본문 바로가기

Theory

(227)
PinkWink의 데이터 사이언스 관련 책이 출판됩니다. - 파이썬으로 데이터 주무르기 2017. 12. 20. 08:00 정말 왜 한다고 결심하고 시작했지?? 하고 후회하는 일이 있었습니다. 최근 저는 책을 한 권 집필했는데요. 나같은 어중이 떠중이가 뭐 대단하다고 이렇게 책을 쓰겠다는 거지? 하면서 몇번을 후회하다가 결국 모든 작업이 마쳐졌네요... 저는 출판이라는 작업이 그렇게 어려운지 몰랐습니다. 저자는 그저 아이디어와 글과 자료만 있을 뿐 그건 책이 아니더라구요. 디자인하시는분, 교정, 기획, 편집.. 휴.. 정말 많은 분들의 손길이 거치는 것이 책인것 같습니다. 그래서 더더욱 중간중간 후회했지요..ㅠㅠ. 아무튼.... 사실 저의 공식적인 출판은 NCS의 학습모듈을 집필할 때였습니다만, 그건 일종의 국책사업이고, 이번에는 순수하게 제 의지로 수행하는 거니 첫 출판 책이지요. 이 책의 구성을 하게 된 히스토리가 있습니..
지도 그리는 모듈 Folium의 업그레이드에 대해 달라진 점들 2017. 11. 30. 08:00 예전에 Python에서 지도 시각화에 좋은 도구인 Folium을 소개[바로가기]했었습니다. 당시에는 설치하면 버젼이 0.2,1이 설치되었었는데요. 그 후에도 버전 0.3.0까지는 Circle 마커의 크기의 단위가 바뀌는 말고는 큰 문제없이 진행되었던 것이... 지금은 갑자기 버전이 0.5.0으로 올라가면서 꽤 많은 변화가 생겼습니다. 특히 당시 코드를 동작시키면 에러가 나는 문제까지 생겼습니다. 당시 버전에서 작성된 이런 코드를 실행하면 바로 저 geo_path라는 부분에서이런 메세지... TypeError: choropleth() got an unexpected keyword argument 'geo_path'즉 geo_path라는 입력 인자가 없다는 에러가 뜹니다. 일단 쉽게 이야기해서 geo_pat..
주가 예측? 나도 해보자~ Forecast 수행에 적합한 Prophet 2017. 8. 3. 08:00 제목은 좀 자극적(^^)이지만, 오늘은 시계열(Time Series) 데이터를 대상으로 예측(forecast)한 결과를 손쉽게 보여주는 prophet이라는 아이를 소개할까합니다. 개발된지 반년쯤 된 따끈따끈한 아이입니다. 그리고 페이스북의 Core Data Science 팀에 의해 개발되고 공개된 아이입니다. 벌써 신뢰가 팍팍 가죠?^^ 그들 홈페이지[바로가기]에 있는 소개 내용을 가져오면 Prophet is a procedure for forecasting time series data. It is based on an additive model where non-linear trends are fit with yearly and weekly seasonality, plus holidays. It wo..
간편하게 사용하면서도 꽤 이쁜 기능도 많은 워드 클라우드 Word Cloud 모듈 (for Python) 2017. 5. 31. 08:00 단어~ 자연어 처리가 되었든 안되었든... 말(단어로 된)을 프로그램으로 다루다 보면 워드클라우드가 필요할 때가 있습니다. 오늘은 그 중 제가 볼 때, 가장 접근하기 편하면서 너무나 강력한 워드클라우드를 소개해 드릴까 합니다. 이름도 그냥 wordcloud입니다.~^^ 설치는 pip install wordcloud입니다.~^^일단 처음에는 영어로 할거라~ 그냥 matplotlib를 import하고 을 받아 두고 위 코드를 실행하면 됩니다.~ wordcloud 모듈 자체가 빈도를 계산하는 기능을 가지고 있어서 쉽게 결과를 얻을 수 있습니다.그리고 그냥~ matplotlib에서 그려버리면 그만~~~^^ 그래도 뭔가 허전하시다면~~~ 사실 이걸로 끝인데^^ 좀 더 진행해 보죠^^ 아참.. 언제나 그렇듯.. 이..
Python 유저가 한글 자연어 처리를 할 때 필수 모듈인 KoNLPy를 소개합니다. 2017. 5. 23. 08:00 제가 S/W나 H/W 혹은 인터넷에서 본 재미있는 아이들을 소개한 적도 있지만, 가끔 인물 자체를 -그것도 잘 알지도 못하면서- 소개한 적이 있습니다. 예를 들면, 많은 글을 적진 않으셨지만, MATLAB에 대해 재미난 글이 많은 theta님이 있었구요... 그리고 최근에는 대한민국 지도를 그릴때 소개해 드린, 혜식님도 있었습니다. 그리고 오늘 또 한 분의 고수를 소개해 드릴까합니다. 사실 이 분은 제 블로그에서 한 번 출연(^^)을 하셨었습니다. 바로 서울시 범죄 현황을 분석하던 글[바로라기]에서 folium으로 지도를 표현할 때 서울시 구별 경계선 데이터를 얻어왔던 한국 지도 데이터가 있던 github[바로가기]을 운영하시던 분 e9t라는 분인데요... 오늘 소개해 드릴 Lucy Park이라는 분입니..
19대 대선 후보간 득표율의 지역별 비교 - 문재인 대통령, 홍준표 후보, 안철수 후보 2017. 5. 13. 09:56 한 주간 참 대단한 일들이 지나갔습니다. 대선이 있었고... 바로 대통령 당선인인 대통령이되고, 그리고 뭔가 대단한 (사실은 지극히 정상적으로 일처리를 하는 것인데도...) 큰 뭔가의 변화들이 있을 것 같아 기대도 됩니다.^^. 그래도 주말마다 취미로 데이터를 만지는게 낙인 저같은 소시민이 이런 대선이라는 큰 이슈에 글하나 남기지 않는다면 그것도 직무유기라 생각되어서 살짝꿍 뭐라도 끄적거리기로 했습니다. 그래서 제가 그간 제 블로그의 Data Science 카테고리에 올린 기본적인 기능을 가지고 이번 대선 득표율을 슬쩍 비교해볼려구요^^. 언제나 그렇듯.. 이 글에는 아무런 기술적 고난도 스킬은 없구요... 그저... 각 모듈을 튜토리얼 수준으로 편집해서 원하는 흐름을 만들었을 뿐입니다.^^ 웹에서 득표..
동적 환경에서 웹 정보를 얻을때 편한 Selenium - 네이버에 로그인하고 메일 목록 확인하기 - 2017. 4. 24. 08:00 아주 예전에 웹 정보를 쉽게 가져올 수 있는 Beautiful Soup을 이야기했었는데요.[바로가기] 이 아이만으로는 약간 한계가 있습니다. 뭐 꼭 버튼을 클릭해야한다던지, 로그인 화면처럼 어떤 정보를 입력해야하는데 그게 접근 주소에 나타나면 쉽게 접근해 볼 수 있는데, 그렇지 않다든지 하는 일들이지요. 그럴때 요즘에 셀레니움(Selenium)을 많이 사용하시는 것 같아요^^. 그래서 그 아이를 한 번 이야기할려구요. 그래서 네이버에 로그인을 하고 또 살짝 내 메일함에서 보낸사람 목록을 추출해 볼까 합니다.^^먼저 pip install selenium으로 셀레니움을 설치합니다.그리고 크롬드라이버를 자신의 OS에 맞춰서 다운로드 받습니다.이제 쉽게 사용하는 방법은 이 4줄을 입력해 보는 겁니다. 아 크롬드..
텐서플로우(tensorflow)에서 텐서보드(tensorboard) 사용하기 (몹시 기초) 2017. 4. 5. 08:00 텐서 플로우 설치에 관한 이야기를 했었는데요[바로가기]. 이번에는 텐서 보드를 처음 사용하는 이야기를 할려고 합니다.~~~^^ 이런 툴은 처음 시작만 좀 익히면 접근하기 쉬운데요^^ 그 시작.. 텐서보드 처음 사용해보기~~ 되겠습니다.^^일단... tf.Graph()를 사용하겠다고 하시구요^^테스트 용으로... 음~~~ 그냥 a,b를 각각 곱하고(c) 더하고(d) 한 것을 다시 더하는(e) 것으로... 심플하게~~그리고.. Session을 실행하면 됩니다.. tf.summary.FileWriter를 통해 first_graph에 저장하라고 해주면 되구요^^이제.. 실행하고... 쓰고.. 닫고^^그리고 터미널에서 소스코드가 위치한 폴더에서 source activate tensorflow를 하시고([바로가기]..

반응형