본문 바로가기

DataScience

(3)
Python seaborn heatmap으로 보는 서울시 구별 범죄현황 (feat. pivot) 2020. 6. 22. 08:00 이번에는 Python에서 seaborn의 heatmap을 익혀볼겸 서울시 구별 범죄현황 데이터를 다뤄보겠습니다. 이 내용은 몇 년전에 제가 지은 책(파이썬으로 데이터 주무르기)에 있는 내용입니다. 그 내용을 조금 다듬어서 오늘 이야기해보려고 합니다.~먼저 구글에서 이쁘게 검색하고~위 사이트에서 관서별 5대 범죄 발생 검거현황을 클릭~위 사이트에서 다운로드 받습니다. 다운로드를 받아서 압축을 풀고 2018년 데이터를 소스코드와 같은 폴더에 두도록 하죠~먼저 raw 데이터를 읽어봅니다. 이 데이터는 경찰서 이름, 각 경찰서마다 5대 범죄, 각 범죄마다 발생/검거가 나눠 기록되어 있습니다.~이 데이터를 정리하는 마법같은 명령어가 pivot_table입니다~~~^^ 이 명령을 위와 같이 사용하면 raw 데이터가..
데이터 사이언스 과정을 막 배운 병아리 레벨이지만 열정을 가진 분들을 소개합니다. 2020. 5. 31. 10:36 저는 도전적인 일을 정말 좋아합니다. 이번에도 저 개인적으로는 도전적인 일을 하나 소화했습니다. 저는 패스트 캠퍼스와의 인연이 꽤 오래되었습니다. 처음 인연을 맺었던 강의는 파이썬을 활용한 데이터 분석 입문이라는 수업이었습니다. 2016년 가을쯤에 시작해서 2019년 겨울까지 수업을 진행했습니다. 여유가 생기면 곧 다시 시작할 수 있지 않을까 합니다.^^ 그리고 2019년 11월부터 정말 기억에 남고 무시무시한 AI Robot이라는 수업을 또 진행했습니다. 항상 뭔가 수업을 한다는 것은 내가 알고 있던 지식을 다시 체계적으로 정리해야하고, 또 미처 정리하지 않았던 내용도 보강해서 잘 정리해 두고 있어야합니다. 특히 저처럼 언제가 새로움을 추구하고 그 와중에 실습형 수업을 좋아하는 사람은 더더욱 여러 상황..
지도 그리는 모듈 Folium의 업그레이드에 대해 달라진 점들 2017. 11. 30. 08:00 예전에 Python에서 지도 시각화에 좋은 도구인 Folium을 소개[바로가기]했었습니다. 당시에는 설치하면 버젼이 0.2,1이 설치되었었는데요. 그 후에도 버전 0.3.0까지는 Circle 마커의 크기의 단위가 바뀌는 말고는 큰 문제없이 진행되었던 것이... 지금은 갑자기 버전이 0.5.0으로 올라가면서 꽤 많은 변화가 생겼습니다. 특히 당시 코드를 동작시키면 에러가 나는 문제까지 생겼습니다. 당시 버전에서 작성된 이런 코드를 실행하면 바로 저 geo_path라는 부분에서이런 메세지... TypeError: choropleth() got an unexpected keyword argument 'geo_path'즉 geo_path라는 입력 인자가 없다는 에러가 뜹니다. 일단 쉽게 이야기해서 geo_pat..

반응형