본문 바로가기

data

(5)
서울시 인구현황이라는 데이터 시각화해보기 최근 데이터사이언스 카테고리에 아주 쉬운 난이도의 글을 올리고 있습니다. 입문하시는 분들에게 작은 도움이 되었으면 좋겠다고 생각했거든요. 이번에는 서울시 인구현황이라는 통계자료가 있는데요. 그걸 한 번 다뤄보도록 하겠습니다.서울시 열린데이터에서 구할 수 있는 자료입니다. 2020년 4월 29일에 업데이트 되었네요.데이터는 휠을 조금 내리면 내려받기를 선택할 수 있습니다. 혹시 시간이 지나서 글을 읽는 분들을 위해 데이터도 같이 올려둡니다.이제 간단히 시작해보겠습니다.~그냥 한 번 읽어봤습니다. 다운로드받는 웹페이지의 안내대로 탭(\t)으로 구분해서 읽어봤습니다.그러나 대략 3번째 줄부터 읽으면 좋을것 같네요. 그래서 header는 2로 설정했습니다. 하나더, 콤마(,)들이 숫자 세자리마다 위치해 있는데요..
PinkWink가 토요일마다 강의를 합니다.^^ 2019년 3월이 한 주가 훌쩍 지나갔네요. 요즘 제가 조금 더 나이를 먹기전에 더 좋은, 더 재미있는 일을 해야하는 것은 아닐까 고민한답니다. 사실 직장인들이 다 그렇지만, 요즘 전 하나의 아이템이 머리에서 계속 맴돌고 있거든요. 어떻게든 실현해 보고 싶다는 생각을 많이 하고 있지요^^. 아무튼, 아주 예전부터, 그러니까, 2016년 10월/11월경에 처음 강의를 시작했었답니다. 그렇게 첫 기수를 시작해서 8주간 매주 토요일 수업을 하고, 또 3주 정도를 쉬고, 또 8주간 매주 토요일 수업을 하는 패턴을 가졌네요. 그러다가, 최근 회사일로 너무 바빠 좀 길게 쉬고, 다시 수업을 시작했답니다. 이제 3월 말부터 11기가 시작됩니다. 와우... 지금까지 총 수업을 한 주차가 80주차이네요. ㅎㅎ. 패스트 ..
동적 환경에서 웹 정보를 얻을때 편한 Selenium - 네이버에 로그인하고 메일 목록 확인하기 - 아주 예전에 웹 정보를 쉽게 가져올 수 있는 Beautiful Soup을 이야기했었는데요.[바로가기] 이 아이만으로는 약간 한계가 있습니다. 뭐 꼭 버튼을 클릭해야한다던지, 로그인 화면처럼 어떤 정보를 입력해야하는데 그게 접근 주소에 나타나면 쉽게 접근해 볼 수 있는데, 그렇지 않다든지 하는 일들이지요. 그럴때 요즘에 셀레니움(Selenium)을 많이 사용하시는 것 같아요^^. 그래서 그 아이를 한 번 이야기할려구요. 그래서 네이버에 로그인을 하고 또 살짝 내 메일함에서 보낸사람 목록을 추출해 볼까 합니다.^^먼저 pip install selenium으로 셀레니움을 설치합니다.그리고 크롬드라이버를 자신의 OS에 맞춰서 다운로드 받습니다.이제 쉽게 사용하는 방법은 이 4줄을 입력해 보는 겁니다. 아 크롬드..
데이터 과학을 위한 재미난 데이터를 찾을 수 있는 kaggle 데이터 과학과 관련된 여러 이야기를 읽다보면 사용하고 있는 예제에서 다루는 데이터가 어마어마한 품질의 데이터일때가 있으면 감탄하게 되죠. 이런 데이터들을 어떻게 수집하고 정리했지???^^ 최근(그러니까 한시간전^^)에 국내에서 정부가 발행하는 공공데이터가 있다고 말씀드렸는데요.[바로가기] 이번에는 해외에서 하나 말씀드릴 곳이 있습니다. 바로 kaggle이라고 하는 곳입니다.이름부터가 Kaggle Datasets입니다.^^저런... 미구 대선과 관련된 분석같은 데이터도 있네요...^^. 축구 데이터에 대한 분석도 있구요~우와~ 야구의 역사라는 데이터도 있네요^^저기서 사용하는 언어(Python, R, Julia 등)을 선택하고나면이제.. 나보다 뭔가 프로그램을 잘 만지는(물론 아닌 경우도 있습니다만^^) ..
데이터 과학? 나도나도 시작해보자... Anaconda로 Python 설치하기 요즘 데이터 과학이 이슈죠? 그래서 살짝 시작해볼려고 합니다. 데이터 과학^^. 뭐 언어는 Python으로~ Python은 설치와 유지보수가 살짝 까다로우니 배우는 단계에서는 한 번 이야기한 적이 있는 아나콘다(anaconda)로 할려고 합니다. 예전과 달라진 부분이 있어서 살짝꿍 다시 이야기할려구요~. 이번은 좀 길게 보고가는 연재입니다. 데이터 과학 이야기를 할려구요. 그런데... 저처럼 Python도, 수학적 지식도, 이론도 (데이터 과학분야에서는) 잘 모르는 분들을 대상으로 (당장 저도 모르니까요^^) 시작합니다. 데이터 과학이 이런거구나... 하는 개념입니다. 그래서 도구로 Python을 사용할려는 겁니다. 이제 연재를 시작해볼까요~~^^일단... 아나콘다라는 아이로 Python을 설치하고자 합..

반응형