데이터 과학과 관련된 여러 이야기를 읽다보면 사용하고 있는 예제에서 다루는 데이터가 어마어마한 품질의 데이터일때가 있으면 감탄하게 되죠. 이런 데이터들을 어떻게 수집하고 정리했지???^^ 최근(그러니까 한시간전^^)에 국내에서 정부가 발행하는 공공데이터가 있다고 말씀드렸는데요.[바로가기] 이번에는 해외에서 하나 말씀드릴 곳이 있습니다. 바로 kaggle이라고 하는 곳입니다.
이름부터가 Kaggle Datasets입니다.^^
저런... 미구 대선과 관련된 분석같은 데이터도 있네요...^^.
축구 데이터에 대한 분석도 있구요~
우와~ 야구의 역사라는 데이터도 있네요^^
저기서 사용하는 언어(Python, R, Julia 등)을 선택하고나면
이제.. 나보다 뭔가 프로그램을 잘 만지는(물론 아닌 경우도 있습니다만^^) 분들의 실력으로 만들어진 데이터 분석을 볼 수 있게 됩니다.^^
저런 내용들을 말이죠^^ 아무튼~~~ 꽤 유용하고 즐거운 데이터들과 또 그런 데이터들 덕분에 당연히~ 즐겁게 공부할 수 있게 되었네요 ㅎㅎ^^
반응형
'Theory > DataScience' 카테고리의 다른 글
Python pandas에서 excel 엑셀 파일 바로 읽어 오기 (12) | 2016.11.23 |
---|---|
Python pandas에서 text 혹은 csv 파일 읽기 (26) | 2016.11.17 |
데이터 과학에서 필수 아이템 seaborn (4) | 2016.11.11 |
구글의 지도(google maps) 데이터를 사용할 준비를 하자 (14) | 2016.11.06 |
연습용 데이터를 획득하기 좋은 공공 데이터 포럼 (2) | 2016.11.06 |
Jupyter 잘 써보기~~~ (4) | 2016.10.30 |
데이터 과학? 나도나도 시작해보자... Anaconda로 Python 설치하기 (6) | 2016.10.11 |