본문 바로가기

Theory/DataScience

(52)
데이터 과학을 위한 재미난 데이터를 찾을 수 있는 kaggle 2016. 11. 6. 08:00 데이터 과학과 관련된 여러 이야기를 읽다보면 사용하고 있는 예제에서 다루는 데이터가 어마어마한 품질의 데이터일때가 있으면 감탄하게 되죠. 이런 데이터들을 어떻게 수집하고 정리했지???^^ 최근(그러니까 한시간전^^)에 국내에서 정부가 발행하는 공공데이터가 있다고 말씀드렸는데요.[바로가기] 이번에는 해외에서 하나 말씀드릴 곳이 있습니다. 바로 kaggle이라고 하는 곳입니다.이름부터가 Kaggle Datasets입니다.^^저런... 미구 대선과 관련된 분석같은 데이터도 있네요...^^. 축구 데이터에 대한 분석도 있구요~우와~ 야구의 역사라는 데이터도 있네요^^저기서 사용하는 언어(Python, R, Julia 등)을 선택하고나면이제.. 나보다 뭔가 프로그램을 잘 만지는(물론 아닌 경우도 있습니다만^^) ..
연습용 데이터를 획득하기 좋은 공공 데이터 포럼 2016. 11. 6. 07:00 데이터 과학이라고 거창하게 이름을 부르지만... 현실은 데이터를 열람하고 분류하고 분석하는 과정에서 당연히 필요한 연습용 데이터를 얻는 것이 참~~~ 힘이 듭니다.ㅠㅠ. 그리고 그나마 있다고 하더라도...ㅠㅠ. 죄다~~ 영어권 국가의 자료들이라 뭔가 실감도 잘 안나구요^^ 저도 처음에는 인터넷에서 고수들의 자료를 보면서 어떻게 이 분들은 데이터를 이렇게 잘 얻었지? 하고... 궁금해 했는데... 알고보니... 그 중 많은 자료의 출처가 공공 데이터 포럼이라고 하는 정부 운영 기관이더군요^^요즘 정부.. 참 슬프지만... 그래서 제 블로그에 저 정부마크는.. 올리고 싶지 않았지만... 뭐~ 올리게 되네요.ㅠㅠ. 아무튼... 저기서 재미있는 데이터들을 얻을 수 있습니다.저런 다양한 데이터가 많아요^^흠.. ..
Jupyter 잘 써보기~~~ 2016. 10. 30. 08:00 이런~ Data Science 이야기 한 번 해보겠다고 해놓고선... 아무런 글을 올리지 않았네요^^. 뭐 제가 그렇듯... 기초기초스럽게 가야죠^^. 거창한 데이터 사이언스 이야기하지만... 결국.. 사용할 툴로는 Python을 선정하고.. 지난번에 Anaconda를 설치했지요... 이번엔 그 아나콘다가 설치되고난 후 같이 포함된 Jupyter를 이야기해볼까합니다.실행된 화면인데요... 저기서 어떤 코드를 입력하고, SHIFT+ENTER를 입력하면 해당 섹션의 코드가 실행됩니다.^^또... 어떤 코드 중에 .을 찍고... TAB키를 누르면.. 바로 사용가능한 명령들이 나타납니다.그리고.. 변수 뒤에 ?를 붙이면 변수의 정보가 나타나며... (물론... SHIFT+ENTER를 하셔야 합니다.^^) 혹시 ..
데이터 과학? 나도나도 시작해보자... Anaconda로 Python 설치하기 2016. 10. 11. 08:00 요즘 데이터 과학이 이슈죠? 그래서 살짝 시작해볼려고 합니다. 데이터 과학^^. 뭐 언어는 Python으로~ Python은 설치와 유지보수가 살짝 까다로우니 배우는 단계에서는 한 번 이야기한 적이 있는 아나콘다(anaconda)로 할려고 합니다. 예전과 달라진 부분이 있어서 살짝꿍 다시 이야기할려구요~. 이번은 좀 길게 보고가는 연재입니다. 데이터 과학 이야기를 할려구요. 그런데... 저처럼 Python도, 수학적 지식도, 이론도 (데이터 과학분야에서는) 잘 모르는 분들을 대상으로 (당장 저도 모르니까요^^) 시작합니다. 데이터 과학이 이런거구나... 하는 개념입니다. 그래서 도구로 Python을 사용할려는 겁니다. 이제 연재를 시작해볼까요~~^^일단... 아나콘다라는 아이로 Python을 설치하고자 합..

반응형