본문 바로가기

분석

(3)
전세계 테러 데이터 분석 (따라하기) 2019. 5. 7. 07:00 오늘은 따라하기입니다.^^Kaggle에 전세계 테러리즘이라는 데이터가 있습니다. 1970년부터 2017년까지의 자료입니다.이 데이터는 압축을 풀면 무려~ 155.27MB의 크기입니다. 헉~ 그리고 저렇게 상세하게 테러 데이터가 정리되어 있습니다.그 중에서 가 장 인기(^^)가 많은 글을 따라가보았습니다.이 분의 글이지요. 이 글이 흥미로워서 따라 읽다가 저는 잘 실행되지 않는 곳도 있고, 또 아주 약간 편집한 것도 있어서 그냥 블로그에 옮겨 봅니다. 다시 말씀드리지만, 따라하기 입니다.ㅠㅠ. import pandas as pd terror = pd.read_csv('./data/globalterrorismdb_0617dist.csv',encoding='ISO-8859-1') terror.rename(co..
[Keras] 타이타닉 생존자 분석. 디카프리오는 정말 살 수 없었을까? 2018. 4. 13. 08:00 영화 타이타닉의 감동을 이번 공부를 하면서 느꼈네요. 머신러닝을 공부하는 분들이 항상 수행하는 연습문제로 MNIST 필기 숫자 인식과 함께 타이타닉 생존자 분석이 있습니다. 저도 역시 공부하는 과정에서 거쳤구요. 이번에는 최근 그 매력에 빠진 케라스(Keras)로 수행해보려고 합니다. 그리고, Keras로 수행한 후 레오나르도 디카프리오가 연기한 그 역할의 남자 주인공의 생존 가능성을 한 번 확인해 보려고 했습니다.^^ 언제나 그랬지만, 오늘도 역시 혼자힘으로는 못하고 많은 분의 도움을 받았습니다. 일부 내용은 그대로 따라했구요. 먼저 Pandas를 이용한 분석과 다양한 데이터를 들여다보고 시각화하는 것은 Matt dePero님의 Titanic Machine Learning from Disaster[바로..
서울시 범죄현황 통계자료에 대한 확인 2017. 3. 2. 08:00 데이터 과학이라고 거창하게 부르지 않아도 요즘은 데이터를 이용해서 실제 원하는 결과를 검증하고 이를 블로그에 올리거나, Github page에 올리는 경우를 많이 봅니다. 그 주제가 참 멋지고 그 과정이 아름다운 분들도 많구요^^. 저도 그냥 가벼운 마음에 통계자료를 가지고 살짝 뭔가를 해볼려고 합니다. 뭐 거창한 알고리즘을 쓴 건 아니구요. 그저 그래프나 깨작거리고 그리고, 데이터의 순서나 좀 바꾸던지.. 혹은 조금 만지작 거리는 수준입니다.^^. 살짝... "서울 강남 3구 체감안전도 높아"라는 위 기사를 보고~~~ 실제 통계자료도 그렇게 나타나는지를 볼려고 했습니다. 사람들이 생각하는 체감안전도와 혹시 통계자료에서 보는 안전도가 같을지 확인해 보는거죠^^ 데이터 가져오기 공공데이터포털이라는 사이트에..

반응형