이 글은 아주 쉬운 데이터를 실습용으로 사용해서 파이썬과 데이터 사이언스 분야를 공부하는 컨셉의 글입니다. 이번에 사용할 데이터는 서울시 흡연율 통계라는 데이터입니다.
해당 페이지 하단으로 이동하면
저렇게 파일을 받을 수 있습니다.
해당 파일은 저도 같이 공유하도록 하죠^^
데이터는 매우 심플한 형태입니다.
구분과 구분.1이라는 컬럼만 확인을 해보면 되겠네요
이중에서 구분에 "생애주기별"이라는 데이터에 오늘은 집중하도록 하겠습니다.
pandas의 DataFrame은 조건문을 이용한 데이터 선별이 아주 쉽습니다 저렇게 말이죠^^ 위 결과에서 전체, 남자, 여자만 가져오고 싶다면
이렇게 하면 됩니다.
이제 저장하죠. 이름을 smoke_age로 하겠습니다.
이제 한글 폰트를 지정하고, (이전에도 이야기했지만, 윈도우 유저는 f_path에 지정된 경로를 윈도에서 폰트가 지정된 경로로 잡으시면 됩니다)
이번에는 seaborn이라는 아이를 이용해서 barplot을 그려보았습니다.
이렇게 수평 방향으로도 그려집니다.~
이번에는 barplot을 연달아 사용해서 겹치게 그릴 수도 있습니다.
거기에 legend도 각각의 barplot에 label을 달아서 사용할 수 있습니다.
이번에는 칼라를 조금 손보고, 테두리 선(despine)도 손을 보았습니다~
이렇게 말이죠^^ 위 내용은 아래 동영상에서 다시 다룹니다.
반응형
'Theory > DataScience' 카테고리의 다른 글
matplotlib 한글 문제 해결하기 (14) | 2020.07.20 |
---|---|
Python seaborn heatmap으로 보는 서울시 구별 범죄현황 (feat. pivot) (14) | 2020.06.22 |
서울시 인구현황이라는 데이터 시각화해보기 (10) | 2020.05.25 |
[Data Science] 서울시민들이 운동을 하지 않는 이유에 대한 분석 (12) | 2020.05.11 |
[Data Science] Conda 환경을 만들고 기초 모듈 설치하기 (10) | 2020.05.10 |
신종 코로나 바이러스 COVID-19 데이터 분석 (20) | 2020.03.07 |
구글 Colab에서 한글 문제 대응하기 (6) | 2019.11.18 |