본문 바로가기

Theory/DataScience

[Data Science] 서울시 흡연률 데이터에서 연령별 흡연률 데이터 시각화

이 글은 아주 쉬운 데이터를 실습용으로 사용해서 파이썬과 데이터 사이언스 분야를 공부하는 컨셉의 글입니다. 이번에 사용할 데이터는 서울시 흡연율 통계라는 데이터입니다. 

해당 페이지 하단으로 이동하면

저렇게 파일을 받을 수 있습니다.

report-2.txt

해당 파일은 저도 같이 공유하도록 하죠^^

데이터는 매우 심플한 형태입니다.

구분과 구분.1이라는 컬럼만 확인을 해보면 되겠네요

이중에서 구분에 "생애주기별"이라는 데이터에 오늘은 집중하도록 하겠습니다.

pandas의 DataFrame은 조건문을 이용한 데이터 선별이 아주 쉽습니다 저렇게 말이죠^^ 위 결과에서 전체, 남자, 여자만 가져오고 싶다면

이렇게 하면 됩니다.

이제 저장하죠. 이름을 smoke_age로 하겠습니다.

이제 한글 폰트를 지정하고, (이전에도 이야기했지만, 윈도우 유저는 f_path에 지정된 경로를 윈도에서 폰트가 지정된 경로로 잡으시면 됩니다)

이번에는 seaborn이라는 아이를 이용해서 barplot을 그려보았습니다.

이렇게 수평 방향으로도 그려집니다.~

이번에는 barplot을 연달아 사용해서 겹치게 그릴 수도 있습니다.

거기에 legend도 각각의 barplot에 label을 달아서 사용할 수 있습니다.

이번에는 칼라를 조금 손보고, 테두리 선(despine)도 손을 보았습니다~

이렇게 말이죠^^ 위 내용은 아래 동영상에서 다시 다룹니다.


반응형