본문으로 바로가기

이 글은 아주 쉬운 데이터를 실습용으로 사용해서 파이썬과 데이터 사이언스 분야를 공부하는 컨셉의 글입니다. 이번에 사용할 데이터는 서울시 흡연율 통계라는 데이터입니다. 

해당 페이지 하단으로 이동하면

저렇게 파일을 받을 수 있습니다.

report-2.txt

해당 파일은 저도 같이 공유하도록 하죠^^

데이터는 매우 심플한 형태입니다.

구분과 구분.1이라는 컬럼만 확인을 해보면 되겠네요

이중에서 구분에 "생애주기별"이라는 데이터에 오늘은 집중하도록 하겠습니다.

pandas의 DataFrame은 조건문을 이용한 데이터 선별이 아주 쉽습니다 저렇게 말이죠^^ 위 결과에서 전체, 남자, 여자만 가져오고 싶다면

이렇게 하면 됩니다.

이제 저장하죠. 이름을 smoke_age로 하겠습니다.

이제 한글 폰트를 지정하고, (이전에도 이야기했지만, 윈도우 유저는 f_path에 지정된 경로를 윈도에서 폰트가 지정된 경로로 잡으시면 됩니다)

이번에는 seaborn이라는 아이를 이용해서 barplot을 그려보았습니다.

이렇게 수평 방향으로도 그려집니다.~

이번에는 barplot을 연달아 사용해서 겹치게 그릴 수도 있습니다.

거기에 legend도 각각의 barplot에 label을 달아서 사용할 수 있습니다.

이번에는 칼라를 조금 손보고, 테두리 선(despine)도 손을 보았습니다~

이렇게 말이죠^^ 위 내용은 아래 동영상에서 다시 다룹니다.



댓글을 달아 주세요

  1. BlogIcon 잉여토기 2020.05.18 09:46 신고

    30~44세의 흡연율이 가장 높네요.
    자신의 건강을 위해서 흡연 인구가 줄어들면 그만큼 대기 환경 지수도 좋아질 듯해요.

  2. BlogIcon 핑구야 날자 2020.05.19 06:53 신고

    3 40대가 흡연율이 높군요 금연하는 것이 상당히 중요한데 쉽지 않을 거 같아요

  3. BlogIcon 북두협객 2020.05.21 15:35 신고

    흡연율 수치를 시각화 그래프로 보니까 눈에 확 들어오네요^^