기나긴 seaborn 연재의 마지막이네요^^ 오늘은 lmplot을 이용한 회귀,... 혹은 뭐 curve fitting 뭐 여하튼... 1차 혹은 그 이상의 함수로 데이터를 표현하고자 하는 것을 seaborn의 lmplot으로 간단히 수행하는 것을 보여드릴려고 합니다.^^
- Seaborn
- [Seaborn 연재] heatmap 사용하기
anscombe라는 데이터가 있습니다. 사실 이 데이터가 뭘 의미하는지는 모르겠습니다. 찾아볼껄^^ 여하튼 이 데이터는 dataset이 총 4종류가 있고 각 데이터마타 x, y 값이 있습니다.^^
pandas의 기능 중 하나인 query를 사용하면 쉽게 데이터중 일부를 추출할 수 있습니다. lmplot으로 plot하고 나면 위 결과를 얻을 수 있습니다.
scatter의 사이즈도 조절 되구요^^
ci를 on해서 시각화를 볼 수 있네요...
이건 1차로 estimation 해서는 안될 듯 하네요. order 옵션으로 2차로 변경해 볼 수 있습니다.
이렇게 말이죠^^
저렇게 한 데이터가 튀어도 그걸 반영하면 전체 직선이 약간 어긋나 보일 수 있습니다.
그럴때 robust 옵션을 이용해서 너무 튀는 데이터는 무시하도록 할 수 있습니다.^^
반응형
'Software > Python' 카테고리의 다른 글
모여있는 점들의 최외곽선을 이어주는 scipy의 ConvexHull 명령 (12) | 2017.04.19 |
---|---|
Python에서 시스템의 운영체제 확인하기 (12) | 2017.02.28 |
맥에서 matplotlib 한글 문제 해결하기 (14) | 2017.02.02 |
[Seaborn 연재] pairplot, jointplot, tsplot 익히기 (4) | 2017.01.25 |
[Seaborn 연재] heatmap 사용하기 (2) | 2017.01.20 |
[Seaborn 연재] lmplot과 kdeplot, distplot (8) | 2017.01.19 |
[Seaborn 연재] set_style과 boxplot, swarmplot (4) | 2017.01.18 |