본문 바로가기

Software/Python

[Seaborn 연재] lmplot을 이용하여 회귀판단하기, 혹은 curve fitting하기

기나긴 seaborn 연재의 마지막이네요^^ 오늘은 lmplot을 이용한 회귀,... 혹은 뭐 curve fitting 뭐 여하튼... 1차 혹은 그 이상의 함수로 데이터를 표현하고자 하는 것을 seaborn의 lmplot으로 간단히 수행하는 것을 보여드릴려고 합니다.^^

anscombe라는 데이터가 있습니다. 사실 이 데이터가 뭘 의미하는지는 모르겠습니다. 찾아볼껄^^ 여하튼 이 데이터는 dataset이 총 4종류가 있고 각 데이터마타 x, y 값이 있습니다.^^

pandas의 기능 중 하나인 query를 사용하면 쉽게 데이터중 일부를 추출할 수 있습니다. lmplot으로 plot하고 나면 위 결과를 얻을 수 있습니다.

scatter의 사이즈도 조절 되구요^^

ci를 on해서 시각화를 볼 수 있네요...

이건 1차로 estimation 해서는 안될 듯 하네요. order 옵션으로 2차로 변경해 볼 수 있습니다.

이렇게 말이죠^^

저렇게 한 데이터가 튀어도 그걸 반영하면 전체 직선이 약간 어긋나 보일 수 있습니다.

그럴때 robust 옵션을 이용해서 너무 튀는 데이터는 무시하도록 할 수 있습니다.^^

반응형