본문으로 바로가기

기나긴 seaborn 연재의 마지막이네요^^ 오늘은 lmplot을 이용한 회귀,... 혹은 뭐 curve fitting 뭐 여하튼... 1차 혹은 그 이상의 함수로 데이터를 표현하고자 하는 것을 seaborn의 lmplot으로 간단히 수행하는 것을 보여드릴려고 합니다.^^

anscombe라는 데이터가 있습니다. 사실 이 데이터가 뭘 의미하는지는 모르겠습니다. 찾아볼껄^^ 여하튼 이 데이터는 dataset이 총 4종류가 있고 각 데이터마타 x, y 값이 있습니다.^^

pandas의 기능 중 하나인 query를 사용하면 쉽게 데이터중 일부를 추출할 수 있습니다. lmplot으로 plot하고 나면 위 결과를 얻을 수 있습니다.

scatter의 사이즈도 조절 되구요^^

ci를 on해서 시각화를 볼 수 있네요...

이건 1차로 estimation 해서는 안될 듯 하네요. order 옵션으로 2차로 변경해 볼 수 있습니다.

이렇게 말이죠^^

저렇게 한 데이터가 튀어도 그걸 반영하면 전체 직선이 약간 어긋나 보일 수 있습니다.

그럴때 robust 옵션을 이용해서 너무 튀는 데이터는 무시하도록 할 수 있습니다.^^


댓글을 달아 주세요

  1. BlogIcon 푸샵 2017.01.27 08:14 신고

    내 맘대로 데이터!~ ^^
    PinkWink님!~ 정유년 새해 복 많이 받으시고, 항상 건강하시고,
    행복하시고, 만사형통하시길 바랍니다. 설연휴 즐겁게 보내세요. ^^b

  2. BlogIcon 공수래공수거 2017.01.27 09:57 신고

    행복한 설 연휴 보내시기 바라겠습니다
    복 많이 받으세요^^

  3. BlogIcon 감자튀김 2017.01.28 10:46 신고

    2017년 좋은 일들 가득하시고
    즐겁고 행복한 한해 되세요~!!! ^^

  4. BlogIcon IT넘버원 2017.01.31 04:12 신고

    완전 전문가급이십니다.^^