본문 바로가기

Software/Python

Python Pandas 기초 - 기초스러운 Series 사용법

겨우 Python을 공부하는 주제에.... 얼마전에 Python Numpy의 아~~~주 기초스러운 부분을 이야기했는데요... 사실 그 글에서도 이야기했지만... 그런 기초스러운 부분을 올리게 된 이유는 바로 GitHub에서 발견한 한 예제[바로가기]들 때문이었습니다. GitHub의 이 예제를 보고 바로 IPython을 설치하게 된거구요.[바로가기] 그리고 선형대수학부분에서는 제가 살을 좀 보탰지만... 엄밀하게는 Numpy 기초 이야기도 그 GitHub 예제를 그냥 따라한 거구요....^^. 이번 Pandas의 Series도 이야기한 GitHub의 한 예제[바로가기]를 그냥 따라한 수준으로 뭐 크게 의미를 가지는 글은 아닙니다. 그저 제가 공부한다는 거죠^^.

일단... 자주쓰는(혹은 쓰게 될~~) SeriesDataFramefrom ~ import로 직접 선언하고.. 나머지 pandas들은 pd로 import를 해두네요^^

먼저.. pandas의 series로 데이터를 열로 선언하면... index가 따라 붙습니다. 그래서 값만 확인할 때는 values를 ... index만 확인할 때는 index 속성을 이용해서 확인하면 됩니다.

혹은 위 처럼 Series를 사용할때 index 속성을 직접 지정할 수 있습니다.

물론 사전식으로 dh2['a']처럼 해당 인덱스의 값을 바로 볼 수 있구요. Series로 선언된 변수의 산술연산은 각 요소에 모두 적용이 됩니다.^^

지수도 적용이 되네요^^

저렇게 사전 형식으로 지정된 데이터를 Series로 하면 인덱스와 값을 잘 표현해 줍니다.^^. 여기서 추가로 인덱스를 잡으면 해당 값은 없다는 의미로 NaN이 들어갑니다.

그래서 isnull속성을 이용하면 NaN인지 아닌지 알려줍니다. 비슷하게는 notnull도 있구요^^

두 Series를 더하기도 할 수 있습니다.

그리고... name 속성도 사용할 수 있으며.. index에도 name 속성이 있습니다. Series는 일종의 한 줄만 데이타가 있는 엑셀같은 것 같습니다.^^ 다음에 DataFrame을 볼려구요... ^^

반응형