본문으로 바로가기

정말 왜 한다고 결심하고 시작했지?? 하고 후회하는 일이 있었습니다. 최근 저는 책을 한 권 집필했는데요. 나같은 어중이 떠중이가 뭐 대단하다고 이렇게 책을 쓰겠다는 거지? 하면서 몇번을 후회하다가 결국 모든 작업이 마쳐졌네요... 

저는 출판이라는 작업이 그렇게 어려운지 몰랐습니다. 저자는 그저 아이디어와 글과 자료만 있을 뿐 그건 책이 아니더라구요. 디자인하시는분, 교정, 기획, 편집.. 휴.. 정말 많은 분들의 손길이 거치는 것이 책인것 같습니다. 그래서 더더욱 중간중간 후회했지요..ㅠㅠ. 아무튼.... 사실 저의 공식적인 출판은 NCS의 학습모듈을 집필할 때였습니다만, 그건 일종의 국책사업이고, 이번에는 순수하게 제 의지로 수행하는 거니 첫 출판 책이지요. 이 책의 구성을 하게 된 히스토리가 있습니다만.. 그건 한 번 더 시간을 내서 이야기하는 걸로 하죠^^ 일단. 이 책에서 다루는 데이터와 소스코드는 모두 Github[바로가기]에 있습니다. 창피하지만 책 소개는 아래와 같습니다.^^

파이썬으로 데이터 주무르기

ISBN 979-11-86697-47-4 (93000)

책 소개

독특한 예제를 통해 배우는 데이터 분석 입문

이 책은 누구나 한 권 이상 가지고 있을 파이썬 기초 문법책과 같은 내용이 아닌, 데이터 분석이라는 특별한 분야에서 초보를 위해 처음부터 끝까지 파이썬으로 진행되는 과정을 다룹니다. 서울시 범죄 현황 분석, 셀프 주유소 가격 정보 분석, 19대 대선 결과 분석 등 흥미 있는 목표를 이루기 위해서 파이썬의 기초를 익히고, 데이터를 다루고 분석하는 데 필요한 과정을 대화 형식으로 전개하면서 필요한 기초 내용은 그때 그때 습득하고자 합니다. 마치 파이썬에 대해 잘 모르는 독자가 구글에서 검색하며 코드 한 줄 한 줄을 완성해가는 느낌으로 기술했습니다. 대부분의 장에는 뚜렷한 목표가 있습니다. 항상 시작은 데이터를 얻는 법을 먼저 다루게 되고, 그 데이터를 정제하거나 변경해가며 목표를 이루는 과정을 보여줍니다. 필요하다면 해당 모듈의 튜토리얼을 가지고 와서 기초를 설명하고자 합니다. 아마 이 책을 다 읽고 나면 파이썬이, 또 파이썬으로 수행하는 데이터 분석의 세계가 아주 흥미롭다는 것을 알게 될 것입니다

이 책의 특징

  • Pandas, Matplotlib, numpy, folium, KoNLPy, Beautiful Soup, Selenium 등 데이터 분석과 시각화에 필요한 많은 모듈을 다룬다.
  • 정확한 목표를 가진 실제 프로젝트를 다수 수행하면서 프로젝트 단위로 데이터 분석을 학습할 수 있다.
  • 파이썬이 처음인 독자라도 프로젝트를 수행할 수 있도록 설명한다.
  • 파이썬을 공부했지만 실제로 어디에 어떻게 적용하는지 궁금한 독자
  • 데이터 분석을 통해 얻을 수 있는 결과를 학습과 동시에 경험하고 싶은 독자
  • 프로그래밍 언어가 처음이지만 단기간에 성과를 얻고 싶은 독자

목차

  1. 서울시 구별 CCTV 현황 분석
    1. CCTV 현황과 인구 현황 데이터 구하기
    2. 파이썬에서 텍스트 파일과 엑셀 파일을 읽기 – pandas
    3. pandas 기초 익히기
    4. pandas를 이용해서 CCTV와 인구 현황 데이터 파악하기
    5. pandas 고급 기능 – 두 DataFrame 병합하기
    6. CCTV 데이터와 인구 현황 데이터를 합치고 분석하기
    7. 파이썬의 대표 시각화 도구 Matplotlib
    8. CCTV 현황 그래프로 분석하기
  2. 서울시 범죄 현황 분석
    1. 데이터 획득하기
    2. pandas를 이용하여 데이터 정리하기
    3. 지도 정보를 얻을 수 잇는 Google Maps
    4. Google Maps를 이용해서 주소와 위도, 경도 정보 얻기
    5. pandas의 pivot_table 학습하기
    6. Pivot_table을 이용해서 데이터 정리하기
    7. 데이터 표현을 위해 다듬기
    8. 좀 더 편리한 시각화 도구 – Seaborn
    9. 범죄 데이터 시각화하기
    10. 지도 시각화 도구 – Folium
    11. 서울시 범죄율에 대한 지도 시각화
    12. 서울시 경찰서별 검거율과 구별 범죄 발생율을 동시에 시각화하기
  3. 시카고 샌드위치 맛집 분석
    1. 웹 데이터를 가져오는 Beautiful Soup 익히기
    2. 크롬 개발자 도구를 이용해서 원하는 태그 찾기
    3. 실전: 시카고 샌드위치 맛집 소개 사이트에 접근하기
    4. 접근한 웹 페이지에서 원하는 데이터 추출하고 정리하기
    5. 다수의 웹 페이지에 자동으로 접근해서 원하는 정보 가져오기
    6. Jupyter Notebook에서 상태 진행바를 쉽게 만들어주는 tqdm 모듈
    7. 상태 진행바까지 적용하고 다시 샌드위치 페이지 50개에 접근하기
    8. 50개 웹 페이지에 대한 정보 가져오기
    9. 맛집 위치를 지도에 표기하기
    10. 네이버 영화 평점 기준 영화의 평점 변화 확인하기
    11. 영화별 날짜 변화에 따른 평점 변화 확인하기
  4. 셀프 주유소는 정말 저렴할까
    1. Selenium 사용하기
    2. 서울시 구별 주유소 가격 정보 얻기
    3. 구별 주유 가격에 대한 데이터의 정리
    4. 셀프 주유소는 정말 저렴한지 boxplot으로 확인하기
    5. 서울시 구별 주유 가격 확인하기
    6. 서울시 주유 가격 상하위 10개 주유소 지도에 표기하기
  5. 우리나라 인구 소멸 위기 지역 분석
    1. 목표 명확히 하기
    2. 인구 데이터 확보하고 정리하기
    3. 인구 소멸 위기 지역 계산하고 데이터 정리하기
    4. 대한민국 지도 그리는 방법에 대한 소개
    5. 지도 시각화를 위해 지역별 고유 ID 만들기
    6. Cartogram으로 우리나라 지도 만들기
    7. 인구 현황 및 인구 소멸 지역 확인하기
    8. 인구 현황에서 여성 인구 비율 확인하기
    9. Folium에서 인구 소멸 위기 지역 표현하기
  6. 19대 대선 결과 분석
    1. Selenium과 Beautiful Soup을 이용한 데이터 획득 준비 작업
    2. 19대 대선 개표 결과 데이터 획득하기
    3. 각 후보의 득표율과 지역 ID 정리
    4. 19대 대선 결과 득표율 시각화하기
  7. 시계열 데이터를 다뤄보자
    1. Numpy의 polyfit으로 회귀(regression) 분석하기
    2. Prophet 모듈을 이용한 forecast 예측
    3. Seasonal 시계열 분석으로 주식 데이터 분석하기
    4. Growth Model과 Holiday Forecast
  8. 자연어 처리 시작하기
    1. 한글 자연어 처리 기초 - KoNLPy 및 필요 모듈의 설치
    2. 한글 자연어 처리 기초
    3. 워드 클라우드
    4. 육아휴직 관련 법안에 대한 분석
    5. Naïve Bayes Classifier 의 이해 – 영문
    6. Naïve Bayes Classifier 의 이해 – 한글
    7. 문장의 유사도 측정하기
    8. 여자친구 선물 고르기



댓글을 달아 주세요

  1. 이전 댓글 더보기
  2. red621 2018.10.03 20:34

    안녕하세요? 책으로 공부하다가 에러가 나서 문의드립니다. 2장에서 seaborn dataset(예. tips, flights 등)을 불러올 때 에러가 발생하는데 해결방법에 대해 알려주시면 감사하겠습니다. 깃허브 상의 선생님의 코드로 돌려도 테이블이 나타나지 않고 에러가 뜨네요...

    • BlogIcon PinkWink 2018.10.05 03:51 신고

      그래요? 혹시 seaborn만 업데이트를 해보는 건 어떨까요? 터미널 명령을 사용하기 어려우시면 anaconda 네비게이터로 가셔서 모듈을 업데이트 하셔도 됩니다.

  3. 이정인 2018.10.07 21:21

    안녕하세요. 책에 일부 파일들의 다운로드 방법에 대해 문의 드립니다. https://github.com/PinkWink/DataScience/tree/master/data/01. population_in_Seoul.xls ==> 다운로드 가능. 하지만 같은 폴더에 있는 01. CCTV_result.csv 또는 03. test_first.html 등 다운로드 버튼이 없는 파일들은 어떻데 다운 받나요?

    • BlogIcon PinkWink 2018.10.10 07:51 신고

      https://github.com/PinkWink/DataScience
      주소에서 전체 다운로드를 하실 수 있습니다.^^
      개별 접근은 안되더라구요^^

  4. 명현 2019.01.20 10:26

    책 사서 열심히 공부하고 있는데 막히는 부분이 있어서 질문드립니다!
    2장 공부중에 터미널에서
    pip install googlemaps로 설치하고 pip list로 확인해보면 googlemaps 3.0.2 가 설치되어 있는것이 확인되는데, 주피터 노트북에서
    import googlemaps 했을 때 ModuleNotFoundError: No module named 'googlemaps' 라고 에러가 나서 진행을 할 수가 없습니다. 답변 부탁드려요!ㅎㅎ

    • BlogIcon PinkWink 2019.01.20 14:47 신고

      사실 잘 모르겠어요ㅠㅠ. 혹시 환경이 맞나요? jupyter notebook에서 !pip list를 해서 다시 한번 그 결과를 봐주세요.

    • 명현 2019.01.20 15:28

      빠른 답변 감사합니다ㅎㅎ 명령 프롬프트에서 파이썬 실행시키고
      import googlemaps
      gmaps_key=""로 키 넣어주고
      코드 실행시키니까 돌아가는데요.
      문제는 주피터 노트북에서는 !pip list로 봤을 때 googlemaps가 없는 것으로 봐서 연결이 안되는 것 같아요. 혹시 계속 해보다가 방법을 찾으면 공유해보도록 하겠습니다.

    • BlogIcon PinkWink 2019.01.27 09:07 신고

      그래도 에러를 직접 해결하셨군요. 대단하십니다.^^

  5. jyj 2019.02.16 15:51

    7장 fbprophet 다운로드 하는 과정좀 상세하게 설명해주시면 감사하겠습니다.. 이틀째 진도를 못나가고 있어요 ㅜ

  6. 2019.02.17 12:49

    비밀댓글입니다

    • BlogIcon PinkWink 2019.02.27 05:59 신고

      다른 챕터를 이미 공부하셨다면 지금에 와서 matplotlib에러가 나는 것이 조금 이상하긴 하네요. pip list 명령으로 해당 모듈이 설치되었는지 확인해 보세요. 그리고 설치가 되지 않았다면, matplotlib.org의 설치 페이지의 안내대로 설치하시면 됩니다.

  7. 2019.02.17 19:24

    비밀댓글입니다

  8. Choi 2019.02.19 22:21

    안녕하세요! 이 책으로 이제 막 시작하는 독자입니다.
    모듈들을 책 13페이지에 있는 버젼으로 재설치하려니 자꾸 설치 실패가 뜨는 모듈들이 몇 개 있습니다ㅠㅠ 그래서 그냥 최신버전으로 깔아서 1장부터 하고 있는데... 왜 설치 실패가 뜨는 걸까요?ㅜㅜ

    • BlogIcon PinkWink 2019.02.27 06:03 신고

      버전간 의존성이 조금 문제가 있습니다. 지금 정리중이긴한데.. 곧 배포하도록 하겠습니다. 그냥 최신버전으로 하셔도 되고, 3.6을 사용하셔도 됩니다.

  9. Demon 2019.05.02 06:46

    안녕하세요 책 보고 따라하고 공부하고 있습니다.
    4장 셀프 주유소는 정말 저렴할까 파트부분에서

    selenium을 사용하여 네이버로 로그인 하는 부분이 있는데,
    기본 naver.com의 메인 페이지의 로그인 부분이 바뀌었습니다.
    그래서 로그인 페이지로 이동되어 로그인 해야 합니다.

    네이버로 로그인 하는 페이지가, 책의 집필 당시와 현재와 상이하여
    예제 및 다른 것들이 실행되지 않습니다.

    변경된 예제나 다른 방법은 없나요?
    확인 부탁드려요 :D

    방법을 알려주시길 바랍니다.

    • BlogIcon PinkWink 2019.05.02 16:22 신고

      일단. 네이버 실습은 조금 넘겨야할 것 같습니다. 아니면 수동으로 크롬드라이버 화면에서 인증을 진행한 후 다음으로 넘어가도 될 겁니다. 지금 이부분 코드를 다른 예제로 대체하려고 하는데 시간이 잘 안나서요ㅠㅠ

    • Demon 2019.05.03 07:59

      핑크윙크님!
      그럼 혹시 구글 메일로 예제로 대체는 안될까요?

      한번 확인해보시고 금방 되실것 같으시면 알려주시면 좋을듯 합니다 :D

      꼭 부탁드려요

    • 2019.05.03 12:02

      비밀댓글입니다

    • BlogIcon PinkWink 2019.05.03 15:13 신고

      네.. 안타깝게도 구글은 간단하지 않습니다.^^ 지금은 yes24 정도를 생각하고 있습니다.

    • BlogIcon PinkWink 2019.05.03 15:13 신고

      네.. 예제가 변경되는 데로.. github을 통해 변경할 예정입니다. 감사합니다.^^

  10. kky 2019.05.13 14:33

    셀프주유소 챕터에서 네이버 자동로긴 안되고 자동문자입력하라고 막혀요 ㅠㅠ;;

    해법좀요 핑크윙키니뮤ㅠㅠㅠㅠ

    • BlogIcon PinkWink 2019.05.13 18:50 신고

      일단.. 이 책의 수준에서는 글자입력을 패스하기 어렵습니다. 크롬드라이버에서 손으로 클릭해서 진행하는것이 가장 좋습니다...ㅠㅠ.

  11. 흑곰 2019.05.14 17:09

    안녕하세요! 쓰신 책으로 1장을 배워나가는 초짜입니다. ^^
    오타 수정 관련인데요~

    P54, 밑에서 세 번째 줄, 0.7 이하면 뚜렷한 상관관계 --> 0.7 이상이면 뚜렸한 상관관계

    라고 되어있는데, 처음에 쓰신 '뚜렷' 이 맞습니다. '뚜렸' 이란 표현은 없어요~ ^^

    열심히 공부하겠습니다! 좋은 책 써주셔서 고맙습니다~ ^^

    • BlogIcon PinkWink 2019.05.14 19:45 신고

      헉.. 그렇군요.. 저런..ㅠㅠ.
      지금 오류를 줄인 버전을 새로 판올림을 하려고 하는데.. 정말 시간이 안나네요ㅠㅠ.

  12. lkkjasd 2019.06.05 14:54

    안녕하세요, 자기주도학습시간에 빅데이터에 대해서 공부하고 싶어서 일단 무턱대고 책을 구매해서 하루에 1장씩 따라하고 있습니다.
    너무 친절하게 설명해주시고 github에 수정사항이 빼곡히 잘 나와있어서 너무 좋았습니다. 이러한 좋은 책을 출판해주셔서 감사합니다. 제가 질문이 하나 있는데 4-2 주유소 가격 정보 얻기 ln [11] 에서 driver.get("https://www.opinet.co.kr/searRgSelect.do") 을 하면 지역별로 검색할 수 있는 구글맵 같은 것이 떠야하는데 그게 아니라 주유소 메인 창으로 저절로 redirect 되더라구요. 그래서 불편하지만 메인페이지에서 한번 더 저 주소로 driver.get 하면 그제야 지역별로 넘어가집니다; x-path click 코드로 들어가보려 했으나 주유소/충전소 찾기 클릭 후 지역별 부분을 개발자도구로 찍어보니 javascript:gopageNet 이런식으로 뜨는데 이런경우 js-path를 써서 click해야 하는지... 너무 긴 질문을 해서 죄송합니다. 바쁘시면 제 감사인사만 받아주셔도 상관없습니다.

    • BlogIcon PinkWink 2019.06.09 10:14 신고

      http://www.opinet.co.kr/searRgSelect.do

      위 주소를 사용해보시면 좋겠습니다. 그리고 열심히 오류를 수정해서 업로드하려고 준비하는데 시간이 허락하지 않네요ㅠㅠ. 아무튼 감사합니다.

  13. 이승진 2019.06.30 12:15

    현재 4장 학습중에 xcode를 이용해 로그인을 시도하고 있습니다. 하지만 최근 네이버 로그인 보안 강화문제로.. 다른 로그인창으로 이동해 로그인을 시도하도록 하고있고, 이에 맞춘 xcode 추출 이후 로그인을 시도하고있는데, 비정상적 로그인 시도로 간주하는지 보안코드를 (그림을 주고 1E4FGD와 같은 형식으로 입력하라는 것) 입력하도록 하여 로그인을 못하고 있습니다. 이 문제를 어떻게 해결할 수 잇을지요?

    • BlogIcon PinkWink 2019.06.30 21:55 신고

      아주 슬프지만, 현재 해당 코드는 진행하기가 어렵습니다. 그러나 네이버 로그인은 수동으로 처리한후 진입하면 이후 코드를 연습하실 수 있습니다.

  14. BlogIcon 이찬영 2019.07.01 19:50

    안녕하세요!

    영국으로 business analytics 석사에 진학할 학생입니다.
    학부 전공이 일반경영이라, 가기 전에 '파이썬으로 데이터 주무르기'로 파이썬을 공부하고자 합니다.

    다름이 아니라, 제 github에 이 책에 나와있는 코드를 올려도 가능한지 여쭤보고자 합니다.
    출판 된 책의 내용을 똑같이 올리는 것과 마찬가지로 코드를 올리는 것도 도용?이라고 생각이 들어서
    이런 것을 여쭤보는 것 자체가 이상하지만, 혹시나해서 여쭤봅니다.

    이 책에 담겨있는 6가지의 프로젝트를 올리기 전에,

    1) 출처 및 허락을 구한 것을 정확히 명시하고
    2) 내용은 한글를 영어로 수정할 계획이며, 가능하다면 해외(주로 영국) 데이터로 사용할 것이고
    3) 목적은 영국에서 취업을 할 때 github를 포트폴리오로 제출하려고 합니다.

    황당한 부탁일 것으로 예상되나 용기내어 글을 남깁니다.

    감사합니다.

  15. 아리랑 2019.09.29 11:19

    안녕하세요. 저 멀리 해외에서 공부 중인 유학생입니다. 한국에 방학 때 교보에서 진짜 딱 보자마자 이거다 하고 사와서 공부 중입니다. 좋은 책 써주셔서 감사말씀 먼저 드리구요! 질문 좀 드려도 될까요? 혹시 유사한 질문 받으신 적이 있다면 링크라도 걸어주실 수 있을까요 ㅠ? 독학이라 참 막막하네요..다른 개념서랑 같이 보고 있는데도, 이부분은 안나오기도 하고, 유튜브나 구글링해도 안나와서 정말 어렵게 질문드려요. ㅠㅠ ( 나중에 개정판 넣어주실때, 제가 궁금해 했던 점들에 대한 설명도 조금 추가해주시면 어떨까 하는 제안도 살짝 드려봅니다.)
    꼭 좀 답변 부탁해주시면 감사하겠습니다..ㅠㅠ

    1) 70p의 오차 구하는 원리..
    data_result['오차'] = np.abs(data_result['소계']-f1(data_result['인구수']))
    수학적 개념이긴 하지만 어떻게 접근하신 건지 간단히 설명 해주실 수 있을까요.. 문송합니다...


    2) 71p 의 산점도 그래프 그릴 때, 컬러 옵션을 오차 결과로 하신거는, 오차 결과에 따라 색깔이 달라진다는 뜻인가요? 그 개념이 와닿지가 않아서요.. 좀 쉬운 설명을 부탁드려도 될까요.
    plt.scatter(data_result['인구수'],data_result['소계'],
    c=data_result['오차'],s=50)

    3) 71p에서 plt. text 그리실때
    for n in range(10):
    plt.text(df_sort['인구수'][n]*1.02,df_sort['소계'][n]*0.98,
    df_sort.index[n],fontsize=15)

    x, y 에 각각 1.02, 0.98 붙이신 이유가 너무 궁금합니다 ㅠㅠㅠㅠㅠㅠㅠ

    메일로도 답변 해주실 수 있을까요? 저도 블로그 들어와 확인해볼게요 ㅠㅠ sdhera@naver.com

    • BlogIcon PinkWink 2019.09.29 12:04 신고

      네. 일단 저의 첫책은 너무 어렵죠ㅠㅠ. 아무튼 답변을 드리면

      1) data_result['소계']-f1(data_result['인구수']) 만 보면, 참값이라고 할 수 있는 data_result['소계']와 나름 직선으로 표현한 f1(data_result['인구수']) 데이터의 차이(빼기)로 구해서, 절대값(abs)을 씌웠습니다. 그럼 오차가 되죠. 오차의 정의에는 부호가 없습니다. 그래서 절대값을 사용했습니다.

      2) 그림의 결과를보면 color bar가 옆에 있는데요. c라는 옵션으로 c=data_result['오차'] 이렇게 설정하면, 오차에 따라 색상을 바꾸라는 지령을 내린겁니다.

      3) x, y에 약간의 숫자를 더하지 않으면 점과 글자가 겹치거든요. 그래서 조금 간격을 두라는 의미해서 그렇게 해두었습니다.^^ 감사합니다.

    • 아리랑 2019.10.03 03:32

      헉! 저자님, 소중한 답변 너무 감사합니다!
      방금 확인했어요. 정말 막막했는데, 뭔가 확 뚤리는 느낌이에요. 정말 감사합니다..
      2번 3번은 확실히 이해했습니다.
      1번은 오차를 구하는 개념을 잘 이해를 처음 제가 못했어가지구, 혼동을 했었거든요..
      인구수의 오차뿐만 아니라, 오차를 구할때는, 참값과 f1을 사용해 그 차이를 구하면 된다 라고 이해하면 될까요? ㅎ아직 거기까지는 이해 하지 않아도 될까요? ㅎㅎ

      이제 2장 좀 더 자신있게 넘어갈 수 있을 것 같아요. 감사합니다^^

    • BlogIcon PinkWink 2019.10.06 09:45 신고

      내가 예측하는 모델 f1과 실제 데이터가 주는 참값과의 차이를 오차라고 생각했기 때문입니다.

  16. 정태민 2019.10.17 12:48

    안녕하세요. 책으로 잘 공부하고 있습니다. 그런데 '시계열을 다루워 보자'라는 파트에서 7-2와 7-3이 전부다 처음 임포트 단계에서부터 작동을 하지 않네요. 출판된 이후 무언가가 바껴서 안되는 건지 아니면 제가 잘 못해서 안되는 건지 궁금합니다. 참고로 깃허브에 있는 코드그대로 복사 붙여넣기해도 안되더라구요.
    <7-2 파트 처음 부분에러>
    TypeError: __init__() got an unexpected keyword argument 'yearly_seasonality'

    <7-3 파트 처음 부분에러>
    ModuleNotFoundError: No module named 'fix_yahoo_finance'

  17. 홍석 2020.02.09 21:46

    1장 최근 제가 다운 받은 data가 int가 아니라 연산이 안되는 것 같은데...
    p43> pop_seoul['외국인 비율']=pop_seoul['외국인']/pop_seoul['인구수']*100
    .....
    astype 으로 변환해도 안되구.
    해결할 수 없네요.ㅠㅠ

    • BlogIcon PinkWink 2020.02.16 12:26 신고

      astype으로 변환하고자 할때 할 수 없다는 에러가 나면 문자나 널문자가 포함되었을 수 있습니다. 확인을 한 번 해보시죠~

  18. geunsu 2020.02.18 23:14

    162 페이지 In[20]에서

    label 이름지정이 빠진거 같습니다.
    코드 그대로 실행하면 범례가 생성되지 않더라구요

  19. JoGeun 2020.02.28 17:44

    In [10]:
    def append_data(df, sido_name, data):
    for each in df[0].values[1:]:
    data['광역시도'].append(sido_name)
    data['시군'].append(each[0])
    data['pop'].append(get_num(each[2]))
    data['moon'].append(get_num(each[3]))
    data['hong'].append(get_num(each[4]))
    data['ahn'].append(get_num(each[5]))

    6-2 내용입니다 each[2]의 경우 콤마가 포함되있더라도 int로 받아서 오류가 나더라구요
    get_num을 빼야하는거같습니다!

    그리고 6-2 내용 추가적으로 질문드립니다

    In [9]:
    from selenium.webdriver.common.by import By
    from selenium.webdriver.support.ui import WebDriverWait
    from selenium.webdriver.support import expected_conditions as EC

    wait = WebDriverWait(driver, 10)

    def move_sido(name):
    element = driver.find_element_by_id("cityCode")
    element.send_keys(name)
    make_xpath = """//*[@id="searchBtn"]"""
    wait.until(EC.element_to_be_clickable((By.XPATH,make_xpath)))
    driver.find_element_by_xpath(make_xpath).click()

    예제로 move_sido('서울특별시') 를 넣었더니 option은 선택됐지만 검색버튼이 클릭이 안되더라구요
    어떻게 해결하면 될까요?

    • BlogIcon PinkWink 2020.03.04 02:39 신고

      제가 다시 수행해 보았는데 이상이 보이지 않았습니다. 어떤 부분이 문제일지 예상이 잘 되지 않네요ㅠㅠ.

  20. 2020.03.14 11:18

    비밀댓글입니다

  21. 돼지펭귄 2020.04.27 12:01

    파이썬으로 데이터 주무르기 책을 구입하여 공부하고 있습니다.
    driver.get("http://www.opinet.co.kr/searRgSelect.do")
    실행했을때 해당 URL로 가지 않고 메인페이지인 http://www.opinet.co.kr/으로 가져서
    다음을 진행 못하고 있습니다. 팝업창도 나오고 해서 다른 방법으로 팝업은 종료시키는 것 까지 했으나,
    해당 http://www.opinet.co.kr/searRgSelect.do 으로 연결할 방법이 없습니다.