본문 바로가기

Education

데이터 사이언스 과정을 막 배운 병아리 레벨이지만 열정을 가진 분들을 소개합니다.

저는 도전적인 일을 정말 좋아합니다. 이번에도 저 개인적으로는 도전적인 일을 하나 소화했습니다. 저는 패스트 캠퍼스와의 인연이 꽤 오래되었습니다. 처음 인연을 맺었던 강의는 파이썬을 활용한 데이터 분석 입문이라는 수업이었습니다. 2016년 가을쯤에 시작해서 2019년 겨울까지 수업을 진행했습니다. 여유가 생기면 곧 다시 시작할 수 있지 않을까 합니다.^^ 그리고 2019년 11월부터 정말 기억에 남고 무시무시한 AI Robot이라는 수업을 또 진행했습니다. 항상 뭔가 수업을 한다는 것은 내가 알고 있던 지식을 다시 체계적으로 정리해야하고, 또 미처 정리하지 않았던 내용도 보강해서 잘 정리해 두고 있어야합니다. 특히 저처럼 언제가 새로움을 추구하고 그 와중에 실습형 수업을 좋아하는 사람은 더더욱 여러 상황에 대비해야합니다. 소스코드는 이렇게 따라하면 쉬울까 어떻게 따라하면 혼선이 없을까 등등을 계속 확인해야하는 거죠ㅠㅠ. 패스트 캠퍼스는 오프라인 강의는 단기성 강의인 캠프 강의와, 또 오늘 이야기할 스쿨 강의가 있습니다. 네~ 제가 바로 그 스쿨 강의를 덥썩.ㅠㅠ. 정말 덥썩 한 꼭지 맡아서 진행을 했습니다.

네.. 바로 저 건물에서 시작해보기로 한 거죠^^

새로운 경험 Fast Campus School 수업

대략 1월부터 시작한 패스트캠퍼스의 데이터사인스 과정 스쿨 수업에서 2학기 파트가 3월부터 시작되었는데, 저는 그 3월 후반부터 10주간(8주 강의, 2주 프로젝트), 머신러닝이라는 주제로 일주일에 하루씩 총 70시간을 강의했습니다.

와우~!!! 저 개인적으로는 엄청나게 많은 수업 준비와 긴장을 한 수업이었습니다. 어떻게 하면 정의와 과정을 정확히 전달할 것인가? 그 와중에 어떻게 하면 집중력을 잃지 않도록 수업에 참여시킬것인가 등을 계속 고민했습니다. 아무튼 10주간 저는

  • Decision Tree
  • 하이퍼파라미터 튜닝
  • 모델 평가
  • 회귀
  • Logistic Regression
  • 앙상블 기법
  • Boosting Algorithm
  • GBM, XGBoost, LightGBM
  • Principal Component Analysis
  • k Nearest Neighber
  • PCA eigenface
  • NLTK using Naive Bayes Classifier
  • Distance of Sentences
  • Clustering
  • Recommendations
  • Simular Image
  • Learning Deep Learning
  • Convolutional Neural Network
  • Recurrent Neural Network
  • Pre-trained Model and Transfer Learning
  • Feature Extractor
  • Neural Style Transfer
  • YOLO

정도의 개념을 다루었습니다. 조금 많긴 하지만, 그래도 조금이라도 더 많은 것을 전달했어야했는데 하고 후회되는 부분도 있습니다. 물리적으로 10주의 시간이 길지 않았습니다.ㅠㅠ.

이렇게 많은 자료를 준비했습니다.

ㅎㅎ 저 자료들은 예전에 가지고 있던 것은 다시 정리했고, 또 완전히 새롭게 만든 것도 있지요^^

강의를 위한 교재는 충분히 흥미를 끌게 하기 위해 노력했습니다. 뭐 약간 강의와는 쓸데없는 와인의 역사 같은것도 들어가긴 했지만요.ㅠㅠ.

개념은 최대한 쉽게 설명하기 위해 정말 많은 노력을 기울였습니다. 더 해야하지만.ㅠㅠ.

아무튼 이렇게 저 개인적으로는 고민하고 노력했지만, 여전히 수강생 분들에게 보다 많은 것을 보다 잘 전달하지 못한 것이 아닐지 미안하고 걱정이 됩니다. 그래서 오늘 글의 목적은 수강생 자랑하기입니다. 이 분들은 8주의 머신러닝과정을 마치고, 2주간의 기간동안 프로젝트를 진행했습니다. 불과 20주전에는 파이썬도 모르는 분들이, 불과 10주 전에는 머신러닝을 모르던 분들이 딱 2주 만에 작업한 성과입니다. 이 성과를 자랑하는 것이 오늘 포스팅의 목표라는 것이죠^^

수강생 프로젝트 - 리뷰 감성 분석 및 화장품 추천

먼저 이분들은 화장품의 리뷰와 평점을 이용해서 감성 분석 및 추천 시스템에 도전해 보신 분들입니다.

팀웍이 좋았고 지속적으로 끈기를 가지고 잘 접근하는 분들이었습니다. glowpick이라는 사이트를 대상으로 평정과 리뷰를 모아서 분석을 하신거죠~

이런 사이트의 크롤링이 쉬운게 아닙니다. 특히 크롤링과정도 이제 막 배운 분들에게는 말이죠. 데이터를 모으는 것부터 직접 수행을 결정한 분들이죠.

네.. 저렇게 리뷰와 평점을 21만건이나 모으셨습니다. 와우~ 저 과정이 순탄하지 않죠. ㅋㅋㅋ.

추천 시스템을 적용을 하려고 노력하셨습니다. 단 2주의 과정에서 좋은 추천시스템을 만드는 것을 목표로하는 것이 아니라 추천시스템을 만드는 과정에 여러 개념을 익히는 것을 목표로 했으면 좋겠다 생각했는데 잘 적응하신 것 같습니다.

수강생 프로젝트 - 카카오 아레나 플레이리스트 추천

저는 이런 대회가 있는 줄 몰랐는데 멜론 데이터를 가지고 개최되는 대회가 있더군요. 이 대회 출전을 목표로 프로젝트를 진행하신 분들도 있습니다.

네.. 추천 곡 리스트를 완성하는 주제의 대회에 출전하시는 분들입니다.

카카오 아레나라는 대회인데, 아마 이런 대회는 대학원 등 전공하신 분들이나 관련 업종의 분들도 많이 참여할 것 같아서, 등수보다는 역시 과정에 집중했으면 하는 바램을 저는 가졌습니다. 데이터를 모으는 노력은 없겠지만, 상금이 걸린 대회인데 만만한 데이터를 줬을리는 없겠죠^^

아무튼 이팀은 유사도 측정에 많은 시간을 할애했습니다.

아마 수업중에는 만나보지 못한 어마어마한 규모의 데이터를 만나 장비의 한계를 많이 경험하셨을 겁니다.

그래도 스스로들 많은 경우를 찾아 학습하고 다시 적용하려는 좋은 노력을 보여주셨습니다. 그리고 아직 대회가 많은 기간 남았고 어쩌면 앞으로 순위가 떨어질 수도 있지만, 태그생성 분야에서 7위를 달성중이십니다.^^

수강생 프로젝트 - 책 읽는 성향에 맞는 여행지 추천

이 팀은 저 개인적으로는 주제가 재미있다고 느낀 팀입니다.

ㅎㅎ 참 즐겁게 준비하고 다른팀도 그랬지만 많은 고민들을 해결할 방법을 찾기 위해 고생한 팀입니다. 이분들은 이번 프로젝트에서 어떤 서비스를 런칭하는 상황을 가정하고 진행하셨습니다.

책을 읽는 독자에게 혹시 너~ 여기 여행가볼래???라고 추천하는 서비스를 만들어 보려 한거죠. 단지 책에 있는 직관적 단어보다는 뭔가 감성적 추천을 시도하셨죠^^

그래서 양대 시장 확대에 어떤 시너지 효과가 나지 않겠느냐~ 라는 것입니다.

그래서 만약 이렇게 책 구매 사이트에서 짠~하고 이런 여행지도 관심있으신가요?라고 이 책을 즐겁게 읽는 독자라면 이런 감성의 여행지는 어떨까하고 소개하는 거죠^^

물론~ 현실은 냉혹해서, 데이터를 모으고 라벨을 붙이는 과정은 어렵습니다. ㅋㅋㅋㅋ

그리고 책의 주제와 내용을 보고 파악을 하려다보니 데이터를 주어진 기간에 많이 모으진 못했지만~ 그래도 우리가 이 과정을 즐기는 것이 더 중요하니 지금은 괜찮습니다.^^

그래서~ 저런 책을 읽은 독자에게 저런 여행지를 추천하는 것이죠^^

수강생 프로젝트 - 비슷한 그림체의 웹툰 추천

그림체라는 것을 과연 구분할 수 있을지 ... 저도 궁금했습니다.

비슷한 그림체의 웹툰 찾기 라는 프로젝트인거죠^^

일단 라벨링과 데이터 정리에 많은 노력이 들어가죠^^

그래도 어느정도는 비슷하게 찾는 경우도 있었습니다^^. 이 분들은 이미지와 분류에 관련된 정말 많은 시도를 하셔서 많은 지식을 쌓으셨습니다. 이 시도는 어쩌면 누군가 이어받아 계속 진행되어도 좋지 않을까 했습니다.

수업을 마치며

수업을 마치면 언제나 후회가 생깁니다. 나 따위가 뭐라고 저들을 가이드할 수 있을까.라는 원천적 자괴감부터, 아~ 이걸 이렇게 이야기했으면 더 좋았을텐데~라는 아쉬움까지... 언제나 그렇듯 수업은 듣는이가 있기 때문에 살아있는 것입니다. 아무튼, 수업은 양방향이니 서로에게 자극을 주는 과정인것 같습니다. 이 수업을 들은 분들께서 자신의 능력이 성장되고 즐겁게 일할 수있는 좋은 직장을 구하시면 좋겠습니다. 혹시 이 프로젝트들을 보시고 어~ 우리 팀에 인턴이나 신입사원으로 괜찮겠는데? 하시는 분들이 있으시면 연락주세요~^^

반응형