아주 오래전부터 저는 제로베이스에서 딥러닝, 머신러닝 부분 전임강사 활동을 하고 있습니다. 제로베이스의 수강생들은 중간 중간에 많은 프로젝트를 수행하는데요. 요즘엔 제가 오프라인 수업이 많이 없고, 기존에 찍었던 온라인 수업 위주여서 수업 진행보다는 프로젝트를 수행하는 수강생들과의 대화와 그들과 기업 사이의 연결에 대한 고민들을 많이 하고 있습니다. 짧은 기간 이지만 집중력 높게 수업을 진행한 우리 수강생의 프로젝트를 소개하는 것이 좋겠다는 생각이 들었습니다.
이번에 소개하는 데이터는 네이버 쇼핑몰 데이터를 얻어서 그 속에서 문장을 학습해서 감성 분석을 해보는 것이구요. 이 과제는 자체적으로 수업의 일환으로 진행된 과제입니다.
앗. 줌으로 발표를 한 것이라 제 얼굴이 살짝 노출되었군요ㅠㅠ.
이런 저런 이상한 표준어 스럽지 않은 외계어(^^)에 가까운 문장들도 감성분석을 해보고 싶었나 봅니다.^^
여하튼, 데이터를 수집하고, 정규식을 통해 걸러낼걸 먼저 걸러내고, 토큰화까지 진행한 후 LSTM과 BILSTM을 사용해서 예측을 하는 모델을 시도했습니다.
데이터 EDA 중에 나타난 현상이라고 하는데요. 긍정적 리뷰의 결과는 이해될법한데, 부정적 리뷰에서도 "좋아요"가 많이 있다고 하네요. 그러니까. 이런 식인 모양입니다. "좋아요. 그런데~" 이렇게 말이죠^^
정규식으로 걸러낼걸 먼저 걸러내고
불용어도 살짝 걸러내고
학습을 시킨 모양입니다. 사실 acc가 엄청 높진 않지만, 저는 이 친구들이 진행한 방식과 처음 딥러닝을 배우고 진행한 그 경험을 높게 평가를 합니다.
특히 그 결과를 보면, 별점(평점)은 높으나 우리가 직접 보았을때 문장 자체가 약간 부정적 느낌의 리뷰에 대해 예측 평점이 역시 부정적으로 나타나서 오히려 재미있는 결과로 보이기도 합니다.^^
'Education' 카테고리의 다른 글
[제로베이스 수강생 프로젝트 소개] 사투리로 된 문장의 유사도 계산 (2) | 2023.01.31 |
---|---|
[수강생 프로젝트 소개] 스마트 팩토리 (0) | 2023.01.25 |
[수강생 프로젝트 소개] 스마트 주차장 (0) | 2023.01.20 |
22년 11월 H-Mobility Robotics 해커톤 대회를 마쳤습니다 (0) | 2022.11.22 |
비버웍스가 NLP 해커톤 대회를 통해 좋은 인재를 모집합니다. [feat. 핑크랩] (4) | 2022.11.18 |
2022년 강남 청소년 로봇AI 전문가 과정을 PinkLAB이 수행했습니다. (2) | 2022.10.26 |
핑크랩이 H-Mobility 해커톤 대회를 준비합니다. (2) | 2022.10.04 |