본문 바로가기

Education

제로베이스 온라인반 수강생들의 머신러닝 딥러닝 작품 활동

저는 제로베이스의 데이터사이언스 스쿨[https://zero-base.co.kr/event/school_DS]에서 머신러닝 딥러닝 강의를 하고 있는데요. 이 과정에서 온라인반 수강생들의 프로젝트 발표가 설직전에 있었습니다. 이 내용 중 일부를 소개하려고 합니다. 많은 기간 동안 파이썬의 기초부터 머신러닝, 딥러닝, 그리고 알고리즘까지를 온라인으로 그 과정을 완료하신 분들인데요. 마지막 과정이 한 달 정도 오프라인으로 프로젝트를 완료하는 것입니다.

잠시 제로베이스의 데이터사이언스 스쿨의 과정을 소개하면 일단 전 과정이 무료입니다. 내일배움카드, 국비지원 뭐 이런게 아니라 그냥 무료입니다. 전 과정은 4~5개월간 이어지는데 그 과정이 모두 무료인거죠. 온라인으로 강의는 진행되지만, 각종 퀴즈와 과제, 프로젝트베이스의 교육 위주입니다. 그리고 마지막에는 오프라인으로 전환되면서 파이널 프로젝트를 완료해야하는 것이죠. 이 과정 중에 창피하게도 제가 머신러닝/딥러닝 부분을 강의를 합니다.ㅠㅠ. 아무튼 오늘은 이번에 22년 1월 30일에 종강한 온라인 반 분들의 프로젝트 중 일부를 소개합니다. 

유사 음원 찾기

이 팀이 사용한 데이터는 한 스타트업에서 제공해 주신 음원데이터를 기본으로 하고 있습니다. 언제 제가 이 스타트업에서의 활동과 아이템을 소개할 수 있는 날이 오면 좋겠네요. 꽤 재미있는 일들을 많이 하거든요. 이번에 수강생들에게 제공된 데이터와 아이템 주제도 사실 이 회사에서 제가 리딩하는 팀이 꽤 좋은 성과를 내고 있는 아이템이랍니다.

아무튼 주제는 유사음원찾기입니다.

표절검사라고 멋지게 말하고 싶지만, 아직 표절까지는 조금 힘들구요. 유사한 음원을 찾는 기능으로 표현해야 맞을 것 같습니다. 아무튼 너~무 유사하면 표절의심도 해 볼 수 있는겠지만요.

만약 음원을 공개하는 어떤 플랫폼이라면 특히 유사음원에 대해 미리 검색할 수 있으면 좋을 겁니다.

오디오 데이터를 저렇게 몇몇 좋은 도구를 이용해서 특성을 추출했습니다.

주파수 영역에서의 특성도 함께 추출해서 해당 특성들을 가지고 머신러닝 알고리즘에 접목한 것입니다.

이 수강생들은 이 번 프로젝트를 위해 오디오의 특성과 오디오 파일을 머신러닝에서 분석하기 위해 어떤 절차를 거치는지 광범위하게 학습을 했습니다. 특히 멜스텍트럼 분석을 통해 이미지로 변환된 음원을 딥러닝에도 적용하려 시도했구요.

유사도가 평가 기준이 약간 감성적인 부분이 있어서 평가는 애매하지만, 그래도 잘 한 것으로 보입니다. 특히 이 팀의 경우 처음 접근할때와 프로젝트가 끝날때 보여준 성장의 정도가 참 남다른 팀이었던것 같습니다.

독거 노인의 낙상 감지 시스템 개발

이 팀의 경우는 독거 노인이 침대에서 떨어지거나 갑작스런 원인으로 쓰러지는 장면을 이미 설치된 카메라를 통해 확인하려는 노력을 해본 팀입니다. 

시니어 이상행동 모니터링 데이터라는 데이터를 이용해서 Pose Estimation 알고리즘과 딥러닝을 접목해서 넘어지는, 쓰러지는 장면을 찾으려고 노력했습니다. 이 과정에서 업계의 동향을 살펴보기 위해 "효돌"이라는 회사와 컨텍해서 인터뷰도 진행했었습니다. 이 자리를 빌어 다시 "효돌"에 감사의 인사를 드립니다.

제공된 데이터 중에서 falldown 데이터를 이용했구요.

데이터를 학습에 사용할 수있도록 정리하고 

포즈 검출을 먼저 시도합니다.

그리고 검출된 포즈의 결과에 딥러닝을 접목하려 노력했구요. 

이 팀의 경우는 짧은 기간 꽤 광범위한 내용을 다룰려다 보니 시간이 부족헀던 아쉬움은 있습니다. 특히 서있다가 넘어진것과 그냥 계속 누워있던것, 등 연속된 동작을 검출하는 부분을 시도하지 못했거든요. 그러나 두명의 팀원이 처음 사용해보는 개념을 빠르게 습득하고 진행하려 노력했습니다. 이런 프로젝트는 완성이 목표이긴 하지만, 또 하나 중요한건 목표를 위해 과정을 잘 진행하는 모습이라고 생각하는데요. 잘 견뎌준 팀이라고 생각합니다.

멜론 플레이리스트 곡 추천

이 팀은 카카오 아레나에서 공개된 멜론 플레이리스트 추천에 도전했습니다. 우리 수업이 워낙 광범위한 내용을 다루다 보니 추천시스템은 그렇게 깊이있게 진행하지 못한 부분도 있는데요. 이 팀은 그런 부분을 극복하고 좋은 결과를 도출한 팀입니다. 역시 열정과 열망이 있는 수강생은 언제나 강사보다 잘합니다.ㅠㅠ.

또한 이런 데이터를 공개해 준 많은 기업들에게도 새삼 고마움을 느낍니다.^^.

이렇게 많은 데이터를 가지고 프로젝트를 진행한 친구들이 아마 고생을 많이 했겠죠.

여기서 협업필터링이라는 기법을 사용했습니다. 이 기법이 배울때는 쉬워 보이는데 자기들이 직접 적용해보력고 하면 어렵거든요.

이 팀은 그 과정을 잘 이수했으며 발표에서는 본인들의 과정을 설명하기 위해 또 노력했습니다.^^

금융 관련 신문 기사와 주가의 상승/하강 예측

이번팀은 데이터 수집에 엄청난 노력을 기울인 팀입니다. 금융관련 뉴스 기사를 검색해서 데이터를 모으고 그 시점의 주식 정보를 수집해서 해당 기업과 관련된 기사가 주가의 경향에 대한 모델을 만들려고 노력했습니다. 항상 딥러닝 관련 플젝을 하면 언제나 한 팀 정도는 주식에 관심이 있는 것 같습니다.^^.

단순히 주가를 예측하고 싶다고 하면 보통 제가 말리는데요. 이 팀의 경우는 뉴스 기사와 주가의 오름과 내림 사이의 관계를 모델링 하려는 노력이라 흥미롭다고 생각했습니다. 그래서 살짝 응원했죠^^.

대상 범위가 너무나 넓기 때문에 시가 총액 상위 10개 종목에 대해 노력했습니다.

이 글을 읽는 분들께...

사실 이런 프로젝트는 그 결과는 잘 안될 수도 있습니다. 이 글을 읽는 경력직, 또 실력자들은 이러면 안되, 저러면 안되 이건 안되 뭐 이런 생각을 하실 수도 있는데요. 짧은 기간 진행하는 프로젝트에서 안정성 위주로 흘러가지 않고 저렇게 도전적 프로젝트를 선정하는 것 자체가 대단한 용기가 필요한 일이라고 말해주고 싶습니다. 그리고 이 팀들은 자신들의 한계를 매일 경험하면서 다시 극복하기를 반복합니다. 비록 어떤 주제는 그들의 환경에서는 선정해서는 안되는 것일 수도 있지만, 그래도 저는 보통 응원합니다. 한계를 극복하기 위해 노력하는 과정에서 너무나 많은 것을 배운다고 저는 믿기 때문입니다.

반응형