제로베이스의 데이터사이언스 스쿨의 학생들은 긴 기간 학습과 프로젝트를 번갈아 합니다. 기본적으로는 영상 학습 자료가 제공되긴 하지만, 수준있는 프로젝트를 수행하는 경우는 스스로 해결하면서 진행하도록 유도됩니다. 이 과정에서 저도 전담 강사로서 함께 고민하는 경우가 많은데요. 이번에 소개할 팀은 처음 접하는 류의 데이터를 만나 엄청 고생하면서 학습을 진행을 했습니다. 바로 소리라는 데이터를 주파수라는 영역에서 들여다 보는 것이었습니다.
왜 고양이가 등장하는지는 좀 있다 밝혀집니다.~^^
프로젝트의 개요
이번 팀의 발표 자료를 꾸미는 스타일이 제가 선호하는 스타일입니다. 아무튼, 언어를 배우는 사람이 자신의 발음이 어디를 교정하면 되는지를 알아 볼 수 있도록 하는 개념을 구현하려고 노력했습니다.
그래서 고양이라는 발음으로 비교를 해보려고 한 것이죠. 음.. 고양이는 단순한 동물이 아니라.. 뭔가 신비한 존재가 분명합니다.~
프로젝트의 진행
소리를 다루는 것은 시간 영역에서 보다 주파수의 영역에서 더 많은 시간을 보내는 것 같습니다. 저도 아직 시리즈를 다 완성하진 않았지만, 제 블로그에서 몇몇 이슈를 이야기했었는데요.
먼저 파이썬으로 주파수 분석을 하는 기본적인 이야기를 다룬적이 있구요.
소리의 주파수 분석에 많이 활용되는 librosa라는 모듈을 소개한 적이 있습니다.
아무튼 우리 팀은 음성을 추출하고, 전처리를 거쳐 특성을 MFCC로 추출하고, 길이나 간격을 맞추기 위해 DTW를 거친 결과를 가지고 유사도를 측정했습니다.
프로젝트 결과 소개
먼저 목소리 출연을 과감하게 허락해주신 다은님에게 고맙다는 말을 전하구요.
위 소리는 두가지 버전의 "고양이"라는 발음입니다.
위에서 말한 과정들을 거쳐 음절을 매칭시킨 후 유사도를 측정하게 됩니다.
그랬을때 이렇게 결과를 얻을 수 있도록 작업을 한 것입니다. 비록 이번 팀은 종강과 함께 이 프로젝트는 종료를 하지만, 주어진 기간 동안 참 열심히 프로젝트를 수행한 팀으로 제 기억에 남아 있을 것 같습니다. 처음에는 간단한 개념만 확인해보자는 느낌이었는데, 워낙 승부욕들이 강한 친구들이라 그런지 끝까지 붙잡고 프로젝트를 진행한 것이 저 개인적으로는 고맙기도 합니다.
사족...
원래 이 프로젝트는 이 팀에게는 약간 사이드프로젝트의 느낌이었습니다. 그럼에도 불구하고 깊은 탐구의욕으로 도전한 것이 대단하다고 생각합니다. 본래 이 프로젝트는 제로베이스의 수강 기간에 이루어진 것입니다. 그러나 의뢰는 핑크랩에서 받아서 제가 전임 강사로 활동하는 제로베이스의 수강생에게 제안을 했던 것입니다. 핑크랩이 수행했던 프로젝트나 현재 수행중인 프로젝트는 아래 링크를 확인해주세요. 또한 이런 성과를 보고 관심있는 기업은 연락주세요;
https://www.pinklab.art/project
'Theory > Project' 카테고리의 다른 글
핑크랩이 문제풀이 학습 시장용 유사문제 찾기 알고리즘에 도전합니다. (0) | 2022.07.25 |
---|---|
핑크랩이 물류로봇에서 사용될 Pose Estimation 프로젝트를 도전합니다. (0) | 2022.07.24 |
전성분을 기준으로 유사화장품 찾기 (2) | 2022.07.13 |
노정석 대표님과 함께 프로젝트를 시작하게 되다... (2) | 2022.05.22 |