본문 바로가기

Theory/Project

어학 학습용으로 사용하면 좋을 것 같은 발음 비교

제로베이스의 데이터사이언스 스쿨의 학생들은 긴 기간 학습과 프로젝트를 번갈아 합니다. 기본적으로는 영상 학습 자료가 제공되긴 하지만, 수준있는 프로젝트를 수행하는 경우는 스스로 해결하면서 진행하도록 유도됩니다. 이 과정에서 저도 전담 강사로서 함께 고민하는 경우가 많은데요. 이번에 소개할 팀은 처음 접하는 류의 데이터를 만나 엄청 고생하면서 학습을 진행을 했습니다. 바로 소리라는 데이터를 주파수라는 영역에서 들여다 보는 것이었습니다.

본 글의 모든 캡쳐 그림은 제로베이스 데이터스쿨의 박덕용, 한선아, 박재우 님의 프로젝트 발표 자료입니다.

왜 고양이가 등장하는지는 좀 있다 밝혀집니다.~^^

프로젝트의 개요

이번 팀의 발표 자료를 꾸미는 스타일이 제가 선호하는 스타일입니다. 아무튼, 언어를 배우는 사람이 자신의 발음이 어디를 교정하면 되는지를 알아 볼 수 있도록 하는 개념을 구현하려고 노력했습니다.

그래서 고양이라는 발음으로 비교를 해보려고 한 것이죠. 음.. 고양이는 단순한 동물이 아니라.. 뭔가 신비한 존재가 분명합니다.~

프로젝트의 진행

소리를 다루는 것은 시간 영역에서 보다 주파수의 영역에서 더 많은 시간을 보내는 것 같습니다. 저도 아직 시리즈를 다 완성하진 않았지만, 제 블로그에서 몇몇 이슈를 이야기했었는데요.

https://pinkwink.kr/1370

 

Python으로 수행하는 주파수 분석 - FFT, STFT

아주 예전에 Python으로 수행하는 FFT라는 주제의 글을 작성한 적이 있습니다. 이번에는 이 글에서 조금 더 나가서 STFT라는 개념도 이야기를 해 보려고 합니다. 시간영역에서의 신호를 분석할 때

pinkwink.kr

먼저 파이썬으로 주파수 분석을 하는 기본적인 이야기를 다룬적이 있구요.

https://pinkwink.kr/1375

 

소리나 음원, 음악 데이터에서 주파수 특성 분석 - librosa

오늘은 소리나 음원, 음악 데이터에서 STFT나 Chroma 분석을 수행하는데 편한 librosa를 소개하고, 이를 이용해서 소리 데이터에서 특성을 추출하는 기초에 대한 이야기를 해보려고 합니다. 먼저 STFT

pinkwink.kr

소리의 주파수 분석에 많이 활용되는 librosa라는 모듈을 소개한 적이 있습니다.

아무튼 우리 팀은 음성을 추출하고, 전처리를 거쳐 특성을 MFCC로 추출하고, 길이나 간격을 맞추기 위해 DTW를 거친 결과를 가지고 유사도를 측정했습니다.

프로젝트 결과 소개

먼저 목소리 출연을 과감하게 허락해주신 다은님에게 고맙다는 말을 전하구요.

pinkwink_고양이.wav
0.43MB

위 소리는 두가지 버전의 "고양이"라는 발음입니다.

위에서 말한 과정들을 거쳐 음절을 매칭시킨 후 유사도를 측정하게 됩니다.

그랬을때 이렇게 결과를 얻을 수 있도록 작업을 한 것입니다. 비록 이번 팀은 종강과 함께 이 프로젝트는 종료를 하지만, 주어진 기간 동안 참 열심히 프로젝트를 수행한 팀으로 제 기억에 남아 있을 것 같습니다. 처음에는 간단한 개념만 확인해보자는 느낌이었는데, 워낙 승부욕들이 강한 친구들이라 그런지 끝까지 붙잡고 프로젝트를 진행한 것이 저 개인적으로는 고맙기도 합니다.

사족...

원래 이 프로젝트는 이 팀에게는 약간 사이드프로젝트의 느낌이었습니다. 그럼에도 불구하고 깊은 탐구의욕으로 도전한 것이 대단하다고 생각합니다. 본래 이 프로젝트는 제로베이스의 수강 기간에 이루어진 것입니다. 그러나 의뢰는 핑크랩에서 받아서 제가 전임 강사로 활동하는 제로베이스의 수강생에게 제안을 했던 것입니다. 핑크랩이 수행했던 프로젝트나 현재 수행중인 프로젝트는 아래 링크를 확인해주세요. 또한 이런 성과를 보고 관심있는 기업은 연락주세요;

https://www.pinklab.art/project

 

기업 프로젝트

핑크랩에서 수행하는 기업 프로젝트는 일반적인 개발 용역 사업과는 조금 다릅니다. 프로젝트 자체의 수행도 중요하지만 기업의 인력 수요에 대한 대응, 혹은 구직자의 경력 확보 등이 포함된

www.pinklab.art

 

반응형