본문 바로가기

Education

국내 이커머스 기업의 해외 진출 방향 제안이라는 주제로 프로젝트를 수행한 팀을 소개합니다.

제가 꽤 오랜 기간동안 데이터원컴퍼니(구 패스트캠퍼스)와 많은 인연을 맺고 있다는 것은 자주 언급했는데요. 그 중에 요즘 저는 제로베이스라는 서비스에서 주로 프로젝트 팀을 가이드하고 있습니다. 그 중 오랜만에 한 팀을 소개할까 합니다. 공부하는 많은 분들이 kaggle 데이터를 사용하게 되는데요. kaggle에서 e-commerce 관련 데이터 중 눈에 많이 띄는 데이터가 브라질의 OList 데이터입니다. 이 데이터가 눈에 확 띄긴 하는데, 또 실제로 프로젝트를 진행해보면 쉽지 않기도 합니다. 

지금 소개하는 팀은 제로베이스의 데이터 분석 과정 17기의 한 팀이구요. 데이터를 잘 정리하고 발표도 잘한 팀입니다. 이 팀의 성과를 소개하고 싶어서 이렇게 글을 작성하고 있습니다. 이 글 제일 마지막에 이 팀의 발표 영상이 다 있는데요. 한 번 봐주세요. 그리고 데이터 분석관련 인턴쉽에 관심있는 회사에서는 이 팀분들에게 한번 기회를 주시면 어떨까 생각합니다. 그런 이유로 또 소개도 하구요.

제목은 약간 공격(?^^)적이지만, 오히려 배우는 단계의 학생들이 이렇게 한 번 질러보는것도 저는 좋다고 생각합니다.

일단 이 팀의 컨셉은 국내 유통사들이 많약 해외로 진출한다면 어떤 지역, 혹은 어떤 전략으로 진출하면 좋을까 하고 고민하는 컨셉입니다.

그 중에 확보한 데이터가 브라질의 OList이니 일단 브라질로^^

Olist 데이터를 다룬 팀들은 많지만, 정작 Olist라는 서비스 자체에 대해 확인하고 정리한 경도 많지 않은데 이것도 잘 한것 같습니다.

데이터의 특성들에 대한 정리와

관계를 파악하고 설명하려는 노력도 좋았구요.

특히, 팀원중 한 명이 브라질에 지인이 있다는 놀라운 찬스를 또 사용해서 용어의 벽을 넘어선것 같습니다.

시각화 방법도 많이 고민했고,

다양한방법으로 수치형 데이터와 리뷰 데이터들을 정리하고 시각화하고 있습니다.

특히 브라질이라는 나라의 특성이 제일 잘 나타나는 것이 배송 기간인 것 같은데요. 그 부분에 대해서 집중적으로 조명하고 있습니다.

그리고 BI 도구를 활용해서 다양한 뷰에서 데이터를 정리하고 보여주고 있습니다. 이런 노력은 자칫 기계적으로 흘러 갈 수 있는데 잘 정리해준것 같습니다.

그래서 쿠팡 물류 센터라고 가정하고, 

브라질의 행정적 구역으로 5개 지역으로 나누고,

데이터들을 군집화해보고,

센터 후보지를 선정하고 있습니다.

더불어 다양한 컬럼들을 대상으로 예측도 해보고 있구요.

지역별 특성도 잘 조사해서 설명하고 있습니다.

이 Olist 데이터는 공부하는 단계의 많은 분들이 도전하는 데이터입니다. 그런데, 브라질이라는 나라에 대해서 잘 모르기때문에 쉽게 분석이 진행되지 않는데요. 이 팀은 끈질기게 잘 진행해 준 것 같아서 이렇게 소개를 합니다. 나머지는 아래의 영상을 확인해주세요.

반응형