제가 꽤 오랜 기간동안 데이터원컴퍼니(구 패스트캠퍼스)와 많은 인연을 맺고 있다는 것은 자주 언급했는데요. 그 중에 요즘 저는 제로베이스라는 서비스에서 주로 프로젝트 팀을 가이드하고 있습니다. 그 중 오랜만에 한 팀을 소개할까 합니다. 공부하는 많은 분들이 kaggle 데이터를 사용하게 되는데요. kaggle에서 e-commerce 관련 데이터 중 눈에 많이 띄는 데이터가 브라질의 OList 데이터입니다. 이 데이터가 눈에 확 띄긴 하는데, 또 실제로 프로젝트를 진행해보면 쉽지 않기도 합니다.
지금 소개하는 팀은 제로베이스의 데이터 분석 과정 17기의 한 팀이구요. 데이터를 잘 정리하고 발표도 잘한 팀입니다. 이 팀의 성과를 소개하고 싶어서 이렇게 글을 작성하고 있습니다. 이 글 제일 마지막에 이 팀의 발표 영상이 다 있는데요. 한 번 봐주세요. 그리고 데이터 분석관련 인턴쉽에 관심있는 회사에서는 이 팀분들에게 한번 기회를 주시면 어떨까 생각합니다. 그런 이유로 또 소개도 하구요.
제목은 약간 공격(?^^)적이지만, 오히려 배우는 단계의 학생들이 이렇게 한 번 질러보는것도 저는 좋다고 생각합니다.
일단 이 팀의 컨셉은 국내 유통사들이 많약 해외로 진출한다면 어떤 지역, 혹은 어떤 전략으로 진출하면 좋을까 하고 고민하는 컨셉입니다.
그 중에 확보한 데이터가 브라질의 OList이니 일단 브라질로^^
Olist 데이터를 다룬 팀들은 많지만, 정작 Olist라는 서비스 자체에 대해 확인하고 정리한 경도 많지 않은데 이것도 잘 한것 같습니다.
데이터의 특성들에 대한 정리와
관계를 파악하고 설명하려는 노력도 좋았구요.
특히, 팀원중 한 명이 브라질에 지인이 있다는 놀라운 찬스를 또 사용해서 용어의 벽을 넘어선것 같습니다.
시각화 방법도 많이 고민했고,
다양한방법으로 수치형 데이터와 리뷰 데이터들을 정리하고 시각화하고 있습니다.
특히 브라질이라는 나라의 특성이 제일 잘 나타나는 것이 배송 기간인 것 같은데요. 그 부분에 대해서 집중적으로 조명하고 있습니다.
그리고 BI 도구를 활용해서 다양한 뷰에서 데이터를 정리하고 보여주고 있습니다. 이런 노력은 자칫 기계적으로 흘러 갈 수 있는데 잘 정리해준것 같습니다.
그래서 쿠팡 물류 센터라고 가정하고,
브라질의 행정적 구역으로 5개 지역으로 나누고,
데이터들을 군집화해보고,
센터 후보지를 선정하고 있습니다.
더불어 다양한 컬럼들을 대상으로 예측도 해보고 있구요.
지역별 특성도 잘 조사해서 설명하고 있습니다.
이 Olist 데이터는 공부하는 단계의 많은 분들이 도전하는 데이터입니다. 그런데, 브라질이라는 나라에 대해서 잘 모르기때문에 쉽게 분석이 진행되지 않는데요. 이 팀은 끈질기게 잘 진행해 준 것 같아서 이렇게 소개를 합니다. 나머지는 아래의 영상을 확인해주세요.
'Education' 카테고리의 다른 글
유퀴즈 조회수 시청률 예측하기 프로젝트 (1) | 2024.03.03 |
---|---|
ROS2로 주행하는 다수의 주행로봇에 대한 경로 설정과 관리를 수행하는 관제 시스템을 개발한 수강생 팀 소개 (2) | 2024.01.31 |
LSTM 모델을 활용하여 사람에게 블록 조립을 가이드하는 딥러닝 모델을 개발한 저희 수강생의 프로젝트를 소개합니다. (0) | 2024.01.29 |
핑크랩이 어마어마한 경진대회에 함께 했습니다. WCRC (5) | 2024.01.22 |
23년 로봇학회 로보틱스 겨울학교를 진행했습니다. (0) | 2023.12.23 |
핑크랩이 데이원컴퍼니의 제로베이스에 데이터분석 과정 수업 개발에 참여했습니다. (0) | 2023.11.12 |
핑크랩이 2023년 여름. 서울로봇아카데미의 교육을 진행했습니다. (0) | 2023.10.29 |