혜니니의 공부방

[사이드프로젝트] US E-COMMERCE 2020 데이터로 RFM 분석, 리뷰 본문

프로젝트 일지

[사이드프로젝트] US E-COMMERCE 2020 데이터로 RFM 분석, 리뷰

니니혜 2022. 8. 11. 11:59

 

 

Datarian 붙캠에서 만난 분들과 함께 US E-Commerce 2020 데이터로 RFM을 분석하게 되었습니다.

사용 Tool : solvesql, Notion, Tableau

인원 3명

 

내 역할: Notion 공간 관리, Tableau로 대시보드 제작하기, 보고서 쓰기

내가 생각하는 기여도: 40% 

 

 

1. 주제 선정

2. 데이터 EDA

3. 액션아이템 작성

 

이렇게 커다랗게 세꼭지를 잡아 구성했습니다.

 

먼저 보시죠 ! 

https://handsomely-lightning-bf1.notion.site/RFM-251e4b36d01a4f6f8bc1d3d9c7706436

 

RFM 프로젝트 보고서

데린이 혜니니 응왕

handsomely-lightning-bf1.notion.site

 

수요일마다 10:00~ Zoom 회의를 했고, 각자 가져온 결과로 토론, 서로의 근거와 논리를 뒷받침해주는 방식이었답니다.

 

1. 주제 선정

 a. 분석 목적 정하기

 b. 상황 정의하기 

 -> 신입 데이터 분석가로 입사한 세명이 “2020년 고객 판매 데이터를 기반으로 향후 마케팅 플랜의 방향성을 수립하려고 합니다. 회사 내부 사정으로 모든 고객들에 대한 마케팅 플랜은 어렵고, 투입될 수 있는 비용도 한정적인 상황입니다. 따라서 타겟팅이 유의미한 고객층을 찾아 고객 특성에 맞는 방향성을 제시해주세요.” 라는 과제를 받은 상황으로 설정 데이터 분석이지만 마케팅에 관한 이야기가 있어서 약간 그로스해킹같은 느낌도 나죠 ? 오호호 

 

2. 데이터 EDA

 

 A. 고객의 segment들을 분석해 가장 많이 차지하는 고객을 선정하여 세부 분석을 진행했습니다 

 B.  ARPPU를 분석했습니다. 여기서 던진 물음 1개 ! 가장 많이 차지하는 고객군인 Consumer 고객군이 가장 크고 주요하지만 가장 크다고 유의미하지는 않잖아요? ARPPU도 높을까요? 라는 의문을 던졌습니다.

 

ARPPU란 !!? 

 -> ARPPU란, 서비스 성장 분석 방법론인 AARRRRevenue Analysis (매출 분석)을 진행하기 위해 사용되는 대표적인 지표 입니다. AR이란 Acquisited Revenue의 약자로, 분석 기간 동안에 얻어진 총 매출을 의미합니다. PU란 Paying User의 약자로, 전체 유저 중 분석 기간 동안 결제 행동이 있었던 고객의 수를 의미합니다. ARPPU분석 기간 동안의 총 매출을 결제 유저의 수로 나눈 값으로, 결제 유저 당 발생한 매출이 어느정도의 규모인지 파악할 수 있게 해주는 지표입니다. 

 

이외에 세부 EDA는 링크를 타고 관람 부탁드립니다.

 

그리고 저희는 선행된 분석에 따라 Consumer 고객군의 Furniture 카테고리 구매량을 효과적으로 증대시키는 방안을 모색하기로 결정했답니다! 고객의 행동을 보고 정한 것이었죠.

 

RFM 분석이란! 

 구매 가능성이 높은 고객을 선정하는 분석 방법으로 고객의 행동을 기반으로 고객을 분류해 효율적인 개인화 마케팅을 진행하고자 하는 것입니다. 

 

분포도와 산점도를 추가했으면 더 좋았겠지만 저희는 '평균'이라는 지점을 삼아서 대부분의 분석을 진행했습니다. 고객을 등급으로 나누고  8개의 고객군으로 분류를 하게 되었습니다. 그중 의미 있는 고객은 총 다섯 종류 입니다.

RFM 고객군 테이블

3. 액션아이템 

 이 바탕으로 고객군들을 중점적으로 신경쓰며 향후 VIP 고객으로 전환시키는것을 목적으로 잡았습니다. 이러한 EDA와 RFM을 바탕으로 태블로로 직접 대시보드도 만들어 보았답니다.

부끄럽지만 태블로로 처음 만든 대시보드라서 엉성하지만 다음에는 더 멋지고 예쁜 대시보드를 만들어보도록 하겠습니다... 이번을 계기로 태블로를 사용하는 법을 알고 대시보드를 만들어 너무나 재미있었어요. 

 의미있는 추세선은 아니지만 월별 매출 추세선 회귀분석 식을 계산해주었습니다. R^2의 결정계수 값이 0.49114로 유의미 하지는 않지만 P값이 0.05이하라 95%의 신뢰수준을 기반으로 할때 귀무가설을 기각합니다.

 

 

다같이 마무리는 KPT 회고를 하고 끝냈답니다.

 

 🐣 혜니니

Keep (이번에 잘했고, 앞으로도 이렇게 하자)

꼼꼼하고 논리를 잘하는 팀원분을 만나서 감사했습니다. 논리가 부족했는데 많이 배울 수 있었던 시간이었습니다. 그리고 이번 기회에 태블로에 대해 습득했고 앞으로도 이 스킬을 키워나가면 좋겠다고 느꼈어요. 한정된 데이터에서 최대한의 인사이트를 뽑아내기 위해 노력하는 팀원분들이 멋졌습니다.


Problem (문제가 있었거나, 개선이 필요한 부분)

문제 정의 부분이 어려웠습니다. 명확하고 타당한 기준을 세우는 일이 이렇게 어렵다는 것을 느꼈어요. 무에서 유를 창조하는 기분이었습니다. 그리고 중간에 취직이 되어 일과 병행하는게 힘들었습니다.


Try (다음에는 이런 걸 시도해보면 어떨까)

통계적인 숫자로 유의미하게 가설검정을 시도해보고싶어요.

구매를 하지 않은 고객군까지 있었다면 더 좋지않았을까 싶기도 하고요!

위의 분 말처럼 파이썬을 이용하는게 더 편할 것 같다는 생각도 듭니다. 하지만 시각화 툴은 피할 수 없고 다음에는 실시간 연동 데이터로 움직이는 태블로 대시보드를 제작하고 싶습니다.

 

 

이것이 제 회고에요! 그래도 정말 재미있고 함께해서 즐거웠던 미니미 사이드 프로젝트 였습니다! 

Comments