프로젝트 : 일본에 진출한 신생 뷰티 브랜드를 위한 이커머스 고객 행동 데이터 분석 및 마케팅 전략 수립
목적 : 3개월간의 이커머스 고객 행동 데이터를 분석하여 일본 시장에 진출한 신생 뷰티 브랜드의 효과적인 마케팅 전략을 수립한다.
데이터 : 일본 이커머스의 3개월간의 유저 로그 행동 데이터

코로나 이후 일본에서는 한류가 유행하였고, 한국인의 깔끔한 피부에 대한 관심이 상승하여 'K-Beauty'가 인기를 얻기 시작했습니다. 특히 일본 소비자들은 검증된 효과 및 가격에 대한 만족감을 한국 화장품을 통해 얻게 되어 지속적으로 한국 화장품은 일본 내에서 많은 관심을 받고 있습니다.
자세한 데이터셋에 대한 내용은 브랜드의 데이터 유출우려가 있으므로 생략하였습니다.
간략히 설명드리면 크게 유저, 제품, url 관련 컬럼으로 나뉘어 집니다.
결측치를 처리할 때에는 url 정보에 담겨있는 내용을 파싱하였고, 유저의 상품에 대한 특정 행동을 한 데이터가 담긴 contents 컬럼을 파싱하여 내용을 추출하여 처리하였습니다.
또한 가격 정보, 상품 정보는 유저가 실제로 행동을 하여 담긴 내용 외에는 신뢰하지 못하는 데이터이기에 url 접근을 통해서 신뢰할 수 있는 데이터만 추출하여 분석에 활용하였습니다.
파싱하여 새로운 컬럼인 price_y는 실제 제품의 가격을 나타내며 위와 같이 범위 밖의 이상치로 판단되는 값을 가진 행들을 삭제 처리하였습니다.
특이한 유저도 1명 발견이 되었는데, 이 유저가 물건을 구매하지 않았다면 단순 매크로와 같은 프로그램으로 해당 유저를 삭제할 것이었지만, 해당 유저 또한 실제로 구매한 기록이 있는 것을 확인한 바 중요한 고객일 수도 있다고 판단하였습니다.
이에 너무나 차이가 나서 클러스터링 진행시 데이터를 로그로 변환하는 과정도 거쳤습니다.
RFM 분석은 고객을 세분화하여 고객에 대해 가치를 평가하기 위해 사용하는 분석 기법입니다. 이는 고객의 과거 구매 데이터를 바탕으로 세 가지 기준을 평가합니다.
1. Recency(최근성) : 고객이 마지막으로 구매한 시점과 현재의 시간 간격을 나타냅니다. 최근에 구매한 고객일수록 더 높은 점수를 부여합니다.
고객이 얼마나 최근에 구입했는가?
2. Frequency(빈도) : 특정 기간 동안 고객이 구매한 횟수를 의미합니다. 자주 구매한 고객일수록 더 높은 점수를 부여합니다.
고객이 얼마나 빈번하게 우리 상품을 구입했나?
3. Monetary(구매 금액) : 특정 기간 동안 고객이 소비한 금액을 의미합니다. 높은 금액을 소비한 고객일수록 더 높은 점수를 부여합니다.
고객이 구입했던 총 금액은 어느 정도인가?
해당 RFM을 통한 고객 세그먼트는 인기 브랜드의 제품을 산 고객들을 대상으로 하였으며, 각각 고객들의 비율에 맞게끔 설정하였습니다.
클러스터링은 전체 고객 상대로 유저아이디 컬럼을 기준으로 하였으며, 새로운 지표를 생성한 새로운 데이터프레임을 통해 진행하였습니다.
pycaret을 통해서 성능이 가장 좋았던 K-means로 진행을 하였습니다. 또한 클러스터링의 성능을 실루엣 점수를 통해서 판단하려고 시도해보았는데, 가진 데이터의 특성상 실루엣 점수가 높게 나왔음에도 노이즈가 많아 클러스터별로 그 특성이 뚜렸하게 나타나지 않았습니다. 따라서 실루엣 계수를 통해서 성능을 판단하는 것은 무리였습니다.
결국 다양한 변수를 조합하고 해석하면서 분석에 있어서 가장 좋은 조합으로 선정하여 진행하였고, 클러스터의 개수는 엘보우 포인트가 확연히 나타나지는 않지만 결국 5로 선택하여 진행하였습니다.
앞서 언급드린 것처럼 RFM은 인기 브랜드의 제품을 산 고객들을 대상으로 하였으며, 클러스터링은 전체 고객을 대상으로 클러스터링을 진행하였습니다.
RFM과 클러스터링을 위의 방식으로 한 이유는 해당 브랜드의 마케팅적인 요소를 찾는 것 입니다. 따라서 전체 고객들의 클러스터링을 통해서 해당 브랜드의 고객들이 얼마나 있는지 파악하고 그 파악한 내용을 통해서 페르소나를 설정하는 것입니다. 또한 페르소나 별로 마케팅 요소를 파악하기 위해 키워드 분석 및 리뷰 크롤링을 통한 분석도 병행하였습니다.
추가적인 데이터 분석 과정 중에 RFM 및 클러스터링된 고객들을 대상으로 키워드 분석을 진행하여 이들의 관심사항을 파악해보았습니다.
특정 브랜드 = 브랜드1 로 명명하였습니다.
위 분석과정을 통해서 RFM와 연관성이 높은 클러스터 3개에 각각 페르소나를 설정하였습니다.
추가적인 인사이트를 얻고자 전체 고객에 대해 어떤 제품들을 전체적으로 구매했는지 키워드 분석을 실시했고, 공통 키워드를 통해 각 클러스터별로 연관 검색어를 확인해 보았습니다.
특정 브랜드의 제품군의 전체적인 리뷰를 통해 인사이트를 얻기는 매우 힘들어 보였습니다. 이미 마케팅적으로 잘 되고 있다는 뜻입니다. 따라서 부정적인 리뷰를 통해 개선사항이 있는지 파악해보았습니다.
해당 부정리뷰에 대해 추가적인 확인을 위하여 토픽 모델링을 통해 부정적인 평가는 어떻게 구성되어 있나 확인을 하였습니다.
앞서 얻은 분석들을 통해서 마케팅 요소에 활용할만한 다양한 인사이트를 얻었고, 이 결과를 토대로 마케팅 전략을 세워보았습니다.
해당 브랜드가 추구하는 가치를 참고하였고, 더 나아가 전 세계적으로 친환경에 대한 트렌드와 잘 맞겠다는 생각이 들어 새로운 브랜딩의 방향을 설정해보았습니다.
작은 실천이 모여 더 나은 미래를 만든다는 믿음을 담아 고객과 함께 지속 가능한 변화를 이끌어가는 브랜드의 이미지를 담는 "작은 변화가 만드는 지속 가능한 내일"이라는 슬로건을 만들어보았습니다.
추가적으로 프로젝트에 대한 한계점 및 느낀점을 나눈 결과를 바탕으로 프로젝트를 마무리지었습니다. 감사합니다.