필요한 데이터 파일
이 실습을 위해서는 다음 데이터 파일들이 필요합니다.data/ 폴더에 저장해주세요.
💡 데이터 준비 방법
- 1. 프로젝트 폴더에
data폴더를 생성하세요 - 2. 위의 모든 CSV 파일을 data 폴더에 저장하세요
- 3. Jupyter Notebook을 실행하고 실습을 시작하세요
실습 정보
실습 단계 미리보기
다음과 같은 순서로 실습이 진행됩니다.
환경 설정 및 데이터 로딩
마케팅 분석에 필요한 라이브러리를 import하고, 5개의 주요 데이터셋을 로딩하여 기본 정보를 확인합니다.
데이터 전처리 및 병합
마케팅 분석을 위해 고객과 주문 데이터를 연결하고, 날짜 데이터를 적절한 형식으로 변환합니다.
기본 고객 통계 분석
마케팅 분석의 기준점이 될 전체 비즈니스 규모와 고객 행동의 기본 지표들을 계산합니다.
지역별 고객 분포 분석
고객의 지역적 분포를 파악하여 지역 맞춤형 마케팅 전략 수립의 기초 데이터를 확인합니다.
RFM 분석을 위한 데이터 준비
RFM 분석에 필요한 통합 데이터셋을 구축하여 고객별 구매 행동을 분석할 준비를 합니다.
RFM 지표 계산
고객별로 최근성, 빈도, 구매금액을 계산하여 RFM 분석의 핵심 지표를 생성합니다.
RFM 점수 계산
RFM 지표를 표준화된 점수로 변환하여 고객 간 비교가 가능한 척도를 만듭니다.
고객 세분화 함수 구현
RFM 점수 조합에 따라 고객을 의미있는 세그먼트로 분류하는 비즈니스 로직을 구현합니다.
고객 세분화 적용 및 분석
고객 세분화 결과를 분석하여 각 세그먼트의 특성과 분포를 파악합니다.
고객 세분화 시각화
고객 세분화 결과를 시각적으로 표현하여 각 세그먼트의 크기와 특성을 직관적으로 파악합니다.
고객 생애 가치(CLV) 계산
고객별 생애 가치를 추정하여 마케팅 투자의 우선순위를 결정할 수 있는 지표를 생성합니다.
고가치 고객 분석
고가치 고객을 식별하고 이들의 특성을 분석하여 VIP 고객 관리 전략을 수립합니다.
K-Means 클러스터링 준비
K-Means 클러스터링을 위해 데이터를 정규화하고 최적 클러스터 수 탐색을 준비합니다.
최적 클러스터 수 탐색
실루엣 점수를 기준으로 최적의 클러스터 개수를 객관적으로 결정합니다.
최종 클러스터링 수행
최적 클러스터 수로 고객을 그룹화하고 각 클러스터의 특성을 분석합니다.
클러스터링 결과 시각화
클러스터링 결과를 다양한 각도에서 시각화하여 고객 그룹의 특성을 직관적으로 파악합니다.
머신러닝 데이터 준비
머신러닝 모델 학습을 위해 충분한 데이터가 있는 주요 고객 세그먼트를 선별합니다.
모델 학습 데이터 분할 및 정규화
머신러닝 모델 학습을 위해 데이터를 적절히 분할하고 정규화하여 모델 성능을 최적화합니다.
랜덤 포레스트 모델 학습
랜덤 포레스트 모델을 사용하여 고객 세분화를 예측하고 모델의 성능을 평가합니다.
피처 중요도 분석
모델이 고객 세분화를 예측할 때 가장 중요하게 고려하는 요인들을 분석합니다.
마케팅 전략 수립
고객 세분화 결과를 바탕으로 각 세그먼트에 적합한 마케팅 전략을 수립합니다.
코호트 분석 데이터 준비
고객의 첫 구매 시점을 기준으로 코호트를 구성하여 시간에 따른 고객 행동 변화를 분석할 준비를 합니다.
코호트 분석 수행
시간 경과에 따른 고객 유지율과 재구매 패턴을 분석하여 고객 생명주기를 파악합니다.
비즈니스 인사이트 도출
전체 마케팅 분석 결과를 핵심 지표로 요약하여 경영진이 이해하기 쉽게 정리합니다.
마케팅 전략 제안
데이터 분석 결과를 실제 마케팅 실행으로 연결하는 구체적이고 실행 가능한 전략을 제시합니다.