단계 1 / 18: 환경 설정 및 데이터 로딩
클릭하여 단계를 이동할 수 있습니다
분석에 필요한 라이브러리를 import하고, 4개의 주요 데이터셋을 로딩하여 기본 정보를 확인합니다.
# 필요한 라이브러리들을 import 하세요
# pandas, numpy, matplotlib.pyplot, seaborn
# datetime에서 datetime, timedelta
# sklearn에서 train_test_split, LinearRegression, RandomForestRegressor
# sklearn.metrics에서 mean_squared_error, r2_score
# sklearn.preprocessing에서 LabelEncoder
# warnings를 ignore 설정하세요
# 한글 폰트와 그래프 스타일을 설정하세요
# matplotlib의 폰트를 'DejaVu Sans'로 설정
# seaborn 스타일을 'seaborn-v0_8'로 설정
# "=== 운영 최적화 분석 실습 ===" 출력
# 1. 다음 4개 CSV 파일을 로딩하세요:
# - olist_orders_dataset.csv → orders_df
# - olist_order_items_dataset.csv → order_items_df
# - olist_order_payments_dataset.csv → payments_df
# - olist_sellers_dataset.csv → sellers_df
# 각 데이터프레임의 shape을 출력하여 확인하세요분석에 필요한 라이브러리를 import하고, 4개의 주요 데이터셋을 로딩하여 기본 정보를 확인합니다.