Page 6 -
P. 6

4장 캐글 경진대회 도전 ②: 주택 가격 예측                              167


                4.1  더 상세하게 알아보는 데이터 분석  168
                4.2  주택 가격 예측하기 경진대회란  169

                4.3  데이터 내려받기  171

                4.4  벤치마크용 베이스라인 작성  177
                    4.4.1 LightGBM으로 예측  177
                    4.4.2 교차 검증으로 모델 학습과 예측  184
                    4.4.3 각 변수의 중요도 확인  189
                4.5  목적 변수의 전처리: 목적 변수의 분포 확인  191
                    4.5.1 SalePrice 데이터의 분포 확인  191

                4.6  설명 변수의 전처리: 결측치 확인  197
                    4.6.1 각 설명 변수의 결측치 확인  197
                4.7  이상치 제외  202
                    4.7.1 이상치란  202
                    4.7.2 각 설명 변수의 데이터 분포 확인  202
                4.8  설명 변수 확인: 특징 값 생성  216

                4.9  하이퍼파라미터 최적화  220
                    4.9.1 Optuna 구현  222
                    4.9.2 캐글에 결과 제출  228

                4.10   여러 가지 머신 러닝 방법을 이용한 앙상블  230
                      4.10.1 랜덤 포레스트로 학습  230
                      4.10.2 LotFrontage의 결측치 삭제  231
                      4.10.3 XGBoost로 학습  236
                      4.10.4 XGBoost와 LightGBM 결과 조합  244
                4.11   추가 분석 ①: 통계 기법을 이용한 클러스터 분석  246
                      4.11.1 통계 기법을 써서 주택 분류  246
                      4.11.2 주성분 분석  254

                4.12   추가 분석 ②: 고급 주택의 조건을 분석하고 시각화  259
                      4.12.1 결정 트리로 시각화  259
   1   2   3   4   5   6   7   8   9   10   11