Page 5 -
P. 5
KAGGLE
3장 캐글 경진대회 도전 ①: 타이타닉 생존자 예측 075
3.1 캐글을 이용하여 실제 데이터 분석 076
3.2 타이타닉 생존자 예측 경진대회란 077
3.3 데이터 내려받기 079
3.4 데이터 분석을 위한 준비 작업 082
3.4.1 순서 1 데이터 분석 환경 준비 082
3.4.2 순서 2 새로운 파일 작성 084
3.4.3 순서 3 디렉터리 구성 확인 086
3.4.4 순서 4 라이브러리를 설치하고 가져오기 088
3.4.5 순서 5 데이터 읽어 보기 089
3.4.6 순서 6 랜덤 시드 설정 094
3.5 데이터 개요 파악 095
3.6 데이터의 시각화 103
3.6.1 목적 변수 관련 데이터의 시각화 104
3.7 데이터 전처리와 특징 값 생성 114
3.8 머신 러닝 모델링 130
3.8.1 검증 데이터로 예측 정확도 확인 137
3.8.2 교차 검증을 이용한 학습 141
3.9 캐글에 결과 제출 145
3.10 정확도 이외의 여러 가지 분석 148
3.10.1 추가 분석 ❶: 타이타닉에는 어떤 사람이 승선하고 있었는가? 148
3.10.2 추가 분석 ❷: 특정 클러스터에 주목 160