Page 5 -
P. 5
Machine Learning
5.2.3 산포 행렬 계산 207
5.2.4 새로운 특성 부분 공간을 위해 선형 판별 벡터 선택 210
5.2.5 새로운 특성 공간으로 샘플 투영 213
5.2.6 사이킷런의 LdA 214
5.3 커널 PCA를 사용하여 비선형 매핑 217
5.3.1 커널 함수와 커널 트릭 218
5.3.2 파이썬으로 커널 PCA 구현 223
5.3.3 새로운 데이터 포인트 투영 230
5.3.4 사이킷런의 커널 PCA 234
5.4 요약 239
6장 모델 평가와 하이퍼파라미터 튜닝의 모범 사례 241
6.1 파이프라인을 사용한 효율적인 워크플로 242
6.1.1 위스콘신 유방암 데이터셋 242
6.1.2 파이프라인으로 변환기와 추정기 연결 244
6.2 k-겹 교차 검증을 사용한 모델 성능 평가 247
6.2.1 홀드아웃 방법 247
6.2.2 k-겹 교차 검증 248
6.3 학습 곡선과 검증 곡선을 사용한 알고리즘 디버깅 254
6.3.1 학습 곡선으로 편향과 분산 문제 분석 254
6.3.2 검증 곡선으로 과대적합과 과소적합 조사 258
6.4 그리드 서치를 사용한 머신 러닝 모델 세부 튜닝 260
6.4.1 그리드 서치를 사용한 하이퍼파라미터 튜닝 260
6.4.2 중첩 교차 검증을 사용한 알고리즘 선택 267
6.5 여러 가지 성능 평가 지표 269
6.5.1 오차 행렬 269
6.5.2 분류 모델의 정밀도와 재현율 최적화 272
6.5.3 ROC 곡선 그리기 274
6.5.4 다중 분류의 성능 지표 280
6.6 불균형한 클래스 다루기 281
6.7 요약 284
machinelearning_06.indd 21 2021-03-17 오후 12:35:57