Page 7 -
P. 7

7.6.1 적절한 이동 거리와 반복 횟수를 찾는 방법  308
                              7.6.2 고차 다항식 추가  310
                              7.6.3 편향-분산 상충 관계와 모델의 복잡도  312
                              7.6.4 잔차 차트 그리기  314
                              7.6.5 일반화를 사용해 과적합 방지  316
                              7.6.6 k-겹 교차 검증  318
                          7.7  알고리즘 성능 최적화  319
                              7.7.1 미니배치 기반 확률적 경사 하강법  319
                              7.7.2 LBFGS 최적화  321
                          7.8  요약  323



                          8장 스파크 ML로 만드는 분류와 군집화                             325


                          8.1  스파크 ML 라이브러리  327
                              8.1.1 변환자, 추정자, 평가자  328
                              8.1.2 ML 매개변수  329
                              8.1.3 ML 파이프라인  329
                          8.2  로지스틱 회귀  330
                              8.2.1 이진 로지스틱 회귀 모델  331
                              8.2.2 로지스틱 회귀에 필요한 데이터 준비  334
                              8.2.3 로지스틱 회귀 모델 훈련  339
                              8.2.4 분류 모델의 평가  342
                              8.2.5 k-겹 교차 검증 수행  346
                              8.2.6 다중 클래스 로지스틱 회귀  349
                          8.3  의사 결정 트리와 랜덤 포레스트  352
                              8.3.1 의사 결정 트리  353
                              8.3.2 랜덤 포레스트  360
                          8.4  군집화  362
                              8.4.1 k-평균 군집화  364
                          8.5  요약  371













         spark_08.indd   21                                                                      2018-05-08   오후 6:26:09
   2   3   4   5   6   7   8   9   10   11   12