Page 6 -
P. 6

6.4  정형 스트리밍  267
                        6.4.1 스트리밍 DataFrame 생성  267
                        6.4.2 스트리밍 데이터 출력  268
                        6.4.3 스트리밍 실행 관리  269
                        6.4.4 정형 스트리밍의 미래  270
                     6.5  요약  270



                     7장 MLlib로 더 똑똑해지자                    273


                     7.1  머신 러닝의 개요  275
                        7.1.1 머신 러닝의 정의  278
                        7.1.2 머신 러닝 알고리즘의 유형  278
                        7.1.3 스파크를 활용한 머신 러닝  282
                     7.2  스파크에서 선형 대수 연산 수행  283
                        7.2.1 로컬 벡터와 로컬 행렬  284
                        7.2.2 분산 행렬  289
                     7.3  선형 회귀  291
                        7.3.1 선형 회귀 소개  291
                        7.3.2 단순 선형 회귀  291
                        7.3.3 다중 선형 회귀로 모델 확장  294
                     7.4  데이터 분석 및 준비  297
                        7.4.1 데이터 분포 분석  298
                        7.4.2 열 코사인 유사도 분석  299
                        7.4.3 공분산 행렬 계산  300
                        7.4.4 레이블 포인트로 변환  301
                        7.4.5 데이터 분할  302
                        7.4.6 특징 변수 스케일링 및 평균 정규화  302
                     7.5  선형 회귀 모델 학습 및 활용  303
                        7.5.1 목표 변수 값 예측  304
                        7.5.2 모델 성능 평가  305
                        7.5.3 모델 매개변수 해석  306
                        7.5.4 모델의 저장 및 불러오기  307
                     7.6  알고리즘 정확도 극대화  307








         spark_08.indd   20                                                                      2018-05-08   오후 6:26:09
   1   2   3   4   5   6   7   8   9   10   11