Page 6 -
P. 6
6.4 정형 스트리밍 267
6.4.1 스트리밍 DataFrame 생성 267
6.4.2 스트리밍 데이터 출력 268
6.4.3 스트리밍 실행 관리 269
6.4.4 정형 스트리밍의 미래 270
6.5 요약 270
7장 MLlib로 더 똑똑해지자 273
7.1 머신 러닝의 개요 275
7.1.1 머신 러닝의 정의 278
7.1.2 머신 러닝 알고리즘의 유형 278
7.1.3 스파크를 활용한 머신 러닝 282
7.2 스파크에서 선형 대수 연산 수행 283
7.2.1 로컬 벡터와 로컬 행렬 284
7.2.2 분산 행렬 289
7.3 선형 회귀 291
7.3.1 선형 회귀 소개 291
7.3.2 단순 선형 회귀 291
7.3.3 다중 선형 회귀로 모델 확장 294
7.4 데이터 분석 및 준비 297
7.4.1 데이터 분포 분석 298
7.4.2 열 코사인 유사도 분석 299
7.4.3 공분산 행렬 계산 300
7.4.4 레이블 포인트로 변환 301
7.4.5 데이터 분할 302
7.4.6 특징 변수 스케일링 및 평균 정규화 302
7.5 선형 회귀 모델 학습 및 활용 303
7.5.1 목표 변수 값 예측 304
7.5.2 모델 성능 평가 305
7.5.3 모델 매개변수 해석 306
7.5.4 모델의 저장 및 불러오기 307
7.6 알고리즘 정확도 극대화 307
spark_08.indd 20 2018-05-08 오후 6:26:09