Page 8 -

P. 8

PYTORCH

11장 클러스터링 613

11.1 클러스터링이란 614

11.2 클러스터링 알고리즘 유형 614
11.2.1 K-평균 군집화 614
11.2.2 가우시안 혼합 모델 628
11.2.3 자기 조직화 지도 630

12장 강화 학습 637

12.1 강화 학습이란 638
12.2 마르코프 결정 과정 639

12.2.1 마르코프 프로세스 639
12.2.2 마르코프 보상 프로세스 641
12.2.3 마르코프 결정 과정 645

12.3 MDP를 위한 벨만 방정식 647
12.3.1 벨만 기대 방정식 647
12.3.2 벨만 최적 방정식 652
12.3.3 다이나믹 프로그래밍 654
12.4 큐-러닝 655
12.4.1 큐-러닝 655
12.4.2 딥 큐-러닝 658
12.5 몬테카를로 트리 탐색 674
12.5.1 몬테카를로 트리 탐색 원리 674
12.5.2 몬테카를로 트리 탐색을 적용한 틱택토 게임 구현 675

3 4 5 6 7 8 9 10 11 12 13