Page 8 -
P. 8
PYTORCH
11장 클러스터링 613
11.1 클러스터링이란 614
11.2 클러스터링 알고리즘 유형 614
11.2.1 K-평균 군집화 614
11.2.2 가우시안 혼합 모델 628
11.2.3 자기 조직화 지도 630
12장 강화 학습 637
12.1 강화 학습이란 638
12.2 마르코프 결정 과정 639
12.2.1 마르코프 프로세스 639
12.2.2 마르코프 보상 프로세스 641
12.2.3 마르코프 결정 과정 645
12.3 MDP를 위한 벨만 방정식 647
12.3.1 벨만 기대 방정식 647
12.3.2 벨만 최적 방정식 652
12.3.3 다이나믹 프로그래밍 654
12.4 큐-러닝 655
12.4.1 큐-러닝 655
12.4.2 딥 큐-러닝 658
12.5 몬테카를로 트리 탐색 674
12.5.1 몬테카를로 트리 탐색 원리 674
12.5.2 몬테카를로 트리 탐색을 적용한 틱택토 게임 구현 675