Page 8 -
P. 8

PYTORCH






                     11장 클러스터링                613


                       11.1  클러스터링이란  614

                       11.2  클러스터링 알고리즘 유형  614
                            11.2.1  K-평균 군집화  614
                            11.2.2  가우시안 혼합 모델  628
                            11.2.3  자기 조직화 지도  630


                     12장 강화 학습               637


                       12.1  강화 학습이란  638
                       12.2  마르코프 결정 과정  639

                            12.2.1  마르코프 프로세스  639
                            12.2.2  마르코프 보상 프로세스  641
                            12.2.3  마르코프 결정 과정  645

                       12.3  MDP를 위한 벨만 방정식  647
                            12.3.1  벨만 기대 방정식  647
                            12.3.2  벨만 최적 방정식  652
                            12.3.3  다이나믹 프로그래밍  654
                       12.4  큐-러닝  655
                            12.4.1  큐-러닝  655
                            12.4.2  딥 큐-러닝  658
                       12.5  몬테카를로 트리 탐색  674
                            12.5.1  몬테카를로 트리 탐색 원리  674
                            12.5.2  몬테카를로 트리 탐색을 적용한 틱택토 게임 구현  675
   3   4   5   6   7   8   9   10   11   12   13