Page 7 -
P. 7

DEEP LEARNING






                      10.2  트랜스포머 어텐션  419
                           10.2.1  seq2seq  422
                           10.2.2  버트  431
                           10.2.3  엘모  446
                      10.3  한국어 임베딩  451


                     11장 클러스터링                455


                      11.1  클러스터링이란  456
                      11.2  클러스터링 알고리즘 유형  456
                           11.2.1  K-평균 군집화  456
                           11.2.2  가우시안 혼합 모델  465
                           11.2.3  자기 조직화 지도  468


                     12장 강화 학습               473


                      12.1  강화 학습이란  474
                      12.2  마르코프 결정 과정  475
                           12.2.1  마르코프 프로세스  475
                           12.2.2  마르코프 보상 프로세스  477
                           12.2.3  마르코프 결정 과정  481
                      12.3  MDP를 위한 벨만 방정식  483
                           12.3.1  벨만 기대 방정식  483
                           12.3.2  벨만 최적 방정식  488
                           12.3.3  다이나믹 프로그래밍  490
                      12.4  큐-러닝  491
                           12.4.1  큐-러닝  492
                           12.4.2  딥 큐-러닝  494
                      12.5  몬테카를로 트리 탐색  502
                           12.5.1  몬테카를로 트리 탐색 원리  503
                           12.5.2  몬테카를로 트리 검색을 적용한 틱택토 게임 구현  504
   2   3   4   5   6   7   8   9   10   11   12