Page 7 -
P. 7
DEEP LEARNING
10.2 트랜스포머 어텐션 419
10.2.1 seq2seq 422
10.2.2 버트 431
10.2.3 엘모 446
10.3 한국어 임베딩 451
11장 클러스터링 455
11.1 클러스터링이란 456
11.2 클러스터링 알고리즘 유형 456
11.2.1 K-평균 군집화 456
11.2.2 가우시안 혼합 모델 465
11.2.3 자기 조직화 지도 468
12장 강화 학습 473
12.1 강화 학습이란 474
12.2 마르코프 결정 과정 475
12.2.1 마르코프 프로세스 475
12.2.2 마르코프 보상 프로세스 477
12.2.3 마르코프 결정 과정 481
12.3 MDP를 위한 벨만 방정식 483
12.3.1 벨만 기대 방정식 483
12.3.2 벨만 최적 방정식 488
12.3.3 다이나믹 프로그래밍 490
12.4 큐-러닝 491
12.4.1 큐-러닝 492
12.4.2 딥 큐-러닝 494
12.5 몬테카를로 트리 탐색 502
12.5.1 몬테카를로 트리 탐색 원리 503
12.5.2 몬테카를로 트리 검색을 적용한 틱택토 게임 구현 504