Page 16 -

P. 16

1.2.2 머신 러닝 학습 알고리즘 1

머신 러닝의 학습 알고리즘으로는 지도 학습, 비지도 학습, 강화 학습이 있습니다. 지도 학습은 이
름에서 알 수 있듯이 정답이 무엇인지 컴퓨터에 알려 주고 학습시키는 방법입니다. 머신 러닝과 딥러닝

그림 1-7 지도 학습

೟ण ള۲ ؘ੉ఠ ੿׹ ۨ੉࠶ MBCFM

੿׹ ৘ஏ

반면 비지도 학습은 정답을 알려 주지 않고 특징( 예 다리 길이가 짧은 초식 동물)이 비슷한 데이터
1
( 예 토끼, 다람쥐)를 클러스터링(범주화) 하여 예측하는 학습 방법입니다. 즉, 다음 그림과 같이
지도 학습은 주어진 데이터에 대해 A 혹은 B로 명확한 분류가 가능한 반면, 비지도 학습은 유사도
기반(데이터 간 거리 측정)으로 특징이 유사한 데이터끼리 클러스터링으로 묶어서 분류합니다.

그림 1-8 지도 학습과 비지도 학습

#
"
૑ب ೟ण
WT
࠺૑ب ೟ण

마지막으로 강화 학습은 머신 러닝의 꽃이라고 부를 만큼 어렵고 복잡합니다. 분류할 수 있는 데

이터가 있는 것도 아니고 데이터가 있다고 해도 정답이 없기 때문입니다. 강화 학습은 자신의 행
동에 대한 보상을 받으며 학습을 진행합니다. 게임이 대표적인 사례입니다. 혹시 <쿠키런>이라는
국내 게임을 알고 있나요? 쿠키가 에이전트(agent)이며(즉, 게이머가 에이전트가 되겠죠?) 게임 배
경이 환경(environment)입니다. 이때 에이전트가 변화하는 환경에 따라 다른 행동(action)을 취하게
됩니다. 동전이나 젤리를 취득하는 등 행동에 따라 보상(몸집이 커짐)을 얻습니다. 강화 학습은 이

1 특성이 비슷한 데이터끼리 하나의 그룹으로 묶어 주는 것입니다.

023

11 12 13 14 15 16 17 18 19 20 21