Page 16 -
P. 16

1.2.2  머신 러닝 학습 알고리즘                                                              1


                    머신 러닝의 학습 알고리즘으로는 지도 학습, 비지도 학습, 강화 학습이 있습니다. 지도 학습은 이
                    름에서 알 수 있듯이 정답이 무엇인지 컴퓨터에 알려 주고 학습시키는 방법입니다.                                      머신 러닝과 딥러닝

                       그림 1-7 지도 학습

                    ೟ण ള۲  ؘ੉ఠ              ੿׹ ۨ੉࠶  MBCFM

                                 ƒ
                                 ƒ
                                 ƒ

                                 ƒ

                                     ੿׹ ৘ஏ


                    반면 비지도 학습은 정답을 알려 주지 않고 특징( 예 다리 길이가 짧은 초식 동물)이 비슷한 데이터
                                                   1
                    ( 예 토끼, 다람쥐)를 클러스터링(범주화) 하여 예측하는 학습 방법입니다. 즉, 다음 그림과 같이
                    지도 학습은 주어진 데이터에 대해 A 혹은 B로 명확한 분류가 가능한 반면, 비지도 학습은 유사도
                    기반(데이터 간 거리 측정)으로 특징이 유사한 데이터끼리 클러스터링으로 묶어서 분류합니다.

                       그림 1-8 지도 학습과 비지도 학습


                            #
                      "
                                          ૑ب ೟ण
                                            WT
                                          ࠺૑ب ೟ण






                    마지막으로 강화 학습은 머신 러닝의 꽃이라고 부를 만큼 어렵고 복잡합니다. 분류할 수 있는 데

                    이터가 있는 것도 아니고 데이터가 있다고 해도 정답이 없기 때문입니다. 강화 학습은 자신의 행
                    동에 대한 보상을 받으며 학습을 진행합니다. 게임이 대표적인 사례입니다. 혹시 <쿠키런>이라는
                    국내 게임을 알고 있나요? 쿠키가 에이전트(agent)이며(즉, 게이머가 에이전트가 되겠죠?) 게임 배
                    경이 환경(environment)입니다. 이때 에이전트가 변화하는 환경에 따라 다른 행동(action)을 취하게
                    됩니다. 동전이나 젤리를 취득하는 등 행동에 따라 보상(몸집이 커짐)을 얻습니다. 강화 학습은 이


                    1   특성이 비슷한 데이터끼리 하나의 그룹으로 묶어 주는 것입니다.

                                                                                                  023
   11   12   13   14   15   16   17   18   19   20   21