Page 18 -
P. 18

1.2.1 지도 학습으로 미래 예측

                                            1
               지도 학습의 주요 목적은 레이블(label) 된 훈련 데이터에서 모델을 학습하여 본 적 없는 미래 데이
               터에 대해 예측을 만드는 것입니다. 여기서 지도(supervised)는 희망하는 출력 신호(레이블)가 있는
               일련의 샘플(데이터 입력)을 의미합니다. 그림 1 -  2는 전형적인 지도 학습 작업 흐름을 나타냅니

               다. 레이블된 훈련 데이터가 머신 러닝 알고리즘에 전달되어 예측 모델을 훈련하고 그다음 새로운
               레이블되지 않은 데이터 입력에 대해 예측을 수행합니다.

                  그림 1-2 지도 학습

                                            레이블

                                  훈련 데이터





                                            머신 러닝
                                             알고리즘







                    새로운 데이터                 예측 모델                    예측



               스팸 메일을 필터링하는 예를 생각해 보죠. 레이블된 이메일 데이터셋에서 지도 학습 머신 러닝
               알고리즘을 사용하여 모델을 훈련할 수 있습니다. 이 데이터셋은 스팸 또는 스팸이 아닌 이메일
               로 정확하게 표시되어 있습니다. 훈련된 모델은 새로운 이메일이 두 개의 범주(category) 중 어디
               에 속하는지 예측합니다. 이메일 스팸 필터의 예처럼 개별 클래스 레이블이 있는 지도 학습을 분

               류(classification)라고 합니다. 지도 학습의 또 다른 종류는 연속적인 값을 출력하는 회귀(regression)
               입니다.










               1   역주 머신 러닝에서 특정 샘플에 할당된 클래스(class)를 레이블이라고 합니다. 즉, 레이블의 범주(category)가 클래스입니다. 책에서는 혼동
                 을 피하기 위해 category가 레이블 범주를 의미하지 않을 때는 ‘카테고리’로 번역합니다. 또한, 프로그래밍 언어의 클래스는 ‘파이썬 클래스’,
                 ‘SGdClassifier 클래스’처럼 명확하게 구분하여 사용합니다.

         034





     machinelearning_06.indd   34                                                           2021-03-17   오후 12:36:01
   13   14   15   16   17   18   19   20   21   22   23