Page 18 -
P. 18
1.2.1 지도 학습으로 미래 예측
1
지도 학습의 주요 목적은 레이블(label) 된 훈련 데이터에서 모델을 학습하여 본 적 없는 미래 데이
터에 대해 예측을 만드는 것입니다. 여기서 지도(supervised)는 희망하는 출력 신호(레이블)가 있는
일련의 샘플(데이터 입력)을 의미합니다. 그림 1 - 2는 전형적인 지도 학습 작업 흐름을 나타냅니
다. 레이블된 훈련 데이터가 머신 러닝 알고리즘에 전달되어 예측 모델을 훈련하고 그다음 새로운
레이블되지 않은 데이터 입력에 대해 예측을 수행합니다.
그림 1-2 지도 학습
레이블
훈련 데이터
머신 러닝
알고리즘
새로운 데이터 예측 모델 예측
스팸 메일을 필터링하는 예를 생각해 보죠. 레이블된 이메일 데이터셋에서 지도 학습 머신 러닝
알고리즘을 사용하여 모델을 훈련할 수 있습니다. 이 데이터셋은 스팸 또는 스팸이 아닌 이메일
로 정확하게 표시되어 있습니다. 훈련된 모델은 새로운 이메일이 두 개의 범주(category) 중 어디
에 속하는지 예측합니다. 이메일 스팸 필터의 예처럼 개별 클래스 레이블이 있는 지도 학습을 분
류(classification)라고 합니다. 지도 학습의 또 다른 종류는 연속적인 값을 출력하는 회귀(regression)
입니다.
1 역주 머신 러닝에서 특정 샘플에 할당된 클래스(class)를 레이블이라고 합니다. 즉, 레이블의 범주(category)가 클래스입니다. 책에서는 혼동
을 피하기 위해 category가 레이블 범주를 의미하지 않을 때는 ‘카테고리’로 번역합니다. 또한, 프로그래밍 언어의 클래스는 ‘파이썬 클래스’,
‘SGdClassifier 클래스’처럼 명확하게 구분하여 사용합니다.
034
machinelearning_06.indd 34 2021-03-17 오후 12:36:01