Page 11 -
P. 11
다. 우리가 문제집을 가지고 공부할 때 일부 문제는 정답을 보면서 공
부하고, 일부 문제는 남겨두었다가 시험 보기 전날 모의시험용으로
활용하는 것과 같다. 모의시험을 만족스럽게 통과해야 안심하고 실전
에 들어갈 수 있다.
데이터가 충분하지 않다거나 학습할 시간이 없다는 핑계를 대면
서 학습을 충분히 하지 않는 경우가 있다. 하지만 반대로 학습을 너무
많이 해서 문제가 생기는 경우도 종종 있다. 이를 과잉학습 또는 과적
합 overfitting이라 한다. 공부를 너무 많이 하다 보면 주어진 유형의 문제
는 거의 완벽하게 푸는데 새로운 형태의 문제가 나오면 당황하는 경
우다. 주어진 문제 유형에 지나치게 적응하고 이에 의존하여 풀이 방
식 등을 일반화시키는 오류를 범하는 것이다. 문제지에 나와 있는 문
제가 전부가 아니듯 기계학습에서 활용하는 데이터가 세상의 모든 데
이터를 대표하지 못한다. 일부 데이터를 지나치게 과잉학습하다 보면
y y y
군집화
x x x
y y y
회귀분석
x x x
부족학습 적정학습 과잉학습
II. 인공지능이 빅데이터를 학습하는 방법 | 83