Page 11 -
P. 11

다. 우리가 문제집을 가지고 공부할 때 일부 문제는 정답을 보면서 공

                    부하고, 일부 문제는 남겨두었다가 시험 보기 전날 모의시험용으로

                    활용하는 것과 같다. 모의시험을 만족스럽게 통과해야 안심하고 실전

                    에 들어갈 수 있다.

                      데이터가 충분하지 않다거나 학습할 시간이 없다는 핑계를 대면

                    서 학습을 충분히 하지 않는 경우가 있다. 하지만 반대로 학습을 너무

                    많이 해서 문제가 생기는 경우도 종종 있다. 이를 과잉학습 또는 과적
                    합 overfitting이라 한다. 공부를 너무 많이 하다 보면 주어진 유형의 문제

                    는 거의 완벽하게 푸는데 새로운 형태의 문제가 나오면 당황하는 경

                    우다. 주어진 문제 유형에 지나치게 적응하고 이에 의존하여 풀이 방

                    식 등을 일반화시키는 오류를 범하는 것이다. 문제지에 나와 있는 문

                    제가 전부가 아니듯 기계학습에서 활용하는 데이터가 세상의 모든 데

                    이터를 대표하지 못한다. 일부 데이터를 지나치게 과잉학습하다 보면


                      y                    y                    y


                 군집화

                                     x                    x                   x

                      y                    y                    y



               회귀분석

                                     x                    x                   x
                            부족학습                적정학습                 과잉학습





                                                   II. 인공지능이 빅데이터를 학습하는 방법 | 83
   6   7   8   9   10   11   12   13   14   15