Page 21 -
P. 21
‘훈련 데이터셋 1000개에 대한 배치 크기가 20’이라면 샘플 단위 20개마다 모델 가중치를
한 번씩 업데이트시킨다는 의미입니다. 즉, 총 50번(=1000/20)의 가중치가 업데이트됩니
다. 이때 에포크가 10이고 배치 크기가 20이라면, 가중치를 50번 업데이트하는 것을 총 열
번 반복한다는 의미입니다. 각 데이터 샘플이 총 열 번씩 사용되는 것이므로 결과적으로 가
중치가 총 500번 업데이트됩니다.
성능이 좋다는 의미는?
머신 러닝/딥러닝에서 ‘성능(performance)’에 대한 공식적인 정의는 없습니다. 궁극적으로 모델 성능은 데이
터가 수집된 산업 분야와 모델이 생성된 목적에 의존한다고 볼 수 있습니다. 즉, 모델 성능이 좋다는 의미는 다
음과 같은 다양한 의미로 사용할 수 있습니다.
•예측을 잘합니다(정확도가 높습니다).
•훈련 속도가 빠릅니다.
● 모델(모형) 예측: 검증 데이터셋을 생성한 모델(모형)에 적용하여 실제로 예측을 진행해 보는
단계입니다. 이때 예측력이 낮다면 파라미터를 튜닝하거나 신경망 자체를 재설계해야 할 수
도 있습니다.
딥러닝 학습 과정에서 중요한 핵심 구성 요소는 신경망과 역전파입니다. 딥러닝은 머신 러닝의 한
11
분야이기는 하지만, 심층 신경망(deep neural network) 을 사용한다는 점에서 머신 러닝과 차이가
있습니다. 심층 신경망에는 데이터셋의 어떤 특성들이 중요한지 스스로에게 가르쳐 줄 수 있는 기
능이 있습니다.
그림 1-13 신경망과 심층 신경망
न҃ݎ बக न҃ݎ
ੑ۱க ץக ۱க ੑ۱க ץக ۱க
11 은닉층이 두 개 이상인 신경망입니다.
028