Page 17 -
P. 17
합성곱층의 필요성을 알았으니, 합성곱 신경망을 자세히 살펴보겠습니다.
5.1.2 합성곱 신경망 구조
합성곱 신경망(Convolutional Neural Network, CNN 또는 ConvNet)은 음성 인식이나 이미지/영상 인
식에서 주로 사용되는 신경망입니다. 다차원 배열 데이터를 처리하도록 구성되어 컬러 이미지 같
은 다차원 배열 처리에 특화되어 있으며, 다음과 같이 계층 다섯 개로 구성됩니다. 5
1. 입력층 합성곱 신경망 I
2. 합성곱층
3. 풀링층
4. 완전연결층
5. 출력층
그림 5-2 합성곱 신경망 구조
ࢿғக ಽ݂க ࢿғக ಽ݂க ৮ ৮ ۱க
۫ܖ ۫ܖ োѾக োѾக
ੑ۱க
%PH
$BU
#PBU
$"3
합성곱 신경망은 합성곱층과 풀링층을 거치면서 입력 이미지의 주요 특성 벡터(feature vector)를
추출합니다. 그 후 추출된 주요 특성 벡터들은 완전연결층을 거치면서 1차원 벡터로 변환되며, 마
지막으로 출력층에서 활성화 함수인 소프트맥스(softmax) 함수를 사용하여 최종 결과가 출력됩니
다. 그럼 입력층부터 하나씩 알아봅시다.
입력층
입력층(input layer)은 입력 이미지 데이터가 최초로 거치게 되는 계층입니다. 이미지는 단순 1차원
의 데이터가 아닌 높이(height), 너비(width), 채널(channel)의 값을 갖는 3차원 데이터입니다. 이때
채널은 이미지가 그레이스케일(gray scale)이면 1 값을 가지며, 컬러(RGB)면 3 값을 갖습니다. 예를
143