Page 17 -
P. 17

합성곱층의 필요성을 알았으니, 합성곱 신경망을 자세히 살펴보겠습니다.




                    5.1.2  합성곱 신경망 구조


                    합성곱 신경망(Convolutional Neural Network, CNN 또는 ConvNet)은 음성 인식이나 이미지/영상 인
                    식에서 주로 사용되는 신경망입니다. 다차원 배열 데이터를 처리하도록 구성되어 컬러 이미지 같

                    은 다차원 배열 처리에 특화되어 있으며, 다음과 같이 계층 다섯 개로 구성됩니다.                                     5

                    1. 입력층                                                                            합성곱 신경망 I

                    2. 합성곱층
                    3. 풀링층

                    4. 완전연결층

                    5. 출력층


                       그림 5-2 합성곱 신경망 구조
                              ೤ࢿғக          ಽ݂க    ೤ࢿғக     ಽ݂க     ৮੹    ৮੹    ୹۱க
                                ۫ܖ                   ۫ܖ            োѾக   োѾக
                        ੑ۱க


                                                                                 %PH
                                                                                 $BU
                                                                                  #PBU
                                                                                   $"3




                    합성곱 신경망은 합성곱층과 풀링층을 거치면서 입력 이미지의 주요 특성 벡터(feature vector)를
                    추출합니다. 그 후 추출된 주요 특성 벡터들은 완전연결층을 거치면서 1차원 벡터로 변환되며, 마
                    지막으로 출력층에서 활성화 함수인 소프트맥스(softmax) 함수를 사용하여 최종 결과가 출력됩니

                    다. 그럼 입력층부터 하나씩 알아봅시다.


                    입력층

                    입력층(input layer)은 입력 이미지 데이터가 최초로 거치게 되는 계층입니다. 이미지는 단순 1차원

                    의 데이터가 아닌 높이(height), 너비(width), 채널(channel)의 값을 갖는 3차원 데이터입니다. 이때
                    채널은 이미지가 그레이스케일(gray scale)이면 1 값을 가지며, 컬러(RGB)면 3 값을 갖습니다. 예를

                                                                                                  143
   12   13   14   15   16   17   18   19   20   21   22