본문 바로가기

Study/데이터 분석 딥러닝 입문 + Pytorch 실습 부트캠프

[CNN] 메타코드 강의 후기_챕터 3: Convolutional Neural Network(CNN) - part 1

 

Convolutional Neural Networks

- CNN, ConvNet, 합성곱 신경망

- Convolutional Layer + Pooling Layer로 이미지에서 정보를 추출한 뒤(feature extractor)

추출된feature (=representation) 을 FC layer로 분류 (=Classifer)

 

 

Image Data

- 사람은 이미지를 눈으로 보고 바로 인식할 수 있지만,

컴퓨터는 이미지를 각 픽셀에 입력되어 있는 숫자값들의 배열로 인식

- 컬러 이미지는 RGB의 3개 채널로 구성, 흑백은 1개 채널로 구성

 

 

• FC Layer로 Image Data는 처리할 수 없나?

- Image Data를 모두 flatten 시켜서 FC Layer로 학습 시키게 되면 필요한 parameter의 수 가너무많아짐

→ 모델 학습의 비효율성

- 이미지의 특정 패턴을 학습하기 어려움

 

 

Convolutional Operation

- Convolution Filter(=Kernel)이 이동하면서 픽셀과 합성곱을 통해  Feature Map을 생성

- Convolution Filter의 값은 학습의 대상(parameter)으로,

점차 각 filter 마다 이미지의 특정 패턴(선, 색상, 질감등)을 학습하게 됨

- Filter size는 주로 3x3, 5x5 등 정사각형 모양을 주로사용함

 

 

 

Hyperparameters in Convolutional Layer

- Padding : Filter를 통과한 feature map의 크기는

입력 데이터 보다 작아지기 때문에 이를 방지하기 위해 가장 자리에 0을 채워 넣는 것

 

 


메타코드 4기 서포터즈 활동의 일환으로 작성한 게시글입니다. 

메타코드M (mcode.co.kr)