[CNN] 메타코드 강의 후기_챕터 3: Convolutional Neural Network(CNN)

Convolutional Neural Networks

- CNN, ConvNet, 합성곱 신경망

- Convolutional Layer + Pooling Layer로 이미지에서 정보를 추출한 뒤(feature extractor)

추출된feature (=representation) 을 FC layer로 분류 (=Classifer)

Image Data

- 사람은 이미지를 눈으로 보고 바로 인식할 수 있지만,

컴퓨터는 이미지를 각 픽셀에 입력되어 있는 숫자값들의 배열로 인식

- 컬러 이미지는 RGB의 3개 채널로 구성, 흑백은 1개 채널로 구성

• FC Layer로 Image Data는 처리할 수 없나?

- Image Data를 모두 flatten 시켜서 FC Layer로 학습 시키게 되면 필요한 parameter의 수 가너무많아짐

→ 모델 학습의 비효율성

- 이미지의 특정 패턴을 학습하기 어려움

Convolutional Operation

- Convolution Filter(=Kernel)이 이동하면서 픽셀과 합성곱을 통해 Feature Map을 생성

- Convolution Filter의 값은 학습의 대상(parameter)으로,

점차 각 filter 마다 이미지의 특정 패턴(선, 색상, 질감등)을 학습하게 됨

- Filter size는 주로 3x3, 5x5 등 정사각형 모양을 주로사용함

Hyperparameters in Convolutional Layer

- Padding : Filter를 통과한 feature map의 크기는

입력 데이터 보다 작아지기 때문에 이를 방지하기 위해 가장 자리에 0을 채워 넣는 것

메타코드 4기 서포터즈 활동의 일환으로 작성한 게시글입니다.

[Classification] 메타코드 강의 후기_챕터 3: Pytorch Exercises - Vision Classification (0)	2024.05.26
[Regression] 메타코드 강의 후기_챕터 3: Pytorch Exercises - Logistic Regression (0)	2024.05.26
[파이토치] 메타코드 강의 후기_챕터2: Tensor 다루기 part 1 (0)	2024.04.21
[파이토치] 메타코드 강의 후기_챕터1: Orientation (0)	2024.04.17

Coding Diary