Convolutional Neural Networks
- CNN, ConvNet, 합성곱 신경망
- Convolutional Layer + Pooling Layer로 이미지에서 정보를 추출한 뒤(feature extractor)
추출된feature (=representation) 을 FC layer로 분류 (=Classifer)
Image Data
- 사람은 이미지를 눈으로 보고 바로 인식할 수 있지만,
컴퓨터는 이미지를 각 픽셀에 입력되어 있는 숫자값들의 배열로 인식
- 컬러 이미지는 RGB의 3개 채널로 구성, 흑백은 1개 채널로 구성
• FC Layer로 Image Data는 처리할 수 없나?
- Image Data를 모두 flatten 시켜서 FC Layer로 학습 시키게 되면 필요한 parameter의 수 가너무많아짐
→ 모델 학습의 비효율성
- 이미지의 특정 패턴을 학습하기 어려움
Convolutional Operation
- Convolution Filter(=Kernel)이 이동하면서 픽셀과 합성곱을 통해 Feature Map을 생성
- Convolution Filter의 값은 학습의 대상(parameter)으로,
점차 각 filter 마다 이미지의 특정 패턴(선, 색상, 질감등)을 학습하게 됨
- Filter size는 주로 3x3, 5x5 등 정사각형 모양을 주로사용함
Hyperparameters in Convolutional Layer
- Padding : Filter를 통과한 feature map의 크기는
입력 데이터 보다 작아지기 때문에 이를 방지하기 위해 가장 자리에 0을 채워 넣는 것
'Study > 데이터 분석 딥러닝 입문 + Pytorch 실습 부트캠프' 카테고리의 다른 글
[Classification] 메타코드 강의 후기_챕터 3: Pytorch Exercises - Vision Classification (0) | 2024.05.26 |
---|---|
[Regression] 메타코드 강의 후기_챕터 3: Pytorch Exercises - Logistic Regression (0) | 2024.05.26 |
[파이토치] 메타코드 강의 후기_챕터2: Tensor 다루기 part 1 (0) | 2024.04.21 |
[파이토치] 메타코드 강의 후기_챕터1: Orientation (0) | 2024.04.17 |