이전 글에서 소개한 Xception, Depth-wise Separable Convolution 등을 토대로 DeepLab V3+ Xception을 소개한다.
DeepLab V3+ Xception에서 사용하는 Xception BackBone은 이전글에서 소개한 Xception과는 구조가 약간 다르다.
- Middle flow를 기존에 8번 반복하던 것에서 16번으로 바꾸어 더 깊은 구조를 형성
- Max Pooling을 Depth-wise Separable Convolution(stride=2)로 바꾸어 사용
- 3 * 3 Depth-wise Convolution 후에 Batch Normalization과 ReLU를 사용하였다.
다음과 같이 수정된 Xception을 BackBone으로 이용한다. 여기서 BackBone은 feature map을 추출하는 부분을 의미한다. DeepLab V3+와의 차이점은 DeepLab V3 BackBone 대신 Xception BackBone을 사용한다는 것이며, feature map을 추출한 이후 ASPP를 적용하는 부분과 Prediction을 출력하는 과정은 동일하다.
해당 구조는 DeepLab V3+을 설명하며 사용한 구조인데 여기서 Encoder의 시작 부분(BackBone)이 Xception으로 구성된 것이라고 이해하면 된다. 뒤의 ASPP나 Decoder는 동일한 구조이다.
'Computer Vision > Semantic Segmentation' 카테고리의 다른 글
Inception & Xception (for DeepLab V3+ Xception) (0) | 2022.08.01 |
---|---|
Depth-wise Separable Convolution (for DeepLab V3+ Xception) (0) | 2022.08.01 |
DeepLab V3+ (0) | 2022.08.01 |
Atrous Convolution, Atrous Spatial Pyramid Pooling(ASPP) (for DeepLab V3+) (0) | 2022.08.01 |
Segmentation Metric(Pixel Accuracy, Intersection over Union) (0) | 2022.08.01 |