Computer Vision/Semantic Segmentation

DeepLab V3+ Xception

진성01 2022. 8. 1. 14:03

이전 글에서 소개한 Xception, Depth-wise Separable Convolution 등을 토대로 DeepLab V3+ Xception을 소개한다.

 

DeepLab V3+ Xception에서 사용하는 Xception BackBone은 이전글에서 소개한 Xception과는 구조가 약간 다르다.

  • Middle flow를 기존에 8번 반복하던 것에서 16번으로 바꾸어 더 깊은 구조를 형성
  • Max Pooling을 Depth-wise Separable Convolution(stride=2)로 바꾸어 사용
  • 3 * 3 Depth-wise Convolution 후에 Batch Normalization과 ReLU를 사용하였다.

다음과 같이 수정된 Xception을 BackBone으로 이용한다. 여기서 BackBone은 feature map을 추출하는 부분을 의미한다. DeepLab V3+와의 차이점은 DeepLab V3 BackBone 대신 Xception BackBone을 사용한다는 것이며, feature map을 추출한 이후 ASPP를 적용하는 부분과 Prediction을 출력하는 과정은 동일하다.

 

해당 구조는 DeepLab V3+을 설명하며 사용한 구조인데 여기서 Encoder의 시작 부분(BackBone)이 Xception으로 구성된 것이라고  이해하면 된다. 뒤의 ASPP나 Decoder는 동일한 구조이다.