1. 졸업프로젝트_Deep_Video

진성01 2022. 5. 9. 02:16

-프로젝트 목표

영화, 드라마 등의 영상에 삽입된 자막 및 캡션 제거

-기술 동향

해당 논문에서 제시한 자막 인페인팅 기술은 두 개의 네트워크로 구성된 모델을 제안한다.

두 개의 네트워크 모두 UNet 구조를 이용한다. 기존 인페인팅에서 사용하는 Encoder-Decoder를 사용하였으나 두 개의 네트워크로 나누어 각각의 역할을 수행하여 성능을 높였다. 또한 Frame_attention 기술을 이용하여 인페인팅의 정확도를 높였다.

-세부 프로젝트 목표

베이스 라인으로 Deep Video Decaptioning (2021) 에서 제시한 모델을 이용하되 성능 개선 및 경량화를 목표로 한다.
아직 자막 인페인팅은 기술만 개발되었고 상용화 되지 않았다. 따라서 웹 클라이언트를 기반으로 해당 프로젝트에서 개발한 자막 인페인팅 기능을 제공한다.

-파트

프로젝트의 80% 이상을 차지하는 Detector, Decaptioner 모델 개발은 전부 참여하며, 실제로 기능을 제공하는 파트에서 역할을 분담하였다. 필자는 웹 클라이언트 개발을 맡았다.

-Use Case Diagram

-Component Diagram