ML Note

  • 홈
  • 태그
  • 방명록

speech representation 1

[논문] wav2vec 2.0: A Framework for Self-Supervised Learning of Speech Representations (Neurips 2020)

이 글에서는 2020 Neurips에 게재된 "wav2vec 2.0: A Framework for Self-Supervised Learning of Speech Representations" (Alexei Baevski, et al)논문에 대해 리뷰한다. 제목 그대로 wav 음원을 vector (speech representation)으로 매핑하는 모델을 제안하였다. 이 논문을 TTS, STT에 넣은 이유는 wav2vec의 output에 간단한 predictor만 붙여주면 speech-to-text 모델로 사용할 수 있기 때문이다. ※ STT: Speech-To-Text, 음성을 텍스트로 변환해 주는 작업이다. Abstract이 연구에서는 처음으로 script없이 오디오로만 표현을 학습하고, script..

Voice, Acoustic AI/TTS, STT 2024.09.05
이전
1
다음
프로필사진

ML Note

  • 분류 전체보기
    • Mathematics
      • Statistics
      • probability
    • Machine Learning
      • Evaluation matric
      • Preprocessing
      • Classification
      • Regression
      • Graph model
      • Recommendation system
      • Learning Method
    • Voice, Acoustic AI
      • Speaker Verification
      • Vocoder
      • Speaker Diarization
      • TTS, STT
      • Voice Conversion
      • Music AI
    • Computer Vision
      • Generative AI
      • Semantic Segmentation
    • Natural Language Processing
      • Keyword Extraction
    • Project
      • 산학협력프로젝트_WELT
      • 졸업프로젝트_Deep Video Inpaintin..
      • 드림학기제_Machine Learning 암 발병..

Tag

scirex, 음원 분리, diffusion 모델, DeepLab V3+ Xception, 악기 분리, DeepLab V3+, speaker verification, information extraction, deberta, music source separation, scierc, kullback leibler, named entity recognition, NER, gliner, Ensemble, self supervised learning, 사후 확률, Xception, 앙상블,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

  2025. 05  
일 월 화 수 목 금 토
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

티스토리툴바

단축키

내 블로그

내 블로그 - 관리자 홈 전환
Q
Q
새 글 쓰기
W
W

블로그 게시글

글 수정 (권한 있는 경우)
E
E
댓글 영역으로 이동
C
C

모든 영역

이 페이지의 URL 복사
S
S
맨 위로 이동
T
T
티스토리 홈 이동
H
H
단축키 안내
Shift + /
⇧ + /

* 단축키는 한글/영문 대소문자로 이용 가능하며, 티스토리 기본 도메인에서만 동작합니다.