ML Note

  • 홈
  • 태그
  • 방명록

onehotencoder 1

데이터 인코딩 (Data Encoding)

데이터 전처리(preprocessing)란, 데이터를 학습에 사용할 수 있도록, 보다 학습 결과가 좋게 나타날 수 있도록 데이터를 처리하는 과정이다. 전처리에서 사용하는 기법은 여러가지가 있는데 이번 글에서는 그 중 하나인 데이터 인코딩에 대해서 소개한다. 레이블 인코딩(label encoding) 사이킷런의 머신러닝 알고리즘은 문자열을 입력값으로 허용하지 않는다. 따라서 모든 문자열은 인코딩 돼서 숫자 형으로 변환해야 한다. 예를 들어 성별을 나타내는 피쳐의 경우 'male', 'female'과 같이 문자열의 형태로 데이터가 저장되어 있을 수 있다. 이는 바로 input으로 사용할 수 없기 때문에 male ->0, female -> 1과 같이 int형태로 바꾼 후 input으로 이용해야 한다. 위에서와..

Machine Learning/Preprocessing 2022.05.08
이전
1
다음
프로필사진

ML Note

  • 분류 전체보기
    • Mathematics
      • Statistics
      • probability
    • Machine Learning
      • Evaluation matric
      • Preprocessing
      • Classification
      • Regression
      • Graph model
      • Recommendation system
      • Learning Method
    • Voice, Acoustic AI
      • Speaker Verification
      • Vocoder
      • Speaker Diarization
      • TTS, STT
      • Voice Conversion
      • Music AI
    • Computer Vision
      • Generative AI
      • Semantic Segmentation
    • Natural Language Processing
      • Keyword Extraction
    • Project
      • 산학협력프로젝트_WELT
      • 졸업프로젝트_Deep Video Inpaintin..
      • 드림학기제_Machine Learning 암 발병..

Tag

악기 분리, DeepLab V3+, self supervised learning, 앙상블, Xception, speaker verification, 음원 분리, scierc, kullback leibler, DeepLab V3+ Xception, NER, gliner, deberta, 사후 확률, diffusion 모델, named entity recognition, information extraction, scirex, music source separation, Ensemble,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

  2025. 05  
일 월 화 수 목 금 토
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

티스토리툴바

단축키

내 블로그

내 블로그 - 관리자 홈 전환
Q
Q
새 글 쓰기
W
W

블로그 게시글

글 수정 (권한 있는 경우)
E
E
댓글 영역으로 이동
C
C

모든 영역

이 페이지의 URL 복사
S
S
맨 위로 이동
T
T
티스토리 홈 이동
H
H
단축키 안내
Shift + /
⇧ + /

* 단축키는 한글/영문 대소문자로 이용 가능하며, 티스토리 기본 도메인에서만 동작합니다.