[데이터 사이언스/개념/문법] oneHotCoding이란?
OneHotEncoder를 사용하여 범주형 데이터를 원-핫 인코딩하면,범주형 데이터를 머신 러닝 모델이 직접 사용할 수 있는 형태로 변환할 수 있습니다.이는 모델 성능 향상에 기여하며, 다양한 알고리즘과의 호환성을 보장합니다.다만, 차원의 증가와 메모리 사용량에 주의해야 합니다. One-Hot Encoding이란?One-Hot Encoding은 범주형 데이터를 이진 벡터(binary vector)로 변환하는 방법입니다.각 범주형 값은 하나의 고유한 이진 벡터로 변환됩니다.벡터의 길이는 해당 범주형 변수의 고유한 값의 개수와 같고, 특정 범주에 해당하는 위치는 1, 나머지 위치는 0으로 설정됩니다.예를 들어, ['red', 'green', 'blue']라는 범주형 변수를 원-핫 인코딩하면 다음과 같은 결과..
2024.08.16