[데이터 사이언스/개념/문법] pipeline이란?
Pipeline은 여러 변환기를 순차적으로 적용할 수 있게 해주는 유용한 도구입니다.각 변환기를 파이프라인의 하나의 "단계(step)"로 추가합니다.이러한 각 단계는 고유의 이름과 변환기로 구성됩니다. num_transformer = Pipeline(steps=[ ('imputer', SimpleImputer(strategy='mean')), ('scaler', StandardScaler())]) 수치형 데이터를 전처리하는 파이프라인을 정의이 파이프라인에는 두 가지 주요 단계: 결측치 대체와 표준화SimpleImputer & StandardScalerSimpleImputer(strategy='mean'):결측치를 평균값으로 대체합니다.각 열에 대해 결측치가 있을 경우, 해당 열의 평균값으로 결측치를 대체..
2024.08.15