AI/ML(패스트 캠퍼스) - Pipeline

 

Pipfeline 적용해보기

Pipeline 만들기


Pipeline

  • 데이터 처리를 위한 여러 개의 컴포넌트들이 연속적으로 처리되도록 만들어놓은 구조.
  • 앞선 컴포넌트가 처리되고 출력된 결과물이 다음 컴포넌트의 입력이 되는 방식으로 pipeline 내의 컴포넌트들이 차례차례 실행된다.
  • 정확한 순서대로 실행이 되어야 하므로 순서에 주의해야 한다.
  • 마지막 단계에는 추정기와 변환기를 모두 사용할 수 있지만 그 이전 단계들은 모두 변환기어야 한다(fit_transform() 함수를 가지고 있어야 함).
  • pipeline의 fit() 함수를 호출하여 전체 pipeline을 실행한다.
  • pipeline 객체는 마지막 추정기와 동일한 함수를 제공한다.

샘플 코드

from sklearn.pipeline import make_pipeline

# StandardScaler를 이용하여 스케일링한 후 ElasticNet을 통해 회귀 분석을 하는 Pipeline
elasticnet_pipeline = make_pipeline(
    StandardScaler(),
    ElasticNet(alpha=0.1, l1_ratio=0.2)
)

# Pipeline으로 만든 elasticnet_pipeline를 이용하여 학습 및 예측을 진행한다.
elasticnet_pred = elasticnet_pipeline.fit(x_train, y_train).predict(x_test)