创建管道

在数据中查找模式通常在数据处理步骤链中进行,例如,特征选择,标准化和分类。在 sklearn 中,使用了一个阶段的管道。

例如,以下代码显示了由两个阶段组成的管道。第一个是对要素进行缩放,第二个是对得到的增广数据集进行分类:

from sklearn.pipeline import make_pipeline
from sklearn.preprocessing import StandardScaler
from sklearn.neighbors import KNeighborsClassifier

pipeline = make_pipeline(StandardScaler(), KNeighborsClassifier(n_neighbors=4))

创建管道后,你可以像常规阶段一样使用它(具体取决于其具体步骤)。例如,这里的管道就像一个分类器。因此,我们可以使用它如下:

# fitting a classifier
pipeline.fit(X_train, y_train)
# getting predictions for the new data sample
pipeline.predict_proba(X_test)