GradientBoostingClassifier

Gradient Boosting 用於分類。梯度增強分類器是基礎模型的加性集合,其誤差在連續迭代(或階段)中通過新增回歸樹來校正殘差(前一階段的誤差)。

匯入:

from sklearn.ensemble import GradientBoostingClassifier

建立一些玩具分類資料

from sklearn.datasets import load_iris

iris_dataset = load_iris()

X, y = iris_dataset.data, iris_dataset.target

讓我們將這些資料分成訓練和測試集

from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(
    X, y, test_size=0.2, random_state=0)

使用預設引數例項化 GradientBoostingClassifier 模型

gbc = GradientBoostingClassifier()
gbc.fit(X_train, y_train)

讓我們在測試集上得分

# We are using the default classification accuracy score
>>> gbc.score(X_test, y_test)
1

預設情況下,建立了 100 個估算器

>>> gbc.n_estimators
100

這可以通過在初始化時間期間將 n_estimators 設定為不同的值來控制。