GradientBoostingClassifier
Gradient Boosting 用於分類。梯度增強分類器是基礎模型的加性集合,其誤差在連續迭代(或階段)中通過新增回歸樹來校正殘差(前一階段的誤差)。
匯入:
from sklearn.ensemble import GradientBoostingClassifier
建立一些玩具分類資料
from sklearn.datasets import load_iris
iris_dataset = load_iris()
X, y = iris_dataset.data, iris_dataset.target
讓我們將這些資料分成訓練和測試集
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(
X, y, test_size=0.2, random_state=0)
使用預設引數例項化 GradientBoostingClassifier
模型
gbc = GradientBoostingClassifier()
gbc.fit(X_train, y_train)
讓我們在測試集上得分
# We are using the default classification accuracy score
>>> gbc.score(X_test, y_test)
1
預設情況下,建立了 100 個估算器
>>> gbc.n_estimators
100
這可以通過在初始化時間期間將 n_estimators
設定為不同的值來控制。