GradientBoostingClassifier
Gradient Boosting 用于分类。梯度增强分类器是基础模型的加性集合,其误差在连续迭代(或阶段)中通过添加回归树来校正残差(前一阶段的误差)。
导入:
from sklearn.ensemble import GradientBoostingClassifier
创建一些玩具分类数据
from sklearn.datasets import load_iris
iris_dataset = load_iris()
X, y = iris_dataset.data, iris_dataset.target
让我们将这些数据分成训练和测试集
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(
X, y, test_size=0.2, random_state=0)
使用默认参数实例化 GradientBoostingClassifier
模型
gbc = GradientBoostingClassifier()
gbc.fit(X_train, y_train)
让我们在测试集上得分
# We are using the default classification accuracy score
>>> gbc.score(X_test, y_test)
1
默认情况下,建立了 100 个估算器
>>> gbc.n_estimators
100
这可以通过在初始化时间期间将 n_estimators
设置为不同的值来控制。