创建随机森林模型
机器学习算法的一个例子是 Random Forest 算法(Breiman,L。(2001).Random Forests。机器学习 45(5)
,第 5-32 页)。根据 Breiman 在 randomForest
包中的原始 Fortran 实现,该算法在 R 中实现。
通过将类变量准备为 factor
,可以在 R 中创建随机森林分类器对象,这在 iris
数据集中已经很明显。因此我们可以通过以下方式轻松创建随机森林
library(randomForest)
rf <- randomForest(x = iris[, 1:4],
y = iris$Species,
ntree = 500,
do.trace = 100)
rf
# Call:
# randomForest(x = iris[, 1:4], y = iris$Species, ntree = 500, do.trace = 100)
# Type of random forest: classification
# Number of trees: 500
# No. of variables tried at each split: 2
#
# OOB estimate of error rate: 4%
# Confusion matrix:
# setosa versicolor virginica class.error
# setosa 50 0 0 0.00
# versicolor 0 47 3 0.06
# virginica 0 3 47 0.06
参数 | 描述 |
---|---|
X |
包含类的描述变量的数据框 |
ÿ | 个别观察的类别。如果此向量是 factor ,则创建分类模型,否则创建回归模型。 |
ntree |
构建的单个 CART 树的数量 |
do.trace | 每次我 TH 一步,整体和每个类的出的现成的错误返回 |