创建随机森林模型

Created: November-22, 2018

机器学习算法的一个例子是 Random Forest 算法（Breiman，L。（2001）.Random Forests。机器学习 45(5) ，第 5-32 页）。根据 Breiman 在 randomForest 包中的原始 Fortran 实现，该算法在 R 中实现。

通过将类变量准备为 factor，可以在 R 中创建随机森林分类器对象，这在 iris 数据集中已经很明显。因此我们可以通过以下方式轻松创建随机森林

library(randomForest)

rf <- randomForest(x = iris[, 1:4], 
                   y = iris$Species, 
                   ntree = 500, 
                   do.trace = 100)

rf

# Call:
#   randomForest(x = iris[, 1:4], y = iris$Species, ntree = 500,      do.trace = 100) 
# Type of random forest: classification
# Number of trees: 500
# No. of variables tried at each split: 2
# 
# OOB estimate of  error rate: 4%
# Confusion matrix:
#   setosa versicolor virginica class.error
# setosa         50          0         0        0.00
# versicolor      0         47         3        0.06
# virginica       0          3        47        0.06

参数	描述
`X`	包含类的描述变量的数据框
ÿ	个别观察的类别。如果此向量是 `factor`，则创建分类模型，否则创建回归模型。
`ntree`	构建的单个 CART 树的数量
do.trace	每次我 TH 一步，整体和每个类的出的现成的错误返回