建立隨機森林模型
機器學習演算法的一個例子是 Random Forest 演算法(Breiman,L。(2001).Random Forests。機器學習 45(5)
,第 5-32 頁)。根據 Breiman 在 randomForest
包中的原始 Fortran 實現,該演算法在 R 中實現。
通過將類變數準備為 factor
,可以在 R 中建立隨機森林分類器物件,這在 iris
資料集中已經很明顯。因此我們可以通過以下方式輕鬆建立隨機森林
library(randomForest)
rf <- randomForest(x = iris[, 1:4],
y = iris$Species,
ntree = 500,
do.trace = 100)
rf
# Call:
# randomForest(x = iris[, 1:4], y = iris$Species, ntree = 500, do.trace = 100)
# Type of random forest: classification
# Number of trees: 500
# No. of variables tried at each split: 2
#
# OOB estimate of error rate: 4%
# Confusion matrix:
# setosa versicolor virginica class.error
# setosa 50 0 0 0.00
# versicolor 0 47 3 0.06
# virginica 0 3 47 0.06
引數 | 描述 |
---|---|
X |
包含類的描述變數的資料框 |
ÿ | 個別觀察的類別。如果此向量是 factor ,則建立分類模型,否則建立迴歸模型。 |
ntree |
構建的單個 CART 樹的數量 |
do.trace | 每次我 TH 一步,整體和每個類的出的現成的錯誤返回 |