預處理
插入符號中的預處理是通過 preProcess()
函式完成的。給定矩陣或資料幀型別物件 x
,preProcess()
對訓練資料應用變換,然後可以將變換應用於測試資料。
preProcess()
函式的核心是 method
引數。方法操作按此順序應用:
- 零方差濾波器
- 近零方差濾波器
- Box-Cox / Yeo-Johnson /指數變換
- 定心
- 縮放
- 範圍
- 歸罪
- PCA
- ICA
- 空間標誌
下面,我們採用 mtcars 資料集並執行居中,縮放和空間符號轉換。
auto_index <- createDataPartition(mtcars$mpg, p = .8,
list = FALSE,
times = 1)
mt_train <- mtcars[auto_index,]
mt_test <- mtcars[-auto_index,]
process_mtcars <- preProcess(mt_train, method = c("center","scale","spatialSign"))
mtcars_train_transf <- predict(process_mtcars, mt_train)
mtcars_test_tranf <- predict(process_mtcars,mt_test)