預處理

插入符號中的預處理是通過 preProcess() 函式完成的。給定矩陣或資料幀型別物件 xpreProcess() 對訓練資料應用變換,然後可以將變換應用於測試資料。

preProcess() 函式的核心是 method 引數。方法操作按此順序應用:

  1. 零方差濾波器
  2. 近零方差濾波器
  3. Box-Cox / Yeo-Johnson /指數變換
  4. 定心
  5. 縮放
  6. 範圍
  7. 歸罪
  8. PCA
  9. ICA
  10. 空間標誌

下面,我們採用 mtcars 資料集並執行居中,縮放和空間符號轉換。

auto_index <- createDataPartition(mtcars$mpg, p = .8,
                                  list = FALSE,
                                  times = 1)

mt_train <- mtcars[auto_index,]
mt_test <- mtcars[-auto_index,]

process_mtcars <- preProcess(mt_train, method = c("center","scale","spatialSign"))

mtcars_train_transf <- predict(process_mtcars, mt_train)
mtcars_test_tranf <- predict(process_mtcars,mt_test)