预处理

插入符号中的预处理是通过 preProcess() 函数完成的。给定矩阵或数据帧类型对象 xpreProcess() 对训练数据应用变换,然后可以将变换应用于测试数据。

preProcess() 函数的核心是 method 参数。方法操作按此顺序应用:

  1. 零方差滤波器
  2. 近零方差滤波器
  3. Box-Cox / Yeo-Johnson /指数变换
  4. 定心
  5. 缩放
  6. 范围
  7. 归罪
  8. PCA
  9. ICA
  10. 空间标志

下面,我们采用 mtcars 数据集并执行居中,缩放和空间符号转换。

auto_index <- createDataPartition(mtcars$mpg, p = .8,
                                  list = FALSE,
                                  times = 1)

mt_train <- mtcars[auto_index,]
mt_test <- mtcars[-auto_index,]

process_mtcars <- preProcess(mt_train, method = c("center","scale","spatialSign"))

mtcars_train_transf <- predict(process_mtcars, mt_train)
mtcars_test_tranf <- predict(process_mtcars,mt_test)