预处理
插入符号中的预处理是通过 preProcess()
函数完成的。给定矩阵或数据帧类型对象 x
,preProcess()
对训练数据应用变换,然后可以将变换应用于测试数据。
preProcess()
函数的核心是 method
参数。方法操作按此顺序应用:
- 零方差滤波器
- 近零方差滤波器
- Box-Cox / Yeo-Johnson /指数变换
- 定心
- 缩放
- 范围
- 归罪
- PCA
- ICA
- 空间标志
下面,我们采用 mtcars 数据集并执行居中,缩放和空间符号转换。
auto_index <- createDataPartition(mtcars$mpg, p = .8,
list = FALSE,
times = 1)
mt_train <- mtcars[auto_index,]
mt_test <- mtcars[-auto_index,]
process_mtcars <- preProcess(mt_train, method = c("center","scale","spatialSign"))
mtcars_train_transf <- predict(process_mtcars, mt_train)
mtcars_test_tranf <- predict(process_mtcars,mt_test)