删除具有大量 NA 的要素
如果某个功能在很大程度上缺少数据,那么它很适合删除:
library(VIM)
data(sleep)
colMeans(is.na(sleep))
BodyWgt BrainWgt NonD Dream Sleep Span Gest
0.00000000 0.00000000 0.22580645 0.19354839 0.06451613 0.06451613 0.06451613
Pred Exp Danger
0.00000000 0.00000000 0.00000000
在这种情况下,我们可能想要删除 NonD 和 Dream,每个都有大约 20%的缺失值(你的截止值可能会有所不同)