刪除具有大量 NA 的要素
如果某個功能在很大程度上缺少資料,那麼它很適合刪除:
library(VIM)
data(sleep)
colMeans(is.na(sleep))
BodyWgt BrainWgt NonD Dream Sleep Span Gest
0.00000000 0.00000000 0.22580645 0.19354839 0.06451613 0.06451613 0.06451613
Pred Exp Danger
0.00000000 0.00000000 0.00000000
在這種情況下,我們可能想要刪除 NonD 和 Dream,每個都有大約 20%的缺失值(你的截止值可能會有所不同)