刪除具有大量 NA 的要素
如果某個功能在很大程度上缺少資料,那麼它很適合刪除:
library(VIM)
data(sleep)
colMeans(is.na(sleep))
   BodyWgt   BrainWgt       NonD      Dream      Sleep       Span       Gest 
0.00000000 0.00000000 0.22580645 0.19354839 0.06451613 0.06451613 0.06451613 
      Pred        Exp     Danger 
0.00000000 0.00000000 0.00000000 
在這種情況下,我們可能想要刪除 NonD 和 Dream,每個都有大約 20%的缺失值(你的截止值可能會有所不同)