删除具有大量 NA 的要素

如果某个功能在很大程度上缺少数据,那么它很适合删除:

library(VIM)
data(sleep)
colMeans(is.na(sleep))

   BodyWgt   BrainWgt       NonD      Dream      Sleep       Span       Gest 
0.00000000 0.00000000 0.22580645 0.19354839 0.06451613 0.06451613 0.06451613 
      Pred        Exp     Danger 
0.00000000 0.00000000 0.00000000 

在这种情况下,我们可能想要删除 NonD 和 Dream,每个都有大约 20%的缺失值(你的截止值可能会有所不同)