检查缺失的数据
anyNA
报告是否存在任何缺失值; 而 is.na
报告元素缺失值:
vec <- c(1, 2, 3, NA, 5)
anyNA(vec)
# [1] TRUE
is.na(vec)
# [1] FALSE FALSE FALSE TRUE FALSE
ìs.na
返回一个逻辑向量,该向量在算术运算下被强制转换为整数值(FALSE = 0,TRUE = 1)。我们可以使用它来找出有多少缺失值:
sum(is.na(vec))
# [1] 1
扩展这种方法,我们可以在数据帧上使用 colSums
和 is.na
来计算每列的 NA:
colSums(is.na(airquality))
# Ozone Solar.R Wind Temp Month Day
# 37 7 0 0 0 0
该 naniar 包 (目前在 GitHub 上,但不 CRAN)提供了更多的工具为探索缺失值。