檢查缺失的資料
anyNA
報告是否存在任何缺失值; 而 is.na
報告元素缺失值:
vec <- c(1, 2, 3, NA, 5)
anyNA(vec)
# [1] TRUE
is.na(vec)
# [1] FALSE FALSE FALSE TRUE FALSE
ìs.na
返回一個邏輯向量,該向量在算術運算下被強制轉換為整數值(FALSE = 0,TRUE = 1)。我們可以使用它來找出有多少缺失值:
sum(is.na(vec))
# [1] 1
擴充套件這種方法,我們可以在資料幀上使用 colSums
和 is.na
來計算每列的 NA:
colSums(is.na(airquality))
# Ozone Solar.R Wind Temp Month Day
# 37 7 0 0 0 0
該 naniar 包 (目前在 GitHub 上,但不 CRAN)提供了更多的工具為探索缺失值。