质量评估
在构建回归模型之后,检查结果并确定模型是否合适并且与手头的数据一起使用是很重要的。这可以通过检查残差图以及其他诊断图来完成。
# fit the model
fit <- lm(mpg ~ wt, data = mtcars)
#
par(mfrow=c(2,1))
# plot model object
plot(fit, which =1:2)
https://i.stack.imgur.com/tHoK5.jpg
这些图检查了构建模型时所做的两个假设:
- 预测变量的预期值(在这种情况下为
mpg
)由预测变量的线性组合给出(在这种情况下为wt
)。我们预计这一估计值是公正的。因此残差应该以预测变量的所有值的均值为中心。在这种情况下,我们看到残差倾向于在末端为正,在中间为负,表明变量之间存在非线性关系。 - 实际预测变量通常围绕其估计分布。因此,残差应该是正态分布的。对于正态分布数据,正常 QQ 图中的点应位于对角线上或靠近对角线。这里的结尾有一些偏差。