创建线性二次和二阶交互术语
y ~ .
:这里 .
被解释为在拟合模型时使用的数据框中除 y
之外的所有变量。它相当于预测变量的线性组合。例如 y ~ var1 + var2 + var3+...+var15
y ~ . ^ 2
将给出数据框中变量的所有线性(主效应)和二阶交互项。它相当于 y ~ var1 + var2 + ...+var15 + var1:var2 + var1:var3 + var1:var4...and so on
y ~ var1 + var2 + ...+var15 + I(var1^2) + I(var2^2) + I(var3^2)...+I(var15^2)
:这里 I(var^2)
表示数据帧中一个变量的二次多项式。
y ~ poly(var1, degree = 2) + poly(var2, degree = 2)+...poly(var15, degree = 2)
要么
y ~ poly(var1, var2, var3, ....var15, degree = 2)
将等同于上面的表达式。
poly(var1, degree = 2)
相当于 var1 + I(var1^2)
。
要获得三次多项式,请在 poly()
中使用 degree = 3
。
使用 poly
与 I(var, 2)
有一个警告,即在拟合模型之后,每个都将产生不同的系数,但拟合值是等价的,因为它们代表同一模型的不同参数化。建议在 poly()
上使用 I(var, 2)
以避免在 poly()
中看到的摘要效果。
总之,要获得线性,二次和二阶交互项,你将得到一个类似的表达式
y ~ .^2 + I(var1^2) + I(var2^2)+...I(var15^2)
演示四个变量:
old <- reformulate( 'y ~ x1+x2+x3+x4' )
new <- reformulate( " y ~ .^2 + I(x1^2) + I(x2^2) + I(x3^2) + I(x4^2) ")
tmp <- .Call(stats:::C_updateform, old, new)
terms.formula(tmp, simplify = TRUE )
# ~y ~ x1 + x2 + x3 + x4 + I(x1^2) + I(x2^2) + I(x3^2) + I(x4^2) +
# x1:x2 + x1:x3 + x1:x4 + x2:x3 + x2:x4 + x3:x4
# attr(,"variables")
# list(~y, x1, x2, x3, x4, I(x1^2), I(x2^2), I(x3^2), I(x4^2))
# attr(,"factors")
# x1 x2 x3 x4 I(x1^2) I(x2^2) I(x3^2) I(x4^2) x1:x2 x1:x3 x1:x4 x2:x3 x2:x4 x3:x4
# ~y 0 0 0 0 0 0 0 0 0 0 0 0 0 0
# x1 1 0 0 0 0 0 0 0 1 1 1 0 0 0
# x2 0 1 0 0 0 0 0 0 1 0 0 1 1 0
# x3 0 0 1 0 0 0 0 0 0 1 0 1 0 1
# x4 0 0 0 1 0 0 0 0 0 0 1 0 1 1
# I(x1^2) 0 0 0 0 1 0 0 0 0 0 0 0 0 0
# I(x2^2) 0 0 0 0 0 1 0 0 0 0 0 0 0 0
# I(x3^2) 0 0 0 0 0 0 1 0 0 0 0 0 0 0
# I(x4^2) 0 0 0 0 0 0 0 1 0 0 0 0 0 0
# attr(,"term.labels")
# [1] "x1" "x2" "x3" "x4" "I(x1^2)" "I(x2^2)" "I(x3^2)" "I(x4^2)"
# [9] "x1:x2" "x1:x3" "x1:x4" "x2:x3" "x2:x4" "x3:x4"
# attr(,"order")
# [1] 1 1 1 1 1 1 1 1 2 2 2 2 2 2
# attr(,"intercept")
# [1] 1
# attr(,"response")
# [1] 1
# attr(,".Environment")
# <environment: R_GlobalEnv>