建立線性二次和二階互動術語
y ~ .
:這裡 .
被解釋為在擬合模型時使用的資料框中除 y
之外的所有變數。它相當於預測變數的線性組合。例如 y ~ var1 + var2 + var3+...+var15
y ~ . ^ 2
將給出資料框中變數的所有線性(主效應)和二階互動項。它相當於 y ~ var1 + var2 + ...+var15 + var1:var2 + var1:var3 + var1:var4...and so on
y ~ var1 + var2 + ...+var15 + I(var1^2) + I(var2^2) + I(var3^2)...+I(var15^2)
:這裡 I(var^2)
表示資料幀中一個變數的二次多項式。
y ~ poly(var1, degree = 2) + poly(var2, degree = 2)+...poly(var15, degree = 2)
要麼
y ~ poly(var1, var2, var3, ....var15, degree = 2)
將等同於上面的表示式。
poly(var1, degree = 2)
相當於 var1 + I(var1^2)
。
要獲得三次多項式,請在 poly()
中使用 degree = 3
。
使用 poly
與 I(var, 2)
有一個警告,即在擬合模型之後,每個都將產生不同的係數,但擬合值是等價的,因為它們代表同一模型的不同引數化。建議在 poly()
上使用 I(var, 2)
以避免在 poly()
中看到的摘要效果。
總之,要獲得線性,二次和二階互動項,你將得到一個類似的表示式
y ~ .^2 + I(var1^2) + I(var2^2)+...I(var15^2)
演示四個變數:
old <- reformulate( 'y ~ x1+x2+x3+x4' )
new <- reformulate( " y ~ .^2 + I(x1^2) + I(x2^2) + I(x3^2) + I(x4^2) ")
tmp <- .Call(stats:::C_updateform, old, new)
terms.formula(tmp, simplify = TRUE )
# ~y ~ x1 + x2 + x3 + x4 + I(x1^2) + I(x2^2) + I(x3^2) + I(x4^2) +
# x1:x2 + x1:x3 + x1:x4 + x2:x3 + x2:x4 + x3:x4
# attr(,"variables")
# list(~y, x1, x2, x3, x4, I(x1^2), I(x2^2), I(x3^2), I(x4^2))
# attr(,"factors")
# x1 x2 x3 x4 I(x1^2) I(x2^2) I(x3^2) I(x4^2) x1:x2 x1:x3 x1:x4 x2:x3 x2:x4 x3:x4
# ~y 0 0 0 0 0 0 0 0 0 0 0 0 0 0
# x1 1 0 0 0 0 0 0 0 1 1 1 0 0 0
# x2 0 1 0 0 0 0 0 0 1 0 0 1 1 0
# x3 0 0 1 0 0 0 0 0 0 1 0 1 0 1
# x4 0 0 0 1 0 0 0 0 0 0 1 0 1 1
# I(x1^2) 0 0 0 0 1 0 0 0 0 0 0 0 0 0
# I(x2^2) 0 0 0 0 0 1 0 0 0 0 0 0 0 0
# I(x3^2) 0 0 0 0 0 0 1 0 0 0 0 0 0 0
# I(x4^2) 0 0 0 0 0 0 0 1 0 0 0 0 0 0
# attr(,"term.labels")
# [1] "x1" "x2" "x3" "x4" "I(x1^2)" "I(x2^2)" "I(x3^2)" "I(x4^2)"
# [9] "x1:x2" "x1:x3" "x1:x4" "x2:x3" "x2:x4" "x3:x4"
# attr(,"order")
# [1] 1 1 1 1 1 1 1 1 2 2 2 2 2 2
# attr(,"intercept")
# [1] 1
# attr(,"response")
# [1] 1
# attr(,".Environment")
# <environment: R_GlobalEnv>