- 追加された行はこの色です。
- 削除された行はこの色です。
重回帰分析のための Design パッケージの利用例
[[Baayen:http://www.mpi.nl/world/persons/private/baayen/]] の[[Analyzing Linguistic Data:http://www.amazon.co.jp/Analyzing-Linguistic-Data-Introduction-Statistics/dp/0521882591/]] pp.185--
Ordinary least squares regression
関数としては ols() を使う以外は lm() と変わるところはない.
ただし,2次の項を含めるなど,非線形分析を行うときには記法が異なる.
# lm() 関数を使う
english.lm <- lm(RTlexdec ~ WrittenFrequency +
I(WrittenFrequency^2) + AgeSubject + LengthInLetters,
data = english)
summary(english.lm)
anova(english.lm)
# ols() 関数を使う
# 192
english.ols <- ols(RTlexdec ~ pol(WrittenFrequency, 2)
+ AgeSubject + LengthInLetters, english)
summary(english.ols)
anova(english.ols)
ただし anova の出力はそれぞれ異なる.
> anova(english.lm)
Analysis of Variance Table
Response: RTlexdec
Df Sum Sq Mean Sq F value Pr(>F)
WrittenFrequency 1 21.261 21.261 2890.361 < 2.2e-16
I(WrittenFrequency^2) 1 1.407 1.407 191.246 < 2.2e-16
AgeSubject 1 56.141 56.141 7632.096 < 2.2e-16
LengthInLetters 1 0.081 0.081 11.032 0.0009026
Residuals 4563 33.565 0.007
> english.ols <- ols(RTlexdec ~ pol(WrittenFrequency, 2) + AgeSubject + LengthInLetters, english)
> anova(english.ols)
Analysis of Variance Response: RTlexdec
Factor d.f. Partial SS MS F P
WrittenFrequency 2 22.4709395 11.235469735 1527.40 <.0001
Nonlinear 1 1.4391888 1.439188764 195.65 <.0001
AgeSubject 1 56.1411838 56.141183791 7632.10 <.0001
LengthInLetters 1 0.0811495 0.081149504 11.03 9e-04
REGRESSION 4 78.8904273 19.722606822 2681.18 <.0001
ERROR 4563 33.5651224 0.007355933
標準パッケージの lm() 関数による分析結果に anova() を適用した場合は Sequential な Anova 表,つまり表の上に位置する要因を次々と階層的に組み込んでいき,それぞれの段階での予測子の効果を計っている.これに対して ols() 関数の結果にanova()を適用した結果は Non-Sequential な Anova 表を出力する.つまり,他の変数がすべてモデルに組み込まれている場合の当該予測子の効果を見ることができる.すなわち他の要因を全て定数とした場合の Partial Effect を調べることができる.