平方和の違い
授業のため,まとめようと思っていたら,ここに簡潔な説明があったので,引用させてもらう.
平方和のタイプ 分散分析は因子が直交している場合に成り立つ平方和の加法性を利用して平方和を分解するものであり、 そもそも釣り合い型データに適用するよう考案された分析である。 ただ、直交性が崩れていると即アウトというわけではない。 もしそうなら現実にはアウトのデータが無残にも山ほどできてしまう。 そこでアンバランスでもなんとか個々の変動要因の平方和を計算する方法を考える。 その案がタイプI〜IVの平方和というやつ(たぶん名前はSAS起源)。 だからこの「平方和のタイプ」は幸運にも自分のデータが直交釣り合い型データのときは まったく関係ない(どれでも同じ)。 基本的に、タイプの違いというのは、「非直交なデータでは要因間に相関があることになるから、 平方和の加法性が単純には成立しないので、その相関の分を如何にコントロールするか」、 というコントロール方法の違いに拠る。ここでいう「コントロール」という概念は 偏相関係数や偏回帰係数におけるそれと同様だと思ってもらってよい。
Type I SS (タイプ I 平方和) 複数の変動要因の効果(主効果、交互作用)を1つずつモデルに追加していく時、 モデルの平方和の増加分をその効果の平方和と考える。このことから、「逐次平方和」とも呼ばれる。 言い換えれば、ある要因の効果は、 それ以前にモデルに投入されたすべての要因によってコントロールされた状態で検討される、ということ。 タイプ I の平方和は、要因の投入順序により異なった値を取る。 ただし、上で述べたように、直交デザインの場合は投入順序には依存しない(コントロールする分がないから)。 低次の効果から順に投入する(主効果、二重交互作用、三重交互作用…)というルールは守るように。
Type II SS (タイプ II 平方和) タイプIと異なり、タイプIIでは同レベルの効果はモデルに一斉投入される。 主効果に関しては、まず、すべての要因の主効果だけを投入したモデルにおいて全体の平方和を計算する。 次にそこからある要因の主効果を取り除いたモデルの平方和を計算する(当然ながらこちらのほうが小さくなる)。 そしてその減少分をその要因の主効果の平方和とする。 同じ手順で、全要因についての主効果が計算される。 これは、ある要因の主効果が、それ以外のすべての要因の主効果でコントロールされた状態で検討されるということ。 一次交互作用に関しては、まず、すべての主効果とすべての一次交互作用を投入して平方和を計算する。 次にそこからある交互作用を取り除いたモデルの平方和を計算する。 そしてその減少分をその交互作用の平方和とする。 これは、ある一次交互作用が、それ以外のすべての一次交互作用とすべての主効果で コントロールされた状態で検討されるということ。 より高次の交互作用についても同様。 タイプIIの平方和は、投入順序には依存しない。
Type III SS (タイプ III 平方和) タイプIIIの平方和では、すべての効果がモデルに同時投入される。 主効果、交互作用に関わらず、ある効果の平方和は、全効果を投入したモデルからその効果を取り除いたときの、 平方和の減少分として計算される。 これは、ある効果が、それ以外のすべての効果(主効果、交互作用)でコントロールされた状態で検討されるということ。 タイプIII の平方和も、投入順序には依存しない。
タイプIIとタイプIIIは両方とも「偏平方和」と呼ばれるが、これらの違いは、 同レベルとそれより低次の効果だけでコントロールする(タイプII)か、 全効果でコントロールする(タイプIII)か、という点。 2要因デザインを例にすると、ある要因の主効果の平方和の算出において、 もう一つの要因の主効果以外に交互作用でもコントロールするか(タイプIII)しないか(タイプII)、 という違い。
Type IV SS (タイプ IV 平方和) これはタイプIIIの類似版で、データが1つもないセル(空のセル)が存在するときに使う(それ以外は使う必要がない)。 空のセルが存在すると、そのセルについて何もわからないのだから、ふつうの分散分析を適用するのはよくない。 とくにタイプIIIは交互作用でコントロールするから。 よって、そのような場合、データが存在するセルだけでできる範囲の比較を行い、 そこから各要因の主効果や(可能ならば)交互作用を推定するという方法が(統計ソフトの内部で)取られる。 その際に計算される平方和である。 コントロールについてはタイプIIIと同様に考えているので、空のセルがなければタイプIIIと一致する。
特徴の比較と選択 繰り返しになるが、釣り合い型データではどれでも同じである。 非釣り合い型だが直交したデータの場合、タイプIとタイプIIは一致するが、 タイプIIIは交互作用で調整するので一致しない。 非直交なデータであっても、交互作用がないモデルの場合は、タイプII、タイプIII、タイプIVは同じである。 これらは平方和がどうコントロールされるか考えれば明らか。
交互作用に関して言うと、タイプIIは主効果の計算において交互作用を無視する。 タイプIIIは交互作用の大きさを「バランスよく」算定し(dummy codeでなくeffect codeをイメージせよ)、 主効果の検討において交互作用を考慮する。 逆に、セルサイズに関して言うと、 タイプIIでは各セルのデータ数で重みをつけた加重平均が周辺平均として計算され、主効果が検討される。 それに対し、タイプIIIでは、セルサイズで重みづけをしない(=等しく重みづけた)平均が計算されることになる。 でも空のセルがあっても等しく重みづけるというのが変だということで、 タイプIVなんてのが出てきたりするわけだ。
このようにタイプIIもタイプIIIもそれぞれの言い分があるから、 どっちがいいかというのは一概に議論が決着しないところ。ユーザは各自の判断で使うしかない。 要因間に因果的な順序が想定される場合などは、タイプIを使うだろう。 それ以外はたいていタイプIIかタイプIIIだが、重みづけをするべきかどうかは、 そのデータの背景や研究分野の理論などとも相談しなければならないだろう。 主効果に主たる関心がある場合はタイプII、 交互作用に関心がある場合はタイプIIIという考え方もあるらしい。