2012年12月18日火曜日

分散分析から回帰分析へ:回帰式による表現を理解する

 心理言語学を志す日本の学生の多くは、言語学科か心理学科に属しているかと思いますが、両者の違いの一つとして、次のことばに対する認識への違いを指摘できます。

「分散分析も所詮は回帰分析のひとつだよね。」

 統計学を必修科目としてお付き合いしてきた心理学出身の人がこれを聞くとたいてい
「そうだね。」「詳しくは知らないけど、授業で聞いたことはある。」という反応ですが、言語学出身の人のなかには
「そうなの?」「そんなの聞いたことないよ。」
という反応のひとがいるかもしれません。

今日は分散分析と回帰分析が同等であることを確認してみます。

1.条件の違いを示す棒グラフを線グラフに変更する。
以下は条件Aと条件Bについて何らかの成績の違いを示しているグラフです。一般的に条件間差はt検定で検定できます。













このグラフを線グラフに直してみます。また、「条件A」や「条件B」はラベルなので何と呼んでもいいはずです。ここで「条件A」を「0」、「条件B」を「1」と呼び変えます。


2.縦軸を移動する。
グラフ上の成績を示す縦軸は、横軸のどこについていてもいいはずです。ここで条件0の上に縦軸が引かれるように、縦軸を移動します。
















上の形を見てみると、中学校の数学で習った一次方程式を示す直線の形になっていることに気づきます。直線のy軸との交点は切片(intercept)、x軸が1変化するときのy軸の変化量を傾き(slope)と呼んでいました。ここで最初の二つの条件間差が傾きに一致していることに注意してください。

つまり、二つの条件はどちらも次のような方程式で書くことができます。

成績 = 切片 + 傾き x (条件の水準)

条件Aは条件の水準0なので
成績 = 切片 + 傾き x (0) = 切片

条件Bは条件の水準1なので
成績 = 切片 + 傾き x (1) = 切片 + 傾き

方程式上でも条件間差は傾きの大きさに一致しています。
こんな風に見方を少し変えるだけで、t検定で扱っていた条件間差が、方程式として表現できることが分かります。
 この考え方を理解できると「分散分析も回帰モデルの一種」という冒頭の言葉の意味がわかるのではないでしょうか。



0 件のコメント:

コメントを投稿