統計学:Rでt検定とone-way ANOVAをやってみた

統計学:Rでt検定とone-way ANOVA

なんかone-way ANOVAって格好良くないすか?授業でちら聞きした時からその響きに惹かれていました。t検定とはなんぞや、という話とANOVAってなんぞやってまとめつつ、Rのコード載せとこうと思います。

統計学:t検定

まずt検定を行う前には必ずデータがt分布に従っているかを確認する必要があります。t分布に従っていない場合、ノンパラメトリックな検定をしなければいけなくなるので。そもそもt検定とはなんぞや、というと二つの変数の平均値に統計的な差異があるかどうかを確認するためのもの。例えば、今回扱ったデータを元に説明をすると、「モルモットに二つの薬品を与えた。仮にこれをA, Bとする。ボックスプロットを書いてみるとAを与えたモルモットの方が平均的に歯の長さが長くなった。Bの場合は対して短い。果たしてこの違いは偶然起きたものなのか、それとも薬品の効果によるものなのか。」

ここで帰無仮説は「薬品Aと薬品Bを与えた時に起きる歯の成長の違いは偶然である。」ということになる。まずはこれを両側検定(AとBで平均が違う)で、その後、片側検定1(A薬品モルモットの方がB薬品モルモットより歯の成長が大きい)を行って確かめてみる。

結果は上記の検定がp値0.06で帰無仮説を採択。惜しいけど、薬品間の違いは偶然かもね、という結果。一方で二つ目の片側検定1をやってみると、p値は0.02で帰無仮説を棄却できる。つまり薬品Aを与えたモルモットの方が薬品Bを与えたモルモットより平均して歯の成長が大きい、という結果がえられる。

統計学:one-way ANOVA

さてロックな方の検定を。one-way ANOVAはt検定の発展系でt検定が二つの変数の平均値を比較するのに対して、anovaでは三つ以上の変数の平均値を比較できる。早速やってみる。

結果、平均値に差はある、とわかったのだが、これだけだとどの変数同士に差があるのかわからない。全部が違っているのか、それとも二つの変数間だけなのか・・。そこでTukeyHSDというテストを行う。これによりどの変数間に違いが生じているのかがわかるのだ。結果、二つ目の変数と三つ目の変数に統計的に有意な差が生じていることがわかった。

統計学:まとめ

やっぱone-way ANOVAはロックでした。理論的な方も詰めつつ、Rで実践してこうと思います。次回はtwo-way ANOVAからの予定です。もっとロック。

シェアする

  • このエントリーをはてなブックマークに追加

フォローする