統計学:仮説検定、P値、信頼区間、タイプ1エラー、タイプ2エラー

統計学:仮説検定・P値

仮説検定とは、帰無仮説を設定し、それを否定することで対立仮説を証明するという手法で行われる。仮説検定の際に必ず出てくるのがP値である。すごくザッパな言い方ではあるけど、こんな例に基づいて理解をしたい。今、「金持ちの家ほど学歴が高い」を証明したいとする。この時、帰無仮説(H0)に当たるのが「金持ちの家と学歴の高さは関係ない」というもの。確率を求めてみたら(ここは少し端折る)「金持ちの家と学歴の高さが関係ない確率」は2%(P値)だった。つまり「金持ちと学歴の高さが関係ない」というのは2%の確率でしか起き得ない。2%ってかなり偶然だよね。ということで帰無仮説「金持ちの家と学歴の高さは関係ない」は採択できず、棄却される。つまり、「金持ちの家ほど学歴は高い」と言える。

統計学:信頼区間の話

僕はいつも信頼区間95%とこの有意水準5%のところがごっちゃというか、ごっちゃにしていいのかいけないのかわかっていない節があったが、これはごっちゃにしていい。というか同じ意味である。有意水準の5%というのは、5%以下しか起きてない、偶然の出来事だから否定しましょう、という感じで使われる。一方で、信頼区間95%というのは、この数値からこの数値の間になる確率が95%です、つまりこの区間の間に数字が落っこちてくるっていうのは結構ありうる話だよね。という感じで使われる。逆のことを言ってるけど、話は同じなのだ。

統計学:タイプ1エラーとタイプ2エラーの話

タイプ1エラーとは「実際帰無仮説は正しい」のにも関わらず、「その帰無仮説を棄却してしまう」こと。先ほどの例をもう一度持ち出すと、「金持ちの家と学歴の高さは関係ない」という帰無仮説は実は正しかったのに、棄却してしまって、結果「金持ちの家と学歴の高さは関係あるんだ!」としてしまう状態のこと。対してタイプ2エラーとは「実際帰無仮説は棄却できる」のにも関わらず「その帰無仮説を採択してしまう」こと。「金持ちの家と学歴の高さは関係ない」確率はわずか2%で棄却できた。にも関わらず何かの手違いで、「帰無仮説は棄却できないよね。金持ちの家と学歴の高さは関係ない!」としてしまう状態のこと。

シェアする

  • このエントリーをはてなブックマークに追加

フォローする