統計・計量経済学 : 平均差の検定(t検定)をRでやってみる。

計量経済学の第一歩

今回も毎回のごとく計量経済学の第一歩で勉強していきます。4章目に取り組んだのですが、不偏性、一致性、効率性など統計分析では欠かせない考え方、仮説検定の基本的な考え方、どういった場面でt分布が登場し、それをt検定に用いるかなどボリューム満点の内容でした。

t分布の登場場面

まず、そもそも母集団からデータを全て取ってくることは不可能なので、*不偏性・一致性を満たす標本を抽出しそれを用いてデータ分析を行います。正規分布に従うデータを用いたいわけですが、正規分布ってそもそも母分散がわからないと使えなかったんですよね。その点t分布は正規分布に近似しているけれども母分散ではなく標本分散と標本平均がわかれば使えて、なおかつデータ数が増えてくると大数の法則に従って、正規分布に近似できるので、ありがたい。

まず、全ての数値を標準化します。標準化する際の式には分母に母分散が含まれています。でもこの母分散は普通わからないことがほとんどです。なので、標本から求められる標本分散を使います。標準化の式に標本分散を使ったものはt検定統計量と呼ばれ、t分布に従います。

ここで不偏性と一致性について。そもそも不偏性とは標本の期待値を取るとそれが母集団の期待値と一致すること(数式による証明あり。)。一致性とは標本サイズを限りなく増やすことにより、母集団パラメータに限りなく近くこと。大数の法則は標本サイズが大きくなると標本平均がどんどん母平均に近づいていくという性質で、中心極限定理は標本サイズが十分に大きければ、標準正規分布に従うという性質。一致性はつまり偏りのないデータ取れてる?ということなのだけど、この一致性が満たされていないといくらデータ集めても、分析しても、それは母集団とかけ離れたものになってしまうので意味がない。

練習問題(実証)の回答

こちらがRで書いたコードです。多分この章まではそもそもRの回答がないので、参考になるかと思います。

シェアする

  • このエントリーをはてなブックマークに追加

フォローする