実践する統計学: Ch5. 確率変数

実践する統計学の5章:確率変数

いつも使っている、計量経済学の第一歩(以下)で確率変数の理解が曖昧なことに気づいたので実践する統計学で再度復習。

こっちは統計学についてです。

確率変数

確率的に値が決まる変数。コイン投げだと、投げる前の段階はまだわからないので、Xは確率変数だけど、投げて表か裏かわかったらそれは実現値と呼ばれる。

離散確率変数→離散確率分布
連続確率変数→連続確率分布

離散確率変数を用いて重要な概念を学ぶが、基本全部連続確率変数の場合にも成立する。

Xの値は確率的に決まるから、実現する値は実際にやってみるまでわからない。だけど、確率分布がわかってさえいれば、平均的に期待される実現値を求められる(分布の中心)。これを期待値と呼ぶ。

期待値:Xのとりうる値xを確率P(x)で加重をつけて足し合わせたもの。

「試行回数が増えるにつれ、平均は期待値に収束する」

共分散と相関係数

共分散とは何か:
xの偏差、(あるxの実現値と期待値Xの差)、yの偏差(あるyの実現値と期待値Yの差)にxとyの同時確率をかけたもの。そして、それを加重平均。

ここでXのみb倍にすると仮定する。すると、計算していく結果、共分散もb倍になってしまう。実際にはXの実現値を倍にしただけであって、xとyの関係性自体は変わらない。(要はxがこれくらい上がったらbはこれくらい上がるという関係性を見たいのに、xの値を大きくしたら、その関係性まで2倍になってしまったということ)。これでは正確に相互関係を測れない。→つまり共分散では関係性のplus minusしか判断することはできない。

相関係数の場合、スケールに依存することがない。例えば先ほどと同じように、Xをb倍すると、分子である、COVはb倍になってしまう。しかし、分母である分散もb^2倍されているので打ち消しあってスケールの影響は消えてくれる。

シェアする

  • このエントリーをはてなブックマークに追加

フォローする