統計学:Rで標準偏差・標準誤差・四分位範囲・カイ二乗テストをやってみた

統計学:はじめに

今日はch.3をやっていきます。この章では標準偏差、標準誤差、四分位範囲、カイ二乗テスト、などについて学ぶとともに、それをRstudioを使って描画してみました。

統計学:標準偏差・標準誤差・四分位範囲

標準偏差とは平均からどれくらい離れているかの指標です。データ全体にどれくらいのばらつきがあるかを知ることができます。標準偏差が基本的に標本の問題を論じているのに対し、標準誤差は選んだ標本に大きな偏りがないかを確認する指標です。授業中先生は”how far the sample mean is likely to be from the population mean”と言っていました。つまり、母平均と比べて標本平均がどのくらい離れているか、を見きわめる指標ということですね。四分位範囲は25%, median(中央値),75%のところを区切りにした範囲のことです。

統計学:その他授業中に出てきたターム

nominal variablesは日本語では名義尺度と言います。男女だったり血液型だったり、分類にのみ意味をもつ変数のことです。カイ二乗テストは帰無仮説を「2つの名義尺度に関係性はない」、として、例えば男女の間に食べ物の好みの差が統計的に有意に存在するか、などを判定します。continuous dataとdiscrete dataはそれぞれ連続型データと離散型データです。連続型は例えば身長や体重などのように明確な区切りがないもの、いくらでも小数点を付け加えられるものを言います。離散型は飛び飛びのデータ、例えばサイコロの出る目のように小数点が置けないものです。

統計学:実際にコードを書いてみる1

さて最初はこんな感じです。

統計学:実際にコードを書いてみる2

次はこんな感じ。

統計学:コードを書いてみる3

次はこんな感じ。

統計学:コードを書いてみる4

次はこんな感じ。


統計学:コードを書いてみる5

次はこんな感じ。


統計学:コードを書いてみる6

次はこんな感じ。


統計学:コードを書いてみる7

次はこんな感じ。

統計学:コードを書いてみる8

これで最後。

終わり

ちゃんと見返して復習しようと思います。次章はもう少し難しくなるはずなので楽しみ。

シェアする

  • このエントリーをはてなブックマークに追加

フォローする