統計学:相関分析をRでやってみる

統計学:相関分析をRでやってみる

相関分析は2(多)変数間の変動パターンを明らかにするものです。相関関係にはpositive, no, negativeの3種類があり、positiveの場合は「xが増えるとyも増える傾向にある」、negativeの場合は「xが増えるとyは減る傾向にある」、noの場合は関係なし、ということがわかります。

統計学:2種類の相関分析

まず正規分布に従う場合には、pearsonの相関分析を行います。一方、正規分布に従わない、いわゆる「ノンパラメトリック」な分布の場合にはspearman, kendallという分析手法を使うことが多いそうです。

統計学:実際にやってみる

まず、やってみる際には散布図を書いてみると大体の関係性がわかって分析がしやすくなります。

続いて、データは正規分布に従っているのか、そうでないかを調べる必要があります。

そして相関係数を調べます。

統計学:変数が増えた場合の相関関係

変数が増えた場合にも同じように相関関係を分析することができます。例えば、データがxとyだけではなく、a,b,c,d…とあった場合、a-b, a-c, a-dなどあらゆる組み合わせの相関関係を知りたいです。その時はこういった形で分析をします。

分析をするとその相関関係の強さを表すテーブルを取得することもできます。

統計学:ノンパラメトリックの場合

正規分布かどうかを確かめた結果、そうでないことがわかったら、冒頭にあるようにspearmanもしくはkendallを使います。spearmanの方が主流です。

シェアする

  • このエントリーをはてなブックマークに追加

フォローする