相関係数(correlation coefficient)

2 つの確率変数の間の相関(類似性の度合い)を示す統計学的指標である。単位は無く、-1 から 1 の間の実数値をとり、1 に近いときは2 つの確率変数には正の相関があるといい、-1 に近ければ負の相関があるという。0 に近いときはもとの確率変数の相関は弱い。因みに 1 もしくは -1 となる場合は 2 つの確率変数は線形従属の関係にある。

歴史

1880年代に、フランシスガルトンと同様な方法で、ピアソンによってxとyの共分散Cov(x,y)を標準偏差σx,σyの積で割った値として定義された。線形従属性の尺度である。

相関係数の意味

相関係数を深く理解するには、データ列 (xi,yi),i=1~n に基づいて、yをxで推定する1次式を考えるとよくわかる。

  • 最小二乗法のページに詳しく解説しました。

標本の相関係数と共分散

2 組の数値からなるデータ列 (xi,yi),i=1~n があたえられたとき、相関係数Rは以下のように求められる。共分散をそれぞれの標準偏差で割ったものに等しい。

相関係数 R = Cov(x,Y)/[σ(x)・σ(y)]
但し、
共分散= Cov(X,Y)= E[(x-E(x))(y-E(y)]
分散 =V(x)=σ(x)^2=E[(x-E(x))^2]
soukann2.png

相関係数の例

横軸をx、縦軸をyとして、(xi,yi)をプロットした時、相関係数は、下図のようになる。

corelation.JPG
  • yをy=ax+bで推定した時、全変動(yの分散)の何割が、yの推定値で説明できたかの指標である
  • 相関係数の二乗を決定係数と呼ぶが、これは誤差二乗和と全変動で表わされる。
    R^2= 1 - 推定誤差二乗和/全変動
  • 相関係数が、最大+1、最小-1の場合は直線上に位置する。
  • 相関係数が0となるのは、水平に位置する場合、円板状に位置する場合などいろいろある。
    • 系列相関がある場合、例えば y=sinx の場合も相関係数は0となる。 全変動の内、何割が予測されたかを表わす指標である

添付ファイル: filecorelation.JPG 408件 [詳細] filesoukann2.png 352件 [詳細]

トップ   差分 バックアップ リロード   一覧 単語検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2010-05-30 (日) 07:58:00 (3454d)