目次(まとめ)
◾️ 共分散は、確率変数の平均を使って計算する
◾️相関係数を使って、相関の有無を評価する
◾️ 参考文献
こんにちは、みっちゃんです。
今回の記事では、2つの確率分布にしたがう確率変数が、独立でなく何らかの関係があるとき、それらの確率変数の関係をとらえるための「共分散」や「相関係数」について解説します。
共分散は、確率変数の平均を使って計算する
共分散(covariance)は、以下のような公式で計算することができます。
$${\rm Cov}(X, Y) = E[(X - \mu_X)(Y - \mu_Y)]$$
ここで、\(\mu_X\) は確率変数 \(X\) の平均(= \(E[X]\) )、\(\mu_Y\) は確率変数 \(Y\) の平均(= \(E[Y]\) )を意味しています。式を変換していくと、以下のように変換していくことができます。
$${\rm Cov}(X, Y) = E[XY] - \mu_YE[X] - \mu_XE[Y] + E[\mu_X\mu_Y]$$
$$\qquad = E[XY] - E[X]E[Y] - E[X]E[Y] + E[X]E[Y]$$
$$\qquad = E[XY] - E[X]E[Y]$$
ちなみに、確率変数 \(X\) の分散(variance)は、平均 \(E[X]\) を使って、以下のように得ることができるので、共分散と分散の式はよく似ています。
$${\rm Var}(X) = E[X^2] - \{E[X]\}^2$$
例えば、確率変数 \(X\) が標準正規分布(平均:0、分散:1)にしたがい、確率変数 \(Y\) が \(X^2\) で表現されるとき、共分散 \({\rm Cov}(X, Y)\) は以下のように計算することができます。
$${\rm Cov}(X, Y) = E[XY] - E[X]E[Y]$$
$$\qquad = E[XX^2] - E[X]E[X^2] = 0 - 0 = 0$$
となります。
ちなみに、確率変数 \(X\) と \(Y\) からなる \(aX + bY\) の平均と分散は、以下のように共分散を使って表現することができます。
$$E[aX + bY] = aE[X] + bE[Y]$$
$${\rm Var}(aX + bY) = a^2 {\rm Var}(X) + b^2 {\rm Var}(Y) + 2ab{\rm Cov}(X, Y)$$
相関係数を使って、相関の有無を評価する
相関係数(correlation coefficient)は、以下のように計算することができます。
$${\rm Corr}(X, Y) = \frac{{\rm Cov}(X, Y)}{\sqrt{{\rm Var}(X){\rm Var}(Y)}}$$
\({\rm Corr}(X, Y) > 0\) のとき確率変数 \(X\) と \(Y\) は正の相関があり、\({\rm Corr}(X, Y) = 0\) のとき相関なし、\({\rm Corr}(X, Y) < 0\) のとき負の相関があるといいます。
相関係数は、-1から1までの値をとります。
参考文献
久保川達也「現代数理統計学の基礎」共立出版