目次(まとめ)
◾️ 正規分布にしたがう確率変数が無相関であるとき、それらは独立である
◾️ 分布を求める問題に対しては、平均と分散を求めることを目指す
◾️ 参考文献
こんにちは、みっちゃんです。
今回の記事では、2013年に行われた統計検定1級の統計数理の問題(問2)を取り上げて、解答を得るための方針について解説します(問題の詳細については、参考文献などをご覧ください)。
この問題では、互いに独立に正規分布 \(N (\mu, \sigma^2)\) にしたがう、確率変数 \(X_1, X_2, ..., X_n\) について考えます。
正規分布にしたがう確率変数が無相関であるとき、それらは独立である
確率変数 \(X\) と \(Y\) が互いに独立であれば、\(X\) と \(Y\) は無相関であり、共分散 \(Cov (X, Y)\) がゼロとなります。
一般に、逆は成り立たず、確率変数 \(X\) と \(Y\) が無相関であっても、\(X\) と \(Y\) が互いに独立であるとは限りません。
しかし、正規分布の場合には「独立であれば無相関」「無相関であれば独立」という関係が成り立ちます。
この問題では、2つの確率変数として、\(Y_n ( = X_1 + X_2 + ... + X_n)\) と \(X_1 - \frac{Y_n}{n}\) を考え、これらが独立かどうかを求めます。
「正規分布にしたがう確率変数の和は正規分布」にしたがうので、これらの確率変数は正規分布にしたがうことになります。
したがって、独立かどうかを調べるために、無相関かどうかを調べればよいということになります。
$$Cov(Y_n, X_1 - \frac{Y_n}{n}) = Cov(Y_n, X_1) - Cov(Y_n, \frac{Y_n}{n})$$
ここで、
$$\begin{eqnarray}Cov(Y_n, X_1) &=& Cov(X_1, X_1) + Cov(X_2, X_1) + ... + Cov(X_n, X_1) \\&=& V[X_1] \\&=& \sigma^2\end{eqnarray}$$
$$Cov(Y_n, \frac{Y_n}{n}) = \frac{1}{n} Cov(Y_n, Y_n) = \frac{V[Y_n]}{n} = \frac{n \sigma^2}{n} = \sigma^2$$
となるので、
$$Cov(Y_n, X_1 - \frac{Y_n}{n}) = 0$$
となり、これらの確率変数は、無相関、かつ、独立、であるとわかります。
分布を求める問題に対しては、平均と分散を求めることを目指す
この問題では、\(Y_n = y_n\) を与えたときの、\(X_1\) の条件付き分布を求められています。
このように分布を求める問題に対しては、分布を特徴づける「平均(期待値)」と「分散」を求めることになります。
準備情報として、\(X_1\) と \(Y_n\) の関係を含む、\(X_1 - \frac{Y_n}{n}\) の平均を考えます(\(X_1\) と \(\frac{Y_n}{n}\) は互いに独立)。
$$E[X_1 - \frac{Y_n}{n}] = E[X_1] - E[\frac{Y_n}{n}]$$
ここで、正規分布にしたがう確率変数の平均 \(\frac{Y_n}{n}\) の平均 \(E[\frac{Y_n}{n}]\) は \(\mu\) となります(詳細はこちらの記事をご覧ください)。 もちろん、\(E[X_1]\) も \(\mu\) です。
したがって、\(E[X_1] - E[\frac{Y_n}{n}] = 0\) となります。
この準備情報に基づき、平均(期待値)について考えてみます。
$$E[X_1 | Y_n = y_n] = E[\frac{Y_n}{n} | Y_n = y_n] = \frac{y_n}{n}$$
一方、分散は、以下のように考えます。
\(Y_n = y_n\) という条件下で \(\frac{Y_n}{n}\) は定数となるので、以下の関係が成り立ちます。
$$V[X_1 | Y_n = y_n] = V[X_1 - \frac{Y_n}{n} | Y_n = y_n] = V[X_1 - \frac{Y_n}{n}]$$
ここで注意したいのは、以下のように変換できないということです。
$$V[X_1 - \frac{Y_n}{n}] = V[X_1] + V[\frac{Y_n}{n}] = V[X_1] + \frac{1}{n^2} V[Y_n]$$
なぜなら、\(Y_n\) に \(X_1\) が含まれており、互いに独立ではないからです。
したがって、以下のように変換する必要があります。
$$V[X_1 - \frac{Y_n}{n}] = V[X_1 - \frac{1}{n} X_1- \frac{1}{n} \sum_{k = 2}^{n} X_k] = (1 - \frac{1}{n}) \sigma^2$$
以上のことから、\(Y_n = y_n\) を与えたときの、\(X_1\) の条件付き分布は、平均 \(\frac{y_n}{n}\)、分散 \((1 - \frac{1}{n}) \sigma^2\) の正規分布になります。