目次(まとめ) 分布収束とは、サンプル数が増えたときに、累積分布関数がある関数に収束することを意味する
中心極限定理は、標本分布が正規分布に近づくことを意味する
参考文献
こんにちは、みっちゃんです。
以前の記事で「確率収束」と「大数の弱法則」を紹介しましたが、今回の記事では、よく似た概念である「分布収束」と「中心極限定理」を解説します。
分布収束とは、サンプル数が増えたときに、累積分布関数がある関数に収束することを意味する
以前の記事において、確率変数の列 X_n (n = 1, 2, ...) が確率変数 X に確率収束するとは、
\lim_{n \to \infty} P(|X_n - X| \geq \epsilon) = 0
と表現されることであると紹介しました。
この式は、X_n と X の差が少しでもある確率は、n が大きくなると0に近づく、ということを意味しています。
同様に、確率変数の列 X_n (n = 1, 2, ...) が確率変数 X に分布収束するとは、
\lim_{n \to \infty} P(X_n \leq x) = P(X \leq x) = F_X(x)
と表現されます。
この式は、X_n が x より小さい確率は、n が大きくなると、X が x より小さい確率を考えるのと同じになる、ということを意味しています。
中心極限定理は、標本分布が正規分布に近づくことを意味する
確率変数 X_1, X_2, ..., X_n について、それぞれが平均 \mu、分散 \sigma^2 の正規分布にしたがうとき、\overline{X} の累積分布関数が正規分布に分布収束することを「中心極限定理」といいます。
さらに、標本平均 \overline{X} を、平均 \mu、分散 \frac{\sigma^2}{n} で標準化した変数について考えると、その累積分布関数は標準正規分布に分布収束します。
\lim_{n \to \infty} P(\frac{\overline{X} - \mu}{\frac{\sigma}{\sqrt{n}}} \leq x) = \int_{- \infty}^{x} \frac{1}{\sqrt{2\pi}} {\rm exp} \{-\frac{y^2}{2}\} dy
この関係は、特性関数を使って証明することができます。参考文献などをご参照ください。
参考文献
久保川達也「現代数理統計学の基礎」共立出版