目次(まとめ)

◾️ 分布収束とは、サンプル数が増えたときに、累積分布関数がある関数に収束することを意味する

◾️ 中心極限定理は、標本分布が正規分布に近づくことを意味する

◾️ 参考文献


こんにちは、みっちゃんです。

以前の記事で「確率収束」と「大数の弱法則」を紹介しましたが、今回の記事では、よく似た概念である「分布収束」と「中心極限定理」を解説します。

分布収束とは、サンプル数が増えたときに、累積分布関数がある関数に収束することを意味する

以前の記事において、確率変数の列 \(X_n (n = 1, 2, ...)\) が確率変数 \(X\) に確率収束するとは、
$$\lim_{n \to \infty} P(|X_n - X| \geq \epsilon) = 0$$
と表現されることであると紹介しました。

この式は、\(X_n\) と \(X\) の差が少しでもある確率は、\(n\) が大きくなると0に近づく、ということを意味しています。

同様に、確率変数の列 \(X_n (n = 1, 2, ...)\) が確率変数 \(X\) に分布収束するとは、
$$\lim_{n \to \infty} P(X_n \leq x) = P(X \leq x) = F_X(x)$$
と表現されます。

この式は、\(X_n\) が \(x\) より小さい確率は、\(n\) が大きくなると、\(X\) が \(x\) より小さい確率を考えるのと同じになる、ということを意味しています。

中心極限定理は、標本分布が正規分布に近づくことを意味する

確率変数 \(X_1, X_2, ..., X_n\) について、それぞれが平均 \(\mu\)、分散 \(\sigma^2\) の正規分布にしたがうとき、\(\overline{X}\) の累積分布関数が正規分布に分布収束することを「中心極限定理」といいます。

さらに、標本平均 \(\overline{X}\) を、平均 \(\mu\)、分散 \(\frac{\sigma^2}{n}\) で標準化した変数について考えると、その累積分布関数は標準正規分布に分布収束します。
$$\lim_{n \to \infty} P(\frac{\overline{X} - \mu}{\frac{\sigma}{\sqrt{n}}} \leq x) = \int_{- \infty}^{x} \frac{1}{\sqrt{2\pi}} {\rm exp} \{-\frac{y^2}{2}\} dy$$
この関係は、特性関数を使って証明することができます。参考文献などをご参照ください。

参考文献

久保川達也「現代数理統計学の基礎」共立出版