目次(まとめ)
◾️ t-分布(自由度 \(m\))の確率密度関数
◾️ t-分布は、サンプル数が増えると標準正規分布に近づく
◾️ t-分布と標準正規分布の関係は、スターリングの公式を使って証明できる
◾️ 参考文献
こんにちは、みっちゃんです。
今回の記事では、正規分布にしたがう母集団に関する分布について有名な「t-分布」が、サンプル数が増えた(無限大)ときに標準正規分布に近づくということについて解説します。
t-分布(自由度 \(m\))の確率密度関数
自由度 \(m\) のt-分布は、以下のように定義される確率変数 \(T\) の分布です(詳細はこちらの記事をご覧ください)。
$$T = \frac{Z}{\sqrt{\frac{U}{m}}}$$
ここで、\(Z\) は標準正規分布(平均:0、分散:1;詳細はこちらの記事)にしたがう確率変数、\(U\) は自由度 \(m\) のカイ2乗分布(平均:\(m\)、分散:\(2m\)、詳細はこちらの記事)にしたがう、互いに独立な確率変数です。
ここで、自由度 \(m\) は、標本の数 \(n\) から1を引いた数になります。
確率密度関数
$$f_T (t | m) = \frac{\Gamma(\frac{m+1}{2})}{\Gamma(\frac{m}{2})} \frac{1}{\sqrt{\pi m}} (1 + \frac{t^2}{m})^{-\frac{m+1}{2}}$$
t-分布は、サンプル数が増えると標準正規分布に近づく
t-分布は、サンプル数が増えると正規分布、さらに無限に増えると標準正規分布(詳しくはこちらの記事)に近づきます。
$$\lim_{m \to \infty} f_T (t | m) = \frac{1}{\sqrt{2 \pi}} {\rm exp}\{-\frac{t^2}{2}\}$$
この関係は「スターリングの公式」などを使って証明することができます。
t-分布と標準正規分布の関係は、スターリングの公式を使って証明できる
まず、t-分布の確率密度関数について、\(m = 2k\) として表現します。
$$f_T (t | 2k) = \frac{\Gamma(\frac{2k+1}{2})}{\Gamma(k)} \frac{1}{\sqrt{2 \pi k}} (1 + \frac{t^2}{2k})^{-\frac{2k+1}{2}} = \frac{1}{\sqrt{2 \pi}}*A*B\qquad(*)$$
ここで
$$A = \frac{\Gamma(\frac{2k+1}{2})}{\sqrt{k}\Gamma(k)}$$
$$B = (1 + \frac{t^2}{2k})^{-\frac{2k+1}{2}}$$
とします。
スターリングの公式は、\(k\) が大きいとき、ガンマ関数を指数関数で近似するときに使うことができます。
$$\Gamma(k + a) \approx \sqrt{2 \pi} k^{k + a - \frac{1}{2}} {\rm exp} \{-k\}$$
この関係を使うと、\(A\) について、\(k\) の極限は以下のように書きなおすことができます。
$$\lim_{k \to \infty}A = \frac{\sqrt{2 \pi} k^{k} {\rm exp} \{-k\}}{\sqrt{k} \sqrt{2 \pi} k^{k - \frac{1}{2}} {\rm exp} \{-k\}} = \frac{\sqrt{k}}{\sqrt{k}} = 1$$
また、
$$\lim_{k \to \infty} (1 + \frac{a_k}{k})^k = {\rm exp} \{a\}$$
という関係から、\(B\) について、\(k\) の極限は以下のようになります。
$$\lim_{k \to \infty} B = \lim_{k \to \infty} (1 + \frac{t^2}{2k})^{-\frac{2k+1}{2}} = {\rm exp}\{-\frac{t^2}{2}\}$$
したがって、\((*)\) 式について、\(k\) の極限を考えると、標準正規分布の確率密度関数が得られます。
参考文献
久保川達也「現代数理統計学の基礎」共立出版