目次(まとめ)
◾️ 多項分布のパラメータについての尤度比検定とカイ2乗適合度検定
◾️ 2項分布の正規近似が意味することを理解する
◾️ 参考文献
こんにちは、みっちゃんです。
今回の記事では、こちらの記事に引き続き、2013年に行われた統計検定1級の統計数理の問題(問5)を取り上げて、解答を得るための方針について解説します(問題の詳細については、参考文献などをご覧ください)。
この問題では、「2項分布」を一般化した分布である「多項分布」について考えます(多項分布については、こちらの記事をご覧ください)。
多項分布のパラメータについての尤度比検定とカイ2乗適合度検定
この問題では、多項分布に注目し、帰無仮説 \(H_0\) として \(p_1 = p_{10}, p_2 = p_{20}, ..., p_k = p_{k0}\) が与えられているときに、以下のような尤度比検定統計量とカイ2乗適合度検定統計量を導出します(詳細はこちらの記事をご覧ください)。
尤度比検定統計量
$$-2 {\rm log} \Lambda = -2 \sum_{i = 1}^{k} x_i {\rm log} (\frac{np_{i0}}{x_i})\qquad (a)$$
カイ2乗適合度検定統計量
$$Y = \sum_{i = 1}^k \frac{(x_i - np_{i0})^2}{np_{i0}}\qquad (b)$$
これらは、どちらも自由度 \(k-1\) のカイ2乗分布(\(n\) が大きいとき)にしたがいます。
2項分布の正規近似が意味することを理解する
この問題では、パラメータ \(n\) と \(p\) の2項分布にしたがう確率変数 \(X\) を新たに考えています。
2項分布の平均、および、分散は、以下のように得られます(詳細はこちらの記事をご覧ください)。
平均
$$E[X] = np$$
分散
$$V[X] = np(1-p)$$
さらに、帰無仮説 \(H_0\) として \(p= p_0\) が与えられているときに、確率変数 \(X\) の正規近似を考えます。
このことが意味するのは、帰無仮説が正しいという条件下で、確率変数 \(X\) が平均 \(np_0\)、分散 \(np_0(1-p_0)\) の正規分布にしたがうということです。
そこで、標準化変換(平均を引いて標準偏差で割る)を行い、新たな確率変数 \(Z\) を考えます。
$$Z = \frac{X - np_0}{\sqrt{np_0(1-p_0)}}$$
以前の記事で紹介したように、標準正規分布にしたがう確率変数を2乗すると、それが自由度1のカイ2乗分布にしたがうことから、以下の \(Z^2\) は自由度1のカイ2乗分布にしたがいます。
$$Z^2 = \frac{(X - np_0)^2}{np_0(1-p_0)}$$