目次(まとめ)
◾️ 離散型確率分布の確率関数は尤度関数になる
◾️ 最尤推定値を使って尤度比検定を行う
◾️ 多項分布の期待値を使って、カイ2乗適合度検定を行う
◾️ 参考文献
◾️ 関連記事
こんにちは、みっちゃんです。
今回の記事では、2013年に行われた統計検定1級の統計数理の問題(問5)を取り上げて、解答を得るための方針について解説します(問題の詳細については、参考文献などをご覧ください)。
この問題では、「2項分布」を一般化した分布である「多項分布」について考えます(多項分布については、こちらの記事をご覧ください)。
離散型確率分布の確率関数は尤度関数になる
以前の記事で紹介したように、多項分布の確率関数は以下のように得られます。
確率関数
$$f_{X_1, ..., X_k}(x_1, ..., x_k | n, p_1, ..., p_{k-1}) = \frac{n!}{x_1! ... x_k!} p_1^{x_1} ... p_k^{x_k}$$
この確率関数から、尤度関数は以下のようになります。
尤度関数
$$L(p_1, ..., p_k) = \frac{n!}{x_1! ... x_k!} p_1^{x_1} ... p_k^{x_k}$$
最尤推定値を使って尤度比検定を行う
尤度関数の両辺に対数をとることによって、以下のような対数尤度関数が得られます。
対数尤度関数
$${\rm log}L(p_1, ..., p_k) = {\rm log} \frac{n!}{x_1! ... x_k!} + x_1 {\rm log}p_1 + ... + x_k {\rm log}p_k$$
一般には、以前の記事で紹介したように、それぞれのパラメータの推定量は、対数尤度関数をそれぞれのパラメータで偏微分した式から尤度方程式を設定し、推定することができます。
ただし、多項分布のように、パラメータに対して制約条件がある場合には、ラグランジュの未定乗数法を用いる必要があるので、注意してください(詳しくは、こちらの記事をご覧ください)。
結果的に、パラメータ \(p_i\) の推定値 \({\hat p_i} ~ (i = 1, 2, ..., k)\) は、以下のように得られます。
$${\hat p_i} = \frac{x_i}{n}\qquad (i = 1, 2, ..., k)$$
この問題では、帰無仮説 \(H_0\) として \(p_1 = p_{10}, p_2 = p_{20}, ..., p_k = p_{k0}\) が与えられているときに、尤度比検定統計量を求める必要があります。
以前の記事で紹介したように、尤度比検定統計量は、分子に「帰無仮説に基づくパラメータを用いた尤度関数」、分母に「対立仮説に基づくパラメータを用いた尤度関数」を当てはめて求めることができるので、以下のようになります。
$$\Lambda = \frac{\frac{n!}{x_1! ... x_k!} p_{10}^{x_1} ... p_{k0}^{x_k}}{\frac{n!}{x_1! ... x_k!} (\frac{x_1}{n})^{x_1} ... (\frac{x_k}{n})^{x_k}} = (\frac{np_{10}}{x_1})^{x_1} ... (\frac{np_{k0}}{x_k})^{x_k}$$
両辺対数をとると、
$${\rm log} \Lambda = x_1 {\rm log} (\frac{np_{10}}{x_1}) + ... + x_k {\rm log} (\frac{np_{k0}}{x_k})$$
となり、両辺に (-2) をかけると、
$$-2 {\rm log} \Lambda = -2 \sum_{i = 1}^{k} x_i {\rm log} (\frac{np_{i0}}{x_i})$$
これが、自由度 \(k-1\) のカイ2乗分布(\(n\) が大きいとき)にしたがいます。
多項分布の期待値を使って、カイ2乗適合度検定を行う
以前の記事で紹介したように、多項分布の期待値 \(E[X_i] = np_i~(i = 1, 2, ..., k)\) となります。
帰無仮説 \(H_0\) として \(p_1 = p_{10}, p_2 = p_{20}, ..., p_k = p_{k0}\) が与えられているときには、\(E[X_i] = np_{i0}~(i = 1, 2, ..., k)\) となります。
以前の記事で紹介したように、カイ2乗適合度検定統計量は、分子に「帰無仮説に基づく期待値と実現値の差(の2乗)」、分母に「帰無仮説に基づく期待値」を当てはめて求めることができるので、以下のようになります。
$$Y = \sum_{i = 1}^k \frac{(x_i - np_{i0})^2}{np_{i0}}$$
これが、自由度 \(k-1\) のカイ2乗分布(\(n\) が大きいとき)にしたがいます。