目次(まとめ)
◾️ ワルド検定とスコア検定の棄却域の定義
◾️ ワルド検定とスコア検定を行うための共通準備
◾️ ワルド検定の棄却域を算出
◾️ スコア検定の棄却域を算出
◾️ 参考文献
こんにちは、みっちゃんです。
今回の記事では、ポアソン分布を例にして、仮説検定法である「ワルド検定」と「スコア検定」の比較をします。
ワルド検定とスコア検定の棄却域の定義
ここでは、以下のような帰無仮説と対立仮説を用いた検定を考えます。
$$H_0:\theta = \theta_0\\H_1:\theta \neq \theta_0$$
「ワルド検定」の棄却域は、以下のように定義されます。
$$R = {{\bf x} \in \chi | \sqrt{n I_1({\hat \theta}_n)}|{\hat \theta}_n - \theta_0| \geq z_{\frac{\alpha}{2}}}$$
ここで、\({\hat \theta}_n\) は \(\theta\) の最尤推定量、\(I_1({\hat \theta}_n)\) は1個のデータに対するフィッシャー統計量です。
(参考記事)
- ワルド検定について:こちら
- 最尤推定量について:こちら
- フィッシャー統計量について:こちら
「スコア検定」の棄却域は、以下のように定義されます。
$$R = {{\bf x} \in \chi | \frac{|S_n(\theta_0, {\bf x})|}{\sqrt{nI_1(\theta_0)}} \geq z_{\frac{\alpha}{2}}}$$
ここで、\(S_n(\theta_0, {\bf x})\) はスコア関数(対数尤度関数をパラメータで1階微分した関数)、\(I_1(\theta_0)\) は1個のデータに対するフィッシャー統計量です。
(参考記事)
- スコア検定について:こちら
- スコア関数について:こちら
- 対数尤度関数について:こちら
- フィッシャー統計量について:こちら
ワルド検定とスコア検定を行うための共通準備
ここでは例として、ポアソン分布に使って解説していきます(ポアソン分布についてはこちらの記事をご参照ください)。
いま、\(n\) 個の標本 \(X_1, X_2, ..., X_n\) が、パラメータ \(\lambda\) のポアソン分布にしたがうとすると、それぞれの確率関数は以下のように表現されます。
$$P(x | \lambda) = \frac{\lambda^x}{x!} {\rm exp}(- \lambda)$$
したがって、尤度関数 \(L(\lambda, {\bf x})\) は、以下のようになります。
$$\begin{eqnarray}L(\lambda, {\bf x}) &=& \prod_{i = 1}^n \frac{\lambda^{x_i}}{x_i!} {\rm exp}(- \lambda)\\&=&\frac{\lambda^{x_1}}{x_1!}{\rm exp}(- \lambda)\frac{\lambda^{x_2}}{x_2!}{\rm exp}(- \lambda)...\frac{\lambda^{x_n}}{x_n!}{\rm exp}(- \lambda)\end{eqnarray}$$
さらに、両辺対数をとることで、対数尤度関数を得ることができます。
$$\begin{eqnarray}l(\lambda, {\bf x}) &=& {\rm log}L(\lambda, {\bf x})\\&=& x_1 {\rm log} \lambda + {\rm log} (\frac{1}{x_1!}) + (-\lambda) + ... + x_n {\rm log} \lambda + {\rm log} (\frac{1}{x_n!}) + (-\lambda)\end{eqnarray}$$
スコア関数は、対数尤度関数をパラメータ \(\lambda\) で1階微分することにより得られることから、以下のようになります。
$$\begin{eqnarray}S_n(\lambda, {\bf x}) &=& \frac{d}{d\lambda} l(\lambda, {\bf x}) \\&=&\frac{x_1 + x_2 + ... + x_n}{\lambda} - n \\&=&\frac{t}{\lambda} - n\end{eqnarray}$$
ここで、\(t = \sum_{i = 1}^n x_i\) です。
また、1個のデータに対するフィッシャー統計量 \(I_1(\lambda)\) は以下のように算出することができます。
$$\begin{eqnarray}I_1(\lambda) &=&-E[\frac{d^2}{d\lambda^2} l(\lambda, x_1)] \\&=&-E[-\frac{x_1}{\lambda^2}]\\&=&\frac{1}{\lambda^2}E[x_1]\\&=&\frac{\lambda}{\lambda^2}\\&=&\frac{1}{\lambda}\end{eqnarray}$$
ワルド検定の棄却域を算出
ワルド検定の棄却域は、以下のように表現されます。
$$R = {{\bf x} \in \chi | \sqrt{n I_1({\hat \theta}_n)}|{\hat \theta}_n - \theta_0| \geq z_{\frac{\alpha}{2}}}$$
まず、尤度方程式 \(S_n(\lambda, {\bf x}) = 0\) を考えると、パラメータ \(\lambda\) の尤度推定量 \({\hat \lambda}\) は以下のようになります。
$${\hat \lambda} = \frac{t}{n}$$
これをワルド検定の棄却域に当てはめると、以下のようになります。
$$\begin{eqnarray}\sqrt{n \frac{n}{t}}|\frac{t}{n} - \lambda_0| &\geq& z_{\frac{\alpha}{2}}\\|\frac{t}{n} - \lambda_0| &\geq& z_{\frac{\alpha}{2}} \frac{\sqrt{t}}{n}\end{eqnarray}$$
ここでは、\(I_1({\hat \lambda}) = \frac{1}{{\hat \lambda}} = \frac{n}{t}\) を使っています。
\(\frac{t}{n} - \lambda_0 > 0\) のとき:
$$\begin{eqnarray}\frac{t}{n} - \lambda_0 &\geq& z_{\frac{\alpha}{2}} \frac{\sqrt{t}}{n}\\\lambda_0 &\leq& \frac{t}{n} - z_{\frac{\alpha}{2}} \frac{\sqrt{t}}{n}\end{eqnarray}$$
\(\frac{t}{n} - \lambda_0 < 0\) のとき:
$$\begin{eqnarray}-\frac{t}{n} + \lambda_0 &\geq& z_{\frac{\alpha}{2}} \frac{\sqrt{t}}{n}\\\lambda_0 &\geq& \frac{t}{n} + z_{\frac{\alpha}{2}} \frac{\sqrt{t}}{n}\end{eqnarray}$$
スコア検定の棄却域を算出
スコア検定の棄却域は、以下のように表現されます。
$$R = {{\bf x} \in \chi | \frac{|S_n(\theta_0, {\bf x})|}{\sqrt{nI_1(\theta_0)}} \geq z_{\frac{\alpha}{2}}}$$
ここでは、式変形を簡単にするため、\(z(0.025) = 1.96 \approx 2\) とおきます。
上で準備した情報を当てはめると、スコア検定の棄却域が得られます。
$$\begin{eqnarray}\frac{|\frac{t}{\lambda_0} - n|}{\sqrt{n\frac{1}{\lambda_0}}} &\geq& 2\\|\frac{t}{\lambda_0} - n|&\geq& 2\sqrt{n\frac{1}{\lambda_0}}\end{eqnarray}$$
\(\frac{t}{\lambda_0} - n > 0\) のとき:
$$\begin{eqnarray}(\lambda_0 - \frac{t+2}{n})^2 &\geq& \frac{4(t + 1)}{n^2}\\\lambda_0 &\geq&\frac{t+2}{n} + \frac{2\sqrt{t + 1}}{n}\end{eqnarray}$$
\(\frac{t}{\lambda_0} - n < 0\) のとき:
$$\begin{eqnarray}(\lambda_0 + \frac{t+2}{n})^2 &\geq& \frac{4(t + 1)}{n^2}\\\lambda_0 &\leq&\frac{t+2}{n} - \frac{2\sqrt{t + 1}}{n}\end{eqnarray}$$
参考文献
- 久保川達也「現代数理統計学の基礎」共立出版
- 日本統計学会「統計検定1級 公式問題集」実務教育出版