目次(まとめ)

◾️ 十分統計量とは母集団の特性を十分に表現する統計量

◾️ ベルヌーイ試行を用いて、十分統計量の考え方を解説

◾️ 参考文献


こんにちは、みっちゃんです。

今回の記事では、「統計量」が「十分統計量」とされる条件などに注目します。

十分統計量とは母集団の特性を十分に表現する統計量

パラメータ \theta をもつ確率分布にしたがう母集団から、ランダムに n 個の標本を取り出す状況を考えます。

ここで、標本は {\bf X} = (X_1, X_2, ..., X_n) と表現します。

この標本を用いると、標本平均 {\overline X} や標本分散 S^2 を計算することができます。

一般に、標本平均や標本分散は「統計量」と呼ばれますが、ここでは、T({\bf X}) と表現します。

いま、パラメータ \theta をもつ確率分布にしたがう母集団 {\bf x} = (x_1, x_2, ..., x_n) について、統計量 T({\bf x}) = t を満たすとき、以下のような条件付き確率を考えます。
P({\bf X} = {\bf x} | T({\bf X}) = t)


つまり、標本から得られる統計量が t であるときに、標本が母集団に一致する確率を考えています。

この条件付き確率が、パラメータ \theta に依存しないとき、統計量 T({\bf X}) が「十分統計量」と呼ばれます。

ベルヌーイ試行を用いて、十分統計量の考え方を解説

標本 {\bf X} = (X_1, X_2, ..., X_n) が互いに独立にパラメータ \theta のベルヌーイ分布にしたがうとします。

ベルヌーイ分布は、"0" か "1" をとるようなベルヌーイ試行の分布であるので、その確率関数は以下のように得られます(ベルヌーイ分布については、こちらの記事をご参照ください)。
P (X = x | \theta) = \theta^x (1 - \theta)^{1 - x}\qquad (x = 0, 1)


ここで、標本 X_1 と標本 X_2 が互いに独立にベルヌーイ分布にしたがうとき、その確率関数は、2つの確率関数の積になるので、以下のように表現できます。
P({\bf X} = {\bf x}) = P(X_1 = x_1) \times P(X_2 = x_2)

これを n 回のベルヌーイ試行で得られた標本 {\bf X} = (X_1, X_2, ..., X_n) に拡張すると、以下のようになります。
\begin{eqnarray}P({\bf X} = {\bf x}) &=& \prod_{i = 1}^n P(X_i = x_i)\\&=&\prod_{i = 1}^n \theta^{x_i} (1 - \theta)^{1 - x_i}\\&=&\theta^{\sum_{i=1}^n x_i} (1 - \theta)^{n - \sum_{i = 1}^n x_i}\end{eqnarray}

また、確率変数 Y を以下のように定義します。
Y = T({\bf X}) = \sum_{i = 1}^n X_i

X_i (i = 1, 2, ..., n) がベルヌーイ試行にしたがうので、X_i = 1 となるX_i を足し合わせていることになり、"1" の数を数えていることになります。

これは、確率変数 Y が2項分布にしたがうことを意味します(2項分布についてはこちらの記事をご参照ください)。

したがって、確率変数 Y の確率関数は、以下のように表現することができます。
P(Y = t) = {}_n \mathrm{C}_t \theta^t (1-\theta)^{n-t}

ここで、Y = T({\bf X}) = t を与えたときの、{\bf X} = {\bf x} の条件付き確率を考えます。
\begin{eqnarray}P({\bf X} = {\bf x} | T({\bf X}) = t) &=& \frac{P({\bf X} = {\bf x} , T({\bf X}) = t)}{P(T({\bf X}) = t)}\\&=&\frac{1}{{}_n \mathrm{C}_t}\end{eqnarray}

得られた結果にはパラメータ \theta を含んでいないことから、統計量 T({\bf X}) が「十分統計量」となります。

参考文献

久保川達也「現代数理統計学の基礎」共立出版