目次(まとめ)
◾️ ガンマ・ポアソン分布とは、ガンマ分布とポアソン分布からなる階層モデルに対する混合分布
◾️ 混合分布の平均や分散は、条件付き期待値の関係や条件付き分散公式を用いて計算できる
◾️ 参考文献
こんにちは、みっちゃんです。
以前の記事で、複数の確率分布からなる階層モデル、混合分布について紹介しました。
今回の記事では、階層モデルの例として、連続分布の「ガンマ分布」と離散分布の「ポアソン分布」からなる階層モデルを取り上げ、混合分布の平均や分散を求める方法について解説します。
ガンマ・ポアソン分布とは、ガンマ分布とポアソン分布からなる階層モデルに対する混合分布
ガンマ分布は、以下のような確率密度関数で表現される連続分布です(詳細はこちらの記事をご覧ください)。
$$f_X(x | \alpha, \beta) = \frac{1}{\Gamma (\alpha)} \frac{1}{\beta} (\frac{x}{\beta})^{\alpha -1} {\rm exp}\{- \frac{x}{\beta}\}$$
ガンマ分布は、一般に、形状母数 \(\alpha\) と尺度母数 \(\beta\) を使って、\(Ga(\alpha, \beta)\) と表現され、その平均は \(\alpha \beta\)、分散は \(\alpha \beta^2\) となります。
一方、ポアソン分布は、以下のような確率関数で表現される離散分布です(詳細はこちらの記事をご覧ください)。
$$P(X = k | \lambda) = \frac{\lambda^k}{k!} {\rm exp} \{- \lambda\} \qquad (k = 0, 1, 2, …)$$
ポアソン分布は、一般に、強度 \(\lambda\) を使って、\(Po(\lambda)\) と表現され、その平均は \(\lambda\)、分散も \(\lambda\) となります。
ここでは、以下のような階層モデルを考えます。
$$X | Y = y \sim Po (Y) \qquad \qquad (1)$$
$$Y \sim Ga(\alpha, \beta)\qquad \qquad (2)$$
この階層モデルが意味するのは、確率変数 \(Y\) はガンマ分布にしたがい、確率変数 \(Y\) の値 \(y\) は確率変数 \(Y\) を強度とするポアソン分布にしたがうということです。つまり、1つ1つの値 \(y\) はポアソン分布にしたがうけれども、\(Y\) 全体としてはガンマ分布にしたがうというようなイメージです。
この階層モデルに対する確率変数 \(X\) の周辺確率関数は、以下のように与えられます。
$$f_X (x) = \frac{\Gamma (x + \alpha)}{\Gamma (\alpha) x!} \frac{\beta^x}{(1 + \beta)^{x + \alpha}}$$
混合分布の平均や分散は、条件付き期待値の関係や条件付き分散公式を用いて計算できる
混合分布の平均や分散を計算するためには、条件付き期待値の関係や条件付き分散公式を使うことが有効です。
条件付き期待値の関係
$$E[X] = E[E[X|Y]]$$
条件付き分散公式
$${\rm Var}(X) = E[{\rm Var}(X|Y)] + {\rm Var}(E[X|Y])$$
例えば、ガンマ・ポアソン分布について、確率変数 \(X\) の平均(期待値)\(E[X]\) を算出する際には、まず \(E[X|Y]\) を考えます。
(1)式より、\(X|Y\) はポアソン分布 \(Po(Y)\) にしたがうので、その平均 \(E[X|Y]\) は \(Y\) になります。
したがって、\(E[E[X|Y]] = E[Y]\) となり、(2)式よりガンマ分布 \(Ga(\alpha, \beta)\) の平均 \(\alpha \beta\) が確率変数 \(X\) の平均になります。
また、確率変数 \(X\) の分散は、条件付き分散公式より、\(E[Y] + {\rm Var}(Y)\) となり、\(\alpha \beta + \alpha \beta^2\) となります。
参考文献
久保川達也「現代数理統計学の基礎」共立出版