目次(まとめ)

◾️ ガンマ・ポアソン分布とは、ガンマ分布とポアソン分布からなる階層モデルに対する混合分布

◾️ 混合分布の平均や分散は、条件付き期待値の関係や条件付き分散公式を用いて計算できる

◾️ 参考文献


こんにちは、みっちゃんです。

以前の記事で、複数の確率分布からなる階層モデル、混合分布について紹介しました。

今回の記事では、階層モデルの例として、連続分布の「ガンマ分布」と離散分布の「ポアソン分布」からなる階層モデルを取り上げ、混合分布の平均や分散を求める方法について解説します。

ガンマ・ポアソン分布とは、ガンマ分布とポアソン分布からなる階層モデルに対する混合分布

ガンマ分布は、以下のような確率密度関数で表現される連続分布です(詳細はこちらの記事をご覧ください)。
$$f_X(x | \alpha, \beta) = \frac{1}{\Gamma (\alpha)} \frac{1}{\beta} (\frac{x}{\beta})^{\alpha -1} {\rm exp}\{- \frac{x}{\beta}\}$$
ガンマ分布は、一般に、形状母数 \(\alpha\) と尺度母数 \(\beta\) を使って、\(Ga(\alpha, \beta)\) と表現され、その平均は \(\alpha \beta\)、分散は \(\alpha \beta^2\) となります。

一方、ポアソン分布は、以下のような確率関数で表現される離散分布です(詳細はこちらの記事をご覧ください)。
$$P(X = k | \lambda) = \frac{\lambda^k}{k!} {\rm exp} \{- \lambda\} \qquad (k = 0, 1, 2, …)$$
ポアソン分布は、一般に、強度 \(\lambda\) を使って、\(Po(\lambda)\) と表現され、その平均は \(\lambda\)、分散も \(\lambda\) となります。

ここでは、以下のような階層モデルを考えます。
$$X | Y = y \sim Po (Y) \qquad \qquad (1)$$
$$Y \sim Ga(\alpha, \beta)\qquad \qquad (2)$$
この階層モデルが意味するのは、確率変数 \(Y\) はガンマ分布にしたがい、確率変数 \(Y\) の値 \(y\) は確率変数 \(Y\) を強度とするポアソン分布にしたがうということです。つまり、1つ1つの値 \(y\) はポアソン分布にしたがうけれども、\(Y\) 全体としてはガンマ分布にしたがうというようなイメージです。

この階層モデルに対する確率変数 \(X\) の周辺確率関数は、以下のように与えられます。
$$f_X (x) = \frac{\Gamma (x + \alpha)}{\Gamma (\alpha) x!} \frac{\beta^x}{(1 + \beta)^{x + \alpha}}$$

混合分布の平均や分散は、条件付き期待値の関係や条件付き分散公式を用いて計算できる

混合分布の平均や分散を計算するためには、条件付き期待値の関係や条件付き分散公式を使うことが有効です。

条件付き期待値の関係
$$E[X] = E[E[X|Y]]$$
条件付き分散公式
$${\rm Var}(X) = E[{\rm Var}(X|Y)] + {\rm Var}(E[X|Y])$$
例えば、ガンマ・ポアソン分布について、確率変数 \(X\) の平均(期待値)\(E[X]\) を算出する際には、まず \(E[X|Y]\) を考えます。

(1)式より、\(X|Y\) はポアソン分布 \(Po(Y)\) にしたがうので、その平均 \(E[X|Y]\) は \(Y\) になります。

したがって、\(E[E[X|Y]] = E[Y]\) となり、(2)式よりガンマ分布 \(Ga(\alpha, \beta)\) の平均 \(\alpha \beta\) が確率変数 \(X\) の平均になります。

また、確率変数 \(X\) の分散は、条件付き分散公式より、\(E[Y] + {\rm Var}(Y)\) となり、\(\alpha \beta + \alpha \beta^2\) となります。

参考文献

久保川達也「現代数理統計学の基礎」共立出版

「確率分布」は以下の記事にまとめていきます