目次(まとめ)

◾️ 条件付き確率分布は、ある確率変数の値が与えられたときの他の確率変数が示す分布

◾️ 条件付き確率(密度)関数からなる階層モデルをつかって混合分布を表現する

◾️ 参考文献


こんにちは、みっちゃんです。

今回の記事では、「条件付き確率分布」を紹介し、それをつかって定義される階層モデル、混合分布について解説します。

条件付き確率分布は、ある確率変数の値が与えられたときの他の確率変数が示す分布

条件付き確率分布は、条件付き確率を確率関数(離散型確率変数の場合)や確率密度関数(連続型確率変数の場合)で置き換えることで考えることができます。

まず、条件付き確率とはどのようなものだったかを確認すると、以下のような定義になります。

条件付き確率
2つの事象 \(X\) と \(Y\) があって \(P(X) > 0\) のとき、
$$P(Y | X) = \frac{P(X \cap Y)}{P(X)}$$
を、\(X\) を与えたときの \(Y\) の条件付き確率という。

つまり、\(P(Y)\) は、事象 \(Y\) の確率全体を示していましたが、「事象 \(X\) に対して値が与えられたとき」という条件のもとで事象 \(Y\) の確率を考えています。

同じように、離散型確率変数に対する「条件付き確率関数」や、連続型確率変数に対する「条件付き確率密度関数」を、以下のように定義することができます。

条件付き確率関数(離散型確率変数の場合)
$$f_{Y|X} (y | x) = \frac{f_{X,Y} (x,y)}{f_X (x)}$$
ここで \(f_{X,Y} (x,y)\) は確率変数 \(X\) と \(Y\) の同時確率関数、\(f_X (x)\) は確率変数 \(X\) の周辺確率関数です(詳細はこちらの記事をご参照ください)。

条件付き確率密度関数(連続型確率変数の場合)
$$f_{Y|X} (y | x) = \frac{f_{X,Y} (x,y)}{f_X (x)}$$
ここで \(f_{X,Y} (x,y)\) は確率変数 \(X\) と \(Y\) の同時確率密度関数、\(f_X (x)\) は確率変数 \(X\) の周辺確率密度関数です(詳細はこちらの記事をご参照ください)。

条件付き確率(密度)関数からなる階層モデルをつかって混合分布を表現する

複数の確率変数からなる確率分布 について「階層モデル」というモデルを考えることができます。
$$X | Y = y \sim f_{X|Y} (x | y) \qquad \qquad (1)$$
$$Y \sim f_Y (y)\qquad \qquad (2)$$
(1)式が示すのは、確率変数 \(Y\) がとる \(y\) という値が、\(y\) が与えられたときの \(X\) の条件付き確率関数に従うということです。例えば「あるフルーツ \(y\)」が「あるフルーツの値段の分布 \(f_{X|Y} (x | y)\)」に従うというようなことです。

また(2)式が示すのは、確率変数 \(Y\) が、\(Y\) の周辺確率関数に従うということです。例えば「あるフルーツ」が「あるフルーツの存在確率」に従うというようなことです。

このような階層モデルについて、確率変数 \(X\) の周辺確率関数は、
$$f_X (x) = \sum f_{X | Y} (x | y) f_Y (y)$$
と表現されます。例えば、\(f_X (x)\) は「すべてのフルーツの値段の分布」に相当します。

つまり、例えば、"りんご" と "みかん" があったとき、「りんごの存在確率×りんごの値段の分布」と「みかんの存在確率×みかんの値段の分布」を足し合わせると「りんごとみかんの値段の分布」が得られるということを示しています。

このように得られる分布を混合分布と呼びます。

また、確率密度関数についても、同じように定義することができます。

参考文献

久保川達也「現代数理統計学の基礎」共立出版

「確率分布」は以下の記事にまとめていきます