目次(まとめ)

◾️ 一般的な現象は、複数の確率変数からなる確率分布で表現される

◾️ 同時分布とは、すべての確率変数について、すべてのペアの確率についての分布

◾️ 周辺分布とは、ある確率変数を固定して得られる、すべてのペアの確率を足した確率についての分布

◾️ 参考文献


こんにちは、みっちゃんです。

今回の記事では、1個のデータに注目した1変量確率分布(正規分布、2項分布、など)を、複数のデータについて考える多変量確率分布について「同時分布」「周辺分布」について解説します。

一般的な現象は、複数の確率変数からなる確率分布で表現される

例えば、1〜6の目をもつサイコロを転がして出た目を確率変数とすることを考えます。

ここで、サイコロを転がすという試行を行って得られる事象を \(X\) とし、例えば、1の目が出る確率 \(P (X = 1)\) を \(f_X(1)\) と表記します。

\(X \in \{1, 2, 3, 4, 5, 6\}\) なので、それらの起こる確率を足し合わせると1になります。

次に、"表" か "裏" がでるコインを投げるという試行を行い、得られる事象 \(Y\) を考えます。

サイコロを転がしたときに得られる事象 \(X\) と同時に考えると、以下のようになります。

つまり、6通りのサイコロの目と、2通りのコインの表裏、について考えると、6×2 = 12通りの場合があり、それぞれが起こる確率が得られるということです。

このように複数の確率変数についてその分布を考えるのが「多変量確率分布」です。

同時分布とは、すべての確率変数について、すべてのペアの確率についての分布

ここでは、上で考えた表を、より一般的な形に書き換えて説明します。

また、確率変数 \(X\) と確率変数 \(Y\) が取る値の組合せの集合を \(C\) とします。

このとき、以下のような関係が成り立つとき、\(f_{X,Y} (x, y)\) を同時確率関数と呼び、同時分布を示しています。
$$P((X, Y) \in C) = \sum_{(X, Y) \in C} f_{X,Y} (x, y) = 1$$

表で示すように、12通りのすべての確率を足し合わせると1になるということに対応しています。

また、連続型確率変数についても同様に、以下のような関係が成り立つとき、\(f_{X,Y} (x, y)\) を同時確率密度関数と呼びます。
$$P((X, Y) \in C) = \int \int_{(X, Y) \in C} f_{X,Y} (x, y) dxdy = 1$$

周辺分布とは、ある確率変数を固定して得られる、すべてのペアの確率を足した確率についての分布

周辺分布とは、ある確率変数を何かに固定した時に、他の確率変数から得られる確率を足して得られる分布です。

例えば、表で示すように、確率変数 \(X\) を \(x_1\) に固定した時には、2つの確率 \(f_{X,Y} (x_1, y_1)\) と \(f_{X,Y} (x_1, y_2)\) が得られるので、これらを足し合わせた確率が周辺分布です。

数式で示すと、以下のような関係が成り立ちます。
$$f_X (x) = \sum_{y = 0}^{\infty} f_{X,Y} (x,y)$$
数式から、確率変数 \(Y\) に対して変化する確率だけ足し合わせていることがわかります。

これを、確率変数 \(X\) の周辺確率関数と呼びます。

また、連続型確率変数についても同様に、以下のような関係が成り立つとき、\(f_X (x)\) を周辺確率密度関数と呼びます。
$$f_X (x) = \int_{-\infty}^{\infty} f_{X,Y} (x,y) dy$$
これらの関係は、確率変数 \(Y\) についても同様に考えることができます。

参考文献

久保川達也「現代数理統計学の基礎」共立出版

「確率分布」は以下の記事にまとめていきます