目次(まとめ)
◾️ 離散型確率変数の期待値は「和」で表現される
◾️ 連続型確率変数の期待値は「積分」で表現される
◾️ 確率分布の平均や分散は、期待値を使って表現できる
◾️ 参考文献
こんにちは、みっちゃんです。
今回の記事では「確率の分野での "期待値" の意味合いがよくわからない」という方向けに、期待値の定義から、それを用いた平均や分散の算出法まで解説します。
離散型確率変数の期待値は「和」で表現される
離散型確率変数\(X\)の関数を\(g(X)\)とするとき、その期待値は、
$$E[g(X)] = \sum_{x_i \in \chi}^{} g(x_i)f_X(x_i)$$
と表されます。ここで、\(f_X(x_i)\)は確率関数と呼ばれる関数で、
$$f_X(x_i) = P(X = x_i)$$
と表現されます。
連続型確率変数の期待値は「積分」で表現される
連続型確率変数\(X\)の関数を\(g(X)\)とするとき、その期待値は、
$$E[g(X)] = \int_{-\infty}^{\infty} g(x)f_X(x) dx$$
と表されます。ここで、\(f_X(x)\)は確率密度関数と呼ばれる関数で、(累積)分布関数\(F_X(x)\)を微分することで得られます。
$$f_X(x) = \frac{d}{dx} F_X(x)$$
ここで、\(F_X(x)=P(X \leq x)\)であり、連続型確率変数\(X\)が\(x\)(すべての実数)以下の値をとる確率です。
つまり、(累積)分布関数の値が大きくなるところで、確率密度関数の値は大きくなるということです。
また、離散型確率変数と異なり、連続型確率変数では「確率関数」を定義できないので「確率密度関数」を代用しています。
確率分布の平均や分散は、期待値を使って表現できる
「平均」や「分散」は、確率分布の特性を表すための重要な指標です。
これらの指標は、以下のように、期待値\(E[g(X)]\)を用いて定義することができます。
◾️ 平均
平均は、\(g(X) = X\)と置いたときの期待値です。平均は一般に\(\mu\)で表現されるので、\(\mu = E[X]\)となります。
つまり、\(X\)が連続型確率変数である場合、その平均値は、
$$\mu = E[X] = \int_{-\infty}^{\infty} xf_X(x) dx$$
で計算できます。
◾️ 分散
分散は、\(g(X) = (X - E[X])^2\)と置いたときの期待値です。分散は一般に\(\sigma^2\)で表現されるので、\(\sigma^2 = E[(X - E[X])^2] = E[(X - \mu)^2]\)となります。
つまり、\(X\)が連続型確率変数である場合、その分散は、
$$\sigma^2 = E[(X - \mu)^2] = \int_{-\infty}^{\infty} (x - \mu)^2f_X(x) dx$$
で計算できます。ちなみに、標準偏差は\(\sqrt{\sigma^2}\)です。
期待値と確率分布の特性(平均、分散など)との関係が理解できると、確率分布の(密度)関数式からその特性を計算できるようになります。
参考文献
久保川達也「現代数理統計学の基礎」共立出版