パレート分布とは所得の分布を表す分布【変数変換を介して指数分布になる】

目次（まとめ）

◾️ パレート分布の確率密度関数と平均、分散

◾️ パレート分布のパラメータが確率分布に及ぼす効果

◾️ 対数を用いた変数変換により指数分布が得られる

◾️ 参考文献

こんにちは、みっちゃんです。

今回の記事では、所得の分布をモデリングするために提唱された「パレート分布」について解説します。

以前紹介した「パレートの法則」と同様に、イタリア人のパレートさんによって提唱されました。

売上の8割を占めるのは2割の商品【パレートの法則】

パレート分布の確率密度関数と平均、分散

パレート分布は、尺度 $\alpha$ （正の実数）と形状 $\beta$（正の実数）という2つのパラメータをつかって表現され、$x > \alpha$ の領域で定義されます。

ちなみに、上の図で示しているパレート分布の確率密度関数は、以下のようにRで実行することで得られます（$\alpha = 1, \beta = 2$）。

> dpareto <- function(x, alpha, beta){
> 	f <- (beta*alpha^beta)/(x^(beta+1))
> 	return(f)
> }

> curve(dpareto(x, 1, 2), xlab = "x", ylab = "probability density", xlim = c(0, 5), from = 1, to = 5)

パレート分布の確率密度関数、平均、分散は、以下のように得られます。

確率密度関数
$$f_X(x | \alpha, \beta) = \frac{\beta \alpha^\beta}{x^{\beta + 1}}$$
平均
$$E[X] = \frac{\alpha \beta}{\beta - 1}$$
分散
$${\rm Var}(X) = \frac{\alpha^2 \beta}{(\beta - 1)^2 (\beta -2)}$$

パレート分布のパラメータが確率分布に及ぼす効果

パレート分布には、尺度 $\alpha$ と形状 $\beta$ という2つのパラメータがあります。

まず、$\beta = 2$ に固定して $\alpha$ を変化させてみます。

パレート分布の定義より、$\alpha$ の値を変えると、分布の開始点が変わります。さらに、$\alpha$ の値を大きくしていくと、なだらかな分布になることがわかります。

次に、$\alpha = 1$ に固定して、$\beta$ を変化させてみます。

この図から、$\beta$ を大きくしていくと、分布の開始点が上に移動していくことがわかります。

対数を用いた変数変換により指数分布が得られる

ここでは、$Y = {\rm log}X = g(X)$ という変数変換を考えます。

この関係から、$X = {\rm exp}\{Y\} = g^{-1}(Y)$ という関係が得られます。

公式から、$Y$の確率密度関数は次のように与えられます。
$$f_Y(y) = f_X(g^{-1}(y))|\frac{{\rm d}}{{\rm d}y} g^{-1}(y)|$$
したがって、パレート分布の確率密度関数 $f_X(x | \alpha, \beta)$ について、変数変換を行うと、以下のような確率密度関数が得られます。
$$f_Y(y | \alpha, \beta) = \frac{\beta \alpha^\beta}{\{{\rm exp}\{y\}\}^{\beta + 1}} {\rm exp}\{y\} = \frac{\beta \alpha^\beta}{{\rm exp}\{\beta y\}}$$
ここで、$\alpha = {\rm exp} \{\mu\}$、$\beta = \frac{1}{\sigma}$ と置いて変換すると、以下のような確率密度関数が得られます。
$$f_Y(y | \mu, \sigma) = \frac{1}{\sigma} {\rm exp}\{-\frac{y - \mu}{\sigma}\}$$
$\mu = 0$ のときを考えると、$\lambda = \frac{1}{\sigma}$ というパラメータをもつ指数分布になっていることがわかります（指数分布についてはこちらの記事をご覧ください）。

参考文献

久保川達也「現代数理統計学の基礎」共立出版

「確率分布」は以下の記事にまとめていきます

主要な確率分布のまとめ【随時更新中】

月	火	水	木	金	土	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

パレート分布とは所得の分布を表す分布【変数変換を介して指数分布になる】

パレート分布の確率密度関数と平均、分散

パレート分布のパラメータが確率分布に及ぼす効果

対数を用いた変数変換により指数分布が得られる

参考文献

「確率分布」は以下の記事にまとめていきます

お知らせ

まとめ記事

アーカイブ

最近の投稿

カテゴリー

RSSフィード

広告

mi-chan-nel | みっちゃんねる