こんにちは、みっちゃんです。

以前の記事で、ベイズの定理を紹介しました。簡単に振り返ると「ある原因が与えられたときの結果(条件付き確率)」の情報を用いて「ある結果が与えられた(得られた)ときの原因(事後確率)」を探るための重要な定理です。

今回の記事では、ベイズの定理を用いたデータ判別について紹介したいと思います。

目次(まとめ)
- ベイズの定理を用いて、学生さんを配属するクラスを判別する
- ベイズ判別=確率分布を考慮したベイズの定理
- 参考文献

ベイズの定理を用いて、学生さんを配属するクラスを判別する

ここでは、5教科のテストの点数で特徴づけられた、理数科の学生と普通科の学生を考えます。

[普通科]
\(x_1\)さん:\((38, 94, 96, 96, 27)\)
\(x_2\)さん:\((13, 40, 79, 77, 60)\)


[理数科]
\(x_3\)さん:\((69, 59, 23, 53, 95)\)
\(x_4\)さん:\((40, 97, 23, 23, 11)\)


いま、先生が、以下のような点数を取った新入生を、理数科にするか、普通科に悩んでいます。

\(x_{新入生}\)さん:\((98, 46, 70, 94, 58)\)・・・・・・・(*)

そこで、\(x_{新入生}\)さんが理数科/普通科に属する事後確率を考えて、確率が高いクラスに入れようと考えます。つまり、(*)の点数を取ったのは、「理数科に属するべき学生さんだから」なのか、もしくは、「普通科に属するべき学生さんだから」なのか、を考えるということです。

ベイズ判別=確率分布を考慮したベイズの定理

冒頭に紹介したように、「ある原因が与えられたときの結果(条件付き確率)」の情報を用いて「ある結果が与えられた(得られた)ときの原因(事後確率)」を探ることがベイズの定理の目的です(以前の記事をご参照ください)。

今回、\(x_{新入生}\)さんが理数科/普通科に属する事後確率を求めたいので、逆に、理数科/普通科に属する見込みの\(x_{新入生}\)さんの存在確率(条件付き確率)を求める必要があります。

使用するデータは、もちろん、いま理数科/普通科にいる学生さんの点数です。ただし、\(x_{新入生}\)さんは、現時点で、理数科にも普通科にも配属されていないので、見込みの配属確率を求める必要があります。

そこで、「確率分布」が登場します。一般には、正規分布を使います。

詳しい数式は、参考文献をご覧ください。

参考文献

小西貞則「多変量解析入門 ー線形から非線形へー」岩波書店