【勉強ログ】ベイズの識別規則について
はじめに
はじめましての方しかいないと思うのではじめまして(強制)。
ユタカタと申します。
本ページは、最近学習を進めている書籍「はじめてのパターン認識」(通称はじパタ本。機械学習コミュニティ内で初学者向けとして認知されている本)の第二章のベイズの識別規則について、学習内容の整理と定着をはかるための自分用勉強ログとなっています。
この分野は素人なので内容に誤りなどがありましたら指摘していただけるとありがたいです(^^)
(注: 自称素人教授とかではないです)
ベイズの識別規則とは?
ベイズの識別規則とは一言で言うと、「ベイズの定理内に現れる事後確率を指標とした識別方法」です。
説明をしやすくするために、以下の図のような状況を考えます。
クラスは実数を要素として持つ集合で、をどちらかのクラスから抽出された観測データとします。また、観測者は観測データがどのクラスから抽出されたデータなのかは分からないものとします。
ここで、クラスの事前確率を、観測データに関する周辺確率を 、観測データが与えられた上でのクラスに関する尤度関数をとしたとき、ベイズの定理は以下の等式で表現される。
※ちなみに、上記等式は同時分布の定義よりすぐに求まる。
上記ベイズの定理を用いて再度説明すると、『ベイズの識別規則とは、ベイズの定理式の左辺が最大となる時のクラス を観測データの所属クラスとして判別する規則』となります。
すなわち、ベイズの識別規則により推定されるクラスは以下の等式を満たすものです。
さらに、上記ベイズの定理中では、は固定値であるため
と式変形できます。
ベイズの識別境界
まず、事後分布に関して以下の等式が成立するを考えます。
また、式は以下の式へと変形することができます。
上記等式を満たすのことをベイズの識別境界と呼び、所属クラスを判別する際の一種の基準となります。
以下、具体例となります。
具体例1)
クラスを『平均、分散の正規分布 から発生する実数の集合』、クラスを『平均、分散の正規分布 から発生する実数の集合』としたとき、
と表現することができます。
さらに、事前確率をそれぞれ
と仮定した時、識別境界は以下の等式を満たすとなります。
実際に、識別境界を図示したグラフは以下のようになります。
上図から、ちょうどのラインで二つの曲線が交わっていることがわかります。このがベイズの識別境界です。(実際に等式(4)にを代入してみても成立することがわかるかと思います。) 識別境界よりも左側()の領域では、観測データはクラスに所属しているものと判別し、 識別境界よりも右側()の領域では、観測データはクラスに所属しているものとして判別されます。