ベイジアン研究所

プログラミング言語(アルゴリズム的な話が中心)やガジェットの紹介をしています。時々心理学の話も。

【ベイズ理論入門】ベイズ確率の基本

1. 記事の目的
ベイズ確率論は一言で言うと、「結果がわかっている時にそれを引き起こした原因の確率を求める確率論である」。これはベイズの定理が意味することでもある。本記事では数式による説明なしで原因の確率を求めるとはどう言うことかを解説する。数式による説明は次の記事を参考に。

camelsan.hatenablog.com

2. 問題設定
いま、次のような確率の問題を考えることとする。二つの容器に赤い玉と白い玉がいくつか入っているとする。

f:id:camelsan:20210109084918p:plain
図1 容器の中に玉が入っている

3. 通常の確率論の考え方
ここで通常の確率論と言っているのは、ベイズ確率論ではない中学校の頃から習っている確率論のことを言っている。

2.の問題設定で通常の確率論では、例えば、容器から玉を一つ取り出すとして、赤い玉が取り出される確率はどのくらいか?などを求める。

ここで、容器1と容器2のどちらから取り出されるか、と言う確率は通常の確率論では同じ確率つまりどちらも二分の1と定められる。

4. ベイズ確率論の考え方
果たして、この設定(それぞれの容器から出る確率が二分の一)は正しいのだろうか。例えば赤い玉が取り出されたとすると、容器1の方が赤玉の割合が多いから、容器1から取り出される確率が高いのではないだろうか。

極端なことを言うと、次の図のような容器の形状では、容器1から赤い玉が取り出される確率はかなり小さいのではないだろうか。

f:id:camelsan:20210109090712p:plain
図2 極端な例

そもそもこの場合は容器1と容器2で同じ確率を設定して、話を進めるのがナンセンスな気がする。

実際、ベイズ確率論では、前者のケースでは、容器1から取り出される事後確率が大きくなる。後者では、容器1の方が取り出され難いと言う主観に基づいて話を進めていく。

ベイズ確率論では、赤い球を取り出された確率を求めるのではなく、赤い玉が取り出されたと言う結果に基づき、容器1から取り出された確率と容器2から取り出された確率という原因の確率を求める。これが冒頭で記載した、ベイズ確率とは「結果がわかっている時にそれを引き起こした原因の確率を求める確率論である」の意味するところである。

ベイズ確率論の考える手順としては次の通りである。赤い玉が取り出されたという結果を使って、原因となる容器1と容器2から取り出された確率をそれぞれ求めるとする。

  1. 容器1と容器2から玉が取り出される確率(事前確率という)を設定する。ここにはどちらかが取り出されにくいという主観が入っていても良い(この点も通常の確率論とは大きく異なる点)。

  2. 容器1から取り出されたとして赤い玉が取り出された確率、容器2から取り出されたとして赤い玉が取り出された確率、をそれぞれ求める。

  3. ベイズの定理と呼ばれるものを用いて、赤い玉が取り出されたとき容器1から取り出された確率、赤い玉が取り出されたとき容器2から取り出された確率を求める(事後確率という)。

具体的な計算方法としては、おおよそ1.の結果と2.の結果を掛け合わせて、3.の結果を求める。

5. 参考文献
この記事では主に次の文献を参考にした。直感的な説明から数式を使用した説明まで書かれており大変わかりやすい。