Ch4-3 Baye’s Theorem ベイズの定理

ベイズの定理はイギリスの牧師・数学者であったトーマス・ベイズが発見したといわれる定理です。
最初にある確率(Prior Probabilities)がすでにあったとします、ベイズの定理はその後新しい情報が加わり、最初の確率Prior Probabilitiesを訂正・更新するときに使われます。
どういうことかというと、
例えば、弁護士になるための司法試験は難関で合格率約26%と言われています。
100人うけても26人しか受からないような難易度と言えます。
とりあえずここでは司法試験の合格率は26%とします。
つまりPrior Probabilityは26%です。
弁護士になるため司法試験を受けるA君とB君がいます。
A君は法学部卒です。
B君は法学部卒ではありません。
果たして二人にとっては司法試験の合格率は26%と同じでしょうか?

ベイズの定理 P(H|E)=P(E|H)*P(H)/P(E)

最初の仮説をH、新しい条件の根拠をEとします。
Hは仮説という意味のHypothesisの頭文字から、Eは根拠・証拠という意味のEvidenceからとられています。
P(H):最初の仮説の確率
P(E):新しい条件の根拠の確率
P(E|H):最初の仮定を条件とした、新しい根拠となる確率
P(H|E)=P(E|H)*P(H)/P(E)というのはベイズの定理によって導き出される修正後の確率です。
司法試験の例でみてみます。
P(H): P(合格)は26%です。逆に合格の反対は不合格しかないのでP(不合格)は74%です。

P(H)の確率 P(合格): 合格の確率

先の例ので司法試験の合格率は26%でした。
つまりPrior Probabilityは26%です。
P(H): P(合格)は26%です。では、不合格の確率はいくつでしょうか?
このように合格かかそうでないか二択となるようなものは、互いに重複するような条件でない・その二択以外のものはないというような関係でありMECE (Mutually Exclusive and Collectively Exhaustive)と言います。
そのような関係であるため、合格の反対は不合格しかないのでP(不合格)は74%です。100%-26%=74%

P(E|H)の確率 P(法学部|合格):合格者の中で法学部卒の確率

ここで合格した人に法学部卒であるか聞いた所60%の人が法学部卒と答えました。
逆に合格した人の中で法学部卒でない人は40%です。100%-60%=40%

次に、不合格になった人にも法学部卒であるか聞いた所30%の人だけが法学部卒と答えました。
不合格した人の中で法学部卒の人は70%です。100%-30%=70%

P(E|H)*P(H)の確率 P(法学部and合格):(試験を受けた人の全体の中で)法学部かつ合格の確率

ここで前回のところで紹介したMultiplication Low of Probability 確率の掛け算の法則をつかって、

  • 合格した人かつ法学部卒である場合
  • 不合格した人かつ法学部卒である場合

の確率を計算してみると。 P(法学部and合格)は15.6%でP(法学部and不合格)は22.2%であることがわかりました。

P(E)の確率P(法学部):(試験を受けた人全体の中で)法学部である確率

他にもP(非法学部and合格)とP(非法学部|不合格)を求めます。そうすると合格不合格に関わらず法学部卒である確率P(E)は15.6%+22.2%で37.8%であることがわかります。

P(H|E)の確率:法学部の人が合格する確率

ここでベイズの定理 P(H|E)=P(E|H)*P(H)/P(E)の登場です。
これまでに数値のわかったP(H)、P(E), P(E|H)をベイズの定理に当てはめるとP(H|E)を求めることができます。

ベイズの定理を使った結果
P(合格|法学部)は41.27%であることがわかりました。

最初の質問の答え

ここで最初の例の問題にもどってみます。
A君は法学部卒です。
B君は法学部卒ではありません。
果たして二人にとっては司法試験の合格率は26%と同じでしょうか?
長くなりましたが答えは、法学部であるなら合格率は41.27%であり。法学部卒の方が合格率が高いと言えることがわかりました。

Baye’s Theorem ベイズの定理の使われ方

ベイズの定理は保険の分野で使われたりします。
例えば、生命保険に入る時に家族に心臓病を患ったことがある人がいるかなど聞かれそれに応じて保険料が変わったりするのもベイズの定理を使い、P(H|E):P(心臓病| 家族に心臓病)を求めた結果、家族に心臓病を患ったことががある人がいる場合のほうが他の人よりも確率が高いからだと言えます。
このようにあるベイズの定理はある条件を追加していくことによりより正確な確率を修正していくことができます。

BASE RATE FALLACY 基準判断の誤謬

Baye’s からもう一つ学べる事は
P(H|E) は P(E|H)でないということです。
法学部だから司法試験に合格することは司法試験に受かったから法学部であるということは全く違うということです。言われて見れば当たり前のことです。
しかし、ときどき議論の場では混合されて話されることがみられます。
「嘘つきは泥棒の始まり」なんてことわざがありますが。
泥棒であるから嘘つきであるのか嘘つきであるから泥棒であるのか、果たしてどちらでしょうか?

Baye’s theorem

Prior Event 1 = A1
Prior Event 2 = A2
Event = B
P(A1|B) = P(A1 and B)/(P(A1 and B) +P(A2 and B))
or
P(A1|B)= P(A1)*P(B|A1)/(P(A1)*P(B|A1)+P(A2)*P(B|A20))
P(A2|B) = P(A2 and B)/(P(A2 and B) +(A1 and B))
or
P(A2|B)= P(A2)*P(B|A1)/(P(A1)*P(B|A1)+P(A2)*P(B|A20))

Leave a Comment

Your email address will not be published. Required fields are marked *

Scroll to Top