3by

Burn the Bridge behind you

三つの箱問題の誤解

   

高校数学も分からない輩の戯言ですので華麗にスルーお願いします。

 

A,B,Cの3つの箱のうちの一つに賞金が入っている。それを当てたら賞金が貰える。
あなたはAを選択。
答えを知っている司会者がCの箱を開けて中身が空だと見せる。
そしてあなたに言う「変更してもいいですよ」
さて、あなたはBに変更したほうがいいだろうか?
答えは変更した方がいいということになっている。

端的に言えば、答えを知っている司会者はBに入っているならCしか選ばないからだという。
ここで素朴な疑問がわく。
仮にAに入っているとするなら司会者はBとCどちらを選択しても同じである。
つまり、Cが開けられたからと言ってBに入っているとは限らない。
Bに入っていれば100%Cを開ける。これはBに入っていればという前提条件があってはじめて成り立つ論理である。
Aに賞金が入っている場合でもCを開ける可能性はある。その可能性は50%。
それに比べてBに賞金が入っている場合はCを開ける可能性は100%となる。
ということでBに入っている確率のほうが高いというロジックがこの3つの箱の問題のキモである。
勘違いしてはいけないのはBに入っている確率が100%とは言っていない点である。
Bに賞金が入っているという条件で考えるとCを開ける確率が100%になるというだけである。
この点、この問題に対する解説にあたかもCが開けられたことによりBに入っている確率が高くなるなどというものがあるが、確率自体が高くなるのだろうか?
確かに1/3から1/2にあがるかもしれないが、だからといってAよりもBに入っている確率が高くなるわけではない。
この点、もともとBに入っている確率は3/1だったものが2/1にあがったとも言えるが、それはAにも言えることである。

 

ベイズ推定について

ベイズ推定について勉強しようとアマゾンで検索していたら、本のレビューにこんな記述があった。
図解・ベイズ統計「超」入門 あいまいなデータから未来を予測する技術

論理を考えるときには、時間軸が重要。「叱られなければ勉強しない」の対偶(対偶は常に真)は「勉強すれば叱られる」で、一見おかしい。これは「(現在)勉強しているのは(過去に)叱られたから」と解釈する。

命題が真ならば対偶にしても真になるはずだがおかしい。
そもそも命題が真ではないのではないか?

 

叱られなければ 勉強しない
言い換えると 叱られると 勉強する
これを対偶にすると
勉強しない 叱られない となりやはりおかしい
しかし、よくよく考えると叱られると勉強するということは勉強している時は叱られないのか?というと勉強している時でも叱られている時がある。
それは勉強以外の理由だろう。勿論ここで違う条件を出したらだめではないか?ということでこれは除外しよう。
いずれにしても叱られると勉強はする。
すると勉強しているときは叱られていないことになる。つまり叱られていないならば勉強しているということになる。
この対偶をとる。
勉強しない 叱られる ということで 成立する。
しかし、叱られていないときは常に勉強しているかというと、そんなことはない。
また、勉強をしていないから叱られているのだが、勉強以外の理由で叱られることもあり得る。
他の条件を付加するというよりも様々な理由で叱られることがあり、叱られるその都度勉強をするわけではない。
つまり、やはりこの命題自体が真とは言えないということだろう。

ベイズ推定のロジック

ベイズ推定あるいはそれを公式化したものの考え方は、要するに我々が日頃様々なものについて予測や推測などをしていることを数値化するための道具であると言える。
従って、ベイズの定理を使えばあたかもなんでも推定できるように考えるのは危険だ。
迷惑メールのフィルターにベイズ推定が使われているのは有名だが、迷惑でないものが多数ゴミ箱に入れられていることからもそれは分かる。
要するに事前データによる確率が精度が高ければベイズ推定も当然よく機能する。ベイズ推定が一部もてはやされているのは結局のところ事前データにあまり信頼性がない場合でも使えるからだ。
とは言え、いずれにしろ公式化されていればそのロジック、考え方を様々な場面で応用できるということでもあり、もてはやされるの頷ける。
プログラムやAIなどで使用する場合に重宝するからに他ならず、ベイズ推定だから確度が高くなるというわけではない。
この点を結構見落としがちである。

乗法定理についての誤解

ベイズの定理とは何か。条件付き確率からわかる判別の知恵

例題)サイコロを振って偶数の目が出た場合に、それが4以上の目である確率は?

偶数の出る確率は2/1
4以上の出る確率で間違ってしまう。
偶数が出たなかで4以上だとすると、2/3になる。そして偶数の出る確率2/1と3/2を乗法すると3/1になる。
しかし、既に偶数が出た中でと条件づけて2/3としているのでそれにさらに2/1を乗じてしまうのはおかしいのだ。
また、上記のリンク先での計算では、Aという条件下でBという結果の出る確率を考える場合、Aという条件下でBの出る結果を全体からの確率判断をしている。
全体での4以上であれば4,5,6で1/2となるが、偶数下での4,6であり、それを全体で判断するので1/3となる。これを偶数下で判断すると3/2になる。
結果的には同じだが導出が違う。
1/3を1/2で割るので結果2/3となる。

条件付き確率の勘違い

何が言いたいかというと、Aという条件下で起こった確率とその条件下でBという事象が起こる確率は単に乗法すればいいと思っていたが、同時確率と条件つき確率を混同していたようだ。
同時確率 乗法定理
条件付き確率はAという条件下での発生確率をもとにしてBという結果が発生した場合のその発生確率を言っているので乗法定理ではない。




 - 素朴な疑問