日本語もままならないのに英語とは~数学とは国語の問題であるという意味

      2024/04/02

同時確率と条件付確率の違いを問題文から読み解けない

こんな問題があった図解・ベイズ統計「超」入門 あいまいなデータから未来を予測する技術30P
ジョーカー抜きのトランプがある

① 抜いたカードがハートで、なおかつ絵札である確率
② 抜いたカードがハートであったときに、それが絵札である確率

まずこの文章を読んで、AとB一体何がどう違うのか?(笑)

①は同時確率 52枚 の中からハートの絵札になる確率
②は条件付確率 ハートのときの絵札の確率

だそうである。これでもよく分からない。答えが分からないのではなく計算方法、算出方法が分からない。いや、Bのハートのときに絵札になる確率というのはハートが出た後での絵札の確率なのか、ハートの確率と絵札の確率との関係性が日本語だけからはよくわからない。言い換えると、結局のところ公式のようなものを事前に理解しておかないと日本語だけからは頓珍漢な計算方法をしてしまうことになりかねない。

答えは

① 52分の3
② 13分の3

自分なりに解釈してみる

となっているが、解説が解説になっていないので解釈してみると
解釈A
①の同時確率と言っているのは 全体の中でハートの絵札は3枚になる、ということのようだ。つまり当該対象が全体の中でどれくらい存在しているのか?ということのようである。

解釈B
②の条件付確率と言っているのは、全体の中でハートは13枚で、その中で絵札は3枚になるということのようだ。つまり当該対象が全体の中でどれくらい存在しているかではなく、当該対象が一定の条件下においてどれくらい存在しているかということのようである。

問題文に適用してみる

改めて問題文と照らし合わせてみると分かるが、問題文だけからこの情報を何の事前情報も持ち合わせず(確率の算出法などを知らないとして)、正解は別として日本語として解釈ABのようなことを導出できるか?というと恐らく無理だと思う(笑)もしそれが分かれば答えもでるくらいの簡単な問題だと言える。

理解できる日本語に翻訳してみる

出来るだけわかりやすい日本語として表記するように努力してみよう

ジョーカー抜きで52枚のカードがある。ここからカードを1枚抜いた場合

①抜いたカードがハートで、なおかつ絵札である確率→ ハートの絵札がでる確率
②抜いたカードがハートであったときに、それが絵札である確率→ ハートから絵札がでる確率

条件付確率という日本語の持つイメージだと人によっては様々な捉え方をする恐れがあるが、ここでいう条件付というのは当該対象の中ですでに条件設定されており、そこでも全体の中での確率となっている点である。
その確率の中での確率ということになるが、結局それも全体の中からみての確率になっているからややこしくなっている。

間違った解釈

同じハートの絵札のでる確率なのにその確率が違うのはなぜか?ということでもある。
①の場合はハート+絵札という条件のように見えるがそうではない。単にハートの絵札という1種類とみることができる。※計算方法は別
②の場合はハートの絵札のでる確率ではなく、ハートがまず出る確率、そしてハートが出たとしてそのカードが絵札である確率という二段構えになっているのが決定的な違いである。※計算方法は別
同時確率と条件付確率の一般的な説明
しかし①の同時確率の説明は解釈とはいささか違う。

https://nego.jp/pdf/2022_letter_202202.pdf
同時に起こる確率は、各々の確率の積になる。これ
を「乗法定理」という。例えば、ジョーカーを除くトラ
ンプの山から 1 枚引いた時に、カードがハートかつ絵
札である確率。前述のように、ハートかつ絵札である
確率は 3/52 であるが、これは分解すれば、カードがハ
ートであった時に、絵札であるという条件付き確率、
3/13 とカードがハートである確率、13/52 の積であ

 ハートで絵札(条件付き確率) × ハートの確率
?? なぜそうなるのか?

条件付確率とは

https://www.headboost.jp/conditional-probability/#index_id1
例として次のような場合を考えてみましょう。

事象 A
:糖尿病である
事象 B
:肥満である
積事象 A∩B
:糖尿病であると同時に肥満である
日本では 18.0%
男性が糖尿病なので、P(A)=0.18
とします。そして日本では 33.0%
の男性が肥満ですので、P(B)=0.33
となります。さらに糖尿病であると同時に肥満である確率は P(A∩B)=0.10
とします。

なお重要な点として、事象 A
と B
はお互いに独立ではないので、確率の乗法定理で P(A∩B)=P(A)P(B)
とはならないという点を理解しておきましょう。条件付き確率 P(A|B)
で対象となる、事象 A
と事象 B
は常に従属事象です。

さて、それぞれまとめると以下の通りです。

P(B)=0.33
:肥満である確率
P(A)=0.18
:糖尿病である確率
P(A∩B)=0.10
:肥満であり糖尿病である確率
このように、それぞれの確率がわかっている場合、肥満である人が糖尿病である条件付き確率 P(A|B)
は次の通り求められます。

P(A|B)=P(A∩B)P(B)=0.10 0.33≈0.30
このことから、先進各国が肥満を減らそうとする政策を取るのは合理的であることがわかります。

このように、事象 A
と B
が同時に起こる確率から、事象 B
が起こる確率を割ることで、「B
という条件下において A
という事象が起こる確率」を求めることができます。これが条件付き確率です。

ミスリード~同時確率とは

全体の中での起こる確率という解釈ではなく、ある事象とある事象が同時に起こることを言っている。
混乱していたのはトランプを使うからである。トランプは1組なので1塊と捉えがちであるが、同時確率は何も1塊で成立する話ではなく、なんの関連性もない事象同士でも同時確率は成立する話である。
問題文を改めてみる
抜いたカードがハートで、なおかつ絵札である確率
特に不自然な日本語ではない。しかし、同時確率の算出ロジックからすればハートの絵札が出る確率としなければならない。
本来同時確率は別々の事象が同時に起こる確率である。しかし、本問のトランプの例では1枚抜く。つまり別々の事象ではない。
これがミスリードを誘っているのだ(この問題に言及している人が見当たらないのでこんなことを言っているのは世界広しと言えど私一人しかいないようだが(笑))

条件付確率とは

:肥満であり糖尿病である確率(同時確率)から事象Bを割る=Bという条件下でAが起こる確率=条件付確率

どうやら解釈が間違っていたようである。
解釈A ①の場合はハート+絵札という条件のように見えるがそうではない。単にハートの絵札という1種類とみることができる。 全体でのハート ハートの中での絵札 2段階の確率 =同時確率
解釈B ②の場合はハートの絵札のでる確率ではなく、ハートがまず出る確率、そしてハートが出たとしてそのカードが絵札である確率という二段構えになっているのが決定的な違いである。
まず同時確率があり、それを条件下の確率で割ることによって条件付確率としている ハートかつ絵札=同時確率 ÷ ハートが出る確率

あったときとなおかつ~日本語の難しさ

条件付確率を言い換えると
ある事象とある事象が同時に起きる確率=同時確率を当該条件とされる事象の確率で割る
ということになり、そうするとまずある事象の起きる確率とある事象の起きる確率を知っておかなければならない
これらが同時に起こったとして、ある事象が起こった場合に他方の起こる確率を算出しようとしていると言える
同時に起こった場合が前提としてある

同時確率はまだ日本語としてそのまま受け取る事が可能だが、条件付確率と言われてもその条件付確率という数学上での意味を理解しておかなければならない。当たり前と言えば当たり前か(笑)。それが数学の勉強と言うものだろう。
とは言え、
抜いたカードがハートであったときに、それが絵札である確率
という表現と
抜いたカードがハートで、なおかつ絵札である確率
という表現を人間の行動としてイメージすると実際は同じ行動であることが分かる。同じ行動なのに言い方ひとつでまったく違う結果となる。
「あったときに」
「なおかつ」
で同時確率か条件付確率かは数学を勉強していれば分かって当然なのだろう。しかし、これを日本語で考えたときに何がどう違うのか?というのがこの記事のテーマでもある(笑)
ちなみにグーグル翻訳にかけてみると
Probability that the drawn card is a face card when it is a heart
Probability that the drawn card is a heart and also a face card
英語であっても似たり寄ったりだった(笑)

上記事象への当てはめ

事象B(抜いたカードがハートであったとき)という条件下で事象A(絵札)が出る確率をだすためにはAとBが起こる同時確率を算出しそれを最終的な条件の確率で割ると出る、ということである
が、「② 抜いたカードがハートであったときに、それが絵札である確率」を算出するのになぜ同時確率をハートが出る確率(全体からみてハートがでる確率)でわるのか?ということでもある。
条件付確率はある条件下での確率を言っているわけだからまず全体から当該条件のでる確率を算出し、その確率から最終的な確率が算出されるという考え方自体に間違いはなく、その算出方法が問題であるようだ。

条件付確率のロジック

ハートと絵札の同時確率をハートの出る確率で割ることによって同時確率下における絵札の出る確率を算出する、という考え方なので、言い換えれば条件付確率はAの確率とBの確率が同時に起きる場合にAが起きる確率を出したければBを消す、Bの起きる確率を出したければAを消す。

つまり、条件付確率は同時確率下においてA又はBが起きる確率のことを言っているということになる。
そして、同時確率とは確率Aと確率Bが同時に起こることであり、やはり2段階で確率が起こることではない。
人間の動作で考えるとカードを1枚しか引いていないが、出たカードの判断過程が単にハートの絵札として捉えるのが同時確率で、ハートのうち絵札と捉えるのが条件付確率だと言える。

(笑)

ということで、これは素人が日本語の問題だけを読んでこれだけの事が理解できるわけもないことが分かる。
つまり、数学の問題とは問題文に書いてあることをまず理解しなければならなず、ここでいう理解とは結局のところ当該問題の処理の仕方=解き方というものを理解しておく必要があるという事である。
まったく初見の問題であっても、その問題文の中からこれはどの解き方が適用できるのか?利用できるのか?という事が分からなければならないという事であり、その為にはまず解き方処理の仕方を覚えておく理解しておく必要があるということでもある。
このことはある事件に対してどの法律のどの条文が適用されるとか、判例が適用されるとか、そういったものに通ずる。
常識的な日本語で考えてもそもそも何の意味もない(笑)




 - 海外とか, 素朴な疑問