1/2なのかそうじゃないのか?

昨日『Marginal Revolution』の『二人の子供問題』の記事和訳があがってきていた。ちょっと問題。

Q1. 僕には年下のきょうだいが2人居る。2人のうち年上の方は弟である。2人とも弟である確率は?
Q2. 僕には年下のきょうだいが2人居る。2人のうち少なくとも一人は弟である。2人とも弟である確率は?
Q3. 僕には年下のきょうだいが2人居る。2人のうち少なくとも一人は弟で、火曜日に生まれた。2人とも弟である確率は?
Q4. 僕には年下のきょうだいが2人居る。2人のうち少なくとも一人は弟で、”じゅげむ”という名前である。2人とも弟である確率は?
※男と女が生まれる確率はそれぞれ1/2、各曜日に生まれる確率はそれぞれ1/7とし、子供が”じゅげむ”という名前である確率は、えー、著しく低いとする。

Q1. 答え:1/2
問題文から考えられる組み合わせは、2人を年の順に書くと
(弟、弟)(弟、妹)の2パターン。
そのうち(弟、弟)である確率なので、1/2。

Q2. 答え:1/3
問題文から考えられる組み合わせは、2人を年の順に書くと
(弟、弟)(弟、妹)(妹、弟)の3パターン。
そのうち(弟、弟)である確率なので、1/3。

Q3. 答え:13/27
問題文から考えられる組み合わせがちょっとめんどくさくなる。
(i)2人のうち上が火曜日産まれの弟で、下が弟
(弟火、弟月)(弟火、弟火)(弟火、弟水)… と7パターン。
(ii)2人のうち上が弟で、下が火曜日産まれの弟
(弟月、弟火)(弟火、弟火)(弟水、弟火)… と7パターン。
(iii)2人のうち上が火曜日産まれの弟で、下が妹
(弟火、妹月)(弟火、妹火)(弟火、妹水)… と7パターン。
(iv)2人のうち上が妹で、下が火曜日産まれの弟
(妹月、弟火)(妹火、弟火)(妹水、弟火)… と7パターン。

(i)から(iv)がこの問題における場合の数だが、2人のうちどちらも火曜日に生まれた弟である場合を2回数えちゃっているので、
全部で考えるべき場合の数は7×4-1=27パターン。
そのうち2人とも弟である確率は、(i)と(ii)であり、
こちらも重複をのぞくと7×2ー1=13パターン。
よって求める確率は、13/27

Q4. 答え:かぎりなく1/2にちかづく
この問題はもともと『Marginal Revolution』で最後に問いかけられていた問題で、ちょっと日本風にアレンジしてみた;

さあここで難題を出そう。ある家庭で2人の子供のうち1人がフロリダという名前の女の子である場合,2人とも女の子である確率はどれだけか。

一見すると,名前を知ることが違いを生むことはありえないように見える。間違いなくさっきと同じように答えは3分の1だ,と思うかい?なんにせよ全ての子供には名前があることだし。しかし名前を知ることは違いを生むのだ。ヒントはフロリダというのが珍しい名前であるということ。

アレックス・タバロック「問題:子供2人のうちどちらも女の子である確率は?」, 経済学101

まあ名前をどうつけるかなんて確率の問題ではないけど、答えを出すために数字で考えてみる。わかりやすくするために、子供に”じゅげむ”と名前をつける確率を0.0000001%としてみる。1億分の1だ。ややこしくなるので男女の名前の違いは考えない(この問題では考えなくてもいい)。

数式で書くのがだるいので、曜日の問題と同じように数え上げ方式で考えてみると、
(i)2人のうち上がじゅげむくんという名の弟で、下が弟
(ii)2人のうち上が弟で、下がじゅげむくんという名の弟
(iii)2人のうち上がじゅげむくんという名の弟で、下が妹
(iv)2人のうち上が妹で、下がじゅげむくんという名の弟

(i)から(iv)がこの問題における場合の数だが、2人のうちどちらもじゅげむくんという名の弟である場合を2回数えちゃっているので、
全部で考えるべき場合の数は1億×4-1=3億9999万9999パターン。
そのうち二人とも弟である確率は、(i)と(ii)であり、
こちらも重複をのぞくと1億×2ー1=1億9999万9999パターン。
よって求める確率は、ほぼ1/2

もともと『2人の子供問題』の答えが1/2なのか1/3なのかの議論はネット上ですごいことになっているのを見たことがあって、今回また似た話を見たので書いてみた。

たとえばこれは微妙な問題文だ;

スミス氏が
「私は二人の子供がいて、少なくとも一人は男の子です。」
と言いました。
もう一人の子も男の子である確率は?
(引用元:http://the-apon.com/coffeedonuts/ambiguousrelatives.html 補足すると、”もう一人”といわれると”その子”個人の性別に言及しているように聞こえる)

結局は問題文がふたりの性別構成についてまとめて言及しているのか、個々それぞれについて言及しているのかでかわってくるわけだ(たとえばQ1の問題文では実質的に”年下の方は男か女か”という問いが示されている)。前者のタイプの問題では確率は1/3で、後者は1/2。これがどっちともとれる問題文だと答えが出なくなる。そして、Q2からQ4の答えが徐々に1/2に近づくように、ふたりの性別の内訳について言及していても、片方の特定の度合いが高くなればなるほど確率が上がってくる。たぶん。自信がなくなってきたので、間違いがあったら教えてください。

こうやって書いていて思ったのは、”言語で思考する”というのは数学みたいな分野と相性が悪いんだろうということだ。それが中高の数学のあのとっつきにくい問題文の言い回しにつながるんだろうし、果ては『モンティ・ホール問題』みたいなやつの原因にさえなったんじゃないだろうか。やっぱり解釈の幅があるっていうのがことばの良さですよね。