蒙提霍尔问题(The Monty Hall problem)有可能是历史上最富争议的概率问题。问题很简单,但正确答案与人们的直觉完全不同,所以很多人难以接受。不少聪明人不仅自己弄错了,还公开为错误的结果高声辩护。
蒙提·霍尔原本是美国电视游戏节目Let's Make a Deal的主持人,蒙提霍尔问题就是源自该节目中的一个游戏。如果你是参赛者,以下是节目现场的情况。
- 你会看到三扇关闭的门,蒙提会告诉你每扇门后的奖励:其中有一扇门后面是一辆车,而另外两扇门后面则是诸如花生酱或假指甲之类不太值钱的东西。奖品的摆放是随机的。
- 你的目标就是要猜出哪扇门后是汽车。如果猜对,汽车就归你了。
- 我们把你选择的门称为A门,其他两扇门分别是B门和C门。
- 在打开你所选择的A门之前,蒙提往往会打开B门或C门扰乱你的选择。(如果汽车确实是在A门后面,那蒙提随机打开B门或C门都没有问题。)
- 接下来,蒙提会给你一个机会:你是坚持原来的选择,还是选择另一扇未打开的门。
问题是,坚持原来的选择或选择另一扇门,会有什么不同吗?
大部分人凭直觉感觉这没有区别。因为,还剩下两扇门,所以汽车在A门后面的概率是50%。
但这就错了。实际上,坚持选择A门,获胜的机会就只有1/3;而如果选择另一扇门,获胜的机会就是2/3。接下来我会解释原因,但信不信由你。
其中的关键在于要明白,这里有三种可能的情况:汽车可能会在A门后,也可能在B门或C门后面。因为奖品是随机摆放的,所以每种情况的概率都是1/3。
如果坚持选择A门,那么就只有在一开始汽车就在A门后面的情况下才能获胜,获胜的概率是1/3。
但如果选择另一扇没打开的门,那么在B或C后面有车这两种情况下都会获胜,总体的获胜概率就是2/3。
你可能还是不信,没关系,很多人都跟你一样。Paul Erdős的一位朋友跟他解释这种情况时,他回答:“不对,这绝不可能,两者没有区别。”〔1〕
〔1〕参见Hoffman的The Man Who Loved Only Numbers一书的83页。
穷尽各种解释都不能说服他。最终,只能用计算机模拟让他接受这个结果。
239 页:The outcome of hundreds of trials favored switching two to one, and Erdős conceded that he was wrong. But the simulation was no more satisfying than the computer proof of the Four Color Map Theorem. It wasn't the Book proof. It didn't reveal why it was better to switch. Erdős, who found Vázsonyi's explanations lacking, was ready to leave.
240 页:Erdos did not forget the Monty Hall problem. He called Graham and demanded the Book proof. "The key to the Monty Hall problem," Graham said, "is knowing ahead of time that the host is always going to give you the chance to pick another door. That's part of the rules of the game which you have to figure into your thinking." Erdős accepted Graham's explanation.
假设有100扇门而不是只有3扇门,你选择1扇门(门后有汽车的概率为1%),另外99扇门中有汽车的概率为99%。
然后蒙提打开另外99扇门中的98扇(没有汽车的)门,如果你不改变选择,获胜的概率仍为1%,如果改变选择,则有99%的获胜率(因为蒙提知道哪扇门后面有汽车,他才能正确地打开没有汽车的98扇门)。
我写了一个 C# 程序进行计算机模拟,请参见:http://www.ituring.com.cn/article/116820 。
请问有标签的球在A、B盒中的概率分别是多少?答案显而易见:A盒1/3,B盒2/3.
请问分别从A、B盒中取一个球,取到有标签球的概率是多少:A盒=1/3*100%=1/3 B盒 =2/3*50%(二取一)=1/3
请问当从B中排除一个无标签球后,再从A、B中取一个球,取到有标签球的概率是多少?A盒=1/3不变,B盒=2/3*100%=2/3
论证完毕。
这里的逻辑陷阱在于,当主持人排除一个后,会让人误以为,标签是在剩下两个球中平均分配的。然而实际上,标签是在三个球中平均分配的。