世界是随机的:大数据时代的概率统计学
上QQ阅读APP看书,第一时间看更新

1.3 条件概率:门后的老山羊与豪车

一个囚犯站在法官面前听候判决。法官严肃地说:“我不得不做出最严厉、最残酷的判决,这就是绞刑。这个严酷的刑罚必须执行,不可更改。除此之外,我唯一的决定权是安排你的行刑日期,对此,我一直在两个方案之间犹疑。”

“最简单、最直接的方案是判决即刻生效,马上执行,但这个判决对你太仁慈了,你完全没有感受到惊恐害怕。因此,我现在决定:在下周7天中的某一天,我会在日出时安排执行绞刑。我绝不会提前告诉任何人,我会在哪一天安排绞刑,所以,我保证你不可能事先知道,自己将在哪一天被绞死。每个夜晚,你都将在担惊受怕中入睡,这是对你最大的惩罚。”

法官宣判完后,囚犯绝望了,他转过头去,居然看到他的律师露出了微笑。走出法庭后,律师对囚犯说:“他们不能绞死你了,”他解释道,“按照法官的安排,下周7天中的某一天,他会在日出时分执行绞刑,而且他们保证不会提前让你知道。因此,他们不能在星期六绞死你,因为星期六是一周的最后一天,如果星期五的早晨,你还没有被绞死,你就知道了行刑日期必然是星期六。这与法官的安排是矛盾的,因为他的计划是不让你知道行刑日期。”

“所以,他们最晚只能在星期五绞死你,这一点没问题吧。”囚犯对此表示赞同。“既然星期六已经排除了,星期五就成了可以绞死你的最后一天,按照同样的逻辑,如果你星期四早上还没被绞死,那么你一定会在星期五被绞死,这又与法官的安排矛盾。你明白了吗?依照同样的逻辑,我们还可以排除星期四、星期三,我们可以排除每一天!法官把自己套住了!这个判决不可能执行!”

囚犯心情愉快地度过了星期一,星期二早晨,他从美梦中醒来,然后被押赴刑场,绞死了。

这是一个经典的悖论——意外绞刑悖论,它还有很多种表现形式,比如老师突袭考试、紧急消防演习等。正如律师所言,如果法官严格的执行判决,囚犯将不会被绞死,然而,法官在公布判决结果时已经下定决心:绞刑必须执行,只有在这个前提下,才能体现出悖论的思辨色彩。哲学家迈克尔·斯克里文这样评论意外绞刑悖论:“逻辑的力量遭到事实的否决,我觉得这正是此悖论的迷人之处。可怜的逻辑学家念着过去屡试不爽的咒语,但事实上这个怪物听不懂咒语,执意前行。”

我们用概率论分析一下这个悖论。在法官说到,要在一周7天中的某一天处死囚犯时,囚犯在一周7天的任何一天被执行绞刑的概率都是1/7,而当法官说到,囚犯不会知道绞刑在哪一天执行时,概率发生了变化,周六执行绞刑的概率原本是1/7,此时却降为了0,因为周六执行绞刑违背了“囚犯不知道绞刑在哪一天执行”的条件。一个前提条件,改变了事件发生的概率,这就是——条件概率。

“三门问题”

“三门问题”是一个知名的概率问题,这个问题刚好用到了“条件概率”,我们一起来看看,条件概率是如何帮助参赛者提高获胜机会的。

蒙提霍尔是一个美国电视节目的主持人,他曾主持过一个有趣的游戏节目,叫作“Let's make a deal”。节目中有三扇关闭的大门,其中一扇门的后边是一辆豪车,另外两扇门的后边各藏着一只老山羊。如果参赛者最终选定的门的背后是豪车,参赛者可以开着豪车回家,如果是老山羊,参赛者将空手而归。节目开始后,蒙提霍尔让参赛者从三扇关闭的门中随便挑选一扇,然后,蒙提霍尔会从剩下的两扇门中打开一扇,门后定会出现一只老山羊,因为,蒙提霍尔知道豪车藏在哪扇门的后边。此时,蒙提霍尔会给参赛者一个改选的机会,如果你是参赛者,你会改选另一扇门还是坚持最初的选择?

我猜你此刻在想:蒙提霍尔知道豪车在哪,我可不知道,所以选哪扇门都一样嘛,改或者不改是一样的,非要我决定改还是不改的话,抛硬币好了。

节目中的参赛者也是这么想的,所以他们有的坚持不改,有的摇摆不定之后改选了另一扇门。这个游戏还包含另一层心理层面的因素,如果参赛者不改变自己最初的选择,即使他们没有得到豪车,也会用“坚持自我”来安慰自己,而如果他们改选另一扇门却落了个空,则会懊恼不已,因为他们把到手的豪车拱手送了出去!看起来,不改变自己最初的选择是对的。“不变初衷”“坚持自我”,多么励志的想法!

然而,科学不相信励志。下面,我就来告诉你,为什么“坚持自我”是错误的。

这个问题中的条件有些复杂,为了由浅入深的展开分析,我们对前提条件做一个简化:假设主持人不知道哪扇门后边是豪车,也就是说,在参赛者选择完一扇门后,主持人在剩下的两扇门里随机挑选一扇。此外,为了方便起见,我们把两只老山羊分别记为公山羊和母山羊,很显然,这样不会影响计算结果。

在这样的前提条件下,我们把所有可能的情况列出来,一共有6种可能的情况,即6个随机事件,如表1-1所示。

表1-1 “三门问题”的所有可能情况

现实中,主持人并非随机选择了一扇门,他只会选择公山羊或母山羊面前的那扇门,所以,随机事件B和随机事件D不可能发生!也就是说,当参赛者第一次选择了公山羊或者母山羊时,主持人根本没有选择的余地,他必须选择另一只山羊,留下豪车,这时,参赛者应该改变初衷,选择另一扇门;当参赛者第一次选择了豪车时,主持人一定会留下一只老山羊,这时参赛者不应该改变初衷。

因此,在下面三种情况下,参赛者会获得豪车。

参赛者选择公山羊⇒主持人选择母山羊⇒参赛者改选另一扇门⇒参赛者获得豪车

参赛者选择母山羊⇒主持人选择公山羊⇒参赛者改选另一扇门⇒参赛者获得豪车

参赛者选择豪车⇒主持人选择母山羊或公山羊⇒参赛者不改变选择⇒参赛者获得豪车

这三种情况包含的一个重要信息是:只要知道了参赛者第一次选择的门后是什么,就知道了参赛者是否应该改选另一扇门。下面,我们来计算参赛者第一次选择的三种可能的结果出现的概率。

设定:

随机事件A1:参赛者第一次选择公山羊;

随机事件A2:参赛者第一次选择母山羊;

随机事件A3:参赛者第一次选择豪车。

我们知道,参赛者第一次的选择是完全随机的,因此:

PA1)=PA2)=PA3

并且:

PA1)+PA2)+PA3)=1

因此可以得到:

PA1)=PA2)=PA3)=1/3

只有当随机事件A3发生时,参赛者才应该坚持自己的选择,而随机事件A3发生的概率只有1/3,所以,我们得到的结论是:改选另一扇门,有2/3的可能得到豪车,反之,则只有1/3的可能得到豪车。

重新审视分析过程,我们会发现,这个游戏有趣的一点就在于:在你随机选择一扇门之后,主持人为你去掉了一个错误答案。有了这个前提条件,参赛者获胜的概率提高了,这就是“条件概率”的神奇之处!

条件概率

条件概率,是针对两个或两个以上的随机事件提出的概念,我们设定任意两个随机事件为AB,那么,在A已经发生的前提下,B发生的概率就称为条件概率,记为PB|A)。

概率具有非负性,条件概率是概率的一个类别,因此同样具有非负性,即对于任意随机事件A和随机事件B, PB|A)≥0。

要研究两个随机事件之间的关系,首先要弄清楚,两个随机事件的概率之间可以进行哪些数学运算,下面我们来介绍概率的加减乘除法则。

首先,我们要定义两个概念:

和事件:随机事件AB称为AB的和事件,它表示随机事件A或随机事件B中至少有一个发生;

积事件:随机事件AB称为AB的积事件,它表示随机事件A和随机事件B同时发生。通常地,我们把AB简写为AB

其次,我们来学习概率的加法和乘法。

概率加法:对任意两个随机事件AB,有

PAB)=PA)+PB)-PAB

概率乘法:对任意随机事件B和满足PA)>0的随机事件A,有

PAB)=PB|A)·PA

概率的加法和乘法就是概率论中的四则运算,很多概率问题的计算都需要使用这两种运算,本书后边的内容也会反复使用它们。这里需要说明的是,概率加法和乘法的证明不在本书的讨论范围内,我们把它们当作数学中的四则运算一样使用就可以了。

细心的读者会发现,概率乘法中出现了条件概率PB|A),事实上,概率乘法的另一种表达方式正是条件概率的数学定义。

设随机事件AB,满足PA)>0,则

PB|A)=PAB)/PA

定义为随机事件A发生的前提下随机事件B发生的条件概率。

关于条件概率,我们要讨论的最后一个问题是:对于某个随机事件B和任意随机事件A, PB|A)和PB)之间的大小关系是怎样的?

这个问题会让人在一瞬间产生两种截然相反的想法。有些人在想:已知条件越多,事情发生的概率应该越大,所以PB|A)≥PB);另一些人在想:已知条件越多,对事件发生的限制也越多,事件发生的概率也越小,所以PB|A)≤PB)。

我们用一个生活中的事例来解释一下。

2015年,北京空气质量达标186天,占全年的51%。假定今天是2016年1月1日,如果我让你预测一下3月1日会是雾霾天还是晴天,你会怎么回答?谁都不可能提前两个月预测一天的雾霾情况,所以,你只能回答51%,看起来,这跟抛硬币没什么区别。

时光如箭,转眼到了2月29日。假如,今天白天狂风大作,夜幕降临时,风停了,你一定会感到欣慰:“明天肯定是好天气!”又如,今天雾霾压城,直到夜里仍不见好转,你会在睡前默默地给全家人准备好口罩,你知道,明天肯定还是雾霾天。

我们用概率语言重新描述上面的事例。

随机事件B:2016年3月1日,北京城是个雾霾天。

随机事件A1:2016年2月29日,北京白天刮大风,晚上风停了。

随机事件A2:2016年2月29日,北京全天雾霾严重。

根据常识,我们得到了下面的结论:

PB|A1)<PB

PB|A2)>PB

所以说,PB|A)和PB)没有确定不变的大小关系,前提条件对随机事件产生的影响无法预测!