2.1 随机变量:骰子游戏
骰子,俗称色子,是全世界都熟知的赌博道具。骰子的历史可以追溯到古巴比伦、古埃及时期,在中国古代的赌场里,也是赌博道具的不二之选。你可不能小看这小小的骰子,它对概率思想的启蒙做出了不可磨灭的贡献。
文艺复兴时期,意大利学者吉罗拉莫·卡尔达诺曾撰文研究骰子原理:“在下注之前,你需要知道所有可能的结果,然后对比一下输赢的结果各有多少种,再按照这个比例去设置奖金,这样才能确保赌局的公平。”这大概是“概率思想”最早的启蒙,在当时是相当有革命性的思想。其后,著名的物理学家伽利略也对赌博中的数学原理产生了兴趣,并撰写了《骰子的研究》一书,在书中,他开创性的研究了掷多个骰子时可能出现的点数,以及这些点数会在怎样的情况下出现。在那之后,赌博中的数学问题引起了很多学者的思考和讨论,其中包括著名数学家帕斯卡和费马。
我们回到过去,一起来看一看在概率论尚未建立时,聪明人是怎么利用骰子赚钱的。
掷骰子游戏
据资料记载,一个化名莫雷的赌徒曾经靠一个骰子游戏赚了很多钱,游戏的玩法是:连续掷骰子四次,如果出现至少一个六点,则莫雷赢;反之,莫雷输。要弄清楚莫雷为什么总是赢,就要计算一下双方赢的概率。要计算掷四次至少出现一个六点的概率,可以用逆向思维,计算掷四次没有任何一次出现六点的概率,再用1减去算出的概率即可,由于每次掷骰子都是彼此独立的,因此:
P(莫雷赢)=1-P(掷四次没有任何一次出现六点)
=1-P(第一次没出现六点)×P(第二次没出现六点)×
P(第三次没出现六点)×P(第四次没出现六点)
=1-(5/6)×(5/6)×(5/6)×(5/6)
=0.518
相对的,P(莫雷输)=(5/6)×(5/6)×(5/6)×(5/6)=0.482
莫雷赢得赌局的概率总是大于对手,所以莫雷可以靠这个赌局赚到钱,对吗?
不对!因为赌徒赚的可不是概率,是真金白银,我们忘记了赌局上最重要的东西——筹码。在莫雷的赌局中,双方的筹码是对等的,假定为“一两黄金”,也就是说,莫雷和对手各自拿出一两黄金作为筹码,如果出现了六点,莫雷拿走对手的一两黄金,如果没出现六点,莫雷将一两黄金送给对手。如表2-1所示,我们设定了一个关联关系——赌局结果与莫雷赢得的筹码之间的关联,莫雷赢得一两黄金的概率是0.518,莫雷输掉一两黄金的概率是0.482,如果将筹码的单位去掉,便可以表示成“+1”对应的概率是0.518,“-1”对应的概率是0.482。
表2-1 莫雷赌局的结果
在概率论中,莫雷赢得的筹码就是一个随机变量。
随机变量
假设随机试验有若干个可能的结果A1, A2, …, An,如果变量X满足:A1, A2, …, An每一个都对应X的一个数值,那么,X就称为随机变量。
上面的例子中,赌局是随机试验,赌局有两种可能的结果A1:莫雷赢,A2:莫雷输,莫雷赢得的筹码是变量X, A1对应X=+1, A2对应X=-1,所以,X是一个随机变量。也就是说,随机试验的每一个结果都对应X的一个值。
一个随机试验可以包含不止一个随机变量,我们仍以骰子游戏为例。
小红、小黄和小蓝三个小朋友玩骰子游戏,规则是:扔一次骰子,出现一点或二点,小红赢;出现三点或四点,小黄赢;出现五点或六点,小蓝赢。游戏开始时,三个小朋友各自有五块泡泡糖,每局的赌注是一人一块泡泡糖,赌局一直进行到有人输光为止。
骰子的每个点数出现的概率都是1/6,游戏中有三位小朋友,可以设定三个随机变量,分别是:
随机变量X:小红一局赢得的泡泡糖数量;
随机变量Y:小黄一局赢得的泡泡糖数量;
随机变量Z:小蓝一局赢得的泡泡糖数量。
我们把游戏结果和随机变量一一列出,如表2-2所示。
表2-2 骰子游戏的结果与随机变量
离散与连续
有这样一串数字,“1231,1231,345,345,5654,31,5654,31,2510,2510”,你能发现这串数字的奥秘吗?
也许有些读者一眼就看穿了我的把戏,但我还是不想现在就公布答案,我们先来讨论随机变量的两个平行世界——离散和连续。
现在,环顾你的四周,你能看到什么?你的手、这本书、手机、绿植等,这是我们看到的世界——宏观世界,这个世界里的东西总是可以用计数的,比如,你有两只手,你的手上有一本书,你有一部手机,手机里有两张SIM卡,你的绿植又生出了一片新叶。可是,世界并非全部如你所见。你一定记得,多年前的生物课上,当你第一次从显微镜里看到一团蠕动的细胞时,是多么的惊讶和好奇,那仿佛是另一个世界!科学告诉我们,显微镜下的细胞与我们看到的绿叶身处同一个世界,只不过它们太微小了,我们看不到。我们常把肉眼看到的世界称为宏观世界,把那个看不见的世界称为微观世界。
在数学世界里,也有宏观与微观的划分。我们从小学习的四则运算、一元二次方程等都是“宏观世界”的数学语言,直到我们遇上那几个让人抓狂的符号——“∫, Δ, ∂”。从此,我们进入了数学的“微观世界”,那些简单的四则运算在“微观世界”里统统变了模样,它们演化成全新的运算规划——微积分。微微分扩张了概率论的疆域,随机变量不再只是赌徒的筹码,它也可以是时间、温度,于是,随机变量便自然地划分为两类——离散与连续。
离散随机变量,指的是随机变量的取值是有限的或可列无限个。比如,小红一局赢得的泡泡糖数量只有两个可能的取值;又如,一个把所有正整数都刻在上面的骰子,这个骰子掷出的点数可能是任何一个正整数,这就是“可列无限个”的离散随机变量。
连续随机变量,指的是随机变量的取值有无限多个并且不可列出。当我们把时间、温度、空间等无法一一罗列出来的指标作为随机变量的时候,连续随机变量就出现了。
有关离散随机变量和连续随机变量的讨论才刚刚开始,在后续章节中,我们会认识很多常用的随机变量,它们有些是离散的,有些是连续的,但无一例外地都是概率论的重要成员。有关离散和连续的关系,我想了很久,想到了一个比喻:音符与音乐。一首曲子,曲谱只是一个个“离散”的数字,没有规律,没有内涵,但当这曲谱被演奏出来时,“离散”的数字化为“连续”的乐音,这乐音弥散在空中,让你陶醉,而你早已忘却了那一个个分离的音符,这就是“离散”与“连续”的完美结合。
最后,我要告诉你,那一串貌似神秘的数字其实是一首歌的乐谱,歌名是——《两只老虎》。