世界是随机的——大数据时代的概率统计学(txt+pdf+epub+mobi电子书下载)


发布时间:2020-05-16 18:48:18

点击下载

作者:李帅,刘志彬

出版社:清华大学出版社

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

世界是随机的——大数据时代的概率统计学

世界是随机的——大数据时代的概率统计学试读:

前言

凯文·凯利在《失控》中曾提道,当高度互联的低级群体的数量大到一定程度时,群体特征便会涌现出来,这特征是群体中的任何个体都不具备的。比如,大量水滴汇集成河水、海水,便会产生让水滴“感到陌生”的新特征——漩涡和波浪。

2013年8月,谷歌公司提出了一个票房预测模型,该模型仅以单词搜索量为依据,便可以提前一个月预测电影的首周票房,准确度高达94%。更令人惊讶的是,这是一个简单的线性回归模型。谷歌是如何做到的呢?

人类对数据的处理已经进入大数据时代。可是,绝大多数的人,对数据统计等基本常识还在算术常识时代。这是一个科技的时代,相对于十年前和二十年前,全球市值最大最受人尊敬的公司Top10,全部变成了苹果、微软、Google……这些高科技公司,任何普通人都用智能手机,任何人都在享受高科技技术带来的便利。为了更好地工作和生活,我们要了解一下这些高科技技术的常识。笔者在这方面有一些经验,所以特地编写了本书,希望以比较科普和有趣的笔调,让你了解一门新的科学,甚至进入一个新的领域。

大学本科时,我曾上过“概率论”和“数理统计”两门课,虽然完整地学习了概率统计,却只是一知半解。攻读硕士时,我在科研工作中需要用到概率统计,方才无奈地发现,当年所学已完完全全地还给了老师。我只能匆忙地自学了概率统计,勉强能应付科研工作,但心中对概率统计的很多概念仍旧一头雾水。后来,我有幸与我的妻子走到了一起,她大学本科和硕士期间都主修“应用数学”专业,在她的帮助下,我这个概率统计的门外汉终于入门了。

硕士毕业前,我和妻子共同翻译了一部英文科普读物《让你爱上数学的50个游戏》,这本书帮助我进一步巩固了概率统计知识,也让我萌生了写书的念头。毕业后我仍从事科研工作,参与了几个与数据分析有关的项目,发现自己对概率统计的理解仍然不够深刻。于是我一口气阅读了几本概率统计的科普书,比如《深入浅出数据分析》《深入浅出统计学》和《生活中的概率趣事》,终于搞懂了“贝叶斯定理”“假设检验”等概念。看书之余,我在“简书”上写了几篇读书心得。出版社的编辑看到我写的文章,问我是否愿意写一本概率统计的科普书,说实话,能写作一本属于自己的书是我的小小理想,既然机会来了,我怎么会拒绝呢?!

开始写作前,我为自己设定了三个原则。

一是理解而非定义。概率统计的教科书里充满了数学公式,虽然数学公式能对抽象的概念做出精确的定义,但这样的定义太晦涩,难以理解。这是一本写给初学者的书,我想帮助读者理解概念的含义,而非怎么求解某个具体问题。所以,我会用解释性的语言来描述概念,而不是给出标准的定义。这么做风险很大,但我愿意尝试,希望本书可以帮助读者更快速、更深刻地理解概念。

二是引导而非灌输。从小到大,我们都承受了太多的灌输式教育,我很庆幸,自己在灌输式教育下活了下来,但我不希望“灌输”给读者任何东西。所以,我总是以案例作先导,先引起读者的兴趣和思考,然后在解答问题的过程中讲述知识。希望这么做可以为读者减负,让读者更流畅的阅读,在轻松愉快中学到知识。

三是有趣而非无趣。很多人说,“有趣”是对一个人最高的评价。我觉得,对一本书同样如此。图书销售排行榜上,小说永远是主角,因为它们“有趣”。读者喜欢故事,不喜欢说教,这是事实,更是真理。我要努力避开说教式的言辞,把知识融入故事中,在讲解知识的同时,带给读者阅读的乐趣。

写作时,我尽量坚持这三个原则,虽然期间有过挣扎和迷茫,但最终还是完成了这本书。

本书共有9章,第1章和第2章介绍概率和随机变量的基础知识;第3章和第4章介绍统计和分布的基础知识;第5章是专门介绍赌博中的概率统计的一章,前4章的知识在这里得到了应用;第6、7、8章分别介绍了概率统计的三个重要方法——假设检验、贝叶斯定理和线性回归;第9章是漫谈概率统计。

我的阅读建议是:第1、2章合并阅读,第3、4章合并阅读,在前4章阅读完成后,再阅读第5、6、7、8、9章,后5章各自独立,不需要按顺序阅读。

本书由李帅主笔编写,同时参与编写的还有黄维、金宝花、李阳、程斌、胡亚丽、焦帅伟、马新原、能永霞、王雅琼、于健、周洋、谢国瑞、朱珊珊、李亚杰、王小龙、张彦梅、李楠、黄丹华、夏军芳、武浩然、武晓兰、张宇微、毛春艳、张敏敏、吕梦琪等作者。在此一并感谢。

这是我的第一本书,其中难免出现错误,希望读者理解包涵,也欢迎读者批评指正。

如果你读过本书,想与我沟通,欢迎通过E-mail联系我:lishuaibeijing@ 163.com。

最后,我要感谢我的家人和朋友。感谢我的父母,陪伴我成长,帮助我养成了读书和写作的习惯。感谢我的妻子,一直理解我、陪伴我,并给我讲解了一些晦涩的数学概念。感谢刘子冲、王充山、秦培根、刘翼、孙淼、赵玮琪等老朋友,你们的支持和鼓励是我坚持写作的动力!编者第1章概率

导语:我们生活的世界,是确定的还是不确定的?自古至今,人们一直试图回答这个哲学命题。一方面我们确信,苹果熟透后会从树上掉下来;另一方面我们又无法确信,抛起的硬币落到地上时,哪一面会朝上。1.1生还是死:这是一个概率问题

2012年7月21日,北京大雨倾盆,事后这一天被称为“北京7·21特大暴雨”。下午两点,我接到父亲的电话,要我赶快回东北老家。家中病危的爷爷快挺不住了。

我抓起外套出了门,冒着大雨疯狂地跑进地铁,奔向北京站。

第二天傍晚五点半,我下了火车,直奔医院。病床前,我看到瘦骨嶙峋的爷爷蜷缩在那里,已经没了意识,奄奄一息。八点整,爷爷血压骤降,医生对父亲点了点头,时辰到了。我终究没能和爷爷说上最后一句话。

后来,我常会梦到爷爷。在梦中,爷爷坐在青绿色的老式沙发上,戴着折叠式老花镜,饶有兴致地看《城市晚报》。我似乎记得爷爷已经去世了,但又分明看到爷爷就坐在那里。那一刻,梦中的那一刻,我真的分不清爷爷是生还是死。

生死与有无、对错一样,都是鲜明对立的东西,它们看似是两条平行的直线,永不相交。然而,梦中的我却分不清爷爷是生还是死。生与死真的永无相交的可能吗?鹰溪桥上的法克尔

下面是美国小说家安布鲁斯·布尔斯的小说《鹰溪桥上》的片段节选,故事发生在美国南北战争期间,讲述的是农场主法克尔被处以绞刑的故事。

亚拉巴马州北部的铁路桥上,一个男人站在那里,俯视着桥下二十米处那湍急的流水。这人的双手被人用绳子绑在身后,一根绳索紧紧地套在他的颈部,绳索的另一端被系在他头顶上方交叉着的架子上,一段绳子松松垮垮地垂在他的膝盖处。铁轨枕木上铺着几块木板,他和要对他行刑的一名中士和两名列兵就站在上面。

那个即将被施以绞刑的男人看起来大约35岁,一副平民的装扮。如果从他的举止行为来看,他像是一位庄园的农场主。他五官端正——鼻子高挺,嘴唇坚毅,额头饱满,长长的黑发顺直地披在脑后,他的眼睛大而乌黑,面目和善,人们很难想象到这人即将被施以绞刑而死。

他索性睁开了眼睛,看到了他身下的流水。“如果我能把双手挣脱,”他心里这样想着,“我就能摆脱颈上的绳索,跳到河里去,然后潜到水下躲避那些子弹,拼命地游到河岸边,钻进那里的森林,就能跑回家了。谢天谢地,我家不在他们的封锁线里,我的妻子和孩子们离他们的先头部队还有些距离。”正当这些想法在犯人脑中闪过时,上尉对中士点头示意。中士从那块木板上跨到了一边。

当法克尔从桥上径直地向下坠落时,他已经没有了意识,就像是死了一样。仿佛过了很久,颈部剧烈地挤压所带来的疼痛使他从这种状态中清醒了过来,接着就感到了窒息。他知道那条绳索已经断了,他坠入了河中,那种窒息的感觉没有加剧。他在黑暗中睁开了眼睛,看到了他上方的一道亮光。他的两只手快速的向下拍水,使身体上浮,他感觉自己的脑袋已经浮出了水面,炫目的阳光使得他睁不开眼睛。他看到了那座桥,以及给他施以绞刑的执行者,他们正大喊着用手指向这边,子弹射到水里,离他的头只有几英寸的距离,溅起的水花打在他的脸上。

法克尔猛地向水下潜去,尽量钻到水的深处。法克尔在湍急的流水中奋力地划水,他思维清晰,四肢越发有力,心里想着:“上帝保佑我,保佑我能躲过所有的子弹!”

突然,他感觉自己开始一圈圈地旋转起来,像陀螺一样。水面、河岸、树林,已经离得很远的桥,还有那军事堡垒和那些士兵,都搅到了一起,变得模糊不清。水中的一处漩涡将他卷了起来,没过一会儿,他就被水流抛到了左岸边的一堆砾石上。他喜极而泣,两手抓起泥沙,一把把的往上扬,落到自己身上,喃喃地说着一些祝福的词句。他跃身而起,迅速地往坡上的岸边跑去,钻进了那片树林。

那一天,他都依照着太阳往前走,那片树林太过茂密,像是永无尽头,他到处都找不到一个可以休息的地方,甚至都找不到一条樵夫走过的小道。夜幕降临时,他已经走得精疲力竭,可是一想到他的妻子和孩子们,他又竭力地继续向前走。最后,他终于找到了一条通往他家的路。那条路像城市里的街道那样笔直而宽阔,可却像是无人从此处通行过,路的两边没有田野,也没有房屋。他的眼睛有些肿胀,没法闭眼,口中干渴,舌头也发胀起来,他把舌头伸出口外去接触空气,感受丝丝的凉意。这条没人走过的路上全是草,这些草多么柔软,软得让他没法儿感觉到脚下的路!

他站在自己家门口,所有的一切都和他离开时一模一样。当他推开门,他看到了女人的衣裙在飘动;他的妻子还是那么的清新甜美,正从门廊中走出来迎接他。她走下了台阶,脸上带着不可言喻的笑容,那种气质简直无与伦比!啊,她是多么的美丽!他伸开双臂冲过去……——节选自《鹰溪桥上》

读到这里,我们的心中难免会有一个疑问:法克尔究竟是死了还是逃跑了?

读到法克尔掉入水中,拼命挣扎着爬上岸时,我们相信法克尔真的逃脱了。可是,怪异的树林、无人走过的路、无法感觉脚下的路,又让人心生怀疑:难道这些是法克尔的幻觉?我们希望法克尔成功逃脱,回到家中与妻子团圆,又担心一切都是法克尔的幻觉。法克尔在我们心中仿佛是一个既可能“生”又可能“死”的人!薛定谔的猫

要测试你是否真的了解“量子物理”,只需要问你两个问题。

第一个问题:你知道“薛定谔的猫”吗?(我猜你会点头。)

第二个问题:你知道哥本哈根学派吗?(别皱眉了,赶快承认不知道吧。)

大多数人都知道这只著名的猫,却不知道这只猫到底是怎么来的,没错,这只猫与哥本哈根学派有莫大的关系。

哥本哈根学派于20世纪20年代初期建立,对量子物理的创立和发展做出了很多重要贡献。学派的创始人是著名量子物理学家玻尔,主要成员包括玻恩、海森堡等知名物理学家。薛定谔也是量子物理学界的鼻祖,他提出的“薛定谔方程”为量子力学奠定了坚实的基础,至今折磨着一代又一代的大学工科男。不过,薛定谔并不是哥本哈根学派的成员,这是因为他对哥本哈根学派的理论存在质疑。为了有的放矢地提出自己的质疑,他脑洞大开地想到了一个实验——“薛定谔的猫”。“薛定谔的猫”是一个思想实验,实验的过程是,把一只可怜的雌性小猫关在一个密室里,密室里有食物也有毒药,毒药装在瓶子里,瓶子上有一个锤子,锤子由一个电子开关控制,如果电子开关被触动,锤子就会落下,砸碎瓶子,瓶子里的有毒氰化物会毒死小猫。问题是:小猫到底是活着还是死了?

实验的关键在于,电子开关是否被触动是一个随机发生的事件,发生的概率是50%。这里的50%不是“抛硬币50%出现正面”这么简单,要产生真正的随机事件,需要使用放射性元素。在微观世界里,放射性元素的衰变是宇宙都无法预知的随机事件,一个真正的有50%概率发生的随机事件。控制电子开关的正是放射性元素,如果放射性元素发生衰变,则开关被触动,锤子砸碎毒瓶,小猫必死。

这个问题要分两种情况讨论。

情况一:我们打开密室观察,可以确切地知道小猫是生还是死。如果放射性元素发生了衰变,那么可怜的小猫一定已经中毒身亡;如果没发生衰变,那么可爱的小猫依然活着。

情况二:我们不打开密室,由于放射性元素的衰变完全无法预测,所以小猫既可能生,也可能死,我们只能认为小猫处于“生与死”的叠加状态!

用量子物理的语言来说,当我们没有观察小猫时,小猫是被“概率云”包裹的,生与死两种状态互相叠加,形成了一个“叠加态”,当我们进入密室观察小猫时,“概率云”瞬间塌缩了,于是我们只能观察到某一种状态的小猫。

一只“既生又死”的猫?这明显违背常识。薛定谔把微观世界的叠加状态平行的移植到宏观世界中,以此质疑量子物理的“完备性”,也就是说,量子物理中的“叠加态”在宏观世界中不成立。

量子物理学家玻尔曾说:“谁要是第一次听到量子理论时没有感到困惑,那他一定没听懂。”亲爱的读者朋友,你是听懂了还是没听懂呢?

我们活在当下,感知当下,环顾四周,仿佛一切都是确定无疑的。可是,此时此刻,还有很多人、很多事是你感知不到的,对你而言,它们是“不确定的”。鹰溪桥上的法克尔和薛定谔的猫到底是生还是死?这不再是一个非此即彼的问题,在谜底揭开之前,它们既可能生,也可能死,这是一个概率问题,专门研究概率问题的学科就是——概率论。

最后,我要公布《鹰溪桥上》的结局了。

他伸开双臂冲过去,正要和那美丽的女人拥抱时,他感觉到自己的颈后遭到了重重的一击,随着一声大炮的轰鸣,他的四周亮起了炫目的白光——接着,一切都陷入了黑暗和静寂。

法克尔死了,他那折断了颈部的尸体正悬在鹰溪桥后面的横木下轻轻地摆动。——节选自《鹰溪桥上》1.2随机事件:翻飞的硬币

我的家乡邻近长白山,那一年,我终于登上了长白山,见到了传说中的天池。站在山顶向下望,天池宛若一面蓝色的魔镜,静如止水,莫过如此。上山之前,很多人说,想看到天池要靠运气,没多一会儿,我就明白了此言不虚。刚刚还晴空万里、阳光普照,转瞬间就是大雾弥漫,我和父亲母亲只能手拉着手站在原地,生怕在白茫茫的雾气中走失。再过一会儿,雾气缓缓消散,正当大家拿出相机要继续拍照时,乌云袭来,风雨大作,我们纷纷披上雨衣,站在寒风中瑟瑟发抖。那是我第一次感到大自然的风云变幻。

自古至今,人们都在试图回答一个哲学命题:我们生活在一个确定的世界还是不确定的世界?我们很确信,苹果熟透了,会从树上掉下来,但我们又不能确定,抛起的硬币落到地上时,哪一面会朝上。对此,哲学领域有两种不同的论断。

决定论:它是指自然界和人类社会普遍存在着客观规律和必然的因果联系,也就是说,如果我们能够发现和理解所有的客观规律和因果联系,自然界和人类社会的任何变化都是可以预知的,我们之所以还做不到,是因为我们对客观规律的认识还不够。

非决定论:与决定论相对,非决定论否认自然界和人类社会普遍存在着客观规律和必然的因果联系,认为事物的发展变化是没有客观规律的,是由事物内在的“自由意志”决定的,也就是说,人们可以自由支配自己的行为,却无法预言客观事物的发展变化和其他人的行为。

我们似乎更容易认同非决定论,毕竟世界如此纷繁复杂,我们只能控制自己,很难预知未来。但我们不能轻易否定决定论,抛开两个论断的对错之争,决定论为我们认识世界提供了新的思路。下面,我们就来做一个“抛硬币”的思想实验。思想实验:抛硬币

抛硬币是大家十分熟悉的小把戏,足球比赛前,裁判会用抛硬币的方式让双方挑边,大家似乎默认抛出的硬币落到手上或地上时,正面和反面朝上的可能性是相同的。但是,决定论的支持者们对此表示怀疑,他们提出了如下的思想实验。实验1.0

假定有一台超高速摄像机和一台超级力学计算器,摄像机自带摇臂,可以跟拍动态画面,并对拍摄到的画面进行实时分析,分辨画面中的物体,提取物体的运动参数,这些参数又被实时的传输到力学计算器,力学计算器可以根据此前的数据计算出物体下一时刻的运动状态。

我们用超高速摄像机对准手上的硬币,然后,抛起硬币!超高速摄像机与硬币一起向上升,又一起向下降,最后,在硬币即将落到手上时,力学计算器输出了计算结果:正面向上。你展开手掌,露出了硬币,果然是正面。

我们在实验中加入了一位超级观察员——由超高速摄像机和超级力学计算器组合而成。只要你不是魔术师,也不刻意作弊,在硬币即将落到手上时,超级观察员一定可以准确地告诉你硬币的哪一面向上。请问:抛硬币的结果是随机的吗?

我的回答依然是:随机的。原因是,硬币在运动过程中,可能受到各种因素的干扰,力学计算器只能做出短时间的预测,所以,超级观察员只能在硬币即将落到手上时,才能计算出硬币哪一面向上,因此,在硬币抛起时,即使是超级观察员也无法预测硬币的哪一面向上。为了反驳这两点,我们将思想实验升级为2.0版。实验2.0

在实验1.0的基础上,我们加入如下条件:一是每次硬币抛掷的周围环境都一样;二是你的手升级为超级机器手,内置力学传感器,你抛起硬币时对硬币施加的力全部会被记录在传感器的芯片中,同时,超级机器手还可以自由设定抛硬币使用的力,也就是说,你可以复现曾经出现过的硬币抛掷过程。再次请问:抛硬币的结果是随机的吗?

这时,我有些语塞了,在这样的条件下,如果我们利用超级机器手重复此前的某一次抛掷,那就意味着,在硬币刚刚抛出时,我们就知道了结果,这时,抛硬币的结果是确定的!如果我们利用这套装置不断进行抛硬币练习,就会收集越来越多的硬币抛掷结果,然后,这只超级机器手就会成为一个开关,它既可以再现过去的抛掷过程,准确预言抛掷结果,也可以进行一次新的抛掷,让结果随机出现。这只超级机器手掌控着一切,仿佛“造物主”一样!

决定论的极限表达是“造物主”,造物主知晓一切,造物主决定一切,造物主预知一切。这种宗教化的解释自然不在我们的讨论范围内,但“决定论”赋予我们一个很有价值的思想:不断探索自然,不断寻找客观规律。试想,在牛顿发现万有引力之前,已有千千万万个苹果落到了地上,难道我们该认为,这些苹果拥有“自由意志”,竟然不约而同地冲向地面吗?这个看似必然发生的事件,正是万有引力定律引起的,对这个确定性事件的解释,让我们对大自然的认识更加深刻,也正是“决定论”指引我们不断探索下去。度量随机事件

我们从思想实验中跳脱出来,回到现实世界。在现实世界中,每时每刻都在发生各种各样的事情,有的事像苹果落地一样,有确凿无疑的结果,而有的事却像抛硬币一样,无法预知结果。数学家们既不是决定论者,也不是非决定论者,他们从数学的角度审视万事万物,概率论由此而来。

抽象地讲,概率论站在无知者和造物主之间审视世界,力图从现实世界中发现客观规律,帮助我们更深刻的认识现实世界。

在概率论的世界里,抛硬币、掷骰子等被统称为随机试验,每一个随机试验都会有一个或多个可能的结果,一个结果或某些结果的组合称为随机事件。

举例来说,抛硬币是一个随机试验,抛硬币可能的结果有两个:正面和反面。我们用一个大写字母来代表随机事件,那么,我们可以得到如下的四个随机事件。

A:抛硬币出现正面

B:抛硬币出现反面

C:抛硬币出现正面或反面

D:抛硬币既不出现正面也不出现反面

随机事件C和随机事件D往往会给初学概率论的人带来困扰,随机事件C根本就不是“随机”事件,分明就是一定会发生的确定性事件,随机事件D正相反,是一定不会发生的事件,自然也不是“随机”事件。概率论是一门完备的科学,它要涵盖所有的事件,而不是只研究那些“随机”事件,为此,我们需要一个度量随机事件的工具——概率。

概率,用于度量随机事件发生的可能性,是个定量指标,用大写字母P来表示。例如,随机事件A发生的概率是50%,可以写成:P(A)=50%

概率有以下两个特性:(1)概率是非负的,即对于任意随机事件A,P(A)≥0;(2)对于任一随机试验,我们假定所有可能的结果有n种(n>12n0),分别记为A,A,…,A,如果这些结果两两之间都不可能同时12n出现,则P(A)+ P(A)+…+P(A)=1。

事实上,在概率论所描述的数学世界中,所有的事件都是随机事件,如果一个事件不可能发生,我们认为它发生的概率是0,如果一个事件必然发生,我们认为它发生的概率是1。下面我们举两个有争议的例子。

随机事件A:公鸡下蛋。

这违背常识,不可能发生,P(A)=0。

随机事件B:人终有一死。

这是个客观事实,必然发生,P(B)=1。

就大多数人的认知,这两个概率是正确的。可是,生物学家或许会质疑这两个概率,甚至罗列一长串的生物新技术来反驳这两个概率。没错,我承认这两个概率可能是错误的,正如崔健唱的那样:“不是我不明白,这世界变化快。”世界在变化,概率也在变化,唯一不变的是:所有的事件都是随机事件。1.3条件概率:门后的老山羊与豪车

一个囚犯站在法官面前听候判决。法官严肃地说:“我不得不做出最严厉、最残酷的判决,这就是绞刑。这个严酷的刑罚必须执行,不可更改。除此之外,我唯一的决定权是安排你的行刑日期,对此,我一直在两个方案之间犹疑。”“最简单、最直接的方案是判决即刻生效,马上执行,但这个判决对你太仁慈了,你完全没有感受到惊恐害怕。因此,我现在决定:在下周7天中的某一天,我会在日出时安排执行绞刑。我绝不会提前告诉任何人,我会在哪一天安排绞刑,所以,我保证你不可能事先知道,自己将在哪一天被绞死。每个夜晚,你都将在担惊受怕中入睡,这是对你最大的惩罚。”

法官宣判完后,囚犯绝望了,他转过头去,居然看到他的律师露出了微笑。走出法庭后,律师对囚犯说:“他们不能绞死你了,”他解释道,“按照法官的安排,下周7天中的某一天,他会在日出时分执行绞刑,而且他们保证不会提前让你知道。因此,他们不能在星期六绞死你,因为星期六是一周的最后一天,如果星期五的早晨,你还没有被绞死,你就知道了行刑日期必然是星期六。这与法官的安排是矛盾的,因为他的计划是不让你知道行刑日期。”“所以,他们最晚只能在星期五绞死你,这一点没问题吧。”囚犯对此表示赞同。“既然星期六已经排除了,星期五就成了可以绞死你的最后一天,按照同样的逻辑,如果你星期四早上还没被绞死,那么你一定会在星期五被绞死,这又与法官的安排矛盾。你明白了吗?依照同样的逻辑,我们还可以排除星期四、星期三,我们可以排除每一天!法官把自己套住了!这个判决不可能执行!”

囚犯心情愉快地度过了星期一,星期二早晨,他从美梦中醒来,然后被押赴刑场,绞死了。

这是一个经典的悖论——意外绞刑悖论,它还有很多种表现形式,比如老师突袭考试、紧急消防演习等。正如律师所言,如果法官严格的执行判决,囚犯将不会被绞死,然而,法官在公布判决结果时已经下定决心:绞刑必须执行,只有在这个前提下,才能体现出悖论的思辨色彩。哲学家迈克尔·斯克里文这样评论意外绞刑悖论:“逻辑的力量遭到事实的否决,我觉得这正是此悖论的迷人之处。可怜的逻辑学家念着过去屡试不爽的咒语,但事实上这个怪物听不懂咒语,执意前行。”

我们用概率论分析一下这个悖论。在法官说到,要在一周7天中的某一天处死囚犯时,囚犯在一周7天的任何一天被执行绞刑的概率都是1/7,而当法官说到,囚犯不会知道绞刑在哪一天执行时,概率发生了变化,周六执行绞刑的概率原本是1/7,此时却降为了0,因为周六执行绞刑违背了“囚犯不知道绞刑在哪一天执行”的条件。一个前提条件,改变了事件发生的概率,这就是——条件概率。“三门问题”“三门问题”是一个知名的概率问题,这个问题刚好用到了“条件概率”,我们一起来看看,条件概率是如何帮助参赛者提高获胜机会的。

蒙提霍尔是一个美国电视节目的主持人,他曾主持过一个有趣的游戏节目,叫作“Let's make a deal”。节目中有三扇关闭的大门,其中一扇门的后边是一辆豪车,另外两扇门的后边各藏着一只老山羊。如果参赛者最终选定的门的背后是豪车,参赛者可以开着豪车回家,如果是老山羊,参赛者将空手而归。节目开始后,蒙提霍尔让参赛者从三扇关闭的门中随便挑选一扇,然后,蒙提霍尔会从剩下的两扇门中打开一扇,门后定会出现一只老山羊,因为,蒙提霍尔知道豪车藏在哪扇门的后边。此时,蒙提霍尔会给参赛者一个改选的机会,如果你是参赛者,你会改选另一扇门还是坚持最初的选择?

我猜你此刻在想:蒙提霍尔知道豪车在哪,我可不知道,所以选哪扇门都一样嘛,改或者不改是一样的,非要我决定改还是不改的话,抛硬币好了。

节目中的参赛者也是这么想的,所以他们有的坚持不改,有的摇摆不定之后改选了另一扇门。这个游戏还包含另一层心理层面的因素,如果参赛者不改变自己最初的选择,即使他们没有得到豪车,也会用“坚持自我”来安慰自己,而如果他们改选另一扇门却落了个空,则会懊恼不已,因为他们把到手的豪车拱手送了出去!看起来,不改变自己最初的选择是对的。“不变初衷”“坚持自我”,多么励志的想法!

然而,科学不相信励志。下面,我就来告诉你,为什么“坚持自我”是错误的。

这个问题中的条件有些复杂,为了由浅入深的展开分析,我们对前提条件做一个简化:假设主持人不知道哪扇门后边是豪车,也就是说,在参赛者选择完一扇门后,主持人在剩下的两扇门里随机挑选一扇。此外,为了方便起见,我们把两只老山羊分别记为公山羊和母山羊,很显然,这样不会影响计算结果。

在这样的前提条件下,我们把所有可能的情况列出来,一共有6种可能的情况,即6个随机事件,如表1-1所示。表1-1 “三门问题”的所有可能情况

现实中,主持人并非随机选择了一扇门,他只会选择公山羊或母山羊面前的那扇门,所以,随机事件B和随机事件D不可能发生!也就是说,当参赛者第一次选择了公山羊或者母山羊时,主持人根本没有选择的余地,他必须选择另一只山羊,留下豪车,这时,参赛者应该改变初衷,选择另一扇门;当参赛者第一次选择了豪车时,主持人一定会留下一只老山羊,这时参赛者不应该改变初衷。

因此,在下面三种情况下,参赛者会获得豪车。

参赛者选择公山羊⇒主持人选择母山羊⇒参赛者改选另一扇门⇒参赛者获得豪车

参赛者选择母山羊⇒主持人选择公山羊⇒参赛者改选另一扇门⇒参赛者获得豪车

参赛者选择豪车⇒主持人选择母山羊或公山羊⇒参赛者不改变选择⇒参赛者获得豪车

这三种情况包含的一个重要信息是:只要知道了参赛者第一次选择的门后是什么,就知道了参赛者是否应该改选另一扇门。下面,我们来计算参赛者第一次选择的三种可能的结果出现的概率。

设定:1

随机事件A:参赛者第一次选择公山羊;2

随机事件A:参赛者第一次选择母山羊;3

随机事件A:参赛者第一次选择豪车。

我们知道,参赛者第一次的选择是完全随机的,因此:123P(A)=P(A)=P(A)

并且:123P(A)+P(A)+P(A)=1

因此可以得到:123P(A)=P(A)=P(A)=1/33

只有当随机事件A发生时,参赛者才应该坚持自己的选择,而随3机事件A发生的概率只有1/3,所以,我们得到的结论是:改选另一扇门,有2/3的可能得到豪车,反之,则只有1/3的可能得到豪车。

重新审视分析过程,我们会发现,这个游戏有趣的一点就在于:在你随机选择一扇门之后,主持人为你去掉了一个错误答案。有了这个前提条件,参赛者获胜的概率提高了,这就是“条件概率”的神奇之处!条件概率

条件概率,是针对两个或两个以上的随机事件提出的概念,我们设定任意两个随机事件为A、B,那么,在A已经发生的前提下,B发生的概率就称为条件概率,记为P(B|A)。

概率具有非负性,条件概率是概率的一个类别,因此同样具有非负性,即对于任意随机事件A和随机事件B,P(B|A)≥0。

要研究两个随机事件之间的关系,首先要弄清楚,两个随机事件的概率之间可以进行哪些数学运算,下面我们来介绍概率的加减乘除法则。

首先,我们要定义两个概念:

和事件:随机事件A∪B称为A和B的和事件,它表示随机事件A或随机事件B中至少有一个发生;

积事件:随机事件A∩B称为A和B的积事件,它表示随机事件A和随机事件B同时发生。通常地,我们把A∩B简写为AB。

其次,我们来学习概率的加法和乘法。

概率加法:对任意两个随机事件A和B,有P(A∪B)=P(A)+P(B)-P(AB)

概率乘法:对任意随机事件B和满足P(A)>0的随机事件A,有P(AB)=P(B|A)·P(A)

概率的加法和乘法就是概率论中的四则运算,很多概率问题的计算都需要使用这两种运算,本书后边的内容也会反复使用它们。这里需要说明的是,概率加法和乘法的证明不在本书的讨论范围内,我们把它们当作数学中的四则运算一样使用就可以了。

细心的读者会发现,概率乘法中出现了条件概率P(B|A),事实上,概率乘法的另一种表达方式正是条件概率的数学定义。

设随机事件A和B,满足P(A)>0,则P(B|A)=P(AB)/P(A)

定义为随机事件A发生的前提下随机事件B发生的条件概率。

关于条件概率,我们要讨论的最后一个问题是:对于某个随机事件B和任意随机事件A,P(B|A)和P(B)之间的大小关系是怎样的?

这个问题会让人在一瞬间产生两种截然相反的想法。有些人在想:已知条件越多,事情发生的概率应该越大,所以P(B|A)≥P(B);另一些人在想:已知条件越多,对事件发生的限制也越多,事件发生的概率也越小,所以P(B|A)≤P(B)。

我们用一个生活中的事例来解释一下。

2015年,北京空气质量达标186天,占全年的51%。假定今天是2016年1月1日,如果我让你预测一下3月1日会是雾霾天还是晴天,你会怎么回答?谁都不可能提前两个月预测一天的雾霾情况,所以,你只能回答51%,看起来,这跟抛硬币没什么区别。

时光如箭,转眼到了2月29日。假如,今天白天狂风大作,夜幕降临时,风停了,你一定会感到欣慰:“明天肯定是好天气!”又如,今天雾霾压城,直到夜里仍不见好转,你会在睡前默默地给全家人准备好口罩,你知道,明天肯定还是雾霾天。

我们用概率语言重新描述上面的事例。

随机事件B:2016年3月1日,北京城是个雾霾天。1

随机事件A:2016年2月29日,北京白天刮大风,晚上风停了。2

随机事件A:2016年2月29日,北京全天雾霾严重。

根据常识,我们得到了下面的结论:1P(B|A)<P(B)2P(B|A)>P(B)

所以说,P(B|A)和P(B)没有确定不变的大小关系,前提条件对随机事件产生的影响无法预测!1.4独立事件:反复抛起的硬币

有这样一个谜题:小明一家四口正在沙滩上享受假期,这时,小明和妹妹为了一个美丽的贝壳争执起来,他们俩都想得到贝壳,谁也不让谁,只好找来父亲。父亲没法说服这对兄妹,只能用一种“公平的方式”来决定贝壳归谁——抛硬币。可是,父亲手上没有硬币,只有几个汽水瓶瓶盖,父亲想要用瓶盖代替硬币,可是,抛瓶盖出现正面和反面的概率未必相同。请问,父亲该怎么办呢?

或许你已经知道答案了,如果你还没想明白,先把这个小谜题放在一边,我们一起来学习概率论中的一个很独特的概念——独立事件。独立事件的含义

通俗地讲,彼此没有任何关联的事件称为独立事件。比如,你和我各自抛一枚硬币,你抛硬币出现正面和我抛硬币出现正面是两个毫不相干的随机事件,此时,我们就称这两个事件彼此独立,互为独立事件。

独立事件看起来很容易理解,实际上,人们常常搞不清楚它的含义。下面,我们就来讨论一下独立事件真正的含义。

某日,一架小型客机在靠近机场的居民区坠落,所幸没有造成人员伤亡。记者们第一时间赶到事故现场,采访了机场总经理。为了安抚大家的情绪,也为了保全机场的声誉,机场总经理这样说道:“从统计学上讲,人们应该感到更放心,因为再次发生类似事故的可能性相比此前大大减小了。”

毫无疑问,这段采访应该入选“史上最差危机公关”的榜单。历史上有很多血淋淋的事件都可以反驳这种愚蠢至极的说法。纽约时间2001年9月11日早8时37分,美国航空公司11次航班被劫持,8时46分,这架波音767飞机以490千米/小时的速度撞向世贸中心北楼。要知道,在此之前,美国发生飞机撞楼事件的概率仅为0.005%,如果按照那位机场总经理的说法,世贸中心第一次被撞之后,几乎不可能再发生类似事件了。而事实是,恐怖分子随后驾驶另外两架波音飞机撞击了世贸中心南楼和五角大楼。除此以外,我们还能列举出很多“祸不单行”的事实。面对恐怖袭击或者意外事故,我们要做的不是拿概率理论来蒙骗大众,而是应该找出事故原因,避免类似的惨剧再次发生。

那么,这位机场总经理到底错在哪儿呢?他混淆了两件事:一个随机事件发生两次和一个随机事件再次发生。以飞机失事为例,设

随机事件A:该机场飞机失事

根据该机场的营运历史,P(A)=0.01%

我们假设两次不同的事故之间是互相独立的,那么,该机场发生两次飞机失事事故的概率是:P(A)·P(A)=0.000 001%

这个概率的确远低于P(A)。可是,在飞机失事已经发生的时候,飞机再次失事的概率依然是:P(A)=0.01%

因为事故之间是彼此独立的。如果两者彼此存在关联,这个概率甚至会变得更大。

对独立事件还有另一种常见的误解。

请你快速回答:抛硬币时,“出现正面”和“出现反面”互相独立吗?

我希望听到肯定的回答,这样我就可以纠正你的错误了!关于独立事件的第二个误解就是:把不能同时发生的事件当作互相独立的事件。“正面”和“反面”的确不可能同时出现,它们看起来互不侵犯,难道不是互相独立吗?答案是否定的。因为独立事件的含义是,当一个随机事件发生时,不影响另一个随机事件发生的概率。如果抛硬币出现了正面,那么,出现反面的概率会从50%降为0!

关于独立事件,我们需要记住以下三点:(1)一个随机事件发生两次的概率不等于一个随机事件再次发生的概率;(2)不可能同时发生的事件不是互相独立的;(3)独立事件的含义是,不论一个随机事件发生还是不发生时,都不会影响另一个随机事件发生的概率。独立事件的数学表达

还记得概率乘法吗?P(AB)=P(B|A)·P(A)

我们刚刚学到,独立事件的含义是,当一个随机事件发生时,不影响另一个随机事件发生的概率。这听起来很像条件概率的定义,实际上,这句话等价于下面的数学表达式:P(B|A)=P(B)

将这两个表达式合并起来,就可以得到,当随机事件A和随机事件B互相独立时,P(AB)=P(B)·P(A)

上面的表述前后颠倒一下,就是独立事件的定义。

设A和B是两个随机事件,如果满足P(AB)=P(B)·P(A)

则称A和B互相独立,或称A和B互为独立事件。

这是两个事件相互独立的定义,那如果是三个事件呢?

设A、B、C是三个随机事件,如果满足如下等式:P(AB)=P(B)·P(A)P(AC)=P(A)·P(C)P(BC)=P(B)·P(C)P(ABC)=P(A)·P(B)·P(C)

则称A、B、C互相独立。

由此可以推论出n个事件互相独立的定义,请读者们自行脑补。

本节的最后,我要告诉你那个小谜题的一个参考答案:扔两次瓶盖,出现“正面、反面”,贝壳归小明;出现“反面、正面”,贝壳归妹妹;出现其他情况,父亲重新扔,直到贝壳有了归属为止。因为每次扔瓶盖是互相独立的,所以,出现“正面、反面”和“反面、正面”的概率一定是相等的,独立事件帮助我们实现了公平。1.5全概率法则:英超冠军争夺战

现代足球的百年历史画卷上留下过很多“草根逆袭”的神话,“70后”会追忆1992年欧洲杯的“丹麦童话”,“80后”依稀记得2004年欧洲杯的“希腊神话”,我倒觉得,像欧洲杯这样的淘汰赛具有很大的偶然性。真正有实力的黑马当属1997—1998赛季的凯泽斯劳滕队,他们在升级到甲级联赛的第一个赛季就力压德甲霸主拜仁慕尼黑,获得了联赛冠军,在当时被认为“难后有来者”。然而,总有人要挑战不可能,来自英超联赛的小球会莱斯特城队很可能重演草根逆袭的神话。莱斯特城队的逆袭

2015—2016赛季的英超联赛,可谓翻天覆地,有一句话能最贴切的描述英超的现状——本想保级的队伍现在在争冠,本想争冠的队伍现在在保级,只有阿森纳实现了“争四”的目标。我们就来一起聊聊那支“本想保级,却在争冠”的队伍——莱斯特城队。

莱斯特是英格兰中部的一座城市,位于伦敦西北156公里,人口约32万。莱斯特城足球俱乐部成立于1884年,绰号“狐狸”,他们于1890年加入英格兰足球协会,在中部地区联赛里混迹了三年后,他们于1894年夺得亚军,获得了参加全国乙级联赛的资格。1908年,莱斯特城队获得乙级联赛亚军,终于升入甲级联赛,然而,由于实力不济,他们很快便降级了。此后的多年,他们一直在甲级联赛和乙级联赛中徘徊,成绩不温不火。上赛季,他们从英甲联赛升入英超联赛,勉强完成了保级任务,留在了英超。夏季休赛期,时任莱斯特城主帅的皮尔逊因为儿子在泰国曝出性丑闻,被球队的泰国老板愤而解职。随后,他们请来了老帅拉涅利。

拉涅利,意大利人,绰号“补锅匠”,执教履历丰富,执教风格保守。“当我和球队谈话时,我发现他们害怕意大利战术,他们看起来不怎么相信我,我自己也是。”在近日的采访中,拉涅利谈起了刚接手莱斯特城队时的情景,“我认为一个教练最重要的是围绕自己球员的特点构建球队,所以我对球员们说,我信任你们,我不会多说战术的事。英国的比赛强度超高,几乎能把球员榨干,他们需要时间恢复。我要确保球员们每周有两天完全与足球无关,这是我在第一天就对他们强调的,这是一种信任。”

正如拉涅利所说,他对球队充分信任。拉涅利上任后,基本保留了球队的原班人马,包括助理教练团队。这使得球队很快度过了磨合期,球员们也踢的更自信。正是主帅的信任和球员的自信让莱斯特城队踢出了十分高效的足球,他们一路过关斩将,踢的霸气十足。曾经的英超五强中,只有阿森纳队在勉强追赶莱斯特城队,然而,圣诞节过后,“争四魔咒”再度降临,温格的球队无可挽回的滑向第4名,莱斯特城队却依旧坚挺。“英超赛季快过半了,占据积分榜头名的是一支叫莱斯特城的球队。一年前的圣诞节,他们排名垫底,濒临降级。”面对媒体的赞扬、调侃或者质疑,莱斯特城队的教练和队员始终在强调:“我们的目标是取得40个以上的积分,确保保级成功。”

莱斯特城队的低调务实不是没有理由的,从勉强保级,到争夺冠军,更何况是在竞争激烈的英超联赛,这实在是天方夜谭。然而,在刚结束的英超第31轮,莱斯特城队1∶0小胜水晶宫队,将自己的领先优势保持在5分,随着联赛轮数逐渐减少,这样的优势促使莱斯特城队的夺冠概率变得越来越大。比赛中,莱斯特城队球迷已经在看台上高唱起“我们将要赢得英超冠军”的口号。其实,无论莱斯特城队能否最终夺冠,我们都在内心深处成了莱斯特城队的球迷,正如老帅拉涅利所说:“莱斯特能夺冠吗?我不知道,但能被问到这个问题就足够美妙了。在这个金钱衡量一切的时代,我们给了每个人希望。”莱斯特城队的夺冠概率

假如我们都是莱斯特城队的球迷,我们一定特别想知道,莱斯特城队夺冠的概率到底有多少。表1-2是英超联赛截至第31轮的积分榜,表1-3是莱斯特城队未来赛程。表1-2 英超联赛2015—2016赛季积分榜(截至第31轮)表1-3 莱斯特城队未来赛程

莱斯特城队能否夺冠不仅与自身的比赛结果有关。还与其他球队的比赛结果有关,因此,我们需要分不同的情况来讨论,然后把这几种情况所求的概率相加,才能得到莱斯特城队夺冠的概率,这就要用到概率论中的“全概率公式”。12n

设随机试验E共有n种可能的结果A,A,…,A,这些结果两两不可能同时出现,那么,任一随机事件B的概率满足:1122n

P(B)=P(B|A)·P(A)+P(B|A)·P(A)+…+ P(B|A)n·P(A)

这就是全概率公式。它隐含的思想正是我们在数学课上常用的“分情况讨论”,只不过,这里要求我们一定要把所有情况都列举全,而且不同的情况之间不能有交叉重叠。

在莱斯特城队登场前,我们先来热身一下。

请问,抛掷一枚硬币两次,出现至少一次正面的概率是多少?

有些读者会马上想到计算两次都是反面的概率,然后用1减去这个概率,这是个很聪明的想法,但在这里,我们要对全概率公式进行刻意练习。设1

随机事件A:第一次抛硬币出现正面;2

随机事件A:第一次抛硬币出现反面;1

随机事件B:第二次抛硬币出现正面;2

随机事件B:第二次抛硬币出现反面;

随机事件C:两次至少出现一次正面。

根据全概率公式:1122P(C)=P(C|A)·P(A)+P(C|A)·P(A)112=1·P(A)+P(B)·P(A)=1×1/2+1/2×1/2=3/4

至少出现一次正面的概率是3/4。

接下来,我们就用全概率公式来算一算莱斯特城队夺冠的概率。为了简化计算过程,我们仅用积分来度量莱斯特城队夺冠的可能性。过去17个赛季,英超冠军的最低积分为79分,2000年之后,英超冠军的平均积分更是高达87.5分,就本赛季目前的积分情况,“低分冠军”似乎已成定局。虽然莱斯特城队现在领先优势不小,但是,“永远不要低估一颗冠军的心”,那些苦苦追赶的队伍有可能在最后7轮变身疯狂的抢分机器。因此,老帅拉涅利为球队定下了79分的目标,他认为,如果莱斯特城队在赛季结束时的积分能够达到甚至超过79分,便一定能夺冠。我们也以79分为标准,来计算莱斯特城队夺冠的概率。

莱斯特城队夺冠的概率等价于莱斯特城队获得不低于79分的概率。31轮过后,莱斯特城队积66分,距离79分还有13分。设

随机事件A:莱斯特城队获得至少13个积分。

根据全概率公式:

P(A)=P(A|莱斯特城第32轮取胜)·P(莱斯特城第32轮取胜)+P(A|莱斯特城第32轮打平)·P(莱斯特城第32轮打平)+P(A|莱斯特城第32轮告负)·P(莱斯特城第32轮告负)=P(莱斯特城后6轮取得至少10分)·P(莱斯特城第32轮取胜)+P(莱斯特城后6轮取得至少12分)·P(莱斯特城第32轮打平)+P(莱斯特城后6轮取得至少13分)·P(莱斯特城第32轮告负)

然后,我们还可以用全概率公式来计算P(莱斯特城后6轮取得至少10分)、P(莱斯特城后6轮取得至少12分)和P(莱斯特城后6轮取得至少13分),按照同样的思路继续分解下去,直到最后一轮比赛。对于每一场比赛,我们要估计出莱斯特城队获胜的概率,然后将这些概率代入全概率公式中,便可以求得P(A)。

我知道,我食言了,我没有算出莱斯特城队的夺冠概率,其实,我本就没打算真正去计算这个概率,毕竟,我们已经学习到了全概率公式的用法,这就足够了,至于莱斯特城队能否夺冠,我们只需要重温老帅拉涅利的那句话就可以了——“莱斯特能夺冠吗?我不知道,但能被问这个问题就足够美妙了。在这个金钱衡量一切的时代,我们给了每个人希望。”第2章随机变量

导语:骰子是世人皆知的赌博道具。这个小小的赌博道具,对概率思想的启蒙做出了不可磨灭的贡献,伽利略、帕斯卡、费马等数学家从骰子的研究中发现了随机事件的数学本质,它就是随机变量。2.1随机变量:骰子游戏

骰子,俗称色子,是全世界都熟知的赌博道具。骰子的历史可以追溯到古巴比伦、古埃及时期,在中国古代的赌场里,也是赌博道具的不二之选。你可不能小看这小小的骰子,它对概率思想的启蒙做出了不可磨灭的贡献。

文艺复兴时期,意大利学者吉罗拉莫·卡尔达诺曾撰文研究骰子原理:“在下注之前,你需要知道所有可能的结果,然后对比一下输赢的结果各有多少种,再按照这个比例去设置奖金,这样才能确保赌局的公平。”这大概是“概率思想”最早的启蒙,在当时是相当有革命性的思想。其后,著名的物理学家伽利略也对赌博中的数学原理产生了兴趣,并撰写了《骰子的研究》一书,在书中,他开创性的研究了掷多个骰子时可能出现的点数,以及这些点数会在怎样的情况下出现。在那之后,赌博中的数学问题引起了很多学者的思考和讨论,其中包括著名数学家帕斯卡和费马。

我们回到过去,一起来看一看在概率论尚未建立时,聪明人是怎么利用骰子赚钱的。掷骰子游戏

据资料记载,一个化名莫雷的赌徒曾经靠一个骰子游戏赚了很多钱,游戏的玩法是:连续掷骰子四次,如果出现至少一个六点,则莫雷赢;反之,莫雷输。要弄清楚莫雷为什么总是赢,就要计算一下双方赢的概率。要计算掷四次至少出现一个六点的概率,可以用逆向思维,计算掷四次没有任何一次出现六点的概率,再用1减去算出的概率即可,由于每次掷骰子都是彼此独立的,因此:

P(莫雷赢)=1-P(掷四次没有任何一次出现六点)=1-P(第一次没出现六点)×P(第二次没出现六点)× P(第三次没出现六点)×P(第四次没出现六点)=1-(5/6)×(5/6)×(5/6)×(5/6)=0.518

相对的,P(莫雷输)=(5/6)×(5/6)×(5/6)×(5/6)=0.482

莫雷赢得赌局的概率总是大于对手,所以莫雷可以靠这个赌局赚到钱,对吗?

不对!因为赌徒赚的可不是概率,是真金白银,我们忘记了赌局上最重要的东西——筹码。在莫雷的赌局中,双方的筹码是对等的,假定为“一两黄金”,也就是说,莫雷和对手各自拿出一两黄金作为筹码,如果出现了六点,莫雷拿走对手的一两黄金,如果没出现六点,莫雷将一两黄金送给对手。如表2-1所示,我们设定了一个关联关系——赌局结果与莫雷赢得的筹码之间的关联,莫雷赢得一两黄金的概率是0.518,莫雷输掉一两黄金的概率是0.482,如果将筹码的单位去掉,便可以表示成“+1”对应的概率是0.518,“-1”对应的概率是0.482。

在概率论中,莫雷赢得的筹码就是一个随机变量。表2-1 莫雷赌局的结果随机变量12n

假设随机试验有若干个可能的结果A,A,…,A,如果变量X12n满足:A,A,…,A每一个都对应X的一个数值,那么,X就称为随机变量。1

上面的例子中,赌局是随机试验,赌局有两种可能的结果A:莫212雷赢,A:莫雷输,莫雷赢得的筹码是变量X,A对应X=+1,A对应X=-1,所以,X是一个随机变量。也就是说,随机试验的每一个结果都对应X的一个值。

一个随机试验可以包含不止一个随机变量,我们仍以骰子游戏为例。

小红、小黄和小蓝三个小朋友玩骰子游戏,规则是:扔一次骰子,出现一点或二点,小红赢;出现三点或四点,小黄赢;出现五点或六点,小蓝赢。游戏开始时,三个小朋友各自有五块泡泡糖,每局的赌注是一人一块泡泡糖,赌局一直进行到有人输光为止。

骰子的每个点数出现的概率都是1/6,游戏中有三位小朋友,可以设定三个随机变量,分别是:

随机变量X:小红一局赢得的泡泡糖数量;

随机变量Y:小黄一局赢得的泡泡糖数量;

随机变量Z:小蓝一局赢得的泡泡糖数量。

我们把游戏结果和随机变量一一列出,如表2-2所示。表2-2 骰子游戏的结果与随机变量离散与连续

有这样一串数字,“1 2 3 1,1 2 3 1,3 4 5,3 4 5,5 6 5 4,3 1,5 6 5 4,3 1,2 5 1 0,2 5 1 0”,你能发现这串数字的奥秘吗?

也许有些读者一眼就看穿了我的把戏,但我还是不想现在就公布答案,我们先来讨论随机变量的两个平行世界——离散和连续。

现在,环顾你的四周,你能看到什么?你的手、这本书、手机、绿植等,这是我们看到的世界——宏观世界,这个世界里的东西总是可以用计数的,比如,你有两只手,你的手上有一本书,你有一部手机,手机里有两张SIM卡,你的绿植又生出了一片新叶。可是,世界并非全部如你所见。你一定记得,多年前的生物课上,当你第一次从显微镜里看到一团蠕动的细胞时,是多么的惊讶和好奇,那仿佛是另一个世界!科学告诉我们,显微镜下的细胞与我们看到的绿叶身处同一个世界,只不过它们太微小了,我们看不到。我们常把肉眼看到的世界称为宏观世界,把那个看不见的世界称为微观世界。

在数学世界里,也有宏观与微观的划分。我们从小学习的四则运算、一元二次方程等都是“宏观世界”的数学语言,直到我们遇上那几个让人抓狂的符号——“∫,Δ,∂”。从此,我们进入了数学的“微观世界”,那些简单的四则运算在“微观世界”里统统变了模样,它们演化成全新的运算规划——微积分。微微分扩张了概率论的疆域,随机变量不再只是赌徒的筹码,它也可以是时间、温度,于是,随机变量便自然地划分为两类——离散与连续。

离散随机变量,指的是随机变量的取值是有限的或可列无限个。比如,小红一局赢得的泡泡糖数量只有两个可能的取值;又如,一个把所有正整数都刻在上面的骰子,这个骰子掷出的点数可能是任何一个正整数,这就是“可列无限个”的离散随机变量。

连续随机变量,指的是随机变量的取值有无限多个并且不可列出。当我们把时间、温度、空间等无法一一罗列出来的指标作为随机变量的时候,连续随机变量就出现了。

有关离散随机变量和连续随机变量的讨论才刚刚开始,在后续章节中,我们会认识很多常用的随机变量,它们有些是离散的,有些是连续的,但无一例外地都是概率论的重要成员。有关离散和连续的关系,我想了很久,想到了一个比喻:音符与音乐。一首曲子,曲谱只是一个个“离散”的数字,没有规律,没有内涵,但当这曲谱被演奏出来时,“离散”的数字化为“连续”的乐音,这乐音弥散在空中,让你陶醉,而你早已忘却了那一个个分离的音符,这就是“离散”与“连续”的完美结合。

最后,我要告诉你,那一串貌似神秘的数字其实是一首歌的乐谱,歌名是——《两只老虎》。

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载