10堂极简概率课(txt+pdf+epub+mobi电子书下载)


发布时间:2020-06-01 09:15:19

点击下载

作者:(美)佩尔西·戴康尼斯,(美)布赖恩·斯科姆斯

出版社:中信出版社

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

10堂极简概率课

10堂极简概率课试读:

前言

这本书是由我们在斯坦福大学合作教授了约10年的一门课程衍生而来的。这是一门大型的混合性课程,听课的人是本科生或研究生,他们分别来自哲学、统计学和一些交叉学科。随着课程的不断发展,我们越来越相信它的内容应该可以吸引更多的听众。学习这门课的一个先决条件,就是接触过一门概率论或统计学的课程,这本书的读者同样需要满足这个条件。但是,考虑到某些读者可能是在很久以前学过这类课程,我们在书中以附录的形式,对概率论进行了一次简要的复习。这本书涉及的内容包括历史、概率和哲学。我们不仅介绍了概率论发展过程中的一些伟大思想及其历史,还致力于探索这些思想的哲学意义。一位阅读过本书初稿的读者抱怨说,读到最后,他仍然不了解我们关于概率的哲学观点,原因或许是我们过于中立。这个问题现在已经解决了,你会发现我们是彻头彻尾的贝叶斯学派,是贝叶斯(Thomas Bayes)、拉普拉斯(Pierre-Simon Laplace)、拉姆齐(Frank Ramsey)和菲尼蒂(Bruno de Finetti)的信徒。有人认为贝叶斯学派是与频率学派相对立的,而我们并不否认频率的重要性,或者讨论客观概率的价值。不仅如此,我们还会在合理的置信度框架内统一考虑这些问题。在这本书的开头,我们与先驱者一起思考,涉及的工具很简单。但到了后半部分,我们将回到当下,不可避免地会接触到一些技术性细节。为了保证行文简洁流畅,我们将把某些细节内容放到附录中,大家可以根据需要查阅。我们还做了大量注释,以方便读者深入挖掘自己感兴趣的内容。在这本书的最后,我们列出了一份参考书目。此外,脚注也给出了较为详细的解释。佩尔西·戴康尼斯布赖恩·斯科姆斯第1课概率是可以测度的吉罗拉莫·卡尔达诺(Gerolamo Cardano)要搞清楚一门学科的本质,认真研究该学科的开创者的想法是一条可行的路径。事实上,某些基础性哲学问题从一开始就是显而易见的。关于概率,我们的第1堂课要介绍的第一个伟大思想是:概率是可以测度的。这个观点的形成时间是16—17世纪,过程为何如此漫长,这个问题至今仍然是一个谜。希腊神话中有命运女神堤喀(Tyche);德谟克利特(Democritus)及其追随者假设,构建宇宙的所有原子都会受到某种物质偶然性的影响;卢克莱修(Lucretius)在《物性论》(De Rerum Natura)中指出,这种偶然性就是原子的偏离;古埃及人和古巴比伦人学会了用指关节骨或骰子玩概率游戏,到了罗马时期,这种游戏流行开来,士兵们通过抽签决定基督斗篷的归属。后来,古希腊学园派怀疑论者将概率视为人[1]生的指南。不过,这些时期似乎都没有出现有关概率的定量[2]理论。[3]想一想,我们是怎么测量东西的?以长度为例,我们会先找到一个长度标准,然后计数某个东西包含多少个这样的标准长度。比如,在我们用脚步测量距离时,这个长度标准就是我们的脚。但是,不同的脚有可能得出不同的测量结果,因此,1522年,有人提议改进法定路德(杆)的确定方法。如图1–1所示,当人们从教堂鱼贯而出时,将排成一列的16个人的脚的[4]总长度设定为法定路德。从图1–1可以看出,这些人的脚长度不一,但通过一群人来设定这个长度单位具有明显的平均效应,因此很多人接受了这个方法。不过,当时似乎还没有人明确提出平均数这个概念。图1-1 法定路德的确定我们有必要指出,这个方法存在哲学上的异议。我们的目的是定义长度,但在用脚长测量距离时,我们已经假定我们采[5]用的长度标准等长。因此,这是一个循环论证的过程。任何有头脑的人都不会因为这个异议而放弃用脚长测量距离的方法。我们的测量活动就始于此,最终建立并完善了长度的概念。脚的长度因人而异,路德会长短不一,标准米尺的长度在足够高的精度条件下也会各不相同。借助物理学知识,我们可以不断改进长度测量方法。因此,这确实是一个循环论证的过程,但它并不是一个致命的缺陷,反而为我们指明了一条[6]趋于完善的道路。概率的测度同样如此。在测度之前,我们先要找到(或者制造)同等可能性的情况,然后计数这些情况发生的次数。于是,事件A的概率,记作P(A),为P(A)=注意,从上式可知:1. 概率永远不会是负值;2. 如果所有可能发生的情况中均包含事件A,则P(A)=1;3. 如果事件A和事件B不会同时发生,则P(A或B)=P(A)+P(B)。此外,某个事件不会发生的概率等于1与该事件发生概率的差:P(非A)=1–P(A)。这个概念虽然十分简单,但如果运用得巧妙得当,就会产生令人惊讶的效果。我们以生日问题为例。如果不考虑闰年,并且假设出生日期的概率均相等,每个人的生日相互独立(即没有双胞胎),那么房间内的所有人中至少有两个人的生日在同一天的概率是多少?如果你以前没有见过这个问题,它的答案肯定会让你大吃一惊。一群人中有人生日在同一天的概率等于1减去所有人生日均不相同的概率。第二个人与第一个人的生日不同的概率为(364/365)。如果前两个人的生日不同,那么第三个人的生日与他们俩都不相同的概率为(363/365),以此类推。因此,N个人中有人生日相同的概率为1–。如果你对同额赌注感兴趣,就可以利用上述公式,找到使输赢概率趋近1/2的N的值。当房间里一共有23个人时,生日相同的概率会略高于1/2。如果房间里有50个人,这个概率就会接近97%。人们经常利用生日问题来考虑一些令人吃惊的巧合情况,因此生日问题出现了很多变种。比如,两个美国人的生日相同,而且他们的父亲、祖父和曾祖父生日相同的可能性大到令人吃惊的程度。为帮助大家应对这些问题,本堂课内容的附录部分给出了一些有用的近似值。最后,本书在结尾部分又利用这些近似值,证明了菲尼蒂定理。现在,大家只要知道“等可能情况”这个基本结构应用广泛和深入就可以了。概率测度的开始创建等概率情况,最有效的方法莫过于抛掷质地均匀的骰子,或者从洗好的一副牌中抽取扑克牌。概率的测度就是从这里开始的。我们不知道首创者是谁,但数学家、医生、占星家吉罗拉莫·卡尔达诺早在16世纪研究赌博游戏时就明明白白地[7]提到过这个概念。卡尔达诺有时以赌博为生,因此他对等概率假设非常敏感。此外,他对动过手脚的骰子以及其他作弊手法都了如指掌:“……骰子有时并不诚实,可能是因为它被打磨过,也可能是因为它被削扁了(这很容易被人看穿),还可能是因为相对应的两面受到挤压而变得扁平了……牌类游戏的作[8]弊手段更是层出不穷。”17世纪早期,伽利略(Galileo)给他的赞助人托斯卡纳大公爵写了一封简短的信,回答了后者提出的一个关于骰子的问题。公爵认为,通过计算可能情况得出的答案似乎是错误的。投掷三枚骰子时,得到10点和11点的数字组合方式各有6种,9点和12点同样如此。“……但是,众所周知,骰子玩家通过长期观察发现,掷出10点和11点的可能性比9点和12点的可能性[9]更大。”这是怎么一回事呢?伽利略答道,他的赞助人在计算得到9点和10点的可能情况时,把三个3点计作一种可能,把两个3点和一个4点也计作一种可能,这种方法是错误的。伽利略指出,后者涵盖了三种可能的组合,它们彼此之间的不同点就在于是哪枚骰子掷出了4点。<4, 3, 3>,<3, 4, 3>,<3, 3, 4>。前者的确只有一种可能,即<3, 3, 3>。伽利略完全掌握了排列组合的相关知识,似乎并没有觉得这是什么新鲜事物。在构建等概率情况时,伽利略和卡尔达诺似乎都隐晦地使用了独立性这个概念。他们认为,对于每一枚骰子,抛掷后得到6个面中的每一个的概率都相等,在抛掷三枚骰子时,得到216个可能结果中的每一个的概率也相等。在解决生日问题时,我们假设所有人的生日都具有独立性。帕斯卡(Pascal)和费马(Fermat)充分理解了这个基本体系。众所周知,他们通过书信往来,解决了几个更加微妙且在概念上又各具特色的问题。帕斯卡和费马帕斯卡和费马于1654年开始的一系列书信往来,似乎标志着概率论这个数学分支第一次开启了实质性研究。本书详细介绍这件事,有三个原因:第一,这是一次史无前例的研究;第二,它告诉我们,借助等可能情况,某些看似复杂的问题有可能被简化为直截了当的计算;第三,它引入了期望值这个重要概念,期望值是概率论这门学科的主要支柱之一。帕斯卡和费马解决的这些问题,在概念特色上不同于卡尔达诺和伽利略解决的那些问题。帕斯卡和费马对公平性进行了定义,还对期望值进行了重点研究。其中有两个问题是帕斯卡的赌友梅内骑士(Chevalier de Méré)提出来的。帕斯卡把这两个问题连同他自己的想法,都通过书信告诉了费马。他们俩是通过梅森学院建立联系的,自从梅森(Marin Mersenne)神父于1635年创建了这家学院之后,包括伽利略、笛卡儿(Descartes)和莱布尼茨(Leibniz)在内的杰出数学家、科学家和哲学家都在这里分享过研究成果。骰子问题:一名玩家需要在8次抛掷骰子的赌局中掷出一个6点。此时,投注金额已经确定,这名玩家已经抛掷了3次,但没有一次是6点。如果从赌注中拿出一定比例的钱给这名玩家,让他放弃第4次的抛掷机会(仅放弃这一次),那么给他[10]多少钱才算公平?[11]点数问题:两名水平相当的玩家正在进行一场多局赌博。每赢一局就可以得到一点。他们一致同意,第一个达到特定点数的玩家获胜,并赢得全部赌注。在进行了若干轮之后,赌局被打断了。此时,如何分配赌注才算公平合理呢?这两个问题都是围绕公平性阐述的。但是,概率论中的公平性到底指什么呢?我们将会看到,帕斯卡和费马隐晦地利用期望值的概念回答这个问题。对赌注为V(x)、结果为x的赌局而言,期望值就是概率的加权平均:期望值(V)=V(x) p(x)+V(x) p(x)+…1122如果玩家对交易的期望值保持不变,就可以视其为公平交易,比如,抛掷质地均匀的硬币。如果是正面朝上,你赢1,反之,你输1。那么,期望值为(+1)(1/2)+(–1)(1/2)=0。我们把这个概念应用到骰子问题上。桌上的赌注没有变化,仍然是s。如果该玩家不放弃第4次抛掷的机会,那么他一共还有5次机会。他的期望值为4① 在余下的4次机会中赢1次的概率=1– P(4轮全输)=1–(5/6)。费马在信中建议玩家拿走1/6的赌注,然后放弃第4次抛掷[12]的机会。在这种情况下,他的期望值是可以看出,两者相同,因此用1/6的赌注作为玩家放弃第4[13]次抛掷机会的收益是公平的。点数问题也是一个期望值问题,曾让许多以前的思想家束手无策。1494年,修道士卢卡·帕乔利(Luca Pacioli)考虑过一个点数问题:在一场只要得到6点即可获胜的赌局中,一名玩家已经得到了5点,另一名玩家得到了3点。也许是受到亚里士多德(Aristotle)的分配正义思想的影响,帕乔利认为按照两个玩家分别赢得的点数之比(5∶3)进行分配是公平的做法。大约50年后,塔尔塔利亚(Tartaglia)提出了反对意见,理由是:根据这条规则,如果游戏在一轮之后停止,那么其中一名玩家就会得到全部赌注。赢得赌局所需的点数越多,这样的结果就越令人难以接受。塔尔塔利亚试图修改帕乔利的规则,以便将这种情况考虑进去,但最后他怀疑这个问题可能根本没有确定的答案。这个问题也让包括卡尔达诺和梅内骑士在内的所有人绞尽脑汁,困惑不已。这时候,费马提出了一个至关重要的见解。假设两名玩家距离赢得赌局分别还差r点和s点,那么赌局肯定会在r+s–1轮内结束。赌局可能会提前结束,但是由于每轮的胜负率是确定的,所以我们不妨考虑一下所有r+s–1轮投掷的结果。这样一来,整个问题就简化为一个关于等概率情况的问题,通过计数就可以算出概率。在帕乔利问题中,玩家1有5点,玩家2有3点,只要他们中的任何一个得到6点,赌局就会结束。因此,赌局最多还可以进行3轮,共有8种等概率情况。玩家2只有赢得接下来的3轮,才会获胜,他的期望值是总赌注的1/8,而玩家1的期望值是7/8。因此,公平的方案是按照这两个期望值之比来分配赌注。通过统计等概率情况计算期望值,可以解决这类问题。但是,等概率情况有时会因为数目过大而难以统计。不妨考虑一下塔尔塔利亚举的例子。赢得6点即可获胜,一名玩家没有得分,另一名已有1点在手。因此,赌局最多还可以进行10轮。把所有1 024种可能的结果全部写出来,是一件单调乏味的事。不过,帕斯卡有一种更好的统计方法。要统计玩家1获胜的情况,我们可以分别统计他在10轮投掷中赢得6次的情况(10选6),在10轮投掷中赢得7次的情况(10选7)……在10轮投掷中赢得10次的情况(10选10),然后将统计结果相加。如图1–2所示,利用帕斯卡三角形[也叫塔尔塔利亚三角形、奥马尔·海亚姆(Omar Khayyam)三角形[14]],我们可以很方便地在第10行找到这些数字。这一行告诉我们,从一组10个对象中选取若干个会有多少种不同的方案。从左至右依次可以看到,选取0个对象有1种选择方案,选取1个对象有10种选择方案,选取2个对象有45种方案,选取3个对象有120种方案,一直到最右端,选取10个对象有1种选择方案。我们需要求出10轮6赢+10轮7赢+…+10轮10赢的总和。利用帕斯卡三角形的第10行,可以算出210+120+45+10+1=386该玩家的最终获胜概率为(约等于38%)。因此,公平分配方案是玩家1(之前没有得分)获得赌注的386/1 024,玩家2则获得剩余赌注。在帕斯卡和费马之后,统计等概率情况和利用组合原理及期望值来计算概率,就成了众所周知的概率测度的基本方法。图1-2 帕斯卡三角形惠更斯帕斯卡与费马在书信中讨论的这些内容传到了克里斯蒂安[15]·惠更斯(Christiaan Huygens)的耳朵中。当时,这位伟大的荷兰科学家正在巴黎访问。他不仅接受并拓展了书信中传递的那些思想,之后还解决了那几个问题,并于1656年出版了关于这些问题的第一部著作。1692年,约翰·阿布斯诺特(John Arbuthnot)把它翻译成英文版,书名就叫《机遇的规[16]律》(Of the Laws of Chance)。在这本书的开头,惠更斯提出了一条基本原理:公设下列命题构建于这样的公理之下:赢得任何东西的概率或期望值,都与在公平赌局中获胜的概率或期望值一样,可以通过求和的方式计算出来。比如,某个人的左手和右手分别握有3先令和7先令。他让我在不知情的情况下选择一只手,然后他会把那只手握着的钱送给我。我认为,这相当于他送给我5先令,这是因为在公平的条件下,我获得5先令与赢得3先令或7先令的概率或期望值是一样的。惠更斯认为,他其实可以通过抛质地均匀的硬币的方法来[17]决定选择哪只手。1/2×3+1/2×7=5,因此他说,赌注的价值和得到5先令的价值是一样的。于是,他明确地(通过一个特例)提出了帕斯卡与费马书信中隐含的一条原理:期望值是测算价值的正确方法。接着,他从公平性的角度论证了这种测算方法的合理性。假设我用一枚质地均匀的硬币与某人打赌,赌注是10先令。由于对称性,所以这个赌局是公平的。现在,假设我们一致同意修改赌局,无论谁赢,都要分给输家3先令。这种做法不会破坏对称性,所以修改后的赌局协议仍然是公平的。但现在输家拿到了赌注中的3先令,赢家还剩7先令。诸如此类的协议都会保持公平性,包括赢家分5先令给输家,最后双方各有5先令的协议。接着,惠更斯表明这种论证方法还可以推广至任意有限数量的结果和概率为任意合理值的结果。所以,利用对称性来证明等概率情况的做法将在本书中反复出现。牛顿追随者的想法[18]阿布斯诺特是牛顿的追随者,他在惠更斯著作的英译本的序言中发表了一句值得我们注意的评论:在力量和方向都确定的情况下,骰子落下后朝上的一面也是确定的,只不过我不知道什么样的力量和方向,才能使我想要的那一面朝上。因此,我称之为概率,意思是技能的缺乏。通过这段文字,阿布斯诺特引入了在确定的环境中如何正确认识概率的问题。他给出的答案是:概率是人类无知的产物。以抛一次硬币为例。用拇指弹击硬币,硬币在空中翻转,随后被抓在手心里。很明显,如果拇指用同样的力量弹击硬币相同的部位,硬币落下后朝上的面也会保持不变。所以,抛硬币是一种有规律可循的物理现象,而不是随机的!为了证明这一点,我们请物理系为我们制造了一台抛硬币机。如图1–3所示,在弹簧被松开之后,停留在弹簧上的硬币一边翻转,一边弹起,然后落在一只杯子里。因为弹簧的力量是受控的,所以硬币落下后总是同一面朝上。这个结果令人发自内心地感到不安(本书的两名作者也不例外),魔术师和不诚实的赌徒(包括本书的一位作者)都具有这样的技能。那么,为什么认为抛硬币具有随机性的观点如此普及,并取得了巨大成功呢?庞加莱(Poincaré)给出了基本回答。如果将硬币用力弹起,使之有足够的垂直速度和角速度,硬币就会对初始条件产生敏感的依赖性。初始条件的一点儿不确定性将会被放大,使结果具有很大的不确定性,以至于在一定程度上,我们可以假设结果具有等概率,但这必须满足一些重要的限制性条件。关于这一点,请参阅本章的附录2。我们将在第9课详细讨论这个问题。图1-3 可以确定结果的抛硬币机伯努利1713年,在雅各布·伯努利(Jacob Bernoulli)去世8年[19]后,他的《猜度术》(Ars Conjectandi)终于出版。在这本书中,伯努利阐明了前辈们的做法。全书的第一部分引述并评论了惠更斯的成果。一个事件的概率被明确地定义为发生该事件的(等概率)情况数量与(等概率)情况总数之比。比如,从一副扑克牌(不含大小王)中抽出一张梅花牌的概率是13/52。此外,伯努利还将条件概率(conditional probability),即第二个事件B在第一个事件A已经发生的条件下的发生概率,定义为两个事件均发生的情况数量与发生第一个事件的情况数量之比:概率(A发生条件下B的发生概率)=。如果抽到的是一张梅花牌,那么这张牌是Q的概率为1/13。在这些定义的基础上,伯努利指出互斥事件的概率可以相加,以及概率满足乘法法则,即P(A∩B)=P(A)P(B/A)。这些简单的法则构成了所有概率计算的核心。不过,伯努利的主要贡献是把概率和频率紧密地联系在一起,并称为他的黄金定理。在此以前,人们只是猜测这两者之间存在联系。伯努利举了一个例子。假设一只罐子中装有3 000块白色鹅卵石和2 000块黑色鹅卵石,从罐子中抓取鹅卵石的行为相互独立,而且每次取出一块鹅卵石后会向罐子中补充一块同色的鹅卵石。那么,在抓取鹅卵石的行为进行了一定的次数之后,我们是否“确有把握”(moral certainty)使取出的白色鹅卵石与黑色鹅卵石的数量之比接近3∶2?如果确有把握,这个抓取次数到底是多少?伯努利选定了一个高概率作为“确有把握”的衡量标准,并确定了所需的抓取次数。然后,他阐明了弱大数定律:对于概率(在本例中等于3/5)周围尽可能小的任意区间,以及无限接近确定值1 –e的近似值,都存在数N,使N次尝试中取出白色鹅卵石的相对频率落在该区间的概率至少是1–e。我们在后文中讨论频率时会详细阐述这个定律。小结就像长度一样,概率也是可以测量的。我们将事情划分成等可能情况,计数这些情况发生的次数,再除以可能情况的总数,即可计算出概率。这个定义满足以下条件:1. 概率是一个0到1之间的数。2. 如果A不可能发生,则P(A)=0。如果A在所有情况下都会发生,则P(A)=1。3. 如果A和B不可能在同一种情况下发生,则P(A∪B)=P(A)+P(B)。4. 在A发生条件下B的发生概率等于B与A同时发生的情况数量除以A发生的情况数量,即P(A∩B)=P(A)P(B|A)。如果A和B相互独立,即P(B|A)等于P(B),则P(A∩B)=P(A)P(B)。在发现并统计可能情况数量的过程中,人们遇到了一些数学问题,比如复杂赌局的获胜概率、生日问题等。期望值可以根据各种结果出现的概率来衡量它们的成本与收益情况,这不仅有助于计算,还是公平性和价值的衡量方法。大数定律(我们将在第4堂课和第6堂课继续讨论)表明,在多次独立尝试中,我们可以通过频率求出次数的近似值(高概率)。本堂课的内容一共有三个附录,分别介绍了帕斯卡和费马的通信往来,抛硬币的物理学发展历程,以及深入分析概率数学与现实世界中发生的偶然事件之间的联系。(本书最后单列出一个附录,以满足读者复习相关知识的需要。)附录1 帕斯卡和费马骰子问题帕斯卡写给费马的第一封信已经遗失,但可以肯定的是,骰子问题就是在这封信中提出来的。费马在回信中指出,帕斯卡犯了一个错误:假设我需要用一枚骰子在8轮投掷中得到某个点数才算赢。下注后,如果我们一致同意我放弃第一轮投掷机会,那么根据我的理论,作为对我放弃第一轮投掷机会的补偿,我拿走全部赌注的1/6才算公平合理。之后,如果我们一致同意我放弃第二轮投掷机会,那么我拿走剩余赌注的1/6,也就是全部赌注的5/36,才算公平合理。之后,如果我们一致同意我放弃第三轮投掷机会,那么作为对我的补偿,我拿走剩余赌注的1/6,也就是全部赌注的25/216,才算公平合理。之后,如果我们一致同意我放弃第4轮投掷机会,那么我拿走剩余赌注的1/6,也就是全部赌注的125/1 296,才算公平合理。你认为,如果玩家完成了前面三轮的投掷,这就是第4轮投掷机会的价值。我认同你的观点。下面是你在信中举出的最后一个例子,我完整地引述如下条件:我需要在8轮投掷中得到6点。我已经投掷了三次,但都没有成功。这时候,我的对手建议我放弃第4轮投掷机会,并且为公平起见,我可以拿走全部赌注的125/1 296。你认为这样做是合理的。但是,根据我的理论,这是不公平的。因为在这种情况下,手持骰子的玩家在前三轮投掷中一无所获,总赌注分文未少。如果他同意放弃第4轮投掷机会,作为补偿,他应该拿走全部赌注的1/6。如果他第4次投掷仍没有成功,那么在双方一致同意他放弃第5轮投掷机会的情况下,他依然应该分得全部赌注的1/6。既然赌注总额一直没有变化,那么无论从理论上看,还是根据常识,每次投掷机会都应该具有相同的价值。很明显,这里的核心问题是期望值。如果放弃某一轮的投掷机会并拿走一部分赌注,不会改变赌局的期望值,这种做法就是公平的。费马清楚地看到,任意一轮赌局的分析结果都是一样的。假设某轮投掷结束后,还剩下n+1轮投掷机会,此时的赌注价值为1。那么,选择参与赌局并在此轮获胜的期望值是1/6,而此轮失败但最终仍有可能获胜的期望值是。拿走1/6的赌注后,用剩余赌注继续赌局的期望值是:到手的现金(数额为1/6),再加上最终获胜的概率与剩余赌注(数额为5/6)的乘积。费马的分析立刻得到了帕斯卡的认同。点数问题帕斯卡讨论的另一个问题也很有趣。他以一个赌局为例,两个玩家各押注32枚金币,率先赢得三点的玩家获胜。我们假设第一个玩家得到两点,另一个玩家得到一点。在接下来的一轮赌局中,如果第一个玩家获胜,他就会赢得全部赌注,即64枚金币。如果第二个玩家获胜,他们的点数之比就是2∶2,此时终止赌局的话,他们各自拿回自己的赌注(32枚金币)就可以了。费马先生,请考虑下面这种情况。如果第一个玩家获胜,64枚金币就会归他一人所有。如果他输了,则可以得到32枚金币。此时他们终止赌局的话,第一个玩家就会说:“我肯定可以得到32枚金币,因为即使我输了,我也会得到这么多金币。至于另外32枚金币,也许会归我所有,也许会归你所有,风险均等。因此,我们可以平分这32枚金币。但是,另外32枚金币肯定归我所有。”这样一来,他将得到48枚金币,而另一名玩家则得到16枚金币。这不仅是在计算期望值,还以任何人都无法辩驳的方式证明了这种分配方案的公平性。你确定拥有的部分,就归你所有;对不确定的部分,在概率相等时则双方平分。这是对修道士帕乔利的疑问的明确解答。接着,帕斯卡表明这个推理过程还可以迭代:现在,我们假设第一个玩家得到两点,另一个玩家一无所获。接下来,他们将争夺第三轮的胜利。如果第一个玩家获胜,那么他将赢得所有赌注,即64枚金币。如果第二个玩家获胜,赌局就会回到前文讨论过的情况,即第一个玩家有两点,第二个玩家有一点。我们已经证明,在这种情况下,48枚金币将归那个赢得两点的玩家所有。此时,他们终止赌局的话,这个玩家就会说:“如果我赢了,我将获得64枚金币。如果我输了,我也会理所当然地得到48枚金币。因此,先将确定归我所有的48枚金币给我,因为即使我输了,这些金币也是我的;然后我们再平分剩余的16枚金币,因为我们得到这些金币的概率均等。”也就是说,他将得到56(48+8)枚金币。现在,我们假设第一个玩家得到一点,第二个玩家一无所获。瞧,费马先生,如果他们开始第二轮,就会出现两种可能的结果。如果第一个玩家获胜,他就会拥有两点,而对手仍然一无所获。根据前文讨论的结果,他将得到56枚金币。如果第一个玩家输了,他们的点数之比就是1∶1,他将得到32枚金币。因此,这名玩家肯定会说:“如果此时终止赌局,就先从56枚金币中把我肯定会得到的那32枚金币给我,然后我们再平分剩下的金币。从56枚金币中拿走32枚,还剩24枚。我们平分之后,各得12枚。12枚加上之前的32枚,我应该得到44枚金币。”这是公平分配的一个递归过程。接着,帕斯卡又分析了点数要求较高的赌局,并给出了这个问题的一般解。附录2 抛硬币的物理学原理从罐子中取鹅卵石、抛硬币、掷骰子和洗牌都是基本的概率模型,那么,这些模型与现实世界中的相应活动有什么关系呢?这些基本模型还经常被应用于复杂得多的环境,计算事件发生的概率。比如,伯努利就曾利用这类模型,对两名网球选手连续得分的情况进行了研究;托马斯·吉洛维奇(Thomas Gilovitch)、阿莫斯·特沃斯基(Amos Tversky)和罗伯特·瓦[20]隆(Robert Vallone)则利用它们来研究篮球运动员的“热手效应”。但问题是,这些研究难道不应该兼顾物理学和心理学两个方面吗?上面提到的这些例子都有据可考。我们先来看单次抛硬币的情况,以便让大家有一个初步认识。然后,我们因势利导去分析其他例子。[21]让我们看一下抛硬币的物理学原理。当硬币从手上弹起时,它有一个向上的初速度v(英尺/秒)和一个翻转速度ω(转/秒)。牛顿告诉我们,如果v和ω已知,那么硬币下落需要的时间以及落下后是正面还是反面朝上都是确定的。模型中硬币的相空间如图1–4所示。单次抛硬币相当于这个平面上的一个点。考虑图1–4中的这个点。它的初速度很快(因此,硬币的上升速度很快),但翻转速度很慢。因此,被抛起的硬币就像手抛比萨一样,几乎不会翻转。同理,v小、ω大的点的翻转速度很快,但由于被抛起的高度不够,也可能连一次翻转都无法完成。因此,如果初始状态的硬币位于靠近两条坐标轴的区域,它就不可能翻转。图1-4 单次抛硬币的v-ω平面邻近这个区域的依次是硬币翻转一次的区域、硬币翻转两次的区域,依此类推。完整的图形如图1–5所示。图1-5 双曲线使得部分相空间变得泾渭分明。阴影区域对应的是使硬币正面朝上的初始状态,空白区域对应的是使硬币反面朝上的初始状态。翻转速度的单位是转/秒认真观察图1–5(并运用一些简单的数学知识),就会发现图中远离0的区域彼此逐渐靠近。因此,初始状态的小变化会带来正面朝上或反面朝上的不同结果。要做进一步分析,就必须知道下面这个问题的答案:当真实世界的人抛真正的硬币时,与之对应的点在图中的哪个位置?我们做了一些实验,结果发现一次正常的抛硬币大约需要1/2秒,硬币的翻转速度大约为40转/秒。根据图1–5中的单位,初始速度的值大约是1/5,非常接近零;而翻滚速度ω为40个单位,远远超出了该图的范围。根据该图的数学含义,我们知道这些区域彼此接近的程度。再结合我们做的实验,可以看出:抛硬币的公平程度可以精确到小数点后两位,但不能精确到小数点后三位。上面分析的是一种简单模型的情况,它假设硬币将沿着一条穿过其自身的轴翻转。事实上,真实硬币的情况要复杂得多,是一种独特的进动。论文《抛硬币的动态偏差》(Dynamical [22]Bias in the Coin Toss)在设定大量的附加条件并参考大量文献资料的基础上,对硬币的运动方式进行了全面细致的分析。分析结果表明,大力抛掷普通硬币会有微小的偏差,开始时朝上的那一面在落下后仍然朝上的概率大约是0.51。这些分析给了我们什么启示呢?标准模型可以非常近似地模拟真实情况。要想探测出0.50和0.51之间的差异(也就是说,要精确到小数点后两位),我们需要用标准模型进行大约25万次抛掷。我们希望标准模型的其他一些实例同样有效。伽利略的骰子与抛硬币的情况类似,而轮盘赌和洗牌则是另一种情[23]况!对简单的抛硬币进行诚实分析竟然会让我们陷入如此复杂的局面,那么,按照莱布尼茨和伯努利的设想,对需要技巧的游戏进行概率分析,或者将概率应用于医学和法律领域,情况会不会更加复杂呢?伯努利非常赞同下面这个观点:请问,人世间疾病的种类如此繁多,可以在任何年龄侵袭人体的无数部位,或者预示死亡即将降临,那么,这些疾病的数量到底是由什么人决定的?谁可以决定哪种疾病(比如,是瘟疫还是水肿,或者是水肿还是发热)更容易杀死我们呢?谁又能在此基础上预测未来的生死呢?同样地,谁可以计数空气每天发生的数不胜数的变化,并在此基础上预测出它一个月(甚至一年)后的成分呢?又或者,谁可以充分洞见人类思想的本质或者人体的奇妙结构,从而敢于在赌博结果完全或部分取决于玩家的机敏度的游戏中,确定到底哪一位玩家将会胜出呢?在这些以及类似的情况下,最后的结果可能是由一些完全隐藏的原因决定的,这些原因还可以通过无数种方式组合到一起,足以抹杀我们的所有努力。因此,试图以这种方式预[24]测未来的情况,显而易见是疯狂之举。伯努利认为他的大数定律可以回答这些问题,在接下来的几堂课中,我们将对他的答案是否恰当做出评估,并讨论另外几个可能的答案。附录3 巧合与生日问题我们每个人都会遇到巧合,在这种情况下,我们应该感到惊讶还是担心呢?简单的生日问题(及其变体)已经变成了一个有效的工具,可用作人们的惊讶程度的测量标准。如果23人中出现有人生日相同的情况,大多数人都会感到惊讶,但本堂课开头介绍的简单计算告诉我们,根本不需要为此感到惊讶。现在,我们把这个计算方法抽象化,并做进一步延伸。我们来看一下“手表”问题。最近,有秒针的老式手表变成了一种时尚。我们认为,秒针的位置是“随机的”,即所有秒针完全不同步,指向1到60秒的可能性完全相等。假设有N个人,每个人都戴着一只有秒针的手表。那么,有两个或两个以上人的手表秒针正好指向同一位置的概率是多少?这是包含60个类别的生日问题,而最初的生日问题有365个类别。抽象化之后,考虑类别数量C(在手表问题中,C=60,而在生日问题中,C=365)。一共有N个人,他们彼此独立,并均匀分布在 {1, 2, 3, …, C} 中。这些数字各不相同的概率是多少?当然,这取决于C和N的值;如果N=C+1,概率就是0。我们把这个概率叫作P(C, N)。根据前面的分析,P(C, N)=这个公式简单明了,在C和N的值确定之后,我们就可以用袖珍计算器算出精确的答案。但这对我们理解这个问题并没有多大的帮助。为方便以后应用,我们可以通过一个简单的近似公式来计算。研究表明,当N=1.2时,概率接近1/2。对手表问题而言,1.2=9.3,所以,一场比赛至少有10个人赔率相同。但在直觉上,这似乎是一个惊人的巧合。(对最初的生日问题而言,1.2=22.9。)我们用命题的形式来表述这个近似公式。命题:如果有N个人和C种可能性,且N和C很大,则不匹配的概率为–N(N – 1)/2CP(C, N) ~ e。证明:在证明过程中,我们需要使用对数的一个简单属性,即当x很小的时候,log(1–x) ~ –x。那么2/3>当N和C较大时,N/C非常小,计算所得的近似值是精确的。在本书作者之一佩尔西·戴康尼斯(Persi Diaconis)和弗[25]雷德里克·莫斯特勒(Frederick Mosteller)的巧合现象研究中,生日问题应用得更多。他们还运用这些想法,研究多重巧合的情况。比如,要使三个人的生日相同的概率达到1/2,N应该多大?(答案是:约81个人)。有人试图利用巧合现象大做文章,但我们反其道而行,提供了一种简单的概率模型,供大家比较鉴别。该模型可用于研究教室中的生日匹配现象,而且研究结果真实可信。但是,有的读者可能会用它来研究高级餐厅里的人群。由于人们经常在生日当天被邀请去餐厅就餐,所以在某个晚上出现多个生日匹配现象的可能性非常高。这样一来,我们这个概率模型的假设条件就不成立,所以它无法得出正确的结论。这个警示适用于本章中提到的所有简单概率模型,更多内容详细见戴康尼斯和[26]苏珊·霍姆斯(Susan Holmes)2002年发表的论文。[1] echoed by Cicero in De Natura.[2] A superb history of early probability is in James Franklin’s The Science of Conjecture: Ev-idence and Probability before Pascal (Baltimore: Johns Hopkins University Press, 2002). Franklin examines every scrap of evidence we have, from the Talmud, early Roman law, and insurance over many ethnicities. He makes it clear that people had all sorts of thoughts about chance, but not a single quantitative aspect surfaces.[3] The same issues come up in measuring any basic quantity, for example, the weight of the standard kilogram or the frequency of light. Careful discussion is the domain of measurement theory. For an extensive discussion, see D. H. Krantz, R. D. Luce, P. Suppes, and A. Tversky, Foundations of Measurement, Vol. I (1971), Vol II (1989), Vol III (1990), (New York: Academic Press). For an illuminating discussion of how the Bureau of Standards actu-ally measures the standard kilogram, see D. Freedman, R. Pisani, and R. Purves, Statistics, 4th ed. (New York: W. W. Norton, 2007).[4] For discussion, see S. Stigler, Seven Pillars of Statistical Wisdom (Cambridge, MA: Har-vard University Press, 2016).[5] This kind of virtuous circularity appears throughout science. For an illustration in a much richer setting, see George e. Smith, “Closing the Loop: Testing Newtonian Gravity, Then and Now,” in Newton and Empiricism, ed. Zvi Beiner and eric Schliesser (Oxford: Ox-ford University Press, 2014): 262–351.[6] 促使等概率这个概念逐步完善的道路是什么?继续阅读这本书,你就会找到答案。[7] Written about 1564 but published only posthumously. See O. Ore, Cardano, the Gambling Scholar (Princeton: Princeton University Press, 1953), for translation and commentary.[8] Our chapter 7. There are a lot of connections between the early gambling literature and the foundations of probability. See D. Bellhouse, “The Role of Roguery in the History of Probability,” Statistical Science 8 (1993): 410–20.[9] 这个问题的表述有一个奇怪的地方,那就是对长期观察这个表达的解释。观察必须持续进行很长时间。根据伽利略的计算,得到9点的概率是25/216,约等于0.116;得到10点的概率是27/216,约等于0.125。两者相差0.009,约等于1/100。大家可以计算一下需要观察的次数,当作一次练习。[10] 在继续阅读之前,大家可以先考虑一个问题。假设在赌局开始之前,双方约定在8次抛掷中率先掷出6点的玩家可以拿走桌上的10美元,那么给你5美元,让你放弃第4次投掷机会,你愿意接受吗?这是否公平?[11] 我们可以假设他们抛掷的是一枚质地均匀的硬币。[12] See appendix 1.[13] Fermat sees this clearly, but Pascal seems to have either made a mistake or misidenti-fied the problem. See appendix 1.[14] Known in India since the second century BCe. For more of the history, see A. edwards, Pascal’s Arithmetical Triangle: The Story of a Mathematical Idea (Baltimore: Johns Hopkins Uni-versity Press, 2002).[15] For more on Huygens, see S. Stigler, “Chance Is 350 Years Old,” Chance 20 (2007): 33–36.[16] Isaac Newton had a copy and made notes, which can be found in D. T. Whiteside, ed., The Mathematical Papers of Isaac Newton, Volume 1 (Cambridge: Cambridge University Press, 1967). Thanks to Stephen Stigler for the reference.[17] 多年以后,霍华德·雷法(Howard Raiffa)在解决所谓的“埃尔斯伯格悖论”(Ellsberg Paradox)时也提出了类似的观点。我们在第3课讨论有关概率的心理学时将介绍这个悖论。[18] Incidentally, Newton, one of the great mathematicians of all time, had poor proba-bilistic skills. See S. Stigler, “Issac Newton as a Probabilist,” Statistical Science 21 (2004): 400–403.[19] Translated with extensive commentary by edith Dudley Sylla as The Art of Conjectur-ing, Together with a Letter to a Friend on Sets in Court Tennis (Baltimore: Johns Hopkins Univer-sity Press, 2006).[20] T. Gilovitch, R. Vallone, and A. Tversky, “The Hot Hand in Basketball: On the Misper-ception of Random,” Cognitive Psychology 17 (1985): 295–314.[21] Joseph Keller, “The Probability of Heads,” American Mathematical Monthly 93 (1986): 191–97.[22] P. Diaconis, S. Holmes, and R. Montgomery, “Dynamical Bias in the Coin Toss,” Siam Review 49 (2007): 211–35.[23] D. Bayer and P. Diaconis, “Tracking the Dovetail Shuffle to Its Lair,” Annals of Applied Probability 2 (1992): 294–313.[24] Quoted from the translation of Sylla, 327.[25] P. Diaconis and F. Mosteller, “Methods for Studying Coincidences,” Journal of the American Statistical Association 84 (1989): 853–61.[26] P. Diaconis and S. Holmes, “A Bayesian Peek into Feller, Volume I,” Sankhya 64 (2002): 820–41.第2课相关性判断就是概率弗兰克·拉姆齐我们的第2堂课要讨论的第二个关于概率的伟大思想是:判断是可以测度的,而具有相关性的判断就是概率。(下文将告诉大家相关性的确切含义。)在第1堂课讨论的经典赌博游戏中,我们是根据对称性做出判断的。我们认为,对称的情况发生的可能性相等。在这一课中,我们将看到关于各种可能情况的判断中隐含的置信度也是可以测度的。在用本堂课介绍的方法测量这些置信度时,我们还将发现,具有相关性的判断同样具有卡尔达诺和伽利略在计数等可能结果时发现的那种数学结构。我们如何估量下一年金融危机发生的可能性,采用某种治疗方案后病人可以存活下来的可能性,以及被告有罪的可能性呢?如何估量某位候选人在选举中获胜的可能性,发生大萧条的可能性,以及某种草率的政治行为引发战争的可能性呢?在直觉上,我们不可能像在公平的骰子游戏中那样,通过计数等可能情况的数量来计算概率。但是,根据莱布尼茨和伯努利的设想,法律、政治和医学等领域其实恰恰是概率计算最重要的用武之地。这些概率就相当于建立在可获得的最佳证据基础上[1]的置信度,但这并不意味着它们无法测算。接下来,我们将通过赌博来讨论概率的估算。在现实世界中,我们在很多情况下除了赌一把以外别无选择。预测市场(prediction market)或许是一个最简单的例子。比如,有一些网站,你可以在上面押注赌某个特定事件将会发生或不会发生,包括谁将成为某场足球赛、赛马或选举的赢家。预测市场不是一个新发明,早在16世纪就存在赌谁会当选教皇的市场[2]了。在典型的预测市场上,合约被定价为0~100点。任何时候你都可以看到买入和卖出的报价,比如买入56.8点、卖出57.2点。如果你想买入一份合约,你可以立即以57.2点的价格买入,或者报出57.0点的买入价,然后等待愿意接受这个价格的卖家。如果你以57.0点(即57美元)的价格买入一份希拉里·克林顿竞选美国总统获胜的合约,这意味着一旦她竞选成功,根据这份合约你将得到100美元的收益。当然,合约的价格会上下波动。把当前的市场价格视为市场概率,这是自然而然的事。如果C的发生概率是0.57,这个赌局的期望值就是57美元。也就是说,如果C发生,则收益为100美元;反之,收益为0美元。如果市场价格与概率的计算结果不相符,那么我们应该怀疑有人在从事市场套利活动。我们认为,你的报价(如果价格低于x,你就会少量购入,如果价格高于y,你就会卖出)应该可以准确地反映出你的概率。大量关于预测市场的信息资料如雨后春笋般展现在人们眼前。购买股票、债券和保险是密切相关的活动,下面列出的这[3]些原则可能对我们从事这些活动有所帮助。我们将本堂课的正式内容分为两个部分,分别介绍一种简单的方法和一种复杂的方法。就像早期的赌徒那样,对当下讨论的这些问题而言,我们先要假设金钱是价值的量度。有了这个先决条件,我们就可以通过直截了当的方式估算判断概率(judgmental probability),并推断这些具有相关性的判断的数学结构。第二部分则舍弃了这个假设前提,进行了更具一般性的分析。这样一来,“概率和效用都是可以测量的”伟大思想就完整了。这套理论的主导思想是由年轻的天才弗兰克·拉姆齐于20世纪20年代提出的。20世纪50年代,美国统计学家伦纳德·吉米·萨维奇(Leonard Jimmie Savage)使其得到了全[4]面发展。部分Ⅰ:赌博与判断概率在测度判断概率时,我们借鉴惠更斯的做法,逆向应用帕斯卡与费马提出的方法。也就是说,我们用期望值来计算概率,而不是通过概率来计算期望值。我们认真考虑某个人愿意在某个事件上押下的赌注,以此估算该事件的期望值。你的判断概率的加权平均值,就是事件的期望值。具体来说:

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载