角斗士、海盗与信任博弈(txt+pdf+epub+mobi电子书下载)-txtepub下载

作者：（以）哈伊姆·夏皮拉

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

角斗士、海盗与信任博弈试读：

角斗士、海盗与信任博弈[以]哈伊姆·夏皮拉著云山译中信出版集团引言本书讨论博弈论，并介绍一些重要的关于概率和统计的观点。这三大思想领域构成了我们在日常生活中做决定的科学基础。由于这些话题都相当严肃，所以我费了九牛二虎之力，尽量想让本书既严谨又有趣，至少不至于太沉闷。毕竟，享受生活和学习知识一样重要。另外，在本书中，你们将会学习到以下内容。●认识诺贝尔经济学奖得主约翰·纳什，并熟悉著名的纳什均衡。●学习《谈判的艺术》中的基本观点。●回顾“囚徒困境”中的每个方面，并学习合作的重要性。●介绍战略思维领域的世界冠军。●审视稳定婚姻问题，并探究它如何通向诺贝尔奖。●参观一个角斗场，并得到一个教练的位置。●在拍卖中竞标，并希望避免“赢者的诅咒”。●学习统计数据的支持在哪儿。●了解手术室中概率的存在。●发现斗鸡博弈与古巴导弹危机有何关联。●建一座机场并分一份遗产。●发出最后通牒并学习信任。●参与约翰·凯恩斯的选美比赛，并研究其与股票交易的关联。●从博弈论的角度讨论公平的意义。●认识杰克·斯帕罗船长，并发现海盗是如何民主瓜分财产的。●寻求玩俄罗斯轮盘赌的最佳战略。第一章用餐者困境如何快速失去许多朋友？在这一章里，我们会去一家餐厅，来看看博弈论到底是什么，为什么它这么重要。我也会举一些我们在日常生活中遇到的博弈论案例。请想象以下场景：汤姆走进一家餐厅，坐下来，翻开菜单，他发现这里有他最喜欢的一道菜——罗西尼牛排。这道菜以意大利伟大的作曲家焦阿基诺·罗西尼的姓氏命名。它将牛里脊肉排（即菲力牛排）用黄油在平底锅里煎过后，放在油煎面包块上，顶上放薄薄一层鹅肝酱，再用几片黑松露装饰一下，最后浇上马德拉酱汁。简言之，这道菜里的所有东西都不利于你的心脏健康。这确实是一道非常美味的菜，但也非常昂贵。假设它标价为200美元，现在汤姆必须决定：点还是不点。这听起来非常戏剧化，甚至有点莎士比亚风格，但这确实不是一个很难做的决定。汤姆需要做的只是想想这道菜带给他的快乐值不值这个标价。请记住，200美元对不同的人有不同的意义。对大街上的乞丐来说，这是一笔很大的财富。但如果你往比尔·盖茨的银行账户里转200美元，他不会感到有什么变化。不管怎样，这是一个相对简单的决定，也和博弈论毫不相干。那我为什么要给你讲这个故事呢？博弈论在这里又有什么作用？原因在此。设想汤姆并不是独自用餐，他是和9个朋友一起来到这家餐厅的。他们10人围坐在一张桌子旁，并且一致同意不要各付各的，而是平摊账单。除了汤姆之外，每人都点了自己的简餐：一份家常炸土豆；一个芝士汉堡；一杯咖啡；一杯苏打水；我什么都不要，谢谢；一杯热巧克力；等等。当他们都点完了，汤姆突然灵机一动，向服务员说道：“我要罗西尼牛排，劳驾。”他的决定看起来非常简单，且从经济和战略角度看都不错：他让自己欣赏了一场罗西尼美味“歌剧”，却只支付了其标价的十分之一。汤姆的选择是否正确？这究竟是不是一个好的点子呢？你认为他的9个朋友接下来会怎么做？（或者数学家会问，这场博弈将如何进行动态变化？）每一个作用力会引发一个反作用力（牛顿第三定律的缩略版）我了解汤姆的这些朋友，而且可以告诉你，他的这一举动无异于一次宣战。餐厅服务员被叫了回来，每个人都突然想起来他们非常饿，菜单上的那些昂贵的菜都很诱人。家常炸土豆很快被替换成卢布松松露饼。芝士汉堡不要了，换成一块2磅（约0.9千克）重的牛排。汤姆的那些朋友突然都变成了伟大的美食鉴赏家，专挑菜单上昂贵的那部分点，甚至还点了几瓶昂贵的葡萄酒。当最后结账时，大家平摊账单，每个人都要支付410美元。无独有偶，科学研究显示，当几个人分摊聚餐账单时，或当免费分发食物时，人们会要得更多——我相信你不会对此感到惊讶。汤姆意识到他犯了一个可怕的错误，但只有他犯了这个错误吗？每个人都不想吃亏，试图避免被汤姆用这种方式愚弄，结果点了他们根本不想点的食物，且付出的钱比他们原本想花在食物上的要多得多。我还没说他们因此摄入了多少卡路里……那他们是不是应该少花一些，仅让汤姆一人享受他的梦想美食呢？你来决定。不管怎样，这将是这群人的最后一次聚餐。这个在餐厅发生的场景展示出几位决策者之间的互动，是一个博弈论研究的现实案例。“互动决策理论或许对于那个常常被称为博弈论的学科而言，是个更具描述性的名称。”——罗伯特·奥曼（摘自《论文集》）以色列数学家罗伯特·奥曼教授因其在博弈论领域的创举，在2005年获得诺贝尔经济学奖。根据他的定义，我们将博弈论确定为一种互动决策的数学形式化。在本书中，我会尽力避免使用数字和公式，很多优秀的书也都是这么做的。我会试着呈现这个专业更有趣的方面，并聚焦那些深刻的见解和要点。博弈论是将理性玩家的礼尚往来公式化，同时假设每一个玩家的目标是使其收益最大化，无论这个收益是什么。玩家可能会是朋友、敌人、政党、国家，或是其他任何有真正互动行为的行为体。博弈分析的问题之一是，作为一个玩家，很难知道什么能使每一个玩家都受益。另外，我们很多人甚至都不清楚自己的目标是什么，或者什么能使我们受益。我想我应该在此指出，参与者获得的奖赏不仅仅是用金钱来衡量的。奖赏是玩家在游戏结束后获得的满足感，它可能是积极的（如金钱、名声、客户、荣誉等），也可能是消极的（如谎言、浪费时间、财产被破坏、幻想破灭等）。如果我们参加一个游戏，游戏结果取决于其他玩家的决定，当我们即将要做一个决定时，我们就会假设，在大多数情况下，其他玩家会和我一样聪明和以自我为中心。也就是说，不要指望你在享受罗西尼牛排时，其他人会一边抿着苏打水，一边分摊账单，同时愉快地分享你的乐趣。我们有很多办法将博弈论运用到日常生活中：商业谈判或者政治谈判，设计一次拍卖（你既可以选择英国模式，即价格持续上升；也可以选择荷兰模式，即起价很高，然后持续砍价），边缘政策模型（古巴导弹危机，伊斯兰对西方世界的威胁），产品定价（可口可乐应在圣诞节前降价还是涨价，百事可乐应如何应对），街边小贩如何与偶遇的游客讨价还价（降低其货品价格的最佳速度是什么？降得太快可能会暗示商品不值钱，而降得太慢有可能让游客失去耐性而离开），捕鲸限制（所有那些仍和以前一样捕鲸的国家希望对其他国家设置捕鲸限制，因为若不设限，鲸鱼将很快灭绝），为棋盘游戏想出聪明的战略，理解合作的演变，求爱策略（人类和动物），军事战略，人与动物行为的进化（我的热情正在衰退，已经开始泛化），等等。真正的问题是，博弈论是否真的可以帮助人们改进日常做决定的方式？人们对此有不同观点。一些专家确信，博弈论能对几乎所有的事情都产生关键影响；但也有不少专家相信，博弈论只是一些好看的数学运算。无论如何，它是一个迷人的思想领域，为我们生活中各种各样的问题提供了无数的见解。我认为，教授和学习博弈论与其他事物的最好办法是通过案例。我们看的例子越多，就越能更好地理解事物。那么就让我们开始吧。第二章勒索者悖论“让我们永远不要因为害怕而谈判，而要永远不害怕谈判。”——约翰·肯尼迪在这一章中，我们将学习一个由罗伯特·奥曼发明的关于谈判的游戏。这个游戏很简单，但它有可能会误导人们——它隐藏了一些深刻的见解。勒索者悖论最初是由罗伯特·奥曼提出的。他是一位伟大的通过博弈论分析法来研究冲突与合作的专家。以下是我的解读。乔和莫走进一间黑屋子，里面有一位高个子、黑皮肤的神秘陌生人等着他们。他身着黑色西装，系着一条黑领带。他取下墨镜，将一个公文箱放在房间中间的一张桌子上。“在这里面，”他指着公文箱不容置疑地说道，“有100万美元现金。不久后这些钱就会成为你们的。但有一个条件，你们俩必须决定如何分这笔钱。只要你们能达成协议，任何协议都行，这钱就是你们的。如果达不成一致，这钱就还给我的老板。我现在把你们留在这里，你们考虑一下，我一个小时后再回来。”高个子男人说完就离开了。那么，让我来猜猜，你现在怎么想的：“这个太简单了吧！完全不需要动脑子。没有进行谈判的必要。我说，为什么一个诺贝尔奖得主会担心这样的事情？我没听漏什么吧？当然没有。这是世界上最简单的游戏了。乔和莫需要做的只是……”沉住气，我的朋友。先别着急下结论。请记住，事情往往不像看起来那么简单。如果这两个玩家只需要平分这笔现金然后回家，我不会在书里写他们。这是之后真正发生的事情：乔是一个好心和体面的人，相信他具有大多数人的素质。他满脸笑容地望向莫，一边搓着手一边说：“你相信那个人吗？他可真有趣！他给了我们一人50万美元。我们都不用谈判。让我们结束这个愚蠢的游戏，平分这笔钱，然后好好庆祝一番，怎么样？”“所以这对你来说只是一个愚蠢的游戏，是吗？”莫说道，语气听起来有些不友好。“我觉得很有意思。你在这里胡言乱语，愚蠢地建议要平分，我倒是有一个更加合理的解决办法。我的方案是这样的：我拿走90万美元，你拿走剩下的10万美元。你能拿这么多，是因为我今天心情刚好不错，知道吗？这是我最后的提议。接不接受随你便。如果你接受，你可以赚10万美元。如果你不接受，那也没问题。我们什么也拿不到，我一点儿也不在乎。”“你不是在开玩笑吧？”乔说道。他开始感到担心。“绝不！别忘了我的外号叫‘金钱怪兽’。你这样的人只配当我的早餐。我从不开玩笑，而且也没有这个习惯。这是我最后的报价，不容谈判！”“你这是怎么了？”乔都快喊起来了，“这是一个由充分了解情况的两个玩家参与的对称博弈。你没有任何理由应该比我多拿一分钱。这说不过去，而且一点儿也不公平。”“听着，你说的太多了，我头都疼了。”莫说，他的上嘴唇明显开始抽搐，“你再多说一句，我会把给你的那份降到5000美元。你现在要说的只是‘好吧，就这么做’，否则我们都空手离开。”于是，乔说：“好吧。”游戏结束。这在一个简单游戏里是如何发生的？乔在哪里做错了？当我在一份主流经济类报刊上提到这个游戏时，我遭遇了大量愤怒的政治声讨，左翼到右翼都有（这证明我的文章是平衡和公正的）。因为读者都理解，这不是关于乔和莫参加的一个游戏，而是有关我们真实生活的谈判。在很多年前，我曾有幸在奥曼教授的门下学习。奥曼教授认为，这个故事与阿以冲突密切相关，并且大体上能教我们一两点关于解决冲突的办法。我们也能在历史谈判中看到不同的勒索者悖论的影子，如1919年的巴黎和会（会议签署了《凡尔赛条约》）、1939年的《莫洛托夫-里宾特洛甫条约》（即《苏德互不侵犯条约》）、2002年的莫斯科大剧院人质危机，以及最近在伊朗共和国和几个大国之间进行的核谈判等。奥曼认为，以色列在与邻国启动谈判时，必须考虑以下三点：第一，它必须考虑面对谈判（或博弈）达不成任何协议的可能性；第二，它必须意识到谈判有可能反复；第三，它必须确定自己的底线，同时坚守住这条底线。我们先讨论前面两点。如果以色列不希望谈判无功而返，那么它就有战略上的缺陷，因为这个谈判不再是对称的。那个在心理上有失败准备的一方就会获得巨大的优势。同样，当乔愿意做出痛苦的让步，接受羞辱的条款以便达成协议时，他的立场会影响未来的谈判，因为当玩家再次碰面时，莫有可能会给出更差的条件。更重要的是，在真实生活中，时间也很关键。考虑一下，莫想勒索乔，乔不慌不忙，试着通过谈判来改变这一不公正的提议。莫坚持不变，乔再次努力，但时间一点点过去……突然有人敲门了，公文箱的主人回来了。“喂，你们两位达成一致意见了吗？”他问道，“还没有？好吧，钱我拿走了，再见。”他走了，留下诚实的乔和勒索者莫，他们一分钱也没有拿到。这实际上是商业界中尽人皆知的情况。我们时不时会听到这样的新闻，一家公司收到了一个试探性的收购报价，但还没等适当讨论，这一报价就被撤走了。一般情况下，我们需要考虑这个给定资源的性质，它的价值可能会随着时间的流逝而被崩减，尽管它都没被用过。我们把它称为“冰棒模型”：一个持续融化直到消失的好东西。这里有一个现代寓言。一个富得不能再富的商人做生意很有一套。他想出价购买一家公司，并规定他给出的价格每天都会缩点水。我们假设他向以色列和约旦政府出价，声称自己想出价1000亿美元购买死海（死海每天都在缩小，没准儿有一天真的会死去），而且他的出价每天都会降10亿美元。如果这两个国家经过官僚主义的繁文缛节或是政治纷争，最终花了相当长的时间才给出答复，他们很可能最终只能得到这个商人一小笔钱，让他拿走死海，这会让这个商人成为死海的主人，从而变得更加富裕。现在我要告诉你，从勒索者的故事中，我得出了以下结论。1.与一个非理性的对手进行理性的竞争往往是不理性的。2.与一个非理性的对手进行非理性的竞争往往是理性的。3.当你更深刻地思考这个游戏（以及生活中的类似场景）时，会发现理性的方式往往不那么清楚（就连“理性”这个词的含义都不清楚——毕竟，莫是这个游戏的赢家，并且拿走了90万美元）。4.当你试图从对手的角度猜测他会怎么做时，你需要非常小心。你不是他，也永远不知道什么会让他做出反应，以及为什么会做出反应。很难甚至不太可能去预测别人在一定情况下会如何反应。当然，我有足够的例子来阐明我的观点。我随机挑选了一些。2006年，格里戈里·佩雷尔曼教授婉拒了菲尔兹奖（相当于数学家的诺贝尔奖），他说：“我对金钱和名声都不感兴趣。”2010年，他因为证明了庞加莱猜想（Poincaré conjecture）而获得100万美元的奖金，但他再次拒绝领取奖金。你看，有些人不喜欢钱。在第二次世界大战期间，约瑟夫·斯大林拒绝了一个战俘交换提议：即用苏联人在斯大林战役中逮捕的一名德国司令官换取他自己的儿子雅科夫·朱加什维利，后者自1941年起就被德国人俘虏。“我不会用一名将军交换一名士兵。”斯大林宣称。与此同时，也有一些人把自己的肾脏捐给了完全不认识的人。为什么呢？你的猜测和我差不多。弗拉基米尔·普京一天早上醒来，决定了克里米亚半岛的未来。我甚至还没来得及开始猜测这个决定。事件发生之后，一些政治大腕为普京的行为给出了巧妙的解释（你可以上网搜一下）。但唯一的问题在于他们没人预测到这一举动，这足以证明他们对普京的思维方式毫无概念。现在，最重要的见解如下。5.虽然学习博弈论模型很重要也很有帮助，但我们必须记住，通常情况下，生活中的真实事件比它们最初看起来要复杂得多（当我们第二次和第三次审视它们时，它们并没有变得更加简单），没有数学模型能够捕捉到它们整体和全部范围的复杂性。数学更适合研究自然的规律，而非人类的本性。即使我们不完全了解事实，进行谈判也是我们生活中的必要成分。我们同配偶、孩子、合作伙伴、老板以及下属都会谈判。当然，谈判也是国家间外交关系或政治机构行为（如组建联盟时）的基石。因此，当发现不仅仅是普通人，连那些重要的政治人物和经济人物有时也会表现出十分拙劣的谈判技巧和谈判哲学时，这不能不让人感到惊讶。在下一章中，我们将读到一个与谈判有关的著名博弈。第三章最后通牒博弈在这一章中，我会着重谈一项经济学实验。这项实验对人类行为进行洞察，动摇了标准的经济学假设，表明人类不愿接受不公正，并清楚地显示经济人（Homo economicus）与真正的人之间的巨大差异。我们也会研究在一个重复出现的最后通牒博弈版本中不同的谈判策略。1982年，德国科学家维尔纳·居特（Werner Güth）、罗尔夫·施密特伯格（Rolf Schmittberger）和贝恩德·施瓦策（Bernd Schwarz）就他们进行的一项实验撰写了一篇文章。这项实验的结果让经济学家（仅仅是经济学家而已）很是惊讶。这项被称为最后通牒博弈的实验自此成为世界上最著名也是研究最多的博弈实验之一。这个博弈类似于勒索者悖论，但有着非常关键的不同。最主要的不同是最后通牒博弈的非对称性。博弈是这样进行的。两位互不相识的博弈者处于同一个房间内。我们姑且称他们为莫里斯和鲍里斯。鲍里斯（让我们称他为提议者）获得了1000美元，并要求用他认为合适的方式与莫里斯（让我们称他为回应者）分享。这里唯一的条件是回应者必须同意提议者的分配方式：如果他不同意，这1000美元就会被拿走，两位博弈者将一无所获。请注意，参与游戏的两位博弈者充分了解情况。这样，如果鲍里斯给莫里斯10美元，而且莫里斯也同意，那么鲍里斯将拿走990美元。但是，如果莫里斯对这一提议不满意（他知道鲍里斯有1000美元），那么他们两人都会空手而归。你认为会发生什么？莫里斯会接受鲍里斯10美元“慷慨”的提议吗？如果你参加这个博弈，你会提议多少？为什么？如果你是一个回应者，你能接受的最少数额是多少？为什么？数学vs心理学我相信这个博弈会指向一个巨大的张力，这个张力经常存在于基于数学原则的决定（“标准”决定）和基于直观原则和心理学的决定（“积极”决定）之间。从数学角度看，这个博弈很容易解决，但是美好而简单的解决办法并不一定是明智的。如果鲍里斯希望使他的个人收益最大化，他应当提议1美元（假设博弈的最小单位是美元，不是美分）。面对这样一个提议，莫里斯面临着莎士比亚的困境：“拿还是不拿，这是个问题。”如果莫里斯是一个普通的经济、数学和统计学人——数学爱好者和坚定的理性主义者——他会问自己一个问题：“哪个更多，1美元还是0美元？”很快，他会想起自己的幼儿园老师曾经说过，“一个总比没有强”。于是他会拿走这1美元，给鲍里斯留下999美元。但是，真正的博弈永远不会这样进行。如果莫里斯只接受这1美元，这确实不合逻辑，除非他确实很爱戴鲍里斯，希望成为他的恩人。更有可能的情况是，这个提议会惹恼甚至侮辱莫里斯。毕竟，莫里斯不是那样一个极端的理性主义者。他有着人类的情感，例如生气、诚实、嫉妒等。知道这些后，你认为鲍里斯会如何提议，从而实现整个交易？我们也可能会问，为什么一些人仅仅因为听说或坚持认为自己知道对方会拿到的数额，就拒绝接受向他们提议的数额——有时也会是很大的数额。我们如何将侮辱也作为因素计入数学计算中？如何量化侮辱？人们愿意放弃多少以避免感觉被人当成傻子？这个博弈曾在不同地方试验过，包括美国、日本、印度尼西亚、蒙古、孟加拉国和以色列。这类博弈不仅涉及金钱的分配，还包括珠宝（在巴布亚新几内亚）和糖果（当小朋友参加游戏时）。经济学学生和佛教的冥想者，甚至黑猩猩也都参加过这场博弈。我总觉得这个博弈有着无法抗拒的吸引力，并用它做了好几次实验。在很多现实生活的情境中，我看到人们拒绝了侮辱性的提议，如很多人拒绝接受低于总数额20%的提议（这是在很多不同文化中都观察到的现象）。当然，这个20%的界限仅仅适用于博弈金额相对较小的情况。这里的“相对”非常重要。我是说，如果比尔·盖茨提议给我他全部财产的哪怕0.01%，我也不会觉得被冒犯。跟往常一样，没什么事情很简单，也没有什么明确的结论等着我们。例如，在印度尼西亚，博弈者获得了100美元——这在他们那里是相对较大的数额——然而一些博弈者却拒绝了30美元的提议（相当于两周的工资）。是的，人都很奇怪，但有些人比大多数人都奇怪，甚至超出了我们的预期。在以色列，我们也看到有人对从500新谢克尔的总额中分到150新谢克尔的提议感到不满意：在150和0之间做出选择，他们的选择是0。这看起来像是一个伟大的时刻，揭示了近来关于价值的一个伟大发现：150比0要大。既然如此，为什么人们会做出上述选择？回应者知道提议者留下了350新谢克尔，而不愿意接受这个现状，认为这极不公平且具有侮辱性。一分也不接受对他的神经更好。在过去，数学家对人们的正义感没有给予足够的重视。现在，他们对此重视了。最后通牒博弈从社会学家的角度来看很迷人，因为它说明人类不愿意接受不公正，同时强调荣誉的重要性。宾夕法尼亚大学的心理学家和人类学家弗朗西斯科·吉尔-怀特（Francisco Gil-White）发现，在蒙古的一些小型社区，提议者倾向于提议数额平分，无论他们是否知道非均匀的分配几乎总是会被接受。或许好的声誉比经济奖励更有价值。“美名胜过美好的膏油。”——《传道书》7:1无知是福顺便说一句，如果回应者事先不知道提议者最后会留下多少钱，那些奇怪的行为（在一次性的匿名博弈中拒绝大量金钱）都不会发生。因此，知道得多并不总是优势。如果我提议你接受100美元，不给你其他任何信息（不告诉你如果你接受了我的提议，我就会得到900美元），你很有可能会拿上这笔钱，给自己买点好东西。《传道书》里提到，“因为智慧多，所以愁烦就多有”（1:18），这是很有道理的。同样，以色列作家阿摩司·奥兹提到他曾经看过一部美国动画片，里面有一只猫一直往前跑，直到抵达了一个深渊边缘。那只猫是怎么做的呢？如果你看过动画片《猫和老鼠》，你就会知道答案：那只猫没有停下来。它会在空中继续跑，然后在一个很关键的时刻，它意识到自己正悬在空中，而只有在那时，这只猫才会像一块石头一样掉下去。那么是什么让它突然掉下去的呢？答案是：知识。如果这只猫不知道自己的爪子下并没有支撑，它就会在空中一直往前走，直到中国。那么，我们该怎么进行这个博弈呢？最佳提议会是什么？当然，这取决于许多变量——包括我自身对冒险欲望的限度。显然，没有一个统一的答案，因为这是一件相对个人的事情。此刻，另一个重要的问题是关于这个博弈进行的次数。在一次性的博弈中，最合理的策略是我们把对方给的都拿走（除非我们觉得这样实在太受欺负），可以买一本书、看场电影、吃个三明治、买顶漂亮的帽子，或做点慈善——有总比没有好。但是，如果这个最后通牒博弈重复出现，故事就会完全不同。虚假的威胁和真实的信号在重复出现的最后通牒博弈中，拒绝大笔金额其实是有道理的。为什么？给对方一个教训，并发出一个清晰的信号：“我没有那么廉价。看，你提议给我20美元，我拒绝了你。下一次，你最好改进你的出价。我甚至会建议你考虑平分，否则你会一无所得。”但是，任何事情都不会像看起来那么简单。如果回应者在第一轮拒绝了200美元，那么接下来提议者会提议多少？在这种情况下，需要考虑几种可能的反应。一种方案是，为了不让回应者生气，提议者应在第二轮一开始就给出500美元。毕竟，他已经毁掉了一次交易，如果再这样就会丢脸了。问题是，一次性从200美元涨到500美元，会让提议者显得很弱。回应者可以通过再次拒绝提议，从而试图压榨出更多的钱，他会想，他这次什么都不要，但可以强迫提议者在未来几轮给他600美元、700美元，甚至800美元。另一个可能的解决方案（普京的做法）是往相反的方向走。如果回应者拒绝了200美元的提议，提议者应给190美元。这样做的逻辑何在？这样的举动是向回应者发出信号：“你想来点狠的？我只会更狠。你拒绝一次出价，我就会少给你10美元。我经济立场坚定，你大可以拒绝我的出价，直到你气得脸色铁青。你会损失更多，而我一点也不在乎。”在这种情况下，回应者应采取什么策略？如果他认为，提议者确实很强硬，也许他会妥协。然而，表面上的冷酷也许只是一种虚假的威胁，所以……现在我们有一个问题，因为我们做的正是心理和大脑的博弈。心理学和数学完全不同，它没有什么确定的事。不管怎样，一次性博弈和重复博弈应该被区别对待，而且博弈者应采取不同的策略。但在一些情况下，参与者拒绝大的数额，是因为他们不知道这个博弈只玩一次，因此给对方发出信号没有意义：虽然提议者可能掌握了线索，但回应者永远也不会从这个学习曲线中受益，因为不会再有下一轮博弈了。通常（我不得不反复强调），事情不会像看起来那么简单。粉饰的乐趣2006年9月，我在哈佛大学举办了一场博弈论的研讨会。一位参加研讨会的科学家告诉我，最近得知，一部分在一次性最后通牒博弈中拒绝高获利提议的人是出于生物和化学的原因才这么做的。当我们拒绝不公正的提议时，我们的腺体会分泌出大量的多巴胺，产生出一种类似于性快感的效果。换句话说，惩罚不公平的对手是一种极大的乐趣。当我们如此享受拒绝时，谁还会想要这区区200美元呢？男人、女人、美和信号陀思妥耶夫斯基曾说：“美将拯救世界。”我不太了解这个世界，但美在最后通牒博弈中到底有多重要呢？（即使从经济角度看，美也是很迷人的。例如，美丽溢价，长得好看的人们比那些没那么美的同事挣得要多，这是一个众所周知的事实。）1999年，马利斯·施韦泽（Maurice Schweitzer）和萨拉·索尔尼克（Sara Solnik）研究了美貌在最后通牒博弈中的影响。在游戏中异性互为提议者和回应者。这是一次性博弈，涉及金额为10美元，而且在游戏开始时，两组队员都要为对方队员的颜值打分。结果是男性对长得漂亮的女性并没有慷慨（这让人有些惊讶），但女性却向吸引她的男性给予更多。有些人甚至从分配的10美元中拿出了8美元给对方。事实上，这是我们所知的在西方世界里进行的唯一一次平均的提议金额超过总金额一半的实验。我们能对此做出什么解释呢？我想，虽然他们被清楚地告知这是一次性的博弈，但这些女性想到的是重复进行的博弈。尽管男性不太善于理解暗示，但他们能理解“一面之交”的含义。显然，这些女人试图向这些美男子发出信号。“看，我给了你我的全部。一会儿你何不请我喝杯咖啡呢？”她们实际试图将这一次性的游戏发展成为“连续剧”。那位优秀的作家简·奥斯汀曾一语道破，她说：“一位女士的想象力是非常迅速的，它能在一瞬间从仰慕变成爱慕，从爱慕变成婚姻。”我相信，一旦跨出博弈的界限，女性参与者在战略性和创造性方面比男性参与者更有优势。女性对其行为产生的长期后果的关注是决策过程中一个重要且很受欢迎的品质。因此，彼得森国际经济研究所最近的一项研究指出有着更多女性领导者的公司更能产生盈利，也就不足为奇了。性别平等不仅仅关乎公平，它同时也是改进经营业绩的关键。法院最后通牒一个在法院环境下进行最后通牒博弈的例子是“强制许可”案例。当有人提出原创的新点子时，他或她会将此注册为专利，事实上就是一个受到许可的垄断。也就是说，专利拥有人可以阻止其他任何人使用他们的发明。虽然法律创设这条是为了鼓励人们通过创新和改革来对社会做出贡献，但事实上这种垄断很可能会被不希望其他人使用专利的专利所有者滥用，要不然就为授权许可收取大量费用——特别是当这个产品可能会获得广泛使用的时候。［最近，图灵制药公司的首席执行官马丁·什克雷利推高了一种被称为达拉匹林（Daraprim）的药物的价格。这种药物是普遍用于治疗艾滋病的抗寄生虫药物，从最初的每粒13.50美元一夜之间涨到每粒750美元。］在这类案例中，想使用这一专利的人可能要求法院给予他们强制许可，即无须首先获得发明者的允许。那些担心其他人会获得强制许可的发明者不会定出不合理的价格，他们将寻求一项协议，有可能无法获得曾经想从发明中获得的全部利润，但他们依然保有许可。就像在最后通牒博弈中的博弈者一样，发明者必须记住，有的时候你不得不做出妥协，虽然获得较少的收益，但有总比没有强。当事实和数学合二为一在最后通牒博弈的另一个版本中，有几位提议者提出了分配博弈金额的几种方法，而唯一的回应者可能会选择其中的一个方案，让其余的人都接受这种方案。在这里，事实与数学合二为一。在数学解决方案中，提议者提出将全部的金额都拿出来，因为这就是纳什均衡（我们之后会谈到这个，但简言之就是如果博弈金额是100美元，并且有一位提议者提出这个金额，那么其他金额少的提议者都不会有好的结果，因为回应者很自然会拒绝）。事实上，提议者希望自己的提议被选上，但同时担心其他提议者会给出更高的金额，这使提议者都倾向于给回应者几乎全部的金额。独裁者博弈这是最后通牒博弈的另一个版本。这里只有两位博弈者，提议者也被称为“独裁者”，拥有完全的控制权，而回应者必须接受独裁者提出的任何条件，事实上他是一个“徒劳的”博弈者。根据数学解决方法，提议者应当拿走全部的游戏金额。正如你肯定已经猜到的那样，标准的经济假设是对实际行为不准确的预测。通常情况下，“独裁者”并没有拿走全部的金额：他倾向于将一些钱（有时候他会给出很可观的金额，有时候他会平分金额）给回应者。他为什么会这样做？这能告诉我们关于人性的什么呢？这与利他主义、公平和自尊有何关系吗？你应该和我猜的一样。第四章人们参与的博弈在这一章中，我们会学一些既有趣又有启发性的博弈。我们会扩展我们的博弈词汇，获得一些启发，并改进我们的战略技能。与此同时，我们还会认识一些我认为可被称为“年度战略家”的人。让我们开始吧。博弈一海盗博弈“你应该相信‘不可信赖’，因为你总能发现人们将是不可信赖的。所谓‘值得信赖’才是你最不能相信的。”——杰克·斯帕罗船长，《加勒比海盗》一群海盗在经历了海上艰难的一天后回到家乡，他们带回[1]来100枚达布隆币（以下简称金币），需要在五个海盗头子之间进行分配。他们分别是亚伯、本、卡尔、唐和埃尔恩。亚伯是最大的头目，而埃尔恩是他们中间地位最低下的。尽管这里存在等级制度，但这个团队还是民主的，因此他们就分赃达成以下原则。亚伯提议了某个分配方案，然后所有海盗（包括亚伯本人）就此进行投票。如果这个方案获得大部分海盗的支持，他们就会执行亚伯的提议，博弈结束。如果得不到大家的支持，亚伯就会被扔进大海（即使民主的海盗也是很难受控制的）。如果亚伯不在了，就轮到本提出方案。他们再次投票。注意，现在有可能形成平局。我们假设在投票平局的情况下，提议将被放弃，而提议者将被扔进大海（但还有一个版本，即在平局情况下，提议者拥有决定性一票）。如果本的提议获得大多数海盗的支持，那么他的方案将获得执行。否则，他会被扔进大海，卡尔会面对越来越少的海盗提出一个方案。以此类推。这个博弈将一直继续，直到某个建议被大多数海盗投票接受。如果这个情况也没出现，那么埃尔恩会是最后一名活着的海盗，并拿走全部的100枚金币。在你继续读下去之前，请停下来想一想这个博弈将如何结束，假设所有的海盗都很贪婪且聪明。数学解决方案数学家通过逆向归纳法（backward induction）来解决这类问题，从结果倒推至开头。假设现在亚伯给出方案并且失败了，本的提议被拒绝而他本人也不在了，卡尔也没能做得更好。唐和埃尔恩是仅存的两名海盗，现在的解决方案相当明显：唐必须建议埃尔恩拿走100枚金币，否则唐很有可能落得在海里和鲨鱼共舞的结局（请记住投票平局也意味着提议者失败），而且不可能存活多久。唐是一个聪明的海盗，他建议埃尔恩拿走全部金币（见表4-1）。表4-1 唐的金币分配方案海盗卡尔也一样聪明，他知道上述情况将是游戏的最后阶段（如果能持续到这一步的话，而这正是卡尔希望尽全力避免的）。此外，卡尔知道他没有什么可以给埃尔恩的，因为埃尔恩的利益就是不管怎样都要努力进入下一阶段。然而，相比最后只剩下唐和埃尔恩时唐所面临的情况，卡尔可以帮助唐改善他的处境，并且可以通过给他一枚金币来让唐投票支持他（在这种情况下，唐会支持卡尔，他们将成为多数）。于是，当还剩三个玩家时，金币的分配是卡尔99枚，唐1枚，埃尔恩0枚（见表4-2）。表4-2 卡尔的金币分配方案本自然知道这些算计。他知道他没有办法提出改善卡尔处境的建议，但他可以给唐和埃尔恩提出他们无法拒绝的方案，即卡尔分文没有，埃尔恩有1枚金币，唐有2枚金币，本得到剩下的97枚金币（见表4-3）。表4-3 本的金币分配方案现在我们能够清楚看到亚伯应该怎么做（作为最资深的海盗，他对分赃这类事情很有经验）。亚伯提出以下建议（见表4-4）。他拿走97枚金币，一枚也不给本（他在任何情况下都不会被收买）；给卡尔1枚金币（这种情况还是要比亚伯被扔进大海，本分配金币好）；唐什么也得不到；埃尔恩会得到2枚金币（唐的投票权比埃尔恩的要便宜一点）。这个方案将以3∶2的形式投票通过。这些海盗将在海上继续抢劫，直到海枯石烂。表4-4 亚伯的金币分配方案这最后的分配看起来有些奇怪。如果我们请五个数学系的学生来做这个实验，是否会得出同样的结论？如果是请心理学系的研究生来做这个实验呢？心理学家又是如何处理各种可能性的呢？参与者能否结成联盟并达成协议？如果能，这个博弈看起来会如何？数学解决方案总是假设所有的玩家都聪明且理性，但这一假设本身是否聪明呢？又是否理性？我观察了这个博弈很多次，从未见过参与者达成数学解决方案。这意味着什么？数学解决方案忽视了如嫉妒、屈辱感或幸灾乐祸这类重要的情绪。情感因素能否改变数学计算？海盗博弈事实上是最后通牒博弈的多人博弈版本。如果你觉得这个博弈很奇怪，那么你会怎么看以下博弈？博弈二死去的富人一位非常富有的老人去世了，留下两个儿子：萨姆和戴夫。[2]兄弟俩合不来，他们已经有10年没有见过面或是说过话。现在他们在自己父亲家中相聚，聆听父亲的遗愿和遗嘱。父亲的律师打开信封，念出了这份独特的遗嘱。这位父亲留给他的两个儿子1010000美元的遗产，以及可能的分配结果。在第一个分配方案（见表4-5）中，哥哥萨姆可以立即拿走100美元，给弟弟留下1美元，再将剩下的遗产全部捐给慈善机构（这将是一大笔善款）。表4-5 第一个分配方案萨姆没有义务一定要接受这个方案，而且可以将难题留给他的弟弟戴夫。如果由戴夫来处理这笔钱，他可以拿走1000美元，萨姆得到10美元，剩下的捐给慈善机构。这是第二个分配方案（见表4-6）。表4-6 第二个分配方案但是现在应由戴夫决定是否拒绝。他可能会给萨姆机会，来决定是否有另一个更好的分配方案，即萨姆拿走1万美元，给戴夫100美元，剩下的钱捐给慈善机构（见表4-7）。表4-7 第三个分配方案然而，萨姆不必接受这个选项，他可能将难题再留给戴夫，而这一次戴夫可能自己拿10万美元，给萨姆1000美元，而捐给慈善的部分不断缩水（见表4-8）。表4-8 第四个分配方案当然，这个并不是最终结果。戴夫可能决定让萨姆再次分配这笔钱，但分配方式如下：自己拿100万美元，给他讨厌的弟弟1万美元，一分钱也不捐给慈善机构（见表4-9）。表4-9 第五个分配方案那么，你认为现在会发生什么？同样，这个问题也可以通过逆向归纳法来解决。每个人都能看出，这个博弈绝不可能持续到最后一个（第五个分配方案），即戴夫让萨姆拿走100万美元，因为这将使他自己的收益从10万美元降到1万美元。萨姆知道这一点，因此，他不会让这个博弈采用第四个分配方案，那时萨姆只能拿到1000美元，而不是第三个分配方案的10万美元。现在继续分析，能看到他们也不会采用第三个分配方案……也不会采用第二个分配方案。这很让人吃惊，但假设兄弟俩都是同一种类别即理性经济人（也就是他们都是精于算计、只知道照顾自己的人），这个博弈在提出第一个分配方案就会结束，其中萨姆拿到100美元，给戴夫1美元，剩下大部分的钱捐给慈善机构（不良的用意也可能导致慷慨的结果，兄弟俩没准会得到神圣的奖励）。这是数学解决方案，萨姆有100美元，戴夫1美元，大部分钱捐给慈善机构。这个解决方案到底符不符合逻辑？由你来判断。博弈三巧克力和毒药博弈这是一个相当简单的游戏，也被称为“巧毒博弈”。我在这里用的“巧毒博弈”的规则应感谢已故的美国数学家大卫·盖尔（David Gale）。这个博弈在一个方格棋盘上进行，棋盘上每一块方格都由巧克力做成，但左下角的一块方格含有一剂毒药。规则如下。开局的玩家在任意一块方格上标明X（见图4-1）。图4-1 巧毒博弈①一经选择，标上X的方格的右方和上方的全部方格都会自动标上X（见图4-2）。图4-2 巧毒博弈②接下来，由另一位玩家在剩下的方格中任选一个标上O。标注后，这个方格右方和上方的方格也会自动标上O（见图4-3）。图4-3 巧毒博弈③之后，第一个玩家在另一个方格上标上X，使这个方格及其右方和上方的方格（如果还有的话）也变成X。之后第二个玩家再在一个方格上标上O，所有在其右方和上方的方格（如果还有的话）也变成O。这个游戏不断进行下去，直到其中一个玩家因被迫选择毒药而输了博弈并“死去”才结束。你可以在7×4（7行4列，或4行7列）的棋盘上玩这个游戏。如果游戏是在一个正方形（行与列的数量一样）的木板上进行，那么这里有一个策略可以让那个开局的玩家永远是赢家。你发现了吗？花上三分钟时间思考一下。解决方案：让我们假设琼和吉尔在玩这个游戏。如果琼是开局的玩家，她应坚持以下策略直到成功。第一步，她应选择毒药右上方斜对角的方格（见图4-4）。图4-4 巧毒博弈④现在她需要做的就是对称地跟随她的对手：也就是说，她会和吉尔选择同样的方格，只是在棋盘的对侧。图4-5可以更好地说明。现在如何赢得这场博弈已经显而易见了。如果这个博弈在一个长方形的棋盘上进行，情况就会变得复杂得多。但我们仍然可以证明，开局的玩家依旧拥有获胜的策略。问题是我们的证据并没有详细说明这个获胜的策略。数学家将这类证据称为“非构造性存在证明”。图4-5 巧毒博弈⑤博弈四不适合老年人的游戏我在我的家乡立陶宛维尔纽斯的初中里，学到的最宝贵的技能之一，就是上课时在纸上玩战略游戏而不被老师发现。我很喜欢三连棋游戏（也叫拼字游戏）的“无限”版本。这个游戏让我熬过了那些枯燥无味的课堂。我想我们大多数人都熟悉三连棋游戏的经典版本，就是在3×3的方格上进行，这对6岁以内的孩子来说非常有吸引力。大一点的孩子（以及成年人）通常打成平手，除非一个玩家在游戏过程中睡着了（这也说得过去，毕竟这是个无聊的游戏）。然而，在“无限”版本中，这个游戏的棋盘有无数的格子，而游戏目标是创造出连续的5个X或者O，而且和原来的版本一样，方向可以是垂直、水平或者对角。玩家轮流用X或者O来标注格子（按照事先约定），而最先完成五连棋的玩家获胜（见图4-6）。图4-6 “无限”版本三连棋在图4-6的左侧，X玩家已经获胜。在图4-6的右侧，虽然轮到O玩家下棋，但他仍然无法阻止X玩家获胜。你知道为什么吗？当时在学校，我曾以为自己发明了这个游戏，但没过多久我就意识到并不是这样。我发现，在日本和越南有一个风靡多年的游戏同这个很像，那个游戏叫五子棋（Gomoku）。Go在日文中就是五。虽然五子棋和围棋可以用同样的棋盘，但这两种游戏是不相关的。围棋是一种古老的中国游戏，孔子在《论语》中曾有提及，但后来被日本人介绍到西方，因此大家只知道它的日语名字。虽然我拥有在课堂和课间（课间玩棋意思不大，因为本来这个时间就可以玩）玩三连棋游戏“无限”版本的大量经验，但是我仍然不确定先下棋的棋手（X棋手）拥有最优获胜战略，也不确定如果两个高手对弈，将总是平局（或者事实上永远结束不了）。然而，我愿意打赌说一定存在获胜战略。当我将来退休并有了充足的时间后，我会试着为先下棋的棋手找出获胜战略。当然，老实说，我已经几十年没有玩这个游戏了。只是在写本书的时候，我才回忆起来。鉴于我重新研究这个游戏战略部分的计划还比较久远，你们可以先开始研究，找出这个战略，为我省下时间和精力。博弈五信封的反面往往更绿想象以下场景。我的面前有两个装有现金的信封，我被告知其中一个里面的现金是另一个的两倍。我可以任选一个拿走。这听起来像是世界上最简单的博弈了。我怎么可能输呢？假设我选了一个信封，打开，发现里面有1000美元。我一开始还挺高兴，但之后我开始想另一个信封里的内容——我没有选中的那个。当然，我不知道里面有什么。它可能是2000美元，这意味着我做了糟糕的选择，但它也有可能是500美元。经过思考后，我得出以下结论：“我不高兴，因为我没选的那个信封里的潜在金额的平均值比我现在拿到的钱要多。毕竟，如果它里面有2000美元和500美元的概率是均等的，因此，平均值是1250美元，这比1000美元要多。我自己算得出来！”事实上，我从信封里无论拿到什么都能证明墨菲定律，即“会出错的事情总会出错”。平均来看，没有选中的信封会永远比我选中的要好。如果我的信封里面有400美元，那另一个里面可能有800美元或200美元，平均值就是500美元。如果这样想，我永远不可能选对。没选上的收益将比我的收益永远高出25%。所以，如果我在检查另一个信封内容之前再次面临这个选择，我会改变主意吗？如果我那样做，我会进入一个永不停歇的循环。为什么一个如此简单的选择会变得这么复杂？事实上，刚才我给你讲的故事也是一个知名的悖论，它最早是由比利时数学家莫里斯·克莱特契克（Maurice Kraitchik，1882—1957）提出的，只不过他讲的是关于领带的故事。两个男人争论谁的领带更好看。他们找到第三个人——比利时著名的领带专家——作为裁判。这位专家答应了，但提出一个条件，赢的人需要将他的领带作为安慰奖送给输的人。这两位领带主人简单考虑了一下并同意了这个提议，因为他们都这样想：“我不知道我的领带是不是更好。不管怎样，如果我赢了，那我会输掉我的领带，但如果我输了，我会赢一条比我自己更好的领带。所以这个赌博对我有利。”两个竞争者怎么能够相信他们都占优势呢？1953年，克莱特契克给出了这个故事的另一个版本，涉及另外两个好争论的比利时人。他们不戴领带，因为他们吃了太多的比利时巧克力，以至于领带让他们感到无法呼吸。他们就用钱包里的东西相互挑战，并决定他们中间更富裕和更开心的那位应将自己的钱包给对方。如果他们不分胜负，那就回去继续吃巧克力。同样，他们都相信自己占有优势。如果他们输了，拿到的奖金会比自己赢时给出的赌注多。这是一个好的游戏吗？你可以试试和大街上的陌生人做这个游戏，看会发生什么。1982年，马丁·伽德纳在《啊哈！原来如此》一书中使这个故事一举成名。这本书是关于智慧思考的最优秀、最简洁和最有趣的著作之一。巴里·纳莱巴夫（耶鲁大学管理学教授）是一位重要的博弈论专家，他在自己1989年的文章中提供了这个故事的信封版本。奇怪的是，即使是在今天，这个博弈也没有一个能让所有统计学家达成一致的解决方案。解决提议之一涉及用几何平均而不是算术平均。几何平均数是指两个数字乘积的平方根。举例说，4和9的几何平均数是他们乘积（即这两个数字相乘）的平方根，也就是6。现在，如果我们在自己的信封里发现有X美元，知道另一个信封里会有2X或者X的1/2，那么另一个信封里的几何平均数将是X，而这正好是我们手里美元的数额。使用几何平均数的逻辑就是，我们事实上是在说相乘（两倍）而不是相加。如果我们说一个信封比另一个信封里要多10美元，我们会使用算术平均数，找出来，得出的结果毫无矛盾，因为如果我们的信封里有X美元，而另一个里面有X+10或者X-10，那么没有选上的信封里的算术平均数是X。那些学过概率课的学生会说，你“不能均匀分配一组有理数”。这听起来是不是让人印象深刻呀？如果你不能理解这意味着什么，也完全没问题，因为这个悖论的最佳版本与概率没有任何关系。这最后的版本在美国数学家、哲学家、古典钢琴家和音乐家雷蒙德·M.斯穆里安的精彩著作《撒旦、康托和无穷》（Satan，Cantor and Infinity）中出现了。斯穆里安展现了这一悖论的两种版本。1.如果在你的信封里有B张纸币，那么你会得到B，或者将你的信封替换成另一个信封，你会得到B的1/2。因此，你应该换过来。2.如果两个信封里分别装有C和2C金额的钱数，而且你选择用一个换另一个，那么你会要么得到C，要么失去C，因此你得与失的概率是平均的。困惑吗？其实我也困惑。无论怎么样，很多保持悲观的人认为这里不存在悖论，这就是生活，无论你做什么或是去哪里，有不同的选择总会更好。例如，如果你结婚了，或许你认为自己应该单身。毕竟，安东·契诃夫写过：“如果你害怕孤独，请不要结婚。”但是，如果你因此选择单身，你又错了。圣经中第一次出现“不好”这个表述是在《创世记》（2：18），其中说：“这个人独居不好。”上帝都这么说了，不是我说的。博弈六金球《金球》（Golden Balls）是一个英国的电视游戏节目，2007—2009年播出。我们不会详细探讨游戏的规则和步骤，但在游戏的最后一步，会剩下两个玩家商量如何在他们之间分一定数量的钱。每个玩家都有两只贴有标签的球，一只球标着“分”，另一只标着“偷”。如果他们都选择“偷”这只球，那两人最终什么也得不到。如果他们选的球不一样，那么选那个标着“偷”的球的人会拿走奖金。玩家可以在选择之前讨论一下他们的处境。表4-10 金球游戏根据游戏规则，我们做出了表4-10。简单看一眼就明白，如果每个玩家只考虑自己的收益，那么选“偷”比选“分”好。问题在于，如果两个玩家都这么做，那么二者皆输。（是的，这和你也许已经知道的囚徒困境很相似。我们稍后会讨论这个著名的困境。）在大多数情况下，玩家会说服彼此选择“分”，这种办法有时候是有用的。YouTube（优兔）视频网站上有很多关于这个游戏的视频，其中会展示不少让人伤心的场面，一些游戏玩家信任他们的对手而选择了“分”，但结果发现他们上当了。一天，一位名为尼克的玩家提出一个与众不同的方法。尼克告诉他的对手易卜拉欣，他会选择“偷”，并乞求易卜拉欣选择“分”，承诺在游戏结束后他会平分得到的奖金（这期奖金为13600英镑）。易卜拉欣不相信自己听到的。尼克反复承诺他会作弊，同时坚持说他提前说出来则表明他基本的诚信。易卜拉欣应相信自己能得到另外一半的钱。“你选‘分’不会损失什么，”尼克告诉他，“你只会获益。”在那一刻，玩家被要求停止谈话并拿起所选的球。易卜拉欣选了“分”，但尼克也选择了“分”。他为什么这么做？尼克非常确信他能说服易卜拉欣与他合作并选择“分”，给他留下在游戏结束后分钱的麻烦。你不得不承认，尼克或许能获得“年度最佳战略家”称号。这个游戏不仅关系到谈判战略，也关系到玩家间的信任。博弈七错综复杂的棋类游戏以下博弈仅适用于下棋和数学爱好者。很多人认为博弈论诞生于1944年，即规范书籍《博弈论与经济行为》出版之时。这部书的作者是美国伟大的匈牙利裔数学家约翰·冯·诺依曼（1903—1957）和经济学家奥斯卡·摩根斯特恩（1902—1977）。（但博弈论解决的问题可以说是自古就有。我们可以在《塔木德》《孙子兵法》，以及柏拉图的作品中找到。）然而，一些人认为博弈论自德国数学家恩斯特·策梅洛（1871—1953）在1913年提出下棋定理“国王博弈”时就已形成，“要么白方有必胜之策略，要么黑方有必胜之策略，要么双方也有必不败之策略”。也就是说，他指出只有三种选项。1.白方有一种策略，一旦遵循，它总是获胜。2.黑方有一种策略，一旦遵循，它总是获胜。3.黑方和白方有一套策略组合，一旦遵循，双方总是打成平局。当最早读到这个定理时，我记得当时在想：“噢，这可真聪明……真新鲜……这位德国思想家告诉我们要么白棋会赢，要么黑棋会赢，或者他们的游戏会打成平局。而我呢，还在想是不是会有更多其他的选项……”只有当我开始读他的论证时，我才理解这个定理到底是讲什么的。事实上，策梅洛证明了国际象棋游戏与有限（3×3）井字棋没有什么不同。正如此前提到，如果井字棋的两位玩家没有暂时精神错乱（有时候确实会发生），所有的游戏总是会打成平局。没有其他的选项。即使一开始不断失败的玩家，最终也会找到一种不败的办法，这使这个已经很无趣的井字棋游戏变得和读一本字体不变的书一样枯燥。策梅洛试图证明国际象棋（以及其他博弈）和井字棋几乎一模一样，它们只有着数量上，而非性质上的不同。在国际象棋中，“策略”是对可能在棋盘上具体化的任何情境做出的一套反应。显然，两个棋手之间会有大量的策略。让我们将白方（第一棋手）的策略标上S，而将其对手的标上T。正如策梅洛定理指出的那样，只存在三种可能性。要么白方有一种策略（我们姑且叫S4），用这种策略，无论黑方怎么走，他总是能赢（见表4-11）。表4-11 国际象棋的白方赢棋策略注：W=白方赢，B=黑方赢，X=平局。或者黑方也有一种策略（我们称为T3），用这种策略，无论白方怎么走，他总是能赢（见表4-12）。表4-12 国际象棋的黑方赢棋策略或者双方有一种策略组合，如果遵循这些策略，博弈总会打成平局（正如井字棋一样，见表4-13）。表4-13 国际象棋的平局策略如果真是这样，人们为什么要下棋？为什么还会觉得有意思？事实上，当我们下棋或看别人下棋时，我们不知道自己面对的是三种情况中的哪一种。超级电脑在未来也许能够给出正确的策略，但我们距离那一步尚远，因此觉得国际象棋始终如此有趣。根据美国数学家和密码学家克劳德·香农（公认为“信息理论之父”）的计算，国际象棋中变化数量达到10的43次幂。看一下这个数字：10000000000000000000000000000000000000000000。很多人认为，计算机用于测试国际象棋可能性的时间范围超过了最现代的技术所能达到的时间极限。一次我和2012年国际象棋冠军鲍里斯·格尔凡德共进午餐。我告诉他，就在几年前，我这样一个差劲的象棋手可以打败电脑程序，但今天电脑可以轻而易举地战胜我，这实在让人尴尬。他评论说，人类棋手与电脑棋手的差距越来越大，现在电脑程序可以轻松地打败最强大的人类棋手。这一差距如此之大，以至于人类对抗电脑的比赛已经没有任何意义了。在象棋比赛中，人类已经遭受惨败。格尔凡德大师最终总结道，如今，人类与强大的电脑程序（也被称为“机器”）对弈就如同与一头大灰熊摔跤一样是不明智的。人与人之间的对弈则要有趣得多。在我们的年代，当象棋大师们对弈时，有时候先走棋的选手会赢，有时候后走棋的选手会赢，有时候他们会打成平局。棋手和理论家通常一致认为，先走棋的白方会有微弱的优势。统计学家也支持这一观点：白方会比黑方持续多赢那么一点，概率约为55%。棋手就双方能否有一场全胜的比赛，白方永远赢或是比赛永远平局，已有过长时间的辩论。他们认为黑方没有获胜策略［和这一流行的观点相反，匈牙利国际象棋大师安德拉什·阿多尔然（András Adorján）认为白方占据优势的观点是一种错觉］。

试读结束[说明：试读内容隐藏了图片]

下载完整电子书

角斗士、海盗与信任博弈试读：

相关推荐

世界最具推理性的侦破故事(4)(txt+pdf+epub+mobi电子书下载)

六祖坛经解读(txt+pdf+epub+mobi电子书下载)

张奎武《英美概况》（第4版）配套题库（含考研真题）(txt+pdf+epub+mobi电子书下载)

建设工程法律纠纷处理依据与解读(第3版)(txt+pdf+epub+mobi电子书下载)

《中华日常礼仪基础教程》第五册经礼(txt+pdf+epub+mobi电子书下载)

军队文职人员招聘考试专用辅导书·护理学(txt+pdf+epub+mobi电子书下载)

柳林风声（英文版）(txt+pdf+epub+mobi电子书下载)

追忆逝水年华(txt+pdf+epub+mobi电子书下载)

农村经济人培训教程(txt+pdf+epub+mobi电子书下载)

你的大脑还可以再抢救一下(共5册)(txt+pdf+epub+mobi电子书下载)

合同常见法律问题及纠纷解决法条速查与文书范本(txt+pdf+epub+mobi电子书下载)

香港凤凰周刊文丛系列——五国秘辛(套装共5册)(txt+pdf+epub+mobi电子书下载)

安心理财(txt+pdf+epub+mobi电子书下载)

指引生命的神话：永续生存的力量(txt+pdf+epub+mobi电子书下载)

创业为了什么？(txt+pdf+epub+mobi电子书下载)

玉米杂交育种(txt+pdf+epub+mobi电子书下载)

拼职场，决不能说的100句话(txt+pdf+epub+mobi电子书下载)

审计学(txt+pdf+epub+mobi电子书下载)

深度学习之PyTorch实战计算机视觉(txt+pdf+epub+mobi电子书下载)

时光邮局的来信(txt+pdf+epub+mobi电子书下载)

最新文章

人生就要不断精进(txt+pdf+epub+mobi电子书下载)

做个心智成熟的人：人生可以不走弯路(txt+pdf+epub+mobi电子书下载)

跟谁都能聊不停：一看就能用的魔鬼搭讪学(txt+pdf+epub+mobi电子书下载)

赴美留学必知(txt+pdf+epub+mobi电子书下载)

我的男友(txt+pdf+epub+mobi电子书下载)

中国东北与东北亚古代交通史(txt+pdf+epub+mobi电子书下载)

幸福生活讲座(txt+pdf+epub+mobi电子书下载)

情商决定一生(txt+pdf+epub+mobi电子书下载)

夜雨寄北(txt+pdf+epub+mobi电子书下载)

让学生热爱学习(txt+pdf+epub+mobi电子书下载)

On Dreams(txt+pdf+epub+mobi电子书下载)

我的史学人生(txt+pdf+epub+mobi电子书下载)

Creo2.0完全学习手册(txt+pdf+epub+mobi电子书下载)

2018年陕西省军转干部安置考试《公共基础知识》题库【真题精选＋章节题库＋模拟试题】(txt+pdf+epub+mobi电子书下载)

假如给我三天光明(txt+pdf+epub+mobi电子书下载)

带出高效执行力(txt+pdf+epub+mobi电子书下载)

北史（四）(txt+pdf+epub+mobi电子书下载)

影响力的企业富豪(上册)(txt+pdf+epub+mobi电子书下载)

商界40年：逐鹿人(1999-2008)(txt+pdf+epub+mobi电子书下载)

The Boats of the Glen Carrig(txt+pdf+epub+mobi电子书下载)