博弈论平话(txt+pdf+epub+mobi电子书下载)


发布时间:2020-11-02 06:03:05

点击下载

作者:王则柯

出版社:中信出版社

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

博弈论平话

博弈论平话试读:

前言

20世纪下半叶,经济学经历了一场博弈论革命。1994年度的诺贝尔经济学奖授予三位博弈论专家,2005年度和2012年度的诺贝尔经济学奖又各授予两位博弈论专家,可以看作博弈论成熟的标志。这也更激发了人们了解博弈论的热情。20世纪末期以来一个重要的社会现象,是世界经济一体化的发展。伴随进行的,是大众传媒中经济术语的一体化。现在,人们对于“零和博弈”、“囚徒困境”、“双赢对局”这些本来属于博弈论(game theory)的专门术语,已经耳熟能详。难怪“当代最后一个经济学全才”保罗·萨缪尔森(Paul Samuelson)教授,在他生命的最后年月,告诫我们说:“要想在现代社会做一个有文化的人,你必须对博弈论有一个大致的了解。”

经典意义上的经济学,以经济主体人的自利行为以及相应的市场反应作为研究的出发点。无论是消费者还是生产者,也无论是竞争形势还是垄断形势,基本上是经济主体人面对市场做出自己的最优决策。形势严峻也好宽松也好,行为的结果都是主体人自己决策的结果。

拿同质商品的市场来说吧,像垄断(monopoly)那样没有对手的决策是比较简单的,“计算”生产和供应多少东西到市场上去可以实现最大利润就可以了。这时候,所论商品的市场价格由市场的需求和垄断企业的供给共同决定,因此说垄断企业是价格的决定者(price maker)。当然还有另外“一个”价格决定者,那就是市场的需求,但是因为这个市场需求是千千万万消费者的消费意愿和消费能力的总和,所以它已经不再具有人格化的面貌。另一方面,像完全竞争(perfect competition)那样对手很多的情况下的决策也比较简单,因为对手多了,他们的意愿、能力,特别是他们的决策相互汇合,其中也包括相互抵消,结果“全体对手的决策”和市场需求合在一起,呈现可以预见的规律,从而可以把对手们的整体反应归结为主体人面对的“一个”不再具有人格化面貌的市场。因为占有市场份额很小的每个竞争企业,不能影响所论商品的市场价格,所以我们说竞争企业是价格的接受者(price taker)。这时候,给定商品的市场价格,竞争企业要做的,就是“计算”应该生产和供应多少商品到市场上去,才可以实现最大利润。

现代经济活动早已超出上述模式。特别是当主体人面对少数几个作为对手的主体人的时候,主体人决策的后果,要由他自己的决策和他的对手的决策共同决定。前面说了,垄断和完全竞争这两种极端情形的决策,都是“计算型”决策。最困难和最不确定的是只有少数几个对手的情形,即所谓寡头经济(oligopoly),每一方的市场份额都很大,每一个主体人的行为后果,受对手行为的影响都很大。经济学特别地把两个企业合起来垄断或几乎垄断了某种商品的市场,称为双寡头经济(duopoly)。可口可乐公司和百事可乐公司,几乎垄断了美国碳酸饮料的市场,它们之间的争斗,就可以看作这个样子的争斗。

这种竞争,是相当人格化的竞争。每个主体人的行为,对对手的利益影响很大,每个主体人的利益,又受到对手的行为的很大影响。这种面临不确定性的决策,固然斗智斗勇,其中也有适应性很广的规律。博弈论就是研究利益关联(包括利益冲突)的主体人的对局的理论,是分析人们在博弈中的理性行为的理论,是讨论人们在博弈的交互作用中如何决策的理论。

作为一门学科系统地学习博弈论,不是一件容易的事情。事实上目前在我国,许多最好的大学,也只在经济学研究生中开设比较全面的博弈论课程。这么说来,广大读者对博弈论似乎只好敬而远之了。其实不然。系统地讲授博弈论固然对学生有很高的要求,但是通过比较浅显的例子和故事普及博弈论的一些知识和方法,阐发博弈论的一些思想和观念,应该还是大有作为的。

本着这个宗旨,本书从囚徒困境、情侣博弈、诺曼底登陆模拟和慕尼黑谈判模拟等入手,介绍静态博弈、动态博弈、纳什均衡、零和博弈、双赢对局、帕累托优势、子博弈精炼纳什均衡等博弈论的基本概念,以及劣势策略消去法、相对优势策略下画线法、确定混合策略纳什均衡的反应函数法、动态博弈的倒推法等博弈论基本方法,帮助具有中学文化程度的读者了解博弈论的若干初步知识。

本书最早的版本,是1998年在中国经济出版社出版的《博弈论平话》,后来在2004年扩充成《新编博弈论平话》在中信出版社出版,在2007年又按照概念和方法的内在逻辑重新整理并且扩充成为《人人博弈论》在中信出版社出版,三个版本都连续重印多次。

后来我们按照读书市场的反馈,修枝剪叶,把《人人博弈论》缩编成本书呈现在读者面前。篇幅虽然比较小,却已经把绝大部分至少在大学本科才能够课堂学习的博弈论内容,比较浅白地向读者展开了。没有牵涉进来的,只是那些需要高等数学的极限理论和概率论贝叶斯公式才能够说明白的概念和方法——我们总不能要求普及读物的读者预先具备包括概率论在内的高等数学知识吧。

反过来说,现在比较好的大学才能够教授的博弈论课程的内容,凡是不使用高等数学的,我们在本书中已经讲得相当清楚了,而且叙述方式要浅白得多。说到数学方法,我们实际上只用到加减乘除。学问讲究发现的乐趣和心得的喜悦,讲究润物细无声。我们并不追求面面俱到,只是努力以朴实浅近的文字唤起读者对博弈论和现代经济学的好奇心。

在进行博弈分析的时候,对于同时决策博弈,需要画出矩阵形的表格,对于先后决策的博弈,需要把博弈表达为一棵“树”。这是学科本身的要求。除此以外,只要有可能,我都用几何图形代替数字计算和代数推导。这也是作者风格的一个体现。

最大的变化,则是新写了一节“囚徒困境两败俱伤的隐含条件”。大家知道,囚徒困境是博弈论最重要的一个模型,“囚徒困境导致两败俱伤”,差不多已经成为人们的共识。可是囚徒困境之所以导致两败俱伤,是有它的前提条件的,忽略这个前提条件,就会误导学生和读者误用囚徒困境导致两败俱伤的这个结论。

现在这个2017版本,则增加了一个后记“从夏普利获得诺贝尔经济学奖谈起”,算是补充了一些晚近的资料。

我的电子信箱是lnswzk@mail.sysu.edu.cn和ch84111987@163.com,敬祈读者和专家继续帮助和批评。王则柯 识于庚寅年秋丁酉年春修订第一章博弈三要素与囚徒困境

这一章是全书的一个导引,首先回顾博弈论普及工作的成效,远溯30多年前作者自己怎样被博弈论吸引。最重要的,则是通过“囚徒困境”博弈,说明表达一个博弈必须明确博弈参与人、他们可以选择的策略或者行动,以及在每种策略组合之下参与人的博弈所得即支付这样三个要素。我们还以“囚徒困境”为例,说明什么是博弈参与人的严格优势策略,什么是博弈的严格优势策略均衡,并且演示寻找严格优势策略均衡的劣势策略消去法。

这一章还谈到“双赢对局”的概念,以及基数支付和序数支付的关系。民营书店的价格大战

我坐在从广州到杭州的CZ3803航班上,翻阅当天的《南方都市报》。西湖和钱塘江是我喜欢的地方,在大学里教书以及和同学们探讨经济学是我喜欢的工作。现在有人请我到西湖旁边做我喜欢的工作,实乃人生乐事。说起教书,我在经济学院校讲授的主要是微观经济学、博弈论和信息经济学,不敢随便揽别的活儿。

报纸对开的B8和B9两版的大字标题映入我的眼中:北京两大书店分别以7.5折和7折应对竞争,引发价格大战书价跳水原来,2006年9月1日,号称北京市最大书店的“第三极书局”广告宣布:“请允许我热烈地爱读者一回——从9月1日至10月20日,全场图书7折。”这个消息早在预料之中。事实上早在一个半月以前,紧邻第三极书局的中关村图书大厦,就已经打出“7月15日至8月15日全场图书7.5折”的条幅,后来又打出“8月19日至10月15日,继续全场7.5折”的广告。这样连续的打折倾销,叫旁边的第三极书局怎么受得了?

对开两版其他文字的标题是:打折是无奈之举:这是割喉战?打折风起云涌:7折还能赢利吗?打折之后:各方力量开始博弈最坏的结果:劣币驱逐良币国营PK民营:需要那么多高度同质化的书城吗?

配题大照片的文字则是:第三极书局推出全场7折,不仅是对竞争对手的应战,对全国图书零售业或许都将产生系列震荡。

你看,诸如国营、民营、零售、竞争、打折、博弈、对手、赢利、同质化,全是经济学词汇,真是硝烟弥漫。其中什么叫作竞争、什么叫作赢利、什么叫作同质化,是微观经济学需要厘清的概念,至于博弈和对手,当然属于博弈论的范畴了。所以这一组文章引起我的兴趣。

所谓“国营PK民营”,背景在于中关村图书大厦是新华书店系统的“巨无霸”,面积1万平方米,而第三极书局是民营书店,面积接近2万平方米。按照记者的说法,第三极书局是迄今最大的民营书店。至于网络用语“PK”的准确含义,我并不十分有把握,但是从上下文看,应该是对手战或者对决的意思。由于两家巨型书店开打如此惨烈的价格战,附近的中小型书店也就只好跟进。一家网上书店甚至开出6.9折的超低价。

对开两版中最长的一篇文章,题为“我们的书价虚高吗?”,其中5个小标题是:拆解图书利润链条定价的差异何在?书业面临“囚徒困境”?打折的几种可能性图书相对购买力低

其中“囚徒困境”已经是博弈论的专门术语了,“囚徒困境”是最典型的一种博弈模式。

两版报纸,让我浮想联翩。作为热心于普及经济学知识的学者,我高兴地看到,以科普小册子《博弈论平话》1998年在中国经济出版社出版为标志,经济学人普及博弈论知识的多年努力,已经遍地开花。传媒和大众都知道“价格大战的囚徒困境”的说法,就是一个明证。有些提法不大准确,例如价格大战已经非常惨烈了,却说“各方力量开始博弈”。不过,这恐怕也是赶着写稿发稿,遣词造句难免欠斟酌的缘故。真的问一句“怎么这时候才开始博弈”,记者自己一定马上醒悟过来。“囚徒困境”非常重要。历史上,学人杜撰的“囚徒困境”模型和其他一些模型,不但曾经孕育了“纳什均衡”这一个博弈论最重要的概念,而且解说了博弈论一种重要的方法。原则上说,我们这本介绍博弈论一些主要概念和基本方法的书,也将从“囚徒困境”模型开始。

不过在此之前,我愿意先说说当初自己怎样被博弈论吸引。我怎样被博弈论吸引

1981年秋天,我受中山大学派遣,到美国普林斯顿大学数学系进修两年,邀请人是在数学系和在经济学系都有办公室的库恩(Harold W. Kuhn)教授。部分由于中山大学体现了中山大学和岭南大学两所大学的传承,在普林斯顿我结识了在那里经济学系任教的岭南大学学长邹至庄(Gregory C. Chow)教授和他的夫人、主持普林斯顿大学国际中心的邹陈国瑞女士,得到他们的很大帮助。这两种人际关系,种下了我后来从事经济学教育的基因。

但是还有一个小小的因素,那就是我曾经被博弈论的一道很浅的习题深深吸引,心灵感受震动:原来,大学博弈论练习可以设计得那么深刻而有趣。

当时,我已经快40岁了,主要的课题,是在库恩教授的带领下,计算复杂性理论的研究。我没有修很多课,但是乐意收集习题。那道习题深深地打动了我,以至于我花了一天时间“不务正业”,给上海的《科学画报》投稿,向中学生介绍这个博弈论故事。

普林斯顿大学的那道习题是这样的:如果给你两个师的兵力,由你来当“司令”,任务是攻克“敌方”占据的一座城市,通往城市的道路只有甲乙两条,而敌方的守备力量是三个师。规定:双方的兵力只能整师调动;当你发起攻击的时候,你的兵力超过敌方,你就获胜;你的兵力比敌方的守备兵力少或者相等,你就失败。那么,你将如何制订攻城方案?

如果你不懂博弈论,看到这样的题目难免会抱怨:为什么给敌方三个师的兵力而只给我两个师?这太不公平。兵力已经吃亏,居然还要规定兵力相等则敌胜我败,连规则都不公平,完全偏袒敌方。这游戏实在没法玩。为此你也许会大为不满,你这个“司令”要来个躺倒不干。

其实,运用博弈论的方法稍加分析,就可以知道这次模拟“作战”,每一方取胜的概率都是50%,即谁胜谁负的可能性是一半对一半。你这个“司令”能否神机妙算,指挥队伍克敌制胜,还得看你的本事。

为什么说取胜的概率是一半对一半呢?那就让我们先学一点儿“纸上谈兵”。

我们来分析一下:敌方有三个师,布防在甲乙两条通道上。由于必须整师布防,敌方有4种部署方案,即:A. 三个师都驻守甲方向;B. 两个师驻守甲方向,一个师驻守乙方向;C. 一个师驻守甲方向,两个师驻守乙方向;D. 三个师都驻守乙方向。

同样,你有两个师的攻城部队,可以有3种部署方案,即:a. 集中全部两个师的兵力从甲方向攻击;b. 兵分两路,一师从甲方向,另一师从乙方向,同时发起攻击;c. 集中全部两个师的兵力从乙方向攻击。

我们把双方的部署方案都叫作策略,那么敌方有4种策略可供选择,我方有3种策略可供选择。4乘3等于12,所以一共有12种策略组合,或者说12种可能的策略对局。在下面3行4列的表格左边,我们写上“我方”和可供我方选择的3种策略a、b、c,上面写上“敌方”和可供敌方选择的4种策略A、B、C和D。这样,每个格子就表示一种策略对局。

每个格子里面,如果我们用左下方的“+”表示我方攻克,用左下方的“–”表示我方攻城失败,用右上方的“+”表示敌方守住,用右上方的“–”表示敌方城池陷落,那么就可以得出下述交战双方的胜负分析表:攻防作业演练

假设你这个“司令”采取a方案,那么如果敌方采取A方案,你的两个师将遇到敌方三个师的抵抗,你要败下阵来,所以描述我方的a策略与敌方的A策略相碰的格子里面,左下方是–,右上方是+;如果敌方取B方案,你的两个师遇到敌方两个师以逸待劳的抵抗,你也要败下阵来,所以描述我方的a策略与敌方的B策略相碰的格子里面,同样是左下方–,右上方+;但是如果敌方取C方案,你以两个师打敌人一个师,你就会以优势兵力获得胜利,结果在描述我方的a策略与敌方的C策略相碰的格子里面,是左下方+,右上方–;同样,如果敌方采取D方案,你攻在敌方的薄弱点上,你就能长驱直入,轻取城池,结果在描述我方的a策略与敌方的D策略相碰的格子里面,也是左下方+,右上方–。其他两行的格子里面的+和–,也是这个道理。

你看,在所有可能的12种策略对局之中,有一半你这个“司令”取胜,有一半敌方取胜,可不是一半对一半?

兵力偏袒敌人,规则也偏袒敌人。如此不公平的一个博弈,敌我双方取胜的概率竟然相等。你看到博弈论“纸上谈兵”的魅力了吧?如此不公平,取胜概率却相等

上一节交战双方的胜负分析表,还可以一步一步尽量化简,得出更加醒目的图像。

怎么化简呢?如果先从我方入手,3种策略当中一下子是分不出优劣来的。a和b,b和c,a和c之间,都说不上谁比谁优,谁比谁劣。于是,我们从敌方入手,尝试站在敌军的立场,比较4种不同的策略。

先比较策略A和B。如果我方采取策略a,那么敌方取策略A或者策略B都会赢,结果一样。如果我方采取策略b,敌方取策略A会输取策略B会赢。如果我方采取策略c,敌方采取策略A或策略B都会输。可见,站在敌方的立场,策略B比策略A好:采取策略A会赢的话(如我方采取a),采取策略B一定也会赢;采取策略A会输的话(如我方采取b或c),采取策略B却不一定会输,因为假如我方取策略b,敌方就赢了。比较敌方的策略A和B,我们知道B是敌方的优势策略,A是敌方的劣势策略。同样,比较敌方的策略C和策略D,我们知道C是敌方的优势策略,而D是敌方的劣势策略。攻防作业演练(1)

智慧的或者说理性的博弈参与人,是不会采用自己的劣势策略的,所以当做出博弈的上述矩阵表示以后,如果发现劣势策略,我们就应该把它划去,如上图两条竖直的灰线所示。攻防作业演练(2)

现在,剩下上面那个3行2列的矩阵,6个格子中,敌胜我负的比较多,似乎敌方的赢面比较大。其实不然。因为到了敌方不会采用A和D这两种“笨蛋”策略的时候,到了敌方只剩下B和C两个较优策略的时候,我方的a、b、c这3个策略之中,原来显不出劣势的策略b,现在很明显是劣势策略了。你也不是笨蛋,所以你这个“司令”也应该把你的劣势策略b删去。最后,得到下面那个两行两列的矩阵博弈表示。攻防作业演练(3)

情况最终就是这样:敌方必取B策略或C策略那样的二一布防,一路两个师,另一路一个师,而我方必集中兵力于某一路实施攻击,即a或c那样的攻击策略。这样,你若攻在敌方的薄弱处,你就获胜;你若攻在敌人兵力较多的地方,你就失败。总之,敌我双方获胜的可能性还是一样大。

所以,“司令”先生,请不要躺倒不干,你并不比对方吃亏。这两节介绍的那个博弈论练习,有一个醒目的标题,叫作:诺曼底登陆模拟博弈。原来,第二次世界大战进行到1944年的时候,以艾森豪威尔为总司令的盟军,经过近一年的准备,在英国集结了强大的军事力量,准备横渡英吉利海峡,在欧洲开辟第二战场。当时可供盟军渡海登陆的地点有两个:一是塞纳河东岸的布隆涅—加来—敦刻尔克一带,另一个是塞纳河西岸的诺曼底地区。在诺曼底登陆模拟博弈中,所谓我军,就是艾森豪威尔为统帅的盟军,所谓敌军,就是法西斯德国军队。这虽然是一个模拟的例子,却具有相当的现实意义。跨海作战,攻方能够调动来渡海作战的兵力,通常总是比守方可以用于守备的兵力少。模拟博弈中假设攻方兵力为两个师而守方的兵力为三个师,背景就是这样。另外,渡海登陆作战,通常至少在一开始的时候,攻方要承受很大的牺牲。模拟博弈中规定若攻守双方兵力相等则攻方失败,就体现了这个意思。囚徒困境与博弈三要素

一次严重的纵火案发生后,警察在现场抓到甲乙两个犯罪嫌疑人。事实上,正是他们为了报复而一起放火烧了这个仓库,但是警方没有掌握足够的证据。于是,警方把他们隔离囚禁起来,要求坦白交代。如果他们都承认纵火,每人将入狱3年;如果他们都不坦白,由于证据不充分,他们每人将只入狱1年;如果一个抵赖而另一个坦白并且愿意做证,那么抵赖者将入狱5年,而坦白者将得到宽大释放,免于刑事处罚。这样,两个犯罪嫌疑人面临的博弈格局如下面表格所示。和前面几节一样,每个格子中左下角的数字是甲的博弈所得,右上角的数字是乙的博弈所得。现在,这些数字都不是正数。囚徒困境

表述一个博弈的基本要素有三个:第一,参与人或者局中人(players);第二,他们可选择的行动(actions)或策略(strategies);第三,所有可能的对局的结果,用局中人在相应对局下的博弈所得来表示,这个博弈所得,叫作赢利、赢得、得益或支付(payoffs)。将来,我们主要采取“支付”的说法。这里注意,“支付”要理解为因为他们参与博弈所得到的支付,而不是他们付出的支付。

在诺曼底登陆模拟博弈中,博弈的两个参与人是盟军和德军;盟军可以选择的策略是a、b、c,德军可以采取的策略是A、B、C和D;博弈的各种对局下双方之支付则是相应格子中的+和–,或者我们可以把它们改写为+1和–1。而在这一节前面介绍的博弈中,博弈的两个参与人是犯罪嫌疑人甲和犯罪嫌疑人乙;他们可以选择的策略都是同样的两个,即坦白和抵赖;甲在各种对局下之博弈所得,是相应格子里面左下角的数字,乙在各种对局下之博弈所得,是相应格子里面右上角的数字。

概括起来,三要素是:参与人或者局中人;他们可以选择的行动或策略;每个参与人在各种对局下的博弈所得,叫作赢利、赢得、得益或支付。

这种用矩阵形式的表格表示两个参与者的博弈所得的做法,来自博弈理论的一位先驱者托马斯·谢林(Thomas C. Schelling)。美国普林斯顿大学经济学系的迪克西特(Avinash K. Dixit)教授以及耶鲁大学经济学和管理学教授奈尔伯夫(Barry J. Nalebuff)在他们的博弈论普及读物《策略思维》中告诉我们,谢林教授曾经说过:“假如真有人问我有没有对博弈论做出一点儿贡献,我会回答有的。若问是什么,我会说我发明了用一个矩阵反映双方得失的做法……我不认为这个发明可以申请专利,所以我免费奉送,不过,除了我的学生,几乎没有人愿意利用这个便利。现在,我也供给各位免费使用我发明的矩阵。”

谢林教授这么说,实在是太谦虚了。要知道,他在1960年出版的著作《对抗的策略》,迄今是博弈论方面很有影响的文献。他的其他论著,有《抉择与后果》、《军备与势力范围》、《策略分析与社会问题》等。他对博弈论有非常大的贡献。虽然谢林教授的博弈论写作以著作为主,与其他博弈论学者以论文为主很不相同,并且谢林的写作以语言描述为主,很少采用更加时髦的数学形式的推导,但是他对于博弈论的巨大的和启发性的贡献,最终还是得到国际学界的承认。喜欢语言描述的谢林教授和非常数学化的奥曼(Robert Aumann)教授,因为对于博弈论的巨大贡献,一起获得2005年度的诺贝尔经济学奖。从囚徒困境说严格优势策略均衡

回到上一节开始讨论的嫌疑犯博弈问题。如果两个嫌疑犯都是只为自己利益打算的所谓理性主体人(rational agent),两位犯罪嫌疑人博弈可能的结果会怎样呢?要是乙抵赖,那么,如果甲坦白甲就可以得到宽大释放;要是乙坦白,那么,如果甲也坦白甲要坐3年牢,但是如果甲抵赖甲可要坐5年牢。可见对于甲来说,不管乙采取什么策略,他坦白自己总是比较有利的。所以两相比较,坦白是他的全面的严格的优势策略。

全面,指的是不论对方采取哪个策略,我的这个策略总显示优势:对方坦白,我坦白比抵赖好;对方抵赖,我也是坦白比抵赖好。严格,指的是这个优势策略的结局确实要好一些:对方坦白,我坦白得–3确实比抵赖得–5好;对方抵赖,我坦白得0也确实比抵赖得–1好。这里,严格是说:–3不仅仅是不差于–5,而且是严格好于–5;0不仅仅是不差于–1,而且是严格好于–1。“全面的严格的优势策略”说起来拗口,我们约定以后可以简称为严格优势策略(strictly dominant strategy)。优势劣势是比较而言的。在这个博弈中,既然坦白是严格优势策略,那么抵赖就是相应的严格劣势策略(strictly dominated strategy)。

同样道理,坦白也是犯罪嫌疑人乙的全面的严格的优势策略,抵赖是相应的严格劣势策略。

理性的主体人是不会采用对自己明显不利的严格劣势策略的,所以在分析博弈可能的结局的时候,我们应该把局中人的严格劣势策略删去。下图中一横一竖的两条粗实线,就代表两个参与人各自把自己的严格劣势策略删去。在这个博弈中把双方的严格劣势策略都删去以后,我们就得到这样的结论:博弈的结局是双方都选择“坦白”策略,在双方博弈的这个对局之下,他们各得支付–3。劣势策略消去法

经济学习惯把市场力量对峙的稳定结局,叫作市场均衡(equilibrium)。比方说电视机的市场,供不应求将驱使价格上升,供大于求将迫使价格下降,供求力量对峙的结果,会在某个价格水平达到市场供求的均衡。但是像上面这样用删去劣势策略的方法得到的由双方的严格优势策略组成的对局,作为这个博弈的均衡,叫作严格优势策略均衡(equilibrium of strictly dominant strategies)。

这个博弈有一个一直沿用的专门名称,叫作囚徒困境(Prisoner’s Dilemma),所谓囚徒就是上面讲的嫌疑犯。在囚徒困境两行两列的矩阵格式中,下面一行对应的是甲的严格劣势策略,右面一列对应的是乙的严格劣势策略,把它们都删去,就得到“坦白,坦白”得“–3,–3”这个严格优势策略均衡。注意,在“–3,–3”或者(–3,–3)这样的写法中,第一个数字是甲之所得,第二个数字是乙之所得。总之,面对上述形式的博弈表达,在(–3,–3)这样的写法中,第一个数字是表格左方博弈参与人之所得,第二个数字是表格上方博弈参与人之所得。

为节约篇幅,今后有时候将只在“矩阵表格”里用黑体字把结果的位置表示出来。注意,这里讲的严格优势策略,是全面的严格的优势策略:不论对方采取什么策略,我采取这个策略总比采取任何别的策略都好,而且要确实显出好来,不许“打平手”。被全面的严格的优势策略压住的那个策略,才叫作严格劣势策略。像上面那样通过把严格劣势策略删去的方法寻求对局结果的方法,叫作严格劣势策略消去法。如果甲乙都有三四个甚至更多的策略选择,通常需要一次一次又一次把严格劣势策略删去,才能最后得到一个均衡。这样一次一次把严格劣势策略删去以寻求对局结果的方法,叫作严格劣势策略逐次消去法(iterated elimination of strictly dominated strategies)。价格大战和双赢对局“囚徒困境”固然是博弈论专家设计的例子,但是囚徒困境博弈模型可以用来描述两个企业的“价格大战”等许多经济学现象。

经济学把两个企业合起来垄断或几乎垄断了某种商品的市场的情形,称为双寡头经济。双寡头经济是寡头经济的一种。寡头经济可以有好几个企业,双寡头只限于两个企业。两个企业互相竞争,都想打垮对手,争取更大的利润。可口可乐公司和百事可乐公司,几乎垄断了美国碳酸饮料市场,它们之间的争斗,可以看作这个样子的争斗。

争斗的目的,最后当然是增加自己企业的利润。可能有些读者会想,要增加利润,那就要提高商品的价格。东西卖得贵了,钱不就赚得多了吗?的确,如果只有你一家企业垄断了整个市场,提高价格可能增加你的利润。但是现在存在两家相互竞争的企业,消费者可以在两家之间选择。这时候,提价的结果不仅不能增加利润,反而可能会使自己企业的利润下降。这里,要紧的因素是市场份额。如果你提价,对方没有提价,你的东西贵了,有些消费者就不买你的东西而买你的对手的东西。这样,你的市场份额会下降很多,利润也就急剧下降。这是历经市场经济洗礼的读者都明白的道理。你提价了,而对方的价格没有提高,他的生意会比原来好得多,利润就可能大幅度上升。但是如果两个企业都采取比较高的价格,消费者没有别的选择,贵也得买,两个企业的利润都会上升。

假定两个企业都采取比较低的价格,可以各得利润30亿美元;都采取比较高的价格,可以各得利润50亿美元;而如果一家采取较高的价格而另一家采取较低的价格,那么价格高的企业利润为10亿美元,价格低的企业因为多销利润将上升到60亿美元。这时候,究竟是采用较高的价格好还是采用较低的价格好,两个企业面临的博弈或对策,可以在下图中表示出来,单位是10亿美元,现在都是正数。因为是关于对策的学问,博弈论也叫作对策论。价格大战

很明显,对于两个企业,高价都是它们的严格劣势策略,所以,根据严格劣势策略消去法,双方价格大战的结果,是左上方都采取低价策略进行价格大战各赚30亿美元的情况。

比较囚徒困境的博弈和价格大战的博弈,细心的读者可以发现,要是把前面两节囚徒困境博弈的矩阵表示中的每个数字都加上6,正好就变成了现在价格大战博弈的矩阵表示。如果你一开始就发现了这一点,那么价格大战的结果就不需要重新用严格劣势策略消去法来做了,你马上可以肯定博弈的结果是左上方的格子所示。事实上,每个数目都加大6,那么优势的仍然优势,劣势的仍然劣势,对局形势并没有任何实质性的变化。将来我们还会进一步看到,许多商战的对策形势,都可以像价格大战博弈那样,归结为囚徒困境博弈。这也是为什么博弈论的书通常都要从囚徒困境博弈讲起的道理。

为什么两个企业那么愚蠢要进行价格大战呢?那是因为每个企业都以对方为敌手,只关心自己一方的利益。在价格大战博弈中,只要以对方为敌手,那么不管对方的决策怎样,自己总是采取低价策略会占便宜。这就促使双方都采取低价策略。但是,如果双方勾结或合作起来,都实行比较高的价格,那么双方都可以因为避免价格大战而获得较高的利润。有人把这样一种双方都采取高价策略的对局形势,叫作双赢(two-win或者win-win)对局。

由于在这个企业价格大战博弈之中,如果双方勾结或联手采取高价策略,双方将都是双赢对局的赢家,所以我们常常把价格大战的参与人采取高价策略,说成他们采取合作策略。相应地,如果参与人采取低价策略,就说他采取不合作策略,或者背叛策略。为什么主要讨论非合作博弈

博弈论主要研究非合作的博弈。本书也将基本上不谈合作或勾结的情形。这有两方面的原因。

从经济的角度来看,如果几个大企业联手或勾结起来形成对行业的垄断,谋求最大利润,那么它们结成的联盟,称为“卡特尔”(Cartel)。卡特尔因为由自主的企业组成,所以很不稳定。以产量竞争来说,组成卡特尔,就要讨价还价,达成限制产量的协定,总产量因为协定的限制降低了,价格就会上去,可能比结成卡特尔以前高出很多。这时候,谁要是偷偷地扩大产量,它可能会占到很大的便宜。卡特尔联盟和组成联盟的成员之间的关系,不是上下级的关系,不是谁服从谁的关系。卡特尔的成员,都是独立的经济主体,只不过为了利益走到一起来了。既然偷偷违反协议增加产量或提供优惠会捞到很大的便宜,这就促使一些成员违反协议。所以说,卡特尔行为本身就提供了瓦解卡特尔的激励。在人类经济活动中,除了石油输出国组织欧佩克(OPEC)还算比较成功以外,卡特尔成功的例子实在很少。

欧佩克之所以比较成功,重要的原因在于它最大的成员沙特阿拉伯“自律”较严。石油产量最大的沙特阿拉伯自律严了,就可以在相当程度上避免或缓和其他成员违反协议对卡特尔的危害。沙特之所以自律较严,也是自己的利益所在。

从政府管制的角度来看,卡特尔在许多情况下是非法行为。20世纪80年代电风扇大战的时候,我国电风扇企业曾经一起协议制定最低价格,规定什么类型的电风扇至少要卖多少钱,不许把价格降到比协议规定的价格还低的位置,其目的无非是不要竞相降价,以免大家的利润都下降。这就是卡特尔行为。很快,国务院就发出文件,指出协议非法。这主要是不许企业联手抬高商品价格损害消费者的利益。从原则上说,政府鼓励企业之间的竞争。企业竞争,会给广大消费者带来很大的好处。比如在20世纪90年代初期,我国移动电话市场原来基本上是一家垄断,设置使用一部移动电话的费用,高达数千元甚至上万元。后来打破这一垄断,允许几家企业经营,设置一部移动电话的费用,很快就下降到千元以下。

初看起来,鼓励竞争似乎对企业不利,使企业不容易赚钱。但是只有这样,才能激励企业改善管理,开发技术,努力以较低的成本生产质量较好的东西,提高企业的市场竞争力。由于历史的原因,我国绝大多数企业在国际市场上的竞争力曾经长期很低。竞争力不是天生就有的,竞争力本身就是竞争的结果。不先让我们的企业在国内市场好好竞争,它们在国际市场就不可能有强大的竞争力。我们在下一章会比较深入地展开这个问题。

发达国家对垄断现象和卡特尔现象的限制往往更加严厉。20世纪70年代,美国两家航空公司的老总在电话交谈中有一句话有试探对方票价走向的意图,马上受到反托拉斯局的检控和惩罚。更典型的例子是,20世纪80年代,经过多年的辩论和漫长的立法程序,美国把原来垄断电话通信市场的AT&T(美国电话电报公司)强行分割为几个公司。分割以后,由于公司之间的竞争,电话服务的价格很快就下降了一半,再加上竞争激励出来的技术进步,现在用电话卡从美国往中国打电话,每分钟只要几美分。我国电话服务市场曾经长期是垄断的,所以直到20多年前,在我国许多地方,装一部电话不仅要花三四千元,还要排队等待不少时间才能装上。但是在许多发达国家,如果你要装电话,只需通知电话公司,马上就会给你装好,完全不用缴纳什么安装费。由于竞争,如果你把选择的电话服务从原来的公司撤出来转到另一家公司,新的公司还马上会给你奖励,比如说奖励你30分钟的国内长途电话费,再加一件T恤什么的。现在,我国电话服务市场开放竞争,不仅消费者马上在话费等方面得到实惠,电话服务水平也明显上升。

由于合作和勾结不容易,也由于政府多半都鼓励竞争,所以,我们将主要研究非合作博弈。公共品供给的囚徒困境

公共品和私人品,性质很不一样。私人品是私有私用,除了像他穿得整齐你看着也舒坦那样十分间接的效应以外,别人很难沾什么光。公共品则不一样,不管是谁提供的,许多人都可以享用。典型的如路灯,只要有人装了,路人都将得到好处,哪怕他没有为此贡献过一分一厘。

设想乡下某个地方有一个只有张三李四两户人家的小居民点,由于道路情况不好,与外界的交通比较困难。假设修一条路出去,每家都能得到“3”那么多好处,但是修路的成本相当于“4”。这时候要是没有人协调,张三李四各自打着是否修路的小算盘,那么两家博弈的形势如下:如果两家联合修路,每家分摊成本“2”,各得好处“3”,两家的纯得益都是“1”;如果一家修另一家坐享其成,修的一家付出“4”而得到“3”,得益是“–1”,坐享其成的一家可以白白得益“3”;如果两家都不修路,结果两家的得益都是“0”。归纳起来,就是下面的博弈。合作修路博弈

坐享其成的一家可以白白得益“3”,是因为我们假设修路的一方并不因此获得路权,即他不能因为修了路就不让邻居走。

在这个博弈中,对方修路、自己不修路可以坐享其成;对方不修路、自己修路将得不偿失,所以修路是张三的严格劣势策略,我们应该把它消去。同样,修路也是李四的严格劣势策略,所以也应该把它消去。这样运用严格劣势策略消去法,我们就得到黑体字所示的这个博弈的严格优势策略均衡:两家都不修路,大家都得0。

一般来说,如果张三只有李四一家邻居,李四只有张三一家邻居,他们多半关系比较好,会互帮互助。这样的两家,自然会好好商量修路的问题,一起把路修好,大家都得到好处。相反的极端情形,两家有仇,也是可能的,那就麻烦了,不是什么修路不修路的问题,迟早要出事。但是,这两种情形,因为掺杂了别的因素在里面,所以都不在博弈论讨论之列。

如果不另外声明,博弈论讨论所牵涉的局中人,都是经济学上所讲的“理性人”,他们只为己,但是并不刻意害人。现在城市公寓里面的不少居民,在邻居关系上,差不多就是这种理性人的关系。对于他们来说,都市化进程的一个副产品,就是“身旁的人已不再熟悉”,陌如路人。如果没有公寓物业管理方面的制度安排,新公寓家家装修一流,可是楼道却杂乱无章,常常还阴暗得很。路灯坏了,往往长久没有人修理。修路灯也和修道路一样,是一个大家都袖手旁观才是严格优势策略均衡的博弈。

这就是公共品供给的囚徒困境:如果大家都只从自己得益多少出发考虑问题,大家都只是打自己的小算盘,结果就谁也不作为,从而对局锁定在“三个和尚没水吃”的局面,无法实现合作双赢的前景。

所以,公共品问题一定要有人协调和管理。就一个国家来说,最重要的公共品是国防、教育、基础设施和其他政府部门。政府责无旁贷,要用好来自纳税人的钱,把文化教育、社会保障、基础设施和国防安全等事情做好。机关大院,居民小区,要有专人协调管理,把身边看起来很琐碎但是弄不好就很损害工作条件和生活环境的事情做好。

发达国家一方面比较讲究个人意志,另一方面对公共秩序的管理十分严格。比方说你买了房子,一方面房子连同地皮都是你的私产,另一方面你不能对你的私产为所欲为。哪怕只是草地没养好,破坏了小区的格调,社区也要管你。邻居对于你没有管护好草地影响了小区格调的抱怨,邻居对于你喜欢大声喧哗扰人清梦的抱怨,都会通过社区匿名地通报给你。政治家的囚徒困境

同样,政治家们也会变成“囚徒困境”中的“囚徒”。迪克西特和奈尔伯夫的《策略思维》中讲了这么一个例子。

1984年,大多数政治家都很明白,美国联邦预算的赤字实在太高了。解决财政问题的基本思路,不外乎“节流”和“开源”。联邦的巨额开支每一笔都理据十足,所以裁减开支在政治上并不可行。这样一来,大幅增税应该是不可避免的。不过,谁愿意担当政治领导角色,带头主张这么做呢?议会政治的政治家以讨好选民为己任,而增税是选民最不喜欢的事情。民主党总统候选人沃尔特·蒙代尔(Walter Mondale)想要在自己的竞选活动当中为这么一个政策转变制造声势,却被罗纳德·里根打得落花流水,因为里根许诺“绝不加税”。1985年,这个议题陷入僵局,无论你怎么划分政治派别,无论是民主党还是共和党,无论是众议院还是参议院,无论是政府还是国会,各方都希望把提出加税的主动权推给对方。

从各方的角度看,最好的结果在于,另一方有人提出加税和削减开支,他们因此不得不付出政治代价。反过来,假如自己提出这样的政策,而对方坚守被动局面,并不附和,自己就会落得最糟糕的下场。双方都知道,与同时坚守被动,眼看巨额赤字上升而无所作为相比,联合起来共同倡议加税和削减开支,共同分享荣誉也分担谴责,显然会对整个国家更有利。即便对他们自己的政治生涯,从长期而言也会有好处。

这样,我们可以画出一个已经熟悉的表格,标明可能的策略和结果,将上述情况变成一个博弈。参与博弈的双方分别是民主党和共和党。为了表示谁更加倾向于怎么做,我们把每个结果按照各方的利益给出从1到4的排序,数字越小越好!每个格子左下角是共和党给出的排序,右上方是民主党给出的排序。共和党和民主党的排序

显而易见,对每一方而言,保持被动是一个优势策略。而这也是真实发生的事情,第99届国会根本没有做出任何加税决定。第99届国会确实通过了《格拉姆—鲁德曼—霍灵斯法案》(Gramm-Rudman-Hollings Act),这一法案规定以后必须实行削减赤字政策。不过,这只是一种伪装,好像采取了行动,实际却推迟了做出艰难抉择的时间。这一目的与其说是通过限制财政支出的做法做到了,不如说只是玩了一个会计上的小把戏。基数支付和序数支付

细心的读者应该注意到,上一节政治家囚徒困境的支付矩阵,和我们前面讲过的支付矩阵很不一样。以前讲的支付矩阵,在运用劣势策略消去法的时候,都是把相应于支付数目小的策略删去,把相应于支付数目大的策略留下。但是上一节讲的政治家的囚徒困境,我们却把相应于数目大的策略删去,把相应于数目小的策略留下。这是很大的不同。

如果你在阅读上一节的时候,没有注意到这个差别,我就要责怪你读书粗心、不经大脑了。

究竟把小的删去还是把大的删去,不能任意胡来。关键是看大的好还是小的好,看大的表示好的还是小的表示好的。以前讲的支付,具体来说就是赢利、赢得或者得益,越大越好。但是上一节讲的政治家的囚徒困境,文字已经说清楚,“为了表示谁更加倾向于怎么做,我们把每个结果按照各方的利益给出从1到4的排序,数字越小越好”。每个格子左下角是共和党给出的排序,右上方是民主党给出的排序。这就是说,在每个博弈参与人的4种结果当中,1表示的是第一好的结果,2就是第二好,3就是第三好,而4是总共4种情形当中当事人认为最不好的情形。

日常生活中,人们常常用两种不同的数字方式表示好坏,表示不同的满意程度。一种是像百分制考试、托福、美国研究生入学考试(GRE)、跳水比赛、体操比赛、十项全能比赛的计分那样,分数越高越好。我们在介绍政治家的囚徒困境以前使用的所有支付表示,都是这样的表示。另外一种,是像体育比赛第几名这样的表示,第1名比第2名好,第7名比第23名强,等等,表示名次的数字越小越好。政治家囚徒困境的上述讨论,就采用了这样的表示方式。所以,以前是删小留大,现在是删大留小,但都是删劣留优。

数字是大的好还是小的好,这要看你使用什么制度。小学生比成绩,如果按百分制比,分数越高越好,如果按名次比,第1名比别的都好。

由此可见,数字表达好坏,有两种基本的制度:一种是像百分制那样的基数(cardinal)表示制度,数字越大越好;另外一种是第1名最好的序数(ordinal)表示制度,数字越小越好。为什么叫作基数表示和序数表示呢?原来,按照语义学,数词分为两种:基数词和序数词。像1、95、7.8、–3.141 6等,是基数词,而第1、第2、第7等,是序数词。可见,基数词给出数值,而序数词给出排序。简单博弈表示中的支付,排出次序或者序次来,是最本质的操作,至于基数赋值究竟是多少,其实反而是第二位的。如果你在阅读本书的前面部分的时候,觉得价格大战中的6、3、1、5不好把握,(为什么不是7、3、1、5呢?)觉得下一章情侣博弈中的2、1、0这些数字不好把握,(为什么不是4、2、0呢?)那是相当正常的现象。但是究竟哪个比哪个好,你应该比较容易把握。这种对比,正好说明排序比基数赋值重要。

总之,以前讨论过的支付矩阵,都是基数支付矩阵,上一节讨论政治家的囚徒困境讲的支付矩阵,却是序数支付矩阵。有些读者不满足于了解博弈论的思想,而且决心掌握本书介绍的博弈论的初步方法。对于这些读者,建议你们把前面讲过的用基数支付矩阵讨论的博弈,全部改用序数支付矩阵重新讨论一次。这样,方法就掌握了。

值得注意的是,序数词不仅是第1、第2、第7等,我们也可以说第0,它比第1更好,可以说第7.8,介乎第7和第8之间。还可以说第–3.141 6、第π、第3π等,不一定是整数,也不一定是正数,甚至不一定是所谓的“有理数”。反正,原则是越小越好。

如果大家对序数表达不大习惯,暂时不使用也没有太大关系。记得我给大学一年级下学期的同学上“中级微观经济学”的第一课时,曾经打出下面这样一个标题:第0章 预备知识

课堂里泛起一阵轻轻的笑声。笑声说明一些同学不习惯章节从0而不是从1排起。但是笑声很轻,并且很快过去,却又说明不习惯的同学马上就习惯了。所以,如果你对序数表达不习惯,那么我告诉你,这到头来还只是一个习惯不习惯的问题,没什么了不起。

作为一个教师,我更多的是体验这阵笑声传达的一种心心相印的意境。美苏争霸的囚徒困境

军备竞赛是囚徒困境的又一个典型例子。下面讲的,源自30多年前美国的博弈论课本,本书不敢掠美。

从军事上看,40多年前,美国和苏联是世界上的两个超级大国,它们相互对垒。假定每一方都有两种策略选择,一个是扩军,发展战略核武器,甚至实施“星球大战”计划等;另一个是彻底裁军,直至不设军备。如果双方都扩军,则各要花费2 000亿美元用于军费。彻底裁军,则军费为0。

在一个弱肉强食的世界上,如果美国裁军不设防,但是苏联扩军,苏联就可以任意欺侮和损害美国。这样,美国就会受到很大损失。损失之大,直至丧失主权。这使我们可以非正式地把这种情况下美国的盈利记作–∞,即负无穷大。

这时候,欺侮人的一方的盈利是多少呢?你可能想象应该是+∞,即正无穷大。其实不然。你想想,砍伐一片森林所造成的损失,难道可以用所得到的木材的价值来补偿吗?更不必说占领甚至炸毁对方一座城市,你所得到的远远低于对方的损失。被欺侮一方的损失,并不会等量地转化为欺侮人的一方的利益,这常常是对抗的规律。所以,在一方扩军欺侮别人而另一方裁军任人欺侮的情况下,我们假定欺侮人的一方将只掠夺到一个有限数额的财富,比方说10 000亿美元。这10 000亿美元的掠夺成本是上面讲的2 000亿美元。没有这2 000亿美元的军费来武装到牙齿,就不能征服对方。所以,在上述数据假设之下,掠夺者之纯盈利应该是8 000亿美元。

可见,如果双方都裁军,各方在这种实际上没有对峙的军事对峙中的盈利都为0。如果双方都扩军,那么在这场均势的军事对峙中,各方的盈利都等于–2 000亿美元,双方都花了军费嘛。如果一方扩军而另一方裁军不设防,扩军一方的盈利为8 000亿美元,不设防一方的盈利为–∞。这样,我们就可以写下美苏两家的争霸博弈。美苏军备竞赛

运用劣势策略消去法,我们马上知道,双方都扩军是这个争霸博弈唯一的优势策略均衡。以后我们还会知道,双方都扩军是这个争霸博弈唯一的“纳什均衡”。

40多年前,现实的军备竞赛形势,的确很像左上角格子代表的情形。这是很可悲的。人类为什么那么愚蠢,不和平共处于不花费军费的右下角呢?这本来是对双方都比较有利的情况呀。原因很简单:在一个弱肉强食的世界上,不论对方是扩军还是裁军,站在自己利益的立场,扩军总是比裁军有利。如果苏联裁军,那么美国也裁军将得0,美国若扩军将得8 000亿美元,所以为了自己的利益美国要扩军;如果苏联扩军,那么美国也扩军将损失军费开支2 000亿美元,美国若裁军将损失无穷大,所以为了自己的利益美国更要扩军。反过来也一样,这就造成了实际上和囚徒困境一样的争霸博弈均衡:双方都扩军,双方都损失。

值得一提的是,这是人们40多年前的数据和思维。现在,世界大势已经和那个时候很不相同。苏联解体,世界上只剩下美国这个超级大国。在美国现代史上,里根总统的地位为什么那么高?部分原因就是他的“星球大战”计划,拖垮了苏联的经济,为美国成为世界上唯一的超级大国创造了条件。

读者是否注意到,上面的分析,隐含美苏实力完全相当的假设条件,但实际情况却是苏联不像美国那么富强。如果苏联比美国弱一点儿,情况又会怎么样?这里说的“弱一点儿”,不妨具体想象为军力弱一点儿,但是整个经济实力弱很多。请试试做一个美苏军备博弈分析,体现苏联比美国弱一点儿的这种情况。你会发现,只要一方不是比另外一方弱得太多,两个超级大国还是会陷入军备竞赛的囚徒困境,直到较弱的一方被拖垮为止。第二章情侣博弈和协调博弈

如果博弈参与人没有严格的优势策略怎么办?难道参与人没有严格的优势策略的博弈,就没有稳定的结局了吗?情况并非如此。

这一章,我们借助“情侣博弈”引入博弈论最重要的“纳什均衡”的概念。由参与人的相对优势策略组成的策略组合,也是博弈的稳定的结局,因为在这种对局之下,没有参与人有单独改变策略选择的激励。这正是纳什均衡概念的精髓所在。

我们还介绍寻求纳什均衡的相对优势策略下画线法,并且借助情侣博弈试图澄清一些人对于现代经济学理性人假设的误解。情侣博弈和纳什均衡

迄今我们讲过的博弈均衡,都是严格优势策略均衡。我们已经知道,这种由每个博弈参与人的严格优势策略组成的博弈均衡,可以用一次一次消去严格劣势策略的“严格劣势策略消去法”做出来。可惜,很多博弈没有严格优势策略组成的严格优势策略均衡。下面的情侣博弈就是一个例子。

情侣还讲什么博弈?你可能会这样问。其实,即使是情侣,双方的爱好或者偏好还是不完全相同的。设想大海和丽娟正在热恋。难得的周末又到了,安排什么节目好呢?周末晚上,中国足球队要在世界杯外围赛中和伊朗队进行生死之战。大海是一个超级球迷,国内的什么“中超”联赛都不肯放过,何况是不争气的国家队的生死大战?也正好是这个周末的晚上,俄罗斯一个著名芭蕾舞剧团莅临该市演出芭蕾舞剧《胡桃夹子》。丽娟最崇尚像钢琴、芭蕾这样的高雅艺术,对斯拉夫民族的歌唱和芭蕾更是崇拜得五体投地,她怎么肯放过正宗的俄罗斯芭蕾《胡桃夹子》?这么说,一个在自己家里看电视转播的足球比赛,一个去剧院看芭蕾演出不就得了?问题在于,他们是热恋中的情侣。各自度过这难得的周末时光,才是最不乐意的事情。这样一来,他们真是面临一场温情笼罩下的“博弈”。情侣博弈

在情侣博弈中,双方都没有严格优势策略和严格劣势策略。我们不妨这样给大海和丽娟的“满意程度”赋值:如果大海看球,让丽娟一个人去看芭蕾,双方的满意程度都为0;两人一起去看足球,大海的满意程度为2,丽娟的满意程度为1;两人一起去看芭蕾,大海的满意程度为1,丽娟的满意程度为2。应该不会有丽娟独自看球而大海独自去看芭蕾的可能,不过人们还是把它写出来,设想因此双方的满意程度也都是0。这样来描述大海和丽娟的情侣博弈,你觉得怎么样?

读过前一章的读者知道寻求严格优势策略均衡的严格劣势策略消去法。现在,芭蕾不是大海的劣势策略,因为如果丽娟坚持芭蕾,他选足球只得0,选芭蕾却还可得1。足球当然更不是大海的劣势策略,所以,大海没有绝对的劣势策略。同样,丽娟也没有绝对的劣势策略。这样,严格劣势策略消去法就没有用武之地了。

但是,他们总会做出一个较好的选择,因为他们是热恋的情侣。博弈论中最重要的概念“纳什均衡”,指明了情侣博弈等一大类策略优势不那么明显的博弈的结局。策略优势不明显,指的是双方都没有“不论对方采取什么策略,我总是采取这个策略好”的严格优势策略。其实,我们只需关心一种双方“相对的优势策略”的组合。在情侣博弈中,双方都去看足球,或者双方都去看芭蕾,就是我们所说的相对的优势策略的组合:一旦处于这样的位置,双方都不想单独改变策略,因为单独改变没有好处。准确地说,是单独改变不会带来进一步的好处。比方说两人一起看足球,大海得2丽娟得1;如果大海单独改变去看芭蕾,变成自己得0,没有好处;如果丽娟单独改变去看芭蕾,也变成自己得0,同样没有好处。所以,两人一起去看足球,是稳定的博弈对局。按照同样的思路,两人一起去看芭蕾,也是稳定的博弈对局。

这样的思考引导我们得到纳什均衡(Nash equilibrium)的概念,纳什(John F. Nash)是在1950年建立这一概念的数学家,由于对博弈论做出奠基性的贡献,他在1994年荣获诺贝尔经济学奖。在情侣博弈中,双方都去看足球,或者双方都去看芭蕾,是博弈的两个纳什均衡。我们在博弈的上述表示中,用黑体数字表示两个纳什均衡的位置。

这里要注意的是,纳什均衡不是(2,1)和(1,2),而是(足球,足球)和(芭蕾,芭蕾),因为纳什均衡是双方策略的组合。两个纳什均衡分别是:大海选足球,丽娟也选足球;丽娟选芭蕾,大海也选芭蕾。我们只是用(2,1)指代大海选足球丽娟也选足球这个(足球,足球)均衡,用(1,2)指代丽娟选芭蕾大海也选芭蕾这个(芭蕾,芭蕾)均衡。总之,两个纳什均衡是(足球,足球)和(芭蕾,芭蕾),在这两个均衡中,博弈双方的所得分别是(2,1)和(1,2)。我们在前面说过,在(2,1)或者(1,2)这样的写法中,第一个数字是博弈的“左方参与人”大海之所得,第二个数字是博弈的“上方参与人”丽娟之所得。所谓左方参与人,就是写在博弈表格左边的参与人;所谓上方参与人,就是写在博弈表格上方的参与人。

这一节我们借助情侣博弈引入博弈论最重要的概念—纳什均衡。因为绝对优势策略一定是相对优势策略,所以很显然,前一章讨论囚徒困境那样的博弈时关注的严格优势策略均衡,也都属于现在引入的纳什均衡。但是,纳什均衡却不一定是严格优势策略均衡。一句话,纳什均衡的概念要求比较宽、比较低,严格优势策略均衡的概念要求比较高、比较窄。

情侣博弈原来的标准说法是性别之战(battle of sexes),说的是恩爱夫妻的偏好差异所引起的对局形势,是利益关系方面双方大同小异这么一种情况。不同的说法适合不同的情形,读者可以有自己的偏好。

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载