合作博弈引论(21世纪经济学研究生规划教材)(txt+pdf+epub+mobi电子书下载)


发布时间:2020-10-08 05:52:39

点击下载

作者:施锡铨

出版社:北京大学出版社

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

合作博弈引论(21世纪经济学研究生规划教材)

合作博弈引论(21世纪经济学研究生规划教材)试读:

作者简介

施锡铨,上海财经大学金融学院教授、博士生导师,主要研究领域为概率统计、统计质量管理和博弈理论。施教授最早研究Jackknife、Bootstrap和其他再抽样方法,1994年在美国发表的有关统计质量管理的论文被国外称为“解决了西方工业世界近二十年来尚未解决的问题”,得到了欧洲工业协会主席的高度重视和评价。曾在Annals of Statistics等国外顶级杂志及《科学通报》《数学学报》等国内权威刊物上发表论文六十多篇,并出版和翻译著作十余本,2000年出版的《博弈论》荣获上海市优秀图书一等奖及上海市第六届哲学社会科学优秀成果著作类一等奖。主持过四项国家自然科学基金项目及一项国家社会哲学科学基金项目,其中《刀切法、自助法及其他再抽样方法》荣获国家教委科学技术进步三等奖。前 言

2011年炎热的七月底,我终于基本完成了耗时三年多的《合作博弈引论》,算是献给自己的生日礼物,勉励自己豪迈地跨入人生的第六十八个年头。“六”十“八”,大“顺”加大“发”,可是个好兆头。

我真正地学习合作博弈,始于2006年,那是因为2005年的诺贝尔经济学奖授予了以色列数学家奥曼和美国退休的经济学教授谢林,以表彰他们在合作博弈理论方面的贡献。一时间,评论文章铺天盖地,主题都是惊叹时隔11年,诺贝尔经济学奖又颁给了同一个科目——博弈论(上一次是在1994年,表彰纳什、泽尔腾和海萨尼奠定了非合作博弈的基础),可见博弈理论何等地重要,甚至“伟大”!我对这种几乎一边倒的评论持有很不同的看法,然而个人的力量是渺小的,我无力改变“主流”,但是我可以自我提高修养。一天接到《中国证券报》的长途电话,邀请我为他们的理论版写一篇特约文章一起“欢呼”一下。我告诉他们,我写出来的东西也许会有点“不入流”。对方很大度,一声“OK”,于是就有了那篇《合作博弈理论缘何能获诺贝尔奖》。后来回过头来,觉得这篇文章写得很粗浅,在介绍合作博弈方面讲得很生硬,写的过程显得很累,不用说,那是因为自己的合作博弈理论的底子太差!听说过世界上的事情怕就怕“认真”两字么,咱就认认真真地系统地看了一些外文书和有关文献,详详细细地做了几本笔记,这也算是近几年闭门修炼的成果吧。

合作博弈的主要重点在于如何制订合理的分配方案,只有科学合理地进行分配,才能做到人心所向,才能提高大联盟的凝聚力,才能把蛋糕做得更大。社会上有人认为“做大蛋糕是重点,分配蛋糕是第二位的”,那么这些人应当静下心来学习一点合作博弈的理论。小到两个人之间的讨价还价,大到国家之间的外交、外贸等的谈判,甚至领土领海的划分,实际上都是在“分蛋糕”。这方面的例子还包括:现在好多人常常挂在嘴巴边的“二次分配”,全国老百姓都在关心着的个人所得税制度的改革,联合国会费的分摊,OPEC的石油生产和出口额的分配,等等。这些事情做好了,会带来社会的和谐,世界的和平。难怪诺贝尔经济学奖要颁给合作博弈理论,因为它是解决矛盾和冲突的有力工具。中国共产党的历任领导人在许多历史时期都体现出他们是合作博弈的高手,本书的第一章中列举的毛泽东的《论持久战》、邓小平的“一国两制”以及现在领导人提倡的构建和谐社会等都是合作博弈的经典案例。

我们一直在强调分配蛋糕的重要性,因为本书乃至国外有关合作博弈的教材或书籍,都是在强调如何求合作博弈的解。所谓合作博弈的求解,无非就是求一个或若干个分配蛋糕的合理方案(也许要顾及形形色色的公理),也就是说,我们自始至终在谈论如何分配蛋糕以提高大联盟的凝聚力。你想掌握合作博弈的理论,沿着这条思路是重要的诀窍。不管是两人讨价还价问题,还是联盟博弈,或者是延伸出来的模糊合作博弈和更有实用性的多选择博弈,它们的“解”概念无一不围绕着集值解——核,和一点解——Shapley值以及这些概念的延伸而展开。而且在这些类型的博弈中,这些解的性质以及相互之间的关系几乎可以说是“大同小异”。这样,为我们的学习和研究带来了极大的方便。当然,在有些方面,尤其是解的性质的证明方面,由于博弈类型和模型的不同,从而产生不同的处理方式。

编写这本书,只是将自己的读书笔记整理以使得尽可能做到普及合作博弈的理论并且推而广之地应用于社会实践。所以,本书与专著“浑身不搭界”,希望读者不要过于苛求。但是,为了尽可能地让经济管理方面的读者能够读懂合作博弈理论中的数学思路和数学证明方法,我在编写的过程中“煞费苦心”,例如,有些例题必须给出详细的求解过程,否则会使不少人感到莫名其妙。有些例题缺少了条件,只得把条件一一补上,甚至发生与参考书中结果未必相同的现象。长长的解题过程也许使得精通数学的读者觉得“啰唆”,但是当你想到其他的人可能得到了照顾,就应该心平气和。不好意思,由于借用了自己的读书笔记,因此有些叙述顺序没有完全按照我所主要参考的书籍。有时候胆子一大,干脆将自己的想法“塞”了进去。例如,我觉得Shapley值的“匿名性”公理太数学化了,凭着我在财经院校的近二十年经验和直觉,觉得经济管理方面的读者可能很难理解。于是,我搞了个比较直观的讲法,似乎很管用,因此装模作样地给予定义和定理。读者如果看了觉得很有道理,那么我会很高兴。(我甚至猜想它们有等价的可能!)不过,原来的公理在书中还是照搬不误,一点儿也不会影响合作博弈理论的正确性和系统性。

本书编写的主要思路参考了两本书:Myerson的Game Theory:Analysis of Conflict以及Branzei,Dimitrov和Tijs的Models in Cooperative Game Theory。前者是诺贝尔奖获得者所写,很有市场。之所以选中后者,是因为这本著作里详细地介绍了模糊合作博弈和多选择博弈。一般的合作博弈讨论的情况是,局中人要么完全参与合作,要么拒绝合作。众所周知,我们面临的社会并不完全是那样的,常常是局中人用自己特有的热情和精力或者财力参与合作,当然最后的分配所得一定跟局中人参与合作的态度有关。研究这种现象具有相当大的实践意义。而模糊合作博弈和多选择博弈正是讨论此类模型的。况且,这本书的三位作者在这方面拥有非常多的成果,他们的这本书相当于他们在这方面的专著。我为自己有机会学习这本书而“沾沾自喜”,当然毫不犹豫地选择了它作为主要参考。唉,我“倒霉”就“倒霉”在这一决策上!

听说,某工程师讲过,高铁造好以后应该有个“夯实”的过程,管理上应该有个“磨合”的时段,这样才能保证安全,所以他两年之内不会去搭乘。我不知道这件事是否为真。可是,从科学上来说,应该是很有道理的。一种理论的面世,照理也应该有个“沉淀”的过程,才能使人信服。模糊合作博弈和多选择博弈的理论是近十几年一直被关注的东西,匆忙写成专著,难免会出差错。我们在本书编写的过程中,就发现国外作者常用处理一般合作博弈的手段去证明模糊合作博弈的结论,由于前者是后者的特例,好多场合证明显然不可能通过。碰到这种情况,叫人想“抄”也不敢!起先,我咬咬牙关自行解决了几个,到后来,搞不动了,很有点难度了,我只能向那本主要参考书的作者“呼救”,希望他们能给我有关他们发表的原始论文作为参考。最先,他们认为不会错,不过要过几天给我答复。我等不及,做了一个附件详细地指出错误的所在。这次他们很爽快,承认证明错误,下面的要求很谦虚:“Do you have a correct one?”我晕!不难猜想那个原始论文也可能是错的。看来,“权威”也不能依赖!我现在特别相信年轻人创造的那句话的现实意义:“神马都是浮云。”读者朋友们,你信还是不信?反正我信了。

我只能承认我在自讨苦吃,经历了大约三十多天的千辛万苦,本人终于“have a correct one”了。读者诸君如果对照着阅读本书与那本外文著作(听说这本书已经有了中译本),将会发现不少定理在形式上的确是一样的,但是仔细阅读将会发觉不少证明被改过了。倘若你认为我是对的,谢谢你的支持。不好意思,我没有告诉对方有关我的证明方法,只告诉了他有关我已经正确地证明了那个定理的消息。一个很简单的想法是,很希望他们能有机会拿到我的这本书,看看咱们中国人是如何处理这些问题的。

本书在编写过程中,得到了上海财经大学副校长王洪卫教授和金融学院常务副院长赵晓菊教授的关心和鼓励,他们甚至动用了部分“211”经费使我在资料收集、学术交流等各方面免除了后顾之忧。我知道,简单的一声“谢谢”不足以表达全部,然而我一个无职无权的“小八腊子”也只能说一句谢谢了。

北京大学出版社的朱启兵编辑对本书的出版给予了大力的支持和帮助,这年头,能对像我这样的“小八腊子”给予无私帮助的人无疑是好人,王洪卫教授和赵晓菊教授也是这样的好人,我从内心真诚地祝愿:“愿好人一生平安!”施锡铨2011年7月底于上海财经大学第1章引言1.1 为什么要研究合作博弈

在国内的经济管理领域,如今谈论博弈理论已经成为家常便饭。无论是报纸,还是杂志,纷纷显现“博弈”两字,字里行间,总以“赢得了这场博弈”来称赞某方获得的胜利或成果。似乎不用博弈两字就不能体现出该件事情的重要性,也不能突出某人的高明。其实,博弈是一件最平常不过的事情!

目前国内谈论的博弈论(有时候或者有些地方称为“对策论”),译自英文“the game theory”,通俗地讲,是研究游戏的理论。游戏永远是最广泛的人间活动,无论是生活还是工作,人生何时何处不是处于游戏之中呢?所以,游戏两字贯穿了每个人的一生,并且散播在茫茫宇宙的各个角落。只要是人,没有一个不玩人生道路上的游戏,但是,不能否认能够通晓博弈理论的人却不多。游戏与学术名词“博弈”之间,关系是那样地密切,以致它们完全混杂在一起,使用着同一个名字“game”,然而它们之间又有着天地般的鸿沟,这也许是因为在“博弈”的后面居然还跟着个“论”字。

有关博弈论的研究在国内存在着一定的误区。仅从对它的历史认识而言,大都以为此“论”出自西方,出自获得诺贝尔经济学奖的数学家纳什,出自多才多艺的天才冯·诺伊曼,等等。在这个问题上,国内许多专家的认识还真不如“老外”实事求是,西方学者的不少经典博弈论著作中,参考文献赫然标出《孙子兵法》,这篇文献比起任何其他的参考文献,在时间上要早几千年,可见中国人的老祖宗在理论上领先了人家几千年。至于到了现在,我们又不得不从他们那儿“拿来”学习和研究,以便尽力赶上世界新潮流。看来,咱们这些后辈真有些不太争气。不过既然老外很佩服我们的老祖宗,咱们中国人的脸面总算有些风光。另外一个重要的误区在于,有相当一部分人,只要谈到博弈,提及市场竞争,似乎一定是“兵戎相见”、“刀光剑影”,必定要分出输赢。甚至社会科学院某研究所的某“学者”由于认为“博弈论专门研究自私自利人的行为”,从而公然进行“博弈论的批判”(见某年CCTV10的一档节目)。总而言之,他们觉得“凡博弈,一定是理性人(因此,有人认为这相当于自私自利人)之间非合作的斗争”。之所以出现这个误区,除了有些“学者”本身对博弈论知之甚少之外,更多的原因可能与1994年诺贝尔经济学奖颁给了纳什、泽尔腾和海萨尼三位数学家这件事有关,因为该奖项主要表彰他们奠定了非合作博弈的基础。一时间,许多人认为博弈一定是非合作的,或者说精彩的博弈理论一定属于非合作范畴。然而,评定诺贝尔经济学奖的委员会成员毕竟都是科学家、专家。真正的专家都清楚,博弈理论包含了“合作博弈”和“非合作博弈”两大块,这两类博弈相互之间有着密切的联系,但是又存在着重大的区别而且不能相互替代,在解决世界的矛盾和冲突的过程中,人们追求的目的常常是“合作”,达成合作的协议成为解决问题的关键和手段,合作博弈在处理此类事情方面有着独特的作用。因此,到了2005年,该委员会毫不吝啬地把该奖项颁给了以色列数学家奥曼和已经退休的美国经济学教授谢林以表彰他们对于合作博弈的贡献。尺寸拿捏之精确令人感叹不已。不过,当时在国内很少有人领会这层意义,2006年国内各报纸杂志连篇累牍发表的评论文章中,一意地欢呼“仅隔11年,诺贝尔经济学奖又一次颁给了博弈论”,在有些人的眼中,博弈论得到的待遇至少是“前无古人”,从而得出“作为学科,博弈论具有压倒性的重要地位”的结论。这也许在很大程度上辜负了评奖委员会的一番苦心。

当今世界,充满了形形色色的矛盾和冲突,潜伏着大大小小的危机。为解决这些矛盾和冲突,处理潜在的危机,有关人员就需要凑在一起玩“游戏”。如果任何游戏都是非合作性的“剑拔弩张”,最后的结果常常未必令人满意,有时候甚至让参与博弈的人们感到难堪。纳什均衡的提出曾经使世人大吃一惊,就是因为有些时候均衡结局会让人出乎意料地尴尬。譬如,著名的囚徒困境,作为问题的解,它的纳什均衡就是局中人互相背叛,显然这是一个对双方都不利的结局,因为互相合作(咬紧牙关不出卖对方)对大家绝对有好处。人们自然会提出问题:为什么要放弃对双方有利的合作结局而把互相出卖对方作为问题的解呢?众所周知,博弈论是一门研究理性人的理性行为的科学,倘若存在一个对大家都好但是却不是纳什均衡的结局,局中人不去追求这个结果而宁可忍受纳什均衡的“痛苦和折磨”,那么局中人离“理性”似乎远了一些。好比囚徒困境中的局中人互相合作(不出卖对方)远远优于互相背叛,为什么他们不去争取达到这个结局呢?从结果来看,互相合作似乎更理性一些。当然,非合作博弈的理论会告诉我们,互相合作的结局很有可能发生偏离,然而只要这两个囚徒看到合作之后的光明前景,他们会想办法进行谈判,在谈判的过程中实施“利诱或威胁”等手段,从而达到阻止任何偏离互相合作结局的可能。这一切(包括思路和过程),正是合作博弈理论要解决的问题之一。

所谓合作,并非一定表现为朋友般地亲密无间。例如,战争的双方,谁都没有把握吃掉对方,但是如果坚持打下去又对自己非常不利,最现实的办法就是试图通过谈判达成停火协议,实际上他们寻求的就是“双方合作”。很多情况下,协议可以有不同的版本,虽然每种版本都可以达到停火的目的,从而使每个局中人得益,但是不同的版本将使他们各自的得益有所不同。作为理性人,各方都希望得到最大的利益,谁也不肯做太多让步,于是谈判可能进入僵局。用非合作博弈的术语,就是博弈可能存在许多均衡,如何寻找一个合适的均衡本身是个难题。谢林利用合作博弈的理论提供了一个可能的解决办法,那就是通过“焦点仲裁人”的协调把他们引导到“焦点均衡”。北约轰炸南斯拉夫就是这方面的一个精彩案例,南斯拉夫为了国家和民族的尊严,绝对不愿意投降,然而坚持战斗下去,其损失简直不可估量;北约是借着严惩“种族灭绝罪”的名义去轰炸南斯拉夫的,然而,如果在南斯拉夫不肯投降的情况下把它炸平,北约本身就犯了种族灭绝罪,无论从道义上还是在现实效果上都对北约不利;但是,如果单方面宣布停止轰炸,则相当于自认失败,北约无论如何不会接受这样的结局。显然,停火(即合作)是最好的解决办法,但是谁都不愿意主动停战。在上海财经大学MBA的课堂上,我们与同学们讨论的结果是必须出现第三者来当“和事佬”。事实上,最后是在俄罗斯的斡旋下,事情终于得到解决,双方达成了各自认为可以接受的停火协议。这里,俄罗斯扮演了“焦点仲裁人”的角色。

从这个例子中可以看到,合作博弈的确为解决矛盾和冲突提供了一种思路和方法。在经济管理领域,人们也能感觉到,合作也许是一个更好的出路。公司之间的竞争,结果并不总是“大鱼吃小鱼,小鱼吃虾米”,弄不好来个“鱼死网破”,对大家都没有好处。因此,有关兼并与重组的许多研究已经从非合作博弈转向合作博弈,甚至出现以合作博弈为主进行研究的现象,正是出于合作博弈在解决矛盾和冲突方面有着非合作博弈不可替代的作用。因此,在欧洲和北美,很多大学的经济学院目前已经将合作博弈引入研究生教学课程。

对于合作博弈及其研究,有三句话可以总结它的精彩:“与天博弈,听天由命;与地博弈,顺其自然;与人(合作)博弈,其乐无穷。”无论是听天由命,还是顺其自然,不是要求我们一味地屈从,而是要求我们在所谓的“斗天改地”中应该尊重自然界的客观规律,与“天”“地”合作!这三句话,颇有古人所说“顺应天时、地利和人和”的意思,其结果是,对于解决矛盾和冲突,开辟了光明的前景。1.2 什么是合作博弈

前面已经指出,博弈论原来就有两个部分:合作博弈与非合作博弈。看起来,这仿佛是完全对立的两个主题,但是它们是很难分离的两个概念,在处理实际问题时,常常是你中有我,我中有你。纳什是人们公认的非合作博弈的奠基者之一(应该说,他是最重要的奠基者),其根据是纳什在1950年到1952年之间发表过四篇论文,其中有两篇建立了纳什均衡这个概念。(这可是非合作博弈的基础和最重要的概念!)其实,人们只要用心观察一下,就会发现他在另外两篇文章中讨论了讨价还价问题,建立了纳什讨价还价解(我们将在第2章中详细介绍),为合作博弈做出了重要贡献。纳什本人在1951年提出,可以利用纳什均衡这个基本概念来研究局中人之间的合作。而且他认为合作行动是希望合作的局中人之间某种讨价还价过程的结果,而在这个讨价还价的过程中,这些理性的局中人都希望自己的效用尽可能地达到最大,形成了非合作博弈的态势。纳什的这段言论,客观地描述了合作博弈与非合作博弈之间的紧密关系。所以,在我们谈论合作博弈时,很难撇开非合作博弈。或者说,无论是合作博弈,还是非合作博弈,人们似乎无法在数学上给出一个精确的定义。

笔者在2000年编著出版的《博弈论》中提到过有关当时宝山钢铁公司与上海钢铁集团的“强强联合”问题。“据说,由于客观上存在着宝钢在效益、福利、待遇等各方面优于上钢的事实,许多宝钢职工对联合持不积极态度,担心自己的利益会因此受到影响,而不少上钢职工则持欢迎态度,指望通过强强联合改善自己的生活待遇。”其实,“强强联合”显然是合作。宝钢与上钢应该看得到合作的前景是灿烂的:宝钢拥有庞大的财源和先进的管理,上钢握有包括制造异型钢管等先进的技术,联合将有可能充分发挥各自的优势,从而收到令人可观的效应。用通俗的话来说,就是合作可以把蛋糕做大。至于如何分配这块做大了的蛋糕,就需要双方进行谈判加以解决。从整体来讲,我们处理的是合作博弈问题。两边职工表现出来的态度实际上体现了极大化自身的利益的理性要求,看起来似乎是一个非合作博弈,在谈判过程中的讨价还价,就反映了这一点,但是为极大化自身利益而进行的讨价还价,其目的显然是谋求合作。

看起来,合作博弈注重于做大蛋糕,是从宏观的角度研究博弈;在分配蛋糕过程中的讨价还价相当于“抢蛋糕”式的非合作博弈,偏向于从微观的角度去解决博弈问题。因此,非合作博弈关心的是局中人在博弈中如何决策,或者实施什么样的策略;而合作博弈看重的是可以得到什么样的结局。

既然合作博弈宏观地要求做大蛋糕,那么自然不希望极大化自身利益的非合作因素会破坏合作,为了保证合作的成果,需要达成一个有约束力的合作协议。例如,在囚徒困境中,为了保证互相不出卖的合作结果,事前两个人可以订立攻守同盟,签订具有约束力的合约,包括了威胁和承诺(例如,威胁出卖同伴的一方“难保他和他的家人的人身安全”,承诺“以后长期合作并许以很高的报酬”),从而使得没有一个人敢于出卖同伙。所以,一个有约束力的合作协议成为合作博弈的关键。难怪有些学者会用一句类似于定义的话来描述合作博弈:存在有约束力的合作协议的博弈称为合作博弈。

在有许多(至少多于两个)局中人参与的合作博弈中,有约束力的合作协议应当对任何的“局中人群体”生效,我们称“局中人群体”为联盟(所有的局中人一起构成的群体称为大联盟),因此合作博弈的研究需要考虑到所有联盟的利益,分配的方案必须为所有联盟接受,使得没有一个联盟会主动脱离大联盟,从而保证了大联盟的合作。于是,在许多书和文献中,常以“联盟博弈”这个名称来替代合作博弈。

合作博弈应当建立在有合作前景和可能的基础之上。也就是说,研究合作博弈,至少应该有一个重要的假设或前提,那就是所有的局中人总是有可能组成大联盟的,或者说,所有的局中人可以期待合作将为自己带来更多的利益。在现代经济管理领域,有许多这样的例子,例如公司的兼并和重组,很可能是兼并和重组以后的公司在社会上具有更强的竞争力。现时大家谈得很起劲的社会财富再分配,也是一个真正的合作博弈问题。一个公平合理的能为各种群体认可的分配方案是构造和谐社会的基础,而和谐社会巨大的内聚力将会产生更为可观的财富。在本书叙述的内容中,主要涉及了“盈利分配”和“成本分摊”这样的主题,其实这正是合作博弈主要解决的问题。

合作博弈与非合作博弈的着重点的不同势必引起在博弈求解方面的差异。非合作博弈中重要的是求博弈的均衡,纳什均衡解呈现的是一个“策略剖面”,由于它是在最大化局中人的盈利的原则下求得的,因此几乎可以转换为一个“规划求解”那样的数学问题。但是合作博弈是需要找到一个能维系大联盟的分配方案,所以要求这个方案具有“公正”性和“合理”性。公正的标准是什么?没有一个精确而统一的讲法,有时候会产生“公说公有理,婆说婆有理”的现象,从不同的角度有不同的看法,我们总是追求几乎可以被大家接受的东西作为公正的标准。因此合作博弈的求解将涉及对“公理”的描述。正因为如此,合作博弈与非合作博弈之间虽然存在着紧密又不可分的关系,但是它们在研究方面却有着很大的差别。1.3 合作博弈的例子和经典案例

在介绍什么是合作博弈的1.2节中,已经列举了不少合作博弈的实例,本节中,我们继续介绍一些实际社会生活中的合作博弈,进一步阐述合作博弈的广泛性和对合作博弈研究的重要意义。

例1.1 一个项目在北京、上海和广州都有当地的小组,准备联合邀请某外国专家来中国分别在这三个地方作学术报告。假如该专家原计划在这段时间访问中国,因此来中国的机票他准备自己负责(先到哪个城市对于他来说是无所谓的,因为所花费的机票费用差不多),而在三个城市的接待费用由当地中方支付,并且接待方负责飞往下一个城市的机票,当然最后到达的城市负责专家回国的机票费用。从费用的支出来看,任何一个城市都不希望自己是专家访问的最后一站。于是,制订一个合理的专家来访计划摆在了大家的面前,一是要求总的花费达到最少,二是各方如何合理地分摊专家来访费用。合作博弈可以帮助我们设计这样一个方案。

例1.2 我们认为,近十多年来,处理天下大事的最精彩的合作博弈案例莫过于在香港回归问题上邓小平提出的“一国两制”。

香港回归,天经地义。它让香港人民回到祖国怀抱,它提高了中华人民共和国在国际上的地位,无论从哪种角度,都是在做大蛋糕。照例应当受到香港居民和内地老百姓的热烈欢迎和全力支持。然而,事情并不是绝对的。撇开国际上的某些政治因素之外,部分香港居民当初怀有自己的小算盘,由于对我国政治体制的缺乏了解,他们认为香港的体制优于内地,香港的民主自由程度远远超过内地,再加上香港的经济发展水平的确高于内地的事实,使得他们对回归以及回归之后的经济收入和政治地位抱有怀疑。其引起的后果是,一部分人纷纷申请并持有英国、美国、加拿大等国家的护照,同时少数有钱人把自己的资产向境外转移。虽然这一切无损于“回归”这件大事,但毕竟于“合作”不利。邓小平展现了最大的智慧和魄力,适时提出了“一国两制”、“五十年不变”。从合作博弈的理论分析,这是一种“承诺”,正是这种承诺,稳定了人心,维护了“合作”,保证了“大联盟”的“联合”。事实说明,“一国两制”的承诺使得回归进程非常顺利,再加上九七回归后不久,在中央政府的支持和帮助下,香港特区政府和香港人民安然度过那场亚洲金融风暴,在经济发展上很快恢复并走向繁荣,“回归”(合作)的效用充分地展示在香港人民、中国人民和全世界人民的面前。怀揣外国护照的人回到了香港,转移出去的资金也回了头,君不见,现在的香港呈现出一片“一派生气、欣欣向荣”的景象。

例1.3 由于对合作博弈做出重大贡献而获得诺贝尔经济学奖的谢林曾经指出,在冲突双方起争端时,显然“强硬”与“让步”是摆在双方面前两种可能的选择。如果大家都采取“强硬”的策略,也许会两败俱伤。但是,“合作”是存在可能性的,如果势均力敌的两方都坚信自己的实力,可以用“持久战”的办法尽可能地拖垮对方,就有可能导致“和平”与“合作”。说实话,我们一直“怀疑”谢林的这种思想来自于毛泽东的《论持久战》,因为毛泽东的《论持久战》完成于1938年,而谢林出版他的《冲突战略》则是在1960年!在《论持久战》中,毛泽东曾经无情地批驳了“亡国论”的悲观情绪,他分析了中日战争互相矛盾着的基本特点:“日本的军力、经济力和政治组织力是强的,但其战争是退步的、野蛮的,人力、物力又不充足,国际形势又处于不利。中国反是,军力、经济力和政治组织力是比较地弱的,然而正处于进步的时代,其战争是进步的和正义的,又有大国这个条件足以支持持久战。”毛泽东通过对敌我双方形势和力量的对比,使人们相信中国不会亡国,但是也不可能“速胜”,实质上呈现“势均力敌”,要想结束战争,唯有持久一战!抗战八年的过程和结果,充分展现了毛泽东《论持久战》的伟大战略,证实了合作博弈理论的奥妙。事实上,通过对合作博弈的研究和对毛泽东选集的学习,我们发现毛泽东不但是一位伟人,而且是合作博弈的一名“高手”。

谢林在成功地应用合作博弈理论的知识对全球安全和冲突问题进行分析时提出过两个概念:一是“可信威胁”,意即使对方深信“己方拥有致命的报复性手段”,迫使对手不敢贸然动手;二是“限制己方的行动”,通过限制己方的行为向对手传递信号,让对手明白本来自己是准备如何对付他的。这两条表示,先是“君子动口不动手”,再是向对手展示实力,不得已时,就如西方谚语所说的“用战争消灭战争”,就如毛泽东在《论持久战》中所高呼的“为永久和平而战”。举例来说,抗战胜利后,毛泽东接受“邀请”,准备赴重庆参加谈判,这对全中国人民来说,是个“利好”,是“做大蛋糕”。延安的党中央领导同志因为蒋介石常常“背信弃义”的举止而很担心他的安全,据说毛泽东说过一句话,大意是,你们在延安把胡宗南打得越狠,我在重庆就越安全。这句话透彻地阐述了合作博弈的以上两个理念。

众所周知,毛泽东同志是著名的战略家,因此他必定是成功的合作博弈专家。他一生中许多著名的言论构成了合作博弈中的高明策略。譬如,“以斗争求团结则团结存”就告诉人们,合作是要有约束力的;毛泽东提出,我们也要搞一些原子弹和氢弹,这使得我们国家拥有了致命的报复性手段,可以向一切敌视我们的人发出“可信威胁”,等到我们有了自己的原子弹和氢弹后,我国政府又宣布不会首先使用核武器,那相当于“限制己方的行动”,达到威慑敌人的作用。为“和平”和“合作”做出了贡献。

改革开放时期,以胡锦涛为核心的党中央提出的构建和谐社会,更是合作博弈的典范。只有这样,才可以加强社会的凝聚力,才能够保住改革开放的成果,使我们国家挺立在世界的前列。目前正在讨论和探索的“社会财富二次分配”、进一步“缩小贫富差距”等,都是合作博弈理论需要解决和能够解决的课题。党中央领导下的改革开放,其结果是做大蛋糕,社会财富合理分配方案的制订相当于公平、科学地分蛋糕,做不到后者,就不能保证前者,这个道理符合合作博弈的基本理论,对我国的经济学家、社会科学工作者和有关的政策制定者提出了学习和研究合作博弈的要求。1.4 如何学习和研究合作博弈

研究合作博弈,首先要有一个基本的假设,那就是“合作”是存在可能的,“大联盟”是可以形成的,或者说,大蛋糕是可以做出来的。否则的话,就没有必要去谈论合作了。

谈论合作,常常分为两种情况:一种是合作可以通过事前达成有约束力的承诺或协议而达到,这种场合通常不去考虑局中人之间如何讨价还价的细节,我们关心的是什么样的协议产生什么样的结果;另外一种是在事先无法达成有约束力的承诺或协议,那么局中人就要开始进行讨价还价,实际上是使用非合作博弈的方法去达到合作的目的,此时,我们比较关心讨价还价的过程。当然,还有一些更加复杂的方法去处理合作的问题,但在我们这样的“引论”类的书中不便讨论。

本书的第2章与第3章主要讨论两人之间的讨价还价问题,其余部分讨论联盟博弈,其中又按照局中人对“合作”的投入态度或程度分为三种情况:(1)局中人以“显明”的态度对待“合作”,要么全心全意地投入,要么根本不参与;(2)局中人以“模糊”的态度参与合作,即,他们以一定百分比的精力或财力参与合作。如果把这种情况转化为情况(1),那么参与博弈的局中人集合可以看做具有“连续统势”;(3)局中人参与合作的选择有有限多个,我们称为多选择的合作博弈。这三种情况虽然有所区别,但是,在博弈的解概念方面的引进和考虑方面基本相似,甚至一些解的性质和它们之间的关系也几乎雷同。因此,读者可以重点关心“显明”合作博弈(即一般意义下的合作博弈)的内容,这些内容将出现在第4章到第7章。当然,在处理模糊合作博弈和多选择博弈类似定理或者性质时,由于博弈的“范畴”有所扩大,因此在描述和证明的过程中将会增加难度。数学工作者应当注意这个问题,至于搞经济管理的人,一般地,他们比较看重的是结果,也就无所谓证明的细节了。第2章纳什(两人)讨价还价解2.1 从囚徒困境说起

我们先研究一个典型的非合作博弈,那就是著名的“囚徒困境”问题。

在一个案件中,两个嫌疑犯被警方抓获,按照惯例他们被关在不同的房子里接受审讯,检察官向他们分别交代了有关政策。在互不知晓对方任何动作的情况下,他们各自有两个策略可供选择:与同伙合作(对于警方来说,这意味着“抗拒”)或者背叛对方(从警方的角度,这就是“坦白”)。如果双方都取策略“合作”而拒绝坦白,那么由于证据不足,他们将在一个月的拘留期满之后获得释放;倘若双方都背叛对方,采用坦白全部作案事实的策略,那么按照法律,案情将使他们各自被关8个月;如果两人中有一人抗拒,另一人坦白,那么“坦白从宽,抗拒从严”,坦白的人立即释放回家,抗拒者将在牢狱中苦度15个月。在大家所熟悉的博弈理论中,对这样的完全信息静态博弈常常通过一个效用(或者盈利)矩阵来描述。下列矩阵的每个格子中有两个数字,左边的表示局中人1的效用,右边的另一个数则代表局中人2的效用。(非合作)博弈理论的基本假设是,局中人都是理性的,理性的局中人所采取的行动应该使得自己的效用(或者盈利)达到最大化。根据这个假设,在囚徒困境中,由于“背叛”是每个局中人的占优策略,因此博弈的纳什均衡解为(背叛,背叛),其结局是双方各自被关8个月。这正是纳什均衡最令人吃惊的地方,因为对于每个局中人来说,(背叛,背叛)引起的结局并不是他最偏好的。从局中人的偏好顺序来看,(背叛,背叛)在四个可能的结局中只列第三位;而从双方的共同利益来看,(背叛,背叛)比起(合作,合作),其效用差得更远。(见图2.1)图2.1 囚徒困境的效用矩阵

众所周知,纳什均衡科学合理地预测了(非合作)博弈的结局,但是作为纳什均衡的(背叛,背叛),远不是双方非常满意的结果。事实上,在不少时候,纳什均衡可能使博弈的双方处于一个十分尴尬的场面。因此,尽管纳什均衡是一个比较合理的预测,但是它并非如某些人所误解地那样做到“双赢”,之所以无法保证达到“双赢”,是因为在博弈中,理性的局中人为了使自己的效用极大化而采取了“不合作”的策略和行动。他们之间玩的是一场非合作的游戏。

囚徒困境中,最接近“双赢”的无疑是(合作,合作)。在非合作博弈的理论中,只要不是无限次地重复囚徒困境,相互合作的结局几乎是不现实的,因为(背叛,背叛)是唯一的纳什均衡解。但是,(-8,-8)比起(-1,-1)来,实在使博弈的双方都觉得难以接受(-8,-8),真正理性的局中人也许会产生一种强烈的愿望,“咱们为什么要互相背叛呢?为什么两个人不走互相合作的路呢?毕竟互相合作要比互相背叛对双方都要好得多!”这样的理性既“利己”又“利人”,比起非合作博弈中纯粹只考虑自己的理性来,似乎更理性一些。然而这样的“理性”要冒被对手背叛的风险。既要达到合作的良好愿望,又想避免被背叛的风险,最好的办法是事前通过某些通信手段来引导结局,或者签订协议(简单地说,就是订立攻守同盟),双方互相承诺共同采取“抗拒”策略。当然,这些承诺和协议都带有一定的约束力。通过上述手段,原先非合作的囚徒困境很自然地转变为合作博弈。

我们称这样的通信、签订协议和互相之间的承诺,相当于对非合作的囚徒困境进行了一次“合作变换”。通过此类合作变换,可以把一个策略型(或展开型)博弈转化为策略型(或展开型)的合作博弈。在合作博弈中,局中人除了在原先博弈中的行动选择之外,还增加了如何去合作以及为实施这些合作行动进行“讨价还价”(对于承诺的约束)的各种选择。

在第1章里,我们曾经谈到过,纳什认为,合作行动实际上就是“合作的”局中人之间某种讨价还价过程的结果,并且在这个讨价还价过程中,可以预期每个局中人都应该按照某个讨价还价策略采取行动,以使个人效用达到最大化。从这个观点出发,纳什在事实上指出了,研究局中人之间的合作问题,可以利用纳什均衡这个(非合作)博弈论中最基本的概念。按照纳什提出的理论,合作变换后得到的博弈,其纳什均衡就是该合作博弈的一个合作解,也就是所谓的纳什方案(Nash's program)。

例2.1 美苏在军备竞争问题上的“囚徒困境”

一些国家之间的军备竞争问题可以建模为“囚徒困境”,尤其是前苏联与美国在20世纪50年代卷入的核军备竞争。有人说,兰德公司接受了美国政府的委托对美苏之间的核扩展竞争进行了研究,在兰德公司提出的研究报告的第一部分就构建了“囚徒困境”模型,也有人认为没有迹象表明美国政府的核策略受到了当时博弈理论研究的影响。不管怎么说,囚徒困境的确反映了当时美苏两国在核军备方面的“窘境”。这个问题的效用矩阵如图2.2所示:图2.2 美苏之间核军备竞赛的“囚徒困境”矩阵中的数字是假设的,如果双方都选择扩充核军备,那么各自为此多付出3000亿美元,倘若采取裁减核军备的策略,则可省下这笔钱。但是如果有一方裁减核军备而另一方扩充核军备,很可能的结果是,扩充一方轻而易举地打败对方,从而有可观的收益(假定为10000亿美元),而失败的一方承受无限的损失。博弈的纳什均衡是双方都扩充核军备。这反映了20世纪50年代之后的一段时期内军备竞赛越演越烈的场面。

双方裁军对大家都有好处,这表示“合作”使双方有着更大的期待利益,两国政府肯定能意识到这一点,只是单方面裁军可能会招致严重的后果,要说服对手一起裁军(即双方合作)就需要进行谈判。合作的利益和愿望促使了谈判的展开,然而为了达成一个双方都能接受的方案,必然在两国之间进行着长时期的讨价还价,这是在20世纪60年代以后发生的众所周知的事实,也是合作博弈的一个经典案例。双方达成的协议主要规定了什么时候各自裁减多少军备,同时制定了互相监督的机制等条例,因此这是一个具有约束力的合作协议。

例2.2 分蛋糕

两人分享一块蛋糕,每个人提出自己希望得到的份额,譬如,甲提出要求p,乙提出要求q,其中p和q均为[0,1]上的任意一个数。如果p+q=1,说明双方默契地达成合作,那么就按照他们各自的意愿分割蛋糕,否则大家一无所有。人人都希望合作成功,所以需要通过谈判来解决分配问题,但是人人又都是理性人,希望自己的份额越多越好,从而在讨价还价过程中出现非合作的现象。讨价还价的谈判是为了“合作”这个目的,达成的协议就必须有所约束,否则会“鸡飞蛋打”。

例2.3 两家保险公司之间的风险互换

保险公司1拥有一笔均值为5(单位从略)和方差为4的保险金业务,保险公司2的保险业务量其均值为10,方差为8。两家公司决定一起探索并缔结一项风险互换协议的可能性。这里,仅考虑线性风险互换,即公司1从自己接受的保险业务中拿出一部分给公司2经营,同样,公司2也从自己接受的保险业务中拿出一部分给公司1。记x与1x分别为公司1和公司2在互换之前的业务量,y和y是互换之后的保212险业务量。所谓线性风险互换是指实施如下交换公式:

y=(1-α)x+βx+K112

y=αx+(1-β)x-K212其中0≤α,β≤1,K是一个固定的(可能为正也可能为负)货币量。对于给定的α和β,只要适当地选择K,就可以保证两家公司互换前后的期望收益不变,在本例中,取K=5α-10β,容易计算得到E(y)=1E(x)=5和E(y)=E(x)=10。业务的交换必须满足这一点,122因为在正常的情况下,它不应该影响每家公司原来的期望收益。而在“不正常”的情况,也就是说很有可能发生风险的情况,互换带来了降低风险的好处。这是因为两笔保险同时失败的可能性小于单笔保险失败的可能性。所以,这样的业务交换是在保证期望收益不变的前提下有效地降低了保险本身存在的风险。在本例中,我们用方差来评估公司的风险与状况(其实,在许多情况中,也常常用方差来评估风险)。假如我们取α=0.2,β=0.3,那么就有Var(y)=3.28<4和1Var(y)=4.08<8。即如果取这样的α和β,两家保险公司的风险与2状况都会得到明显的改善。随着α,β发生变化,它们状况的改善会随之发生变化。显然,每家公司都有合作的愿望,既保证期望收益又降低风险,何乐而不为?但是,在合作的过程中,各个公司又都希望能选择对自己最有利的α和β,于是就要探索α与β的“最优解”——使得双方都能接受或者觉得满意的(α,β)配置,并就这个问题进行讨价还价。2.2 聚焦理论

为合作而进行的讨价还价可以有不同的结果,譬如分蛋糕,双方愿意合作,那么蛋糕的分配方案一定呈现(x,1-x)的形式,其中0<x<1。只要x≠0,x≠1,合作的成果总有蛋糕“进账”,优于不合作时“只能得到0”的尴尬场面。在讨价还价的博弈中,形如(x,1-x)(0<x<1)的方案都是纳什均衡,因为任何人不会偏离这个策略剖面,否则将发生大家都是“两手空空”的局面。现在,我们需要在那么多的纳什均衡中选择一个最为“合理”的解,使合作的两方都比较满意,从而加深“合作的意愿”。这个过程就是所谓的求合作博弈的纳什均衡——纳什讨价还价方案,问题在于,纳什均衡集合太大了,在那么大的集合中去找一个“合理”的解,具有相当的难度。在非合作博弈的理论中,这被称为多重均衡问题,是一个令人头疼的问题。

解决多重均衡的办法有许许多多,重要的方法之一是谢林提出的聚焦理论。该理论认为,在存在多重纳什均衡的情况下,局中人有可能将注意力聚焦于某个特定的均衡,于是,这个均衡常常成为众望所归,从而大家实施这个均衡。

什么样的均衡有可能成为焦点呢?这涉及各种各样的因素,比如局中人的文化背景、生活或他在决策中的习惯、历史的积累经验等等,都可以引导局中人的注意力趋向某个特定的结局。

有些焦点依靠局中人的理性推断就可以明确得到的,譬如,两人分享蛋糕,使p+q=1的“正数对”(p,q)可以有无穷多个,如果两个人的各方面条件几乎雷同,局中人的理性促使他们都是既想得到蛋糕又希望自己得到的那份不比对手少,同时他们也都会想到对手拥有与自己相同的观点,于是,(p,q)必定满足:p≤q,p≥q,p+q=1。同时满足这三个条件的(p,q)只有,因此构成了博弈的焦点,两人很快在谈判中达成共识,以平分蛋糕结束博弈。

但是,有相当多的焦点并不是博弈中的局中人能够自行明白并得到执行的,或者是某个局中人虽然知道但不便说出的(否则可能对他不利)。比如夫妻争吵并导致打架,这是一场利益冲突的游戏或博弈。吵架对双方不利,甚至可能导致家庭分裂,大多数家庭成员都不愿意看到这样的结局,他们有停止争吵以及和好的愿望,于是博弈就有可能向合作博弈转化。常说的好办法是“各退半步”,可是所谓的各退半步很难用“量”测定,它可以有各种各样的解决方案。哪个方案算是焦点?行事一向公正的老丈人或许是解决这个难题的关键,出于对他的尊重,基于对他以往处事比较公正的认识,争吵的夫妻两人将愿意倾听他的意见并按照他所提出的某个“均衡状态”办事,这样的人在合作博弈中被称为“焦点仲裁人”。上海、江浙一带在社区矛盾冲突中常常请出的“老娘舅”,社区街道里的治保主任等常常扮演焦点仲裁人的角色。焦点仲裁人的建议未必具有绝对的约束力,但是如果他有一定的地位与身份,或者在处理矛盾冲突方面有着良好的记录,那么每个局中人都会相信:其他局中人会像自己那样去接受仲裁人的建议。此时只要仲裁人提出的建议是一个均衡,所有局中人将会发现按照这个建议是解决矛盾的最好方式。

我们在第1章中提到的北约轰炸南斯拉夫,其中俄罗斯就担当了焦点仲裁人的角色。一场严酷的战争,如果双方谁也无法征服对手,那么停止这场无休止的战争对双方都有好处,于是非合作博弈的战争转换为合作博弈式的讨价还价谈判。北约希望有一个体面的方法使得自己可以停止轰炸,南斯拉夫也需要停止战争但是绝不是投降。俄罗斯的斡旋引导双方达成了体面的停战协定。

特殊的一类焦点仲裁人,其本身就是博弈中的局中人,那就是在博弈中被称为委托人的局中人。在委托—代理模型中,如果信息是完全的,那么焦点均衡必定是委托人挑选一个能使自己得到最大期望盈利的均衡,讲得直白一些,就是委托人说了算,当然他所说的一定应该是均衡。

倘若没有焦点仲裁人,而且焦点并不是“不言而喻”的,此时可以通过博弈前的通信过程,使得某些局中人能有机会声明自己到底喜欢哪种均衡,倘若能做到“不谋而合”,焦点自然浮现。大多数情况,各个局中人喜欢的均衡不一样,于是就在这些均衡之间进行谈判,称为“焦点谈判”,其实这是一个讨价还价形式的展开型博弈。2.3 两人讨价还价问题

我们不妨把目光先局限于两人之间的讨价还价。两个局中人,如果合作,给他们双方各自带来的好处远远超过他们分别单干时的效用,这样大家都有与对手合作的激励,同时由于局中人的个人理性,他们又都希望从合作所产生的好处中,自己能多分一杯羹,因而产生了谈判和讨价还价,形成了两人讨价还价博弈的基本点。通俗地说,合作就是做大蛋糕;如何分配做大了的蛋糕,则要谈判。讨价还价问题就是需要给出一个分蛋糕的合理方案,正是这个方案,保证了两人愿意合作,确保共同得到大蛋糕。

现在,我们试图对两人讨价还价问题建立模型。

首先,应该认识到,讨价还价是对已有的(或者合作之后能得到的)利益或盈利的分配(或者是对共建成本的分摊)。如果两个局中人谈判导致合作,那么局中人1与局中人2一起共同产生的效用记为v({1,2}),假设谈判的结果是局中人1获得x(当然这个量应该不1比局中人1单独一个人创造的财富v({1})小),局中人2获得x(同2样,这个量应该不比局中人2单独一个人创造的财富v({2})小),必定应该有x+x=v({1,2})。这样的(x,x)构成了一个分配1212(或配置),所有可能的(x,x)形成了博弈的“可行配置集”,记122为F。显然,F是二维空间的一个子集。而且它应当包含两个极端点:(v({1,2}),0)和(0,v({1,2}))。之所以说这两个点“极端”,是因为按照这样的配置,“大蛋糕”将被其中一个人独吞,另外一个人一无所有(一般地,总不能让人家倒欠蛋糕)。

假定(x,x)和(y,y)是F中的两个可行配置,两个局中人1212在这两个配置之间可以随机地进行选择,倘若他们乐意以概率θ(0≤θ≤1)接受x=(x,x),那么他们接受y=(y,y)的概率应该等1212于1-θ。这样进行了随机选择之后所得到的期望配置可以表示为θ(x,x)+(1-θ)(y,y),我们很合理地要求这个期望配置

1212也是F中的一个可行配置,当θ从0向1连续变化时,期望配置θ(x,1x)+(1-θ)(y,y)从y=(y,y)走向x=(x,x),且走2121212遍这两点之间的连线,也就是说,我们要求连接x和y的线段上的每个点都是可行配置。这在数学上相当于要求可行配置集F是个凸集。它在应用中有着实际的含义。譬如,令x和y是两个局中人同等认可的两个可行配置,他们无法确定到底采用哪一个比较好,抛均匀钱币的随机装置可以把他们引向一个共同的分配方案,在抛钱币前预测他们的期望效用的配置为x+y,这显然是一个可行配置。如果这个随机装置中的钱币不是均匀的,那么期望效用的配置为θ·x+(1-θ)y,它自然也应该是可行配置。

除了要求F是凸集之外,我们还将要求F是闭集,就是说,要求F的边界一定属于F。这个要求并不苛刻,即使对数学不太熟悉的读者也容易理解这一点:设想有一个可行配置的系列(x(k),x(k))12∈F,(k=1,2,…),如果当k→∞时,系列趋向一个极限点(),把这个极限点()认为也是一个可行配置应当是件很自然的事情。

考虑两人之间的讨价还价,这两个人肯定是博弈中的理性人,为了瓜分共同创造的财富而进行的讨价还价,最终每个局中人得到的份额一定不应该少于该局中人单干时所创造的财富,否则他又何必与对方合作呢?我们把这个基本要求称为“个人理性”。两人谈判成功,瓜分v({1,2}),其配置是x=(x,x),如果无法使意见达成一致12从而谈判失败,大家回到原来的不合作状态各干各的,得到的盈利向量记为(v,v),所以干脆称(v,v)为“意见不一致时的盈利配1212置”,或者称为“无法达成协议的配置”(disagreement payoff allocation)。v和v相当于这两个局中人在讨价还价过程中各自坚持12的“底线”或者谈判的“筹码”,少于这个“底线”会导致局中人不愿意合作而使谈判失败。因此,对任意的可行配置x=(x,x),12“个人理性”要求总是成立:x≥v和x≥v。1122

现在,我们可以对两人讨价还价问题进行数学上的严格定义了。2两人讨价还价问题由“对偶”(F,v)组成,其中F是中的一个闭2凸子集,v=(v,v)是中的一个点,并且12

F∩{(x,x)|x≥v和x≥v}121122是非空有界集合。

这里,非空有界的要求是必需的。如果F∩{(x,x)|x≥v和x12112≥v}非空,说明在F中至少存在一个配置使得每个局中人合作之后得2到的盈利不会比他们的“底线”差,已经讲过,这是讨价还价的基础,否则双方就没有任何必要进行谈判。此外,“有界”的假定也是必不可少的,否则将会出现超出“底线”并趋于无限的配置,无限的配置使得局中人陶醉,有这么好的前景放着,再去讨价还价就失去现实意义。

要有现实意义的当数“实质性的”(essential)(或称为“本质的”、“基本的”)两人讨价还价问题,它是指这样的(F,v):F中至少存在一个y=(y,y),对于两个局中人来说,y严格地好于v:y121>v,y>v。只有实质性的(F,v),才能激励局中人去讨价还122价。

在两人讨价还价问题中,无法达成协议的配置v对于求合作博弈的解,有着至关重要的作用,因此,如何确定v在求讨价还价问题的解时显得十分重要。在稍后的讨论中就可以看到这一点,然而我们再去讨论如何确定它。目前,总是暂时认定v=(v,v)是客观存在12的事实。2.4 纳什讨价还价解

对于讨价还价问题(F,v),无论是通过双方的谈判,或者是通过焦点仲裁人所提出的建议,其目的无非是从F∩{(x,x)|x≥v和12112x≥v}中找出一个合理的配置,或者说,是从中识别出一个或若干22个配置,作为在(F,v)下谈判或者仲裁的结果。不妨把这样得到的配置记为(F,v),也就是两人讨价还价问题的解函数。

什么样的解函数是合理的呢?“合理”两字本身是值得讨论的问题。从不同的角度会有不同的“合理”理由,从而出现不同的解概念。俗话说,“公说公有理,婆说婆有理”,从“公”或“婆”各自的立场出发常常可以得到不同的解决方案。采用一方认为合理的观点去解决问题很有可能造成“片面”,最后或许无济于事。一般地,从人们共同认可的准则出发得到的解,也许最容易被人们接受。出于这样的基本考虑,纳什从公理的角度提出讨价还价解的概念。我们把产生纳什讨价还价解的公理称为“纳什公理”,以区别于其他讨价还价解所出自的公理系统。由于公理系统的不同,合作博弈可以有不同的解概念,这正是它与非合作博弈的研究之间明显的差异之一。

由于纳什公理涉及向量之间的比较“大小”,因此在介绍公理之前,我们先交代如何比较二元向量的大小。

记x=(x,x),y=(y,y):1212

x≥y当且仅当x≥y和x≥y1122

x>y当且仅当x>y和x>y1122

在两人讨价还价问题中,解(F,v)必定包含两个局中人各自的盈利(或成本分摊),局中人1与2的盈利分别记为(F,v)和1(F,v),即(F,v)=((F,v),(F,v))。212

有了这些基本准备之后,对于一个两人讨价还价问题(F,v),纳什讨价还价解的公理叙述如下:

公理1 个体理性(individual rationality)

正如我们在前面已经指出的,这是一个最起码的准则,讨价还价中的每个人指望从合作中得到的盈利,至少不应该比自己没有参与合作时的收益差,否则就会散伙,因此,个体理性是合作的必需条件。

公理2 Pareto强有效性

如果(F,v)是两人讨价还价问题的解,那么(F,v)∈F。并且对于F中的任何一个配置x=(x,x),假如x≥(F,v),12

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载