45度向上傾斜
纳什与博弈论的发展
2015年5月23日,美国数学家、经济学家约翰·纳什因遭遇车祸而身亡,终年86岁。
约翰·纳什的一生是跌宕起伏的一生:21岁时,一份只有27页的博士论文令他名声大噪;23岁时,担任麻省理工学院的讲师;30岁时,精神失常;66岁时,获得诺贝尔经济学奖。
??
“这人是个数学天才。”纳什的硕士导师为他读博士写的推荐信,只有一句话。尽管纳什在数理科学等各领域都取得了巨大成就,但他最为人熟知的还是他对博弈论发展做出的贡献。2007年诺贝尔经济学奖得主罗杰·迈尔森是这样评价约翰·纳什对经济学领域所做出的杰出贡献的:“他的理论对经济学和社会科学产生了根本的普遍性影响,堪比DNA双螺旋结构的发现对生物科学领域产生的影响。”
确实,博弈论对经济学的影响力不言而喻,最近的10个诺贝尔经济学奖得主中有5个就是博弈论理论学家。但博弈论的价值远不止于此,如今,随着科学家们利用博弈论思想在进化生物学和动物社会行为领域取得了重大突破,博弈论已然成为了生命科学的基本原理。
所谓博弈论,一言以蔽之,就是研究理性决策者之间冲突或合作模式的相关问题。博弈论可以用来解释世间万事,从蚁群的功能机制到人类的爱情选择、消费选择,乃至国家关系的变化等等。
博弈论的研究在纳什取得重大突破之前就已经存在,20世纪20年代到40年代之间,美国著名数学家冯·诺依曼就做过博弈论方面的研究。不过,直到纳什对博弈论的研究取得重大突破,博弈论这个名称才开始为大家所熟知。
1950年,纳什在读博士期间开始研究博弈论。当时博弈论仍然处于起步阶段,在普林斯顿高等研究所的美国著名数学家冯·诺依曼是当时该领域的带头人,他对零和博弈作出了非常深入的研究。所谓零和博弈,即是所有对局者的收益综合为零,一方获益必然意味着一方损失。
然而,现实生活中的博弈没有这么简单,双赢和两败俱伤的情况常有发生。就以当时美苏冷战为例,如果把对方的损失看作自己的收益的话,那么双方的最优策略就是,先发制人给予对方最大的打击。但是对于美苏这两个旗鼓相当的对手来说,对方也会激烈反击,这样做的最大可能却是两败俱伤。由于有这种局限性,尽管对零和博弈的研究非常深入,但在应用上价值不算太大,因为谁都不想费了牛大的力气却毫无收获。
因此,当纳什在1950年发表对非合作博弈的研究时,博弈学界眼前为之一亮。他换了一个角度来思考问题:不是考虑自己的最佳收益,而是考虑双方在什么情况下达到均衡。他认为,对于任何一个博弈来说,总是存在一个“均衡点”,在均衡点处,当对方不改变策略时,他此时的策略是最好的。如果更改自己的策略,反而不会带来任何好处。这样的均衡点后来被称为“纳什均衡”,在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。比如对美苏博弈来说,冷战、保持强大的威慑力、但谁也不先动手,就是一个双方都不愿意改变的“均衡点”。
我们可以用个常见的现象来解释下,例如价格战。生产同一样产品的若干厂家会形成一个相对稳定的价格,这就是“均衡点”。在这个“均衡点”,各家所卖的产品价格保持基本一致。若其中一方打破默契,开始大幅降价,以求薄利多销,获取更大利润,那么其他家便会很快跟进,互相压价。刚开始降价的一方短期内可能会增加销量和利润,但最终的结果是大家的利润都降低了。
由于纳什均衡的应用范围远比零和博弈广泛,所以纳什对博弈论的发展具有更重要的意义。
纳什均衡:
背叛为何优于合作?
我们生活在一个博弈的世界,“纳什均衡”在这个世界中应用极为广泛,它已经深刻地影响了一般人的生活,绝不仅限于数学的范畴。下面将给大家举几个经典的例子,以便大家更深刻地理解约翰·纳什这位奇才留给我们的精神遗产。
一说到博弈论,几乎每个人都会想到“囚徒困境”。这是最简单的一个博弈模型,说的是警方逮捕了两名嫌疑犯,但没有足够证据指控二人有罪。于是警方分开嫌疑犯,让他们相互不能沟通,并分别向两个人提供以下相同的选择:若一人认罪并检举对方(“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将坐牢3年;若二人都保持沉默(互相“合作”),则因证据不足,二人都坐牢1年;若二人都互相检举(互相“背叛”),则二人都坐牢2年。
在这个模型里,对两个人来说,合作收益最大;彼此背叛收益最小。但对一个人来说,他有两种选择、四种结果:选择沉默,结果是1年(对方也沉默)或3年(对方检举),如果选择检举,则结果是获释(对方沉默)或2年(对方也检举)。这样平衡下来,检举是最好的选择。并且一方检举,一方沉默,检举一方收益更大。
由此看来,在“囚徒困境”中,双方合作收益最大(二人都坐牢1年),但在实际情况中,每个人都首先考虑自己的收益,所以双方都采取了彼此背叛的策略,结果却导致两人都坐牢2年。
囚徒困境被视为人类合作失败的一种体现,它深刻揭示了个体理性与集体理性之间的矛盾和冲突:个体按照自身利益最大化的原则采取对自己最有利的占优战略,得到的却不一定是最优的结果,相反可能导致集体的非理性。
近年来在高考招生中,北大、清华为了在各省争抢状元,采取各种手段明争暗斗,甚至不惜撕破脸皮在微博上吵架,可谓斯文扫地。作为中国最顶尖的两所大学,难道就不知道这样抢状元吃相太难看吗?非不为也,实不能也。
北大清华的状元之争是一个典型的囚徒困境。对于北大来说,无论清华抢不抢状元,抢状元都是北大的最好选择;对于清华来说也是一样。两所大学都抢状元就构成了北大清华招生博弈的纳什均衡。纳什均衡最深刻的悲剧性在于,北大和清华都意识到抢状元是毫无意义的,但抢状元却是他们必然的选择。除非引入第三方力量改变博弈结构,否则囚徒困境就不可能被打破。
破解之道就是改变高考招生的制度设计,改变以高考分数为唯一依据的招生设计。美国也有高考(SAT和ACT),但从来没听说美国有什么高考状元,也没听说美国有什么大学为争抢尖子生而闹得不可开交。原因就在于,美国大学申请不仅要看高考成绩,还要看平时成绩和社会活动,每个学校还会有不同的录取标准。在这样的招录制度下,没有哪个高校有兴趣抢什么状元。
用制度引导均衡
制度如何能够改变博弈中的纳什均衡?我们来看看另一个比较著名的博弈案例:智猪博弈。
猪圈里有两头猪,一头大猪,一头小猪。猪圈的一边有个踏板,每踩一下踏板,在远离踏板的另一边食槽就会落下少量的食物。由于踏板离食槽比较远,当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。
那么,两只猪各会采取什么策略?答案是:小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。因为小猪踩踏板将一无所获,不踩踏板反而能吃上食物,对小猪而言,无论大猪是否踩踏板,不踩踏板总是好的选择。反观大猪,明知小猪是不会去踩动踏板的,但如果自己也不去踩踏板的话,就会饿死,所以只好亲力亲为了。小猪“搭便车”成了这个游戏的纳什均衡点。
“搭便车”现象在人类社会中屡见不鲜。小的方面,在集体野炊时,有人不动手积极劳动,等着别人做好饭就来吃;在公司里,有些人不创造效益但却分享成果。大的方面,现代社会的高福利政策也是一种民众的搭便车行为,高收入者支付的高额税收,对同样享用高福利(医疗、教育)的低税收贡献者来说,是被后者“搭了顺风车”;在商品市场中,很多商人等着成功的创新商品出现,然后大举模仿,乃至抄袭,就是“搭便车”行为。
“搭便车”自然是个很坏的纳什均衡点,那么怎样才能改变“搭便车”现象呢?在“智猪博弈”中,要想改变“小猪躺着大猪跑”的现象,就必须改变给猪喂食的方案。最好的方案是将食槽移到踏板附近,谁踩踏板谁就优先得到食物。结果呢,小猪和大猪都在拼命地抢着踩踏板。等待者不得食,而多劳者多得。政策一变,“搭便车”现象就自然消失了。也就是说,改变条件,就会形成新的纳什均衡点。
同样,在人类社会中,要想杜绝“搭便车”现象,也需要进行制度设计。比如,在国有企业的收入分配比较平均,一些奖励也是人人有份,这就使人容易产生“搭便车”心理,干活的人少,混日子的人多。最好的激励机制就是,奖励并非人人有份,而是直接针对个人(如业务按比例提成),既节约了成本(对公司而言),又消除了“搭便车”现象,能实现有效的激励。
纳什均衡还能够用于解释很多经济现象,比如“公地悲剧”。1968年,美国学者哈定在《科学》杂志上发表了一篇题为《公地的悲剧》的文章。英国曾经有这样一种土地制度——封建主在自己的领地中划出一片尚未耕种的土地作为牧场,无偿向牧民开放(称为“公地”)。这本来是一件造福于民的事,但由于是无偿放牧,每个牧民都养尽可能多的牛羊。随着牛羊数量无节制地增加,公地牧场最终因“超负荷”而成为不毛之地,牧民的牛羊最终全部饿死。
这样的“公地悲剧”在现实社会中很常见,环境污染、全球暖化都是公地悲剧的体现。假如市场经济中存在着污染,政府又没有管制,企业为了追求利润的最大化,宁愿以牺牲环境为代价也绝不会主动增加环保设备投资,所有企业都会从利己的目的出发,采取不顾环境的策略 ,从而进入“纳什均衡”状态。如果一个企业从利他的目的出发,投资治理污染 ,而其他企业仍然不顾环境污染,那么这个企业的生产成本就会增加 ,价格就要提高,它的产品就没有竞争力 ,甚至企业还要破产。
因此,在公共领域,如果人人都可以无偿使用公共资源,那么在这个博弈中,无论在哪一个纳什均衡点上,公共资源都会被过度消耗,每个人的收益最终会抵不过所付出的代价。解决这个悲剧的出路也许就是公共资源的产权化,将公共资源出售或承包给私人管理。
枪手博弈与三国演义
当博弈者只有双方时,其均衡点很容易寻找。但是生活中常见的博弈是三方还有更多方来参与,在这种情况下,我们又怎样寻找均衡点?我们来看一个枪手博弈的故事:
甲、乙、丙三个枪手准备决斗。甲枪法最好,十发八中;乙枪法次之,十发六中;丙枪法最差,十发四中。
先提第一个问题:如果三人同时开枪,并且每人只发一枪;第一轮枪战后,谁活下来的机会大一些?一般人认为甲的枪法好,活下来的可能性大一些。但合乎逻辑的结论是,枪法最糟糕的丙活下来的几率最大。
我们来分析一下各个枪手的策略。枪手甲一定要对枪手乙先开枪,因为乙对甲的威胁要比丙对甲的威胁更大,甲应该首先干掉乙,这是甲的最佳策略;同样的道理,枪手乙的最佳策略是第一枪瞄准甲;枪手丙的最佳策略也是先对甲开枪。
尽管第一轮结束后,丙活下来的可能性最大,但是第二轮开始,丙的存活的几率却会比甲或乙为低。因为在第一轮枪战后,不论甲或乙,他们的命中率都比丙的命中率为高。除非第一轮中甲乙皆死。
我们现在改变游戏规则,假定甲、乙、丙不是同时开枪,而是他们轮流开一枪。在这个例子中,我们发现丙的机会好于他的实力。
先假定开枪的顺序是甲、乙、丙,甲一枪将乙干掉后(80%的几率),就轮到丙开枪,丙有40%的几率一枪将甲干掉。
假设开枪的顺序是乙、丙、甲,乙先开枪,乙还是会瞄准枪法最好的甲开枪;不管乙是否一枪干掉了甲,下一轮仍然是轮到丙开枪。
如果开枪的顺序是丙、甲、乙,是丙先开枪,情况又如何呢? 丙可以向甲先开枪,即使丙打不中甲,甲的最佳策略仍然是向乙开枪。但是,如果丙打中了甲,下一轮可就是乙开枪打丙了。因此,丙的最佳策略是胡乱开一枪,只要丙不打中甲或者乙,在下一轮射击中,甲和乙仍然会互相火拼,他就处于有利的形势。
我们通过这个例子,可以理解人们在博弈中能否获胜,不单纯取决于他们的实力,更重要的是取决于博弈方实力对比所形成的关系。在上面的例子中,乙和丙实际上是一种联盟关系,先把甲干掉,他们的生存几率都上升了。我们现在来判断一下,乙和丙之中,谁更有可能背叛,谁更可能忠诚?任何一个联盟的成员都会时刻权衡利弊,一旦背叛的好处大于忠诚的好处,联盟就会破裂。在乙和丙的联盟中,乙是最忠诚的。这不是因为乙本身具有更加忠诚的品质,而是利益关系使然。只要甲不死,乙的枪口就一定会瞄准甲。但丙就不是这样了,丙不瞄准甲而胡乱开一枪显然违背了联盟关系,丙这样做的结果,将使乙处于更危险的境地。
这个枪手博弈的模型显示了多方参与下,纳什均衡的不断变化。而且这个模型正好与我们历史上的三国演义有一定相似之处。公元208年,赤壁之战前,曹操大军首先横扫弱小的刘备,刘备那时对曹操根本没有还手之力,但曹操也根本没有把刘备放在眼里,而是把目光投向了在江东颇具实力的孙权政权。孙权为了自保,联络了毫无实力但在荆州一带很有人望的刘备,与刘备结成联盟,共同抗曹。结果,借着赤壁之战的胜利,原本等着灭亡的刘备,一跃而成为三足之一,这就是最差的反而活得更好的典型例证。
赤壁之战后,北方的曹操与南方的孙权、刘备达成了短暂的平衡,谁也没有能力吃掉谁。但孙权和刘备因利益冲突却开战起来,夷陵一战后,刘备元气大伤,蜀汉实力从此一蹶不振。刘备与孙权开战,完全打破了纳什均衡,消弱了自己的实力,这也是刘备不懂博弈论、意气用事的结果。在这场战争中,作为实力第二的孙权,原本应该对孙刘联盟最忠心,但为了与刘备打仗,却去投靠了曹操。不过,他很快醒悟过来,夷陵之战后,立刻着手修复与刘备的关系。
接下来,轮到诸葛亮不懂博弈论了。作为三国中最弱的一方,身处具有大山屏障的四川腹地,蜀国原本应该与“枪手博弈”中的丙一样,轮到他开枪时,朝天开个空枪,坐看老大老二相斗,自己韬光养晦、苦练内功,强国强民,方为上策。可是诸葛亮在蜀国国力贫弱的情况下,竟然七伐中原,消耗了大量国力,并使强大的曹魏始终把矛头对准自己。因此,蜀国在三国中第一个灭国就毫不为奇了。
抗日战争时期,中国大地上可谓也是一种三国格局。日本鬼子最为猖狂,占据了中国最肥沃的半壁河山;国民党政府占据着西南地区,正统上仍是中国政府;实力最弱的共产党,统治地域主要集中于贫瘠的西北一隅。为了联合对付日本鬼子,国民党和共产党这两个杀红了眼的冤家对头结成联盟,相当于枪手乙和枪手丙结盟对付甲。不过,共产党人比诸葛亮更懂博弈论,他们对付日本人主要采取游击战,而不是与日本鬼子正面硬碰硬。因此,抗战胜利后,八路军的实力大大增强,与国民党实力的差距大大缩小,在随后的国共对决中,共产党很快占了上风。
处处可见的纳什均衡
纳什均衡这么理论化的数学问题,却也能应用到恋爱中。在约翰·纳什的传记电影《美丽心灵》中就有很好的例子,纳什和他的四个男伙伴在酒吧,而对面正好有五个单身女生,其中一个最为漂亮。如果纳什和他的四个男伙伴都去追求最为漂亮的女神,那么女神就会不知道同意谁而全部拒绝。追求女神不行,接下来追求剩下的四位女生,这四个女生当然也不会同意,因为没人愿意屈居第二,当“备胎”。这样就会造成谁也没有搭讪成功。如果纳什他们改变策略,一开始谁都不去追求女神,四位男生分别去追求其她四位女生,当女神看到其她女生都有人追求,而自己却没有,这时如果纳什去追求女神,到手的几率就会大大增大。在这个策略下,每个人都有可能搭讪成功。
搭讪成功后,假设纳什真的开始了对女神的追求,那么,其实女神也还有其他不止一个追求者,对于女神来说,如何确定谁是真正的追求者是个难题,因为她没办法完全掌握每个追求者的内心世界,这是一种“非完全信息博弈”。这时她就需要某种信号来筛选了。在证明真爱方面,一句“我爱你”是没有作用的,还需要其他行动。这些行动是要付出成本的,不管是为了努力接近女孩所需要的时间成本,还是为了讨好女孩的物质成本,证明真爱,就要发出对你有成本的信号,以凸显出你值得她选择。
这样的博弈最终会导致两种均衡。一种是,追求者相继退出竞争,不再投入成本,而坚持得最久、投入成本最多的那个人最终胜出,从众多的追求者中分离开来,这叫做“分离均衡”。“分离均衡”在生活中很常见,比如,公司招聘时无法断定一个人的能力,就以学历来区分人才;而应聘者也以工资高低来衡量公司好坏,双方互相衡量,最后达至“分离均衡”。
另一种是,到最后,两种人也没完全区分出来,一些爱得不那么深的人也混在真爱中,继续花费成本发送信号对谁都不再值得,姑娘索性选一个人嫁了得了,这叫做“混同均衡”。“混同均衡”在现实生活中也很常见,比如小孩子上学,如果不是特别要去择校的话,他就是随便选一个学校就上学了,因为义务教育阶段的学校没什么好区分的,这就是“混同均衡”。
非完全信息的博弈在生活中处处可见。比如在足球比赛射点球时,射门的运动员是射左边还是射右边呢?没有哪个更好,踢球者只希望射门方向与门将扑球的方向相反;而门将所追求的,则是相同。这里没有纯策略均衡,只有混合策略均衡。也就是说,射门者最终只会以一定的概率去踢左边,一定的概率踢中间,一定的概率踢右边;而门将也会有一定的概率扑左边,一定概率不动,一定的概率扑右边。按照这种概率分布,存在均衡。
证明博弈中存在这样一个混合策略均衡,就是纳什的贡献。还拿射点球为例子,对于门将而言,他不知道射门者的偏好,只能是对这个偏好进行一个估计,如果是右撇子,他会估计说这个球员踢向门左侧的策略会大一些。那么,根据这一估计,他会以更大的概率按照这个方向去扑球。但是,射门的人完全有可能踢向另一个方向。
另外一个例子,就是出价买东西。买方喊出一个买价的时候,是不知道卖家心目中的合适价格的,怕喊高了;同样的道理,要是卖家喊价,也有可能喊低了。但是这个喊价无论出自卖方还是买方,都存在一个概率分布,这里有一个混合策略均衡。
这样的混合策略均衡甚至在宏大的政治经济层面也不鲜见。在政治上,比如革命的群体协作,你是否揭竿而起不仅取决于你相信政权有多么脆弱,还同时取决于你相信别人是否参与。在经济学上,一个很好的例子是银行挤兑,你是否挤兑不仅取决于你对银行有多信赖,也取决于你相信别人是否会挤兑。在这样的博弈中,其均衡点是动态的。
由于纳什均衡的提出和不断完善,博弈论开始广泛应用于经济学、管理学、社会学等学科中。不光是这些专业领域,我们在生活中打扑克、买东西、下围棋时,都有可能在不经意间运用了博弈论和纳什均衡。我们都不是科学家,但可以站在科学家的肩膀上,利用他们的研究成果帮助我们思考,帮助我们更好地生活。
小葛装饰
姓名:约翰·纳什 性别:男 出生年月:1928年生 籍贯:美国 他在普林斯顿读博士时刚刚20岁出头,他的一篇关于非合作博弈的博士论文和其他两篇相关文章确立了他博弈论大师的地位。到上世纪50年代末,他已是闻名世界的大牌科学家 然而,正当他的事业如日中天的时候,天妒英才,他得了严重的精神分裂症。多亏前妻艾莉西亚的爱心呵护和普林斯顿大学诸多朋友和同事无私的帮助才没有使他流落街头,并最终把他推上诺贝尔经济学奖宝座。纳什不是一个完人,他举止古怪,离经叛道。曾经想放弃美国国籍,几乎遗弃了同居女友和亲生儿子,与深爱他的贤妻艾莉西亚离婚…… 1950年和1951年纳什的两篇关于非合作博弈论的重要论文,彻底改变了人们对竞争和市场的看法。他证明了非合作博弈及其均衡解,并证明了均衡解的存在性,即著名的纳什均衡。从而揭示了博弈均衡与经济均衡的内在联系。纳什的研究奠定了现代非合作博弈论的基石,后来的博弈论研究基本上都沿着这条主线展开的。然而,纳什天才的发现却遭到冯·诺依曼的断然否定,在此之前他还受到爱因斯坦的冷遇。但是骨子里挑战权威、藐视权威的本性,使纳什坚持了自己的观点,终成一代大师。要不是30多年的严重精神病折磨,恐怕他早已站在诺贝尔奖的领奖台上了,而且也绝不会与其他人分享这一殊荣。 纳什是一个非常天才的数学家,他的主要贡献是1950至1951年在普林斯顿读博士学位时做出的。然而,他的天才发现———非合作博弈的均衡,即“纳什均衡”并不是一帆风顺的。 1948年纳什到普林斯顿大学读数学系的博士。那一年他还不到20岁。当时普林斯顿可谓人杰地灵,大师如云。爱因斯坦、冯·诺依曼、列夫谢茨(数学系主任)、阿尔伯特·塔克、阿伦佐·切奇、哈罗德·库恩、诺尔曼·斯蒂恩罗德、埃尔夫·福克斯……等全都在这里。博弈论主要是由冯·诺依曼(1903—1957)创所立的。他是一位出生于匈牙利的天才的数学家。他不仅创立了经济博弈论,而且发明了计算机。早在20世纪初,塞梅鲁(Zermelo)、鲍罗(Borel)和冯·诺伊曼已经开始研究博弈的准确的数学表达,直到1939年,冯·诺依曼遇到经济学家奥斯卡·摩根斯特恩(Oskar Morgenstern),并与其合作才使博弈论进入经济学的广阔领域。 1944年他与奥斯卡·摩根斯特恩合著的巨作《博弈论与经济行为》出版,标志着现代系统博弈理论的的初步形成。尽管对具有博弈性质的问题的研究可以追溯到19世纪甚至更早。例如,1838年古诺(Cournot)简单双寡头垄断博弈;1883年伯特兰和1925年艾奇沃奇思研究了两个寡头的产量与价格垄断;2000多年前中国著名军事家孙武的后代孙膑利用博弈论方法帮助田忌赛马取胜等等都属于早期博弈论的萌芽,其特点是零星的,片断的研究,带有很大的偶然性,很不系统。冯·诺依曼和摩根斯特恩的《博弈论与经济行为》一书中提出的标准型、扩展型和合作型博弈模型解的概念和分析方法,奠定了这门学科的理论基础。合作型博弈在20世纪50年代达到了巅峰期。然而,诺依曼的博弈论的局限性也日益暴露出来,由于它过于抽象,使应用范围受到很大限制,在很长时间里,人们对博弈论的研究知之甚少,只是少数数学家的专利,所以,影响力很有限。正是在这个时候,非合作博弈———“纳什均衡”应运而生了,它标志着博弈论的新时代的开始!纳什不是一个按部就班的学生,他经常旷课。据他的同学们回忆,他们根本想不起来曾经什么时候和纳什一起完完整整地上过一门必修课,但纳什争辩说,至少上过斯蒂恩罗德的代数拓扑学。斯蒂恩罗德恰恰是这门学科的创立者,可是,没上几次课,纳什就认定这门课不符合他的口味。于是,又走人了。然而,纳什毕竟是一位英才天纵的非凡人物,他广泛涉猎数学王国的每一个分支,如拓扑学、代数几何学、逻辑学、博弈论等等,深深地为之着迷。纳什经常显示出他与众不同的自信和自负,充满咄咄逼人的学术野心。1950年整个夏天纳什都忙于应付紧张的考试,他的博弈论研究工作被迫中断,他感到这是莫大的浪费。殊不知这种暂时的“放弃”,使原来模糊、杂乱和无绪的若干念头,在潜意识的持续思考下,逐步形成一条清晰的脉络,突然来了灵感!这一年的10月,他骤感才思潮涌,梦笔生花。其中一个最耀眼的亮点就是日后被称之为“纳什均衡”的非合作博弈均衡的概念。纳什的主要学术贡献体现在1950年和1951年的两篇论文之中(包括一篇博士论文)。1950年他才把自己的研究成果写成题为“非合作博弈”的长篇博士论文,1950年11月刊登在美国全国科学院每月公报上,立即引起轰动。说起来这全靠师兄戴维·盖尔之功,就在遭到冯·诺依曼贬低几天之后,他遇到盖尔,告诉他自己已经将冯·诺依曼的“最小最大原理”(minimax solution)推到非合作博弈领域,找到了普遍化的方法和均衡点。盖尔听得很认真,他终于意识到纳什的思路比冯·诺伊曼的合作博弈的理论更能反映现实的情况,而对其严密优美的数学证明极为赞叹。盖尔建议他马上整理出来发表,以免被别人捷足先登。纳什这个初出茅庐的小子,根本不知道竞争的险恶,从未想过要这么做。结果还是盖尔充当了他的“经纪人”,代为起草致科学院的短信,系主任列夫谢茨则亲自将文稿递交给科学院。纳什写的文章不多,就那么几篇,但已经足够了,因为都是精品中的精品。这一点也是值得我们深思的。国内提一个教授,要求在“核心的刊物”上发表多少篇文章。按照这个标准可能纳什还不一定够资格。 1996年诺贝尔经济学奖得主莫尔里斯当牛津大学艾奇沃思经济学讲座教授时也没有发表过什么文章,特殊的人才,必须有特殊的选拔办法。 纳什在上大学时就开始从事纯数学的博弈论研究,1948年进入普林斯顿大学后更是如鱼得水。20岁出头已成为闻名世界的数学家。特别是在经济博弈论领域,他做出了划时代的贡献,是继冯·诺依曼之后最伟大的博弈论大师之一。他提出的著名的纳什均衡的概念在非合作博弈理论中起着核心的作用。后续的研究者对博弈论的贡献,都是建立在这一概念之上的。由于纳什均衡的提出和不断完善为博弈论广泛应用于经济学、管理学、社会学、政治学、军事科学等领域奠定了坚实的理论基础。 囚犯的两难处境 大理论中的小故事 要了解纳什的贡献,首先要知道什么是非合作博弈问题。现在几乎所有的博弈论教科书上都会讲“囚犯的两难处境”的例子,每本书上的例子都大同小异。 博弈论毕竟是数学,更确切地说是运筹学的一个分支,谈经论道自然少不了数学语言,外行人看来只是一大堆数学公式。好在博弈论关心的是日常经济生活问题,所以不能不食人间烟火。其实这一理论是从棋弈、扑克和战争等带有竞赛、对抗和决策性质的问题中借用的术语,听上去有点玄奥,实际上却具有重要现实意义。博弈论大师看经济社会问题犹如棋局,常常寓深刻道理于游戏之中。所以,多从我们的日常生活中的凡人小事入手,以我们身边的故事做例子,娓娓道来,并不乏味。话说有一天,一位富翁在家中被杀,财物被盗。警方在此案的侦破过程中,抓到两个犯罪嫌疑人,斯卡尔菲丝和那库尔斯,并从他们的住处搜出被害人家中丢失的财物。但是,他们矢口否认曾杀过人,辩称是先发现富翁被杀,然后只是顺手牵羊偷了点儿东西。于是警方将两人隔离,分别关在不同的房间进行审讯。由地方检察官分别和每个人单独谈话。检察官说,“由于你们的偷盗罪已有确凿的证据,所以可以判你们一年刑期。但是,我可以和你做个交易。如果你单独坦白杀人的罪行,我只判你三个月的监禁,但你的同伙要被判十年刑。如果你拒不坦白,而被同伙检举,那么你就将被判十年刑,他只判三个月的监禁。但是,如果你们两人都坦白交代,那么,你们都要被判5年刑。”斯卡尔菲丝和那库尔斯该怎么办呢?他们面临着两难的选择——坦白或抵赖。显然最好的策略是双方都抵赖,结果是大家都只被判一年。但是由于两人处于隔离的情况下无法串供。所以,按照亚当·斯密的理论,每一个人都是从利己的目的出发,他们选择坦白交代是最佳策略。因为坦白交代可以期望得到很短的监禁———3个月,但前提是同伙抵赖,显然要比自己抵赖要坐10年牢好。这种策略是损人利己的策略。不仅如此,坦白还有更多的好处。如果对方坦白了而自己抵赖了,那自己就得坐10年牢。太不划算了!因此,在这种情况下还是应该选择坦白交代,即使两人同时坦白,至多也只判5年,总比被判10年好吧。所以,两人合理的选择是坦白,原本对双方都有利的策略(抵赖)和结局(被判1年刑)就不会出现。这样两人都选择坦白的策略以及因此被判5年的结局被称为“纳什均衡”,也叫非合作均衡。因为,每一方在选择策略时都没有“共谋”(串供),他们只是选择对自己最有利的策略,而不考虑社会福利或任何其他对手的利益。也就是说,这种策略组合由所有局中人(也称当事人、参与者)的最佳策略组合构成。没有人会主动改变自己的策略以便使自己获得更大利益。“囚徒的两难选择”有着广泛而深刻的意义。个人理性与集体理性的冲突,各人追求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人都不利的结局。他们两人都是在坦白与抵赖策略上首先想到自己,这样他们必然要服长的刑期。只有当他们都首先替对方着想时,或者相互合谋(串供)时,才可以得到最短时间的监禁的结果。“纳什均衡”首先对亚当·斯密的“看不见的手”的原理提出挑战。按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。不妨让我们重温一下这位经济学圣人在《国富论》中的名言:“通过追求(个人的)自身利益,他常常会比其实际上想做的那样更有效地促进社会利益。”从“纳什均衡”我们引出了“看不见的手”的原理的一个悖论:从利己目的出发,结果损人不利己,既不利己也不利他。两个囚徒的命运就是如此。从这个意义上说,“纳什均衡”提出的悖论实际上动摇了西方经济学的基石。因此,从“纳什均衡”中我们还可以悟出一条真理:合作是有利的“利己策略”。但它必须符合以下黄金律:按照你愿意别人对你的方式来对别人,但只有他们也按同样方式行事才行。也就是中国人说的“己所不欲勿施于人”。但前提是人所不欲勿施于我。其次,“纳什均衡”是一种非合作博弈均衡,在现实中非合作的情况要比合作情况普遍。所以“纳什均衡”是对冯·诺依曼和摩根斯特恩的合作博弈理论的重大发展,甚至可以说是一场革命。 从“纳什均衡”的普遍意义中我们可以深刻领悟司空见惯的经济、社会、政治、国防、管理和日常生活中的博弈现象。我们将例举出许多类似于“囚徒的两难处境”这样的例子。如价格战、军奋竞赛、污染等等。一般的博弈问题由三个要素所构成:即局中人(players)又称当事人、参与者、策略等等的集合,策略(strategies)集合以及每一对局中人所做的选择和赢得(payoffs)集合。其中所谓赢得是指如果一个特定的策略关系被选择,每一局中人所得到的效用。所有的博弈问题都会遇到这三个要素。 价格战博弈: 现在我们经常会遇到各种各样的家电价格大战,彩电大战、冰箱大战、空调大战、微波炉大战……这些大战的受益者首先是消费者。每当看到一种家电产品的价格大战,百姓都会“没事儿偷着乐”。在这里,我们可以解释厂家价格大战的结局也是一个“纳什均衡”,而且价格战的结果是谁都没钱赚。因为博弈双方的利润正好是零。竞争的结果是稳定的,即是一个“纳什均衡”。这个结果可能对消费者是有利的,但对厂商而言是灾难性的。所以,价格战对厂商而言意味着自杀。从这个案例中我们可以引伸出两个问题,一是竞争削价的结果或“纳什均衡”可能导致一个有效率的零利润结局。二是如果不采取价格战,作为一种敌对博弈论(vivalry game)其结果会如何呢?每一个企业,都会考虑采取正常价格策略,还是采取高价格策略形成垄断价格,并尽力获取垄断利润。如果垄断可以形成,则博弈双方的共同利润最大。这种情况就是垄断经营所做的,通常会抬高价格。另一个极端的情况是厂商用正常的价格,双方都可以获得利润。从这一点,我们又引出一条基本准则:“把你自己的战略建立在假定对手会按其最佳利益行动的基础上”。事实上,完全竞争的均衡就是“纳什均衡”或“非合作博弈均衡”。在这种状态下,每一个厂商或消费者都是按照所有的别人已定的价格来进行决策。在这种均衡中,每一企业要使利润最大化,消费者要使效用最大化,结果导致了零利润,也就是说价格等于边际成本。在完全竞争的情况下,非合作行为导致了社会所期望的经济效率状态。如果厂商采取合作行动并决定转向垄断价格,那么社会的经济效率就会遭到破坏。这就是为什么WTO和各国政府要加强反垄断的意义所在。 污染博弈: 假如市场经济中存在着污染,但政府并没有管制的环境,企业为了追求利润的最大化,宁愿以牺牲环境为代价,也绝不会主动增加环保设备投资。按照看不见的手的原理,所有企业都会从利己的目的出发,采取不顾环境的策略,从而进入“纳什均衡”状态。如果一个企业从利他的目的出发,投资治理污染,而其他企业仍然不顾环境污染,那么这个企业的生产成本就会增加,价格就要提高,它的产品就没有竞争力,甚至企业还要破产。这是一个“看不见的手的有效的完全竞争机制”失败的例证。直到20世纪90年代中期,中国乡镇企业的盲目发展造成严重污染的情况就是如此。只有在政府加强污染管制时,企业才会采取低污染的策略组合。企业在这种情况下,获得与高污染同样的利润,但环境将更好。 贸易自由与壁垒: 这个问题对于刚刚加入WTO的中国而言尤为重要。任何一个国家在国际贸易中都面临着保持贸易自由与实行贸易保护主义的两难选择。贸易自由与壁垒问题,也是一个“纳什均衡”,这个均衡是贸易双方采取不合作博弈的策略,结果使双方因贸易战受到损害。X国试图对Y国进行进口贸易限制,比如提高关税,则Y国必然会进行反击,也提高关税,结果谁也没有捞到好处。反之,如X和Y能达成合作性均衡,即从互惠互利的原则出发,双方都减少关税限制,结果大家都从贸易自由中获得了最大利益,而且全球贸易的总收益也增加了
小麻烦ly
对策论(即所谓的博弈论)于本世纪初由一些数学家率先提出,涉及到用数学公式表达棋、牌类选手下棋和出牌技巧。1944年,大数学家约翰·诺伊曼与经济学家奥斯卡·摩根斯坦相识于普林斯顿大学,并合作出版了《对策论与经济行为》一书,该书标志着策略对策论取得了重大进展,并且成功地把对策理论与经济分析结合在一起。从此,普林斯顿大学成为世界对策理论研究中心。1950年,该校年仅22岁的数学博士约翰·纳什连续发表了两篇划时代的论文:《N—人对策的均衡点》、《讨价还价问题》。次年,他又发表了《非合作对策》。这一切为非合作对策理论以及合作对策的讨价还价理论奠定了坚实的基础,同时为对策论在50年代形成一门成熟的学科做出了创始性的贡献。
论文发表总量包括参与作者发表数量。 论文发表的查重率要求不同级别的期刊是不一样的,核心期刊的查重率不能超过百分之三,省级重点期刊不能超过百分之五,省级普通期刊要
1928年6月13日,约翰?纳什出生在西维吉尼亚州勃鲁费尔。 当纳什还是一名高中生时,就阅读E?T?Bell的著作《数学家》。他曾成功地证明了一项费玛的经典定理
1994年5月23号,在瑞典斯德哥尔摩举办的诺贝尔颁奖典礼上,一位文质彬彬、身材消瘦的男子吸引了人们的注意,他站起身接受了诺贝尔经济学奖,并优雅地鞠了一躬。在场
“纳什均衡”:合作是有利的“利己策略”。它必须符合以下黄金律:按照你愿意别人对你的方式来对别人,但只有他们也按同样方式行事才行。也就是中国人说的“己所不欲勿施于
中国论文数量世界第二35%以上从未被引用亲自写过论文的人,心里其实都明白:我们做某个课题、写一篇文章时,最关键最受启发的核心文献也就那么几篇甚至一两篇;大部分的