博弈论论文心得_博弈论论文心得怎么写
博弈论论文心得
以前没发现,但在学习了 博弈论基础的知识后,很容易的发现,博弈如同空气般,围绕在我们身边,无处不在。生活中的大小事怎么个博弈法,下面的内容将娓娓道来。
无论在日常生活中还是在工作中,“博弈”都是一个高频的词汇,生活中的博弈和经济学中的博弈有怎样的关系,精通“博弈”的人会不会特别擅长“套路”,“博弈论”到底是怎样的一种思维?下面我们来从以下方面谈论一下。
一、博弈论的定义
博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的目的。 博弈论思想古已有之,中国古代的《孙子兵法》等著作就不仅是一部军事著作,而且算是最早的一部博弈论著作。
二、博弈论的发展
博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展。近代对博弈论的研究,开始于策 梅洛、波莱尔、冯·诺依曼。
1928年, 冯·诺依曼 证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。1944年, 冯·诺依曼 和 摩根斯坦 共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统地应用于经济领域,从而奠定了这一学科的基础和理论体系。
1950~1951年, 约翰·福布斯·纳什 利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚实的基础。纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。此外, 莱因哈德·泽尔腾、约翰·海萨尼 的研究也对博弈论发展起到推动作用。今天博弈论已发展成一门较完善的学科。
三、博弈论的例子
“博弈论”中有一些由点及面、发人深思的经典案例,这些案例不仅使专业研究人士如醉如痴,也使一些普通民众兴致盎然;不仅成为“博弈论”中的一道亮丽风景,也是整个经济学领域中的学术奇葩。
一囚徒困境
囚徒困境的故事讲的是,两个嫌疑犯作案后被警察抓住,分别关在不同的屋子里接受审讯。警察知道两人有罪,但缺乏足够的证据。警察告诉每个人:如果两人都抵赖,各判刑一年;如果两人都坦白,各判八年;如果两人中一个坦白而另一个抵赖,坦白的放出去,抵赖的判十年。于是,每个囚徒都面临两种选择:坦白或抵赖。然而,不管同伙选择什么,每个囚徒的最优选择是坦白:如果同伙抵赖、自己坦白的话放出去,抵赖的话判一年,坦白比不坦白好;如果同伙坦白、自己坦白的话判八年,比起抵赖的判十年,坦白还是比抵赖的好。结果,两个嫌疑犯都选择坦白,各判刑八年。如果两人都抵赖,各判一年,显然这个结果好。但这个帕累托改进办不到,因为它不能满足人类的个体的理性要求。
囚徒困境所反映出的深刻问题是,人类的个人理性有时能导致集体的非理性——聪明的人类会因自己的聪明而作茧自缚,或者损害集体的利益。
前几年,我国彩电市场上,生产厂家基于自我利益选择大幅降价,但由此引发的价格战使所有生产厂家都遭受重创,这也是一种囚徒困境。
二智猪博弈
猪圈里面有两只猪, 一只大,一只小。猪圈很长,一头有一个踏板,另一头是饲料的出口和食槽。每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只 猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时,大猪 会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。所以呢小猪为了能吃饭东西,最好的策论就是大大猪的“便车”。这种情况在现实中比比皆是。
比如,在某种新产品刚上市,其性能和功用还不为人所熟识的情况下,如果进行新产品生产的不仅是一家小企业,还有其他生产能力和销售能力更强的企业。那么,小企业完全没有必要作出头鸟,自己去投入大量广告做产品宣传,只要采用跟随战略即可。
“智猪博弈”告诉我们,谁先去踩这个踏板,就会造福全体,但多劳却并不一定多得。
三那什均衡
纳什均衡最核心的其实就是互利的思想。有个小故事就可以体现。街上相邻的地方有两家小店,一家卖稀饭豆浆,一家卖油条馒头,一般客人都是买上馒头油条去和稀饭豆浆,所以开始两家的生意都很红火。后来卖豆浆的觉得卖油条的抢了生意,双方产生了矛盾,卖油条的走了,结果连带自己的生意也不行了。
其实我们生活中有很多与博弈相关的例子。而在这样一个复杂的博弈战场上,我们怎么能使得自己在博弈场上获得最大的利益就是一门很大的学问了。所以,博弈论是一门很有用的学科。通过读书学习让我又懂得了一问学问。
博弈论的论文该怎么写?
博弈论论文的写作格式、流程与写作技巧 广义来说,凡属论述科学技术内容的作品,都称作科学著述,如原始论著(论文)、简报、综合报告、进展报告、文献综述、述评、专著、汇编、教科书和科普读物等。但其中只有原始论著及其简报是原始的、主要的、第一性的、涉及到创造发明等知识产权的。其它的当然也很重要,但都是加工的、发展的、为特定应用目的和对象而撰写的。下面仅就论文的撰写谈一些体会。在讨论论文写作时也不准备谈有关稿件撰写的各种规定及细则。主要谈的是论文写作中容易发生的问题和经验,是论文写作道德和书写内容的规范问题。论文写作的要求下面按论文的结构顺序依次叙述。(一)论文——题目科学论文都有题目,不能“无题”。论文题目一般20字左右。题目大小应与内容符合,尽量不设副题,不用第1报、第2报之类。论文题目都用直叙口气,不用惊叹号或问号,也不能将科学论文题目写成广告语或新闻报道用语。(二)论文——署名科学论文应该署真名和真实的工作单位。主要体现责任、成果归属并便于后人追踪研究。严格意义上的论文作者是指对选题、论证、查阅文献、方案设计、建立方法、实验操作、整理资料、归纳总结、撰写成文等全过程负责的人,应该是能解答论文的有关问题者。现在往往把参加工作的人全部列上,那就应该以贡献大小依次排列。论文署名应征得本人同意。学术指导人根据实际情况既可以列为论文作者,也可以一般致谢。行政领导人一般不署名。(三)论文——引言 是论文引人入胜之言,很重要,要写好。一段好的论文引言常能使读者明白你这份工作的发展历程和在这一研究方向中的位置。要写出论文立题依据、基础、背景、研究目的。要复习必要的文献、写明问题的发展。文字要简练。(四)论文——材料和方法 按规定如实写出实验对象、器材、动物和试剂及其规格,写出实验方法、指标、判断标准等,写出实验设计、分组、统计方法等。这些按杂志 对论文投稿规定办即可。(五)论文——实验结果 应高度归纳,精心分析,合乎逻辑地铺述。应该去粗取精,去伪存真,但不能因不符合自己的意图而主观取舍,更不能弄虚作假。只有在技术不熟练或仪器不稳定时期所得的数据、在技术故障或操作错误时所得的数据和不符合实验条件时所得的数据才能废弃不用。而且必须在发现问题当时就在原始记录上注明原因,不能在总结处理时因不合常态而任意剔除。废弃这类数据时应将在同样条件下、同一时期的实验数据一并废弃,不能只废弃不合己意者。实验结果的整理应紧扣主题,删繁就简,有些数据不一定适合于这一篇论文,可留作它用,不要硬行拼凑到一篇论文中。论文行文应尽量采用专业术语。能用表的不要用图,可以不用图表的最好不要用图表,以免多占篇幅,增加排版困难。文、表、图互不重复。实验中的偶然现象和意外变故等特殊情况应作必要的交代,不要随意丢弃。(六)论文——讨论 是论文中比较重要,也是比较难写的一部分。应统观全局,抓住主要的有争议问题,从感性认识提高到理性认识进行论说。要对实验结果作出分析、推理,而不要重复叙述实验结果。应着重对国内外相关文献中的结果与观点作出讨论,表明自己的观点,尤其不应回避相对立的观点。 论文的讨论中可以提出假设,提出本题的发展设想,但分寸应该恰当,不能写成“科幻”或“畅想”。(七)论文——结语或结论 论文的结语应写出明确可靠的结果,写出确凿的结论。论文的文字应简洁,可逐条写出。不要用“小结”之类含糊其辞的词。(八)论文——参考义献 这是论文中很重要、也是存在问题较多的一部分。列出论文参考文献的目的是让读者了解论文研究命题的来龙去脉,便于查找,同时也是尊重前人劳动,对自己的工作有准确的定位。因此这里既有技术问题,也有科学道德问题。一篇论文中几乎自始至终都有需要引用参考文献之处。如论文引言中应引上对本题最重要、最直接有关的文献;在方法中应引上所采用或借鉴的方法;在结果中有时要引上与文献对比的资料;在讨论中更应引上与 论文有关的各种支持的或有矛盾的结果或观点等。一切粗心大意,不查文献;故意不引,自鸣创新;贬低别人,抬高自己;避重就轻,故作姿态的做法都是错误的。而这种现象现在在很多论文中还是时有所见的,这应该看成是利研工作者的大忌。其中,不查文献、漏掉重要文献、故意不引别人文献或有意贬损别人工作等错误是比较明显、容易发现的。有些做法则比较隐蔽,如将该引在引言中的,把它引到讨论中。这就将原本是你论文的基础或先导,放到和你论文平起平坐的位置。又如 科研工作总是逐渐深人发展的,你的工作总是在前人工作基石出上发展起来做成的。正确的写法应是,某年某人对本题做出了什么结果,某年某人在这基础上又做出了什么结果,现在我在他们基础上完成了这一研究。这是实事求是的态度,这样表述丝毫无损于你的贡献。有些论文作者却不这样表述,而是说,某年某人做过本题没有做成,某年某人又做过本题仍没有做成,现在我做成了。这就不是实事求是的态度。这样有时可以糊弄一些不明真相的外行人,但只需内行人一戳,纸老虎就破,结果弄巧成拙,丧失信誉。这种现象在现实生活中还是不少见的。(九)论文——致谢 论文的指导者、技术协助者、提供特殊试剂或器材者、经费资助者和提出过重要建议者都属于致谢对象。论文致谢应该是真诚的、实在的,不要庸俗化。不要泛泛地致谢、不要只谢教授不谢旁人。写论文致谢前应征得被致谢者的同意,不能拉大旗作虎皮。(十)论文——摘要或提要:以200字左右简要地概括论文全文。常放篇首。论文摘要需精心撰写,有吸引力。要让读者看了论文摘要就像看到了论文的缩影,或者看了论文摘要就想继续看论文的有关部分。此外,还应给出几个关键词,关键词应写出真正关键的学术词汇,不要硬凑一般性用词。 推荐一些比较好的论文网站。论文之家 优秀论文杂志 论文资料网 法律图书馆 法学论文资料库 中国总经理网论文集 mba职业经理人论坛 财经学位论文下载中心 公开发表论文_深圳证券交易所 中国路桥资讯网论文资料中心 论文商务中心 法律帝国: 学术论文 论文统计 北京大学学位论文样本收藏 学位论文 (清华大学) 中国科技论文在线 论文中国 : 新浪论文网分类: 中国论文联盟: 大学生论文库 论文资料网:
博弈论 论文
博弈论是指某个个人或是组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,从各自选择的行为或是策略进行选择并加以实施,并从各自取得相应结果或收益的过程,在经济学上博奕论是个非常重要的理论概念。
什么是博弈论?古语有云,世事如棋。生活中每个人如同棋手,其每一个行为如同在一张看不见的棋盘上布一个子,精明慎重的棋手们相互揣摩、相互牵制,人人争赢,下出诸多精彩纷呈、变化多端的棋局。博弈论是研究棋手们 “出棋” 着数中理性化、逻辑化的部分,并将其系统化为一门科学。换句话说,就是研究个体如何在错综复杂的相互影响中得出最合理的策略。事实上,博弈论正是衍生于古老的游戏或曰博弈如象棋、扑克等。数学家们将具体的问题抽象化,通过建立自完备的逻辑框架、体系研究其规律及变化。这可不是件容易的事情,以最简单的二人对弈为例,稍想一下便知此中大有玄妙:若假设双方都精确地记得自己和对手的每一步棋且都是最“理性” 的棋手,甲出子的时候,为了赢棋,得仔细考虑乙的想法,而乙出子时也得考虑甲的想法,所以甲还得想到乙在想他的想法,乙当然也知道甲想到了他在想甲的想法…
面对如许重重迷雾,博弈论怎样着手分析解决问题,怎样对作为现实归纳的抽象数学问题求出最优解、从而为在理论上指导实践提供可能性呢?现代博弈理论由匈牙利大数学家冯·诺伊曼于20世纪20年代开始创立,1944年他与经济学家奥斯卡·摩根斯特恩合作出版的巨著《博弈论与经济行为》,标志着现代系统博弈理论的初步形成。对于非合作、纯竞争型博弈,诺伊曼所解决的只有二人零和博弈--好比两个人下棋、或是打乒乓球,一个人赢一着则另一个人必输一着,净获利为零。在这里抽象化后的博弈问题是,已知参与者集合(两方) ,策略集合(所有棋着) ,和盈利集合(赢子输子) ,能否且如何找到一个理论上的“解” 或“平衡” ,也就是对参与双方来说都最“合理” 、最优的具体策略?怎样才是“合理” ?应用传统决定论中的“最小最大” 准则,即博弈的每一方都假设对方的所有功略的根本目的是使自己最大程度地失利,并据此最优化自己的对策,诺伊曼从数学上证明,通过一定的线性运算,对於每一个二人零和博弈,都能够找到一个“最小最大解” 。通过一定的线性运算,竞争双方以概率分布的形式随机使用某套最优策略中的各个步骤,就可以最终达到彼此盈利最大且相当。当然,其隐含的意义在於,这套最优策略并不依赖于对手在博弈中的操作。用通俗的话说,这个著名的最小最大定理所体现的基本“理性” 思想是“抱最好的希望,做最坏的打算” 。
2.在经济学中,“智*博弈”(Pigs’payoffs)是一个著名博弈论例子。
这个例子讲的是:*圈里有两头*,一头大*,一头小*。*圈的一边有个踏板,每踩一下踏板,在远离踏板的*圈的另一边的投食口就会落下少量的食物。如果有一只*去踩踏板,另一只*就有机会抢先吃到另一边落下的食物。当小*踩动踏板时,大*会在小*跑到食槽之前刚好吃光所有的食物;若是大*踩动了踏板,则还有机会在小*吃完落下的食物之前跑到食槽,争吃到另一半残羹。
那么,两只*各会采取什么策略?答案是:小*将选择“搭便车”策略,也就是舒舒服服地等在食槽边;而大*则为一点残羹不知疲倦地奔忙于踏板和食槽之间。
原因何在?因为,小*踩踏板将一无所获,不踩踏板反而能吃上食物。对小*而言,无论大*是否踩动踏板,不踩踏板总是好的选择。反观大*,已明知小*是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,所以只好亲力亲为了。
“小*躺着大*跑”的现象是由于故事中的游戏规则所导致的。规则的核心指标是:每次落下的事物数量和踏板与投食口之间的距离。
如果改变一下核心指标,*圈里还会出现同样的“小*躺着大*跑”的景象吗?试试看。
改变方案一:减量方案。投食仅原来的一半分量。结果是小*大*都不去踩踏板了。小*去踩,大*将会把食物吃完;大*去踩,小*将也会把食物吃完。谁去踩踏板,就意味着为对方贡献食物,所以谁也不会有踩踏板的动力了。
如果目的是想让*们去多踩踏板,这个游戏规则的设计显然是失败的。
改变方案二:增量方案。投食为原来的一倍分量。结果是小*、大*都会去踩踏板。谁想吃,谁就会去踩踏板。反正对方不会一次把食物吃完。小*和大*相当于生活在物质相对丰富的“共产主义”社会,所以竞争意识却不会很强。
对于游戏规则的设计者来说,这个规则的成本相当高(每次提供双份的食物);而且因为竞争不强烈,想让*们去多踩踏板的效果并不好。
改变方案三:减量加移位方案。投食仅原来的一半分量,但同时将投食口移到踏板附近。结果呢,小*和大*都在拼命地抢着踩踏板。等待者不得食,而多劳者多得。每次的收获刚好消费完。
对于游戏设计者,这是一个最好的方案。成本不高,但收获最大。
原版的“智*博弈”故事给了竞争中的弱者(小*)以等待为最佳策略的启发。但是对于社会而言,因为小*未能参与竞争,小*搭便车时的社会资源配置的并不是最佳状态。为使资源最有效配置,规则的设计者是不愿看见有人搭便车的,政府如此,公司的老板也是如此。而能否完全杜绝“搭便车”现象,就要看游戏规则的核心指标设置是否合适了。
比如,公司的激励制度设计,奖励力度太大,又是持股,又是期权,公司职员个个都成了百万富翁,成本高不说,员工的积极性并不一定很高。这相当于“智*博弈”
增量方案所描述的情形。但是如果奖励力度不大,而且见者有份(不劳动的“小*”也有),一度十分努力的大*也不会有动力了----就象“智*博弈”减量方案一所描述的情形。最好的激励机制设计就象改变方案三----减量加移位的办法,奖励并非人人有份,而是直接针对个人(如业务按比例提成),既节约了成本(对公司而言),又消除了“搭便车”现象,能实现有效的激励。
许多人并未读过“智*博弈”的故事,但是却在自觉地使用小*的策略。股市上等待庄家抬轿的散户;等待产业市场中出现具有赢利能力新产品、继而大举仿制牟取暴利的游资;公司里不创造效益但分享成果的人,等等。因此,对于制订各种经济管理的游戏规则的人,必须深谙“智*博弈”指标改变的个中道理。
3.背景知识:纳什博弈论的原理与应用
2002年03月21日17:44 北京晚报
1950年和1951年纳什的两篇关于非合作博弈论的重要论文,彻底改变了人们对竞争和市场的看法。他证明了非合作博弈及其均衡解,并证明了均衡解的存在性,即著名的纳什均衡。从而揭示了博弈均衡与经济均衡的内在联系。纳什的研究奠定了现代非合作博弈论的基石,后来的博弈论研究基本上都沿着这条主线展开的。然而,纳什天才的发现却遭到冯·诺依曼的断然否定,在此之前他还受到爱因斯坦的冷遇。但是骨子里挑战权威、藐视权威的本性,使纳什坚持了自己的观点,终成一代大师。要不是30多年的严重精神病折磨,恐怕他早已
站在诺贝尔奖的领奖台上了,而且也绝不会与其他人分享这一殊荣。
纳什是一个非常天才的数学家,他的主要贡献是1950至1951年在普林斯顿读博士学位时做出的。然而,他的天才发现———非合作博弈的均衡,即“纳什均衡”并不是一帆风顺的。
1948年纳什到普林斯顿大学读数学系的博士。那一年他还不到20岁。当时普林斯顿可谓人杰地灵,大师如云。爱因斯坦、冯·诺依曼、列夫谢茨(数学系主任)、阿尔伯特·塔克、阿伦佐·切奇、哈罗德·库恩、诺尔曼·斯蒂恩罗德、埃尔夫·福克斯……等全都在这里。博弈论主要是由冯·诺依曼(1903—1957)创所立的。他是一位出生于匈牙利的天才的数学家。他不仅创立了经济博弈论,而且发明了计算机。早在20世纪初,塞梅鲁(Zermelo)、鲍罗(Borel)和冯·诺伊曼已经开始研究博弈的准确的数学表达,直到1939年,冯·诺依曼遇到经济学家奥斯卡·摩根斯特恩(Oskar Morgenstern),并与其合作才使博弈论进入经济学的广阔领域。
1944年他与奥斯卡·摩根斯特恩合著的巨作《博弈论与经济行为》出版,标志着现代系统博弈理论的的初步形成。尽管对具有博弈性质的问题的研究可以追溯到19世纪甚至更早。例如,1838年古诺(Cournot)简单双寡头垄断博弈;1883年伯特兰和1925年艾奇沃奇思研究了两个寡头的产量与价格垄断;2000多年前中国著名军事家孙武的后代孙膑利用博弈论方法帮助田忌赛马取胜等等都属于早期博弈论的萌芽,其特点是零星的,片断的研究,带有很大的偶然性,很不系统。冯·诺依曼和摩根斯特恩的《博弈论与经济行为》一书中提出的标准型、扩展型和合作型博弈模型解的概念和分析方法,奠定了这门学科的理论基础。合作型博弈在20世纪50年代达到了巅峰期。然而,诺依曼的博弈论的局限性也日益暴露出来,由于它过于抽象,使应用范围受到很大限制,在很长时间里,人们对博弈论的研究知之甚少,只是少数数学家的专利,所以,影响力很有限。正是在这个时候,非合作博弈———“纳什均衡”应运而生了,它标志着博弈论的新时代的开始!纳什不是一个按部就班的学生,他经常旷课。据他的同学们回忆,他们根本想不起来曾经什么时候和纳什一起完完整整地上过一门必修课,但纳什争辩说,至少上过斯蒂恩罗德的代数拓扑学。斯蒂恩罗德恰恰是这门学科的创立者,可是,没上几次课,纳什就认定这门课不符合他的口味。于是,又走人了。然而,纳什毕竟是一位英才天纵的非凡人物,他广泛涉猎数学王国的每一个分支,如拓扑学、代数几何学、逻辑学、博弈论等等,深深地为之着迷。纳什经常显示出他与众不同的自信和自负,充满咄咄逼人的学术野心。1950年整个夏天纳什都忙于应付紧张的考试,他的博弈论研究工作被迫中断,他感到这是莫大的浪费。殊不知这种暂时的“放弃”,使原来模糊、杂乱和无绪的若干念头,在潜意识的持续思考下,逐步形成一条清晰的脉络,突然来了灵感!这一年的10月,他骤感才思潮涌,梦笔生花。其中一个最耀眼的亮点就是日后被称之为“纳什均衡”的非合作博弈均衡的概念。纳什的主要学术贡献体现在1950年和1951年的两篇论文之中(包括一篇博士论文)。1950年他才把自己的研究成果写成题为“非合作博弈”的长篇博士论文,1950年11月刊登在美国全国科学院每月公报上,立即引起轰动。说起来这全靠师兄戴维·盖尔之功,就在遭到冯·诺依曼贬低几天之后,他遇到盖尔,告诉他自己已经将冯·诺依曼的“最小最大原理”(minimax solution)推到非合作博弈领域,找到了普遍化的方法和均衡点。盖尔听得很认真,他终于意识到纳什的思路比冯·诺伊曼的合作博弈的理论更能反映现实的情况,而对其严密优美的数学证明极为赞叹。盖尔建议他马上整理出来发表,以免被别人捷足先登。纳什这个初出茅庐的小子,根本不知道竞争的险恶,从未想过要这么做。结果还是盖尔充当了他的“经纪人”,代为起草致科学院的短信,系主任列夫谢茨则亲自将文稿递交给科学院。纳什写的文章不多,就那么几篇,但已经足够了,因为都是精品中的精品。这一点也是值得我们深思的。国内提一个教授,要求在“核心的刊物”上发表多少篇文章。按照这个标准可能纳什还不一定够资格。
1996年诺贝尔经济学奖得主莫尔里斯当牛津大学艾奇沃思经济学讲座教授时也没有发表过什么文章,特殊的人才,必须有特殊的选拔办法。
纳什在上大学时就开始从事纯数学的博弈论研究,1948年进入普林斯顿大学后更是如鱼得水。20岁出头已成为闻名世界的数学家。特别是在经济博弈论领域,他做出了划时代的贡献,是继冯·诺依曼之后最伟大的博弈论大师之一。他提出的著名的纳什均衡的概念在非合作博弈理论中起着核心的作用。后续的研究者对博弈论的贡献,都是建立在这一概念之上的。由于纳什均衡的提出和不断完善为博弈论广泛应用于经济学、管理学、社会学、政治学、军事科学等领域奠定了坚实的理论基础。
囚犯的两难处境
大理论中的小故事
要了解纳什的贡献,首先要知道什么是非合作博弈问题。现在几乎所有的博弈论教科书上都会讲“囚犯的两难处境”的例子,每本书上的例子都大同小异。
博弈论毕竟是数学,更确切地说是运筹学的一个分支,谈经论道自然少不了数学语言,外行人看来只是一大堆数学公式。好在博弈论关心的是日常经济生活问题,所以不能不食人间烟火。其实这一理论是从棋弈、扑克和战争等带有竞赛、对抗和决策性质的问题中借用的术语,听上去有点玄奥,实际上却具有重要现实意义。博弈论大师看经济社会问题犹如棋局,常常寓深刻道理于游戏之中。所以,多从我们的日常生活中的凡人小事入手,以我们身边的故事做例子,娓娓道来,并不乏味。话说有一天,一位富翁在家中被杀,财物被盗。警方在此案的侦破过程中,抓到两个犯罪嫌疑人,斯卡尔菲丝和那库尔斯,并从他们的住处搜出被害人家中丢失的财物。但是,他们矢口否认曾杀过人,辩称是先发现富翁被杀,然后只是顺手牵羊偷了点儿东西。于是警方将两人隔离,分别关在不同的房间进行审讯。由地方检察官分别和每个人单独谈话。检察官说,“由于你们的偷盗罪已有确凿的证据,所以可以判你们一年刑期。但是,我可以和你做个交易。如果你单独坦白杀人的罪行,我只判你三个月的监禁,但你的同伙要被判十年刑。如果你拒不坦白,而被同伙检举,那么你就将被判十年刑,他只判三个月的监禁。但是,如果你们两人都坦白交代,那么,你们都要被判5年刑。”斯卡尔菲丝和那库尔斯该怎么办呢?他们面临着两难的选择——坦白或抵赖。显然最好的策略是双方都抵赖,结果是大家都只被判一年。但是由于两人处于隔离的情况下无法串供。所以,按照亚当·斯密的理论,每一个人都是从利己的目的出发,他们选择坦白交代是最佳策略。因为坦白交代可以期望得到很短的监禁———3个月,但前提是同伙抵赖,显然要比自己抵赖要坐10年牢好。这种策略是损人利己的策略。不仅如此,坦白还有更多的好处。如果对方坦白了而自己抵赖了,那自己就得坐10年牢。太不划算了!因此,在这种情况下还是应该选择坦白交代,即使两人同时坦白,至多也只判5年,总比被判10年好吧。所以,两人合理的选择是坦白,原本对双方都有利的策略(抵赖)和结局(被判1年刑)就不会出现。这样两人都选择坦白的策略以及因此被判5年的结局被称为“纳什均衡”,也叫非合作均衡。因为,每一方在选择策略时都没有“共谋”(串供),他们只是选择对自己最有利的策略,而不考虑社会福利或任何其他对手的利益。也就是说,这种策略组合由所有局中人(也称当事人、参与者)的最佳策略组合构成。没有人会主动改变自己的策略以便使自己获得更大利益。“囚徒的两难选择”有着广泛而深刻的意义。个人理性与集体理性的冲突,各人追求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人都不利的结局。他们两人都是在坦白与抵赖策略上首先想到自己,这样他们必然要服长的刑期。只有当他们都首先替对方着想时,或者相互合谋(串供)时,才可以得到最短时间的监禁的结果。“纳什均衡”首先对亚当·斯密的“看不见的手”的原理提出挑战。按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。不妨让我们重温一下这位经济学圣人在《国富论》中的名言:“通过追求(个人的)自身利益,他常常会比其实际上想做的那样更有效地促进社会利益。”从“纳什均衡”我们引出了“看不见的手”的原理的一个悖论:从利己目的出发,结果损人不利己,既不利己也不利他。两个囚徒的命运就是如此。从这个意义上说,“纳什均衡”提出的悖论实际上动摇了西方经济学的基石。因此,从“纳什均衡”中我们还可以悟出一条真理:合作是有利的“利己策略”。但它必须符合以下黄金律:按照你愿意别人对你的方式来对别人,但只有他们也按同样方式行事才行。也就是中国人说的“己所不欲勿施于人”。但前提是人所不欲勿施于我。其次,“纳什均衡”是一种非合作博弈均衡,在现实中非合作的情况要比合作情况普遍。所以“纳什均衡”是对冯·诺依曼和摩根斯特恩的合作博弈理论的重大发展,甚至可以说是一场革命。
从“纳什均衡”的普遍意义中我们可以深刻领悟司空见惯的经济、社会、政治、国防、管理和日常生活中的博弈现象。我们将例举出许多类似于“囚徒的两难处境”这样的例子。如价格战、军奋竞赛、污染等等。一般的博弈问题由三个要素所构成:即局中人(players)又称当事人、参与者、策略等等的集合,策略(strategies)集合以及每一对局中人所做的选择和赢得(payoffs)集合。其中所谓赢得是指如果一个特定的策略关系被选择,每一局中人所得到的效用。所有的博弈问题都会遇到这三个要素。
价格战博弈:
现在我们经常会遇到各种各样的家电价格大战,彩电大战、冰箱大战、空调大战、微波炉大战……这些大战的受益者首先是消费者。每当看到一种家电产品的价格大战,百姓都会“没事儿偷着乐”。在这里,我们可以解释厂家价格大战的结局也是一个“纳什均衡”,而且价格战的结果是谁都没钱赚。因为博弈双方的利润正好是零。竞争的结果是稳定的,即是一个“纳什均衡”。这个结果可能对消费者是有利的,但对厂商而言是灾难性的。所以,价格战对厂商而言意味着自杀。从这个案例中我们可以引伸出两个问题,一是竞争削价的结果或“纳什均衡”可能导致一个有效率的零利润结局。二是如果不采取价格战,作为一种敌对博弈论(vivalry game)其结果会如何呢?每一个企业,都会考虑采取正常价格策略,还是采取高价格策略形成垄断价格,并尽力获取垄断利润。如果垄断可以形成,则博弈双方的共同利润最大。这种情况就是垄断经营所做的,通常会抬高价格。另一个极端的情况是厂商用正常的价格,双方都可以获得利润。从这一点,我们又引出一条基本准则:“把你自己的战略建立在假定对手会按其最佳利益行动的基础上”。事实上,完全竞争的均衡就是“纳什均衡”或“非合作博弈均衡”。在这种状态下,每一个厂商或消费者都是按照所有的别人已定的价格来进行决策。在这种均衡中,每一企业要使利润最大化,消费者要使效用最大化,结果导致了零利润,也就是说价格等于边际成本。在完全竞争的情况下,非合作行为导致了社会所期望的经济效率状态。如果厂商采取合作行动并决定转向垄断价格,那么社会的经济效率就会遭到破坏。这就是为什么WTO和各国政府要加强反垄断的意义所在。
污染博弈:
假如市场经济中存在着污染,但政府并没有管制的环境,企业为了追求利润的最大化,宁愿以牺牲环境为代价,也绝不会主动增加环保设备投资。按照看不见的手的原理,所有企业都会从利己的目的出发,采取不顾环境的策略,从而进入“纳什均衡”状态。如果一个企业从利他的目的出发,投资治理污染,而其他企业仍然不顾环境污染,那么这个企业的生产成本就会增加,价格就要提高,它的产品就没有竞争力,甚至企业还要破产。这是一个“看不见的手的有效的完全竞争机制”失败的例证。直到20世纪90年代中期,中国乡镇企业的盲目发展造成严重污染的情况就是如此。只有在政府加强污染管制时,企业才会采取低污染的策略组合。企业在这种情况下,获得与高污染同样的利润,但环境将更好。 谢谢采纳
有关博弈论的毕业论文,可以写什么?不想太学术性,比较喜欢现实生活中的应用,麻烦大家给我点建议。。。
博弈论本身是一门严谨的学科,一般博弈现象在社会政治和经济层面居多,博弈多方生在群体之间。生活中个人之间很难称得上是什么博弈。可以写互联网与传统行业之间的博弈,这个比较接近现在的生活。另外资本和政策的博弈,这个比较庞杂。博弈的结果不一定是胜负两分,很多时候是达成一种新的平衡,一种气和。可以把围棋所表现出来的博弈引入,这样也比较生活。
抛砖引玉
试析博弈论在经济学理论发展中的基本线索和作用 求一篇3000-5000的论文 字数多多益善啦 谢谢各位O(∩_∩)O
无处不在的博弈
日常生活中的一切,均可从博弈得到解释,大到美日贸易战,小到今天早上你突然生病。可能读者会认为,贸易争端用博弈论来分析是可以的,但对自己生病也可以用博弈论来理解就有点不可思议,因为自己就一个人,和谁进行游戏?
实际上,并非只有一个人,还有一个叫做“自然”(Nature)的参与者。“自然”可以理解为无所不能的上帝,上帝现在有两种策略,让人生病或不生病。人一旦生病,就不得不根据生病的信息判断上帝的策略,然后采取对应的策略。上帝采取让人生病的策略,人就采取吃药的策略来对付;上帝采取不让人生病的策略,人就采取不予理睬的策略。这正是一场人和上帝进行博弈的游戏。
“自然”是研究单人博弈的重要假定。再比如一个农夫种庄稼也是同自然进行博弈的一个过程。自然的策略可以是:天旱、多雨、风调雨顺。农夫对应的策略分别是:防旱、防涝、放心地休息。当然,“自然”究竟采用哪种策略并不确定,于是农夫只有根据经验判断或气象预报来确定自己的行动。如果估计今年的旱情较重,就可早做防旱准备;如果估计水情严重,就早做防涝准备;如果估计是风调雨顺,农夫就可以悠哉游哉了。
生活中更多的游戏不是单人博弈,而是双人或多人的博弈。比如,某一天你觉得应该是你太太的生日,但又不能肯定:如果是太太的生日的话,你可以送一束花,太太会特别高兴;你不送花,太太会埋怨你忘了她的生日;如果不是太太的生日的话,你可以送太太一束花,太太感到意外的惊喜;你不送花,结果生活同往常一样。
在这个博弈里,我们看到,“自然”可以有两种策略:确定今天是太太的生日或确定今天不是太太的生日,但不论“自然”采取何种策略,你的最好行动都是买花。
夫妻吵架也是一场博弈。夫妻双方都有两种策略,强硬或软弱。博弈的可能结果有四种组合:夫强硬妻强硬、夫强硬妻软弱、夫软弱妻强硬、夫软弱妻软弱。
根据生活的实际观察,夫软弱妻软弱是婚姻最稳定的一种,因为互相都不愿让对方受到伤害或感到难过,常常情愿自己让步。动物学的研究有相同的结论,性格温顺的雄鸟和雌鸟更能和睦相处,寿命也更长。
夫强硬妻强硬是婚姻最不稳定的一种,大多数结局是负气离婚。夫强硬妻软弱和妻强硬夫软弱是最常见的一种,许多夫妻吵架都是这样,最后终归是一方让步,不是丈夫撤退到院子里点根烟,就是妻子避让到卧室里号啕大哭。
在竞争激烈的商业界,博弈更为常见。比如两个空调厂家之间的价格战,双方都要判断对方是否降价来决定自己是否降价,显而易见,厂家之间的博弈目标就是尽可能获得最大的市场份额,赚取最多的收益。
事实上,这种有利益(或效用)的争夺正是博弈的目的,也是形成博弈的基础。经济学的最基本的假设就是经济人或理性人的目的就是为了效用最大化,参与博弈的博弈者正是为了自身效用的最大化而互相争斗。参与博弈的各方形成相互竞争相互对抗的关系,以争得效用的多少决定胜负,一定的外部条件又决定了竞争和对抗的具体形式,这就形成了博弈。
如象棋对局的参与者是以将对方的军为目标,战争的目的是为了胜利,古罗马竞技场中角斗士在争夺两人中仅有的一个生存权,企业经营的目的是为了生存发展,而股市中人们所争的很实在,就是金钱。从经济学角度来看,有一种资源为人们所需要,而资源的总量具是稀缺的或是有限的,这时就会发生竞争,竞争需要有一个具体形式把大家拉在一起,一旦找到了这种形式就形成了博弈,竞争各方之间就会走到一起开始一场博弈。
《孙子兵法》上说:“知己知彼,百战百胜。”可见竞争对抗还有博弈各方拥有信息的特征。比如上一个例子中,博弈双方都明白对方的策略,从博弈理论来说,更拗口的说法是一方知道另一方知道自己的策略,反之另一方亦然,这种句法我们可以一直这么用下去,一直用到打“……”,而这正是博弈双方所掌握的公共信息。
因此我们可以了解到,形成一个博弈有4个要素:
1.博弈要有2个或2个以上的参与者(Player)。在博弈中存在一个必须的因素,那就是不是一个人在一个毫无干扰的真空里做出决策。比如一个单身汉,就不可能存在夫妻吵架的博弈,更不存在是否送花讨太太欢心的困扰。
从经济学的角度来看,如果是一个人做决策而不受到他人干扰的话,那就是一个传统经济学或管理学中最经常研究的最优化问题,也就是一个人或一个企业在一个既定的局面或情况下如何决策的问题。
最简单的一个最优化的例子就是,吸烟伤肺,不吸烟却又伤心,烟民是选择抽烟还是不抽烟,这就需要进行权衡(Tradeoff)。如果这个烟民非单身贵族,而是有妻子或女友,这种情况下就很有可能形成一个博弈。这也就是,博弈者的身边充斥着具有主观能动性的决策者,他们的选择与其它博弈者的选择相互作用、相互影响。这种互动关系自然会对博弈各方的思维和行动产生重要的影响,有时甚至直接影响着其他参与者的决策结果。
在冯·诺依曼(Von Neumann)的博弈论奠基之作《博弈论与经济行为》一书中举过这样一个经典的例子。在《鲁滨逊漂流记》中,与世隔绝的“鲁滨逊”(Robinson Crusoe)一个人组成一个独立的经济系统,有中学数学水平的人都能够清楚,这只是一个普通的求解最大值的问题。
因为鲁滨逊面对的是一些死的数据,而不是有主观意愿的人。一旦“星期五”(《鲁滨逊漂流记》中鲁滨逊的黑人仆人)加入这个系统,这个经济系统就形成了一个博弈问题。
2.博弈要有参与各方争夺的资源或收益(Resources或Payoff)。资源指的不仅仅是自然资源,如矿山、石油、土地、水资源等,还包括了各种社会资源,如人脉、信誉、学历、职位等。
如果这些资源是无限供给的,那么我们也不需要为共产主义而奋斗了,因为一步就可以迈入“货恶其弃于地也,不必藏于已,力恶其不出于身也,不必为已。”“大道之行也,天下为公。”的大同社会。
当然,不可否认是,一方面,博弈者之间会发生冲突;另一方面,他们当中也包含着合作的潜力。
值得强调的是,资源是有主观性的。人们之所以会参与博弈是受到利益的吸引,预期将来所获得利益的大小直接影响到竞争博弈的吸引力和参与者的关注程度。
经济学的效用理论可以用来解释这个问题,凡是自己主观需要的就是资源,反之亦然。比如,“孩子总是自己的好,妻子总是别人的好”:自己的孩子在眼里是无价之宝,而在别人面前相对是无价值的;即使是众人公认的美妻娇眷也会产生审美疲劳,资源的价值不断下降,这正是效用递减规律起了作用。
最极端的例子大概就是明代小说《镜花缘》中所描绘的君子国,人人礼让使得客观的资源就变得毫无价值,自然就不存在竞争与博弈。
3.参与者有自己能够选择的策略(Strategy)。所谓策略,就是“计利以听,乃为之势,以佐其外。势者,因利而制权也。”这指的是直接实用的针对某一个具体问题所采取的应对方式。通俗地说,策略就是计策,是博弈参与者所能够选择的手段方法。
一般日常生活中,策略选择仅是解决问题的方法,并不牵涉到分析关键因素、确定局势特征这些理论化的内容。而博弈论中的策略选择,是先对局势和整体状况进行分析,确定局势特征,找出其中关键因素,然后在最重要的目标上进行策略选择。由此可见,博弈对局中的策略是可以牵一发而动全身的,这直接对整个局势造成重大影响。
4.参与者拥有一定量的信息(Information)。比如在“合纵连横”的故事中,秦国与六国之间所拥有的信息就是完全的。
但有些时候,信息并不是完全的,俗话说“天有不测风云”,比如今天是阴云密布、狂风大作,气象台预报明天是“阴转小雨”,明天出门上班到底要不要带伞呢?这种情况的信息是不完全的,人们决策的信息条件是不确定。当然从情理上说,在实际生活中一般是要带伞以防不测。
通俗地说,博弈就是个人或组织在一定的环境条件与既定的规则下,同时或先后,仅仅一次或是进行多次地选择策略并实施,从而得到某种结果的过程。我们生活在这个世界上,就不可避免地要与他人打交道,这是一个利益交换的过程,也就不可避免地要面对各种矛盾和冲突。
所谓博弈论听似拗牙聱齿,看似深不可测,但其思想极易理解。简单说来博弈论就是研究人们如何进行决策,以及这种决策如何达到均衡的问题。每个博弈者在决定采取何种行动时,不但要根据自身的利益和目的行事,还必须考虑到他的决策行为对其他人的可能影响,以及其他人的反应行为的可能后果,通过选择最佳行动计划,来寻求收益或效用的最大化。
博弈是一种竞合游戏
2000多年前,雄才大略的秦始皇第一次统一了中国大地,并创建了当时世界上最庞大的帝国,得以名垂青史。从当时的历史条件来看,秦国虽然在商鞅变法之后实力大增,但其经济、政治、军事实力是远远不能与六国总和相匹敌的。这种情况下,六国与秦国的形势就产生了两种针锋相对的可能:其一,六国采用“合纵”政策对抗秦国,也就是各国缔结军事盟约,共同抵御秦国的侵略,秦国若对任一国家发动侵略,其它国家必须无条件出兵营救;其二,六国采用“连横”政策与秦国妥协,也就是各国都与秦国签订友好互助条约,保持双边和平关系。
当时七国之中,只有齐国实力比秦国稍逊一筹,成为六国军事同盟的核心。一旦齐国放弃“合纵”政策,六国的军事同盟就土崩瓦解。真实的历史也证明了这一点,秦国对六国联盟的破坏正是从齐国开始的。
在这种情况下,秦国与齐国都有两种战略政策可以选择,那就是“合纵”与“连横”。秦国如果默许六国“合纵”,齐国采用“合纵”政策,结果是秦国势力扩张被遏制,而齐国成为六国领袖,势力得以扩张。秦国采取“连横”政策,齐国仍然采取“合纵”政策,结果是秦国与六国处于对峙状态。秦国默许六国“合纵”,齐国却采用“连横”政策与秦国示好,结果是秦国没有吞并六国的野心自然无法一统天下,齐国的势力也没有得以扩张。而历史的真相是,秦国采取“连横”政策,齐国默许秦国的“连横”政策并与秦国建立友好外交关系,齐国最终被灭,千古一帝秦始皇得以名扬千秋。
“博弈论”的英文是“Game Theory”,实际上Game的本意是游戏,博弈论直接翻译成中文最贴切的直译是“游戏理论”。更准确点说,是一种竞合的智力游戏。
从秦始皇的故事中,我们看到博弈中包含了竞争冲突与合作两种截然不同的策略。所谓竞合,就是竞争合作的简写,一个博弈,并不仅仅是竞争,实际上竞争中包含着潜在合作的种子,合作中包含着潜在竞争的种子。
合作博弈并不是指合作各方具有合作的意向或态度,而是指在博弈中有一些对博弈各方有约束力的协议或契约,或者说是博弈各方不能公然“串通”或“共谋”。
合作博弈最典型的例子就是石油输出国组织欧佩克(Organization of Petroleum Exporting Countries,简称Opec)。1960年9月,伊朗、伊拉克、科威特、沙特阿拉伯和委内瑞拉的代表在巴格达开会,决定联合起来共同对付西方石油公司,维护石油收入。欧佩克在这个时候应运而生。欧佩克现在已发展成为亚洲、非洲和拉丁美洲一些主要石油生产国的国际性石油组织。它统一协调各成员国的石油政策,并以石油生产配额制的手段来维护它们各自和共同的利益,把国际石油价格稳定在公平合理的水平上。比如有些时候为防止石油价格飚升,欧佩克可依据市场形势增加其石油产量;为阻止石油价格下滑,欧佩克则可依据市场形势减少其石油产量。
对于个人来说,从博弈论的角度来看,在人生、事业一筹莫展的时候,如何能寻找到一个快速突破困境的办法?
首先要寻找一个合理的策略,而这个合理的策略,势必要建立在一个牢固的基点之上,才能切实可行。如果在困境之中,有人与你因为同样的原因无法抽身,那么是否能够和这个人一起摆脱不利的处境,在合作的基础上走向双赢呢?
《红楼梦》里面形容四大家族的时候,用过一个评语,叫做“一荣俱荣,一损皆损”,就是因为这四个家族你中有我,我中有你,相互之间有利益的合作,也有亲缘关系,所以结成一个牢固的联盟。
那么,如果两个同时处在困境中的人,也有这种利益 亲缘的双重关系,他们合作起来就会更加容易,而且形成的合力就会更大。正所谓“二人同心,其利断金”,而要做到“同心”,只有利益上的合作是不够的,还需要一种近乎亲情的亲缘关系。显然,这是可遇而不可求的,因为亲缘关系不是能够随便形成的。
博弈论简单入门 基本概念解释以及具体案例分析
博弈论也也 称为 对策论 或 赛局理论 ,是研究具有斗争或竞争性质现象的数学理论和方法。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。表面上不同的相互作用可能表现出相似的激励结构,所以它们是同一个游戏的特例。其中一个著名有趣的应用例子是囚徒困境。
具有竞争或对抗性质的行为称为博弈行为。在这类行为中,参加斗争或竞争的各方各自具有不同的目标或利益。为了达到各自的目标和利益,各方必须考虑对手的各种可能的行动方案,并力图选取对自己最为有利或最为合理的方案。博弈论就是研究博弈行为中斗争各方是否存在着最合理的行为方案,以及如何找到这个合理的行为方案的数学理论和方法。
约翰·冯·诺伊曼是个超级跨界牛人——他同时在“数学、物理学、经济学、计算机”等多个领域作出了划时代的贡献,并留下一大堆以他命名的东西,比如程序员应该都听说过“冯诺依曼体系”,比如数学领域有“冯诺依曼代数、冯诺依曼遍历定理……”,理论物理领域有“冯诺依曼量子测量、冯诺依曼熵、冯诺依曼方程……”。另外还有很多东西,虽没有以他命名,也是他先搞出来的,比如:量子力学的公理化表述、希尔伯特第5问题、连续几何(其空间维数不是整数)、蒙特卡洛方法、归并排序算法1944年,他与奥斯卡·摩根斯坦合作发表了《博弈论与经济行为》一举奠定博弈论体系的基础,所以他也被称作博弈论之父。
合作博弈 & 非合作博弈
不论是合作博弈与非合作博弈,在博弈过程中都可能会出现合作的现象。差别在于——对于合作博弈,存在某种外部约束力,使得背叛的行为会受到这种外部约束力的惩罚。对于非合作博弈,没有上述这种外部约束力,对背叛的惩罚只能依靠博弈过程的其它参与者。通常所说的博弈大都指非合作博弈。
同时博弈 & 顺序博弈
同时博弈有时也称作静态博弈,指的是——博弈的任何一个参与者在选择自己的行为之前,并不知道其它参与者的行为信息。顺序博弈有时也称作动态博弈。在这类博弈中,参与者的动作有时间上的先后,并且后一个执行动作的博弈者可以看到其他博弈者之前的动作,然后根据别人的动作,思考自己的行为。
零和博弈 & 非零和博弈
零和博弈这个名称具有误导性,使得很多人以为各方的收益总和为零。零和博弈指的是——在博弈结束之后,参与各方的利益总和为常量(可以是零,也可以是正值或负值)。非零和博弈指的是——在博弈结束之后,参与各方的利益总和为变量。所以这类博弈有时候称为变和博弈。对于这类博弈,在某些情况下可能会让参与各方的利益总和变大,从而使得各方存在合作的可能性。
非重复博弈 & 重复博弈
非重复博弈有时也称作单次博弈;相应的,重复博弈也被称作多次博弈。重复博弈还可以进一步细分为有限重复博弈与无限重复博弈。更严谨的说法是:有限重复博弈——重复次数确定的博弈,无限重复博弈——重复次数不确定的博弈
收益矩阵 & 决策树
这两个概念都是为了更直观地描述博弈过程,并帮你看清各方的利弊得失。收益矩阵通常用来描述静态博弈(同时博弈)而且一般是用来描述双人的静态博弈,更多人的静态博弈也可以用收益矩阵表述,但画起来会复杂很多;由于动态博弈(顺序博弈)比较复杂,通常不用“收益矩阵”描述。决策树既可以用来描述静态博弈,也可以用来描述动态博弈。
策略 & 策略集合
以象棋为例,完成一局需要经历很多个步骤,对每个步骤,你都有多个决策选项(要走哪个棋子,走到哪)。而策略指的是——从第一步到最后一步的所有决策选项的总和。你可以把策略通俗理解为某种算法 指导思想,它指导你从第一步走到最后一步。所有可能的策略,构成了策略集合。
有限策略集合 & 无限策略集合
石头剪刀布是典型的有限策略集合,该集合只有3个元素。为了说明无限策略集合这种集合,举个分蛋糕博弈的例子,其中一人先把蛋糕随意分为两块,然后另一个人先挑选其中一块。对于负责分蛋糕的人而言,其策略集合是无穷大。很多人凭直觉会认为:具有无限策略集合的博弈比有限策略集合的博弈更复杂。其实不然,围棋虽然很复杂,但其策略集合依然是有限滴。作为对比,分蛋糕博弈比围棋简单多了,但分蛋糕博弈反而具有无限的策略集合。
纯策略 & 混合策略
在实际博弈时,如果你总是固定选择策略集合中的某一个策略,这种情况称之为纯策略。如果你在博弈时,总是随机选择策略集合中的某几个策略,这种情况称之为混合策略。如果某个混合策略包含了策略集合中的每一个元素,称之为完全混合策略。
支配策略
假设你有两个策略 A & B。如果在任何情况下,A 都比 B 更优,称作 A 支配 B 或者 B 被 A 支配。支配策略又称优势策略。如果某个策略能够支配所有其它策略,那么它就是支配策略。通俗地说,不论你的对手采用何种策略,你的支配策略总是比你的其它策略有更好的结果。有时候会把支配策略进一步细分为强支配和弱支配。对于前者,它在任何情况下都比其它策略更好;对于后者,它在某些情况下比其它策略更好,某些情况下与其它策略一样好。制胜策略也称必胜策略,它通常只用于零和博弈,指的是——只要你采用这个策略,不论对方如何应对你总是赢。制胜策略肯定是支配策略;但支配策略不一定是制胜策略。
最小最大定理
比较绕口的陈述是:最小化最大损失,更通俗的表述是在最坏情况下最小化损失。该定理及算法最早由冯·诺依曼在《博弈论与经济行为》一书中提出。
反向归纳法 & 概念该方法洋
其精髓是正向展望,反向推理,首先,你需要思考自己的每个决策,以及对方在应对你的决策时,会采用何种决策,这个思维过程类似于决策树的展开,这个展开过程要一直推演到最后一步,也就是决策树的叶子节点。此时你就可以看清双方在最后一步各自的最优选择;然后再反向回推到第一步。当你要用反向归纳进行展望与推理,前提是——你要获得充分的信息;或者说,如果某个博弈者所知的信息不够充分,就无法运用该方法。
问题描述
5个海盗抢了100个金币,讨论如何分赃。这5个海盗有等级高低(不妨假设 A>B>C>D>E)。先由等级最高的海盗提出分赃方案,然后投票。如果半数以上(含半数)同意,就按这个方案分,游戏结束;如果同意的不到半数,把提出方案的海盗扔进海里喂鲨鱼,然后由次一等级的海盗提出新的方案;以此类推。每个海盗的特点是:足够理性(追求个人利益最大化)并且知道别人也足够理性;足够残忍(在个人利益等同的情况下,倾向于把更多同伴扔进海里)。
策略分析
为了进行反向推理,假设最后只剩下2个海盗(D & E)。此时的投票肯定过半(D 肯定投票赞同自己的方案)。在这种局面下,D 可以采用最极端的方案——自己全拿100个金币,E 则一个也拿不到。
现在回推一步。当只剩下3个海盗(C、D、E),由 C 提出方案。他只需要分1个金币给 E,E 就会投票支持(否则的话,等到由 D 来提方案,E 啥也拿不到)。所以在 C 的方案中,他自己拿99个金币,E 拿1个金币。
再往前一步。只剩下4个海盗(B、C、D、E),B 提方案,他当然也能想到刚才那些推理。他只需给 D 1个金币,D 就会支持他(如果等到 C 来提方案,D 啥也拿不到)。所以 B 提出的方案是 B:99,C:0,D:1,E:0,同样能得到半数支持。
基于上述分析,再看 A 的方案,就很显然了——A:98,B:0,C:1,D:0,E。
美国数学家纳什在1951年发表了一篇小论文名叫《非合作博弈》,其中提出了纳什均衡的概念并给出了相应的基于不动点定理数学证明。通俗地说是指在多人的非合作博弈中,如果每个博弈者都无法单方面改善自己的境地,此时的局面称作纳什均衡。冯·诺伊曼已经在《博弈论与经济行为》一书中证明了:零和博弈必定存在这样的均衡点。纳什的贡献在于他从零和博弈推广到非零和博弈,并证明了:这样的均衡点依然存在。当博弈的局面处于纳什均衡,此时的系统是稳定滴,如果每个博弈者都足够理性,他们都不愿意主动改变当前的策略。
换位思考
前面聊的很多博弈相关技能都依赖于换位思考这个能力,你需要站在对手的角度进行思考,才能看清局面,从而更好地选择自己的策略。一般来说,那些换位思考能力越强的人,也越善于进行强批判思维。
理性人假设
微观经济学在进行数学建模的时候,通常都会引入一个理性人假设,假定市场的行为主体是充分理性,此处的充分理性还隐含着掌握充分的信息,引入这个假设是为了数学建模的需要。对任何一个国家大多数人都很平庸,他们的共同点之一是非常不理性。充分理性并且掌握了充分信息的个人,那也绝对是凤毛麟角,而理性人假设竟然设定市场的行为主体全都是充分理性的。有了博弈论之后,这个非常扯蛋的理性人假设就可以丢到垃圾桶里。
旧的经济学理论(理性人的解释)会说——所有公司的老板都充分理性,也掌握了充分的信息,知道应该生产何种商品,才能满足市场需求。新的经济学理论(博弈论的解释)会说——公司的老板既有优秀的,也有平庸的。平庸公司生产的商品没人要,自然会亏损并倒闭。随着时间的推移,经过自然选择,活下来的公司当然是那些聪明的。
装疯策略
理性的博弈者把自己伪装成非理性的博弈者,这么干可以获得某种虚张声势的唬人效果。对这种手法,俺称之为装疯策略。
经济学
谈博弈论的影响,当然首先要谈它对经济学的影响。有了博弈论,就不再需要那个扯蛋的理性人假设了,这是博弈论诞生后对微观经济的重大影响,还有很多其它的影响。比如说:博弈论诞生前传统的微观经济学以供给需求来建立价格的数学模型。这个模型只考虑了供应量需求量的变化对价格的影响,而完全不考虑供给双方的力量对比。如果供给双方中,一方变得强势或另一方变得弱势。即使供应量与需求量都维持不变,价格也会发生变动,朝着对强势方有利的方向移动。
生物学
生物学受博弈论影响最大的分支估计是演化生物学,也就是的进化论。借助博弈论的研究成果,演化生物学家可以更好地建立物种演化的数学模型。
跪求关于博弈论的论文一篇,请有相关专业知识的朋友帮忙!!
博弈论及其在现代经济生活中的应用
有一个典型的案例:甲乙两人合伙作案,结果被警察抓了起来,分别被隔离审讯。在不能互通信息的情形下———也就是不知道对方是坦白还是缄默的前提下,每个嫌疑犯都可以作出自己的选择:或者供出同伙,即与警察合作,从而背叛同伙;或者保持沉默,也就是与同伙合作,而不是与警察合作。这样会出现以下几种情况:如果两人都不坦白,警察会因证据不足而将两人各判刑! 年;如果一人招供而另外一人不招,坦白者作为证人将不会被起诉,另一人将会被重判!" 年;如果两人都招供,则会因罪名成立各判!# 年。这两个嫌疑犯该怎么办呢?是选择合作还是互相背叛?从表面上看,他们应该互相合作,保持沉默,因为这样对他们整体而言是最好的结果———都只判!年。但是他们不得不仔细考虑对方可能采取的选择。问题就这样开始了,两个人都十分精明,而且只关心减少自己的刑期,并不会在乎对方被判多少年。每个人都会这样推理:假如对方不招,我只要一招供,马上可以获得自由,而不招却要坐牢! 年,显然招比不招好;假如对方招了,我若不招,则要坐牢!" 年。招了只要坐牢!# 年,显然还是招更好些。可见,对方无论招或者不招,我的最佳选择都是招认。两个人都会基于同样的想法作出招供的选择,这对他们个人来说都是最佳策略,但对整体而言却是一个最差的结果。
这就是博弈论的一个经典模型———“囚徒困境模型”。作为一种关于决策和策略的理论,博弈论其实就在我们身边,它研究的许多例子来自于日常生活和经济活动中的游戏和事物。
博弈的英文即,中文译为“博弈”是非常传神和贴切的,因为中国古代称下棋为“弈”,“博”则含有争斗的意思。在下棋这样的游戏中有一个重要的特点:即策略在其中起着举足轻重的影响和作用。精明慎重的棋手们相互揣摩、相互牵制,人人争赢,布每一个棋子时,都必须考虑到对手的策略选择,从而选择自己的最佳策略。这也就是博弈的核心问题:决策主体的一方行动后,参与博弈的其他人将会采取什么行动?参与人为取得最佳效果应采取怎样的对策?我们可以将博弈论定义为:一些个人、一些团队或其他组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,同时或先后,一次或多次,从各自允许选择的行为或策略进行选择并加以实施,并从中各自取得相应结果或收益的过程。博弈论是(# 世纪四五十年代发展起来的。美国经济学家冯•诺依曼与奥斯卡•摩根斯特恩于!)**年合著的《博弈论与经济行为》被公认为博弈论诞生的标志。
博弈论可以分为合作博弈理论和非合作博弈理论。前者主要强调的是集体理性;而后者主要研究人们在利益相互影响的局势中如何选择策略使自己的收益最大,强调的是个人理性。所谓“个人理性”是反映个体的行为始终都是以实现自身的最大利益为惟一目标,除非是为了实现自身利益的需要,否则不会考虑其他的个体或社会利益这样一种决策原则。非合作博弈要求各参与人之间不能存在任何有约束力的协议,也就是各个参与人不能公开“串通”或“共谋”。(# 世纪"# 年代,数学家纳什提出了著名的非合作博弈的纳什均衡理论,奠定了现代非合作博弈论的基石,后来的博弈论研究基本上是沿着这条主线展开的。纳什均衡理论地提出和不断完善为博弈论广泛应用于经济学、管理学、社会学、政治学、军事科学等领域奠定了坚实的理论基础。现在人们所说的博弈论基本是指非合作博弈论。这是因为竞争是一切社会经济关系的根本基础。在现实生活中非合作的情况要比合作普遍,不合作是基本的,合作是有条件和暂时的。事实上在我们证明非合作博弈的无效率或低效率的同时,就自然说明了博弈论及其在现代经济生活中的应用!# 杨佳佳!"存在着合作的可能性和必要性。“囚徒困境模型”在现代经济生活中有着广泛而深刻的应用。比如,我们经常会遇到各种各样的价格大战,家用电器大战、服装大战、机票打折大战⋯⋯。
按照囚徒困境模型,各个厂家都将选择降价作为自己的优势策略。因为别的厂家如果不降价,我选择降价将会获得更多的市场份额;别的厂家如果降价,我只有跟着降价才能维持本来的市场份额。最后,博弈的结果是各个厂家谁都没有多少钱赚。再如,在遗失钱物时,遗失人和拾得人的心态其实也就像这两个囚徒,前者希望不给任何报酬能失而复得,后者怕得不到报答干脆占为己有,博弈的结果通常是遗失物被拾得人侵占。“囚徒困境博弈”准确地抓住了人性的真实一面———相互防范背叛与彼此的不信任,以及这种心理对合作的破坏作用。
但是,在现实生活中,我们巴不得囚徒之间以及各个厂家之间不能合作。因为我们不愿意看到危险的罪犯通过合作逃脱了法律的制裁或者是几个大企业联合起来形成对行业的垄断,导致我们不能享受合理的价格。在现实生活中,我们也期待遗失人和拾得人能更多地为对方的利益着想,从而提升整个社会的道德水准。当我们试图阻挠或者促进“囚徒”之间的合谋,希望通过法律或者道德维系良好的社会秩序时,我们必须了解什么样的途径可以破解“囚徒困境”,并且正视人们正当的逐利心态在博弈过程中的影响。比如:很多发达国家往往利用法律的形式对垄断行为进行严格的限制。反垄断法的实施阻挠了企业之间的价格合谋,并且激励企业改善管理,开发技术,努力以较低的成本生产质量较好的产品,提高企业的市场竞争力。同时,如果我们期待拾金不昧的博弈结果,那么就要鼓励归还失物这一善行。怎么鼓励呢?中国人的道德宗师孔子两千年前就回答了这个问题。孔子的弟子有一次救了一个溺水的人。被救者酬谢这位弟子一头牛,他收下了。孔子对这个弟子的行为大加赞赏。因为这会激励更多的人去救人,今后也会有更多溺水的人得到营救。道德准则要求人们不要惟利是图,但是从不反对社会成员通过自己的正当行为获取收益。如果德行善举得不到报答和补偿,那么它就只能是少数圣贤的“专利”而不会成为社会公德。“智猪博弈模型”是博弈论中另一个经典的模型。它说的是:猪圈里有两头猪,一头大猪,一头小猪。猪圈的一边有个踏板,每踩一下踏板,在远离踏板猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时,大猪会在小猪跑到投食口之前刚好吃完所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到投食口,争吃到另一半残羹。那么,两只猪各会采取什么策略?答案是小猪将选择“搭便车”策略,也就是舒舒服服地等在投食口旁;而大猪则为一点残羹不知疲倦地奔忙于踏板和投食口之间。原因何在?因为,小猪踩踏板将会一无所获,不踩踏板反而能吃上食物。对小猪而言,无论大猪是否踩动踏板,不踩踏板总是最好的选择。反观大猪,已经明知小猪是不会踩动踏板的,自己踩总比不踩强,所以,只好亲历亲为了。
这个经典模型揭示了市场竞争中大企业与小企业之间的关系。研究开发,为新产品做广告,对大企业是值得的,对小企业则得不偿失。小企业应把精力花在模仿上,或等待大企业用广告打开市场后出售廉价产品,而大企业应当以主动的态度来开拓市场。一个理性的企业,就应该象“智猪”一样,选择自己的优势策略。在欧佩克中,各个成员的生产能力各不相同。同属一个同盟的大成员和小成员,他们应该选择遵守协议还是选择作弊多生产石油呢?假设以沙特阿拉伯和科威特为例。假定在合作的情况下,科威特每天应当生产!"" 万桶石油,沙特阿拉伯则生产#"" 万桶。对于他们两家而言,作弊意味着每天多生产!"" 万桶。科威特有一个优势策略:作弊每天生产$"" 万桶。沙特阿拉伯的优势策略则是遵守协议,每天仍然生产#"" 万桶。为什么会这样呢?沙特阿拉伯选择遵守协议也是出于纯粹的自利心理。假如它有一个较低的生产数量,则市场价格攀升,欧佩克全体成员的边际利润上扬。如果它的产量只占欧佩克总产量一个很小的份额,它自然很难发现价格上扬对自己的好处。如果它占的份额很大,他将占有上扬的边际利润的大部分好处,因此牺牲一些产量也是值得的。智猪博弈模型给了竞争中的弱者(小猪)最佳策略的启发。但是对于社会而言,由于小猪未能参加竞争,小猪搭便车式的社会资源配置并不是最佳状态。为使资源有效配置,避免“小猪躺着大猪跑”的现象,游戏规则的设计就非常关键了。规则的核心指标是:每次落下的食物数量和踏板与投食口之间的距离。如果改变核心指标,会出现什么样的现象呢?改变方案一:减量方案。投食仅是原来的一半分量。结果是大猪和小猪都不去踩踏板了。因为无论谁去踩,对方都会把食物吃完,所以谁都不会有踩踏板的动力了。这个游戏规则的设计抑制了竞争,显然是失败的。
结果是小猪大猪都会去踩踏板,反正对方不会一次性把食物吃完。这个规则的成本相当高(每次提供双份食物),而且竞争也不强烈,效果也不好。改变方案三:减量加移位方案。投食仅为原来的一半分量,但同时将投食口移到踏板附近。结果大猪和小猪都拼命抢着踩踏板,多劳多得,每次的收获刚好消费完。这个游戏的规则是最好的,成本不高,但收获最大。在现实生活中,公司的激励制度设计就必须充分利用智猪博弈的策略。如果公司的奖励力度太大,又是持股,又是期权,公司职员各个都成了百万富翁,成本高不说,员工的积极性并不一定很高;如果奖励力度不大,而且见者有份(不劳动的小猪也有),一度十分努力的大猪也不会有动力了;最好的激励机制就是———奖励并非人人有份,而是直接针对个人(如业务按比例提成),这样既节约了公司的成本,又消除了“搭便车”现象,能够实现有效的激励。随着社会生活各个方面的竞争性和对抗性的增强,随着人们对自身行为和决策的理性及效率的更高层次的追求,更多地利用博弈的原理指导我们的行动,能让我们在既定规则下选择更为适宜的策略,或是在制度设计、规则优化方面思路更开阔,考虑更全面,从而获得更加理想的结果。! 作者单位:国家发改委价检司"#$%&’———我对你诉说# 王春廷张海涛许多双手敲打着不同电话机上的#$%&’———这同一键盘不同声音诉说着问题疑难对可信赖的你发出渴望公平的呼唤你是一柄利剑高悬于不法经营者之顶违规“必斩”你是一把标尺准确丈量价格的法律界限事实为鉴因你的存在我们不再把受到的委屈强行吞咽因你的秉公经济上的损失被追还捍卫了应有的尊严价格领域的法官你倾听百姓的肺腑之言作出公正的评断你给出的满意答案就是一股春风化解了群众的抱怨因为你消费者们不再心烦意乱因为你迷茫中找到失落已久的主见有了你生活更加圆满有了你生存更觉安全每个人心中溢满由衷的称赞对你的认识也许并不全面但我们知晓“全心全意为人民服务”就是你工作的出发点及时准确严谨实办是你永恒的职业理念微欲微慎微独微权是你永不忘却的誓言让世间不再有狡诈欺骗是你不懈的追求即便是永久的失业也心甘情愿!#"$#%$&%’风雨中的一把伞!#"$#%$&%’寒冬里的一缕暖一株常青树因所有人的倾情浇灌枝繁叶茂茁壮参天!作者单位:山东省夏津县物价局!"
怎样才能最为成功的与所有人进行斗争、博弈、竞争呢?
博弈论(GameTheory),有时也称为对策论,或者赛局理论,是研究具有斗争或竞争性质现象的理论和方法,它是应用数学的一个分支,既是现代数学的一个新分支,也是运筹学的一个重要学科。目前在生物学、经济学、国际关系学、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。主要研究公式化了的激励结构(游戏或者博弈(Game))间的相互作用,是研究具有斗争或竞争性质现象的数学理论和方法,也是运筹学的一个重要学科。 博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。表面上不同的相互作用可能表现出相似的激励结构(incentivestructure),所以他们是同一个游戏的特例。其中一个有名有趣的应用例子是囚徒困境悖论(Prisoner'sdilemma)。 具有竞争或对抗性质的行为成为博弈行为。在这类行为中,参加斗争或竞争的各方各自具有不同的目标或利益。为了达到各自的目标和利益,各方必须考虑对手的各种可能的行动方案,并力图选取对自己最为有利或最为合理的方案。比如日常生活中的下棋,打牌等。博弈论就是研究博弈行为中斗争各方是否存在着最合理的行为方案,以及如何找到这个合理的行为方案的数学理论和方法。 生物学家使用博弈理论来理解和预测进化论的某些结果。例如:JohnMaynardSmith和在1973年发表于Nature上的论文中提出的“evolutionarilystablestrategy”的这个概念就是使用了博弈理论。还可以参见演化博弈理论(evolutionarygametheory)和行为生态学(behavioralecology)。 博弈论也应用于数学的其他分支,如概率、统计和线性规划等。博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论专著。博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展,正式发展成一门学科则是在20世纪初。 对于博弈论的研究,开始于策墨洛(Zermelo,1913)、波雷尔(Borel,1921)及冯·诺伊曼(vonNeumann,1928),后来由冯·诺伊曼和奥斯卡·摩根斯坦(vonNeumannandMorgenstern,1944,1947)首次对其系统化和形式化(参照Myerson,1991)。随后约翰·福布斯·纳什(JohnForbesNashJr.,1950,1951)利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚实的基础。此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。今天博弈论已发展成一门较完善的的学科。 当代博弈论的“三大家”和“四君子” "三大家"包括约翰·福布斯·纳什、约翰·C·海萨尼以及莱因哈德·泽尔腾。这三人同时因为他们对博弈论的突出贡献而获得1994年的瑞典银行经济学奖(也称诺贝尔经济学奖)。 "四君子"包括罗伯特·J·奥曼、肯·宾摩尔、戴维·克瑞普斯以及阿里尔·鲁宾斯坦。博弈要素: (1)局中人(players):在一场竞赛或博弈中,每一个有决策权的参与者成为一个局中人。只有两个局中人的博弈现象称为“两人博弈”,而多于两个局中人的博弈称为“多人博弈”。 (2)策略(strategiges):一局博弈中,每个局中人都有选择实际可行的完整的行动方案,即方案不是某阶段的行动方案,而是指导整个行动的一个方案,一个局中人的一个可行的自始至终全局筹划的一个行动方案,称为这个局中人的一个策略。如果在一个博弈中局中人都总共有有限个策略,则称为“有限博弈”,否则称为“无限博弈”。 (3)得失(payoffs):一局博弈结局时的结果称为得失。每个局中人在一局博弈结束时的得失,不仅与该局中人自身所选择的策略有关,而且与全局中人所取定的一组策略有关。所以,一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数,通常称为支付(payoff)函数。 (4)次序(orders):各博弈方的决策有先后之分,且一个博弈方要作不止一次的决策选择,就出现了次序问题;其他要素相同次序不同,博弈就不同。 (5)博弈涉及到均衡:均衡是平衡的意思,在经济学中,均衡意即相关量处于稳定值。在供求关系中,某一商品市场如果在某一价格下,想以此价格买此商品的人均能买到,而想卖的人均能卖出,此时我们就说,该商品的供求达到了均衡。所谓纳什均衡,它是一稳定的博弈结果。 纳什均衡(NashEquilibrium):在一策略组合中,所有的参与者面临这样一种情况,当其他人不改变策略时,他此时的策略是最好的。也就是说,此时如果他改变策略他的支付将会降低。在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。所谓“均衡偶”是在二人零和博弈中,当局中人A采取其最优策略a*,局中人B也采取其最优策略b*,如果局中人仍采取b*,而局中人A却采取另一种策略a,那么局中人A的支付不会超过他采取原来的策略a*的支付。这一结果对局中人B亦是如此。 这样,“均衡偶”的明确定义为:一对策略a*(属于策略集A)和策略b*(属于策略集B)称之为均衡偶,对任一策略a(属于策略集A)和策略b(属于策略集B),总有:偶对(a,b*)≤偶对(a*,b*)≤偶对(a*,b)。 对于非零和博弈也有如下定义:一对策略a*(属于策略集A)和策略b*(属于策略集B)称为非零和博弈的均衡偶,对任一策略a(属于策略集A)和策略b(属于策略集B),总有:对局中人A的偶对(a,b*)≤偶对(a*,b*);对局中人B的偶对(a*,b)≤偶对(a*,b*)。 有了上述定义,就立即得到纳什定理: 任何具有有限纯策略的二人博弈至少有一个均衡偶。这一均衡偶就称为纳什均衡点。 纳什定理的严格证明要用到不动点理论,不动点理论是经济均衡研究的主要工具。通俗地说,寻找均衡点的存在性等价于找到博弈的不动点。 纳什均衡点概念提供了一种非常重要的分析手段,使博弈论研究可以在一个博弈结构里寻找比较有意义的结果。 但纳什均衡点定义只局限于任何局中人不想单方面变换策略,而忽视了其他局中人改变策略的可能性,因此,在很多情况下,纳什均衡点的结论缺乏说服力,研究者们形象地称之为“天真可爱的纳什均衡点”。 塞尔顿(R·Selten)在多个均衡中剔除一些按照一定规则不合理的均衡点,从而形成了两个均衡的精炼概念:子博弈完全均衡和颤抖的手完美均衡。
博弈论是怎样的一门学科
博弈.就是用这种游戏思维来突破看似无法改变的局面,解决现实的严肃问题的策略。在博弈中,每个参与者都在特定条件下争取其最大利益,强差一者来必胜券在握,弱者也未必永无出头之日。因为在博弈中,特别是多十参与者的博彝中,结果不仅取决干参与者的实力与策略,而且还取决于其他参与者的制约和策略。
博弈论的目的在于巧妙的策略,而不是解法。学习博弈论的目的,不是为了享受博弈分析的过程,而在于赢得更好的结局。博弈的思想既然来自现实生活,它就可以高度抽象化地用数学工具来表述,也可以用日常事例来说明,并运用到生活中。
所谓博弈就是行为者在一定环境条件和规则下,选择一定的行为或策略加以实施并取得相应结果的过程。 博弈论用途很广。
生活中的博弈论论文 知乎
纳什均衡 捕风捉影 以讹传讹 是什么玩意儿
博弈圣经著作人笑谈博弈论,人们在寻找一粒爆香的黄豆时,还不如老鼠能选择最近的路程。
《博弈圣经》中《人类未知的蓝色档案》一文给出了博弈论的定义:“我们把动物利用大自然移动的瘾魂,在决策人期待的空间里,形成三维均衡的语文学理论,称为博弈论。”
博弈圣经著作人说;博弈论是青年人的毒品,是无知者的兴奋剂,是沉默者的摇头丸。
博弈圣经著作人对博弈、宗教、伟人,有过美妙的阐述
博弈圣经著作人说;博弈,是人与宇宙的宗教。博弈的使命是探索自然界里和思维世界里,所显示出来的崇高、庄严、不可思议的秩序。人们对宇宙,实体、知识、未知的神秘,以及对个体,性质、经验、已知的恐惧——产生了宗教。人们认识到,有些为我们所不能洞察的东西存在其中,感觉到有一种最原始的形式、最深奥的理性、最灿烂的壮美、所产生的博弈情感,构成了真正的宗教感情。没有宗教、没有信仰、没有博弈感情,就不会出现时代伟人。
博弈论就是 张冠李戴 捕风捉影 以讹传讹
【典故】讽刺博弈论的最高博弈水平;
有人问博弈圣经著作人,什么是博弈论。
他回答说;博弈论就是,一问、二答、三无知。
也就是说;问者无知、回答者无知、听者更无知。
有人追问,到目前为止,那么多博弈论图书,那么多作者,他们的最高博弈水平是什么?博弈圣经著作人一听就笑了;目前他们的最高博弈水平,就是想卖给你一本书,就想赢你一本书钱。
博弈圣经著作人通俗的谈菜鸟与金鸟
一个人想变得伟大,从一个菜鸟变成一个金鸟,就要利用国家实体特性造个金鸟笼。日后,就可以在媒体的报道中、绘声绘色地描述那个金鸟笼;他是某某大学院校、某某著名教授、某某首席科学家、某某诺贝尔奖得主、甚至某某政府官员,他就自然的钻进了金鸟笼。
博弈论理论,是停滞不前的理论,它是太过于急躁、太过于草率的理论。由于博弈论新奇、古怪、原始,一个“囚徒困境”的三维谜团像似神话,人们又错误的认为博弈论能够取胜,因此受到了人们盲目的吹捧和疯狂的参与。人们把博弈取胜的欲望作为动力,博弈竞争的欲望在远古就出现了,一个人有了欲望,就要有实现欲望的对象和博弈对局的背景,加上自己行为的结果,才能取得想要的东西。欲望的天性就是进行交往,建立行为二特性对局,就是博弈的合作。
《博弈圣经》赢的定义;赢不是大小、不是多少、不是均衡平衡、不是战略战术,而是在未来国正论的0、1、2,三维随机状态中,一粒期望的粒子(常数0.007813,也是私湍边际效应的一个小目标)优先达成。
赢也不是福,输也不是罪,输赢与均衡属于第三空地论的内容。
但明眼的人都能看得出,所谓那些自称的博弈专家抄来的无效理论、编成的一本本博弈论,就是张冠李戴、捕风捉影、以讹传讹,不管他从外国哪个地方抄来的,不管他抄了多少、编了多少本书、多少篇文章,究其低劣的学术品质,他仍然是一个菜鸟。
假如博弈论大师,走出那个金鸟笼,再靠讲课赚大钱,靠卖书赚小钱,靠博弈取胜策略赚不到一毛钱,他就是骗子,也许是一个罪犯。
更为讽刺的是,一本本博弈论著作,古老的内容千篇一律,里面没有几句精彩的话,没有几个经典的词,更没有定理、定律、定义和法则。至今一个个博弈论专家、矛盾论专家、概率论专家和外行知道得一样多。
以往经济学家为了降低风险,建议投资多元化,“不要把鸡蛋放在一个篮子里”,这种分散投资的经济思想,实在是经济学家对博弈取胜的无奈。《博弈圣经》在453节有一段风趣的表述:“我们根本不能完全理解大自然,或许人们不如老鼠在寻找食物时能选择最近的路程,那是大自然的拓扑几何图像的捷径。”
看看权威媒体上发表的理论文章,标题或者落款,都是什么什么单位(一个金鸟笼)、某某某人的大名(一个金鸟),即使有一个金鸟笼做背书、做包装,再看他那排列整齐错落有致的垃圾文章,如果只看外观不读内容,真像是一篇好文章出笼了,假如读者直接读内容,就会得出结论;理论文章就是破碎的八卦,假如他再发一篇文章,又是卜上一卦?文章的内容就是拼凑的垃圾、金鸟笼就是忽悠人、金鸟其实就是一个菜鸟。中国新领导人形容过“笼子政治”的概念,因此中国就是一个笼子政治,金鸟笼里豢养了很多菜鸟,(政治菜鸟、经济菜鸟、学术菜鸟、司法菜鸟、还有博弈论菜鸟等)。他们的罪恶,给中国百姓制造了无数的冤假错案和人间悲剧。(受害者等待机会,等新领导人依法治国的社会稳定了、等忠诚合格的人到位了、等到司法环境改善了,就开始用罪恶者的犯罪事实、向最高司法机关举报他,国家只要用法律的尺度、度量他,他一定是个罪犯。)
中国百姓很善良,面对、遍地强盗;面对、遍地流氓;面对、中共暴力机器;面对、公检法菜鸟的黑恶势力;面对、学术痞子的打压;都先忍耐着,别上访告状、上访就会倾家荡产。期盼着中国特色社会主义之后、中国实体社会的黎明……。博弈圣经著作人的经典名句;中国实体社会主义的民主与自由——民主是罪恶者的坟墓、自由是中国梦的故乡。
新领导人面临着,历代罪恶造成的、各种人间悲剧;中国特色社会主义制造的、冤民遍地;冤民到联合国上访、演绎了中国特色社会主义的国际景观;至今还遗留几个、无人触碰的雷区;新领导人开始了真正的国家思考,开始了全面依法治国的“谨慎变革”。所以新领导人说;把权力关进笼子里,就是先把菜鸟的权力关进笼子里……。
……。