运筹学博弈论论文

发布时间：2023-12-12 04:53:03

运筹学博弈论论文

博弈论的概念博弈论又被称为对策论（Games Theory),是研究具有斗争或竞争性质现象的理论和方法，它既是现代数学的一个新分支，也是运筹学的一个重要学科。博弈论的发展博弈论思想古已有之，我国古代的《孙子兵法》就不仅是一部军事著作，而且算是最早的一部博弈论专著。博弈论最初主要研究象棋、桥牌、赌博中的胜负问题，人们对博弈局势的把握只停留在经验上,没有向理论化发展，正式发展成一门学科则是在20世纪初。1928年冯·诺意曼证明了博弈论的基本原理，从而宣告了博弈论的正式诞生。1944年，冯·诺意曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域，从而奠定了这一学科的基础和理论体系。谈到博弈论就不能忽略博弈论天才纳什，纳什的开创性论文《n人博弈的均衡点》（1950），《非合作博弈》（1951）等等，给出了纳什均衡的概念和均衡存在定理。此外，塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。今天博弈论已发展成一门较完善的的学科。博弈论的基本概念博弈要素 (1)局中人：在一场竞赛或博弈中，每一个有决策权的参与者成为一个局中人。只有两个局中人的博弈现象称为“两人博弈”,而多于两个局中人的博弈称为 “多人博弈”。 (2)策略：一局博弈中，每个局中人都有选择实际可行的完整的行动方案，即方案不是某阶段的行动方案，而是指导整个行动的一个方案，一个局中人的一个可行的自始至终全局筹划的一个行动方案，称为这个局中人的一个策略。如果在一个博弈中局中人都总共有有限个策略，则称为“有限博弈”，否则称为“无限博弈”。 (3)得失：一局博弈结局时的结果称为得失。每个局中人在一局博弈结束时的得失，不仅与该局中人自身所选择的策略有关，而且与全局中人所取定的一组策略有关。所以，一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数，通常称为支付（payoff）函数。 (4)对于博弈参与者来说，存在着一博弈结果 (5)博弈涉及到均衡：均衡是平衡的意思，在经济学中，均衡意即相关量处于稳定值。在供求关系中，某一商品市场如果在某一价格下，想以此价格买此商品的人均能买到，而想卖的人均能卖出，此时我们就说，该商品的供求达到了均衡。所谓纳什均衡，它是一稳定的博弈结果。纳什均衡(Nash Equilibrium)：在一策略组合中，所有的参与者面临这样一种情况，当其他人不改变策略时，他此时的策略是最好的。也就是说，此时如果他改变策略他的支付将会降低。在纳什均衡点上，每一个理性的参与者都不会有单独改变策略的冲动。纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。所谓“均衡偶”是在二人零和博弈中，当局中人A采取其最优策略a*,局中人B也采取其最优策略b*,如果局中人仍采取b*,而局中人A却采取另一种策略a，那么局中人A的支付不会超过他采取原来的策略a*的支付。这一结果对局中人B亦是如此。这样，“均衡偶”的明确定义为：一对策略a*(属于策略集A)和策略b*（属于策略集B）称之为均衡偶，对任一策略a(属于策略集A)和策略b（属于策略集B），总有：偶对（a, b*）≤偶对(a*,b*)≤偶对（a*，b）。对于非零和博弈也有如下定义：一对策略a*（属于策略集A）和策略b*（属于策略集B）称为非零和博弈的均衡偶，对任一策略a(属于策略集A）和策略b（属于策略集B），总有：对局中人A的偶对（a, b*） ≤偶对(a*,b*);对局中人B的偶对（a*，b）≤偶对(a*,b*)。有了上述定义，就立即得到纳什定理：任何具有有限纯策略的二人博弈至少有一个均衡偶。这一均衡偶就称为纳什均衡点。纳什定理的严格证明要用到不动点理论，不动点理论是经济均衡研究的主要工具。通俗地说，寻找均衡点的存在性等价于找到博弈的不动点。纳什均衡点概念提供了一种非常重要的分析手段，使博弈论研究可以在一个博弈结构里寻找比较有意义的结果。但纳什均衡点定义只局限于任何局中人不想单方面变换策略，而忽视了其他局中人改变策略的可能性，因此，在很多情况下，纳什均衡点的结论缺乏说服力，研究者们形象地称之为“天真可爱的纳什均衡点”。塞尔顿（R·Selten)在多个均衡中剔除一些按照一定规则不合理的均衡点，从而形成了两个均衡的精炼概念：子博弈完全均衡和颤抖的手完美均衡。博弈的类型 (1)合作博弈——研究人们达成合作时如何分配合作得到的收益，即收益分配问题。 (2)非合作博弈——研究人们在利益相互影响的局势中如何选决策使自己的收益最大，即策略选择问题。 (3)完全信息不完全信息博弈：参与者对所有参与者的策略空间及策略组合下的支付有充了解称为完全信息；反之，则称为不完全信息。 (4)静态博弈和动态博弈静态博弈：指参与者同时采取行动，或者尽管有先后顺序，但后行动者不知道先行动者的策略。动态博弈：指双方的的行动有先后顺序并且后行动者可以知道先行动者的策略。财产分配问题和夏普里值（Shapley value）考虑这样一个合作博弈：a、b、c、投票决定如何分配100万，他们分别拥有50％、40％、10％的权力，规则规定，当超过50%的票认可了某种方案时才能通过。那么如何分配才是合理的呢?按票力分配，a50万、b40万、c10万c向a提出：a70万、b0、c30万b向a提出：a80万、b20万、c0…… 权力指数：每个决策者在决策时的权力体现在他在形成的获胜联盟中的“关键加入者”的个数，这个“关键加入者”的个数就被称为权利指数。夏普里值：在各种可能的联盟次序下，参与者对联盟的边际贡献之和除以各种可能的联盟组合。次序 abc acb bac bca cab cba 关键加入者 a c a c a b 由此计算出a,b,c的夏普里值分别为4/6,1/6,1/6 所以a,b,c应分别获得100万的2/3,1/6,1/6。博弈论的意义弈论的研究方法和其他许多利用数学工具研究社会经济现象的学科一样，都是从复杂的现象中抽象出基本的元素，对这些元素构成的数学模型进行分析，而后逐步引入对其形势产影响的其他因素，从而分析其结果。基于不同抽象水平，形成三种博弈表述方式，标准型、扩展型和特征函数型利用这三种表述形式,可以研究形形色色的问题。因此,它被称为“社会科学的数学”从理论上讲，博弈论是研究理性的行动者相互作用的形式理论，而实际上正深入到经济学、政治学、社会学等等，被各门社会科学所应用。博弈论是指某个个人或是组织，面对一定的环境条件，在一定的规则约束下，依靠所掌握的信息，从各自选择的行为或是策略进行选择并加以实施，并从各自取得相应结果或收益的过程，在经济学上博弈论是个非常重要的理论概念。什么是博弈论？古语有云，世事如棋。生活中每个人如同棋手，其每一个行为如同在一张看不见的棋盘上布一个子，精明慎重的棋手们相互揣摩、相互牵制，人人争赢，下出诸多精彩纷呈、变化多端的棋局。博弈论是研究棋手们 “出棋” 着数中理性化、逻辑化的部分，并将其系统化为一门科学。换句话说，就是研究个体如何在错综复杂的相互影响中得出最合理的策略。事实上，博弈论正是衍生于古老的游戏或曰博弈如象棋、扑克等。数学家们将具体的问题抽象化，通过建立自完备的逻辑框架、体系研究其规律及变化。这可不是件容易的事情，以最简单的二人对弈为例，稍想一下便知此中大有玄妙：若假设双方都精确地记得自己和对手的每一步棋且都是最“理性” 的棋手，甲出子的时候，为了赢棋，得仔细考虑乙的想法，而乙出子时也得考虑甲的想法，所以甲还得想到乙在想他的想法，乙当然也知道甲想到了他在想甲的想法… 面对如许重重迷雾，博弈论怎样着手分析解决问题，怎样对作为现实归纳的抽象数学问题求出最优解、从而为在理论上指导实践提供可能性呢？现代博弈理论由匈牙利大数学家冯·诺伊曼于20世纪20年代开始创立，1944年他与经济学家奥斯卡·摩根斯特恩合作出版的巨著《博弈论与经济行为》，标志着现代系统博弈理论的初步形成。对于非合作、纯竞争型博弈，诺伊曼所解决的只有二人零和博弈--好比两个人下棋、或是打乒乓球，一个人赢一着则另一个人必输一着，净获利为零。在这里抽象化后的博弈问题是，已知参与者集合(两方) ，策略集合(所有棋着) ，和盈利集合(赢子输子) ，能否且如何找到一个理论上的“解” 或“平衡” ，也就是对参与双方来说都最“合理” 、最优的具体策略？怎样才是“合理” ？应用传统决定论中的“最小最大” 准则，即博弈的每一方都假设对方的所有功略的根本目的是使自己最大程度地失利，并据此最优化自己的对策，诺伊曼从数学上证明，通过一定的线性运算，对于每一个二人零和博弈，都能够找到一个“最小最大解” 。通过一定的线性运算，竞争双方以概率分布的形式随机使用某套最优策略中的各个步骤，就可以最终达到彼此盈利最大且相当。当然，其隐含的意义在于，这套最优策略并不依赖于对手在博弈中的操作。用通俗的话说，这个著名的最小最大定理所体现的基本“理性” 思想是“抱最好的希望，做最坏的打算” 。

博弈论又被称为对策论（Game Theory）既是现代数学的一个新分支，也是运筹学的一个重要学科。博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。博弈论考虑游戏中的个体的预测行为和实际行为，并研究它们的优化策略。生物学家使用博弈理论来理解和预测进化论的某些结果。博弈论已经成为经济学的标准分析工具之一。在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。基本概念中包括局中人、行动、信息、策略、收益、均衡和结果等。其中局中人、策略和收益是最基本要素。局中人、行动和结果被统称为博弈规则。理论历史博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略，达到取胜的目的。博弈论思想古已有之，中国古代的《孙子兵法》等著作就不仅是一部军事著作，而且算是最早的一部博弈论著作。博弈论最初主要研究象棋、桥牌、赌博中的胜负问题，人们对博弈局势的把握只停留在经验上，没有向理论化发展。博弈论考虑游戏中的个体的预测行为和实际行为，并研究它们的优化策略。近代对于博弈论的研究，开始于策梅洛（Zermelo），波莱尔（Borel）及冯·诺依曼（vonNeumann）。1928年，冯·诺依曼证明了博弈论的基本原理，从而宣告了博弈论的正式诞生。1944年，冯·诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统地应用于经济领域，从而奠定了这一学科的基础和理论体系。1950～1951年，约翰·福布斯·纳什（John Forbes NashJr）利用不动点定理证明了均衡点的存在，为博弈论的一般化奠定了坚实的基础。纳什的开创性论文《n人博弈的均衡点》（1950），《非合作博弈》（1951）等等，给出了纳什均衡的概念和均衡存在定理。此外，莱因哈德·泽尔腾、约翰·海萨尼的研究也对博弈论发展起到推动作用。今天博弈论已发展成一门较完善的学科。类型(1)合作博弈——研究人们达成合作时如何分配合作得到的收益，即收益分配问题。(2)非合作博弈——研究人们在利益相互影响的局势中如何选决策使自己的收益最大，即策略选择问题。(3)完全信息/不完全信息博弈：参与者对所有参与者的策略空间及策略组合下的支付有充分了解称为完全信息；反之，则称为不完全信息。(4)静态博弈和动态博弈诺贝尔奖从1994年诺贝尔经济学奖授予3位博弈论专家开始，共有6届的诺贝尔经济学奖与博弈论的研究有关，分别为：1994年，授予加利福尼亚大学伯克利分校的约翰·海萨尼（）、普林斯顿大学约翰·纳什（）和德国波恩大学的赖因哈德·泽尔滕（ReinhardSelten）。以表彰这三位数学家在非合作博弈的均衡分析理论方面做出了开创性的贡献，对博弈论和经济学产生了的重大影响。1996年，授予英国剑桥大学的詹姆斯·莫里斯（James A. Mirrlees）与美国哥伦比亚大学的威廉·维克瑞（WilliamVickrey）。前者在信息经济学理论领域做出了重大贡献，尤其是不对称信息条件下的经济激励理论，后者在信息经济学、激励理论、博弈论等方面都做出了重大贡献。2001年，授予加利福尼亚大学伯克利分校的乔治·阿克尔洛夫（George A. Akerlof ）、美国斯坦福大学的迈克尔·斯宾塞（A. MichaelSpence ）和美国哥伦比亚大学的约瑟夫·斯蒂格利茨（Joseph ）。他们的研究为不对称信息市场的一般理论奠定了基石，他们的理论迅速得到了应用，从传统的农业市场到现代的金融市场，他们的贡献来自于现代信息经济学的核心部分。2005年，授予美国马里兰大学的托马斯·克罗姆比·谢林(Thomas CrombieSchelling)和耶路撒冷希伯来大学的罗伯特·约翰·奥曼(Robert John Aumann）。二者的研究通过博弈论分析促进了对冲突与合作的理解。2007年，授予美国明尼苏达大学的里奥尼德·赫维茨（Leonid Hurwicz）、美国普林斯顿大学的埃里克·马斯金(Eric ）以及美国芝加哥大学的罗杰·迈尔森(Roger B. Myerson）。三者的研究为机制设计理论奠定了基础。2012年，授予美国经济学家埃尔文·罗斯（Alvin E. Roth）与罗伊德·沙普利（Lloyd ）。他们创建“稳定分配”的理论，并进行“市场设计”的实践[3] 。作为一门工具学科能够在经济学中如此广泛运用并得到学界垂青实为罕见。2014年，授予法国经济学家梯若尔。他在产业组织理论以及串谋问题上，采用了博弈论的思想，让理论和问题得以解决。在规制理论上也有创新。要素(1)局中人：在一场竞赛或博弈中，每一个有决策权的参与者成为一个局中人。只有两个局中人的博弈现象称为“两人博弈”,而多于两个局中人的博弈称为“多人博弈”。(2)策略：一局博弈中，每个局中人都有选择实际可行的完整的行动方案，即方案不是某阶段的行动方案，而是指导整个行动的一个方案，一个局中人的一个可行的自始至终全局筹划的一个行动方案，称为这个局中人的一个策略。如果在一个博弈中局中人都总共有有限个策略，则称为“有限博弈”，否则称为“无限博弈”。(3)得失：一局博弈结局时的结果称为得失。每个局中人在一局博弈结束时的得失，不仅与该局中人自身所选择的策略有关，而且与全局中人所取定的一组策略有关。所以，一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数，通常称为支付（payoff）函数。(4)对于博弈参与者来说，存在着一博弈结果。(5)博弈涉及到均衡：均衡是平衡的意思，在经济学中，均衡意即相关量处于稳定值。在供求关系中，某一商品市场如果在某一价格下，想以此价格买此商品的人均能买到，而想卖的人均能卖出，此时我们就说，该商品的供求达到了均衡。所谓纳什均衡，它是一稳定的博弈结果。博弈类型博弈的分类根据不同的基准也有不同的分类。一般认为，博弈主要可以分为合作博弈和非合作博弈。合作博弈和非合作博弈的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议，如果有，就是合作博弈，如果没有，就是非合作博弈。从行为的时间序列性，博弈论进一步分为静态博弈、动态博弈两类：静态博弈是指在博弈中，参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动；动态博弈是指在博弈中，参与人的行动有先后顺序，且后行动者能够观察到先行动者所选择的行动。通俗的理解：囚徒困境就是同时决策的，属于静态博弈；而棋牌类游戏等决策或行动有先后次序的，属于动态博弈按照参与人对其他参与人的了解程度分为完全信息博弈和不完全信息博弈。完全博弈是指在博弈过程中，每一位参与人对其他参与人的特征、策略空间及收益函数有准确的信息。不完全信息博弈是指如果参与人对其他参与人的特征、策略空间及收益函数信息了解的不够准确、或者不是对所有参与人的特征、策略空间及收益函数都有准确的信息，在这种情况下进行的博弈就是不完全信息博弈。经济学家们所谈的博弈论一般是指非合作博弈，由于合作博弈论比非合作博弈论复杂，在理论上的成熟度远远不如非合作博弈论。非合作博弈又分为：完全信息静态博弈，完全信息动态博弈，不完全信息静态博弈，不完全信息动态博弈。与上述四种博弈相对应的均衡概念为：纳什均衡(Nashequilibrium），子博弈精炼纳什均衡（subgame perfect Nash equilibrium），贝叶斯纳什均衡(Bayesian Nashequilibrium），精炼贝叶斯纳什均衡(perfect Bayesian Nash equilibrium）。博弈论还有很多分类，比如：以博弈进行的次数或者持续长短可以分为有限博弈和无限博弈；以表现形式也可以分为一般型（战略型）或者展开型；以博弈的逻辑基础不同又可以分为传统博弈和演化博弈。纳什均衡纳什均衡(NashEquilibrium)：在一策略组合中，所有的参与者面临这样一种情况，当其他人不改变策略时，他此时的策略是最好的。也就是说，此时如果他改变策略他的支付将会降低。在纳什均衡点上，每一个理性的参与者都不会有单独改变策略的冲动。纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。所谓“均衡偶”是在二人零和博弈中，当局中人A采取其最优策略a*，局中人B也采取其最优策略b*,如果局中人仍采取b*，而局中人A却采取另一种策略a，那么局中人A的支付不会超过他采取原来的策略a*的支付。这一结果对局中人B亦是如此。这样，“均衡偶”的明确定义为：一对策略a*(属于策略集A)和策略b*（属于策略集B）称之为均衡偶，对任一策略a(属于策略集A)和策略b（属于策略集B），总有：偶对（a,b*）≤偶对（a*，b）≤偶对(a*,b*)。对于非零和博弈也有如下定义：一对策略a*（属于策略集A）和策略b*（属于策略集B）称为非零和博弈的均衡偶，对任一策略a(属于策略集A）和策略b（属于策略集B），总有：对局中人A的偶对（a,b*） ≤偶对(a*,b*);对局中人B的偶对（a*，b）≤偶对(a*,b*)。有了上述定义，就立即得到纳什定理：任何具有有限纯策略的二人博弈至少有一个均衡偶。这一均衡偶就称为纳什均衡点。纳什定理的严格证明要用到不动点理论，不动点理论是经济均衡研究的主要工具。通俗地说，寻找均衡点的存在性等价于找到博弈的不动点。纳什均衡点概念提供了一种非常重要的分析手段，使博弈论研究可以在一个博弈结构里寻找比较有意义的结果。但纳什均衡点定义只局限于任何局中人不想单方面变换策略，而忽视了其他局中人改变策略的可能性，因此，在很多情况下，纳什均衡点的结论缺乏说服力，研究者们形象地称之为“天真可爱的纳什均衡点”。塞尔顿（R·Selten)在多个均衡中剔除一些按照一定规则不合理的均衡点，从而形成了两个均衡的精炼概念：子博弈完全均衡和颤抖的手完美均衡。

1950年和1951年纳什的两篇关于非合作博弈论的重要论文，彻底改变了人们对竞争和市场的看法。他证明了非合作博弈及其均衡解，并证明了均衡解的存在性，即著名的纳什均衡。从而揭示了博弈均衡与经济均衡的内在联系。纳什的研究奠定了现代非合作博弈论的基石，后来的博弈论研究基本上都沿着这条主线展开的。然而，纳什天才的发现却遭到冯·诺依曼的断然否定，在此之前他还受到爱因斯坦的冷遇。但是骨子里挑战权威、藐视权威的本性，使纳什坚持了自己的观点，终成一代大师。要不是30多年的严重精神病折磨，恐怕他早已站在诺贝尔奖的领奖台上了，而且也绝不会与其他人分享这一殊荣。纳什是一个非常天才的数学家，他的主要贡献是1950至1951年在普林斯顿读博士学位时做出的。然而，他的天才发现———非合作博弈的均衡，即“纳什均衡”并不是一帆风顺的。1948年纳什到普林斯顿大学读数学系的博士。那一年他还不到20岁。当时普林斯顿可谓人杰地灵，大师如云。爱因斯坦、冯·诺依曼、列夫谢茨(数学系主任)、阿尔伯特·塔克、阿伦佐·切奇、哈罗德·库恩、诺尔曼·斯蒂恩罗德、埃尔夫·福克斯……等全都在这里。博弈论主要是由冯·诺依曼(1903—1957)创所立的。他是一位出生于匈牙利的天才的数学家。他不仅创立了经济博弈论，而且发明了计算机。早在20世纪初，塞梅鲁(Zermelo)、鲍罗(Borel)和冯·诺伊曼已经开始研究博弈的准确的数学表达，直到1939年，冯·诺依曼遇到经济学家奥斯卡·摩根斯特恩(Oskar Morgenstern)，并与其合作才使博弈论进入经济学的广阔领域。1944年他与奥斯卡·摩根斯特恩合著的巨作《博弈论与经济行为》出版，标志着现代系统博弈理论的的初步形成。尽管对具有博弈性质的问题的研究可以追溯到19世纪甚至更早。例如，1838年古诺(Cournot)简单双寡头垄断博弈；1883年伯特兰和1925年艾奇沃奇思研究了两个寡头的产量与价格垄断；2000多年前中国著名军事家孙武的后代孙膑利用博弈论方法帮助田忌赛马取胜等等都属于早期博弈论的萌芽，其特点是零星的，片断的研究，带有很大的偶然性，很不系统。冯·诺依曼和摩根斯特恩的《博弈论与经济行为》一书中提出的标准型、扩展型和合作型博弈模型解的概念和分析方法，奠定了这门学科的理论基础。合作型博弈在20世纪50年代达到了巅峰期。然而，诺依曼的博弈论的局限性也日益暴露出来，由于它过于抽象，使应用范围受到很大限制，在很长时间里，人们对博弈论的研究知之甚少，只是少数数学家的专利，所以，影响力很有限。正是在这个时候，非合作博弈———“纳什均衡”应运而生了，它标志着博弈论的新时代的开始！纳什不是一个按部就班的学生，他经常旷课。据他的同学们回忆，他们根本想不起来曾经什么时候和纳什一起完完整整地上过一门必修课，但纳什争辩说，至少上过斯蒂恩罗德的代数拓扑学。斯蒂恩罗德恰恰是这门学科的创立者，可是，没上几次课，纳什就认定这门课不符合他的口味。于是，又走人了。然而，纳什毕竟是一位英才天纵的非凡人物，他广泛涉猎数学王国的每一个分支，如拓扑学、代数几何学、逻辑学、博弈论等等，深深地为之着迷。纳什经常显示出他与众不同的自信和自负，充满咄咄逼人的学术野心。1950年整个夏天纳什都忙于应付紧张的考试，他的博弈论研究工作被迫中断，他感到这是莫大的浪费。殊不知这种暂时的“放弃”，使原来模糊、杂乱和无绪的若干念头，在潜意识的持续思考下，逐步形成一条清晰的脉络，突然来了灵感！这一年的10月，他骤感才思潮涌，梦笔生花。其中一个最耀眼的亮点就是日后被称之为“纳什均衡”的非合作博弈均衡的概念。纳什的主要学术贡献体现在1950年和1951年的两篇论文之中(包括一篇博士论文)。1950年他才把自己的研究成果写成题为“非合作博弈”的长篇博士论文，1950年11月刊登在美国全国科学院每月公报上，立即引起轰动。说起来这全靠师兄戴维·盖尔之功，就在遭到冯·诺依曼贬低几天之后，他遇到盖尔，告诉他自己已经将冯·诺依曼的“最小最大原理”(minimax solution)推到非合作博弈领域，找到了普遍化的方法和均衡点。盖尔听得很认真，他终于意识到纳什的思路比冯·诺伊曼的合作博弈的理论更能反映现实的情况，而对其严密优美的数学证明极为赞叹。盖尔建议他马上整理出来发表，以免被别人捷足先登。纳什这个初出茅庐的小子，根本不知道竞争的险恶，从未想过要这么做。结果还是盖尔充当了他的“经纪人”，代为起草致科学院的短信，系主任列夫谢茨则亲自将文稿递交给科学院。纳什写的文章不多，就那么几篇，但已经足够了，因为都是精品中的精品。这一点也是值得我们深思的。国内提一个教授，要求在“核心的刊物”上发表多少篇文章。按照这个标准可能纳什还不一定够资格。1996年诺贝尔经济学奖得主莫尔里斯当牛津大学艾奇沃思经济学讲座教授时也没有发表过什么文章，特殊的人才，必须有特殊的选拔办法。纳什在上大学时就开始从事纯数学的博弈论研究，1948年进入普林斯顿大学后更是如鱼得水。20岁出头已成为闻名世界的数学家。特别是在经济博弈论领域，他做出了划时代的贡献，是继冯·诺依曼之后最伟大的博弈论大师之一。他提出的著名的纳什均衡的概念在非合作博弈理论中起着核心的作用。后续的研究者对博弈论的贡献，都是建立在这一概念之上的。由于纳什均衡的提出和不断完善为博弈论广泛应用于经济学、管理学、社会学、政治学、军事科学等领域奠定了坚实的理论基础。囚犯的两难处境大理论中的小故事要了解纳什的贡献，首先要知道什么是非合作博弈问题。现在几乎所有的博弈论教科书上都会讲“囚犯的两难处境”的例子，每本书上的例子都大同小异。博弈论毕竟是数学，更确切地说是运筹学的一个分支，谈经论道自然少不了数学语言，外行人看来只是一大堆数学公式。好在博弈论关心的是日常经济生活问题，所以不能不食人间烟火。其实这一理论是从棋弈、扑克和战争等带有竞赛、对抗和决策性质的问题中借用的术语，听上去有点玄奥，实际上却具有重要现实意义。博弈论大师看经济社会问题犹如棋局，常常寓深刻道理于游戏之中。所以，多从我们的日常生活中的凡人小事入手，以我们身边的故事做例子，娓娓道来，并不乏味。话说有一天，一位富翁在家中被杀，财物被盗。警方在此案的侦破过程中，抓到两个犯罪嫌疑人，斯卡尔菲丝和那库尔斯，并从他们的住处搜出被害人家中丢失的财物。但是，他们矢口否认曾杀过人，辩称是先发现富翁被杀，然后只是顺手牵羊偷了点儿东西。于是警方将两人隔离，分别关在不同的房间进行审讯。由地方检察官分别和每个人单独谈话。检察官说，“由于你们的偷盗罪已有确凿的证据，所以可以判你们一年刑期。但是，我可以和你做个交易。如果你单独坦白杀人的罪行，我只判你三个月的监禁，但你的同伙要被判十年刑。如果你拒不坦白，而被同伙检举，那么你就将被判十年刑，他只判三个月的监禁。但是，如果你们两人都坦白交代，那么，你们都要被判5年刑。”斯卡尔菲丝和那库尔斯该怎么办呢？他们面临着两难的选择——坦白或抵赖。显然最好的策略是双方都抵赖，结果是大家都只被判一年。但是由于两人处于隔离的情况下无法串供。所以，按照亚当·斯密的理论，每一个人都是从利己的目的出发，他们选择坦白交代是最佳策略。因为坦白交代可以期望得到很短的监禁———3个月，但前提是同伙抵赖，显然要比自己抵赖要坐10年牢好。这种策略是损人利己的策略。不仅如此，坦白还有更多的好处。如果对方坦白了而自己抵赖了，那自己就得坐10年牢。太不划算了！因此，在这种情况下还是应该选择坦白交代，即使两人同时坦白，至多也只判5年，总比被判10年好吧。所以，两人合理的选择是坦白，原本对双方都有利的策略(抵赖)和结局(被判1年刑)就不会出现。这样两人都选择坦白的策略以及因此被判5年的结局被称为“纳什均衡”，也叫非合作均衡。因为，每一方在选择策略时都没有“共谋”(串供)，他们只是选择对自己最有利的策略，而不考虑社会福利或任何其他对手的利益。也就是说，这种策略组合由所有局中人(也称当事人、参与者)的最佳策略组合构成。没有人会主动改变自己的策略以便使自己获得更大利益。“囚徒的两难选择”有着广泛而深刻的意义。个人理性与集体理性的冲突，各人追求利己行为而导致的最终结局是一个“纳什均衡”，也是对所有人都不利的结局。他们两人都是在坦白与抵赖策略上首先想到自己，这样他们必然要服长的刑期。只有当他们都首先替对方着想时，或者相互合谋(串供)时，才可以得到最短时间的监禁的结果。“纳什均衡”首先对亚当·斯密的“看不见的手”的原理提出挑战。按照斯密的理论，在市场经济中，每一个人都从利己的目的出发，而最终全社会达到利他的效果。不妨让我们重温一下这位经济学圣人在《国富论》中的名言：“通过追求(个人的)自身利益，他常常会比其实际上想做的那样更有效地促进社会利益。”从“纳什均衡”我们引出了“看不见的手”的原理的一个悖论：从利己目的出发，结果损人不利己，既不利己也不利他。两个囚徒的命运就是如此。从这个意义上说，“纳什均衡”提出的悖论实际上动摇了西方经济学的基石。因此，从“纳什均衡”中我们还可以悟出一条真理：合作是有利的“利己策略”。但它必须符合以下黄金律：按照你愿意别人对你的方式来对别人，但只有他们也按同样方式行事才行。也就是中国人说的“己所不欲勿施于人”。但前提是人所不欲勿施于我。其次，“纳什均衡”是一种非合作博弈均衡，在现实中非合作的情况要比合作情况普遍。所以“纳什均衡”是对冯·诺依曼和摩根斯特恩的合作博弈理论的重大发展，甚至可以说是一场革命。从“纳什均衡”的普遍意义中我们可以深刻领悟司空见惯的经济、社会、政治、国防、管理和日常生活中的博弈现象。我们将例举出许多类似于“囚徒的两难处境”这样的例子。如价格战、军奋竞赛、污染等等。一般的博弈问题由三个要素所构成：即局中人(players)又称当事人、参与者、策略等等的集合，策略(strategies)集合以及每一对局中人所做的选择和赢得(payoffs)集合。其中所谓赢得是指如果一个特定的策略关系被选择，每一局中人所得到的效用。所有的博弈问题都会遇到这三个要素。价格战博弈：现在我们经常会遇到各种各样的家电价格大战，彩电大战、冰箱大战、空调大战、微波炉大战……这些大战的受益者首先是消费者。每当看到一种家电产品的价格大战，百姓都会“没事儿偷着乐”。在这里，我们可以解释厂家价格大战的结局也是一个“纳什均衡”，而且价格战的结果是谁都没钱赚。因为博弈双方的利润正好是零。竞争的结果是稳定的，即是一个“纳什均衡”。这个结果可能对消费者是有利的，但对厂商而言是灾难性的。所以，价格战对厂商而言意味着自杀。从这个案例中我们可以引伸出两个问题，一是竞争削价的结果或“纳什均衡”可能导致一个有效率的零利润结局。二是如果不采取价格战，作为一种敌对博弈论(vivalry game)其结果会如何呢？每一个企业，都会考虑采取正常价格策略，还是采取高价格策略形成垄断价格，并尽力获取垄断利润。如果垄断可以形成，则博弈双方的共同利润最大。这种情况就是垄断经营所做的，通常会抬高价格。另一个极端的情况是厂商用正常的价格，双方都可以获得利润。从这一点，我们又引出一条基本准则：“把你自己的战略建立在假定对手会按其最佳利益行动的基础上”。事实上，完全竞争的均衡就是“纳什均衡”或“非合作博弈均衡”。在这种状态下，每一个厂商或消费者都是按照所有的别人已定的价格来进行决策。在这种均衡中，每一企业要使利润最大化，消费者要使效用最大化，结果导致了零利润，也就是说价格等于边际成本。在完全竞争的情况下，非合作行为导致了社会所期望的经济效率状态。如果厂商采取合作行动并决定转向垄断价格，那么社会的经济效率就会遭到破坏。这就是为什么WTO和各国政府要加强反垄断的意义所在。污染博弈：假如市场经济中存在着污染，但政府并没有管制的环境，企业为了追求利润的最大化，宁愿以牺牲环境为代价，也绝不会主动增加环保设备投资。按照看不见的手的原理，所有企业都会从利己的目的出发，采取不顾环境的策略，从而进入“纳什均衡”状态。如果一个企业从利他的目的出发，投资治理污染，而其他企业仍然不顾环境污染，那么这个企业的生产成本就会增加，价格就要提高，它的产品就没有竞争力，甚至企业还要破产。这是一个“看不见的手的有效的完全竞争机制”失败的例证。直到20世纪90年代中期，中国乡镇企业的盲目发展造成严重污染的情况就是如此。只有在政府加强污染管制时，企业才会采取低污染的策略组合。企业在这种情况下，获得与高污染同样的利润，但环境将更好。贸易自由与壁垒：这个问题对于刚刚加入WTO的中国而言尤为重要。任何一个国家在国际贸易中都面临着保持贸易自由与实行贸易保护主义的两难选择。贸易自由与壁垒问题，也是一个“纳什均衡”，这个均衡是贸易双方采取不合作博弈的策略，结果使双方因贸易战受到损害。X国试图对Y国进行进口贸易限制，比如提高关税，则Y国必然会进行反击，也提高关税，结果谁也没有捞到好处。反之，如X和Y能达成合作性均衡，即从互惠互利的原则出发，双方都减少关税限制，结果大家都从贸易自由中获得了最大利益，而且全球贸易的总收益也增加了。

纳什均衡，Nash equilibrium ,又称为非合作博弈均衡，是博弈论的一个重要术语，以约翰·纳什命名。纳什均衡是一种策略组合，使得同一时间内每个参与人的策略是对其他参与人策略的最优反应。假设有n个局中人参与博弈，如果某情况下无一参与者可以独自行动而增加收益（即为了自身利益的最大化，没有任何单独的一方愿意改变其策略的[1] ），则此策略组合被称为纳什均衡。所有局中人策略构成一个策略组合（Strategy Profile）。纳什均衡，从实质上说，是一种非合作博弈状态。纳什均衡达成时，并不意味着博弈双方都处于不动的状态，在顺序博弈中这个均衡是在博弈者连续的动作与反应中达成的。纳什均衡也不意味着博弈双方达到了一个整体的最优状态，需要注意的是，只有最优策略才可以达成纳什均衡，严格劣势策略不可能成为最佳对策，而弱优势和弱劣势策略是有可能达成纳什均衡的。在一个博弈中可能有一个以上的纳什均衡，而囚徒困境中有且只有一个纳什均衡。

运筹学博弈论建模论文参考文献

博弈论（Game Theory），又称为对策论，或者赛局理论，应用数学的一个分支，是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论。目前在生物学，经济学，国际关系，计算机科学，政治学，军事战略和其他很多学科都有广泛的应用。博弈论也应用于数学的其他分支，如概率，统计和线性规划，生物学家使用博弈理论来理解和预测进化（论）的某些结果。博弈论主要研究公式化了的激励结构（游戏或者博弈）间的相互作用，是研究具有斗争或竞争性质现象的数学理论和方法，也是运筹学的一个重要学科。博弈论作为一门正式学科，博弈论是在20世纪40年代形成并发展起来的。博弈论考虑游戏中的个体的预测行为和实际行为，并研究它们的优化策略。表面上不同的相互作用可能表现出相似的激励结构（incentive structure），所以他们是同一个游戏的特例。其中一个有名有趣的应用例子是囚徒困境悖论（Prisoner's dilemma）。具有竞争或对抗性质的行为成为博弈行为。在这类行为中，参加斗争或竞争的各方各自具有不同的目标或利益。为了达到各自的目标和利益，各方必须考虑对手的各种可能的行动方案，并力图选取对自己最为有利或最为合理的方案。比如日常生活中的下棋，打牌等。博弈论就是研究博弈行为中斗争各方是否存在着最合理的行为方案，以及如何找到这个合理的行为方案的数学理论和方法。博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论。前者主要强调的是团体理性；而后者主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大，即策略选择问题，强调的是个人理性。目前经济学家谈到博弈论主要指的是非合作博弈，也就是各方在给定的约束条件下如何追求各自利益最大化，最后达到力量均衡。在这一点上，博弈论和经济学家的研究模式是完全一样的。经济学越来越转向人与人关系的研究，特别是人与人之间行为的相互影响和相互作用，人与人之间利益和冲突、竞争与合作，而这正是博弈论的研究对象。此外，博弈论以不同的所持信息又可以分为完美博弈、完全博弈和不完全博弈（贝叶斯博弈）；以博弈进行的次数或者持续长短可以分为有限博弈和无限博弈；以表现形式也可以分为一般型（战略型）或者展开型，等等。博弈论在国际贸易中的运用如：任何一个国家在国际贸易中都面临着保持贸易自由与实行贸易保护主义的两难选择。贸易自由与壁垒问题，也是一个“纳什均衡”，这个均衡是贸易双方采取不合作博弈的策略，结果使双方因贸易战受到损害。X国试图对Y国进行进口贸易限制，比如提高关税，则Y国必然会进行反击，也提高关税，结果谁也没有捞到好处。反之，如X和Y能达成合作性均衡，即从互惠互利的原则出发，双方都减少关税限制，结果大家都从贸易自由中获得了最大利益，而且全球贸易的总收益也增加了。当代博弈论的主要理论家有：约翰·福布斯·纳什（John Forbes Nash Jr）、约翰·C·海萨尼、莱因哈德·泽尔腾，他们3人因对博弈论的突出贡献而同时获得1994年的瑞典银行经济学奖）；罗伯特·奥曼（Robert J. Aumann）、美国人托马斯·谢林（Thomas C. Schelling）他们2人获得2005年诺贝尔经济学奖；以及肯·宾摩尔、戴维·克瑞普斯，阿里尔·鲁宾斯坦等。

论文引用参考文献格式范例有篇一、篇二、篇三。

1、篇一。

期刊作者。题名。刊名，出版年，卷（期）：起止页码。专著作者。书名。版本（第一版不著录）。出版地∶出版者，出版年∶起止页码。论文集作者。题名。编者。论文集名，出版地∶出版者，出版年∶起止页码。学位论文作者。题名。保存地点。保存单位。年份。专利文献题名。国别。专利文献种类。专利号。出版日期。标准编号。标准名称。报纸作者。

题名。报纸名。出版日期（版次）。报告作者。题名。保存地点。年份。电子文献作者。题名电子文献及载体类型标识。文献出处，日期。

2、篇二。

对于非纸张型载体的电子文献，当被引用为参考文献时需在参考文献类型标识中同时标明其载体类型。本规范建议采用双字母表示电子文献载体类型：磁带（magnetictape）MT，磁盘（disk）DK，光盘（CD-ROM）CD，联机网络（online）OL，并以下列格式表示包括了文献载体类型的参考文献类型标识。

3、篇三。

刘国钧，陈绍业，王涛，等。图书馆目录。北京: 高等教育出版社， 1957. 15-18 。辛西。信息技术与信息服务国际研讨会论文集：A集。北京：中国社会出版社，1994。钟文发。非线性规划在可燃毒物配置中的应用。赵玮。运筹学的理论与应用--中国运筹学会第五届大会论文集。

西安：西安电子科技大学出版社，。张筑生。微分半动力系统的不变集。北京：北京大学数学所，1983。冯西桥。LBB分析。北京: 清华大学核能技术设计院，1997。石柱，何新贵。优序法在软件评价中的应用。

博弈论是指某个个人或是组织，面对一定的环境条件，在一定的规则约束下，依靠所掌握的信息，从各自选择的行为或是策略进行选择并加以实施，并从各自取得相应结果或收益的过程，在经济学上博奕论是个非常重要的理论概念。什么是博弈论？古语有云，世事如棋。生活中每个人如同棋手，其每一个行为如同在一张看不见的棋盘上布一个子，精明慎重的棋手们相互揣摩、相互牵制，人人争赢，下出诸多精彩纷呈、变化多端的棋局。博弈论是研究棋手们 “出棋” 着数中理性化、逻辑化的部分，并将其系统化为一门科学。换句话说，就是研究个体如何在错综复杂的相互影响中得出最合理的策略。事实上，博弈论正是衍生于古老的游戏或曰博弈如象棋、扑克等。数学家们将具体的问题抽象化，通过建立自完备的逻辑框架、体系研究其规律及变化。这可不是件容易的事情，以最简单的二人对弈为例，稍想一下便知此中大有玄妙：若假设双方都精确地记得自己和对手的每一步棋且都是最“理性” 的棋手，甲出子的时候，为了赢棋，得仔细考虑乙的想法，而乙出子时也得考虑甲的想法，所以甲还得想到乙在想他的想法，乙当然也知道甲想到了他在想甲的想法… 面对如许重重迷雾，博弈论怎样着手分析解决问题，怎样对作为现实归纳的抽象数学问题求出最优解、从而为在理论上指导实践提供可能性呢？现代博弈理论由匈牙利大数学家冯·诺伊曼于20世纪20年代开始创立，1944年他与经济学家奥斯卡·摩根斯特恩合作出版的巨著《博弈论与经济行为》，标志着现代系统博弈理论的初步形成。对于非合作、纯竞争型博弈，诺伊曼所解决的只有二人零和博弈--好比两个人下棋、或是打乒乓球，一个人赢一着则另一个人必输一着，净获利为零。在这里抽象化后的博弈问题是，已知参与者集合(两方) ，策略集合(所有棋着) ，和盈利集合(赢子输子) ，能否且如何找到一个理论上的“解” 或“平衡” ，也就是对参与双方来说都最“合理” 、最优的具体策略？怎样才是“合理” ？应用传统决定论中的“最小最大” 准则，即博弈的每一方都假设对方的所有功略的根本目的是使自己最大程度地失利，并据此最优化自己的对策，诺伊曼从数学上证明，通过一定的线性运算，对於每一个二人零和博弈，都能够找到一个“最小最大解” 。通过一定的线性运算，竞争双方以概率分布的形式随机使用某套最优策略中的各个步骤，就可以最终达到彼此盈利最大且相当。当然，其隐含的意义在於，这套最优策略并不依赖于对手在博弈中的操作。用通俗的话说，这个著名的最小最大定理所体现的基本“理性” 思想是“抱最好的希望，做最坏的打算” 。 2.在经济学中，“智*博弈”（Pigs’payoffs）是一个著名博弈论例子。这个例子讲的是：*圈里有两头*，一头大*，一头小*。*圈的一边有个踏板，每踩一下踏板，在远离踏板的*圈的另一边的投食口就会落下少量的食物。如果有一只*去踩踏板，另一只*就有机会抢先吃到另一边落下的食物。当小*踩动踏板时，大*会在小*跑到食槽之前刚好吃光所有的食物；若是大*踩动了踏板，则还有机会在小*吃完落下的食物之前跑到食槽，争吃到另一半残羹。那么，两只*各会采取什么策略？答案是：小*将选择“搭便车”策略，也就是舒舒服服地等在食槽边；而大*则为一点残羹不知疲倦地奔忙于踏板和食槽之间。原因何在？因为，小*踩踏板将一无所获，不踩踏板反而能吃上食物。对小*而言，无论大*是否踩动踏板，不踩踏板总是好的选择。反观大*，已明知小*是不会去踩动踏板的，自己亲自去踩踏板总比不踩强吧，所以只好亲力亲为了。 “小*躺着大*跑”的现象是由于故事中的游戏规则所导致的。规则的核心指标是：每次落下的事物数量和踏板与投食口之间的距离。如果改变一下核心指标，*圈里还会出现同样的“小*躺着大*跑”的景象吗？试试看。改变方案一：减量方案。投食仅原来的一半分量。结果是小*大*都不去踩踏板了。小*去踩，大*将会把食物吃完；大*去踩，小*将也会把食物吃完。谁去踩踏板，就意味着为对方贡献食物，所以谁也不会有踩踏板的动力了。如果目的是想让*们去多踩踏板，这个游戏规则的设计显然是失败的。改变方案二：增量方案。投食为原来的一倍分量。结果是小*、大*都会去踩踏板。谁想吃，谁就会去踩踏板。反正对方不会一次把食物吃完。小*和大*相当于生活在物质相对丰富的“共产主义”社会，所以竞争意识却不会很强。对于游戏规则的设计者来说，这个规则的成本相当高（每次提供双份的食物）；而且因为竞争不强烈，想让*们去多踩踏板的效果并不好。改变方案三：减量加移位方案。投食仅原来的一半分量，但同时将投食口移到踏板附近。结果呢，小*和大*都在拼命地抢着踩踏板。等待者不得食，而多劳者多得。每次的收获刚好消费完。对于游戏设计者，这是一个最好的方案。成本不高，但收获最大。原版的“智*博弈”故事给了竞争中的弱者（小*）以等待为最佳策略的启发。但是对于社会而言，因为小*未能参与竞争，小*搭便车时的社会资源配置的并不是最佳状态。为使资源最有效配置，规则的设计者是不愿看见有人搭便车的，政府如此，公司的老板也是如此。而能否完全杜绝“搭便车”现象，就要看游戏规则的核心指标设置是否合适了。比如，公司的激励制度设计，奖励力度太大，又是持股，又是期权，公司职员个个都成了百万富翁，成本高不说，员工的积极性并不一定很高。这相当于“智*博弈” 增量方案所描述的情形。但是如果奖励力度不大，而且见者有份（不劳动的“小*”也有），一度十分努力的大*也不会有动力了----就象“智*博弈”减量方案一所描述的情形。最好的激励机制设计就象改变方案三----减量加移位的办法，奖励并非人人有份，而是直接针对个人（如业务按比例提成），既节约了成本（对公司而言），又消除了“搭便车”现象，能实现有效的激励。许多人并未读过“智*博弈”的故事，但是却在自觉地使用小*的策略。股市上等待庄家抬轿的散户；等待产业市场中出现具有赢利能力新产品、继而大举仿制牟取暴利的游资；公司里不创造效益但分享成果的人，等等。因此，对于制订各种经济管理的游戏规则的人，必须深谙“智*博弈”指标改变的个中道理。 3.背景知识：纳什博弈论的原理与应用 2002年03月21日17:44 北京晚报1950年和1951年纳什的两篇关于非合作博弈论的重要论文，彻底改变了人们对竞争和市场的看法。他证明了非合作博弈及其均衡解，并证明了均衡解的存在性，即著名的纳什均衡。从而揭示了博弈均衡与经济均衡的内在联系。纳什的研究奠定了现代非合作博弈论的基石，后来的博弈论研究基本上都沿着这条主线展开的。然而，纳什天才的发现却遭到冯·诺依曼的断然否定，在此之前他还受到爱因斯坦的冷遇。但是骨子里挑战权威、藐视权威的本性，使纳什坚持了自己的观点，终成一代大师。要不是30多年的严重精神病折磨，恐怕他早已站在诺贝尔奖的领奖台上了，而且也绝不会与其他人分享这一殊荣。纳什是一个非常天才的数学家，他的主要贡献是1950至1951年在普林斯顿读博士学位时做出的。然而，他的天才发现———非合作博弈的均衡，即“纳什均衡”并不是一帆风顺的。 1948年纳什到普林斯顿大学读数学系的博士。那一年他还不到20岁。当时普林斯顿可谓人杰地灵，大师如云。爱因斯坦、冯·诺依曼、列夫谢茨(数学系主任)、阿尔伯特·塔克、阿伦佐·切奇、哈罗德·库恩、诺尔曼·斯蒂恩罗德、埃尔夫·福克斯……等全都在这里。博弈论主要是由冯·诺依曼(1903—1957)创所立的。他是一位出生于匈牙利的天才的数学家。他不仅创立了经济博弈论，而且发明了计算机。早在20世纪初，塞梅鲁(Zermelo)、鲍罗(Borel)和冯·诺伊曼已经开始研究博弈的准确的数学表达，直到1939年，冯·诺依曼遇到经济学家奥斯卡·摩根斯特恩(Oskar Morgenstern)，并与其合作才使博弈论进入经济学的广阔领域。 1944年他与奥斯卡·摩根斯特恩合著的巨作《博弈论与经济行为》出版，标志着现代系统博弈理论的的初步形成。尽管对具有博弈性质的问题的研究可以追溯到19世纪甚至更早。例如，1838年古诺(Cournot)简单双寡头垄断博弈；1883年伯特兰和1925年艾奇沃奇思研究了两个寡头的产量与价格垄断；2000多年前中国著名军事家孙武的后代孙膑利用博弈论方法帮助田忌赛马取胜等等都属于早期博弈论的萌芽，其特点是零星的，片断的研究，带有很大的偶然性，很不系统。冯·诺依曼和摩根斯特恩的《博弈论与经济行为》一书中提出的标准型、扩展型和合作型博弈模型解的概念和分析方法，奠定了这门学科的理论基础。合作型博弈在20世纪50年代达到了巅峰期。然而，诺依曼的博弈论的局限性也日益暴露出来，由于它过于抽象，使应用范围受到很大限制，在很长时间里，人们对博弈论的研究知之甚少，只是少数数学家的专利，所以，影响力很有限。正是在这个时候，非合作博弈———“纳什均衡”应运而生了，它标志着博弈论的新时代的开始！纳什不是一个按部就班的学生，他经常旷课。据他的同学们回忆，他们根本想不起来曾经什么时候和纳什一起完完整整地上过一门必修课，但纳什争辩说，至少上过斯蒂恩罗德的代数拓扑学。斯蒂恩罗德恰恰是这门学科的创立者，可是，没上几次课，纳什就认定这门课不符合他的口味。于是，又走人了。然而，纳什毕竟是一位英才天纵的非凡人物，他广泛涉猎数学王国的每一个分支，如拓扑学、代数几何学、逻辑学、博弈论等等，深深地为之着迷。纳什经常显示出他与众不同的自信和自负，充满咄咄逼人的学术野心。1950年整个夏天纳什都忙于应付紧张的考试，他的博弈论研究工作被迫中断，他感到这是莫大的浪费。殊不知这种暂时的“放弃”，使原来模糊、杂乱和无绪的若干念头，在潜意识的持续思考下，逐步形成一条清晰的脉络，突然来了灵感！这一年的10月，他骤感才思潮涌，梦笔生花。其中一个最耀眼的亮点就是日后被称之为“纳什均衡”的非合作博弈均衡的概念。纳什的主要学术贡献体现在1950年和1951年的两篇论文之中(包括一篇博士论文)。1950年他才把自己的研究成果写成题为“非合作博弈”的长篇博士论文，1950年11月刊登在美国全国科学院每月公报上，立即引起轰动。说起来这全靠师兄戴维·盖尔之功，就在遭到冯·诺依曼贬低几天之后，他遇到盖尔，告诉他自己已经将冯·诺依曼的“最小最大原理”(minimax solution)推到非合作博弈领域，找到了普遍化的方法和均衡点。盖尔听得很认真，他终于意识到纳什的思路比冯·诺伊曼的合作博弈的理论更能反映现实的情况，而对其严密优美的数学证明极为赞叹。盖尔建议他马上整理出来发表，以免被别人捷足先登。纳什这个初出茅庐的小子，根本不知道竞争的险恶，从未想过要这么做。结果还是盖尔充当了他的“经纪人”，代为起草致科学院的短信，系主任列夫谢茨则亲自将文稿递交给科学院。纳什写的文章不多，就那么几篇，但已经足够了，因为都是精品中的精品。这一点也是值得我们深思的。国内提一个教授，要求在“核心的刊物”上发表多少篇文章。按照这个标准可能纳什还不一定够资格。 1996年诺贝尔经济学奖得主莫尔里斯当牛津大学艾奇沃思经济学讲座教授时也没有发表过什么文章，特殊的人才，必须有特殊的选拔办法。纳什在上大学时就开始从事纯数学的博弈论研究，1948年进入普林斯顿大学后更是如鱼得水。20岁出头已成为闻名世界的数学家。特别是在经济博弈论领域，他做出了划时代的贡献，是继冯·诺依曼之后最伟大的博弈论大师之一。他提出的著名的纳什均衡的概念在非合作博弈理论中起着核心的作用。后续的研究者对博弈论的贡献，都是建立在这一概念之上的。由于纳什均衡的提出和不断完善为博弈论广泛应用于经济学、管理学、社会学、政治学、军事科学等领域奠定了坚实的理论基础。囚犯的两难处境大理论中的小故事要了解纳什的贡献，首先要知道什么是非合作博弈问题。现在几乎所有的博弈论教科书上都会讲“囚犯的两难处境”的例子，每本书上的例子都大同小异。博弈论毕竟是数学，更确切地说是运筹学的一个分支，谈经论道自然少不了数学语言，外行人看来只是一大堆数学公式。好在博弈论关心的是日常经济生活问题，所以不能不食人间烟火。其实这一理论是从棋弈、扑克和战争等带有竞赛、对抗和决策性质的问题中借用的术语，听上去有点玄奥，实际上却具有重要现实意义。博弈论大师看经济社会问题犹如棋局，常常寓深刻道理于游戏之中。所以，多从我们的日常生活中的凡人小事入手，以我们身边的故事做例子，娓娓道来，并不乏味。话说有一天，一位富翁在家中被杀，财物被盗。警方在此案的侦破过程中，抓到两个犯罪嫌疑人，斯卡尔菲丝和那库尔斯，并从他们的住处搜出被害人家中丢失的财物。但是，他们矢口否认曾杀过人，辩称是先发现富翁被杀，然后只是顺手牵羊偷了点儿东西。于是警方将两人隔离，分别关在不同的房间进行审讯。由地方检察官分别和每个人单独谈话。检察官说，“由于你们的偷盗罪已有确凿的证据，所以可以判你们一年刑期。但是，我可以和你做个交易。如果你单独坦白杀人的罪行，我只判你三个月的监禁，但你的同伙要被判十年刑。如果你拒不坦白，而被同伙检举，那么你就将被判十年刑，他只判三个月的监禁。但是，如果你们两人都坦白交代，那么，你们都要被判5年刑。”斯卡尔菲丝和那库尔斯该怎么办呢？他们面临着两难的选择——坦白或抵赖。显然最好的策略是双方都抵赖，结果是大家都只被判一年。但是由于两人处于隔离的情况下无法串供。所以，按照亚当·斯密的理论，每一个人都是从利己的目的出发，他们选择坦白交代是最佳策略。因为坦白交代可以期望得到很短的监禁———3个月，但前提是同伙抵赖，显然要比自己抵赖要坐10年牢好。这种策略是损人利己的策略。不仅如此，坦白还有更多的好处。如果对方坦白了而自己抵赖了，那自己就得坐10年牢。太不划算了！因此，在这种情况下还是应该选择坦白交代，即使两人同时坦白，至多也只判5年，总比被判10年好吧。所以，两人合理的选择是坦白，原本对双方都有利的策略(抵赖)和结局(被判1年刑)就不会出现。这样两人都选择坦白的策略以及因此被判5年的结局被称为“纳什均衡”，也叫非合作均衡。因为，每一方在选择策略时都没有“共谋”(串供)，他们只是选择对自己最有利的策略，而不考虑社会福利或任何其他对手的利益。也就是说，这种策略组合由所有局中人(也称当事人、参与者)的最佳策略组合构成。没有人会主动改变自己的策略以便使自己获得更大利益。“囚徒的两难选择”有着广泛而深刻的意义。个人理性与集体理性的冲突，各人追求利己行为而导致的最终结局是一个“纳什均衡”，也是对所有人都不利的结局。他们两人都是在坦白与抵赖策略上首先想到自己，这样他们必然要服长的刑期。只有当他们都首先替对方着想时，或者相互合谋(串供)时，才可以得到最短时间的监禁的结果。“纳什均衡”首先对亚当·斯密的“看不见的手”的原理提出挑战。按照斯密的理论，在市场经济中，每一个人都从利己的目的出发，而最终全社会达到利他的效果。不妨让我们重温一下这位经济学圣人在《国富论》中的名言：“通过追求(个人的)自身利益，他常常会比其实际上想做的那样更有效地促进社会利益。”从“纳什均衡”我们引出了“看不见的手”的原理的一个悖论：从利己目的出发，结果损人不利己，既不利己也不利他。两个囚徒的命运就是如此。从这个意义上说，“纳什均衡”提出的悖论实际上动摇了西方经济学的基石。因此，从“纳什均衡”中我们还可以悟出一条真理：合作是有利的“利己策略”。但它必须符合以下黄金律：按照你愿意别人对你的方式来对别人，但只有他们也按同样方式行事才行。也就是中国人说的“己所不欲勿施于人”。但前提是人所不欲勿施于我。其次，“纳什均衡”是一种非合作博弈均衡，在现实中非合作的情况要比合作情况普遍。所以“纳什均衡”是对冯·诺依曼和摩根斯特恩的合作博弈理论的重大发展，甚至可以说是一场革命。从“纳什均衡”的普遍意义中我们可以深刻领悟司空见惯的经济、社会、政治、国防、管理和日常生活中的博弈现象。我们将例举出许多类似于“囚徒的两难处境”这样的例子。如价格战、军奋竞赛、污染等等。一般的博弈问题由三个要素所构成：即局中人(players)又称当事人、参与者、策略等等的集合，策略(strategies)集合以及每一对局中人所做的选择和赢得(payoffs)集合。其中所谓赢得是指如果一个特定的策略关系被选择，每一局中人所得到的效用。所有的博弈问题都会遇到这三个要素。价格战博弈：现在我们经常会遇到各种各样的家电价格大战，彩电大战、冰箱大战、空调大战、微波炉大战……这些大战的受益者首先是消费者。每当看到一种家电产品的价格大战，百姓都会“没事儿偷着乐”。在这里，我们可以解释厂家价格大战的结局也是一个“纳什均衡”，而且价格战的结果是谁都没钱赚。因为博弈双方的利润正好是零。竞争的结果是稳定的，即是一个“纳什均衡”。这个结果可能对消费者是有利的，但对厂商而言是灾难性的。所以，价格战对厂商而言意味着自杀。从这个案例中我们可以引伸出两个问题，一是竞争削价的结果或“纳什均衡”可能导致一个有效率的零利润结局。二是如果不采取价格战，作为一种敌对博弈论(vivalry game)其结果会如何呢？每一个企业，都会考虑采取正常价格策略，还是采取高价格策略形成垄断价格，并尽力获取垄断利润。如果垄断可以形成，则博弈双方的共同利润最大。这种情况就是垄断经营所做的，通常会抬高价格。另一个极端的情况是厂商用正常的价格，双方都可以获得利润。从这一点，我们又引出一条基本准则：“把你自己的战略建立在假定对手会按其最佳利益行动的基础上”。事实上，完全竞争的均衡就是“纳什均衡”或“非合作博弈均衡”。在这种状态下，每一个厂商或消费者都是按照所有的别人已定的价格来进行决策。在这种均衡中，每一企业要使利润最大化，消费者要使效用最大化，结果导致了零利润，也就是说价格等于边际成本。在完全竞争的情况下，非合作行为导致了社会所期望的经济效率状态。如果厂商采取合作行动并决定转向垄断价格，那么社会的经济效率就会遭到破坏。这就是为什么WTO和各国政府要加强反垄断的意义所在。污染博弈：假如市场经济中存在着污染，但政府并没有管制的环境，企业为了追求利润的最大化，宁愿以牺牲环境为代价，也绝不会主动增加环保设备投资。按照看不见的手的原理，所有企业都会从利己的目的出发，采取不顾环境的策略，从而进入“纳什均衡”状态。如果一个企业从利他的目的出发，投资治理污染，而其他企业仍然不顾环境污染，那么这个企业的生产成本就会增加，价格就要提高，它的产品就没有竞争力，甚至企业还要破产。这是一个“看不见的手的有效的完全竞争机制”失败的例证。直到20世纪90年代中期，中国乡镇企业的盲目发展造成严重污染的情况就是如此。只有在政府加强污染管制时，企业才会采取低污染的策略组合。企业在这种情况下，获得与高污染同样的利润，但环境将更好。谢谢采纳

你可以上网搜索《博弈圣经》摘自《博弈圣经》第三版后记《博弈圣经》曹• 国正著新加坡希望出版社《博弈圣经》新加坡第三版后记博弈文化盛宴曹•国正精神是虚无的，没有个性，在浮浅无知的层面上自我构成，以绝妙的组合与大自然的节奏和谐。感觉、思维是生理、心理能量的原始开端，从无到有的状态在影子和气息之间进行着灵魂的运动，这个抽象、混沌的体系不可能找到，这是构成文化的初级阶段。文化只有进程，没有核心，是虚无的精神谎言，但又分裂成大小不同的两块。文化进程里恩怨游戏的终结就是文明。文明的永恒、普适、唯一性就是科学。文化进程的创新战略结构就是国正论○2里的非绝对对立性。战略是寻找连续正理○17、科学的文明实体。战术是达成局部真理、文明的文化性质。一个人懂得了文化进程，就走进了产生智慧、文明、科学的发源地。人类在文化进程中，通过自由的激情，在真理之前不可能达到完整性，因为包含了错误行为的那一部分，任何人从未彻底解决这一矛盾。每一个人都有权让自己变得愚蠢，有权犯错，寻找自我，确证自我的存在。人是一个神秘的怪物，每时每刻都在矛盾的对立中期待着什么，一旦有了机会，便信口开河地胡说，想创造独有的理论，看似有着健全的理智，其实搀进了主观无知的闹剧成分，异想天开，任意发挥，荒谬之极，根本不知道什么是真理、文化、文明、科学、哲学，只是想证明自己，却忽略了正在表现的正是一个低级文化的残缺过程。人们并没有多少文化，只是简单地对名词的吼叫。文化的无知逐渐神话，与听众的无知共同走到一起，无知的结合赋予了文化进程的和谐，接受未来与过去共同的命运。在非理性的文化过程中，遗留下来的文化因素是复活的文化个性，能对文化人格进行区分。文化是一个进程，伟大的文化价值在进程的中间。文化不是实现，而是象征，最终以物理世界的存在达到文明。文明是现实主义。大部分人对文化的中间属性持怀疑态度，人们在非物质文化中表现出的正常精神或精神疾病都来源于文化虚无主义。虽然文化价值遭到了不同程度的毁灭，任何真实存在的文明还都是通过文化来实现，一次次的文化变成现实，都是精神与物理世界的博弈，也是大自然的一次次呼吸，以国正论○2相对性的结构永存并进行传递。人是客观世界的秩序，看到的都是生物行为表现出的国正○24相对性中极少的那一部分，感觉到的处处都是相互对立的混沌世界，因此人们会感到恐惧。不难想象，就连恐惧也是两种存在，人们会在恐惧中不满足现实的表现，沉迷在另一个世界，并默默地酝酿着创造。人类在文化进程中，像信徒走进教堂，像管理者走进办公室，像运动员走进赛场，都是进入了一个文化世界，使精神在进程中不朽地演化，一切文化要素在这里给相对性的国正○24大小进行区分，用自己认为宝贵的东西来创造激情，再进行有价值地混合。所有的灵魂都没有自律的文化价值，人们就是在这个文化的哲学中相互混淆，然后再不同的分裂，不同的对立，所有的人类在文化进程探索中都变成了文化人，在内在的张力中用文化哲学进行着创作。我们把文化中借助国正论○2的语文学反映，定义为哲学。人们用哲学认识未来。在文化进程的路上，一个人一生都在寻找精神中的那一半，不如说是寻找精神期盼中的机会，每时每刻都被困扰着，一会儿反复、徘徊，一会儿迷茫、诱惑。我把识别万物实体与性质的是与不是，定义为知识。知识在思想内部接受各种因素的抽象惩罚之后，才会变动一步。每一次变动都是一次博弈（相当于人与赌场的一次博弈），都会得出一个结果。生物亲序○8的本性在彻头彻尾的矛盾中认识到国正论○2相对性是基本常理，当站在实体背景与人形成对立时，实体一方便以博弈世界固有的法则作为战略，包括国家战略、军事战略、经济战略、企业战略等。只有首先洞察战略的定义和战略里的文化结构，才能真正站在大自然的文明实体一边，才能精准地掌握战术者的行为，战略和战术的博弈结构影响着人类的文化、文明和科学，对立的文化属性使人走向单一轨道，实现自我肯定。但在正常的人群当中，绝对有一半或一大半的人属于精神病患者，听起来是骇人听闻，其实这是大自然的博弈实体○9结构。以往的战略家只知道站在文明实体这一边会占优，但并不知道为什么。其实，战略是赌场，战术是赌客；单位是赌场，员工是赌客；自然是赌场，人类就是赌客。任何利用文明实体威力狂妄地表现出权力、金钱优势的人，一旦离开文明实体独立存在成为赌客时，立刻会表现出渺小而不堪一击。那些不可抗拒的灾难也都是人与自然对抗的失利案例。相对性的国正论○2是连着两个世界的桥梁，它中间的第三空地象征着一个可创新的美丽世界，是深刻现实的艺术中心，那里表现出最深刻的精神现实，就是创造博弈结构的无限可能。一切创新突破都介入了人与世界的相际关系，一切创造都是博弈的结果。人与自然、人与背景、人与社会相当于人与赌场的二特性实体结构。不要幻想将已发生过的事件进行回放，特别是公安、侦查、侦探，一直想把不可逆的事件变成可逆，将历史过程再次重现。目前，人们只是在文化进程中用简单的推理来寻找证据，或在从文明再返回到文化进程中的简单逻辑里反反复复，并没有准确给侦察定义。博弈的结果证明：事件可逆、让事实重现都是违反了大自然的法则，应该从战略和战术的横向对局的第三空地里产生博弈的混合、排序、定性，才可能有所发现。人们利用战略中的六种命题，解释战术中的六种形式，追问是与不是，给战术者的创造行为定性，让文化进程形成一个闭环，从而让战术者优先找到那唯一证据。如果优先确定罪犯是战略特性还是战术特性，就可以确定罪犯的层次，也可以搏猎○23出领袖和士兵的文化等级。公安侦查、检察侦查在侦查一个罪犯时，就像一个赌客，先定性生物特性行为找到输的原因，再确定输的事实。战略的定义范式是检验国家战略、军事战略、经济战略、企业战略的模块，这是领导人博弈对抗战胜对手的六法则，可以检验出战略策略的缺陷，也可以检验战略家的能力，罪犯创造的罪恶只包含在战术中。战略的特征是发现智谋的纲领，战术的特征是创造实在的行为。人是自然界的个别现象，不是宇宙的高级现象。人是微观世界的中心，贫民无知的追星现象都围绕着他疯狂地旋转，这股旋转的动力，从人们的本性深处腾起，像火山岩浆似的，从文化进程的空渊中喷出。人类的身上隐藏着世界生活之谜，生物行为的问题是精神问题，从文化运动中对好与坏，经过自我的内在分配并自豪的定型之后展现出来，才能得到解释。最具欺性的游戏并不是娱乐场，股票的上市是将一些破铜烂铁、有形的、无形的、虚无的，虚拟一个资本的框架，并得到政府和国家货币组织的批准，形成一个博弈战略的大股市潘多拉。一旦上市开盒，一个卖家，无数的买家，形成博弈对局，生物特性的蚁团行为一旦转移并开始了相互博币○41运动，就不容易停息。其实，几个幸运的股东早已变现逃之夭夭。人的行为结构里没有理性，世界就是用国正○24相对性这种博弈的形式运动。国正论○2的非绝对对立性没有理性，是一种观念，就像承认股市是赌场，但却在经济学里被合法、被默认，托马斯•谢林也是这个观点。道德与博弈的共存一元论是经济学里的默认定律○89。优先预测悲剧后作出的忍让是道德。优先预测胜利前作出的竞争是博弈。竞争与忍让基本对立，博弈与道德基本对立。赢在博弈，就缺失道德；赢得道德，就缺少博弈。领导人的行为一半是道德，一半是博弈。博弈是决策优先，道德是对抗默认。超智慧的领导人知道多少忍让，又何时竞争。他们总是寻找战略主题，制定规则，让他人竞赛。理性是说教，道德是展现。有多少人，就有多少道德途径，都是为了绝对的自信进行国正论○2的大小之争。道德与自信没有法纪，是第三空地里游荡的个人意志，那里的灵魂正将演变成智慧，它不是生也不是死，而是新文明的创生。其实人类的文化进程无穷无尽，无终无果。我们把文化进程中被瘾魂○88驱动的欲望抛弃了自我之后，自由给予的真、善、美，定义为爱。爱是精神文化过程，真、善、美表现出的高尚感，在瘾魂○88的作用下，它会俘获，也会出现极小极大地自由跟随，暂时的信任就变成了全部意义。信任并自由地给予和欲意的收入，定义为幸福。人们提倡的浪漫与自由，是动物的本能特性。一个人和多少异性对局，就有多少个行为印象，男女之间对这种印象行动称为感情。感情是依赖，是瘾魂○88驱动欲望过程中的殷勤创作。感情是精神疫情，发作时使人疯癫成为怪物，这种怪物行为的畸变反而成了鲜活浪漫的感情作品，不然会导致淫乱、婚变、家庭悲剧、自杀、情杀、道德和法制压力。爱的文化进程就是博弈，它的结果是情，爱与情是一个象物又象魂的物势影像○48，我定义为爱情。所以，谁也说不清人的一生在寻找什么，最终好像在寻找一种废物。人们急于寻找爱的真理，真理是一个观念在个别情况下判断中现时的体验。真理不计后果，只表现出暂时的意义。一个个局部真理属性的连续性，构成了真理的永恒特征。它不容忍假设，更不允许与谎言并存，因为真理的下一站就是物理世界的证据，那是文明的所在地。文化的魅力来自智慧的偏见和野蛮，偶然性个案才能进入神秘的创新，当然也会引起争议，我们知道完整和分裂都是世界的面貌。文化的成型到鲜艳、炫耀、敏锐、透彻，才能表现出智慧的辩证和深邃。智慧就是文化进程中独创的执行力。大自然用时间创造了文化的次序，人类根据大自然双重性和第三空地的优雅产生了博弈智慧的深度。这里引入战略和战术不同时空特性，战略和战术的对局或许可以给侦察定义。这里也是战略和战术的博弈，战术者（赌客）只懂得文化性质，战略家（赌场）还懂得文明实体。文化是一个进程，一个按时间可分的精神演变进程。感觉、思维、意识、观念、主观、理性、真理，这是文化进程。感觉、思维、意识、观念、主观、理性、真理、证据，这是文明进程。感觉、思维、意识、观念、主观、理性、真理、证据、科学，这是科学进程。文化诞生于谎言，文化又是虚无主义，只有文化才有万能的理性产生当代文明。文化来源于各种各样组织教育机构，来源于不同的格式和理解万事万物非绝对对立的意识态度，用哲学分化的倾向，用崇拜信奉的自由，带有部分痴化的偏见并给以肯定。文化就是去掉完整性，区分出是与不是才能在文化进程中完成探索、发现、发明。理性是真理的灵魂，真理是文明的胚胎，文明是科学的丰碑。文明的创新一定要战胜他人，保持和自然宇宙的一切和谐才能走向科学，科学用它的永恒、普适、唯一的三大不变属性，作为检验万事万物的准则，度量人的非物质文化行为博弈价值，也度量着有形的物理世界。CSDN下载地址：

运筹学学报

1.数学学报 2.数学年刊.A辑 3.应用数学学报 4.计算数学 5.数学进展 6.数学研究与评论 7.系统科学与数学 8.数学物理学报 9.应用概率统计 10.工程数学学报 11.应用数学 12.数学杂志 13.高校应用数学学报.A辑 14.模糊系统与数学 15.高等学校计算数学学报 16.数学季刊 17.工科数学（改名为：大学数学） 18.数学的实践与认识 19.纯粹数学与应用数学 20.运筹学学报 21.数学教育学报都是忙着发论文的人啊～～

我国数学类的核心刊物主要有：1 数学学报2 数学研究与评论 3 数学年刊4 应用数学学报 5 计算数学 6 数学进展 7 数学杂志8 系统科学与数学 9 应用数学 10 应用概率统计 11 高等学校计算数学学报 12 高校应用数学学报 13 系统工程理论与实践 14 数学的实践与认识 15 数学物理学报 16 数理统计与应用概率 17 运筹学学报 18 工程数学学报 19 系统工程

运筹学学报是数学类核心刊物。

1 数学学报北京北京科学院数学研究所 2 数学研究与评论大连大连理工大学数学科学研究所3 数学年刊.A辑上海复旦大学数学研究所4 应用数学学报北京中国数学会5 计算数学北京中国科学院计算中心6 数学进展北京中国数学会7 数学杂志武汉湖北省数学学会等8 系统科学与数学北京中国科学院系统科学研究所9 应用数学武汉华中理工大学10 应用概率统计上海中国数学会概率统计学会11 高等学校计算数学学报南京南京大学数学系 12 高校应用数学学报杭州浙江大学13 系统工程理论与实践北京中国系统工程学会14 数学的实践与认识北京北京大学数学科学学院15 数学物理学报武汉中国科学院武汉数学物理研究所16 数理统计与应用概率长沙北京工业大学应用数学系等17 运筹学学报上海中国运筹学会18 工程数学学报西安西安交通大学19 系统工程长沙湖南省系统工程学会

运筹学论文

在中国战国时期，曾经有过一次流传后世的赛马比赛，相信大家都知道，这就是田忌赛马。田忌赛马的故事说明在已有的条件下，经过筹划，选择一个最好的方案，就会取得最好的效果。可见，筹划是十分重要的。现在普遍认为，运筹学是近代应用数学的一个分支，主要是将生产、管理等事件中出现的一些带有普遍性的运筹问题加以提炼，然后利用数学方法进行解决。前者提供模型，后者提供理论和方法。运筹学的思想在古代就已经产生了。敌我双方交战，要克敌制胜就要在了解双方情况的基础上，做出最优的对付敌人的方法，这就是“运筹帷幄之中，决胜千里之外”的说法。但是作为一门数学学科，用纯数学的方法来解决最优方法的选择安排，却是晚多了。也可以说，运筹学是在二十世纪四十年代才开始兴起的一门分支。运筹学主要研究经济活动和军事活动中能用数量来表达的有关策划、管理方面的问题。当然，随着客观实际的发展，运筹学的许多内容不但研究经济和军事活动，有些已经深入到日常生活当中去了。运筹学可以根据问题的要求，通过数学上的分析、运算，得出各种各样的结果，最后提出综合性的合理安排，已达到最好的效果。运筹学作为一门用来解决实际问题的学科，在处理千差万别的各种问题时，一般有以下几个步骤：确定目标、制定方案、建立模型、制定解法。虽然不大可能存在能处理及其广泛对象的运筹学，但是在运筹学的发展过程中还是形成了某些抽象模型，并能应用解决较广泛的实际问题。随着科学技术和生产的发展，运筹学已渗入很多领域里，发挥了越来越重要的作用。运筹学本身也在不断发展，现在已经是一个包括好几个分支的数学部门了。比如：数学规划（又包含线性规划；非线性规划；整数规划；组合规划等）、图论、网络流、决策分析、排队论、可靠性数学理论、库存论、对策论、搜索论、模拟等等。

财政和会计。根据查询运筹学论文相关信息得知，方向有财政和会计。运筹学就是以数学为主要手段、着重研究最优化问题解法的学科。运筹学可以用来很好的解决生活中的许多问题。运筹学有着广泛的应用，对现代化建设有重要作用。

英国学术博弈论文

在学术上，豪尔绍尼在20世纪50年代初发表了关于在福利经济学和在伦理学中应用冯·诺伊曼—摩根斯坦效用函数以及关于可变爱好福利经济学的论文。他在阅读了纳什1950—1953年期间的四篇有关博弈论的著名论文之后，对博弈论产生兴趣，并进入这一研究领域。

下面是豪尔绍尼的学术研究的轨迹。1956年，他说明了周生和纳什的谈判模型的数学等价形式并且陈述了最优威胁策略的代数差别标准。1963年，他把夏普莱值(Shapelyvalue)延伸到没有可转移效用的博弈，并且表明他的新解概念是夏普莱值和纳什有可变威胁谈判解的推广。在1967年和1968年发表的一篇论文中，他说明如何把一局不完全信息博弈转化为一局有完全而不完善信息的博弈，以便可用博弈论分析。在1973年说明“几乎所有”混合策略纳什均衡可以重新解释为一个适当选择的有随机波动报酬函数的博弈的纯策略严格均衡。

博弈论论文的写作格式、流程与写作技巧广义来说，凡属论述科学技术内容的作品，都称作科学著述，如原始论著（论文）、简报、综合报告、进展报告、文献综述、述评、专著、汇编、教科书和科普读物等。但其中只有原始论著及其简报是原始的、主要的、第一性的、涉及到创造发明等知识产权的。其它的当然也很重要，但都是加工的、发展的、为特定应用目的和对象而撰写的。下面仅就论文的撰写谈一些体会。在讨论论文写作时也不准备谈有关稿件撰写的各种规定及细则。主要谈的是论文写作中容易发生的问题和经验，是论文写作道德和书写内容的规范问题。论文写作的要求下面按论文的结构顺序依次叙述。(一)论文——题目科学论文都有题目，不能“无题”。论文题目一般20字左右。题目大小应与内容符合，尽量不设副题，不用第1报、第2报之类。论文题目都用直叙口气，不用惊叹号或问号，也不能将科学论文题目写成广告语或新闻报道用语。(二)论文——署名科学论文应该署真名和真实的工作单位。主要体现责任、成果归属并便于后人追踪研究。严格意义上的论文作者是指对选题、论证、查阅文献、方案设计、建立方法、实验操作、整理资料、归纳总结、撰写成文等全过程负责的人，应该是能解答论文的有关问题者。现在往往把参加工作的人全部列上，那就应该以贡献大小依次排列。论文署名应征得本人同意。学术指导人根据实际情况既可以列为论文作者，也可以一般致谢。行政领导人一般不署名。(三)论文——引言是论文引人入胜之言，很重要，要写好。一段好的论文引言常能使读者明白你这份工作的发展历程和在这一研究方向中的位置。要写出论文立题依据、基础、背景、研究目的。要复习必要的文献、写明问题的发展。文字要简练。(四)论文——材料和方法按规定如实写出实验对象、器材、动物和试剂及其规格，写出实验方法、指标、判断标准等，写出实验设计、分组、统计方法等。这些按杂志对论文投稿规定办即可。(五)论文——实验结果应高度归纳，精心分析，合乎逻辑地铺述。应该去粗取精，去伪存真，但不能因不符合自己的意图而主观取舍，更不能弄虚作假。只有在技术不熟练或仪器不稳定时期所得的数据、在技术故障或操作错误时所得的数据和不符合实验条件时所得的数据才能废弃不用。而且必须在发现问题当时就在原始记录上注明原因，不能在总结处理时因不合常态而任意剔除。废弃这类数据时应将在同样条件下、同一时期的实验数据一并废弃，不能只废弃不合己意者。实验结果的整理应紧扣主题，删繁就简，有些数据不一定适合于这一篇论文，可留作它用，不要硬行拼凑到一篇论文中。论文行文应尽量采用专业术语。能用表的不要用图，可以不用图表的最好不要用图表，以免多占篇幅，增加排版困难。文、表、图互不重复。实验中的偶然现象和意外变故等特殊情况应作必要的交代，不要随意丢弃。(六)论文——讨论是论文中比较重要，也是比较难写的一部分。应统观全局，抓住主要的有争议问题，从感性认识提高到理性认识进行论说。要对实验结果作出分析、推理，而不要重复叙述实验结果。应着重对国内外相关文献中的结果与观点作出讨论，表明自己的观点，尤其不应回避相对立的观点。论文的讨论中可以提出假设，提出本题的发展设想，但分寸应该恰当，不能写成“科幻”或“畅想”。(七)论文——结语或结论论文的结语应写出明确可靠的结果，写出确凿的结论。论文的文字应简洁，可逐条写出。不要用“小结”之类含糊其辞的词。(八)论文——参考义献这是论文中很重要、也是存在问题较多的一部分。列出论文参考文献的目的是让读者了解论文研究命题的来龙去脉，便于查找，同时也是尊重前人劳动，对自己的工作有准确的定位。因此这里既有技术问题，也有科学道德问题。一篇论文中几乎自始至终都有需要引用参考文献之处。如论文引言中应引上对本题最重要、最直接有关的文献;在方法中应引上所采用或借鉴的方法；在结果中有时要引上与文献对比的资料；在讨论中更应引上与论文有关的各种支持的或有矛盾的结果或观点等。一切粗心大意，不查文献；故意不引，自鸣创新；贬低别人，抬高自己；避重就轻，故作姿态的做法都是错误的。而这种现象现在在很多论文中还是时有所见的，这应该看成是利研工作者的大忌。其中，不查文献、漏掉重要文献、故意不引别人文献或有意贬损别人工作等错误是比较明显、容易发现的。有些做法则比较隐蔽，如将该引在引言中的，把它引到讨论中。这就将原本是你论文的基础或先导，放到和你论文平起平坐的位置。又如科研工作总是逐渐深人发展的，你的工作总是在前人工作基石出上发展起来做成的。正确的写法应是，某年某人对本题做出了什么结果，某年某人在这基础上又做出了什么结果，现在我在他们基础上完成了这一研究。这是实事求是的态度，这样表述丝毫无损于你的贡献。有些论文作者却不这样表述，而是说，某年某人做过本题没有做成，某年某人又做过本题仍没有做成，现在我做成了。这就不是实事求是的态度。这样有时可以糊弄一些不明真相的外行人，但只需内行人一戳，纸老虎就破，结果弄巧成拙，丧失信誉。这种现象在现实生活中还是不少见的。(九)论文——致谢论文的指导者、技术协助者、提供特殊试剂或器材者、经费资助者和提出过重要建议者都属于致谢对象。论文致谢应该是真诚的、实在的，不要庸俗化。不要泛泛地致谢、不要只谢教授不谢旁人。写论文致谢前应征得被致谢者的同意，不能拉大旗作虎皮。(十)论文——摘要或提要：以200字左右简要地概括论文全文。常放篇首。论文摘要需精心撰写，有吸引力。要让读者看了论文摘要就像看到了论文的缩影，或者看了论文摘要就想继续看论文的有关部分。此外，还应给出几个关键词，关键词应写出真正关键的学术词汇，不要硬凑一般性用词。推荐一些比较好的论文网站。论文之家优秀论文杂志论文资料网法律图书馆法学论文资料库中国总经理网论文集 mba职业经理人论坛财经学位论文下载中心公开发表论文_深圳证券交易所中国路桥资讯网论文资料中心论文商务中心法律帝国：学术论文论文统计北京大学学位论文样本收藏学位论文（清华大学）中国科技论文在线论文中国 : 新浪论文网分类: 中国论文联盟: 大学生论文库论文资料网:

海萨尼对博弈论最大的贡献在于他在不完全信息问题上的突破。古典经济模型几乎无一例外地假设，个人（或厂商）的资源与偏好情况不仅为自己，也为他们的竞争对手所知，即完全信息假设。这显然不符合实际。不过，这并非模型建立者本身所希望的，而只是因为缺乏解决不完全信息问题的工具而不得不做出的简化。博弈论的发展也遇到同样问题。由于对不完全信息问题一度苦无良策，博弈论曾受到严厉批评，因为局中人事实上不可能清楚关于对手决策的所有信息，由此导致博弈理论的应用范围受到了限制。海萨尼对这一问题的解决方法是将不完全信息建模为自然完成的一种抽彩。这种抽彩决定局中人的特征，而这些特征是局中人偏好与经验的总和。其中，每个局中人清楚自己的特征，但不知道别人的真实特征。即他对整个博弈局势只有不完全信息。据其特征，局中人可分为一些“类型”。每个局中人知道自己的类型，不知道别人的类型，但知道类型上的联合分布，从而能对其他局中人的类型做出先验分布判断。不完全信息的这种博弈局势把千变万化的不完全信息都归结为局中人对他人的主观判断。这种方法成功地将不易建模的不完全信息转化为数学上可处理的不完善信息，即局中人根据经验与知识对对手的类型得出关于可能性大小的主观判断，即数学上的一种先验分布。不完全信息博弈的解是由纳什均衡概念推广而来的。其均衡点（贝叶斯均衡点）是一个n重策略，每个局中人的个人策略均是对其他局中人的（n-1）重策略的某种类型的最佳应对。以类型为基础的不完全信息博弈是海萨尼（1967—1968年）提出的。他运用这种方法来克服将局中人的信息与偏好以及他对其他局中人信息与偏好的了解进行建模时所遇到的复杂性。这一思路极富创造性，使不完全信息博弈成为解决经济问题的一个有力工具。对混合策略概念的传统解释是，局中人应用一种随机方法来决定所选择的纯策略。这种解释在理论与实际上均不能令人满意。海萨尼对此提出了更确切的解释方法。他说明每一真实的博弈形势，总受一些微小的随机波动因素影响。在一标准型博弈模型中，这些影响表现为微小的独立连续随机变量，每个局中人的每一策略均对应一个。这些随机变量的具体取值仅为相关局中人所知，这种知识即成为私有信息；而联合分布则是博弈者的共有信息。这称为变动收益博弈。变动收益博弈适用哈萨尼的不完全信息博弈理论，各随机变量的取值类型影响着每一个博弈者的收益。在适当的技术条件下，变动收益博弈所形成的纯策略组合与对应无随机影响的标准型博弈的混合策略组合恰好一致。海萨尼证明，当随机变量趋于零时，变动收益博弈的纯策略均衡点转化为对应无随机影响的标准型博弈的混合策略均衡点。豪尔绍尼的变动收益博弈理论提供了对混合策略均衡点具有说服力的解释。局中人只是表面上以混合策略博弈，实际上，他们是在各种略为不同的博弈情形中以纯策略博弈。这种解释是一个具有重大意义的概念创新，是海萨尼对博弈论所采用的贝叶斯研究方法奠定的一块基石。海萨尼关于博弈论的第一篇论文（1956年）把纳什的合作理论与Zeuthen的议价模型结合，这是他建立n人合作博弈的通用议价模型的第一步。绝大多数合作解概念是基于具有或不具有旁支付的特征方程型博弈。而他的通用议价模型是第一个适用于标准型博弈问题的n人合作理论。通过对均衡时效用权重与联盟对局中人分红具有独创性的构造，他成功地定义了一种议价解法，与非合作博弈的一种均衡点非常相似。直至现在，他的n人议价模型仍是合作博弈理论中最为重要的理论之一。现在，一种观点已被广泛接受，即有关一种博弈形势的充分详细的模型必为一个非合作博弈理论。而在二十世纪六十年代以前，一般观点认为，合作理论比非合作理论更为重要。因为合作有利可图，人们怎会放弃呢？海萨尼是促使这种观念变迁产生的博弈论研究者之一。他首先认识到合作机会以非合作博弈形式建模的必要性。由此观点，合作理论可被视为一个简化形式，需要建立具有更多细节的非合作模型。以这种思路，海萨尼为特征方程型博弈中一个重要的合作理论——冯·诺伊曼——摩根斯坦稳定集——进行了创造性的非合作形式重建。海萨尼在议价模型中为一个具有可转移效用的零和特征方程型博弈设计了一个收益向量序列，以其序列递推过程描述联盟的选择过程。其理论利用非直接优势概念形成了修正的稳定集概念。海萨尼对稳定集概念的非合作重建为考察联盟形成的非合作模型构造提供了方法上的突破。总的来说，海萨尼在他所面临的博弈论几个前沿热点上均取得了突出成就。他的某些思想已成为博弈论的基石，有些思想现在仍然处在研究之中。他的工作不仅极大地促进了博弈论的发展，而且以其新颖与创造性激发了后人的进一步开拓。海萨尼在到目前为止的学术生涯中，著述颇丰，发表了各类论文过百篇，著作五部：“博弈和社会中的理性行为与讨价还价均衡”（1977年）“关于伦理学与社会行为及其科学解释的论文”（1976年）“博弈论论文集”（1982年）“博弈均衡选择的一般理论”（1988年，与塞尔腾合著）“道德、平等和个人美德：一个不正统的功利主义理论”（待出版）此外，海萨尼还是一位勤奋的学者，1993年和1994年，七十多岁的海萨尼还在进行研究和写作，他把与塞尔腾在1988年合作形成而发表的均衡选择理论进行了创新和简化，得到一个更加简洁和更有吸力的形式。由于海萨尼的学术贡献，他在经济学界享有很高的声誉。著名经济史学家布劳格Mark Blaug）在其1986年版（第二版）的“经济学家名人录：1700——1986”中收录有海萨尼的词条，肯定了海萨尼在经济哲学与博弈理论方面的贡献（这一版的名人录中没有纳什和塞尔腾，同时海萨尼获诺贝尔经济学奖的成果也未列入）。海萨尼拥有一系列的荣誉职衔，他是美国国家科学院的成员（从1992年）；美国艺术与科学研究院院士（从1984年）；计量经济学会会员（从1968年）；美国经济学会荣誉会员（1994年）；美国西北大学名誉博士（1989年）。

索引序列
运筹学博弈论论文
运筹学博弈论建模论文参考文献
运筹学学报
运筹学论文
英国学术博弈论文
返回顶部

运筹学博弈论论文