博弈论

博弈
博弈
 
  博弈论(Game theory),也称为对策论、赛局理论,是应用数学的一个分支,也是运筹学的一个重要学科,目前在生物学经济学国际关系计算机科学政治学、军事战略和其他很多学科都有广泛的应用。主要研究公式化了的激励结构(游戏或者博弈)间的相互作用:考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。博弈论是研究具有斗争或竞争性质现象的数学理论和方法,可对经济学、社会学和政治学等行为科学产生的模型作出分析判断,在管理科学、系统控制和统计决策等领域都有应用,现已成为经济学的标准分析工具之一。
 
 

概述

  博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。表面上不同的相互作用可能表现出相似的激励结构(incentive structure),所以他们是同一个游戏的特例。其中一个有名有趣的应用例子是囚徒困境
  具有竞争或对抗性质的行为成为博弈行为。在这类行为中,参加斗争或竞争的各方各自具有不同的目标或利益。为了达到各自的目标和利益,各方必须考虑对手的各种可能的行动方案,并力图选取对自己最为有利或最为合理的方案。比如日常生活中的下棋,打牌等。博弈论就是研究博弈行为中斗争各方是否存在着最合理的行为方案,以及如何找到这个合理的行为方案的数学理论和方法。
  生物学家使用博弈理论来理解和预测进化(论)的某些结果。例如,John Maynard Smith 和George R. Price 在1973年发表于《自然》杂志上的论文中提出的“evolutionarily stable strategy”的这个概念就是使用了博弈理论。还可以参见进化博弈理论(evolutionary game theory)和行为生态学(behavioral ecology)。
  博弈论也应用于数学的其他分支,如概率,统计和线性规划等。

数学定义

 
  对于“博弈”(game)有不少可以互换的定义。这里给出简短的介绍和相互关系的说明。

·范式博弈(Normal form game)

  范式博弈又被译为正则形式的博弈、策略型赛局或标准型赛局。
  设定是一个“参与者”(players)的集合。对于每一个“参与者”i∈N都有一个给定的“策略”集合∑i·博弈(游戏)是一个函数, 定义为:
 
  也就是说,如果我们知道了参与者的策略集合是什么,那么就可以有一个实数值与之对应。 我们可以把上面的方程拆成两个方程来进一步把它一般化。一个方程是正则形式(Normal form game)的参与者程,描述策略规定结果的方式。 另外一个方程描写参与者对于结果(outcome)集合的偏好(preference)。也就是:
 
  这里 Γ 是游戏(博弈)的结果集合(outcome set)。对于每一个参与者i∈N都有一个偏好函数( preference function)
 

·展开形式的博弈(Extensive form game)

  展开形式的博弈又可译为扩展形式的博弈、扩展式赛局或扩展型赛局。
  正则形式的定义为数学家们提供了“均衡”(equilibria)问题的研究一个容易使用的表达式。因为它避免了怎么计算“策略”的问题,也就是说游戏是怎么进行的问题。
  若要考虑游戏是如何进行的,展开形式的博弈是一个比较方便的表达式。这个形式与组合博弈论关系密切。这个定义通过一个树的形式给定。在树的每一个节点(vertex),不同的参与者选择一个边(edge)。

发展历史

 
冯·诺伊曼(John von Neumann)
冯·诺伊曼
(John von Neumann)
  博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的目的。博弈论思想古已有之,中国古代的《孙子兵法》就不仅是一部军事着作,而且算是最早的一部博弈论着作。博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展。
  对于博弈论的研究开始于恩斯特·策梅洛(德语:Ernst Friedrich Ferdinand Zermelo)(1913)、埃米尔·博雷尔(法语:Félix-Édouard-Justin-Émile Borel)(1921)及冯·诺伊曼(John von Neumann)(1928),后来由冯·诺伊曼和奥斯卡·摩根斯坦(1944,1947)首次对其系统化和形式化(参照Myerson, 1991)。随后约翰·福布斯·纳什(John Forbes Nash Jr.)(1950, 1951)利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚实的基础。
  约翰·福布斯·纳什、约翰·C·海萨尼(John Charles Harsanyi)及莱因哈德·泽尔腾(Reinhard Selten)因为他们对博弈论的突出贡献而获得1994年的瑞典银行经济学奖。罗伯特·J·奥曼(Robert John Aumann)、肯·宾摩尔、戴维·克瑞普斯及阿里尔·鲁宾斯坦对于博弈论也做出重大贡献。

分类

 
  博弈的分类根据不同的基准也有不同的分类。一般认为,博弈主要可以分为合作博弈和非合作博弈。它们的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议,如果有,就是合作博弈,如果没有,就是非合作博弈。
  从行为的时间序列性,博弈论进一步分为两类:静态博弈是指在博弈中,参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动;动态博弈是指在博弈中,参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。通俗的理解:“囚徒困境”就是同时决策的,属于静态博弈;而棋牌类游戏等决策或行动有先后次序的,属于动态博弈。
  按照参与人对其他参与人的了解程度分为完全信息博弈和不完全信息博弈。完全博弈是指在博弈过程中,每一位参与人对其他参与人的特征、策略空间及收益函数有准确的信息。如果参与人对其他参与人的特征、策略空间及收益函数信息了解的不够准确、或者不是对所有参与人的特征、策略空间及收益函数都有准确的准确信息,在这种情况下进行的博弈就是不完全信息博弈。
  不完全信息博弈是指如果参与人对其他参与人的特征、策略空间及收益函数信息了解的不够准确、或者不是对所有参与人的特征、策略空间及收益函数都有准确的信息,在这种情况下进行的博弈就是不完全信息博弈。
  目前经济学家们现在所谈的博弈论一般是指非合作博弈,由于合作博弈论比非合作博弈论复杂,在理论上的成熟度远远不如非合作博弈论。非合作博弈又分为:完全信息静态博弈,完全信息动态博弈,不完全信息静态博弈,不完全信息动态博弈。与上述四种博弈相对应的均衡概念为:纳什均衡(Nash equilibrium),子博弈精炼纳什均衡(英语:subgame perfect Nash equilibrium),贝叶斯纳什均衡(Bayesian Nash equilibrium),精炼贝叶斯纳什均衡(perfect Bayesian Nash equilibrium)。
  博弈论还有很多分类,比如:以博弈进行的次数或者持续长短可以分为有限博弈和无限博弈;以表现形式也可以分为一般型(战略型)或者展开型,等等。

诺贝尔奖

 
  从1994年诺贝尔经济学奖授予3位博弈论专家开始,共有5届的诺贝尔经济学奖与博弈论的研究有关,分别为:
  1994年,授予美国伯克利加利福尼亚大学的约翰·海萨尼(John Charles Harsanyi)、普林斯顿大学约翰·纳什(John Forbes Nash Jr.)和德国波恩大学的赖因哈德·泽尔滕(Reinhard Selten)。
  1996年,授予英国剑桥大学詹姆斯·莫里斯(James A. Mirrlees)与美国哥伦比亚大学威廉·维克瑞(William Vickrey)。
  2001年,授予美国加州大学伯克莱分校的乔治·阿克尔洛夫(George A. Akerlof )生于1940年、美国斯坦福大学迈克尔·斯宾塞(A. Michael Spence )和美国纽约哥伦比亚大学的约瑟夫·斯蒂格利茨(Joseph E. Stiglitz)。
  2005年,授予美国马里兰大学的托马斯·克罗姆比·谢林(Thomas Crombie Schelling)和耶路撒冷希伯来大学的罗伯特·约翰·奥曼(Robert John Aumann)。
  2007年,授予美国明尼苏达大学的里奥尼德·赫维茨(Leonid Hurwicz)、美国普林斯顿大学的埃里克·马斯金(Eric S. Maskin)以及美国芝加哥大学的罗杰·迈尔森(Roger B. Myerson)。
  2012年,授予美国经济学家埃尔文·罗斯(Alvin E. Roth)与罗伊德·沙普利因(Lloyd S. Shapley)。
  作为一门工具学科能够在经济学中如此广泛运用并得到学界垂青实为罕见。

相关概念

  纳什均衡  囚徒困境  重复博弈  大众定理  信息  帕累托最优(PARE-TOEFFICIENCY)
  零和博弈(Zero-Sum Game)  非零和博弈  微分包含式(Differential inclusion)  拍卖博弈