首页 > 文章中心 > 进化博弈理论

进化博弈理论

进化博弈理论

进化博弈理论范文第1篇

本文以进化博弈理论的基本均衡概念----进化稳定策略的提出、发展及不断完善为主线,在指出原初概念缺陷的基础上,文章从非对称博弈、有限群体、随机因素及动态过程四个方面分别介绍了博弈论理论家们对该概念的拓展。

关键词:进化稳定策略;渐近稳定性;严格N群体ESS;随机稳定集;群体稳定集

引言

进化博弈理论来自于达尔文的生物进化论,至少自雷威丁(Lewontin 1960)用于解释生态现象 ②就已经产生了。但直到1973年梅纳德·史密斯和普莱斯(Maynard Smith and Price)、梅纳德·史密斯(1974)提出了该理论的基本均衡概念----进化稳定策略[3](evolutionary stable strategy, ESS)及泰勒和乔克(Taylor and Jonker)提出该理论的基本动态概念---模拟者动态以后,进化博弈理论得到了理论界的普遍关注。特别是1992年关于进化博弈理论发展的国际学术会议在康奈尔大学的召开,正式确定了进化博弈理论在经济学上的学术地位,此后,该理论在经济学便上获得了迅速的发展及广泛的应用。越来越多的经济学家运用进化博弈理论来分析诸如社会制度变迁[阿克赛尔罗德和米尔顿(Axelrod and Hamilton 1981);阿克赛尔罗德(1984)]、行业发展趋势[波特Porter 1980)]、股市发展方向[康利斯克(Conlisk 1980);利奈尔和罗尔(Cornell and Roll 1981)]、消费者对品牌的选择[凯思和史培罗(Katz and Shapiro 1985)]、社会学习过程[弗登博格(Fudenberg 1995)]及社会习俗形成[彼特·杨,(H. Peyton Young 1993,1998)等领域的相关问题。进化稳定策略是进化博弈理论最基本的均衡概念,它具有广泛的应用并在发展中得到了不断完善。本文以进化稳定策略概念的发展为主线来介绍博弈论理论家们对它在不同条件下的拓展。

一、原初ESS定义及其缺陷

在梅纳德·史密斯和普莱斯(1973);梅纳德·史密斯(1974)提出进化稳定策略概念以前,进化博弈理论的发展还仅仅处于萌芽阶段。在这一时期生态学家们主要应用纯数学理论如极限环、分岔、奇异吸引子(罗森,Rosen 1970)等概念来描述生态演化系统并用于解释生态现象,同时把生物之间的互动行为纳入到进化模型之中(威尔·艾德瓦兹,Wynne-Edwards 1962),他们处理问题的方法已经蕴含了进化博弈理论的基本思想。

在七十年代,生态学理论和博弈理论在各自领域中都获得了迅速的发展,同时实验经济学作为一门学科也获得了经济学界的一致认同,这些条件为进化论与博弈论的结合提供了理论和现实基础。生态学家梅纳德·史密斯和普莱斯(1973)在总结以前理论的基础上,提出进化博弈理论的基本均衡概念----进化稳定策略③ ,该均衡概念的提出使得进化博弈理论的研究有了明确的方向,为进化博弈理论的进一步发展奠定了坚实的基础。

所谓进化稳定策略就是指:如果占群体绝大多数的个体选择进化稳定策略,那么小的突变者群体就不可能侵入到这个群体。或者说,在自然选择压力下,突变者要么改变策略而选择进化稳定策略,要么退出系统而在进化过程中消失。下面我们给出梅纳德·史密斯和普莱斯(1973)所定义的进化稳定策略(文献[3]对此有详细的介绍):

说是进化稳定策略,如果,存在一个④,不等式对任意都成立。其中A是群体中个体博弈时的支付矩阵;y表示突变策略;是一个与突变策略y有关的常数,称之为侵入界限(Invasion Barriers);表示选择进化稳定策略群体与选择突变策略群体所组成的混合群体。从定义可以看出,当系统处于进化稳定状态时(群体选择进化稳定策略时所处的状态就是进化稳定状态),除非有来自外部强大的冲击,否则系统就不会偏离进化稳定状态,即系统会“锁定”(Lock in)于该状态。定义的直观意思就是,当一个系统处于进化稳定均衡的吸引域范围之内时,它就能够抵抗来自外部的小冲击。显然,进化稳定策略是一个静态概念,但它却可以描述出系统的局部即吸引域内的动态性质。

原初进化稳定策略定义为以后的研究者提供了理论基础,但它是建立在许多理想化的假定之上,存在着许多不够完善的地方:第一,梅纳德·史密斯等是在研究生态现象时提出的进化稳定策略概念的,由于动植物的行为完全是由其基因决定的。因而,每个种群体都被程式化为一个纯策略,整个生态环境的所有种群也被看作一个大群体。然而,同一种群的个体由于其性别不同、需要不同、能力不同、基因突变或基因遗传⑤ 等因素都会影响到它们的行为,把每一个种群行为程式化一个纯策略是没有太强说服力的,把一个生态环境中所有种群看作一个大群体也存在不妥之处;第二,从梅纳德·史密斯等提出的进化稳定策略定义可以看出,它仅适应于互不重叠且相互独立的突变因素的影响,其吸引域半径只与单个突变因素y有关,也就是说只有等到一个突变因素对群体的影响消失之后,才能出现另一个突变因素,现实中出现这种现象是非常偶然的;第三,梅纳德·史密斯等为了技术上处理的方便及更好地利用数学工具和博弈论来描述生态演化过程而假定群体规模无限大 ⑥,即隐含地假定博弈的支付⑦ 空间是一个连通、闭集,这个假定不符合现实;第四,从原初的进化稳定策略定义可以看出,它是一个静态概念,只能描述系统的局部动态性质,没有涉及到动态系统整体的调整过程,而现实中许多系统的均衡依赖于系统的整体动态性质。

从生态意义上说,进化稳定策略把种群之间的互动行为纳入到模型之中,推广了达尔文的优胜劣汰理论,然而与纳什均衡概念相比,进化稳定策略并不能解释群体如何达到稳定的。它只能回答一旦达到了这种稳定状态,原群体就对突变者群体者具有较强的抵抗力。也就是说,它只能回答当系统处于某一个均衡点的吸引域时,在一定条件下,随着时间的演化,该系统就会趋于这个均衡点,而当系统有多重均衡或者多个吸引域时,原初的定义就显得无能为力了。事实上梅纳德·史密斯和帕克(Maynard Smith and Parker 1976)、梅纳德·史密斯(1978;1979)已经识到原初定义的某些缺陷,梅纳德·史密斯(1982)给予了一定程度的修进并提出了修进的ESS(Modified ESS)概念。下面我们从四个方面来介绍理论家对进化稳定均衡所作的拓展。

二、非对称群体中的ESS概念

梅纳德·史密斯早在1979年就已经意识到,原初的进化稳定策略在处理多群体非对称博弈时遇到了困难。他发现,在现实中,如生态学、经济学和其他社会科学中的许多策略互动行为可能发生于两个或多个群体的个体之间,个体之间进行的是非对称博弈,单用原初定义不能很好解释现实中的这些现象。如何把静态的单群体进化稳定标准拓展到多群体情形呢?在单群体中,所有的个体都被程式化了一个纯策略(梅纳德·史密斯假定只有纯策略是可以遗传的),个体之间进行的是两两重复匿名博弈;并且在单群体中,规模很少的突变因素对群体所产生的影响是可以忽略的,因此,非严格纳什均衡策略不可能侵入到最优反应的严格纳什均衡策略群体。在多群体中,突变因素可能来自于各个群体,突变策略者的互动行为会对群体行为产生不可忽略的影响。因此,原初的进化稳定标准仅仅限于严格纳什均衡之间的选择就不能运用于解释多群体情形。Selten(1980)认为,把均衡概念由单群体拓展到多群体不是一个简单的过渡,而是涉及到系统的动态调整过程及动态稳定性等一系列的变化。哈曼斯顿(Hammerstein 1981)认为,在非对称博弈中,个体更加倾向于应用稳定策略来选择行为并决定竞争结果,而这些稳定策略与进化稳定策略相比,可能会有更少的“吸引域”。因此,由进化稳定策略定义所得的结论就显得有点似是而非了,但他没有作出进一步解释。

泽尔腾(Selten (1980))首次深入地研究了非对称博弈动态稳定性并利用两群体博弈情形证明 “在非对称博弈原初进化稳定策略必定是严格纳什均衡”。后来,Van Damme(1987)在更一般的情形下证明了这个命题⑧ 。我们知道,严格纳什均衡本来就显示出很好的性质,如果一个理论把其主要的注意力集中于研究严格纳什均衡,那么它就没有任何理论价值;更重要的是许多非对称博弈根本就不存在严格纳什均衡,因而也就无法研究动态系统的稳定性;在非对称博弈中,渐近稳定性(Asymptotic Stability)实质上也蕴含了严格纳什均衡,因此,渐近稳定性在非对称博弈中也不是一个合适概念;进化稳定策略是一个静态概念,虽然能够描述系统的局部动态性质,但在非对称博弈中,原初的进化稳定均衡与动态演化过程极限结果之间的对应关系却不明显(即出现了局部与全局的矛盾)。因此,要研究非对称博弈的动态稳定性就必须通过考察系统的动态演化过程来寻求能够适应于对称博弈与非对称博弈的稳定性概念。为了能够更精确地描述非对称博弈,泽尔腾(1983,1988)通过对引入角色限制行为(Role Conditioned Behavior)而提出了适应于非对称博弈的ESS概念。

他的定义如下:在有角色限制的博弈G中,一个行为策略称为进化稳定策略,

如果 (ⅰ)对任意的,满足

(ⅱ)如果那么对任意的有。

然而,泽尔滕的ESS概念尽管适应于描述两群体非对称博弈的情形,但它只能描述系统的局部动态性质,而且该定义并不能够显示出均衡概念与动态演化过程极限结果之间的关系。因此,要更好地描述非对称博弈均衡,就必须正确处理好均衡概念与动态演化过程均衡结果之间的关系。于是,弗里德曼(Friedman 1991)考察了非对称博弈的更一般的单调调整过程并得出了四个基本结论:(1)每一个纳什均衡都是动态系统的静止点(rest point)⑨ ;(2)渐近稳定结果必定是纳什均衡;(3)在对称和非对称博弈中,对所有单调调整过程而言ESS不一定是渐近稳定的;(4)对某些单调调整过程而言,正规ESS是渐近稳定的。在此基础上,他得出了“渐近稳定结果必定是纳什均衡”结论。莱瑞·萨谬尔森和张建波(Larry Samuelson and Jianbo Zhang 1992)在弗里德曼(1991)的基础上进一步考察了非对称博弈的累积单调选择动态(Aggregate Monotonic Selection Dynamic)并得出:在非对称博弈中,单调调整过程能够剔除所有严格劣的纯策略,并且能够确保均衡结果必定是纳什均衡。同时,他们证明了“稳定点必定是纳什均衡”及“渐近稳定结果必定是严格纳什均衡”,进而强化了弗里德曼(1991)的“渐近稳定结果必定是纳什均衡”的结论。

Swinkels(1992)认为,进化稳定标准不对突变策略组合给予适当限制是说不过去的。特别地,在处理某些经济问题时,突变策略可能来自于参与人或者企业的创新、试验等活动,这些突变策略组合本身可能会影响系统的稳定性。因此,考察相对于后进入突变群体最优反应策略组合的稳定性可能会更合理,并且这些稳定性概念很容易由单群体情形推广到多群体N-人非对称博弈。于是他定义了适应于非对称博弈的策略稳健性概念。

定义:称之为相对于均衡进入者的稳健策略(Robust against Equilibrium Entrants REE),如果存在对所有的策略组合及满足:。其中表示突变策略;表示选择突变策略者在群体中所占的比例;表示混合群体;表示突变策略相对于策略x的最优反应策略,他并且证明了REE是ESS的一个子集。然后,他又把REE概念推广到了N-人非对称博弈的情形而提出了均衡进化稳定(Equilibrium Evolutionarily Stable EES)概念:

定义:称集合是均衡进化稳定的(EES),如果它是相对于下面性质的最小集: X是纳什均衡策略集合一个非空闭子集,存在,如果及,那么。

换句话说,EES集是纳什均衡策略集的最小闭集,它能够保证任何小规模的均衡进入突变者不可能使得群体离开进化稳定均衡的吸引域。

三、有限群体上的ESS概念

梅纳德·史密斯等提出的ESS概念另一个缺陷就是,他们为了在技术上处理的方便而认为群体规模无限大,这个假定与现实尤其应用于解决经济问题时并不相符。为了使理论与现实更接近,许多博弈论理论家对有限群体的均衡问题进行了深入的研究。沙弗尔(Schaffer 1988)首次放开群体规模无限大的假定,考察了有限规模群体的进化稳定性并提出了有限群体ESS(Finite Population Ess)概念。他证明“在一般情况下,有限群体ESS并不是纳什均衡策略”。汉森和萨谬尔森(Hansen and Samuelson 1988)分析了经济博弈的演化过程,并把有限群体ESS称之为“普遍生存策略”(universal survival strategy)。他们认为,在现实世界竞争中,未来的利润和可供选择的策略具有不确定性,这就会阻碍企业选择最优化策略,企业必须通过不断的试验、学习过程来寻求有利可图的满意策略 ⑩(不一定是最优策略)。沙弗尔(1989)应用“普遍生存策略”来研究寡头企业之间的竞争并得出结论:通过经济自然选择过程 ⑾而得以生存下来的策略是相对的而不是绝对的利润最大化策略。泰尼克(Tanaka 2000)利用模拟者动态,考察了差别产品对称寡头企业竞争的情形并定义了“全局生存策略”(Globally Surviving Strategy GSS)。他得出结论的是:在价格与数量竞争的寡头模型中,GSS都是随机稳定的并且在两种情况下它们是等价的。

以上所得到的均衡概念基本上是适应于单群体有限个体情形,并不适应于有限个体多群体博弈。哈佛保尔和西格蒙德(Hofbauer and Sigmund 1988)证明了“两群体对称博弈中不存在混合策略ESS”。泽尔腾(1988)在考察了大量的两人对称博弈的基础上也得出了类似的结论。克瑞斯曼(Cressman 1992)定义了有限两群体非对称博弈的进化稳定策略,1996年对他所定义的概念作了进一步说明。他认为,在模拟者动态下,至少一个群体的突变者所得到的平均支付少于选择稳定策略者所获得的支付,才能保证静止点的渐近稳定性。Garay and Varga(2000)认为,定义有限数目多群体的均衡概念应该满足如下三点:其一是突变者不能侵入他自己的群体;其二是现有群体对来自外部的随机冲击具有较强的抵抗力;其三是多群体ESS定义应该与非对称博弈理论的基本结论一致。众所周知,纯策略模拟者动态的渐近稳定集并不一定是ESS。那么,哪一种动态稳定概念等价于ESS呢?克瑞斯曼(1990)指出,在单群体条件下强稳定性等价于ESS,那么多群体的ESS定义也应该满足多群体稳定性概念等价于多群体ESS。根据这个标准,Garay and Varga(2000)定义了严格N群体ESS概念。其定义如下:

定义:策略组合 称之为N-群体进化稳定策略,如果对每一个,存在,对所有的都有:

框架。

四、随机因素影响下ESS概念

梅纳德·史密斯等提出的ESS概念第三个缺陷是要求突变因素是不连续且不重叠的。原初ESS定义由于仅仅考虑单个因素对系统的影响,所以任何偏离均衡状态的行为都会随着时间的演化自动回复到原来的进化稳定状态。帕克和菲尔德曼(Peck and Feldman 1988)认为,由于群体规模和后代数目很大,因而随机因素对动态系统的影响是可以忽略不计的。现实并不是这样,经济演化系统常常会受到来自突变和其他偶然事件的冲击,这些因素可能会对系统产生不可忽略的影响。福斯特和杨(Foster and Young 1990)认为,首先,ESS概念把影响系统的因素都看成是一个个孤立的事件,而在现实中系统常常会受到连续的随机冲击。如果假定有一个因素的影响消失以后,再考虑另一个因素对系统的影响,那么,系统当然就不会远离原来的均衡状态;其次,现实中出现上述情况纯属偶然现象,一个只能处理偶然现象的理论是没有任何存在价值。现实中,尽管单个随机因素对动态系统的影响较少,但它们却可能对系统产生累积作用而定量地改变系统的稳定性,使得系统离开进化稳定状态,系统什么时候回复到当初的进化稳定状态,依赖于动态过程的全局结构,而ESS定义是一个局部概念,因此在考虑随机冲击时就不能作为判断系统稳定性的标准;再次,由于系统的极限行为依赖于初始条件,同时在吸引子集合中只有一部分状态是随机稳定的,且随机稳定状态的选择还依赖于随机过程特定的结构,因此,ESS和一般意义上的吸引子(Attractors)由于没有充分地考虑到随机因素对进化系统的影响,在描述随机系统的稳定性时也很不理想。于是,他们首次把影响系统的随机因素纳入到进化模型之中并提出了一个既不同于传统ESS也不同于吸引子(Attractor)概念的随机稳定性(Stochastic Stability)概念。他们的定义如下:

定义:群体向量是随机稳定的,如果随着随机影响,极限密度对的每一个小邻域都赋有正概率;更精确地说,其中。其中是当时,的极限分布,表示随机因素对系统所产生的影响。

粗略地说,一个状态P是一个随机稳定的,如果在长期中,随着随机冲击因素影响的不断变少,系统几乎一定(nearly certain)不会离开P的任意少的邻域。随机稳定的群体向量总是存在的,它有如下性质:随着及,它是一个最小闭集。接着,他们又提出了更一般的概念----随机稳定集(Stochastic Stable Set)。随机稳定集 是一个满足如下条件的状态集合,即从长期来看,随着随机冲击的不断变少,系统几乎一定处于包含于S的任何一个开邻域中。随机稳定集概念的提出把传统确定性动态模型中的ESS拓展到随机性动态系统中,并且它是一个比进化稳定策略集更精练的概念,是进化稳定集的子集。随机稳定集已经成为描述随机动态系统的基本均衡概念。

五、ESS与动态的结合

从ESS的定义可以看出,它只能描述系统的局部动态性质而与系统的全局动态过程无关,然而,要更准确地描述一个系统的动态性质就必须对仔细考察整个系统的动态调整过程。泰勒和乔克(Taylor and Jonker 1978)首次把传统的ESS定义用模拟者动态模型表示出来,他们证明在一个多群体的模型中,进化稳定策略是渐近稳定的充分但非必要条件。但他们没有作出进一步的研究。鉴于此,吉尔博和马特休(Gilboa and Matsui (1991))在考察群体行动态调整过程的基础上,提出了“循环稳定集”(Cyclically Stable Set)又一均衡概念。“循环稳定集”直接来源于群体行为的调整过程,其基本思想是“可接近性”(Accessibility)。一个策略分布f称为可以从另一个策略分布g接近是指,如果存在一条从f到g的道路,且在该道路方向上任何一点都是相对于该点的最优反应。“循环稳定集”是指在满足“可接近性”条件下是封闭的策略分布集合(在该集合中任何两个分布之间都是接近的)。与一般均衡理论不同,仅当参与人按照均衡策略而作出选择时才有效,CSS并不要求群体保持这种决策状态。CSS的直观意义是,在一个很短的时间间隔内,只有少部分人离开或者死亡并且由一些新来的人(新生的孩子)代替,这些新来者从他们的母体那里继承一些行为模式,并且在现行预期(也就是说他们并不关心行为模式未来的变化)条件下作出最优的反应,一旦新来者选择了某一行动,他就会一直坚持下去(转换成本的存在是他坚持这个行动的一个重要原因)。马特休(Matsui 1992)给出了一个“稳定”策略的静态表述,在存在对原群体中各策略的初始分布冲击的情况下该策略能够保持这种分布。斯温克斯(1992)在马特休的基础上提出了“群体稳定策略”(Socially Stable Strategy SSS)。相对于均衡的进入者而言,所谓“群体稳定策略”是指如果存在一个突变群体(或者进入者群体,譬如说群体A),其支付高于原群体的支付,那么必定存在另外一个群体(如群体B),在这个包含大部分原群体个体而有一少部分群体A的个体的群体中,群体B将获得高于群体A的支付。这个概念也称为“稳健策略组合”。当然在某些情况下,“群体稳定策略”可能并不存在,但不是这个概念本身的缺点,出现这种情况与我们所研究的动态过程本身是分不开的。然而,我们可能会问,实际的行为模式又是怎么样呢?如果这个过程并不是稳定状态,那么稳定状态又是什么呢?在对这个问题作出回答时,马特休利用了吉尔博和马特休(1991)所提出的集值解的概念(Set-valued Solution),同时他也证明了循环稳定集的存在性。Binmore and Samuelson(1993)把参与人的学习过程纳入到了进化模型中并提出了自我强化均衡[10](Self-confirming Equilibrium)。他们认为,每个参与人都会通过自己的经验来推断对手可能选择的策略而作出最优反应,这个学习过程可能使得系统在不同自我强化均衡的吸引域之间漂移而不会停留在某一个均衡,由于在非均衡路径上的推断不一定正确,所以自我强化均衡可能不一定是纳什均衡。

结束语

进化博弈理论从发展到现在虽然只有二十几年的历史,但它却受到社会学、经济学、生态学们的普遍关注。特别是该理论的基本均衡概念----进化稳定均衡提出以后,理论界已经从不同的方面对它进行了拓展,并取得了令人瞩目的成果,使进化博弈理论体系得到了在发展中不断完善。进化博弈理论具有较强的实用性和广阔的发展前景 ⑿,相信它会引起更多经济学家的兴趣,必将成为主流经济学的一部分。

注释: ①张良桥:中山大学岭南学院经济学系数量经济学硕士研究生,广东省顺德职业技术学院经济管理系教师(邮政编码:528300;联系电话:0765-2338029;13825507060,值此文发表之际谨向他们致以深深的谢意,同时要感谢经济管理系的仇颖老师对此文中英文名字进行了认真的翻译。 ②生物学家在研究生态现象时发现,利用纳什均衡可以很好地解释生物进化结果。然而,生物是没有思维的更谈不上理性要求了,它们的行为却可以趋于纳什均衡,因此,理性要求并不是纳什均衡的必要条件。这样,生物进化论与博弈论的结合便成为可能,为进化博弈理论的产生奠定了基础。进化博弈理论以群体(Population)为研究对象,主要处理群体中近视且幼稚的(Navie)个体进行重复、匿名博弈的动态调整过程。其基本思想为:给定群体所处的状态,随着时间的演化更合适的策略会被更多参与者采用,其目的是为预测群体最终行为提供一个理论依据。 ③此后本文称之为原初定义 ④实际上相当于吸引域的半径,也就说进化稳定策略考察的是系统落于该均衡的吸引域范围之内的动态性质,而落于吸引域范围之外是不考虑的,所以说它只能够描述系统的局部动态性质。 ⑤如长颈鹿进化的过程。 ⑥对群体模型为无限大的要求有两个原因:其一是机械式的,为了假想的“侵入界限”(Invasion Barriers)也就是突变者群体在大群体中所占的份额(Population Share),当突变群体模型超过1/n时,n是大群体的个体数,突变群体就有可能侵入到大群体,进化稳定策略的条件就有不满足了。其二是技术上的,群体模型足够大,就可以忽略掉现行群体个体的行为对其他突变者群体未来行为的影响,即不考虑学习过程。 ⑦其中的支付是生态学上的适应度(Fitness)或繁殖成活率。 ⑧下面我给出Van Damme1987的证明:首先设是进化稳定的,并且令所有参与人都选择不变的策略。令,对所有的。令,其中,那么对所有,满足及,因此,由进化稳定性可知。所以,而是任意的,所以。其次,设是一个严格纳什均衡策略,并且,那么至少存在一个满足,由的连续性可知,至少存在一个,对所有及,至少存在一个 满足:,这就说明 是进化稳定的。 ⑨静止点(Rest Point)就是当动态系统处于静止点时就不会离开该点。 ⑩Alchian(1950)指出,企业必须通过对所观察到的市场参与者的行动与结果之间的比较来得知什么是好的策略什么是不好的策略。 ⑾他考察了如下的选择过程,每一个企业所能够选择的策略不随环境的变化而变化。在每一个阶段结束时,如果企业1的利润大于企业2的利润,那么企业1在下一阶段生存下来的概率就大于企业2在下一阶段生存下来的概率。相应地可以把企业的生存规则看作为策略的幸存,成功策略在群体中所占的比例通过企业之间对策略的模仿而得以增长 ⑿杨小凯教授(1995)认为,博弈理论当前最有趣的研究成果及日后有可能获得诺贝尔奖的工作就是信息不对称的动态博弈模型,以及对策游戏规则演化模型(也就是进化博弈模型)。事实上1996年及2001年的诺奖都属于研究信息经济学的经济学家,这说明杨教授具有超前的预见性,进化博弈理论研究者虽然还没有获得诺贝尔经济学奖,但也可以说明杨教授非常看重对进化博弈理论的研究。

[参考文献]

[1] 王则柯(1999):《博弈论平话》,中国经济出版社。

[2] 张维迎(1999):《博弈论与信息经济学》,上海三联出版社。

[3] 张良桥(2001):《进化稳定均衡与纳什均衡:兼谈进化博弈理论的发展》,《经济科学》,3,103-111。

[4] 张良桥(2001):《理性与有限理性:论经典博弈理论与进化博弈理论之关系》,《世界经济》,8,74-78。

[5] Binmore, K., G., and Larry Samuelson(1993): Musical Chaires: The Evolutionary Mechanica of Equilibrium Selection, Mimeo, (University College London and University of Wisconsin, Madison) .

[6] Cressman, P.,(1992): The Stability Concept of Evolutionary Game Theory (A Dynamical Approach), Lecture Notes in Biomathematics, Vol. 94, Springer Berlin.

[7) Cressman, P.,(1996): Frequency-dependent Stability for two-species interactions, Theoretical Population biology, 49, 189-210.

[8] Cressman, r.,(1990): Strong Stability and Density-dependent Evolutionarily Stable Strategies, Theoretical Population biology, 145, 319-330.

[9] Friedman, D.(1991): Evolutionary games in economics, Econometrica 59.

[10] Fudenberg, D. (1998): Learning in Games, Cambridge MIT Press.

[11] Gilboa, I. and A. Matsui (1991): Social Stability and Equilibrium, Econometrica,59, 869-867.

[12] Hammerstein, P., (1981): The role of Asymmetries in Animal Contests, Anim. Behav. 29, 193-205.

[13] Hansen, R. G., and Samuelson, W., (1988): Evolution in Economic Games. Journal of Economic Behavior and Organization, 10, 315-338.

[14] Hofbauer, J., Sigmund, K.,(1988): The Theory of Evolution and Dynamical Systems, Cambridge University Press, Cambridge.

[15] Lewontin, R. C. (1960): Evolution and the Theory of Games. Journal of Theoretical Biology, 1, 382-403.

[16] Matsui, A.(1992): Best Response Dynamics and Socially Stable Strategies, Journal of Economic Theory, 67, 343-362.

[17] Maynard Smith(1974): The theory of Games and the Evolution of Animal Conflict, Journal of Theoretical Biology, 47, 09-221.

[18] Maynard Smith(1978): In defence of Models, Anim, Behav. 26, 632-633.

[19] Maynard Smith, J. And Price, B. R. (1973): The Logic of Animal Conflict, Nature, 246, 15-18.

[20] Peck, J. R., and Feldman (1988): Kin Selection and the evolution of Monogamy, Science, 240, 1672-1674.

[21] Rosen, R. (1970): “Dynamical System Theory in Biology,” Vols. 1 and 2, Wiley-Interscience, New York.

[22] Samuelson, Larry and Jianbo, Zhang(1992), Evolutionary Stability in Asymmetric Games, Journal of Economic Theory 57.363-391.

[23] Schaffer, M. E., (1988): Evolutionarily Stable Strategies for a Finite Population and a Variable Contest Size. Journal of Theoretical Biology, 132, 469-478.

[24] Selten, R.(1980), Evolutionary Stability in Extensive Two-person Games-Correction and Further Development, Mathematical. Social. Science, pp. 93-101.

[25] Selten, R.(1983), Evolutionary stability in extensive two-Person Games, Mathematical. Social. Science 5. 269-363.

[26] Selten, R.(1988), Evolutionary stability in extensive two-Person Games—Correction and further development, Mathematical. Social. Science 16 . 93-101.

[27] Swinkels, J. (1992): Evolution and Strategic Stability: From Maynard Smith to Kohlberg and Mertens, Journal of Economic Theory, 57, 333-342.

[28] Swinkels, J. (1993): Adjustment Dynamics and rational Play in Games, Games and Economic Behavior, .5, 455-484.

[29] Tanaka, Y., (2000): Stochastically Stable States in an oligopoly with Differentiated Goods: Equivalence of Price and Quantity Strategies, Journal of Mathematical Economics, 34, 235-253.

[30] Taylor, P. D., and Jonker, L. B. (1978): Evolutionarily Stable Strategies and Game Dynamics, Mathematical. Bioscience. 40, 145-156.

[31] Wynne-Edwards, V. C. (1962): “Animal Dispersion in Relation To Social Behavior,” Hofner, New York.

进化博弈理论范文第2篇

一 博弈理论简介

(一)博弈论的名称

博弈论,英文名称为Game theory是研究各方策略相互影响的条件下,理性决策人的决策行为的一种理论。博弈论刚被介绍至我国时,曾有过多种译法。有的学者根据其英文名称,直译为游戏理论;有的学者则从该理论本身的研究对象出发,转译为对策论或对策运筹论。近年来,学术界越来越多地接受了博弈论这一名称。这除了由于博弈这个带有文言味的词本身的学究气浓郁而给人的第一印象较为深刻外,更重要的是博弈一词能更准确、全面地体现策略选择、依策而动以及最终结果三者的统一。

(二)博弈的要素

一个完整的博弈应包含如下四项要素:1,博弈的参加者(player)。也称局中人或博弈方。是指博弈中能独立决策、独立行动并承担决策结果的个人或组织。小到一个人,大到一个跨国公司乃至一个国家,只要能独立决策和行动,都可视作一个博弈方。比如柯达与富士公司的竞争,就可看作一个有二个博弈方的博弈。一般说来, 博弈的参加者越多,情况就越复杂,结果越难预料。2,策略空间(strategy space)。是指各博弈方可选择策略的集合。strategy直译应为战略,不过战略一词对大多数博弈来讲显然过于抽象和宽泛了。每一个策略都对应一个相应的结果。因此每个博弈方可选的策略数量越多,博弈就越复杂。3,进行博弈的次序(the order of play)。博弈中各博弈方行动的顺序对于博弈的结果是非常重要的。同样的博弈方、同样的策略空间,先后决策并行动和同时决策行动,其结果是大相径庭的。 4,博弈的信息(information)。知己知彼、百战不殆。可见信息对博弈的重要性古人早已知之。博弈中最重要的信息是有关对手策略以及各博弈方得益的信息。例如,在各博弈方同时决策的博弈中,必须保证不能让对手知道自己采取何种策略,否则自己将永远是博弈的输家。得益(play off),也称支付,是指博弈方策略实施后的结果。有关得益的信息是促使某博弈方选择某种策略的关键参考值。理性的博弈方总是选择能使自己获得最大得益的策略。一旦确定了以上四要素,一个博弈也就随之确定了。值得注意的是,博弈论特别强调“理性人”的前提假定,即参加博弈的各博弈方始终以自身利益最大化为惟一目标。除非为了实现自身最大利益的需要,否则不会考虑其他博弈方或社会利益。

(三)博弈论的结构

由于一个完整的博弈需具备上述四要素,因此博弈可以从不同的角度划分成不同类别:1,按博弈方划分,可分为单人博弈和多人博弈。单人博弈因为只有一个博弈方,所以它已退化为一般的最优化问题。经济学中常见的求最优问题,实际上是博弈的特例。多个博弈方的博弈较单人博弈复杂,而且两人以上的博弈会出现合作博弈问题。这样,多方博弈又将分为合作博弈与非合作博弈。因为在社会与经济关系中,竞争与不合作是基本方面。所以当前的博弈论主要研究的是非合作博弈。1994年诺贝尔经济学奖三位得主的主要贡献,即在非合作博弈方面。2,按策略空间划分,可分为有限策略博弈和无限策略博弈。因为每一种策略都相应地对应一个得益结果,所以从理论上讲,有限策略博弈的结果必然是有限的,而无限策略博弈的结果则有无穷多种可能。3,按进行博弈的次序划分,可分为静态博弈和动态博弈。各博弈方可同时决策并行动的博弈称为静态博弈。当然,严格讲各博弈方在非常精确的同一时点同时决策是不可能的。因此,同时决策是指可近似地看作同时作决定的过程,如乒乓球团体赛的出场顺序,虽双方决策可能有早有晚,但一旦敲定便谁也不许变更,因而可看作同时决策。各博弈方不是同时决策,而是先后、依次决策、行动的博弈叫动态博弈。弈棋就是一种典型的动态博弈,双方的每一步都将取决于前面的情势。4,按信息划分,如按得益信息分类,可分为完全信息博弈与不完全信息博弈。完全(complete)信息,是指各方对自己每种策略的得益情况完全清楚,否则是不完全信息;在动态博弈中,如按博弈进程信息分类,可分为完美信息动态博弈与不完美信息动态博弈。完美(perfect)信息,是指博弈方在决策前对其他博弈方的行为完全了解,否则是不完美信息。5,按得益情况划分,可分为零和博弈、常和博弈和变和博弈。一方收益必来自另一方的损失,这样的博弈叫零和博弈,零和博弈的博弈方始终是对立关系;各方都会有收益,但收益总和是一固定常数,这样的博弈为常和博弈;各方不同的策略组合会有不同的收益,这样的博弈称变和博弈。显然,零和博弈是常和博弈的特例,常和博弈是变和博弈的特例。6,综合分类。综合分类是将博弈次序与博弈信息结合起来的一种分类方法。按这两个标准,可将博弈分为:完全信息静态博弈、不完全信息静态博弈、完全且完美信息动态博弈、不完全但完美信息动态博弈、完全不完美信息动态博弈以及不完全不完美信息动态博弈。这种分类方式有助于针对不同特性的博弈进行研究和求解。

博弈论 (Game Theory),是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。因此,博弈论又称为“对策论”,也就是说当一个主体,比如一个人或一个企业的选择受到其他人、其他企业选择的影响,而且反过来影响到其他的人、其他企业的决策问题和均衡问题。正是在这个意义上,博弈理论又译为“决策理论”。博弈论创立于20世纪40年代,到50年代博弈论的研究达到了顶峰。博弈论研究的决策不仅包括经济学领域,而妾包括政治学、军事、外交、国际关系、公共选择等各个领域,因而博弈论又被称之为方法论。本文拟将这种方法引入到反垄断法领域,具体分析反垄断法规则的制定过程。

二、反垄断法的博弈分析

(一)政府和企业之间的博弈分析

进化博弈理论范文第3篇

关键词:经济行为;博弈论;应用

一、引言

博弈论也被称为对策论、游戏理论,它是运筹学中的一个重要分支,是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。博弈论是由美国数学家在1944年首先创立的,世界上也有几名博弈论专家因将博弈论应用到经济学中而成功的获得诺贝尔经济学奖。由此可见,博弈论与经济学一直都有着千丝万缕的联系,博弈论的成功之处就在于将一个复杂的经济现象中抽离出数学基本模型,从另外一个视角来帮助我们更加直观的来掌握生活中的经济现象。博弈论成功的应用于经济学,这就使得经济学越来越侧重于人与人之间关系的研究,为研究经济行为主体提供了很好的方法论依据。

在过去的几十年中,博弈论为经济学的发展贡献了自己的一份力,也逐渐占据了经济学的核心地位。博弈论已经成功的将宏观经济学和微观经济学的研究紧密的结合起来,为经济复杂性的现象研究提供了新的思路。在市场经济飞速发展和市场经济竞争日趋激烈的今天,博弈论为经济学的研究提供了一个很好的方法论。在市场经济条件下,企业与企业之间既有竞争的关系又是高度依存的,每个企业在自己的发展过程中够应该选择一定的策略,在决定采取任何措施之前都要对对手做出的反应进行很好的预估,并相应的做出下一步的对策。

二、博弈论的主体构成部分及其分类

博弈论简单的来说就是一些个体或者组织,面对一定的环境条件和一定的规则下,同时或者先后、一次或者多次,从各自允许选择的行为或者策略中进行选择并且加以实施,各自取得相应结果的全过程。

博弈的分类同样也是多种多样的,可以根据参加人的多少分为二人博弈和多人博弈;根据参加者是否选择合作分为合作博弈和非合作博弈;根据博弈结果的不同分为零和博弈、常和博弈和变和博弈。在日常的经济行为中,合作博弈理论和非合作博弈理论是比较经常研究的方向,合作博弈理论主要强调的是集体理性,而非合作博弈理论则是主要研究人们在利益相互影响的局势中如何选择策略进而使自身的利益达到最大化。除非是为了实现自身利益最大化的需要,否则不会去考虑其它个体利益的一种决策原则。这种非合作博弈理论要求参与者中不能存在任何有约束力的协议,这也就是要求各参与者之间不能事先串通。现在大家所说的博弈论基本上是指非合作博弈论,广泛应用到经济学等各个领域。竞争无处不在,竞争是一切社会经济关系的根本基础。在市场经济条件下,合作是有条件和暂时的,不合作才是普遍的,这也就从客观上证明博弈论在现代经济生活中存在着应用的可能性与必要性。

三、博弈论在经济学中的应用

企业是以营利为目的的市场主体,最大的希望就是想要达到利润最大化。我们经常说市场经济中的两只手,就是“看的见的手”和“看不见的手”。企业在相互竞争过程中就会渐渐发现只有企业之间联合起来,形成市场垄断,这样才能更好的控制市场,达到盈利的目的。但是这样的结果是消费者是最大的受害者,想买的东西却买不起。但是企业之间为了保护自己的利益最大化,依然不肯选择降价,最后会导致市场崩溃,这就是自由竞争中最大的恶果。所以针对这样的情况,政府必须要伸出调节之手,对自由竞争中产生的恶果进行市场调节,避免更大恶果的出现。这种政府对企业的管制和对市场的调节就是经济行为中最大的博弈,因为政府想要达到的结果是市场稳健的进行,但是这和企业之间想要达到的利益最大化相冲突,所以这两种力量之间的博弈是随时都会发生的,至少在社会主义社会中是不可能消失的。博弈论广泛而深远地改变了经济学家的思维方式,传统的西方主流经济理论都建立在自由竞争的市场经济基础之上的。博弈论注重经济生活中各个方面,随着社会经济的发展,社会向更大规模和更集中的方向发展,博弈论在经济行为中运用范围越来越广。

博弈论应用于经济学已经成为现代经济学发展的大趋势了,随着对博弈论研究的日益进步和经济复杂程度的变化,博弈论的研究也成为热点。主要的表现在以下几个方面:

1、博弈论分为的合作博弈和非合作博弈,在日常的经济行为中主要表现为企业投资者花钱雇佣管理者管理企业时,通常是采用合同的方式来明确双方的责任和义务,使双方都能获得最大的经济利益,这就是合作博弈。另外一种情况则是非合作博弈,这种博弈方式更加看重的是自己一方的利益,这样做的结果很有可能最后造成集体的非理性,但是合作博弈则是强调的是集体理性,如经济行为中的讨价还价。在市场竞争日趋激烈的今天,完全竞争的市场结构已经不再存在,不完全竞争的市场结构日益显现。这就要求博弈双方在进行行为决策时,需要一定的条件和规章去约束,进而更好的规范经济行为,规范市场,最后以达到经济稳定的均衡状态。在任何经济行为中,个体永远离不开社会这个复杂的大系统,为了维持这个系统的相对稳定,也是需要协议的约束,所以合作博弈成为一种趋势。在经济行为中如中央和地方一直都是处于博弈的状态,最终形成地方强、中央弱的局面。如果建立一种新的更适合的博弈规则,最大限度的保护地方利益,最终达到全局利益的相对均衡,才能更好的解决地方和中央的理性冲突。为了更好的实现协议,可以建立一种激励政策,对于合作的地方政府以政策上的支持与奖励,对不合作的地方政府以相应的惩罚。这样就可以使双方都获得合理的利益,避免出现利益的极端化,造成不必要的损失。

2、博弈论对于信息的占有也是有很大讲究的,博弈参与者根据各自的信息分布类型来选择可以使自己利益最大化的策略。在科学技术发展的今天,信息的掌握程度已经成为市场主体间竞争成败的重中之重,谁能获得和传递更多的信息,谁就能最终获得胜利,所以,在日常经济行为中,博弈论中的信息研究越来越受到重视。例如在公共物品配置的过程中,不同的利益主体在信息不对称的条件下,做出符合自己实际情况的策略,得到不同的收益和均衡解,任何的经济行为,都可以通过对策完美均衡解来解释。

3、在以往的博弈论研究中,参与者的决策大多是非连续性的。但是随着竞争的越来越激烈化,信息也在决策中扮演重要角色,博弈论的研究也更趋向于连续化。博弈论作为一种强有力 的分析工具,广泛的应用于经济学领域。

四、博弈论在经济学中的应用实例

在我国的电力市场中竞争非常的激烈,参与者如何在市场经济允许的条件喜爱运用策略进行合法竞争最后使其利益最大化,并且如何预测和判断不合理竞争现象,这些都是需要运用博弈论来进行研究的。在上个世纪初,我国的电力企业充分显示了规模经济化,市场垄断可以为用户提供便宜但是又相当可靠的电力。但是随着科学的不断进步,电力企业的规模经济已经不能适应社会的发展,发电机组的效率也是已经达到了极限。以往的规模经济已不占什么优势,垄断经营模式的缺点也一点一点显现出来,例如生产效率低下、生产成本提高、企业内部缺乏活力等问题。所以在20世纪中后期,为了改变这种情况,许多电力企业开始改革自身的体制,打破垄断,建立更加公平、公开的电力市场。电力企业改革的主要目标是减少最终用户的用电成本,并最终降低整个电力工业的生产成本,吸引更多的投资,使自身的竞争力增强,最终实现社会资源的优化配置和社会福利最大化。电力企业在参与市场竞争定价时,企业的收益不仅仅是取决于自己公司的报价,很大程度上牵制了其他发电企业的报价,发电公司的报价过程就是一种竞价博弈。这样发电公司必然要运用博弈策略使得自己的企业在竞争中取得更大的利益。一些电力企业还可以相互组成一个利益集团,联合在一起来控制电力市场的价格,从而可以抬高市场价格,这些都是博弈论的思想策略。

在电力企业中,考虑到交易模式,这是竞价的首要条件。其中交易模式住哟啊有两种,一种是发电方直接将电卖给用户,这就属于双边交易模式,这期间不需要任何中介机构的参与,是一种完全竞争的交易模式。发电方可以接受用户的直接选择,但同时也取得了选择用户的权利,发电方可以很自由的进入或者退出市场。而另外一种则是发电公司通过中介机构(电力企业)和用户之间进行交易,在这种交易模式下,所有的发电企业都将电卖给电力企业,电力企业负责整个电能的买卖管理和整个电网的安全运行。为了更好的体现经济行为中的博弈论,本文主要介绍后一种交易模式的博弈论体现。电力企业可以进行区域间功率交换以取得更好的经济效益,比如我国的西电东送工程,就可以得到错峰效益和水火联合调度的效益等,更可以提高电力系统的安全性和可靠性,降低成本,提高经济效益。

在过去传统的发输电过程中主要是由一个部门统一决策和实施的,相应的定价方法也是以设备和运行的成本作为依据,所以投资能够确保回收。但是在现在的电力市场中,发电容量的大幅度增加主要是由各个独立的发电企业自己来决定的,输电的具体规划也很难与发电的规划相适应和协调,并且投资的主体也呈现多元化的趋势。虽然在市场化经济的今天,各方面的改革使得社会资金可以自由地进入到这个原本垄断的行业,但是更多的不确定性也造成了各方决策的困难程度。传统的发电扩建中,需要考虑的主要有扩建容量、地点和建设周期等,主体目标是以最大的成本来满足负荷增长的需要。但是在竞争日趋激烈的电力市场中,电力企业的目的是使利润达到最大化,尤其是想将成本能够尽快的收回。所以这就不可避免的要求发电厂扩建的周期逐渐的缩短,所以就存在着各个电力企业中的博弈行为。电力市场竞争的日趋激烈,使得原本垄断的行业逐渐分成各个不用利益的主体。这就不可避免的会出现运行成本要各个电力企业合理分摊,而合作博弈中的关于成本分摊的理论恰好可以很好的解决这个问题。在电力市场中,需要电力企业分摊的成本主要是有输电网固定成本、网损和输电阻塞成本。这其中输电网固定成本的有效回收是电网公司能够正常运行的有利保障,所以输电网络的固定成本在用户间进行合理有效的分摊是解决问题的关键,为了降低各自需要承担的费用,各个电力企业很有可能相互勾结,这也充分反映出博弈论研究在经济行为中的运用。

由于电力企业的最终目的都是通过各种策略来使自己的利益最大化,所以一些不合理的企图控制市场的行为也会随之出现。这就在客观上要求在市场运营时运用博弈论来判别和分析这些不合理行为,尽最大能力去防止这类行为的发生,并且要进行及时的纠正,这也是博弈论在电力企业中成功应用的一个案例。由于电力商品的特殊性,这些电力企业很有可能联合起来,运用协作博弈的方法进行投标对市场进行垄断,所以在市场正常运行的情况下必须要阻止这种寡头问题的出现。如果一旦出现一些电力企业利用线路阻塞、峰荷运行的工况造成机组必须运行的机会,运用博弈方法和策略哄抬电价的行为更要及时制止。国家为了减少电力企业报高价以获得更好的利润及时的采取措施,制定合理的上网竞价规则,使这些电力企业的竞价能够更接近边际成本,合理的竞价规则则可以改变竞价博弈的支付结构。所以这就要求电力企业在市场经济条件下更应注意竞争和调节的关系。政府的监管部门也应该在促进电力企业提高生产效率和管理水平的同时,对电力市场进行更好的宏观调控、制定出合理的竞价规则,使电力企业的利润都存在在合理的范围之内,才能保证我国电力市场的平稳发展。

五、总结

博弈论是一种独特的经济学理论,是研究人类经济行为的重要放大,在经济学领域占有非常重要的地位。在经济世界中,无时无刻不在演绎着博弈,优秀者们用世人叹为观止的手法去赢得最后的胜利。博弈论创造了一种全新的、科学的思维方式,这种思维方式有助于人们在负载的经济现象中做出理性和科学的选择。从博弈论的角度去看待我们日常生活中的经济行为,每个局的走向都将有理可依。当经济行为和博弈论这两门博大精深的学问得到完美融合的时候,瞬间就拥有了无限的魅力,引人去深思、去追寻。(作者单位:燕山大学)

参考文献

[1]谢识予编著.经济博弈论[M].上海:复旦大学出版社,1997.

[2]张维迎.博弈论与信息经济学[M].上海:上海三联书店,上海人民出版社,1996.

[3]李保明.效用理论与纳什均衡选择[M].北京:经济科学出版社,2003.

[4]彭建刚.博弈论与西方经济学的发展[J].经济学动态,1998(5).

[5][美]哈尔.瓦里安.微观经济学[M].周洪,等译.北京:经济科学出版社,1997.

[6][英]亚当.斯密.国民财富的性质和原因的研究(上卷)[M].郭大力等译.北京:商务印书馆,1972.

[7]侯光明,李存金.管理博弈论[M].北京:北京理工大学出版社,2000.

进化博弈理论范文第4篇

内容摘要:本文在梳理经典博弈论理论体系及其应用领域的基础上,对其发展趋势进行了展望。分析显示:经典博弈理论按其发展的脉络来划分,主要包括静态博弈、动态博弈、完全信息博弈和不对称信息博弈等几大理论体系;其应用领域主要涉及管理学中的激励问题,信息经济学中的信息甄别、信号传递和社会学中“合作与冲突”这一古老而又永恒的主题;其发展方向表现为扬弃“理性假设”条件下的行为博弈。

关键词:纳什均衡 信息经济学 激励理论 行为博弈

经典博弈理论体系

博弈论又称对策论,英文名称是Game Theory,是研究一些个人,一些团队或组织面对特定的环境条件,在一定的规则制约下,依靠所拥有的信息,同时或先后,一次或多次,从各自允许选择的策略进行选择并加以行动,并从中各自取得相应结果或支付的过程的理论。博弈论的主要研究目的是研究博弈各方的行为特征,即各决策主体行为发生直接的相互作用时的决策特征;以及何种情况下采取哪种策略,会达到什么样的结果即决策主体决策后的均衡问题。

博弈思想可以追溯到我国古代“田忌赛马”的故事,但一般认为,1944年冯•诺依曼和奥斯卡•摩根斯坦恩合著的《博弈论和经济行为》形成了现代博弈论的基本分析框架,标志着系统的博弈论初步形成。上世纪50年代,数学天才纳什明确提出“纳什均衡”这一概念,使经济学中的均衡问题发生了质变(从“瓦尔拉斯均衡”突破到“纳什均衡”)。“纳什均衡”的提出抓住了问题研究的关键,为博弈论的应用和发展奠定了坚实基础。“纳什均衡”描述的是行动双方的均衡问题,即“如果一个博弈存在一个战略组合,任何参与人要改变这一战略组合都可能导致降低自身的效用水平(或只能保持原有的效用水平),因而任何参与人都没有积极性去改变这一战略组合,这一战略组合称为该博弈的纳什均衡。

“纳什均衡”实现了合作博弈向非合作博弈的转化,但纳什均衡是“基于一个时期的模式”而非“动态模式”,纳什均衡没有考虑自己的选择行为如何影响博弈对手的战略,且允许不可置信威胁战略的存在,经常遇到一个博弈中存在多个纳什均衡,难于预见哪个均衡会发生等问题。为了弥补纳什均衡的上述缺陷,泽尔腾发展了动态的博弈。泽尔腾动态博弈模型思想集中体现在他1965年发表的著名论文《一个具有需求惯性的寡头博弈模型》一文之中,在该文中泽尔腾对“子博弈精练纳什均衡”给出了正式的定义。其基本思想是:“在扩展型博弈中的任一决策点,现行局中人利用其先行优势及后行者必然做出理性的反应这一事实,来进行选择以达到最优的纳什均衡,有限完美信息动态博弈求解可采取倒推归纳法”。泽尔滕定义“子博弈精炼纳什均衡”的中心意义是将纳什均衡中包含的不可置信威胁战略剔出出去,使均衡战略不再包含不可置信的威胁战略。它要求参与人的决策在任何时点上都是最优的,决策者要随机应变,向前看而不是固守旧略。由于剔出了不可置信的威胁战略,在多数情况下,精炼纳什均衡也缩小了纳什均衡的个数,这也是子博弈精炼纳什均衡的优点所在。

纳什均衡严格依赖于现实博弈环境难于满足的“完全信息”假设,即“所有博弈参与人均知道博弈的结构、博弈的规则和支付函数”,针对纳什均衡中“完全信息”假设的缺点,哈萨尼建立了不完全信息博弈模型,拓展了纳什分析的应用范围。哈萨尼的不完全信息博弈是在纳什均衡的基础上吸收了贝叶斯研究成果,以贝叶斯定理为出发点,对纳什均衡作了广泛拓展。哈萨尼在其论文《贝叶斯参与人完成的不完全信息博弈》中提出了不完全信息博弈模型,还证明如何把不完全信息博弈模型转化为完全但非完美信息博弈模型,使得博弈模型易于处理,为信息经济学的发展奠定了理论基础。哈萨尼提出的“贝叶斯-纳什均衡”是指在静态不完全信息博弈中,参与人同时行动,没有机会观察到别人的选择;由于每个参与人按照贝叶斯原则仅知道其他参与人类型的概率分布而不知道其真实类型,且不可能准确地知道其他参与人实际上会选择什么战略;但是能准确地预测到其他参与人的选择是如何依赖于其各自的类型;因此参与人决策的目标就是在给定自己的类型和别人的类型依从战略的情况下,最大化自己的期望效用。即“给定自己类型和别人类型的概率分布的情况下,每个参与人的期望效用达到了最大化,也就是说没有人有积极性去选择其他战略组合”。而应用于不完全信息动态博弈的均衡的概念是“精炼贝叶斯均衡”,这个概念是完全信息动态博弈的精炼纳什均衡和不完全信息静态博弈的贝叶斯均衡的结合,泽尔腾、克瑞普斯和威尔逊及弗登伯格和泰勒等学者为此做出了重要贡献。精炼贝叶斯纳什均衡的要点在于当事人要根据所观察到的他人的行为按照贝叶斯原则来修正自己有关后者类型的主观概率,并由此选择自己的行动。也就是说精炼贝叶斯纳什均衡是一个数学上的“不动点”。即满足:给定每个关于其他参与人类型的主观概率的情况下,参与人的战略选择是最优的;每个参与人有关其他参与人类型的主观概率均是按照贝叶斯法则从所观察到的行动中获得的。不完全信息博弈运用现代随机分析方法解决信息不完全或不对称下的决策问题,由此发展起来的不完全信息动态博弈模型使博弈论的理论研究与实际应用更加紧密。

博弈论的主要应用

就博弈论发展而衍生的信息经济学而言,除哈萨尼所做的开创性工作之外,维克里和莫里斯也对不对称信息条件下的激励理论做出了重要性贡献。维克里上世纪40年代关于个人所得税税制问题的思考:“收入均等化并不能解决理想税赋结构难题”,因为这一方案没有给个人努力工作提供激励,因而不会产生社会效率最大化。莫里斯通过设计递减税率回答了维克里的税制难题,并致力于信息不对称条件下隐藏行动理论方面的研究。莫里斯上世纪70年代的系列研究成果奠定了委托-理论模型框架,并确立了激励相融契约必需满足的两个约束前提。其一是参与约束:委托人所选的效用函数必须使人因接受合约而获得的效用不小于因拒绝合约而获得的效用;其二是激励相融约束:合约缔结后人在所选行动上的边际收益等于边际成本。

1970年,著名经济学家阿克洛夫在《经济学季刊》上刊发了具有划时代意义论文《柠檬市场:质量不确定性和市场机制》,该文研究了一种商品市场,其中出售者对商品质量的了解比购买者要多,并以二手车市场为例进行说明。由于文章阐述了一个简单而又深奥的普遍化思想,并因得到应用广泛而产生重大影响。阿克洛夫在该文中对具有逆向选择这一信息问题的市场进行开创性分析,指出信息不对称问题可能导致该市场崩溃,或者只有劣等产品充斥其中。“柠檬论文”解释了信息不对称导致的市场低效率,同时该文的另一个独到见解是经济主体有强烈的激励去抵消信息不对称问题对市场效率的不利影响。

继阿克洛夫之后,斯彭斯着重研究如何改善信息不对称以提高市场效率问题,即信号传递模型。信号传递模型描述的是信息富有的一方如何可靠地将信息传递给信息缺乏的一方,以减少双方之间信息不对称、促进交易的达成、提高市场效率。斯彭斯以劳动力市场为例,研究得出只有当信息富有者的传递路径产生的费用绝对高于其它传递途径产生的费用时,该信息富有者的信息传递才具有效率。该模型很好地解释了商标、广告、教育文凭等信息传递问题。为减少信息不对称,提高市场效率,提供操作上的理论依据。

在斯彭斯之后,运用博弈论来研究信息不对称市场的另一位集大成者乃诺贝尔经济学奖得主,信息经济学的集大成者斯蒂格利茨。斯蒂格利茨在1974年之后发表的一系列论文中,构建了以不完全信息和不完备市场为前提的新模型,描述了信息不对称条件下市场运行机制的变化。他通过对保险市场、农业土地租赁市场、信贷市场和劳动力市场的考察,证明了信息不完全和信息不对称的普遍性,说明在这样的市场中,传统的价格机制实现帕累托效率的有效性值得怀疑,从而对以彻底的私有化和市场化为导向的改革模式(即“华盛顿共识”)提出了质疑。其中,1981年斯蒂格利茨和温斯合作发表的文章《信息不对称市场的信贷配给》堪称当代信贷文献的典范,该文详细论述了信贷过程中不同阶段银行面临的各种风险。该文创立的逆向选择模型与道德风险模型对分析金融问题具有划时代意义。

继博弈论在经济学领域取得巨大成功之后,以以色列博弈论专家奥曼与美国国防经济学者谢林为代表的博弈论推崇者则努力运用博弈论来解决“合作与冲突”这一古老而又永恒的社会问题,使博弈论由经济领域拓展到社会领域。奥曼与谢林分别从数学和经济学的角度重塑了关于人类交互作用的博弈分析范式。谢林从非合作博弈的角度加深了人们对社会交互作用机理的理解,而奥曼则发现一些长期的社会交互作用可以运用正式的非合作博弈理论来进行深入分析。

博弈论发展趋势

博弈论以决策者之间的相互影响为主要决策因变量导致经济学从“瓦尔拉斯均衡”突破到“纳什均衡”的质变,经典博弈论从静态博弈到动态博弈,信息完全到信息不对称博弈均是在放松理论假设的前提下使博弈理论分析与经济社会现实更加接近,以增强其实用性和对经济社会现象的解释能力。经典博弈理论作为经典经济学的分析工具,其共同秉承的“理性人”假设、不可观测的效用函数假设和主观概率假设是经典博弈论的主要局限,上述假设的存在使经典博弈被戏称为“研究‘天才’决策的理论”,现实经济社会中也出现过很多经典博弈理论无法解释的异象。随着行为经济学的兴起并得到社会的认同,基于理性人假设的经典博弈理论自然而然遭受到行为学派的挑战,考虑参与者“有限理性”、“情感”、“环境”、“经验”、“制度文化”等现实因素的行为博弈论成为近年来博弈论的发展方向。

与经典博弈理论比较,行为博弈论的最大特点是考虑了人类的非理性因素,其研究目的是研究博弈参与人实际做出了什么行动,可以说行为博弈论是实验经济学与行为经济学的一个分支。行为博弈论近年来在“囚徒困境”模型重释、投资博弈模型、可置信威慑的议价博弈模型、大陆分水岭协调博弈模型及选美比赛博弈模型等方面取得了重要进展,很好地解释了经典博弈论无法解释的一些现象。但行为博弈同样面临“有限理性”中“有限”度的量化,“经验”因素中参与者的“学习”问题以及“学习”如何及何时影响博弈均衡结果等问题。上述问题的存在形成了行为博弈未来的主要研究方向:一是学习过程中的自利行为和利他行为怎样导致社会偏好的变化;二是在重复博弈中,随机最优反应函数的地位如何,参与者关于博弈对手和环境的信息信念如何变化;三是组织、团队乃至企业的博弈行为将在何等程度上与个体博弈存在差异,引发该差异的机制是什么,社会认知空间的变化对博弈行为有何影响等等。

结论

值得一提的是经济领域的至高荣誉诺贝尔经济学奖特别偏爱博弈论领域的集大成者。瑞典皇家科学院诺贝尔奖委员会分别于1994年、1996年、2001年和2005年将诺贝尔经济学奖授予经典博弈论的杰出贡献者纳什、泽尔腾与哈萨尼,博弈理论的实践人、激励理论创立者维克里和莫里斯,博弈论衍生的信息经济学的奠基人及集大成者阿克罗夫、斯彭斯与斯蒂格利茨,博弈论应用领域的拓展者以色列数学家奥曼和美国国防经济专家谢林;以表彰他们在博弈论领域的卓越贡献。博弈论领域的多次获奖彰显博弈论对现代经济理论特别是市场交易理论的突出贡献。

参考文献:

1.张维迎.博弈论与信息经济学[M].上海人民出版社,2004

2.斯蒂格利茨,沃因,韦坎德.契约经济学.经济科学出版社,1999

3.John Chahes Harsanyi. Games with Incomplete Information Played by Bayesian Players Parts I, II and III. Management Science, 1967

4.John von Neumann and Oskar Morgenstern. The Theory of Games and Economic Behavior. Princeton: Princeton Universty Press.1944

进化博弈理论范文第5篇

关键词:博弈论;供应链管理;均衡

abstract: game theory focus on the status analyze of conflict and cooperation. with the development of competition and cooperation among modern enterprises, game theory is widely used in supply chain management(scm). this paper classified the applications of game theory in scm into two groups: applications in traditional problems of scm, and applications in scm network equilibrium. the paper made a depth literature review of these two categories and gave out the future research trends.

key words: game theory; supply chain management; network equilibrium

0引言

博弈论所研究的是多种决策情况(博弈)中,每位决策者的最优决策和这些最优决策所构成的可能结果,以及这些结果的相关特性[1]。wWW.133229.cOM博弈论关注于包含冲突与合作的状态分析[2],目前的应用领域非常广泛。供应链管理是对从原材料采购到产成品消费整个过程所产生的各种关系、信息、物流等进行管理,以改善顾客服务和增加经济价值的流程[3]。近年来,随着供应链中企业间的竞争与合作不断增强,博弈论作为一种分析企业间相互竞争及相互合作的工具再次被广泛应用,主要用于解决供应链管理中的库存决策、产量/价格博弈、多决策分析及供应链网络的均衡等问题。

1博弈论在供应链管理中的应用现状

供应链由不同的企业组成,企业间相互竞争的同时也相互合作,随着供应链由“链”向“网”的转变,企业间关系越来越复杂,不仅存在着上下游企业的竞争与合作,还包括不同供应链的核心企业间的竞争与合作问题。纵观供应链管理弈论的应用研究,本文将博弈论在供应链管理中的应用分为两大类:博弈论在传统供应链问题中的应用;博弈论在供应链网络均衡中的应用。

(1)博弈论在传统供应链问题中的应用

cachon和netessine根据供应链管理的应用,将博弈论分为四种类型:非合作静态博弈、动态博弈、合作博弈和贝叶斯博弈[2];leng通过对130多篇供应链管理中运用博弈论的文献进行总结,认为博弈论在供应链中的应用主要有五种类型:固定单位采购成本与库存博弈、数量折扣下的库存博弈、产量和价格竞争博弈、其他属性的博弈(能力决策、服务质量、产品质量等)及联合决策博弈(能力、服务/产品质量、产量/定价、广告/新产品开发等决策内容的组合博弈)[2]。

在供应链的传统问题中,博弈论主要用于解决单阶段或两阶段供应链的上下游企业间存在的决策博弈,parlar分析了单阶段,两个零售商出售同质可替代产品进行订货决策以使各自利润最大化的问题[4];cachon研究了两阶段情况下,一个供应商与一个零售商的库存决策问题[5];monahan针对数量折扣现象,研究了供货商和购买者在顺序决策情况下,供货商的最优折扣决策[6],而kohli和park就供应链两阶段成员间基于数量折扣的合作问题进行了探讨[7];随着市场竞争的加剧,企业需要在控制成本的前提下提供令顾客满意的服务和产品,gans研究了m个供应商之间的服务质量竞争问题[8],而cohen和whang研究了售后服务质量决策问题[9];最近10年来,随着供应链问题研究的深入,多决策博弈问题也受到了重视,例如bernstein和federgruen研究了两阶段下,单个供应商和n个零售商在库存和产量/定价联合决策下的零售商利润最大化问题[12]。

(2)博弈论在供应链网络均衡中的应用

随着供应链成员的增加,供应链中“流”的复杂化,供应链由链状结构逐步发展成网络结构,而供应链网络的均衡问题也受到了越来越多学者的重视。

nagurney对由制造商、零售商以及市场组成的三层供应链建立了单一产品下需求确定的网络均衡模型,指出供应链网络均衡是其中的产品流、资金流等满足所有决策者的优化条件,即控制供应链网络的有限维变分不等式的解[11];dong在nagurney的研究基础上对单一产品的随机需求情况进行了研究,以三方各自追求利益最大化(非合作)为目标,建立了相应的供应链网络均衡模型[12];张铁柱对需求确定情况下的多产品供应链网络进行了均衡建模研究[13];藤春贤对多产品随机需求的供应链网络进行了均衡建模研究[14]。以上这些研究都是基于静态博弈进行的供应链上下游企业间的博弈问题研究,由于企业间的博弈随着时间的变化而不停变化,如何解决供应链企业间存在的动态博弈成为研究的下一个方向;此外,在供应链网络中,不仅仅存在上下游企业间的竞争与合作,不同供应链之间的核心企业之间也普遍存在竞争与合作。李春发假设需求受时间影响,针对单产品供应链网络进行了上下游企业间的动态博弈研究[15];黎继子针对不同供应链的核心企业间博弈进行了相应研究,但仅局限于同质产品的情况[16]。

2总结与趋势

博弈论在供应链管理中的广泛应用证明了博弈论在帮助解决供应链中存在的多种问题的有效性,包括库存决策、产品定价与产品数量、库存/定价/质量/广告等多决策问题,以及供应链成员间的竞争合作问题等,而且随着供应链网络的复杂化,也需要利用博弈论来解决相关网络均衡问题。

在当前研究中,nash均衡和stackeberg均衡常常作为解决非合作博弈的方法被广泛使用,而旁支付方法较多地运用于解决供应链成员间的合作问题,核、shaply值及核仁的运用相对较少;而且多数研究是针对供应链的静态博弈进行分析,而在现实的供应链网络运作中,企业更多是随着时间的推移和根据其他供应链成员的决策进行动态决策,因此如何将动态博弈理论应用于供应链管理研究也将是下一个研究热点。

参考文献:

[1] 杨荣基,彼得罗相,李颂志. 动态合作——尖端博弈论[m]. 北京:中国市场出版社,2007.

[2] leng, m. and m. parlar. game theoretical applications in supply chain management: a review[j]. infor,2005,43(3):187

-221.

[3] b.j lalonde. supply chain management: myth or reality?[j]. supply chain management review,1997(1):6-7.

[4]m. parlar. game theoretic analysis of the substitutable product inventory problem with ramdom demands[j]. naval research logistics, 1988(35):397-409.

[5] g.p. cachon, et al. competitive and cooperative inventory policies in a two-stage supply chain[j]. management science,1999,45(7):936.

[6] j.p. monahan. a quantity discount pricing model to increase vendor profits[j]. management science,1984(30):720-726.

[7] b. kohil and h. park. a cooperative game theory model of quantity discount[j]. management science,1989,35(6):693-707. [8] n. gans. customer loyalty and supplier quality competition[j]. management science, 2002,48(2):207-221.

[9] m.a. cohen and s. whang. competing in product and service: a product life-cycle model[j]. management science, 1997,43(4):535-545.

[10]d.j. reyniers and c.s. tapiero. the delivery and control of quality in supplier-producer contracts[j]. management science, 1995,41(10):1581-1589.

[11]nagurney a, dong j, zhang d. a supply chain network equilibrium model[j]. transportation research: part e, 2002(38):281-304.

[12]dong, j., d. zhang, et al.. multitiered supply chain networks: multicriteria decision—making under uncertainty[j]. annals of operations research,2005,135(1):155.

[13] 张铁柱,刘志勇,滕春贤. 多商品流供应链网络均衡模型的研究[j]. 系统工程理论与实践,2005,25(7):61-68.

[14] 滕春贤,潘晓东. 供应链网络均衡中的利润协调问题[j]. 哈尔滨工程大学学报,2007,28(7):818-821.