Download presentation
Presentation is loading. Please wait.
1
复杂系统中演化博弈研究 背景介绍 姜罗罗 中国科学技术大学
2
提纲 演化博弈理论简介 经典博弈理论 演化博弈理论
3
1 、博弈理论简介 博弈论 (Game Theory) :研究具有斗争或竞争性质现象的 理论和方法。 三要素:参与者 (players) 集合,策略 (strategies) 集合和收益 (payoffs) 集 分类:合作博弈、非合作博弈; 静态博弈、动态博弈; 完全信息博弈、不完全信息博弈; 研究博弈论的意义:理解人类的经济行为;理解社会和生态 物种系统中的合作行为以及自自组织斑图。
4
约翰 · 冯 · 诺依曼 (J. von Neumann ) 《 Theory of games and economic behavior 》 (1944 ) ( 1 )经典博弈论 合作博弈 强调群体理性 (group rationality) ,就是从群体 的角度考虑策略的选择,使得整 体收益最大。所以合作博弈研究 的是参与者在达成合作时如何分 配合作得到的收益,即收益分配 问题。
5
纳什 (J. Nash) 的博士论文 《非合作博弈》 (1950) 非合作博弈 强调个体理性 (individual rationality) ,就是从个 体的角度考虑策略选择,使得个体 收益最大。所以非合作博弈研究的 是参与者在利益相互影响的情况下 如何选策略使自己的收益最大,即 策略选择问题 。 约翰 · 纳什 (J. Nash) 纳什均衡 (Nash Equilibrium) : 所有参与人最优策略的 组合。此时,每一个理性的参与者都不会有单独改变策略,因为 当其他人不改变策略时如果他改变策略他的收益将会降低 。 例如:在两人合作博弈中,当参与者 A 采取其最优策略 a* ,参与者 B 也采取其 最优策略 b* ,如果 B 仍采取 b* ,而 A 却采取另一种策略 a ,那么 A 的收益不会超 过他采取原来的策略 a* 的收益。这一结果对 B 亦是如此。
6
应用举例: 田忌赛马: 贵族:上等马、中等马、下等马 田忌:下等马、上等马、中等马 司马迁 《史记》
7
财富分配: a 、 b 、 c 三人投票决定如何分配 100 万,他们分别拥有 50 %、 40 %、 10 % 的权力,规则规定,当超过 50% 的票认可了某种方案时才能通过。 如何分配才是合理的呢 ? 按可以票力分配, a50 万、 b40 万、 c10 万; c 向 a 提出: a70 万、 b0 、 c30 万 b 向 a 提出: a80 万、 b20 万、 c0…… 权力指数:每个决策者在决策时的权力体现在他在形成的获胜联盟中的 “ 关键加入者 ” 的个数,这个 “ 关键加入者 ” 的个数就被称为权利指数。 夏普里值:在各种可能的联盟次序下,参与者对联盟的边际贡献之和除 以各种可能的联盟组合。 次序 abc acb bac bca cab cba 关键加入者 a c a c a b 由此计算出 a,b,c 的夏普里值分别为 4/6,1/6,1/6 所以 a,b,c 应分别获得 100 万的 2/3,1/3,1/3 。 最后通牒博弈
8
酒吧博弈 在酒吧中消费,人太多则拥挤,人少则能够享受很好 的服务。第一次到酒吧的人多,那么大多人人认为酒吧人 太多,太挤。第二次决定的时候,参考前次而不去酒吧。 少数去的人发现酒吧的人第二天很少,感觉很爽,第三次 将继续回来,并重新带回许多人 …… 循环就此开始。 如何决定下一次是否去酒吧消费? 争当少数者博弈
9
智猪博弈 小猪和大猪住在猪圈的一边(食槽在这里),开启食物的 开关在另一头,谁去踩,谁丧失先机。如何小猪去踩开关, 等小猪回来的时候大猪已经把大部分食物吃完。如果大猪 去踩开关,等大猪回来的时候小猪已经把一半的食物吃完。 对于小猪来说,最佳策略是等待大猪去踩开关,然后 “ 搭便 车 ” 获得小部分食物。然而,当大猪不去踩开关的时候,小 猪也要冒风险去踩开关。例如腾讯毫无顾忌地跟风,做 QQ 旋风,做拍拍,做滔滔。因为不甘心的小猪早早把新技术 研发的前期搞定了,大猪们只需要悄悄跟随,适当的时候 踢开挡路的,就可以了。
10
关税战: 任何一个国家在国际贸易中都面临着保持贸易自由与 实行贸易保护主义的两难选择。 X 国和 Y 国进行贸易就是 博弈。这里存在一 Nash 均衡,就是双方都实行贸易保护 主义,提高关税。在这个均衡中贸易双方采取不合作的 策略,结果使双方因贸易战受到损害。 X 国试图对 Y 国进 行进口贸易限制,比如提高关税,则 Y 国必然会进行反 击,也提高关税。结果贸易双方的利益都受到损害,也 就是损人不利己。反之,如果贸易双方都采取合作的策 略,都减少关税限制,那么双方都可以从贸易自由中获 得了最大利益。
13
( 2 )演化博弈论 进化稳定策略 (Evolutionary stable strategy) 理性、重复博弈; 策略学习动力学。
14
善良 (niceness) 、报复 (retaliation) 、宽容 (forgiveness) 、清晰 (clarity) 针锋相对 (tit for tat, TFT)
15
“ 囚徒困境 ” 博弈 M. A. Nowak and R. M. May, Evolutionary games and spatial chaos, Nature, 359, 826 (1992).
17
M. Nowak and R. May, Evolutionary games and spatial chaos, Nature ( 1992 )
18
( a ) R = 1 , R= 1.62 , S = −0.07 , P= 0 ( b ) R = 1 , R= 1.62 , S = 0.38 , P= 0 C. Hauert and M. Doebeli, Spatial structure often inhibits the evolution of cooperation in the snowdrift game, Nature, 428, 643 (2004).
19
生态博弈
Similar presentations
© 2024 SlidePlayer.com. Inc.
All rights reserved.