友情提示:如果本网页打开太慢或显示不完整,请尝试鼠标右键“刷新”本网页!
暧昧电子书 返回本书目录 加入书签 我的书架 我的书签 TXT全本下载 『收藏到我的浏览器』

更好地学会做策略选择:博弈生存-第2部分

快捷操作: 按键盘上方向键 ← 或 → 可快速上下翻页 按键盘上的 Enter 键可回到本书目录页 按键盘上方向键 ↑ 可回到本页顶部! 如果本书没有阅读完,想下次继续接着阅读,可使用上方 "收藏到我的浏览器" 功能 和 "加入书签" 功能!

  在囚徒困境中存在惟一的纳什均衡,该均衡为两个囚犯均选择“招认”。这是一稳定的结果。
  有些博弈的纳什均衡点不止一个。如下述“夫妻博弈”(或称性别之战)中有两个明显的纳什均衡点。丈夫帕特和妻子克里斯商量晚上的活动。丈夫喜欢看拳击,而妻子喜欢欣赏歌剧。但两人都希望在一起度过夜晚,双方的支付矩阵如下:

夫妻博弈
丈夫
  妻子
歌剧
拳击
歌剧
2,1
0,0
拳击
0,0
1,2  在这个“夫妻博弈”中有两个纳什均衡点:(歌剧,歌剧),(拳击,拳击)。读者可试着检验这两点是否符合纳什均衡的定义。
  在任何一个博弈中,在有两个或两个以上纳什均衡点的博弈中,其最后的博弈结果我们难以事先预测。在“夫妻博弈”中,我们无法知道,最后结果是一同欣赏歌剧还是一起去看拳击。也许因双方都知道的性格,比如妻子扭不过有大男子主义的丈夫,每次这样的博弈其结果都是一起去看拳击;也许因夫妻长期博弈而形成的“习惯”,如“妻管严”,每次这样的博弈其结果都是一起看歌剧。
  是不是所有的博弈存在至少一个纳什均衡点呢?是的。但纳什均衡点不一定是那种纯策略纳什均衡点——所谓纯策略是指参与人在他的策略空间中选取惟一确定的策略,而可能是一个混合策略(mixed strategy)均衡点——所谓混合策略是指参与人采取的不是惟一的策略,而是其策略空间上的一种概率分布。这就是纳什于1950年证明了的纳什定理。我们下面将在“警察与小偷的故事”例子中给出混合策略的说明。
  在有些博弈中,纳什均衡有无穷多个。举一个例子:两人分100元钱,若两人为自己提出的钱数之和不超过100元,即小于或等于100元,则按照所提出的方案来分配,若提出的钱数总和超过100元则两人均无所得。此时的纳什均衡是:两人为自己提出的分配所得之和为100元。如:(20,80)是一个纳什均衡;(30,70)也是一个纳什均衡……这样的均衡有无穷多。之所以“两人提出的分配之和为100”构成纳什均衡,是因为一旦两人提出的方案满足这个条件(总和为100元),每个人不会单独改变方案——若某个人改变方案,他的收益会降低。其他分配方案不能是纳什均衡,因为:若分配方案之和小于100元或大于100元,两人都有单独改变方案的动机。因此,也可以说,“两人提出的分配之和为100元”构成该博弈的纳什均衡的充分必要条件。
  对于纳什均衡,博弈论给出这样的结论:一个博弈若只有一个纳什均衡,那么该纳什均衡点构成该博弈的结果,若博弈是完全信息博弈,该博弈的纳什均衡能够在一次博弈中实现。这个均衡结果因而是可预测的。若不是完全信息博弈,该博弈均衡可能在参与人不断地学习中达到。这是重要的结论。当然,若博弈不止一个纳什均衡,我们无法事先预测该博弈结果,除非给出其他条件。
  无论一个博弈有多少个纳什均衡,某个纳什均衡一旦达到,博弈将稳定在这个均衡之上,任何一个参与人都没有单独改变策略的动机。这是纳什均衡重要的特点。
  我国研究纳什均衡的专家谢识予博士在《纳什均衡论》中用通俗的话表达了纳什均衡含义:给定你的策略,我的策略是最好的策略;给定我的策略,你的策略也是你最好的策略。这就是说,双方在对方的策略下自己现有的策略是最好的策略。即:此时双方在对方给定的策略下不愿意调整自己的策略。这里的策略包括混合策略。
  纳什均衡是博弈论中的重要概念,同时也是经济学的重要概念。诺贝尔经济学奖获得者萨缪尔森有一句幽默的话:你可以将一只鹦鹉训练成经济学家,因为它所需要学习的只有两个词:供给与需求。博弈论专家坎多瑞(Kandori)引申说:要成为现代经济学家,这只鹦鹉必须再多学一个词,这个词就是“纳什均衡”。由此可见纳什均衡在现代经济学中的重要性。纳什均衡不仅对经济学意义重大,对其他社会科学意义同样重大。我在书后的附录中用数学语言给出了纳什均衡概念及纳什均衡存在定理。
  纳什均衡被人们平凡使用,以至于普林斯顿的迪克西特()教授在一次演讲中这样说:“假如每人写到或说到‘纳什均衡’,纳什就能得到1美元,那么纳什早就变成大富翁了”。
   txt小说上传分享

博弈的类型
根据参与人能否形成约束性的协议、以便集体行动,博弈可分合作性博弈和非合作性博弈。纳什等博弈论专家研究得更多的是非合作性博弈。
  所谓合作性博弈是指参与人从自己的利益出发与其他参与人谈判达成协议或形成联盟,其结果对联盟形成方均有利;而非合作性博弈是指参与人在行动选择时无法或没有达成约束性的协议。企业的形成、政治联盟的构建等都是合作性的博弈,而囚徒困境以及本书后面所讨论的公共资源悲剧都是非合作性的博弈。
  博弈又分静态博弈和动态博弈。静态博弈指参与人同时采取行动,或者尽管参与人行动的采取有先后顺序,但后行动的人在行动时不知道先采取行动的人采取的是什么行动。动态博弈指参与人的行动有先后顺序,并且后采取行动的人在行动决策时可以观察到先采取行动的人所采取的行动。
  从知识的拥有程度来看,博弈分为完全信息博弈和不完全信息博弈。信息是博弈分析所要涉及到的重要的内容。完全信息博弈指参与人对所有参与人的策略空间及策略组合下的支付有“完全的了解”,否则是不完全信息博弈。严格地讲,完全信息博弈是指这样的博弈,参与人的策略空间及策略组合下的支付是博弈中所有参与人的“公共知识”,否则是不完全信息博弈。
  这只是对博弈论的简单介绍。关于其中的详细内容,读者应参阅有关书籍。
  

博弈案例(1)
1.囚徒困境博弈与我国应试教育的困境 
  囚徒困境可以用来说明许多现象。我国目前的应试教育就是一个囚徒困境。
  囚徒博弈是完全信息下的静态博弈,两个小偷各种策略组合下的支付是他们之间的“公共知识”(“公共知识”将在下一章中专门讨论)。
  我们上面已经分析了囚徒对局下各个策略下的结果或支付,以及它的均衡。它的均衡是双方均选择“招认”的策略。
  可以这么说,最近10多年来,我国基础教育的问题是如何摆脱应试教育的困境问题。目前给中小学生“减负”不仅是学生家长的呼声,也是教育专家和教育管理部门的呼声,也可以说是全社会的呼声。教育管理部门这几年做了一系列的工作,但收效甚微,并没有从根本上解决问题。学校不断给学生增加负担是目前教育的实际状况。
  大家普遍认为应试教育扼杀学生的创造性,无论是专家还是家长,都在呼吁改变应试教育的模式。但是无论是专家,还是意识到教育问题的普通老百姓以及没有意识到教育问题的老百姓,其小孩都在接受着这种教育。
  在现有的教育体制下,学生(或学生家长)有两个可选择的策略:“减负”和“增负”。学生的精力是有限的,如果选择“减负”策略,意味着学生有更多的时间学习课本以外的东西,这样学生的素质得到提高,因此,“减负”策略往往与素质教育联系在一起;而如果选择“增负”策略,则意味着学生花大量的时间做大量的习题,以“学透”、“学精”课本规定的东西,学生没有时间学习课本以外的没有规定的内容。“减负”的结果是学生的全面发展;而“增负”的结果是学生获得更高的分数。
  在这样的博弈结构下,学生(或学生家长)如何选择呢?每个学生这样想:其他人采取的是“增负”教育策略的情况下,如果我采取“减负”教育策略,我的考试分数不如他人,在求学方面我会落后,接受不了好的教育,在未来求职时我也赶不上他人。在他人采取“增负”的策略下,我也应当采取“增负”策略。
  如果其他人采取的是“减负”策略,我应当采取什么策略呢?还是应当采取“增负”策略!因为,如果其他人采取的是“减负”策略的话,如果我采取的是“增负”策略,我的考试分数会比其他人高,我会上好的学校,在未来的职业竞争中我会处于优势。
  因此,无论其他人采取的是什么策略,我采取“增负”策略都是最好的。当每个学生都这样想的时候,全社会便进入了应试教育这样一个囚徒困境之中。
  如果我国现有的考试制度没有改变,现在假设所有的学生都选择“减负”策略,即除了做少量的巩固性的作业外,不补课、不做其他的练习题,情况会是什么样子?
  假设这种状态会出现,我们说,这种状态会很快消失,而立即会出现所有学生都进入“增负”的这样一个状态之中。可以说,均选择“减负”策略的状态是不稳定的,而“增负”的状态是稳定的均衡即纳什均衡。原因就是,目前的教育的博弈结构规定了各种行动或行为的收益或好处:获得高分的会进入好的初中、高中,进入好的初中、高中的学生可以考高分进入好的大学。在这个博弈中,对于教师来说,学生的升学率高意味着其成绩大、奖金高,对自己的学生采取“增负”策略,对于自己而言是占优策略。书 包 网 txt小说上传分享

博弈案例(2)
我国基础教育的博弈与囚徒困境有共同的结构,大家均选择“增负”策略构成基础教育博弈的纳什均衡。这是一个稳定的博弈结果。这也是为什么我国目前的应试教育难以改变的原因。
  2.斗鸡博弈与古巴的导弹危机
  试想有两只公鸡遇到一起,每只公鸡有两个行动选择:一是退下来,一是进攻。如果一方退下来,而对方没有退下来,对方获得胜利,这只公鸡则很丢面子;如果对方也退下来,双方则打个平手;如果自己没退下来,而对方退下来,自己则胜利,对方则失败;如果两只公鸡都前进,那么则两败俱伤。因此,对每只公鸡来说,最好的结果是,对方退下来,而自己不退。支付矩阵如下:
  鸡乙
  鸡甲
前进
后退
前进
…2,…2
1,…1
后退
…1,1
…1,…1  上表中的数字的意思是:两者如果均选择“前进”,结果是两败俱伤,两者均获得…2的支付;如果一方“前进”,另外一方“后退”,“前进”的公鸡获得1的支付,即赢得了面子,而后退的公鸡获得…1的支付,即输掉了面子,但没有两者均“前进”受到的损失大;两者均“后退”,两者均输掉了面子,获得…1的支付。当然表中的数字只具有相对的意义。
  这个博弈有两个纳什均衡:一方前进,另一方后退。但关键是谁进谁退?一个博弈,如果有惟一的纳什均衡点,那么这个博弈是可预测的,即这个纳什均衡点就是博弈参与人事先知道的惟一的博弈结果。但是如果一博弈有两个或两个以上的纳什均衡点,则任何人无法预测博弈的结果是什么。因此,我们无法预测斗鸡博弈的结果,即我们不能预先知道谁“前进”谁“后退”。
  用这个博弈模型来解释20世纪60年代初发生在美苏两个超级大国之间的一场导弹危机,是最合适不过的了。
  二战结束后,形成了对峙的两个超级大国,美国和苏联。这两个超级大国是两个核心,在其周围有各自的盟友,它们一起组成了两大敌对的阵营。1962年赫鲁晓夫偷偷地将导弹运送到加勒比海上的岛国古巴,卡斯特罗政权是苏联这个超级大国的盟友,是美国的敌人。苏联的目的是将导弹部署在美国的眼皮底下,以对付美国。然而苏联的行动被美国的U…2飞机侦察到了,美国发现古巴建立了导弹发射场。此事震动美国,肯尼迪总统指责苏联,并发出严重警告,而苏联方面矢口否认。美国决定对古巴进行军事封锁,派遣了舰艇、空军及航空母舰,并集结了登陆部队。美国进入戒备状态,美苏之间的战争一触即发。
  面对美国的反应,苏联面临着是将导弹撤回国还是坚持部署在古巴的选择;而对于美国,则面临着是挑起战争还是容忍苏联的挑衅行为的选择。也就是说,这两只“大公鸡”均在考虑采取进的策略还是退的策略。战争的结果当然是两败俱伤,而任何一方退下来(而对方不退)则是不光彩的事。结果是苏联将导弹从古巴撤了下来,做了丢面子的“撤退的鸡”。美国坚持了自己的策略,做了“前进的鸡”。当然,为了给苏联一点面子,同时也担心苏联坚持不退而发生美苏战争——这是美国不愿意看到的,美国象征性地从土耳其撤离了一些导弹。古巴导弹危机是冷战期间美苏两霸之间发生的最严重的一次危机。这就是美国与苏联在古巴导弹上的博弈结果。对于苏联来说,退下来的结果是丢了面子,但总比战争要好;对美国而言,既保全了面子,又没有发生战争。这就是这两只“大公鸡”博弈的最终结果。。 最好的txt下载网

博弈案例(3)

  3.骑虎难下博弈与美苏武器竞赛
  我们经常碰到的一类博弈是,行动者进也不是,退也不是。笔者将这样的博弈称为骑虎难下博弈。
  有一个拍卖,其规则是:两个参与人轮流出价,谁出得最高,谁就将得到该物品,但是出价少的人不仅得不到该物品,并且要按他所叫的价付给拍卖方。
  假定有两人竞价争夺价值100元的物品,只要双方开始叫价,在这个博弈中双方就进入了骑虎难下的状态。因为,每个人都这样想,如果我退出,我将失去我出的钱,若不退出,我将有可能得到这价值100元的物品,但是,随着出价的增加,他可能的损失也越大。每个人面临着两难:是继续叫价还是退出?
  这个博弈为耶鲁大学的舒比克教授构造出来的。
  你会说,这个拍卖的规则不合理,纯粹是博弈论专家的构想,在实际中这样的拍卖不会出现。然而,它尽管只是一个模型,在实际中我们经常会看到此模型的博弈案例。3
  在冷战期间,美苏为争夺霸权拼命发展武器,无论是原子弹、氢弹等核武器的研制,还是如隐形战斗机这样的常规武器的研制,双方均不甘落后。20世纪80年代,里根在位时准备启动“星球大战”计划,此举意味着两个超级大国的武器竞赛将进一步升级。美苏之间的武器竞赛就相当于这个骑虎难下博弈中双方轮番出价,双方均不断出更高的价,如果一方没有出最高的价钱,退了下来,即没有继续竞赛下去,那么意味着它在军备上的前期投入没有效果,打了水漂,而对方将赢得整个局面。但如果继续竞赛下去,一旦支撑不住,损失也就更大。
  1991年苏联的垮台在一定程度上是军备竞赛的结果。苏联将整个力量放在军备竞赛上,而民用建设无法跟上,国力不济,最终退下阵来。里根的“星球大战”计划其目的就是要拖垮苏联。一旦进入骑虎难下的博弈,及早退出是明智之举,然而当局者往往做不到,这就是所谓当局者迷。这种骑虎难下的博弈经常出现在国家之间,也出现在企业或组织之间,当然个人之间也经常碰到。20世纪60年代,美国介入越南就是一个骑虎难下博弈。赌红了眼的赌徒输了钱还要继续赌下去以希望返本,也是骑虎难下博弈,其实,赌徒进入赌场开始赌博时,他已经进入了骑虎难下的状态,因为,赌场从概率上讲必定赢。4
  博弈论专家将这里的骑虎难下博弈称为协和谬误。20世纪60年代,英国和法国政府联合投资开发大型超音速客机,即协和飞机。该种飞机机身大、设计豪华并且速度快。但是,英法政府发现:若继续投资开发这样的机型,花费会急剧增加,并且还不清楚这样的设计定位能否适应市场;而若停止研制,以前的投资将付诸东流。随着研制工作的深入,他们更是无法作出停止研制工作的决定。协和飞机最终研制成功,但因飞机的缺陷(如耗油大、噪音大、污染严重等等),它不适合市场,最终被市场淘汰,英法政府为此蒙受很大的损失。在这个研制过程中,如果英法政府能及早放弃飞机的开发工作,会使损失减少,但他们没能做到。
  4.警察与小偷的故事——混合策略问题
  纳什在《n人博弈的均衡点》这篇论文中,给出了均衡存在的简单证明,纳什说,在n个人的博弈中至少存在一个均衡,在这点上双方均不愿意先改变策略。这里的均衡点有可能是混合策略点。人们称它为纳什定理。
  什么是混合策略?
  我们来看一个混合策略的例子。警察部门负责一城市中某一区的治安。警察要对该区的A、B两地进行巡逻。假定该区有一群小偷,要实施偷盗。�
返回目录 上一页 下一页 回到顶部 1 1
快捷操作: 按键盘上方向键 ← 或 → 可快速上下翻页 按键盘上的 Enter 键可回到本书目录页 按键盘上方向键 ↑ 可回到本页顶部!
温馨提示: 温看小说的同时发表评论,说出自己的看法和其它小伙伴们分享也不错哦!发表书评还可以获得积分和经验奖励,认真写原创书评 被采纳为精评可以获得大量金币、积分和经验奖励哦!