按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!
个博弈,并不仅仅是竞争,实际上竞争中包含着潜在合作的种子,合作中包含着潜在竞争的种子。
合作博弈并不是指合作各方具有合作的意向或态度,而是指在博弈中有一些对博弈各方有约束力的协议或契约,或者说是博弈各方不能公然“串通”或“共谋”。
合作博弈最典型的例子就是石油输出国组织欧佩克(Organization of Petroleum Exporting Countries,简称Opec)。1960年9月,伊朗、伊拉克、科威特、沙特阿拉伯和委内瑞拉的代表在巴格达开会,决定联合起来共同对付西方石油公司,维护石油收入。欧佩克在这个时候应运而生。欧佩克现在已发展成为亚洲、非洲和拉丁美洲一些主要石油生产国的国际性石油组织。它统一协调各成员国的石油政策,并以石油生产配额制的手段来维护它们各自和共同的利益,把国际石油价格稳定在公平合理的水平上。比如有些时候为防止石油价格飚升,欧佩克可依据市场形势增加其石油产量;为阻止石油价格下滑,欧佩克则可依据市场形势减少其石油产量。
对于个人来说,从博弈论的角度来看,在人生、事业一筹莫展的时候,如何能寻找到一个快速突破困境的办法?
首先要寻找一个合理的策略,而这个合理的策略,势必要建立在一个牢固的基点之上,才能切实可行。如果在困境之中,有人与你因为同样的原因无法抽身,那么是否能够和这个人一起摆脱不利的处境,在合作的基础上走向双赢呢?
《红楼梦》里面形容四大家族的时候,用过一个评语,叫做“一荣俱荣,一损皆损”,就是因为这四个家族你中有我,我中有你,相互之间有利益的合作,也有亲缘关系,所以结成一个牢固的联盟。
那么,如果两个同时处在困境中的人,也有这种利益+亲缘的双重关系,他们合作起来就会更加容易,而且形成的合力就会更大。正所谓“二人同心,其利断金”,而要做到“同心”,只有利益上的合作是不够的,还需要一种近乎亲情的亲缘关系。显然,这是可遇而不可求的,因为亲缘关系不是能够随便形成的。
智力游戏与博弈相近似的本质是:在确定游戏规则的约束下,游戏参与者决策、行动的过程。各种智力游戏实质上就是一个社会的经济、管理、军事、政治等现象抽象出来的缩微模拟模型。在这个意义上不妨说,博弈论就是研究怎么玩好游戏的理论。
游戏是一种抽象。面对复杂现象时,人们经常会“只见树木不见森林”,无法抓住某种现象的关键所在。而在游戏中,可以通过抽象出现实生活中的要点,并将干扰因素减至最低,从而轻松地分析问题并找到合理可行的解决方法。
中国最古老的围棋智力游戏,其最初的功能形态就是模拟战争。围棋包含最多的就是博弈的内涵,特别是战争中的博弈内涵,如围而歼之,生死存亡为先,争地夺利为上。围棋以获得最大的利益为胜,抽象出战争的本质和目的,来研究战争的规律。
围棋游戏的规则极其简单,不过是两气生,一气死,附加帖目、打劫等辅助规则,最终以所占地盘大小定胜负。然而,其作为一项智力游戏,围棋与战争在很多方面都相通。围棋棋手在小小棋盘上较量,就是战争、战场、战斗在棋盘上的演绎。
战争理念和战争指导思想是“基于毁伤”,以破坏、消耗、摧毁敌方为上。现代西方国家提出“基于效果”的作战思想,美国人将这一战争理念上的革命称为新的战争哲学。基于效果就是,着眼于敌方整个作战系统的控制,使之丧失作战能力。美军在伊拉克发动“斩首行动”的前一天,还专门召开了推出基于效果作战理念的新闻发布会,接着就发动了进攻。
围棋模拟出“基于效果”的战争理念,强调从全局上控制,而不是基于蝇头小利。即所有的作战方法都必须是有效的,着子要看在全局中是否有用、有效,而不再是基于棋理、棋道、棋风等虚幻的在形式。基于效果的思想就是赢棋第一,实事求是。比如韩国棋手李昌镐就是基于效果的典范。
现在很多世界级公司都已经明白智力游戏的作用。比如著名的微软公司在招聘员工时出过非常“儿童化”的招聘考题,题目是这样的:“某合唱团的4名成员A、B、C、D往演出现场,他们途中要经过一座小桥。当他们赶到桥头时,天已经黑了,周围没有灯。他们只有一只手电筒。现在规定:一次最多只许两人一起过桥,过桥人手里必须有手电筒,而且手电筒不能用扔的方式传递。4个人的步行速度都不同,若两人同行,则以较慢者的速度为准。A需花1分钟过桥,B过桥需花2分钟,C需花5分钟过桥,D需花10分钟过桥。请问:他们能在17分钟内过桥吗?”
这可不是微软公司的别出心裁,据说许多跻身世界500强的公司在招收新员工时,都要出类似的智力题。
智力游戏可以锻炼人的思维能力,培养人的思维方法。良好的思维方法能使我们从错综复杂的现象中找到事物的本质,从纷繁的因素中找到事物变化的主要原因,使事物呈现出条理性。
思维方法是抽象的,它不像1+1=2那么简单,只有通过自己的想象,亲自动手操作,经历失败,才能逐步形成。思维科学化程度越高的人,工作中发现问题、解决问题的能力就越强。这一点已成为人们的共识。
在许多智力游戏中,都存在这么一个共同的特点:就是参与者所选择的策略对于胜负有着举足轻重的影响。一个游戏的规则一旦定好之后,策略选择的好坏就成了游戏参加者所能自由运用的左右游戏结果的最关键因素。特别是在围棋、象棋之类参与者的初始条件完全相同的游戏中,策略选择就成了游戏结果的唯一决定因素。
至于从围棋初段到九段之间的差别,从博弈论的角度去看,不过是他们策略选择技巧的高低不同而已。博弈论的策略思维是一种技巧。策略思维从一些基本技巧出发,考虑的是怎样将这些基本技巧最大限度地发挥出来。
任何游戏都有自己的规则(Rule of the game)。实际现实中的人类社会自然也是如此,这就是法律、道德和各种成文或不成文的规章制度和惯例等。当然,这些规则也不是一成不变的,它会随着情况的改变和人们的要求不断修正,但是只要规则存在,这个规则就确定了人们行为的前提条件。
因此博弈与游戏都有一个重要的共同特征:那就是这些规则规定游戏参加者可以做什么,不可以做什么,按照什么次序去做,什么时候结束游戏,一旦参与者犯规将受到怎样的处罚等。
游戏者的策略有相互依存的关系。每一个游戏者从游戏所得结果的好坏不仅取决于自身的策略选择,同时也取决于其它参加者的策略选择。有时甚至一个坏的策略会给选它的一方带来并不坏的结果,原因是其它方选择了更坏的利他而不利己的策略。这一点也是游戏与博弈重要的相似之处。
从围棋定式谈纳什均衡
我们已经知道,博弈论的基本前提是,某人或某物的行为效果如何,有赖于他人或他物的行为。由于世间的事物很少有不依赖于其他事物而存在的。非合作博弈强调利益的冲突,即非合作甚至对抗状态。
比如,“零和博弈”就是典型的非合作博弈,它是指博弈各方的所得之和为零,在特殊情况下如两人博弈时,一方所得与另一方所失相等。从严格的数学角度来看,围棋19×19的361个交叉点就是围棋对弈者所得的总和,因此围棋棋手非输即赢,可见围棋明显是数学意义上的严格的零和博弈。
世事如棋局,而棋局是可以用博弈思维加以概括的。比如过分的“骗着”,“本手”与“缓着”之间,一般都会选择本手,着法过分如不遇反击,可能占到便宜,如遇反击则可能亏损,因此如果棋力相当,则应考虑到对手的反击手段。对手也同样考虑到在追求利益中不可能占尽便宜。这就导致双方都能接受方案。
围棋定式从策略层面看,如一方的策略是抢占实地,另一方是获得外势,而结果相当,互有所得,双方就愿意那样下。抢占实地考虑现实利益,获得外势考虑将来发展,这便形成一个双方的“均衡”;另一方面,可以从具体行棋效果来看,如果一步棋能考虑到对手各种应手而依然成立,对手也运用同样法则找到应对,则可以说双方达成了“均衡”。
在经济学中,均衡(equilibrium)意即相关量处于稳定值。均衡是在分析均衡价格与数量的决定与变动的状况。供需均衡时会达到供需相等,市场出清,也就是在其他条件不变下,会维持不变的状况。
一物的供给量等于需求量的价格,就是其均衡价格,对应的数量就是均衡数量。这就是在供给线与需求线相交之处,也称为均衡点。比如在供需分析中,若某一商品的市场价格使得欲购买该商品的人均能买到,同时想卖的人均能将商品卖出去,此时该商品的供求达到了均衡。这个市场价格可称之为均衡价格,产量可称之为均衡产量。均衡分析是经济学中的重要方法。
在谈纳什均衡之前,我们先来看这样一个例子。这个例子对大家所熟知的“囚徒困境”做了一些微小的修改,结果却是发生根本的变化。
A和B是两个因盗窃而被抓的惯犯。警察局局长C正在调查该局管辖区域内的一宗悬而未决的银行抢劫案,并且他根据一系列的线索判定A和B是这桩案子的凶犯。
因为该局管辖地区治安一向混乱不堪,C的上级对C非常恼火,直接威胁C,如果银行案破不了,就要撤销C局长的职位,给予降级惩罚。C在上级的压力下不得不耗费大量时间、精力提审A和B。为了能够让两个囚犯认罪,C想让A和B明白,假如只有他们其中的一人坦白认罪则这个人可能受到的最严厉的惩罚是什么,但向他们遵守承诺,若两个人都坦白,则会从轻发落。
于是,这个警察局长C分别与A、B立下许诺:如果只有一个人坦白认罪,则认罪的一方会收到所有指控,会因抢劫银行而判无期徒刑,另一个人则不会再加刑罚。如果无人认罪,两个人都会因盗窃罪而判刑2年。如果两个人都坦白,则两个人都被判处有期徒刑5年。
这样,警察局长C给A和B构造了一个博弈。不妨假设,A和B都是极其精明的会打小算盘的自私自利不讲“江湖义气”的人,同时A和B被分别审查不能够进行沟通。
在这种情况下,A会在心里打起小算盘,他会想:如果选择坦白,那么B选择坦白时将判刑5年,B选择不坦白时将被判无期徒刑,因此选择坦白时最坏的打算就把牢底坐穿;若是选择不坦白,那么B选择坦白时将无罪释放获得自由,B选择不坦白时将判有期徒刑2年,因此选择不坦白时最坏的可能就是被囚禁5年。
两害相权,取其轻。因此在这种情况下,A必然会选择不坦白,同样的道理,B也会选择不坦白。这个时候,博弈达到了这样一种局面,这种局面就是纳什均衡(Nash Equilibrium)。
纳什均衡的思想其实并不复杂,在博弈达到纳什均衡时,局中的每一个博弈者都不可能因为单方面改变自己的策略而增加获益,于是各方为了自己利益的最大化而选择了某中最优策略,并与其他对手达成了某种暂时的平衡。
这种平衡在外界环境没有变化的情况下,倘若有关各方坚持原有的利益最大化原则并理性面对现实,那么这种平衡状况就能够长期保持稳定。
再简单一点说,一个策略组合中,所有的参与者面临这样的一种情况:当其他人不改变策略时,他此时的策略是最好的。也就是说,此时如果他改变策略,他的收益将会降低。在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。
由此可见,纳什均衡是一稳定的博弈结果。打一个比方,如果把一个乒乓球,放到一个光滑的铁锅里,不论其初始位置在何处,最终乒乓球都会稳定地停留在锅底,这时的锅底就可称为是一个纳什均衡点。
相反,如果锅是扣在地上的,那么一个乒乓球很难在锅底部位保持稳定,因为往任何方向的一点点移动,都会使球立刻离开锅底。这时的锅底部位就不是一个纳什均衡点了。
博弈的结果并不都能成为均衡。博弈的均衡是稳定的,则必然可以预测。纳什均衡的另一层含义是:在对方策略确定的情况下,每个参与者的策略是最好的,此时没有人愿意先改变或主动改变自己的策略。
在上面的“囚徒困境”变形的博弈