友情提示：如果本网页打开太慢或显示不完整，请尝试鼠标右键“刷新”本网页！阅读过程发现任何错误请告诉我们，谢谢！！报告错误

5608-生活中的博弈论-第5章

按键盘上方向键 ← 或 → 可快速上下翻页，按键盘上的 Enter 键可回到本书目录页，按键盘上方向键 ↑ 可回到本页顶部！
————未阅读完？加入书签已便下次继续阅读！

　　　　在博弈论中，可以选择出某个策略的纳什均衡，这个策略叫做纯策略。　　　　
　　　　用专业的话来说，所谓纯策略是指参与者在他的策略空间中选取惟一确定的策略。但至少存在一个混合策略均衡点。　　　　
　　　　所谓混合策略是指参与者采取的不是惟一的策略，而是其策略空间上的概率分布。这就是纳什于1950年证明了的纳什定理。而这个博弈没有纯策略纳什均衡点，而有混合策略均衡点。这个混合策略均衡点下的策略选择是每个参与者的混合策略选择。　　　　
　　　　最常见混和策略就是猜硬币游戏。比如在足球比赛开场，裁判将手中的硬币抛掷到空中，让双方队长猜硬币落下的正反面。由于硬币落下是正是反是随机的，概率应该都是1/2。那么，猜硬币游戏的参与者都是1/2的概率选择正与反，这时博弈达到混和策略纳什均衡。　　　　
　　　　再比如我们儿时玩的“剪、布、锤”就不存在纯策略均衡，对每个小孩来说，自己采取出“剪”、“布”、还是“锤”的策略应当是随机的。一旦一方知道另一方出其中某个策略的可能性增大，那么这个对弈者在游戏中输的可能性就增大。因此，每个小孩的最优混合策略是采取每个策略的可能性是l／3。在这样的博弈中，每个小孩各取三个策略的1／3是纳什均衡。　　　　
　　　　由此可见，纯策略是参与者一次性选取的，并且坚持他选取的策略。而混合策略是参与者在各种备选策略中采取随机方式选取的。　　　　
　　　　在博弈中，参与者可以改变他的策略，而使得他的策略选取满足一定的概率。当博弈是零和博弈时，即一方所得是另外一方的所失时，此时只有混合策略均衡。对于任何一方来说，此时不可能有纯策略的占优策略。

《生活中的博弈论》第一部分位置博弈的策略

　　　　有这么一个大家都很熟悉的现象，那就是在每个大大小小的城市街道上，经常见到一些地段上的商店十分拥挤，形成一个繁荣的商业中心区，但另一些地段却十分冷僻，没什么商店。　　　　
　　　　更有意思的是，往往同类型的商家总是聚集在比较近的地方，比如肯德基、麦当劳之间总是紧紧相邻。再如超市现象，前两年有很多人对超市的布局发表了一些议论。因为有人注意到，如果在一条街上有2～3家超市的话，这几家超市经常会“相依为邻”，选址离得很近，倘若它们稍微分散地布置于街上，无疑对市民的购物提供相当的便利，因此他们认为超市“拥挤”在一起属于资源浪费。　　　　
　　　　类似的事情也发生于国内各省级电视台的节目播放。很多电视迷会发现，大部分电视台总是将最精彩的节目放在相同的时间段，甚至有些时候是在相同时间段播放类似的节目，比如你播“快乐大本营”，我就播“超级总动员”；你播“玫瑰之约”，我就播“单身男女”。人都说文人相轻，电视台也是这么相煎太急。　　　　
　　　　博弈论能够对这个现象作出科学的解释。首先对一个简单的博弈模型进行叙述：　　　　
　　　　假设有条完全笔直的公路，连接城市A到城市B之间的交通。这条公路上每天行驶着大量的车辆，并且车流量在公路上是均匀分布的。假设有两家快餐店，我们不妨假设为靠高速公路起家的麦当劳与肯德基，它们要在这条公路上选择一个位置开设快餐，招揽来往车辆。为了能够更加清晰地说明这个博弈，我们不得不画一张图。　　　　
　　　　再对该模型作一个合乎逻辑的假定：通常情况下，车辆总是乐意到距自己最近的快餐店购买食物。根据这个原则，从资源的最佳配置来看，麦当劳、肯德基应该分别开在1/4、3/4处是最优。　　　　
　　　　在这种均匀散布的情况下，每家快餐店都拥有1/2的顾客量，同时对于开车的人们总体来说，这种策略的选择，车辆到快餐店的总的距离最短。　　　　
　　　　然而，人生不如意事十之八九，天并不总能遂人之愿。肯德基与麦当劳都是百年老店，自然是精明之至，从经济学上就是具有经济理性。他们只要手段合法，总是希望自己的生意尽可能地红火，至于其他人的生意的好坏则与己无关。　　　　
　　　　出于这种理性，肯德基分店经理肯定会想到：如果我将店铺从3/4点处向左移一点，那么1/4点之间的中点不再是1/2点处，而是位于1/2点的靠左边一点。这等于说，这一移位，肯德基将从麦当劳夺取部分顾客，这对于肯德基单方面来说无疑是一个好主意。当然麦当劳也不甘示弱，作为一个“理性人”，麦当劳自然也应该想到将自己的店铺从1/4点处向右移动以争取更多的顾客。　　　　
　　　　不难想象，双方博弈的结果将使他们的店铺设置在l/2中点附近达到纳什均衡状态，甲乙两人相依为邻且相安无事地做起快餐生意。如果我们放宽条件，不是两家快餐店，而是很多家快餐店，很容易分析得到结果：这些快餐店仍然会在1/2处设店达到纳什均衡。　　　　
　　　　同样的道理，如果地段的繁华等其他原因在一条路上都可以认为到处相同的话，没有一个商家会将自己安置于某条路的一头，只要条件许可，超市将几乎趋向于相依为邻，这种现象完全可以看做公正的市场竞争的合理结果。这就是很多城市商业中心形成的原理，在博弈论中称为位置博弈。　　　　
　　　　电视台之间在时间段上的重叠问题在本质上就是位置博弈。事实上，我们只要将时间设想为上述案例中的公路，就不难分析出：市场竞争的结果就是，观众青睐的精彩节目将集中在同一黄金时段。在这种情况下，电视台之间的竞争会更加激烈，为了获得收视率，电视台只能在制作质量上下功夫，最终获得实惠的仍然是广大观众。　　　　
　　　　西方国家在名义上是民权政治。实际上，选举上台的各个政党之间的政策并没有多大差别。就拿美国来说，民主党与共和党为了能够获得总统大选的胜利，必须要尽量争取最多的选民。两党在制订政策时，必然以这个目的为原则。我们把选民的政治主张看成是位置博弈中的均匀分布的人群，把两个政党看成是两个店铺，最终的结果必然是两个政党的政策趋向于折衷，并且非常近似。从这个意义上来说，西方政党的换届选举倒真是有“换汤不换药”的味道。

《生活中的博弈论》第一部分猎鹿模型的合作哲学

　　　　社会学告诉我们，在人类文明之初的原始社会，人们维生的方式主要是狩猎。　　　　
　　　　话说某个部落有两个出色的猎人，某一天他们狩猎的时候，看到一头梅花鹿。于是两人商量，只要守住梅花鹿可能逃跑的两个路口，梅花鹿就会无路可逃。只要他们能够齐心协力，梅花鹿就会成为他们的盘中餐。不过只要其中有任何一人放弃围捕，梅花鹿就会逃跑掉。　　　　
　　　　“福兮祸之所依；祸兮福之所伏。”有时运气太好并不一定有好的结果。正当两个猎人严阵以待，围捕梅花鹿的时候，在两个路口都跑过一群兔子，如果猎人去抓兔子，会抓住4只兔子。从维持生存的角度来看，4只兔子可以供一个人吃4天，1只梅花鹿如果被抓住将被两个猎人平分，可供每人吃10天。这里不妨假设两个猎人叫A和B。　　　　
　　　　在这个矩阵图中，每一个格子都代表一种博弈的结果。具体说来：　　　　
　　　　1．左上角的格子表示，猎人A和B都抓兔子，结果是猎人A和B都能吃饱4天；　　　　
　　　　2．左下角的格子表示，猎人A抓兔子，猎人B打梅花鹿，结果是猎人A可以吃饱4天，B则一无所获；　　　　
　　　　3．在右上角，猎人A打梅花鹿，猎人B抓兔子，结果是猎人A一无所获，猎人B可以吃饱4天；　　　　
　　　　4．在右下角，猎人A和B合作抓捕梅花鹿，结果是两人平分猎物，都可以吃饱10天。　　　　
　　　　在这个博弈中，根据纳什均衡的定义，应用博弈论中的“严格劣势删除法”（有兴趣的读者可以找本书参考文献中的相关书籍阅读，这里不做详细介绍。）可以得到该博弈有两个纳什均衡点，那就是：要么分别打兔子，每人吃饱4天；要么合作，每人吃饱10天。　　　　
　　　　两个纳什均衡，就是两个可能的结局。两种结局到底哪一个最终发生，这无法用纳什均衡本身来确定。　　　　
　　　　比较＇10，10＇和＇4，4＇两个纳什均衡，明显的事实是，两人一起去猎梅花鹿比各自去抓兔子可以让每个人多吃6天。按照经济学的说法，合作猎鹿的纳什均衡，分头抓打兔子的纳什均衡，具有帕累托优势。与＇4，4＇相比，＇10，10＇不仅有整体福利改进，而且每个人都得到福利改进。　　　　
　　　　换一种更加严密的说法就是，＇10，10＇与＇4，4＇相比，其中一方收益增大，而其它各方的境况都不受损害。这就是＇10，10＇对于＇4，4＇具有帕累托优势的含义。　　　　
　　　　在经济学中，帕累托效率准则是：经济的效率体现于配置社会资源以改善人们的境况，主要看资源是否已经被充分利用。如果资源已经被充分利用，要想再改善我就必须损害你或别的什么人，要想再改善你就必须损害另外某个人。　　　　
　　　　一句话简单概括，要想再改善任何人都必须损害别的人了，这时候就说一个经济已经实现了帕累托效率。　　　　
　　　　相反，如果还可以在不损害别人的情况下改善任何人，就认为经济资源尚未充分利用，就不能说已经达到帕累托效率。效率是指资源配置已达到这样一种境地，即任何重新改变资源配置的方式，都不可能使一部分人在没有其他人受损的情况下受益。这一资源配置的状态，被称为“帕累托最优”（Pareto　optimum）状态，或称为“帕累托有效”（Pareto　efficient）。　　　　
　　　　目前在世界上比比皆是的企业强强联合，就接近于猎鹿模型的帕累托改善，跨国汽车公司的联合、日本两大银行的联合等等均属此列，这种强强联合造成的结果是资金雄厚、生产技术先进、在世界上占有的竞争地位更优越，发挥的影响更显著。　　　　
　　　　总之，他们将蛋糕做得越大，双方的效益也就越高。比如宝山钢铁公司与上海钢铁集团强强联合也好，还是其他什么重组方式；最重要的在于将蛋糕做大。在宝钢与上钢的强强联合中，宝钢有着资金、效益、管理水平、规模等各方面的优势，上钢也有着生产技术与经验的优势。两个公司实施强强联合，充分发挥各方的优势，发掘更多更大的潜力，形成一个更大更有力的拳头，将蛋糕做得比原先两个蛋糕之和还要大。　　　　
　　　　猎鹿模型的讨论，我们的思路实际只停留在考虑整体效率最高这个角度，而没有考虑蛋糕做大之后的分配。猎鹿模型是假设猎人双方平均分配猎物。　　　　
　　　　我们不妨做这样一种假设，猎人A比猎人B狩猎的能力水平要略高一筹，但B猎人却是酋长之子，拥有较高的分配权。　　　　
　　　　可以设想，A猎人与B猎人合作猎鹿之后的分配不是两人平分成果，而是A猎人仅分到了够吃2天的梅花鹿肉，B猎人却分到了够吃18天的梅花鹿肉。　　　　
　　　　在这种情况下，整体效率虽然提高，但却不是帕累托改善，因为整体的改善反而伤害到猎人A的利益。我们假想，具有特权的猎人B会通过各种手段方法让猎人A乖乖就范。但是猎人A的狩猎热情遭到伤害，这必然会导致整体效率的下降。进一步推测，如果不是两个人进行狩猎，而是多人狩猎博弈，根据分配可以分成既得利益集团与弱势群体，这和我国的现状非常相似。　　　　
　　　　我国改革的进程在九十年代中期以前是一种帕累托改善的过程。但是随着各种复杂的不确定因素影响，贫富差距逐渐拉大，基尼指数甚至超过0。45的国际警戒线，帕累托改善的过程受到干扰。　　　　
　　　　这种情况如果继续下去，社会稳定和改革深化必将受到决定性的冲击。我们的党和政府已经关注到弱势群体的生存状态，并适时地提出建设和谐社会的改革目标，纠正了一些错误思潮，将改革的进程拉回到健康的轨道。

《生活中的博弈论》第一部分“囚徒困境”的深刻哲理

　　　　在博弈论中，有一个流传颇为广泛的故事，叫做“囚徒困境”（Pris…oner's　Dilemma）。　　　　
　　　　话说有一天，一位富翁在家中被杀，财物被盗。警方在此案的侦破过程中，抓到两个犯罪嫌疑人A和B，并从他们的住处搜出被害人家中丢失的财物。但是，他们都矢口否认曾杀过人，辩称是先发现富翁被杀，然后只是顺手牵羊偷了点儿东西。于是警方将两人隔离审讯。　　　　
　　　　这个时候，聪明的警官找他们谈话，分别告诉他们说：“你们的偷盗罪确凿，所以可以判你们2年刑期。但是，我可以和你做个交易。如果

返回目录上一页下一页回到顶部赞（0）踩（0）

未阅读完？加入书签已便下次继续阅读！

温馨提示：温看小说的同时发表评论，说出自己的看法和其它小伙伴们分享也不错哦！发表书评还可以获得积分和经验奖励，认真写原创书评被采纳为精评可以获得大量金币、积分和经验奖励哦！