按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!
是那精炼贝叶斯均衡吧?说起来不过就是以前μ已知,求β;变为β已知,求μ而已!
何必再安些名词出来?”
“那,不完美信息博弈的精炼贝叶斯均衡。。。。。。”
“同上!”
文书的脸色有些难看:“序贯均衡?”
“呵呵,你那序贯均衡无非是不想让人们在非均衡路径上乱来,所以想着任何零概率事
件都赋予正的小概率,好利用条件概率的性质到所有决策上是么?我那代数表达式在所
有策略上都有概率符号,不管它是零概率也好还是其它什么也好,保证在哪儿都不会乱
来!岂非不就是序贯均衡?”
“颤抖手均衡呢?”
“只要第一步用代数式来表达,就也是颤抖手均衡!绝对没有那些乱七八糟的怪现象出
现!”
文书语气开始有些软了。
“你能说说显示原理么?”
“不就是所谓的纳什均衡么?给定每个人的性质,可以设计出一个纳什均衡。要是其中
有一个人谎报自己的情况,便是单独偏离了此均衡,故结果定然对他不利。所以他的唯
一选择就是说实话。”
“我便不信!”绛仙叫道,“你根本不了解别人的情况,居然就能让别人说实话!”
“是啊,这个显示原理也有个前提,就是其它所有人都说的是实话的前提下,单个人不
会偏离均衡而说谎。倘若其它多数人都是说谎,便不是单个人偏离均衡,而是多数人偏
离均衡了,此时谁能保证偏离不会得到更大的利益呢?所以社会环境的确是重要啊!”
“无名氏定理又是怎么回事?”
“这个是无限次重复博弈中的东东。一般说来,博弈中双方合作时得益最大,但若一方
不遵守合作约定,必定是另一方老好人吃亏。所以便引入惩罚机制:谁TMD违约,以后就
要处罚他,使他不敢违约。这便是无名氏定理的要义。”
“处罚的方式有很多,譬如既然已经违约,这个人是不值得相信的了,别人也决计不会
再想和他合作,所以便可能选择一个对这个人最不利的纳什均衡策略,使得此人受损—
—你知道,在无限重复博弈中,倘若损失不考虑时间贴现,则违约人因此受到的损失当
是无穷大;如果时间贴现为0,则违约人不会因惩罚而受到任何损失,所以必有一个贴现
值居于中间,使得凡大于此贴现时的损失,超过违约人一次违约的利益。”
“当然了,其它人倒未必一定要永远处罚下去,只要一段时期损失累计大于违约利益后
,大家又可以合作,倘若再违约,再开始一段时期的处罚。所以违约必亏,大家便永远
合作了。”
文书黯然把书合上了。狐狸笑道:“还有么?”
文书耸了耸肩。