纳什均衡完整版(纳什均衡2)
纳什均衡完整版(纳什均衡2)“囚徒困境”有很重要的现实意义,经济、政治、生活中的例子比比皆是。如:两国之间的军备竞赛就是一种“囚徒困境”,在两个国家没有沟通合作的情况下,双方最终会倾向于增加军备。突破“囚徒困境”的方法,就是合作。布置作业,看一部美国电影:Thirteen Days (惊爆十三天),讲的是1960年代古巴导弹危机的故事。古巴导弹危机是人类最接近核战争的一次危机,最后苏联和美国领导人达成协议解决了危机。这部电影不算很精品,但故事情节比较好,博弈的过程精彩,是我们学博弈论时必看的(美国人拍的,当然立场是站在美国那边的)。
博弈论有一个假设前提(共同知识):所有参与人都是理性人,所有参与人都知道所有参与人是理性人。理性人的意思是既不笨、也按常理出牌。这种假设是为了方便推算。所有科学学科都是如此,如数学中的公理“1 1=2”一样,有了这些所有人都知道的公理,数学才能进行下去。
所有博弈论的书,都会谈到纳什均衡的最经典模型:囚徒困境(Prisoner’s Dilemma),这个必须讲解一下。
A和B共同犯了重罪被警察抓住,警察只有他们犯的一个轻罪的证据、没有重罪的证据。警察把他们关在不同的屋子里审讯(A和B无法串供)。警察告诉他们:如果两人都坦白重罪,各判8年;如果两人都抵赖重罪,按轻罪各判1年;如果其中一人坦白并揭发对方的重罪、另一人抵赖重罪,则坦白的获释还可得到一笔奖金,抵赖的被从严判10年。
可能你乍一看会说,当然都抵赖重罪对两人是最好的选择,都只判一年。但置于事件中的A和B的思想博弈却不会这样。A会想:选择坦白的结局是8年或0年,选择抵赖的结局是10年或1年。虽然两个人都抵赖是对两个人最好的,但我没法保证B会选择抵赖,如果我抵赖他坦白,那我要被判10年而他会被释放还能得一笔奖金,岂不是太便宜他了?所以,在不知道对方选择的情况下,选择坦白对自己来说是最有利的:可以避免10年严判,或侥幸被释放,即便被判8年也没什么心理不平衡。同样,B也会这样想。最后结果便是两个人都选择坦白,每人都要坐8年牢。这就是一个纳什均衡,两人都OK、都心理平衡,但对两人而言却不是最好的结局。
“囚徒困境”有很重要的现实意义,经济、政治、生活中的例子比比皆是。如:两国之间的军备竞赛就是一种“囚徒困境”,在两个国家没有沟通合作的情况下,双方最终会倾向于增加军备。突破“囚徒困境”的方法,就是合作。
布置作业,看一部美国电影:Thirteen Days (惊爆十三天),讲的是1960年代古巴导弹危机的故事。古巴导弹危机是人类最接近核战争的一次危机,最后苏联和美国领导人达成协议解决了危机。这部电影不算很精品,但故事情节比较好,博弈的过程精彩,是我们学博弈论时必看的(美国人拍的,当然立场是站在美国那边的)。