纳什均衡很复杂吗(纳什均衡下)
纳什均衡很复杂吗(纳什均衡下)很明显 (A A)的策略组合是一种坏的策略组合 因为它导致(0 0)的最坏结局。不过 这仍是一种“纳什均衡”。因为对方选择A策略的时候 你的最优选择也是A策略 这个时候形成的策略组合便是“纳什均衡”。同样 (B B)的策略组合也是“纳什均衡” (0 10)的结果是双方都想得到的。(A B)和(B A)的策略组合不是“纳什均衡”。这也说明一场博弈中可以有多个“纳什均衡” 并且有优劣之分。这场博弈中存在两个“纳什均衡”:如果一方选择损毀对方瓜苗 另一方的最优对应策略是选择报复 再一个便是双方同时选择相互帮助。两个均衡的结果也截然相反 第一个均衡的结局是(0 0)两败俱伤 第二个均衡的结果是(10 10) 实现双赢。可见双方相互报复的平衡是坏平衡 相互帮助的平衡是好平衡。魏国的村民知道之后 非常气愤 决定以牙还牙 报复楚国的村民。但是 村长却反对这样做。他认为报复的结局是两败俱伤最终两个村到了秋
阅读前请先点击关注,麦穗阅读与您一起共读好书好文,本期与您一起共读《博弈论》第二章 纳什均衡。
根据“纳什均衡”的定义我们可以知道一场博弈中并不一定只有一个“纳什均衡” 但是均衡之间有好坏之分。比如“囚徒困境”中 两名囚犯同时选择不坦白 得到的均衡便是好的均衡。同时选择坦白 得到的均衡便是坏的均衡。好均衡的结果是双方受益 坏均衡的结果是双方亏损 或者受益没有好均衡那样多。
“纳什均衡”中各方策略的制定都是对对方策略的最佳反应 以为自己争取最大利益为目的 好均衡与坏均衡都是如此。好均衡与坏均衡之间有时候可以转换。古时候 楚国和魏国交界处有一个小县域 城中的居民都以种瓜为生。
有一年 天气大早。魏国一边的村民比较勤劳 白天挑水浇瓜 瓜苗长势喜人;而楚国边的村民比较懒 所以瓜苗长得又枯又黄。楚国村民看着魏国一边的瓜苗绿油油一片 而自己这边又枯又黄 于是心生嫉妒 夜里组织人到魏国一边去搞破坏 将瓜苗拔出来扔到一边。
魏国的村民知道之后 非常气愤 决定以牙还牙 报复楚国的村民。但是 村长却反对这样做。他认为报复的结局是两败俱伤最终两个村到了秋后谁也收获不了瓜。最后村长提出了一个想法 那就是以德报怨 晩上组织村民偷偷到楚国一边的村庄田地里 替他们给瓜苗浇水。
村民们按照村长说的去做 最后楚国的村民看到自己田里的瓜苗变绿了 并且知道是魏国的村民晚上来偷偷浇水 都感到非常羞。为了表示歉意 楚国村民晩上偷偷到魏国村庄的田地里去替他们重新种上了瓜苗。最终 双方平安无事 从此和谐相处。
我们看一下其中的均衡是如何转换的 我们将这个故事中双方的博弈制作成一个简单的博弈模型。假设选择去损毁对方瓜苗为A策略 而选择去以德报怨 相互帮助为B策略。瓜苗被损毁 所得利益为0 没有被损毁所得利益为10。这样我们就会得到一个简单的博弈矩阵图:
这场博弈中存在两个“纳什均衡”:如果一方选择损毀对方瓜苗 另一方的最优对应策略是选择报复 再一个便是双方同时选择相互帮助。两个均衡的结果也截然相反 第一个均衡的结局是(0 0)两败俱伤 第二个均衡的结果是(10 10) 实现双赢。可见双方相互报复的平衡是坏平衡 相互帮助的平衡是好平衡。
很明显 (A A)的策略组合是一种坏的策略组合 因为它导致(0 0)的最坏结局。不过 这仍是一种“纳什均衡”。因为对方选择A策略的时候 你的最优选择也是A策略 这个时候形成的策略组合便是“纳什均衡”。同样 (B B)的策略组合也是“纳什均衡” (0 10)的结果是双方都想得到的。(A B)和(B A)的策略组合不是“纳什均衡”。这也说明一场博弈中可以有多个“纳什均衡” 并且有优劣之分。
故事中楚国最先选择了A策略 按照博弈论的分析 选择A策略是魏国的最好的回应 也就是以牙还牙。这种想法非常符合我们日常的行为习惯 你不让我好过 我也不让你好过。
这样选择的结果将会达成一种平衡 不过是坏的平衡。但是魏国人没有选择报复 而是用行动来感化对方 选择了B策略。最终楚国人被感化 也选择了B第略 双方达成了一种新的均衡。这时候的均是一种好的“纳什均衡”。
这里面存在一个问题 那就是博弈模型同现实情况之间的差异。理性的博弈分析中 选择报复是最优决策。而现实情况中则要考虑很多其他影响因素 比如以后低头不见抬头见之类的。
以德报怨不是博弈分析中的最优决策 但是却可以解决现实问题。相互报复会陷人恶性循环 “冤冤相报何时了” 所以即使不能感化对方 也不应该采取报复。
再说 魏国村民之所以会做出以德报怨的决策 肯定是对楚国村民的民风民俗很了解 知道他们会被感化。若是同水火不容的敌人之间 则不会有忍让。这些都是出于对现实情况的考虑