快捷搜索:  汽车  科技

进化博弈论基本内容,博弈论和纳什平衡是什么

进化博弈论基本内容,博弈论和纳什平衡是什么这个游戏的不同版本可以在互联网上找到。让我们举个简单的例子,有两名囚犯张三和李四,他们刚刚因为抢劫银行被抓获,警察没有足够的证据来定罪,但知道他们犯了罪。他们把张三和李四分别安排在不同的对话室里,并说明了后果。博弈论已经发展到分析更广泛的博弈论,如组合博弈论和微分博弈论。但我们有时间只看一个博弈论中经常研究的一个经典博弈例子叫做囚徒困境。他想要找到一个可以应用于外交、战争、爱情、生物进化或商业策略的理论,它被称之为博弈论。在1944年与经济学家奥斯卡摩根斯特恩合作,撰写了一本名为博弈论与经济行为的书。冯诺伊曼和摩根斯特恩在他们的书中宣称,任何经济状况都可以被定义为两个或更多参与者之间的博弈。结果说了这么多,到底什么是博弈论?耶鲁大学本波拉克指出,每场游戏都有三个基本组成部分,玩家策略和回报博弈论适用于涉及两个或更多玩家的游戏,游戏中玩家分享游戏规则,可用策略和可能获得的回报的常识。然而,玩

今天我们来讲很有意思的理论博弈论。它是考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。

它已经成为经济学的标准分析工具之一。在金融学、证券学、生物学、国际关系、计算机科学、政治学、军事战略和其他学科中都有广泛应用。

在我们的日常生活中也有大量应用,例如讨价还价、博弈囚徒困境、稚猪博弈、酒吧博弈、警察与小偷博弈等。

进化博弈论基本内容,博弈论和纳什平衡是什么(1)

日常生活中的博弈策略书中讲到,通过博弈的智慧运用到生活中的决策,实际上有些事情是可以通过辩证思维来预判行为的。让我们开始步入正题。我们今天所知道的博弈论的产生部分是因为一个人对扑克的兴趣。他是数学家、物理学家、冯诺伊曼最初的目的只是为了成为一个更厉害的扑克牌玩家。根据文章报道,他之所以对扑克牌感兴趣,只是因为他认为这是一条通往数学的道路。

他想要找到一个可以应用于外交、战争、爱情、生物进化或商业策略的理论,它被称之为博弈论。在1944年与经济学家奥斯卡摩根斯特恩合作,撰写了一本名为博弈论与经济行为的书。冯诺伊曼和摩根斯特恩在他们的书中宣称,任何经济状况都可以被定义为两个或更多参与者之间的博弈。

进化博弈论基本内容,博弈论和纳什平衡是什么(2)

结果说了这么多,到底什么是博弈论?耶鲁大学本波拉克指出,每场游戏都有三个基本组成部分,玩家策略和回报博弈论适用于涉及两个或更多玩家的游戏,游戏中玩家分享游戏规则,可用策略和可能获得的回报的常识。然而,玩家并不总是能够完美地了解游戏中的这些元素。策略是玩家在游戏中采取的行动,策略是博弈论的核心。福布斯将博弈论与经济行为中的理论描述为理性对手之间战略互动的数学模型,每一方的行动都取决于另一方的行动。这很像我们的象棋和围棋战略相互依赖的概念,一方的行为影响,另一方的行为是冯诺伊曼博弈论的一个重要方面。

进化博弈论基本内容,博弈论和纳什平衡是什么(3)

这在今天仍然适用,而回报就是玩家运用策略的结果。根据游戏种类的不同,回报也是多种多样的,可以是利润和平条约,或者买一辆好车。冯诺伊曼的博弈论的一个局限是,他专注于为一种零和博弈寻找最优策略。在零和游戏中,一方的损失就是另一方的收益。并且在联合游戏中,资源的总量是固定的,玩家既不能增加也不能减少。这就像我们所拥有的时间,它也是总量固定的。我们所有人既不能增加时间,也无法在死亡之前减少时间。但是如何制定不同的策略来利用时间获取更多的回报,是我们可以控制的。批评人士指出,生活往往不像零和游戏那么简单,在现实世界中还可能出现更复杂的游戏场景,例如玩家可以寻找更多资源或结成联盟,增加几个玩家的收益。

博弈论已经发展到分析更广泛的博弈论,如组合博弈论和微分博弈论。但我们有时间只看一个博弈论中经常研究的一个经典博弈例子叫做囚徒困境。

这个游戏的不同版本可以在互联网上找到。让我们举个简单的例子,有两名囚犯张三和李四,他们刚刚因为抢劫银行被抓获,警察没有足够的证据来定罪,但知道他们犯了罪。他们把张三和李四分别安排在不同的对话室里,并说明了后果。

如果两人都认罪,他们将各自被判坐牢十年,如果其中一人认罪,另一人不认罪,那么认罪的人会被释放。不认罪的另外一人则会被判坐牢二十年。如果两人都不认罪,他们都会因另一项罪名被判坐牢五年。囚徒困境包含了游戏的基本元素,两个玩家张三和李四他们有两种策略,坦白或不坦白这款游戏的回报是获得自由到入狱五年、十年或二十年不等。如果将这些结果放入一个矩阵中,就更容易看到和比较。他们因为张三的策略是成型排列的,或者说x 轴,所以它的收益是排在前面的,以四的收益列在第二。

进化博弈论基本内容,博弈论和纳什平衡是什么(4)

因为它的策略列在y 轴上,c 表示坦白,n c 表示不坦白这个矩阵在博弈论中称为范式,一定是同步的。这意味着双方都不知道对方的决定,而且决策是在同一时间做出的。在这个例子中,两个囚犯被关在不同的房间里,在他们做出决定之前是不会被释放的。同时,游戏的一个常见解决方案就是主导策略,也就是无论其他玩家选择什么,都能获得最佳收益的策略。李四不知道张三是否会招供,他在考虑自己的选择策略。如果张三坦白,而李四不坦白,李四将被判二十年。

如果两人都认罪,李四只会被判十年。如果张三不坦白,而李四坦白,李四就会被释放。对李四来说,最好的策略是坦白,因为不管张三的行为如何坦白,都能带来最好的回报。坦白会让李四要么获得自由,要么比不坦白。服刑时间短。张三和李四处境相同,也有同样的选择。因此对张三来说,最好的策略也是坦白,因为坦白和李四一样会得到最好的回报。

当每个参与者选择自己的主导策略时,就会达到主导策略的均衡。为什么两者都不坦白的策略不是最好的选择。虽然这一选择比他们认罪的情况下,两人的刑期都要少,但只有在双方都能确保对方不会认罪的情况下,这一选择才会奏效。谁也不会知道,在两人当前的情况下,是否会有一定的默契,都选择不认罪。

此外,双方都不太可能选择不认罪的策略,因为这比他们认罪的惩罚更大。坦白还让他们每个人都有可能不服刑甚至不到五年的刑期。囚徒困境是理解博弈论的一个很好的例子。哥伦比亚大学的研究院称,囚徒困境是博弈论中最具有争议的问题之一。

他指出,几乎所有的理论都是基于这样的假设,即行动者是努力实现效用收益最大化的理性参与者。然而,研究表明,参与者、记者并不总是理性的,而且理性分析的结论有时与现实不符。从这个游戏中我们可以看出,给双方都减少服刑时间的最合理的策略不是最好的选择,而让双方都延长服刑时间的选择才是最好的选择。

囚徒困境也反映了其他博弈问题,理论家是如何用冯诺伊曼的博弈论解决一些问题的。其中一位是数学家约翰纳什。此处应该划重点,小伙伴们可以再去了解一下这个电影美丽心灵的男主角原型。他找到了一种在任何有限对策中确定最优策略的方法。这种最优策略的方法被称为那是平衡,它被描述为一种博弈的特殊解决方案。其特征是每个参与人都在尽可能地发挥自己或他的最佳水平,而其他所有参与人都在采用这种策略。当博弈达到那时均衡时,没有参与者希望改变策略。因为这样做将导致比当前策略更糟糕的结果。在囚徒困境中,那是平衡,是双方都坦白的策略,没有比这更好的选择了。

从这个博弈中,我们还可以看到,那是平衡的另一个有趣的方面,任何占优战略均衡也是一个纳什平衡。这是因为纳什平衡是优势策略均衡概念的延伸。他指出,那是均衡,可以用来解决没有主导策略的游戏。那是因那是平衡和他在博弈论方面的其他工作而获得了极大的赞扬。但赞扬并不是来自发现博弈论的冯诺依曼。据报道,冯诺依曼满怀激动,将年轻的那时的结果视为微不足道。而其他人并不认同冯诺依曼对那时研究结果的评价。那时约翰海萨尼和莱因哈德左耳疼,因他们在博弈论方面的研究而分享了一九九四年诺贝尔经济学奖。二零一五年乃是七十时一家学术新闻网站这样总结他的成就,那是对博弈论最根本的贡献,在于他将这个领域拓展到了更广泛的应用领域,并让人们可以研究不同的情景。如果没有它的突破,博弈论之后的许多内容可能。

猜您喜欢: