博弈模型的5个基本要素（100万次的实验证明）

小君 2023-06-05 01:15:01 57

博弈模型的5个基本要素（100万次的实验证明）这时候，甲乙两人应该怎么选择是有利于自己的呢？经过实验表明，选择背叛是最有利于自己的选择。甲乙两名罪犯同时被抓，于是将两人分别进行盘问，如果两人都保持沉默（合作），那两人只会被判半年的监禁；如果一人检举对方（背叛），另一人保持沉默（合作），那被检举的人要判10年的监禁，检举的人会被立即释放；如果两人都互相检举（都背叛），那两人都会被判5年监禁。一、重复博弈模型。重复博弈模型是博弈论的一种模型，所以在讲透这个模型前，我们需要了解经典博弈模式——囚徒困境模型。1、囚徒困境。

博弈模型的5个基本要素（100万次的实验证明）(1)

职场遇到同事给你穿小鞋的同事，你会怎么处理呢？90%的人会劝你大度点，不要太较真，气坏身体不值得，远离小人就是了。然后这样的做法就是最正确的吗？

减法师的建议，是“一报还一报”“以牙还牙，以眼还眼”。这是科学家通过计算机上万次博弈模型推演的实验结论，只有不断重复对方上一次的动作，最终得分最高。

所以，职场上遇到他人陷害，最好的“生存策略”就是别总是当老好人，这样反而容易被欺负。“以牙还牙”是对自己的保护，我们的善良，应该有点儿“锋芒”，方能长久立足于充满利益的职场江湖。

博弈模型的5个基本要素（100万次的实验证明）(2)

其实这是应用了一种数学模型——重复博弈模型。

一、重复博弈模型。

重复博弈模型是博弈论的一种模型，所以在讲透这个模型前，我们需要了解经典博弈模式——囚徒困境模型。

1、囚徒困境。

甲乙两名罪犯同时被抓，于是将两人分别进行盘问，如果两人都保持沉默（合作），那两人只会被判半年的监禁；如果一人检举对方（背叛），另一人保持沉默（合作），那被检举的人要判10年的监禁，检举的人会被立即释放；如果两人都互相检举（都背叛），那两人都会被判5年监禁。

这时候，甲乙两人应该怎么选择是有利于自己的呢？经过实验表明，选择背叛是最有利于自己的选择。

博弈模型的5个基本要素（100万次的实验证明）(3)

2、重复囚徒困境

这是单次囚徒困境的情况下的选择，那假如从单次变成多次的情况下，如何选择才是最有利自己呢?

被称为可以取代圣经的经典之作的《合作的进化》这书，就这个问题进行全面阐述，作者是美国科学院院士阿克塞尔·罗德教授。

博弈模型的5个基本要素（100万次的实验证明）(4)

他用计算机游戏来模拟上述的囚徒困境，他邀请14位各行各业精通博弈论的专家，把自己的博弈策略写成程序再提交给他，自然收到程序是五花八门，但总体可以分为三种，第一种是“好人策略”，就是在任何情况下，都不会先背叛合作者；第二种是“坏人策略”，总是时不时背叛一下对方；第三种是“随机策略”，就是在合作过程中随意选择背叛或合作。他把这些策略在计算机上进行12万次的一对一的比赛，最后实验结果排名前八位的都是“好人策略”。

阿克塞尔又将14位专家扩展到62位专家，然后将12万次比拼变成上百万次，通过计算机模拟显示排名前15个策略中，只有一个是坏人策略，其他都是好人策略，而且这两次实验结果中夺冠的那个好人策略都是一样的。这个策略叫做“一报还一报策略”。也就是一开始选择合作，下次的策略与上一次对方策略一致，也就是上一次背叛我，下次我一定会背叛你，假如没背叛我，那我会选择与你合作。

博弈模型的5个基本要素（100万次的实验证明）(5)

二、“一报还一报”的特点

虽然“一报还一报”这个策略比较简单，但它隐藏了很多人生哲学，这点我们先人早已说这点。

在《论语·宪问》中“何以报德？以直报怨，以德报德。”，意思就是用什么来报答恩德呢？用正直报答怨恨，用恩德报答恩德。

朱熹的《中庸集注》说过，"故君子之治人也，即以其人之道，还治其人之身。"

鲁迅先生也说过，“犯而不校“是怨道，”以眼还眼，以牙还牙“是直道。

博弈模型的5个基本要素（100万次的实验证明）(6)

“一报还一报策略”之所以可以战胜这么多的策略，还在于它的四个特点：善良性、报复性、宽容性和清晰性。

首先，它是善良的，一开始合作的态度，会选择跟你合作，这就是善良性。这也是很重要的一步，因为在实验中，一开始选择背叛的，很早就被淘汰出局。

其次，它也不是好欺负的，遇到背叛或欺负，会选择报复反击，这叫作你的善良，应该有点儿“锋芒”。总是当老好人，容易被欺负，适当地反击报复，也是保护自己的一种方法。

博弈模型的5个基本要素（100万次的实验证明）(7)

再次，它也不会沉寂于过去的背叛，对方一旦改观选择合作，它也会立马宽容对方，与其合作，这就是宽容性。

最后，个人认为是最重要的一点，就是它的规则很清晰，不夹带其他复杂的因素，让周边的人很容易掌握到他的规律，这就是清晰性。

三、“重复博弈模型”如何应用到职场？

重复博弈是一种特殊的博弈重复博弈的关键在于“重复”，如果博弈只进行一次，则每个人都只关心一次性的支付，但如果博弈的次数变得可以很多次，想要生存到最后的，那实行“一报还一报”策略。

博弈模型的5个基本要素（100万次的实验证明）(8)

职场是一个是逐利的环境，所以职场是最需要博弈，也是最常见博弈。除了少数把工作当做事业的人，剩下的混迹职场无非就是为了“名”和“利”。“名”就是名望或升职，名望和升职呈一个“金字塔结构”，跨越一个等级，名额越随着减少，所以争“名”需要博弈；“利”就是升职或利益，人性是逐利的，有利益的地方，大家都会蜂窝地往前冲，所以这个夺“利”，也是需要博弈。

而职场很多场景下，它的博弈次数不是一次性的，特别是体制类的职场环境。因为频繁地换工作的成本很高，所以人们更多时间不会为了一次的短期利益而选择一次性的博弈。

那如何长期立足于职场呢？减法师建议“重复博弈模型”中的“一报还一报”策略是最为妥当的。

在职场中，一开始就选择做坏人，选择“背叛”，一旦名声被传开，这样的人容易被同事唾弃，最后就被孤立；但永远做“老好人”，确实你会跟同事关系处得比较好，但会过得很累，脏活累活都是你的，升职加薪远离你。在职场最明智的处世之术就是既能对世俗投以白眼，又能与光同尘。

博弈模型的5个基本要素（100万次的实验证明）(9)

简单地说，要贯彻使用“一报还一报”策略的善良性、报复性、宽容性和清晰性四个特点。开始要实行“好人”策略（善良性），让大家接受你，愿意跟你合作，但遇到一味地把脏活推给你，出了问题让你背黑锅的人，则要果断反击（报复性），让对方有所收敛，知道你不是好欺负的。但后续他再次选择合作，态度也是真诚，则要宽容接受（宽容性）。这时你可以适当表达你的态度，让对方清晰地知道你的态度，不会一味记仇，也不愿吃亏（清晰性）。

资料参考：阿克塞尔·罗德的《合作的进化》。

博弈模型的5个基本要素（100万次的实验证明）(10)

网站首页

返回栏目

博弈模型的5个基本要素（100万次的实验证明）

猜您喜欢：

相关文章