博弈模型的5个基本要素(100万次的实验证明)
博弈模型的5个基本要素(100万次的实验证明)这时候,甲乙两人应该怎么选择是有利于自己的呢?经过实验表明,选择背叛是最有利于自己的选择。甲乙两名罪犯同时被抓,于是将两人分别进行盘问,如果两人都保持沉默(合作),那两人 只会被判半年的监禁;如果一人检举对方(背叛),另一人保持沉默(合作),那被检举的人要判10年的监禁,检举的人会被立即释放;如果两人都互相检举(都背叛),那两人都会被判5年监禁。一、重复博弈模型。重复博弈模型是博弈论的一种模型,所以在讲透这个模型前,我们需要了解经典博弈模式——囚徒困境模型。1、囚徒困境。
职场遇到同事给你穿小鞋的同事,你会怎么处理呢?90%的人会劝你大度点,不要太较真,气坏身体不值得,远离小人就是了。然后这样的做法就是最正确的吗?
减法师的建议,是“一报还一报”“以牙还牙,以眼还眼”。这是科学家通过计算机上万次博弈模型推演的实验结论,只有不断重复对方上一次的动作,最终得分最高。
所以,职场上遇到他人陷害,最好的“生存策略”就是别总是当老好人,这样反而容易被欺负。“以牙还牙”是对自己的保护,我们的善良,应该有点儿“锋芒”,方能长久立足于充满利益的职场江湖。
其实这是应用了一种数学模型——重复博弈模型。
一、重复博弈模型。
重复博弈模型是博弈论的一种模型,所以在讲透这个模型前,我们需要了解经典博弈模式——囚徒困境模型。
1、囚徒困境。
甲乙两名罪犯同时被抓,于是将两人分别进行盘问,如果两人都保持沉默(合作),那两人 只会被判半年的监禁;如果一人检举对方(背叛),另一人保持沉默(合作),那被检举的人要判10年的监禁,检举的人会被立即释放;如果两人都互相检举(都背叛),那两人都会被判5年监禁。
这时候,甲乙两人应该怎么选择是有利于自己的呢?经过实验表明,选择背叛是最有利于自己的选择。
2、重复囚徒困境
这是单次囚徒困境的情况下的选择,那假如从单次变成多次的情况下,如何选择才是最有利自己呢?
被称为可以取代圣经的经典之作的《合作的进化》这书,就这个问题进行全面阐述,作者是美国科学院院士阿克塞尔·罗德教授。
他用计算机游戏来模拟上述的囚徒困境,他邀请14位各行各业精通博弈论的专家 ,把自己的博弈策略写成程序再提交给他,自然收到程序是五花八门,但总体可以分为三种,第一种是“好人策略”,就是在任何情况下,都不会先背叛合作者;第二种是“坏人策略”,总是时不时背叛一下对方;第三种是“随机策略”,就是在合作过程中随意选择背叛或合作。他把这些策略在计算机上进行12万次的一对一的比赛,最后实验结果排名前八位的都是“好人策略”。
阿克塞尔又将14位专家扩展到62位专家,然后将12万次比拼变成上百万次,通过计算机模拟显示排名前15个策略中,只有一个是坏人策略,其他都是好人策略,而且这两次实验结果中夺冠的那个好人策略都是一样的。这个策略叫做“一报还一报策略”。也就是一开始选择合作,下次的策略与上一次对方策略一致,也就是上一次背叛我,下次我一定会背叛你,假如没背叛我,那我会选择与你合作。
二、“一报还一报”的特点
虽然“一报还一报”这个策略比较简单,但它隐藏了很多人生哲学,这点我们先人早已说这点。
在《论语·宪问》中“何以报德?以直报怨,以德报德。”,意思就是用什么来报答恩德呢?用正直报答怨恨,用恩德报答恩德。
朱熹的《中庸集注》说过,"故君子之治人也,即以其人之道,还治其人之身。"
鲁迅先生也说过,“犯而不校“是怨道,”以眼还眼,以牙还牙“是直道。
“一报还一报策略”之所以可以战胜这么多的策略,还在于它的四个特点:善良性、报复性、宽容性和清晰性。
首先,它是善良的,一开始合作的态度,会选择跟你合作,这就是善良性。这也是很重要的一步,因为在实验中,一开始选择背叛的,很早就被淘汰出局。
其次,它也不是好欺负的,遇到背叛或欺负,会选择报复反击,这叫作你的善良,应该有点儿“锋芒”。总是当老好人,容易被欺负,适当地反击报复,也是保护自己的一种方法。
再次,它也不会沉寂于过去的背叛,对方一旦改观选择合作,它也会立马宽容对方,与其合作,这就是宽容性。
最后,个人认为是最重要的一点,就是它的规则很清晰,不夹带其他复杂的因素,让周边的人很容易掌握到他的规律,这就是清晰性。
三、“重复博弈模型”如何应用到职场?
重复博弈是一种特殊的博弈 重复博弈的关键在于“重复”,如果博弈只进行一次,则每个人都只关心一次性的支付,但如果博弈的次数变得可以很多次,想要生存到最后的,那实行“一报还一报”策略。
职场是一个是逐利的环境,所以职场是最需要博弈,也是最常见博弈。除了少数把工作当做事业的人,剩下的混迹职场无非就是为了“名”和“利”。“名”就是名望或升职,名望和升职呈一个“金字塔结构”,跨越一个等级,名额越随着减少,所以争“名”需要博弈;“利”就是升职或利益,人性是逐利的,有利益的地方,大家都会蜂窝地往前冲,所以这个夺“利”,也是需要博弈。
而职场很多场景下,它的博弈次数不是一次性的,特别是体制类的职场环境。因为频繁地换工作的成本很高,所以人们更多时间不会为了一次的短期利益而选择一次性的博弈。
那如何长期立足于职场呢?减法师建议“重复博弈模型”中的“一报还一报”策略是最为妥当的。
在职场中,一开始就选择做坏人,选择“背叛”,一旦名声被传开,这样的人容易被同事唾弃,最后就被孤立;但永远做“老好人”,确实你会跟同事关系处得比较好,但会过得很累,脏活累活都是你的,升职加薪远离你。在职场最明智的处世之术就是既能对世俗投以白眼,又能与光同尘。
简单地说,要贯彻使用“一报还一报”策略的善良性、报复性、宽容性和清晰性四个特点。开始要实行“好人”策略(善良性),让大家接受你,愿意跟你合作,但遇到一味地把脏活推给你,出了问题让你背黑锅的人,则要果断反击(报复性),让对方有所收敛,知道你不是好欺负的。但后续他再次选择合作,态度也是真诚,则要宽容接受(宽容性)。这时你可以适当表达你的态度,让对方清晰地知道你的态度,不会一味记仇,也不愿吃亏(清晰性)。
资料参考:阿克塞尔·罗德的《合作的进化》。