快捷搜索:  汽车  科技

思维模型落地教程(思维模型脱先)

思维模型落地教程(思维模型脱先)3、因果之间的关系需要多角度观察是的这是本质。//@慢马轻裘:alphago一直是全局评估 下子当然不会连贯。人没有这么强大的计算力,要是一味简单模仿反而入歧途了看了几十局狗狗棋谱,现总结阿尔法狗围棋十诀如下:1、见星就点三三,且挡角方向没讲究。2、对方有点模样就去肩冲。3、布局之初就碰,实在不会下了也碰。4、厚势沒眼,也要去攻击。5、多用大跳、大飞、超大飞。拆边时,思想有多远,就拆多远。6、学会看轻棋子和主动弃子。7、布局必有三三。8、能脱先就脱先。9、下棋一定不能太连贯,变化不要走尽,东一榔头、西一棒子。10、围棋是自由的。抛弃一切固有的定式,想怎么下就怎么下。【张志勇、唐磊合作总结】要脱先,不必连贯,要抛弃一切定势,想怎么下就怎么下。。//@Keepleer:哥涉猎颇广啊

脱先

根据硅谷王川网文整理

1、围棋术语。在对局双方的接触战中,对对方的着法暂时置之不理,争得先手投于它处,称“脱先”。一般具有争取主动的用意。“脱先”在局部难免遭到损失,须统筹全局,方能判定优劣。日本称为“手拔”。

2、阿尔法狗不断脱先

看了几十局狗狗棋谱,现总结阿尔法狗围棋十诀如下:
1、见星就点三三,且挡角方向没讲究。
2、对方有点模样就去肩冲。
3、布局之初就碰,实在不会下了也碰。
4、厚势沒眼,也要去攻击。
5、多用大跳、大飞、超大飞。拆边时,思想有多远,就拆多远。
6、学会看轻棋子和主动弃子。
7、布局必有三三。
8、能脱先就脱先。
9、下棋一定不能太连贯,变化不要走尽,东一榔头、西一棒子。
10、围棋是自由的。抛弃一切固有的定式,想怎么下就怎么下。
【张志勇、唐磊合作总结】

要脱先,不必连贯,要抛弃一切定势,想怎么下就怎么下。。

思维模型落地教程(思维模型脱先)(1)

//@Keepleer:哥涉猎颇广啊

是的这是本质。//@慢马轻裘:alphago一直是全局评估 下子当然不会连贯。人没有这么强大的计算力,要是一味简单模仿反而入歧途了

3、因果之间的关系需要多角度观察

1/ 人们通常只能关注自己角度可以看得到,听得见的信息.

2/ 把自己看得见的信息,和其后发生的事件,建立起因果关系,是很自然的本能反应。但事件的真正起因可能非常复杂,或者来自于某种在其视角和维度内无法观察理解的信息.

3/ UCLA 心理学家 Shelley Taylor 把这个现象称作 "what-is-focal-presumed-causal".

4/ 华尔街基金经理的各种量化模型,老百姓的各种迷信,本质都是同一类现象.

5/ 不能摆脱这种直觉本能的迷信,人和普通动物其实没有太大区别.

6/ 这种动物本能导致的错误判断是如此顽固,即使你告诉对方,他们也很难克服,甚至要暴跳如雷和你争辩.

7/ 多角度多维度全面观察,不断 arbitrage 大众的迷信本能,和事实真相的差别,是智者义不容辞的责任.

欧耶//@铁锤咖啡刘大锤:终归没能真正全面地看清事物的每一个维度的本质,只能不断扩大视野知识框架尽量的多维度观察分析。阿法狗的策略就是尽量能先脱先就先脱先,尽量全局优化。

4、活在当下,不断归零再出发

今天听到 @王烁 说AI 下围棋的一个秘诀是:“什么时候不会下就脱先。脱先总能得九十分。长考出来一套精妙打法,多半不及格。上一步无论有什么构思,这一步都要忘掉。”

非常有共鸣,每一天都是新的开始。脱先,和果断放弃沉没成本是一个思路。

一般之所以有“脱先和坚持”的争论,都是因为坚持不下去了,再坚持就弹尽粮绝了。脱先至少还有继续生存的希望。

从疯狂脱先的系统的视角来看,那些一辈子从事同样行业的个体,实在是太落后了。:)

我最近也常用这个「脱先」的思路,或者就叫「不接招」。换个项目比喻的话,像棒球这种 game,投手扔过来一个好的曲线球(curve ball)的时候你必须要挥棒。但在一个开放系统内,你不需要解决每一个出现在你面前的难题,永远可以跳出来做全局思考。Know your game 啊朋友。

从疯狂脱先的系统的视角来看,那些一辈子从事同样行业的个体,实在是太落后了。:)//@abjf:还有,据说alphago的一个显著特征就是疯狂脱先

下一步的最优点并不总是分布在原先的路径附近,这一点其实挺容易理解的。

5、有限游戏和无限游戏

1/ 纽约大学学者 James Carse 在 1986年出版的 "Finite & Infinite Game" 中,详细阐述了有限游戏和无限游戏的区别。

2/ 有限游戏是有明确胜负定义的游戏, 是一种有较为清晰的边界,时间长度和规则的游戏 ;有限游戏里,任何让你离最终胜利更近的行动,会被认为是好的行动。应试教育,体育,政治,某个大奖,首富的排行榜等等,都可以看成是有限游戏。

3/ 有限游戏的赢家,往往会得到多数人公认的某个头衔,而这个头衔成为大家追逐的目标。一个社会流行的教育的价值观,让人们的大脑对这些头衔的产生了本能的,不假思索的追逐。

4/ 无限游戏,没有清晰边界和规则,没有胜负的界定,它的目的就是要永远继续玩下去,任何可以让你持续玩下去的行为,会被认为是好的行为。换言之,能让你活下来的决策,才是真正理性的决策。( 如Nassim Taleb 所言:Rationality is survival )

5/ 有限游戏的玩家在边界之内博弈;无限游戏的玩家和边界本身博弈 ;有限游戏的玩家通常不会意识到其行为自由度远远大于其想象。因为他要时常关注他在有限游戏中的进展,所有他往往误以为他正在做的事,是必须要做的。所以他会无意识地给自己画地为牢,而很难解脱。

6/ 有限游戏的玩家,追求的是确定性和对意外的控制。所以有限玩家接受的训练,就是要不断预测防范所有未来的可能性,以实现对未来的掌控。

7/ 但是未来演变的维度和速度变化之快,意外的演变成指数级增长,以个体线性增长的资源试图穷举应对外界环境带来的指数增长的意外,来获得确定性,是数学上不可能的任务,是脆弱的。

8/ 秦始皇听说“亡秦者胡”而修长城,没有想到秦朝亡于胡亥;朱元璋为皇太子太孙殚精竭虑,杀戮大量功臣,没想到他去世后四年,燕王朱棣靖难之役拿下南京,取建文帝而代之。

9/ 从这个角度看,有限游戏中追求的连续性和对连续性衡量的单一化标准 (比如说:名,利),长期而言是海市蜃楼,水中明月。为了追求有限时空和规则内,胜利的确定性,而完全忽视了无限游戏中规则边界的改变;主观上想维护过去积累的各种成果,客观上却常常落后于外界环境演变的速度,并为之疲于奔命。

10/ 而无限游戏,追求的是不断扩大游戏的时空之边界,不断打破想象中的禁忌和限制;在无限游戏中, 意外是令人期待的,各种意外可以带来生存空间和生存方式的指数级上升。以线性的资源,主动开拓寻找指数增长的意外惊喜,数学上是反脆弱的。

11/ 正如 Carse 所说:To be prepared against surprise is to be trained. To be prepared for surprise is to be educated.
培训,是防备意外之风险 ;教育,则是准备迎接意外之惊喜。

12/ 讽刺的是,恰恰是在游戏规则和边界彻底变迁之时,有限游戏中追求的资源可能突然一钱不值,甚至成为负担而导致玩家的灭亡;无限游戏的玩家因为可以生存下来,所有可以轻松捕捉新环境中有价值的资源。这就是有限游戏玩家遭遇的不连续性。

13/ 但无限游戏的玩家,不可沉溺于好运带来的收获,而退化成一个有限游戏的保守玩家,否则自己也就注定重复他们的命运。

意识到在这个多变的世界愈发像一个无限游戏的情况下,不过早优化,不断脱先,将是最适合生存下来的策略。进化的目的是生存,而不是追求极致。要坚决拒绝“更快。更高,更强”和“把事情做到极致”的这类心灵鸡汤。

从另外一个角度看,追求极致,类似于追求神经网络中某一层的参数数目,而无限游戏好比增加神经网络的隐层的数目, 也就是增加维度。

Carse: 无限游戏无法被抽象化,因为它不是某个整体的一部分,也无法代表某个(更大的)整体;它就是一个整体,它也知道自己是一个(不可被抽象化的)整体。

6、朋友圈的晒没啥意义

Daniel Kahneman 老师的理论:

“ 快乐 (happiness ) 和满足 (satisfaction) 的区别在于‘记忆’。 快乐是一种实时发生的现象。满足是一种对于过去经历的回顾。人们在内心会不断讲述一个关于自己的故事,这个故事也许愉快,也许不愉快。短暂的快乐会感觉不错,但是不一定能够帮助这个长期的故事的构建。。有心理学家说,如果人们知道将要去度假但是他们的记忆都会被抹去而且他们无法拍照,那么他们可能选择根本就不去。我们做很多事的(下意识的)原因,是要留下让自己满足的回忆,可以未来再回顾。我们对于快乐本身实际上兴趣没有那么大。 这个理论也可以解释社交媒体推动的文化:我们某种程度上对快乐兴趣不大,我们更感兴趣制造一种让人嫉妒的存在感。我们忙碌于量化社交圈的好友和粉丝,而不是花更多时间和喜欢的人在一起。最终,这让我们很不爽。 ”

总觉得这里面还有更深的底层生理机制,需要继续深挖才能搞清楚。

记忆的坏处是可能导致过于纠结。因为纠结,无法摆脱记忆中的“沉没成本”,就无法做出永远符合“未来利益最大化”的选择。记得有人说为什么 alphago 围棋比人下得好,就是因为它每天不断“脱先”,不让记忆经历变为成长发展的负担。说来容易做起来难,因为你要用极度理性和大脑底层的生理直觉较劲。

在朋友圈里不断晒幸福感,会让比自己状态更差的人心里更加嫉恨,比自己强的人觉得可笑,实际上对自己没有太多好处。但是大家还是沉浸在自我满足的泡沫中很难自拔。这种现象背后的机制可能在以前有一定进化优势, 但是现在就不一定了。

7、很多成功者的成就,是和时势环境紧密相关的

netflix 福利不错,公司每天常有各种 party 各种好吃好喝,还时常提前在公司放些新电影。昨天放的是描绘当年美国工会 teamster 头目 Jimmy hoffa的电影,Irishman. Hoffa 五十到六十年代在美国地位和名气如日中天,甚至超过猫王。电影里有趣的地方是,经常在某个角色出现时,下面打了几行小字,"某某某,1979年坐在阳台上 (或1980年在自家厨房里),挨了多少枪,卒"。让我想起以前看过一个电影叫 burn baby burn 每个角色出现时,会标注几行小字, "某某某,曾经在(白宫的)林肯卧室里睡过 (或 没睡过)几天觉"。

netflix 公司三季度的营收突破五十亿美元,年化两百亿美元,这个数字已经达到全球电影院收入四百亿美元的一半。

现在去电影院看个电影票价都要将近十四美元,而且 amc 变成了要提前指定座位号,而不是像以前一样进去随便坐,先到先得。看样子是收入吃紧所以出此下策。这个票价已经超过 netflix 的十三美元月费,伯恩哈勃高级版的十美元月费,迪士尼plus的七美元月费。再这样下去,看来更多人会愿意宅在家里娱乐,电影院的生意越来越难做了。

Hoffa 因为通过工会和黑手党组织有些勾结, 67-71年坐了四年牢。后来被尼克松特赦出来后,还想重新获得当年在工会的如日中天的权力,但遭到新的实权派的抵制,1975年七月底在底特律一个停车场失踪。五年后他的老婆也因为长期伤痛欲绝而去世。

很多成功者的权力和成就,是和时势环境紧密相关的。同样的人,同样的套路,时势一变,和套路不再匹配,可能就玩不转了。有人说 AI 下围棋,之所以远超人类,是因为它不断疯狂地"脱先",不断根据最新的信息和情况改变博弈方法,而不是拘泥于某个特定的套路。如果那时候 Hoffa 有这个见识,最佳选择应当远离斗争的漩涡,安安静静跑到硅谷,赶上集成电路和电脑的发展热潮,不断囤积大公司的股票和周边的房产,也许很大程度上可以有个幸福的晚年。

teamster 工会成员主要是卡车司机,现在还有一百三十万左右的成员,等到自动驾驶技术开始铺开,可能会员数目将要面临断崖式的萎缩?

netflix 的商业模式是个长期被外人误解和低估的经典案例。它的高负债,负现金流,被搞财务分析的人过分夸大,没有理解其垄断地位的累积效应。外人只有当它坐大若干年后,才真正恍然大悟它是如何崛起的。

电影院面对制作大片的影视公司如迪士尼,在分账上实际还是非常弱势。netflix 则是在分发,制作两头都越来越硬。

实体店边际成本还是太高。电影院年收入全球每年增长不到 2%,netflix 增长超过 25%, 二者的差距还在加大。

想起黄光裕出狱后的豪言壮语,时势环境全部改变了,活神仙也无力回天了。

猜您喜欢: