复杂问题解决的认知模型(线性模型一复杂问题的抽象与简化)
复杂问题解决的认知模型(线性模型一复杂问题的抽象与简化)在一元线性模型中,自变量x的变化,会导致因变量y的线性变化,用如下方程表示: y=kx b 其中,k等于直线的斜率,即因变量y的变化速度;b等于截距,即当自变量x等于0时的因变量值。简单的线性模型为一元线性模型,较为复杂的为多元线性模型。一元线性模型和多元线性模型在实际生活中的建模,都需要用到线性回归,即一元线性回归和多元线性回归。下面分别介绍。对线性的界定,一般是从相互关联的两个角度来进行的:其一,叠加原理成立:f(x y)=f(x) f(y)。即总体等于部分之和,线性系统是可以叠加的。其二,物理变量间的函数关系是直线,变量间的变化率是恒量,这意味着函数的斜率在其定义域内处处存在且相等,即函数的一阶导数为常数。
工作和生活中,我们面对的问题要么是线性的,要么是非线性的。
例如你找个稳定的工作上班,工资相对比较稳定,你的努力和收入就是一个线性关系。
如果你创业或者做风险投资,你的努力和收入可能就不是线性关系了,可能你新研发的一个新技术专利就可以让你的财富实现指数级别的增长。也可能一个“新冠疫情黑天鹅”就可以让你血本无归。
就像《三体》作者刘慈欣一样,在电厂上班,努力和收入是线性的,而写科幻小说,努力和收入是非线性的。线性是一种简化形式,是对复杂问题的抽象与简化,绝对的线性是不存在的,世界上只有理想中的线性和近似的线性关系。
线性模型对线性的界定,一般是从相互关联的两个角度来进行的:
其一,叠加原理成立:f(x y)=f(x) f(y)。即总体等于部分之和,线性系统是可以叠加的。
其二,物理变量间的函数关系是直线,变量间的变化率是恒量,这意味着函数的斜率在其定义域内处处存在且相等,即函数的一阶导数为常数。
简单的线性模型为一元线性模型,较为复杂的为多元线性模型。一元线性模型和多元线性模型在实际生活中的建模,都需要用到线性回归,即一元线性回归和多元线性回归。下面分别介绍。
一元线性模型在一元线性模型中,自变量x的变化,会导致因变量y的线性变化,用如下方程表示: y=kx b 其中,k等于直线的斜率,即因变量y的变化速度;b等于截距,即当自变量x等于0时的因变量值。
一元线性模型呈现的函数图像为一条直线,其变化率为k,直线的斜率k处处相等。若k为正,则y与x正相关,若k为负,则y与x负相关。
在现实世界中,存在着大量的这样的情况:两个变量例如x和y有一些依赖关系。由x可以部分地决定y的值,但这种决定往往不很确切。
常常用来说明这种依赖关系的最简单、直观的例子是体重与身高。若用x表示某人的身高,用y表示他的体重。众所周知,一般来说,当x大时,y也倾向于大。但x不能严格地决定y。
又如,城市生活里用电量y与气温x有很大的关系,但夏天气温很高或冬天气温很低时,由于空调、冰箱等家用电器的使用,用电量就高。相关在春秋季气温不高也不低,用电量就相对少。但我们不能由气温x准确地决定用电量y,类似的例子还很多。
变量之间的这种关系称为“相关关系”,回归模型就是研究相关关系的一个有力工具。
一元线性回归,即两个相关关系的变量,它们之间为近似的一次函数关系。例如从某大学中随机选取8名女大学生,其身高和体重数据如下,
根据数据,绘制身高与体重的散点图,根据最小二乘法,做回归分析,可作图
则由回归分析,可得出其回归方程:y=0.849x-85.712
由此回归方程,即可预测女大学生身高与体重的大致线性关系。任意给定一个女大学生的身高,即可预测其大概的体重值。当然,预测的值有一定的误差。我们用R2来判断误差大小,回归线越靠近数据,模型解释的数据越多,R2就越大(得到解释的百分比越大),误差就越小。如果数据全部都恰好位于回归线上,R2就等于100%。
多元线性模型大多数现象都有不止一个因果变量和相关变量,这种为多个变量建模的模型称之为多元线性模型。
为了直观的理解多元线性模型,我们先来了解一个方程,迈克尔·莫布森著名的实力-运气方程,这个方程说的是,任何成功,无论是日常工作中的成功、体育运动上的成功,都可以视为实力-运气的一个加权线性函数。
成功=a×实力 (1-a)×运气。
其中,a位于区间[0,1]上,是技能的相对权重。
如果给实力和运气分配适当的权重(也许通过利用现有数据进行回归,可以得到这样的权重),我们就能够运用这个模型来预测结果。
例如一个运动员,在高级别比赛中获奖,拼的不仅仅是实力,因为在顶级的比赛中,各个选手的实力都不相上下的,关键看比赛当时的运气,比如前一天晚上有没有休息好?有没有生病?精神是否紧张?是否超常发挥?或者前一天有没有接触到新冠病人等?
这些都是不可控因素,拼的是运气。就像在奥运会,进入决赛的选手之间的实力差异很小,因而运气就非常重要了。莫布森把这种情况称为“实力悖论”(paradox of skill)。
历史上最伟大的运动员之一迈克尔·菲尔普斯可以说同时位于这个悖论的两端。
在2008年奥运会的一场决赛中,菲尔普斯在100米蝶泳快结束时仍然落后于米洛拉德·卡维奇。然而幸运女神眷顾了他,菲尔普斯率先触到了池壁。然而,在2012年奥运会的一场决赛中,菲尔普斯一直领先于查德·勒·克洛斯,但是幸运女神这次没有眷顾他,勒·克洛斯率先触到了池壁。菲尔普斯拥有令人难以置信的实力,但是上一次胜利和这一次失败,却都是运气的产物。
生活中的线性模型大多是多元线性模型。就像一个人的幸福可以归因于身体健康、 婚姻美满、子女、宗教信仰和财富等,在常人看来拥有巨额财富的富豪,应该个个都很幸福,但其实未必。
一个人的健康可以归因于其身体基础条件,饮食习惯,睡眠质量,运动健身状况等。一个学生的学习成绩可能受到学习时间、听课质量等多重因素影响。下面来看一个案例:
例如一个学生的数学成绩,我们通过多元数据回归分析,大致可以得出学生数学成绩的回归方程。大致由三个要素来决定。不妨设x为学生学习的小时数,y为学生家庭社会经济状况,z为学生参加高质量的辅导班。大致可以得出如下回归方程:
数学成绩=9.2x 0.8y 6.9z 21.1
由此回归方程,可以看出学生的数学成绩,是多元线性模型,影响较大的是学生学习的小时数,和学生上课的学习情况。每增加一个小时的学习,成绩将提高9.2分,每多上一次课,学生成绩增加6.9分。
而与家庭社会经济状况关系不大。由此多元线性回归方程,大致就可量化预测一个孩子的数学成绩。通过这个模型预测,如果花7个小时学习,并同时参加一个“高质量的辅导班”课程,数学成绩就能够达到90分左右。这个模型还可以用来指导行动,但必须保持谨慎,因为我们无法推断因果关系,只能知道各变量之间相关关系。所以不管做任何事情,请记住:不把相关当因果。
尼采说过:“世界上最危险的关系就是因果关系”。因为这个世界是混沌和复杂的。但在这个复杂的世界里,人类需要一定的确定性,需要对很多现实问题进行抽象和简化,找到影响事物运行的关键变量,将其变为线性问题,用回归分析去模拟其回归方程,从而预测未来的结果。
小结线性模型是对复杂问题的简化,简化复杂问题,是我们处理问题的一种方式。
尤其是自然科学领域,这种简化问题的方式随处可见。比如牛顿力学系统,各个公式的导出,即一种理想假设,从而得出线性的结论。
如:f=ma,s=vt等等;在数学中,线性代数,运筹学,都是将复杂的生活问题简化成线性关系,从而计算出一个最优解;再比如傅立叶变换,表示能将满足一定条件的某个函数表示成三角函数(正弦和/或余弦函数)或者它们的积分的线性组合。类似的例子,在科学研究中还很多。
在生活中,我们面对的大多数问题都是非线性的。比如说,如何成功?如何谈恋爱?如何学习?如何受人欢迎?如何建立人脉圈?等等,这些问题的答案其实都是非线性的,是混沌的,没有标准的线性答案。
但我们通常的考虑方式也是将其简化,转化为线性答案和行为。比如我们的生活习惯,大多是线性的,每天固定时间大致做什么事情,由习惯支配,是线性的;生活的常态,是线性的,生活的无常是非线性的;部分职业的收入,靠稳定线性工资,收入是线性的;而创业的人,收入是非线性的,可能赚很多也可能亏很惨。
所以,线性模型,是一种非常重要的思维方式,是一种将复杂问题简化的方式,在某些问题上,其简化后的结果能高度拟合现实,在简单的系统中非常有用,也非常高效。当然,一些复杂问题,在复杂系统中,是非线性的。所以,我们不仅仅要有线性思维,也需要具备非线性思维。
参考资料:
《模型思维》
作者:斯科特·佩奇
浙江人民出版社