机器学习原理线性回归(线性分类器详解)
机器学习原理线性回归(线性分类器详解)希望获得代码的同学请留言你们的邮箱,小编会一一发给你们小结最初级的线性分类器仅仅用到了一些高中知识,一般人也可以理解的,但这却是很多后续机器学习算法的核心。注意里面的几个概念,其一利用训练数据来得到模型,再利用模型去预测数据;其二使用数值最优化方法训练模型,其三对数据分析选用合适的模型。后续小编将继续介绍逻辑回归等更加高级的线性即广义线性分类器转载请注明出处,谢谢
机器学习(Machine Learning)是计算机科学的一个分支,是当前最前沿的研究方向之一,吸引了包括数学,数值最优化,统计学等领域学者的高度重视。
最初在1959年,学者Arthur Samuel将机器学习定义为“让计算机具有学习能力的研究方向,并且这种能力不是由显式的编程带来的”。机器学习致力于探索并研究能够在数据上进行预测的算法,这些算法根据样例构建模型从而能够给出数据驱动的预测甚至决策,而不再单单基于规则预测。
线性分类器
分类器,顾名思义,希望把数据分成我们想要的几个类别。首先我们假设一个目标可以用向量来表示。向量使用多个维度的数值来表示一个物体,比如我们从身高和体重来代表一个人,这种表示就是一个二维向量。n维向量用数学符号表示为:
而使用二维向量表示人可以表示为
分类器希望我们有目标的将物体分为几个类别,具体到刚刚的例子就是通过人的身高和体重将人分为胖瘦。所有机器学习算法一般假设我们有一组训练数据,类似于
所以我们需要使用前面提到的训练数据来找到里面的两个参数:
这里面有不同的求解方法,大体的思路就是要尽量要逼近0和1,使得误差值越小越好,用最优化的写法就是
这里呢,能理解的同学就理解,不能的就认识其表述为要找到最好的参数使得后面的值越小越好。使用最小二乘法可以求解,求得的线如下,可以发现其很好的把数据分为了两类。 其次,有时候数据会有偏置(bias),就是高中数学里面的截距,指的是数据集体相比于0有一个偏移量,即
更新后的结果为 后续根据新来的人的身高和体重,我们使用上述公式计算他的得分,如果高于0.5就判别为胖,否则为瘦。
小结
最初级的线性分类器仅仅用到了一些高中知识,一般人也可以理解的,但这却是很多后续机器学习算法的核心。注意里面的几个概念,其一利用训练数据来得到模型,再利用模型去预测数据;其二使用数值最优化方法训练模型,其三对数据分析选用合适的模型。后续小编将继续介绍逻辑回归等更加高级的线性即广义线性分类器
转载请注明出处,谢谢
希望获得代码的同学请留言你们的邮箱,小编会一一发给你们