机器学习必学10大算法原理（机器学习十大算法都是何方神圣）

逗爷 2022-12-04 10:20:16 278

机器学习必学10大算法原理（机器学习十大算法都是何方神圣）具体应用有：垃圾邮件检测、文章分类、情感分类、人脸识别等。P(A|B) 是后验概率， P(B|A) 是似然，P(A)为先验概率，P(B) 为我们要预测的值。机器学习算法分为三类：有监督学习、无监督学习、增强学习。有监督学习需要标识数据（用于训练，即有正例又有负例），无监督学习不需要标识数据，增强学习介于两者之间（有部分标识数据）。下面我将向大家具体介绍机器学习中10大算法（只介绍有监督、无监督两类，暂不介绍增强学习）。决策树是一种树形结构，为人们提供决策依据，决策树可以用来回答yes和no问题，它通过树形结构将各种情况组合都表示出来，每个分支表示一次选择（选择yes还是no），直到所有选择都进行完毕，最终给出正确答案。朴素贝叶斯分类器基于贝叶斯理论及其假设（即特征之间是独立的，是不相互影响的）

雷锋网按：机器学习与人工智能变得越来越热。大数据原本在工业界中就已经炙手可热，而基于大数据的机器学习则更加流行，因为其通过对数据的计算，可以实现数据预测、为公司提供决策依据。跟我们生活息息相关的最常见机器学习算法包括电影推荐算法、图书推荐算法。这些算法都是基于你的电影观看记录或图书购买记录来给你做推荐的。

James Le 在 KDnuggets 上发布了一篇文章，介绍了他是如何入门机器学习的。此外，他在其中摸索出十大常用的机器学习算法，并逐一进行介绍。雷锋网编译如下，未经许可不得转载。

如果你想学机器学习，那怎么入门呢？对于我来说，我是这样开始我的机器学习的，首先，我选修了一门人工智能课程。教我课程的老师是Technical University of Denmark的大学教授，他的研究方向就是逻辑与人工智能。我们用的教材是人工智能的经典教材： Peter Norvig's Artificial Intelligence — A Modern Approach。这本书主要讲了智能主体、对抗搜索、概率论、多智能系统、AI哲学等等。这门课程我上了三个学期，最后我做了一个简单的基于搜索的智能系统，这个系统可以完成虚拟环境下的传输任务。

通过这门课程我学到了很多知识，在将来我还要继续学习。最近几周，我有幸在旧金山的举办的机器学习大会上与众多机器学习大牛交谈，我和他们聊了很多关于深度学习、神经网络、数据结构的内容。此外，我还在网上选修了一门机器学习入门课程，正巧刚刚修完。在接下来内容中，我将和大家分享我在这门课程中所学到的机器学习常用算法。

机器学习算法分为三类：有监督学习、无监督学习、增强学习。有监督学习需要标识数据（用于训练，即有正例又有负例），无监督学习不需要标识数据，增强学习介于两者之间（有部分标识数据）。下面我将向大家具体介绍机器学习中10大算法（只介绍有监督、无监督两类，暂不介绍增强学习）。

一、有监督学习

算法一：决策树

决策树是一种树形结构，为人们提供决策依据，决策树可以用来回答yes和no问题，它通过树形结构将各种情况组合都表示出来，每个分支表示一次选择（选择yes还是no），直到所有选择都进行完毕，最终给出正确答案。

机器学习必学10大算法原理（机器学习十大算法都是何方神圣）(1)

算法二：朴素贝叶斯分类器

朴素贝叶斯分类器基于贝叶斯理论及其假设（即特征之间是独立的，是不相互影响的）

机器学习必学10大算法原理（机器学习十大算法都是何方神圣）(2)

P(A|B) 是后验概率， P(B|A) 是似然，P(A)为先验概率，P(B) 为我们要预测的值。

具体应用有：垃圾邮件检测、文章分类、情感分类、人脸识别等。

算法三：最小二乘法

如果你对统计学有所了解，那么你必定听说过线性回归。最小均方就是用来求线性回归的。如下图所示，平面内会有一系列点，然后我们求取一条线，使得这条线尽可能拟合这些点分布，这就是线性回归。这条线有多种找法，最小二乘法就是其中一种。最小二乘法其原理如下，找到一条线使得平面内的所有点到这条线的欧式距离和最小。这条线就是我们要求取得线。

机器学习必学10大算法原理（机器学习十大算法都是何方神圣）(3)