机器学习的分类(机器学习的分类)
机器学习的分类(机器学习的分类)
机器学习主要分成两大类:有监督学习和无监督学习,两者的区别在于是否有标签。标签可以类比为问题的答案,提供答案让计算机用来学习以及检查学习效果的是监督学习,没有答案的是无监督学习。比如在垃圾邮件分类问题中,每封邮件都被标记了是否是垃圾,计算机学习以后就可以实现自动对新邮件分类,这是有监督学习。再比如电子商务网站、娱乐平台等通常都拥有大量用户数据,这些数据一般没有标签,我们常常需要把有着相似属性的用户放在一起,从而为后期的个性化推荐服务,这是无监督学习。
有监督学习又进一步分为:回归和分类两大类。两类的不同点在标签类别是否有限,回归的标签一般是连续的实数,比如给定房屋各项属性值(面积,建造年份,所处地理位置)预测房屋价格;分类的标签则是有限多个,比如给定西瓜的各项属性值(瓜蒂、声响、颜色)预测是否为好瓜。
如同每个人都会采用最适合自己的学习方法,计算机也是一样,面对大量数据时,它也要选择合适的学习方法,这些方法我们可以统称为机器学习算法。常用的有监督学习算法有:线性回归和线性分类算法、k-近邻算法、逻辑回归、支持向量机、决策树和随机森林以及现在非常火热的神经网络和深度学习,无监督学习算法有:k-均值算法、聚类算法、降维算法等。后面我会一一详述每种算法的特点和适用的条件。
未完待续……