数据分类的几种方法(分类数据处理方法)
数据分类的几种方法(分类数据处理方法)分享“TES工作室”公众号相应推文内容到3个500人以上的学校群聊或者朋友圈展示24小时,截图给客服可以免费获取一份数学建模资料包集合,包括数学建模历年优秀论文、数学建模常见十大算法包、数学建模用书三十本等。除了上述几类方法,还有深度学习算法黑盒协议一样可以适用该问题分析,不过常用于大样本数据分析。接下来,TES工作室将以军事数学建模题作为案例,解析多种聚类算法、分类算法和回归算法,以python来实现。回归算法:一种预测性的建模技术,它研究的是因变量(目标)和自变量(预测器,自变量数量可以是单个也可以是多个)之间的关系。聚类算法:现对样本的细分,使得同组内的样本特征较为相似,不同组的样本特征差异较大。常见的聚类算法有Mean-shift、Spectral Clustering、Hierarchical Clustering、DBSCAN、Birch、GaussianMixtureMode
2020年军事数学建模C题第一问给出附件1作战车辆属性数据和分类数据,对未知分类编队的车辆属性数据附件2进行分类。
这题实质上是已知类别标号样本,对未知样本进行分类,对于此类问题通常可以采取数据挖掘方式进行分析,常见的有4种方法:分类、回归、聚类分析、关联分析。
分类算法:在一群已知类别标号的样本中,训练一种分类器,对未知样本进行分类。它是集中有监督的学习。分类算法的分类过程就是建立一种分类模型来描述预定的数据集或概念集,通过分析由属性描述的数据库元组来构造模型。分类的目的就是使用分类对新的数据集进行划分,其主要涉及分类规则的准确性、过拟合、矛盾划分的取舍等。分类算法分类效果如图所示。
常用的分类算法包括:NBC(Naive Bayesian Classifier,朴素贝叶斯分类)算法、LR(Logistic Regress,逻辑回归)算法、ID3(Iterative Dichotomiser 3 迭代二叉树3 代)决策树算法、C4.5 决策树算法、C5.0 决策树算法、SVM(Support Vector Machine,支持向量机)算法、KNN(K-Nearest Neighbor,K 最近邻近)算法、ANN(Artificial Neural Network,人工神经网络)算法等。
回归算法:一种预测性的建模技术,它研究的是因变量(目标)和自变量(预测器,自变量数量可以是单个也可以是多个)之间的关系。
聚类算法:现对样本的细分,使得同组内的样本特征较为相似,不同组的样本特征差异较大。常见的聚类算法有Mean-shift、Spectral Clustering、Hierarchical Clustering、DBSCAN、Birch、GaussianMixtureModel算法。
关联算法:指的是我们想发现数据的各部分之间的联系和规则。常见的有Apriori和FP-growth 算法。
除了上述几类方法,还有深度学习算法黑盒协议一样可以适用该问题分析,不过常用于大样本数据分析。接下来,TES工作室将以军事数学建模题作为案例,解析多种聚类算法、分类算法和回归算法,以python来实现。
分享“TES工作室”公众号相应推文内容到3个500人以上的学校群聊或者朋友圈展示24小时,截图给客服可以免费获取一份数学建模资料包集合,包括数学建模历年优秀论文、数学建模常见十大算法包、数学建模用书三十本等。
若有疑问可扫描文末二维码进群咨询。
出品/TES工作室
推荐阅读:
投影寻踪回归模型
马科维茨投资组合模型
数学建模——抢险救援问题
编程建模丨Python异常值检测——向量机算法
编程建模丨Python异常值检测——孤立森林算法
编程建模丨Python异常值检测——kNN算法