快捷搜索:  汽车  科技

系统聚类需要设置聚类的个数(针对变量的聚类)

系统聚类需要设置聚类的个数(针对变量的聚类)第四步:选择输出“树状图”,不同版本的SPSS,对该图形的叫法不同,此处为SPSS24.0,名称为“谱系图”。较老版本中翻译为“树状图”。设置完毕后点击确定,得到分析结果。第三步:设置聚类方法为“组间连接”,并且将测量指标选择为“皮尔逊相关性”。(对变量的聚类,一般都是选择利用皮尔逊相关系数来衡量变量之间的距离)。spss中的系统聚类方法,可以利用pearson相关系数来衡量变量之间的距离,并且自动对变量进行类别划分,点点菜单就能得到结果,是不是很赞?下面就来介绍如何用系统聚类方法得到我们想要的结果——哪些国家的裁判打分比较一致。第一步:导入数据,并依次选择分析<分类<系统聚类。(数据通过阅读原文直接下载)第二步:将需要聚类的变量选入“变量”对话框。并且选择聚类类型为“变量”。

系统聚类需要设置聚类的个数(针对变量的聚类)(1)

在文章K-mean聚类(快速聚类)中介绍的快速聚类方法,只能够对个案进行聚类,但是有些情况下,需要对变量进行分类。如下面这个案列:

在某次国际跳水运动中,来自不同国家的裁判对一批跳水运动员的打分的部分数据如下图所示,现在想找出那些国家在打分上比较一致。

系统聚类需要设置聚类的个数(针对变量的聚类)(2)

分析本案例,要找出那些国家在打分上比较一致,那么我们可以考虑利用相关分析得到不同国家的裁判所给出的分数的相关系数,相关系数大的两个国家之间,打分比较一致。得到的相关系数矩阵如下图:

系统聚类需要设置聚类的个数(针对变量的聚类)(3)

这个表格有没有价值呢?价值是有的,只不过价值很低,还需要进一步加工,才能得到有用的信息——哪些国家的裁判打分的相关系数较大——哪些国家的裁判打分比较一致。

spss中的系统聚类方法,可以利用pearson相关系数来衡量变量之间的距离,并且自动对变量进行类别划分,点点菜单就能得到结果,是不是很赞?下面就来介绍如何用系统聚类方法得到我们想要的结果——哪些国家的裁判打分比较一致。

第一步:导入数据,并依次选择分析<分类<系统聚类。(数据通过阅读原文直接下载)

第二步:将需要聚类的变量选入“变量”对话框。并且选择聚类类型为“变量”。

系统聚类需要设置聚类的个数(针对变量的聚类)(4)

第三步:设置聚类方法为“组间连接”,并且将测量指标选择为“皮尔逊相关性”。(对变量的聚类,一般都是选择利用皮尔逊相关系数来衡量变量之间的距离)。

系统聚类需要设置聚类的个数(针对变量的聚类)(5)

第四步:选择输出“树状图”,不同版本的SPSS,对该图形的叫法不同,此处为SPSS24.0,名称为“谱系图”。较老版本中翻译为“树状图”。设置完毕后点击确定,得到分析结果。

系统聚类需要设置聚类的个数(针对变量的聚类)(6)

第五步:阅读输出结果,我们不关心表格,通过图形就能够直观的看出那些国家被分到了同一个类中。先来阅读树状图。

树状图的解读方法:注意图中3条不同颜色的线和圆圈以及文字注释。利用树状图来分类,我们需要借助一个直线,来切割这棵树。当用红色线来切割时,得到与树的4个交叉点,交叉点再往下的类别归为1类,于是将这些国家分成了4类。

第一类是:韩国、法国、美国

第二类是:意大利

第三类是:罗马尼亚、俄罗斯、中国

第四类是:跳水运动爱好者

当用蓝色线来切割时,意大利被归到了第一类,其它类别不变。

当用黑色线来切割时,专业裁判与普通爱好者分成了两个类别,说明专业与非专业的差别还是很大。

系统聚类需要设置聚类的个数(针对变量的聚类)(7)

冰柱图的阅读方法

spss中聚类分析结果中还有一类图形,就是冰柱图,如下图所示。阅读冰柱图,同样需要借助几何图形。这里用矩形遮盖整个冰柱图的一部分。每个国家对应的柱子是完整的,国家之间的柱子高低不一。在可以看见的区域,如果柱子是白色的,说明,柱子两边的部分归属不同的类别。当用半透明的矩形遮住一部分后,图中有两个柱子显示出了白色,因此将所有国家分为了3类。与上面树状图分为3类的情况一致。

系统聚类需要设置聚类的个数(针对变量的聚类)(8)

如需练习本文介绍的方法,点击阅读原文下载数据。

猜您喜欢: