聚类分析论文中的理论介绍
聚类分析论文中的理论介绍
聚类分析是研究“物以类聚”的一种科学有效的方法。做聚类分析时,出于不同的目的和要求,可以选择不同的统计量和聚类方法。
系统聚类是目前应用最为广泛的一种聚类方法,其基本思想是:先将待聚类的n个样品(或者变量)各自看成一类,共有n类;然后按照实现选定的方法计算每两类之间的聚类统计量,即某种距离(或者相似系数),将关系最为密切的两类合为一类,其余不变,即得到n-1类;再按照前面的计算方法计算新类与其他类之间的距离(或相似系数),再将关系最为密切的两类并为一类,其余不变,即得到n-2类;如此下去,每次重复都减少一类,直到最后所有的样品(或者变量)都归为一类为止。
什么是聚类分析?
1、与多元分析的其他方法相比,聚类分析是很粗糙的,理论尚不完善,但由于它成功地应用于心理、经济、社会、管理、医学、地质、生态、地震、气象、考古、企业决策等,因此成了多元分析的重要方法,统计包中都有丰富的软件,对数据进行聚类处理。
2、聚类分析除了独立的统计功能外,还有一个辅助功能,就是和其他统计方法配合,对数据进行预处理。
例如,当总体不清楚时,可对原始数据进行聚类,根据聚类后相似的数据,各自建立回归分析,分析的效果会更好。同时如果聚类不是根据个案,而是对变量先进行聚类,聚类的结果,可以在每一类推出一个最有代表性的变量,从而减少了进入回归方程的变量数。
3、聚类分析是研究按一定特征,对研究对象进行分类的多元统计方法,它并不关心特征及变量间的因果关系。分类的结果,应使类别间个体差异大,而同类的个体差异相对要小。
扩展资料:
聚类效果的检验:
一、聚类分析后得到的每个类别是否可以进行有效的命名,每个类别的特征情况是否符合现实意义,如果研究者可以结合专业知识对每个聚类类别进行命名,即说明聚类效果良好,如果聚类类别无法进行命名,则需要考虑重新进行聚类分析。
二、使用判别分析方法进行判断,将SPSS生成的聚类类别变量作为因变量(Y),而将聚类变量作为自变量(X)进行判别分析,判别分析具体分析聚类变量与类别之间投影关系情况,如果研究人员对聚类分析效果非常在乎,可以使用判别分析进行分析。
三、聚类分析方法的详细过程说明,描述清楚聚类分析的科学使用过程,科学的聚类分析方法使用即是良好结果的前提保障。
是、聚类分析后每个类别样本数量是否均匀,如果聚类结果显示为三个类别,有一个类别样本量非常少,比如低于30,此时很可能说明聚类效果较差。针对聚类效果的判断,研究者主要是结合专业知识判断,即聚类类别是否可以进行有效命名。
参考资料来源:百度百科—聚类分析
聚类分析的思想是什么
聚类分析的基本思想为:根据各个待分类的模式特征相似程度进行分类,相似的归为一类,不相似的归为另一类。
谢谢
上一篇:论文创新与特色万能模板
下一篇:聚类分析论文可以提的问题