• 回答数

    3

  • 浏览数

    80

kisscat0317
首页 > 学术期刊 > 模糊聚类分析论文参考文献

3个回答 默认排序
  • 默认排序
  • 按时间排序

壹只头俩只脑

已采纳

聚类分析算法论文

聚类分析又称群分析,它是研究(样品或指标)分类问题的一种统计分析方法,同时也是数据挖掘的一个重要算法。下面是我分享给大家的聚类分析算法论文,欢迎阅读。

一、引言

聚类分析算法是给定m维空间R中的n个向量,把每个向量归属到k个聚类中的某一个,使得每一个向量与其聚类中心的距离最小。聚类可以理解为:类内的相关性尽量大,类间相关性尽量小。聚类问题作为一种无指导的学习问题,目的在于通过把原来的对象集合分成相似的组或簇,来获得某种内在的数据规律。聚类分析的基本思想是:采用多变量的统计值,定量地确定相互之间的亲疏关系,考虑对象多因素的联系和主导作用,按它们亲疏差异程度,归入不同的分类中一元,使分类更具客观实际并能反映事物的内在必然联系。也就是说,聚类分析是把研究对象视作多维空间中的许多点,并合理地分成若干类,因此它是一种根据变量域之间的相似性而逐步归群成类的方法,它能客观地反映这些变量或区域之间的内在组合关系。盐矿区系统是一个多层次、复杂的大系统,涉及诸多模糊、不确定的因素。平顶山市盐矿区的经济分类是以整个平顶山市的所有盐矿区为研究对象,以各盐矿区为基本单元,以经济为中心,以发展战略和合理布局为目标进行经济类型区划。其基本原则是:平顶山市的盐矿区资源开发、利用的相对一致性;自然、经济、社会条件的一致性;保持一定行政地域单元的相对稳定性。现行的平顶山市盐矿区行政划分不能反映出各个盐矿区的共同点,有必要通过模糊聚类分析将那些经济实际状况相似的铁矿区归类,剖析、发现各况矿区的差异,对症下药,为制定发展对策提供依据。

二、建立指标体系

1、确定分类指标进行经济区划分,应考虑的指标因素是多种多样的。既要以岩盐矿资源储量为主,又要适当考虑岩盐质量和勘察阶段和开发利用状况;既要有直接指标,又要有间接指标;既要考虑矿区发展的现状,又要考虑矿区发展的过程和矿区发展的未来方向。参考有关资料,结合专家意见,我们确定了对平顶山市盐矿区进行经济区划分的指标。如表1所示。表中列举了具体指标及各指标的原始数据(数据来源于河南省2006年矿产资源储量简表)。表1盐矿区经济划分指标体系及指标数据注:表中N表示缺失数据,勘察阶段1、2、3分别表示:初步勘探、详细普查、详细勘探,利用状况1~7分别表示:近期不宜进一步工作、可供进一步工作、近期难以利用、推荐近期利用、计划近期利用、基建矿区、开采矿区。

2、转换指标数据由于不同变量之间存在不同量纲由于不同变量之间存在不同量纲、不同数量级,为使各个变量更具有可比性,有必要对数据进行转换。目前进行数据处理的方法大致有三种,即标准化、极差标准化和正规化。为便于更直观的比较各市之间同一指标的数值大小,我们采用了正规化转换方式。其计算公式为:为了方便叙述,做如下设定:设Xi(i=1,2,3,…,21)为具体指标层中第i个评价指标的值,Pi(i=1,2,3,…,21)为第i个指标正规化后的值,0≤Pi≤1,Xs,i(Xs,i=Xmax-Xmin),为第i个评价指标的标准值,Xmax为最大值,Xmin为最小值。(1)对于越高越好的`指标①Xi≥Xmax,则Pi=1;②Xi≤Xmin,则Pi=0;③Xmin

三、聚类分析

1、聚类步骤(Stage).从1~3表示聚类的先后顺序。

2、个案合并(ClusterCombined)。表示在某步中合并的个案,如第一步中个案1叶县田庄盐矿段和个案2叶县马庄盐矿段合并,合并以后用第一项的个案号表示生成的新类。

3、相似系数(Coefficients).据聚类分析的基本原理,个案之间亲密程度最高即相似系数最接近于1的,最先合并。因此该列中的系数与第一列的聚类步骤相对应,系数值从小到大排列。

4、新类首次出现的步骤(StageClusterFirstAppears)。对应于各聚类步骤参与合并的两项中,如果有一个是新生成的类(即由两个或两个以上个案合并成的类),则在对应列中显示出该新类在哪一步第一次生成。如第三步中该栏第一列显示值为1,表示进行合并的两项中第一项是在第一步第一次生成的新类。如果值为O,则表示对应项还是个案(不是新类)。

5、新类下次出现步骤(NextStage)。表示对应步骤生成的新类将在第几步与其他个案或新类合并。如第一行的值是11,表示第一步聚类生成的新类将在第11步与其他个案或新类合并。

6、解析图DendrogramusingAverageLinkage(BetweenGroups)RescaledDistanceClusterCombine聚类树状图(方法:组间平均连接法)图清晰的显示了聚类的全过程。他将实际距离按比例调整到0~25之间,用逐级连线的方式连接性质相近的个案或新类,直至并未一类。在该图上部的距离标尺上根据需要(粗分或细分)选定一个划分类的距离值,然后垂直标尺划线,该垂线将与水平连线相交,则相交的交点数即为分类的类别数,相交水平连线所对应的个案聚成一类。例如,选标尺值为5,则聚为3类:叶县田庄盐段、叶县马庄盐矿段为一类,叶县娄庄盐矿、叶县五里堡盐矿段为一类,叶县姚寨盐矿为一类。若选标尺值为10,则聚为2类:叶县田庄盐段、叶县马庄盐矿段为一类,叶县娄庄盐矿、叶县五里堡盐矿段、叶县姚寨盐矿为一类。

四、结论

对平顶山市5个盐矿区进行经济区划分,究竟划分为几个区合适,既不是越多越好,也不是越少越好。划分经济区的目的,就是要根据各盐矿经济区资源特点、勘察、开发的不同,分类指导经济活动,使人们的经济活动更加符合当地的实际,使各经济区能充分发挥各自的优势,做到扬长避短,趋利避害,达到投人少、产出多,创造良好的经济效益和社会效益之目的。分区太多,就失去了分区的意义,分区太少,则分类指导很难做到有的放矢。综合以上聚类分析结果,我们可以得出三个方案。其中两个方案比较合适,可供选择。方案一:(当比例尺为5时,分为3类)叶县田庄盐段、叶县马庄盐矿段为一类,叶县娄庄盐矿、叶县五里堡盐矿段为一类,叶县姚寨盐矿为一类。从聚类分析中看出平顶山市盐矿区分类图方案一。方案二:(当比例尺为10时,分为2类)叶县田庄盐段、叶县马庄盐矿段为一类,叶县娄庄盐矿、叶县五里堡盐矿段、叶县姚寨盐矿为一类。从聚类分析中看出平顶山市盐矿区分类图方案二。平顶山市盐矿区分类图方案2聚类分析的原理就是将矿石质量、资源储量、勘查阶段、利用状况相近或相类似的矿区聚合在一起,其分析结果也是直观易见的。在此结合平顶山市实际行政区划以及矿山企业特征我们对铁矿区划分做一个调整使其理论与实际能够结合的更紧密使其更好的指导实践。

1、叶县田庄盐段、叶县马庄盐矿段为一类,这一类属于矿床规模相当,资源储量接近,勘查开发阶段接近,利用程度相当,故,可以分为一类。

2、叶县娄庄盐矿、叶县五里堡盐矿段为一类,这一类属于勘查开发阶段处于同一阶段。

3、叶县姚寨盐矿为一类,这一类属于储量较高,盐矿品位较高,故其勘察开采规划有别于其它两类。总的说来,运用聚类分析是基本成功的,大部分的分类是符合实际的。综合以上论述盐矿区划分如下表所示:当然聚类分析有其优点也有其缺点:(1)优点:聚类分析模型的优点就是直观,结论形式简明。(2)缺点:在样本量较大时,要获得聚类结论有一定困难。由于相似系数是根据被试的反映来建立反映被试问内在联系的指标,而实践中有时尽管从被试反映所得出的数据中发现他们之间有紧密的关系,但事物之间却无任何内在联系,此时,如果根据距离或相似系数得出聚类分析的结果,显然是不适当的,但是,聚类分析模型本身却无法识别这类错误。

271 评论

愿无悲喜2015

[1]李贤彬,李后强,丁晶.人地协同论的理论框架[J].大自然探索,1996,15(56):23~28

[2]李后强,艾南山,汪富泉.人地协同论:可持续发展模型构建的基础[J].中国人口·资源与环境,1998,8(3):48~53

[3]魏宏森,曾国屏.试论系统的层次性原理[J],系统辩证学学报.1995,3(1):42~47

[4]张鲜化,陈金泉.多目标突变论在城市空间发展方向决策中的应用[J].南方冶金学院学报,2005,26(3):51~55

[5]侯敏,张有坤.多目标突变论在城市用地发展方向决策中的应用———以抚顺市为例[J].特区经济,2008,24(1):54~56

[6]徐恒力.环境地质学,北京:地质出版社,2009

[7]邵桂华.渐变与突变的整合:突变论的体育教学启示[J].西安体育学院学报,2006,23(2):104~108

[8]吴效军.城市地质安全战略与城市地质灾害防治规划[J].规划师论坛,2002,18(1):14~16

[9]陈华文.城市可持续发展中地质环境的经济学分析———以上海城市地质环境为例[D].上海,复旦大学,2004

[10]韦仕川.土地利用规划的地质环境分析及研究应用:以东莞市为例[D].浙江:浙江大学,2008

[11]金浩,数量经济学的内涵及前沿问题[J],河北工业大学学报.2004,33(2):116~120

[12]张屹山,金成晓.数量经济学的特定内涵与学科定位,数量经济技术经济研究[J],2002,19(11):5~8

[13]周惠成,陈守煌.有模糊约束的多阶段多目标系统模糊优化理论与模型[J].水利学报,1992,22(2):29~36

[14]唐加福,汪定伟.模糊优化理论与方法的研究综述[J].控制理论与应用,2000,17(2):160 ~ 164

[15] 吴龙军,陈华平,田智慧 . 模糊优化理论在多目标多阶段决策系统中的应用 [J]. 价值工程,2004,23 (3): 110 ~ 112

[16] 杨庆,栾茂田 . 地下水易污性评价方法———DRASTIC 指标体系 [J]. 水文地质工程地质,1999,26(2): 4 ~ 9

[17] 孙才志,潘俊 . 地下水脆弱性的概念、评价方法与研究前景 . 水科学进展,2000,10 (4):444 ~ 449

[18] 蔡鹤生,周爱国等,地质环境评价理论与应用 . 中国地质大学出版社,1998

[19] Adams B,Foster SSD Land-surface zoning for groundwater protection. Institution of Water and Environment Managemengt,1992,6: 312 ~ 320

[20] El Naqa Ali. Aquifer vulnerability assessment using the DRASTIC model at Russeifa landfill,northeast Jordan. Environmental Geology,2004,47 (1): 51 ~ 62

[21] Thirunalaivasan D,Karmeqam M,Venuqopal K. AHP-DRASTIC: Software for specific aquifer vulnerability assessment using DRASTIC model and GIS. Environmental Modelling and Software,2003,18 (7): 645 ~656

[22] Al-Zabet T. Evaluation of aquifer vulnerability to contamination potential using the DRASTIC Geology,2002,43 (1): 203 ~ 208

[23] Lasserre F,Razack M Banton Q. A GIS-linked model for the assessment of nitrate contamination in groundwater. Journal of Hydrology. 1999,224: 81 ~ 90

[24] AllerI,Bennet T,Lehr J H et al. DRASTIC: a standardized system for evaluating groundwater pollution potential using hydrogeologic settings [R]. U. S. EPA Report,1987

[25] 陈守煜 . 工程水文水资源系统模糊集分析理论与实践 [M]. 大连: 大连理工大学出版社,1998

[26] 陈守煜 . 含水层脆弱性模糊分析模型与方法 [J]. 水利学报,2002,(7): 16 ~ 19

[27] 付雁鹏,高嘉瑞 . 模糊数学在水质评价中的应用 [M]. 武汉: 华中工学院出版社,1986

[28] Aller L,Bennett T,Lehr J H et al. DRASTIC: A Standardized system for evaluating groundwater potential using hydrogeological settings [A]. ROBERT S K. US EPA Report [R]. Environmental Research Laboratory,Ada Oklahoma,1985

[29] 孙才志,潘俊 . 地下水脆弱性的概念、评价方法与研究前景 . 水科学进展,2000,10 (4):444 ~ 449

[30] 姜志群 . 地下水污染敏感性评价中 DRASTIC 法的应用 . 河海大学学报,2001,29 (2): 100 ~ 103

[31] 杨庆,栾茂田 . 地下水易污性评价方法———DRASTIC 指标体系 [J]. 水文地质工程地质,1999,26(2): 4 ~ 9

[32] 姜志群 . 地下水污染敏感性评价中 DRASTIC 法的应用 . 河海大学学报,2001,29 (2): 100 ~ 103

[33] 杨晓婷,王文科等 . 关中盆地地下水脆弱性评价指标体系的探讨 . 西安工程学院学报,2001,23(2): 46 ~ 49

[34] 李玉,彭晓峰,陈慧青 . 统计软件 SPSS 在应用统计学教学中的应用 [J]. 金融教学与研究,2009,25 (3): 71 ~ 72

[35] 张春月,李晓奇 . 基于 SPSS 的模糊聚类分析 [J]. 见: 第七届中国不确定系统年会论文集 . 2009:99 ~ 103

[36] 胡应平 . 群决策中模糊偏好集结的软技术 [J]. 系统工程理论与实践,1999,19 (5): 105 ~ 109

[37] 孙培善等 . 城市地质工作概论 [M]. 北京: 地质出版社,2004

[38] 戴福初,李军,张晓晖 . 城市建设用地与地质环境协调性评价的 GIS 方法及其应用 [J]. 地球科学—中国地质大学学报,2000,25 (2): 210 ~214

[39] 王思敬 . 典型人类工程活动与地质环境相互作用研究 [M]. 北京: 地质出版社,1995

[40] 许树柏 . 层次分析法原理 [M]. 天津: 天津大学出版社,1988

[41] 张卫民,安景文,韩朝 . 嫡值法在城市可持续发展评价问题中的应用 [J],数量经济技术经济研究 . 2003,20 (6): 115 ~118

[42] 孟凡永 . 区间数、三角模糊数及其判断矩阵排序理论研究 [D]. 广西大学,2008

[43] 宋光兴 . 多属性决策理论、方法及其在矿业中的应用研究 [D]. 昆明理工大学,2001

[44] 吴恒 . 城市用地的影响因素分析及其评价系统 [J]. 地理研究,1995,14 (4): 69 ~ 77

[45] 徐泽水 . 三角模糊数互补判断矩阵排序的一种排序方法 [J]. 模糊系统与数学,2002,16 (1):47 ~ 50

[46] Buckley J. J. Ranking Alternatives Using Fuzzy Numbers [J],Fuzzy Sets and Systems,1985,15 (1):21 ~ 31

[47] 关冲,李汉铃 . 模糊 AHP 决策方法 [J]. 管理工程学报,2001,15 (1): 63 ~ 64

[48] 胡艳欣,任茂昆 . 地质环境质量的模糊评价 [J]. 西部探矿工程,2003,15 (10): 169 ~ 170

[49] 蔡鹤生,唐朝晖,周爱国 . 地质环境质量综合评价中的敏感因子模型 [J]. 地质科技情报,1998,17 (2): 72 ~ 76

[50] 周爱国,梁和成等 . 城市地质环境评价方法专题研究报告,2004

[51] Shu-Jen J. Chen,Hwang C. L. Fuzzy Multiple Attribute Decision Making: Methods and Applications[M]. New York,Springer-Verlag,1992

[52] 刘树林,邱莞华 . 多属性决策基础理论研究 [J]. 系统工程理论与实践,1998,18 (1): 38 ~ 43

[53] 张梅荣,姜玉英 . 多属性决策方法及其应用 [J]. 北京印刷学院学报,2007,15 (2): 72 ~ 75

[54] 宋光兴 . 多属性决策理论、方法及其在矿业中的应用研究 [D]. 昆明理工大学,2001

[55] 谭春桥,张强 . 模糊多属性决策的直觉模糊集方法 [J]. 模糊系统与数学,2006,20 (5): 71 ~ 76

[56] 周宏安 . 模糊多属性决策方法研究 [D]. 西安电子科技大学,2007

[57] 张全,樊治平,潘德惠 . 区间数多属性决策中一种带有可能度的排序方法 [J]. 控制与决策,1999,14 (6): 703 ~ 707

[58] 潘晖 . 多级模糊模式识别模型在地质环境评价中的应用 [J]. 西部探矿工程,2007,19 (8):83 ~ 85

[59] 谭周地 . 城市工程地质环境质量评价与区划 [M]. 北京: 地质出版社,1988

[60] 王东祥 . 搞好主题功能区划优化区域开发格局 [J]. 浙江经济,2006,23 (16): 4 7

[61] 孟昭福,薛澄泽,张增强,等 . 土壤中重金属复合污染的表征 [J]. 农业环境保护,1999,18(2): 87 ~ 91

[62] 夏立江,王宏康 . 土壤污染及其防治 [M]. 上海: 华东理工大学出版社,2001

[63] 阮俊华,张志剑,陈英旭,等 . 受污染土壤的农业损失评估法初探 [J]. 农业环境保护,2002,21(20): 163 ~ 165

[64] 郑昭佩,刘作新 . 土壤质量及其评价 [J]. 应用生态学报,2003,14 (1): 131 ~ 134

[65] 舒冬妮 . 用模糊数学综合评判土壤中重金属污染程度的探讨 [J]. 农业环境保护,1989,8 (5):30 ~ 32

[66] 王金生 . 灰 色 聚 类 法在 土 壤污染 综 合 评价中的 应 用 [J]. 农 业 环境保 护,1991,10 (4):169 ~ 172

[67] 张松滨 . 共斜率灰色聚类法与土壤环境质量评价 [J]. 农业环境保护,1991,10 (2): 80 ~ 83

[68] DEFRA,EA (The Environment Agency). Assessment of risks to human health from land contamination:an overview of the development of soil guideline values and related research [M]. London,Environmental Agency,2002: 12 ~ 85

[69] EA (The Environment Agency),DEFRA (Department of Environment,Food and Rural Affairs),Contaminated land Exposure Assessment (CLEA )Model: Technical Basis and Algorithms (include errata)[M]. London,The Environment Agency,2002: 12 ~ 97

[70] 罗启仕,李小平 . 上海建设用地土壤指导限值研究 [J]. 上海环境学,2007,26 (2): 77 ~ 82

[71] 施烈焰,曹云者 . RBCA 和 CLEA 模型在某重金属污染场地环境风险评价中的应用比较 [J]. 环境科学研究,2009,22 (2): 241 ~247

[72] C Paul Nathanail. ,Paul Bardos. Reclamation of Contaminated Land [M]. New York,John Wiley and sons,2004: 60 ~ 83

[73] 周杰,裴宗平,靳晓燕等 . 浅论土壤环境容量 [J]. 环境科学与管理,2006,31 (2): 74 ~ 76

[74] 叶嗣宗 . 土壤环境背景值在容量计算和环境质量评价中的应用 [J]. 中国环境监测,1993,9 (3):52 ~ 54

[75] 中国水网 . http: / /www. urumqi. gov. cn/lsshwjg/zilaishui/qysh. htm.

[76] 陈梦筱 . 我国水资源现状与管理对策 [J]. 市场经纬,2006: 61 ~ 62

[77] 唐克旺 . 中国水资源可持续利用战略 . 国家环保总局网站 . 2006

[78] 王瑗,盛连喜,李科等 . 中国水资源现状分析与可持续发展对策研究 [J]. 水资源与水工程学报,2008,19 (3): 10 ~ 14

[79] 董辅祥 . 城市与工业节约用水理论 [M]. 北京: 中国建筑工业出版社,2000

[80] 中国科学技术协会主编,中国城市承载力及其危机管理研究报告,2008

[81] 贾生华,张宏斌,金星 . 城市土地储备制度: 模式、效果、问题和对策 [J]. 现代城市研究,2001,(3): 44 ~ 47

137 评论

篠田麻里子

模糊聚类的时候,要计算2个数据之间的相似度(或相异度)。定量属性就用距离来算就行了。定性属性又分2种,一种是没有序的关系的。比如颜色,性别等等。一种是有序的关系的。比如一等品,二等品等等。定性属性没有序的关系时,相异度可以用相同属性的个数与定性属性的总数之间的比值来衡量。【还有很多其他方法。。】定性属性有序的关系时,相异度可以把定性属性当成量化后的定量属性来衡量【直接计算距离】。个人觉得没有必要用等级划分的方法来统一这些属性指标。【因为,你在等级划分的时候可能会丢失掉一些有用的信息。而丢掉的这些信息也许会对最后的结果有影响。也就是说,如果你的聚类结果和等级划分方法相关,那么,聚类结果的说服力就会下降。】如果一定要这样,等级划分就相当于做量化处理。如果均匀分组【等宽】,要决定组距,组数,野点的处理等等。不均匀分组【等深,或其他准则】,要决定组深,组数等等。总之,分组的时候,既要尽量保留原有数据之间的关联,又要尽量将数据区分开。俺觉得,等级划分的困难和确定定性属性之间的相异度相比,并不低。要等级划分,可以找量化,数据分组等方面的参考文献。要确定定性属性之间的相异度,可以找相异度,特别是混合数据类型之间的相异度方面的文献。

100 评论

相关问答

  • 关于聚类分析论文题目

    1. 刘勰的时序论文:探索时序数据分析的机会与挑战2. 刘勰的时序论文:深入探索时序数据挖掘的新方法3. 刘勰的时序论文:时序数据挖掘在智能系统中的应用4. 刘

    ellegirlme 5人参与回答 2023-12-10
  • 模糊聚类分析论文参考文献

    聚类分析算法论文 聚类分析又称群分析,它是研究(样品或指标)分类问题的一种统计分析方法,同时也是数据挖掘的一个重要算法。下面是我分享给大家的聚类分析算法论文,欢

    kisscat0317 3人参与回答 2023-12-09
  • 学术写作聚类分析论文怎么写

    1、题目:应简洁、明确、有概括性,字数不宜超过20个字。2、摘要:要有高度的概括力,语言精练、明确,中文摘要约100—200字;3、关键词:从论文标题或正文中挑

    淘淘7011 4人参与回答 2023-12-07
  • 财务分析类论文参考文献

    建议CNKI找下就成 [1] 沙洁. 企业财务报表分析[J]. 财会研究 , 2004,(10) . [2] 石玉华 ,沈斌 ,刘广丽. 试论企业财务报表分析的

    苏州大高中 2人参与回答 2023-12-06
  • 采用聚类分析的毕业论文

    基于聚类分析的广西区域经济发展状况研究的论文 【摘要】:本文以广西壮族自治区14个地级市作为研究对象,从地区生产总值、社会消费品零售总额、全社会固定资产投资、公

    翔雨lollipop 2人参与回答 2023-12-08