• 回答数

    3

  • 浏览数

    172

安吉拉pig
首页 > 期刊论文 > 聚类分析论文参考文献

3个回答 默认排序
  • 默认排序
  • 按时间排序

如果蛋蛋愿意

已采纳

聚类分析在企业网络营销中的应用论文

论文摘要:本文针对企业网络营销中的大量数据为基础进行数据的分析,依据数据挖掘技术中典型的聚类分析方法进行数据的处理,并以一个网络营销公司为例,对其客户信息进行了聚类分析,得到了一些有价值的信息,对于企业的营销策略的决策给与一定的支持。

论文关键词:聚类分系,网络营销,策略,客户关系

0前言

现代科学技术的迅猛发展,特别是在互联网的应用和开发上更加的迅速,企业必须通过网络对自己的产品加强宣传以增强自己的竞争力。客户是一个非常重要的、有价值的重要资源,现在如何更好地从数据库中挖掘出客户中有价值的信息,更好的培植和经营与有价值客户的关系,抛弃那些无利可图没有发展前景而且营销费用高的客户,并且可以针对不同价值的客户给与不同的政策同时制定出个性化的营销策略,这些才能够保证企业的生存发展。对于这一切数据挖掘无疑是行之有效的好方法之一。本文以一个网络营销公司为例,提出了一套可操作性的对客户价值评价方法,然后使用数据挖掘技术中比较常见和常用的聚类分析算法对客户信息进行聚类从而达到非常重要的信息并为企业在网络营销中提供决策依据。

1聚类分析

聚类(clustering)是对于数据挖掘技术是非常重要的一部分,现在也是数据挖掘技术中关键的一种。聚类的意义就是针对物理或逻辑上的数据对象的进行自动分类,最后将数据对象分为多个类或簇的过程。对于聚类结果要使得数据对象在同一个分类中具有最大的相似度,而在不同的类中具有最小相似度。聚类的现实意义就是在于可以将数据按照一定得关系进行自动的分类,事先不知道所有的数据对象共有多少类,通过算法的处理最后得到一个分类结果进行应用。譬如在市场研究领域中,特别是针对网络营销的企业或网站,从大量的网络数据进行分析聚类,可以讲客户分成不同的类别,针对这些类别不同的购买力和兴趣爱好来进行个性化的营销手段,提高企业的经济效益。目前研究人员大多针对于聚类分析算法的改进和完善进行研究,进而提高聚类分析的工作效率。著名的算法有:CLARANS,BRICH,DBSCAN,CURE,STING,CLIGUE和WaveCluster等。

2聚类分析应用于企业客户资源管理

现针对某电子商务公司进行分析,该电子商务公司的客户分布在全国各地以及国外一些地区,现仅列出具有代表性的10个大客户:吉林,黑龙江,山东,江苏,浙江,安徽,湖南,缅甸,印度,南非等。在数据挖掘的目的就是从客户中找到一些共同点,在对这些客户数据进行处理前要使用聚类分析的方法进行研究看看这10个客户能否有一些共同之处以便企业针对不同类型的客户给与不同的对策,首先对该公司采用专家打分的方法,而且还有通过网上问卷调查和访谈的方式,收集各地销售专员的意见等方式,然后对数据加以综合,最后聚类分析法确定各项指标的权重。

那么在具体实施聚类分析法的时候可分为5个步骤进行:

第1步:首先对各项指数构建层次结构,其中被评定的10个大客户作为方案层,客户价值放在目标层中进行处理,各项指标是准则层,按照这样的分层结构来构造客户关系评价系统中个指数的结构图,见图2-1所示;

从数据可以看出有两种情形:一是缅甸和南非,从数据中可看出这类客户的当前价值很小,但是具有很大的隐含价值,势必会有一天他们的成长给企业会带来丰厚的物质利益,这样具有发展潜能的客户应该采取措施激发潜能;二是安徽和印度这类客户,虽然从数据中看出这类客户当前价值很小,但是就这两个省份的地理位置和经济状况来分析他们隐含着较大的价值。对于这一类的客户,企业就应该采取灵活的措施,激发他们的购买能力促使该类型的客户不断地向前发展;

第2类是“维持型”客户,他们会源源不断的为企业提供利润,如黑龙江和江苏,他们这类客户根据以往的交易记录分析到得结果就是目前价值大,不过没什么发展的潜能,或者说在某种情况下它的时常还会萎缩,当前这类客户会给企业带肋比较丰厚的利润但是就长期发展而言却不是利润的主要来源,他们在某种情况下会流失掉,会被其他的企业竞争对手的介入而流失,为此对于企业一方面要维持与这类客户的良好关系,保持稳定的`客户关系,另一方面还要采取一些营销手段来刺激该类客户的消费,提供一些个性化的服务和策略;

第3类“淘汰型”客户,这类用户就如同鸡肋了,对于企业的现在和将来都意义不大,目前的销售份额较小,企业对他们营销的成本还很高,年利润率很低,根据分析这类客户包括浙江、湖南和吉林,他们没有长期的发展的趋势,所以企业采取的策略就是应充分挖掘他们给企业带来的当前价值后逐渐地放弃他们;

第4类是“贵宾型”客户,这类用户是企业的主要经济利润的来源,在某种程度上可以说是企业生存的保证,他对企业是关系到生死存亡的重要客户,从数据中看山东就是该企业的这类贵宾型的客户,他的当前价值和潜在价值都很大,企业必须认真对待,细心呵护与这类客户的关系,以及该客户企业的关键性人物的关系,加强与这类客户的沟通和关系的培养,同时还要提高警惕,防止竞争对手抢走这些贵宾型客户。针对贵宾型客户企业就应该对其进行一对一的营销策略,进行良好的客户需求沟通,尽最大可能满足他们的需求,适当给与一些特殊政策来加强和他们的关系。从不同角度来加强客户对企业的忠诚度、满意度等。企业根据这些重要的信息就可以针对不同的客户采取合适的销售策略。

3小结

总之,企业首先对客户的价值进行全方位、多角度进行评价,再将分析结果量化后进行数据挖掘,通过聚类分析,对客户进行细分,针对不同类型的客户给与个性化的服务。

268 评论

shiyeyouyou

聚类分析算法论文

聚类分析又称群分析,它是研究(样品或指标)分类问题的一种统计分析方法,同时也是数据挖掘的一个重要算法。下面是我分享给大家的聚类分析算法论文,欢迎阅读。

一、引言

聚类分析算法是给定m维空间R中的n个向量,把每个向量归属到k个聚类中的某一个,使得每一个向量与其聚类中心的距离最小。聚类可以理解为:类内的相关性尽量大,类间相关性尽量小。聚类问题作为一种无指导的学习问题,目的在于通过把原来的对象集合分成相似的组或簇,来获得某种内在的数据规律。聚类分析的基本思想是:采用多变量的统计值,定量地确定相互之间的亲疏关系,考虑对象多因素的联系和主导作用,按它们亲疏差异程度,归入不同的分类中一元,使分类更具客观实际并能反映事物的内在必然联系。也就是说,聚类分析是把研究对象视作多维空间中的许多点,并合理地分成若干类,因此它是一种根据变量域之间的相似性而逐步归群成类的方法,它能客观地反映这些变量或区域之间的内在组合关系。盐矿区系统是一个多层次、复杂的大系统,涉及诸多模糊、不确定的因素。平顶山市盐矿区的经济分类是以整个平顶山市的所有盐矿区为研究对象,以各盐矿区为基本单元,以经济为中心,以发展战略和合理布局为目标进行经济类型区划。其基本原则是:平顶山市的盐矿区资源开发、利用的相对一致性;自然、经济、社会条件的一致性;保持一定行政地域单元的相对稳定性。现行的平顶山市盐矿区行政划分不能反映出各个盐矿区的共同点,有必要通过模糊聚类分析将那些经济实际状况相似的铁矿区归类,剖析、发现各况矿区的差异,对症下药,为制定发展对策提供依据。

二、建立指标体系

1、确定分类指标进行经济区划分,应考虑的指标因素是多种多样的。既要以岩盐矿资源储量为主,又要适当考虑岩盐质量和勘察阶段和开发利用状况;既要有直接指标,又要有间接指标;既要考虑矿区发展的现状,又要考虑矿区发展的过程和矿区发展的未来方向。参考有关资料,结合专家意见,我们确定了对平顶山市盐矿区进行经济区划分的指标。如表1所示。表中列举了具体指标及各指标的原始数据(数据来源于河南省2006年矿产资源储量简表)。表1盐矿区经济划分指标体系及指标数据注:表中N表示缺失数据,勘察阶段1、2、3分别表示:初步勘探、详细普查、详细勘探,利用状况1~7分别表示:近期不宜进一步工作、可供进一步工作、近期难以利用、推荐近期利用、计划近期利用、基建矿区、开采矿区。

2、转换指标数据由于不同变量之间存在不同量纲由于不同变量之间存在不同量纲、不同数量级,为使各个变量更具有可比性,有必要对数据进行转换。目前进行数据处理的方法大致有三种,即标准化、极差标准化和正规化。为便于更直观的比较各市之间同一指标的数值大小,我们采用了正规化转换方式。其计算公式为:为了方便叙述,做如下设定:设Xi(i=1,2,3,…,21)为具体指标层中第i个评价指标的值,Pi(i=1,2,3,…,21)为第i个指标正规化后的值,0≤Pi≤1,Xs,i(Xs,i=Xmax-Xmin),为第i个评价指标的标准值,Xmax为最大值,Xmin为最小值。(1)对于越高越好的`指标①Xi≥Xmax,则Pi=1;②Xi≤Xmin,则Pi=0;③Xmin

三、聚类分析

1、聚类步骤(Stage).从1~3表示聚类的先后顺序。

2、个案合并(ClusterCombined)。表示在某步中合并的个案,如第一步中个案1叶县田庄盐矿段和个案2叶县马庄盐矿段合并,合并以后用第一项的个案号表示生成的新类。

3、相似系数(Coefficients).据聚类分析的基本原理,个案之间亲密程度最高即相似系数最接近于1的,最先合并。因此该列中的系数与第一列的聚类步骤相对应,系数值从小到大排列。

4、新类首次出现的步骤(StageClusterFirstAppears)。对应于各聚类步骤参与合并的两项中,如果有一个是新生成的类(即由两个或两个以上个案合并成的类),则在对应列中显示出该新类在哪一步第一次生成。如第三步中该栏第一列显示值为1,表示进行合并的两项中第一项是在第一步第一次生成的新类。如果值为O,则表示对应项还是个案(不是新类)。

5、新类下次出现步骤(NextStage)。表示对应步骤生成的新类将在第几步与其他个案或新类合并。如第一行的值是11,表示第一步聚类生成的新类将在第11步与其他个案或新类合并。

6、解析图DendrogramusingAverageLinkage(BetweenGroups)RescaledDistanceClusterCombine聚类树状图(方法:组间平均连接法)图清晰的显示了聚类的全过程。他将实际距离按比例调整到0~25之间,用逐级连线的方式连接性质相近的个案或新类,直至并未一类。在该图上部的距离标尺上根据需要(粗分或细分)选定一个划分类的距离值,然后垂直标尺划线,该垂线将与水平连线相交,则相交的交点数即为分类的类别数,相交水平连线所对应的个案聚成一类。例如,选标尺值为5,则聚为3类:叶县田庄盐段、叶县马庄盐矿段为一类,叶县娄庄盐矿、叶县五里堡盐矿段为一类,叶县姚寨盐矿为一类。若选标尺值为10,则聚为2类:叶县田庄盐段、叶县马庄盐矿段为一类,叶县娄庄盐矿、叶县五里堡盐矿段、叶县姚寨盐矿为一类。

四、结论

对平顶山市5个盐矿区进行经济区划分,究竟划分为几个区合适,既不是越多越好,也不是越少越好。划分经济区的目的,就是要根据各盐矿经济区资源特点、勘察、开发的不同,分类指导经济活动,使人们的经济活动更加符合当地的实际,使各经济区能充分发挥各自的优势,做到扬长避短,趋利避害,达到投人少、产出多,创造良好的经济效益和社会效益之目的。分区太多,就失去了分区的意义,分区太少,则分类指导很难做到有的放矢。综合以上聚类分析结果,我们可以得出三个方案。其中两个方案比较合适,可供选择。方案一:(当比例尺为5时,分为3类)叶县田庄盐段、叶县马庄盐矿段为一类,叶县娄庄盐矿、叶县五里堡盐矿段为一类,叶县姚寨盐矿为一类。从聚类分析中看出平顶山市盐矿区分类图方案一。方案二:(当比例尺为10时,分为2类)叶县田庄盐段、叶县马庄盐矿段为一类,叶县娄庄盐矿、叶县五里堡盐矿段、叶县姚寨盐矿为一类。从聚类分析中看出平顶山市盐矿区分类图方案二。平顶山市盐矿区分类图方案2聚类分析的原理就是将矿石质量、资源储量、勘查阶段、利用状况相近或相类似的矿区聚合在一起,其分析结果也是直观易见的。在此结合平顶山市实际行政区划以及矿山企业特征我们对铁矿区划分做一个调整使其理论与实际能够结合的更紧密使其更好的指导实践。

1、叶县田庄盐段、叶县马庄盐矿段为一类,这一类属于矿床规模相当,资源储量接近,勘查开发阶段接近,利用程度相当,故,可以分为一类。

2、叶县娄庄盐矿、叶县五里堡盐矿段为一类,这一类属于勘查开发阶段处于同一阶段。

3、叶县姚寨盐矿为一类,这一类属于储量较高,盐矿品位较高,故其勘察开采规划有别于其它两类。总的说来,运用聚类分析是基本成功的,大部分的分类是符合实际的。综合以上论述盐矿区划分如下表所示:当然聚类分析有其优点也有其缺点:(1)优点:聚类分析模型的优点就是直观,结论形式简明。(2)缺点:在样本量较大时,要获得聚类结论有一定困难。由于相似系数是根据被试的反映来建立反映被试问内在联系的指标,而实践中有时尽管从被试反映所得出的数据中发现他们之间有紧密的关系,但事物之间却无任何内在联系,此时,如果根据距离或相似系数得出聚类分析的结果,显然是不适当的,但是,聚类分析模型本身却无法识别这类错误。

285 评论

Annaso安娜

摘要:目前农业类专家系统是网络上解决各种农业问题和各种数据管理的一种有效途径,文章将模糊数学的模糊聚类分析法应用于专家系统用户的类型分析,使专家系统用户得到合理分类,在开发专家系统时提供必要数据,以节约开发成本,提高专家系统质量。 关键词:模糊聚类分析;专家系统用户;农业 中图分类号:O159 文献标识码:A文章编号:1003-6997(2012)16-0003-02 农业类专家系统是一个智能计算机程序系统,其内部含有大量的专家水平的知识与经验,能够利用人类专家的知识和解决问题的方法来处理该领域问题。例如病虫害专家系统。但使用该系统的用户计算机的应用水平却是参差不齐,因此为了让各类型的用户有效利用专家系统合理管理数据,快速、有效地为用户解决现实农业生产中所遇到的问题,有必要对使用专家系统的用户进行分类研究。 1模糊聚类分析法 聚类分析也称群分析、点群分析,是对事物按一定要求和规律进行分类的一种数学方法。 一般来说,用经典数学来描述现实的分类,往往不令人满意,而用模糊聚类分析的方法,即用模糊数学方法来进行聚类分析,描述现实的分类,更显得自然,也更符合实际。模糊聚类的主要步骤为:确定对象,建立模糊相似关系和布尔矩阵聚类[1,2]。 1.1确定对象 设X={X1,X2,...,Xn}为待分类的全体,其中每一个分类对象由一组数据来表征:Xi=(xi1,xi2,...,xim)。 1.2建立模糊相似关系 对象Xi与Xj之间的相关程度,可用数rij∈[0,1]来描述,以rij为元素可建立模糊相似矩阵R=(rij)n×n[1],其中rij=rji,rii=1(i,j=1,...,n)。确定rij的值,可用算术平均最小法,如式(1)所示: (1) 最大树聚类分析法:使U={X1,X2,……,Xn},先画出所有顶点Xi(i=1,2,……,n),从模糊相似矩阵R中按照rij从大到小的顺序依次画枝,并标上权重,要求不产生圈,直到所有顶点连通为止,就得到一棵最大树,取定λ∈[0,1],砍断权重低于λ的枝,得到一个不连通的图,各个连通的分支就构成了在λ水平上的分类[3]。 2分析计算机应用系统用户类型 下面以外行型、初学型、熟练型和专家型的用户为例,阐明对农业类专家系统用户的模糊聚类分析法。描述一个实体用户,可用以下属性描述:熟悉计算机操作,对计算机系统有一定认识,纠正意外错误的能力,扩展系统的能力等[4]。具有以上这些属性的组合实体,可以有外行型、初学型、熟练型和专家型等各种不同类型,但本质是一类事物。表1列举了外行型、初学型、熟练型和专家型的有关属性指标。为了计算简便,作了一些处理,但并不影响分析。 表1中为0的数据表示完全不具有该属性能力。如对于用户项目X3熟练型,完全没有纠正意外错误的能力,则此属性为0。表中为1的数据表示完全具有该属性能力。如对于用户项目X4专家型,完全具有扩展系统的能力,则此属性为1。根据表1的数据,表中为小数的数据表示具有该种能力的程度。如X1外行型对计算机的操作熟悉度为0.1,即很不熟悉。下面用模糊聚类分析法来分类农业类专家系统用户的类型[5]。 2.1确定外行型、初学型、熟练型和专家型分别为对象X1,X2,X3,X4 对象Xi对应的属性熟悉计算机操作,对计算机系统有一定认识,纠正意外错误的能力,扩展系统的能力分别用xi1,xi2,xi3,xi4来表征。有对象矩阵,如式(2)所示: x=0000100011001111(2) 2.2求取模糊相似矩阵R 用算术平均最小法即公式(1)确定,R中的rij的值。如r23=0.714。与此类似,可算出其他rij,得到模糊相似矩阵R,如式(3)所示: R=10.1820.1050.0490.18210.7140.40.1050.71410.6210.0490.40.6211(3) 2.3在R的模糊相似矩阵上使用最大树法进行聚类 使U={X1,X2,X3,X4},先画出所有顶点Xi(i=1,2,3,4),从模糊相似矩阵R中按照rij从大到小的顺序依次画枝,并标上权重,要求不产生圈,直到所有顶点连通为止,就得到一棵最大树: 在最大树中,取定λ=0.621,砍断权重低于λ的枝,得到一个不连通的图: 此时,对象X分为2类:{X1},{X2,X3,X4}即认为Xi是不同的对象。提高λ的值,取λ=0.714,得到一个不连通的图: 在此λ水平下,认为X2与X3是同类对象,即X可分为3类:{X2,X3},{X1},{X4}。与此类似,继续提高λ水平,有不同的分类。将各分类总结如下: 取λ=1,X分为4类:{X1},{X2},{X3},{X4}; 取λ=0.714,X分为3类:{X1},{X2,X3},{X4}; 取λ=0.621,X分为2类:{X1},{X2,X3,X4}; 取λ=0.182,X分为1类:{X1,X2,X3,X4}。 3结果分析 从上面的分类结果分析,可以看出λ的值决定分类的结果,与实际相符。在标准严格时,各类相似事物被视为不同类别;当标准并不严格时,有相似特征的事物可归为一类。模糊聚类分析法较好地体现了这一现实中的分类规律。 4结束语 在计算机应用系统中,用户是最基本的使用对象,对这些用户如何加以归类,是开发计算机应用系统的一个必须要考虑的问题。应用模糊数学中的模糊聚类分析法,可以较满意地再现实际中的经验分类法。在模糊聚类分析中,用一个介于0与1之间的数值λ,表示了经验标准。从本文的分析可见,现实中的不确定的分类,运用模糊聚类分析法,也可得到较满意的数学描述,使计算机应用系统用户得到合理分类,在开发计算机应用系统时提供必要数据,以节约开发成本,提高计算机应用系统质量。 参考文献: [1]高新波.模糊聚类分析及其应用[M].西安:西安电子科技大学出版社,2004. [2]鄢丹.应用模糊数学定量化方法分析交通状况[J].武汉理工大学学报,2003,27(5):671-677. [3]黄立亚,刘法胜,任传祥,等.模糊聚类分析在高速公路车辆信息采集中的应用[J].山东交通科技,2010,⑷:5-7. [4]张勇昌.模糊聚类分析在网络资源分析中的应用[J].计算机时代,2009,⑺:36-37. [5]谢季坚,刘承平.模糊数学方法及其应用(第三版)[M].武汉:华中科技大学出版社,2006. (责任编辑张亮)

149 评论

相关问答

  • 聚类分析论文参考文献

    聚类分析在企业网络营销中的应用论文 论文摘要:本文针对企业网络营销中的大量数据为基础进行数据的分析,依据数据挖掘技术中典型的聚类分析方法进行数据的处理,并以一个

    安吉拉pig 3人参与回答 2023-12-11
  • 聚类分析毕业论文答辩

    毕业论文答辩技巧 毕业论文答辩技巧,近几年答辩开始变得火热起来,作为答辩委员会的成员,我希望给大家带来一些答辩的实用小技巧,帮助大家快速通过答辩,完成毕业通关,

    淇淇爱添添 2人参与回答 2023-12-07
  • 论文聚类分析案例模板

    聚类分析算法论文 聚类分析又称群分析,它是研究(样品或指标)分类问题的一种统计分析方法,同时也是数据挖掘的一个重要算法。下面是我分享给大家的聚类分析算法论文,欢

    小豆子就是我 2人参与回答 2023-12-08
  • 毕业论文模糊聚类分析法

    聚类分析,亦称群分析或点分析,是研究多要素事物分类问题的数量方法。其基本原理是,根据样本自身的属性,用数学方法按照某些相似性或差异性指标,定量地确定样本之间的亲

    油墩子2016 2人参与回答 2023-12-11
  • 学术写作聚类分析论文范文

    统计分析是运用统计 方法 与分析对象有关的知识,从定量与定性的结合上进行的研究活动。下文是我为大家整理的关于统计分析论文的 范文 ,欢迎大家阅读参考!

    jessiemaomao 2人参与回答 2023-12-11