欢迎来到学术参考网
当前位置:发表论文>论文发表

聚类分析论文可以提的问题

发布时间:2023-12-11 01:03

聚类分析论文可以提的问题

1.聚类分析的特点
 聚类分析(cluster analysis)是根据事物本身的特性研究个体的一种方法,目的在于将相似的事物归类.它的原则是同一类中的个体有较大的相似性,不同类的个体差异性很大.这种方法有三个特征:适用于没有先验知识的分类.如果没有这些事先的经验或一些国际、国内、行业标准,分类便会显得随意和主观.这时只要设定比较完善的分类变量,就可以通过聚类分析法得到较为科学合理的类别;可以处理多个变量决定的分类.例如,要根据消费者购买量的大小进行分类比较容易,但如果在进行数据挖掘时,要求根据消费者的购买量、家庭收入、家庭支出、年龄等多个指标进行分类通常比较复杂,而聚类分析法可以解决这类问题;聚类分析法是一种探索性分析方法,能够分析事物的内在特点和规律,并根据相似性原则对事物进行分组,是数据挖掘中常用的一种技术.
  这种较成熟的统计学方法如果在市场分析中得到恰当的应用,必将改善市场营销的效果,为企业决策提供有益的参考.其应用的步骤为:将市场分析中的问题转化为聚类分析可以解决的问题,利用相关软件(如SPSS、SAS等)求得结果,由专家解读结果,并转换为实际操作措施,从而提高企业利润,降低企业成本.
2.应用范围
 聚类分析在客户细分中的应用
  
  消费同一种类的商品或服务时,不同的客户有不同的消费特点,通过研究这些特点,企业可以制定出不同的营销组合,从而获取最大的消费者剩余,这就是客户细分的主要目的.常用的客户分类方法主要有三类:经验描述法,由决策者根据经验对客户进行类别划分;传统统计法,根据客户属性特征的简单统计来划分客户类别;非传统统计方法,即基于人工智能技术的非数值方法.聚类分析法兼有后两类方法的特点,能够有效完成客户细分的过程.
  例如,客户的购买动机一般由需要、认知、学习等内因和文化、社会、家庭、小群体、参考群体等外因共同决定.要按购买动机的不同来划分客户时,可以把前述因素作为分析变量,并将所有目标客户每一个分析变量的指标值量化出来,再运用聚类分析法进行分类.在指标值量化时如果遇到一些定性的指标值,可以用一些定性数据定量化的方法加以转化,如模糊评价法等.除此之外,可以将客户满意度水平和重复购买机会大小作为属性进行分类;还可以在区分客户之间差异性的问题上纳入一套新的分类法,将客户的差异性变量划分为五类:产品利益、客户之间的相互作用力、选择障碍、议价能力和收益率,依据这些分析变量聚类得到的归类,可以为企业制定营销决策提供有益参考.
  以上分析的共同点在于都是依据多个变量进行分类,这正好符合聚类分析法解决问题的特点;不同点在于从不同的角度寻求分析变量,为某一方面的决策提供参考,这正是聚类分析法在客户细分问题中运用范围广的体现.
  
  聚类分析在实验市场选择中的应用
  
  实验调查法是市场调查中一种有效的一手资料收集方法,主要用于市场销售实验,即所谓的市场测试.通过小规模的实验性改变,以观察客户对产品或服务的反应,从而分析该改变是否值得在大范围内推广.
  实验调查法最常用的领域有:市场饱和度测试.市场饱和度反映市场的潜在购买力,是市场营销战略和策略决策的重要参考指标.企业通常通过将消费者购买产品或服务的各种决定因素(如价格等)降到最低限度的方法来测试市场饱和度.或者在出现滞销时,企业投放类似的新产品或服务到特定的市场,以测试市场是否真正达到饱和,是否具有潜在的购买力.前述两种措施由于利益和风险的原因,不可能在企业覆盖的所有市场中实施,只能选择合适的实验市场和对照市场加以测试,得到近似的市场饱和度;产品的价格实验.这种实验往往将新定价的产品投放市场,对顾客的态度和反应进行测试,了解顾客对这种价格的是否接受或接受程度;新产品上市实验.波士顿矩阵研究的企业产品生命周期图表明,企业为了生存和发展往往要不断开发新产品,并使之向明星产品和金牛产品顺利过渡.然而新产品投放市场后的失败率却很高,大致为66%到90%.因而为了降低新产品的失败率,在产品大规模上市前,运用实验调查法对新产品的各方面(外观设计、性能、广告和推广营销组合等)进行实验是非常有必要的.
  在实验调查方法中,最常用的是前后单组对比实验、对照组对比实验和前后对照组对比实验.这些方法要求科学的选择实验和非实验单位,即随机选择出的实验单位和非实验单位之间必须具备一定的可比性,两类单位的主客观条件应基本相同.
  通过聚类分析,可将待选的实验市场(商场、居民区、城市等)分成同质的几类小组,在同一组内选择实验单位和非实验单位,这样便保证了这两个单位之间具有了一定的可比性.聚类时,商店的规模、类型、设备状况、所处的地段、管理水平等就是聚类的分析变量

聚类分析(1)之市场细分

市场研究中,聚类分析用的最多的就是细分市场。笔记结合两个问题:聚类分析、市场细分。聚类分析是市场细分的一个统计方法,市场细分还有其他内容,比如剖面分析,对应分析等。

学习资料:两本书,一个视频

两个学习内容:有两个层次的学习内容,面向工作的应用层次和探求原理的数学内容。

系列文章: 聚类分析(2)聚类技术

实例:

2019/9/9有很多数据,比如态度语句可以做市场细分,或者消费者聚类,同样,消费者行为数据也可以用来做用户聚类,比如张文彤的视频案例,用通讯行为数据做用户聚类。也就是说,角度可以有两个:1)我要做市场细分,这些多维度数据,我来做。2)有一个行为数据,我可以针对这个数据做市场细分或者用户聚类。或者有一个态度语句,我可以用来做市场细分或者用户聚类。

在本书案例(牙膏市场细分)中,做市场细分都是利用因子分析和聚类分析结合。市场细分的变量是消费者对产品的态度语句和需要语句作为输入变量。但消费者细分有很多方法,也可以利用消费者对 某一产品不同功能 的使用来区分,比如张文彤的电信客户分类案例,就是利用电信提供的功能和消费者的使用情况作为消费者细分依据。所以,要看你具体目标是什么,采集对应的数据。在以前不是很清楚的时候,对应分析也被我理解为市场细分,但在后面的学习汇中能看出,对应分析是用来了解各细分市场之间的差异的,对应分析属于定位方法。具体步骤如下

这里是态度语句和需要语句,其实,你可以测量任何你要探讨的语句,没有太多严格分类。态度,需要,动机,考虑因素,生活态度等等。如下图。

如何确认这些语句?

收集大概150条以上功能和情感需要语句。

通过初步的问卷测试,利用统计方法(因子分析),精简语句至20-30句。在本案例中,似乎没有做前期的因子分析。

如上图,我们列的语句有很多从表面上看就已有重复的,角度相同的。更何况内部联系上,很多语句在消费者语境下表达的同一问题,我们需要用因子分析简化和理清这些语句。

关于理解因子分析后进行聚类分析,可以参考《IBM SPSS数据分析与数据挖掘案例精粹》第11章:找出因子后,保存各因子做为新的变量,且会自动计算每个样本在各个变量上的“打分”

根据样本的因子得分,用聚类分析对样本进行分类。如何选择聚类方法?需要参考样本容量,变量数量,并需要多次迭代。聚类分析后会产生几类消费者。我们需要结合聚类变量来确定如何命名各类消费者。这些我们使用方差检验等方法,具体参考张文彤的视频(电信客户聚类)和《IBM SPSS数据分析与数据挖掘案例精粹》中的保健品购买动机分析(视频+书籍)

本案例中讲牙膏市场分为七个市场

类一 关系核心功能的理性消费者

类二 无刷牙动力者

类三 信奉中草药的家庭导向者

类四 倾向中草药的基本需求者

类五 时髦美容导向者

类六 追求防蛀牙的家庭导向者

类七 简单需求清新口气者

衡量各细分市场的指标,除了人口占比外,还有“消费/人口指数”

既 细分市场在产品上的消费数量上的所占比例% / 细分市场人口所占比例%

消费数量占比和人口占比的除数,反映了该细分市场是否消费了对等的产品。如果大于100,则说明该细分市场更重要,消费能力更强。反之则不重要。

将细分市场与其他维度的数据交叉,对比各细分市场之间的差异。比如最常见的是与人口统计指标对比,分析各细分市场是否有不同差异。但一个合格的剖面分析应该不止于人口统计特征。

剖面分析可以解决的问题:

类似于之前学习过的“人物角色”。结合前面做的细分和剖面分析,总结出各细分市场的典型人物形象。

第六步:分析各细分市场之间的联系

聚类分析是一个黑盒过程,我们可以利用结果去推敲各细分市场之间的关键差异。关键差异的维度最好为两个,因为这样可以画出二维图。

如果无法做到找出二个关键差异维度,可以利用对应分析,将细分市场投射在二维图中。如下图,关键维度是:口腔护理投入程度和中草药成分的信任程度。

下图是其他案例,使用的是对应分析,将细分市场投射在“态度”上,看各细分市场在态度是否有差异。

两本书结合,张文彤的书籍

不需要做因子分析的,比如在张文彤的高级教材中电信案例。

聚类一般是对样本聚类

因子分析一般是变量。

其实不一定是要严格说是为了细分市场,有时候,我们收集了一些态度,需求,或者考虑因素的语句,我们需要做分析,看看这些语句除了明面上的差异外,消费者会不会有关联认同的,或者说内在结构也许会不同外表。比如黑眼圈,到底是关注外表的,还是表示熬夜没精力

聚类分析在企业网络营销中的应用论文

聚类分析在企业网络营销中的应用论文

论文摘要:本文针对企业网络营销中的大量数据为基础进行数据的分析,依据数据挖掘技术中典型的聚类分析方法进行数据的处理,并以一个网络营销公司为例,对其客户信息进行了聚类分析,得到了一些有价值的信息,对于企业的营销策略的决策给与一定的支持。

论文关键词:聚类分系,网络营销,策略,客户关系

0前言

现代科学技术的迅猛发展,特别是在互联网的应用和开发上更加的迅速,企业必须通过网络对自己的产品加强宣传以增强自己的竞争力。客户是一个非常重要的、有价值的重要资源,现在如何更好地从数据库中挖掘出客户中有价值的信息,更好的培植和经营与有价值客户的关系,抛弃那些无利可图没有发展前景而且营销费用高的客户,并且可以针对不同价值的客户给与不同的政策同时制定出个性化的营销策略,这些才能够保证企业的生存发展。对于这一切数据挖掘无疑是行之有效的好方法之一。本文以一个网络营销公司为例,提出了一套可操作性的对客户价值评价方法,然后使用数据挖掘技术中比较常见和常用的聚类分析算法对客户信息进行聚类从而达到非常重要的信息并为企业在网络营销中提供决策依据。

1聚类分析

聚类(clustering)是对于数据挖掘技术是非常重要的一部分,现在也是数据挖掘技术中关键的一种。聚类的意义就是针对物理或逻辑上的数据对象的进行自动分类,最后将数据对象分为多个类或簇的过程。对于聚类结果要使得数据对象在同一个分类中具有最大的相似度,而在不同的类中具有最小相似度。聚类的现实意义就是在于可以将数据按照一定得关系进行自动的分类,事先不知道所有的数据对象共有多少类,通过算法的处理最后得到一个分类结果进行应用。譬如在市场研究领域中,特别是针对网络营销的企业或网站,从大量的网络数据进行分析聚类,可以讲客户分成不同的类别,针对这些类别不同的购买力和兴趣爱好来进行个性化的营销手段,提高企业的经济效益。目前研究人员大多针对于聚类分析算法的改进和完善进行研究,进而提高聚类分析的工作效率。著名的算法有:CLARANS,BRICH,DBSCAN,CURE,STING,CLIGUE和WaveCluster等。

2聚类分析应用于企业客户资源管理

现针对某电子商务公司进行分析,该电子商务公司的客户分布在全国各地以及国外一些地区,现仅列出具有代表性的10个大客户:吉林,黑龙江,山东,江苏,浙江,安徽,湖南,缅甸,印度,南非等。在数据挖掘的目的就是从客户中找到一些共同点,在对这些客户数据进行处理前要使用聚类分析的方法进行研究看看这10个客户能否有一些共同之处以便企业针对不同类型的客户给与不同的对策,首先对该公司采用专家打分的方法,而且还有通过网上问卷调查和访谈的方式,收集各地销售专员的意见等方式,然后对数据加以综合,最后聚类分析法确定各项指标的权重。

那么在具体实施聚类分析法的时候可分为5个步骤进行:

第1步:首先对各项指数构建层次结构,其中被评定的10个大客户作为方案层,客户价值放在目标层中进行处理,各项指标是准则层,按照这样的分层结构来构造客户关系评价系统中个指数的结构图,见图2-1所示;

从数据可以看出有两种情形:一是缅甸和南非,从数据中可看出这类客户的当前价值很小,但是具有很大的隐含价值,势必会有一天他们的成长给企业会带来丰厚的物质利益,这样具有发展潜能的客户应该采取措施激发潜能;二是安徽和印度这类客户,虽然从数据中看出这类客户当前价值很小,但是就这两个省份的地理位置和经济状况来分析他们隐含着较大的价值。对于这一类的客户,企业就应该采取灵活的措施,激发他们的购买能力促使该类型的客户不断地向前发展;

第2类是“维持型”客户,他们会源源不断的为企业提供利润,如黑龙江和江苏,他们这类客户根据以往的交易记录分析到得结果就是目前价值大,不过没什么发展的潜能,或者说在某种情况下它的时常还会萎缩,当前这类客户会给企业带肋比较丰厚的利润但是就长期发展而言却不是利润的主要来源,他们在某种情况下会流失掉,会被其他的企业竞争对手的介入而流失,为此对于企业一方面要维持与这类客户的良好关系,保持稳定的`客户关系,另一方面还要采取一些营销手段来刺激该类客户的消费,提供一些个性化的服务和策略;

第3类“淘汰型”客户,这类用户就如同鸡肋了,对于企业的现在和将来都意义不大,目前的销售份额较小,企业对他们营销的成本还很高,年利润率很低,根据分析这类客户包括浙江、湖南和吉林,他们没有长期的发展的趋势,所以企业采取的策略就是应充分挖掘他们给企业带来的当前价值后逐渐地放弃他们;

第4类是“贵宾型”客户,这类用户是企业的主要经济利润的来源,在某种程度上可以说是企业生存的保证,他对企业是关系到生死存亡的重要客户,从数据中看山东就是该企业的这类贵宾型的客户,他的当前价值和潜在价值都很大,企业必须认真对待,细心呵护与这类客户的关系,以及该客户企业的关键性人物的关系,加强与这类客户的沟通和关系的培养,同时还要提高警惕,防止竞争对手抢走这些贵宾型客户。针对贵宾型客户企业就应该对其进行一对一的营销策略,进行良好的客户需求沟通,尽最大可能满足他们的需求,适当给与一些特殊政策来加强和他们的关系。从不同角度来加强客户对企业的忠诚度、满意度等。企业根据这些重要的信息就可以针对不同的客户采取合适的销售策略。

3小结

总之,企业首先对客户的价值进行全方位、多角度进行评价,再将分析结果量化后进行数据挖掘,通过聚类分析,对客户进行细分,针对不同类型的客户给与个性化的服务。

本科论文题目Q型聚类与R型聚类的统计初探,求帮忙可议价

1、聚类分析
又称群分析、点群分析。根据研究对象特征对研究对象进行分类的一种多元分析技术, 把性质相近的个体归为一类, 使得同一类中的个体都具有高度的同质性, 不同类之间的个体具有高度的异质性。根据分类对象的不同分为样品聚类和变量聚类。
2、判别分析
是一种进行统计判别和分组的技术手段。根据一定量案例的一个分组变量和相应的其他多元变量的已知信息, 确定分组与其他多元变量之间的数量关系, 建立判别函数, 然后便可以利用这一数量关系对其他未知分组类型所属的案例进行判别分组。
判别分析中的因变量或判别准则是定类变量, 而自变量或预测变量基本上是定距变量。依据判别类型的多少与方法不同, 分为多类判别和逐级判别。判别分析的过程是通过建立自变量的线性组合(或其他非线性函数), 使之能最佳地区分因变量的各个类别。

聚类分析中分类数的确定问题

聚类分析中分类数的确定问题
聚类的目的是为了分类,但到底分多少类合适呢?迄今为止它上没有得到完全解决。
Demirmen曾提出根据树状结构图来分类的准则:
1.任何类都必须在临近类中是突出的
2.各类所包含的元素不应过多
3.分类数应该符合使用目的
4.采用集中聚类法,聚类图上应发现相同的类
这些准则是对分类数的探索之一。SAS软件中作聚类分析,可以控制CCC,PSEUDO选项,这两组选项对分类数的确定有一定的参考意义。CCC在高惠璇编著的STAT使用手册中译作立方聚类标准,它与R和半偏R统计量相关。值得注意的是,它的计算需要协方差矩阵存在特征值,它不用在SINGLE聚类方法中。PSEUDO选项可以得到伪的F统计量和t统计量,分别反映当前水平下所有类分离程度和最近合并的两个类间的分离程度。该选项用在数据是坐标型的(等同的),或者是用在聚类方法为AVERAGE,CENTROID,WARD时。
通常会认为CCC的值大于2或3反映聚类的好,伪F统计量较大显示聚类,伪t统计量提示分类结点的选择。
看看STAT文档中的例子“Cluster Analysis of Fisher’s Iris Data”:
.........................
proc cluster data=iris method=ward print=15ccc pseudo;
var petal: sepal:;
copy species;
run;
proc tree noprintncl=3out=out;
copy petal: sepal: species;
run;
...................................
结果如下图:

上一篇:聚类分析论文中的理论介绍

下一篇:论文初稿创新点万能模板