欢迎来到学术参考网

一种基于WEKA平台的新业务主动营销策略

发布时间:2015-12-14 14:27

摘 要:近年来,随着各企业数据的急剧增加,企业纷纷利用数据挖掘技术,来发掘隐藏在数据中的有用的信息,将数据转变为知识。本文以广东联通决策支持系统为基础,探讨了基于WEKA平台的数据挖掘技术在该系统中的应用过程,详细的介绍了一种利用WEKA进行新业务主动营销的策略,希望对我国电信行业的发展起到一定的促进作用。

关键词:数据挖掘;目标客户;主动营销;WEKA

1.引言
  数据挖掘就是从存放在数据库,数据仓库或其他信息库中的大量的数据中获取有效的、潜在有用的、最终可理解的模式的过程。
  本文以广东联通决策支持系统为例,基于数据仓库中的数据,经过WEKA平台进行挖掘,从而生成目标客户,并对目标客户营销,营销成功的客户将导入数据仓库中,来优化因子来提高WEKA预测的准确性。
2.系统数据挖掘的实施步骤
  以广东联通“如意博客”业务的营销为例,通过使用WEKA工具进行数据挖掘,产生目标客户。数据挖掘的分析实现过程分为以下步骤:数据准备、数据预处理、建模、评估及应用、结果发布。系统数据挖掘的步骤如图1所示:
图1  系统数据挖掘步骤
2.1数据准备
  广东联通“如意博客”是将手机的通信特性与博客相结合的手机博客服务。它是一种新业务,,系统中没有营销成功的客户数据,所以首先需要确定试验营销客户,系统采用统计抽样原则利用随机抽取方法通过sql语句从数据仓库中导出广东省10%的客户资料以供预测。
2.2数据预处理
  由于本系统的数据是直接从数据仓库中导出的,因此用于数据挖掘的数据已经经过ETL处理,只需要按照WEKA的要求进行简单的预处理操作就能够达到预测时的数据格式要求。由于不能直接从数据仓库中导出WEKA需要的arff格式的文件,所以先从数据仓库中将数据导出为CSV文件,然后利用WEKA的”Arff Viewer”将文件转化成arff格式。并对numeric的属性进行离散化处理,转换成nominal类型。
2.3建模、评估及应用
  对数据进行预处理以后,我们可以选择数据挖掘的算法开始进行建模工作。WEKA提供了多种算法,基于本系统中数据的特点,本文采用聚类算法中的k-means算法。
  运用Weka中“Applications”菜单项的“Explorer”选项打开处理后的数据,切换到“Cluster”选项,在“Choose”按钮中选择“SimpleKMeans”,并设置“numClusters”为10,“seed”参数也为10,然后点击“start”进行预测,图2是运用k-means算法生成的预测模型的可视化的聚类结果:
  图2 使用k-means算法生成的聚类结果
  最后应用该模型进行预测,并对结果进行分析,我们得到以下结论:
  使用业务预测可能性在50%以上的客户因素前五位为年龄在26到34岁之间,月平均话费在100元以上,同时开通GPRS业务和手机报业务,品牌为新势力,地市为广州、深圳、珠海,近一年无欠费记录的客户。
2.4结果生成和发布
  使用除去试验营销客户数据后的数据集,经挖掘模型进行预测后,得到目标客户名单,然后将目标客户名单传入客户管理系统,由营销人员按照预测的结果进行营销。
2.5模型优化
  由于新业务主动营销,所以,系统第一次预测采用的数据是随机的数据,预测的准确度必然比较低,所以,首次营销后,将营销成功的记录导入数据库并作为训练数据再次优化挖掘模型和调整因子,这样能够提高预测的准确度,降低企业的营销成本。
3.结论
  广东联通市场营销成功率以往只有10%左右,但应用了数据挖掘技术后,营销成功率提升到了35%,大幅提高了营销的效率,降低了营销的成本。通过WEKA平台,改变了传统的“扫街”式的营销方式,大大提升了营销的成功率,降低了企业的成本,是数据挖掘技术的一个成功的应用案例。
参考文献
. s计算机工程与应用,2008,44(19).

上一篇:基于CDIO模式的数据库技术课程改革

下一篇:试论电子文档安全管理系统方案设计