基于家庭客户识别模型的营销支撑体系

发布时间：2015-09-06 08:52

摘　要：

关键词：

1.前言
　　家庭市场是福建移动公司今后重要客户发展和保有，是实现企业在竞争市场的最为重要的保障之一，更是公司未来发展的重要基础和业务拓展基石，同时也是各大电信运营商竞争的焦点。
　　在2008年初电信行业重组之前，家庭客户的市场主要是中国电信的垄断市场，竞争并不算激烈。随着重组后全业务竞争的帷幕拉开，家庭客户成为移动运营商新的发展市场。竞争对手通过家庭产品的优势抢夺和保有家庭客源的手段层出不穷，中国移动作为家庭客户市场的后来者，需要更有效的策略，更科学的方法去维持和推动家庭客户市场的发展。
　　从目前福建移动家庭客户的发展现状来看，家庭客户规模有一定的下滑，主要原因为家庭产品吸引力不足、营销推广力度低、电信家庭市场竞争激烈等；家庭市场中的主要产品-家庭宽带，电信占据了绝对的优势，因此需要深入的研究家庭市场发展策略，逐步完善家庭市场体系。
　　要建立一整套家庭客户的管理、维系和家庭市场的分析、产品策划、营销体系。目前，关键的是如何准确的识别家庭客户，建立家庭客户关系，确定家庭区域范围、分析家庭客户消费需求和制定家庭客户营销方案。
　　
2.家庭市场管理体系规划
　　通过在福建移动经营分析系统建立家庭客户管理模块，实现对家庭客户管理的闭环分析，提升家庭市场的支撑能力。基于家庭客户识别模型，找到两者家庭关系、家庭关键人物、家庭位置小区、家庭产品潜在需求。对现有家庭客户进行位置小区打标、判断家庭客户的纯度、分析家庭客户的发展情况。对家庭客户进行有效的针对性营销和家庭客户的社区维系保有。
　　（1）通过挖掘模型找到潜在家庭产品需求的客户，将潜在的客户进行有效的营销发展家庭客户和家庭产品；
　　（2）进行家庭客户发展KPI指标监控及跟踪分析，了解当前营销政策的整体情况与改进方向；
　　（3）每月对营销后的家庭客户进行对比、跟踪分析评估营销的效果，对存在的不足进行总结和提出改进建议；
　　（4）根据家庭市场客户关怀和维系模块，对退订家庭产品的客户进行有效的客户关怀，了解客户需求，改进营销方式和进行产品优化，建立和客户良好的关系，实现持续营销。

3.家庭客户识别模型
　　通过对客户的交际圈和家庭客户通话行为普遍规律，结合相关业务经验，建立家庭客户识别模型。确定家庭客户对和家庭客户的家庭位置小区。根据家庭客户对中的客户账单金额、客户品牌、入网时长、交际圈和客户身份证等相关的业务信息判断家庭客户的关键成员。
3.1数据准备
（1）分析用户群：结合福建移动目前的业务以及数据资源，选择家庭VPN用户中标识为家庭关系的用户对作为分析的用户群，剔除同一个用户在多个家庭VPN中或者同一个家庭VPN有多个付费用户的用户对，该用户群为模型组。同时还需要准备未标识家庭关系的用户群作为对照组(模型组主号与其本地语音交往圈号码组成的用户对)。模型组和对照组用户群共同构成了模型的训练集和测试集：训练集（标识为家庭关系的用户对375对，未标识的为10707对）、测试集1(标识为家庭关系的用户对135对，未标识的为3519对)、测试集2(标识为家庭关系的用户对9563对，未标识的为130647对)
（2）基础变量：主要包含两类变量：与通话时段相关的变量、基站以及资料相关的变量。
3.2数据探索和数据分析
（1）分析用户群的外呼验证：在准备好分析用户群之后，对标识为家庭关系的用户对的数据进行了抽样外呼。外呼总数902个，接受调查502个，成功率57％。其中接受调查中有87％是家人，3％是亲戚。只有2％是同事和朋友。可见选取的家庭客户样本数据纯度很高。
（2）通信时段分析：按照通话时长对用户群进行分箱，可以发现具有家庭关系的用户群通话高峰期出现在下班时段；对于短信，通信越密切的，高峰期出现的越晚。根据通信时段的分析，可以生成一些新的衍生变量用在后续的分析建模中，如：下午、下班时段、晚上各时段的通话时长、通话次数、短信条数以及相应的占比等。
（3）基站分析：对于同住一家的家庭用户，活动地点往往有重合之处，而基站数据反映的正是用户的位置特征，特别是夜间（21点至次日早上7点）的基站。但是，太少的通话的基站扇区又不能作为用户的特征，而此段时间属于通话闲时阶段，通话量较小，所以需要考察用怎样的通话次数作为阈值才能兼顾到大部分的用户，结合通话次数以及用户占比，选择通话大于等于3次的扇区作为有效扇区，这样覆盖了80%以上的用户。通过分析，在通话时长20-120分钟的用户对中，夜间通话基站的重合比例都超过了35%。
（4）变量相关性分析：在做好模型宽表后，对宽表中的变量做相关性分析，可以直观的看出模型自变量和目标变量的关系，还可以对比相关变量的区分程度，这为建模时的模型调整提供了重要依据。例如通话时长和通话次数，是一堆相关性比较大的变量，同时他们与目标变量的关系都比较密切。一些挖掘算法要求输入变量的相关性较低，所以必须从两个相关性较强的变量中剔除一个，简单的，可以把最后一个分箱提升率低的变量剔除。
3.3模型构建
（1）建模方法选取：移动经分应用中绝大多数数据挖掘问题是预测类问题，本次我们使用数据挖掘工具的逻辑回归算法来进行建模，预测结果将是[0,1]闭区间的概率。
（2）模型结果：将是否家庭关系作为因变量，其他变量作为自变量，输入数据挖掘工具，设置模型的分析参数，运行之后，得到一对用户是否具有家庭关系的打分公式：

其中 y = 常数 + 系数1×变量1 + 系数2×变量2 + ......。各个数值以及变量如下表所示：

系数是负的，说明因变量与该变量是负相关；系数是正的，说明因变量与该变量是负的。标准化系数反应了该变量对模型的影响大小：标准话系数的绝对值越大，对是否家庭关系的概率的影响就越大。从表中可看出通话次数、短信、夜间上行短信条数、以及下班时段通话比例和目标变量都是正相关的。
（3）模型评估：对于训练模型，一般使用命中率、提升率、覆盖率来评价模型。
　　命中率 = 提取的用户对中具有家庭关系的用户对 / 提取的用户对
　　提升率 = 命中率 / 总体中家庭关系用户对的比例
　　覆盖率 = 提取的用户中实际具有家庭关系的用户对 /总体中家庭关系用户对 = 提取的用户对在总体中的占比 × 提升率
　　测试集1与测试集2这个三个指标的曲线如下图所示：

前5%的命中率在40%左右，提升率在10左右，覆盖率在50%左右。
　　对于家庭关系，只在两三个用户中存在，有一定的排他性。所以在主号相同的用户对中提取模型打分排名第一的用户对，认为他们之间具有家庭关系，看模型的命中率和覆盖率，如下表所示：

（4）外呼验证模型准确率：通过对福州、泉州、南平、龙岩4地市进行外呼验证，其中，朋友占比也比较高，说明即使被调查的用户对非家庭，也有很亲密的关系，结果如下表所示：

3.4模型部署

根据模型结果，对于每个用户号码，都可以对其交往圈号码进行打分，打分高的认为他们具有家庭关系的可能性较大，通过营销管理平台对其进行针对性营销，推荐合适的家庭产品以及后续的活动效果跟踪反馈。

4.实施效果
4.1家庭产品拓展营销
基于家庭客户识别模型中打分较高且未办理合家欢套餐的客户，即为家庭成员可能性较高的客户，结合泉州地市家庭市场当前的营销活动和业务特点，对家庭关键人进行合家欢套餐的外呼推广营销活动并通过营业厅进行办理，取得了良好的效果，既增加了合家欢套餐的办理客户数，提升了客户价值，同时对合家欢套餐起到了一定的宣传作用，使家庭产品深入人心，也对渠道的支撑能力进行了一定的优化。
模型组意向率比对照组意向率高出6个百分点，模型组成功办理率比对照组成功办理率高出3倍。

4.2完善家庭市场营销支撑体系
通过家庭客户管理的闭环分析体系，加深对家庭客户的认识和了解，将家庭客户识别分析模型推向一线应用，准确圈定家庭成员、家庭关键人和把握家庭客户需求，建立了精确化市场营销体系，巩固和拓展了家庭业务，提高家庭产品在存量用户中的渗透面，同时积极发展家庭数信业务，扩大家庭市场规模，提高客户价值，实现了家庭存量市场的保有和增量市场的构建，完善家庭市场营销支撑体系，有效地支撑了公司全业务经营工作。

上一篇：谈戏剧表演教学中学生心理承受力的培养

下一篇：服刑人员书信智能审查方法研究

基于家庭客户识别模型的营销支撑体系

热门论文

热门推荐

推荐问答