• 回答数

    2

  • 浏览数

    335

黄小琼琼
首页 > 期刊论文 > 电商平台用户画像建模研究论文

2个回答 默认排序
  • 默认排序
  • 按时间排序

bingdaoyu16

已采纳

包括用户行为数据和用户基本信息数据: 重复值处理 缺失值处理 数据格式处理: 日期格式的转换 astype() 查看有无重复值:首先看使用df.info查看各个字段的记录数,再看去除重复值后的数量。以此判断有无重复数据。 去重重复值可以使用函数drop_duplicates() 通过df.info查看数据格式 看到time是object类型的,不适合处理。同时我们一般将数据分为日期和时间格式,因此对其进行拆分处理。 为各个时段打标,将时段分为'凌晨'、'上午'、'中午'、'下午'、'晚上' 知识点:pd.cut函数,区间分割 查看空值,并计算数量。可以看到并无空值。 在订单表中按照(用户,时段)分组,取每个时段的记录数(订单数): 这里的操作流程与hive-sql类似,我们需要先把max算出来,再去关联。 将生成的标签加入标签表: 同理,可统计出用户购买的活跃时间段,在此不赘述,仅展示结果 分析用户最喜欢的类目,从而便于我们为其进行推荐。 最终得到标签表: 通过分析用户分析最近的行为,来判断该用户是否活跃、流失 分析近30天的活跃天数,只要有浏览、收藏、加购和购物四种行为之一就认为是活跃。 结果如下: 我们可以通过查看所有用户30天活跃天数的分布情况,来确认一个分类的标准,判断某个用户是否活跃。 用户30天活跃天数分布图如图: 同理,可分析用户近7天的行为,包括其购物次数和活跃天数。 与上述操作类似,展示结果: 明确今天的日期,在本项目中,“今天”指“2014-12-19”,然后统计订单表中用户某种行为的最大日期与当前日期的差值。 使用的函数是:datetime.strptime: new datetime parsed from a string (like time.strptime()) ,将字符串转为date格式,以方便我们做日期运算 结果如图: 使用日期的diff函数 返回结果 RFM分组是指按照最近一次消费 (Recency)、消费频率 (Frequency)和消费金额(Monetary)进行分组 最近一次消费,我们按照最后一次购物距今的天数进行分组,同样是观看用户的一个分布情况,然后看如何进行分类。 消费频率,这里放宽要求,按照用户的30天活跃天数进行分类 消费金额,本次不涉及金额的统计。 因此,我们可以根据活跃度分类和最近一次消费将用户划分为四类: 结果如图 可以看到在第8天前后,用户有明显的分层,因此按照8天对其进行划分,最后一次消费距今天数小于8天的,认为最近有消费,大于8天的认为最近无消费 返回结果: 通过value_counts查看每个值的出现次数: 上述返回的结果值是: 如果值为空,说明无相应的行为,对浏览未购买的数据记录进行打标 以上的步骤到商品粒度,下面对用户进行统计,即只要用户有浏览未下单的行为就对其进行打标 返回的结果如图: 加购未下单同上述步骤 分析平台用户的年龄、学历、性别、城市、职业、婚姻情况等,以便于我们去分析我们的典型用户是什么。 从上图可以看出,平台用户中男性居多,女性较少。 值的分层可以使用pd.cut函数 从年龄分布图中,可以看出平台的用户以25岁-40岁的用户居多。青年人和中老年用户较少。 返回结果如下图,从结果中可以看到来自北上广深的用户占绝大部分比例。 从婚姻分布情况中可以看到,平台用户中有超过60%的用户为已婚。 使用该平台的用户大部分拥有大学及以上的学历 使用该平台的用户大部分为互联网从业人群 首先查看这一个月的时间跨度用户每天的购物情况: 从上图可以看出,该平台每天的下单用户数比较平稳,有一些周期性因素在其中,可能是每周周中和周末的购物情况不同。同时,注意到12.12这一天购物用户激增,可能是12.12购物节的因素。 再分析下用户喜欢在周几下单,哪个时间下单 从图中我们可以看到用户的喜欢的购物时间:周五,晚上9点。上午购物的人数都比较少,主要集中在下午和晚上。 通过用户的下单情况,我们可以对每周的下单用户进行分层,将其分为活跃用户、不活跃用户和回流用户。 最终结果 通过面积图看一下每周不同类型用户的比例情况: 复购率:一周内购买多次(>1)的用户占总用户的比例 从中可以看到,5周的复购用户都在50%以上,47周和51周的复购率较低,可能是因为数据不完整的原因。 用户最喜欢购买的品类? 用户最多收藏的品类? 从结果可见,用户最喜欢购买的品类前五名是6344、12189、5232、1863和4370,用户收藏最多的品类是13230、5894、1863、6513和5027。 转换率=浏览该商品的用户数/购买该商品的用户数 最终结果如图: 查看转换率的分布情况:

302 评论

狐狸猫fiesta

1.分析的背景     最近小家电类目的订单数量、产品浏览量、搜索数量等都有所下降, 现在运营同事计划对小家电类目进行一次季末促销活动,希望你能针对小家电的用户特征给出一些建议。 2.促销活动落地的方向: a.活动的受众群体定位 b.受众群体的偏好 c.活动的推送时间

1.数据准备及导入:

2.用户的基本属性: 1.1、用户的性别分布

1.用户的特征: 多数是来自一线城市的男性,年龄在30岁左右。学历水平较高,从事互联网等高收入行业。他们喜欢在周二到周五的晚上10点左右下单。他们喜欢追求生活品质,关心家庭,但是因为生活节奏和工作压力又没有时间在家庭生活上付出很多时间和精力。 2.对于促销活动的建议: 文案:采取无性别风格的文案,突出产品对于家庭生活品质的提升,突出产品口碑 时间:活动应该选择在周二到周五的晚上8点进行推送

162 评论

相关问答

  • 跨境电商平台比较研究论文

    写论文的时候内容提要应把论文的主要观点提示出来,便于读者一看就能了解论文内容的要点。论文提要要求写得简明而又全面,不要罗哩罗嗦抓不住要点或者只是干巴巴的几条筋,

    七月紫梦 3人参与回答 2023-12-07
  • 跨境电商平台国外研究论文

    跨境电商物流是跨境电商发展的重要支撑,相比国内快递物流,跨境电商物流流程复杂大大提升,已经成为跨境电商发展的重要痛点之一,因此,我国政府出台多项政策推动跨境电商

    青藤6970 2人参与回答 2023-12-05
  • 社区电商平台融资问题研究论文

    中文摘要 3-5英文摘要 5-61 绪论 10-191.1 问题的提出及研究意义 10-141.1.1 变革中的就业环境与当代大学生就业形势分析 10-111.

    Greta:)杨婷 5人参与回答 2023-12-08
  • 社区化电商平台商业模式研究论文

    电子商务是一种全新的商务模式,在全球引发了生产方式的重大变革。随着企业信息化和互联网技术的高速发展,电子商务已经成为当代企业竞争的关键手段。面对日益严峻的资源约

    似曾相识SaMa 5人参与回答 2023-12-05
  • 跨境电商平台分析论文模板

    电子商务市场是现在发展最快,最具潜力的领域,电子商务的迅速发展和应用,推动着社会生产力的发展,是全球经济增长最具潜力的领域之一。下面是我为大家整理的电子商务

    家军小太郎 4人参与回答 2023-12-11