高潜用户购买意向预测
一、小组成员:
- 孟玉立 2120161024
- 谢瑄 2120161065
- 王龙 2120161054
- 王欣欣 2120161059
- 商军英 2120161032
二、问题描述
高潜用户购买意向预测问题,首先需要解释的是高潜用户这一概念。所谓高潜用户即在用户群体中有更多可能性下单购买商品的用户,比如用户经常浏览购物网站,用户在购物网站的用户等级比较高的用户。然后从这些用户中预测在给定商品中其可能购买的商品。
网购已经成为现今购物一大主要方式,购物平台一般都积累了海量的真实数据。如何从历史数据中找出规律,去预测用户未来的购买需求,让最合适的商品遇见最需要的人,是大数据应用在精准营销中的关键问题。以真实的用户、商品和行为数据(脱敏后)为基础,构建用户购买商品的预测模型,输出高潜用户和目标商品的匹配结果,为精准营销提供高质量的目标群体。
三、数据集
从京东的算法大赛上获得数据集,然后对数据集进行处理。
数据集的属性:用户编号、商品编号、行为时间、点击模块编号、type类型(6种)、品类ID、品牌ID。
四、实现步骤
- 主要思路
- 对于历史记录的用户,绘画出历史购买轨迹,用已购买中评价最高的数据为预测数据
- 对于没有历史记录的用户,用用户数据表中的age、sex、user_lv_cd、user_reg_tm属性来聚类分析结果。
- 主要特征
第一层特征:使用cate, 行为数据表中的type使用权重处理一下,考虑用户数据的age、sex、user_lv_cd、user_reg_tm等
第二层特征:在第一层特征基础上加brand,调type的权重
第三层特征:
- 在第二层上基础上考虑product
- 考虑comment_num,bad_comment_rate
- 给1)和2)加权整理一下
整体上是线性回归神经网络算法
- 第1层主要步骤
第一步:考虑cate,用权重处理一下type
第二步:根据用户的age、sex等特征聚类出用户群体以及对应的cate最优值。
第三步:加权,0.4x[0.1,0.2,0.3]+0.6X[0.1,0.2,0.3]
- 第2层主要步骤
第一步:考虑brand,用权重处理一下type
第二步:根据用户的age、sex等特征聚类出用户群体以及对应的brand最优值。
第三步:加权,0.4x[0.1,0.2,0.3]+0.6X[0.1,0.2,0.3]
- 第3层主要步骤
第一步:考虑product,用权重处理一下type
第二步:根据用户的age、sex等特征聚类出用户群体以及对应的product最优值。
第三步:加权,0.4x[0.1,0.2,0.3]+0.6X[0.1,0.2,0.3]
五、组员分工
- 数据收集:王龙
- 数据处理:谢瑄
- 数据分析:王欣欣
- 算法实现:孟玉立
- 项目总结:商军英