利用历史购物数据分析超市商品摆放规则
成员
- 康杨
- 刘元培
- 高建花
- 姜艳杰
问题描述
1、问题背景分析
当今社会已经步入大数据时代,大量信息已经成为信息社会最重要的特征。然而如何更好的利用信息,如何从海量数据中发现知识创造价值是人类面对的一个重要课题。
目前,商家往往不能根据累计的顾客购物信息获取有效的研究信息,更少有商家可以利用数据挖掘的方式从海量数据中获取有利的营销策略。如何从大量的购物数据中获取商品关联规则并令商家利益趋于最大化,则是我们本次实验的研究重点。
2、问题描述
2.1. 数据准备
从网络中下载购物篮数据,对其中购物数据的基本属性如众数、中位数等进行统计分析,并依照购买顾客进行简单分类,完成初步的数据准备。
2.2. 模型建立
参数训练,得到商品数据关联规律,估计满足商家利益最大化的摆放方式。
项目评估
项目采用Apriori算法,来测量测试样本中的关联规则,实验流程预计如下:
- 1.寻找开放数据集确定评测指标。
- 2.数据分析和数据预处理。
- 3.用Apriori算法进行实验,分析利润影响因素。
- 4.编写实验报告。
项目分工
- 数据采集及预处理:康杨
- 关联规则挖掘:刘元培
- 数据可视化实现:高建花
- 结果报告及展示:姜艳杰