关联规则挖掘

数据源

从以下2个数据集中任选一个

要求

  1. 对数据集进行处理,转换成适合关联规则挖掘的形式;
  2. 找出频繁项集;
  3. 导出关联规则,计算其支持度和置信度;
  4. 去除冗余的规则;
  5. 对规则进行评价,可使用Lift,也可以使用教材中所提及的其它指标;
  6. 使用可视化技术,如散点图、平行坐标、泡泡图等,对规则进行展示。

提交的内容

  • 对数据集进行处理的源程序
  • 关联规则挖掘的源程序
  • 挖掘结果及分析
  • 挖掘过程的报告