项目题目
电子商务网站用户行为分析及服务推荐
成员
夏铭泽 2620170053 相铮 2620170056 李晓波 2620170054 韩林洁 2620170052
问题描述
1、问题背景分析
随着互联网和信息技术的快速发展,电子商务、网上服务与交易等网络业务的越来越普及,大量的信息聚集起来,形成海量信息。用户想要从海量信息中快速准确地寻找到自己感兴趣的信息已经变得越来越困难,在电子商务领域这点显得更加突出。因此信息过载问题已经成为互联网技术中的一个重要难题。如今传统的搜索引擎已经无法满足用户的需求,与搜索引擎不同,推荐系统并不需要用户提供明确的需求,而是通过分析用户的历史行为,从而主动向用户推荐能够满足他们兴趣和需求的信息,在电子商务领域中推荐技术可以起到一下作用:(1)帮助用户发现其感兴趣的物品,节省用户时间,提升用户体验。(2)提高用户对电子商务网站的忠诚度,如果推荐系统能够准确地发现用户的兴趣点,并将合适的资源推荐给用户,用户就会对该电子商务网站产生依赖,从而建立稳定的企业忠实客户群。
2、问题描述
2.1. 数据准备 本次我们主要的研究对象是北京某家法律网站,它是一家电子商务类的大型法律咨询网站,致力于为用户提供丰富的法律信息与专业的咨询服务,并为律师与律师事务所提供卓有成效的互联网整合营销解决方案。 数据文件:7law.zip 2.2. 模型建立 为实现较好的推荐效果,我们采用结合多种推荐方法将推荐结果进行组合,最后得出推荐结果。我们采用基于物品的协同过滤推荐系统对用户进行个性化推荐,以其推荐结果作为推荐系统的重要部分。基于物品的协同过滤算法主要分为两步:1、计算物品之间相似度;2、根据物品的相似度和用户的历史行为给用户生成推荐列表。关于物品相似度计算方法我们采用杰拉德(Jaccard)相似系数法。完成各个物品之间的相似度的计算之后,即可构成一个物品之间的相似度矩阵,通过采用相似度矩阵,推荐算法会给用户推荐与其物品最相似的K个物品。
项目评估
我们采用随机打乱数据的方法完成模型的评测,用随机函数打乱原数据顺序,然后将用户行为数据集按照均匀分布随机分成10份,选取一份作为测试集,九份作为训练集,在训练集上进行建模,并在测试集上进行用户行为预测,统计出相应的评测指标。评价推荐系统的性能需要从用户、物品提供者、提供推荐系统网站等方面来进行考虑。我们采用离线的数据集构建模型,用户行为是二元选择,例如:喜欢与不喜欢,浏览与否等,因此在对模型评价的指标为分类准确度指标,通过三种推荐算法,以及不同的K值的情况下所得出的准确率和召回率的评价指标。
项目分工
收集数据及进行数据预处理 夏铭泽, 关联规则挖掘 相铮, 数据可视化实现 李晓波, 结果评估及撰写报告 韩林洁