基于协同过滤算法的电影推荐系统及相关电影数据挖掘
成员
- 郭 强: 2120160993
- 尚子钰: 2120161034
- 廖晨宇: 2120161014
问题描述
1.问题背景分析及相关工作
推荐系统是一种信息过滤系统,用于预测用户对物品的“评分”或者“偏好”。推荐系统近年来非常流行,应用于各行各业。推荐的对象包括:电影、音乐、新闻、书籍、学术论文、搜索查询、分众分类以及其他产品。也有一些推荐系统专门为寻找专家、合作者、笑话、餐厅、美食、金融服务、生命保险、网络交友以及twitter页面设计。协同过滤,简单来说就是利用某些兴趣相投、拥有共同经验之群体的喜好来推荐用户感兴趣的信息,个人通过合作的机制给予信息相当程度的回应(如评分,回应不一定局限于特别感兴趣的,特别不感兴趣的信息记录也相当重要)并记录下来以达到过滤的目的,进而帮助别人筛选信息。
2.问题描述
(1)数据预处理。包括对数据进行分析与整理、填补缺失数据、对数值数据进行离散化。(2)挖掘关联信息和相关性信息,挖掘不同性别、年龄的观影者对不同电影的评分倾向性和关联性,挖掘不同性别的观影人群最具差异性评分的50部电影。(3)电影推荐系统。利用协同过滤算法对观影者进行推荐,推荐其最可能想看的电影。于此同时,为新上映电影预测目标观影人群。
目标
经过实验操作,挖掘电影评分当中蕴含的关联信息和相关性,为观影者推荐适合其的电影。
项目分工
- 郭 强:利用协同过滤算法挖掘关联规则,完成电影推荐。利用朴素贝叶斯分类方法,为新上映电影推荐目标观影人群
- 尚子钰:数据预处理,挖掘电影关联信息、挖掘性别、年龄对不同类型电影的不同倾向性,挖掘性别差异导致的电影评分差异
- 廖晨宇:数据预处理,算法设计,文档编写