PUBG玩家排名预测
成员
- 李敏琴(3220190826)
- 劳安(3220190818)
- 杨雅逸(3220190909)
- 殷昕(3120191067)
问题描述
1、问题背景及分析
大逃杀风格的电子游戏风靡全球,PlayerUnknown’s BattleGrounds (PUBG) 享有巨大的人气。它的销量超过5000万份,是有史以来第五大畅销游戏,月活跃玩家达数百万。在PUBG游戏中,每场比赛最多有100名玩家。玩家可以分到不同的队伍,比赛结束后,根据被淘汰时其他队伍还有多少人活着的情况进行排名。在游戏中,100名玩家空手降落在一个岛屿上,玩家可以拾取不同的枪支、子弹、医疗物品等,复活被击倒但未被淘汰的队友,驾驶车辆,游泳,奔跑,射击。在PUBG中,最好的胜利策略是什么?玩家应该坐在一个点位上苟着等待胜利,还是要做顶尖刚枪高手?
项目要解决的问题就是:
如何利用超过65,000场比赛的匿名玩家数据(包括击落的敌方玩家数量、造成的总伤害、使用的治疗物品数量、玩家存活时间、步行/车辆行驶/游泳的总距离等28条相关信息),建立合适的模型,根据最终的比赛统计和初始玩家评分来预测最终的排名?
目前所想到的方法就是首先对数据集进行数据分析,看看是否存在缺失值或者异常值。若存在缺失值,则对缺失值进行填充或者删除处理,若存在异常值则对异常值进行删除或者修正处理,并可视化分析数据。然后将处理好的数据集分成训练集和测试集,用训练集来训练一个排名预测模型,然后对模型的预测结果进行分析,并与真实的排名信息进行对比可视化分析,对咱们的模型预测方法进行评估。
2、问题描述
2.1 数据准备
从kaggle上挑选了PUBG Finish Placement Prediction数据集,包含两个.csv文件:train_V2.csv和test_V2.csv。每一行都包含一个玩家的赛后统计信息。但test_V2.csv文件里面缺失了排名信息,所以我们最终使用的数据集是train_V2.csv文件,将其进行处理并划分为训练集和测试集。
2.2 准备采用的方法或模型
在数据预处理之后,采用LR、SVM、DecisionTree以及MLP等几种机器学习方法进行对比实验。
2.3 预期的挖掘结果
根据经验,理论上来说,通过训练一个预测模型应该能得到还不错的排名预测结果,根据这个预测结果与真实结果做对比评估,应该能分析出其他属性特征与排名属性的相关性,从而得到还不错的挖掘结果。
项目评估
采用预测的winPlacePerc与观察到的winPlacePerc之间的平均绝对误差进行评估。
项目分工
- 李敏琴: 负责预测模型的训练和模型性能的评估
- 劳安:负责预测模型的训练和模型性能的评估
- 杨雅逸:负责对预测之前的数据进行分析并对预测前后的数据进行分析
- 殷昕:负责对预测之后的数据进行分析并对预测前后的数据进行分析