NBA数据挖掘

一、小组成员

  • 冯博思 2120160986
  • 姜晓健 2120161002

二、问题描述

1、问题背景分析

NBA作为世界上水平最高的篮球联赛,吸引了无数的球迷。每一场NBA比赛都会产生大量的数据信息,如果能够有效地运用这些数据,便可以充分发挥出其潜在价值。

对于博彩公司而言,在赛季初准确的了解本赛季球队以及球员的表现可以最大化其收入。

对于球员以及教练员而言,及时地了解每场比赛最适合的阵容配置以及战术配合可以在一定程度上提高赢球的概率。

2、问题描述

(1)数据预处理。包括对球员个人数据以及球队数据的爬取、清洗、归一化、降维等,形成较为规则的数据集。

(2)使用相关的机器学习算法以及knn聚类预测球员个人数据以及球队战绩。使用Adaboost算法将以上两种预测结果结合起来训练分类器,预测球员本赛季个人荣誉(MVP、最佳阵容等)。

(3)对比赛中的战术以及人员配置使用Apriori算法进行关联规则挖掘,找出赢球率最高的战术配合以及人员配置。

三、目标与功能

1、在赛季初,完成对本赛季各大奖项(如MVP、最佳阵容)的得主的预测,完成对球队战绩的预测。

2、通过预测阵容配置以及战术配合,教练员可以在场上根据情况做出最佳决策。

四、项目分工

  • 冯博思: 数据预处理、算法研究、算法改进、方案探讨
  • 姜晓健: 算法研究、算法实现、文档整理、方案探讨