爱荷华州埃姆斯市房价预测
成员
- 齐若岩(3220190857)
- 刘豪(3120191022)
- 李挺(3220190829)
- 王佳佳 (3220190877)
- 李佳钰(3220190824)
问题描述
1、问题背景及分析
在现在经济生活中,房地产市场成为金融、建筑和股市等经济板块发展的重要推动力,其产业的兴衰影响着国民经济的发展状态。房价每天都在发生着变化,对房价进行预测能够帮助有购房意愿的人们更好地购房。
该问题的目的是预测房价。我们可以把房价预测问题视为典型的回归问题,需要从众多可能的影响因子中挑选出最能预测房价的因子来建立模型,用于预测房价。
2、问题描述
2.1 数据准备
Ames Housing数据集由Dean De Cock编译,用于数据科学教育。该数据集借助79个变量几乎描述了爱荷华州埃姆斯市住宅的方方面面,要据此预测每个房屋的最终价格。在分析之前,我们需要对这些数据进行合适的选取以及处理,并且划分好训练集和测试集,分别用于评估训练以及测试的效果。
2.2 准备采用的方法或模型
首先挑选特征,找到刻画每个特征与目标变量之间的关系,找出最重要的特征。之后应用交叉验证,对训练集进行建立合适的模型,再在测试集上测试。最终建立预测房价的模型。
2.3 预期的挖掘结果
通过对数据的分析,可以找到影响房价的关键因素,并建立预测模型,从而实现准确的预测房价。
项目评估
对于测试集中的每个ID,预测SalePrice变量的值。根据预测值的对数与观察到的销售价格的对数之间的均方根误差(RMSE)评估提交的内容。取对数意味着预测昂贵房屋和廉价房屋的错误将同等影响结果。
项目分工
- 齐若岩:系统设计,算法实现,文档编写
- 刘豪:数据预处理,算法实现,文档编写
- 李挺:数据分析,算法实现,文档编写
- 王佳佳:项目评估,算法实现,文档编写
- 李佳钰:可视化,算法实现,文档编写