短期降水量预测
一、小组成员
- 1 李盛楠:2120161009
- 2 洪辉婷:2120160997
- 3 江明明:2120161000
二、项目内容与意义
本项目题目及数据来源为阿里云天池大赛项目——CIKM AnalytiCup 2017。本项目旨在通过雷达回波(radar echo)数据进行外推预测短期的降水量。
短期降水量预测在气象服务领域一直是一个非常重要的任务。准确的天气预报服务可以支持诸如户外运动或比赛等用途,甚至可以提供水灾或交通事故的预警。短期降水量预测通常利用雷达、雨量监测仪以及通过求解大气动力学方程组得到的数值天气等进行分析预测。本项目致力于单独利用雷达(主要为雷达回波)数据建立短期降水量预测模型。
每个雷达站点覆盖其周围的m*m个网格,其中每个网格的雷达反射率为z。雷达站点的雷达反射率为Z,Z的取值范围可以是从一个很小的值到一个很大的值,通常使用dBZ来测量这个值:
问题详细描述
本项目提供不同时间段的雷达地图——主要包含目标站点和周边覆盖地区的雷达反射率信息——用以预测每个目标站点未来1小时至2小时之间的地面总降水量。该项目主要涉及以下信息分析任务:
-
- 当前降水量与雷达地图之间的关系。针对雷达地图的分析可以获得当前降水量的相关线索;
-
- 利用雷达地图中的当前目标站点及其周边地区的雷达反射率信息,可以分析目标地点与周边地区之间的降水关系;
-
- 根据历史上不同时间段的雷达地图数据,挖掘发现降雨量演变的模式。
三、 数据集
本数据集由深圳气象局提供。数据集包含真实的雷达地图信息以及不同地点的降水量信息。数据集包含训练集及测试集: 1) 训练集:包含10000个数据实例 2) 测试集:包含2000个数据实例
数据集格式为“id,label,radar_map”,详细介绍如下:
- id:位于雷达地图中心的目标地点;
- label:雷达地图中目标地点在未来1小时~2小时之间的降水量标注(注意,若当前时间为12:00,则未来1小时~2小时之间为13:00~14:00之间,即,不考虑12:00~13:00之间的降水量);
- radar_map:15个时间段(间隔6分钟)在4个不同高度(0.5~3.5km,间隔1km)测量的雷达地图(如图1),每个雷达地图占地面积,目标位置位于中心,即(50,50)(如图2)。即radar_map共有154101*101个值,按照“THYX(时间、高度、Y轴、X轴)”排列,以空格分开,顺序为:T0H0Y0X0 T0H0Y0X1 … T0H0Y0X100 T0H0Y1X0 … T0H1Y0X0 … T1H0Y0X0 … T14H3Y100X100。
四、 预期结果与结论
本项目预期训练一个最小化预测误差的模型,用以获得目标地点未来1小时~2小时内确切的地面总降水量预测结果。 我们使用均方根误差(Root Mean Square Error,RMSE)来评估性能:
五、项目分工
江明明:算法设计、程序实现
李盛楠:算法设计、数据分析、文档编写
洪辉婷:算法设计、数据处理、文档编写与PPT制作