首页 / 一种基于随机森林的冰雹气候特征预测方法

一种基于随机森林的冰雹气候特征预测方法有效专利 发明

技术领域

[0001] 本发明涉及气候预测技术领域,尤其涉及一种基于随机森林的冰雹气候特征预测方法。

相关背景技术

[0002] 冰雹是强对流系统引起的极端天气之一,常伴随有强风暴、短时强降水、剧烈降温等天气现象,由于其空间尺度小、突发性强、破坏力大,对其定点定时定量的预报难度极大,容易使当地的农业和经济遭受巨大损失。目前国内外对于冰雹的研究多集中于典型雹灾个例研究、冰雹预报预警、冰雹气候特征统计分析等方面,对于冰雹气候特征的未来预测较少且有待更新。因此,有必要进一步研究未来几十年冰雹气候特征可能的演变情况,为冰雹的短时临近预报提供更大的预报背景,更好地开展冰雹的预报预警工作。
[0003] 政府间气候变化专门委员会(Intergovernmental Panel on Climate Change,IPCC)第四次评估报告指出,近几十年来的气候变化导致极端天气事件显著增多,但类似冰雹这种局地性强的事件的变化趋势还不是很清楚。国内外许多气象学者对各地的冰雹气候特征进行过多方面、多角度的统计与分析,冰雹在不同地区、不同时期都呈现不同的时空分布特征和变化趋势。因此,目前还缺少一个可以描述不同地区冰雹气候特征的标准,也无法拟合出一组适用于所有地区的冰雹变化趋势方程。
[0004] 目前,对于未来冰雹气候特征预测的研究较少,主要使用两种传统方法:一是基于各气象要素与降雹频率之间的相关关系建立的经验模型,该方法具有显著的物理意义,但局限于某一类大尺度背景下的冰雹事件,模型对于其他类型的冰雹事件不具备较好的复现能力;二是基于数值预报气候模型,利用数值预报数据驱动冰雹物理模型HAILCAST,从而预报未来长期的冰雹发生频率和冰雹尺寸的时空变化,但该方法计算成本较高、耗时较大、参数设置非常复杂,且预测结果很大程度上依赖于数值预报数据的好坏。
[0005] 自1956年机器学习的概念在达特茅斯会议上被首次提出后,它就成为数学、计算机科学、神经科学等多学科的活跃研究方向,其算法也被广泛应用到大气、海洋等众多学科领域。目前,机器学习在天气、气候预报中的应用非常普遍,印度学者使用深度神经网络自动识别可预测印度均质区域降雨量的气候因子,建立一个集合回归树模型用于不同区域的季风预报,与当前最先进的预测模型相比具有较强的竞争力。韩国学者基于深度学习方法构建的卷积神经网络模型可以提前7~21个月有效预测ENSO事件,并且预测准确率达到80%左右,高于当前大部分动力气候预测模型。可见机器学习有着良好的学习能力和非线性表达能力,在气候预测领域有着较好的应用前景。
[0006] 为了解决传统方法在大尺度背景和数值预报模型上的局限性,亟需将机器学习运用于冰雹气候特征的未来预测,将机器学习与传统方法相结合,提供更加准确的未来降雹次数和冰雹尺寸的变化趋势,为冰雹的气候预测提供新的思路。

具体实施方式

[0046] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。
[0047] 实施例:
[0048] 如图1‑7所示,一种基于随机森林的冰雹气候特征预测方法,包括一下步骤:
[0049] S1、历史冰雹观测数据准备;
[0050] 首先整理出1955~2014年的冰雹观测数据,剔除异常记录;
[0051] 将每个月发生的冰雹次数相加得出月降雹次数,进而得到为期60年逐月的数据集T;
[0052] S2、将降雹尺寸按照冰雹直径大小分为SA、SB、SC三个等级;
[0053] 直径小于等于1英寸的冰雹为SA,直径大于1英寸且小于等于2.5英寸的冰雹为SB,直径大于2.5英寸的冰雹为SC;
[0054] 将每个等级冰雹的月降雹次数除以年总降雹次数,得到每个等级冰雹的月降雹次数占比;
[0055] 三个等级冰雹的月降雹次数占比分别作为数据集A、B、C。
[0056] S3、CMIP6气候模式数据准备;
[0057] 选取具有代表性、预报效果较好的6个CMIP6气候模式;准备与数据集T同时间段的6个气候模式历史数据及各要素取平均作为数据集CF6,数据集CF6包括近地面温度、地表温度、850hPa气温、500hPa气温、500hPa位势高度共5项要素;
[0058] 准备未来80年的6个气候模式预报数据及各要素取平均作为数据集CA6,要素同CF6;
[0059] 未来预报数据包括全球变暖得到控制(ssp126)、全球变暖保持现状(ssp245)和全球极端变暖(ssp585)三种情景。
[0060] 另准备1980~2014年间4个气候模式历史数据及各要素取平均作为测试集CF4,要素同CF6,用于测试模型的效果。
[0061] S4、利用随机森林算法建立以数据集T为目标,以数据集CF6为输入的模型MT;
[0062] 将数据集T和数据集CF6按时间对应排列;整体按照8:2的比例随机划分训练集和验证集;
[0063] 调整随机森林算法参数,将学习速率固定为0.01,循环搜索树深度和迭代次数;
[0064] 判断损失函数MAE(平均绝对误差)在验证集上的值是否已经达到最小,如果没有则重复上一步;
[0065] 将全部训练集作为算法输入,以上两步得到的最优参数训练随机森林算法得到模型MT。
[0066] S5、利用随机森林算法建立分别以数据集A、B、C为目标,以数据集CF6为输入的模型MA、MB、MC;
[0067] 将数据集A和数据集CF6按时间对应排列;整体按照8:2的比例随机划分训练集和验证集;
[0068] 调整随机森林算法参数,将学习速率固定为0.01,循环搜索树深度和迭代次数;
[0069] 判断损失函数MAE(平均绝对误差)在验证集上的值是否已经达到最小,如果没有则重复上一步;
[0070] 将全部训练集作为算法输入,以上两步得到的最优参数训练随机森林算法得到模型MA;
[0071] 模型MB、MC训练步骤同MA。
[0072] S6、利用测试集CF4分别测试模型MT、MA、MB、MC的效果;
[0073] 将测试集CF4输入模型MT后得到月降雹次数;
[0074] 根据模型输出的月降雹次数,计算出1980~2014逐年降雹次数;
[0075] 计算模型预测年降雹次数与真实观测年降雹次数的相关系数,以测试模型MT的效果;
[0076] 将测试集CF4输入模型MA、MB、MC计算后得到SA、SB、SC的月降雹次数占比;
[0077] 计算出1980~2014年间SA、SB、SC逐年降雹次数占比,与真实观测的三个等级年降雹次数占比计算相关系数,以测试模型MA、MB、MC的效果。
[0078] S7、未来80年降雹次数和冰雹尺寸变化预测;
[0079] 将数据集CA6输入模型MT后,得到未来80年三种全球变暖情景下的月降雹次数;
[0080] 将每年的月降雹次数相加,得到逐年的年降雹次数,即为最终预测的年降雹次数数据;
[0081] 将数据集CA6输入模型MA、MB、MC后,得到未来80年三种全球变暖情景下的三个冰雹尺寸等级月降雹次数占比;
[0082] 再将月降雹次数占比相加,计算得到三个等级的年降雹次数占比,即为最终预测的冰雹尺寸变化数据。
[0083] 本发明所述方法对美国中部地区1980~2014年间的逐年降雹次数和三个冰雹尺寸等级年降雹次数占比进行了预测,结果显示,该方法提供了较为准确的预测结果,与实际观测数据的相关系数达到了0.9以上,可用于未来长期的降雹次数和冰雹尺寸变化的预测。
[0084] 以上,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

当前第1页 第1页 第2页 第3页