技术领域
[0001] 本发明属于天气雷达回波预测领域,特别涉及该领域中的一种天气雷达回波逐帧预测神经网络训练状态判定方法。
相关背景技术
[0002] 天气雷达回波预测(外推)在气象预报中具有极其重要的意义。可以及时发现并预测强降水、台风等灾害性天气的发生和发展趋势,为相关部门和公众提供及时的预警信息。有助于减少灾害性天气对人民生命财产安全的威胁。目前已使用的天气雷达回波预测方法包括交叉相关法、单体质心法、光流法以及神经网络预测方法等。其中,神经网络预测方法,尤其是深度学习神经网络预测方法,可基于海量大数据和累积学习训练,实现高精度的天气雷达回波短临预测。
[0003] 对于预测类神经网络,通常是通过评估预测结果与目标样本的相似性,来判断网络的训练状态(效果)和评估是否完成训练。具体到天气雷达回波逐帧预测神经网络,通常采用雷达历史探测数据中连续的多帧(如10帧)时序回波数据作为输入样本,下一帧回波数据作为目标样本。然而,需要注意到由于待预测回波与上一帧回波对应的时刻相隔很近,因此其回波数据变化通常很小。同时,对于高时间分辨率和大探测范围的天气雷达,其连续测量的多帧时序回波数据变化通常也不显著。在上述情况下,可能出现的一种现象是:在神经网络经过若干次训练后,预测结果虽与目标样本的相似性已经很高,但其却更相似于某个(些)输入样本,这种结果显然未能有效体现出神经网络的预测性。
具体实施方式
[0036] 为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图和实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
[0037] 实施例1,本实施例公开了一种天气雷达回波逐帧预测神经网络训练状态判定方法,该方法能使神经网络预测结果具有较好的预测性,对天气短临预报具有重要的意义,如图1所示,包括如下步骤:
[0038] 步骤1,收集天气雷达回波数据集,对数据进行预处理,建立天气雷达回波数据样本;
[0039] 天气雷达回波数据,是指天气雷达探测的反射率因子PPI(Plan Position Indicator,平面位置显示)数据。
[0040] 收集天气雷达回波数据集,是指收集天气雷达的历史时序回波数据集合,令天气雷达历史时序回波数据总个数为NP,回波数据为P(iP),其中iP=1,2,……,NP,则天气雷达回波数据集SP为:
[0041] SP={P(iP)}={P(1),P(2),…,P(NP)}。
[0042] 回波数据P(iP)通常为二维数组形式。
[0043] 对数据进行预处理,包括数据质量控制处理和数据降尺度处理,
[0044] 所述的数据降尺度处理,是指为减少计算资源消耗和提高训练效率,通过降低原始回波数据的空间分辨率,从而降低原始回波数据尺度。对于极坐标系形式的回波数据,包括降低方位向尺度和径向尺度,令原始回波数据的尺度为(M0,N0),则原始回波数据表示为P0(i0,j0),i0=1,2,…,M0,j0=1,2,…,N0,降低后的回波数据尺度为(M1,N1),则降尺度后的回波数据表示为P1(i1,j1),i1=1,2,…,M1,j1=1,2,…,N1,降尺度处理后的回波数据采用距离上的就近原则取值,有:
[0045]
[0046] 上式中,函数D代表两个数据点的距离。
[0047] 原始回波数据方位向尺度和径向尺度分别为360和920,其回波数据见图2。按照步骤1所述方法,将原始回波数据进行降尺度处理。降尺度后的回波数据方位向尺度和径向尺度分别为180和115,其回波数据见图3。此外,图3还同时进行了质量控制处理。
[0048] 建立天气雷达回波数据样本,首先对天气雷达回波数据集SP取样,取样方式采用滑动取样;设输入样本为SX,输入样本长度为NX,设目标样本为ST,对于逐帧预测,目标样本长度为1,则取样总长度为NX+1,其中,样本前NX个元素为输入样本,最后一个元素为目标样本,有:
[0049]
[0050] 上式中,iS为样本序号,样本总数为NP‑NX;将上述样本再随机分为训练样本和验证样本,分配比例按90:10。
[0051] 按照步骤1所述方法,给出一组天气雷达回波数据样本,其中输入样本如图4所示,目标样本如图5所示。
[0052] 步骤2,建立天气雷达回波逐帧预测神经网络;
[0053] 天气雷达回波逐帧预测神经网络采用Python语言Keras人工神经网络库下的顺序模型,设置了四个堆叠的二维卷积长短期记忆层和批量归一化层,以及一个三维卷积层,损失函数FL使用交叉熵损失函数或均方差损失函数等。
[0054] 步骤3,建立天气雷达回波逐帧预测神经网络训练状态判定方法,开展神经网络训练,判定训练状态至完成:
[0055] 所述天气雷达回波逐帧预测神经网络训练状态判定方法包括基于神经网络损失函数FL的方法和基于预测结果SY与输入‑目标时序样本{SX,ST}相似度比对的方法;
[0056] 所述基于神经网络损失函数FL的方法,是指随着神经网络训练,考察损失函数FL是否小于(或不大于)阈值FLT。其中,阈值可根据经验取值。
[0057] 所述基于预测结果SY与输入‑目标时序样本{SX,ST}相似度比对的方法,是指随着神经网络训练,计算当前训练状态下神经网络预测结果SY与输入‑目标时序样本{SX,ST}中各元素SX‑T的相似度,考察预测结果SY是否与输入‑目标时序样本{SX,ST}中的目标样本ST的相似度最高。其中,相似度FS可用均方差函数MSE评估。同时,考察所有验证样本,对验证样本中所有样本的相似度做平均。有:
[0058]
[0059] 所述判定训练状态至完成,是指同时满足基于神经网络损失函数FL方法的判定条件和基于预测结果SY与输入‑目标时序样本{SX,ST}相似度比对方法的判定条件。具体判定条件是:
[0060]
[0061] 上式中,FLT为阈值,MSE表示均方差函数,当满足上述判定条件时,判定训练完成。基于此训练状态下的神经网络,即可有效开展天气雷达回波逐帧预测。
[0062] 按照步骤3所述方法,获得神经网络损失函数随训练次数的变化如图6所示。若设定阈值为6,则当训练次数达到120次时,满足基于神经网络损失函数方法的判定条件。
[0063] 按照步骤3所述方法获得预测结果与输入‑目标时序样本相似度,训练次数分别为160次(如图7所示)和320次(如图8所示)。当训练次数达到320次时,满足基于预测结果与输入‑目标时序样本相似度比对方法的判定条件。
[0064] 综上,当训练次数达到320次时,同时满足基于神经网络损失函数方法的判定条件和基于预测结果与输入‑目标时序样本相似度比对方法的判定条件,因此判定训练状态完成。最终,给出训练状态完成后的目标样本(如图9所示)与预测结果(如图10所示)。