首页 / 有向图深度神经网络径流概率预报方法、系统、设备及终端

有向图深度神经网络径流概率预报方法、系统、设备及终端有效专利 发明

技术领域

[0001] 本发明属于水文水资源技术领域,尤其涉及一种有向图深度神经网络径流概率预报方法、系统、设备及终端。

相关背景技术

[0002] 目前,准确可靠的径流预报,能为水库群调度决策提供有益的数据依据,对于增加发电效益、降低防洪风险、提升水资源综合利用效益具有重大意义。随着计算机技术的发展,支持向量机回归、神经网络、长短期记忆网络等机器学习和深度学习方法在径流预报中展现出了优秀的性能。然而,这一类基于统计的黑箱模型往往存在一下两点缺点:一是黑箱模型仅仅是数据与数据之间的传输,其模型参数在水文径流产生的过程中没有较好的物理
解释;二是传统的预报模型仅预报一个单点值,无法量化预报中的不确定性。因此,如何建立具有一定物理意义的统计学习模型,并使其具有区间预测和概率预测的能力来量化预报
不确定性是亟需解决的理论和实际工程问题。
[0003] 通过上述分析,现有技术存在的问题及缺陷为:
[0004] (1)现有基于统计的黑箱模型仅仅是数据与数据之间的传输,其模型参数在水文径流产生的过程中没有较好的物理解释。
[0005] (2)传统的预报模型仅预报一个单点值,无法量化预报中的不确定性。
[0006] 解决以上问题及缺陷的难度为:一般的统计模型仅仅只是单纯考虑输入输出数据的相关性,难以建立一种考虑水文物理过程的模型;径流预报误差存在“非正态”、“异方差”的特性,难以用一般的高斯分布量化预报的不确定性。
[0007] 解决以上问题及缺陷的意义为:将深度学习模型往概念性水文模型发展,提高水文预报精度的同事,给出合理的参数解释;此外,量化径流预报的不确定性,为水库调度决策提供了更为丰富、可靠的预报信息,有助于调度决策者合理分配水资源。

具体实施方式

[0063] 为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
[0064] 针对现有技术存在的问题,本发明提供了一种有向图深度神经网络径流概率预报方法、系统、设备及终端,下面结合附图对本发明作详细的描述。
[0065] 如图1所示,本发明实施例提供的有向图深度神经网络径流概率预报方法包括以下步骤:
[0066] 步骤1,构建水文站点与气象站点有向图结构;
[0067] 步骤2,根据多站点有向图,结合空间信息捕捉过程和特征聚合过程两个过程建立有向图深度神经网络预报模型;
[0068] 步骤3,构建由预报径流和其预报因子组成的数据集,采用Adam优化算法训练有向图深度神经网络,得到具有高精度的多步长径流预报结果;
[0069] 步骤4,将有向图深度神经网络得到的预报结果与实测径流值重新构建隐含马尔科夫回归训练数据集;
[0070] 步骤5,训练隐含马尔科夫回归模型,得到径流概率预报结果。
[0071] 如图2所示,本发明实施例提供的径流概率预报系统包括:
[0072] 有向图结构构建模块1,用于构建水文站点与气象站点有向图结构;
[0073] 预报模型构建模块2,用于根据多站点有向图,结合空间信息捕捉过程和特征聚合过程两个过程建立有向图深度神经网络预报模型;
[0074] 预报模型优化模块3,用于构建由预报径流和其预报因子组成的数据集,采用Adam优化算法训练有向图深度神经网络,得到具有高精度的多步长径流预报结果;
[0075] 训练数据集构建模块4,用于将有向图深度神经网络得到的预报结果与实测径流值重新构建隐含马尔科夫回归训练数据集;
[0076] 径流概率预报模块5,用于通过训练隐含马尔科夫回归模型,得到径流概率预报结果。
[0077] 下面结合具体实施例对本发明的技术方案作进一步描述。
[0078] 实施例
[0079] 本发明实施例提供的基于有向图深度神经网络的有向图深度神经网络径流概率预报方法,包括以下步骤:
[0080] 步骤1.构建水文站点与气象站点有向图结构;
[0081] 步骤2.根据多站点有向图,结合空间信息捕捉过程和特征聚合过程两个过程建立有向图深度神经网络预报模型;
[0082] 步骤3.构建由预报径流和其预报因子组成的数据集,采用Adam优化算法训练有向图深度神经网络,得到具有高精度的多步长径流预报结果;
[0083] 步骤4.将有向图深度神经网络得到的预报结果与实测径流值重新构建隐含马尔科夫回归训练数据集;
[0084] 步骤5.训练隐含马尔科夫回归模型,得到径流概率预报结果。
[0085] 步骤1.构建水文站点与气象站点有向图结构。
[0086] 本发明实例以长江上游水文站点和气象站点为研究对象,将每个水文站点和气象站点作为有向图中的点;根据水文站点和气象站点所在流域中的区域以及水文站点之间的
上下游关系确定每个水文站点与其他水文站点以及气象站点的关系,将具有因果关系的点
用向量连接;将所有的点和向量构成有向图,如图3所示。
[0087] 步骤2.根据多站点有向图,结合空间信息捕捉过程和特征聚合过程两个过程建立有向图深度神经网络预报模型。
[0088] 本发明的有向图深度神经网络模型主要由空间信息捕捉过程和特征聚合过程组成。其中,空间信息捕捉过程由多个卷积层和一个全连接层组成,主要目的在于通过卷积操作捕捉区域范围内的降雨对水文站点径流的影响,这一过程可以看作水文模型中的降雨产
流模型。空间信息捕捉过程可表述如下:
[0089]
[0090]
[0091]
[0092] 其中,v=1,…,NI为水文站点的索引,L为该过程的网络层数, 代表地v个水文站点空间信息捕捉过程中的第i层,SP(v)表示降雨量影响到第v个水文站点的气象站点集
合,Pu表示第u个气象站点的降雨信息,Conv1D()表示卷积操作,fi为第i层输出空间的维
度,ki为卷积窗口的长度,si为卷积的步长,σ()表示全连接层的激活函数,本发明采用线性激活函数,Wv为全连接层的权重,bv为全连接层的偏置向量。
[0093] 特征聚合过程则是由多层感知网络组成,其目标在于建立卷积神经网络捕捉的降雨特征以及上游径流特征与当前水文站点径流的非线性关系,这一过程可以看作水文模型
中的汇流过程。特征聚合过程可表述如下:
[0094]
[0095]
[0096]
[0097] 其中,L’为特征聚合过程的网络层数, 代表地v个水文站点特征聚合过程中的第i层,SI(v)表示影响到第v个水文站点的上游水文站点集合,Iv表示第v个水文站点的前
期径流信息, 为第i个隐含层的权重, 为第i个隐含层的偏置向量,δ()表示隐含层的
激活函数,本发明采用Sigmoid激活函数,Wtar为全连接层的权重,btar为全连接层的偏置向量,σ()输出层的激活函数,本发明采用线性激活函数。
[0098] 步骤3中.构建由预报径流和其预报因子组成的数据集,采用Adam优化算法训练有向图深度神经网络,得到具有高精度的多步长径流预报结果。
[0099] 预报因子为所有水文站点和气象站点前期实测径流数据和降雨数据,预报值为目标站点未来径流值,由预报因子和预报值组成的训练集可表示如下:
[0100] D1=[X,Y]
[0101]
[0102] yt=[Itar,t+1,...,Itar,t+C]
[0103] 其中,D1为有向图深度神经网络模型的训练集,X为训练集的预报因子X=[Xt,…,XT],Y为训练集的预报值Y=[yt,…,yT],T为训练集总时长,J为预报因子的前期步长,C为预报步长,Iv,t表示第v个水文站点在t时段的径流,Pu,t为第u个气象站点在t时段的降雨,NI为水文站点总个数,NP为气象站点总个数,tar为预报目标站点。
[0104] 构建完数据集后,对数据进行归一化处理,设置有向图深度神经网络的参数,包括每个空间信息捕捉过程的卷积层个数和全连接层节点数,多层感知网络的感知层个数、隐藏层节点数以及输出层节点数,网络学习率,训练代数。采用结合Adam优化算法在训练集上训练有向图深度神经网络,迭代优化模型参数。根据训练后的有向图深度神经网络模型,得tar
到多步长径流预报结果Y 。
[0105] 步骤4.将步骤3中训练集有向图深度神经网络得到的预报径流结果Ytar和实测径tar
流Y组合成隐含马尔科夫回归的训练集D=[Y ,Y]。
[0106] 步骤5.训练隐含马尔科夫回归模型,得到径流概率预报结果。
[0107] 隐含马尔科夫回归主要由隐含马尔科夫模型和概率预报两部分组成,首先采用Baum‑Welch算法训练隐含马尔科夫模型参数。隐含马尔科夫模型的隐含变量与观测变量的联合概率分布表示如下:
[0108]
[0109] 其中,D2为所有观测序列;Z=[z1,...,zT]为所有时刻下的隐含状态变量;θ表示隐含马尔科夫模型所有待训练的参数:π=[π1,...,πK]为先验概率,πk代表在状态k下的先验概率,K为模型组件个数;A为K×K的状态转移概率矩阵,其中Aij代表从i状态转移到j状态的转移概率,φ=[φ1,...,φK]为观测模型的参数,φk表示第k个观测模型的参数。观测变量的条件概率分布定义为p(dt|zt=k,φk)。当采用多元高斯分布作为观测模型时,此条件概率分布为:
[0110] p(dt|zt=k,φk)=N(dt|μk,∑k)
[0111] 其中,μk为第k个状态下观测值的均值向量,∑k为第k个状态下观测值的协方差矩阵。
[0112] 采用EM算法迭代优化模型的参数θ={π,A,φ},得到训练后的隐含马尔科夫模型。然后根据高斯联合概率分布的性质、概率乘法公式以及贝叶斯公式推理得到给出预报因子
后的预报值的条件概率密度函数,如下式:
[0113]
[0114] 其中, 为预报值的条件概率密度函数; 为预报因子和预报值的联合概率密度函数;p(yt)为预报因子y的边缘概率密度函数,ht(k)为为前向概率,可通过前向‑后向算法得到; 和 分别为预报因子在第k个观测模型的均值向量和协方差
矩阵; 和 分别为预报值在第k个观测模型的条件均值向量和协方差矩阵。
[0115] 本发明以长江上游宜昌站水文站位预报对象,宜昌站以上水文站点和气象站点为预报因子,采用1970年至1997年的日均数据为训练集,1998年至2004年日均数据为测试集,对宜昌站点未来三天日径流做出预报,按照图2所示的有向图深度神经网络的有向图深度
神经网络径流概率预报方法进行预测。以下采用均方根误差(Root Mean Square Error,
RMSE)以及纳什系数(Nash‑Sutcliffe efficiency coefficient,NSE)两个评价指标评估
预报方法的性能,并分析概率预报的不确定性。
[0116] 表1和表2分别给出有向图深度神经网络(DGDNN)模型、长短期记忆神经网络模型(LSTM)、门控制循环单元模型(GRU)以及神经网络模型(ANN)的RMSE和NSE评价指标值。RMSE指标值越小越好,NSE是一个相对值,其范围在负无穷到1之间,越接近于1,代表预报值与实测径流值越接近。从表1和表2可以看出,采用提出的有向图深度神经网络预报的方法比其
他对比模型的预报精度更高,具有优越的预报性能。
[0117] 表1四种模型未来三天径流预报的RMSE值
[0118]
[0119] 表2四种模型未来三天径流预报的NSE值
[0120]
[0121] 在预报精度评价的基础上,进一步对预报的不确定性进行分析。图4以时间轴为横坐标,预报径流区间以及观测径流值为纵坐标,展示了概率预报的95%、70%置信区间。从图中可以明显的看出预报区间在汛期的宽度普遍大于预报区间在枯水期的宽度,代表径流
预报在汛期的不确定性要大于枯水期的不确定性。图5以预报均值为横坐标,展示了概率预报的95%、70%置信区间,从图中可以明显的看出置信区间随着预报均值的增加呈变宽的
趋势,这一现象证明了本发明的概率预报较好的描述了预报不确定性“异方差”这一特性。
综上所述,图4和图5证明了本发明能够有效的估计不同调度时期的径流预报不确定性,因
此能够为调度决策提供可靠的径流概率预报值。
[0122] 表3给出了部分日期下,DGDNN、LSTM、GRU、ANN预报径流与实际径流的实验数据。
[0123] 表3DGDNN、LSTM、GRU、ANN预报径流与实际径流的实验数据
[0124]
[0125]
[0126] 在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上;术语“上”、“下”、“左”、“右”、“内”、“外”、“前端”、“后端”、“头部”、“尾部”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对
本发明的限制。此外,术语“第一”、“第二”、“第三”等仅用于描述目的,而不能理解为指示或暗示相对重要性。
[0127] 在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用全部或部分地以计算机程序产品的形式实现,所述计算机程序产品包括一个或
多个计算机指令。在计算机上加载或执行所述计算机程序指令时,全部或部分地产生按照
本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网
络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一
个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输)。所述计算机可读取存储介质可以是计算机能够存取的任何可用介质或者是包含一
个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介
质(例如软盘、硬盘、磁带)、光介质(例如DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
[0128] 以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,都应涵盖在本发明的保护范围之内。

当前第1页 第1页 第2页 第3页
相关技术
径流概率相关技术
方法系统相关技术
刘永琦发明人的其他相关专利技术