技术领域
[0001] 本发明属于数据处理技术领域,具体涉及一种基于ST‑LSTM和Swin‑Transformer联合应用的风场智能化预报方法和系统。
相关背景技术
[0002] 在风能发电并网过程中,为了提高稳定性和减少弃风量,研究人员一直希望能准确地预报风速/功率。在过去的几十年里,大量的相关模型得到了开发与应用,包括统计模型、物理模型和人工智能模型。
[0003] 统计模型往往也被称之为基于时间序列的预报方法,在历史风速数据和实际产生的风速之间建立一种关系,该方法易于建模且成本低廉,但难以预报风速的非线性和非平稳特性,准确度有限;物理模型主要是数值天气预报,输入一个包含气压、气温和风场等大量气象要素的初始场,通过对大气动力学偏微分方程的求解,预报未来的天气状况,该方法是目前天气预报业务采用的最主要手段,准确度较高、可解释性较强,但计算过程非常复杂,需要大量的计算资源和时间成本;人工智能模型其实是传统统计模型的一种更优的替代方法,也是通过历史的风场数据来预报未来的风场变化,其准确度高、计算效率高,但可解释性较弱,且模型迭代过程中预报结果的累积误差也会逐渐增大,预报结果会逐渐平滑、空间分辨率降低。
[0004] 在人工智能模型的基础上,近年来,越来越多的机构推出了AI气象大模型,逐步解决了传统人工智能模型预报精度不及数值模式预报的世界性难题,且相比于数值模式预报有着更高的运行速度,可完成对全球气象的秒级预测。FourCastNet作为全球首个完全由数据驱动的全球中尺度AI气象大模型,能够以较高准确性预测长达一周的地面风速和降水量等关键变量。华为团队研发的“盘古”大模型通过使用3D Earth‑Specific Transformer和层次化预报技术,在预报准确性上首次超越了IFS,并且支持广泛的应用场景,例如台风路径实时预报、集合预报。DeepMind团队研发的GraphCast使用图神经网络的自回归模型,在252个预报任务中,以99.2%的准确率超越了PangGu‑Weather的预报结果。上海人工智能研究院开发的“风乌”模型,基于多模态和多任务深度学习方法,实现了高分辨率下对关键大气变量超过10天的有效预报,并在80%的评估指标上超过了GraphCast。这些基于数据驱动的全球天气预报模型基于海量气象数据,提供全球常规气象要素的中期预报,空间分辨率能达到0.25°。AI气象大模型相较于传统人工智能模型具有更高的准确率和计算效率,但其预报范围覆盖全球,空间分辨率在全球范围来说尚且合适,但针对更小的局地区域则明显不足以满足精细化预报需求;风场预报结果虽指标表现较好,但从预报场的空间分布来看存在显著的平滑现象,难以预报大风事件和极端事件。
具体实施方式
[0042] 下面将参考附图并结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
[0043] 以下详细说明均是示例性的说明,旨在对本发明提供进一步的详细说明。除非另有指明,本发明所采用的所有技术术语与本申请所属领域的一般技术人员的通常理解的含义相同。本发明所使用的术语仅是为了描述具体实施方式,而并非意图限制根据本发明的示例性实施方式。
[0044] 实施例一
[0045] 参见图1,一种基于ST‑LSTM和Swin‑Transformer联合应用的风场智能化预报方法,包括以下步骤:
[0046] 构建基于ST‑LSTM的时序预测模型;
[0047] 将风场历史数据输入基于ST‑LSTM的时序预测模型获得未来风场预报数据;
[0048] 构建基于Swin Transformer架构的风场空间降尺度模型;
[0049] 将风场预报数据输入基于Swin Transformer架构的风场空间降尺度模型得到风场精细化预报数据。
[0050] 基于ST‑LSTM和Swin‑Transformer联合应用的风场智能化预报方法能够显著提升预测精度、增强模型泛化能力、提高计算效率、增强可视化与解释性,并满足实时性和稳定性的要求。有利于为风场预报提供更加可靠、高效和智能的解决方案。
[0051] 基于ST‑LSTM的时序预测模型的构建方法包括如下步骤:
[0052] 利用再分析风场数据样本集通过ST‑LSTM和GRU构建时序预测模型,采用分层时间聚合策略的训练架构训练时序预测模型得到的最优模型为基于ST‑LSTM的时序预测模型;
[0053] 基于Swin Transformer架构的风场空间降尺度模型构建方法包括如下步骤:
[0054] 利用数值模拟数据样本集通过Swin Transformer架构构建风场空间降尺度模型,采用损失函数训练空间降尺度模型得到的最优模型为基于Swin Transformer架构的风场空间降尺度模型。
[0055] 再分析风场数据样本集中的数据采用ERA5再分析风场数据,再分析风场数据样本集划分为再分析测试集、再分析验证集和再分析训练集;再分析测试集为再分析风场数据样本集中每个月随机两天的数据,再分析验证集为再分析风场数据样本集中除再分析测试集的数据中每个月随机两天的数据,再分析训练集为再分析风场数据样本集中除再分析验证集的数据中每个月随机两天的数据。
[0056] 分层时间聚合策略的训练架构使用贪婪算法限制针对预测目标最小的迭代次数;训练基于ST‑LSTM的时序预测模型时的损失函数采用mse、mae和感知损失,感知损失使用VGG16提取特征;训练基于ST‑LSTM的时序预测模型时的归一化采用normalize和LayerNorm函数;训练基于ST‑LSTM的时序预测模型时的优化采用Adam优化器;训练基于ST‑LSTM的时序预测模型时的学习率采用ReduceLROnPlateau学习率调度器动态调整。
[0057] 数值模拟数据样本集划分为数值模拟测试集、数值模拟验证集、数值模拟训练集,数值模拟测试集为数值模拟数据样本集中随机天数的数据,数值模拟验证集为数值模拟数据样本集中除数值模拟测试集的数据中随机天数的数据,数值模拟训练集为数值模拟数据样本集中除数值模拟验证集的数据中随机天数的数据。
[0058] 基于Swin Transformer架构的风场空间降尺度模型包括浅层特征提取、深特征提取和高分辨率风场重建,浅层特征提取使用卷积层提取浅层特征,并通过长跳跃连接直接传输到高分辨率风场重建;
[0059] 深度特征提取使用RSTB块提取深度特征传输到高分辨率风场重建,每个RSTB块利用多个Swin Transformer层进行局部注意力计算和跨窗口交互,每个RSTB块的末尾使用残差连接一个卷积层;
[0060] 高分辨率风场重建融合浅层特征和深层特征。
[0061] 训练基于Swin Transformer架构的风场空间降尺度模型时的损失函数采用L1损失;训练基于Swin Transformer架构的风场空间降尺度模型时的优化采用Adam优化器;训练基于Swin Transformer架构的风场空间降尺度模型时的学习率采用ReduceLROnPlateau学习率调度器动态调整。
[0062] 实施例二
[0063] 参见图2,一种基于ST‑LSTM和Swin‑Transformer联合应用的风场智能化预报系统,包括时序预测模型构建模块,用于构建基于ST‑LSTM的时序预测模型;
[0064] 未来风场预报模块,用于将风场历史数据输入基于ST‑LSTM的时序预测模型获得未来风场预报数据;
[0065] 风场空间降尺度模型构建模块,用于构建基于Swin Transformer架构的风场空间降尺度模型;
[0066] 风场精细化预报模块,用于将风场预报数据输入基于Swin Transformer架构的风场空间降尺度模型得到风场精细化预报数据。
[0067] 实施例三
[0068] 参见图3,一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现所述的一种基于ST‑LSTM和Swin‑Transformer联合应用的风场智能化预报方法。
[0069] 实施例四
[0070] 一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现所述的一种基于ST‑LSTM和Swin‑Transformer联合应用的风场智能化预报方法。
[0071] 实施例五
[0072] 一种基于ST‑LSTM和Swin‑Transformer联合应用的风场智能化预报方法,具体步骤如下:
[0073] (1)步骤一:数据集制作。
[0074] ERA5是欧洲中期天气预报中心(ECMWF)开发的第五代全球气候再分析数据集。这个数据集提供了从1950年至今的高分辨率(包括时间分辨率和空间分辨率)大气、海洋、陆地表面和次表面的气象变量的估计值。ERA5数据集是基于大量观测数据(如卫星观测、无线电探空仪、地面站观测等)以及先进的数值天气预报模型(NWP)的集成结果。ERA5提供了多种不同的空间和时间分辨率的数据,例如水平分辨率可以达到0.25°(约31公里)或更高,时间分辨率可以是每小时或更短。该数据集涵盖了大量的气象和气候变量,包括但不限于温度、湿度、风速、风向、降水、辐射、气压、海表面温度等。ERA5覆盖了从1950年(有些变量可能更早或稍晚)至今的数据,为气候研究、历史天气分析、环境科学等多个领域提供了宝贵的数据资源。ERA5数据集是一个动态更新的系统,新的观测数据和模型预测结果会不断被整合到数据集中,以提供更加准确和最新的气候信息。
[0075] 针对时序预测模型,本实施例采用ERA5再分析风场数据来制作样本集,共使用了2017~2018两年的数据进行取样,每个月随机选出2天作为测试集样本TS1,剩余样本中再每个月随机选出2天作为验证集样本VL1,此时的剩余样本为训练集样本TR1。为满足分层时间聚合策略的需求,时序预测模型的样本集分为3种,输入数据均为过去6小时的风场分别预报第1、3、6小时 如图1所示。D表示风
场数据,下标表示时间,上标表示空间分辨率。
[0076] 针对智能空间降尺度模型,本实施例采用数值模拟数据来制作样本集,共使用了2017~2018两年的数据进行取样,随机选出120天作为测试集样本TS2,剩余样本中再随机选出90天作为验证集样本VL2,此时的剩余样本为训练集样本TR1。输入数据为0.25°的数值模拟风场数据 输出数据为0.125°的数值模拟风场数据
[0077] (2)步骤二:时序预测模型构建与训练。
[0078] ST‑LSTM是RNN(Recurrent Neural Network,循环神经网络)的一种扩展。具体来说,ST‑LSTM在LSTM(Long Short‑Term Memory,长短期记忆网络)的基础上引入了空间维度的处理能力,使其能够同时捕捉数据中的时间特征和空间特征。RNN是一类专门用于处理序列数据的神经网络结构,它通过循环结构能够捕捉序列数据中的时序信息和上下文信息。然而,传统的RNN在处理长序列时容易遇到梯度消失或梯度爆炸的问题,导致模型难以训练。为了克服这些问题,研究人员提出了LSTM等改进模型。LSTM通过引入遗忘门、输入门和输出门等结构来控制信息的传递和遗忘过程,从而有效地缓解了梯度消失和梯度爆炸的问题,并在长序列任务中表现出色。而ST‑LSTM则是在LSTM的基础上进一步扩展,引入了空间维度的处理能力。这使得ST‑LSTM能够同时处理时空序列数据,即同时考虑数据在时间上的变化和空间上的分布。在实际应用中,ST‑LSTM已经被用于多种时空预测任务,如交通流量预测、气象预报等,并取得了较好的效果。
[0079] 基于递归神经网络(RNN)构建时序预测模型,引入门控循环单元(GRU)来更好地控制信息流,允许模型学习长期依赖关系,有助于提高模型的预测准确性。与时空序列预测的常用模型ConvLSTM相比,本案例采用的时空长短时记忆单元(ST‑LSTM),它由两个记忆单元组成,能够同时提取和记忆空间和时间表示,一个是传统LSTM包含的时间记忆单元,另一个是捕捉相邻帧之间空间依赖关系的时空记忆单元。时空记忆单元旨在通过增加时间相邻RNN状态之间的非线性神经元的深度,在短邻域内学习复杂的转换函数。与简单的记忆拼接不同,ST‑LSTM单元对两种记忆类型使用共享的输出门,实现了无缝的记忆融合,可以有效地对时空序列中的形变和运动轨迹进行建模。
[0080] ST‑LSTM(时空长短时记忆单元)是一种特殊的LSTM(长短期记忆网络)变体,它特别设计用于处理时空序列数据,如视频、雷达图像等。ST‑LSTM通过引入时空记忆单元和时间记忆单元,以及它们之间的交互机制,来捕捉数据中的空间和时间依赖关系。时空记忆单元(Spatiotemporal Memory Unit)主要负责捕捉相邻帧之间的空间依赖关系。在视频处理中,这意味着它能够理解和建模帧内像素或特征之间的空间关系,以及这些关系如何随时间变化。时空记忆单元通过跨层的垂直传播(即在不同RNN层之间传递信息)来实现这一点。它允许信息在垂直方向上流动,从而在不同层次的网络结构中共享和整合空间信息。这种机制使得ST‑LSTM能够更全面地理解时空序列数据的复杂结构,提高模型对空间变化和时间演变的建模能力。时间记忆单元(Temporal Memory Unit)则负责捕捉序列数据中的时间依赖关系。它类似于传统LSTM中的记忆单元,通过水平传播(即在同一RNN层内的时间步之间传递信息)来更新和维持状态。时间记忆单元保证了模型能够处理长期的时间依赖关系,避免在处理长序列数据时出现的梯度消失或梯度爆炸问题。与时空记忆单元相结合,时间记忆单元使得ST‑LSTM能够同时捕捉空间和时间上的复杂依赖关系,从而在处理时空序列数据时表现出色。共享输出门(Shared Output Gate)在ST‑LSTM中,时空记忆单元和时间记忆单元共享一个输出门。这意味着输出门的决策同时考虑了时空记忆和时间记忆的状态,从而生成一个综合的输出表示。共享输出门的设计简化了模型结构,减少了参数数量,并有助于模型在生成输出时综合考虑空间和时间信息。通过共享输出门,ST‑LSTM能够更有效地控制从记忆单元中输出信息的数量和质量,从而提高模型的预测准确性和泛化能力。
[0081] 分层时间聚合策略是一种数据管理技术,特别是在处理时间序列数据时显得尤为有效。该策略的核心思想是将时间序列数据按照不同的时间间隔进行聚合,以便于不同级别的数据分析和存储。分层时间聚合策略将时间按照层级进行划分,例如年、季度、月、周、日等,每个层级都包含下一层级的时间,并且每个层级的时间范围是固定的。通过这种层级划分,可以实现多个时间粒度的数据分析和查询。实施分层时间聚合策略通常包括以下几个步骤:首先收集需要处理的时间序列数据。根据实际需求将时间划分为不同的层级,如年、季度、月、周、日等。按照划分的时间层级对数据进行聚合处理。根据需要对聚合后的数据进行分析和查询。
[0082] 采用分层时间聚合策略的训练架构如图2所示,本实施例训练3个独立的模型,分别进行未来第1个小时、3、6个小时的预测;在推理阶段,给定一个预测目标,可以使用贪婪算法来保证最小的迭代次数。例如,对于未来第12个小时的预报,执行2次6小时预测;而对于未来第10个小时的预报,执行1次6小时预测、1次3小时预测和1次1小时预测。损失函数结合mse、mae和感知损失,其中感知损失使用的是VGG16提取特征,模型采用normalize和LayerNorm函数进行归一化,采用Adam优化器,初始学习率为0.001,使用ReduceLROnPlateau学习率调度器动态调整学习率,调度器的耐心值为10、衰减因子为0.5,训练周期数为100,收敛后的最优模型称为M1。
[0083] (3)步骤三:智能空间降尺度模型构建与训练。
[0084] 风场空间降尺度模型结构如图3所示,包括浅特征提取、深特征提取和高分辨率风场重建三部分内容。浅层特征提取使用卷积层提取浅层特征,并通过长跳跃连接将其直接传输到高分辨率风场重建部分,以保留低频信息。深度特征提取主要由带有残差连接的Swin Transformer块(RSTB)组成,每个块利用多个Swin Transformer层进行局部注意力计算和跨窗口交互。每个RSTB块的末尾添加了一个卷积层以增强特征,并使用残差连接为特征聚合提供快捷方式。最后,在重建部分中融合了浅层和深层特征,实现了高分辨率的风场重建。该模型的优势在于其使用的Swin Transformer架构,能够有效地捕获长期依赖关系和全局上下文信息,这对于空间降尺度任务至关重要。
[0085] 训练空间降尺度模型时损失函数为L1损失,采用Adam优化器,初始学习率为0.001,使用ReduceLROnPlateau学习率调度器动态调整学习率,调度器的耐心值为5、衰减因子为0.5,训练周期数为200,收敛后的最优模型称为M2。
[0086] (4)步骤四:模型验证及应用。
[0087] 通过步骤二和步骤三分别得到M1和M2后,可利用预留的测试集分别测试两个模型的准确度。利用步骤一中的TS1对M1进行测试和评估,U分量的平均绝对误差为0.828m/s,平均均方根误差为1.140m/s;V分量的平均绝对误差为0.903m/s,平均均方根误差为1.266m/s。利用步骤一中的TS2对M2进行测试和评估,U分量的平均绝对误差为0.067m/s,平均均方根误差为0.123m/s;V分量的平均绝对误差为0.071m/s,平均均方根误差为0.129m/s。
[0088] 在实际业务场景的应用中,本实施例所提出的方法流程如图4所示,首先将空间分辨率0.25°的风场历史数据输入M1中,得到未来12小时的风场预报数据;然后再将0.25°的风场预报数据输入至M2中,得到0.125°的风场精细化预报数据。
[0089] 本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD‑ROM、光学存储器等)上实施的计算机程序产品的形式。
[0090] 本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0091] 这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0092] 这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0093] 最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。