技术领域
[0001] 本发明属于航空发动机的技术领域,具体涉及一种航空发动机燃烧室性能自适应优化调控方法。
相关背景技术
[0002] 航空发动机作为飞机的“心脏”,是飞机的重要部件之一。飞机的总体性能受到发动机工作状态及其性能的影响。随着飞机性能要求的不断提高,对航空发动机也有了更高的要求。燃烧室是航空发动机的三大部件之一,燃烧室的性能会对航空发动机的工作状态和性能产生重要影响。而燃烧室火焰燃烧的稳定性会直接影响燃烧室内的燃烧释热情况,燃烧不稳定的情况下,极易发生燃烧效率降低的情况,并伴随额外的污染物、噪声等,甚至导致严重飞行事故。目前,燃烧室性能指标获取主要依赖于CFD数值模拟或风洞试验生成的空气动力学数据,通过现有的数学模型进行计算,从而得到燃烧室性能指标。由于燃烧室性能计算中涉及到复杂的湍流燃烧和两相流等复杂数值模型,导致计算周期过长,难以实现对燃烧室性能的实时监测。另一方面,传统的燃烧稳定性判断方法,如基于火焰辐射强度、基于压力信号、基于光谱信息等判别方法有较高的成本和门槛,同时航空发动机燃烧室往往面临亚声速甚至超声速的自由流条件,对于燃烧稳定性判别的实时性稳定性提出了更高要求,传统的燃烧稳定性判别方法难以在航空发动机燃烧室中进行应用。
[0003] 此外,在现代智能航空发动机的研发过程中,如何确保燃烧室在全包线、全域内的性能、稳定性、鲁棒性、可靠性达到最优,仍是当前研究的重点。由于燃烧室在工作中会遭遇到大范围的工况变化、显著的非线性特征以及恶劣的工作环境,这些因素都会在飞行过程中引入干扰和未建模动态。因此,所设计的航空发动机控制系统需要极强的鲁棒性。然而,传统的控制方法如PID控制,缺乏根据外界环境变化进行实时自适应控制的能力,强化学习作为机器学习的一种范式,因其强大的策略试错学习能力而越发受到关注,随着深度学习的融入,深度强化学习方法在复杂的控制任务中获得了诸多成功应用。
具体实施方式
[0065] 下面对本发明的具体实施方式进行描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。
[0066] 实施例1
[0067] 本实施例提供一种航空发动机燃烧室性能自适应优化调控方法,可以实现燃烧室燃烧稳定性及性能实时监测,并鲁棒调控油气分布及燃烧流场,确保燃烧室在外部飞行环境动态变化情况下仍能处于最优状态,参考图1和图2,其具体包括以下步骤:
[0068] 步骤S1、针对航空发动机燃烧室构型,并根据燃烧室燃烧组织方式,确定航空发动机燃烧室的多维燃油调控参数和航空发动机的来流参数;
[0069] 具体的,本实施例基于航空发动机燃烧室模型,选择效果优异的燃油分级、燃烧空气分区的分区分级燃烧方式,确定航空发动机燃烧室的多维燃油调控参数和航空发动机的来流参数。其中,燃烧室主预燃级供油方式,主预燃级供油方式包括预燃级供油流量、主燃级供油流量、主预燃级流量分配和分级比;来流参数包括飞行高度、马赫数、进口总温和进口总压。
[0070] 步骤S2、根据多种来流参数工况下的多维燃油调控参数构建高维样本空间,并在设计空间内开展最优拉丁超立方抽样,均匀获取全空间内样本信息,得到样本输入参数,进而进行燃油调控方法对燃烧室性能影响的计算与实验;
[0071] 其中,本实施例最优拉丁超立方抽样方法用于在输入参数样本空间区域内均匀、随机、正交采样,能够用比较少的点获得大量的模型信息,具有良好的空间填充性和均衡性。最优拉丁超立方抽样方法在拉丁超立方抽样方法的基础上以最小化最大距离准则进行了改进。
[0072] 最小化最大距离准则及 准则:最小化最大距离准则是将样本空间内各个样本间的距离都取为在样本空间里可以取到的最大距离:
[0073]
[0074] 式中, 分别为第 和 个样本, 为两样本的距离。
[0075] 步骤S3、基于样本输入参数并结合地面风洞实验数据进行数据同化处理,构建多源数据融合的样本数据集,其具体包括以下分步骤:
[0076] 步骤S31、在燃油调控方法对燃烧室性能影响的实验中,在航空发动机燃烧室的多个典型工况下开展实验获取地面风洞实验数据,实验数据包括燃烧效率、总压损失、燃烧室内温度分布、燃烧室内压力分布,为后续一维计算模型和三维计算模型提供实验样本,进行仿真数据的生成及同化;
[0077] 步骤S32、采用航空发动机燃烧室一维计算模型和三维计算模型计算样本输入参数对应的燃烧室性能参数,具体为输入参数对应的燃烧室性能参数燃烧效率和总压损失以及燃烧室燃烧流场数据,并结合地面风洞实验数据,采用卡尔曼滤波法进行数据同化处理,进行数据样本的扩充,以构建多源数据融合的样本数据集。
[0078] 本实施例的一维计算模型和三维计算模型采用专利一种航空发动机燃烧室的参数多目标优化方法ZL202211675222.4提出的航空发动机燃烧室一维计算模型和三维计算模型,其为公开技术,故在本方案中不再赘述其过程。
[0079] 其中,卡尔曼滤波的线性动态系统模型可如下表示:
[0080]
[0081]
[0082] 式中, 为系统状态矩阵, 为状态阵的观测量, 为状态转移矩阵,为控制输入矩阵, 为状态观测矩阵, 为过程噪声, 为测量噪声, 为时间步k‑1的状态向量, 为控制向量包含了所有外部输入到系统的控制信号。
[0083] 步骤S4、根据多源数据融合的样本数据集,构建基于活性子空间高斯过程回归模型AS‑GPR的燃烧室性能代理模型,参考图3,其具体包括以下内容:
[0084] 本实施例采用数据驱动方式,使用活性子空间模型(AS)和高斯过程回归模型(GPR)相融合的模型构建方法,建立基于活性子空间高斯过程回归模型(AS‑GPR)的燃烧室性能代理模型,其输入为燃烧室供油参数和来流参数,输出为燃烧室性能参数,燃烧室性能参数是燃烧效率以及总压损失。基于先前步骤得到的样本数据集作为模型的驱动数据库,利用活性子空间高斯过程回归模型对所拥有的样本数据集进行特征参数的学习。最终得到燃烧室性能参数与燃烧室输入参数间多维非线性的复杂映射关系,使用该燃烧室性能代理模型进行对指定工况、确定输入参数条件下燃烧室性能参数的预测输出。
[0085] 本实施例利用活性子空间方法对高维输入参数的重要方向进行识别,在降维的活性子空间中构建代理模型可以克服“维度诅咒”,提高预测精度,降低样本需求量,燃烧室性能代理模型总体表示为:
[0086]
[0087] 式中, 为燃烧室性能代理模型得到的燃烧室性能参数; 为高维模型在低维子空间中的映射,即降阶模型部分; 为基于高斯过程回归对非线性系统的建模过程,即回归模型部分; 为均值函数; 为协方差矩阵。
[0088] 降阶模型部分使用活性子空间方法在输入空间中找到最活跃的方向的集合。每个方向对应于原始输入变量的线性组合,称为活性子空间。通过对响应梯度的协方差类矩阵进行特征值分解来识别活性子空间:
[0089]
[0090] 式中, ,…, 是梯度的向量,为输入参数 的维度,是输入 的概率密度函数, 特征向量的正交矩阵,
是由降序特征值组成的对角矩阵。假设第m个特征值同第(m+1)个特征值存在较大差距,即,便将特征值特征向量以m为分界划为两组:
[0091]
[0092] 其中 且 对应前 个特征值对应特征向量的正交矩阵,该矩阵中对应的参数方向相比第二组的方向能引起更大的输出扰动,因此活性子空间定为。
[0093] 回归模型部分利用高斯过程 来建模输出变量的联合分布,并通过条件概率推断来预测新的数据点,通常协方差矩阵由核函数 来确定,一般选用径向基函数作为高斯过程的核函数:
[0094]
[0095] 式中, 和 为该核函数的超参数;均值函数表示了输出变量的整体趋势,协方差函数描述了不同输入变量之间的相关性。
[0096] 同理对于预测值 、 同样满足一个高斯过程,于是就可以得到一组关于 与的联合高斯分布,进而通过联合高斯分布计算得出最终的回归值 的分布:
[0097]
[0098] 其中,均值 表示对输出变量的估计,方差 表示了对估计的不确定度;
[0099]
[0100]
[0101] 后基于上述建立模型进行模型求解,采用最大似然估计完成超参数估值求解,至此完成基于活性子空间高斯过程回归模型AS‑GPR的燃烧室性能代理模型的建立。
[0102] 步骤S5、根据多源数据融合的样本数据集,采用深度学习方法构建基于卷积神经网络的燃烧室燃烧不稳定性预测模型,其具体包括以下分步骤:
[0103] 步骤S51、根据多源数据融合的样本数据集,采用数据结合机理的联合驱动方式,构建在单一来流参数工况下的嵌入物理信息神经网络(PINN)模型,实现单一工况下流场精确预测,参考图4,其具体包括以下内容:
[0104] 具体的,嵌入物理信息神经网络模型包括神经网络和物理模型;
[0105] 神经网络为卷积‑长短时记忆网络(CNN‑LSTM),其以时间空间信息、燃烧室供油参数和来流参数为输入,输出为燃烧室对应温度场与压力场;所构建的CNN‑LSTM包含3个卷积层,1个全连接层和2个LSTM层,其中卷积层后通过添加BN层和激活函数ReLU实现数据的归一化和非线性操作,从而加快模型收敛速率和解决梯度消失的问题。通过CNN‑LSTM能够加强流场时间和空间信息的关注,提取流场的深层特征。
[0106] 物理模型为流体无粘流动原理的欧拉方程;
[0107] CNN‑LSTM主要通过卷积、长短时记忆和全连接建立输入输出数据之间的非线性特征映射关系,无法挖掘流体力学数据中隐藏的物理规律,故本实施例将流体无粘流动原理的欧拉方程嵌入到卷积‑长短时记忆网络中,利用损失函数进行正则化,将隐藏在数据之间的先验知识施加到卷积‑长短时记忆网络中,即得到嵌入物理信息神经网络模型;
[0108] 其中,嵌入物理信息神经网络模型的损失函数 为:
[0109]
[0110]
[0111]
[0112] 式中, 为神经网络的损失; 为欧拉方程的自均方误差,代表无粘流动的特性; 为标签数据结果,为神经网络预测结果,n为每一轮训练迭代次数; 为物理约束方程的误差;
[0113] 神经网络部分决定预测结果和标签的均方误差,属于监督学习。偏微分方程部分不需要标记进行比较,直接找到自己的均方误差,属于无监督学习。该模型使均方误差最小;即使欧拉方程的右无穷趋近于0,然后以正则化形式将 融合到损失函数中,利用损失函数的梯度更新来实现神经网络的迭代优化。
[0114] 在笛卡尔坐标系下,考虑质量、动量和能量守恒的物理约束方程的误差 为:
[0115]
[0116]
[0117]
[0118] 气体的总热力学能为:
[0119]
[0120] 气体的热力学内能为:
[0121]
[0122] 式中,E、F、G为无粘通量; 为一个状态矢量、描述流体的守恒属性;为控制体积内由于非对流原因产生或消失的 的量;u,v,w分别表示x,y,z方向上的速度场;t为时间变量;为压力场;为气体的热力学内能 ; 为声速;为密度场,为比热容比。
[0123] 步骤S52、对来流参数工况进行稀释采样,并基于嵌入物理信息神经网络模型,采用迁移学习方法构建多工况燃烧室流场预测模型,实现多工况燃烧室流场的实时精确预测,其具体包括以下内容:
[0124] 采用迁移学习方法构建多工况燃烧室流场预测模型包括预训练阶段和微调阶段;
[0125] 预训练阶段:在源域中对嵌入物理信息神经网络模型进行预训练,得到并学习源域流场结构信息的底层机制,进而得到单工况燃烧室流场预测模型;
[0126] 微调阶段:对来流参数工况进行稀释采样,并基于稀释采样后的样本数据对单工况燃烧室流场预测模型进行微调,使目标域在从源域中训练得到的知识的基础上进行目标域适应,避免从头开始训练网络,并得到多工况燃烧室流场预测模型。
[0127] 上述源域与目标域区别在于不同来流条件,其拥有相同的学习任务。在本实施例中,首先使马赫数2.0飞行工况为源域,进行预训练得到单工况燃烧室流场预测模型,后在马赫数1.0和1.5飞行工况下稀疏采样,使之作为目标域开展预训练模型微调,得到多工况燃烧室流场预测模型。
[0128] 模型训练过程中设置阶梯状学习率,在预训练过程中使用较大学习率学习流场结构信息,在微调阶段使用较小学习率学习目标域细致信息。通过阶梯状学习率可以增加全局搜索能力和局部开发能力,提高模型训练精度和效率。
[0129] 最终,在高性能服务器上开展训练,通过不断地迭代优化,实现有限工况下燃烧室流场的高精度实时预测、跨时刻超前预测,得到快速、精确的燃烧室流场预测模型,为燃烧室燃烧不稳定性判别奠定基础。
[0130] 步骤S53、在上述燃烧室流场实时精确预测的基础上,构建基于卷积神经网络的燃烧室燃烧不稳定性预测模型,其输入为燃烧室流场预测图像,输出为燃烧室燃烧稳定性判别结果,实现燃烧室燃烧不稳定性的精确判别,参考图5,其具体包括以下内容:
[0131] 燃烧室燃烧不稳定性预测模型通过浅卷积结构获取图像的纹理特征。但随着网络层次的加深,抽象的特征信息导致反向传播过程中梯度的消失,因此采用跳跃式连接的残差结构,解决模型深度造成的梯度消失问题,最终通过上述样本数据集训练,得到基于卷积神经网络的燃烧室燃烧不稳定性预测模型,实现燃烧不稳定性的精确判别,为后续燃烧室自适应优化调控规律研究奠定基础。
[0132] 步骤S6、基于燃烧室燃烧不稳定性预测模型,针对燃烧室燃油调控参数,结合深度强化学习方法得到燃烧室性能自适应优化调控规律,及时有效地抑制燃烧室燃烧不稳定性情况以提升燃烧室工作性能;并嵌入燃烧室性能代理模型,根据深度强化学习智能体模块的决策动作实时预测燃烧性能变化情况;最终实现航空发动机燃烧室燃烧稳定性及性能实时监测、强鲁棒控制和高性能工作运行,其具体包括以下内容:
[0133] 步骤S61、基于燃烧室燃烧不稳定性预测模型,结合改进深度强化学习方法,针对燃烧室燃油调控参数,构建燃烧室性能自适应优化调控规律系统,及时抑制燃烧室燃烧不稳定性情况,得到保持燃烧稳定的供油参数,实现强鲁棒控制和高性能工作运行,参考图6和图7,其具体包括以下内容:
[0134] 采用改进深度确定性策略梯度(DDPG)算法,进行调控规律寻优。DDPG算法使用批量次的数据对仿真智能体进行训练,最终训练出合适的强化学习智能体,智能体根据环境改变而更新策略,更新评判。融合长短期记忆网络(LSTM)对执行者‑评论家网络进行改进,增强对燃烧不稳定性动态行为的时间序列数据处理能力。
[0135] 具体的,本实施例搭建航空发动机燃烧室性能自适应优化调控规律系统,主要包括发动机燃烧室燃烧不稳定性预测模型、初始化参数输入模块、燃烧室不稳定性输出模块、强化学习智能体模块、智能体与环境间的数据交互模块、智能体与燃烧室交互的观测值模块、环境检测模块和控制目标输入模块。
[0136] 燃烧室燃烧不稳定性模型使用航空发动机燃烧室数据所创建的融合物理信息,输出为燃烧不稳定性预测结果。
[0137] 强化学习智能体模块基于执行者‑评论家(AC)框架,继承了深度Q网络(DQN)算法,利用神经网络拟合值函数的思想和确定性策略梯度(DPG)算法,并融入DQN算法中的经验回放机制,通过将训练轨迹以( , , , )的形式进行存储并按一定规则采样回放来消除数据之间的关联,进而加快算法的收敛;其中, 、 、 分别为t时刻系统的状态、动作与回报, 为系统在状态 下采取动作 后于t+1时刻获得的新状态。
[0138] 动作网络(actor网络) 用于根据系统状态 确定应采取动作 ,其中为actor网络参数。评价网络(critic网络) 则用于实现对于当前状态 下采取某一动作 的优劣程度的评判,即输出动作‑状态价值函数 ,其中 为critic网络参数。DDPG算法在当前网络的基础上增加一个可提供相对固定网络更新目标的同参数网络来增强学习的稳定性,在算法的训练过程中共需对4个神经网络进行参数更新,即actor网络 、目标actor网络 、critic网络 和目标critic网络 。
[0139] actor网络参数的更新基于DPG算法,通过最大化Q( , )的期望 来获得以其为评价指标的最优策略。根据策略梯度定理,沿着梯度 上升的方向更新 可获得当前状态下使价值函数最大的动作,即最优动作。critic网络的训练则是基于Q学习算法的思想,即以最小化损失函数 为目标,沿着梯度 下降的方向更新 ,从而使网络可用于近似表达价值函数;具体的网络优化目标如下式所示:
[0140]
[0141] 式中: 为策略评估目标函数; 为状态‑动作对的值函数,表示在状态 下采取动作 的预期回报; 为基于参数 的策略,决定了在状态 下采取的动作 ; 为状态‑动作对的值函数,表示在状态 下采取由 决定的动作 的预期回报; 为策略优化的目标函数; 为即时奖励; 为价值函数
的估计值; 为critic网络的值函数; 为critic网络参数;E为数学期望;为折扣系数; 、 分别为t时刻系统的状态、动作, 为系统在状态 下采取动作 后于t+1时刻获得的新状态; 为下一个状态的最大值函数。
[0142] 智能体与环境间的数据交互模块则主要包括计算奖励值模块、计算观测值模块、训练回合结束条件模块。
[0143] 智能体与燃烧室交互的计算奖励值模块侧重于燃烧稳定性并使性能指标达到最优,计算观测值模块主要以预测模型的输出燃烧不稳定判别结果为主,当燃烧室的燃烧不稳定判别结果满足条件时,训练回合结束,不满足条件则训练继续。
[0144] 本实施例初始化参数输入模块将发动机燃烧室的初始状态以及运行条件参数传输给燃烧室燃烧不稳定性预测模型;控制目标输入模块将约束条件输入给强化学习智能体模块以完成奖励函数以及训练回合结束条件的设置;强化学习智能体模块根据执行动作的策略,输出动作指令作为燃烧室燃烧不稳定性预测模型的输入;燃烧室燃烧不稳定性预测模型通过燃烧室不稳定性输出模块将动作奖励回馈信号、燃烧不稳定性判别结果和训练目标条件输入至强化学习智能体模块,智能体与燃烧室燃烧不稳定性预测模型在交互中获得最优的燃烧室系统供油参数输入。
[0145] 利用强化学习完成航空发动机燃烧室优化智能体的训练后,得到燃烧室调控规律优化器并得到使燃烧室燃烧稳定的供油参数输入。
[0146] 步骤S62、基于步骤S61得到的燃烧室性能自适应优化调控规律系统嵌入燃烧室性能代理模型,根据深度强化学习智能体的决策动作实时预测燃烧性能变化情况,实现航空发动机燃烧室燃烧稳定性及性能实时监测。
[0147] 虽然结合附图对发明的具体实施方式进行了详细地描述,但不应理解为对本专利的保护范围的限定。在权利要求书所描述的范围内,本领域技术人员不经创造性劳动即可做出的各种修改和变形仍属本专利的保护范围。