首页 / 一种基于模型驱动的设备健康等级评估方法及装置

一种基于模型驱动的设备健康等级评估方法及装置实质审查 发明

技术领域

[0001] 本发明涉及设备健康等级评估技术领域,尤其涉及一种基于模型驱动的设备健康等级评估方法及装置。

相关背景技术

[0002] 随着工业设备的规模和复杂度的不断增加,设备维护和管理的难度也随之提升。大型设备的正常运行对工业生产的稳定性和效率至关重要,然而设备故障往往具有隐蔽
性,且发生故障时会造成严重的经济损失。为避免设备突发故障带来的不良影响,预防性维护和设备健康评估已成为工业领域中的研究热点。传统的设备健康评估主要依赖于专家经
验或简单的阈值判断,但随着设备运行数据的复杂性增加,这些方法显得力不从心,难以精准预测设备的健康状态。
[0003] 传统的方法对设备运行数据处理时,通常依赖于预先定义的特征提取方法,缺乏自适应性和灵活性。这导致在处理不同数据分布时,特征提取的效果不够理想。传统的特征提取方法还容易陷入局部最优解,无法全局优化特征表示。此外,传统的分类器在处理复杂数据结构时,受限于其处理能力和表达能力,难以全面捕捉数据中的复杂关系。基于此,传统的模型在复杂数据上的分类精度往往不高。

具体实施方式

[0020] 为使本发明实施例的目的、技术方案和优点更加清楚,以下通过特定的具体实例说明本公开的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本公开的
其他优点与功效。显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施
例。本公开还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节
也可以基于不同观点与应用,在没有背离本公开的精神下进行各种修饰或改变。需说明的
是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于
本公开保护的范围。
[0021] 需要说明的是,下文描述在所附权利要求书的范围内的实施例的各种方面。应显而易见,本发明中所描述的方面可体现于广泛多种形式中,且本发明中所描述的任何特定
结构及/或功能仅为说明性的。基于本公开,所属领域的技术人员应了解,本发明中所描述的一个方面可与任何其它方面独立地实施,且可以各种方式组合这些方面中的两者或两者
以上。举例来说,可使用本发明中所阐述的任何数目个方面来实施设备及/或实践方法。另外,可使用除了本发明中所阐述的方面中的一或多者之外的其它结构及/或功能性实施此
设备及/或实践此方法。
[0022] 还需要说明的是,以下实施例中所提供的图示仅以示意方式说明本公开的基本构想,图式中仅显示与本公开中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘
制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。另外,在以下描述中,提供具体细节是为了便于透彻理解实例。然而,所属领域的技术人员将理解,可在没有这些特定细节的情况下实践所述方面。
[0023] 本发明实施例提供一种基于模型驱动的设备健康等级评估方法及装置,能够根据数据分布的变化,自适应地调整模型参数,准确地捕捉特征之间的复杂依赖关系,提高分类精度。
[0024] 为了便于理解,首先对本发明实施例提供的一种基于模型驱动的设备健康等级评估方法进行说明,图1示出了本发明实施例提供的一种基于模型驱动的设备健康等级评估
方法的流程图,如图1所示,该方法包括:
步骤S102,获取预设设备的运行监测数据,将运行监测数据中的文本数据转换为
向量格式,生成预设设备的待测样本。
[0025] 为了评估设备的健康状态,本发明实施例通过获取设备的运行监测数据,并对数据进行处理。其中,本发明实施例的运行监测数据为从预设设备的运行日志和传感器数据
中采集得到的。在一种实施方式中,数据采集于大型设备的运行日志和传感器数据,数据通过多种传感器(如温度感应器、压力感应器、振动感应器等)连续采集,并通过加密协议传输至中央数据存储系统。在存储时,数据采用结构化的格式进行存储,具体为JSON格式。
[0026] 在一个实施例中,所采集的数据属性包括:温度Ra1,压力Ra2,振动Ra3,电流Ra4,使用时长Ra5,维护历史Ra6,能效比Ra7,故障历史Ra8,环境因素Ra9,设备配置Ra10。
[0027] 在本实施例中,其中的5条数据如下:{70℃,150psi,0.3mm,15A,10000h,无,1.2,无,温和,标准型};
{85℃,180psi,0.5mm,20A,15000h,轻微,1.0,有,寒冷,高性能型};
{65℃,140psi,0.2mm,10A,8000h,无,1.5,无,炎热,标准型};
{90℃,200psi,0.6mm,25A,20000h,重度,0.8,有,寒冷,重型};
{75℃,165psi,0.4mm,18A,12000h,轻微,1.1,有,温和,高性能型}。
[0028] 需要说明的是,本实施例仅为说明本发明的一种数据格式和种类,在实际应用中,数据的属性通常多于10个属性,数据的属性数量可能达到几十个甚至上百个。在一个实施例中,若所采集的数据中存在文本型数据,设文本为
,其中, 是文本中的第i个词,nw为文本词向量长度,本发明实施例还将所采集的数据转
化为向量的形式,以适配后机器学习模型的输入格式。在一个实施方式中,采用预训练的词嵌入模型Ewb 实现词语与向量的转换,每个词 被映射到一个固定维度的向量空间,
即:
[0029] 式中,Ewb 为词嵌入模型, 为第i个文本中的词语, 为第i个转换后的词向量。基于此,文本类型的Twb转换为向量序列{ , ,…, , }。
[0030] 步骤S104,通过预先构建的特征提取模型对待测样本进行特征提取,得到待测样本对应的目标特征。
[0031] 通过特征提取,可以从高维数据中提取出最能代表设备状态的关键特征,保留对设备健康状态评估最有价值的信息,从而提高模型的预测准确性和泛化能力。传统的神经
网络模型在特征提取时,容易受到梯度消失、梯度爆炸和局部最优解的影响,难以确保模型的训练稳定性和全局搜索能力。为解决这一问题,本发明实施例的特征提取模型的网络参
数基于分配的生态位进行更新,网络参数的生态位通过模拟生态系统中的物种的竞争策略
确定。通过对模型中的每个神经元或参数组在特征空间中的位置和作用定义生态位,并模
拟自然界中的物种竞争,适应度较低的生态位会被适应度较高的生态位取代,而且,多个生态位可以协同进化,共同解决复杂问题。通过不断竞争和合作,模型的网络参数逐步优化,最终达到更好的性能。基于上述方式动态调整网络参数,可以提高模型的训练稳定性,减少梯度消失和爆炸的风险。还能够帮助模型更好地探索解空间,避免陷入局部最优解。且,可以根据数据分布的变化,自适应地调整模型参数,提高模型的泛化能力。
步骤S106,将目标特征输入至预设的分类器模型中,通过分类器模型对目标特征
进行分类决策,输出决策结果。
[0032] 可以根据问题的性质和数据的特点,选择合适的分类器模型,将处理后的目标特征输入到预训练的分类器模型中。分类器模型会输出设备的健康状态类别,例如“正常”、“轻度故障”、“严重故障”等。
[0033] 在本发明实施例中,分类器模型基于深度神经决策树算法作为分类器算法。传统的分类器模型通常依赖于固定的特征表示方法,缺乏灵活性。而且,在处理复杂数据结构
时,受限于其处理能力和表达能力,难以全面捕捉数据中的复杂关系,分类精度不足。例如,决策树模型虽然能够处理非线性关系,但在处理高维数据时容易过拟合,且树的深度和节
点数受限。
[0034] 为解决上述问题,本发明实施例通过引入量子位的概念,提高模型的处理能力和表达能力。其中,深度神经决策树算法的决策树的节点初始化为量子位,且,决策树的决策分支基于量子位的状态确定。量子位的状态可以通过量子态叠加和纠缠等特性来表示复杂
的数据关系。进一步地,本发明实施例的量子位的状态通过模拟决策树分裂过程中的信息
增益计算确定,模型可以自动调整量子位的状态和决策树的结构,优化分类性能。基于此,本发明实施例的分类器模型结合了深度神经网络的强表达能力和决策树的可解释性,并可
以通过量子位的状态,更准确地捕捉特征之间的复杂依赖关系,提高信息增益的计算精度,提高分类器的决策能力。
[0035] 步骤S108,基于决策结果,评估预设设备的健康状态。
[0036] 可以根据分类器的输出结果解释设备的健康状态。在一种实施方式中,可以获取决策结果所指示的决策标签,将决策标签指示的设备状态确定为预设设备的健康状态。进
一步地,还可以结合业务知识和领域经验,对结果进行进一步分析。还可以基于健康状态制定相应的维护计划或采取预防措施。例如,如果模型预测设备即将发生故障,可以提前进行维修或更换部件。
[0037] 进一步地,在上述实施例的基础上,本发明实施例还提供另一种基于模型驱动的设备健康等级评估方法,该方法主要对基于模拟生态系统中的物种的竞争策略确定生态
位,基于分配的生态位更新特征提取模型的网络参数的步骤进行说明。在本发明实施例中,采用5层的全连接神经网络进行特征提取。其中,采用基于自适应生态优化的神经网络算法作为特征提取模型,受启发于自然界中生态系统的生态位概念,每个物种都有其特定的生
态位,具体是指一个物种在生态系统中所占据的位置、所执行的功能以及与环境的相互作
用,每个物种的生存和繁荣都依赖于它能否有效地适应其生态位的变化。将这一原理应用
于神经网络的权重和偏置的优化中,模拟生物在其生态位中通过不断适应环境变化以提高
生存率的过程,在神经网络的训练过程中,每组参数(权重和偏置)被视为在高维参数空间中的一个物种,每个物种都试图优化其在问题空间中的生态位。
[0038] 图2示出了本发明实施例提供的另一种基于模型驱动的设备健康等级评估方法的流程图。参照图2,该方法包括以下步骤:
步骤S202,通过预设的训练样本集对预设的特征提取模型进行训练。
[0039] 其中,该特征提取模型的网络参数分配有初始生态位。首先生成初始的神经网络参数集合,每个参数集合视为生态系统中的一个物种,并随机分配初始的生态位,对应神经网络的参数初始化,在一个实施例中,初始化的方式表示为:
[0040]
[0041] 式中, 和 分别表示第i个物种的初始权重和初始偏置,即对应神经网络的权重和偏置的初始值;Wp,i和bp,i分别表示第i个物种的权重和偏置; 是神经网络的初始
化标准差,用于控制参数的初始分布范围; 为均值为0、方差为1的正态分布;
表示正态分布; 表示服从于特定分布。
[0042] 进一步地,对每一组参数对应其在生态系统中的生态位进行随机分配,表示为:Lp,i~rand(0,1)。Lp,i表示第i个物种的生态位,即对应神经网络参数的生态位;rand(0,1)表示从0到1之间的随机值。
[0043] 步骤S204,计算特征提取模型的网络参数对应的损失函数值,将损失函数值作为网络参数对应的适应性评分,计算网络参数对应的能量调节因子。
[0044] 对每个物种进行评估,计算其在当前神经网络架构下的损失函数值,作为其适应性评分,适应性评估的方式表示为:
[0045] 式中,Sp,i是第i个物种的适应性评分; 是适应性评分超参数,用于调整损失函数对适应性评分Sp,i的影响;Loss(Wp,i,bp,i)表示使用权重Wp,i和偏置bp,i计算得到的网络损失;Loss 表示神经网络的损失函数。优选地, 设置为5。
在一个实施例中,考虑到模型复杂度和预测误差,神经网络的损失函数的计算方
式表示为:
[0046] 式中, 是调节预测误差和模型复杂度的权重系数;MSE是神经网络的均方误差;Com 为模型复杂度函数。优选地, 设置为0.5。
[0047] 进一步地,神经网络的均方误差的计算方式表示为:
[0048] 式中, 是神经网络关于第j个样本输出的特征向量,经预设的Softmax函数得到的模型预测值;yj是第j个样本的真实标签;nMSE是当前批次输入到神经网络的样本数量。
[0049] 进一步地,模型复杂度函数的计算方式表示为:
[0050] 式中,Wp,ik和表示第i个物种的权重参数组合中的第k个参数。
[0051] 在一个实施例中,本发明实施例采用自适应能量调节机制根据每个物种(参数集合)的历史表现动态调整其变异能量,通过调节每次变异时的能量输入,使得适应性较低的物种得到更大的调整机会,而适应性较高的物种保持较为稳定的状态,从而增加算法的全
局搜索能力和避免局部最优,具体的,定义能量调节因子的计算方式表示为:
[0052] 式中, 为第i个物种的能量调节因子;Hp,i表示第i个物种的历史适应性,即本次迭代之前累积的适应性评分值; 是能量调节的敏感性参数, 是本次迭代之前累积
的适应性评分的平均值。优选地, 设置为0.1。
[0053] 步骤S206,基于能量调节因子,计算网络参数对应的动态变异率。
[0054] 步骤S208,基于动态变异率对初始生态位进行迁移,从而对网络参数进行更新。
[0055] 具体地,本发明实施例根据能量调节因子和预设的最大能量输入计算网络参数对应的变异能量,基于变异能量和预设的迁移和变异调节系数,对适应性评分进行计算,确定网络参数对应的动态变异率。
[0056] 进行变异能量的计算,表示为:
[0057] 式中,Ep,max是最大能量输入, 为参数正交项。优选地,Ep,max设置为0.4。
[0058] 进一步地,利用环境感知型参数正交化调整机制参数正交化,确保不同参数集(物种)之间保持适当的多样性,从而避免过早收敛于局部最优并增强全局搜索能力,具体的,通过在生态位的调整过程中利用参数的正交化调整,确保参数更新过程不仅响应当前的适应性,同时也保持参数之间的独立性,从而促进算法探索未知的、可能更优的解空间,正交化能量的计算方式表示为:
[0059] 式中,Orthop,i表示第i个物种的正交化能量; 表示向量点积, 表示L2范数;Wp,j表示第j个物种的权重和偏置。
[0060] 进一步地,基于正交化能量计算参数正交项,计算方式表示为:
[0061] 式中, 是正交调整的学习率。优选地, 设置为0.01。
[0062] 模拟物种根据其适应性进行参数的迁移和变异,适应性高的物种其参数有较小的变异率,保持稳定;适应性低的物种则尝试较大的变异,以寻求生态位的改善。具体的,参数的迁移和变异依赖于物种的适应性评分,计算方式表示为:
[0063]
[0064] 式中, 表示迁移和变异后的神经网络的权重,作为下一次迭代的神经网络的权重; 是基于适应性的动态变异率,其反映物种适应性的逆,适应性越低,变异率越
高; 表示迁移和变异影响因子; 是迁移和变异调节系数; 为变异能量。优选
地, 设置为0.1, 设置为0.3。
[0065] 模拟生态位竞争策略,即物种之间进行竞争,损失函数低(适应性高)的物种将占据更优的生态位,而适应性低的物种可能被迫迁移到较差的生态位或被淘汰,进而实现生态位的迁移,即对应神经网络权重和偏置参数的改变,表示为:
[0066]
[0067] 式中, 和 为更新后的神经网络的权重和偏置,ΔWp,i和Δbp,i为神经网络权重和偏置的更新增量。
[0068] 在一个实施例中,神经网络权重和偏置的更新增量的计算方式表示为:
[0069]
[0070] 式中, 是神经网络的学习率; 是第i个物种的适应性评分关于权重参数的梯度; 为第i个物种的适应性评分关于偏置参数的梯度。优选地, 设置为0.01。
[0071] 进一步地,重复迭代上述步骤,直至满足预设的停止迭代条件,即表示模型训练完成。在一个实施例中,预设的停止迭代条件为达到预设的最大迭代次数,优选地,预设的最大迭代次数设置为1000次。
[0072] 综上,本发明实施例通过自适应生态优化算法动态调整权重和偏置参数,将神经网络的参数优化过程类比为生态系统中物种的生态位适应过程,从而提升网络的稳定性和
全局搜索能力,减少梯度消失、梯度爆炸及局部最优问题的发生,提高特征提取的准确性和效率。
[0073] 进一步地,本发明实施例还通过预先构建的降维模型对所述目标特征进行降维度处理。降维后,特征的数量减少,模型的训练和推理过程所需的计算资源显著降低,加速了模型的训练和预测速度。降维后的低维数据更容易进行可视化,帮助研究人员和工程师更
直观地理解数据的分布和结构。降维后的特征更能反映数据的本质结构,有助于模型更好
地泛化到未见过的数据上,提高模型的鲁棒性和准确性。而且,高维数据容易导致模型过拟合,降维可以减少特征数量,降低模型复杂度,从而减少过拟合的风险。
[0074] 传统的特征降维方法主要依赖于统计方法或线性变换,难以有效地区分哪些特征是重要的,哪些是冗余的。这可能导致降维后的特征表示不够精确,关键信息丢失或无关信息引入。此外,传统的降维方法通常是固定的,无法根据具体数据集的特点进行调整,缺乏灵活性和适应性。本发明实施例采用基于特征细化的自编码神经网络作为降维模型,通过
递归优化特征权重向量,能够动态地调整每个特征的重要性。这种方法可以根据数据的实
际分布和特征之间的关系,灵活地确定每个特征的权重,自编码神经网络能够更精确地识
别出哪些特征是重要的,哪些是冗余的。
[0075] 其中,本发明实施例的基于特征细化的自编码神经网络由编码器、解码器、特征调整模块三部分构成,编码器负责将高维输入数据映射到低维特征空间,解码器用于将降维后的特征重构回原始空间,以保证降维过程的可逆性。特征调整模块通过递归特征自适应
优化动态调整降维后的特征空间,使得重要特征能够得到强化,次要特征被逐步弱化,从而使得降维后的特征表示在保留数据信息的同时具备较好的简洁性。对应的,图3示出了降维模型的训练过程示意图。
[0076] 具体地,降维模型的构建方法如下:1)将预设的训练样本集输入至预设的自编码神经网络中,通过自编码神经网络的
编码器将训练样本集映射到初始低维特征空间,得到初始低维特征。
[0077] 首先,设输入到自编码神经网络的数据为Xr,编码器采用多层非线性映射结构,将高维数据映射到初始的低维特征空间,表示为:
[0078] 式中,Zr表示初始低维特征,Wr为编码器的权重矩阵,br为编码器的偏置向量,Sigenc 为编码器的多层Sigmoid激活函数。
[0079] 2)基于初始低维特征对应的损失函数值,确定初始低维特征的特征重要性。
[0080] 3)基于特征重要性,对自编码神经网络的特征权重向量进行递归优化。
[0081] 在低维特征生成后,特征调整模块根据当前特征空间中的特征重要性,自动生成特征权重,该模块初始化时对所有特征赋予相同的初始权重,以便后续步骤中根据特征贡
献逐步调整,初始权重矩阵的计算方式表示为:
[0082] 式中,Ar为初始权重矩阵; 为特征权重向量, 中的每个元素 初始化为相同的值,表示所有特征在初始阶段具有相同的重要性;diag 为提取矩阵的对角线元素
的函数。
[0083] 进一步地,调整后的特征可以表示为:
[0084] 式中, 为经过特征权重调整后的特征表示。
[0085] 特征调整模块对初步生成的低维特征进行递归优化,在每一轮迭代中,模块会根据前一轮特征的表现,调整各个特征的权重,逐步增强那些有重要影响的特征,并逐步削弱冗余或噪声特征,设第 轮迭代中,权重的更新规则如下:
[0086] 式中, 表示第t+1轮迭代的特征权重, 表示第t轮迭代的特征权重, 为自编码神经网络的学习率,Lr 为自编码神经网络的损失函数,Yr为标签数据, 表
示损失函数对特征权重的梯度。优选地,自编码神经网络的损失函数我重构误差损失函数。
优选地, 设置为0.01。
[0087] 4)基于特征权重向量,确定新的低维特征,通过解码器对新的低维特征进行特征重构。
[0088] 5)直到自编码神经网络满足预设的迭代条件,基于自编码神经网络构建降维模型。
[0089] 为了确保降维过程的有效性,解码器将低维特征重新映射回高维空间,以确保降维过程没有丢失重要信息。解码器的重构过程表示为:
[0090] 式中, 为重构后的高维数据, 为解码器的权重矩阵, 为解码器的偏置向量,Sigdec 为解码器的多层Sigmoid激活函数。
[0091] 重复迭代上述步骤,直至满足预设的停止迭代条件,即表示模型训练完成。在一个实施例中,预设的停止迭代条件为达到预设的最大迭代次数,优选地,预设的最大迭代次数设置为1000次。
[0092] 综上,本发明实施例采用基于特征细化的自编码神经网络,将高维数据映射到低维特征空间,通过递归优化特征权重,逐步强化重要特征,削弱冗余特征,确保在保留关键信息的前提下实现有效降维,有效减少了无关和冗余信息,使得降维后的特征表示更加简
洁,同时保留了数据的关键信息。
[0093] 进一步地,本发明实施例还对分类器模型的构建方法进行说明。结合上述实施例,现有技术在处理复杂数据结构时,受限于其处理能力和表达能力,难以全面捕捉数据中的复杂关系,分类精度不足。本发明实施例采用基于量子纠缠态的深度神经决策树算法作为
分类器模型。深度神经决策树(Deep Neural Decision Tree, DNDT)是一种结合了传统决策树和深度神经网络优点的模型。它将决策树的结构嵌入到神经网络中,从而可以利用神
经网络的强大表征能力和优化方法来训练模型。深度神经决策树的中间层由多个神经元组
成,每个神经元对应决策树的一个节点。这些神经元通过激活函数(如ReLU)进行非线性变换。在每个内部节点(决策节点),根据特征值和节点的权重(类似于决策树中的阈值)决定数据沿着哪条路径前进。最终数据会到达某个叶子节点,该叶子节点的输出就是最终的预
测结果。本发明实施例结合量子位的纠缠状态模拟信息的多维度表示,从而增强分类器处
理复杂数据结构的能力。
具体地,分类器的构建方法如下:
1)模拟决策树分裂过程中的信息增益计算确定量子位的状态。
[0094] a‑对预设的深度神经决策树算法的决策树的节点初始化为量子位。
[0095] 对模型的量子位进行初始化,每个量子位代表决策树中的一个节点,初始状态为最大叠加态,确保在训练初期每个特征维度都能被公平地考虑。具体的,设定量子位的初始状态为 ,计算方式表示为:
[0096] 式中,nu表示量子位的数量, 是数据的基态。
[0097] b‑通过预设的训练样本集深度神经决策树算法进行训练,通过复数域的指数运算,确定训练样本集对应的自定义旋转门的旋转参数。
[0098] c‑基于旋转参数和预设的量子逻辑门操作,调整量子位之间的纠缠和相位。
[0099] 在训练过程中,根据训练数据利用量子逻辑门调整量子位之间的纠缠和相位,模拟决策树分裂过程中的信息增益计算,具体的,设量子逻辑门为 ,包括Pauli‑X门、
CNOT门以及自定义旋转门,以模拟信息增益的计算,表示为:
[0100] 式中, 为自定义旋转门; 是根据数据动态调整的旋转参数,代表在Bloch球上的旋转角度,用以调整量子位的纠缠和相位关系,增强模型的非线性决策能力,且, 为第一旋转参数, 为第二旋转参数, 为第三旋转参数;CNOT表示CNOT
门;Pauli‑X表示Pauli‑X门。
[0101] 在一个实施例中,自定义旋转门通过复数域的指数运算实现量子比特的旋转,允许在高维特征空间中模拟决策树的信息增益过程,计算方式表示为:
[0102] 式中,Xus和Zus是 Pauli矩阵代表在X和Z轴上的旋转操作; 是虚数单位。
[0103] d‑基于调整的量子位之间的纠缠和相位,对量子位进行量子测量,确定量子位对应的概率分布,以评估量子位的状态。
[0104] 在每次迭代后,对量子位进行测量,得到各个节点的具体状态。这些状态信息用于确定决策树中的分裂条件,如信息增益或基尼不纯度的最优化,表示为:
[0105] 式中,Mu为量子测量操作,量子测量操作提取量子态在特定基态上的投影概率,用以评估当前节点是否满足某个分裂条件; 表示在第t次迭代的测量后得到的概率分布,用于评估当前量子位的状态,从而决定信息增益最大化的分裂路径; 为第t次迭代的
量子位; 为第t次迭代的量子位的共轭。
[0106] 在一个实施例中,量子测量操作为基于特定决策规则的测量操作,根据决策树节点的逻辑规则与量子计算中的态叠加和纠缠特性,能够更精确地评估分裂条件,其矩阵表
示如下:
[0107] 式中, 和 是基态投影操作,基态投影操作的目的是通过特定的基态,确定节点状态是否符合决策树节点的逻辑条件。如,一个节点需要检查数据是否满足某个特
征阈值,通过投影操作在特定基矢方向上的权重来表达,且 为第一基态投影操作,
为第二基态投影操作;I是单位矩阵,Z是Pauli‑Z矩阵; 为矩阵乘法。
[0108] 2)基于量子位的状态生成决策树的决策分支。
[0109] 其中,根据测量结果和训练数据,执行节点分裂,生成新的决策分支。在具体实现时,包括以下步骤:a‑根据量子位的状态,计算训练样本集对应的决策条件。
[0110] 在一个实施例中,根据量子位的状态和训练数据计算得出的决策条件基于非线性映射以适应复杂数据特性,计算方式表示为:
[0111] 式中,Du 为根据量子位的状态和训练数据计算得出的决策条件,用于节点的分裂决定。mu是量子位数量,wuj是第j个节点的量子状态权重系数,Sig 是Sigmoid激活函
数;xuj是第j个节点的分裂数据属性; 是第j个节点的第一旋转参数。
[0112] b‑基于决策条件,通过预设的决策函数控制决策树的节点分裂操作,生成决策树的决策分支。
[0113] 量子态的叠加和纠缠能力使得算法能够在高维空间中更有效地进行数据划分。具体的,节点分裂操作由决策函数控制,该函数根据旋转门调整后的概率阈值来执行,表示
为:
[0114] 式中, 是信息增益或基尼不纯度优化后确定的阈值;Split为分裂行为。优选地, 设置为0.04。
[0115] 3)进行模型评估。
[0116] 其中,在节点分裂完成后,评估当前模型的分类效果,并根据评估结果调整量子门参数,以优化整个模型,表示为:
[0117]
[0118]
[0119] 式中, 是深度神经决策树的学习率, 表示损失函数 关于参数的梯度;为第t次迭代的第一旋转参数, 为第t次迭代的第二旋转参数, 为第t次迭代的第三旋
转参数; 为第t+1次迭代的第一旋转参数, 为第t+1次迭代的第二旋转参数,
为第t+1次迭代的第三旋转参数。优选地, 设置为0.2。
[0120] 重复迭代上述步骤,直至满足预设的停止迭代条件,即表示模型训练完成。在一个实施例中,预设的停止迭代条件为达到预设的最大迭代次数,优选地,预设的最大迭代次数设置为500次。
[0121] 综上,本发明实施例采用基于量子纠缠态的深度神经决策树算法进行分类决策,通过利用量子位的叠加和纠缠特性模拟复杂数据的多维度表示,能够高效处理多维复杂数
据。并通过量子逻辑门操作优化决策树节点分裂条件,从而对节点分裂过程进行优化,能够提高分类器在复杂数据结构下的分类能力。
[0122] 进一步地,在上述实施例的基础上,本发明实施例还提供另一种基于模型驱动的设备健康等级评估方法,该实施例主要对训练样本集的构建方法进行说明,图4示出了本发明实施例提供的一种训练样本集的构建方法的流程图,如图4所示,该方法包括以下步骤:
步骤S10,获取预先采集的设备运行监测样本。
[0123] 步骤S11,基于运行监测样本所表征的设备健康状态,对运行监测样本进行标注,以及,将运行监测样本中的文本数据转换为向量格式,构建初始样本集。
[0124] 本发明实施例的设备运行监测样本包括预设设备的运行日志和传感器数据,可参照上述实施例的内容。进一步地,对采集到的数据进行标注,用于训练模型。在一个实施例中,标注方式可以是人工标注,标注的类别包括:健康、警告、故障,共3个类别。
[0125] 步骤S12,利用预先构建的数据扩充模型对初始样本集进行数据扩充,生成初始样本集的扩充样本。
[0126] 可以理解的是,在本发明任务中,训练数据的采集获取、标注及预处理是耗时耗力的,且训练样本不足容易导致模型泛化能力差,同时影响模型的精度。然而,传统的生成对抗网络在面对偏斜数据分布时往往难以生成较为稀缺类别的准确样本,导致数据不均衡,影响模型的泛化性能。本发明实施例的数据扩充模型包括生成对抗网络算法,生成对抗网
络算法的生成器参数和判别器参数基于博弈论的动态策略进行调整,能够实现对抗过程中
生成器和判别器的权衡,使得每一次生成的数据更好地模拟真实的数据分布。具体地,包括以下步骤:
1)通过自适应特征变换策略,对预设的训练样本集的特征权重进行调整。
[0127] 在一个实施例中,通过自适应特征变换策略提升生成样本的质量并加强模型对不同数据的学习能力,基于对生成器输入特征的动态加权和调整,实现特征权重学习,则特征变换的权重的计算方式表示为:
[0128] 式中,Sig 为Sigmoid激活函数;Vc是权重学习的参数矩阵,具体为生成器的权重参数矩阵。
[0129] 2)通过生成对抗网络算法的生成器,对特征权重调整后的训练样本集进行数据扩充,生成初始扩充样本。
[0130] 设生成器为Gc,判别器为Dc,设定生成器的权重为WGc,判别器的权重为WDc,在一个实施例中,生成器和判别器的参数的初始化方式表示为:
[0131]
[0132] 式中, 为均值为0、标准差为单位矩阵I的正态分布; 为服从于特定分布。
[0133] 在生成阶段,生成器根据当前网络参数,生成一批新的数据样本,这些样本初步尝试模仿真实数据的分布特征,表示为:
[0134] 式中,zc为从先验分布中采样得到的隐向量;Gc 为生成器函数, 为第t次迭代时的生成器权重; 为在第t次迭代中,生成器生成的样本;WTc代表特征变换的权重;
表示元素级的乘法。
[0135] 3)通过生成对抗网络算法的判别器对初始扩充样本进行评估,得到评估结果。
[0136] 判别器对生成的数据样本和真实数据样本进行评估,输出每个样本为真实样本的概率,表示为:
[0137] 式中, 表示将生成的样本和真实样本合并为一个批次输入;Dc 为判别器函数, 为第t次迭代时的判别器权重; 为在第t次迭代中判别器的判别结果。
[0138] 4)根据评估结果和初始扩充样本的熵,计算生成器的损失函数;以及,基于预设的正则化项,计算判别器的损失函数。
[0139] 本发明实施例的生成器的损失函数结合生成数据的熵进行综合计算,以更全面评估生成数据的质量,并增加生成样本的多样性,表示为:
[0140] 式中,Hc 表示熵函数, 是控制熵项影响的调节系数。
[0141] 进一步地,判别器的损失函数利用正则化项以防止过拟合,表示为:
[0142] 式中,yc表示真实样本标签(1为真实样本,0为生成样本); 为正则化系数,用于权重衰减,以减少模型复杂度和过拟合风险; 表示判别器权重的L2范数的平方。
[0143] 5)基于生成器的损失函数和判别器的损失函数,以及预设的动态博弈策略对生成器的生成器参数和判别器的判别器参数分别进行调整。
[0144] 利用动态博弈策略调整生成器和判别器的学习速率和更新策略,根据每一轮对抗的结果动态调整损失函数,优先提升生成稀缺类别数据的能力,表示为:
[0145]
[0146] 式中, 为第t+1次迭代时的生成器权重; 为第t+1次迭代时的判别器权重; 为生成器的学习率; 为判别器的学习率; 为生成器的损失函数; 为判别器
的损失函数;Xrc为生成器生成的样本; 表示关于生成器权重的梯度; 表示关于判
别器参数的权重。生成器的目标是最大化损失函数,因此使用梯度上升来更新参数。判别器的目标是最大化其损失函数,使用梯度下降来更新参数。生成器不断调整其参数,以生成更逼真的样本。每次迭代中,生成器的损失函数随着生成器生成的样本质量的变化而变化。生成器的目标是使损失函数尽可能大,即让判别器认为生成的样本是真实的。判别器的损失
函数随着生成器生成的样本质量和真实样本的变化而变化。判别器的目标是最大化损失函
数,以正确识别真实样本和生成样本。
[0147] 在生成器和判别器的对抗训练过程中,动态博弈策略通过动态调整控制熵项影响的调节系数和正则化系数,以使得每一次生成的数据更好地模拟真实的数据分布,表示为:
[0148]
[0149] 式中, 是学习率调节因子,用于控制学习率的动态调整;为偏导数符号; 为第t次迭代的控制熵项影响的调节系数, 为第t次迭代的正则化系数; 为第t次迭代
的控制熵项影响的调节系数, 为第t次迭代的正则化系数。优选地, 设置为0.01。
[0150] 重复迭代上述步骤,直至满足预设的停止迭代条件,即表示模型训练完成。在一个实施例中,预设的停止迭代条件为达到预设的最大迭代次数,优选地,预设的最大迭代次数设置为1000次。数据扩充模型训练完成后,利用训练好的数据扩充模型进行样本数量的增加。在一个实施例中,设原始采集样本为800条,数据扩充模型扩充生成得到样本200条,则扩充后的数据集包含样本1000条。
[0151] 步骤S13,基于扩充样本和初始样本集构建训练样本集。
[0152] 综上,本发明实施例采用基于动态博弈的生成对抗网络算法,通过调整生成器和判别器的动态策略,结合熵函数评估生成数据的质量和多样性,可以优先生成稀缺类别的
数据,保证数据扩充的均衡性,提升模型的泛化能力和训练精度,有效解决训练数据不足的问题。
[0153] 进一步地,在上述实施例的基础上,本发明实施例还提供一种基于模型驱动的设备健康等级评估装置,图5示出了本发明实施例提供的一种基于模型驱动的设备健康等级
评估装置的结构示意图,参照图5,该装置包括:数据获取模块100,用于获取预设设备的运行监测数据,将运行监测数据中的文本数据转换为向量格式,生成预设设备的待测样本;运行监测数据为从预设设备的运行日志和传感器数据中采集得到的;数据处理模块200,用于通过预先构建的特征提取模型对待测样本进行特征提取,得到待测样本对应的目标特征;
其中,特征提取模型的网络参数基于分配的生态位进行更新,网络参数的生态位通过模拟
生态系统中的物种的竞争策略确定;执行模块300,用于将目标特征输入至预设的分类器模型中,通过分类器模型对目标特征进行分类决策,输出决策结果;其中,分类器模型基于深度神经决策树算法作为分类器算法,深度神经决策树算法的决策树的节点初始化为量子
位,且,决策树的决策分支基于量子位的状态确定,量子位的状态通过模拟决策树分裂过程中的信息增益计算确定;输出模块400,用于基于决策结果,评估预设设备的健康状态。
[0154] 本发明实施例提供的一种基于模型驱动的设备健康等级评估装置,与上述实施例提供的一种基于模型驱动的设备健康等级评估方法具有相同的技术特征,所以也能解决相
同的技术问题,达到相同的技术效果。
[0155] 进一步地,本发明实施例还提供另一种基于模型驱动的设备健康等级评估装置,图6示出了本发明实施例提供的另一种基于模型驱动的设备健康等级评估装置的结构示意
图,如图6所示,上述输出模块400,还用于获取决策结果所指示的决策标签;将决策标签指示的设备状态确定为预设设备的健康状态。
[0156] 上述执行模块300,还用于对预设的深度神经决策树算法的决策树的节点初始化为量子位;通过预设的训练样本集深度神经决策树算法进行训练,通过复数域的指数运算,确定训练样本集对应的自定义旋转门的旋转参数;基于旋转参数和预设的量子逻辑门操
作,调整量子位之间的纠缠和相位;基于调整的量子位之间的纠缠和相位,对量子位进行量子测量,确定量子位对应的概率分布,以评估量子位的状态。
[0157] 上述执行模块300,还用于基于量子位的状态生成决策树的决策分支的步骤,包括:根据量子位的状态,计算训练样本集对应的决策条件;基于决策条件,通过预设的决策函数控制决策树的节点分裂操作,生成决策树的决策分支。
[0158] 上述数据处理模块200,还用于通过预设的训练样本集对预设的特征提取模型进行训练;其中,特征提取模型的网络参数分配有初始生态位;计算特征提取模型的网络参数对应的损失函数值,将损失函数值作为网络参数对应的适应性评分,计算网络参数对应的
能量调节因子;基于能量调节因子,计算网络参数对应的动态变异率;基于动态变异率对初始生态位进行迁移,从而对网络参数进行更新。
[0159] 上述数据处理模块200,还用于根据能量调节因子和预设的最大能量输入计算网络参数对应的变异能量;基于变异能量和预设的迁移和变异调节系数,对适应性评分进行
计算,确定网络参数对应的动态变异率。
[0160] 上述数据处理模块200,还用于通过预先构建的降维模型对目标特征进行降维度处理;其中,降维模型的构建方法,包括:将预设的训练样本集输入至预设的自编码神经网络中,通过自编码神经网络的编码器将训练样本集映射到初始低维特征空间,得到初始低
维特征;基于初始低维特征对应的损失函数值,确定初始低维特征的特征重要性;基于特征重要性,对自编码神经网络的特征权重向量进行递归优化;基于特征权重向量,确定新的低维特征,通过解码器对新的低维特征进行特征重构;直到自编码神经网络满足预设的迭代
条件,基于自编码神经网络构建降维模型。
[0161] 该装置还包括构建模块500,用于获取预先采集的设备运行监测样本;设备运行监测样本包括预设设备的运行日志和传感器数据;基于运行监测样本所表征的设备健康状
态,对运行监测样本进行标注,以及,将运行监测样本中的文本数据转换为向量格式,构建初始样本集;利用预先构建的数据扩充模型对初始样本集进行数据扩充,生成初始样本集
的扩充样本;其中,数据扩充模型包括生成对抗网络算法,生成对抗网络算法的生成器参数和判别器参数基于博弈论的动态策略进行调整;基于扩充样本和初始样本集构建训练样本
集。
[0162] 上述构建模块500,还用于通过自适应特征变换策略,对预设的训练样本集的特征权重进行调整,通过生成对抗网络算法的生成器,对特征权重调整后的训练样本集进行数
据扩充,生成初始扩充样本;通过生成对抗网络算法的判别器对初始扩充样本进行评估,确定生成器的初始损失值;根据初始损失值和初始扩充样本的熵,计算生成器的损失函数;以及,基于预设的正则化项,计算判别器的损失函数;基于生成器的损失函数和判别器的损失函数,以及预设的动态博弈策略对生成器的生成器参数和判别器的判别器参数分别进行调
整。
[0163] 本发明实施例还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述图1至图4任一所示的方
法的步骤。本发明实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储
有计算机程序,计算机程序被处理器运行时执行上述图1至图4任一所示的方法的步骤。本
发明实施例还提供了一种电子设备的结构示意图,如图7所示,为该电子设备的结构示意
图,其中,该电子设备包括处理器71和存储器70,该存储器70存储有能够被该处理器71执行的计算机可执行指令,该处理器71执行该计算机可执行指令以实现上述图1至图4任一所示
的方法。在图7示出的实施方式中,该电子设备还包括总线72和通信接口73,其中,处理器
71、通信接口73和存储器70通过总线72连接。
[0164] 其中,存储器70可能包含高速随机存取存储器(RAM,Random Access Memory),也可能还包括非易失性存储器(non‑volatile memory),例如至少一个磁盘存储器。通过至少一个通信接口73(可以是有线或者无线)实现该系统网元与至少一个其他网元之间的通信连接,可以使用互联网,广域网,本地网,城域网等。总线72可以是ISA(Industry Standard Architecture,工业标准体系结构)总线、PCI(Peripheral Component Interconnect,外设部件互连标准)总线或EISA(Extended Industry Standard Architecture,扩展工业标准结构)总线等,还可以是AMBA(Advanced Microcontroller Bus Architecture,片上总线的标准)总线,其中,AMBA定义了三种总线,包括APB(Advanced Peripheral Bus)总线、AHB(Advanced High‑performance Bus)总线和AXI(Advanced eXtensible Interface)总线。
总线72可以分为地址总线、数据总线、控制总线等。为便于表示,图7中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。处理器71可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器71中的硬件的集成逻
辑电路或者软件形式的指令完成。上述的处理器71可以是通用处理器,包括中央处理器
(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processor,简称DSP)、专用集成电路(Application Specific Integrated Circuit,简称ASIC)、现场可编程门阵列(Field‑Programmable 
Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申
请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理
器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存
储介质位于存储器,处理器71读取存储器中的信息,结合其硬件完成前述图1至图4任一所
示的方法。
[0165] 本发明实施例所提供的一种基于模型驱动的设备健康等级评估方法及装置的计算机程序产品,包括存储了程序代码的计算机可读存储介质,所述程序代码包括的指令可
用于执行前面方法实施例中所述的方法,具体实现可参见方法实施例,在此不再赘述。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统的具体工作过
程,可以参考前述方法实施例中的对应过程,在此不再赘述。另外,在本发明实施例的描述中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。所述功能如果以软件功能单
元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质
中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该
技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质
中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read‑Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。在本发明的描述中,需要说明的是,术语
“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示
所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本
发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。最后应说明的是:以上实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域技术人员应当理解:任何熟悉本技术领域的技术人员在本发
明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到
变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之
内。因此,本发明的保护范围应以权利要求的保护范围为准。

当前第1页 第1页 第2页 第3页
相关技术
方法装置相关技术
模型驱动相关技术
尹旭发明人的其他相关专利技术