技术领域
[0001] 本发明属于轴承故障诊断技术领域,具体涉及一种基于因果特征加权网络(Causal Feature Weighted Network,CFWN)的滚动轴承复合故障特征选择方法。
相关背景技术
[0002] 滚动轴承作为一种关键部件,在现代机械设备中应用广泛,其健康状况关乎整个设备的工作安全。然而,由于实际工况中设备所处环境复杂多变,滚动轴承发生故障时往往不是单一故障,而是多种故障同时存在,导致复合故障特征难以准确提取,故障诊断的有效性变得十分困难。事实上,为了提高故障诊断的精度,工程上一般从多角度对振动信号进行特征提取,以此确保多域特征可以反映信号各种状态下的故障信息。但是,此类方法不仅导致特征维度增多,而且在提高相关性的同时出现特征冗余问题,影响诊断精度。因此,对复合故障信号多维特征进行选择是故障诊断的关键一环。
[0003] 针对特征选择问题,传统算法分为封装法、过滤法和嵌入法三类,主要根据特征和复合故障之间的相关性寻找相关特征子集。然而,相关关系只能反映故障模式和特征之间的共存关系,无法解释特征之间的潜在机制。随着复杂网络理论研究的不断深入,有学者开始尝试使用复杂网络理论分析节点之间的关系进行选择特征,唐晓波等人通过PageRank算法识别网络中的重要节点作为特征,赵鹏等人构建文档语言网络计算节点的度和集聚系数来选择特征词,这些利用复杂网络小世界特性的思想为特征选择提供了新的思路。现有研究中,多数学者更倾向于针对简单的无权网络进行算法设计。然而,故障之间的相互耦合使信号在多域特征上涌现出不同强弱的因果属性,而加权网络中可以通过权重能反映特征节点间因果关系所蕴含的有效信息。现有技术难以对网络中的连边加以区分,不能将特征网络抽象为加权网络,无法合理有效地解决特定的滚动轴承复合故障特征选择。
具体实施方式
[0036] 下面结合附图,通过实施例对本发明做进一步说明,但不以任何方式限制本发明的范围。
[0037] 以下实施例采用某大学采集的滚动轴承振动数据集,通过本发明提供的因果特征加权网络复合故障特征选择方法实现滚动轴承复合故障特征选择的实施。
[0038] 方法具体实施的过程如图1所示。本发明方法包括:1)预处理标准数据集,并对数据集进行多域特征提取;2)构建因果特征加权网络模型;3)通过节点中心性获得特征子集,对特征子集进行训练完成复合故障特征选择;4)对复合故障诊断准确率进行归因分析,量化复合故障因果特征的SHAP值。具体实施步骤如下:
[0039] 1.预处理标准数据集,并对数据集进行多域特征提取,如图2所示,具体步骤如下:
[0040] 1.1.利用线性瞬时混合模型对滚动轴承振动数据集进行混合获得“内圈+外圈”、“内圈+滚动体”和“外圈+滚动体”三种类型的混合数据集S。混合矩阵如式1所示,其中n为待定系数且n∈(0,1)。以1024为一组切分复合故障数据集S={sa},a∈[1,102400],总计获得2700组复合故障数据集X={xb},b∈[1,2700],并为三种类型的复合故障打上标签,复合故障状态信息表如表1所示。
[0041]
[0042] 表1轴承复合故障状态信息表
[0043]
[0044] 1.2.对复合故障数据集X进行时域、频域和熵值的多域特征提取获得复合故障特征集Fea={feai,j},i∈[1,2700],j∈[1,20],其中时域特征包括7种有量纲参数和6种无量纲参数,有量纲参数记为fea1~fea7,分别是峰值、峰峰值、平均幅值、均方根、方根幅值、方差和标准差;无量纲参数记为fea8~fea13,分别是峰值因子、脉冲因子、裕度因子、波形因子、峭度因子和偏度;频域特征记为fea14~fea18,分别是重心频率、均方频率、均方根频率、频率方差和频率标准差;熵值特征记为fea19~fea20,分别是功率谱熵和奇异谱熵。
[0045] 1.3.由于每段信号均为已发生故障的信号,并且每段信号经过切分至少包含一个周期的故障信息,因此将为百分比为标准划分训练集和测试集,分别是80%的特征集为训练集,20%的特征集为测试集。
[0046] 2.构建因果特征加权网络模型,如图3所示,具体步骤如下:
[0047] 2.1.通过增量关联马尔可夫毯IAMB算法寻找特征间的因果关系,获得每种复合故障特征的马尔可夫毯集合:MB={MBp},p∈[1,20]
[0048] 2.1.1.以复合故障特征feaj为当前目标特征,初始化目标特征的父子(PC)集合PCj并初始化为空集,将除了目标特征以外的其他特征放入候选MB集合,记为CMBj。
[0049] 2.1.2.运用Fish‑z检验判断目标特征和CMB集合中每一个特征的条件独立性。如果二者条件相关,则将该特征从CMB集合中删除并加入到目标特征的PC集合中,以获得该目标特征的PC集合和CMB集合。
[0050] 2.1.3.判断目标特征在以CMB集合为条件下,与PC集合中的每一个特征的条件独立性。如果二者条件独立,则该特征为错误的节点,将该节点从PC集合中删除,以获得该目标特征的最终PC集合。
[0051] 2.1.4.将目标特征与PC集合的并集,视为该复合故障特征的马尔可夫毯MB集合MB={MBp}。
[0052] 2.2.以feaj为网络节点vj,通过MBp为网络中添加连边。具体地,如果节点v1所对应的特征fea1的MB1中存在特征fea2,则在节点v1和节点v2之间添加连边,即a12=1,反之则不添加连边,即a12=0。重复上述过程,得到因果特征无权网络A={apj}。
[0053] 2.3.计算所有特征对(feap,feaj)之间的Person相关系数R={rpj},并将其定义为因果特征加权网络中的权重wpj,即Person相关系数越大,表示两个节点相似。获得因果特征加权网络B={bpj}。
[0054] 3.通过节点中心性获得特征子集,对特征子集进行训练完成复合故障特征选择,如图4所示,具体步骤如下:
[0055] 3.1.采用加权网络中的节点强度作为中心性指标来量化复合故障特征重要性,计算方式如式2所示,其中sj表示每个节点的节点强度,N为网络节点的数量,wpj表示节点p和节点j之间两边的权重。
[0056]
[0057] 对CFWN中的网络节点进行中心性降序排列,即节点中心性从大到小。根据排序结果得到特征子集fn,n∈[1,20],其中n表示节点中心性排序结果中相关性最大的前n个特征。
[0058] 3.2.设计4层DNN模型对特征子集进行训练,优化器采用自适应矩估计(Adaptive Moment Estimation),损失函数采用二元交叉熵函数(Binary cross entropy),其它实验参数设置如表2所示,实验环境如表3所示。具体框架如下:
[0059] 3.2.1.输入层:神经元个数为特征子集中包含特征种类的数量。
[0060] 3.2.2.第一个隐层:神经元个数为40个,激活函数采用线性整流函数(Linear rectification function,RELU)。
[0061] 3.2.3.第二个隐层:神经元个数为20个,激活函数采用RELU函数,并用L2范数进行正则化防止训练过拟合。
[0062] 3.2.4.输出层:神经元个数为标签数量,激活函数采用Sigmoid函数。
[0063] 3.3.采用测试集对模型进行测试:
[0064] 3.3.1.评价指标选择准确率(Accuracy),计算原理及各指标说明如式4、表4所示。
[0065]
[0066] 表2实验参数设置
[0067]
[0068] 表3实验环境
[0069]
[0070] 表4准确率指标说明
[0071]
[0072] 3.3.2.计算每个特征子集用于进行复合故障诊断的准确率,结果如图5所示,将复合故障诊断准确率最高对应的特征子集作为最优特征子集。结果表明本发明提出的方法明显优于不进行特征选择的实验结果。相比于特征维度较高、信息冗余较多影响模型性能的原始方法,经过特征选择之后在有效的降低数据维度的同时,还保留了重要的故障信息,提高了复合故障诊断的准确率。
[0073] 4.进一步地,对最优特征子集的复合故障诊断准确率进行归因分析,量化复合故障因果特征的SHAP值,结果如图6、7所示。具体步骤如下:
[0074] 首先,计算最优特征子集中某个样本包含某些复合故障特征和不包含这些特征对DNN模型预测输出的联合贡献;然后,计算样本中该种特征和其他特征所有可能的组合分别对DNN模型预测输出的边际贡献;最后,计算每种特征边际贡献的加权平均值,即该特征在该样本上对准确率的SHAP值。对最优特征子集中全部样本分别进行执行上述的操作,获得每种特征边际贡献的加权平均值,得到该特征在最优特征子集上对准确率的SHAP值,SHAP值为正,该特征对最终的预测结果是正向推动;反之,一个特征的SHAP值为负,该特征对最终的预测结果是负向的。具体计算方法如式4~6所示:
[0075]
[0076]
[0077]
[0078] 其中整个模型的基线,即所有样本目标变量的均值为ybase;shap(fij)为最优特征子集中第i个样本的第j个特征对复合故障诊断的SHAP值。例如,shap(fi1)是第i个样本中第1个特征对最终预测值yi的贡献值,当shap(fi1)>0,说明该特征提升了预测值,有正向作用;反之,说明该特征使得预测值降低,有反向作用。M是最优特征子集不包含j特征的子集中特征类别的数目, 是每个特征的SHAP值, 是一个常数。对于某个特征j,需要针对所有可能的特征组合及其不同排序计算SHAP值,然后加权求和,式6中F是所有特征的集合,pM∪{j}为训练第j个特征的模型,pM为训练所有特征的模型,pM∪{j}(fM∪{j})‑pM(fM)为比较第j个特征对模型输出的差异,fM表示集合M中输入特征的值,由于特征j的贡献度取决于模型中的其他特征,因此需要为所有可能的子集 计算fM∪{j}(xM∪{j})‑fM(xM),式中的权重可解释为一共有F个特征,则在考虑顺序的情况下这F个特征共有F!种组合,固定了某个特征j,则剩余的有|M|!(|F|‑|M|‑1)!种组合。
[0079] 需要注意的是,公布实施例的目的在于帮助进一步理解本发明,但是本领域的技术人员可以理解:在不脱离本发明及所附权利要求的范围内,各种替换和修改都是可能的。因此,本发明不应局限于实施例所公开的内容,本发明要求保护的范围以权利要求书界定的范围为准。