首页 / 一种用于工业交换机的故障检测可视化处理系统及方法

一种用于工业交换机的故障检测可视化处理系统及方法公开 发明

技术领域

[0001] 本发明涉及人工智能技术领域,具体为一种用于工业交换机的故障检测可视化处理系统及方法。

相关背景技术

[0002] 工业交换机在工业自动化和控制系统中起着关键作用,它们用于连接和管理工业网络中的各种设备和传感器,确保数据的可靠传输。然而,随着工业自动化水平的提高和工业网络规模的扩大,工业交换机的稳定性和可靠性面临越来越大的挑战。一旦工业交换机发生故障,可能会导致整个工业系统的瘫痪,造成巨大的损失。因此,实时监测和诊断工业交换机的运行状态,及时发现和处理故障,已成为工业自动化领域的研究热点。
[0003] 许多现有系统只能在故障发生后进行诊断,缺乏对故障的早期预警和预测能力,难以及时采取预防措施,减少故障带来的影响。现有系统通常在本地进行所有的数据处理和模型训练,计算资源有限,处理速度慢,难以实时应对大量数据的处理需求。许多现有系统缺乏智能分析能力,无法自动追踪故障源头,分析故障传播路径,并基于历史数据提供修复建议和预防措施。

具体实施方式

[0022] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0023] 请参阅图1和图2,本发明提供技术方案:根据本发明的一个实施例,如图1一种用于工业交换机的故障检测可视化处理方法的步骤示意图所示,一种用于工业交换机的故障检测可视化处理方法,所述方法包括:
S100、从不同数据源收集工业交换机的运行数据,所述数据源包括传感器数据、日志数据和流量数据,进行多源数据融合,构建为多源数据融合数据集,记录进入历史数据;
S200、从工业交换机的历史数据中提取异常特征,使用随机森林算法训练故障诊断模型,将实时数据输入模型,进行故障预测和诊断;
S300、根据用户需求,设计可视化界面,使用若干种图形展示工业交换机的运行状态和故障信息;提供实时刷新、历史回溯和故障定位的功能;
S400、在发现故障后,自动追踪故障源头,分析故障传播路径,基于故障类型和历史数据,使用贝叶斯网络基于历史数据建立传感器数据、日志数据和流量数据之间的关联模型,提供修复建议和预防措施;
S500、分析需要进行初步故障检测的数据,在工业交换机本地进行初步故障检测,用于减少数据传输延迟,过滤掉正常数据后,将剩余数据和模型训练任务移至云端,实时同步边缘与云端数据。
[0024] 根据步骤S100,从安装在工业交换机上的各类传感器收集传感器数据,所述传感器包括温度传感器、电压传感器和振动传感器;从交换机的系统日志中收集日志数据,所述系统日志包括启动日志、错误日志和事件日志,日志数据记录交换机的操作历史和异常事件;从交换机的网络接口采集流量数据,流量数据反映网络的运行状态和性能;对采集到的原始数据进行清洗,去除噪声数据和异常值,将不同来源的数据转换为统一的格式,对各数据源的时间戳进行对齐,进行多源数据融合,构建为多源数据融合数据集。
[0025] 本实施例的实验环境如下:数据采集周期:1秒;数据集时间跨度:1个月;数据源:温度传感器、电压传感器、振动传感器、系统日志、流量数据;数据记录格式:JSON。
[0026] 根据步骤S100,通过温度传感器收集温度数据,记录时间和温度值,通过电压传感器收集电压数据,记录时间和电压值,通过振动传感器收集振动数据,记录时间和振动强度值,通过启动日志,记录交换机的启动时间、启动过程中的事件,通过错误日志,记录交换机运行过程中发生的错误信息,通过事件日志记录工业交换机系统的各类事件;将所有数据统一为JSON格式,每条记录包含时间戳和数据值;进行多源数据融合时需要对数据提取特征,从传感器数据中提取温度、电压和振动的平均值、最大值、最小值、标准差、变化率、峰值持续时间和异常次数,从日志数据中提取关键事件的时间、事件类型和错误代码,从流量数据提取流量的总量、峰值、平均值和传输速率;
创建数据库,所述数据库中的表包含所有特征字段,对于每个时间点,将不同数据源中的特征值进行匹配和整合,构建为多源数据融合数据集。
[0027] 温度传感器:记录了每秒的温度值,数据格式如 {"timestamp": "2023‑06‑01T00:00:00Z", "temperature": 25.4};电压传感器:记录了每秒的电压值,数据格式如 {"timestamp": "2023‑06‑01T00:00:00Z", "voltage": 220};振动传感器:记录了每秒的振动强度,数据格式如 {"timestamp": "2023‑06‑01T00:00:00Z", "vibration": 
0.002}。
[0028] 启动日志:记录了每次启动的时间和过程中的事件,数据格式如 {"timestamp": "2023‑06‑01T00:00:00Z", "event": "boot", "detail": "success"};错误日志:记录了发生的错误信息,数据格式如 {"timestamp": "2023‑06‑01T00:00:00Z", "error_code": 404, "message": "not found"};事件日志:记录了系统中的各类事件,数据格式如 {"timestamp": "2023‑06‑01T00:00:00Z", "event_type": "update", "detail": "software update"}。
[0029] 流量总量:记录了每秒的流量值,数据格式如 {"timestamp": "2023‑06‑01T00:00:00Z", "flow_total": 100};流量峰值:记录了每秒的峰值流量,数据格式如 {"timestamp": "2023‑06‑01T00:00:00Z", "flow_peak": 120};平均流量:记录了每秒的平均流量,数据格式如 {"timestamp": "2023‑06‑01T00:00:00Z", "flow_average": 80};
传输速率:记录了每秒的传输速率,数据格式如 {"timestamp": "2023‑06‑01T00:00:
00Z", "transfer_rate": 1000}。
[0030] 根据步骤S200,从工业交换机的历史数据中提取异常特征的步骤如下:S201‑1、针对一段时间内的温度平均值,评估工业交换机的热稳定性;针对最高温度和最低温度,检测温度是否超出安全范围;针对温度波动的标准差,评估温度稳定性;针对温度的变化率,识别温度突变情况;针对温度超过某一阈值的峰值持续时间,识别过热情况;针对温度的异常次数,用于判断工业交换机是否存在异常热现象,所述异常次数表示超过预设阈值的次数;
S201‑2、针对一段时间内的电压平均值,评估供电稳定性;针对最高电压和最低电压,检测电压是否超出安全范围;针对电压波动的标准差,评估供电稳定性;针对电压的变化率,识别电压突变情况;针对电压超过某一阈值的峰值持续时间,识别过压或欠压情况;
针对电压的异常次数,用于判断工业交换机是否存在异常供电现象;
S201‑3、针对一段时间内的振动平均值,评估工业交换机的振动强度;针对最高振动和最低振动,检测振动是否超出安全范围;针对振动波动的标准差,评估振动稳定性;针对振动的变化率,识别振动的突变情况;针对振动超过某一阈值的峰值持续时间,识别过振动情况;针对振动的异常次数,判断工业交换机是否存在异常振动现象;
S201‑4、针对交换机每次启动的时间,提取启动过程中事件的发生时间和类型,识别启动过程中的异常行为;针对错误日志中的错误发生时间,提取错误类型和错误代码,识别错误类型,统计一段时间内的错误发生频次,评估工业交换机的稳定性;针对工业交换机系统中各类事件的发生时间,提取事件类型和描述,识别常见和异常事件,统计一段时间内的事件发生频次;
S201‑5、针对一段时间内的流量总量,评估网络负载;针对一段时间内的流量峰值,识别网络流量的高峰时段;针对一段时间内的平均流量,评估网络的日常使用情况;针对一段时间内的数据传输速率,评估网络性能。
[0031] 根据步骤S200,使用随机森林算法训练故障诊断模型并对实时数据进行故障预测和诊断的步骤如下:S202‑1、根据历史数据,将数据集中的每条记录进行标签化,分为“正常状态”和“故障状态”,将数据集按比例划分为训练集和测试集;
S202‑2、设置随机森林的超参数,所述超参数包括决策树的数量、每棵树的最大深度和最小样本分裂数,使用设置的超参数初始化随机森林模型;在本实施例中,树的数量设置为:100, 150, 200,最大树深度设置为:10, 20, 30;最小样本分裂数设置为:2, 4, 6,最小样本叶子数设置为:1, 2, 3。
[0032] S202‑3、从训练集中随机抽样生成多组样本子集,每组子集用于训练一棵决策树;在每棵决策树的分裂过程中,从全部特征中随机选择一部分特征进行分裂,以减少相关性和过拟合;
S202‑4、根据选定的特征和样本子集,计算各分裂点的基尼指数或信息增益,选择最佳分裂点,逐层构建决策树,直到满足停止条件;
S202‑5、将所有构建好的决策树组合成一个随机森林模型,通过投票综合各决策树的预测结果;
S202‑6、将测试集数据输入训练好的随机森林模型,进行故障预测;计算模型的准确率、召回率和F1分数,评估模型性能;生成混淆矩阵,分析模型的分类效果,识别误判和漏判情况;
S202‑7、从随机森林模型中提取各特征的重要性评分,识别对故障诊断有重要影响的特征;根据特征重要性分析结果,优化特征提取和选择,去除冗余特征;
S202‑8、使用网格搜索,调整随机森林的超参数,寻找最佳参数组合;进行k折交叉验证,评估不同参数组合下模型的性能,选择最优模型;通过剪枝和增加正则化,防止模型过拟合;根据优化结果,更新随机森林模型;
S202‑9、将实时提取的特征输入训练好的随机森林模型,模型输出预测结果,判断当前状态是否存在故障前兆或异常行为;将预测结果反馈到监控系统,进行实时预警和故障诊断。
[0033] 根据步骤S202‑8,使用网格搜索调整随机森林的超参数时,首先,确定随机森林模型中需要调整的超参数,包括树的数量n_estimators、最大树深度max_depth、最小样本分割数min_samples_split、最小样本叶子数min_samples_leaf等。其中,n_estimators:从50到200之间,每隔50取一个值;max_depth:从10到50之间,每隔10取一个值;min_samples_split:从2到10之间,每隔2取一个值;min_samples_leaf:从1到5之间,每隔1取一个值;通过遍历所有超参数的取值范围,生成所有可能的参数组合;对于每个参数组合,训练随机森林模型,使用预定的评价指标对模型性能进行评估。
[0034] 进行5折交叉验证时,将数据集分成5个等大小的子集,对于每个参数组合,进行5次训练和验证,每次使用5个子集中的4个进行训练,剩下的1个子集进行验证,每次训练和验证后,记录模型的性能指标,对5次验证的结果进行平均,得到该参数组合的平均性能指标,比较所有参数组合的平均性能指标,选择性能最优的参数组合。
[0035] 在构建决策树时,通过设置最大树深度max_depth来限制树的生长,防止生成过深的树。设置最小样本分割数min_samples_split,确保每次分裂至少有一定数量的样本,从而减少树的复杂度。设置最小样本叶子数min_samples_leaf,保证每个叶子节点至少有一定数量的样本,避免过拟合。通过增加树的数量n_estimators,让模型更加稳定,减小单颗树过拟合的风险。使用袋装Bootstrap采样技术,训练每棵树时使用不同的样本子集,使得每棵树都具有一定的随机性,提高模型的泛化能力。引入特征选择,通过限制每次分裂时考虑的特征数量max_features,让模型更加简单,有助于防止过拟合。
[0036] 测试集上的模型评估:准确率:98%,召回率:95%,F1分数:96%,生成混淆矩阵,分析模型的分类效果,识别误判和漏判情况。提取各特征的重要性评分,识别对故障诊断有重要影响的特征,优化特征提取和选择。
[0037] 对于特征重要性,温度变化率:35%,电压峰值持续时间:25%,振动标准差:20%,错误日志频次:15%,流量总量:5%。
[0038] 根据步骤S300,可视化界面包括以下区域:仪表盘区域显示实时数据,历史数据图表区域展示各项指标的历史变化趋势,故障信息区域显示故障记录和详细信息,操作区域提供用户交互功能;通过与工业交换机的数据接口进行实时通信,定期获取最新的传感器数据、日志数据和流量数据;将最新数据更新到可视化界面,刷新图表和仪表盘;允许用户设置自动刷新频率;
提供日期和时间范围选择功能,用户能够选择特定时间段,查看该时段内的历史数据;根据用户选择的时间范围,从数据库中查询相应的历史数据,并在图表区域展示各项指标的历史变化趋势;提供时间轴滑动功能,用户能够通过滑动时间轴浏览不同时间点的历史数据;
在故障信息区域,实时显示最新的故障记录,用户点击某条故障记录,能够查看该故障的详细信息;提供故障趋势分析图表,展示不同类型故障的历史发生频次和变化趋势;
如果工业交换机安装在不同地理位置,提供故障定位地图,显示各故障的发生地点和分布情况。
[0039] 根据步骤S400,从故障记录中提取相关的传感器数据、日志数据和流量数据,分析故障发生前的异常特征,确定故障源头;结合传感器数据、日志数据和流量数据,进行多源数据关联分析,识别与故障相关的事件和行为;对故障发生前的时间序列数据进行分析,识别出故障传播的时间点和路径;使用贝叶斯网络基于历史数据建立传感器数据、日志数据和流量数据之间的关联模型,将不同数据源之间的关联关系进行表示;当检测到故障时,通过关联模型分析各数据源之间的关系,识别故障传播路径;确定哪些数据特征和事件是相互关联的,并生成对应的时间顺序;在关联模型中,识别出关键节点,所述关键节点包括异常传感器、错误日志和流量峰值;根据关键节点和时间序列数据,追踪故障传播路径;
根据故障类型,将故障进行分类,每种故障类型对应不同的修复方法和预防措施;
将当前故障与历史数据中的故障记录进行匹配,找出相似故障的处理经验和结果;根据故障类型和历史数据,使用预定义的规则生成修复建议;使用随机森林算法,根据历史故障数据和修复记录,自动生成修复建议。
[0040] 使用贝叶斯网络建立关联模型时,将每种数据特征定义为贝叶斯网络中的一个节点,定义各节点之间的先验依赖关系,使用K2算法从历史数据中学习节点之间的依赖关系,构建贝叶斯网络结构;使用历史数据,通过贝叶斯估计,计算贝叶斯网络中各节点的条件概率表,对贝叶斯网络模型进行参数优化;使用贝叶斯网络进行故障传播路径分析,推理温度异常、电压波动和振动异常之间的因果关系,确定故障传播路径;在实时故障检测过程中,根据最新数据动态更新贝叶斯网络模型,通过实时推理确定当前故障的传播路径和源头;使用测试数据集验证贝叶斯网络模型的准确性和性能,评估故障源头识别和传播路径分析的效果;根据验证结果,对贝叶斯网络模型进行优化,进行结构调整和参数更新。
[0041] 根据步骤S500,使用预定义的阈值和规则进行初步故障检测,使用简单线性回归对关键特征进行初步故障检测,当温度超过安全范围、电压发生波动或振动强度超标时,触发故障检测;对已检测出的故障和异常数据进行标记,并将标记数据保存在本地;过滤掉正常数据,仅传输标记数据和相关特征到云端;边缘设备和云端服务器之间建立双向数据同步机制,采用增量同步方式,仅传输新增和变化的数据;边缘设备和云端服务器共享故障检测信息,云端服务器生成的建议和预防措施,通过同步机制反馈给边缘设备。
[0042] 根据本发明的另一个实施例,如图2一种用于工业交换机的故障检测可视化处理系统的系统结构图所示,一种用于工业交换机的故障检测可视化处理系统,其特征在于,包括:多源数据融合模块:包括:数据采集单元和数据融合单元;其中,数据采集单元负责从不同数据源收集工业交换机的运行数据,所述数据源包括传感器数据、日志数据和流量数据,数据融合单元负责进行多源数据融合,构建为多源数据融合数据集,记录进入历史数据;
故障诊断模块:包括:特征提取单元、模型训练单元和实时预测单元;其中,特征提取单元负责从工业交换机的历史数据中提取异常特征,模型训练单元使用随机森林算法训练故障诊断模型,实时预测单元负责将实时数据输入模型,进行故障预测和诊断;
可视化界面模块:包括:用户界面单元和功能交互单元;其中,用户界面单元根据用户需求,设计可视化界面,使用若干种图形展示工业交换机的运行状态和故障信息,功能交互单元提供实时刷新、历史回溯和故障定位的功能;
故障分析模块:包括:故障追踪单元和贝叶斯网络单元;其中,故障追踪单元在发现故障后,自动追踪故障源头,分析故障传播路径,贝叶斯网络单元基于故障类型和历史数据,使用贝叶斯网络基于历史数据建立传感器数据、日志数据和流量数据之间的关联模型,提供修复建议和预防措施;
边缘计算模块:包括:初步检测单元、数据传输单元和数据同步单元;其中,初步检测单元分析需要进行初步故障检测的数据,在工业交换机本地进行初步故障检测,用于减少数据传输延迟,数据传输单元负责过滤掉正常数据后,将剩余数据和模型训练任务移至云端,数据同步单元负责实时同步边缘与云端数据。
[0043] 在本实施例中,故障分析模块在检测到故障后,自动追踪故障源头,通过分析传感器数据和日志数据,确定故障发生的时间和位置。在某时刻检测到温度异常升高,同时日志记录显示电源故障,故障追踪单元确定故障源头为电源模块。
[0044] 故障追踪单元对于故障一,部分追踪结果如下:故障类型:电压异常波动;故障源头:电源模块;故障传播路径:电压异常 ‑>温度升高 ‑>系统重启;追踪时间:1秒;对于故障二,部分追踪结果如下:故障类型:网络流量过高;故障源头:网络接口过载;故障传播路径:流量峰值 ‑>数据传输速率下降 ‑>网络性能下降;追踪时间:2秒。
[0045] 贝叶斯网络单元针对故障一,部分处理结果如下:历史数据分析:基于过去1个月的数据,分析出电压异常与温度升高之间的关联性;模型结果:电压异常波动 ‑>温度升高 ‑>系统重启;修复建议:检查电源模块,确保电压稳定;增加温度监控;预防措施:安装备用电源模块,设定温度报警阈值。
[0046] 贝叶斯网络单元针对故障二,部分处理结果如下:历史数据分析:基于过去1个月的数据,分析出网络流量过高与系统性能下降之间的关联性;模型结果:流量峰值 ‑>数据传输速率下降 ‑>网络性能下降;修复建议:优化网络接口配置,增加带宽;预防措施:监控流量峰值,设定流量报警阈值。
[0047] 需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
[0048] 最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页 第1页 第2页 第3页
相关技术
化处理相关技术
处理系统相关技术
陈四军发明人的其他相关专利技术