技术领域
[0001] 本发明涉及计算机视觉技术领域,尤其涉及一种基于改进YOLO‑v5s模型的铁路异物入侵小目标检测方法及系统。
相关背景技术
[0002] 2023年全球轨道交通线路长度达115.27万公里,铁路在支持经济发展方面发挥着越来越重要的作用,庞大的铁路运输网络促进了国家经济社会的发展,但随之而来的安全问题成为了社会关注的重点和高速铁路发展的关键,因此,高速铁路安全监测系统以及异常情况检测手段的自动化、智能化对保障高速铁路的安全运行具有重要意义。在运载能力越来越高、运行速度越来越快的趋势下,异物入侵更容易造成不可逆的破坏。
[0003] 目前,目标检测算法可以分为两类:两阶段检测算法和一阶段检测算法。两阶段检测算法包括卷积神经网络、CNN和R‑CNN,生成包含潜在目标的候选框,然后使用区域分类器对其进行预测。一阶段检测算法,如SSD和YOLO系列,直接对特征图上每个位置的目标进行分类预测,检测速度更快,实用性更强。
[0004] 铁路入侵检测主要有接触式检测和非接触式检测两类方法。接触式检测需要大量硬件的支持,安装麻烦,不适合大规模使用。计算机视觉是一种有效的非接触式入侵检测方法,随着深度学习算法的发展,可以一定程度上实现高检测精度和低误报率,然而在铁路异物入侵检测中,小目标检测因其尺寸小、对比度低、易被背景干扰等特点,一直是技术难点。传统的检测方法往往难以准确识别这些小目标,导致漏检率较高。因此,在复杂的铁路场景中需要一种准确率高、误报率低、速度快的铁路入侵检测方法。
具体实施方式
[0057] 为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合说明书附图对本发明的具体实施方式做详细的说明,显然所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明的保护的范围。
[0058] 在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其他不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施例的限制。
[0059] 其次,此处所称的“一个实施例”或“实施例”是指可包含于本发明至少一个实现方式中的特定特征、结构或特性。在本说明书中不同地方出现的“在一个实施例中”并非均指同一个实施例,也不是单独的或选择性的与其他实施例互相排斥的实施例。
[0060] 本发明结合示意图进行详细描述,在详述本发明实施例时,为便于说明,表示器件结构的剖面图会不依一般比例作局部放大,而且所述示意图只是示例,其在此不应限制本发明保护的范围。此外,在实际制作中应包含长度、宽度及深度的三维空间尺寸。
[0061] 同时在本发明的描述中,需要说明的是,术语中的“上、下、内和外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一、第二或第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
[0062] 本发明中除非另有明确的规定和限定,术语“安装、相连、连接”应做广义理解,例如:可以是固定连接、可拆卸连接或一体式连接;同样可以是机械连接、电连接或直接连接,也可以通过中间媒介间接相连,也可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
[0063] 实施例1
[0064] 参照图1‑图5,为本发明的一个实施例,提供了一种基于改进YOLO‑v5s模型的铁路异物入侵小目标检测方法,通过将YOLO‑v5s模型使用的CIOU损失函数替换为Focal EIOU损失函数,增加了模型的检测精度。同时,在SPPF模块后添加了改进的非参数注意力机制模块M‑SimAM,增强了特征提取能力。此外,将YOLO‑v5s模型的检测头部替换为动态检测头DyHead,以动态调整目标检测的特征表示。最后,通过修改后的铁路异物入侵小目标检测模型对待检测的图像进行检测,获得检测结果。
[0065] 如图1所示,本发明方法包括:
[0066] S100,获取并构建带有标注的铁路异物的数据集;
[0067] 进一步的,S100的具体步骤如下:
[0068] 获取铁路异物数据集,通过labelme制作异物标签;
[0069] 将制作好的异物数标签进行数据增强,数据增强包括旋转、平移、镜像、图片亮暗变换以及高斯模糊处理。
[0070] 具体的,图像旋转公式具体表示为:
[0071]
[0072] 其中,(x,y)表示原始图像中像素点坐标,(x’,y’)表示对应像素点(x,y)经过旋转变换后输出图像像素点的坐标,θ为旋转角度;
[0073] 图像平移公式具体表示为:
[0074]
[0075] 其中,(x0,y0)为图像沿着x轴和y轴方向的平移量;
[0076] 图像垂直镜像变换公式具体表示为:
[0077]
[0078] 图像水平镜像变换公式具体表示为:
[0079]
[0080] 其中,N和M分别代表图像的长度和宽度,(x,y)为原图像坐标,(x’,y’)为变换后的坐标;
[0081] 图像亮暗变换公式具体表示为:
[0082] g(x’,y’)=af(x,y)+β
[0083] 其中f(x,y)为原图像像素,g(x’,y’)为输出图像像素,x和y表示像素位于第x行和第y列,参数a>0和β为增益和偏差参数,分别控制对比度和亮度;
[0084] 高斯模糊变换公式具体表示为:
[0085]
[0086] 其中,r是模糊半径,σ是正态分布的标准偏差。
[0087] 更进一步的,构建数据集还包括:
[0088] 将铁路异物数据集进行标注,分成图片数据集文件以及图片对应标签文件;
[0089] 将标注好的数据集进行分类,分类包括行人、动物、泥石流、落石以及滚木;
[0090] 对处理好的数据集进行预处理,以7:1:2的比例将数据集划分为训练集、验证集和测试集,通过旋转、平移、镜像、图片亮暗变换以及高斯模糊进行数据增强,以增加训练样本数量,从而有效提升模型性能。
[0091] S200,将YOLOv5s模型中的CIOU损失函数修改为Focal EIOU损失函数,对不同目标大小进行平衡的加权;
[0092] 应说明的是,将CIoU损失函数替换为一种更有效的损失函数Focal EIoU,它取代了CIoU损失函数,以提高小目标检测性能。在EIOU的基础上,Focal EIOU结合Focal loss,将焦点集中在更好的锚盒上,从而显著提高了检测小目标的准确性。
[0093] 进一步的,Focal EIOU损失函数表示为:
[0094] LFocal‑EIOU=IOUγLEIOU
[0095]
[0096] 其中,γ是用于控制曲线的超参数,LIOU表示IOU损失,Ldis表示距离损失,Lasp为边2 gt gt 2
长损失,ρ (b,b )表示预测框的中心坐标b和真实框的中心坐标b 之间的欧氏距离,ρ (w,gt gt 2 gt
w )表示预测框的宽度w和实线方框宽度w 之差的平方,ρ(h,h )表示预测盒的高度h和真gt
实箱体的高度h 之差的平方,cw和ch分别表示预测框和目标框的最小外接矩形的宽度和高度,c表示最小外接矩形的对角线长度。
[0097] S300,改进YOLOv5s模型,在SPPF模块后添加改进后的非参数注意力机制M‑SimAM模块,同时处理通道或空间的特征;
[0098] 应说明的是,M‑SimAM模块可以在不增加其他参数的情况下帮助网络提取特征,提高小目标的检测性能。SimAM是一个3D注意力模块,其核心思想是使用基于相似性的加权方法将注意力集中在最相关的部分,引入mish激活函数来代替SimAM中的sigmoid激活函数,由于其平滑性和更好的梯度性能,mish激活函数可以增强模型检测小目标的能力,避免梯度消失或梯度爆炸等问题,从而提高模型的准确性和稳定性。
[0099] 进一步的,引入mish激活函数替换SimAM模块中的sigmoid激活函数,生成新的M‑SimAM模块,M‑SimAM注意力机制的特征图计算表示为:
[0100]
[0101] 其中,X表示输入到M‑SimAM模块的原始特征值, 表示经过M‑SimAM模块增强后的特征输出值。
[0102] S400,将YOLOv5s模型的检测头部替换为动态检测头DyHead,以动态调整目标检测的特征表示;
[0103] 应说明的是,在YOLOv5s模型中,主干网络输出的是一个三维张量,其中包含了关于物体的水平信息、空间信息和通道信息,为了增强模型的感知能力,替换YOLOv5s模型的检测头部,使用一种动态检测检测头DyHead(Dynamic Head),DyHead能够在特征张量的每个特定维度上引入注意力机制,从而实现尺度感知、空间感知和任务感知的统一。
[0104] 具体的,动态检测头DyHead包括:
[0105] 修改YOLOv5s模型的检测头部为动态检测头DyHead,在特征张量的每个特定维度L×S×C上引入注意力机制,即在检测层上给定三维特征张量F∈R ,动态检测检测头的注意力函数表示为:
[0106] W(F)=πC(πS(πL(F)·F)·F)·F
[0107] 其中,πL(·)、πS(·)、πC(·)分别是表示应用在维度L、S、C上的三个不同的注意力函数,这三种注意力顺序应用于检测头部,可以多次叠加使用。
[0108] S500,基于改进后的YOLOv5s模型得到铁路异物入侵小目标检测模型,对待检测试图像进行检测,并对检测结果进行评估。
[0109] 具体的,配置环境变量,设置epoch为300,batch size为16,image size为416*416;
[0110] 通过铁路异物入侵小目标检测模型进行训练,并对待检测试图像进行检测,得到检测结果;
[0111] 基于检测结果进行评估,所涉及的评估指标为mAP@0.5:0.95,通过计算模型在IoU阈值的平均精度,得到评估指标mAP,表示为:
[0112]
[0113]
[0114] 其中,mAP表示平均精度均值,p表示精确度,R表示召回率,TP表示实际为正类预测也为正类的数量,FP表示实际为负类预测为正类的数量,FN表示实际为正类预测为负类的数量,优选的,IoU阈值范围为[0.5,0.95]。
[0115] 需要说明的是,本实施例中,步骤S200中将YOLOv5s模型使用的CIOU损失函数替换为Focal EIOU损失函数,Focal EIOU损失函数在计算距离时考虑了目标框的长度和宽度的纵横比,从而能够更好地处理不同大小的目标框,并在损失函数中对不同目标大小进行更平衡的加权。此外,Focal EIOU对目标框之间的距离使用了更有效的计算方法,使网络模型在训练小目标时更有效。焦斑损失使罕见类别的目标具有更大的权重,使其对小目标检测更敏感。通过引入平衡因子,可以在一定程度上缓解类别失衡问题。在EIOU的基础上,Focal EIOU结合Focal loss,将焦点集中在更好的锚盒上,从而显著提高了检测的准确性。
[0116] 步骤S300中在SPPF模块后添加改进后的非参数注意力机制模块M‑SimAM,针对现有的大多数注意力机制只能关注通道或空间的一维特征,缺乏空间和通道同时处理的灵活性的问题。本发明在非参数注意力机制模块SimAM基础上提出了M‑SimAM模块。该模块可以在不增加其他参数的情况下帮助网络提取特征,提高小目标的检测性能。M‑SimAM是一个3D注意力模块,其核心思想是使用基于相似性的加权方法将注意力集中在最相关的部分。M‑SimAM通过设计能量函数来计算注意力权重。它的大多数操作都是基于能量函数的解决方案,可以灵活有效地增强神经网络中特征的提取。本发明引入mish激活函数来代替SimAM中的sigmoid激活函数,由于其平滑性和更好的梯度性能,mish激活函数可以增强模型检测小目标的能力,避免梯度消失或梯度爆炸等问题,从而提高模型的准确性和稳定性。此外,mish激活函数可以增强模型的泛化能力,使其在更具挑战性的场景中表现更好。
[0117] 步骤S400中将YOLOv5s模型的检测头部替换为动态检测头DyHead(Dynamic Head),将YOLOv5s模型的检测头部替换为一种可同时实现尺度感知注意力、空间感知注意力和任务感知注意力统一的动态检测头DyHead(Dynamic Head),即在特征张量的每个特定维度上添加注意力机制,以动态调整目标检测的特征表示。在本发明模型的设计中,使用了四组πL(·)、πS(·)、πC(·)模块依次叠加,让检测头具备更强的表示能力,从而提升算法对小目标的检测效果。
[0118] 上述为本实施例的一种基于改进YOLO‑v5s模型的铁路异物入侵小目标检测方法的示意性方案。需要说明的是,该基于改进YOLO‑v5s模型的铁路异物入侵小目标检测系统的技术方案与上述的基于改进YOLO‑v5s模型的铁路异物入侵小目标检测方法的技术方案属于同一构思,本实施例中基于改进YOLO‑v5s模型的铁路异物入侵小目标检测系统的技术方案未详细描述的细节内容,均可以参见上述基于改进YOLO‑v5s模型的铁路异物入侵小目标检测方法的技术方案的描述。
[0119] 本实施例中基于改进YOLO‑v5s模型的铁路异物入侵小目标检测系统,包括:
[0120] 收集模块,用于获取并构建带有标注的铁路异物的数据集;
[0121] 第一改进模块,用于将YOLOv5s模型中的CIOU损失函数修改为Focal EIOU损失函数,对不同目标大小进行平衡的加权;
[0122] 第二改进模块,用于改进YOLOv5s模型,在SPPF模块后添加改进后的非参数注意力机制M‑SimAM模块,同时处理通道或空间的特征;
[0123] 第三改进模块,用于将YOLOv5s模型的检测头部替换为动态检测头DyHead,以动态调整目标检测的特征表示;
[0124] 评估模块,用于基于改进后的YOLOv5s模型得到铁路异物入侵小目标检测模型,对待检测试图像进行检测,并对检测结果进行评估。
[0125] 本实施例还提供一种电子设备,适用于基于改进YOLO‑v5s模型的铁路异物入侵小目标检测的情况,包括:
[0126] 存储器和处理器;存储器用于存储计算机可执行指令,处理器用于执行计算机可执行指令,实现如上述实施例提出的实现基于改进YOLO‑v5s模型的铁路异物入侵小目标检测方法。
[0127] 本实施例还提供一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述实施例提出的实现基于改进YOLO‑v5s模型的铁路异物入侵小目标检测方法。
[0128] 本实施例提出的存储介质与上述实施例提出的实现基于改进YOLO‑v5s模型的铁路异物入侵小目标检测方法属于同一发明构思,未在本实施例中详尽描述的技术细节可参见上述实施例,并且本实施例与上述实施例具有相同的有益效果。
[0129] 通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(ReadOnly,Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例的方法。
[0130] 实施例2
[0131] 参照表1,为本发明的一个实施例,提供了一种基于改进YOLO‑v5s模型的铁路异物入侵小目标检测方法,为了验证其有益效果,提供了两种方案的对比结果。
[0132] 首先实验环境与参数设置,本实验的硬件配置为Nvidia RTX3060 GPU和Intel i7‑127002.70GHz CPU,软件环境为Windows11系统下的Pytorch深度学习框架。输入图像大小为640×640,共200个训练轮次。同时,为了加速网络收敛,采用官方预训练权重作为初始权重,网络训练的初始学习率设置为0.01。
[0133] 准备实验数据集,根据实验的需要,建立铁轨异物目标入侵的数据集,来模拟真实环境中的入侵。该数据集以上海应用技术大学200米轨道为实验场地,远距离采集场景中所有可能妨碍铁路系统正常运行的物体,创建铁路异物小目标检测数据集。在实验中,选择行人、汽车、落石和动物等典型异物作为研究对象。这些数据集将用于训练和测试铁路异物检测模型。数据集分为5500个训练集,1000个验证集和1000个测试集,用于评估每种策略的性能的实验。
[0134] 根据下列评价指标来评估模型的性能:平均精确度(mean Average Precision,mAP)记作PmAP、每秒帧数(FPS)和计算量(GLOPs),相关公式如下:
[0135]
[0136]
[0137]
[0138] 其中,Tp为阳性样本被正确分类;TN为阴性样本被正确分类;Fp为阴性样本被错误分类;FN为阳性样本被错误分类。n为所有类别数量;PA为目标类别的平均精确度。
[0139] 最终得出铁路异物入侵小目标检测实验结果,为了验证本算法的有效性和优越性,在同样的训练条件和数据的前提下,将本发明提出的方法与Mask R‑CNN、YOLOv3‑SPP、YOLOv5、YOLOX‑S、YOLOv5X、YOLOv5s等方法进行实验对比,几种模型在数据集上测试并比较了平均精度和处理速度检测结果,实验结果如表1所示。
[0140] 表1:对比实验结果
[0141]
[0142] 对比表1中各种目标检测算法的实验结果,我们可以明显看出本发明算法在平均精确度PmAP指标上显著领先于其他主流算法,表现出卓越的检测精度。相对于原始的YOLOv5s算法,本算法提升了10%,相比YOLOv5,提升了12%,而相比YOLOv3‑SPP,提升了12.9%,与Mask R‑CNN、YOLOX‑S和YOLO5X等算法相比,本发明算法的检测准确率分别提高了15.2%、9.3%和11.3%。相对于检测速度类似的YOLOv5s和YOLOv3‑SPP算法,本算法的检测准确率显著优越;虽然YOLOv5X速度更快,但其检测精度相对较低,难以满足复杂铁路环境下的异物检测需求。
[0143] 本发明算法不仅在平均精确度和检测速度上均优于原始的YOLOv5s目标检测算法,而且在检测精度上有了显著提高,FPS提高了15.85%,达到了速度和精度的平衡。综上所述,本发明算法相较于其他主流算法更加符合复杂道路场景目标检测的实时性和准确性需求。
[0144] 应说明的是,以上实施例仅用于说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。