首页 / 一种基于深度学习网络的玉米种子质量的评估方法

一种基于深度学习网络的玉米种子质量的评估方法实质审查 发明

技术领域

[0001] 本发明涉及玉米种子的质量检测技术领域,特别是涉及一种基于深度学习网络的玉米种子质量的评估方法。

相关背景技术

[0002] 玉米作为全球范围内重要的粮食作物之一,其种子的质量直接关系到农业产出的质量和效率。传统的玉米种子质量检测主要依赖于人工视觉检查和简单的物理方法,这些方法不仅耗时耗力,而且结果的准确性和可重复性差且受人为因素影响较大。在深度学习技术领域,计算机视觉和图像处理的能力为自动化和智能化的玉米种子质量检测提供了新途径。
[0003] 然而,传统的卷积神经网络虽然能够提取图像的空间特征并具有很高的计算效率,却无法精确捕捉种子图像的细微差别。此外,自注意力机制在模型感知和处理全局上下文信息的能力显著提升,但由于计算资源的需求较高,在有限的环境下难以实现稳定、高效处理。

具体实施方式

[0050] 下面将结合本实施例中的附图,对本实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0051] 本发明的目的是提供一种基于深度学习网络的玉米种子质量的评估方法,通过对训练图像进行图像数量平衡处理,增强检测模型的鲁棒性和泛化性;通过PConvEncoder单元和SpeedyEncoder单元实现对特征的精细化和全局表达的提取,以提高模型的分类能力;引入加速模块和数据增强模块,以缩短对迭代的训练时间和提高训练效果。
[0052] 为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明做进一步详细的说明。
[0053] 图1为本实施例提供的评估流程示意图,如图1所示,本发明提供了一种基于深度学习网络的玉米种子质量的评估方法,包括:
[0054] 步骤100:收集待评估玉米种子图像;
[0055] 步骤200:将待评估玉米种子图像输入到预设的玉米种子质量检测模型中,得到目标评估结果;
[0056] 玉米种子质量检测模型的构建过程包括:
[0057] 对预设数据集中不同类别的预设玉米种子图像进行数量平衡处理和归一化操作,得到预处理图像;
[0058] 确定模型结构;模型结构包括:补丁嵌入层、四个特征提取层、四个下采样层以及一个特征转换层;特征提取层和下采样层交叉分布;特征提取层包括:PConvEncoder单元和SpeedyEncoder单元;
[0059] 引入加速模块、数据增强模块、AdamW优化器以及交叉熵损失函数;
[0060] 利用补丁嵌入层降低预处理图像的维度,并提取预处理图像的特征,得到原始特征;
[0061] 利用特征提取层提取原始特征的多尺度特征,得到第一中间特征;
[0062] 利用下采样层降低第一中间特征的空间尺寸和增加第一中间特征的通道数量;
[0063] 利用特征转换层对最后一个特征提取层输出的第一中间特征的特征进行增强,得到分类概率;
[0064] 基于分类概率和预设数据集中预处理图像的真实质量数据,利用交叉熵损失函数计算损失值;
[0065] 根据损失值,利用加速模块、数据增强模块以及AdamW优化器对模型结构的参数进行优化并迭代,得到迭代完成的玉米种子质量检测模型。
[0066] 具体地,对预设数据集中不同类别的预设玉米种子图像进行数量平衡处理和归一化操作,得到预处理图像,包括:
[0067] 构建生成对抗网络;生成对抗网络包括:生成器和判别器;生成对抗网络的参数包括:epoch、生成学习率、判别学习率以及批量大小;
[0068] 将随机噪声和预设玉米种子图像的标签传递给生成器,经过生成器和判别器的交替训练,得到生成图像;
[0069] 将生成图像与预设玉米种子图像混合,得到类别平衡的样本数据集;
[0070] 对样本数据集进行归一化操作,得到预处理图像。
[0071] 进一步地,利用特征提取层提取原始特征的多尺度特征,得到第一中间特征,包括:
[0072] 利用PConvEncoder单元提取原始特征的局部精细特征;
[0073] 利用SpeedyEncoder单元提取原始特征的局部‑全局表示特征。
[0074] 可选地,补丁嵌入层采用ReLU激活函数;特征提取层采用GeLU激活函数。
[0075] 优选地,数据增强模块的参数设置包括:MixUp为1、CutMix为0.8、颜色抖动比例为0.4、RandAugment幅度为9、标准差为0.5、标签平滑为0.1以及梯度裁剪上限为0.01。
[0076] 进一步地,还包括:
[0077] 计算玉米种子质量检测模型的精确度、召回率、F1分数以及准确度,得到模型性能参数;
[0078] 利用模型性能参数对玉米种子质量检测模型进行评估,得到模型性能和泛化评估结果。
[0079] 具体地,生成学习率和判别学习率的优化策略采用余弦退火策略;余弦退火策略的优化公式为 lr(t)为第t次迭代的目标学习率;lrmin为目标学习率的最小值;lrmax为目标学习率的最大值;Tmax为目标学习率达到最小值经历的迭代次数;t为当前迭代次数;目标学习率包括:生成学习率和判别学习率中的任一个。
[0080] 进一步地,利用SpeedyEncoder单元提取原始特征的局部‑全局表示特征,包括:
[0081] 基于自注意力算法,利用两个初始化矩阵将输入SpeedyEncoder单元的嵌入矩阵转换成查询矩阵和密钥矩阵;
[0082] 计算查询矩阵和SpeedyEncoder单元的可学习参数向量,得到全局注意力查询向量;全局注意力查询向量的计算公式为: α为全局注意力查询向量;Q为查询矩阵;Wa为可学习参数向量;d为嵌入矩阵的维度;
[0083] 对全局注意力查询向量进行池化,得到全局查询向量;全局查询向量的池化计算公式为: q为全局查询向量;αi为第i个全局注意力查询向量;Qi为第i个查询矩阵;n为嵌入矩阵的数量;
[0084] 利用逐元素乘积法对全局查询向量和密钥矩阵的交互进行编码,得到局部‑全局表示特征;局部‑全局表示特征的编码公式为: 为局部‑全局表示特征;K为密钥矩阵;q为所述查询向量; 为归一化查询矩阵;T为线性变换计算。
[0085] 参考图2,对数据集中的玉米种子图像进行预处理后获得新数据集,具体包括:将数据集中不同类别(破损、变色、纯色、丝切)的玉米种子通过生成对抗网络进行数量平衡处理;生成对抗网络的结构如图2所示,其包括一个生成器与一个判别器;对抗网络包括:500个epoch,生成器和判别器学习率分别设置为5e‑5和2e‑4,批量大小为128。通过将随机噪声和标签传递给生成器并在不断交替训练下获得逼真的玉米种子生成图像,将符合真实玉米种子形态的生成图像与原始玉米种子数据集混合,得到类别平衡的样本数据集。对数量平衡处理后的图像进行归一化操作,获得最终可被输入到网络模型的预处理图像。
[0086] 参考图3,构建结合卷积神经网络和自注意力机制的玉米种子质量检测轻量化模型;质量检测模型具体结构包括1个补丁嵌入层、4个特征提取层、4个下采样层与1个特征转换层。在整个网络模型中,位于第一层的补丁嵌入层由两个步长为2的3*3卷积实现,用于降低输入的玉米种子图像的空间尺寸并提取出原始特征。4个特征提取层通过不同的配置来捕捉从局部到全局的特征,每一层包含特定数量的PConvEncoder和SpeedyEncoder单元,尺度分别为3、3、6、4,以有效地提升模型对玉米种子图像中多尺度特征的理解能力。
[0087] 参考图4,PConvEncoder负责局部的精细特征提取,由部分卷积和两个逐点卷积组成。参考图5,SpeedyEncoder负责学习丰富的局部‑全局表示,由部分卷积、高效的注意力模块与线性层组成。
[0088] 进一步地,在相邻特征提取层之间都存在一个下采样层用于减少数据的空间尺寸并增加特征的通道数量。最终通过特征转换层,尤其是上下文广播模块进一步提升了特征的综合表达能力。经过上下文广播模块处理后的特征被送入最后的分类器,输出最终的类别概率,预测出玉米种子的质量分类。
[0089] 具体地,作为上述网络结构的补充,自注意力机制、部分卷积以及上下文广播模块起到至关重要的作用;相比较自注意力机制,本实施例采用了高效自注意力,利用查询键交互的集成线性投影层来有效地编码和学习标记之间的关联,以提升处理速度并强化上下文捕获能力,不仅保持了模型性能,而且优化了计算资源的使用。
[0090] 参考图6,模型计算过程包括:
[0091] 利用两个初始化矩阵Wq、WK将输入嵌入矩阵x转换为查询(Q)和密钥(K);其中,( 表示所有n×d维实数矩阵的集合), ( 表示所有d×d维实数矩阵的集合),n为令牌长度,d为嵌入向量的维度;将查询矩阵Q乘以可学习参数向量 ( 表示所有d维实数向量的集合)以学习查询注意力权重,产生全局注
意力查询向量 ( 表示所有n维实数向量的集合),其计算公式如下:
[0092]
[0093] 根据学习到的注意力权重对查询矩阵进行池化,产生单个全局查询向量其计算公式如下:
[0094]
[0095] 使用逐元素乘积对全局查询向量 和密钥矩阵 之间的交互进行编码,以形成全局上下文 其计算公式如下:
[0096]
[0097] 参考图7,部分卷积通过跨特定输入通道进行选择性卷积,并最大限度地减少内存访问,优化了每秒浮点运算的数量,进一步提高了计算效率。
[0098] 参考图8,上下文广播模块通过对特征进行均匀池化并将全局信息广播回原始特征,增强了模型的特征表示能力并优化了对复杂图像的理解和分类性能,计算过程如下:
[0099] 假设有N个令牌的序列 ( 表示所有N×d维实数矩阵的集合),上下文广播模块将平均池化令牌返回给令牌:
[0100]
[0101] CB()表示利用上下文广播模块进行计算;N表示假设的令牌个数,Xi代表X中的第i个标记。
[0102] 具体地,玉米种子质量检测模型的训练具体包括:
[0103] 将预处理后新得到的玉米种子数据集按照8:2划分训练集与验证集;经过数据增强技术处理(MixUp设置为1、CutMix设置为0.8、颜色抖动设置比例为0.4、RandAugment设置幅度为9、标准差为0.5、设置标签平滑为0.1以及梯度裁剪上限为0.01)的训练集输入至玉米种子质量检测模型中并引入加速模块通过无偏动态数据修剪技术实现训练加速,最终获得一组输出向量;其中,MixUp技术通过在图像和标签级别进行线性插值,组合两个训练样本的特征及其标签,从而生成新的训练样本,其计算过程如下:
[0104] 1)设置两个数据点(xi,yi)和(xj,yj);xi表示第i个图像;yi表示第i个图像的标签;
[0105] 2)通过xnew=λxi+(1‑λ)xj,ynew=λyi+(1‑λ)yj生成新的数据点(xnew,ynew),λ是从[0,1]范围内的Beta分布中随机抽取的。
[0106] CutMix技术则是将一部分图像从一个图像中剪切并粘贴到另一个图像中,同时调整标签的比例来反映图像的内容比例;训练过程中,采用余弦退火策略动态调整学习率,根据余弦曲线逐步减小学习率,以促进更平滑的模型收敛并提高效率,其计算公式如下:
[0107]
[0108] 其中,lr(t)是第t次迭代的学习率;lrmin是学习率的最小值;lrmax是学习率的最大值,通常是训练开始时的初始学习率;t是当前选代次数;Tmax是在学习率达到最小值前经过的选代次数。
[0109] 采用AdamW优化器进行模型优化,该优化器将权重衰减集成到优化过程中,增强训练稳定性并减轻过度激进的权重衰减可能带来的问题,其优化过程包括:
[0110] 1)计算梯度的第一(m)和第二(v)矩估计;
[0111] mt=β1mt‑1+(1‑β1)gt
[0112]
[0113] 其中,gt是第t次迭代的梯度,β1和β2是估计的衰减率(通常接近1);mt为第一矩估计梯度的移动平均值,代表了梯度的方向;vt为第二矩估计梯度的移动平均值,代表了梯度的方差;β1控制梯度移动平均的衰减率;β2控制梯度方差移动平均的衰减率;
[0114] 2)对m和v进行偏差修正;
[0115]
[0116] 偏差修正后的第一矩估计,这是修正后的梯度移动平均值,用于权重更新;偏差修正后的第二矩估计,这是修正后的梯度方差的移动平均值,用于权重更新时调整学习率; 的t次幂,表示在第t次迭代时的权重衰减;
[0117] 3)更新权重,包括权重衰减;
[0118]
[0119] 其中,wt是第t次迭代时的权重,ηt是第t次迭代的学习率,∈是一个非常小的数,防‑8止除以零(通常为10 ),σ是权重衰减系数;
[0120] 为确保模型输出的预测概率分布与实际标签保持一致,通过交叉熵损失函数计算模型输出的预测概率分布和真实标签的独热编码之间的距离,不断最小化这个距离,计算公式如下:
[0121]
[0122] Lavg代表样本的交叉熵损失值;C代表类别数;yi,j代表代表第j样本第i个类别的目标标签的独热编码值,实际类别为1,其他类别为0;pi,j代表模型预测的第j个样本属于第i个类别的概率;N1代表数据集中样本的数量;Lj代表第j个样本的交叉熵损失。
[0123] 通过精确度、召回率、F1分数和准确度等评价指标,全面评估并不断优化模型的性能,以确保模型在玉米种子质量评估中的准确性和可靠性。
[0124] 参考图9,将测试集输入到训练成熟的质量检测模型中,得到预测输出,本实施例检测模型的准确率达到84.12%;玉米种子图像预测的混淆矩阵如图9所示。
[0125] 可选地,将本实施例质量检测模型与其他八种分类网络进行对比,评估模型的分类性能和泛化性;将平衡数据集分别输入至AlexNet、VGG16、ResNet18、ResNet34、ResNet50、ResNet101、MobileNetV2以及SqueezeNet网络模型中,每个网络都采用200个epoch的加速训练策略,所有比较网络中分类层的神经元数量被标准化为4,在每个网络的主干结构保持不变的情况下,采用迁移学习来训练主干,确保了实验结果的可靠性。实验结果如下表1所示:
[0126] 表1
[0127]模型 准确率(%) F1分数 参数量(MB)
AlexNet 68.07 68.32 57.02
VGG16 77.58 77.13 134.28
MobileNetv2 76.45 76.34 2.23
SqueezeNet 67.67 67.31 0.74
ResNet18 80.99 80.94 11.18
ResNet34 81.85 81.76 21.29
ResNet50 82.16 82.03 23.52
ResNet101 81.93 81.93 42.51
本实施例 84.12 84.03 3.66
[0128] 进一步地,由表1可知,本实施例在识别准确率、F1分数和参数量方面取得了良好的平衡。与其他模型相比,本实施例不仅保持了较高的分类性能,还显著减少了参数量,展示了优越的效率和泛化能力。
[0129] 具体地,利用初始数据集和通过生成对抗网络生成的平衡数据集进行实验,确保质量检测模型在平衡数据集上的有效性,初始数据集的实验结果如表2,平衡数据集的实验结果如表3所示;其中,broken:在物理上有损伤的种子;discolored:颜色异常的种子;pure:优质种子;silkcut:一种缺陷,表现为玉米籽粒顶部或侧面的破裂,同时有丝状物嵌入这些破裂区域。
[0130] 表2
[0131]
[0132] 表3
[0133]
[0134]
[0135] 进一步地,由表2和表3可知,本实施例在平衡数据集的召回率、精确度和F1分数方面均显著优于初始数据集,进一步验证了平衡数据集的有效性,增强了质量检测模型的性能。
[0136] 优选地,将质量检测模型的不同关键结构进行消融测试,得出每个组件对模型性能指标的影响;实验在200个epoch的平衡数据集上进行,主要关注关键结构包括高效自注意力机制、部分卷积、上下文广播和加速训练,统计结果如表4所示:
[0137] 表4
[0138]
[0139] 进一步地,随着组件的逐步集成,准确性和F1分数都呈现出上升的轨迹,组件之间的协同相互作用有效地提高了模型的性能。
[0140] 本发明的有益效果如下:
[0141] 本发明通过对训练图像进行图像数量平衡处理,增强了检测模型的鲁棒性和泛化性;通过PConvEncoder单元和SpeedyEncoder单元实现了对特征的精细化和全局表达的提取,提高了模型的分类能力;通过引入加速模块和数据增强模块,缩短了对迭代的训练时间和提高了训练效果。
[0142] 本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。
[0143] 本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

当前第1页 第1页 第2页 第3页