技术领域
[0001] 本发明涉及一种作物籽粒识别技术领域,特别是涉及一种基于改进YOLOX的作物籽粒识别方法、装置及介质。
相关背景技术
[0002] 农业作物籽粒种类繁多,主要包括水稻、小麦、玉米、大豆、棉花、油菜、花生、马铃薯、大白菜和结球甘蓝等,农业作物籽粒个体识别是一种现代化的技术手段,主要应用于作物栽培和育种等领域。这项技术利用计算机图像处理技术,可以快速准确地识别出作物籽粒的数量,这种技术不仅提高了农作物的质量,也极大地降低了农业生产的成本,并促进了我国粮食在国际市场的竞争水平。
[0003] 由于需要在规定的时间内完成作物籽粒数量的统计,所需大量人工统计,耗费大量人力物力。而在目前的实际运用中,科研人员主要通过相机拍摄的RGB图像进行图像处理技术,从而来识别作物籽粒数量。但是在作物籽粒表型的测量中能够提取的性状类型较少,还有些作物籽粒的表型特征尺寸较小,不足以检测图像中的所有籽粒,计数精度降和测量效率逐渐成为关注的重点。虽然半自主检测算法已经被开发出来,但全自动作物籽粒识别仍然不可用。因此,为了能够快速识别作物籽粒图像,需要一种高精度、高效率的全自动计数的方法迫在眉捷。
具体实施方式
[0049] 下面将结合附图和具体实施方式,对本发明作进一步描述。
[0050] 如图1所示,一种基于改进YOLOX的作物籽粒识别方法,包括下述步骤:
[0051] 步骤1:采集双目视觉下的作物籽粒图像:通过工业双目点云摄像机对作物籽粒进行拍摄,在对作物籽粒进行拍摄时,根据作物籽粒外观颜色的特点,调整背景板颜色并外加特定颜色可见光源同时工作,利用双目摄像头获取待识别作物籽粒均匀分布的三维点云图像和RGB彩色图像;
[0052] 步骤2:图像数据压缩:对步骤1中双目摄像头获取的作物籽粒的三维点云图像和RGB彩色图像分别进行图像处理,对所述三维点云图像进行经纬特征和梯度特征提取,得到第一特征数据,对所述RGB彩色图像进行灰度特征和梯度特征提取,得到第二特征数据,对第一特征数据和第二特征数据进行融合,得到融合后的图像;
[0053] 步骤3:待识别的作物籽粒图像输入改进后YOLOX网络:对步骤2中融合后的图像分别输入到YOLOX主干网络、空洞卷积神经网络、Inception V3网络中,对作物籽粒进行特征提取,并将三种特征进行融合;再根据卷积注意力机制模块的方法对融合后的特征图进行增强,得到新特征图;
[0054] 步骤4:识别与计数结果:对改进后YOLOX网络模型进行训练与测试,得到改进后模型的权重模型,并根据训练和校验数据对模型参数进行调整,每张籽粒图像中的籽粒检测精度有所提升,能较好地应用于对籽粒图像中籽粒体的识别,为自动检测籽粒打下基础。
[0055] 上述的步骤2包括以下步骤:
[0056] 步骤2.1:将所述步骤1中双目摄像头第一图像传感器采集到的三维点云图像和双目摄像头第二图像传感器采集到的RGB彩色图像进行分别进行预处理;
[0057] 步骤2.2:对步骤2.1的三维点云图像进行高斯滤波去噪,滤掉图像中的离群点;
[0058] 步骤2.3:对所述步骤2.2的三维点云图像,依据三维点云图像的三维坐标,计算作物籽粒的经纬特征;坐标点为(X,Y,Z),R为半径,Lat为纬度角,Lng为经度角,计算公式为:
[0059]
[0060]
[0061] 步骤2.4:对所述步骤2.2的三维点云图像,依据三维点云图像的三维坐标,计算作物籽粒的梯度特征;深度图像的梯度即深度图像中的深度分量Z在X和Y方向上的偏导数Zx,Zy,计算公式为:
[0062]
[0063] 步骤2.5:对所述三维点云图像进行经纬特征和梯度特征提取,经纬特征和梯度特征作为第一特征数据;
[0064] 步骤2.6:对步骤2.1的RGB彩色图像进行灰度特征提取就是根据三色通道权重系数计算的方法,将彩色RGB图像转换成灰度图像;
[0065] 步骤2.7:对所述步骤2.6的灰度图像,依据灰度的二维坐标,计算灰度图像的梯度特征;
[0066] 步骤2.8:对所述RGB彩色图像进行灰度特征和梯度特征提取,得到第二特征数据;
[0067] 步骤2.8:对两种图像的第一特征数据和第二特征数据进行融合。
[0068] 上述步骤3中包括以下步骤:
[0069] 步骤3.1:在步骤2中融合后的图像分别输入到YOLOX主干网络、空洞卷积神经网络、Inception V3网络中,对作物籽粒进行特征提取,并融合合并成最终输入融合特征图像,根据卷积注意力机制模块的方法对融合特征图进行增强是分通道注意力机制的处理和空间注意力机制的处理;
[0070] 步骤3.2:读入步骤3.1的融合特征图像,通道注意力机制的实现分为两个部分,对输入进来的单个特征层分别进行全局平均池化和全局最大池化;
[0071] 步骤3.3:对步骤3.2平均池化和最大池化的结果,利用共享的全连接层进行处理,对处理后的两个结果进行相加,然后进行非线性变换,使得输入特征层每一个通道的权值位于0‑1之间,根据激活函数sigmoid计算,exp函数为自然常数e为底的指数函数,计算公式为:
[0072]
[0073] 步骤3.4:将步骤3.3这个权值乘上原输入特征层:
[0074] 步骤3.5:对步骤3.1的融合特征图像,空间注意力机制的实现分为两个部分,对输入进来的单个特征层分别进行全局平均池化和全局最大池化;
[0075] 步骤3.6:对步骤3.5平均池化和最大池化的结果,利用共享的全连接层进行处理,对处理后的两个结果进行相加,然后进行非线性变换,使得输入特征层每一个通道的权值位于0‑1之间,根据sigmoid函数公式(4)计算;
[0076] 步骤3.7:将步骤3.6这个权值乘上原输入特征层;
[0077] 步骤3.8:对步骤3.4和步骤3.7的两个输出结果进行逐元素相加,再通过激活函数得到最终注意力机制增强的输出结果;
[0078] 步骤3.9:将步骤3.8的最终注意力机制增强结果与步骤3.1的融合特征图像相乘,得到新特征图。
[0079] 上述步骤3中YOLOX主干网络包括Focus模块和强特征提取模块,Focus模块对融合后的图像进行采样,再经过强特征提取模块对采样的图像进行特征提取。
[0080] 如图4所示,一种基于改进YOLOX的作物籽粒识别方法的装置,包括:图像采集模块1,用于获取待识别作物籽粒均匀分布的三维点云图像和RGB彩色图像;图像处理模块2,用于对图像采集模块的多维图像数据特征融合,将待识别的作物籽粒图像输入改进后YOLOX网络,输出对作物籽粒个体的识别结果。
[0081] 图像采集模块1包括多色可见光源11,在多色可见光源11下方设有工业双目点云摄像机12,在工业双目点云摄像机12下方设有放置待识别作物籽粒的多色背景板13。
[0082] 上述的图像处理模块2仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
[0083] 图像处理模块2包括,一个处理器21;一个存储器22;输入装置23和输出装置24,一个处理器21;一个存储器22;输入装置23和输出装置24通过总线25连接,一个或多个应用程序,其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个处理器执行,所述一个或多个应用程序配置用于:执行基于改进YOLOX的作物籽粒识别方法。
[0084] 一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现基于改进YOLOX的作物籽粒识别方法。
[0085] 处理器21可以是CPU、通用处理器、DSP、ASIC、FPGA或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本实施例公开内容所描述的逻辑方框,模块和电路。处理器21也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合等。
[0086] 总线25可包括一通路,在上述组件之间传送信息。总线25可以是PCI(Peripheral Component Interconnect,外设部件互连标准)总线或E I S A(ExtendedIndustry Standard Architecture,扩展工业标准结构)总线等。总线25可以分为地址总线、数据总线、控制总线等。为便于表示,图5中仅用一条粗线表示,但并不表示仅有一根总线或一型的总线。
[0087] 存储器22可以是ROM(Read Only Memory,只读存储器)或可存储静态信息和指令的其他类型的静态存储设备,RAM(Random AccessMemory,随机存取存储器)或者可存储信息和指令的其他类型的动态存储设备,也可以是EEPROM(ElectricallyErasableProgrammable Read Only Memory,电可擦可编程只读存储器)或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。
[0088] 存储器22用于存储执行本实施方案的应用程序代码,并由处理器21来控制执行。处理器21用于执行存储器22中存储的应用程序代码,以实现前述方法实施例所示的内容。
[0089] 以上仅是本申请的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。