首页 / 一种基于多通道频域匹配的车身标志图像识别定位方法

一种基于多通道频域匹配的车身标志图像识别定位方法有效专利 发明

技术领域

[0001] 本发明涉及图像识别及图像定位技术领域,尤其涉及一种基于多通道频域匹配的车身标志图像识别定位方法,更具体的涉及一种基于多通道频域匹配的车身危险品标志图像识别及图像定位方法。

相关背景技术

[0002] 随着道路智能交通管理的发展,对道路上行驶的危险品车辆的管理要求越来越高,例如对道路往来的危险品车辆类型进行识别、记录车辆行驶路线等。因难以实现人工进行24小时监督检查,故选择利用道路上已有的视频监控设备进行危险品车辆识别。
[0003] 但是由于危险品标识种类繁多,如有易燃品、爆炸品、有毒品、腐蚀性物品、放射性物品等,且图标形状、纹理不一,有的是文字,有的是图像,同时车身侧面复杂多变,尤其是集装箱、车载货物、货车篷布纹理都有所不同,背景干扰多,容易造成多检,漏检。

具体实施方式

[0053] 为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0054] 下面结合附图对本发明做进一步的详细描述:
[0055] 如图1所示,本发明提供的一种基于多通道频域匹配的车身标志图像识别定位方法,包括步骤:
[0056] S1、获取所有需识别危险品图标的R、G、B单通道图像频谱图和RGB三通道拼接图像的频谱图,组成危险品图标频谱图集模板。
[0057] 其中,具体包括步骤如图2所示:
[0058] S1-1、收集所有需识别危险品图标并统一所有危险品图标的宽高;
[0059] S1-2、对每种危险品图标进行RGB色彩通道分离处理,得到各危险品图标的R、G、B单通道图像;
[0060] S1-3、将各危险品图标的R、G、B单通道图像进行频域变换,得到各危险品图标的R、G、B单通道图像频谱图;
[0061] S1-4、将各危险品图标的R、G、B单通道图像进行拼接,并对拼接后RGB三通道拼接图像进行频域变换,得到各危险品图标的RGB三通道拼接图像的频谱图;
[0062] S1-5、将所有危险品图标的R、G、B单通道图像频谱图和RGB三通道拼接图像的频谱图保存在同一数据库中,得到危险品图标频谱图集模板。
[0063] S2、获取所有需识别危险品图标对应的R、G、B模板图像的过滤阈值及拼接模板图像的过滤阈值。
[0064] 其中,包括:
[0065] S2-1、选定一个危险品图标类型,收集N张包含此类危险品图标的车侧全景图作为正样本,收集N张不包含此类危险品图标的车侧全景图作为负样本;获取正样本及负样本的R、G、B单通道图像频谱图,用此类危险品图标类型的RGB单通道图像频谱图模板与正样本及负样本进行相位相关计算,获取对应的脉冲图像,求脉冲图像的最大值及对应的横纵坐标;
[0066] S2-2、将所有脉冲图像的最大值依次放入一个数组中,利用最大类间方差法求取阈值,具体操作如下:
[0067] 阈值t将数组分成大于阈值和小于阈值的两个部分,这两个部分各自的均值为m1、m2,图像的全局均值为m,同时数值被分为两部分的概率分别为p1、p2,根据方差的概念得到类间方差表达式为:
[0068] σ2=p1(m1-m)2+p2(m2-m)2
[0069] S2-3、类间方差越大,说明两个部分的差距越大;阈值从0开始,每次增长0.01,计算小于等于当前值及大于当前值两类的类间方差,使得类间方差取值最大的值作为此类危险品图标R、G、B模板的过滤阈值。
[0070] S2-3、获取每幅脉冲图像最大值对应的横纵坐标,结合对应的模板的宽高,在对应的车侧全景的R、G、B单通道图像上裁剪生成R、G、B识别候选集图像,将对应图像的R、G、B单通道图像进行拼接;
[0071] S2-4、获取识别候选集的拼接图像的图像频谱图;
[0072] S2-5、将识别候选集的拼接图像频谱图与此类危险品图标图像的模板生成的拼接拼图图像逐一进行相位相关计算,获取到对应的脉冲图像的最大值,将所有脉冲图像的最大值依次放入一个数组用,利用最大类间方差法求取阈值作为该类危险品图标的识别拼接图像的过滤阈值
[0073] S2-6、其余类型危险品图标重复上述操作,获取对应危险品图标类型的R、G、B单通道图像与模板匹配的过滤阈值及对应危险品图标类型的识别拼接图像的过滤阈值[0074] S3、获取当前帧车侧全景图像的R、G、B单通道图像的频谱图。
[0075] 其中,包括:
[0076] S3-1、对当前帧车侧全景图像进行图像RGB色彩通道分离处理,分别得到R、G、B单通道图像;
[0077] S3-2、对R、G、B单通道图像进行频域变换(傅里叶变换),得到频谱图。
[0078] S4、将当前帧车侧全景图像的R、G、B单通道图像频谱图与危险品图标频谱图集模板中各危险品图标的R、G、B单通道图像频谱图逐一做相位相关计算,得到各个危险品图标与车侧全景图像互相关的R、G、B脉冲图像;
[0079] 其中,包括:
[0080] S4-1、分别计算R、G、B模板频谱图与当前帧车侧全景图像的R、G、B单通道频谱图像的互功率谱;
[0081] S4-2、对上述生成的互功率谱求傅里叶逆变换得到脉冲图像。
[0082] S5、获取每幅脉冲图像的最大值及最大值的脉冲坐标,将每个脉冲图像的最大值对应与预设R、G、B过滤阈值相比较,保留大于阈值的数值及对应的脉冲坐标;
[0083] S5-1、将每幅脉冲图像分别求每一行的最大值得到长度为脉冲图像高的数组,每个数组最大值的索引值作为对应危险品图标在车侧全景图上最相似区域的纵坐标;将每幅脉冲图像求每一列的最大值得到长度为脉冲图像宽的数组,每个数组最大值的索引值作为对应危险品图标在车侧全景图上最相似区域的横坐标;
[0084] S5-2、每个横纵坐标对应脉冲图像上的数值为该脉冲图像的最大值,将每个脉冲图像的最大值与预设阈值相比较,保留大于阈值的数值及对应的坐标。
[0085] S6、根据保留的所有脉冲坐标截取车侧全景图的R、G、B单通道图像,并分别获取截取图像的R、G、B三通道拼接图像频谱图,组成识别候选集图像频谱图。
[0086] 其中,包括:
[0087] S6-1、将上述生成的多个坐标作为多个识别候选图片在车侧原图上的位置的左上角坐标,将对应的各个危险品图标的模板的宽高作为对应候选框的宽高,在车侧全景的R、G、B单通道图像上根据候选框裁剪生成R、G、B识别候选集图像;
[0088] S6-2、将识别候选集对应图像的R、G、B单通道图像进行拼接;
[0089] S6-3、获取识别候选集的拼接图像频谱图;
[0090] S7、将识别候选集图像频谱图与图像频谱图集模板中RGB三通道拼接图像的频谱图逐一进行再次相位相关计算,得到图像频谱图集模板中与识别候选图像频谱图的再次互相关脉冲图像;
[0091] S8、获取再次互相关的脉冲图像的最大值作为对应识别候选集是对应危险品图标的概率,保留识别候选集中概率大于预设拼接图像过滤阈值的图像及对应的危险品图标;
[0092] S9、输出当前帧车侧全景图像中的危险品图标以及该图标在当前帧车侧全景图像上的坐标。
[0093] 实施例:
[0094] 利用道路上已有的视频监控设备以及已建立的危险品图标频谱图集模板,图10为防爆品标志B通道图像傅里叶变换后的图像,图11为防爆品标志的原图像以及R、G、B单通道图像。
[0095] 在某道路进行危险品车辆识别,某车辆车侧当前帧全景图像如图3所示,危险品图标识别定位过程如下:
[0096] 步骤一、对当前帧车侧全景图像进行图像RGB色彩通道分离处理,分别得到R、G、B单通道图像,如图4至图6所示;
[0097] 步骤二、对当前帧车侧全景图像的R、G、B单通道图像进行频域变换(傅里叶变换),得到频谱图,B通道图像傅里叶变化后图像如图7所示。
[0098] 步骤三、将当前帧车侧全景图像的R、G、B单通道图像频谱图与危险品图标频谱图集模板中各危险品图标的R、G、B单通道图像频谱图分别做相位相关计算,获得脉冲图像,如图8、9所示;
[0099] 将每幅脉冲图像分别求每一行的最大值得到长度为脉冲图像高的数组,每个数组最大值的索引值作为对应危险品图标在车侧全景图上最相似区域的纵坐标;将每幅脉冲图像求每一列的最大值得到长度为脉冲图像宽的数组,每个数组最大值的索引值作为对应危险品图标在车侧全景图上最相似区域的横坐标;每个横纵坐标对应脉冲图像上的数值为该脉冲图像的最大值,将每个脉冲图像的最大值与预设阈值相比较,保留大于阈值的数值及对应的坐标;
[0100] 步骤四、将上述生成的多个坐标作为多个识别候选图片在车侧原图上的位置的左上角坐标,将对应的各个危险品图标的模板的宽高作为对应候选框的宽高,在车侧全景的R、G、B单通道图像上根据候选框裁剪生成R、G、B识别候选集图像;
[0101] 步骤五、将识别候选集对应图像的R、G、B单通道图像进行拼接,如图13所示,获取拼接图像集的频谱图像;
[0102] 步骤六、将识别候选集的拼接图像频谱图与所有的模板生成的拼接拼图图像逐一进行相位相关计算,得到各个危险品图标拼接图像与危险品识别候选图像的拼接图像互相关的脉冲图像;
[0103] 步骤七、获取每幅拼接互相关的脉冲图像的最大值作为对应识别候选图属于对应危险品图标模板类型的概率,保留概率大于预设阈值的识别候选区域如图9所示,以及对应的危险品图标类型;
[0104] 步骤八、输出当前帧车侧全景图像中的危险品图标为爆炸品,该图标在当前帧车侧全景图像上的坐标如图12所示。
[0105] 本发明的优点:
[0106] (1)通过多通道频域模板,可以增加危险品图标与背景的区分性,降低相似形状的背景的匹配得分。
[0107] (2)通过多通道频域模板匹配,可以降低危险品图标间的相似性,可以实现危险品图标的预分类,减少系统后续识别危险品图标类型的计算量;
[0108] (3)实现了通过现有的道路监控设备,识别车辆车侧全景图像中的危险品图标以及确定图标在图像中的位置。
[0109] 以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页 第1页 第2页 第3页
相关技术
图像识别相关技术
域匹配相关技术
廖原发明人的其他相关专利技术