首页 / 一种异常样本生成方法

一种异常样本生成方法实质审查 发明

技术领域

[0001] 本发明涉及工业质检技术领域,尤其是涉及一种异常样本生成方法。

相关背景技术

[0002] 在工业质检领域,需要训练模型检测各种异常情况。如果采用深度学习模型,那么就需要有充足的样本去训练。通常情况下,我们可以轻易地获得正常样本,但却无法获取足量的异常样本,也无法获取所有的异常类型。为了提高算法的鲁棒性,我们迫切需要利用正常样本来模拟异常样本。例如,在磁瓦表面缺陷中,气孔和磨损两种缺陷均比周围要暗一些,但是大小与形状均不固定。再例如在卡证质检中,由于卡证需要覆膜,如果膜发生破损,那么在正常光照下,破损的位置会比正常的位置要偏亮,同样的,破损的位置、大小和形状均不固定。
[0003] 因此,在自动化检测过程中,需要收集大量的异常样本才能训练出一个鲁棒的模型。

具体实施方式

[0017] 以下结合附图对本发明作进一步详细说明。本发明实施例公开一种异常样本生成方法。
[0018] 参照图1‑图3,一种异常样本生成方法,包括以下步骤:步骤1,在正常样本中随机位置生成一个光滑的闭合区域;
步骤2,选择步骤1中的闭合区域作为缺陷产生的位置,根据缺陷的类型确定背景图像的类型;
步骤3,在背景图像中随机选择一个位置,抠出相同形状的闭合区域;
步骤4,将所抠出的闭合区域以加权融合的方式贴到正常样本中,得到缺陷图像;
步骤5,对缺陷图像进行图像增强得到异常样本。
[0019] 首先在正常样本中随机位置生成一个光滑的闭合区域,然后随机地选择一幅背景图像,在该背景图像中随机选择一个位置,抠出相同形状的闭合区域,接着将所抠出的区域以加权融合的方式贴到正常样本中得到缺陷图像,最后对缺陷图像进行图像增强得到异常样本;使用所提出方法,可以基于正常样本快速得到多个异常样本,为工业质检领域检测模型提供充足的多样化的异常样本。基于生成的异常样本和正常样本对检测、分类或者分割模型进行训练,可以解决因异常样本缺乏导致的模型过拟合问题。步骤1采用以下步骤生成光滑的闭合区域:
步骤11,在正常样本图像范围内随机选择一个点;
步骤12,以选择的点为中心,分别生成N个点的x坐标和y坐标,其中x坐标和y坐标服从高斯分布、均匀分布、贝塔分布、泊松分布或者二维正态分布,得到一个包含N个点的集合;这里不限制x坐标和y坐标的分布类型。
[0020] 步骤13,获取点集的凸包;步骤14,根据凸包的点,生成光滑的曲线,这些光滑的曲线形成了一个闭合的区域。
[0021] 可以得到多样化的闭合区域,区域的大小和形状都是随机的,可以根据实际缺陷产生的原因来设置x坐标和y坐标所服从的分布类型,并适当调整分布参数,尽量模拟真实缺陷的产生过程。据此可以得到多样化的异常样本。
[0022] 使用高级科学计算库scipy的ConvexHull函数来计算凸包。
[0023] 使用高级科学计算库scipy的splprep函数对凸包上的点进行光滑曲线拟合。
[0024] 根据缺陷的类型确定背景图像的类型,背景图像是纯色图像、自然图像或根据实际缺陷类型确定。
[0025] 增强方法包括调整光照强度、饱和度和色度,水平翻转和垂直翻转。
[0026] 调整光照强度、饱和度和色度,可以模拟不同光照条件下获取的样本,丰富生成样本的光照环境,使用增强后的样本训练,可以提高模型对光照的鲁棒性。水平翻转和垂直翻转,一方面可以增加训练样本的数量,另一方面也可以增加模型对水平翻转和垂直翻转的鲁棒性。
[0027] 步骤4中,加权融合的加权系数k为取值范围为[0,1]之间的随机数,缺陷图像计算方式为:;
其中 为正常样本图像, 为背景图像,k为加权系数。
[0028] 可以灵活地调整所选定的闭合区域中正常样本图像与背景图像的加权融合系数,使得生成的缺陷图像更加多样化,也更加符合实际的缺陷生成过程。
[0029] 以下基于实施例说明一种异常样本生成方法的实施原理:磁瓦表面缺陷包含气孔和磨损两种缺陷,这两种缺陷都比周围要暗,真实样本如图2所示。
[0030] 由于真实的异常样本较少,难以获取丰富的异常样本去训练一个鲁棒的异常检测/分割模型。为了解决这个问题,可以采用以下方法进行异常样本生成。
[0031] 步骤1,获取一个正常样本,按照如下方法在正常样本的随机位置生成一个光滑的闭合区域:在正常样本图像范围内随机选择一个点,坐标为x0,y0;
以该点为中心,生成一个包含80个随机点的点集,其中这些随机点的x坐标服从均值为x0,方差为d1的高斯分布,y坐标服从均值为y0,方差为d2的高斯分布。调整d1和d2的值,可以得到不同大小和形状的区域。
[0032] 获取该点集的凸包。可以使用高级科学计算库scipy的ConvexHull函数来计算凸包。
[0033] 根据凸包上的点,利用样条插值算法,生成光滑的曲线,这些光滑的曲线就形成了一个闭合的区域。可以使用高级科学计算库scipy的splprep函数对凸包上的点进行光滑曲线拟合。
[0034] 步骤2,选择步骤1中的闭合区域作为缺陷产生的位置,由于缺陷要比周围暗,因此可以设置背景图像为纯黑色图像。这里的背景图像也可以采用真实的缺陷图。
[0035] 步骤3,在背景图像中随机选择一个位置,抠出相同形状的闭合区域,由于背景图像为纯黑色图像,因此只需要一幅与正常样本同样大小的纯黑色图像,在同样的位置抠出形状相同的闭合区域即可。
[0036] 步骤4,将所抠出的区域以加权融合的方式贴到正常图像中,得到异常样本。加权系数可以设置为0‑1之间的随机数。
[0037] 其中步骤3和步骤4相当于如下操作:加权系数k为取值范围为[0,1]之间的随机数。
[0038] 最后的缺陷图像计算方式为:;
 normal_img为正常样本图像,back_img为背景图像,这里用的是纯黑色图像。
[0039] 对异常样本进行图像增强,增强方法包括调整光照强度、饱和度和色度,水平翻转、垂直翻转。由于真实样本是灰度图像,只需要调整光照强度,不需要调整饱和度和色度,可以进行水平翻转和垂直翻转。
[0040] 按照上述步骤生成的异常样本如图3所示。
[0041] 以上均为本发明的较佳实施例,并非以此限制本发明的保护范围,故:凡依本发明的结构、形状、原理所做的等效变化,均应涵盖于本发明的保护范围之内。

当前第1页 第1页 第2页 第3页