首页 / 基于对标注图像学习的图像分割方法

基于对标注图像学习的图像分割方法失效专利 发明

技术领域

[0001] 本发明涉及的是一种图像分割方法。具体地说是一种借助对大量可靠的标注图像的学习,通过事物的外表视觉特征与标注字的联系,将图像中的物体识别问题应用到对图像分割问题的方法。

相关背景技术

[0002] 以往人们常常将图像分割和识别的研究割裂开来,图像分割基本上都是作为图像理解的一个预处理阶段。尽管已经存在很多分割方法,但目前的技术还无法达到令人满意的应用效果。图像分割已经成为限制许多视觉应用的一个瓶颈,其原因是由于在对图像进行分割时,主要依赖图像像素在视觉上的相似性和邻近像素位置上的相关性作为分割判别依据。这种仅仅依赖低级视觉特征进行分割的方法,已经很难获得突破性进展。
[0003] 已有认知心理学证据表明,人类在对图像进行分割时,除了依赖视觉器官,还依靠自身所具有的认知能力,这种认知能力包括了对物体的检测与识别能力。从这个意义上讲,图像分割与识别的过程是紧密相关的。因此,寻找一个合适的纽带将图像的分割与识别过程相融合,使物体识别与图像分割过程互相依赖、彼此促进,对视觉认知系统的研究具有极其重要的意义。
[0004] 标注字是对图像语义内容的高度概括,它为缩小图像的高低级语义差距提供了有效的研究途径。高质量图像标注信息的逐步增多为探求图像标注字与视觉内容之间的映射关系提供了大量可靠的学习样本。因此,我们将标注字作为图像分割和物体识别的联系纽带,通过对标注图像的学习来提高图像分割质量。

具体实施方式

[0026] 具体实施方案分为两个过程,过程1首先对标注好的训练样本进行学习,包括对训练图像的分割、训练图像的场景分类以及特定场景下的标注字与分割区域的联接建立。过程2利用过程1学习到得模型参数确定待分割区域的标注字,并通过区域的标注信息进行信息融合,完成分割。
[0027] 过程1:
[0028] 步骤1,图像的过分割。采用改进的模糊K-均值方法对图像进行过分割。首先给出初始图像视觉聚类中心,然后在确定每个像素的聚类中心隶属度与更新聚类中心的两个过程的循环中,加入一个对隶属度平滑滤波过程,以此引入分割聚类中邻近像素间的相互作用及彼此约束力。
[0029] 步骤2,自动场景语义类别的确定。首先利用视觉特征与标注字之间的相关性,将视觉特征转化为标注字描述方式。具体方案将每幅图像的标注向其视觉邻近的图像传播,信息传播量由邻近图像间的视觉相似程度所决定,而接收图像则按照标注字间的相关性进行信息接收。标注字间的相关性利用训练样本中同一图像中出现的标注字进行统计。让标注字信息量在视觉相似图像中累积增长,将视觉特征转化为代表其与标注字相关程度的权值。然后利用概率潜在语义分析(Probabilistic Latent Semantic Analysis,PLSA)模型针对具有权值的标注字提取图像的语义类别。将训练样本分成不同的场景后,每个场景采用高斯混合模型模拟该场景下的视觉分布,利用获得的模型参数在后续步骤中确定待分割图像的场景。
[0030] 步骤3,特定场景下过分割区域与标注字的映射学习。采用前馈神经网络在场景约束下的区域视觉特征和标注字之间建立联系。网络的输入节点为图像区域的视觉描述特征,输出节点为某一场景下的标注字,每个节点对应一个标注字。指导信息为一个二值特征向量,该向量的每个分量代表一个固定的标注字。当在网络输入端接收到视觉刺激后,直接会在输出端的视觉概念区产生相应的概念响应。
[0031] 过程2:
[0032] 步骤1,图像的过分割。与过程1中的步骤1相同。
[0033] 步骤2,待分割图像的场景确立。将分割后的图像输入过程1中步骤2所建立的不同场景下的视觉混合模型。按照混合模型的后验概率确定待分割图像场景。
[0034] 步骤3,过分割图像区域的标注。将分割图像的视觉特征输入到过程1的步骤3中所建立的相应场景下的前馈神经网络,然后通过特定场景所对应的前馈神经网络,在输出端获得每个过分割区域的标注结果,该输出值可作为标注的可靠性与分割合理性的判别依据。
[0035] 步骤4,过分割标注区域的融合。为了能够很好地确定图像区域的空间位置信息,将每个过分割区域映射到网格结构中,这样每个区域对应网格结构下的一个或多个节点。将每个节点的标注向8连通邻近节点传递,统计出每个节点的标注概率,利用位置约束方法可以排除掉概率较小的标注字,使过分割区域标注结果更加合理。合并标注字趋于一致的过分割区域,实现趋向物体级的语义分割。

当前第1页 第1页 第2页 第3页