CN107967494A

CN107967494A - 一种基于视觉语义关系图的图像区域标注方法

Info

Publication number: CN107967494A
Application number: CN201711387422.9A
Authority: CN
Inventors: 张静; 陶提; 穆亚昆; 王喆; 赵贤文; 陈美�
Original assignee: East China University of Science and Technology
Current assignee: East China University of Science and Technology
Priority date: 2017-12-20
Filing date: 2017-12-20
Publication date: 2018-04-27
Anticipated expiration: 2037-12-20
Also published as: CN107967494B

Abstract

本发明公开了一种基于视觉和语义的图像标注算法，可实现对图像区域的自动标注。提出的基于视觉语义关系图的图像区域标注算法包括两个部分：视觉语义关系图的构建和基于视觉语义关系图的图像标注。视觉语义关系图的构建考虑了图像间的全局相似性、区域相似性、图像区域标签的语义关联以及各层次间的关联。然后在构建好的视觉语义关系图上进行半监督学习，得到未标注图像区域与图像区域标签之间的关联度，对未标注图像区域进行标签预测。

Description

一种基于视觉语义关系图的图像区域标注方法

技术领域

本发明属于图像语义理解领域，具体涉及一种基于视觉语义关系图的图像区域标注方法。

背景技术

当今社会图像数据量巨大，图像自动标注技术成为人们对图像数据检索和管理的重要途径，但是由于“语义鸿沟”的存在，严重影响了传统图像区域标注算法的准确性，本发明提出了一种基于视觉语义关系图的图像区域标注方法。

图像全局间具有图像视觉特征相似性，图像区域间也具有图像视觉特征相似性，图像标签之间则具有语义关联性，这些信息有助于图像区域标注与理解，因而本发明提出了一种能够有效描述上述关系的视觉语义关系图，并以此图为基础实现跨层次的随机游走算法对图像区域进行自动语义标注。

发明内容

本发明的目的在于提出一种基于视觉语义关系图的图像区域标注方法，通过分析图像间的全局相似性、区域相似性、图像区域标签的语义关联，以及各层次之间的关联构造视觉语义关系图，提出跨层次的随机游走算法对图像区域进行自动标注。

本发明的技术方案如下：

(1)图像全局相似性子图与图像区域相似性子图的构建：提取图像的全局视觉特征，并计算图像间的特征相似性；提取图像区域的视觉特征，并计算区域间的特征相似性。

(2)图像区域标签语义相关性子图的构建：语义相关性由不同标签之间的语义共现度表示，语义共现度是根据语义标签在图像训练集中的共现概率进行计算的。

(3)各子图间关联的构建：图像全局相似性子图与图像区域相似性子图的关联由图像与图像分割成区域的所属关系确定；图像全局相似性子图与图像区域标签语义相关性子图的关联由已标注图像的全局标签信息确定；图像区域相似性子图与图像区域标签语义相关性子图的关联由已标注图像的区域标签信息确定。

(4)跨层次的随机游走算法：将未标注图像插入视觉语义关系图，在新构建的视觉语义关系图上进行跨层次的随机游走，从而得到未标注图像区域的标签。本部分主要分两步：

(41)将未标注图像分割成区域，并将图像和其所包含的区域插入视觉语义关系图。并根据未标注图像与已标注图像全局特征的相似性以及未标注区域与已标注区域的局部特征相似性来确定对应边的值。

(42)将图像全局、图像区域以及语义标签看作一个三元组复合节点，在新构建的三层视觉语义关系图上进行随机游走，得到未标注图像区域与标签之间的关联值，并选取关联值最高的标签作为图像区域的预测标签。

附图说明

为了更清楚地说明本发明实施步骤，下面将对步骤附图进行详细介绍

图1是基于视觉语义关系图的图像区域标注流程图

图2是视觉语义关系图

图3是图像全局相似性子图

图4是图像区域相似性子图

图5是图像区域标签语义相关性子图

具体实施方式

下面结合附图，对本发明的技术方案进行具体说明。

图1是本发明提供的基于视觉语义关系图的图像区域标注方法流程示意图，该标注方法包括4个单元。

单元100为图像全局相似性子图和图像区域相似性子图的构建。以图像为单位，提取图像全局视觉特征：SIFT特征、HSVH特征、颜色矩特征和Gabor 特征，并且使用词袋模型对图像内容进行表示。使用欧式距离计算图像间全局视觉特征的相关度得到全局相似性子图，如图3所示。以图像区域为单位，提取图像区域视觉特征：HSVH特征、颜色矩特征和Gabor特征，并且使用词袋模型对图像区域内容进行表示。使用欧式距离计算图像区域间视觉特征的相关度得到图像区域相似性子图，如图4所示。

单元101为图像区域标签语义相关性子图的构建。两个标签之间的语义关系即为标签对的共现度。标签对的共现度是根据一个语义标签出现时，另一个语义标签也在同一幅图像中出现的条件概率计算得到。构建的图像区域标签语义相关性子图如图5所示。

单元102为各子图间关联的构建。各子图间的关联关系包括图像全局相似性子图与图像区域相似性子图的关联、图像全局相似性子图与图像区域标签语义相关性子图的关联、图像区域相似性子图与图像区域标签语义相关性子图的关联。图像全局相似性子图与图像区域相似性子图的关联是根据图像与该图像分割区域的隶属关系构建。图像全局相似性子图与图像区域标签语义相关性子图的关联是根据已标注图像的全局标签信息构建。图像区域相似性子图与图像区域标签语义相关性子图的关联是根据已标注图像区域的标签信息构建。

通过以上各种子图和各子图关联的构建，得到的视觉语义关系图如图2 所示。

单元103为跨层次的随机游走算法,这里分为两步：

(1)将未标注图像及其区域插入视觉语义关系图。首先将未标注图像插入视觉语义关系图中图像全局相似性子图，并提取图像的全局特征与已标注的图像的全局特征计算相似性，用于完善本层子图间全局相似性关联。然后将未标注图像按图像底层特征分割，得到的区域插入图像区域相似性子图，并提取图像区域的特征与已标注的图像区域特征计算相似性，用于完善本层子图间区域相似性关联。根据未标注图像的分割从属关系构建关系子图之间的关联。并将语义标签与未标注图像以及区域建立初始值为零的关联边。此时并将未标注图像插入视觉语义关系图，构建新的视觉语义关系图。

(2)对于新构建的视觉语义关系图，将图像顶点、图像区域顶点以及语义标签顶点看作一个三元组复合顶点，此顶点作为跨层次随机游走的基本单位。以复合节点为单位在新构建的视觉语义关系图上进行随机游走，其游走的初始值为未标注区域与语义标签的关联值，其转移矩阵为已构建的各子图内部关联及子图间的关联，其游走路线可以在三层视觉语义关系图上随意跳转。每次迭代伴随着各个复合节点的值的更新，通过多次迭代直至所有复合节点的值到达比较稳定的状态，此时可以得到未标注图像区域与语义标签间的关联值，选取与未标注图像区域关联值最高的语义标签作为该区域的预测标签。

Claims

1.一种基于视觉语义关系图的图像区域标注方法，其特征包括两个步骤：

(1)分析图像间的全局相似性、区域相似性以及图像区域标签的语义关联；

(2)分析各层次间的关联，构造视觉语义关系图；

(3)将未标注图像插入视觉语义关系图，并在新的语义关系图上实现跨层次随机游走算法，通过更新未标注图像区域与标签之间的关联度，对未标注图像区域进行标签预测。

2.如权利要求1所述方法，其特征在于步骤(1)中，视觉语义关系图包括图像全局相似性子图、图像区域相似性子图和图像区域标签语义相关性子图。图像全局相似性子图是根据图像全局场景进行相似性比较而建立图像间的关联；图像区域相似性子图是根据图像分割区域的相似性比较而建立区域间的关联；图像区域标签语义相关性子图是根据语义共现度建立标签间的关联。

3.如权利要求1所述方法，其特征在于步骤(2)中，视觉语义关系图之间的关联包括图像全局相似性子图与图像区域相似性子图的关联、图像全局相似性子图与图像区域标签语义相关性子图的关联、图像区域相似性子图与图像区域标签语义相关性子图的关联；图像全局相似性子图与图像区域相似性子图的关联描述图像与图像分割成区域的所属关系；图像全局相似性子图与图像区域标签语义相关性子图的关联是描述已标注图像的全局标签信息；图像区域相似性子图与图像区域标签语义相关性子图的关联是描述已标注图像的区域标签信息。

4.如权利要求1所述的方法，其特征在于步骤(3)，基于视觉语义关系图的图像区域标注包括如下步骤：

(31)将未标注图像进行区域分割，分别将分割的区域以及全图插入视觉语义关系图，构建新的视觉语义关系图；

(32)用跨层次随机游走算法在新构造的视觉语义关系图中对未标注图像区域的标签进行预测。