CN107633031A

CN107633031A - 一种对图像进行语义注释的方法及装置

Info

Publication number: CN107633031A
Application number: CN201710796583.7A
Authority: CN
Inventors: 叶进蓉
Original assignee: Individual
Current assignee: Individual
Priority date: 2017-09-06
Filing date: 2017-09-06
Publication date: 2018-01-26

Abstract

本发明提供了一种对图像进行语义注释的方法，包括如下步骤：提取图像的物体的形状轮廓；对所述形状轮廓进行语义注释，并将注释后的形状轮廓添加至一形状集合中，其中，多个图像的注释后的形状轮廓共同组成多个形状集合，以形成形状轮廓数据库；将形状轮廓数据库中每一形状集合中的形状轮廓进行分割，以形成预设数量的分割图像块；识别每一分割图像块，并对所述分割图像块再次进行语义注释，以进一步细化图像的语义注释。本发明方案的语义注释简单便捷，占用服务器的内存较小，使得用户在搜索时能够根据搜索的关键字等信息快速获得想要的图片，极大提高了用户体验。

Description

一种对图像进行语义注释的方法及装置

技术领域

本发明涉及计算机技术领域，具体涉及一种对图像进行语义注释的方法及装置。

背景技术

图像检索技术用来帮助用户在海量的图像集中浏览、搜索和检索图像。这些技术使得用户能够在通过因特网可访问的图像和/或任意其它图像集中搜索他们寻找的一个或更多个图像。例如，用户可以使用搜索引擎来搜索物体或者人的图像。为此，用户可以输入诸如“建筑”或者“名人”的搜索询问，以找到用户寻找的图像。

搜索引擎可以基于与被搜索的图像相关联的文本注释，响应于用户的搜索询问识别一个或更多个图像。特别地，可以将用户的搜索询问与和被搜索的图像中的每个相关联的一个或更多个文本注释进行比较，并且基于比较的结果向用户呈现搜索结果。例如，如果用户正在使用搜索询问“建筑”来搜索图像，则搜索引擎可以返回使用包括词语“建筑”的文本进行了注释的图像。

因此，图像搜索结果的质量取决于与被搜索的图像相关联的注释以及如何识别这些注释。用于图像注释的一些传统技术包含基于图像出现于其中的文档中的数据将注释与该图像相关联。例如，搜索引擎可以从该网页中的信息(诸如图像标签中的信息(例如标题、元数据等)和/或围绕网页中的图像的信息)中识别针对出现在该网页中的图像的注释。

发明内容

本发明所采用的技术方案是：一种对图像进行语义注释的方法，包括如下步骤：

提取图像的物体的形状轮廓；

对所述形状轮廓进行语义注释，并将注释后的形状轮廓添加至一形状集合中，其中，多个图像的注释后的形状轮廓共同组成多个形状集合，以形成形状轮廓数据库；

将形状轮廓数据库中每一形状集合中的形状轮廓进行分割，以形成预设数量的分割图像块；

识别每一分割图像块，并对所述分割图像块再次进行语义注释，以进一步细化图像的语义注释。

进一步地，对所述形状轮廓进行语义注释，并将注释后的形状轮廓添加至一形状集合中，包括如下步骤：

对所述形状轮廓进行定义，以定义形成含有词或短语的至少一个分级集合；

对每一分级集合进行近似词义扩展以形成语义注释；

将带有语义注释的图像的形状轮廓添加至所述形状集合中。

进一步地，对所述形状轮廓进行定义，以定义形成含有词或短语的至少一个分级集合，包括以下步骤：

定义一逻辑推导规则，所述逻辑推导规则根据自学习形成的图像库中推导形成；

根据所述逻辑推导规则对所述形状轮廓进行定义，以定义形成含有词或短语的至少一个分级集合。

进一步地，将形状轮廓数据库中每一形状集合中的形状轮廓进行分割，以形成预设数量的分割图像块，包括如下步骤：

提取所述形状轮廓数据库中的形状轮廓的多个特征；

检查所述形状轮廓的多个特征之间的关联性；

将具有关联的特征和没有关联的特征进行分割，以分割形成多个分割图像块。

特别地，本发明还提供了一种对图像进行语义注释的装置，包括：

提取模块，用于提取图像的物体的形状轮廓；

注释模块，用于对所述形状轮廓进行语义注释，并将注释后的形状轮廓添加至一形状集合中，其中，多个图像的注释后的形状轮廓共同组成多个形状集合，以形成形状轮廓数据库；

分割模块，用于将形状轮廓数据库中每一形状集合中的形状轮廓进行分割，以形成预设数量的分割图像块；

识别模块，用于识别每一分割图像块，并对所述分割图像块再次进行语义注释，以进一步细化图像的语义注释。

进一步地，所述注释模块包括：

定义单元，用于对所述形状轮廓进行定义，以定义形成含有词或短语的至少一个分级集合；

扩展单元，用于对每一分级集合进行近似词义扩展以形成语义注释；

添加单元，用于将带有语义注释的图像的形状轮廓添加至所述形状集合中。

进一步地，所述定义单元包括：

第一定义子单元，用于定义一逻辑推导规则，所述逻辑推导规则根据自学习形成的图像库中推导形成；

第二定义子单元，用于根据所述逻辑推导规则对所述形状轮廓进行定义，以定义形成含有词或短语的至少一个分级集合。

进一步地，所述分割模块包括：

提取单元，用于提取所述形状轮廓数据库中的形状轮廓的多个特征；

检查单元，用于检查所述形状轮廓的多个特征之间的关联性；

分割单元，用于将具有关联的特征和没有关联的特征进行分割，以分割形成多个分割图像块。

本发明的有益效果在于：本发明的方案对图像中的形状轮廓进行语义注释，并且形成形状轮廓数据库，以便于形状轮廓语义注释的更新，使得图像搜索结果的质量极大提高。此外，对每一形状集合中的形状轮廓进行分割，并对分割后的分割图像块再次进行语义注释，使得语义注释更加精确。本发明方案的语义注释简单便捷，占用服务器的内存较小，使得用户在搜索时能够根据搜索的关键字等信息快速获得想要的图片，极大提高了用户体验。

附图说明

图1是根据本发明一个实施例的用于网络日志文件中的对网页中的图片进行处理的方法的方法流程图；

图2是根据本发明一个实施例的用于网络日志文件中的多维度数据去重系统的结构图。

具体实施方式

下面将结合附图及具体实施例对本发明作进一步详细说明。

如图1所示，本发明所采用的技术方案是：一种对图像进行语义注释的方法，包括如下步骤：

S100、提取图像的物体的形状轮廓；

S200、对所述形状轮廓进行语义注释，并将注释后的形状轮廓添加至一形状集合中，其中，多个图像的注释后的形状轮廓共同组成多个形状集合，以形成形状轮廓数据库；

S300、将形状轮廓数据库中每一形状集合中的形状轮廓进行分割，以形成预设数量的分割图像块；

S400、识别每一分割图像块，并对所述分割图像块再次进行语义注释，以进一步细化图像的语义注释。

对所述形状轮廓进行语义注释，并将注释后的形状轮廓添加至一形状集合中，包括如下步骤：

S210、对所述形状轮廓进行定义，以定义形成含有词或短语的至少一个分级集合；

S220、对每一分级集合进行近似词义扩展以形成语义注释；

S230、将带有语义注释的图像的形状轮廓添加至所述形状集合中。

对所述形状轮廓进行定义，以定义形成含有词或短语的至少一个分级集合，包括以下步骤：

S211、定义一逻辑推导规则，所述逻辑推导规则根据自学习形成的图像库中推导形成；

S212、根据所述逻辑推导规则对所述形状轮廓进行定义，以定义形成含有词或短语的至少一个分级集合。

将形状轮廓数据库中每一形状集合中的形状轮廓进行分割，以形成预设数量的分割图像块，包括如下步骤：

S310、提取所述形状轮廓数据库中的形状轮廓的多个特征；

S320、检查所述形状轮廓的多个特征之间的关联性；

S330、将具有关联的特征和没有关联的特征进行分割，以分割形成多个分割图像块。

提取模块100，用于提取图像的物体的形状轮廓；

注释模块200，用于对所述形状轮廓进行语义注释，并将注释后的形状轮廓添加至一形状集合中，其中，多个图像的注释后的形状轮廓共同组成多个形状集合，以形成形状轮廓数据库；

分割模块300，用于将形状轮廓数据库中每一形状集合中的形状轮廓进行分割，以形成预设数量的分割图像块；

识别模块400，用于识别每一分割图像块，并对所述分割图像块再次进行语义注释，以进一步细化图像的语义注释。

进一步地，所述注释模块200包括：

定义单元210，用于对所述形状轮廓进行定义，以定义形成含有词或短语的至少一个分级集合；

扩展单元220，用于对每一分级集合进行近似词义扩展以形成语义注释；

添加单元230，用于将带有语义注释的图像的形状轮廓添加至所述形状集合中。

进一步地，所述定义单元210包括：

第一定义子单元211，用于定义一逻辑推导规则，所述逻辑推导规则根据自学习形成的图像库中推导形成；

第二定义子单元212，用于根据所述逻辑推导规则对所述形状轮廓进行定义，以定义形成含有词或短语的至少一个分级集合。

进一步地，所述分割模块300包括：

提取单元310，用于提取所述形状轮廓数据库中的形状轮廓的多个特征；

检查单元320，用于检查所述形状轮廓的多个特征之间的关联性；

分割单元330，用于将具有关联的特征和没有关联的特征进行分割，以分割形成多个分割图像块。

需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。附图中描述位置关系的用于仅用于示例性说明，不能理解为对本专利的限制，显然，本发明的上述实施例仅仅是为清楚地说明本发明所作的举例，而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说，在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明权利要求的保护范围之内。

Claims

1.一种对图像进行语义注释的方法，其特征在于，包括如下步骤：

提取图像的物体的形状轮廓；

2.根据权利要求1所述的对图像进行语义注释的方法，其特征在于，对所述形状轮廓进行语义注释，并将注释后的形状轮廓添加至一形状集合中，包括如下步骤：

对每一分级集合进行近似词义扩展以形成语义注释；

将带有语义注释的图像的形状轮廓添加至所述形状集合中。

3.根据权利要求2所述的对图像进行语义注释的方法，其特征在于，对所述形状轮廓进行定义，以定义形成含有词或短语的至少一个分级集合，包括以下步骤：

4.根据权利要求2或3所述的对图像进行语义注释的方法，其特征在于，将形状轮廓数据库中每一形状集合中的形状轮廓进行分割，以形成预设数量的分割图像块，包括如下步骤：

提取所述形状轮廓数据库中的形状轮廓的多个特征；

检查所述形状轮廓的多个特征之间的关联性；

5.一种对图像进行语义注释的装置，其特征在于，包括：

提取模块，用于提取图像的物体的形状轮廓；

6.根据权利要求5所述的对图像进行语义注释的装置，其特征在于，所述注释模块包括：

7.根据权利要求6所述的对图像进行语义注释的装置，其特征在于，所述定义单元包括：

8.根据权利要求6或7所述的对图像进行语义注释的装置，其特征在于，所述分割模块包括：