CN107633031A - 一种对图像进行语义注释的方法及装置 - Google Patents

一种对图像进行语义注释的方法及装置 Download PDF

Info

Publication number
CN107633031A
CN107633031A CN201710796583.7A CN201710796583A CN107633031A CN 107633031 A CN107633031 A CN 107633031A CN 201710796583 A CN201710796583 A CN 201710796583A CN 107633031 A CN107633031 A CN 107633031A
Authority
CN
China
Prior art keywords
shape contour
shape
image
semantic annotations
carried out
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710796583.7A
Other languages
English (en)
Inventor
叶进蓉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201710796583.7A priority Critical patent/CN107633031A/zh
Publication of CN107633031A publication Critical patent/CN107633031A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)

Abstract

本发明提供了一种对图像进行语义注释的方法,包括如下步骤:提取图像的物体的形状轮廓;对所述形状轮廓进行语义注释,并将注释后的形状轮廓添加至一形状集合中,其中,多个图像的注释后的形状轮廓共同组成多个形状集合,以形成形状轮廓数据库;将形状轮廓数据库中每一形状集合中的形状轮廓进行分割,以形成预设数量的分割图像块;识别每一分割图像块,并对所述分割图像块再次进行语义注释,以进一步细化图像的语义注释。本发明方案的语义注释简单便捷,占用服务器的内存较小,使得用户在搜索时能够根据搜索的关键字等信息快速获得想要的图片,极大提高了用户体验。

Description

一种对图像进行语义注释的方法及装置
技术领域
本发明涉及计算机技术领域,具体涉及一种对图像进行语义注释的方法及装置。
背景技术
图像检索技术用来帮助用户在海量的图像集中浏览、搜索和检索图像。这些技术使得用户能够在通过因特网可访问的图像和/或任意其它图像集中搜索他们寻找的一个或更多个图像。例如,用户可以使用搜索引擎来搜索物体或者人的图像。为此,用户可以输入诸如“建筑”或者“名人”的搜索询问,以找到用户寻找的图像。
搜索引擎可以基于与被搜索的图像相关联的文本注释,响应于用户的搜索询问识别一个或更多个图像。特别地,可以将用户的搜索询问与和被搜索的图像中的每个相关联的一个或更多个文本注释进行比较,并且基于比较的结果向用户呈现搜索结果。例如,如果用户正在使用搜索询问“建筑”来搜索图像,则搜索引擎可以返回使用包括词语“建筑”的文本进行了注释的图像。
因此,图像搜索结果的质量取决于与被搜索的图像相关联的注释以及如何识别这些注释。用于图像注释的一些传统技术包含基于图像出现于其中的文档中的数据将注释与该图像相关联。例如,搜索引擎可以从该网页中的信息(诸如图像标签中的信息(例如标题、元数据等)和/或围绕网页中的图像的信息)中识别针对出现在该网页中的图像的注释。
发明内容
本发明所采用的技术方案是:一种对图像进行语义注释的方法,包括如下步骤:
提取图像的物体的形状轮廓;
对所述形状轮廓进行语义注释,并将注释后的形状轮廓添加至一形状集合中,其中,多个图像的注释后的形状轮廓共同组成多个形状集合,以形成形状轮廓数据库;
将形状轮廓数据库中每一形状集合中的形状轮廓进行分割,以形成预设数量的分割图像块;
识别每一分割图像块,并对所述分割图像块再次进行语义注释,以进一步细化图像的语义注释。
进一步地,对所述形状轮廓进行语义注释,并将注释后的形状轮廓添加至一形状集合中,包括如下步骤:
对所述形状轮廓进行定义,以定义形成含有词或短语的至少一个分级集合;
对每一分级集合进行近似词义扩展以形成语义注释;
将带有语义注释的图像的形状轮廓添加至所述形状集合中。
进一步地,对所述形状轮廓进行定义,以定义形成含有词或短语的至少一个分级集合,包括以下步骤:
定义一逻辑推导规则,所述逻辑推导规则根据自学习形成的图像库中推导形成;
根据所述逻辑推导规则对所述形状轮廓进行定义,以定义形成含有词或短语的至少一个分级集合。
进一步地,将形状轮廓数据库中每一形状集合中的形状轮廓进行分割,以形成预设数量的分割图像块,包括如下步骤:
提取所述形状轮廓数据库中的形状轮廓的多个特征;
检查所述形状轮廓的多个特征之间的关联性;
将具有关联的特征和没有关联的特征进行分割,以分割形成多个分割图像块。
特别地,本发明还提供了一种对图像进行语义注释的装置,包括:
提取模块,用于提取图像的物体的形状轮廓;
注释模块,用于对所述形状轮廓进行语义注释,并将注释后的形状轮廓添加至一形状集合中,其中,多个图像的注释后的形状轮廓共同组成多个形状集合,以形成形状轮廓数据库;
分割模块,用于将形状轮廓数据库中每一形状集合中的形状轮廓进行分割,以形成预设数量的分割图像块;
识别模块,用于识别每一分割图像块,并对所述分割图像块再次进行语义注释,以进一步细化图像的语义注释。
进一步地,所述注释模块包括:
定义单元,用于对所述形状轮廓进行定义,以定义形成含有词或短语的至少一个分级集合;
扩展单元,用于对每一分级集合进行近似词义扩展以形成语义注释;
添加单元,用于将带有语义注释的图像的形状轮廓添加至所述形状集合中。
进一步地,所述定义单元包括:
第一定义子单元,用于定义一逻辑推导规则,所述逻辑推导规则根据自学习形成的图像库中推导形成;
第二定义子单元,用于根据所述逻辑推导规则对所述形状轮廓进行定义,以定义形成含有词或短语的至少一个分级集合。
进一步地,所述分割模块包括:
提取单元,用于提取所述形状轮廓数据库中的形状轮廓的多个特征;
检查单元,用于检查所述形状轮廓的多个特征之间的关联性;
分割单元,用于将具有关联的特征和没有关联的特征进行分割,以分割形成多个分割图像块。
本发明的有益效果在于:本发明的方案对图像中的形状轮廓进行语义注释,并且形成形状轮廓数据库,以便于形状轮廓语义注释的更新,使得图像搜索结果的质量极大提高。此外,对每一形状集合中的形状轮廓进行分割,并对分割后的分割图像块再次进行语义注释,使得语义注释更加精确。本发明方案的语义注释简单便捷,占用服务器的内存较小,使得用户在搜索时能够根据搜索的关键字等信息快速获得想要的图片,极大提高了用户体验。
附图说明
图1是根据本发明一个实施例的用于网络日志文件中的对网页中的图片进行处理的方法的方法流程图;
图2是根据本发明一个实施例的用于网络日志文件中的多维度数据去重系统的结构图。
具体实施方式
下面将结合附图及具体实施例对本发明作进一步详细说明。
如图1所示,本发明所采用的技术方案是:一种对图像进行语义注释的方法,包括如下步骤:
S100、提取图像的物体的形状轮廓;
S200、对所述形状轮廓进行语义注释,并将注释后的形状轮廓添加至一形状集合中,其中,多个图像的注释后的形状轮廓共同组成多个形状集合,以形成形状轮廓数据库;
S300、将形状轮廓数据库中每一形状集合中的形状轮廓进行分割,以形成预设数量的分割图像块;
S400、识别每一分割图像块,并对所述分割图像块再次进行语义注释,以进一步细化图像的语义注释。
对所述形状轮廓进行语义注释,并将注释后的形状轮廓添加至一形状集合中,包括如下步骤:
S210、对所述形状轮廓进行定义,以定义形成含有词或短语的至少一个分级集合;
S220、对每一分级集合进行近似词义扩展以形成语义注释;
S230、将带有语义注释的图像的形状轮廓添加至所述形状集合中。
对所述形状轮廓进行定义,以定义形成含有词或短语的至少一个分级集合,包括以下步骤:
S211、定义一逻辑推导规则,所述逻辑推导规则根据自学习形成的图像库中推导形成;
S212、根据所述逻辑推导规则对所述形状轮廓进行定义,以定义形成含有词或短语的至少一个分级集合。
将形状轮廓数据库中每一形状集合中的形状轮廓进行分割,以形成预设数量的分割图像块,包括如下步骤:
S310、提取所述形状轮廓数据库中的形状轮廓的多个特征;
S320、检查所述形状轮廓的多个特征之间的关联性;
S330、将具有关联的特征和没有关联的特征进行分割,以分割形成多个分割图像块。
特别地,本发明还提供了一种对图像进行语义注释的装置,包括:
提取模块100,用于提取图像的物体的形状轮廓;
注释模块200,用于对所述形状轮廓进行语义注释,并将注释后的形状轮廓添加至一形状集合中,其中,多个图像的注释后的形状轮廓共同组成多个形状集合,以形成形状轮廓数据库;
分割模块300,用于将形状轮廓数据库中每一形状集合中的形状轮廓进行分割,以形成预设数量的分割图像块;
识别模块400,用于识别每一分割图像块,并对所述分割图像块再次进行语义注释,以进一步细化图像的语义注释。
进一步地,所述注释模块200包括:
定义单元210,用于对所述形状轮廓进行定义,以定义形成含有词或短语的至少一个分级集合;
扩展单元220,用于对每一分级集合进行近似词义扩展以形成语义注释;
添加单元230,用于将带有语义注释的图像的形状轮廓添加至所述形状集合中。
进一步地,所述定义单元210包括:
第一定义子单元211,用于定义一逻辑推导规则,所述逻辑推导规则根据自学习形成的图像库中推导形成;
第二定义子单元212,用于根据所述逻辑推导规则对所述形状轮廓进行定义,以定义形成含有词或短语的至少一个分级集合。
进一步地,所述分割模块300包括:
提取单元310,用于提取所述形状轮廓数据库中的形状轮廓的多个特征;
检查单元320,用于检查所述形状轮廓的多个特征之间的关联性;
分割单元330,用于将具有关联的特征和没有关联的特征进行分割,以分割形成多个分割图像块。
本发明的有益效果在于:本发明的方案对图像中的形状轮廓进行语义注释,并且形成形状轮廓数据库,以便于形状轮廓语义注释的更新,使得图像搜索结果的质量极大提高。此外,对每一形状集合中的形状轮廓进行分割,并对分割后的分割图像块再次进行语义注释,使得语义注释更加精确。本发明方案的语义注释简单便捷,占用服务器的内存较小,使得用户在搜索时能够根据搜索的关键字等信息快速获得想要的图片,极大提高了用户体验。
需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。附图中描述位置关系的用于仅用于示例性说明,不能理解为对本专利的限制,显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。

Claims (8)

1.一种对图像进行语义注释的方法,其特征在于,包括如下步骤:
提取图像的物体的形状轮廓;
对所述形状轮廓进行语义注释,并将注释后的形状轮廓添加至一形状集合中,其中,多个图像的注释后的形状轮廓共同组成多个形状集合,以形成形状轮廓数据库;
将形状轮廓数据库中每一形状集合中的形状轮廓进行分割,以形成预设数量的分割图像块;
识别每一分割图像块,并对所述分割图像块再次进行语义注释,以进一步细化图像的语义注释。
2.根据权利要求1所述的对图像进行语义注释的方法,其特征在于,对所述形状轮廓进行语义注释,并将注释后的形状轮廓添加至一形状集合中,包括如下步骤:
对所述形状轮廓进行定义,以定义形成含有词或短语的至少一个分级集合;
对每一分级集合进行近似词义扩展以形成语义注释;
将带有语义注释的图像的形状轮廓添加至所述形状集合中。
3.根据权利要求2所述的对图像进行语义注释的方法,其特征在于,对所述形状轮廓进行定义,以定义形成含有词或短语的至少一个分级集合,包括以下步骤:
定义一逻辑推导规则,所述逻辑推导规则根据自学习形成的图像库中推导形成;
根据所述逻辑推导规则对所述形状轮廓进行定义,以定义形成含有词或短语的至少一个分级集合。
4.根据权利要求2或3所述的对图像进行语义注释的方法,其特征在于,将形状轮廓数据库中每一形状集合中的形状轮廓进行分割,以形成预设数量的分割图像块,包括如下步骤:
提取所述形状轮廓数据库中的形状轮廓的多个特征;
检查所述形状轮廓的多个特征之间的关联性;
将具有关联的特征和没有关联的特征进行分割,以分割形成多个分割图像块。
5.一种对图像进行语义注释的装置,其特征在于,包括:
提取模块,用于提取图像的物体的形状轮廓;
注释模块,用于对所述形状轮廓进行语义注释,并将注释后的形状轮廓添加至一形状集合中,其中,多个图像的注释后的形状轮廓共同组成多个形状集合,以形成形状轮廓数据库;
分割模块,用于将形状轮廓数据库中每一形状集合中的形状轮廓进行分割,以形成预设数量的分割图像块;
识别模块,用于识别每一分割图像块,并对所述分割图像块再次进行语义注释,以进一步细化图像的语义注释。
6.根据权利要求5所述的对图像进行语义注释的装置,其特征在于,所述注释模块包括:
定义单元,用于对所述形状轮廓进行定义,以定义形成含有词或短语的至少一个分级集合;
扩展单元,用于对每一分级集合进行近似词义扩展以形成语义注释;
添加单元,用于将带有语义注释的图像的形状轮廓添加至所述形状集合中。
7.根据权利要求6所述的对图像进行语义注释的装置,其特征在于,所述定义单元包括:
第一定义子单元,用于定义一逻辑推导规则,所述逻辑推导规则根据自学习形成的图像库中推导形成;
第二定义子单元,用于根据所述逻辑推导规则对所述形状轮廓进行定义,以定义形成含有词或短语的至少一个分级集合。
8.根据权利要求6或7所述的对图像进行语义注释的装置,其特征在于,所述分割模块包括:
提取单元,用于提取所述形状轮廓数据库中的形状轮廓的多个特征;
检查单元,用于检查所述形状轮廓的多个特征之间的关联性;
分割单元,用于将具有关联的特征和没有关联的特征进行分割,以分割形成多个分割图像块。
CN201710796583.7A 2017-09-06 2017-09-06 一种对图像进行语义注释的方法及装置 Pending CN107633031A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710796583.7A CN107633031A (zh) 2017-09-06 2017-09-06 一种对图像进行语义注释的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710796583.7A CN107633031A (zh) 2017-09-06 2017-09-06 一种对图像进行语义注释的方法及装置

Publications (1)

Publication Number Publication Date
CN107633031A true CN107633031A (zh) 2018-01-26

Family

ID=61100801

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710796583.7A Pending CN107633031A (zh) 2017-09-06 2017-09-06 一种对图像进行语义注释的方法及装置

Country Status (1)

Country Link
CN (1) CN107633031A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112364200A (zh) * 2021-01-15 2021-02-12 清华大学 一种类脑成像的方法、装置、设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102422286A (zh) * 2009-03-11 2012-04-18 香港浸会大学 利用图像获取参数和元数据自动和半自动的图像分类、注释和标签
CN102831239A (zh) * 2012-09-04 2012-12-19 清华大学 一种构建图像数据库的方法与系统
CN105512161A (zh) * 2015-09-14 2016-04-20 阜阳师范学院 一种唐卡图像感兴趣区域语义标注和检索系统
CN106295706A (zh) * 2016-08-17 2017-01-04 山东大学 一种基于形状视觉知识库的图像自动分割和语义注释方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102422286A (zh) * 2009-03-11 2012-04-18 香港浸会大学 利用图像获取参数和元数据自动和半自动的图像分类、注释和标签
CN102831239A (zh) * 2012-09-04 2012-12-19 清华大学 一种构建图像数据库的方法与系统
CN105512161A (zh) * 2015-09-14 2016-04-20 阜阳师范学院 一种唐卡图像感兴趣区域语义标注和检索系统
CN106295706A (zh) * 2016-08-17 2017-01-04 山东大学 一种基于形状视觉知识库的图像自动分割和语义注释方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112364200A (zh) * 2021-01-15 2021-02-12 清华大学 一种类脑成像的方法、装置、设备及存储介质
CN112364200B (zh) * 2021-01-15 2021-04-13 清华大学 一种类脑成像的方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
US11573996B2 (en) System and method for hierarchically organizing documents based on document portions
KR101419623B1 (ko) 검색 키워드로부터 문서 데이터를 검색하는 방법, 그 컴퓨터 시스템 및 컴퓨터 프로그램
Song et al. Real-time automatic tag recommendation
US9589208B2 (en) Retrieval of similar images to a query image
US20160034512A1 (en) Context-based metadata generation and automatic annotation of electronic media in a computer network
US20090300046A1 (en) Method and system for document classification based on document structure and written style
US9519718B2 (en) Webpage information detection method and system
US20160034514A1 (en) Providing search results based on an identified user interest and relevance matching
WO2015149533A1 (zh) 一种基于网页内容分类进行分词处理的方法和装置
CN107688616B (zh) 使实体的独特事实显现
US11709880B2 (en) Method of image searching based on artificial intelligence and apparatus for performing the same
CN108319583B (zh) 从中文语料库提取知识的方法与系统
CN107506472B (zh) 一种学生浏览网页分类方法
CN106407195B (zh) 用于网页消重的方法和系统
CN111325030A (zh) 文本标签构建方法、装置、计算机设备和存储介质
KR101607468B1 (ko) 콘텐츠에 대한 키워드 태깅 방법 및 시스템
Ruocco et al. A scalable algorithm for extraction and clustering of event-related pictures
US11182441B2 (en) Hypotheses generation using searchable unstructured data corpus
CN112818200A (zh) 基于静态网站的数据爬取及事件分析方法及系统
Li et al. Towards retrieving relevant information graphics
Wang et al. Constructing a comprehensive events database from the web
CN112818206A (zh) 一种数据分类方法、装置、终端及存储介质
CN112231513A (zh) 一种学习视频推荐方法、装置及系统
Bartík Text-based web page classification with use of visual information
CN107633031A (zh) 一种对图像进行语义注释的方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180126

RJ01 Rejection of invention patent application after publication