CN104268504A - 图片识别方法和装置 - Google Patents

图片识别方法和装置 Download PDF

Info

Publication number
CN104268504A
CN104268504A CN201410444197.8A CN201410444197A CN104268504A CN 104268504 A CN104268504 A CN 104268504A CN 201410444197 A CN201410444197 A CN 201410444197A CN 104268504 A CN104268504 A CN 104268504A
Authority
CN
China
Prior art keywords
picture
identified
descriptor
classification
association
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410444197.8A
Other languages
English (en)
Other versions
CN104268504B (zh
Inventor
国玉晶
徐饶
李颖超
李�浩
钟升达
田甜
许笑天
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201410444197.8A priority Critical patent/CN104268504B/zh
Publication of CN104268504A publication Critical patent/CN104268504A/zh
Application granted granted Critical
Publication of CN104268504B publication Critical patent/CN104268504B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Abstract

本发明提出一种图片识别方法和装置,该图片识别方法包括获取待识别的图片;确定与所述待识别的图片关联的图片,并提取所述关联的图片的描述信息;根据所述描述信息,识别所述待识别的图片。该方法能够提高图片识别的准确度。

Description

图片识别方法和装置
技术领域
本发明涉及通信技术领域,尤其涉及一种图片识别方法和装置。
背景技术
目前的图像识别技术,大多通过图片分类技术实现,通常只针对图像进行比对处理,搜索得到相似的图片,再将该相似图片所属的类别确定为识别结果。例如,当要识别的图片是一个动漫人物时,通常只能识别到动漫,或者误识别为一个通常的动漫人物。因此,这种识别方式准确度较低。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的一个目的在于提出一种图片识别方法,该方法可以提高图片识别的准确度。
本发明的另一个目的在于提出一种图片识别装置。
为达到上述目的,本发明第一方面实施例提出的图片识别方法,包括:获取待识别的图片;确定与所述待识别的图片关联的图片,并提取所述关联的图片的描述信息;根据所述描述信息,识别所述待识别的图片。
本发明第一方面实施例提出的图片识别方法,通过获取与待识别的图片关联的图片,并获取该关联的图片的描述信息,根据描述信息识别图片,相对于只能确定出类别的图片分类技术,描述信息可以表明更多的关于图片的信息,因此可以提高图片识别的准确度。
为达到上述目的,本发明第二方面实施例提出的图片识别装置,包括:获取模块,用于获取待识别的图片;提取模块,用于确定与所述待识别的图片关联的图片,并提取所述关联的图片的描述信息;识别模块,用于根据所述描述信息,识别所述待识别的图片。
本发明第二方面实施例提出的图片识别装置,通过获取与待识别的图片关联的图片,并获取该关联的图片的描述信息,根据描述信息识别图片,相对于只能确定出类别的图片分类技术,描述信息可以表明更多的关于图片的信息,因此可以提高图片识别的准确度。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1是本发明一实施例提出的图片识别方法的流程示意图;
图2是本发明另一实施例提出的图片识别方法的流程示意图;
图3是本发明另一实施例提出的图片识别装置的结构示意图;
图4是本发明另一实施例提出的图片识别装置的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。相反,本发明的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。
图1是本发明一实施例提出的图片识别方法的流程示意图,该方法包括:
S11:获取待识别的图片。
其中,服务端可以接收搜索引擎发送的待识别的图片,其中,搜索引擎可以接收用户实时拍摄的或者从本地图片库中选择的图片。
S12:确定与所述待识别的图片关联的图片,并提取所述关联的图片的描述信息。
其中,与待识别的图片关联的图片可以是指与待识别的图片相似的图片,具体可以在网络上搜索,通过相似比对,可以获取与待识别的图片相似的图片。
在获取关联的图片后,可以进一步获取该图片的描述信息,具体可以在关联的图片所在的网页中,提取描述信息。其中,关联的图片所在的网页不限于网页标题或者网页前面的内容,可以在该关联的图片所在的全部网页中进行搜索,得到描述信息。例如,某个用户在某个网页中上传的该相似的图片,那么在搜索描述信息时,不仅搜索该相似的图片所在的主贴中的信息,还可以搜索该用户在后续贴中的信息,还可以在其他用户的回复贴中搜索,如果该主题的网页包括了多页,可以在这多页中搜索,而不限于仅在第一页。
S13:根据所述描述信息,识别所述待识别的图片。
其中,可以从描述信息中提取出识别结果,例如,描述信息中包含“海贼王”,“路飞”等,那么可以将该《海贼王》中的角色路飞确定为识别结果。其中,可以理解的是,“海贼王”,“路飞”可以包含在一个结果中,或者,也可以包含在不同的结果中,例如,由同一个人在同一个帖子中回复是“海贼王”,“路飞”,或者,也可以是由不同的人分别回复是“海贼王”以及“路飞”。
或者,
可选的,还可以确定待识别的图片所属的类别,例如,采用图片分类技术确定相应的类别,例如,可以确定该类别是动漫。
之后,再将类别和描述信息结合获取识别结果。例如,描述信息中包括上述的《海贼王》中的角色路飞,经过图片分类识别可以确定该图片属于动漫,那么可以将识别结果确定为动漫《海贼王》中的角色路飞。
另外,类别还可以排除一些明显不合适的描述信息,从而提高识别准确度,例如,当确定类别是动漫人物时,那么可以将描述信息中花的信息等排除。
本实施例通过获取与待识别的图片关联的图片,并获取该关联的图片的描述信息,根据描述信息识别图片,相对于只能确定出类别的图片分类技术,描述信息可以表明更多的关于图片的信息,因此可以提高图片识别的准确度。
图2是本发明另一实施例提出的图片识别方法的流程示意图,该方法包括:
S21:搜索引擎接收用户输入的图片。
例如,用户拍摄了一张动漫《海贼王》里角色路飞的图片,用户希望知道该图片中的人物是谁,此时用户可以在搜索引擎中点击图片输入按钮输入该拍摄的图片。
S22:搜索引擎将该图片发送给服务端。
S23:服务端根据图片分类技术,确定该图片属于的类别。
相关技术中,对于未知的图片通常采用图片分类技术确定出类别,例如,识别出该图片的类别是“动漫”。相关技术中该类别就是识别结果,或者,进一步的将该类别中通用的人物作为结果,例如,误认为是常见的“机器猫”。这样会造成识别的不准确。而本实施例还包括:
S24:服务端在网络上查找与该图片相似的图片,并获取该相似的图片的描述信息。
例如,经过图片比对,在一个网页中找到了相似图片,在相似图片的网页中还包括:“海贼王”,“路飞”。可以理解的是,“海贼王”,“路飞”可以包含在一个结果中,或者,也可以包含在不同的结果中,例如,由同一个人在同一个帖子中回复是“海贼王”,“路飞”,或者,也可以是由不同的人分别回复是“海贼王”以及“路飞”。
S25:服务端根据识别出的类别和描述信息,确定识别结果。
其中,将类别与从描述信息中提取的关键字进行组合,得到识别结果,例如,识别结果是:“动漫”+“海贼王”+“路飞”。
S26:服务端将识别结果发送给搜索引擎。
S27:搜索引擎展现识别结果。
例如,将识别结果优先排序展现在搜索结果页的上方。
本实施例通过获取与待识别的图片关联的图片,并获取该关联的图片的描述信息,根据描述信息识别图片,相对于只能确定出类别的图片分类技术,描述信息可以表明更多的关于图片的信息,因此可以提高图片识别的准确度。本实施例通过将图片分类技术,图片的相似图技术和相似图片的文本信息挖掘技术等结合,可以提高图像识别准确度。
图3是本发明另一实施例提出的图片识别装置的结构示意图,该装置30包括:获取模块31、提取模块32和识别模块33。
获取模块31用于获取待识别的图片;
可选的,所述获取模块31具体用于:
接收搜索引擎发送的待识别的图片,其中,搜索引擎接收用户拍摄的或者从本地图片库中选择的图片。
例如,用户拍摄了一张动漫《海贼王》里角色路飞的图片,用户希望知道该图片中的人物是谁,此时用户可以在搜索引擎中点击图片输入按钮输入该拍摄的图片。
搜索引擎将该图片发送给服务端。
提取模块32用于确定与所述待识别的图片关联的图片,并提取所述关联的图片的描述信息;
其中,与待识别的图片关联的图片可以是指与待识别的图片相似的图片,具体可以在网络上搜索,通过相似比对,可以获取与待识别的图片相似的图片。
在获取关联的图片后,可以进一步获取该图片的描述信息,具体可以在关联的图片所在的网页中,提取描述信息。其中,关联的图片所在的网页不限于网页标题或者网页前面的内容,可以在该关联的图片所在的全部网页中进行搜索,得到描述信息。例如,某个用户在某个网页中上传的该相似的图片,那么在搜索描述信息时,不仅搜索该相似的图片所在的主贴中的信息,还可以搜索该用户在后续贴中的信息,还可以在其他用户的回复贴中搜索,如果该主题的网页包括了多页,可以在这多页中搜索,而不限于仅在第一页。
可选的,所述提取模块32具体用于:
在网络上进行搜索,根据相似图技术,获取与所述待识别的图片关联的图片。
可选的,所述提取模块32还具体用于:
从所述关联的图片所在的网页中,提取所述描述信息。
识别模块33用于根据所述描述信息,识别所述待识别的图片。
其中,可以从描述信息中提取出识别结果,例如,描述信息中包含“海贼王”,“路飞”等,那么可以将该《海贼王》中的角色路飞确定为识别结果。其中,可以理解的是,“海贼王”,“路飞”可以包含在一个结果中,或者,也可以包含在不同的结果中,例如,由同一个人在同一个帖子中回复是“海贼王”,“路飞”,或者,也可以是由不同的人分别回复是“海贼王”以及“路飞”。
一个实施例中,参见图4,该装置30还包括:
确定模块34,用于确定所述待识别的图片所属的类别;
可选的,所述确定模块34具体用于:
根据图像分类技术,确定所述待识别的图片在预先的类别中所属的类别。
例如,可以确定该类别是动漫。
相应的,所述识别模块33具体用于:根据所述类别和所述描述信息,识别所述待识别的图片。
例如,经过图片比对,在一个网页中找到了相似图片,在相似图片的网页中还包括:“海贼王”,“路飞”。可以理解的是,“海贼王”,“路飞”可以包含在一个结果中,或者,也可以包含在不同的结果中,例如,由同一个人在同一个帖子中回复是“海贼王”,“路飞”,或者,也可以是由不同的人分别回复是“海贼王”以及“路飞”。
其中,将类别与从描述信息中提取的关键字进行组合,得到识别结果,例如,识别结果是:“动漫”+“海贼王”+“路飞”。
另外,类别还可以排除一些明显不合适的描述信息,从而提高识别准确度,例如,当确定类别是动漫人物时,那么可以将描述信息中花的信息等排除。
本实施例通过获取与待识别的图片关联的图片,并获取该关联的图片的描述信息,根据描述信息识别图片,相对于只能确定出类别的图片分类技术,描述信息可以表明更多的关于图片的信息,因此可以提高图片识别的准确度。本实施例通过将图片分类技术,图片的相似图技术和相似图片的文本信息挖掘技术等结合,可以提高图像识别准确度。
需要说明的是,在本发明的描述中,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (12)

1.一种图片识别方法,其特征在于,包括:
获取待识别的图片;
确定与所述待识别的图片关联的图片,并提取所述关联的图片的描述信息;
根据所述描述信息,识别所述待识别的图片。
2.根据权利要求1所述的方法,其特征在于,还包括:
确定所述待识别的图片所属的类别;
所述根据所述描述信息,识别所述待识别的图片,包括:
根据所述类别和所述描述信息,识别所述待识别的图片。
3.根据权利要求1所述的方法,所述确定与所述待识别的图片关联的图片,包括:
在网络上进行搜索,根据相似图技术,获取与所述待识别的图片关联的图片。
4.根据权利要求3所述的方法,其特征在于,所述提取所述关联的图片的描述信息,包括:
从所述关联的图片所在的网页中,提取所述描述信息。
5.根据权利要求2所述的方法,其特征在于,所述确定所述待识别的图片所属的类别,包括:
根据图像分类技术,确定所述待识别的图片在预先的类别中所属的类别。
6.根据权利要求1-5任一项所述的方法,其特征在于,所述获取待识别的图片,包括:
接收搜索引擎发送的待识别的图片,其中,搜索引擎接收用户拍摄的或者从本地图片库中选择的图片。
7.一种图片识别装置,其特征在于,包括:
获取模块,用于获取待识别的图片;
提取模块,用于确定与所述待识别的图片关联的图片,并提取所述关联的图片的描述信息;
识别模块,用于根据所述描述信息,识别所述待识别的图片。
8.根据权利要求7所述的装置,其特征在于,还包括:
确定模块,用于确定所述待识别的图片所属的类别;
所述识别模块具体用于:根据所述类别和所述描述信息,识别所述待识别的图片。
9.根据权利要求7所述的装置,其特征在于,所述提取模块具体用于:
在网络上进行搜索,根据相似图技术,获取与所述待识别的图片关联的图片。
10.根据权利要求9所述的装置,其特征在于,所述提取模块还具体用于:
从所述关联的图片所在的网页中,提取所述描述信息。
11.根据权利要求8所述的装置,其特征在于,所述确定模块具体用于:
根据图像分类技术,确定所述待识别的图片在预先的类别中所属的类别。
12.根据权利要求7-11任一项所述的装置,其特征在于,所述获取模块具体用于:
接收搜索引擎发送的待识别的图片,其中,搜索引擎接收用户拍摄的或者从本地图片库中选择的图片。
CN201410444197.8A 2014-09-02 2014-09-02 图片识别方法和装置 Active CN104268504B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410444197.8A CN104268504B (zh) 2014-09-02 2014-09-02 图片识别方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410444197.8A CN104268504B (zh) 2014-09-02 2014-09-02 图片识别方法和装置

Publications (2)

Publication Number Publication Date
CN104268504A true CN104268504A (zh) 2015-01-07
CN104268504B CN104268504B (zh) 2017-10-27

Family

ID=52160024

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410444197.8A Active CN104268504B (zh) 2014-09-02 2014-09-02 图片识别方法和装置

Country Status (1)

Country Link
CN (1) CN104268504B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104951537A (zh) * 2015-06-18 2015-09-30 百度在线网络技术(北京)有限公司 一种图像搜索的方法和装置
CN105069063A (zh) * 2015-07-29 2015-11-18 百度在线网络技术(北京)有限公司 图片搜索方法及装置
CN107092603A (zh) * 2016-02-18 2017-08-25 腾讯科技(深圳)有限公司 一种图片识别方法及装置
CN110555173A (zh) * 2019-09-04 2019-12-10 北京人民在线网络有限公司 一种基于poi的地域识别系统及其识别方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080095515A1 (en) * 2006-10-24 2008-04-24 Masaru Miyamoto Contents Character Information Acquisition Method, Contents Character Information Acquisition Program, Contents Character Information Acquisition Apparatus, and Video Content Recording Apparatus
CN101211341A (zh) * 2006-12-29 2008-07-02 上海芯盛电子科技有限公司 图像智能模式识别搜索方法
US20090041356A1 (en) * 2006-03-03 2009-02-12 Koninklijke Philips Electronics N.V. Method and Device for Automatic Generation of Summary of a Plurality of Images
CN101751447A (zh) * 2009-07-22 2010-06-23 中国科学院自动化研究所 基于语义分析的网络图像检索方法
CN102012934A (zh) * 2010-11-30 2011-04-13 百度在线网络技术(北京)有限公司 图片搜索方法及搜索系统
CN103631889A (zh) * 2013-11-15 2014-03-12 北京奇虎科技有限公司 一种图像识别方法和装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090041356A1 (en) * 2006-03-03 2009-02-12 Koninklijke Philips Electronics N.V. Method and Device for Automatic Generation of Summary of a Plurality of Images
US20080095515A1 (en) * 2006-10-24 2008-04-24 Masaru Miyamoto Contents Character Information Acquisition Method, Contents Character Information Acquisition Program, Contents Character Information Acquisition Apparatus, and Video Content Recording Apparatus
CN101211341A (zh) * 2006-12-29 2008-07-02 上海芯盛电子科技有限公司 图像智能模式识别搜索方法
CN101751447A (zh) * 2009-07-22 2010-06-23 中国科学院自动化研究所 基于语义分析的网络图像检索方法
CN102012934A (zh) * 2010-11-30 2011-04-13 百度在线网络技术(北京)有限公司 图片搜索方法及搜索系统
CN103631889A (zh) * 2013-11-15 2014-03-12 北京奇虎科技有限公司 一种图像识别方法和装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104951537A (zh) * 2015-06-18 2015-09-30 百度在线网络技术(北京)有限公司 一种图像搜索的方法和装置
CN105069063A (zh) * 2015-07-29 2015-11-18 百度在线网络技术(北京)有限公司 图片搜索方法及装置
CN107092603A (zh) * 2016-02-18 2017-08-25 腾讯科技(深圳)有限公司 一种图片识别方法及装置
CN110555173A (zh) * 2019-09-04 2019-12-10 北京人民在线网络有限公司 一种基于poi的地域识别系统及其识别方法
CN110555173B (zh) * 2019-09-04 2022-09-23 北京人民在线网络有限公司 一种基于poi的地域识别系统及其识别方法

Also Published As

Publication number Publication date
CN104268504B (zh) 2017-10-27

Similar Documents

Publication Publication Date Title
US10642892B2 (en) Video search method and apparatus
CN107657048B (zh) 用户识别方法及装置
CN104504109A (zh) 图片搜索方法和装置
CN112015949B (zh) 视频生成方法和装置、存储介质及电子设备
US10325221B2 (en) Metadata tag description generation
CN109145110B (zh) 标签查询方法和装置
CN107357787B (zh) 语义交互方法、装置及电子设备
CN103942279A (zh) 搜索结果的展现方法和装置
CN103425640A (zh) 一种多媒体问答系统及方法
CN102165464A (zh) 用于对视频内容中的人进行自动注释的方法和系统
CN104239461A (zh) 提取图片摘要的方法和装置
JP2014022837A (ja) 学習装置、及びプログラム
CN106326386B (zh) 搜索结果的展示方法和装置
CN111931859B (zh) 一种多标签图像识别方法和装置
CN104268504A (zh) 图片识别方法和装置
CN104462590A (zh) 信息搜索方法及装置
CN102236714A (zh) 一种基于xml的交互应用多媒体信息检索方法
CN104504108A (zh) 信息搜索方法及装置
CN104035955A (zh) 搜索方法和装置
CN105260396A (zh) 字词检索方法和装置
CN104504110A (zh) 搜索方法和装置
CN110162797B (zh) 文章质量检测方法和装置
CN104462282A (zh) 信息搜索方法和装置
Feng et al. Multiple style exploration for story unit segmentation of broadcast news video
CN107577667B (zh) 一种实体词处理方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant