CN104036009A - 一种搜索匹配图片的方法、图片搜索方法及装置 - Google Patents

一种搜索匹配图片的方法、图片搜索方法及装置 Download PDF

Info

Publication number
CN104036009A
CN104036009A CN201410286225.8A CN201410286225A CN104036009A CN 104036009 A CN104036009 A CN 104036009A CN 201410286225 A CN201410286225 A CN 201410286225A CN 104036009 A CN104036009 A CN 104036009A
Authority
CN
China
Prior art keywords
picture
threshold value
local feature
checked
matching
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410286225.8A
Other languages
English (en)
Other versions
CN104036009B (zh
Inventor
邱学侃
胡金辉
韩玉刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Qihoo Technology Co Ltd
Qizhi Software Beijing Co Ltd
Original Assignee
Beijing Qihoo Technology Co Ltd
Qizhi Software Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Qihoo Technology Co Ltd, Qizhi Software Beijing Co Ltd filed Critical Beijing Qihoo Technology Co Ltd
Priority to CN201410286225.8A priority Critical patent/CN104036009B/zh
Publication of CN104036009A publication Critical patent/CN104036009A/zh
Priority to US15/322,074 priority patent/US20170154056A1/en
Priority to PCT/CN2015/082070 priority patent/WO2015196964A1/zh
Application granted granted Critical
Publication of CN104036009B publication Critical patent/CN104036009B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5838Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour

Landscapes

  • Engineering & Computer Science (AREA)
  • Library & Information Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供了一种搜索匹配图片的方法、图片搜索方法及装置,通过设定第一比例阈值和第二比例阈值,第一比例阈值大于第二比例阈值,在使用较大的那个匹配阈值来进行局部特征匹配,并在此基础上,对于匹配比例小于第一比例阈值大于第二比例阈值的每个图片,再使用感知哈希的匹配方式进行筛选,将其中汉明距离小于设定的第一距离阈值的图片也放入图片匹配结果中,一方面使用较大的匹配阈值保证了图片的匹配准确性,另一方面,对于局部特征匹配重合比例在较大匹配阈值和较小匹配阈值之间的图片,进一步利用感知哈希的方式进行筛选,在保证筛选的图片的准确性的前提下,增加了搜索结果中图片数量。

Description

一种搜索匹配图片的方法、图片搜索方法及装置
技术领域
本发明涉及互联网技术领域,尤其涉及一种搜索匹配图片的方法、图片搜索方法及装置。
背景技术
在互联网上,有很多图片会被不同的网站转载,在转载过程中每个网站可能都会对图片进行处理(缩放、裁剪、加水印、旋转及各种PS等)。将这些图片内容相似但经过不同操作得到的图片识别出来,在许多领域都可能用到,例如应用在搜索、去重、过滤等相关产品中。
以搜索引擎为例,以前搜索引擎在进行搜索时,只要给出足够的关键词就可以搜到想要的东西。但是对于图片搜索来说,如果用户想要找到和一张图片内容相似的所有图片,但是手头没有关键词,只有“关键图”,例如用户手上已经有一张图片,想要找一张尺寸更大的,或是没有水印的,或是PS处理之前的原图;在这种情况和前提下,需要对用户输入的图片(为了方便说明,以下称为待查询的图片),搜索与该图片内容相似的图片(或者说是与该图片相匹配的图片)作为搜索结果提供给用户。
目前匹配图片的搜索技术中,使用比较多的是基于图片局部特征的方法即:从待识别的图片中提取大量局部特征,将待识别的图片表示为局部特征的集合。比较两幅图片的相似度时,以局部特征集合的重合比例作为比较标准,当两个图片的局部特征集合的重合比例高于某个固定阈值时则认为两幅图片是相同的;对于不同类型的图片,由于图片中提取的局部特征数目不同、重复纹理导致的重复局部特征数目不同等原因,局部特征集合重合比例的阈值差异较大。如果阈值选择不恰当,例如当阈值设的过高,会有很多实际匹配的图片无法被搜索出来(即准确匹配的图片数量相对少);而阈值设的过低,则会搜出来很多错误匹配的图片,错误图片与原图在整体视觉上往往没有任何相似性。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种搜索匹配图片的方法、图片搜索方法及装置。
基于上述问题,本发明实施例提供的一种搜索匹配图片的方法,包括:
对用户输入的待查询图片提取局部特征;
将图片数据库中每个图片的局部特征,与所述待查询图片的局部特征进行匹配,确定所述数据库中的每个图片与所述待查询图片的局部特征的匹配比例;
将所述数据库中匹配比例大于等于第一比例阈值的图片,放入图片匹配结果集合中;
对于所述数据库中匹配比例小于第一比例阈值大于第二比例阈值的每个图片,计算该图片的感知哈希值与所述待查询图片的感知哈希值之间的汉明距离,将其中汉明距离小于设定的第一距离阈值的图片,放入图片匹配结果中;所述第一比例阈值大于第二比例阈值。
进一步地,本发明实施例提供的上述搜索匹配图片的方法,进一步包括:
预先对图片数据库中的每个图片进行离线特征提取,所述离线特征包括感知哈希值和/或设定数量的局部特征。
进一步地,本发明实施例提供的上述搜索匹配图片的方法,还包括:
确定所述数据库中匹配比例小于第一比例阈值大于第二比例阈值且汉明距离小于设定的第二距离阈值的所有图片并放入参照集合中;所述第二距离阈值小于所述第一距离阈值;
针对所述参照集合中的每个图片,使用该图片的各局部特征,与所述待查询图片的各局部特征进行匹配,计算该图片与所述待查询图片的局部特征的匹配比例;
确定所述参照集合中每个图片对应的匹配比例中的最小值。
进一步地,本发明实施例提供的上述搜索匹配图片的方法,还包括:
将所述数据库中匹配比例小于第一比例阈值大于第二比例阈值且汉明距离大于等于设定的第二距离阈值的所有图片放入候选结果集合中;
针对所述候选结果集合中的每个图片,使用该图片的各局部特征,与所述待查询图片的各局部特征进行匹配,计算该图片与所述待查询图片的局部特征的匹配比例;
将候选结果集合中匹配比例大于所述最小值的图片放入图片匹配结果中。
本发明实施例提供的一种图片搜索方法,包括:
接收用户输入的待查询图片,提取所述待查询图片的局部特征;基于所述待查询图片的局部特征搜索与用户输入所述待查询的图片相匹配的图片;
将搜索到的图片作为搜索结果返回给用户。
本发明实施例提供的一种搜索匹配图片的装置,包括:
待查询图片提取器,用于对所述待查询图片提取局部特征;
匹配比例确定模块,用于将图片数据库中每个图片的局部特征,与所述待查询图片的局部特征进行匹配,确定所述数据库中的每个图片与所述待查询图片的局部特征的匹配比例;
计算模块,用于对于所述数据库中匹配比例小于第一比例阈值大于第二比例阈值的每个图片,计算该图片的感知哈希值与所述待查询图片的感知哈希值之间的汉明距离;
匹配结果确定模块,用于根据匹配比例确定模块的确定结果,将所述数据库中匹配比例大于等于第一比例阈值的图片,以及所述数据库中匹配比例小于第一比例阈值大于第二比例阈值且汉明距离小于设定的第一距离阈值的图片放入图片匹配结果中;所述第一比例阈值大于第二比例阈值。
进一步地,本发明实施例提供的上述搜索匹配图片的装置,还包括:存储模块;
所述提取模块,还用于预先对图片数据库中的每个图片进行离线特征提取,所述离线特征包括感知哈希值和/或设定数量的局部特征;
所述存储模块,用于保存预先提取的数据库中的每个图片的感知哈希值和设定数量的局部特征。
进一步地,本发明实施例提供的上述搜索匹配图片的装置,还包括:
参照集合确定模块,用于确定所述数据库中匹配比例小于第一比例阈值大于第二比例阈值且汉明距离小于设定的第二距离阈值的所有图片并放入参照集合中;所述第二距离阈值小于所述第一距离阈值;
所述计算模块,还用于针对所述参照集合中的每个图片,使用该图片的各局部特征,与所述待查询图片的各局部特征进行匹配,计算该图片与所述待查询图片的局部特征的匹配比例;并确定所述参照集合中每个图片对应的匹配比例中的最小值。
进一步地,本发明实施例提供的上述搜索匹配图片的装置,还包括:
候选结果集合确定模块,用于将所述数据库中匹配比例小于第一比例阈值大于第二比例阈值且汉明距离大于等于设定的第二距离阈值的所有图片放入候选结果集合中;
所述计算模块,还用于针对所述候选结果集合中的每个图片,使用该图片的各局部特征,与所述待查询图片的各局部特征进行匹配,计算该图片与所述待查询图片的局部特征的匹配比例;
匹配结果确定模块,还用于将候选结果集合中匹配比例大于所述最小值的图片放入图片匹配结果中。
本发明实施例提供的图片的搜索装置,包括:
输入接口,用于接收用户输入的待查询图片;
图片查询器,发起搜索与所述待查询图片相匹配图片的请求并获取基于所述待查询图片的局部特征的与用户输入所述待查询的图片相匹配的图片;
输出接口,用于将搜索到的图片作为搜索结果返回给用户。
本发明实施例的有益效果包括:
本发明实施例提供的一种搜索匹配图片的方法、图片搜索方法及装置,通过设定两个匹配阈值-第一比例阈值和第二比例阈值,其中,第一比例阈值大于第二比例阈值,在使用较大的那个匹配阈值来进行局部特征匹配(即:将数据库中匹配比例大于等于第一比例阈值的图片,放入图片匹配结果中),并在此基础上,对于匹配比例小于第一比例阈值大于第二比例阈值的每个图片,再使用感知哈希的匹配方式进行筛选,计算匹配比例小于第一比例阈值大于第二比例阈值的每个图片的感知哈希值与用户输入的图片的感知哈希值之间的汉明距离,将其中汉明距离小于设定的第一距离阈值的图片也放入图片匹配结果中,一方面使用较大的匹配阈值保证了图片的匹配准确性,另一方面,对于局部特征匹配重合比例在较大匹配阈值和较小匹配阈值之间的图片,进一步利用感知哈希的方式进行筛选,在保证筛选的图片的准确性的前提下,增加了搜索结果中图片数量。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1为本发明实施例提供的搜索匹配图片的方法的流程图;
图2为本发明实施例提供的实例的流程图;
图3为本发明实施例提供的本发明实施例提供的图片搜索方法的流程图;
图4为本发明实施例提供的本发明实施例提供的搜索匹配图片的装置的结构示意图;
图5为本发明实施例提供的图片的搜索装置的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
下面结合说明书附图,对本发明实施例提供的一种搜索匹配图片的方法、图片搜索方法及装置的具体实施方式进行说明。
本发明实施例提供的搜索匹配图片的方法,对现有基于局部特征匹配进行图片匹配的方法进行了改进,将基于感知哈希进行图片匹配的方法融入到基于局部特征匹配进行图片匹配的方法之中,综合利用局部特征和感知哈希,在满足图片搜索结果的数量的基础上,保证搜索结果的准确性。
基于感知哈希进行图片匹配的方法,简单来说,就是对一幅图片提取出感知特征用于描述图片整体。每个图片会表示成一个固定长度(64位)的01二进制串,如果两个二进制串的汉明距离(不同的位的数目)低于一定阈值,则认为两幅图片是相匹配的图片。
具体来说,本发明实施例提供的图片匹配的方法,如图1所示,包括以下步骤:
S101、对用户输入的待查询图片提取局部特征;
在本步骤中,提取的局部特征的数量可以预先设定;
S102、将图片数据库中每个图片的局部特征,与用户输入的图片(即待查询的图片)的局部特征进行匹配,确定数据库中的每个图片与用户输入的图片的局部特征的匹配比例;
S103、将数据库中匹配比例大于等于第一比例阈值的图片,放入图片匹配结果中;
S104、对于数据库中匹配比例小于第一比例阈值大于第二比例阈值的每个图片,计算该图片的感知哈希值与用户输入的图片的感知哈希值之间的汉明距离;
S105、将其中汉明距离小于设定的第一距离阈值的图片,放入图片匹配结果中。
下面分别对上述S101~S105进行详细的说明。
本发明实施例预先设置两个匹配阈值,第一比例阈值和第二比例阈值,其中,第一比例阈值大于第二比例阈值。
上述方法中,还需要执行下述步骤:
在离线状态下,预先对图片数据库中的每个图片进行离线特征提取,包括提取感知哈希值和/或设定数量的局部特征;
提取之后,为了后续搜索匹配的图片的方便,还可以将提取的感知哈希值和设定数量的局部特征进行保存。提取的数量例如可以为几百个。
在保存时,可采用感知哈希值列表和局部特征列表存储于数据库中的存储方式,每个列表中,都保存了图片的标识和对应的多个感知哈希值(多个局部特征)的对应关系。
这样,后续S102和S104就能够直接使用所保存的每个图片提取的局部特征和感知哈希值,进行局部特征匹配和汉明距离的计算,提高运算效率。
上述S101中提取局部特征的步骤,可以采用现有技术的做法,在此不再赘述。
上述S101~S105中,通过设定两个匹配阈值-第一比例阈值和第二比例阈值,第一比例阈值大于第二比例阈值,在使用较大的那个匹配阈值来进行局部特征匹配(即:将数据库中局部特征匹配比例大于等于第一比例阈值的图片,放入图片匹配结果中),并在此基础上,对于匹配比例小于第一比例阈值大于第二比例阈值的每个图片,再使用感知哈希的匹配方式进行筛选,计算匹配比例小于第一比例阈值大于第二比例阈值的每个图片的感知哈希值与用户输入的图片的感知哈希值之间的汉明距离,将其中汉明距离小于设定的第一距离阈值的图片也放入图片匹配结果中,一方面使用较大的匹配阈值保证了图片的匹配准确性,另一方面,对于局部特征匹配重合比例在较大匹配阈值和较小匹配阈值之间的图片,进一步利用感知哈希的方式进行筛选,在保证筛选的图片的准确性的前提下,增加了搜索结果中图片数量。
为了在保证图片搜索准确性的基础上进一步地提高图片的搜索数量,本发明实施例提供的上述图片匹配的方法,还设定了另外一个衡量汉明距离的第二距离阈值,该第二距离阈值小于所述第一距离阈值,相应地,在上述步骤S101~S105的基础上,还执行下述步骤:
确定数据库中匹配比例小于第一比例阈值大于第二比例阈值且汉明距离小于设定的第二距离阈值的所有图片并放入参照集合中;
针对参照集合中的每个图片,使用该图片的各局部特征,与用户输入的图片的各局部特征进行匹配,计算该图片与用户输入的图片的局部特征的匹配比例;
确定参照集合中每个图片对应的匹配比例中的最小值。
上述参照集合是使用局部特征匹配的匹配比例小于第一比例阈值大于第二比例阈值的图片中,使用感知哈希匹配的汉明距离小于第二距离阈值(第二比例阈值小于第一距离阈值)的图片,该参照集合是上述S105中确定出来的汉明距离小于设定的第一距离阈值的图片的子集,换言之,该参照集合是局部特征匹配的匹配比例小于第一比例阈值大于第二比例阈值、且汉明距离小于设定的第一距离阈值的所有图片中,更为接近用户输入的图片的那些图片,使用这些图片的局部特征匹配的匹配比例值的最小值作为参考值(可视为一个与用户输入的图片非常接近的图片),可以从局部特征匹配的匹配比例小于第一比例阈值大于第二比例阈值、且汉明距离大于等于设定的第一距离阈值的所有图片中进一步筛选出与用户输入的图片匹配的图片,增加图片匹配的选择范围。
因此,在确定参照集合中每个图片对应的匹配比例中的最小值的同时,本发明实施例提供的上述图片匹配的方法,还可以包括:
确定数据库中匹配比例小于第一比例阈值大于第二比例阈值且汉明距离大于等于设定的第二距离阈值的所有图片并放入候选结果集合中;
针对候选结果集合中的每个图片,使用该图片的各局部特征,与用户输入的图片的各局部特征进行匹配,计算该图片与用户输入的图片的局部特征的匹配比例;
将候选结果集合中匹配比例大于最小值的图片放入图片匹配结果中。
基于上述步骤,将候选集合中的匹配比例大于上述最小值的图片放入图片匹配结果中,也就是说,将前述与用户输入的图片非常接近的图片作为参考,将候选集合中的图片中局部特征匹配比例值大于该参考的图片的局部特征匹配比例值的图片,再次作为搜索结果中的图片,在保证图片匹配准确性的前提下,进一步提高了增加了搜索结果中图片数量。
为了更好地说明上述方法,以下以一个实际的例子来说明,如图2所示,该方法的流程说明如下:
预先设置四个阈值,即:A1、A2(用于局部特征,A1>A2);B1、B2(用于感知哈希,B1>B2)。
首先对图片数据库中的每幅图片进行离线特征提取,包括64位的感知哈希和局部特征集合(集合元素数目不限定,约几百个)。
并且,对用户输入的待查询图片同样提取感知哈希和局部特征。
然后,将局部特征匹配比例大于等于A1的图片放入结果图片集合R,小于A1但大于A2的图片放入候选图片集M。
进一步地,将图片集M中的所有图片中感知哈希的汉明距离小于B1的图片放入结果图片集合R,其余图片(感知哈希距离大于等于B1)放入候选集合S,而所有小于B2的图片同时放入调整参照集N。(调整参照集N中的图片是由于感知哈希跟查询图片非常接近,所以用来指导调整局部特征匹配阈值)。
对图片集N中的所有图片,取其中跟查询图片局部特征匹配比例的最小值K。
然后遍历图片集S,将局部特征匹配比例超过K的图片放入结果图片集合R。
从而所有结果图片集合R中的图片即为搜索结果。
相对于完全使用局部特征匹配的方法,上述图2提供的方法,一方面使用感知哈希来自适应的调整局部特征匹配阈值(将匹配阈值由A1降到K),另一方面感知哈希和局部特征融合也协助增加了搜索结果的数量(局部哈希匹配比例在A2和K之间同时感知哈希距离小于B1的图片会加入到结果集)。
另外,相对于现有技术中完全使用感知哈希进行图片匹配的方法,上述图2提供的方法通过局部特征来克服图片裁剪、旋转等操作导致的图片不能判断为相同的问题是相当有效的,克服了仅依靠感知哈希进行图片匹配带来的对图片操作(尤其是裁剪)表现的不够鲁棒,无法对经过裁剪、加水印等操作后的图片进行准确匹配的问题。
本发明实施例提供的图片搜索方法,如图3所示,包括下述步骤:
S301、接收用户输入的待查询图片,提取所述待查询图片的局部特征;
S302、基于所述待查询图片的局部特征搜索与用户输入所述待查询的图片相匹配的图片;
S303、将搜索到的图片作为搜索结果返回给用户。
其中,上述S302中搜索与用户输入的图片相同的图片的步骤可以采用本发明提供的上述搜索匹配图片的方法,具体实施过程参见前述搜索匹配图片的方法。比如,
比如,进一步地,上述步骤S302可包括
对用户输入的待查询图片提取局部特征;
提取图片数据库中每个图片的局部特征,与所述待查询图片的局部特征进行匹配,确定所述数据库中的每个图片与所述待查询图片的局部特征的匹配比例;
将所述数据库中匹配比例大于等于第一比例阈值的图片,放入图片匹配结果集合中;
对于所述数据库中匹配比例小于第一比例阈值大于第二比例阈值的每个图片,计算该图片的感知哈希值与所述待查询图片的感知哈希值之间的汉明距离,将其中汉明距离小于设定的第一距离阈值的图片,放入图片匹配结果中;所述第一比例阈值大于第二比例阈值;所述图片匹配结果中的图片作为与待查询图片相匹配的图片。
基于同一发明构思,本发明实施例还提供了一种搜索匹配图片的装置和图片的搜索装置,由于这些装置所解决问题的原理与前述搜索匹配图片的方法和图片的搜索方法相似,因此该装置的实施可以参见前述方法的实施,重复之处不再赘述。
本发明实施例提供的搜索匹配图片的装置,如图4所示,包括:
待查询图片提取器401,用于对用户输入的待查询图片提取局部特征;
匹配比例确定模块402,用于将图片数据库中每个图片的局部特征,与所述待查询图片的局部特征进行匹配,确定所述数据库中的每个图片与所述待查询图片的局部特征的匹配比例;
计算模块403,用于对于数据库中匹配比例小于第一比例阈值大于第二比例阈值的每个图片,计算该图片的感知哈希值与用户输入的图片的感知哈希值之间的汉明距离;
匹配结果确定模块404,用于根据匹配比例确定模块402的确定结果,将数据库中匹配比例大于等于第一比例阈值的图片,以及数据库中匹配比例小于第一比例阈值大于第二比例阈值且汉明距离小于设定的第一距离阈值的图片放入图片匹配结果中;其中,第一比例阈值大于第二比例阈值。
进一步地,上述搜索匹配图片的装置,如图4所示,还包括:存储模块405;
相应地,上述提取模块401,还用于预先对图片数据库中的每个图片进行离线特征提取,所述离线特征包括感知哈希值和设定数量的局部特征;
存储模块405,用于保存预先提取的数据库中的每个图片的感知哈希值和设定数量的局部特征。
上述存储模块405,在具体实施时,可采用数据库的形式。
本发明实施例提供的图片匹配的装置,如图4所示,还包括:
参照集合确定模块406,用于确定数据库中匹配比例小于第一比例阈值大于第二比例阈值且汉明距离小于设定的第二距离阈值的所有图片并放入参照集合中;第二距离阈值小于所述第一距离阈值;
相应地,上述计算模块403,还用于针对参照集合中的每个图片,使用该图片的各局部特征,与用户输入的图片的各局部特征进行匹配,计算该图片与用户输入的图片的局部特征的匹配比例;并确定参照集合中每个图片对应的匹配比例中的最小值。
本发明实施例提供的图片匹配的装置,如图4所示,还包括:
候选结果集合确定模块407,用于将数据库中匹配比例小于第一比例阈值大于第二比例阈值且汉明距离大于等于设定的第二距离阈值的所有图片放入候选结果集合中;
相应地,上述计算模块403,还用于针对候选结果集合中的每个图片,使用该图片的各局部特征,与用户输入的图片的各局部特征进行匹配,计算该图片与用户输入的图片的局部特征的匹配比例;
匹配结果确定模块404,还用于将候选结果集合中匹配比例大于最小值的图片放入图片匹配结果中。
本发明实施例提供的图片的搜索装置,如图5所示,包括:
输入接口501,用于接收用户输入的待查询图片;
图片查询器502,用于发起搜索与所述待查询图片相匹配图片的请求并获取基于所述待查询图片的局部特征的与用户输入所述待查询的图片相匹配的图片;
输出接口503,用于将搜索到的图片作为搜索结果返回给用户。
进一步地,上述图片的搜索装置,其获取与待查询图片相匹配的图片的方式,可以基于本发明所述的技术方案实现。比如,
对用户输入的待查询图片提取局部特征;
提取图片数据库中每个图片的局部特征,与所述待查询图片的局部特征进行匹配,确定所述数据库中的每个图片与所述待查询图片的局部特征的匹配比例;
将所述数据库中匹配比例大于等于第一比例阈值的图片,放入图片匹配结果集合中;
对于所述数据库中匹配比例小于第一比例阈值大于第二比例阈值的每个图片,计算该图片的感知哈希值与所述待查询图片的感知哈希值之间的汉明距离,将其中汉明距离小于设定的第一距离阈值的图片,放入图片匹配结果中;所述第一比例阈值大于第二比例阈值;获取所述图片匹配结果中的图片作为与待查询图片相匹配的图片。
本发明实施例提供的上述图片的搜索装置,在具体实施时,可以集成于搜索客户端等产品中。
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的图片匹配的装置和图片的搜索装置中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种搜索匹配图片的方法,包括:
对用户输入的待查询图片提取局部特征;
将图片数据库中每个图片的局部特征,与用户输入的图片的局部特征进行匹配,确定所述数据库中的每个图片与所述待查询图片的局部特征的匹配比例;
将所述数据库中匹配比例大于等于第一比例阈值的图片,放入图片匹配结果集合中;
对于所述数据库中匹配比例小于第一比例阈值大于第二比例阈值的每个图片,计算该图片的感知哈希值与所述待查询图片的感知哈希值之间的汉明距离,将其中汉明距离小于设定的第一距离阈值的图片,放入图片匹配结果中;所述第一比例阈值大于第二比例阈值。
2.如权利要求1所述的方法,进一步包括:
预先对图片数据库中的每个图片进行离线特征提取,所述离线特征包括感知哈希值和/或设定数量的局部特征。
3.如权利要求1或2所述的方法,其特征在于,还包括:
确定所述数据库中匹配比例小于第一比例阈值大于第二比例阈值且汉明距离小于设定的第二距离阈值的所有图片并放入参照集合中;所述第二距离阈值小于所述第一距离阈值;
针对所述参照集合中的每个图片,使用该图片的各局部特征,与所述待查询图片的各局部特征进行匹配,计算该图片与所述待查询图片的局部特征的匹配比例;
确定所述参照集合中每个图片对应的匹配比例中的最小值。
4.如权利要求1-3任一项所述的方法,其特征在于,还包括:
将所述数据库中匹配比例小于第一比例阈值大于第二比例阈值且汉明距离大于等于设定的第二距离阈值的所有图片放入候选结果集合中;
针对所述候选结果集合中的每个图片,使用该图片的各局部特征,与所述待查询图片的各局部特征进行匹配,计算该图片与所述待查询图片的局部特征的匹配比例;
将候选结果集合中匹配比例大于所述最小值的图片放入图片匹配结果中。
5.一种图片搜索方法,包括:
接收用户输入的待查询图片,提取所述待查询图片的局部特征;基于所述待查询图片的局部特征搜索与用户输入所述待查询的图片相匹配的图片;
将搜索到的图片作为搜索结果返回给用户。
6.一种搜索匹配图片的装置,其特征在于,包括:
待查询图片提取器,用于对用户输入的待查询图片提取局部特征;
匹配比例确定模块,用于将图片数据库中每个图片的局部特征,与所述待查询图片的局部特征进行匹配,确定所述数据库中的每个图片与所述待查询图片的局部特征的匹配比例;
计算模块,用于对于所述数据库中匹配比例小于第一比例阈值大于第二比例阈值的每个图片,计算该图片的感知哈希值与所述待查询图片的感知哈希值之间的汉明距离;
匹配结果确定模块,用于根据匹配比例确定模块的确定结果,将所述数据库中匹配比例大于等于第一比例阈值的图片,以及所述数据库中匹配比例小于第一比例阈值大于第二比例阈值且汉明距离小于设定的第一距离阈值的图片放入图片匹配结果中;所述第一比例阈值大于第二比例阈值。
7.如权利要求6所述的装置,其特征在于,还包括:存储模块;
所述提取模块,还用于预先对图片数据库中的每个图片进行离线特征提取,所述离线特征包括感知哈希值和/或设定数量的局部特征;
所述存储模块,用于保存预先提取的数据库中的每个图片的感知哈希值和设定数量的局部特征。
8.如权利要求6或7所述的装置,其特征在于,还包括:
参照集合确定模块,用于确定所述数据库中匹配比例小于第一比例阈值大于第二比例阈值且汉明距离小于设定的第二距离阈值的所有图片并放入参照集合中;所述第二距离阈值小于所述第一距离阈值;
所述计算模块,还用于针对所述参照集合中的每个图片,使用该图片的各局部特征,与所述待查询图片的各局部特征进行匹配,计算该图片与所述待查询图片的局部特征的匹配比例;并确定所述参照集合中每个图片对应的匹配比例中的最小值。
9.如权利要求6-8任一项所述的装置,其特征在于,还包括:
候选结果集合确定模块,用于将所述数据库中匹配比例小于第一比例阈值大于第二比例阈值且汉明距离大于等于设定的第二距离阈值的所有图片放入候选结果集合中;
所述计算模块,还用于针对所述候选结果集合中的每个图片,使用该图片的各局部特征,与所述待查询图片的各局部特征进行匹配,计算该图片与所述待查询图片的局部特征的匹配比例;
匹配结果确定模块,还用于将候选结果集合中匹配比例大于所述最小值的图片放入图片匹配结果中。
10.一种图片的搜索装置,其特征在于,包括:
输入接口,用于接收用户输入的待查询图片;
图片查询器,发起搜索与所述待查询图片相匹配图片的请求并获取基于所述待查询图片的局部特征的与用户输入所述待查询的图片相匹配的图片;
输出接口,用于将搜索到的图片作为搜索结果返回给用户。
CN201410286225.8A 2014-06-24 2014-06-24 一种搜索匹配图片的方法、图片搜索方法及装置 Expired - Fee Related CN104036009B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201410286225.8A CN104036009B (zh) 2014-06-24 2014-06-24 一种搜索匹配图片的方法、图片搜索方法及装置
US15/322,074 US20170154056A1 (en) 2014-06-24 2015-06-23 Matching image searching method, image searching method and devices
PCT/CN2015/082070 WO2015196964A1 (zh) 2014-06-24 2015-06-23 搜索匹配图片的方法、图片搜索方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410286225.8A CN104036009B (zh) 2014-06-24 2014-06-24 一种搜索匹配图片的方法、图片搜索方法及装置

Publications (2)

Publication Number Publication Date
CN104036009A true CN104036009A (zh) 2014-09-10
CN104036009B CN104036009B (zh) 2017-08-08

Family

ID=51466779

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410286225.8A Expired - Fee Related CN104036009B (zh) 2014-06-24 2014-06-24 一种搜索匹配图片的方法、图片搜索方法及装置

Country Status (1)

Country Link
CN (1) CN104036009B (zh)

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105141888A (zh) * 2015-07-11 2015-12-09 深圳市美贝壳科技有限公司 一种过滤监控视频重复内容的办法
CN105205406A (zh) * 2015-08-26 2015-12-30 中国地质大学(武汉) 一种隐私保护的交集计算方法
WO2015196964A1 (zh) * 2014-06-24 2015-12-30 北京奇虎科技有限公司 搜索匹配图片的方法、图片搜索方法及装置
CN105554570A (zh) * 2015-12-31 2016-05-04 北京奇艺世纪科技有限公司 一种版权视频监控方法和装置
CN105681898A (zh) * 2015-12-31 2016-06-15 北京奇艺世纪科技有限公司 一种相似视频和盗版视频的检测方法及装置
CN105681899A (zh) * 2015-12-31 2016-06-15 北京奇艺世纪科技有限公司 一种相似视频和盗版视频的检测方法及装置
CN106372572A (zh) * 2016-08-19 2017-02-01 北京旷视科技有限公司 监控方法和装置
CN106886762A (zh) * 2017-01-25 2017-06-23 咪咕动漫有限公司 一种连结信息的插入方法、设备及系统
CN108737885A (zh) * 2018-06-07 2018-11-02 北京奇艺世纪科技有限公司 一种分析在线视频播放卡顿的方法及装置
CN109902700A (zh) * 2017-12-11 2019-06-18 北京航天泰坦科技股份有限公司 一种基于哈希算法的大规模影像匹配方法
CN110032933A (zh) * 2019-03-07 2019-07-19 北京旷视科技有限公司 一种图像数据的获取方法、装置、终端及存储介质
CN110209852A (zh) * 2019-06-12 2019-09-06 北京我的天科技有限公司 基于ar技术的商标识别方法及设备
CN111368128A (zh) * 2020-03-12 2020-07-03 北京海益同展信息科技有限公司 目标图片的识别方法、装置和计算机可读存储介质
CN111475674A (zh) * 2020-04-22 2020-07-31 深圳市艾伯信息科技有限公司 用于暴力行为检测的深度学习模型训练数据集构造方法及系统
CN111506750A (zh) * 2020-06-15 2020-08-07 北京金山云网络技术有限公司 图片检索方法、装置及电子设备
CN113283617A (zh) * 2021-05-21 2021-08-20 东华大学 一种服装重构方法及其服务器系统
CN113780028A (zh) * 2021-09-08 2021-12-10 三维码(厦门)网络科技有限公司 一种结合图片的新型三维码的验证方法及设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090080711A1 (en) * 2007-09-20 2009-03-26 Kentaro Yokoi Apparatus, method, and computer program product for detecting object from image
CN102141994A (zh) * 2010-02-03 2011-08-03 苗乾坤 基于内容的图片搜索方法及其并行优化技术
CN102508910A (zh) * 2011-11-11 2012-06-20 大连理工大学 基于多哈希表映射误差最小化的图像检索方法
CN102567543A (zh) * 2012-01-12 2012-07-11 北京搜狗信息服务有限公司 一种服装图片的搜索方法和装置
CN102819582A (zh) * 2012-07-26 2012-12-12 华数传媒网络有限公司 一种海量图片快速检索方法
WO2013115202A1 (ja) * 2012-01-30 2013-08-08 日本電気株式会社 情報処理システム、情報処理方法、情報処理装置およびその制御方法と制御プログラム、通信端末およびその制御方法と制御プログラム

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090080711A1 (en) * 2007-09-20 2009-03-26 Kentaro Yokoi Apparatus, method, and computer program product for detecting object from image
CN102141994A (zh) * 2010-02-03 2011-08-03 苗乾坤 基于内容的图片搜索方法及其并行优化技术
CN102508910A (zh) * 2011-11-11 2012-06-20 大连理工大学 基于多哈希表映射误差最小化的图像检索方法
CN102567543A (zh) * 2012-01-12 2012-07-11 北京搜狗信息服务有限公司 一种服装图片的搜索方法和装置
WO2013115202A1 (ja) * 2012-01-30 2013-08-08 日本電気株式会社 情報処理システム、情報処理方法、情報処理装置およびその制御方法と制御プログラム、通信端末およびその制御方法と制御プログラム
CN102819582A (zh) * 2012-07-26 2012-12-12 华数传媒网络有限公司 一种海量图片快速检索方法

Cited By (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015196964A1 (zh) * 2014-06-24 2015-12-30 北京奇虎科技有限公司 搜索匹配图片的方法、图片搜索方法及装置
CN105141888A (zh) * 2015-07-11 2015-12-09 深圳市美贝壳科技有限公司 一种过滤监控视频重复内容的办法
CN105205406A (zh) * 2015-08-26 2015-12-30 中国地质大学(武汉) 一种隐私保护的交集计算方法
CN105205406B (zh) * 2015-08-26 2017-11-07 中国地质大学(武汉) 一种隐私保护的交集计算方法
CN105554570B (zh) * 2015-12-31 2019-04-12 北京奇艺世纪科技有限公司 一种版权视频监控方法和装置
CN105554570A (zh) * 2015-12-31 2016-05-04 北京奇艺世纪科技有限公司 一种版权视频监控方法和装置
CN105681898A (zh) * 2015-12-31 2016-06-15 北京奇艺世纪科技有限公司 一种相似视频和盗版视频的检测方法及装置
CN105681899A (zh) * 2015-12-31 2016-06-15 北京奇艺世纪科技有限公司 一种相似视频和盗版视频的检测方法及装置
CN105681899B (zh) * 2015-12-31 2019-05-10 北京奇艺世纪科技有限公司 一种相似视频和盗版视频的检测方法及装置
CN105681898B (zh) * 2015-12-31 2018-10-30 北京奇艺世纪科技有限公司 一种相似视频和盗版视频的检测方法及装置
CN106372572A (zh) * 2016-08-19 2017-02-01 北京旷视科技有限公司 监控方法和装置
CN106372572B (zh) * 2016-08-19 2019-11-12 北京旷视科技有限公司 监控方法和装置
CN106886762A (zh) * 2017-01-25 2017-06-23 咪咕动漫有限公司 一种连结信息的插入方法、设备及系统
CN106886762B (zh) * 2017-01-25 2020-05-01 咪咕动漫有限公司 一种连结信息的插入方法、设备及系统
CN109902700A (zh) * 2017-12-11 2019-06-18 北京航天泰坦科技股份有限公司 一种基于哈希算法的大规模影像匹配方法
CN108737885A (zh) * 2018-06-07 2018-11-02 北京奇艺世纪科技有限公司 一种分析在线视频播放卡顿的方法及装置
CN110032933B (zh) * 2019-03-07 2021-06-25 北京旷视科技有限公司 一种图像数据的获取方法、装置、终端及存储介质
CN110032933A (zh) * 2019-03-07 2019-07-19 北京旷视科技有限公司 一种图像数据的获取方法、装置、终端及存储介质
CN110209852A (zh) * 2019-06-12 2019-09-06 北京我的天科技有限公司 基于ar技术的商标识别方法及设备
CN111368128A (zh) * 2020-03-12 2020-07-03 北京海益同展信息科技有限公司 目标图片的识别方法、装置和计算机可读存储介质
CN111368128B (zh) * 2020-03-12 2023-09-29 京东科技信息技术有限公司 目标图片的识别方法、装置和计算机可读存储介质
CN111475674A (zh) * 2020-04-22 2020-07-31 深圳市艾伯信息科技有限公司 用于暴力行为检测的深度学习模型训练数据集构造方法及系统
CN111506750B (zh) * 2020-06-15 2021-03-16 北京金山云网络技术有限公司 图片检索方法、装置及电子设备
CN111506750A (zh) * 2020-06-15 2020-08-07 北京金山云网络技术有限公司 图片检索方法、装置及电子设备
CN113283617A (zh) * 2021-05-21 2021-08-20 东华大学 一种服装重构方法及其服务器系统
CN113780028A (zh) * 2021-09-08 2021-12-10 三维码(厦门)网络科技有限公司 一种结合图片的新型三维码的验证方法及设备
CN113780028B (zh) * 2021-09-08 2023-12-01 三维码(厦门)网络科技有限公司 一种结合图片的新型三维码的验证方法及设备

Also Published As

Publication number Publication date
CN104036009B (zh) 2017-08-08

Similar Documents

Publication Publication Date Title
CN104036009A (zh) 一种搜索匹配图片的方法、图片搜索方法及装置
CN102915299B (zh) 一种分词方法及装置
CN104077391A (zh) 提供专题新闻搜索的方法、服务器、客户端和系统
WO2015078273A1 (en) Method and apparatus for search
CN104484459A (zh) 一种对知识图谱中的实体进行合并的方法及装置
CN108363729B (zh) 一种字符串比较方法、装置、终端设备及存储介质
US11093461B2 (en) Method for computing distinct values in analytical databases
CN104933056A (zh) 统一资源定位符去重方法及装置
CN104091164A (zh) 人脸图片人名识别方法和系统
CN103984776A (zh) 一种识别重复图片的方法、图片搜索去重方法及其装置
CN105205397A (zh) 恶意程序样本分类方法及装置
US11182438B2 (en) Hybrid processing of disjunctive and conjunctive conditions of a search query for a similarity search
KR101651780B1 (ko) 빅 데이터 처리 기술을 이용한 연관 단어 추출 방법 및 그 시스템
US10482390B2 (en) Information discovery system
CN103942319A (zh) 一种搜索的方法及装置
CN103984757A (zh) 在搜索结果页上插入新闻信息条目的方法和系统
CN105095391A (zh) 利用分词程序识别机构名称的装置及方法
CN104036259A (zh) 人脸相似度识别方法和系统
CN104376115A (zh) 一种基于全局搜索的模糊词确定方法及装置
CN103942264A (zh) 推送包含新闻信息的网页的方法和装置
CN103559313A (zh) 搜索方法及装置
CN103500181A (zh) 一种互联网信息分析方法和装置
CN103744970A (zh) 一种确定图片的主题词的方法及装置
CN104462552A (zh) 问答页面核心词提取方法和装置
CN104036281A (zh) 一种图片的匹配方法、搜索方法及其装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20170808

Termination date: 20210624