CN102622366B - 相似图像的识别方法和装置 - Google Patents

相似图像的识别方法和装置 Download PDF

Info

Publication number
CN102622366B
CN102622366B CN201110031701.8A CN201110031701A CN102622366B CN 102622366 B CN102622366 B CN 102622366B CN 201110031701 A CN201110031701 A CN 201110031701A CN 102622366 B CN102622366 B CN 102622366B
Authority
CN
China
Prior art keywords
image
hash
signatures
binary vector
input picture
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201110031701.8A
Other languages
English (en)
Other versions
CN102622366A (zh
Inventor
薛晖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201110031701.8A priority Critical patent/CN102622366B/zh
Priority to TW100116696A priority patent/TWI528196B/zh
Priority to EP12739016.9A priority patent/EP2668619A4/en
Priority to PCT/US2012/021722 priority patent/WO2012102926A1/en
Priority to US13/509,059 priority patent/US9053386B2/en
Priority to JP2013552013A priority patent/JP5926291B2/ja
Publication of CN102622366A publication Critical patent/CN102622366A/zh
Priority to HK12108975.8A priority patent/HK1168919A1/zh
Application granted granted Critical
Publication of CN102622366B publication Critical patent/CN102622366B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5854Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using shape and object relationship
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/751Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/758Involving statistics of pixels or of feature values, e.g. histogram matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/761Proximity, similarity or dissimilarity measures

Abstract

本申请提供了一种相似图像的识别方法和装置,用于获取与输入图像的内容信息对应的图像签名,对图像签名进行哈希操作,在预先存储的哈希表中查询与哈希操作的结果相对应的表项,并在与查询得到的表项对应的候选图像中识别与输入图像相似的图像。本申请解决了现有图像识别技术中所存在的容错性问题,使得能够准确地识别出所需的相似图像。

Description

相似图像的识别方法和装置
技术领域
本申请涉及多媒体图像识别技术领域,具体而言,涉及一种相似图像的识别方法和装置。
背景技术
相似图像检索是近几年兴起的技术,属于多媒体识别的一种,其主要包含特征提取、索引构建、查询、相似度排序等主要步骤。如图1所示,在建立图像索引库时,用户A向图像服务器10上传待存储的图像,图像服务器10为该图像生成图像签名,并以该图像签名作为索引,以便于后续的检索查询。当需要识别相似图像时,用户B向图像服务器10请求相似图像检索,图像服务器10根据该图像的索引查询与该图像索引对应的相似图像。在图像服务器10查找到与用户B输入的图像相似的图像之后,向用户B返回相似的图像列表。
目前在生成图像的图像签名时,常用的方法是在图像服务器10中对图片内容的二进制流进行哈希编码,作为唯一标识该图像的图像签名,然后将该图像签名常驻内存或存储在图像服务器10中的数据库或文件系统中。
然而,上述现有技术的相似图像检索存在以下缺点:
1)通用性较差
对于同一副图片,即使不做任何修改,以不同的格式(bmp、jpeg、png、gif等等)保存,得到的图像签名值也有很大的差异;然而大部分情况下,从用户期望的角度来看,希望将两幅仅仅格式不同的图片作为相似图片。
2)容错性问题
由于冲突的原因,图像的二进制流的哈希编码不可能是唯一的,即存在这种情况,即便是两张完全不同的图片,也有可能会因为图像签名相同而被做为相同的图片提供给图像查询者。
3)不适合用作近似检索
传统的基于哈希编码的图片签名方式,由于没有利用图片本身的信息,因此只能用于精确检索,即查找和目标图片完全一样的图片,不适用作相似图片检索。
针对相关技术中所存在的问题,目前尚未发现有效的解决方案。
发明内容
本申请旨在提供一种相似图像的识别方法和装置,以解决现有技术中的图像识别方法所存在的容错性的问题。
根据本申请的一个方面,提供了一种相似图像的识别方法,其包括:获取与输入图像的内容信息对应的图像签名;对该图像签名进行哈希操作;在预先存储的哈希表中查询与该哈希操作的结果相对应的表项;在与查询得到的该表项对应的候选图像中识别与该输入图像相似的图像。
进一步地,通过以下步骤获取与输入图像的内容信息对应的图像签名:将输入图像转化为灰度图像;将灰度图像分成N×N的子图像,并对每个子图像分别从M个方向上计算边缘直方图,得到N×N×M个计算结果,其中,N和M均为自然数;将灰度图像对应的N×N×M个计算结果组合成作为图像签名的N×N×M维向量。
进一步地,对图像签名进行哈希操作的步骤包括:分别使用L个局部哈希函数对与该图像签名进行哈希操作,得到L个第一哈希值,其中,L为自然数;使用一个全局哈希函数分别对L个第一哈希值进行哈希操作,得到L个第二哈希值。
进一步地,在预先存储的哈希表中查询与哈希操作的结果相对应的表项的步骤包括:在每个第二哈希值对应的哈希表中查找是否存在记录有该第二哈希值的表项,其中,所述哈希表中的每个表项记录了一个图像的哈希值和图像标识,或者,所述每个表项记录了一个图像的哈希值、该图像的图像标识以及图像签名。
进一步地,第二哈希值与哈希表的对应关系包括:第i个第二哈希值对应于第i个哈希表,i=1,...L。
进一步地,分别使用L个局部哈希函数对图像签名进行哈希操作的步骤包括:将图像签名转换成R维二进制向量,其中,R为自然数;使用R维二进制向量生成L个局部哈希函数,其中,每个局部哈希函数由R维二进制向量中的一维或多维二进制向量生成;使用L个局部哈希函数对R维二进制向量进哈希操作。
进一步地,使用R维二进制向量中的一维或多维二进制向量生成一个局部哈希函数的步骤包括:设置局部哈希函数的输入参数为K;随机从R维二进制向量中选取K维二进制向量,将K维二进制向量进行拼接作为局部哈希函数的返回值,其中,K<R。
进一步地,在与查询得到的表项对应的候选图像中识别与输入图像相似的图像的步骤包括:计算输入图像的图像签名与每个候选图像的图像签名之间的空间距离;按照空间距离的大小来识别候选图像与输入图像的相似度,其中,空间距离越小的候选图像与输入图像的相似度越高。
进一步地,按照空间距离的大小来识别候选图像与输入图像的相似度之后,还包括:按照空间距离的大小输出候选图像。
进一步地,在分别使用L个局部哈希函数对图像签名进行哈希操作之前,通过以下步骤预先建立L个哈希表:分别使用L个局部哈希函数对与每个待存储的图像的内容对应的图像签名进行哈希操作,得到L个第三哈希值,其中,L为自然数;使用一个全局哈希函数分别对L个第三哈希值进行哈希操作,得到L个第四哈希值;将第j个第四哈希值以及该第四哈希值对应的图像标识和图像签名记录到第j个哈希表中,其中,j=1,...L。
根据本申请的另一方面,提供了一种相似图像的识别装置,位于图片服务器上,其包括:获取单元,用于获取与输入图像的内容信息对应的图像签名;哈希操作单元,用于对图像签名进行哈希操作;查询单元,用于在预先存储的哈希表中查询与哈希操作的结果相对应的表项;识别单元,用于在与查询得到的表项对应的候选图像中识别与输入图像相似的图像。
进一步地,获取单元包括:转化模块,用于将输入图像转化为灰度图像;计算模块,用于将灰度图像分成N×N的子图像,并对每个子图像分别从M个方向上计算边缘直方图,得到N×N×M个计算结果,其中,N和M均为自然数;生成模块,用于将灰度图像对应的N×N×M个计算结果组合成作为图像签名的N×N×M维向量。
进一步地,哈希操作单元包括:第一哈希处理模块,用于分别使用L个局部哈希函数对图像签名进行哈希操作,得到L个第一哈希值,其中,L为自然数;第二哈希处理模块,用于使用一个全局哈希函数分别对L个第一哈希值进行哈希操作,得到L个第二哈希值。
进一步地,查询单元包括:查找模块,用于在每个第二哈希值对应的哈希表中查找是否存在记录有该第二哈希值的表项,其中,所述哈希表中的每个表项记录了一个图像的哈希值和图像标识,或者,所述每个表项记录了一个图像的哈希值、该图像的图像标识以及图像签名;添加模块,用于在存在记录有该第二哈希值的表项时,将查找到的表项所记录的图像添加到候选图像中。
进一步地,第一哈希处理模块包括:转换子模块,用于将图像签名转换成R维二进制向量,其中,R为自然数;生成子模块,用于使用R维二进制向量生成L个局部哈希函数,其中,每个局部哈希函数由R维二进制向量中的一维或多维二进制向量生成;哈希操作子模块,用于使用L个局部哈希函数对R维二进制向量进哈希操作。
进一步地,生成子模块包括:设置子模块,用于设置局部哈希函数的输入参数为K;处理子模块,用于随机从R维二进制向量中选取K维二进制向量,将K维二进制向量进行拼接作为局部哈希函数的返回值,其中,K<R。
进一步地,识别单元包括:计算模块,用于计算输入图像的图像签名与每个候选图像的图像签名之间的空间距离;识别模块,用于按照空间距离的大小来识别候选图像与输入图像的相似度,其中,空间距离越小的候选图像与输入图像的相似度越高。
进一步地,还包括:输出单元,用于在按照空间距离的大小来识别该候选图像与输入图像的相似度之后,按照空间距离的大小输出候选图像。
进一步地,还包括:哈希表建立单元,用于在第一哈希操作模块分别使用L个局部哈希函数对与输入图像的内容对应的图像签名进行哈希操作之前,分别使用L个局部哈希函数对与每个待存储的图像的内容信息对应的图像签名进行哈希操作,得到L个第三哈希值,其中,L为自然数;使用一个全局哈希函数分别对L个第三哈希值进行哈希操作,得到L个第四哈希值;将第j个第四哈希值以及第四哈希值对应的图像标识和图像签名记录到第j个哈希表中,其中,j=1,...L。
在本申请中,利用图像本身的内容作为图像签名,其签名的相似度取决于图像本身的相似度,即越是相似的图像,其签名的相似度也越大,或者说对应的空间距离(海明距离或欧氏距离)越短,这样,仅仅是存储格式不同的图像具有完全相同图像签名值,从而解决了现有技术中的图像识别方法所存在的容错性的问题,使得能够准确地识别出所需的相似图像。在此基础上,本申请还提出了基于局部敏感哈希技术的海量相似图像索引方案,将检索的时间复杂度降低到亚线性级别,并且能将结果按照相似程度进行排序输出。此外,采用边缘直方图的统计值作为图像签名的基础特征,配合图像分割和基于人眼视觉敏感程度的非均匀量化技术,对不同颜色、不同缩放比例、局部模糊以及失真均有很好的适应性。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据相关技术的相似图像的识别系统的一种结构示意图;
图2是根据本申请实施例的相似图像的识别系统的一种优选结构示意图;
图3是根据本申请实施例的相似图像的识别装置的一种优选结构示意图;
图4是根据本申请实施例的相似图像的识别装置的另一种优选结构示意图;
图5是根据本申请实施例的相似图像的识别方法的一种优选流程图;
图6是根据本申请实施例的图像签名获取方法的一种优选流程图;
图7是根据本申请实施例的图像索引构建方法的一种优选流程图;
图8是根据本申请实施例的相似图像查询方法的一种优选流程图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本申请。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
实施例1
如图2所示,本优选的实施例提供了一种相似图像的识别系统,其包括如下:上传服务器202、图像数据库装置204、索引服务器206、图像计算服务器208、以及图像检索前台服务器210。
在建立图像索引库时,用户A向上传服务器202上传待存储的图像,上传服务器202计算该图像的图像签名,并将该图像的图像签名发送给图像数据库装置204。本申请实施例也可以通过爬虫系统从网络中抓取图像后存储于上传服务器202中,本申请对此并不作限定。优选的,上传服务器202利用图像自身的内容信息(例如,图像的元数据,比如色彩、纹理等,而非字节流)来计算该图像的图像签名,从而大大降低了发生冲突的概率。
图像数据库装置204在接收到该图像的图像签名之后,利用局部哈希函数对该图像签名进行哈希操作,将结果作为索引信息发送给索引服务器。
当需要识别相似图像时,用户B向图像检索前台服务器210请求相似图像检索,图像检索前台服务器210将用户B输入的图像发送给图像计算服务器208,以请求返回相似的图像或图像列表。图像计算服务器208在接收到用户B输入的图像之后,向索引服务器206查询与该输入的图像相似的图像的标识(ID),其中,相似的图像的哈希值与输入图像的哈希值相同。具体的查找方法可以为:利用用户B输入的图像自身的内容信息来构建用于查询的图像签名,在索引服务器206中查询与该图像签名对应的相似图像。
在图像计算服务器208查找到与用户B输入的图像相似的图像之后,向图像检索前台服务器210返回相似的图像或图像列表,以便显示给用户B。
作为一种可选的实施方式,各个服务器所执行的功能可以在一个服务器上实现,例如,如图3所示的相似图像的识别装置,其位于图像服务器上,其包括:获取单元302,用于获取与输入图像的内容信息对应的图像签名;哈希操作单元304,用于对该图像签名进行哈希操作;查询单元306,用于在预先存储的哈希表中查询与哈希操作的结果相对应的表项;识别单元308,用于在与查询得到的表项对应的候选图像中识别与输入图像相似的图像。
在本优选的实施例中,识别装置利用图像本身的内容作为图像签名,其签名的相似度取决于图像本身的相似度,即越是相似的图像,其签名的相似度也越大,或者说对应的空间距离(海明距离或欧氏距离)越短,这样,仅仅是存储格式不同的图像具有完全相同图像签名值,从而解决了现有技术中的图像识别方法所存在的容错性的问题,使得能够准确地识别出所需的相似图像。
优选的,如图4所示,获取单元302包括:转化模块3021,用于将输入图像转化为灰度图像;计算模块3022,用于将灰度图像分成N×N的子图像,并对每个子图像分别从M个方向上计算边缘直方图,得到N×N×M个计算结果,其中,N和M均为自然数;生成模块3023,用于将灰度图像对应的N×N×M个计算结果组合成作为图像签名的N×N×M维向量。优选的,还可以对N×N×M维向量采用基于人眼视觉敏感程度的非均匀量化技术。在本优选的实施例中,利用图像自身的内容信息来计算图像的图像签名,从而大大降低了发生冲突的概率。此外,采用边缘直方图的统计值作为图像签名的基础特征,配合图像分割以及基于人眼视觉敏感程度的非均匀量化技术,对不同颜色、不同缩放比例、局部模糊以及失真均有很好的适应性。需要注意的是,分割的方式仅是一种示例,本申请不仅限于此,例如,将灰度图像分成N×P的子图像。作为一种最佳的方式,M可以等于5。
优选的,计算模块3022对每个子图像分别从5个方向上计算边缘直方图的步骤包括:对于每个子图像中的每个图像块而言,计算该图像块五个方向上的梯度值,选取梯度值最大的方向作为该图像块的待统计方向,在一个子图像中统计上述五个方向作为待统计方向的次数,并将得到的统计值作为该子图像的边缘直方图。
举例来说,假设一个子图像具有1000个图像块,五个方向分别为:A,B,C,D,E,其中,100个图像块的待统计方向为A,200个图像块的待统计方向为B,300个图像块的待统计方向为C,400个图像块的待统计方向为D,0个图像块的待统计方向为E,则该子图像的统计值(或对应的边缘直方图)为向量(100,200,300,400,0)。
优选的,哈希操作单元304包括:第一哈希处理模块3041,用于分别使用L个局部哈希函数对该图像签名进行哈希操作,得到L个第一哈希值,其中,L为自然数;第二哈希处理模块3042,用于使用一个全局哈希函数分别对L个第一哈希值进行哈希操作,得到L个第二哈希值。在本优选的实施例中,采用了基于局部敏感哈希技术的海量相似图像索引方案,将检索的时间复杂度降低到亚线性级别。
优选的,查询单元306包括:查找模块3061,用于在每个第二哈希值对应的哈希表中查找是否存在记录有该第二哈希值的表项,其中,上述哈希表中的每个表项记录了一个图像的哈希值和图像标识,或者,所述每个表项记录了一个图像的哈希值、该图像的图像标识以及图像签名;添加模块3062,用于在存在记录有第二哈希值的表项时,将查找到的表项所记录的图像添加到候选图像中。在本优选的实施例中,采用了查找方式来查找对应的候选图像,提高了查找的准确性和效率。
优选的,第二哈希值与哈希表的对应关系包括但不限于:第i个第二哈希值对应于第i个哈希表,i=1,...L。例如,第二哈希值与哈希表的对应关系还可以为:第i个第二哈希值对应于第L-i+1个哈希表,i=1,...L。
优选的,第一哈希处理模块3041包括:转换子模块,用于将图像签名转换成R维二进制向量,其中,R为自然数;生成子模块,用于使用R维二进制向量生成L个局部哈希函数,其中,每个局部哈希函数由R维二进制向量中的一维或多维二进制向量生成;哈希操作子模块,用于使用L个局部哈希函数对R维二进制向量进哈希操作。在本优选的实施例中,采用特定的方式来进行哈希操作,大大降低了发生冲突的概率。需要注意的是,第一哈希处理模块的处理过程只是一种示例,本申请不仅限于此。
优选的,生成子模块包括:设置子模块,用于设置局部哈希函数的输入参数为K;处理子模块,用于随机从R维二进制向量中选取K维二进制向量,将K维二进制向量进行拼接作为局部哈希函数的返回值,其中,K<R。在本优选的实施例中,采用特定的方式来生成局部哈希函数,进一步降低了发生冲突的概率。需要注意的是,生成子模块的处理过程只是一种示例,本申请不仅限于此。
优选的,识别单元308包括:计算模块3081,用于计算输入图像的图像签名与每个候选图像的图像签名之间的空间距离;识别模块3082,用于按照空间距离的大小来识别候选图像与输入图像的相似度,其中,空间距离越小的候选图像与输入图像的相似度越高。在本优选的实施例中,通过采用空间距离来识别相似图像,大大提高了识别的准备性。优选的,本实施例中的空间距离可以包括但不限于:海明距离和欧式距离。
优选的,如图3所示的相似图像的识别装置还包括:输出单元310,用于在按照空间距离的大小来识别候选图像与输入图像的相似度之后,按照空间距离的大小输出候选图像。在本优选的实施例中,通过按照相似度来输出相似图像,大大提高了用户的体验度。
优选的,如图3所示的互联网相似图像的识别装置还包括:哈希表建立单元312,用于在第一哈希操作模块分别使用L个局部哈希函数对与输入图像的内容对应的图像签名进行哈希操作之前,分别使用L个局部哈希函数对与每个待存储的图像的内容信息对应的图像签名进行哈希操作,得到L个第三哈希值,其中,L为自然数;使用一个全局哈希函数分别对L个第三哈希值进行哈希操作,得到L个第四哈希值;将第j个第四哈希值以及第四哈希值对应的图像标识和图像签名记录到第j个哈希表中,其中,j=1,...L。在本优选的实施例中,采用了方式来建立存储图像索引的哈希表,提高了查找的准确性和效率。
实施例2
基于图2所示的识别系统以及图3和图4所示的识别装置,本优选的实施例还提供了一种相似图像的识别方法,如图5所示,识别方法包括如下步骤:
S502,获取与输入图像的内容信息对应的图像签名;优选的,在图2所示的识别系统中,可以由图像检索前台服务器210获取用户B输入的输入图像的内容信息,并将其发送给图像计算服务器208,图像计算服务器208获取与输入图像的内容信息对应的图像签名。优选的,在图3所示的识别装置中,由获取单元302获取与输入图像的内容信息对应的图像签名。
在本优选的实施例中,图像检索前台服务器210或获取单元302可以包括用于接收用户输入的图像的接收模块(例如,USB传输接口,蓝牙传输接口,或者,以太网传输接口等),以及,图像计算服务器208或获取单元302可以包括用于计算输入图像的内容信息对应的图像签名的处理模块(例如,微处理器MCU,或FPGA等)。可以理解的是,关于执行“获取与输入图像的内容信息对应的图像签名”的主体并不仅限于此,可以根据实际需求来灵活配置。
S504,对图像签名进行哈希操作;优选的,在图2所示的识别系统中,可以由图像计算服务器208对图像签名进行哈希操作。优选的,在图3所示的识别装置中,可以由哈希操作单元304对图像签名进行哈希操作。在本优选的实施例中,哈希操作单元304可以为微处理器MCU,或FPGA等,作为一种优选的方式,哈希操作单元304与获取单元302所执行的功能可以由同一个处理器来实现。可以理解的是,关于执行“对图像签名进行哈希操作”的主体并不仅限于此,还可以根据实际需求来灵活配置。
S506,在预先存储的哈希表中查询与哈希操作的结果相对应的表项;优选的,在图2所示的识别系统中,可以由图像计算服务器208向索引服务器206中存储的哈希表中查询与哈希操作的结果相对应的表项。优选的,在图3所示的识别装置中,可以由查询单元306向存储由哈希表的数据库查询与哈希操作的结果相对应的表项。可以理解的是,关于执行“在预先存储的哈希表中查询与哈希操作的结果相对应的表项”的主体并不仅限于此,还可以根据实际需求来灵活配置。
在本优选的实施例中,图像计算服务器208可以但不限于按照预定的局域网传输协议与索引服务器206通信,查询单元306可以但不限于通过内部总线与数据库进行通信。
S508,在与查询得到的表项对应的候选图像中识别与输入图像相似的图像。优选的,在图2所示的识别系统中,图像计算服务器208可以根据索引服务器206返回的相似图像的ID获取对应的候选图像(可以在本地获取,也可以从第三方设备上获取),并在与查询得到的表项对应的候选图像中识别与输入图像相似的图像。优选的,在图3所示的识别装置中,识别单元308可以根据查询单元306返回的相似图像的ID获取对应的候选图像(可以在本地获取,也可以从第三方设备上获取),并在与查询得到的表项对应的候选图像中识别与输入图像相似的图像。可以理解的是,关于执行“在与查询得到的表项对应的候选图像中识别与输入图像相似的图像”的主体并不仅限于此,还可以根据实际需求来灵活配置。
在本优选的实施例中,识别装置利用图像本身的内容作为图像签名,其签名的相似度取决于图像本身的相似度,即越是相似的图像,其签名的相似度也越大,或者说对应的空间距离(海明距离或欧氏距离)越短,这样,仅仅是存储格式不同的图像具有完全相同图像签名值,从而解决了现有技术中的图像识别方法所存在的容错性的问题,使得能够准确地识别出所需的相似图像。
优选的,通过以下步骤获取与输入图像的内容信息对应的图像签名:可以但不限于由图4所示的转化模块3021将输入图像转化为灰度图像;可以但不限于由图4所示的计算模块3022将灰度图像分成N×N的子图像,并对每个子图像分别从M个方向上计算边缘直方图,得到N×N×M个计算结果,其中,N和M均为自然数;可以但不限于由图4所示的生成模块3023将灰度图像对应的N×N×M个计算结果组合成作为图像签名的N×N×M维向量。优选的,还可以对N×N×M维向量采用基于人眼视觉敏感程度的非均匀量化技术。在本优选的实施例中,利用图像自身的内容信息来计算图像的图像签名,从而大大降低了发生冲突的概率。此外,本优选的实施例采用边缘直方图的统计值作为图像签名的基础特征,配合图像分割以及基于人眼视觉敏感程度的非均匀量化技术,对不同颜色、不同缩放比例、局部模糊以及失真均有很好的适应性。需要注意的是,分割的方式仅是一种示例,本申请不仅限于此,例如,将灰度图像分成N×P的子图像。作为一种最佳的方式,M可以等于5。
优选的,计算模块3022对每个子图像分别从5个方向上计算边缘直方图的步骤包括:对于每个子图像中的每个图像块而言,计算该图像块五个方向上的梯度值,选取梯度值最大的方向进行作为该图像块的待统计方向,在一个子图像中统计上述五个方向作为待统计方向的次数,并将得到的统计值作为该子图像的边缘直方图。
举例来说,假设一个子图像具有1000个图像块,五个方向分别为:A,B,C,D,E,其中,100个图像块的待统计方向为A,200个图像块的待统计方向为B,300个图像块的待统计方向为C,400个图像块的待统计方向为D,0个图像块的待统计方向为E,则该子图像的统计值(或对应的边缘直方图)为向量(100,200,300,400,0)。
在本优选的实施例中,转化模块3021、计算模块3022以及生成模块3023可以但不限于由同一个微处理器MCU来实现。
优选的,对图像签名进行哈希操作的步骤包括:可以但不限于由图4所示的第一哈希处理模块3041分别使用L个局部哈希函数对图像签名进行哈希操作,得到L个第一哈希值,其中,L为自然数;可以但不限于由图4所示的第二哈希处理模块3042使用一个全局哈希函数分别对L个第一哈希值进行哈希操作,得到L个第二哈希值。在本优选的实施例中,采用了基于局部敏感哈希技术的海量相似图像索引方案,将检索的时间复杂度降低到亚线性级别。
在本优选的实施例中,第一哈希处理模块3041和第二哈希处理模块3042可以但不限于由同一个编码芯片或微处理器MCU来实现。
优选的,在预先存储的哈希表中查询与哈希操作的结果相对应的表项的步骤包括:可以但不限于由图4所示的查找模块3061在每个第二哈希值对应的哈希表中查找是否存在记录有第二哈希值的表项,其中,所述哈希表中的每个表项记录了一个图像的哈希值和图像标识,或者,所述每个表项记录了一个图像的哈希值、该图像的图像标识以及图像签名;若存在,则可以但不限于由图4所示的添加模块3062将查找到的表项所记录的图像添加到候选图像中。在本优选的实施例中,采用了查找方式来查找对应的候选图像,提高了查找的准确性和效率。
在本优选的实施例中,查找模块3061和添加模块3062可以但不限于由同一个微处理器MCU来实现。
优选的,第二哈希值与哈希表的对应关系包括但不限于:第i个第二哈希值对应于第i个哈希表,i=1,...L。例如,第二哈希值与哈希表的对应关系还可以为:第i个第二哈希值对应于第L-i+1个哈希表,i=1,...L。
优选的,分别使用L个局部哈希函数对图像签名进行哈希操作的步骤包括:可以但不限于由图4所示的第一哈希处理模块3041将图像签名转换成R维二进制向量,其中,R为自然数;可以但不限于由图4所示的第一哈希处理模块3041使用R维二进制向量生成L个局部哈希函数,其中,每个局部哈希函数由R维二进制向量中的一维或多维二进制向量生成;可以但不限于由图4所示的第一哈希处理模块3041使用L个局部哈希函数对R维二进制向量进哈希操作。在本优选的实施例中,采用特定的方式来进行哈希操作,大大降低了发生冲突的概率。需要注意的是,哈希操作的过程只是一种示例,本申请不仅限于此。
优选的,使用R维二进制向量中的一维或多维二进制向量生成一个局部哈希函数的步骤包括:可以但不限于由图4所示的第一哈希处理模块3041设置局部哈希函数的输入参数为K;可以但不限于由图4所示的第一哈希处理模块3041随机从R维二进制向量中选取K维二进制向量,将K维二进制向量进行拼接作为局部哈希函数的返回值,其中,K<R。在本优选的实施例中,采用特定的方式来生成局部哈希函数,进一步降低了发生冲突的概率。需要注意的是,生成一个局部哈希函数的步骤只是一种示例,本申请不仅限于此。
优选的,在与查询得到的表项对应的候选图像中识别与输入图像相似的图像的步骤包括:可以但不限于由图4所示的计算模块3081计算输入图像的图像签名与每个候选图像的图像签名之间的空间距离;可以但不限于由图4所示的识别模块3082按照空间距离的大小来识别候选图像与输入图像的相似度,其中,空间距离越小的候选图像与输入图像的相似度越高。在本优选的实施例中,通过采用空间距离来识别相似图像,大大提高了识别的准备性。优选的,本实施例中的空间距离可以包括但不限于:海明距离和欧式距离。
在本优选的实施例中,计算模块3081和识别模块3082可以但不限于由同一个微处理器MCU来实现。
优选的,按照空间距离的大小来识别候选图像与输入图像的相似度之后,本优选实施例的识别方法还包括:可以但不限于由图3所示的输出单元310按照空间距离的大小输出候选图像。在本优选的实施例中,通过按照相似度来输出相似图像,大大提高了用户的体验度。
在本优选的实施例中,输出单元310可以但不限于为蓝牙传输模块,或者,红外传输模块,或者,以太网传输模块。
优选的,在分别使用L个局部哈希函数对图像签名进行哈希操作之前,通过以下步骤预先建立L个哈希表:可以但不限于由图3所示的哈希表建立单元312分别使用L个局部哈希函数对与每个待存储的图像的内容对应的图像签名进行哈希操作,得到L个第三哈希值,其中,L为自然数;可以但不限于由图3所示的哈希表建立单元312使用一个全局哈希函数分别对L个第三哈希值进行哈希操作,得到L个第四哈希值;可以但不限于由图3所示的哈希表建立单元312将第j个第四哈希值以及第四哈希值对应的图像标识和图像签名记录到第j个哈希表中,其中,j=1,...L。在本优选的实施例中,采用了方式来建立存储图像索引的哈希表,提高了查找的准确性和效率。
在本优选的实施例中,哈希表建立单元312可以但不限于由同一个微处理器MCU来实现。
基于以上的识别系统和装置以及识别方法,以下结合附图来具体描述识别方法中的图像签名获取方法、图像索引构建方法以及相似图像查询方法。
如图6所示,图像签名获取方法(也称特征提取阶段)包括从图像中提取元数据信息作为唯一标识图像本身的签名,本优选的实施例采用基于边缘直方图的纹理特征来生成签名,具体步骤如下:
S602,可以但不限于由图4所示的转化模块3021将原始图像转化为灰度图像,以期到最终得到的结果对颜色、光照的改变不敏感;
S604,可以但不限于由图4所示的计算模块3022将灰度图像分割成N×N的子图像;
S606,可以但不限于由图4所示的计算模块3022把S604中处理完毕的子图像进一步分割为固定数目的一系列图像块,每个图像块的面积随着原始图像的面积变化而变化;
S608,可以但不限于由图4所示的计算模块3022计算每个子图像的五个方向上的边缘直方图。具体地,对于每个子图像中的每个图像块而言,计算该图像块五个方向上的梯度值,选取梯度值最大的方向进行作为该图像块的待统计方向,在一个子图像中统计上述五个方向作为待统计方向的次数,并将得到的统计值作为该子图像的边缘直方图。
举例来说,假设一个子图像具有1000个图像块,上述五个方向分别为:A,B,C,D,E,其中,100个图像块的待统计方向为A,200个图像块的待统计方向为B,300个图像块的待统计方向为C,400个图像块的待统计方向为D,0个图像块的待统计方向为E,则该子图像的统计值(或对应的边缘直方图)为向量(100,200,300,400,0)。
S610,可以但不限于由图4所示的生成模块3023将各个子图像的统计值(即向量)拼接成一个多维向量作为原始图像的签名。假设按照N=4进行切分,原始图像的签名最终会以一个4×4×5=80维的向量来表示。
S612,考虑到人眼视觉对亮度敏感程度的非均匀性,采用非线性量化的方式,可以但不限于由图4所示的生成模块3023对S610中得到的80维整型向量进行量化压缩,以达到较高的空间利用率。举例来说,使用0-7之间的8个数字进行量化,最后得到的单个签名所占空间的大小为80×3=240bit,也就是30个字节,相比量化之前节约了90%以上的存储空间。
S614,将压缩后的结果作为图像签名。
当然,上述S612步骤中的压缩处理是一种优选的方式,本发明也可以直接将S610得到的80维向量来作为该图像的图像签名。
在本优选的实施例中,转化模块3021、计算模块3022以及生成模块3023可以但不限于由同一个微处理器MCU来实现。
如图7所示,图像索引构建方法(也称为索引构建阶段)主要包括针对特征提取阶段所获得的图像签名,实现高维向量的K近似检索,本优选实施例采用局部敏感哈希来实现,具体步骤如下:
S702,可以但不限于由图4所示的第一哈希处理模块3041将特征提取阶段所获的向量标识转化为海明空间中的高维二进制向量(即每一维仅为1或0),例如,假设某一维的向量值为X,最大值为C,则向量在海明空间表示为连续的X个1紧跟C-X个0的C维二进制向量。
S704,可以但不限于由图4所示的第一哈希处理模块3041定义如下的哈希函数G,随机选取S702中目标向量的K维二进制向量,将结果拼接起来作为返回值。目标向量之间相似度越大,产生的相同哈希值相概率越大。
S706,为降低近似检索的误差,可以但不限于由图4所示的第一哈希处理模块3041利用L个S704中随机生成的哈希函数,将其分别作用在S702中提取的高维向量中;
S708,可以但不限于由图4所示的第二哈希处理模块3042对S706中的结果使用传统的哈希函数(例如md5)再次哈希;
S710,可以但不限于由图4所示的第二哈希处理模块3042将S708中的哈希结果作为键、图片的唯一标识(ID)作为值存放存在对应的L个哈希表当中。优选的,相同的图像签名会被放在同一个桶中去,不同的图像签名,则有较大概率放到不同的桶中去。
在本优选的实施例中,第一哈希处理模块3041和第二哈希处理模块3042可以但不限于由同一个编码芯片或微处理器MCU来实现。
优选的,选择不同K与L的会在很大程度上影响检索的准确率与召回率,一般通过事先的模拟实验进行预估。最后生成的索引结构,在硬件允许的条件下,可以考虑常驻内存以提高检索效率;在海量样本库的情况下,也可以考虑将索引文件持久化到本地磁盘或者分布式的处理方式。
如图8所示,相似图像查询方法(也称为查询阶段)主要包括针对输入的图像进行处理,获得其边缘直方图的签名,并在样本库中查询出相似图像的过程,其具体步骤如下:
S802,可以但不限于由图4所示的获取单元302采用图6所示的方法计算输入图像的签名值;
S804-S810,根据S802中得到的签名值,可以但不限于由图4所示的哈希操作单元304采用图7所示的图像索引构建方法,将L个哈希函数作用在该签名上,再计算md5哈希过后的值,可以但不限于由图4所示的查询单元306分别将计算得到的结果作为键在L个哈希表中查询;
S812,可以但不限于由图4所示的查询单元306将查询得到的多个结果所对应的图像添加到候选图像队列中;
S814,针对候选图像队列中的每一个签名值,可以但不限于由图4所示的识别单元308计算其与输入图像的签名值的空间距离(海明距离或者欧氏距离),其值的大小决定了候选图片与输入图片的相似度;
S816,可以但不限于由图3所示的输出单元310按照距离的大小进行排序输出。由于候选队列中图像签名的数量与样本库中签名的数量相比,已大大减少,因此与现有技术相比,计算的成本或开销也大为减少。最后得到的结果集就是与目标图像相似、并按照相似度排序的图像集。
在本优选的实施例中,哈希操作单元304可以为微处理器MCU,或FPGA等,作为一种优选的方式,哈希操作单元304与获取单元302所执行的功能可以由同一个处理器来实现。此外,在本优选的实施例中,查询单元306可以但不限于通过内部总线与保存了哈希表的数据库进行通信,查询单元306与识别单元308所执行的功能可以由同一个处理器来实现。
从以上的描述中,可以看出,本申请实现了如下技术效果:
在本申请中,利用图像本身的内容作为图像签名,其签名的相似度取决于图像本身的相似度,即越是相似的图像,其签名的相似度也越大,或者说对应的空间距离(海明距离或欧氏距离)越短,这样,仅仅是存储格式不同的图像具有完全相同图像签名值,从而解决了现有技术中的图像识别方法所存在的容错性的问题,使得能够准确地识别出所需的相似图像。在此基础上,本申请还提出了基于局部敏感哈希技术的海量相似图像索引方案,将检索的时间复杂度降低到亚线性级别,并且能将结果按照相似程度进行排序输出。此外,采用边缘直方图的统计值作为图像签名的基础特征,配合图像分割和基于人眼视觉敏感程度的非均匀量化技术,对不同颜色、不同缩放比例、局部模糊以及失真均有很好的适应性。
显然,本领域的技术人员应该明白,本申请的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本申请不限制于任何特定的硬件和软件结合。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (15)

1.一种相似图像的识别方法,其特征在于包括:
获取与输入图像的内容信息对应的图像签名;
对所述图像签名进行哈希操作;
在预先存储的哈希表中查询与所述哈希操作的结果相对应的表项;以及
在与查询得到的所述表项对应的候选图像中识别与所述输入图像相似的图像;
其中,对所述图像签名进行哈希操作的步骤包括:
分别使用L个局部哈希函数对所述图像签名进行哈希操作,得到L个第一哈希值,其中,L为自然数;以及
使用一个全局哈希函数分别对所述L个第一哈希值进行哈希操作,得到L个第二哈希值;
其中,通过以下步骤获取所述与输入图像的内容信息对应的图像签名:将所述输入图像转化为灰度图像;将所述灰度图像分成N×N的子图像,并对每个所述子图像分别从M个方向上计算边缘直方图,得到N×N×M个计算结果,其中,所述N和M均为自然数;以及将所述灰度图像对应的N×N×M个计算结果组合成作为所述图像签名的N×N×M维向量。
2.根据权利要求1所述的方法,其特征在于,在预先存储的哈希表中查询与所述哈希操作的结果相对应的表项的步骤包括在每个所述第二哈希值对应的所述哈希表中查找是否存在记录有该第二哈希值的表项,并将查找到的所述表项所记录的图像添加到所述候选图像中,其中,所述哈希表中的每个表项记录了一个图像的哈希值和图像标识,或者,所述每个表项记录了一个图像的哈希值、该图像的图像标识以及图像签名。
3.根据权利要求2所述的方法,其特征在于,所述第二哈希值与所述哈希表的对应关系包括:第i个所述第二哈希值对应于第i个所述哈希表,i=1,…L。
4.根据权利要求1至3中任一项所述的方法,其特征在于,分别使用L个局部哈希函数对所述图像签名进行哈希操作的步骤包括:
将所述图像签名转换成R维二进制向量,其中,R为自然数;
使用所述R维二进制向量生成L个所述局部哈希函数,其中,每个所述局部哈希函数由所述R维二进制向量中的一维或多维二进制向量生成;以及
使用L个所述局部哈希函数对所述R维二进制向量进哈希操作。
5.根据权利要求4所述的方法,其特征在于,使用所述R维二进制向量中的一维或多维二进制向量生成一个局部哈希函数的步骤包括:
设置所述局部哈希函数的输入参数为K;以及
随机从所述R维二进制向量中选取K维二进制向量,将所述K维二进制向量进行拼接作为所述局部哈希函数的返回值,其中,K<R。
6.根据权利要求1至3中任一项所述的方法,其特征在于,在与查询得到的所述表项对应的候选图像中识别与所述输入图像相似的图像的步骤包括:
计算所述输入图像的图像签名与每个所述候选图像的图像签名之间的空间距离;以及
按照空间距离的大小来识别所述候选图像与所述输入图像的相似度,其中,空间距离越小的所述候选图像与所述输入图像的相似度越高。
7.根据权利要求6所述的方法,其特征在于,按照空间距离的大小来识别所述候选图像与所述输入图像的相似度之后,还包括按照所述空间距离的大小输出所述候选图像。
8.根据权利要求1所述的方法,其特征在于,在分别使用L个局部哈希函数对所述图像签名进行哈希操作之前,通过以下步骤预先建立L个哈希表:
分别使用L个局部哈希函数对与每个待存储的图像的内容对应的图像签名进行哈希操作,得到L个第三哈希值,其中,L为自然数;
使用一个全局哈希函数分别对所述L个第三哈希值进行哈希操作,得到L个第四哈希值;以及
将第j个第四哈希值以及该第四哈希值对应的图像标识和图像签名记录到第j个哈希表中,其中,j=1,…L。
9.一种相似图像的识别装置,位于图像服务器上,其特征在于,包括:
获取单元,用于获取与输入图像的内容信息对应的图像签名;
哈希操作单元,用于对所述图像签名进行哈希操作;
查询单元,用于在预先存储的哈希表中查询与所述哈希操作的结果相对应的表项;以及
识别单元,用于在与查询得到的所述表项对应的候选图像中识别与所述输入图像相似的图像;
其中,所述哈希操作单元包括:
第一哈希处理模块,用于分别使用L个局部哈希函数对所述图像签名进行哈希操作,得到L个第一哈希值,其中,L为自然数;以及
第二哈希处理模块,用于使用一个全局哈希函数分别对所述L个第一哈希值进行哈希操作,得到L个第二哈希值;
其中,所述获取单元包括:转化模块,用于将所述输入图像转化为灰度图像;计算模块,用于将所述灰度图像分成N×N的子图像,并对每个所述子图像分别从M个方向上计算边缘直方图,得到N×N×M个计算结果,其中,所述N和M均为自然数;以及生成模块,用于将所述灰度图像对应的N×N×M个计算结果组合成作为所述图像签名的N×N×M维向量。
10.根据权利要求9所述的装置,其特征在于,所述查询单元包括:
查找模块,用于在每个所述第二哈希值对应的所述哈希表中查找是否存在记录有该第二哈希值的表项,其中,所述哈希表中的每个表项记录了一个图像的哈希值和图像标识,或者,所述每个表项记录了一个图像的哈希值、该图像的图像标识以及图像签名;以及
添加模块,用于在存在记录有该第二哈希值的表项时,将查找到的表项所记录的图像添加到所述候选图像中。
11.根据权利要求9或10所述的装置,其特征在于,所述第一哈希处理模块包括:
转换子模块,用于将所述图像签名转换成R维二进制向量,其中,R为自然数;
生成子模块,用于使用所述R维二进制向量生成L个所述局部哈希函数,其中,每个所述局部哈希函数由所述R维二进制向量中的一维或多维二进制向量生成;以及
哈希操作子模块,用于使用L个所述局部哈希函数对所述R维二进制向量进哈希操作。
12.根据权利要求11所述的装置,其特征在于,所述生成子模块包括:
设置子模块,用于设置所述局部哈希函数的输入参数为K;以及
处理子模块,用于随机从所述R维二进制向量中选取K维二进制向量,将所述K维二进制向量进行拼接作为所述局部哈希函数的返回值,其中,K<R。
13.根据权利要求9或10所述的装置,其特征在于,所述识别单元包括:
计算模块,用于计算所述输入图像的所述图像签名与每个所述候选图像的图像签名之间的空间距离;以及
识别模块,用于按照空间距离的大小来识别所述候选图像与所述输入图像的相似度,其中,空间距离越小的所述候选图像与所述输入图像的相似度越高。
14.根据权利要求13所述的装置,其特征在于,还包括输出单元,用于在按照空间距离的大小来识别所述候选图像与所述输入图像的相似度之后,按照所述空间距离的大小输出所述候选图像。
15.根据权利要求9所述的装置,其特征在于,还包括哈希表建立单元,用于在所述第一哈希操作模块分别使用L个局部哈希函数对与所述输入图像的内容对应的图像签名进行哈希操作之前,分别使用L个局部哈希函数对与每个待存储的图像的内容信息对应的图像签名进行哈希操作,得到L个第三哈希值,其中,L为自然数;使用一个全局哈希函数分别对所述L个第三哈希值进行哈希操作,得到L个第四哈希值;将第j个第四哈希值以及该第四哈希值对应的图像标识和图像签名记录到第j个哈希表中,其中,j=1,…L。
CN201110031701.8A 2011-01-28 2011-01-28 相似图像的识别方法和装置 Active CN102622366B (zh)

Priority Applications (7)

Application Number Priority Date Filing Date Title
CN201110031701.8A CN102622366B (zh) 2011-01-28 2011-01-28 相似图像的识别方法和装置
TW100116696A TWI528196B (zh) 2011-01-28 2011-05-12 Similar image recognition method and apparatus
PCT/US2012/021722 WO2012102926A1 (en) 2011-01-28 2012-01-18 Method and apparatus of identifying similar images
US13/509,059 US9053386B2 (en) 2011-01-28 2012-01-18 Method and apparatus of identifying similar images
EP12739016.9A EP2668619A4 (en) 2011-01-28 2012-01-18 METHOD AND APPARATUS FOR IDENTIFYING SIMILAR IMAGES
JP2013552013A JP5926291B2 (ja) 2011-01-28 2012-01-18 類似画像を識別する方法および装置
HK12108975.8A HK1168919A1 (zh) 2011-01-28 2012-09-13 相似圖像的識別方法和裝置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110031701.8A CN102622366B (zh) 2011-01-28 2011-01-28 相似图像的识别方法和装置

Publications (2)

Publication Number Publication Date
CN102622366A CN102622366A (zh) 2012-08-01
CN102622366B true CN102622366B (zh) 2014-07-30

Family

ID=46562289

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110031701.8A Active CN102622366B (zh) 2011-01-28 2011-01-28 相似图像的识别方法和装置

Country Status (7)

Country Link
US (1) US9053386B2 (zh)
EP (1) EP2668619A4 (zh)
JP (1) JP5926291B2 (zh)
CN (1) CN102622366B (zh)
HK (1) HK1168919A1 (zh)
TW (1) TWI528196B (zh)
WO (1) WO2012102926A1 (zh)

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI470549B (zh) * 2012-04-20 2015-01-21 Insyde Software Corp A method of using an image recognition guide to install an application, and an electronic device
CN103324650A (zh) * 2012-10-23 2013-09-25 深圳市宜搜科技发展有限公司 一种图像检索方法及系统
CN103902595B (zh) * 2012-12-27 2017-02-08 北京新媒传信科技有限公司 一种构建数据库的方法和装置
CN103761483A (zh) * 2014-01-27 2014-04-30 百度在线网络技术(北京)有限公司 恶意代码的检测方法及装置
CN103955914A (zh) * 2014-02-27 2014-07-30 西安电子科技大学 基于随机投影和Signature/EMD框架的SAR图像分割方法
CN103984776B (zh) * 2014-06-05 2017-05-03 北京奇虎科技有限公司 一种识别重复图片的方法、图片搜索去重方法及其装置
CN105224569B (zh) * 2014-06-30 2018-09-07 华为技术有限公司 一种数据过滤、构造数据滤波器的方法及装置
CN104199827B (zh) * 2014-07-24 2017-08-04 北京大学 基于局部敏感哈希的大规模多媒体数据的高维索引方法
KR101713197B1 (ko) * 2015-04-01 2017-03-09 주식회사 씨케이앤비 서버 컴퓨팅 장치 및 이를 이용한 콘텐츠 인식 기반의 영상 검색 시스템
CN106302202B (zh) * 2015-05-15 2020-07-28 阿里巴巴集团控股有限公司 数据限流方法和装置
WO2017099806A1 (en) * 2015-12-11 2017-06-15 Hewlett Packard Enterprise Development Lp Hash suppression
CN105589938A (zh) * 2015-12-13 2016-05-18 公安部第三研究所 基于fpga的图像检索系统及检索方法
CN106991095B (zh) * 2016-01-21 2021-09-28 阿里巴巴集团控股有限公司 机器异常的处理方法、学习速率的调整方法及装置
CN107464268A (zh) * 2016-06-02 2017-12-12 国家计算机网络与信息安全管理中心 一种利用全局和局部特征的联合编码方法
CN108154072A (zh) * 2016-12-02 2018-06-12 天津工业大学 基于深度卷积神经网络的航拍绝缘子故障自动检测
CN108011956A (zh) * 2017-12-06 2018-05-08 易居(中国)企业集团股份有限公司 基于文件内容哈希值的分布式存储方法
CN108121806A (zh) * 2017-12-26 2018-06-05 湖北工业大学 一种基于局部特征匹配的图像搜索方法及系统
KR102002863B1 (ko) * 2018-04-13 2019-07-24 라인플러스 주식회사 사람의 얼굴을 이용한 동물 형상의 아바타를 생성하는 방법 및 시스템
CN108629049A (zh) * 2018-05-14 2018-10-09 芜湖岭上信息科技有限公司 一种基于哈希算法的图像实时存储及查找装置及方法
US11126649B2 (en) 2018-07-11 2021-09-21 Google Llc Similar image search for radiology
US11556581B2 (en) * 2018-09-04 2023-01-17 Inception Institute of Artificial Intelligence, Ltd. Sketch-based image retrieval techniques using generative domain migration hashing
KR101998200B1 (ko) * 2018-11-26 2019-07-10 주식회사 아임클라우드 동일 이미지 식별정보 생성 시스템
US20200364516A1 (en) * 2019-05-15 2020-11-19 EMC IP Holding Company LLC Data compression using nearest neighbor cluster
WO2020258101A1 (zh) * 2019-06-26 2020-12-30 深圳市欢太科技有限公司 用户相似度计算方法、装置、服务端及存储介质
CN110909791B (zh) * 2019-11-20 2023-02-28 车智互联(北京)科技有限公司 一种相似图像识别方法及计算设备
US11645323B2 (en) 2020-02-26 2023-05-09 Samsung Electronics Co.. Ltd. Coarse-to-fine multimodal gallery search system with attention-based neural network models
CN111414527B (zh) * 2020-03-16 2023-10-10 腾讯音乐娱乐科技(深圳)有限公司 相似项目的查询方法、装置及存储介质
CN111818236A (zh) * 2020-07-08 2020-10-23 山东省肿瘤防治研究院(山东省肿瘤医院) 核磁共振图像的同步采集与回放方法
CN112614187B (zh) * 2020-12-31 2024-03-26 深圳市优必选科技股份有限公司 回环检测方法、装置、终端设备和可读存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101354728A (zh) * 2008-09-26 2009-01-28 中国传媒大学 一种基于区间权值的相似性度量方法
CN101887457A (zh) * 2010-07-02 2010-11-17 杭州电子科技大学 基于内容的复制图像检测方法

Family Cites Families (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6671407B1 (en) 1999-10-19 2003-12-30 Microsoft Corporation System and method for hashing digital images
US8037310B2 (en) * 2004-11-30 2011-10-11 Ricoh Co., Ltd. Document authentication combining digital signature verification and visual comparison
JP4284288B2 (ja) 2005-03-10 2009-06-24 株式会社東芝 パターン認識装置及びその方法
US20060242418A1 (en) * 2005-04-25 2006-10-26 Xerox Corporation Method for ensuring the integrity of image sets
US7783135B2 (en) * 2005-05-09 2010-08-24 Like.Com System and method for providing objectified image renderings using recognition information from images
US7657100B2 (en) * 2005-05-09 2010-02-02 Like.Com System and method for enabling image recognition and searching of images
US7519200B2 (en) * 2005-05-09 2009-04-14 Like.Com System and method for enabling the use of captured images through recognition
JP4968882B2 (ja) * 2005-06-03 2012-07-04 キヤノン株式会社 画像検索装置、画像検索方法およびプログラム
US7457825B2 (en) * 2005-09-21 2008-11-25 Microsoft Corporation Generating search requests from multimodal queries
US7647331B2 (en) 2006-03-28 2010-01-12 Microsoft Corporation Detecting duplicate images using hash code grouping
US20080059461A1 (en) * 2006-08-29 2008-03-06 Attributor Corporation Content search using a provided interface
EP2315161A1 (en) * 2006-10-11 2011-04-27 Mitsubishi Electric Information Technology Centre Europe B.V. Image descriptor for image recognition
US8265345B2 (en) 2006-11-20 2012-09-11 Sharp Kabushiki Kaisha Image processing method, image processing apparatus, image forming apparatus, and image reading apparatus
US8055079B2 (en) 2007-03-06 2011-11-08 Sharp Kabushiki Kaisha Image processing method, image processing apparatus, and image forming apparatus
JP4898531B2 (ja) * 2007-04-12 2012-03-14 キヤノン株式会社 画像処理装置及びその制御方法、並びにコンピュータプログラム
US8171030B2 (en) * 2007-06-18 2012-05-01 Zeitera, Llc Method and apparatus for multi-dimensional content search and video identification
JP2009031876A (ja) 2007-07-24 2009-02-12 Sharp Corp 画像処理装置およびそれを備えた画像形成装置、画像読取装置、画像処理方法、画像処理プログラム、画像処理プログラムを記録した記録媒体
JP5098504B2 (ja) 2007-08-09 2012-12-12 富士通株式会社 文字認識プログラム、文字認識装置および文字認識方法
WO2009031297A1 (ja) * 2007-09-07 2009-03-12 Mitsubishi Electric Corporation 画像検索装置、画像分類装置及び方法並びにプログラム
DE112009000485T5 (de) * 2008-03-03 2011-03-17 VideoIQ, Inc., Bedford Objektvergleich für Verfolgung, Indizierung und Suche
JP4538507B2 (ja) 2008-05-02 2010-09-08 シャープ株式会社 画像照合方法、画像照合装置、画像データ出力処理装置、プログラム及び記憶媒体
JP4565015B2 (ja) * 2008-05-15 2010-10-20 シャープ株式会社 画像処理装置、画像形成装置、画像処理システム、画像処理プログラムおよびその記録媒体
US8233722B2 (en) * 2008-06-27 2012-07-31 Palo Alto Research Center Incorporated Method and system for finding a document image in a document collection using localized two-dimensional visual fingerprints
US8144947B2 (en) * 2008-06-27 2012-03-27 Palo Alto Research Center Incorporated System and method for finding a picture image in an image collection using localized two-dimensional visual fingerprints
US8533848B2 (en) * 2009-02-18 2013-09-10 Korea Advanced Institute Of Science And Technology Method and system for producing multimedia fingerprint based on quantum hashing
US20100268628A1 (en) * 2009-04-15 2010-10-21 Attributor Corporation Managing controlled content on a web page having revenue-generating code
JP5224537B2 (ja) * 2009-06-01 2013-07-03 日本電信電話株式会社 局所性検知可能ハッシュの構築装置、類似近傍検索処理装置及びプログラム
US8467631B2 (en) * 2009-06-30 2013-06-18 Red Hat Israel, Ltd. Method and apparatus for identification of image uniqueness
US9233399B2 (en) * 2010-02-09 2016-01-12 Xerox Corporation Document separation by document sequence reconstruction based on information capture
US9183173B2 (en) * 2010-03-02 2015-11-10 Microsoft Technology Licensing, Llc Learning element weighting for similarity measures
US8452106B2 (en) 2010-03-23 2013-05-28 Microsoft Corporation Partition min-hash for partial-duplicate image determination
US8498473B2 (en) 2010-08-24 2013-07-30 Compuware Corporation System for computationally quantifying similarities between images

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101354728A (zh) * 2008-09-26 2009-01-28 中国传媒大学 一种基于区间权值的相似性度量方法
CN101887457A (zh) * 2010-07-02 2010-11-17 杭州电子科技大学 基于内容的复制图像检测方法

Also Published As

Publication number Publication date
US20130301935A1 (en) 2013-11-14
EP2668619A1 (en) 2013-12-04
US9053386B2 (en) 2015-06-09
CN102622366A (zh) 2012-08-01
JP5926291B2 (ja) 2016-05-25
WO2012102926A1 (en) 2012-08-02
HK1168919A1 (zh) 2013-01-11
TWI528196B (zh) 2016-04-01
JP2014505313A (ja) 2014-02-27
TW201232302A (en) 2012-08-01
EP2668619A4 (en) 2016-12-14

Similar Documents

Publication Publication Date Title
CN102622366B (zh) 相似图像的识别方法和装置
He et al. Mobile product search with bag of hash bits and boundary reranking
CN101887457B (zh) 基于内容的复制图像检测方法
AU2013403805B2 (en) Mobile video search
US8913853B2 (en) Image retrieval system and method
CN100414548C (zh) 综合利用图像及文字信息的搜索系统及搜索方法
KR101388638B1 (ko) 이미지에 주석 달기
JP5950864B2 (ja) スケール不変の画像特徴の量子化された埋込みを用いて画像を表現する方法
CN1162793C (zh) 利用形状进行目标表示与检索的方法和装置
JP5911578B2 (ja) 画像の特徴点位置情報を符号化する方法、コンピュータプログラム、モバイルデバイス
US20090070110A1 (en) Combining results of image retrieval processes
US10839006B2 (en) Mobile visual search using deep variant coding
Haldar et al. Content based image retrieval using histogram, color and edge
CN105183746B (zh) 从多相关图片中挖掘显著特征实现图像检索的方法
CN106570166B (zh) 一种基于多个局部敏感哈希表的视频检索方法及装置
CN115630236A (zh) 无源遥感影像的全球快速检索定位方法、存储介质及设备
CN108875828A (zh) 一种相似图像的快速匹配方法和系统
KR20130098470A (ko) 레이아웃 기술자와 이미지 특징점을 이용한 실시간 증강현실 이미지 검색시스템
Chen et al. Image Deduplication Based on Hashing and Clustering in Cloud Storage.
CN113051984A (zh) 视频拷贝检测方法和装置、存储介质和电子装置
CN111324766A (zh) 一种基于lbp特征的加密图像检索方法
JP2004318365A (ja) 画像検索システム、画像検索方法およびそのプログラム
CN109981755A (zh) 图像识别方法、装置和电子设备
Zhang et al. A scalable approach for content-based image retrieval in peer-to-peer networks
CN106886783A (zh) 一种基于区域特征的图像检索方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1168919

Country of ref document: HK

C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1168919

Country of ref document: HK