CN102955784B - 一种基于数字签名对多个图像进行相似判断的设备和方法 - Google Patents
一种基于数字签名对多个图像进行相似判断的设备和方法 Download PDFInfo
- Publication number
- CN102955784B CN102955784B CN201110240715.0A CN201110240715A CN102955784B CN 102955784 B CN102955784 B CN 102955784B CN 201110240715 A CN201110240715 A CN 201110240715A CN 102955784 B CN102955784 B CN 102955784B
- Authority
- CN
- China
- Prior art keywords
- image
- digital signature
- processing
- images
- similar
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Abstract
本发明提供一种用于基于数字签名对多个图像进行相似判断的设备和方法,包括:获取一个图像的图像特征信息;对所述图像的图像特征信息进行预定数字处理,生成该图像所对应的一个数字签名;其中,该方法还包括:根据待处理的多个图像中各个图像所对应的数字签名,对所述多个图像进行相似判断,并基于相似判断结果对所述多个图像进行相应处理。与现有技术相比,本发明基于所述多个图像中每个图像的数字签名来进行相似判断,并根据相似判断结果来对所述图像进行相应处理,提高了对多个图像进行相似判断的处理效率。
Description
技术领域
本发明涉及互联网技术领域,尤其涉及用于通过数字签名对多个图像进行相似判断的图像处理技术。
背景技术
在诸如搜索引擎或信息检索系统的应用中,一个查询序列大多数时候对应于多个查询结果,在这些查询结果中,由于超链接、反向链接或网页来源不同,相同的搜索信息可能会以两个或两个以上的查询结果呈现给用户。以图像为例,当用户键入图像查询序列后,相同的图像查询结果可能会有不同的版本,并且每个版本分别对应于不同的图像查询结果,导致版本不同的情形可能包括:图像边缘的裁剪尺寸不同、图像所添加的Logo不一样、图像中的噪声不同或者图像分辨率不同。如果不对这些实质上包含相同图像的查询结果进行相应处理,可能会极大地降低用户的图像搜索体验。
有鉴于此,如何设计一种对多个图像进行相似判断的方法,基于所述多个图像中每个图像的数字签名来进行相似判断,并根据相似判断结果来对所述图像进行相应处理,提高用户的图像搜索体验,是相关技术人员亟待解决的一项课题。
发明内容
本发明的目的是提供一种基于数字签名对多个图像进行相似判断的设备和方法。
根据本发明的一个方面,提供一种用于基于数字签名对多个图像进行相似判断的方法,其中,该方法包括以下步骤:
a获取一个图像的图像特征信息;
b对所述图像的图像特征信息进行预定数字处理,生成该图像所对应的一个数字签名;
其中,该方法还包括:根据待处理的多个图像中各个图像所对应的数字签名,对所述多个图像进行相似判断,并基于相似判断结果对所述多个图像进行相应处理。
根据本发明的另一个方面,还提供了一种用于基于数字签名对多个图像进行相似判断的设备,其中,所述设备包括:
第一获取装置,用于获取一个图像的图像特征信息;
生成装置,用于对所述图像的图像特征信息进行预定数字处理,生成该图像所对应的一个数字签名;
其中,该设备还包括判断装置,用于根据待处理的多个图像中各个图像所对应的数字签名,对所述多个图像进行相似判断,并基于相似判断结果对所述多个图像进行相应处理。
根据本发明的再一个方面,还提供了一种搜索引擎,其中,该搜索引擎包括如上述本发明的一个方面所述的用于基于数字签名对多个图像进行相似判断的设备。
与现有技术相比,本发明基于所述多个图像中每个图像的数字签名来进行相似判断,并根据相似判断结果来对所述图像进行相应处理,提高了对多个图像进行相似判断的处理效率。此外,若将处理后的一个或多个图像提供给用户,也会增强用户的图像搜索体验。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1示出依据本发明一个方面的基于数字签名对多个图像进行相似判断的设备示意图;
图2示出依据本发明一优选实施例的基于数字签名对多个图像进行相似判断的设备示意图;
图3示出依据本发明另一个方面的用于基于数字签名对多个图像进行相似判断的方法流程图;
图4示出依据本发明一优选实施例的用于基于数字签名对多个图像进行相似判断的方法流程图。
附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
下面结合附图对本发明作进一步详细描述。
图1示出依据本发明一个方面的基于数字签名对多个图像进行相似判断的设备示意图。其中,判断设备1包括但不限于网络主机、单个网络服务器、多个网络服务器集或多个服务器构成的云。在此,云可以由基于云计算(Cloud Computing)的大量计算机或网络服务器构成,其中,云计算是分布式计算的一种由一群松散耦合的计算机集组成的一个超级虚拟计算机。其中,所述判断设备1包括第一获取装置11、生成装置12和判断装置13。
第一获取装置11获取一个图像的图像特征信息。具体地,第一获取装置11例如通过搜索引擎等第三方设备所提供的应用程序接口(API)或约定的通信方式,从该第三方设备获取所述图像,并针对所获取的图像使用诸如颜色直方图、灰度共生矩阵、小波变换等处理方式来得到所述图像的图像特征信息;或者,通过搜索引擎等第三方设备所提供的应用程序接口(API)或约定的通信方式,从该第三方设备获取该用户通过用户设备输入的图像查询序列,并将所述图像查询序列在搜索索引库中进行匹配查询,获取与所述图像查询序列相对应的所述图像,并针对所获取的图像使用诸如颜色直方图、灰度共生矩阵、小波变换等处理方式来得到所述图像的图像特征信息;或者,通过页面技术,如ASP、JSP、PHP等,从用户设备获取用户通过该用户设备输入的图像查询序列,并将所述图像查询序列在搜索索引库中进行匹配查询,获取与所述图像查询序列相对应的所述图像,并针对所获取的图像使用诸如颜色直方图、灰度共生矩阵、小波变换等处理方式来得到所述图像的图像特征信息。例如,用户在搜索输入栏中键入查询序列“鲜花”,第一获取装置11调用诸如搜索引擎等第三方设备所提供的应用程序接口(API)或其他约定的通信方式,获取所述查询序列“鲜花”,然后根据所获取的查询序列“鲜花”得到对应的图像,并针对所得到的图像使用诸如颜色直方图、灰度共生矩阵、小波变换等处理方式来获取所述图像的图像特征信息。又如,对于图像检索系统,第一获取装置11接收自该图像检索系统发送的新添加至该图像检索系统的一个图像,或者在不同的图像类别中随机选取一个图像,并针对所选取的图像使用诸如颜色直方图、灰度共生矩阵、小波变换等处理方式来获取所述图像的图像特征信息。本领域技术人员应能理解上述获取一个图像的图像特征信息的方式仅为举例,其他现有的或今后可能出现的获取一个图像的图像特征信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
生成装置12对所述图像的图像特征信息进行预定数字处理,生成所述图像所对应的一个数字签名。具体地,通过第一获取装置11获取所述图像的图像特征信息后,所述生成装置12通过诸如降维方式、量化方式或归一化处理方式对所述第一获取装置11获取的图像特征信息进行数字处理,生成所述图像所对应的一个数字签名。例如,第一获取装置11所获取的图像特征信息包括两个图像特征信息分量,如颜色类图像特征信息和纹理类图像特征信息,每个图像特征信息分量均使用上百维的实数来表示,所述生成装置12对所述每个图像特征信息分量进行降维处理,从而将每个图像特征信息分量使用维数更小的实数来表征。又如,第一获取装置11所获取的图像特征信息包括两个图像特征信息分量,每个图像特征信息分量均使用上百维的实数来表示,所述生成装置12对所述每个图像特征信息分量进行量化处理,比如,通过某一数学模型将每个图像特征信息分量所对应的实数均量化为010101序列,从而将原先使用上百维实数表示的图像特征信息分量改由更简化的二进制序列来表示。本领域技术人员应能理解上述对所述每个图像的图像特征信息进行预定数字处理来生成所述每个图像所对应的一个数字签名的方式仅为举例,其他现有的或今后可能出现的对所述每个图像的图像特征信息进行预定数字处理来生成所述每个图像所对应的一个数字签名的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
判断装置13根据待处理的多个图像中各个图像所对应的所述数字签名,对所述多个图像进行相似判断,并基于相似判断结果对所述多个图像进行相应处理。具体地,判断装置13通过离线方式或实时方式来得到所述多个图像中各个图像所对应的所述数字签名,然后根据所述数字签名对所述多个图像进行相似判断,并基于相似判断结果对所述多个图像进行相应处理,如分类处理、过滤处理、去重处理等。例如,本发明持续不断地通过所述第一获取装置11来获取一个图像的图像特征信息并由所述生成装置12对所述图像的图像特征信息进行预定数字处理,生成该图像所对应的一个数字签名,从而使判断装置13执行以下两种情形中的任意一种:1)离线获取所述多个图像中各个图像所对应的所述数字签名,并根据所述数字签名对所述多个图像进行相似判断,基于相似判断结果对所述多个图像进行相应处理,如分类处理、过滤处理、去重处理等;2)在所述生成装置12生成与所述图像相对应的所述数字签名后,实时获取所述多个图像中每个图像所对应的所述数字签名,依次进行相似判断并基于相似判断结果的相应处理,如分类处理、过滤处理、去重处理等。本领域技术人员应能理解上述对所述多个图像进行相似判断并基于相似判断结果对所述多个图像进行相应处理的方式仅为举例,其他现有的或今后可能出现的对所述多个图像进行相似判断并基于相似判断结果对所述多个图像进行相应处理的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
优选地,判断设备1的各个装置之间持续不断地工作。具体地,第一获取装置11获取一个图像的图像特征信息;然后,生成装置12对所述图像的图像特征信息进行预定数字处理,生成该图像所对应的一个数字签名;接着,所述判断装置13根据待处理的多个图像中各个图像所对应的数字签名,对所述多个图像进行相似判断,并基于相似判断结果对所述多个图像进行相应处理。在此,本领域技术人员应理解“持续”是指判断设备1的各装置分别按照设定的或实时调整的工作模式要求进行图像的图像特征信息的获取、与所述图像相对应的数字签名的生成、根据多个图像中各个图像所对应的数字签名对所述多个图像的相似判断、基于相似判断结果对所述多个图像的相应处理,直至判断设备1在较长时间内停止获取所述图像的图像特征信息。
优选地,所述判断设备1还包括第二获取装置(未示出),所述第二获取装置获取与所述图像相对应的特征信息类型;其中,所述第一获取装置11还根据所述特征信息类型,基于图像特征向量模型,获取所述图像特征信息。具体地,第二获取装置获取与所述图像相对应的特征信息类型,在此,所述特征信息类型包括颜色类、纹理类、形状类、空间分布类,相应地,所述图像的图像特征信息包括颜色类特征信息、纹理类特征信息、形状类特征信息、空间分布类特征信息,例如,第二获取装置获取与所述图像相对应的特征信息类型,如颜色类和形状类,然后所述第一获取装置11根据所述特征信息类型,基于图像特征向量模型,得到所述图像中的颜色类特征信息和形状类特征信息。更优选地,所述判断设备1还包括第三获取装置(未示出),所述第三获取装置采用诸如颜色直方图、灰度共生矩阵、小波变换等训练方式对大量图像进行图像特征训练,得到所述大量图像各自的颜色类特征信息和/或纹理类特征信息,并将所述大量图像所对应的颜色类特征信息和/或纹理类特征信息作为图像特征向量,从而生成所述图像特征向量模型。例如,所述第三获取装置基于小波变换的训练方式对大量图像进行图像特征训练,得到所述大量图像的纹理类特征信息,并将所述大量图像的纹理类特征信息作为图像特征向量,以生成所述图像特征向量模型。本领域技术人员应能理解上述基于图像特征向量模型来获取所述图像特征信息的方式仅为举例,其他现有的或今后可能出现的基于图像特征向量模型来获取所述图像特征信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
优选地,所述判断装置13还基于相似判断结果对所述多个图像进行去重处理,以获取去重处理后的一个或多个图像。具体地,所述判断装置13根据待处理的多个图像中每个图像所对应的数字签名,对所述多个图像进行相似判断,得到这些图像中相同或相似的图像,然后将所述相同或相似的图像进行去重处理,仅保留这些相同或相似的图像中的一个,删除或舍弃其他图像。更优选地,所述设备还包括第四获取装置和提供装置(均未示出),所述第四获取装置根据用户查询序列进行搜索,以获得所述待处理的多个图像,所述第一获取装置11获取所述多个图像中每个图像的图像特征信息,所述生成装置12对所述图像的图像特征信息进行预定数字处理,生成所述图像所对应的一个数字签名,所述判断装置13根据所述多个图像中各个图像所对应的数字签名,对所述多个图像进行去重处理,以获得去重处理后的一个或多个图像,最后所述提供装置将所述去重处理后的一个或多个图像提供给所述用户。将本发明的该优选实施例应用于搜索引擎,当用户根据图像查询序列进行搜索时,将与所述图像查询序列相对应的图像搜索结果中的所有图像进行去重处理,并将所述去重处理后的一个或多个图像提供给用户,因而用户所看到的图像搜索结果并不会重复看到相同或相似的图像,提升了用户的图像搜索体验。
优选地,所述生成装置12还结合所述图像的内容属性,对所述图像的图像特征信息进行预定数字处理,生成所述数字签名。具体地,所述生成装置12通过诸如对所述图像进行内容解析来得到所述图像的内容属性,然后根据所述图像的内容属性,诸如所述图像中所包含的内容多少、内容分布信息等,对所述图像的图像特征信息进行预定数字处理,生成所述数字签名。例如,当所述图像中所包含的内容多并且内容分布均匀时,使用预定数字处理后的数字序列中的某一位或多位来表征,并且这些位在以二进制形式表示时置为1;当所述图像中所包含的内容少并且内容分布十分不均匀时,也使用预定数字处理后的数字序列中的某一位或多位来表征,并且这些位在以二进制形式表示时均清零。
优选地,所述生成装置12还用于对所述图像的图像特征信息进行降维处理,生成所述数字签名。更优选地,所述生成装置12还包括:第一处理装置(未示出),所述第一处理装置结合所述图像特征信息的权重,对所述图像的图像特征信息进行降维处理和筛选处理,以获取与所述图像相对应的第一图像特征信息;第五获取装置(未示出),所述第五获取装置基于所述第一图像特征信息,生成所述数字签名。例如,所述生成装置12还对所述图像的图像特征信息进行预定数字处理,所述预定数字处理包括但不限于降维处理,当所述图像特征信息中的某一图像特征信息分量使用多个实数或布尔数值来表示时,通过诸如PCA(Principal Component Analysis,主成分分析)或SPCA(Sparse Principal ComponentAnalysis,稀疏主成分分析)算法对该图像特征信息分量进行降维处理,从而得到一个数字序列,所述数字序列既能够反映出所述图像的该图像特征信息分量,又可减少实数或布尔数值个数。又如,所述图像中不同的图像特征信息对相似判断的重要程度也各有不同,此时所述第一处理装置结合所述图像特征信息的权重,对所述图像的图像特征信息进行降维处理和筛选处理,以获取所述图像所对应的第一图像特征信息,并且所述第五获取装置基于所述第一图像特征信息来生成所述数字签名。一般地,将权重较高的那些图像特征信息所对应的数字序列调整到整个序列的前面,而将权重较低的那些图像特征信息所对应的数字序列调整至整个序列的后面,并且对所述调整后的整个序列进行筛选处理,从而得到所述图像所对应的第一图像特征信息。由上述可知,对所述图像的图像特征信息进行降维处理和筛选处理后,基于筛选结果而生成的数字签名也相应地变得更加精简,并且基于精简后的数字签名对所述多个图像进行相似判断,也可提高所述判断设备1的处理效率。更优选地,所述第五获取装置还对所述第一图像特征信息进行量化处理,获取与所述第一图像特征信息相对应的数字序列;对所述数字序列进行预定编码处理,生成所述数字签名。在此,所述预定编码处理包括以下至少任一项:
-基于高位提取方式的编码处理;
-压缩编码处理。
以基于高位提取方式的编码处理为例,所述第五获取装置对所述第一图像特征信息进行量化处理后,将诸如多个浮点型实数值转化为二进制形式的数字序列。例如,所述数字序列包括4个整数型数值,第一个整数型数值包括用于表征SCD(Scalable ColorDescriptor,可伸缩颜色描述子)的数字字段;第二个整数型数值包括用于表征HTD(Homogeneous Texture Descriptor,同质纹理描述子)的数字字段;第三个整数型数值包括用于表征CC(Cross Correlation Descriptor,互相关描述子)的数字字段,第四个整数型数值包括用于表征CLD(Color Layout Descriptor,颜色分布描述子)的数字字段。在此,所述数字序列划分为4个数字字段,在该优选实施例中,所述第五获取装置基于高位提取方式对所述4个数字字段进行编码,例如,基于编码结果来形成新数字序列,在所述新数字序列中,将CC的高8位作为新数字序列中第1数字字段(预设所述数字字段的总位数为32位)的高8位,将HTD的高4位作为所述第1数字字段的第9-12位,将CLD的高4位作为所述第1数字字段的第13-16位,以及将CC的第9-24位作为所述第1数字字段的第17-32位。以压缩编码处理为例,所述第五获取装置对所述第一图像特征信息进行量化处理后,将诸如多个浮点型实数值转化为二进制形式的数字序列。仍然接上例,所述数字序列包括4个整数型数值,第一个整数型数值包括用于表征SCD(Scalable Color Descriptor,可伸缩颜色描述子)的数字字段;第二个整数型数值包括用于表征HTD(Homogeneous Texture Descriptor,同质纹理描述子)的数字字段;第三个整数型数值包括用于表征CC(Cross CorrelationDescriptor,互相关描述子)的数字字段,第四个整数型数值包括用于表征CLD(ColorLayout Descriptor,颜色分布描述子)的数字字段。在此,所述数字序列划分为4个数字字段,在该优选实施例中,所述第五获取装置基于高位提取方式对所述4个数字字段进行编码,例如,基于编码结果来形成新数字序列,在所述新数字序列中,将CC的高8位作为新数字序列中第1数字字段(预设所述数字字段的总位数为32位)的高8位,将HTD的高4位作为所述第1数字字段的第9-12位,将CLD的高4位作为所述第1数字字段的第13-16位,以及将CC的第9-24位作为所述第1数字字段的第17-32位。
优选地,所述图像特征信息包括以下至少任一项:
-可伸缩颜色描述子;
-同质纹理描述子;
-颜色分布描述子;
-基于互相关的描述子。
以可伸缩颜色描述子为例,当所述判断设备1对多个图像进行相似判断时,获取可伸缩颜色描述子作为所述多个图像中各个图像的颜色类的图像特征信息,并对所述图像的可伸缩颜色描述子进行预定数字处理,生成所述图像的数字签名,然后根据所述数字签名对所述多个图像进行相似判断。以同质纹理描述子为例,当所述判断设备1对多个图像进行相似判断时,获取同质纹理描述子作为所述多个图像中各个图像的纹理类的图像特征信息,并对所述图像的同质纹理描述子进行预定数字处理,生成所述图像的数字签名,然后根据所述数字签名对所述多个图像进行相似判断。以颜色分布描述子为例,当所述判断设备1对多个图像进行相似判断时,获取颜色分布描述子作为所述多个图像中各个图像的颜色类的另一图像特征信息,并对所述图像的颜色分布描述子进行预定数字处理,生成所述图像的数字签名,然后根据所述数字签名对所述多个图像进行相似判断。以基于互相关的描述子为例,当所述判断设备1对多个图像进行相似判断时,获取基于互相关的描述子作为所述多个图像中各个图像的图像特征信息,并对所述图像的基于互相关的描述子进行预定数字处理,生成所述图像的数字签名,然后根据所述数字签名对所述多个图像进行相似判断。在一优选实施例中,第一获取装置11还获取所述可伸缩颜色描述子、同质纹理描述子、颜色分布描述子和基于互相关的描述子中的两个或两个以上的描述子作为所述多个图像中各个图像的图像特征信息,并基于所述图像特征信息来生成所述各个图像的数字签名。
图2示出依据本发明一优选实施例的基于数字签名对多个图像进行相似判断的设备示意图。其中,判断设备1’包括但不限于网络主机、单个网络服务器、多个网络服务器集或多个服务器构成的云。在此,云可以由基于云计算(Cloud Computing)的大量计算机或网络服务器构成,其中,云计算是分布式计算的一种由一群松散耦合的计算机集组成的一个超级虚拟计算机。其中,所述判断设备1’包括第一获取装置11’、生成装置12’、判断装置13’,其中判断装置13’还包括第二处理装置14’和比对装置15’。
在图2所示的判断设备1’中,第一获取装置11’和生成装置12’分别与图1所示的第一获取装置11和生成装置12相同或相似,为描述简便起见,故此处不再赘述,并通过引用的方式包含于此。
第二处理装置14’根据所述数字签名,对所述多个图像进行预定分类处理,以获得多组图像,每组图像分别属于一类图像类别。具体地,所述生成装置12’对所述图像的图像特征信息进行预定数字处理从而生成所述图像的数字签名后,第二处理装置14’通过所述多个图像中各个图像的数字签名,将所述多个图像进行预定分类处理,以获得多组图像,每组图像包含在同一个图像类别中。例如,通过生成装置12’生成所述多个图像中各个图像的数字签名后,相同或相似的图像大体上具有局部相同或基本上完全相同的数字签名,第二处理装置14’根据这些数字签名就可将相同或相似的图像划分为一组,并且所述图像组构成一个图像类别。本领域技术人员应能理解上述根据所述数字签名对所述多个图像进行预定分类处理以获得多组图像的方式仅为举例,其他现有的或今后可能出现的根据所述数字签名对所述多个图像进行预定分类处理以获得多组图像的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
然后,所述比对装置15’根据所述数字签名,对所述每组图像进行位比对操作,以获得所述相似判断结果。具体地,所述第二处理装置14’根据所述数字签名,对所述多个图像进行预定分类处理而获得多组图像后,所述比对装置15’通过诸如截取所述数字签名中的一部分数字串,对所述每组图像中的任意两个或两个以上的图像进行位比对操作,以获得所述相似判断结果;或者,通过诸如将所述数字签名转换成二进制字符串,对所述每组图像中的任意两个或两个以上的图像相对应的二进制字符串中的部分或全部数值序列进行逻辑运算,以获得所述相似判断结果。因此,所述判断设备1’在根据所述数字签名对所述多个图像进行相似判断前,还可通过所述第二处理装置14’将所述多个图像进行预定分类处理以得到多组图像,并利用所述比对装置15’对所述每组图像进行位比对操作,以获得所述相似判断结果。由于所述判断设备1’仅对每组图像中的两个或两个以上的图像进行比对操作,从而极大地提高了相似判断的处理效率。此外,在同一图像类别中的图像进行相似判断时,所述比对装置15’还对所述图像的数字签名采用位比对操作,也可显著加快相似判断的速度。本领域技术人员应能理解上述根据所述数字签名对所述每组图像进行位比对操作以获得所述相似判断结果的方式仅为举例,其他现有的或今后可能出现的根据所述数字签名对所述每组图像进行位比对操作以获得所述相似判断结果的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
优选地,所述预定分类处理包括基于以下至少任一项算法进行分类处理:
-散列算法;
-取模算法;
-随机数算法。
以所述预定分类处理包括基于散列算法进行分类处理为例,第二处理装置14’通过散列算法,将相同或相近似的图像所对应的数字签名转换为一个散列值,并根据所述散列值将所述相同或相近似的图像归为一个图像组,该组图像对应于一个图像类别。然后,所述比对装置15’基于所述数字签名对同一图像类别中的图像进行位比对操作,以获得所述相似判断结果。以所述预定分类处理包括基于取模算法进行分类处理为例,若预定将所述多个图像划分为2N类(其中N为自然数),则第二处理装置14’通过取模算法,将相同或相近似的图像所对应的数字签名转换为一个整数值,诸如0~2N-1中的任一整数值,然后将整数值相同的所有图像归为一个图像组,该组图像对应于一个图像类别。然后,所述比对装置15’基于所述数字签名对同一图像类别中的图像进行位比对操作,以获得所述相似判断结果。以所述预定分类处理包括基于随机数算法进行分类处理为例,若预定将所述多个图像划分为2N类(其中N为自然数),则第二处理装置14’通过随机数算法,诸如使用Random函数,将相同或相近似的图像所对应的数字签名转换为一个整数值,诸如0~2N-1中的任一整数值,然后将整数值相同的所有图像归为一个图像组,该组图像对应于一个图像类别。然后,所述比对装置15’基于所述数字签名对同一图像类别中的图像进行位比对操作,以获得所述相似判断结果。
优选地,所述判断装置13’还基于相似判断结果对所述多个图像进行去重处理,以获取去重处理后的一个或多个图像。具体地,所述判断装置13’根据待处理的多个图像中每个图像所对应的数字签名,对所述多个图像进行相似判断,得到这些图像中相同或相似的图像,然后将所述相同或相似的图像进行去重处理,仅保留这些相同或相似的图像中的一个,删除或舍弃其他图像。更优选地,所述设备还包括第四获取装置和提供装置(均未示出),所述第四获取装置根据用户查询序列进行搜索,以获得所述待处理的多个图像,所述第一获取装置11’获取所述多个图像中每个图像的图像特征信息,所述生成装置12’对所述图像的图像特征信息进行预定数字处理,生成所述图像所对应的一个数字签名,所述判断装置13’根据所述多个图像中各个图像所对应的数字签名,对所述多个图像进行去重处理,以获得去重处理后的一个或多个图像,最后所述提供装置将所述去重处理后的一个或多个图像提供给所述用户。将本发明的该优选实施例应用于搜索引擎,当用户根据图像查询序列进行搜索时,将与所述图像查询序列相对应的图像搜索结果中的所有图像进行去重处理,并将所述去重处理后的一个或多个图像提供给用户,因而用户所看到的图像搜索结果并不会重复看到相同或相似的图像,提升了用户的图像搜索体验。
优选地,所述图像特征信息包括以下至少任一项:
-可伸缩颜色描述子;
-同质纹理描述子;
-颜色分布描述子;
-基于互相关的描述子。
以可伸缩颜色描述子为例,当所述判断设备1’对多个图像进行相似判断时,获取可伸缩颜色描述子作为所述多个图像中各个图像的颜色类的图像特征信息,并对所述图像的可伸缩颜色描述子进行预定数字处理,生成所述图像的数字签名,然后根据所述数字签名对所述多个图像进行相似判断。以同质纹理描述子为例,当所述判断设备1’对多个图像进行相似判断时,获取同质纹理描述子作为所述多个图像中各个图像的纹理类的图像特征信息,并对所述图像的同质纹理描述子进行预定数字处理,生成所述图像的数字签名,然后根据所述数字签名对所述多个图像进行相似判断。以颜色分布描述子为例,当所述判断设备1’对多个图像进行相似判断时,获取颜色分布描述子作为所述多个图像中各个图像的颜色类的另一图像特征信息,并对所述图像的颜色分布描述子进行预定数字处理,生成所述图像的数字签名,然后根据所述数字签名对所述多个图像进行相似判断。以基于互相关的描述子为例,当所述判断设备1’对多个图像进行相似判断时,获取基于互相关的描述子作为所述多个图像中各个图像的图像特征信息,并对所述图像的基于互相关的描述子进行预定数字处理,生成所述图像的数字签名,然后根据所述数字签名对所述多个图像进行相似判断。在一优选实施例中,第一获取装置11’还获取所述可伸缩颜色描述子、同质纹理描述子、颜色分布描述子和基于互相关的描述子中的两个或两个以上的描述子作为所述多个图像中各个图像的图像特征信息,并基于所述图像特征信息来生成所述各个图像的数字签名。
此外,上述用于基于数字签名对多个图像进行相似判断的判断设备可以与现有的搜索引擎相结合,构成一种新的搜索引擎,现有的搜索引擎可以采用已知的如百度、Google、Yahoo等搜索引擎。
图3示出依据本发明另一个方面的基于数字签名对多个图像进行相似判断的方法流程图。其中,用于基于数字签名对多个图像进行相似判断的判断设备包括但不限于网络主机、单个网络服务器、多个网络服务器集或多个服务器构成的云。在此,云可以由基于云计算(Cloud Computing)的大量计算机或网络服务器构成,其中,云计算是分布式计算的一种由一群松散耦合的计算机集组成的一个超级虚拟计算机。
在步骤S1中,所述判断设备获取一个图像的图像特征信息。具体地,所述判断设备例如通过搜索引擎等第三方设备所提供的应用程序接口(API)或约定的通信方式,从该第三方设备获取所述图像,并针对所获取的图像使用诸如颜色直方图、灰度共生矩阵、小波变换等处理方式来得到所述图像的图像特征信息;或者,通过搜索引擎等第三方设备所提供的应用程序接口(API)或约定的通信方式,从该第三方设备获取该用户通过用户设备输入的图像查询序列,并将所述图像查询序列在搜索索引库中进行匹配查询,获取与所述图像查询序列相对应的所述图像,并针对所获取的图像使用诸如颜色直方图、灰度共生矩阵、小波变换等处理方式来得到所述图像的图像特征信息;或者,通过页面技术,如ASP、JSP、PHP等,从用户设备获取用户通过该用户设备输入的图像查询序列,并将所述图像查询序列在搜索索引库中进行匹配查询,获取与所述图像查询序列相对应的所述图像,并针对所获取的图像使用诸如颜色直方图、灰度共生矩阵、小波变换等处理方式来得到所述图像的图像特征信息。例如,用户在搜索输入栏中键入查询序列“鲜花”,所述判断设备调用诸如搜索引擎等第三方设备所提供的应用程序接口(API)或其他约定的通信方式,获取所述查询序列“鲜花”,然后根据所获取的查询序列“鲜花”得到对应的图像,并针对所得到的图像使用诸如颜色直方图、灰度共生矩阵、小波变换等处理方式来获取所述图像对应的图像特征信息。又如,对于图像检索系统,所述判断设备接收自该图像检索系统发送的新添加至该图像检索系统的一个图像,或者在不同的图像类别中随机选取一个图像,并针对所选取的图像使用诸如颜色直方图、灰度共生矩阵、小波变换等处理方式来获取所述图像的图像特征信息。本领域技术人员应能理解上述获取一个图像的图像特征信息的方式仅为举例,其他现有的或今后可能出现的获取一个图像的图像特征信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
在步骤S2中,所述判断设备对所述图像的图像特征信息进行预定数字处理,生成所述图像所对应的一个数字签名。具体地,通过所述步骤S1获取所述图像的图像特征信息后,所述判断设备通过诸如降维方式、量化方式或归一化处理方式对所获取的图像特征信息进行数字处理,生成所述图像所对应的一个数字签名。例如,利用上述步骤S1所获取的图像特征信息包括两个图像特征信息分量,每个图像特征信息分量均使用上百维的实数来表示,所述判断设备对所述每个图像特征信息分量进行降维处理,从而将每个图像特征信息分量使用维数更小的实数来表征。又如,利用上述步骤S1所获取的图像特征信息包括两个图像特征信息分量,每个图像特征信息分量均使用上百维的实数来表示,所述判断设备对所述每个图像特征信息分量进行量化处理,比如,通过某一数学模型将每个图像特征信息分量所对应的实数均量化为010101序列,从而将原先使用上百维实数表示的图像特征信息分量改由更简化的二进制序列来表示。本领域技术人员应能理解上述对所述每个图像的图像特征信息进行预定数字处理来生成所述每个图像所对应的一个数字签名的方式仅为举例,其他现有的或今后可能出现的对所述每个图像的图像特征信息进行预定数字处理来生成所述每个图像所对应的一个数字签名的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
在步骤S3中,所述判断设备根据待处理的多个图像中各个图像所对应的所述数字签名,对所述多个图像进行相似判断,并基于相似判断结果对所述多个图像进行相应处理。具体地,所述判断设备通过离线方式或实时方式来得到所述多个图像中各个图像所对应的所述数字签名,然后根据所述数字签名对所述多个图像进行相似判断,并基于相似判断结果对所述多个图像进行相应处理,如分类处理、过滤处理、去重处理等。例如,本发明持续不断地通过步骤S1来获取一个图像的图像特征信息并由步骤S2对所述图像的图像特征信息进行预定数字处理,生成该图像所对应的一个数字签名,从而使所述判断设备在步骤S3中执行以下两种情形中的任意一种:1)离线获取所述多个图像中各个图像所对应的所述数字签名,并根据所述数字签名对所述多个图像进行相似判断,基于相似判断结果对所述多个图像进行相应处理,如分类处理、过滤处理、去重处理等;2)在所述步骤S2生成与所述图像相对应的所述数字签名后,实时获取所述多个图像中每个图像所对应的所述数字签名,依次进行相似判断并基于相似判断结果的相应处理,如分类处理、过滤处理、去重处理等。本领域技术人员应能理解上述对所述多个图像进行相似判断并基于相似判断结果对所述多个图像进行相应处理的方式仅为举例,其他现有的或今后可能出现的对所述多个图像进行相似判断并基于相似判断结果对所述多个图像进行相应处理的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
优选地,该方法还包括步骤S5(未示出),在所述步骤S5中,所述判断设备获取与所述图像相对应的特征信息类型;然后根据所述特征信息类型,基于图像特征向量模型,获取所述图像特征信息。具体地,所述判断设备获取与所述图像相对应的特征信息类型,在此,所述特征信息类型包括颜色类、纹理类、形状类、空间分布类,相应地,所述图像的图像特征信息包括颜色类特征信息、纹理类特征信息、形状类特征信息、空间分布类特征信息,例如,所述判断设备获取与所述图像相对应的特征信息类型,如颜色类和形状类,然后根据所述特征信息类型,基于图像特征向量模型,得到所述图像中的颜色类特征信息和形状类特征信息。更优选地,该方法还包括步骤S6(未示出),在步骤S6中,所述判断设备采用诸如颜色直方图、灰度共生矩阵、小波变换等训练方式对大量图像进行图像特征训练,得到所述大量图像各自的颜色类特征信息和/或纹理类特征信息,并将所述大量图像所对应的颜色类特征信息和/或纹理类特征信息作为图像特征向量,从而生成所述图像特征向量模型。例如,所述判断设备基于小波变换的训练方式对大量图像进行图像特征训练,得到所述大量图像的纹理类特征信息,并将所述大量图像的纹理类特征信息作为图像特征向量,以生成所述图像特征向量模型。本领域技术人员应能理解上述基于图像特征向量模型来获取所述图像特征信息的方式仅为举例,其他现有的或今后可能出现的基于图像特征向量模型来获取所述图像特征信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
优选地,该方法还包括步骤S7(未示出),在所述步骤S7中,所述判断设备基于相似判断结果对所述多个图像进行去重处理,以获取去重处理后的一个或多个图像。具体地,所述判断设备根据待处理的多个图像中每个图像所对应的数字签名,对所述多个图像进行相似判断,得到这些图像中相同或相似的图像,然后将所述相同或相似的图像进行去重处理,仅保留这些相同或相似的图像中的一个,删除或舍弃其他图像。更优选地,该方法还包括步骤S8和步骤S9(均未示出),在步骤S8中,所述判断设备根据用户查询序列进行搜索,以获得所述待处理的多个图像;然后,通过步骤S1获取所述多个图像中每个图像的图像特征信息;接着,通过步骤S2对所述图像的图像特征信息进行预定数字处理,生成所述图像所对应的一个数字签名;在步骤S3中,所述判断设备根据所述多个图像中各个图像所对应的数字签名,对所述多个图像进行去重处理,以获得去重处理后的一个或多个图像;最后,在步骤S9中,所述判断设备将所述去重处理后的一个或多个图像提供给所述用户。将本发明的该优选实施例应用于搜索引擎,当用户根据图像查询序列进行搜索时,将与所述图像查询序列相对应的图像搜索结果中的所有图像进行去重处理,并将所述去重处理后的一个或多个图像提供给用户,因而用户所看到的图像搜索结果并不会重复看到相同或相似的图像,提升了用户的图像搜索体验。
优选地,在所述步骤S2中,所述判断设备还结合所述图像的内容属性,对所述图像的图像特征信息进行预定数字处理,生成所述数字签名。具体地,所述判断设备通过诸如对所述图像进行内容解析来得到所述图像的内容属性,然后根据所述图像的内容属性,诸如所述图像中所包含的内容多少、内容分布信息等,对所述图像的图像特征信息进行预定数字处理,生成所述数字签名。例如,当所述图像中所包含的内容多并且内容分布均匀时,使用预定数字处理后的数字序列中的某一位或多位来表征,并且这些位在以二进制形式表示时置为1;当所述图像中所包含的内容少并且内容分布十分不均匀时,也使用预定数字处理后的数字序列中的某一位或多位来表征,并且这些位在以二进制形式表示时均清零。
优选地,在所述步骤S2中,所述判断设备对所述图像的图像特征信息进行降维处理,生成所述数字签名。更优选地,所述判断设备结合所述图像特征信息的权重,对所述图像的图像特征信息进行降维处理和筛选处理,以获取与所述图像相对应的第一图像特征信息;然后,基于所述第一图像特征信息,生成所述数字签名。例如,在所述步骤S2中,所述判断设备对所述图像的图像特征信息进行预定数字处理,所述预定数字处理包括但不限于降维处理,当所述图像特征信息中的某一图像特征信息分量使用多个实数或布尔数值来表示时,通过诸如PCA(Principal Component Analysis,主成分分析)或SPCA(SparsePrincipal Component Analysis,稀疏主成分分析)算法对该图像特征信息分量进行降维处理,从而得到一个数字序列,所述数字序列既能够反映出所述图像的该图像特征信息分量,又可减少实数或布尔数值个数。又如,所述判断设备结合所述图像特征信息的权重,对所述图像的图像特征信息进行降维处理和筛选处理,以获取所述图像所对应的第一图像特征信息,并且基于所述第一图像特征信息来生成所述数字签名。一般地,将权重较高的那些图像特征信息所对应的数字序列调整到整个序列的前面,而将权重较低的那些图像特征信息所对应的数字序列调整至整个序列的后面,并且对所述调整后的整个序列进行筛选处理,从而得到所述图像所对应的第一图像特征信息。由上述可知,对所述图像的图像特征信息进行降维处理和筛选处理后,基于筛选结果而生成的数字签名也相应地变得更加精简,并且基于精简后的数字签名对所述多个图像进行相似判断,也可提高所述判断设备的处理效率。更优选地,所述判断设备还对所述第一图像特征信息进行量化处理,获取与所述第一图像特征信息相对应的数字序列;对所述数字序列进行预定编码处理,生成所述数字签名。在此,所述预定编码处理包括以下至少任一项:
-基于高位提取方式的编码处理;
-压缩编码处理。
以基于高位提取方式的编码处理为例,所述判断设备对所述第一图像特征信息进行量化处理后,将诸如多个浮点型实数值转化为二进制形式的数字序列。例如,所述数字序列包括4个整数型数值,第一个整数型数值包括用于表征SCD(Scalable ColorDescriptor,可伸缩颜色描述子)的数字字段;第二个整数型数值包括用于表征HTD(Homogeneous Texture Descriptor,同质纹理描述子)的数字字段;第三个整数型数值包括用于表征CC(Cross Correlation Descriptor,互相关描述子)的数字字段,第四个整数型数值包括用于表征CLD(Color Layout Descriptor,颜色分布描述子)的数字字段。在此,所述数字序列划分为4个数字字段,在该优选实施例中,所述判断设备基于高位提取方式对所述4个数字字段进行编码,例如,基于编码结果来形成新数字序列,在所述新数字序列中,将CC的高8位作为新数字序列中第1数字字段(预设所述数字字段的总位数为32位)的高8位,将HTD的高4位作为所述第1数字字段的第9-12位,将CLD的高4位作为所述第1数字字段的第13-16位,以及将CC的第9-24位作为所述第1数字字段的第17-32位。以压缩编码处理为例,所述判断设备对所述第一图像特征信息进行量化处理后,将诸如多个浮点型实数值转化为二进制形式的数字序列。仍然接上例,所述数字序列包括4个整数型数值,第一个整数型数值包括用于表征SCD(Scalable Color Descriptor,可伸缩颜色描述子)的数字字段;第二个整数型数值包括用于表征HTD(Homogeneous Texture Descriptor,同质纹理描述子)的数字字段;第三个整数型数值包括用于表征CC(Cross Correlation Descriptor,互相关描述子)的数字字段,第四个整数型数值包括用于表征CLD(Color LayoutDescriptor,颜色分布描述子)的数字字段。在此,所述数字序列划分为4个数字字段,在该优选实施例中,所述判断设备基于高位提取方式对所述4个数字字段进行编码,例如,基于编码结果来形成新数字序列,在所述新数字序列中,将CC的高8位作为新数字序列中第1数字字段(预设所述数字字段的总位数为32位)的高8位,将HTD的高4位作为所述第1数字字段的第9-12位,将CLD的高4位作为所述第1数字字段的第13-16位,以及将CC的第9-24位作为所述第1数字字段的第17-32位。
优选地,所述图像特征信息包括以下至少任一项:
-可伸缩颜色描述子;
-同质纹理描述子;
-颜色分布描述子;
-基于互相关的描述子。
以可伸缩颜色描述子为例,当所述判断设备对多个图像进行相似判断时,获取可伸缩颜色描述子作为所述多个图像中各个图像的颜色类的图像特征信息,并对所述图像的可伸缩颜色描述子进行预定数字处理,生成所述图像的数字签名,然后根据所述数字签名对所述多个图像进行相似判断。以同质纹理描述子为例,当所述判断设备对多个图像进行相似判断时,获取同质纹理描述子作为所述多个图像中各个图像的纹理类的图像特征信息,并对所述图像的同质纹理描述子进行预定数字处理,生成所述图像的数字签名,然后根据所述数字签名对所述多个图像进行相似判断。以颜色分布描述子为例,当所述判断设备对多个图像进行相似判断时,获取颜色分布描述子作为所述多个图像中各个图像的颜色类的另一图像特征信息,并对所述图像的颜色分布描述子进行预定数字处理,生成所述图像的数字签名,然后根据所述数字签名对所述多个图像进行相似判断。以基于互相关的描述子为例,当所述判断设备对多个图像进行相似判断时,获取基于互相关的描述子作为所述多个图像中各个图像的图像特征信息,并对所述图像的基于互相关的描述子进行预定数字处理,生成所述图像的数字签名,然后根据所述数字签名对所述多个图像进行相似判断。在一优选实施例中,所述判断设备通过步骤S1获取所述可伸缩颜色描述子、同质纹理描述子、颜色分布描述子和基于互相关的描述子中的两个或两个以上的描述子作为所述多个图像中各个图像的图像特征信息,并基于所述图像特征信息来生成所述各个图像的数字签名。
图4示出依据本发明一优选实施例的基于数字签名对多个图像进行相似判断的方法流程图。其中,用于基于数字签名对多个图像进行相似判断的判断设备包括但不限于网络主机、单个网络服务器、多个网络服务器集或多个服务器构成的云。在此,云可以由基于云计算(Cloud Computing)的大量计算机或网络服务器构成,其中,云计算是分布式计算的一种由一群松散耦合的计算机集组成的一个超级虚拟计算机。
在图4所示的方法中,步骤S1’和步骤S2’分别与图3所示的步骤S1和步骤S2相同或相似,为描述简便起见,故此处不再赘述,并通过引用的方式包含于此。
在步骤S31’中,所述判断设备根据所述数字签名,对所述多个图像进行预定分类处理,以获得多组图像,每组图像分别属于一类图像类别。具体地,所述判断设备对所述图像的图像特征信息进行预定数字处理从而生成所述图像的数字签名后,通过所述多个图像中各个图像的数字签名,将所述多个图像进行预定分类处理,以获得多组图像,每组图像包含在同一个图像类别中。例如,通过上述步骤S2’生成所述多个图像中各个图像的数字签名后,相同或相似的图像大体上具有局部相同或基本上完全相同的数字签名,所述判断设备根据这些数字签名就可将相同或相似的图像划分为一组,并且所述图像组构成一个图像类别。本领域技术人员应能理解上述根据所述数字签名对所述多个图像进行预定分类处理以获得多组图像的方式仅为举例,其他现有的或今后可能出现的根据所述数字签名对所述多个图像进行预定分类处理以获得多组图像的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
然后,在步骤S32’中,所述判断设备根据所述数字签名,对所述每组图像进行位比对操作,以获得所述相似判断结果。具体地,所述判断设备根据所述数字签名,对所述多个图像进行预定分类处理而获得多组图像后,通过诸如截取所述数字签名中的一部分数字串,对所述每组图像中的任意两个或两个以上的图像进行位比对操作,以获得所述相似判断结果;或者,通过诸如将所述数字签名转换成二进制字符串,对所述每组图像中的任意两个或两个以上的图像相对应的二进制字符串中的部分或全部数值序列进行逻辑运算,以获得所述相似判断结果。因此,所述判断设备在根据所述数字签名对所述多个图像进行相似判断前,还可通过上述步骤S31’将所述多个图像进行预定分类处理以得到多组图像,并利用上述步骤S32’对所述每组图像进行位比对操作,以获得所述相似判断结果。由于所述判断设备仅对每组图像中的两个或两个以上的图像进行比对操作,从而极大地提高了相似判断的处理效率。此外,在同一图像类别中的图像进行相似判断时,所述判断设备还对所述图像的数字签名采用位比对操作,也可显著加快相似判断的速度。本领域技术人员应能理解上述根据所述数字签名对所述每组图像进行位比对操作以获得所述相似判断结果的方式仅为举例,其他现有的或今后可能出现的根据所述数字签名对所述每组图像进行位比对操作以获得所述相似判断结果的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
优选地,所述预定分类处理包括基于以下至少任一项算法进行分类处理:
-散列算法;
-取模算法;
-随机数算法。
以所述预定分类处理包括基于散列算法进行分类处理为例,在步骤S31’中,所述判断设备通过散列算法,将相同或相近似的图像所对应的数字签名转换为一个散列值,并根据所述散列值将所述相同或相近似的图像归为一个图像组,该组图像对应于一个图像类别。然后,在步骤S32’中,所述判断设备基于所述数字签名对同一图像类别中的图像进行位比对操作,以获得所述相似判断结果。以所述预定分类处理包括基于取模算法进行分类处理为例,若预定将所述多个图像划分为2N类(其中N为自然数),则在步骤S31’中,所述判断设备通过取模算法,将相同或相近似的图像所对应的数字签名转换为一个整数值,诸如0~2N-1中的任一整数值,然后将整数值相同的所有图像归为一个图像组,该组图像对应于一个图像类别。然后,在步骤S32’中,所述判断设备基于所述数字签名对同一图像类别中的图像进行位比对操作,以获得所述相似判断结果。以所述预定分类处理包括基于随机数算法进行分类处理为例,若预定将所述多个图像划分为2N类(其中N为自然数),则在步骤S31’中,所述判断设备通过随机数算法,诸如使用Random函数,将相同或相近似的图像所对应的数字签名转换为一个整数值,诸如0~2N-1中的任一整数值,然后将整数值相同的所有图像归为一个图像组,该组图像对应于一个图像类别。然后,在步骤S32’中,所述判断设备基于所述数字签名对同一图像类别中的图像进行位比对操作,以获得所述相似判断结果。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
Claims (25)
1.一种计算机实现的用于基于数字签名对多个图像进行相似判断的方法,其中,该方法包括以下步骤:
a获取一个图像的图像特征信息;
b对所述图像的图像特征信息进行预定数字处理,生成该图像所对应的一个数字签名;
其中,该方法还包括:
-根据待处理的多个图像中各个图像所对应的数字签名,对所述多个图像进行相似判断,并基于相似判断结果对所述多个图像进行相应处理;
其中,对所述多个图像进行相似判断的步骤还包括:
-根据所述多个图像中各个图像的数字签名,通过将所述多个图像中所对应的数字签名相同或相似的图像划分为一组,来获得多组图像,每组图像分别属于一类图像类别;
-根据所述多个图像中各个图像的数字签名,对所述每组图像中的任意两个或两个以上的图像进行位比对操作,以获得所述相似判断结果。
2.根据权利要求1所述的方法,其中,所述方法还包括:
-获取与所述图像相对应的特征信息类型;
其中,所述步骤a还包括:
-基于图像特征向量模型,结合所述特征信息类型,获取所述图像特征信息。
3.根据权利要求2所述的方法,其中,所述方法还包括:
-对大量图像进行图像特征训练,以获取所述图像特征向量模型。
4.根据权利要求1至3中任一项所述的方法,其中,所述基于相似判断结果对所述多个图像进行相应处理的步骤还包括:
-基于相似判断结果对所述多个图像进行去重处理,以获得去重处理后的一个或多个图像。
5.根据权利要求4所述的方法,其中,该方法还包括:
-根据用户查询序列进行搜索,以获得所述待处理的多个图像;
其中,该方法还包括:
-将所述去重处理后的一个或多个图像提供给所述用户。
6.根据权利要求1所述的方法,其中,所述步骤b还包括:
-结合所述图像的内容属性,对所述图像的图像特征信息进行预定数字处理,生成所述数字签名。
7.根据权利要求1所述的方法,其中,所述步骤b还包括:
-对所述图像的图像特征信息进行降维处理,生成所述数字签名。
8.根据权利要求7所述的方法,其中,所述步骤b还包括:
b1结合所述图像特征信息的权重,对所述图像的图像特征信息进行降维处理和筛选处理,以获得与所述图像相对应的第一图像特征信息;
b2基于所述第一图像特征信息,生成所述数字签名。
9.根据权利要求8所述的方法,其中,所述步骤b2还包括:
-对所述第一图像特征信息进行量化处理,获取与所述第一图像特征信息相对应的数字序列;
-对所述数字序列进行预定编码处理,生成所述数字签名。
10.根据权利要求9所述的方法,其中,所述预定编码处理包括以下至少任一项:
-基于高位提取方式的编码处理;
-压缩编码处理。
11.根据权利要求1所述的方法,其中,所述预定分类处理包括基于以下至少任一项算法进行分类处理:
-散列算法;
-取模算法;
-随机数算法。
12.根据权利要求1所述的方法,其中,所述图像特征信息包括以下至少任一项:
-可伸缩颜色描述子;
-同质纹理描述子;
-颜色分布描述子;
-基于互相关的描述子。
13.一种用于基于数字签名对多个图像进行相似判断的设备,其中,所述设备包括:
第一获取装置,用于获取一个图像的图像特征信息;
生成装置,用于对所述图像的图像特征信息进行预定数字处理,生成该图像所对应的一个数字签名;
其中,该设备还包括判断装置,用于:
-根据待处理的多个图像中各个图像所对应的数字签名,对所述多个图像进行相似判断,并基于相似判断结果对所述多个图像进行相应处理;
其中,所述判断装置还包括:
第二处理装置,用于根据所述多个图像中各个图像的数字签名,通过将所述多个图像中所对应的数字签名相同或相似的图像划分为一组,来获得多组图像,每组图像分别属于一类图像类别;
比对装置,用于根据所述多个图像中各个图像的数字签名,对所述每组图像中的任意两个或两个以上的图像进行位比对操作,以获得所述相似判断结果。
14.根据权利要求13所述的设备,其中,所述设备还包括第二获取装置,用于获取与所述图像相对应的特征信息类型;
其中,所述第一获取装置还用于:
-基于图像特征向量模型,结合所述特征信息类型,获取所述图像特征信息。
15.根据权利要求14所述的设备,其中,所述设备还包括第三获取装置,用于:
-对大量图像进行图像特征训练,以获取所述图像特征向量模型。
16.根据权利要求13至15中任一项所述的设备,其中,所述判断装置还用于:
-基于相似判断结果对所述多个图像进行去重处理,以获得去重处理后的一个或多个图像。
17.根据权利要求16所述的设备,其中,所述设备还包括第四获取装置,用于:
-根据用户查询序列进行搜索,以获得所述待处理的多个图像;
其中,所述设备还包括提供装置,用于:
-将所述去重处理后的一个或多个图像提供给所述用户。
18.根据权利要求13所述的设备,其中,所述生成装置还用于:
-结合所述图像的内容属性,对所述图像的图像特征信息进行预定数字处理,生成所述数字签名。
19.根据权利要求13所述的设备,其中,所述生成装置还用于:
-对所述图像的图像特征信息进行降维处理,生成所述数字签名。
20.根据权利要求19所述的设备,其中,所述生成装置还包括:
第一处理装置,用于结合所述图像特征信息的权重,对所述图像的图像特征信息进行降维处理和筛选处理,以获得与所述图像相对应的第一图像特征信息;
第五获取装置,用于基于所述第一图像特征信息,生成所述数字签名。
21.根据权利要求20所述的设备,其中,所述第五获取装置还用于:
-对所述第一图像特征信息进行量化处理,获取与所述第一图像特征信息相对应的数字序列;
-对所述数字序列进行预定编码处理,生成所述数字签名。
22.根据权利要求21所述的设备,其中,所述预定编码处理包括以下至少任一项:
-基于高位提取方式的编码处理;
-压缩编码处理。
23.根据权利要求13所述的设备,其中,所述预定分类处理包括基于以下至少任一项算法进行分类处理:
-散列算法;
-取模算法;
-随机数算法。
24.根据权利要求13所述的设备,其中,所述图像特征信息包括以下至少任一项:
-可伸缩颜色描述子;
-同质纹理描述子;
-颜色分布描述子;
-基于互相关的描述子。
25.一种搜索引擎,其中,该搜索引擎包括如权利要求13至24中任一项所述的用于基于数字签名对多个图像进行相似判断的设备。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110240715.0A CN102955784B (zh) | 2011-08-19 | 2011-08-19 | 一种基于数字签名对多个图像进行相似判断的设备和方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110240715.0A CN102955784B (zh) | 2011-08-19 | 2011-08-19 | 一种基于数字签名对多个图像进行相似判断的设备和方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102955784A CN102955784A (zh) | 2013-03-06 |
CN102955784B true CN102955784B (zh) | 2018-03-06 |
Family
ID=47764598
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201110240715.0A Active CN102955784B (zh) | 2011-08-19 | 2011-08-19 | 一种基于数字签名对多个图像进行相似判断的设备和方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102955784B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103838484A (zh) * | 2014-02-21 | 2014-06-04 | 联想(北京)有限公司 | 一种删除冗余图像的方法以及一种电子设备 |
CN105205487B (zh) * | 2014-05-28 | 2019-08-23 | 腾讯科技(深圳)有限公司 | 一种图片处理方法及装置 |
DE102016212888A1 (de) * | 2016-07-14 | 2018-01-18 | Siemens Healthcare Gmbh | Bestimmen einer Bildserie abhängig von einer Signaturmenge |
CN106886378A (zh) * | 2017-02-23 | 2017-06-23 | 济南浪潮高新科技投资发展有限公司 | 一种打印方法和装置、一种可读介质和存储控制器 |
CN109242750B (zh) * | 2018-08-14 | 2023-03-21 | 武汉斗鱼网络科技有限公司 | 图片签名方法、图片匹配方法、装置、设备及存储介质 |
CN110321858B (zh) * | 2019-07-08 | 2022-06-14 | 北京字节跳动网络技术有限公司 | 视频相似度确定方法、装置、电子设备及存储介质 |
CN112738458A (zh) * | 2020-12-21 | 2021-04-30 | 山东产研信息与人工智能融合研究院有限公司 | 一种基于视频识别的棉包数量检测装置和方法 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2785862B2 (ja) * | 1995-10-16 | 1998-08-13 | 日本電気株式会社 | 指紋カード選択装置および指紋カード絞り込み装置 |
US7475061B2 (en) * | 2004-01-15 | 2009-01-06 | Microsoft Corporation | Image-based document indexing and retrieval |
CN100361437C (zh) * | 2005-05-08 | 2008-01-09 | 中国科学院计算技术研究所 | 一种数字图像哈希签名方法 |
CN101034442A (zh) * | 2006-03-08 | 2007-09-12 | 刘欣融 | 基于图像识别技术的商品的外观设计相同和相近似判断系统 |
CN101136015A (zh) * | 2006-09-01 | 2008-03-05 | 北大方正集团有限公司 | 一种计算图像之间相似度的方法 |
CN101211341A (zh) * | 2006-12-29 | 2008-07-02 | 上海芯盛电子科技有限公司 | 图像智能模式识别搜索方法 |
CN102141994A (zh) * | 2010-02-03 | 2011-08-03 | 苗乾坤 | 基于内容的图片搜索方法及其并行优化技术 |
-
2011
- 2011-08-19 CN CN201110240715.0A patent/CN102955784B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN102955784A (zh) | 2013-03-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102955784B (zh) | 一种基于数字签名对多个图像进行相似判断的设备和方法 | |
KR101388638B1 (ko) | 이미지에 주석 달기 | |
CN107077474A (zh) | 快速颜色搜索 | |
Kadam et al. | [Retracted] Efficient Approach towards Detection and Identification of Copy Move and Image Splicing Forgeries Using Mask R‐CNN with MobileNet V1 | |
CN108062478A (zh) | 全局特征可视化与局部特征相结合的恶意代码分类方法 | |
CN102306287B (zh) | 一种用于识别敏感图像的方法与设备 | |
US10255355B2 (en) | Method and system for information retrieval and aggregation from inferred user reasoning | |
CN110175249A (zh) | 一种相似图片的检索方法及系统 | |
CN108460056A (zh) | 一种dxf文件有效图元转换json数据的方法 | |
Yin et al. | Yes," Attention Is All You Need", for Exemplar based Colorization | |
CN103678460B (zh) | 用于识别适于在多语言环境中进行通信的非文本元素的方法和系统 | |
CN109829065A (zh) | 图像检索方法、装置、设备及计算机可读存储介质 | |
GB2607440A (en) | Method and apparatus for determining encryption mask, device and storage medium | |
CN115238670B (zh) | 信息文本抽取方法、装置、设备及存储介质 | |
Alawieh et al. | GAN-SRAF: subresolution assist feature generation using generative adversarial networks | |
CN106570166A (zh) | 一种基于多个局部敏感哈希表的视频检索方法及装置 | |
CN104537280B (zh) | 基于文本关系相似性的蛋白质交互关系识别方法 | |
CN112182275A (zh) | 一种基于多维度特征融合的商标近似检索系统和方法 | |
CN108090117A (zh) | 一种图像检索方法及装置,电子设备 | |
CN113821602B (zh) | 基于图文聊天记录的自动答疑方法、装置、设备及介质 | |
CN116705304A (zh) | 基于图像文本的多模态任务处理方法、装置、设备及介质 | |
CN116522944A (zh) | 基于多头注意力的图片生成方法、装置、设备及介质 | |
CN107066926A (zh) | 使用描述符的3d对象定位 | |
CN114707017A (zh) | 视觉问答方法、装置、电子设备和存储介质 | |
Chiang et al. | Content-based image retrieval via the multiresolution wavelet features of interest |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
EE01 | Entry into force of recordation of patent licensing contract | ||
EE01 | Entry into force of recordation of patent licensing contract |
Application publication date: 20130306 Assignee: Beijing small mutual Entertainment Technology Co., Ltd. Assignor: BEIJING BAIDU NETCOM SCIENCE AND TECHNOLOGY Co.,Ltd. Contract record no.: 2017110000013 Denomination of invention: Equipment and method for judging similarity of various images on basis of digital signatures License type: Exclusive License Record date: 20170705 |
|
GR01 | Patent grant | ||
GR01 | Patent grant |