CN106033549A - 一种车辆检索中的重排序方法及装置 - Google Patents

一种车辆检索中的重排序方法及装置 Download PDF

Info

Publication number
CN106033549A
CN106033549A CN201510115124.9A CN201510115124A CN106033549A CN 106033549 A CN106033549 A CN 106033549A CN 201510115124 A CN201510115124 A CN 201510115124A CN 106033549 A CN106033549 A CN 106033549A
Authority
CN
China
Prior art keywords
image
vector
similarity
sample image
tuples
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510115124.9A
Other languages
English (en)
Other versions
CN106033549B (zh
Inventor
段凌宇
李晨霞
陈杰
黄铁军
高文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University
Original Assignee
Peking University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University filed Critical Peking University
Priority to CN201510115124.9A priority Critical patent/CN106033549B/zh
Publication of CN106033549A publication Critical patent/CN106033549A/zh
Application granted granted Critical
Publication of CN106033549B publication Critical patent/CN106033549B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明公开了一种车辆检索中的重排序方法及装置,所述方法包括:获取待查询图像基于预先建立的模板库中所有样例图像的第一统计分布特征向量,以及获取目标图像库中每一图像基于模板库中所有样例图像的第二统计分布特征向量;获取所述目标图像库中部分图像排序的初始检索结果序列,根据第一统计分布特征向量和第二统计分布特征向量、和初始检索结果序列确定初始检索结果序列中每一图像与待查询图像的第三相似度;将初始检索结果序列中的所有图像按照第三相似度的大小重新排序,获得重排序的目标检索结果序列。上述方法能够实现在车辆检索中的重排序,以便提高车辆检索的准确率。

Description

一种车辆检索中的重排序方法及装置
技术领域
本发明涉及计算机技术,具体涉及一种车辆检索中的重排序方法及装置。
背景技术
交通监控图像和视频是公安业务的重要数据基础,在社会治安维稳、打击违法犯罪等方面有着至关重要的作用。为此,如何从大量的监控图像和视频中检索出目标车辆成为研究热点。
现有技术中,重排序是图像检索技术中常用的提升检索性能的技术,例如,可通过图像对之间的视觉特征匹配关系对初始检索结果进行重排序。
然而,重排效果极大依赖于所使用的视觉特征是否能够足够有效地表达图像。在相似车辆搜索中,由于很多车辆往往外形很相似,提取出的视觉特征也会比较相似,无法区分不同车型,从而导致这种直接使用图像对之间的匹配关系的重排序方法不能较好的检索出相似车辆。
发明内容
针对现有技术中的缺陷,本发明提供了一种车辆检索中的重排序方法及装置,能够实现在车辆检索中的重排序,以便提高车辆检索的准确率。
第一方面,本发明提供一种车辆检索中的重排序方法,包括:
获取待查询图像基于预先建立的模板库中所有样例图像的第一统计分布特征向量,以及获取目标图像库中每一图像基于所述模板库中所有样例图像的第二统计分布特征向量;
获取所述目标图像库中部分图像排序的初始检索结果序列,所述初始检索结果序列是按照所述待查询图像与所述目标图像库中每一图像的第一相似度的大小排序的;
根据所述第一统计分布特征向量和所述初始检索结果序列中每一图像的第二统计分布特征向量,确定所述待查询图像与所述初始检索结果序列中每一图像的第二相似度;
根据所述初始检索结果序列中每一图像与所述待查询图像的第一相似度和第二相似度,确定所述初始检索结果序列中每一图像与所述待查询图像的第三相似度;
将所述初始检索结果序列中的所有图像按照所述第三相似度的大小重新排序,获得重排序的目标检索结果序列。
可选地,所述获取待查询图像基于预先建立的模板库中所有样例图像的第一统计分布特征向量之前,所述方法还包括:
对筛选后的样例图像进行聚类处理,建立包括部分样例图像的模板库,所述模板库中的样例图像均不重复。
可选地,所述对筛选后的样例图像进行聚类处理,建立包括样例图像的模板库,包括:
采用预设的图像匹配系统对预先收集的N张样例图像进行筛选,获得筛选后的T张样例图像;
其中,N、T均为大于1的自然数,N大于T。
可选地,获取待查询图像基于预先建立的模板库中所有样例图像的第一统计分布特征向量,包括:
获取所述待查询图像与所述模板库中每张样例图像的视觉相似度,得到Q个二元组,每一二元组包括:样例图像标识和该样例图像对应的视觉相似度;
根据预设的视觉相似度的阈值,从Q个二元组中筛选出Q’个二元组,Q和Q’均为大于1的自然数;
采用构建的第一向量和第二向量对Q’个二元组进行统计,根据统计结果生成第一统计分布特征向量;
其中,所述第一向量为各维度初始化为0;
第二向量为各维度初始化为0;
所述第一向量的维度和第二向量的维度相同,且与所述模板库中所有样例图像对应的类别数量匹配。
可选地,获取目标图像库中每一图像基于所述模板库中所有样例图像的第二统计分布特征向量,包括:
获取所述目标图像库中每一图像与所述模板库中每张样例图像的视觉相似度,获得每一图像的Q个二元组,每一二元组包括:样例图像标识和该样例图像对应的视觉相似度;
根据预设的视觉相似度的阈值,从每一图像对应的所有二元组中筛选出R个二元组,R为大于1的自然数;
采用构建的第一向量和第二向量对R个二元组进行统计,根据统计结果生成该图像的第二统计分布特征向量;
其中,所述第一向量为各维度初始化为0;
第二向量为各维度初始化为0;
所述第一向量的维度和第二向量的维度相同,且与所述模板库中所有样例图像对应的类别数量匹配。
可选地,所述根据统计结果生成第一统计分布特征向量,包括:
将统计有Q’个二元组的第一向量的每个维度除以统计有Q’个二元组的第二向量中对应维度值的开方,获得第一统计分布特征向量;
或者,
根据统计结果生成第二统计分布特征向量,包括:
将统计有R个二元组的第一向量的每个维度除以统计有R个二元组的第二向量中对应维度值的开方,获得第二统计分布特征向量。
第二方面,本发明提供一种车辆检索中的重排序装置,包括:
统计分布特征向量获取单元,用于获取待查询图像基于预先建立的模板库中所有样例图像的第一统计分布特征向量,以及获取目标图像库中每一图像基于所述模板库中所有样例图像的第二统计分布特征向量;
初始检索结果序列获取单元,用于获取所述目标图像库中部分图像排序的初始检索结果序列,所述初始检索结果序列是按照所述待查询图像与所述目标图像库中每一图像的第一相似度的大小排序的;
第二相似度确定单元,用于根据所述第一统计分布特征向量和所述初始检索结果序列中的每一图像的第二统计分布特征向量,确定所述待查询图像与所述初始检索结果序列中每一图像的第二相似度;
第三相似度确定单元,用于根据所述初始检索结果序列中每一图像与所述待查询图像的第一相似度和第二相似度,确定所述初始检索结果序列中每一图像与所述待查询图像的第三相似度;
目标检索结果序列获取单元,用于将所述初始检索结果序列中的所有图像按照所述第三相似度的大小重新排序,获取重排序的目标检索结果序列。
可选地,所述装置还包括:
模板库建立单元,用于对筛选后的样例图像进行聚类处理,建立包括部分样例图像的模板库,所述模板库中的样例图像均不重复。
可选地,统计分布特征向量获取单元,具体用于
获取所述待查询图像与所述模板库中每张样例图像的视觉相似度,得到Q个二元组,每一二元组包括:样例图像标识和该样例图像对应的视觉相似度;
根据预设的视觉相似度的阈值,从Q个二元组中筛选出Q’个二元组,Q和Q’均为大于1的自然数;
采用构建的第一向量和第二向量对Q’个二元组进行统计,根据统计结果生成第一统计分布特征向量;
以及,
获取所述目标图像库中每一图像与所述模板库中每张样例图像的视觉相似度,获得每一图像的Q个二元组,每一二元组包括:样例图像标识和该样例图像对应的视觉相似度;
根据预设的视觉相似度的阈值,从每一图像对应的所有二元组中筛选出R个二元组,R为大于1的自然数;
采用构建的第一向量和第二向量对R个二元组进行统计,根据统计结果生成该图像的第二统计分布特征向量;
其中,所述第一向量为各维度初始化为0;
第二向量为各维度初始化为0;
所述第一向量的维度和第二向量的维度相同,且与所述模板库中所有样例图像对应的类别数量匹配。
第三方面,本发明还提供一种车辆检索方法,包括:
采用上述任一所述的车辆检索中的重排序方法获取待查询图像的目标检索结果序列;
根据所述目标检索结果序列,确定与所述待查询图像相似的目标图像。
由上述技术方案可知,本发明的车辆检索中的重排序方法及装置,利用模板库的统计分布特性,将待匹配的两张图像分别映射到该模板库,生成统计分布特征,利用初始检索结果图像与查询图像间的统计分布特征相似度对初始检索结果做重排序。能够实现在车辆检索中的重排序,提高车辆检索的准确率。
附图说明
图1为本发明一实施例提供的车辆检索中的重排序方法的流程示意图;
图2为本发明一实施例提供的车辆检索中的重排序方法的流程示意图;
图3为本发明一实施例提供的车辆检索中的重排序装置的流程示意图。
具体实施方式
下面结合附图,对发明的具体实施方式作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。本发明实施例中所使用的“第一”、“第二”仅为更清楚的说明本申请的内容,不具有特定含义,也不限定任何内容。
本发明实施例提出一种利用基于第三方图像集合生成的统计分布特征的重排序方法,将一对一的匹配模式转换为一对多的匹配,可以得到更准确、稳定的匹配关系,从而获得更好的重排序效果。
图1示出了本发明一实施例提供的车辆检索中的重排序方法的流程示意图,如图1所示,本实施例的车辆检索中的重排序方法如下所述。
101、获取待查询图像基于预先建立的模板库中所有样例图像的第一统计分布特征向量,以及获取目标图像库中每一图像基于所述模板库中所有样例图像的第二统计分布特征向量。
在本实施例中,模板库是预先建立的,并包括有多个类别即车型种类类别的样例图像,且模板库中的样例图像均不重复。
102、获取所述目标图像库中部分图像排序的初始检索结果序列,所述初始检索结果序列是按照所述待查询图像与所述目标图像库中每一图像的第一相似度的大小排序的。
举例来说,可预先获取所述待查询图像与所述目标图像库中每一图像的第一相似度;选取大于预设第一阈值的第一相似度组成第一相似度集合,将所述第一相似度集合中所有第一相似度对应的图像进行排序,获得初始检索结果序列。
103、根据所述第一统计分布特征向量和所述初始检索结果序列中每一图像的第二统计分布特征向量,确定所述待查询图像与所述初始检索结果序列中每一图像的第二相似度。
104、根据所述初始检索结果序列中的每一图像与所述待查询图像的第一相似度和第二相似度,确定所述初始检索结果序列中的每一图像与所述待查询图像的第三相似度。
105、将所述初始检索结果序列中的所有图像按照所述第三相似度的大小重新排序,获得重排序的目标检索结果序列。
本实施例的车辆检索中的重排序方法,利用模板库的统计分布特性,将待匹配的两张图像分别映射到该模板库,生成统计分布特征,利用初始检索结果图像与查询图像间的统计分布特征相似度对初始检索结果做重排序,能够实现在车辆检索中的重排序,提高车辆检索的准确率。
图2示出了本发明一实施例提供的车辆检索中的重排序方法的流程示意图,如图2所示,本实施例的车辆检索中的重排序方法如下所述。
201、对筛选后的样例图像进行聚类处理,建立包括部分或全部样例图像的模板库,所述模板库中的样例图像均不重复。
举例来说,可采用预设的图像匹配系统对预先收集的N张样例图像进行筛选,获得筛选后的T张样例图像;其中,N、T均为大于1的自然数,N大于T。
例如,对预先收集N张样例图像的第一图像集合中的所有样例图像进行图像检索筛选,获得符合某一设定阈值的M对图像匹配对,每一图像匹配对包括第一图像集合中的两个样例图像;
进一步地,还可采用预设的图像匹配系统对所述M对图像匹配对进行优化筛选,获得P对图像匹配对,将所述P对图像匹配对对应的样例图像组成模板库;
其中,M大于等于P,其中,N、M、P均为自然数。
本实施例中,预设图像匹配系统可为FPR(False Positive Rate)低于某一设定阈值的图像匹配系统。
202、获取所述待查询图像与所述模板库中每张样例图像的视觉相似度,得到Q个二元组,每一二元组包括:样例图像标识和该样例图像对应的视觉相似度。
举例来说,每一二元组可为包括(图像ID,与该图像对应视觉相似度)的二元组。
对待查询图像与模板库中的每张样例图像的视觉相似度即为视觉特征相似度,该处的视觉特征可使用Fisher向量、SIFT特征、SURF特征等现有特征提取技术,不做限定,本实施例使用Fisher向量作为视觉特征描述子,得到Q个(图像ID,视觉相似度)二元组;
203、根据预设的视觉相似度的阈值,从Q个二元组中筛选出Q’个二元组;采用构建的第一向量和第二向量对Q’个二元组进行统计,根据统计结果生成第一统计分布特征向量;
本实施例中,Q和Q’均为大于1的自然数,其中,所述第一向量可为各维度初始化为0;
第二向量可为各维度初始化为0;
所述第一向量的维度和第二向量的维度相同,且与所述模板库中所有样例图像对应的类别数量匹配。可理解的是,模板库中的类别是用聚类算法自动聚类生成的,与车型种类不严格对应。
另外,需要说明的是,预设的视觉相似度的阈值可为具体经验值,但考虑到不同视觉模型下(如,来自不同交通治安卡口)的查询图像和目标图像库中图像的视觉相似度可能不在相当的水平,该处的阈值应根据实际场景自适应调节,本实施例的视觉相似度的阈值设置方式为:记Q个(图像ID,视觉相似度)二元组中视觉相似度最大值为MAX,那么视觉相似度的阈值=MAX*0.6,其中,0.6为经验值,可根据实际目标图像库的信息进行调整。
举例来说,将统计有Q’个二元组的第一向量的每个维度除以统计有Q’个二元组的第二向量中对应维度值的开方,获得第一统计分布特征向量。
例如,可将上述第一向量每个维度除以第二向量中的相应维度值:生成第一统计分布特征向量
204、获取所述目标图像库中每一图像与所述模板库中每张样例图像的视觉相似度,获得目标图像库中每一图像的Q个二元组。
本实施例中,每一二元组包括:样例图像标识和该样例图像对应的视觉相似度;
205、根据预设的视觉相似度的阈值,从目标图像库中每一图像对应的所有二元组中筛选出R个二元组,采用构建的第一向量和第二向量对R个二元组进行统计,根据统计结果生成该图像的第二统计分布特征向量;
本实施例中,Q、R均为大于1的自然数;其中,所述第一向量为各维度初始化为0;
第二向量为各维度初始化为0;
所述第一向量的维度和第二向量的维度相同,且与所述模板库中所有样例图像对应的类别匹配。可理解的是,模板库中的类别是用聚类算法自动聚类生成的,与车型种类不严格对应。
举例来说,根据统计结果生成第二统计分布特征向量,包括:
将统计有R个二元组的第一向量的每个维度除以统计有R个二元组的第二向量中对应维度值的开方,获得第二统计分布特征向量。
206、获取目标图像库中部分图像排序的初始检索结果序列,所述初始检索结果序列是按照所述待查询图像与所述目标图像库中每一图像的第一相似度的大小排序的。
在本实施例中,重排序的操作对象是基于通过某种检索方式获取的初始检索结果序列。
假设通过某种检索方式,获取查询图像Q1的长度为m的初始检索结果序列R1={r1,r2,…,rm},一般满足sim1(Q1,rj)>sim1(Q1,rj+1),sim1表示两张图像的第一相似度,即R1按照第一相似度从高到低排列。
207、根据所述第一统计分布特征向量和所述初始检索结果序列中每一图像的第二统计分布特征向量,确定所述待查询图像与所述初始检索结果序列中每一图像的第二相似度。
也就是说,分别计算待查询图像Q1与r1~rm的统计分布特征相似度,即第二相似度,即计算sim2可以是余弦距离,也可以先进行L2归一化,然后计算欧式距离,当然也可以使用其他距离度量方式,不做具体限定,本实施例使用余弦距离作为统计分布特征相似性度量方式。
208、根据所述初始检索结果序列中的每一图像与所述待查询图像的第一相似度和第二相似度,确定所述初始检索结果序列中的每一图像与所述待查询图像的第三相似度。
例如,将第一相似度与第二相似度按照某种方式融合,得到第三相似度,融合方式可以是加权或相乘等方式,加权中也可以将第一相似度权重设为0,即,直接取第二相似度作为第三相似度,不做严格限定。上述的第一相似度可为视觉特征相似度,第二相似度可为统计分布特征相似度。
本实施例的融合方式为:先将初始检索结果序列R1的第一相似度归一化,归一化方式为:将初始检索结果序列R1中的每一项的第一相似度除以第一相似度最大值,由于R1按照第一相似度从高到低排列,那么最大值一般为首项,即初始检索结果序列R1中图像r1与待查询图像的第一相似度sim1(Q1,r1);
然后将归一化后的第一相似度与第二相似度相加,得到第三相似度,即:
sim 3 ( Q 1 , r j ) = sim 1 ( Q 1 , r j ) / sim 1 ( Q 1 , r 1 ) + sim 2 ( S → Q 1 , S → r j )
209、将所述初始检索结果序列中的所有图像按照所述第三相似度的大小重新排序,获得重排序的目标检索结果序列。
将初始检索结果序列R1按照第三相似度sim3从高到低进行重排序,得到新的目标检索结果序列。
本实施例的方法,通过引入第三方图像集合,并使用聚类的方式训练模板库,利用查询图像和目标图像库图像在该模板库上的统计分布特性对检索结果进行重排序,弥补了传统的图像一对一匹配不稳定、区分能力不够等缺陷,能够获得更好的重排效果。
在一个具体的例子中,对上述步骤201进行详细说明如下:
2011、根据样例筛选规则,从第一样例图像集合中选择可靠车辆样例图像,构成第二样例图像集合。
所述第一样例图像集合为车辆图像样例组成的样例图像集合,一般应尽可能但不绝对要求包含所有车型的样例,假设第一样例图像集合包含样例图像的个数为N,N一般应大于5000,本实施例中使用从XX城镇交通治安卡口采集的样例图像中随机选择的N=30000张样例图像构成第一样例图像集合;
根据样例筛选规则,从第一样例图像集合的N个样例图像中选择出T个可靠的样例图像,构成第二样例图像集合。需要说明的是,T的具体值依赖于样例筛选规则中的参数设置,以及第一样例图像集合中的N张样例图像的实际分布情况,不同情况下会得到不同的T值。本实施例中,从N=30000张样例图像中筛选出了T=18347张样例图像构成第二样例图像集合。
具体地:2011a、对第一样例图像集合两两构建图像匹配对,得到第一图像对集合。
第一样例图像集合包含N张样例图像,对其两两构建图像匹配对,目标是从这些样例图像对中选出强匹配对,但并不严格要求能够选出所有的强匹配对,理论上可以产生C(N,2)=N(N-1)/2对图像对,本实施例中N=30000,理论产生图像匹配对数量为4亿多对,而其中多数是不匹配对,如果对所有4亿多对图像匹配对一一匹配,效率过低。
因此,本实施例首先将N张样例图像中的每一张样例图像作为查询图像基于这N张样例图像构成的第一图像集合进行检索,每张查询图像得到一个按相似度从高到低排序的检索结果序列R2={r1,r2,…,rN},其中首位结果r1与查询图像的相似度sim(Q2,r1)最大,当该最大值小于第三阈值时,认为这一组检索结果序列不存在可能与相应查询图像构成强匹配对的样例图像,直接跳过这一条查询,否则,即,当sim(Q2,r1)大于第三阈值时,从检索结果序列R2中选出相似度大于第四阈值的结果与查询图像构成图像匹配对。本实施例中,使用Fisher向量作为描述子,第三阈值设为25.0,第四阈值设为sim(Q2,r1)*0.8。需要说明的是,不同的视觉特征描述子计算得到的相似度得分量级不同,应根据实际情况设置第三阈值。
按照上述方法构建的图像匹配对都存在相对较强的匹配关系,本实施例中构建了约42.7万对图像对,远远少于4亿的理论值,大大减少了后续匹配的工作量。
本实施例中的第三阈值和第四阈值可对应前述步骤201中选取M对图像匹配对过程中设定的阈值。
可选地,本实施例中还可执行下述的步骤2011b。
2011b、采用预设的图像匹配系统对第一图像对集合中的每组图像匹配对做匹配,选出能够匹配上的图像匹配对组成第二图像对集合。
本实施例预设图像匹配系统可为FPR(False Positive Rate)低于某一设定阈值如0.1%的图像匹配系统对第一图像对集合中的样例图像对逐对进行匹配,所有能够识别为匹配对的样例图像对组成第二图像对集合。本实施例从42.7万对图像匹配对中选出了42.5万对图像匹配对,构成第二图像对集合。
2012、使用第二图像对集合中的图像组成第二图像集合。
将第二图像对集合所包含图像匹配对对应的样例图像组成第二图像集合,本实施例包含42.5万对图像对的第二图像对集合包含18347张不重复图像,即,本实施例的第二图像集合由18347张不重复图像构成。
本实施例的模板库样例筛选方法,通过控制图像匹配系统的FPR在较低水平,选择出“可靠”的样例图像,这些样例图像能够与部分其他样例产生较强的匹配关系,使用这些“可靠”的样例图像进行聚类,能够较好地保证类的高内聚低耦合要求,从而更好地支撑后续的统计分布特性表达。
2013、使用聚类算法训练第二图像集合,生成模板库。
使用聚类算法对第二图像集合按照视觉特征相似度进行聚类,得到K个子集,构成所述模板库。
聚类算法可以是AP聚类算法、谱聚类算法、K-Means聚类算法等现有技术。本实施例中,首先对包含T张图像的第二图像集合构建T*T的相似度矩阵,然后使用AP聚类算法进行聚类,算法原理在此不做详述。
在本实施例中,获取相似度矩阵之前,需要分别提取每一张样例图像的视觉特征,通常,可采用Fisher向量、尺度不变特征转换(Scale-invariant feature transform,简称SIFT),快速鲁棒特征(Speeded-up Robust Features,简称SURF),特征梯度直方图(Histograms of Oriented Gradients,简称HOG)等方式提取每一张图像的视觉特征。本实施例中,提取任一图像的视觉特征可为业内公知技术,本实施例不对其进行详述。
在提取第二图像集合中每一样例图像的视觉特征之后,可采用汉明距离、欧式距离、马式距离等距离度量方式获取两两之间的视觉特征相似度,构建T*T的相似度矩阵。
另外需要说明的是,使用AP聚类算法聚出的类别个数一般较多,而模板库的类别个数一般不应偏离实际车型种类数量太远,本实施例使用AP聚类算法第一次聚类得到3392个类,而实际车型种类大约在1000种,因此,本实施例对第一次聚类得到的聚类中心进行二次聚类,最终得到938个类。本实施例中,这18347张图像训练出的938个子集构成所述模板库。
应该说明的是,前述步骤201中建立的模板库可以在任意检索中使用,后续对待查询图像可无需建立模板库,直接使用前期建立的模板库即可,即,只需要建立一次模板库,每次检索时可以直接使用,无需每检索一次建立一次模板库。
进一步地,前述步骤203中和205中的第一向量和第二向量的长度均为K,K值为模板库子集个数,本实施例中,K=938,因此生成的统计分布特征向量为938维。
统计方式为:对Q’或R个二元组中的每一个,如果“图像ID”所对应的图像在模板库中属于第i类,i∈N+,i∈[1,K],那么将“视觉相似度”累加到pi,同时ti加1。
进一步地,可将上述第一向量每个维度除以第二向量中的相应维度值的开方:生成所述统计分布特征向量
待查询图像和目标图像库中每张图像均按上述方式生成相应的K维统计分布特征向量(如上步骤203中的第一统计分布特征向量和步骤205中的第二统计分布特征向量)。
由于上述统计过程之前用视觉相似度的阈值进行了选择,参与统计的(图像ID,视觉相似度)二元组数量一般很少,本实施例中,平均能够保留约不到20个二元组,因此,生成的K维统计分布特征向量SG是稀疏的,在后续重排序步骤中计算量很小,从而保证了时间效率。
上述实施例中的方法,能够提升相似车辆检索性能。
特别地,通过多次试验证明,如构建一个包含4188张图像的目标数据库,对348张查询图像进行检索,查询图像与目标数据库图像来自同一城市。使用CDVS特征和检索框架获得按照第一相似度排序的初始检索结果序列,平均准确率(Mean Average Precision,MAP)为0.78,使用上述方法做重排序后提升到0.80。
另外,第二试验中构建与上述试验来自不同城市的150张查询图像,基于上述试验的目标数据库进行检索,同样使用CDVS特征和检索框架获得按照第一相似度排序的初始检索结果序列,平均准确率为0.42,使用本发明所述方法做重排序后提升到0.53。
从上述试验结果可知,本发明实施例的重排序方法对待查询图像与目标图像库中图像同场景(如同一城市或同一卡口)和不同场景(如不同城市或)的情况下均能获得提升效果,在查询图像与目标数据库图像来自不同场景的情况下提升尤为明显。
本实施例的方法与现有技术相比,不同于图像对之间一对一的匹配,本实施例使用聚类算法训练一个第三方的样例图像集合,这里称之为“模板库”,利用模板库的统计分布特性,将待匹配的两张图像分别映射到该模板库,生成统计分布特征,利用初始检索结果图像与查询图像间的统计分布特征相似度对初始检索结果做重排序。
另外,本发明还提供一种车辆检索方法,该车辆检索方法包括:前述任意实施例描述的车辆检索中的重排序方法获取待查询图像的目标检索结果序列;进而根据所述目标检索结果序列,确定与所述待查询图像相似的目标图像。
采用车辆检索方法可以从目标图像库中快速且准确的检索出目标车辆。
图3示出了本发明一实施例提供的车辆检索的重排序装置,如图3所示,本实施例的车辆检索的重排序装置包括:统计分布特征向量获取单元31、初始检索结果序列获取单元32、第二相似度确定单元33、第三相似度确定单元34、目标检索结果序列获取单元35;
其中,统计分布特征向量获取单元31用于获取待查询图像基于预先建立的模板库中所有样例图像的第一统计分布特征向量,以及获取目标图像库中每一图像基于所述模板库中所有样例图像的第二统计分布特征向量;
初始检索结果序列获取单元32用于获取所述目标图像库中部分图像排序的初始检索结果序列,所述初始检索结果序列是按照所述待查询图像与所述目标图像库中每一图像的第一相似度的大小排序的;
第二相似度确定单元33用于根据所述第一统计分布特征向量和所述初始检索结果序列中的每一图像的第二统计分布特征向量,确定所述待查询图像与所述初始检索结果序列中每一图像的第二相似度;
第三相似度确定单元34用于根据所述初始检索结果序列中每一图像与所述待查询图像的第一相似度和第二相似度,确定所述初始检索结果序列中每一图像与所述待查询图像的第三相似度;
目标检索结果序列获取单元35用于将所述初始检索结果序列中的所有图像按照所述第三相似度的大小重新排序,获取重排序的目标检索结果序列。
在一种具体的例子中,上述的车辆检索中的重排序装置还可包括图中未示出的模板库建立单元30,该模板库建立单元30用于采用预设的图像匹配系统对预先收集的N张样例图像进行筛选,获得筛选后的T张样例图像;进而对筛选后的样例图像进行聚类处理,建立包括部分样例图像的模板库,所述模板库中的样例图像均不重复,N、T均为大于1的自然数,N大于T。
应说明的是,本实施例中的模板库建立单元30连接统计分布特征向量获取单元31。
可选地,统计分布特征向量获取单元31具体用于,获取所述待查询图像与所述模板库中每张样例图像的视觉相似度,得到Q个二元组,每一二元组包括:样例图像标识和该样例图像对应的视觉相似度;
根据预设的视觉相似度的阈值,从Q个二元组中筛选出Q’个二元组,Q和Q’均为大于1的自然数;
采用构建的第一向量和第二向量对Q’个二元组进行统计,根据统计结果生成第一统计分布特征向量;
其中,所述第一向量为各维度初始化为0;
第二向量为各维度初始化为0;
所述第一向量的维度和第二向量的维度相同,且与所述模板库中所有样例图像对应的类别数量匹配。
或者,统计分布特征向量获取单元31具体用于,获取所述目标图像库中每一图像与所述模板库中每张样例图像的视觉相似度,获得每一图像的Q个二元组,每一二元组包括:样例图像标识和该样例图像对应的视觉相似度;
根据预设的视觉相似度的阈值,从每一图像对应的所有二元组中筛选出R个二元组,R为大于1的自然数;
采用构建的第一向量和第二向量对R个二元组进行统计,根据统计结果生成该图像的第二统计分布特征向量;
其中,所述第一向量为各维度初始化为0;
第二向量为各维度初始化为0;
所述第一向量的维度和第二向量的维度相同,且与所述模板库中所有样例图像对应的类别数量匹配。
本实施例中的重排序装置可执行前述图1和图2所示的方法流程,本实施例不对其进行详述。进一步地,本实施例的重排序装置可位于任一终端或设备中,实现图像的检索。本实施例中车辆检索的重排序装置,能够提升相似车辆检索性能。
本发明的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本发明公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释呈反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在于该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是互相排斥之处,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围,其均应涵盖在本发明的权利要求和说明书的范围当中。

Claims (10)

1.一种车辆检索中的重排序方法,其特征在于,包括:
获取待查询图像基于预先建立的模板库中所有样例图像的第一统计分布特征向量,以及获取目标图像库中每一图像基于所述模板库中所有样例图像的第二统计分布特征向量;
获取所述目标图像库中部分图像排序的初始检索结果序列,所述初始检索结果序列是按照所述待查询图像与所述目标图像库中每一图像的第一相似度的大小排序的;
根据所述第一统计分布特征向量和所述初始检索结果序列中每一图像的第二统计分布特征向量,确定所述待查询图像与所述初始检索结果序列中每一图像的第二相似度;
根据所述初始检索结果序列中每一图像与所述待查询图像的第一相似度和第二相似度,确定所述初始检索结果序列中每一图像与所述待查询图像的第三相似度;
将所述初始检索结果序列中的所有图像按照所述第三相似度的大小重新排序,获得重排序的目标检索结果序列。
2.根据权利要求1所述的方法,其特征在于,所述获取待查询图像基于预先建立的模板库中所有样例图像的第一统计分布特征向量之前,所述方法还包括:
对筛选后的样例图像进行聚类处理,建立包括部分样例图像的模板库,所述模板库中的样例图像均不重复。
3.根据权利要求2所述的方法,其特征在于,所述对筛选后的样例图像进行聚类处理,建立包括样例图像的模板库,包括:
采用预设的图像匹配系统对预先收集的N张样例图像进行筛选,获得筛选后的T张样例图像;
其中,N、T均为大于1的自然数,N大于T。
4.根据权利要求1所述的方法,其特征在于,获取待查询图像基于预先建立的模板库中所有样例图像的第一统计分布特征向量,包括:
获取所述待查询图像与所述模板库中每张样例图像的视觉相似度,得到Q个二元组,每一二元组包括:样例图像标识和该样例图像对应的视觉相似度;
根据预设的视觉相似度的阈值,从Q个二元组中筛选出Q’个二元组,Q和Q’均为大于1的自然数;
采用构建的第一向量和第二向量对Q’个二元组进行统计,根据统计结果生成第一统计分布特征向量;
其中,所述第一向量为各维度初始化为0;
第二向量为各维度初始化为0;
所述第一向量的维度和第二向量的维度相同,且与所述模板库中所有样例图像对应的类别数量匹配。
5.根据权利要求1所述的方法,其特征在于,获取目标图像库中每一图像基于所述模板库中所有样例图像的第二统计分布特征向量,包括:
获取所述目标图像库中每一图像与所述模板库中每张样例图像的视觉相似度,获得每一图像的Q个二元组,每一二元组包括:样例图像标识和该样例图像对应的视觉相似度;
根据预设的视觉相似度的阈值,从每一图像对应的所有二元组中筛选出R个二元组,R为大于1的自然数;
采用构建的第一向量和第二向量对R个二元组进行统计,根据统计结果生成该图像的第二统计分布特征向量;
其中,所述第一向量为各维度初始化为0;
第二向量为各维度初始化为0;
所述第一向量的维度和第二向量的维度相同,且与所述模板库中所有样例图像对应的类别数量匹配。
6.根据权利要求4或5所述的方法,其特征在于,所述根据统计结果生成第一统计分布特征向量,包括:
将统计有Q’个二元组的第一向量的每个维度除以统计有Q’个二元组的第二向量中对应维度值的开方,获得第一统计分布特征向量;
或者,
根据统计结果生成第二统计分布特征向量,包括:
将统计有R个二元组的第一向量的每个维度除以统计有R个二元组的第二向量中对应维度值的开方,获得第二统计分布特征向量。
7.一种车辆检索中的重排序装置,其特征在于,包括:
统计分布特征向量获取单元,用于获取待查询图像基于预先建立的模板库中所有样例图像的第一统计分布特征向量,以及获取目标图像库中每一图像基于所述模板库中所有样例图像的第二统计分布特征向量;
初始检索结果序列获取单元,用于获取所述目标图像库中部分图像排序的初始检索结果序列,所述初始检索结果序列是按照所述待查询图像与所述目标图像库中每一图像的第一相似度的大小排序的;
第二相似度确定单元,用于根据所述第一统计分布特征向量和所述初始检索结果序列中的每一图像的第二统计分布特征向量,确定所述待查询图像与所述初始检索结果序列中每一图像的第二相似度;
第三相似度确定单元,用于根据所述初始检索结果序列中每一图像与所述待查询图像的第一相似度和第二相似度,确定所述初始检索结果序列中每一图像与所述待查询图像的第三相似度;
目标检索结果序列获取单元,用于将所述初始检索结果序列中的所有图像按照所述第三相似度的大小重新排序,获取重排序的目标检索结果序列。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括:
模板库建立单元,用于对筛选后的样例图像进行聚类处理,建立包括部分样例图像的模板库,所述模板库中的样例图像均不重复。
9.根据权利要求7所述的装置,其特征在于,统计分布特征向量获取单元,具体用于
获取所述待查询图像与所述模板库中每张样例图像的视觉相似度,得到Q个二元组,每一二元组包括:样例图像标识和该样例图像对应的视觉相似度;
根据预设的视觉相似度的阈值,从Q个二元组中筛选出Q’个二元组,Q和Q’均为大于1的自然数;
采用构建的第一向量和第二向量对Q’个二元组进行统计,根据统计结果生成第一统计分布特征向量;
以及,
获取所述目标图像库中每一图像与所述模板库中每张样例图像的视觉相似度,获得每一图像的Q个二元组,每一二元组包括:样例图像标识和该样例图像对应的视觉相似度;
根据预设的视觉相似度的阈值,从每一图像对应的所有二元组中筛选出R个二元组,R为大于1的自然数;
采用构建的第一向量和第二向量对R个二元组进行统计,根据统计结果生成该图像的第二统计分布特征向量;
其中,所述第一向量为各维度初始化为0;
第二向量为各维度初始化为0;
所述第一向量的维度和第二向量的维度相同,且与所述模板库中所有样例图像对应的类别数量匹配。
10.一种车辆检索方法,其特征在于,包括:
根据权利要求1至6任一所述的方法获取待查询图像的目标检索结果序列;
根据所述目标检索结果序列,确定与所述待查询图像相似的目标图像。
CN201510115124.9A 2015-03-16 2015-03-16 一种车辆检索中的重排序方法及装置 Active CN106033549B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510115124.9A CN106033549B (zh) 2015-03-16 2015-03-16 一种车辆检索中的重排序方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510115124.9A CN106033549B (zh) 2015-03-16 2015-03-16 一种车辆检索中的重排序方法及装置

Publications (2)

Publication Number Publication Date
CN106033549A true CN106033549A (zh) 2016-10-19
CN106033549B CN106033549B (zh) 2019-05-07

Family

ID=57150935

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510115124.9A Active CN106033549B (zh) 2015-03-16 2015-03-16 一种车辆检索中的重排序方法及装置

Country Status (1)

Country Link
CN (1) CN106033549B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110555471A (zh) * 2019-08-26 2019-12-10 珠海格力电器股份有限公司 一种移动终端及目标物的搜寻方法
CN110674331A (zh) * 2018-06-15 2020-01-10 华为技术有限公司 信息处理方法、相关设备及计算机存储介质
CN110766077A (zh) * 2019-10-24 2020-02-07 上海眼控科技股份有限公司 证据链图像中特写图筛选方法、装置和设备
CN110992300A (zh) * 2018-09-29 2020-04-10 北京国双科技有限公司 图像检测方法及装置
CN111651624A (zh) * 2020-06-11 2020-09-11 浙江大华技术股份有限公司 一种图像检索方法及装置
CN112307239A (zh) * 2020-10-29 2021-02-02 泰康保险集团股份有限公司 一种图像检索方法、装置、介质和设备
CN112417197A (zh) * 2020-12-02 2021-02-26 云从科技集团股份有限公司 一种排序方法、装置、机器可读介质及设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100080470A1 (en) * 2008-09-30 2010-04-01 International Business Machines Corporation Tagging images by determining a set of similar pre-tagged images and extracting prominent tags from that set
CN102867192A (zh) * 2012-09-04 2013-01-09 北京航空航天大学 一种基于监督测地线传播的场景语义迁移方法
CN103440646A (zh) * 2013-08-19 2013-12-11 成都品果科技有限公司 用于颜色分布和纹理分布图像检索的相似度获取方法
CN103970771A (zh) * 2013-01-29 2014-08-06 中国科学院计算技术研究所 一种人体的检索方法和系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100080470A1 (en) * 2008-09-30 2010-04-01 International Business Machines Corporation Tagging images by determining a set of similar pre-tagged images and extracting prominent tags from that set
CN102867192A (zh) * 2012-09-04 2013-01-09 北京航空航天大学 一种基于监督测地线传播的场景语义迁移方法
CN103970771A (zh) * 2013-01-29 2014-08-06 中国科学院计算技术研究所 一种人体的检索方法和系统
CN103440646A (zh) * 2013-08-19 2013-12-11 成都品果科技有限公司 用于颜色分布和纹理分布图像检索的相似度获取方法

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110674331A (zh) * 2018-06-15 2020-01-10 华为技术有限公司 信息处理方法、相关设备及计算机存储介质
US11734341B2 (en) 2018-06-15 2023-08-22 Huawei Technologies Co., Ltd. Information processing method, related device, and computer storage medium
CN110992300A (zh) * 2018-09-29 2020-04-10 北京国双科技有限公司 图像检测方法及装置
CN110992300B (zh) * 2018-09-29 2023-04-07 北京国双科技有限公司 图像检测方法及装置
CN110555471A (zh) * 2019-08-26 2019-12-10 珠海格力电器股份有限公司 一种移动终端及目标物的搜寻方法
CN110766077A (zh) * 2019-10-24 2020-02-07 上海眼控科技股份有限公司 证据链图像中特写图筛选方法、装置和设备
CN111651624A (zh) * 2020-06-11 2020-09-11 浙江大华技术股份有限公司 一种图像检索方法及装置
CN111651624B (zh) * 2020-06-11 2023-09-19 浙江大华技术股份有限公司 一种图像检索方法及装置
CN112307239A (zh) * 2020-10-29 2021-02-02 泰康保险集团股份有限公司 一种图像检索方法、装置、介质和设备
CN112307239B (zh) * 2020-10-29 2024-02-02 泰康保险集团股份有限公司 一种图像检索方法、装置、介质和设备
CN112417197A (zh) * 2020-12-02 2021-02-26 云从科技集团股份有限公司 一种排序方法、装置、机器可读介质及设备

Also Published As

Publication number Publication date
CN106033549B (zh) 2019-05-07

Similar Documents

Publication Publication Date Title
CN106033549A (zh) 一种车辆检索中的重排序方法及装置
CN106033443A (zh) 一种车辆检索中的扩展查询方法及装置
Li et al. Deep joint discriminative learning for vehicle re-identification and retrieval
Dev et al. Categorization of cloud image patches using an improved texton-based approach
JP4990383B2 (ja) 画像グループの表現方法、画像グループの探索方法、装置、コンピュータ読み取り可能な記憶媒体およびコンピュータシステム
CN105809146B (zh) 一种图像场景识别方法和装置
CN104933420B (zh) 一种场景图像识别方法和场景图像识别设备
CN103325122B (zh) 基于双向排序的行人检索方法
CN105320705A (zh) 相似车辆的检索方法及装置
CN105320923A (zh) 车型识别方法及装置
CN109299668A (zh) 一种基于主动学习和聚类分析的高光谱图像分类方法
CN103839078A (zh) 一种基于主动学习的高光谱图像分类方法
CN110188217A (zh) 图像查重方法、装置、设备和计算机可读储存介质
CN103678558A (zh) 基于sift特征的嫌疑车辆检索方法
CN103390165A (zh) 一种图片聚类的方法及装置
CN108764302A (zh) 一种基于颜色特征和词袋特征的票据图像分类方法
CN104537356A (zh) 利用瑞士轮排序进行步态识别的行人再标识方法和装置
CN104008404B (zh) 一种基于显著直方图特征的行人检测方法及系统
CN111651624A (zh) 一种图像检索方法及装置
Reta et al. Color uniformity descriptor: An efficient contextual color representation for image indexing and retrieval
CN102567738A (zh) 基于高斯分布的色情视频快速检测方法
Le et al. Document retrieval based on logo spotting using key-point matching
CN113313110B (zh) 一种车牌类型识别模型构建及车牌类型识别方法
CN104253981A (zh) 一种用于视频侦查的运动目标按颜色排序的方法
Steel The mask-SIFT cascading classifier for pornography detection

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant