CN108985190B - 目标识别方法和装置、电子设备、存储介质 - Google Patents
目标识别方法和装置、电子设备、存储介质 Download PDFInfo
- Publication number
- CN108985190B CN108985190B CN201810689610.5A CN201810689610A CN108985190B CN 108985190 B CN108985190 B CN 108985190B CN 201810689610 A CN201810689610 A CN 201810689610A CN 108985190 B CN108985190 B CN 108985190B
- Authority
- CN
- China
- Prior art keywords
- image
- similarity
- sample
- target
- query
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 79
- 238000013528 artificial neural network Methods 0.000 claims description 83
- 238000012549 training Methods 0.000 claims description 26
- 238000012216 screening Methods 0.000 claims description 24
- 238000012545 processing Methods 0.000 claims description 22
- 230000004927 fusion Effects 0.000 claims description 20
- 238000005457 optimization Methods 0.000 claims description 18
- 238000004891 communication Methods 0.000 claims description 14
- 238000010606 normalization Methods 0.000 claims description 14
- 238000012546 transfer Methods 0.000 claims description 13
- 238000013527 convolutional neural network Methods 0.000 claims description 8
- 230000008569 process Effects 0.000 claims description 7
- 239000000523 sample Substances 0.000 description 191
- 239000013598 vector Substances 0.000 description 11
- 238000010586 diagram Methods 0.000 description 10
- 238000004590 computer program Methods 0.000 description 8
- 238000000605 extraction Methods 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/103—Static body considered as a whole, e.g. static pedestrian or occupant recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请实施例公开了一种目标识别方法和装置、电子设备、存储介质,其中,方法包括:获取查询图像和图像集,其中,所述图像集中包括至少两个图像;确定所述查询图像与所述图像集中各图像的初始相似度;获取所述图像集中各图像之间的相似度;根据所述图像集中各图像之间的相似度优化所述初始相似度,获得所述查询图像与所述图像集中的各个图像之间的目标相似度;根据所述目标相似度,获得与所述查询图像之间的目标相似度达到预设条件的至少一个目标图像。本实施例充分利用了图像集中各图像的相似度,能获得更全面的查询结果,准确性更高。
Description
技术领域
本申请涉及计算机视觉技术,尤其是一种目标识别方法和装置、电子设备、存储介质。
背景技术
行人再识别任务指给出一个行人的查询图片(probe image),需要在一个大规模的数据集(画廊集,gallery set)中寻找到属于同一个行人的所有图片。但是大多数行人再识别技术只关注某个查询图片与画廊图片之间的关系,损失了大量的信息,使得重识别的准确度较低。
发明内容
本申请实施例提供的一种目标识别技术。
根据本申请实施例的一个方面,提供的一种目标识别方法,包括:
获取查询图像和图像集,其中,所述图像集中包括至少两个图像;
确定所述查询图像与所述图像集中各图像的初始相似度;
获取所述图像集中各图像之间的相似度;
根据所述图像集中各图像之间的相似度优化所述初始相似度,获得所述查询图像与所述图像集中的各个图像之间的目标相似度;
根据所述目标相似度,获得与所述查询图像之间的目标相似度达到预设条件的至少一个目标图像。
可选地,所述确定所述查询图像与所述图像集中各图像的初始相似度,包括:
通过第一神经网络确定所述查询图像与所述图像集中各图像的初始相似度。
可选地,所述第一神经网络执行的操作包括:
利用预定卷积神经网络分别对所述查询图像与所述图像集中各图像进行特征提取,得到所述查询图像的查询特征和所述图像集中各图像的图像特征;
基于所述查询特征与各个所述图像特征获得所述查询图像与所述图像集中各图像的初始相似度。
可选地,所述基于所述查询特征与所述各个图像特征获得所述查询图像与所述图像集中各图像的初始相似度,包括:
获取所述查询特征与所述图像特征之间的差值特征,并将所述差值特征作为所述查询图像与所述图像集中各图像之间的初始相似度。
可选地,在所述获取所述查询特征与所述图像特征之间的差值特征之后,还包括:
将所述差值特征依次经过平方运算和归一化处理,得到处理结果,并将所述处理结果作为所述查询图像与所述图像集中各图像之间的初始相似度。
可选地,所述确定所述查询图像与所述图像集中各图像的初始相似度之后,还包括:
基于所述初始相似度对所述图像集中的图像进行筛选,得到预设数量的图像构成图像子集;
所述获取所述图像集中各图像之间的相似度,包括:
分别获取所述图像子集中各图像对应的图像特征;
根据所述图像特征确定所述图像子集中各图像之间的相似度。
可选地,所述根据所述图像集中各图像之间的相似度优化所述初始相似度,获得所述查询图像与所述图像集中的各个图像之间的目标相似度,包括:
基于第二神经网络根据所述图像集中各图像之间的相似度优化所述初始相似度,获得所述查询图像与所述图像集中的各个图像之间的目标相似度。
可选地,所述第二神经网络执行的操作,包括:
将所述查询图像与所述图像集中第一图像的初始相似度,作为第一初始相似度,将所述查询图像与所述图像集中第二图像的初始相似度,作为第二初始相似度;
基于至少一级信息传递神经网络获取所述第二初始相似度的深度信息;
获取所述第一图像与所述第二图像之间的相似度权重;
根据所述深度信息和所述相似度权重获取相似度偏差;
将所述第一初始相似度与所述相似度偏差进行加权融合,获得优化后的初始相似度;
将所述优化后的初始相似度作为所述查询图像与所述图像集中第一图像之间的目标相似度。
可选地,每级所述信息传递神经网络依次包括:全连接层、归一化层和ReLU层。
可选地,所述将所述第一初始相似度与所述相似度偏差进行加权融合,获得优化后的初始相似度之后,还包括:
将所述优化后的初始相似度作为第一初始相似度;
根据所述深度信息和所述相似度权重获取相似度偏差;
将所述第一初始相似度与所述相似度偏差进行加权融合,获得优化后的初始相似度;
判断是否达到设定条件,当达到设定条件,将所述优化后的初始相似度作为查询图像与所述图像集中第一图像之间的目标相似度;
当未达到设定条件,将所述优化后的初始相似度作为第一初始相似度。
可选地,所述获取所述第一图像与所述图像集中第二图像之间的相似度权重,包括:
计算所述第一图像与所述第二图像的相似度;
对所述第一图像与所述第二图像的相似度进行指数运算,得到第一结果;
对所有所述第一结果进行求和运算,得到第二结果;
将所述第一结果除以所述第二结果的商值作为所述相似度权重。
可选地,所述第二图像与所述第一图像的相似度大于或等于设定相似度。
可选地,所述基于第二神经网络根据所述图像集中各图像之间的相似度优化所述初始相似度,获得所述查询图像与所述图像集中的各个图像之间的目标相似度之前,还包括:
基于样本图像集训练所述第二神经网络;所述样本图像集包括第一样本图像集和第二样本图像集,所述第一样本图像集包括至少一个第一样本图像,所述第二样本图像集包括至少两个第二样本图像,每个所述第一样本图像对应至少两个第二样本图像,所述第一样本图像与其对应的所述第二样本图像对应同一目标。
可选地,所述基于样本图像集训练所述第二神经网络,包括:
将所述第一样本图像作为所述查询图像,所述第二样本图像集作为所述图像集;
确定所述第一样本图像与所述第二样本图像集中各第二样本图像的样本初始相似度,并获得所述第二样本图像集中各第二样本图像之间的样本相似度;
基于所述第二神经网络根据所述第二样本图像集中各第二样本图像之间的样本相似度优化所述样本初始相似度,获得所述第一样本图像与所述第二样本图像集中各第二样本图像之间的样本目标相似度;
基于所述样本目标相似度获得与所述第一样本图像之间的样本目标相似度达到预设条件的至少一个样本目标图像;
基于所述样本目标图像与所述第一样本图像对应相同目标的第二样本图像,调整所述第二神经网络的参数。
可选地,所述根据所述目标相似度,获得与所述查询图像之间的目标相似度达到预设条件的至少一个目标图像,包括:
对所述目标相似度进行筛选,获得至少一个大于预设值的所述目标相似度;
基于所述筛选获得的目标相似度获得对应的至少一个目标图像。
根据本申请实施例的另一个方面,提供的一种目标识别装置,包括:
图像获取单元,用于获取查询图像和图像集,其中,所述图像集中包括至少两个图像;
初始相似度单元,用于确定所述查询图像与所述图像集中各图像的初始相似度;
图像集相似度单元,用于获取所述图像集中各图像之间的相似度;
相似度优化单元,用于根据所述图像集中各图像之间的相似度优化所述初始相似度,获得所述查询图像与所述图像集中的各个图像之间的目标相似度;
目标获取单元,用于根据所述目标相似度,获得与所述查询图像之间的目标相似度达到预设条件的至少一个目标图像。
可选地,所述初始相似度单元,具体用于通过第一神经网络确定所述查询图像与所述图像集中各图像的初始相似度。
可选地,所述初始相似度单元通过第一神经网络执行的操作包括:
利用预定卷积神经网络分别对所述查询图像与所述图像集中各图像进行特征提取,得到所述查询图像的查询特征和所述图像集中各图像的图像特征;
基于所述查询特征与各个所述图像特征获得所述查询图像与所述图像集中各图像的初始相似度。
可选地,所述初始相似度单元,具体用于获取所述查询特征与所述图像特征之间的差值特征,并将所述差值特征作为所述查询图像与所述图像集中各图像之间的初始相似度。
可选地,所述初始相似度单元,还用于将所述差值特征依次经过平方运算和归一化处理,得到处理结果,并将所述处理结果作为所述查询图像与所述图像集中各图像之间的初始相似度。
可选地,还包括:
图像集筛选单元,用于基于所述初始相似度对所述图像集中的图像进行筛选,得到预设数量的图像构成图像子集;
所述图像集相似度单元,用于分别获取所述图像子集中各图像对应的图像特征;根据所述图像特征确定所述图像子集中各图像之间的相似度。
可选地,所述相似度优化单元,具体用于基于第二神经网络根据所述图像集中各图像之间的相似度优化所述初始相似度,获得所述查询图像与所述图像集中的各个图像之间的目标相似度。
可选地,所述相似度优化单元通过第二神经网络执行的操作,包括:
将所述查询图像与所述图像集中第一图像的初始相似度,作为第一初始相似度,将所述查询图像与所述图像集中第二图像的初始相似度,作为第二初始相似度;
基于至少一级信息传递神经网络获取所述第二初始相似度的深度信息;
获取所述第一图像与所述第二图像之间的相似度权重;
根据所述深度信息和所述相似度权重获取相似度偏差;
将所述第一初始相似度与所述相似度偏差进行加权融合,获得优化后的初始相似度;
将所述优化后的初始相似度作为查询图像与所述图像集中第一图像之间的目标相似度。
可选地,每级所述信息传递神经网络依次包括:全连接层、归一化层和ReLU层。
可选地,所述相似度优化单元将所述第一初始相似度与所述相似度偏差进行加权融合,获得优化后的初始相似度之后,还用于将所述优化后的初始相似度作为第一初始相似度;根据所述深度信息和所述相似度权重获取相似度偏差;将所述第一初始相似度与所述相似度偏差进行加权融合,获得优化后的初始相似度;判断是否达到设定条件,当达到设定条件,将所述优化后的初始相似度作为查询图像与所述图像集中第一图像之间的目标相似度;当未达到设定条件,将所述优化后的初始相似度作为第一初始相似度。
可选地,所述相似度优化单元获取所述第一图像与所述图像集中第二图像之间的相似度权重时,具体用于计算所述第一图像与所述第二图像的相似度;对所述第一图像与所述第二图像的相似度进行指数运算,得到第一结果;对所有所述第一结果进行求和运算,得到第二结果;将所述第一结果除以所述第二结果的商值作为所述相似度权重。
可选地,所述第二图像与所述第一图像的相似度大于或等于设定相似度。
可选地,还包括:
训练单元,用于基于样本图像集训练所述第二神经网络;所述样本图像集包括第一样本图像集和第二样本图像集,所述第一样本图像集包括至少一个第一样本图像,所述第二样本图像集包括至少两个第二样本图像,每个所述第一样本图像对应至少两个第二样本图像,所述第一样本图像与其对应的所述第二样本图像对应同一目标。
可选地,所述训练单元,具体用于将所述第一样本图像作为所述查询图像,所述第二样本图像集作为所述图像集,确定所述第一样本图像与所述第二样本图像集中各第二样本图像的样本初始相似度,并获得所述第二样本图像集中各第二样本图像之间的样本相似度;基于所述第二神经网络根据所述第二样本图像集中各第二样本图像之间的样本相似度优化所述样本初始相似度,获得所述第一样本图像与所述第二样本图像集中各第二样本图像之间的样本目标相似度;基于所述样本目标相似度获得与所述第一样本图像之间的样本目标相似度达到预设条件的至少一个样本目标图像;基于所述样本目标图像与所述第一样本图像对应相同目标的第二样本图像,调整所述第二神经网络的参数。
可选地,所述目标获取单元,具体用于对所述目标相似度进行筛选,获得至少一个大于预设值的所述目标相似度;基于所述筛选获得的目标相似度获得对应的至少一个目标图像。
根据本申请实施例的另一个方面,提供的一种电子设备,包括处理器,所述处理器包括如上任意一项所述的目标识别装置。
根据本申请实施例的另一个方面,提供的一种电子设备,包括:存储器,用于存储可执行指令;
以及处理器,用于与所述存储器通信以执行所述可执行指令从而完成如上任意一项所述目标识别方法的操作。
根据本申请实施例的另一个方面,提供的一种计算机可读存储介质,用于存储计算机可读取的指令,所述指令被执行时执行如上任意一项所述目标识别方法的操作。
根据本申请实施例的另一个方面,提供的一种计算机程序产品,包括计算机可读代码,当所述计算机可读代码在设备上运行时,所述设备中的处理器执行用于实现如上任意一项所述目标识别方法的指令。
基于本申请上述实施例提供的一种目标识别方法和装置、电子设备、存储介质,获取查询图像和图像集,确定查询图像与图像集中各图像的初始相似度;获取图像集中各图像之间的相似度;根据图像集中各图像之间的相似度优化初始相似度,获得查询图像与图像集中的各个图像之间的目标相似度;根据目标相似度,获得与查询图像之间的目标相似度达到预设条件的至少一个目标图像,充分利用了图像集中各图像的相似度,能获得更全面的查询结果,准确性更高。
下面通过附图和实施例,对本申请的技术方案做进一步的详细描述。
附图说明
构成说明书的一部分的附图描述了本申请的实施例,并且连同描述一起用于解释本申请的原理。
参照附图,根据下面的详细描述,可以更加清楚地理解本申请,其中:
图1为本申请目标识别方法一个实施例的流程图。
图2为本申请目标识别方法一个具体示例中第一神经网络的结构示意图。
图3为本申请目标识别方法一个具体示例中信息传递网络的结构示意图。
图4为本申请目标识别方法一个具体示例中第二神经网络的结构示意图。
图5为本申请目标识别装置一个实施例的结构示意图。
图6为适于用来实现本申请实施例的终端设备或服务器的电子设备的结构示意图。
具体实施方式
现在将参照附图来详细描述本申请的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本申请的范围。
同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。
以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本申请及其应用或使用的任何限制。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
图1为本申请目标识别方法一个实施例的流程图。如图1所示,该实施例方法包括:
步骤110,获取查询图像和图像集。
行人重识别需要在大规模的图像集(画廊集,gallery set)中寻找到目标对象(同一个人),在本实施例中,可以将视频序列中的当前图像帧作为确定是否包含目标对象的查询图像,图像集中包括至少两个图像。
步骤120,确定查询图像与图像集中各图像的初始相似度。
在本实施例中,初始相似度可以通过图像间的特征确定,图像特征可以通过深度神经网络对图像进行特征提取获得,通过图像特征之间的距离(如欧式距离、余弦距离等)即可确定图像之间的相似度,也可以通过其他方式获得图像之间的相似度。在其他实施例中,还可以采用其他方式确定本实施例不做具体限定。
步骤130,获取图像集中各图像之间的相似度。
图像集中各图像之间的相似度可以通过各图像间的图像特征获得,图像特征可以通过深度神经网络对图像进行特征提取获得,通过图像特征之间的距离(如:欧式距离、余弦距离等)即可确定图像之间的相似度,也可以通过其他方式获得图像之间的相似度,本实施例对具体获得相似度的方式不做限定。
步骤140,根据图像集中各图像之间的相似度优化初始相似度,获得查询图像与图像集中的各个图像之间的目标相似度。
本实施例通过获取图像集中各图像之间的相似度来优化图像与查询图像之间的初始相似度,充分利用了图像集中各图像的相似度,能获得更全面的查询结果。
步骤150,根据目标相似度,获得与查询图像之间的目标相似度达到预设条件的至少一个目标图像。
本实施例中预设条件可以包括但不限于:选择目标相似度大于预设值的图像作为目标图像,或目标相似度按照从大到小排序后选择预设数量的图像作为目标图像,或从大于预设值的目标相似度中选择目标相似度最大的预设数量的图像作为目标相似度;通过预设条件的筛选即可获得与查询图像相似的目标图像,避免了基于初始相似度筛选目标图像而出现的遗漏相似图像的问题。
基于上述实施例提供的目标识别方法,获取查询图像和图像集,确定查询图像与图像集中各图像的初始相似度;获取图像集中各图像之间的相似度;根据图像集中各图像之间的相似度优化初始相似度,获得查询图像与图像集中的各个图像之间的目标相似度;根据目标相似度,获得与查询图像之间的目标相似度达到预设条件的至少一个目标图像,充分利用了图像集中各图像的相似度,能获得更全面的查询结果,准确性更高。
在一个或多个可选的实施例中,步骤120可以通过第一神经网络实现。
可选地,第一神经网络执行的操作包括:
利用预定卷积神经网络分别对查询图像与图像集中各图像进行特征提取,得到查询图像的查询特征和图像集中各图像的图像特征。
在本实施例中,采用基于Siamese ResNet-50的卷积神经网络分别对查询图像与图像集中各图像进行特征提取,在其他实施例中,还可以采用其他神经网络提取特征,在此不做赘述。
基于查询特征与各个图像特征获得查询图像与图像集中各图像的初始相似度。
可选地,获取查询特征与图像特征之间的差值特征,并将差值特征作为查询图像与图像集中各图像之间的初始相似度。
可选地,每个差值特征是查询特征与一个图像特征之间的差值特征(例如:当图像特征为特征向量时,该差值特征为差值向量)确定的。由于图像特征通常为向量或特征图,因此该差值可以是通过逐位相减获得。除了基于差值特征外,还可以通过其他方式获得初始相似度,本实施例仅为本领域技术人员提供一种可实现的获取初始相似度的方式,以易于理解,并不用于限制本申请获取初始相似度的方式。
可选地,在获取查询特征与图像特征之间的差值特征之后,还包括:
将差值特征依次经过平方运算和归一化处理,得到处理结果,并将处理结果作为查询图像与图像集中各图像之间的初始相似度。
图2为本申请目标识别方法一个具体示例中第一神经网络的结构示意图。如图2所示,本示例中基于ImageNet上pretrain的Siamese ResNet-50作为特征提取网络(预定卷积神经网络),通过对查询图像(probe,探针)对应的特征和图像集(gallery,画廊)中图像对应的特征相减,得到差值特征(或关系特征),将得到的差值特征经过平方和归一化处理后得到第i查询图像与画廊图像的相似度f(di)。
在一个或多个可选的实施例中,步骤120之后,还可以包括:
基于初始相似度对图像集中的图像进行筛选,得到预设数量的图像构成图像子集。
由于图像集中的图像数量巨大,如果基于图像集中所有图像之间的相似度优化初始相似度,将导致识别的速度过慢,因此,在步骤130之前通过初始相似度从图像集中筛选获得预设数量的图像构成图像子集,以提高运算效率。
在一个或多个可选的实施例中,步骤130获取图像集中各图像之间的相似度可以包括:
(1)分别获取图像子集中各图像对应的图像特征;
图像子集是从图像集中筛选获得的,图像子集中的图像都属于图像集,因此,图像子集中各图像之间的相似度同样可以通过各图像间的图像特征获得,图像特征可以通过深度神经网络对图像进行特征提取获得。
(2)根据图像特征确定图像子集中各图像之间的相似度。
具体地,可通过差值特征获得查询图像与图像集中各图像之间的相似度;按照相似度由大到小的顺序从图像集中筛选获得预设数量的图像。即按照相似度由大到小按序获得预设数量的图像构成图像子集,此时图像子集中所有的图像相对来说都是与查询图像比较相似的图像,提高了识别效率。
在一个或多个可选的实施例中,步骤140可以通过第二神经网络实现。
可选地,第二神经网络执行的操作,包括:
(1)将查询图像与图像集中第一图像的初始相似度,作为第一初始相似度,将查询图像与图像集中第二图像的初始相似度,作为第二初始相似度;
(2)基于至少一级信息传递神经网络获取第二初始相似度的深度信息;
可选地,每级信息传递神经网络依次包括:全连接层、归一化层和ReLU层。
图3为本申请目标识别方法一个具体示例中消息网络(message net)的结构示意图。如图3所示,本实施例中包括两级信息传递网络,每级信息传递网络包括全连接层(fully connected layers,FC)、归一化层(Batch Normalization,BN)、激活层(ReLU)等,通过全连接层对相邻样本差值特征增加参数,可获得更好的训练效果。
(3)获取第一图像与第二图像之间的相似度权重;
(4)根据深度信息和相似度权重获取相似度偏差;
(5)将第一初始相似度与相似度偏差进行加权融合,获得优化后的初始相似度;
(6)将优化后的初始相似度作为查询图像与图像集中第一图像之间的目标相似度。
具体地,本实施例中计算目标相似度可以基于公式(1)获得:
其中,表示第一图像的目标相似度,(1-α)表示第一初始相似度对应的权重值,α表示相似度偏差对应的权重值,表示第一图像的第一初始相似度,表示第二初始相似度的深度信息,Wij表示第一图像与图像集中第二图像之间的相似度权重,i=1,2,…N,j=1,2,…N,N为正整数。
可选地,获取第一图像与第二图像之间的相似度权重可以包括:
计算第一图像与第二图像的相似度;
对第一图像与第二图像的相似度进行指数运算,得到第一结果;
对所有第一结果进行求和运算,得到第二结果;
将第一结果除以第二结果的商值作为相似度权重。
具体可基于以下公式(2)计算获得相似度权重Wij:
其中,S(gi,gj)表示第i图像与第j图像的相似度,exp(S(gi,gj))表示基于第i图像与第j图像获得的第一结果,∑jexp(S(gi,gj))表示对所有i≠j的情况下获得的第一结果的和,即第二结果。当i=j时,相似度权重为0。
可选地,第二图像与第一图像的相似度大于或等于设定相似度。
基于第一图像对应的第一初始相似度优化第二图像对应的第二初始相似度并不是随机选择的第一图像,而是选择与第二图像之间相似度大于或等于设定相似度的第一图像对第二图像的第二初始相似度进行优化,例如:第二图像一个人的背面图,第一图像是与其相似的是这个人的侧面图,查询图像是这个人的正面图,直接计算获得的第二图像与查询图像之间的相似度通常不能将第二图像获取为目标图像,而第一图像与查询图像相似度较大,与第二图像的相似度也较大,通过第一图像的第一初始相似度将第二初始相似度优化后,即可将第二图像识别为目标图像。
可选地,将第一初始相似度与相似度偏差进行加权融合,获得优化后的初始相似度之后,还包括:
将优化后的初始相似度作为第一初始相似度;
根据深度信息和相似度权重获取相似度偏差;
将第一初始相似度与相似度偏差进行加权融合,获得优化后的初始相似度;
判断是否达到设定条件,当达到设定条件,将优化后的初始相似度作为查询图像与图像集中第一图像之间的目标相似度;
当未达到设定条件,将优化后的初始相似度作为第第一初始相似度,继续迭代执行上述加权融合。
本实施例中,通过多次迭代对第一图像对应的第一初始相似度进行优化,预设条件可以是预设的迭代次数,当达到预设的迭代次数时,停止优化;或者,预设条件是当优化后的初始相似度达到收敛(调整变化率小于一定值),当优化后的初始相似度收敛时,停止调整。
具体通过迭代的方式计算优化后的初始相似度的过程,可以基于公式(3)获得:
其中,表示第i节点的第t+1次调整得到的优化后的初始相似度,(1-α)表示第一初始相似度对应的权重值,α表示相似度偏差对应的权重值,表示第i节点的第t次优化得到的第一初始相似度,表示深度信息,Wij表示第一图像与图像集中第二图像之间的相似度权重,其中,与第i节点相邻的节点为第j节点,j=1,2,…N。
图4为本申请目标识别方法一个具体示例中第二神经网络的结构示意图。如图4所示,和表示图像集中的第一图像对应的第一初始相似度,经至少一级信息传递神经网络获得第一初始相似度的深度信息和将获得的深度信息结合对应的相似度权重获取相似度偏差,即公式(3)中的获得相似度权重Wij之后即可利用上述公式(3),将第二图像对应的初始相似度与相似度偏差加权融合,获得优化后的优化后的相似度作为查询图像与图像集中图像之间的目标相似度。
可选地,还可以将初始相似度(差值特征)作为节点,将至少两个初始相似度对应的至少两个图像特征之间的相似度作为边,建模一个图,图中每两个节点之间通过边连接;
基于边的长度由小到大获取节点对应的至少一个相邻节点;基于至少一个相邻节点优化节点对应的初始相似度;将优化后的初始相似度作为查询图像与图像集中图像之间的目标相似度。
本实施例通过基于差值特征和图像特征之间的相似度建立一个图,该图由节点和边构成,两个图像特征之间的相似度越大,其边的长度越短,即两个图像特征之间越相似其在图中的位置越近;通过边实现节点之间的信息传递,以实现对差值特征进行调整;通常基于距离节点较近(边的长度较小)的相邻节点对该节点进行调整。
在一个或多个可选的实施例中,步骤150可以包括:
对目标相似度进行筛选,获得至少一个大于预设值的目标相似度;
基于筛选获得的目标相似度获得对应的至少一个目标图像。
通过目标相似度,即可确定哪些图像与查询图像更相似,当达到预设条件(例如:相似度大于设定值或相似度最大的预设个数),确定这些图像为查询图像的目标图像,可以认为这些图像与查询图像对应同一个目标(例如:人),即实现了目标的识别。
在一个或多个可选的实施例中,本实施例方法利用目标识别网络实现,在执行步骤110之前,本实施例方法还可以包括:
基于样本图像集训练目标识别网络。
样本图像集包括至少两个样本图像和对应样本图像的至少两个相似图像,每个样本图像及其对应的至少一个标注相似图像对应同一目标。
为了提高目标识别网络的准确率,在应用目标识别网络进行预测前,需要根据具体任务对目标识别网络进行训练,本实施例中的任务是为查询图像从图像集中识别获得相似图像,因此,基于相似图像的样本图像对目标识别网络进行训练。
可选地,基于样本图像集训练目标识别网络之前,还包括:
基于至少两个目标从样本图像集中获取至少两个样本图像及其对应的至少两个标注相似图像,获得样本图像子集。
本实施例采用了一种特殊的采样方式来生成样本对:假设每个训练批有256个样本,本实施例将随机挑选64个人(目标),每个人随机挑选4张图,组成这个训练批(图像子集);在每个人的4张样本图像中,随机挑出一张作为训练中的探针(样本图像probe,或者称query)图片,另外3张作为标注相似图像构成图像集(gallery,画廊)。
基于上述实施例的例子得到训练子集,可以得到共64张probe和192张gallery,probe和gallery之间的相似度有64x192个,gallery之间的相似度为192x192个,相似度可以由深度神经图网络的分类器得到。将所有差值特征基于gallery之间的相似度构建图,便可以应用图信息传递(graph message passing)来改善probe和gallery之间的差值特征,图上的节点(node)的输入特征向量可由probe与gallery之间的差值特征得到,差值特征由两者的特征向量输入到一个关系子模块得到。
可选地,基于样本图像集训练目标识别网络,包括:
经目标识别网络对样本图像子集中的各样本图像及其对应的至少两个标注相似图像进行处理,得到各样本图像对应的至少一个预测相似图像;
基于预测相似图像和标注相似图像训练目标识别网络。
可选地,基于样本图像获得至少一个预测相似图像可通过一个概率向量进行表达,其中概率值最大的表示与样本图像越相似,标注相似图像同样基于一个概率向量表达,基于两个概率向量的差值通过损失函数可获得损失,基于该损失训练目标识别网络。
除了上述实施例中提供的通过样本图像训练目标识别网络之外,还可以仅对目标识别网络中的部分进行训练,此时假设目标识别网络中的其他部分已经完成训练(单独训练或在目标识别网络中共同训练),此时,在一个或多个可选的是实施例中,在基于第二神经网络根据图像集中各图像之间的相似度优化初始相似度,获得查询图像与图像集中的各个图像之间的目标相似度之前,还包括:
基于样本图像集训练第二神经网络。
为了提高第二神经网络的优化效果,本实施例通过样本图像集对第二神经网络进行训练,虽然是对第二神经网络进行训练,但由于样本图像集中的样本图像能标注的信息是相似图像,因此,样本图像集包括第一样本图像集和第二样本图像集,第一样本图像集包括至少一个第一样本图像,第二样本图像集包括至少两个第二样本图像,每个第一样本图像对应至少两个第二样本图像,第一样本图像与其对应的所述第二样本图像对应同一目标。将第一样本图像集中的图像作为获取查询图像,将第二样本图像集作为被查询的图像集。
可选地,基于样本图像集训练第二神经网络,包括:
将第一样本图像作为查询图像,第二样本图像集作为图像集,
确定第一样本图像与第二样本图像集中各第二样本图像的样本初始相似度,并获得第二样本图像集中各第二样本图像之间的样本相似度;
基于第二神经网络根据第二样本图像集中各第二样本图像之间的样本相似度优化样本初始相似度,获得第一样本图像与第二样本图像集中各第二样本图像之间的样本目标相似度;
基于样本目标相似度获得与第一样本图像之间的样本目标相似度达到预设条件的至少一个样本目标图像;
基于样本目标图像与第一样本图像对应相同目标的第二样本图像,调整第二神经网络的参数。
对第二神经网络的训练的过程,与目标识别过程类似,通过第一神经网络和第二神经网络获得样本目标图像,再基于样本目标图像与第一样本图像对应相同目标的第二样本图像获得损失,通过损失反向传播而训练第二神经网络中的参数,训练后的第二神经网络能够更好的优化图像的初始相似度。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
图5为本申请目标识别装置一个实施例的结构示意图。该实施例的装置可用于实现本申请上述各方法实施例。如图5所示,该实施例的装置包括:
图像获取单元51,用于获取查询图像和图像集。
行人重识别需要在大规模的图像集(画廊集,gallery set)中寻找到目标对象(同一个人),在本实施例中,可以将视频序列中的当前图像帧作为确定是否包含目标对象的查询图像,图像集中包括至少两个图像。
初始相似度单元52,用于确定查询图像与图像集中各图像的初始相似度。
在本实施例中,初始相似度可以通过图像间的特征确定,图像特征可以通过深度神经网络对图像进行特征提取获得,通过图像特征之间的距离(如欧式距离、余弦距离等)即可确定图像之间的相似度,也可以通过其他方式获得图像之间的相似度。在其他实施例中,还可以采用其他方式确定本实施例不做具体限定。
图像集相似度单元53,用于获取图像集中各图像之间的相似度。
图像集中各图像之间的相似度可以通过各图像间的图像特征获得,图像特征可以通过深度神经网络对图像进行特征提取获得,通过图像特征之间的距离(如:欧式距离、余弦距离等)即可确定图像之间的相似度,也可以通过其他方式获得图像之间的相似度,本实施例对具体获得相似度的方式不做限定。
相似度优化单元54,用于根据图像集中各图像之间的相似度优化初始相似度,获得查询图像与图像集中的各个图像之间的目标相似度。
本实施例通过获取图像集中各图像之间的相似度来优化图像与查询图像之间的初始相似度,充分利用了图像集中各图像的相似度,能获得更全面的查询结果。
目标获取单元55,用于根据目标相似度,获得与查询图像之间的目标相似度达到预设条件的至少一个目标图像。
本实施例中预设条件可以包括但不限于:选择目标相似度大于预设值的图像作为目标图像,或目标相似度按照从大到小排序后选择预设数量的图像作为目标图像,或从大于预设值的目标相似度中选择目标相似度最大的预设数量的图像作为目标相似度;通过预设条件的筛选即可获得与查询图像相似的目标图像,避免了基于初始相似度筛选目标图像而出现的遗漏相似图像的问题。
基于上述实施例提供的目标识别装置,充分利用了图像集中各图像的相似度,能获得更全面的查询结果,准确性更高。
在一个或多个可选的实施例中,初始相似度单元52,具体用于通过第一神经网络确定查询图像与图像集中各图像的初始相似度。
可选地,初始相似度单元通过第一神经网络执行的操作包括:
利用预定卷积神经网络分别对查询图像与图像集中各图像进行特征提取,得到查询图像的查询特征和图像集中各图像的图像特征;
基于查询特征与各个图像特征获得查询图像与图像集中各图像的初始相似度。
可选地,初始相似度单元52,具体用于获取查询特征与图像特征之间的差值特征,并将差值特征作为查询图像与图像集中各图像之间的初始相似度。
可选地,每个差值特征是查询特征与一个图像特征之间的差值特征(例如:当图像特征为特征向量时,该差值特征为差值向量)确定的。由于图像特征通常为向量或特征图,因此该差值可以是通过逐位相减获得。除了基于差值特征外,还可以通过其他方式获得初始相似度,本实施例仅为本领域技术人员提供一种可实现的获取初始相似度的方式,以易于理解,并不用于限制本申请获取初始相似度的方式。
可选地,初始相似度单元52,还用于将差值特征依次经过平方运算和归一化处理,得到处理结果,并将处理结果作为查询图像与图像集中各图像之间的初始相似度。
在一个或多个可选的实施例中,还包括:
图像集筛选单元,用于基于初始相似度对图像集中的图像进行筛选,得到预设数量的图像构成图像子集;
图像集相似度单元53,用于分别获取图像子集中各图像对应的图像特征;根据图像特征确定图像子集中各图像之间的相似度。
由于图像集中的图像数量巨大,如果基于图像集中所有图像之间的相似度优化初始相似度,将导致识别的速度过慢,因此,在确定图像集中各图像之间的相似度之前通过初始相似度从图像集中筛选获得预设数量的图像构成图像子集,以提高运算效率。
可选地,相似度优化单元54,具体用于基于第二神经网络根据图像集中各图像之间的相似度优化初始相似度,获得查询图像与图像集中的各个图像之间的目标相似度。
可选地,相似度优化单元通过第二神经网络执行的操作,包括:
将查询图像与图像集中第一图像的初始相似度,作为第一初始相似度,将查询图像与图像集中第二图像的初始相似度,作为第二初始相似度;
基于至少一级信息传递神经网络获取第二初始相似度的深度信息;
获取第一图像与第二图像之间的相似度权重;
根据深度信息和相似度权重获取相似度偏差;
将第一初始相似度与相似度偏差进行加权融合,获得优化后的初始相似度;
将优化后的初始相似度作为查询图像与图像集中第一图像之间的目标相似度。
本实施例中的目标相似度可基于上述公式(1)计算获得。
可选地,每级信息传递神经网络依次包括:全连接层、归一化层和ReLU层。
可选地,相似度优化单元54将第一初始相似度与相似度偏差进行加权融合,获得优化后的初始相似度之后,还用于将优化后的初始相似度作为第一初始相似度;根据深度信息和相似度权重获取相似度偏差;将第一初始相似度与相似度偏差进行加权融合,获得优化后的初始相似度;判断是否达到设定条件,当达到设定条件,将优化后的初始相似度作为查询图像与图像集中第一图像之间的目标相似度;当未达到设定条件,将优化后的初始相似度作为第一初始相似度,继续迭代执行上述加权融合。
本实施例中,通过多次迭代对第一图像对应的第一初始相似度进行优化,预设条件可以是预设的迭代次数,当达到预设的迭代次数时,停止优化;或者,预设条件是当优化后的初始相似度达到收敛(调整变化率小于一定值),当优化后的初始相似度收敛时,停止调整。
可选地,相似度优化单元54获取第一图像与图像集中第二图像之间的相似度权重时,具体用于计算第一图像与第二图像的相似度;对第一图像与第二图像的相似度进行指数运算,得到第一结果;对所有第一结果进行求和运算,得到第二结果;将第一结果除以第二结果的商值作为相似度权重。
可选地,第二图像与第一图像的相似度大于或等于设定相似度。
在一个或多个可选的实施例中,还包括:
训练单元,用于基于样本图像集训练第二神经网络。
为了提高第二神经网络的优化效果,本实施例通过样本图像集对第二神经网络进行训练,虽然是对第二神经网络进行训练,但由于样本图像集中的样本图像能标注的信息是相似图像,因此,样本图像集包括第一样本图像集和第二样本图像集,第一样本图像集包括至少一个第一样本图像,第二样本图像集包括至少两个第二样本图像,每个第一样本图像对应至少两个第二样本图像,第一样本图像与其对应的所述第二样本图像对应同一目标。将第一样本图像集中的图像作为获取查询图像,将第二样本图像集作为被查询的图像集。
可选地,训练单元,具体用于将第一样本图像作为查询图像,第二样本图像集作为图像集,确定第一样本图像与第二样本图像集中各第二样本图像的样本初始相似度,并获得第二样本图像集中各第二样本图像之间的样本相似度;基于第二神经网络根据第二样本图像集中各第二样本图像之间的样本相似度优化样本初始相似度,获得第一样本图像与第二样本图像集中各第二样本图像之间的样本目标相似度;基于样本目标相似度获得与第一样本图像之间的样本目标相似度达到预设条件的至少一个样本目标图像;基于样本目标图像与第一样本图像对应相同目标的第二样本图像,调整第二神经网络的参数。
在一个或多个可选的实施例中,目标获取单元55,具体用于对目标相似度进行筛选,获得至少一个大于预设值的目标相似度;基于筛选获得的目标相似度获得对应的至少一个目标图像。
通过目标相似度,即可确定哪些图像与查询图像更相似,当达到预设条件(例如:相似度大于设定值或相似度最大的预设个数),确定这些图像为查询图像的目标图像,可以认为这些图像与查询图像对应同一个目标(例如:人),即实现了目标的识别。
根据本申请实施例的另一个方面,提供的一种电子设备,包括处理器,该处理器包括如上任意一项所述的目标识别装置。
根据本申请实施例的另一个方面,提供的一种电子设备,包括:存储器,用于存储可执行指令;
以及处理器,用于与该存储器通信以执行所述可执行指令从而完成如上任意一项所述目标识别方法的操作。
本发明实施例还提供了一种电子设备,例如可以是移动终端、个人计算机(PC)、平板电脑、服务器等。下面参考图6,其示出了适于用来实现本申请实施例的终端设备或服务器的电子设备600的结构示意图:如图6所示,电子设备600包括一个或多个处理器、通信部等,所述一个或多个处理器例如:一个或多个中央处理单元(CPU)601,和/或一个或多个图像处理器(GPU)613等,处理器可以根据存储在只读存储器(ROM)602中的可执行指令或者从存储部分608加载到随机访问存储器(RAM)603中的可执行指令而执行各种适当的动作和处理。通信部612可包括但不限于网卡,所述网卡可包括但不限于IB(Infiniband)网卡,
处理器可与只读存储器602和/或随机访问存储器603中通信以执行可执行指令,通过总线604与通信部612相连、并经通信部612与其他目标设备通信,从而完成本申请实施例提供的任一项方法对应的操作,例如,获取查询图像和图像集,确定查询图像与图像集中各图像的初始相似度;获取图像集中各图像之间的相似度;根据图像集中各图像之间的相似度优化初始相似度,获得查询图像与图像集中的各个图像之间的目标相似度;根据目标相似度,获得与查询图像之间的目标相似度达到预设条件的至少一个目标图像。
此外,在RAM 603中,还可存储有装置操作所需的各种程序和数据。CPU601、ROM602以及RAM603通过总线604彼此相连。在有RAM603的情况下,ROM602为可选模块。RAM603存储可执行指令,或在运行时向ROM602中写入可执行指令,可执行指令使中央处理单元(CPU)601执行上述通信方法对应的操作。输入/输出(I/O)接口605也连接至总线604。通信部612可以集成设置,也可以设置为具有多个子模块(例如多个IB网卡),并在总线链接上。
以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
需要说明的,如图6所示的架构仅为一种可选实现方式,在具体实践过程中,可根据实际需要对上述图6的部件数量和类型进行选择、删减、增加或替换;在不同功能部件设置上,也可采用分离设置或集成设置等实现方式,例如GPU613和CPU601可分离设置或者可将GPU613集成在CPU601上,通信部可分离设置,也可集成设置在CPU601或GPU613上,等等。这些可替换的实施方式均落入本发明公开的保护范围。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括有形地包含在机器可读介质上的计算机程序,计算机程序包含用于执行流程图所示的方法的程序代码,程序代码可包括对应执行本申请实施例提供的方法步骤对应的指令,例如,获取查询图像和图像集,确定查询图像与图像集中各图像的初始相似度;获取图像集中各图像之间的相似度;根据图像集中各图像之间的相似度优化初始相似度,获得查询图像与图像集中的各个图像之间的目标相似度;根据目标相似度,获得与查询图像之间的目标相似度达到预设条件的至少一个目标图像。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被中央处理单元(CPU)601执行时,执行本申请的方法中限定的上述功能。
根据本申请实施例的另一个方面,提供的一种计算机可读存储介质,用于存储计算机可读取的指令,该指令被执行时执行如上任意一项所述目标识别方法的操作。
根据本申请实施例的另一个方面,提供的一种计算机程序产品,包括计算机可读代码,当该计算机可读代码在设备上运行时,设备中的处理器执行用于实现如上任意一项所述目标识别方法的指令。
可能以许多方式来实现本申请的方法和装置。例如,可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本申请的方法和装置。用于所述方法的步骤的上述顺序仅是为了进行说明,本申请的方法的步骤不限于以上具体描述的顺序,除非以其它方式特别说明。此外,在一些实施例中,还可将本申请实施为记录在记录介质中的程序,这些程序包括用于实现根据本申请的方法的机器可读指令。因而,本申请还覆盖存储用于执行根据本申请的方法的程序的记录介质。
本申请的描述是为了示例和描述起见而给出的,而并不是无遗漏的或者将本申请限于所公开的形式。很多修改和变化对于本领域的普通技术人员而言是显然的。选择和描述实施例是为了更好说明本申请的原理和实际应用,并且使本领域的普通技术人员能够理解本申请从而设计适于特定用途的带有各种修改的各种实施例。
Claims (29)
1.一种目标识别方法,其特征在于,包括:
获取查询图像和图像集,其中,所述图像集中包括至少两个图像;
确定所述查询图像与所述图像集中各图像的初始相似度;
获取所述图像集中各图像之间的相似度;
基于第二神经网络根据所述图像集中各图像之间的相似度优化所述初始相似度,获得所述查询图像与所述图像集中的各个图像之间的目标相似度;
根据所述目标相似度,获得与所述查询图像之间的目标相似度达到预设条件的至少一个目标图像;
所述基于第二神经网络根据所述图像集中各图像之间的相似度优化所述初始相似度,获得所述查询图像与所述图像集中的各个图像之间的目标相似度之前,还包括:
基于样本图像集训练所述第二神经网络;所述样本图像集包括第一样本图像集和第二样本图像集,所述第一样本图像集包括至少一个第一样本图像,所述第二样本图像集包括至少两个第二样本图像,每个所述第一样本图像对应至少两个第二样本图像,所述第一样本图像与其对应的所述第二样本图像对应同一目标。
2.根据权利要求1所述的方法,其特征在于,所述确定所述查询图像与所述图像集中各图像的初始相似度,包括:
通过第一神经网络确定所述查询图像与所述图像集中各图像的初始相似度。
3.根据权利要求2所述的方法,其特征在于,所述第一神经网络执行的操作包括:
利用预定卷积神经网络分别对所述查询图像与所述图像集中各图像进行特征提取,得到所述查询图像的查询特征和所述图像集中各图像的图像特征;
基于所述查询特征与各个所述图像特征获得所述查询图像与所述图像集中各图像的初始相似度。
4.根据权利要求3所述的方法,其特征在于,所述基于所述查询特征与所述各个图像特征获得所述查询图像与所述图像集中各图像的初始相似度,包括:
获取所述查询特征与所述图像特征之间的差值特征,并将所述差值特征作为所述查询图像与所述图像集中各图像之间的初始相似度。
5.根据权利要求4所述的方法,其特征在于,在所述获取所述查询特征与所述图像特征之间的差值特征之后,还包括:
将所述差值特征依次经过平方运算和归一化处理,得到处理结果,并将所述处理结果作为所述查询图像与所述图像集中各图像之间的初始相似度。
6.根据权利要求1所述的方法,其特征在于,所述确定所述查询图像与所述图像集中各图像的初始相似度之后,还包括:
基于所述初始相似度对所述图像集中的图像进行筛选,得到预设数量的图像构成图像子集;
所述获取所述图像集中各图像之间的相似度,包括:
分别获取所述图像子集中各图像对应的图像特征;
根据所述图像特征确定所述图像子集中各图像之间的相似度。
7.根据权利要求1-6任一所述的方法,其特征在于,所述第二神经网络执行的操作,包括:
将所述查询图像与所述图像集中第一图像的初始相似度,作为第一初始相似度,将所述查询图像与所述图像集中第二图像的初始相似度,作为第二初始相似度;
基于至少一级信息传递神经网络获取所述第二初始相似度的深度信息;
获取所述第一图像与所述第二图像之间的相似度权重;
根据所述深度信息和所述相似度权重获取相似度偏差;
将所述第一初始相似度与所述相似度偏差进行加权融合,获得优化后的初始相似度;
将所述优化后的初始相似度作为所述查询图像与所述图像集中第一图像之间的目标相似度。
8.根据权利要求7所述的方法,其特征在于,每级所述信息传递神经网络依次包括:全连接层、归一化层和ReLU层。
9.根据权利要求7所述的方法,其特征在于,所述将所述第一初始相似度与所述相似度偏差进行加权融合,获得优化后的初始相似度之后,还包括:
将所述优化后的初始相似度作为第一初始相似度;
根据所述深度信息和所述相似度权重获取相似度偏差;
将所述第一初始相似度与所述相似度偏差进行加权融合,获得优化后的初始相似度;
判断是否达到设定条件,当达到设定条件,将所述优化后的初始相似度作为查询图像与所述图像集中第一图像之间的目标相似度;
当未达到设定条件,将所述优化后的初始相似度作为第一初始相似度。
10.根据权利要求7所述的方法,其特征在于,所述获取所述第一图像与所述图像集中第二图像之间的相似度权重,包括:
计算所述第一图像与所述第二图像的相似度;
对所述第一图像与所述第二图像的相似度进行指数运算,得到第一结果;
对所有所述第一结果进行求和运算,得到第二结果;
将所述第一结果除以所述第二结果的商值作为所述相似度权重。
11.根据权利要求7所述的方法,其特征在于,所述第二图像与所述第一图像的相似度大于或等于设定相似度。
12.根据权利要求1-6任一所述的方法,其特征在于,所述基于样本图像集训练所述第二神经网络,包括:
将所述第一样本图像作为所述查询图像,所述第二样本图像集作为所述图像集;
确定所述第一样本图像与所述第二样本图像集中各第二样本图像的样本初始相似度,并获得所述第二样本图像集中各第二样本图像之间的样本相似度;
基于所述第二神经网络根据所述第二样本图像集中各第二样本图像之间的样本相似度优化所述样本初始相似度,获得所述第一样本图像与所述第二样本图像集中各第二样本图像之间的样本目标相似度;
基于所述样本目标相似度获得与所述第一样本图像之间的样本目标相似度达到预设条件的至少一个样本目标图像;
基于所述样本目标图像与所述第一样本图像对应相同目标的第二样本图像,调整所述第二神经网络的参数。
13.根据权利要求1-6任一所述的方法,其特征在于,所述根据所述目标相似度,获得与所述查询图像之间的目标相似度达到预设条件的至少一个目标图像,包括:
对所述目标相似度进行筛选,获得至少一个大于预设值的所述目标相似度;
基于所述筛选获得的目标相似度获得对应的至少一个目标图像。
14.一种目标识别装置,其特征在于,包括:
图像获取单元,用于获取查询图像和图像集,其中,所述图像集中包括至少两个图像;
初始相似度单元,用于确定所述查询图像与所述图像集中各图像的初始相似度;
图像集相似度单元,用于获取所述图像集中各图像之间的相似度;
相似度优化单元,用于基于第二神经网络根据所述图像集中各图像之间的相似度优化所述初始相似度,获得所述查询图像与所述图像集中的各个图像之间的目标相似度;
目标获取单元,用于根据所述目标相似度,获得与所述查询图像之间的目标相似度达到预设条件的至少一个目标图像;
训练单元,用于基于样本图像集训练所述第二神经网络;所述样本图像集包括第一样本图像集和第二样本图像集,所述第一样本图像集包括至少一个第一样本图像,所述第二样本图像集包括至少两个第二样本图像,每个所述第一样本图像对应至少两个第二样本图像,所述第一样本图像与其对应的所述第二样本图像对应同一目标。
15.根据权利要求14所述的装置,其特征在于,所述初始相似度单元,具体用于通过第一神经网络确定所述查询图像与所述图像集中各图像的初始相似度。
16.根据权利要求15所述的装置,其特征在于,所述初始相似度单元通过第一神经网络执行的操作包括:
利用预定卷积神经网络分别对所述查询图像与所述图像集中各图像进行特征提取,得到所述查询图像的查询特征和所述图像集中各图像的图像特征;
基于所述查询特征与各个所述图像特征获得所述查询图像与所述图像集中各图像的初始相似度。
17.根据权利要求16所述的装置,其特征在于,所述初始相似度单元,具体用于获取所述查询特征与所述图像特征之间的差值特征,并将所述差值特征作为所述查询图像与所述图像集中各图像之间的初始相似度。
18.根据权利要求17所述的装置,其特征在于,所述初始相似度单元,还用于将所述差值特征依次经过平方运算和归一化处理,得到处理结果,并将所述处理结果作为所述查询图像与所述图像集中各图像之间的初始相似度。
19.根据权利要求14所述的装置,其特征在于,还包括:
图像集筛选单元,用于基于所述初始相似度对所述图像集中的图像进行筛选,得到预设数量的图像构成图像子集;
所述图像集相似度单元,用于分别获取所述图像子集中各图像对应的图像特征;根据所述图像特征确定所述图像子集中各图像之间的相似度。
20.根据权利要求14-19任一所述的装置,其特征在于,所述相似度优化单元通过第二神经网络执行的操作,包括:
将所述查询图像与所述图像集中第一图像的初始相似度,作为第一初始相似度,将所述查询图像与所述图像集中第二图像的初始相似度,作为第二初始相似度;
基于至少一级信息传递神经网络获取所述第二初始相似度的深度信息;
获取所述第一图像与所述第二图像之间的相似度权重;
根据所述深度信息和所述相似度权重获取相似度偏差;
将所述第一初始相似度与所述相似度偏差进行加权融合,获得优化后的初始相似度;
将所述优化后的初始相似度作为所述查询图像与所述图像集中第一图像之间的目标相似度。
21.根据权利要求20所述的装置,其特征在于,每级所述信息传递神经网络依次包括:全连接层、归一化层和ReLU层。
22.根据权利要求20所述的装置,其特征在于,所述相似度优化单元将所述第一初始相似度与所述相似度偏差进行加权融合,获得优化后的初始相似度之后,还用于将所述优化后的初始相似度作为第一初始相似度;根据所述深度信息和所述相似度权重获取相似度偏差;将所述第一初始相似度与所述相似度偏差进行加权融合,获得优化后的初始相似度;判断是否达到设定条件,当达到设定条件,将所述优化后的初始相似度作为查询图像与所述图像集中第一图像之间的目标相似度;当未达到设定条件,将所述优化后的初始相似度作为第一初始相似度。
23.根据权利要求20所述的装置,其特征在于,所述相似度优化单元获取所述第一图像与所述图像集中第二图像之间的相似度权重时,具体用于计算所述第一图像与所述第二图像的相似度;对所述第一图像与所述第二图像的相似度进行指数运算,得到第一结果;对所有所述第一结果进行求和运算,得到第二结果;将所述第一结果除以所述第二结果的商值作为所述相似度权重。
24.根据权利要求20所述的装置,其特征在于,所述第二图像与所述第一图像的相似度大于或等于设定相似度。
25.根据权利要求14-19任一所述的装置,其特征在于,所述训练单元,具体用于将所述第一样本图像作为所述查询图像,所述第二样本图像集作为所述图像集;确定所述第一样本图像与所述第二样本图像集中各第二样本图像的样本初始相似度,并获得所述第二样本图像集中各第二样本图像之间的样本相似度;基于所述第二神经网络根据所述第二样本图像集中各第二样本图像之间的样本相似度优化所述样本初始相似度,获得所述第一样本图像与所述第二样本图像集中各第二样本图像之间的样本目标相似度;基于所述样本目标相似度获得与所述第一样本图像之间的样本目标相似度达到预设条件的至少一个样本目标图像;基于所述样本目标图像与所述第一样本图像对应相同目标的第二样本图像,调整所述第二神经网络的参数。
26.根据权利要求14-19任一所述的装置,其特征在于,所述目标获取单元,具体用于对所述目标相似度进行筛选,获得至少一个大于预设值的所述目标相似度;基于所述筛选获得的目标相似度获得对应的至少一个目标图像。
27.一种电子设备,其特征在于,包括处理器,所述处理器包括权利要求14至26任意一项所述的目标识别装置。
28.一种电子设备,其特征在于,包括:存储器,用于存储可执行指令;
以及处理器,用于与所述存储器通信以执行所述可执行指令从而完成权利要求1至13任意一项所述目标识别方法的操作。
29.一种计算机可读存储介质,用于存储计算机可读取的指令,其特征在于,所述指令被处理器执行时执行权利要求1至13任意一项所述目标识别方法的操作。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810689610.5A CN108985190B (zh) | 2018-06-28 | 2018-06-28 | 目标识别方法和装置、电子设备、存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810689610.5A CN108985190B (zh) | 2018-06-28 | 2018-06-28 | 目标识别方法和装置、电子设备、存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108985190A CN108985190A (zh) | 2018-12-11 |
CN108985190B true CN108985190B (zh) | 2021-08-27 |
Family
ID=64539497
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810689610.5A Active CN108985190B (zh) | 2018-06-28 | 2018-06-28 | 目标识别方法和装置、电子设备、存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108985190B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109800821A (zh) * | 2019-01-31 | 2019-05-24 | 北京市商汤科技开发有限公司 | 训练神经网络的方法、图像处理方法、装置、设备和介质 |
CN110502659B (zh) * | 2019-08-23 | 2022-07-15 | 深圳市商汤科技有限公司 | 图像特征提取及网络的训练方法、装置和设备 |
CN110689046A (zh) * | 2019-08-26 | 2020-01-14 | 深圳壹账通智能科技有限公司 | 图像识别方法、装置、计算机装置及存储介质 |
CN113850179A (zh) * | 2020-10-27 | 2021-12-28 | 深圳市商汤科技有限公司 | 图像检测方法及相关模型的训练方法、装置、设备、介质 |
CN112395451A (zh) * | 2020-11-17 | 2021-02-23 | 厦门博海中天信息科技有限公司 | 基于图像特征的分类检索方法、系统、介质及设备 |
CN114972883B (zh) * | 2022-06-17 | 2024-05-10 | 平安科技(深圳)有限公司 | 基于人工智能的目标检测样本生成方法及相关设备 |
CN117315725A (zh) * | 2023-11-29 | 2023-12-29 | 北京科技大学 | 一种基于单目视觉的行人跟随方法、系统及装置 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103810252A (zh) * | 2014-01-21 | 2014-05-21 | 南京信息工程大学 | 一种基于群稀疏特征选择的图像检索方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9274818B2 (en) * | 2013-02-06 | 2016-03-01 | International Business Machines Corporation | Reliable and scalable image transfer for data centers with low connectivity using redundancy detection |
CN106250870B (zh) * | 2016-08-16 | 2019-10-08 | 电子科技大学 | 一种联合局部和全局相似性度量学习的行人再识别方法 |
CN106778464A (zh) * | 2016-11-09 | 2017-05-31 | 深圳市深网视界科技有限公司 | 一种基于深度学习的行人重识别方法和装置 |
CN106650639A (zh) * | 2016-12-05 | 2017-05-10 | 华南理工大学 | 一种适用于安防的监控系统行人再识别方法 |
CN106991370B (zh) * | 2017-02-28 | 2020-07-31 | 中科唯实科技(北京)有限公司 | 基于颜色和深度的行人检索方法 |
-
2018
- 2018-06-28 CN CN201810689610.5A patent/CN108985190B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103810252A (zh) * | 2014-01-21 | 2014-05-21 | 南京信息工程大学 | 一种基于群稀疏特征选择的图像检索方法 |
Also Published As
Publication number | Publication date |
---|---|
CN108985190A (zh) | 2018-12-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108985190B (zh) | 目标识别方法和装置、电子设备、存储介质 | |
CN110210560B (zh) | 分类网络的增量训练方法、分类方法及装置、设备及介质 | |
CN108182394B (zh) | 卷积神经网络的训练方法、人脸识别方法及装置 | |
CN108280477B (zh) | 用于聚类图像的方法和装置 | |
CN110431560B (zh) | 目标人物的搜索方法和装置、设备和介质 | |
CN110362677B (zh) | 文本数据类别的识别方法及装置、存储介质、计算机设备 | |
WO2019237846A1 (zh) | 图像处理方法、人脸识别方法、装置和计算机设备 | |
WO2019109526A1 (zh) | 人脸图像的年龄识别方法、装置及存储介质 | |
CN112348117B (zh) | 场景识别方法、装置、计算机设备和存储介质 | |
CN108073902B (zh) | 基于深度学习的视频总结方法、装置及终端设备 | |
CN108288051B (zh) | 行人再识别模型训练方法及装置、电子设备和存储介质 | |
WO2019200735A1 (zh) | 牲畜特征向量的提取方法、装置、计算机设备和存储介质 | |
CN108564102A (zh) | 图像聚类结果评价方法和装置 | |
CN112215831B (zh) | 一种用于人脸图像质量的评价方法和系统 | |
CN112464803A (zh) | 图像比较方法和装置 | |
CN111767750A (zh) | 图像处理方法和装置 | |
CN113255557A (zh) | 一种基于深度学习的视频人群情绪分析方法及系统 | |
CN108228684A (zh) | 聚类模型的训练方法、装置、电子设备和计算机存储介质 | |
US10346722B2 (en) | Signal classification using sparse representation | |
CN114612743A (zh) | 深度学习模型的训练方法、目标对象识别方法和装置 | |
CN112364198A (zh) | 一种跨模态哈希检索方法、终端设备及存储介质 | |
CN114255381B (zh) | 图像识别模型的训练方法、图像识别方法、装置及介质 | |
CN110135428B (zh) | 图像分割处理方法和装置 | |
CN113920382A (zh) | 基于类一致性结构化学习的跨域图像分类方法和相关装置 | |
CN112036316B (zh) | 手指静脉识别方法、装置、电子设备及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |