WO2023207197A1

WO2023207197A1 - 目标重识别方法、装置、设备和计算机可读存储介质

Info

Publication number: WO2023207197A1
Application number: PCT/CN2022/143487
Authority: WO
Inventors: 何烨林; 魏新明; 肖嵘
Original assignee: 深圳云天励飞技术股份有限公司
Priority date: 2022-04-28
Filing date: 2022-12-29
Publication date: 2023-11-02
Also published as: CN114707614A

Abstract

本申请适用于图像识别技术领域，提供了一种目标重识别方法、装置、设备和计算机可读存储介质，该方法包括：获取多帧图像，每帧图像中均包括待识别目标；将多帧图像中的单帧图像输入到外观特征提取网络中，得到待识别目标的外观特征，待识别目标的外观特征与单帧图像的颜色无关，外观特征提取网络用于消除图像的颜色对目标的外观的干扰；根据待识别目标的外观特征，从历史图像库中确定与待识别目标相匹配的图像。该方法可以避免因待识别目标图像与历史图像库中的目标图像的衣物颜色不同，导致的对待识别目标图像重识别准确率低的问题。

Description

目标重识别方法、装置、设备和计算机可读存储介质

本申请要求于2022年4月28日提交中国专利局，申请号为202210458101.8、发明名称为“目标重识别方法、装置、设备和计算机可读存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请属于图像识别技术领域，尤其涉及一种目标重识别方法、装置、设备和计算机可读存储介质。

背景技术

目标重识别技术是智能安防、失踪目标查找、案件侦查等领域的重要技术手段。例如，在失踪目标查找领域，用来根据失踪目标的图像查找失踪目标。

目前，相关技术中，主要基于深度学习技术进行目标重识别，具体为先利用Yolo检测算法将多个视频文件包括的多帧图像中的每张图像检测出来并裁剪保存形成历史图像库；再使用特征提取网络提取裁剪得到的历史图像库中的每张图像的特征向量；最后对比找出历史图像库中与待识别目标图像的特征向量最接近的图像。

然而，由于待识别目标图像与历史图像库中的目标图像的衣物颜色可能不同，导致相关技术对待识别目标图像的识别准确率较低。

发明内容

本申请提供了一种目标重识别方法、装置、设备和计算机可读存储介质，可以避免因待识别目标图像与历史图像库中的目标图像的衣物颜色不同，导致的对待识别目标图像重识别准确率低的问题。

第一方面，本申请提供一种目标重识别方法，包括：

获取多帧图像，每帧图像中均包括待识别目标；

将所述多帧图像中的单帧图像输入到外观特征提取网络中，得到所述待识别目标的外观特征，所述待识别目标的外观特征与所述单帧图像的颜色无关，所述外观特征提取网络用于消除图像的颜色对目标的外观的干扰；

根据所述待识别目标的外观特征，从历史图像库中确定与所述待识别目标相匹配的图像。

本申请通过将多帧图像中的单帧图像输入到外观特征提取网络中，得到与单帧图像的颜色无关的待识别目标的外观特征，根据待识别目标的外观特征，从历史图像库中确定与待识别目标相匹配的图像。避免了因待识别目标图像与历史图像库中的目标图像的衣物颜色不同，导致的对待识别目标图像重识别准确率低的问题，提高了重识别的准确率。

第二方面，本申请提供了一种目标重识别装置，该装置用于执行上述第一方面或第一方面的任一可能的实现方式中的方法。具体地，该装置包括：

第一获取模块，用于获取多帧图像，每帧图像中均包括待识别目标；

第二获取模块，用于将所述多帧图像中的单帧图像输入到外观特征提取网络中，得到所述待识别目标的外观特征，所述待识别目标的外观特征与所述单帧图像的颜色无关，所述外观特征提取网络用于消除图像的颜色对目标的外观的干扰；

识别模块，用于根据所述待识别目标的外观特征，从历史图像库中确定与所述待识别目标相匹配的图像。

第三方面，本申请提供了一种目标重识别设备，该设备包括存储器与处理器。该存储器用于存储指令；该处理器执行该存储器存储的指令，使得该设备执行第一方面或第一方面的任一可能的实现方式中目标重识别方法。

第四方面，提供一种计算机可读存储介质，该计算机可读存储介质中存储有指令，当该指令在计算机上运行时，使得计算机执行第一方面或第一方面的任一可能的实现方式中目标重识别方法。

第五方面，提供一种包含指令的计算机程序产品，当该指令在设备上运行时，使得设备执行第一方面或第一方面的任一可能的实现方式中目标重识别方法。

可以理解的是，上述第二方面至第五方面的有益效果可以参见上述第一方面中的相关描述，在此不再赘述。

附图说明

为了更清楚地说明本申请中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请一实施例提供的目标重识别方法的流程示意图；

图2是本申请一实施例提供的目标重识别方法的流程示意图；

图3是本申请一实施例提供的目标重识别方法的流程示意图；

图4是本申请一实施例提供的目标重识别方法的流程示意图；

图5a是本申请一实施例提供的目标重识别方法的流程示意图；

图5b是本申请一实施例提供的确定第一评分的示意图；

图5c是本申请一实施例提供的确定第二评分的示意图；

图6是本申请一实施例提供的目标重识别方法的流程示意图；

图7是本申请一实施例提供的目标重识别装置的结构示意图；

图8是本申请一实施例提供的目标重识别设备的结构示意图。

具体实施方式

以下描述中，为了说明而不是为了限定，提出了诸如特定系统结构、技术之类的具体细节，以便透彻理解本申请。然而，本领域的技术人员应当清楚，在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中，省略对众所周知的系统、装置、电路以及方法的详细说明，以免不必要的细节妨碍本申请的描述。

应当理解，当在本申请说明书和所附权利要求书中使用时，术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在，但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。

还应当理解，在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合，并且包括这些组合。

如在本申请说明书和所附权利要求书中所使用的那样，术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地，短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。

另外，在本申请说明书和所附权利要求书的描述中，术语“第一”、“第二”、“第三”等仅用于区分描述，而不能理解为指示或暗示相对重要性。

在本申请说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此，在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例，而是意味着“一个或多个但不是所有的实施例”，除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”，除非是以其他方式另外特别强调。

本申请提供一种目标重识别方法、装置、设备和计算机可读存储介质，该方法可以通过目标重识别装置实现，且应用于案件侦查、失踪人口查找和智能安防等场景中。

其中，目标重识别装置与目标重识别设备通信连接。例如，目标重识别装置可以通过应用程序(application，APP)、网页、应用中的公众号和小程序等形式，与目标重识别设备进行相互通信，使得目标重识别装置与目标重识别设备能够相互传递信息。用户可通过与目标重识别设备通信的目标重识别装置实现目标重识别。

其中，目标重识别装置指的是用户进行目标重识别时所使用的设备。目标重识别设备可以为具有显示屏硬件以及相应软件支持的设备，例如智能手机、平板电脑、台式电脑、笔记本电脑、可穿戴设备、手持设备和车载设备等。本申请实施例对目标重识别设备的具体类型不作任何限制。

基于上述场景描述，下面，结合目标重识别装置，对本申请实施例提供的目标重识别方法进行详细说明。

请参阅图1，图1示出了本申请一实施例提供的目标重识别方法的流程示意图。

如图1所示，本申请提供的目标重识别方法可以包括：

S101、获取多帧图像，每帧图像中均包括待识别目标。

在一些实施方式中，目标重识别设备可显示目标重识别装置的查找页面。其中，目标重识别装置的查找页面用于显示输入多帧图像的导入口以及显示查找结果。本申请对目标重识别装置的查找页面的具体实现方式不做限定。在一些实施例中，查找页面中可以包括一个用于输入视频或者图像的控件，该控件用于触发通过输入视频或者图像进行查找。

用户可在目标重识别装置的查找页面中进行目标重识别。从而，目标重识别设备可向目标重识别装置发送用户的查找请求。其中，用户的查找请求用于表示用户想要进行目标重识别。

例如，目标重识别设备在接收到用户指示的在用于输入视频或者图像的控件上执行的如点击、双击、长按等类型的操作后，可将该操作转为用户的查找请求，并向目标重识别装置发送用户的查找请求。本申请对用户的查找请求的具体实现方式不做限定。

其中，多帧图像为通过目标跟踪算法在给定的视频数据中对待识别目标进行目标跟踪而获取的。

目标重识别装置可以将目标跟踪算法存储在目标重识别装置和/或存储设备中。

其中，存储设备可与目标重识别装置进行通信，使得目标重识别装置能够从存储设备中获取通过外观特征提取网络提取的外观特征。本申请对存储设备的存储方式和具体类型不做限定。

在一些实施例中，目标跟踪算法为DeepSORT算法。

给定的视频数据可以是用户直接给定的，也可以是从监控摄像头、摄像机等图像采集设备采集的视频数据中抽取的。

摄像头可以包括单摄像头、双摄像头或三摄像头，或者，摄像头可以设定为广角摄像头或长焦摄像头，本申请实施例对此不作限定。

在一些实施例中，多帧图像来自用户直接给定的视频数据中的图像。具体地，给定的多帧图像中，每帧图像中均包括待识别目标。

在另一些实施例中，多帧图像来自监控摄像头、摄像机等图像采集设备采集的视频数据中抽取的多帧图像。具体地，采集的多帧图像中，每帧图像中均包括待识别目标。

在一些实施方式中，当待识别目标的身份已知时，多帧图像中每帧图像中均包括待识别已知身份的目标。

在一些实施方式中，待识别目标的身份未知时，多帧图像中每帧图像中均包括待识别未知身份的目标。

其中，待识别目标包括但不限于人体。

在一个具体的实施例中，假设目标重识别设备为手机，目标重识别装置为小程序，小程序可以显示目标重识别装置的查找页面。在查找失踪人口场景中，用户在小程序的查找页面中可以输入每帧图像均包括有待识别失踪人口甲的多帧图像。

S102、将所述多帧图像中的单帧图像输入到外观特征提取网络中，得到所述待识别目标的外观特征，所述待识别目标的外观特征与所述单帧图像的颜色无关，所述外观特征提取网络用于消除图像的颜色对目标的外观的干扰。

基于S101，目标重识别装置可以获得查找请求。从而，目标重识别装置可以执行查找请求，首先将多帧图像中的单帧图像输入到外观特征提取网络中，提取待识别目标的外观特征。

其中，外观特征提取网络为预先设计，外观特征提取网络用于消除图像的颜色对目标的外观的干扰。外观特征提取网络可在提取外观特征时，对衣物颜色不敏感。

目标重识别装置可以将预先设计的外观特征提取网络存储在目标重识别装置和/或存储设备中。

在一些实施方式中，外观特征可以包括但不限于头发、上衣、下装、性别、是否背包、是否戴帽子、是否背包、鞋子中的一个或者多个。例如，外观特征包括头发、上衣、下装、性别和鞋子五个。

在一个具体的实施例中，假设目标重识别设备为手机，目标重识别装置为小程序，小程序可以显示目标重识别装置的查找页面。在查找失踪人口场景中，用户在小程序的查找页面中输入每帧图像均包括有待识别失踪人口甲的多帧图像后，小程序从存储设备中调取外观特征提取网络提取包括有失踪人口甲的头发、上衣、下装、性别和鞋子特征。

S103、根据所述待识别目标的外观特征，从历史图像库中确定与所述待识别目标相匹配的图像。

历史图像库中图像可以是预先存储在目标重识别装置/存储设备中的具有多个历史目标图像的图像库，也可以是从多个与目标重识别设备通信连接的监控摄像头、摄像机等图像采集设备采集的视频数据对应的图像。

在一些实施方式中，当待识别目标的身份已知时，可以从预先存储的具有多个历史目标图像的图像库中匹配与待识别目标相匹配的图像。

在另一些实施例中，当待识别目标的身份未知时，可以从多个与目标重识别设备通信连接的监控摄像头、摄像机等图像采集设备采集的视频数据对应的图像中匹配与待识别目标相匹配的图像。

在一个具体的实施例中，假设目标重识别设备为手机，目标重识别装置为小程序，小程序可以显示目标重识别装置的查找页面。在查找失踪人口场景中，用户在小程序的查找页面中输入每帧图像均包括有待识别失踪人口甲的多帧图像后，小程序从存储设备中调取外观特征提取网络提取包括有失踪人口甲的头发、上衣、下装、性别和鞋子特征，小程序从存储设备中调取历史图像库，并根据失踪人口甲的头发、上衣、下装、性别和鞋子特征从历史图像库中查找与失踪人口甲相匹配的图像，并在查找页面显示从历史图像库中查找到的与失踪人口甲相匹配的图像。

本申请提供的目标重识别方法，通过将多帧图像中的单帧图像输入到外观特征提取网络中，得到与单帧图像的颜色无关的待识别目标的外观特征，根据待识别目标的外观特征，从历史图像库中确定与待识别目标相匹配的图像。借助用于消除图像颜色对目标的外观的干扰的外观特征提取网络提取单帧图像中与颜色无关的待识别目标的外观特征，由于待识别目标的外观特征与颜色无关，可以避免因待识别目标图像与历史图像库中的目标图像的衣物颜色不同，而导致的对待识别目标图像重识别准确率低的问题。

基于上述图1所示实施例的描述，本申请还提供了预先设计的外观特征提取网络的生成过程。

下面，结合图2，详细介绍本申请的生成外观特征提取网络的过程的具体实现过程。

基于图1中S102的描述，目标重识别装置在获取单帧图像中的外观特征时，通过外观特征提取网络用于消除图像的颜色对目标的外观的干扰。

外观特征提取网络生成过程可以通过特征网络生成系统生成，也可以通过其他可行的网络生成系统生成，在此不再赘述。

请参阅图2，图2示出了本申请一实施例提供的生成外观特征提取网络的过程的流程示意图。

如图2所示，本申请提供的生成外观特征提取网络的过程可以包括：

S201、获取至少一帧样本图像，每帧所述样本图像中均包括样本目标。

在一些实施例中，样本图像为多帧。

其中，样本图像可以为预先拍摄准备的图像，也可以为从现有的每帧均包括样本目标的图像中选取得到的。

S202、对每帧所述样本图像中的每个像素点进行数据增强，得到多帧增强图像。

在一些实施例中，通过对每帧所述样本图像中的每个像素点的各个颜色通道的颜色值进行交换，得到多帧增强图像。

例如，当样本图像为RGB图像时，将该RGB图像中的每个像素点的RGB颜色通道的颜色值进行交换，得到除原始RGB图像的五张图像，五张图像包括：RBG图像、GRB图像、GBR图像、BRG图像和BGR图像。

在另一些实施例中，通过对每帧所述样本图像中的每个像素点分别进行各个颜色通道的颜色值交换，以及对每帧所述样本图像中的每个像素点进行灰度值转换，得到多帧增强图像。

对每帧所述样本图像中的每个像素点进行灰度值转换，即随机将每个像素点的灰度值进行改变。

例如，将样本图像中每个灰度值为10的像素点，转换为灰度值为20或者8的像素点，将样本图像中每个灰度值为40的像素点，转换成灰度值为50或者45的像素点。

S203、根据所述多帧增强图像，确定所述样本目标的外观特征，所述样本目标的外观特征与所述多帧增强图像的颜色无关。

S204、根据所述样本目标的外观特征，对原始特征提取网络进行训练，得到所述外观特征提取网络。

本申请中，特征网络生成系统生成外观提取网络的过程中，先获取样本图像，对每帧样本图像中的每个像素点进行数据增强，得到多帧增强图像，根据多帧增强图像，确定样本目标的外观特征，样本目标的外观特征与多帧增强图像的颜色无关，根据样本目标的外观特征，对原始特征提取网络进行训练，得到外观特征提取网络。由于生成的过程中对样本图像的每个像素点进行了数据增强处理，因而通过此过程训练的网络能够用于消除图像的颜色对目标的外观的干扰。

基于图1所示实施例的描述，目标重识别装置在实现目标重识别时，还可以引入步态特征，将步态特征与外观特征结合来从历史图像库中确定与待识别目标相匹配的图像。

其中，步态特征旨在通过走路时的姿态和动作进行身份识别。步态识别具有不容易伪装和对衣着服饰不敏感的特点。

下面，结合图3，详细介绍目标重识别装置执行上述过程的具体实现方式。

请参阅图3，图3示出了本申请一实施例提供的目标重识别方法的流程示意图。

如图3所示，本申请提供的目标重识别方法可以包括：

S301、获取多帧图像，每帧图像中均包括待识别目标。

S302、将所述多帧图像中的单帧图像输入到外观特征提取网络中，得到所述待识别目标的外观特征，所述待识别目标的外观特征与所述单帧图像的颜色无关，所述外观特征提取网络用于消除图像的颜色对目标的外观的干扰。

其中，S301和S302分别与图1所示实施例中的S101和S102实现方法类似，本申请此处不再赘述。

S303、从所述多帧图像中，获取时间连续的连续帧图像。

时间连续的连续帧图像表示在时间序列上连续的图像。

在一些实施方式中，通过将多帧图像中在时间序列上连续的图像截取，得到时间连续的连续帧图像。

在一个具体的实施例中，假设目标重识别设备为手机，目标重识别装置为小程序，小程序可以显示目标重识别装置的查找页面。在查找失踪人口场景中，用户在小程序的查找页面中输入每帧图像均包括有待识别失踪人口甲的多帧图像后，小程序从待识别失踪人口甲的多帧图像中截取连续帧图像。

S304、根据所述连续帧图像，确定所述待识别目标的步态特征，所述待识别目标的步态特征用于表示所述待识别目标在走路时的姿态和动作。

在一些实施例中，目标重识别装置根据连续帧图像从步态特征提取网络中提取待识别目标的步态特征。

其中，目标重识别装置将步态特征提取网络存储在目标重识别装置和/或存储设备中。

在一些实施方式中，将多帧图像输入到步态特征提取网络中，就可以得到待识别目标的步态特征。

在一些实施方式中，通过步态特征提取网络提取外观特征的公式为：

f _i＝F(X _i)

其中，f _i表示通过步态特征提取网络的转换函数得到的待识别目标身份为i的连续帧图像X _i的步态特征，F表示步态特征提取网络的转换函数，X _i表示待识别目标的身份为i的连续帧图像，n表示连续帧图像的总帧数，P表示待识别目标的身份，P _i表示身份为i的待识别目标，

表示连续帧图像中身份为i的待识别目标的第j帧图像，

表示其中，

为P _i的第j帧图像。

在一个具体的实施例中，假设目标重识别设备为手机，目标重识别装置为小程序，小程序可以显示目标重识别装置的查找页面。在查找失踪人口场景中，用户在小程序的查找页面中输入每帧图像均包括有待识别失踪人口甲的多帧图像后，小程序从存储设备中调取步态特征提取网络从连续帧图像中提取失踪人口甲的走路时的动作与姿态特征。

S305、根据所述待识别目标的外观特征和所述待识别目标的步态特征，从所述历史图像库中确定与所述待识别目标相匹配的图像。

在一个具体的实施例中，假设目标重识别设备为手机，目标重识别装置为小程序，小程序可以显示目标重识别装置的查找页面。在查找失踪人口场景中，用户在小程序的查找页面中输入每帧图像均包括有待识别失踪人口甲的多帧图像后，小程序从存储设备中调取外观特征提取网络提取包括有失踪人口甲的多帧图像中每帧图像的头发、上衣、下装、性别和鞋子特征，同时，小程序从从存储设备中调取步态特征提取网络从连续帧图像中提取包括有失踪人口甲的走路时的动作与姿态特征，小程序根据失踪人口甲的头发、上衣、下装、性别和鞋子特征以及走路时的动作与姿态特征结合从历史图像库中查找与失踪人口甲相匹配的人体图像，并在查找页面显示从历史图像库中查找到的与失踪人口甲相匹配的人体图像。

本申请中，目标重识别装置通过将多帧图像中的单帧图像输入到外观特征提取网络中，得到与单帧图像的颜色无关的待识别目标的外观特征，根据待识别目标的外观特征，并通过续帧图像，确定待识别目标的步态特征，再根据待识别目标的外观特征和待识别目标的步态特征，从历史图像库中确定与待识别目标相匹配的图像。结合外观特征和步态特征从历史图像库中确定与待识别目标相匹配的图像，提高了识别的效率，也提高了识别的准确率；同时，由于步态识别具有不容易伪装和对衣着服饰不敏感的特点，因而也可以避免因待识别目标图像与历史图像库中的目标图像的衣物颜色不同，而导致的对待识别目标图像重识别准确率低的问题。

基于图3所示实施例的描述，目标重识别装置还可以在将从多帧图像中获取时间连续的连续帧图像后，从连续帧图像中获取待识别目标的步态特征。

下面，结合图4，详细介绍目标重识别装置执行上述过程的具体实现方式。

请参阅图4，图4示出了本申请一实施例提供的目标重识别方法的流程示意图。

如图4所示，本申请提供的目标重识别方法可以包括：

S401、将所述连续帧图像中的每帧图像的前背景区域和背景区域进行分离，所述前背景区域中包括所述待识别目标，所述背景区域中不包括所述待识别目标。

其中，前背景是指在图像画面中衬托主体的区域，是为主体服务的；背景是指位于主体后面，用以陪衬主体的区域，具有烘托主体的作用。例如，一张人体站在海边的图像，包括人体的区域为前背景，不包括人体的位于人体后面的大海区域为背景。

将前背景区域和背景区域进行分离是指将包括有待识别目标的区域和不包括待识别目标的区域分离。

在一个具体的实施例中，假设目标重识别设备为手机，目标重识别装置为小程序，小程序可以显示目标重识别装置的查找页面。在查找失踪人口场景中，用户在小程序的查找页面中输入每帧图像均包括有待识别失踪人口甲的多帧图像后，小程序从多帧图像中截取连续帧图像，再将连续帧图像中包括有失踪人口甲的区域和不包括有失踪人口甲的区域分离。

S402、将所述连续帧图像中的每帧图像的前背景区域作为连续帧前背景图像。

在一个具体的实施例中，假设目标重识别设备为手机，目标重识别装置为小程序，小程序可以显示目标重识别装置的查找页面。在在查找失踪人口场景中，用户在小程序的查找页面中输入每帧图像均包括有待识别失踪人口甲的多帧图像后，小程序从多帧图像中截取连续帧图像，再将连续帧图像中包括有失踪人口甲的区域和不包括有失踪人口甲的区域分离，并将包括有失踪人口甲的区域作为连续帧前背景图像。

S403、根据所述连续帧前背景图像，确定所述待识别目标的步态特征。

在一个具体的实施例中，假设目标重识别设备为手机，目标重识别装置为小程序，小程序可以显示目标重识别装置的查找页面。在查找失踪人口场景中，用户在小程序的查找页面中输入每帧图像均包括有待识别失踪人口甲的多帧图像后，小程序从多帧图像中截取连续帧图像，再将连续帧图像中包括有失踪人口甲的区域和不包括有失踪人口甲的区域分离，并将包括有失踪人口甲的区域作为连续帧前背景图像，小程序从存储设备中调取步态特征提取网络从连续帧前背景图像中提取失踪人口甲的走路时的动作与姿态特征。

本申请中，目标重识别装置通过将所述连续帧图像中的每帧图像的前背景区域和背景区域进行分离，将所述连续帧图像中的每帧图像的前背景区域作为连续帧前背景图像，根据所述连续帧前背景图像，确定所述待识别目标的步态特征。从连续帧图像中提取连续帧前背景图像，再从连续帧前背景图像中提取步态特征，避免了背景区域的干扰，有利于快速获取待识别目标的步态特征。

基于图4所示实施例的描述，目标重识别装置在将步态特征与外观特征结合来从历史图像库中确定与待识别目标相匹配的图像时，可以通过多种方式，比如，引入相似度进行匹配。

下面，结合图5a，详细介绍目标重识别装置执行上述过程的具体实现方式。

基于S304的描述，目标重识别装置可引入相似度，通过待识别目标的步态特征与历史图像库中每帧图像步态特征的相似度以及待识别目标的外观特征与历史图像库中每帧图像的外观特征的相似度结合来从历史图像库中确定与待识别目标相匹配的图像。

其中，相似度是指两个目标之间的相近程度。

请参阅图5a，图5a示出了本申请一实施例提供的目标重识别方法的流程示意图。

如图5a所示，本申请提供的目标重识别方法可以包括：

S501、获取多帧图像，每帧图像中均包括待识别目标。

S502、将所述多帧图像中的单帧图像输入到外观特征提取网络中，得到所述待识别目标的外观特征，所述待识别目标的外观特征与所述单帧图像的颜色无关，所述外观特征提取网络用于消除图像的颜色对目标的外观的干扰。

S503、从所述多帧图像中，获取时间连续的连续帧图像。

S504、根据所述连续帧图像，确定所述待识别目标的步态特征。

其中，S501、S502、S503和S504分别与图3所示实施例中的S301、S302、S303和S304实现方法类似，本申请此处不再赘述。

S505、在所述历史图像库中，确定每帧图像中的目标的外观特征和步态特征。

其中，历史图像库的每帧图像中的目标的外观特征和步态特征可以为预先提取的，也可以为在目标重识别过程中由目标重识别装置进行提取的。

在一个具体的实施例中，假设目标重识别设备为手机，目标重识别装置为小程序，小程序可以显示目标重识别装置的查找页面。在查找失踪人口场景中，用户在小程序的查找页面中输入每帧图像均包括有待识别失踪人口甲的多帧图像后，小程序可以从历史图像库中获取每帧图像中的人体的头发、上衣、下装、性别和鞋子特征以及走路时的动作与姿态特征。

S506、根据所述待识别目标的外观特征与所述每帧图像中的目标的外观特征，确定多个第一评分，每个第一评分用于指示所述待识别目标的外观特征与所述每帧图像中的目标的外观特征之间的相似度。

其中，每个第一评分表示待识别目标的外观特征与每帧图像中的目标的外观特征的相似度。

在一些实施例中，待识别目标的外观特征与每帧图像中的目标的外观特征的相似度是指待识别目标的外观特征与每帧图像中的目标的外观特征的余弦相似度。

其中，余弦相似度，又称为余弦相似性，是通过计算两个特征对应的向量的夹角余弦值来得到的相似度。

余弦相似度，为两个特征对应的向量相乘并处以两个向量模的乘积。余弦相似度越大，说明两个特征对应的向量之间的夹角越小，两个特征对应的向量越接近；反之，则越远。

在一些实施例中，待识别目标的外观特征与每帧图像中的目标的外观特征的余弦相似度计算公式为：

其中，s′表示待识别目标的外观特征与每帧图像中的目标的外观特征的余弦相似度，f′ _i表示待识别目标的外观特征对应的向量，f′ _j表示每帧图像中的目标的外观特征对应的向量，||f′ _i||||f′ _j||表示待识别目标的外观特征对应的向量和每帧图像中的目标的外观特征对应的向量的模。

在一个具体的实施例中，假设目标重识别设备为手机，目标重识别装置为小程序，小程序可以显示目标重识别装置的查找页面。在查找失踪人口场景中，用户在小程序的查找页面中输入每帧图像均包括有待识别失踪人口甲的多帧图像后，小程序可以从历史图像库中提取每帧图像中的目标的外观特征，并计算待识别失踪人口甲的头发、上衣、下装、性别和鞋子特征与历史图像库中每帧图像中的人体的头发、上衣、下装、性别和鞋子特征的余弦相似度。

在历史图像库中有100帧图像时，计算待识别失踪人口甲的头发、上衣、下装、性别和鞋子特征与100帧图像中每帧图像中的人体的头发、上衣、下装、性别和鞋子特征的余弦相似度。

如图5b所示，第1列为待识别失踪人口甲的外观特征，可以通过待识别失踪人口甲的外观特征得到待识别失踪人口甲的外观特征对应的向量；第2列为历史图像库中每帧图像中的人体的外观特征，可以通过历史图像库中每帧图像中的人体的外观特征得到历史图像库中每帧图像中的人体的外观特征对应的向量；通过待识别失踪人口甲的外观特征对应的向量和历史图像库中每帧图像中的人体的外观特征对应的向量计算出待识别失踪人口甲的外观特征与历史图像库中每帧图像中的人体的外观特征的余弦相似度，即第3列的第一评分。

S507、根据所述待识别目标的步态特征与所述每帧图像中的目标的步态特征，确定多个第二评分，每个第二评分用于指示所述待识别目标的步态特征与所述每帧图像中的目标的步态特征之间的相似度。

其中，每个第二评分表示待识别目标的步态特征与每帧图像中的目标的步态特征的相似度。

在一些实施例中，待识别目标的步态特征与每帧图像中的目标的步态特征的相似度是指待识别目标的步态特征与每帧图像中的目标的步态特征的余弦相似度。

在一些实施例中，待识别目标的步态特征与每帧图像中的目标的步态特征的余弦相似度计算公式为：

其中，s表示待识别目标的步态特征与每帧图像中的目标的步态特征的余弦相似度，f _i表示待识别目标的步态特征对应的向量，f _j表示历史图像库中每帧图像中的目标的步态特征对应的向量，||f _i||||f _j||表示待识别目标的步态特征对应的向量和每帧图像中的目标的步态特征对应的向量的模。

在一个具体的实施例中，假设目标重识别设备为手机，目标重识别装置为小程序，小程序可以显示目标重识别装置的查找页面。在查找失踪人口场景中，用户在小程序的查找页面中输入每帧图像均包括有待识别失踪人口甲的多帧图像后，小程序可以从历史图像库中提取每帧图像中的人体的步态特征，并计算待识别失踪人口甲的走路时的动作与姿态和历史图像库中每帧图像中的人体的走路时的动作与姿态的余弦相似度。

在历史图像库中有100帧图像时，计算待识别失踪人口甲的走路时的动作与姿态和100帧图像中每帧图像中的人体的走路时的动作与姿态的余弦相似度。

如图5c所示，第1列为待识别失踪人口甲的步态特征，可以通过待识别失踪人口甲的步态特征得到待识别失踪人口甲的步态特征对应的向量；第2 列为历史图像库中每帧图像中的人体的步态特征，可以通过历史图像库中每帧图像中的人体的步态特征得到历史图像库中每帧图像中的人体的步态特征对应的向量；通过待识别失踪人口甲的步态特征对应的向量和历史图像库中每帧图像中的人体的步态特征对应的向量计算出待识别失踪人口甲的步态特征与历史图像库中每帧图像中的人体的步态特征的余弦相似度，即第3列的第二评分。

S508、对所述多个第一评分和所述多个第二评分进行融合，得到多个评分。

在一些实施例中，将历史图像库中每帧图像对应第一评分和第二评分相对应，再进行第一评分和第二评分的融合，得到多个评分。

由于余弦相似度的取值范围在-1～1之间，因此，余弦相似度的融合不能单纯使用两个余弦相似度相乘。

在一些实施例中，使用下式对两个余弦相似度进行融合：

s _fusion＝fusion(s；λ ₀,γ ₀)·fusion(s′；λ ₁,γ ₁)

其中，s _fusion表示将第一评分和第二评分融合得到的评分的值，fusion表示转换函数，可以通过转换函数可以将余弦相似度的值域转换为0到1之间，λ和γ表示转换函数的参数，λ ₀和γ ₀表示步态特征与每帧图像中的目标的步态特征的余弦相似度的转换函数的参数，λ ₁和γ ₁表示外观特征与每帧图像中的目标的外观特征的余弦相似度的转换函数的参数。

在一个具体的实施例中，假设目标重识别设备为手机，目标重识别装置为小程序，小程序可以显示目标重识别装置的查找页面。在查找失踪人口场景中，用户在小程序的查找页面中输入每帧图像均包括有待识别失踪人口甲的多帧图像后，小程序可以将每帧图像对应的第一评分和第二评分进行融合，得到多个评分。

在历史图像库中有100帧图像时，将100帧图像中每帧图像对应的第一评分和第二评分相对应，比如先将图像1对应的第一评分和图像1对应的第二评分对齐，再进行融合。

S509、按照评分由大到小的顺序，从所述多个评分中取前N个评分，N为正整数。

其中，N为预先设置的，比如，N可以为50。在N为50时，从多个评分取前N个评分为从多个评分取前50个评分。

在一个具体的实施例中，假设目标重识别设备为手机，目标重识别装置为小程序，小程序可以显示目标重识别装置的查找页面。在查找失踪人口场景中，用户在小程序的查找页面中输入每帧图像均包括有待识别失踪人口甲的多帧图像后，小程序可以将每帧图像对应的第一评分和第二评分进行融合，得到多个评分，并将评分的值按照由大到小的顺序排序，并从中取前N个评分。

在历史图像库中有100帧图像时，将100帧图像中每帧图像对应的第一评分和第二评分相对应，比如将图像1对应的第一评分和图像1对应的第二评分对齐，进行融合，得到100个评分，从100个评分中取前50个评分。

S510、从所述历史图像库中，获取所述前N个评分对应的图像。

在一个具体的实施例中，假设目标重识别设备为手机，目标重识别装置为小程序，小程序可以显示目标重识别装置的查找页面。在查找失踪人口场景中，用户在小程序的查找页面中输入每帧图像均包括有待识别失踪人口甲的多帧图像后，小程序可以将每帧图像对应的第一评分和第二评分进行融合，得到多个评分，并将评分的值按照由大到小的顺序排序，从中取前N个评分对应的图像。

在历史图像库中有100帧图像时，将100帧图像中每帧图像对应的第一评分和第二评分相对应，比如将图像1对应的第一评分和图像1对应的第二评分对齐，进行融合，得到100个评分，从100个评分中取前50个评分对应的图像。

S511、确定与所述待识别目标相匹配的图像为所述前N个评分对应的图像。

在一个具体的实施例中，假设目标重识别设备为手机，目标重识别装置为小程序，小程序可以显示目标重识别装置的查找页面。在查找失踪人口场景中，用户在小程序的查找页面中输入每帧图像均包括有待识别失踪人口甲的多帧图像后，小程序可以将每帧图像对应的第一评分和第二评分进行融合，得到多个评分，并将评分的值按照由大到小的顺序排序，从中取前N个评分对应的图像作为与待识别目标相匹配的图像，在小程序的查找页面上进行显示。

本申请中，目标重识别装置将多帧图像中的单帧图像输入到外观特征提取网络中，得到与单帧图像的颜色无关的待识别目标的外观特征，并通过续帧图像，确定待识别目标的步态特征；根据待识别目标的外观特征与每帧图像中的目标的外观特征，确定多个第一评分，根据待识别目标的步态特征与每帧图像中的目标的步态特征，确定多个第二评分，对多个第一评分和多个第二评分进行融合，得到多个评分，按照评分由大到小的顺序，获取前N个评分对应的图像，作为与待识别目标相匹配的图像。通过两个评分进行融合，再将融合得到的前N个评分对应的图像作为与待识别目标相匹配的图像，可以达到提高识别的准确率的效果；同时，将前N个评分对应的图像，作为与待识别目标相匹配的图像，得到的与待识别目标相似的图像数量较多，可以避免漏掉与待识别目标相似的图像，保证识别的人性化。

基于图1所示实施例的描述，目标重识别装置在获取外观特征时，将多帧图像中的每帧图像依次输入外观特征提取网络，得到多个外观特征，再将多个外观特征融合。

下面，结合图6，详细介绍目标重识别装置执行上述过程的具体实现方式。

请参阅图6，图6示出了本申请一实施例提供的目标重识别方法的流程示意图。

如图6所示，本申请提供的目标重识别方法可以包括：

S601、将所述多帧图像中的每帧图像均输入到所述外观特征提取网络中，分别得到多个外观特征，每个外观特征与对应的每帧图像的颜色无关。

其中，S601与图1所示实施例中的S102实现方法类似，本申请此处不再赘述。

在一些实施方式中，通过外观特征提取网络提取外观特征的公式为：

其中，f′ _i表示通过外观特征提取网络的转换函数得到的待识别目标身份为i的多帧图像K _i的外观特征，G表示外观特征提取网络的转换函数，K _i表示包括待识别目标身份为i的多帧图像，n表示多帧图像的总帧数，P表示待识别目标的身份，P _i表示身份为i的待识别目标，

表示多帧图像中身份为i的待识别目标的第j帧图像，

表示其中，

为P _i的第j帧图像。

S602、对所述多个外观特征进行融合，得到所述待识别目标的外观特征。

本申请中，目标重识别装置将所述多帧图像中的每帧图像均输入到外观特征提取网络中，分别得到多个外观特征，对所述多个外观特征进行融合，得到所述待识别目标的外观特征。通过将多帧图像中每帧图像对应的外观特征进行融合，得到待识别目标的外观特征的方式，可以保证得到的外观特征更加准确，以进一步确保识别的准确率。

对应于上述图1所示实施例所述的一种目标重识别方法，本申请还提供了一种目标重识别装置。

下面，结合图7，对本申请一实施例提供的目标重识别装置进行详细说明。

请参阅图7，图7示出了本申请一实施例提供的目标重识别装置的示意性框图。

如图7所示，本申请一实施例提供的目标重识别装置，包括第一获取模块701、第二获取模块702和识别模块703。

第一获取模块701，用于获取多帧图像，每帧图像中均包括待识别目标；

第二获取模块702，用于将所述多帧图像中的单帧图像输入到外观特征提取网络中，得到所述待识别目标的外观特征，所述待识别目标的外观特征与所述单帧图像的颜色无关，所述外观特征提取网络用于消除图像的颜色对目标的外观的干扰；

识别模块703，用于根据所述待识别目标的外观特征，从历史图像库中确定与所述待识别目标相匹配的图像。

在一些实施例中，特征网络生成系统，用于：

获取至少一帧样本图像，每帧所述样本图像中均包括样本目标；

对每帧所述样本图像中的每个像素点进行数据增强，得到多帧增强图像；

根据所述多帧增强图像，确定所述样本目标的外观特征，所述样本目标的外观特征与所述多帧增强图像的颜色无关；

根据所述样本目标的外观特征，对原始特征提取网络进行训练，得到所述外观特征提取网络。

在一些实施例中，特征网络生成系统，具体用于：

对每帧所述样本图像中的每个像素点分别进行各个颜色通道的颜色值交换和进行灰度值转换，得到多帧增强图像；

或者，对每帧所述样本图像中的每个像素点进行各个颜色通道的颜色值交换，得到多帧增强图像。

在一些实施例中，目标重识别装置700还包括：第三获取模块(图7中未进行示意)。

第三获取模块，用于：

从所述多帧图像中，获取时间连续的连续帧图像；

根据所述连续帧图像，确定所述待识别目标的步态特征，所述待识别目标的步态特征用于表示所述待识别目标在走路时的姿态和动作。

在一些实施例中，识别模块703，具体用于：

根据所述待识别目标的外观特征和所述待识别目标的步态特征，从所述历史图像库中确定与所述待识别目标相匹配的图像。

在一些实施例中，第三获取模块，具体用于：

将所述连续帧图像中的每帧图像的前背景区域和背景区域进行分离，所述前背景区域中包括所述待识别目标，所述背景区域中不包括所述待识别目标；

将所述连续帧图像中的每帧图像的前背景区域作为连续帧前背景图像；

根据所述连续帧前背景图像，确定所述待识别目标的步态特征。

在一些实施例中，识别模块703，具体用于：

在所述历史图像库中，确定每帧图像中的目标的外观特征和步态特征；

根据所述待识别目标的外观特征与所述每帧图像中的目标的外观特征，确定多个第一评分，每个第一评分用于指示所述待识别目标的外观特征与所述每帧图像中的目标的外观特征之间的相似度；

根据所述待识别目标的步态特征与所述每帧图像中的目标的步态特征，确定多个第二评分，每个第二评分用于指示所述待识别目标的步态特征与所述每帧图像中的目标的步态特征之间的相似度；

对所述多个第一评分和所述多个第二评分进行融合，得到多个评分；

按照评分由大到小的顺序，从所述多个评分中取前N个评分，N为正整数；

从所述历史图像库中，获取所述前N个评分对应的图像；

确定与所述待识别目标相匹配的图像为所述前N个评分对应的图像。

在一些实施例中，第二获取模块702，用于：

将所述多帧图像中的每帧图像均输入到所述外观特征提取网络中，分别得到多个外观特征，每个外观特征与对应的每帧图像的颜色无关；

对所述多个外观特征进行融合，得到所述待识别目标的外观特征。

应理解的是，本申请的装置700可以通过专用集成电路(application-specific integrated circuit，ASIC)实现，或可编程逻辑器件(programmable logic device，PLD)实现，上述PLD可以是复杂程序逻辑器件(complex programmable logical device，CPLD)，现场可编程门阵列(field-programmable gate array，FPGA)，通用阵列逻辑(generic array logic，GAL)或其任意组合。也可以通过软件实现图1所示的目标重识别方法，当通过软件实现图1所示的目标重识别方法时，装置700及其各个模块也可以为软件模块。

图8为本申请提供的一种目标重识别设备的结构示意图。如图8所示，其中设备800包括处理器801、存储器802、通信接口803和总线804。其中，处理器801、存储器802、通信接口803通过总线804进行通信，也可以通过无线传输等其他手段实现通信。该存储器802用于存储指令，该处理器801用于执行该存储器802存储的指令。该存储器802存储程序代码8021，且处理器801可以调用存储器802中存储的程序代码8021执行图1所示的目标重识别方法。

应理解，在本申请中，处理器501可以是CPU，处理器801还可以是其他通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者是任何常规的处理器等。

该存储器802可以包括只读存储器和随机存取存储器，并向处理器801提供指令和数据。存储器802还可以包括非易失性随机存取存储器。该存储器802可以是易失性存储器或非易失性存储器，或可包括易失性和非易失性存储器两者。其中，非易失性存储器可以是只读存储器(read-only memory，ROM)、可编程只读存储器(programmable ROM，PROM)、可擦除可编程只读存储器(erasable PROM，EPROM)、电可擦除可编程只读存储器(electrically EPROM，EEPROM)或闪存。易失性存储器可以是随机存取存储器(random access memory，RAM)，其用作外部高速缓存。通过示例性但不是限制性说明，许多形式的RAM可用，例如静态随机存取存储器(static RAM，SRAM)、动态随机存取存储器(DRAM)、同步动态随机存取存储器(synchronous DRAM，SDRAM)、双倍数据速率同步动态随机存取存储器(double data date SDRAM，DDR SDRAM)、增强型同步动态随机存取存储器(enhanced SDRAM，ESDRAM)、同步连接动态随机存取存储器(synchlink DRAM，SLDRAM)和直接内存总线随机存取存储器(direct rambus RAM，DR RAM)。

该总线804除包括数据总线之外，还可以包括电源总线、控制总线和状态信号总线等。但是为了清楚说明起见，在图8中将各种总线都标为总线804。

应理解，根据本申请的设备800可对应于本申请中的装置700，并可以对应于本申请图1所示方法中的设备，当设备800对应于图1所示方法中的设备时，设备800中的各个模块的上述和其它操作和/或功能分别为了实现图1中的由设备执行的方法的操作步骤，为了简洁，在此不再赘述。

本申请还提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现可实现上述各个方法实施例中的步骤。

本申请提供了一种计算机程序产品，当计算机程序产品在移动终端上运行时，使得移动设备执行时实现可实现上述各个方法实施例中的步骤。

应理解，上述实施例中各步骤的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本申请的实施过程构成任何限定。

需要说明的是，上述装置/单元之间的信息交互、执行过程等内容，由于与本申请方法实施例基于同一构思，其具体功能及带来的技术效果，具体可参见方法实施例部分，此处不再赘述。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，仅以上述各功能单元、模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能单元、模块完成，即将上述装置的内部结构划分成不同的功能单元或模块，以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中，上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。另外，各功能单元、模块的具体名称也只是为了便于相互区分，并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述或记载的部分，可以参见其它实施例的相关描述。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

在本申请所提供的实施例中，应该理解到，所揭露的装置/网络设备和方法，可以通过其它的方式实现。例如，以上所描述的装置/网络设备实施例仅仅是示意性的，例如，上述模块或单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口，装置或单元的间接耦合或通讯连接，可以是电性，机械或其它的形式。

上述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本申请方案的目的。

以上所述实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围，均应包含在本申请的保护范围之内。

Claims

一种目标重识别方法，其特征在于，包括：

获取多帧图像，每帧图像中均包括待识别目标；

将所述多帧图像中的单帧图像输入到外观特征提取网络中，得到所述待识别目标的外观特征，所述待识别目标的外观特征与所述单帧图像的颜色无关，所述外观特征提取网络用于消除图像的颜色对目标的外观的干扰；

根据所述待识别目标的外观特征，从历史图像库中确定与所述待识别目标相匹配的图像。
如权利要求1所述的方法，其特征在于，生成所述外观特征提取网络的过程，包括：

获取至少一帧样本图像，每帧所述样本图像中均包括样本目标；

对每帧所述样本图像中的每个像素点进行数据增强，得到多帧增强图像；

根据所述多帧增强图像，确定所述样本目标的外观特征，所述样本目标的外观特征与所述多帧增强图像的颜色无关；

根据所述样本目标的外观特征，对原始特征提取网络进行训练，得到所述外观特征提取网络。
如权利要求2所述的方法，其特征在于，所述对每帧所述样本图像中的每个像素点进行数据增强，得到多帧增强图像，包括：

对每帧所述样本图像中的每个像素点分别进行各个颜色通道的颜色值交换和进行灰度值转换，得到多帧增强图像；

或者，对每帧所述样本图像中的每个像素点进行各个颜色通道的颜色值交换，得到多帧增强图像。
如权利要求1所述的方法，其特征在于，所述方法还包括：

从所述多帧图像中，获取时间连续的连续帧图像；

根据所述连续帧图像，确定所述待识别目标的步态特征，所述待识别目标的步态特征用于表示所述待识别目标在走路时的姿态和动作；

所述根据所述待识别目标的外观特征，从历史图像库中确定与所述待识别目标相匹配的图像，包括：

根据所述待识别目标的外观特征和所述待识别目标的步态特征，从所述历史图像库中确定与所述待识别目标相匹配的图像。
如权利要求4所述的方法，其特征在于，所述根据所述连续帧图像，确定所述待识别目标的步态特征，包括：

将所述连续帧图像中的每帧图像的前背景区域和背景区域进行分离，所述前背景区域中包括所述待识别目标，所述背景区域中不包括所述待识别目标；

将所述连续帧图像中的每帧图像的前背景区域作为连续帧前背景图像；

根据所述连续帧前背景图像，确定所述待识别目标的步态特征。
如权利要求4或5所述的方法，其特征在于，所述根据所述待识别目标的外观特征和所述待识别目标的步态特征，从所述历史图像库中确定与所述待识别目标相匹配的图像，包括：

在所述历史图像库中，确定每帧图像中的目标的外观特征和步态特征；

根据所述待识别目标的外观特征与所述每帧图像中的目标的外观特征，确定多个第一评分，每个第一评分用于指示所述待识别目标的外观特征与所述每帧图像中的目标的外观特征之间的相似度；

根据所述待识别目标的步态特征与所述每帧图像中的目标的步态特征，确定多个第二评分，每个第二评分用于指示所述待识别目标的步态特征与所述每帧图像中的目标的步态特征之间的相似度；

对所述多个第一评分和所述多个第二评分进行融合，得到多个评分；

按照评分由大到小的顺序，从所述多个评分中取前N个评分，N为正整数；

从所述历史图像库中，获取所述前N个评分对应的图像；

确定与所述待识别目标相匹配的图像为所述前N个评分对应的图像。
如权利要求1至5中任一所述的方法，其特征在于，所述将所述多帧图像中的单帧图像输入到外观特征提取网络中，得到所述待识别目标的外观特征，包括：

将所述多帧图像中的每帧图像均输入到所述外观特征提取网络中，分别得到多个外观特征，每个外观特征与对应的每帧图像的颜色无关；

对所述多个外观特征进行融合，得到所述待识别目标的外观特征。
一种目标重识别装置，其特征在于，包括：

第一获取模块，用于获取多帧图像，每帧图像中均包括待识别目标；

第二获取模块，用于将所述多帧图像中的单帧图像输入到外观特征提取网络中，得到所述待识别目标的外观特征，所述待识别目标的外观特征与所述单帧图像的颜色无关，所述外观特征提取网络用于消除图像的颜色对目标的外观的干扰；

识别模块，用于根据所述待识别目标的外观特征，从历史图像库中确定与所述待识别目标相匹配的图像。
一种目标重识别设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述的方法。
一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的方法。