WO2019020103A1

WO2019020103A1 - 目标识别方法、装置、存储介质和电子设备

Info

Publication number: WO2019020103A1
Application number: PCT/CN2018/097374
Authority: WO
Inventors: 沈岩涛; 肖桐; 李鸿升; 伊帅; 王晓刚
Original assignee: 北京市商汤科技开发有限公司
Priority date: 2017-07-28
Filing date: 2018-07-27
Publication date: 2019-01-31
Also published as: US20200005090A1; CN108229292A; SG11201911625YA; US20220058812A1; US11200682B2; JP2020519989A; KR20190128724A; US20220051417A1; KR102339323B1; JP6893564B2

Abstract

一种目标识别方法、装置、存储介质和电子设备。其中，所述目标识别方法包括：获取第一图像及第二图像（S102），所述第一图像及所述第二图像中均包含待确定目标；基于所述第一图像及所述第二图像，生成预测路径（S104），所述预测路径的两端分别对应所述第一图像及所述第二图像；对所述预测路径进行有效性判断，基于判断结果，确定所述第一图像及所述第二图像中的待确定目标是否为同一待确定目标（S106）。

Description

目标识别方法、装置、存储介质和电子设备

相关申请的交叉引用

本申请基于申请号为201710633604.3、申请日为2017年07月28日的中国专利申请提出，并要求该中国专利申请的优先权，该中国专利申请的全部内容在此以引入方式并入本申请。

技术领域

本发明实施例涉及人工智能技术领域，尤其涉及一种目标识别方法、装置、存储介质和电子设备。

背景技术

交通工具再识别，如车辆再识别，是计算机视觉和公共安全领域的重要内容，其在交通工具检测与跟踪、行进路线估计以及异常行为检测等诸多方面都有重要应用价值。

大多数交通工具再识别的技术都是基于交通工具的外观信息进行判断，不同于行人再识别，单纯利用交通工具外观信息进行交通工具再识别的难点在于许多交通工具如车辆的外观(如颜色、型号、造型等)十分相似。尤其是在同品牌同款的不同交通工具之间，差异将会更加微小。而依赖交通工具标识信息如车辆的车牌信息以及交通工具内装饰物如车内装饰物这些独特细节信息进行检测和识别，则会因为监控镜头角度不佳、光照条件不佳、镜头模糊等因素使检测和识别的鲁棒性变差，导致检测和识别结果不准确。

发明内容

本发明实施例提供了一种目标识别的技术方案。

根据本发明实施例的第一方面，提供了一种目标识别方法。所述方法包括：获取第一图像及第二图像，所述第一图像及所述第二图像中均包含待确定目标；基于所述第一图像及所述第二图像，生成预测路径，所述预测路径的两端分别对应所述第一图像及所述第二图像；对所述预测路径进行有效性判断，基于判断结果，确定所述第一图像及所述第二图像中的待确定目标是否为同一待确定目标。

在一实施例中，所述待确定目标为交通工具。

在一实施例中，所述基于所述第一图像及所述第二图像，生成预测路径之前，所述方法还包括：根据所述第一图像的时间信息、空间信息、图像特征信息，以及，所述第二图像的时间信息、空间信息、图像特征信息，确定所述第一图像及所述第二图像中分别包含的待确定目标的初步相同概率值；所述基于所述第一图像及所述第二图像，生成预测路径，包括：当所述初步相同概率值大于预设值时，基于所述第一图像及所述第二图像，生成所述预测路径。

在一实施例中，根据所述第一图像的时间信息、空间信息、图像特征信息，以及，所述第二图像的时间信息、空间信息、图像特征信息，确定所述第一图像及所述第二图像中分别包含的待确定目标的初步相同概率值，包括：将所述第一图像和所述第二图像，以及，所述第一图像和所述第二图像之间的时间信息的差异和空间信息的差异输入孪生卷积神经网络(Siamese Convolutional Neural Network，Siamese-CNN)，获得所述第一图像和第二图像中的待确定目标的初步相同概率值。

在一实施例中，所述基于所述第一图像及所述第二图像，生成预测路径，包括：根据所述第一图像的特征信息、所述第一图像的时间信息、所述第一图像的空间信息、所述第二图像的特征信息、所述第二图像的时间信息、和所述第二图像的空间信息，通过概率模型生成所述待确定目标的预测路径。

在一实施例中，所述通过概率模型生成所述待确定目标的预测路径，包括：通过链状马尔可夫随机场模型(Markov Random Field，MRF)从获取的图像集中确定出包含有所述待确定目标的信息、且与所述第一图像和所述第二图像均具有时空序列关系的所有图像；根据确定出的所有图像对应的时间信息和空间信息，生成所述待确定目标的预测路径。

在一实施例中，所述根据确定出的所有图像对应的时间信息和空间信息，生成所述待确定目标的预测路径，包括：根据确定出的所有图像对应的时间信息和空间信息，生成以所述第一图像为首节点且以所述第二图像为尾节点的一条预测路径，其中，所述预测路径除对应所述首节点和所述尾节点外，还对应至少一个中间节点。

在一实施例中，所述通过MRF从获取的图像集中确定出包含有所述待确定目标的信息、且与所述第一图像和所述第二图像均具有时空序列关系的所有图像，包括：以所述第一图像的空间信息对应的位置为起始位置，以所述第二图像的空间信息对应的位置为终止位置，获取从所述起始位置至所述终止位置之间的所有摄像设备的位置信息；根据所有摄像设备的位置信息所指示的位置之间的关系，以所述起始位置对应的摄像设备为起点，以所述终止位置对应的摄像设备为终点，生成至少一个设备路径，其中，每个设备路径除包括所述起点的摄像设备和所述终点的摄像设备外，还包括至少一个其它摄像设备的信息；针对每一个设备路径，以所述第一图像的时间信息对应的时间为起始时间，以所述第二图像的时间信息对应的时间为终止时间，从当前路径上的每个其它摄像设备拍摄的图像中，确定出与当前摄像设备相邻的前一摄像设备拍摄的包含所述待确定目标的信息的图像具有设定时间序列关系、且包含所述待确定目标的信息的图像。

在一实施例中，所述根据确定出的所有图像对应的时间信息和空间信息，生成以所述第一图像为首节点且以所述第二图像为尾节点的一条预测路径，包括：针对每一个设备路径，根据确定出的所述图像的时间序列关系生成相连的具有时空序列关系的多个中间节点；根据所述首节点、所述尾节点、和所述中间节点，生成与当前设备路径对应的具有时空序列关系的图像路径；从每一个设备路径对应的图像路径中，确定出以所述第一图像为首节点且以所述第二图像为尾节点的最大概率图像路径作为所述待确定目标的预测路径。

在一实施例中，所述从每一个设备路径对应的图像路径中，确定出以所述第一图像为首节点且以所述第二图像为尾节点的最大概率图像路径作为所述待确定目标的预测路径，包括：针对每一个设备路径对应的图像路径，获取所述图像路径中每两个相邻节点的图像之间具有同一个待确定目标的信息的概率；根据所述图像路径中每两个相邻节点的图像之间具有同一个待确定目标的信息的概率计算所述图像路径作为所述待确定目标的预测路径的概率；根据每一个图像路径作为所述待确定目标的预测路径的概率确定最大概率图像路径作为所述待确定目标的预测路径。

在一实施例中，对所述预测路径进行有效性判断，基于判断结果，确定所述第一图像及所述第二图像中的待确定目标是否相同，包括：通过神经网络，对所述预测路径进行有效性判断，基于判断结果，确定所述第一图像和第二图像中的待确定目标是否为同一个待确定目标。

在一实施例中，通过神经网络，对所述预测路径进行有效性判断，基于判断结果，确定所述第一图像和第二图像中的待确定目标是否为同一个待确定目标，包括：根据所述预测路径中的相邻的图像的时间信息，获取相邻的图像的时间差异；根据相邻的图像的空间信息，获取相邻的图像的空间差异；根据相邻的图像中的待确定目标的特征信息，获取相邻的图像中的待确定目标的特征差异；将获得的所述预测路径中相邻的图像的时间差异、空间差异和特征差异输入长短时记忆网络(Long Short-Term Memory，LSTM)，获得所述预测路径的待确定目标的识别概率；根据所述预测路径的待确定目标的识别概率，确定所述第一图像和第二图像中的待确定目标是否为同一个待确定目标。

在一实施例中，根据相邻的图像中的待确定目标的特征信息，获取相邻的图像中的待确定目标的特征差异，包括：通过Siamese-CNN分别获取相邻的图像中的待确定目标的特征信息；根据分别获取的所述特征信息，获取相邻的图像中的待确定目标的特征差异。

根据本发明实施例的第二方面，提供了一种目标识别装置。所述装置包括：获取模块，配置为获取第一图像及第二图像，所述第一图像及所述第二图像中均包含待确定目标；生成模块，配置为基于所述第一图像及所述第二图像，生成预测路径，所述预测路径的两端分别对应所述第一图像及所述第二图像；第一确定模块，配置为对所述预测路径进行有效性判断，基于判断结果，确定所述第一图像及所述第二图像中的待确定目标是否为同一待确定目标。

在一实施例中，所述待确定目标为交通工具。

在一实施例中，所述装置还包括：第二确定模块，配置为根据所述第一图像的时间信息、空间信息、图像特征信息，以及，所述第二图像的时间信息、空间信息、图像特征信息，确定所述第一图像及所述第二图像中分别包含的待确定目标的初步相同概率值；所述生成模块，包括：第一生成子模块，配置为当所述初步相同概率值大于预设值时，基于所述第一图像及所述第二图像，生成所述预测路径。

在一实施例中，所述第二确定模块，包括：第一确定子模块，配置为将所述第一图像和所述第二图像，以及，所述第一图像和所述第二图像之间的时间信息的差异和空间信息的差异输入Siamese-CNN，获得所述第一图像和第二图像中的待确定目标的初步相同概率值。

在一实施例中，所述生成模块，包括：第二生成子模块，配置为根据所述第一图像的特征信息、所述第一图像的时间信息、所述第一图像的空间信息、所述第二图像的特征信息、所述第二图像的时间信息、和所述第二图像的空间信息，通过概率模型生成所述待确定目标的预测路径。

在一实施例中，所述第二生成子模块，包括：第一确定单元，配置为通过MRF从获取的图像集中确定出包含有所述待确定目标的信息、且与所述第一图像和所述第二图像均具有时空序列关系的所有图像；第一生成单元，配置为根据确定出的所有图像对应的时间信息和空间信息，生成所述待确定目标的预测路径。

在一实施例中，所述第一生成单元，包括：第二生成单元，配置为根据确定出的所有图像对应的时间信息和空间信息，生成以所述第一图像为首节点且以所述第二图像为尾节点的一条预测路径，其中，所述预测路径除对应所述首节点和所述尾节点外，还对应至少一个中间节点。

在一实施例中，所述第一确定单元，配置为：以所述第一图像的空间信息对应的位置为起始位置，以所述第二图像的空间信息对应的位置为终止位置，获取从所述起始位置至所述终止位置之间的所有摄像设备的位置信息；根据所有摄像设备的位置信息所指示的位置之间的关系，以所述起始位置对应的摄像设备为起点，以所述终止位置对应的摄像设备为终点，生成至少一个设备路径，其中，每个设备路径除包括所述起点的摄像设备和所述终点的摄像设备外，还包括至少一个其它摄像设备的信息；针对每一个设备路径，以所述第一图像的时间信息对应的时间为起始时间，以所述第二图像的时间信息对应的时间为终止时间，从当前路径上的每个其它摄像设备拍摄的图像中，确定出与当前摄像设备相邻的前一摄像设备拍摄的包含所述待确定目标的信息的图像具有设定时间序列关系、且包含所述待确定目标的信息的图像。

在一实施例中，所述第二生成单元，配置为：针对每一个设备路径，根据确定出的所述图像的时间序列关系生成相连的具有时空序列关系的多个中间节点；根据所述首节点、所述尾节点、和所述中间节点，生成与当前设备路径对应的具有时空序列关系的图像路径；从每一个设备路径对应的图像路径中，确定出以所述第一图像为首节点且以所述第二图像为尾节点的最大概率图像路径作为所述待确定目标的预测路径。

在一实施例中，所述第二生成单元，还配置为：针对每一个设备路径对应的图像路径，获取所述图像路径中每两个相邻节点的图像之间具有同一个待确定目标的信息的概率；根据所述图像路径中每两个相邻节点的图像之间具有同一个待确定目标的信息的概率计算所述图像路径作为所述待确定目标的预测路径的概率；根据每一个图像路径作为所述待确定目标的预测路径的概率确定最大概率图像路径作为所述待确定目标的预测路径。

在一实施例中，所述第一确定模块，包括：第二确定子模块，配置为通过神经网络，对所述预测路径进行有效性判断，基于判断结果，确定所述第一图像和第二图像中的待确定目标是否为同一个待确定目标。

在一实施例中，所述第二确定子模块，包括：第一获取单元，配置为根据所述预测路径中的相邻的图像的时间信息，获取相邻的图像的时间差异；根据相邻的图像的空间信息，获取相邻的图像的空间差异；根据相邻的图像中的待确定目标的特征信息，获取相邻的图像中的待确定目标的特征差异；第二获取单元，配置为将获得的所述预测路径中相邻的图像的时间差异、空间差异和特征差异输入LSTM，获得所述预测路径的待确定目标的识别概率；第二确定单元，配置为根据所述预测路径的待确定目标的识别概率，确定所述第一图像和第二图像中的待确定目标是否为同一个待确定目标。

在一实施例中，所述第一获取单元，配置为：通过Siamese-CNN分别获取相邻的图像中的待确定目标的特征信息；根据分别获取的所述特征信息，获取相邻的图像中的待确定目标的特征差异。

根据本发明实施例的第三方面，提供了一种计算机可读存储介质，其上存储有计算机程序指令，其中，所述程序指令被处理器执行时实现本发明实施例的第一方面所述的目标识别方法的步骤。

根据本发明实施例的第四方面，提供了一种电子设备，包括：处理器、存储器、通信元件和通信总线，所述处理器、所述存储器和所述通信元件通过所述通信总线完成相互间的通信；所述存储器用于存放至少一可执行指令，所述可执行指令使所述处理器执行如本发明实施例的第一方面所述的目标识别方法的步骤。

根据本发明实施例提供的技术方案，基于第一图像和第二图像所包含的信息，生成待确定目标可能通过的预测路径；并通过对该预测路径的有效性判断，以确定第一图像及第二图像中的待确定目标是否相同。其中，有效性判断是对当前预测路径是否会为同一个待确定目标的行进路线的可能性判断，其可能性越高则第一图像和第二图像中的待确定目标为同一个待确定目标的可能性也越高。由此，可以对不同图像中的待确定目标是否为同一个待确定目标进行较为精准的检测和识别。

附图说明

图1是根据本发明实施例一的一种目标识别方法的流程示意图；

图2是根据本发明实施例二的一种目标识别方法的流程示意图；

图3是根据本发明实施例三的一种目标识别方法的流程示意图；

图4是根据本发明实施例四的一种目标识别装置的结构框图；

图5是根据本发明实施例五的一种目标识别装置的结构框图；

图6是根据本发明实施例六的一种目标识别装置的结构框图；

图7是根据本发明实施例七的一种电子设备的结构示意图。

具体实施方式

下面结合附图(若干附图中相同的标号表示相同的元素)和实施例，对本发明实施例的具体实施方式作进一步详细说明。以下实施例用于说明本发明，但不用来限制本发明的范围。

本领域技术人员可以理解，本发明实施例中的“第一”、“第二”等术语仅用于区别不同步骤、设备或模块等，既不代表任何特定技术含义，也不表示它们之间的必然逻辑顺序。

实施例一

图1是根据本发明实施例一的一种目标识别方法的流程示意图。如图1所示，本实施例的目标识别方法包括以下步骤：

在步骤S102中，获取第一图像及第二图像。

在具体的实施方式中，从图像包含的内容来讲，所述第一图像和所述第二图像中均包含待确定目标。从图像的类别来讲，所述第一图像和所述第二图像均可为拍摄的静态图像，或者为视频帧序列中的视频图像等。具体地，所述待确定目标可包括行人、无人机以及交通工具等。可以理解的是，本实施例不限于此，任何可移动的物体均被包括在待确定目标的范围内。

在步骤S104中，基于所述第一图像及所述第二图像，生成预测路径。

其中，所述预测路径的两端分别对应所述第一图像及所述第二图像。在本发明实施例中，可基于所述第一图像和所述第二图像中包含的待确定目标的特征信息以及所述第一图像和所述第二图像中包含的时空信息来对待确定目标的行进路线进行预测，以路线预测结果来加强待确定目标识别的可信度。具体地，以所述第一图像和所述第二图像所包含的信息为基础，需要进一步找出图像中的待确定目标的可能的行进路线，其中，该行进路线上拍摄的待确定目标的图像均应与所述第一图像和所述第二图像在时空上相关。

在步骤S106中，对所述预测路径进行有效性判断，基于判断结果，确定所述第一图像及所述第二图像中的待确定目标是否为同一待确定目标。

其中，有效性判断是对一条预测路径是否会为同一个待确定目标的行进路线的可能性判断，其可能性越高则第一图像和第二图像中的待确定目标为同一个待确定目标的可能性也越高，也即是所述第一图像中的待确定目标与所述第二图像中的待确定目标相同的可能性也越高。在具体的实施方式中，所述有效性判断的结果具体可以是有效概率，也可以直接是“是否有效”。

根据本实施例提供的目标识别方法，基于第一图像和第二图像所包含的信息，生成待确定目标可能通过的预测路径；并通过对该预测路径的有效性判断，以确定第一图像及第二图像中的待确定目标是否相同。其中，有效性判断是对当前预测路径是否会为同一个待确定目标的行进路线的可能性判断，其可能性越高则第一图像和第二图像中的待确定目标为同一个待确定目标的可能性也越高。由此，可以对不同图像中的待确定目标是否为同一个待确定目标进行较为精准的检测和识别。

本实施例的目标识别方法可以由任意适当的具有图像或数据处理能力的设备执行，包括但不限于：摄像头、终端、移动终端、PC机、服务器、车载设备、娱乐设备、广告设备、个人数码助理(PDA)、平板电脑、笔记本电脑、掌上游戏机、智能眼镜、智能手表、可穿戴设备、虚拟显示设备或显示增强设备(如Google Glass、Oculus Rift、Hololens、Gear VR)等。

实施例二

参照图2，示出了根据本发明实施例二的一种目标识别方法的流程示意图。

在本实施例中，以待确定目标为交通工具为例，对本发明实施例的目标识别方法进行说明，但本领域技术人员应当明了，在实际应用中，其它的待确定目标可参照本实施例实现相应的目标识别操作。

本实施例的目标识别方法包括以下步骤：

在步骤S202中，获取第一图像及第二图像。

在具体的实施方式中，所述第一图像和所述第二图像中均包含待确定目标，且所述待确定目标为交通工具。

在步骤S204中，根据所述第一图像的特征信息、所述第一图像的时间信息、所述第一图像的空间信息、所述第二图像的特征信息、所述第二图像的时间信息、和所述第二图像的空间信息，通过概率模型生成所述待确定目标的预测路径。

相比较于行人的行进路线，交通工具的行进路线更加稳定、更加有规律，判断和识别的准确率更高，因此，可以联合利用交通工具的特征信息(可以表征交通工具的外观)和图像的时空信息来对交通工具的行进路线进行预测，以路线预测结果来加强交通工具识别的可信度。

其中，图像的时间信息用于指示拍摄图像的时间，可以认为是待确定目标(如交通工具)经过拍摄设备的时间；图像的空间信息用于指示拍摄图像的位置，可以认为是拍摄设备所在的位置，也可以认为是待确定目标如交通工具被拍摄时所处的位置；图像的特征信息用于指示图像中的待确定目标的特征，如交通工具的特征，根据该特征可以确定交通工具的外观等信息。可以理解的是，本实施例涉及的图像所包含的信息可包括但不限于：图像的时间信息、图像的空间信息和图像的特征信息。

在具体的实施方式中，所述概率模型可为MRF。

随机场可以看成是一组对应于同一个样本空间的随机变量的集合。一般来说，当这些随机变量之间有依赖关系时，该随机场可以被认为具有实际意义。随机场包含两个要素，即位置(site)和相空间(phase space)，当给每一个位置中按照某种分布随机赋予相空间的一个值之后，其全体就叫做随机场。

MRF是加了Markov性质限制的随机场。Markov性质是指一个随机变量序列按时间先后关系依次排开的时候，第N+1时刻的分布特性，与N时刻以前的随机变量的取值无关。一个MRF对应一个无向图，这个无向图上的每一个节点对应一个随机变量，节点之间的边表示节点对应的随机变量之间有概率依赖关系。因此，MRF的结构本质上反应了先验知识，即，哪些变量之间有依赖关系需要考虑，而哪些可以忽略。

本实施例中，可以通过MRF生成第一图像和第二图像中的待确定目标的至少一条预测路径，然后，从中确定出最优路径作为所述待确定目标的预测路径。具体地，可以根据第一图像的特征信息、第一图像的时间信息、第一图像的空间信息、第二图像的特征信息、第二图像的时间信息、和第二图像的空间信息，通过MRF生成所述待确定目标的预测路径。在一实施例中，可以通过链状MRF从获取的图像集中确定出包含有所述待确定目标的信息、且与第一图像和第二图像均具有时空序列关系的所有图像；根据确定出的所有图像对应的时间信息和空间信息，生成所述待确定目标的预测路径。

其中，时空数据是指同时具有时间和空间维度的数据，其包括时间和空间二个维度的信息。地理学中，由于连续的时空数据都是经过离散化抽样提取并存储的，因而能够将时空数据看作是空间上有相关关系的时间序列集合，即时空序列。该集合中的数据可以被认为是具有时空序列关系的数据。具体地，与第一图像和第二图像均具有时空序列关系的所有图像的含义为该所有图像中包含的时空数据分别与第一图像中包含的时空数据和第二图像中包含的时空数据在时间和空间上相关。

通常情况下，可以以第一图像为路径首节点图像，以第二图像为路径尾节点图像，根据链状MRF确定出的所有图像对应的时间信息和空间信息，生成以第一图像为首节点且以第二图像为尾节点的一条预测路径，其中，该预测路径除对应所述首节点和所述尾节点外，还对应至少一个中间节点。

其中，在通过链状MRF从获取的图像集中确定出包含有所述待确定目标的信息、且与所述第一图像和所述第二图像均具有时空序列关系的所有图像时，可以以第一图像的空间信息对应的位置为起始位置，以第二图像的空间信息对应的位置为终止位置，获取从所述起始位置至所述终止位置之间的所有摄像设备的位置信息；根据所有摄像设备的位置信息所指示的位置之间的关系，以所述起始位置对应的摄像设备为起点，以所述终止位置对应的摄像设备为终点，生成至少一个设备路径，其中，每个设备路径除包括所述起点的摄像设备和所述终点的摄像设备外，还包括至少一个其它摄像设备的信息；针对每一个设备路径，以第一图像的时间信息对应的时间为起始时间，以第二图像的时间信息对应的时间为终止时间，从当前路径上的每个其它摄像设备拍摄的图像中，确定出与当前摄像设备相邻的前一摄像设备拍摄的包含所述待确定目标的信息的图像具有设定时间序列关系、且包含所述待确定目标的信息的图像。

进而，在根据确定出的所有图像对应的时间信息和空间信息，生成以第一图像为首节点且以第二图像为尾节点的一条预测路径时，可以针对每一个设备路径，根据确定出的图像的时间序列关系生成相连的具有时空序列关系的多个中间节点；根据所述首节点、所述尾节点、和所述中间节点，生成与当前设备路径对应的具有时空序列关系的图像路径；从每一个设备路径对应的图像路径中，确定出以第一图像为首节点且以第二图像为尾节点的最大概率图像路径作为所述待确定目标的预测路径。

其中，在从每一个设备路径对应的图像路径中，确定出以第一图像为首节点且以第二图像为尾节点的最大概率图像路径作为所述待确定目标的预测路径时，可以针对每一个设备路径对应的图像路径，获取所述图像路径中每两个相邻节点的图像之间具有同一个待确定目标的信息的概率；根据所述图像路径中每两个相邻节点的图像之间具有同一个待确定目标的信息的概率计算所述图像路径作为所述待确定目标的预测路径的概率；根据每一个图像路径作为所述待确定目标的预测路径的概率确定最大概率图像路径作为所述待确定目标的预测路径。

以本实施例中的待确定目标为交通工具为例，假定交通工具在路网中的行进路线为一个链状MRF，链上的每一个节点为一个摄像机，节点的变量空间为该摄像机所拍摄的图像、图像的拍摄时间和地点所组成的三元组。任给一对需要识别是否为同一辆交通工具的图像，以及它们之间的可能的监控摄像机(可能的监控摄像机为先验信息，可以通过任意适当方式得到，如通过在数据训练集上进行统计得到)，把相邻摄像机之间每一对图像以及它们之间的时空差异输入到Siamese-CNN中，计算出每一对路网中相邻监控摄像机所拍的图像中的交通工具所属为同一辆交通工具的概率。其中，Siamese-CNN可以视作为MRF中相邻节点的势能函数，可以通过最大子序列和(Max-Sum)算法，最小化(优化)势能函数的乘积数值，以得到一条可能性最高的预测路径，该预测路径包括该交通工具所经过的摄像机的地理位置、被拍摄的时间以及被拍摄的图像的相关信息。

例如，设定p表示第一图像的信息(包括特征信息、时间信息和空间信息)，q表示第二图像的信息(包括特征信息、时间信息和空间信息)，通过链状MRF从多条可能的预测路径中确定最优路径的一种方式可以采用最大化下述公式(1)的方式实现：

其中，P表示预测路径(即交通工具有可能经过的预测路径)；X表示摄像机；N表示一条预测路径上的摄像机的数量，从X1到XN，x ₁表示X1拍摄到的所述交通工具的图像的信息，以此类推，x _N表示XN拍摄到的所述交通工具的图像的信息，

表示势能函数(即Siamese-CNN的输出，为0～1之间的概率值)，

表示x _i和x _i+1之间的势能函数对，x _i和x _i+1被认为包含有同一辆交通工具的信息。如果x _i和x _i+1确实包含有同一辆交通工具的信息，则

将有一个较大值，否则，会有一个较小值。

在最大化上述公式(1)时，可以使用公式(2)中所述的时间约束，使公式(2)满足公式(3)，即：

其中，t表示时间，

和

分别表示x _i对应的图像的信息的最优选择和x _i+1对应的图像的信息的最优选择；X表示摄像机；N表示一条预测路径上的摄像机的数量，从X1到XN，x ₁表示X1拍摄到的所述交通工具的图像的信息，以此类推，x _N表示XN拍摄到的所述交通工具的图像的信息。

上述公式(1)、(2)和(3)中，图像的信息均包括图像的时间信息、空间信息和特征信息。

基于上述公式(1)、(2)和(3)，可以将上述公式(1)最优化为下述公式(4)，以获得最优路径，也即，交通工具可能通过的最大概率路径。

通过上述过程，可以确定出所述交通工具最有可能经过的一条预测路径。

例如，以第一图像为预测路径首节点A，以第二图像为预测路径尾节点D，根据摄像设备之间的位置关系，车辆可能的行驶路线包括：路线1：A->B->C->D；路线2：A->E->D；路线3：A->F->G->H->D。经过上述公式(4)的计算，确定路线1的概率为85％，路线2的概率为95％，而路线3的概率为70％，则可将路线2确定为交通工具的预测路径。

需要说明的是，上述过程以链状MRF为例，但在实际应用中，本领域技术人员也可以使用其它适当方式实现所述待确定目标的预测路径的生成。例如，根据深度神经网络检测第一图像和第二图像的背景信息，以生成所述待确定目标的预测路径。

在步骤S206中，通过神经网络，对所述预测路径进行有效性判断，基于判断结果，确定所述第一图像和第二图像中的待确定目标是否为同一个待确定目标。

其中，所述神经网络可以是任意适当的可实现特征提取或目标对象识别的神经网络，包括但不限于卷积神经网络、增强学习神经网络、对抗神经网络中的生成网络等等。神经网络中具体结构的设置可以由本领域技术人员根据实际需求适当设定，如卷积层的层数、卷积核的大小、通道数等等，本发明实施例对此不作限制。

在具体的实施方式中，所述神经网络可为LSTM。LSTM是一种时间递归神经网络，是一种循环神经网络(RNN)的变种，较为擅长于处理序列信息。本发明实施例中，交通工具的预测路径也可以认为是一个序列信息，采用LSTM对其进行处理，以确定预测路径的有效性。

有效性判断是对一条预测路径是否会为同一个待确定目标的行进路线的可能性判断，其可能性越高则第一图像和第二图像中的待确定目标为同一个待确定目标的可能性也越高。

本实施例中，可以根据所述预测路径中的相邻的图像的时间信息，获取相邻的图像的时间差异；根据相邻的图像的空间信息，获取相邻的图像的空间差异；根据相邻的图像中的待确定目标的特征信息，获取相邻的图像中的待确定目标的特征差异；将获得的所述预测路径中相邻的图像的时间差异、空间差异和特征差异输入LSTM，获得所述预测路径的待确定目标的识别概率；根据所述预测路径的待确定目标的识别概率，确定所述第一图像和第二图像中的待确定目标是否为同一个待确定目标。其中，对待确定目标是否为同一个待确定目标的判断标准的具体设定可以由本领域技术人员根据实际需要适当设置，本发明实施例对此不作限制。

其中，相邻图像的时间差异可以通过两者的时间信息相减得到；相邻图像的空间差异可以通过计算两者之间的距离得到；而相邻图像的特征差异可以通过两者的特征向量相减得到。在一种可行方式中，在获得相邻图像的特征差异时，可以利用Siamese-CNN，通过Siamese-CNN分别获取相邻的图像中的待确定目标的特征信息；根据分别获取的特征信息，获取相邻的图像中的待确定目标的特征差异。其中，本步骤中的Siamese-CNN可以与步骤S204中的Siamese-CNN相同也可以不同。

本实施例中，在通过MRF得到任意两张交通工具图像之间的行进路线后，需要对该行进路线是否有效进行判断，即进行有效性判断。其中，有效指该行进路线是一条同样的交通工具会走过的路线，反之则为无效路线。本实施例中，采用的判断方式是使用LSTM来进行判断，该LSTM的输入为路线上相邻节点之间的时间差(即时间差异)、距离差(即空间差异)，还有它们的外观差异(即特征差异)，如前所述，其中的外观差异可用两张图像输入到Siamese-CNN后输出的特征向量直接进行相减得到。该LSTM的输出为一个概率值，通过该概率值可以对预测路径是否有效进行判断，进而判断两张图像中的交通工具是否确实为同一辆交通工具。

可见，通过本实施例，基于第一图像和第二图像所包含的时空信息和特征信息，生成图像中待确定目标可能通过的预测路径；并通过对该预测路径的有效性判断，以确定第一图像及第二图像中的待确定目标是否相同。其中，有效性判断是对当前预测路径是否会为同一个待确定目标的行进路线的可能性判断，其可能性越高则第一图像和第二图像中的待确定目标为同一个待确定目标的可能性也越高。由此，可以对不同图像中的待确定目标是否为同一个待确定目标进行较为精准的检测和识别。

实施例三

参照图3，示出了根据本发明实施例三的一种目标识别方法的流程示意图。在本实施例中，以待确定目标为交通工具为例，对本发明实施例的目标识别方法进行说明，但本领域技术人员应当明了，在实际应用中，其它的待确定目标可参照本实施例实现相应的目标识别操作。

本实施例的目标识别方法包括以下步骤：

在步骤S302中，根据所述第一图像的时间信息、空间信息、图像特征信息，以及，所述第二图像的时间信息、空间信息、图像特征信息，确定所述第一图像及所述第二图像中分别包含的待确定目标的初步相同概率值。

其中，第一图像和第二图像均包含有待确定目标的信息。

本发明实施例中，第一图像和第二图像具有时空序列关系，且均包含有相应的待确定目标的信息，在综合考虑图像的时间信息、空间信息、图像特征信息的基础上，本领域技术人员可以采用任意适当的方法初步确定这两张图像中的待确定目标的初步相同概率值。

在一种可行方案中，可以使用Siamese-CNN获得所述第一图像及所述第二图像中分别包含的待确定目标的初步相同概率值。

Siamese-CNN是一种至少具有两个分支的CNN，可以同时接收多个输入，输出该多个输入的相似度(可以表现为概率的形式)。以双分支为例，可以通过双分支同时向Siamese-CNN输入两张图像，Siamese-CNN将输出这两张图像之间的相似度，或者，输出两张图像是否相似的判断结果。本实施例中的Siamese-CNN包括三个分支，其中两个分支用于接收输入的图像，一个分支用于接收输入的两个图像之间的时间信息的差异(时间差异)和空间信息的差异(空间差异)。通过对输入的图像进行检测输出图像中目标对象(本实施例中为交通工具)在特征方面的相似度(如外观相似度)，以及，对输入的时间信息的差异和空间信息的差异进行检测输出图像中目标对象在时空方面的相似度。根据这两方面的相似度，可以进一步确定图像中的目标对象，如本实施例中的交通工具的初步相同概率值。

可见，在本实施例中，可以将第一图像和第二图像，以及，第一图像和第二图像之间的时间信息的差异和空间信息的差异输入Siamese-CNN，获得所述第一图像和第二图像中的待确定目标的初步相同概率值。在获得初步相同概率值之后，根据所述初步相同概率值初步确定所述第一图像和第二图像中具有相同的待确定目标。具体地，将所述初步相同概率值与预设值进行比较，当所述初步相同概率值小于或等于预设值时，确定所述第一图像和第二图像中不具有相同的待确定目标，当所述初步相同概率值大于预设值时，初步确定所述第一图像和第二图像中具有相同的待确定目标。其中，所述预设值可以由本领域技术人员根据实际情况适当设置，本发明实施例对此不作限制。

Siamese-CNN可以对具有时空信息的两张图像中的目标对象如交通工具的相似程度进行有效判断，但不限于Siamese-CNN，其它具有类似功能或者可以实现相同目的的方式或神经网络也同样适用于本发明实施例的方案。

在步骤S304中，当所述初步相同概率值大于预设值时，基于所述第一图像及所述第二图像，生成所述预测路径。

相比较于行人的行进路线，待确定目标如交通工具的行进路线更加有规律性，因此，可以联合利用交通工具的特征信息(可以表征交通工具的外观)和时空信息来对交通工具的路线进行估计，以路线估计结果来加强交通工具再识别的可信度。

如前所述，第一图像和第二图像为具有时空序列关系的图像，以此为基础，需要进一步找出图像中的交通工具的可能的行进路线，其中，该行进路线上拍摄的交通工具的图像均应与第一图像和第二图像具有时空序列关系。

在具体的实施方式中，根据第一图像的信息和第二图像的信息，使用MRF生成所述待确定目标的预测路径。具体的实现过程与上述实施二中的步骤S204类似，在此不再赘述。

在步骤S306中，对所述预测路径进行有效性判断，基于判断结果，对所述第一图像和所述第二图像中的待确定目标是否为同一个待确定目标进行再识别。

其中，有效性判断是对一条预测路径是否会为同一个待确定目标的行进路线的可能性判断，其可能性越高则第一图像和第二图像中的待确定目标为同一个待确定目标的可能性也越高。

例如，在某些情况下，有可能初步确定的结果本身就是错误的，也即，第一图像中的交通工具和第二图像中的交通工具可能并不为同一辆交通工具，但却被误识别为同一辆交通工具。若二者不为同一辆交通工具，则二者在可能的合理时间范围内具有相同的行驶路线的概率很低，因此，根据第一图像的信息和第二图像的信息确定有的预测路径的有效性也较低，由此可以实现对第一图像和第二图像中的交通工具是否为同一辆交通工具的再判断和识别。

在具体的实施方式中，通过LSTM，对所述预测路径进行有效性判断，根据判断结果对所述第一图像和第二图像中的待确定目标是否为同一个待确定目标进行再识别。具体的实现过程与上述实施二中的步骤S206类似，在此不再赘述。

根据本实施例提供的目标识别方法，在初步确定所述第一图像及所述第二图像中分别包含的待确定目标相同的基础上，确定该待确定目标可能通过的预测路径；进而，通过对该预测路径的有效性判断，确定初步确定的结果是否准确，以实现对第一图像和第二图像中的待确定目标是否为同一个待确定目标的再识别。其中，有效性判断是对当前预测路径是否会为同一个待确定目标的行进路线的可能性判断，其可能性越高则第一图像和第二图像中的待确定目标为同一个待确定目标的可能性也越高。由此，可以对不同图像中的待确定目标是否为同一个待确定目标进行较为精准的再检测和识别。

实施例四

基于相同的技术构思，图4是示出根据本发明实施例四的一种目标识别装置的结构示意图。可用以执行如实施例一所述的目标识别方法流程。

参照图4，该目标识别装置包括获取模块401、生成模块402和第一确定模块403。

获取模块401，配置为获取第一图像及第二图像，所述第一图像及所述第二图像中均包含待确定目标；

生成模块402，配置为基于所述第一图像及所述第二图像，生成预测路径，所述预测路径的两端分别对应所述第一图像及所述第二图像；

第一确定模块403，配置为对所述预测路径进行有效性判断，基于判断结果，确定所述第一图像及所述第二图像中的待确定目标是否为同一待确定目标。

通过本实施例提供的目标识别装置，基于第一图像和第二图像所包含的信息，生成待确定目标可能通过的预测路径；并通过对该预测路径的有效性判断，以确定第一图像及第二图像中的待确定目标是否相同。其中，有效性判断是对当前预测路径是否会为同一个待确定目标的行进路线的可能性判断，其可能性越高则第一图像和第二图像中的待确定目标为同一个待确定目标的可能性也越高。由此，可以对不同图像中的待确定目标是否为同一个待确定目标进行较为精准的检测和识别。

实施例五

基于相同的技术构思，图5是示出根据本发明实施例五的一种目标识别装置的结构示意图。可用以执行如实施例二所述的目标识别方法流程。

参照图5，该目标识别装置包括获取模块501、生成模块502和第一确定模块503。其中，获取模块501，配置为获取第一图像及第二图像，所述第一图像及所述第二图像中均包含待确定目标；生成模块502，配置为基于所述第一图像及所述第二图像，生成预测路径，所述预测路径的两端分别对应所述第一图像及所述第二图像；第一确定模块503，配置为对所述预测路径进行有效性判断，基于判断结果，确定所述第一图像及所述第二图像中的待确定目标是否为同一待确定目标。

在一实施例中，所述生成模块502，包括：第二生成子模块5021，配置为根据所述第一图像的特征信息、所述第一图像的时间信息、所述第一图像的空间信息、所述第二图像的特征信息、所述第二图像的时间信息、和所述第二图像的空间信息，通过概率模型生成所述待确定目标的预测路径。

在一实施例中，所述第二生成子模块5021，包括：第一确定单元5022，配置为通过MRF从获取的图像集中确定出包含有所述待确定目标的信息、且与所述第一图像和所述第二图像均具有时空序列关系的所有图像；第一生成单元5023，配置为根据确定出的所有图像对应的时间信息和空间信息，生成所述待确定目标的预测路径。

在一实施例中，所述第一生成单元5023，包括：第二生成单元5024，配置为根据确定出的所有图像对应的时间信息和空间信息，生成以所述第一图像为首节点且以所述第二图像为尾节点的一条预测路径，其中，所述预测路径除对应所述首节点和所述尾节点外，还对应至少一个中间节点。

在一实施例中，所述第一确定单元5022，配置为：以所述第一图像的空间信息对应的位置为起始位置，以所述第二图像的空间信息对应的位置为终止位置，获取从所述起始位置至所述终止位置之间的所有摄像设备的位置信息；根据所有摄像设备的位置信息所指示的位置之间的关系，以所述起始位置对应的摄像设备为起点，以所述终止位置对应的摄像设备为终点，生成至少一个设备路径，其中，每个设备路径除包括所述起点的摄像设备和所述终点的摄像设备外，还包括至少一个其它摄像设备的信息；针对每一个设备路径，以所述第一图像的时间信息对应的时间为起始时间，以所述第二图像的时间信息对应的时间为终止时间，从当前路径上的每个其它摄像设备拍摄的图像中，确定出与当前摄像设备相邻的前一摄像设备拍摄的包含所述待确定目标的信息的图像具有设定时间序列关系、且包含所述待确定目标的信息的图像。

在一实施例中，所述第二生成单元5024，配置为：针对每一个设备路径，根据确定出的所述图像的时间序列关系生成相连的具有时空序列关系的多个中间节点；根据所述首节点、所述尾节点、和所述中间节点，生成与当前设备路径对应的具有时空序列关系的图像路径；从每一个设备路径对应的图像路径中，确定出以所述第一图像为首节点且以所述第二图像为尾节点的最大概率图像路径作为所述待确定目标的预测路径。

在一实施例中，所述第二生成单元5024，还配置为：针对每一个设备路径对应的图像路径，获取所述图像路径中每两个相邻节点的图像之间具有同一个待确定目标的信息的概率；根据所述图像路径中每两个相邻节点的图像之间具有同一个待确定目标的信息的概率计算所述图像路径作为所述待确定目标的预测路径的概率；根据每一个图像路径作为所述待确定目标的预测路径的概率确定最大概率图像路径作为所述待确定目标的预测路径。

在一实施例中，所述第一确定模块503，包括：第二确定子模块5031，配置为通过神经网络，对所述预测路径进行有效性判断，基于判断结果，确定所述第一图像和第二图像中的待确定目标是否为同一个待确定目标。

在一实施例中，所述第二确定子模块5031，包括：第一获取单元5032，配置为根据所述预测路径中的相邻的图像的时间信息，获取相邻的图像的时间差异；根据相邻的图像的空间信息，获取相邻的图像的空间差异；根据相邻的图像中的待确定目标的特征信息，获取相邻的图像中的待确定目标的特征差异；第二获取单元5033，配置为将获得的所述预测路径中相邻的图像的时间差异、空间差异和特征差异输入LSTM，获得所述预测路径的待确定目标的识别概率；第二确定单元5034，配置为根据所述预测路径的待确定目标的识别概率，确定所述第一图像和第二图像中的待确定目标是否为同一个待确定目标。

在一实施例中，所述第一获取单元5032，配置为：通过Siamese-CNN分别获取相邻的图像中的待确定目标的特征信息；根据分别获取的所述特征信息，获取相邻的图像中的待确定目标的特征差异。

需要说明的是，对于本发明实施例提供的目标识别装置还涉及的具体细节已在本发明实施例提供的目标识别方法中作了详细的说明，在此不在赘述。

实施例六

基于相同的技术构思，图6是示出根据本发明实施例六的一种目标识别装置的结构示意图。可用以执行如实施例三所述的目标识别方法流程。

参照图6，该目标识别装置包括获取模块601、生成模块603和第一确定模块604。其中，获取模块601，配置为获取第一图像及第二图像，所述第一图像及所述第二图像中均包含待确定目标；生成模块603，配置为基于所述第一图像及所述第二图像，生成预测路径，所述预测路径的两端分别对应所述第一图像及所述第二图像；第一确定模块604，配置为对所述预测路径进行有效性判断，基于判断结果，确定所述第一图像及所述第二图像中的待确定目标是否相同。

在一实施例中，所述待确定目标为交通工具。

在一实施例中，所述装置还包括：第二确定模块602，配置为根据所述第一图像的时间信息、空间信息、图像特征信息，以及，所述第二图像的时间信息、空间信息、图像特征信息，确定所述第一图像及所述第二图像中分别包含的待确定目标的初步相同概率值；相应地，所述生成模块603，包括：第一生成子模块6031，配置为当所述初步相同概率值大于预设值时，基于所述第一图像及所述第二图像，生成所述预测路径。

在一实施例中，所述第二确定模块602，包括：第一确定子模块6021，配置为将所述第一图像和所述第二图像，以及，所述第一图像和所述第二图像之间的时间信息的差异和空间信息的差异输入Siamese-CNN，获得所述第一图像和第二图像中的待确定目标的初步相同概率值。

实施例七

本发明实施例七提供了一种电子设备，例如可以是移动终端、个人计算机(PC)、平板电脑、服务器等。下面参考图7，其示出了适于用来实现本发明实施例的终端设备或服务器的电子设备700的结构示意图：如图7所示，电子设备700包括一个或多个处理器、通信元件等，所述一个或多个处理器例如：一个或多个中央处理单元(CPU)701，和/或一个或多个图像处理器(GPU)713等，处理器可以根据存储在只读存储器(ROM)702中的可执行指令或者从存储部分708加载到随机访问存储器(RAM)703中的可执行指令而执行各种适当的动作和处理。通信元件包括通信组件712和/或通信接口709。其中，通信组件712可包括但不限于网卡，所述网卡可包括但不限于IB(Infiniband)网卡，通信接口709包括诸如LAN卡、调制解调器等的网络接口卡的通信接口，通信接口709经由诸如因特网的网络执行通信处理。

处理器可与只读存储器702和/或随机访问存储器703中通信以执行可执行指令，通过通信总线704与通信组件712相连、并经通信组件712与其他目标设备通信，从而完成本发明实施例提供的任一项目标识别方法对应的操作，例如，获取第一图像及第二图像，所述第一图像及所述第二图像中均包含待确定目标；基于所述第一图像及所述第二图像，生成预测路径，所述预测路径的两端分别对应所述第一图像及所述第二图像；对所述预测路径进行有效性判断，基于判断结果，确定所述第一图像及所述第二图像中的待确定目标是否相同。

此外，在RAM 703中，还可存储有装置操作所需的各种程序和数据。CPU701或GPU713、ROM702以及RAM703通过通信总线704彼此相连。在有RAM703的情况下，ROM702为可选模块。RAM703存储可执行指令，或在运行时向ROM702中写入可执行指令，可执行指令使处理器执行上述通信方法对应的操作。输入/输出(I/O)接口705也连接至通信总线704。通信组件712可以集成设置，也可以设置为具有多个子模块(例如多个IB网卡)，并在通信总线链接上。

以下部件连接至I/O接口705：包括键盘、鼠标等的输入部分706；包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分707；包括硬盘等的存储部分708；以及包括诸如LAN卡、调制解调器等的网络接口卡的通信接口709。驱动器710也根据需要连接至I/O接口705。可拆卸介质711，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器710上，以便于从其上读出的计算机程序根据需要被安装入存储部分708。

需要说明的，如图7所示的架构仅为一种可选实现方式，在具体实践过程中，可根据实际需要对上述图7的部件数量和类型进行选择、删减、增加或替换；在不同功能部件设置上，也可采用分离设置或集成设置等实现方式，例如GPU和CPU可分离设置或者可将GPU集成在CPU上，通信元件可分离设置，也可集成设置在CPU或GPU上，等等。这些可替换的实施方式均落入本发明的保护范围。

特别地，根据本发明实施例，上文参考流程图描述的过程可以被实现为计算机软件程序。例如，本发明实施例包括一种计算机程序产品，其包括有形地包含在机器可读介质上的计算机程序，计算机程序包含用于执行流程图所示的方法的程序代码，程序代码可包括对应执行本发明实施例提供的方法步骤对应的指令，例如，获取第一图像及第二图像，所述第一图像及所述第二图像中均包含待确定目标；基于所述第一图像及所述第二图像，生成预测路径，所述预测路径的两端分别对应所述第一图像及所述第二图像；对所述预测路径进行有效性判断，基于判断结果，确定所述第一图像及所述第二图像中的待确定目标是否相同。在这样的实施例中，该计算机程序可以通过通信元件从网络上被下载和安装，和/或从可拆卸介质711被安装。在该计算机程序被处理器执行时，执行本发明实施例的方法中限定的上述功能。

需要指出，根据实施的需要，可将本发明实施例中描述的各个部件/步骤拆分为更多部件/步骤，也可将两个或多个部件/步骤或者部件/步骤的部分操作组合成新的部件/步骤，以实现本发明实施例的目的。

上述根据本发明实施例的方法可在硬件、固件中实现，或者被实现为可存储在记录介质(诸如CD ROM、RAM、软盘、硬盘或磁光盘)中的软件或计算机代码，或者被实现通过网络下载的原始存储在远程记录介质或非暂时机器可读介质中并将被存储在本地记录介质中的计算机代码，从而在此描述的方法可被存储在使用通用计算机、专用处理器或者可编程或专用硬件(诸如ASIC或FPGA)的记录介质上的这样的软件处理。可以理解，计算机、处理器、微处理器控制器或可编程硬件包括可存储或接收软件或计算机代码的存储组件(例如，RAM、ROM、闪存等)，当所述软件或计算机代码被计算机、处理器或硬件访问且执行时，实现在此描述的处理方法。此外，当通用计算机访问用于实现在此示出的处理的代码时，代码的执行将通用计算机转换为用于执行在此示出的处理的专用计算机。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及方法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明实施例的范围。

以上实施方式仅用于说明本发明实施例，而并非对本发明实施例的限制，有关技术领域的普通技术人员，在不脱离本发明实施例的精神和范围的情况下，还可以做出各种变化和变型，因此所有等同的技术方案也属于本发明实施例的范畴，本发明实施例的专利保护范围应由权利要求限定。

Claims

一种目标识别方法，包括：

获取第一图像及第二图像，所述第一图像及所述第二图像中均包含待确定目标；

基于所述第一图像及所述第二图像，生成预测路径，所述预测路径的两端分别对应所述第一图像及所述第二图像；

对所述预测路径进行有效性判断，基于判断结果，确定所述第一图像及所述第二图像中的待确定目标是否为同一待确定目标。
根据权利要求1所述的方法，其中，所述待确定目标为交通工具。
根据权利要求1所述的方法，其中，所述基于所述第一图像及所述第二图像，生成预测路径之前，所述方法还包括：

根据所述第一图像的时间信息、空间信息、图像特征信息，以及，所述第二图像的时间信息、空间信息、图像特征信息，确定所述第一图像及所述第二图像中分别包含的待确定目标的初步相同概率值；

所述基于所述第一图像及所述第二图像，生成预测路径，包括：

当所述初步相同概率值大于预设值时，基于所述第一图像及所述第二图像，生成所述预测路径。
根据权利要求3所述的方法，其中，根据所述第一图像的时间信息、空间信息、图像特征信息，以及，所述第二图像的时间信息、空间信息、图像特征信息，确定所述第一图像及所述第二图像中分别包含的待确定目标的初步相同概率值，包括：

将所述第一图像和所述第二图像，以及，所述第一图像和所述第二图像之间的时间信息的差异和空间信息的差异输入孪生卷积神经网络Siamese-CNN，获得所述第一图像和第二图像中的待确定目标的初步相同概率值。
根据权利要求1-4任一项所述的方法，其中，所述基于所述第一图像及所述第二图像，生成预测路径，包括：

根据所述第一图像的特征信息、所述第一图像的时间信息、所述第一图像的空间信息、所述第二图像的特征信息、所述第二图像的时间信息、和所述第二图像的空间信息，通过概率模型生成所述待确定目标的预测路径。
根据权利要求5所述的方法，其中，所述通过概率模型生成所述待确定目标的预测路径，包括：

通过链状马尔可夫随机场模型MRF从获取的图像集中确定出包含有所述待确定目标的信息、且与所述第一图像和所述第二图像均具有时空序列关系的所有图像；

根据确定出的所有图像对应的时间信息和空间信息，生成所述待确定目标的预测路径。
根据权利要求6所述的方法，其中，所述根据确定出的所有图像对应的时间信息和空间信息，生成所述待确定目标的预测路径，包括：

根据确定出的所有图像对应的时间信息和空间信息，生成以所述第一图像为首节点且以所述第二图像为尾节点的一条预测路径，其中，所述预测路径除对应所述首节点和所述尾节点外，还对应至少一个中间节点。
根据权利要求7所述的方法，其中，所述通过链状马尔可夫随机场模型MRF从获取的图像集中确定出包含有所述待确定目标的信息、且与所述第一图像和所述第二图像均具有时空序列关系的所有图像，包括：

以所述第一图像的空间信息对应的位置为起始位置，以所述第二图像的空间信息对应的位置为终止位置，获取从所述起始位置至所述终止位置之间的所有摄像设备的位置信息；

根据所有摄像设备的位置信息所指示的位置之间的关系，以所述起始位置对应的摄像设备为起点，以所述终止位置对应的摄像设备为终点，生成至少一个设备路径，其中，每个设备路径除包括所述起点的摄像设备和所述终点的摄像设备外，还包括至少一个其它摄像设备的信息；

针对每一个设备路径，以所述第一图像的时间信息对应的时间为起始时间，以所述第二图像的时间信息对应的时间为终止时间，从当前路径上的每个其它摄像设备拍摄的图像中，确定出与当前摄像设备相邻的前一摄像设备拍摄的包含所述待确定目标的信息的图像具有设定时间序列关系、且包含所述待确定目标的信息的图像。
根据权利要求8所述的方法，其中，所述根据确定出的所有图像对应的时间信息和空间信息，生成以所述第一图像为首节点且以所述第二图像为尾节点的一条预测路径，包括：

针对每一个设备路径，根据确定出的所述图像的时间序列关系生成相连的具有时空序列关系的多个中间节点；根据所述首节点、所述尾节点、和所述中间节点，生成与当前设备路径对应的具有时空序列关系的图像路径；

从每一个设备路径对应的图像路径中，确定出以所述第一图像为首节点且以所述第二图像为尾节点的最大概率图像路径作为所述待确定目标的预测路径。
根据权利要求9所述的方法，其中，所述从每一个设备路径对应的图像路径中，确定出以所述第一图像为首节点且以所述第二图像为尾节点的最大概率图像路径作为所述待确定目标的预测路径，包括：

针对每一个设备路径对应的图像路径，获取所述图像路径中每两个相邻节点的图像之间具有同一个待确定目标的信息的概率；

根据所述图像路径中每两个相邻节点的图像之间具有同一个待确定目标的信息的概率计算所述图像路径作为所述待确定目标的预测路径的概率；

根据每一个图像路径作为所述待确定目标的预测路径的概率确定最大概率图像路径作为所述待确定目标的预测路径。
根据权利要求1-10任一项所述的方法，其中，所述对所述预测路径进行有效性判断，基于判断结果，确定所述第一图像及所述第二图像中的待确定目标是否为同一待确定目标，包括：

通过神经网络，对所述预测路径进行有效性判断，基于判断结果，确定所述第一图像和第二图像中的待确定目标是否为同一个待确定目标。
根据权利要求11所述的方法，其中，所述通过神经网络，对所述预测路径进行有效性判断，基于判断结果，确定所述第一图像和第二图像中的待确定目标是否为同一个待确定目标，包括：

根据所述预测路径中的相邻的图像的时间信息，获取相邻的图像的时间差异；根据相邻的图像的空间信息，获取相邻的图像的空间差异；根据相邻的图像中的待确定目标的特征信息，获取相邻的图像中的待确定目标的特征差异；

将获得的所述预测路径中相邻的图像的时间差异、空间差异和特征差异输入长短时记忆网络LSTM，获得所述预测路径的待确定目标的识别概率；

根据所述预测路径的待确定目标的识别概率，确定所述第一图像和第二图像中的待确定目标是否为同一个待确定目标。
根据权利要求12所述的方法，其中，根据相邻的图像中的待确定目标的特征信息，获取相邻的图像中的待确定目标的特征差异，包括：

通过Siamese-CNN分别获取相邻的图像中的待确定目标的特征信息；

根据分别获取的所述特征信息，获取相邻的图像中的待确定目标的特征差异。
一种目标识别装置，包括：

获取模块，配置为获取第一图像及第二图像，所述第一图像及所述第二图像中均包含待确定目标；

生成模块，配置为基于所述第一图像及所述第二图像，生成预测路径，所述预测路径的两端分别对应所述第一图像及所述第二图像；

第一确定模块，配置为对所述预测路径进行有效性判断，基于判断结果，确定所述第一图像及所述第二图像中的待确定目标是否为同一待确定目标。
根据权利要求14所述的装置，其中，所述待确定目标为交通工具。
根据权利要求14所述的装置，其中，所述装置还包括：

第二确定模块，配置为根据所述第一图像的时间信息、空间信息、图像特征信息，以及，所述第二图像的时间信息、空间信息、图像特征信息，确定所述第一图像及所述第二图像中分别包含的待确定目标的初步相同概率值；

所述生成模块，包括：

第一生成子模块，配置为当所述初步相同概率值大于预设值时，基于所述第一图像及所述第二图像，生成所述预测路径。
根据权利要求16所述的装置，其中，所述第二确定模块，包括：

第一确定子模块，配置为将所述第一图像和所述第二图像，以及，所述第一图像和所述第二图像之间的时间信息的差异和空间信息的差异输入孪生卷积神经网络Siamese-CNN，获得所述第一图像和第二图像中的待确定目标的初步相同概率值。
根据权利要求14-17任一项所述的装置，其中，所述生成模块，包括：

第二生成子模块，配置为根据所述第一图像的特征信息、所述第一图像的时间信息、所述第一图像的空间信息、所述第二图像的特征信息、所述第二图像的时间信息、和所述第二图像的空间信息，通过概率模型生成所述待确定目标的预测路径。
根据权利要求18所述的装置，其中，所述第二生成子模块，包括：

第一确定单元，配置为通过链状马尔可夫随机场模型MRF从获取的图像集中确定出包含有所述待确定目标的信息、且与所述第一图像和所述第二图像均具有时空序列关系的所有图像；

第一生成单元，配置为根据确定出的所有图像对应的时间信息和空间信息，生成所述待确定目标的预测路径。
根据权利要求19所述的装置，其中，所述第一生成单元，包括：

第二生成单元，配置为根据确定出的所有图像对应的时间信息和空间信息，生成以所述第一图像为首节点且以所述第二图像为尾节点的一条预测路径，其中，所述预测路径除对应所述首节点和所述尾节点外，还对应至少一个中间节点。
根据权利要求20所述的装置，其中，所述第一确定单元，配置为：

以所述第一图像的空间信息对应的位置为起始位置，以所述第二图像的空间信息对应的位置为终止位置，获取从所述起始位置至所述终止位置之间的所有摄像设备的位置信息；

根据所有摄像设备的位置信息所指示的位置之间的关系，以所述起始位置对应的摄像设备为起点，以所述终止位置对应的摄像设备为终点，生成至少一个设备路径，其中，每个设备路径除包括所述起点的摄像设备和所述终点的摄像设备外，还包括至少一个其它摄像设备的信息；

针对每一个设备路径，以所述第一图像的时间信息对应的时间为起始时间，以所述第二图像的时间信息对应的时间为终止时间，从当前路径上的每个其它摄像设备拍摄的图像中，确定出与当前摄像设备相邻的前一摄像设备拍摄的包含所述待确定目标的信息的图像具有设定时间序列关系、且包含所述待确定目标的信息的图像。
根据权利要求21所述的装置，其中，所述第二生成单元，配置为：

针对每一个设备路径，根据确定出的所述图像的时间序列关系生成相连的具有时空序列关系的多个中间节点；根据所述首节点、所述尾节点、和所述中间节点，生成与当前设备路径对应的具有时空序列关系的图像路径；

从每一个设备路径对应的图像路径中，确定出以所述第一图像为首节点且以所述第二图像为尾节点的最大概率图像路径作为所述待确定目标的预测路径。
根据权利要求22所述的装置，其中，所述第二生成单元，还配置为：

针对每一个设备路径对应的图像路径，获取所述图像路径中每两个相邻节点的图像之间具有同一个待确定目标的信息的概率；

根据所述图像路径中每两个相邻节点的图像之间具有同一个待确定目标的信息的概率计算所述图像路径作为所述待确定目标的预测路径的概率；

根据每一个图像路径作为所述待确定目标的预测路径的概率确定最大概率图像路径作为所述待确定目标的预测路径。
根据权利要求14-23任一项所述的装置，其中，所述第一确定模块，包括：

第二确定子模块，配置为通过神经网络，对所述预测路径进行有效性判断，基于判断结果，确定所述第一图像和第二图像中的待确定目标是否为同一个待确定目标。
根据权利要求24所述的装置，其中，所述第二确定子模块，包括：

第一获取单元，配置为根据所述预测路径中的相邻的图像的时间信息，获取相邻的图像的时间差异；根据相邻的图像的空间信息，获取相邻的图像的空间差异；根据相邻的图像中的待确定目标的特征信息，获取相邻的图像中的待确定目标的特征差异；

第二获取单元，配置为将获得的所述预测路径中相邻的图像的时间差异、空间差异和特征差异输入长短时记忆网络LSTM，获得所述预测路径的待确定目标的识别概率；

第二确定单元，配置为根据所述预测路径的待确定目标的识别概率，确定所述第一图像和第二图像中的待确定目标是否为同一个待确定目标。
根据权利要求25所述的装置，其中，所述第一获取单元，配置为：

通过Siamese-CNN分别获取相邻的图像中的待确定目标的特征信息；

根据分别获取的所述特征信息，获取相邻的图像中的待确定目标的特征差异。
一种计算机可读存储介质，其上存储有计算机程序指令，其中，所述程序指令被处理器执行时实现权利要求1至13中任意一项权利要求所述的目标识别方法的步骤。
一种电子设备，包括：处理器、存储器、通信元件和通信总线，所述处理器、所述存储器和所述通信元件通过所述通信总线完成相互间的通信；

所述存储器用于存放至少一可执行指令，所述可执行指令使所述处理器执行如权利要求1至13中任意一项权利要求所述的目标识别方法的步骤。