WO2019237516A1

WO2019237516A1 - 目标跟踪方法、装置、计算机设备及存储介质

Info

Publication number: WO2019237516A1
Application number: PCT/CN2018/103516
Authority: WO
Inventors: 马潜
Original assignee: 平安科技（深圳）有限公司
Priority date: 2018-06-11
Filing date: 2018-08-31
Publication date: 2019-12-19
Also published as: CN109035299B; CN109035299A

Abstract

一种目标跟踪方法、装置、计算机设备及存储介质，所述方法包括：获取每帧图像中的检测窗口；根据预设尺寸对每个检测窗口进行归一化处理和区域分割，提取每个子区域的特征值，组成待检测目标的特征向量；按照预设的选取方式确定起始帧、检测帧和基准向量集；计算待检测目标的特征向量与基准向量集中的每个基准特征向量之间的相似度，并获取最大相似度；若最大相似度大于或等于第一相似度阈值，则确定该最大相似度对应的特征向量和基准特征向量属于同一个跟踪目标，并根据该特征向量记录该跟踪目标的变化轨迹。能有效降低多机位跟踪目标时待检测目标的误判率，提高目标检测精度。

Description

目标跟踪方法、装置、计算机设备及存储介质

本申请以2018年06月11日提交的申请号为201810593793.0，名称为“目标跟踪方法、装置、计算机设备及存储介质”的中国发明专利申请为基础，并要求其优先权。

技术领域

本申请涉及图像处理技术领域，尤其涉及一种目标跟踪方法、装置、计算机设备及存储介质。

背景技术

目标跟踪是计算机视觉领域中一个重要的研究分支，其在军事制导、视频监控、智能交通、机器人以及人工智能等领域有着广泛的应用。

目前，采用多机位摄像头对目标进行摄像跟踪时，不同机位获取到的目标图像在角度、尺寸以及色彩等方面会有所差异，使得对每个机位获取的目标图像分别处理后，误差将进一步扩大，这导致了目标检测出错的几率大，检测精度不高。

发明内容

基于此，有必要针对上述技术问题，提供一种在多机位目标跟踪时提高目标检测精度的目标跟踪方法、装置、计算机设备及存储介质。

一种目标跟踪方法，包括：

接收多机位摄像头采集的视频数据；

对所述视频数据进行分帧处理得到的每帧图像进行目标检测，获取每帧图像进行目标检测时的检测窗口，其中，每个所述检测窗口包含一个待检测目标；

根据预设尺寸对每个所述检测窗口进行归一化处理，得到该检测窗口对应的目标区域图像，使得每个所述目标区域图像的图像尺寸均一致；

针对每个所述待检测目标，根据预设的切分方式对该待检测目标的目标区域图像进行区域分割，得到N个子区域，并提取每个所述子区域的特征值，构成子特征向量，将N个所述子特征向量组成该检测窗口所对应的待检测目标的特征向量，其中，N为正整数；

按照预设的选取方式，从所述视频数据分帧处理后的帧图像中确定起始帧和检测帧，并以所述起始帧中的K个所述待检测目标作为跟踪目标，将K个所述跟踪目标对应的基准特征向量构成基准向量集，其中，K为正整数；

针对所述检测帧中的每个所述待检测目标，将所述检测帧中的待检测目标的特征向量与所述基准向量集中的K个所述基准特征向量进行逐个相似度计算，其中，所述检测帧中的每个所述待检测目标对应K个相似度，从K个所述相似度中获取最大相似度作为所述检测帧中每个所述待检测目标对应的最大相似度；

若所述检测帧中所述待检测目标对应的最大相似度大于或等于预设的第一相似度阈值，则确定该最大相似度对应的特征向量和该最大相似度对应的基准特征向量属于同一个跟踪目标，并根据该特征向量记录该跟踪目标的变化轨迹。

一种目标跟踪装置，包括：

视频数据采集模块，用于接收多机位摄像头采集的视频数据；

检测窗口获取模块，用于对所述视频数据进行分帧处理得到的每帧图像进行目标检测，获取每帧图像进行目标检测时的检测窗口，其中，每个所述检测窗口包含一个待检测目标；

归一化处理模块，用于根据预设尺寸对每个所述检测窗口进行归一化处理，得到该检测窗口对应的目标区域图像，使得每个所述目标区域图像的图像尺寸均一致；

区域分割计算模块，用于针对每个所述待检测目标，根据预设的切分方式对该待检测目标的目标区域图像进行区域分割，得到N个子区域，并提取每个所述子区域的特征值，构成子特征向量，将N个所述子特征向量组成该检测窗口所对应的待检测目标的特征向量，其中，N为正整数；

基准向量集设置模块，用于按照预设的选取方式，从所述视频数据分帧处理后的帧图像中确定起始帧和检测帧，并以所述起始帧中的K个所述待检测目标作为跟踪目标，将K个所述跟踪目标对应的基准特征向量构成基准向量集，其中，K为正整数；

相似度计算模块，用于针对所述检测帧中的每个所述待检测目标，将所述检测帧中的待检测目标的特征向量与所述基准向量集中的K个所述基准特征向量进行逐个相似度计算，其中，所述检测帧中的每个所述待检测目标对应K个相似度，从K个所述相似度中获取最大相似度作为所述检测帧中每个所述待检测目标对应的最大相似度；

跟踪目标判断处理模块，用于若所述检测帧中所述待检测目标对应的最大相似度大于或等于预设的第一相似度阈值，则确定该最大相似度对应的特征向量和该最大相似度对应的基准特征向量属于同一个跟踪目标，并根据该特征向量记录该跟踪目标的变化轨迹。

一种计算机设备，包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机可读指令，所述处理器执行所述计算机可读指令时实现上述目标跟踪方法的步骤。

一个或多个存储有计算机可读指令的非易失性可读存储介质，所述计算机可读指令被一个或多个处理器执行时，使得所述一个或多个处理器执行上述目标跟踪方法的步骤。

本申请的一个或多个实施例的细节在下面的附图和描述中提出，本申请的其他特征和优点将从说明书、附图以及权利要求变得明显。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对本申请实施例的描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本申请一实施例中目标跟踪方法的一应用环境示意图；

图2是本申请一实施例中目标跟踪方法的流程图；

图3是本申请一实施例中目标检测的示意图；

图4是本申请一实施例中确定新目标的流程图；

图5是本申请一实施例中步骤S6的具体实现流程图；

图6是本申请一实施例中更新基准特征向量的具体实现流程图；

图7是本申请一实施例中目标跟踪装置的示意图；

图8是本申请一实施例中计算机设备的示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请提供的目标跟踪方法，可应用在采用多机位摄像头对目标进行摄像跟踪的应用环境中，如图1所示，该应用环境包括后台服务端和前端采集设备，其中，后台服务端和前端采集设备之间网络进行连接，该网络可以是有线网络或者无线网络，前端采集设备具体包括但不限于不同机位的摄像机设备，前端采集设备对目标进行视频摄像后，将视频数据发送到后台服务端，后台服务端对通过对视频数据进行处理，实现对目标的跟踪，后台服务端具体可以用独立的服务器或者多个服务器组成的服务器集群实现。本申请实施例提供的目标跟踪方法应用于后台服务端。

在一实施例中，如图2所示，提供了一种目标跟踪方法，其实现流程包括如下步骤：

S1：接收多机位摄像头采集的视频数据。

在本申请实施例中，在同一个视频监控区域内的不同位置安装多个摄像头，每个摄像头都是独立工作的，将它们采集到的视频数据进行结合，可以避免监控死角，以及准确的反应目标移动的轨迹。

具体地，后台服务端接收视频监控区域内的不同位置的摄像头采集到的视频数据。

S2：对视频数据进行分帧处理得到的每帧图像进行目标检测，获取每帧图像进行目标检测时的检测窗口，其中，每个检测窗口包含一个待检测目标。

在本申请实施例中，由于不同机位摄像头采集视频数据的时间不同，因此，后台服务端接收到视频数据后，按照视频数据的采集时间的先后顺序对每个视频数据进行分帧处理，得到的每一帧图像，称为检测图像。检测图像可以是来自于不同机位。对检测图像进行目标检测，即对检测图像进行识别，也叫目标提取，是一种基于目标几何和统计特征的图像分割，能检测出图像中的待检测目标，该待监测目标可以是行人或者动物等物体。在检测到检测图像中的待监测目标之后，获取该待检测目标对应的检测窗口。其中，检测窗口的数量是和待检测目标的数量一致，若检测图像中不存在待检测目标，则检测图像中检测窗口的数量为0。

具体地，对步骤S1得到的视频数据，用OpenCV提供的分帧功能进行分帧处理，得到单帧图像。OpenCV是一个基于伯克利软件发行版(Berkeley Software Distribution，BSD)许可发行的跨平台计算机视觉库，可以运行在Linux、Windows、Android和Mac OS等操作系统上。

采用目标检测算法对分帧处理后的单帧图像进行目标检测，检测每帧图像中包含的待检测目标，并获取每个待检测目标所在的检测窗口。常用的目标检测算法包括但不限于YOLO、SSD、R-CNN、SPP-NET和Fast R-CNN等。可以采用OpenCV结合上述一个或多个目标检测算法实现对检测图像的目标检测。

请参阅图3，图3示出了对一帧检测图像进行目标检测的结果的示意图。如图3所示，通过对该检测图像进行目标检测，获取待检测目标的检测窗口，该检测窗口为一矩形窗，其中，检测窗口A、检测窗口B和检测窗口C中的待检测目标均为人物，检测窗口D中的待检测目标为车辆。

S3：根据预设尺寸对每个检测窗口进行归一化处理，得到该检测窗口对应的目标区域图像，使得每个目标区域图像的图像尺寸均一致。

在本申请实施例中，由于多个摄像头分布在不同的位置，并且拍摄的角度各不相同，因此对同一跟踪目标获取到的检测窗口的尺寸不一。通过对每个检测窗口的尺寸进行归一化处理，使得各个检测窗口的尺寸统一，有利于在相同的水平基础上评估检测窗口中待检测目标的特征，从而使得后续进行特征相似度计算时，能够使得从不同机位的摄像机得到的特征向量在同一数量级进行计算，从而提高计算结果的准确性。

具体地，利用OpenCV中的图形图像转换函数对每个检测窗口进行归一化处理

下面，以OpenCV中的图形图像转换函数resize()为例进行说明，resize()函数的定义及其参数的具体含义详述如下：

void resize(InputArray src,OutputArray dst,Size dsize,double fx＝0,double fy＝0)

其中，src为输入参数，表示检测窗口的尺寸，dst为输出参数，表示归一化处理之后的目标区域图像，dsize为目标区域图像的尺寸大小，fx为横向方向的缩放比例，fy为纵向方向的缩放比例。

以图3中的检测窗口A为例，假设1号摄像头获取的检测窗口大小是10*35dpi(Dots Per Inch，每英寸点数)，2号摄像头获取的检测窗口大小是15*10dpi，则通过归一化处理，将2号摄像头获取的检测窗口大小转化为10*35dpi，或者将1号摄像头获取的检测窗口大小转化为15*10dpi，或者将两者转化为某一预定尺寸的大小。

需要说明的是，预设尺寸具体可以根据实际应用的需要进行设置，此处不做限制。

S4：针对每个待检测目标，根据预设的切分方式对该待检测目标的目标区域图像进行区域分割，得到N个子区域，并提取每个子区域的特征值，构成子特征向量，将N个子特征向量组成该检测窗口所对应的待检测目标的特征向量，其中，N为正整数。

可以理解的，在一帧图像中，像素的色彩可能分布不均的，例如，背景的色彩可能是大块且连续的，而跟踪目标的色彩基本是固定的。因此，基于图像色彩的复杂性，将图像分割成更小的区域，用更细的粒度来反应一帧图像的特征信息比单纯对整帧图像进行特征处理要更加准确和稳定。

具体地，针对每个待检测目标，根据预设的切分方式对该待检测目标的目标区域图像进行区域分割，得到N个子区域。

需要说明的是，预设的切分方式可以是沿水平方向或者垂直方向对目标区域图像按照预设的分割数量进行平均分割，也可以是按照固定的像素值进行水平方向或者垂直方向分割，还可以是其他的切分方式，其具体可以根据实际应用的需要进行设置，此处不做限制。

优选地，按照预设的分割数量对目标区域图像进行纵向平均区域分割，得到多个子区域。例如，预设的分割数量为10，将尺寸为240*120dpi的目标区域图像进行纵向平均区域分割，得到10个子区域，则每个子区域的图像尺寸为24*120dpi。

在对每个待检测目标的目标区域图像进行区域分割后，得到N个子区域，对每个子区域进行特征提取，得到每个子区域的特征值，将该特征值构成子特征向量，并将N个子特征向量组成待检测目标的特征向量，使得每个待检测目标的特征向量转化为各个子区域的特征向量的总和。

其中，对每个子区域的特征提取具体可以采用离散傅里叶变换、离散余弦变换等方式，优选地，可以进行离散小波变换，得到能稳定的反应该子区域的图像特征的特征值。

S5：按照预设的选取方式，从视频数据分帧处理后的帧图像中确定起始帧和检测帧，并以该起始帧中的K个待检测目标作为跟踪目标，将K个跟踪目标对应的基准特征向量构成基准向量集，其中，K为正整数。

在本申请实施例中，基准特征向量是指用于跟踪的跟踪目标对应的特征向量。

需要说明的是，预设的选取方式包括对起始帧和检测帧的选取方式。其中，起始帧用于确定跟踪目标和基准特征向量，检测帧用于判断跟踪目标的变化轨迹。对于起始帧的选取方式，可以是选取视频数据分帧处理后的第一帧图像作为起始帧，或者选取视频数据分帧处理后的第i帧图像作为起始帧，其中，i大于1；对于检测帧的选取方式，可以是起始帧之后的每一帧图像，也可以是从起始帧开始每隔预定帧数的帧图像。预设的选取方式具体可以根据实际应用的需要进行设置，此处不做限制。

具体地，获取起始帧中的K个待检测目标，将该K个待检测目标作为跟踪目标，并将每个跟踪目标对应的特征向量作为该跟踪目标的基准特征向量，K个基准特征向量构成了一个基准向量集。

继续以图3为例，假设以图3的这一帧图像作为起始帧，则根据图3中的4个检测窗口，分别是检测窗口A、检测窗口B、检测窗口C和检测窗口D，得到4个基准特征向量，这4个基准特征向量组成一个基准向量集。

可以理解的是，针对每个跟踪目标，通过比对该跟踪目标在起始帧图像中的位置与检测帧图像中的位置之间的关系，能够得到该跟踪目标的运动轨迹或者变化状态。

S6：针对检测帧中的每个待检测目标，将检测帧中的待检测目标的特征向量与基准向量集中的K个基准特征向量进行逐个相似度计算，其中，检测帧中的每个待检测目标对应K个相似度，从K个相似度中获取最大相似度作为检测帧中每个待检测目标对应的最大相似度。

具体地，通过计算两个向量之间的距离定义相似度，距离越近则两个向量之间的相似度越大，反之，距离越远则两个向量之间的相似度越小。

可选地，可以采用欧几里得距离算法、曼哈顿距离算法或者余弦相似度算法等实现对相似度的计算。继续以图3为例，假设从起始帧开始每隔10帧选取的帧图像作为检测帧，则计算检测帧中的4个待检测目标的特征向量与基准向量集中的每个基准特征向量之间的相似度，对每个待检测目标均得到1个包含4个相似度的相似度集合，并从该相似度集合中获取值最大的相似度为检测帧中待检测目标对应的最大相似度，从而每个待检测目标均对应一个最大相似度。

S7：若检测帧中待检测目标对应的最大相似度大于或等于预设的第一相似度阈值，则确定该最大相似度对应的特征向量和该最大相似度对应的基准特征向量属于同一个跟踪目标，并根据该特征向量记录该跟踪目标的变化轨迹。

具体地，若步骤S6得到的检测帧中待检测目标对应的最大相似度大于或者等于预设的第一相似度阈值，则确定该最大相似度对应的特征向量和该最大相似度对应的基准特征向量属于同一个跟踪目标，并根据该特征向量记录该跟踪目标的变化轨迹。

其中，变化轨迹的记录方式可以是直接记录该特征向量，也可以是分析并记录特征向量与基准特征向量之间的区别特征，还可以是其他能够体现跟踪目标变化轨迹的记录方式，其具体可以根据实际应用的需要进行设置，此处不做限制。

需要说明的是，预设的第一相似度阈值可以根据跟踪目标的类型进行动态调整。例如，当跟踪目标的类型是人物时，第一相似度阈值可以设置为80％，即当检测帧中待检测目标对应的最大相似度大于或等于80％时，确定该最大相似度对应的特征向量和该最大相似度对应的基准特征向量属于同一个人；当跟踪目标的类型是车辆时，由于车辆色彩相对人物更加单一，判断起来误差更小，因此可以将第一相似度阈值设置为70％，即当检测帧中待检测目标对应的最大相似度大于或等于70％时，确定该最大相似度对应的特征向量和该最大相似度对应的基准特征向量属于同一辆车辆。

在本实施例中，对接收到的多机位摄像头采集的视频数据进行分帧处理后，获取每帧图像进行目标检测时的监测窗口，通过对检测窗口进行归一化处理，使得对归一化后的目标区域图像进行特征相似度计算时，能够使得从不同机位的摄像机得到的特征向量在同一数量级进行计算，从而提高计算结果的准确性；在对目标区域图像进行特征提取时，通过对目标区域图像进行区域分割，得到多个子区域，分别提取每个子区域的子特征向量，作为待检测目标的特征向量，通过多个子特征向量的方式能够更加准确的反应待检测目标的特征，进而通过计算待检测目标的特征向量与基准向量集中的每个基准特征向量之间的相似度，并根据检测帧中待检测目标对应的最大相似度与预设的第一相似度阈值的比较结果，能够准确判断该最大相似度对应的特征向量和基准特征向量是否属于同一个跟踪目标，从而有效降低多机位跟踪目标时待检测目标的误判率，提高目标检测精度。

还可以进一步判断待检测目标是否为新出现的目标，并保存其特征向量在一实施例中，如图4所示，在步骤S6之后，还可以进一步判断待检测目标是否为新出现的目标，并保存其特征向量，该目标跟踪方法还包括如下步骤：

S81：若检测帧中待检测目标对应的最大相似度小于预设的第二相似度阈值，则确定该最大相似度对应的特征向量属于新目标，其中，第二相似度阈值小于第一相似度阈值。

具体地，若步骤S6得到的检测帧中待检测目标对应的最大相似度小于预设的第二相似度阈值，则说明该最大相似度对应的特征向量与基准向量集中的每个基准特征向量之间均不相似，即该最大相似度对应的特征向量属于新目标。

其中，预设的第二相似度阈值也可以根据跟踪目标的类型进行动态调整，但第二相似度阈值与第一相似度阈值的不同之处在于，第一相似度阈值是判断检测帧中待检测目标对应的最大相似度对应的特征向量和该最大相似度对应的基准特征向量是否属于同一个跟踪目标，而第二相似度阈值是用来判断检测帧中待检测目标对应的最大相似度对应的特征向量所属的待检测目标是否是一个新出现的跟踪目标。

例如，当跟踪目标的类型是人物时，预设的第二相似度阈值为20％，若检测帧中待检测目标对应的最大相似度小于20％，则确定该最大相似度对应的特征向量属于非人物类型的新目标；当跟踪目标的类型是车辆时，预设的第二相似度阈值为40％，若检测帧中待检测目标对应的最大相似度小于40％，则确定该最大相似度对应的特征向量属于非车辆类型的新目标。

S82：将新目标的特征向量添加到基准向量集中。

具体地，对于步骤S81确定的新目标，将其特征向量记录到基准向量集中，以便在后续的跟踪过程中进行相似度计算。

在本实施例中，确定待检测目标是否属于新出现的跟踪目标。对于新出现的跟踪目标，将其特征向量保存到基准向量集中去，以便后续对新出现的跟踪目标进行跟踪。

在一实施例中，如图5所示，在步骤S6中，即针对检测帧中的每个待检测目标，将检测帧中的待检测目标的特征向量与基准向量集中的K个基准特征向量进行逐个相似度计算，其中，检测帧中的每个待检测目标对应K个相似度，从K个相似度中获取最大相似度作为检测帧中每个待检测目标对应的最大相似度，具体包括如下步骤：

S61：针对检测帧中的每个待检测目标，在计算该待检测目标的特征向量与基准向量集中的每个基准特征向量之间的相似度时，将该待检测目标的特征向量中的每个子特征向量与该基准特征向量中的每个子特征向量进行同位置比较，得到N个子向量相似度。

在本申请实施例中，待检测目标的特征向量和基准特征向量都是对N个子区域进行特征提取得到的N个子特征向量组成的。在向量相似度比较过程中，将待检测目标的特征向量中每个子区域的子特征向量分别与基准特征向量中相同位置的子区域的子特征向量进行比较，得到N个子向量相似度。例如，若待检测目标的特征向量和基准特征向量都存在10个子特征向量，即N等于10，则将相同位置的子区域的子特征向量进行比较计算，得到10个子向量相似度。

可选地，可以采用欧几里得距离算法、曼哈顿距离算法或者余弦相似度算法等来实现对子向量相似度的计算。

S62：根据预设的权重分配方式，对N个子向量相似度进行加权计算，得到相似度。

需要说明的是，在一个目标区域图像中，不同子区域中包含的像素点信息是不同的，一般来说，越接近中间区域位置的像素点信息就越能代表待检测目标的特征，而远离中间区域位置的像素点信息可能代表的是图像背景的特征。因此，在预设的权重分配方式中为不同子区域设置不同的权值，接近中间区域位置的子区域的权值大于远离中间区域位置的子区域的权值，并且不同子区域之间的权值可以按线性变化。

具体地，根据预设的每个子区域的权重，按照公式(1)将每个子区域对应的子向量相似度进行加权求和再取平均值，得到两个待检测目标的特征向量与基准特征向量之间的向量相似度SIM：

其中，N为子区域的个数，a _i为第i个子区域的权值，s _i为第i个子区域对应的子特征向量相似度。

在本实施例中，通过将待检测目标的特征向量中各个子特征向量与基准特征向量中的各个子特征向量进行同位置比较，得到N个子向量相似度，并按照预设的权重分配方式使用公式(1)进行相似度计算，可以过滤掉图像边缘的不重要的信息对特征向量产生的影响，能够更加准确的反应待检测目标的特征，从而准确识别跟踪目标。

在一实施例中，在步骤S7之后，还可以进一步对基准特征向量进行更新，该目标跟踪方法还包括如下步骤：

S8：将检测帧中待检测目标对应的最大相似度对应的基准特征向量更新为检测帧中待检测目标对应的最大相似度对应的特征向量。

具体地，由于基准特征向量代表的是跟踪目标的起始状态，而跟踪目标随着时间的推移会在形体、角度、距离等方面发生变化。在检测帧中获取到的待检测目标对应的最大相似度对应的特征向量更能够代表跟踪目标当前的状态。

在本实施例中，将跟踪目标的基准特征向量替换为检测帧中待检测目标对应的最大相似度对应的特征向量，从而有效提高了后续通过相似度计算检测跟踪目标的准确性。

在一实施例中，如图6所示，在步骤S7之后，还可以通过另一种方式对基准特征向量进行更新，该目标跟踪方法还包括如下步骤：

S71：计算检测帧中待检测目标对应的最大相似度对应的特征向量和检测帧中待检测目标对应的最大相似度对应的基准特征向量之间的平均值。

具体地，根据步骤S7确定的特征向量和基准特征向量，计算该特征向量和该基准特征向量之间的平均值。

S72：将检测帧中待检测目标对应的最大相似度对应的基准特征向量更新为平均值。

具体地，将跟踪目标的基准特征向量更新为步骤S71得到的平均值。

在本实施例中，通过用检测帧中待检测目标对应的最大相似度对应的特征向量和检测帧中待检测目标对应的最大相似度对应的基准特征向量之间的平均值来代替检测帧中待检测目标对应的最大相似度对应的基准特征向量，能够避免相似度数值变化过大而引起的误差，从而能够更加精准的描述跟踪目标的特征值变化，有效提高目标检测精度。

应理解，上述实施例中各步骤的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本申请实施例的实施过程构成任何限定。

在一实施例中，提供一种目标跟踪装置，该目标跟踪装置与上述实施例中目标跟踪方法一一对应。如图7所示，该目标跟踪装置包括：视频数据采集模块71，检测窗口获取模块72，归一化处理模块73，区域分割计算模块74，基准向量集设置模块75，相似度计算模块76，跟踪目标判断处理模块77。各功能模块详细说明如下：

视频数据采集模块71：用于接收多机位摄像头采集的视频数据；

检测窗口获取模块72：用于对视频数据进行分帧处理得到的每帧图像进行目标检测，获取每帧图像进行目标检测时的检测窗口，其中，每个检测窗口包含一个待检测目标；

归一化处理模块73：用于根据预设尺寸对每个检测窗口进行归一化处理，得到该检测窗口对应的目标区域图像，使得每个目标区域图像的图像尺寸均一致；

区域分割计算模块74：用于针对每个待检测目标，根据预设的切分方式对该待检测目标的目标区域图像进行区域分割，得到N个子区域，并提取每个子区域的特征值，构成子特征向量，将N个子特征向量组成该检测窗口所对应的待检测目标的特征向量，其中，N为正整数；

基准向量集设置模块75：用于按照预设的选取方式，从视频数据分帧处理后的帧图像中确定起始帧和检测帧，并以起始帧中的K个待检测目标作为跟踪目标，将K个跟踪目标对应的基准特征向量构成基准向量集，其中，K为正整数；

相似度计算模块76：用于针对检测帧中的每个待检测目标，将检测帧中的待检测目标的特征向量与基准向量集中的K个基准特征向量进行逐个相似度计算，其中，检测帧中的每个待检测目标对应K个相似度，从K个相似度中获取最大相似度作为检测帧中每个待检测目标对应的最大相似度；

跟踪目标判断处理模块77：用于若检测帧中待检测目标对应的最大相似度大于或等于预设的第一相似度阈值，则确定该最大相似度对应的特征向量和该最大相似度对应的基准特征向量属于同一个跟踪目标，并根据该特征向量记录该跟踪目标的变化轨迹。

进一步地，该目标跟踪装置还包括：

新目标判断模块781：用于若检测帧中待检测目标对应的最大相似度小于预设的第二相似度阈值，则确定该最大相似度对应的特征向量属于新目标，其中，第二相似度阈值小于第一相似度阈值；

新目标采集模块782：用于将新目标的特征向量添加到基准向量集中。

进一步地，相似度计算模块76包括：

子特征向量比较子模块761：用于针对检测帧中的每个待检测目标，在计算该待检测目标的特征向量与基准向量集中的每个基准特征向量之间的相似度时，将该待检测目标的特征向量中的每个子特征向量与该基准特征向量中的每个子特征向量进行同位置比较，得到N个子向量相似度；

加权计算子模块762：用于根据预设的权重分配方式，对N个子向量相似度进行加权计算，得到相似度。

进一步地，该目标跟踪装置还包括：

第一更新模块79：用于将检测帧中待检测目标对应的最大相似度对应的基准特征向量更新为检测帧中待检测目标对应的最大相似度对应的特征向量；

平均值计算模块710：用于计算检测帧中待检测目标对应的最大相似度对应的特征向量和检测帧中待检测目标对应的最大相似度对应的基准特征向量之间的平均值；

第二更新模块711：用于将检测帧中待检测目标对应的最大相似度对应的基准特征向量更新为平均值。

关于目标跟踪装置的具体限定可以参见上文中对于目标跟踪方法的限定，在此不再赘述。上述目标跟踪装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是服务器，其内部结构图可以如图8所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性可读存储介质、内存储器。该非易失性可读存储介质存储有操作系统、计算机可读指令和数据库。该内存储器为非易失性可读存储介质中的操作系统和计算机可读指令的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机可读指令被处理器执行时以实现一种目标跟踪方法。

在一个实施例中，提供了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机可读指令，处理器执行计算机可读指令时实现上述实施例中目标跟踪方法的步骤，例如图2所示的步骤S1至步骤S7。或者，处理器执行计算机可读指令时实现上述实施例中多机位目标跟踪装置的各模块/单元的功能，例如图7所示模块71至模块77的功能。为避免重复，这里不再赘述。

在一实施例中，提供一个或多个非易失性可读存储介质，其上存储有计算机可读指令，计算机可读指令被一个或多个处理器执行时实现上述方法实施例中目标跟踪方法，或者，该计算机可读指令被一个或多个处理器执行时实现上述装置实施例中目标跟踪装置中各模块/单元的功能。为避免重复，这里不再赘述。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机可读指令来指令相关的硬件来完成，所述的计算机可读指令可存储于一非易失性计算机可读取存储介质中，该计算机可读指令在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，仅以上述各功能单元、模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能单元、模块完成，即将所述装置的内部结构划分成不同的功能单元或模块，以完成以上描述的全部或者部分功能。

以上所述实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围，均应包含在本申请的保护范围之内。

Claims

一种目标跟踪方法，其特征在于，所述目标跟踪方法包括：

接收多机位摄像头采集的视频数据；

对所述视频数据进行分帧处理得到的每帧图像进行目标检测，获取每帧图像进行目标检测时的检测窗口，其中，每个所述检测窗口包含一个待检测目标；

根据预设尺寸对每个所述检测窗口进行归一化处理，得到该检测窗口对应的目标区域图像，使得每个所述目标区域图像的图像尺寸均一致；

针对每个所述待检测目标，根据预设的切分方式对该待检测目标的目标区域图像进行区域分割，得到N个子区域，并提取每个所述子区域的特征值，构成子特征向量，将N个所述子特征向量组成该检测窗口所对应的待检测目标的特征向量，其中，N为正整数；

按照预设的选取方式，从所述视频数据分帧处理后的帧图像中确定起始帧和检测帧，并以所述起始帧中的K个所述待检测目标作为跟踪目标，将K个所述跟踪目标对应的基准特征向量构成基准向量集，其中，K为正整数；

针对所述检测帧中的每个所述待检测目标，将所述检测帧中的待检测目标的特征向量与所述基准向量集中的K个所述基准特征向量进行逐个相似度计算，其中，所述检测帧中的每个所述待检测目标对应K个相似度，从K个所述相似度中获取最大相似度作为所述检测帧中每个所述待检测目标对应的最大相似度；

若所述检测帧中所述待检测目标对应的最大相似度大于或等于预设的第一相似度阈值，则确定该最大相似度对应的特征向量和该最大相似度对应的基准特征向量属于同一个跟踪目标，并根据该特征向量记录该跟踪目标的变化轨迹。
如权利要求1所述的目标跟踪方法，其特征在于，所述针对所述检测帧中的每个所述待检测目标，将所述检测帧中的待检测目标的特征向量与所述基准向量集中的K个所述基准特征向量进行逐个相似度计算，其中，所述检测帧中的每个所述待检测目标对应K个相似度，从K个所述相似度中获取最大相似度作为所述检测帧中每个所述待检测目标对应的最大相似度之后，所述目标跟踪方法还包括：

若所述检测帧中所述待检测目标对应的最大相似度小于预设的第二相似度阈值，则确定该最大相似度对应的特征向量属于新目标，其中，所述第二相似度阈值小于所述第一相似度阈值；

将所述新目标的特征向量添加到所述基准向量集中。
如权利要求1所述的目标跟踪方法，其特征在于，所述针对所述检测帧中的每个所述待检测目标，将所述检测帧中的待检测目标的特征向量与所述基准向量集中的K个所述基准特征向量进行逐个相似度计算包括：

针对所述检测帧中的每个所述待检测目标，在计算该待检测目标的特征向量与所述基准向量集中的每个所述基准特征向量之间的相似度时，将该待检测目标的特征向量中的每个子特征向量与该基准特征向量中的每个子特征向量进行同位置比较，得到N个子向量相似度；

根据预设的权重分配方式，对所述N个子向量相似度进行加权计算，得到所述相似度。
如权利要求1至3任一项所述的目标跟踪方法，其特征在于，所述若所述检测帧中所述待检测目标对应的最大相似度大于或等于预设的第一相似度阈值，则确定该最大相似度对应的特征向量和该最大相似度对应的基准特征向量属于同一个跟踪目标，并根据该特征向量记录该跟踪目标的变化轨迹之后，所述目标跟踪方法还包括：

将所述检测帧中所述待检测目标对应的最大相似度对应的基准特征向量更新为所述检测帧中所述待检测目标对应的最大相似度对应的特征向量。
如权利要求1至3任一项所述的目标跟踪方法，其特征在于，所述若所述检测帧中所述待检测目标对应的最大相似度大于或等于预设的第一相似度阈值，则确定该最大相似度对应的特征向量和该最大相似度对应的基准特征向量属于同一个跟踪目标，并根据该特征向量记录该跟踪目标的变化轨迹之后，所述目标跟踪方法还包括：

计算所述检测帧中所述待检测目标对应的最大相似度对应的特征向量和所述检测帧中所述待检测目标对应的最大相似度对应的基准特征向量之间的平均值；

将所述检测帧中所述待检测目标对应的最大相似度对应的基准特征向量更新为所述平均值。
一种目标跟踪装置，其特征在于，所述目标跟踪装置包括：

视频数据采集模块，用于接收多机位摄像头采集的视频数据；

检测窗口获取模块，用于对所述视频数据进行分帧处理得到的每帧图像进行目标检测，获取每帧图像进行目标检测时的检测窗口，其中，每个所述检测窗口包含一个待检测目标；

归一化处理模块，用于根据预设尺寸对每个所述检测窗口进行归一化处理，得到该检测窗口对应的目标区域图像，使得每个所述目标区域图像的图像尺寸均一致；

区域分割计算模块，用于针对每个所述待检测目标，根据预设的切分方式对该待检测目标的目标区域图像进行区域分割，得到N个子区域，并提取每个所述子区域的特征值，构成子特征向量，将N个所述子特征向量组成该检测窗口所对应的待检测目标的特征向量，其中，N为正整数；

基准向量集设置模块，用于按照预设的选取方式，从所述视频数据分帧处理后的帧图像中确定起始帧和检测帧，并以所述起始帧中的K个所述待检测目标作为跟踪目标，将K个所述跟踪目标对应的基准特征向量构成基准向量集，其中，K为正整数；

相似度计算模块，用于针对所述检测帧中的每个所述待检测目标，将所述检测帧中的待检测目标的特征向量与所述基准向量集中的K个所述基准特征向量进行逐个相似度计算，其中，所述检测帧中的每个所述待检测目标对应K个相似度，从K个所述相似度中获取最大相似度作为所述检测帧中每个所述待检测目标对应的最大相似度；

跟踪目标判断处理模块，用于若所述检测帧中所述待检测目标对应的最大相似度大于或等于预设的第一相似度阈值，则确定该最大相似度对应的特征向量和该最大相似度对应的基准特征向量属于同一个跟踪目标，并根据该特征向量记录该跟踪目标的变化轨迹。
如权利要求6所述的目标跟踪装置，其特征在于，所述目标跟踪装置还包括：

新目标判断模块，用于若所述检测帧中所述待检测目标对应的最大相似度小于预设的第二相似度阈值，则确定该最大相似度对应的特征向量属于新目标，其中，所述第二相似度阈值小于所述第一相似度阈值；

新目标采集模块，用于将所述新目标的特征向量添加到所述基准向量集中。
如权利要求6所述的目标跟踪装置，其特征在于，所述相似度计算模块包括：

子特征向量比较子模块，用于针对所述检测帧中的每个所述待检测目标，在计算该待检测目标的特征向量与所述基准向量集中的每个所述基准特征向量之间的相似度时，将该待检测目标的特征向量中的每个子特征向量与该基准特征向量中的每个子特征向量进行同位置比较，得到N个子向量相似度；

加权计算子模块，用于根据预设的权重分配方式，对所述N个子向量相似度进行加权计算，得到所述相似度。
如权利要求6至8任一项所述的目标跟踪装置，其特征在于，所述目标跟踪装置还包括：

第一更新模块，用于将所述检测帧中所述待检测目标对应的最大相似度对应的基准特征向量更新为所述检测帧中所述待检测目标对应的最大相似度对应的特征向量。
如权利要求6至8任一项所述的目标跟踪装置，其特征在于，所述目标跟踪装置还包括：

平均值计算模块，用于计算所述检测帧中所述待检测目标对应的最大相似度对应的特征向量和所述检测帧中所述待检测目标对应的最大相似度对应的基准特征向量之间的平均值；

第二更新模块，用于将所述检测帧中所述待检测目标对应的最大相似度对应的基准特征向量更新为所述平均值。
一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令，其特征在于，所述处理器执行所述计算机可读指令时实现如下步骤：

接收多机位摄像头采集的视频数据；

对所述视频数据进行分帧处理得到的每帧图像进行目标检测，获取每帧图像进行目标检测时的检测窗口，其中，每个所述检测窗口包含一个待检测目标；

根据预设尺寸对每个所述检测窗口进行归一化处理，得到该检测窗口对应的目标区域图像，使得每个所述目标区域图像的图像尺寸均一致；

针对每个所述待检测目标，根据预设的切分方式对该待检测目标的目标区域图像进行区域分割，得到N个子区域，并提取每个所述子区域的特征值，构成子特征向量，将N个所述子特征向量组成该检测窗口所对应的待检测目标的特征向量，其中，N为正整数；

按照预设的选取方式，从所述视频数据分帧处理后的帧图像中确定起始帧和检测帧，并以所述起始帧中的K个所述待检测目标作为跟踪目标，将K个所述跟踪目标对应的基准特征向量构成基准向量集，其中，K为正整数；

针对所述检测帧中的每个所述待检测目标，将所述检测帧中的待检测目标的特征向量与所述基准向量集中的K个所述基准特征向量进行逐个相似度计算，其中，所述检测帧中的每个所述待检测目标对应K个相似度，从K个所述相似度中获取最大相似度作为所述检测帧中每个所述待检测目标对应的最大相似度；

若所述检测帧中所述待检测目标对应的最大相似度大于或等于预设的第一相似度阈值，则确定该最大相似度对应的特征向量和该最大相似度对应的基准特征向量属于同一个跟踪目标，并根据该特征向量记录该跟踪目标的变化轨迹。
如权利要求11所述的计算机设备，其特征在于，所述针对所述检测帧中的每个所述待检测目标，将所述检测帧中的待检测目标的特征向量与所述基准向量集中的K个所述基准特征向量进行逐个相似度计算，其中，所述检测帧中的每个所述待检测目标对应K个相似度，从K个所述相似度中获取最大相似度作为所述检测帧中每个所述待检测目标对应的最大相似度之后，所述处理器执行所述计算机可读指令时还实现如下步骤：

若所述检测帧中所述待检测目标对应的最大相似度小于预设的第二相似度阈值，则确定该最大相似度对应的特征向量属于新目标，其中，所述第二相似度阈值小于所述第一相似度阈值；

将所述新目标的特征向量添加到所述基准向量集中。
如权利要求11所述的计算机设备，其特征在于，所述针对所述检测帧中的每个所述待检测目标，将所述检测帧中的待检测目标的特征向量与所述基准向量集中的K个所述基准特征向量进行逐个相似度计算包括：

针对所述检测帧中的每个所述待检测目标，在计算该待检测目标的特征向量与所述基准向量集中的每个所述基准特征向量之间的相似度时，将该待检测目标的特征向量中的每个子特征向量与该基准特征向量中的每个子特征向量进行同位置比较，得到N个子向量相似度；

根据预设的权重分配方式，对所述N个子向量相似度进行加权计算，得到所述相似度。
如权利要求11至13任一项所述的计算机设备，其特征在于，所述若所述检测帧中所述待检测目标对应的最大相似度大于或等于预设的第一相似度阈值，则确定该最大相似度对应的特征向量和该最大相似度对应的基准特征向量属于同一个跟踪目标，并根据该特征向量记录该跟踪目标的变化轨迹之后，所述处理器执行所述计算机可读指令时还实现如下步骤：

将所述检测帧中所述待检测目标对应的最大相似度对应的基准特征向量更新为所述检测帧中所述待检测目标对应的最大相似度对应的特征向量。
如权利要求11至13任一项所述的计算机设备，其特征在于，所述若所述检测帧中所述待检测目标对应的最大相似度大于或等于预设的第一相似度阈值，则确定该最大相似度对应的特征向量和该最大相似度对应的基准特征向量属于同一个跟踪目标，并根据该特征向量记录该跟踪目标的变化轨迹之后，所述处理器执行所述计算机可读指令时还实现如下步骤：

计算所述检测帧中所述待检测目标对应的最大相似度对应的特征向量和所述检测帧中所述待检测目标对应的最大相似度对应的基准特征向量之间的平均值；

将所述检测帧中所述待检测目标对应的最大相似度对应的基准特征向量更新为所述平均值。
一个或多个存储有计算机可读指令的非易失性可读存储介质，其特征在于，所述计算机可读指令被一个或多个处理器执行时，使得所述一个或多个处理器执行如下步骤：

接收多机位摄像头采集的视频数据；

对所述视频数据进行分帧处理得到的每帧图像进行目标检测，获取每帧图像进行目标检测时的检测窗口，其中，每个所述检测窗口包含一个待检测目标；

根据预设尺寸对每个所述检测窗口进行归一化处理，得到该检测窗口对应的目标区域图像，使得每个所述目标区域图像的图像尺寸均一致；

针对每个所述待检测目标，根据预设的切分方式对该待检测目标的目标区域图像进行区域分割，得到N个子区域，并提取每个所述子区域的特征值，构成子特征向量，将N个所述子特征向量组成该检测窗口所对应的待检测目标的特征向量，其中，N为正整数；

按照预设的选取方式，从所述视频数据分帧处理后的帧图像中确定起始帧和检测帧，并以所述起始帧中的K个所述待检测目标作为跟踪目标，将K个所述跟踪目标对应的基准特征向量构成基准向量集，其中，K为正整数；

针对所述检测帧中的每个所述待检测目标，将所述检测帧中的待检测目标的特征向量与所述基准向量集中的K个所述基准特征向量进行逐个相似度计算，其中，所述检测帧中的每个所述待检测目标对应K个相似度，从K个所述相似度中获取最大相似度作为所述检测帧中每个所述待检测目标对应的最大相似度；

若所述检测帧中所述待检测目标对应的最大相似度大于或等于预设的第一相似度阈值，则确定该最大相似度对应的特征向量和该最大相似度对应的基准特征向量属于同一个跟踪目标，并根据该特征向量记录该跟踪目标的变化轨迹。
如权利要求16所述的非易失性可读存储介质，其特征在于，所述针对所述检测帧中的每个所述待检测目标，将所述检测帧中的待检测目标的特征向量与所述基准向量集中的K个所述基准特征向量进行逐个相似度计算，其中，所述检测帧中的每个所述待检测目标对应K个相似度，从K个所述相似度中获取最大相似度作为所述检测帧中每个所述待检测目标对应的最大相似度之后，所述计算机可读指令被一个或多个处理器执行时，使得所述一个或多个处理器还执行如下步骤：

若所述检测帧中所述待检测目标对应的最大相似度小于预设的第二相似度阈值，则确定该最大相似度对应的特征向量属于新目标，其中，所述第二相似度阈值小于所述第一相似度阈值；

将所述新目标的特征向量添加到所述基准向量集中。
如权利要求16所述的非易失性可读存储介质，其特征在于，所述针对所述检测帧中的每个所述待检测目标，将所述检测帧中的待检测目标的特征向量与所述基准向量集中的K个所述基准特征向量进行逐个相似度计算包括：

针对所述检测帧中的每个所述待检测目标，在计算该待检测目标的特征向量与所述基准向量集中的每个所述基准特征向量之间的相似度时，将该待检测目标的特征向量中的每个子特征向量与该基准特征向量中的每个子特征向量进行同位置比较，得到N个子向量相似度；

根据预设的权重分配方式，对所述N个子向量相似度进行加权计算，得到所述相似度。
如权利要求16至18任一项所述的非易失性可读存储介质，其特征在于，所述若所述检测帧中所述待检测目标对应的最大相似度大于或等于预设的第一相似度阈值，则确定该最大相似度对应的特征向量和该最大相似度对应的基准特征向量属于同一个跟踪目标，并根据该特征向量记录该跟踪目标的变化轨迹之后，所述计算机可读指令被一个或多个处理器执行时，使得所述一个或多个处理器还执行如下步骤：

将所述检测帧中所述待检测目标对应的最大相似度对应的基准特征向量更新为所述检测帧中所述待检测目标对应的最大相似度对应的特征向量。
如权利要求16至18任一项所述的非易失性可读存储介质，其特征在于，所述若所述检测帧中所述待检测目标对应的最大相似度大于或等于预设的第一相似度阈值，则确定该最大相似度对应的特征向量和该最大相似度对应的基准特征向量属于同一个跟踪目标，并根据该特征向量记录该跟踪目标的变化轨迹之后，所述计算机可读指令被一个或多个处理器执行时，使得所述一个或多个处理器还执行如下步骤：

计算所述检测帧中所述待检测目标对应的最大相似度对应的特征向量和所述检测帧中所述待检测目标对应的最大相似度对应的基准特征向量之间的平均值；

将所述检测帧中所述待检测目标对应的最大相似度对应的基准特征向量更新为所述平均值。