CN113822163A

CN113822163A - 一种复杂场景下的行人目标跟踪方法及装置

Info

Publication number: CN113822163A
Application number: CN202110981011.2A
Authority: CN
Inventors: 王培田; 李振宇
Original assignee: Beijing Ziyan Lianhe Technology Co ltd
Current assignee: Beijing Ziyan Lianhe Technology Co ltd
Priority date: 2021-08-25
Filing date: 2021-08-25
Publication date: 2021-12-21

Abstract

本发明公开一种复杂场景下的行人目标跟踪方法及装置。所述方法包括选定目标人物，获取目标图像的起始时刻，建立运动轨迹；计算检测到目标图像的时刻距离运动轨迹最后更新时刻之间的时间间隔，如果该时间间隔超过预设轨迹消失时间阈值，则目标已经丢失；否则计算根据所预测的目标图像位置信息与实际目标图像的位置信息的距离，筛选满足距离条件的目标组成候选集，提取目标人脸特征和内嵌特征，进行人物相似度匹配。本发明实现在较短时间间隔内的目标人物跟踪定位场景下，结合脸部信息、目标人物的上半身身体特征进行辅助判别关联，进行有效的特征对匹配的结果进行验证和修正，有利于提升复杂场景下的目标人物的跟踪效果。

Description

一种复杂场景下的行人目标跟踪方法及装置

技术领域

本发明涉及人工智能技术领域，尤其涉及一种复杂场景下的行人目标跟踪方法及装置。

背景技术

重点人物的目标跟踪有很重要的使用价值，在现实世界中，运动场景都比较复杂，简单的线性运动模型、或者传统的目标跟踪技术，都显得捉襟见肘。一些应用场景中，行人目标交叠，并且行人的特征变化不显著，导致两个目标人物的轨迹交叉、误匹配，最终导致目标人物丢失。对目标人物的智能监控和追踪都会带来不好的体验。

基于深度学习等相关性滤波的单目标跟踪虽然也取得了比较好的跟踪效果，但是在效率上还是不好，对应对复杂场景的行人目标跟踪效果也不是很好。

人脸特征、身份重识别的内嵌特征在生物特征识别、身份辨别领域都取得了很好的效果，用这些稳定的特征进行目标人物跟踪辅助是有效的技术途径。

发明内容

本发明提供了一种复杂场景下的行人目标跟踪方法，包括：

选定目标人物，获取目标图像的起始时刻，为目标人物建立运动轨迹；

计算下一次检测到目标图像的时刻距离运动轨迹最后更新时刻之间的时间间隔，判断该时间间隔是否在预设轨迹消失时间阈值内：

如果该时间间隔超过预设轨迹消失时间阈值，则表示目标人物丢失太久，确定目标已经丢失；

如果该时间间隔在预设轨迹消失时间阈值内，则计算根据所预测的目标图像位置信息与实际目标图像的位置信息的距离，筛选满足距离条件的目标组成候选集，从候选集中提取目标人脸特征和内嵌特征，进行人物相似度匹配，若能够匹配到目标人物，则更新目标人物运动轨迹，否则完成本次跟踪，等待下一帧的目标人物。

如上所述的复杂场景下的行人目标跟踪方法，其中，在复杂场景下进行某一目标人物追踪时，先查找该目标人物的目标图像在视频中的起始时刻t，该时刻代表获得了一个新的检测目标，为该目标重新建立一条运动轨迹Trackobj，记录此时的目标图像为image_t，其位置为position_{obj_t}(x_{obj_t},y_{obj_t},width_{obj_t},height_{obj_t})，t+k时刻的图像为记为image_t+k，位置为position_{obj_t+k}(x_{obj_t+k},y_{obj_t+k},width_{obj_t+k},height_{obj_t+k})，k与视频跳帧处理有关是自然数，k∈{1,2,..}。

如上所述的复杂场景下的行人目标跟踪方法，其中，如果该时间间隔在预设轨迹消失时间阈值内，则具体执行如下子步骤：

对运动轨迹中最后更新时刻t所对应的目标图像位置position_{obj_t}进行预测，得到t+k时刻的预测位置position_predict；

计算t+k时刻的预测位置position_predict与实际位置position_{obj_t+k}之间的距离；

将满足距离条件的t+k时刻的若干目标组成一组候选集objSet{obj0,obj1,...,objm}。

如上所述的复杂场景下的行人目标跟踪方法，其中，对运动轨迹中最后更新时刻t所对应的目标图像位置position_{obj_t}进行预测，具体为：采用kalman线性预测，根据当前帧位置position_{obj_t+k}和新更新目标的位置信息position_{obj_t}计算Kalman状态参数，通过Kalman状态参数预测下一时刻目标应该出现的位置及大小postionpredict(xpre，ypre，widthpre，heightpre)。

如上所述的复杂场景下的行人目标跟踪方法，其中，进行人物相似度匹配，具体包括如下子步骤：

对t+k时刻的目标图像候选集objSet的所有成员，进行人脸检测；

如果人脸区域存在，则提取t+k时刻对应的人脸特征FaceFea_t+k，计算目标人物object在t时刻对应的人脸特征FaceFea_t和t+k时刻对应的人脸特征FaceFea_t+k的相似度simi(ReidFea_t,ReidFea_t+k)，如果相似度大于给定的阈值faceThr，那么认为是同一个目标人物，则更新目标人物运动轨迹，否则完成本次跟踪，等待下一帧的目标人物；

如果人脸区域不存在，则提取内嵌特征ReidFea_t+k，计算目标人物object在t时刻对应的内嵌特征ReidFea_t和t+k时刻对应的内嵌特征ReidFea_t+k的相似度simi(ReidFea_t,ReidFea_t+k)，如果相似度阈值大于给定的阈值AttriThr，那么认为是同一目标人物，则更新目标人物运动轨迹，否则完成本次跟踪，等待下一帧的目标人物。

本发明还提供一种复杂场景下的行人目标跟踪装置，包括：运动轨迹创建模块21、目标运动轨迹检测模块22、目标运动轨迹确定模块23；

运动轨迹创建模块21，用于选定目标人物，获取目标图像的起始时刻，为目标人物建立运动轨迹；

目标运动轨迹检测模块22，用于计算下一次检测到目标图像的时刻距离运动轨迹最后更新时刻之间的时间间隔，判断该时间间隔是否在预设轨迹消失时间阈值内：如果该时间间隔超过预设轨迹消失时间阈值，则表示目标人物丢失太久，确定目标已经丢失；如果该时间间隔在预设轨迹消失时间阈值内，则触发目标运动轨迹确定模块23；

目标运动轨迹确定模块23，用于计算根据所预测的目标图像位置信息与实际目标图像的位置信息的距离，筛选满足距离条件的目标组成候选集，从候选集中提取目标人脸特征和内嵌特征，进行人物相似度匹配，若能够匹配到目标人物，则更新目标人物运动轨迹，否则完成本次跟踪，等待下一帧的目标人物。

如上所述的复杂场景下的行人目标跟踪装置，其中，如果该时间间隔在预设轨迹消失时间阈值内，则目标运动轨迹检测模块22具体用于：对运动轨迹中最后更新时刻t所对应的目标图像位置position_{obj_t}进行预测，得到t+k时刻的预测位置position_predict；计算t+k时刻的预测位置position_predict与实际位置position_{obj_t+k}之间的距离；将满足距离条件的t+k时刻的若干目标组成一组候选集objSet{obj0,obj1,...,objm}。

如上所述的复杂场景下的行人目标跟踪装置，其中，对运动轨迹中最后更新时刻t所对应的目标图像位置position_{obj_t}进行预测，具体为：采用kalman线性预测，根据当前帧位置position_{obj_t+k}和新更新目标的位置信息position_{obj_t}计算Kalman状态参数，通过Kalman状态参数预测下一时刻目标应该出现的位置及大小postionpredict(xpre，ypre，widthpre，heightpre)。

如上所述的复杂场景下的行人目标跟踪装置，其中，目标运动轨迹确定模块23具体用于：对t+k时刻的目标图像候选集objSet的所有成员，进行人脸检测；如果人脸区域存在，则提取t+k时刻对应的人脸特征FaceFea_t+k，计算目标人物object在t时刻对应的人脸特征FaceFea_t和t+k时刻对应的人脸特征FaceFea_t+k的相似度simi(FaceFea_t,FaceFea_t+k)，如果相似度大于给定的阈值faceThr，那么认为是同一个目标人物，则更新目标人物运动轨迹，否则完成本次跟踪，等待下一帧的目标人物；如果人脸区域不存在，则提取内嵌特征ReidFea_t+k，计算目标人物object在t时刻对应的内嵌特征ReidFea_t和t+k时刻对应的内嵌特征ReidFea_t+k的相似度simi(ReidFea_t,ReidFea_t+k)，如果相似度阈值大于给定的阈值AttriThr，那么认为是同一目标人物，则更新目标人物运动轨迹，否则完成本次跟踪，等待下一帧的目标人物。

本发明还提供一种计算机存储介质，其特征在于，包括：至少一个存储器和至少一个处理器；

存储器用于存储一个或多个程序指令；

处理器，用于运行一个或多个程序指令，用以执行上述任一项所述的一种复杂场景下的行人目标跟踪方法。

本发明实现的有益效果如下：本发明提出一个实时的且通过多种特征属性约束的方式进行跟踪的改进方法。实现在较短时间间隔内的目标人物跟踪定位场景下，结合脸部信息、目标人物的上半身内嵌特征进行辅助判别关联，进行有效的特征对匹配的结果进行验证和修正，有利于提升复杂场景下的目标人物的跟踪效果。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明中记载的一些实施例，对于本领域普通技术人员来讲，还可以根据这些附图获得其他的附图。

图1是本发明实施例一提供的一种复杂场景下的行人目标跟踪方法流程图；

图2是当判定时间间隔在预设轨迹消失时间阈值内所执行方法流程图

图3是进行人物相似度匹配方法流程图；

图4是本发明实施例二提供的一种复杂场景下的行人目标跟踪装置示意图。

具体实施方式

下面结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

实施例一

如图1所示，本发明实施例一提供一种复杂场景下的行人目标跟踪方法，包括：

步骤110、选定目标人物，获取目标图像的起始时刻，为目标人物建立运动轨迹；

在复杂场景下进行某一目标人物追踪时，先查找该目标人物的目标图像在视频中的起始时刻t，该时刻代表获得了一个新的检测目标，为该目标重新建立一条运动轨迹Track_obj，记录此时的目标图像为image_t，其位置为position_{obj_t}，t+k时刻的图像为记为image_t+k，位置为position_{obj_t+k}。

设定对于任意的目标object，其位置表示为position(x，y，width，height)，其中，x，y是目标外接矩形的左上角坐标，用其表示目标的位置，width，height是对应矩形的宽度和高度，用其表示目标的大小，因此此时对应t时刻的目标人物object的位置为position_{obj_t}(x_{obj_t},y_{obj_t},width_{obj_t},height_{obj_t})，同样地，t+k时刻的图像位置为position_{obj_t+k}(x_{obj_t+k},y_{obj_t+k},width_{obj_t+k},height_{obj_t+k})，k与视频跳帧处理有关是自然数，k∈{1,2,..}，k愈大，对应算法运算量愈小，但是会影响跟踪体验，本发明优选k＝6。

步骤120、计算下一次检测到目标图像的时刻距离运动轨迹最后更新时刻之间的时间间隔，判断该时间间隔是否在预设轨迹消失时间阈值内，如果该时间间隔超过预设轨迹消失时间阈值，则表示目标人物丢失太久，确定目标已经丢失；如果该时间间隔在预设轨迹消失时间阈值内，则执行步骤130；

本发明实施例中，对于t+k时刻检测到的目标图像image_t+k，位置为position_{obj_t+k}，计算t+k时刻，距离运动轨迹最后更新的时间的时间间隔，判断时间间隔是否在轨迹消失的时间阈值endTrackThr(优选可设置endTrackThr＝60)内，如果时间间隔大于该阈值，则人物目标丢失太久，目标已经丢失，追踪结束；

如图2所示，如果时间间隔在时间阈值内，则执行如下子步骤：

步骤210、对运动轨迹中最后更新时刻t所对应的目标图像位置position_{obj_t}进行预测，得到t+k时刻的预测位置position_predict；

优选地，本发明采用kalman(卡尔曼)线性预测，根据当前帧位置position_{obj_t+k}和新更新目标的位置信息position_{obj_t}计算Kalman状态参数，通过Kalman状态参数预测下一时刻目标应该出现的位置及大小postionpredict(xpre，ypre，widthpre，heightpre)；

其中，Kalman预测具体方法为：

Kalman状态估计使用一个8维空间去刻画轨迹在某时刻的状态

分别表示目标的中心位置、纵横比、高度、以及在图像坐标中对应的速度信息；卡尔曼滤波器采用匀速模型和线性观测模型，对应的观测变量为中心位置(x,y)，纵横比r，高度h，最终得到预测的位置postionpredict(xpre，ypre，widthpre，heightpre)，其中，x_pre＝x，y_pre＝y，width_pre＝h*r，height_pre＝h。Kalman预测性能比较稳定、且能够可靠地预测下一帧目标出现的位置，利于提升轨迹连接效果。

步骤220、计算t+k时刻的预测位置position_predict与实际位置position_{obj_t+k}之间的距离，将满足距离条件的t+k时刻的若干目标组成一组候选集objSet{obj0,obj1,...,objm}；

具体地，计算t+k时刻的预测位置position_predict与实际位置position_{obj_t+k}之间的距离的计算公式为：

其中，xcen_predict＝x_predict+width_predict*0.5，ycen_predict＝y_predict+height_predict*0.5，如果位置距离dist(position_predict,position_{obj_t+k})<1.5*(width_predict+width_{obj_t+k})，则认为是满足距离条件的目标，保存到候选集objSet中，通过距离条件筛选可以确定t+k时刻的目标图像image_t+k与t时刻目标图像image_t是否是同一个目标集合objSet。

若经距离条件筛选后所得的候选集objSet为空，则继续进行下一帧的目标追踪。此外，计算距离轨迹Trackobj最后更新的时间间隔timeInterval，判断间隔timeInterval是否大于轨迹消失的时间阈值，直到间隔timeInterval大于轨迹消失的时间阈值endTrackThr，结束该轨迹，建立新的轨迹。

返回参见图1，步骤130、计算根据所预测的目标图像位置信息与实际目标图像的位置信息的距离，筛选满足距离条件的目标组成候选集，从候选集中提取目标人脸特征和内嵌特征，进行人物相似度匹配，若能够匹配到目标人物，则更新目标人物运动轨迹，否则完成本次跟踪，等待下一帧的目标人物；

内嵌特征(embedding feature)指目标人物穿着、人脸、发型等综合特征，本申请综合考虑人脸特征和内嵌特征，实现对目标任务的精准追踪定位。

本发明实施例中，如图3所示，从候选集中提取目标人脸特征和内嵌特征，进行人物相似度匹配，具体包括如下子步骤：

步骤310、对t+k时刻的目标图像候选集objSet的所有成员，进行人脸检测，如果人脸区域存在，则执行步骤320，否则执行步骤330；

步骤320、提取t+k时刻对应的人脸特征FaceFea_t+k，计算目标人物object在t时刻对应的人脸特征FaceFeat和t+k时刻对应的人脸特征FaceFea_t+k的相似度simi(FaceFea_t,FaceFea_t+k)，如果相似度大于给定的阈值faceThr(优选地，阈值faceThr＝0.7)，那么认为是同一个目标人物，则更新目标人物运动轨迹，否则完成本次跟踪，等待下一帧的目标人物；

若目标图像候选集objSet的所有成员中存在多个相似度大于给定的阈值faceThr的目标，则选择相似度最高的目标作为目标人物的运动轨迹，对应目标object记录添加到轨迹Trackobj中，完成匹配。

步骤330、提取内嵌特征ReidFea_t+k(优选提取上半身属性特征)，计算目标人物object在t时刻对应的内嵌特征ReidFea_t和t+k时刻对应的内嵌特征ReidFea_t+k的相似度simi(ReidFeat,ReidFea_t+k)，如果相似度阈值大于给定的阈值AttriThr(优选AttriThr＝0.75)，那么认为是同一目标人物，则更新目标人物运动轨迹，否则完成本次跟踪，等待下一帧的目标人物；

具体地，相似度的计算公式为：

其中，缓冲轨迹的目标特征为fea0(fea0₁,fea0₂,...,fea0_N)，目标obj_new的特征为fea1(fea1₁,fea1₂,...,fea1_N)，N为对应特征的维数；若Step22使用该公式计算相似度时，目标特征fea0表示t时刻对应的人脸特征FaceFea_t，fea1表示t+k时刻对应的人脸特征FaceFea_t+k；若Step23使用该公式计算相似度时，目标特征fea0表示t时刻对应的内嵌特征ReidFea_t，fea1表示t+k时刻对应的内嵌特征ReidFea_t+k；

若目标图像候选集objSet的所有成员中存在多个相似度大于给定的阈值AttriThr的目标，则选择相似度最高的目标作为目标人物的运动轨迹，对应目标object记录添加到轨迹Trackobj中，完成匹配，由此完成跟踪，等待下一帧的新目标输入。

实施例二

如图4所示，本发明实施例二提供一种复杂场景下的行人目标跟踪装置40，包括运动轨迹创建模块41、目标运动轨迹检测模块42、目标运动轨迹确定模块43；

运动轨迹创建模块41，用于选定目标人物，获取目标图像的起始时刻，为目标人物建立运动轨迹；

具体地，在复杂场景下进行某一目标人物追踪时，先查找该目标人物的目标图像在视频中的起始时刻t，该时刻代表获得了一个新的检测目标，为该目标重新建立一条运动轨迹Trackobj，记录此时的目标图像为image_t，其位置为position_{obj_t}(x_{obj_t},y_{obj_t},width_{obj_t},height_{obj_t})，t+k时刻的图像为记为image_t+k，位置为position_{obj_t+k}(x_{obj_t+k},y_{obj_t+k},width_{obj_t+k},height_{obj_t+k})，k与视频跳帧处理有关是自然数，k∈{1,2,..}。

目标运动轨迹检测模块42，用于计算下一次检测到目标图像的时刻距离运动轨迹最后更新时刻之间的时间间隔，判断该时间间隔是否在预设轨迹消失时间阈值内：如果该时间间隔超过预设轨迹消失时间阈值，则表示目标人物丢失太久，确定目标已经丢失；如果该时间间隔在预设轨迹消失时间阈值内，则触发目标运动轨迹确定模块43；

具体地，如果该时间间隔在预设轨迹消失时间阈值内，则具体包括：对运动轨迹中最后更新时刻t所对应的目标图像位置position_{obj_t}进行预测，得到t+k时刻的预测位置position_predict；计算t+k时刻的预测位置position_predict与实际位置position_{obj_t+k}之间的距离；将满足距离条件的t+k时刻的若干目标组成一组候选集objSet{obj0,obj1,...,objm}。

其中，对运动轨迹中最后更新时刻t所对应的目标图像位置position_{obj_t}进行预测，具体为：采用kalman线性预测，根据当前帧位置position_{obj_t+k}和新更新目标的位置信息position_{obj_t}计算Kalman状态参数，通过Kalman状态参数预测下一时刻目标应该出现的位置及大小postionpredict(xpre，ypre，widthpre，heightpre)。

目标运动轨迹确定模块43，用于计算根据所预测的目标图像位置信息与实际目标图像的位置信息的距离，筛选满足距离条件的目标组成候选集，从候选集中提取目标人脸特征和内嵌特征，进行人物相似度匹配，若能够匹配到目标人物，则更新目标人物运动轨迹，否则完成本次跟踪，等待下一帧的目标人物。

具体地，进行人物相似度匹配，具体包括：对t+k时刻的目标图像候选集objSet的所有成员，进行人脸检测；如果人脸区域存在，则提取t+k时刻对应的人脸特征FaceFea_t+k，计算目标人物object在t时刻对应的人脸特征FaceFea_t和t+k时刻对应的人脸特征FaceFea_t+k的相似度simi(FaceFea_t,FaceFea_t+k)，如果相似度大于给定的阈值faceThr(优选地，阈值faceThr＝0.7)，那么认为是同一个目标人物，则更新目标人物运动轨迹，否则完成本次跟踪，等待下一帧的目标人物；如果人脸区域不存在，则提取内嵌特征ReidFea_t+k(优选提取上半身内嵌特征)，计算目标人物object在t时刻对应的内嵌特征ReidFea_t和t+k时刻对应的内嵌特征ReidFea_t+k的相似度simi(ReidFea_t,ReidFea_t+k)，如果相似度阈值大于给定的阈值AttriThr(优选AttriThr＝0.75)，那么认为是同一目标人物，则更新目标人物运动轨迹，否则完成本次跟踪，等待下一帧的目标人物。

与上述实施例对应的，本发明实施例提供一种计算机存储介质，包括：至少一个存储器和至少一个处理器；

存储器用于存储一个或多个程序指令；

处理器，用于运行一个或多个程序指令，用以执行复杂场景下的行人目标跟踪方法。

与上述实施例对应的，本发明实施例提供一种计算机可读存储介质，计算机存储介质中包含一个或多个程序指令，一个或多个程序指令用于被处理器执行复杂场景下的行人目标跟踪方法。

本发明所公开的实施例提供一种计算机可读存储介质，所述计算机可读存储介质中存储有计算机程序指令，当所述计算机程序指令在计算机上运行时，使得计算机执行上述的一种复杂场景下的行人目标跟踪方法。

在本发明实施例中，处理器可以是一种集成电路芯片，具有信号的处理能力。处理器可以是通用处理器、数字信号处理器(Digital Signal Processor，简称DSP)、专用集成电路(Application Specific Integrated Circuit，简称ASIC)、现场可编程门阵列(FieldProgrammable Gate Array，简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。处理器读取存储介质中的信息，结合其硬件完成上述方法的步骤。

存储介质可以是存储器，例如可以是易失性存储器或非易失性存储器，或可包括易失性和非易失性存储器两者。

其中，非易失性存储器可以是只读存储器(Read-Only Memory，简称ROM)、可编程只读存储器(Programmable ROM，简称PROM)、可擦除可编程只读存储器(Erasable PROM，简称EPROM)、电可擦除可编程只读存储器(Electrically EPROM，简称EEPROM)或闪存。

易失性存储器可以是随机存取存储器(Random Access Memory，简称RAM)，其用作外部高速缓存。通过示例性但不是限制性说明，许多形式的RAM可用，例如静态随机存取存储器(Static RAM，简称SRAM)、动态随机存取存储器(Dynamic RAM，简称DRAM)、同步动态随机存取存储器(Synchronous DRAM，简称SDRAM)、双倍数据速率同步动态随机存取存储器(Double Data RateSDRAM，简称DDRSDRAM)、增强型同步动态随机存取存储器(EnhancedSDRAM，简称ESDRAM)、同步连接动态随机存取存储器(Synchlink DRAM，简称SLDRAM)和直接内存总线随机存取存储器(DirectRambus RAM，简称DRRAM)。

本发明实施例描述的存储介质旨在包括但不限于这些和任意其它适合类型的存储器。

本领域技术人员应该可以意识到，在上述一个或多个示例中，本发明所描述的功能可以用硬件与软件组合来实现。当应用软件时，可以将相应功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。计算机可读介质包括计算机存储介质和通信介质，其中通信介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。存储介质可以是通用或专用计算机能够存取的任何可用介质。

以上所述的具体实施方式，对本发明的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上所述仅为本发明的具体实施方式而已，并不用于限定本发明的保护范围，凡在本发明的技术方案的基础之上，所做的任何修改、等同替换、改进等，均应包括在本发明的保护范围之内。

Claims

1.一种复杂场景下的行人目标跟踪方法，其特征在于，包括：

2.如权利要求1所述的复杂场景下的行人目标跟踪方法，其特征在于，在复杂场景下进行某一目标人物追踪时，先查找该目标人物的目标图像在视频中的起始时刻t，该时刻代表获得了一个新的检测目标，为该目标重新建立一条运动轨迹Trackobj，记录此时的目标图像为image_t，其位置为position_{obj_t}(x_{obj_t},y_{obj_t},width_{obj_t},height_{obj_t})，t+k时刻的图像为记为image_t+k，位置为position_{obj_t+k}(x_{obj_t+k},y_{obj_t+k},width_{obj_t+k},height_{obj_t+k})，k与视频跳帧处理有关是自然数，k∈{1,2,..}。

3.如权利要求2所述的复杂场景下的行人目标跟踪方法，其特征在于，如果该时间间隔在预设轨迹消失时间阈值内，则具体执行如下子步骤：

4.如权利要求3所述的复杂场景下的行人目标跟踪方法，其特征在于，对运动轨迹中最后更新时刻t所对应的目标图像位置position_{obj_t}进行预测，具体为：采用kalman线性预测，根据当前帧位置position_{obj_t+k}和新更新目标的位置信息position_{obj_t}计算Kalman状态参数，通过Kalman状态参数预测下一时刻目标应该出现的位置及大小postionpredict(xpre，ypre，widthpre，heightpre)。

5.如权利要求2所述的复杂场景下的行人目标跟踪方法，其特征在于，进行人物相似度匹配，具体包括如下子步骤：

如果人脸区域存在，则提取t+k时刻对应的人脸特征FaceFea_t+k，计算目标人物object在t时刻对应的人脸特征FaceFea_t和t+k时刻对应的人脸特征FaceFea_t+k的相似度simi(FaceFeat,FaceFea_t+k)，如果相似度大于给定的阈值faceThr，那么认为是同一个目标人物，则更新目标人物运动轨迹，否则完成本次跟踪，等待下一帧的目标人物；

6.一种复杂场景下的行人目标跟踪装置，其特征在于，包括：运动轨迹创建模块21、目标运动轨迹检测模块22、目标运动轨迹确定模块23；

7.如权利要求6所述的复杂场景下的行人目标跟踪装置，其特征在于，如果该时间间隔在预设轨迹消失时间阈值内，则目标运动轨迹检测模块22具体用于：对运动轨迹中最后更新时刻t所对应的目标图像位置position_{obj_t}进行预测，得到t+k时刻的预测位置position_predict；计算t+k时刻的预测位置position_predict与实际位置position_{obj_t+k}之间的距离；将满足距离条件的t+k时刻的若干目标组成一组候选集objSet{obj0,obj1,...,objm}。

8.如权利要求7所述的复杂场景下的行人目标跟踪装置，其特征在于，对运动轨迹中最后更新时刻t所对应的目标图像位置position_{obj_t}进行预测，具体为：采用kalman线性预测，根据当前帧位置position_{obj_t+k}和新更新目标的位置信息position_{obj_t}计算Kalman状态参数，通过Kalman状态参数预测下一时刻目标应该出现的位置及大小postionpredict(xpre，ypre，widthpre，heightpre)。

9.如权利要求6所述的复杂场景下的行人目标跟踪装置，其特征在于，目标运动轨迹确定模块23具体用于：对t+k时刻的目标图像候选集objSet的所有成员，进行人脸检测；如果人脸区域存在，则提取t+k时刻对应的人脸特征FaceFea_t+k，计算目标人物object在t时刻对应的人脸特征FaceFea_t和t+k时刻对应的人脸特征FaceFea_t+k的相似度simi(FaceFea_t,FaceFea_t+k)，如果相似度大于给定的阈值faceThr，那么认为是同一个目标人物，则更新目标人物运动轨迹，否则完成本次跟踪，等待下一帧的目标人物；如果人脸区域不存在，则提取内嵌特征ReidFea_t+k，计算目标人物object在t时刻对应的内嵌特征ReidFea_t和t+k时刻对应的内嵌特征ReidFea_t+k的相似度simi(ReidFea_t,ReidFea_t+k)，如果相似度阈值大于给定的阈值AttriThr，那么认为是同一目标人物，则更新目标人物运动轨迹，否则完成本次跟踪，等待下一帧的目标人物。

10.一种计算机存储介质，其特征在于，包括：至少一个存储器和至少一个处理器；

存储器用于存储一个或多个程序指令；

处理器，用于运行一个或多个程序指令，用以执行如权利要求1-5任一项所述的复杂场景下的行人目标跟踪方法。