CN110544268B

CN110544268B - 一种基于结构光及SiamMask网络的多目标跟踪方法

Info

Publication number: CN110544268B
Application number: CN201910686889.6A
Authority: CN
Inventors: 呼子宇; 高博; 马学敏; 宋浩诚
Original assignee: Yanshan University
Current assignee: Yanshan University
Priority date: 2019-07-29
Filing date: 2019-07-29
Publication date: 2023-03-24
Anticipated expiration: 2039-07-29
Also published as: CN110544268A

Abstract

本发明公开了一种基于结构光及SiamMask网络的多目标跟踪方法，引入结构光获取深度图像进一步提高检测精度，同时加入目标检测网络，自动提取目标位置坐标，改进单目标跟踪网络SiamMask，实现多目标的跟踪，提出检测与跟踪之间的匹配算法以及采用深度神经网络Resnet进行重识别，保障多个目标同时检测和跟踪。本方法取代了传统多目标跟踪网络中相关滤波的算法，采用基于深度神经网络的SiamMask网络。SiamMask网络在视频跟踪中是目前精度最高的网络，在IOU阈值为0.5时，VOT数据集上精度达到90%，同时本算法加入深度图像信息，进一步提高检测精度。为了提高网络运行速度，本算法舍弃了SiamMask网络的掩膜分支，后期需要可直接加入，呈现分割图像。

Description

一种基于结构光及SiamMask网络的多目标跟踪方法

技术领域

本发明涉及一种跟踪方法，具体是一种基于结构光及SiamMask网络的多目标跟踪方法。

背景技术

现有的跟踪网络有单目标跟踪网络如SiamMask网络和多目标跟踪网络如deep_sort_yolov3网络。

单目标跟踪无法自动获取目标坐标，只能识别一个目标，不方便应用于实际生活；多目标跟踪网络采用相关滤波的算法作为跟踪器，精度比较差；两者都没用到结构光的摄像头。

发明内容

本发明的目的在于提供一种基于结构光及SiamMask网络的多目标跟踪方法，以解决上述背景技术中提出的问题。

为实现上述目的，本发明提供如下技术方案：

一种基于结构光及SiamMask网络的多目标跟踪方法，包含以下步骤：

A、采用摄像头获取彩色图像与对应的深度图像，调用pyrealsense2库函数将彩色图与深度图对齐；

B、生成目标边框坐标；送入SiamMask网络；

C、SiamMask网络接收目标坐标开始跟踪；

D、检测目标与跟踪目标的匹配，决定目标跟踪的开启与目标跟踪的结束；并且采用深度神经网络Resnet进行重识别；

E、显示跟踪目标。

作为本发明的进一步技术方案：所述摄像头为realsense D435深度摄像头。

作为本发明的进一步技术方案：所述步骤B具体是：采用目标检测模型，以yolov3为基础的改进网络，接收彩色图与深度图，分别获取其特征并在最后的卷积层结束后进行特征融合，将融合后的特征图一起送入全连接层，进行分类和回归，生成目标的边框坐标送入SiamMask网络。

作为本发明的进一步技术方案：所述步骤C具体是：多个目标生成多个特征图，每个特征图与当前帧图像进行比对，每个接收的目标分别取最大概率值所在当前帧图像的位置。接收的目标个数与当前帧检测的目标个数一致，且不能重复，当多次未检测到接收的目标时，结束跟踪未检测到的目标。

作为本发明的进一步技术方案：所述目标的匹配具体是：提取目标运动状态信息与目标中心点运动特征向量，进行多个目标的匹配。

作为本发明的进一步技术方案：所述步骤E具体是：用不同颜色边框选中不同目标，并为每个目标加上不同的ID或名称。

作为本发明的进一步技术方案：所述步骤D是为了防止目标跟踪互串。目标运动状态信息

其中(u,v)是bounding box中心坐标，r是长宽比，h是高，剩余四个代表运动向量。

取目标检测网络生成的运动信息d_j和目标跟踪网络生成的运动信息y_i，求的两者之间的马氏距离d⁽¹⁾(i,j)，如果两者相匹配，则d⁽¹⁾(i,j)在一定范围内，因此根据实际检测设定阈值，d⁽¹⁾(i,j)小于阈值为匹配合格。

d⁽¹⁾(i,j)＝(d_j-y_i)^TS_i ^-1(d_j-y_i)

其中S为协方差矩阵。

当d⁽¹⁾(i,j)在阈值内时，将目标检测的检测框和目标跟踪的跟踪框内图像同时输入重识别网络，同一个目标会经过卷积网络会生成相同或相似的特征图，对比目标检测网络和目标跟踪网络两者生成的特征图，验证是否为同一目标。

与现有技术相比，本发明具有以下优点：本发明基于结构光及SiamMask网络的多目标跟踪方法通过增加图像目标的深度信息、目标检测模型、检测目标与跟踪目标匹配算法和重试别网络。提高了多目标跟踪的精度和实用性，方便使用

附图说明

图1为本发明流程示意图。

具体实施方式

下面将对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

实施例1：一种基于结构光及SiamMask网络的多目标跟踪方法，包含以下步骤：

A、采用realsense D435深度摄像头获取彩色图像与对应的深度图像，调用pyrealsense2库函数将彩色图与深度图对齐；

B、目标边框坐标生成，采用目标检测模型，以yolov3为基础的改进网络，接收彩色图与深度图，分别获取其特征并在最后的卷积层结束后进行特征融合，将融合后的特征图一起送入全连接层，进行分类和回归，生成目标的边框坐标送入SiamMask网络：

C、SiamMask网络接收目标坐标开始跟踪。多个目标生成多个特征图，每个特征图与当前帧图像进行比对，每个接收的目标分别取最大概率值所在当前帧图像的位置。接收的目标个数与当前帧检测的目标个数一致，且不能重复，当多次未检测到接收的目标时，结束跟踪未检测到的目标；

D、检测目标与跟踪目标的匹配，决定目标跟踪的开启与目标跟踪的结束，防止目标跟踪互串。提取目标运动状态信息与目标中心点运动特征向量，进行多个目标的匹配。并且采用深度神经网络Resnet进行重识别；

E、显示跟踪目标。

实施例2，在实施例1的基础上，步骤E具体是，用不同颜色边框选中不同目标,为每个目标加上特定的ID或名称，以便于各个目标的区分。

对于本领域技术人员而言，显然本发明不限于上述示范性实施例的细节，而且在不背离本发明的精神或基本特征的情况下，能够以其他的具体形式实现本发明。因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本发明的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。

此外，应当理解，虽然本说明书按照实施方式加以描述，但并非每个实施方式仅包含一个独立的技术方案，说明书的这种叙述方式仅仅是为清楚起见，本领域技术人员应当将说明书作为一个整体，各实施例中的技术方案也可以经适当组合，形成本领域技术人员可以理解的其他实施方式。

Claims

1.一种基于结构光及SiamMask网络的多目标跟踪方法，其特征在于，包含以下步骤：

步骤A、采用摄像头获取彩色图像与对应的深度图像，调用pyrealsense2库函数将彩色图与深度图对齐；

步骤B、生成目标边框坐标；送入SiamMask网络；

步骤C、SiamMask网络接收目标坐标开始跟踪；

步骤D、检测目标与跟踪目标的匹配，决定目标跟踪的开启与目标跟踪的结束；并且采用深度神经网络Resnet进行重识别；

步骤E、显示跟踪目标。

2.根据权利要求1所述的一种基于结构光及SiamMask网络的多目标跟踪方法，其特征在于，所述摄像头为realsense D435深度摄像头。

3.根据权利要求1所述的一种基于结构光及SiamMask网络的多目标跟踪方法，其特征在于，步骤B具体是：采用目标检测模型，以yolov3为基础的改进网络，接收彩色图与深度图，分别获取其特征并在最后的卷积层结束后进行特征融合，将融合后的特征图一起送入全连接层，进行分类和回归，生成目标的边框坐标送入SiamMask网络。

4.根据权利要求1所述的一种基于结构光及SiamMask网络的多目标跟踪方法，其特征在于，步骤C具体是：多个目标生成多个特征图，每个特征图与当前帧图像进行比对，每个接收的目标分别取最大概率值所在当前帧图像的位置；

接收的目标个数与当前帧检测的目标个数一致，且不能重复，当多次未检测到接收的目标时，结束跟踪未检测到的目标。

5.根据权利要求1所述的一种基于结构光及SiamMask网络的多目标跟踪方法，其特征在于，所述目标的匹配具体是：提取目标运动状态信息与目标中心点运动特征向量，进行多个目标的匹配。

6.根据权利要求1所述的一种基于结构光及SiamMask网络的多目标跟踪方法，其特征在于，步骤E具体是：用不同颜色边框选中不同目标，并为每个目标加上不同的ID或名称。

7.根据权利要求5所述的一种基于结构光及SiamMask网络的多目标跟踪方法，其特征在于，步骤D是为了防止目标跟踪互串。