CN112598739A

CN112598739A - 基于时空特征聚合网络的移动机器人红外目标跟踪方法、系统及存储介质

Info

Publication number: CN112598739A
Application number: CN202011564825.8A
Authority: CN
Inventors: 何震宇; 刘乔; 杨超; 白扬; 孙旭岩; 万玉东
Original assignee: Shenzhen Graduate School Harbin Institute of Technology
Current assignee: Shenzhen Graduate School Harbin Institute of Technology
Priority date: 2020-12-25
Filing date: 2020-12-25
Publication date: 2021-04-02
Anticipated expiration: 2040-12-25
Also published as: CN112598739B

Abstract

本发明提供了一种基于时空特征聚合网络的移动机器人红外目标跟踪方法、系统及存储介质，目标跟踪方法包括：根据跟踪视频第一帧给定的目标大小和位置获取目标模板帧；将目标模板帧送入孪生网络的模板分支提取目标模板特征；将当前搜索帧和历史帧送入孪生网络的搜索分支提取特征；根据孪生网络模板分支和搜索分支提取的特征计算响应图，确定目标在下一帧中的位置。本发明的有益效果是：本发明针对红外目标跟踪中物体特征提取，在提取语义与空间结构特征的基础上，将物体的运动信息网络化，融合多帧信息加强表观模型的判别能力，并结合已有的空间感知网络形成了一个端到端的时空特征聚合孪生网络，更好地区分相似物干扰，提高跟踪的准确性和鲁棒性。

Description

基于时空特征聚合网络的移动机器人红外目标跟踪方法、系统及存储介质

技术领域

本发明涉及红外目标跟踪技术领域，尤其涉及一种在视频序列中基于时空特征聚合网络对红外目标的跟踪方法、系统及存储介质。

背景技术

视觉目标跟踪技术是计算机视觉领域的一个研究热点，并被广泛应用在机器人视觉跟踪与导航，智能监控等方向。视觉目标跟踪任务就是在视频的初始帧中给定要跟踪目标的位置与大小，预测后续视频帧中该目标出现的位置与大小。

热红外视觉目标跟踪属于视觉目标跟踪中的一个分支，主要被用于夜间对目标的跟踪。不同于可见光下的视觉目标跟踪，热红外视觉目标跟踪具有全天候，复杂环境下的工作能力，其不受光线变化的影响，既可在白天也可在夜间对目标进行跟踪。因此它在视觉领域存在大量的应用场景，如：监护机器人的夜间监护、保安机器人夜间巡逻，城市交通夜间监控等。特别是近年来随着热红外成像技术的进步，热红外成像在分辨率与距离上都有大幅提升，成像设备价格却在逐渐降低。越来越多的民用领域，如监测、救援、消防、交通等开始利用热红外成像设备。

相对于可见光下的视觉目标跟踪而言，热红外视觉目标跟踪尚属于起步阶段，研究相对较少。早期的热红外目标跟踪技术主要研究对弱小目标的跟踪，多用于军事领域对导弹等军事目标的跟踪，其不能适用于目前民用领域对通用目标跟踪技术的需求。当前的热红外图像已经具有较高的质量，目标的纹理、轮廓，分辨率都有了很大的提升，因此对跟踪技术有更高的要求。

发明内容

本发明提供了一种基于时空特征聚合网络的移动机器人红外目标跟踪方法，包括依次执行如下步骤：

步骤S1：根据跟踪视频第一帧给定的目标大小和位置获取目标模板帧；

步骤S2：将目标模板帧送入孪生网络的模板分支提取目标模板特征；

步骤S3：将当前搜索帧和历史帧送入孪生网络的搜索分支提取时空聚合特征；

步骤S4：根据孪生网络模板分支和搜索分支提取的特征计算响应图，确定目标在下一帧中的位置；

步骤S5：判断视频序列是否为最后一帧，若是，那么结束，否则执行步骤S2。

作为本发明的进一步改进，所述步骤S2包括如下步骤：

步骤S21：利用深度网络提取特征；

步骤S22：对提取的特征图进行裁剪并送入相关滤波层得到目标模板特征。

作为本发明的进一步改进，所述步骤S3包括如下步骤：

步骤S31：将搜索帧和历史帧送入深度网络提取特征；

步骤S32：将搜索帧特征与历史帧的特征用对齐网络模型进行特征对齐；

步骤S33：连接对齐后的特征，并将其分别送入时间特征聚合网络和空间特征聚合网络，对特征进行空间维度和时间维度的加权融合；

步骤S34：将时空聚合后的特征相加，送入一层卷积层，得到最终的搜索帧特征。

作为本发明的进一步改进，在所述步骤S31中，搜索分支所使用的深度特征提取网络与模板分支使用的深度特征提取网络相同。

作为本发明的进一步改进，在所述步骤S32中，需要将搜索帧特征与前k个历史帧送入对齐模型，逐帧对特征进行对齐。

作为本发明的进一步改进，在所述步骤S33中，将前k帧对齐后的特征与搜索帧特征在通道维度连接。

作为本发明的进一步改进，在所述步骤S33中，通过线性变换对特征进行嵌入，对嵌入后的特征进行矩阵乘，得到空间和时间相关矩阵，并依据关系矩阵对特征进行融合。

作为本发明的进一步改进，在所述步骤S4中，在响应图中，根据响应图的峰值确定目标在下一帧中的位置。

本发明还提供了一种基于时空特征聚合网络的移动机器人红外目标跟踪系统，包括：存储器、处理器以及存储在所述存储器上的计算机程序，所述计算机程序配置为由所述处理器调用时实现本发明所述的移动机器人红外目标跟踪方法的步骤。

本发明还提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序配置为由处理器调用时实现本发明所述的移动机器人红外目标跟踪方法的步骤。

本发明的有益效果是：本发明针对红外目标跟踪中物体特征提取，在提取语义与空间结构特征的基础上，将物体的运动信息网络化，融合了多帧信息加强表观模型的判别能力，并结合已有的空间感知网络形成了一个端到端的时空特征聚合孪生网络，能够更好地区分相似物干扰，从而提高跟踪的准确性和鲁棒性。

附图说明

图1是本发明的方法流程图。

具体实施方式

如图1所示，本发明公开了一种基于时空特征聚合网络的移动机器人红外目标跟踪方法，包括依次执行如下步骤：

所述步骤S2包括如下步骤：

步骤S21：利用深度网络提取特征；

所述步骤S3包括如下步骤：

步骤S31：将搜索帧和历史帧送入深度网络提取特征；

在所述步骤S31中，搜索分支所使用的深度特征提取网络与模板分支使用的深度特征提取网络相同。

在所述步骤S32中，需要将搜索帧特征与前k个历史帧送入对齐模型，逐帧对特征进行对齐。

在所述步骤S33中，将前k帧对齐后的特征与搜索帧特征在通道维度连接。

在所述步骤S33中，通过线性变换对特征进行嵌入，对嵌入后的特征进行矩阵乘，得到空间和时间相关矩阵，并依据相关矩阵对特征进行融合。

在所述步骤S4中，在响应图中，根据响应图的峰值确定目标在下一帧中的位置。

在本发明中，针对红外跟踪中目标缺乏纹理、颜色等信息的特点，本发明希望利用尽可能多的特征来加强目标的表示能力。为了更好地利用物体的运动信息，本发明在使用卷积神经网络提取当前搜索帧和目标模板帧特征的同时也提取视频序列历史帧的特征，从而增强特征的判别性和鲁棒性。机器人在移动过程中，摄像头的拍摄位置、角度会发生改变，红外跟踪目标也在不停运动，在不同视频帧中目标的外观、大小及位置都会不同。如果直接对特征在通道维度上进行连接，不同帧未对齐的特征不仅无法提高红外跟踪性能，甚至会造成跟踪性能下降。

本发明使用对齐模型将待对齐历史帧和当前搜索帧的特征进行对齐。待对齐帧和搜索帧的特征先进行矩阵乘法，再通过sigmoid函数得到亲和矩阵，将得到的亲和矩阵送入三个卷积层得到对待对齐帧进行采样的参数，利用采样参数对待对齐帧进行采样从而得到该帧对齐后的特征。

将对齐后的历史帧特征与搜索帧的特征在通道维度上连接，得到新的搜索帧特征。如果参考了k张历史帧，新搜索帧特征的通道数就会变成原搜索帧特征通道数的k+1倍，从而势必会造成特征的冗余。结合已有的空间感知网络，本发明提出了它的变体——时间感知网络，对新搜索特征进行时间和空间维度上的聚合，从而减少冗余特征，同时也能加快跟踪速度。

在本发明中，孪生神经网络的模板分支加入了相关滤波层，能够对目标模板进行更新，从而缓解物体形变或跟踪漂移的问题。对模板分支特征和搜索分支特征进行互相关运算，得到最终的响应图，根据响应图的峰值确定目标的中心位置。

本发明还公开了一种基于时空特征聚合网络的移动机器人红外目标跟踪系统，包括：存储器、处理器以及存储在所述存储器上的计算机程序，所述计算机程序配置为由所述处理器调用时实现本发明所述的移动机器人红外目标跟踪方法的步骤。

本发明还公开了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序配置为由处理器调用时实现本发明所述的移动机器人红外目标跟踪方法的步骤。

以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明，不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干简单推演或替换，都应当视为属于本发明的保护范围。

Claims

1.一种基于时空特征聚合网络的移动机器人红外目标跟踪方法，其特征在于，包括依次执行如下步骤：

2.根据权利要求1所述的移动机器人红外目标跟踪方法，其特征在于，所述步骤S2包括如下步骤：

步骤S21：利用深度网络提取特征；

3.根据权利要求1所述的移动机器人红外目标跟踪方法，其特征在于，所述步骤S3包括如下步骤：

步骤S31：将搜索帧和历史帧送入深度网络提取特征；

4.根据权利要求3所述的移动机器人红外目标跟踪方法，其特征在于，在所述步骤S31中，搜索分支所使用的深度特征提取网络与模板分支使用的深度特征提取网络相同。

5.根据权利要求3所述的移动机器人红外目标跟踪方法，其特征在于，在所述步骤S32中，需要将搜索帧特征与前k个历史帧送入对齐模型，逐帧对特征进行对齐。

6.根据权利要求3所述的移动机器人红外目标跟踪方法，其特征在于，在所述步骤S33中，将前k帧对齐后的特征与搜索帧特征在通道维度连接。

7.根据权利要求3所述的移动机器人红外目标跟踪方法，其特征在于，在所述步骤S33中，通过线性变换对特征进行嵌入，对嵌入后的特征进行矩阵乘，得到空间和时间相关矩阵，并依据相关矩阵对特征进行融合。

8.根据权利要求1所述的移动机器人红外目标跟踪方法，其特征在于，在所述步骤S4中，在响应图中，根据响应图的峰值确定目标在下一帧中的位置。

9.一种基于时空特征聚合网络的移动机器人红外目标跟踪系统，其特征在于，包括：存储器、处理器以及存储在所述存储器上的计算机程序，所述计算机程序配置为由所述处理器调用时实现权利要求1-8中任一项所述的移动机器人红外目标跟踪方法的步骤。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，所述计算机程序配置为由处理器调用时实现权利要求1-8中任一项所述的移动机器人红外目标跟踪方法的步骤。