CN113610888B

CN113610888B - 一种基于高斯平滑的孪生网络目标跟踪方法

Info

Publication number: CN113610888B
Application number: CN202110725901.7A
Authority: CN
Inventors: 谭敏; 闫胜业
Original assignee: Nanjing University of Information Science and Technology
Current assignee: Nanjing University of Information Science and Technology
Priority date: 2021-06-29
Filing date: 2021-06-29
Publication date: 2023-11-24
Anticipated expiration: 2041-06-29
Also published as: CN113610888A

Abstract

本发明涉及一种基于高斯平滑的孪生网络目标跟踪方法，属于计算机视觉技术领域。该方法包括如下步骤：1、选择目标模板；2、获取搜索区域；3、将获取的模板图像和搜索区域图像分别输入到孪生特征提取网络中进行特征提取；4、特征提取后得到模板图像特征和搜索区域图像特征，对得到的搜索区域图像特征进行高斯平滑处理；5、将模板图像特征和高斯平滑后的搜索区域图像特征进行互相关运算，得到响应图；6、将响应图用双三线性插值放大到搜索区域图像大小，放大后响应图上得分最大的点，即为预测目标的位置。本发明使提取到的图像特征更具有判别性；同时，防止跟踪漂移，使跟踪结果更准确。

Description

一种基于高斯平滑的孪生网络目标跟踪方法

技术领域

本发明涉及一种基于高斯平滑的孪生网络目标跟踪方法，属于计算机视觉技术领域。

背景技术

近几年来，深度学习技术在计算机视觉中的应用越来越广泛，在图像分类、图像检测、图像分割方面均取得了长足的进步，在目标跟踪领域也不例外。受深度学习在其他不同领域内的启发，应用深度学习的目标跟踪算法不断涌现，其中基于卷积神经网络(Convolutional Neural Network，CNN)的目标跟踪算法占据了主导地位。

构造传统特征需要考虑特征的尺度不变性、光照不变性、旋转不变性等特性，但是卷积特征只需要大量的图像进行训练便可以得到具有更强判别力的特征，这是传统特征所无法比拟的。CNN在目标跟踪中的应用，不仅仅因为CNN提取的特征具有非常强的判别能力，更得益于CNN的网络结构具有很强的迁移能力。在其他任务中训练得到的网络模型进行微调便可以应用于目标跟踪任务。因此，基于CNN的目标跟踪算法在其他计算机视觉任务的影响下得到了迅猛发展。HCF(分层卷积特征算法)发现不同层次的卷积层对于目标跟踪具有不同的作用，高层卷积层具有更多的语义信息，低层卷积层具有更多的纹理信息，将不同卷积层的响应进行加权可以到了更好的跟踪效果。ECO(高效卷积操作符算法)通过特征降维、目标函数求解优化、模型更新策略调整等方面对跟踪过程进行了加速，兼顾了性能与速度。

上述使用CNN与相关性滤波结合的方法，集结了深度学习与传统方法各自的特点，但是无法进行端对端的训练，从而并没有发挥出深度学习强大的优势。最近几年，基于孪生神经网络的目标跟踪算法，由于其轻便性和可扩展性，得到了快速发展。SiamFC算法使用全卷积的孪生神经网络，进行模板图像和搜索区域图像匹配，输出的响应图中得分最高的位置，具有较高的跟踪速度。由于SiamFC很好地平衡了目标跟踪中跟踪速度与跟踪精度的关系，打破了相关滤波方法在目标跟踪中的垄断地位，于是成为了当前最经典的孪生网络目标跟踪算法。但SiamFC算法仍存在针对遮挡、相似语义背景信息干扰下跟踪漂移，鲁棒性差等问题。如何克服目标在视频中的遮挡、背景信息干扰等因素影响，从而实现准确的目标跟踪，仍是科研人员急需解决的问题。

发明内容

本发明提出了一种基于高斯平滑的孪生网络目标跟踪方法，在SiamFC算法的基础上，充分利用当前更强的骨干网络，使提取到的图像特征更具有判别性；同时，通过高斯平滑函数抑制目标周边具有相似语义信息干扰的背景信息，防止跟踪漂移，使跟踪结果更准确。

本发明为解决其技术问题采用如下技术方案：

一种基于高斯平滑的孪生网络目标跟踪方法，包括如下步骤：

第一步：选择目标模板，模板图像为初始帧中以目标为中心框选一个刚好包住目标的图像，记为z；

第二步：获取搜索区域，搜索区域图像是以上一帧的目标为中心，大小是模板图像的4倍的区域图像，记为x；

第三步：将获取的模板图像和搜索区域图像分别输入到孪生特征提取网络中进行特征提取；

第四步：特征提取后得到模板图像特征和搜索区域图像特征/>对得到的搜索区域图像特征/>进行高斯平滑处理；

第五步：将模板图像特征和高斯平滑后的搜索区域图像特征进行互相关运算，得到响应图；

第六步：将响应图用双三线性插值放大到搜索区域图像大小，放大后响应图上得分最大的点，即为预测目标的位置。

步骤3所述特征提取网络采用的是修改后的VGG16网络。

步骤4所述对得到的搜索区域图像特征进行高斯平滑处理具体如下：

用搜索区域图像特征乘上高斯分布蒙版G(i，j)，抑制背景信息。

本发明的有益效果如下：

1、本发明使提取到的图像特征更具有判别性。

2、本发明防止跟踪漂移，使跟踪结果更准确。

附图说明

图1为方法框架图。

图2为高斯分布蒙版图。

具体实施方式

下面结合附图对本发明创造做进一步详细说明。

在本发明中，跟踪任意目标的任务可以看做是相似性学习的问题。基于孪生网络的跟踪器利用孪生网络可以学习相似性的特点实现跟踪。假设要学习的相似性函数由孪生网络f(x，z|θ)表示，其中x和z分别表示以目标为中心框取的搜索区域图像和模板图像，θ表示该网络的参数，经过f(x，z)的计算，得到一个目标模板z在搜索区域x中不同位置的打分，当前位置得分越高，说明目标越有可能处于这个位置。如图1所示，在实际应用中，x和z并不直接参与相似性的计算，而是先经过一个特征提取网络得到相应的特征/>和/>我们对搜索区域图像特征/>进行高斯平滑处理，具体操作是用/>乘上高斯分布蒙版，最后将模板图像特征和搜索区域图像特征进行互相关运算，得到响应图，响应图上得分最大的点，即为预测目标的位置。相似性度量函数如式(1)所示：

G(i，j)表示高斯分布蒙版的亮度范围是从1到0，*表示互相关运算。

如图2所示，高斯分布蒙版的亮度范围是从1到0，从中心到边缘逐渐减弱，中心的亮度值最高为1，边缘的亮度值最低为0.图像上任何一点的亮度值为：

其中i，j表示图2上任何一点的坐标，以左上角为坐标原点，d表示图像上任何一点到图像中心点的距离，R表示图像的半径，具体计算式如式(3)、(4)。图像的高(H)和宽(W)与一致。

高斯分布蒙版能有效抑制搜索区域图像中目标周边的背景信息，使经过互相关运算后得到的响应图上的打分更准确，提升跟踪鲁棒性。

算法训练过程

式(1)得到的孪生网络f通过在VID、GOT-10k数据集上进行离线训练，在训练的过程中，利用判别的方法对f进行训练，其损失函数定义如式(5)、(6)所示：

l(y，v)＝log(1+exp(-yv)) (5)

其中，y∈[-1，+1]表示标签值，D是互相关运算后的生成的响应图，v是响应图上的实际得分，u为响应图中任意一点，|D|为响应图的大小。响应图的标签值按照公式(7)进行标记：

其中：c为响应图的中心，||u-c||是u与c的欧氏距离，T为距离的阈值，k网络的下采样步长。

如图1所示为本发明提供的一种基于高斯平滑的孪生网络目标跟踪方法框架图。将数据集中的目标图像和搜索区域图像分别输入到孪生特征提取网络中，特征提取网络采用的是修改后的VGG16网络，具体结构如表1所示。

表1修改后的VGG16网络结构

得到模板图像特征特征和搜索区域图像特征/>后，对搜索区域图像特征进行高斯平滑处理，抑制背景信息。最后将模板图像特征和高斯平滑处理后的搜索区域图像特征进行互相关运算，得到响应图，利用损失函数(6)进行训练学习。

Claims

1.一种基于高斯平滑的孪生网络目标跟踪方法，其特征在于，包括如下步骤：

第三步：将获取的模板图像和搜索区域图像分别输入到特征提取网络φ中进行特征提取；

第四步：特征提取后得到模板图像特征φ(z)和搜索区域图像特征φ(x)，对得到的搜索区域图像特征φ(x)进行高斯平滑处理；具体如下：

用搜索区域图像特征φ(x)乘上高斯分布蒙版G(i,j)，抑制背景信息，高斯分布蒙版的亮度范围是从1到0，从中心到边缘逐渐减弱，中心的亮度值最高为1，边缘的亮度值最低为0，图像上任何一点的亮度值为:

其中i,j表示图上任何一点的坐标，以左上角为坐标原点，d表示图像上任何一点到图像中心点的距离，R表示图像的半径；

第五步：将模板图像特征φ(z)和高斯平滑后的搜索区域图像特征进行互相关运算，得到响应图；

2.根据权利要求1所述的一种基于高斯平滑的孪生网络目标跟踪方法，其特征在于，步骤3所述特征提取网络φ采用的是修改后的VGG16网络。