CN113592899A

CN113592899A - 一种相关滤波目标跟踪深度特征的提取方法

Info

Publication number: CN113592899A
Application number: CN202110593777.3A
Authority: CN
Inventors: 许廷发; 张语珊; 吴零越; 吴凡
Original assignee: Beijing Institute of Technology BIT; Chongqing Innovation Center of Beijing University of Technology
Current assignee: Beijing Institute of Technology BIT; Chongqing Innovation Center of Beijing University of Technology
Priority date: 2021-05-28
Filing date: 2021-05-28
Publication date: 2021-11-02

Abstract

本发明提供了一种相关滤波目标跟踪深度特征的提取方法，包括S1：获取输入视频序列，设定目标跟踪的搜索区域；S2：构建深度特征提取网络模型，在残差网络模型卷积块输出后进行裁剪操作提取当前帧图像的深度特征，将深度特征和高斯标签作为输入训练滤波器；S3：获取下一帧图像数据根据对应搜索区域提取的特征；S4：下一帧图像数据对应提取的图像特征与相关滤波器进行相关操作获得目标预测位置。本发明通过构建模型中的裁剪修正操作，去除了深度特征提取过程中填充补零操作对特征质量的影响，提高了目标预测位置的准确性。

Description

一种相关滤波目标跟踪深度特征的提取方法

技术领域

本发明涉及图像处理技术领域，特别涉及一种相关滤波目标跟踪深度特征的提取方法。

背景技术

视觉目标跟踪一直是计算机视觉领域的研究热点，在公共监控、自动驾驶等领域有着广泛的应用。跟踪的目的是在已知第一帧中目标的初始状态的情况下，预测目标在后续帧中的位置。当下，视觉跟踪的主流方法是判别方法，如基于相关滤波(DCF)的跟踪器，通常将其作为分类问题，然后进行精确的定位步骤。

在相关滤波跟踪过程中，为了得到鲁棒的目标描述，通常采用深度卷积神经网络进行特征提取。深度学习方法应用在计算机视觉许多不同的领域，特别是图像识别和分类方面具有突出的效果，例如AlexNet、google、VggNet、ResNet、DenseNet、SENet等。由于这些网络模型在图像的识别和分类中具有显著效果，因而其中一些网络模型也被引入到视觉目标跟踪任务中，进行特征的提取。

然而，深度卷积神经网络中大部分都涉及填充补零操作，由于在图像边缘进行填充操作与实际情况相矛盾，因此会降低其性能。

发明内容

本发明提供了一种相关滤波目标跟踪深度特征的提取方法，通过引入一个裁剪单元来裁减掉被填充补零操作影响的深度特征的最外层像素，提高模型的性能。

本发明提供了一种相关滤波目标跟踪深度特征的提取方法，方法具体步骤如下：

步骤S1：获取输入视频的各帧图像数据，设定目标跟踪的搜索区域。

步骤S2：构建深度特征提取网络模型，并根据该网络模型对当前帧图像数据的所述搜索区域进行特征提取，获得不受补零操作影响的特征；

通过得到的当前帧图像对应的深度特征以及高斯标签训练滤波模板；

步骤S3：获取下一帧图像数据根据所述深度特征提取网络模型，提取对应设定的搜索区域的图像特征；

步骤S4：将下一帧图像数据对应搜索搜索区域所提取的特征与训练得到的相关滤波器进行卷积操作得到目标预测位置。

进一步的，所述深度特征提取网络模型采用残差网络结构，在卷积块的激活函数输出后设有预处理层，所述预处理层对最外层特征进行裁剪，将特征范围由0：N裁剪为1：N-1，N表示特征范围。

进一步的，所述卷积块包括基本块basic block和瓶颈块和bottleneck block。

进一步的，所述卷积操作为对每个特征通道，求取输入特征和滤波模板的卷积，并将各个通道得到的结果相加，具体公式如下：

其中，d表示特征通道的个数，x表示输入特征，f表示滤波模板。

进一步的，所述搜索区域设定为以跟踪目标为中心的面积为跟踪目标面积的16倍的正方形区域。

进一步的，步骤S2中，训练相关滤波器的模板如下：

其中，ω为空间约束正则化项系数，α_i为每个训练样本所占权重,S_f(x_i)为对样本x_i的输出卷积响应，y_i为样本高斯标签，f为的滤波器，l为滤波器通道数量。

本发明的有益效果如下：

1、通过对ResNet残差网络模型中的每个卷积层的block进行裁剪修正操作，去除了深度特征提取过程中填充补零操作对特征质量的影响，提高了提取深度特征的图像表征效果，提高模型训练效果。

2、将上一帧图像提取的对应深度特征与高斯标签训练滤波模板并通过下一帧图像提取的对应深度特征进行卷积操作得到目标预测位置，对模板进行更新，使得最终的滤波模型的输出更加准确。

附图说明

图1是本发明方法流程示意图；

图2是本发明的训练流程示意图；

图3是本发明的ResNet网络结构basic block对比结构示意图；

图4是本发明的ResNet网络结构bottleneck block对比结构示意图。

具体实施方式

在下面的描述中对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本发明的一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

实施例1

本发明的实施例提供了一种相关滤波目标跟踪深度特征的提取方法，如图1所示，方法包括如下步骤：

步骤S1：获取输入视频的各帧图像数据，设定目标跟踪的搜索区域为以跟踪目标为中心的面积为跟踪目标面积的16倍的正方形区域。

所述深度特征提取网络模型采用残差网络结构，在卷积块的激活函数输出后设有预处理层，本实施例中，神经网络模型中所述卷积块包括基本块basic block和瓶颈块bottleneck block；

如图2所示，为神经网络模型中基本块basic block的结构对比图，左侧图为原始网络模型中basic block的结构图，为两个conv3×3的卷积层通过批归一化层bn和激活函数relu连接，右侧图为在卷积块的输出后增加的预处理操作。

如图3所示，为神经网络模型中瓶颈块bottleneck block的结构对比图，左侧图为原始网络模型中bottleneck block的结构图，包括两个conv1×1的卷积层和一个conv3×3的卷积层，卷积层之间通过批归一化层bn和激活函数relu连接，右侧图为在卷积块的输出后增加的预处理操作。

所述预处理操作即对特征范围进行裁剪，将最外层特征裁剪，特征范围由0：N裁剪为1：N-1，N表示特征范围。

训练相关滤波器的模板如下：

其中，ω为空间约束正则化项系数，α_i为每个训练样本所占权重,S_f(x_i)为对样本x_i的输出卷积响应，y_i为样本高斯标签，f为滤波器，l为滤波器通道数量。

步骤S4：将下一帧图像数据对应搜索搜索区域所提取的特征与训练得到的相关滤波器进行卷积操作得到目标预测位置；

所述卷积操作为对每个特征通道，求取输入特征和滤波模板的卷积，并将各个通道得到的结果相加，具体公式如下：

所述搜索区域的为以跟踪目标为中心的面积为跟踪目标面积的16倍的正方形区域。

本发明并不局限于前述的具体实施方式。本发明扩展到任何在本说明书中披露的新特征或任何新的组合，以及披露的任一新的方法或过程的步骤或任何新的组合。

Claims

1.一种相关滤波目标跟踪深度特征的提取方法，其特征在于，包括如下步骤：

步骤S1：获取输入视频的各帧图像数据，设定目标跟踪的搜索区域；

步骤S4：将下一帧图像数据对应搜索区域所提取的特征与训练得到的相关滤波器进行卷积操作得到目标预测位置。

2.根据权利要求1所述的相关滤波目标跟踪深度特征的提取方法，其特征在于，所述深度特征提取网络模型采用残差网络结构，在卷积块的激活函数输出后设有预处理层，所述预处理层对最外层特征进行裁剪，将特征范围由0：N裁剪为1：N-1，N表示特征范围。

3.根据权利要求2所述的相关滤波目标跟踪深度特征的提取方法，其特征在于，所述卷积块包括基本块basic block和瓶颈块和bottleneck block。

4.根据权利要求1所述的相关滤波目标跟踪深度特征的提取方法，其特征在于，所述卷积操作为对每个特征通道，求取输入特征和滤波模板的卷积，并将各个通道得到的结果相加，具体公式如下：

5.根据权利要求1所述的相关滤波目标跟踪深度特征的提取方法，其特征在于，所述搜索区域设定为以跟踪目标为中心的面积为跟踪目标面积的16倍的正方形区域。

6.根据权利要求1所述的相关滤波目标跟踪深度特征的提取方法，其特征在于，步骤S2中，训练相关滤波器的模板如下：

其中，ω为空间约束正则化项系数，α_i为每个训练样本所占权重,S_f(x_i)为对样本x_i的输出卷积响应，y_i为样本高斯标签。