CN107633529A

CN107633529A - 一种深度卷积神经网单目标跟踪方法、设备及存储设备

Info

Publication number: CN107633529A
Application number: CN201710814400.XA
Authority: CN
Inventors: 陈分雄; 陶然; 陈沁仪; 黄华文; 刘建林; 尹关; 唐曜曜; 凌承昆; 王典洪
Original assignee: China University of Geosciences
Current assignee: China University of Geosciences
Priority date: 2017-09-11
Filing date: 2017-09-11
Publication date: 2018-01-26

Abstract

本发明提供了一种深度卷积神经网单目标跟踪方法、设备及存储设备，所述方法包括步骤：对深度卷积神经网络进行预训练；训练后得到深度卷积神经网络模型参数；根据模型参数得到训练后的深度卷积神经网络；初始化训练后的深度卷积神经网络模型的末端网络层以突出跟踪目标特征；获取训练后并初始化后的深度卷积神经网络模型；通过高斯分布融合光流特征点来简化跟踪目标；将简化的跟踪目标输入训练后并初始化后的深度卷积神经网络模型得到输出结果；训练回归模型用于修正所述输出结果得到修正结果；使用修正结果更新深度卷积神经网络模型参数,得到最新的深度卷积神经网络模型。本发明在保证跟踪精度优势的情况下获得实用的算法处理速度。

Description

一种深度卷积神经网单目标跟踪方法、设备及存储设备

技术领域

本发明涉及深度学习技术领域，具体涉及一种深度卷积神经网单目标跟踪方法、设备及存储设备。

背景技术

人类对客观世界的感知有70％由视觉获取，使用计算机代替人类对世界进行感知、语义分析和理解是计算机视觉的最终目标。在计算机视觉领域，目标跟踪是关键技术。但是，在视频跟踪过程中目标的形变、尺寸变化、旋转、背景噪声、部分遮挡以及光照变化等使得对目标跟踪的研究仍具有很大的挑战性，这些外在因素影响了图像跟踪的精度。如何在获取较高跟踪精度的同时，还能保持图像的处理速度符合实用要求，就成为本领域亟待解决的问题。

发明内容

为了解决上述问题，本发明提供了一种深度卷积神经网单目标跟踪方法、设备及存储设备，通过将，从而有效解决上述问题。

本发明提供的技术方案是：一种深度卷积神经网单目标跟踪方法，所述方法包括步骤：对深度卷积神经网络进行预训练；训练后得到深度卷积神经网络模型参数；根据模型参数得到训练后的深度卷积神经网络；初始化训练后的深度卷积神经网络模型的末端网络层以突出跟踪目标特征；获取训练后并初始化后的深度卷积神经网络模型；通过高斯分布融合光流特征点来简化跟踪目标；将简化的跟踪目标输入训练后并初始化后的深度卷积神经网络模型得到输出结果；训练回归模型用于修正所述输出结果得到修正结果；使用修正结果更新深度卷积神经网络模型参数,得到最新的深度卷积神经网络模型。

本发明的有益效果是：本发明提供了一种深度卷积神经网单目标跟踪方法、设备及存储设备,通过在CNN模型中加入HM策略与BB回归模型，大幅提升了图像跟踪精度。然后使用高斯分布融合光流特征点优化提取候选框，在付出极少量跟踪精度(仍然保留了较大精度优势)的情况下大幅提升了算法处理速度，最终做到在保证跟踪精度优势的情况下获得实用的算法处理速度。

附图说明

图1是本发明实施例中深度卷积神经网单目标跟踪方法的整体流程图；

图2是本发明实施例中深度卷积神经网络模型构建示意图；

图3是本发明实施例中深度卷积神经网络模型批训练示意图；

图4是本发明实施例的通过高斯分布融合光流特征点来优化跟踪结果示意图；

图5是本发明实施例中加入HM(hard negative mining)策略及BB(bounding box)回归的跟踪效果对比图；

图6是本发明实施例中使用高斯分布融合光流特征点进行跟踪优化的效果图；

图7是本发明实施例的硬件设备工作示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明实施方式作进一步地描述，下文中提到的具体技术细节，如：方法，设备等，仅为使读者更好的理解技术方案，并不代表本发明仅局限于以下技术细节。

本发明的实施例提供了一种深度卷积神经网单目标跟踪方法、设备及存储设备，通过将。请参阅图1，图1是本发明实施例中深度卷积神经网单目标跟踪方法的整体流程图，所述方法由一种深度卷积神经网单目标跟踪设备实现，具体步骤包括：

S101：对深度卷积神经网络进行预训练。

S102：训练后得到深度卷积神经网络模型参数；所述深度卷积神经网络模型参数为{W₁,……,W₅}。

S103：根据模型参数得到训练后的深度卷积神经网络。

S104：初始化训练后的深度卷积神经网络模型的末端网络层以突出跟踪目标特征，具体包括：根据具体的跟踪目标来初始化深度卷积神经网络模型参数W₆, 这样就突出了跟踪目标的特征,淡化了无关特征。

S105：获取训练后并初始化后的深度卷积神经网络模型。

S106：通过高斯分布融合光流特征点来简化跟踪目标，具体包括：首先根据上一帧跟踪结果通过高斯分布来选取一些候选框，然后通过两帧之间的光流特征点来筛选出更有效的目标候选框，最后通过网络计算置信度确定跟踪结果。

S107：将简化的跟踪目标输入训练后并初始化后的深度卷积神经网络模型得到输出结果。

S108：训练回归模型用于修正所述输出结果得到修正结果，具体包括：所述回归模型为bounding box回归模型。

S109：使用修正结果更新深度卷积神经网络模型参数,得到最新的深度卷积神经网络模型，具体包括：使用历史跟踪结果更新深度卷积神经网络模型参数。

参见图2，图2是本发明实施例中深度卷积神经网络模型构建示意图，其中：201表示输入层，202表示第一卷积层，203表示第二卷积层，204表示第三卷积层，205表示第一全连接层，206表示第二全连接层，207表示第三全连接层。模型的具体构建步骤包括：构建202、203及204对输入图像进行降维；使用卷积核提取图像的通用深层特征；构建205及206将提取到的特征进行组合得到更具区分力的典型特征；构建207对典型特征做进一步组合，组合后的典型特征能够对图像的目标和背景进行区分。

参见图3，图3是本发明实施例中深度卷积神经网络模型批训练示意图，其中：301表示损失值轴，302表示批训练次数轴，303表示损失值曲线。由图中可见，随着批训练次数的增加，构建出的深度卷积神经网络模型的损失值也逐渐减小。

参见图4，图4是本发明实施例的通过高斯分布融合光流特征点来优化跟踪结果示意图，其中：401表示原始图像，402表示加入高斯分布融合光流特征点后的图像，403表示处理后确定的跟踪结果图像。从图中可见，经过高斯分布融合光流特征点处理后的图像得到了简化，突出了需要跟踪的结果。

参见图5，图5是本发明实施例中加入HM(hard negative mining)策略及 BB(bounding box)回归的跟踪效果对比图，其中：501表示中心位置准确率轴， 502表示中心像素误差阈值轴，503表示重叠成功率轴，504表示重叠率阈值轴， BaseCNN表示基本卷积神经网络的曲线，BaseCNN+HM表示加入了HM策略的基本卷积神经网络的曲线，BaseCNN+HM+BB表示加入了HM策略和BB回归的基本卷积神经网络的曲线。由图中可见，加入了HM策略和BB回归的基本卷积神经网络的跟踪效果最好。表1是BaseCNN+HM+BB与其他算法跟踪性能对比。其中，DP rate 表示跟踪位置精度成功率，OS rate表示跟踪重叠成功率，CLE表示跟踪结果中心点像素误差，FPS表示帧数。由表1可见，BaseCNN+HM+BB模型相较与其他算法在跟踪精度上有明显的优势。

表1

参见图6，图6是本发明实施例中使用高斯分布融合光流特征点进行跟踪优化的效果图，其中：601表示中心位置准确率轴，602表示中心像素误差阈值轴， 603表示重叠成功率轴，604表示重叠率阈值轴，605表示优化前重叠成功率曲线，606表示优化后重叠成功率曲线，607表示优化后中心位置准确率曲线，608 表示优化前中心位置准确率曲线。由图中可见，使用高斯分布融合光流特征点进行跟踪优化后，虽然稍微降低了跟踪精度，但是简化了处理数量，提升了处理速度。同时，跟踪精度差异在可接受范围内，对跟踪效果基本未构成实质影响。表2是CNN结合高斯分布融合光流特征点(LK)模型与其他模型跟踪性能的比较。对比表1与表2可见，优化后跟踪精度有了较小的损失，但在跟踪速度上有了显著的提升(5.5倍FPS)。

表2

参见图7，图7是本发明实施例的硬件设备工作示意图，所述硬件设备具体包括：一种深度卷积神经网单目标跟踪设备701、处理器702及存储设备703。

深度卷积神经网单目标跟踪设备701：所述一种深度卷积神经网单目标跟踪设备701实现所述一种深度卷积神经网单目标跟踪方法。

处理器702：所述处理器702加载并执行所述存储设备703中的指令及数据用于实现所述的一种深度卷积神经网单目标跟踪方法。

存储设备703：所述存储设备703存储指令及数据；所述存储设备703用于实现所述的一种深度卷积神经网单目标跟踪方法。

通过执行本发明的实施例，本发明权利要求里的所有技术特征都得到了详尽阐述。

区别于现有技术，本发明的实施例提供了一种深度卷积神经网单目标跟踪方法、设备及存储设备,通过在CNN模型中加入HM策略与BB回归模型，大幅提升了图像跟踪精度。然后使用高斯分布融合光流特征点优化提取候选框，在付出极少量跟踪精度(仍然保留了较大精度优势)的情况下大幅提升了算法处理速度，最终做到在保证跟踪精度优势的情况下获得实用的算法处理速度。

以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种深度卷积神经网单目标跟踪方法，所述方法由一种深度卷积神经网单目标跟踪设备实现，其特征在于：包括以下步骤：对深度卷积神经网络进行预训练；训练后得到深度卷积神经网络模型参数；根据模型参数得到训练后的深度卷积神经网络；初始化训练后的深度卷积神经网络模型的末端网络层以突出跟踪目标特征；获取训练后并初始化后的深度卷积神经网络模型；通过高斯分布融合光流特征点来简化跟踪目标；将简化的跟踪目标输入训练后并初始化后的深度卷积神经网络模型得到输出结果；训练回归模型用于修正所述输出结果得到修正结果；使用修正结果更新深度卷积神经网络模型参数,得到最新的深度卷积神经网络模型。

2.如权利要求1所述的一种深度卷积神经网单目标跟踪方法，其特征在于：所述深度卷积神经网络模型参数为{W₁,……,W₅}。

3.如权利要求1所述的一种深度卷积神经网单目标跟踪方法，其特征在于：所述初始化深度卷积神经网络的末端网络层具体包括：根据具体的跟踪目标来初始化深度卷积神经网络模型参数W₆。

4.如权利要求1所述的一种深度卷积神经网单目标跟踪方法，其特征在于：所述回归模型为bounding box回归模型。

5.如权利要求1所述的一种深度卷积神经网单目标跟踪方法，其特征在于：所述通过高斯分布融合光流特征点来简化跟踪目标具体包括：首先根据上一帧跟踪结果通过高斯分布来选取一些候选框，然后通过两帧之间的光流特征点来筛选出更有效的目标候选框，最后通过网络计算置信度确定跟踪结果。

6.如权利要求1所述的一种深度卷积神经网单目标跟踪方法，其特征在于：所述更新深度卷积神经网络模型参数具体为：使用历史跟踪结果更新深度卷积神经网络模型参数。

7.如权利要求1所述的一种深度卷积神经网单目标跟踪方法，其特征在于：所述深度卷积神经网络模型的构建具体包括步骤：构建卷积层对输入图像进行降维；使用卷积核提取图像的通用深层特征；构建初始全连接层将提取到的特征进行组合得到更具区分力的典型特征；构建最终全连接层对典型特征做进一步组合。

8.如权利要求7所述的一种深度卷积神经网单目标跟踪方法，其特征在于：所述构建最终全连接层对典型特征做进一步组合后能够对图像的目标和背景进行区分。

9.一种存储设备，其特征包括：所述存储设备存储指令及数据用于实现权利要求1～8所述的一种深度卷积神经网单目标跟踪方法。

10.一种深度卷积神经网单目标跟踪设备，其特征在于：包括：处理器及所述存储设备；所述处理器加载并执行所述存储设备中的指令及数据用于实现权利要求1～8所述的一种深度卷积神经网单目标跟踪方法。