CN110147747B

CN110147747B - 一种基于累积一阶导数高置信度策略的相关滤波跟踪方法

Info

Publication number: CN110147747B
Application number: CN201910385800.2A
Authority: CN
Inventors: 高赟; 余丽; 张学杰; 张晋; 林宇
Original assignee: Yunnan University YNU; Kunming Institute of Physics
Current assignee: Yunnan University YNU; Kunming Institute of Physics
Priority date: 2019-05-09
Filing date: 2019-05-09
Publication date: 2022-07-12
Anticipated expiration: 2039-05-09
Also published as: CN110147747A

Abstract

本发明涉及相关滤波跟踪方法，具体涉及一种基于累积一阶导数高置信度策略的相关滤波跟踪方法。所述方法基于相关滤波跟踪框架，采用方向梯度直方图(HOG)和颜色直方图两种互补特征进行特征提取，融合后的响应图最大值对应位置作为当前帧跟踪结果，并根据响应图历史序列最大值向量的累积一阶导数和当前帧响应图最大值对当前跟踪结果的置信度进行判别，当前跟踪结果具有高置信度情况下方可更新目标模板以提高目标模板的正确性。本申请相比逐帧更新策略的相关滤波跟踪方法，取得了更为稳定的跟踪效果。

Description

一种基于累积一阶导数高置信度策略的相关滤波跟踪方法

技术领域

本发明涉及相关滤波跟踪方法，具体涉及一种基于累积一阶导数高置信度策略的相关滤波跟踪方法。

背景技术

视频目标跟踪是计算机视觉领域的研究热点之一，其目的是为了在视频图像序列中估计目标的位置。该技术在视频监控、人机交互、机器人领域和无人驾驶汽车等众多应用中扮演着十分重要的角色。实时性和稳定性是实现目标跟踪系统的两大目标。卷积原理表明耗时的卷积运算在傅立叶变换域可以转换为元素点积运算。基于卷积原理的相关滤波技术被引入到目标跟踪中，其极高的处理速度满足了目标跟踪系统对实时性的要求。然而，由于复杂场景下光照变化、外观变形、局部遮挡、快速运动、运动模糊、背景相似等诸多因素的干扰，视频目标跟踪仍然是一项具有挑战性的任务。

目标模板是跟踪系统判别每帧候选目标是否是真实目标的重要依据。目标模板又是一个在线学习的过程，其更新机制的好坏将影响目标模板与真实目标的偏离程度。目前，在大多数基于相关滤波框架的目标跟踪方法中，大多采用逐帧更新方式对目标模板进行更新。我们使用逐帧更新模板方式对跟踪结果准确性的影响做了如下的实验：

以Staple跟踪算法跟踪Girl2视频序列为例，Girl2视频中被跟踪目标在 105～123帧之间发生了局部遮挡甚至完全遮挡，在此期间对目标模板分别进行逐帧更新和不更新两种操作。在第105帧目标开始发生局部遮挡，在第108帧目标发生了完全遮挡，此时特征响应图的最大响应值快速下降，根据局部遮挡甚至完全遮挡的跟踪结果对目标模板逐帧更新，必然导致原本正确的目标模板被污染，进而模板漂移导致第123帧目标跟踪失败。对于目标发生遮挡的情况，如果采取目标模板不更新的操作，目标模板就不会受到遮挡后跟踪结果带来的负面影响，在第123帧目标再次出现时再次准确跟踪到目标。

由此可见，逐帧更新方式并不适用于所有视频环境的特点，遮挡情况下不更新模板反而产生了更准确的跟踪结果，其本质是由于目标模板没有受到遮挡情况下跟踪结果的影响发生漂移。那么，如果我们能够判别每帧跟踪结果的置信度，自然就可以根据高置信度的跟踪结果来更新模板，尽可能维持目标模板的正确性，进而促进跟踪系统的稳定性。

根据上述情况，本发明将基于相关滤波跟踪框架，提出一种基于累积一阶导数高置信度策略的相关滤波跟踪方法。

发明内容

为了解决上述问题，本发明提供了一种基于累积一阶导数高置信度策略的相关滤波跟踪方法。

具体技术方案为：一种基于累积一阶导数高置信度策略的相关滤波跟踪方法，所述方法基于相关滤波跟踪框架，采用方向梯度直方图和颜色直方图两种互补特征进行特征提取，融合后的响应图最大值对应位置作为当前帧跟踪结果，并根据响应图历史序列最大值向量的累积一阶导数和当前帧响应图最大值对当前跟踪结果的置信度进行判别，当前跟踪结果具有高置信度情况下方可更新目标模板以提高目标模板的正确性。

优选的，所述步骤包括：

步骤一、输入第一帧

视频帧序列中的每一帧左上角为坐标原点(1，1)，宽高分别为Width和Height，手工或自动选定第一帧中待跟踪目标的矩形区域(x₀，y₀，w₀，h₀)，即选定的跟踪目标；

其中，(x₀，y₀)表示矩形区域的左上角坐标，w₀，h₀分别表示矩形区域的宽高，第一帧选定目标也称为当前帧跟踪结果(x₁，y₁，w₁，h₁)＝(x₀，y₀，w₀，h₀)，下标表示当前帧号；

步骤二、初始化目标模板

(1)、计算搜寻窗口；

(2)、生成标准高斯响应图；

(3)、提取方向梯度直方图(HOG)特征；

(4)、计算HOG特征的相关滤波器模板；

(5)、提取颜色直方图特征模板；

步骤三、初始化高置信度策略参数

令No_Stable表示跟踪系统最近稳定态帧号，对于第一帧或当前帧被高置信度策略判别为稳定态时重置No_Stable＝t；

令No_Init表示跟踪系统的初始累积帧号，表示计算累积一阶导数的起始帧号，累积一阶导数至多计算连续n帧，设置方法如公式(1)所示：

令GL_t表示当前帧两种特征加权融合响应图，令GL_max_t表示GL_t矩阵中最大元素值，由于第一帧的跟踪目标是绝对正确的，故特别地对于第一帧将标准高斯响应图的频域表示G作为GL₁，且GL_max₁＝1；

令SumD表示当前帧的累积一阶导数，对于第一帧或当前帧被高置信度策略判别为稳定态时重置SumD＝0，对于其它帧按照公式(2)计算：

令UpdateFlag表示当前帧目标模板是否需要更新，令StableFlag表示当前帧是否被判别为稳定态，这两个参数可以同时为0，但不会同时为1，特别地对于第一帧UpdateFlag＝1，StableFlag＝0；

令H_Stable表示HOG特征相关滤波器模板的稳定态，第一帧将其初始化为H₁，令bg_hist_Stable和fg_hist_Stable分别表示背景颜色直方图和前景颜色直方图模板的稳定态，第一帧将其初始化为bg_hist₁和fg_hist₁；

令φ₁、φ₂、φ₃分别表示两种特征加权融合响应图矩阵元素取值范围中三个阈值，且-1.0＜φ₁≤φ₂＜φ₃＜1.0；令

分别表示累积一阶导数取值范围中三个阈值，且

步骤四、输入下一帧并提取特征

依据步骤二中步骤(1)的方法计算当前帧搜寻窗口Search(t)，依据步骤二中步骤(3)的描述提取当前帧方向梯度直方图(HOG)特征的频域表示F_t，当前帧HOG特征的响应图G_t根据公式G_t＝F_t⊙H_t-1计算得到；

依据步骤二中步骤(5)的方法提取当前帧颜色直方图特征bg_hist_t和 fg_hist_t，将搜寻区域图像中每个像素对应到直方图的bin值，结合标准目标窗口尺寸和上一帧颜色直方图特征bg_hist_t-1和fg_hist_t-1，计算出当前帧颜色直方图特征和颜色直方图模板的相似图谱L_t，其尺寸与高斯响应图G相同；

HOG特征响应图G_t和颜色直方图相似图谱L_t加权融合计算方法如公式(3) 所示：

GL_t＝α×G_t+(1-α)×L_t (3)

其中，GL_t表示当前帧两种特征加权融合响应图，α表示加权融合参数；

步骤五、确定跟踪结果

特征融合响应图GL_t矩阵元素值代表其对应搜寻窗口内候选目标是跟踪结果的概率，则最大元素值对应候选目标即是跟踪结果；

步骤六、高置信度判别

依据步骤三中公式(1)计算No_Init，依据公式(2)计算当前帧SumD，并依据UpdateFlag的值分为以下两种情况进行处理：

(1)、当UpdateFlag＝1的情况下，根据累积一阶导数和当前最大响应值进行判别：目标模板是否更新、当前帧是否稳定态；

(2)、当UpdateFlag＝0的情况下，根据累积一阶导数和当前最大响应值进行判别：目标模板是否恢复更新；

步骤七、更新目标模板

当UpdateFlag和StableFlag皆为0时转至步骤八，否则更新目标模板的方法如下：

(1)、根据当前帧跟踪结果提取特征；

(2)、更新模板；

步骤八、如果当前帧是最后一帧，跟踪结束；否则，转至步骤四。

优选的，所述步骤二具体包括以下步骤：

(1)、计算搜寻窗口

根据上一帧即t-1帧跟踪结果(x_t-1，y_t-1，w_t-1，h_t-1)对应的矩形区域可以计算出当前帧即第t帧候选目标的搜寻窗口Search(t)，特别地，第一帧搜寻窗口则根据 (x₀，y₀，w₀，h₀)计算；搜寻窗口的中心点为(x_s_t，y_s_t)，其中x_s_t＝x_t-1+w_t-1/2、 y_s_t＝y_t-1+h_t-1/2，宽高分别为w_s_t＝1.5×w_t-1+0.5×h_t-1、 h_s_t＝1.5×h_t-1+0.5×w_t-1；为了确保搜寻范围在视频帧范围内，进一步依据该搜寻范围与当前帧区域的交集修正搜寻窗口的宽高；为便于后续计算颜色直方图特征，限定搜寻窗口的边界与真实目标边界之间的距离为偶数，进一步修正搜寻窗口的宽高；

令标准化窗口NormWin的宽高分别为w_n和h_n，则搜寻窗口的变换因子为

根据搜寻窗口变换因子可以将搜寻窗口图像进行标准化变换形成标准搜寻窗口，其宽高为w_sn_t＝w_s_t×γ、h_sn_t＝h_s_t×γ，当前帧的标准目标窗口的宽高为w_on_t＝w_sn_t×0.75-h_sn_t×0.25、 h_on_t＝h_sn_t×0.75-w_sn_t×0.25；

(2)、生成标准高斯响应图

标准高斯响应图g是一个二维矩阵，其宽高为w_g＝w_sn_t/cell、 h_g＝h_sn_t/cell，其矩阵元素值是符合二维高斯分布N(0，0，δ，δ，0)的概率密度函数，可按照

公式进行计算；其中，δ表示二维高斯分布的标准差，计算方法为

cell表示HOG特征提取过程中每个格子的尺寸参数，格子尺寸为cell×cell，(i，j)表示高斯响应图矩阵的元素坐标位置，原点位于矩阵的中心点；将标准高斯响应图进行傅立叶变换可以得到其频域表示 G，其与g同尺寸；

(3)、提取方向梯度直方图(HOG)特征

HOG特征提取时每个格子尺寸为cell×cell、块大小为2×2个格子、直方图组距bin设置为2π/7，在当前帧标准化搜寻窗口内提取HOG特征f_t，其尺寸为 w_g×h_g×28；采用尺寸为w_g×h_g的余弦窗对特征f_t进行平滑处理，再进行傅里叶变换得到HOG特征的频域表示F_t，其与f_t同尺寸；

(4)、计算HOG特征的相关滤波器模板

已知标准化搜寻窗口HOG特征的频域表示F_t和标准高斯响应图的频域表示G，则HOG特征相关滤波器模板的频域表示H_t可以根据公式H_t＝G/F_t计算得到；

(5)、提取颜色直方图特征模板

搜寻窗口Search(t)＝(x_s_t，y_s_t，w_s_t，h_s_t)内目标区域(x_t-1，y_t-1，w_t-1，h_t-1) 以外的区域定义为背景区域，目标区域缩进一定量定义为前景区域，其中心点与目标区域相同，宽高缩进量皆为(w_t-1+h_t-1)/10；在背景区域和前景区域分别提取背景颜色直方图bg_hist_t和前景颜色直方图fg_hist_t，即为当前帧颜色直方图特征模板。

优选的，所述步骤五具体为：

当前帧搜寻窗口内候选目标的个数为(w_sn_t-w_on_t)×(h_sn_t-h_on_t)，令 GL_max_t、x_GL_max_t和y_GL_max_t分别表示当前帧特征融合响应图GL_t矩阵中最大元素值及其对应的横纵坐标位置，则当前帧跟踪结果为(x_t，y_t，w_t，h_t)；其中：

w_t＝w_t-1、h_t＝h_t-1、x_t＝x_t-1+(x_GL_max_t-(w_sn_t-w_on_t)/2)/γ-w_t/2、 y_t＝y_t-1+(y_GL_max_t-(h_sn_t-h_on_t)/2)/γ-h_t/2，γ为搜寻窗口的变换因子，该变换因子的计算方法为步骤二中步骤(1)。

优选的，所述步骤六中步骤(1)的判别方法具体为：

当累积一阶导数和当前最大响应值皆较小即SumD＜φ₁或者

时，判别当前帧目标模板不更新且当前帧为非稳定态，设置UpdateFlag＝0， StableFlag＝0；当累积一阶导数和当前最大响应值皆较为稳定即φ₂＜SumD＜φ₃且

时，判别当前帧目标模板不更新且当前帧为稳定态，设置UpdateFlag＝0，StableFlag＝1；当以上两种情况不满足时，判别当前帧目标模板保持更新，此时UpdateFlag＝1，StableFlag＝0。

优选的，所述步骤六中步骤(2)的判别方法具体为：当累积一阶导数和当前最大响应值恢复稳定即SumD＞φ₂且

时，判别当前帧目标模板恢复更新，设置UpdateFlag＝1，StableFlag＝0，否则，判别当前帧目标模板仍然不更新，此时UpdateFlag＝0，StableFlag＝0。

优选的，所述步骤七具体为：

(1)、根据当前帧跟踪结果提取特征；

依据当前帧跟踪结果(x_t，y_t，w_t，h_t)的位置和步骤二中步骤(1)的方法计算搜寻窗口Search′(t)，依据步骤二中步骤(3)的方法提取Search′(t)范围内方向梯度直方图(HOG)特征的频域表示F_t′，依据步骤二中步骤(4)的方法计算H_t′＝G/F_t′；依据当前帧跟踪结果(w_t，y_t，w_t，h_t)的位置和步骤二中步骤(5)的方法提取颜色直方图特征bg_hist_t′和fg_hist_t′；

(2)、更新模板；

令η为HOG特征相关滤波器模板H_t的更新参数，θ和β为背景颜色直方图和前景颜色直方图模板的更新参数；由于UpdateFlag和StableFlag不会同时为1，依据二者的值分为以下两种情况进行处理：

①当UpdateFlag＝1且StableFlag＝0时，目标模板更新方法如公式(4)～(6) 所示：

H_t＝(1-η)×H_t-1+η×H_t′ (4)

bg_hist_t＝(1-θ)×bg_hist_t-1+θ×bg_hist_t′ (5)

fg_hist_t＝(1-β)×fg_hist_t-1+β×fg_hist_t′ (6)

②当UpdateFlag＝0且StableFlag＝1时，设置参数UpdateFlag＝1， StableFlag＝0，SumD＝0，No_Stable＝t，目标模板更新方法如公式(7)～ (12)所示：

H_Stable＝(1-η)×H_Stable+η×H_t′ (7)

H_t＝H_Stable (8)

bg_hist_Stable＝(1-θ)×bg_hist_Stable+θ×bg_hist_t′ (9)

bg_hist_t＝bg_hist_Stable (10)

fg_hist_Stable＝(1-β)×fg_hist_Stable+β×fg_hist_t′ (11)

fg_hist_t＝fg_hist_Stable (12)。

本发明的有益效果为：本发明提出了一种基于累积一阶导数高置信度策略的相关滤波跟踪方法。该方法基于相关滤波跟踪框架，采用方向梯度直方图(HOG) 和颜色直方图两种互补特征进行特征提取，融合后的响应图最大值对应位置作为当前帧跟踪结果，并根据响应图历史序列最大值向量的累积一阶导数和当前帧响应图最大值对当前跟踪结果的置信度进行判别，当前跟踪结果具有高置信度情况下方可更新目标模板以提高目标模板的正确性。相比逐帧更新策略的相关滤波跟踪方法，取得了更为稳定的跟踪效果。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为一种基于累积一阶导数高置信度策略的相关滤波跟踪方法的示意图；

图2为视频序列第一帧跟踪区域选取情况；

图3为响应图融合；

图4为Girl2视频跟踪结果部分截图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

实施例1

选取Girl2视频帧序列进行目标跟踪，其具有光照变化、遮挡、尺度变化、形变、背景杂乱等挑战性问题。

步骤一、输入第一帧

选取Girl2视频，其中视频的规格是480*640*3，第一帧跟踪目标的矩形区域 (x₀，y₀，w₀，h₀)，即(294，135，44，171)，即选定的跟踪区域如图2点线框内所示，其中(294，135)是矩形区域左上角的坐标，(44，171)是矩形区域的宽高。

步骤二、初始化目标模板

(1)、计算搜寻窗口

根据上一帧即t-1帧跟踪结果(x_t-1，y_t-1，w_t-1，h_t-1)对应的矩形区域可计算当前帧，即第t帧的候选目标的搜寻窗口，特别的，第一帧搜寻窗口根据 (294，135，44，171)计算，搜寻窗口的Search(1)的中心点是(316，220.5)，宽高 w_s₁，h_s₁分别(152，279)。为了确保搜寻范围在视频帧范围内，进一步依据该搜寻范围与当前帧区域的交集修正搜寻窗口的宽高。为便于后续计算颜色直方图特征，限定搜寻窗口的边界与真实目标边界之间的距离为偶数，进一步修正搜寻窗口的宽高。

令标准化窗口NormWin的宽高分别为w_n＝150和h_n＝150，则搜寻窗口的变换因子为

根据搜寻窗口变换因子可以将搜寻窗口图像进行标准化变换形成标准搜寻窗口，其宽高为w_sn₁＝111、h_sn₁＝203，当前帧的标准目标窗口的宽高为w_on₁＝33、h_on₁＝125。

(1)、生成标准高斯响应图

标准高斯响应图g是一个二维矩阵，其宽高为w_g＝27、h_g＝50，其矩阵元素值是符合二维高斯分布N(0，0，δ，δ，0)的概率密度函数，可按照

公式进行计算。其中，δ表示二维高斯分布的标准差，δ＝1.0035， cell＝4表示HOG特征提取过程中每个格子的尺寸参数，格子尺寸为 cell×cell＝4×4，(i，j)表示高斯响应图矩阵的元素坐标位置，原点位于矩阵的中心点。将标准高斯响应图进行傅立叶变换可以得到其频域表示G，其与g同尺寸。

(3)、提取方向梯度直方图(HOG)特征

HOG特征提取时每个格子尺寸为cell×cell＝4×4、块大小为2×2个格子、直方图组距bin设置为2π/7，在当前帧标准化搜寻窗口内提取HOG特征f₁，其尺寸为27×50×28。采用尺寸为27×50的余弦窗对特征f₁进行平滑处理，再进行傅里叶变换得到HOG特征的频域表示F₁，其与f₁同尺寸。

(4)、计算HOG特征的相关滤波器模板

已知标准化搜寻窗口HOG特征的频域表示F_t和标准高斯响应图的频域表示G，则HOG特征相关滤波器模板的频域表示H₁可以根据公式H₁＝G/F₁计算得到。

(5)、提取颜色直方图特征模板

搜寻窗口Search(1)＝(316，220.5，125，279)内目标区域(294，135，44，171)计以外的区域定义为背景区域，目标区域缩进一定量定义为前景区域，其中心点与目标区域相同，宽高缩进量皆为10.75。在背景区域和前景区域分别提取背景颜色直方图bg_hist₁和前景颜色直方图fg_hist₁，即为当前帧颜色直方图特征模板。

步骤三、初始化高置信度策略参数

第一帧的No_Stable＝1。累积一阶导数连续计算5帧，No_Init＝1， SumD＝0，UpdateFlag＝1，StableFlag＝0。

由于第一帧的跟踪目标是绝对正确的，对于第一帧将标准高斯响应图的频域表示G作为GL₁，且GL_max₁＝1。

HOG特征相关滤波器，第一帧将其初始化为H₁。背景颜色直方图和前景颜色直方图模板的稳定态，第一帧初始化为bg_hist₁和fg_hist₁。

设置φ₁＝-0.25、φ₂＝0、φ₃＝0.1为两种特征加权融合响应图矩阵元素取值范围中三个阈值，设置

表示累积一阶导数取值范围中三个阈值。

步骤四、输入下一帧并提取特征

输入下一帧也就是第二帧，依据步骤二中步骤(1)的方法计算当前帧搜寻窗口Search(2)，依据步骤二中步骤(3)提取当前帧方向梯度直方图(HOG)特征的频域表示F₂，当前帧HOG特征的响应图G₂可以根据公式G₂＝F₂⊙H₁计算得到。

依据步骤二中步骤(5)的方法提取当前帧颜色直方图特征bg_hist₂和 fg_hist₂，将搜寻区域图像中每个像素对应到直方图的bin值，结合标准目标窗口尺寸和上一帧颜色直方图特征bg_hist₁和fg_hist₁，计算出当前帧颜色直方图特征和颜色直方图模板的相似图谱L₂，其尺寸与响应图G相同。

HOG特征响应图G₂和颜色直方图相似图谱L₂加权融合计算方法如公式(3) 所示：

GL₂＝0.7×G₂+(1-0.7)×L₂ (3)

其中，GL₂表示当前帧两种特征加权融合响应图，α表示加权融合参数，α＝0.7。响应图融合如图3所示：

特征融合的响应图矩阵值如表1所示，该表列出矩阵中第1行～10行，第1 列～10列的情况。

表1：特征融合的响应图矩阵

步骤五、确定跟踪结果

特征融合响应图GL₂矩阵元素值代表其对应搜寻窗口内候选目标是跟踪结果的概率，则最大元素值对应候选目标即是跟踪结果。

当前帧搜寻窗口内候选目标的个数为6084。令GL_max₂＝0.7294、 x_GL_max₂＝40和y_GL_max₂＝40分别表示当前帧特征融合响应图GL₂矩阵中最大元素值及其对应的横纵坐标位置，则当前帧跟踪结果为 (294，135，44，171)，其中w₂＝44、h₂＝171、x₂＝294、y₂＝135。

步骤六、高置信度判别

以第2帧为例：

由步骤三中公式(1)，(2)计算出No_Init＝1，SumD＝0，GL_max₂＝0.7294，并依据当前帧的UpdateFlag＝1，做如下操作：由于当前累积一阶导数和当前最大响应值为SumD＝0，GL_max₂＝0.7294，不满足SumD＜-0.25或者 GL_max_t＜0.15的条件，也不满足0＜SumD＜0.1且0.15＜GL_max₂＜0.4的条件，由于以上两种情况都不满足，所以判别当前帧目标模板保持更新，此时设置 UpdateFlag＝1，StableFlag＝0。

以第53帧为例：

由步骤三中公式(1)，(2)计算出No_Init＝48，SumD＝0.0119， GL_max₅₃＝0.2920，并依据当前帧的UpdateFlag＝1，所以做如下操作：由于当累积一阶导数和当前最大响应值为SumD＝0.0119和GL_max₅₃＝0.2920，满足0＜SumD＜0.1且0.15＜GL_max_t＜0.4的条件，判断当前帧的模板不更新，且当前帧为稳定态，此时设置UpdateFlag＝0，StableFlag＝1。

以第106帧为例：

由步骤三中公式(1)，(2)计算出No_Init＝101，SumD＝-0.1493， GL_max_t＝0.1241，并依据当前帧的UpdateFlag＝1，做如下操作：由于当前累积一阶导数和当前最大响应值为SumD＝-0.1493和GL_max_t＝0.1241，满足 SumD＜-0.25或者GL_max_t＜0.15的条件，判别当前帧目标模板不更新且当前帧为非稳定态，设置UpdateFlag＝0，StableFlag＝0。

以第107帧为例：

由步骤三中公式(1)，(2)计算出No_Init＝102，SumD＝-0.1803， GL_max_t＝0.1171，并依据当前帧的UpdateFlag＝0，做如下操作：由于当前累积一阶导数和当前最大响应值继续处于极小的情况，因为SumD＝-0.1803和 GL_max_t＝0.1171不满足SumD＞0且GL_max_t＞0.15的条件，所以判别当前帧的跟踪结果仍然存在异常，目标模板不更新，且当前帧为非稳定态，设置 UpdateFlag＝0，StableFlag＝0。

以第120帧为例：

由步骤三中公式(1)，(2)计算出No_Init＝115，SumD＝0.0199， GL_max_t＝0.1751，并依据当前帧的UpdateFlag＝0，所以做如下操作：由于 SumD＝0.0199和GL_max_t＝0.1751满足SumD＞0且GL_max_t＞0.15的条件，当前的累积一阶导数和最大响应值恢复稳定，判别当前帧目标模板恢复更新，设置 UpdateFlag＝1，StableFlag＝0。

步骤七、更新目标模板

以第106帧和第107帧为例：由于UpdateFlag和StableFlag的值都为0，则转到步骤八。

以第2帧、第53帧和第120帧为例：由于不满足UpdateFlag和StableFlag的值都为0，执行以下特征提取和更新目标模板的操作，方法如下。

(1)、根据当前帧跟踪结果提取特征

以第2帧为例：依据当前帧跟踪结果(294，135，44，171)的位置和步骤二中步骤(1)的方法计算搜寻窗口Search′(2)为(240，81，152，279)，依据步骤二中步骤 (3)的方法提取Search′(2)范围内方向梯度直方图(HOG)特征的频域表示F₂′，依据步骤二中步骤(4)的方法计算H₂′＝G/F₂′。依据当前帧跟踪结果 (294，135，44，171)的位置和步骤二中步骤(5)的方法提取颜色直方图特征 bg_hist₂′和fg_hist₂′。

(2)、更新模板

令η＝0.025为HOG特征相关滤波器模板H₂的更新参数，θ＝0.04和β＝0.04为背景颜色直方图和前景颜色直方图模板的更新参数。由于 UpdateFlag和StableFlag不会同时为1，，依据二者的值分为以下两种情况进行处理：

①以第2帧和第120帧为例：由于UpdateFlag＝1且StableFlag＝0，目标模板更新方法如公式(4)～(6)所示：

H₂＝(1-0.025)×H₁+0.025×H₂′ (4)

bg_hist₂＝(1-0.04)×bg_hist₁+0.04×bg_hist₂′ (5)

fg_hist₂＝(1-0.04)×fg_hist₁+0.04×fg_hist₂′ (6)。

②以第53帧为例：由于UpdateFlag＝0且StableFlag＝1，设置参数UpdateFlag＝1，StableFlag＝0，SumD＝0，No_Stable＝53，目标模板更新方法如公式(7)～(12)所示：

H_Stable＝(1-0.025)×H_Stable+0.025×H_t′ (7)

H₁₀₆＝H_Stable (8)

bg_hist_Stable＝(1-0.04)×bg_hist_Stable+0.04×bg_hist_t′ (9)

bg_hist₁₀₆＝bg_hist_Stable (10)

fg_hist_Stable＝(1-0.04)×fg_hist_Stable+0.04×fg_hist_t′ (11)

fg_hist₁₀₆＝fg_hist_Stable (12)。

最后，本发明实施例的硬件实验环境为Intel Core i7-6700 CPU、主频3.4GHz、内存8GB配置的计算机，最终跟踪结果的成功率达到98.7％，精度值可以达到 0.979，部分跟踪结果截图如图4所示。图中，实线框表示视频标记真实位置，点线框表示本发明跟踪结果，虚线框表示搜索区域。

以上所述仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等，均包含在本发明的保护范围内。

Claims

1.一种基于累积一阶导数高置信度策略的相关滤波跟踪方法，其特征在于，所述方法基于相关滤波跟踪框架，采用方向梯度直方图和颜色直方图两种互补特征进行特征提取，融合后的响应图最大值对应位置作为当前帧跟踪结果，并根据响应图历史序列最大值向量的累积一阶导数和当前帧响应图最大值对当前跟踪结果的置信度进行判别，当前跟踪结果具有高置信度情况下方可更新目标模板以提高目标模板的正确性；

步骤包括：

步骤一、输入第一帧

视频帧序列中的每一帧左上角为坐标原点(1,1)，宽高分别为Width和Height，手工或自动选定第一帧中待跟踪目标的矩形区域(x₀,y₀,w₀,h₀)，即选定的跟踪目标；

其中，(x₀,y₀)表示矩形区域的左上角坐标，w₀,h₀分别表示矩形区域的宽高，第一帧选定目标也称为当前帧跟踪结果(x₁,y₁,w₁,h₁)＝(x₀,y₀,w₀,h₀)，下标表示当前帧号；

步骤二、初始化目标模板

1、计算搜寻窗口；

2、生成标准高斯响应图；

3、提取方向梯度直方图(HOG)特征；

4、计算HOG特征的相关滤波器模板；

5、提取颜色直方图特征模板；

步骤三、初始化高置信度策略参数

令φ₁、φ₂、φ₃分别表示两种特征加权融合响应图矩阵元素取值范围中三个阈值，且-1.0＜φ₁≤φ₂<φ₃＜1.0；令

分别表示累积一阶导数取值范围中三个阈值，且

步骤四、输入下一帧并提取特征

依据步骤二中步骤1的方法计算当前帧搜寻窗口Search(t)，依据步骤二中步骤3的描述提取当前帧方向梯度直方图(HOG)特征的频域表示F_t，当前帧HOG特征的响应图G_t根据公式G_t＝F_t⊙H_t-1计算得到；

依据步骤二中步骤5的方法提取当前帧颜色直方图特征bg_hist_t和fg_hist_t，将搜寻区域图像中每个像素对应到直方图的bin值，结合标准目标窗口尺寸和上一帧颜色直方图特征bg_hist_t-1和fg_hist_t-1，计算出当前帧颜色直方图特征和颜色直方图模板的相似图谱L_t，其尺寸与高斯响应图G相同；

HOG特征响应图G_t和颜色直方图相似图谱L_t加权融合计算方法如公式(3)所示：

GL_t＝α×G_t+(1-α)×L_t (3)

步骤五、确定跟踪结果

步骤六、高置信度判别

1、当UpdateFlag＝1的情况下，根据累积一阶导数和当前最大响应值进行判别：目标模板是否更新、当前帧是否稳定态；

2、当UpdateFlag＝0的情况下，根据累积一阶导数和当前最大响应值进行判别：目标模板是否恢复更新；

步骤七、更新目标模板

1、根据当前帧跟踪结果提取特征；

2、更新模板；

步骤八、如果当前帧是最后一帧，跟踪结束；否则，转至步骤4。

2.根据权利要求1所述的一种基于累积一阶导数高置信度策略的相关滤波跟踪方法，其特征在于，所述步骤二具体包括以下步骤：

1、计算搜寻窗口

根据上一帧即t-1帧跟踪结果(x_t-1,y_t-1,w_t-1,h_t-1)对应的矩形区域可以计算出当前帧即第t帧候选目标的搜寻窗口Search(t)，特别地，第一帧搜寻窗口则根据(x₀,y₀,w₀,h₀)计算；搜寻窗口的中心点为(x_s_t,y_s_t)，其中x_s_t＝x_t-1+w_t-1/2、y_s_t＝y_t-1+h_t-1/2，宽高分别为w_s_t＝1.5×w_t-1+0.5×h_t-1、h_s_t＝1.5×h_t-1+0.5×w_t-1；为了确保搜寻范围在视频帧范围内，进一步依据该搜寻范围与当前帧区域的交集修正搜寻窗口的宽高；为便于后续计算颜色直方图特征，限定搜寻窗口的边界与真实目标边界之间的距离为偶数，进一步修正搜寻窗口的宽高；

根据搜寻窗口变换因子可以将搜寻窗口图像进行标准化变换形成标准搜寻窗口，其宽高为w_sn_t＝w_s_t×γ、h_sn_t＝h_s_t×γ，当前帧的标准目标窗口的宽高为w_on_t＝w_sn_t×0.75-h_sn_t×0.25、h_on_t＝h_sn_t×0.75-w_sn_t×0.25；

2、生成标准高斯响应图

标准高斯响应图g是一个二维矩阵，其宽高为w_g＝w_sn_t/cell、h_g＝h_sn_t/cell，其矩阵元素值是符合二维高斯分布N(0,0,δ,δ,0)的概率密度函数，可按照

cell表示HOG特征提取过程中每个格子的尺寸参数，格子尺寸为cell×cell，(i,j)表示高斯响应图矩阵的元素坐标位置，原点位于矩阵的中心点；将标准高斯响应图进行傅立叶变换可以得到其频域表示G，其与g同尺寸；

3、提取方向梯度直方图(HOG)特征

HOG特征提取时每个格子尺寸为cell×cell、块大小为2×2个格子、直方图组距bin设置为2π/7，在当前帧标准化搜寻窗口内提取HOG特征f_t，其尺寸为w_g×h_g×28；采用尺寸为w_g×h_g的余弦窗对特征f_t进行平滑处理，再进行傅里叶变换得到HOG特征的频域表示F_t，其与f_t同尺寸；

4、计算HOG特征的相关滤波器模板

5、提取颜色直方图特征模板

搜寻窗口Search(t)＝(x_s_t,y_s_t,w_s_t,h_s_t)内目标区域(x_t-1,y_t-1,w_t-1,h_t-1)以外的区域定义为背景区域，目标区域缩进一定量定义为前景区域，其中心点与目标区域相同，宽高缩进量皆为(w_t-1+h_t-1)/10；在背景区域和前景区域分别提取背景颜色直方图bg_hist_t和前景颜色直方图fg_hist_t，即为当前帧颜色直方图特征模板。

3.根据权利要求1所述的一种基于累积一阶导数高置信度策略的相关滤波跟踪方法，其特征在于，所述步骤五具体为：

当前帧搜寻窗口内候选目标的个数为(w_sn_t-w_on_t)×(h_sn_t-h_on_t)，令GL_max_t、x_GL_max_t和y_GL_max_t分别表示当前帧特征融合响应图GL_t矩阵中最大元素值及其对应的横纵坐标位置，则当前帧跟踪结果为(x_t,y_t,w_t,h_t)；其中：

w_t＝w_t-1、h_t＝h_t-1、x_t＝x_t-1+(x_GL_max_t-(w_sn_t-w_on_t)/2)/γ-w_t/2、y_t＝y_t-1+(y_GL_max_t-(h_sn_t-h_on_t)/2)/γ-h_t/2，γ为搜寻窗口的变换因子，该变换因子的计算方法为步骤二中步骤1)。

4.根据权利要求1所述的一种基于累积一阶导数高置信度策略的相关滤波跟踪方法，其特征在于，所述步骤六中步骤1的判别方法具体为：

当累积一阶导数和当前最大响应值皆较小即SumD＜φ₁或者

时，判别当前帧目标模板不更新且当前帧为非稳定态，设置UpdateFlag＝0，StableFlag＝0；当累积一阶导数和当前最大响应值皆较为稳定即φ₂＜SumD＜φ₃且

5.根据权利要求1所述的一种基于累积一阶导数高置信度策略的相关滤波跟踪方法，其特征在于，所述步骤六中步骤2的判别方法具体为：当累积一阶导数和当前最大响应值恢复稳定即SumD＞φ₂且

6.根据权利要求1所述的一种基于累积一阶导数高置信度策略的相关滤波跟踪方法，其特征在于，所述步骤七具体为：

1、根据当前帧跟踪结果提取特征；

依据当前帧跟踪结果(x_t,y_t,w_t,h_t)的位置和步骤二中步骤1的方法计算搜寻窗口Search'(t)，依据步骤二中步骤3的方法提取Search'(t)范围内方向梯度直方图(HOG)特征的频域表示F_t'，依据步骤二中步骤4的方法计算H_t'＝G/F_t'；依据当前帧跟踪结果(x_t,y_t,w_t,h_t)的位置和步骤二中步骤5的方法提取颜色直方图特征bg_hist_t'和fg_hist_t'；

2、更新模板；

(1)当UpdateFlag＝1且StableFlag＝0时，目标模板更新方法如公式(4)～(6)所示：

H_t＝(1-η)×H_t-1+η×H_t' (4)

bg_hist_t＝(1-θ)×bg_hist_t-1+θ×bg_hist_t' (5)

fg_hist_t＝(1-β)×fg_hist_t-1+β×fg_hist_t' (6)

(2)当UpdateFlag＝0且StableFlag＝1时，设置参数UpdateFlag＝1，StableFlag＝0，SumD＝0，No_Stable＝t，目标模板更新方法如公式(7)～(12)所示：

H_Stable＝(1-η)×H_Stable+η×H_t' (7)

H_t＝H_Stable (8)

bg_hist_Stable＝(1-θ)×bg_hist_Stable+θ×bg_hist_t' (9)

bg_hist_t＝bg_hist_Stable (10)

fg_hist_Stable＝(1-β)×fg_hist_Stable+β×fg_hist_t' (11)

fg_hist_t＝fg_hist_Stable (12)。