发明内容
为了解决上述背景技术提出的问题,本发明旨在提供基于支持向量机的多特征选择目标跟踪方法,该方法能够解决单一特征描述目标能力较差的问题以及克服单一正样本训练的分类器分类能力较弱的缺点,能够在光照影响较大、目标出现严重遮挡等复杂场景下提高目标跟踪器的精度和稳健性。
为了实现上述技术目的,本发明的技术方案为:
基于支持向量机的多特征选择目标跟踪方法,包括以下步骤:
(1)利用简单跟踪器跟踪视频序列的前n帧,将每帧的跟踪结果分别作为一个正样本,共得到n个正样本,同时在当前帧的跟踪结果附近获取若干负样本,分别提取正、负样本的多个特征;
(2)在跟踪过程中,对于新到来的每帧图像,分别抽取N个粒子作为候选目标,并对抽取的候选目标采用步骤(1)中提取正、负样本特征的方式提取目标特征;
(3)对于从正、负样本以及候选目标中提取出的特征进行核化处理,使所有特征的维数达到相同;
(4)利用正、负样本训练支持向量机分类器;
(5)用分类器计算候选目标属于正样本的概率,将具有最大概率值的候选目标作为跟踪结果;
(6)在跟踪过程中,每隔一定帧数对正、负样本进行更新,用更新后的正、负样本重新训练分类器,实现分类器的更新;
(7)采用标准度量准则评估跟踪性能。
步骤(1)中,所述正、负样本的多个特征包括灰度特征和LBP特征。
步骤(2)中,所述候选目标的抽取方法为,在上一帧图像的跟踪目标的周围进行高斯采样,选取跟踪目标的运动仿射参数作为跟踪目标的状态变量St=(ψt,βt,θt,st,αt,φt),抽取候选目标;其中ψt、βt、θt、st、αt、φt分别表示跟踪目标在第t帧x方向上的坐标、y方向上的坐标、旋转角度、尺度变化、宽高比、倾斜度;
步骤(6)中,采用子空间学习的方法更新正样本。
步骤(7)中,所述标准度量准则包括中心误差和跟踪重叠率。
采用上述技术方案带来的有益效果:
(1)本发明不同于传统用单一正样本和多个负样本进行分类器训练的方法,采用不同特征的多个正负样本进行分类器训练,增强了分类器的分类能力;
(2)本发明联合采用不同特征——灰度特征和LBP特征对目标进行描述,弥补了单一特征描述目标能力不足的缺点;
(3)本发明在跟踪过程中,采用子空间学习的方法对正样本集进行更新,较好地处理了遮挡等因素的不良影响;
(4)本发明在目标发生遮挡,旋转,尺度变化,快速运动,光照变化等各种复杂情况下,依然可以准确的跟踪目标,并且达到满意的处理速度。
具体实施方式
以下将结合附图,对本发明的技术方案进行详细说明。
首先,手动或者用一个自动检测器在第一帧中选择需要跟踪的目标。接着,获得目标的正、负样本,获得正样本的方法:在第一帧中提取需要跟踪的目标后,接着利用一个简单跟踪器跟踪视频序列前n帧,将前n帧的跟踪结果作为n个正样本。在当前帧的跟踪结果附近抽取若干个图像块构成负样本集。这里所述“跟踪结果附近”的大小由实际操作决定。
提取正负样本集的灰度特征和LBP特征。将目标正样本图像区域的像素灰度值按列依次排序得到一维列向量作为目标的灰度特征。用表示目标的灰度特征,表示d行1列的解空间。在灰度图像的基础上计算出每个像素点的LBP码,将LBP码按列依次排序得到一维列向量作为目标的LBP特征,用表示目标的LBP特征,表示p行1列的解空间。用和分别表示正样本集的灰度特征和LBP特征,n表示正样本的个数。用同样的方法提取负样本的灰度特征和LBP特征,构成和m表示当前负样本集内的负样本个数。在本实施例中,n的取值为10,m的取值为40。
在新的一帧图像到来时,需要抽取候选目标。在候选样本的产生中,用St表示目标在时刻t的目标状态,则p(St|St-1)可以假设为一个简单的平滑模型。目标跟踪过程中,基于相邻帧之间目标移动很小的特点,对新的一帧图像,可以在上一帧跟踪目标位置周围进行高斯采样。本发明选取目标的运动仿射参数作为目标的状态变量,用向量St=(ψt,βt,θt,st,αt,φt)表示,其中ψt、βt、θt、st、αt、φt分别表示目标在第t帧x方向上的坐标、y方向上的坐标、旋转角度、尺度变化、宽高比、倾斜度。假设状态转移模型服从高斯分布,即:
p(St|St-1)=N(St;St-1,Σ) (1)
式(1)中Σ是一个对角协方差矩阵,其对角元素依次是前述6个运动仿射参数的方差。
对所产生的候选目标,采用前述提取正、负样本特征的方法来提取候选目标的灰度特征和LBP特征,用和分别表示候选目标的灰度特征和LBP特征集合,N表示每帧抽取候选目标的数目,在本实施例中,N的取值为600。
接着用正、负样本训练分类器。为了实现用多种特征训练分类器,需要对不同的特征(包括正负样本集和候选目标的特征)进行核化处理。用和分别表示正、负样本的两种特征集合。和分别表示候选目标的两种特征集合。用统一表示正负样本的两种特征集合,统一表示候选目标的两种特征集合。其中k表示特征索引,mk表示对应第k个特征的维数。按照下面的方式对和进行核化处理:
经过核化处理,对任意特征k,都有不同的特征核化后的维数只与正、负样本总的个数有关。从而使所有特征在维数上达到了一致,便于不同特征之间的融合。在本实施例中,n=10,m=40,k=2,d=m1=1024,p=m2=900,N=600。
本发明采用训练支持向量机(SVM)的方法对不同特征的正负样本进行训练。已知的目标正负样本可以归为一个训练集:xi是训练样本的特征向量,yi是训练样本对应的标签,即yi∈{-1,+1}。为使分类器对所有样本正确分类并具备分类间隔,要求其满足:
yi[(w·xi)+b]≥1,i=1,2,…c (2)
其中,w为权值向量,b为偏置。由此可得分类间隔为2/||w||,于是采用带约束的最小值问题即可以代替构造最优超平面的问题:
引入Lagrange函数:
其中,ai>0为Lagrange系数。将该QP(quadratic programming)问题转化为下列对偶问题(a=(a1,a2,…ac)):
经计算,最优权值向量w*和最优偏置b*分别为
其中,因此得到最优分类面(w*·x)+b*=0,进而得到最优分类函数为
用训练得到的分类器对候选目标的不同特征分别进行分类判别,得到f(Yk)=sgn{(w*·Yk)+b*}。将判别后的值映射到logistic函数上,候选目标是正样本的概率即为通过对不同特征的候选目标是正样本的概率大小比较,实现特征的选择并实现对目标的跟踪,将具有最大概率值的候选目标作为跟踪结果,即目标的跟踪结果为
接着,对样本及分类器进行更新。本发明在跟踪过程中,每隔5帧数使用子空间学习的方法对正样本集进行更新。在大部分的跟踪方法中,早期的跟踪结果相对精确一些,因此它们应该在正样本集中存储更长的时间,平衡新旧正样本的一种有效方式就是给它们分配不同的更新概率。我们首先产生一个累积的概率序列:
其中,n表示正样本个数,可以看出该累积序列的特点是前面密集后面稀疏。然后在0到1之间产生一个随机数r,根据随机数r的大小在上述累积序列中所处的位置来确定需要更新的正样本。通过这样的更新方式将会致使老的正样本更新较慢,而新的正样本更新较快,从而可以克服跟踪漂移问题。接下来联合稀疏表示和子空间学习来实现对正样本集的更新。我们用正样本集的目标灰度特征执行增量学习方法(incremental learning method),得到特征基向量(eigenbasis vectors)构成的矩阵U、特征基向量的系数q。则目标估计值可建模成PCA基向量和遮挡模板的线性组合:
式(10)中表示观测向量,e表示中被遮挡或干扰的像素。由于因遮挡或噪声引起的误差是随机的并且稀疏的,因此我们可以将此问题看成以下l1正则化最小二乘问题:
式(11)中H=[U I],μ=[q e]T,λ是一个正则化参数。通过求解式(11)得到q和e,将重构图像用于替代被更新的正样本。采用这种正样本集更新方法,可以适应目标外观的改变并能很好地处理部分遮挡。重构图像即是更新后的正样本的灰度特征,通过灰度特征可以得到该样本的LBP特征,在当前帧抽取若干负样本提取灰度特征和LBP特征,根据得到的正负样本集训练新的分类器实现对目标的跟踪。实验发现,本发明在目标发生外观变化、遮挡、光照改变等复杂情况时,子空间学习的方法能够对最新的跟踪结果进行重构,将重构图像更新进正样本集中,使得正样本集在消除遮挡、光照改变等不良情况下,既保留了老的正样本,又将目标当前的变化情况更新进来。用子空间学习的方法对正样本集进行更新进而训练新的分类器能够应对诸多复杂情况,实现对目标的准确、稳定的跟踪。
最后对跟踪结果进行度量。本发明采用两种度量准则来定量评估跟踪性能。第一种是真实值与跟踪结果中心位置的距离,距离越小表示跟踪结果越精确;另一种称为the success rate,若给定跟踪结果RT和真实值RG,则the success rate计算如下:
式(12)中,area(x)表示取x的面积,“∩”表示取交集,“∪”表示取并集,score值越大表示跟踪结果越好。
本发明通过对不同特征的多个正负样本训练分类器,用分类器对候选粒子的不同特征进行判决,进而实现了特征的选择并取得了较好地跟踪结果。同时用子空间学习的方法对正样本集进行更新有效地克服了遮挡、光照变化等不良影响。通过与其他经典跟踪方法的对比发现,本发明具有一定的优势。表1和表2分别展示了本发明与其他跟踪方法在平均中心位置误差和目标框的平均重叠率上的对比情况,其他跟踪方法有Frag、IVT、MIL、VTD、TLD、APGL1、MTT、LSAT、SCM、ASLAS、OSPT,Ours表示本发明方法。
表1
表2
视频序列 |
Frag |
IVT |
MIL |
VTD |
TLD |
APGL1 |
MTT |
LSAT |
SCM |
ASLAS |
OSPT |
Ours |
Car4 |
0.22 |
0.92 |
0.34 |
0.73 |
0.64 |
0.70 |
0.53 |
0.91 |
0.89 |
0.89 |
0.92 |
0.91 |
Car11 |
0.09 |
0.81 |
0.17 |
0.43 |
0.38 |
0.83 |
0.58 |
0.49 |
0.79 |
0.81 |
0.81 |
0.82 |
animal |
0.08 |
0.22 |
0.21 |
0.58 |
0.41 |
0.45 |
0.60 |
0.35 |
0.46 |
0.62 |
0.61 |
0.62 |
Caviar1 |
0.68 |
0.28 |
0.25 |
0.83 |
0.70 |
0.28 |
0.45 |
0.85 |
0.91 |
0.90 |
0.89 |
0.81 |
Occlusion1 |
0.90 |
0.85 |
0.59 |
0.77 |
0.65 |
0.87 |
0.79 |
0.90 |
0.93 |
0.83 |
0.91 |
0.92 |
Face |
0.39 |
0.44 |
0.15 |
0.24 |
0.62 |
0.14 |
0.26 |
0.69 |
0.36 |
0.21 |
0.68 |
0.74 |
singer |
0.34 |
0.66 |
0.34 |
0.79 |
0.41 |
0.83 |
0.32 |
0.52 |
0.85 |
0.78 |
0.82 |
0.85 |
Caviar2 |
0.56 |
0.45 |
0.26 |
0.67 |
0.66 |
0.32 |
0.33 |
0.28 |
0.81 |
0.35 |
0.71 |
0.69 |
Owl |
0.09 |
0.22 |
0.09 |
0.12 |
0.60 |
0.17 |
0.09 |
0.13 |
0.79 |
0.78 |
0.48 |
0.73 |
Average |
0.37 |
0.54 |
0.27 |
0.57 |
0.56 |
0.51 |
0.44 |
0.57 |
0.75 |
0.69 |
0.76 |
0.79 |
以上实施例仅为说明本发明的技术思想,不能以此限定本发明的保护范围,凡是按照本发明提出的技术思想,在技术方案基础上所做的任何改动,均落入本发明保护范围之内。