CN112926693A - 针对快速运动和运动模糊的核化相关滤波算法 - Google Patents
针对快速运动和运动模糊的核化相关滤波算法 Download PDFInfo
- Publication number
- CN112926693A CN112926693A CN202110389746.6A CN202110389746A CN112926693A CN 112926693 A CN112926693 A CN 112926693A CN 202110389746 A CN202110389746 A CN 202110389746A CN 112926693 A CN112926693 A CN 112926693A
- Authority
- CN
- China
- Prior art keywords
- target
- tracking
- algorithm
- motion
- kcf
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004422 calculation algorithm Methods 0.000 title claims abstract description 79
- 238000001914 filtration Methods 0.000 title claims abstract description 20
- 238000003064 k means clustering Methods 0.000 claims abstract description 5
- 238000001514 detection method Methods 0.000 claims description 6
- 238000013077 scoring method Methods 0.000 claims description 6
- 238000000638 solvent extraction Methods 0.000 claims description 3
- 238000000034 method Methods 0.000 abstract description 25
- 230000004927 fusion Effects 0.000 abstract description 4
- 230000006911 nucleation Effects 0.000 abstract description 4
- 238000010899 nucleation Methods 0.000 abstract description 4
- 239000013598 vector Substances 0.000 description 23
- 238000002474 experimental method Methods 0.000 description 17
- 239000011159 matrix material Substances 0.000 description 16
- 230000004044 response Effects 0.000 description 14
- 125000004122 cyclic group Chemical group 0.000 description 11
- 238000012549 training Methods 0.000 description 8
- 238000012545 processing Methods 0.000 description 6
- 230000000052 comparative effect Effects 0.000 description 5
- 230000009191 jumping Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000012706 support-vector machine Methods 0.000 description 4
- 241000282994 Cervidae Species 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 241000195940 Bryophyta Species 0.000 description 2
- 239000008186 active pharmaceutical agent Substances 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 230000010485 coping Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000000875 corresponding effect Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000003631 expected effect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/50—Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种针对快速运动和运动模糊的核化相关滤波算法。首先在KCF算法中建立一个FM(Fast Motion)检测器,当检测器监测到目标发生了快速运动当前帧跟踪结果作废,以上一帧目标框为中心扩大当前帧目标寻找范围,范围内对相关滤波器用滑窗法得到目标可能位置的坐标分布;对该位置分布进行K‑means聚类,找出分布规律得到M个位置分布域,分布域中以类簇心为中心进行相关滤波定位目标中心位置,得到M个目标中心候选点;通过计分器选出最佳目标中心点。本发明在保证实时性的情况下提高了KCF算法对目标快速运动和运动模糊的鲁棒性,并为多特征融合提供一种新的思路。
Description
技术领域
本发明属于图形图像处理的技术领域,尤其涉及一种针对快速运动和运动模糊的核化相关滤波算法。
背景技术
视觉目标跟踪是计算机视觉的一个重要分支,在视频智能交通监控、机器人、监控、人机交互等领域得到了广泛的应用。根据目标外观模型将目标跟踪算法分为生成式算法与判别式跟踪算法。近年来,随着机器学习的兴起,判别式跟踪方法由于能同时利用目标信息和目标周围背景信息并具有良好的跟踪新能而逐渐占据了主导地位。
判别式跟踪方法通过训练数据学习到一个分类模型来区分前景和背景。以目标所在区域为正样本,背景区域为负样本,进行分类器的训练,分类器预测的最高分数所在位置就是目标所在的位置,这种方法也称为检测跟踪方法,其中代表性的算法有基于分类跟踪的深度学习方法和基于支持向量机的跟踪算法等。核相关滤波目标跟踪就是基于支持向量机跟踪算法的一种。
信号的相关性是信号学用来描述两个信号的相似程度,一般情况下,相关性计算可以通过卷积来实现。相关性计算方式与卷积很相似,但也有区别。计算图像某一区域与滤波器的相关性,就是计算将滤波器顺时针旋转180度后与该区域的卷积。
Bolme等人在2010年首次将相关滤波应用于目标跟踪领域,利用快速傅里叶变换和卷积定理在频域中最小化期望响应和滤波器与目标区域的循环相关之间的均方误差和,得到最小平方和误差滤波器(MOSSE)。MOSSE作为相关滤波跟踪算法的开山鼻祖,将目标跟踪跟与以往经典的目标跟踪算法划分开来,其跟踪速度高达每秒600多帧,虽然跟踪精度不太理想,但与传统的跟踪算法相比大大提高了跟踪算法的实时性。
在MOOSE算法的基础上,出现了许多改进的相关滤波算法。Henriques等人将循环矩阵及核技巧引入MOOSE算法,利用灰度特征构建循环结构检测跟踪算法(CSK),提高了MOOSE算法的跟踪精度。此外,Danelljan等人利用颜色属性表示输入数据,自适应选择鲁棒颜色特征进行跟踪(CN);Henriques等人提出了核化相关滤波器(KCF)算法,扩充了CSK,在其中引入不同的核方法以及方向梯度直方图(HOG)特征,提高了相关滤波视频目标跟踪算法的精度。Chen等将模糊逻辑系统(TSK-FLS)引入经典KCF算法提出了MFKCF(Multi fuzzykernel correlation filter),该算法针对目标快速运动的跟踪精度有明显提升。
以上方法在目标快速移动和运动模糊时,会丢失目标或者影响跟踪精度。
发明内容
基于以上现有技术的不足,本发明所解决的技术问题在于提供一种针对快速运动和运动模糊的核化相关滤波算法。
为了解决上述技术问题,本发明通过以下技术方案来实现:
本发明提供的针对快速运动和运动模糊的核化相关滤波算法,包括以下步骤:
步骤1:在KCF的框架中建立一个检测器,检测器检测到两帧之间跟踪失败,停止更新滤波器模板,抛掉当前预测位置,扩大目标寻找范围;
步骤2:以上一帧目标框为中心扩大当前帧目标寻找范围内用相关滤波器模板以滑动窗口的方式快速检测N个目标候选中心点,对N个点进行K-means聚类,聚成M类;
步骤3:以M类的簇心为中心进行相关滤波定位再次进行快速检测,得到M个当前帧跟踪结果候选点,最后通过计分法选出最佳跟踪结果;
可选的,KCF跟踪算法的基础上利用滑窗聚类(Sliding window Clustering)在图像上进行位置分区,提高目标真实位置的查全率,再通过多特征计分(Multi-featureScoring)确定最佳目标位置。
本发明提出了针对快速运动和运动模糊的核化相关滤波算法,适用于运动状态下的目标跟踪问题。本发明具有以下有益效果:
1、能够对快速运动和运动模糊的目标进行跟踪。
2、距离精度、重叠精度、中心位置误差优于传统算法。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其他目的、特征和优点能够更明显易懂,以下结合优选实施例,并配合附图,详细说明如下。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例的附图作简单地介绍。
图1为本发明的针对快速运动和运动模糊的核化相关滤波算法的流程图。
图2为本发明的跟踪目标分层图。
图3为本发明的滑窗示意图。
图4为五种算法在BlurBody、Couple和Jumping案例上的跟踪效果图,其中(a)为BlurBody案例,(b)为Couple案例,(c)为Jumping案例。
具体实施方式
下面结合附图详细说明本发明的具体实施方式,其作为本说明书的一部分,通过实施例来说明本发明的原理,本发明的其他方面、特征及其优点通过该详细说明将会变得一目了然。在所参照的附图中,不同的图中相同或相似的部件使用相同的附图标号来表示。
KCF跟踪算法:KCF(Kernelized Correlation Filter)目标跟踪算法是一种判别式跟踪算法。算法在第一帧目标所在区域训练一个目标检测器(相关滤波器模板),用于预测下一帧目标所在位置,再由新的预测结果更新目标检测器。在训练滤波器模板时选取目标区域为正样本,对目标区域进行循环移位获得负样本,构造出循环矩阵,利用傅里叶变换与循环矩阵相关性质,大大缩短了训练滤波器所需的时间。
(1)岭回归
KCF在这里使用岭回归训练分类器,因为它包含一个简单的闭式解,并且可以实现与支持向量机(Support Vector Machine)等更复杂的方法相近的性能。
训练分类器的目的是为了找到一个形如f(X)=wTX的函数,使样本xi与其回归目标yi的平方误差最小化,并且加入了正则化项防止分类器过拟合。其表达式为
其中w表示系数向量,xi表示数据样本,yi表示样本类别,λ是正则项系数。用矩阵表示为
其中X表示样本集合,Y表示样本类别向量。对w进行求导并令其为零,得w闭式解
w=(XTX+λI)-1XTY (3)
其中I是XTX的同阶单位阵,T表示转置。由卷积定理和快速傅里叶变换的性质可知,空域的矩阵卷积运算可以转换为频域的点乘运算,可以大大减少运算所需的时间。在傅里叶域中有XH=(X*)T,进一步得到
w=(XHX+λI)-1XHY (4)
其中X*表示X的复共轭,XH表示X的复共轭的转置。
(2)循环移位
KCF算法对目标框提取特征转化为特征向量,再对特征向量进行循环移位构造循环矩阵获得训练集。KCF中所有的训练样本都是通过对目标样本的特征向量进行循环移位获得,列向量的循环可由左乘初等矩阵得到。例如,要将x=[x1,x2,...,xn]T转化为x=[xn,x1,...,xn-1]T只需x=Px,其中P为n阶初等阵。
这样就使得x在垂直方向上偏移了一个元素,最终的循环矩阵为
X=[x,Px,P2x,...,Pn-1x]T (5)
所有的循环矩阵通过离散傅里叶变换形成了对角阵,且与基样本x无关,故X可以表示为
(3)核技巧及快速检测
KCF算法将核技巧引入目标检测器的训练,避免了因样本当前维线性不可分无法训练出好的目标检测器的问题,提高了算法的鲁棒性。它利用核方法将线性问题的输入x映射到非线性特征空间Φ(x),其过程分为如下两步:
1)将解w表示为样本的线性组合:
2)以点积的形式写入核方法:
该方法用核函数k来计算,所有样本对之间的点积保存于一个n×n的核矩阵K中,元素值为
Kij=k(xi,xj) (10)
为快速检测到感兴趣的目标,KCF在若干图像位置上评估f(z),这些图像块可用循环移位来建模。再用Kz表示所有训练样本与候选块间的核矩阵。所有训练样本和图像块都分别为基样本x和基块z的循环移位。即可用循环矩阵的第一行向量来定义核矩阵
Kz=C(kxz) (11)
其中,C(·)表示对·的循环移位函数,kxz是对k(x,z)的简写。故回归函数为
f(z)=(Kz)Tα (12)
本发明在KCF跟踪算法的基础上利用滑窗聚类(Sliding window Clustering)在图像上进行位置分区,提高目标真实位置的查全率,再通过多特征计分(Multi-featureScoring)确定最佳目标位置,故算法命名为区域多特征计分(Regional Multi-featureScoring)核相关滤波算法,简记为RMS。
RMS程序流程如图1所示,虚线部分为在KCF基础上提出的本发明算法工作流程。RMS算法描述:在KCF的框架中建立一个检测器,检测器检测到两帧之间跟踪失败,停止更新滤波器模板,抛掉当前预测位置,扩大目标寻找范围,范围内用相关滤波器模板以滑动窗口的方式快速检测N个目标候选中心点,对N个点进行K-means聚类,聚成M类,以M类的簇心为中心再次进行快速检测,得到M个当前帧跟踪结果候选点,最后通过计分法选出最佳跟踪结果。(为了方便后续说明,暂取M=4。)
目标分层图如图2所示,对目标框内的每一种灰度值做直方图统计。为了减小边缘背景灰度对统计的影响,以及目标应该位于跟踪框中心位置,故采取中心加权的方式统计。本发明算法中把目标框分为三层,中心层权重值为1,中间层权重值为0.5,边缘层权重值为0.1,权重的设计应遵循目标框中心到边缘统计权重逐渐减小的基本原则,权重梯度应该适当大,要有区分度。
检测器用来检测相邻两帧之间跟踪是否成功,其原理是通过计算上一帧与当前帧跟踪框的相同灰度值统计量的方差和,在能够检测当前帧跟踪是否成功的同时保持了KCF算法的实时性和鲁棒性。为了保持监测器的稳定性,使其能够应对复杂多变的环境,只对两帧跟踪框内部分灰度值求其统计量的方差和。本发明的算法提取了上一帧跟踪框非零统计量中大小位于前百分之四十的灰度值,在当前帧只统计这些提取出来的灰度值,将前一帧与后一帧相同灰度值的统计量求方差,最后将所有灰度值统计量的方差加起来得到跟踪误差GE(Gray Error)。GE的计算方法为
跟踪误差GE若是超过阈值TGE,则认为当前帧KCF跟踪失败,如果低于阈值说明跟踪成功。本发明阈值TGE取值区间为0.2-0.6倍的最大跟踪误差(MGE),GE在当且仅当n为零向量时取得最大跟踪误差MGE。
若检测器检测到当前帧跟踪失败,扩大目标寻找范围,在范围内使用滑窗法检测目标所在的位置。
滑窗法如图3所示,用滤波器模板在目标搜索框中以固定的间隔(pading)进行滑动检测,检测出数个目标位置。实验中,pading的设置为3(相邻像素点之间的距离为1),滤波器横向可以滑动21次,纵向可以滑动21次,共计441个响应坐标。对这441个响应坐标使用K-means聚类,将其聚成四类。聚类的目的有三个:一是缩小目标找寻范围,将搜索框划分为四块区域,对区域进行快速检测,得出四个目标候选中心,将441个点缩小至4个点。二是为特征的并行融合提供前置条件,三是根据这些数据点集的分布可以更加精确的找到目标位置。
前面的工作筛选出了四个候选跟踪结果,现在需要对这四个目标位置进行打分,选取分数最高的目标跟踪结果为最终跟踪结果。算法最为关键的部分就是计分器,计分器的好坏直接影响着算法的跟踪性能。计分器考量了HOG特征的区域平均峰值响应、区域CN响应和区域灰度误差(GE),这种计分式的考量方法可以视为特征的并行融合,特征模板之间不相互关联,并行工作,这样保证特征的独立性,不会出现把特征串行融和在一起时在其独有的优势领域性能均降低的情况。另外计分器有很强的可扩展性,横向可以增加计分向量S的个数,除了CN、HOG和Gray等特征外可以进一步考量深度特征。纵向可以对计分向量进行加权以更加适应复杂多变的跟踪情景。优化计分器还可以减轻检测器的压力,使得检测器可以适当放宽松TGE,充分发挥KCF的速度和其他方面的优势。
实验中,评分属性有区域平均HOG峰值响应,区域CN峰值响应,跟踪误差GE三个标准。为了方便描述,四种类别所分布的区域分别记为A、B、C、D。以A区域为例,区域平均HOG峰值响应的计分方法为
其中,R表示A区域中所有响应峰值组成的响应向量,DS(·)表示对向量·进行降序排序,分子表示对向量DS(R)求前m项元素和。区域CN峰值响应计分方法为
VA(CN)=max(RA) (15)
其中,RA表示区域A的响应矩阵,max(·)表示对矩阵·找元素最大值。
跟踪误差GE计分方法为
VA(GE)=GE (16)
其中,GE表示当前帧与前一帧目标框的灰度误差。评分向量S可以表示为
S=N(SHOG/max(SHOG))+N(SCN/max(SCN))+N(min(SGE)/SGE)
其中,
SHOG=[VA(HOG),VB(HOG),VC(HOG),VD(HOG)]SCN=[VA(CN),VB(CN),VC(CN),VD(CN)]SGE=[VA(GE),VB(GE),VC(GE),VD(GE)]
均为1×4的计分向量,N(·)表示对向量·做归一化处理,max(·)表示对向量·取元素最大值。最后,选择评分向量S中分值最高的元素所对应区域的目标中心位置作为最佳跟踪位置。
实验的硬件环境为Inter(R)Core(TM)i5-7500 CPU,主频3.40GHz,8GB RAM;操作系统为Windows10的64位操作系统;软件环境为MATLAB R2016a。为找出最佳参数先做调参实验,实验结果见表1。
表1本发明算法在OTB100上的不同参数的平均距离精度
注:加粗字体为每列最优值,阈值Tc=20pixel。
从表1数据可知,当聚类数M=4,TGE=0.2MGE时,算法精度最高。故实验最终将M设置为4,TGE设置为0.2MGE。
理论上当检测器阈值越低,检测越严格,相邻帧跟踪失败的查全率越高,在校正算法优于KCF算法的情况下精度会得到不断提升,表1数据不仅在实验最低阈值处取得了最好跟踪效果,而且相比于其他阈值其列平均距离精度均处于最高值,在没有对比实验的情况下说明了本发明算法在KCF算法基础上的提高。
假设RMS在OTB-2015数据集上的跟踪效果不如KCF算法,那么平均距离精度完全会因为相邻帧跟踪失误的查全率的提高而下降。举个极限的例子,令GE=0,也就是说所有序列帧均由RMS完成,得到的平均距离精度值假设为X,GE=MGE时,所有视频帧的跟踪将由KCF算法跟踪完成,得到的平均距离精度假设为Y,由前提可知X<Y,那么可以得出结论:在GE从0取到MGE的过程中平均距离精度总体呈下降的趋势。该结论正好与表1结果相违背,故可以侧面印证RMS在KCF算法上面的提高。
为了验证RMS和评估方法的有效性,分别在数据集OTB-2015上对整体98个数据集和标签带有FM的39个数据集上与MFKCF、KCF、CSK和CN进行对比实验。OTB-2015整体数据集上的对比试验目的是为了说明RMS在KCF的基础上加入快速运动处理机制后是否会影响对非快速运动问题域的处理性能。OTB-2015的FM数据集上的对比实验目的是检验RMS是否真实达到了处理快速运动的预期效果。
表2对比算法在OTB100整体数据集上的一次实验结果
在表1当中RMS在OTB-2015全集上平均DP为0.727,表2中平均DP为0.725。两次实验结果不相同是因为在用K-means聚类的过程中,由于每次聚类的初始簇心是根据数据点分布情况随机选取的,如果滑窗得出的一些响应点数据分布较为密集,那么就会存在一些类别模糊的点既可以被分到A区域也可以被分到B区域,也就是说在重复实验的过程中如果响应点数据分布不够健壮,就会造成每一次聚类结果都会有微小出入,导致跟踪结果不唯一,平均DP会有些许波动。为了保证实验数据的可靠性,此后所有有关本算法的实验数据均由RMS取十次平均值。
表3对比算法在OTB100整体数据集上的十次实验结果
如表3所示,在OTB-2015整体数据上,RMS平均DP比KCF高出1.8%,平均OP比KCF高0.5%,中心位置误差降低了1.013pixel,速度下降了170.67帧/秒。相比于MFKCF平均DP提高了1.2%,平均OP提高了0.3%,平均FPS下降了144.34帧/秒。相比于CN平均DP提高了11.8%,平均OP提高了8.3%,平均CLE降低了36.561pixel,平均FPS下降了157.9帧/秒。
虽然RMS在算法速度上有明显降低,但其他各方面的性能均优于MFKCF、KCF和CN,而且速度仍然满足实时要求。接下来的实验将会对比RMS在FM数据集上的表现,通过公式22计算出非FM数据集的精度,以此度量RMS在非快速运动问题域的处理性能。
表4对比算法在OTB100 FM数据集上的十次实验结果
从表4可以看出,在OTB-2015FM数据上,RMS平均DP比KCF高出7.1%,平均OP比KCF高4.2%,中心位置误差降低了2.324pixel,速度下降了171.37帧/秒。相比于MFKCF平均DP提高了3.6%,平均OP提高了1.5%,平均FPS下降了128.21帧/秒。相比于CN平均DP提高了19.9%,平均OP提高了14.2%,平均CLE降低了31.58pixel,平均FPS下降了112.71帧/秒。
相比于整体数据集来说,RMS在FM数据集上表现得更加优秀,记OTB-2015整体数据集除开FM的数据集合为ALL-FM,若记算法在FM上的实验提高的DP为α=7.1%,在ALL上的实验提高的DP为β=1.8%,在ALL-FM上的实验提高的DP精度为λ(λ可为负数),则λ的计算公式为:
其中,m表示OTB-2015总体数据集(ALL)元素个数,n表示FM数据集元素个数,计算出λ=-1.7%,说明RMS在处理目标快速运动以外的视频序列精度稍有降低,但不明显几乎可以忽略不计。
在RMS所针对的目标快速运动和运动模糊的问题领域上,RMS展现出了良好的跟踪性能,相比于MFKCF、KCF、CN、CSK,DP和OP有了显著性的提高。在Tc=20pixel,RMS相比于KCF提高了7.1%,OP基本也是如此。
下面展示7组样例的具体跟踪结果,为了更加直观的展示RMS在快速运动和运动模糊上的抗性,先观察七组样例的描述标签,见表5。
表5七组样例的描述标签
注:加粗字体为出现频率最高的标签。
由表5可知,快速运动(FM)出现了7次,运动模糊(MB)出现了5次,FM和MB同时出现5次,其余标签则出现了4次或4次以下。7组样例的具体跟踪结果见表6。
表6对比算法在FM上七组实验结果
注:加粗字体为每行最优值,Tc=20pixel。
从表6可以看出,相比于KCF,DP平均高出50%以上,在7组样例的跟踪结果上相比于其他算法都展现出良好的跟踪性能。
对照表5可总结出:在FM和MB为主要问题域的视频上,RMS都表现出了良好的跟踪效果。如BlurBody,虽然它还有其它标签,但主要问题领域还是FM和MB,其它的诸如尺度变化(SV)、非刚性形变(DEF)、旋转(IPR)等影响程度比较低,所以RMS跟踪得非常成功,DP达到了94.6%比KCF高出了37.1%。ClifBar虽然有轻微的遮挡(OCC)、尺度变化(SV)以及旋转(IPR)等问题,但主要问题还是FM和MB,RMS在该样例跟踪结果仍然非常成功,DP达到了86.2%,比KCF高出了41.9%。如果说前面两个案例还有其他标签的干扰,那么只含有FM和MB的Jumping则是最能体现RMS性能的核心案例,RMS在Jumping上跟踪的DP为100%,比KCF高出了66.1%,比MFKCF高出了36.2%。
五种算法在BlurBody、Couple和Jumping的跟踪效果如图4所示,图4a跟踪目标是一个穿黑色上衣蓝色牛仔裤的人,由于未出现快速运动、遮挡、尺度变化等问题,视频37帧中所有算法均能准确跟踪目标,110帧由于出现了轻微快速运动及运动模糊导致KCF跟踪失败,302帧由于目标的快速运动和运动模糊加剧,导致除RMS外的其他算法跟踪失败。图4c跟踪目标为一对行人,由于快速运动始终贯穿整个视频,其间还有背景相似干扰,导致除RMS算法以外的其他算法跟踪效果均不理想,CSK和CN算法跟踪框甚至一度飞出图像外。图4b跟踪目标是一个跳绳男子的头部,由于跳绳所产生的快速运动及运动模糊导致KCF在第40帧跟踪彻底失败、CN和CSK算法从一开始就跟踪失败,MFKCF第40帧的时候偏离跟踪对象,第159帧的找回跟踪目标,又于217帧偏离跟踪目标,最终丢失目标。
在OTB-2015数据集上与相关滤波的五种算法做了对比,在整体数据集上距离精度相比于KCF提高了1.9%,重叠精度提高了0.5%,中心位置误差减小了1.013。在快速运动样例集合中距离精度相比于KCF提高了7.1%,重叠精度提高了4.2%,中心位置误差减小了2.324。本发明在保证实时性的情况下提高了KCF算法对目标快速运动和运动模糊的鲁棒性,并为多特征融合提供一种新的思路。
以上所述是本发明的优选实施方式而已,当然不能以此来限定本发明之权利范围,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和变动,这些改进和变动也视为本发明的保护范围。
Claims (2)
1.针对快速运动和运动模糊的核化相关滤波算法,其特征在于,包括以下步骤:
步骤1:在KCF的框架中建立一个检测器,检测器检测到两帧之间跟踪失败,停止更新滤波器模板,抛掉当前预测位置,扩大目标寻找范围;
步骤2:以上一帧目标框为中心扩大当前帧目标寻找范围内用相关滤波器模板以滑动窗口的方式快速检测N个目标候选中心点,对N个点进行K-means聚类,聚成M类;
步骤3:以M类的簇心为中心进行相关滤波定位再次进行快速检测,得到M个当前帧跟踪结果候选点,最后通过计分法选出最佳跟踪结果。
2.如权利要求1所述的针对快速运动和运动模糊的核化相关滤波算法,其特征在于,在KCF跟踪算法的基础上利用滑窗聚类(Sliding window Clustering)在图像上进行位置分区,提高目标真实位置的查全率,再通过多特征计分(Multi-feature Scoring)确定最佳目标位置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110389746.6A CN112926693B (zh) | 2021-04-12 | 针对快速运动和运动模糊的核化相关滤波方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110389746.6A CN112926693B (zh) | 2021-04-12 | 针对快速运动和运动模糊的核化相关滤波方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112926693A true CN112926693A (zh) | 2021-06-08 |
CN112926693B CN112926693B (zh) | 2024-05-24 |
Family
ID=
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109977971A (zh) * | 2019-03-29 | 2019-07-05 | 苏州大学 | 基于均值偏移与核相关滤波的尺度自适应目标跟踪系统 |
CN110008844A (zh) * | 2019-03-12 | 2019-07-12 | 华南理工大学 | 一种融合slic算法的kcf长期手势跟踪方法 |
CN110009665A (zh) * | 2019-03-12 | 2019-07-12 | 华中科技大学 | 一种遮挡环境下的目标检测跟踪方法 |
CN110060280A (zh) * | 2019-04-28 | 2019-07-26 | 东华大学 | 基于外观自适应空间正则化相关滤波器的目标跟踪方法 |
CN111563915A (zh) * | 2020-05-06 | 2020-08-21 | 南京航空航天大学 | 一种融合运动信息检测和Radon变换的KCF目标跟踪方法 |
KR102164754B1 (ko) * | 2019-08-27 | 2020-10-13 | 중앙대학교 산학협력단 | 개선된 kcf를 이용한 객체 추적 방법 및 장치 |
CN112561965A (zh) * | 2020-12-21 | 2021-03-26 | 阜阳强松航空科技有限公司 | 基于相关滤波的实时长期跟踪方法 |
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110008844A (zh) * | 2019-03-12 | 2019-07-12 | 华南理工大学 | 一种融合slic算法的kcf长期手势跟踪方法 |
CN110009665A (zh) * | 2019-03-12 | 2019-07-12 | 华中科技大学 | 一种遮挡环境下的目标检测跟踪方法 |
CN109977971A (zh) * | 2019-03-29 | 2019-07-05 | 苏州大学 | 基于均值偏移与核相关滤波的尺度自适应目标跟踪系统 |
CN110060280A (zh) * | 2019-04-28 | 2019-07-26 | 东华大学 | 基于外观自适应空间正则化相关滤波器的目标跟踪方法 |
KR102164754B1 (ko) * | 2019-08-27 | 2020-10-13 | 중앙대학교 산학협력단 | 개선된 kcf를 이용한 객체 추적 방법 및 장치 |
CN111563915A (zh) * | 2020-05-06 | 2020-08-21 | 南京航空航天大学 | 一种融合运动信息检测和Radon变换的KCF目标跟踪方法 |
CN112561965A (zh) * | 2020-12-21 | 2021-03-26 | 阜阳强松航空科技有限公司 | 基于相关滤波的实时长期跟踪方法 |
Non-Patent Citations (1)
Title |
---|
江维创 等: "基于改进核相关滤波器的目标跟踪算法", 计算机工程, vol. 44, no. 11, 30 November 2018 (2018-11-30) * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10929649B2 (en) | Multi-pose face feature point detection method based on cascade regression | |
CN109614922B (zh) | 一种动静态手势识别方法和系统 | |
CN109242884B (zh) | 基于JCFNet网络的遥感视频目标跟踪方法 | |
JP5604256B2 (ja) | 人物動作検出装置およびそのプログラム | |
CN110263712B (zh) | 一种基于区域候选的粗精行人检测方法 | |
Rekha et al. | Hand gesture recognition for sign language: A new hybrid approach | |
CN112836639A (zh) | 基于改进YOLOv3模型的行人多目标跟踪视频识别方法 | |
CN107590427B (zh) | 基于时空兴趣点降噪的监控视频异常事件检测方法 | |
CN111340855A (zh) | 一种基于轨迹预测的道路移动目标检测方法 | |
CN112836640A (zh) | 一种单摄像头多目标行人跟踪方法 | |
CN110008844B (zh) | 一种融合slic算法的kcf长期手势跟踪方法 | |
CN108320306A (zh) | 融合tld和kcf的视频目标跟踪方法 | |
CN115527269B (zh) | 一种人体姿态图像智能识别方法及系统 | |
Barcellos et al. | Part-based object tracking using multiple adaptive correlation filters | |
CN116469020A (zh) | 一种基于多尺度和高斯Wasserstein距离的无人机图像目标检测方法 | |
CN108921872B (zh) | 一种适用于长程跟踪的鲁棒性视觉目标跟踪方法 | |
CN112613565B (zh) | 基于多特征融合与自适应学习率更新的抗遮挡跟踪方法 | |
CN108647629A (zh) | 一种图像识别定位方法、视频中图像轨迹识别方法和装置 | |
Rodríguez-Serrano et al. | Trajectory clustering in CCTV traffic videos using probability product kernels with hidden Markov models | |
Sun et al. | Efficient compressive sensing tracking via mixed classifier decision | |
CN112926693B (zh) | 针对快速运动和运动模糊的核化相关滤波方法 | |
CN112926693A (zh) | 针对快速运动和运动模糊的核化相关滤波算法 | |
CN112991395B (zh) | 一种基于前景条件概率优化尺度和角度的视觉跟踪方法 | |
CN115345902A (zh) | 基于机器学习的红外图像弱小目标检测跟踪方法及系统 | |
Dai et al. | An Improved ORB Feature Extraction Algorithm Based on Enhanced Image and Truncated Adaptive Threshold |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |