CN104021395A - 一种基于高阶偏最小二乘法的目标跟踪算法 - Google Patents

一种基于高阶偏最小二乘法的目标跟踪算法 Download PDF

Info

Publication number
CN104021395A
CN104021395A CN201410279523.4A CN201410279523A CN104021395A CN 104021395 A CN104021395 A CN 104021395A CN 201410279523 A CN201410279523 A CN 201410279523A CN 104021395 A CN104021395 A CN 104021395A
Authority
CN
China
Prior art keywords
target
image
current
test pattern
image block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410279523.4A
Other languages
English (en)
Other versions
CN104021395B (zh
Inventor
钟必能
王田
沈映菊
陈雁
谢维波
陈锻生
陈维斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huaqiao University
Original Assignee
Huaqiao University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huaqiao University filed Critical Huaqiao University
Priority to CN201410279523.4A priority Critical patent/CN104021395B/zh
Publication of CN104021395A publication Critical patent/CN104021395A/zh
Application granted granted Critical
Publication of CN104021395B publication Critical patent/CN104021395B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)

Abstract

本发明公开了一种基于高阶偏最小二乘法的目标跟踪算法,包括初始化阶段、训练阶段、测试阶段,和更新阶段。本发明以二维张量来表示图像块,保存了该图像块内在的空间结构信息,同时,本发明综合了多个时序的图像块及其类别来建立高阶张量,并以偏最小二乘法来分析该高阶张量与其类别矩阵的关联之处,使目标跟踪算法的性能大大提高。

Description

一种基于高阶偏最小二乘法的目标跟踪算法
技术领域
本发明涉及信息技术领域中的计算机视觉和模式识别方向,特别涉及一种基于高阶偏最小二乘法的目标跟踪算法。
背景技术
随着监控摄像头安装数量的日益增多,以及平安城市和公共安全需求的日益增长,采用人工的视频监控方式已经远远不能满足需要,因此智能视频监控技术应运而生并迅速成为一个研究热点。智能视频监控技术是一个跨领域的研究方向,它的研究内容丰富,应用领域广泛多样。一般而言,智能视频监控研究中对视频图像的处理可以分为底层、中层、以及高层三个层次。其中目标跟踪算法是智能视频监控技术中层分析阶段的核心组成部件,其目的是获得运动目标的活动时间、位置、运动方向、运动速度、大小、表观(颜色、形状、纹理)等信息。虽然目标跟踪算法的研究已经持续了很多年,研究者们提出了各种各样的跟踪方法;但是目标跟踪在实际应用中遇到的很多难点问题依然没有得到很好的解决,例如光照突变、遮挡、姿态/视角变化、相似物体与杂乱背景干扰等。
发明内容
本发明的目的在于克服现有技术之不足,提供一种基于高阶偏最小二乘法的目标跟踪算法,以二维张量来表示图像块,保存了该图像块内在的空间结构信息,同时,本发明综合了多个时序的图像块及其类别来建立高阶张量,并以偏最小二乘法来分析该高阶张量与其类别矩阵的关联之处,使目标跟踪算法的性能大大提高。
本发明解决其技术问题所采用的技术方案为:一种基于高阶偏最小二乘法的目标跟踪算法,包括初始化阶段、训练阶段、测试阶段,和更新阶段;
所述初始化阶段包括:指定一个目标物体,并设定以该目标物体的中心为中心的n-1种不同相对方位为该目标物体的n-1种非目标方位;将当前时刻记为t时刻,并提取从t-m时刻到t时刻的m帧图像,其中m为一个预先设定的正整数;针对所提取的每一帧图像,人为找到该图像中的目标物体,以该目标物体的中心为中心截取包含该目标物体的1个第一图像块,之后分别以该目标物体的n-1种非目标方位为中心截取n-1个第二图像块,其中n为一个预先设定的大于1的正整数;所有第一图像块和所有第二图像块的大小均一致;将所截取的每个第一图像块和每个第二图像块均用一个I1×I2的特征矩阵表示,I1和I2均为一个预先设定的正整数;将当前的m个第一图像块组成一个图像集,并记为目标图像集;将当前以同一种非目标方位为中心的第二图像块组成一个图像集,并记为非目标图像集,得到n-1个非目标图像集;将t时刻的一帧图像中目标物体的中心位置设为当前位置;然后转入训练阶段;
所述训练阶段包括:
A1、将当前的目标图像集的类别标记为目标类,将当前的n-1个非目标图像集的各类别分别标记为第1非目标类、第2非目标类、…第n-1非目标类;然后将所述目标类、第1非目标类、第2非目标类、…第n-1非目标类分别对应n个类别行向量,记为y1,y2,…,yn,其中,yi=[0,0,...,1,...,0](i=1,2,…m),是除了第i个元素为1之外,其余全为0的向量,当i=1时,其含义表示目标类,当1<i≤n时,其含义表示第i-1非目标类;
A2、基于当前的1个目标图像集和n-1个非目标图像集构建一个高阶张量,记为X,且其中第一阶的n表示n个类别,第二阶和第三阶的I1×I2表示所截取的图像块的特征矩阵大小为I1×I2,第四阶的m表示m帧图像;将所述n个类别行向量y1,y2,…,yn依照X的第一阶中n个类别的顺序从上到下排列、构建成一个X的类别矩阵,记为Y,得出Y∈Rn×n
A3、利用高阶偏最小二乘法,分别将X和Y分解为
X = Σ r = 1 R G r × 1 t r × 2 P r ( 1 ) × 3 P r ( 2 ) × 4 P r ( 3 ) + E R - - - ( 1 )
Y = Σ r = 1 R u r q r T + F R - - - ( 2 )
其中,R表示对X和Y的分解进行R次迭代,Gr表示X的第r次迭代的核心张量,tr表示X的第r次迭代的隐藏向量,Pr (1)、Pr (2)、Pr (3)为X第r次迭代的三个加载矩阵,ur为Y第r次迭代的隐藏向量,qr为Y第r次迭代的加载向量,ER为X经过R次迭代后所得的残差张量,FR为Y经过R次迭代后所得的残差矩阵,tr、ur和qr均为列向量;同时,||qr||=1,||tr||=1,以及i=1,2,3,r=1,2,...R;
A4、将对当前的X进行R次迭代所得的所有隐藏向量组成一个隐藏矩阵,记为T,则T=[t1,t2,...tR];将对当前Y进行R次迭代所得的所有隐藏向量组成一个隐藏矩阵,记为U,则U=[u1,u2,...uR];对U与T作关联处理,得出U=TD+Z,其中D是对角矩阵,Z是高斯残差;将公式(2)中的Y分解改写为:
Y = Σ r = 1 R u r q r T + F R = Σ r = 1 R d r t r q r T + F R , - - - ( 3 )
其中,dr为D的第r个对角元素,F’R=FR+ZQ,Q为由q1,q2,...qR构成的矩阵,Q=[q1,q2,...qR];
A5、根据公式(1),设定
X1=X=G1×1t1×2P1 (1)×3P1 (2)×4P1 (3)+E1
X2=X1-G1×1t1×2P1 (1)×3P1 (2)×4P1 (3)=E1   (4)
……
XR=XR-1-GR-1×1tR-1×2PR-1 (1)×3PR-1 (2)×4PR-1 (3)=ER-1
其中,ER-1为X经过R-1次迭代后所得的残差张量;
同理根据公式(3),得出Y1,Y2,...YR,之后根据
max { P r ( i ) , q r } | | X r × 1 Y r T × 1 q r T × 2 P r ( 1 ) T × 3 P r ( 2 ) T × 4 P r ( 3 ) T | | F 2 s . t . P r ( i ) T P r ( i ) = I , | | q r | | F = 1 , i = 1,2,3 , r = 1,2 , . . . R - - - ( 5 )
同时,设定Cr=Xr×1Yr T,利用高阶奇异值分解依次计算出Cr的单次迭代的核心张量Gr (C),并求解出Pr (1)、Pr (2)、Pr (3)和qr,r=1,2,...R,然后根据
t 1 ← ( X 1 × 2 P 1 ( 1 ) T × 3 P 1 ( 2 ) T × 4 P 1 ( 3 ) T ) ( 1 ) G 1 ( 1 ) ( C ) + , t 1 ← t 1 / | | t 1 | | F t 2 ← ( X 2 × 2 P 2 ( 1 ) T × 3 P 2 ( 2 ) T × 4 P 2 ( 3 ) T ) ( 1 ) G 2 ( 1 ) ( C ) + , t 2 ← t 2 / | | t 2 | | F . . . . . . t R ← ( X R × 2 P R ( 1 ) T × 3 P R ( 2 ) T × 4 P R ( 3 ) T ) ( 1 ) G R ( 1 ) ( C ) + , t R ← t R / | | t R | | F - - - ( 6 )
依次求解出t1,t2,...tR
最后根据
d1=t1 Tu1=t1 TY1q1
d2=t2 Tu2=t2 TY2q2   (7)
……
dR=tR TuR=tR TYRqR
依求解出d1,d2,...dR;然后转入测试阶段;
所述测试阶段包括:
B1、提取下一时刻的一帧图像,设定该图像上以所述当前位置为中心、以指定半径长度为半径的圆形区域为该图像的搜索区域;转入步骤B2;
B2、在当前一帧图像的搜索区域中选取至少一个位置,作为当前一帧图像的测试位置;对于当前一帧图像的每个测试位置,分别以该测试位置为中心提取图像块,作为该测试位置的测试图像块;所有测试图像块大小均一致,且与所述初始化阶段中第一图像块或第二图像块的大小一致;转入步骤B3;
B3、将当前所提取的每个测试图像块均用一个I1×I2的特征矩阵表示;针对所提取的每个测试图像块:将该测试图像块与当前的目标图像集中的所有图像块一起组成一个新的图像集,记为测试图像集,然后基于该测试图像集构建一个新的高阶张量,记为Xnew,且Xnew∈RI1×I2×(m+1);将该测试图像块对应的类别行向量设为ynew,则
ynew≈XnewWDQT   (8)
其中,W是R列的矩阵,每一列表示为
w r = ( P r ( 3 ) ⊗ P r ( 2 ) ⊗ P r ( 1 ) ) G r + - - - ( 9 )
由公式(8)和(9)计算出ynew=[β,γ1,γ2,...,γn-1],其中β表示该测试图像块对应目标类的概率,γi(i=1,...,n-1)表示该测试图像块对应第i非目标类的概率;
计算出当前所有测试图像块对应的类别行向量后,转入步骤B4;
B4、根据这些测试图像块对应的类别行向量,选取其中与所述目标类对应的类别行向量最接近的一个,若该类别行向量与所述目标类对应的类别行向量的差值大于预设的阈值,则舍弃当前所获取的所有测试图像块,并转入步骤B2;若该类别行向量与所述目标类对应的类别行向量的差值小于或等于预设的阈值,则转入更新阶段;
所述更新阶段包括:
C1、将所述当前位置更新为所选取的类别行向量所对应的测试图像块的测试位置,并记录跟踪;然后,将该测试图像块添加到当前的目标图像集中并将该目标图像集中对应时刻最早的一个图像块删除,得到1个新的目标图像集;
C2、以所述当前位置为中心获取当前一帧图像中目标物体的n-1种非目标方位;之后,分别以这n-1种非目标方位为中心提取n-1个图像块,这n-1个图像块的大小均与所述初始化阶段中第一图像块或第二图像块的大小一致;然后,将这n-1个图像块根据所围绕的非目标方位、分别添加到当前的n-1个非目标图像集中,并将这n-1个非目标图像集中对应时刻最早的一个图像块删除,得到n-1个新的非目标图像集;
C3、将当前目标图像集中所有图像块和当前n-1个非目标图像集中所有图像块均用一个I1×I2的特征矩阵表示,转入训练阶段。
一实施例中:所述指定半径长度为所指定的目标物体的宽度的2至3倍。
一实施例中:所述I1×I2的特征矩阵为I1×I2的灰度值特征矩阵。
由上述对本发明的描述可知,与现有技术相比,本发明具有如下有益效果:
1.本发明的一种基于高阶偏最小二乘法的目标跟踪算法,相对于传统的以一个特征向量来表示图像块的目标跟踪算法,本发明以二维张量(I1×I2的特征矩阵)来表示图像块,保存了该图像块内在的空间结构信息,同时,本发明综合了多个时序的图像块及其类别来建立高阶张量,并以偏最小二乘法来分析该高阶张量与其类别矩阵的关联之处,使目标跟踪算法的性能大大提高。
2.本发明的一种基于高阶偏最小二乘法的目标跟踪算法,精细地将单一的非目标类划分为多个类别,从而能够找出对目标类别造成干扰最大的非目标类别,最终改善该目标跟踪算法的性能。
附图说明
图1为本发明实施例的一种基于高阶偏最小二乘法的目标跟踪算法示意图。
具体实施方式
实施例,
如图1所示,本发明提供了一种基于高阶偏最小二乘法的目标跟踪算法,包括初始化阶段001、训练阶段002、测试阶段003,和更新阶段004;
所述初始化阶段001包括:指定一个目标物体,并设定以该目标物体的中心为中心的n-1种不同相对方位为该目标物体的n-1种非目标方位(例如某一种非目标方位为,在目标物体中心点的东方偏南30度、距离该目标物体中心3个像素点的位置);将当前时刻记为t时刻,并提取从t-m时刻到t时刻的m帧图像,其中m为一个预先设定的正整数;针对所提取的每一帧图像,人为找到该图像中的目标物体,以该目标物体的中心为中心截取包含该目标物体的1个第一图像块,之后分别以该目标物体的n-1种非目标方位为中心截取n-1个第二图像块,其中n为一个预先设定的大于1的正整数;所有第一图像块和所有第二图像块的大小均一致;将所截取的每个第一图像块和每个第二图像块均用一个I1×I2的特征矩阵表示,I1和I2均为一个预先设定的正整数;将当前的m个第一图像块组成一个图像集,并记为目标图像集;将当前以同一种非目标方位为中心的第二图像块组成一个图像集,并记为非目标图像集,得到n-1个非目标图像集;将t时刻的一帧图像中目标物体的中心位置设为当前位置;然后转入训练阶段002;
所述训练阶段002包括:
A1、将当前的目标图像集的类别标记为目标类,将当前的n-1个非目标图像集的各类别分别标记为第1非目标类、第2非目标类、…第n-1非目标类;然后将所述目标类、第1非目标类、第2非目标类、…第n-1非目标类分别对应n个类别行向量,记为y1,y2,…,yn,其中,yi=[0,0,...,1,...,0](i=1,2,…m),是除了第i个元素为1之外,其余全为0的向量,当i=1时,其含义表示目标类,当1<i≤n时,其含义表示第i-1非目标类;
A2、基于当前的1个目标图像集和n-1个非目标图像集构建一个高阶张量,记为X,且其中第一阶的n表示n个类别,第二阶和第三阶的I1×I2表示所截取的图像块的特征矩阵大小为I1×I2,第四阶的m表示m帧图像;将所述n个类别行向量y1,y2,…,ynY∈Rn×n
A3、利用高阶偏最小二乘法,分别将X和Y分解为
X = Σ r = 1 R G r × 1 t r × 2 P r ( 1 ) × 3 P r ( 2 ) × 4 P r ( 3 ) + E R - - - ( 1 )
Y = Σ r = 1 R u r q r T + F R - - - ( 2 )
其中,R表示对X和Y的分解进行R次迭代,Gr表示X的第r次迭代的核心张量,tr表示X的第r次迭代的隐藏向量,Pr (1)、Pr (2)、Pr (3)为X第r次迭代的三个加载矩阵,ur为Y第r次迭代的隐藏向量,qr为Y第r次迭代的加载向量,ER为X经过R次迭代后所得的残差张量,FR为Y经过R次迭代后所得的残差矩阵,tr、ur和qr均为列向量;同时,||qr||=1,||tr||=1,以及i=1,2,3,r=1,2,...R;当R越大时,代表进行越多次迭代,得出的隐藏向量也就越精细,而残差矩阵或残差张量也会越小。但是进行太多次,可能会影响系统速度,占用太多计算资源,所以R需要在预测结果的精确度和计算效率之间取一个平衡点,一般可以根据经验来取值,也可以根据交叉验算等算法来确定;
A4、将对当前的X进行R次迭代所得的所有隐藏向量组成一个隐藏矩阵,记为T,则T=[t1,t2,...tR];将对当前Y进行R次迭代所得的所有隐藏向量组成一个隐藏矩阵,记为U,则U=[u1,u2,...uR];对U与T作关联处理,得出U=TD+Z,其中D是对角矩阵,Z是高斯残差;将公式(2)中的Y分解改写为:
Y = Σ r = 1 R u r q r T + F R = Σ r = 1 R d r t r q r T + F R , - - - ( 3 )
其中,dr为D的第r个对角元素,FR=FR+ZQ,Q为由q1,q2,...qR构成的矩阵,Q=[q1,q2,...qR];
A5、根据公式(1),设定
X1=X=G1×1t1×2P1 (1)×3P1 (2)×4P1 (3)+E1
X2=X1-G1×1t1×2P1 (1)×3P1 (2)×4P1 (3)=E1   (4)
……
XR=XR-1-GR-1×1tR-1×2PR-1 (1)×3PR-1 (2)×4PR-1 (3)=ER-1
其中,ER-1为X经过R-1次迭代后所得的残差张量;
同理根据公式(3),得出Y1,Y2,...YR
Y 1 = d 1 t 1 q 1 T + F 1 , Y 2 = Y 1 - d 1 t 1 q 1 T = F 1 , . . . . . . Y R = Y R - 1 - d R - 1 t R - 1 q R - 1 T = F R - 1 ,
其中,F’R-1为Y经过如上所述的R-1次迭代后所得的残差矩阵;
之后根据
max { P r ( i ) , q r } | | X r × 1 Y r T × 1 q r T × 2 P r ( 1 ) T × 3 P r ( 2 ) T × 4 P r ( 3 ) T | | F 2 s . t . P r ( i ) T P r ( i ) = I , | | q r | | F = 1 , i = 1,2,3 , r = 1,2 , . . . R - - - ( 5 )
同时,设定Cr=Xr×1Yr T,利用高阶奇异值分解依次计算出Cr的单次迭代的核心张量Gr (C),并求解出Pr (1)、Pr (2)、Pr (3)和qr,r=1,2,...R;
每一次分解都要尽可能地提取数据的有效成分,因此需要使残差张量和残差矩阵最小化;例如,针对第一次分解,X1=X=G1×1t1×2P1 (1)×3P1 (2)×4P1 (3)+E1需要使||E1||F和||F1’||F同时最小,等价于求||G1||R和||d1||F同时最大,又等价于求最大;而由X1=X=G1×1t1×2P1 (1)×3P1 (2)×4P1 (3)+E1,可得出在忽略残差的情况下, G 1 = X 1 × 1 t 1 T × 2 P 1 ( 1 ) T × 3 P 1 ( 2 ) T × 4 P 1 ( 3 ) T , 同理, d 1 = t 1 T Y 1 q 1 , 另外,由 | | t 1 | | = t 1 T t 1 = 1 , 因此,将G1和d1代入则最终可得需要最大化 | | X 1 × 1 Y 1 T × 1 q 1 T × 2 P 1 ( 1 ) T × 3 P 1 ( 2 ) T × 4 P 1 ( 3 ) T | | F 2 , 扩展到第r次迭代,从而得出公式(5);
C r = X r × 1 Y r T ≈ d r G r × 1 q r × 2 P r ( 1 ) × 3 P r ( 2 ) × 4 P r ( 3 ) ⇒ C r ≈ G r ( C ) × 1 q r × 2 P r ( 1 ) × 3 P r ( 2 ) × 4 P r ( 3 ) , 因此可利用现有的HOOI算法(高阶正交迭代算法)来分解Cr,从而直接得出Gr (C)、Pr (1)、Pr (2)、Pr (3)和qr,r=1,2,...R,并可得出Gr (C)=drGr,与Gr存在线性关系;
然后根据
t 1 ← ( X 1 × 2 P 1 ( 1 ) T × 3 P 1 ( 2 ) T × 4 P 1 ( 3 ) T ) ( 1 ) G 1 ( 1 ) ( C ) + , t 1 ← t 1 / | | t 1 | | F t 2 ← ( X 2 × 2 P 2 ( 1 ) T × 3 P 2 ( 2 ) T × 4 P 2 ( 3 ) T ) ( 1 ) G 2 ( 1 ) ( C ) + , t 2 ← t 2 / | | t 2 | | F . . . . . . - - - ( 6 )
t R ← ( X R × 2 P R ( 1 ) T × 3 P R ( 2 ) T × 4 P R ( 3 ) T ) ( 1 ) G R ( 1 ) ( C ) + , t R ← t R / | | t R | | F
依次求解出t1,t2,...tR;需要解释说明的是,若设定一个高阶张量为A,则A(1)表示A的mode-1展开,而A+表示A的M-P伪逆;以X的第一次迭代为例,可得到公式(6)的推导过程为
X 1 = G 1 × 1 t 1 × 2 P 1 ( 1 ) × 3 P 1 ( 2 ) × 4 P 1 ( 3 ) + E 1 ⇒ X 1 ≈ G 1 × 1 t 1 × 2 P 1 ( 1 ) × 3 P 1 ( 2 ) × 4 P 1 ( 3 ) ⇒ X 1 × 2 P 1 ( 1 ) T × 3 P 1 ( 2 ) T × 4 P 1 ( 3 ) T ≈ G 1 × 1 t 1 ⇒ ( X 1 × 2 P 1 ( 1 ) T × 3 P 1 ( 2 ) T × 4 P 1 ( 3 ) T ) ( 1 ) ≈ G 1 ( 1 ) × 1 t 1 ⇒ ( X 1 × 2 P 1 ( 1 ) T × 3 P 1 ( 2 ) T × 4 P 1 ( 3 ) T ) ( 1 ) G 1 ( 1 ) + → t 1 ⇒ ( X 1 × 2 P 1 ( 1 ) T × 3 P 1 ( 2 ) T × 4 P 1 ( 3 ) T ) ( 1 ) G 1 ( 1 ) ( C ) + → t 1 (由于G1与G1 (c)存在线性关系,因此可用来求解);
最后根据
d1=t1 Tu1=t1 TY1q1
d2=t2 Tu2=t2 TY2q2   (7)
……
dR=tR TuR=tR TYRqR
依求解出d1,d2,...dR;然后转入测试阶段003;其中,以Y的第一次迭代为例,可得到公式(7)的推导过程为
Y 1 = d 1 t 1 q 1 T + F 1 , ⇒ Y 1 ≈ d 1 t 1 q 1 T ⇒ d 1 ≈ t 1 T Y 1 q 1
所述测试阶段003包括:
B1、提取下一时刻的一帧图像,设定该图像上以所述当前位置为中心、以指定半径长度为半径的圆形区域为该图像的搜索区域;转入步骤B2;
B2、在当前一帧图像的搜索区域中选取至少一个位置,作为当前一帧图像的测试位置;对于当前一帧图像的每个测试位置,分别以该测试位置为中心提取图像块,作为该测试位置的测试图像块;所有测试图像块大小均一致,且与所述初始化阶段001中第一图像块或第二图像块的大小一致;转入步骤B3;
B3、将当前所提取的每个测试图像块均用一个I1×I2的特征矩阵表示;针对所提取的每个测试图像块:将该测试图像块与当前的目标图像集中的所有图像块一起组成一个新的图像集,记为测试图像集,然后基于该测试图像集构建一个新的高阶张量,记为Xnew,且Xnew∈RI1×I2×(m+1),也就是将该测试图像块的I1×I2的特征矩阵添加到当前的X中属于目标类的那部分的最后;将该测试图像块对应的类别行向量设为ynew,则
ynew≈XnewWDQT   (8)
其中,W是R列的矩阵,每一列表示为
w r = ( P r ( 3 ) ⊗ P r ( 2 ) ⊗ P r ( 1 ) ) G r + - - - ( 9 )
由公式(8)和(9)计算出ynew=[β,γ1,γ2,...,γn-1],其中β表示该测试图像块对应目标类的概率,γi(i=1,...,n-1)表示该测试图像块对应第i非目标类的概率;
公式(8)和(9)的推导过程为,首先由公式(3)可得, 其次,根据如上所述的公式(6)的推导过程可得
t r ← ( X r × 2 P r ( 1 ) T × 3 P r ( 2 ) T × 4 P 4 ( 3 ) T ) ( 1 ) G r ( 1 ) + , ( r = 1,2 , . . . R )
⇒ t r ← X r ( P r ( 3 ) ⊗ P r ( 2 ) ⊗ P r ( 1 ) ) G r + (根据克罗内克积的性质进行等价推导)
⇒ t r ← X r w r (已设定 w r = ( P r ( 3 ) ⊗ P r ( 2 ) ⊗ P r ( 1 ) ) G r + )
⇒ T = XW (已设定T=[t1,t2,...tR],W=[w1,w2,...wR])
⇒ Y ≈ XWDQ T
⇒ y new ≈ X new WDQ T
计算出当前所有测试图像块对应的类别行向量后,转入步骤B4;
B4、根据这些测试图像块对应的类别行向量,选取其中与所述目标类对应的类别行向量最接近的一个,若该类别行向量与所述目标类对应的类别行向量的差值大于预设的阈值,则舍弃当前所获取的所有测试图像块,并转入步骤B2;若该类别行向量与所述目标类对应的类别行向量的差值小于或等于预设的阈值,则转入更新阶段004;
所述更新阶段004包括:
C1、将所述当前位置更新为所选取的类别行向量所对应的测试图像块的测试位置,并记录跟踪;然后,将该测试图像块添加到当前的目标图像集中并将该目标图像集中对应时刻最早的一个图像块删除,得到1个新的目标图像集;
C2、以所述当前位置为中心获取当前一帧图像中目标物体的n-1种非目标方位;之后,分别以这n-1种非目标方位为中心提取n-1个图像块,这n-1个图像块的大小均与所述初始化阶段001中第一图像块或第二图像块的大小一致;然后,将这n-1个图像块根据所围绕的非目标方位、分别添加到当前的n-1个非目标图像集中,并将这n-1个非目标图像集中对应时刻最早的一个图像块删除,得到n-1个新的非目标图像集;
C3、将当前目标图像集中所有图像块和当前n-1个非目标图像集中所有图像块均用一个I1×I2的特征矩阵表示,转入训练阶段002。
一实施例中:所述指定半径长度为所指定的目标物体的宽度的2至3倍。
一实施例中:所述I1×I2的特征矩阵为I1×I2的灰度值特征矩阵。
上述实施例仅用来进一步说明本发明的一种基于高阶偏最小二乘法的目标跟踪算法,但本发明并不局限于实施例,凡是依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均落入本发明技术方案的保护范围内。

Claims (3)

1.一种基于高阶偏最小二乘法的目标跟踪算法,其特征在于,包括初始化阶段、训练阶段、测试阶段,和更新阶段;
所述初始化阶段包括:指定一个目标物体,并设定以该目标物体的中心为中心的n-1种不同相对方位为该目标物体的n-1种非目标方位;将当前时刻记为t时刻,并提取从t-m时刻到t时刻的m帧图像,其中m为一个预先设定的正整数;针对所提取的每一帧图像,人为找到该图像中的目标物体,以该目标物体的中心为中心截取包含该目标物体的1个第一图像块,之后分别以该目标物体的n-1种非目标方位为中心截取n-1个第二图像块,其中n为一个预先设定的大于1的正整数;所有第一图像块和所有第二图像块的大小均一致;将所截取的每个第一图像块和每个第二图像块均用一个I1×I2的特征矩阵表示,I1和I2均为一个预先设定的正整数;将当前的m个第一图像块组成一个图像集,并记为目标图像集;将当前以同一种非目标方位为中心的第二图像块组成一个图像集,并记为非目标图像集,得到n-1个非目标图像集;将t时刻的一帧图像中目标物体的中心位置设为当前位置;然后转入训练阶段;
所述训练阶段包括:
A1、将当前的目标图像集的类别标记为目标类,将当前的n-1个非目标图像集的各类别分别标记为第1非目标类、第2非目标类、…第n-1非目标类;然后将所述目标类、第1非目标类、第2非目标类、…第n-1非目标类分别对应n个类别行向量,记为y1,y2,…,yn,其中,yi=[0,0,...,1,...,0](i=1,2,…m),是除了第i个元素为1之外,其余全为0的向量,当i=1时,其含义表示目标类,当1<i≤n时,其含义表示第i-1非目标类;
A2、基于当前的1个目标图像集和n-1个非目标图像集构建一个高阶张量,记为X,且其中第一阶的n表示n个类别,第二阶和第三阶的I1×I2表示所截取的图像块的特征矩阵大小为I1×I2,第四阶的m表示m帧图像;将所述n个类别行向量y1,y2,…,yn依照X的第一阶中n个类别的顺序从上到下排列、构建成一个X的类别矩阵,记为Y,得出Y∈Rn×n
A3、利用高阶偏最小二乘法,分别将X和Y分解为
X = Σ r = 1 R G r × 1 t r × 2 P r ( 1 ) × 3 P r ( 2 ) × 4 P r ( 3 ) + E R - - - ( 1 )
Y = Σ r = 1 R u r q r T + F R - - - ( 2 )
其中,R表示对X和Y的分解进行R次迭代,Gr表示X的第r次迭代的核心张量,tr表示X的第r次迭代的隐藏向量,Pr (1)、Pr (2)、Pr (3)为X第r次迭代的三个加载矩阵,ur为Y第r次迭代的隐藏向量,qr为Y第r次迭代的加载向量,ER为X经过R次迭代后所得的残差张量,FR为Y经过R次迭代后所得的残差矩阵,tr、ur和qr均为列向量;同时,||qr||=1,||tr||=1,以及i=1,2,3,r=1,2,...R;
A4、将对当前的X进行R次迭代所得的所有隐藏向量组成一个隐藏矩阵,记为T,则T=[t1,t2,...tR];将对当前Y进行R次迭代所得的所有隐藏向量组成一个隐藏矩阵,记为U,则U=[u1,u2,...uR];对U与T作关联处理,得出U=TD+Z,其中D是对角矩阵,Z是高斯残差;将公式(2)中的Y分解改写为:
Y = Σ r = 1 R u r q r T + F R = Σ r = 1 R d r t r q r T + F R , - - - ( 3 )
其中,dr为D的第r个对角元素,FR=FR+ZQ,Q为由q1,q2,...qR构成的矩阵,Q=[q1,q2,...qR];
A5、根据公式(1),设定
X1=X=G1×1t1×2P1 (1)×3P1 (2)×4P1 (3)+E1
X2=X1-G1×1t1×2P1 (1)×3P1 (2)×4P1 (3)=E1   (4)
……
XR=XR-1-GR-1×1tR-1×2PR-1 (1)×3PR-1 (2)×4PR-1 (3)=ER-1
其中,ER-1为X经过R-1次迭代后所得的残差张量;
同理根据公式(3),得出Y1,Y2,...YR,之后根据
max { P r ( i ) , q r } | | X r × 1 Y r T × 1 q r T × 2 P r ( 1 ) T × 3 P r ( 2 ) T × 4 P r ( 3 ) T | | F 2 s . t . P r ( i ) T P r ( i ) = I , | | q r | | F = 1 , i = 1,2,3 , r = 1,2 , . . . R - - - ( 5 )
同时,设定Cr=Xr×1Yr T,利用高阶奇异值分解依次计算出Cr的单次迭代的核心张量Gr (C),并求解出Pr (1)、Pr (2)、Pr (3)和qr,r=1,2,...R,然后根据
t 1 ← ( X 1 × 2 P 1 ( 1 ) T × 3 P 1 ( 2 ) T × 4 P 1 ( 3 ) T ) ( 1 ) G 1 ( 1 ) ( C ) + , t 1 ← t 1 / | | t 1 | | F t 2 ← ( X 2 × 2 P 2 ( 1 ) T × 3 P 2 ( 2 ) T × 4 P 2 ( 3 ) T ) ( 1 ) G 2 ( 1 ) ( C ) + , t 2 ← t 2 / | | t 2 | | F . . . . . . t R ← ( X R × 2 P R ( 1 ) T × 3 P R ( 2 ) T × 4 P R ( 3 ) T ) ( 1 ) G R ( 1 ) ( C ) + , t R ← t R / | | t R | | F - - - ( 6 )
依次求解出t1,t2,...tR
最后根据
d1=t1 Tu1=t1 TY1q1
d2=t2 Tu2=t2 TY2q2   (7)
……
dR=tR TuR=tR TYRqR
依求解出d1,d2,...dR;然后转入测试阶段;
所述测试阶段包括:
B1、提取下一时刻的一帧图像,设定该图像上以所述当前位置为中心、以指定半径长度为半径的圆形区域为该图像的搜索区域;转入步骤B2;
B2、在当前一帧图像的搜索区域中选取至少一个位置,作为当前一帧图像的测试位置;对于当前一帧图像的每个测试位置,分别以该测试位置为中心提取图像块,作为该测试位置的测试图像块;所有测试图像块大小均一致,且与所述初始化阶段中第一图像块或第二图像块的大小一致;转入步骤B3;
B3、将当前所提取的每个测试图像块均用一个I1×I2的特征矩阵表示;针对所提取的每个测试图像块:将该测试图像块与当前的目标图像集中的所有图像块一起组成一个新的图像集,记为测试图像集,然后基于该测试图像集构建一个新的高阶张量,记为Xnew,且Xnew∈RI1×I2×(m+1);将该测试图像块对应的类别行向量设为ynew,则
ynew≈XnewWDQT   (8)
其中,W是R列的矩阵,每一列表示为
w r = ( P r ( 3 ) ⊗ P r ( 2 ) ⊗ P r ( 1 ) ) G r + - - - ( 9 )
由公式(8)和(9)计算出ynew=[β,γ1,γ2,...,γn-1],其中β表示该测试图像块对应目标类的概率,γi(i=1,...,n-1)表示该测试图像块对应第i非目标类的概率;
计算出当前所有测试图像块对应的类别行向量后,转入步骤B4;
B4、根据这些测试图像块对应的类别行向量,选取其中与所述目标类对应的类别行向量最接近的一个,若该类别行向量与所述目标类对应的类别行向量的差值大于预设的阈值,则舍弃当前所获取的所有测试图像块,并转入步骤B2;若该类别行向量与所述目标类对应的类别行向量的差值小于或等于预设的阈值,则转入更新阶段;
所述更新阶段包括:
C1、将所述当前位置更新为所选取的类别行向量所对应的测试图像块的测试位置,并记录跟踪;然后,将该测试图像块添加到当前的目标图像集中并将该目标图像集中对应时刻最早的一个图像块删除,得到1个新的目标图像集;
C2、以所述当前位置为中心获取当前一帧图像中目标物体的n-1种非目标方位;之后,分别以这n-1种非目标方位为中心提取n-1个图像块,这n-1个图像块的大小均与所述初始化阶段中第一图像块或第二图像块的大小一致;然后,将这n-1个图像块根据所围绕的非目标方位、分别添加到当前的n-1个非目标图像集中,并将这n-1个非目标图像集中对应时刻最早的一个图像块删除,得到n-1个新的非目标图像集;
C3、将当前目标图像集中所有图像块和当前n-1个非目标图像集中所有图像块均用一个I1×I2的特征矩阵表示,转入训练阶段。
2.如权利要求1所述的一种基于高阶偏最小二乘法的目标跟踪算法,其特征在于,所述指定半径长度为所指定的目标物体的宽度的2至3倍。
3.如权利要求1所述的一种基于高阶偏最小二乘法的目标跟踪算法,其特征在于,所述I1×I2的特征矩阵为I1×I2的灰度值特征矩阵。
CN201410279523.4A 2014-06-20 2014-06-20 一种基于高阶偏最小二乘法的目标跟踪算法 Active CN104021395B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410279523.4A CN104021395B (zh) 2014-06-20 2014-06-20 一种基于高阶偏最小二乘法的目标跟踪算法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410279523.4A CN104021395B (zh) 2014-06-20 2014-06-20 一种基于高阶偏最小二乘法的目标跟踪算法

Publications (2)

Publication Number Publication Date
CN104021395A true CN104021395A (zh) 2014-09-03
CN104021395B CN104021395B (zh) 2017-05-03

Family

ID=51438139

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410279523.4A Active CN104021395B (zh) 2014-06-20 2014-06-20 一种基于高阶偏最小二乘法的目标跟踪算法

Country Status (1)

Country Link
CN (1) CN104021395B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104820419A (zh) * 2015-03-02 2015-08-05 北京交通大学 一种基于高阶奇异值分解的性能基准估计的方法和系统
CN105262441A (zh) * 2015-09-08 2016-01-20 西安交通大学 基于红外图像的光伏阵列故障等级划分方法
CN107942658A (zh) * 2017-11-10 2018-04-20 华侨大学 一种采用自适应滤波器的大圆机旋转周期预测方法及系统
CN110084834A (zh) * 2019-04-28 2019-08-02 东华大学 一种基于快速张量奇异值分解特征降维的目标跟踪方法
CN110398331A (zh) * 2019-07-22 2019-11-01 华侨大学 基于偏最小二乘的振动响应频域预测方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050016947A1 (en) * 2001-03-23 2005-01-27 David Fatke Method and apparatus for endpoint detection using partial least squares
CN101004791A (zh) * 2007-01-19 2007-07-25 赵力 一种基于二维偏最小二乘法的面部表情识别方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050016947A1 (en) * 2001-03-23 2005-01-27 David Fatke Method and apparatus for endpoint detection using partial least squares
CN101004791A (zh) * 2007-01-19 2007-07-25 赵力 一种基于二维偏最小二乘法的面部表情识别方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
BINENG ZHONG等: "Structured partial least squares for simultaneous object tracking and segmentation", 《NEUROCOMPUTING》 *
王建平 等: "基于高阶偏最小二乘的间歇过程建模", 《化工学报》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104820419A (zh) * 2015-03-02 2015-08-05 北京交通大学 一种基于高阶奇异值分解的性能基准估计的方法和系统
CN105262441A (zh) * 2015-09-08 2016-01-20 西安交通大学 基于红外图像的光伏阵列故障等级划分方法
CN105262441B (zh) * 2015-09-08 2017-04-12 西安交通大学 基于红外图像的光伏阵列故障等级划分方法
CN107942658A (zh) * 2017-11-10 2018-04-20 华侨大学 一种采用自适应滤波器的大圆机旋转周期预测方法及系统
CN107942658B (zh) * 2017-11-10 2020-06-26 华侨大学 一种采用自适应滤波器的大圆机旋转周期预测方法及系统
CN110084834A (zh) * 2019-04-28 2019-08-02 东华大学 一种基于快速张量奇异值分解特征降维的目标跟踪方法
CN110398331A (zh) * 2019-07-22 2019-11-01 华侨大学 基于偏最小二乘的振动响应频域预测方法及装置

Also Published As

Publication number Publication date
CN104021395B (zh) 2017-05-03

Similar Documents

Publication Publication Date Title
Garcia-Garcia et al. A review on deep learning techniques applied to semantic segmentation
Gao et al. Infar dataset: Infrared action recognition at different times
Chatfield et al. Return of the devil in the details: Delving deep into convolutional nets
George et al. Recognizing products: A per-exemplar multi-label image classification approach
Xia et al. Spectral–spatial classification for hyperspectral data using rotation forests with local feature extraction and Markov random fields
CN109993748B (zh) 一种基于点云处理网络的三维网格物体分割方法
CN104021395A (zh) 一种基于高阶偏最小二乘法的目标跟踪算法
CN101470809B (zh) 一种基于扩展混合高斯模型的运动目标检测方法
CN103258324B (zh) 基于可控核回归和超像素分割的遥感图像变化检测方法
Zhang et al. Easy domain adaptation method for filling the species gap in deep learning-based fruit detection
Li et al. Sign language recognition based on computer vision
CN103942535B (zh) 多目标跟踪方法及装置
Zhang et al. Lightweight fruit-detection algorithm for edge computing applications
CN106228109A (zh) 一种基于骨骼运动轨迹的动作识别方法
Yang et al. Visual tracking with long-short term based correlation filter
Cheng et al. Cascaded non-local neural network for point cloud semantic segmentation
CN107203745A (zh) 一种基于跨域学习的跨视角动作识别方法
CN104036243A (zh) 一种基于光流信息的行为识别方法
CN107767416A (zh) 一种低分辨率图像中行人朝向的识别方法
Sun et al. Modeling and recognizing human trajectories with beta process hidden Markov models
Puri COCO dataset stuff segmentation challenge
CN105718934A (zh) 一种基于低秩稀疏编码技术的害虫图像特征学习与识别方法
CN107424174A (zh) 基于局部约束非负矩阵分解的运动显著区域提取方法
Ding et al. Simultaneous body part and motion identification for human-following robots
Gu 3D densely connected convolutional network for the recognition of human shopping actions

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant