CN109598311A

CN109598311A - 一种基于对称正定矩阵流形切空间子空间学习的描述子局部聚合向量方法

Info

Publication number: CN109598311A
Application number: CN201910062529.9A
Authority: CN
Inventors: 马争鸣; 车航健; 陈李创凯; 刘洁
Original assignee: Sun Yat Sen University
Current assignee: Sun Yat Sen University
Priority date: 2019-01-23
Filing date: 2019-01-23
Publication date: 2019-04-09

Abstract

本发明涉及机器学习中描述子局部聚合向量相关问题，提出了一种基于对称正定矩阵流形切空间子空间学习的描述子局部聚合向量方法。已有的局部聚合向量方法大都是在欧式空间上，无法处理对称正定矩阵流形的非线性数据，为此，本方法提出了将训练数据映射到码字的切空间上进行子空间学习，将非线性问题转化为线性问题，然后是在学习的子空间上计算局部聚合向量。在子空间学习阶段，在码字的切空间上根据训练数据的标签信息来学习具有判别性的子空间，让同类别的数据在子空间上尽可能靠近，异类的数据在子空间上尽可能远离。在局部聚合向量计算阶段，将输入图片提取的对称正定矩阵映射到码字切空间的子空间上计算聚合向量。

Description

一种基于对称正定矩阵流形切空间子空间学习的描述子局部聚合向量方法

技术领域

本发明涉及面向机器学习领域的编码技术，具体是一种描述子局部聚合向量方法。

背景技术

近年来，计算机视觉成为了研究的热点，在计算机视觉问题中，特征不再局限于传统的向量特征，很多矩阵形式的特征提取方法被提出，所以对矩阵特征进行处理是很有必要的。

在现在的研究中，矩阵形式的特征主要分为两类，一类是区域协方差描述子(Region Covariance Descriptor,RCoVD)，另一类是线性子空间。其中区域协方差描述子由于其优越的性能被广泛用于人脸识别(文献1，M.T.Harandi,R.Hartley,B.Lovell,andC.Sanderson,Sparse coding on symmetric positive definite manifolds usingbregman divergences,IEEE Trans.Neural Netw.Learn.Syst,vol.27,no.6,pp.1294–1306,Jun.2016.)、纹理分类(文献2，M.Faraki,M.T.Harandi,and F.Porikli,Materialclassification on symmetric positive definite manifolds,in Proc.IEEE WinterConf.Appl.Comput.Vis.,Jan.2015,pp.749–756.)和人头姿势估计(文献3，D.Tosato,M.Spera,M.Cristani,and V.Murino,Characterizing humans on Riemannianmanifolds,IEEE Trans.Pattern Anal.Mach.Intell.,vol.35,no.8,pp.1972–1984,Aug.2013.)等问题上。区域协方差描述子是对称正定矩阵，因而是对称正定矩阵流形(Symmetric Positive Definite Manifold,SPD Manifold)上的点，SPD流形是典型的黎曼流形，在SPD流形上每个点的切空间上都定义了缓慢变化的内积运算。由于SPD流形的非线性，常用的基于向量运算的方法不再适用于SPD流形数据。所以有必要提出基于SPD流形的编码算法，将SPD流形上的点编码成为向量。

目前基于SPD流形的编码算法主要分为类，一类是稀疏编码，另一类是描述子局部聚合向量方法(Vector Of Aggregated Descriptors,VLAD)。基于欧式空间的VLAD编码表现出了良好的性能(文献4，H.Jégou,F.Perronnin,M.Douze,J.Sánchez,P.Pérez,andC.Schmid,Aggregating local image descriptors into compact codes,IEEETrans.Pattern Anal.Mach.Intell.,vol.34,no.9,pp.1704–1716,Sep.2012)。基于SPD流形的VLAD编码方法也引起了关注。目前基于SPD流形的VLAD编码算法主要分为两类，一种做法是在码本的切空间上计算局部差异向量，文献5(M.Faraki,M.T.Harandi,andF.Porikli,Material classification on symmetric positive definite manifolds,inProc.IEEE Winter Conf.Appl.Comput.Vis.,Jan.2015,pp.749–756.)提出了基于SPD流形的VLAD编码，在将SPD矩阵映射到码本切空间时采用了两种方式，一种是通过传统的Log映射，另一种是通过计算输入样本与码本之间测度关于码本的梯度来将输入SPD矩阵映射到码本切空间上。第二种映射SPD流形数据的做法是将SPD流形数据映射到再生核希尔伯特空间上计算每个码本的局部差异向量，文献6(Mehrtash Harandi,Mathieu Salzmann,andFatih Porikli，When VLAD met Hilbert,2016 IEEE Conference on Computer Visionand Pattern Recognition.)提出了基于核方法的SPD流形VLAD编码方法，具体做法是通过SPD流形的正定核函数定义一个再生核希尔伯特空间，从而确定一个从SPD流形到再生核希尔伯特空间的映射，将SPD矩阵映射到再生核希尔伯特空间上进行局部差异向量的计算。

本方法是一种基于SPD流形的VLAD方法，本方法映射SPD流形数据的方法是将SPD流形数据映射到码本的切空间上，主要的创新点在切空间上基于原始SPD矩阵的类别信息来学习具有判别性的子空间，这样计算的局部差异向量更具有判别性，能够得到较好的分类效果，此外，由于子空间的学习可以人为确定子空间的标准正交基的个数，相对于文献5提出的方法，本方法可以灵活控制每个码本上局部差异向量的长度。

发明内容

本发明的目的在于提供一种对称正定矩阵流形上的描述子局部聚合向量方法。本发明的技术方案是，先利用训练数据在码字切空间上学习子空间，学习的方法是先通过聚类算法生成K个码字，然后将训练数据根据最近邻原则分配给码字，对每个码字，将分配到该码字的训练样本映射到码字的切空间上，然后在切空间上根据同类数据距离最小化和异类数据距离最大化的原则来学习具有判别性的子空间，子空间学习完成后对新输入的图片通过计算每个局部区域的描述子协方差矩阵得到SPD矩阵集合，将SPD矩阵映射到码字切空间上，在根据学习到的子空间的标准正交基得到SPD矩阵在码字切空间的子空间的表示，利用这个表示进行聚合向量的计算。发明内容如下：

1.“对称正定矩阵流形切空间上子空间学习算法”。该算法是在对称正定矩阵的切空间上根据训练数据的标签信息学习具有判别性的子空间。其具体步骤如下：

步骤一：利用训练数据通过对称正定流形上的K聚类算法来产生K个聚类中心点作为码本码本也是由SPD矩阵组成的集合。根据最近邻原则将训练数据分配给不同码字。

步骤二：将训练数据映射到码字切空间上，以码字C_t为例，首先将被分配到C_t的训练数据映射到C_t的切空间上。得到训练数据的切向量，SPD矩阵的切向量是对称矩阵，映射的公式是：

其中δ表示SPD流形上的测度，T_i∈symⁿ表示n维对称矩阵空间。

步骤三：在每个码字的切空间上进行子空间学习，子空间学习的目标是让在学习的子空间上同类数据的距离尽可能小，异类数据之间的距离尽可能大，假设子空间的基可以由线性组合得到：

步骤四：根据训练数据的标签信息构建同类信息矩阵：同类数据在子空间上的距离总和为：其中Y_i是数据在子空间上的表示，可以通过数据的切向量与子空间的基的内积得到：W是组合系数矩阵，L_w是G_w的拉普拉斯矩阵，K(T)是码字C_t的切向量之间的距离矩阵。

步骤五：构建异类信息矩阵：异类数据在子空间上的距离总和：其中，L_w是G_w的拉普拉斯矩阵。

步骤六：总的目标函数为：

s.t WK(T)W^T＝I,W∈R^d×N

2.一种对称正定矩阵流形上的描述子局部聚合向量方法。该方法是对一幅输入图片的提取由对称正定矩阵组成的特征，然后对称正定矩阵进行VLAD编码。具体地，对输入的一幅图片，通过计算有重叠的局部区域的协方差矩阵，得到SPD矩阵组成的集合对集合中的每个SPD矩阵，首先根据最近邻原则将其分配到某一码字C_t，然后将SPD矩阵映射到码字C_t的切空间上，根据已学习好的子空间标准正交基计算SPD矩阵的切向量在子空间上的表示作为差异向量。把属于同一个码字的所有差异向量累加起来得到该码字的局部聚合向量，所有码字的聚合向量拼接成一个编码向量得到最终的编码结果。

本发明的特点及其意义：

(1)提出了一种新的SPD流形上的VLAD方法。在每个码本的切空间上利用流形数据的类别信息学习具有判别性的子空间，然后在子空间上进行VLAD计算。

(2)提出的VLAD方法的编码长度可变。

(3)具有较好的适用性。使用已有的训练数据学习子空间，学习得到子空间的标准正交基之后，可以对新来数据点进行VLAD计算。

附图说明

图1：基于对称正定矩阵流形切空间子空间学习的描述子局部聚合向量流程图。

具体实施方式

本发明的目的在于提供一种对称正定矩阵流形上的描述子局部聚合向量方法。本发明的技术方案是，先利用训练数据在码字切空间上学习子空间，学习的方法是先通过聚类算法生成K个码字，然后将训练数据根据最近邻原则分配给码字，对每个码字，将分配到该码字的训练样本映射到码字的切空间上，然后在切空间上根据同类数据距离最小化和异类数据距离最大化的原则来学习具有判别性的子空间，子空间学习完成后对新输入的图片通过计算每个局部区域的描述子协方差矩阵得到SPD矩阵集合，将SPD矩阵映射到码字切空间上，在根据学习到的子空间的标准正交基得到SPD矩阵在码字切空间的子空间的表示，利用这个表示进行聚合向量的计算。如下介绍本发明的具体原理。

令表示训练数据。通过SPD流形上的K聚类算法产生K个码本根据最近邻原则将训练数据分配给码字，令码字C_t分配得到的训练数据记为首先要把训练数据映射到C_t的切空间上，映射的公式为：

SPD流形上一点的切空间是由对称矩阵组成的矩阵空间，具有欧式空间的性质，可以进行线性运算，因而可以大大方便后续的计算。

在进行子空间学习之前首先要根据训练数据的标签信息构同类信息矩阵G_w和异类信息矩阵G_w：

子空间学习是在码字C_t的切空间上进行的，子空间学习的目的是利用SPD流形数据的类别信息学习比原始空间更有判别性的子空间，假设子空间的基可以由训练数据在码字切空间上的对应的切向量线性组合表示：

记T_i在自空间上的表示为Y_i：Y_i＝[<Γ₁,T_i>…<Γ_d,T_i>]∈R^d×1，又：

其中K(T)是之间的距离矩阵，用矩阵内积计算，K(T)的计算如下：

矩阵之间的内积定义为：<A,B>＝tr(A^TB)，则Y_i的计算公式为：

根据两个原则来构建目标函数，一是同类数据在子空间上距离尽可能小，在子空间上同类数据之间的距离总和：

其中L_w是G_w的拉普拉斯矩阵，L_w＝D_w-G_w，D_w＝diag(D₁₁,…,D_NN)。第二个原则是不同类的数据临近点在子空间上的距离尽可能大，同理，在子空间上异类近邻点之间的距离总和：

其中L_b是G_b的拉普拉斯矩阵。

由于子空间的基要求是标准正交基，因此需要对此作限制：

其中由约束条件可以看到每个基与其他基的矩阵内积都是0，而自身的范数是1。加上约束条件之后，总的目标函数为：

目标函数是一个广义瑞利商问题，可以通过特征分解来求解，对K(T)进行chol分解K(T)＝VV^T,则目标函数可以改写为：

对B进行chol分解B＝LL^T,目标函数可以改写为：

其中对矩阵L^-1A(L^T)^-1进行特征分解，前d小的特征值对应的特征向量构成Y,由于Y＝ML＝WVL，最后得到W＝Y(VL)^-1。得到稀疏矩阵W之后可以通过的线性组合得到子空间的标准正交基。

对一幅输入的图片，通常是通过区域协方差描述子产生SPD矩阵的集合对每个Z_i，根据最近邻原则将其分配给距离最近的码字C_t，然后将Z_i映射到C_t的切空间上：

记C_t的切空间上学习得到的子空间的基为则C_t与Z_i的局部差异向量为：

v_ti＝[<Γ₁,T_i><Γ₂,T_i>...<Γ_d,T_i>]^T (15)

码字C_t的总的局部聚合向量为：

其中Z_i∈C_t表示Z_i被分配到C_t。最后得到这幅图片的VLAD编码为：

V＝[v₁ v₂ ... v_K]^T (17)

至此，VLAD编码完成。

Claims

1.一种基于对称正定矩阵流形切空间子空间学习的描述子局部聚合向量方法，其特征在于：

A.训练数据是有标签的对称正定(Symmetric Positive Definite,SPD)矩阵流形数据，将训练数据映射到码字的切空间上，根据训练数据的标签信息，通过同类数据在子空间上距离最小化和异类数据在子空间上距离最大化两个原则在码字的切空间上学习具有判别性的子空间；

B.对输入数据进行局部聚合向量的计算；对输入的图片通过计算每个局部区域的描述子协方差矩阵得到SPD矩阵集合，将SPD矩阵映射到码字切空间上，在根据学习到的子空间的标准正交基得到SPD矩阵在码字切空间的子空间的表示，利用这个表示进行聚合向量的计算。

2.根据权利要求1所述方法，其步骤A具体包括：

2A.训练数据是有标签的SPD矩阵{X_i,l_i}，通过基于SPD流形的聚类算法产生码本，然后根据最近邻原则将训练数据分配给不同码字；将分配给某一码字C_t的训练数据映射成为C_t的切空间上的切向量；

2B.子空间学习的目的一是使同类数据在子空间上距离尽可能小，子空间的基可以由训练数据在码字切空间上对应的切向量线性组合得到：w表示组合系数，根据训练数据的标签信息得到同类信息矩阵同类数据在子空间上的距离总和为：其中Y_i是数据在子空间上的表示，可以通过数据的切向量与子空间的基的内积得到：W是组合系数矩阵，L_w是G_w的拉普拉斯矩阵，K(T)是码字C_t的切向量{T_i}之间的距离矩阵；

2C.子空间学习的目的二是使异类数据在子空间上距离尽可能大，根据训练数据的标签得到异类信息矩阵异类数据在子空间上的距离总和是：其中L_b是G_b的拉普拉斯矩阵；

2D.此外子空间的基要求是标准正交基，因此不同基之间的内积结果应该为0，得到限制条件：WK(T)W^T＝I，I表示单位矩阵，总的目标函数为：

s.t WK(T)W^T＝I,W∈R^d×N。

3.根据权利要求1所述方法，其步骤B具体包括：对输入的一幅图片，通过计算有重叠的局部区域的协方差矩阵，得到SPD矩阵组成的集合；对集合中的每个SPD矩阵，首先根据最近邻原则将其分配到某一码字，然后将SPD矩阵映射到码字的切空间上，根据已学习好的子空间标准正交基计算SPD矩阵的切向量在子空间上的表示作为差异向量。把属于同一个码字的所有差异向量累加起来得到该码字的聚合向量，所有码字的聚合向量拼接成一个编码向量得到最终的编码结果。