CN103218617B - 一种多线性大间距的特征提取方法 - Google Patents
一种多线性大间距的特征提取方法 Download PDFInfo
- Publication number
- CN103218617B CN103218617B CN201310176389.0A CN201310176389A CN103218617B CN 103218617 B CN103218617 B CN 103218617B CN 201310176389 A CN201310176389 A CN 201310176389A CN 103218617 B CN103218617 B CN 103218617B
- Authority
- CN
- China
- Prior art keywords
- phi
- sigma
- tensor
- matrix
- circletimes
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Image Analysis (AREA)
- Complex Calculations (AREA)
Abstract
本专利提供的是一种多线性大间距的特征提取方法。首先,提取视频流样本的一个周期的步态序列数据,并且表示成张量结构;第二,用多线性主成分分析(MPCA)进行张量数据预处理,使高维的张量数据投影到一个低维的张量结构,去除冗余和噪声信息;第三,优化类间Laplacian散度和类内Laplacian散度之差,使其值最大,通过不断迭代求值,使其解收敛并达到迭代终止条件,得到各个模式下的投影矩阵,通过张量乘法得到一个维数更低、带有监督信息的低维张量;最后,通过基于欧氏距离的最近邻分类器进行分类。本发明所提供的方法较MPCA有更高的识别率,最终降维后的特征也更短一些。
Description
技术领域
本发明属于机器学习和模式识别领域,具体地说是一种多线性大间距的特征提取方法。
背景技术
随着数据收集以及存储能力的提高,在各个应用领域每天都会产生大量多维数据,行之有效的特征提取方法就变得尤为重要。传统的基于向量的降维方法,例如主成分分析(Principalcomponentanalysis,PCA),线性判别分析(Lineardiscriminantanalysis,LDA)以及局部保留投影(Localpreserveprojection,LPP)都是将图像矩阵转换成更高维数的向量,这在图像序列识别中必然会带来维数灾难。而且,采用Fisher判别准则的方法(如LDA)需要计算类内散度矩阵的逆,这会带来小样本问题,同时也破坏了原始图像的结构信息。
为了获得更好的特征提取性能,在图像(或图像序列)处理中直接利用矩阵或张量数据形式进行特征提取。Yang等人提出了二维主成分分析(TwodimensionalPCA,2DPCA)[1],Li等人提出了二维判别分析方法(TwodimensionalLDA,2DLDA)[2],这不但提高了特征提取的效率,还可避免原始图像特征向量化造成结构信息的破坏。但是,对于图像序列乃至更多模式的数据,例如灰度图像序列,彩色图像等,基于矩阵的特征提取方法并不能有效地处理多模式的高维数据。因此,基于张量的特征提取方法逐渐成为研究的热点。吕海平等人提出了多线性主成分分析(Multilinearprincipalcomponentanalysis,MPCA)[3],并且归纳了张量在多线性子空间学习中的研究成果[4]。MPCA虽然没有破坏张量数据的结构信息,但是是一种无监督的学习方法,因此识别率可以进一步提高。Tao等人提出了广义张量判别分析(GeneralTensorDiscriminantAnalysis,GTDA)是一种有监督的张量学习方法,它是优化类间散度与类内散度之差达到最大[5]。
与本发明相关的公开报道有:
[1]YangJ,ZhangD,FrangiAF,YangJY.Two-dimensionalPCA:anewapproachtoappearance-basedfacerepresentationandrecognition(二维主成分分析:一种基于外观的人脸表示与识别新方法).IEEEtransactionsonPatternAnalysisandMachineIntelligence(国际IEEE模式分析与机器智能期刊),2004,26(1):131-137。
[2]LiM,YuanBZ.2D-LDA:astatisticallineardiscriminantanalysisforimagematrix(二维线性判别分析:一种对图像矩阵的统计线性判别分析).PatternRecognitionLetters(国际模式识别快报),2005,26(5):527-532。
[3]HaipingLu,PlataniotisKN,VenetsanopoulosAN.MPCA:MultilinearPrincipalComponentAnalysisofTensorObjects(MPCA:张量个体的多线性主成分分析).IEEETransactionsonNeuralNetworks.(国际IEEE神经网络期刊)2008,19(1):18-39。
[4]HaipingLu,K.N.Plataniotis,A.N.Venetsanopoulos.AsurveyofMultilinearSubspaceLearningforTensorData(张量数据的多线性子空间学习方法综述).PatternRecognition(国际模式识别期刊),2011,44(7):1540-1551。
[5]DachengTao,XuelongLi,XindongWu,etal.GeneralTensorDiscriminantAnalysisandGaborFeaturesforGaitRecognition(广义张量判别分析和Gabor特征的步态识别方法).IEEETransactionsonPatternAnalysisandMachineIntelligence(国际IEEE模式分析与机器智能期刊).2007,29(10):1700-1715。
传统的基于向量的特征提取方法是通过将图像矩阵(或图像序列)向量化来实现的,但在多模式数据降维中会造成维数灾难和破坏原始特征的结构信息。而已有的张量方法,MPCA、GTDA虽然得到了令人鼓舞的识别效果,但是识别性能仍有提升的空间。
发明内容
为了克服这些缺点,本发明的目的在于提供一种既能避免维数灾难,同时引入监督信息和Laplacian矩阵,优化类间Laplacian散度与类内Laplacian散度之差达到最大,可避免小样本问题,同时获得具有更高识别性能的多线性大间距的特征提取方法。
本发明是通过如下技术方案来实现的:
假设第m个训练样本用N阶张量表示,其中,R代表空间,In(n=1,…,N)为张量的“n-模式”的维数,那么M个训练样本集合可以表示为{χm,m=1,…,M},它们是张量空间中的张量;将张量空间映射到其中,Pn(n=1,…,N)表示降维后的张量的“n-模式”的维数,映射后的张量能捕捉到原始张量数据“变化”最大的方向用Laplacian散度之差来度量,即使类间Laplacian散度与类内Laplacian散度之差最大。
具体操作步骤如下:
(1)预处理阶段:利用MPCA方法对整个张量训练集进行降维处理,得到的特征记为
其中,是找到原始张量数据“变化”最大的方向投影后的张量,是寻找到的投影矩阵集合,其中Qn(n=1,…,N)表示张量经MPCA降维后的“n-模式”的维数,T为转置。图2所示是三阶张量的乘法。
(2)多线性大间距的投影矩阵初始化阶段:采用全投影的初始化方法,求J*的特征分解,得到其特征值按照从大到小排列,初始化投影矩阵由J*的前Pn个大的特征值对应的特征向量组成,
其中,为类间Lalacian散度初始化矩阵,为类内Laplacian散度初始化矩阵,为整体Laplacian散度初始化矩阵;
其中,角标(n)表示n模式,表示Pn×Pn大小的单位阵,表示Kronecker积,c表示样本集的类别数,Mi(i=1,…,c)表示第i类的样本数,Zm(n)表示第m个样本的n-模式矩阵,为样本集整体的n-模式均值矩阵
表示第i类第j个样本的n-模式矩阵,表示第i类n-模式的均值矩阵
为了保持张量的内在非线性流形结构,在散度矩阵中引入Laplacian矩阵的高斯相似度矩阵W,它其中的元素wij为
其中,σ是热核参数,zi和zj分别表示经MPCA降维后第i个张量样本和第j个张量样本的向量化结果,当i样本和j样本属于同一个类别,则计算||zi-zj||2;否则将||zi-zj||2置为+∞;D为对角矩阵,对角元素为
则Laplacian矩阵L
L=D-W(10)
第i类中第k个样本和第l个样本的Laplacian相似性为
其中,zk和zl分别表示和的向量化结果
第i类的相似度矩阵记为W(i),它其中的第k行第l列的元素是D(i)是第i类的对角阵,对角元素
第i类的Laplacian矩阵
则Laplacian矩阵Lw
Pn一般都是依据经验人为设定,此处通过约束条件n-模式截断后整体散度保留下来的前Pn个最大特征值之和与截断前全投影下的特征值之和的比值testQ(n)(n=1,…,N)来确定;
其中,是全投影下n-模式第i(n)个特征值;
为了简化testQ(n)(n=1,…,N)的选取问题,令testQ=testQ(1)=testQ(2)=…=testQ(N);
(3)循环迭代求得最优投影矩阵;固定其他所有投影矩阵不变,不断优化类间Laplacian散度与类内Laplacian散度之差J达到最大,直到求得n模式投影矩阵收敛为止;
其中,
迭代终止条件:保证迭代前后两次的每个模式(n=1,…,N)的投影矩阵ε是设定阈值,表示第t次迭代n-模式的投影矩阵
(4)计算投影后的张量:
(5)计算待测试样本χ′投影后张量和训练样本投影后形成新的训练集合的欧氏距离Dis,采用最近邻分类器测试识别;若
则χ′属于χm所在的类别,其中,||||F表示F范数;yi(i=1,…,M)表示训练样本集经式(20)得到的张量特征,y′对应χ′的最终的张量特征。
本发明的有益效果:本发明提供了一种多线性大间距的特征提取方法,不仅引入了监督信息,而且还引入了具有流形结构的Laplacian矩阵,优化类间Laplacian散度与类内Laplacian散度之差达到最大。该方法不仅在识别性能上有所改善,而且很好地克服了小样本问题。
附图说明
图1:本发明的流程图。
图2:张量乘法示例(以三阶张量乘法为例说明)。
图3:不同testQ时的识别率比较结果。
具体实施方式
下面结合附图与实施例对本发明作进一步说明。
一种多线性大间距的特征提取方法,具体操作步骤如下:
(1)预处理阶段:利用MPCA方法对整个张量训练集进行降维处理,得到的特征记为
其中,是找到原始张量数据“变化”最大的方向投影后的张量,是寻找到的投影矩阵集合,其中Qn(n=1,…,N)表示张量经MPCA降维后的“n-模式”的维数;T为转置;
(2)多线性大间距的投影矩阵初始化阶段:采用全投影的初始化方法,求J*的特征分解,得到其特征值按照从大到小排列,初始化投影矩阵由J*的前Pn个大的特征值对应的特征向量组成,
其中,为类间Lalacian散度初始化矩阵,为类内Laplacian散度初始化矩阵,为整体Laplacian散度初始化矩阵;
其中,角标(n)表示n模式,表示Pn×Pn大小的单位阵,表示Kronecker积,c表示样本集的类别数,Mi(i=1,…,c)表示第i类的样本数,Zm(n)表示第m个样本的n-模式矩阵,为样本集整体的n-模式均值矩阵
表示第i类第j个样本的n-模式矩阵,表示第i类n-模式的均值矩阵
为了保持张量的内在非线性流形结构,在散度矩阵中引入Laplacian矩阵的高斯相似度矩阵W,它其中的元素wij为
其中,σ是热核参数,zi和zj分别表示经MPCA降维后第i个张量样本和第j个张量样本的向量化结果,当i样本和j样本属于同一个类别,则计算||zi-zj||2;否则将||zi-zj||2置为+∞;D为对角矩阵,对角元素为
则Laplacian矩阵L
L=D-W(10)
第i类中第k个样本和第l个样本的Laplacian相似性为
其中,zk和zl分别表示和的向量化结果
第i类的相似度矩阵记为W(i),它其中的第k行第l列的元素是D(i)是第i类的对角阵,对角元素
第i类的Laplacian矩阵
则Laplacian矩阵Lw
Pn通过约束条件n-模式截断后整体散度保留下来的前Pn个最大特征值之和与截断前全投影下的特征值之和的比值testQ(n)(n=1,…,N)来确定;
其中,是全投影下n-模式第i(n)个特征值;
为了简化testQ(n)(n=1,…,N)的选取问题,令testQ=testQ(1)=testQ(2)=…=testQ(N);
(3)循环迭代求得最优投影矩阵;固定其他所有投影矩阵不变,不断优化类间Laplacian散度与类内Laplacian散度之差J达到最大,直到求得n模式投影矩阵收敛为止;
其中,
迭代终止条件:保证迭代前后两次的每个模式(n=1,…,N)的投影矩阵ε是设定阈值,表示第t次迭代n-模式的投影矩阵
(4)计算投影后的张量:
(5)计算待测试样本χ′投影后张量和训练样本投影后形成新的训练集合的欧氏距离Dis,采用最近邻分类器测试识别;若
则χ′属于χm所在的类别,其中,||||F表示F范数;yi(i=1,…,M)表示训练样本集经式(20)得到的张量特征,y′对应χ′的最终的张量特征。
实验的数据库选择的是CASIA(B)步态数据库,该库含有124个人,每人6个正常步态样本,对每个样本都提取视频流样本的一个周期的步态序列数据,选择前3个样本进行训练,后3个样本进行测试识别。本专利所提供的方法一般迭代5次就收敛到终止条件,所以操作中采用5次迭代即可。投影后张量保留的维数由testQ值确定,这样可简化维数保留的选择问题。实验中:σ=1。
如图3所示是本专利所提供的方法在不同testQ下的识别率曲线,可以看出:在testQ=96%时,该方法获得最佳的识别率为93.55%,此时张量的维数降为18x23x13。
表1是本专利所提供的方法与MPCA和GTDA方法在识别率、testQ和最终保留特征的维数上的比较结果。可以看出:本专利所提供的方法较MPCA和GTDA方法有更高的识别率,特征最终保留的维数也较MPCA低一些。
表一各种方法的比较
MPCA | GTDA | 本专利提供的方法 | |
识别率 | 92.74% | 90.59% | 93.55% |
testQ值 | 90% | 97% | 96% |
最终保留特征的维数 | 330 | 70 | 242 |
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。
Claims (1)
1.一种多线性大间距的特征提取方法,其特征是,假设第m个训练样本用N阶张量表示,其中,R代表空间,In(n=1,…,N)为张量的“n-模式”的维数,那么M个训练样本集合可以表示为它们是张量空间中的张量;将张量空间映射到 其中,Pn(n=1,…,N)表示降维后的张量的“n-模式”的维数,映射后的张量能捕捉到原始张量数据“变化”最大的方向用Laplacian散度之差来度量,即使类间Laplacian散度与类内Laplacian散度之差最大;
具体操作步骤如下:
(1)预处理阶段:利用多线性主成分分析MPCA方法对整个张量训练集进行降维处理,得到的特征记为
其中,是找到原始张量数据“变化”最大的方向投影后的张量,是寻找到的投影矩阵集合,其中Qn(n=1,…,N)表示张量经MPCA降维后的“n-模式”的维数;T为转置;×1,×2,×3…×N表示张量与矩阵的1,2,3...N模式的乘积;
(2)多线性大间距的投影矩阵初始化阶段:采用全投影的初始化方法,求J*的特征分解,得到其特征值按照从大到小排列,初始化投影矩阵由J*的前Pn个大的特征值对应的特征向量组成,
其中,为类间Laplacian散度初始化矩阵,为类内Laplacian散度初始化矩阵,为整体Laplacian散度初始化矩阵;
其中,角标(n)表示n模式,表示Pn×Pn大小的单位阵,表示Kronecker积,c表示样本集的类别数,Mi(i=1,…,c)表示第i类的样本数,Zm(n)表示第m个样本的n-模式矩阵,为样本集整体的n-模式均值矩阵
表示第i类第j个样本的n-模式矩阵,表示第i类n-模式的均值矩阵
为了保持张量的内在非线性流形结构,在散度矩阵中引入Laplacian矩阵的高斯相似度矩阵W,它其中的元素wij为
其中,σ是热核参数,zi和zj分别表示经MPCA降维后第i个张量样本和第j个张量样本的向量化结果,当i样本和j样本属于同一个类别,则计算||zi-zj||2;否则将||zi-zj||2置为+∞;D为对角矩阵,对角元素为
则Laplacian矩阵L
L=D-W(10)
第i类中第k个样本和第l个样本的Laplacian相似性为
其中,zk和zl分别表示和的向量化结果
第i类的相似度矩阵记为W(i),它其中的第k行第l列的元素是D(i)是第i类的对角阵,对角元素
第i类的Laplacian矩阵
则Laplacian矩阵Lw
Pn通过约束条件n-模式截断后整体散度保留下来的前Pn个最大特征值之和与截断前全投影下的特征值之和的比值testQ(n)(n=1,…,N)来确定;
其中,是全投影下n-模式第i(n)个特征值;
为了简化testQ(n)(n=1,…,N)的选取问题,令testQ=testQ(1)=testQ(2)=…=testQ(N);
(3)循环迭代求得最优投影矩阵;固定其他所有投影矩阵不变,不断优化类间Laplacian散度与类内Laplacian散度之差J达到最大,直到求得n模式投影矩阵收敛为止;
其中,
迭代终止条件:保证迭代前后两次的每个模式(n=1,…,N)的投影矩阵ε是设定阈值,表示第t次迭代n-模式的投影矩阵
(4)计算投影后的张量:
(5)计算待测试样本投影后张量和训练样本投影后形成新的训练集合的欧氏距离Dis,采用最近邻分类器测试识别;若
则属于所在的类别,其中,||||F表示F范数;表示训练样本集经式(20)得到的张量特征,对应的最终的张量特征。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310176389.0A CN103218617B (zh) | 2013-05-13 | 2013-05-13 | 一种多线性大间距的特征提取方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310176389.0A CN103218617B (zh) | 2013-05-13 | 2013-05-13 | 一种多线性大间距的特征提取方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103218617A CN103218617A (zh) | 2013-07-24 |
CN103218617B true CN103218617B (zh) | 2015-12-23 |
Family
ID=48816386
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310176389.0A Expired - Fee Related CN103218617B (zh) | 2013-05-13 | 2013-05-13 | 一种多线性大间距的特征提取方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103218617B (zh) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104318521A (zh) * | 2014-09-29 | 2015-01-28 | 北京理工大学 | 多线性子空间学习的医疗图像去噪方法 |
CN105389560B (zh) * | 2015-11-13 | 2018-05-11 | 东北师范大学 | 基于局部约束的图优化维数约简方法 |
CN106096532B (zh) * | 2016-06-03 | 2019-08-09 | 山东大学 | 一种基于张量联立判别分析的跨视角步态识别方法 |
CN106203321B (zh) * | 2016-07-06 | 2019-11-05 | 深圳先进技术研究院 | 一种步态识别方法及系统 |
CN106529435B (zh) * | 2016-10-24 | 2019-10-15 | 天津大学 | 基于张量量化的动作识别方法 |
CN106778837B (zh) * | 2016-11-29 | 2019-05-31 | 浙江工业大学 | 基于多线性主成分分析和张量分析的sar图像目标识别方法 |
CN110110673B (zh) * | 2019-05-10 | 2020-11-27 | 杭州电子科技大学 | 一种基于双向2dpca和级联前向神经网络的人脸识别方法 |
CN113836757A (zh) * | 2021-11-30 | 2021-12-24 | 滨州学院 | 有监督特征选择方法、装置以及电子设备 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7457749B2 (en) * | 2002-06-25 | 2008-11-25 | Microsoft Corporation | Noise-robust feature extraction using multi-layer principal component analysis |
-
2013
- 2013-05-13 CN CN201310176389.0A patent/CN103218617B/zh not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7457749B2 (en) * | 2002-06-25 | 2008-11-25 | Microsoft Corporation | Noise-robust feature extraction using multi-layer principal component analysis |
Non-Patent Citations (3)
Title |
---|
Two linear subpattern dimensionality reduction algorithms;BEN Xian-ye等;《Journal of Harbin Institute of Technology》;20121015;第47-53页 * |
基于线性插值的张量步态识别算法;贲晛烨等;《计算机应用研究》;20120115;第29卷(第1期);第356页 * |
拉普拉斯最大最小判别分析及应用;郑忠龙等;《电子学报》;20100415;第38卷(第4期);第860-864、859页 * |
Also Published As
Publication number | Publication date |
---|---|
CN103218617A (zh) | 2013-07-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103218617B (zh) | 一种多线性大间距的特征提取方法 | |
CN107316013B (zh) | 基于nsct变换和dcnn的高光谱图像分类方法 | |
Luo et al. | Pedestrian parsing via deep decompositional network | |
CN103605985B (zh) | 一种基于张量全局‑局部保持投影的数据降维的人脸识别方法 | |
CN103605952B (zh) | 基于拉普拉斯正则组稀疏的人体行为识别方法 | |
CN103530657B (zh) | 一种基于加权l2抽取深度学习人脸识别方法 | |
CN105678261B (zh) | 基于有监督图的直推式数据降维方法 | |
CN111931505A (zh) | 一种基于子图嵌入的跨语言实体对齐方法 | |
CN103164689A (zh) | 人脸识别方法及系统 | |
CN103745205A (zh) | 一种基于多线性均值成分分析的步态识别方法 | |
CN104700089A (zh) | 一种基于Gabor小波和SB2DLPP的人脸识别方法 | |
CN104636732A (zh) | 一种基于序列深信度网络的行人识别方法 | |
CN103065158A (zh) | 基于相对梯度的isa模型的行为识别方法 | |
CN105631478A (zh) | 基于稀疏表示字典学习的植物分类方法 | |
CN104966090A (zh) | 实现面向图像理解的视觉单词生成和评价的系统及方法 | |
CN104268507A (zh) | 一种基于rgb-d图像的手语字母识别方法 | |
CN101515328A (zh) | 一种面向鉴别的具有统计不相关性的局部保持投影方法 | |
Tan et al. | L1-norm latent SVM for compact features in object detection | |
CN104156628A (zh) | 一种基于多核学习判别分析的舰船辐射信号识别方法 | |
Zhou et al. | Hierarchical palmprint feature extraction and recognition based on multi‐wavelets and complex network | |
CN104915400B (zh) | 基于彩色直方图和nsct的模糊相关同步图像检索方法 | |
CN103714340A (zh) | 基于图像分块的自适应特征提取方法 | |
CN106803105B (zh) | 一种基于稀疏表示字典学习的图像分类方法 | |
CN106022359A (zh) | 基于有序信息熵的模糊熵空间聚类分析方法 | |
CN102982342B (zh) | 基于拉格朗日对偶的半正定谱聚类方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20151223 Termination date: 20160513 |
|
CF01 | Termination of patent right due to non-payment of annual fee |