CN103034869A - 一种邻域自适应的局部保持投影方法 - Google Patents

一种邻域自适应的局部保持投影方法 Download PDF

Info

Publication number
CN103034869A
CN103034869A CN2012105182204A CN201210518220A CN103034869A CN 103034869 A CN103034869 A CN 103034869A CN 2012105182204 A CN2012105182204 A CN 2012105182204A CN 201210518220 A CN201210518220 A CN 201210518220A CN 103034869 A CN103034869 A CN 103034869A
Authority
CN
China
Prior art keywords
point
nearest neighbor
nearest
neighborhood
sample point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012105182204A
Other languages
English (en)
Other versions
CN103034869B (zh
Inventor
蒋云良
胡文军
成新民
王娟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huzhou University
Original Assignee
Huzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huzhou University filed Critical Huzhou University
Priority to CN201210518220.4A priority Critical patent/CN103034869B/zh
Publication of CN103034869A publication Critical patent/CN103034869A/zh
Application granted granted Critical
Publication of CN103034869B publication Critical patent/CN103034869B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种邻域自适应的局部保持投影方法,主要包括计算每个样本点xi的最近邻点zi或最近邻域εi,找出每个样本点xi的最近邻点N(xi),计算近邻图的权矩阵W,计算对角矩阵和拉普拉斯矩阵L=D-W等步骤。本发明主要以局部保持投影作为研究对象,在此基础上通过估计样本点的最近邻点或最近邻域,进而发明了邻域自适应的局部保持投影方法,即LPPANS方法。本发明不需要设置一个合适的近邻大小,而只要设置样本点的最小最近邻点个数kmin,局部保持投影就会自动匹配数据潜在流行的局部几何结构,使局部保持投影算法能够自动根据数据集的分布构建近邻图,从而更加有效地实现降维。

Description

一种邻域自适应的局部保持投影方法
【技术领域】
本发明涉及特征提取的方法,具体涉及一种邻域自适应的局部保持投影方法。
【背景技术】
在模式识别、信息融合、文本分类、计算视觉和数据挖掘等应用领域,常常会碰到许多高维数据,处理高维数据需要很长的时间和非常大的存储空间,因此,在进行诸如分类、聚类任务前,需要对高维数据进行降维预处理,常见的两种降维方法是特征选择和特征提取。
目前,己出现了多种特征选择方法,如主成分分析、线性鉴别分析等,主成分分析是一种无监督的降维方法,其目的是找出一组正交基,并在该组正交基空间下捕获数据的全局信息;线性鉴别分析是一种监督的降维方法,其目的通过最大类问散布矩阵和最小类内散布矩阵获得数据的一个变换子空间。另外,基于流行学习方法,提出了ISOMAP、拉普拉斯特征映射、局部线性嵌入和局部保持投影等降维方法,ISOMAP和拉普拉斯特征映射属于非线性算法,而局部线性嵌入和局部保持投影是属于线性算法。一般来说,基于流行学习的降维方法的核心思想是通过局部不变性来检测数据潜在的流行结构以便获得数据的低维表示,另外,这种局部不变性通常使用一个近邻图来保证,但什么样的近邻图是合适的、多大才算是局部成为了难题,具体来说,如何选择合适的近邻大小来构建近邻图以便匹配流行的局部几何结构成为有效降维的关键。
【发明内容】
本发明的目的是解决邻域大小自动选择的问题,并集成到局部保持投影算法中,使局部保持投影算法能够自动根据数据集的分布构建近邻图,实现有效降维。
为实现上述目的,本发明提出了一种邻域自适应的局部保持投影方法,包含如下步骤:
A)计算每个样本点xi的最近邻点zi或最近邻域εi
B)找出每个样本点xi的最近邻点N(xi);
C)计算近邻图的权矩阵w;
D)计算对角矩阵
Figure BDA00002530420100011
和拉普拉斯矩阵L=D-w;
E)计算特征问题XLXTv=λXDXTv的特征值和特征向量,  其中
Figure BDA00002530420100012
F)根据E)步骤中所得的特征值的大小,依次输出d个最小特征值对应的特征向量V=[v1,Λ,vd];
G)根据F)步骤中所得的特征向量V对每个样本点进行降维,获得低维数据Y=VTX,其中
Figure BDA00002530420100021
作为优选,所述A)步骤中所计算的是:每个样本点xi的最近邻点zi
z i = E x i ~ x ~ i ( x j ) = Σ x j ∈ x ~ i p ( x j ) x j , - - - ( 1 )
其中,所述xi为样本点,所述l≤i≤N,所述 x ~ i = [ x 1 , Λ , x i - 1 , x i + 1 , Λ , x N ] ,
Figure BDA00002530420100024
Figure BDA00002530420100025
是xj依据的数学期望,p(xj)指xj是xi最近邻点的概率。
作为优选,所述所述kσ(xi,xj)是带宽为σ的核函数。
作为优选,所述满足‖xi-xj‖≤‖xi-zi‖的所有样本点均为xi的最近邻点。
作为优选,所述A)步骤中所计算的是:每个样本点xi的最近邻域εi
ϵ i = E x i ~ x ~ i ( | | x j - x i | | 2 ) = Σ x j ∈ x ~ i p ( x j ) | | x j - x i | | 2 - - - ( 2 )
其中,所述xi为样本点,所述1≤i≤N,所述 x ~ i = [ x 1 , Λ , x i - 1 , x i + 1 , Λ , x N ] ,
Figure BDA000025304201000210
E x i ~ x ~ i ( | | x j - x i | | 2 ) 是‖xj-xi2依据
Figure BDA000025304201000212
的数学期望。
作为优选,所述满足‖xi-xj2≤εi的所有样本点均为xi的最近邻点。
作为优选,所述若所得出的最近邻点个数不足规定的最小最近邻点个数kmin,则通过欧式距离找出其他近邻点直至kmin个。
本发明的优点是:本发明与基于流行学习的降维方法相比,不需要设置一个合适的近邻大小,而只要设置样本点的最小最近邻点个数kmin,即能够自动选择每个样本点的最近邻点个数,自动匹配数据潜在流行的局部几何结构,并集成到局部保持投影算法中,使局部保持投影算法能够自动根据数据集的分布构建近邻图,实现有效降维。
【附图说明】
图l是本发明一种邻域自适应的局部保持投影方法的应用示意图。
图2是本发明一种邻域自适应的局部保持投影方法得到的分类性能于COIL20数据集的示意图。
图3是本发明一种邻域自适应的局部保持投影方法得到的聚类性能于PIE数据集的示意图,其中图3-a是本发明得到的聚类性能于PIE数据集5类的示意图;其中图3-b是本发明得到的聚类性能于PIE数据集lO类的示意图;其中图3-c是本发明得到的聚类性能于PIE数据集20类的示意图;其中图3-d是本发明得到的聚类性能于PIE数据集30类的示意图;其中图3-e是本发明得到的聚类性能于PIE数据集40类的示意图;其中图3-f是本发明得到的聚类性能于PIE数据集50类的示意图;其中图3-g是本发明得到的聚类性能于PIE数据集60类的示意图;其中图3-h是本发明得到的聚类性能于PIE数据集68类的示意图。
【具体实施方式】
实施例一
在真实的COIL20数据集数据集上,利用本发明进行降维,然后再进行分类任务。参阅图1:本发明一种邻域自适应的局部保持投影方法,有两种方法,方法一包含如下步骤:
A)计算每个样本点xi的最近邻点zi
z i = E x i ~ x ~ i ( x j ) = Σ x j ∈ x ~ i p ( x j ) x j - - - ( 1 ) ,
其中,所述xi为样本点,所述1≤i≤N,所述 x ~ i = [ x 1 , Λ , x i - 1 , x i + 1 , Λ , x N ] ,
Figure BDA00002530420100033
Figure BDA00002530420100034
是xj依据
Figure BDA00002530420100035
的数学期望,p(xj)指xj是xi最近邻点的概率,所述
Figure BDA00002530420100036
所述kσ(xi,xj)是带宽为σ的核函数,所述满足‖xi-xj‖≤‖xi-zi‖的所有样本点均为xi的最近邻点,若所得出的最近邻点个数不足规定的最小最近邻点个数kmin,则通过欧式距离找出其他近邻点直至kmin个;
B)找出每个样本点xi的最近邻点N(xi);
C)计算近邻图的权矩阵W,采用0-1权计算近邻图的权矩阵W
即:
D)计算对角矩阵
Figure BDA00002530420100038
和拉普拉斯矩阵L=D-W;
E)计算特征问题XLXTv=λXDXTv的特征值和特征向量,其中
Figure BDA00002530420100039
F)根据E)步骤中所得的特征值的大小,依次输出d个最小特征值对应的特征向量V=[v1,Λ,vd];
G)根据F)步骤中所得的特征向量V对每个样本点进行降维,获得低维数据Y=VTX,其中
方法二包含如下步骤:
A)计算每个样本点xi的最近邻点zi或最近邻域εi
B)找出每个样本点xi的最近邻点N(xi);
C)计算近邻图的权矩阵W,采用0-1权计算近邻图的权矩阵W
即:
Figure BDA000025304201000311
D)计算对角矩阵
Figure BDA000025304201000312
和拉普拉斯矩阵L=D-W;
E)计算特征问题XLXTv=λXDXTv的特征值和特征向量,其中
Figure BDA00002530420100041
F)根据E)步骤中所得的特征值的大小,依次输出d个最小特征值对应的特征向量V=[v1,Λ,vd];
G)根据F)步骤中所得的特征向量V对每个样本点进行降维,获得低维数据Y=VTX,其中
ϵ i = E x i ~ x ~ i ( | | x j - x i | | 2 ) = Σ x j ∈ x ~ i p ( x j ) | | x j - x i | | 2 - - - ( 2 ) ;
然后执行后续任务。
其中,所述xi为样本点,所述1≤i≤N,所述 x ~ i = [ x 1 , Λ , x i - 1 , x i + 1 , Λ , x N ] ,
Figure BDA00002530420100045
Figure BDA00002530420100046
是‖xj-xi||2依据
Figure BDA00002530420100047
的数学期望,所述满足‖xi-xj||2≤εi的所有样本点均为xi的最近邻点,若所得出的最近邻点个数不足规定的最小最近邻点个数kmin,则通过欧式距离找出其他近邻点直至kmin个。
如图2所示(LPPANS对应本发明方法),由于本发明自动匹配数据潜在流行的局部几何结构,使得1-NN分类器在低维数据上就可以获得好的分类性能。
实施例2
在真实的PIE数据集上,利用本发明进行降维,然后再进行聚类任务。
参阅图1:本发明一种邻域自适应的局部保持投影方法,有两种方法,方法一包含如下步骤:
A)计算每个样本点xi的最近邻点zi
z i = E x i ~ x ~ i ( x j ) = Σ x j ∈ x ~ i p ( x j ) x j - - - ( 1 ) ,
其中,所述xi为样本点,所述1≤i≤N,所述 x ~ i = [ x 1 , Λ , x i - 1 , x i + 1 , Λ , x N ] ,
Figure BDA000025304201000410
是xj依据
Figure BDA000025304201000412
的数学期望,p(xj)指xj是xi最近邻点的概率,所述
Figure BDA000025304201000413
所述kσ(xi,xj)是带宽为σ的核函数,所述满足‖xi-xj‖≤‖xi-zi‖的所有样本点均为xi的最近邻点,若所得出的最近邻点个数不足规定的最小最近邻点个数kmin,则通过欧式距离找出其他近邻点直至kmin个;
B)找出每个样本点xi的最近邻点N(xi);
C)计算近邻图的权矩阵W,采用0-1权计算近邻图的权矩阵W
即:
Figure BDA000025304201000414
D)计算对角矩阵
Figure BDA00002530420100051
和拉普拉斯矩阵L=D-W;
E)计算特征问题XLXTv=λXDXTv的特征值和特征向量,其中
Figure BDA00002530420100052
F)根据E)步骤中所得的特征值的大小,依次输出d个最小特征值对应的特征向量V=[v1,Λ,vd];
G)根据F)步骤中所得的特征向量V对每个样本点进行降维,获得低维数据Y=VTX,其中
方法二包含如下步骤:
A)计算每个样本点xi的最近邻点zi或最近邻域εi
B)找出每个样本点xi的最近邻点N(xi);
C)计算近邻图的权矩阵W,采用0-1权计算近邻图的权矩阵W即:
Figure BDA00002530420100054
D)计算对角矩阵
Figure BDA00002530420100055
和拉普拉斯矩阵L=D-W;
E)计算特征问题XLXTv=λXDXTv的特征值和特征向量,其中
Figure BDA00002530420100056
F)根据E)步骤中所得的特征值的大小,依次输出d个最小特征值对应的特征向量V=[v1,Λ,vd];
G)根据F)步骤中所得的特征向量V对每个样本点进行降维,获得低维数据Y=VTX,其中
ϵ i = E x i ~ x ~ i ( | | x j - x i | | 2 ) = Σ x j ∈ x ~ i p ( x j ) | | x j - x i | | 2 - - - ( 2 ) ;
然后执行后续任务。
其中,所述xi为样本点,所述1≤i≤N,所述 x ~ i = [ x 1 , Λ , x i - 1 , x i + 1 , Λ , x N ] ,
Figure BDA000025304201000511
是||xj-xi||2依据的数学期望,所述满足‖xi-xj2≤εi的所有样本点均为xi的最近邻点,若所得出的最近邻点个数不足规定的最小最近邻点个数kmin,则通过欧式距离找出其他近邻点直至kmin
参阅图3-a~图3-h:即LPPANS对应本发明方法,由于本发明自动匹配数据潜在流行的局部几何结构,使得K-Means聚类方法在低维数据上就可以获得好的聚类性能。
上述实施例是对本发明的说明,不是对本发明的限定,任何对本发明简单变换后的方案均属于本发明的保护范围。

Claims (7)

1.一种邻域自适应的局部保持投影方法,其特征在于:包含如下步骤:
A)计算每个样本点xi的最近邻点zi或最近邻域εi
B)找出每个样本点xi的最近邻点N(xi);
C)计算近邻图的权矩阵W,采用0-1权计算近邻图的权矩阵W即:
Figure FDA00002530420000011
D)计算对角矩阵
Figure FDA00002530420000012
和拉普拉斯矩阵L=D-W;
E)计算特征问题XLXTv=λXDXTv的特征值和特征向量,其中
Figure FDA00002530420000013
F)根据E)步骤中所得的特征值的大小,依次输出d个最小特征值对应的特征向量V=[v1,Λ,vd];
G)根据F)步骤中所得的特征向量V对每个样本点进行降维,获得低维数据Y=VTX,其中
2.如权利要求1所述的一种邻域自适应的局部保持投影方法,其特征在于:所述A)步骤中所计算的是:每个样本点xi的最近邻点zi
z i = E x i ~ X ~ i ( x j ) = Σ x j ∈ X ~ i p ( x j ) x j , - - - ( 1 )
其中,所述xi为样本点,所述1≤i≤N,所述
Figure FDA00002530420000016
Figure FDA00002530420000017
Figure FDA00002530420000018
是xj依据
Figure FDA00002530420000019
的数学期望,p(xj)指xj是xi最近邻点的概率。
3.如权利要求2所述的一种邻域自适应的局部保持投影方法,其特征在于:所述
Figure FDA000025304200000110
所述kσ(xi,xj)是带宽为σ的核函数。
4.如权利要求2所述的一种邻域自适应的局部保持投影方法,其特征在于:所述满足||xi-xj||≤||xi-zi||的所有样本点均为xi的最近邻点。
5.如权利要求1所述的一种邻域自适应的局部保持投影方法,其特征在于:所述A)步骤中所计算的是:每个样本点xi的最近邻域εi
ϵ i = E x i ~ X ~ i ( | | x j - x i | | 2 ) = Σ x j ∈ X ~ i p ( x j ) | | x j - x i | | 2 - - - ( 2 )
其中,所述xi为样本点,所述1≤i≤N,所述
Figure FDA000025304200000112
Figure FDA000025304200000113
Figure FDA000025304200000114
是||xj-xi||2依据
Figure FDA000025304200000115
的数学期望。
6.如权利要求5所述的一种邻域自适应的局部保持投影方法,其特征在于:所述满足||xi-xj||2≤εi的所有样本点均为xi的最近邻点。
7.如权利要求1至6中任一项所述的一种邻域自适应的局部保持投影方法,其特征在于:若所得出的最近邻点个数不足规定的最小最近邻点个数kmin,则通过欧式距离找出其他近邻点直至kmin个。
CN201210518220.4A 2012-12-05 2012-12-05 一种邻域自适应的局部保持投影方法 Active CN103034869B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210518220.4A CN103034869B (zh) 2012-12-05 2012-12-05 一种邻域自适应的局部保持投影方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210518220.4A CN103034869B (zh) 2012-12-05 2012-12-05 一种邻域自适应的局部保持投影方法

Publications (2)

Publication Number Publication Date
CN103034869A true CN103034869A (zh) 2013-04-10
CN103034869B CN103034869B (zh) 2015-05-06

Family

ID=48021747

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210518220.4A Active CN103034869B (zh) 2012-12-05 2012-12-05 一种邻域自适应的局部保持投影方法

Country Status (1)

Country Link
CN (1) CN103034869B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103605985A (zh) * 2013-11-15 2014-02-26 浙江工业大学 一种基于张量全局-局部保持投影的数据降维方法
CN103605889A (zh) * 2013-11-13 2014-02-26 浙江工业大学 一种基于数据全局-局部结构保持投影的数据降维方法
CN104063717A (zh) * 2014-07-09 2014-09-24 哈尔滨工业大学 局部结构保持的全局监督图嵌入复杂系统监测数据可视化方法
CN104483962A (zh) * 2014-11-20 2015-04-01 沈阳化工大学 基于多向正交局部保持投影的间歇过程在线故障检测方法
CN106897730A (zh) * 2016-12-30 2017-06-27 陕西师范大学 基于融合类别信息与局部保持投影的sar目标型号识别方法
CN108388918A (zh) * 2018-02-28 2018-08-10 中国科学院西安光学精密机械研究所 具有结构保持特性的数据特征选择方法
CN110263777A (zh) * 2019-06-26 2019-09-20 中国人民解放军火箭军工程大学 基于空谱结合的局部保持投影算法的目标检测方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101369316A (zh) * 2008-07-09 2009-02-18 东华大学 基于全局和局部结构融合的图像特征提取方法
CN101819629A (zh) * 2010-04-08 2010-09-01 西京学院 一种基于监督张量流形学习的掌纹识别系统及识别方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101369316A (zh) * 2008-07-09 2009-02-18 东华大学 基于全局和局部结构融合的图像特征提取方法
CN101819629A (zh) * 2010-04-08 2010-09-01 西京学院 一种基于监督张量流形学习的掌纹识别系统及识别方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王立志等: "基于MFA与kNNS算法的高光谱遥感影像分类", 《计算机科学》 *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103605889A (zh) * 2013-11-13 2014-02-26 浙江工业大学 一种基于数据全局-局部结构保持投影的数据降维方法
CN103605985A (zh) * 2013-11-15 2014-02-26 浙江工业大学 一种基于张量全局-局部保持投影的数据降维方法
CN103605985B (zh) * 2013-11-15 2017-02-01 浙江工业大学 一种基于张量全局‑局部保持投影的数据降维的人脸识别方法
CN104063717A (zh) * 2014-07-09 2014-09-24 哈尔滨工业大学 局部结构保持的全局监督图嵌入复杂系统监测数据可视化方法
CN104063717B (zh) * 2014-07-09 2017-03-22 哈尔滨工业大学 局部结构保持的全局监督图嵌入复杂系统监测数据可视化方法
CN104483962A (zh) * 2014-11-20 2015-04-01 沈阳化工大学 基于多向正交局部保持投影的间歇过程在线故障检测方法
CN104483962B (zh) * 2014-11-20 2017-06-16 沈阳化工大学 基于多向正交局部保持投影的间歇过程在线故障检测方法
CN106897730A (zh) * 2016-12-30 2017-06-27 陕西师范大学 基于融合类别信息与局部保持投影的sar目标型号识别方法
CN106897730B (zh) * 2016-12-30 2020-04-10 陕西师范大学 基于融合类别信息与局部保持投影的sar目标型号识别方法
CN108388918A (zh) * 2018-02-28 2018-08-10 中国科学院西安光学精密机械研究所 具有结构保持特性的数据特征选择方法
CN108388918B (zh) * 2018-02-28 2020-06-12 中国科学院西安光学精密机械研究所 具有结构保持特性的数据特征选择方法
CN110263777A (zh) * 2019-06-26 2019-09-20 中国人民解放军火箭军工程大学 基于空谱结合的局部保持投影算法的目标检测方法及系统

Also Published As

Publication number Publication date
CN103034869B (zh) 2015-05-06

Similar Documents

Publication Publication Date Title
CN103034869B (zh) 一种邻域自适应的局部保持投影方法
CN111881714B (zh) 一种无监督跨域行人再识别方法
Sun et al. Large-scale web video event classification by use of fisher vectors
CN105184303B (zh) 一种基于多模态深度学习的图像标注方法
Zhang et al. Dimension reduction using semi-supervised locally linear embedding for plant leaf classification
CN104317902B (zh) 基于局部保持迭代量化哈希的图像检索方法
CN104112018B (zh) 一种大规模图像检索方法
CN104899549A (zh) 基于距离像时频图鉴别字典学习的sar目标识别方法
CN105279554A (zh) 基于哈希编码层的深度神经网络的训练方法及装置
CN107832458A (zh) 一种字符级的基于嵌套深度网络的文本分类方法
CN103164701B (zh) 手写体数字识别方法及装置
Chen et al. Hyperspectral face recognition via feature extraction and CRC‐based classifier
CN103258210A (zh) 一种基于字典学习的高清图像分类方法
CN103605985A (zh) 一种基于张量全局-局部保持投影的数据降维方法
CN109739999A (zh) 一种高效的果蝇神经网络哈希搜索wmsn数据方法
CN109711483A (zh) 一种基于Sparse Autoencoder的电力系统运行方式聚类方法
Park A feature selection method using hierarchical clustering
Shang et al. Object recognition using rotation invariant local binary pattern of significant bit planes
CN101877065B (zh) 小样本条件下的人脸图像非线性鉴别特征抽取和识别方法
Zhang et al. Few-shot bearing fault diagnosis based on meta-learning with discriminant space optimization
CN108805280A (zh) 一种图像检索的方法和装置
CN102902984A (zh) 基于局部一致性的遥感影像半监督投影降维方法
Mengash et al. Search and Rescue Optimization with Machine Learning Enabled Cybersecurity Model.
Javan et al. On-line voltage and power flow contingencies ranking using enhanced radial basis function neural network and kernel principal component analysis
CN102982346B (zh) 一种最小最大局部结构信息的特征选择方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant