CN103034869A - 一种邻域自适应的局部保持投影方法 - Google Patents
一种邻域自适应的局部保持投影方法 Download PDFInfo
- Publication number
- CN103034869A CN103034869A CN2012105182204A CN201210518220A CN103034869A CN 103034869 A CN103034869 A CN 103034869A CN 2012105182204 A CN2012105182204 A CN 2012105182204A CN 201210518220 A CN201210518220 A CN 201210518220A CN 103034869 A CN103034869 A CN 103034869A
- Authority
- CN
- China
- Prior art keywords
- point
- nearest neighbor
- nearest
- neighborhood
- sample point
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种邻域自适应的局部保持投影方法,主要包括计算每个样本点xi的最近邻点zi或最近邻域εi,找出每个样本点xi的最近邻点N(xi),计算近邻图的权矩阵W,计算对角矩阵和拉普拉斯矩阵L=D-W等步骤。本发明主要以局部保持投影作为研究对象,在此基础上通过估计样本点的最近邻点或最近邻域,进而发明了邻域自适应的局部保持投影方法,即LPPANS方法。本发明不需要设置一个合适的近邻大小,而只要设置样本点的最小最近邻点个数kmin,局部保持投影就会自动匹配数据潜在流行的局部几何结构,使局部保持投影算法能够自动根据数据集的分布构建近邻图,从而更加有效地实现降维。
Description
【技术领域】
本发明涉及特征提取的方法,具体涉及一种邻域自适应的局部保持投影方法。
【背景技术】
在模式识别、信息融合、文本分类、计算视觉和数据挖掘等应用领域,常常会碰到许多高维数据,处理高维数据需要很长的时间和非常大的存储空间,因此,在进行诸如分类、聚类任务前,需要对高维数据进行降维预处理,常见的两种降维方法是特征选择和特征提取。
目前,己出现了多种特征选择方法,如主成分分析、线性鉴别分析等,主成分分析是一种无监督的降维方法,其目的是找出一组正交基,并在该组正交基空间下捕获数据的全局信息;线性鉴别分析是一种监督的降维方法,其目的通过最大类问散布矩阵和最小类内散布矩阵获得数据的一个变换子空间。另外,基于流行学习方法,提出了ISOMAP、拉普拉斯特征映射、局部线性嵌入和局部保持投影等降维方法,ISOMAP和拉普拉斯特征映射属于非线性算法,而局部线性嵌入和局部保持投影是属于线性算法。一般来说,基于流行学习的降维方法的核心思想是通过局部不变性来检测数据潜在的流行结构以便获得数据的低维表示,另外,这种局部不变性通常使用一个近邻图来保证,但什么样的近邻图是合适的、多大才算是局部成为了难题,具体来说,如何选择合适的近邻大小来构建近邻图以便匹配流行的局部几何结构成为有效降维的关键。
【发明内容】
本发明的目的是解决邻域大小自动选择的问题,并集成到局部保持投影算法中,使局部保持投影算法能够自动根据数据集的分布构建近邻图,实现有效降维。
为实现上述目的,本发明提出了一种邻域自适应的局部保持投影方法,包含如下步骤:
A)计算每个样本点xi的最近邻点zi或最近邻域εi;
B)找出每个样本点xi的最近邻点N(xi);
C)计算近邻图的权矩阵w;
F)根据E)步骤中所得的特征值的大小,依次输出d个最小特征值对应的特征向量V=[v1,Λ,vd];
作为优选,所述A)步骤中所计算的是:每个样本点xi的最近邻点zi,
且
作为优选,所述所述kσ(xi,xj)是带宽为σ的核函数。
作为优选,所述满足‖xi-xj‖≤‖xi-zi‖的所有样本点均为xi的最近邻点。
作为优选,所述A)步骤中所计算的是:每个样本点xi的最近邻域εi,
且
作为优选,所述满足‖xi-xj‖2≤εi的所有样本点均为xi的最近邻点。
作为优选,所述若所得出的最近邻点个数不足规定的最小最近邻点个数kmin,则通过欧式距离找出其他近邻点直至kmin个。
本发明的优点是:本发明与基于流行学习的降维方法相比,不需要设置一个合适的近邻大小,而只要设置样本点的最小最近邻点个数kmin,即能够自动选择每个样本点的最近邻点个数,自动匹配数据潜在流行的局部几何结构,并集成到局部保持投影算法中,使局部保持投影算法能够自动根据数据集的分布构建近邻图,实现有效降维。
【附图说明】
图l是本发明一种邻域自适应的局部保持投影方法的应用示意图。
图2是本发明一种邻域自适应的局部保持投影方法得到的分类性能于COIL20数据集的示意图。
图3是本发明一种邻域自适应的局部保持投影方法得到的聚类性能于PIE数据集的示意图,其中图3-a是本发明得到的聚类性能于PIE数据集5类的示意图;其中图3-b是本发明得到的聚类性能于PIE数据集lO类的示意图;其中图3-c是本发明得到的聚类性能于PIE数据集20类的示意图;其中图3-d是本发明得到的聚类性能于PIE数据集30类的示意图;其中图3-e是本发明得到的聚类性能于PIE数据集40类的示意图;其中图3-f是本发明得到的聚类性能于PIE数据集50类的示意图;其中图3-g是本发明得到的聚类性能于PIE数据集60类的示意图;其中图3-h是本发明得到的聚类性能于PIE数据集68类的示意图。
【具体实施方式】
实施例一
在真实的COIL20数据集数据集上,利用本发明进行降维,然后再进行分类任务。参阅图1:本发明一种邻域自适应的局部保持投影方法,有两种方法,方法一包含如下步骤:
A)计算每个样本点xi的最近邻点zi,
且
其中,所述xi为样本点,所述1≤i≤N,所述 是xj依据的数学期望,p(xj)指xj是xi最近邻点的概率,所述所述kσ(xi,xj)是带宽为σ的核函数,所述满足‖xi-xj‖≤‖xi-zi‖的所有样本点均为xi的最近邻点,若所得出的最近邻点个数不足规定的最小最近邻点个数kmin,则通过欧式距离找出其他近邻点直至kmin个;
B)找出每个样本点xi的最近邻点N(xi);
C)计算近邻图的权矩阵W,采用0-1权计算近邻图的权矩阵W
即:
F)根据E)步骤中所得的特征值的大小,依次输出d个最小特征值对应的特征向量V=[v1,Λ,vd];
G)根据F)步骤中所得的特征向量V对每个样本点进行降维,获得低维数据Y=VTX,其中
方法二包含如下步骤:
A)计算每个样本点xi的最近邻点zi或最近邻域εi;
B)找出每个样本点xi的最近邻点N(xi);
C)计算近邻图的权矩阵W,采用0-1权计算近邻图的权矩阵W
F)根据E)步骤中所得的特征值的大小,依次输出d个最小特征值对应的特征向量V=[v1,Λ,vd];
G)根据F)步骤中所得的特征向量V对每个样本点进行降维,获得低维数据Y=VTX,其中
且
然后执行后续任务。
其中,所述xi为样本点,所述1≤i≤N,所述 是‖xj-xi||2依据的数学期望,所述满足‖xi-xj||2≤εi的所有样本点均为xi的最近邻点,若所得出的最近邻点个数不足规定的最小最近邻点个数kmin,则通过欧式距离找出其他近邻点直至kmin个。
如图2所示(LPPANS对应本发明方法),由于本发明自动匹配数据潜在流行的局部几何结构,使得1-NN分类器在低维数据上就可以获得好的分类性能。
实施例2
在真实的PIE数据集上,利用本发明进行降维,然后再进行聚类任务。
参阅图1:本发明一种邻域自适应的局部保持投影方法,有两种方法,方法一包含如下步骤:
A)计算每个样本点xi的最近邻点zi,
且
其中,所述xi为样本点,所述1≤i≤N,所述 是xj依据的数学期望,p(xj)指xj是xi最近邻点的概率,所述所述kσ(xi,xj)是带宽为σ的核函数,所述满足‖xi-xj‖≤‖xi-zi‖的所有样本点均为xi的最近邻点,若所得出的最近邻点个数不足规定的最小最近邻点个数kmin,则通过欧式距离找出其他近邻点直至kmin个;
B)找出每个样本点xi的最近邻点N(xi);
C)计算近邻图的权矩阵W,采用0-1权计算近邻图的权矩阵W
F)根据E)步骤中所得的特征值的大小,依次输出d个最小特征值对应的特征向量V=[v1,Λ,vd];
G)根据F)步骤中所得的特征向量V对每个样本点进行降维,获得低维数据Y=VTX,其中
方法二包含如下步骤:
A)计算每个样本点xi的最近邻点zi或最近邻域εi;
B)找出每个样本点xi的最近邻点N(xi);
F)根据E)步骤中所得的特征值的大小,依次输出d个最小特征值对应的特征向量V=[v1,Λ,vd];
G)根据F)步骤中所得的特征向量V对每个样本点进行降维,获得低维数据Y=VTX,其中
且
然后执行后续任务。
其中,所述xi为样本点,所述1≤i≤N,所述 是||xj-xi||2依据的数学期望,所述满足‖xi-xj‖2≤εi的所有样本点均为xi的最近邻点,若所得出的最近邻点个数不足规定的最小最近邻点个数kmin,则通过欧式距离找出其他近邻点直至kmin个
参阅图3-a~图3-h:即LPPANS对应本发明方法,由于本发明自动匹配数据潜在流行的局部几何结构,使得K-Means聚类方法在低维数据上就可以获得好的聚类性能。
上述实施例是对本发明的说明,不是对本发明的限定,任何对本发明简单变换后的方案均属于本发明的保护范围。
Claims (7)
4.如权利要求2所述的一种邻域自适应的局部保持投影方法,其特征在于:所述满足||xi-xj||≤||xi-zi||的所有样本点均为xi的最近邻点。
6.如权利要求5所述的一种邻域自适应的局部保持投影方法,其特征在于:所述满足||xi-xj||2≤εi的所有样本点均为xi的最近邻点。
7.如权利要求1至6中任一项所述的一种邻域自适应的局部保持投影方法,其特征在于:若所得出的最近邻点个数不足规定的最小最近邻点个数kmin,则通过欧式距离找出其他近邻点直至kmin个。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210518220.4A CN103034869B (zh) | 2012-12-05 | 2012-12-05 | 一种邻域自适应的局部保持投影方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210518220.4A CN103034869B (zh) | 2012-12-05 | 2012-12-05 | 一种邻域自适应的局部保持投影方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103034869A true CN103034869A (zh) | 2013-04-10 |
CN103034869B CN103034869B (zh) | 2015-05-06 |
Family
ID=48021747
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210518220.4A Active CN103034869B (zh) | 2012-12-05 | 2012-12-05 | 一种邻域自适应的局部保持投影方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103034869B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103605985A (zh) * | 2013-11-15 | 2014-02-26 | 浙江工业大学 | 一种基于张量全局-局部保持投影的数据降维方法 |
CN103605889A (zh) * | 2013-11-13 | 2014-02-26 | 浙江工业大学 | 一种基于数据全局-局部结构保持投影的数据降维方法 |
CN104063717A (zh) * | 2014-07-09 | 2014-09-24 | 哈尔滨工业大学 | 局部结构保持的全局监督图嵌入复杂系统监测数据可视化方法 |
CN104483962A (zh) * | 2014-11-20 | 2015-04-01 | 沈阳化工大学 | 基于多向正交局部保持投影的间歇过程在线故障检测方法 |
CN106897730A (zh) * | 2016-12-30 | 2017-06-27 | 陕西师范大学 | 基于融合类别信息与局部保持投影的sar目标型号识别方法 |
CN108388918A (zh) * | 2018-02-28 | 2018-08-10 | 中国科学院西安光学精密机械研究所 | 具有结构保持特性的数据特征选择方法 |
CN110263777A (zh) * | 2019-06-26 | 2019-09-20 | 中国人民解放军火箭军工程大学 | 基于空谱结合的局部保持投影算法的目标检测方法及系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101369316A (zh) * | 2008-07-09 | 2009-02-18 | 东华大学 | 基于全局和局部结构融合的图像特征提取方法 |
CN101819629A (zh) * | 2010-04-08 | 2010-09-01 | 西京学院 | 一种基于监督张量流形学习的掌纹识别系统及识别方法 |
-
2012
- 2012-12-05 CN CN201210518220.4A patent/CN103034869B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101369316A (zh) * | 2008-07-09 | 2009-02-18 | 东华大学 | 基于全局和局部结构融合的图像特征提取方法 |
CN101819629A (zh) * | 2010-04-08 | 2010-09-01 | 西京学院 | 一种基于监督张量流形学习的掌纹识别系统及识别方法 |
Non-Patent Citations (1)
Title |
---|
王立志等: "基于MFA与kNNS算法的高光谱遥感影像分类", 《计算机科学》 * |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103605889A (zh) * | 2013-11-13 | 2014-02-26 | 浙江工业大学 | 一种基于数据全局-局部结构保持投影的数据降维方法 |
CN103605985A (zh) * | 2013-11-15 | 2014-02-26 | 浙江工业大学 | 一种基于张量全局-局部保持投影的数据降维方法 |
CN103605985B (zh) * | 2013-11-15 | 2017-02-01 | 浙江工业大学 | 一种基于张量全局‑局部保持投影的数据降维的人脸识别方法 |
CN104063717A (zh) * | 2014-07-09 | 2014-09-24 | 哈尔滨工业大学 | 局部结构保持的全局监督图嵌入复杂系统监测数据可视化方法 |
CN104063717B (zh) * | 2014-07-09 | 2017-03-22 | 哈尔滨工业大学 | 局部结构保持的全局监督图嵌入复杂系统监测数据可视化方法 |
CN104483962A (zh) * | 2014-11-20 | 2015-04-01 | 沈阳化工大学 | 基于多向正交局部保持投影的间歇过程在线故障检测方法 |
CN104483962B (zh) * | 2014-11-20 | 2017-06-16 | 沈阳化工大学 | 基于多向正交局部保持投影的间歇过程在线故障检测方法 |
CN106897730A (zh) * | 2016-12-30 | 2017-06-27 | 陕西师范大学 | 基于融合类别信息与局部保持投影的sar目标型号识别方法 |
CN106897730B (zh) * | 2016-12-30 | 2020-04-10 | 陕西师范大学 | 基于融合类别信息与局部保持投影的sar目标型号识别方法 |
CN108388918A (zh) * | 2018-02-28 | 2018-08-10 | 中国科学院西安光学精密机械研究所 | 具有结构保持特性的数据特征选择方法 |
CN108388918B (zh) * | 2018-02-28 | 2020-06-12 | 中国科学院西安光学精密机械研究所 | 具有结构保持特性的数据特征选择方法 |
CN110263777A (zh) * | 2019-06-26 | 2019-09-20 | 中国人民解放军火箭军工程大学 | 基于空谱结合的局部保持投影算法的目标检测方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN103034869B (zh) | 2015-05-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103034869B (zh) | 一种邻域自适应的局部保持投影方法 | |
CN111881714B (zh) | 一种无监督跨域行人再识别方法 | |
Sun et al. | Large-scale web video event classification by use of fisher vectors | |
CN105184303B (zh) | 一种基于多模态深度学习的图像标注方法 | |
Zhang et al. | Dimension reduction using semi-supervised locally linear embedding for plant leaf classification | |
CN104317902B (zh) | 基于局部保持迭代量化哈希的图像检索方法 | |
CN104112018B (zh) | 一种大规模图像检索方法 | |
CN104899549A (zh) | 基于距离像时频图鉴别字典学习的sar目标识别方法 | |
CN105279554A (zh) | 基于哈希编码层的深度神经网络的训练方法及装置 | |
CN107832458A (zh) | 一种字符级的基于嵌套深度网络的文本分类方法 | |
CN103164701B (zh) | 手写体数字识别方法及装置 | |
Chen et al. | Hyperspectral face recognition via feature extraction and CRC‐based classifier | |
CN103258210A (zh) | 一种基于字典学习的高清图像分类方法 | |
CN103605985A (zh) | 一种基于张量全局-局部保持投影的数据降维方法 | |
CN109739999A (zh) | 一种高效的果蝇神经网络哈希搜索wmsn数据方法 | |
CN109711483A (zh) | 一种基于Sparse Autoencoder的电力系统运行方式聚类方法 | |
Park | A feature selection method using hierarchical clustering | |
Shang et al. | Object recognition using rotation invariant local binary pattern of significant bit planes | |
CN101877065B (zh) | 小样本条件下的人脸图像非线性鉴别特征抽取和识别方法 | |
Zhang et al. | Few-shot bearing fault diagnosis based on meta-learning with discriminant space optimization | |
CN108805280A (zh) | 一种图像检索的方法和装置 | |
CN102902984A (zh) | 基于局部一致性的遥感影像半监督投影降维方法 | |
Mengash et al. | Search and Rescue Optimization with Machine Learning Enabled Cybersecurity Model. | |
Javan et al. | On-line voltage and power flow contingencies ranking using enhanced radial basis function neural network and kernel principal component analysis | |
CN102982346B (zh) | 一种最小最大局部结构信息的特征选择方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |