CN102663392A - 一种基于拉普拉斯算子的图像特征提取方法 - Google Patents

一种基于拉普拉斯算子的图像特征提取方法 Download PDF

Info

Publication number
CN102663392A
CN102663392A CN2012100505401A CN201210050540A CN102663392A CN 102663392 A CN102663392 A CN 102663392A CN 2012100505401 A CN2012100505401 A CN 2012100505401A CN 201210050540 A CN201210050540 A CN 201210050540A CN 102663392 A CN102663392 A CN 102663392A
Authority
CN
China
Prior art keywords
image
matrix
vector
characteristic
optimization
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2012100505401A
Other languages
English (en)
Inventor
何晓飞
卜佳俊
陈纯
刘晓
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN2012100505401A priority Critical patent/CN102663392A/zh
Publication of CN102663392A publication Critical patent/CN102663392A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

本发明公开了一种基于拉普拉斯算子的图像特征提取方法。本发明的方法在特征提取的过程中引入了拉普拉斯正则化最小二乘因子,利用其特性将数据中的潜在流形结构和数据的区别性纳入到考虑范围中。同时,本方法中要提取使结果集协方差矩阵最小的特征,可以使用两种不同的度量方法——协方差矩阵的迹最优化(A-optimality)和协方差矩阵的行列式最优化(D-optimality),也相应产生两种不同的算法,分别是拉普拉斯正则化A-最佳特征选择(LapAOFS)和拉普拉斯正则化D-最佳特征选择(LapDOFS)。本方法的优点在于同时考虑到了数据中的区别结构与几何结构,可以提取出一个合适的特征子集,在保持了数据潜在流形结构的同时可以将后续的学习过程的性能尽量提高。

Description

一种基于拉普拉斯算子的图像特征提取方法
技术领域
本发明涉及特征选择,矩阵降维,流形等领域,特别是涉及一种基于拉普拉斯算子的图像特征提取方法。 
背景技术
在很多计算机视觉、模式识别、数据挖掘的实践中,图像、文字等对象常常被表示为高维欧式空间中的点。但是过高的维数显著增加了信息处理过程中需要的时间和空间。更为重要的是,如分类、聚集、检索等在低维空间中简单可行的基本学习任务在维度达到数百或者数千的高维空间中会显得相当棘手。为了解决这个问题,特征选择与抽取技术就从所有特征的集合中选出有意义的特征子集或者特征组合,同时也减少了特征的维数,它可以被应用到数据预处理中并加速后续的学习任务。 
特征提取的使用环境可以分为有监管与无监管两种。 
在有监管的情况下,数据中会包含类标签,可以通过判断特征与类标签的关联程度评估某个特征的重要性。常见有监管特征提取方法有Pearson相关系数、Kolmogorov-Smirnov测试等。但是在实际应用中常常面对的都是不含有类标签的数据,而且要添加类标签的代价相当高。因此,找到一种能利用所有数据点的无监管特征提取方法就具有极强的重要性。 
无监管特征提取方法可以大致分为两类。第一类方法致力于优化聚集性能,比如Q-α算法,它可以将输入数据投影到特定的坐标上, 进而在最小二乘准则函数的基础上根据其可聚集能力进行优化。第二类方法则是着重与提取出那些最能表现出数据空间几何结构的特征,比如PCA算法。 
本发明所提出的一种基于拉普拉斯算子的图像特征提取方法正是综合了上述两类无监管特征提取方法,通过应用拉普拉斯算子成功地找到了一种新的特征提取方法。这种方法既考虑到了图像特征数据的区别性,又考虑到了图像特征数据的原始几何结构,并且在实践中表现出了比原有方法更高的性能,具有很强的应用价值与理论意义。 
发明内容
为了实现更加有效的特征提取,本发明公开了一种基于拉普拉斯算子的图像特征提取方法。不同与原有的特征提取方法,本方法既考虑到了数据的区别性,又考虑到了数据的原始几何结构,并且在实践中表现出了比原有方法更高的性能。该方法包含以下步骤: 
1)利用互联网搜集图像,获得一个图像库,并根据图像的视觉特征将每个图像用一个高维度的向量xi=(f1,i,...,fn,i)T表示,fj,i表示第i个图像所对应的第j个特征的值。 
2)将所有步骤1)得到的所有图像特征向量表示成一个矩阵X=(x1,...,xm),其中的每一个列向量xi都对应第i个图像由步骤1)得到的向量,每一个行向量都对应到某一个特征。方法的目标是提取合适的特征,即提取合适的行向量。用 
Figure BDA0000139589940000021
表示最后选出的特征所表示的矩阵,其中的列向量 
Figure BDA0000139589940000022
表示原始图像经过特征提取之后的特征向量。 
3)计算得到一个m×m维相似矩阵W( 
Figure BDA0000139589940000031
xi是步骤2)中矩阵X的一个列向量,N(xi)表示与xi距离最近的k个向量的集合,k为一个参数),再计算对角矩阵D,且Dii=∑jWij。对角矩阵减去相似矩阵可以得到拉普拉斯矩阵L,即L=D-W。 
4)利用拉普拉斯正则化最小均方的方法: 
a)得到拉普拉斯算子 
J LapRLS ( w ) = Σ i = 1 m ( w T x i S - y i ) 2 + λ 1 2 Σ i , j = 1 m ( w T x i S - w T x j S ) 2 W ij
+ λ 2 | | w | | 2
(其中w表示特征权重的向量, 
Figure BDA0000139589940000034
是2)中所示矩阵XS的一个列向量,yi是该特征向量对应的数据点的标签,λ1和λ2是拉普拉斯算子的两个参数)。 
b)计算J对于w的一阶导数,并令其为0得到: 
w ^ = ( X S ( X S ) T + λ 1 X S L ( X S ) T + λ 2 I ) - 1 X S y
其中I为k阶单位矩阵;L为步骤3)所得拉普拉斯矩阵;y=(XS)Tw+∈,∈为平均值为0的未知误差,∈的方差为σ2。 
c)定义H=XS(XS)T1XSL(XS)T2I,用xS某一个具体的图像,由于Cov(y)=σ2I,且λ1和λ2的值通常被设定得较小,所以协方差与偏差可以有如下近似: 
Cov ( w ^ ) ≈ σ 2 H - 1
E ( y - y ^ ) 2 ≈ σ 2 + σ 2 ( x S ) T H - 1 x S
要获得最优解,即要求得使H-1最小的特征集 
5)用最优化矩阵的迹和最优化矩阵的行列式两种最优判别标准优化步骤4)所得的协方差矩阵,提取出最优的图像特征维度。 
对应最优化矩阵的行列式方法为: 
最小化det(H-1),其中det()表示求矩阵行列式;问题可以进一步转化为最大化det(H),并最终转化为求如下优化问题: 
Figure BDA0000139589940000043
其中{g1,...,gk}为被选中的特征的集合,gi在第i个维度上所有图像的特征所组成的向量; 
Figure BDA0000139589940000044
为所有特征的集合;M=λ2(I+λ1L)-1,λ1、λ2是拉普拉斯算子参数;I为k阶单位矩阵;L为拉普拉斯矩阵。 
最优化矩阵的迹方法为: 
最小化Tr(H-1),其中Tr()表示求矩阵迹;问题最终化简为如下优化问题: 
Figure BDA0000139589940000051
其中M=λ2(I+λ1L)-1;I为k阶单位矩阵;k为如3所述的参数;L为拉普拉斯矩阵;αT=(α1,...,αn),其中如果第i个特征被选中则αi=1,否则αi=0。 
在得出如上两种简化问题之后均可以通过顺序优化和凸优化两种方法使问题得到解决。 
附图说明
图1是本发明的方法流程图。 
具体实施方式
参照附图,进一步说明本发明: 
一种基于拉普拉斯算子的图像特征提取方法,该方法包括以下步骤: 
1)获取原始图像特征数据 
利用互联网搜集图像,获得一个图像库,并根据图像的视觉特征将每个图像用一个高维度的向量xi=(f1,i,...,fn,i)T表示,fj,i表示第i个图像所对应的第j个特征的值。 
2)获取拉普拉斯矩阵 
将所有步骤1)得到的所有图像特征向量表示成一个矩阵X=(x1,...,xm),其中的每一个列向量xi都对应第i个图像由步骤1)得到的向量,每一个行向量都对应到某一个特征。方法的目标是提取 合适的特征,即提取合适的行向量。用 表示最后选出的特征所表示的矩阵,其中的列向量 表示原始图像经过特征提取之后的特征向量。 
计算得到一个m×m维相似矩阵W 
Figure BDA0000139589940000063
xi矩阵X的一个列向量,N(xi)表示与xi距离最近的k个向量的集合,k为一个参数),再计算对角矩阵D,且Dii=∑jWij。对角矩阵减去相似矩阵可以得到拉普拉斯矩阵L,即L=D-W。 
3)获取协方差矩阵 
利用拉普拉斯正则化最小均方的方法: 
a)得到拉普拉斯算子 
J LapRLS ( w ) = Σ i = 1 m ( w T x i S - y i ) 2 + λ 1 2 Σ i , j = 1 m ( w T x i S - w T x j S ) 2 W ij
+ λ 2 | | w | | 2
(其中w表示特征权重的向量, 
Figure BDA0000139589940000066
是2)中所示矩阵XS的一个列向量,yi是该特征向量对应的数据点的标签,λ1和λ2是拉普拉斯算子的两个参数)。 
b)计算J对于w的一阶导数,并令其为0得到: 
w ^ = ( X S ( X S ) T + λ 1 X S L ( X S ) T + λ 2 I ) - 1 X S y
其中I为k阶单位矩阵;L为步骤3)所得拉普拉斯矩阵;y=(XS)Tw+∈,∈为平均值为0的未知误差,∈的方差为σ2。 
c)定义H=XS(XS)T1XSL(XS)T2I,用xS某一个具体的图像,由于Cov(y)=σ2I,且λ1和λ2的值通常被设定得较小,所以协方差与偏差可以有如下近似: 
Cov ( w ^ ) ≈ σ 2 H - 1
E ( y - y ^ ) 2 ≈ σ 2 + σ 2 ( x S ) T H - 1 x S
要获得最优解,即要求得使H-1最小的特征集 
4)用最优化矩阵的迹和最优化矩阵的行列式两种最优判别标准优化步骤4)所得的协方差矩阵,提取出最优的图像特征维度。 
对应最优化矩阵的行列式方法为: 
最小化det(H-2),其中det()表示求矩阵行列式;问题可以进一步转化为最大化det(H),并最终转化为求如下优化问题: 
Figure BDA0000139589940000074
其中{g1,...,gk}为被选中的特征的集合,gi在第i个维度上所有图像的特征所组成的向量; 
Figure BDA0000139589940000075
为所有特征的集合;M=λ2(I+λ1L)-1,λ1、λ2是拉普拉斯算子参数;I为k阶单位矩阵;L为拉普拉斯矩阵。 
最优化矩阵的迹方法为: 
最小化Tr(H-1),其中Tr()表示求矩阵迹;问题最终化简为如下优化问题: 
Figure BDA0000139589940000081
Figure BDA0000139589940000082
其中M=λ2(I+λ2L)-1;I为k阶单位矩阵;k为如3所述的参数;L为拉普拉斯矩阵;αT=(α1,...,αn),其中如果第i个特征被选中则αi=1,否则αi=0。 
在得出如上两种简化问题之后均可以通过顺序优化和凸优化两种方法使问题得到解决。 
本说明书实施例所述的内容仅仅是对发明构思的实现形式的列举,本发明的保护范围不应当被视为仅限于实施例所陈述的具体形式,本发明的保护范围也及于本领域技术人员根据本发明构思所能够想到的等同技术手段。 

Claims (5)

1.一种基于拉普拉斯算子的图像特征提取方法,其特征在于该方法的步骤如下:
1)利用互联网搜集图像,获得一个图像库,并根据图像的视觉特征将每个图像用一个高维度的向量表示,每个维度表示一个图像特征;
2)通过构建图像的最近邻图,得到拉普拉斯矩阵;
3)利用拉普拉斯正则化最小均方的方法,计算得到协方差矩阵;
4)通过最小化协方差得到最优的特征子集,用最优化协方差矩阵的行列式和最优化协方差矩阵的迹两种最优判别标准,提取出最优的图像特征子集。
2.根据权利要求1所述的一种基于拉普拉斯算子的图像特征提取方法,其特征在于:所述步骤1)产生特征向量主要是提取图像的多种视觉特征,并将每一种特征作为一个维度,将每个图像用一个高维度的向量xi=(f1,i,...,fn,i)T表示,fj,i表示第i个图像所对应的第j个特征的值;将得到的所有图像特征向量表示成一个矩阵X=(x1,...,xm),其中的每一个列向量xi都对应第i个图像由步骤1)得到的向量,每一个行向量都对应到某一个特征。方法的目标是提取合适的特征,即提取合适的行向量。用 
Figure FDA0000139589930000011
表示最后选出的特征所表示的矩阵,其中的列向量 
Figure FDA0000139589930000012
表示原始图像经过特征提取之后的特征向量。 
3.根据权利要求1所述的一种基于拉普拉斯算子的图像特征提取方法,其特征在于:所述步骤2)中图像的最近邻图是通过计算步骤1)所产生的m个图像向量两两之间的距离(余弦距离)得到的,选出与第j个图像距离最近的前k个图像,如果第i个图像在其中,则第i个图像属于第j个图像的k个最近邻,k是一个预先设定的参数;计算得到一个m×m的相似矩阵W,其中Wij=1当第i个图像属于第j个图像的k个最近邻(k为参数),其余Wij=0;再计算对角矩阵D,且Dii=∑jWij;对角矩阵减去相似矩阵可以得到拉普拉斯矩阵L,即L=D-W。
4.根据权利要求1所述的一种基于拉普拉斯算子的图像特征提取方法,其特征在于:所述步骤3)中的利用拉普拉斯正则化最小均方的方法:
Figure FDA0000139589930000021
计算J对于w的一阶导数,并令其为0得到:
Figure FDA0000139589930000023
其中I为k阶单位矩阵;L为步骤3)所得拉普拉斯矩阵;y=(XS)Tw+∈,∈为平均值为0的未知误差,∈的方差为σ2; 
定义H=XS(XS)T1XSL(XS)T2I,用xS某一个具体的图像,由于Cov(y)=σ2I,且λ1和λ2的值通常被设定得较小,所以协方差与偏差可以有如下近似:
要获得最优解,就要最小化协方差矩阵,即要求得使H-1最小的特征集。
5.根据权利要求1所述的一种基于拉普拉斯算子的图像特征提取方法,其特征在于:所述步骤4)中对应
最优化矩阵的行列式方法为:
最小化det(H-1),其中det()表示求矩阵行列式;问题可以进一步转化为最大化det(H),并最终转化为求如下优化问题:
Figure FDA0000139589930000033
其中{g1,...,gk}为被选中的特征的集合,gi在第i个维度上所有图像的特征所组成的向量; 
Figure FDA0000139589930000034
为所有特征的集合;M=λ2(I+λ1L)-1,λ1、λ2是拉普拉斯算子参数;I为k阶单位矩阵;L为拉普拉斯矩阵;
最优化矩阵的迹方法为: 
最小化Tr(H-1),其中Tr()表示求矩阵迹;问题最终化简为如下优化问题:
Figure FDA0000139589930000041
Figure FDA0000139589930000042
其中M=λ2(I+λ1L)-1;I为k阶单位矩阵;k为如3所述的参数;L为拉普拉斯矩阵;αT=(α1,...,αn),其中如果第i个特征被选中则αi=1,否则αi=0。 
CN2012100505401A 2012-02-29 2012-02-29 一种基于拉普拉斯算子的图像特征提取方法 Pending CN102663392A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2012100505401A CN102663392A (zh) 2012-02-29 2012-02-29 一种基于拉普拉斯算子的图像特征提取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2012100505401A CN102663392A (zh) 2012-02-29 2012-02-29 一种基于拉普拉斯算子的图像特征提取方法

Publications (1)

Publication Number Publication Date
CN102663392A true CN102663392A (zh) 2012-09-12

Family

ID=46772876

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2012100505401A Pending CN102663392A (zh) 2012-02-29 2012-02-29 一种基于拉普拉斯算子的图像特征提取方法

Country Status (1)

Country Link
CN (1) CN102663392A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106570910A (zh) * 2016-11-02 2017-04-19 南阳理工学院 基于自编码特征和近邻模型的图像自动标注方法
CN108363724A (zh) * 2018-01-04 2018-08-03 浙江大学 一种利用图像正则化及数据重建解决特征提取任务的方法
CN108388918A (zh) * 2018-02-28 2018-08-10 中国科学院西安光学精密机械研究所 具有结构保持特性的数据特征选择方法
CN106204473B (zh) * 2016-06-30 2019-07-16 扬州大学 基于Laplacian优化的非完备模型局部变形的恢复方法
CN113554074A (zh) * 2021-07-09 2021-10-26 浙江工贸职业技术学院 一种基于分层Laplace的图像特征分析方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
XIAOFEI HE等: "A Variance Minimization Criterion to Feature Selection Using Laplacian Regularization", 《IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106204473B (zh) * 2016-06-30 2019-07-16 扬州大学 基于Laplacian优化的非完备模型局部变形的恢复方法
CN106570910A (zh) * 2016-11-02 2017-04-19 南阳理工学院 基于自编码特征和近邻模型的图像自动标注方法
CN106570910B (zh) * 2016-11-02 2019-08-20 南阳理工学院 基于自编码特征和近邻模型的图像自动标注方法
CN108363724A (zh) * 2018-01-04 2018-08-03 浙江大学 一种利用图像正则化及数据重建解决特征提取任务的方法
CN108388918A (zh) * 2018-02-28 2018-08-10 中国科学院西安光学精密机械研究所 具有结构保持特性的数据特征选择方法
CN108388918B (zh) * 2018-02-28 2020-06-12 中国科学院西安光学精密机械研究所 具有结构保持特性的数据特征选择方法
CN113554074A (zh) * 2021-07-09 2021-10-26 浙江工贸职业技术学院 一种基于分层Laplace的图像特征分析方法

Similar Documents

Publication Publication Date Title
Liang et al. Delta-density based clustering with a divide-and-conquer strategy: 3DC clustering
CN102324047B (zh) 基于稀疏核编码skr的高光谱图像地物识别方法
Wang et al. SAT-GCN: Self-attention graph convolutional network-based 3D object detection for autonomous driving
Landgrebe et al. The interaction between classification and reject performance for distance-based reject-option classifiers
Yu et al. Maximal entropy random walk for region-based visual saliency
Ju et al. Macroeconomic performance of oil price shocks: Outlier evidence from nineteen major oil-related countries/regions
CN102663392A (zh) 一种基于拉普拉斯算子的图像特征提取方法
CN102282572A (zh) 表示图像块的方法和系统
CN105069811A (zh) 一种多时相遥感图像变化检测方法
CN102999926B (zh) 一种基于底层特征融合的图像视觉显著性计算方法
Zhang et al. Global context aware convolutions for 3d point cloud understanding
Song et al. Improved t-SNE based manifold dimensional reduction for remote sensing data processing
CN104680140A (zh) 基于图像的人群聚集状态检测方法
Annoni et al. Analysis of aircraft trajectories using fourier descriptors and kernel density estimation
CN103605985A (zh) 一种基于张量全局-局部保持投影的数据降维方法
Liu et al. LB-LSD: A length-based line segment detector for real-time applications
CN102651132A (zh) 一种基于交叉视觉皮质模型的医学图像配准方法
CN113628291A (zh) 基于边界提取与合并的多形状目标栅格数据矢量化方法
CN104008394A (zh) 基于近邻边界最大的半监督高光谱数据降维方法
CN102708589B (zh) 一种基于特征聚类的三维目标多视点视图建模方法
Deng et al. Nuclear norm-based matrix regression preserving embedding for face recognition
Nagar et al. A novel data-driven visualization of n-dimensional feasible region using interpretable self-organizing maps (iSOM)
Lu et al. Uncorrelated multilinear principal component analysis through successive variance maximization
Deepika et al. Comparison of principal-component-analysis-based extreme learning machine models for boiler output forecasting
Barra et al. Gradient boosting regression for faster Partitioned Iterated Function Systems‐based head pose estimation

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20120912