一种基于优化图谱理论的高光谱降维方法
技术领域
本发明涉及遥感技术领域,尤其涉及一种从高光谱遥感数据中去除冗余信息增强不同类别地面目标间差异的降维方法。
背景技术
高光谱图像为判别不同地面目标间的细微差别提供了丰富的光谱信息。但是,对于高光谱图像分类而言,不是所有的波段信息对于判别地面目标有帮助,大量的光谱波段对于后续处理来说是个挑战。因此,高光谱图像在分类之前往往要进行降维处理,在保留大部分重要信息的同时,降低后续处理的复杂性。
由于高光谱图像在成像过程中发生多向散射,使得数据内在呈现出非线性结构,因此,非线性降维方法是最合适的处理手段。其中,基于流形学习的降维方法是最有效的手段。主要的流形学习方法包括局部线性嵌入、近邻保留嵌入和局部保留嵌入等。具体方法可参见
文献1:D.deRidderandR.P.Duin,″Locallylinearembeddingforclassification,″PatternRecognitionGroup,Dept.ofImagingScience&Technology,DelftUniversityofTechnology,Delft,TheNetherlands,Tech.Rep.PH-2002-01,pp.1-12,2002;
文献2:X.He,D.Cai,S.Yan,andH.-J.Zhang,″Neighborhoodpreservingembedding,″inComputerVision,2005.ICCV2005.TenthIEEEInternationalConferenceon,2005,pp.1208-1213;
文献3:X.HeandP.Niyogi,″LocalityPreservingProjections,″inAdvancesinNeuralInformationProcessingSystems,2004,pp.153-160;
然而这些方法都是通过保留局部近邻结构来将原始数据映射到新的子流形中,但是,对于分类而言,只保留局部近邻信息是难以显著提高后续分类精度的。
此外,文献4:CN103136736A,2013.06.05,一种高光谱遥感数据非线性降维方法;该案为解决现有的高光谱数据线性降维方法对非线性特征保留较少且线性降维后得到的维数依然较高的技术问题,提供了一种高光谱遥感数据的降维方法;其技术方案包括一、先将高光谱遥感数据进行坏带去除;二、将经步骤一处理后的高光谱遥感数据进行低通滤波;三、将经步骤二处理后的高光谱遥感数据看做一个三维矩阵,三维矩阵中同一空间位置不同波段位置形成的向量称为像素向量;四、将步骤三得到的二维矩阵的像素向量映射到D维的特征空间中;五、运用黎曼流行学习中的自适应选择领域点的方法,将相邻的点互相之间连接起来,构成邻接;……。最终利用基于黎曼流形学习的高光谱数据非线性降维方法,将高光谱数据中的像素样本用更小的维数来表示,同时还保持住原光谱更多的信息。
文献5:CN104008394A,2014.08.27,基于近邻边界最大的半监督高光谱数据降维方法;该案为实现利用少量的监督信息,实现对高光谱遥感数据的高效降维的目的,提供了一种基于近邻边界最大的半监督高光谱数据降维方法,其技术方案包括:(1)将遥感影像数据库样本集划分为训练数据集X和标记样本集Y;(2)生成标记样本集的散度矩阵;(3)通过空间近邻关系生成训练数据集的空间近邻矩阵,……。采用低秩表示的流形正则和空间一致性的空间正则来构造半监督正则项,生成训练数据集的流形和空间的结构正则,在很少监督信息的情况下,采用空谱联合的正则策略,使得投影矩阵更加鲁棒、完备。
发明内容
本发明针对以上问题,提供了一种基于优化图谱理论的高光谱降维方法,以解决现有技术对高光谱数据降维只依赖于局部近邻信息,没有考虑非近邻的差异,对后续分类精度没有显著提高的问题。
本发明的技术方案是:包括如下步骤:
1)、根据原始高光谱影像像元间的相似性度量,通过最近邻优化获得优化近邻图;
2)、将优化近邻图中的任意两个非近邻像元用边连接,获得连接图,对连接图中的边赋予权重,构成权重矩阵;
3)、在映射到低维空间时,保证降维后有边连接的非近邻像元间距离最大化;
4)、求解特征向量,构成变换矩阵;
5)、计算原始高光谱数据降维后的结果。
所述步骤1)中获得优化近邻图的步骤为:
1a)、确定像元间相似性度量的标准;
1b)、计算任意两个像元间的相似性,每个像元选取最相似的一个像元构成最近邻图;
1c)、通过最近邻优化,获得优化近邻图,优化步骤如下:第一步,只要任意两个像元存在单向最近邻关系,则视二者互为最近邻关系;第二步,像元一的最近邻点是像元二,像元二的最近邻点是像元三,则将像元一和像元三都视为像元二的最近邻点,在第一步的基础上,视像元一和像元三也互为最近邻点。
所述步骤2)中构成权重矩阵按如下步骤进行:
2a)、根据所构建的近邻图,将图中任意两个非近邻像元用边连接,两个近邻像元间则不存在这样的边,由此形成连接图;
2b)、对连接图中的边赋予权重,凡是有边连接的,赋予权重Wij,没有边连接的,赋值为0,构成权重矩阵。
根据目标函数公式(1)实现所述步骤3)所述的在映射到低维空间时,保证降维后有边连接的非近邻像元间距离最大化,
max∑ij(yi-yj)2Wij(1)
其中,yi和yj分别表示原始像元xi和xj降维后在新的特征空间中对应的像元,xi是原始高光谱影像X的第i个像元向量。
求解步骤4)中所述的特征向量的方法如下:
4a)、将yi T=aTxi代入公式(1),得到公式(2):
其中,a为特征向量,T为向量或矩阵的转置,D为对角矩阵,Dii=ΣjWji,L是拉普拉斯矩阵,L=D-W;
4b)、将代入公式(2),得到公式(3):
4c)、结合公式(4)求解特征向量a,
XLXTa=λXDXTa(4)
按公式(5)计算步骤5)中所述的原始高光谱数据降维后的结果,即xi降维后的结果yi:
xi→yi=ATxi,A=(a0,a1,…,at-1)(5)
其中,向量组a0,…,at-1为公式(4)的解。
本发明的有益效果是:本发明的方法可以在对高光谱影像降维的过程中,充分考虑光谱的不相似性,增强不同地面类别间的分离度,从而提高后续高光谱影像分类的精度。
附图说明
图1是本发明的工作流程图,
图2(a)是原始高光谱数据的像元分布图,
图2(b)是优化后近邻结构关系图,
图2(c)是降维后像元的分布特征;
图3是本发明实施例中原始的光谱曲线图;
图4是本发明实施例中波段21和54的原始二维散点图;
图5是本发明实施例中波段21和54降维后的散点图。
具体实施方式
下面结合附图和实施例对本发明作具体说明。
如图1所示,本发明包括以下步骤:
S101:对原始高光谱数据,依据像元间的相似性度量,构建最近邻图;
可采用欧氏距离作为高光谱影像像元间相似性度量的标准。计算所有像元间的欧氏距离,为每个像元选择欧氏距离最小的一个像元,构建最近邻图。
S102:对最近邻图进行图优化,形成每个像元拥有不同数量近邻点的优化近邻图;
例如,图2(a)为原始高光谱数据的像元分布图,图中x3的最近邻点为x4,而x4的最近邻点为x5,则将x3和x5都视为x4的最近邻点,同时,将x3和x5也视为互为最近邻点,因此,x3、x4和x5最终都视为互为近邻点,任意两点间都存在最近邻关系。同理,x5、x6和x7之间也是上述关系,x5、x8和x9也是如此。最终,x3-x9任意两点都视为存在最近邻关系,也就形成了图2(b)中有虚线连接的形式。而x1的最近邻点为x2,同时x2的最近邻点为x1,因此,只有这两个点之间存在存在最近邻关系,所以二者之间有虚线连接。同理,x10和x11,x12和x13也分别是最近邻关系。
S103:用边连接优化近邻图中的任意两个非近邻像元,形成连接图;
S104:对连接图中的边赋予权重,两像元间没有边则赋为0,构成权重矩阵;
根据所构建的优化近邻图,将图中任意两个非近邻像元用边连接,两个近邻像元间则不存在这样的边,由此形成连接图;对连接图中的边赋予权重值Wij,为了简化算法,Wij可设为1,两像元间没有边赋予权重值为0。
S105:确保有边连接的像元间距离降维后为最大化距离,目的是充分考虑非近邻像元间的差异,提高后续分类精度:
由目标函数公式(1)实现,
max∑ij(yi-yj)2Wij(1)
其中,yi和yj分别表示原始像元xi和xj降维后在新的特征空间中对应的像元,xi是原始高光谱影像X的第i个像元向量,示例中,最大化的效果如图2(c)所示。
S106:求解特征向量,获取降维后的数据。
将yi T=aTxi代入公式(1),得到公式(2):
其中,a为特征向量,T为向量或矩阵的转置,D为对角矩阵,Dii=∑jWji,L是拉普拉斯矩阵,L=D-W;
本方法是一种线性变换方法,xi表示变换前的向量,yi表示变换后的向量,向量线性变换的一般形式就是yi T=aTxi,这里的T表示向量或矩阵的转置形式。
对于任意xi,D是一种自然度量,Dii的值越大,yi(相应于Dii)越重要,因此,在这种情况下,求解的y可以是任意的,yi与yj的变换尺度是不同的,为了避免尺度的影响及消除线性变换平移的任意性,要施加限制这可以确保任意yi在求解过程中都保持在同一尺度下而不是任意的。于是,将代入公式(2),得到公式(3)即我们最终的目标函数:
在满足这个目标函数的前提下要求得变换向量a,求解的方法是公式(4),公式(4)是线性代数中的特征值与特征向量问题的基本形式之一。
XLXTa=λXDXTa(4)
其中,λ是矩阵特征值。
令列向量组a0,…,at-1为式(4)的解,根据它们的特征值排序,λ0>,…,>λt-1,构成变换矩阵。
最后将公式(4)的解代入公式(5)计算xi降维后的结果yi:
Xi→yi=ATxi,A=(a0,a1,…,at-1)(5)
实施例:
本实施例中的原始数据是AVIRIS传感器获取的1992年美国印第安纳西北部地区的影像,包含220个波段,空间分辨率为20米,影像大小为145像素*145像素。从影像中选取了三个类别(soybean-notill,soybean-mintill,andcorn-notill)各100个像元。原始的光谱曲线如图3所示,二维散点图(波段21和54)如图4所示,本方法降维后的前两个波段散点图如图5所示:对比图4和图5,我们可以看出,通过本方法降维后大大增强了不同类别间的分离度,从而方便高光谱影像的后续分类,并大大提高分类精度。