CN104680169A - 一种面向高空间分辨率遥感图像专题信息提取的半监督诊断性特征选择方法 - Google Patents

一种面向高空间分辨率遥感图像专题信息提取的半监督诊断性特征选择方法 Download PDF

Info

Publication number
CN104680169A
CN104680169A CN201510119477.6A CN201510119477A CN104680169A CN 104680169 A CN104680169 A CN 104680169A CN 201510119477 A CN201510119477 A CN 201510119477A CN 104680169 A CN104680169 A CN 104680169A
Authority
CN
China
Prior art keywords
sample
matrix
semi
remote sensing
spatial resolution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510119477.6A
Other languages
English (en)
Other versions
CN104680169B (zh
Inventor
陈曦
谷延峰
张晔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hit Robot Group Co ltd
Original Assignee
Harbin Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Institute of Technology filed Critical Harbin Institute of Technology
Priority to CN201510119477.6A priority Critical patent/CN104680169B/zh
Publication of CN104680169A publication Critical patent/CN104680169A/zh
Application granted granted Critical
Publication of CN104680169B publication Critical patent/CN104680169B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • G06V20/13Satellite images

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Astronomy & Astrophysics (AREA)
  • Remote Sensing (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

一种面向高空间分辨率遥感图像专题信息提取的半监督诊断性特征选择方法,本发明涉及半监督诊断性特征选择方法。本发明是要解决标记样本的工作量大且难以量化评价特征对提取专题类的贡献的问题,提出一种面向高空间分辨率遥感图像专题信息提取的半监督诊断性特征选择方法。该方法是通过步骤一:获得对象特征矩阵;步骤二:构造样本权重矩阵步骤三:构建目标函数;步骤四:将目标函数变换成简化的目标函数;步骤五:对简化的目标函数进行迭代优化输出矩阵U,选择U的后m行为优化变量矩阵W;步骤六:选择出W绝对值的和最大的特征作为目标类别的诊断性特征子集等步骤实现的。本发明应用于半监督诊断性特征选择领域。

Description

一种面向高空间分辨率遥感图像专题信息提取的半监督诊断性特征选择方法
技术领域
本发明涉及半监督诊断性特征选择方法,特别涉及一种面向高空间分辨率遥感图像专题信息提取的半监督诊断性特征选择方法。
背景技术
近十几年来,IKONOS、QuickBird和WorldView II等高分辨率卫星影像广泛与专题信息提取,例如道路提取,建筑物提取和滑坡制图。在这些应用中,面向对象的图像分析方法(object-based image analysis,OBIA)已经成为专题信息提取的最有效的方法。OBIA可以提取大量的特征,这些特征可能会恶化专题信息提取的性能。
针对上述问题,可以根据经验选择对专题类敏感的特征子集。然而,这种经验性的方法难以客观评价特征对专题类的有效性。而且,随着传感器的不同和时间的变化,同一专题类的诊断性特征可能会有所不同。因此,有必要度量特征对专题类的有效性并自动选择出合适的诊断性特征。传统特征选择方法的目标是找到一个最优的特征子集以区别所有类别,这些方法很少量化评价特征对提取专题类的贡献。因此,提取专题信息时缺乏指导性原则或者自动的特征选择方法。
另一方面,专题信息提取之前常常要先标记大量样本,标记样本的过程极大地增加了人力成本和时间开销,而且有时还很难获取足够的标记样本。因此,在需求紧迫的时候往往需要更加用少量的标记样本,然后基于大量的未标记样本信息选择诊断性特征,以提高专题信息提取的精度。然而现有的诊断性特征选择方法还没有注意到这一问题。
发明内容
本发明的目的是为了解决标记样本的工作量大且难以量化评价特征对提取专题类的贡献的问题,提出一种面向高空间分辨率遥感图像专题信息提取的半监督诊断性特征选择方法。
上述的发明目的是通过以下技术方案实现的:
步骤一:将图像分割成对象即样本,将对象进行特征提取,提取出对象特征值;根据对象特征值获得对象特征矩阵为其中,特征矩阵为v+q行,m列;从所有样本任意选出v个样本进行标记,得到标记样本Xl=(x1,x2,...,xv)T,剩下q个样本为无标记样本Xu=(xv+1,xv+2,...,xv+q)T
步骤二:构造样本权重矩阵在S中,度量样本对样本空间的局部几何信息和样本空间的判别结构的保持能力;
步骤三:根据步骤一中的对象特征矩阵具有内在稀疏性;根据对象特征矩阵内在稀疏性将损失函数设定为基于l2,1范数最小化样本重构误差,并在样本重构误差中引入权重矩阵S,得到损失函数将损失函数与正则项||W||2,1求和构建目标函数,其中,β为正则化参数;W在步骤三中是未知的优化变量矩阵;
步骤四:将步骤三得到的目标函数变换成简化的目标函数;
步骤五:对简化的目标函数进行迭代优化输出矩阵U,选择U的后m行为优化变量矩阵W;
步骤六:求各对象特征的W绝对值的和,选择出W绝对值的和最大的特征作为目标类别的诊断性特征子集;即完成了一种面向高空间分辨率遥感图像专题信息提取的半监督诊断性特征选择方法。
发明效果
本发明为了提出了一种面向高分辨率遥感图像专题信息提取的半监督诊断性特征选择方法,该方法可以在只标记少量样本的情况下,联合利用少量的标记样本和大量的未标记样本的内在信息,根据局部几何信息和判别结构处理标记样本少的问题,并在正则项和损失函数上使得l2,1范数联合最小化,度量特征对专题信息敏感性的竞争力,为专题类选择最优诊断性特征。获取对专题信息敏感的诊断性特征。实验结果表明:相比于传统特征选择方法,诊断性特征选择方法的性能优于通过有效地选出诊断性特征,提升专题信息提取的性能。
本发明选择出的特征鲁棒性好、可解释性强以及专题信息提取精度大大提高,有效解决了在标记少量样本的情况下,客观度量特征对特定地类诊断性能力的应用难题。
由于本发明针对在标记样本少的情况下,基于l2,p范数最小化的目标函数计算出的残差将极大地偏离真实值,模型的可靠性将大大降低这一问题,度量特征对局部几何信息和判别结构的保持能力,并引入目标函数,增强了结果的鲁棒性。利用该方法可以有效地解决标记样本数量不足对基于l2,p范数最小化的目标函数建模不可靠的问题,准确地度量特征对地类的诊断能力。
本方法用于在标记样本不足的情况下,优化损失函数和正则项的l2,p范数最小化目标函数。它将局部几何信息和判别结构引入损失函数,并对目标函数整体做了简化并迭代求解。
利用该方法可以在标记样本少的情况下,克服噪声的干扰,对高空间分辨率遥感图像专题信息有效选择出诊断性特征,客观度量特征对特定地类诊断性能力,提高专题信息提取的精度。
表1是提取的特征及其数量;选择20个特征时因为选择20个特征的分类精度已经近似或者由于采用所有特征的分类精度。限于篇幅,只展示每类选取10个标记样本的结果,选取其他数量的标记样本的结果类似。表2是在悉尼图像上当取10个标记样本,每个类别采用20个特征时的分类精度[%]、采用所有特征时所有类别的平均AUC[%]。表3是美国加州圣克莱门特图像上相应的结果。从表2~3中可以看出,新方法SCFS明显好于对比方法。总的来看,在美国加州圣克莱门特图像上,所有类别所有特征的平均AUC可比其他的高2%。在悉尼图像上,可比其他的高2.8%。选用20个特征时,在两幅图像图像上,采用SCFS时专题类别的精度可以比其他方法高10%。另外,由于每类只标记少量的标记样本,很难处理实际的不平衡数据。随着特征数量的增加,尤其多于50个时,不平衡数据更难处理。因此每个类别的平均AUC大约在50%。
半监督特征选择方法Asymmetrically Local Discriminant Selection(ALDS)和其他的采用一对多策略的诊断性特征选择方法没有表现出足够的优势。ALDS同样采用了局部几何信息以弥补标记样本的不足带来的影响,但是受限于没有针对专题类别。采用一对多策略的诊断性特征选择方法能度量特征对专题类别的依赖性,但是受限于标记样本不足的影响。结果表明应该结合无标记样本信息和与专题类别相关的信息,才能提高性能。
表4是悉尼图像上每类10个标记样本即nl=10时,不同专题信息的前6个诊断性特征及其对专题信息提取的相对贡献。表5是圣克莱门特图像上每类10个标记样本即nl=10时,不同专题信息的诊断性特征及其对专题信息提取的相对贡献。其中相对贡献为每个特征的贡献与最大贡献的比值。一般来说,不同类别有不同的诊断性特征。另外,一个类别在不同图像中也有不同的诊断性特征。例如,在悉尼图像中,水有5个GLCM纹理特征,和一个形状特征和一个光谱特征。相反,圣克莱门特图像上,水有1个GLCM纹理特征,6个光谱特征。原因在于:1)悉尼图像中水有相似的光谱特征,所以纹理和形状特征诊断性相对较强;2)圣克莱门特图像上,不同部分的水有非常不同的光谱特征,所以纹理特征诊断性相对较弱。再如,悉尼图像中道路有明显的形状,所以形状特征诊断性较强。然而圣克莱门特图像上,道路的形状特征诊断性较弱在于标记样本太少。
即使一个类别在不同的图像中有相同的诊断性特征,特征的贡献也不同。原因在于不同图像的对象外表的相异性。
一般来说,纹理和光谱是高分辨率遥感图像对象最好的诊断性特征,如图2澳洲悉尼图像是第六波段的灰度共生矩阵同质性和对比度特征、第一波段的均值特征。圣克莱门特图像是第八波段的灰度共生矩阵均值特征、第一波段的均值特征相邻像素标准差和第七波段的圆周均值。
附图说明
图1是具体实施方式一提出的一种面向高空间分辨率遥感图像专题信息提取的半监督诊断性特征选择方法流程图;
图2为具体实施方式一提出的Worldview-2高分辨率图像于2012年8月拍摄的澳大利亚悉尼8波段1.8米空间分辨率遥感图像,像素大小为2543×2543;
图3为具体实施方式一提出的Worldview-2高分辨率图像于2012年9月拍摄的美国圣克莱门特8波段1.8米空间分辨率遥感图像,像素大小为3101×2086。
具体实施方式
具体实施方式一:本实施方式的一种面向高空间分辨率遥感图像专题信息提取的半监督诊断性特征选择方法,具体是按照以下步骤制备的:
步骤一:预处理,将图像分割成对象即样本,将对象进行特征提取,提取出对象特征值;根据对象特征值获得对象特征矩阵为为了更好地提取高分辨率遥感影像中的信息,采用面向对象的图像分析方法(Object-based ImageAnalysis,OBIA)对图像进行分析;其中,特征矩阵为v+q行,m列;从所有样本任意选出v个样本进行标记,得到标记样本Xl=(x1,x2,...,xv)T,剩下q个样本(对象)为无标记样本(对象)Xu=(xv+1,xv+2,...,xv+q)T
步骤二:根据流形学习理论,每个样本的相似样本或者其在样本空间的邻近样本可以表达数据的局部邻近关系;通过保持该关系,尤其在标记样本少的情况下,可以避免过拟合;另外,采用样本空间的判别结构往往比采用局部几何信息能取得更好的性能;对此,我们构造样本权重矩阵在S中,全面度量样本对样本空间的局部几何信息和样本空间的判别结构的保持能力;
步骤三:现有的l2,p范数最小化模型常常将标记拟合的误差||Y-XW||2,p作为损失函数,其中Y是样本标记,W是特征选择矩阵;该方法在样本充足时能取得良好的效果;然而,在标记样本不足的情况下,该误差函数所估计出的残差将极大地偏离真实值,模型的可靠性将大大降低;由于少量特征即可取得比全部特征差不多甚至更好的分类效果,根据步骤一中的对象特征矩阵具有内在稀疏性;根据对象特征矩阵内在稀疏性将损失函数设定为基于l2,1范数最小化样本重构误差,并在样本重构误差中引入权重矩阵S,得到损失函数该损失函数有较强的判别能力、泛化能力和对噪声的鲁棒性;另外,正则项||W||2,1能够使得W列稀疏以更好地选择特征;将损失函数与正则项||W||2,1求和构建目标函数,可以增强鲁棒性,并准确度量特征对目标类别的诊断能力;其中,β为正则化参数;W在步骤三中是未知的优化变量矩阵;
步骤四:将步骤三得到的目标函数变换成简化的目标函数,以便于求解;
步骤五:对简化的目标函数进行迭代优化输出矩阵U,可以用于度量特征诊断能力;选择U的后m行为优化变量矩阵W;
步骤六:根据特征的诊断能力选择特征;求各对象特征的W绝对值的和,将W绝对值的和作为特征对目标类别的诊断能力;根据特征的诊断能力对特征进行排序,选择出W绝对值的和最大的特征作为目标类别的诊断性特征子集如图1;即完成了一种面向高空间分辨率遥感图像专题信息提取的半监督诊断性特征选择方法。
本实施方式效果:
本实施方式为了提出了一种面向高分辨率遥感图像专题信息提取的半监督诊断性特征选择方法,该方法可以在只标记少量样本的情况下,联合利用少量的标记样本和大量的未标记样本的内在信息,根据局部几何信息和判别结构处理标记样本少的问题,并在正则项和损失函数上使得l2,1范数联合最小化,度量特征对专题信息敏感性的竞争力,为专题类选择最优诊断性特征。获取对专题信息敏感的诊断性特征。实验结果表明:相比于传统特征选择方法,诊断性特征选择方法的性能优于通过有效地选出诊断性特征,提升专题信息提取的性能。
本实施方式选择出的特征鲁棒性好、可解释性强以及专题信息提取精度大大提高,有效解决了在标记少量样本的情况下,客观度量特征对特定地类诊断性能力的应用难题。
由于本实施方式针对在标记样本少的情况下,基于l2,p范数最小化的目标函数计算出的残差将极大地偏离真实值,模型的可靠性将大大降低这一问题,度量特征对局部几何信息和判别结构的保持能力,并引入目标函数,增强了结果的鲁棒性。利用该方法可以有效地解决标记样本数量不足对基于l2,p范数最小化的目标函数建模不可靠的问题,准确地度量特征对地类的诊断能力。
本方法用于在标记样本不足的情况下,优化损失函数和正则项的l2,p范数最小化目标函数。它将局部几何信息和判别结构引入损失函数,并对目标函数整体做了简化并迭代求解。
利用该方法可以在标记样本少的情况下,克服噪声的干扰,对高空间分辨率遥感图像专题信息有效选择出诊断性特征,客观度量特征对特定地类诊断性能力,提高专题信息提取的精度。
表1是提取的特征及其数量;选择20个特征时因为选择20个特征的分类精度已经近似或者由于采用所有特征的分类精度。限于篇幅,只展示每类选取10个标记样本的结果,选取其他数量的标记样本的结果类似。表2是在悉尼图像上当取10个标记样本,每个类别采用20个特征时的分类精度[%]、采用所有特征时所有类别的平均AUC[%]。表3是美国加州圣克莱门特图像上相应的结果。从表2~3中可以看出,新方法SCFS明显好于对比方法。总的来看,在美国加州圣克莱门特图像如图3上,所有类别所有特征的平均AUC可比其他的高2%。在悉尼图像上,可比其他的高2.8%。选用20个特征时,在两幅图像图像上,采用SCFS时专题类别的精度可以比其他方法高10%。另外,由于每类只标记少量的标记样本,很难处理实际的不平衡数据。随着特征数量的增加,尤其多于50个时,不平衡数据更难处理。因此每个类别的平均AUC大约在50%。
半监督特征选择方法Asymmetrically Local Discriminant Selection(ALDS)和其他的采用一对多策略的诊断性特征选择方法没有表现出足够的优势。ALDS同样采用了局部几何信息以弥补标记样本的不足带来的影响,但是受限于没有针对专题类别。采用一对多策略的诊断性特征选择方法能度量特征对专题类别的依赖性,但是受限于标记样本不足的影响。结果表明应该结合无标记样本信息和与专题类别相关的信息,才能提高性能。
表4是悉尼图像上每类10个标记样本即nl=10时,不同专题信息的前6个诊断性特征及其对专题信息提取的相对贡献。表5是圣克莱门特图像上每类10个标记样本即nl=10时,不同专题信息的诊断性特征及其对专题信息提取的相对贡献。其中相对贡献为每个特征的贡献与最大贡献的比值。一般来说,不同类别有不同的诊断性特征。另外,一个类别在不同图像中也有不同的诊断性特征。例如,在悉尼图像中,水有5个GLCM纹理特征,和一个形状特征和一个光谱特征。相反,圣克莱门特图像上,水有1个GLCM纹理特征,6个光谱特征。原因在于:1)悉尼图像中水有相似的光谱特征,所以纹理和形状特征诊断性相对较强;2)圣克莱门特图像上,不同部分的水有非常不同的光谱特征,所以纹理特征诊断性相对较弱。再如,悉尼图像中道路有明显的形状,所以形状特征诊断性较强。然而圣克莱门特图像上,道路的形状特征诊断性较弱在于标记样本太少。
即使一个类别在不同的图像中有相同的诊断性特征,特征的贡献也不同。原因在于不同图像的对象外表的相异性。
一般来说,纹理和光谱是高分辨率遥感图像对象最好的诊断性特征,如图2澳洲悉尼图像是GLCM Homogeneity of the 6-th channel,GLCM Contrast of the 6-th channel and Meanof the first channel。圣克莱门特图像是GLCM Mean of the 8-th channel,Std Dev.to NeighborPixels of the first channel and Circular Mean of the 7-th channel。
具体实施方式二:本实施方式与具体实施方式一不同的是:步骤一中预处理图像分割成对象的过程为:
采用现在通用的eCognition(或称为Definiens Delveloper)软件中的多尺度分割方法将图像分割成对象;图像分割是面向对象分析的基石,其本质是依据特定参数把图像分成对象;其中,参数形状设定为0.1、紧致度设定为0.5和尺度参数在10~100中调节。其它步骤及参数与具体实施方式一相同。
具体实施方式三:本实施方式与具体实施方式一或二不同的是:步骤一中提取出对象特征值具体过程为:
(1)令样本xi的标记为yi,yi∈{1,...,c},c是样本(对象)类别数量;对每类样本标记相同数量的样本(对象)nl,则一共标记标记v个样本,Xl=(x1,x2,...,xv)T,v=c×nl;剩下q个样本(对象)构成无标记样本(对象)Xu=(xv+1,xv+2,...,xv+q)T且v<<q;
(2)用eCognition自带的模块,在0°、45°、90°和135°方向上提取出灰度共生矩阵(gray-level co-occurrence matrix,GLCM)特征和灰度差分矢量(gray-level divergence vector,GLDV)特征;
(3)将步骤(2)中计算的所有矩阵加起来取平均以获得特征方向不变性的对象纹理特征矩阵;
(4)用eCognition自带的模块提取形状和光谱特征矩阵;
(5)对象纹理特征矩阵、形状特征矩阵和光谱特征矩阵组合成对象特征矩阵每个样本有m个特征。其它步骤及参数与具体实施方式一或二相同。
具体实施方式四:本实施方式与具体实施方式一至三之一不同的是:步骤二中构造样本权重矩阵在S中,度量样本对样本空间的局部几何信息和样本空间的判别结构的保持能力的具体过程为:
(1)计算任一样本xi与其他样本的欧式距离,并将欧式距离作为xi与其他样本在样本空间中的距离;与xi的欧式距离最小的k个样本作为xi的近邻或者相似样本,且k<nl;近邻样本组成样本集合N(xi);
(2)以一对多的模式重置所有样本的标记;当选择第t个类别作为专题类别时,将属于第t个类别样本的标记设为1,其他类别样本令为一类,且其标记设为-1;显然,N(xi)一般包括标记近邻样本和未标记近邻样本;
(3)设定邻近的标记样本两两之间的权重,邻近的标记样本之间的关系不仅有利于判别结构保持,也有利于局部几何结构保持;然而其它样本间的关系没有同时具备这两个特点,因此他们间的关系的权重最大;另外,邻近的标记样本与样本xi若为同类,则其权重设为γ2,且γ>1;邻近的标记样本与样本xi若为异类,则其权重设为γ2相反数,即-γ2;同类和异类样本权重设置为相反数能够更好地突出标记信息的判别能力;因此,邻近的标记样本两两之间的权重有助于同时保持局部几何信息和样本空间的判别结构;
(4)设定邻近的标记样本两两之间的权重;根据一致性假设,标记样本的无标记邻近样本对局部几何结构保持有利,且在某种程度上有助于判别结构的保持;因此设为第二大的权重;若xi属于第t个类别,其与无标记近邻的权重设为γ;若xi不属于第t个类别,其与无标记近邻的权重设为-γ;
(5)设定邻近的无标记样本两两之间的权重;无标记样本之间的关系仅仅表达了样本的局部几何结构,所以它们的关系相对不重要;另外,由于它们数量庞大,所以会对结果施加巨大影响;对此,无标记样本之间的关系也值得考虑,并设置无标记样本之间的关系权重为1;
(6)设定非邻近样本两两之间的权重;由于非近邻样本无助于保持局部几何结构,而局部几何结构是本数据分析算法的基础,因此设置为0;
(7)总的来说,权重矩阵S第i行第j列元素Sij的取值如公式(1)所示:
其中,惩罚参数γ根据经验在{2,...,10}中选择,一般来说,选择2就能取得足够好的效果;Xu是无标记样本(对象)。其它步骤及参数与具体实施方式一至三之一相同。
具体实施方式五:本实施方式与具体实施方式一至四之一不同的是:步骤三中的构建目标函数如下:
min W Σ i = 1 n | | S i XW - X i | | 2 + β Σ j = 1 m | | W j | | 2 - - - ( 2 )
min W 1 β | | SXW - X | | 2,1 + | | W | | 2,1 - - - ( 1 )
其中,正则化参数β>0,是投影矩阵或选择矩阵,Wj是第j个特征对应的权重,是S的第i行,即S=[S1,...,Sn]T;Sin是S中第i行n列的权重元素,1≤i≤v+q。其它步骤及参数与具体实施方式一至四之一相同。
具体实施方式六:本实施方式与具体实施方式一至五之一不同的是:步骤四中将步骤三得到的目标函数变换成简化的目标函数具体为:
min W 1 β | | E | | 2,1 + | | W | | 2,1 s . t . - βI SX E W = X - - - ( 4 )
其中,E=(SXW-X)/β,I是单位阵;令
A=(-βI SX)   (5)
则公式(4)变为
min U | | U | | 2,1 s . t . AU = X - - - ( 6 )
其中,优化矩阵
l2,1范数最小化问题是不光滑的,其求解比l1范数最小化问题困难得多,且现有的大多数求解方式的迭代收敛速度较慢;为此,将l2,1范数最小化问题变换成一个容易求解的问题;U为矩阵;如(3)~(6)所述,不同情况下的样本对将在不同程度上保持局部几何信息和样本空间的判别结构,因此设置为不同的权重;
最后公式变为求解如下拉格朗日问题:
L(U)=||U||2,1-Tr(ΛT(AU-X))   (7)
其中,Λ是β的对角阵;Tr为矩阵的迹。其它步骤及参数与具体实施方式一至五之一相同。
具体实施方式七:本实施方式与具体实施方式一至六之一不同的是:步骤五中对简化的目标函数进行迭代优化输出矩阵U,可以用于度量特征诊断能力;选择U的后m行为矩阵W的过程为:
首先固定对角阵D,优化矩阵U;然后固定U,优化对角阵D;重复这一过程直至收敛;其中,对角阵D中第i个对角元素为U(i)为U的第i行向量;
输入:正则化参数β,样本矩阵其中每l类标记nl个样本,惩罚参数γ,邻近样本数量k;
1)由式(1)得到权重矩阵S,由式(5)得到权重矩阵A;
2)令z=0,初始化对角阵D0=Im×m为单位阵;其中,D为对角阵;
3)在初始化D后,计算 U z + 1 = D z - 1 A T ( AD z - 1 A T ) - 1 X ;
4)计算对角阵Dz+1,其中,Dz+1第i个对角元素为Dz+1中的其它元素为0;
5)检查Uz+1与Uz,Dz+1与Dz的差值是否均小于预设值,如果差值均小于预设值,如0.01,则停止迭代;如果差值大于等于预设值则重复步骤3)~5);直至差值均小于预设值为止;最后输出矩阵U;迭代次数在经验上50步以内可以基本满足要求;其中,z是迭代次数;预设值可以认为就是个阈值,即设置一个足够小的值,可以认为是经验设定的;
6)输出:取W为U的后m行。其它步骤及参数与具体实施方式一至六之一相同。
采用以下实施例验证本发明的有益效果:
实施例一:
本实施例一种面向高空间分辨率遥感图像专题信息提取的半监督诊断性特征选择方法,具体是按照以下步骤制备的:
表1所提取的特征名称及其数量
表2
表2是对圣克莱门特图像选择20个特征时,每个专题信息的分类精度[%]及平均AUC[%]。提取的特征及其数量。
Asymmetrically Local Discriminant Selection(ALDS)是半监督特征选择方法缩写为ALS;是常用的特征选择方法。mRMR_OVA、ReliefF_OVA和SPEC_OVA是结合一对多策略(one-vs-all scheme)的诊断性特征选择方法。mRMR缩写为MRR,ReliefF缩写为REF,SPEC缩写为SPC,mRMR_OVA缩写为MOA,ReliefF_OVA缩写为ROA,SPEC_OVA,缩写为SOA,。
表3
表3是对悉尼图像选择20个特征时,每个专题信息的分类精度[%]及平均AUC[%]。
表4GLCM缩写成G,Correlation缩写成Cor,Circular缩写成CR,Homogeneity缩写成HY,Mean缩写成MN,Contrast缩写成CT,Brighter Neighbors缩写成BRNR,Neighbor Pixels缩写成NR PL,Direction缩写成Dir,Border Index缩写成BR IX,Elliptic Fit缩写成EC FT。特征前面的数字表示波段数目
表5 GLCM缩写成G,Mean缩写成MN,Circular缩写成CR,Darker Neighbors缩写成Darker,Homogeneity缩写成HY,Correlation缩写成Cor,Contrast缩写成CT,Brighter Neighbors缩写成BR NR,Neighbor Pixels缩写成NR PL,Direction缩写成Dir,Border Index缩写成BR IX,Elliptic Fit缩写成EC FT,Outer Border缩写成OR Outer。特征前面的数字表示波段数目。
本发明还可有其它多种实施例,在不背离本发明精神及其实质的情况下,本领域技术人员当可根据本发明作出各种相应的改变和变形,但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。

Claims (7)

1.一种面向高空间分辨率遥感图像专题信息提取的半监督诊断性特征选择方法,其特征在于一种面向高空间分辨率遥感图像专题信息提取的半监督诊断性特征选择方法具体是按照以下步骤进行的:
步骤一:将图像分割成对象即样本,将对象进行特征提取,提取出对象特征值;根据对象特征值获得对象特征矩阵为其中,特征矩阵为v+q行,m列;从所有样本任意选出v个样本进行标记,得到标记样本Xl=(x1,x2,...,xv)T,剩下q个样本为无标记样本Xu=(xv+1,xv+2,...,xv+q)T
步骤二:构造样本权重矩阵在S中,度量样本对样本空间的局部几何信息和样本空间的判别结构的保持能力;
步骤三:根据步骤一中的对象特征矩阵具有内在稀疏性;根据对象特征矩阵内在稀疏性将损失函数设定为基于l2,1范数最小化样本重构误差,并在样本重构误差中引入权重矩阵S,得到损失函数将损失函数与正则项||W||2,1求和构建目标函数,其中,β为正则化参数;W为投影矩阵或选择矩阵;
步骤四:将步骤三得到的目标函数变换成简化的目标函数;
步骤五:对简化的目标函数进行迭代优化输出矩阵U,选择U的后m行为投影矩阵或选择矩阵W;
步骤六:求各对象特征的W绝对值的和,选择出W绝对值的和最大的特征作为目标类别的诊断性特征子集;即完成了一种面向高空间分辨率遥感图像专题信息提取的半监督诊断性特征选择方法。
2.根据权利要求1所述一种面向高空间分辨率遥感图像专题信息提取的半监督诊断性特征选择方法,其特征在于:步骤一中图像分割成对象的过程为:
采用现在通用的eCognition软件中的多尺度分割方法将图像分割成对象;
其中,参数形状设定为0.1、紧致度设定为0.5和尺度参数在10~100中调节。
3.根据权利要求1所述一种面向高空间分辨率遥感图像专题信息提取的半监督诊断性特征选择方法,其特征在于:步骤一中提取出对象特征值具体过程为:
(1)令样本xi的标记为yi,yi∈{1,...,c},c是样本类别数量;对每类样本标记相同数量的样本nl,则一共标记标记v个样本,Xl=(x1,x2,...,xv)T,v=c×nl;剩下q个样本构成无标记样本Xu=(xv+1,xv+2,...,xv+q)T且v<<q;
(2)用eCognition自带的模块,在0°、45°、90°和135°方向上提取出灰度共生矩阵特征和灰度差分矢量特征;
(3)将步骤(2)中计算的所有矩阵加起来取平均以获得特征方向不变性的对象纹理特征矩阵;
(4)用eCognition自带的模块提取形状和光谱特征矩阵;
(5)对象纹理特征矩阵、形状特征矩阵和光谱特征矩阵组合成对象特征矩阵每个样本有m个特征。
4.根据权利要求1所述一种面向高空间分辨率遥感图像专题信息提取的半监督诊断性特征选择方法,其特征在于:步骤二中构造样本权重矩阵在S中,度量样本对样本空间的局部几何信息和样本空间的判别结构的保持能力的具体过程为:
(1)计算任一样本xi与其他样本的欧式距离,并将欧式距离作为xi与其他样本在样本空间中的距离;与xi的欧式距离最小的k个样本作为xi的近邻样本,且k<nl;近邻样本组成样本集合N(xi);
(2)当选择第t个类别作为专题类别时,将属于第t个类别样本的标记设为1,其他类别样本令为一类,且其标记设为-1;N(xi)一般包括标记近邻样本和未标记近邻样本;
(3)邻近的标记样本与样本xi若为同类,则其权重设为γ2,且γ>1;邻近的标记样本与样本xi若为异类,则其权重设为γ2相反数,即-γ2;同类和异类样本权重设置为相反数;
(4)根据一致性假设,标记样本的无标记邻近样本设为第二大的权重;若xi属于第t个类别,其与无标记近邻的权重设为γ;若xi不属于第t个类别,其与无标记近邻的权重设为-γ;
(5)设置无标记样本之间的关系权重为1;
(6)设置非近邻样本为0;
(7)权重矩阵S第i行第j列元素Sij的取值如公式(1)所示:
其中,惩罚参数γ根据经验在{2,...,10}中选择,Xu是无标记样本。
5.根据权利要求1所述一种面向高空间分辨率遥感图像专题信息提取的半监督诊断性特征选择方法,其特征在于:步骤三中的构建目标函数如下:
min W &Sigma; i = 1 n | | S i XW - X i | | 2 + &beta; &Sigma; j = 1 m | | W j | | 2 - - - ( 2 )
min W 1 &beta; | | SXW - X | | 2,1 + | | W | | 2,1 - - - ( 1 )
其中,正则化参数β>0,是投影矩阵或选择矩阵,Wj是第j个特征对应的权重,是S的第i行,即S=[S1,...,Sn]T;Sin是S中第i行n列的权重元素,1≤i≤v+q。
6.根据权利要求1所述一种面向高空间分辨率遥感图像专题信息提取的半监督诊断性特征选择方法,其特征在于:步骤四中将步骤三得到的目标函数变换成简化的目标函数具体为:
min W 1 &beta; | | E | | 2,1 + | | W | | 2,1 s . t . - &beta;I SX E W = X
其中,E=(SXW-X)/β,I是单位阵;令
A=(-βI SX)     (5)
则公式(4)变为
min U | | U | | 2,1 s . t . AU = X - - - ( 6 )
其中,优化矩阵
最后公式变为求解如下拉格朗日问题:
L(U)=||U||2,1-Tr(ΛT(AU-X))    (7)
其中,Λ是β的对角阵;Tr为矩阵的迹。
7.根据权利要求1所述一种面向高空间分辨率遥感图像专题信息提取的半监督诊断性特征选择方法,其特征在于:步骤五中对简化的目标函数进行迭代优化输出矩阵U,选择U的后m行为投影矩阵或选择矩阵W的过程为:
输入:正则化参数β,样本矩阵其中每l类标记nl个样本,惩罚参数γ,邻近样本数量k;
1)由式(1)得到权重矩阵S,由式(5)得到权重矩阵A;
2)令z=0,初始化对角阵D0=Im×m为单位阵;其中,D为对角阵;
3)在初始化D后,计算 U z + 1 = D z - 1 A T ( AD z - 1 A T ) - 1 X ;
4)计算对角阵Dz+1,其中,Dz+1第i个对角元素为Dz+1中的其它元素为0;U(i)为U的第i行向量;
5)检查Uz+1与Uz,Dz+1与Dz的差值是否均小于预设值,如果差值均小于预设值,则停止迭代;如果差值大于等于预设值则重复步骤3)~5);直至差值均小于预设值为止;最后输出矩阵U;其中,z是迭代次数;
6)输出:取W为U的后m行。
CN201510119477.6A 2015-03-18 2015-03-18 一种面向高空间分辨率遥感图像专题信息提取的半监督诊断性特征选择方法 Active CN104680169B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510119477.6A CN104680169B (zh) 2015-03-18 2015-03-18 一种面向高空间分辨率遥感图像专题信息提取的半监督诊断性特征选择方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510119477.6A CN104680169B (zh) 2015-03-18 2015-03-18 一种面向高空间分辨率遥感图像专题信息提取的半监督诊断性特征选择方法

Publications (2)

Publication Number Publication Date
CN104680169A true CN104680169A (zh) 2015-06-03
CN104680169B CN104680169B (zh) 2017-11-17

Family

ID=53315186

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510119477.6A Active CN104680169B (zh) 2015-03-18 2015-03-18 一种面向高空间分辨率遥感图像专题信息提取的半监督诊断性特征选择方法

Country Status (1)

Country Link
CN (1) CN104680169B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105046286A (zh) * 2015-08-31 2015-11-11 哈尔滨工业大学 基于自动视图生成和联合l1,2范数最小化的监督多视图特征选择方法
CN105320963A (zh) * 2015-10-21 2016-02-10 哈尔滨工业大学 面向高分遥感图像的大尺度半监督特征选择方法
CN105809172A (zh) * 2016-03-07 2016-07-27 哈尔滨工业大学 面向高分辨率遥感图像的有效半监督特征选择方法
CN108154069A (zh) * 2016-12-02 2018-06-12 航天星图科技(北京)有限公司 一种基于tm影像的泥石流信息提取方法
CN109871798A (zh) * 2019-02-01 2019-06-11 浙江大学 一种基于卷积神经网络的遥感影像建筑物提取方法
CN111144423A (zh) * 2019-12-26 2020-05-12 哈尔滨工业大学 基于一维组卷积神经网络的高光谱遥感数据多尺度光谱特征提取方法
CN111898710A (zh) * 2020-07-15 2020-11-06 中国人民解放军火箭军工程大学 一种图的特征选择方法及系统
CN112231933A (zh) * 2020-11-06 2021-01-15 中国人民解放军国防科技大学 一种面向雷达电磁干扰效应分析的特征选择方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6137909A (en) * 1995-06-30 2000-10-24 The United States Of America As Represented By The Secretary Of The Navy System and method for feature set reduction
US20060050953A1 (en) * 2004-06-18 2006-03-09 Farmer Michael E Pattern recognition method and apparatus for feature selection and object classification
CN101770584A (zh) * 2009-12-30 2010-07-07 重庆大学 高光谱遥感数据鉴别特征提取方法
CN102902984A (zh) * 2012-09-27 2013-01-30 西安电子科技大学 基于局部一致性的遥感影像半监督投影降维方法
CN104077408A (zh) * 2014-07-11 2014-10-01 浙江大学 大规模跨媒体数据分布式半监督内容识别分类方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6137909A (en) * 1995-06-30 2000-10-24 The United States Of America As Represented By The Secretary Of The Navy System and method for feature set reduction
US20060050953A1 (en) * 2004-06-18 2006-03-09 Farmer Michael E Pattern recognition method and apparatus for feature selection and object classification
CN101770584A (zh) * 2009-12-30 2010-07-07 重庆大学 高光谱遥感数据鉴别特征提取方法
CN102902984A (zh) * 2012-09-27 2013-01-30 西安电子科技大学 基于局部一致性的遥感影像半监督投影降维方法
CN104077408A (zh) * 2014-07-11 2014-10-01 浙江大学 大规模跨媒体数据分布式半监督内容识别分类方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
陈曦等: ""Multiview Feature Selection for Very High Resolution Remote Sensing Images"", 《INSTRUMENTATION AND MEASUREMENT,COMPUTER,COMMUNICATION AND CONTROL(IMCCC),2014 FORTH INTERNATIONAL CONFERENCE ON IEEE》 *
陈曦等: ""semisupervised feature selection for unbalanced sample sets of VRH images"", 《IEEE GEOSCIENCE AND REMOTE SENSING LETTERS》 *

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105046286B (zh) * 2015-08-31 2018-11-02 哈尔滨工业大学 基于自动视图生成和联合l1,2范数最小化的监督多视图特征选择方法
CN105046286A (zh) * 2015-08-31 2015-11-11 哈尔滨工业大学 基于自动视图生成和联合l1,2范数最小化的监督多视图特征选择方法
CN105320963A (zh) * 2015-10-21 2016-02-10 哈尔滨工业大学 面向高分遥感图像的大尺度半监督特征选择方法
CN105320963B (zh) * 2015-10-21 2018-10-02 哈尔滨工业大学 面向高分遥感图像的大尺度半监督特征选择方法
CN105809172B (zh) * 2016-03-07 2019-07-02 哈尔滨工业大学 面向高分辨率遥感图像的有效半监督特征选择方法
CN105809172A (zh) * 2016-03-07 2016-07-27 哈尔滨工业大学 面向高分辨率遥感图像的有效半监督特征选择方法
CN108154069A (zh) * 2016-12-02 2018-06-12 航天星图科技(北京)有限公司 一种基于tm影像的泥石流信息提取方法
CN109871798A (zh) * 2019-02-01 2019-06-11 浙江大学 一种基于卷积神经网络的遥感影像建筑物提取方法
CN111144423A (zh) * 2019-12-26 2020-05-12 哈尔滨工业大学 基于一维组卷积神经网络的高光谱遥感数据多尺度光谱特征提取方法
CN111144423B (zh) * 2019-12-26 2023-05-05 哈尔滨工业大学 基于一维组卷积神经网络的高光谱遥感数据多尺度光谱特征提取方法
CN111898710A (zh) * 2020-07-15 2020-11-06 中国人民解放军火箭军工程大学 一种图的特征选择方法及系统
CN111898710B (zh) * 2020-07-15 2023-09-29 中国人民解放军火箭军工程大学 一种图的特征选择方法及系统
CN112231933A (zh) * 2020-11-06 2021-01-15 中国人民解放军国防科技大学 一种面向雷达电磁干扰效应分析的特征选择方法

Also Published As

Publication number Publication date
CN104680169B (zh) 2017-11-17

Similar Documents

Publication Publication Date Title
CN104680169A (zh) 一种面向高空间分辨率遥感图像专题信息提取的半监督诊断性特征选择方法
Li et al. A deep learning method for change detection in synthetic aperture radar images
CN110443143B (zh) 多分支卷积神经网络融合的遥感图像场景分类方法
CN109086700B (zh) 基于深度卷积神经网络的雷达一维距离像目标识别方法
CN108388927B (zh) 基于深度卷积孪生网络的小样本极化sar地物分类方法
CN107292317B (zh) 基于浅层特征与t矩阵深度学习的极化sar分类方法
CN103034863B (zh) 一种结合核Fisher与多尺度提取的遥感影像道路获取方法
CN108229551B (zh) 一种基于紧凑字典稀疏表示的高光谱遥感图像分类方法
CN105069811B (zh) 一种多时相遥感图像变化检测方法
CN102999762B (zh) 基于Freeman分解和谱聚类的极化SAR图像分类方法
CN105160351B (zh) 基于锚点稀疏图的半监督高光谱分类方法
CN112699717A (zh) 基于gan网络的sar图像生成方法及生成装置
CN104657717A (zh) 一种基于分层核稀疏表示的行人检测方法
CN106096655A (zh) 一种基于卷积神经网络的光学遥感图像飞机检测方法
CN105760900A (zh) 基于近邻传播聚类和稀疏多核学习的高光谱图像分类方法
CN110807485B (zh) 基于高分遥感影像二分类语义分割图融合成多分类语义图的方法
CN104751475A (zh) 一种面向静态图像对象识别的特征点优选匹配方法
CN114842264A (zh) 一种基于多尺度空谱特征联合学习的高光谱图像分类方法
CN106611422A (zh) 基于素描结构的随机梯度贝叶斯sar图像分割方法
CN109034213B (zh) 基于相关熵原则的高光谱图像分类方法和系统
CN111738052B (zh) 基于深度学习的多特征融合高光谱遥感地物分类方法
CN103714353A (zh) 基于视觉先验模型的极化sar图像分类方法
CN105787505A (zh) 一种结合稀疏编码和空间约束的红外图像聚类分割方法
CN105069403A (zh) 一种基于分块统计特征与字典学习稀疏表示分类的三维人耳识别
CN105160666B (zh) 基于非平稳分析与条件随机场的sar图像变化检测方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20190618

Address after: 150000 Heilongjiang Harbin Dalian economic and Trade Zone, the North Road and Xingkai Road intersection

Patentee after: HIT ROBOT GROUP Co.,Ltd.

Address before: 150001 No. 92 West straight street, Nangang District, Heilongjiang, Harbin

Patentee before: Harbin Institute of Technology

PP01 Preservation of patent right
PP01 Preservation of patent right

Effective date of registration: 20240626

Granted publication date: 20171117