CN113075129B - 一种基于近邻子空间划分高光谱影像波段选择方法及系统 - Google Patents

一种基于近邻子空间划分高光谱影像波段选择方法及系统 Download PDF

Info

Publication number
CN113075129B
CN113075129B CN202110174636.8A CN202110174636A CN113075129B CN 113075129 B CN113075129 B CN 113075129B CN 202110174636 A CN202110174636 A CN 202110174636A CN 113075129 B CN113075129 B CN 113075129B
Authority
CN
China
Prior art keywords
band
hyperspectral image
subspace
bands
correlation coefficient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110174636.8A
Other languages
English (en)
Other versions
CN113075129A (zh
Inventor
朱信忠
徐慧英
王俊
唐厂
赵建民
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Normal University CJNU
Original Assignee
Zhejiang Normal University CJNU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Normal University CJNU filed Critical Zhejiang Normal University CJNU
Priority to CN202110174636.8A priority Critical patent/CN113075129B/zh
Publication of CN113075129A publication Critical patent/CN113075129A/zh
Priority to PCT/CN2021/135928 priority patent/WO2022166363A1/zh
Priority to LU502854A priority patent/LU502854B1/en
Priority to ZA2022/07737A priority patent/ZA202207737B/en
Application granted granted Critical
Publication of CN113075129B publication Critical patent/CN113075129B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • G06V20/194Terrestrial scenes using hyperspectral data, i.e. more or other wavelengths than RGB
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/01Arrangements or apparatus for facilitating the optical investigation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24147Distances to closest patterns, e.g. nearest neighbour classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N2021/1793Remote sensing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Evolutionary Computation (AREA)
  • Biochemistry (AREA)
  • Analytical Chemistry (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Remote Sensing (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于近邻子空间划分高光谱影像波段选择方法及系统,其中涉及的一种基于近邻子空间划分高光谱影像波段选择方法,包括:S11.输入高光谱影像立方体,并计算输入的高光谱影像立方体中包含的任意两个相邻波段之间的相关系数,得到相关系数的向量;S12.根据得到的相关系数的向量寻找所有相关系数极值点,并在寻找到的所有相关系数极值点中筛选出相关系数极小值点,通过筛选出的相关系数极小值点确定最优划分的高光谱波段子空间;S13.根据子空间中波段数的大小对子空间进行排序,并计算每个子空间中波段的信息熵,根据计算得到的信息熵从子空间中选取所需数量的特征波段。本发明可以确保最终选取的波段包含相对完整的信息。

Description

一种基于近邻子空间划分高光谱影像波段选择方法及系统
技术领域
本发明涉及高光谱遥感影像波段选择技术领域,尤其涉及一种基于近邻子空间划分高光谱影像波段选择方法及系统。
背景技术
相比于传统的RGB图像,高光谱影像具有信息量丰富、波段数目多、分辨率高等特点,因此它被广泛应用于目标检测、环境监测、矿物勘探、农业资源调查和海洋研究等方面。由于其包含大量的波段信息,且相邻波段之间的特征相似度较高,这在一定程度上增加了高光谱影像分类的计算复杂度,并且还会影响分类器最终的分类精度。所以需要对高光谱影像进行降维处理,从而解决维度灾难问题。
特征提取和特征选择一直是数据降维领域的研究热点,这两种方法也通常作为高光谱影像降维的有效方式。在高光谱影像中,特征选择也可以称为波段选择。
在无监督的波段选择中,基于聚类的方法都取得了较好的结果。Yang等人主要是采用K-means算法不断计算所有样本点与当前候选中心的距离来确定最终的聚类中心,然后通过遍历所有的簇来选取特征波段。然而由于K-means聚类对初始聚类中心的选取非常敏感,通常需要采用不同的初始化方法来最终确定一个较好的解决办法。另外只有当数据集样本数量较少时,该方法才能够表现出良好的性能。对于样本数量较多的数据集,其多次迭代往往需要花费大量的时间,效率较低。为了解决K-means聚类算法对初始条件敏感性的问题,Qian等人提出了一种基于样本的AP聚类算法。它考量各个波段之间的相关性,然后通过最大化目标函数来获得特征波段子集。尽管它的聚类结果表现的比较稳定,然而对于包含波段数目较多的数据集,其往往具有较高的时间复杂度。此外,Ahmad和Jia等人在聚类的过程中,往往只在单个波段或者成对波段的基础上进行判断选取,忽略了所选波段子集内部之间的关系。进一步来说,就是只考虑到划分时波段之间的相关性,忽略了最后选择的波段之间的关联。一般来说,应将最后选择的波段看为一个整体而非每个单独存在的个体。在选取的波段子集中,既要保证特征波段之间差异性最大,也要保证信息量最多。
目前来看,大多数基于聚类的波段选择算法都存在对聚类中心数的强敏感性问题。具体表现在,当选取的聚类中心数较少时,精度较低;当选取的聚类中心数超过一定数量时,精度反而会随着聚类中心数的增加呈现出一种下降的趋势。这两种情况显然不满足实际需要。
为了解决这个问题,本发明提出了一种基于近邻子空间划分高光谱影像波段选择方法及系统。
发明内容
本发明的目的是针对现有技术的缺陷,提供了一种基于近邻子空间划分高光谱影像波段选择方法及系统。
为了实现以上目的,本发明采用以下技术方案:
一种基于近邻子空间划分高光谱影像波段选择方法,包括:
S1.输入高光谱影像立方体,并计算输入的高光谱影像立方体中包含的任意两个相邻波段之间的相关系数,得到相关系数的向量;
S2.根据得到的相关系数的向量寻找所有相关系数极值点,并在寻找到的所有相关系数极值点中筛选出相关系数极小值点,通过筛选出的相关系数极小值点确定最优划分的高光谱波段子空间;
S3.按照每个子空间所包含的波段数大小对子空间进行排序,并计算每个子空间中波段的信息熵,按照信息熵大小从这若干个子空间中选取所需数量的特征波段。
进一步的,所述步骤S1中计算输入的高光谱影像立方体中包含的任意两个相邻波段之间的相关系数,得到相关系数的向量,表示为:
Figure GDA0004067984700000021
Figure GDA0004067984700000022
其中,X∈RW×H×L表示高光谱影像立方体,L表示高光谱影像立方体所包含的波段数目,W和H分别表示每个波段的宽度和高度;Xi表示高光谱影像数据集中第i个波段;Xj表示高光谱影像数据集中第j个波段;Xi(m,n)表示Xi第m行第n列的值;R表示相关系数的向量;Vi表示第i个波段的像素差;Vj表示第j个波段的像素差;Vo表示第o个波段的像素差;Xo表示高光谱影像数据集中第o个波段;
Figure GDA0004067984700000031
表示第o个波段的像素均值;o={i,j}。
进一步的,所述步骤S2中筛选出相关系数极小值点是通过MATLAB的工具箱进行筛选的。
进一步的,所述通过MATLAB的工具箱进行筛选的公式表示为:
y=findpeaks(-R)
其中,findpeaks表示MATLAB内置函数;R表示整个数据集相邻波段之间的相关系数向量;y表示包含所有极小值的向量。
进一步的,所述步骤S3中计算波段信息熵的计算公式表示为:
Figure GDA0004067984700000032
其中,Ω表示整个样本空间,p(i)表示样本i出现在图像中的概率;H表示样本i的信息熵;
当需要选择的特征波段的数量小于或等于划分的子空间个数时,则从排序后的子空间中选出对应数量的波段子空间,然后从选出的子空间中选取信息熵最大的波段作为特征波段;当需要选择的特征波段的数量大于划分的子空间个数时,则从每个子空间中选出S个波段作为特征波段。
进一步的,所述步骤S3中S的具体计算公式表示为:
Figure GDA0004067984700000033
/>
其中,Z表示每个波段子空间所包含的波段数目;L表示整个数据集所包含的波段数;K表示需要选取的特征波段数;S表示选取的波段;
通过计算最终得到所需的特征波段子集Y。
相应的,还提供一种基于近邻子空间划分高光谱影像波段选择系统,包括:
计算模块,用于输入高光谱影像立方体,并计算输入的高光谱影像立方体中包含的任意两个相邻波段之间的相关系数,得到相关系数的向量;
筛选模块,用于根据得到的相关系数的向量寻找所有相关系数极值点,并在寻找到的所有相关系数极值点中筛选出相关系数极小值点,通过筛选出的相关系数极小值点确定最优划分的高光谱波段子空间;
选取模块,用于按照每个子空间所包含的波段数大小对子空间进行排序,并计算每个子空间中波段的信息熵,按照信息熵大小从这若干个子空间中选取所需数量的特征波段。
进一步的,所述计算模块中计算输入的高光谱影像立方体中包含的任意两个相邻波段之间的相关系数,得到相关系数的向量,表示为:
Figure GDA0004067984700000041
Figure GDA0004067984700000042
其中,X∈RW×H×L表示高光谱影像立方体,L表示高光谱影像立方体所包含的波段数目,W和H分别表示每个波段的宽度和高度;Xi表示高光谱影像数据集中第i个波段;Xj表示高光谱影像数据集中第j个波段;Xi(m,n)表示Xi第m行第n列的值;R表示相关系数的向量;Vi表示第i个波段的像素差;Vj表示第j个波段的像素差;Vo表示第o个波段的像素差;Xo表示高光谱影像数据集中第o个波段;
Figure GDA0004067984700000043
表示第o个波段的像素均值;o={i,j}。
进一步的,所述选取模块中计算波段信息熵的计算公式表示为:
Figure GDA0004067984700000044
其中,Ω表示整个样本空间,p(i)表示样本i出现在图像中的概率;H表示样本i的信息熵;
当需要选择的特征波段的数量小于或等于划分的子空间个数时,则从排序后的子空间中选出对应数量的波段子空间,然后从选出的子空间中选取信息熵最大的波段作为特征波段;当需要选择的特征波段的数量大于划分的子空间个数时,则从每个子空间中选出S个波段作为特征波段。
进一步的,所述选取模块中S的具体计算公式,表示为:
Figure GDA0004067984700000045
其中,Z表示每个波段子空间所包含的波段数目;L表示整个数据集所包含的波段数;K表示需要选取的特征波段数;S表示选取的波段;
通过计算最终得到所需的特征波段子集Y。
与现有技术相比,本发明通过计算相邻波段之间的相关系数,根据相关系数的曲率变化情况找到分组临界点,然后以临界点数目作为最终确定的聚类簇个数。此外以信息熵作为波段选取的评价指标。在对每个聚类簇进行波段选取时,将信息熵作为权重对每个波段排序,然后选择信息熵最大的波段作为特征波段,这样可以确保最终选取的波段包含相对完整的信息。
附图说明
图1是实施例一提供的一种基于近邻子空间划分高光谱影像波段选择方法流程图;
图2是实施例一提供的一种基于近邻子空间划分高光谱影像波段选择框图;
图3是实施例一提供的近邻子空间划分示例示意图;
图4是实施例一提供的Indian Pines数据集上所有波段的信息熵示例示意图;
图5是实施例二提供的不同的高光谱影像波段选择方法在Botswana数据集上的Overall-Accuracy曲线示意图;
图6是实施例二提供的不同的高光谱影像波段选择方法在Salinas数据集上的Overall-Accuracy曲线示意图;
图7是实施例二提供的不同的高光谱影像波段选择方法在Indian Pines数据集上的Overall-Accuracy曲线示意图。
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
本发明针对现有缺陷,提供了一种基于近邻子空间划分高光谱影像波段选择方法及系统。
实施例一
本实施例提供的一种基于近邻子空间划分高光谱影像波段选择方法,如图1、2所示,包括:
S11.输入高光谱影像立方体,并计算输入的高光谱影像立方体中包含的任意两个相邻波段之间的相关系数,得到相关系数的向量;
S12.根据得到的相关系数的向量寻找所有相关系数极值点,并在寻找到的所有相关系数极值点中筛选出相关系数极小值点,通过筛选出的相关系数极小值点确定最优划分的高光谱波段子空间;
S13.按照每个子空间所包含的波段数大小对子空间进行排序,并计算每个子空间中波段的信息熵,按照信息熵大小从这若干个子空间中选取所需数量的特征波段。
在本实施例中,基于波段之间是有序排列,并且距离较远的波段之间相关性较低的思想,因此认为按照有序波段进行划分不仅可以降低波段子空间之间的相关性,同时也能避免最后选取的特征波段之间相关性较高的问题。基于此,本实施例提出了一种基于近邻子空间划分的高光谱影像波段选择方法,简称为SEASP。其中,SEASP采用了聚类和排序相结合的方式来解决当聚类中心数较少时精度较低的问题。
在步骤S11中,输入高光谱影像立方体,并计算输入的高光谱影像立方体中包含的任意两个相邻波段之间的相关系数,得到相关系数的向量。
对于给定的输入高光谱影像立方体,首先计算其包含的任意两个相邻波段之间的相关系数,得到对应的相关系数向量。
其中,计算高光谱影像立方体中所包含的任意两个波段之间的相关系数的具体步骤为:
给定一个高光谱影像立方体X∈RW×H×L,其中L代表高光谱影像立方体所包含的波段数目,W和H则分别代表每个波段的宽度和高度。
一般来说,可将高光谱波段影像看作一个由具有不同光谱值的像素点组成的二维矩阵,所以令Xi代表高光谱影像数据集中第i个波段。那么波段Xi和Xj之间的相关系数计算方法如下:
Figure GDA0004067984700000061
Figure GDA0004067984700000062
其中,X∈RW×H×L表示高光谱影像立方体,L表示高光谱影像立方体所包含的波段数目,W和H分别表示每个波段的宽度和高度;Xi表示高光谱影像数据集中第i个波段;Xj表示高光谱影像数据集中第j个波段;Xi(m,n)表示Xi第m行第n列的值;R表示相关系数的向量;Vi表示第i个波段的像素差;Vj表示第j个波段的像素差;Vo表示第o个波段的像素差;Xo表示高光谱影像数据集中第o个波段;
Figure GDA0004067984700000071
表示第o个波段的像素均值;o={i,j}。/>
Figure GDA0004067984700000072
的计算方法如下:
Figure GDA0004067984700000073
考虑到高光谱波段之间的有序性和非近邻空间的弱相关性,只计算相邻波段之间的相关系数,最后得到相关系数向量。
本实施例对于输入的高光谱影像立方体X∈RW×H×L,将其包含的波段影像看作一个由具有不同光谱值的像素点组成的二维矩阵,然后按照上述计算方法求出任意两个相邻波段之间的相关系数,得到相关系数向量。
在步骤S12中,根据得到的相关系数的向量寻找所有相关系数极值点,并在寻找到的所有相关系数极值点中筛选出相关系数极小值点,通过筛选出的相关系数极小值点确定最优划分的高光谱波段子空间。
从相关系数向量中寻找所有相关系数极值点,通过极小值点的选取确定最优划分的高光谱波段子空间。
在聚类算法的思想中,衡量划分的标准通常是使得类内相关度最高,类间相关度最低。基于此,在SEASP中,主要是根据相关系数的变化率来确定分组之间的相关性大小。具体来说,若两个波段之间的相关性在某个区间内最小,即相关系数的变化率在该区间内最大,说明这两个波段在很大概率上不属于同一组,为两个相邻分组之间的分割点。考虑到波段之间的有序性和非近邻空间的弱相关性,实施例只计算相邻波段的相关系数,此时聚类划分问题便转化为在有序数据集中寻找分组之间的间断点问题。所以根据得到的相关系数向量计算其包含的所有相关系数极小值,从而得到所有子空间的间断点。
从相关系数向量中寻找所有相关系数极小值点的具体步骤为:
在有序的高光谱波段中,聚类划分便转化为在有序数据集中寻找分组之间的间断点。对于寻找相关系数极小值点问题,可以采用MATLAB现有的工具箱进行解决,具体计算方法如下所示:
y=findpeaks(-R)
其中,findpeaks表示MATLAB内置函数;R表示整个数据集相邻波段之间的相关系数向量;y表示包含所有极小值的向量。
具体来说,findpeaks函数在判断某一点是否为峰值点时,主要是将该点处的函数值和其左右相邻的函数值进行比较,若其为最大,则将其判断为该波形的一个波峰点。所以当对输入参数进行取反操作时,求得的波峰点便是原始数据的波谷点。现假设在点x处的函数值为F(x),那么当F(x)同时满足F(x)<F(x-1)和F(x)<F(x+1)时,便将其作为一个波谷点。通过极小值点的选取来确定有序波段之间的间断点,从而得到划分的波段子空间,具体实例如图3所示。
在步骤S13中,按照每个子空间所包含的波段数大小对子空间进行排序,并计算每个子空间中波段的信息熵,按照信息熵大小从这若干个子空间中选取所需数量的特征波段。
按照每个子空间所包含的波段数大小对其进行排序,并计算每个波段的信息熵,最后按照信息熵大小从这若干个子空间中选取所需数量的特征波段。
计算每个波段的信息熵大小并从中选择所需数量的特征波段的具体步骤为:
信息熵用来衡量图像中包含的平均信息量的大小,一个图像的信息熵越大,那么该图像所包含的信息也就越丰富。所以信息熵作为衡量波段重要性程度的一个度量指标是较为合适的。关于其具体的计算方法如下所示:
Figure GDA0004067984700000081
其中,Ω表示整个样本空间,p(i)表示样本i出现在图像中的概率;H表示样本i的信息熵。
如图4给出了Indian Pines数据集中所有波段的信息熵示例。
在根据信息熵对所有波段进行排序的过程中,考虑到传入参数K,即所需波段数量的变化,将划分的每个波段子空间按照其包含的波段数大小进行排序,得到排序后的波段子空间。
当所需波段的数量小于或等于划分的子空间个数时,则从排序后的子空间中选出对应数量的波段子空间,然后从选出的子空间中选取信息熵最大的波段作为特征波段;当所需波段的数量大于划分的子空间个数时,则从每个子空间中选出S个波段作为特征波段。
具体为:当K小于或等于划分子空间个数时,从每个子空间中选取信息熵最大的波段作为特征波段;当K大于划分子空间个数时,从每个子空间中按照信息熵的大小选取S个波段。其中,关于S的具体计算方法如下:
Figure GDA0004067984700000091
其中,Z表示每个波段子空间所包含的波段数目;L表示整个数据集所包含的波段数;K表示需要选取的特征波段数;S表示选取的波段。
通过上式的计算,可以最终得到所需特征波段子集Y。
与现有技术相比,本实施例通过计算相邻波段之间的相关系数,根据相关系数的曲率变化情况找到分组临界点,然后以临界点数目作为最终确定的聚类簇个数。此外以信息熵作为波段选取的评价指标。在对每个聚类簇进行波段选取时,将信息熵作为权重对每个波段排序,然后选择信息熵最大的波段作为特征波段,这样可以确保最终选取的波段包含相对完整的信息。
实施例二
本实施例提供的一种基于近邻子空间划分高光谱影像波段选择方法与实施例一的区别在于:
本实施例为了验证所提出的SEASP算法在高光谱波段选择上的有效性,进行了大量的相关实验。
实验中主要选取了三个公共数据集,分别为Botswana数据集、Salinas数据集和Indian Pines数据集。选取的分类器有KNN、SVM和LDA,KNN分类器的参数k设置为5,SVM统一采用的距离函数为高斯核函数,Indian Pines和Botswana数据集的惩罚系数为10000,Salinas数据集的惩罚系数为100。由于上述三种分类器都是有监督的分类方法,所以在进行实验的时候,随机选取整个数据集的10%作为训练样本,剩下的数据作为测试样本。此外,本实施例还和当下几种比较先进的算法进行了对比,它们分别是ASPS_MN、ASPS_IE、TOF、UBS和FNGBS。对于三个公共的高光谱影像数据集,由于目前其最佳选择的波段数目未知,所以在本次实验中,选取波段数目的范围为5到50。为了充分展示波段数目设置的随机性,实验选取的波段数目一共有12个,分别为5,7,10,15,26,30,36,39,42,44,47,49。本次实验采用了三种度量标准来对分类的结果进行分析,分别为总体精度(OA),平均总体精度(AOA)以及Kappa系数(Kappa)。所有的实验均在MATLAB 2016a上运行,CPU为i7-5500U,2.40GHz,内存8Gb。
表1展示了竞争算法在三个公共数据集上所表现出的AOA和Kappa。其中,在进行测试比较时,三个数据集选取的波段数目分别为36、5和5,AOA为10次运行结果的范围。为了清晰地展现出所比较算法在三个数据集上的性能,在表1中以粗体的形式将两种较好的分类结果标出。
Figure GDA0004067984700000101
表1
从图5、图6、图7可以看出,本实施例所提出的算法在一些特定的波段数目上所表现出来的性能优于其他算法。在图5中,当选择的波段数目大于25时,SEASP始终保持一个稳定性,而其他算法则处于上下波动状态。此外,从所有分类器的结果可以看出,当选择的波段数目较少时,有些算法的结果不如其他算法,这也反映出它们对选择波段数目的强敏感性。只有当选择的波段数目达到一定数量时,其才能够表现出一个更好的性能。从整体来看,随着选择波段数目的不断增加,SEASP所表现出的结果变化幅度并没有其他算法那么大,这也侧面验证了其对选择波段数目的敏感性是较小的,同时说明了其在少量选择的波段数目上也能够表现出不错的性能。在图6和图7中,随着选择波段数目的增加,SEASP基本上是处于稳定上升的状态,没有出现明显的反弹现象。而其他算法则不太稳定,当选择的波段数目变多时,相反结果还会出现下降的趋势。这反映了随着选取波段数目的增加,这些算法都不可避免的选取了一些冗余波段,这就导致了分类精度的下降。而本实施例所提出的算法则不会出现这个明显的现象,也说明了在选取波段时,SEASP充分考虑到最后选择的目标波段之间强相关性的问题,从而改正了大多数基于聚类的波段选择算法的不足。
为了进一步验证所提出方法的可行性,在三个数据集的波段选择上还计算了所有竞争算法的时间。其中,在三个数据集的波段选取数目上面,分别设置为10,15,20,呈现出一种递增的趋势。表2给出了不同算法在不同数据集上选择同样数目波段所耗费的时间。从表中结果可以看出,本实施例提出的算法所耗费时间是较小的,并且与其他算法相比也具有一定的可比性。
Figure GDA0004067984700000111
表2
从上述一系列实验可知,本实施例所提出的算法不仅原理简单,而且在三个公共数据集的分类性能上与其他算法具有一定的可比性,甚至优于其他算法,另外其执行速度也是较快的,从而验证了该算法的有效性和可行性。
实施例三
本实施例提供一种基于近邻子空间划分高光谱影像波段选择系统,包括:
计算模块,用于输入高光谱影像立方体,并计算输入的高光谱影像立方体中包含的任意两个相邻波段之间的相关系数,得到相关系数的向量;
筛选模块,用于根据得到的相关系数的向量寻找所有相关系数极值点,并在寻找到的所有相关系数极值点中筛选出相关系数极小值点,通过筛选出的相关系数极小值点确定最优划分的高光谱波段子空间;
选取模块,用于按照每个子空间所包含的波段数大小对子空间进行排序,并计算每个子空间中波段的信息熵,按照信息熵大小从这若干个子空间中选取所需数量的特征波段。
进一步的,所述计算模块中计算输入的高光谱影像立方体中包含的任意两个相邻波段之间的相关系数,表示为:
Figure GDA0004067984700000121
Figure GDA0004067984700000122
其中,X∈RW×H×L表示高光谱影像立方体,L表示高光谱影像立方体所包含的波段数目,W和H分别表示每个波段的宽度和高度;Xi表示高光谱影像数据集中第i个波段;Xj表示高光谱影像数据集中第j个波段;Xi(m,n)表示Xi第m行第n列的值;R(Xi,Xj)表示两个相邻波段之间的相关系数;Vi表示第i个波段的像素差;Vj表示第j个波段的像素差;Vo表示第o个波段的像素差;Xo表示高光谱影像数据集中第o个波段;
Figure GDA0004067984700000123
表示第o个波段的像素均值;o={i,j}。
进一步的,所述选取模块中计算波段信息熵的计算公式表示为:
Figure GDA0004067984700000124
其中,Ω表示整个样本空间,p(i)表示样本i出现在图像中的概率;H表示样本i的信息熵;
当需要选择的特征波段的数量小于或等于划分的子空间个数时,则从排序后的子空间中选出对应数量的波段子空间,然后从选出的子空间中选取信息熵最大的波段作为特征波段;当需要选择的特征波段的数量大于划分的子空间个数时,则从每个子空间中选出S个波段作为特征波段。
进一步的,所述选取模块中S的具体计算公式,表示为:
Figure GDA0004067984700000125
其中,Z表示每个波段子空间所包含的波段数目;L表示整个数据集所包含的波段数;K表示需要选取的特征波段数;S表示选取的波段;
通过计算最终得到所需的特征波段子集Y。
需要说明的是,本实施例提供的一种基于近邻子空间划分高光谱影像波段选择系统与实施例一类似,在此不多做赘述。
与现有技术相比,本实施例通过计算相邻波段之间的相关系数,根据相关系数的曲率变化情况找到分组临界点,然后以临界点数目作为最终确定的聚类簇个数。此外以信息熵作为波段选取的评价指标。在对每个聚类簇进行波段选取时,将信息熵作为权重对每个波段排序,然后选择信息熵最大的波段作为特征波段,这样可以确保最终选取的波段包含相对完整的信息。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (4)

1.一种基于近邻子空间划分高光谱影像波段选择方法,其特征在于,包括:
S1.输入高光谱影像立方体,并计算输入的高光谱影像立方体中包含的任意两个相邻波段之间的相关系数,得到相关系数的向量;
所述步骤S1中计算输入的高光谱影像立方体中包含的任意两个相邻波段之间的相关系数,得到相关系数的向量,表示为:
Figure QLYQS_1
Figure QLYQS_2
其中,X∈RW×H×L表示高光谱影像立方体,L表示高光谱影像立方体所包含的波段数目,W和H分别表示每个波段的宽度和高度;Xi表示高光谱影像数据集中第i个波段;Xj表示高光谱影像数据集中第j个波段;Xi(m,n)表示Xi第m行第n列的值;R表示相关系数的向量;Vi表示第i个波段的像素差;Vj表示第j个波段的像素差;Vo表示第o个波段的像素差;Xo表示高光谱影像数据集中第o个波段;
Figure QLYQS_3
表示第o个波段的像素均值;o={i,j};
S2.根据得到的相关系数的向量寻找所有相关系数极值点,并在寻找到的所有相关系数极值点中筛选出相关系数极小值点,通过筛选出的相关系数极小值点确定最优划分的高光谱波段子空间;
S3.按照每个子空间所包含的波段数大小对子空间进行排序,并计算每个子空间中波段的信息熵,按照信息熵大小从这若干个子空间中选取所需数量的特征波段;
所述步骤S3中计算波段信息熵的计算公式表示为:
Figure QLYQS_4
其中,Ω表示整个样本空间,pi表示样本i出现在图像中的概率;H表示样本i的信息熵;
当需要选择的特征波段的数量小于或等于划分的子空间个数时,则从排序后的子空间中选出对应数量的波段子空间,然后从选出的子空间中选取信息熵最大的波段作为特征波段;当需要选择的特征波段的数量大于划分的子空间个数时,则从每个子空间中选出S个波段作为特征波段;
S的具体计算公式表示为:
Figure QLYQS_5
其中,Z表示每个波段子空间所包含的波段数目;L表示整个数据集所包含的波段数;K表示需要选取的特征波段数;S表示选取的波段;
通过计算最终得到所需的特征波段子集Y。
2.根据权利要求1所述的一种基于近邻子空间划分高光谱影像波段选择方法,其特征在于,所述步骤S2中筛选出相关系数极小值点是通过MATLAB的工具箱进行筛选的。
3.根据权利要求2所述的一种基于近邻子空间划分高光谱影像波段选择方法,其特征在于,所述通过MATLAB的工具箱进行筛选的公式表示为:
y=findpeaks(-R)
其中,findpeaks表示MATLAB内置函数;R表示整个数据集相邻波段之间的相关系数向量;y表示包含所有极小值的向量。
4.一种基于近邻子空间划分高光谱影像波段选择系统,其特征在于,包括:
计算模块,用于输入高光谱影像立方体,并计算输入的高光谱影像立方体中包含的任意两个相邻波段之间的相关系数,得到相关系数的向量;
所述计算模块中计算输入的高光谱影像立方体中包含的任意两个相邻波段之间的相关系数,得到相关系数的向量,表示为:
Figure QLYQS_6
Figure QLYQS_7
其中,X∈RW×H×L表示高光谱影像立方体,L表示高光谱影像立方体所包含的波段数目,W和H分别表示每个波段的宽度和高度;Xi表示高光谱影像数据集中第i个波段;Xj表示高光谱影像数据集中第j个波段;Xi(m,n)表示Xi第m行第n列的值;R表示相关系数的向量;Vi表示第i个波段的像素差;Vj表示第j个波段的像素差;Vo表示第o个波段的像素差;Xo表示高光谱影像数据集中第o个波段;
Figure QLYQS_8
表示第o个波段的像素均值;o={i,j};
筛选模块,用于根据得到的相关系数的向量寻找所有相关系数极值点,并在寻找到的所有相关系数极值点中筛选出相关系数极小值点,通过筛选出的相关系数极小值点确定最优划分的高光谱波段子空间;
选取模块按照每个子空间所包含的波段数大小对子空间进行排序,并计算每个子空间中波段的信息熵,按照信息熵大小从这若干个子空间中选取所需数量的特征波段;
计算波段信息熵的计算公式表示为:
Figure QLYQS_9
其中,Ω表示整个样本空间,pi表示样本i出现在图像中的概率;H表示样本i的信息熵;
当需要选择的特征波段的数量小于或等于划分的子空间个数时,则从排序后的子空间中选出对应数量的波段子空间,然后从选出的子空间中选取信息熵最大的波段作为特征波段;当需要选择的特征波段的数量大于划分的子空间个数时,则从每个子空间中选出S个波段作为特征波段;
S的具体计算公式表示为:
Figure QLYQS_10
其中,Z表示每个波段子空间所包含的波段数目;L表示整个数据集所包含的波段数;K表示需要选取的特征波段数;S表示选取的波段;
通过计算最终得到所需的特征波段子集Y。
CN202110174636.8A 2021-02-07 2021-02-07 一种基于近邻子空间划分高光谱影像波段选择方法及系统 Active CN113075129B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN202110174636.8A CN113075129B (zh) 2021-02-07 2021-02-07 一种基于近邻子空间划分高光谱影像波段选择方法及系统
PCT/CN2021/135928 WO2022166363A1 (zh) 2021-02-07 2021-12-07 一种基于近邻子空间划分高光谱影像波段选择方法及系统
LU502854A LU502854B1 (en) 2021-02-07 2021-12-07 A hyperspectral image band selection method and system based on nearest neighbor subspace division
ZA2022/07737A ZA202207737B (en) 2021-02-07 2022-07-12 A hyperspectral image band selection method and system based on nearest neighbor subspace division

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110174636.8A CN113075129B (zh) 2021-02-07 2021-02-07 一种基于近邻子空间划分高光谱影像波段选择方法及系统

Publications (2)

Publication Number Publication Date
CN113075129A CN113075129A (zh) 2021-07-06
CN113075129B true CN113075129B (zh) 2023-03-31

Family

ID=76609942

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110174636.8A Active CN113075129B (zh) 2021-02-07 2021-02-07 一种基于近邻子空间划分高光谱影像波段选择方法及系统

Country Status (4)

Country Link
CN (1) CN113075129B (zh)
LU (1) LU502854B1 (zh)
WO (1) WO2022166363A1 (zh)
ZA (1) ZA202207737B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113075129B (zh) * 2021-02-07 2023-03-31 浙江师范大学 一种基于近邻子空间划分高光谱影像波段选择方法及系统
CN113486876A (zh) * 2021-09-08 2021-10-08 中国地质大学(武汉) 一种高光谱影像波段选择方法、装置及系统
CN117435940B (zh) * 2023-12-20 2024-03-05 龙建路桥股份有限公司 一种面向冬季混凝土养护过程中光谱检测方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101131734A (zh) * 2007-06-25 2008-02-27 北京航空航天大学 适用于高光谱遥感图像的自动波段选择方法
CN103886334A (zh) * 2014-04-08 2014-06-25 河海大学 一种多指标融合的高光谱遥感影像降维方法
CN104751179A (zh) * 2015-04-01 2015-07-01 河海大学 一种基于博弈论的多目标高光谱遥感影像波段选择方法
WO2016000088A1 (zh) * 2014-07-02 2016-01-07 中国林业科学研究院林业研究所 一种基于最佳指数-相关系数法的高光谱波段提取方法
CN108154094A (zh) * 2017-12-14 2018-06-12 浙江工业大学 基于子区间划分的高光谱图像非监督波段选择方法
CN110751142A (zh) * 2019-09-25 2020-02-04 河海大学 一种改进型的高光谱遥感影像波段选择方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100963797B1 (ko) * 2008-02-27 2010-06-17 아주대학교산학협력단 복잡성이 감소된 고분광 프로세싱에 기반을 둔 실시간 타겟검출 방법
CN103065293A (zh) * 2012-12-31 2013-04-24 中国科学院东北地理与农业生态研究所 相关性加权的遥感影像融合方法及该融合方法的融合效果评价方法
CN107124612B (zh) * 2017-04-26 2019-06-14 东北大学 基于分布式压缩感知的高光谱图像压缩方法
US11280777B2 (en) * 2018-03-20 2022-03-22 SafetySpect, Inc. Apparatus and method for multimode analytical sensing of items such as food
CN113075129B (zh) * 2021-02-07 2023-03-31 浙江师范大学 一种基于近邻子空间划分高光谱影像波段选择方法及系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101131734A (zh) * 2007-06-25 2008-02-27 北京航空航天大学 适用于高光谱遥感图像的自动波段选择方法
CN103886334A (zh) * 2014-04-08 2014-06-25 河海大学 一种多指标融合的高光谱遥感影像降维方法
WO2016000088A1 (zh) * 2014-07-02 2016-01-07 中国林业科学研究院林业研究所 一种基于最佳指数-相关系数法的高光谱波段提取方法
CN104751179A (zh) * 2015-04-01 2015-07-01 河海大学 一种基于博弈论的多目标高光谱遥感影像波段选择方法
CN108154094A (zh) * 2017-12-14 2018-06-12 浙江工业大学 基于子区间划分的高光谱图像非监督波段选择方法
CN110751142A (zh) * 2019-09-25 2020-02-04 河海大学 一种改进型的高光谱遥感影像波段选择方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Hyperspectral band selection via adaptive subspace partition strategy;Wang Qi,等;《IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing》;20191231;第12卷(第12期);第4940-4950页 *
基于子空间中主成分最优线性预测的高光谱波段选择;吴一全等;《红外与毫米波学报》;20180228;第37卷(第1期);第119-128页 *
高光谱图像的特征提取与分类识别方法研究;吉春蕊;《中国优秀博硕士学位论文全文数据库》;20190228(第2期);第9-13页 *
高光谱影像加权波段指数波段选择算法;马莉等;《黑龙江科技信息》;20100205(第4期);第71页 *

Also Published As

Publication number Publication date
CN113075129A (zh) 2021-07-06
LU502854B1 (en) 2023-01-30
ZA202207737B (en) 2022-07-27
WO2022166363A1 (zh) 2022-08-11

Similar Documents

Publication Publication Date Title
CN113075129B (zh) 一种基于近邻子空间划分高光谱影像波段选择方法及系统
CN103403704B (zh) 用于查找最近邻的方法和设备
CN109583469B (zh) 基于互信息的k均值高光谱图像波段聚类方法
CN107451562B (zh) 一种基于混沌二进制引力搜索算法的波段选择方法
CN104820840B (zh) 基于字典和波段重组的最近邻高光谱图像分类方法
CN107679138A (zh) 基于局部尺度参数、熵和余弦相似性的谱特征选择方法
CN113269201A (zh) 一种基于潜在特征融合的高光谱影像波段选择方法及系统
Duin et al. Mode seeking clustering by KNN and mean shift evaluated
Shang et al. Iterative spatial-spectral training sample augmentation for effective hyperspectral image classification
Ji et al. A divisive hierarchical clustering approach to hyperspectral band selection
Hozumi et al. Ccp: Correlated clustering and projection for dimensionality reduction
CN114663770A (zh) 一种基于集成聚类波段选择的高光谱图像分类方法及系统
CN109871768B (zh) 基于共享最近邻的高光谱最优波段选择方法
CN112884035B (zh) 一种噪声鲁棒的高光谱图像波段选择方法
CN111601358B (zh) 一种多阶段分层分簇空间相关性温度感知数据去冗余方法
Izakian et al. Fuzzy clustering of time series data: A particle swarm optimization approach
CN111914930A (zh) 一种基于自适应微簇融合的密度峰值聚类方法
CN114863291A (zh) 基于mcl和光谱差异度量的高光谱影像波段选择方法
Li et al. A local potential-based clustering algorithm for unsupervised hyperspectral band selection
CN115510959A (zh) 基于自然最近邻和多簇合并的密度峰值聚类方法
Zhu et al. Hyperspectral band selection based on improved affinity propagation
CN111310842A (zh) 一种密度自适应的快速聚类方法
Valero et al. Hyperspectral image segmentation using binary partition trees
CN107992886B (zh) 一种燃机压气机设备故障趋势预测方法
Xie et al. A majority affiliation based under-sampling method for class imbalance problem

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant