CN108154094A - 基于子区间划分的高光谱图像非监督波段选择方法 - Google Patents
基于子区间划分的高光谱图像非监督波段选择方法 Download PDFInfo
- Publication number
- CN108154094A CN108154094A CN201711334938.7A CN201711334938A CN108154094A CN 108154094 A CN108154094 A CN 108154094A CN 201711334938 A CN201711334938 A CN 201711334938A CN 108154094 A CN108154094 A CN 108154094A
- Authority
- CN
- China
- Prior art keywords
- band
- bands
- representative
- mutual information
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000010187 selection method Methods 0.000 title claims abstract description 25
- 238000000034 method Methods 0.000 claims abstract description 32
- 239000011159 matrix material Substances 0.000 claims abstract description 12
- 238000004364 calculation method Methods 0.000 claims description 8
- 238000011002 quantification Methods 0.000 claims description 4
- 238000013139 quantization Methods 0.000 claims description 4
- 238000001228 spectrum Methods 0.000 claims description 4
- 239000013598 vector Substances 0.000 claims description 4
- 238000010521 absorption reaction Methods 0.000 claims description 3
- 230000008569 process Effects 0.000 claims description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 3
- 238000011835 investigation Methods 0.000 claims description 2
- 230000009466 transformation Effects 0.000 claims description 2
- 230000000007 visual effect Effects 0.000 claims description 2
- 238000007476 Maximum Likelihood Methods 0.000 abstract description 14
- 238000012706 support-vector machine Methods 0.000 abstract description 14
- 238000012545 processing Methods 0.000 abstract description 6
- 238000011156 evaluation Methods 0.000 abstract description 3
- 238000010276 construction Methods 0.000 abstract description 2
- 238000012549 training Methods 0.000 description 21
- 230000006870 function Effects 0.000 description 13
- 230000003595 spectral effect Effects 0.000 description 9
- 238000003971 tillage Methods 0.000 description 6
- 240000008042 Zea mays Species 0.000 description 5
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 5
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 5
- 235000005822 corn Nutrition 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 244000068988 Glycine max Species 0.000 description 4
- 235000010469 Glycine max Nutrition 0.000 description 4
- 230000009467 reduction Effects 0.000 description 4
- 238000002310 reflectometry Methods 0.000 description 4
- 238000001514 detection method Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 244000025254 Cannabis sativa Species 0.000 description 1
- 240000005979 Hordeum vulgare Species 0.000 description 1
- 235000007340 Hordeum vulgare Nutrition 0.000 description 1
- 240000004658 Medicago sativa Species 0.000 description 1
- 235000017587 Medicago sativa ssp. sativa Nutrition 0.000 description 1
- 235000008331 Pinus X rigitaeda Nutrition 0.000 description 1
- 235000011613 Pinus brutia Nutrition 0.000 description 1
- 241000018646 Pinus brutia Species 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000009435 building construction Methods 0.000 description 1
- 238000000701 chemical imaging Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000002329 infrared spectrum Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 239000004576 sand Substances 0.000 description 1
- 239000002023 wood Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
- G06V20/13—Satellite images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Astronomy & Astrophysics (AREA)
- Remote Sensing (AREA)
- Multimedia (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Abstract
本发明提供了一种高光谱图像波段选择方法。包括互信息矩阵构建、子区间划分、代表性波段选择、分类及其评价。所述的互信息矩阵通过计算两两波段间的互信息,形成互信息矩阵。所述的子区间为波段区间内两两波段间具有相近互信息的波段区间。所述代表性波段选择分为初始波段和剩余波段选择,初始波段为波段子区间内平均互信息和波段子区间外平均互信息的商最大的波段;剩余波段选择同一波段区间内与已选波段平均互信息和波段区间外平均互信息的积最小的波段。所述的分类使用最大似然分类和支持向量机分类对选择出的波段组合进行分类。所述评价使用地面真实分类图像验证分类的准确性。本发明主要解决高光谱图像信息冗余大和处理效率低的问题。
Description
技术领域
本发明属于遥感图像处理领域,主要涉及的是一种对高光谱遥感图像非监督的波段选择的方法,可应用于高光谱图像数据的降维,分类和目标识别等领域。
背景技术
随着光谱成像仪的发展,高光谱遥感已成为遥感领域的主要手段之一,通过获得从可见光到中远红外光谱的数十个乃至数百个狭窄而连续的光谱波段图像,在二维图像的基础上形成了对应不同波段的光谱图像块(image cube),并且具有较高的光谱分辨率。正因为其丰富的光谱信息,目前,高光谱遥感已广泛应用于环境监测、目标识别和地物分类等方面。但过多的光谱波段也为高光谱图像带来了数据量大,波段间相关性强,冗余度大等问题,造成高光谱遥感图像的存储资源占用多和计算处理效率的低。在对高光谱图像进行分类等应用时,随着数据维数的增加,甚至会产生严重的Hughes现象(随着数据维数的增加,分类精度会出现降低的现象)。针对上述问题,如何在尽量不损失数据信息的前提下进行高光谱数据降维是处理高光谱图像的一大挑战。
非监督波段选择方法是在没有类别先验知识的情况下,对波段进行选择,主要包括以下三种方法:基于信息量的波段选择方法,基于聚类的波段选择方法和基于增量式的波段选择方法。基于信息量的波段选择方法首先对各个波段图像计算其信息量的大小,根据每个波段所包含的信息量进行从大到小的排序,通过排序的顺序移除高光谱图像中信息量较小的波段,最后根据具体应用所需的波段数目选择信息量大小靠前的若干波段;基于聚类的波段选择方法根据地物对相邻波段具有相近反射率的特征,将反射率相近,即相似的波段图像进行聚类,再根据具体应用的不同选择标准,在不同的地物中寻找最具代表性的波段;基于增量式的方法通过逐个增加选择波段实现数据的降维,该方法首先选择若干最不相似的波段(最不相似波段有不同的取法,如:互信息最小或反射率相差最大)作为初始波段,再从其余所有波段中找到与初始波段最不相似的波段并加入初始波段中,这样不断寻找最不相似的波段,直到满足所需的波段数。
Martínez-Usó.A等人在论文“Clustering-Based Hyperspectral BandSelection Using Information Measures”中提出一种基于聚类的高光谱图像波段选择方法,分别使用互信息(Ward’sLinkage Strategy Using Mutual Information,WaLuMI)和K-L散度(Ward’s Linkage Strategy Using Divergence Information,WaLuDI)作为评价标准。这两种方法分别计算波段间基于互信息的距离和K-L散度信息来评价波段的相似性,再根据相似性对波段进行聚类,最后选择每个类别中权重最大的波段作为代表性波段。虽然基于聚类的方法没有涉及到波段的信息量,但聚类操作仍然能够选择出信息量丰富的波段。但该方法在聚类时需要反复计算相同类别与其余类别的相似性,会增加大量计算时间用于地物的聚类;并且聚类后并没有考虑不同类别间的可分性,仅选择该类别中具有最高权重的波段作为代表性波段,某些情况会造成分类时分类性能欠佳。Du等人在其发表的论文“Similarity-Based Unsupervised Band Selection for Hyperspectral ImageAnalysis”中提出了一种基于相似性测量的非监督波段选择方法:线性预测(LinearPrediction,LP)和正交子空间投影(Orthogonal Subspace Projection,OSP)。该方法首先选择两个最不相似的波段作为初始波段,再从其余所有波段中找到与初始波段最不相似的波段并加入初始波段中,这样不断寻找最不相似的波段,直到满足所需的波段数。这两种方法在进行线性预测和正交子空间构建时会增加大量计算时间,而且波段选择时需要遍历全体剩余波段,同样会增加大量计算时间。因此,波段选择的效率不高。
发明内容
本发明旨在克服目前已有的高光谱图像波段选择方法中存在的地物可分性不好和计算时间过长的问题,提出一种基于子区间划分的高光谱图像非监督波段选择方法,以减少选择波段间的冗余度,增加子区间内相同地物的一致性和子区间之间不同地物的可分性,最终选出最具代表性的波段组合。
本发明的技术方案是通过计算高光谱图像波段间的互信息将高光谱图像划分为不相交的若干连续子区间,再从这些子区间中选择最具代表性的光谱波段,直到选择波段数量满足具体应用要求的高光谱图像分类中需要的波段数量。
本发明是一种基于子区间划分的高光谱图像非监督波段选择方法,其特征在于:
一种基于子区间划分的高光谱图像非监督波段选择方法,其特征在于,包括如下步骤:
(1)利用MATLAB中multibandread()函数高光谱图像并移除包含较大噪声和光谱水汽吸收大的波段,根据样本个数和光谱曲线确定地物类别数目,并进行高光谱图像量化;具体步骤如下:
(1.1)使用multibandread()函数读取高光谱图像,逐一显示全部M个波段{b1,b2,…,bM},通过目视解译将包含噪声大的波段进行移除,剩余波段数为N;
(1.2)根据实际调查获得的真实地物分布图像和每个类别在真实图像中包含的样本个数,即像素个数,将像素个数较少的类别移除;将所有波段图像中相同坐标的像素的亮度构成一个亮度值向量,即Hi={hi1,hi2,…hiN},其中hij为第i个像素在第j个波段的亮度值。将具有相近的亮度值向量的不同类别合并为同一类别;
(1.3)高光谱图像的量化具体步骤如下:
(1.3.1)将高光谱图像各波段按照无符号8位整型或无符号16位整型方式存储,量化过程如下:
(1.3.1a)若存储方式为无符号8位整型,即图像中像素亮度范围从0-255,量化为32个区间;每个区间的初始亮度值范围为[8n,8n+7],其中n=0,1,…31;每个区间量化后的亮度值为:
h=8n+4 (1)
(1.3.1b)若存储方式为无符号16位整型,即图像中像素亮度范围从0-65535,量化为256个区间,每个区间初始亮度值范围为[256n,256n+255],其中n=0,1,…255;每个区间量化后的亮度值为:
h=256n+128 (2)
(2)互信息矩阵MI的构建,具体步骤如下:
(2.1)分别计算相同坐标位置像素点对应的亮度值hi和hj在两波段图像中出现的概率p,设亮度值分别为hi和hj,在波段Xi,Xj中的概率分别为:
其中,hi,hj为两波段图像中相同坐标位置像素的亮度,ni,nj分别为两波段中亮度值为hi,hj的像素的个数。
(2.2)计算波段Xi和Xj的互信息:
其中,MI(Xi,Xj)表示波段Xi和波段Xj的互信息大小,p(hi)和p(hj)分别为波段Xi和波段Xj在相同坐标像素点的亮度的概率密度函数,p(hi,hj)为这两个像素点的联合概率密度函数,Ωi和Ωj分别为波段图像Xi和Xj中像素不同亮度的全部取值;
(2.3)变换为信息熵的表示,具体步骤如下:
(2.3.1)计算波段Xi和Xj的信息熵和联合熵:
其中,hi和hj分别为波段图像Xi和Xj在相同坐标位置的亮度值,p(hi)和p(hj)分别为hi和hj这两个亮度值出现的概率密度函数,p(hi,hj)为hi和hj的联合概率密度函数,Ωi和Ωj分别为波段图像Xi和Xj中像素不同亮度的全部取值;
(2.3.2)波段Xi和Xj的互信息为:
MI(Xi,Xj)=H(Xi)+H(Xj)-H(Xi,Xj) (9)
其中,H(Xi)和H(Xj)分别为波段图像Xi和Xj的信息熵,H(Xi,Xj)为波段图像Xi和Xj的联合熵;
(2.4)通过上述计算,互信息矩阵MI表示为:
其中,MI(Xi,Xj)表示波段Xi和Xj的互信息;
(3)波段子区间划分,具体步骤如下:
(3.1)使用imagesc()函数显示互信息矩阵MI的灰度图:
(3.2)通过灰度图中较亮点的分布,将全部波段划分为连续的不相交的波段子区间{B1,B2,…,BS},其中,S表示波段子区间的个数;每个波段子区间内包含的波段个数为Ni,满足:
N1+N2+…+NS=N (11)
(4)确定需要选择的代表性波段总数Ns的具体步骤如下:
分别选择6、10、15、20、25、30、35、40、45、50个波段作为选择的代表性波段总数;
(5)每个波段子区间内选择代表性波段的具体步骤如下:
(5.1)计算子区间包含波段数Ni与全部波段数N的比值;
(5.2)将该比值与代表性波段总数Ns相乘得到的数值小数位进行四舍五入后取整作为子区间中需要选择的代表性波段数目ni:
ni=round(r×Ns) (13)
(6)代表性波段的选择,分为初始代表性波段的选择和剩余代表性波段的选择,具体步骤如下:
(6.1)初始代表性波段的选择,选择方法如下:
(6.1.1)计算第1子区间中第i个波段(0<i<ni)的子区间内平均互信息Iiw和子区间外平均互信息Iib:
其中,Bi和Bj分别表示第i个和第j个波段子区间。初始代表性波段的选择方法如下:
(6.1.2)定义第一个波段子区间代表性波段子集φ1初始为空集,在获得初始代表性波段后,将其加φ1中:
φ1=φ1∪{b} (17)
(6.2)剩余代表性波段的选择,具体方法如下:
(6.2.1)分别计算波段子区间内未选择波段与φ1中包含的已选的代表性波段计算平均互信息I′iw:
剩余代表性波段的选择准则如下:
(6.2.2)将选择的剩余代表性波段加入φ1中,φ1=φ1∪{b'};
(6.3)选择代表性波段加入φ1中,直到满足|φ1|=n1,其中,|·|表示集合中元素的个数;其余波段子区间的代表性波段选择重复步骤(6),直到遍历全部波段子区间;
(7)全部代表性波段的选择,具体步骤如下:
φ=φ1∪φ2∪…∪φS (20)
其中,φ为全体代表性波段集合。
本发明具有以下优点:
第一,本发明在计算波段间互信息的基础上对高光谱图像波段进行划分,将具有相近亮度信息的波段集中在一起,符合地物反射率在相邻波段相近的特点,子区间的划分类似于一个聚类的操作,并且去除了包含噪声较大的波段对后续高光谱图像处理的影响,如:高光谱图像分类,识别等。
第二,在选择初始代表性波段时,综合考虑子区间内部互信息和子区间外部互信息,增强了内部一致性和外部可分性。进一步,在选择剩余代表性波段时,又能够在保持类别可分性的同时减少选择波段的冗余,对高光谱数据的存储资源要求有较大的降低,对高光谱图像的处理效率有较大地提高。
附图说明
图1为本发明流程图
图2a和图2b为本发明实施例中Indianpines高光谱图像三波段组合成的图像及地面真实类别分布图,其中,图2a是Indianpines高光谱图像第5、17、30波段组合成的三波段图像,图2b是地面真实类别分布图
图3为本发明实施例中Indianpines高光谱图像全波段互信息矩阵灰度图。
图4a~图4f为本发明实施例中给出的波段选择方法与现有波段选择方法WaLuMI,LP和OSP方法的获得的波段组合的分类精度曲线图,其中图4a是训练样本为10%,最大似然分类器分类精度曲线图,图4b是训练样本为10%,支持向量机分类器分类精度曲线图,图4c是训练样本为20%,最大似然分类器分类精度曲线图,图4d是训练样本为20%,支持向量机分类器分类精度曲线图,图4e是训练样本为40%,最大似然分类器分类精度曲线图,图4f是训练样本为40%,支持向量机分类器分类精度曲线图。
图5a~图5f为本发明实施例中给出的波段选择方法与现有波段选择方法WaLuMI,LP和OSP方法的获得的波段组合的Kappa系数曲线图,其中图5a是训练样本为10%,最大似然分类器Kappa系数曲线图,图5b是训练样本为10%,支持向量机分类器Kappa系数曲线图,图5c是训练样本为20%,最大似然分类器Kappa系数曲线图,图5d是训练样本为20%,支持向量机分类器Kappa系数曲线图,图5e是训练样本为40%,最大似然分类器Kappa系数曲线图,图5f是训练样本为40%,支持向量机分类器Kappa系数曲线图。
具体实施方式
下面结合附图进一步说明本发明的技术方案。
附图1为本发明的流程图,本发明输入图像为IndianPines高光谱图像,包含220个波段,去除噪声过大和水汽吸收波段后(去除波段为1-4,103-112,149-165和217-220号波段),剩余185个波段。图像大小为145像素×145像素,光谱范围为400nm-2500nm,光谱分辨率为10nm,空间分辨率为20m。附图2中,左图为该高光谱图像第5、17、30波段组合成的伪彩色图像,右图为实际地物分布图像,真实地物共有16种类别,主要包括农作物,牧草、人工建筑和道路等类别,其中苜蓿、收割牧草、燕麦和公路这4类因样本数过少被移除为背景,将玉米未耕和玉米少耕合并为玉米,大豆未耕和大豆少耕合并为大豆未耕,因此剩余9类作为主要类别。如表1所示。
表1不同类别及其样本数
类别 | 样本数(像素) |
玉米 | 3495 |
牧草 | 483 |
树木 | 730 |
干草堆 | 478 |
大豆未耕 | 972 |
大豆 | 3048 |
大麦 | 205 |
木头 | 1265 |
建筑物 | 386 |
高光谱图像两两波段间的互信息计算公式如下:
其中,MI(Xi,Xj)表示波段Xi和波段Xj的互信息大小,p(hi)和p(hj)分别为波段Xi和波段Xj在相同坐标像素点的亮度的概率密度函数,p(hi,hj)为这两个像素点的联合概率密度函数,Ωi和Ωj分别为波段图像Xi和Xj中像素不同亮度的全部取值。
根据信息熵的表示如下:
MI(Xi,Xj)=H(Xi)+H(Xj)-H(Xi,Xj) (9)
其中,hi和hj分别为波段图像Xi和Xj在相同坐标位置的亮度值,p(hi)和p(hj)分别为hi和hj这两个亮度值出现的概率密度函数,p(hi,hj)为hi和hj的联合概率密度函数,Ωi和Ωj分别为波段图像Xi和Xj中像素不同亮度的全部取值。波段图像Xi和Xj信息熵和联合熵的计算公式如下:
其中,hi和hj分别为波段图像Xi和Xj在相同坐标位置的亮度值,p(hi)和p(hj)分别为hi和hj这两个亮度值出现的概率密度函数,p(hi,hj)为hi和hj的联合概率密度函数,Ωi和Ωj分别为波段图像Xi和Xj中像素不同亮度的全部取值。
附图3为IndianPines高光谱图像全波段灰度图像,从图中可以看出,波段间互信息的范围为(0,5),波段间互信息越大,其对应的像素点的亮度值越高。相邻波段间存在较大的互信息,并且具有较高互信息的波段是成块出现的,因此可以通过互信息矩阵灰度图实现波段子区间的划分。
根据互信息矩阵灰度图中亮度较高的点对应的波段,将全部波段划分为连续的不相交的子区间Bi,因此高光谱图像可以表示为B={B1,B2,...,BS},其中,Bi表示第i个子区间,S表示子区间的个数。根据附图3,将高光谱图像划分波段序号为1-30,31-55,56-75,76-95,96-135,136-185这6个子区间。
为了验证本发明选择的代表性波段的分类性能,分别选择10种不同代表性波段数Ns,这10种不同代表性波段数分别为6、10、15、20、25、30、35、40、45和50。
对第i个波段子区间Bi,根据式计算出该波段子区间内应选择的代表性波段数,如:当Ns=30时,第一个波段子区间应选择的波段数为:
则其余五个波段子区间的选择波段数分别为:4、3、3、7、8。
在确定好全体选择波段数量Ns和每个子区间的选择波段数ni后,对第i个子区间选择满足b=arg max(Iiw/Iib)的波段作为初始波段,并加入子区间初始波段子集φ中。选择完初始波段后,在相同波段子区间中继续选择满足b'=argmin(I′iw×Iib)的波段作为剩余波段,加入子区间初始波段子集φ中,若φ中包含的波段数达到ni,则进入下一波段子区间进行波段选择,否则继续选择满足的波段加入φ中。
在执行完代表性波段选择后,分别选取占全部样本10%、20%和40%的样本作为训练样本,剩余样本中选择占全部样本50%的样本作为检测样本(如:玉米共包含3495个样本,则对应的训练样本数分别为:350、700和1400个样本,对应的检测样本数量为1750个,训练样本和检测样本的数量误差不超过5%)。在分类过程中分别选择最大似然(MaximumLikelihood,ML)分类器和支持向量机(SupportVectorMachine,SVM)分类器进行分类实验,以验证本文方法对不同分类器的适用性,实验使用传统的WaLuMI、LP和OSP波段选择方法选择的代表性波段与本发明选择的代表性波段进行分类实验,比较最终的分类精度和Kappa系数。所有代表性波段选择实验代码均是在MATLAB2010b上编写,操作系统为Windows7,硬件环境为Intelcorei52.2Gz处理器,内存4GB。分类精度(OverallAccuracy,OA)的计算公式如下:
Kappa系数的计算公式如下:
其中,p0=s/n为正确分类像素个数与图像总的像素个数的比值,pc为每个类中正确分类像素的平方和与图像像素数目平方的比值。
实验结果分析
附图4是本发明和其余3种波段选择方法选择的代表性波段在最大似然分类器和支持向量机分类器分类后的分类精度曲线图,(a)、(c)和(e)分别为最大似然分类器在训练样本为10%、20%和40%时的分类精度曲线图,(b)、(d)和(f)分别为支持向量机分类器在训练样本为10%、20%和40%时的分类精度曲线图。其中,横坐标表示代表性波段数量,纵坐标表示分类精度。从两个分类器得到的分类精度曲线可以看出,本发明选择的代表性波段在大部分代表性波段数上均能够获得较高的分类精度,仅在代表性波段数为6个时,分类精度低于LP和OSP方法。在最大似然分类器分类中,当训练样本数较少时,随着代表性波段数量的增加,分类精度会出现下降,而在支持向量机分类中并不会出现该现象。
附图5为本发明和其余3种波段选择方法选择的代表性波段在最大似然分类器和支持向量机分类器分类的Kappa系数曲线图,(a)、(c)和(e)分别为最大似然分类器在训练样本为10%、20%和40%时的Kappa系数曲线图,(b)、(d)和(f)分别为支持向量机分类器在训练样本为10%、20%和40%时的Kappa系数曲线图。从图中可以看出,本发明得到的代表性波段在分类时,对不同类别的分类准确性较为平均。因此本发明能够获得较高的Kappa系数曲线。
综合分类精度和Kappa系数,本发明提出的基于子区间划分的高光谱图像非监督波段选择方法选择的代表性波段,在不同分类器和不同训练样本的情况下,均能获得较高的分类性能。表明本发明选择的波段更具代表性,在实现对高光谱图像降维的同时,相比于传统的波段选择方法获得的代表性波段,本发明获得的代表性波段的分类性能更高。
本说明书实施例所述的内容仅仅是对发明构思的实现形式的列举,本发明的保护范围不应当被视为仅限于实施例所陈述的具体形式,本发明的保护范围也及于本领域技术人员根据本发明构思所能够想到的等同技术手段。
Claims (1)
1.一种基于子区间划分的高光谱图像非监督波段选择方法,其特征在于,包括如下步骤:
(1)利用MATLAB中multibandread()函数高光谱图像并移除包含较大噪声和光谱水汽吸收大的波段,根据样本个数和光谱曲线确定地物类别数目,并进行高光谱图像量化;具体步骤如下:
(1.1)使用multibandread()函数读取高光谱图像,逐一显示全部M个波段{b1,b2,…,bM},通过目视解译将包含噪声大的波段进行移除,剩余波段数为N;
(1.2)根据实际调查获得的真实地物分布图像和每个类别在真实图像中包含的样本个数,即像素个数,将像素个数较少的类别移除;将所有波段图像中相同坐标的像素的亮度构成一个亮度值向量,即Hi={hi1,hi2,…hiN},其中hij为第i个像素在第j个波段的亮度值。将具有相近的亮度值向量的不同类别合并为同一类别;
(1.3)高光谱图像的量化具体步骤如下:
(1.3.1)将高光谱图像各波段按照无符号8位整型或无符号16位整型方式存储,量化过程如下:
(1.3.1a)若存储方式为无符号8位整型,即图像中像素亮度范围从0-255,量化为32个区间;每个区间的初始亮度值范围为[8n,8n+7],其中n=0,1,…31;每个区间量化后的亮度值为:
h=8n+4 (1)
(1.3.1b)若存储方式为无符号16位整型,即图像中像素亮度范围从0-65535,量化为256个区间,每个区间初始亮度值范围为[256n,256n+255],其中n=0,1,…255;每个区间量化后的亮度值为:
h=256n+128 (2)
(2)互信息矩阵MI的构建,具体步骤如下:
(2.1)分别计算相同坐标位置像素点对应的亮度值hi和hj在两波段图像中出现的概率p,设亮度值分别为hi和hj,在波段Xi,Xj中的概率分别为:
其中,hi,hj为两波段图像中相同坐标位置像素的亮度,ni,nj分别为两波段中亮度值为hi,hj的像素的个数。
(2.2)计算波段Xi和Xj的互信息:
其中,MI(Xi,Xj)表示波段Xi和波段Xj的互信息大小,p(hi)和p(hj)分别为波段Xi和波段Xj在相同坐标像素点的亮度的概率密度函数,p(hi,hj)为这两个像素点的联合概率密度函数,Ωi和Ωj分别为波段图像Xi和Xj中像素不同亮度的全部取值;
(2.3)变换为信息熵的表示,具体步骤如下:
(2.3.1)计算波段Xi和Xj的信息熵和联合熵:
其中,hi和hj分别为波段图像Xi和Xj在相同坐标位置的亮度值,p(hi)和p(hj)分别为hi和hj这两个亮度值出现的概率密度函数,p(hi,hj)为hi和hj的联合概率密度函数,Ωi和Ωj分别为波段图像Xi和Xj中像素不同亮度的全部取值;
(2.3.2)波段Xi和Xj的互信息为:
MI(Xi,Xj)=H(Xi)+H(Xj)-H(Xi,Xj) (9)
H(Xi)和H(Xj)分别为波段图像Xi和Xj的信息熵,H(Xi,Xj)为波段图像Xi和Xj的联合熵;
(2.4)通过上述计算,互信息矩阵MI表示为:
其中,MI(Xi,Xj)表示波段Xi和Xj的互信息;
(3)波段子区间划分,具体步骤如下:
(3.1)使用imagesc()函数显示互信息矩阵MI的灰度图:
(3.2)通过灰度图中较亮点的分布,将全部波段划分为连续的不相交的波段子区间{B1,B2,…,BS},其中,S表示波段子区间的个数;每个波段子区间内包含的波段个数为Ni,满足:
N1+N2+…+NS=N (11)
(4)确定需要选择的代表性波段总数Ns的具体步骤如下:
分别选择6、10、15、20、25、30、35、40、45、50个波段作为选择的代表性波段总数;
(5)每个波段子区间内选择代表性波段的具体步骤如下:
(5.1)计算子区间包含波段数Ni与全部波段数N的比值;
(5.2)将该比值与代表性波段总数Ns相乘得到的数值小数位进行四舍五入后取整作为子区间中需要选择的代表性波段数目ni:
ni=round(r×Ns) (13)
(6)代表性波段的选择,分为初始代表性波段的选择和剩余代表性波段的选择,具体步骤如下:
(6.1)初始代表性波段的选择,选择方法如下:
(6.1.1)计算第1子区间中第i个波段(0<i<ni)的子区间内平均互信息Iiw和子区间外平均互信息Iib:
其中,Bi和Bj分别表示第i个和第j个波段子区间。初始代表性波段的选择方法如下:
(6.1.2)定义第一个波段子区间代表性波段子集初始为空集,在获得初始代表性波段后,将其加中:
(6.2)剩余代表性波段的选择,具体方法如下:
(6.2.1)分别计算波段子区间内未选择波段与中包含的已选的代表性波段计算平均互信息Ii'w:
剩余代表性波段的选择准则如下:
(6.2.2)将选择的剩余代表性波段加入中,
(6.3)选择代表性波段加入中,直到满足其中,|·|表示集合中元素的个数;其余波段子区间的代表性波段选择重复步骤(6),直到遍历全部波段子区间;
(7)全部代表性波段的选择,具体步骤如下:
其中,为全体代表性波段集合。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711334938.7A CN108154094B (zh) | 2017-12-14 | 2017-12-14 | 基于子区间划分的高光谱图像非监督波段选择方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711334938.7A CN108154094B (zh) | 2017-12-14 | 2017-12-14 | 基于子区间划分的高光谱图像非监督波段选择方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108154094A true CN108154094A (zh) | 2018-06-12 |
CN108154094B CN108154094B (zh) | 2020-04-24 |
Family
ID=62466089
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711334938.7A Active CN108154094B (zh) | 2017-12-14 | 2017-12-14 | 基于子区间划分的高光谱图像非监督波段选择方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108154094B (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109146003A (zh) * | 2018-09-30 | 2019-01-04 | 合刃科技(深圳)有限公司 | 一种基于高光谱成像的分类识别方法、装置及系统 |
CN109583469A (zh) * | 2018-10-17 | 2019-04-05 | 浙江工业大学 | 基于互信息的k均值高光谱图像波段聚类方法 |
CN110441647A (zh) * | 2019-09-06 | 2019-11-12 | 云南电网有限责任公司电力科学研究院 | 基于光谱强度信息的弧光危险评估方法及装置 |
CN110751142A (zh) * | 2019-09-25 | 2020-02-04 | 河海大学 | 一种改进型的高光谱遥感影像波段选择方法 |
CN112067129A (zh) * | 2020-09-24 | 2020-12-11 | 江苏集萃苏科思科技有限公司 | 一种高光谱处理方法及波段选择方法 |
CN112884035A (zh) * | 2021-02-07 | 2021-06-01 | 山东科技大学 | 一种噪声鲁棒的高光谱图像波段选择方法 |
CN113075129A (zh) * | 2021-02-07 | 2021-07-06 | 浙江师范大学 | 一种基于近邻子空间划分高光谱影像波段选择方法及系统 |
CN113505846A (zh) * | 2021-07-26 | 2021-10-15 | 云南电网有限责任公司电力科学研究院 | 基于互信息的高光谱波段选择方法 |
CN114912168A (zh) * | 2022-04-21 | 2022-08-16 | 华中科技大学 | 隧道结构损伤识别的子区间划分方法、系统、可存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104268579A (zh) * | 2014-10-14 | 2015-01-07 | 哈尔滨工业大学 | 基于分层集成学习的高光谱遥感图像分类方法 |
CN104268582A (zh) * | 2014-08-26 | 2015-01-07 | 中国科学院遥感与数字地球研究所 | 一种高光谱图像的波段选择方法及装置 |
US20170213109A1 (en) * | 2014-03-31 | 2017-07-27 | Los Alamos National Security, Llc | Classification of multispectral or hyperspectral satellite imagery using clustering of sparse approximations on sparse representations in learned dictionaries obtained using efficient convolutional sparse coding |
CN107194423A (zh) * | 2017-05-19 | 2017-09-22 | 杭州电子科技大学 | 基于特征随机抽样集成超限学习机的高光谱图像分类方法 |
CN107220662A (zh) * | 2017-05-16 | 2017-09-29 | 西北工业大学 | 基于全局最优聚类的高光谱图像波段选择方法 |
-
2017
- 2017-12-14 CN CN201711334938.7A patent/CN108154094B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170213109A1 (en) * | 2014-03-31 | 2017-07-27 | Los Alamos National Security, Llc | Classification of multispectral or hyperspectral satellite imagery using clustering of sparse approximations on sparse representations in learned dictionaries obtained using efficient convolutional sparse coding |
CN104268582A (zh) * | 2014-08-26 | 2015-01-07 | 中国科学院遥感与数字地球研究所 | 一种高光谱图像的波段选择方法及装置 |
CN104268579A (zh) * | 2014-10-14 | 2015-01-07 | 哈尔滨工业大学 | 基于分层集成学习的高光谱遥感图像分类方法 |
CN107220662A (zh) * | 2017-05-16 | 2017-09-29 | 西北工业大学 | 基于全局最优聚类的高光谱图像波段选择方法 |
CN107194423A (zh) * | 2017-05-19 | 2017-09-22 | 杭州电子科技大学 | 基于特征随机抽样集成超限学习机的高光谱图像分类方法 |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109146003A (zh) * | 2018-09-30 | 2019-01-04 | 合刃科技(深圳)有限公司 | 一种基于高光谱成像的分类识别方法、装置及系统 |
CN109583469A (zh) * | 2018-10-17 | 2019-04-05 | 浙江工业大学 | 基于互信息的k均值高光谱图像波段聚类方法 |
CN109583469B (zh) * | 2018-10-17 | 2021-10-15 | 浙江工业大学 | 基于互信息的k均值高光谱图像波段聚类方法 |
CN110441647A (zh) * | 2019-09-06 | 2019-11-12 | 云南电网有限责任公司电力科学研究院 | 基于光谱强度信息的弧光危险评估方法及装置 |
CN110751142A (zh) * | 2019-09-25 | 2020-02-04 | 河海大学 | 一种改进型的高光谱遥感影像波段选择方法 |
CN110751142B (zh) * | 2019-09-25 | 2022-07-26 | 河海大学 | 一种改进型的高光谱遥感影像波段选择方法 |
CN112067129A (zh) * | 2020-09-24 | 2020-12-11 | 江苏集萃苏科思科技有限公司 | 一种高光谱处理方法及波段选择方法 |
CN112884035A (zh) * | 2021-02-07 | 2021-06-01 | 山东科技大学 | 一种噪声鲁棒的高光谱图像波段选择方法 |
CN113075129A (zh) * | 2021-02-07 | 2021-07-06 | 浙江师范大学 | 一种基于近邻子空间划分高光谱影像波段选择方法及系统 |
CN113075129B (zh) * | 2021-02-07 | 2023-03-31 | 浙江师范大学 | 一种基于近邻子空间划分高光谱影像波段选择方法及系统 |
CN113505846A (zh) * | 2021-07-26 | 2021-10-15 | 云南电网有限责任公司电力科学研究院 | 基于互信息的高光谱波段选择方法 |
CN114912168A (zh) * | 2022-04-21 | 2022-08-16 | 华中科技大学 | 隧道结构损伤识别的子区间划分方法、系统、可存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN108154094B (zh) | 2020-04-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108154094B (zh) | 基于子区间划分的高光谱图像非监督波段选择方法 | |
CN110321963B (zh) | 基于融合多尺度多维空谱特征的高光谱图像分类方法 | |
CN107451614B (zh) | 基于空间坐标与空谱特征融合的高光谱分类方法 | |
CN109598306B (zh) | 基于srcm和卷积神经网络的高光谱图像分类方法 | |
He et al. | A dual global–local attention network for hyperspectral band selection | |
CN107563442B (zh) | 基于稀疏低秩正则图张量化嵌入的高光谱图像分类方法 | |
US9330332B2 (en) | Fast computation of kernel descriptors | |
CN110929080B (zh) | 基于注意力和生成对抗网络的光学遥感图像检索方法 | |
CN110516525B (zh) | 基于gan和svm的sar图像目标识别方法 | |
US8463050B2 (en) | Method for measuring the dissimilarity between a first and a second images and a first and second video sequences | |
CN108229551B (zh) | 一种基于紧凑字典稀疏表示的高光谱遥感图像分类方法 | |
CN111881933A (zh) | 一种高光谱图像分类方法及系统 | |
CN110309780A (zh) | 基于bfd-iga-svm模型的高分辨率影像房屋信息快速监督识别 | |
CN109583469B (zh) | 基于互信息的k均值高光谱图像波段聚类方法 | |
CN104160409A (zh) | 用于图像分析的方法和系统 | |
CN111814685A (zh) | 基于双支路卷积自编码器的高光谱图像分类方法 | |
CN115564996A (zh) | 一种基于注意力联合网络的高光谱遥感图像分类方法 | |
CN113269201A (zh) | 一种基于潜在特征融合的高光谱影像波段选择方法及系统 | |
CN111414958A (zh) | 一种视觉词袋金字塔的多特征图像分类方法及系统 | |
CN115457332A (zh) | 基于图卷积神经网络和类激活映射的图像多标签分类方法 | |
CN105160666B (zh) | 基于非平稳分析与条件随机场的sar图像变化检测方法 | |
Faria et al. | Rank aggregation for pattern classifier selection in remote sensing images | |
CN111047579B (zh) | 一种特征质量评估方法及图像特征均匀提取方法 | |
CN104732246A (zh) | 一种半监督协同训练高光谱图像分类方法 | |
CN109460788B (zh) | 基于低秩-稀疏信息组合网络的高光谱图像分类方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |