CN110598594A - 基于空谱自适应双向长短时记忆模型的高光谱分类方法 - Google Patents
基于空谱自适应双向长短时记忆模型的高光谱分类方法 Download PDFInfo
- Publication number
- CN110598594A CN110598594A CN201910807957.XA CN201910807957A CN110598594A CN 110598594 A CN110598594 A CN 110598594A CN 201910807957 A CN201910807957 A CN 201910807957A CN 110598594 A CN110598594 A CN 110598594A
- Authority
- CN
- China
- Prior art keywords
- network
- time
- short
- long
- spectral
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001228 spectrum Methods 0.000 title claims abstract description 42
- 238000000034 method Methods 0.000 title claims abstract description 33
- 230000002457 bidirectional effect Effects 0.000 title claims abstract description 22
- 230000003595 spectral effect Effects 0.000 claims abstract description 43
- 238000000605 extraction Methods 0.000 claims abstract description 29
- 230000006870 function Effects 0.000 claims abstract description 25
- 238000012549 training Methods 0.000 claims abstract description 15
- 238000012360 testing method Methods 0.000 claims abstract description 9
- 230000008569 process Effects 0.000 claims abstract description 8
- 239000013598 vector Substances 0.000 claims description 23
- 210000005056 cell body Anatomy 0.000 claims description 18
- 230000004927 fusion Effects 0.000 claims description 10
- 239000011159 matrix material Substances 0.000 claims description 9
- 230000009467 reduction Effects 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims description 6
- 230000003044 adaptive effect Effects 0.000 claims description 4
- 238000011176 pooling Methods 0.000 description 8
- 238000000513 principal component analysis Methods 0.000 description 5
- 238000013527 convolutional neural network Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 210000004027 cell Anatomy 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000002310 reflectometry Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
- G06V20/13—Satellite images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
- G06V20/194—Terrestrial scenes using hyperspectral data, i.e. more or other wavelengths than RGB
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Astronomy & Astrophysics (AREA)
- Remote Sensing (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于空谱自适应双向长短时记忆模型的高光谱分类方法,建立包含光谱特征提取与空间特征提取两个分支的网络,并进行融合,实现空谱特征联合分类,其特征在于:在光谱特征学习分支中,针对高光谱图像波段间的相关性,提出了基于波段分组的双向长短时记忆网络模型,该模型包括正向长短时记忆网络与反向长短时记忆网络;在进行空谱特征融合时,对应的权重因子在网络训练过程中进行自适应的学习;在利用随机批梯度下降算法最小化网络的损失函数之后,对待分类高光谱图像生成测试样本,输入到网络中,得到地物分类结果。本发明在进行特征提取时,不仅利用了高光谱序列的前文信息,也能同时利用后文信息,满足高精度地物目标识别的需求。
Description
技术领域
本发明属于计算机图像处理技术领域,涉及一种图像分类方法,具体涉及一种基于空谱自适应双向长短时记忆模型的高光谱遥感图像分类方法。
背景技术
高光谱遥感通过结合光谱技术与成像技术,可以同时获得空间维度与光谱维度上连续的遥感观测数据。与自然图像相比,高光谱遥感图像光谱分辨率更高,波段数更多,能够反映更加丰富的地物波谱特性。因此,利用高光谱图像进行地物目标的分类与识别,是实现对地观测的重要途径之一。目前,高光谱图像分类任务存在以下挑战:
1)高光谱图像同时具有丰富的光谱信息和空间信息,现有方法(如文献[1])通常将光谱特征提取与空间特征提取分开进行,使得两种特征没有得到有效的融合。同时,不同遥感场景类型下,空间特征与光谱特征对地物识别的影响权重往往不同。而现有方法(如文献[2])在分类过程中,通常对空间特征与光谱特征进行简单叠加,未能充分考虑二者的权重关系。
2)高光谱图像中相邻的波段往往具有较高的相关性,现有方法在进行光谱特征提取时,将光谱向量作为一个整体进行处理,忽略了波段间的相关性。例如,文献[3]提出了一种基于光谱滤波的高光谱图像分类方法,但其在滤波过程中,并未考虑高光谱图像波段间存在的相关性,而是将整个光谱向量视作一个完整的特征向量进行处理,未能深入挖掘波段间的相关性。文献[2]提出了一种基于长短时记忆模型的光谱特征提取机制,但该方法在建模过程中,仅考虑了波长从短到长的波段相关性,未能综合考虑正反两个方向的光谱特征表达。
因此,本领域需要一种空谱自适应的高光谱遥感图像分类方法,更好的实现空谱特征的有效融合,从而满足高精度地物目标识别的需求。
参考文献:
[1]苗荣慧,黄锋华,杨华,等.基于空谱一体化的农田高光谱图像分类[J].江苏农业学报,2018,34(4):818-824.DOI:10.3969/j.issn.1000-4440.2018.04.015.
[2]Y.Xu,L.Zhang,B.Du,and F.Zhang,“Spectral-spatial unified networksfor hyperspectral image classification,”IEEE Transactions on Geoscience andRemote Sensing,vol.56,no.10,pp.5893–5909,2018.
[3]张巨萍,高光来,苏向东.融合光谱滤波的高光谱图像分类深度网络[J].计算机科学与探索,2018,12(11):1806-1814.DOI:10.3778/j.issn.1673-9418.1709013.
发明内容
为了解决上述技术问题,本发明提供了一种基于空谱自适应双向长短时记忆模型的高光谱遥感图像分类方法。
本发明提供一种基于空谱自适应双向长短时记忆模型的高光谱分类方法,建立包含光谱特征提取与空间特征提取两个分支的网络,并将两个分支的特征进行融合,实现空谱特征联合分类,在光谱特征学习分支中,针对高光谱图像波段间的相关性,提出了基于波段分组的双向长短时记忆网络模型,该模型包括一个正向长短时记忆网络与一个反向长短时记忆网络;在进行空谱特征融合时,记空间特征向量和光谱特征向量分别为hspatial和hspectral,λspatial和λspectral为对应的权重因子,融合的空谱特征hjoint表示为,
hjoint=λspatialhspatial+λspectralhspectral
式中,λspatial和λspectral在网络训练过程中进行自适应的学习;
在利用随机批梯度下降算法最小化网络的损失函数之后,对待分类高光谱图像生成测试样本,输入到网络中,得到地物分类结果。
而且,采用以下步骤实现,
步骤1,将高光谱图像中的每一个像素对应的光谱向量分成多个分组;
步骤2,对原始高光谱图像进行PCA降维;
步骤3,对降维后的高光谱图像中的每一个像素,以该像素为中心提取影像块;
步骤4,初始化网络中的参数,满足均值为0方差为0.1的高斯分布;
步骤5,将基于步骤1生成的光谱训练样本输入到网络的光谱特征提取分支;
步骤6,将基于步骤2和步骤3生成的空间训练样本输入到网络的空间特征提取分支;
步骤7,进行空谱特征融合;
步骤8,利用随机批梯度下降算法,最小化网络的损失函数;
步骤9,对待分类高光谱图像,采用步骤1、步骤2和步骤3生成测试样本,输入到网络中,完成分类任务。
而且,所述双向长短时记忆网络模型,输入数据为步骤1产生的多个分组序列数据,输出为全连接结构的光谱特征,
t时刻正向长短时记忆网络中的门限函数及胞体计算方式如下:
正向输入门if (t)=σ(Wfix(t)+Ufihf (t-1)+bfi)
正向遗忘门ff (t)=σ(Wffx(t)+Uffhf (t-1)+bff)
正向输出门of (t)=σ(Wfox(t)+Ufohf (t-1)+bfo)
正向胞体cf (t)=if (t)·g(Wfcx(t)+Ufchf (t-1)+bfc)+ff (t)·cf (t-1)
正向长短时记忆网络的输出hf (t)=of (t)·g(cf (t))
其中,cf (t-1)为t-1时刻的正向胞体,hf (t-1)为t-1时刻正向长短时记忆网络的输出,x(t)为t时刻读入的新词,用于生成新记忆;
t时刻反向长短时记忆网络中的门限函数及胞体计算方式如下,
反向输入门ib (t)=σ(Wbix(t)+Ubihb (t+1)+bbi)
反向遗忘门fb (t)=σ(Wbfx(t)+Ubfhb (t+1)+bbf)
反向输出门ob (t)=σ(Wbox(t)+Ubohb (t+1)+bbo)
反向胞体cb (t)=ib (t)·g(Wbcx(t)+Ubchb (t+1)+bbc)+fb (t)·cb (t+1)
反向长短时记忆网络的输出hb (t)=ob (t)·g(cb (t))
其中,cb (t+1)为t+1时刻的反向胞体,hb (t+1)为t+1时刻反向长短时记忆网络的输出,x(t)为t时刻读入的新词,用于生成新记忆;
最终双向长短时记忆模型的输出为h(t)=hf (t)+hb (t)
上述公式中,σ()为Sigmoid函数,g()为双曲正切函数,Wfi、Wff、Wfo、Wfc、Wbi、Wbf、Wbo、Wbc与Ufi、Uff、Ufo、Ufc、Ubi、Ubf、Ubo、Ubc为相关权重矩阵,bfi、bff、bfo、bfc、bbi、bbf、bbo、bbc为相关偏置向量,·表示点积运算。
而且,网络的损失函数为,
其中,m为训练样本个数,yi为样本i对应的真实类别,代表样本i空谱联合分类的预测类别。
本发明的有益效果为:
(1)本发明提出了一种新颖的自适应空谱特征权重学习机制,将空间权重与光谱权重视作两个可学习的参数,使网络可以根据不同数据集的特点,自适应的学习不同遥感场景下的空谱特征融合权重;
(2)本发明充分考虑高光谱遥感影像相邻波段间的相关性,提出了基于波段分组的双向长短时记忆模型用于层次化光谱特征提取,从而综合考虑了波长范围由短到长及由长到短两个方向上,相邻波段间的光谱特性。相比于只考虑正向光谱特性的现有方法,本发明在进行特征提取时,不仅利用了高光谱序列的前文信息(即短波范围特征),也能同时利用后文信息(即长波范围特征),真正实现了基于上下文关系的光谱特征提取。
因此,本发明技术方案能够更好的实现空谱特征的有效融合,实现更高精度地物目标识别。
附图说明
图1为本发明实施例提出的基于双向长短时记忆模型进行光谱特征学习的网络结构示意图。
图2为本发明实施例采用的基于多尺度卷积神经网络进行空间特征学习的网络结构示意图。
图3为本发明实施例的自适应空谱特征权重学习机制结构示意图。
具体实施方式
为了便于本领域普通技术人员理解和实施本发明,下面结合附图及实施例对本发明作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本发明,并不用于限定本发明。
本发明提供的方法建立包含光谱特征提取与空间特征提取两个分支的网络,并将两个分支的特征进行自适应融合,实现空谱特征联合分类。在光谱特征提取分支中,考虑到高光谱图像波段间的相关性,提出了基于波段分组的双向长短时记忆网络模型;在空间特征提取分支中,采用多尺度的卷积神经网络模型。方法综合考虑了光谱特征提取、空间特征提取与分类器训练,通过共享统一的目标函数,使得空谱特征得到更好的融合,从而更好的满足高精度地物目标识别的需求。
本发明实施例提供的一种基于空谱自适应双向长短时记忆模型的高光谱遥感图像分类方法,包括以下步骤:
步骤1:将高光谱图像中的每一个像素对应的光谱向量分成τ个分组;
请见图1,高光谱图像中的每个像素对应的原始光谱向量被分成τ个分组。
作为优选,步骤1中所述的光谱向量分组,其具体实现过程包括以下子步骤:
步骤1.1:给定波段分组的目标组数τ。具体实施时,可预设τ的取值,建议取值范围为2~10;
步骤1.2:记z=[z1,z2,…,zn]为原始高光谱图像中某像素的光谱向量,其中zi为第i个波段的反射率,n为总的波段数。计算每一组份序列长度为m=floor(n/τ),其中floor()表示向下取整函数;
步骤1.3:以τ为间隔,对原始光谱向量进行分组操作。记x=[x(1),x(2),…,x(τ)]为分组后的序列,其中每一个分组的生成方式可表示为:
x(1)=[z1,z2,…zm]
x(2)=[zm+1,zm+2,…z2m]
…
x(i)=[z(i-1)m+1,z(i-1)m+2,…zim]
…
x(τ)=[z(τ-1)m+1,z(τ-1)m+2,…zτm]
图1中,波段分组标号t=1,2,…τ。
步骤2:对原始高光谱图像进行PCA降维(主成分分析,Principal ComponentAnalysis,PCA),保留前p个主成分;
具体实施时,本领域技术人员可预先设定p的取值。请见图2,原始高光谱图像经过PCA降维后,维度降至p维。
作为优选,步骤2中所述的PCA降维,其具体实现过程包括以下子步骤:
步骤2.1:记高光谱图像为其中m为图像中的像素总数,n为光谱特征总数,表示实数域。计算图像X的协方差矩阵C;
步骤2.2:对协方差矩阵C进行奇异值分解,得到矩阵C的特征值与对应的特征向量;
步骤2.3:对特征值按数值大小进行降序排序,特征向量按特征值的顺序也依次进行排序;
步骤2.4:取步骤2.3排序后的前p个特征向量u1,u2,…up组成矩阵
步骤2.5:计算降维后的图像Z=XU。
步骤3:对降维后的高光谱图像中的每一个像素,以该像素为中心,提取大小为w×w×p的影像块,即邻域块;具体实施时,可预设w的取值,建议取值范围为8~20;
请见图2,对降维后的高光谱图像中的每一个像素进行邻域块的提取操作。
步骤4:初始化网络中的参数;
具体实施时,可以根据需要预先初始化神经网络中的所有可训练的参数。优选地,初始化所有卷积层与全连接层中的权重矩阵和偏置向量参数,使其满足均值为0方差为0.1的高斯分布。
步骤5:将基于步骤1生成的光谱训练样本输入到网络的光谱特征提取分支;
请见图1,网络的光谱分支为一个双向长短时记忆模型,具体包括一个正向长短时记忆网络与一个反向长短时记忆网络。其输入数据为步骤1产生的τ个分组序列数据,输出为全连接结构的光谱特征。图中,Sigmoid函数的表达式为σ(x)=1/(1+exp(-x))。
t时刻正向长短时记忆网络中的门限函数及胞体(Cell)计算方式如下:
正向输入门if (t)=σ(Wfix(t)+Ufihf (t-1)+bfi)
正向遗忘门ff (t)=σ(Wffx(t)+Uffhf (t-1)+bff)
正向输出门of (t)=σ(Wfox(t)+Ufohf (t-1)+bfo)
正向胞体cf (t)=if (t)·g(Wfcx(t)+Ufchf (t-1)+bfc)+ff (t)·cf (t-1)
正向长短时记忆网络的输出hf (t)=of (t)·g(cf (t))
其中,cf (t-1)为t-1时刻的正向胞体,hf (t-1)为t-1时刻正向长短时记忆网络的输出,x(t)为t时刻读入的新词,用于生成新记忆。
t时刻反向长短时记忆网络中的门限函数及胞体计算方式如下:
反向输入门ib (t)=σ(Wbix(t)+Ubihb (t+1)+bbi)
反向遗忘门fb (t)=σ(Wbfx(t)+Ubfhb (t+1)+bbf)
反向输出门ob (t)=σ(Wbox(t)+Ubohb (t+1)+bbo)
反向胞体cb (t)=ib (t)·g(Wbcx(t)+Ubchb (t+1)+bbc)+fb (t)·cb (t+1)
反向长短时记忆网络的输出hb (t)=ob (t)·g(cb (t))
其中,cb (t+1)为t+1时刻的反向胞体,hb (t+1)为t+1时刻反向长短时记忆网络的输出,x(t)为t时刻读入的新词,用于生成新记忆。
最终双向长短时记忆模型的输出为h(t)=hf (t)+hb (t)
上述公式中,g(x)=tanh(x)=(ex-e-x)/(ex+e-x)为双曲正切函数,W(包括Wfi、Wff、Wfo、Wfc、Wbi、Wbf、Wbo、Wbc)与U(包括Ufi、Uff、Ufo、Ufc、Ubi、Ubf、Ubo、Ubc)为相关权重矩阵,b(包括bfi、bff、bfo、bfc、bbi、bbf、bbo、bbc)为相关偏置向量,·表示点积运算。
步骤6:将基于步骤2、3生成的空间训练样本输入到网络的空间特征提取分支;
请见图2,网络的空间分支为包含三个卷积层、三个池化层及四个全连接层的卷积神经网络,其输入数据为步骤2、3产生的影像块,输出为多尺度空间特征。具体而言,卷积层1、池化层1、卷积层2、池化层2、卷积层3和池化层3依次连接,网络中的三个池化层分别添加一个节点数为128的全连接层进行空间特征学习,以保证特征的维度一致。记hi=σ(Wixi+bi),i=1,2,3为第i个池化层对应的全连接层特征,其中xi表示第i个池化层拉直后的特征向量,Wi,bi分别为对应的权重矩阵与偏置向量,σ()为Sigmoid函数。随后采用一个全连接层,以逐点相加的方式,将三个全连接层的特征进行融合,得到多尺度空间特征
步骤7:进行空谱特征融合。请见图3。记空间特征向量和光谱特征向量分别为hspatial和hspectral,λspatial和λspectral为对应的权重因子。则融合的空谱特征hjoint可表示为:
hjoint=λspatialhspatial+λspectralhspectral
式中,λspatial和λspectral为可训练的网络参数,在网络训练过程中可进行自适应的学习。λspatial和λspectral取值范围为1~2,在步骤4中也可以对λspatial和λspectral预先进行随机初始化。
步骤8:利用随机批梯度下降算法,最小化网络的损失函数。网络的损失函数为:
其中,m为训练样本个数,yi为样本i对应的真实类别,代表样本i空谱联合分类的预测类别。
步骤9:对待分类高光谱图像,采用步骤1、2、3生成测试样本,输入到网络中,完成分类任务。
以上是本发明涉及的高光谱图像分类方法的实现步骤。整个网络综合考虑了光谱特征提取、空间特征提取与分类器训练,通过共享统一的目标函数,使得空谱特征得到更好的融合。具体实施时,可采用软件方式实现流程的自动运行。运行流程的装置也应当在本发明的保护范围内。
由于数据采集设备的差异,采集到的高光谱图像像素值往往差别很大,可能影响图像分类效果。为了避免这一问题,在进行步骤1前,应对高光谱图像数据进行标准化处理,使所有像素值处于0-1的范围之内。这一步将作为本发明涉及的预处理步骤。
应当理解的是,本说明书未详细阐述的部分均属于现有技术。
应当理解的是,上述针对较佳实施例的描述较为详细,并不能因此而认为是对本发明专利保护范围的限制,本领域的普通技术人员在本发明的启示下,在不脱离本发明权利要求所保护的范围情况下,还可以做出替换或变形,均落入本发明的保护范围之内,本发明的请求保护范围应以所附权利要求为准。
Claims (4)
1.一种基于空谱自适应双向长短时记忆模型的高光谱分类方法,建立包含光谱特征提取与空间特征提取两个分支的网络,并将两个分支的特征进行融合,实现空谱特征联合分类,其特征在于:在光谱特征学习分支中,针对高光谱图像波段间的相关性,提出了基于波段分组的双向长短时记忆网络模型,该模型包括一个正向长短时记忆网络与一个反向长短时记忆网络;在进行空谱特征融合时,记空间特征向量和光谱特征向量分别为hspatial和hspectral,λspatial和λspectral为对应的权重因子,融合的空谱特征hjoint表示为,
hjoint=λspatialhspatial+λspectralhspectral
式中,λspatial和λspectral在网络训练过程中进行自适应的学习;
在利用随机批梯度下降算法最小化网络的损失函数之后,对待分类高光谱图像生成测试样本,输入到网络中,得到地物分类结果。
2.根据权利要求1所述基于空谱自适应双向长短时记忆模型的高光谱分类方法,其特征在于:采用以下步骤实现,
步骤1,将高光谱图像中的每一个像素对应的光谱向量分成多个分组;
步骤2,对原始高光谱图像进行PCA降维;
步骤3,对降维后的高光谱图像中的每一个像素,以该像素为中心提取影像块;
步骤4,初始化网络中的参数,满足均值为0方差为0.1的高斯分布;
步骤5,将基于步骤1生成的光谱训练样本输入到网络的光谱特征提取分支;
步骤6,将基于步骤2和步骤3生成的空间训练样本输入到网络的空间特征提取分支;
步骤7,进行空谱特征融合;
步骤8,利用随机批梯度下降算法,最小化网络的损失函数;
步骤9,对待分类高光谱图像,采用步骤1、步骤2和步骤3生成测试样本,输入到网络中,完成分类任务。
3.根据权利要求2所述基于空谱自适应双向长短时记忆模型的高光谱分类方法,其特征在于:所述双向长短时记忆网络模型,输入数据为步骤1产生的多个分组序列数据,输出为全连接结构的光谱特征,
t时刻正向长短时记忆网络中的门限函数及胞体计算方式如下:
正向输入门if (t)=σ(Wfix(t)+Ufihf (t-1)+bfi)
正向遗忘门ff (t)=σ(Wffx(t)+Uffhf (t-1)+bff)
正向输出门of (t)=σ(Wfox(t)+Ufohf (t-1)+bfo)
正向胞体cf (t)=if (t)·g(Wfcx(t)+Ufchf (t-1)+bfc)+ff (t)·cf (t-1)
正向长短时记忆网络的输出hf (t)=of (t)·g(cf (t))
其中,cf (t-1)为t-1时刻的正向胞体,hf (t-1)为t-1时刻正向长短时记忆网络的输出,x(t)为t时刻读入的新词,用于生成新记忆;
t时刻反向长短时记忆网络中的门限函数及胞体计算方式如下,
反向输入门ib (t)=σ(Wbix(t)+Ubihb (t+1)+bbi)
反向遗忘门fb (t)=σ(Wbfx(t)+Ubfhb (t+1)+bbf)
反向输出门ob (t)=σ(Wbox(t)+Ubohb (t+1)+bbo)
反向胞体cb (t)=ib (t)·g(Wbcx(t)+Ubchb (t+1)+bbc)+fb (t)·cb (t+1)
反向长短时记忆网络的输出hb (t)=ob (t)·g(cb (t))
其中,cb (t+1)为t+1时刻的反向胞体,hb (t+1)为t+1时刻反向长短时记忆网络的输出,x(t)为t时刻读入的新词,用于生成新记忆;
最终双向长短时记忆模型的输出为h(t)=hf (t)+hb (t)
上述公式中,σ()为Sigmoid函数,g()为双曲正切函数,Wfi、Wff、Wfo、Wfc、Wbi、Wbf、Wbo、Wbc与Ufi、Uff、Ufo、Ufc、Ubi、Ubf、Ubo、Ubc为相关权重矩阵,bfi、bff、bfo、bfc、bbi、bbf、bbo、bbc为相关偏置向量,·表示点积运算。
4.根据权利要求1或2或3所述基于空谱自适应双向长短时记忆模型的高光谱分类方法,其特征在于:网络的损失函数为,
其中,m为训练样本个数,yi为样本i对应的真实类别,代表样本i空谱联合分类的预测类别。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910807957.XA CN110598594A (zh) | 2019-08-29 | 2019-08-29 | 基于空谱自适应双向长短时记忆模型的高光谱分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910807957.XA CN110598594A (zh) | 2019-08-29 | 2019-08-29 | 基于空谱自适应双向长短时记忆模型的高光谱分类方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110598594A true CN110598594A (zh) | 2019-12-20 |
Family
ID=68856295
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910807957.XA Pending CN110598594A (zh) | 2019-08-29 | 2019-08-29 | 基于空谱自适应双向长短时记忆模型的高光谱分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110598594A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111126256A (zh) * | 2019-12-23 | 2020-05-08 | 武汉大学 | 一种基于自适应空谱多尺度网络的高光谱图像分类方法 |
CN111738329A (zh) * | 2020-06-19 | 2020-10-02 | 中南大学 | 一种面向时间序列遥感影像的土地利用分类方法 |
CN111814607A (zh) * | 2020-06-24 | 2020-10-23 | 中国地质大学(武汉) | 一种适用于小样本高光谱影像分类的深度学习模型 |
CN111865702A (zh) * | 2020-08-04 | 2020-10-30 | 北京航空航天大学 | 基于卷积神经网络的网络故障诊断方法及装置 |
CN112016392A (zh) * | 2020-07-17 | 2020-12-01 | 浙江理工大学 | 一种基于高光谱图像的大豆虫害程度的小样本检测方法 |
CN112052755A (zh) * | 2020-08-24 | 2020-12-08 | 西安电子科技大学 | 基于多路注意力机制的语义卷积高光谱图像分类方法 |
WO2022160771A1 (zh) * | 2021-01-26 | 2022-08-04 | 武汉大学 | 基于自适应多尺度特征提取模型的高光谱图像分类方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108268890A (zh) * | 2017-12-28 | 2018-07-10 | 南京信息工程大学 | 一种高光谱图像分类方法 |
CN110084159A (zh) * | 2019-04-15 | 2019-08-02 | 西安电子科技大学 | 基于联合多级空谱信息cnn的高光谱图像分类方法 |
-
2019
- 2019-08-29 CN CN201910807957.XA patent/CN110598594A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108268890A (zh) * | 2017-12-28 | 2018-07-10 | 南京信息工程大学 | 一种高光谱图像分类方法 |
CN110084159A (zh) * | 2019-04-15 | 2019-08-02 | 西安电子科技大学 | 基于联合多级空谱信息cnn的高光谱图像分类方法 |
Non-Patent Citations (4)
Title |
---|
SIMIN LI等: "Hierarchical Multi-Scale Convolutional Neural Networks for Hyperspectral Image Classification", 《SENSORS》 * |
YONGHAO XU等: "Spectral–Spatial Unified Networks for Hyperspectral Image Classification", 《IEEE TRANSACTIONS ON GEOSCIENCE AND REMOTE SENSING》 * |
刘文龙等: "基于双线性函数注意力Bi-LSTM模型的机器阅读理解", 《计算机科学》 * |
唐晓燕: "《高光谱图像混合像元非线性分解技术》", 31 March 2019 * |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111126256A (zh) * | 2019-12-23 | 2020-05-08 | 武汉大学 | 一种基于自适应空谱多尺度网络的高光谱图像分类方法 |
CN111126256B (zh) * | 2019-12-23 | 2022-02-15 | 武汉大学 | 一种基于自适应空谱多尺度网络的高光谱图像分类方法 |
CN111738329A (zh) * | 2020-06-19 | 2020-10-02 | 中南大学 | 一种面向时间序列遥感影像的土地利用分类方法 |
CN111738329B (zh) * | 2020-06-19 | 2021-07-13 | 中南大学 | 一种面向时间序列遥感影像的土地利用分类方法 |
CN111814607A (zh) * | 2020-06-24 | 2020-10-23 | 中国地质大学(武汉) | 一种适用于小样本高光谱影像分类的深度学习模型 |
CN111814607B (zh) * | 2020-06-24 | 2023-12-29 | 中国地质大学(武汉) | 一种适用于小样本高光谱影像分类的深度学习模型 |
CN112016392A (zh) * | 2020-07-17 | 2020-12-01 | 浙江理工大学 | 一种基于高光谱图像的大豆虫害程度的小样本检测方法 |
CN112016392B (zh) * | 2020-07-17 | 2024-05-28 | 浙江理工大学 | 一种基于高光谱图像的大豆虫害程度的小样本检测方法 |
CN111865702A (zh) * | 2020-08-04 | 2020-10-30 | 北京航空航天大学 | 基于卷积神经网络的网络故障诊断方法及装置 |
CN112052755A (zh) * | 2020-08-24 | 2020-12-08 | 西安电子科技大学 | 基于多路注意力机制的语义卷积高光谱图像分类方法 |
WO2022160771A1 (zh) * | 2021-01-26 | 2022-08-04 | 武汉大学 | 基于自适应多尺度特征提取模型的高光谱图像分类方法 |
US11783569B2 (en) | 2021-01-26 | 2023-10-10 | Wuhan University | Method for classifying hyperspectral images on basis of adaptive multi-scale feature extraction model |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110598594A (zh) | 基于空谱自适应双向长短时记忆模型的高光谱分类方法 | |
Zanjani et al. | Stain normalization of histopathology images using generative adversarial networks | |
Suárez et al. | Infrared image colorization based on a triplet dcgan architecture | |
CN110287800B (zh) | 一种基于sgse-gan的遥感图像场景分类方法 | |
CN109949255B (zh) | 图像重建方法及设备 | |
Juefei-Xu et al. | Local binary convolutional neural networks | |
CN110555458B (zh) | 基于注意力机制生成对抗网络的多波段图像特征级融合方法 | |
CN107085716B (zh) | 基于多任务生成对抗网络的跨视角步态识别方法 | |
Lin et al. | Hyperspectral image denoising via matrix factorization and deep prior regularization | |
Cohen et al. | Crater detection via convolutional neural networks | |
CN109977757B (zh) | 一种基于混合深度回归网络的多模态的头部姿态估计方法 | |
CN111274869A (zh) | 基于并行注意力机制残差网进行高光谱图像分类的方法 | |
Suárez et al. | Learning to colorize infrared images | |
CN109190511B (zh) | 基于局部与结构约束低秩表示的高光谱分类方法 | |
CN109598220B (zh) | 一种基于多元输入多尺度卷积的人数统计方法 | |
CN112488205A (zh) | 基于优化kpca算法的神经网络图像分类识别方法 | |
CN111639719A (zh) | 基于时空运动和特征融合的足迹图像检索方法 | |
CN112818764A (zh) | 一种基于特征重建模型的低分辨率图像人脸表情识别方法 | |
CN114821164A (zh) | 基于孪生网络的高光谱图像分类方法 | |
Zhang et al. | Self-blast state detection of glass insulators based on stochastic configuration networks and a feedback transfer learning mechanism | |
CN109239670B (zh) | 基于结构嵌入和深度神经网络的雷达hrrp识别方法 | |
Sang et al. | Discriminative deep feature learning for facial emotion recognition | |
Ge et al. | Adaptive hash attention and lower triangular network for hyperspectral image classification | |
CN115116139A (zh) | 基于图卷积网络的多粒度人体动作分类方法 | |
Jang et al. | Deep neural networks with a set of node-wise varying activation functions |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20191220 |
|
RJ01 | Rejection of invention patent application after publication |