CN112699899A - 一种基于生成对抗网络的高光谱图像特征提取方法 - Google Patents
一种基于生成对抗网络的高光谱图像特征提取方法 Download PDFInfo
- Publication number
- CN112699899A CN112699899A CN202011642545.4A CN202011642545A CN112699899A CN 112699899 A CN112699899 A CN 112699899A CN 202011642545 A CN202011642545 A CN 202011642545A CN 112699899 A CN112699899 A CN 112699899A
- Authority
- CN
- China
- Prior art keywords
- data
- discriminator
- sample
- hyperspectral image
- generator
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000605 extraction Methods 0.000 title claims abstract description 52
- 238000000034 method Methods 0.000 claims abstract description 41
- 238000012549 training Methods 0.000 claims abstract description 37
- 230000008569 process Effects 0.000 claims abstract description 17
- 230000006870 function Effects 0.000 claims description 37
- 238000011176 pooling Methods 0.000 claims description 26
- 238000010606 normalization Methods 0.000 claims description 20
- 238000005070 sampling Methods 0.000 claims description 17
- 239000011159 matrix material Substances 0.000 claims description 9
- 238000010586 diagram Methods 0.000 claims description 7
- 230000003044 adaptive effect Effects 0.000 claims description 6
- 230000000295 complement effect Effects 0.000 claims description 5
- 230000004913 activation Effects 0.000 claims description 3
- 238000013459 approach Methods 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000005457 optimization Methods 0.000 claims description 3
- 230000003595 spectral effect Effects 0.000 abstract description 11
- 238000002474 experimental method Methods 0.000 description 15
- 238000000513 principal component analysis Methods 0.000 description 9
- 238000013527 convolutional neural network Methods 0.000 description 8
- 238000012706 support-vector machine Methods 0.000 description 6
- 238000001228 spectrum Methods 0.000 description 5
- 235000008331 Pinus X rigitaeda Nutrition 0.000 description 4
- 235000011613 Pinus brutia Nutrition 0.000 description 4
- 241000018646 Pinus brutia Species 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 241000488988 Monotropa Species 0.000 description 3
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 230000000052 comparative effect Effects 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000004880 explosion Methods 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 238000010521 absorption reaction Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000003331 infrared imaging Methods 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000000087 stabilizing effect Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Landscapes
- Image Analysis (AREA)
Abstract
本发明涉及一种基于生成对抗网络的高光谱图像特征提取方法,将生成对抗网络与1D‑CNN相结合,摆脱了对标记高光谱数据样本的依赖,实现无监督的高光谱图像的光谱特征提取。具体地,采用对抗训练的方式,生成器梯度的更新信息不再像CNN一样来自于标记的数据样本,而是来自于判别器,整个训练过程中,不再需要标记的数据样本。
Description
技术领域
本发明属于通信系统技术领域,具体涉及一种基于生成对抗网络的高光谱图像特征提取方法。
背景技术
在对高光谱图像进行分类时,由于高光谱图像相邻波段相关性高,数据存在较高的冗余,而且同一种地物可能具有不同的光谱,不同的地物又可能具有相同的光谱,加大了分类难度。因此在对高光谱图像分类之前有必要进行特征提取,使高光谱图像数据具有更好的可分性。
特征提取是从原始数据中求出对分类识别最有效的特征,去除不易判别的特征,对于重复和相关性较强的特征则只选取其中的一个。传统的特征提取方法如主成分分析(PCA)、线性判别分析(LDA)都是典型的线性投影方法,对非线性的高光谱数据不能起到很好的效果,而且它们不能够提取到深层的特征信息。卷积神经网络(CNN)能够较好的处理非线性数据,但是它在训练过程中需要大量的标记样本,而高光谱数据样本的标记往往需要耗费大量的人力物力。受成本限制,一般而言,高光谱数据的标记类别样本不足,常用于特征提取的监督深度学习方法的性能会受到较大的影响。
故此需要一种性能优秀且可以摆脱对高光谱数据标记样本的依赖的高光谱图像特征提取方法,以对高光谱图像进行更准确的分类。
发明内容
基于现有技术中存在的上述缺点和不足,本发明的目的之一是至少解决现有技术中存在的上述问题之一或多个,换言之,本发明的目的之一是提供满足前述需求之一或多个的一种基于生成对抗网络的高光谱图像特征提取方法。
为了达到上述发明目的,本发明采用以下技术方案:
一种基于生成对抗网络的高光谱图像特征提取方法,包括步骤:
S1、将高光谱图像数据中各波段的值归一化到[0,1]之间,生成真实样本;
S2、构建生成器网络,生成器网络用于生成与真实样本大小相同的假样本;构建判别器网络,判别器网络用于根据假样本及真实样本生成特征图,并通过特征图得到假样本相对于真实样本为真的程度;
S3、固定生成器并生成假样本,将真实样本与假样本共同输入判别器,训练判别器,得到判别器损失函数,判别器损失函数为判别器的输出结果,用于评估真实数据分布和生成样本分布之间的距离,将判别器损失函数进行梯度反向传播,并更新判别器中的参数;
S4、固定判别器,训练生成器,得到生成器损失函数,生成器损失函数为判别器的输出结果,用来评估真实数据分布与生成样本分布之间的距离;将生成器损失函数进行梯度反向传播,并更新生成器中的参数;
S5、若判别器损失函数及生成器损失函数未达到0,则返回步骤S3,否则保存判别器参数,进入步骤S6;
S6、高光谱图像数据样本输入判别器,对判别器生成的特征图在通道方向进行最大池化操作;将池化后的特征展平为一维特征并连接,得到融合的多特征层互补特征。
其中x’r为归一化之后的像素数据,xr为选择的高光谱图像数据中第r个像素的数据,r=1,2.…P,P为选择的高光谱图像数据的像素总个数,表示第r个像素的第i个波段的值,i=1,2.…L,L为高光谱图像数据波段的总数,Xmin为xr中波段的最小值,Xmax为xr中波段的最大值。
作为优选方案,对于波段总数为200的高光谱图像数据,步骤S2中,生成器网络的结构及使用方法具体为:
生成器网络由两层全连接层、第一上采样层、第一卷积层构成;从高斯分布N(0,1)采样的100维随机噪声输入生成器,经过两个全连接层得到一个3200×1的一维张量,将该一维张量重塑为50×64的二维张量,其中,50为特征图上每个通道的数据维数,64为通道个数;插值将长度为50的一维数据矩阵放大至100,得到100×64的特征图;在第一卷积层中对特征图进行扩充,再通过上采样层将特征图扩展到200维度,以得到假样本。
作为优选方案,生成器网络在第一卷积层后还依次连接第二、第三卷积层;数据输出上采样层后进行批归一化操作,批归一化即通过计算一批数据的均值和方差对数据进行归一化,使数据具有0均值和单位方差;再经过两个卷积层将特征图的通道数缩减至1,生成假样本;第三卷积层在批归一化之后采用双曲正切函数,第一卷积层、第二卷积层采用带泄漏线性整流函数作为激活函数。
作为优选方案,判别器由五层卷积层和全连接层组成,不包含常规模型的池化层,改用步长卷积代替池化操作;对于波段总数为200的高光谱图像数据,200×1的假样本和真实样本数据输入判别器后,在卷积层中依次经过三次卷积和两次步长卷积操作,得到大小为48×32的特征;将输出尺寸为48×32的特征图展平为1536×1的一维张量,最后经过全连接层输出一个结果值,用于刻画假样本相对于真实样本为真的程度;展平操作即将二维或多维数据矩阵中的数据依次连接在一起组成一维数据;在判别网络完成卷积操作之后,除第一个卷积层不添加批归一化层之外,其他所有卷积层都添加批归一化层和带泄漏线性整流函数。步长卷积操作通过设置多步幅来压缩部分信息,即判别器卷积层的卷积核在数据上进行滑动计算时,每次滑动多个数据单位;五层卷积层的卷积核大小皆为1×3,卷积所得特征的参数48和32分别为特征图的维度和通道数;
作为优选方案,对于波段总数为200的高光谱图像数据,判别器的训练过程具体为,从高斯分布N(0,1)随机采样100维噪声数据z,输入生成器中得到生成样本G(z),固定生成器,将生成样本G(z)和真实样本x一同输入判别器中,得到D(G(z))和D(x);并引入惩罚项对判别器的梯度进行惩罚,判别器损失函数Dloss如下:
其中,pdata(x)为真实样本分布,pz(z)为噪声数据分布。r(x')是判别器输入的样本空间,通过在真实样本x和生成样本G(z)之间插值得到x'=αx+(1-α)G(z),α为0到1之间的小数;D(G(z))为输入样本为G(z)时判别器输出的值,D(x)为输入样本为x时判别器输出的值,是判别器梯度2范数的平方,使D(x')的梯度不断接近0,则生成样本分布pg也在不断向真实样本分布pr靠近,k为惩罚参数,用于控制D(x')的梯度接近0的速度,E为期望,通过计算每一批输出数据的均值得到;z~pz(z)表示噪声数据z服从分布pz(z),表示判别器对由噪声数据z生成的样本的判别结果的期望。x~pdata(x)表示真实数据x服从分布pdata(x),表示判别器对真实数据x的判别结果的期望,x'~r(x')表示数据x'服从分布r(x'),表示输入数据为x'时,判别器梯度2范数的平方的期望。
作为优选方案,更新判别器的参数,使用自适应矩估计优化器进行判别器网络中的权值和偏置参数的更新,学习率用于控制网络优化的速度对于波段总数为200的高光谱图像数据,学习率设置为0.0005。
作为优选方案,对于波段总数为200的高光谱图像数据,生成器的训练过程具体为:从高斯分布N(0,1)随机采样100维噪声数据z,输入生成器中得到生成样本G(z),将生成样本G(z)输入判别器得到输出值为D(G(z)),生成器损失函数Gloss如下:
其中,D(G(z))为输入样本为G(z)时判别器输出的值,z~pz(z)表示噪声数据z服从分布pz(z),即z是从pz(z)采样得到的,E为期望,这里由均值求得,表示判别器对由噪声数据z生成的样本的判别结果的期望。
作为优选方案,更新生成器的参数,使用自适应矩估计优化器进行生成器网络中参数的更新,对于波段总数为200的高光谱图像数据,学习率设置为0.0002。
作为优选方案,将特征展平为一维并连接具体为:
fm=Flatten(Maxpoolingchannel(Fm))
fh=Flatten(Maxpoolingchannel(Fh))
ffinal=fm C fh
其中Fm为倒数第二层特征图,Fh为最后一层特征图,ffinal为最终得到的融合特征,fm表示中层特征,fh表示高层特征,Flatten为展平操作,即将二维数据矩阵中的每一个数据依次连接并组成一维数据;C为连接操作,即将两个一维数据首尾相连,拼接为一个一维数据;Maxpoolingchannel表示在通道方向进行最大池化,池化窗口大小为1×4,步长为4,即使用1×4的方框在一维数据上滑动,计算每次滑动时方框内数据的最大值并保留,方框每次滑动的距离为4个数据单位。
本发明与现有技术相比,有益效果是:
本发明的一种基于生成对抗网络的高光谱图像特征提取方法,可以摆脱对高光谱数据标记样本的依赖,实现较少样本数下高光谱图像特征的提取。
附图说明
图1是本发明实施例的一种基于生成对抗网络的高光谱图像特征提取方法的流程示意图;
图2是本发明实施例的一种基于生成对抗网络的高光谱图像特征提取方法的生成器和判别器的模型结构图;
图3是本发明实施例的一种基于生成对抗网络的高光谱图像特征提取方法的步长卷积和最大池化的对比图;
图4是本发明实施例的一种基于生成对抗网络的高光谱图像特征提取方法的高光谱图像光谱特征提取的示意图;
图5是本发明实施例的一种基于生成对抗网络的高光谱图像特征提取方法的通道最大池化和普通最大池化的对比图;
图6是本发明实施例的一种基于生成对抗网络的高光谱图像特征提取方法的对比实验的一张植被分布图像数据;
图7是本发明实施例的一种基于生成对抗网络的高光谱图像特征提取方法的对比实验的另一张植被分布图像数据。
具体实施方式
为了更清楚地说明本发明实施例,下面将对照附图说明本发明的具体实施方式。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,并获得其他的实施方式。
实施例:本发明提出的一种基于生成对抗网络的高光谱图像特征提取方法,其一实施例的流程图如图1所示,本实施例的方法针对具有r个像素L个波段的高光谱数据xr。
方法包括步骤:
步骤一、对高光谱图像数据预处理;
步骤二、构建生成对抗网络模型;
步骤三、对网络模型训练并保存参数;
步骤四、提取光谱特征。
具体的,
采用如下流程:
步骤S1、
1)从公开数据集中获取高光谱图像数据,选择带有地物类别标签的像素。
其中x’r为归一化之后的像素数据,xr为选择的高光谱数据中第r个像素的数据,r=1,2.…P,P为选择的高光谱数据的像素总个数,表示第r个像素的第i个波段的值,i=1,2.…L,L为高光谱数据波段的总数(常用数据样本具有200或103个波段),Xmin为xr中波段的最小值,Xmax为xr中波段的最大值。
步骤S2,针对于高光谱图像的光谱特征,将生成对抗网络与1D-CNN相结合,生成网络通过上采样和1D-CNN生成与真实样本相似的假样本,判别器经过多个卷积层和全连接层输出判别结果。与CNN中使用的最大池化相比,步长卷积操作同样能够实现对特征图的下采样,不同于最大池化的固定操作,步长卷积的卷积核参数可通过训练得到,能够进行自适应下采样,保留更多关键信息。生成器和判别器的模型结构如图2所示,本发明中步长卷积和最大池化的对比如图3所示。
生成器网络的构建方法为:生成器主要由全连接层(FC)、上采样层(UpSamping)和1维卷积层(1D-CNN)三部分组成。生成器的输入为从高斯分布N(0,1)采样的100维随机噪声,经过两个全连接层得到一个3200×1的一维张量,将该一维张量重塑为50×64的二维张量。其中,50为特征图上每个通道的数据维数,64为通道个数。上采样层操作与池化操作相反,将缩放因子设为2,具体的,通过在相邻数据之间插值的方式,将输入长度为50的一维数据矩阵放大至100,得到100×64的特征图。为了获取更多的特征,使用128个1×3的卷积核对特征通道进行扩充,再通过上采样层将特征图扩展到与样本数据相同维度,即200维。此外,为了稳定生成器的训练和学习,在卷积层和上采样层之后进行批归一化(BN)操作,批归一化即通过计算一批数据的均值和方差对数据进行归一化,使数据具有0均值和单位方差,从而稳定网络的学习过程。最后经过两个卷积层将特征图的通道数缩减至1,即生成了与真实样本大小相同的假样本。为了增加网络的非线性,对最后一个卷积层在批归一化之后采用双曲正切函数(Tanh),其他卷积层采用带泄漏线性整流函数(LRelu)作为激活函数。
构建判别器网络,判别器模型中主要由1维卷积层和全连接层组成,与其他模型中采用最大池化进行下采样不同,判别器中不含池化层,使用步长卷积替代池化操作。其中,下采样即对数据进行抽取,对于一维数据序列,每隔几个数据取样一次,得到新的采样数据;步长卷积通过设置多步幅来压缩部分信息,即卷积核在数据上进行滑动计算时,每次滑动多个数据单位。判别器的输入为200×1的生成样本和真实样本数据,经过三次卷积和两次步长卷积操作,得到大小为48×32的特征图。其中,卷积核的大小为1×3,48和32分别为特征图的维度和通道数。将输出尺寸为48×32的特征图展平为1536×1的一维张量,最后经过全连接层输出一个值用于刻画输入样本为真的程度。其中,展平操作即将二维或多维数据矩阵中的数据依次连接在一起组成一维数据。为了保证模型训练时的稳定性,在判别网络完成卷积操作之后,除第一个卷积层不添加批归一化层(BN)之外,其他所有卷积层都添加批归一化层(BN)和带泄漏线性整流函数(LRelu)。
步骤S3、
训练判别器,从高斯分布N(0,1)随机采样100维噪声数据z,输入生成器中得到生成样本G(z),固定生成器,将生成样本G(z)和真实样本x一同输入判别器中,得到D(G(z))和D(x)。为了稳定模型的训练,防止出现梯度爆炸,即梯度迅速呈指数级增长,并确保网络的收敛,本发明引入惩罚项对判别器的梯度进行惩罚,得到判别器损失函数Dloss如下:
其中,pdata(x)为真实样本分布,pz(z)为噪声数据分布。r(x')是判别器输入的样本空间,x'可通过在真实样本x和生成样本G(z)之间插值得到,即x'=αx+(1-α)G(z),α为0到1之间的小数。D(G(z))为输入样本为G(z)时判别器输出的值,D(x)为输入样本为x时判别器输出的值,是判别器梯度2范数的平方,使D(x')的梯度不断接近0,则生成样本分布pg也在不断向真实样本分布pr靠近,k为惩罚参数,用于控制D(x')的梯度接近0的速度,E为期望,这里通过计算每一批输出数据的均值得到,z~pz(z)表示噪声数据z服从分布pz(z),表示判别器对由噪声数据z生成的样本的判别结果的期望。x~pdata(x)表示真实数据x服从分布pdata(x),表示判别器对真实数据x的判别结果的期望,x'~r(x')表示数据x'服从分布r(x'),表示输入数据为x'时,判别器梯度2范数的平方的期望。
将判别器损失进行梯度反向传播,并使用自适应矩估计(Adam)优化器进行判别器网络中的权值和偏置参数的更新,学习率设置为0.0005,学习率用于控制网络优化的速度。
S4、训练生成器,固定判别器,从高斯分布N(0,1)随机采样100维噪声数据z,输入生成器中得到生成样本G(z),将生成样本G(z)输入判别器得到输出值为D(G(z)),生成器损失函数Gloss如下:
其中,D(G(z))为输入样本为G(z)时判别器输出的值,z~pz(z)表示噪声数据z服从分布pz(z),即z是从pz(z)采样得到的,E为期望,这里由均值求得,表示判别器对由噪声数据z生成的样本的判别结果的期望。
D、将生成器损失进行梯度反向传播,并使用自适应矩估计(Adam)优化器进行生成器网络的参数的更新,学习率设置为0.0002。
E、重复步骤A~D,直至生成器和判别器的损失都减小并稳定在0,保存判别器的参数。
S5、
将训练好的判别器作为特征提取器,高光谱图像光谱特征提取的示意图如图4所示。
将高光谱数据样本输入训练完成的判别器,为了在降低特征维度的同时尽可能地保留光谱信息,取出最后两层特征图Fm和Fh,并在通道方向进行最大池化操作。普通最大池化和本发明中通道最大池化的对比如图5所示;
将池化后的特征展平为一维特征并连接,便得到了融合的多特征层互补特征,实现过程公式如下:
fm=Flatten(Maxpoolingchannel(Fm))
fh=Flatten(Maxpoolingchannel(Fh))
ffinal=fm C fh
其中Fm为倒数第二层特征图,Fh为最后一层特征图,ffinal为最终得到的融合特征,fm表示中层特征,fh表示高层特征,Flatten为展平操作,即将二维数据矩阵中的每一个数据依次连接并组成一维数据;C为连接操作,即将两个一维数据首尾相连,拼接为一个一维数据;Maxpoolingchannel表示在通道方向进行最大池化,其中池化窗口大小为1×4,步长为4,即使用1×4的方框在一维数据上滑动,计算每次滑动方框内数据的最大值并保留,方框每次滑动的距离为4个数据单位。
于传统的特征提取方法如主成分分析(PCA)、线性判别分析(LDA)都是典型的线性投影方法,对非线性的高光谱数据不能起到很好的效果,而且它们不能够提取到深层的特征信息。卷积神经网络(CNN)能够较好的处理非线性数据,但是它在训练过程中需要大量标记类别的样本,而高光谱数据样本类别的标记往往需要耗费大量的人力物力。本发明提供了一种基于生成对抗网络的高光谱图像特征提取方法,将生成对抗网络与1D-CNN相结合,摆脱了对标记高光谱数据样本的依赖,实现无监督的高光谱图像的光谱特征提取。具体地,采用对抗训练的方式,生成器梯度的更新信息不再像CNN一样来自于标记的数据样本,而是来自于判别器,整个训练过程中,不再需要标记的数据样本。由于普通的GAN训练过程中非常不稳定,容易出现模式崩塌和梯度爆炸等问题,为了稳定模型的训练,确保GAN的收敛,本发明在判别器的损失函数中引入了正则项对判别器的梯度进行惩罚,并在训练过程中对生成器和判别器采用不同的学习率,以确保判别器正确判断输入样本的真假,使得生成器向正确的方向优化。此外,针对高光谱图像的光谱特征,常使用的最大池化会去除大量的光谱信息,本发明中在通道方向对特征图进行池化,不仅降低了特征维度,还保留了关键光谱特征。多特征层特征融合能够获取不同层次的互补特征,与CNN中展平最后一层特征图作为特征相比,并有更多的互补性和相关性信息。本发明的方法较好的实现了无监督的高光谱图像特征提取,并在分类任务中获得了较好的分类精度。
以下通过具体试验数据解释本发明方法的优越性:
选取Indian Pines和Pavia University两个典型的高光谱真实数据集进行实验,其中,Indian Pines是于1992年由机载可见/红外成像光谱仪(AVIRIS)传感器在美国印第安纳西北部地区捕获的植被影像。由145×145个像素和220个光谱波段组成,波长范围从为0.4-2.5μm。由于大气和水的吸收影响,去除了20个波段(104—108波段、150—163波段),剩下的200个波段用于分类实验。两个数据集的真实地物分布图分别如图6和图7所示,它们分别包含16和9个标记的类别,图中使用不同颜色进行类别的分割。
为了验证提出方法的有效性,在模型训练阶段,使用所有无标签的高光谱数据样本进行训练,训练完成后,依次对每个样本进行无监督特征提取,再使用少量标记样本进行监督分类实验。我们采用不同分类器对提取特征进行分类,在进行分类前,首先将高光谱数据归一化至区间[0,1]中,通过分类结果对所提取特征进行直观评价,并与无监督特征提取方法PCA、监督特征提取方法LDA以及原始数据进行对比。PCA作为经典的无监督特征提取方法,已经广泛用于高光谱图像的特征提取,并取得了良好的效果。与PCA不同,LDA为监督特征提取方法,该方法在进行特征提取时需要样本的类别信息。为了降低分类器带来的误差,我们选取广泛使用的支持向量机(SVM)和k近邻(KNN)这两种监督分类器,其中SVM核函数为高斯径向基函数(RBF),惩罚参数C从10-2到104进行测试,内核宽度γ在10-2到103之间,近邻数在1-10之间。为了公平起见,我们进行多次实验,使用网格搜索(grid search)方法确定SVM和k近邻的最佳参数值,并记录两种分类方法所得的实验结果。此外,为了对分类性能进行评估,我们选取了总体准确度(OA)、平均准确度(AA)和卡帕系数(KC)这三个关键指标。OA为正确分类的像素数与总像素数的比值,能够反映整体分类性能;AA为每个类分类准确度的均值,可以反映出每一类的分类性能;KC用于分类的一致性检验。
与以往使用大量训练数据不同(如20%和50%),在Indian Pines上的实验分别随机抽取10%和5%的样本作为训练样本,其余为测试样本。而在Pavia University上实验时,由于该数据集样本数量较多,训练样本的比例分别设置为3%和1%。为了降低实验带来的误差,每次分类实验重复10次,并取OA、AA以及KC的平均值进行比较。在Indian Pines上的实验结果如表1和表2所示,在Pavia University上的实验结果如表3和表4所示,每种方法的最优结果用黑体标出。
在Indian Pines数据集上使用KNN进行分类时,如表1和表2所示,当训练样本为10%和5%时,本发明提出的方法在AA和KC方面获得了良好的表现,优于原始数据和PCA方法。尽管LDA方法在训练样本为10%时获得了最优的OA,但它是监督特征提取方法,需要大量的类别标签。当使用SVM进行分类,训练样本分别为10%和5%时,本发明提出方法在OA、AA和KC三个分类指标上都得到了最好的结果,并且与原数据和其他两种特征提取方法相比,在大多数类别上的分类表现都具有显著的提升。此外,对于第1类、第7类和第9类来说,尽管每个类别中的样本数量较少(分别为46、28和20),本发明提出方法在两种方法的分类结果上仍获得了非常巨大的提升,这也证明了本发明提出方法能够较好的缓解各类样本不平衡的问题。
表1不同特征提取方法在Indian Pines上的分类结果(分类器训练样本10%)
表2不同特征提取方法在Indian Pines数据集上的分类结果(分类器训练样本5%)
由表3和表4中的实验结果可得,在Pavia University数据集上,分别使用3%和1%样本对KNN和SVM两个分类器训练。在该数据集实验时,要适当调节提出模型中生成器和判别器的结构,使得生成样本为103维。在两次实验中,本发明提出方法在OA、AA和KC三个分类指标都取得了最优的结果。在两个数据集上的实验结果表明,对于缺少标记样本的高光谱数据,CNN等深度学习方法难以获得良好的分类表现。而提出的无监督特征提取方法只需要5%或1%的标记样本用于分类器的训练,便能够完成对高光谱图像的良好分类,并优于PCA、LDA等传统特征提取方法,较好的解决了高光谱数据标记样本不足的问题。
表3不同特征提取方法在Pavia University上的分类结果(分类器训练样本3%)
表4不同特征提取方法在Pavia University上的分类结果(分类器训练样本1%)
应当说明的是,以上所述仅是对本发明的优选实施例及原理进行了详细说明,对本领域的普通技术人员而言,依据本发明提供的思想,在具体实施方式上会有改变之处,而这些改变也应视为本发明的保护范围。
Claims (10)
1.一种基于生成对抗网络的高光谱图像特征提取方法,其特征在于,包括步骤:
S1、将高光谱图像数据中各波段的值归一化到[0,1]之间,生成真实样本;
S2、构建生成器网络,所述生成器网络用于生成与所述真实样本大小相同的假样本;构建判别器网络,所述判别器网络用于根据假样本及真实样本生成特征图,并通过所述特征图得到所述假样本相对于真实样本为真的程度;
S3、固定生成器并生成假样本,将真实样本与假样本共同输入判别器,训练判别器,得到判别器损失函数,所述判别器损失函数为判别器的输出结果,用于评估真实数据分布和生成样本分布之间的距离,将判别器损失函数进行梯度反向传播,并更新判别器中的参数;
S4、固定判别器,训练生成器,得到生成器损失函数,所述生成器损失函数为判别器的输出结果,用来评估真实数据分布与生成样本分布之间的距离;将生成器损失函数进行梯度反向传播,并更新生成器中的参数;
S5、若判别器损失函数及生成器损失函数未达到0,则返回步骤S3,否则保存判别器参数,进入步骤S6;
S6、高光谱图像数据样本输入判别器,对判别器生成的特征图在通道方向进行最大池化操作;将池化后的特征展平为一维特征并连接,得到融合的多特征层互补特征。
3.根据权利要求2所述的一种基于生成对抗网络的高光谱图像特征提取方法,其特征在于,对于波段总数为200的高光谱图像数据,步骤S2中,所述生成器网络的结构及使用方法具体为:
生成器网络由两层全连接层、第一上采样层、第一卷积层构成;从高斯分布N(0,1)采样的100维随机噪声输入生成器,经过两个全连接层得到一个3200×1的一维张量,将该一维张量重塑为50×64的二维张量,其中,50为特征图上每个通道的数据维数,64为通道个数;插值将长度为50的一维数据矩阵放大至100,得到100×64的特征图;在第一卷积层中对特征图进行扩充,再通过上采样层将特征图扩展到200维度,以得到假样本。
4.根据权利要求3所述的一种基于生成对抗网络的高光谱图像特征提取方法,其特征在于,所述生成器网络在第一卷积层后还依次连接第二、第三卷积层;数据输出上采样层后进行批归一化操作,批归一化即通过计算一批数据的均值和方差对数据进行归一化,使数据具有0均值和单位方差;再经过两个卷积层将特征图的通道数缩减至1,生成假样本;所述第三卷积层在批归一化之后采用双曲正切函数,所述第一卷积层、第二卷积层采用带泄漏线性整流函数作为激活函数。
5.根据权利要求1所述的一种基于生成对抗网络的高光谱图像特征提取方法,其特征在于,判别器由五层卷积层和全连接层组成,不包含常规模型的池化层,改用步长卷积代替池化操作;对于波段总数为200的高光谱图像数据,200×1的假样本和真实样本数据输入判别器后,在卷积层中依次经过三次卷积和两次步长卷积操作,得到大小为48×32的特征;将输出尺寸为48×32的特征图展平为1536×1的一维张量,最后经过全连接层输出一个结果值,用于刻画所述假样本相对于所述真实样本为真的程度;所述展平操作即将二维或多维数据矩阵中的数据依次连接在一起组成一维数据;在判别网络完成卷积操作之后,除第一个卷积层不添加批归一化层之外,其他所有卷积层都添加批归一化层和带泄漏线性整流函数。所述步长卷积操作通过设置多步幅来压缩部分信息,即判别器卷积层的卷积核在数据上进行滑动计算时,每次滑动多个数据单位;所述五层卷积层的卷积核大小皆为1×3,卷积所得特征的参数48和32分别为所述特征图的维度和通道数。
6.根据权利要求5所述的一种基于生成对抗网络的高光谱图像特征提取方法,其特征在于,对于波段总数为200的高光谱图像数据,所述判别器的训练过程具体为,从高斯分布N(0,1)随机采样100维噪声数据z,输入生成器中得到生成样本G(z),固定生成器,将生成样本G(z)和真实样本x一同输入判别器中,得到D(G(z))和D(x);并引入惩罚项对判别器的梯度进行惩罚,判别器损失函数Dloss如下:
其中,pdata(x)为真实样本分布,pz(z)为噪声数据分布。r(x')是判别器输入的样本空间,通过在真实样本x和生成样本G(z)之间插值得到x'=αx+(1-α)G(z),α为0到1之间的小数;D(G(z))为输入样本为G(z)时判别器输出的值,D(x)为输入样本为x时判别器输出的值,是判别器梯度2范数的平方,使D(x')的梯度不断接近0,则生成样本分布pg也在不断向真实样本分布pr靠近,k为惩罚参数,用于控制D(x')的梯度接近0的速度,E为期望,通过计算每一批输出数据的均值得到;z~pz(z)表示噪声数据z服从分布pz(z),表示判别器对由噪声数据z生成的样本的判别结果的期望。x~pdata(x)表示真实数据x服从分布pdata(x),表示判别器对真实数据x的判别结果的期望,x'~r(x')表示数据x'服从分布r(x'),表示输入数据为x'时,判别器梯度2范数的平方的期望。
7.根据权利要求1所述的一种基于生成对抗网络的高光谱图像特征提取方法,其特征在于,所述更新判别器的参数,使用自适应矩估计优化器进行判别器网络中的权值和偏置参数的更新,所述学习率用于控制网络优化的速度对于波段总数为200的高光谱图像数据,所述学习率设置为0.0005。
9.根据权利要求1所述的一种基于生成对抗网络的高光谱图像特征提取方法,其特征在于,所述更新生成器的参数,使用自适应矩估计优化器进行生成器网络中参数的更新,对于波段总数为200的高光谱图像数据,所述学习率设置为0.0002。
10.根据权利要求1所述的一种基于生成对抗网络的高光谱图像特征提取方法,其特征在于,所述将特征展平为一维并连接具体为:
fm=Flatten(Maxpoolingchannel(Fm))
fh=Flatten(Maxpoolingchannel(Fh))
ffinal=fm C fh
其中Fm为倒数第二层特征图,Fh为最后一层特征图,ffinal为最终得到的融合特征,fm表示中层特征,fh表示高层特征,Flatten为展平操作,即将二维数据矩阵中的每一个数据依次连接并组成一维数据;C为连接操作,即将两个一维数据首尾相连,拼接为一个一维数据;Maxpoolingchannel表示在通道方向进行最大池化,池化窗口大小为1×4,步长为4,即使用1×4的方框在一维数据上滑动,计算每次滑动时方框内数据的最大值并保留,方框每次滑动的距离为4个数据单位。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011642545.4A CN112699899A (zh) | 2020-12-31 | 2020-12-31 | 一种基于生成对抗网络的高光谱图像特征提取方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011642545.4A CN112699899A (zh) | 2020-12-31 | 2020-12-31 | 一种基于生成对抗网络的高光谱图像特征提取方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112699899A true CN112699899A (zh) | 2021-04-23 |
Family
ID=75514178
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011642545.4A Pending CN112699899A (zh) | 2020-12-31 | 2020-12-31 | 一种基于生成对抗网络的高光谱图像特征提取方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112699899A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113378680A (zh) * | 2021-06-01 | 2021-09-10 | 厦门大学 | 一种拉曼光谱数据的智能建库方法 |
CN113435243A (zh) * | 2021-05-14 | 2021-09-24 | 西安电子科技大学 | 一种高光谱真实下采样模糊核估计方法 |
CN113469084A (zh) * | 2021-07-07 | 2021-10-01 | 西安电子科技大学 | 基于对比生成对抗网络的高光谱图像分类方法 |
CN113705358A (zh) * | 2021-08-02 | 2021-11-26 | 山西警察学院 | 一种基于特征映射的多角度侧脸正面化方法 |
CN114492526A (zh) * | 2022-01-25 | 2022-05-13 | 太原科技大学 | 一种面向多星光谱自动识别的SPEC-Net网络架构及识别方法 |
CN114858782A (zh) * | 2022-07-05 | 2022-08-05 | 中国民航大学 | 基于拉曼高光谱对抗判别模型的奶粉掺杂非定向检测方法 |
CN116527206A (zh) * | 2023-07-03 | 2023-08-01 | 南京华飞数据技术有限公司 | 改进knn方法的数字信号处理方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107679465A (zh) * | 2017-09-20 | 2018-02-09 | 上海交通大学 | 一种基于生成网络的行人重识别数据生成和扩充方法 |
CN108460391A (zh) * | 2018-03-09 | 2018-08-28 | 西安电子科技大学 | 基于生成对抗网络的高光谱图像无监督特征提取方法 |
CN109948693A (zh) * | 2019-03-18 | 2019-06-28 | 西安电子科技大学 | 基于超像素样本扩充和生成对抗网络高光谱图像分类方法 |
-
2020
- 2020-12-31 CN CN202011642545.4A patent/CN112699899A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107679465A (zh) * | 2017-09-20 | 2018-02-09 | 上海交通大学 | 一种基于生成网络的行人重识别数据生成和扩充方法 |
CN108460391A (zh) * | 2018-03-09 | 2018-08-28 | 西安电子科技大学 | 基于生成对抗网络的高光谱图像无监督特征提取方法 |
CN109948693A (zh) * | 2019-03-18 | 2019-06-28 | 西安电子科技大学 | 基于超像素样本扩充和生成对抗网络高光谱图像分类方法 |
Non-Patent Citations (1)
Title |
---|
毛贻顺: "基于深度学习的高光谱图像无监督空谱联合特征提取", 《中国优秀硕士学位论文全文数据库 信息科技辑》, no. 3, 15 March 2020 (2020-03-15), pages 39 - 44 * |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113435243A (zh) * | 2021-05-14 | 2021-09-24 | 西安电子科技大学 | 一种高光谱真实下采样模糊核估计方法 |
CN113378680A (zh) * | 2021-06-01 | 2021-09-10 | 厦门大学 | 一种拉曼光谱数据的智能建库方法 |
CN113378680B (zh) * | 2021-06-01 | 2022-06-28 | 厦门大学 | 一种拉曼光谱数据的智能建库方法 |
CN113469084A (zh) * | 2021-07-07 | 2021-10-01 | 西安电子科技大学 | 基于对比生成对抗网络的高光谱图像分类方法 |
CN113469084B (zh) * | 2021-07-07 | 2023-06-30 | 西安电子科技大学 | 基于对比生成对抗网络的高光谱图像分类方法 |
CN113705358A (zh) * | 2021-08-02 | 2021-11-26 | 山西警察学院 | 一种基于特征映射的多角度侧脸正面化方法 |
CN113705358B (zh) * | 2021-08-02 | 2023-07-18 | 山西警察学院 | 一种基于特征映射的多角度侧脸正面化方法 |
CN114492526A (zh) * | 2022-01-25 | 2022-05-13 | 太原科技大学 | 一种面向多星光谱自动识别的SPEC-Net网络架构及识别方法 |
CN114858782A (zh) * | 2022-07-05 | 2022-08-05 | 中国民航大学 | 基于拉曼高光谱对抗判别模型的奶粉掺杂非定向检测方法 |
CN116527206A (zh) * | 2023-07-03 | 2023-08-01 | 南京华飞数据技术有限公司 | 改进knn方法的数字信号处理方法 |
CN116527206B (zh) * | 2023-07-03 | 2023-09-01 | 南京华飞数据技术有限公司 | 改进knn方法的数字信号处理方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112699899A (zh) | 一种基于生成对抗网络的高光谱图像特征提取方法 | |
AU2020104006A4 (en) | Radar target recognition method based on feature pyramid lightweight convolutional neural network | |
CN112287978B (zh) | 一种基于自注意力上下文网络的高光谱遥感图像分类方法 | |
CN107316013B (zh) | 基于nsct变换和dcnn的高光谱图像分类方法 | |
Ding et al. | Semi-supervised locality preserving dense graph neural network with ARMA filters and context-aware learning for hyperspectral image classification | |
CN110210313B (zh) | 基于多尺度pca-3d-cnn空谱联合的高光谱遥感影像分类方法 | |
CN110728192B (zh) | 一种基于新型特征金字塔深度网络的高分遥感图像分类方法 | |
CN109086773B (zh) | 基于全卷积神经网络的断层面识别方法 | |
CN105975931B (zh) | 一种基于多尺度池化的卷积神经网络人脸识别方法 | |
CN109711426B (zh) | 一种基于gan和迁移学习的病理图片分类装置及方法 | |
CN108009559B (zh) | 一种基于空谱联合信息的高光谱数据分类方法 | |
CN107239759B (zh) | 一种基于深度特征的高空间分辨率遥感图像迁移学习方法 | |
CN105138973A (zh) | 人脸认证的方法和装置 | |
CN112395442B (zh) | 移动互联网上的低俗图片自动识别与内容过滤方法 | |
CN111626267B (zh) | 一种利用空洞卷积的高光谱遥感图像分类方法 | |
CN111476247B (zh) | 利用了1xK或Kx1卷积运算的CNN方法及装置 | |
CN113240683A (zh) | 基于注意力机制的轻量化语义分割模型构建方法 | |
CN114155443A (zh) | 一种基于多感受野图注意力网络的高光谱图像分类方法 | |
CN115049054B (zh) | 基于特征图响应的通道自适应分段动态网络剪枝方法 | |
CN116843975A (zh) | 结合空间金字塔注意力机制的高光谱图像分类方法 | |
CN116524253A (zh) | 一种基于轻量级Transformer的甲状腺癌病理图像分类方法 | |
CN115512226A (zh) | 融入注意力机制多尺度CNN的LiDAR点云滤波方法 | |
CN116563683A (zh) | 一种基于卷积神经网络和多层感知机的遥感影像场景分类方法 | |
CN117671666A (zh) | 一种基于自适应图卷积神经网络的目标识别方法 | |
Zhu et al. | Computer image analysis for various shading factors segmentation in forest canopy using convolutional neural networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |