CN114065831A - 基于多尺度随机深度残差网络的高光谱图像分类方法 - Google Patents

基于多尺度随机深度残差网络的高光谱图像分类方法 Download PDF

Info

Publication number
CN114065831A
CN114065831A CN202110992748.4A CN202110992748A CN114065831A CN 114065831 A CN114065831 A CN 114065831A CN 202110992748 A CN202110992748 A CN 202110992748A CN 114065831 A CN114065831 A CN 114065831A
Authority
CN
China
Prior art keywords
spectral
size
scale
residual block
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110992748.4A
Other languages
English (en)
Inventor
同磊
许德梅
高正
段娟
肖创柏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Technology
Original Assignee
Beijing University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Technology filed Critical Beijing University of Technology
Priority to CN202110992748.4A priority Critical patent/CN114065831A/zh
Publication of CN114065831A publication Critical patent/CN114065831A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Abstract

本发明公开了基于多尺度随机深度残差网络的高光谱图像分类方法,输入使用3个不同尺寸的卷积核,目的在于通过这种方式提取不同不同尺度特征。通过不同尺寸卷积核将不同尺度特征信息分里,就可以将相关性较强的特征聚集,从而达到加速网络收敛的目的。感受野的大小对于模型的性能有重要的影响。过小的感受野会只能观察到局部的特征,但过大的感受野则会导致模型获取到冗余信息,使用多个不同大小卷积核提取多尺度特征,然后将其进行融合的模型架构是一种合适的选择。本发明所提出的方法能够实现高光谱图像的有效分类且相较于同等深度的网络,本发明不但提高了训练效率而且保证了较高的分类准确率。

Description

基于多尺度随机深度残差网络的高光谱图像分类方法
技术领域
本发明属于图像处理技术领域,具体涉及一种多尺度随机深度残差网络(Multi-scale SDRN),结合了光谱和空谱信息的高光谱图像分类方法。
背景技术
高光谱图像的研究方向主要有降维、目标检测、变化检测、分类以及解混。作为高光谱图像处理技术的一个重要分支,高光谱图像分类逐渐成为高光谱遥感领域的热门研究问题。高光谱图像分类是根据不同类别地物的光谱信息以及空间信息对图像中的每一个像素点进行类别标记,然后将得到的类别与真实的地物类别进行对应,从而计算分类性能指标,实现地物目标的分类。高光谱分类技术是监测地物各项信息变化的重要方法,例如土地资源调查、生态环境监测、林业资源监测、病虫灾害监测与火灾等灾害监测、植被生物量估算等,包括与日常生活休憩相关的天气预报、空气质监、电子地图等都可以通过高光谱图像分类识别后获得的信息进行系统的监测或管理。遥感影像最原始的分类方法是人工目视解释法,通俗的讲,就是依靠工作者自身的地学知识和判断经验进行分类。那么最终分类结果不可避免的会受到工作人员经验和知识的影响,容易出错。且人工方法效率低,需要耗费大量人力、物力。随着成像设备的不断改进更新,图像质量也在不断提高,图像可提取的地物细节信息也日益丰富。人工方法已经无法满足快速发展的遥感数据处理需求。随着计算机技术的高速发展,对于高光谱图像的分类有了更好的方法。主流的分类方法一般可分为传统机器学习方法和深度学习方法。传统机器学习方法提取的特征不能很好地代表原始数据,大部分方法仅利用高光谱图像中的光谱特征,提取的特征不够全面。空间特征在高光谱图像分类中也发挥着重要的作用。虽然有一些基于空间谱特征组合的分类方法取得了显著的效果,但都需要人工设计分类特征来提高分类精度,这都需要大量的时间来反复验证。深度学习起源于人工神经网络,旨在通过模拟人脑分析处理问题的方式解决问题。深度学习网络模型由于其深层的网络,对于特征的提取能力更强。但是深层网络也存在着一系列问题,例如随着网络层数的增加会出现梯度消失等问题,网络也会出现退化的现象。
综上所述,研究更为简单、高效的高光谱图像分类方法,可以为大规模、成批量的高光谱遥感系统的应用做好技术储备和铺垫,具有一定的理论研究意义和实际应用价值。因此,如何从这些冗杂的数据信息中得到反映物质本质的特征,使之更适合于分类器的处理是至关重要的。所以,针对高光谱图像提出具有更好效果的分类方法仍是一个急需解决的问题。深度学习方法良好的提取特征能力往往意味着神经网络深具有数十或者更多的层。这些深层次的网络会带来一系列的问题,例如梯度消失、过拟合等,训练时间也会非常慢。为了解决这些问题,提出了基于多尺度随机深度残差网络的高光谱图像分类方法,进一步提高了分类准确率。
发明内容
受到Inception-ResNet模型的启发,本发明对于残差块加入了多尺度卷积核提取特征,并通过1×1卷积进行通道匹配,从而降低参数量。为了解决网络过深导致训练时间过长的问题,本发明采用了随机深度的训练策略。
输入使用3个不同尺寸的卷积核,目的在于通过这种方式提取不同不同尺度特征。更丰富的特征有利于提高分类的准确率。这种方式还有利于提高网络收敛的速度。因为传统的序贯网络模型对于输入只采用一种尺寸卷积核进行提取特征,所以在该固定尺寸范围的输出特征是均匀分布的。但是如果采用不同尺寸卷积核提取特征就可以使特征以相关性为标准进行聚集,得到多个较为密集的特征集。这样可以减少相关性较弱的非关键特征。所以,多尺度的设计可以有效去除特征的冗余信息从而加速网络的收敛。1949年赫布曾提出Hebbin理论,该理论认为两个神经元或者神经元系统,如果总是同时兴奋,就会形成一种‘组合’,其中一个神经元的兴奋会促进另一个的兴奋”。所以通过不同尺寸卷积核将不同尺度特征信息分里,就可以将相关性较强的特征聚集,从而达到加速网络收敛的目的。
1×1卷积的使用从直观上来说就是降维,因为特征图少了,参数自然减少了。卷积是在通道维度上进行的,这样的操作可以压缩特征图,二次提取特征,好处在于提高了特征图的特征表达效果。降维不仅实现了通道匹配。而且在保持特征图不变的情况下极大增加了网络的非线性。而非线性允许网络可以学习更复杂的特征,间接加深了整个网络。1×1卷积也是在进行通道间信息交互,在相同感受野的情况下提升了特征的丰富度,提高了模型的泛化能力。
为了达到上述目的,本发明实现步骤如下:
步骤一、首先对数据进行预处理。将所有可用的带标签的数据分成三个部分。取数据集的10%作为训练集,10%作为验证集,80%作为测试集。将输入图像的每一个像素块作为样本。假设数据的波段数为d,则设定一个大小为7×7×d的高光谱图像光谱样本窗口,以每一个像素点为中心进行滑动取样,超出边界的则采取补零策略后取样。对取得的样本进行翻转,增加高斯噪声操作,实现对数据的扩容,以减少过拟合。
步骤二、模型构建。模型主要由两部分组成,光谱特征提取与空间信息特征提取。
步骤三、模型训练。
步骤四、高光谱图像分类。将数据输入网络,进行类别的预测,得到分类的高光谱图像。
步骤五、输出分类图像
本发明与现有的技术相比具有以下优点:
本发明通过多尺度残差块充分提取并利用了高光谱图像的空谱特征和光谱特征,提高了分类精度。
附图说明
图1是本发明的流程示意图
图2是本发明的数据增强模型
图3是本发明的整体框架
图4是多尺度光谱残差块示意图
图5是空间特征学习模块第一层
图6是多尺度空间残差块示意图
图7是本发明的总体模型结构(以美国Salinas山谷高光谱图像数据集为例)
图8是本发明用到的美国Salinas山谷高光谱图像
图9是本发明用到的意大利的帕维亚城Pavia University高光谱图像
图10(a)是SVM-RBF分类方法对美国Salinas山谷高光谱图像分类的结果图
图10(b)是3D-CNN分类方法对美国Salinas山谷高光谱图像分类的结果图
图10(c)是M3D-DCNN分类方法对美国Salinas山谷高光谱图像分类的结果图
图10(d)是本发明对美国Salinas山谷高光谱图像分类的结果图
图11(a)是SVM-RBF分类方法对意大利的帕维亚城Pavia University高光谱图像分类的结果图
图11(b)是3D-CNN分类方法对意大利的帕维亚城Pavia University高光谱图像分类的结果图
图11(c)是M3D-DCNN分类方法对意大利的帕维亚城Pavia University高光谱图像分类的结果图
图11(d)是本发明对意大利的帕维亚城Pavia University高光谱图像分类的结果图
具体实施方式
下面结合附图对本发明做进一步的描述。
参照图1,本发明的实现步骤如下:
步骤一,数据预处理
(1)输入高光谱图像
输入原高光谱图像,将图像的每一个像素块作为样本,并建立样本集。
(2)获取样本集
假设高光谱图像的通道数为d,则设定一个7×7×d的窗口,以每一个像素点为中心抓取样本集中的样本,对于边界采取补零策略。
(3)数据处理
将所有可用的样本分成三个部分,每个类别各取10%,10%,80%分别作为训练集,验证集,测试集。假设一个HIS数据集X包含N个可分类的地物像素,X={x1,x2,...,xN}∈R1X1Xb,Y={y1,y2,...,yN}∈R1X1Xl为对应的独热编码标签,其中b和l分别为该数据集的可用光谱波段数和土地类别数。以HIS数据集X中像素为中心的立方体形成了一组新的数据集Z={z1,z2,...zN}∈RhXhXb。为了充分利用HSI数据集中的光谱和空谱特征,将大小为h×h×b的立方体作为网络的输入。x1,x2,...,xN表示N个可分类的地物像素,y1,y2,...,yN表示与x1,x2,...,xN相对应的独热编码标签,z1,z2,...zN则表示N个分别以x1,x2,...,xN像素点为中心所构造的样本。
(4)数据增强
参附图2,对训练样本进行数据增强操作,包括翻转,添加高斯噪声等操作。使训练样本更具随机性,增强模型的泛化能力和鲁棒性。
步骤二,构建分类网络的模型
残差块由函数Fspe组成,Fspe由三维卷积层,批归一化层和一个ReLU激活层组成。维持该函数不变的情况下,在一个残差块中使用不同尺寸的卷积核进行特征提取。多尺度光谱残差块的结构如附图4所示,在训练阶段的前向传播规则如公式(1)所示,其中
Figure BDA0003232970700000041
表示第l个多尺度光谱残差块的输出,id表示恒等变换,C1表示卷积核为1×1×1的卷积。
Figure BDA0003232970700000042
表示该函数中的卷积核大小为ei,ei=((1×1×3),(1×1×5),(1×1×7),i∈[1,3]}。
Figure BDA0003232970700000043
那么为了减少参数量,同时确保在丢弃所有残差块的情况下,至少进行一次空间特征提取,原第一个空间残差块不再设计为残差块的形式。其结构如附图5所示,在训练阶段的前向传播规则如公式(2)所示,其中
Figure BDA0003232970700000044
表示空间特征学习模块第一层的输出,
Figure BDA0003232970700000045
表示光谱特征学习模块的输出。
Figure BDA0003232970700000046
表示该函数中的卷积核大小为
Figure BDA0003232970700000047
Figure BDA0003232970700000048
Figure BDA0003232970700000049
其中num为
Figure BDA00032329707000000410
的通道数。
Figure BDA00032329707000000411
其他多尺度空间残差块结构如附图6所示,前向传播公式如公式(3)所示,其中
Figure BDA00032329707000000412
表示第l个多尺度空间残差块的输出。
Figure BDA00032329707000000413
表示该函数中的卷积核大小为ai,ai={(1×1×1),(3×3×1),(5×5×1),i∈[1,3]}
Figure BDA00032329707000000414
(1)多尺度SDRN结构
下面介绍一下所提出的多尺度随机深度残差网络模型的一些细节。如附图7所示,该网络由四个模块组成:数据预处理模块、光谱特征学习模块、空间特征学习模块和分类模块。
多尺度SDRN的光谱特征学习模块由k1个光谱残差块组成、空间特征学习模块由如附图5所示的空间特征学习模块第一层和k2个空间残差块组成。k1与k2的值由实验得到,当k1=3,k2=3时效果最好。模型中的卷积均为三维卷积,输入到网络中的数据块大小为7×7×d,d表示高光谱图像的波段数。以Salinas数据集为例,则输入到网络中的数据块大小为7×7×204。因为原始的输入数据包含冗余的光谱信息,所以首先对原始数据进行3D卷积,采用24个1×1×7大小的卷积核,步长为(1,1,2),生成24个尺寸为7×7×99的特征块。通过这个操作降低了输入数据的高维性,提取了低光谱特征。然后进行批标准化以及ReLU激活,加快收敛速度。
接下来的网络主要由光谱特征学习部分与空间特征学习部分组成。光谱特征学习部分由3个多尺度光谱残差块组成。上一层的输出作为光谱特征学习部分第一个残差块的输入,首先第一个多尺度光谱残差块,分别使用24个1×1×3、1×1×5、1×1×7大小的卷积核,补零以保持特征块的大小不变,并在通道维度相加。生成的72个尺寸为7×7×99的特征块再用24个大小为1×1×1的卷积核进行卷积,批标准化以及ReLU激活。生成的24个尺寸为7×7×99的特征块和输入相加,根据光谱特征学习部分第一个残差块的生存概率决定保留前者或者后者作为光谱特征学习部分第一个残差块的输出。随后的2个多尺度光谱残差块的运算同上。在空间特征提取部分与光谱特征提取部分之间添加了一层卷积用于调整特征块维度。
空间特征学习部分依旧由3个多尺度空间残差块组成,首先第一个多尺度空间残差块,分别使用24个1×1×1、3×3×1、5×5×1大小的卷积核,补零以保持特征块的大小不变,并在通道维度相加。生成的72个尺寸为7×7×1的特征块再用24个大小为1×1×1的卷积核进行卷积,批标准化以及ReLU激活。生成的24个尺寸为7×7×1的特征块和输入相加,根据空间特征学习部分第一个残差块的生存概率决定保留前者或者后者作为空间特征学习部分第一个残差块的输出。随后的2个多尺度空间残差块的运算同上。
经过光谱和空间光谱特征学习模块后,得到24个大小为7×7×1的特征立方体。送入池化层后得到24个大小为1×1×1的特征立方体。对特征立方体进行扁平化操作(Flatten Operation),并将其转化为特征向量。最后经过完全连接层,根据类别的数量,产生一个输出向量
Figure BDA0003232970700000051
在训练阶段为了减少神经网络的长度,在每个批次部随机地完全跳过一些残差块。即对于每一个残差块,随机地选择是否删除该残差块的转换函数F,仅保留跳跃连接。但在测试阶段保持网络的深度不变。对于第l个残差块设置一个bl∈{0,1}表示一个伯努利随机变量,当bl=1时表示该残差块是活动的,当bl=0是表示该残差块是非活动的,即该残差块删除转换函数F,仅保留跳跃连接。第l个残差块的生存概就可以表示为Pl=P(bl=1)。训练阶段传播规则为下面的公式(4):
Hl=ReLU(blFl(Hl-1)+id(Hl-1)) (4)
若bl等于0,则简化成下面的公式(5)。对于非负输入,则使用激活函数ReLU代替恒等变换id。
Hl=id(Hl-1) (5)
Pl是训练过程中的一个超参数,表示第1个残差块的生存概率,即根据Pl的大小。PL表示最后一个残差块的生存概率,恒定为0.5。Pl的设置有两种方式。一是令所有的Pl均等于PL,二是将Pl设置为关于1的衰减函数,公式如下所示:
Figure BDA0003232970700000061
步骤三,训练网络
训练集和验证集进行训练。Batchsize为16,Epoch为200。采用交叉熵损失函数,优化器采用学习率初值为0.0003的随机梯度下降算法。卷积核均使用He正态分布初始化方法初始化。
步骤四,高光谱图像分类
将测试数据输入网络得到预测值,使用预测值与真实值进行对比,得到准确率。
步骤五,输出分类图像
实验以及分析
1.实验条件
本发明的硬件测试平台是:处理器Intel(R)Core(TM)i7-8750H CPU,主频为2.20Hz,内存为16GB,显卡为Nvidia GeForce GTX 1060;软件平台为Windows10操作系统,开发环境为PyCharm 2019。编程语言是python,使用Pytorch搭建网络结构。
2.实验数据
本发明的性能评价主要用到两个数据集:美国Salinas山谷数据集和意大利的帕维亚城Pavia University数据集。
美国Salinas山谷数据集大小为512×217,204个可用波段,共包含111104个像素点,其中有56975个像素点是背景像素,可应用于分类的像素点有54129个,这些像素点总共分为16类。取5418个像素点作为训练集,5418个像素点作为验证集,43293个像素点作为测试集。附图7即美国Salinas山谷高光谱图像。表1是本发明对美国Salinas山谷数据集的训练与测试样本的选取。注:下表所列测试数据包括验证集与测试集。
表1
Figure BDA0003232970700000071
意大利的帕维亚城Pavia University数据集图像大小为610×340,103个可用波段,共有207400个像素,但是其中只有42776个像素是地物像素,其余164624个像素均为背景像素,这些像素点总共分为9类。取4281个像素点作为训练集,4281个像素点作为验证集,34214个像素点作为测试集。附图8即意大利的帕维亚城Pavia University高光谱图像。表2是本发明对意大利的帕维亚城Pavia University数据集的训练与测试样本的选取。注:下表所列测试数据包括验证集与测试集。
表2
Figure BDA0003232970700000072
Figure BDA0003232970700000081
3.性能比较
本发明用到的三个现有技术对比分类的方法如下:
(1)Bor-Chen kuo等人在“A Kernel-Based Feature Selection Method for SVMWith RBF Kernel for Hyperspectral Image Classification”中提出的高光谱图像分类方法。简称SVM-RBF分类方法。基于RBF核的SVM高光谱图像分类算法。
(2)Chen Y等人在“Deep Feature Extraction and Classification ofHyperspectral Images Based on Convolutional Neural Networks”提出的高光谱分类方法,简称3D-CNN分类方法。
(3)He M等人在“Multi-scale 3D deep convolutional neural network forhyperspectral image classification”中提出的高光谱图像分类方法,简称M3D-DCNN。
在实验中,采用以下三个指标来评价本发明的性能:
第一个评价指标是总体精度(OA),表示正确分类的样本占所有样本的比例,值越大,说明分类效果越好。
第二个评价指标是平均精度(AA),表示每一类分类精度的平均值,值越大,说明分类效果越好。
第三个评价指标是卡方系数(Kappa),表示混淆矩阵中不同的权值,值越大,说明分类效果越好。
表3是本发明对美国Salinas山谷高光谱图像分类的准确率以及对比。
表4是本发明对意大利的帕维亚城Pavia University高光谱图像分类的准确率以及对比。
表3
Figure BDA0003232970700000082
Figure BDA0003232970700000091
表4
Figure BDA0003232970700000092
从表3和表4可以看出,对于相同的高光谱图像数据集,本发明提出的分类方法,其分类精度要优于其他分类方法。另外图10和图11展示了各个分类方法的分类图,其可视化的分类效果图与表3和表4所列出的结果相同。从图像可以看出,与SVM-RBF、3D-CNN、和M3D-DCNN分类方法相比,本发明实现的分类图误差较小。
综上所述,本发明针对分类精度不高以及网络过深导致训练时间过长的问题,提出一种基于多尺度残差网络的高光谱图像分类方法。感受野的大小对于模型的性能有重要的影响。过小的感受野会只能观察到局部的特征,但过大的感受野则会导致模型获取到冗余信息,因此使用多个不同大小卷积核提取多尺度特征,然后将其进行融合的模型架构是一种合适的选择。从上面的实验结果来看,这种方式显著提高了模型的分类精度及鲁棒性。通过真实实验数据分析,表明本发明所提出的方法能够实现高光谱图像的有效分类且相较于同等深度的网络,本发明不但提高了训练效率而且保证了较高的分类准确率。

Claims (7)

1.基于多尺度随机深度残差网络的高光谱图像分类方法,其特征在于:该方法包括如下步骤:
步骤一、首先对数据进行预处理;将所有可用的带标签的数据分成三个部分;取数据集的10%作为训练集,10%作为验证集,80%作为测试集;将输入图像的每一个像素块作为样本;假设数据的波段数为d,则设定一个大小为7×7×d的高光谱图像光谱样本窗口,以每一个像素点为中心进行滑动取样,超出边界的则采取补零策略后取样;对取得的样本进行翻转,增加高斯噪声操作,实现对数据的扩容,以减少过拟合;
步骤二、模型构建;模型主要由两部分组成,光谱特征提取与空间信息特征提取;
步骤三、模型训练;
步骤四、高光谱图像分类;将数据输入网络,进行类别的预测,得到分类的高光谱图像;
步骤五、输出分类图像。
2.根据权利要求1所述的基于多尺度随机深度残差网络的高光谱图像分类方法,其特征在于:步骤一中,
(1)输入高光谱图像
输入原高光谱图像,将图像的每一个像素块作为样本,并建立样本集;
(2)获取样本集
假设高光谱图像的通道数为d,则设定一个7×7×d的窗口,以每一个像素点为中心抓取样本集中的样本,对于边界采取补零策略;
(3)数据处理
将所有可用的样本分成三个部分,每个类别各取10%,10%,80%分别作为训练集,验证集,测试集;假设一个HIS数据集X包含N个可分类的地物像素,X={x1,x2,...,xN}∈R1X1Xb,Y={y1,y2,...,yN}∈R1X1Xl为对应的独热编码标签,其中b和l分别为该数据集的可用光谱波段数和土地类别数;以HIS数据集X中像素为中心的立方体形成了一组新的数据集Z={z1,z2,...zN}∈RhXhXb;为了充分利用HSI数据集中的光谱和空谱特征,将大小为h×h×b的立方体作为网络的输入;x1,x2,...,xN表示N个可分类的地物像素,y1,y2,...,yN表示与x1,x2,...,xN相对应的独热编码标签,z1,z2,...zN则表示N个分别以x1,x2,...,xN像素点为中心所构造的样本;
(4)数据增强
对训练样本进行数据增强操作,包括翻转,添加高斯噪声操作;使训练样本更具随机性,增强模型的泛化能力和鲁棒性。
3.根据权利要求1所述的基于多尺度随机深度残差网络的高光谱图像分类方法,其特征在于:步骤二中,残差块由函数Fspe组成,Fspe由三维卷积层,批归一化层和一个ReLU激活层组成;维持该函数不变的情况下,在一个残差块中使用不同尺寸的卷积核进行特征提取;在训练阶段的前向传播规则如公式(1)所示,其中
Figure FDA0003232970690000021
表示第l个多尺度光谱残差块的输出,id表示恒等变换,C1表示卷积核为1×1×1的卷积;
Figure FDA0003232970690000022
定示该函数中的卷积核大小为ei,ei={(1×1×3),(1×1×5),(1×1×7),i∈[1,3]};
Figure FDA0003232970690000023
在训练阶段的前向传播规则如公式(2)所示,其中
Figure FDA0003232970690000024
表示空间特征学习模块第一层的输出,
Figure FDA0003232970690000025
表示光谱特征学习模块的输出;
Figure FDA0003232970690000026
表示该函数中的卷积核大小为
Figure FDA0003232970690000027
Figure FDA0003232970690000028
Figure FDA0003232970690000029
其中num为
Figure FDA00032329706900000210
的通道数;
Figure FDA00032329706900000211
前向传播公式如公式(3)所示,其中
Figure FDA00032329706900000212
表示第l个多尺度空间残差块的输出;
Figure FDA00032329706900000213
良示该函数中的卷积核大小为ai,ai={(1×1×1),(3×3×1),(5×5×1),i∈[1,3]}
Figure FDA00032329706900000214
4.根据权利要求1所述的基于多尺度随机深度残差网络的高光谱图像分类方法,其特征在于:多尺度随机深度残差网络模型由四个模块组成:数据预处理模块、光谱特征学习模块、空间特征学习模块和分类模块;
多尺度SDRN的光谱特征学习模块由k1个光谱残差块组成、空间特征学习模块由空间特征学习模块第一层和k2个空间残差块组成;k1与k2的值由实验得到,当k1=3,k2=3时效果最好;模型中的卷积均为三维卷积,输入到网络中的数据块大小为7×7×d,d表示高光谱图像的波段数;以Salinas数据集为例,则输入到网络中的数据块大小为7×7×204;因为原始的输入数据包含冗余的光谱信息,首先对原始数据进行3D卷积,采用24个1×1×7大小的卷积核,步长为(1,1,2),生成24个尺寸为7×7×99的特征块;通过这个操作降低了输入数据的高维性,提取了低光谱特征;然后进行批标准化以及ReLU激活,加快收敛速度。
5.根据权利要求1所述的基于多尺度随机深度残差网络的高光谱图像分类方法,其特征在于:网络由光谱特征学习部分与空间特征学习部分组成;光谱特征学习部分由3个多尺度光谱残差块组成;上一层的输出作为光谱特征学习部分第一个残差块的输入,首先第一个多尺度光谱残差块,分别使用24个1×1×3、1×1×5、1×1×7大小的卷积核,补零以保持特征块的大小不变,并在通道维度相加;生成的72个尺寸为7×7×99的特征块再用24个大小为1×1×1的卷积核进行卷积,批标准化以及ReLU激活;生成的24个尺寸为7×7×99的特征块和输入相加,根据光谱特征学习部分第一个残差块的生存概率决定保留前者或者后者作为光谱特征学习部分第一个残差块的输出;随后的2个多尺度光谱残差块的运算同上;在空间特征提取部分与光谱特征提取部分之间添加了一层卷积用于调整特征块维度;
空间特征学习部分依旧由3个多尺度空间残差块组成,首先第一个多尺度空间残差块,分别使用24个1×1×1、3×3×1、5×5×1大小的卷积核,补零以保持特征块的大小不变,并在通道维度相加;生成的72个尺寸为7×7×1的特征块再用24个大小为1×1×1的卷积核进行卷积,批标准化以及ReLU激活;生成的24个尺寸为7×7×1的特征块和输入相加,根据空间特征学习部分第一个残差块的生存概率决定保留前者或者后者作为空间特征学习部分第一个残差块的输出;随后的2个多尺度空间残差块的运算同上;
经过光谱和空间光谱特征学习模块后,得到24个大小为7×7×1的特征立方体;送入池化层后得到24个大小为1×1×1的特征立方体;对特征立方体进行扁平化操作,并将其转化为特征向量;最后经过完全连接层,根据类别的数量,产生一个输出向量
Figure FDA0003232970690000031
6.根据权利要求1所述的基于多尺度随机深度残差网络的高光谱图像分类方法,其特征在于:在训练阶段为了减少神经网络的长度,在每个批次都随机地完全跳过一些残差块;即对于每一个残差块,随机地选择是否删除该残差块的转换函数F,仅保留跳跃连接;但在测试阶段保持网络的深度不变;对于第l个残差块设置一个bl∈{0,1}表示一个伯努利随机变量,当bl=1时表示该残差块是活动的,当bl=0是表示该残差块是非活动的,即该残差块删除转换函数F,仅保留跳跃连接;第l个残差块的生存概就可以表示为Pl=P(bl=1);训练阶段传播规则为下面的公式(4):
Hl=ReLU(blFl(Hl-1)+id(Hl-1)) (4)
若bl等于0,则简化成下面的公式(5);对于非负输入,则使用激活函数ReLU代替恒等变换id;
Hl=id(Hl-1) (5)
Pl是训练过程中的一个超参数,表示第l个残差块的生存概率,即根据Pl的大小;PL表示最后一个残差块的生存概率,恒定为0.5;Pl的设置有两种方式;一是令所有的Pl均等于PL,二是将Pl设置为关于1的衰减函数,公式如下所示:
Figure FDA0003232970690000032
7.根据权利要求1所述的基于多尺度随机深度残差网络的高光谱图像分类方法,其特征在于:步骤三中,训练集和验证集进行训练;Batchsize为16,Epoch为200;采用交叉熵损失函数,优化器采用学习率初值为0.0003的随机梯度下降算法;卷积核均使用He正态分布初始化方法初始化。
CN202110992748.4A 2021-08-27 2021-08-27 基于多尺度随机深度残差网络的高光谱图像分类方法 Pending CN114065831A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110992748.4A CN114065831A (zh) 2021-08-27 2021-08-27 基于多尺度随机深度残差网络的高光谱图像分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110992748.4A CN114065831A (zh) 2021-08-27 2021-08-27 基于多尺度随机深度残差网络的高光谱图像分类方法

Publications (1)

Publication Number Publication Date
CN114065831A true CN114065831A (zh) 2022-02-18

Family

ID=80233565

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110992748.4A Pending CN114065831A (zh) 2021-08-27 2021-08-27 基于多尺度随机深度残差网络的高光谱图像分类方法

Country Status (1)

Country Link
CN (1) CN114065831A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114511791A (zh) * 2022-04-20 2022-05-17 成都锦城学院 一种基于改进深度残差网络的区域水资源分类评价方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114511791A (zh) * 2022-04-20 2022-05-17 成都锦城学院 一种基于改进深度残差网络的区域水资源分类评价方法

Similar Documents

Publication Publication Date Title
CN110728224B (zh) 一种基于注意力机制深度Contourlet网络的遥感图像分类方法
Zhang et al. Hyperspectral classification based on lightweight 3-D-CNN with transfer learning
CN111353463B (zh) 基于随机深度残差网络的高光谱图像分类方法
Liu et al. Application of deep convolutional neural networks for detecting extreme weather in climate datasets
Luus et al. Multiview deep learning for land-use classification
CN105138993A (zh) 建立人脸识别模型的方法及装置
CN111696101A (zh) 一种基于SE-Inception的轻量级茄科病害识别方法
CN112529146B (zh) 神经网络模型训练的方法和装置
CN106529563B (zh) 基于双图稀疏非负矩阵分解的高光谱波段选择方法
CN114821164A (zh) 基于孪生网络的高光谱图像分类方法
Yadav et al. AFD-Net: Apple Foliar Disease multi classification using deep learning on plant pathology dataset
CN113344045B (zh) 一种结合hog特征提高sar船只分类精度的方法
CN111524140B (zh) 基于cnn和随机森林法的医学图像语义分割方法
CN113705580A (zh) 基于深度迁移学习的高光谱图像分类方法
CN112733736A (zh) 基于增强过采样的类别不平衡高光谱图像分类方法
Xiao et al. Citrus greening disease recognition algorithm based on classification network using TRL-GAN
Liu et al. Image retrieval using CNN and low-level feature fusion for crime scene investigation image database
Ke et al. Mango varieties classification-based optimization with transfer learning and deep learning approaches
CN114065831A (zh) 基于多尺度随机深度残差网络的高光谱图像分类方法
Liu et al. DS-MENet for the classification of citrus disease
Tsai et al. Deep learning techniques for colorectal cancer tissue classification
CN117115675A (zh) 一种跨时相轻量化空谱特征融合高光谱变化检测方法、系统、设备及介质
CN116958709A (zh) 一种轻量级张量卷积长短时记忆网络的高光谱分类方法
CN116580279A (zh) 基于混合自注意力机制的番茄病害检测方法及系统
Feng et al. Study on the optimization of CNN based on image identification

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination