CN116883726A - 基于多分支与改进的Dense2Net的高光谱图像分类方法及系统 - Google Patents
基于多分支与改进的Dense2Net的高光谱图像分类方法及系统 Download PDFInfo
- Publication number
- CN116883726A CN116883726A CN202310749812.5A CN202310749812A CN116883726A CN 116883726 A CN116883726 A CN 116883726A CN 202310749812 A CN202310749812 A CN 202310749812A CN 116883726 A CN116883726 A CN 116883726A
- Authority
- CN
- China
- Prior art keywords
- space
- branch
- multiplied
- size
- dense2net
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 87
- 238000012549 training Methods 0.000 claims abstract description 57
- 238000012360 testing method Methods 0.000 claims abstract description 54
- 238000012795 verification Methods 0.000 claims abstract description 28
- 238000000605 extraction Methods 0.000 claims abstract description 19
- 238000012544 monitoring process Methods 0.000 claims abstract description 7
- 230000003595 spectral effect Effects 0.000 claims description 53
- 238000001228 spectrum Methods 0.000 claims description 44
- 238000010586 diagram Methods 0.000 claims description 22
- 230000008569 process Effects 0.000 claims description 20
- 230000006870 function Effects 0.000 claims description 18
- 230000004913 activation Effects 0.000 claims description 15
- 238000011176 pooling Methods 0.000 claims description 12
- 238000004364 calculation method Methods 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 8
- 230000007246 mechanism Effects 0.000 claims description 8
- 239000000203 mixture Substances 0.000 claims description 8
- 230000009467 reduction Effects 0.000 claims description 8
- 238000012545 processing Methods 0.000 claims description 7
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 claims description 6
- 239000011159 matrix material Substances 0.000 claims description 6
- 238000007670 refining Methods 0.000 claims description 6
- 230000004927 fusion Effects 0.000 claims description 5
- 238000012546 transfer Methods 0.000 claims description 4
- 238000010276 construction Methods 0.000 claims description 3
- 238000011156 evaluation Methods 0.000 claims description 3
- 238000012804 iterative process Methods 0.000 claims description 3
- 230000003121 nonmonotonic effect Effects 0.000 claims description 3
- 230000008901 benefit Effects 0.000 abstract description 15
- 238000005516 engineering process Methods 0.000 abstract description 5
- 238000013527 convolutional neural network Methods 0.000 description 19
- 238000013135 deep learning Methods 0.000 description 9
- 238000004422 calculation algorithm Methods 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000010200 validation analysis Methods 0.000 description 4
- 230000015556 catabolic process Effects 0.000 description 3
- 238000006731 degradation reaction Methods 0.000 description 3
- 238000002372 labelling Methods 0.000 description 3
- 230000008092 positive effect Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 241001466077 Salina Species 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000007637 random forest analysis Methods 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- ZZMVLMVFYMGSMY-UHFFFAOYSA-N 4-n-(4-methylpentan-2-yl)-1-n-phenylbenzene-1,4-diamine Chemical compound C1=CC(NC(C)CC(C)C)=CC=C1NC1=CC=CC=C1 ZZMVLMVFYMGSMY-UHFFFAOYSA-N 0.000 description 1
- 108010015780 Viral Core Proteins Proteins 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 238000013213 extrapolation Methods 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- WYZDCUGWXKHESN-UHFFFAOYSA-N n-benzyl-n-methyl-1-phenylmethanamine Chemical compound C=1C=CC=CC=1CN(C)CC1=CC=CC=C1 WYZDCUGWXKHESN-UHFFFAOYSA-N 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/09—Supervised learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A40/00—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
- Y02A40/10—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Image Analysis (AREA)
Abstract
本发明属于信息技术服务技术领域,公开了一种基于多分支与改进的Dense2Net的高光谱图像分类方法、系统及终端,包括数据集生成,获取高光谱图像数据集,将数据集随机划分为训练集、验证集和测试集;构建TBTA‑D2Net网络模型;利用训练集训练TBTA‑D2Net网络模型,更新多次迭代的参数;利用验证集监测模型的性能并选择出最优模型;利用最优模型对测试样本进行测试,实现对高光谱数据每个像素点的分类。本发明的Dense2Net bottleneck模块加强了DenseNet的特征传播和特征重用,并结合了Res2Net模块的多尺度特征提取优势。除此之外,本发明还采用了一种新的深度模型优化器Adan。Adan结合了自适应优化器,Nesterov冲量,以及解耦的权重衰减策略的优点,可以有效提升网络模型的训练速度。
Description
技术领域
本发明属于信息技术服务技术领域,尤其涉及一种基于多分支与改进的Dense2Net的小样本高光谱图像分类方法、系统及终端。
背景技术
高光谱图像(Hyperspectral Images,HSI)同时包含了丰富的空间信息和光谱信息,其中光谱信息的分辨率极高,一般可达到纳米级别,可以准确区分相似的土地覆盖类型。高光谱图像分类就是对图像中的每一个像素进行确定的类别标注。由于高光谱图像具有较高的光谱分辨率,形成的三维的高光谱图像数据块可以有效反映成像目标的信息。因此,高光谱图像分类已被广泛应用于医学影像分析、环境监测和精细农业等领域。
传统的基于机器学习的分类方法,如支持向量机SVM、随机森林RF、多项逻辑回归等,只能提取浅层的光谱特征或者空间特征,特征提取不完整,导致分类精度不高。深度学习具有强大的特征提取能力,可以有效提升分类精度。因此,各类基于深度学习的分类方法逐渐被应用到高光谱图像分类任务中,特别是卷积神经网络(Convolutional NeuralNetwork,CNN)。由于高光谱图像的高维特性容易引发休斯现象,且光谱波段的冗余信息较多,使高光谱图像分类成为一个极具挑战的任务。另外,基于深度学习的网络模型在进行分类任务时一般需要大量的已标记样本数据,如果训练样本过少会使网络模型发生过拟合。然而,高光谱数据获取困难,样本标记耗时耗力,训练样本匮乏。因此,解决小样本高光谱图像分类具有极大的实用价值。
通过上述分析,现有技术存在的问题及缺陷为:
(1)基于传统的机器学习方法由于只能提取浅层特征,特征提取不完整导致分类精度较低;另外,需要花费大量的人力和时间成本去手动设计分类特征。
(2)由于高光谱图像数据获取困难,而基于深度学习的网络模型一般需要大量的训练样本,样本不足会影响网络的分类性能。因此,如何改进网络结构提升小样本下的分类精度至关重要,具有极大的实用价值。
(3)基于光谱和空间特征的CNN具有更好的分类性能,这需要设计更复杂的网络结构,以便于有效提升分类精度。
发明内容
针对现有技术存在的问题,本发明提供了一种基于多分支与改进的Dense2Net的小样本高光谱图像分类方法、系统及终端。
本发明是这样实现的,一种基于多分支与改进的Dense2Net的小样本高光谱图像分类方法,包括:
步骤一,数据集生成,获取高光谱图像数据集,将数据集随机划分为训练集、验证集和测试集;
步骤二,构建TBTA-D2Net网络模型;
步骤三,利用训练集训练TBTA-D2Net网络模型,更新多次迭代的参数;利用验证集监测模型的性能并选择出最优模型;
步骤四,利用最优模型对测试样本进行测试,实现对高光谱数据每个像素点的分类。
进一步,所述步骤一中数据集的具体生成过程为:
步骤1.1:假设HSI数据集A由N个标记像素组成,其中p为光谱波段;对应的类别标签集为/>其中q为土地覆盖类别数;从原始数据中选取中心像素ai的b×b邻近像素,生成三维立方块的集合/>如果目标像素位于图像的边缘,则将缺失的相邻像素值设置为零;b的大小设置为9,b为光谱带的数量,然后,将三维立方块集K随机划分为训练集Xtrain、验证集Xval和测试集Xtest。相应的标签向量分为Ytrain、Yval和Ytest;
步骤1.2:将训练集Xtrain中每一个像素点ai,以及其周围9×9大小的邻域像素点,输入到步骤二中的TBTA-D2Net网络模型中。
进一步,所述步骤二为TBTA-D2Net网络模型的构建过程,具体步骤如下:
步骤2.1:首先经过一个1×1×7大小的3D-CNN对输入特征图进行降维处理,然后将降维后的特征图分别输入到光谱分支、空间X分支和空间Y分支,分别提取光谱特征、空间X特征和空间Y特征;
3D-CNN进行卷积操作的计算如下:
其中,表示第i层的第j个特征图在(x,y,z)位置上的输出;Si是卷积核的宽,Ti是卷积核的高,Ri是光谱维数;/>表示第i层第j个卷积核在(s,t,r)位置上的输出;表示上一层第m个特征图在(x+s,y+t,z+r)位置上的输出值;
步骤2.2:在光谱分支中,首先经过一个卷积核大小为1×1×7的Dense2Netbottleneck;然后,经过一个带BN的3D-CNN层和Mish激活函数,将得到的特征图变形为(9×9×1,192)大小;接着,经过光谱注意块对特征图进行细化;最后,经过带Mish的BN层、Dropout层和全局平均池化层,得到大小为1×192的光谱特征图;
步骤2.3:在空间X分支中,首先经过一个卷积核大小为3×1×1的Dense2Netbottleneck;然后,经过一个带BN的3D-CNN层和Mish激活函数,将得到的特征图变形为(9×9×1,192)大小;接着,经过空间X注意块对特征图进行细化;最后,经过带Mish的BN层、Dropout层和全局平均池化层,得到大小为1×192的空间X特征图;
步骤2.4:在空间Y分支中,首先经过一个卷积核大小为1×3×1的Dense2Netbottleneck;然后,经过一个带BN的3D-CNN层和Mish激活函数,将得到的特征图变形为(9×9×1,192)大小;接着,经过空间Y注意块对特征图进行细化;最后,经过带Mish的BN层、Dropout层和全局平均池化层,得到大小为1×192的空间Y特征图;
步骤2.5:拼接三个分支上输出的大小为1×192的光谱特征图、空间X特征图和空间Y特征图,拼接操作后的特征图大小为1×576;接着,经过一个全连接层、softmax函数,得到最终的分类结果。
进一步,所述步骤2.2包括:
(1)Dense2Net bottleneck:包含3组Improved res2Net模块,BN和Mish;其中,光谱分支在Improved res2Net模块中卷积核的大小为1×1×7,空间X分支在Improvedres2Net模块中卷积核的大小为3×1×1,空间Y分支在Improved res2Net模块中卷积核的大小为1×3×1;Res2Net在单个残差块内构造具有等级制的类似残差连接,取代了通用的单个3×3卷积核;在Res2Net块中,一个单独残差块中的分层的残差连接使感受野在更细粒度级别上的变化能够捕获细节和全局特性;假设输入特征数据为为了实现分层操作,将特征按通道数平分为4个部分,每个特征图子集Xi(i=1,2,3,4)的空间大小相同;将Xi(i=2,3,4)分别与P×Q×R的卷积核进行卷积,每个部分的输出为:
其中,K(·)表示卷积操作;然后对Yi进行逐一级联,通过一个1×1×1卷积核的卷积层得到Res2Net模块的输出Y;
(2)Mish激活函数:Mish是一个自正则化的非单调激活函数,Mish为上界无界,下界范围为[≈-0.31,∞];Mish的计算公式是:
(3)三重注意力机制:用于细化光谱、空间X和空间Y分支上提取的特征,首先,分别对输入特征A做reshape、和reshape&transpose;reshape中光谱注意块:C×N,空间X注意块:H×N,空间Y注意块:W×N;reshape&trans pose中光谱注意块:N×C;空间X注意块:N×H;空间Y注意块:N×W;然后,将得到的两个特征图相乘,再通过softmax得到注意力映射X,注意力映射X中光谱注意块:C×C,空间X注意块:H×H,空间Y注意块:W×W,计算注意力映射X的公式如下:
其中xji衡量了第i个通道对第j个通道的影响;接着把X的转置与reshape的A做矩阵乘法,再乘以尺度系数α,再reshape为原来形状;最后与A相加得到最后的输出B;其中α初始化为0,并逐渐的学习得到更大的权重:
进一步,所述步骤三中最优模型的选择策略为:在训练过程中,输出在验证集上分类准确率最高的模型;如若在验证集上的分类准确率一致,则输出在验证集上损失最小的模型;迭代过程中,保存最优模型。
进一步,步骤四为预测过程,将测试集Xtest中的每个像素点ai,以及其周围9×9邻域的大小,输入到最优模型中,最终输出测试样本的类别标签Ypre,完成高光谱图像中地物的分类;然后,通过(Ypre,Ytest)计算TBTA-D2Net模型的3个分类评价指标:OA、AA和Kappa系数。
本发明的另一目的在于提供一种应用所述的基于多分支与改进的Dense2Net的小样本高光谱图像分类系统包括:
三分支前特征提取模块,从原始输入高光谱数据中选取大小为9×9×200的样本立方块作为输入特征A;如果目标像素位于图像的边缘,则将缺失的相邻像素值设置为0;然后,使用一个卷积核大小为1×1×7的3D-CNN对输入特征A进行降维操作,得到(9×9×97,24)大小的特征图作为光谱分支、空间X分支和空间Y分支的输入特征图;
光谱分支特征提取模块,将(9×9×97,24)的特征图输入到光谱分支。首先,经过Dense2Net bottleneck模块,它由3组Improved res2Net和带Mish的BN层组成,每个Improved res2Net的卷积核大小为1×1×7,具体计算如公式(2)所示。经过Dense2Netbottleneck模块后,输出特征图的大小变为(9×9×97,192)。然后,经过卷积核大小为1×1×97的3D-CNN将特征图降维为(9×9×1,192)大小,再使用光谱注意块细化光谱特征。最后,经过带Mish的BN层、Dropout层和全局平均池化层,得到1×192的光谱特征图;
空间X分支特征提取模块,空间X分支的步骤与光谱分支相同,不同的是Improvedres2Net卷积核的大小为3×1×1,经过空间X注意块;最后,得到1×192的空间X特征图;
空间Y分支特征提取模块,空间Y分支的步骤与光谱分支和空间X分支相同,不同的是Improved res2Net卷积核的大小为1×3×1,经过空间Y注意块;最后,得到1×192的空间Y特征图;
光谱、空间X和空间Y特征融合模块,采用拼接操作将光谱特征图、空间X特征图和空间Y特征图融合,经过全连接层和softmax层得到分类结果;由于光谱特征、空间X特征和空间Y特征都在不相关的域中,采用拼接操作可以使三个特征之间保持独立性。
本发明的另一目的在于提供一种计算机设备,计算机设备包括存储器和处理器,存储器存储有计算机程序,计算机程序被处理器执行时,使得处理器执行所述的基于多分支与改进的Dense2Net的小样本高光谱图像分类方法的步骤。
本发明的另一目的在于提供一种计算机可读存储介质,存储有计算机程序,计算机程序被处理器执行时,使得处理器执行所述的基于多分支与改进的Dense2Net的小样本高光谱图像分类方法的步骤。
本发明的另一目的在于提供一种信息数据处理终端,信息数据处理终端用于实现所述的基于多分支与改进的Dense2Net的小样本高光谱图像分类系统。
结合上述的技术方案和解决的技术问题,本发明所要保护的技术方案所具备的优点及积极效果为:
第一,为了解决现有技术类中存在的问题,有效提高小样本下高光谱图像的分类精度。本发明提出了一种基于多分支与改进的Dense2Net的小样本高光谱图像分类方法,简称TBTA-D2Net。TBTA-D2Net网络分三个分支:光谱分支、空间X分支和空间Y分支分别提取三个分支上的特征,并在三个分支上分别应用了光谱注意块,空间X注意块和空间Y注意块,通过注意力权重对空谱信息丰富的区域重新赋予更多的关注,增强光谱和空间特征的可判别性。最后将三个分支上提取到的特征融合进行分类。
为了抑制因网络加深出现的网络退化问题,本发明结合DenseNet和Res2Net方法的优点,设计了Dense2Net bottleneck模块。Dense2Net bottleneck模块加强了DenseNet的特征传播和特征重用,并结合了Res2Net模块的多尺度特征提取优势。除此之外,本发明还采用了一种新的深度模型优化器Adan。Adan结合了自适应优化器,Nesterov冲量,以及解耦的权重衰减策略的优点,可以有效提升网络模型的训练速度。
第二,把技术方案看做一个整体或者从产品的角度,本发明所要保护的技术方案具备的技术效果和优点,具体描述如下:
(1)本发明能够根据训练好的深度学习模型,自动进行分类,无需输入任何参数和耗费大量的时间成本和人力成本去标注数据。
(2)对Res2Net进行了改进,设计了Dense2Net bottleneck模块,能够提取出光谱和空间中更细粒度的特征。
(3)解决了小样本问题,在训练样本数量非常有限的情况下,有效提高了分类精度。
第三,作为本发明的权利要求的创造性辅助证据,还体现在以下几个重要方面:
(1)本发明的技术方案转化后的预期收益和商业价值为:
本发明方法提高了小样本下高光谱遥感图像的分类精度,可将其应用于许多不同的领域,比如精细农业、医学诊断、地质勘测、军事侦察等。
(2)本发明的技术方案是否解决了人们一直渴望解决、但始终未能获得成功的技术难题:
目前,高光谱图像智能识别主要面临两大核心难题:一是如何准确提取复杂的空谱特征;二是小样本情形下如何精确分类。本发明技术成功提高了小样本下的分类精度。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图做简单的介绍,显而易见地,下面所描述的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的基于多分支与改进的Dense2Net的小样本高光谱图像分类方法流程图;
图2是本发明实施例提供的Res2Net与Improved res2Net的网络结构对比图;其中,(a)为Res2Net示意图;(b)为Improved res2Net示意图;
图3是本发明实施例中三重注意力机制的示意图;
图4是本发明实施例提供的TBTA-D2Net的网络结构示意图;
图5是本发明实施例提供的不同训练样本比例下各方法在IP,UP和SV数据集上的OA结果对比示意图;其中,(a)为IP数据集;(b)为UP数据集;(c)为SV数据集。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
针对现有技术存在的问题,本发明提供了一种基于多分支与改进的Dense2Net的小样本高光谱图像分类方法、系统及终端,下面结合附图对本发明作详细的描述。
为了解决现有技术类中存在的问题,有效提高小样本下高光谱图像的分类精度。本发明提出了一种基于多分支与改进的Dense2Net的小样本高光谱图像分类方法,简称TBTA-D2Net。TBTA-D2Net网络分三个分支:光谱分支、空间X分支和空间Y分支分别提取三个分支上的特征,并在三个分支上分别应用了光谱注意块,空间X注意块和空间Y注意块,通过注意力权重对空谱信息丰富的区域重新赋予更多的关注,增强光谱和空间特征的可判别性。最后将三个分支上提取到的特征融合进行分类。
为了抑制因网络加深出现的网络退化问题,本发明结合DenseNet和Res2Net方法的优点,设计了Dense2Net bottleneck模块。Dense2Net bottleneck模块加强了DenseNet的特征传播和特征重用,并结合了Res2Net模块的多尺度特征提取优势。除此之外,本发明还采用了一种新的深度模型优化器Adan。Adan结合了自适应优化器,Nesterov冲量,以及解耦的权重衰减策略的优点,可以有效提升网络模型的训练速度。
TBTA-D2Net算法的具体实现过程可分为以下4个步骤:
步骤1:数据集生成。获取高光谱图像数据集,将数据集随机划分为训练集、验证集和测试集。
步骤2:构建TBTA-D2Net网络模型。
步骤3:利用训练集训练TBTA-D2Net网络模型,更新多次迭代的参数。利用验证集监测模型的性能并选择出最优模型。
步骤4:利用最优模型对测试样本进行测试,实现对高光谱数据每个像素点的分类。
基于多分支与改进的Dense2Net的小样本高光谱图像分类方法(以下简称为TBTA-D2Net)是一种针对小样本高光谱图像数据进行分类的深度学习方法。其主要特征包括多分支结构和改进的Dense2Net结构,使其在处理高光谱图像分类任务时具有更高的性能。以下是详细的信号数据处理过程以及方法的优点和积极效果。
本发明实施例的信号数据处理过程:
1)数据集生成:首先,获取高光谱图像数据集,将数据集随机划分为训练集、验证集和测试集。这个过程可以通过数据增强方法(如旋转、翻转、裁剪等)来扩充数据集,提高模型的泛化能力。
2)构建TBTA-D2Net网络模型:TBTA-D2Net网络模型主要由多分支结构和改进的DenseNet结构组成。多分支结构可以捕捉不同尺度的特征,提高模型的表达能力;改进的DenseNet结构则利用密集连接、跳跃连接等技术,提高了网络的信息传播效率。
3)训练与验证:利用训练集对TBTA-D2Net网络模型进行训练,通过多次迭代更新模型参数。在训练过程中,利用验证集监测模型的性能,根据验证集上的准确率、损失等指标选择出最优模型。
4)测试与分类:利用最优模型对测试样本进行测试,实现对高光谱数据每个像素点的分类。可以通过混淆矩阵、分类准确率等指标来评估模型的分类性能。
本发明实施例的优点和积极效果:
1)通过多分支结构捕捉不同尺度的特征,提高模型的表达能力,使其在处理高光谱图像分类任务时具有更高的性能。
2)改进的DenseNet结构利用密集连接和跳跃连接等技术,提高了网络的信息传播效率,有助于解决梯度消失和梯度爆炸等问题。
3)适用于小样本高光谱图像分类任务,降低了大量标注数据的需求,减轻了数据标注的工作量。
4)结合数据增强方法,提高模型的泛化能力,使其在不同场景下的高光谱图像分类任务中具有较好的适应性。
总之,TBTA-D2Net方法在高光谱图像分类任务中具有较高的性能和较好的泛化能力,为小样本高光谱图像分类提供了一种有效的解决方案。
步骤1中数据集的具体生成过程为:
步骤1.1:假设HSI数据集A由N个标记像素组成,其中p为光谱波段,对应的类别标签集为/>其中q为土地覆盖类别数。从原始数据中选取中心像素ai的b×b邻近像素,生成三维立方块的集合/>如果目标像素位于图像的边缘,则将缺失的相邻像素值设置为零。本研究中b的大小设置为9,b为光谱带的数量。然后,将三维立方块集K随机划分为训练集Xtrain、验证集Xval和测试集Xtest。相应的标签向量分为Ytrain、Yval和Ytest。
步骤1.2:将训练集Xtrain中每一个像素点ai,以及其周围9×9大小的邻域像素点,输入到步骤2中的TBTA-D2Net网络模型中。
步骤2为TBTA-D2Net网络模型的构建过程,具体如下:
步骤2.1:首先经过一个1×1×7大小的3D-CNN对输入特征图进行降为处理,然后将降维后的特征图分别输入到光谱分支、空间X分支和空间Y分支,分别提取光谱特征、空间X特征和空间Y特征。
3D-CNN进行卷积操作的计算如下:
式(1)表示第i层的第j个特征图在(x,y,z)位置上的输出。其中,Si是卷积核的宽,Ti是卷积核的高,Ri是光谱维数。表示第i层第j个卷积核在(s,t,r)位置上的输出。表示上一层第m个特征图在(x+s,y+t,z+r)位置上的输出值。
步骤2.2:在光谱分支中,首先经过一个卷积核大小为1×1×7的Dense2Netbottleneck。然后,经过一个带BN的3D-CNN层和Mish激活函数,将得到的特征图变形为(9×9×1,192)大小。接着,经过光谱注意块对特征图进行细化。最后,经过带Mish的BN层、Dropout层和全局平均池化层,得到大小为1×192的光谱特征图。
(1)Dense2Net bottleneck:包含3组Improved res2Net模块,BN和Mish。其中,光谱分支在Improved res2Net模块中卷积核的大小为1×1×7,空间X分支在Improvedres2Net模块中卷积核的大小为3×1×1,空间Y分支在Improved res2Net模块中卷积核的大小为1×3×1。Res2Net在单个残差块内构造具有等级制的类似残差连接,取代了通用的单个3×3卷积核。在Res2Net块中,一个单独残差块中的分层的残差连接使感受野在更细粒度级别上的变化能够捕获细节和全局特性。为了更好的促进梯度的反向传播和获取三分支上的特征,本研究对Res2Net进行了改进,使其能够应用于高光谱图像分类中。Improvedres2Net与Res2Net的网络结构对比如图2所示。假设输入特征数据为为了实现分层操作,将特征按通道数平分为4个部分,每个特征图子集Xi(i=1,2,3,4)的空间大小相同。将Xi(i=2,3,4)分别与P×Q×R的卷积核进行卷积,每个部分的输出为
其中,K(·)表示卷积操作。然后对Yi进行逐一级联,通过一个1×1×1卷积核的卷积层得到Res2Net模块的输出Y。
(2)Mish激活函数:Mish是一个自正则化的非单调激活函数,Mish为上界无界,下界范围为[≈-0.31,∞]。Mish的计算公式是:
(3)三重注意力机制:本研究设计了三重注意力机制来分别细化光谱、空间X和空间Y分支上提取的特征。三重注意力机制的网络结构如图3所示。首先,分别对输入特征A做reshape(光谱注意块:C×N;空间X注意块:H×N;空间Y注意块:W×N)和reshape&transpose(光谱注意块:N×C;空间X注意块:N×H;空间Y注意块:N×W)。然后,将得到的两个特征图相乘,再通过softmax得到注意力映射X(光谱注意块:C×C;空间X注意块:H×H;空间Y注意块:W×W)。计算注意力映射X的公式如下:
其中xji衡量了第i个通道对第j个通道的影响。接着把X的转置与reshape的A做矩阵乘法,再乘以尺度系数α,再reshape为原来形状。最后与A相加得到最后的输出B。其中α初始化为0,并逐渐的学习得到更大的权重。
步骤2.3:在空间X分支中,首先经过一个卷积核大小为3×1×1的Dense2Netbottleneck。然后,经过一个带BN的3D-CNN层和Mish激活函数,将得到的特征图变形为(9×9×1,192)大小。接着,经过空间X注意块对特征图进行细化。最后,经过带Mish的BN层、Dropout层和全局平均池化层,得到大小为1×192的空间X特征图。
步骤2.4:在空间Y分支中,首先经过一个卷积核大小为1×3×1的Dense2Netbottleneck。然后,经过一个带BN的3D-CNN层和Mish激活函数,将得到的特征图变形为(9×9×1,192)大小。接着,经过空间Y注意块对特征图进行细化。最后,经过带Mish的BN层、Dropout层和全局平均池化层,得到大小为1×192的空间Y特征图。
步骤2.4:拼接三个分支上输出的大小为1×192的光谱特征图、空间X特征图和空间Y特征图,拼接操作后的特征图大小为1×576。接着,经过一个全连接层、softmax函数,得到最终的分类结果。
步骤3中最优模型的选择策略为:在训练过程中,输出在验证集上分类准确率最高的模型。如若在验证集上的分类准确率一致,则输出在验证集上损失最小的模型。迭代过程中,保存最优模型。
步骤4为预测过程。将测试集Xtest中的每个像素点ai,以及其周围9×9邻域的大小,输入到最优模型中,最终输出测试样本的类别标签Ypre,完成高光谱图像中地物的分类。然后,通过(Ypre,Ytest)计算TBTA-D2Net模型的3个分类评价指标:OA、AA和Kappa系数。
本发明提出了一种基于多分支与改进的Dense2Net的小样本高光谱图像分类方法:首先将原始的高光谱数据输入,然后选择每一个像素点及其周围邻域9×9大小的三维立方块输入,随后通过本研究方法TBTA-D2Net,提取光谱特征、空间X特征和空间Y特征,训练网络模型,并通过验证集和最优模型选择策略输出最优模型。最后,输入测试样本预测分类结果,并输出预测结果的OA指标、AA指标和Kappa系数。
TBTA-D2Net网络具体实施步骤
TBTA-D2Net的网络结构如图4所示。以Indian Pines(IP)数据集为例,TBTA-D2Net网络的特征提取与分类识别步骤如下。
(1)三分支前特征提取
从原始输入高光谱数据中选取大小为9×9×200的样本立方块作为输入特征A。如果目标像素位于图像的边缘,则将缺失的相邻像素值设置为0。然后,使用一个卷积核大小为1×1×7的3D-CNN对输入特征A进行降维操作,得到(9×9×97,24)大小的特征图作为光谱分支、空间X分支和空间Y分支的输入特征图。
(2)光谱分支特征提取
将(9×9×97,24)的特征图输入到光谱分支。首先,经过Dense2Net bottleneck模块,它由3组Improved res2Net和带Mish的BN层组成,每个Improved res2Net的卷积核大小为1×1×7,具体计算如公式(2)所示。经过Dense2Net bottleneck模块后,输出特征图的大小变为(9×9×97,192)。然后,经过卷积核大小为1×1×97的3D-CNN将特征图降维为(9×9×1,192)大小,再使用光谱注意块细化光谱特征。最后,经过带Mish的BN层、Dropout层和全局平均池化层,得到1×192的光谱特征图。光谱分支的实施细节如下表所示:
表1在光谱分支上的实施细节
(3)空间X分支特征提取
空间X分支的实施步骤与光谱分支相同。不同的是Improved res2Net卷积核的大小为3×1×1,经过空间X注意块。最后,得到1×192的空间X特征图。空间X分支的实施细节如下表所示:
表2在空间X分支上的实施细节
(4)空间Y分支特征提取
空间Y分支的实施步骤与光谱分支和空间X分支相同。不同的是Improved res2Net卷积核的大小为1×3×1,经过空间Y注意块。最后,得到1×192的空间Y特征图。空间Y分支的实施细节如下表所示:
表3在空间Y分支上的实施细节
(5)光谱、空间X和空间Y特征融合
采用拼接操作将光谱特征图、空间X特征图和空间Y特征图融合,经过全连接层和softmax层得到分类结果。由于光谱特征、空间X特征和空间Y特征都在不相关的域中,采用拼接操作可以使三个特征之间保持独立性。
本发明的应用实施例提供了一种计算机设备,计算机设备包括存储器和处理器,存储器存储有计算机程序,计算机程序被处理器执行时,使得处理器执行所述的基于多分支与改进的Dense2Net的小样本高光谱图像分类方法的步骤。
本发明的应用实施例提供了一种计算机可读存储介质,存储有计算机程序,计算机程序被处理器执行时,使得处理器执行所述的基于多分支与改进的Dense2Net的小样本高光谱图像分类方法的步骤。
本发明的应用实施例提供了一种信息数据处理终端,信息数据处理终端用于实现所述的基于Dense2Net的小样本高光谱图像分类系统。
本发明实施例在研发或者使用过程中取得了一些积极效果,和现有技术相比的确具备很大的优势,下面内容结合试验过程的数据、图表等进行描述。
本发明方法在3个公开的高光谱数据集上进行了实验,即Indian Pines(IP)数据集、Pavia University(UP)数据集、和Salinas Valley(SV)数据集。对比了其他5种目前分类效果比较好的、基于深度学习的方法,这5种方法分别是:
1)Lee和Kwon在其发表的论文“Going deeper with contextual CNN forhyperspectral image classification[J].IEEE Trans Image Process.2017,26(10):4843-4855.”中提出的CDCNN方法。
2)Zhong等在其发表的论文“Spectral-spatial residual network forhyperspectral image classification:A 3-D deep learning framework[J].IEEETrans Geosci Remote Sens.2018,56(2):847-858.”中提出的SSRN方法。
3)Wang等在其发表的论文“A fast dense spectral-spatial convolutionnetwork frame work for hyperspectral images classification[J].RemoteSens.2018,10(7):1068.”中提出的FDSSC方法。
4)Ma等在其发表的论文“Double-branch multi-attention mechanism networkfor hyperspectral image classification[J].Remote Sens.2019,11(11):1307.”中提出的DBMA方法。
5)Li等在其发表的论文“Classification of hyperspectral image based ondouble-branch dual-attention mechanism network[J].Remote Sens.2020,12(3):582.”中提出的DBDA方法。
实验都在相同的平台上执行,所有方法均使用PyTorch实现,配置16GB内存和NVIDIA GeForce RTX 1080Ti GPU。批处理大小均设为16,优化器设为Adan,学习率为0.0005。epoch总数设置为150。每种方法独立进行10次迭代,实验结果取10次迭代结果的平均值。输入大小均为9×9×p,其中p为光谱带的数量。
在深度学习中,随着网络深度的增加,网络模型的训练速度便会下降。为了提升网络模型的收敛速度,本研究采用了一种新的深度学习优化器:自适应Nesterov动量算法,简称Adan。Adan通过重新制定vanilla Nesterov加速度提出了一种新的Nesterov动量估计(NME)方法,这消除了在外推点计算梯度的需要。然后将该方法应用于估计自适应梯度算法中梯度的一阶和二阶矩,从而加快收敛速度。Adan的算法流程如下:
实验结果
在Indian Pines(IP)数据集上,去除水汽影响严重的波段,有效样本数为10249个。其中3%为训练集,3%为验证集,其余94%为测试集。各方法在IP数据集上的分类结果如表4所示,每类中最佳分类结果加粗表示。
表4不同方法在IP数据集上的分类结果(训练样本比例为3%)
在Pavia University(UP)数据集上,有效样本数为42776个。其中0.5%为训练集,0.5%为验证集,其余99%为测试集。各方法在UP数据集上的分类结果如表5所示,每类中最佳分类结果加粗表示。
表5不同方法在UP数据集上的分类结果(训练样本比例为0.5%)
在Salinas Valley(SV)数据集上,有效样本数为54129个。其中0.5%为训练集,0.5%为验证集,其余99%为测试集。各方法在SV数据集上的分类结果如表6所示,每类中最佳分类结果加粗表示。
表6不同方法在SV数据集上的分类结果(训练样本比例为0.5%)
从表4-表6中可以看出,与CDCNN,SSRN,FDSSC,DBMA和DBDA相比,本发明提出的方法TBTA-D2Net在IP,UP和SV三个数据集上,OA,AA和KAPPA指标均取得了最佳结果。因此,TBTA-D2Net网络有效提升了小样本下高光谱图像分类的精度。
不同训练样本比例下,各方法在IP,UP和SV数据集上的OA结果对比如图5所示。其中,在IP数据集上训练样本比例分别为0.5%,1%,3%和5%。在UP和SV数据集上训练样本比例分别为0.1%,0.5%,1%和5%。由于UP和SV数据集比较大,所以训练样本比例最小为0.1%。从图中可以看出,随着训练样本比例增加,各方法的OA结果也随之提高。在三个数据集上,本发明提出的方法TBTA-D2Net在不同训练样本比例下,均优于其他方法,尤其是在训练样本有限的情况下对比明显。
本发明提供的实施例1:
在本实施例中,假设我们有一个高光谱遥感图像数据集,用于进行农作物种类识别。我们的目标是利用基于多分支与改进的Dense2Net(TBTA-D2Net)的小样本高光谱图像分类方法,对农作物种类进行分类。
步骤1.1:获取高光谱图像数据集,例如Indian Pines数据集。该数据集包含224个光谱波段,土地覆盖类别数为16。从原始数据中选取中心像素的邻近像素,生成三维立方块的集合。假设邻域大小为9,将三维立方块集随机划分为训练集、验证集和测试集。
步骤1.2:将训练集中每一个像素点,以及其周围大小为9的邻域像素点,输入到TBTA-D2Net网络模型中。
步骤2:构建TBTA-D2Net网络模型,包括多分支与改进的Dense2Net结构。这使得模型可以更好地捕捉到高光谱图像的空间信息和光谱信息。
步骤3:利用训练集训练TBTA-D2Net网络模型,更新多次迭代的参数。利用验证集监测模型的性能并选择出最优模型。
步骤4:利用最优模型对测试样本进行测试,实现对高光谱数据每个像素点的农作物种类分类。
本发明提供的实施例2:
在本实施例中,假设我们有一个高光谱遥感图像数据集,用于进行城市土地覆盖分类。我们的目标是利用基于多分支与改进的Dense2Net(TBTA-D2Net)的小样本高光谱图像分类方法,对城市土地覆盖进行分类。
步骤1.1:获取高光谱图像数据集,例如Pavia University数据集。该数据集包含103个光谱波段,土地覆盖类别数为9。从原始数据中选取中心像素的邻近像素,生成三维立方块的集合。假设邻域大小为9,将三维立方块集随机划分为训练集、验证集和测试集。
步骤1.2:将训练集中每一个像素点,以及其周围大小为9的邻域像素点,输入到TBTA-D2Net网络模型中。
步骤2:构建TBTA-D2Net网络模型,包括多分支与改进的Dense2Net结构。这使得模型可以更好地捕捉到高光谱图像的空间信息和光谱信息。
步骤3:利用训练集训练TBTA-D2Net网络模型,更新多次迭代的参数。利用验证集监测模型的性能并选择出最优模型。
步骤4:利用最优模型对测试样本进行测试,实现对高光谱数据每个像素点的城市土地覆盖分类。
这两个实施例展示了如何使用基于多分支与改进的Dense2Net的小样本高光谱图像分类方法进行不同应用场景下的高光谱图像分类。
应当注意,本发明的实施方式可以通过硬件、软件或者软件和硬件的结合来实现。硬件部分可以利用专用逻辑来实现;软件部分可以存储在存储器中,由适当的指令执行系统,例如微处理器或者专用设计硬件来执行。本领域的普通技术人员可以理解上述的设备和方法可以使用计算机可执行指令和/或包含在处理器控制代码中来实现,例如在诸如磁盘、CD或DVD-ROM的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。本发明的设备及其模块可以由诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现,也可以用由各种类型的处理器执行的软件实现,也可以由上述硬件电路和软件的结合例如固件来实现。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,都应涵盖在本发明的保护范围之内。
Claims (10)
1.一种基于多分支与改进的Dense2Net的小样本高光谱图像分类方法,其特征在于,包括:
步骤一,数据集生成,获取高光谱图像数据集,将数据集随机划分为训练集、验证集和测试集;
步骤二,构建TBTA-D2Net网络模型;
步骤三,利用训练集训练TBTA-D2Net网络模型,更新多次迭代的参数;利用验证集监测模型的性能并选择出最优模型;
步骤四,利用最优模型对测试样本进行测试,实现对高光谱数据每个像素点的分类。
2.如权利要求1所述的基于多分支与改进的Dense2Net的小样本高光谱图像分类方法,其特征在于,所述步骤一中数据集的具体生成过程为:
步骤1.1:假设HSI数据集A由N个标记像素组成,其中p为光谱波段;对应的类别标签集为/>其中q为土地覆盖类别数;从原始数据中选取中心像素ai的b×b邻近像素,生成三维立方块的集合/>如果目标像素位于图像的边缘,则将缺失的相邻像素值设置为零;b的大小设置为9,b为光谱带的数量,然后,将三维立方块集K随机划分为训练集Xtrain、验证集Xval和测试集Xtest;相应的标签向量分为Ytrain、Yval和Ytest;
步骤1.2:将训练集Xtrain中每一个像素点ai,以及其周围9×9大小的邻域像素点,输入到步骤二中的TBTA-D2Net网络模型中。
3.如权利要求1所述的基于多分支与改进的Dense2Net的小样本高光谱图像分类方法,其特征在于所述步骤二为TBTA-D2Net网络模型的构建过程,具体步骤如下:
步骤2.1:首先经过一个1×1×7大小的3D-CNN对输入特征图进行降维处理,然后将降维后的特征图分别输入到光谱分支、空间X分支和空间Y分支,分别提取光谱特征、空间X特征和空间Y特征;
3D-CNN进行卷积操作的计算如下:
其中,表示第i层的第j个特征图在(x,y,z)位置上的输出;Si是卷积核的宽,Ti是卷积核的高,Ri是光谱维数;/>表示第i层第j个卷积核在(s,t,r)位置上的输出;/>表示上一层第m个特征图在(x+s,y+t,z+r)位置上的输出值;
步骤2.2:在光谱分支中,首先经过一个卷积核大小为1×1×7的Dense2Netbottleneck;然后,经过一个带BN的3D-CNN层和Mish激活函数,将得到的特征图变形为(9×9×1,192)大小;接着,经过光谱注意块对特征图进行细化;最后,经过带Mish的BN层、Dropout层和全局平均池化层,得到大小为1×192的光谱特征图;
步骤2.3:在空间X分支中,首先经过一个卷积核大小为3×1×1的Dense2Netbottleneck;然后,经过一个带BN的3D-CNN层和Mish激活函数,将得到的特征图变形为(9×9×1,192)大小;接着,经过空间X注意块对特征图进行细化;最后,经过带Mish的BN层、Dropout层和全局平均池化层,得到大小为1×192的空间X特征图;
步骤2.4:在空间Y分支中,首先经过一个卷积核大小为1×3×1的Dense2Netbottleneck;然后,经过一个带BN的3D-CNN层和Mish激活函数,将得到的特征图变形为(9×9×1,192)大小;接着,经过空间Y注意块对特征图进行细化;最后,经过带Mish的BN层、Dropout层和全局平均池化层,得到大小为1×192的空间Y特征图;
步骤2.5:拼接三个分支上输出的大小为1×192的光谱特征图、空间X特征图和空间Y特征图,拼接操作后的特征图大小为1×576;接着,经过一个全连接层、softmax函数,得到最终的分类结果。
4.如权利要求1所述的基于多分支与改进的Dense2Net的小样本高光谱图像分类方法,其特征在于所述步骤2.2包括:
(1)Dense2Net bottleneck:包含3组Improved res2Net模块,BN和Mish;其中,光谱分支在Improved res2Net模块中卷积核的大小为1×1×7,空间X分支在Improved res2Net模块中卷积核的大小为3×1×1,空间Y分支在Improved res2Net模块中卷积核的大小为1×3×1;Res2Net在单个残差块内构造具有等级制的类似残差连接,取代了通用的单个3×3卷积核;在Res2Net块中,一个单独残差块中的分层的残差连接使感受野在更细粒度级别上的变化能够捕获细节和全局特性;假设输入特征数据为为了实现分层操作,将特征按通道数平分为4个部分,每个特征图子集Xi(i=1,2,3,4)的空间大小相同;将Xi(i=2,3,4)分别与P×Q×R的卷积核进行卷积,每个部分的输出为:
其中,K(·)表示卷积操作;然后对Yi进行逐一级联,通过一个1×1×1卷积核的卷积层得到Res2Net模块的输出Y;
(2)Mish激活函数:Mish是一个自正则化的非单调激活函数,Mish为上界无界,下界范围为[≈-0.31,∞];Mish的计算公式是:
(3)三重注意力机制:用于细化光谱、空间X和空间Y分支上提取的特征,首先,分别对输入特征A做reshape和reshape&transpose;reshape中光谱注意块:C×N,空间X注意块:H×N,空间Y注意块:W×N;reshape&transpose中光谱注意块:N×C;空间X注意块:N×H;空间Y注意块:N×W;然后,将得到的两个特征图相乘,再通过softmax得到注意力映射X,注意力映射X中光谱注意块:C×C,空间X注意块:H×H,空间Y注意块:W×W,计算注意力映射X的公式如下:
其中xji衡量了第i个通道对第j个通道的影响;接着把X的转置与reshape的A做矩阵乘法,再乘以尺度系数α,再reshape为原来形状;最后与A相加得到最后的输出B;其中α初始化为0,并逐渐的学习得到更大的权重:
5.如权利要求1所述的基于多分支与改进的Dense2Net的小样本高光谱图像分类方法,其特征在于所述步骤三中最优模型的选择策略为:在训练过程中,输出在验证集上分类准确率最高的模型;如若在验证集上的分类准确率一致,则输出在验证集上损失最小的模型;迭代过程中,保存最优模型。
6.如权利要求1所述的基于多分支与改进的Dense2Net的小样本高光谱图像分类方法,其特征在于步骤四为预测过程,将测试集Xtest中的每个像素点ai,以及其周围9×9邻域的大小,输入到最优模型中,最终输出测试样本的类别标签Ypre,完成高光谱图像中地物的分类;然后,通过(Ypre,Ytest)计算TBTA-D2Net模型的3个分类评价指标:OA、AA和Kappa系数。
7.一种应用如权利要求1~6所述的高光谱图像分类方法的基于多分支与改进的Dense2Net的小样本高光谱图像分类系统,其特征在于,包括:
三分支前特征提取模块,从原始输入高光谱数据中选取大小为9×9×200的样本立方块作为输入特征A;如果目标像素位于图像的边缘,则将缺失的相邻像素值设置为0;然后,使用一个卷积核大小为1×1×7的3D-CNN对输入特征A进行降维操作,得到(9×9×97,24)大小的特征图作为光谱分支、空间X分支和空间Y分支的输入特征图;
光谱分支特征提取模块,将(9×9×97,24)的特征图输入到光谱分支;首先,经过Dense2Net bottleneck模块,它由3组Improved res2Net和带Mish的BN层组成,每个Improved res2Net的卷积核大小为1×1×7,经过Dense2Net bottleneck模块后,输出特征图的大小变为(9×9×97,192);然后,经过卷积核大小为1×1×97的3D-CNN将特征图降维为(9×9×1,192)大小,再使用光谱注意块细化光谱特征;最后,经过带Mish的BN层、Dropout层和全局平均池化层,得到1×192的光谱特征图;
空间X分支特征提取模块,空间X分支的步骤与光谱分支相同,不同的是Improvedres2Net卷积核的大小为3×1×1,经过空间X注意块;最后,得到1×192的空间X特征图;
空间Y分支特征提取模块,空间Y分支的步骤与光谱分支和空间X分支相同,不同的是Improved res2Net卷积核的大小为1×3×1,经过空间Y注意块;最后,得到1×192的空间Y特征图;
光谱、空间X和空间Y特征融合模块,采用拼接操作将光谱特征图、空间X特征图和空间Y特征图融合,经过全连接层和softmax层得到分类结果;由于光谱特征、空间X特征和空间Y特征都在不相关的域中,采用拼接操作可以使三个特征之间保持独立性。
8.一种计算机设备,计算机设备包括存储器和处理器,存储器存储有计算机程序,计算机程序被处理器执行时,使得处理器执行如权利要求1~6所述的基于多分支与改进的Dense2Net的小样本高光谱图像分类方法的步骤。
9.一种计算机可读存储介质,存储有计算机程序,计算机程序被处理器执行时,使得处理器执行如权利要求1~6所述的基于多分支与改进的Dense2Net的小样本高光谱图像分类方法的步骤。
10.一种信息数据处理终端,信息数据处理终端用于实现如权利要求7所述的基于多分支与改进的Dense2Net的小样本高光谱图像分类系统。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310749812.5A CN116883726A (zh) | 2023-06-25 | 2023-06-25 | 基于多分支与改进的Dense2Net的高光谱图像分类方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310749812.5A CN116883726A (zh) | 2023-06-25 | 2023-06-25 | 基于多分支与改进的Dense2Net的高光谱图像分类方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116883726A true CN116883726A (zh) | 2023-10-13 |
Family
ID=88263451
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310749812.5A Pending CN116883726A (zh) | 2023-06-25 | 2023-06-25 | 基于多分支与改进的Dense2Net的高光谱图像分类方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116883726A (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009154765A1 (en) * | 2008-06-18 | 2009-12-23 | Spectral Image, Inc. | Systems and methods for hyperspectral imaging |
US8897570B1 (en) * | 2011-03-31 | 2014-11-25 | Raytheon Company | Detection of targets from hyperspectral imagery |
CN113011499A (zh) * | 2021-03-22 | 2021-06-22 | 安徽大学 | 一种基于双注意力机制的高光谱遥感图像分类方法 |
CN113486851A (zh) * | 2021-07-28 | 2021-10-08 | 齐齐哈尔大学 | 基于双分支光谱多尺度注意力网络的高光谱图像分类方法 |
CN114330591A (zh) * | 2022-01-05 | 2022-04-12 | 安徽大学 | 一种基于空域-光谱维度转换的高光谱分类方法 |
CN114758170A (zh) * | 2022-04-02 | 2022-07-15 | 内蒙古农业大学 | 一种结合d3d的三分支三注意力机制高光谱图像分类方法 |
CN116012653A (zh) * | 2023-01-16 | 2023-04-25 | 河南理工大学 | 一种注意力残差单元神经网络高光谱图像分类方法及系统 |
-
2023
- 2023-06-25 CN CN202310749812.5A patent/CN116883726A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009154765A1 (en) * | 2008-06-18 | 2009-12-23 | Spectral Image, Inc. | Systems and methods for hyperspectral imaging |
US8897570B1 (en) * | 2011-03-31 | 2014-11-25 | Raytheon Company | Detection of targets from hyperspectral imagery |
CN113011499A (zh) * | 2021-03-22 | 2021-06-22 | 安徽大学 | 一种基于双注意力机制的高光谱遥感图像分类方法 |
CN113486851A (zh) * | 2021-07-28 | 2021-10-08 | 齐齐哈尔大学 | 基于双分支光谱多尺度注意力网络的高光谱图像分类方法 |
CN114330591A (zh) * | 2022-01-05 | 2022-04-12 | 安徽大学 | 一种基于空域-光谱维度转换的高光谱分类方法 |
CN114758170A (zh) * | 2022-04-02 | 2022-07-15 | 内蒙古农业大学 | 一种结合d3d的三分支三注意力机制高光谱图像分类方法 |
CN116012653A (zh) * | 2023-01-16 | 2023-04-25 | 河南理工大学 | 一种注意力残差单元神经网络高光谱图像分类方法及系统 |
Non-Patent Citations (3)
Title |
---|
于慧伶 等: "融合多层特征SENet和多尺度宽残差的高光谱图像地物分类", 实验室研究与探索, vol. 39, no. 07, 25 July 2020 (2020-07-25), pages 28 - 34 * |
唐婷 等: "基于TBTA网络的高光谱图像分类", 《计算机仿真》, vol. 40, no. 1, 31 January 2023 (2023-01-31), pages 239 - 250 * |
赵丽萍 等: "面向图像分类的残差网络进展研究", 计算机工程与应用, vol. 56, no. 20, 31 October 2020 (2020-10-31), pages 9 - 19 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Gao et al. | Multiscale residual network with mixed depthwise convolution for hyperspectral image classification | |
Zhong et al. | Deep residual networks for hyperspectral image classification | |
WO2018010434A1 (zh) | 一种图像分类方法及装置 | |
CN113486851B (zh) | 基于双分支光谱多尺度注意力网络的高光谱图像分类方法 | |
Fang et al. | DOG: A new background removal for object recognition from images | |
CN111915644B (zh) | 孪生导向锚框rpn网络的实时目标跟踪方法 | |
Bozkurt | Skin lesion classification on dermatoscopic images using effective data augmentation and pre-trained deep learning approach | |
CN115359074B (zh) | 基于超体素聚类及原型优化的图像分割、训练方法及装置 | |
He et al. | SAR target recognition and unsupervised detection based on convolutional neural network | |
CN115527056A (zh) | 基于双混合卷积生成对抗网络的高光谱图像分类方法 | |
Wang et al. | Building correlations between filters in convolutional neural networks | |
Fan et al. | A novel sonar target detection and classification algorithm | |
CN117131376A (zh) | 一种基于视变换结合生成对抗网络进行持续学习的高光谱跨域鲁棒异常检测方法、系统、设备及介质 | |
Bacea et al. | Single stage architecture for improved accuracy real-time object detection on mobile devices | |
Nawaz et al. | CoffeeNet: A deep learning approach for coffee plant leaves diseases recognition | |
Gao et al. | Bi-directional LSTM with multi-scale dense attention mechanism for hyperspectral image classification | |
Gutiérrez-Zaballa et al. | On-chip hyperspectral image segmentation with fully convolutional networks for scene understanding in autonomous driving | |
CN110569882A (zh) | 一种图像信息分类方法及装置 | |
CN114494777A (zh) | 一种基于3D CutMix-Transformer的高光谱图像分类方法及系统 | |
Shi et al. | Hyperspectral image classification based on dual-branch spectral multiscale attention network | |
Zhang et al. | Identification of stored grain pests by modified residual network | |
Liang et al. | Accurate image recognition of plant diseases based on multiple classifiers integration | |
Alam et al. | Comparing pre-trained models for efficient leaf disease detection: a study on custom CNN | |
Liu et al. | GGRNet: Global graph reasoning network for salient object detection in optical remote sensing images | |
CN116883726A (zh) | 基于多分支与改进的Dense2Net的高光谱图像分类方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |