CN111199214A - 一种残差网络多光谱图像地物分类方法 - Google Patents

一种残差网络多光谱图像地物分类方法 Download PDF

Info

Publication number
CN111199214A
CN111199214A CN202010007512.6A CN202010007512A CN111199214A CN 111199214 A CN111199214 A CN 111199214A CN 202010007512 A CN202010007512 A CN 202010007512A CN 111199214 A CN111199214 A CN 111199214A
Authority
CN
China
Prior art keywords
size
classification
network
residual error
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010007512.6A
Other languages
English (en)
Other versions
CN111199214B (zh
Inventor
马文萍
赵继樑
朱浩
武越
沈建超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xidian University
Original Assignee
Xidian University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xidian University filed Critical Xidian University
Priority to CN202010007512.6A priority Critical patent/CN111199214B/zh
Publication of CN111199214A publication Critical patent/CN111199214A/zh
Application granted granted Critical
Publication of CN111199214B publication Critical patent/CN111199214B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • G06V20/13Satellite images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Astronomy & Astrophysics (AREA)
  • Remote Sensing (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种残差网络多光谱图像地物分类方法,从数据集中读入多光谱图像;对数据进行归一化操作;对多光谱图像进行SLIC超像素,对图像中的边缘像素点使用自适应邻域选择策略进行取块建立数据集,建立训练集,验证集和测试集;构造基于全局通道交互注意力机制的残差网络的分类模型;用训练数据集对分类模型进行训练,同时使用验证集实时验证网络分类精度;最后利用训练好的分类模型对测试数据集分类。本发明采用了全局通道交互注意力机制,在网络训练的过程中,不断地加强对分类有帮助的特征通道,抑制对分类无用的特征通道,这与普通的卷积神经网络相比鲁棒性更强,稳定性更高,大大提高了分类精度。

Description

一种残差网络多光谱图像地物分类方法
技术领域
本发明属于图像处理技术领域,具体涉及一种基于全局通道交互注意力机制的残差网络的多光谱图像地物分类方法。
背景技术
在遥感应用中,通过遥感图像分析与解译来识别各种地物是遥感图像处理的最终目的。分类问题也是遥感图像信息提取中的最基本的问题之一。无论地物提取、土地动态变化监测,还是专题地图制作和遥感图像库的建立都离不开分类,许多方面的应用都会涉及分类。通过遥感图像的分类识别后可以更加精确地描述地物的属性和特征,在农作物估产、土地利用、环境监测、工程勘测、自然灾害监测、基础设施布局、交通规划管理、旅游开发以及各类资源的调查研究都会产生积极的作用,从而更好的为这些领域服务。
卷积神经网络的布局是最接近实体生物大脑的神经网络,在处理任务时具有优越性。与一般的神经网络相比较,卷积神经网络在进行图像处理方面有着突出的表现:
(1)通过神经元的局部连接和权值共享模式减少了网络的连接数和训练参数,提高了运行效率,同时简单的网络结构更能够适应多种分类任务;
(2)统一层的权值共享利于网络的并行运算;
(3)网络拓扑结构适合图像数据的输入,可以直接对图像的二维矩阵进行处理;
(4)特征提取过程和模式分类过程可在训练过程中同时进行,回避了复杂的、随机的、不靠谱的显式的特征提取过程。
发明内容
本发明所要解决的技术问题在于针对上述现有技术中的不足,提供一种残差网络多光谱图像地物分类方法,首先使用了一种自适应邻域选择策略,自适应的调整中心点的邻域像素区域,而不是以往的固定滑窗取块,生成更具有辨别性的样本块,使得网络能提取出更鲁棒的特征;同时利用全局交互通道注意力机制生成注意力权重,对特征通道进行权重调整,加强对分类有帮助的通道,抑制对分类没有帮助的通道;训练出更稳定、判别性更强的分类网络。
本发明采用以下技术方案:
一种残差网络多光谱图像地物分类方法,从数据集中读入多光谱图像;对数据进行归一化操作;对多光谱图像进行SLIC超像素,对图像中的边缘像素点使用自适应邻域选择策略进行取块建立数据集,建立训练集,验证集和测试集;构造基于全局通道交互注意力机制的残差网络的分类模型;用训练数据集对分类模型进行训练,同时使用验证集实时验证网络分类精度;最后利用训练好的分类模型对测试数据集分类。
具体的,多光谱图像包括QuickBird卫星数据、DEMIMOS-2卫星数据以及对应的只有部分区域的类标ground truth图。
具体的,归一化操作具体为,采用min-max标准化,对原始数据进行线性变化,使结果值映射到0到1之间。
具体的,使用自适应邻域选择策略进行取块具体为:
S301、对多光谱图像使用SLIC超像素,得到超像素类标数据图;
S302、计算每个超像素标记数据图中每个超像素块的质心坐标;
S303、计算超像素类标数据图每一点的梯度,若某一个点水平梯度
Figure BDA0002355823500000031
或竖直梯度
Figure BDA0002355823500000032
为0,则该点为超像素图块边缘点并保存像素点坐标;
S304、计算超像素标记图中每个SLIC超像素图块质心与边缘像素点的距离;
S305、将边缘点像素坐标和当前超像素块质心坐标相连,以竖直方向为轴,得到角度α;
S306、根据计算的得到的距离,计算边缘像素点改变的距离,得到改变后的边缘像素点坐标。
进一步的,步骤S302中,超像素块质心坐标(xi,yi)为:
Figure BDA0002355823500000033
其中,(xk,yk)是超像素块中像素点坐标,n代表超像素块中像素点个数。
具体的,建立训练集,测试集和验证集具体为:
S401、对每一幅多光谱影像进行边缘扩充操作,边缘填充的大小为滑窗操作所选窗口的边长的一半;
S402、在归一化后的图像中找到有对应类标的像素点,以像素点为中心截取邻域为120×120的区域,然后将区域逆时针旋转角度α,再以像素点为中心截取大小为32×32的邻域作为样本块,每个块的邻域都是为中心点的分类所服务;
S403、将四个数据集Vancouver Level 1B、Vancouver Level 1c、Xi’an suburbarea、Xi’an urban area,分别进行训练样本,测试样本和验证样本的选取;
S404、采用等比采样的方式选取不同类别的训练样本,每类选取20%个样本作为训练集,10%为测试集,剩余70%为验证集。
具体的,全局通道交互注意力机制的残差神经网络的分类模型包括三部分,共有十八个层的残差神经网络,第一部分是卷积层,第二部分是由8个残差元堆叠的中间层,每个残差元有两个卷积层,总共16个卷积层,第三部分是全连接层,将第17层的网络输出进行全局平均池化,再连接上一个输出为8的全连接层,然后使用sigmoid函数得到最后的分类结果。
进一步的,通道每层的参数如下:
初始输入为大小32*32的MS图块,第1层为卷积层,输入尺寸为32*32,输出尺寸为32*32,卷积核个数为16,卷积核大小为5*5,步长为1;第2至5层为2个残差元堆叠构成;输入尺寸为32*32,输出尺寸为16*16,卷积核个数为32,卷积核大小为3*3,步长1,第二个残差元步长为2,每个卷积层后接一个全局通道交互注意力机制调整输出特征图的权重值;第6至9层为2个残差元堆叠构成;输入尺寸为16*16,输出尺寸为8*8,卷积核个数为64,卷积核大小为3*3,步长为1,第二个残差元步长为2,每个卷积层后接一个全局通道交互注意力机制调整输出特征图的权重值;第10至13层为2个残差元堆叠构成;输入尺寸为8*8,输出尺寸为4*4,卷积核个数为128,卷积核大小为3*3,步长为1,第二个残差元步长为2,每个卷积层后接一个全局通道交互注意力机制调整输出特征图的权重值;第14至17层为2个残差元堆叠构成;输入尺寸为4*4,输出尺寸为2*2,卷积核个数为256,卷积核大小为3*3,步长为1,第二个残差元步长为2,每个卷积层后接一个全局通道交互注意力机制调整输出特征图的权重值,全局池化输出,输入为2*2*256,输出为256;第18层为全连接层,输入为256,输出为8;
残差元结构如下:
第一步是卷积层,卷积核大小为3*3,步长为1;第二步是使用relu的激活函数;第三步是卷积层,卷积核大小为3*3,步长为1或2;第四步是将第三步卷积层的输出与第一步的输入相加,当步长为2时,先将第一步输入进行zero padding调整尺寸,再相加;第五步是使用relu的激活函数。
具体的,使用验证集实时验证网络分类精度具体为:
用训练数据集对分类模型进行训练,通过输入训练数据集得到网络得分类结果后,与地面实况图上所对应的真实类标作对比,计算所得的损失函数并根据损失函数使用随机梯度下降法进行反向传播,优化分类模型的网络参数,每训练50代后利用验证数据集实时验证网络分类精度,最后得到训练好的分类模型。
具体的,对测试数据集进行分类具体为:
将测试数据集的样本块作为训练好的分类模型输入,训练好的分类模型输出为测试数据集中每个像素点进行分类得到的分类类别。
与现有技术相比,本发明至少具有以下有益效果:
本发明一种残差网络多光谱图像地物分类方法,从数据集中读入多光谱影像;得到图像矩阵后,对数据进行归一化操作;对样本进行超像素,使用自适应邻域选择策略对每一个像素点取块建立数据集,分出训练集,测试集和验证集;构造基于全局通道交互注意力机制的残差网络的分类模型;用训练数据集对分类模型进行训练,验证集进行实时验证网络分类准确率;利用训练好的分类模型对测试数据集分类。
进一步的,通过对样本进行自适应邻域选择,使得相邻的具有相似信息的但属于不同类别的像素点会自适应的选择更符合自身类别的邻域信息,这使得样本更具有辨别性,网络能提取出特异性更强,更具有类别代表性的特征,进而提高多光谱图像地物分类的准确率。
进一步的,将数据集按类别以比例选取出20%作为训练集、10%作为验证集和70%作为测试集;训练集作为网络训练样本,按网络设定训练次数,循环输入进网络中,并且根据训练结果与标签进行比较通过损失函数得到训练损失(loss),根据损失用反向传播算法(BP)更新网络参数,同时每训练一定次数,网络随机输入验证数据集中某些图块,正向传播得到训练损失,并且与标签进行比较得到训练分类准确率,了解网络实时状况,但不进行反向传播更新参数,保证网络没有得到额外的训练样本参与;训练完成之后,将测试数据集整体输入进网络,得到网络对测试数据集的分类结果,并且因为提前分离样本,保证测试数据没有参与到网络训练的过程中,确保最后分类结果的准确性。
进一步的,网络主体使用残差网络,残差网络在分类任务上,因为浅层特征与深层特征的直接相连相加,可以反向传播(BP)过程中,让梯度信息在网络中的完整的流动,这样更利于网络参数的更新;并且在特征通道之间,全局通道交互注意力机制能根据每个特征图,结合与其全部通道中最与之相关的N个特征通道,并且使用卷积的方式,自适应迭代参数提取出相关的特征信息,最后通过sigmoid得到特征通道间的权重分布,加强网络中对分类有帮助的特征通道,抑制对分类没有帮助的特征通道。
进一步的,通过使用验证数据集,能实时得到网络反馈,验证网络在未知数据上的分类表现,从而判断网络是否存在过拟合等现象。
综上所述,本发明采用了全局通道交互注意力机制,在网络训练的过程中,不断地加强对分类有帮助的特征通道,抑制对分类无用的特征通道,这与普通的卷积神经网络相比鲁棒性更强,稳定性更高,大大提高了分类精度。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
图1为本发明的实现流程图;
图2为本发明的自适应邻域选择示意图;
图3为采用本发明方法的分类结果图。
具体实施方式
本发明提供了一种残差网络多光谱图像地物分类方法,从数据集中读入多光谱图像;对数据进行归一化操作;对多光谱图像进行SLIC超像素,对图像中的边缘像素点使用自适应邻域选择策略进行取块建立数据集,建立训练集,验证集和测试集;构造基于全局通道交互注意力机制的残差网络的分类模型;用训练数据集对分类模型进行训练,同时使用验证集实时验证网络分类精度;最后利用训练好的分类模型对测试数据集分类。本发明引入自适应像素邻域选择,得到更具有辨别性的样本块,并且利用全局交互注意力机制对网络特征通道进行权重调整,加强网络鲁棒性,大大提高了分类精度。
请参阅图1,本发明一种残差网络多光谱图像地物分类方法,包括以下步骤:
S1、从数据集中读入多光谱影像,其中包括QuickBird卫星数据、DEMIMOS-2卫星数据以及对应的只有部分区域的类标ground truth图,这两个传感器卫星数据图和groundtruth图对应的是同一个城市的地物,且对应位置也已配准。
将数据集包含有的Vancouver Level 1B、Vancouver Level 1c、Xi’an suburbarea、Xi’an urban area等四个数据集和与之对应的ground truth类标图。
S2、数据归一化
分别对QuickBird卫星数据、DEMIMOS-2卫星数据图像进行归一化处理。采用min-max标准化,对原始数据进行线性变化,使结果值映射到0到1之间。
转换函数如下:
Figure BDA0002355823500000081
由于各个城市像素值分布差异较大,为了使不同城市同一类别的像素值处于同一数量级且相对关系不变,因此对每个波段进行归一化处理。综合考虑所有城市所有时段同一波段的图像数据,观察每个波段像素值的分布,发现存在极少部分像素值很大或者很小的像素点,将这些像素点归一化后的值赋为0或1,然后根据大部分像素值的分布情况确定用于归一化的最大值和最小值。经过归一化处理后,图像矩阵中的所有像素点的像素值被归一化到[0,1]之间。
S3、使用自适应选择邻域策略建立数据集
S301、对多光谱图像使用SLIC超像素,得到超像素类标数据图;
S302、计算每个超像素标记数据图中每个超像素块的质心坐标;
Figure BDA0002355823500000082
其中,(xi,yi)是超像素块质心坐标,(xk,yk)是超像素块中像素点坐标,n代表超像素块中像素点个数;
S303、按梯度公式计算超像素类标数据图每一点的梯度,若某一个点水平梯度
Figure BDA0002355823500000083
或竖直梯度
Figure BDA0002355823500000084
为0,则该点为超像素图块边缘点并保存像素点坐标:
Figure BDA0002355823500000085
其中,
Figure BDA0002355823500000086
水平方向两点类标差值,
Figure BDA0002355823500000087
竖直方向两点类标差值,
Figure BDA0002355823500000088
S304、计算超像素标记图中每个SLIC超像素图块质心与边缘像素点的距离:
Figure BDA0002355823500000089
其中,di第i点和质心的距离,(x,y)为质心点坐标,(xi,yi)是第i个边缘像素点坐标;
S305、将边缘点像素坐标和当前超像素块质心坐标相连,以竖直方向为轴,得到角度α;
S306、根据计算的得到的距离,计算边缘像素点改变的距离,得到改变后的边缘像素点坐标:
Figure BDA0002355823500000091
其中,
Figure BDA0002355823500000092
为改变后的点坐标,(xi,yi)是边缘像素点坐标,S是设定的超像素块尺寸大小,α是像素点与质心的角度;
S4、建立训练集,测试集和验证集。
S401、对每一幅多光谱影像进行边缘扩充操作。由于采用的是逐像素滑窗操作选取样本块,为了使原始图像的边缘点也能进行滑窗操作,所以这里边缘填充的大小为滑窗操作所选窗口的边长的一半;
S402、在归一化后的图像中找到有对应类标的像素点,以像素点为中心截取邻域为120×120的区域,然后将区域逆时针旋转角度α(根据步骤S306计算得出),再以像素点为中心截取大小为32×32的邻域作为样本块,每个块的邻域都是为中心点的分类所服务;
S403、将四个数据集Vancouver Level 1B、Vancouver Level 1c、Xi’an suburbarea、Xi’an urban area,分别进行训练样本,测试样本和验证样本的选取;
S404、由于存在类别不平衡的问题,所以采用等比采样的方式选取不同类别的训练样本。按照等比取点的方式,每类选取20%个样本作为训练集,10%为测试集,剩余70%为验证集;
S5、构造全局通道交互注意力机制的残差神经网络的分类模型。
S501、网络分为三部分,共有十八个层的残差神经网络,第一部分是一个卷积核个数为16,卷积核大小为5*5,步长为1的卷积层,第二部分是由8个残差元堆叠的中间层,每个残差元有两个卷积层,总共16个卷积层,第三部分是全连接层,将第17层的网络输出进行全局平均池化(global average pooling),再连接上一个输出为8的全连接层,然后使用sigmoid函数得到最后的分类结果,如图3所示;
S502、在网络的第二部分,即残差元堆叠部分,每层网络会输出一个大小为B×N×H×W的特征图(feature map),对其进行全局平均池化(global average pooling),得到一个大小B×N×1×1特征向量;
Figure BDA0002355823500000101
其中,ni,j是一个N×N的矩阵,循环B次,得到一个大小为B×N×N的相关矩阵;
S503、其中N×N矩阵的第i行中最小的5个元素,代表着与xi最相关的5个通道,从B×N×1×1大小的特征向量提取这5个相关通道的值,循环B×N次得到一个大小为B×5N×1×1的特征向量;
S504、将上述结果作为输入,输入到卷积核尺寸为5,卷积核步长为5的卷积层中,得到一个B×N×1×1输出,再经过一个sigmoid函数,得到B×N大小且输出值分布为[0,1]的通道注意力权重(attention map);
S505、将通道注意力权重与网络每一层输出的特征图相乘,通过注意力权重加强对分类有帮助的通道,抑制对分类没有帮助的通道;
S506、通道每层的参数如下:
初始输入为大小32*32的MS图块,
第1层为卷积层,输入尺寸为32*32,输出尺寸为32*32,卷积核个数为16,卷积核大小为5*5,步长为1。
第2至5层为2个残差元堆叠构成;输入尺寸为32*32,输出尺寸为16*16,卷积核个数为32,卷积核大小为3*3,步长1(第二个残差元步长为2),每个卷积层后接一个全局通道交互注意力机制调整输出特征图的权重值;
第6至9层为2个残差元堆叠构成;输入尺寸为16*16,输出尺寸为8*8,卷积核个数为64,卷积核大小为3*3,步长为1(第二个残差元步长为2),每个卷积层后接一个全局通道交互注意力机制调整输出特征图的权重值;
第10至13层为2个残差元堆叠构成;输入尺寸为8*8,输出尺寸为4*4,卷积核个数为128,卷积核大小为3*3,步长为1(第二个残差元步长为2),每个卷积层后接一个全局通道交互注意力机制调整输出特征图的权重值;
第14至17层为2个残差元堆叠构成;输入尺寸为4*4,输出尺寸为2*2,卷积核个数为256,卷积核大小为3*3,步长为1(第二个残差元步长为2),每个卷积层后接一个全局通道交互注意力机制调整输出特征图的权重值,全局池化输出,输入为2*2*256,输出为256;
第18层为全连接层,输入为256,输出为8;
残差元结构如下:
第一步是卷积层,卷积核大小为3*3,步长为1;
第二步是使用relu的激活函数;
第三步是卷积层,卷积核大小为3*3,步长为1(或2);
第四步是将第三步卷积层的输出与第一步的输入相加(步长为2时,先将第一步输入进行zero padding调整尺寸,再相加);
第五步是使用relu的激活函数;
S7、用训练数据集对分类模型进行训练,通过输入训练数据集得到网络得分类结果后,与地面实况图(ground truth)上所对应的真实类标作对比,计算所得的损失函数并根据损失函数使用随机梯度下降法进行反向传播,来优化分类模型的网络参数,每训练50代后利用验证数据集实时验证网络分类精度,最后得到训练好的分类模型;
S8、利用训练好的分类模型对测试数据集进行分类。
将测试数据集的样本块作为训练好的分类模型的输入,训练好的分类模型的输出为测试数据集中每个像素点进行分类得到的分类类别。
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中的描述和所示的本发明实施例的组件可以通过各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
仿真条件:
硬件平台为:Intel(R)Xeon(R)CPU E5-2630,2.40GHz×16,内存为64G。
软件平台为:PyCharm。
仿真内容与结果:
本发明仿真实验的多光谱图像有2016年IEEE GRSS数据融合大赛数据集DEMIMOS-2卫星数据和实验室购买的QuickBird卫星数据两个传感器卫星数据图,具体包括Vancouver Level 1B、Vancouver Level 1c、Xi’an suburb area、Xi’an urban area等4张多光谱图像,对于QuickBird卫星数据中,Xi’an urban area具有以2.44m的分辨率,图像大小为1650*1550*4个像素点,包含R,G,B,NIR等4个多光谱带;DEMIMOS-2卫星数据VancouverLevel 1B一共有3249*2928*4个像素点,包含R,G,B,NIR等4个多光谱带。用本发明方法在上述仿真条件下进行实验,得到如图2的分类结果。
本发明的仿真实验是将待分类的多光谱图像中的地物分为8类。
表一是分别F1为采用残差网络方法(使用Resnet18为分类网咯)、F2全局通道交互注意力机制的残差网络方法、F3采用基于自适应邻域选择的全局通道交互注意力机制的残差网络方法对多光谱影像中地物分类准确率的统计。
表1.三种方法在仿真中得到的分类正确率
仿真算法 分类正确率(%)
F1 95.19
F2 96.32
F3 99.13
从表1中可以看出,用本发明方法相比于其他两种方法,在分类精度上有了较大的提高,这主要是因为对样本邻域进行自适应选择,得到有辨别性的邻域信息;并且利用全局通道交互注意力机制加强对分类有帮助的特征通道,抑制对分类没用的特征通道,使得网络有效且更具有鲁棒性,得到更高的分类准确率。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上内容仅为说明本发明的技术思想,不能以此限定本发明的保护范围,凡是按照本发明提出的技术思想,在技术方案基础上所做的任何改动,均落入本发明权利要求书的保护范围之内。

Claims (10)

1.一种残差网络多光谱图像地物分类方法,其特征在于,从数据集中读入多光谱图像;对数据进行归一化操作;对多光谱图像进行SLIC超像素,对图像中的边缘像素点使用自适应邻域选择策略进行取块建立数据集,建立训练集,验证集和测试集;构造基于全局通道交互注意力机制的残差网络的分类模型;用训练数据集对分类模型进行训练,同时使用验证集实时验证网络分类精度;最后利用训练好的分类模型对测试数据集分类。
2.根据权利要求1所述的残差网络多光谱图像地物分类方法,其特征在于,多光谱图像包括QuickBird卫星数据、DEMIMOS-2卫星数据以及对应的只有部分区域的类标groundtruth图。
3.根据权利要求1所述的残差网络多光谱图像地物分类方法,其特征在于,归一化操作具体为,采用min-max标准化,对原始数据进行线性变化,使结果值映射到0到1之间。
4.根据权利要求1所述的残差网络多光谱图像地物分类方法,其特征在于,使用自适应邻域选择策略进行取块具体为:
S301、对多光谱图像使用SLIC超像素,得到超像素类标数据图;
S302、计算每个超像素标记数据图中每个超像素块的质心坐标;
S303、计算超像素类标数据图每一点的梯度,若某一个点水平梯度
Figure FDA0002355823490000011
或竖直梯度
Figure FDA0002355823490000012
为0,则该点为超像素图块边缘点并保存像素点坐标;
S304、计算超像素标记图中每个SLIC超像素图块质心与边缘像素点的距离;
S305、将边缘点像素坐标和当前超像素块质心坐标相连,以竖直方向为轴,得到角度α;
S306、根据计算的得到的距离,计算边缘像素点改变的距离,得到改变后的边缘像素点坐标。
5.根据权利要求4所述的残差网络多光谱图像地物分类方法,其特征在于,步骤S302中,超像素块质心坐标(xi,yi)为:
Figure FDA0002355823490000021
其中,(xk,yk)是超像素块中像素点坐标,n代表超像素块中像素点个数。
6.根据权利要求1所述的残差网络多光谱图像地物分类方法,其特征在于,建立训练集,测试集和验证集具体为:
S401、对每一幅多光谱影像进行边缘扩充操作,边缘填充的大小为滑窗操作所选窗口的边长的一半;
S402、在归一化后的图像中找到有对应类标的像素点,以像素点为中心截取邻域为120×120的区域,然后将区域逆时针旋转角度α,再以像素点为中心截取大小为32×32的邻域作为样本块,每个块的邻域都是为中心点的分类所服务;
S403、将四个数据集Vancouver Level 1B、Vancouver Level 1c、Xi’an suburb area、Xi’an urban area,分别进行训练样本,测试样本和验证样本的选取;
S404、采用等比采样的方式选取不同类别的训练样本,每类选取20%个样本作为训练集,10%为测试集,剩余70%为验证集。
7.根据权利要求1所述的残差网络多光谱图像地物分类方法,其特征在于,全局通道交互注意力机制的残差神经网络的分类模型包括三部分,共有十八个层的残差神经网络,第一部分是卷积层,第二部分是由8个残差元堆叠的中间层,每个残差元有两个卷积层,总共16个卷积层,第三部分是全连接层,将第17层的网络输出进行全局平均池化,再连接上一个输出为8的全连接层,然后使用sigmoid函数得到最后的分类结果。
8.根据权利要求7所述的残差网络多光谱图像地物分类方法,其特征在于,通道每层的参数如下:
初始输入为大小32*32的MS图块,第1层为卷积层,输入尺寸为32*32,输出尺寸为32*32,卷积核个数为16,卷积核大小为5*5,步长为1;第2至5层为2个残差元堆叠构成;输入尺寸为32*32,输出尺寸为16*16,卷积核个数为32,卷积核大小为3*3,步长1,第二个残差元步长为2,每个卷积层后接一个全局通道交互注意力机制调整输出特征图的权重值;第6至9层为2个残差元堆叠构成;输入尺寸为16*16,输出尺寸为8*8,卷积核个数为64,卷积核大小为3*3,步长为1,第二个残差元步长为2,每个卷积层后接一个全局通道交互注意力机制调整输出特征图的权重值;第10至13层为2个残差元堆叠构成;输入尺寸为8*8,输出尺寸为4*4,卷积核个数为128,卷积核大小为3*3,步长为1,第二个残差元步长为2,每个卷积层后接一个全局通道交互注意力机制调整输出特征图的权重值;第14至17层为2个残差元堆叠构成;输入尺寸为4*4,输出尺寸为2*2,卷积核个数为256,卷积核大小为3*3,步长为1,第二个残差元步长为2,每个卷积层后接一个全局通道交互注意力机制调整输出特征图的权重值,全局池化输出,输入为2*2*256,输出为256;第18层为全连接层,输入为256,输出为8;
残差元结构如下:
第一步是卷积层,卷积核大小为3*3,步长为1;第二步是使用relu的激活函数;第三步是卷积层,卷积核大小为3*3,步长为1或2;第四步是将第三步卷积层的输出与第一步的输入相加,当步长为2时,先将第一步输入进行zeropadding调整尺寸,再相加;第五步是使用relu的激活函数。
9.根据权利要求1所述的残差网络多光谱图像地物分类方法,其特征在于,使用验证集实时验证网络分类精度具体为:
用训练数据集对分类模型进行训练,通过输入训练数据集得到网络得分类结果后,与地面实况图上所对应的真实类标作对比,计算所得的损失函数并根据损失函数使用随机梯度下降法进行反向传播,优化分类模型的网络参数,每训练50代后利用验证数据集实时验证网络分类精度,最后得到训练好的分类模型。
10.根据权利要求1所述的残差网络多光谱图像地物分类方法,其特征在于,对测试数据集进行分类具体为:
将测试数据集的样本块作为训练好的分类模型输入,训练好的分类模型输出为测试数据集中每个像素点进行分类得到的分类类别。
CN202010007512.6A 2020-01-04 2020-01-04 一种残差网络多光谱图像地物分类方法 Active CN111199214B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010007512.6A CN111199214B (zh) 2020-01-04 2020-01-04 一种残差网络多光谱图像地物分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010007512.6A CN111199214B (zh) 2020-01-04 2020-01-04 一种残差网络多光谱图像地物分类方法

Publications (2)

Publication Number Publication Date
CN111199214A true CN111199214A (zh) 2020-05-26
CN111199214B CN111199214B (zh) 2023-05-05

Family

ID=70744495

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010007512.6A Active CN111199214B (zh) 2020-01-04 2020-01-04 一种残差网络多光谱图像地物分类方法

Country Status (1)

Country Link
CN (1) CN111199214B (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111523521A (zh) * 2020-06-18 2020-08-11 西安电子科技大学 一种双支路融合多尺度注意神经网络的遥感图像分类方法
CN111738213A (zh) * 2020-07-20 2020-10-02 平安国际智慧城市科技股份有限公司 人物属性识别方法、装置、计算机设备及存储介质
CN112472048A (zh) * 2021-01-15 2021-03-12 郑州大学 用于心血管疾病患者脉象识别的神经网络结构
CN112507853A (zh) * 2020-12-02 2021-03-16 西北工业大学 一种基于互注意力机制的跨模态行人重识别方法
CN112560967A (zh) * 2020-12-18 2021-03-26 西安电子科技大学 一种多源遥感图像分类方法、存储介质及计算设备
CN112861802A (zh) * 2021-03-16 2021-05-28 吉林大学 基于时空深度学习融合技术的农作物全自动化分类方法
CN113111970A (zh) * 2021-04-30 2021-07-13 陕西师范大学 通过构建全局嵌入式注意力残差网络对图像分类的方法
CN113223068A (zh) * 2021-05-31 2021-08-06 西安电子科技大学 一种基于深度全局特征的多模态图像配准方法及系统
CN113240017A (zh) * 2021-05-18 2021-08-10 西安理工大学 一种基于注意力机制的多光谱和全色图像分类方法
CN113537410A (zh) * 2021-09-14 2021-10-22 征图新视(江苏)科技股份有限公司 一种通用的深度学习正样本自动均衡方法
CN114067313A (zh) * 2021-11-19 2022-02-18 云南农业大学 一种双线性残差网络模型的农作物叶部病害识别方法
CN114264626A (zh) * 2021-12-18 2022-04-01 复旦大学 一种基于时间序列残差网络的织物无损定量分析方法
CN114693670A (zh) * 2022-04-24 2022-07-01 西京学院 基于多尺度U-Net的直缝埋弧焊管焊缝缺陷超声检测方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9819916D0 (en) * 1997-09-30 1998-11-04 Ricoh Kk An improved compression and decompression system with reversible wavelets and lossy reconstruction
CN108830330A (zh) * 2018-06-22 2018-11-16 西安电子科技大学 基于自适应特征融合残差网的多光谱图像分类方法
WO2018214195A1 (zh) * 2017-05-25 2018-11-29 中国矿业大学 一种基于卷积神经网络的遥感图像桥梁检测方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9819916D0 (en) * 1997-09-30 1998-11-04 Ricoh Kk An improved compression and decompression system with reversible wavelets and lossy reconstruction
WO2018214195A1 (zh) * 2017-05-25 2018-11-29 中国矿业大学 一种基于卷积神经网络的遥感图像桥梁检测方法
CN108830330A (zh) * 2018-06-22 2018-11-16 西安电子科技大学 基于自适应特征融合残差网的多光谱图像分类方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
戴玉超;张静;FATIH PORIKLI;何明一;: "深度残差网络的多光谱遥感图像显著目标检测" *

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111523521A (zh) * 2020-06-18 2020-08-11 西安电子科技大学 一种双支路融合多尺度注意神经网络的遥感图像分类方法
CN111523521B (zh) * 2020-06-18 2023-04-07 西安电子科技大学 一种双支路融合多尺度注意神经网络的遥感图像分类方法
CN111738213A (zh) * 2020-07-20 2020-10-02 平安国际智慧城市科技股份有限公司 人物属性识别方法、装置、计算机设备及存储介质
CN111738213B (zh) * 2020-07-20 2021-02-09 平安国际智慧城市科技股份有限公司 人物属性识别方法、装置、计算机设备及存储介质
CN112507853A (zh) * 2020-12-02 2021-03-16 西北工业大学 一种基于互注意力机制的跨模态行人重识别方法
CN112507853B (zh) * 2020-12-02 2024-05-14 西北工业大学 一种基于互注意力机制的跨模态行人重识别方法
CN112560967A (zh) * 2020-12-18 2021-03-26 西安电子科技大学 一种多源遥感图像分类方法、存储介质及计算设备
CN112560967B (zh) * 2020-12-18 2023-09-15 西安电子科技大学 一种多源遥感图像分类方法、存储介质及计算设备
CN112472048A (zh) * 2021-01-15 2021-03-12 郑州大学 用于心血管疾病患者脉象识别的神经网络结构
CN112472048B (zh) * 2021-01-15 2023-10-24 郑州大学 用于心血管疾病患者脉象识别的神经网络的实现方法
CN112861802B (zh) * 2021-03-16 2022-09-27 吉林大学 基于时空深度学习融合技术的农作物全自动化分类方法
CN112861802A (zh) * 2021-03-16 2021-05-28 吉林大学 基于时空深度学习融合技术的农作物全自动化分类方法
CN113111970A (zh) * 2021-04-30 2021-07-13 陕西师范大学 通过构建全局嵌入式注意力残差网络对图像分类的方法
CN113111970B (zh) * 2021-04-30 2023-12-26 陕西师范大学 通过构建全局嵌入式注意力残差网络对图像分类的方法
CN113240017A (zh) * 2021-05-18 2021-08-10 西安理工大学 一种基于注意力机制的多光谱和全色图像分类方法
CN113240017B (zh) * 2021-05-18 2023-09-12 西安理工大学 一种基于注意力机制的多光谱和全色图像分类方法
CN113223068A (zh) * 2021-05-31 2021-08-06 西安电子科技大学 一种基于深度全局特征的多模态图像配准方法及系统
CN113223068B (zh) * 2021-05-31 2024-02-02 西安电子科技大学 一种基于深度全局特征的多模态图像配准方法及系统
CN113537410B (zh) * 2021-09-14 2021-12-07 征图新视(江苏)科技股份有限公司 一种通用的深度学习正样本自动均衡方法
CN113537410A (zh) * 2021-09-14 2021-10-22 征图新视(江苏)科技股份有限公司 一种通用的深度学习正样本自动均衡方法
CN114067313A (zh) * 2021-11-19 2022-02-18 云南农业大学 一种双线性残差网络模型的农作物叶部病害识别方法
CN114264626A (zh) * 2021-12-18 2022-04-01 复旦大学 一种基于时间序列残差网络的织物无损定量分析方法
CN114693670A (zh) * 2022-04-24 2022-07-01 西京学院 基于多尺度U-Net的直缝埋弧焊管焊缝缺陷超声检测方法

Also Published As

Publication number Publication date
CN111199214B (zh) 2023-05-05

Similar Documents

Publication Publication Date Title
CN111199214B (zh) 一种残差网络多光谱图像地物分类方法
CN111523521B (zh) 一种双支路融合多尺度注意神经网络的遥感图像分类方法
CN112084869B (zh) 一种基于紧致四边形表示的建筑物目标检测方法
Costea et al. Creating roadmaps in aerial images with generative adversarial networks and smoothing-based optimization
Ma et al. Adaptive multiobjective memetic fuzzy clustering algorithm for remote sensing imagery
CN113223068B (zh) 一种基于深度全局特征的多模态图像配准方法及系统
CN111062885B (zh) 基于多阶段迁移学习的标志检测模型训练及标志检测方法
CN111259906A (zh) 含多级通道注意力的条件生成对抗遥感图像目标分割方法
CN111291826A (zh) 基于相关性融合网络的多源遥感图像的逐像素分类方法
CN111191735B (zh) 基于数据差异和多尺度特征的卷积神经网络影像分类方法
CN113610905B (zh) 基于子图像匹配的深度学习遥感图像配准方法及应用
CN113095371B (zh) 一种面向三维重建的特征点匹配方法及系统
CN111860124A (zh) 基于空谱胶囊生成对抗网络的遥感图像分类方法
CN111582091A (zh) 基于多分支卷积神经网络的行人识别方法
Yang et al. Toward country scale building detection with convolutional neural network using aerial images
CN115937552A (zh) 一种基于融合手工特征与深度特征的图像匹配方法
CN110334628B (zh) 一种基于结构化随机森林的室外单目图像深度估计方法
CN107704509A (zh) 一种联合稳定区域与深度学习的重排序方法
CN112418256A (zh) 分类、模型训练、信息搜索方法、系统及设备
CN107392926B (zh) 基于前期土地专题图的遥感影像特征选择方法
CN111914809A (zh) 目标对象定位方法、图像处理方法、装置和计算机设备
Elashry et al. Feature matching enhancement using the graph neural network (gnn-ransac)
Li et al. A new algorithm of vehicle license plate location based on convolutional neural network
CN113989671A (zh) 基于语义感知与动态图卷积的遥感场景分类方法及系统
CN114943766A (zh) 重定位方法、装置、电子设备及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant