CN108596248B - 一种基于改进深度卷积神经网络的遥感影像分类方法 - Google Patents
一种基于改进深度卷积神经网络的遥感影像分类方法 Download PDFInfo
- Publication number
- CN108596248B CN108596248B CN201810368763.XA CN201810368763A CN108596248B CN 108596248 B CN108596248 B CN 108596248B CN 201810368763 A CN201810368763 A CN 201810368763A CN 108596248 B CN108596248 B CN 108596248B
- Authority
- CN
- China
- Prior art keywords
- remote sensing
- sensing image
- convolution
- neural network
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
- G06V10/462—Salient features, e.g. scale invariant feature transforms [SIFT]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明涉及一种基于改进深度卷积神经网络的遥感影像分类方法,所述遥感分类方法包括以下步骤:步骤S1、基于瓶颈单元的遥感特征影像降维;步骤S2、基于分组卷积的遥感特征影像卷积多通道优化;步骤S3、基于通道洗牌的遥感特征影像特征提取能力改进;步骤S4、面向遥感影像空间位置特征的波段化处理。其优点表现在:实现了对待输入遥感影像的降维,降低深度卷积神经网络遥感影像分类方法训练时的卷积计算量;同时,针对遥感影像的空间相关性,构建通道洗牌结构,提升分组卷积阶段神经网络的特征提取能力。针对遥感影像的空间位置特征,提高了可深度卷积神经网络模型对遥感影像的空间位置特征识别度。
Description
技术领域
本发明涉及遥感影像技术领域,具体地说,是一种基于改进深度卷积神经网络的遥感影像分类方法。
背景技术
上世纪70年代初,美国率先开展了地球资源卫星计划,开始对地球表面进行远距离、非接触观测,在其带动下,世界范围内基于多平台的对地观测技术获得了飞速发展。我国《国家中长期科技发展规划纲要(2006-2020)》明确地指出要建成多光谱段、不同轨道高度且具有全天时、全天候、全球观测能力的先进对地观测系统,到十三五末期形成具有独立知识产权的空间信息产业链。快速发展的对地观测技术使得遥感影像的获取方式越来越多样,获取速度越来越快。在生产生活和科学研究中,为了更充分地利用遥感影像的信息,需要对其进行不同层面的分类、解译等。因此,遥感影像的解译效率成为制约遥感影像使用时效性的关键问题之一。
近年来随着深度学习技术的发展,深度学习方法在图像识别、分类、分割等方面取得了巨大突破。深度学习开源框架的出现,降低了深度学习方法的工程开发难度,使得越来越多的学者在分析遥感影像时倾向于采用深度学习方法。
深度学习方法在图像处理上应用最广的是卷积神经网络。上世纪60年代, Hubel等发现了生物视觉的认知机制,受此启发,1980年Fukushima提出了卷积神经网络的前身——neocognitron。1985年,Hinton等提出了后向传播算法,为深度学习模型参数的训练优化奠定了基础。1998年,LeCun利用BP 算法训练6层卷积神经网络LeNet用于识别手写数字,取得了当时世界上最好的识别结果,并广泛应用于各大银行支票的手写数字识别任务中。然而,由于缺乏大规模数据的训练和计算机的硬件限制,LeNet对于复杂问题的处理结果并不理想。21世纪初,研究者们设计很多方法试图克服深度卷积神经网络训练难的问题。Krizhevsky等在2012年提出了深度卷积神经网络AlexNet,并在图像识别任务上取得了重大突破。在当年的ImageNet图像分类竞赛中,AlexNet 模型取得了冠军,且top-5错误率与上一年的冠军相比,下降了十个百分点。AlexNet与LeNet类似,但网络深度更深,借助两块GPU实现了对8层卷积神经网络的分布训练。此后在图像分类上,以深度卷积神经网络为代表的深度学习方法得到了快速发展,2014年VGG网络将大型的卷积核替换为较小卷积核,实现19层的卷积神经网络;同年GoogleNet系列开始相继提出,GoogleNet 的开发者们在卷积结构中加入Inception模块,使卷积神经网络的宽度和深度都得到提升,平衡了深度和宽度,使流入网络的信息最大化。2015年,He等人提出152层的残差网络ResNet,在ILSVRC和COCO 2015上的五个主要任务中都获得了第一名的成绩。在ILSVRC上更取得了3.57%的整体错误率,超过了人类平均水平5%的错误率。随着在图像分类上取得的巨大成功,研究者逐步使用深度学习方法解决更复杂的问题,RCNN、fast-RCNN、faster-RCNN等逐步解决了图像识别与定位问题,FCN、U-Net、SegNet等实现了图像的语义分割, Mask-RCNN、Maskx-RCNN等实现了图像定位与分割问题的结合,几乎达到了分割万物的效果。
伴随卷积神经网络在图像处理领域的巨大成功,国内外学者已开始将深度学习技术应用到遥感影像中,比如遥感影像的图像解译、地物分类、参数反演以及目标检测识别等,并在多种类型的遥感影像如可见光、远红外、高光谱、高分辨率影像上开展了对应的研究。
党宇等基于面向对象的图斑分类体系,引入AlexNet模型实现对土地利用类型的分类评价验证;陈睿敏等借助随机剪裁和增强处理,扩充了训练数据,然后搭建U-Net深度学习模型,实现红外遥感影像的特征信息的自动提取;牛新等使用迁移AlexNet,用少量训练样本加以微调,构建了一个级联式的遥感影像的机场与飞行器目标秒级识别系统;杜艳玲等利用卷积神经网络对西沙、南沙群岛海域的中尺度涡进行了高精度识别。Wang等利用卷积神经网络实现了高分辨下雷达图像下海冰的识别;Lima等对卷积神经网络对海洋类型信息的识别进行了研究、比较;Castelluccio等采用GoogleNet和CaffeNet网络通过对三个不同模态图像的学习,更广泛地提取图像特征,取得了效果显著的分类效果;Scott等专门针对遥感影像进行数据扩充,极大地扩展了小的训练图像数据集,提高了深度卷积神经网络对遥感影像数据的鲁棒性在,UC Merced数据集,以ResNet深度网络分类模型达到的了98%的土地覆被分类精度。
深度卷积神经网络等深度学习方法在遥感影像处理上的应用已取得了较大的进步,但这些应用更多地集中在直接使用深度卷积神经网络进行遥感分类、目标识别等。而以深度卷积神经网络为代表的深度学习方法多以常规图像为学习对象,但遥感影像以多光谱、高光谱图像为主,其具有多光谱特性和空间位置特征,现有深度卷积神经网络直接用于遥感影像的分类,将产生大量的模型参数,加重计算负担,降低训练速度。
中国专利文献CN201511026790.1,申请日20151231,专利名称为:一种基于深度学习的大规模遥感影像目标自动识别方法,公开了一种大规模遥感影像目标识别方法,包括:采用深度神经网络对训练遥感影像进行训练,对训练好的深度神经网络添加一个目标分类层,再对该深度神经网络进行调整,得到最优的深度神经网络,通过该最优的深度神经网络对大规模遥感影像进行目标自动识别。
上述专利文献的基于改进深度卷积神经网络的遥感影像分类方法,能快速和准确的完成大规模遥感影像特征提取,提高特征对遥感影像的光照、角度、尺度和背景等复杂变化的反应性,进而提高大规模遥感影像目标识别的效率。但是,关于一种能够减少计算资源消耗,保证特征提取效果,提高空间位置特征识别度的技术方案则无相应的公开。
综上所述,需要一种能够减少计算资源消耗,保证特征提取效果,提高空间位置特征识别度的基于改进深度卷积神经网络的遥感影像分类方法,而关于这种遥感影像分类方法目前还未见报道。
发明内容
本发明的目的是针对现有技术中的不足,提供一种能够减少计算资源消耗,保证特征提取效果,提高空间位置特征识别度的基于改进深度卷积神经网络的遥感影像分类方法。
本发明的再一的目的是,提供一种基于改进深度卷积神经网络的遥感影像分类方法的分类流程。
为实现上述目的,本发明采取的技术方案是:
一种基于改进深度卷积神经网络的遥感影像分类方法,其特征在于,所述遥感分类方法包括以下步骤:
步骤S1、基于瓶颈单元的遥感特征影像降维;
步骤S2、基于分组卷积的遥感特征影像卷积多通道优化;
步骤S3、基于通道洗牌的遥感特征影像特征提取;
步骤S4、面向遥感影像空间位置特征的波段化处理。
作为一种优选的技术方案,步骤S1中瓶颈单元是卷积核为1×1的卷积运算,具有12个通道的特征影像经过4个1×1卷积核的卷积后被降维至4通道,然后再经过12个3×3卷积核的卷积得到12个通道的输出特征影像。
作为一种优选的技术方案,步骤S2中分组卷积首先对输入的特征通道进行分组,此时卷积运算将不直接对所有通道进行卷积操作,而在每个组内进行分别进行卷积运算,并输出该组的卷积结果,最后对所有的输出特征影像进行通道连接作为本层的输出。
作为一种优选的技术方案,步骤S2中在分组卷积的基础之上,对瓶颈单元的输出结果使用极限的分组卷积降低卷积运算的参数量。
作为一种优选的技术方案,极限分组卷积的分组数和输入的特征影像的通道数相同,每个卷积核只负责一个通道的卷积运算。
作为一种优选的技术方案,步骤S3中通道洗牌操作对原有的波段排列方式进行重排列,按固定的波段间隔选择波段。
作为一种优选的技术方案,步骤S4中将遥感影像的经度和维度信息分类转化为类似光谱信息的存储方式,生成了两个新的波段,并把该两个波段将与光谱波段一同输入卷积神经网络进行训练,具体包括以下步骤:
步骤S41、对像素点通过以下公式进行空间定位:
式中x是遥感影像中某像素所在的列数;y是图像中某像素所在的行数; xl为该像素所对应的经度坐标;yb为该像素所对应的纬度坐标;A是图像中像素x方向的比例参数,代表了单个像素在南北方向实际范围;E是图像中像素 y方向的比例参数,代表了单个像素在东西方向实际范围负值;B和D为旋转参数,分别代表像素因旋转在东向和北向产生的距离偏移值;C和F是图像左上角处像素的地理坐标;
步骤S42、根据以下公式计算像素中心点坐标:
其中,(x1,y1),(x2,y2),(x3,y3),(x4,y4)为该像素四个端点所在的经度和维度值,(X0,Y0)表示中心点坐标;
步骤S43、将X0和Y0分离,分别构成经度波段和维度波段,同其他光谱波段一起加入神经网络中进行训练。
为实现上述第二个目的,本发明采取的技术方案是:
一种利用至少一项上述实施例所述的基于改进深度卷积神经网络的遥感影像分类方法的分类方法,其特征在于,所述的分类流程包括以下步骤:
步骤S1、数据准备;
步骤S2、构建数据集;
步骤S21、在构建数据集时,原始遥感影像首先进行了空间位置信息的波段化处理,在读取每幅图像的坐标文件后,构建了所有像素点的经度波段和纬度波段,并将它们与遥感影像的原始光谱波段组合,然后一起输入神经网络进行特征提取;然后在遥感影像上裁剪选取含有岛屿的区域,此时两个空间信息波段也对应裁剪;
步骤S22、在数据集中标注图像时,首先手动勾取每一裁剪图像中的海岛轮廓线,提取海岛区域;然后将海洋区域设为背景,像素值设为0;最后将所有海岛区域的像素统一修改为1,完成标注;
步骤S3、实验环境选择;
步骤S4、海岛遥感影像分类方法的训练;
步骤S5、基于遥感影像分类方法的遥感影像分类。
作为一种优选的技术方案,步骤S4中具体包括以下步骤:
步骤S41、引入激活函数f(x)=σ(x),使神经网络可以逼近任意函数,并具体使用Rectified LinearUnit函数作为激活函数:
步骤S42、对神经网络的参数进行优化,优化方法为梯度下降方法:
步骤S43、数据集中遥感影像输入海岛分类网络训练时,每次50幅图像为一批次进行训练,训练时模型的学习率(learning rate)为10-5。
作为一种优选的技术方案,选择Adaptive Moment Estimation的优化方法提高梯度下降速度:
式中mt为梯度的第一时刻平均值,vt为梯度的第二时刻非中心方差值,它将每个参数的历史梯度平方均值存于vt中。
本发明优点在于:
1、本发明的一种基于改进深度卷积神经网络的遥感影像分类方法,针对遥感影像分类方法在深度卷积神经网络中训练难的问题,对卷积运算进行了改进。改进后的卷积运算在卷积过程中加入瓶颈单元实现遥感影像的波段降维,并结合分组卷积进一步降低卷积运算中模型参数的产生,减少计算资源消耗;在波段分组阶段加入通道洗牌操作,保证特征提取效果;且对遥感影像空间位置信息进行了波段化处理,使其与光谱波段一起加入深度卷积神经网络进行训练,实现卷积运算对遥感影像空间特征的提取。最终将改进后的卷积运算应用于U-Net网络中,实现了参数量更少、计算效率更高的遥感影像分类深度卷积神经网络,具有很高的实用价值。
2、基于遥感影像的波谱特征,通过设置瓶颈单元,实现待分类遥感影像的降维。
3、通过优化分组卷积,降低待分类遥感影像的卷积计算量。
4、通过构建通道洗牌结构,优化遥感影像分类的深度卷积神经网络结构;从而构建了遥感影像分类的深度卷积神经网络模型。
5、基于遥感影像的空间位置特征,将待训练的遥感影像进行“波段化”预处理,将遥感影像的空间位置特征转化为“经度波段”和“纬度波段”,从而与其他波段一起生成遥感影像分类深度卷积神经网络模型的输入参数,以提高了深度卷积神经网络模型对遥感影像分类的空间位置特征识别度。
6、本发明的深度卷积神经网络遥感影像分类方法减少了分类方法训练时参数量,提高了计算效率,主要适用于多波段遥感影像的地物类型,遥感影像波段数越多,其效率明显。
附图说明
附图1是瓶颈单元结构图。
附图2分组卷积结构图。
附图3深度可分离卷积结构图。
附图4普通分组方式及通道洗牌分组方式示意图。
附图5像素中心坐标表示示意图。
附图6基于改进深度卷积神经网络的遥感影像分类方法训练流程图
附图7改进深度卷积神经网络结构示意图。
附图8海岛遥感影像分类结果示意图。
附图9海岛遥感影像示意图。
附图10数据集构建过程示意图。(a)裁剪影像;(b)去除背景影像;(c) 标注影像。
附图11海岛分类数据集示意图。
附图12损失函数收敛过程示意图。
附图13海岛遥感影像分类结果示意图。
具体实施方式
下面结合附图对本发明提供的具体实施方式作详细说明。
一种基于改进深度卷积神经网络的遥感影像分类方法,该遥感影像分类方法主要体现在以下两方面:(1)针对遥感影像的多波谱特性,优化深度卷积神经网络的结构。在深度卷积神经网络的卷积结构中设置瓶颈单元,实现对待输入遥感影像的降维;通过分组卷积,降低深度卷积神经网络遥感影像分类方法训练时的卷积计算量;同时,针对遥感影像的空间相关性,构建通道洗牌结构,提升分组卷积阶段神经网络的特征提取能力。(2)针对遥感影像的空间位置特征,重构待分类的遥感影像数据。通过对遥感影像进行“波段化”预处理,使遥感影像的空间位置信息转化为“经度波段”和“纬度波段”,并使其与其他波段一起构成输入数据,以提高深度卷积神经网络模型对遥感影像的空间位置特征识别度。
所述的分类方法包括以下步骤:
骤1:基于瓶颈单元的遥感特征影像降维
瓶颈单元是卷积核为1×1的卷积运算。在深度卷积神经网络中,瓶颈单元在不同的通道上对每个像素点进行线性组合,并通过调控输出通道数实现降维目的。图1为瓶颈单元的结构图:
在图1中,具有12个通道的特征影像经过4个1×1卷积核的卷积后被降维至4通道,然后再经过12个3×3卷积核的卷积得到12个通道的输出特征影像。此过程与直接进行12个3×3的卷积核卷积相比节省了大量的计算资源,详见表1:
表1:瓶颈单元性能分析
从表1中可看到,若不使用瓶颈单元,卷积运算要产生参数1296个,进行乘法计算2100多万次;加入瓶颈单元后,卷积运算仅产生参数459个,参数量减少了65%,进行乘法计算780多万次,计算量减少了63%。
步骤2:基于分组卷积的遥感特征影像卷积多通道优化
在深度卷积神经网络结构中,当输入的特征影像为多通道时,卷积核需对所有输入通道进行卷积运算,而分组卷积主要改进在减少输入卷积核的通道数量。分组卷积首先对输入的特征通道进行分组,此时卷积运算将不直接对所有通道进行卷积操作,而在每个组内进行分别进行卷积运算,并输出该组的卷积结果,最后对所有的输出特征影像进行通道连接作为本层的输出。分组卷积的结构如图2。
图2中,在1×1的卷积运算后,分组卷积将128个通道的特征影像分为 32组。此时32个3×3大小的卷积核将分别对每个组内的特征影像进行卷积运算并输出4个通道的结果,最后所有输出结果进行通道连接作为最终的输出特征影像。这样的改进可使得参数量和计算量减少至原来的1/32。在分组卷积的基础上,我们对瓶颈单元的输出结果使用了极限的分组卷积进一步降低卷积运算的参数量。极限分组卷积又称深度可分离卷积,结构如图3。
极限分组卷积的分组数和输入的特征影像的通道数相同,每个卷积核只负责一个通道的卷积运算。在图3中,特征影像经过1×1卷积运算之后,对每一个降维后的通道分别进行3×3的独立卷积,最后进行波段连接,得到特征影像。
步骤3:基于通道洗牌的遥感特征影像特征提取能力改进
由步骤2可以看出,卷积运算中加入分组操作提高了卷积操作的计算效率。然而分组操作也产生了一个新的问题:特定的卷积核仅对特定通道的输入进行运算,阻碍了通道之间的信息流传递,分组数量增多,每个组的输入通道数量越少,将造成单个卷积核特征提取能力的退化,削弱了整体网络的表达能力。而在遥感影像特别是高光谱影像上这个问题又将被放大。
遥感影像的不同波段反映了不同光谱的反射信息,而且在构成遥感影像时,从第一波段到最后一个波段,其代表的光谱的波长从高到底连续排列。如图4所示,遥感影像中相近的波长反映的信息差别较小;反而波长相差越大,信息越丰富。若进行直接进行对波段进行分组,每个组只能对相近波长的几个波段进行特征提取,不能充分考虑其它波长相差较大的波段,因此导致组内特征提取能力将大大减弱。
为了解决这个问题,我们在卷积运算前,对输入的影像进行通道洗牌 (Shuffle)操作。通道洗牌结构如图4所示。
普通的分组方式直接按遥感影像的波段排列顺序或特征影像的排列顺序进行顺序分组,不利于特征提取。通道洗牌操作对原有的波段排列方式进行重排列,按固定的波段间隔选择波段,避免波谱信息接近的波段被分在同一组内,进而提高特征提取能力。以128波段,32组为例,通道洗牌分组时每隔4个波段选进行组合,得到最终的32组特征影像。
步骤4:面向遥感影像空间位置特征的波段化处理
遥感影像具有空间位置特征,但在卷积神经网络中空间特征的有效利用率远不如光谱特征。因为空间位置信息存储方式的不同,如果以计算卷积窗口内若干像素统计特征的方式进行特征提取,将忽略遥感影像的空间位置信息,降低遥感影像的信息利用效率,不利于遥感影像的特征提取。因而建立包含空间位置信息和波谱信息的特征提取系统已成必然。
为了在深度卷积神经网络中有效的利用遥感影像的空间位置信息,我们对遥感影像的空间位置信息进行波段化处理,将遥感影像的经度和维度信息分类转化为类似光谱信息的存储方式,生成了两个新的波段。这两个波段将与光谱波段一同输入卷积神经网络进行训练,提高分类方法的特征提取能力。
遥感影像数据的空间位置信息一般定义在头文件中(.hdr),以上海市 Landsat影像为例,该文件中与空间信息的相关的数据如下:
30.00000000000000----A
0.00000000000000----D
0.00000000000000----B
-30.00000000000000----E
308215.49790000000000----C
3530587.01400000000000-----F
像素点的空间定位通过(1)式来完成
式中x是遥感影像中某像素所在的列数;y是图像中某像素所在的行数; xl为该像素所对应的经度坐标;yb为该像素所对应的纬度坐标;A是图像中像素x方向的比例参数,代表了单个像素在南北方向实际范围;E是图像中像素 y方向的比例参数,代表了单个像素在东西方向实际范围负值;B和D为旋转参数,分别代表像素因旋转在东向和北向产生的距离偏移值;C和F是图像左上角处像素的地理坐标。
在空间位置位置信息波段化处理时,本文以像素的中心点坐标代表该像素的坐标信息。图5表示任意像素,图中(x1,y1),(x2,y2),(x3,y3),(x4,y4) 为该像素四个端点所在的经度和维度值,(X0,Y0)表示中心点坐标。
中心点坐标可由经公式(2)计算得出。最后将经度(X0)和纬度(Y0)分离,分别构成经度波段和维度波段,同其他光谱波段一起加入神经网络中进行训练。
一.卷积计算参数说明
卷积运算涉及的主要参数包括:(1)卷积核的大小k;(2)卷积步长s;(3) 填充数目p。
卷积运算的输出影像尺寸o为:
其中,o'为输入影像的尺寸。由此,卷积层间的参数量(忽略偏置项)为:
para=k2·Cl-1·Cl (4)
其中,Cl-1为输入影像的通道数,Cl为输出影像的通道数(卷积核的个数)。深度卷积神经网络中卷积运算的时间复杂度O(n)为:
深度卷积神经网络中卷积运算的的算法复杂度为:
其中,l是卷积层的索引值,d表示卷积的深度(层数)。ol为输出特征影像的尺寸。
二.结合附图6和图7对本发明进一步说明,基于改进深度卷积神经网络的遥感影像分类方法训练流程如下:
①鉴于遥感影像各波段间的信息冗余性,首先对输入的影像进行基于通道洗牌的波段重排列,以提高波谱信息的特征提取能力;
②鉴于遥感影像多波段性,基于分组卷积实现重排列后特征影像的分组,以降低卷积运算时的参数量和计算量;以图7中数据为例,结合卷积运算公式(3-6),针对通道重新排列的输入影像,分组卷积将256个通道分为32组,每组8通道;
③为提高计算效率,在各组内设置瓶颈单元结构,对组内的数据进行降维处理;降维后得到32组,每组4通道的特征影像;结合卷积运算公式 (3-6),计算此过程共产生参数1024个(32×8×1×1×4);
④对各组内降维后的结果进行极限分组卷积,进一步降低参数量和计算量;结合卷积运算公式(3-6),此过程中参数量为1152个(128×1×3×3×1);
⑤将极限分组卷积得到的128幅特征影像进行聚合连接,得到输出结果。
在图7中以256波段输入,128波段输出的情况下,结合卷积运算公式 (3-6),直接使用3×3卷积和的普通卷积方式则共产生参数294912个 (256×3×3×128),而改进的卷积结构模型参数总量为2176个(1024+1152),仅为原来的1/135。同时,在输入输出图像尺寸不变的情况下,改进后的卷积运算计算量可降低至原来的1/135。
三.结合附图8,以基于遥感影像的海岛快速分类为例,阐述了基于改进深度卷积神经网络的遥感影像分类方法的分类流程。
本实验构建了用于海岛分类的遥感影像数据集(1500例);并利用遥感影像分类深度卷积神经网络模型训练得到分类方法;使用分类方法对训练数据集之外的遥感影像中进行分类处理。具体如下:
步骤一:数据准备
本实验使用公开的遥感数据集,包括高分1号和landsat8卫星的影像。影像成像时间为2017年5月值2017年9月,所截取的海岛均位于我国东海海域。图9为截取的原始遥感影像图:
步骤二:构建数据
在构建数据集时,原始遥感影像首先进行了空间位置信息的波段化处理,在读取每幅图像的坐标文件后,构建了所有像素点的经度波段和纬度波段,并将它们与遥感影像的原始光谱波段组合,然后一起输入神经网络进行特征提取;然后在遥感影像上裁剪选取含有岛屿的区域,此时两个空间信息波段也对应裁剪,如图10(a)。
数据集中标注图像借助人工半自动的标注方式完成。首先手动勾取每一裁剪图像中的海岛轮廓线,提取海岛区域;然后将海洋区域设为背景(像素值设为0),如10(b);最后将所有海岛区域的像素统一修改为1,完成标注,如图 10(c)。其中标注数据在训练过程中仅需要作为目标值,与分类结果进行比较降低误差,仅需单通道图像即可。
海岛分类遥感影像数据集共采集海岛影像694幅,共标注了海洋和海岛两个类别。本发明使用keras的ImageDataGenerator工具对数据集进行旋转、平移、错切变换、拉伸翻转等操作后,使数据集扩充至1500幅,并随机选取 1200幅进行训练,使用剩余300幅进行测试检验。
步骤三:实验环境选择
本次实验使用1台英伟达Tesla p100计算卡进行深度卷积神经网络的训练。Teslap100计算卡内建3584个CUDA核心,224个纹理单元,150亿个晶体管,16GB HBM2显存,其双精度运算速度达5.3万亿次/s,单精度运算速度达10.6万亿次/s。深度卷积神经网络框架使用Tensorflow1.4搭建,借助 cuda7.0对计算卡进行调用,并应用cuDnn5.1专门对卷积神经网络进行加速优化。
骤四:海岛遥感影像分类方法的训练
在深度卷积神经网络中,若卷积操作后每一层输出的都是上一层输入的线性函数,即使神经网络深度再深,也只能解决线性问题。但是现实生活中的数据往往是线性不可分的,这时就需要引入激活函数f(x)=σ(x),使神经网络可以逼近任意函数。常用的激活函数有sigmoid函数,Tanh函数,ReLu函数等。本文使用的ReLU(Rectified Linear Unit)函数作为激活函数:
使用ReLU进行训练时模型收敛速度会比sigmoid或tanh函数快很多,相比于sigmoid或tanh函数,ReLU只需设置一个参数就可以得到激活值,使得计算效率得到提高。
神经网络的参数优化方法为梯度下降方法:
其中η是学习率,J(θ)是损失函数,是损失函数关于参数θ的梯度。通过迭代更新求得最优的权重参数θ。本文为了提高梯度下降的速度,选择了 Adam(AdaptiveMoment Estimation)优化方法:
式中mt为梯度的第一时刻平均值,vt为梯度的第二时刻非中心方差值,它将每个参数的历史梯度平方均值存于vt中。在实际应用中,Adam方法每次迭代参数的学习步长都有一个确定的范围,不会因为很大的梯度导致很大的学习步长,参数的值比较稳定,因此收敛速度更快。与其他优化算法相比,Adam方法学习效果更为有效。
数据集中遥感影像输入海岛分类网络训练时,共训练20个时期(Epoch)。大量图像进行训练将占用巨大的内存消耗,因此每次进行训练时取批量尺寸 (batch-size)为50,即每次50幅图像为一批次进行训练。训练时模型的学习率(learning rate)为10-5,学习率过大将导致模型参数在梯度下降优化时直接跳过最优点,并使分类误差增大,不利于训练。其他设置与U-Net网络相同。
步骤五:基于遥感影像分类方法的遥感影像分类
本次实验经过20×1500次训练后误差收敛到了可接受的范围:
图12选择了最后2500次迭代过程中的误差值,图中可看到损失函数的误差逐渐从1降低至0附近,并趋于稳定,表明分类方法在训练集中已取得了良好的分类效果。
分类方法实际用于海岛分类的效果如图13。图13中上半部分原始图像,下半部分为本文模型得到的分类图像。分类图像中较准确地识别了海岛的轮廓,实现了对海岛的有效分类。使用深度卷积神经网络进行图像分类时,资源消耗多集中在模型训练阶段。原U-net网络在训练阶段共耗时10337秒;本文改进的模型在训练阶段共耗时564秒,时间消耗仅为原来的1/18。分类方法得到后可直接用于海岛影像的分类,此过程消耗资源较少。在4核Intel Xeon、运行频率2.67GHz CPU的设备上,对图4-5中4幅海岛的分类时,原U-Net分类方法分别耗时22.406s、24.411s、25.161s、26.021s,评价耗时24.500s;本文改进的模型分别耗时0.127s、0.140s、0.143s、0.159s,平均耗时0.142s,时间消耗仅为原来的1/172。
本发明的一种基于改进深度卷积神经网络的遥感影像分类方法,针对遥感影像分类方法在深度卷积神经网络中训练难的问题,对卷积运算进行了改进。改进后的卷积运算在卷积过程中加入瓶颈单元实现遥感影像的波段降维,并结合分组卷积进一步降低卷积运算中模型参数的产生,减少计算资源消耗;在波段分组阶段加入通道洗牌操作,保证特征提取效果;且对遥感影像空间位置信息进行了波段化处理,使其与光谱波段一起加入深度卷积神经网络进行训练,实现卷积运算对遥感影像空间特征的提取。最终将改进后的卷积运算应用于 U-Net网络中,实现了参数量更少、计算效率更高的遥感影像分类深度卷积神经网络,具有很高的实用价值。基于遥感影像的波谱特征,通过设置瓶颈单元,实现待分类遥感影像的降维;通过优化分组卷积,降低待分类遥感影像的卷积计算量;通过构建通道洗牌结构,优化遥感影像分类的深度卷积神经网络结构;从而构建了遥感影像分类的深度卷积神经网络模型。基于遥感影像的空间位置特征,将待训练的遥感影像进行“波段化”预处理,将遥感影像的空间位置特征转化为“经度波段”和“纬度波段”,从而与其他波段一起生成遥感影像分类深度卷积神经网络模型的输入参数,以提高了深度卷积神经网络模型对遥感影像分类的空间位置特征识别度。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员,在不脱离本发明方法的前提下,还可以做出若干改进和补充,这些改进和补充也应视为本发明的保护范围。
Claims (9)
1.一种基于改进深度卷积神经网络的遥感影像分类方法,其特征在于,所述遥感影像分类方法包括以下步骤:
步骤S1、基于瓶颈单元的遥感特征影像降维;
步骤S2、基于分组卷积的遥感特征影像卷积多通道优化;
步骤S3、基于通道洗牌的遥感特征影像特征提取;
步骤S4、面向遥感影像空间位置特征的波段化处理:将遥感影像的经度和维度信息分类转化为类似光谱信息的存储方式,生成了两个新的波段,并把该两个波段与光谱波段一同输入卷积神经网络进行训练,具体包括以下步骤:
步骤S41、对像素点通过以下公式进行空间定位:
式中x是遥感影像中某像素所在的列数;y是图像中某像素所在的行数;xl为该像素所对应的经度坐标;yb为该像素所对应的纬度坐标;A是图像中像素x方向的比例参数,代表了单个像素在南北方向实际范围;E是图像中像素y方向的比例参数,代表了单个像素在东西方向实际范围负值;B和D为旋转参数,分别代表像素因旋转在东向和北向产生的距离偏移值;C和F是图像左上角处像素的地理坐标;
步骤S42、根据以下公式计算像素中心点坐标:
其中,(x1,y1),(x2,y2)为该像素端点所在的经度和维度值,(X0,Y0)表示中心点坐标;
步骤S43、将X0和Y0分离,分别构成经度波段和纬度波段,同其他光谱波段一起加入神经网络中进行训练。
2.根据权利要求1所述的基于改进深度卷积神经网络的遥感影像分类方法,其特征在于,步骤S1中瓶颈单元是卷积核为1×1的卷积运算,具有12个通道的特征影像经过4个1×1卷积核的卷积后被降维至4通道,然后再经过12个3×3卷积核的卷积得到12个通道的输出特征影像。
3.根据权利要求1所述的基于改进深度卷积神经网络的遥感影像分类方法,其特征在于,步骤S2中分组卷积首先对输入的特征通道进行分组,此时卷积运算将不直接对所有通道进行卷积操作,而在每个组内进行分别进行卷积运算,并输出该组的卷积结果,最后对所有的输出特征影像进行通道连接作为本层的输出。
4.根据权利要求1所述的基于改进深度卷积神经网络的遥感影像分类方法,其特征在于,步骤S2中在分组卷积的基础之上,对瓶颈单元的输出结果使用极限的分组卷积降低卷积运算的参数量。
5.根据权利要求4所述的基于改进深度卷积神经网络的遥感影像分类方法,其特征在于,极限分组卷积的分组数和输入的特征影像的通道数相同,每个卷积核只负责一个通道的卷积运算。
6.根据权利要求1所述的基于改进深度卷积神经网络的遥感影像分类方法,其特征在于,步骤S3中通道洗牌操作对原有的波段排列方式进行重排列,按固定的波段间隔选择波段。
7.一种利用权利要求1-6任一项所述的基于改进深度卷积神经网络的遥感影像分类方法的分类方法,其特征在于,所述的分类流程包括以下步骤:
步骤S1、数据准备;
步骤S2、构建数据集;
步骤S21、在构建数据集时,原始遥感影像首先进行了空间位置信息的波段化处理,在读取每幅图像的坐标文件后,构建了所有像素点的经度波段和纬度波段,并将它们与遥感影像的原始光谱波段组合,然后一起输入神经网络进行特征提取;然后在遥感影像上裁剪选取含有岛屿的区域,此时两个空间信息波段也对应裁剪;
步骤S22、在数据集中标注图像时,首先手动勾取每一裁剪图像中的海岛轮廓线,提取海岛区域;然后将海洋区域设为背景,像素值设为0;最后将所有海岛区域的像素统一修改为1,完成标注;
步骤S3、实验环境选择;
步骤S4、海岛遥感影像分类方法的训练;
步骤S5、基于遥感影像分类方法的遥感影像分类。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810368763.XA CN108596248B (zh) | 2018-04-23 | 2018-04-23 | 一种基于改进深度卷积神经网络的遥感影像分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810368763.XA CN108596248B (zh) | 2018-04-23 | 2018-04-23 | 一种基于改进深度卷积神经网络的遥感影像分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108596248A CN108596248A (zh) | 2018-09-28 |
CN108596248B true CN108596248B (zh) | 2021-11-02 |
Family
ID=63614107
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810368763.XA Active CN108596248B (zh) | 2018-04-23 | 2018-04-23 | 一种基于改进深度卷积神经网络的遥感影像分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108596248B (zh) |
Families Citing this family (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI694414B (zh) * | 2018-12-18 | 2020-05-21 | 國立成功大學 | 卷積神經網路分析方法、電腦程式產品與電子裝置 |
CN109766822B (zh) * | 2019-01-07 | 2021-02-05 | 山东大学 | 基于神经网络的手势识别方法及系统 |
CN109859209B (zh) * | 2019-01-08 | 2023-10-17 | 平安科技(深圳)有限公司 | 遥感影像分割方法、装置及存储介质、服务器 |
CN109754017B (zh) * | 2019-01-09 | 2022-05-10 | 西北工业大学 | 基于可分离的三维残差网络和迁移学习高光谱图像分类方法 |
CN110032928B (zh) * | 2019-02-27 | 2021-09-24 | 成都数之联科技有限公司 | 一种适用于颜色敏感的卫星遥感影像水体识别方法 |
CN110097075B (zh) * | 2019-03-21 | 2023-04-18 | 国家海洋信息中心 | 基于深度学习的海洋中尺度涡分类识别方法 |
CN109949321B (zh) * | 2019-03-26 | 2019-12-10 | 电子科技大学 | 基于三维Unet网络的脑部核磁共振图像组织分割方法 |
CN109978071A (zh) * | 2019-04-03 | 2019-07-05 | 西北工业大学 | 基于数据增广和分类器融合的高光谱图像分类方法 |
CN110084294A (zh) * | 2019-04-18 | 2019-08-02 | 北京师范大学 | 一种基于多尺度深度特征的遥感影像分类方法 |
CN110097129B (zh) * | 2019-05-05 | 2023-04-28 | 西安电子科技大学 | 基于轮廓波分组特征金字塔卷积的遥感目标检测方法 |
CN110136145A (zh) * | 2019-05-17 | 2019-08-16 | 东北大学 | 基于多通道可分离卷积神经网络的mr脑部图像分割方法 |
CN110211069B (zh) * | 2019-06-03 | 2021-09-03 | 广东工业大学 | 一种图像去噪模型训练方法、系统、设备、计算机介质 |
CN110414428A (zh) * | 2019-07-26 | 2019-11-05 | 厦门美图之家科技有限公司 | 一种生成人脸属性信息识别模型的方法 |
CN110443259B (zh) * | 2019-07-29 | 2023-04-07 | 中科光启空间信息技术有限公司 | 一种从中等分辨率遥感影像中提取甘蔗的方法 |
CN110543900A (zh) * | 2019-08-21 | 2019-12-06 | 北京市商汤科技开发有限公司 | 图像处理方法及装置、电子设备和存储介质 |
CN110619310B (zh) * | 2019-09-19 | 2023-01-20 | 北京达佳互联信息技术有限公司 | 一种人体骨骼关键点检测方法、装置、设备及介质 |
US20210089887A1 (en) * | 2019-09-24 | 2021-03-25 | Apple Inc. | Variance-Based Learning Rate Control For Training Machine-Learning Models |
CN112840348B (zh) * | 2019-10-11 | 2024-05-03 | 安徽中科智能感知科技股份有限公司 | 一种基于时序遥感数据和卷积神经网络的作物种植分布预测方法 |
CN111325126B (zh) * | 2020-02-12 | 2023-11-03 | 二十一世纪空间技术应用股份有限公司 | 遥感图像的解译方法及装置 |
CN111553921B (zh) * | 2020-02-19 | 2023-04-25 | 中山大学 | 一种基于通道信息共享残差模块的实时语义分割方法 |
CN111353463B (zh) * | 2020-03-12 | 2023-07-25 | 北京工业大学 | 基于随机深度残差网络的高光谱图像分类方法 |
CN111407245B (zh) * | 2020-03-19 | 2021-11-02 | 南京昊眼晶睛智能科技有限公司 | 一种基于摄像头的非接触式心率、体温测量方法 |
CN113515969B (zh) * | 2020-04-09 | 2023-04-07 | 广西壮族自治区自然资源信息中心 | 基于卷积神经网络的多时态遥感影像地表覆盖分类方法 |
CN111611960B (zh) * | 2020-05-29 | 2022-06-28 | 长光卫星技术股份有限公司 | 一种基于多层感知神经网络大区域地表覆盖分类方法 |
CN112200090B (zh) * | 2020-10-12 | 2022-07-01 | 桂林电子科技大学 | 基于交叉分组空谱特征增强网络的高光谱图像分类方法 |
CN112329703A (zh) * | 2020-11-20 | 2021-02-05 | 北京林业大学 | 一种适宜识别松材线虫病遥感影像的深度卷积神经网络的构建方法 |
CN113553985A (zh) * | 2021-08-02 | 2021-10-26 | 中再云图技术有限公司 | 一种基于人工智能高空烟雾检测识别方法,存储装置及服务器 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105447497A (zh) * | 2015-06-30 | 2016-03-30 | 中国石油天然气股份有限公司 | 高分辨率多光谱遥感影像中的油田井场的识别方法 |
CN107239782A (zh) * | 2017-05-09 | 2017-10-10 | 广州地理研究所 | 基于亚像元定位的遥感影像水体提取方法 |
WO2017200524A1 (en) * | 2016-05-16 | 2017-11-23 | United Technologies Corporation | Deep convolutional neural networks for crack detection from image data |
CN107516317A (zh) * | 2017-08-18 | 2017-12-26 | 上海海洋大学 | 一种基于深度卷积神经网络的sar影像海冰分类方法 |
CN107656289A (zh) * | 2017-08-23 | 2018-02-02 | 中国科学院光电研究院 | 基于地基辐亮度的星载光学载荷绝对辐射定标方法及系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016207875A1 (en) * | 2015-06-22 | 2016-12-29 | Photomyne Ltd. | System and method for detecting objects in an image |
-
2018
- 2018-04-23 CN CN201810368763.XA patent/CN108596248B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105447497A (zh) * | 2015-06-30 | 2016-03-30 | 中国石油天然气股份有限公司 | 高分辨率多光谱遥感影像中的油田井场的识别方法 |
WO2017200524A1 (en) * | 2016-05-16 | 2017-11-23 | United Technologies Corporation | Deep convolutional neural networks for crack detection from image data |
CN107239782A (zh) * | 2017-05-09 | 2017-10-10 | 广州地理研究所 | 基于亚像元定位的遥感影像水体提取方法 |
CN107516317A (zh) * | 2017-08-18 | 2017-12-26 | 上海海洋大学 | 一种基于深度卷积神经网络的sar影像海冰分类方法 |
CN107656289A (zh) * | 2017-08-23 | 2018-02-02 | 中国科学院光电研究院 | 基于地基辐亮度的星载光学载荷绝对辐射定标方法及系统 |
Non-Patent Citations (3)
Title |
---|
Xception: Deep Learning with Depthwise Separable Convolutions;Francois Chollet 等;《arXiv》;20170405;第1-8页 * |
基于混合蛙跳算法改进的OTSU遥感图像分割方法;路彬彬 等;《计算机应用与软件》;20110930;第77-79,105页 * |
面向Spark的遥感影像金字塔模型的并行构建方法;黄冬梅 等;《计算机应用与软件》;20170531;第175-181页 * |
Also Published As
Publication number | Publication date |
---|---|
CN108596248A (zh) | 2018-09-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108596248B (zh) | 一种基于改进深度卷积神经网络的遥感影像分类方法 | |
CN110443143B (zh) | 多分支卷积神经网络融合的遥感图像场景分类方法 | |
Wu et al. | ORSIm detector: A novel object detection framework in optical remote sensing imagery using spatial-frequency channel features | |
Hosseinpour et al. | CMGFNet: A deep cross-modal gated fusion network for building extraction from very high-resolution remote sensing images | |
CN111695467B (zh) | 基于超像素样本扩充的空谱全卷积高光谱图像分类方法 | |
Zhao et al. | Hyperspectral image classification with multi-attention transformer and adaptive superpixel segmentation-based active learning | |
Lin et al. | Hyperspectral image denoising via matrix factorization and deep prior regularization | |
Xiao et al. | Enhancing multiscale representations with transformer for remote sensing image semantic segmentation | |
CN113780149A (zh) | 一种基于注意力机制的遥感图像建筑物目标高效提取方法 | |
CN110599502B (zh) | 一种基于深度学习的皮肤病变分割方法 | |
CN109190511B (zh) | 基于局部与结构约束低秩表示的高光谱分类方法 | |
CN112818920B (zh) | 一种双时相高光谱图像空谱联合变化检测方法 | |
CN114022408A (zh) | 基于多尺度卷积神经网络的遥感图像云检测方法 | |
CN109034213B (zh) | 基于相关熵原则的高光谱图像分类方法和系统 | |
CN114332070A (zh) | 一种基于智能学习网络模型压缩的陨坑检测方法 | |
CN115272670A (zh) | 一种基于掩膜注意交互的sar图像舰船实例分割方法 | |
CN115457311A (zh) | 一种基于自表达迁移学习的高光谱遥感影像波段选择方法 | |
Guo et al. | Decoupling semantic and edge representations for building footprint extraction from remote sensing images | |
CN115240066A (zh) | 基于深度学习的遥感影像矿区复绿监测方法及系统 | |
Jiang et al. | An Improved Semantic Segmentation Method for Remote Sensing Images Based on Neural Network. | |
Qiao et al. | LiteSCANet: An efficient lightweight network based on spectral and channel-wise attention for hyperspectral image classification | |
CN115909077A (zh) | 基于无监督光谱解混神经网络的高光谱图像变化检测方法 | |
CN114049567A (zh) | 自适应软标签生成方法以及在高光谱图像分类中的应用 | |
He et al. | Fast and Accurate Sea-Land Segmentation Based on Improved SeNet and Coastline Database for Large-Scale Image | |
Huanhuan et al. | Depthwise separable residual network for remote sensing image scene classification |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |