CN108830296B - 一种改进的基于深度学习的高分遥感影像分类方法 - Google Patents

一种改进的基于深度学习的高分遥感影像分类方法 Download PDF

Info

Publication number
CN108830296B
CN108830296B CN201810478949.0A CN201810478949A CN108830296B CN 108830296 B CN108830296 B CN 108830296B CN 201810478949 A CN201810478949 A CN 201810478949A CN 108830296 B CN108830296 B CN 108830296B
Authority
CN
China
Prior art keywords
layer
remote sensing
sensing image
neural network
convolutional neural
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810478949.0A
Other languages
English (en)
Other versions
CN108830296A (zh
Inventor
王鑫
李可
石爱业
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hohai University HHU
Original Assignee
Hohai University HHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hohai University HHU filed Critical Hohai University HHU
Priority to CN201810478949.0A priority Critical patent/CN108830296B/zh
Publication of CN108830296A publication Critical patent/CN108830296A/zh
Application granted granted Critical
Publication of CN108830296B publication Critical patent/CN108830296B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06F18/2148Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种改进的基于深度学习的高分遥感影像分类方法,首先,基于深度学习理论,设计一个七层卷积神经网络。其次,将高分遥感影像样本输入该网络中进行网络训练,并将学习得到的最后两个全连接层输出,作为遥感影像两种不同的高层特征。接着,针对该网络第五层池化层输出,采用主成分分析进行降维,降维后的结果作为遥感影像的第三种高层特征。然后,将上述三种高层特征通过串联的形式进行融合。最后,设计一种有效的基于逻辑回归的分类器,对遥感影像进行分类。本发明基于深度学习理论对高分遥感影像进行特征提取,学习得到的特征表现力及鲁棒性强。此外,将提取到的多种高层特征进行融合并输入逻辑回归分类器中,能实现良好的分类效果。

Description

一种改进的基于深度学习的高分遥感影像分类方法
技术领域
本发明属于图像处理领域,尤其涉及一种改进的基于深度学习的高分遥感影像分类方法。
背景技术
在光学遥感图像处理领域中,遥感图像的空间分辨率是指能够被光学传感器辨识的单一地物或2个相邻地物间的最小尺寸。空间分辨率越高,遥感图像包含的地物形态信息就越丰富。目前已经商业化运行的光学遥感卫星的空间分辨率已经达到“亚米级”,如2016年发射的美国WorldView-4卫星能够提供0.3m分辨率的高清晰地面图像。近年来,随着我国空间技术的快速发展,特别是高空间分辨率(简称高分)对地观测系统重大专项的实施,我国的卫星遥感技术也迈入了亚米级时代,高分2号卫星(GF-2)全色谱段星下点空间分辨率达到0.8m。
高空间分辨率遥感影像包含了丰富的地物纹理、形状、结构、邻域关系等信息,可主要应用于地物分类、目标提取与识别、变化检测等。高分遥感影像分类作为其中的一个研究热点,在资源勘测、环境监测和军事目标锁定等方面有着非常重要的应用。
目前的高分遥感影像分类的研究多注重分类算法的改进,而实际上,训练样本特征提取的准确度和有效性对分类精度和效率有着非常重要的影响。
公开号CN104102928A一种基于纹理基元的遥感图像分类方法,通过选取典型地物的遥感图像的邻域特征向量并聚类形成纹理基元字典和纹理模型库,将待分类的图像划分成超像素,与纹理模型库中的模型进行比较,实现超像素的分类,进而实现图像分类。该方法虽然利用了超像素的强同质性和纹理的空间分布规律,但是,仅运用纹理特征进行分类在遥感图像地物光谱特征复杂的情况下效果不佳。
公开号CN102622607A一种基于多特征融合的遥感图像分类方法,通过提取训练样本和测试样本遥感图像的视觉词袋特征、颜色直方图特征和纹理特征,进行支持向量机训练,得到三个不同的支持向量机分类器,采用上述分类器进行类别预测,得到三组类别预测结果,然后采用加权综合法对三组类别预测结果进行综合,从而得到最终的分类结果。该方法虽然有效融合了遥感图像的视觉词袋特征、颜色直方图特征和纹理特征,使得提取到的遥感图像特征向量涵盖信息丰富,但是,需要人为提取多种特征,操作复杂。
近年来,深度学习理论在图像处理和模式识别等领域迅速发展,人们试着将其应用于图像分类问题中,获得了良好的结果。例如,黄等人在2017年北京航空航天大学学报上发表论文“基于卷积神经网络的遥感图像舰船目标检测”,该文献提出了一种将卷积神经网络与支持向量机相结合的舰船目标检测方法,利用卷积神经网络可自主提取图像特征并进行学习的优点,避免了复杂的特征选择和提取过程。但是由于该方法直接将全连接层特征输入支持向量机进行分类,未能利用卷积神经网络提取多种特征进行融合,导致分类性能受限。
综上,现有的高分遥感影像分类方法,存在的诸多局限性主要表现在:
(1)现有的遥感影像分类方法常需要遥感影像样本进行预处理,而预处理过程容易受到诸多外部因素,如大气条件、地表环境等因素的影响,这将弱化分类的性能。
(2)现有的遥感影像分类方法提取特征时需要过多的人为干预,选择不同的图像特征提取算法,提取图像的各种类型的特征,用于后续的图像分类,特征提取过程复杂。
(3)现有的遥感影像分类方法提取得到的特征鲁棒性不强。现有的分类方法常提取图像底层特征,如纹理特征、颜色特征以及上下文先验信息等,这些特征还可能存在冗余现象,在位移、旋转等方面表现欠佳,导致分类正确率不高。
发明内容
发明目的:针对现有技术中存在的问题,本发明提供一种改进的基于深度学习的高分遥感影像分类方法。该方法可以避免传统复杂的特征提取过程,扩大特征的选择范围,增强特征表现力,提高分类的准确率。
技术方案:为实现本发明的目的,本发明所采用的技术方案是:一种改进的基于深度学习的高分遥感影像分类方法,包含训练阶段和测试阶段:
所述训练阶段包括以下步骤:
(1)构建多类遥感影像样本数据集,并制作相应的样本标签集合,将每类遥感影像样本数据集分为训练集Train和测试集Test;
(2)搭建七层卷积神经网络,使用训练集对卷积神经网络进行训练;
(3)提取卷积神经网络第五层池化层输出特征值和第六、第七两个全连接层的输出特征值;
(4)针对卷积神经网络的第五层池化层输出特征值,采用主成分分析方法对其进行降维;
(5)将降维后的第五层池化层特征和两个全连接层特征通过串联的形式进行特征融合;
(6)在融合特征的基础上,设计基于逻辑回归的分类器;
所述测试阶段包括以下步骤:
(7)将测试集输入到步骤(2)中训练好的卷积神经网络中,得到每个测试样本的第五层池化层特征和两个全连接层特征;
(8)利用步骤(4)中所述的主成分分析方法,对步骤(7)得到的第五层池化层特征进行降维;
(9)针对步骤(7)中的两个全连接层特征和步骤(8)中的降维后的第五层池化层特征,进行串联,实现特征融合;
(10)使用步骤(6)设计好的分类器对测试集进行分类识别。
其中,步骤(1)中的,构建训练集和测试集的方法如下:
(1.1)构建多类遥感影像样本数据集Image=[Image1,…,Imagei,…,ImageN],并制作相应的样本标签Label=[Label1,…,Labeli,…,LabelN],其中N表示N类遥感影像,Imagei表示第i类遥感影像的集合,Labeli表示第i类遥感影像的标签集合,标签集合取值为i-1,其中,i=1,…,N;
(1.2)将每类数据集分为训练集部分Train和测试集部分Test,针对数据集中每类遥感影像,设其样本总数为n,从中随机抽取m张图像构建训练集,其余n-m张图像构建测试集,则有:Train=[Train1,…,Traini,…,TrainN],Test=[Test1,…,Testi,…,TestN],其中,Traini表示第i类遥感影像的训练集合,它包含了m张图像,Testi表示第i类遥感影像的测试集合,它包含n-m张图像。
其中,步骤(2)中的,卷积神经网络搭建及训练方法如下:
(2.1)搭建一个七层的卷积神经网络:第一、二、五层分别包括卷积层和池化层;第三、四层只包含卷积层;第六、七层分别是两个全连接层;
(2.2)将遥感影像训练集输入搭建好的卷积神经网络中,前向计算卷积神经网络每个神经元的输出值;
(2.2.1)假设第l层为卷积层,则第l层第j个特征图
Figure BDA0001665255450000031
的计算公式为:
Figure BDA0001665255450000041
其中,*表示卷积操作,
Figure BDA0001665255450000042
为第l-1层第i个特征图,
Figure BDA0001665255450000043
表示
Figure BDA0001665255450000044
Figure BDA0001665255450000045
的卷积核,
Figure BDA0001665255450000046
表示第l层第j个特征图的偏置,f(·)表示线性整流激活函数,Ml-1表示第l-1层特征图的个数;
(2.2.2)假设第l层为池化层,则第l层第j个特征图
Figure BDA0001665255450000047
的计算公式为:
Figure BDA0001665255450000048
其中,
Figure BDA0001665255450000049
表示第l层第j个特征图的池化参数,
Figure BDA00016652554500000410
表示第l-1层第j个特征图,down(·)表示池化函数,
Figure BDA00016652554500000411
表示第l层第j个特征图的偏置;
(2.2.3)假设第l层为全连接层,则第l层第j个特征图
Figure BDA00016652554500000412
的计算公式为:
Figure BDA00016652554500000413
其中,yl-1表示第l-1层所有特征图的加权结果,
Figure BDA00016652554500000414
表示第l层第j个特征图的偏置,f(·)为线性整流激活函数;
(2.3)反向计算卷积神经网络的损失函数;
(2.3.1)设遥感影像训练集中任一带标签样本Ii,其中i=1,…,N×m,N表示有N类遥感影像,m表示每一类包括m个测试图像,对于样本Ii,其分类标签为:
Figure BDA00016652554500000415
(2.3.2)对于标签样本Ii,若卷积神经网络将其预测为第k类的概率为
Figure BDA00016652554500000416
则定义其误差为Ei
Figure BDA00016652554500000417
(2.3.3)基于所有训练样本的误差,计算卷积神经网络的损失函数E:
Figure BDA00016652554500000418
(2.4)采用梯度下降算法,最小化损失函数,并更新卷积神经网络中的各个参数;
(2.4.1)训练卷积神经网络寻找最佳参数以最小化损失函数E,卷积神经网络的参数是步骤(2.2)中描述的
Figure BDA0001665255450000051
Figure BDA0001665255450000052
若用W表示所有参数,即:
Figure BDA0001665255450000053
则采用遥感影像训练集训练卷积神经网络后,可以找到一组参数W*,使得:
Figure BDA0001665255450000054
其中,arg表示W*满足minE;
(2.4.2)采用梯度下降算法更新卷积神经网络的参数,同时最小化损失函数E:
Figure BDA0001665255450000055
其中,α表示卷积神经网络的学习率,决定了每步调整的幅度,W(i)表示第i组更新的参数,W(i-1)表示第i-1组参数,
Figure BDA0001665255450000056
表示损失函数E对参数W求偏导。
其中,步骤(3)中的,提取卷积神经网络第五层池化层输出和第六、第七两个全连接层的输出,方法如下:
(3.1)根据步骤(2.2.2)的方法,可以得到卷积神经网络第五层池化层输出结果p5,包含了第五层池化层计算得到的所有特征图;
(3.2)根据步骤(2.2.3)的方法,可以得到卷积神经网络第六层全连接层输出结果features_fc6,包含了第六层全连接层计算得到的所有特征图;
(3.3)根据步骤(2.2.3)的方法,可以得到卷积神经网络第七层全连接层输出结果features_fc7,包含了第七层全连接层计算得到的所有特征图。
其中,步骤(4)中的,针对卷积神经网络的第五层池化层输出,采用主成分分析方法对其进行降维,方法如下:
(4.1)将(3.1)计算得到的第五层池化层输出结果p5变形为二维矩阵C,二维矩阵的每一行反映了一个遥感训练样本对应的特征向量,设该特征向量维数为d;
(4.2)对二维矩阵C的每一列进行零均值化得到一个新的矩阵C0,即用C的每列减去该列的均值,使得每列数据的均值为零;
(4.3)求C0的协方差矩阵M,协方差矩阵M反映了所有遥感影像训练样本特征向量之间的相互关系:如果两个样本特征向量的协方差为正或为负,表明它们之间具有相关性;如果为零,则表示不相关,最终,计算得到的协方差矩阵M大小应为d×d;
(4.4)求协方差矩阵M的d个特征值和d个特征向量;
(4.5)选择协方差矩阵M的主成分,将协方差矩阵M的特征向量按照特征值由大到小排序,根据精度要求选择e个特征向量,构成主成分矩阵Mp
(4.6)对第五层池化层输出结果p5进行降维,降维后的第五层池化层特征为features_p5=C·Mp
其中,步骤(5)中的,将降维后的第五层池化层特征和两个全连接层特征通过串联的形式进行特征融合,方法如下:
将上述步骤得到的features_p5、features_fc6和features_fc7特征进行串联形式的融合,融合方法如下:
Figure BDA0001665255450000061
X为最终融合后的深度特征向量。
其中,步骤(6)中的,在融合特征的基础上,设计基于逻辑回归的分类器,方法如下:
(6.1)通过采用逻辑回归方法,计算每一个训练集中遥感影像样本对应的属于第i类的概率hθ (i),i=1,…,N:
Figure BDA0001665255450000062
其中,Xj表示第j个遥感影像样本对应求得的最终融合后的深度特征,θ是权重矩阵,θT表示矩阵θ的转置;
(6.2)根据计算得到的hθ (i),i=1,…,N,可以获得第j个遥感影像样本最终的预测值:
Figure BDA0001665255450000063
其中,max(·)表示取N个hθ (i)中的最大值;
取hj对应的标签类别作为第j个遥感影像样本的预测值pred_labelj,pred_labelj为1-N的整数;
(6.3)根据预测结果,利用梯度上升算法不断优化逻辑回归参数θ,使所有训练样本的预测值pred_label与标签值Label相等。
其中,步骤(10)中使用训练好的逻辑回归分类器对遥感影像测试集进行分类识别,从而得到每个测试样本的分类结果。
有益效果:与现有技术相比,本发明具有以下有益的技术效果:
(1)本发明的方法可直接将原始遥感影像输入到深度学习卷积神经网络中,自动学习图像特征,无需进行图像预处理,避免了外部因素的干扰。
(2)本发明的方法可通过卷积神经网络自动提取遥感影像中具有较大差异的特征来表征图像,避免了复杂的特征提取过程,减少了人为干预。
(3)本发明的方法针对卷积神经网络提取到的第五层池化层特征和两个全连接层特征,用串联的方式实现特征融合,最终融合的特征具有一定的平移不变性和旋转不变性,且涵盖信息丰富。
附图说明
图1为本发明实施例的框架图;
图2为搭建的七层卷积神经网络结构。
具体实施方式
下面结合附图和实施例对本发明的技术方案作进一步的说明。
如图1所示,进一步的详细描述如下:
(1)构建多类遥感影像样本数据集,并制作相应的样本标签集合,将遥感影像样本数据集分为训练集Train和测试集Test。
(1.1)构建多类遥感影像样本数据集Image=[Image1,…,Imagei,…,ImageN],并制作相应的样本标签Label=[Label1,…,Labeli,…,LabelN],其中N表示N类遥感影像,Imagei表示第i类遥感影像的集合,Labeli表示第i类遥感影像的标签集合,并且每个类标签取值为i。本发明选用遥感场景图像公共数据集UCMerced_LandUse进行实验,该数据集包含N=21类遥感场景图像。
(1.2)将每类数据集分为训练集部分Train和测试集部分Test,针对数据集中每类遥感影像,设其样本总数为n,从中随机抽取m张图像构建训练集,其余n-m张图像构建测试集例如,可取n=100,m=80。则有:Train=[Train1,…,Traini,…,TrainN],Test=[Test1,…,Testi,…,TestN]。其中,Traini表示第i类遥感影像的训练集合,它包含了m张图像。Testi表示第i类遥感影像的测试集合,它包含n-m张图像。
(2)搭建七层卷积神经网络,使用训练集对卷积神经网络进行训练。
(2.1)搭建一个七层的卷积神经网络,其中,前五层分别用layer1,layer2layer3,layer4,layer5表示。layer1,layer2和layer5分别包括卷积层和池化层,各层卷积层分别用conv1,conv2和conv5表示,各层池化层分别用pool1,pool2和pool5表示;layer3和layer4分别只有一个卷积层,用conv3和conv4表示;第六层和第七层,称为全连接层,分别用fc6和fc7表示。其中,卷积层的目的是为了提取特征图,池化层用于对卷积层得到的特征图进行压缩,全连接层可以将二维特征图转化成一个一维的向量。
搭建好的七层卷积神经网络具体参数如下:
(a)在输入层中,将每一个遥感场景图像归一化为227×227大小;
(b)在第一层layer1的卷积层conv1中,定义96个尺寸为11×11的卷积核,设定步长为4;在layer1的池化层pool1,池化方法设为MAX pooling;
(c)在第二层layer2的卷积层conv2中,定义256个尺寸为5×5的卷积核,步长定为1;在layer2的池化层pool2,池化方法设为MAX pooling;
(d)在第三层layer3的卷积层conv3中,定义384个尺寸为3×3的卷积核,步长定为1;
(e)在第四层layer4的卷积层conv4中,定义384个尺寸为3×3的卷积核,步长定为1;
(f)在第五层layer5的卷积层conv5中,定义256个尺寸为3×3的卷积核,步长定为1;在layer5的池化层pool5,池化方法设为MAX pooling;
(g)第六层fc6为全连接层;
(h)第七层fc7为全连接层。
(2.2)将遥感影像训练集输入搭建好的卷积神经网络中,前向计算卷积神经网络每个神经元的输出值。
(2.2.1)假设第l层为卷积层,则第l层第j个特征图
Figure BDA0001665255450000091
的计算公式为:
Figure BDA0001665255450000092
其中,*表示卷积操作,
Figure BDA0001665255450000093
为第l-1层第i个特征图,
Figure BDA0001665255450000094
表示
Figure BDA0001665255450000095
Figure BDA0001665255450000096
的卷积核,
Figure BDA0001665255450000097
表示第l层第j个特征图的偏置,f(·)表示线性整流激活函数(Rectified Linear Unit,ReLU),Ml-1表示第l-1层特征图的个数。
(2.2.2)假设第l层为池化层,则第l层第j个特征图
Figure BDA0001665255450000098
的计算公式为:
Figure BDA0001665255450000099
其中,
Figure BDA00016652554500000910
表示第l层第j个特征图的池化参数,
Figure BDA00016652554500000911
表示第l-1层第j个特征图,
down(·)表示池化函数,
Figure BDA00016652554500000912
表示第l层第j个特征图的偏置。
(2.2.3)假设第l层为全连接层,则第l层第j个特征图
Figure BDA00016652554500000913
的计算公式为:
Figure BDA00016652554500000914
其中,yl-1表示第l-1层所有特征图的加权结果,
Figure BDA00016652554500000915
表示第l层第j个特征图的偏置,f(·)仍为线性整流激活函数。
(2.3)反向计算卷积神经网络的损失函数。
(2.3.1)设遥感影像训练集中任一带标签样本Ii(i=1,…,N×m),其中N表示有N类遥感影像,m表示每一类包括m个测试图像。Ii的标签实际是one-of-N标签。即,对于标签样本Ii,其分类标签为:
Figure BDA00016652554500000916
(2.3.2)对于标签样本Ii,若卷积神经网络将其预测为第k类的概率为
Figure BDA00016652554500000917
则定义其误差为Ei
Figure BDA0001665255450000101
(2.3.3)基于所有训练样本的误差,计算卷积神经网络的损失函数E:
Figure BDA0001665255450000102
(2.4)采用梯度下降算法,最小化损失函数,并更新卷积神经网络中的各个参数。
(2.4.1)训练卷积神经网络的目的是寻找合适的参数以最小化损失函数E。卷积神经网络的参数是步骤(2.2)中描述的
Figure BDA0001665255450000103
Figure BDA0001665255450000104
表示
Figure BDA0001665255450000105
Figure BDA0001665255450000106
的卷积核,
Figure BDA0001665255450000107
表示第l层第j个特征图的池化参数,
Figure BDA0001665255450000108
表示第l层第j个特征图的偏置。若用W表示所有参数,即:
Figure BDA0001665255450000109
则采用遥感影像训练集训练卷积神经网络后,可以找到一组参数W*,使得:
Figure BDA00016652554500001010
其中,arg表示W*满足minE。
(2.4.2)采用梯度下降算法更新卷积神经网络的参数W,同时最小化损失函数E:
Figure BDA00016652554500001011
其中,α表示卷积神经网络的学习率,决定了每步调整的幅度,W(i)表示第i组更新的参数,W(i-1)表示第i-1组参数,
Figure BDA00016652554500001012
表示损失函数E对参数W求偏导。
(3)提取卷积神经网络第五层池化层输出和第六、第七两个全连接层的输出,其中,最后两个全连接层的输出作为遥感影像的两种不同的高层特征。
(3.1)根据步骤(2.2.2)中介绍方法,可以得到卷积神经网络第五层池化层输出结果p5,包含了第五层池化层计算得到的所有特征图。第五层layer5学习得到的是较为完整的具有辨别性的特征,这些具有辨别性的特征是遥感场景图像中存在重大差异的一类物体。Layer5卷积层conv5输出得到256张特征图,每张特征图的尺寸为13×13;池化层pool5得到256张特征图,每张特征图的尺寸为6×6。例如,一张遥感图像类别为建筑物,则layer4学习到的特征为建筑物屋顶,layer5学习到的特征为建筑物。
(3.2)根据步骤(2.2.3)中介绍方法,可以得到卷积神经网络第六层全连接层输出结果features_fc6,包含了第六层全连接层计算得到的所有特征图。features_fc6包含4096张特征图,每张特征图的尺寸为1×1。
(3.3)根据步骤(2.2.3)中介绍方法,可以得到卷积神经网络第七层全连接层输出结果features_fc7,包含了第七层全连接层计算得到的所有特征图。features_fc7包含4096张特征图,每张特征图的尺寸为1×1。
(3.4)features_fc6和features_fc7将作为遥感影像的两种不同的高层特征。
(4)针对卷积神经网络的第五层池化层输出,采用主成分分析方法对其进行降维,降维后的结果作为遥感影像的第三种高层特征。
(4.1)将(3.1)计算得到的第五层池化层输出结果p5变形为二维矩阵C,二维矩阵的每一行反映了一个遥感训练样本对应的特征向量,设该特征向量维数为d=9216。
(4.2)对二维矩阵C的每一列进行零均值化得到一个新的矩阵C0,即用C的每列减去该列的均值,使得每列数据的均值为零。
(4.3)求C0的协方差矩阵M。协方差矩阵M反映了所有遥感影像训练样本特征向量之间的相互关系:如果两个样本特征向量的协方差为正或为负,表明它们之间具有相关性;如果为零,则表示不相关。最终,计算得到的协方差矩阵M大小应为d×d。
(4.4)求协方差矩阵M的d个特征值和d个特征向量。
(4.5)选择协方差矩阵M的主成分。将协方差矩阵M的特征向量按照特征值由大到小排序,根据精度要求选择e个特征向量,构成主成分矩阵Mp
(4.6)对第五层池化层输出结果p5进行降维,降维后的第五层池化层特征为features_p5=C·Mp
(4.7)features_p5作为遥感影像的第三种高层特征,最终尺寸为1×1×200。
(5)将降维后的第五层池化层特征和两个全连接层特征通过串联的形式进行特征融合。
将上述步骤得到的features_p5、features_fc6和features_fc7等特征进行串联形式的融合。融合方法如下:
Figure BDA0001665255450000121
X为最终融合后的深度特征向量,维数为200+4096+4096=8392。
(6)在融合特征的基础上,设计基于逻辑回归的分类器。
(6.1)通过采用逻辑回归方法,计算每一个遥感影像样本对应的属于第i类的概率hθ (i)(i=1,…,N):
Figure BDA0001665255450000122
其中,Xj表示第j个遥感影像样本对应求得的最终融合后的深度特征。θ是权重矩阵,θT表示矩阵θ的转置。
(6.2)根据计算得到的hθ (i)(i=1,…,N),可以获得第j个遥感影像样本最终的预测值:
Figure BDA0001665255450000123
其中,max(·)表示取N个hθ (i)中的最大值。
取hj对应的标签类别作为第j个遥感影像样本的预测值pred_labelj,pred_labelj为0-N-1的整数。
(6.3)根据预测结果,利用梯度上升算法不断优化逻辑回归参数θ,使所有训练样本的预测值pred_label与标签值Label相等。
(7)将测试集输入到步骤(2)中的卷积神经网络中,得到每个测试样本的第五层池化层特征和两个全连接层特征。
(7.1)根据步骤(2.2.2)中介绍方法,得到每个测试样本的第五层池化层特征图。
(7.2)根据步骤(2.2.3)中介绍方法,得到每个测试样本第六层全连接层特征图。
(7.3)根据步骤(2.2.3)中介绍方法,得到每个测试样本第七层全连接层特征图。
(8)利用步骤(4)中所述的主成分分析方法,对步骤(7.1)得到的第五层池化层特征图进行降维。
(9)针对步骤(7)中的两个全连接层特征图和步骤(8)中的降维后的第五层池化层特征图,进行串联,实现特征融合。
(10)使用步骤(6)中训练好的逻辑回归分类器对遥感影像测试集进行分类识别,从而得到每个测试样本的分类结果。
本发明选用一个不同的遥感图像场景分类算法与提出的方法进行比较,选用的比较算法是:
张等人在“基于深度学习的高分辨率遥感图像识别与分类研究[J].信息通信,2017(01):110-111.”提出的用深度学习卷积神经网络实现的高分辨率遥感图像场景分类方法,简称方法1。
表1是两种方法在遥感场景图像公共数据集UCMerced_LandUse上的性能比较。结果表明,本发明提出的方法对遥感图像场景分类效果更好。
表1两种方法分类准确率比较
Figure BDA0001665255450000131

Claims (8)

1.一种改进的基于深度学习的高分遥感影像分类方法,包含训练阶段和测试阶段,其特征在于:
所述训练阶段包括以下步骤:
(1)构建多类遥感影像样本数据集,并制作相应的样本标签集合,将每类遥感影像样本数据集分为训练集Train和测试集Test;
(2)搭建七层卷积神经网络,使用训练集对卷积神经网络进行训练;
(3)提取卷积神经网络第五层池化层输出特征值和第六、第七两个全连接层的输出特征值;
(4)针对卷积神经网络的第五层池化层输出特征值,采用主成分分析方法对其进行降维;
(5)将降维后的第五层池化层特征和第六、第七两个全连接层特征通过串联的形式进行特征融合;
(6)在融合特征的基础上,设计基于逻辑回归的分类器;
所述测试阶段包括以下步骤:
(7)将测试集输入到步骤(2)中训练好的卷积神经网络中,得到每个测试样本的第五层池化层特征和第六、第七两个全连接层特征;
(8)利用步骤(4)中所述的主成分分析方法,对步骤(7)得到的第五层池化层特征进行降维;
(9)针对步骤(7)中的第六、第七两个全连接层特征和步骤(8)中的降维后的第五层池化层特征,进行串联,实现特征融合;
(10)使用步骤(6)设计好的分类器对测试集进行分类识别。
2.根据权利要求1所述的一种改进的基于深度学习的高分遥感影像分类方法,步骤(1)中的,构建训练集和测试集的方法如下:
(1.1)构建多类遥感影像样本数据集
Figure FDA0003116697100000011
并制作相应的样本标签
Figure FDA0003116697100000012
其中N表示N类遥感影像,
Figure FDA0003116697100000013
表示第i1类遥感影像的集合,
Figure FDA0003116697100000014
表示第i1类遥感影像的标签集合,标签集合取值为i1-1,其中,i1=1,…,N;
(1.2)将每类数据集分为训练集部分Train和测试集部分Test,针对数据集中每类遥感影像,设其样本总数为n,从中随机抽取m张图像构建训练集,其余n-m张图像构建测试集,则有:
Figure FDA00031166971000000216
Figure FDA00031166971000000217
其中,
Figure FDA00031166971000000218
表示第i1类遥感影像的训练集合,它包含了m张图像,
Figure FDA00031166971000000219
表示第i1类遥感影像的测试集合,它包含n-m张图像。
3.根据权利要求1所述的一种改进的基于深度学习的高分遥感影像分类方法,步骤(2)中的,卷积神经网络搭建及训练方法如下:
(2.1)搭建一个七层的卷积神经网络:第一、二、五层分别包括卷积层和池化层;第三、四层只包含卷积层;第六、七层分别是全连接层;
(2.2)将遥感影像训练集输入搭建好的卷积神经网络中,前向计算卷积神经网络每个神经元的输出值;
(2.2.1)假设第l层为卷积层,则第l层第j个特征图
Figure FDA0003116697100000021
的计算公式为:
Figure FDA0003116697100000022
其中,*表示卷积操作,
Figure FDA0003116697100000023
为第l-1层第i2个特征图,
Figure FDA0003116697100000024
表示
Figure FDA0003116697100000025
Figure FDA0003116697100000026
的卷积核,
Figure FDA0003116697100000027
表示第l层第j个特征图的偏置,f(·)表示线性整流激活函数,Ml-1表示第l-1层特征图的个数;
(2.2.2)假设第l层为池化层,则第l层第j个特征图
Figure FDA0003116697100000028
的计算公式为:
Figure FDA0003116697100000029
其中,
Figure FDA00031166971000000210
表示第l层第j个特征图的池化参数,
Figure FDA00031166971000000211
表示第l-1层第j个特征图,down(·)表示池化函数,
Figure FDA00031166971000000212
表示第l层第j个特征图的偏置;
(2.2.3)假设第l层为全连接层,则第l层第j个特征图
Figure FDA00031166971000000213
的计算公式为:
Figure FDA00031166971000000214
其中,yl-1表示第l-1层所有特征图的加权结果,
Figure FDA00031166971000000215
表示第l层第j个特征图的偏置,f(·)为线性整流激活函数;
(2.3)反向计算卷积神经网络的损失函数;
(2.3.1)设遥感影像训练集中任一带标签样本
Figure FDA0003116697100000031
其中i3=1,…,N×m1,N表示有N类遥感影像,m1表示每一类包括m1个测试图像,对于标签样本
Figure FDA0003116697100000032
其分类标签为:
Figure FDA0003116697100000033
(2.3.2)对于标签样本
Figure FDA0003116697100000034
若卷积神经网络将其预测为第k类的概率为
Figure FDA0003116697100000035
k=1,…,N,则定义其误差为
Figure FDA0003116697100000036
Figure FDA0003116697100000037
(2.3.3)基于所有训练样本的误差,计算卷积神经网络的损失函数E:
Figure FDA0003116697100000038
(2.4)采用梯度下降算法,最小化损失函数,并更新卷积神经网络中的各个参数;
(2.4.1)训练卷积神经网络寻找最佳参数以最小化损失函数E,卷积神经网络的参数是步骤(2.2)中描述的
Figure FDA0003116697100000039
Figure FDA00031166971000000310
若用W表示所有参数,即:
Figure FDA00031166971000000311
则采用遥感影像训练集训练卷积神经网络后,找到一组参数W*,使得:
Figure FDA00031166971000000312
其中,arg表示W*满足minE;
(2.4.2)采用梯度下降算法更新卷积神经网络的参数,同时最小化损失函数E:
Figure FDA00031166971000000313
其中,α表示卷积神经网络的学习率,决定了每步调整的幅度,
Figure FDA00031166971000000315
表示第i4组更新的参数,
Figure FDA00031166971000000316
表示第i4-1组参数,
Figure FDA00031166971000000314
表示损失函数E对参数W求偏导。
4.根据权利要求1所述的一种改进的基于深度学习的高分遥感影像分类方法,步骤(3)中的,提取卷积神经网络第五层池化层输出和第六、第七两个全连接层的输出,方法如下:
(3.1)根据步骤(2.2.2)的方法,得到卷积神经网络第五层池化层输出结果p5,包含了第五层池化层计算得到的所有特征图;
(3.2)根据步骤(2.2.3)的方法,得到卷积神经网络第六层全连接层输出结果features_fc6,包含了第六层全连接层计算得到的所有特征图;
(3.3)根据步骤(2.2.3)的方法,得到卷积神经网络第七层全连接层输出结果features_fc7,包含了第七层全连接层计算得到的所有特征图。
5.根据权利要求4所述的一种改进的基于深度学习的高分遥感影像分类方法,步骤(4)中的,针对卷积神经网络的第五层池化层输出,采用主成分分析方法对其进行降维,方法如下:
(4.1)将(3.1)计算得到的第五层池化层输出结果p5变形为二维矩阵C,二维矩阵的每一行反映了一个遥感训练样本对应的特征向量,设该特征向量维数为d;
(4.2)对二维矩阵C的每一列进行零均值化得到一个新的矩阵C0,即用C的每列减去该列的均值,使得每列数据的均值为零;
(4.3)求C0的协方差矩阵M,协方差矩阵M反映了所有遥感影像训练样本特征向量之间的相互关系:如果两个样本特征向量的协方差为正或为负,表明它们之间具有相关性;如果为零,则表示不相关,最终,计算得到的协方差矩阵M大小应为d×d;
(4.4)求协方差矩阵M的d个特征值和d个特征向量;
(4.5)选择协方差矩阵M的主成分,将协方差矩阵M的特征向量按照特征值由大到小排序,根据精度要求选择e个特征向量,构成主成分矩阵Mp
(4.6)对第五层池化层输出结果p5进行降维,降维后的第五层池化层特征为features_p5=C·Mp
6.根据权利要求1所述的一种改进的基于深度学习的高分遥感影像分类方法,步骤(5)中的,将降维后的第五层池化层特征和第六、第七两个全连接层特征通过串联的形式进行特征融合,方法如下:
将上述步骤得到的features_p5、features_fc6和features_fc7特征进行串联形式的融合,融合方法如下:
Figure FDA0003116697100000051
X为最终融合后的深度特征向量。
7.根据权利要求1所述的一种改进的基于深度学习的高分遥感影像分类方法,步骤(6)中的,在融合特征的基础上,设计基于逻辑回归的分类器,方法如下:
(6.1)通过采用逻辑回归方法,计算每一个训练集中遥感影像样本对应的属于第i5类的概率
Figure FDA0003116697100000054
i5=1,…,N:
Figure FDA0003116697100000052
其中,Xj表示第j个遥感影像样本对应求得的最终融合后的深度特征,θ是权重矩阵,θT表示矩阵θ的转置;
(6.2)根据计算得到的
Figure FDA0003116697100000055
获得第j个遥感影像样本最终的预测值:
Figure FDA0003116697100000053
其中,max(·)表示取N个
Figure FDA0003116697100000056
中的最大值;
取hj对应的标签类别作为第j个遥感影像样本的预测值pred_labelj,pred_labelj为1-N的整数;
(6.3)根据预测结果,利用梯度上升算法不断优化逻辑回归参数θ1,使所有训练样本的预测值pred_label与标签值Label相等。
8.根据权利要求7所述的一种改进的基于深度学习的高分遥感影像分类方法,步骤(10)中使用训练好的逻辑回归分类器对遥感影像测试集进行分类识别,从而得到每个测试样本的分类结果。
CN201810478949.0A 2018-05-18 2018-05-18 一种改进的基于深度学习的高分遥感影像分类方法 Active CN108830296B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810478949.0A CN108830296B (zh) 2018-05-18 2018-05-18 一种改进的基于深度学习的高分遥感影像分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810478949.0A CN108830296B (zh) 2018-05-18 2018-05-18 一种改进的基于深度学习的高分遥感影像分类方法

Publications (2)

Publication Number Publication Date
CN108830296A CN108830296A (zh) 2018-11-16
CN108830296B true CN108830296B (zh) 2021-08-10

Family

ID=64148336

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810478949.0A Active CN108830296B (zh) 2018-05-18 2018-05-18 一种改进的基于深度学习的高分遥感影像分类方法

Country Status (1)

Country Link
CN (1) CN108830296B (zh)

Families Citing this family (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109685115B (zh) * 2018-11-30 2022-10-14 西北大学 一种双线性特征融合的细粒度概念模型及学习方法
CN109766938A (zh) * 2018-12-28 2019-05-17 武汉大学 基于场景标签约束深度网络的遥感影像多类目标检测方法
CN109711381B (zh) * 2019-01-04 2021-03-23 北京环境特性研究所 遥感图像的目标识别方法、装置和计算机设备
CN109740692A (zh) * 2019-01-13 2019-05-10 胡燕祝 一种基于主成分分析的逻辑斯蒂回归的目标归类方法
CN109902584B (zh) * 2019-01-28 2022-02-22 深圳大学 一种口罩缺陷的识别方法、装置、设备及存储介质
CN109871798B (zh) * 2019-02-01 2021-06-29 浙江大学 一种基于卷积神经网络的遥感影像建筑物提取方法
CN110070116B (zh) * 2019-04-08 2022-09-20 云南大学 基于深度树状训练策略的分段式选择集成图像分类方法
CN110084294A (zh) * 2019-04-18 2019-08-02 北京师范大学 一种基于多尺度深度特征的遥感影像分类方法
CN110110796B (zh) * 2019-05-13 2020-12-18 哈尔滨工程大学 一种基于深度学习的海上船舶时序数据的分析方法
CN110263644B (zh) * 2019-05-21 2021-08-10 华南师范大学 基于三胞胎网络的遥感图像分类方法、系统、设备及介质
CN110287800B (zh) * 2019-05-29 2022-08-16 河海大学 一种基于sgse-gan的遥感图像场景分类方法
CN110210412B (zh) * 2019-06-04 2022-08-26 河海大学 一种基于深度学习和多示例学习的高光谱影像分类方法
CN110363239B (zh) * 2019-07-04 2021-08-13 中国人民解放军国防科技大学 一种面向多模态数据的小样本机器学习方法、系统和介质
CN110334765B (zh) * 2019-07-05 2023-03-24 西安电子科技大学 基于注意力机制多尺度深度学习的遥感影像分类方法
CN110414377B (zh) * 2019-07-09 2020-11-13 武汉科技大学 一种基于尺度注意力网络的遥感图像场景分类方法
CN110659665B (zh) * 2019-08-02 2023-09-29 深圳力维智联技术有限公司 一种异维特征的模型构建方法及图像识别方法、装置
CN110516687B (zh) * 2019-08-07 2022-02-08 北京工业大学 一种基于图像融合和改进ResNet的图像识别方法
CN110728192B (zh) * 2019-09-16 2022-08-19 河海大学 一种基于新型特征金字塔深度网络的高分遥感图像分类方法
CN110689077A (zh) * 2019-09-29 2020-01-14 福建师范大学 一种新型数字图像分类方法
CN110993102A (zh) * 2019-11-18 2020-04-10 温州医科大学 一种基于校园大数据的学生行为与心理检测结果的精准分析方法及系统
CN111131069B (zh) * 2019-11-25 2021-06-08 北京理工大学 一种基于深度学习策略的异常加密流量检测与分类方法
CN111027508B (zh) * 2019-12-23 2022-09-06 电子科技大学 一种基于深层神经网络的遥感图像覆被变化检测方法
CN111476301A (zh) * 2019-12-26 2020-07-31 山东中科先进技术研究院有限公司 一种基于机器学习的医学图像分类方法及系统
CN111178304B (zh) * 2019-12-31 2021-11-05 江苏省测绘研究所 基于全卷积神经网络的高分辨率遥感影像像素级解译方法
CN111191617B (zh) * 2020-01-02 2022-02-01 武汉大学 一种基于分层结构的遥感场景分类方法
CN111339935B (zh) * 2020-02-25 2023-04-18 西安电子科技大学 一种基于可解释cnn图像分类模型的光学遥感图片分类方法
CN111401145B (zh) * 2020-02-26 2022-05-03 三峡大学 一种基于深度学习与ds证据理论的可见光虹膜识别方法
CN111368776B (zh) * 2020-03-13 2024-03-22 长安大学 一种基于深度集成学习的高分辨率遥感图像分类方法
CN113515969B (zh) * 2020-04-09 2023-04-07 广西壮族自治区自然资源信息中心 基于卷积神经网络的多时态遥感影像地表覆盖分类方法
CN111612066B (zh) * 2020-05-21 2022-03-08 成都理工大学 基于深度融合的卷积神经网络的遥感图像分类方法
CN111800414A (zh) * 2020-07-03 2020-10-20 西北工业大学 一种基于卷积神经网络的流量异常检测方法及系统
CN111985532B (zh) * 2020-07-10 2021-11-09 西安理工大学 一种场景级上下文感知的情感识别深度网络方法
CN112348124B (zh) * 2021-01-05 2021-04-20 北京航空航天大学 一种基于数据驱动的微小故障诊断方法及装置
CN112733788B (zh) * 2021-01-20 2022-08-05 武汉大学 基于跨传感器迁移的高分辨率遥感影像不透水面提取方法
CN113344030B (zh) * 2021-05-11 2023-11-03 淮阴工学院 一种基于判决相关分析的遥感图像特征融合方法及系统
CN114994547B (zh) 2022-08-05 2022-11-18 中汽研新能源汽车检验中心(天津)有限公司 基于深度学习和一致性检测的电池包安全状态评估方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105550709A (zh) * 2015-12-14 2016-05-04 武汉大学 一种遥感影像输电线路走廊森林区域提取方法
CN106650781A (zh) * 2016-10-21 2017-05-10 广东工业大学 一种卷积神经网络图像识别方法及装置
CN107679462A (zh) * 2017-09-13 2018-02-09 哈尔滨工业大学深圳研究生院 一种基于小波的深度多特征融合分类方法
CN107844795A (zh) * 2017-11-18 2018-03-27 中国人民解放军陆军工程大学 基于主成分分析的卷积神经网络特征提取方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105550709A (zh) * 2015-12-14 2016-05-04 武汉大学 一种遥感影像输电线路走廊森林区域提取方法
CN106650781A (zh) * 2016-10-21 2017-05-10 广东工业大学 一种卷积神经网络图像识别方法及装置
CN107679462A (zh) * 2017-09-13 2018-02-09 哈尔滨工业大学深圳研究生院 一种基于小波的深度多特征融合分类方法
CN107844795A (zh) * 2017-11-18 2018-03-27 中国人民解放军陆军工程大学 基于主成分分析的卷积神经网络特征提取方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于卷积神经网络的遥感图像舰船目标检测;黄洁等;《北京航空航天大学学报》;20170119;第43卷(第9期);第1-8页 *

Also Published As

Publication number Publication date
CN108830296A (zh) 2018-11-16

Similar Documents

Publication Publication Date Title
CN108830296B (zh) 一种改进的基于深度学习的高分遥感影像分类方法
CN111860612B (zh) 无监督高光谱图像隐低秩投影学习特征提取方法
CN108764316B (zh) 基于深度卷积神经网络和多核学习的遥感图像场景分类方法
CN110738146B (zh) 一种目标重识别神经网络及其构建方法和应用
CN108596154B (zh) 基于高维特征选择与多级融合的遥感图像分类方法
CN107145836B (zh) 基于栈式边界辨别自编码器的高光谱图像分类方法
CN110728192A (zh) 一种基于新型特征金字塔深度网络的高分遥感图像分类方法
CN112347888B (zh) 基于双向特征迭代融合的遥感图像场景分类方法
CN113705580B (zh) 基于深度迁移学习的高光谱图像分类方法
CN112232151B (zh) 一种嵌入注意力机制的迭代聚合神经网络高分遥感场景分类方法
CN114398491A (zh) 一种基于知识图谱的语义分割图像实体关系推理方法
CN111401426B (zh) 基于伪标签学习的小样本高光谱图像分类方法
CN112488205A (zh) 基于优化kpca算法的神经网络图像分类识别方法
CN113139512B (zh) 基于残差和注意力的深度网络高光谱影像分类方法
US11941865B2 (en) Hyperspectral image classification method based on context-rich networks
CN111428758A (zh) 一种改进的基于无监督表征学习的遥感图像场景分类方法
CN109840518B (zh) 一种结合分类与域适应的视觉追踪方法
CN113536986B (zh) 一种基于代表特征的遥感图像中的密集目标检测方法
CN115564996A (zh) 一种基于注意力联合网络的高光谱遥感图像分类方法
CN112115806B (zh) 基于Dual-ResNet小样本学习的遥感影像场景精确分类方法
CN109145950B (zh) 一种基于图信号采样的高光谱图像主动学习方法
CN114329031A (zh) 一种基于图神经网络和深度哈希的细粒度鸟类图像检索方法
Al-Gaashani et al. Ensemble learning of lightweight deep convolutional neural networks for crop disease image detection
Wang et al. Active deep feature extraction for hyperspectral image classification based on adversarial learning
CN114596463A (zh) 一种基于图像的地块类型分类方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant