CN108681692B

CN108681692B - 一种基于深度学习的遥感图像内新增建筑识别方法

Info

Publication number: CN108681692B
Application number: CN201810314895.4A
Authority: CN
Inventors: 陈佳; 余卫宇; 王珂尧
Original assignee: South China University of Technology SCUT
Current assignee: South China University of Technology SCUT
Priority date: 2018-04-10
Filing date: 2018-04-10
Publication date: 2022-03-25
Anticipated expiration: 2038-04-10
Also published as: CN108681692A

Abstract

本发明公开了一种基于深度学习的遥感图像内新增建筑识别方法，包括下述步骤：获取样本图像：两时间段遥感图像和新增建筑背景图像；将具有原始尺寸的样本图像分别进行裁剪切割，得到小尺寸图像；对所有小尺寸图像进行数据增强处理；再将增强后的小尺寸两时间段遥感图像进行中心化及全局对比归一化，完成后再一一对应相减，得到遥感差异图；将遥感差异图和小尺寸新增建筑背景图像输入修改后的两种深度神经网络进行网络参数训练；再将待测遥感图像输入训练所得的两种深度神经网络，在网络的softmax输出层处进行模型融合，再对输出的初步结果进行修饰处理，得到最终的新增建筑识别图像。本发明方法具有遥感图像内新增建筑识别准确率高以及适用性广的优点。

Description

一种基于深度学习的遥感图像内新增建筑识别方法

技术领域

本发明涉及图像处理技术领域，特别涉及一种基于深度学习的遥感图像内新增建筑识别方法。

背景技术

基于深度学习的遥感图像内新增建筑识别依赖图像分割技术完成，其目的是寻找某特定国土区域内两时间段间的新增建筑，以辅助完成国土监察业务。

现有的传统图像分割算法包括：基于颜色和亮度的分割方法、基于区域的分割方法、基于图论的分割方法和基于能量泛函的分割方法。基于颜色和亮度的分割方法是通过图像的颜色或亮度对每个像素点进行划分，如K-Means算法即是将图像看作是由RGB三维特征组成的点集，对图像的所有像素点进行聚类实现分割目的；基于区域的分割方法，包含区域生长法和分水岭法，是按照相似性准则将图像分割为多个区域。基于图论的分割方法将图像映射为带权无向图，移除特定的边，将图划分为若干个子图实现图像分割；基于能量泛函的分割方法主要包括活动轮廓模型以及其衍生方法。上述方法通常需要先验条件进行初始化，如K-means算法在分割图像前需指定分割区域的数量、分水岭方法必须指定分割部分的关键点、活动轮廓模型需设置初始化轮廓，这些先验条件要求都局限了图像分割研究的发展。

实现遥感图像内的新增建筑识别业务非常具有挑战性。因拍摄天气、高度、云层遮挡等外界干扰，使得可获取的遥感图像清晰度和完整度均低于其他类别图像。除去数据特点，本业务需要学习图像内的新增建筑特征信息并完成尽可能多的新增建筑识别任务，本方法引用修改后的深层卷积神经网络完成新增建筑识别业务。

发明内容

本发明的目的在于克服现有技术中的缺点与不足，提供一种基于深度学习的遥感图像内新增建筑的识别方法，通过对样本图像(两时间段的遥感图像和新增建筑背景图像)做预处理，然后将训练样本输入修改的深度卷积神经网络进行训练，再将待测遥感图像输入训练所得的两种深度神经网络，在网络的 softmax输出层处进行模型融合，获取最佳图像分割模型，并对识别结果进行后端处理，能够较准确的获得遥感图像内新增建筑识别图像。

为实现以上目的，本发明采取如下技术方案：

一种基于深度学习的遥感图像内新增建筑识别方法，包括下述步骤：

S1、首先人工在两个不同时间段内对某特定区域采集两张遥感图像，对其中部分新增建筑进行标记，以获得对应的新增建筑背景图像；

S2、利用所设计的图像滑动切割算法，将具有原始尺寸的两张遥感图像及对应的新增建筑背景图像进行切割裁剪，得到若干张小尺寸图像；所述小尺寸图像大小为256x256；

S3、对两个时间段的小尺寸遥感图像及对应的小尺寸新增建筑背景图像进行数据增强处理，分别进行旋转、镜像、以及尺度缩放的操作；将经过数据增强处理的小尺寸新增建筑背景图像作为第一训练样本；

S4、对步骤S3中经过数据增强处理的所有小尺寸遥感图像分别进行中心化及全局对比度归一化的操作；接着，将处理后的两个时间段的小尺寸遥感图像进行一一对应相减，得到遥感差异图；将遥感差异图作为第二训练样本，辅助网络参数训练；

S5、分别将基础的VGG-19及ResNet-50卷积神经网络修改为图像分割模型，即DeepLab网络结构；再将第一训练样本和第二训练样本，均分别输入修改后的两种DeepLab网络结构进行网络参数训练；

S6、将待测遥感图像输入步骤S5中训练所得的两种DeepLab网络结构进行新增建筑识别测试，在两种DeepLab网络结构的softmax输出层处进行模型融合，使最终所得的图像分割模型结合两种DeepLab网络结构的学习能力，得到初步的新增建筑识别结果图像；

S7、针对步骤S6中得到的新增建筑识别结果图像，首先进行全连接CRF 处理；然后进行形态学膨胀处理，将结果图像汇总中由于网络分割不细致导致的黑点置白，得到最终的新增建筑识别结果图像。

作为优选的技术方案，步骤S1中对于两个时间段的两张遥感图像，根据先验知识通过人工标记部分新增建筑，新增建筑像素值设置为1，其余设置为0。

作为优选的技术方案，步骤S2中，所述图像滑动切割算法：将裁剪坐标框同时应用在两张遥感图像及一张新增建筑背景图像上，使三张原始尺寸图像剪裁后所得的小尺寸图像仍然一一对应，且每一张裁剪所得的小尺寸新增建筑背景图像中，至少含有一个非0像素点。

作为优选的技术方案，步骤S3的具体过程如下：

S31、首先对所有小尺寸图像进行旋转增强处理；

S32、然后将旋转增强处理后的小尺寸图像进行上下、左右、以及上下左右镜像处理；

S33、最后对镜像处理后的小尺寸图像进行多尺度缩放处理。

作为优选的技术方案，步骤S31中小尺寸图像进行旋转增强处理，旋转角度为：90度、180度、270度，使得小尺寸图像数据扩大至4倍；

步骤S32中将旋转增强处理后的小尺寸图像进行上下、左右、上下左右镜像处理，使得旋转增强处理后的小尺寸图像数据扩大至16倍；

步骤S33中针对镜像处理后的小尺寸图进行多尺度缩放操作，缩放比例为：0.8、1.2、1.4，使得镜像处理后的小尺寸图像数据扩大至64倍。

作为优选的技术方案，步骤S4中，对经过数据增强处理的两个时间段的小尺寸遥感图像分别进行中心化及全局对比度归一化的操作，具体利用如下公式：

x′＝(x-mean)/var

其中mean为整张遥感图像的均值，var为整张遥感图像的方差，x为遥感图像像素值。

作为优选的技术方案，步骤S5中，将VGG-19网络修改为DeepLab网络结构的具体方法如下：

从输入层至输出层依次连接为：卷积层conv1、卷积层conv2、池化层 maxpool1、卷积层conv3、卷积层conv4、池化层maxpool2、卷积层conv5、卷积层conv6、卷积层conv7、卷积层conv8、池化层maxpool3、卷积层conv9、卷积层conv10、卷积层conv11、卷积层conv12、池化层maxpool4、卷积层conv13、卷积层conv14、卷积层conv15、卷积层conv16、以及池化层maxpool5；

将池化层maxpool4、池化层maxpool5的池化步长stride修改为1；将卷积层conv13、卷积层conv14、卷积层conv15、以及卷积层conv16中的卷积核修改为孔径系数为2的带孔卷积核；在池化层maxpool5后，连接空间金字塔ASPP 结构；在空间金字塔ASPP结构后连接Eltwise层，Eltwise层合并空间金字塔 ASPP结构的计算结果；其中，所述空间金字塔ASPP结构是在网络的最末池化 pool层后连接4个包含三层全连接层的分支结构，每个分支结构的第一层是带孔卷积层，孔径系数分别为：6、12、18、24；最后，在Eltwise层后连接softmax 层，得到网络输出结果；每次卷积操作后通过ReLu函数激活图像特征得到特征映射图。

作为优选的技术方案，步骤S5中，将ResNet-50网络修改为DeepLab结构的具体方法如下：

从输入层至输出层依次连接为：池化层maxpool1、池化层maxpool2、包含3 个Block模块的残差结构Block1、包含4个Block模块的残差结构Block2、包含6个 Block模块的残差结构Block3、以及包含3个Block模块的残差结构Block4；

其中，残差结构Block1～Block4存在四种不同的配置，但其中所有Block模块均由三层卷积层组合得到，且第一层卷积层可直接连接至第三卷积层；将残差结构Block2的第一个Block模块的第一层卷积层的卷积滑动步长stride修改为2；将残差结构Block3的所有6个Block模块的第二层卷积层的卷积核修改为孔径系数为2的带孔卷积；将残差结构Block4的所有3个Block模块的第二层卷积层的卷积核修改为孔径系数为4的带孔卷积；在所有Block模块连接完成后，连接空间金字塔ASPP结构；在空间金字塔ASPP结构后连接Eltwise层，Eltwise层合并空间金字塔ASPP结构的计算结果；最后，在Eltwise层后连接softmax层，得到网络输出结果；每次卷积操作后通过ReLu函数激活图像特征得到特征映射图，每一卷积层前均连接BN层进行数据分布调整。

作为优选的技术方案，步骤S6中，对两种DeepLab网络结构的softmax输出层进行模型融合操作，具体步骤如下：

S61、将待测遥感图像分别输入两种图像分割模型进行新增建筑识别测试，将测试所得的softmax层输出数据保存为.npy矩阵数据格式；矩阵数据保存的内容是经图像分割模型计算后，每个像素点属于0或1类别的概率值；

S62、计算步骤S61获得的两个.npy矩阵的均值矩阵，得到新的softmax矩阵数据；利用argmax函数处理所述的softmax矩阵数据，获得每个像素点的最终所属类别，实现了两种模型的融合，得到图像分割模型的分割结果图像，即初步的新增建筑识别结果图像。

作为优选的技术方案，步骤S7中，所述全连接CRF处理，具体是利用待测遥感图像的RGB及空间位置x、y信息，对分割结果图像进行惩罚学习并重新分配部分像素点的所属类别，实现图像边缘的修饰。

本发明相对于现有技术具有如下的优点和效果：

(1)本发明遥感图像内的新增建筑识别方法中，首先对比所获取的某特定国土区域两时间段遥感图像，对部分新增建筑进行人工标记，得到新增建筑的对应label图像；然后利用图像滑动切割算法，将整张的大尺寸两时间段遥感图像及新增建筑label图像进行裁剪切割，得到若干张256x256小尺寸图像；对已获取的所有图像进行数据增强处理，分别进行旋转、镜像、尺寸缩放等操作扩大图像数据；将增强后的两时间段遥感图像分别进行中心化及全局对比度归一化，完成后再一一对应相减，得到差异图；将基础的VGG-19及ResNet-50卷积神经网络修改为图像分割网络结构：DeepLab结构，输入差异图及对应label图像进行网络参数训练得到分割模型；将待识别遥感图像输入以上所得分割模型，在两种DeepLab网络结构的softmax输出层处进行模型融合，获得融合后的新增建筑识别图像；最后对所得结果图像进行全连接CRF及形态学膨胀处理，修饰图像边缘并去除图像内的小片空洞区域，得到最终的新增建筑识别结果。可见，本发明基于深度学习理论，通过对大量遥感图像进行网络训练及网络后端处理，得到一套最佳的遥感图像新增建筑识别算法，从而完成待测遥感图像内新增建筑识别任务；本发明方法不需要先验条件进行初始化且不受先验条件限制，具有遥感图像内新增建筑识别准确率高的优点，针对遥感图像内的新增建筑识别问题具有较强的适用性，可辅助国土监测工作。

(2)本发明遥感图像内新增建筑识别方法中，使用由VGG-19及ResNet-50 这两种深层卷积神经网络修改得到的DeepLab网络结构进行图像分割；对两种网络的softmax输出层进行模型融合操作，使所得分割网络模型结合两种卷积神经网络的学习能力，得到最佳的分割模型。

附图说明

图1是本实施例的基于深度学习的遥感图像内新增建筑识别方法流程图；

图2(a)和图2(b)是本实施例的两个不同时间段的两张原始遥感图像；

图3(a1)～图3(a4)、图3(b1)～图3(b4)、图3(c1)～图3(c4) 分别是本实施例的第一个时间段的小尺寸遥感图像、第二个时间段的小尺寸遥感图像、以及小尺寸新增建筑背景图像进行旋转操作的结果图像；其中，图3 (a1)、图3(b1)和图3(c1)分别是相应小尺寸图像的原图；图3(a2)、图3(b2)和图3(c2))分别是相应小尺寸图像做旋转90度增强处理；图3(a3)、图3(b3)和图3(c3)分别是相应小尺寸图像做旋转180度增强处理；图3(a4)、图3(b4)和图3(c4)分别是相应小尺寸图像做旋转270度增强处理；

图4(a1)～图4(a4)、图4(b1)～图4(b4)、图4(c1)～图4(c4) 分别是本实施例的第一个时间段的小尺寸遥感图像、第二个时间段的小尺寸遥感图像、以及小尺寸新增建筑背景图像进行镜像操作的结果图像；其中，图4 (a1)、图4(b1)和图4(c1)分别是相应小尺寸图像的原图；图4(a2)、图4(b2)和图4(c2))分别是相应小尺寸图像做左右镜像操作；图4(a3)、图4(b3)和图4(c3)分别是相应小尺寸图像做上下镜像操作；图4(a4)、图4(b4)和图4(c4)分别是相应小尺寸图像做上下左右镜像操作；

图5(a1)～图5(a4)、图5(b1)～图5(b4)、图5(c1)～图5(c4) 分别是本实施例的第一个时间段的小尺寸遥感图像、第二个时间段的小尺寸遥感图像、以及小尺寸新增建筑背景图像进行多尺度缩放操作的结果图像；其中，图5(a1)、图5(b1)和图5(c1)分别是相应小尺寸图像的原图；图5(a2)、图5(b2)和图5(c2))分别是相应小尺寸图像做0.8倍缩小操作；图5(a3)、图5(b3)和图5(c3)分别是相应小尺寸图像做1.2倍放大操作；图5(a4)、图5(b4)和图5(c4)分别是相应小尺寸图像做1.4倍放大操作；

图6是本实施例的ResNet残差结构Block模块结构图；

图7(a)和图7(b)是本实施例的DeepLab网络结构中的不同孔径系数的带孔卷积核结构图；

图8是本实施例的DeepLab网络结构的空间金字塔ASPP结构图；

图9是本实施的全连接CRF结构图。

具体实施方式

为了使本发明的目的、技术方案以及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步的详细说明。应当理解，此处所描述的具体实施例仅仅用于解释本发明，并不限于本发明。

实施例

如图1所示，一种基于深度学习的遥感图像内新增建筑识别方法，包括下述步骤：

S1、首先人工在两个不同时间段内对某特定区域采集两张遥感图像，对其中部分新增建筑进行标记，以获得对应的新增建筑背景(label)图像；

对于两个时间段的两张遥感图像，根据先验知识通过人工标记部分新增建筑，新增建筑像素值设置为1，其余设置为0。

S2、如图2(a)和图2(b)所示为两时间段原始遥感图像，利用所设计的图像滑动切割算法，将具有原始尺寸的两张遥感图像及对应的新增建筑背景图像进行切割裁剪，得到若干张小尺寸图像；所述小尺寸图像大小为256x256；所述图像滑动切割算法的思路为：将裁剪坐标框同时应用在两张遥感图像及一张新增建筑背景图像上，使三张原始尺寸图像剪裁后所得的小尺寸图像仍然一一对应，且每一张裁剪所得的小尺寸新增建筑背景图像中，至少含有一个非0像素点。

S3、对两个时间段的小尺寸遥感图像及对应的小尺寸新增建筑背景图像进行数据增强处理，分别进行旋转、镜像、以及尺度缩放的操作；将经过数据增强处理的小尺寸新增建筑背景图像作为第一训练样本；数据增强处理的具体过程如下：

S31、首先对所有小尺寸图像进行旋转增强处理，旋转角度为：90度、180 度、270度，使得小尺寸图像数据扩大至4倍；如图3(a1)～图3(a4)、图3 (b1)～图3(b4)、图3(c1)～图3(c4)所示；

S32、然后将旋转增强处理后的小尺寸图像进行上下、左右、以及上下左右镜像处理，使得旋转增强处理后的小尺寸图像数据扩大至16倍；图4(a1)～图4(a4)、图4(b1)～图4(b4)、图4(c1)～图4(c4)所示

S33、最后对镜像处理后的小尺寸图像进行多尺度缩放处理，缩放比例为： 0.8、1.2、1.4，使得镜像处理后的小尺寸图像数据扩大至64倍；图5(a1)～图5(a4)、图5(b1)～图5(b4)、图5(c1)～图5(c4)；

S4、对步骤S3中经过数据增强处理的所有小尺寸遥感图像分别进行中心化及全局对比度归一化的操作；具体利用如下公式：

x′＝(x-mean)/var

其中mean表示中心化的整张遥感图像的均值，var表示全局对比度归一化的整张遥感图像的方差，x为遥感图像像素值。

接着，将处理后的两个时间段的小尺寸遥感图像进行一一对应相减，得到遥感差异图；将遥感差异图作为第二训练样本，辅助网络参数训练；

S5、分别将基础的VGG-19及ResNet-50卷积神经网络修改为图像分割模型，即DeepLab网络结构；再将第一训练样本和第二训练样本，均分别输入修改后的两种DeepLab网络结构进行网络参数训练；如表1所示为基础VGG-19卷积神经网络结构；如表2所示为基础ResNet-50卷积神经网络结构：

表1

表2

将VGG-19网络修改为DeepLab网络结构的具体方法如下：

将池化层maxpool4、池化层maxpool5的池化步长stride修改为1，防止池化缩小feature map尺寸；将如图7(a)所示的卷积层conv13、卷积层conv14、卷积层 conv15、以及卷积层conv16中的孔径系数rate＝1的普通卷积核，修改为如图7(b) 所示的孔径系数为2的带孔卷积核；在池化层maxpool5后，连接空间金字塔ASPP 结构；在空间金字塔ASPP结构后连接Eltwise层，Eltwise层合并空间金字塔ASPP 结构的计算结果；其中，如图8所示，所述空间金字塔ASPP结构是在网络的最末池化pool层后连接4个包含三层全连接层的分支结构，每个分支结构的第一层是带孔卷积层，孔径系数分别为：6、12、18、24；本实施例的空间金字塔结构使得网络更充分的学习新增建筑特征并进行多尺度融合，使网络学习到的特征具有更好的可分性，对于每个像素点的类别判断更准确，从而得到最佳的图像分割结果；其中，带孔卷积不增加所需训练的参数，可扩大当前featuremap的感受野，使得网络可使用更少量的池化pool层，从而保护feature map的尺寸大小；最后，在Eltwise层后连接softmax层，得到网络输出结果；每次卷积操作后通过ReLu 函数激活图像特征得到特征映射图。

将ResNet-50网络修改为DeepLab结构的具体方法如下：

从输入层至输出层依次连接为：池化层maxpool1、池化层maxpool2、包含3 个Block模块的残差结构Block1、包含4个Block模块的残差结构Block2、包含6个Block模块的残差结构Block3、以及包含3个Block模块的残差结构Block4；

其中，残差结构Block1～Block4存在四种不同的配置，但其中所有Block 模块均由三层卷积层组合得到，且第一层卷积层可直接连接至第三卷积层，如图6所示；使得残差结构的参数学习更加容易，只需要学习最优与当前的残差即可；另外该结构还有较少训练参数量的作用，在第一卷积层处首先降纬处理，减少feature map数量，然后在第三层卷积层处进行升纬处理，将feature map张数恢复至所需的数值；

将残差结构Block2的第一个Block模块的第一层卷积层的卷积滑动步长 stride修改为2；将残差结构Block3的所有6个Block模块的第二层卷积层的卷积核修改为孔径系数为2的带孔卷积，以此保证feature map的感受野；将残差结构Block4的所有3个Block模块的第二层卷积层的卷积核修改为孔径系数为 4的带孔卷积，以此保证feature map的感受野；在所有Block模块连接完成后，连接空间金字塔ASPP结构；在空间金字塔ASPP结构后连接Eltwise层，Eltwise 层合并空间金字塔ASPP结构的计算结果；最后，在Eltwise层后连接softmax 层，得到网络输出结果；每次卷积操作后通过ReLu函数激活图像特征得到特征映射图，每一卷积层前均连接BN层进行数据分布调整，防止网络出现剃度弥散及爆炸等问题，且同时加快网络训练速度。

对两种DeepLab网络结构的softmax输出层进行模型融合操作，具体步骤如下：

S61、将待测遥感图像分别输入两种图像分割模型进行新增建筑识别测试，将测试所得的softmax输出层输出数据保存为.npy矩阵数据格式；矩阵数据保存的内容是经图像分割模型计算后，每个像素点属于0或1类别的概率值；所述 softmax输出层为指数操作；

S7、针对步骤S6中得到的新增建筑识别结果图像，首先进行全连接CRF 处理；具体是利用待测遥感图像的RGB及空间位置x、y信息，对分割结果图像进行惩罚学习并重新分配部分像素点的所属类别，实现图像边缘的修饰；如图9所示为全连接CRF结构图；

然后进行形态学膨胀处理，将经过全连接CRF处理的分割结果图像汇总中由于网络分割不细致导致的黑点置白，得到最终的新增建筑识别结果图像；因为考虑实际业务，在被检测出一大块的新增建筑中，其中含有一小部分的黑点(白色新增建筑，黑色为其他)是可以认为是由于网络分割结果不“细致”导致的，所以使用形态学的膨胀操作，把黑点置白，这更符合实际的业务。

以上所述实施例仅表达了本发明的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对本发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变形和改进，这些都属于本发明的保护范围。因此，本发明专利的保护范围应以权利要求所述为准。

Claims

1.一种基于深度学习的遥感图像内新增建筑识别方法，其特征在于，包括下述步骤：

S7、针对步骤S6中得到的新增建筑识别结果图像，首先进行全连接CRF处理；然后进行形态学膨胀处理，将经过全连接CRF处理的结果图像汇总中由于网络分割不细致导致的黑点置白，得到最终的新增建筑识别结果图像。

2.根据权利要求1所述的基于深度学习的遥感图像内新增建筑识别方法，其特征在于，步骤S1中对于两个时间段的两张遥感图像，根据先验知识通过人工标记部分新增建筑，新增建筑像素值设置为1，其余设置为0。

3.根据权利要求1所述的基于深度学习的遥感图像内新增建筑识别方法，其特征在于，步骤S2中，所述图像滑动切割算法：将裁剪坐标框同时应用在两张遥感图像及一张新增建筑背景图像上，使三张原始尺寸图像剪裁后所得的小尺寸图像仍然一一对应，且每一张裁剪所得的小尺寸新增建筑背景图像中，至少含有一个非0像素点。

4.根据权利要求1所述的基于深度学习的遥感图像内新增建筑识别方法，其特征在于，步骤S3的具体过程如下：

S31、首先对所有小尺寸图像进行旋转增强处理；

S33、最后对镜像处理后的小尺寸图像进行多尺度缩放处理。

5.根据权利要求4所述的基于深度学习的遥感图像内新增建筑识别方法，其特征在于，步骤S31中小尺寸图像进行旋转增强处理，旋转角度为：90度、180度、270度，使得小尺寸图像数据扩大至4倍；

6.根据权利要求1所述的基于深度学习的遥感图像内新增建筑识别方法，其特征在于，步骤S4中，对经过数据增强处理的两个时间段的小尺寸遥感图像分别进行中心化及全局对比度归一化的操作，具体利用如下公式：

x′＝(x-mean)/var

7.根据权利要求1所述的基于深度学习的遥感图像内新增建筑识别方法，其特征在于，步骤S5中，将VGG-19网络修改为DeepLab网络结构的具体方法如下：

从输入层至输出层依次连接为：卷积层conv1、卷积层conv2、池化层maxpool1、卷积层conv3、卷积层conv4、池化层maxpool2、卷积层conv5、卷积层conv6、卷积层conv7、卷积层conv8、池化层maxpool3、卷积层conv9、卷积层conv10、卷积层conv11、卷积层conv12、池化层maxpool4、卷积层conv13、卷积层conv14、卷积层conv15、卷积层conv16、以及池化层maxpool5；

将池化层maxpool4、池化层maxpool5的池化步长stride修改为1；将卷积层conv13、卷积层conv14、卷积层conv15、以及卷积层conv16中的卷积核修改为孔径系数为2的带孔卷积核；在池化层maxpool5后，连接空间金字塔ASPP结构；在空间金字塔ASPP结构后连接Eltwise层，Eltwise层合并空间金字塔ASPP结构的计算结果；其中，所述空间金字塔ASPP结构是在网络的最末池化pool层后连接4个包含三层全连接层的分支结构，每个分支结构的第一层是带孔卷积层，孔径系数分别为：6、12、18、24；最后，在Eltwise层后连接softmax层，得到网络输出结果；每次卷积操作后通过ReLu函数激活图像特征得到特征映射图。

8.根据权利要求1所述的基于深度学习的遥感图像内新增建筑识别方法，其特征在于，步骤S5中，将ResNet-50网络修改为DeepLab结构的具体方法如下：

从输入层至输出层依次连接为：池化层maxpool1、池化层maxpool2、包含3个Block模块的残差结构Block1、包含4个Block模块的残差结构Block2、包含6个Block模块的残差结构Block3、以及包含3个Block模块的残差结构Block4；

9.根据权利要求1所述的基于深度学习的遥感图像内新增建筑识别方法，其特征在于，步骤S6中，对两种DeepLab网络结构的softmax输出层进行模型融合操作，具体步骤如下：

10.根据权利要求1所述的基于深度学习的遥感图像内新增建筑识别方法，其特征在于，步骤S7中，所述全连接CRF处理，具体是利用待测遥感图像的RGB及空间位置x、y信息，对分割结果图像进行惩罚学习并重新分配部分像素点的所属类别，实现图像边缘的修饰。