CN109800736B

CN109800736B - 一种基于遥感影像和深度学习的道路提取方法

Info

Publication number: CN109800736B
Application number: CN201910104050.7A
Authority: CN
Inventors: 于瑞云; 乔通; 汪宇庭
Original assignee: Northeastern University China
Current assignee: Northeastern University China
Priority date: 2019-02-01
Filing date: 2019-02-01
Publication date: 2023-07-21
Anticipated expiration: 2039-02-01
Also published as: CN109800736A

Abstract

本发明涉及一种基于遥感影像和深度学习的道路提取方法，步骤为：在遥感影像中，确定遥感影像的分辨率并截取，对截取遥感影像进行数据标注；使用Canny边缘检测算法对截取的遥感像对图像边缘进行提取，将提取得到的图像与原图像叠加，突出道路特征；搭建图像分类模型，在对基础的网络进行分类任务的训练中，留下低级的图像特征信息，并在特征提取模型构建的流程中，传递给下一级语义分割模型；搭建语义分割模型，用于在遥感影像中分割出道路信息；训练后，提取道路信息的网络参数将留存在分割模型中。本发明通过对图像进行预处理，突出道路特征，用以加速学习，加速语义分割模型的训练，可以实现提取遥感影像道路信息的效果。

Description

一种基于遥感影像和深度学习的道路提取方法

技术领域

本发明涉及一种计算机视觉领域，具体为一种基于遥感影像和深度学习的道路提取方法。

背景技术

随着空间信息技术的发展，以及从遥感数据中提取影像的相关技术愈发成熟，遥感影像的应用也逐渐从军事等专业领域走入日常生活中。处于正常工作状态的遥感卫星每次环绕至取样地点时，都可以采集广阔范围内的精细数据，因而遥感影像具有很高的实时性和有效性。除可见光波段外，卫星可以通过不同种类的传感器获取红边波段，黄边波段等各波段的数据，因而当前遥感影像的一大应用是在环境资源领域。在农业、林业、海洋、水利、生态环境等领域，不同波段的影像可以很方便的获取到诸如植被覆盖、地表温度、温室气体浓度等信息。

相关技术的高速发展带来了应用成本的下降，现在很多电子地图，诸如百度、高德等都集成了遥感影像地图，并免费提供服务给每一位用户。因此研究者们也不再仅仅局限于环境、救灾等专业领域的粗粒度分析，转而用遥感影像数据来解决如城市规划等领域中因数据获取成本过高而导致的数据集缺失问题。其中一个非常重要的问题就是自动路网提取，在飞速发展的城市中，道路结构很可能在数月内发生巨大的变化，提取的道路信息可以用来生成用于导航的路网地图，而健全的路网，往往意味着城市的建设状况更好，因此从遥感影像中提取的道路信息，也可以用来分析城市的经济信息。

近年来，随着图像处理利器——深度学习的飞速发展，在遥感影像上使用深度学习对遥感影像进行分割、分类的研究者也逐渐增加。在用于提取遥感影像数据时，深度学习技术与传统的图像处理相比，有更高的泛用性和准确性。深度学习是当前最受关注的机器学习方法，2012年深度学习模型获得了ImageNet冠军，让深度学习成为了近几年人工智能领域内的研究热点。深度学习最早起源于机器学习的连接学派，连接学派通过使用人工神经网络中权值的变化来模拟学习的过程。深度学习狭义的定义就是很多层(深)的神经网络，早期的连接学派受限于计算机计算性能的瓶颈，无法使用较为复杂的模型因而效果很差。深度学习通过提高神经网络层数，获得了提取复杂特征的能力，解决了此问题。

但是在对比传统学习算法与人类的学习过程时，研究者们发现一个很大的问题，即在于机器学习算法(包括深度学习)，通常都基于某一个特定领域下的特定学习过程，而人类在成长过程中，可以将已经学到的知识“迁移”到初次接触的新领域中。以图像分类举例，很多分类算法的测试都是从最简单的“猫狗分类”开始的，在训练和测试时，都要使用猫和狗的照片。一个使用猫狗照片训练出的算法，在测试时，如果遇见卡通的猫狗图片，就无法对其分类。而人类则不受此限制。显然，研究者不可能针对于世界上所有的问题都训练出一个算法，机器学习应当具有“举一反三”的能力。

发明内容

针对现有技术中学习算法不具有普适性、对于图片的识别要求太高或者只能单一识别某一具体情况等不足，本发明要解决的问题是提供一种学习能力强的基于深度学习和遥感影像的道路提取方法。

为解决上述技术问题，本发明采用的技术方案是：

本发明一种基于遥感影像和深度学习的道路提取方法，包括以下步骤：

1)在遥感影像中，确定遥感影像的分辨率并截取，对截取遥感影像进行数据标注；

2)使用Canny边缘检测算法对截取的遥感影像进行预处理，通过对图像边缘进行提取，并将提取得到的图像与原图像叠加，突出道路特征，用以加速学习；

3)搭建一个图像分类模型，通过在对基础的网络进行分类任务的训练中，在网络的参数存留下低级的图像特征信息，将上述图像特征信息在特征提取模型构建的流程中，传递给下一级的语义分割模型；

4)搭建一个语义分割模型，用于在遥感影像中分割出道路信息；在经过训练后，提取道路信息的网络参数将留存在分割模型中。

步骤1)中对截取遥感影像进行数据标注为：

101)观察并测量遥感影像所覆盖的地理范围，结合要提取的道路实际情况，截取图像分类和语义分割任务的原始数据是尺寸为256*256，即0.23像素每米分辨尺度的RGB遥感的影像；

102)定义道路为三级以上的公路，即双车道，8.5米宽以上的公路；

103)像素级的图像标注，在图像上标注道路像素的问题转化为对矩阵元素的二分类问题；

设图像矩阵M为:

其中，为图像矩阵，(R_ij，G_ij，B_ij)为图像矩阵M上的任意元素，对于尺寸为256*256的训练图像，有i＝256，j＝256；

104)对于图像矩阵M上的任意元素(R_ij，G_ij，B_ij)，设道路图像的像素集合为R，可生成一个新图像矩阵M’，其任意元素a_ij，有：

新的图像矩阵M'即为标注结果。

步骤2)中使用Canny边缘检测算法对截取的遥感影像进行预处理为：

201)用高斯滤波去除影像噪点，得到去噪后的图像；

202)使用Sobel算子，利用卷积操作计算遥感影像x和y两个方向的梯度，尺寸为3的Sobel算子，在x和y两个方向的卷积核如下:

203)提取边缘信息时，缩减边缘，只保留局部最大梯度，通过Canny算法使用两个阈值，来区分边缘像素，利用低阈值过滤掉噪声或颜色变化引起的小的梯度值，利用高阈值区分强边缘点和弱边缘点。

步骤3)搭建一个图像分类模型，通过在对基础的网络进行分类任务的训练中，在网络的参数存留下低级的图像特征信息，具体为：

301)以VGG-16网络作为基础模型，搭建图像分类模型卷积层；

302)搭建图像分类模型的全连接层；

303)图像分类模型使用Softmax结合交叉熵作为损失层，对于一个K类分类，Softmax的计算过程为：

为

其中，ai为向量a中任意一个元素，a_j为中间元素，j为中间变量，k为任意实数的向量维数；

304)训练图像分类模型，将图像的低层次特征保存在图像分类模型中。

步骤301)中，以VGG-16网络作为基础模型，搭建图像分类模型过程为：

30101)第1层和第2层均为64个卷积核，卷积核大小为3，步长为1，填充1的卷积层，用以在不改变尺寸大小的同时，引入足量的参数，不改变尺寸大小的意义在于不破坏特征在空间中的结构；

30102)第3层为步长和卷积核大小均为2的最大池化层，用以减小尺度，同时尽可能的保留特征信息。通过卷积对尺寸影响的规律计算，在第3层的池化输出的尺寸是112*112，而后第4层和第5层均为128个卷积核，卷积核大小为3，步长为1，填充1的卷积层，这两层会保持尺寸为112*112，只是通过128个卷积核，引入更多参数；

30103)第6层为步长和卷积核大小均为2的最大池化层，用以减小尺寸，将其降低为56*56。之后第7、第8层、第9层使用大小为3的卷积核，步长为1，充填为1，卷积核的数量为256个的卷积层。此卷积过程中，同样不会对尺寸造成改变；

30104)第10层为池化层，与前文的池化层参数相同，第11、12、13层均为卷积核的数量为512，卷积核大小为3，步长为1，充填1的卷积层。第14层到第17层，与第10层到第13层的结构相同；

30105)第18层是池化层，与前文池化层参数相同，然后是两个分别具有4096个神经元的全连接层，接着是具有1000个神经元的全连接层，用于分类训练。

步骤302)中，搭建图像分类模型的全连接层为：

30201)所有的卷积层和全连接层均使用线性整流函数作为激活函数；

30202)在最后3层的全连接层上，使用概率为0.5的dropout，防止网络在训练时发生过拟合。

步骤304)中，训练图像分类模型为：

30401)在使用遥感影像数据集进行分类训练前，先使用Image Net数据集进行预训练；

30402)对练图像分类模型再次使用道路遥感影像分类数据进行训练，弥补分类模型中，对遥感影像相关特征的缺失。

步骤4)中，搭建一个语义分割模型，用于在遥感影像图像中分割出道路信息；在经过训练后，提取道路信息的网络参数将留存在分割模型中，具体为：

401)利用FCN网络搭建语义分割模型，只在第一层卷积层中进行填充修改，并将最后的全连接层替换成卷积层；

402)反卷积操作，将图像恢复为与原图相同的尺寸；

403)累加特征图需要融合池化操作，对两个n×n特征图矩阵X，Y：

使用融合函数f(x，y)进行融合池化，有结果特征图FP：

用于累加的融合池化，有f(x+y)＝x+y；

其中，X、Y为n×n矩阵，x、y及其下标为矩阵中对应的元素；

404)对最后一层卷积层进行裁剪处理，将裁剪处理后得到的特征图像输入SoftmaxLossLayer层；

405)对语义分割模型进行训练，得到训练图像。

步骤401)中，利用FCN网络搭建语义分割模型，只在第一层卷积层中进行填充修改，并将最后的全连接层替换成卷积层，包括：

40101)对卷积层中的第一层做大小为100的填充；

40102)在池化层的第五层之后，语义分割模型将图像分类模型中的全连接层1，2，3替换为卷积层14，15，16；

步骤405)中，对语义分割模型进行训练，具体为：

40501)采取多阶段的训练方式，使用32倍特征缩放的语义分割模型进行训练；

40502)拷贝训练图像到16倍、8倍特征缩放的语义分割模型，并进行迭代次数的训练；

40503)在8倍特征缩放的语义分割模型上完成训练。

本发明具有以下有益效果及优点：

1.本发明基于遥感影像和深度学习的道路提取算法，可以通过输入一张遥感影像数据，在进行深度学习之前，通过对图像进行预处理，突出道路特征，用以加速学习；本发明采用搭建图像分类和语义分割两种模型，图像分类模型为CNN结构，语义分割模型为FCN结构，前者在网络的参数存留下非常低级的图像特征信息，将这些信息在特征提取模型构建的流程中，传递给下一级模型，可以加速语义分割模型的训练，可以实现提取遥感影像道路信息的效果。

图1为本发明中道路提取算法的方法流程图；

图2为本发明方法中使用labelme进行图像标注的示意图；

图3为本发明方法中使用高斯滤波的处理结果图；

图4为本发明方法中使用Canny处理的效果图；

图5为本发明方法中图像分类模型的示意图；

图6为本发明方法中使用32倍特征缩放的语义分割模型的示意图；

图7为本发明方法中使用的16倍特征缩放的语义分割模型的示意图；

图8为本发明方法中使用的8倍特征缩放的语义分割模型的示意图；

图9为本发明方法中语义分割模型训练输出数据；

图10为本发明完成道路提取的示意图。

具体实施方式

下面结合说明书附图对本发明作进一步阐述。

发明一种基于遥感影像和深度学习的道路提取方法，如图1所示，包括以下步骤：

2)使用Canny边缘检测算法对截取的遥感影像进行预处理，通过对图像边缘进行提取，并将提取得到的图像与原图像叠加，得到突出道路特征的叠加图像

4)搭建一个语义分割模型，用于在遥感影像图像中分割出道路信息；在经过训练后，提取道路信息的网络参数将留存在分割模型中。

步骤1)中对截取遥感影像进行数据标注，如图2所示，具体为：

102)定义道路为三级以上的公路，即双车道、8.5米宽以上的公路；

在当前的遥感影像尺度下，包括小区内的小路都可以观察得到，使用不同的道路定义，标注的训练集是不同的，这也会影响迁移学习的过程。考虑遥感影像图像区域对应的范围接近一平方公里，过于细小的道路在图像特征层面上差距太大，很难识别，而且对于整个区域内的影响较为有限，因此本发明中对道路的定义为三级以上的公路，即双车道、8.5米宽以上的公路；

设图像矩阵M为:

其中，M为图像矩阵，(R_ij，G_ij，B_ij)为图像矩阵M上的任意元素，对于尺寸为256*256的训练图像，有i＝256，j＝256；

新的图像矩阵M'即为标注结果。

步骤2)中，使用Canny边缘检测算法对截取的遥感影像进行预处理，通过对图像边缘进行提取，并将提取得到的图像与原图叠加，达到突出道路特征的效果。使用Canny边缘检测算法对截取的遥感影像进行预处理为：

201)用高斯滤波去除影像噪点，得到去噪后的图像；

由于噪点处往往具有很高的像素梯度，因此非常容易被识别为边缘。高斯滤波会让图像变得更平滑，单一的噪点在滤波过程中会被抹除；如图3所示，经过高斯滤波后的图像稍微变的模糊了一些，但是总体边界信息没有发生变化，通过平滑，原图像上的噪点像素被“摊平”到临近的像素中，减少了在噪点位置的像素梯度，进而减少了噪点被识别成边缘的概率。

202)使用Sobel算子，利用卷积(滤波)操作计算遥感影像x和y两个方向的梯度，尺寸为3的Sobel算子，在x和y两个方向的卷积核如下:

经典的Canny使用四个梯度算子分别计算水平、垂直以及两个对角线方向的梯度。本发明使用Sobel算子，利用卷积(滤波)操作计算x和y两个方向的梯度。

在提取边缘信息时，通常得到的梯度边缘是多个像素宽度，不利于精确的确定边缘信息。因此需要缩减边缘，只保留局部最大梯度。Canny算法使用两个阈值，来区分边缘像素，利用低阈值来过滤掉噪声或颜色变化引起的小的梯度值，利用高阈值来区分强边缘点和弱边缘点。通过调整两个阈值，可以对不同对比度的图像均实现较好的处理；

如图4所示，使用Canny边缘检测算法对高斯滤波图像进行进一步处理，使用大小为3*3的Sobel算子替代六向梯度计算，左右两天阈值不同，左图为小阈值与大阈值为100和300，右图为0。本实施例测试了多种阈值，通过观察认为在100和300的阈值设定下，边缘检测算法可以更多的突显出道路数据。

301)以VGG-16网络作为基础模型，搭建图像分类模型卷积层；

如图5所示，具体步骤如下：

30101)第1层(Conv 1_1)和第2层(Conv 1_2)均为64个卷积核，卷积核大小为3，步长为1，填充1的卷积层，用以在不改变尺寸大小的同时，引入足量的参数，不改变尺寸大小的意义在于不破坏特征在空间中的结构；

30102)第3层为步长和卷积核大小均为2的最大池化层(pool 1)，用以减小尺度，同时尽可能的保留特征信息。通过卷积对尺寸影响的规律计算，在第3层的池化输出的尺寸是112*112，而后第4层和第5层均为128个卷积核，卷积核大小为3，步长为1，填充1的卷积层，这两层会保持尺寸为112*112，只是通过128个卷积核，引入更多参数；

30103)第6层为步长和卷积核大小均为2的最大池化层(pool 2)，用以减小尺寸，将其降低为56*56。之后第7(Conv 3_1)、第8层(Conv3_2)、第9层(Conv 3_3)使用大小为3的卷积核，步长为1，充填为1，卷积核的数量为256个的卷积层。此卷积过程中，同样不会对尺寸造成改变；

30104)第10层为池化层(pool 3)，与前文的池化层参数相同，第11(Conv 4_1)、12(Conv 4_2)、13层(Conv 4_3)均为卷积核的数量为512，卷积核大小为3，步长为1，充填1的卷积层。第14层(pool 4)到第17层(Conv 5_3)，与第10层到第13层的结构相同；

30105)第18层是池化层(pool 5)，与前文池化层参数相同，然后是两个分别具有4096个神经元的全连接层(fc6，fc7)，接着是具有1000个神经元的全连接层(fc8)，这些全连接层，会降低维度，以便于在网络最后接入回归层，以用于分类训练；

302)搭建图像分类模型的全连接层；

30201)所有的卷积层和全连接层均使用线性整流函数(Rectified Linear Unit，ReLU)用作激活函数(Activation Function)；

30202)在最后几层的全连接层上，使用了概率为0.5的dropout。dropout是一种通过在网络中引入随机性，以防止网络在训练时发生过拟合的技术，自全连接网络诞生时，便被大量应用在全连接网络中，添加概率为0.5的dropout意味着，在每次前向计算时，该网络中会随机“丢弃”一半的神经元，这些被“丢弃”的神经元不会真的失去他们的权值信息，而只是不参加这一次前向运算或在这一次前向运算中输出被固定为0。在计算损失后，误差反向传播时，这一部分的神经元也不会被更新。在到了下一次的前向计算时，这些神经元会恢复成被删除前的状态，而本发明中的dropout是在所有的神经元中再随机找出要丢弃的神经元，重复上一流程。在整个训练过程中，每一次的dropout都是在概率分布上各自独立的。

为

其中，a_j为中间元素，j为中间变量，k为任意实数的向量维数；

利用该公式将一个含任意实数的K维向量“压缩”a到另一个K维实向量中，ai为向量a中任意一个元素，并且所有元素的和为1。

30402)对模型再使用上文中收集的道路遥感影像分类数据进行训练，以弥补分类模型中，对遥感影像相关特征的缺失。

步骤401)利用FCN网络搭建语义分割模型，此FCN网络结构的主体上与上文的CNN网络结构相似，只在第一层卷积层中进行了填充修改，并将最后的全连接层替换成了卷积层；具体按如下步骤进行：

40101)对卷积层1(Conv 1_1)做了大小为100的填充；

增加填充不会影响网络参数，但会影响对输入图片的处理。图像分类模型的图像输入尺寸是固定的，而语义分割模型则应当对任意尺寸的图像都能够正确的处理，如果不进行填充，则对常见的200*200左右的图像进行一系列的卷积后，最后得到的结果会非常接近1*1，在后续处理中无法解析不同位置的特征，也就无法对图像进行语义分割；

40102)在池化层的第五层(pool 5)之后，语义分割模型将图像分类模型中的全连接层1，2，3(图5中的fc6，fc7，fc8)替换为卷积层14，15，16(conv_6，conv_7，conv_8)；

步骤402)反卷积(也称转置卷积Deconvolution，Transposed Convolution)操作将图像恢复为与原图相同的尺寸；

所述步骤4.2按如下步骤进行：

40201)将最后一层卷积得到的特征图像(原图的1/32)通过反卷积放大两倍，与池化层4(pool4)后得到的特征图像(原图的1/16)在对应像素位置相加；

40202)将其结果通过反卷积放大2倍，并与池化层3后得到的特征图像(原图的1/8)相加，并将其结果放大八倍，与原图像尺寸相同，并最后对每个像素进行分类；

步骤403)累加特征图需要融合池化操作，对两个n×n特征图矩阵X，Y：

使用融合函数f(x，y)进行融合池化，有结果特征图FP：

用于累加的融合池化，有f(x+y)＝x+y；

其中，X、Y为矩阵，其下标代表对应的元素。

405)对语义分割模型进行训练，按如下步骤进行：

40501)采取多阶段的训练方式，先使用32倍特征缩放的语义分割模型进行训练；

如图6所示，32倍特征缩放的语义分割模型，与图像分类模型非常相似，up_conv_32中的32是指反卷积层的步长，也就是放大的倍数，与前面卷积层中的数字含义不同，前面卷积层的数字代表着卷积的序号

40502)拷贝权重到16倍特征缩放的语义分割模型，并进行一定迭代次数的训练；

如图7所示，刨除网络额外的卷积、反卷积，以及融合池化等部分外，网络主体结构没有发生变化，而这些被刨除的部分，并不含有可训练的参数，因而可以满足权重拷贝的要求；

40503)在8倍特征缩放的语义分割模型上完成训练，因为这三种不同特征缩放倍数的语义分割模型，主体网络结构是相同的，也就是说它们包含的权重是相同的，所以在拷贝权值过程中，不需要做任何的适配；

如图8所示，8倍特征缩放的语义分割网络结构更为复杂，但因为保留了pool3和pool4处的特征数据，因而可以得到最精细的语义分割结果；

如图10所示，即完成道路提取的效果。如图9所示，本发明在数据集上的准确率高达97％，即每100个像素，只有3个像素被错误归类，因此与实际效果相比，使用模型提取得到的道路图几乎没有肉眼可见的分别。

Claims

1.一种基于遥感影像和深度学习的道路提取方法，其特征在于包括以下步骤：

4)搭建一个语义分割模型，用于在遥感影像中分割出道路信息；在经过训练后，提取道路信息的网络参数将留存在分割模型中；

301)以VGG-16网络作为基础模型，搭建图像分类模型卷积层；

302)搭建图像分类模型的全连接层；

其中，a_i为向量a中任意一个元素，a_j为中间元素，j为中间变量；

304)训练图像分类模型，将图像的低层次特征保存在图像分类模型中；

30102)第3层为步长和卷积核大小均为2的最大池化层，用以减小尺度，同时尽可能的保留特征信息；通过卷积对尺寸影响的规律计算，在第3层的池化输出的尺寸是112*112，而后第4层和第5层均为128个卷积核，卷积核大小为3，步长为1，填充1的卷积层，这两层会保持尺寸为112*112，只是通过128个卷积核，引入更多参数；

30103)第6层为步长和卷积核大小均为2的最大池化层，用以减小尺寸，将其降低为56*56；之后第7、第8层、第9层使用大小为3的卷积核，步长为1，充填为1，卷积核的数量为256个的卷积层；此卷积过程中，同样不会对尺寸造成改变；

30104)第10层为池化层，与前文的池化层参数相同，第11、12、13层均为卷积核的数量为512，卷积核大小为3，步长为1，充填1的卷积层；第14层到第17层，与第10层到第13层的结构相同；

30105)第18层是池化层，与前文池化层参数相同，然后是两个分别具有4096个神经元的全连接层，接着是具有1000个神经元的全连接层，用于分类训练；

步骤302)中，搭建图像分类模型的全连接层为：

30202)在最后3层的全连接层上，使用概率为0.5的dropout，防止网络在训练时发生过拟合；

步骤304)中，训练图像分类模型为：

2.根据权利要求1所述的基于遥感影像和深度学习的道路提取方法，其特征在于：步骤1)中对截取遥感影像进行数据标注为：

设图像矩阵M为:

104)对于图像矩阵M上的任意元素(R_ij，G_ij，B_ij)，设道路图像的像素集合为R，可生成一个新图像矩阵M'，其任意元素a_ij，有：

新的图像矩阵M'即为标注结果。

3.根据权利要求1所述的基于遥感影像和深度学习的道路提取方法，其特征在于：步骤2)中使用Canny边缘检测算法对截取的遥感影像进行预处理为：

201)用高斯滤波去除影像噪点，得到去噪后的图像；

4.根据权利要求1所述的基于遥感影像和深度学习的道路提取方法，其特征在于：步骤4)中，搭建一个语义分割模型，用于在遥感影像图像中分割出道路信息；在经过训练后，提取道路信息的网络参数将留存在分割模型中，具体为：

402)反卷积操作，将图像恢复为与原图相同的尺寸；

使用融合函数f(x，y)进行融合池化，有结果特征图FP：

用于累加的融合池化，有f(x，y)＝x+y；

其中，X、Y为n×n矩阵，x、y及其下标为矩阵中对应的元素；

405)对语义分割模型进行训练，得到训练图像。

5.根据权利要求4所述的基于遥感影像和深度学习的道路提取方法，其特征在于：步骤401)中，利用FCN网络搭建语义分割模型，只在第一层卷积层中进行填充修改，并将最后的全连接层替换成卷积层，包括：

40101)对卷积层中的第一层做大小为100的填充；

40102)在池化层的第五层之后，语义分割模型将图像分类模型中的全连接层1，2，3替换为卷积层14，15，16。

6.根据权利要求4所述的基于遥感影像和深度学习的道路提取方法，其特征在于：步骤405)中，对语义分割模型进行训练，具体为：

40503)在8倍特征缩放的语义分割模型上完成训练。