CN113326799A

CN113326799A - 基于EfficientNet网络和方向学习的遥感影像道路提取方法

Info

Publication number: CN113326799A
Application number: CN202110689290.5A
Authority: CN
Inventors: 仪锋; 陈文韬; 李想; 刘欣悦; 特日根
Original assignee: Chang Guang Satellite Technology Co Ltd
Current assignee: Chang Guang Satellite Technology Co Ltd
Priority date: 2021-06-22
Filing date: 2021-06-22
Publication date: 2021-08-31

Abstract

基于EfficientNet网络和方向学习的遥感影像道路提取方法，涉及光学遥感影像处理与深度学习领域，解决现有技术中采用像素级语义分割道路提取不连续的问题，无法生成正确拓扑连接关系的问题，本发明利用EfficientNet在特征提取的优势，提高了图像的分割质量，并引入方向学习模块进而增强了道路的连通性。方向学习模块与语义分割模块共享编码器，在上采样部分加入膨胀系数分别为1、2、4的空洞卷积用来提高感受野，最后将语义分割与方向学习的特征进行相加融合。本发明基于EfficientNet网络和方向学习的遥感影像道路提取的方法。集成了方向学习和语义分割共享编码器下采样的设计，提高了道路提取的精度。

Description

基于EfficientNet网络和方向学习的遥感影像道路提取方法

技术领域

本发明涉及光学遥感影像处理与深度学习领域，具体涉及一种基于EfficientNet网络和方向学习的遥感影像道路提取方法。

背景技术

随着高空间分辨率光学遥感卫星技术的发展，遥感影像表现出其高空间分辨率，数据量大的特点，如何利用深度学习强大的特征表达能力提取遥感影像中的信息成为遥感图像识别领域重要问题。通过遥感影像道路提取的研究已经开展多年，但由于道路的材质和形状不同，同时加上树木、建筑、绿化带的遮挡的影响，使得通过遥感影像对道路精确提取成为技术难点。

传统基于深度学习和卷积神经网络的道路提取方法是：首先利用全卷积网络生成输入图片的特征，使用反卷积对特征图进行上采样，并将每一层图像特征与大小相同的特征进行拼接，最后根据所有的特征重建图像。

上述方法仍存在明显不足：1.对于输入复杂的遥感道路影像并不能精确的进行特征提取，图像的特征提取是语义分割的重要一个环节，其结果直接影响最后的分割精度。2.该方法道路提取结果往往会包含许多零散的道路片段，其原因是缺乏对连接关系的监督以及有效拓扑关系的约束。

发明内容

本发明为解决现有技术中采用像素级语义分割道路提取不连续的问题，无法生成正确拓扑连接关系的问题，提供一种基于EfficientNet网络和方向学习的遥感影像道路提取方法。

基于EfficientNet网络和方向学习的遥感影像道路提取方法，由以下步骤实现：

步骤一、获取遥感道路图像数据集，并对所述图像数据集进行划分，获得训练集和验证集；

步骤二、将步骤一的图像数据集中RGB图像输入到EfficientNet-B4网络，获得图像中道路的特征信息；

步骤三、将步骤二中获得的特征信息进行双分支上采样，分别为语义分割和方向学习；将语义分割和方向学习同时进行上采样，并融合下采样时的浅层特征信息，获得基于EfficientNet网络和方向学习的双分支训练模型；

步骤四、采用步骤一中的训练集对步骤三获得的训练模型进行训练，获得预测模型；

步骤五、采用步骤一中的验证集对预测模型进行预测，实现图像中的道路提取。

本发明的有益效果：本发明基于EfficientNet网络和方向学习的遥感影像道路提取的方法。集成了方向学习和语义分割共享编码器下采样的设计，提高了道路提取的精度。

(1)采用EfficientNet-B4网络模型进行下采样，并在上采样中融合浅层的特征信息减少了特征的丢失，进而提高了语义分割道路提取的精度。

(2)加入了方向学习的分支，解决了传统的像素级分割道路提取不连续的问题。

附图说明

图1为本发明的流程示意图；

图2为本发明的网络结构图；该网络模型由三部分组成：共享编码器，语义分割分支，方向学习分支。对于输入的图像，通过共享编码器获得图像道路的特征信息，采用多分支任务对特征信息进行上采样，分别得到语义分割分支和方向学习分支的预测结果，最后将两者结果相加融合。

图3为本发明在建筑遮挡情况下3×1024×1024遥感影像的分割效果图；其中，(a)为原始影像，(b)为真实标签，(c)为语义分割预测影像，(d)为方向学习预测影像，(e)为融合影像；

图4为本发明在植被遮挡情况下3×1024×1024遥感影像的分割效果图；其中，(a)为原始影像，(b)为真实标签，(c)为语义分割预测影像，(d)为方向学习预测影像，(e)为融合影像。

具体实施方式

结合图1至图3说明本实施方式，基于EfficientNet网络和方向学习的遥感影像道路提取方法，该方法由以下步骤实现：

基于EfficientNet网络和方向学习的遥感影像道路提取方法，包括以下步骤：

步骤1、制作基于DeepGlobe(全球卫星图像道路提取)遥感道路数据集，具体为：

对DeelGlobe数据集进行数据集划分，其中训练集图片数量为4696，验证集图片数量为1530，图片大小1024×1024；

将训练集和验证集进行数据扩充，对每张图片进行裁剪，其中裁剪大小为512×512，裁剪重叠区域为256，进而得到训练集数量为42264，验证集数量为6120。

步骤2、将步骤1中的RGB图像输入到EfficientNet-B4网络得到图像的特征信息；

步骤2.1、生成方向学习标签图像，其中方向向量数量设为30，判定方向角度为10，道路宽度设为7；

步骤2.2、具体步骤1中，3通道RGB图像大小为512×512×3，真实标签大小为512×512×1，方向标签大小为512×512×1，并输入到EfficientNet-B4网络中

步骤2.3、设置第一层模块，卷积核大小为3×3，步长为2，特征数为48；

步骤2.4、设置第二层模块，结构为一层的MBConv，MBConv卷积核大小为3×3，特征数为24，步长为1；

步骤2.5、设置第三层模块，结构为两层的MBConv，MBConv卷积核大小为3×3，特征数为32，步长为2；

步骤2.6、设置第四层模块，结构为两层的MBConv，MBConv卷积核大小为5×5，特征数为56，步长为2；

步骤2.7、设置第五层模块，结构为三层的MBConv，MBConv卷积核大小为3×3，特征数为112，步长为2；

步骤2.8、设置最后网络层，结构为八层的MBConv，MBConv卷积核大小为5×5，步长为2，提取特征图大小为16×16，特征数为1792。

步骤3、将步骤2中的特征信息进行双分支的上采样，分支1为语义分割，分支2为方向学习。将分支1、分支2同时进行上采样，并融合下采样时的浅层特征信息，得到基于EfficientNet网络和方向学习的双分支训练模型；

步骤3.1、具体步骤2.8中，将特征图为16×16×1792进行双分支上采样，分支1为道路分割，分支2为方向学习；

步骤3.2、将两个分支同时做上采样操作，通过反卷积将特征图恢复为32×32×512；分支1首先做膨胀系数分别为1、2、4的空洞卷积，之后通过跳跃连接融合步骤2.7的特征，接着做2次3×3的卷积，将特征图调整为32×32×512；分支2通过跳跃连接融合步骤2.7的特征，接着做2次3×3的卷积，将特征图调整为32×32×512；

步骤3.3、两个分支通过反卷积进行上采样操作，并将每层与下采样大小相同的模块层输出拼接，接着进行卷积操作，最后得到上采样每一层的大小为：64×64×256，128×128×128，256×256×64，512×512×32；

步骤3.4、同时对两个分支最后一层做卷积操作，分支1用sigmoid激活函数得到大小为512×512×1的输出，分支2用softmax归一化得到512×512×30的输出；

步骤3.5、将分支1的输出和真实标签值代入交叉熵损失函数(loss1)，并将分支2的输出和方向标签值代入交叉熵损失函数(loss2)，并对模型进入训练。

步骤4、对DeepGlobe遥感道路数据集使用上述模型进行训练；

步骤4.1、程序将在CPU为Intel SkyLake 6151，GPU为2*NVIDIA T4/2*16G，操作系统为Ubuntu的机器上运行，使用Python版本为3.6，torch版本为1.7.1；

步骤4.2、对数据集进行训练时超参数如下，初始学习速率learning_rate＝0.001，优化器RMSprop，批尺寸batch_size＝8，训练代数epochs＝80，语义分割类别n_classes＝1，方向学习类别n_classes＝30；

步骤4.3、每次迭代后，保存当前最优的mIOU(交并比)模型；

步骤5、将训练得到的模型参数作为预测模型，实现图像的道路提取。

步骤5.1、对于每一张验证集(3×1024×1024)原图像使用训练后的模型进行测试，设置语义分割的输出阈值为0.5，得到语义分割的二分类输出；

步骤5.2、设置方向学习的输出阈值为30，得到方向学习的二分类输出；

步骤5.3、将步骤5.1和步骤5.2输出结果进行相加融合，得到最终道路提取结果。

结合图3和图4说明本实施方式，图3和图4中，其(a)为原始影像，(b)为真实标签，(c)为语义分割预测影像，(d)为方向学习预测影像，(e)为融合影像。可以看出，采用语义分割分支和方向分支融合的方式能够有效的改善道路提取的精度，并能够保持道路的连通性和拓扑性。

Claims

1.基于EfficientNet网络和方向学习的遥感影像道路提取方法，其特征是：该方法由以下步骤实现：

2.根据权利要求1所述的基于EfficientNet网络和方向学习的遥感影像道路提取方法，其特征在于：步骤一中，对DeelGlobe数据集进行数据集划分，对每张图像进行裁剪，图像裁剪大小为512×512，裁剪重叠区域为256，分别获得训练集和验证集。

3.根据权利要求1所述的基于EfficientNet网络和方向学习的遥感影像道路提取方法，其特征在于：步骤二的具体过程为：

步骤二一、生成方向学习标签图像，其中方向向量数量设为30，判定方向角度为10，道路宽度设为7；

步骤二二、设定RGB图像为512×512×3，真实标签为512×512×1，步骤二一方向标签大小为512×512×1，并输入到EfficientNet-B4网络中；

步骤二三、设置EfficientNet-B4网络的第一层模块，卷积核大小为3×3，步长为2，特征数为48；设置第二层模块，结构为一层的MBConv，MBConv卷积核大小为3×3，特征数为24，步长为1；设置第三层模块，结构为两层的MBConv，MBConv卷积核大小为3×3，特征数为32，步长为2；设置第四层模块，结构为两层的MBConv，MBConv卷积核大小为5×5，特征数为56，步长为2；设置第五层模块，结构为三层的MBConv，MBConv卷积核大小为3×3，特征数为112，步长为2；

设置最后网络层，结构为八层的MBConv，MBConv卷积核大小为5×5，步长为2，提取特征图大小为16×16，特征数为1792。

4.根据权利要求1所述的基于EfficientNet网络和方向学习的遥感影像道路提取方法，其特征在于：

步骤三一、对步骤二获得的特征图，将特征图为16×16×1792进行双分支上采样；

步骤三二、将语义分割和方向学习同时进行上采样操作，通过反卷积将特征图恢复为32×32×512；

对语义分割做膨胀系数分别为1、2、4的空洞卷积，然后通过跳跃连接融合步骤二三的第五层模块的特征，做两次3×3的卷积，将特征图调整为32×32×512；

对方向学习通过跳跃连接融合步骤二三的第五层模块的特征，做两次3×3的卷积，将特征图调整为32×32×512；

步骤三三、两个分支通过反卷积进行上采样操作，将每层特征图与下采样大小相同的模块层输出拼接，进行卷积操作，最后获得上采样每一层图像的大小为：64×64×256，128×128×128，256×256×64，512×512×32；

同时对两个分支最后一层做卷积操作，语义分割采用sigmoid激活函数获得大小为512×512×1的输出，方向学习采用softmax归一化获得512×512×30的输出；

步骤三四、将语义分割的输出和步骤二二真实标签值代入交叉熵损失函数loss1，并将方向学习输出和步骤二二方向标签值代入交叉熵损失函数loss2，并对网络模型进行训练，获得基于EfficientNet网络和方向学习的双分支训练模型。

5.根据权利要求1所述的基于EfficientNet网络和方向学习的遥感影像道路提取方法，其特征在于：

步骤四中，设定数据集的训练时超参数，初始学习速率learning_rate＝0.001，优化器RMSprop，批尺寸batch_size＝8，训练迭代次数epochs＝80，语义分割类别n_classes＝1，方向学习类别n_classes＝30；

每次迭代后，保存当前最优的mIOU模型，作为预测模型。

6.根据权利要求1所述的基于EfficientNet网络和方向学习的遥感影像道路提取方法，其特征在于：

步骤五中，对于每一张验证集原图像使用步骤四训练后的模型进行测试，设置语义分割的输出阈值为0.5，获得语义分割的二分类输出；

设置方向学习的输出阈值为30，获得的二分类输出；

将所述语义分割和方向学习的输出结果进行相加融合，获得最终道路提取结果。