CN111325076B

CN111325076B - 一种基于U-net与Seg-net网络融合的航空地面建筑物提取方法

Info

Publication number: CN111325076B
Application number: CN201811543246.8A
Authority: CN
Inventors: 孟祥杰; 乐国庆; 苏帅; 刘振; 许静
Original assignee: Beijing Huahang Radio Measurement Research Institute
Current assignee: Beijing Huahang Radio Measurement Research Institute
Priority date: 2018-12-17
Filing date: 2018-12-17
Publication date: 2023-05-16
Anticipated expiration: 2038-12-17
Also published as: CN111325076A

Abstract

本发明提供一种基于U‑net与Seg‑net网络融合的航空地面建筑物提取方法，包括以下步骤：步骤S1、训练样本制作；步骤S2、深度学习模型训练；步骤S3、测试训练模型；步骤S4、输出结果，获取地面建筑物在原图中的位置。本发明应用于无人机光电吊舱对地的光电侦查，转化为图像语义分割任务，有效提取地面建筑物进行分析，提高识别效果。

Description

一种基于U-net与Seg-net网络融合的航空地面建筑物提取方法

技术领域

本发明涉及计算机视觉领域的予以分割问题，主要应用于无人机光电吊舱对地的光电侦查，并对重点区域的目标建筑物提取与分析。

背景技术

在航空飞行器对地面侦察和作战过程中，快速准确地获得地物类型信息，尤其是地面建筑物信息，对于目标识别和精确打击具有重要的意义。

随着机载设备性能提升，航空图像对地面建筑物区域成像分辨率越来高，其成像呈现如下特点：(1)地面建筑物的几何结构更加清晰；(2)地面建筑物的位置布局更加明显；(3)地面建筑内部的纹理特征信息更加清晰。

在传统的方法中，主要通过阈值分割、纹理信息、轮廓匹配等信息，实现对地面建筑物目标的分割和提取。但这些方法识别效果不好。

发明内容

针对上述的问题，本发明提供一种基于U-net与Seg-net网络融合的航空地面建筑物提取方法，应用于无人机光电吊舱对地的光电侦查，转化为图像语义分割任务，有效提取地面建筑物进行分析，提高识别效果。

本发明包括以下步骤：

步骤S1、训练样本制作:

选择现有的图像数据库，进行裁剪及处理，获得训练样本；

步骤S2、深度学习模型训练:

选取U-net和Seg-net网络的框架，使用训练样本，分别进行模型训练，最后获得两个训练模型；

步骤S3、测试训练模型:

步骤S301、首先对原图像进行切割，然后通过步骤S2得到的模型对每一张图像进行前向预测分割，获得两张MASK结果图像；

步骤S302、对两张结果图的每个像素点采取投票表决其类别，票数最多的类别即为该像素点的类别；

步骤S4、输出结果:

输出二值化的标记分割结果，并可以通过标记位置获取地面建筑物在原图中的位置。

进一步，所述步骤S1的训练样本中含有标注信息。

进一步，所述步骤S1的训练样本做裁剪、旋转、镜像、光照调整、增加噪声操作。

进一步，所述步骤S3还利用形态学处理孤立像素点的分类或修复断裂边缘。

进一步，所述步骤S3中对原图像的切割采用有重叠的裁剪方式。

进一步，步骤S302中投票为，两张结果图中相同位置像素点的类别以U-net预测的类别为优先级进行最终类别的决策。

本发明有益效果如下：

本发明将深度学习的语义分割技术应用于航空飞行器对航空图像地面建筑物提取上。根据航空光电图像数据集及自有数据集，构建训练集和测试集。利用训练集在端到端的U-net与Seg-net融合网络架构进行训练，得到模型，对测试集进行测试，然后将测试结果进行融合，提取地面建筑物。U-net与Seg-net融合网络架构可以提取图像中的高级语义特征，进而提高识别效果，可以明显提升武器的侦察智能水平和精确打击能力。

附图说明

附图仅用于示出具体实施例的目的，而并不认为是对本发明的限制，在整个附图中，相同的参考符号表示相同的部件。

图1训练数据集中的原图与标记图像。

图2 U-net网络结构图。

图3 Seg-net网络结构图。

图4测试原图像。

图5 Seg-net与U-net测试分割结果。

图6最终输出结果。

图7本发明的流程图。

具体实施方式

下面结合附图来具体描述本发明的优选实施例，其中，附图构成本申请一部分，并与本发明的实施例一起用于阐释本发明的原理。

本发明的一个具体实施例，包括以下步骤：

步骤S1、训练样本制作。

选择现有的图像数据库，数据库包括原始图像及label(标记)图像，进行裁剪及各种处理操作，获得训练样本。如图1所示。

本实施例选择了INRIA aerial image dataset:Inria(法国国家信息与自动化研究所)，建立的城市建筑物检测的数据库，为不同的城市遥感图像。覆盖810km²，其中405km²为训练图像，405km²为测试图像，训练图像和测试图像各包含样本数200张，每张图像的像素数最大为5000*5000，像素分辨率为0.3米，真实标记数据按照建筑物和非建筑物分为两类，训练样本中含有真实标注信息。

对于数据集中标注好的图像，由于图像分辨率过大，计算机内存承受不了而且其尺寸也各不相同，首先将所有原图做随机切割，获得256*256的小图。做裁剪、旋转、镜像、光照调整、增加噪声等操作来增加可用来训练以及模拟多种情况的训练样本。

步骤S2、深度学习模型训练。本实施例选取了可以提取图像中的高级语义特征的U-net和Seg-net网络的框架，使用训练样本，再调整两个网络的相应参数后分别进行模型训练，最后获得两个训练模型。

步骤S3、测试训练模型

步骤S301、首先对原图像进行切割，切割成可以处理的256*256小图，然后通过U-net与Seg-net的模型对每一张图像进行前向预测分割，最终获得两张MASK(掩模)结果图像；如图5所示；

步骤S302、采取模型融合的思路，对两张结果图的每个像素点采取投票表决其类别，也即两张结果图中相同位置像素点的类别以U-net预测的类别为优先级进行最终类别的决策，票数最多的类别即为该像素点的类别。如下表所示。

U-net	Seg-net	结果
			建筑物	建筑物	建筑物
建筑物	非建筑物	建筑物
			非建筑物	建筑物	非建筑物
非建筑物	非建筑物	非建筑物

通过这种方式，可以很好地去掉一些明显分类错误的像素点，很大程度上改善模型的预测能力。

同时由于投票后会存在某些孤立像素点的分类问题，使用形态学处理来减少该问题带来的影响，也即对投票后的结果图进行小区域的腐蚀和膨胀。

考虑到大图在裁剪后分割的边缘部分存在的拼接痕迹问题，使用形态学处理的方式修复断裂边缘的连接。或者采用有重叠的裁剪方式。

步骤S4、输出结果。输出二值化的标记分割结果，并可以通过标记位置获取地面建筑物在原图中的位置。

综上所述，本发明提供的用于遥感图像的地面目标分割技术，适用于无人机光电吊舱对地光电侦查的地面建筑物提取分析。

以上所述，仅为本发明较佳的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本发明的保护范围之内。

Claims

1.一种基于U-net与Seg-net网络融合的航空地面建筑物提取方法，包括以下步骤：

步骤S1、训练样本制作：

选择现有的图像数据库，进行裁剪及处理，获得训练样本；

步骤S2、深度学习模型训练：选取U-net和Seg-net网络的框架，使用训练样本，分别进行模型训练，最后获得两个训练模型；

步骤S3、测试训练模型：

步骤S302、对两张结果图像的每个像素点采取投票表决其类别，票数最多的类别即为该像素点的类别；

步骤S4、输出结果：

输出二值化的标记分割结果，通过标记位置获取地面建筑物在原图中的位置。

2.如权利要求1所述的方法，其特征在于，所述步骤S1的训练样本中含有标注信息。

3.如权利要求1所述的方法，其特征在于，所述步骤S1的训练样本做裁剪、旋转、镜像、光照调整、增加噪声操作。

4.如权利要求1所述的方法，其特征在于，所述步骤S3还利用形态学处理孤立像素点的分类或修复断裂边缘。

5.如权利要求1所述的方法，其特征在于，所述步骤S3中对原图像的切割采用有重叠的裁剪方式。

6.如权利要求1所述的方法，其特征在于，所述步骤S302中投票为，两张结果图中相同位置像素点的类别以U-net预测的类别为优先级进行最终类别的决策。