CN116503729A

CN116503729A - 应用于遥感数字图像的道路提取方法和装置

Info

Publication number: CN116503729A
Application number: CN202310274763.4A
Authority: CN
Inventors: 韩灵怡; 郑向向; 丁梓越; 冯磊; 杨昭颖
Original assignee: China Aero Geophysical Survey and Remote Sensing Center for Natural Resources
Current assignee: China Aero Geophysical Survey and Remote Sensing Center for Natural Resources
Priority date: 2023-03-17
Filing date: 2023-03-17
Publication date: 2023-07-28

Abstract

本公开提供了一种应用于遥感数字图像的道路提取方法和装置，应用于遥感图像处理技术领域，所述方法包括：获取当前遥感数字图像；利用预先训练的道路提取模型对所述当前遥感数字图像进行处理，生成道路提取图像；利用预先训练的道路优化模型对所述道路提取图像进行处理，生成道路优化图像。通过本公开实施例的应用于遥感数字图像的道路提取方法，能够实现语义分割，并且不依赖于遥感影像来对道路提取图像进行修复，既能够充分利用高分影像中所呈现的道路细节信息，又能够去除由于高分辨率所带来的遮挡、阴影造成的干扰。

Description

应用于遥感数字图像的道路提取方法和装置

技术领域

本公开的实施例一般涉及遥感图像处理技术领域，并且更具体地，涉及一种应用于遥感数字图像的道路提取方法和装置。

背景技术

在遥感影像中，道路表现出细长跨度大，具有网状分布的结构。卫星遥感、无人机等地表探测技术的快速发展使人们能够以较低成本来获取到海量的高分辨率遥感影像(高分影像)。随着遥感影像空间分辨率的不断提高，许多原来在中低分辨率影像中难以辨识的道路，在高分影像中清晰可见，有关从高分影像中提取道路的理论与方法研究也逐步受到重视。然而，由于不同传感器类型、不同的光谱和空间分辨率、不同的天气条件、不同的道路材料、复杂的背景等因素的影响，通常很难从遥感图像中准确提取道路，提取精度仍旧无法满足实际需求。

随着深度学习技术在计算机视觉领域的不断进步，其在图像分类、目标检测和语义分割等任务中获得了重大突破，它们在遥感领域中也得到了广泛应用，例如水体提取，建筑物提取等。近年来，道路提取也从传统方法过渡到基于深度学习的语义分割方法。深度学习可以从大规模的训练样本中自动学习和提取具有代表性和显著性的特征，因此它能够获得比传统方法更好的性能。目前，最广泛使用的基于深度学习的道路提取方法是基于编码器-解码器的语义分割网络。编码器模块以遥感影像为输入，通过下采样逐渐降低特征图分辨率并捕获高层语义信息，解码器通过上采样逐渐提高特征图分辨率并恢复空间和细节信息，最终获得二元道路地图。然而，如何准确高效地实现道路语义分割仍旧存在很大的挑战。一方面，高分影像中可以展示出更多的道路细节信息，但同时由其他物体造成的遮挡也更加清晰可见，例如道路上的车辆，道路两旁物体(树木、建筑物)，天上的云朵。这些干扰容易导致提取算法将道路类别错误判断为非道路类别，从而造成输出的道路地图存在道路边缘不光滑或道路断开的问题。另一方面，河流等地物与道路具有相似的长条形状，建筑物或者桥梁等与道路具有相同的建造材料，容易造成提取算法将非道路类别错误判断为道路类别。

现有技术中的道路语义分割仍然存在着准确度低、效率低的问题。

发明内容

根据本公开的实施例，提供了一种应用于遥感数字图像的道路提取方法和装置，来提高道路语义分割的准确度和效率。

在本公开的第一方面，提供了一种应用于遥感数字图像的道路提取方法，包括：

获取当前遥感数字图像；

利用预先训练的道路提取模型对所述当前遥感数字图像进行处理，生成道路提取图像；

利用预先训练的道路优化模型对所述道路提取图像进行处理，生成道路优化图像。

在一些实施例中，所述道路提取模型通过以下方式训练得到：

以预设数量的标注有对应的二元道路图像的遥感数字图像为训练样本，将遥感数字图像作为图像语义分割网络的输入，输出二元道路图像；

响应于输出的二元道路图像与标注的二元道路图像的损失函数值大于预设阈值，对所述图像语义分割网络的参数进行调整；

重复上述过程，直到输出的二元道路图像与标注的二元道路图像的损失函数值小于预设阈值，完成对所述图像语义分割网络的训练，生成道路提取模型。

在一些实施例中，所述道路优化模型通过以下方式训练得到：

以预设数量的标注有损坏区域的二元道路图像及其对应的完整道路图像为训练样本，将标注有损坏区域的二元道路图像作为拓扑修复模型的输入，输出道路优化图像；

响应于输出的道路优化图像与输入的标注有损坏区域的二元道路图像对应的完整道路图像的损失函数值大于预设阈值，对所述拓扑修复模型的参数进行调整；

重复上述过程，直到输出的道路优化图像与输入的标注有损坏区域的二元道路图像对应的完整道路图像的损失函数值小于预设阈值，完成对所述拓扑修复模型的训练，生成道路优化模型。

在一些实施例中，所述道路优化模型的训练样本通过以下方式生成：

将训练样本中的二元道路图像按照预设规则切分为多个数据块，利用全0矩阵或者全1矩阵对其中的部分数据块进行替换，生成训练样本；

和/或，从二元道路图像中随机选取多个道路像元，利用全0矩阵对以选取的道路像元为中心，预设长度为边长的数据块进行替换，生成训练样本；

和/或，将在训练过程中所述道路提取模型输出的道路提取图像作为训练样本。

在一些实施例中，所述道路优化模型的输入层用于将输入图像切分为多个方形数据块，对于每一个方形数据块，分别进行数据层面的编码和位置层面的编码，生成表征向量。

在一些实施例中，所述对于每一个方形数据块，分别进行数据层面的编码和位置层面的编码，生成表征向量，包括：

数据层面的编码包括：

对于第n个方形数据块，采用D^ec个p×p的卷积核对其进行卷积运算，记第k个卷积核得到的运算结果为从而得到D^ec个卷积结果，将D^ec个卷积结果进行合并，得到第n个数据块的数据编码记为/>其中，

ec为卷积核的维度；/>为数据编码空间；

位置层面的编码包括：

第n个数据块位置编码采用以下函数计算得到：

其中，d为1到D^ec之间的正整数；

将数据编码和位置编码进行相加，合并所有数据块的结果从而得到最终的输入编码矩阵E，

其中，为编码矩阵集合。

在本公开的第二方面，提供了一种应用于遥感数字图像的道路提取装置，包括：

图像获取模块，用于获取当前遥感数字图像；

道路提取图像生成模块，用于利用预先训练的道路提取模型对所述当前遥感数字图像进行处理，生成道路提取图像；

图像优化模块，用于利用预先训练的道路优化模型对所述道路提取图像进行处理，生成道路优化图像。

在本公开的第三方面，提供了一种电子设备，包括存储器和处理器，所述存储器上存储有计算机程序，所述处理器执行所述程序时实现如以上所述的方法。

在本公开的第四方面，提供了一种计算机可读存储介质，其上存储有计算机程序，所述程序被处理器执行时实现如以上所述的方法。

通过本公开的应用于遥感数字图像的道路提取方法，在道路提取模型阶段，充分利用大规模遥感影像来实现道路语义分割；在道路优化模型阶段，不依赖于遥感影像来对道路提取图像进行修复，既能够充分利用高分影像中所呈现的道路细节信息，又能够去除由于高分辨率所带来的遮挡、阴影造成的干扰。

发明内容部分中所描述的内容并非旨在限定本公开的实施例的关键或重要特征，亦非用于限制本公开的范围。本公开的其它特征将通过以下的描述变得容易理解。

附图说明

结合附图并参考以下详细说明，本公开各实施例的上述和其他特征、优点及方面将变得更加明显。在附图中，相同或相似的附图标记表示相同或相似的元素，其中：

图1示出了本公开实施例一的应用于遥感数字图像的道路提取方法的流程图；

图2示出了本公开实施例二的应用于遥感数字图像的道路提取装置的结构示意图；

图3示出了用来实施本公开的实施例的电子设备的示意性框图。

具体实施方式

为使本公开实施例的目的、技术方案和优点更加清楚，下面将结合本公开实施例中的附图，对本公开实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本公开一部分实施例，而不是全部的实施例。基于本公开中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的全部其他实施例，都属于本公开保护的范围。

另外，本文中术语“和/或”，仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本文中字符“/”，一般表示前后关联对象是一种“或”的关系。

本公开实施例的应用于遥感数字图像的道路提取方法，在道路提取模型阶段，充分利用大规模遥感影像来实现道路语义分割；在道路优化模型阶段，不依赖于遥感影像来对道路提取图像进行修复，既能够充分利用高分影像中所呈现的道路细节信息，又能够去除由于高分辨率所带来的遮挡、阴影造成的干扰。

具体地，如图1所示，为本公开实施例一的应用于遥感数字图像的道路提取方法的流程图。作为本公开的一个可选实施例，所述应用于遥感数字图像的道路提取方法，可以包括以下步骤：

S101：获取当前遥感数字图像。

本公开实施例的应用于遥感数字图像的道路提取方法，用于根据遥感数字图像提取二元道路图像。

具体地，定义3通道的遥感数字图像相应的同尺寸的二元道路地图记为/>用来标识出X的像元v的类别如下：

其中，为遥感数字图像空间，I₁，I₂，I₃，为遥感数字图像空间的维度，为二元道路地图空间，I₁，I₂，为二元道路地图空间的纬度。

根据遥感数字图像生成二元道路图像。本实施例的方法，可以应用于遥感数字图像的批量处理，对其中的一张遥感数字图像进行处理时，需要获取当前遥感数字图像。

S102：利用预先训练的道路提取模型对所述当前遥感数字图像进行处理，生成道路提取图像。

在本实施例中，当获取到当前遥感数字图像后，可以利用预先训练的道路提取模型对所述当前遥感数字图像进行处理，进而生成道路提取图像。

具体地，本实施例中的道路提取模型是通过以下方式训练得到：

本实施例中的道路提取模型可以是预先训练好的，道路提取模型采用的网络结构可以是U-net，Deeplabv3+等图像语义分割网络。关于道路提取模型的具体结构不实施例不再展开描述。

S103：利用预先训练的道路优化模型对所述道路提取图像进行处理，生成道路优化图像。

在本实施例中，当利用道路提取模型对当前遥感数字图像进行处理，生成道路提取图像后，可以利用道路优化模型对生成的道路提取图像进行进一步的处理，生成道路优化图像。

具体地，道路优化模型也可以是预先训练得到的，道路优化模型通过以下方式训练得到：

在本实施例中，所述道路优化模型的训练样本通过以下方式生成：

和/或，从二元道路图像中随机选取多个道路像元，利用全0矩阵对以选取的像元为中心，预设长度为边长的数据块进行替换，生成训练样本；

具体地，在生成道路优化模型的训练样本时，可以采用随机块噪声方法。在具体实现时，可以定义随机块列表q_i(i＝1,2,…,l)为整数。然后随机从/>中选取一个q，并且以q×q为单位，将二元道路地图分为Q个q×q的数据块。最后，从Q个数据块中随机抽取N₁个数据块，并随机用q×q的全0矩阵或者全1矩阵将其替换，生成训练样本。

另外，在生成道路优化模型的训练样本时，还可以采用道路随机块噪声。在具体实现时，从二元道路地图随机抽取N₂个道路像元。对每一个被抽到的道路像元v，随机抽取一个整数q，以v为中点，q为边长，得到一个q×q的数据块，然后以全0矩阵将其替换。

此外，在生成道路优化模型的训练样本时，还可以利用在道路提取模型的训练过程中生成的二元道路图像作为训练样本。

在一些实施例中，可以将按照以上三种方式生成的训练样本按照预设的比例进行混合，生成最终的训练样本集。然后利用生成的训练样本集中的样本对拓扑修复模型进行训练，生成道路优化模型。

此外，作为本公开的一个可选实施例，所述道路优化模型的输入层用于将输入图像切分为多个方形数据块，对于每一个方形数据块，分别进行数据层面的编码和位置层面的编码，生成表征向量。

具体地，数据层面的编码包括：

ec为卷积核的维度；

位置层面的编码包括：

第n个数据块位置编码采用以下函数计算得到：

其中，d为1到D^ec之间的正整数；

其中，为编码矩阵集合。

在得到输入编码矩阵E后，将编码矩阵输入到具有注意力头的编码器，得到道路地图数据每一个数据块的编码特征。然后再经过解码器后，输出道路优化图像。

需要说明的是，对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应所述知悉，本公开并不受所描述的动作顺序的限制，因为依据本公开，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应所述知悉，说明书中所描述的实施例均属于可选实施例，所涉及的动作和模块并不一定是本公开所必须的。

以上是关于方法实施例的介绍，以下通过装置实施例，对本公开所述方案进行进一步说明。

如图2所示，为本公开实施例二的应用于遥感数字图像的道路提取装置的结构示意图。本实施例的应用于遥感数字图像的道路提取装置，包括：

图像获取模块201，用于获取当前遥感数字图像；

道路提取图像生成模块202，用于利用预先训练的道路提取模型对所述当前遥感数字图像进行处理，生成道路提取图像；

图像优化模块203，用于利用预先训练的道路优化模型对所述道路提取图像进行处理，生成道路优化图像。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，所述描述的模块的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

图3示出了可以用来实施本公开的实施例的电子设备300的示意性框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本公开的实现。

电子设备300包括计算单元301，其可以根据存储在ROM302中的计算机程序或者从存储单元308加载到RAM303中的计算机程序，来执行各种适当的动作和处理。在RAM303中，还可存储电子设备300操作所需的各种程序和数据。计算单元301、ROM302以及RAM303通过总线304彼此相连。I/O接口305也连接至总线304。

电子设备300中的多个部件连接至I/O接口305，包括：输入单元306，例如键盘、鼠标等；输出单元307，例如各种类型的显示器、扬声器等；存储单元308，例如磁盘、光盘等；以及通信单元309，例如网卡、调制解调器、无线通信收发机等。通信单元309允许电子设备300通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

计算单元301可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元301的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元301执行上文所描述的各个方法和处理，例如去中心化的自组网方法。例如，在一些实施例中，去中心化的自组网方法可被实现为计算机软件程序，其被有形地包含于机器可读介质，例如存储单元308。在一些实施例中，计算机程序的部分或者全部可以经由ROM302和/或通信单元309而被载入和/或安装到电子设备300上。当计算机程序加载到RAM303并由计算单元301执行时，可以执行上文描述的去中心化的自组网方法的一个或多个步骤。备选地，在其他实施例中，计算单元301可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行去中心化的自组网方法。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器，使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器，也可以为分布式系统的服务器，或者是结合了区块链的服务器。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本公开公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本公开保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等，均应包含在本公开保护范围之内。

Claims

1.应用于遥感数字图像的道路提取方法，其特征在于，包括：

获取当前遥感数字图像；

2.根据权利要求1所述的道路提取方法，其特征在于，所述道路提取模型通过以下方式训练得到：

3.根据权利要求2所述的道路提取方法，其特征在于，所述道路优化模型通过以下方式训练得到：

4.根据权利要求3所述的道路提取方法，其特征在于，所述道路优化模型的训练样本通过以下方式生成：

5.根据权利要求3所述的道路提取方法，其特征在于，所述道路优化模型的输入层用于将输入图像切分为多个方形数据块，对于每一个方形数据块，分别进行数据层面的编码和位置层面的编码，生成表征向量。

6.根据权利要求5所述的道路提取方法，其特征在于，所述对于每一个方形数据块，分别进行数据层面的编码和位置层面的编码，生成表征向量，包括：

数据层面的编码包括：

ec为卷积核的维度；/>为数据编码集合；

位置层面的编码包括：

第n个数据块位置编码采用以下函数计算得到：

其中，d为1到D^ec之间的正整数；

其中，为编码矩阵集合。

7.应用于遥感数字图像的道路提取装置，其特征在于，包括：

图像获取模块，用于获取当前遥感数字图像；

8.一种电子设备，包括存储器和处理器，所述存储器上存储有计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1～6中任一项所述的方法。

9.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述程序被处理器执行时实现如权利要求1～6中任一项所述的方法。