CN117593639A

CN117593639A - 公路及其附属物的提取方法、装置、设备及介质

Info

Publication number: CN117593639A
Application number: CN202311557883.1A
Authority: CN
Inventors: 邓莉书
Original assignee: Beijing Tianding Shutong Technology Co ltd
Current assignee: Beijing Tianding Shutong Technology Co ltd
Priority date: 2023-11-21
Filing date: 2023-11-21
Publication date: 2024-02-23
Anticipated expiration: 2043-11-21
Also published as: CN117593639B

Abstract

本发明涉及计算机技术领域，尤其涉及一种公路及其附属物的提取方法、装置、设备及介质。该方法通过对深度学习网络进行优化，即在解码网络中设置依次连接的语义关联迁移模块和空间感知模块，语义关联迁移模块可以完成第二编码模块、第三编码模块和第四编码模块的不同层级特征之间的语义关联，并将深层特征的语义信息迁移至浅层特征中，空间感知模块可以融合不同层次特征的空间细节和语义信息，这样可以充分交互公路及其附属物高低特征层的语义信息，重点关注不同尺度地物要素的空间细节，使得网络在保持较高提取精度的同时，显著地提升了识别效率。因此，上述技术方案能够有效提高公路及其附属物的提取精度。

Description

公路及其附属物的提取方法、装置、设备及介质

技术领域

本发明涉及计算机技术领域，尤其涉及一种公路及其附属物的提取方法、装置、设备及介质。

背景技术

公路以及路面裂缝、标线和路边建筑物等公路典型附属物要素，是一类活跃的遥感大数据泛地理实体。精确、快速、自动且轻量化地获取这些泛地理实体是遥感提取持续研究的热点。

随着计算机技术、机器学习技术等发展，深度学习凭借其优异的特征提取能力，广泛运用于公路及其附属物的巡检领域。然而，相关提取模型在提取公路及其附属物的特征信息时存在提取精度不佳的技术问题。

基于此，本发明提出了一种公路及其附属物的提取方法、装置、设备及介质来解决上述技术问题。

发明内容

本发明描述了一种公路及其附属物的提取方法、装置、设备及介质，能够有效提高公路及其附属物的提取精度。

根据第一方面，本发明提供了一种公路及其附属物的提取方法，包括：

获取待提取的公路遥感图像；

将待提取的公路遥感图像输入到训练好的遥感提取模型中，得到待提取的公路遥感图像中公路及其附属物的提取结果；其中，所述遥感提取模型是利用标签公路遥感影像对预设的深度学习网络进行训练得到的；

所述深度学习网络包括编码网络和解码网络，所述编码网络包括依次连接的第一编码模块、第二编码模块、第三编码模块和第四编码模块，所述解码网络包括依次连接的语义关联迁移模块、空间感知模块和输出模块；

所述语义关联迁移模块的输入端分别与所述第二编码模块、所述第三编码模块和所述第四编码模块的输出端连接，用于完成所述第二编码模块、所述第三编码模块和所述第四编码模块的不同层级特征之间的语义关联，并将深层特征的语义信息迁移至浅层特征中；

所述空间感知模块的输入端分别与所述第一编码模块和所述语义关联迁移模块的输出端连接，用于融合不同层次特征的空间细节和语义信息；

所述输出模块的输入端与所述空间感知模块的输出端连接，用于输出所述提取结果。

根据第二方面，本发明提供了一种公路及其附属物的提取装置，包括：

获取单元，被配置为获取待提取的公路遥感图像；

提取单元，被配置为将待提取的公路遥感图像输入到训练好的遥感提取模型中，得到待提取的公路遥感图像中公路及其附属物的提取结果；其中，所述遥感提取模型是利用标签公路遥感影像对预设的深度学习网络进行训练得到的；

根据第三方面，本发明提供了一种电子设备，包括存储器和处理器，所述存储器中存储有计算机程序，所述处理器执行所述计算机程序时，实现第一方面的方法。

根据第四方面，本发明提供了一种计算机可读存储介质，其上存储有计算机程序，当所述计算机程序在计算机中执行时，令计算机执行第一方面的方法。

根据本发明提供的公路及其附属物的提取方法、装置、设备及介质，通过对深度学习网络进行优化，即在解码网络中设置依次连接的语义关联迁移模块和空间感知模块，语义关联迁移模块可以完成第二编码模块、第三编码模块和第四编码模块的不同层级特征之间的语义关联，并将深层特征的语义信息迁移至浅层特征中，空间感知模块可以融合不同层次特征的空间细节和语义信息，这样可以充分交互公路及其附属物高低特征层的语义信息，重点关注不同尺度地物要素的空间细节，使得网络在保持较高提取精度的同时，显著地提升了识别效率。因此，上述技术方案能够有效提高公路及其附属物的提取精度。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1示出了根据一个实施例的公路及其附属物的提取方法的流程示意图；

图2示出了根据一个实施例的公路及其附属物的提取装置的示意性框图；

图3示出了根据一个实施例的遥感提取模型的结构示意图；

图4为图3所示遥感提取模型中EDB的结构示意图；

图5为图3所示遥感提取模型中SIT的结构示意图；

图6为图3所示遥感提取模型中MSA的结构示意图；

图7为图6所示MSA中msa的结构示意图。

具体实施方式

下面结合附图，对本发明提供的方案进行描述。

图1示出根据一个实施例的公路及其附属物的提取方法的流程示意图。可以理解，该方法可以通过任何具有计算、处理能力的装置、设备、平台、设备集群来执行。如图1所示，该方法包括:

步骤101、获取待提取的公路遥感图像；

步骤102、将待提取的公路遥感图像输入到训练好的遥感提取模型(可参见图3)中，得到待提取的公路遥感图像中公路及其附属物的提取结果；其中，遥感提取模型是利用标签公路遥感影像对预设的深度学习网络进行训练得到的；

深度学习网络包括编码网络和解码网络，编码网络包括依次连接的第一编码模块、第二编码模块、第三编码模块和第四编码模块，解码网络包括依次连接的语义关联迁移模块(即图3中的(a))、空间感知模块(即图3中的(b))和输出模块(即图3中的(c))；

语义关联迁移模块的输入端分别与第二编码模块、第三编码模块和第四编码模块的输出端连接，用于完成第二编码模块、第三编码模块和第四编码模块的不同层级特征之间的语义关联，并将深层特征的语义信息迁移至浅层特征中；

空间感知模块的输入端分别与第一编码模块和语义关联迁移模块的输出端连接，用于融合不同层次特征的空间细节和语义信息；

输出模块的输入端与空间感知模块的输出端连接，用于输出提取结果。

在本实施例中，通过对深度学习网络进行优化，即在解码网络中设置依次连接的语义关联迁移模块和空间感知模块，语义关联迁移模块可以完成第二编码模块、第三编码模块和第四编码模块的不同层级特征之间的语义关联，并将深层特征的语义信息迁移至浅层特征中，空间感知模块可以融合不同层次特征的空间细节和语义信息，这样可以充分交互公路及其附属物高低特征层的语义信息，重点关注不同尺度地物要素的空间细节，使得网络在保持较高提取精度的同时，显著地提升了识别效率。因此，上述技术方案能够有效提高公路及其附属物的提取精度。

如图3所示，在编码部分使用卷积神经网络(Convolutional Neural Networks，CNNs)或Transformer自注意力机制作为骨干特征提取网络，分别收集公路及其附属物等地物信息的局部和全局特征信息，自动地生成不同层级的特征图{E_i}。在解码部分先后使用SAT(即SIA和SIT，其中SIA为EDB中的一部分)和MSA策略高效地完成层级特征之间的语义信息关联，快速地迁移深层特征丰富的语义信息，并实现公路及其附属物等多尺度地物特征空间细节的敏锐感知，最终得到精细的提取结果。

对于遥感影像中公路、裂缝、标线或建筑物等多种形态和尺度不一的特性，缺乏深层语义信息引导和浅层空间细节考虑的解码器很难实现精确的地物提取结果。为此，发明人创造性地提出：可以使用语义关联迁移(Sematic Association Transfer，SAT)和多尺度空间感知(Multiscale Spatial Awareness，MSA)，即语义关联迁移模块和空间感知模块，从而可以加强远距离特征之间的语义关联，实现深层特征语义信息的高效传递，并在多个尺度上感知提取目标的空间分布关系，提高浅层特征的全局语义和局部空间信息感知能力，从而提升公路及其附属物提取精度和效率。

如图4所示，作为一种优选的实施方式，语义关联迁移模块是通过采用如下公式完成第二编码模块、第三编码模块和第四编码模块的不同层级特征之间的语义关联的：

D₄＝DConv(ρ_row(P_rj(E₄))(ρ_col(P_rj(E₄))^TP_rj(E₄)))

式中，2≤i≤3；E_i为第i编码模块生成的浅层特征图；D_i为与第i编码模块对应的深层特征图；X_i为E_i和D_i融合后的特征图；CBR(·)表示依次进行3×3卷积、BN和Relu的操作；Conv(·)表示卷积操作；UP²(·)表示2倍上采样操作；表示add融合操作；P_rj(·)为使用1×1卷积的投影函数；ρ_row(·)和ρ_col(·)依次为行和列的归一化函数；DConv(·)表示深度可分离卷积操作。

在本实施例中，通过降维和融合方式获取的存在通道信息衰减和跨层特征混合的缺点，需要进一步加强公路及其附属物等地物语义信息长距离关联，并消除层级特征差异的影响。为此，发明人设计了如图4所示的高效解码块(即EDB)，采用语义信息关联策略和特征提取分支，加强地物特征之间的语义关联，逐级还原地物特征的空间细节。

输入特征图X_i在SIA的支持下，定量地刻画远距离信息的权重关系，并以矩阵相乘方式进行加权求和，加强公路及其附属物的语义信息关联。SIA使用矩阵维度变换函数生成一组特征向量其中N_i＝(H/2ⁱ⁺¹)×(W/2ⁱ⁺¹)表示特征向量的长度，是具备C个元素的行向量。随后，使用三个投影函数P_rj(·)生成对应的地物特征矩阵/>和/>

归一化函数ρ_col(·)表示对K_i的每一列进行归一化。通过这种改进的点乘自注意力机制，发明人成功地减少了计算复杂度，同时也加强了跨层特征特征远距离语义信息的关联。此外，特征提取分支首先使用3×3卷积提取地物特征的局部空间信息，然后与信息迁移策略提取的特征进行相加融合，最后使用深度可分离卷积快速地还原地物的空间细节，通过三个层级结构得到精细的地物提取结果。公路和裂缝的输入特征图经过高效解码器后，其亮度发生了显著地变化，使得模型关注提取目标本身，而不是树木等噪声信息。

尽管SIA在一定程度上缓解了逐级解码方案语义信息衰减效应，但是高效解码器通过通道降维的方式限制了语义信息的还原。为此，发明人基于高效语义信息关联策略的计算模式，设计了如图5所示的深层特征语义信息迁移模块(Sematic InformationTransform，SIT)，将深层特征丰富的语义信息高效迁移至浅层特征，允许公路及其附属物特征的语义信息在编码解码器之间充分流动，显著地提升有益特征的传播和流动。

如图5所示，作为一种优选的实施方式，语义关联迁移模块是通过采用如下公式完成将深层特征的语义信息迁移至浅层特征中的：

T＝ρ_row(Q)(ρ_col(K)^TV)

D₁＝Concat(D₂,T)

式中，UP⁴(·)表示4倍上采样操作；E₂、E₃和E₄依次为第二编码模块、第三编码模块和第四编码模块生成的浅层特征图；D₁为与第一编码模块对应的深层特征图；Concat(·)表示Concat融合操作。

在本实施例中，由可视化结果可知，特征图和/>分别具备详尽的空间细节和丰富的语义信息，而/>两者兼具。SIT接收来自编码器的三个特征图，通过映射、激活和迁移等步骤后，一方面将深层特征E₄丰富的语义信息传递至浅层特征E₂，另一方面，也保留了浅层特征E₂详尽的空间细节信息。对于编码器的三个特征图E₂、E₃和E₄，分别使用1×1卷积和双线性上采样方法将其映射为Q、K和V，使其具有相同的空间分辨率(H/8)×(W/8)，满足后续的矩阵乘法运算规则。

特征图K和V通过softmax_col(K)归一化函数、矩阵转置和矩阵乘法等一系列操作，自动地定量刻画每个特征点语义信息的长距离关系，优化分配通道权重信息，得到语义信息矩阵A，定义如下：

式中，K使用softmax_col(·)激活函数列进行归一化计算，权衡特征点的重要程度。在K^T和V相乘后，得到8C×4C大小的的语义关系图A，不仅暂时保存了深层特征图E₄的语义信息，而且激活了深层特征图E₃的通道信息，高度地表达了每个特征点之间的长距离语义关系。同时，语义信息矩阵A能够自适应的评估每个长距离语义信息的相关性，选择性地判断深层语义信息的重要程度，在一定程度上削弱了特征的冗余性。将语义信息矩阵A和特征图Q相乘后，在不需要过多卷积的情况下完成了深层特征语义信息的快速迁移，不仅保留了详细的空间细节信息，而且选择性地评估长距离语义信息的贡献程度。计算过程如下：

T＝softmax_row(Q)A

式中，表示SIT的输出特征图。softmax_row(·)对Q的每一行进行归一化，使其其中每个语义信息被激活，再与特征图A的相乘过程中，自动地实现深层特征语义信息的迁移，最终将浅层特征图E₂的通道数2C变为深层特征图E₄的8C。正如特征图可视化结果，SIT有效地将深层特征对建筑物的语义信息成功迁移至迁移特征，同时也保留了浅层特征的空间细节。通过这种方式，SIT有效地将深层特征的语义信息迁移至浅层特征，使地物特征在解码器中充分流动，实现了跨层特征的有效融合。

综上，SAT通过SIA和SIT两种模式，有效地缓解了逐级解码方法的语义信息衰减效应，提高了地物特征之间的紧密关联的程度，也实现了深层特征语义信息的高效迁移，使得网络快速地得到精细化的地物提取结果。

编码器的浅层特征E₁尽管具有十分详尽的空间细节，但其特征语义信息较为薄弱。相反，解码器逐级还原的深层特征D₁提供了较为丰富的语义信息，但空间细节模糊。如何在解码最后阶段构建顾及空间细节和语义信息的解码单元，是实现公路及其附属物信息精细提取的关键所在。为此，发明人设计了如图6所示的特征精细解码头(即MSA)，通过语义关联和空间感知两个策略，充分融合不同层次特征的空间细节和语义信息，进一步提高地物提取的精度和效果。

如图6和7所示，作为一种优选的实施方式，空间感知模块是通过采用如下公式完成融合不同层次特征的空间细节和语义信息的：

F_p＝(Max(F₁),Mean(F₁))

式中，E₁为第一编码模块生成的浅层特征图；F₂为空间感知模块生成的特征图；Max(·)表示最大池化操作；Mean(·)表示平均池化操作；表示不同卷积提取的空间特征图；BN(·)表示批量归一化操作。

在本实施例中，特征精细解码头一方面通过SIA捕捉浅层特征和深层特征/>两者之间的语义信息关系，另一方面采用空间感知方式提高空间细节信息感知能力，精确地还原地物的空间语义信息。同时，使用跳跃连接机制和深度可分离卷积加快模型特征学习的效率，快速地融合不同层次特征的语义信息和空间细节。

图7展示了msa模块的主要结果及其特征可视化的结果。输入图像经过编码器和SAT得到的特征图F₁虽然通过利用了SIA策略评估了每个通道信息的贡献程度，但其空间细节仍未被重视，存在背景噪声区域的错误关注。为此，发明人提出的msa模块通过空间信息压缩、多尺度空间感知和空间特征激活三个关键步骤，自适应地探索特征信息的空间分布规律，从多个尺度上自主地构建每个像素之间的空间关系，增强特征区域的空间细节信息刻画，抑制背景区域的噪声信息干扰，使得网络将背景区域的注意力移动到公路前区域。

1)空间信息压缩：输入特征通过最大池化和平均池化操作，将通道信息压缩至一维，生成含有空间信息的特征图/>尽可能地刻画公路的边缘和内部的语义信息。由特征图可视化结果可知，平均池化和最大池化分别保留了公路的边缘细节和语义信息；

2)多尺度空间感知：分别使用三个大小不同的卷积分支感受不同空间尺度的地物特征信息，获取每个像素点之间的空间分布关系，得到具有空间信息权重的特征图

3)特征激活：特征图F_s ^j高度表征了公路特征点之间的空间分布关系。使用Sigmoid激活函数进一步详细地刻画其中的空间细节信息，并与输入特征F₁矩阵点乘后，抑制背景信息的干扰。

由特征图可知，三种不同尺度的卷积操作实现了不同尺度公路的上下文信息聚合，并同时加强了对公路边缘细节的关注程度，也抑制了背景噪声信息的表达。综上，msa模块通过通道信息降维、空间关系感知和地物特征激活等三个关键步骤，自适应地获取了每个地物特征点之间的空间关系，并以优化分配权重的方式自动地提高公路信息的空间表征强度，降低背景噪声信息的干扰。

综上，上述技术方案不仅实现了公路、建筑物等大尺度地物要素的高精度高效率提取，而且也能较好地处理裂缝、标线破损等小尺度的空间细节；同时，可通过定量表征方式关联公路及其附属物不同层次特征之间的语义信息，有效将深层特征语义信息快速迁移至浅层特征，提高了对地物语义特征的认知能力；利用多个不同尺度的空间感知路径，有效地感知了不同尺度特征的空间边缘细节，消除背景噪声信息的干扰。

上述对本发明特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

根据另一方面的实施例，本发明提供了一种公路及其附属物的提取装置。图2示出根据一个实施例的公路及其附属物的提取装置的示意性框图。可以理解，该装置可以通过任何具有计算、处理能力的装置、设备、平台和设备集群来实现。如图2所示，该装置包括：获取单元201和提取单元202。其中各组成单元的主要功能如下：

获取单元201，被配置为获取待提取的公路遥感图像；

提取单元202，被配置为将待提取的公路遥感图像输入到训练好的遥感提取模型中，得到待提取的公路遥感图像中公路及其附属物的提取结果；其中，遥感提取模型是利用标签公路遥感影像对预设的深度学习网络进行训练得到的；

深度学习网络包括编码网络和解码网络，编码网络包括依次连接的第一编码模块、第二编码模块、第三编码模块和第四编码模块，解码网络包括依次连接的语义关联迁移模块、空间感知模块和输出模块；

作为一种优选的实施方式，语义关联迁移模块是通过采用如下公式完成第二编码模块、第三编码模块和第四编码模块的不同层级特征之间的语义关联的：

D₄＝DConv(ρ_row(P_rj(E₄))(ρ_col(P_rj(E₄))^TP_rj(E₄)))

作为一种优选的实施方式，语义关联迁移模块是通过采用如下公式完成将深层特征的语义信息迁移至浅层特征中的：

T＝ρ_row(Q)(ρ_col(K)^TV)

D₁＝Concat(D₂,T)

作为一种优选的实施方式，空间感知模块是通过采用如下公式完成融合不同层次特征的空间细节和语义信息的：

F_p＝(Max(F₁),Mean(F₁))

根据另一方面的实施例，还提供一种计算机可读存储介质，其上存储有计算机程序，当计算机程序在计算机中执行时，令计算机执行结合图1所描述的方法。

根据再一方面的实施例，还提供一种电子设备，包括存储器和处理器，存储器中存储有可执行代码，处理器执行可执行代码时，实现结合图1的方法。

本发明中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

本领域技术人员应该可以意识到，在上述一个或多个示例中，本发明所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时，可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。

以上所述的具体实施方式，对本发明的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上所述仅为本发明的具体实施方式而已，并不用于限定本发明的保护范围，凡在本发明的技术方案的基础之上，所做的任何修改、等同替换、改进等，均应包括在本发明的保护范围之内。

Claims

1.一种公路及其附属物的提取方法，其特征在于，包括：

获取待提取的公路遥感图像；

2.根据权利要求1所述的方法，其特征在于，所述语义关联迁移模块是通过采用如下公式完成所述第二编码模块、所述第三编码模块和所述第四编码模块的不同层级特征之间的语义关联的：

D₄＝DConv(ρ_row(P_rj(E₄))(ρ_col(P_rj(E₄))^TP_rj(E₄)))

式中，2≤i≤3；E_i为第i编码模块生成的浅层特征图；D_i为与第i编码模块对应的深层特征图；X_i为E_i和D_i融合后的特征图；CBR(·)表示依次进行3×3卷积、BN和Relu的操作；Conv(·)表示卷积操作；UP²()表示2倍上采样操作；表示add融合操作；P_rj(·)为使用1×1卷积的投影函数；ρ_row(·)和ρ_col(·)依次为行和列的归一化函数；DConv(·)表示深度可分离卷积操作。

3.根据权利要求2所述的方法，其特征在于，所述语义关联迁移模块是通过采用如下公式完成将深层特征的语义信息迁移至浅层特征中的：

T＝ρ_row(Q)(ρ_col(K)^TV)

D₁＝Concat(D₂,T)

式中，UP⁴(·)表示4倍上采样操作；E₂、E₃和E₄依次为所述第二编码模块、所述第三编码模块和所述第四编码模块生成的浅层特征图；D₁为与所述第一编码模块对应的深层特征图；Concat(·)表示Concat融合操作。

4.根据权利要求3所述的方法，其特征在于，所述空间感知模块是通过采用如下公式完成融合不同层次特征的空间细节和语义信息的：

F_p＝(Max(F₁),Mean(F₁))

式中，E₁为所述第一编码模块生成的浅层特征图；F₂为所述空间感知模块生成的特征图；Max(·)表示最大池化操作；Mean(·)表示平均池化操作；F_s ^j表示不同卷积提取的空间特征图；BN(·)表示批量归一化操作。

5.一种公路及其附属物的提取装置，其特征在于，包括：

获取单元，被配置为获取待提取的公路遥感图像；

6.根据权利要求5所述的装置，其特征在于，所述语义关联迁移模块是通过采用如下公式完成所述第二编码模块、所述第三编码模块和所述第四编码模块的不同层级特征之间的语义关联的：

D₄＝DConv(ρ_row(P_rj(E₄))(ρ_col(P_rj(E₄))^TP_rj(E₄)))

7.根据权利要求6所述的装置，其特征在于，所述语义关联迁移模块是通过采用如下公式完成将深层特征的语义信息迁移至浅层特征中的：

T＝ρ_row(Q)(ρ_col(K)^TV)

D₁＝Concat(D₂,T)

8.根据权利要求7所述的装置，其特征在于，所述空间感知模块是通过采用如下公式完成融合不同层次特征的空间细节和语义信息的：

F_p＝(Max(F₁),Mean(F₁))

式中，E₁为所述第一编码模块生成的浅层特征图；F₂为所述空间感知模块生成的特征图；Max(·)表示最大池化操作；Mean(·)表示平均池化操作；表示不同卷积提取的空间特征图；BN(·)表示批量归一化操作。

9.一种电子设备，其特征在于，包括存储器和处理器，所述存储器中存储有计算机程序，所述处理器执行所述计算机程序时，实现如权利要求1-4中任一项所述的方法。

10.一种计算机可读存储介质，其特征在于，其上存储有计算机程序，当所述计算机程序在计算机中执行时，令计算机执行权利要求1-4中任一项所述的方法。