CN116977876A

CN116977876A - 一种无人机图像处理方法、系统及介质

Info

Publication number: CN116977876A
Application number: CN202310835602.8A
Authority: CN
Inventors: 易旭良; 李先校; 赵宇; 武正敏
Original assignee: Guangdong Changshi Communication Technology Co ltd
Current assignee: Guangdong Changshi Communication Technology Co ltd
Priority date: 2023-07-07
Filing date: 2023-07-07
Publication date: 2023-10-31

Abstract

本发明提供了一种无人机图像处理方法、系统及介质，该方法包括：获取无人机拍摄到的遥感图像数据，作为输入图像；基于双分支网络对所述图像进行处理，得到所述图像的空间域特征和频域特征，其中，所述双分支网络包括空间域分支和频域分支；将所述图像的空间域特征和频域特征进行融合，得到所述图像的空间域特征和频域特征的统一表示。本发明采用自适应的双分支网络，可以更好地应对遥感图像小目标检测的挑战，减少缺乏足够空间域的信息，增强语义信息的表示。另外，本发明通过一种融合机制，结合图像增强网络实现语义增强，挖掘空间和频域元素的联合表示，从而提高了小目标检测的精度。

Description

一种无人机图像处理方法、系统及介质

技术领域

本发明涉及图像处理技术领域，尤其涉及一种融合频域信息的无人机图像处理方法、系统及介质。

背景技术

遥感目标检测可以应用于通信网络巡检的场景，以提高巡检的效率和准确性。通信网络无人机巡检可以用于监测和巡视电信基站、塔桅、光缆等基础设施的状态和安全性。它可以通过图像识别和传感器数据分析来检测潜在的故障、损坏或异常情况，帮助提前发现和解决问题，提高基础设施的可靠性和可用性。

通信网络安全巡检是保障通信网络正常运行的重要环节，也是建设智能电网的重要内容。随着无人机技术的发展，选用无人机巡检成为当前最主要的方向之一。因此，通过计算机视觉技术对无人机遥感图像进行高准确率检测是必要的。

目前，无人机遥感图像检测主要分为两类：

第一类是基于经典机器学习算法，主要通过人工特征和线性分类器结合进行检测，一般应用于背景简单类目标检测。这类技术所消耗的时间较长且比较难以推广。

第二类是使用深度学习算法对遥感图像进行检测。这类技术在目标单一且背景简单的图像检测效果最好，但现在的遥感图像大多背景复杂且种类多样，而且由于遥感图像具有小目标繁多的特点，导致检测效果大打折扣。

发明内容

本发明的主要目的在于提供一种融合频域信息的无人机图像处理方法、系统及介质，旨在提高小目标检测的精度。

为了达到上述目的，本发明提出一种无人机图像处理方法，所述方法包括以下步骤：

步骤S10，获取无人机拍摄到的遥感图像数据，作为输入图像；

步骤S20，基于双分支网络对所述图像进行处理，得到所述图像的空间域特征和频域特征，其中，所述双分支网络包括空间域分支和频域分支；

步骤S30，将所述图像的空间域特征和频域特征进行融合，得到所述图像的空间域特征和频域特征的统一表示。

本发明的进一步技术方案是，所述基于双分支网络对所述图像进行处理，得到所述图像的空间域特征和频域特征的步骤包括：

将所述图像从空间域移动到频域，采用二维离散余弦变换对所述图像进行频域转换，得到所述图像的频域特征。

本发明的进一步技术方案是，所述采用二维离散余弦变换对所述图像进行频域转换，得到所述图像的频域特征的步骤中所采用的公式为：

其中，表示二维离散余弦变换的结果，C(u)是一个与变量u相关的系数，用于调整变换的幅度，C(u)是一个与变量v相关的系数，用于调整变换的幅度，f(i，j)表示信号在空间域中的取样值；

表示两个余弦函数的乘积，表示了两个余弦函数在给定的频率和位置上的取值。

本发明的进一步技术方案是，所述将所述图像从空间域移动到频域，采用二维离散余弦变换对所述图像进行频域转换，得到所述图像的频域特征的步骤之后还包括：

基于特征增强模块消除所述频域特征中多余的语义信息和噪声干扰。

本发明的进一步技术方案是，所述基于特征增强模块消除所述频域特征中多余的语义信息和噪声干扰的步骤包括：

对所述图像进行下采样生成多尺度图像x_f＝{x₁，x₂，...，x_n}，其中，n是指4；

采用特征增强模块构建多尺度特征图，其中，所述特征增强模块的一部分写成：

其中，表示输入图像，/>是最终的增强图像，GELU代表GELU激活函数。

本发明的进一步技术方案是，所述基于特征增强模块消除所述频域特征中多余的语义信息和噪声干扰的步骤还包括：

将特征传递给前馈网络FFN以增强信道信息，其中，前馈网络FFN可以写成：

其中，DW-Conv_3x3表示内核大小为3x3的深度卷积层。

本发明的进一步技术方案是，所述步骤S30，将所述图像的空间域特征和频域特征进行融合，得到所述图像的空间域特征和频域特征的统一表示的步骤包括：

基于注意力机制将所述图像的空间域特征和频域特征进行融合，其中，所述空间域特征通过通道注意力自动捕获重要的区域特征，所述频域特征通过空间注意力增强其局部细节并抑制冗余语义信息。

本发明的进一步技术方案是，所述步骤S30，将所述图像的空间域特征和频域特征进行融合，得到所述图像的空间域特征和频域特征的统一表示的步骤还包括：

通过点乘法将所述空间域特征和所述频域特征进行融合，其中，三个反向特征可以写成：

M_sf＝Conv_1×1(Conv_1×1(X_s)·Conv_1×1(Y_f))；

其中，X′_s，Y′_f和M_sf表示三个反向特征，X_s和Y_f分别表示空间域特征和频域特征，FC表示两个线性层，GN表示群范数，sigmoid表示激活函数；

将三个反向特征添加到最终的注意力模块中，以获得所述空间域特征和所述频域特征的统一表示A_i，其中，统一表示A_i可以写成：

A_i＝atten(Conv_1×1(X′_s+Y′_f+M_sf))；

其中，atten表示普通注意力模块。

本发明的进一步技术方案是，所述将三个反向特征添加到最终的注意力模块中，以获得所述空间域特征和所述频域特征的统一表示A_i的步骤之后还包括：

借助特征金字塔PAFPN将所述空间域特征和所述频域特征的统一表示A_i融合得到遥感图像以进一步丰富语义信息；

将所述空间域特征和所述频域特征的统一表示A_i输入检测头得到最后的检测结果。

为实现上述目的，本发明还提出一种无人机图像处理系统，所述系统包括存储器、处理器以及存储在所述处理器上的无人机图像处理程序，所述无人机图像处理程序被所述处理器运行时执行如上所述的方法的步骤。

为实现上述目的，本发明还提出一种计算机可读存储介质，所述计算机可读存储介质存储有无人机图像处理程序，所述无人机图像处理程序被处理器运行时执行如上所述的方法的步骤。

本发明无人机图像处理方法、系统及介质的有益效果是：本发明通过上述技术方案，采用自适应的双分支网络，可以更好地应对遥感图像小目标检测的挑战，减少缺乏足够空间域的信息，增强语义信息的表示。另外，本发明通过一种融合机制，结合图像增强网络实现语义增强，挖掘空间和频域元素的联合表示，从而提高了小目标检测的精度。

附图说明

图1是本发明无人机图像处理方法第一实施例的流程示意图；

图2是本发明无人机图像处理方法所涉及到的模型框架图。

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。

具体实施方式

应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。

考虑到目前基于计算机视觉技术的目标检测并不能有效的处理航拍图像总多小目标问题，这是因为现在的目标检测器在图像处理时会损失空间域信息，从而导致航拍图像的小目标检测准确率较低，为解决这个问题，本发明采用一种从空间域转移到频域的注意力机制，针对航拍图像小物体进行了检测优化，同时，本发明结合图像增强网络的融合机制实现语义增强并提取空间域和频域的联合表示组件提高了小物体检测的准确性。

请参照图1，本发明提出一种无人机图像处理方法，本发明无人机图像处理方法第一实施例包括以下步骤：

步骤S10，获取无人机拍摄到的遥感图像数据，作为输入图像。

本发明无人机图像处理方法所涉及的模型框架图如图2所示，本实施例中，整个模型的输入是遥感图像数据，该图像可为无人机拍摄得到。本实施例中，设表示输入的表格图像，其中H和W分别表示输入图像的高度和宽度。

步骤S20，基于双分支网络对所述图像进行处理，得到所述图像的空间域特征和频域特征，其中，所述双分支网络包括空间域分支和频域分支。

本实施例中，所述双分支网络包括空间域分支和频域分支。

ResNet-50凭借其强大的残差块，已成为计算机视觉任务中使用最广泛的骨干网络之一，本实施例采用ResNet-50作为提取空间域特征的骨干网络。

图像的压缩会显著影响图像的空间域信息，但是频域信息可以保留，因此，需要合并频域信息和空间域信息，以获得坚固的表示以进行检测。

值得提出的是，为了融合所述图像的空间域特征和频域特征，最简单的方法就是将相应的元素添加或连接在一起，但这种方案有时可能会难以产生最佳性能，因此，本实施例基于神经网络中汲取灵感，通过在空间频域融合模块中加入了注意力机制，将所述图像的空间域特征和频域特征结合起来，进行融合，得到所述图像的空间域特征和频域特征的统一表示。

本实施例的有益效果是：本实施例通过上述技术方案，采用自适应的双分支网络，可以更好地应对遥感图像小目标检测的挑战，减少缺乏足够空间域的信息，增强语义信息的表示。另外，本实施例通过一种融合机制，结合图像增强网络实现语义增强，挖掘空间和频域元素的联合表示，从而提高了小目标检测的精度。

基于图1所示的第一实施例，提出本发明无人机图像处理方法第二实施例，本实施例与图1所示的第一实施例的区别在于，本实施例中，所述基于双分支网络对所述图像进行处理，得到所述图像的空间域特征和频域特征的步骤包括：

图像压缩通常采用离散余弦变换(DCT)，本实施例利用DCT将输入图像I从空间域移动到频域，此外，DCT可以比其他技术(如快速傅里叶变换)更有效地变换频域特征。

具体地，本实施例中，所述采用二维离散余弦变换对所述图像进行频域转换，得到所述图像的频域特征的步骤中所采用的公式为：

所述将所述图像从空间域移动到频域，采用二维离散余弦变换对所述图像进行频域转换，得到所述图像的频域特征的步骤之后还包括：

在DCT应用之后，高频信息通常位于图像的右下角，而低频信息位于左上角，为了消除频域中多余的语义信息和噪声干扰，本实施例采用了特征增强模块(TEB)。

所述基于特征增强模块消除所述频域特征中多余的语义信息和噪声干扰的步骤具体包括：

对所述图像进行下采样生成多尺度图像x_f＝{x₁，x₂，...，x_n}，其中，n是指4。

本实施例首先形成输入图像I，然后通过DCT变换到频域，模型对其进行下采样生成多尺度图像x_f。

然后采用特征增强模块(TEB)构建多尺度特征图，其中，所述特征增强模块的一部分写成：

本实施例中，所述基于特征增强模块消除所述频域特征中多余的语义信息和噪声干扰的步骤还包括：

其中，DW-Conv_3x3表示内核大小为3x3的深度卷积层。在TEB模块之后，X_out将使用空间频域特征融合块(SFFB)模块与空间域图片融合。

本实施例中，所述步骤S30，将所述图像的空间域特征和频域特征进行融合，得到所述图像的空间域特征和频域特征的统一表示的步骤包括：

为了融合空间域特征和频域特征，最简单的方法是将相应的元素添加或连接在一起，尽管这是一项简单的操作，但是有时可能难以产生最佳性能。因此，本实施例从人工神经网络中汲取灵感，在空间频域特征融合模块中加入了注意力机制，将空间域特征和频域特征结合起来。具体地，本实施例主要是通过以下方法获得最终的融合特征表示。首先，空间域的特征通过通道注意力自动捕获重要的区域特征；频域特征，通过空间注意力增强其局部细节并抑制冗余语义信息。

进一步地，本实施例中，所述步骤S30，将所述图像的空间域特征和频域特征进行融合，得到所述图像的空间域特征和频域特征的统一表示的步骤还包括：

M_sf＝Conv_1×1(Conv_1×1(X_s)·Conv_1×1(Y_f))；

其中，X′_s，Y′_f和M_sf表示三个反向特征，X_s和Y_f分别表示空间域特征和频域特征，FC表示两个线性层，GN表示群范数，sigmoid表示激活函数。

A_i＝atten(Conv_1×1(X′_s+Y′_f+Msf))；

其中，atten表示普通注意力模块。

进一步地，本实施例中，所述将三个反向特征添加到最终的注意力模块中，以获得所述空间域特征和所述频域特征的统一表示A_i的步骤之后还包括：

将所述空间域特征和所述频域特征的统一表示A_i输入检测头得到最后的检测结果。其中，本实施例采用的是Faster-rcnn的检测头。

本发明无人机图像处理方法的有益效果是：本发明通过上述技术方案，采用自适应的双分支网络，可以更好地应对遥感图像小目标检测的挑战，减少缺乏足够空间域的信息，增强语义信息的表示。另外，本发明通过一种融合机制，结合图像增强网络实现语义增强，挖掘空间和频域元素的联合表示，从而提高了小目标检测的精度。

为实现上述目的，本发明还提出一种无人机图像处理系统，所述系统包括存储器、处理器以及存储在所述处理器上的无人机图像处理程序，所述无人机图像处理程序被所述处理器运行时执行如上任一实施例所述的方法的步骤，这里不再赘述。

为实现上述目的，本发明还提出一种计算机可读存储介质，所述计算机可读存储介质存储有无人机图像处理程序，所述无人机图像处理程序被处理器运行时执行如权利要求1至8上任一实施例所述的方法的步骤，这里不再赘述。

以上所述仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或流程变换，或直接或间接运用在其它相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种无人机图像处理方法，其特征在于，所述方法包括以下步骤：

2.根据权利要求1所述的无人机图像处理方法，其特征在于，所述基于双分支网络对所述图像进行处理，得到所述图像的空间域特征和频域特征的步骤包括：

3.根据权利要求2所述的无人机图像处理方法，其特征在于，所述采用二维离散余弦变换对所述图像进行频域转换，得到所述图像的频域特征的步骤中所采用的公式为：

4.根据权利要求2所述的无人机图像处理方法，其特征在于，所述将所述图像从空间域移动到频域，采用二维离散余弦变换对所述图像进行频域转换，得到所述图像的频域特征的步骤之后还包括：

基于特征增强模块消除所述频域特征中多余的语义信息和噪声干扰；

所述基于特征增强模块消除所述频域特征中多余的语义信息和噪声干扰的步骤包括：

5.根据权利要求4所述的无人机图像处理方法，其特征在于，所述基于特征增强模块消除所述频域特征中多余的语义信息和噪声干扰的步骤还包括：

将特和传递给前馈网络FFN以增强信道信息，其中，前馈网络FFN可以写成：

其中，DW-Conv_3x3表示内核大小为3x3的深度卷积层。

6.根据权利要求5所述的无人机图像处理方法，其特征在于，所述步骤S30，将所述图像的空间域特征和频域特征进行融合，得到所述图像的空间域特征和频域特征的统一表示的步骤包括：

7.根据权利要求6所述的无人机图像处理方法，其特征在于，所述步骤S30，将所述图像的空间域特征和频域特征进行融合，得到所述图像的空间域特征和频域特征的统一表示的步骤还包括：

M_sf＝Conv_1×1(Conv_1×1(X_s)·Conv_1×1(Y_f))；

A_i＝atten(Conv_1×1(X′_s+Y′_f+M_sf))；

其中，atten表示普通注意力模块。

8.根据权利要求7所述的无人机图像处理方法，其特征在于，所述将三个反向特征添加到最终的注意力模块中，以获得所述空间域特征和所述频域特征的统一表示A_i的步骤之后还包括：

9.一种无人机图像处理系统，其特征在于，所述系统包括存储器、处理器以及存储在所述处理器上的无人机图像处理程序，所述无人机图像处理程序被所述处理器运行时执行如权利要求1至8任意一项所述的方法的步骤。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有无人机图像处理程序，所述无人机图像处理程序被处理器运行时执行如权利要求1至8任意一项所述的方法的步骤。