CN117671509B

CN117671509B - 遥感目标检测方法、装置、电子设备及存储介质

Info

Publication number: CN117671509B
Application number: CN202410147681.8A
Authority: CN
Inventors: 周严; 鹿璇; 黄炎; 杜飞飞
Original assignee: Wuhan Zmvision Technology Co ltd
Current assignee: Wuhan Zhuomu Technology Co ltd
Priority date: 2024-02-02
Filing date: 2024-02-02
Publication date: 2024-05-24
Anticipated expiration: 2044-02-02
Also published as: CN117671509A

Abstract

本发明提供一种遥感目标检测方法、装置、电子设备及存储介质，属于遥感目标检测技术领域，该方法包括：获取待检测遥感图像；将所述待检测遥感图像输入至遥感目标检测模型，得到所述遥感目标检测模型输出的所述待检测遥感图像的目标检测结果；所述遥感目标检测模型用于基于对所述待检测遥感图像进行特征提取得到的卷积特征和注意力特征进行融合，并基于融合所得的特征确定所述待检测遥感图像的目标检测结果；所述遥感目标检测模型是根据遥感图像样本和对应的遥感目标标签信息训练得到的。本发明可以精确识别遥感图像中的目标，有效提高了遥感目标检测的精度和效果，同时也大幅度提高了遥感目标检测的效率。

Description

遥感目标检测方法、装置、电子设备及存储介质

技术领域

本发明涉及遥感目标检测技术领域，尤其涉及一种遥感目标检测方法、装置、电子设备及存储介质。

背景技术

遥感是于 20 世纪 60 年代发展起来的一项对地观测技术。自从上世纪 80 年代以来，遥感技术的发展非常迅速，对于遥感技术的应用也越来越广泛。遥感图像虽然能提供巨大的信息量，但是如果只靠人力分析，不仅效率底下，耗费不必要的人力物力，还容易漏掉一些关键信息。随着近几年来计算机视觉的飞速发展，学术界和工业界开始用目标检测方法来处理遥感图像，以提高信息提取的效率。

但是遥感图像和一般图像存在非常大的差异，由于遥感图像的背景更复杂、目标相对小而多、目标朝向具任意性，以致传统模型对于遥感目标的检测精度较低。

因此，如何更好地进行遥感目标检测已经成为业界亟待解决的技术问题。

发明内容

本发明提供一种遥感目标检测方法、装置、电子设备及存储介质，用以更好地进行遥感目标检测。

本发明提供一种遥感目标检测方法，包括：

获取待检测遥感图像；

将所述待检测遥感图像输入至遥感目标检测模型，得到所述遥感目标检测模型输出的所述待检测遥感图像的目标检测结果；

所述遥感目标检测模型用于基于对所述待检测遥感图像进行特征提取得到的卷积特征和注意力特征进行融合，并基于融合所得的特征确定所述待检测遥感图像的目标检测结果；所述遥感目标检测模型是根据遥感图像样本和对应的遥感目标标签信息训练得到的。

根据本发明提供的一种遥感目标检测方法，所述遥感目标检测模型包括主干网络、颈部网络和头部网络；所述主干网络用于提取所述待检测遥感图像的卷积特征和注意力特征，并对所述卷积特征和所述注意力特征的融合特征进行多尺度特征提取；所述颈部网络用于对所述主干网络输出的多个特征图像进行特征融合；所述头部网络用于基于所述颈部网络输出的特征融合图像，确定所述待检测遥感图像的目标检测结果。

根据本发明提供的一种遥感目标检测方法，所述主干网络中的至少一个残差模块为多路径注意力模块，所述多路径注意力模块包括残差卷积模块、注意力特征提取模块、通道维串联模块和卷积模块；

所述残差卷积模块用于提取输入特征图的卷积特征；所述注意力特征提取模块用于提取所述输入特征图的注意力特征；所述通道维串联模块用于对所述输入特征图的卷积特征和注意力特征进行融合拼接，得到拼接融合特征图；所述卷积模块用于对所述拼接融合特征图进行卷积处理。

根据本发明提供的一种遥感目标检测方法，所述注意力特征提取模块包括依次连接的自适应通道注意力模块和局部自注意力模块，所述自适应通道注意力模块用于提取所述输入特征图的全局通道注意力特征，所述局部自注意力模块用于提取所述全局通道注意力特征的局部通道注意力特征。

根据本发明提供的一种遥感目标检测方法，所述颈部网络中的至少一个上采样模块为改进的上采样模块，所述改进的上采样模块包括依次连接的图像划分模块、线性全连接层、拼接模块和层归一化模块；

所述图像划分模块用于将输入的特征图划分为多个子特征图；所述线性全连接层用于将输入的每个所述子特征图进行维度扩大；所述拼接模块用于对每个维度扩大后的子特征图进行依次拼接，得到拼接后的特征图；所述层归一化模块用于对所述拼接后的特征图进行层归一化处理。

根据本发明提供的一种遥感目标检测方法，在所述将所述待检测遥感图像输入至遥感目标检测模型，得到所述遥感目标检测模型输出的所述待检测遥感图像的目标检测结果之前，所述方法还包括：

将遥感图像样本和对应的遥感目标标签信息作为一组训练样本，获取多组训练样本；

利用所述多组训练样本，对遥感目标检测模型进行训练。

根据本发明提供的一种遥感目标检测方法，所述利用所述多组训练样本，对遥感目标检测模型进行训练，包括：

对于任意一组训练样本，将所述训练样本输入至遥感目标检测模型，输出所述训练样本对应的预测信息；

利用预设损失函数，根据所述训练样本对应的预测信息和所述训练样本对应的遥感目标标签信息，计算损失值；

基于所述损失值，对所述遥感目标检测模型的模型参数进行调整，直至所述损失值小于预设阈值或训练次数达到预设次数；

将所述损失值小于所述预设阈值或训练次数达到所述预设次数时所得到的模型参数作为训练好的遥感目标检测模型的模型参数，则所述遥感目标检测模型训练完成。

本发明还提供一种遥感目标检测装置，包括：

获取模块，用于获取待检测遥感图像；

检测模块，用于将所述待检测遥感图像输入至遥感目标检测模型，得到所述遥感目标检测模型输出的所述待检测遥感图像的目标检测结果；

本发明还提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如上述任一种所述遥感目标检测方法。

本发明还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现如上述任一种所述遥感目标检测方法。

本发明还提供一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时实现如上述任一种所述遥感目标检测方法。

本发明提供的遥感目标检测方法、装置、电子设备及存储介质，通过强化对遥感目标图像卷积特征和注意力特征的融合，利用遥感图像样本和对应的遥感目标标签信息对单阶段目标检测模型进行模型训练，得到训练好的遥感目标检测模型，以利用遥感目标检测模型对待检测遥感图像进行特征提取得到卷积特征和注意力特征，并对该卷积特征和注意力特征进行融合，基于融合所得的特征对待检测遥感图像中的目标进行检测，可以精确识别遥感图像中的目标，有效提高了遥感目标检测的精度和效果，同时也大幅度提高了遥感目标检测的效率。

附图说明

为了更清楚地说明本发明或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明提供的遥感目标检测方法的流程示意图；

图2是本发明提供的遥感目标检测方法中遥感目标检测模型的结构示意图；

图3是本发明提供的遥感目标检测方法中多路径注意力模块的结构示意图；

图4是本发明提供的遥感目标检测方法中改进的上采样方法的流程示意图；

图5是本发明提供的遥感目标检测装置的结构示意图；

图6是本发明提供的电子设备的实体结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合本发明中的附图，对本发明中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

下面结合图1-图6描述本发明的遥感目标检测方法、装置、电子设备及存储介质。

图1是本发明提供的遥感目标检测方法的流程示意图，如图1所示，包括：

步骤110，获取待检测遥感图像；

步骤120，将待检测遥感图像输入至遥感目标检测模型，得到遥感目标检测模型输出的待检测遥感图像的目标检测结果；

遥感目标检测模型用于基于对待检测遥感图像进行特征提取得到的卷积特征和注意力特征进行融合，并基于融合所得的特征确定待检测遥感图像的目标检测结果；遥感目标检测模型是根据遥感图像样本和对应的遥感目标标签信息训练得到的。

具体地，本发明实施例所描述的待检测遥感图像指的是待检测区域的遥感图像，其中，待检测区域中可能出现有所需检测的目标。

本发明实施例所描述的遥感目标检测模型是根据遥感图像样本和对应的遥感目标标签信息对单阶段目标检测模型训练得到的，用于对待检测遥感图像进行特征提取，获取待检测遥感图像的卷积特征和注意力特征，并对该卷积特征和注意力特征进行融合，基于融合所得的特征对待检测遥感图像进行目标检测，输出高精度的目标检测结果。

需要说明的是，本发明实施例中，遥感目标检测模型可以是基于单阶段目标检测模型构建得到的。其中单阶段目标检测模型具体可以采用YOLO系列模型，如YOLOv5模型、YOLOv7模型、YOLOv8模型等，也可以目标检测模型RetinaNet，等等，还可以为其他用于目标检测，实现遥感图像目标检测的模型，在本发明中不做具体限定。

其中，在本发明的实施例中，模型训练样本是由多组携带有遥感目标标签信息的遥感图像样本组成的。

在本发明的实施例中，遥感目标标签信息是遥感图像样本中目标的真实标注信息，其可以采用LabelImg标注软件对遥感图像样本进行标注得到，其是根据遥感图像样本预先确定的，并与遥感图像样本是一一对应的。也就是说，训练样本中的每一个遥感图像样本，都预先设定好携带与之对应的遥感目标标签信息。

在本发明的实施例中，步骤110中，通过遥感设备，如无人机或是高空相机对待检测区域进行高空录制视频，然后从该视频中逐帧抽取出每一张视频帧，从而获取待检测遥感图像。

进一步地，在本发明的实施例中，步骤120中，预先利用遥感图像样本和对应的遥感目标标签信息对预设的目标检测模型进行模型训练，得到训练好的遥感目标检测模型，然后将步骤110中获取到的待检测遥感图像输入至遥感目标检测模型，通过遥感目标检测模型对待检测遥感图像进行特征提取得到卷积特征和注意力特征，并对两类图像特征进行融合，根据融合所得的特征进一步进行目标识别，最终输出待检测遥感图像的目标检测结果。

本发明实施例的遥感目标检测方法，通过强化对遥感目标图像卷积特征和注意力特征的融合，利用遥感图像样本和对应的遥感目标标签信息对单阶段目标检测模型进行模型训练，得到训练好的遥感目标检测模型，以利用遥感目标检测模型对待检测遥感图像进行特征提取得到卷积特征和注意力特征，并对该卷积特征和注意力特征进行融合，基于融合所得的特征对待检测遥感图像中的目标进行检测，可以精确识别遥感图像中的目标，有效提高了遥感目标检测的精度和效果，同时也大幅度提高了遥感目标检测的效率。

图2是本发明提供的遥感目标检测方法中遥感目标检测模型的结构示意图，如图2所示，在本发明的实施例中，遥感目标检测模型包括主干网络1、颈部网络2和头部网络3；主干网络1用于提取待检测遥感图像的卷积特征和注意力特征，并对卷积特征和注意力特征的融合特征进行多尺度特征提取；颈部网络2用于对主干网络输出的多个特征图像进行特征融合；头部网络3用于基于颈部网络输出的特征融合图像，确定待检测遥感图像的目标检测结果。

具体地，在本发明的实施例中，遥感目标检测模型是基于单阶段的目标检测模型构建的，比如YOLO系列模型：YOLOv5模型、YOLOv7模型、YOLOv8模型，以及目标检测模型RetinaNet等。

在本发明的实施例中，遥感目标检测模型包括主干网络（Backbone）、颈部网络（Neck）和头部网络（Head）三个部分。

其中，主干网络可以引入注意力融合机制，用于同时提取待检测遥感图像的卷积特征和注意力特征，并对卷积特征和注意力特征的融合特征进行多尺度特征提取。

颈部网络则可以对主干网络输出的多个特征图像进行特征融合，实现对骨干网络的不同层次的特征进行多尺度融合。

头部网络也称为检测网络，包括分类器和回归网络。该分类器用于根据颈部网络输出的特征融合图像对区域特征图和目标对象进行分类，得到分类结果；回归网络则用于对区域特征图中的锚框进行边框回归处理，以修正锚框的位置，得到目标物体的准确位置，最终输出待检测遥感图像的目标检测结果。

本发明实施例的方法，通过采用注意力融合机制来改进单阶段目标检测模型中的主干网络，使其能够同时提取待检测遥感图像的卷积特征和注意力特征，并进行融合，加强模型对局部信息的感知度，增强网络对局部遥感目标的检测效果，对遥感目标特别是遥感小目标有更强的感知能力。

基于上述实施例的内容，作为一种可选的实施例，主干网络中的至少一个残差模块为多路径注意力模块，多路径注意力模块包括残差卷积模块、注意力特征提取模块、通道维串联模块和卷积模块；

残差卷积模块用于提取输入特征图的卷积特征；注意力特征提取模块用于提取输入特征图的注意力特征；通道维串联模块用于对输入特征图的卷积特征和注意力特征进行融合拼接，得到拼接融合特征图；卷积模块用于对拼接融合特征图进行卷积处理。

具体地，本发明实施例所描述的主干网络中的残差模块可以是YOLOv5模型中的C3模块，也可以是YOLOv7模型中的ELAN模块，也可以是YOLOv8模型中的C2f模块，以及还可以是目标检测模型RetinaNet中的残差块（Bottleneck）。

在本发明的实施例中，主干网络中的至少一个残差模块为多路径注意力模块，也就是说，针对YOLOv5模型，主干网络中至少有一个C3模块被替换为多路径注意力模块；针对YOLOv7模型，主干网络中至少有一个ELAN模块被替换为多路径注意力模块；针对YOLOv8模型，主干网络中至少有一个C2f模块被替换为多路径注意力模块；针对RetinaNet模型，主干网络中至少有一个残差块被替换为多路径注意力模块。

图3是本发明提供的遥感目标检测方法中多路径注意力模块的结构示意图，如图3所示，在本发明的实施例中，多路径注意力模块主要包括残差卷积（ResNet）模块11、注意力特征提取模块12、通道维串联模块13和卷积模块14；

残差卷积模块11用于提取输入特征图的卷积特征；注意力特征提取模块12用于提取输入特征图的注意力特征；通道维串联模块13用于对输入特征图的卷积特征和注意力特征进行融合拼接，得到拼接融合特征图；卷积模块14用于对拼接融合特征图进行卷积处理。

在本发明的实施例中，多路径注意力模块的整体结构由残差卷积模块、注意力特征提取模块作为两路并行分支结构组成，两路分支所提取的特征会在通道维串联模块上进行串联融合，最后再经过卷积模块处理，完成注意力特征和卷积特征的融合。其中，卷积模块可以采用3×3卷积处理方式。

继续参照图3，基于上述实施例的内容，作为一种可选的实施例，注意力特征提取模块12包括依次连接的自适应通道注意力（Adaptive Channel Attention，ACA）模块121和局部自注意力（Local Self-Attention，LSA）模块122，ACA模块用于提取输入特征图的全局通道注意力特征，LSA模块用于提取全局通道注意力特征的局部通道注意力特征。

由于卷积神经网络和注意力机制虽然在理论上存在互补的可能性，但是实际上二者的兼容性并不理想，如果直接做特征融合的加法，最后融合出来的特征反而不是很理想。

其中，LSA模块为Swin Tranformer模型的基本模块。ACA模块可以基于对SENet模型的通道注意力模块进行改进，将其全局池化替换为自适应全局池化而得到。

本发明实施例的方法，通过在特征图进入LSA模块之前设置一个ACA模块，以此构建多路径注意力模块中的注意力特征提取模块，让经过卷积神经网络处理后的特征图以更兼容的方式进入LSA模块，可以让LSA模块只关注重要的通道特征。

在本发明的实施例中，多路径注意力模块的计算公式可以表示为：

；

具体来说，多路径注意力模块通过两路分支网络，将输入特征图通过两个1×1卷积层（对应上述公式中的和/>），在通道维将输入特征图切分为二，其一使用传统的残差卷积模块（对应上述公式中的/>）进行卷积计算；其二先用于基于窗口划分的LSA模块处理（对应上述公式中的/>）计算，再使用基于自适应全局池化的ACA模块（对应上述公式中的/>）计算，二者计算完毕后在通道维合二为一，经过一个 3×3 卷积层（对应上述公式中的/>）后，得到最终的输出。

在本发明的实施例中，骨干网络的多路径注意力模块的基于窗口划分的LSA模块的处理过程：先将输入的初始特征图基于固定窗口进行划分，可以表示为：

；

其中，表示初始特征图，/>表示初始特征图上的第/>行、第/>列的子特征图，/>表示多头自注意力，/>表示初始特征图的子特征图集合，/>表示注意力加强后的特征图。

继续参照图3，更具体地，假设输入多路径注意力模块的特征图的尺寸是 C×H×W，其中，C表示图像通道数目，H表示图像高度，W表示图像宽度。为了降低计算复杂度，两路分支的1×1卷积层主要负责在通道维度上降低通道数，即每个1×1卷积层的输出图像尺寸是(C/2) ×H×W。

对于上方的第一路分支，通过ACA模块，让经过卷积神经网络处理后的特征图以更兼容的方式进入LSA模块，可以让LSA模块只关注重要的通道特征。随后特征图经过LSA模块，提取图像的局部特征，最后输出图像的尺寸依然是(C/2) ×H×W。

对于下方的第二路分支，使用残差结构来进一步提取图像的局部信息，最后输出图像的尺寸也是(C/2) ×H×W。两个部分的输出在通道维上串联，最终可以得到尺寸为 C×H×W 的特征图，最后再经过一个 3×3 卷积后输出尺寸为 C×H×W 的融合后的特征图。

需要说明的是，常规自注意力方法通常是经过一个大卷积核和与卷积核大小相同地步长做一个嵌入（embedding）操作，以此得到图像到句子的编码，进而进行自注意力的计算。这样操作虽然利于自然图像，但显然不利于遥感图像，这是因为在embedding操作后，遥感目标的细节信息会被大大弱化，最终导致训练出来的模型对遥感目标，特别是遥感小目标的感知能力弱。

在本发明的实施例中，通过引入LSA模块来改进这个问题。其基本方法是，将原始特征按设定的窗口大小分为若干子特征，然后在子特征上计算查询向量Q、键向量K和值向量V，进而进行自注意力计算。

还与常规自注意力不同的是，本发明实施例还提供另外一种Q、K、V的取得方法。在局部窗口自注意力中，Q是通过线性变换直接作用于H、W维度得到的（区别于常规方法是作用于通道维度），这种做法得到的Q的每一个值是综合考虑全局得到的，而K和V未作任何改变，都是输入本身。将所用子特征图计算完毕后，即将计算后的子特征图拼成一个与原始特征图尺寸一样的计算后的特征图，为了确保新特征图的一致性，本专利使用层归一化（Layer Norm）正则化对新特征图进行处理，处理后再进行传统自注意力都用的MLP操作。

在本发明的实施例中，骨干网络的多路径注意力模块的基于自适应全局池化的ACA模块的处理过程：使用可学习的线性层对输入的初始特征进行全局池化，自适应全局池化通过一个线性层（Linear）在特征维度进行线性变化，最后得到和初始特征通道数一样，特征维度为1×1 的特征图。

需要说明的是，传统的通道注意力方法中，通常使用最大池化来得到通道权重参数，但是对于遥感目标而言，简单的最大池化会丢掉许多纹理信息。而在本发明的实施例中，将全局自适应池化应用于通道注意力计算中，简称为自适应通道注意力。全局自适应池化的本质上是一个尺寸为图片大小的卷积核，这单个卷积核和特征图每个通道的二维矩阵做卷积运算，最后得到和原图片通道数一样的 1×1×C 的特征图。在实际操作过程中，可以使用线性变换即一层全连接网络来实现这种操作。使用全局自适应池化生成通道权重后，即可通过传统的压缩和膨胀操作，将最终通道权重赋权于通道维度。

本发明实施例的方法，通过将构建好的多路径注意力模块替换主干网络中的残差模块，利用多路径注意力模块中的两路分支结构，通过模块中的ACA处理，增强目标的特征提取效果，防止常规池化所造成的目标特征信息的丢失，通过模块中基于窗口划分的LSA，获取遥感目标周围的局部信息，强化网络对遥感目标的局部感知能力，并将两路分支的特征进行融合，实现检测图像中注意力特征和卷积特征的融合，极大地增强了遥感目标检测模型对局部遥感目标的检测效果。

基于上述实施例的内容，作为一种可选的实施例，颈部网络中的至少一个上采样模块为改进的上采样模块，改进的上采样模块包括依次连接的图像划分模块、线性全连接层、拼接模块和层归一化模块；

图像划分模块用于将输入的特征图划分为多个子特征图；线性全连接层用于将输入的每个子特征图进行维度扩大；拼接模块用于对每个维度扩大后的子特征图进行依次拼接，得到拼接后的特征图；层归一化模块用于对拼接后的特征图进行层归一化处理。

具体地，在本发明的实施例中，颈部网络中的上采样模块可以是YOLOv5模型、YOLOv7模型、YOLOv8模型以及RetinaNet模型中的上采样模块。

在本发明的实施例中，颈部网络中的至少一个上采样模块为改进的上采样模块，也就是说，针对YOLOv5模型，颈部网络中至少有一个上采样模块被替换为改进的上采样模块；针对YOLOv7模型，颈部网络中至少有一个上采样模块被替换为改进的上采样模块；针对YOLOv8模型，颈部网络中至少有一个上采样模块被替换为改进的上采样模块；针对RetinaNet模型，颈部网络中至少有一个上采样模块被替换为改进的上采样模块。

在本发明的实施例中，改进的上采样模块包括依次连接的图像划分模块、线性全连接层、拼接模块和层归一化模块。改进的上采样模块执行的是一种可学习的上采样方法，即局部可学习上采样方法。局部可学习上采样带有可学习参数，这是与常规的近邻上采样不带可学习参数的方法之间的主要区别。

图4是本发明提供的遥感目标检测方法中改进的上采样方法的流程示意图，如图4所示，在本发明的实施例中，将特征图输入改进的上采样模块后，通过图像划分模块将输入的特征图按照预先设定的窗口大小进行划分，得到4个子特征图，进而通过线性全连接层操作（Linear（HW，4H/>W）），将输入的每个子特征图进行拉直后的HW维度扩大四倍，接着通过拼接模块对每个维度扩大后的子特征图按次序拼接，得到拼接后的特征图，并使用层归一化模块对拼接后的特征图进行层归一化处理，得到最终的两倍上采样的输出特征图。

本发明实施例的方法，通过利用改进的上采样方法，对输入特征图进行局部可学习的上采样操作，可以有效优化常规上采样方法破坏小目标特征信息的问题，增强颈部网络特征融合的效果，进一步提升遥感目标检测的精度。

在本发明的一个具体实施例中，遥感目标检测模型是基于YOLOv5模型构建的，将YOLOv5模型中主干网络的C3模块均替换为多路径注意力模块，并将颈部网络中的上采样模块均替换为改进的上采样模块。在得到训练好的遥感目标检测模块后，将待检测遥感图像输入至遥感目标检测模型进行目标检测，通过主干网络提取待检测遥感图像的卷积特征和注意力特征，并对卷积特征和注意力特征的融合特征进行多尺度特征提取，可以得到主干网络中输出层上多路径注意力模块输出的特征图和最后一层快速空间金字塔池化（Spatial Pyramid Pooling – Fast，SPPF）模块输出的特征图。

进一步地，颈部网络结合改进的上采样模块对主干网络输出的这些特征图像进行特征融合处理，最终将多个特征融合图像输入至头部网络中，头部网络通过对这些特征融合图像的检测，最终输出待检测遥感图像的目标检测结果。

基于上述实施例的内容，作为一种可选的实施例，在将待检测遥感图像输入至遥感目标检测模型，得到遥感目标检测模型输出的待检测遥感图像的目标检测结果之前，该方法还包括：

利用多组训练样本，对遥感目标检测模型进行训练。

在本发明的实施例中，在将待检测遥感图像输入至遥感目标检测模型之前，还需对遥感目标检测模型进行训练，以得到训练好的遥感目标检测模型。

在本发明的实施例中，模型训练之前，首先要对样本数据进行采集，以车辆目标检测为例，可以采用无人机或是高空相机高空录制多个场景车辆的视频（包含：停车场、十字路口、高架桥等等），然后将其逐帧抽出每一张图片。同时，使用相机拍摄多个场景的汽车图像（场景尽可能的多），由此获取大量遥感图像样本。获取前述采集的包含检测目标的图像样本，分别生成训练集合A和验证集合B。

可选地，在本发明的实施例中，还可以对训练集合A采取数据增广方式，增加训练集合A的图片个数，以提高模型识别能力和泛化能力。其中，数据增广方式包括旋转、反射变换、翻转变换、缩放变换、平移变换、尺度变换、对比度变换、噪声扰动和颜色变换中的至少一种方式。数据增强使数据集中包括同一张图片在不同角度、不同尺度的各种数据，增加了数据集中图片的个数。通过扩充数据集，可以防止图像样本过少导致的过拟合问题。

进一步地，将训练集合A和验证集合B中的检测目标用矩形框进行逐一标注。具体地，每个目标对应一个矩形框坐标（x,y,w,h）和矩形框中所包含目标的种类，矩形框尽可能贴近目标，其中，x、y分别表示矩形框中心点相对于图片左上角的水平和竖直偏移，w表示矩形框的宽度，h表示矩形框的高度。每个图片还对应一个txt文件，txt文件中每一行包含该图中目标对应的矩形框的坐标（x,y,w,h）以及目标类别，从而确定每一遥感图像样本的遥感目标标签信息。该过程优选采用LabelImg标注软件进行标注。

在本发明的实施例中，利用上述训练集合A对遥感目标检测模型进行训练，具体训练过程如下：

将遥感图像样本和对应的遥感目标标签信息作为一组训练样本，即将每个带有遥感目标标签信息的遥感图像样本作为一组训练样本，由此即可获得多组训练样本。

在本发明的实施例中，遥感图像样本与其携带的遥感目标标签信息是一一对应的。

然后，在获得多组训练样本之后，再将多组训练样本依次输入至遥感目标检测模型中，利用多组训练样本对遥感目标检测模型进行训练，即：

将每组训练样本中的遥感图像样本与其携带的遥感目标标签信息同时输入至遥感目标检测模型中，根据遥感目标检测模型中的每一次输出结果，通过计算损失函数值，对遥感目标检测模型中的模型参数进行调整，在满足预设训练终止条件的情况下，最终完成遥感目标检测模型的整个训练过程，得到训练好的遥感目标检测模型。

进一步地，通过预先准备好的验证集合B，对上述训练好的遥感目标检测模型进行评估，最终选择出效果最好、泛化能力最佳的权重模型，作为最终训练好的遥感目标检测模型。

本发明实施例的方法，通过将遥感图像样本和对应的遥感目标标签信息作为一组训练样本，利用多组训练样本对遥感目标检测模型进行训练，有利于提升遥感目标检测模型的泛化、检测能力。

基于上述实施例的内容，作为一种可选的实施例，利用多组训练样本，对遥感目标检测模型进行训练，包括：

对于任意一组训练样本，将训练样本输入至遥感目标检测模型，输出训练样本对应的预测信息；

利用预设损失函数，根据训练样本对应的预测信息和训练样本对应的遥感目标标签信息，计算损失值；

基于损失值，对遥感目标检测模型的模型参数进行调整，直至损失值小于预设阈值或训练次数达到预设次数；

将损失值小于预设阈值或训练次数达到预设次数时所得到的模型参数作为训练好的遥感目标检测模型的模型参数，则遥感目标检测模型训练完成。

具体地，本发明实施例所描述的预设损失函数指的是预先设置在遥感目标检测模型里的损失函数，用于进行模型评估；预设阈值指的是模型预先设置的阈值，用于获得最小损失值，完成模型训练；预设次数指的是预先设置的模型迭代训练的最大次数。

在获得多组训练样本之后，对于任意一组训练样本，将每组训练样本中的遥感图像样本与其携带的遥感目标标签信息同时输入至遥感目标检测模型，输出该训练样本对应的预测信息。

在此基础上，利用预设损失函数，根据该训练样本对应的预测信息和该训练样本对应的遥感目标标签信息，计算损失值。

进一步地，在计算获得损失值之后，本次训练过程结束。再基于该损失值对遥感目标检测模型的模型参数进行调整，来更新遥感目标检测模型中的模型的各层权重参数，之后再进行下一次训练，如此反复迭代进行模型训练。

在训练的过程中，若针对某组训练样本的训练结果满足预设训练终止条件，如对应计算获得的损失值小于预设阈值，或着当前的迭代次数达到预设次数时，模型的损失值可以控制在收敛范围内，则模型训练结束。此时，可以将所得到的模型参数作为训练好的遥感目标检测模型的模型参数，则遥感目标检测模型训练完成，由此得到训练好的遥感目标检测模型。

本发明实施例的方法，通过利用多组训练样本对遥感目标检测模型进行反复迭代训练，将遥感目标检测模型的损失值控制在收敛范围内，从而有利于提高模型输出的遥感目标检测结果的准确性，提升遥感目标检测的精度。

下面对本发明提供的遥感目标检测装置进行描述，下文描述的遥感目标检测装置与上文描述的遥感目标检测方法可相互对应参照。

图5是本发明提供的遥感目标检测装置的结构示意图，如图5所示，包括：

获取模块510，用于获取待检测遥感图像；

检测模块520，用于将待检测遥感图像输入至遥感目标检测模型，得到遥感目标检测模型输出的待检测遥感图像的目标检测结果；

本实施例所述的遥感目标检测装置可以用于执行上述遥感目标检测方法实施例，其原理和技术效果类似，此处不再赘述。

本发明实施例的遥感目标检测装置，通过强化对遥感目标图像卷积特征和注意力特征的融合，利用遥感图像样本和对应的遥感目标标签信息对单阶段目标检测模型进行模型训练，得到训练好的遥感目标检测模型，以利用遥感目标检测模型对待检测遥感图像进行特征提取得到卷积特征和注意力特征，并对该卷积特征和注意力特征进行融合，基于融合所得的特征对待检测遥感图像中的目标进行检测，可以精确识别遥感图像中的目标，有效提高了遥感目标检测的精度和效果，同时也大幅度提高了遥感目标检测的效率。

图6是本发明提供的电子设备的实体结构示意图，如图6所示，该电子设备可以包括：处理器（processor）610、通信接口（Communications Interface）620、存储器（memory）630和通信总线640，其中，处理器610，通信接口620，存储器630通过通信总线640完成相互间的通信。处理器610可以调用存储器630中的逻辑指令，以执行上述各方法所提供的遥感目标检测方法，该方法包括：获取待检测遥感图像；将待检测遥感图像输入至遥感目标检测模型，得到遥感目标检测模型输出的待检测遥感图像的目标检测结果；遥感目标检测模型用于基于对待检测遥感图像进行特征提取得到的卷积特征和注意力特征进行融合，并基于融合所得的特征确定待检测遥感图像的目标检测结果；遥感目标检测模型是根据遥感图像样本和对应的遥感目标标签信息训练得到的。

此外，上述的存储器630中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备（可以是个人计算机，服务器，或者网络设备等）执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器（ROM，Read-Only Memory）、随机存取存储器（RAM，Random Access Memory）、磁碟或者光盘等各种可以存储程序代码的介质。

另一方面，本发明还提供一种计算机程序产品，所述计算机程序产品包括计算机程序，计算机程序可存储在非暂态计算机可读存储介质上，所述计算机程序被处理器执行时，计算机能够执行上述各方法所提供的遥感目标检测方法，该方法包括：获取待检测遥感图像；将待检测遥感图像输入至遥感目标检测模型，得到遥感目标检测模型输出的待检测遥感图像的目标检测结果；遥感目标检测模型用于基于对待检测遥感图像进行特征提取得到的卷积特征和注意力特征进行融合，并基于融合所得的特征确定待检测遥感图像的目标检测结果；遥感目标检测模型是根据遥感图像样本和对应的遥感目标标签信息训练得到的。

又一方面，本发明还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现以执行上述各方法提供的遥感目标检测方法，该方法包括：获取待检测遥感图像；将待检测遥感图像输入至遥感目标检测模型，得到遥感目标检测模型输出的待检测遥感图像的目标检测结果；遥感目标检测模型用于基于对待检测遥感图像进行特征提取得到的卷积特征和注意力特征进行融合，并基于融合所得的特征确定待检测遥感图像的目标检测结果；遥感目标检测模型是根据遥感图像样本和对应的遥感目标标签信息训练得到的。

以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备（可以是个人计算机，服务器，或者网络设备等）执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种遥感目标检测方法，其特征在于，包括：

获取待检测遥感图像；

所述遥感目标检测模型用于基于对所述待检测遥感图像进行特征提取得到的卷积特征和注意力特征进行融合，并基于融合所得的特征确定所述待检测遥感图像的目标检测结果；所述遥感目标检测模型是根据遥感图像样本和对应的遥感目标标签信息训练得到的；

其中，所述遥感目标检测模型包括主干网络、颈部网络和头部网络；所述主干网络用于提取所述待检测遥感图像的卷积特征和注意力特征，并对所述卷积特征和所述注意力特征的融合特征进行多尺度特征提取；所述颈部网络用于对所述主干网络输出的多个特征图像进行特征融合；所述头部网络用于基于所述颈部网络输出的特征融合图像，确定所述待检测遥感图像的目标检测结果；

其中，所述主干网络中的至少一个残差模块为多路径注意力模块，所述多路径注意力模块包括残差卷积模块、注意力特征提取模块、通道维串联模块和卷积模块；

所述残差卷积模块用于提取输入特征图的卷积特征；所述注意力特征提取模块用于提取所述输入特征图的注意力特征；所述通道维串联模块用于对所述输入特征图的卷积特征和注意力特征进行融合拼接，得到拼接融合特征图；所述卷积模块用于对所述拼接融合特征图进行卷积处理；

其中，所述注意力特征提取模块包括依次连接的自适应通道注意力模块和局部自注意力模块，所述自适应通道注意力模块用于提取所述输入特征图的全局通道注意力特征，所述局部自注意力模块用于提取所述全局通道注意力特征的局部通道注意力特征。

2.根据权利要求1所述的遥感目标检测方法，其特征在于，所述颈部网络中的至少一个上采样模块为改进的上采样模块，所述改进的上采样模块包括依次连接的图像划分模块、线性全连接层、拼接模块和层归一化模块；

3.根据权利要求1-2任一项所述的遥感目标检测方法，其特征在于，在所述将所述待检测遥感图像输入至遥感目标检测模型，得到所述遥感目标检测模型输出的所述待检测遥感图像的目标检测结果之前，所述方法还包括：

利用所述多组训练样本，对遥感目标检测模型进行训练。

4.根据权利要求3所述的遥感目标检测方法，其特征在于，所述利用所述多组训练样本，对遥感目标检测模型进行训练，包括：

5.一种遥感目标检测装置，其特征在于，包括：

获取模块，用于获取待检测遥感图像；

6.一种电子设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1至4任一项所述遥感目标检测方法。

7.一种非暂态计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至4任一项所述遥感目标检测方法。