CN113822383A

CN113822383A - 一种基于多域注意力机制的无人机检测方法及系统

Info

Publication number: CN113822383A
Application number: CN202111389310.3A
Authority: CN
Inventors: 罗远哲; 刘瑞景; 徐盼云; 梅轶纯; 郑玉洁; 吴鹏; 刘志明; 李文静; 孟小钰
Original assignee: Beijing China Super Industry Information Security Technology Ltd By Share Ltd
Current assignee: Beijing China Super Industry Information Security Technology Ltd By Share Ltd
Priority date: 2021-11-23
Filing date: 2021-11-23
Publication date: 2021-12-21
Anticipated expiration: 2041-11-23
Also published as: CN113822383B

Abstract

本发明涉及一种基于多域注意力机制的无人机检测方法，该方法包括：构建无人机检测图像数据集；构建基于多域注意力机制的无人机检测网络；采用无人机检测图像数据集对无人机检测网络进行训练，获得无人机检测模型；利用无人机检测模型对待检测图像进行无人机检测；无人机检测网络包括骨干网络、多尺度特征融合网络、多域注意力机制模块、区域生成网络、ROI Align层和检测头。本发明提高了无人机识别精度。

Description

一种基于多域注意力机制的无人机检测方法及系统

技术领域

本发明涉及目标检测领域，特别是涉及一种基于多域注意力机制的无人机检测方法及系统。

背景技术

近年来，中国无人机行业迅速发展，无人机的应用场景得以不断拓宽加深。但是无人机数量的激增和其监管体系的不完善也导致了个人隐私泄露、保密信息外泄等一系列问题，对社会与军事安全构成了严重威胁。实现无人机的快速精确识别是进行无人机监管和反制的基础。由于强大的特征表达能力和出色的检测效率，基于卷积神经网络的目标检测技术得到了专家学者的广泛研究，能够为无人机识别提供可靠的技术途径。

然而无人机多处于飞行运动状态，导致其在视场中的尺寸变化较大。此外，受到型号、飞行姿态、拍摄角度等多种因素影响，无人机的视觉特征存在较大的丰富性和差异性。这使得无人机的精确检测成为目标检测领域的一大难点。现有算法多采用多尺度特征融合技术来解决无人机检测中的尺度变化问题（曹靖豪,张俊举,黄维,姚若彤,张平.基于多尺度特征融合的无人机识别与检测[J].空天防御,2021,4(01):60-64+70.），但对如何从丰富的特征信息中筛选出有助于无人机识别定位的关键特征则研究较少。因此，亟需探索一种能精确识别和定位无人机的方法。

发明内容

本发明的目的是提供一种基于多域注意力机制的无人机检测方法及系统，提高了无人机识别精度。

为实现上述目的，本发明提供了如下方案：

一种基于多域注意力机制的无人机检测方法，包括：

构建无人机检测图像数据集；

构建基于多域注意力机制的无人机检测网络；

采用所述无人机检测图像数据集对所述无人机检测网络进行训练，获得无人机检测模型；

利用所述无人机检测模型对待检测图像进行无人机检测；

所述无人机检测网络包括骨干网络、多尺度特征融合网络、多域注意力机制模块、区域生成网络、ROI Align层和检测头；

所述骨干网络包括依次连接的第一卷积块、第二卷积块、第三卷积块、第四卷积块和第五卷积块；

所述多尺度特征融合网络用于对所述第五卷积块的输出进行卷积核为1*1的卷积操作，获得特征图F5；所述多尺度特征融合网络还用于将对所述特征图F5进行上采样操作后的特征图与对所述第四卷积块的输出进行卷积核为1*1的卷积操作后的特征图进行元素级相加，获得特征图F4；所述多尺度特征融合网络还用于将对所述特征图F4进行上采样操作后的特征图与对所述第三卷积块的输出进行卷积核为1*1的卷积操作后的特征图进行元素级相加，获得特征图F3；所述多尺度特征融合网络还用于将对所述特征图F3进行上采样操作后的特征图与对所述第二卷积块的输出进行卷积核为1*1的卷积操作后的特征图进行元素级相加，获得特征图F2；

所述多域注意力机制模块用于对所述特征图F5进行全局平均池化，获得通道域特征图；所述多域注意力机制模块还用于将所述通道域特征图分别与所述特征图F4、所述特征图F3和所述特征图F2相乘，获得对应的特征图M5、特征图M4、特征图M3和特征图M2；所述多域注意力机制模块还用于对所述特征图F2进行卷积核为1*1的卷积操作，获得空间域特征图；所述多域注意力机制模块还用于将所述空间域特征图与所述特征图M2相乘，获得特征图D2；所述多域注意力机制模块还用于将所述空间域特征图进行一次核为2*2的最大池化操作后与所述特征图M3相乘，获得特征图D3，将所述空间域特征图进行最大池化操作后的特征图与所述特征图M3空间维度相同；所述多域注意力机制模块还用于将所述空间域特征图进行两次核为2*2的最大池化操作后与所述特征图M4相乘，获得特征图D4；所述多域注意力机制模块还用于将所述空间域特征图进行三次核为2*2的最大池化操作后与所述特征图M5相乘，获得特征图D5；

所述特征图D5、所述特征图D4、所述特征图D3和所述特征图D2输入所述区域生成网络；所述区域生成网络的输出连接所述ROI Align层，所述ROI Align层连接检测头。

可选地，所述ROI Align层输出的各候选区域特征图的尺寸相同。

可选地，所述检测头包括分类支路和回归支路；所述分类支路的损失函数为二分类交叉熵损失函数，所述回归支路的损失函数为平衡损失函数。

可选地，所述无人机检测图像数据集中图像包括利用可见光摄像头拍摄的不同型号的无人机的飞行视频转换后获得的图像，所述无人机检测图像数据集中图像还包括通过网络爬虫下载的包含无人机的图像。

可选地，所述构建无人机检测图像数据集，具体包括：

采用标注软件标注出各无人机检测图像中无人机的位置；

通过对标注后的无人机检测图像进行旋转和加噪处理，增多无人机检测图像的数量。

本发明还公开了一种基于多域注意力机制的无人机检测系统，包括：

数据集构建模块，用于构建无人机检测图像数据集；

无人机检测网络构建模块，用于构建基于多域注意力机制的无人机检测网络；

模型训练模块，用于采用所述无人机检测图像数据集对所述无人机检测网络进行训练，获得无人机检测模型；

无人机检测模块，用于利用所述无人机检测模型对待检测图像进行无人机检测；

可选地，所述数据集构建模块具体包括：

标注单元，用于采用标注软件标注出各无人机检测图像中无人机的位置；

图像处理单元，用于通过对标注后的无人机检测图像进行旋转和加噪处理，增多无人机检测图像的数量。

根据本发明提供的具体实施例，本发明公开了以下技术效果：

本发明无人机检测网络包括多域注意力机制模块，多域注意力机制模块从高层特征图提炼出通道域注意力信息，从低层特征图提炼出有助于无人机定位的空间域注意力信息，并通过相乘操作逐层生成包含多域注意力信息的加权特征图，从而引导各层特征图更加关注无人机目标所在位置，提高了无人机识别精度，另外多域注意力机制模块主要基于池化层构建，有效降低了网络计算复杂度。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本发明一种基于多域注意力机制的无人机检测方法流程示意图；

图2为本发明无人机检测网络的结构示意图；

图3为本发明一种基于多域注意力机制的无人机检测系统结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明的目的是提供一种基于多域注意力机制的无人机检测方法，提高了无人机识别精度。

为使本发明的上述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式对本发明作进一步详细的说明。

图1为本发明一种基于多域注意力机制的无人机检测方法流程示意图，如图1所示，一种基于多域注意力机制的无人机检测方法，包括：

步骤101：构建无人机检测图像数据集。

无人机检测图像数据集中图像包括利用可见光摄像头拍摄的不同型号的无人机的飞行视频转换后获得的图像，无人机检测图像数据集中图像还包括通过网络爬虫下载的包含无人机的图像。即采用两种方式进行图像采集，第一种：在不同背景、天气情况下，利用可见光摄像头拍摄不同型号无人机的飞行视频，并将飞行视频转换为图像帧，获得无人机图像；第二种：通过网络爬虫下载包含无人机的图像。

其中，步骤101具体包括：

对采集所得图像进行筛选，并采用标注软件标注出各无人机检测图像中无人机的位置，类别变化为UAV，获得标注文件。

通过对标注后的无人机检测图像进行旋转和加噪处理，同步更新对应标注文件，以增多无人机检测图像的数量和多样性。

基于无人机图像与各图像对应的标注文件，得到无人机检测数据集。

步骤102：构建基于多域注意力机制的无人机检测网络。

无人机检测网络包括骨干网络、多尺度特征融合网络、多域注意力机制模块、区域生成网络、ROI Align层和检测头。骨干网络为ResNet50网络。

ResNet50网络包括依次连接的第一卷积块、第二卷积块、第三卷积块、第四卷积块和第五卷积块。

待检测图像输入第一卷积块，第一卷积块的输出连接第二卷积块的输入，第二卷积块的输出连接第三卷积块的输入，第三卷积块的输出连接第四卷积块的输入，第四卷积块的输出连接第五卷积块的输入。

多尺度特征融合网络用于对第五卷积块的输出进行卷积核为1*1的卷积操作，获得特征图F5；多尺度特征融合网络还用于将对特征图F5进行上采样操作后的特征图与对第四卷积块的输出进行卷积核为1*1的卷积操作后的特征图进行元素级相加，获得特征图F4；多尺度特征融合网络还用于将对特征图F4进行上采样操作后的特征图与对第三卷积块的输出进行卷积核为1*1的卷积操作后的特征图进行元素级相加，获得特征图F3；多尺度特征融合网络还用于将对特征图F3进行上采样操作后的特征图与对第二卷积块的输出进行卷积核为1*1的卷积操作后的特征图进行元素级相加，获得特征图F2。

多域注意力机制模块用于对特征图F5进行全局平均池化，获得通道域特征图；多域注意力机制模块还用于将通道域特征图分别与特征图F4、特征图F3和特征图F2相乘，获得对应的特征图M5、特征图M4、特征图M3和特征图M2；多域注意力机制模块还用于对特征图F2进行卷积核为1*1的卷积操作，获得空间域特征图；多域注意力机制模块还用于将空间域特征图与特征图M2相乘，获得特征图D2；多域注意力机制模块还用于将空间域特征图进行一次核为2*2的最大池化操作后与特征图M3相乘，获得特征图D3，将空间域特征图进行最大池化操作后的特征图与特征图M3空间维度相同；多域注意力机制模块还用于将空间域特征图进行两次核为2*2的最大池化操作后与特征图M4相乘，获得特征图D4；多域注意力机制模块还用于将空间域特征图进行三次核为2*2的最大池化操作后与特征图M5相乘，获得特征图D5。

特征图D5、特征图D4、特征图D3和特征图D2输入区域生成网络；区域生成网络的输出连接ROI Align层，ROI Align层连接检测头。

ROI Align层输出的各候选区域特征图的尺寸相同。

检测头包括分类支路和回归支路；分类支路的损失函数为二分类交叉熵损失函数，回归支路的损失函数为平衡损失函数。

如图2所示，以输入一张待检测的无人机图像1024×1024为例，展示卷积神经网络（无人机检测网络）的设计过程：

1、采用ResNet50作为整个检测网络的骨干网络，ResNet50由五个依次连接的卷积块构成，各卷积块的输出特征图及对应尺寸依次为C1：512×512×64、C2：256×256×256、C3：128×128×512、C4：64×64×1024、C5：32×32×2048。

第一卷积块输出的特征图为C1，第二卷积块输出的特征图为C2，第三卷积块输出的特征图为C3，第四卷积块输出的特征图为C4，第五卷积块输出的特征图为C5。

2、基于骨干网络构建多尺度特征融合网络，以增强网络对不同尺度无人机的检测能力：对C2、C3、C4、C5分别进行卷积核为1*1的卷积操作，将通道数变换为256，从而使特征图的通道数统一。接下来，将C5对应的输出特征图命名为F5。对F5进行上采样操作，通过双线性插值法将F5尺寸放大为原来的2倍，并与相等尺寸的C4对应的输出特征图进行元素级相加，从而得到F4。依次对F4和F3进行上述特征融合操作，从而得到F3和F2特征图。至此，获得特征图F2、F3、F4、F5，其对应尺寸依次为256×256×256、128×128×256、64×64×256、32×32×256。此处构建的多尺度特征融合网络结构通过为每层特征图融合来自相邻高层具有丰富语义信息的高质量特征，来提升网络对不同尺寸无人机的识别能力。

3、构建多域注意力机制（Multi-Domain Attention Mechanism，MDAM），即多域注意力机制模块，以增强网络对关键特征信息的感知能力：对上一步所得高层特征图F5进行全局平均池化（Global Average Pooling）操作，获得尺寸为1×1×256的通道域特征图Ch，将通道域特征图Ch分别与F5、F4、F3、F2相乘，得到包含全局信息的特征图M5、M4、M3、M2。对上一步所得低层特征图F2进行一次卷积核为1*1的卷积操作，将通道数变换为1，获得尺寸为256×256×1的空间域特征图Sp，将空间域特征图Sp与M2相乘，获得特征图D2。对特征图Sp进行一次核为2*2的最大池化（Max Pooling）操作，获得与M3空间维度相同的特征图，并与M3相乘，获得特征图D3。对特征图Sp进行两次核为2*2的最大池化（Max Pooling）操作，并与M4相乘，获得特征图D4。对特征图Sp进行三次核为2*2的最大池化（Max Pooling）操作，并与M5相乘，获得特征图D5。至此，获得特征图D2、D3、D4、D5，其对应尺寸依次为256×256×256、128×128×256、64×64×256、32×32×256。此处构建的多域注意力机制（MDAM）从高层特征图提炼出通道域注意力信息，从低层特征图提炼出有助于无人机定位的空间域注意力信息，并通过相乘操作逐层生成包含多域注意力信息的加权特征图，从而引导各层特征图更加关注无人机目标所在位置。且该网络主要基于池化层构建，有效降低了网络的计算复杂度。

4、构建区域建议网络和ROI Align层。将上一步所得的D2、D3、D4、D5依次输入区域建议网络和ROI Align层，并输出一系列相同尺寸的候选区域特征图。通过区域建议网络获得目标候选区域。

5、构建网络检测头。将候选区域特征图分别输入两层全连接层进行特征提取和分类后，再分别输入两个检测支路（分类支路和回归支路）：利用二分类交叉熵损失函数（Binary Crossentropy Loss）进行无人机与背景信息的分类，确定候选区域特征图是否为无人机目标；利用平衡损失函数（Balanced L1 Loss）完成边框回归操作，从而获得无人机的具体位置信息。整个卷积神经网络的损失值由二分类交叉熵损失值和平衡损失值相加所得。

步骤103：采用无人机检测图像数据集对无人机检测网络进行训练，获得无人机检测模型。

其中，步骤103具体包括：

采用无人机检测图像数据集中无人机检测图像和对应的无人机检测图像标注文件训练无人机检测网络，基于损失函数对整个网络进行参数更新，获得无人机检测模型。损失函数为二分类交叉熵损失函数与平衡损失函数之和。

步骤104：利用无人机检测模型对待检测图像进行无人机检测。

通过无人机检测模型输出无人机所在的具体位置信息。

本发明将基于深度学习的目标检测技术用于无人机识别，本发明方法能自动且快速发现当前图像中的无人机目标，并输出无人机目标的精确位置，从而实现无人机的智能化识别。本发明方法可被应用于军用民用机场、重大活动场所、保密区域等多种场景，实现无人机的快速精准识别，并为无人机的监管与反制提供支持，维护公共与军事安全。

本发明针对无人机目标特有的尺寸跨度大和视觉特征多样性问题，分别基于多尺度特征融合结构和多域注意力机制（MDAM）进行无人机检测网络的结构设计，从而有效提升了网络对无人机目标的检测准确率。

本发明针对无人机的特征信息存在较大多样性和复杂性的问题，设计了多域注意力机制（MDAM）并将其应用在多尺度特征融合操作之后。MDAM从高层特征图提炼出通道域注意力信息，从低层特征图提炼出有助于无人机定位的空间域注意力信息，并为每个特征层生成包含多域注意力信息的加权特征图，从而引导各层特征图更加关注无人机目标所在位置，有助于网络从丰富的特征信息中提取出最关键有用的特征，从而提高网络对无人机目标的定位能力。

图3为本发明一种基于多域注意力机制的无人机检测系统结构示意图，如图3所示，一种基于多域注意力机制的无人机检测系统，包括：

数据集构建模块201，用于构建无人机检测图像数据集。

数据集构建模块201具体包括：

图像处理单元，用于通过对标注后的无人机检测图像进行旋转和加噪处理，增多无人机检测图像的数量；

无人机检测图像数据集中图像包括利用可见光摄像头拍摄的不同型号的无人机的飞行视频转换后获得的图像，无人机检测图像数据集中图像还包括通过网络爬虫下载的包含无人机的图像。

无人机检测网络构建模块202，用于构建基于多域注意力机制的无人机检测网络。

模型训练模块203，用于采用无人机检测图像数据集对无人机检测网络进行训练，获得无人机检测模型。

模型训练模块203具体包括：

模型训练单元，用于采用无人机检测图像数据集中无人机检测图像和对应的无人机检测图像标注文件训练无人机检测网络，基于损失函数对整个网络进行参数更新，获得无人机检测模型。损失函数为二分类交叉熵损失函数与平衡损失函数之和。

无人机检测模块204，用于利用无人机检测模型对待检测图像进行无人机检测。

无人机检测网络包括骨干网络、多尺度特征融合网络、多域注意力机制模块、区域生成网络、ROI Align层和检测头；

骨干网络包括依次连接的第一卷积块、第二卷积块、第三卷积块、第四卷积块和第五卷积块；

多尺度特征融合网络用于对第五卷积块的输出进行卷积核为1*1的卷积操作，获得特征图F5；多尺度特征融合网络还用于将对特征图F5进行上采样操作后的特征图与对第四卷积块的输出进行卷积核为1*1的卷积操作后的特征图进行元素级相加，获得特征图F4；多尺度特征融合网络还用于将对特征图F4进行上采样操作后的特征图与对第三卷积块的输出进行卷积核为1*1的卷积操作后的特征图进行元素级相加，获得特征图F3；多尺度特征融合网络还用于将对特征图F3进行上采样操作后的特征图与对第二卷积块的输出进行卷积核为1*1的卷积操作后的特征图进行元素级相加，获得特征图F2；

多域注意力机制模块用于对特征图F5进行全局平均池化，获得通道域特征图；多域注意力机制模块还用于将通道域特征图分别与特征图F4、特征图F3和特征图F2相乘，获得对应的特征图M5、特征图M4、特征图M3和特征图M2；多域注意力机制模块还用于对特征图F2进行卷积核为1*1的卷积操作，获得空间域特征图；多域注意力机制模块还用于将空间域特征图与特征图M2相乘，获得特征图D2；多域注意力机制模块还用于将空间域特征图进行一次核为2*2的最大池化操作后与特征图M3相乘，获得特征图D3，将空间域特征图进行最大池化操作后的特征图与特征图M3空间维度相同；多域注意力机制模块还用于将空间域特征图进行两次核为2*2的最大池化操作后与特征图M4相乘，获得特征图D4；多域注意力机制模块还用于将空间域特征图进行三次核为2*2的最大池化操作后与特征图M5相乘，获得特征图D5；

ROI Align层输出的各候选区域特征图的尺寸相同；

本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。

本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处。综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种基于多域注意力机制的无人机检测方法，其特征在于，包括：

构建无人机检测图像数据集；

构建基于多域注意力机制的无人机检测网络；

利用所述无人机检测模型对待检测图像进行无人机检测；

2.根据权利要求1所述的基于多域注意力机制的无人机检测方法，其特征在于，所述ROI Align层输出的各候选区域特征图的尺寸相同。

3.根据权利要求1所述的基于多域注意力机制的无人机检测方法，其特征在于，所述检测头包括分类支路和回归支路；所述分类支路的损失函数为二分类交叉熵损失函数，所述回归支路的损失函数为平衡损失函数。

4.根据权利要求1所述的基于多域注意力机制的无人机检测方法，其特征在于，所述无人机检测图像数据集中图像包括利用可见光摄像头拍摄的不同型号的无人机的飞行视频转换后获得的图像，所述无人机检测图像数据集中图像还包括通过网络爬虫下载的包含无人机的图像。

5.根据权利要求1所述的基于多域注意力机制的无人机检测方法，其特征在于，所述构建无人机检测图像数据集，具体包括：

采用标注软件标注出各无人机检测图像中无人机的位置；

6.一种基于多域注意力机制的无人机检测系统，其特征在于，包括：

数据集构建模块，用于构建无人机检测图像数据集；

7.根据权利要求6所述的基于多域注意力机制的无人机检测系统，其特征在于，所述ROI Align层输出的各候选区域特征图的尺寸相同。

8.根据权利要求6所述的基于多域注意力机制的无人机检测系统，其特征在于，所述检测头包括分类支路和回归支路；所述分类支路的损失函数为二分类交叉熵损失函数，所述回归支路的损失函数为平衡损失函数。

9.根据权利要求6所述的基于多域注意力机制的无人机检测系统，其特征在于，所述无人机检测图像数据集中图像包括利用可见光摄像头拍摄的不同型号的无人机的飞行视频转换后获得的图像，所述无人机检测图像数据集中图像还包括通过网络爬虫下载的包含无人机的图像。

10.根据权利要求6所述的基于多域注意力机制的无人机检测系统，其特征在于，所述数据集构建模块具体包括：