CN115953668A - 一种基于YOLOv5算法的迷彩伪装目标检测方法及系统 - Google Patents

一种基于YOLOv5算法的迷彩伪装目标检测方法及系统 Download PDF

Info

Publication number
CN115953668A
CN115953668A CN202211479561.5A CN202211479561A CN115953668A CN 115953668 A CN115953668 A CN 115953668A CN 202211479561 A CN202211479561 A CN 202211479561A CN 115953668 A CN115953668 A CN 115953668A
Authority
CN
China
Prior art keywords
module
unit
convolution
detection
camouflage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211479561.5A
Other languages
English (en)
Inventor
曹铁勇
王烨奎
付炳阳
郑云飞
方正
赵斐
申海霞
王杨
陈雷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Army Engineering University of PLA
Original Assignee
Army Engineering University of PLA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Army Engineering University of PLA filed Critical Army Engineering University of PLA
Priority to CN202211479561.5A priority Critical patent/CN115953668A/zh
Publication of CN115953668A publication Critical patent/CN115953668A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Image Analysis (AREA)

Abstract

本发明公开了一种基于YOLOv5算法的迷彩伪装目标检测方法及系统,包括:采集包含迷彩伪装目标的实时战场图像数据,将实时战场图像数据输入至预先训练的迷彩伪装目标检测模型中获取对伪装目标的检测结果;所述迷彩伪装目标检测模型的训练过程包括:获取历史战争图像数据,构建训练数据集合;将提取网络、聚合网络和基于YOLOv5算法的检测模块构建迷彩伪装目标检测模型;利用训练数据集合训练迷彩伪装目标检测模型,重复训练过程直至迷彩伪装目标检测模型的检测准确率趋于稳定;本发明能够显著提升检测精度,缩减网络规模,并满足军事行动中实时、准确感知战场态势的要求。

Description

一种基于YOLOv5算法的迷彩伪装目标检测方法及系统
技术领域
本发明属于机器视觉技术领域,具体涉及迷彩伪装目标检测方法及系统。
背景技术
随着战争形态由信息化向智能化转变,无人作战等新兴领域对战场态势的感知能力提出了更高要求。在军事行动中,迷彩是较为常用的伪装手段,其能模拟自然环境的颜色特性,破坏伪装目标轮廓,使目标与周围背景相融合,从而实现伪装的效果。迷彩伪装对感知战场态势产生重大干扰,高效、精准地发现和检测迷彩伪装目标成为提升战场态势感知能力的关键。
近年来,深度神经网络被大规模应用于目标检测任务中,并取得了良好的效果。根据候选区域(Region Proposals)生成方式的不同,可以将深度目标检测算法分为双阶段算法与单阶段算法。双阶段检测算法在第一阶段生成可能包含目标的候选区域,在第二阶段对候选区域的位置进行调整,并输出所包含目标的类别,典型算法包括R-CNN、Fast RCNN、Faster RCNN、Cascade RCNN等。双阶段算法的检测精度较传统算法大幅提升,但存在检测速度较慢、训练优化困难等问题。
单阶段检测算法直接在骨干网络提取出的特征图上生成候选区域,并完成后续检测,典型方法包括YOLO系列、SSD等。单阶段算法的检测速度较双阶段算法有明显的提升,能满足实时感知战场态势的要求,然而单阶段算法对迷彩伪装目标特征的提取能力较弱,导致其在迷彩目标检测任务上的效果并不出众。
发明内容
本发明的目的在于提供一种基于YOLOv5算法的迷彩伪装目标检测方法及系统,能够显著提升检测精度,缩减网络规模,并满足军事行动中实时、准确感知战场态势的要求。
为达到上述目的,本发明所采用的技术方案是:
本发明第一方面提供了一种基于YOLOv5算法的迷彩伪装目标检测方法,包括:
采集包含迷彩伪装目标的实时战场图像数据,将实时战场图像数据输入至预先训练的迷彩伪装目标检测模型中获取对伪装目标的检测结果;
所述迷彩伪装目标检测模型的训练过程包括:
获取历史战争图像数据,构建训练数据集合;
基于YOLOv5算法的骨干网络将C3模块替换为DC3模块获得提取网络,基于YOLOv5算法的头部网络、DC3模块和动态注意力机制模块构建聚合网络;将提取网络、聚合网络和基于YOLOv5算法的检测模块构建迷彩伪装目标检测模型;
利用训练数据集合训练迷彩伪装目标检测模型,重复训练过程直至迷彩伪装目标检测模型的检测准确率趋于稳定。
优选的,将实时战场图像数据输入至预先训练的迷彩伪装目标检测模型中获取对伪装目标的检测结果的方法包括:
将实时战场图像数据输入预设的提取网络,提取得到实时战场图像数据中迷彩伪装目标的特征图;
利用聚合网络对提取到的特征图进行融合,融合得到迷彩伪装目标的增强特征图;
对增强特征图进行检测得到迷彩伪装目标的类别及在原始图像中的位置信息。
优选的,所述提取网络依次分为第一提取单元、第二提取单元、第三提取单元、第四提取单元和第五提取单元;所述第一提取单元包括卷积模块;第二提取单元、第三提取单元和第四提取单元包括依次叠加的卷积模块和DC3模块;所述第五提取单元包括依次叠加的卷积模块、金字塔池化层和DC3模块;所述卷积模块包含卷积层、标准化层和激活函数。
优选的,将实时战场图像数据输入预设的提取网络,提取得到实时战场图像数据中迷彩伪装目标的特征图的方法包括:
将实时战场图像数据输入至第一提取单元获得第一特征图,第一特征图的尺度为该实时战场图像的特征图尺度的1/2;
将第一特征图输入至所述第二提取单元,经过第二提取单元中的卷积模块和DC3模块处理第一特征图后输出第二特征图,所述第二特征图尺度为实时战场图像尺度的1/4;
将第二特征图输入至所述第三提取单元,经过第三提取单元中的卷积模块和DC3模块处理第二特征图后输出第三特征图,所述第三特征图尺度为实时战场图像尺度的1/8;
将第三特征图输入至所述第四提取单元,经过第四提取单元中的卷积模块和DC3模块处理第三特征图后输出第四特征图,所述第四特征图尺度为实时战场图像尺度的1/16;
将第四特征图输入至所述第五提取单元,经过第五提取单元中的卷积模块、金字塔池化层和DC3模块处理第四特征图后输出第五特征图,所述第五特征图尺度为实时战场图像尺度的1/32。
优选的,所述聚合网络包括依次叠加设置的第一聚合单元、第二聚合单元、第三聚合单元、第四聚合单元和第五聚合单元;
所述第一聚合单元包括依次叠加的卷积模块、上采样模块和拼接模块;所述第一聚合单元中卷积模块的输入特征为所述第五提取单元中DC3模块的输出特征;所述第一聚合单元的拼接模块作用于拼接第一聚合单元中上采样模块的输出特征和所述第四提取单元中DC3模块的输出特征;
第二聚合单元包括依次叠加的DC3模块、卷积模块、上采样模块和拼接模块;所述第二聚合单元中DC3模块的输入特征为所述第一聚合单元中拼接模块的输出特征;所述第二聚合单元的拼接模块作用于拼接第三提取单元中卷积模块的输出特征和第二聚合单元中上采样模块的输出特征;
所述第三聚合单元包括动态注意力机制模块;所述第四聚合单元和第五聚合单元包括依次叠加的卷积模块、拼接模块和动态注意力机制模块;所述第四聚合单元中拼接模块作用于拼接所述第二聚合单元中卷积模块的输出特征和第四聚合单元中卷积模块的输出特征;所述第五聚合单元中拼接模块作用于拼接所述第一聚合单元中上采样模块的输出特征和第五聚合单元中卷积模块的输出特征;所述的动态注意力机制模块的输出特征输送至所述检测模块。
优选的,利用聚合网络对提取到的特征图进行融合,融合得到迷彩伪装目标的增强特征图的方法包括:
将第五提取单元中DC3模块的输出特征、第四提取单元中DC3模块的输出特征、第三提取单元中卷积模块的输出特征分别记为提取特征图P1、提取特征图P2和提取特征图P3;
将提取特征图P1、提取特征图P2输入至所述第一聚合单元进行融合获得融合特征图S1;
将融合特征图S1和提取特征图P3输入至所述第二聚合单元进行融合获得融合特征图S2;
将融合特征图S2输入至第三聚合单元处理获得第一检测特征图C1;
将第一检测特征图C1输入所述第四聚合单元中卷积模块处理后与第二聚合单元中卷积模块的输出特征进行融合,再由第四聚合单元中动态注意力机制模块处理获得第二检测特征图C2;
将第二检测特征图C2输入所述第五聚合单元中卷积模块处理后与第一聚合单元中上采样模块的输出特征进行融合,再由第五聚合单元中动态注意力机制模块处理获得第三检测特征图C3;
将第一检测特征图C1、第二检测特征图C2和第三检测特征图C3作为迷彩伪装目标的增强特征图。
优选的,所述DC3模块包括第一支路、第二支路和拼接模块;所述DC3模块的输入特征分别输入至第一支路和第二支路;所述第一支路的输出特征和第二支路的输出特征经过拼接模块进行拼接后,输入至卷积模块获得DC3模块的输出特征;
所述第一支路包括依次叠加的卷积模块和N个S-Bottleneck模块;所述第二支路包括依次叠加的深度卷积层和逐点卷积层。
优选的,所述S-Bottleneck模块包括依次叠加的第一标准化单元、第二标准化单元、第三标准化单元和第四标准化单元;所述第一标准化单元内依次设有深度卷积层、标准化层和激活函数;所述第二标准化单元内依次设有逐点卷积层和标准化层;所述第三标准化单元内依次设有逐点卷积层、标准化层和激活函数;所述第四标准化单元内依次设有深度卷积层和标准化层;所述第四标准化单元的输出特征与S-Bottleneck模块的输入特征进行元素相加形成S-Bottleneck模块的输出特征。
优选的,所述动态注意力机制模块模块包括DC3模块、Dynamic ReLU模块和空间注意力模块;所述动态注意力机制模块模块的输入特征分别输入至所述DC3模块;所述DC3模块的输出特征分别输入至所述Dynamic ReLU模块和空间注意力模块;
所述Dynamic ReLU模块依次包括平均池化层、全连接层和激活函数;利用DynamicReLU模块学习输入特征图的全局信息自适应得到两个ReLU函数;DC3模块的输出特征分别通过得到的两个ReLU函数进行处理并取最大值获得输出特征A;
所述空间注意力模块依次包括卷积、标准化层、归一化处理和激活函数处理;所述空间注意力模块的输出特征与所述输出特征A进行元素相乘获得输出特征B;所述输出特征B与输出特征A进行拼接获得动态注意力机制模块模块的输出特征。
本发明第二方面提供了一种基于YOLOv5算法的迷彩伪装目标检测系统,包括:
检测模块,采集包含迷彩伪装目标的实时战场图像数据,将实时战场图像数据输入至预先训练的迷彩伪装目标检测模型中获取对伪装目标的检测结果;
获取模块,用于获取历史战争图像数据,构建训练数据集合;
模型构建模块,用于基于YOLOv5算法的骨干网络将C3模块替换为DC3模块获得提取网络,基于YOLOv5算法的头部网络、DC3模块和动态注意力机制模块构建聚合网络;将提取网络、聚合网络和基于YOLOv5算法的检测模块构建迷彩伪装目标检测模型;
训练模块,用于利用训练数据集合训练迷彩伪装目标检测模型,重复训练过程直至迷彩伪装目标检测模型的检测准确率趋于稳定。
本发明第三方面提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现所述迷彩伪装目标检测方法的步骤。
与现有技术相比,本发明的有益效果:
本发明用于基于YOLOv5算法的骨干网络将C3模块替换为DC3模块获得提取网络;将实时战场图像数据输入预设的提取网络,提取得到实时战场图像数据中迷彩伪装目标的特征图;结合深度可分离卷积与残差结构设计了新的提取模块,既提升了模型对迷彩伪装目标的特征提取能力,又缩减了网络规模,降低了参数量。
本发明基于YOLOv5算法的头部网络、DC3模块和动态注意力机制模块构建聚合网络;利用聚合网络对提取到的特征图进行融合,融合得到迷彩伪装目标的增强特征图;在聚合网络中引入动态注意力机制,强化模型对迷彩伪装目标语义特征和位置信息的感知能力,有效提升了检测精度。
附图说明
图1是本发明实施例一提供的一种基于YOLOv5算法的迷彩伪装目标检测方法的网络结构;
图2是本发明提供的一种基于YOLOv5算法的迷彩伪装目标检测方法的深度可分离卷积的示意图;
图3是本发明提供的DC3模块的结构图;
图4是本发明提供的S-Bottleneck模块的结构图;
图5是本发明提供的DAM模块的结构图。
具体实施方式
下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
实施例一
如图1至图5所示,本发明第一方面提供了一种基于YOLOv5算法的迷彩伪装目标检测方法,包括:
采集包含迷彩伪装目标的实时战场图像数据,将实时战场图像数据输入至预先训练的迷彩伪装目标检测模型中获取对伪装目标的检测结果的方法包括:
(1)将实时战场图像数据输入预设的提取网络,提取得到实时战场图像数据中迷彩伪装目标的特征图的方法包括:
将实时战场图像数据输入至第一提取单元获得第一特征图,第一特征图的尺度为该实时战场图像的特征图尺度的1/2;通道数增至32。
将第一特征图输入至所述第二提取单元,经过第二提取单元中的卷积模块和DC3模块处理第一特征图后输出第二特征图,所述第二特征图尺度为实时战场图像的1/4;通道数为64。
将第二特征图输入至所述第三提取单元,经过第三提取单元中的卷积模块和DC3模块处理第二特征图后输出第三特征图,所述第三特征图尺度为实时战场图像的1/8;通道数为128
将第三特征图输入至所述第四提取单元,经过第四提取单元中的卷积模块和DC3模块处理第三特征图后输出第四特征图,所述第四特征图尺度为实时战场图像的1/16;通道数为256。
将第四特征图输入至所述第五提取单元,经过第五提取单元中的卷积模块、金字塔池化层和DC3模块处理第四特征图后输出第五特征图,所述第五特征图尺度为实时战场图像的1/32;通道数为512。
(2)利用聚合网络对提取到的特征图进行融合,融合得到迷彩伪装目标的增强特征图的方法包括:
将第五提取单元中DC3模块的输出特征、第四提取单元中DC3模块的输出特征、第三提取单元中卷积模块的输出特征分别记为提取特征图P1、提取特征图P2和提取特征图P3;
将提取特征图P1、提取特征图P2输入至所述第一聚合单元进行融合获得融合特征图S1;
将融合特征图S1和提取特征图P3输入至所述第二聚合单元进行融合获得融合特征图S2;
将融合特征图S2输入至第三聚合单元处理获得第一检测特征图C1;
将第一检测特征图C1输入所述第四聚合单元中卷积模块处理后与第二聚合单元中卷积模块的输出特征进行融合,再由第四聚合单元中动态注意力机制模块处理获得第二检测特征图C2;
将第二检测特征图C2输入所述第五聚合单元中卷积模块处理后与第一聚合单元中上采样模块的输出特征进行融合,再由第五聚合单元中动态注意力机制模块处理获得第三检测特征图C3;
将第一检测特征图C1、第二检测特征图C2和第三检测特征图C3作为迷彩伪装目标的增强特征图。
(3)对增强特征图进行检测得到迷彩伪装目标的类别及在原始图像中的位置信息。
所述迷彩伪装目标检测模型的训练过程包括:
获取历史战争图像数据,构建训练数据集合;将历史战争图像调整为640×640×3。设置批处理大小为32,训练迭代次数为300轮,图像大小为512×288像素,初始学习率设置为0.02,使用SGD(随机梯度下降)优化方法,动量值为0.9,采用了mosic数据增强。
基于YOLOv5算法的骨干网络将C3模块替换为DC3模块获得提取网络,所述提取网络依次分为第一提取单元、第二提取单元、第三提取单元、第四提取单元和第五提取单元;所述第一提取单元包括卷积模块;第二提取单元、第三提取单元和第四提取单元包括依次叠加的卷积模块和DC3模块;所述第五提取单元包括依次叠加的卷积模块、金字塔池化层和DC3模块;所述卷积模块包含卷积层、标准化层和激活函数。
基于YOLOv5算法的头部网络、DC3模块和动态注意力机制模块构建聚合网络;所述聚合网络包括依次叠加设置的第一聚合单元、第二聚合单元、第三聚合单元、第四聚合单元和第五聚合单元;
所述第一聚合单元包括依次叠加的卷积模块、上采样模块和拼接模块;所述第一聚合单元中卷积模块的输入特征为所述第五提取单元中DC3模块的输出特征;所述第一聚合单元的拼接模块作用于拼接第一聚合单元中上采样模块的输出特征和所述第四提取单元中DC3模块的输出特征;
第二聚合单元包括依次叠加的DC3模块、卷积模块、上采样模块和拼接模块;所述第二聚合单元中DC3模块的输入特征为所述第一聚合单元中拼接模块的输出特征;所述第二聚合单元的拼接模块作用于拼接第三提取单元中卷积模块的输出特征和第二聚合单元中上采样模块的输出特征;
所述第三聚合单元包括动态注意力机制模块;所述第四聚合单元和第五聚合单元包括依次叠加的卷积模块、拼接模块和动态注意力机制模块;所述第四聚合单元中拼接模块作用于拼接所述第二聚合单元中卷积模块的输出特征和第四聚合单元中卷积模块的输出特征;所述第五聚合单元中拼接模块作用于拼接所述第一聚合单元中上采样模块的输出特征和第五聚合单元中卷积模块的输出特征;所述的动态注意力机制模块的输出特征输送至所述检测模块。
所述DC3模块包括第一支路、第二支路和拼接模块;所述DC3模块的输入特征分别输入至第一支路和第二支路;所述第一支路的输出特征和第二支路的输出特征经过拼接模块进行拼接后,输入至卷积模块获得DC3模块的输出特征;
所述第一支路包括依次叠加的卷积模块和N个S-Bottleneck模块;所述第二支路包括依次叠加的深度卷积层和逐点卷积层。
所述S-Bottleneck模块包括依次叠加的第一标准化单元、第二标准化单元、第三标准化单元和第四标准化单元;所述第一标准化单元内依次设有深度卷积层、标准化层和激活函数;所述第二标准化单元内依次设有逐点卷积层和标准化层;所述第三标准化单元内依次设有逐点卷积层、标准化层和激活函数;所述第四标准化单元内依次设有深度卷积层和标准化层;所述第四标准化单元的输出特征与S-Bottleneck模块的输入特征进行元素相加形成S-Bottleneck模块的输出特征。
标准化层需要对输入的所有通道进行标准卷积,如图2(a)所示,假设输入大小为M×W×H,输出大小为N×W×H,卷积核大小为M×K×K,由于输出通道为N,因此需要N个上述卷积核进行卷积操作,由此可得标准卷积计算量为K2×M×N×H×W;如图2(b)所示,深度卷积对输入的每个通道分别应用一个K×K大小的卷积进行处理,共有M个通道,由此可得深度卷积的计算量为K2×M×H×W;如图2(c)所示,逐点卷积再将深度卷积的输出应用N个M×1×1大小的卷积进行组合,由此可得逐点卷积计算量为M×N×H×W。
深度卷积叠加逐点卷积相较于标准卷积缩减了模型大小,减少的计算量为:
Figure SMS_1
所述动态注意力机制模块模块包括DC3模块、Dynamic ReLU模块和空间注意力模块;所述动态注意力机制模块模块的输入特征分别输入至所述DC3模块;所述DC3模块的输出特征分别输入至所述Dynamic ReLU模块和空间注意力模块;
所述Dynamic ReLU模块依次包括平均池化层、全连接层和激活函数;利用DynamicReLU模块学习输入特征图的全局信息自适应得到两个ReLU函数;DC3模块的输出特征分别通过得到的两个ReLU函数进行处理并取最大值获得输出特征A;
所述空间注意力模块依次包括卷积、标准化层、归一化处理和激活函数处理;所述空间注意力模块的输出特征与所述输出特征A进行元素相乘获得输出特征B;所述输出特征B与输出特征A进行拼接获得动态注意力机制模块模块的输出特征。
将提取网络、聚合网络和基于YOLOv5算法的检测模块构建迷彩伪装目标检测模型;利用训练数据集合训练迷彩伪装目标检测模型;重复训练过程直至迷彩伪装目标检测模型的检测准确率趋于稳定。
迷彩伪装目标检测模型将增强特征图分成S×S个网格,由迷彩伪装目标中心所在区域的网格负责预测该目标。模型在网格上放置B个Anchor,对每一Anchor输出(5+N)个预测值,分别是置信度(confidence)、锚框中心距网格左上角坐标的偏移量(tx,ty)、锚框长宽的缩放比(tw,th)和N个类别的概率。为了增加正样本的数量,YOLO v5还采用跨网格匹配规则,除了目标中心所在区域的网格之外,再找出离目标中心最近的两个网格,同时用这三个网格预测该目标,缓解了正负样本不平衡的问题。
模型损失函数有类别损失lcls、置信度损失lobj和位置回归损失lbox三部分组成,具体公式如下所示:
Figure SMS_2
Figure SMS_3
lbox=l-CIoU
类别损失、置信度损失均采用了BCE(交叉熵损失函数);位置回归损失采用了CIoU进行计算,CIoU是对DIoU的改进,DIoU考虑到了边界框与预测框重叠面积和中心点距离对目标位置回归的影响,但忽略了两框的长宽比这个因素,CIoU在其基础上添加了长宽比的惩罚项,使得目标框回归变得更加稳定。当第i个格子里的第j个预测框包含目标时,
Figure SMS_4
当第i个格子里的第j个预测框不包含目标时,
Figure SMS_5
Figure SMS_6
代表该类别预测概率,
Figure SMS_7
为预测值,Ci、cn为类别标签值(非0即1);λnoobj为预测框未包含目标的损失系数。
本实施提供的检测方法与算法的迷彩伪装目标检测方法与采用Faster RCNN、Cascade RCNN、SSD300、FCOS、ATSS、YOLOX、Deformable DETR算法在同一数据集上进行比较,验证本实施例对迷彩伪装目标检测性能的效果。
本实施使用多种指标来综合评价不同模型的检测性能。对于目标检测的预测结果共有4种,正样本被正确识别为正样本(True positives,TP)、负样本被正确识别为负样本(True negatives,TN)、负样本被错误识别为正样本(False positives,FP)、正样本被错误识别为负样本(False negatives,FN)。精确度(Precision,P)、召回率(Recall,R)计算公式如下所示:
Figure SMS_8
Figure SMS_9
目标检测常用的性能评价指标为平均准确度均值(mean average precision,mAP),mAP就是所有类别的平均准确度(average precision,AP)的均值,AP的值即为P-R曲线下方的面积。
为了更好地反应算法检测性能,采用了与coco数据集一致的评价指标。该指标对算法检测性能评价更严格,使用10个IoU阈值(0.5至0.95间每隔0.05取一个值)分别计算mAP,然后取平均值得到最后的结果,并且该评价指标还将尺寸小于322,大于322且小于962,大于962像素的目标分别归为小目标、中目标、大目标,并计算这三类目标的mAP及平均召回率均值(mean average recall,mAR),从多个角度评价算法的检测性能,实验结果如表1所示。此外,还添加了每秒处理的图片数量(FPS)指标来衡量算法的检测速度。
表1不同算法的各类mAP比较
Figure SMS_10
Figure SMS_11
本实施提供的检测方法显著提升检测精度,缩减网络规模,并满足军事行动中实时、准确感知战场态势的要求。
实施例二
一种基于YOLOv5算法的迷彩伪装目标检测系统,本系统应用于实施例一所述迷彩伪装目标检测方法,系统包括:
信号传递模块,用于利用GOOSE自动化测试框架传递主站两个出线断路器位置信号给主站供电的各个子站的母联保护装置;断路器位置信号为断路器合位信号或者断路器分位信号;
编码模块,用于从主站供电的第一个子站开始按照供电顺序对各个子站依次编号;前述主站包括非备用主站和备用主站;
采集模块,用于通过子站的母联保护装置采集子站的电压互感器电压和失压时间;
判断模块,用于根据非备用主站的断路器位置信号、备用主站的断路器位置信号、子站的电压互感器电压和子站的失压时间判断是否满足子站的备自投启动条件;
启动模块,用于预先设定各个子站的备自投总动作时限沿供电顺序依次增加;当子站的备自投满足启动条件,按照各个子站设定的备自投总动作时限依次启动备自投。
实施例三
一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现实施例一所述迷彩伪装目标检测方法的步骤。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变形,这些改进和变形也应视为本发明的保护范围。

Claims (10)

1.一种基于YOLOv5算法的迷彩伪装目标检测方法,其特征在于,包括:
采集包含迷彩伪装目标的实时战场图像数据,将实时战场图像数据输入至预先训练的迷彩伪装目标检测模型中获取对伪装目标的检测结果;
所述迷彩伪装目标检测模型的训练过程包括:
获取历史战争图像数据,构建训练数据集合;
基于YOLOv5算法的骨干网络将C3模块替换为DC3模块获得提取网络,基于YOLOv5算法的头部网络、DC3模块和动态注意力机制模块构建聚合网络;将提取网络、聚合网络和基于YOLOv5算法的检测模块构建迷彩伪装目标检测模型;
利用训练数据集合训练迷彩伪装目标检测模型,重复训练过程直至迷彩伪装目标检测模型的检测准确率趋于稳定。
2.根据权利要求1所述的一种基于YOLOv5算法的迷彩伪装目标检测方法,其特征在于,将实时战场图像数据输入至预先训练的迷彩伪装目标检测模型中获取对伪装目标的检测结果的方法包括:
将实时战场图像数据输入预设的提取网络,提取得到实时战场图像数据中迷彩伪装目标的特征图;
利用聚合网络对提取到的特征图进行融合,融合得到迷彩伪装目标的增强特征图;
对增强特征图进行检测得到迷彩伪装目标的类别及在原始图像中的位置信息。
3.根据权利要求2所述的一种基于YOLOv5算法的迷彩伪装目标检测方法,其特征在于,所述提取网络依次分为第一提取单元、第二提取单元、第三提取单元、第四提取单元和第五提取单元;所述第一提取单元包括卷积模块;第二提取单元、第三提取单元和第四提取单元包括依次叠加的卷积模块和DC3模块;所述第五提取单元包括依次叠加的卷积模块、金字塔池化层和DC3模块;所述卷积模块包含卷积层、标准化层和激活函数。
4.根据权利要求3所述的一种基于YOLOv5算法的迷彩伪装目标检测方法,其特征在于,所述聚合网络包括依次叠加设置的第一聚合单元、第二聚合单元、第三聚合单元、第四聚合单元和第五聚合单元;
所述第一聚合单元包括依次叠加的卷积模块、上采样模块和拼接模块;所述第一聚合单元中卷积模块的输入特征为所述第五提取单元中DC3模块的输出特征;所述第一聚合单元的拼接模块作用于拼接第一聚合单元中上采样模块的输出特征和所述第四提取单元中DC3模块的输出特征;
第二聚合单元包括依次叠加的DC3模块、卷积模块、上采样模块和拼接模块;所述第二聚合单元中DC3模块的输入特征为所述第一聚合单元中拼接模块的输出特征;所述第二聚合单元的拼接模块作用于拼接第三提取单元中卷积模块的输出特征和第二聚合单元中上采样模块的输出特征;
所述第三聚合单元包括动态注意力机制模块;所述第四聚合单元和第五聚合单元包括依次叠加的卷积模块、拼接模块和动态注意力机制模块;所述第四聚合单元中拼接模块作用于拼接所述第二聚合单元中卷积模块的输出特征和第四聚合单元中卷积模块的输出特征;所述第五聚合单元中拼接模块作用于拼接所述第一聚合单元中上采样模块的输出特征和第五聚合单元中卷积模块的输出特征;所述的动态注意力机制模块的输出特征输送至所述检测模块。
5.根据权利要求4所述的一种基于YOLOv5算法的迷彩伪装目标检测方法,其特征在于,利用聚合网络对提取到的特征图进行融合,融合得到迷彩伪装目标的增强特征图的方法包括:
将第五提取单元中DC3模块的输出特征、第四提取单元中DC3模块的输出特征、第三提取单元中卷积模块的输出特征分别记为提取特征图P1、提取特征图P2和提取特征图P3;
将提取特征图P1、提取特征图P2输入至所述第一聚合单元进行融合获得融合特征图S1;
将融合特征图S1和提取特征图P3输入至所述第二聚合单元进行融合获得融合特征图S2;
将融合特征图S2输入至第三聚合单元处理获得第一检测特征图C1;
将第一检测特征图C1输入所述第四聚合单元中卷积模块处理后与第二聚合单元中卷积模块的输出特征进行融合,再由第四聚合单元中动态注意力机制模块处理获得第二检测特征图C2;
将第二检测特征图C2输入所述第五聚合单元中卷积模块处理后与第一聚合单元中上采样模块的输出特征进行融合,再由第五聚合单元中动态注意力机制模块处理获得第三检测特征图C3;
将第一检测特征图C1、第二检测特征图C2和第三检测特征图C3作为迷彩伪装目标的增强特征图。
6.根据权利要求5所述的一种基于YOLOv5算法的迷彩伪装目标检测方法,其特征在于,所述DC3模块包括第一支路、第二支路和拼接模块;所述DC3模块的输入特征分别输入至第一支路和第二支路;所述第一支路的输出特征和第二支路的输出特征经过拼接模块进行拼接后,输入至卷积模块获得DC3模块的输出特征;
所述第一支路包括依次叠加的卷积模块和N个S-Bottleneck模块;所述第二支路包括依次叠加的深度卷积层和逐点卷积层。
7.根据权利要求6所述的一种基于YOLOv5算法的迷彩伪装目标检测方法,其特征在于,所述S-Bottleneck模块包括依次叠加的第一标准化单元、第二标准化单元、第三标准化单元和第四标准化单元;所述第一标准化单元内依次设有深度卷积层、标准化层和激活函数;所述第二标准化单元内依次设有逐点卷积层和标准化层;所述第三标准化单元内依次设有逐点卷积层、标准化层和激活函数;所述第四标准化单元内依次设有深度卷积层和标准化层;所述第四标准化单元的输出特征与S-Bottleneck模块的输入特征进行元素相加形成S-Bottleneck模块的输出特征。
8.根据权利要求6所述的一种基于YOLOv5算法的迷彩伪装目标检测方法,其特征在于,所述动态注意力机制模块模块包括DC3模块、Dynamic ReLU模块和空间注意力模块;所述动态注意力机制模块模块的输入特征分别输入至所述DC3模块;所述DC3模块的输出特征分别输入至所述Dynamic ReLU模块和空间注意力模块;
所述Dynamic ReLU模块依次包括平均池化层、全连接层和激活函数;利用DynamicReLU模块学习输入特征图的全局信息自适应得到两个ReLU函数;DC3模块的输出特征分别通过得到的两个ReLU函数进行处理并取最大值获得输出特征A;
所述空间注意力模块依次包括卷积、标准化层、归一化处理和激活函数处理;所述空间注意力模块的输出特征与所述输出特征A进行元素相乘获得输出特征B;所述输出特征B与输出特征A进行拼接获得动态注意力机制模块模块的输出特征。
9.一种基于YOLOv5算法的迷彩伪装目标检测系统,其特征在于,包括:
检测模块,采集包含迷彩伪装目标的实时战场图像数据,将实时战场图像数据输入至预先训练的迷彩伪装目标检测模型中获取对伪装目标的检测结果;
获取模块,用于获取历史战争图像数据,构建训练数据集合;
模型构建模块,用于基于YOLOv5算法的骨干网络将C3模块替换为DC3模块获得提取网络,基于YOLOv5算法的头部网络、DC3模块和动态注意力机制模块构建聚合网络;将提取网络、聚合网络和基于YOLOv5算法的检测模块构建迷彩伪装目标检测模型;
训练模块,用于利用训练数据集合训练迷彩伪装目标检测模型,重复训练过程直至迷彩伪装目标检测模型的检测准确率趋于稳定。
10.一种电子设备,其特征在于,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现权利要求1至权利要求8任一项所述迷彩伪装目标检测方法的步骤。
CN202211479561.5A 2022-11-24 2022-11-24 一种基于YOLOv5算法的迷彩伪装目标检测方法及系统 Pending CN115953668A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211479561.5A CN115953668A (zh) 2022-11-24 2022-11-24 一种基于YOLOv5算法的迷彩伪装目标检测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211479561.5A CN115953668A (zh) 2022-11-24 2022-11-24 一种基于YOLOv5算法的迷彩伪装目标检测方法及系统

Publications (1)

Publication Number Publication Date
CN115953668A true CN115953668A (zh) 2023-04-11

Family

ID=87281442

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211479561.5A Pending CN115953668A (zh) 2022-11-24 2022-11-24 一种基于YOLOv5算法的迷彩伪装目标检测方法及系统

Country Status (1)

Country Link
CN (1) CN115953668A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117132943A (zh) * 2023-10-20 2023-11-28 南京信息工程大学 一种安全帽佩戴检测方法、装置、系统及存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117132943A (zh) * 2023-10-20 2023-11-28 南京信息工程大学 一种安全帽佩戴检测方法、装置、系统及存储介质

Similar Documents

Publication Publication Date Title
CN111161349B (zh) 物体姿态估计方法、装置与设备
CN111079739B (zh) 一种多尺度注意力特征检测方法
CN111797983A (zh) 一种神经网络构建方法以及装置
CN111178206A (zh) 一种基于改进yolo的建筑预埋件检测方法及系统
CN113569667A (zh) 基于轻量级神经网络模型的内河船舶目标识别方法及系统
CN112801047B (zh) 缺陷检测方法、装置、电子设备及可读存储介质
CN112036381B (zh) 视觉跟踪方法、视频监控方法及终端设备
CN113569672A (zh) 轻量级目标检测与故障识别方法、装置及系统
CN115147598A (zh) 目标检测分割方法、装置、智能终端及存储介质
CN112967388A (zh) 三维时序图像神经网络模型的训练方法和装置
CN115953668A (zh) 一种基于YOLOv5算法的迷彩伪装目标检测方法及系统
CN114565842A (zh) 基于Nvidia Jetson嵌入式硬件的无人机实时目标检测方法及系统
CN115830535A (zh) 一种变电站周边区域积水检测方法、系统、设备及介质
CN116310850A (zh) 基于改进型RetinaNet的遥感图像目标检测方法
CN116805387B (zh) 基于知识蒸馏的模型训练方法、质检方法和相关设备
CN114241360A (zh) 一种基于自适应推理的视频识别方法和装置
CN114462486A (zh) 图像处理模型的训练方法、图像处理方法及相关装置
CN117710841A (zh) 一种无人机航拍图像的小目标检测方法、装置
Liu et al. Object detection algorithm based on lightweight YOLOv4 for UAV
CN116912483A (zh) 目标检测方法、电子设备以及存储介质
CN114820755B (zh) 一种深度图估计方法及系统
CN113902744A (zh) 基于轻量级网络的图像检测方法、系统、设备和存储介质
CN113108794B (zh) 位置识别方法、装置、设备及计算机可读存储介质
CN114170421B (zh) 图像检测方法、装置、设备及存储介质
CN117557775B (zh) 基于红外和可见光融合的变电站电力设备检测方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination