CN112308019B - 基于网络剪枝和知识蒸馏的sar舰船目标检测方法 - Google Patents

基于网络剪枝和知识蒸馏的sar舰船目标检测方法 Download PDF

Info

Publication number
CN112308019B
CN112308019B CN202011308276.8A CN202011308276A CN112308019B CN 112308019 B CN112308019 B CN 112308019B CN 202011308276 A CN202011308276 A CN 202011308276A CN 112308019 B CN112308019 B CN 112308019B
Authority
CN
China
Prior art keywords
network
convolution
feature
pruning
features
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011308276.8A
Other languages
English (en)
Other versions
CN112308019A (zh
Inventor
占荣辉
陈诗琪
王威
刘盛启
张军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National University of Defense Technology
Original Assignee
National University of Defense Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National University of Defense Technology filed Critical National University of Defense Technology
Priority to CN202011308276.8A priority Critical patent/CN112308019B/zh
Publication of CN112308019A publication Critical patent/CN112308019A/zh
Application granted granted Critical
Publication of CN112308019B publication Critical patent/CN112308019B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • G06V20/13Satellite images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/082Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Abstract

本发明公开了一种基于网络剪枝和知识蒸馏的SAR舰船目标检测方法,属于雷达遥感图像应用技术领域。技术方案是首先设计适用于SAR多尺度、大长宽比目标的骨干网络结构,然后对该网络进行通道剪枝以产生较紧凑的模型。另外,应用知识蒸馏策略来弥补由于网络剪枝造成的性能下降。不同于常用检测模型蒸馏方法中的全特征模仿,本发明将不同层级特征图之间的相互关系作为蒸馏中的迁移知识,还设计了一种新颖的注意力机制以增强目标相关的特征,从而使得蒸馏的特征有更强的表示能力。采用本发明构建的检测器可实现2.8M的模型大小,大于200fps的推理速度以及较低的计算成本,检测精度也有一定提升。

Description

基于网络剪枝和知识蒸馏的SAR舰船目标检测方法
技术领域
本发明属于雷达遥感图像应用技术领域,涉及基于卷积神经网络的SAR(合成孔径雷达)图像舰船检测方法,尤其是结合深度网络压缩的目标检测方法。
背景技术
合成孔径雷达(Synthetic Aperture Radar,SAR)一种主动式微波成像传感器,其利用距离向的脉冲压缩技术和方位向的孔径合成技术来实现较高的空间分辨率,并借助机载和星载等平台实现对大范围观测区域的高分辨成像。目前,开展基于SAR图像的舰船目标检测研究备受各国关注,对维护海洋权益,执行海上救援任务以及实行海上目标的精确制导有着重要意义。
近年来,卷积神经网络(convolution neural network,CNN)凭借其强大的特征表示能力以及自动提取特征的优势在计算机视觉领域的检测、分类、分割等多个任务中取得了较高的精度,基于CNN的检测器在SAR图像舰船检测中的方法也层出不穷。然而,大多数检测模型以牺牲检测速度和模型计算量的代价来提高检测精度,限制了实时应用中SAR检测器的性能。如对比文件Cui Z,Li Q,et al,“Dense attention pyramid networks formulti-scale ship detection in sar images”,IEEE Transactions on Geoscience andRemote Sensing,2019,57(11):8983-8997(Cui Z等人于2019年在《电气与电子工程师协会地理科学与遥感会刊》第57卷第11期发表的“密集注意力金字塔网络下的多尺度SAR图像舰船检测”);对比文件Wei S,Su H,et al,“Precise and robust ship detection forhigh-resolution sar imagery based on hr-sdnet”,Remote Sensing,2019,12(1):167(Wei S等人于2019年在《遥感》期刊第12卷第1期发表的“基于HR-SDNet网络的精确和鲁棒高分辨率SAR图像舰船检测”)。
对比文件Zhang T,Zhang X,et al,“Depthwise separable convolution neuralnetwork for high-accurate and high-speed sar ship detection”,Remote Sensing,vol.11,no.21,p.2483,2019(Zhang T等人在《遥感》期刊第11卷第21期发表的“用于高精度和高速SAR舰船检测的深度可分离卷积神经网络”)针对SAR图像中复杂的舰船背景提出改进版本的YOLOv3,并结合了特征金字塔结构提高了多尺度舰船目标的检测性能。虽然检测精度有提高,但模型的计算量和容量都比较大且网络参数较多,检测速度有所下降。如何在保持检测精度的前提下,实现模型的小型化、计算的轻量化、检测的高效化,是应用于机载星载实时SAR图像解译中需要解决的关键问题。
发明内容
针对上述存在问题或不足,为克服现有基于CNN的SAR舰船检测模型中计算量大且参数冗余的现象,本发明提出一种基于网络剪枝和知识蒸馏的SAR舰船目标检测方法。由此构建的轻量化检测器Tiny YOLO-Lite能在保证精度的同时实现快速检测且占用较少的计算资源,有利于检测模型在实际应用中的部署以及硬件移植。
本发明的技术方案由以下步骤实现,其舰船检测方法的整体流程如附图1所示。
步骤1:将SAR图像切片输入检测网络,使用YOLOv3检测器作为参考检测框架;在骨干网络中的最后三个阶段引入非对称卷积模块ACM,以加强长宽比较大的目标的特征表现能力;通过加入不同形状的卷积核以丰富卷积核的感受野,提升不同形状目标的检测;将输入特征表示为Fin,且Fin来自于骨干网络中最后三个阶段的输出特征图;将输入特征Fin接入三个分支,其中第一个分支和第三个分支对应的卷积核大小分别是1×d和d×1,对应的卷积分别表示为Conv1×d和Convd×1;中间分支保持d×d大小的卷积核,对应的卷积表示为Convd×d;输出特征图Fout的计算过程如下:
Fout=ReLu(Conv1×d(Fin)+Convd×d(Fin)+Convd×1(Fin))
其中,ReLu表示激活函数,对三个分支融合后的输出进行处理得到输出特征;
然后,构建一个含密集连接要素的金字塔网络以融合不同层级的特征,进一步增强每个尺度特征的语义信息,进而提升多尺度船舶尤其是小目标的检测性能;将骨干网络中最后三个Res模块的输出特征图定义为F1,F2,F3,即ACM模块的输入特征,其中最后三个Res模块分别为Res8,Res8,Res4,且Res之后的数字表示Res单元的个数;将密集连接后生成的特征图定义为F1′,F2′,F3′,依次对应检测小、中、大尺寸的目标;定义CBL为3×3卷积、批量归一化BN以及LeakyReLu操作的集合,定义m×操作为:
Figure BDA0002788957600000021
其中,Concat表示特征拼接操作,UpSamplem表示m倍的上采样操作,Conv1×1是核大小为1×1的卷积,Fi表示骨干网络中最后三个Res模块输出的第i个特征图;
Figure BDA0002788957600000022
表示第(i+log2m)个特征图,log2m表示特征Fi和特征
Figure BDA0002788957600000023
之间的距离层数;
将不同层级用于预测不同尺度目标的输出特征图集合F1′,F2′,F3′表示为:
F3′=Conv1×1(CBL(ACM(F3)))
Figure BDA0002788957600000031
Figure BDA0002788957600000032
其中,Fi,i=1,2,3表示骨干网络最后三个Res模块对应的三个层级的特征图;
Figure BDA0002788957600000033
i=1,2,3表示与Fi间隔log2m个特征层级数的对应特征;ACM表示非对称卷积模块,CBL是卷积操作集合,m1,m2表示不同层级之间的倍数关系;
将YOLOv3主干网络DarkNet-53中的Res单元里的第二个卷积模块换成深度可分离卷积模块DSC,其中,DSC模块由3×3深度卷积、批量归一化BN、LeakyReLu、1×1点卷积、批量归一化BN以及LeakyReLu的组合构成,完成改进骨干网络的自适应多尺度多形态目标检测器DC-ACM YOLOv3的构建;
步骤2:对步骤1中构建的DC-ACM YOLOv3进行稀疏训练,在网络通道剪枝之前先联合训练网络权重参数和表示通道重要性的尺度因子,并以通道形式对尺度因子进行L1正则化。
将通道剪枝网络的训练目标函数表示为:
Figure BDA0002788957600000034
第一项表示检测器的常规损失函数,f(γ)=|γ|表示用于实现稀疏功能的L1归一化项,γ为表示通道重要性的尺度因子,Γ为尺度因子集合构成的空间,λ用于平衡两者;
步骤3:通过深度网络压缩中的模型剪枝方法修剪DC-ACM YOLOv3的主干网络以获得一个更加紧凑的特征提取模型,从网络模型中挑选出重要性程度较低的部分参数进行网络参数裁剪;
在通道层面引入稀疏训练后,将批量归一化(BN)层中的尺度缩放因子γ作为衡量通道重要性的参数挑选出待剪枝的特征通道,然后进行通道裁剪;给定剪枝率α,定义全局阈值
Figure BDA0002788957600000035
表示所有γ值中第α个百分比对应的值,同时以层级的局部保护阈值θ限制待剪枝通道的尺度因子,根据这两个阈值
Figure BDA0002788957600000036
和θ对所有卷积层构建剪枝掩膜;
处理骨干网络的路由层时,按顺序拼接其所有输入的剪枝掩膜并经输出掩膜作为当前层的剪枝掩膜;对于跨层连接层,为匹配与该层相连接的层的通道数,遍历所有与其相连接层的剪枝掩膜并执行“或”的操作以产生这些连接层的最终剪枝掩膜;获取剪枝掩膜后,移除所有尺度因子接近0的通道对应的输入输出以及权重参数从而得到网络的轻量化模型;
步骤4:使用特征图间相互关系指导的知识蒸馏策略,将设计的检测器DC-ACMYOLOv3定义为教师模型,而学生网络是经过通道剪枝得到的轻量化网络;
舰船检测框架中的知识蒸馏结构图见附图2。给定输入图像I,分别对其在教师网络和学生网络中进行特征提取,得到教师网络中的预测特征图集合FT={f1 T,f2 T,f3 T}和学生网络中的预测特征图集合FS={f1 S,f2 S,f3 S};每一层级的预测特征将接入分类分支和回归分支生成对应的属于目标类别的概率p(ps、pt分别表示学生模型和教师模型的分类分数输出,y表示目标的真值)和对应的回归偏置R(Rs、Rt分别表示学生模型和教师模型的分类分数输出,Rgt表示目标的真值框位置)分别从三个层面即骨干网络特征,分类头部和边框回归头部进行教师网络到学生网络的蒸馏;
由于检测是更高级的视觉任务,需要同时输出每个实例的分类和位置信息,因此直接蒸馏分类分支的软目标难以产生较好的效果。其次,前景实例和背景实例两者之间的极端不平衡使得学生网络难以捕捉教师网络中最具代表性的知识。因此本发明提出一种新型的注意力机制以提取目标的显著性特征,尤其是在检测近岸船舶时能削弱SAR图像中强后向散射点的干扰以及复杂背景下引起的虚警。具体方法如下:
4.1首先构造特征相似度图FAG来表示不同层级特征图之间的知识。
给定训练实例xi,定义fl(xi)为从第l个阶段中提取的特征,即骨干网络中三个层级的中间特征图;将特征的互关系表示为不同尺度特征间的邻接矩阵Al,将第i个训练样本对应的FAG表示为:
FAGi=(Vn,En)=(fl(xi),Al)
其中,Vn为一系列表示不同预测层级特征分布的节点,每对节点由边集合En连接,其中的每个元素Al表示特征间的关系,特征间的关系矩阵Al(m,n)由下式计算:
Figure BDA0002788957600000041
式中,fm(xi)和fn(xi)表示训练实例xi中提取的第m和n层特征,
Figure BDA0002788957600000042
表示欧几里得距离计算。
4.2构建基于条带池化的注意力模块SPAM增强图结构中的每个特征,SPAM的整体结构见附图3。
SPAM图结构中不同层级的特征图
Figure BDA0002788957600000043
作为输入特征图进行SPAM操作,得到每层特征的注意力图
Figure BDA0002788957600000044
其将作为特征重要性的描述子。
SPAM首先沿着通道轴以两个平行分支生成对应的池化特征,为保证两个池化特征有相同的空间尺度,接着送入卷积核大小为3的一维卷积层,输出的水平条带池化特征和垂直条带池化特征分别是Phori和Pver;两个分支的特征以相加方式融合后,经过1×1卷积和激活函数得到空间注意力图Asam(Xi),再与原输入特征图相乘得到注意力增强的输出特征图Xsam,计算过程如下式所示:
Figure BDA0002788957600000051
Figure BDA0002788957600000052
其中,f1×1表示1×1卷积,
Figure BDA0002788957600000053
表示按元素相加,σ为Sigmoid激活函数,
Figure BDA0002788957600000054
表示按元素相乘。
4.3在骨干网络的中间特征,分类头部和边框回归头部部分增加来自教师网络的监督信号,融合这三个蒸馏项得到轻量化的学生网络的训练目标函数,计算公式如下式:
Figure BDA0002788957600000055
Figure BDA0002788957600000056
Lcls,Lreg分别表示图结构下得特征蒸馏损失,分类和回归分支中的蒸馏损失,β表示控制特征蒸馏损失比例的超参数。
本发明在现有单阶段检测器YOLOv3的基础上,提出了一种基于网络剪枝和知识蒸馏的SAR舰船目标检测方法。首先设计了融合密集连接和非对称卷积模块的骨干网络,以提升SAR图像中多尺度和大长宽比舰船目标的检测性能。接着用通道剪枝方法缩减原始骨干网络的大小,并结合知识蒸馏策略弥补剪枝带来的性能下降。通过模拟不同层级特征之间的相互关系,构建基于图的显著性特征知识蒸馏模块,从而更好地逼近教师网络的检测性能。
与现有的基于卷积神经网络的SAR舰船目标检测方法不同,本发明构建了轻量化的舰船检测模型Tiny YOLO-Lite,能在保证检测精度的同时达到较快的检测速度,模型的计算量和容量也有大幅度精简。在小尺度、大长宽比和排列密集的舰船上都能取得良好的检测效果。
附图说明
图1为本发明轻量化SAR舰船实时检测方法的总体流程图;
图2为检测模型中的知识蒸馏结构图;
图3为基于特征图互关系的图结构;
图4为本发明中SAR图像多尺度、密集排列的舰船检测结果示意图。
具体实施方式
下面结合附图和具体实施例对本发明进一步说明。
基于网络剪枝和知识蒸馏的SAR舰船目标检测方法,包括如下步骤:
步骤1:将SAR图像切片输入检测网络,使用YOLOv3检测器作为参考检测框架;在骨干网络中的最后三个阶段引入非对称卷积模块ACM,以加强长宽比较大的目标的特征表现能力;通过加入不同形状的卷积核以丰富卷积核的感受野,提升不同形状目标的检测;将输入特征表示为Fin,且Fin来自于骨干网络中最后三个阶段的输出特征图;将输入特征Fin接入三个分支,其中第一个分支和第三个分支对应的卷积核大小分别是1×d和d×1,对应的卷积分别表示为Conv1×d和Convd×1;中间分支保持d×d大小的卷积核,对应的卷积表示为Convd×d;输出特征图Fout的计算过程如下:
Fout=ReLu(Conv1×d(Fin)+Convd×d(Fin)+Convd×1(Fin))
其中,ReLu表示激活函数,对三个分支融合后的输出进行处理得到输出特征;
然后,构建一个含密集连接要素的金字塔网络以融合不同层级的特征,进一步增强每个尺度特征的语义信息,进而提升多尺度船舶尤其是小目标的检测性能;将骨干网络中最后三个Res模块(Res8,Res8,Res4,其中Res之后的数字表示Res单元的个数)的输出特征图定义为F1,F2,F3,即ACM模块的输入特征;将密集连接后生成的特征图定义为F1′,F2′,F3′,依次对应检测小、中、大尺寸的目标;定义CBL为3×3卷积、批量归一化BN以及LeakyReLu操作的集合,定义m×操作为:
Figure BDA0002788957600000061
其中,Concat表示特征拼接操作,UpSamplem表示m倍的上采样操作,Conv1×1是核大小为1×1的卷积。Fi表示骨干网络中最后三个Res模块输出的第i个特征图;
Figure BDA0002788957600000062
表示第(i+log2m)个特征图,log2m表示特征Fi和特征
Figure BDA0002788957600000063
之间的距离层数;
将不同层级用于预测不同尺度目标的输出特征图集合F1′,F2′,F3′表示为:
F3′=Conv1×1(CBL(ACM(F3)))
Figure BDA0002788957600000064
Figure BDA0002788957600000065
其中,Fi,i=1,2,3表示骨干网络最后三个Res模块对应的三个层级的特征图;
Figure BDA0002788957600000066
i=1,2,3表示与Fi间隔log2m个特征层级数的对应特征;ACM表示非对称卷积模块,CBL是卷积操作集合,m1,m2表示不同层级之间的倍数关系;
将YOLOv3主干网络DarkNet-53中的Res单元里的第二个卷积模块换成深度可分离卷积模块DSC,DSC模块由3×3深度卷积、批量归一化BN、LeakyReLu、1×1点卷积、批量归一化BN以及LeakyReLu的组合构成,完成改进骨干网络的自适应多尺度多形态目标检测器DC-ACM YOLOv3的构建;
步骤2:对步骤1中构建的DC-ACM YOLOv3进行稀疏训练,在网络通道剪枝之前先联合训练网络权重参数和表示通道重要性的尺度因子,并以通道形式对尺度因子进行L1正则化。
将通道剪枝网络的训练目标函数表示为:
Figure BDA0002788957600000071
第一项表示检测器的常规损失函数,f(γ)=|γ|表示用于实现稀疏功能的L1归一化项,γ为表示通道重要性的尺度因子,Γ为尺度因子集合构成的空间,λ用于平衡两者;
步骤3:通过深度网络压缩中的模型剪枝方法修剪DC-ACM YOLOv3的主干网络以获得一个更加紧凑的特征提取模型,从网络模型中挑选出重要性程度较低的部分参数进行网络参数裁剪;
在通道层面引入稀疏训练后,将批量归一化(BN)层中的尺度缩放因子γ作为衡量通道重要性的参数挑选出待剪枝的特征通道,然后进行通道裁剪;给定剪枝率α,定义全局阈值
Figure BDA0002788957600000072
表示所有γ值中第α个百分比对应的值,同时以层级的局部保护阈值θ限制待剪枝通道的尺度因子,根据这两个阈值
Figure BDA0002788957600000073
和θ对所有卷积层构建剪枝掩膜;
处理骨干网络的路由层时,按顺序拼接其所有输入的剪枝掩膜并经输出掩膜作为当前层的剪枝掩膜;对于跨层连接层,为匹配与该层相连接的层的通道数,遍历所有与其相连接层的剪枝掩膜并执行“或”的操作以产生这些连接层的最终剪枝掩膜;获取剪枝掩膜后,移除所有尺度因子接近0的通道对应的输入输出以及权重参数从而得到网络的轻量化模型;
步骤4:使用特征图间相互关系指导的知识蒸馏策略,将设计的检测器DC-ACMYOLOv3定义为教师模型,而学生网络是经过通道剪枝得到的轻量化网络;
舰船检测框架中的知识蒸馏结构图见附图2。给定输入图像I,分别对其在教师网络和学生网络中进行特征提取,得到教师网络中的预测特征图集合FT={f1 T,f2 T,f3 T}和学生网络中的预测特征图集合FS={f1 S,f2 S,f3 S};每一层级的预测特征将接入分类分支和回归分支生成对应的属于目标类别的概率p(ps、pt分别表示学生模型和教师模型的分类分数输出,y表示目标的真值)和对应的回归偏置R(Rs、Rt分别表示学生模型和教师模型的分类分数输出,Rgt表示目标的真值框位置)分别从三个层面即骨干网络特征,分类头部和边框回归头部进行教师网络到学生网络的蒸馏;
由于检测是更高级的视觉任务,需要同时输出每个实例的分类和位置信息,因此直接蒸馏分类分支的软目标难以产生较好的效果。其次,前景实例和背景实例两者之间的极端不平衡使得学生网络难以捕捉教师网络中最具代表性的知识。因此本发明提出一种新型的注意力机制以提取目标的显著性特征,尤其是在检测近岸船舶时能削弱SAR图像中强后向散射点的干扰以及复杂背景下引起的虚警。具体方法如下:
4.1首先构造特征相似度图FAG来表示不同层级特征图之间的知识。
给定训练实例xi,定义fl(xi)为从第l个阶段中提取的特征,即骨干网络中三个层级的中间特征图;将特征的互关系表示为不同尺度特征间的邻接矩阵Al,将第i个训练样本对应的FAG表示为:
FAGi=(Vn,En)=(fl(xi),Al)
其中,Vn为一系列表示不同预测层级特征分布的节点,每对节点由边集合En连接,其中的每个元素Al表示特征间的关系,特征间的关系矩阵Al(m,n)由下式计算:
Figure BDA0002788957600000081
式中,fm(xi)和fn(xi)表示训练实例xi中提取的第m和n层特征,
Figure BDA0002788957600000082
表示欧几里得距离计算。
4.2构建基于条带池化的注意力模块SPAM增强图结构中的每个特征,SPAM的整体结构见附图3。
SPAM图结构中不同层级的特征图
Figure BDA0002788957600000083
作为输入特征图进行SPAM操作,得到每层特征的注意力图
Figure BDA0002788957600000084
其将作为特征重要性的描述子。
SPAM首先沿着通道轴以两个平行分支生成对应的池化特征,为保证两个池化特征有相同的空间尺度,接着送入卷积核大小为3的一维卷积层,输出的水平条带池化特征和垂直条带池化特征分别是Phori和Pver;两个分支的特征以相加方式融合后,经过1×1卷积和激活函数得到空间注意力图Asam(Xi),再与原输入特征图相乘得到注意力增强的输出特征图Xsam,计算过程如下式所示:
Figure BDA0002788957600000094
Figure BDA0002788957600000092
其中,f1×1表示1×1卷积,
Figure BDA0002788957600000095
表示按元素相加,σ为Sigmoid激活函数,
Figure BDA0002788957600000093
表示按元素相乘。
4.3在骨干网络的中间特征,分类头部和边框回归头部部分增加来自教师网络的监督信号,融合这三个蒸馏项得到轻量化的学生网络的训练目标函数,计算公式如下式:
Figure BDA0002788957600000096
Figure BDA0002788957600000097
Lcls,Lreg分别表示图结构下得特征蒸馏损失,分类和回归分支中的蒸馏损失,β表示控制特征蒸馏损失比例的超参数。
下面利用海军航空大学提出的舰船数据集SSDD进行多尺度、密集排列舰船目标检测,对本发明做进一步说明。
实验采用的数据集为SAR图像舰船检测数据集SSDD,该数据集采集了来自不同传感器和极化方式,不同海况和场景下具有不同分辨率的SAR图像。SSDD中船舶尺寸分布从最小的7×7到最大的211×298,目标形状各异,部分复杂场景中存在密集排列的目标。实验中对1160张SAR图像按照7:2:1的比例划分训练、验证和测试集。
训练网络方面,学习率初始值设置为0.001,并在训练过程中通过余弦退火机制进行衰减,在动量为0.9,权重衰减率为0.0005的条件下以随机梯度下降法优化。正常训练教师网络时,代数设置为100,而稀疏训练时设置为200,其余参数保持一致。网络中锚框的尺度和比例设置同YOLOv3中的设置相同。
表1舰船检测精度比较
Figure BDA0002788957600000091
与现有基于卷积神经网络的SAR舰船检测方法比较,本发明提出方法下的舰船检测精度能达到94.6%,比表中最好的YOLOv3结构提高了1.1%。与未经过剪枝的YOLOv3相比,本发明方法得到的网络浮点计算量能减少约93.6%,模型参数能减少约98.9%且模型容量仅有YOLOv3模型的1%大小。表1为本发明方法与其他典型的CNN检测方法下的检测精度比较。多尺度、密集排列的舰船目标检测结果比较见附图4所示。从图中可以看出,待检测的船只都分布于复杂场景下的近岸区域。其他轻量化模型下存在部分漏检和虚景,一些平行排列的靠岸舰船会被当作一个目标,或者预测框重叠区域较大区分不够明显,这是由于紧密排列舰船的边界不够清晰。而本发明中所提轻量化模型在模仿教师网络的特征时加强了目标的语义信息表示,因此能获取具有高质量且目标包围更紧凑的预测框。此外,诸如岛屿和人造设施之类的虚景会出现在内陆区域中,这是由邻近的具有相似散射强度的非目标的干扰导致的。而本发明中的特征注意力机制能在抑制表示能力不足的背景特征的同时增强突出目标相关的重要像素,从而能将目标与背景散射点进行有效的区分。综上所述,本发明能在保证检测精度的同时提升检测速度,构建计算量和网络参数量较小且模型精简化的检测框架。
虽然参照上述实施例详细描述了本发明,但是应该理解本发明并不限于所公开的实施例。对于本专业领域的技术人员来说,可以对其形式和细节进行各种改变。本发明意欲涵盖所附权利要求书的精神和范围内的各种变形。

Claims (1)

1.基于网络剪枝和知识蒸馏的SAR舰船目标检测方法,其特征在于,包括如下步骤:
步骤1:将SAR图像切片输入检测网络,使用YOLOv3检测器作为参考检测框架;在骨干网络中的最后三个阶段引入非对称卷积模块ACM;通过加入不同形状的卷积核以丰富卷积核的感受野,提升不同形状目标的检测;将输入特征表示为Fin,且Fin来自于骨干网络中最后三个阶段的输出特征图;将输入特征Fin接入三个分支,其中第一个分支和第三个分支对应的卷积核大小分别是1×d和d×1,对应的卷积分别表示为Conv1×d和Convd×1;中间分支保持d×d大小的卷积核,对应的卷积表示为Convd×d;输出特征图Fout的计算过程如下:
Fout=ReLu(Conv1×d(Fin)+Convd×d(Fin)+Convd×1(Fin))
其中,ReLu表示激活函数,对三个分支融合后的输出进行处理得到输出特征;
然后,构建一个含密集连接要素的金字塔网络以融合不同层级的特征,进一步增强每个尺度特征的语义信息,进而提升多尺度船舶小目标的检测性能;将骨干网络中最后三个Res模块的输出特征图定义为F1,F2,F3,即ACM模块的输入特征,其中最后三个Res模块分别为Res8,Res8,Res4,且Res之后的数字表示Res单元的个数;将密集连接后生成的特征图定义为F′1,F′2,F′3,依次对应检测小、中、大尺寸的目标;定义CBL为3×3卷积、批量归一化BN以及LeakyReLu操作的集合,定义m×操作为:
Figure FDA0003146813360000011
其中,Concat表示特征拼接操作,UpSamplem表示m倍的上采样操作,Conv1×1是核大小为1×1的卷积,Fi表示骨干网络中最后三个Res模块输出的第i个特征图;
Figure FDA0003146813360000012
表示第(i+log2m)个特征图,log2 m表示特征Fi和特征
Figure FDA0003146813360000013
之间的距离层数;
将不同层级用于预测不同尺度目标的输出特征图集合F′1,F′2,F′3表示为:
F′3=Conv1×1(CBL(ACM(F3)))
Figure FDA0003146813360000014
Figure FDA0003146813360000015
其中,Fi,i=1,2,3表示骨干网络最后三个Res模块对应的三个层级的特征图;
Figure FDA0003146813360000016
表示与Fi间隔log2 m个特征层级数的对应特征;ACM表示非对称卷积模块,CBL是卷积操作集合,m1,m2表示不同层级之间的倍数关系;
将YOLOv3主干网络DarkNet-53中的Res单元里的第二个卷积模块换成深度可分离卷积模块DSC,其中,DSC模块由3×3深度卷积、批量归一化BN、LeakyReLu、1×1点卷积、批量归一化BN以及LeakyReLu的组合构成,完成改进骨干网络的自适应多尺度多形态目标检测器DC-ACM YOLOv3的构建;
步骤2:对步骤1中构建的DC-ACM YOLOv3进行稀疏训练,在网络通道剪枝之前先联合训练网络权重参数和表示通道重要性的尺度因子,并以通道形式对尺度因子进行L1正则化;
将通道剪枝网络的训练目标函数表示为:
Figure FDA0003146813360000021
第一项表示检测器的常规损失函数,f(γ)=|γ|表示用于实现稀疏功能的L1归一化项,γ为表示通道重要性的尺度因子,Γ为尺度因子集合构成的空间,λ用于平衡两者;
步骤3:通过深度网络压缩中的模型剪枝方法修剪DC-ACM YOLOv3的主干网络以获得一个更加紧凑的特征提取模型,从网络模型中挑选出重要性程度较低的部分参数进行网络参数裁剪;
在通道层面引入稀疏训练后,将批量归一化BN层中的尺度缩放因子γ作为衡量通道重要性的参数挑选出待剪枝的特征通道,然后进行通道裁剪;给定剪枝率α,定义全局阈值
Figure FDA0003146813360000022
Figure FDA0003146813360000023
表示所有γ值中第α个百分比对应的值,同时以层级的局部保护阈值θ限制待剪枝通道的尺度因子,根据这两个阈值
Figure FDA0003146813360000024
和θ对所有卷积层构建剪枝掩膜;
处理骨干网络的路由层时,按顺序拼接其所有输入的剪枝掩膜并经输出掩膜作为当前层的剪枝掩膜;对于跨层连接层,为匹配与该层相连接的层的通道数,遍历所有与其相连接层的剪枝掩膜并执行“或”的操作以产生这些连接层的最终剪枝掩膜;获取剪枝掩膜后,移除所有尺度因子接近0的通道对应的输入输出以及权重参数从而得到网络的轻量化模型;
步骤4:使用特征图间相互关系指导的知识蒸馏策略,将设计的检测器DC-ACM YOLOv3定义为教师模型,而学生网络是经过通道剪枝得到的轻量化网络;
给定输入图像I,分别对其在教师网络和学生网络中进行特征提取,得到教师网络中的预测特征图集合
Figure FDA0003146813360000025
和学生网络中的预测特征图集合
Figure FDA0003146813360000026
每一层级的预测特征将接入分类分支和回归分支生成对应的属于目标类别的概率p和对应的回归偏置R;分别从三个层面即骨干网络特征,分类头部和边框回归头部进行教师网络到学生网络的蒸馏;
具体包括如下步骤:
4.1首先构造特征相似度图FAG来表示不同层级特征图之间的知识
给定训练实例xi,定义fl(xi)为从第l个阶段中提取的特征,即骨干网络中三个层级的中间特征图;将特征的互关系表示为不同尺度特征间的邻接矩阵Al,将第i个训练样本对应的FAG表示为:
FAGi=(Vn,En)=(fl(xi),Al)
其中,Vn为一系列表示不同预测层级特征分布的节点,每对节点由边集合En连接,其中的每个元素Al表示特征间的关系,特征间的关系矩阵Al(m,n)由下式计算:
Figure FDA0003146813360000031
式中,fm(xi)和fn(xi)表示训练实例xi中提取的第m和n阶段特征,
Figure FDA0003146813360000032
表示欧几里得距离计算;
4.2构建基于条带池化的注意力模块SPAM增强图结构中的每个特征
SPAM图结构中不同层级的特征图
Figure FDA0003146813360000033
作为输入特征图进行SPAM操作,得到每层特征的注意力图
Figure FDA0003146813360000034
其将作为特征重要性的描述子;
SPAM首先沿着通道轴以两个平行分支生成对应的池化特征,为保证两个池化特征有相同的空间尺度,接着送入卷积核大小为3的一维卷积层,输出的水平条带池化特征和垂直条带池化特征分别是Phori和Pver;两个分支的特征以相加方式融合后,经过1×1卷积和激活函数得到空间注意力图Asam(Xi),再与原输入特征图相乘得到注意力增强的输出特征图Xsam,计算过程如下式所示:
Figure FDA0003146813360000035
Figure FDA0003146813360000036
其中,f1×1表示1×1卷积,
Figure FDA0003146813360000037
表示按元素相加,σ为Sigmoid激活函数,
Figure FDA0003146813360000038
表示按元素相乘;
4.3在骨干网络的中间特征,分类头部和边框回归头部部分增加来自教师网络的监督信号,融合这三个蒸馏项得到轻量化的学生网络的训练目标函数,计算公式如下式:
Figure FDA0003146813360000039
Figure FDA00031468133600000310
Lcls,Lreg分别表示图结构下得特征蒸馏损失,分类和回归分支中的蒸馏损失,β表示控制特征蒸馏损失比例的超参数。
CN202011308276.8A 2020-11-19 2020-11-19 基于网络剪枝和知识蒸馏的sar舰船目标检测方法 Active CN112308019B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011308276.8A CN112308019B (zh) 2020-11-19 2020-11-19 基于网络剪枝和知识蒸馏的sar舰船目标检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011308276.8A CN112308019B (zh) 2020-11-19 2020-11-19 基于网络剪枝和知识蒸馏的sar舰船目标检测方法

Publications (2)

Publication Number Publication Date
CN112308019A CN112308019A (zh) 2021-02-02
CN112308019B true CN112308019B (zh) 2021-08-17

Family

ID=74335131

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011308276.8A Active CN112308019B (zh) 2020-11-19 2020-11-19 基于网络剪枝和知识蒸馏的sar舰船目标检测方法

Country Status (1)

Country Link
CN (1) CN112308019B (zh)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113111758B (zh) * 2021-04-06 2024-01-12 中山大学 一种基于脉冲神经网络的sar图像舰船目标识别方法
CN113496253A (zh) * 2021-04-22 2021-10-12 南京工程学院 一种船舶目标检测方法及系统
CN113255759B (zh) * 2021-05-20 2023-08-22 广州广电运通金融电子股份有限公司 基于注意力机制的目标内特征检测系统、方法和存储介质
CN113379603B (zh) * 2021-06-10 2024-03-15 大连海事大学 一种基于深度学习的船舶目标检测方法
CN113469073B (zh) * 2021-07-06 2024-02-20 西安电子科技大学 一种基于轻量级深度学习的sar图像舰船检测方法及系统
CN113449680B (zh) * 2021-07-15 2022-08-30 北京理工大学 一种基于知识蒸馏的多模小目标检测方法
CN113743230A (zh) * 2021-08-09 2021-12-03 东北大学 一种基于边缘计算的飞机检测跟踪识别系统
CN113642473A (zh) * 2021-08-17 2021-11-12 四川航天电液控制有限公司 一种基于计算机视觉的矿下煤机状态识别方法
CN113744220B (zh) * 2021-08-25 2024-03-26 中国科学院国家空间科学中心 一种基于pynq的无预选框检测系统
CN113610232B (zh) * 2021-09-28 2022-02-22 苏州浪潮智能科技有限公司 网络模型量化方法、装置、计算机设备以及存储介质
CN114119959A (zh) * 2021-11-09 2022-03-01 盛视科技股份有限公司 一种基于视觉的垃圾桶满溢检测方法及装置
CN114119582B (zh) * 2021-12-01 2024-04-26 安徽大学 一种合成孔径雷达图像目标检测方法
CN114677545B (zh) * 2022-03-29 2023-05-23 电子科技大学 一种基于相似性剪枝和高效模块的轻量化图像分类方法
CN115618271B (zh) * 2022-05-05 2023-11-17 腾讯科技(深圳)有限公司 对象类别识别方法、装置、设备及存储介质
CN115017948A (zh) * 2022-06-02 2022-09-06 电子科技大学 一种智能信号检测识别模型的轻量化处理方法
CN115019180B (zh) * 2022-07-28 2023-01-17 北京卫星信息工程研究所 Sar图像舰船目标检测方法、电子设备及存储介质
CN116110022B (zh) * 2022-12-10 2023-09-05 河南工业大学 基于响应知识蒸馏的轻量化交通标志检测方法及系统
CN115995032B (zh) * 2023-03-23 2023-06-06 中国船舶集团有限公司第七一九研究所 一种多模态特征融合的舰船智能识别方法和系统
CN116188509A (zh) * 2023-04-23 2023-05-30 电子科技大学 一种高效率三维图像分割方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111444760A (zh) * 2020-02-19 2020-07-24 天津大学 一种基于剪枝与知识蒸馏的交通标志检测与识别方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108898168B (zh) * 2018-06-19 2021-06-01 清华大学 用于目标检测的卷积神经网络模型的压缩方法和系统
CN109557529B (zh) * 2018-11-28 2019-08-30 中国人民解放军国防科技大学 一种基于广义Pareto分布杂波统计建模的雷达目标检测方法
CN109685152B (zh) * 2018-12-29 2020-11-20 北京化工大学 一种基于dc-spp-yolo的图像目标检测方法
CN111062489B (zh) * 2019-12-11 2023-10-20 北京知道创宇信息技术股份有限公司 一种基于知识蒸馏的多语言模型压缩方法、装置
CN111127438A (zh) * 2019-12-25 2020-05-08 昆明理工大学 基于改进yolo算法的肺部ct图像中结节检测方法
CN111274980B (zh) * 2020-01-23 2022-04-15 天津大学 基于yolov3和非对称卷积的小尺寸交通标志识别方法
CN111626330B (zh) * 2020-04-23 2022-07-26 南京邮电大学 基于多尺度特征图重构和知识蒸馏的目标检测方法与系统
CN111461083A (zh) * 2020-05-26 2020-07-28 青岛大学 基于深度学习的快速车辆检测方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111444760A (zh) * 2020-02-19 2020-07-24 天津大学 一种基于剪枝与知识蒸馏的交通标志检测与识别方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Training Efficient Saliency Prediction Models with Knowledge Distillation;Peng Zhang等;《Session 2A: Knowledge Processing & Action Analysis》;20191025;全文 *

Also Published As

Publication number Publication date
CN112308019A (zh) 2021-02-02

Similar Documents

Publication Publication Date Title
CN112308019B (zh) 基于网络剪枝和知识蒸馏的sar舰船目标检测方法
CN114119582B (zh) 一种合成孔径雷达图像目标检测方法
CN110472627B (zh) 一种端到端的sar图像识别方法、装置及存储介质
CN110135267B (zh) 一种大场景sar图像细微目标检测方法
CN111738112B (zh) 基于深度神经网络和自注意力机制的遥感船舶图像目标检测方法
CN112766087A (zh) 一种基于知识蒸馏的光学遥感图像舰船检测方法
CN109101897A (zh) 水下机器人的目标检测方法、系统及相关设备
Ma et al. Light-YOLOv4: An edge-device oriented target detection method for remote sensing images
CN111079739B (zh) 一种多尺度注意力特征检测方法
CN111753677B (zh) 基于特征金字塔结构的多角度遥感船舶图像目标检测方法
CN112347895A (zh) 一种基于边界优化神经网络的舰船遥感目标检测方法
Wan et al. AFSar: An anchor-free SAR target detection algorithm based on multiscale enhancement representation learning
CN113408340A (zh) 基于增强型特征金字塔的双极化sar小型船只检测方法
Zhang et al. Nearshore vessel detection based on Scene-mask R-CNN in remote sensing image
CN115965862A (zh) 基于掩码网络融合图像特征的sar舰船目标检测方法
CN116168240A (zh) 基于注意力增强的任意方向密集舰船目标检测方法
Chang et al. Yolov3 based ship detection in visible and infrared images
CN114565824A (zh) 基于全卷积网络的单阶段旋转舰船检测方法
Chen et al. Ship Detection with Optical Image Based on Attention and Loss Improved YOLO
CN113486819A (zh) 一种基于YOLOv4算法的船舶目标检测方法
CN115240078B (zh) 一种基于轻量化元学习的sar图像小样本目标检测方法
Ding et al. Sw-YoloX: An anchor-free detector based transformer for sea surface object detection
CN115035429A (zh) 一种基于复合主干网络和多预测头的航拍目标检测方法
CN114331950A (zh) 基于稠密连接稀疏激活网络的sar图像舰船检测方法
CN114494999A (zh) 一种双分支联合型目标密集预测方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant