CN117218545A

CN117218545A - 基于LBP特征与改进Yolov5的雷达图像检测方法

Info

Publication number: CN117218545A
Application number: CN202311259766.7A
Authority: CN
Inventors: 李焘; 王月荣; 彭冬亮
Original assignee: Hangzhou Dianzi University
Current assignee: Hangzhou Dianzi University
Priority date: 2023-09-27
Filing date: 2023-09-27
Publication date: 2023-12-12

Abstract

本发明公开了一种基于LBP特征与改进Yolov5的雷达图像检测方法，该方法针对原始SAR图像提取LBP特征，并与原始图像融合后作为训练数据。在Yolov5模型特征提取网络的C3模块中加入可变形卷积，在特征融合金字塔网络模块中使用基于特征的内容感知重组CARAFE算子来对特征图进行上采样、在三个预测特征层进行使用自适应特征融合ASFF增强特征表达。然后利用训练数据进行网络训练，使用训练后的网络进行雷达图像目标检测。本方法为训练数据补充了低层次的纹理信息，降低了在复杂场景中背景的干扰，通过融合低层次的局部纹理特征和深度网络的高层次语义特征，提升了整体的目标检测性能。

Description

基于LBP特征与改进Yolov5的雷达图像检测方法

技术领域

本发明属于雷达目标检测技术领域，具体涉及一种基于LBP特征与改进Yolov5的雷达图像检测方法。

背景技术

合成孔径雷达(Synthetic Aperture Radar,SAR)是一种先进的主动式微波传感器，相比于光学、红外、高光谱等其他遥感工具，具有不受光照和气候条件等限制实现全天时、全天候对地观测的特点，被广泛应用于地质勘测、灾害救援、海洋监视等场景。对SAR图像中车辆和舰船目标进行检测具有重要意义，然而SAR图像数据量庞大，人工检测效率较低，基于卷积神经网络的SAR目标检测方法因其强大的特征提取能力、无需过度的人工参与受到越来越多学者的关注。

现有技术中常见的目标检测方法分为YOLO、SSD、RetinaNet等单阶段算法和Faster R-CNN、Cascade R-CNN等双阶段算法，尽管神经网络学习到的特征较为抽象，难以被人类理解，但在目标检测中具有比人类更快的速度和更高的精度。然而随着特征提取的深入，大多数神经网络的输出结果都依赖于高层次的深度抽象特征，而忽略了低层次的纹理特征，导致特征表达的不充分。同时，SAR图像本身存在相干斑噪声，这导致目标边缘不明显，在复杂的场景中杂波强度较高，产生了许多的干扰信息，严重影响检测网络的性能，造成大量的虚警或漏检现象。

发明内容

针对现有技术的不足，本发明提出了基于LBP特征与改进Yolov5的雷达图像检测方法，通过在原图像中融合LBP(Local Binary Pattern,局部二值模式)特征，补充低层次的纹理信息，在Yolov5模型中引入可变形卷积和上采样算子CARAFE，提高检测性能。

基于LBP特征与改进Yolov5的雷达图像检测方法，具体包括以下步骤：

步骤1、收集SAR图像，灰度化处理后裁剪为相同大小的切片。针对每张切片提取其中一个通道图像的LBP特征，然后与其余两个通道图像在通道维度进行拼接融合，得到的新的三通道图像作为训练样本。标注样本中的目标位置，作为训练标签。

所述LBP特征的提取方法为：针对图像中的每个像素点，依次计算其局部LBP特征值VAR_P,R，得到图像的LBP特征：

其中，R表示该像素点的邻域半径，P表示领域内的采样点数量，g_p表示第p个采样点的像素值，p＝0,2,…,P-1。

步骤2、构建一个Yolov5，然后在骨干网络(backone)的C3模块中将Bottleneck的第二个卷积替换为可变形卷积DCN，在特征金字塔中，使用上采样算子CARAFE进行特征上采样，最后在头部结构(head)的三个预测特征层中使用自适应特征融合ASFF模块增强特征表达，得到改进的Yolov5模型。

步骤3、将步骤1所得的训练样本输入步骤2构建的改进的Yolov5模型中，根据模型输出计算边界框回归损失，优化模型参数。

步骤4、针对待检测SAR图像，按照步骤1的方式提取LBP特征并融合，然后输入步骤3训练后的模型中，得到SAR图像中的目标位置。

本发明具有以下有益效果：

1、本方法引入SAR图像的LBP特征，补充了低层次的纹理信息，降低了在复杂场景中背景的干扰，为网络的输入数据提供了更多有帮助的信息，降低了误检的可能，提高了算法的检测性能。

2、本发明通过融入可变形卷积来提高特征提取能力，让模型可以拟合目标多尺度形变，降低背景的干扰，在复杂的场景中，更容易将目标和背景分离开来；使用CARAFE上采样算子，基于特征的内容感知重组来对特征图进行上采样，使特征包含更丰富的语义信息；使用自适应特征融合ASFF对预测特征层进行自适应融合，使得特征表达更加完整，进一步充分利用CARAFE上采样算子得到的语义信息，从而获得更好的SAR目标检测性能。

附图说明

图1为实施例中基于LBP特征与改进Yolov5的雷达图像检测方法流程图；

图2为实施例中提取LBP特征的采样点示意图；

图3为实施例中提取的LBP特征图；

图4为实施例中构建的改进的Yolov5模型；

图5为实施例中改进后的C3模块的示意图；

图6为可变性卷积DCN的示意图；

图7为上采样算子CARAFE的示意图；

图8为自适应特征融合ASFF模块示意图；

图9为实施例中多种方案的检测结果对比图。

具体实施方式

以下结合附图对本发明作进一步的解释说明；

基于LBP特征与改进Yolov5的雷达图像检测方法，如图1所示，具体包括以下步骤：

步骤1、MiniSAR数据集选取9幅图像，以重叠滑窗的方式裁剪成300×300大小的切片，共计1171张，作为原始的训练集A。然后针对原始训练集A中的每张切片进行灰度化处理，提取其第一个通道图像的LBP特征，与其余两个通道图像在通道维度进行拼接融合，得到的新的三通道图像作为训练样本，标注样本中的目标位置，作为训练标签，得到新的训练集A’。从MiniSAR数据集选取3幅图像，按照同样的方式得到293张切片作为原始测试集B，再经过LBP特征提取与融合后，标注目标位置，得到新的测试集B’。

如图2所示，针对原始SAR图像切片中的每个像素点，依次在其半径为2的领域内采集16个采样点的，计算这16个采样点的像素值的方差VAR_P,R，作为该像素点的LBP特征值：

遍历每个像素点，计算其LBP特征值，从而获得原始SAR图像切片对应的LBP特征图，如图3所示，将其中每个像素点的LBP特征值缩放至[0,225]这个区间内，并与原始SAR图像切片另外两个通道图像在通道维度拼接融合，形成新的三通道图像，即得到新的训练样本与测试样本。

步骤2、构建一个Yolov5，然后在骨干网络(backone)的C3模块中将Bottleneck的第二个卷积替换为可变形卷积DCN，在特征金字塔中，使用上采样算子CARAFE进行特征上采样，最后在头部结构(head)的三个预测特征层中使用自适应特征融合ASFF模块增强特征表达，得到改进的Yolov5模型，如图4所示。

步骤2.1、Yolov5中的C3模块包括3个Conv模块和1个Bottleneck模块，Bottleneck模块包括两个连续的卷积和一个残差连接，本方法将Bottleneck的第二个卷积替换为可变形卷积DCN，如图5所示。

所述可变形卷积DCN首先对输入特征图进行一次卷积操作，得到一组卷积核偏移的特征图，这个偏移的特征图尺寸和输入特征图的尺寸相同，通道数为3N，其中N为卷积核的像素个数，3表示卷积核在x轴、y轴方向上的偏移量(x,y)以及偏移量(x,y)的权重参数△m。如图6所示，输入特征图x中初始位置为p₀的像素点x(p₀)经过可变形卷积后的输出为：

其中，w为卷积核的权重参数，Z表示为卷积区域，Z＝{(-1,-1),(-1,0),....,(0,1),(1,1)}，其中(-1,-1)表示距离x(p₀)左方和下方一个单位长度的位置，(1,1)表示距离x(p₀)右方和上方一个单位长度的位置。Δp_n为可学习偏移量参数，△m∈[0,1]。

步骤2.2、如图7所示，上采样算子CARAFE基于特征的内容感知重组对特征图进行上采样操作，包括上采样核预测模块和特征重组模块。

所述上采样核预测模块包括通道压缩、内容编码与上采样核预测、上采样核归一化三部分。对于大小为H×W×C的输入特征图，上采样核预测模块首先通过1×1的卷积将其通道数由C压缩至C_m，以减小后续的计算量。然后使用输入通道数为C_m、输出通道数为大小为3的卷积进行内容编码，之后使用像素混洗操作，将通道维在空间维展开，得到形状为/>的上采样核。最后对上采样核使用SoftMax进行归一化，完成上采样核预测。

所述特征重组模块输出大小为σH×σW×C的输出特征图。对于输出特征图中的每个位置l'＝(i',j')，将其K_up×K_up大小的邻域与其对应的上采样核进行点积运算，映射回原特征图l＝(i,j)中，i＝i'/σ,j＝j'/σ。

在本实施例中，设置C_m＝64、上采样倍率σ＝2、上采样核尺寸K_up＝5。

步骤2.3、如图8所示，针对头部结构预测特征层中三个不同层级的特征图，依次在各自的层级与其他两个层级的特征图进行加权求和，使得特征表达更加完整，如图8所示：

其中表示第l个层级的融合结果，l＝1,2,3。/>分别表示来自第1～3层级的特征，是由/>经过上采样或下采样后经过1×1卷积得到的与第l层级特征图大小相同、通道数相同的特征图。/>表示对应的融合空间权重，由网络自动训练得到，从而实现自适应的特征融合，且/>

步骤3、将步骤1所得的新训练集中的样本输入步骤2构建的改进的Yolov5模型中，进行网络训练。本实施例使用的软件平台为WIN10操作系统和Pytorch1.8.1，硬件配置为i9-13900K CPU和NVIDIA GeForce RTX 3090GPU。设置训练轮数为300，batch-size为64，采用CIOU Loss作为边界框回归的损失函数，使用随机梯度下降SGD优化器实现模型参数优化，学习率lr设置为0.001，IOU阈值设置为0.5。

所述CIOU Loss损失函数为：

其中，A∩B为A边界框与B边界框的交集面积，A∪B为并集面积。w_A和h_A分别表示边界框A的宽度与高度，w_B和h_B分别表示边界框B的宽度与高度，ρ²(A,B)为两个框中心点的距离，c为两个边界框的对角线长度。

步骤4、将新测试集B’中的样本输入步骤3训练后的模型中，比较模型输出的预测结果与标签，计算模型性能指标：

其中，TP表示实际正类被预测为正类的数量；FP表示实际负类被预测为正类的数量；FN表示实际正类被预测为负类的数量；P(R)表示Precision-Recall曲线。

为验证本方法的有效性，在本实施例中选取了单阶段目标检测算法YOLOV3、RetinaNet、SSD，以及双阶段目标检测算法Faster-RCNN、Cascade-RCNN、Grid-RCNN以及Libra-RCNN进行了对比实验，测试参数置信度阈值设为0.5，IOU阈值设为0.5。对比算法基于MMDetection工具实现，网络结构如表1所示：

表1

将检测结果可视化到了测试图像上，如图9所示，其中实线矩形框表示检测正确的目标，虚线矩形框为虚警，圆圈为漏检。具体的性能指标比较结果如表2所示：

表2

从表2的数据可以看出，本方法的Precision、mAP、F1数值都达到了最优。从图9的检测结果也可以看出，Cascade-RCNN、Libra-RCNN、Grid-RCNN、Libra-RCNN、RetinaNet这五种方法都造成了大量的虚警，YOLOV3虚警相对较少，但存在漏检。而本方法的虚警数量为3个，远小于其他方案，同时不存在漏检目标，说明本方法有效提高了SAR图像的检测性能。

Claims

1.基于LBP特征与改进Yolov5的雷达图像检测方法，其特征在于：该方法具体包括以下步骤：

步骤1、收集SAR图像，灰度化处理后裁剪为相同大小的切片；针对每张切片提取其中一个通道图像的LBP特征，然后与其余两个通道图像在通道维度进行拼接融合，得到的新的三通道图像作为训练样本；标注样本中的目标位置，作为训练标签；

步骤2、构建一个Yolov5，然后在骨干网络的C3模块中将Bottleneck的第二个卷积替换为可变形卷积DCN；在特征金字塔中，使用上采样算子CARAFE进行特征上采样，最后在头部结构的三个预测特征层中使用自适应特征融合ASFF模块，得到改进的Yolov5模型；

步骤3、将步骤1所得的训练样本输入步骤2构建的改进的Yolov5模型中，根据模型输出计算边界框回归损失，优化模型参数；

2.如权利要求1所述基于LBP特征与改进Yolov5的雷达图像检测方法，其特征在于：针对图像中的每个像素点，依次计算其局部LBP特征值VAR_P,R，得整个图像的LBP特征：

3.如权利要求2所述基于LBP特征与改进Yolov5的雷达图像检测方法，其特征在于：设置邻域半径R＝2，采样点数量P＝16。

4.如权利要求1所述基于LBP特征与改进Yolov5的雷达图像检测方法，其特征在于：所述可变形卷积DCN首先对输入特征图进行一次卷积操作，输入特征图中初始位置为p₀的像素点x(p₀)经过可变形卷积后的输出为：

其中，w为卷积核的权重参数，Z表示为卷积区域；Δp_n为可学习的偏移量参数，△m表示卷积核偏移量的权重参数，△m∈[0,1]。

5.如权利要求1所述基于LBP特征与改进Yolov5的雷达图像检测方法，其特征在于：所述上采样算子CARAFE包括上采样核预测模块和特征重组模块；

所述上采样核预测模块对于大小为H×W×C的输入特征图，首先通过1×1的卷积将其通道数由C压缩至C_m，然后使用输入通道数为C_m、输出通道数为大小为3的卷积进行内容编码，之后使用像素混洗操作，将通道维在空间维展开，得到形状为/>的上采样核；最后对上采样核使用SoftMax进行归一化，完成上采样核预测；

所述特征重组模块输出大小为σH×σW×C的输出特征图，对于输出特征图中的每个位置l'＝(i',j')，将其K_up×K_up大小的邻域与其对应的上采样核进行点积运算，映射回原特征图l＝(i,j)中，i＝i'/σ,j＝j'/σ。

6.如权利要求5所述基于LBP特征与改进Yolov5的雷达图像检测方法，其特征在于：设置C_m＝64、上采样倍率σ＝2、上采样核尺寸K_up＝5。

7.如权利要求1所述基于LBP特征与改进Yolov5的雷达图像检测方法，其特征在于：所述自适应特征融合ASFF模块针对头部结构预测特征层中三个不同层级的特征图，依次在各自的层级与其他两个层级的特征图进行加权求和：

其中表示第l个层级的融合结果，l＝1,2,3；/>分别表示来自第1～3层级的特征，是由/>经过上采样或下采样后经过1×1卷积得到的与第l层级特征图大小相同、通道数相同的特征图；/>表示对应的融合空间权重，由网络自动训练得到，/>

8.如权利要求1所述基于LBP特征与改进Yolov5的雷达图像检测方法，其特征在于：在步骤3中，设置训练轮数为300，batch-size为64，采用CIOU Loss作为边界框回归的损失函数，使用随机梯度下降SGD优化器实现模型参数优化，学习率lr设置为0.001，IOU阈值设置为0.5。

9.一种计算机可读存储介质，其上存储有计算机程序，当所述计算机程序在计算机中执行时，令计算机执行权利要求1～8中任一项所述的方法。