CN116740342A

CN116740342A - 改进YOLO v8的毫米波图像目标检测与识别方法

Info

Publication number: CN116740342A
Application number: CN202310704658.XA
Authority: CN
Inventors: 宋裕曼; 孟杨; 华金铭; 孙懿; 杨帆行; 刘笑言; 胡佳峻; 张玺
Original assignee: Chongqing University of Post and Telecommunications
Current assignee: Chongqing University of Post and Telecommunications
Priority date: 2023-06-14
Filing date: 2023-06-14
Publication date: 2023-09-12

Abstract

本发明涉及一种改进YOLOv8的毫米波图像目标检测与识别方法，属于图像处理技术领域。该系统包括以下步骤：通过将获取的毫米波图像输入到预训练过的改进YOLOv8神经网络中；在输出层获得目标位置和类别信息，并进行目标检测与识别；根据目标信息生成相应的检测结果，包括目标类别、坐标、置信度，实现对目标的高效检测和准确识别。该系统具有检测速度快、精度高等优点。

Description

改进YOLO v8的毫米波图像目标检测与识别方法

技术领域

本发明属于图像处理技术领域，涉及改进YOLOv8的毫米波图像目标检测与识别方法。

背景技术

当前常见的毫米波目标检测方法主要是基于传统的特征提取和分类算法，其精度受限且需要大量的计算资源。同时，基于深度学习的目标检测方法在可见光图像领域已经得到广泛应用，但在毫米波图像中存在着较大差异，需要针对性地进行网络结构设计和预训练。

发明内容

有鉴于此，本发明的目的在于提供一种改进YOLOv8的毫米波图像目标检测与识别方法。

为达到上述目的，本发明提供如下技术方案：

一种改进YOLOv8的毫米波图像目标检测与识别方法，包括以下步骤：

S1：获取毫米波图像

S11：使用雷达芯片通过发射和接收低功率的调频连续(FMCW)毫米波，主动获得目标的空间位置、速度、反射强度等信息。

设置相应的毫米波雷达参数，如工作频率f、距离分辨率ΔR和方向角度θ等。根据雷达方程可计算所需的最小可检测功率P_min：

其中，P_t为发射功率；G_t和G_r分别为发射和接收天线增益；λ为波长；σ为目标雷达截面积；R为距离；L为系统损耗。

S12：使用RMA成像算法获得毫米波雷达三维成像流程如下：

S121：获取四维回波数据s(x_m,x_n,z,k)；

S122：对四维回波数据沿扫描方向(x_m,x_n,k)做三维傅里叶变换，得到四维波数域；

S123：对波数域回波数据进行插值及维度转换，得到三维波数域图像重构数据；

S124：三维波数域回波数据做三维傅里叶逆变换，得到最终三维图像重构数据。

雷达板采集到的原始数据通过以太网获取原生的雷达数据，假设雷达采样位置为(x,y,0)，待成像目标空间坐标为(x',y',z₀)，目标反射率为p(x',y')，则雷达接收到的后向散射数据为：

R表示收发天线的中心位置到目标的距离，目标到雷达的平均距离为z₀。上式中R^-2可以使用(z₀R)^-1替代，对于静止目标，z₀为常数可以忽略。最终接收到的数据可以近似表示为：

球面波可认为是平面波的叠加，则:

其中：

所以,

改变积分顺序可以发现对应反射率函数的二维傅里叶变换，即FT_2D[p(x,y)]＝p(k_x,k_y)，而/>又表示二维傅里叶逆变换。所以

则可以重构二维目标反射率：

S13：将预处理后的数据转换为图像格式(如PNG或JPEG)，得到毫米波图像。首先对数据进行幅度和相位的计算，然后将幅度数据映射到灰度值范围(0-255)，得到最终的毫米波图像。

S2：改进YOLO v8神经网络结构

S21：骨干网络替换：采用轻量级骨干网络ShuffleNet替代Darknet53。ShuffleNet网络引入了Shuffle模块，降低了计算量和参数量，提高模型效率和精度。具体地，Shuffle模块通过分组卷积和通道重排操作来减小计算量并提高特征表达能力。在分组卷积中，输入通道被分为多个组，每个组内进行独立的卷积操作，从而减少计算量。通道重排操作则是在卷积操作之后增加通道混洗，提高模型的特征表达能力。

S22：后处理算法优化：改进YOLOv8的后处理算法采用非极大值抑制(NMS)算法来对重叠的目标进行筛选，同时引入像素点修正方法，可以提高模型的准确率和鲁棒性。具体地，像素点修正方法根据图像局部梯度信息对目标框坐标进行调整，使其更接近理想边界。

S2：图像预处理与特征提取

S21：对获取到的毫米波图像进行预处理，如缩放、裁剪、颜色空间转换等操作，使其符合改进YOLO v8输入要求。例如，将图像缩放至网络所需的固定尺寸(如416×416，640×640)。

S22：将预处理后的图像输入到改进后的YOLO v8神经网络中，利用ShuffleNet骨干网络提取特征信息。基于卷积、激活和池化等操作，逐层计算网络输出。

S23：利用YOLO v8的多尺度特征融合机制，通过上采样和跳级连接等方法，将不同深度的特征图进行融合，从而增强检测性能。具体地，可以采用以下公式：

其中，F(x)为融合后的特征图；U为上采样操作；α为权重参数；F_l(x)和F_s(x)分别表示深层和浅层特征图；表示特征融合操作(如相加或拼接)。

S3：目标检测与识别

S31：将网络输出按照预定义的锚框形状进行解码，得到候选目标框和置信度。这一步通常包括计算预测边界框的中心坐标、宽高以及类别置信度。具体计算公式如下：

b_x＝σ(t_x)+c_x

b_y＝σ(t_y)+c_y

b_w＝p_wexp(t_w)

b_h＝p_hexp(t_h)

Pr(Class_i|Object)＝σ(t_ci)

其中，b_x、b_y、b_w、b_h分别为预测边界框的中心坐标和宽高；t_x、t_y、t_w、t_h为网络输出值；c_x、c_y为锚框的中心坐标；p_w、p_h为锚框的宽高；σ为Sigmoid函数；t_ci表示第i类的类别置信度；Pr(Class_i|Object)为目标属于第i类的概率。

S32：对候选目标框进行筛选，剔除置信度低于阈值的目标框。例如，若置信度阈值设为0.5，则只保留置信度大于等于0.5的目标框。

S33：应用非极大值抑制(NMS)算法对筛选后的目标框进行进一步优化。计算目标框之间的IoU(交并比)，如果某个目标框与其他高置信度目标框的IoU大于预定阈值(如0.5)，则认为该目标框是冗余的，将其移除。

S34：对优化后的目标框应用像素点修正方法，根据图像局部梯度信息对目标框坐标进行调整，使其更接近理想边界。具体地，通过计算邻域内梯度最大值的方向来调整目标框边缘坐标。

S4：输出最终的检测结果，包括目标框位置、大小和类别信息。此时，毫米波图像中的目标已经被成功检测和识别。

本发明通过引入轻量级骨干网络ShuffleNet，并优化YOLO v8神经网络结构，提高了毫米波图像目标检测与识别的精度和效率。同时，采用非极大值抑制(NMS)和像素点修正方法对检测结果进行优化，进一步提高模型的准确性和鲁棒性。本发明适用于无人驾驶、安防监控等领域，具有广泛的应用前景。

本发明的有益效果在于：

1.速度快：相比于其他目标检测算法，YOLO识别速度快，能够在GPU上实时进行目标检测。基于YOLO的实时目标检测准确率高，检测速度可达每秒xx帧。

2.准确率高：采用了全卷积神经网络，通过对整个图像进行一次前向传播可以直接得到目标存在的概率和位置信息，相对于R-CNN系列方法如果将其检测与回归的多个步骤合并，并且与毫米波雷达检测结合利用广泛的电磁波频段，扫描人体或物品外部的电磁波反射信号来检测内部的物质和构造。相比传统的金属检测器，更准确地检测到被隐藏在人体或物品内部的非金属和低密度物质，能够实现相似甚至更好的检测精度。

3.一般化：YOLO能够处理多种尺寸的图像、多种尺寸和比例的目标，并且能够在复杂的环境中检测物体。

4.自适应：YOLO能够通过自我在线学习来增强自己的检测能力，比如在新的场景下和新的物体上进行检测。

5.不依赖传统的图像分割、目标检测等技术：YOLO算法不需要预先将图像中的物体进行分割，它将整幅图像作为输入，直接输出各个物体在图像中的类别和位置信息。

本发明的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述，并且在某种程度上，基于对下文的考察研究对本领域技术人员而言将是显而易见的，或者可以从本发明的实践中得到教导。本发明的目标和其他优点可以通过下面的说明书来实现和获得。

附图说明

为了使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明作优选的详细描述，其中：

图1为本申请实施例中提供的一种改进YOLO v8的毫米波图像目标检测与识别方法的流程示意图。

图2为本发明基于改进YOLO v8的毫米波图像目标检测与识别方法的训练模型中对输入为菜刀的测试结果图。

图3为本发明基于改进YOLO v8的毫米波图像目标检测与识别方法的训练模型中对输入为锅铲的测试结果图。

图4为本发明基于改进YOLO v8的毫米波图像目标检测与识别方法的训练模型中对输入为剪刀的测试结果图。

图5为本发明基于改进YOLO v8的毫米波图像目标检测与识别方法的训练模型中对输入为长尖刀的测试结果图。

图6为本发明基于改进YOLO v8的毫米波图像目标检测与识别方法的训练模型中对输入为水果刀的测试结果图。

具体实施方式

以下通过特定的具体实例说明本发明的实施方式，本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用，本说明书中的各项细节也可以基于不同观点与应用，在没有背离本发明的精神下进行各种修饰或改变。需要说明的是，以下实施例中所提供的图示仅以示意方式说明本发明的基本构想，在不冲突的情况下，以下实施例及实施例中的特征可以相互组合。

其中，附图仅用于示例性说明，表示的仅是示意图，而非实物图，不能理解为对本发明的限制；为了更好地说明本发明的实施例，附图某些部件会有省略、放大或缩小，并不代表实际产品的尺寸；对本领域技术人员来说，附图中某些公知结构及其说明可能省略是可以理解的。

本发明实施例的附图中相同或相似的标号对应相同或相似的部件；在本发明的描述中，需要理解的是，若有术语“上”、“下”、“左”、“右”、“前”、“后”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此附图中描述位置关系的用语仅用于示例性说明，不能理解为对本发明的限制，对于本领域的普通技术人员而言，可以根据具体情况理解上述术语的具体含义。

请参阅图1该内容为进YOLO v8的毫米波图像目标检测与识别方法的流程示意图，具体方法如下：

a.获取毫米波图像。

1.将毫米波雷达设置为60GHz工作频率，距离分辨率为5cm，方向角度范围为360度。

2.通过毫米波雷达扫描目标区域，获取一组距离和方向上的强度值数据，利用全息重建算法得到目标的距离方向上投影后的毫米波图像。

3.应用高斯滤波器对原始数据进行平滑处理，去除噪声，并使用增强算法增强目标信号。

4.将预处理后的数据进行灰度化处理，并将其转换为PNG格式图像，以便后续分析和展示。

b.将图像输入到经过训练的改进的YOLO v8神经网络中。

1.通过Shuffle ghost网络的卷积和池化层，提取毫米波图像的特征表示。

2.将骨干网络提取的不同尺度的特征图与YOLO v8的特征融合层进行融合，以获取更丰富的特征信息。

3.将融合后的特征图输入YOLO v8的卷积层、激活函数和池化层，逐层计算网络输出。

c.在输出层获得目标位置和类别信息，并进行目标检测与识别。

1.根据网络输出的特征图和预定义的锚框形状，解码得到候选目标框的位置和置信度。

2.设置一个阈值，如0.5，筛选出置信度高于该阈值的候选目标框。

3.应用NMS算法，剔除重叠度较高的候选目标框，只保留最具代表性的目标框。

4.使用像素点修正方法，对目标框的位置进行微调，以提高目标框的准确性和精度。

d.根据目标信息生成相应的检测结果，包括目标类别、坐标、置信度。

1.从经过NMS处理的目标框中提取出每个目标的类别标签和置信度。

2.根据网络输出的特征图和目标框的位置信息，将目标框的坐标转换为原始图像空间的坐标。

3.将目标类别、坐标和置信度以JSON或XML格式的数据结构表示，作为最终的检测结果。

对于本实例对改进YOLO v8的毫米波图像目标检测与识别方法的模型进行训练，输入种类有5种，分别为菜刀、锅铲、剪刀、长尖刀和水果刀。关于不同输入及其对应的输出结果请参阅图2至图6。

最后说明的是，以上实施例仅用以说明本发明的技术方案而非限制，尽管参照较佳实施例对本发明进行了详细说明，本领域的普通技术人员应当理解，可以对本发明的技术方案进行修改或者等同替换，而不脱离本技术方案的宗旨和范围，其均应涵盖在本发明的权利要求范围当中。

Claims

1.改进YOLO v8的毫米波图像目标检测与识别方法，其特征在于：该方法包括以下步骤：

S1：获取毫米波图像；

S11：使用雷达芯片通过发射和接收低功率的调频连续FMCW毫米波，主动获得目标的空间位置、速度和反射强度；

设置相应的毫米波雷达参数，包括工作频率f、距离分辨率ΔR和方向角度θ；根据雷达方程计算所需的最小可检测功率P_min：

其中，P_t为发射功率；G_t和G_r分别为发射和接收天线增益；λ为波长；σ为目标雷达截面积；R为距离；L为系统损耗；

S12：使用RMA成像算法获得毫米波雷达三维成像；

R表示收发天线的中心位置到目标的距离，目标到雷达的平均距离为z₀；上式中R^-2使用(z₀R)^-1替代，对于静止目标，z₀为常数忽略不计；最终接收到的数据表示为：

球面波认为是平面波的叠加，则：

其中：

则有：

改变积分顺序发现对应反射率函数的二维傅里叶变换，即FT_2D[p(x,y)]＝p(k_x,k_y)，而/>表示二维傅里叶逆变换；则

则重构二维目标反射率：

S13：将预处理后的数据转换为图像格式，得到毫米波图像；

S2：将图像输入到经过训练的改进的YOLO v8神经网络中；

使用轻量级网络ShuffleNet替代Darknet53；改进YOLOv8的后处理算法采用非极大值抑制NMS算法来对重叠的目标进行筛选，同时引入像素点修正方法，提高模型的准确率和鲁棒性；

S21：对获取到的毫米波图像进行预处理，包括缩放、裁剪和颜色空间转换，使其符合改进YOLO v8输入要求；

S22：将预处理后的图像输入到ShuffleNet骨干网络中，提取特征信息；基于卷积、激活和池化操作，逐层计算网络输出；

S23：利用YOLO v8的多尺度特征融合机制，通过上采样和跳级连接方法，将不同深度的特征图进行融合，采用以下公式：

F(x)＝U(αF_l(x))⊕(1-α)F_s(x)

其中，F(x)为融合后的特征图；U为上采样操作；α为权重参数；F_l(x)和F_s(x)分别表示深层和浅层特征图；⊕表示特征融合操作，即相加或拼接；

S3：在输出层获得目标位置和类别信息，并进行目标检测与识别；

S31：将网络输出按照预定义的锚框形状进行解码，得到候选目标框和置信度，包括计算预测边界框的中心坐标、宽高以及类别置信度，具体计算公式如下：

b_x＝σ(t_x)+c_x

b_y＝σ(t_y)+c_y

b_w＝p_wexp(t_w)

b_h＝p_hexp(t_h)

P_r(Class_i|Object)＝σ(t_ci)

其中，b_x、b_y、b_w、b_h分别为预测边界框的中心坐标和宽高；t_x、t_y、t_w、t_h为网络输出值；c_x、c_y为锚框的中心坐标；p_w、p_h为锚框的宽高；σ为Sigmoid函数；t_ci表示第i类的类别置信度；Pr(Class_i|Object)为目标属于第i类的概率；

S32：对候选目标框进行筛选，剔除置信度低于阈值的目标框；若置信度阈值设为0.5，则只保留置信度大于等于0.5的目标框；

S33：应用非极大值抑制NMS算法对筛选后的目标框进行优化；计算目标框之间的交并比IoU，如果某个目标框与其他高置信度目标框的IoU大于预定阈值，则认为该目标框是冗余的，将其移除；

S34：对优化后的目标框应用像素点修正方法，根据图像局部梯度信息对目标框坐标进行调整，使其更接近理想边界；具体地，通过计算邻域内梯度最大值的方向来调整目标框边缘坐标；

S4：根据目标信息生成相应的检测结果，包括目标类别、坐标和置信度；

S41：在NMS处理后的目标框中，分别提取目标类别和置信度；

S42：将目标框的坐标从网络输出空间转换回原始图像空间；

S43：根据目标类别、坐标和置信度，生成检测结果。

2.根据权利要求1所述的改进YOLO v8的毫米波图像目标检测与识别方法，其特征在于：所述S12具体包括以下步骤：

S121：获取四维回波数据s(x_m,x_n,z,l)；

3.根据权利要求2所述的改进YOLO v8的毫米波图像目标检测与识别方法，其特征在于：所述S43中，检测结果以JSON或XML格式表示。