CN116563800A

CN116563800A - 基于轻量化YOLOv3的隧道内车辆检测方法及系统

Info

Publication number: CN116563800A
Application number: CN202310463003.8A
Authority: CN
Inventors: 白慧慧; 张一多
Original assignee: Beijing Jiaotong University
Current assignee: Beijing Jiaotong University
Priority date: 2023-04-26
Filing date: 2023-04-26
Publication date: 2023-08-08

Abstract

本发明提供一种基于轻量化YOLOv3的隧道内车辆检测方法及系统，属于目标检测技术领域，采集隧道内车辆图像构建数据集tunnel_img；基于YOLOv3算法，将Backbone替换成轻量化模型MobileNetV2，减小网络模型的体积，提升检测速度；在此基础上，添加高效通道注意力模块ECA，增加网络视野，对重要特征进行强化来提升隧道场景检测准确率。本发明训练后的模型在保证检测效果的前提下，体积参数远小于基础模型，能够在计算力不强，存储能力有限的隧道终端上部署应用，相较与之前传统的虚拟检测区域的技术，本发明可以快速识别检测对象，提高检测效率和部署数量。

Description

基于轻量化YOLOv3的隧道内车辆检测方法及系统

技术领域

本发明涉及目标检测技术领域，具体涉及一种基于轻量化YOLOv3的隧道内车辆检测方法及系统。

背景技术

高速公路隧道作为高速公路网的咽喉地段，高速公路隧道安全问题逐渐引起社会的广泛重视。由于高速公路隧道里程长，车速快，出入隧道口光线差大等问题，导致高度公路隧道安全问题频发。如何解决高速公路隧道安全问题，为人们提供一个安全舒适、方便快捷、经济高效、畅通无阻的交通出行环境，日益成为高速公路运营管理单位关注的焦点。

在高速公路隧道视频监控中，传统的视频检测算法，主要是基于虚拟检测区域的技术。这是交通流视频检测中最为根本的技术。这代还处于简单的模拟环形线圈检测器检测交通流信息的方式检测，通过在视频图像的特定位置来设定检测线圈区域，达到模拟的效果。这代算法仍存在着弊端：准确率不高。针对整段公路的视频检测，不能专门针对高速公路隧道进行优化。算法体积较大，对于边缘设备不容易部署。

发明内容

本发明的目的在于提供一种减少权重网络的参数量、缩小算法内存体积、提升目标识别率的基于轻量化YOLOv3的隧道内车辆检测方法及系统，以解决上述背景技术中存在的至少一项技术问题。

为了实现上述目的，本发明采取了如下技术方案：

一方面，本发明提供一种基于轻量化YOLOv3的隧道内车辆检测方法，包括：

获取隧道场景图片；

利用预先训练好的检测模型对获取的隧道场景图片进行处理，识别图片中的车辆；其中，所述预先训练好的检测模型的训练包括：

获取隧道场景下车辆的图像，对收集的图像作预处理，制作数据集；

搭建YOLOv3的骨干网络DarkNet53及Head的网络结构；替换主干网络，添加注意力机制，得到改进后的MobileNet-ECA-YOLOv3网络模型。

利用数据集训练改进后的MobileNet-ECA-YOLOv3网络模型，直到损失函数收敛，保留最优权重文件。

优选的，通过隧道内摄像头获取隧道内车辆图像，经过LabelImg处理后获取标注label的txt格式，制作数据集。

优选的，搭建YOLOv3的骨干网络DarkNet53及Head的网络结构包括：主干网络由1个卷积跟5个残差结构构成，残差结构包含残差数量为1，2，8，8，4；经过主干网络特征提取后，特征融合，并输出。

优选的，输入特征在残差结构中，首先经过大小为1x1的卷积核进行卷积操作压缩特征，减少输入特征的通道数，再经过批量归一化操作以及利用ReLU激活函数进行激活，然后再进行第二次卷积操作，利用大小为3x3的滤波器进行卷积操作扩充特征，增加特征的通道数，再经过批量归一化操作以及ReLU激活，将输入特征跟经过两次卷积操作后输出的特征图叠加，作为最终特征进行输出。

优选的，利用数据集迭代目标检测模型，从最后获得的权重文件中选取最高模型作为结果。

优选的，注意力机制包括：将输入的特征图进行全局平均池化操作；进行卷积核大小为k的1维卷积操作，并经过Sigmoid激活函数得到各个通道的权重w；将权重与原始输入特征图对应元素相乘，得到最终输出特征图。

第二方面，本发明提供一种基于轻量化YOLOv3的隧道内车辆检测系统，包括：

获取模块，用于获取隧道场景图片；

检测模块，用于利用预先训练好的检测模型对获取的隧道场景图片进行处理，识别图片中的车辆；其中，所述预先训练好的检测模型的训练包括：

第三方面，本发明提供一种非暂态计算机可读存储介质，所述非暂态计算机可读存储介质用于存储计算机指令，所述计算机指令被处理器执行时，实现如上所述的基于轻量化YOLOv3的隧道内车辆检测方法。

第四方面，本发明提供一种计算机程序产品，包括计算机程序，所述计算机程序当在一个或多个处理器上运行时，用于实现如上所述的基于轻量化YOLOv3的隧道内车辆检测方法。

第五方面，本发明提供一种电子设备，包括：处理器、存储器以及计算机程序；其中，处理器与存储器连接，计算机程序被存储在存储器中，当电子设备运行时，所述处理器执行所述存储器存储的计算机程序，以使电子设备执行实现如上所述的基于轻量化YOLOv3的隧道内车辆检测方法的指令。

本发明有益效果：基于隧道场景自建数据集tunnel_img，可以更具体的针对使用场景进行优化；轻量化YOLOv3算法相比较修改前具有参数计算量更少，体积更小，识别更快的优点，可以轻松嵌入隧道内边缘设备，节省资源，并通过添加ECANet注意力机制，提高识别准确率，可以满足多数情况下的识别要求。

本发明附加方面的优点，将在下述的描述部分中更加明显的给出，或通过本发明的实践了解到。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例所述的MobileNetv2网络压缩示意图。

图2为本发明实施例所述的高效通道注意力模块ECA融入主干网络示意图。

图3为本发明实施例所述的高效通道注意力模块ECA网络结构示意图。

图4为本发明实施例所述的各个算法模型在mAP0.5指标上的对比图。

图5为本发明实施例所述的各个算法模型在mAP0.5:0.95指标上的对比图。

图6为本发明实施例所述的MobileNet-ECA-YOLOv3算法检测结果图。

具体实施方式

下面详细叙述本发明的实施方式，所述实施方式的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过附图描述的实施方式是示例性的，仅用于解释本发明，而不能解释为对本发明的限制。

本技术领域技术人员可以理解，除非另外定义，这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。

还应该理解的是，诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义，并且除非像这里一样定义，不会用理想化或过于正式的含义来解释。

本技术领域技术人员可以理解，除非特意声明，这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是，本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件，但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件和/或它们的组。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。而且，描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

为便于理解本发明，下面结合附图以具体实施例对本发明作进一步解释说明，且具体实施例并不构成对本发明实施例的限定。

本领域技术人员应该理解，附图只是实施例的示意图，附图中的部件并不一定是实施本发明所必须的。

实施例1

本实施例1中，首先提供了一种基于轻量化YOLOv3的隧道内车辆检测系统，该系统包括：获取模块，用于获取隧道场景图片；检测模块，用于利用预先训练好的检测模型对获取的隧道场景图片进行处理，识别图片中的车辆；其中，所述预先训练好的检测模型的训练包括：获取隧道场景下车辆的图像，对收集的图像作预处理，制作数据集；搭建YOLOv3的骨干网络DarkNet53及Head的网络结构；替换主干网络，添加注意力机制，得到改进后的MobileNet-ECA-YOLOv3网络模型；利用数据集训练改进后的MobileNet-ECA-YOLOv3网络模型，直到损失函数收敛，保留最优权重文件。

本实施例中，利用上述的系统，实现了基于轻量化YOLOv3的隧道内车辆检测方法，包括：利用获取模块获取隧道场景图片；利用监检测模块基于预先训练好的检测模型对获取的隧道场景图片进行处理，识别图片中的车辆；其中，所述预先训练好的检测模型的训练包括：获取隧道场景下车辆的图像，对收集的图像作预处理，制作数据集；搭建YOLOv3的骨干网络DarkNet53及Head的网络结构；替换主干网络，添加注意力机制，得到改进后的MobileNet-ECA-YOLOv3网络模型。利用数据集训练改进后的MobileNet-ECA-YOLOv3网络模型，直到损失函数收敛，保留最优权重文件。

其中，通过隧道内摄像头获取隧道内车辆图像，经过LabelImg处理后获取标注label的txt格式，制作数据集。搭建YOLOv3的骨干网络DarkNet53及Head的网络结构包括：主干网络由1个卷积跟5个残差结构构成，残差结构包含残差数量为1，2，8，8，4；经过主干网络特征提取后，特征融合，并输出。输入特征在残差结构中，首先经过大小为1x1的卷积核进行卷积操作压缩特征，减少输入特征的通道数，再经过批量归一化操作以及利用ReLU激活函数进行激活，然后再进行第二次卷积操作，利用大小为3x3的滤波器进行卷积操作扩充特征，增加特征的通道数，再经过批量归一化操作以及ReLU激活，将输入特征跟经过两次卷积操作后输出的特征图叠加，作为最终特征进行输出。

利用数据集迭代目标检测模型，从最后获得的权重文件中选取最高模型作为结果。

其中，注意力机制包括：将输入的特征图进行全局平均池化操作；进行卷积核大小为k的1维卷积操作，并经过Sigmoid激活函数得到各个通道的权重w；将权重与原始输入特征图对应元素相乘，得到最终输出特征图。

实施例2

本实施例2中，提供了一种基于轻量化YOLOv3的隧道内车辆检测方法，包括如下步骤：

步骤(1)：制作数据集。

步骤(2)：搭建YOLOv3的骨干网络及多尺度特征融合的网络结构。

步骤(3)：在原网络结构上，通过两种方法对网络结构进行改进，得到改进后的MobileNet-ECA-YOLOv3网络模型。

步骤(4)：训练改进后的网络模型，保留权重文件。

步骤(5)：使用新模型对隧道场景的车辆进行检测，获得检测结果。

在步骤(1)中，采用了7121张图片作为训练数据集，对图片中汽车进行标注，并形成txt文件。

在步骤(2)中，随着网络的逐渐加深，会出现梯度消失或梯度爆炸的问题，为了能够有效的解决这个问题，在Darknet53的骨干网络中一共添加了5组残差结构，其中每一个残差结构包含的残差块分别为1个，2个，8个，8个，4个，这正好对应网络的所有残差，利用这种残差模块的组合，减小了梯度爆炸的风险，也增强了网络的学习能力。输入特征在这种残差结构中，首先经过大小为1x1的卷积核进行卷积操作压缩特征，减少输入特征的通道数，再经过批量归一化操作以及利用ReLU激活函数进行激活，然后再进行第二次卷积操作，这时利用大小为3x3的滤波器进行卷积操作扩充特征，增加特征的通道数，同样再经过批量归一化操作以及ReLU激活，将输入特征跟经过这两次卷积操作后输出的特征图叠加，作为最终特征进行输出；

输入特征在通过Darknet53骨干网络时，首先进行的是一个3x3的常规卷积操作，而后再分别通过5组叠加的残差块，每个残差块分别包含1、2、8、8、4个S21所说的残差网络结构，每相邻的两个残差块之间需要进行下采样连接，通过卷积核尺寸为3x3，步长为2的卷积操作来实现；

YOLOv3有3个尺度的输出，对于Darknet53网络结构，分别取第3、4、5组残差块的输出，用来当作多尺度融合特征提取网络的输入，将尺寸为1x1和3x3的卷积核用于多尺度特征融合提取网络中，通过上采样的方式同前一组残差块的输出进行融合，最后输出3个不同的尺度的特征图，分别为52×52，26×26，13×13。都是奇数，这使得输出的特征图网格一定会有个中心位置。同时，YOLOv3输出的这3个尺度，每个尺度之间都有联系，比如说，13×13这个尺度的输出一般用于检测大型物体，对应的26×26这个尺度一般检测中型目标，而52×52的尺度一般用于检测小型目标。

在步骤(3)中，考虑到检测场景固定且单一，为了优化网络模型，提高运行速度，降低系统负担，故针对Darknet53网络结构提出改进策略，更换BackBone为MobileNetv2网络。MobileNetv2网络的特点：

MobileNetv2网络采用深度可分离卷积，通过1*1conv卷积层+ReLU层将维度从k维增加到t*k维，丰富特征数量，进而提高精度。之后通过3*3conv卷积层+ReLU可分离卷积对图像进行降采样，此时特征维度已经为t*k维度，最后通过1*1conv卷积层(无ReLU)进行降维，维度从t*k降低到k维。如图1所示。

替换后的网络，模型体积更为轻量化，与此同时带来问题，mAP下降较为严重，MobileNet-YOLOv3相比YOLOv3的mAP下降4％，针对该问题，在网络模型结构中融入高效通道注意力模块ECA，用以提高主干网络捕获特征信息的能力，具体融入位置如图2所示。

高效通道注意力机制ECA采用不降维的局部跨信道交互策略，通过一维卷积有效避免了维度缩减带来的副作用，在采用极少参数量的同时保持性能，示意图如图3所示。高效通道注意力模块ECA处理过程如下：

将输入特征图进行全局平均池化操作；

进行卷积核大小为k的1维卷积操作，并经过Sigmoid激活函数得到各个通道的权重w；

将权重与原始输入特征图对应元素相乘，得到最终输出特征图。

在步骤(4)中，设置模型的训练参数，训练120epochs(迭代)，32batch-size，img大小640，观察损失函数曲线，收敛后，保存best.pt。

实验证明：

本实施例2中公开的轻量化YOLOv3隧道内车辆检测模型算法，主要是针对YOLOv3的网络结构做出改进，提出轻量化算法MobileNet-ECA-YOLOv3。为了证明MobileNet-ECA-YOLOv3在综合性能上的优越性，本实施例2中将MobileNet-ECA-YOLOv3与YOLOv3，YOLOv3-tiny和MobileNet-YOLOv3在各项数据上进行了对比，训练条件为120epochs，32batch-size，640img，训练过程如图4、图5所示。图4中，由图中最右端线条的端点处，从上到下依次为mobilenetv2-eca、yolov3、mobilenetv2-yolo、yolov3-tiny。图5中，由最右端线条的端点处，从上到下依次为yolov3、mobilenetv2-eca、mobilenetv2-yolo、yolov3-tiny。

通过实验可得，MobileNet-ECA-YOLOv3的参数量是YOLOv3的4.5％，是YOLOv3-tiny的54.2％。检测效果几乎相同，甚至在mAP0.5指标上比YOLOv3多2.1％，证明MobileNet-ECA-YOLOv3算法基于隧道车辆数据集上能够达到有效的检测结果，并具备明显的轻量化优势。如下表1所示。

表1

实施例3

本实施例3提供一种非暂态计算机可读存储介质，所述非暂态计算机可读存储介质用于存储计算机指令，所述计算机指令被处理器执行时，实现如上所述的基于轻量化YOLOv3的隧道内车辆检测方法，该方法包括：

获取隧道场景图片；

搭建YOLOv3的骨干网络DarkNet53及Head的网络结构；替换主干网络，添加注意力机制，得到改进后的MobileNet-ECA-YOLOv3网络模型；

实施例4

本实施例4提供一种计算机程序产品，包括计算机程序，所述计算机程序当在一个或多个处理器上运行时，用于实现如上所述的基于轻量化YOLOv3的隧道内车辆检测方法，该方法包括：

获取隧道场景图片；

实施例5

本实施例5提供一种电子设备，包括：处理器、存储器以及计算机程序；其中，处理器与存储器连接，计算机程序被存储在存储器中，当电子设备运行时，所述处理器执行所述存储器存储的计算机程序，以使电子设备执行实现如上所述的基于轻量化YOLOv3的隧道内车辆检测方法的指令，该方法包括：

获取隧道场景图片；

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

上述虽然结合附图对本发明的具体实施方式进行了描述，但并非对本发明保护范围的限制，所属领域技术人员应该明白，在本发明公开的技术方案的基础上，本领域技术人员在不需要付出创造性劳动即可做出的各种修改或变形，都应涵盖在本发明的保护范围之内。

Claims

1.一种基于轻量化YOLOv3的隧道内车辆检测方法，其特征在于，包括：

获取隧道场景图片；

2.根据权利要求1所述的基于轻量化YOLOv3的隧道内车辆检测方法，其特征在于，通过隧道内摄像头获取隧道内车辆图像，经过LabelImg处理后获取标注label的txt格式，制作数据集。

3.根据权利要求1所述的基于轻量化YOLOv3的隧道内车辆检测方法，其特征在于，搭建YOLOv3的骨干网络DarkNet53及Head的网络结构包括：主干网络由1个卷积跟5个残差结构构成，残差结构包含残差数量为1，2，8，8，4；经过主干网络特征提取后，特征融合，并输出。

4.根据权利要求3所述的基于轻量化YOLOv3的隧道内车辆检测方法，其特征在于，输入特征在残差结构中，首先经过大小为1x1的卷积核进行卷积操作压缩特征，减少输入特征的通道数，再经过批量归一化操作以及利用ReLU激活函数进行激活，然后再进行第二次卷积操作，利用大小为3x3的滤波器进行卷积操作扩充特征，增加特征的通道数，再经过批量归一化操作以及ReLU激活，将输入特征跟经过两次卷积操作后输出的特征图叠加，作为最终特征进行输出。

5.根据权利要求1所述的基于轻量化YOLOv3的隧道内车辆检测方法，其特征在于，利用数据集迭代目标检测模型，从最后获得的权重文件中选取最高模型作为结果。

6.根据权利要求1所述的基于轻量化YOLOv3的隧道内车辆检测方法，其特征在于，注意力机制包括：将输入的特征图进行全局平均池化操作；进行卷积核大小为k的1维卷积操作，并经过Sigmoid激活函数得到各个通道的权重w；将权重与原始输入特征图对应元素相乘，得到最终输出特征图。

7.一种基于轻量化YOLOv3的隧道内车辆检测系统，其特征在于，包括：

获取模块，用于获取隧道场景图片；

8.一种非暂态计算机可读存储介质，其特征在于，所述非暂态计算机可读存储介质用于存储计算机指令，所述计算机指令被处理器执行时，实现如权利要求1-6任一项所述的基于轻量化YOLOv3的隧道内车辆检测方法。

9.一种计算机程序产品，其特征在于，包括计算机程序，所述计算机程序当在一个或多个处理器上运行时，用于实现如权利要求1-6任一项所述的基于轻量化YOLOv3的隧道内车辆检测方法。

10.一种电子设备，其特征在于，包括：处理器、存储器以及计算机程序；其中，处理器与存储器连接，计算机程序被存储在存储器中，当电子设备运行时，所述处理器执行所述存储器存储的计算机程序，以使电子设备执行实现如权利要求1-6任一项所述的基于轻量化YOLOv3的隧道内车辆检测方法的指令。