CN113177560A

CN113177560A - 一种普适性轻量级深度学习车辆检测方法

Info

Publication number: CN113177560A
Application number: CN202110459491.6A
Authority: CN
Inventors: 蔡雪莲; 罗贸峰; 左沛昂; 岳文伟; 张和和; 李长乐
Original assignee: Xidian University
Current assignee: Xidian University
Priority date: 2021-04-27
Filing date: 2021-04-27
Publication date: 2021-07-27

Abstract

本发明提出了一种普适性轻量级深度学习车辆检测方法，用于解决现有技术中在计算资源、存储空间有限的情况下，无法同时满足准确率和实时性的问题，实现步骤为：获取训练样本集和测试样本集；构建改进的YOLOv4网络模型；对改进的YOLOv4网络模型进行迭代训练；获取车辆检测结果。本发明所构建的主干特征提取网络采用深度可分离卷积模块代替传统卷积模块方式，降低模型大小的同时提高检测实时性，同时所构建的主干特征提取网络所包含的第二瓶颈模块中加入通道混洗模块，一定程度上提高了车辆检测的精度，可用于汽车自动或半自动驾驶。

Description

一种普适性轻量级深度学习车辆检测方法

技术领域

本发明属于深度学习技术领域，特别涉及一种普适性轻量级深度学习车辆检测方法。考虑现实场景中车载终端计算资源、存储空间有限而导致大多数深度学习方法不再适用，根据轻量化网络模型的思想，通过对YOLOv4网络模型中主干特征提取网络轻量化设计，在保证了检测的准确率的前提下，降低了车辆检测复杂度、压缩了模型大小，提高了检测的实时性，可用于高级辅助驾驶系统中。

背景技术

研究表明，目前我国智能网联汽车的发展正处在从L2级自动驾驶向L3级自动驾驶过度阶段。然而随着道路上的车辆日益增多，汽车在驾驶过程中容易发生各种突发状况，给人们带来经济损失的同时，可能造成部分区域的交通拥堵，更加严重的是可能导致相关人员的伤亡。随着智能交通系统的蓬勃发展能够有针对性的部分解决当前所面临的各种各样的交通问题，其中高级辅助驾驶系统(Advanced Driving Assistance System，ADAS)作为智能交通系统体系框架的重要内容，可以有针对性的解决道路上各种问题。高精度、实时车辆检测则是自动驾驶和ADAS的基础，同时也是ADAS中至关重要的一步。大多数车辆检测算法的提出都将提高精度作为第一准则，但不可避免的是模型复杂度的提升和大量内存的消耗。在现实场景中，由于单车计算资源、存储空间有限，很难同时满足高准确率和实时性，因此如何在有限的计算资源和存储资源的场景下保证准确率的同时提高检测的实时性是研究的关键。

现有基于深度学习的车辆检测方法有两种，一种是两阶段车辆检测方法，另一种是单阶段车辆检测方法。采用两阶段车辆检测主要通过一个完整的卷积神经网络(Convolutional Neural Networks，CNN)来完成目标检测的过程。在训练网络时，主要训练两个部分，第一步是训练候选区生成网络(Region Proposal Network，RPN)，第二步则是训练目标区域检测的网络。该方法虽然具有很高的检测精度，但由于网络结构的复杂性，导致检测速度很慢，往往在一些场景下无法满足实时性的要求。采用单阶段车辆检测主要是通过直接回归的方式进行车辆检测，该方法虽然在检测速度上相较于两阶段算法有较大的优势，但在计算资源和存储资源有限的场景下仍无法满足实时性，为了进一步提高检测实时性，需要对单阶段车辆检测进行轻量化操作，其中包括剪枝和构建轻量级网络模型，但由于单阶段检测网络结构比较简单，对图像中车辆信息提取能力有限，从而导致检测精度较低。

现有的深度车辆检测算法，多数采用YOLOv3网络模型为基础进行改进来提高检测速度，例如申请公布号为CN 110796168 A，名称为“一种基于改进YOLOv3的车辆检测方法”的专利申请，公开的一种改进YOLOv3的车辆检测方法，该方法重新设计Darknet层于三个yolo层之间的卷积神经网络结构，借鉴了TridentNet权重共享的想法，设计YOLO-TN网络；对YOLO-TN卷积神经网络进行模型剪枝；构建车辆检测数据集，并对数据集中的车辆位置信息进行标注；训练YOLO-TN的车辆检测模型，完成车辆检测任务。该方法在保证实时性的同时还具有较高的平均精度，对远处车辆以及小尺度目标进行检测时，漏检率较低，定位也更准确。但其存在的不足之处在于，该方法采用模型剪枝的方法对网络模型进行轻量化，在计算资源有限和存储资源有限的场景下无法同时保证高精度和实时性。

现有YOLOv4网络模型，其结构如图1所示，包括级联的主干特征提取网络CSPDarknet-53、空间金字塔池化网络SSP和路径聚合网络PANet，其中，主干特征提取网络包括级联的标准卷积模块、多个残差模块以及卷积层，标准卷积模块包括级联的卷积层、归一化层、激活层，残差模块包括级联的卷积层和激活层；空间金字塔池化网络包括依次层叠的多个不同尺寸的最大池化层；路径聚合网络包括多个标准卷积模块、多个上采样层以及多个下采样层；主干特征提取网络中倒数第二个残差模块和倒数第三个残差模块，以及空间金字塔池化网络的输出层与路径聚合网络相连。

发明内容

本发明目的在于针对上述现有技术的不足，提出了一种普适性轻量级深度学习车辆检测方法，用于解决现有技术中存在的在计算资源和存储资源有限的场景下车辆检测实时性和准确率较差的技术问题。

为实现上述目的，本发明采取的技术方案包括如下步骤：

(1)获取训练样本集I和测试样本集F：

从数据集中获取N幅包括车辆的图像，并将其中的M幅图像及其对应的包含车辆位置信息标注框的标签数据作为训练样本集I，将其余N-M幅作为测试样本集F，其中N＞10000，M＞N/2；

(2)构建改进的YOLOv4网络模型H：

(2a)构建改进的YOLOv4网络模型H的结构：

构建包括级联的主干特征提取网络My-MobileNet、空间金字塔池化网络SSP和路径聚合网络PANet的改进的YOLOv4网络模型H，其中，主干特征提取网络包括级联的深度可分离卷积模块、多个步长为2的第一瓶颈模块、多个步长为1的第二瓶颈模块以及卷积层，深度可分离卷积模块包括级联的深度卷积层、归一化层、激活层和逐点卷积层，第一瓶颈模块包括级联的深度卷积层、卷积层、归一化层以及激活层，第二瓶颈模块包括级联的第一瓶颈模块和通道混洗模块；空间金字塔池化网络包括依次层叠的多个不同尺寸的最大池化层；路径聚合网络包括多个深度可分离卷积模块、多个上采样层以及多个下采样层；主干特征提取网络中倒数第一个步长为2的第一瓶颈模块和倒数第四个的步长为2的第一瓶颈模块，以及空间金字塔池化网络的输出层与路径聚合网络相连；

(2b)构建改进的YOLOv4网络模型H的损失函数L：

L＝L₁+L₂+L₃

其中，L₁为预测框中心点坐标的损失函数，L₂为预测置信度的损失函数，L₃为预测类别的损失函数，IoU为标注框和预测框的交并比，ρ²(b,b^gt)表示预测框的中心点和标注框的中心点两点之间的欧拉距离，d表示包含标注框和预测框的外界矩形对角线的距离，w、h分别为预测框的宽和高，w^gt、h^gt分别为标注框的宽和高，S×S表示图像被划分成网格的大小，

表示判断网格内是否存在车辆目标

表示网络预测车辆的概率，p_i(c)表示第i网格存在车辆的概率，B表示每个网格预测的边框数，

为预测框的置信度，C_i为第i个网格边界框的置信度，λ_noobj为权重系数；

(3)对改进的YOLOv4网络模型H进行迭代训练：

(3a)将训练样本集I中的M幅图像划分为n组，每组包括D幅图像，并以

为比例对每组中的每幅图像进行压缩，然后将每组中的D幅压缩图像拼接成与原图像尺寸相同的图像，最后将n幅拼接图像与训练样本集I中未被分组的M-nD幅图像混合成数据增强后的训练样本集I′，其中，D∈{4,16,64,...}，nD＜M，n≥1；

(3b)设迭代次数为t，最大迭代次数为T，T≥50000，第t次迭代的改进的YOLOv4网络模型为H^t，并令t＝1，H^t＝H；

(3c)将数据增强后的训练样本集I′作为改进的YOLOv4网络模型H^t的输入，主干特征提取网络对I′中的每幅图像进行车辆特征提取，得到每幅图像的三种不同尺度特征图，空间金字塔池化网络对最小尺度特征图进行特征增强，得到增强后的特征图，路径聚合网络对增强后的特征图与主干特征提取网络提取的除最小尺度特征图以外的其余两幅特征图进行多尺度特征融合，得到n幅拼接图像和M-nD幅原图像的标签集Z＝{Z₁,Z₂,...,Z_k,...,Z_K}，

其中，K＝n+M-nD，Z_k表示由第k幅数据增强后的训练样本集图像的车辆类别预测标签

车辆置信度预测标签

和车辆预测框位置标签

组成的标签集；

(3d)采用损失函数L，并通过Z_k计算改进的YOLOv4网络模型H^t的损失值，然后对K个损失值进行均值处理，得到第t次迭代后H^t的损失值L^t；

(3e)采用反向传播算法，并根据L^t对改进的YOLOv4网络模型H^t中的深度卷积层的卷积核参数λ^t和逐点卷积层的卷积核参数θ^t进行更新，得到第t次训练后的H^t；

(3f)判断t＝T是否成立，若是，得到训练好的改进的轻量级YOLOv4网络模型H^*，否则，令t＝t+1，并执行步骤(3c)；

(4)获取车辆检测结果：

将测试样本集F作为训练好的改进的轻量级YOLOv4网络模型H^*的输入，主干特征提取网络对F中的每幅图像进行车辆特征提取，得到每幅图像的三种不同尺度特征图，空间金字塔池化网络对最小尺度特征图进行特征增强，得到增强后的特征图，路径聚合网络对增强后的特征图与主干特征提取网络提取的除最小尺度特征图以外的其余两幅特征图进行多尺度特征融合，得到N-M幅F的标签集Z^*。

本发明与现有技术相比，具有以下优点：

(1)本发明通过深度可分离卷积模块代替现有技术中的标准卷积模块，实现对主干特征提取网络的改进，得到改进的YOLOv4网络模型，在对改进的YOLOv4网络模型进行训练以及获取车辆检测结果的过程中，深度可分离卷积模块中深度卷积和逐点卷积远小于标准卷积模块中卷积操作所消耗的计算量和参数量，在计算资源和存储资源有限的场景下本发明与现有技术相比，在保证车辆检测准确率的同时，有效提高了车辆检测的实时性。

(2)本发明在第二瓶颈模块中增加了通道混洗模块，实现对主干特征提取网络的改进，得到改进的YOLOv4网络模型，在对改进的YOLOv4网络模型进行训练以及获取车辆检测结果的过程中，第二瓶颈模块中的通道混洗操作，可以解决各个分组之间的特征信息融合较差的缺点，一定程度上提高了车辆检测的精度。

附图说明

图1为现有YOLOv4网络模型的结构示意图；

图2为本发明的实现流程图；

图3为本发明所构建的改进的YOLOv4网络模型的结构示意图。

具体实施方式

以下结合附图和具体实施例，对本发明作进一步详细描述。

参照图2，本发明包括如下步骤：

步骤1)获取训练样本集I和测试样本集F。

从数据集中获取N幅包括车辆的图像，并将其中的M幅图像及其对应的包含车辆位置信息标注框的标签数据作为训练样本集I，将其余N-M幅作为测试样本集F，其中N＞10000，M＞N/2，本实施例中，数据集采用KITTI数据集、UA-DETRAC数据集以及在西安城区所采集的数据集混合而成的数据集，N＝12310，M＝11079；

步骤2)构建改进的YOLOv4网络模型H：

(2a)构建改进的YOLOv4网络模型H的结构，其结构如图3所示：

构建包括级联的主干特征提取网络、空间金字塔池化网络和路径聚合网络的改进的YOLOv4网络模型H，其中：

主干特征提取网络包括级联的深度可分离卷积模块、多个步长为2的第一瓶颈模块、多个步长为1的第二瓶颈模块以及卷积层，深度可分离卷积模块包括级联的深度卷积层、归一化层、激活层和逐点卷积层，第一瓶颈模块包括级联的深度卷积层、卷积层、归一化层以及激活层，第二瓶颈模块包括级联的第一瓶颈模块和通道混洗模块。

在本实施例中，第一瓶颈模块的数量为12，第二瓶颈模块的数量为5，该主干特征提取网络的具体结构为：深度可分离卷积模块→第二瓶颈模块→第一瓶颈模块→第一瓶颈模块→第一瓶颈模块→第一瓶颈模块→第一瓶颈模块→第一瓶颈模块→第一瓶颈模块→第一瓶颈模块→第一瓶颈模块→第二瓶颈模块→第二瓶颈模块→第二瓶颈模块→第一瓶颈模块→第一瓶颈模块→第一瓶颈模块→第二瓶颈模块→卷积层；深度可分离模块、第一瓶颈模块和第二瓶颈模块所包含的深度卷积层中的卷积核大小为3×3，激活层中的激活函数为Relu函数，逐点卷积层的卷积核大小为1×1，卷积层中卷积核大小为1×1。

深度可分离模块采用深度卷积和逐点卷积级联的方式代替卷积操作，在有效的提取图像特征的同时降低了计算量，减少参数量，第二瓶颈模块中所包含的通道混洗模块克服了原有技术中各个分组之间的特征信息融合较差的缺点，保证了检测精度，主干特征提取网络用来的提取图像中车辆的特征信息，并使用特征图的方式表示；

空间金字塔池化网络包括依次层叠的多个不同尺寸的最大池化层，在本实施例中，最大池化层的个数为3，池化核大小分别为13×13、9×9、5×5；

路径聚合网络包括多个深度可分离卷积模块、多个上采样层以及多个下采样层，在本实施例中，深度可分离卷积模块的个数为20、上采样层和下采样层的个数均为2。

主干特征提取网络中倒数第一个步长为2的第一瓶颈模块和倒数第四个的步长为2的第一瓶颈模块，以及空间金字塔池化网络的输出层与路径聚合网络相连；

(2b)构建改进的YOLOv4网络模型H的损失函数L：

L＝L₁+L₂+L₃

表示判断网格内是否存在车辆目标，

为预测框的置信度，C_i为第i个网格边界框的置信度，λ_noobj为权重系数。

相较于原有技术中的预测框中心点坐标的损失函数，L₁表达式中增加了中心点间距离

和重叠面积IoU，使得损失函数在真实值附近的梯度更加平滑，从而使得预测值更容易稳定收敛，提升了模型的训练速度与性能。

步骤3)对改进的YOLOv4网络模型H进行迭代训练：

为比例对每组中的每幅图像进行压缩，然后将每组中的D幅压缩图像拼接成与原图像尺寸相同的图像，最后将n幅拼接图像与训练样本集I中未被分组的M-nD幅图像混合成数据增强后的训练样本集I′，其中，D∈{4,16,64,...}，nD＜M，n≥1，本实施例中，n＝2769，D＝4，该方法在不损失车辆信息同时，有效的提高训练速度。

(3b)设迭代次数为t，最大迭代次数为T，T≥50000，本实施例中，T＝50500，第t次迭代的改进的YOLOv4网络模型为H^t，并令t＝1，H^t＝H。

其中，K＝n+M-nD，本实施例中，K＝2772，Z_k表示由第k幅数据增强后的训练样本集图像的车辆类别预测标签

车辆置信度预测标签

和车辆预测框位置标签

组成的标签集。

(3d)采用损失函数L，并通过Z_k计算改进的YOLOv4网络模型H^t的损失值，然后对K个损失值进行均值处理，得到第t次迭代后H^t的损失值L^t。

(3e)采用反向传播算法，并根据L^t对改进的YOLOv4网络模型H^t中的深度卷积层的卷积核参数λ^t和逐点卷积层的卷积核参数θ^t进行更新，得到第t次训练后的H^t，更新公式为：

其中η表示学习步长，0.0001≤η≤0.01，λ^t+1和θ^t+1分别表示λ^t和θ^t更新后的结果，

表示偏导计算，在本实施例中，η＝0.001。

步骤4)获取车辆检测结果：

以上描述仅是本发明的一个具体实例，并未构成对本发明的任何限制，显然对于本领域的专业人员来说，在了解了本发明内容和原理后，都可能在不背离本发明原理、结构的情况下，进行形式和细节上的各种修改和改变，但是这些基于本发明思想的修正和改变仍在本发明的权利要求保护范围之内。

Claims

1.一种普适性轻量级深度学习车辆检测方法，其特征在于，包括如下步骤：

(1)获取训练样本集I和测试样本集F：

(2)构建改进的YOLOv4网络模型H：

(2a)构建改进的YOLOv4网络模型H的结构：

构建包括级联的主干特征提取网络、空间金字塔池化网络和路径聚合网络的改进的YOLOv4网络模型H，其中，主干特征提取网络包括级联的深度可分离卷积模块、多个步长为2的第一瓶颈模块、多个步长为1的第二瓶颈模块以及卷积层，深度可分离卷积模块包括级联的深度卷积层、归一化层、激活层和逐点卷积层，第一瓶颈模块包括级联的深度卷积层、卷积层、归一化层以及激活层，第二瓶颈模块包括级联的第一瓶颈模块和通道混洗模块；空间金字塔池化网络包括依次层叠的多个不同尺寸的最大池化层；路径聚合网络包括多个深度可分离卷积模块、多个上采样层以及多个下采样层；主干特征提取网络中倒数第一个步长为2的第一瓶颈模块和倒数第四个的步长为2的第一瓶颈模块，以及空间金字塔池化网络的输出层与路径聚合网络相连；

(2b)构建改进的YOLOv4网络模型H的损失函数L：

L＝L₁+L₂+L₃

表示判断网格内是否存在车辆目标，

表示网络预测车辆的概率，pi(c)表示第i网格存在车辆的概率，B表示每个网格预测的边框数，

(3)对改进的YOLOv4网络模型H进行迭代训练：

车辆置信度预测标签

和车辆预测框位置标签

组成的标签集；

(3f)判断t＝T是否成立，若是，得到训练好的改进的轻量级YOLOv4网络模型H*，否则，令t＝t+1，并执行步骤(3c)；

(4)获取车辆检测结果：

将测试样本集F作为训练好的改进的轻量级YOLOv4网络模型H*的输入，主干特征提取网络对F中的每幅图像进行车辆特征提取，得到每幅图像的三种不同尺度特征图，空间金字塔池化网络对最小尺度特征图进行特征增强，得到增强后的特征图，路径聚合网络对增强后的特征图与主干特征提取网络提取的除最小尺度特征图以外的其余两幅特征图进行多尺度特征融合，得到N-M幅F的标签集Z*。

2.根据权利要求1所述的一种普适性轻量级深度学习车辆检测方法，其特征在于，步骤(2a)中所述的改进的YOLOv4网络模型H，其中包含的主干特征提取网络、空间金字塔池化网络和路径聚合网络的参数和具体结构分别为：

主干特征提取网络，其包含的第一瓶颈模块的数量为12，第二瓶颈模块的数量为5，该主干特征提取网络的具体结构为：深度可分离卷积模块→第二瓶颈模块→第一瓶颈模块→第一瓶颈模块→第一瓶颈模块→第一瓶颈模块→第一瓶颈模块→第一瓶颈模块→第一瓶颈模块→第一瓶颈模块→第一瓶颈模块→第二瓶颈模块→第二瓶颈模块→第二瓶颈模块→第一瓶颈模块→第一瓶颈模块→第一瓶颈模块→第二瓶颈模块→卷积层；深度可分离模块、第一瓶颈模块和第二瓶颈模块所包含的深度卷积层中的卷积核大小为3×3，激活层中的激活函数为Relu函数，逐点卷积层的卷积核大小为1×1，卷积层中卷积核大小为1×1；

空间金字塔池化网络，其包含的最大池化层的个数为3，池化核大小分别为13×13、9×9、5×5；

路径聚合网络，其包含的深度可分离卷积模块的个数为20、上采样层和下采样层的个数均为2。

3.根据权利要求1所述的一种普适性轻量级深度学习车辆检测方法，其特征在于：步骤(3e)中所述的对改进的YOLOv4网络模型H^t中的深度卷积层的卷积核参数λ^t和逐点卷积层的卷积核参数θ^t进行更新，更新公式分别为：

表示偏导计算。