CN112699928B

CN112699928B - 基于深度卷积网络的非机动车检测和识别方法

Info

Publication number: CN112699928B
Application number: CN202011568694.0A
Authority: CN
Inventors: 袁夏; 叶佳林; 赵春霞
Original assignee: Nanjing University of Science and Technology
Current assignee: Nanjing University of Science and Technology
Priority date: 2020-12-25
Filing date: 2020-12-25
Publication date: 2022-09-20
Anticipated expiration: 2040-12-25
Also published as: CN112699928A

Abstract

本发明公开了一种基于深度卷积网络的非机动车检测和识别方法，首先自建非机动车数据集，并划分成训练集和测试集。然后建立基于深度学习的神经网络构架，将第一步划分的训练集放入网络中训练，从而得到训练好的深度卷积网络，最后将测试集送入训练好的深度卷积网络中测试。本发明通过基于深度卷积网络的方法来进行非机动车检测和识别，使得非机动车检测的精度更高。

Description

基于深度卷积网络的非机动车检测和识别方法

技术领域

本发明涉及目标检测技术领域，具体是一种基于深度卷积网络的非机动车检测和识别方法。

背景技术

目标检测在计算机视觉领域占据十分重要的地位，它是通过图像去检测目标，即标注出图像中每个目标所属的类别及坐标。在近年的自动驾驶技术中，也需要用到这种技术。当车载摄像头采集到图像后，后台服务器可以将图像进行检测，从而达到规避行人的特点。目前图像检测技术极大部分采用的深度学习技术，但是基于深度学习的网络模型都有所侧重，专门用于非机动车检测和识别的方法较少。

发明内容

本发明的目的在于提供基于一种深度卷积网络的非机动车检测和识别方法，提升了非机动车检测的准确率和精度。

实现本发明目的的技术解决方案为：一种深度卷积网络的非机动车检测和识别方法，s1、建立起非机动车数据集，并划分成训练集，测试集和验证集；

s2、搭建起基于深度学习的目标检测网络；

s3、将训练集样本送入神经网络中训练，获得训练后的神经网络模型；

s4、将训练好的神经网络模型分别送入测试网络获得测试结果；

s5、将测试结果中最好的模型保存；

作为一种优选实施方式，步骤s1中的训练集和测试集比例划分为4:1。

作为一种优选实施方式，步骤s2中深度神经网络包括特征提取网络，特征融合网络和输出网络。特征提取网络包括5个残差模块，每个残差模块都包含了多个卷模块，并且使用了步长为2的卷积层进行下采样；特征融合网络包括了3个融合模块，分别是其8倍下采样层，16倍下采样层和32倍下采样层；输出网络包含了两个输出模块。

作为一种更优选实施方式，卷积模块采用了3*3卷积层和1*1卷积层的组合；卷积模块都采用的激活函数是Leaky-Relu激活函数，并且每个卷积模块都是卷积层加上激活函数加上批归一化层组合。

作为一种优选实施方式，特征提取网络中残差模块是三个卷积层组合形成的，分别通过一个3*3卷积模块将通道数减少为原来的一半，在通过一个1*1卷积模块卷积，通过一个3*3卷积模块恢复通道数，最后将原始特征层与最后恢复通道数后的卷积层特征相加，获得新的特征层。

作为一种优选实施方式，特征融合网络分别采用其8倍下采样特征层A，16倍下采样特征层B，32倍下采样特征层C进行融合。首先特征C通过一个1*1卷积降低其通道数，再通过上采样将其特征层大小变为原来的两倍,生成特征层D，其次将特征层A通过3*3卷积层将其通道数变为原来的两倍并将其特征层大小变为原来的一半，最后将特征层A,B,C进行相加，生成新的特征层D，将特征层D进行2次3*3卷积生成特征层E，将特征层E首先通过通过1*1卷积再通过上采样生成与特征层A相同大小的特征层F，然后将特征层E通过3*3卷积生成与特征层B相同的大小的特征层G，最后将特征层E通过上采样生成与特征层C相同大小的特征层H。

所述输出网络中对特征融合后的特征层首先采用一个1*1卷积降低特征层的维度，再通过2个3*3卷积融合特征，最后输出大小为H*W*class的卷积层A和大小为H*W*5的卷积层B，其中H代表特征层的高度，W代表特征层的宽度，class代表类别数量，5代表此中心点距离左边界距离，中心点距离上边界的距离，中心点距离右边界的距离，中心点距离下边界的距离和分类置信度。

作为一种优选实施方式，输出网络中对特征融合后的卷积层分别采用一个1*1卷积并分别通过两个3*3卷积输出大小为H*W*class的卷积层和大小为H*W*5的卷积层，其中H代表特征层的高度，W代表特征层的宽度，class代表类别数量，其中5代表此中心点距离左边界距离，中心点距离上边界的距离，中心点距离右边界的距离，中心点距离下边界的距离和分类置信度。

作为一种更优选实施方式，在训练过程中使用损失函数进行边界框回归；其中，b、b^gt分别代表了预测框和真实框的中心点，且ρ代表的是计算两个中心点间的欧式距离，c代表的是能够同时包含预测框和真实框的最小闭包区域的对角线距离：

作为一种优选实施方式，步骤s4中，在训练网络的时候，把整个数据集分为K份，每次选取其中一个子集作为测试集，再从K-1个子集中选取百分之80作为训练集，百分之20作为验证集，进行K次交叉验证，从而训练好网络模型。

作为一种优选实施方式，在训练前，对非机动车数据集的图像进行基于色彩饱和度的图像增强、基于图像尺寸的数据增强，扩充数据集。

本发明与现有技术相比，其显著优点：1)本发明是一种基于深度卷积网络的的目标检测和识别方法，增加了非机动车检测的精度。2)本发明在网络结构的融合部分，使用4尺度进行融合，使得检测结果更好。

附图说明

图1为本发明的基于深度卷积网络的非机动车检测和识别方法的流程图。

图2为卷积模块示意图。

图3为融合层特征图。

具体实施方式

下面结合说明书附图和具体实施例对本发明方案作进一步说明。

一种基于深度卷积网络非机动车检测和识别方法，包括以下步骤：

步骤一、建立起基于深度卷积网络的非机动车检测神经网络构架，使用卷积神经网络对交通场景下的非机动车图像进行多层特征提取，产生多级特征图，然后对多级特征图按照从高到底的方式进行特征融合操作，在最终输出结果前加入损失函数，不断地更新模型参数，使得最后的检测结果中，非机动车类别检测效果更好。

本发明采用的是经典神经网络结构darknet53，同时进行结构上的改进，具体是构建5个卷积模块(CONV_BLOCK)，每个卷积块中包含多个步长为1的卷积层和一个步长为2的卷积层，如图2所示。通过对每张输入图像进行第一层的卷积和降采样的处理，使得通道数变为64，特征图尺寸变为原来的1/2，如图3所示；通过对中间层的特征图进行卷积和降采样处理，使得通道数翻倍，特征图尺寸变为上一层的1/2。重复五次，最后特征层大小变为原来的1/32，通道数变成1024。特征融合网络分别采用其8倍下采样层特征层、16倍下采样层特征层、32倍下采样层特征层进行融合；特征融合网络分别采用其8倍下采样特征层A，16倍下采样特征层B，32倍下采样特征层C进行融合。首先特征C通过一个1*1卷积降低其通道数，再通过上采样将其特征层大小变为原来的两倍,生成特征层D，其次将特征层A通过3*3卷积层将其通道数变为原来的两倍并将其特征层大小变为原来的一半，最后将特征层A,B,C进行相加，生成新的特征层D，将特征层D进行2次3*3卷积生成特征层E，将特征层E首先通过通过1*1卷积再通过上采样生成与特征层A相同大小的特征层F，然后将特征层E通过3*3卷积生成与特征层B相同的大小的特征层G，最后将特征层E通过上采样生成与特征层C相同大小的特征层H。

关于卷积核的选择，鉴于以往的深度学习经验，本发明选取大小为3*3的卷积核和1*1的卷积核，所有的卷积层都是用这个卷积核的尺寸。

关于激活函数，本发明使用Leakey-ReLu作为激活函数，这是由于Leakey-ReLu激活函数本身的一些优点，包括：

(1)采用sigmoid等函数，算激活函数时(指数运算)，计算量大，反向传播求误差梯度时，求导涉及除法，计算量相对大，而采用Relu激活函数，整个过程的计算量节省很多。

(2)对于深层网络，sigmoid函数反向传播时，很容易就会出现梯度消失的情况，Leakey-ReLu能有效解决这个问题。

(3)Leakey-ReLu会使一部分神经元的输出降低，这样就造成了网络的稀疏性，并且减少了参数的相互依存关系，缓解了过拟合问题的发生。

关于构架的损失函数，采用DIOU损失函数，将交通场景下的非机动车作为检测类别，确定检测框和真实框之间的IOU的值，再DIOU按照损失函数的定义计算其损失值，具体的损失函数如下：

其中，b、b^gt分别代表了预测框和真实框的中心点，且ρ代表的是计算两个中心点间的欧式距离，c代表的是能够同时包含预测框和真实框的最小闭包区域的对角线距离

步骤2、选择非机动车数据集，划分成训练数据集、验证数据集、测试数据集，训练神经网络模型；

先介绍数据集各组成部分的作用，训练数据用于模型构建；验证数据可选，用于辅助模型构建，可以重复使用。测试数据用于检测模型构建，此数据只在模型检验时使用，用于评估模型的准确率，绝对不允许用于模型构建过程，否则会导致过拟合。

本发明把整个数据集均分成K个子集，每次选取一个子集作为测试集，从K-1个子集中选出4/5作为训练数据集，剩下的1/5作为验证数据集，进行K次交叉验证，得到训练好的神经网络模型。

训练神经网络模型时，卷积部分，主干网络在ImageNet上进行预训练的权重初始化，再特征融合层，使用随机初始化参数的方法，这样可以明显减少训练时间，在更少的时间内取得更好的检测效果。此外还需要设置一些超参数，包括迭代次数epoch，每次输入到神经网络进行训练的图像数量batch-size的大小设置，确定训练结束条件。本发明中设置epoch的值为50，batch-size的大小为64。通过设置初始网络权重，网络参数采用随机初始化的方法，不断进行迭代训练，直到加权平均损失小于设定的阈值或者迭代次数大于设定的阈值，结束训练。

作为一种优选实施方式，还可以在训练前，对非机动车数据集的图像进行基于色彩饱和度的图像增强、基于图像尺寸的数据增强，扩充数据集，然后对扩充的数据集，进行上述处理。

步骤3、利用训练好的模型，进行非机动车检测和识别。

本发明在检测非机动车时，利用DIOU损失函数的方法，使得定位精度更高；本发明在检测非机动车时，利用多尺度融合特征层的方法，使得小目标检测准确率更高；本发明在检测非机动车时，使用DIOU损失函数进行训练；然后得到最终的神经网络模型，即得到训练好的参数值。

Claims

1.一种基于深度卷积网络的非机动车检测和识别方法，其特征在于，包括以下步骤：

s1、建立起非机动车数据集，数据集中包含自行车数据和电动自行车数据，并划分成训练集，测试集和验证集；

s2、搭建起基于深度学习的目标检测网络；步骤s2中深度神经网络包括特征提取网络、特征融合网络和输出网络；特征提取网络包括5个残差模块，每个残差模块都包含多个卷积模块，并且使用步长为2的卷积层进行下采样；特征融合网络包括3个融合模块，分别是其8倍下采样层、16倍下采样层和32倍下采样层；输出网络包含两个输出模块；特征融合网络分别采用其8倍下采样特征层A，16倍下采样特征层B，32倍下采样特征层C进行融合；首先特征C通过一个1*1卷积降低其通道数，再通过上采样将其特征层大小变为原来的两倍,生成特征层D，其次将特征层A通过3*3卷积层将其通道数变为原来的两倍并将其特征层大小变为原来的一半，最后将特征层A、B、C进行相加，生成新的特征层D，将特征层D进行3次3*3卷积生成特征层E，将特征层E首先通过1*1卷积再通过上采样生成与特征层A相同大小的特征层F，然后将特征层E通过3*3卷积生成与特征层B相同的大小的特征层G，最后将特征层E通过上采样生成与特征层C相同大小的特征层H；

s5、将测试结果中最好的模型保存并应用。

2.根据权利要求1所述的基于深度卷积网络的非机动车检测和识别方法，其特征在于：步骤s1中的训练集和测试集比例划分为4:1。

3.根据权利要求1所述的基于深度卷积网络的非机动车检测和识别方法，其特征在于：卷积模块采用3*3卷积层和1*1卷积层的组合；卷积模块都采用的激活函数是Relu激活函数，且每个卷积模块都是卷积层加上激活函数加上批归一化层组合。

4.根据权利要求1所述的基于深度卷积网络的非机动车检测和识别方法，其特征在于：所述特征提取网络中残差模块由三个卷积层组合形成，分别通过一个3*3卷积模块将通道数减少为原来的一半，再通过一个1*1卷积模块卷积，通过一个3*3卷积模块恢复通道数，最后将原始特征层与恢复通道数后的卷积层特征相加，获得新的特征层。

5.根据权利要求1所述的基于深度卷积网络的非机动车检测和识别方法，其特征在于：所述输出网络中对特征融合后的特征层首先采用一个1*1卷积降低特征层的维度，再通过2个3*3卷积融合特征，最后输出大小为H*W*class的卷积层A和大小为H*W*5的卷积层B，其中H代表特征层的高度，W代表特征层的宽度，class代表类别数量，5代表此中心点距离左边界距离，中心点距离上边界的距离，中心点距离右边界的距离，中心点距离下边界的距离和分类置信度。

6.根据权利要求1所述的基于深度卷积网络的非机动车检测和识别方法，其特征在于：在训练过程中使用损失函数进行边界框回归；其中，b、b^gt分别代表了预测框和真实框的中心点，且ρ代表的是计算两个中心点间的欧式距离，c代表的是能够同时包含预测框和真实框的最小闭包区域的对角线距离：

7.根据权利要求1所述的基于深度卷积网络的非机动车检测和识别方法，其特征在于：步骤s4中，在训练网络的时候，把整个数据集分为K份，每次选取其中一个子集作为测试集，再从K-1个子集中选取百分之80作为训练集，百分之20作为验证集，进行K次交叉验证，从而训练好网络模型。

8.根据权利要求1所述的基于深度卷积网络的非机动车检测和识别方法，其特征在于：所述步骤s1在训练前，对非机动车数据集的图像进行基于色彩饱和度的图像增强、基于图像尺寸的数据增强，扩充数据集。