CN110598801A

CN110598801A - 一种基于卷积神经网络的车型识别方法

Info

Publication number: CN110598801A
Application number: CN201910904657.3A
Authority: CN
Inventors: 赵宏阳; 付俊; 井元伟
Original assignee: Northeastern University China
Current assignee: Northeastern University China
Priority date: 2019-09-24
Filing date: 2019-09-24
Publication date: 2019-12-20

Abstract

本发明公开一种基于卷积神经网络的车型识别方法，属于智能交通中的车型识别技术领域，该方法采用数据增强策略扩增数据集，使数据集更加贴合实际情况，在Inception‑V3网络的基础上，针对车型识别，采用Adam优化算法对权值和偏移量进行更新，并借鉴迁移学习思想，提高了车型识别的效率。另外，在损失函数上采用AMSoftmax损失函数代替传统的Softmax损失函数，减小了类内差异，扩大了类间差异，提高不同背景环境下车型识别精度。

Description

一种基于卷积神经网络的车型识别方法

技术领域

本发明涉及智能交通中的车型识别技术领域，尤其涉及一种基于卷积神经网络的车型识别方法。

背景技术

由于近年来交通压力不断增大，智能交通系统日益体现出重要性和紧迫性，而车型识别作为智能交通系统的重要分支和关键技术，主要是针对特定地段下的车辆进行准确的识别，可为智能停车场收费系统、车辆违规占道等方面提供技术支持。

国内外关于车型识别研究的主要方法可以概括为：基于图像处理的方法和基于物理的方法。卷积神经网络是神经网络的一种，它由卷积层、池化层、激活层、全连接层组成，它能够提取输入的不同特征并进行分类。随着卷积神经网络(CNN)在图像分类上取得良好的成果，卷积神经网络被广泛应用到各种分类任务。但在实际的交通环境中，车辆识别存在着光照变化、图像模糊等影响因素，影响了卷积神经网络对车型识别的精度。综上，现实情况中面临车型识别准确率比较低的问题，本发明采用卷积神经网络模型并引入AMSoftmax损失函数来对车型图片进行分类，解决了现有技术中车型识别准确率低的缺点。

发明内容

针对上述现有技术的不足，本发明提供一种基于卷积神经网络的车型识别方法。

为解决上述技术问题，本发明所采取的技术方案是：一种基于卷积神经网络的车型识别方法，该方法的流程如图1所示，包括如下步骤：

步骤1：采集车型图片数据集，利用数据增强对数据集进行扩增，将扩增后的数据集按一定比例分为训练集和测试集；

其中，分别采用旋转和高斯模糊两种策略对车型图片数据集中的每个图像进行处理，将处理后的图像加入原车型图片数据集中，使得车型图像数据扩增为原数据集的3倍。

步骤2：借鉴迁移学习的思想，将Inception-V3网络模型在大规模数据集ImageNet上进行训练，得到Inception-V3网络模型各个参数的最优初始值；

步骤3：采用Adam优化算法对权值和偏移量进行更新，并采用AMSoftmax损失函数对输出分类引入角度特征，来优化Inception-V3网络模型；

步骤3.1：采用Adam优化算法对权值和偏移量进行更新：

步骤3.1.1：首先初始化一阶和二阶变量：v_dw＝0，v_db＝0，s_dw＝0，s_db＝0；

其中，v_dw为针对权重W的梯度的指数加权平均，v_db为针对偏移量b的梯度的指数加权平均，s_dw为针对W的梯度平方的指数加权平均，s_db为针对b的梯度平方的指数加权平均；

步骤3.1.2：假设在第t轮训练中，对参数进行更新：

v_dw(t)＝β₁v_dw(t-1)+(1-β₁)dW

v_db(t)＝β₁v_db(t-1)+(1-β₁)db

s_dw(t)＝β₂s_dw(t-1)+(1-β₂)dW²

s_db(t)＝β₂s_dw(t-1)+(1-β₂)db²

其中，v为一阶矩，s为二阶矩；

β₁为一阶矩v的指数衰减率，β₂为二阶矩s的指数衰减率，其中β₁，β₂∈[0,1)；

dW和db为损失函数在反向传播时的权值和偏移量的梯度；

步骤3.1.3：对上述参数值进行偏差修正：

步骤3.1.4：最后对权重和偏置进行更新：

其中，α为学习率，ε取10^-8，ε>0用来保证分母大于0。

步骤3.2：采用AMSoftmax损失函数对输出分类引入角度特征；

传统的softmax损失函数：

其中，W^Tf＝||W||·||f||·cosθ，可知特征向量包含角度信息，将W^Tf由||W||·||f||·cosθ代替，可得：

其中，f是最后一个完全连接层的输入，W_j是最后一个完全连接层参数矩阵W的第j列，可称为第i个样本的目标逻辑，n为输入数据的总个数，c为类别总数；

在每一次迭代中归一化权值||W_j||＝1，将偏置b设为0，可得A-Softmax损失函数：

其中，并且k∈[0,m-1]，其中m通常是个大于1的数，控制分类边界的大小。

在A-Softmax损失函数的基础上，引入一个简洁的附加间隔，定义得到AMSoftmax，如下：

其中，m用于控制边界，通常m>0，s为引入的缩放因子；

步骤4：将车型图像数据集中的训练集及步骤2得到的网络参数的最优初始值输入到优化后的Inception-V3网络模型中，对模型进行训练；

步骤5：将车型图像的测试集输入训练好的网络模型中，对车型进行分类，其中卷积神经网络模型训练及测试的流程如图2所示。

采用上述技术方案所产生的有益效果在于：

1、本发明采用数据增强策略扩增数据集，使数据集更加贴合实际情况；

2、本发明借鉴迁移学习思想，提高了车型识别的效率；

3、本发明采用Adam优化算法对权值和偏移量进行更新，同时获得适应性梯度算法(AdaGrad)和均方根传播算法(RMSProp)的优点，不仅可以基于一阶矩均值计算适应性参数学习率，同时还充分利用了梯度的二阶矩均值；

4、本发明利用两个较小的卷积滤波器来代替一个大的卷积滤波器，并且采用非对称的卷积结构，加速了运算并减轻了过拟合；

5、本发明在损失函数上采用AMSoftmax损失函数代替传统的Softmax损失函数，减小了类内差异，扩大了类间差异，提高不同背景环境下车型识别精度。

附图说明

图1为本发明一种基于卷积神经网络的车型识别方法流程图；

图2为本发明卷积神经网络车型识别的流程图；

图3为本发明实施例中具体的Inception模块；

图4为本发明实施例迭代过程车型分类准确率的仿真结果。

具体实施方式

下面结合附图和实施例，对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明，但不用来限制本发明的范围。

如图1所示，本实施例的方法如下所述。

步骤1：采集车型图片数据集，利用数据增强对数据集进行扩增，得到更加贴近于真实场景的图片，将扩增后的数据集按一定比例分为训练集和测试集；

本实施例中采用的车型图片数据集为BIT-vehicle数据集，共9850张图片，共包含客车、面包车、微汽车、轿车、SUV和卡车6个类型；

其中，分别采用旋转和高斯模糊两种策略对BIT-vehicle车型图片数据集中的每个图像进行处理，将处理后的图像加入原车型图片数据集中，使得车型图像数据扩增为原数据集的3倍即29550张，按0.8：0.2随机分为训练集和测试集。

步骤2：借鉴迁移学习的思想，将Inception-V3网络模型在大规模数据集ImageNet上进行训练，得到Inception-V3网络模型各个参数的最优初始值；迁移学习的方法在提高识别精度的同时节约了训练时间；

本实施例中Inception-V3网络模型包含46层网络，含有11个Inception模块，相比于其它卷积神经网络，Inception-V3在增加网络深度和宽度的同时减少了参数，可以更好的平衡网络的深度和宽度。Inception模块如图3所示，采用Inception模块来分解大尺寸卷积核，将大尺寸卷积核分解为小尺寸卷积核，例如将一个5×5卷积核分解为两个连续的3×3卷积核，并且将卷积核分解为非对称卷积核，如将n×n卷积核分解为1×n和n×两个卷积核，在减少运算量的同时增加了模型的非线性表达能力。网络通过Inception模块进行卷积、池化后，由最后的全连接层整合特征，输入至分类器，并且在训练过程中引入辅助分类器，即把网络中间层提前拿出来进行回归分类，提高正则化效果。

步骤3.1：采用Adam优化算法对权值和偏移量进行更新：

步骤3.1.2：假设在第t轮训练中，对参数进行更新：

v_dw(t)＝β₁v_dw(t-1)+(1-β₁)dW

v_db(t)＝β₁v_db(t-1)+(1-β₁)db

s_dw(t)＝β₂s_dw(t-1)+(1-β₂)dW²

s_db(t)＝β₂s_dw(t-1)+(1-β₂)db²

其中，v为一阶矩，s为二阶矩；

一阶矩v的指数衰减率β₁＝0.9，二阶矩s的指数衰减率β₂＝0.999，其中β₁，β₂∈[0,1)；

dW和db为损失函数在反向传播时的权值和偏移量的梯度；

步骤3.1.3：对上述参数值进行偏差修正：

步骤3.1.4：最后对权重和偏置进行更新：

其中，学习率α＝0.0001，ε取10^-8，ε>0用来保证分母大于0。

步骤3.2：采用AMSoftmax损失函数对输出分类引入角度特征；

传统的softmax损失函数：

其中，m用于控制边界，s为引入的缩放因子，通过实验对比分析，s取40，m取0.7时，此模型效果最佳。

步骤5：将车型图像的测试集输入训练好的网络模型中，对车型进行分类，分类结果如图4所示，图4展现了在30次迭代过程中，测试集平均准确率的变化，图4中居于下侧的曲线代表未经过迁移学习在30次迭代过程中车型识别的准确率的变化过程，图4中居于上侧的曲线代表经过迁移学习之后在30次迭代过程中车型识别的准确率的变化过程，在BIT-Vehicle数据集中六种车型的识别率如表1所示：

表1模型在BIT-Vehicle数据集上六种车型的识别率

Claims

1.一种基于卷积神经网络的车型识别方法，其特征在于包括如下步骤：

步骤5：将车型图像的测试集输入训练好的网络模型中，对车型进行分类。

2.根据权利要求1所述的一种基于卷积神经网络的车型识别方法，其特征在于：所述步骤1中利用数据增强对数据集进行扩增的方法为：

分别采用旋转和高斯模糊两种策略对车型图片数据集中的每个图像进行处理，将处理后的图像加入原车型图片数据集中，使得车型图像数据扩增为原数据集的3倍。

3.根据权利要求1所述的一种基于卷积神经网络的车型识别方法，其特征在于所述步骤3中采用Adam优化算法对权值和偏移量进行更新的过程如下：

步骤3.1.2：假设在第t轮训练中，对参数进行更新：

v_dw(t)＝β₁v_dw(t-1)+(1-β₁)dW

v_db(t)＝β₁v_db(t-1)+(1-β₁)db

s_dw(t)＝β₂s_dw(t-1)+(1-β₂)dW²

s_db(t)＝β₂s_dw(t-1)+(1-β₂)db²

其中，v为一阶动量矩，s为二阶动量矩；

dW和db为损失函数在反向传播时的权值和偏移量的梯度；

步骤3.1.3：对上述参数值进行偏差修正：

步骤3.1.4：最后对权重和偏置进行更新：

其中，α为学习率，ε取10^-8，ε>0用来保证分母大于0。

4.根据权利要求1所述的一种基于卷积神经网络的车型识别方法，其特征在于：所述采用AMSoftmax损失函数对输出分类引入角度特征的过程如下：

传统的softmax损失函数：

其中，并且k∈[0,m-1]，其中m通常是个大于1的数，控制分类边界的大小；

其中，m用于控制边界，s为引入的缩放因子。