CN108629267A

CN108629267A - 一种基于深度残差网络的车型识别方法

Info

Publication number: CN108629267A
Application number: CN201810170873.5A
Authority: CN
Inventors: 刘敦强; 沈峘
Original assignee: Nanjing University of Aeronautics and Astronautics
Current assignee: Nanjing University of Aeronautics and Astronautics
Priority date: 2018-03-01
Filing date: 2018-03-01
Publication date: 2018-10-09
Anticipated expiration: 2038-03-01
Also published as: CN108629267B

Abstract

本发明公开了一种基于深度残差网络的车型识别方法，涉及计算机视觉领域，能够在不同背景下提取车辆特征，进行车型识别。本发明包括：对深度残差网络进行参数初始化；将训练数据载入深度残差网络，结合数据增强策略，训练得到训练好的深度残差网络；将车型图像载入训练好的深度残差网络，训练好的深度残差网络进行识别，并从网络输出端输出类别标签。

Description

一种基于深度残差网络的车型识别方法

技术领域

本发明涉及计算机视觉领域，尤其涉及一种基于深度残差网络的车型识别方法。

背景技术

近年来，汽车厂商推出的车型日益丰富，国内汽车保有总量逐年攀升，导致汽车增长量与道路承载能力之间的矛盾愈发突出，道路堵塞、交通事故等问题层出不穷，一些重要路段的交通压力也越来越大。

汽车车型识别已经成为了智能交通领域的一个重要的研究内容，可以为核心路段的交通监控、交通事故责任判定等方面提供有力的技术支持。在实际的道路环境下，车辆图像往往存在着多角度、遮挡、光照变化等影响因素，影响到了车型的识别。

综上，现有技术中缺乏能够适应于不同背景下提取车辆特征的车型识别方法。

发明内容

本发明提供一种基于深度残差网络的车型识别方法，能够在不同背景下提取车辆特征，进行车型识别。

为达到上述目的，本发明采用如下技术方案：

一种基于深度残差网络的车型识别方法，包括：

S1、对深度残差网络进行参数初始化；

S2、将训练数据载入深度残差网络，结合数据增强策略，训练得到训练好的深度残差网络；

S3、将车型图像载入训练好的深度残差网络，训练好的深度残差网络进行识别，并从网络输出端输出类别标签。

进一步的，所述深度残差网络包括五个残差单元、两个全连接层、分类损失、类别中心损失、输出层。五个残差单元共有34层，两个全连接层用于提取全局特征，输出层用于预测输入图像的类别，训练时作为类别损失项和中心化损失项的输入。

第一残差单元的组成按照总体模型在输入样本进行预测时的数据流向依次为卷积层1，参数包括通道数为128，卷积核尺寸为3和3，步长为2，补零项尺寸为1和1；批量正则化层1，参数包括动态更新值2，以及仿射比例和仿射偏置；线性激活层1；卷积层2，参数包括通道数为256，卷积核尺寸为1和1，步长为1，补零项尺寸为0和0；批量正则化层2, 参数包括动态更新值2，以及仿射比例和仿射偏置；数值单元融合层，模式为相加操作；线性激活层2，

第二残差单元的组成按照总体模型在输入样本进行预测时的数据流向依次为卷积层1，参数包括通道数为256，卷积核尺寸为3和3，步长为2，补零项尺寸为1和1；批量正则化层1，参数包括动态更新值2，以及仿射比例和仿射偏置；线性激活层1；卷积层2，参数包括通道数为512，卷积核尺寸为1和1，步长为1，补零项尺寸为0和0；批量正则化层2, 参数包括动态更新值2，以及仿射比例和仿射偏置；数值单元融合层，模式为相加操作；线性激活层2，

第三残差单元的组成按照总体模型在输入样本进行预测时的数据流向依次为卷积层1，参数包括通道数为512，卷积核尺寸为3和3，步长为2，补零项尺寸为1和1；批量正则化层1，参数包括动态更新值2，以及仿射比例和仿射偏置；线性激活层1；卷积层2，参数包括通道数为1024，卷积核尺寸为1和1，步长为1，补零项尺寸为0和0；批量正则化层2, 参数包括动态更新值2，以及仿射比例和仿射偏置；数值单元融合层，模式为相加操作；线性激活层2，

第四残差单元的组成按照总体模型在输入样本进行预测时的数据流向依次为卷积层1，参数包括通道数为1024，卷积核尺寸为3和3，步长为2，补零项尺寸为1和1；批量正则化层1，参数包括动态更新值2，以及仿射比例和仿射偏置；线性激活层1；卷积层2，参数包括通道数为2048，卷积核尺寸为1和1，步长为1，补零项尺寸为0和0；批量正则化层2, 参数包括动态更新值2，以及仿射比例和仿射偏置；数值单元融合层，模式为相加操作；线性激活层2，

第五残差单元的组成按照总体模型在输入样本进行预测时的数据流向依次为卷积层1，参数包括通道数为2048，卷积核尺寸为3和3，步长为2，补零项尺寸为1和1；批量正则化层1，参数包括动态更新值2，以及仿射比例和仿射偏置；线性激活层1；卷积层2，参数包括通道数为1024，卷积核尺寸为1和1，步长为1，补零项尺寸为0和0；批量正则化层2, 参数包括动态更新值2，以及仿射比例和仿射偏置；数值单元融合层，模式为相加操作；线性激活层2，

第一全连接层的内部参数包括二维矩阵权重，尺寸分别是50176和4096，以及一维矩阵偏置，尺寸为4096，

第二全连接层的内部参数包括二维矩阵权重，尺寸分别是4096和1000，以及一维矩阵偏置，尺寸为1000，

多分类对率回归损失层无内部参数，输出为各个输入特征以自然数空间为基准相对于同样以自然数空间为基准的输入特征总和的比例，

中心损失层的内部参数只有二维矩阵中心距离，尺寸为196和1000，该参数在第一次训练时设置为全零矩阵，随后每经过一个训练批次就按照当前训练批次的特征所属的类别计算该类别下的特征的欧氏距离均值，然后乘以学习率得到更新值，最后对该类别下的中心距离进行更新。

进一步的，在所述S1中，所述参数初始化为基于高斯分布的方法初始化学习参数，其中高斯中心为0，高斯方差为训练时一个训练批次样本数的两倍倒数的平方根。

进一步的，在所述S2中，所述训练使用的数据增强方法包括图像水平翻转、图像随机尺寸剪切、图像随机噪声添加；所述训练采用随机梯度下降训练方法，一个训练批次的训练样本数为128个，总的迭代次数为80个训练周期，1个训练周期代表总的训练样本对1个训练周期的商，每经过1个训练周期就随机生成总的所述训练样本的训练次序，学习率参数采用阶梯下降策略，所述学习率的初始值设为0.01，经过30个训练周期和50个训练周期时分别下降一次，下降因子为0.1。权重衰减项为0.0005，动量项为0.9。

本发明的有益效果为：

本发明设计了基于残差学习单元的深度残差网络结构，在深度残差网络的基础上添加类别中心正则化的约束以强化同一类别内的特征的相似性及不同类别的特征的可区分性，进一步提高模型的分类性能；训练时使用了多种数据增强策略，充分利用预训练模型的优势，在不同背景下提高车型识别效率。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它的附图。

图1为本发明的模型结构总图。

具体实施方式

为使本领域技术人员更好地理解本发明的技术方案，下面结合具体实施方式对本发明作进一步详细描述。

一种基于深度残差网络的车型识别方法，包括：

S1、设计一种深度残差网络，其结构如图1所示。

所述深度残差网络包括五个残差单元、两个全连接层、分类损失、类别中心损失、输出层。五个残差单元共有34层，两个全连接层用于提取全局特征，输出层用于预测输入图像的类别，训练时作为类别损失项和中心化损失项的输入。

S2、将训练数据载入所述深度残差网络，结合数据增强策略，训练得到训练好的深度残差网络。

训练主机的型号为泰坦 X(帕斯卡架构) 12GB + I7-6700K + 16GB 金士顿的内存 + 128GB 西部数据的固态硬盘，训练框架为Caffe(Convolution Architecture forFast Feature Embedding)，采用C++语言。

训练采用随机梯度下降训练方法，训练样本数为128个，总的迭代次数为80个训练周期，1个训练周期代表总的训练样本对1个训练批量的商，每经过1个训练周期再次随机挑选总的所述训练样本，学习率参数采用阶梯下降策略，所述学习率的初始值设为0.01，经过30个训练周期和50个训练周期时分别下降一次，下降因子为0.1。权重衰减项为0.0005，动量项为0.9。

S3、将车型图像载入所述训练好的深度残差网络，所述训练好的深度残差网络进行识别，并从网络输出端输出类别标签。

车型图像存储在固态硬盘中，再以文本格式输入到网络模型中。深度残差网络识别时采用斯坦福车型数据集，数据集中的图像和标签转成LMDB（lightening-MemoryMapped Dataset）格式输入到深度残差网络中。

本发明的有益效果是：

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应该以权利要求的保护范围为准。

Claims

1.一种基于深度残差网络的车型识别方法，其特征在于，包括：

S1、对深度残差网络进行参数初始化；

S2、将训练数据载入所述深度残差网络，结合数据增强策略，训练得到训练好的深度残差网络；

2.根据权利要求1所述的方法，其特征在于，所述深度残差网络包括五个残差单元、两个全连接层、多分类对率回归损失层、中心损失层，

中心损失层的内部参数只有二维矩阵中心距离，尺寸为196和4096，该参数在第一次训练时设置为全零矩阵，随后每经过一个训练批次就按照当前训练批次的特征所属的类别计算该类别下的特征的欧氏距离均值，然后乘以学习率得到更新值，最后对该类别下的中心距离进行更新。

3.根据权利要求1所述的方法，在所述S1中，所述参数初始化为基于高斯分布的方法初始化学习参数，其中高斯中心为0，高斯方差为训练时一个训练批次样本数的两倍倒数的平方根。

4.根据权利要求1所述的方法，在所述S2中，所述训练使用的数据增强方法包括图像水平翻转、图像随机尺寸剪切、图像随机噪声添加；所述训练采用随机梯度下降训练方法，一个训练批次的训练样本数为128个，总的迭代次数为80个训练周期，1个训练周期代表总的训练样本对1个训练周期的商，每经过1个训练周期就随机生成总的所述训练样本的训练次序，学习率参数采用阶梯下降策略，所述学习率的初始值设为0.01，经过30个训练周期和50个训练周期时分别下降一次，下降因子为0.1。

5.权重衰减项为0.0005，动量项为0.9。