CN108280490A

CN108280490A - 一种基于卷积神经网络的细粒度车型识别方法

Info

Publication number: CN108280490A
Application number: CN201810167949.9A
Authority: CN
Inventors: 周锋; 左雨婷; 李小勇; 黄智濒
Original assignee: Beijing University of Posts and Telecommunications
Current assignee: Beijing University of Posts and Telecommunications
Priority date: 2018-02-28
Filing date: 2018-02-28
Publication date: 2018-07-13

Abstract

本发明提供了一种基于卷积神经网络的细粒度车型识别方法，包括如下步骤：步骤S101，输入车型图像并划分为训练样本与测试样本；步骤S102，根据输入图像的类别标签，设计基于细类别和粗类别的类别编码，用于训练；步骤S103，设计卷积层、池化层、全连接层，对车型特征进行提取；步骤S104，设计分类函数，根据提取的车型特征进行分类；步骤S105，设计代价函数，根据预测的样本编码和真实的样本编码，使用对数似然估计计算代价函数；步骤S106，使用梯度下降法对网络的权值和偏移量进行更新；步骤S107，根据训练得到的网络结构，实现基于卷积神经网络的车型识别方法。采用本发明的方法，实现基于卷积神经网络的细粒度车型的识别，提高识别的准确率。

Description

一种基于卷积神经网络的细粒度车型识别方法

技术领域

本发明涉及一种卷积神经网络技术领域，特别是涉及一种基于卷积神经网络的细粒度的车型识别方法。

背景技术

神经网络是一种基于机器学习方法。该网络由大量的节点(或称神经元)组成，每个神经元是一个多输入单输出的计算单元，神经元将各个输入值乘上相应权重并进行相加，再加上一个偏移量，然后使用激活函数得到非线性输出。神经网络由输入层、隐藏层和输出层组成，其中每一层都由单个或多个神经元组成，上一层的输出作为下一层的输入。

卷积神经网络(CNN)是神经网络的一种，它能够提取输入的不同特征并进行分类。CNN的隐藏层由卷积层、池化层和全连接层组成。卷积神经网络的输入层接受输入向量，隐藏层负责传输、分析、权衡各个向量，输出层完成结果的输出。其中，卷积层通过卷积操作提取输入的不同特征，浅层的卷积层提取诸如边缘、线条的低级特征，深层的卷积层提取高级特征；池化层接在卷积层之后，对局部接受域进行池化操作以获取具有空间不变性的特征；全连接层一般位于多个卷积层和池化层之后，整合卷积层或池化层中具有类别区分性的局部信息。

卷积神经网络在图像分类上取得了良好的成果，但目前的分类比较粗，在大类下细分的子类间分类识别率较低。目前基于卷积神经网络的图像识别项目中，没有一种这样的识别方式，即根据车型标签，建立具有层次结构的标签属性，并用于训练和分类。目前的情况下，如果车型种类多且比较细时，面临车型识别的准确率比较低的问题。

发明内容

有鉴于此，本发明设计了一种基于卷积神经网络的细粒度车型识别方法，包括如下步骤：

步骤S101，输入车型图像并划分为训练样本与测试样本；

步骤S102，根据输入图像的类别标签，设计基于细类别和粗类别的类别编码，用于训练；

步骤S103，设计卷积层、池化层、全连接层，对车型特征进行提取；

步骤S104，设计分类函数，根据提取的车型特征进行分类；

步骤S105，设计代价函数，根据预测的样本编码和真实的样本编码，使用对数似然估计计算代价函数；

步骤S106，根据误差，使用梯度下降法对网络的权值和偏移量进行更新；

步骤S107，根据训练得到的网络结构，得到基于卷积神经网络的车型识别方法。

步骤S102中设计类别编码的具体方法为：对于每个细类别标签(原始标签)，找到其所属的粗类别标签，包括车牌、车形和年份。根据细类别标签生成一个one-hot编码y，根据三个粗类别标签，分别生成三个one-hot编码y1、y2、y3。将四个编码连接到一起，生成类别编码。

步骤S103中设计卷积层的具体方法为：设计使用五层卷积层。在卷积神经网络的第一层使用11x11的过滤器，过滤器个数为96个，在网络的第二层使用5x5的过滤器，过滤器个数为256个，从网络的第三层到第五层均使用3x3的过滤器，过滤器个数分别为384,384,256个。卷积层中，使用ReLU作为激活函数。

步骤S103中设计池化层的具体方法为：在第一层、第二层和第五层卷积层后分别接一层池化层。池化层使用最大池化，选取局部区域的最大值作为该区域的值。

步骤S103中设计全连接层的具体方法为：在最后一层池化层后接三层全连接层，前两层全连接层各有4096个神经元，最后一层神经元有283个神经元。在全连接层中，使用ReLU作为激活函数。

步骤S104中，使用softmax作为分类函数，根据提取的特征，对图像进行分类，输出预测的类别编码。

步骤S105中设计代价函数的具体方法为：根据预测类别编码与真实类别编码，计算对数似然估计。假设真实类的细类别为y，粗类别为y1、y2、y3，找到预测类别编码中对于细类和粗类的似然估计为p、p1、p2、p3,则代价函数Cost＝a1*log p+a2*log p1+a3*log p2+a4*log p3。其中a1、a2、a3、a4为系数，用于权衡各个类的重要程度。

附图说明

后文将参照附图以示例性而非限制性的方式详细描述本发明的一些具体实施例。附图中相同的附图标记标示了相同或类似的部件或部分。本领域技术人员应该理解，这些附图未必是按比例绘制的。本发明的目标及特征考虑到如下结合附图的描述将更加明显，附图中：

图1为根据本发明实施例的一种基于卷积神经网络的细粒度车型识别方法的训练流程图。

图2为根据本发明实施例的卷积神经网络结构图。

图3为根据本发明实施例的结构标签图。

具体实施方式

为了使得本发明能够针对其发明要点更加明显易懂，下面将结合附图和实例对本发明作进一步的说明。在下面的描述中阐述了很多细节和具体实例，提供这些实例是为了能够更透彻地理解本发明，并且能够将本发明完整形象地传达给本领域的技术人员。虽然本发明能够以很多不同于此的描述的其它方式实施，但是本领域技术人员可以在不违背本发明内涵的情况下做相应的推广，因此本发明不受下面公开的具体实例及具体附图所限制。

虽然本发明已经参考特定的说明性实施例进行了描述，但是不会受到这些实施例的限定而仅仅受到附加权利要求的限定。本领域技术人员应当理解可以在不偏离本发明的保护范围和精神的情况下对本发明的实施例能够进行改动和修改。

图1展示了本发明一个实施例的基于卷积神经网络的车型识别方法的训练流程图。包括以下步骤：步骤S101，输入车型图片集，每张图片包含一个具体的车型的图片，同时在数据库中标注对应车型的标签。图片集共含有16000张图片，根据车辆的品牌、型号、车身形态(即车形)、年份精确的分为了196个类别，称为车型的细粒度标签(或原始标签)，将整个图片集按1:1分为训练集与测试集，用于卷积神经网络的训练和学习。步骤S102，根据原有的图片标签，按照其细粒度分类和粗粒度分类，根据one-hot编码，分别生成细粒度和粗粒度one-hot编码，并按顺序连接。步骤S103，根据训练集图片集，训练卷积神经网络，学习不同车型的特征。S104，根据学习的车型特征，训练车型分类器。S105，使用学习到的分类器对测试集图片进行分类，使用得到的分类编码与真实的分类编码进行比较，计算代价函数。S106，通过代价函数对卷积神经网络中的权值和偏移量进行更新。

本实施中采用了经典的反向传播算法来训练卷积神经网络，所述反向传播算法包括正向传播和反向传播过程组成。正向传播过程中，训练图片通过输入层经过卷积、池化等操作，逐层处理传到输出层。如果在输出层中输出的标签编码和实际的标签编码不同，则根据代价函数计算误差，转入反向传播。按照与输入相反的方向，从输出层开始，逐层计算代价函数相对于各个神经元权值的偏导数，构成代价函数对权值向量的梯度，作为修改权值的依据，网络的学习即是指不断的进行权值修改，直到代价函数的值达到期望范围内，此时网络学习结束，得到对车型分类的卷积神经网络结构。

图2展示了本发明一个实施例的卷积神经网络结构图。网络总共包含八层，其中包含五个卷积层和三个全连接层。首先，读取三通道的彩色图片并将图片大小调整为224*224。在第一层中使用96个11x11的过滤器进行卷积操作，并进行池化。在第二层中使用256个5x5的过滤器进行卷积操作，并进行池化。在第三层和第四层中使用384个3x3的过滤器进行卷积操作。在第五层中使用256个3x3的过滤器进行卷积操作，并进行池化。第六层和第七层为全连接层，均含有4096个神经元。由于数据总共分为196个类，其中按品牌、车形、年款三个粗类可分别分为49、22、16个粗类，因此最后一层全连接层含有196+49+22+16＝283个神经元。最后一层连接层后接softmax函数作为分类函数进行车型分类。

优选实施例中涉及的卷积神经网络中卷积层和全连接层均使用了激活函数和池化操作。激活函数是一种非线性的函数，用于获取非线性输出，以获取更好的特征表示。本实施中，每层均使用ReLU函数作为激活函数。池化是对输入的特征图进行压缩，一方面使特征图变小，简化网络计算复杂度，一方面进行特征压缩，提取主要特征。本实施中，每层使用最大池化进行池化操作。

图3展示了本发明一个实施例的结构标签编码方式。原始类别包含196种，按照品牌、车形、年款三个属性进行粗分类，并根据原始类和每个粗类生成one-hot编码。其中按品牌、车形、年款三个属性分别进行粗分类可依次分为49、22、16个粗类别，连接一个细类和三个粗类的编码生成新的编码用于类别表示，标签向量的长度为196+49+22+16＝283维。

Claims

1.一种基于卷积神经网络的细粒度车型识别方法，其特征在于包括如下步骤：

步骤S101，输入车型图像并划分为训练样本与测试样本；

步骤S104，设计分类函数，根据提取的车型特征进行分类；

步骤S106，根据代价函数，使用梯度下降法对网络的权值和偏移量进行更新；

步骤S107，根据训练得到的网络结构，实现基于卷积神经网络的车型识别方法。

2.根据权利要求1所述的一种基于卷积神经网络的细粒度车型识别方法，其特征在于所述步骤S102中设计类别编码的具体方法为：对于每个细类别标签(即原始标签)，找到其所属的粗类别标签，包括车牌、车形和年份，根据细类别标签生成一个one-hot编码y，根据三个粗类别标签，分别生成三个one-hot编码y1、y2、y3，将四个编码连接到一起，生成类别编码。

3.根据权利要求1所述的一种基于卷积神经网络的细粒度车型识别方法，其特征在于所述步骤S103中设计卷积层的具体方法为：设计使用五层卷积层，在卷积神经网络的第一层使用11x11的过滤器，过滤器个数为96个，在网络的第二层使用5x5的过滤器，过滤器个数为256个，从网络的第三层到第五层均使用3x3的过滤器，过滤器个数分别为384,384,256个，卷积层中，使用ReLU作为激活函数。

4.根据权利要求1所述的一种基于卷积神经网络的细粒度车型识别方法，其特征在于所述步骤S103中设计池化层的具体方法为：在第一层、第二层和第五层卷积层后分别接一层池化层，池化层使用最大池化，选取局部区域的最大值作为该区域的值。

5.根据权利要求1所述的一种基于卷积神经网络的细粒度车型识别方法，其特征在于所述步骤S103中设计全连接层的具体方法为：在最后一层池化层后接三层全连接层，前两层全连接层各有4096个神经元，最后一层神经元有283个神经元，全连接层中，使用ReLU作为激活函数。

6.根据权利要求1所述的一种基于卷积神经网络的细粒度车型识别方法，其特征在于所述步骤S104中，使用softmax作为分类函数，根据提取的特征，对图像进行分类，输出预测的类别编码。

7.根据权利要求1所述的一种基于卷积神经网络的细粒度车型识别方法，其特征在于所述步骤S105中设计代价函数的具体方法为：根据预测类别编码与真实类别编码，计算对数似然估计，假设真实类的细类别为y，粗类别为y1、y2、y3，预测类别编码中对于细类和粗类的似然估计为p、p1、p2、p3,则代价函数Cost＝a1*log p+a2*log p1+a3*log p2+a4*logp3，其中a1、a2、a3、a4为系数，用于权衡各个类的重要程度。