CN111325152B

CN111325152B - 一种基于深度学习的交通标志识别方法

Info

Publication number: CN111325152B
Application number: CN202010105769.5A
Authority: CN
Inventors: 刘哲; 贺国平; 杨佳现; 陈子豪; 刘宇豪
Original assignee: Beijing University of Technology
Current assignee: Beijing University of Technology
Priority date: 2020-02-19
Filing date: 2020-02-19
Publication date: 2023-09-26
Anticipated expiration: 2040-02-19
Also published as: CN111325152A

Abstract

一种基于深度学习的交通标志识别方法属于图像识别领域。包括以下步骤：步骤一、获取交通标志数据集，并对数据集进行预处理。步骤二、构建TSR_ConvNet网络结构进行训练。TSR_ConvNet网络加入改善过拟合的Dropout策略，加入批量归一化层。设计合适的卷积核尺寸。全连接层的softmax分类层采用Label‑smoothing策略。步骤三、将预处理后的交通标志图像输入到TSR_ConvNet网络模型，进行交通标志识别。本发明在保证较高准确率的情况下简化了模型结构，使得模型计算量小从而训练时间大幅减少，具有更好的实用性。

Description

一种基于深度学习的交通标志识别方法

技术领域

本技术属于图像识别领域，是一种基于卷积神经网络进行特征提取，可应用于道路交通标志的识别。

背景技术

交通标志载有大量有效道路信息，对于调节交通流量缓解交通拥堵和预示道路路况防止发生交通事故起到了重要指示作用。然而真实的自然环境复杂多变，交通标志识别的准确性和实时性极易受到交通标志褪色变形、复杂的光照环境以及天气变化、交通标志被障碍物遮挡、汽车运动导致图片模糊等因素的影响。因此快速可靠的交通标志识别系统成为辅助驾驶与智慧交通系统的重要组成部分。现有的交通标志识别方法根据所采用的技术的不同，可总体上划分为以下三类：HSV颜色空间的阈值图像分割技术，基于人工提取特征和机器学习相结合的分类技术和基于卷积神经网络进行特征提取从而进行识别的技术。基于HSV颜色空间的阈值图像分割技术根据交通标志颜色的不同进行识别，能够有效识别出不同类别的交通标志。比如红色代表停止、禁止类，蓝色代表指示标志类，黄色代表注意警告类，绿色代表安全类。然而由于每种大类下面可细分出不同小类的交通标志，对具体的交通标志类型识别率不高。基于人工提取特征和机器学习相结合的技术，采用方向梯度直方图、LBP特征等方法进行特征提取。然后采用传统的分类器进行分类。比如支持向量机、随机森林分类器、AdaBoost算法等。然而该方法针对不同的类别的交通标志，需要设计不同的特征。人工设计特征的好坏往往导致交通标志图像的识别精度和识别效率有较大起伏，在实际应用中存在着很大的挑战。随着人工智能的发展，深度学习为交通标志识别提供了一种新的方案。卷积神经网络可以在不进行预处理的情况下从大量样本中学习特征，不仅避免了手工制作特征的设计难度，而且还可以训练更多的特征，大大提高了交通标志识别的准确性。目前主流的卷积神经网络框架有用于手写数字识别的LeNet-5,用于图像分类的AlexNet、VGGNet等。虽然它们能够取得很高的识别准确率，但在训练的过程中计算量非常大，对硬件的要求较高，操作复杂，而且训练非常耗时。

发明内容

本发明提供一种基于改进的卷积神经网络模型的交通标志识别方法。具有训练时间短、识别准确率高、良好的泛化能力的特点。使用德国交通标志数据集(GTSRB)进行交通标志分类识别实验。实验结果表明，在GTSRB基准数据集上获得98.74％以上的识别准别率以及每幅图像17ms的识别速度。本发明构建的交通标志识别模型TSR_ConvNet具有模型的参减少、模型训练时间短，在1.5h内能够训完成。

本发明通过对数据集进行预处理，得到了高质量的数据集。包括为交通标志图像采用加权平均法进行灰度化处理、对比度受限的自适应直方图均衡化(CLAHE)、提升数据集平衡性的数据增广(加噪、模糊、旋转)。采用Random erasing方法，解决交通标志识别过程中遇到物体遮挡问题，提高模型的泛化性，解决了过拟合问题。

本发明提出了一种用于交通标志识别的TSR_ConvNet网络模型。基于经典的Lenet-5卷积神经网络进行改进。包括加入改善过拟合的Dropout策略，在卷积层DropoutRatio设置为0.2，全连接层Dropout Ratio设置为0.5。在卷积层后面添加批量归一化层即Batch Normalization层，防止过拟合和梯度消失，加速训练。卷积核尺寸由5×5改成3×3，减少了计算量，加快了训练速度。并且全连接层的softmax分类层采用Label-smoothing策略，使算法具有更好的鲁棒性。

为了实现上述问题，本发明提供了一种改进的基于卷积神经网络模型的交通标志识别方法。该方法具体包括：

步骤1、获取交通标志数据集，并将该数据集分为训练集和测试集。然后对交通标志数据集中数据进行预处理，得到经过与处理后的交通标志数据集，并且在下面的步骤对本数据集进行操作；

步骤1具体包含以下步骤：

步骤1.1输入一幅大小为W*H的原始交通标志图像，并设定其尺寸归一化后的目标尺寸为32*32，W为原始图像宽度，H为原始图像的高度，32为目标图像的高度，32为目标图像的高度；

步骤1.2将尺寸归一化后的交通标志图片进行灰度化处理，由彩色图片转换为灰度图片；

步骤1.3通过将图像随机旋转，缩放，移动，剪切或翻转操作，创建一些新的数据来平衡各类交通标志图像的分布。并且采用Random erasing方法，解决交通标志识别过程中遇到物体遮挡问题。最后通过直方图均衡算法调高图像整体对比度，使交通标志图像更加清晰；

步骤2、对卷积神经网络模型的结构进行改进，通过Keras和Tensorflow构建改进后的交通标志识别模型，将训练集样本输入TSR_ConvNet模型，采用mini-batch的反向传播方法进行训练。

步骤2具体包含以下步骤：

步骤2.1将进行过预处理的训练数据集输入到12层的TSR_ConvNet模型，进行向前传播；即图片特征从输入层向前传播，经过5个卷积层，3个池化层以及2个全连接层，通过输出层得到网络的输出结果；对于l层i单元和l-1层k个单元，其过程如下:

其中w，b是l层的权重和偏差，为l-1层的输入，/>为第l层的输出。

步骤2.2根据负对数似然函数计算预测输出值与实际值之间的误差，通过链式求导法计算各层网络节点的偏导数，然后采用随机梯度下降算法(SGD)更新权重参数，进行反向传播，直至完成一次迭代；权重更新公式为：

其中，W₂，b₂为第l层更新后的权重和偏移量。W₁，b₁为更新前的权重和偏移量。η为学习率，为第l层权重的梯度，/>为第l层偏移量的梯度。

步骤2.3重复进行向前传播和反向传播阶段，直到达到设定的迭代次数10次后或者当loss在3次迭代稳定时调用回调函数，训练终止，此时得到训练好的模型；

步骤3、将训练好的卷积神经网络模型导出保存在本地。通过加载训练好的模型对新的交通标志图像进行预测，得到预测结果。

步骤1的具体过程为：

①原始数据集中交通标志图像的大小分布不均,图像大小为：15x15到250×250，统计发现图像尺寸长宽分布的中位数是41x40。综合考虑运算量和图像细节,对交通标志图片尺寸归一化为32*32。将训练集中的图片随机打散后按照8:2分成训练集和验证数据集，测试集仍然作为测试集。

②对数据集中的彩色交通标志图像进行灰度化处理，转换为灰度图片。为了不降低图像细节部分的信息，本文采用加权平均法对图像进行灰度化处理。

Gray＝0.3R+0.59G+0.11B (4)

公式(1)中，R、G、B分别为彩色图像中的红、绿、蓝3个颜色分量,Gray表示计算出的灰度值大小。

③对训练集进行图像增强处理，获得高质量和分布均匀的数据集。具体为：(1)在keras中采用ImageDataGenerator方法构造图像生成器，进行数据增强。通过将图像随机旋转，缩放，移动，剪切或翻转操作，创建一些新的数据来平衡各类交通标志图像的分布。(2)采用Random erasing方法，解决交通标志识别过程中遇到物体遮挡问题。(3)采用直方图均衡算法调高图像整体对比度。

步骤2的具体过程为：

④本发明中以LeNet-5网络为基础，通过优化CNN结构，调整网络参数，构造了一个深度为12的TSR_ConvNet结构。其中卷积神经网络结构包括1个输入层、1个输出层、2个全连接层、5个卷积层、3个采样层。其中，

第一层为输入层：输入图像样本的像素值大小为32×32。

第二层为卷积层C1：有32个大小为32×32的特征图，卷积核尺寸为5×5，步长为1像素。

第三层为池化层S2：有32个大小为16×16的特征图，卷积核尺寸为2×2。

第四、五层分为卷积层C3、C4：有64个大小为16×16的特征图，卷积核尺寸为3×3

第六层为池化层S5：64个大小为8×8的特征图，卷积核尺寸为2×2

第七、八层为卷积层C6、C7：有128个大小为8×8的特征图，卷积核尺寸为3×3

第九层为池化层S8：有128个大小为4×4的特征图，卷积核尺寸为2×2

第十层为全连接层F9：神经元个数为512个

第十一层为全连接层F10：神经元个数为258个

第十二层为输出层：输出层的神经元个数为43个，采用softmax函数，分别用于识别43类交通标志。

⑤本发明中池化方式采用最大池化方式。激活函数采用ReLU函数f(x)＝max(0,x)。0.001作为初始学习率，通过Adam优化器设置动态学习率，使学习率随着迭代次数增加逐渐变小，从而达到更好的训练效果。

⑥本发明中的损失函数为负对数似然函数。成本函数定义为当前批次的损失函数的平均值。卷积神经网络训练的过程是通过梯度下降法使代价函数最小化。负对数似然函数由方程组(5)描述：

L(r,y)＝-[ylnr+(1-y)ln(1-r)] (5)

其中r是通过卷积神经网络向前传播获得的每个类别的计算概率，

y是每个类别的真实概率,为负对数似然函数的输出值；

成本函数由方程式(6)(7)描述：

其中w，b是输出全连接层的权重和偏差，m是迭代次数，r是通过卷积神经网络向前传播获得的每个类别的计算概率，y是每个类别的真实概率，为当前批次通过损失函数计算的损失值，为当前批次损失函数计算的损失值的平均值；

⑦为提高模型的泛化能力，解决模型过拟合，采用方法如下：1、在改进模型中增加Dropout层，设置Dropout率在卷积层为0.2，全连接层为0.5。2、在卷积操作形成的特征层添加归一化函数。3、在全连接层的softmax分类层采用Label-smoothing策略4、训练轮次比较多的情况下,增加回调函数,当算法在训练过程中loss稳定时算法调用回调函数提前停止训练。

其中归一化算法的具体步骤如下：

批处理输入交通标志图像数据集：β＝{x_i…m}，输出：规范后的网络{y_i＝BN_γ,β(x_i)}；计算给定数据集的批处理均值和方差：

其中为输入的交通标志图像，m为当前批次的大小，为均值，为方差；

规范化

其中，ε是避免除数为0时所加的一个很小的正值1e-8，x_i为数据集中每个数据进行归一化后的值，x_i为输出的数据集值，μ_β为均值，为方差；

尺度变化和偏移，然后返回学习到的参数γ和β；

y_i←γx_i+β＝BN_γ,β(x_i) (11)

其中，γ是尺度因子；β是平移因子，y_i为进行规范化后的输出值；实现Label-smoothing regularization正则化方法，在标签m中加入噪声，实现对模型约束，降低模型过拟合程度。本发明中将损失的目标值从1降到0.9以及从0升到0.1。将真实的概率改造为：

其中，ε是一个小的常数为0～0.1，K是类别的数目，m是图片的真正的标签，i代表第i个类别，qi是图片为第i类的概率。

步骤3的具体过程为：

将训练好的卷积神经网络模型导出保存在本地。选取测试集中一张交通标志图片，输入到训练好的卷积神经网络模型中，对该交通标志图像进行预测，输出该标志的具体类别。

附图说明：

图1为本发明所涉及的方法流程图。

图2为本发明使用的卷积神经网络结构图

图3为本发明使用的卷积神经网络参数图

图4为本发明模型训练时精度损失图。

具体实施方式：

本发明所用到的硬件平台：系统的硬件环境拟采用Intel(R)Core(TM)i7-4702作为处理器，采用8G内存和1TB的机械硬盘用来储存系统数据，同时使用NVIDIA GTX1050显卡来加速图形化处理的PC机1台。软件环境：Anaconda3，Tensorflow2.0，Kares，Python，OpenCV，CUDA/Cudnn等。

如图1所示，本发明提供了一种交通标志识别的方法流程图。

具体包括如下步骤：

步骤1具体包含以下步骤：

步骤1.1获取交通标志图片数据集，数据集中样本的大小为16×16至250×250。统一对交通标志图片进行归一化操作。例如一张原始交通标志图片大小为W*H，尺寸归一化后的目标尺寸为32*32，W为原始图像宽度，H为原始图像的高度，32为目标图像的高度，32为目标图像的高度；

步骤1.3在keras中采用ImageDataGenerator方法构造图像生成器，进行数据增强。通过将图像随机旋转，缩放，移动，剪切和翻转操作，创建一些新的数据来平衡各类交通标志图像的分布。并且采用Random erasing方法，解决交通标志识别过程中遇到物体遮挡问题。最后通过直方图均衡算法调高图像整体对比度，使交通标志图像更加清晰；

步骤2具体包含以下步骤：

步骤2.1将进行过预处理的训练数据集输入到12层的TSR_ConvNet模型，进行向前传播；即图片特征从输入层向前传播，经过5个卷积层，3个池化层以及2个全连接层，通过输出层得到网络的输出结果；

步骤2.2根据负对数似然函数计算预测输出值与实际值之间的误差，通过链式求导法计算各层网络节点的偏导数，然后采用随机梯度下降算法(SGD)更新权重参数，进行反向传播，直至完成一次迭代；

步骤3、将训练好的卷积神经网络模型导出保存在本地。按照步骤1中预处理后的测试集交通标志图像输入到步骤2得到的改进后的卷积神经网络模型进行识别，得到该交通标志的类别。

采用传统的HOG+SVM方法进行交通标志识别的准确率为95.68％，而本发明中交通标志识别方法准确率为98.74％，提升了3.06％。采用VGG卷积神经网络对本发明中的数据集进行交通标志识别的准确率为98.23％，训练时间为11h。而本发明中交通标志的识别率提升了0.51％。训练时间为1.5H。

通过上述方式，本发明构建了一种基于改进的卷积神经网络的交通标志识别方法。本发明对Lenet-5卷积神经网络进行改进，改进后的模型参数量减少，计算量减少，训练速度变快，识别准确率达到98.74％，具有更好的鲁棒性。

Claims

1.一种基于深度学习的交通标志识别方法，其特征在于，包括以下步骤：

步骤1、获取交通标志数据集，并将该数据集分为训练集和测试集；然后对交通标志数据集中数据进行预处理，得到经过预处理后的交通标志数据集；

步骤1具体包含以下步骤：

步骤1.1输入一幅大小为W*H的原始交通标志图像，并设定其尺寸归一化后的目标尺寸为32*32，W为原始图像宽度，H为原始图像的高度，32为目标图像的高度；

步骤1.3通过将图像随机旋转，缩放，移动，剪切或翻转操作，创建一些新的数据来平衡各类交通标志图像的分布；并且采用Random erasing方法，解决交通标志识别过程中遇到物体遮挡问题；最后通过直方图均衡算法调高图像整体对比度，使交通标志图像更加清晰；

步骤2、对卷积神经网络模型的结构进行改进，通过Keras和Tensorflow构建改进后的交通标志识别模型，将训练集样本输入TSR_ConvNet模型，采用mini-batch的反向传播方法进行训练；

步骤2具体包含以下步骤：

其中w，b是l层的权重和偏差，为l-1层的输入，/>为第l层的输出；

步骤2.2根据负对数似然函数计算预测输出值与实际值之间的误差，通过链式求导法计算各层网络节点的偏导数，然后采用随机梯度下降算法更新权重参数，进行反向传播，直至完成一次迭代；权重更新公式为：

其中，W₂，b₂为第l层更新后的权重和偏移量；W₁，b₁为更新前的权重和偏移量；η为学习率，为第l层权重的梯度，/>为第l层偏移量的梯度；

步骤3、将训练好的卷积神经网络模型导出保存在本地；通过加载训练好的模型对新的交通标志图像进行预测，得到预测结果；

所述步骤2具体为：

以LeNet-5网络为基础，通过优化CNN结构，调整网络参数，构造了一个深度为12的TSR_ConvNet结构；其中卷积神经网络结构包括1个输入层、1个输出层、2个全连接层、5个卷积层、3个采样层；其中，

第一层为输入层：输入图像样本的像素值大小为32×32；

第二层为卷积层C1：有32个大小为32×32的特征图，卷积核尺寸为5×5，步长为1像素；

第三层为池化层S2：有32个大小为16×16的特征图，卷积核尺寸为2×2；

第四、五层分别为卷积层C3、C4：均有64个大小为16×16的特征图，卷积核尺寸为3×3；

第六层为池化层S5：64个大小为8×8的特征图，卷积核尺寸为2×2；

第七、八层分别为卷积层C6、C7：均有128个大小为8×8的特征图，卷积核尺寸为3×3；

第九层为池化层S8：有128个大小为4×4的特征图，卷积核尺寸为2×2；

第十层为全连接层F9：神经元个数为512个；

第十一层为全连接层F10：神经元个数为258个；

第十二层为输出层：输出层的神经元个数为43个，采用softmax函数，分别用于识别43类交通标志；

池化层的池化方式采用最大池化方式；卷积层采用ReLU函数的作为激活函数，ReLU函数定义为：f(x)＝max(0,x)；0.001作为初始学习率，通过Adam优化器设置动态学习率，使学习率随着迭代次数增加逐渐变小，结合梯度的反向传播算法对该卷积神经网络模型中的参数进行更新；

损失函数为负对数似然函数；成本函数定义为当前批次的损失函数的平均值；卷积神经网络训练的过程是通过梯度下降法使代价函数最小化；负对数似然函数由方程组(5)描述：

L(r,y)＝-[ylnr+(1-y)ln(1-r)] (5)

其中r是通过卷积神经网络向前传播获得的每个类别的计算概率，y是每个类别的真实概率,L(r,y)为负对数似然函数的输出值；

成本函数由方程式(6)(7)描述：

其中w，b是输出全连接层的权重和偏差，m是迭代次数，r是通过卷积神经网络向前传播获得的每个类别的计算概率，y是每个类别的真实概率，J(w,b)为当前批次通过损失函数计算的损失值，j(w,b)为当前批次损失函数计算的损失值的平均值；

为提高模型的泛化能力，解决模型过拟合，采用方法如下：1、在改进模型中的池化层后面增加Dropout层，并设置Dropout率为0.2，在全连接层的每层之间添加Dropout层，并设置Dropout率为0.5；2、在卷积操作形成的特征层添加归一化函数即BatchNormalization层；3、在全连接层的softmax分类层采用Label-smoothing策略；4、当算法在训练过程中loss稳定时算法调用回调函数提前停止训练；

其中归一化算法的具体步骤如下：

其中x_i为输入的交通标志图像，m为当前批次的大小，μ_β为均值，为方差；

规范化

其中，ε是避免除数为0时所加的正值，为数据集中每个数据进行归一化后的值，x_i为输出的数据集值，μ_β为均值，/>为方差；

尺度变化和偏移，然后返回学习到的参数γ和β；

其中，γ是尺度因子；β是平移因子，y_i为进行规范化后的输出值；

在全连接层中加入Label-smoothing regularization策略；LSR正则化方法是在标签m中加入噪声，实现对模型约束，降低模型过拟合程度；将损失的目标值从1降到0.9以及从0升到0.1；将真实的概率改造为：

其中，ε是一个常数为0～0.1，K是类别的数目，m是图片的真正的标签，i代表第i个类别，q_i是图片为第i类的概率。

2.如权利要求1所述的方法，其特征在于，所述步骤3具体为：

将训练好的卷积神经网络模型导出保存在本地；选取测试集中一张交通标志图片，输入到训练好的卷积神经网络模型中，对该交通标志图像进行预测，输出该标志的具体类别。