CN110321803A

CN110321803A - 一种基于srcnn的交通标志识别方法

Info

Publication number: CN110321803A
Application number: CN201910499090.6A
Authority: CN
Inventors: 曹宇; 孔金迪; 张绩成; 陈可佳
Original assignee: Nanjing Post and Telecommunication University
Current assignee: Nanjing Post and Telecommunication University
Priority date: 2019-06-10
Filing date: 2019-06-10
Publication date: 2019-10-11
Anticipated expiration: 2039-06-10
Also published as: CN110321803B

Abstract

本发明公开了一种基于SRCNN的交通标志识别方法，包括以下步骤：步骤一：对输入的交通标志图像进行图像预处理：将输入的交通标志图像的像素与处理分界点像素进行比较，对于像素小于处理分界点像素的图像，利用基于SRCNN的超分辨率重建算法将输入图像重建为处理分界点像素的图像；对于像素不小于处理分界点像素的图像，利用双线性插值算法缩小为处理分界点像素的图像；步骤二：对Lenet‑5卷积神经网络进行训练，得到Lenet‑5卷积神经网络模型；步骤三：将步骤一预处理后的交通标志图像输入步骤二得到的Lenet‑5神经网络模型进行识别，得到交通标志图像类别。本发明具有能提高低分辨率图像识别准确率且计算量小的优点。

Description

一种基于SRCNN的交通标志识别方法

技术领域

本发明涉及图像处理技术领域，具体涉及一种基于SRCNN的交通标志识别方法。

背景技术

随着智能交通的发展，自动驾驶汽车的多项技术也受到了广泛关注和研究。为了帮助驾驶员判断前进方向，限速范围以及当前的道路情况,交通标志识别(TSR)成为了智能交通系统中不可忽视的问题，得到了国内外研究人员的广泛关注。

当前，关于交通标志的识别分类算法主要包括径向基函数方法、多层决策树分类法，支持向量机分类法，句法分类和卷积神经网络等。

在径向基函数方法中(黄锋.基于径向基函数神经网络的图像识别研究[D].太原理工大学,2007)，使用降维显著地降低计算量，对提高处理速度，保证系统的实时性要求具有重要的意义。径向基函数网络的实质是降维映射，因而在交通标志的分类中获得应用。相关文献采用径向基函数网络进行分类，其中径向基函数采用线性斜坡函数而非高斯函数。径向基函数网络具有拓扑结构简单、易于学习训练的优点，但基函数的选择比较困难，且网络的泛化能力有限。

在多层决策树分类法中(Lei Song and Zheyuan,“Color-based traffic signdetection”,2012International Conference on Quality,Reliability,Risk,Maintenance,and Safety Engineering)，采用多层结构的决策树进行分类，比采用单分类器分类能加快处理速度、提高分类结果的精度，而且通过将相关特征分解到各层简化分类器的设计。相关文献提出根据颜色、形状以及图元的三层决策树的分类方法，每个树的节点都是一个统计分类器。对彩色图像和黑白图像都可以采用这种任务分解的方法进行分类。交通标志可根据颜色信息或几何形状的先验知识逐层分解进行分类。在分类器的设计中，有的文献采用基于laplace-kernel分类器(P Pacllk,JP Pudil,P Somol,“road sign classification using Laplace kernel classifier”,PatternRecognition Letters,2000:1165-1173)。这类方法具有并行结构，可采用计算机并行算法实现，以提高处理速度，但优化的决策树的设计是个难点，目前，大都依靠经验知识，而且分类器的参数选择也较复杂。

在支持向量机分类法中，由于支持向量机根据结构风险最小化原理进行设计，所以具有结构简单、泛化能力强等特点，是一种新的模式识别分类方法。在相关文献中(JGPark,KJ Kim,“Design ofa visual perception model with edgeadaptive Gaborfilter and support vector machine for traffic sign detection”,Expert Systemswith Applications,2013:3679-3687)，也有采用支持向量机确定交通标志的类型。但是，这部分的研究才刚刚开始，目前的处理时间还较大，如何构造合适的核函数还尚未解决。

在句法分类方法中，利用目标的结构特征对目标进行描述和识别，在交通标志识别中也是人们关注的重点之一。有的文献根据颜色、形状、基本图元以及相互的位置，建立语义网对交通标志进行描述，采用LISP语言在符号化的工作站上编程实现。针对侦测的不确定性知识，采用证据理论融合各种知识后，采用语义网对交通标志进行分类。但是对于复杂的目标，只提取它的数值特征构成特征向量，往往不能全面对其进行描述，这是因为这些数值特征不能反映目标的结构信息。

基于卷积神经网络(CNN，Convolutional Neural Network)的交通标志识别算法因为学习能力强，权值共享、正确率高等优点得到了研究人员的高度关注。但在实际场景中，由于受到周围环境(如恶劣天气)等不确定性因素的影响，系统捕捉到的交通标志图像较为模糊，分辨率低。所以仅使用这种方法对该种情况适应能力较差，准确率难以保证。因此，需要设计一种能提高低分辨率图像识别准确率的交通标志识别算法。

超分辨率重建卷积神经网络(SRCNN，Super-Resolution Convolutional NeuralNetwork)是一种进行图像超分辨率重建的经典算法，通过该算法可以将低分辨率图像还原为高分辨率图像。使用SRCNN对图像进行预处理并应用于交通标志识别网络，可以改善对低分辨率图像的识别准确率。

现阶段，《陕西师范大学学报(自然科学版)》2017年02期公开了一种“基于二级改进LeNet-5的交通标志识别算法”，该算法以真实场景中拍摄的交通标志图像数据集GTSRB为研究对象，将卷积神经网络与支持向量机相结合；

上述基于二级改进LeNet-5的交通标志识别算法，首先根据识别系统的实时性要求，对原始LeNet-5结构进行改进；然后用裁剪、灰度化、图像增强和尺寸归一化等操作对原始图像进行预处理,得到32×32的感兴趣区域；接下来，利用数据集GTSRB训练出一个二级改进LeNet-5，其中第一级改进LeNet-5将感兴趣区域中包含的交通标志粗分为6类，第二级改进LeNet-5对粗分类结果进行细分类，识别出交通标志所属的最终类别。实验结果表明，基于二级改进LeNet-5交通标志识别算法因网络模型能够提取交通标志的多尺度特征，识别正确率可达91.76％。

但是上述基于二级改进LeNet-5的交通标志识别算法存在以下缺点：该算法的预处理过程只是简单的对输入图像进行缩放的处理，而原图在缩放过程中容易丢失部分信息，尤其是将小尺寸图像放大成大尺寸图像时，放大后的图像较为模糊，即使肉眼也难以识别，若将其直接作为图像输入进行识别，极有可能造成识别错误。

目前，还有一种交通标志识别方法：先利用图像聚类算法对原始数据集进行样本优化；然后采用多种图像预处理操作使样本整体质量进一步提升；最后构造了深度为9的CNN结构，通过多次训练得到最终的网络模型，将待识别的图像输入到CNN模型来实现自动识别。在德国交通标志数据集(GTSRB)和比利时交通标志数据集(BTSD,Belgium trafficsign dataset)上证明了算法的有效性，单张图片的识别速度只需0.2s,识别精度高达98.5％以上。本算法具有识别速度快、准确率高的特点，可为智能驾驶的可靠性和安全性提供理论依据和技术支持。但是上述算法存在以下缺点：方案二的训练过程中的计算量非常大，对硬件要求较高，操作复杂，且非常耗时。所采用的CNN结构参数复杂，输入和输出特征较多。

发明内容

本发明的目的是提供一种能提高低分辨率图像识别准确率且计算量小的基于SRCNN的交通标志识别方法。

为实现上述目的，本发明采用了如下技术方案：一种基于SRCNN的交通标志识别方法，包括以下步骤：

步骤一：对输入的交通标志图像进行图像预处理：先定义处理分界点像素；然后将输入的交通标志图像的像素与处理分界点像素进行比较，对于像素小于处理分界点像素的图像，利用基于SRCNN的超分辨率重建算法将输入图像重建为处理分界点像素的图像；对于像素不小于处理分界点像素的图像，利用双线性插值算法缩小为处理分界点像素的图像；

步骤二：对Lenet-5卷积神经网络进行训练，得到Lenet-5卷积神经网络模型；

步骤三：将步骤一中预处理后的交通标志图像输入步骤二得到的Lenet-5神经网络模型进行识别，得到该交通标志图像的类别。

进一步地，前述的一种基于SRCNN的交通标志识别方法，其中：在步骤一中，使用基于SRCNN的超分辨率重建方法对输入图像进行超分辨率重建的具体步骤如下：

步骤(1.1)：将输入图像P按照R、G、B三个通道进行分割，对每个通道的图片分别进行超分辨率重建，使用ReLu作为激活函数d(x)＝max(0,x)；

(1.1.1)对G通道的矩阵G：

Y₁＝d(G*W₁+B₁)

Y₂＝d(Y₁*W₂+B₂)

Y₃＝d(Y₂*W₃+B₃)

其中，Y_i为第i层卷积层的输出特征，作为第i+1层的输入，B_i和W_i为第i层的偏置和权重，*表示卷积运算；其中，权重初始为正态分布，偏置初始化为0；第一层卷积网络对输入的图片进行特征提取，第二层对第一层提取的特征进行非线性映射，第三层生成高分辨率图像；

(1.1.2)对B通道的矩阵B：

Y₁＝d(B*W₁+B₁)

Y₂＝d(Y₁*W₂+B₂)

Y₃＝d(Y₂*W₃+B₃)

(1.1.3)对R通道的矩阵R：

Y₁＝d(B*W₁+B₁)

Y₂＝d(Y₁*W₂+B₂)

Y₃＝d(Y₂*W₃+B₃)

步骤(1.2)：对经超分辨率重建后的R、G、B三个颜色通道进行合成，生成处理分界点像素的图像；

其中，采取MSE作为损失函数E^N，步长为1，补零填充，将Adam作为优化器进行误差的反向传播；

其中，N为样本个数，g为输入的类别，y为输出，label为标签。

进一步地，前述的一种基于SRCNN的交通标志识别方法，其中：在步骤二中，采用mini-batch的反向传播方法对Lenet-5卷积神经网络的进行训练，具体步骤如下：

步骤(2.1)：前向传播阶段：

步骤(2.1.1)：从进行过超分辨率重建或双线性插值的训练集中取出训练样本(x_t,y_t)，将x_t作为卷积神经网络的输入，y_t作为前向传播结果的标签；

步骤(2.1.2)将输入依次送入Lenet-5卷积神经网络的7层神经网络，其中，

第一层为第一卷积层：卷积核大小为5x5像素，步长为1像素，特征图个数为32个；第一卷积层的形式如下所示：

其中，l代表层数，k是卷积核，M_j代表输入特征图的一个选择。每个输入图像有一个偏置b；

第二层为第一池化层：池化窗口大小为2x2像素，步长为2像头，采用最大池化方式；

第三层为第二卷积层：卷积核大小为5x5像素，步长为1像素，特征图个数为32个；

第四层为第二池化层：池化窗口大小为2x2像素，步长为2像素，采用最大池化方式；

第五层为第一连接层：神经元个数为512个，采用能防止网络训练出现过拟合的dropout算法，隐含节点dropout率设置为0.5；

第六层为第二连接层：神经元个数为43个，节点数目转换；

第七层为softmax，其中，softmax函数如下所示：

其中，C是样本种类数，是第i类结果的第六层的输出；取最大值作为预测值p_t；

步骤(2.2)：反向传播阶段：

根据交叉熵函数，计算各层网络节点的偏导数，并更新权重参数，进行反向传播，直至完成一次迭代；

其中，交叉熵函数如下所示：

L＝-(y_t logp_t+(1-y_t)log(1-p_t))

其中，p_t为预测值，y_t为实际值；

步骤(2.3)：重复进行前向传播与反向传播阶段，直至达到设定的迭代次数后，训练终止，此时得到的网络模型即为最终的结果。

进一步地，前述的一种基于SRCNN的交通标志识别方法，其中：第一池化层、第二池化层及第二连接层中采用能将输出结果映射到(0,1)区间的sigmoid激活函数。

通过上述技术方案的实施，本发明的有益效果是：能提高低分辨率图像识别准确率，计算量小。

附图说明

图1为本发明所述的一种基于SRCNN的交通标志识别方法的识别流程图。

图2为本发明中基于SRCNN的超分辨率重建方法的流程示意图。

图3为本发明中sigmoid函数图像。

图4为本发明中输入为28*28时的损失函数图像。

图5为本发明中输入为48*48时的损失函数图像。

具体实施方式

下面结合附图和具体实施例对本发明作进一步详细说明。

如图1所示，所述的一种基于SRCNN的交通标志识别方法，包括以下步骤：

其中，如图2所示，使用基于SRCNN的超分辨率重建方法对输入图像进行超分辨率重建的具体步骤如下：

(1.1.1)对G通道的矩阵G：

Y₁＝d(G*W₁+B₁)

Y₂＝d(Y₁*W₂+B₂)

Y₃＝d(Y₂*W₃+B₃)

(1.1.2)对B通道的矩阵B：

Y₁＝d(B*W₁+B₁)

Y₂＝d(Y₁*W₂+B₂)

Y₃＝d(Y₂*W₃+B₃)

(1.1.3)对R通道的矩阵R：

Y₁＝d(B*W₁+B₁)

Y₂＝d(Y₁*W₂+B₂)

Y₃＝d(Y₂*W₃+B₃)

其中，N为样本个数，g为输入的类别，y为输出，label为标签；

其中，如图3所示，采用mini-batch的反向传播方法对Lenet-5卷积神经网络的进行训练，具体步骤如下：

步骤(2.1)：前向传播阶段：

第二层为第一池化层：池化窗口大小为2x2像素，步长为2像头，采用最大池化方式，并采用能将输出结果映射到(0,1)区间的sigmoid激活函数；

第四层为第二池化层：池化窗口大小为2x2像素，步长为2像素，采用最大池化方式，并采用能将输出结果映射到(0,1)区间的sigmoid激活函数；

第六层为第二连接层：神经元个数为43个，节点数目转换，并采用能将输出结果映射到(0,1)区间的sigmoid激活函数；

第七层为softmax，其中，softmax函数如下所示：

步骤(2.2)：反向传播阶段：

其中，交叉熵函数如下所示：

L＝-(y_t logp_t+(1-y_t)log(1-p_t))

其中，p_t为预测值，y_t为实际值；

步骤(2.3)：重复进行前向传播与反向传播阶段，直至达到设定的迭代次数后，训练终止，此时得到的网络模型即为最终的结果；

改进后的Lenet-5网络结构如下表所示：

表1改进的Lenet-5网络结构

以28′28像素的图片作为Lenet-5网络的输入数据，采用背景技术中的识别方法进行交通标志识别的准确率为89.24％，而采用本发明所述的基于SRCNN的交通标志识别方法进行交通标志识别的准确率为89.48％；提升幅度为0.24％。

以48′48像素的图片作为Lenet-5网络的输入数据，采用背景技术中的识别方法进行交通标志识别的准确率为91.08％，而采用本发明所述的基于SRCNN的交通标志识别方法进行交通标志识别的准确率为91.32％，提升了0.23％。损失函数的图像如图4、图5所示。

本发明的优点是：在训练和使用交通标志进行识别的神经网络的过程中，使用SRCNN超分辨率算法对输入图像进行更复杂且精确的预处理，使低分辨率图像经过处理后能得到较高分辨率的图像，进而提高低分辨率图像识别准确率；并且对Lenet-5卷积神经网络进行改进，计算量小。

Claims

1.一种基于SRCNN的交通标志识别方法，其特征在于：包括以下步骤：

2.根据权利要求1所述的一种基于SRCNN的交通标志识别方法，其特征在于：在步骤一中，使用基于SRCNN的超分辨率重建方法对输入图像进行超分辨率重建的具体步骤如下：

(1.1.1)对G通道的矩阵G：

Y₁＝d(G*W₁+B₁)

Y₂＝d(Y₁*W₂+B₂)

Y₃＝d(Y₂*W₃+B₃)

(1.1.2)对B通道的矩阵B：

Y₁＝d(B*W₁+B₁)

Y₂＝d(Y₁*W₂+B₂)

Y₃＝d(Y₂*W₃+B₃)

(1.1.3)对R通道的矩阵R：

Y₁＝d(B*W₁+B₁)

Y₂＝d(Y₁*W₂+B₂)

Y₃＝d(Y₂*W₃+B₃)

3.根据权利要求1所述的一种基于SRCNN的交通标志识别方法，其特征在于：在步骤二中，采用mini-batch的反向传播方法对Lenet-5卷积神经网络的进行训练，具体步骤如下：

步骤(2.1)：前向传播阶段：

第六层为第二连接层：神经元个数为43个，节点数目转换；

第七层为softmax，其中，softmax函数如下所示：

步骤(2.2)：反向传播阶段：

其中，交叉熵函数如下所示：

L＝-(y_t log p_t+(1-y_t)log(1-p_t))

其中，p_t为预测值，y_t为实际值；

4.根据权利要求3所述的一种基于SRCNN的交通标志识别方法，其特征在于：第一池化层、第二池化层及第二连接层中采用能将输出结果映射到(0,1)区间的sigmoid激活函数。