CN110321803A - 一种基于srcnn的交通标志识别方法 - Google Patents
一种基于srcnn的交通标志识别方法 Download PDFInfo
- Publication number
- CN110321803A CN110321803A CN201910499090.6A CN201910499090A CN110321803A CN 110321803 A CN110321803 A CN 110321803A CN 201910499090 A CN201910499090 A CN 201910499090A CN 110321803 A CN110321803 A CN 110321803A
- Authority
- CN
- China
- Prior art keywords
- layer
- pixel
- input
- traffic sign
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/56—Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
- G06V20/58—Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads
- G06V20/582—Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads of traffic signs
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于SRCNN的交通标志识别方法,包括以下步骤:步骤一:对输入的交通标志图像进行图像预处理:将输入的交通标志图像的像素与处理分界点像素进行比较,对于像素小于处理分界点像素的图像,利用基于SRCNN的超分辨率重建算法将输入图像重建为处理分界点像素的图像;对于像素不小于处理分界点像素的图像,利用双线性插值算法缩小为处理分界点像素的图像;步骤二:对Lenet‑5卷积神经网络进行训练,得到Lenet‑5卷积神经网络模型;步骤三:将步骤一预处理后的交通标志图像输入步骤二得到的Lenet‑5神经网络模型进行识别,得到交通标志图像类别。本发明具有能提高低分辨率图像识别准确率且计算量小的优点。
Description
技术领域
本发明涉及图像处理技术领域,具体涉及一种基于SRCNN的交通标志识别方法。
背景技术
随着智能交通的发展,自动驾驶汽车的多项技术也受到了广泛关注和研究。为了帮助驾驶员判断前进方向,限速范围以及当前的道路情况,交通标志识别(TSR)成为了智能交通系统中不可忽视的问题,得到了国内外研究人员的广泛关注。
当前,关于交通标志的识别分类算法主要包括径向基函数方法、多层决策树分类法,支持向量机分类法,句法分类和卷积神经网络等。
在径向基函数方法中(黄锋.基于径向基函数神经网络的图像识别研究[D].太原理工大学,2007),使用降维显著地降低计算量,对提高处理速度,保证系统的实时性要求具有重要的意义。径向基函数网络的实质是降维映射,因而在交通标志的分类中获得应用。相关文献采用径向基函数网络进行分类,其中径向基函数采用线性斜坡函数而非高斯函数。径向基函数网络具有拓扑结构简单、易于学习训练的优点,但基函数的选择比较困难,且网络的泛化能力有限。
在多层决策树分类法中(Lei Song and Zheyuan,“Color-based traffic signdetection”,2012International Conference on Quality,Reliability,Risk,Maintenance,and Safety Engineering),采用多层结构的决策树进行分类,比采用单分类器分类能加快处理速度、提高分类结果的精度,而且通过将相关特征分解到各层简化分类器的设计。相关文献提出根据颜色、形状以及图元的三层决策树的分类方法,每个树的节点都是一个统计分类器。对彩色图像和黑白图像都可以采用这种任务分解的方法进行分类。交通标志可根据颜色信息或几何形状的先验知识逐层分解进行分类。在分类器的设计中,有的文献采用基于laplace-kernel分类器(P Pacllk,JP Pudil,P Somol,“road sign classification using Laplace kernel classifier”,PatternRecognition Letters,2000:1165-1173)。这类方法具有并行结构,可采用计算机并行算法实现,以提高处理速度,但优化的决策树的设计是个难点,目前,大都依靠经验知识,而且分类器的参数选择也较复杂。
在支持向量机分类法中,由于支持向量机根据结构风险最小化原理进行设计,所以具有结构简单、泛化能力强等特点,是一种新的模式识别分类方法。在相关文献中(JGPark,KJ Kim,“Design ofa visual perception model with edgeadaptive Gaborfilter and support vector machine for traffic sign detection”,Expert Systemswith Applications,2013:3679-3687),也有采用支持向量机确定交通标志的类型。但是,这部分的研究才刚刚开始,目前的处理时间还较大,如何构造合适的核函数还尚未解决。
在句法分类方法中,利用目标的结构特征对目标进行描述和识别,在交通标志识别中也是人们关注的重点之一。有的文献根据颜色、形状、基本图元以及相互的位置,建立语义网对交通标志进行描述,采用LISP语言在符号化的工作站上编程实现。针对侦测的不确定性知识,采用证据理论融合各种知识后,采用语义网对交通标志进行分类。但是对于复杂的目标,只提取它的数值特征构成特征向量,往往不能全面对其进行描述,这是因为这些数值特征不能反映目标的结构信息。
基于卷积神经网络(CNN,Convolutional Neural Network)的交通标志识别算法因为学习能力强,权值共享、正确率高等优点得到了研究人员的高度关注。但在实际场景中,由于受到周围环境(如恶劣天气)等不确定性因素的影响,系统捕捉到的交通标志图像较为模糊,分辨率低。所以仅使用这种方法对该种情况适应能力较差,准确率难以保证。因此,需要设计一种能提高低分辨率图像识别准确率的交通标志识别算法。
超分辨率重建卷积神经网络(SRCNN,Super-Resolution Convolutional NeuralNetwork)是一种进行图像超分辨率重建的经典算法,通过该算法可以将低分辨率图像还原为高分辨率图像。使用SRCNN对图像进行预处理并应用于交通标志识别网络,可以改善对低分辨率图像的识别准确率。
现阶段,《陕西师范大学学报(自然科学版)》2017年02期公开了一种“基于二级改进LeNet-5的交通标志识别算法”,该算法以真实场景中拍摄的交通标志图像数据集GTSRB为研究对象,将卷积神经网络与支持向量机相结合;
上述基于二级改进LeNet-5的交通标志识别算法,首先根据识别系统的实时性要求,对原始LeNet-5结构进行改进;然后用裁剪、灰度化、图像增强和尺寸归一化等操作对原始图像进行预处理,得到32×32的感兴趣区域;接下来,利用数据集GTSRB训练出一个二级改进LeNet-5,其中第一级改进LeNet-5将感兴趣区域中包含的交通标志粗分为6类,第二级改进LeNet-5对粗分类结果进行细分类,识别出交通标志所属的最终类别。实验结果表明,基于二级改进LeNet-5交通标志识别算法因网络模型能够提取交通标志的多尺度特征,识别正确率可达91.76%。
但是上述基于二级改进LeNet-5的交通标志识别算法存在以下缺点:该算法的预处理过程只是简单的对输入图像进行缩放的处理,而原图在缩放过程中容易丢失部分信息,尤其是将小尺寸图像放大成大尺寸图像时,放大后的图像较为模糊,即使肉眼也难以识别,若将其直接作为图像输入进行识别,极有可能造成识别错误。
目前,还有一种交通标志识别方法:先利用图像聚类算法对原始数据集进行样本优化;然后采用多种图像预处理操作使样本整体质量进一步提升;最后构造了深度为9的CNN结构,通过多次训练得到最终的网络模型,将待识别的图像输入到CNN模型来实现自动识别。在德国交通标志数据集(GTSRB)和比利时交通标志数据集(BTSD,Belgium trafficsign dataset)上证明了算法的有效性,单张图片的识别速度只需0.2s,识别精度高达98.5%以上。本算法具有识别速度快、准确率高的特点,可为智能驾驶的可靠性和安全性提供理论依据和技术支持。但是上述算法存在以下缺点:方案二的训练过程中的计算量非常大,对硬件要求较高,操作复杂,且非常耗时。所采用的CNN结构参数复杂,输入和输出特征较多。
发明内容
本发明的目的是提供一种能提高低分辨率图像识别准确率且计算量小的基于SRCNN的交通标志识别方法。
为实现上述目的,本发明采用了如下技术方案:一种基于SRCNN的交通标志识别方法,包括以下步骤:
步骤一:对输入的交通标志图像进行图像预处理:先定义处理分界点像素;然后将输入的交通标志图像的像素与处理分界点像素进行比较,对于像素小于处理分界点像素的图像,利用基于SRCNN的超分辨率重建算法将输入图像重建为处理分界点像素的图像;对于像素不小于处理分界点像素的图像,利用双线性插值算法缩小为处理分界点像素的图像;
步骤二:对Lenet-5卷积神经网络进行训练,得到Lenet-5卷积神经网络模型;
步骤三:将步骤一中预处理后的交通标志图像输入步骤二得到的Lenet-5神经网络模型进行识别,得到该交通标志图像的类别。
进一步地,前述的一种基于SRCNN的交通标志识别方法,其中:在步骤一中,使用基于SRCNN的超分辨率重建方法对输入图像进行超分辨率重建的具体步骤如下:
步骤(1.1):将输入图像P按照R、G、B三个通道进行分割,对每个通道的图片分别进行超分辨率重建,使用ReLu作为激活函数d(x)=max(0,x);
(1.1.1)对G通道的矩阵G:
Y1=d(G*W1+B1)
Y2=d(Y1*W2+B2)
Y3=d(Y2*W3+B3)
其中,Yi为第i层卷积层的输出特征,作为第i+1层的输入,Bi和Wi为第i层的偏置和权重,*表示卷积运算;其中,权重初始为正态分布,偏置初始化为0;第一层卷积网络对输入的图片进行特征提取,第二层对第一层提取的特征进行非线性映射,第三层生成高分辨率图像;
(1.1.2)对B通道的矩阵B:
Y1=d(B*W1+B1)
Y2=d(Y1*W2+B2)
Y3=d(Y2*W3+B3)
其中,Yi为第i层卷积层的输出特征,作为第i+1层的输入,Bi和Wi为第i层的偏置和权重,*表示卷积运算;其中,权重初始为正态分布,偏置初始化为0;第一层卷积网络对输入的图片进行特征提取,第二层对第一层提取的特征进行非线性映射,第三层生成高分辨率图像;
(1.1.3)对R通道的矩阵R:
Y1=d(B*W1+B1)
Y2=d(Y1*W2+B2)
Y3=d(Y2*W3+B3)
其中,Yi为第i层卷积层的输出特征,作为第i+1层的输入,Bi和Wi为第i层的偏置和权重,*表示卷积运算;其中,权重初始为正态分布,偏置初始化为0;第一层卷积网络对输入的图片进行特征提取,第二层对第一层提取的特征进行非线性映射,第三层生成高分辨率图像;
步骤(1.2):对经超分辨率重建后的R、G、B三个颜色通道进行合成,生成处理分界点像素的图像;
其中,采取MSE作为损失函数EN,步长为1,补零填充,将Adam作为优化器进行误差的反向传播;
其中,N为样本个数,g为输入的类别,y为输出,label为标签。
进一步地,前述的一种基于SRCNN的交通标志识别方法,其中:在步骤二中,采用mini-batch的反向传播方法对Lenet-5卷积神经网络的进行训练,具体步骤如下:
步骤(2.1):前向传播阶段:
步骤(2.1.1):从进行过超分辨率重建或双线性插值的训练集中取出训练样本(xt,yt),将xt作为卷积神经网络的输入,yt作为前向传播结果的标签;
步骤(2.1.2)将输入依次送入Lenet-5卷积神经网络的7层神经网络,其中,
第一层为第一卷积层:卷积核大小为5x5像素,步长为1像素,特征图个数为32个;第一卷积层的形式如下所示:
其中,l代表层数,k是卷积核,Mj代表输入特征图的一个选择。每个输入图像有一个偏置b;
第二层为第一池化层:池化窗口大小为2x2像素,步长为2像头,采用最大池化方式;
第三层为第二卷积层:卷积核大小为5x5像素,步长为1像素,特征图个数为32个;
第四层为第二池化层:池化窗口大小为2x2像素,步长为2像素,采用最大池化方式;
第五层为第一连接层:神经元个数为512个,采用能防止网络训练出现过拟合的dropout算法,隐含节点dropout率设置为0.5;
第六层为第二连接层:神经元个数为43个,节点数目转换;
第七层为softmax,其中,softmax函数如下所示:
其中,C是样本种类数,是第i类结果的第六层的输出;取最大值作为预测值pt;
步骤(2.2):反向传播阶段:
根据交叉熵函数,计算各层网络节点的偏导数,并更新权重参数,进行反向传播,直至完成一次迭代;
其中,交叉熵函数如下所示:
L=-(yt logpt+(1-yt)log(1-pt))
其中,pt为预测值,yt为实际值;
步骤(2.3):重复进行前向传播与反向传播阶段,直至达到设定的迭代次数后,训练终止,此时得到的网络模型即为最终的结果。
进一步地,前述的一种基于SRCNN的交通标志识别方法,其中:第一池化层、第二池化层及第二连接层中采用能将输出结果映射到(0,1)区间的sigmoid激活函数。
通过上述技术方案的实施,本发明的有益效果是:能提高低分辨率图像识别准确率,计算量小。
附图说明
图1为本发明所述的一种基于SRCNN的交通标志识别方法的识别流程图。
图2为本发明中基于SRCNN的超分辨率重建方法的流程示意图。
图3为本发明中sigmoid函数图像。
图4为本发明中输入为28*28时的损失函数图像。
图5为本发明中输入为48*48时的损失函数图像。
具体实施方式
下面结合附图和具体实施例对本发明作进一步详细说明。
如图1所示,所述的一种基于SRCNN的交通标志识别方法,包括以下步骤:
步骤一:对输入的交通标志图像进行图像预处理:先定义处理分界点像素;然后将输入的交通标志图像的像素与处理分界点像素进行比较,对于像素小于处理分界点像素的图像,利用基于SRCNN的超分辨率重建算法将输入图像重建为处理分界点像素的图像;对于像素不小于处理分界点像素的图像,利用双线性插值算法缩小为处理分界点像素的图像;
其中,如图2所示,使用基于SRCNN的超分辨率重建方法对输入图像进行超分辨率重建的具体步骤如下:
步骤(1.1):将输入图像P按照R、G、B三个通道进行分割,对每个通道的图片分别进行超分辨率重建,使用ReLu作为激活函数d(x)=max(0,x);
(1.1.1)对G通道的矩阵G:
Y1=d(G*W1+B1)
Y2=d(Y1*W2+B2)
Y3=d(Y2*W3+B3)
其中,Yi为第i层卷积层的输出特征,作为第i+1层的输入,Bi和Wi为第i层的偏置和权重,*表示卷积运算;其中,权重初始为正态分布,偏置初始化为0;第一层卷积网络对输入的图片进行特征提取,第二层对第一层提取的特征进行非线性映射,第三层生成高分辨率图像;
(1.1.2)对B通道的矩阵B:
Y1=d(B*W1+B1)
Y2=d(Y1*W2+B2)
Y3=d(Y2*W3+B3)
其中,Yi为第i层卷积层的输出特征,作为第i+1层的输入,Bi和Wi为第i层的偏置和权重,*表示卷积运算;其中,权重初始为正态分布,偏置初始化为0;第一层卷积网络对输入的图片进行特征提取,第二层对第一层提取的特征进行非线性映射,第三层生成高分辨率图像;
(1.1.3)对R通道的矩阵R:
Y1=d(B*W1+B1)
Y2=d(Y1*W2+B2)
Y3=d(Y2*W3+B3)
其中,Yi为第i层卷积层的输出特征,作为第i+1层的输入,Bi和Wi为第i层的偏置和权重,*表示卷积运算;其中,权重初始为正态分布,偏置初始化为0;第一层卷积网络对输入的图片进行特征提取,第二层对第一层提取的特征进行非线性映射,第三层生成高分辨率图像;
步骤(1.2):对经超分辨率重建后的R、G、B三个颜色通道进行合成,生成处理分界点像素的图像;
其中,采取MSE作为损失函数EN,步长为1,补零填充,将Adam作为优化器进行误差的反向传播;
其中,N为样本个数,g为输入的类别,y为输出,label为标签;
步骤二:对Lenet-5卷积神经网络进行训练,得到Lenet-5卷积神经网络模型;
其中,如图3所示,采用mini-batch的反向传播方法对Lenet-5卷积神经网络的进行训练,具体步骤如下:
步骤(2.1):前向传播阶段:
步骤(2.1.1):从进行过超分辨率重建或双线性插值的训练集中取出训练样本(xt,yt),将xt作为卷积神经网络的输入,yt作为前向传播结果的标签;
步骤(2.1.2)将输入依次送入Lenet-5卷积神经网络的7层神经网络,其中,
第一层为第一卷积层:卷积核大小为5x5像素,步长为1像素,特征图个数为32个;第一卷积层的形式如下所示:
其中,l代表层数,k是卷积核,Mj代表输入特征图的一个选择。每个输入图像有一个偏置b;
第二层为第一池化层:池化窗口大小为2x2像素,步长为2像头,采用最大池化方式,并采用能将输出结果映射到(0,1)区间的sigmoid激活函数;
第三层为第二卷积层:卷积核大小为5x5像素,步长为1像素,特征图个数为32个;
第四层为第二池化层:池化窗口大小为2x2像素,步长为2像素,采用最大池化方式,并采用能将输出结果映射到(0,1)区间的sigmoid激活函数;
第五层为第一连接层:神经元个数为512个,采用能防止网络训练出现过拟合的dropout算法,隐含节点dropout率设置为0.5;
第六层为第二连接层:神经元个数为43个,节点数目转换,并采用能将输出结果映射到(0,1)区间的sigmoid激活函数;
第七层为softmax,其中,softmax函数如下所示:
其中,C是样本种类数,是第i类结果的第六层的输出;取最大值作为预测值pt;
步骤(2.2):反向传播阶段:
根据交叉熵函数,计算各层网络节点的偏导数,并更新权重参数,进行反向传播,直至完成一次迭代;
其中,交叉熵函数如下所示:
L=-(yt logpt+(1-yt)log(1-pt))
其中,pt为预测值,yt为实际值;
步骤(2.3):重复进行前向传播与反向传播阶段,直至达到设定的迭代次数后,训练终止,此时得到的网络模型即为最终的结果;
改进后的Lenet-5网络结构如下表所示:
表1改进的Lenet-5网络结构
步骤三:将步骤一中预处理后的交通标志图像输入步骤二得到的Lenet-5神经网络模型进行识别,得到该交通标志图像的类别。
以28′28像素的图片作为Lenet-5网络的输入数据,采用背景技术中的识别方法进行交通标志识别的准确率为89.24%,而采用本发明所述的基于SRCNN的交通标志识别方法进行交通标志识别的准确率为89.48%;提升幅度为0.24%。
以48′48像素的图片作为Lenet-5网络的输入数据,采用背景技术中的识别方法进行交通标志识别的准确率为91.08%,而采用本发明所述的基于SRCNN的交通标志识别方法进行交通标志识别的准确率为91.32%,提升了0.23%。损失函数的图像如图4、图5所示。
本发明的优点是:在训练和使用交通标志进行识别的神经网络的过程中,使用SRCNN超分辨率算法对输入图像进行更复杂且精确的预处理,使低分辨率图像经过处理后能得到较高分辨率的图像,进而提高低分辨率图像识别准确率;并且对Lenet-5卷积神经网络进行改进,计算量小。
Claims (4)
1.一种基于SRCNN的交通标志识别方法,其特征在于:包括以下步骤:
步骤一:对输入的交通标志图像进行图像预处理:先定义处理分界点像素;然后将输入的交通标志图像的像素与处理分界点像素进行比较,对于像素小于处理分界点像素的图像,利用基于SRCNN的超分辨率重建算法将输入图像重建为处理分界点像素的图像;对于像素不小于处理分界点像素的图像,利用双线性插值算法缩小为处理分界点像素的图像;
步骤二:对Lenet-5卷积神经网络进行训练,得到Lenet-5卷积神经网络模型;
步骤三:将步骤一中预处理后的交通标志图像输入步骤二得到的Lenet-5神经网络模型进行识别,得到该交通标志图像的类别。
2.根据权利要求1所述的一种基于SRCNN的交通标志识别方法,其特征在于:在步骤一中,使用基于SRCNN的超分辨率重建方法对输入图像进行超分辨率重建的具体步骤如下:
步骤(1.1):将输入图像P按照R、G、B三个通道进行分割,对每个通道的图片分别进行超分辨率重建,使用ReLu作为激活函数d(x)=max(0,x);
(1.1.1)对G通道的矩阵G:
Y1=d(G*W1+B1)
Y2=d(Y1*W2+B2)
Y3=d(Y2*W3+B3)
其中,Yi为第i层卷积层的输出特征,作为第i+1层的输入,Bi和Wi为第i层的偏置和权重,*表示卷积运算;其中,权重初始为正态分布,偏置初始化为0;第一层卷积网络对输入的图片进行特征提取,第二层对第一层提取的特征进行非线性映射,第三层生成高分辨率图像;
(1.1.2)对B通道的矩阵B:
Y1=d(B*W1+B1)
Y2=d(Y1*W2+B2)
Y3=d(Y2*W3+B3)
其中,Yi为第i层卷积层的输出特征,作为第i+1层的输入,Bi和Wi为第i层的偏置和权重,*表示卷积运算;其中,权重初始为正态分布,偏置初始化为0;第一层卷积网络对输入的图片进行特征提取,第二层对第一层提取的特征进行非线性映射,第三层生成高分辨率图像;
(1.1.3)对R通道的矩阵R:
Y1=d(B*W1+B1)
Y2=d(Y1*W2+B2)
Y3=d(Y2*W3+B3)
其中,Yi为第i层卷积层的输出特征,作为第i+1层的输入,Bi和Wi为第i层的偏置和权重,*表示卷积运算;其中,权重初始为正态分布,偏置初始化为0;第一层卷积网络对输入的图片进行特征提取,第二层对第一层提取的特征进行非线性映射,第三层生成高分辨率图像;
步骤(1.2):对经超分辨率重建后的R、G、B三个颜色通道进行合成,生成处理分界点像素的图像;
其中,采取MSE作为损失函数EN,步长为1,补零填充,将Adam作为优化器进行误差的反向传播;
其中,N为样本个数,g为输入的类别,y为输出,label为标签。
3.根据权利要求1所述的一种基于SRCNN的交通标志识别方法,其特征在于:在步骤二中,采用mini-batch的反向传播方法对Lenet-5卷积神经网络的进行训练,具体步骤如下:
步骤(2.1):前向传播阶段:
步骤(2.1.1):从进行过超分辨率重建或双线性插值的训练集中取出训练样本(xt,yt),将xt作为卷积神经网络的输入,yt作为前向传播结果的标签;
步骤(2.1.2)将输入依次送入Lenet-5卷积神经网络的7层神经网络,其中,
第一层为第一卷积层:卷积核大小为5x5像素,步长为1像素,特征图个数为32个;第一卷积层的形式如下所示:
其中,l代表层数,k是卷积核,Mj代表输入特征图的一个选择。每个输入图像有一个偏置b;
第二层为第一池化层:池化窗口大小为2x2像素,步长为2像头,采用最大池化方式;
第三层为第二卷积层:卷积核大小为5x5像素,步长为1像素,特征图个数为32个;
第四层为第二池化层:池化窗口大小为2x2像素,步长为2像素,采用最大池化方式;
第五层为第一连接层:神经元个数为512个,采用能防止网络训练出现过拟合的dropout算法,隐含节点dropout率设置为0.5;
第六层为第二连接层:神经元个数为43个,节点数目转换;
第七层为softmax,其中,softmax函数如下所示:
其中,C是样本种类数,是第i类结果的第六层的输出;取最大值作为预测值pt;
步骤(2.2):反向传播阶段:
根据交叉熵函数,计算各层网络节点的偏导数,并更新权重参数,进行反向传播,直至完成一次迭代;
其中,交叉熵函数如下所示:
L=-(yt log pt+(1-yt)log(1-pt))
其中,pt为预测值,yt为实际值;
步骤(2.3):重复进行前向传播与反向传播阶段,直至达到设定的迭代次数后,训练终止,此时得到的网络模型即为最终的结果。
4.根据权利要求3所述的一种基于SRCNN的交通标志识别方法,其特征在于:第一池化层、第二池化层及第二连接层中采用能将输出结果映射到(0,1)区间的sigmoid激活函数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910499090.6A CN110321803B (zh) | 2019-06-10 | 2019-06-10 | 一种基于srcnn的交通标志识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910499090.6A CN110321803B (zh) | 2019-06-10 | 2019-06-10 | 一种基于srcnn的交通标志识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110321803A true CN110321803A (zh) | 2019-10-11 |
CN110321803B CN110321803B (zh) | 2022-08-30 |
Family
ID=68120840
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910499090.6A Active CN110321803B (zh) | 2019-06-10 | 2019-06-10 | 一种基于srcnn的交通标志识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110321803B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112528881A (zh) * | 2020-12-16 | 2021-03-19 | 公安部交通管理科学研究所 | 一种公路场景识别中抑制过拟合的训练方法 |
CN113536942A (zh) * | 2021-06-21 | 2021-10-22 | 上海赫千电子科技有限公司 | 一种基于神经网络的道路交通标志识别方法 |
CN115221798A (zh) * | 2022-09-19 | 2022-10-21 | 中南大学 | 一种电池热过程时空建模预测方法、系统、设备及介质 |
CN117765127A (zh) * | 2023-11-28 | 2024-03-26 | 中微物创智能科技(上海)有限公司 | 一种基于目标检测算法构建高精地图交通标志元素的方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104537393A (zh) * | 2015-01-04 | 2015-04-22 | 大连理工大学 | 一种基于多分辨率卷积神经网络的交通标志识别方法 |
CN108520212A (zh) * | 2018-03-27 | 2018-09-11 | 东华大学 | 基于改进的卷积神经网络的交通标志检测方法 |
CN109635784A (zh) * | 2019-01-10 | 2019-04-16 | 重庆邮电大学 | 基于改进的卷积神经网络的交通标志识别方法 |
CN109657584A (zh) * | 2018-12-10 | 2019-04-19 | 长安大学 | 辅助驾驶的改进LeNet-5融合网络交通标志识别方法 |
-
2019
- 2019-06-10 CN CN201910499090.6A patent/CN110321803B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104537393A (zh) * | 2015-01-04 | 2015-04-22 | 大连理工大学 | 一种基于多分辨率卷积神经网络的交通标志识别方法 |
CN108520212A (zh) * | 2018-03-27 | 2018-09-11 | 东华大学 | 基于改进的卷积神经网络的交通标志检测方法 |
CN109657584A (zh) * | 2018-12-10 | 2019-04-19 | 长安大学 | 辅助驾驶的改进LeNet-5融合网络交通标志识别方法 |
CN109635784A (zh) * | 2019-01-10 | 2019-04-16 | 重庆邮电大学 | 基于改进的卷积神经网络的交通标志识别方法 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112528881A (zh) * | 2020-12-16 | 2021-03-19 | 公安部交通管理科学研究所 | 一种公路场景识别中抑制过拟合的训练方法 |
CN112528881B (zh) * | 2020-12-16 | 2022-05-24 | 公安部交通管理科学研究所 | 一种公路场景识别中抑制过拟合的训练方法 |
CN113536942A (zh) * | 2021-06-21 | 2021-10-22 | 上海赫千电子科技有限公司 | 一种基于神经网络的道路交通标志识别方法 |
CN113536942B (zh) * | 2021-06-21 | 2024-04-12 | 上海赫千电子科技有限公司 | 一种基于神经网络的道路交通标志识别方法 |
CN115221798A (zh) * | 2022-09-19 | 2022-10-21 | 中南大学 | 一种电池热过程时空建模预测方法、系统、设备及介质 |
CN117765127A (zh) * | 2023-11-28 | 2024-03-26 | 中微物创智能科技(上海)有限公司 | 一种基于目标检测算法构建高精地图交通标志元素的方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110321803B (zh) | 2022-08-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110334705B (zh) | 一种结合全局和局部信息的场景文本图像的语种识别方法 | |
CN110490946B (zh) | 基于跨模态相似度和生成对抗网络的文本生成图像方法 | |
CN110321803A (zh) | 一种基于srcnn的交通标志识别方法 | |
Yuan et al. | Gated CNN: Integrating multi-scale feature layers for object detection | |
CN103761531B (zh) | 基于形状轮廓特征的稀疏编码车牌字符识别方法 | |
CN109635744A (zh) | 一种基于深度分割网络的车道线检测方法 | |
CN108509978A (zh) | 基于cnn的多级特征融合的多类目标检测方法及模型 | |
CN108491836B (zh) | 一种自然场景图像中中文文本整体识别方法 | |
CN104517103A (zh) | 一种基于深度神经网络的交通标志分类方法 | |
CN110163286A (zh) | 一种基于混合池化的领域自适应图像分类方法 | |
CN109255284A (zh) | 一种基于运动轨迹的3d卷积神经网络的行为识别方法 | |
CN113255837A (zh) | 工业环境下基于改进的CenterNet网络目标检测方法 | |
CN114898472B (zh) | 基于孪生视觉Transformer网络的签名鉴定方法和系统 | |
CN106960176A (zh) | 一种基于超限学习机和颜色特征融合的行人性别识别方法 | |
Xu et al. | Face expression recognition based on convolutional neural network | |
CN113743505A (zh) | 基于自注意力和特征融合的改进ssd目标检测方法 | |
Ling et al. | A facial expression recognition system for smart learning based on YOLO and vision transformer | |
Xiao | exYOLO: A small object detector based on YOLOv3 Object Detector | |
CN114550197A (zh) | 一种端子排图像检测信息匹配方法 | |
Kannan et al. | An adaptive approach of tamil character recognition using deep learning with big data-a survey | |
Lincy et al. | An Enhanced Deep Learning Model for Handwritten Tamil Character Identification | |
Tofani et al. | Segmentation of text from color map images | |
CN112766263A (zh) | 一种针对多层控股关系股份图的识别方法 | |
Jia et al. | A Novel Fault Inspection Method of Steel Plate Surface | |
Akbulut et al. | Smart Arms Detection System Using YOLO Algorithm and OpenCV Libraries |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |