CN109492526A - 基于ldcnn模型和nhe算法的交通标志识别方法 - Google Patents

基于ldcnn模型和nhe算法的交通标志识别方法 Download PDF

Info

Publication number
CN109492526A
CN109492526A CN201811130838.7A CN201811130838A CN109492526A CN 109492526 A CN109492526 A CN 109492526A CN 201811130838 A CN201811130838 A CN 201811130838A CN 109492526 A CN109492526 A CN 109492526A
Authority
CN
China
Prior art keywords
model
traffic sign
ldcnn
layer
frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811130838.7A
Other languages
English (en)
Inventor
黄知超
李栋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guilin University of Electronic Technology
Original Assignee
Guilin University of Electronic Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guilin University of Electronic Technology filed Critical Guilin University of Electronic Technology
Priority to CN201811130838.7A priority Critical patent/CN109492526A/zh
Publication of CN109492526A publication Critical patent/CN109492526A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/52Surveillance or monitoring of activities, e.g. for recognising suspicious objects
    • G06V20/54Surveillance or monitoring of activities, e.g. for recognising suspicious objects of traffic, e.g. cars on the road, trains or boats
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了基于LDCNN模型和NHE算法的交通标志识别方法,包括如下步骤:1)GTSRB数据集预处理;2)交通标志对比度增强;3)构建LDCNN模型;4)训练LDCNN模型;5)识别。这种方法使用方便,能提取交通标志更多特征,提高了交通标志识别的准确率。

Description

基于LDCNN模型和NHE算法的交通标志识别方法
技术领域
本发明涉及深度学习和图像领域,具体是基于LDCNN模型和NHE算法的交通标志识别方法。
背景技术
近年来,先进驾驶辅助系统ADAS的发展受到了政府和汽车行业的广泛关注,交通标志识别系统TSRS作为ADAS的子系统之一,能为驾驶员提供警示和指导信息,提高车辆行驶安全,因此研究交通标志识别具有重要的理论意义和实用价值。
90年代初,国内外专家已经提出许多基于传统算法的TSRS,如:Liu H等提出一种基于稀疏编码特征的TSRS模型;文献中分别提出一种基于决策树、小波变换(DT-CWT)方法的TSRS模型。以上传统算法尚不能满足实际使用要求,究其原因,图像特征主要依靠人工提取,不仅耗费大量时间,而且交通标志的识别准确率较低。最近几年,CNN成为最热门的图像分类技术,相较于传统方法,其优势在于网络模型的输入是原始图像而不是人工提取的图像特征,不仅节省了大量时间,而且还实现了高识别率。CNN已经取得了很大的进展,2012年,Alex等提出AlexNet,该模型在ImageNet视觉识别比赛(ILSVRC)上取得优异成绩。2014年,牛津大学和Google共同研发了VGG16,该网络的拓展性很强,迁移到其他图片数据上的泛化性非常好,故被用于很多相关领域。鉴于此,国内外学者将CNN运用于交通标志识别领域,文献中提出一种铰链损失随机梯度下降法来训练CNN模型,并在GTSRB基准中进行了评估;Limetal等提出基于CNN的识别算法,并使用PCA和Fisher预选颜色特征以提高识别率。Sermanet等提出基于CNN模型的TSRS方法,实现了98.31%交通标志识别准确率。上述交通标志识别算法都达到较高的识别准确率,但依旧存在两个问题,一是交通标志识别准确率还有待提高,另一是传统算法和CNN算法都没有对原始图像进行增强处理,这也是导致识别准确率无法提高的原因。
发明内容
本发明的目的是针对现有技术的不足,而提供基于LDCNN模型和NHE算法的交通标志识别方法。这种方法使用方便,能提取交通标志更多特征,能提高交通标志识别的准确率。
实现本发明目的的技术方案是:
基于LDCNN模型和NHE算法的交通标志识别方法,与现有技术不同的是,包括如下步骤:
1)GTSRB数据集预处理:采用数据增强技术对GTSRB数据集中的交通标志进行数量扩增,所述数据增强技术为水平翻转、垂直翻转、旋转和调整亮度;
2)交通标志对比度增强:采用新直方图均衡即NHE算法对步骤1)处理后的交通标志整体对比度增强,首先对交通标志进行分频处理,其次对低频数据做直方图均衡,对高频数据做线性加权,最后将低、高频数据进行数量级融合,得最终图像,E(·)表示分频滤波器,k表示加权系数,f(x,y)、fa(x,y)、fb(x,y)和F(x,y)分别表示原始输入、低频分量、高频分量和最终图像;
E(·)使用高斯低通滤波器,采用这种滤波器的原因是它在时域和频均具有良好的平滑性能,而且在图像分频上,不会出现图像细微结构发生极性反转现象,其次,还能将图像二维卷积分解成行、列两个方向的一维卷积,使算法速度得到提高,再次,一定尺度下的图像细节也能通过调整尺度因子来得到保护,滤波器定义:
其中,σ是滤波器的尺度因子,
图像f(x,y)经过分频处理得到低频fa(x,y)和高频fb(x,y),三者关系定义为
f(x,y)=fa(x,y)+fb(x,y) (2),
fa(x,y)执行直方图均衡,fa1(x,y)为均衡后低频图像,对fb(x,y)进行加权,fb1(x,y)为增强后高频图像,F(x,y)等于fa1(x,y)和fb1(x,y)的线性加和,也即:
F(x,y)=fa1(x,y)+fb1(x,y)=HE(fa(x,y))+k*fb(x,y) (5)
其中,k为高频部分的权系数,NHE算法可以实现提高图像的整体对比度,突出整体图像细节,为LDCNN模型训练的交通标志打下良好的基础;
3)构建LDCNN模型:在改进卷积层、激活函数、池化层种类参数基础上,加入块层技术,构建新的LDCNN模型,所述LDCNN模型包括顺序连接的卷积层C1、卷积池化层C2c2-C4c4、聚合层C5-C7、卷积层C8、全连接层FL9、FL10和输出层Output,其中,C1-C7层中嵌入块层,交通标志数据加载到主程序C1,C2c2-C4c4,C5-C8,经FL9-10进入Output层输出准确率结果;
CNN的核心是卷积层,其中权值共享和局部连接的特性能够降低训练参数数量,设l层是卷积层,则的表示形式为:
其中,是l层中的第j个特征图,
卷积操作属于线性操作,在卷积层后添加一个非线性的ReLU激活函数,并用该函数进行特征图的映射,增加浅层网络的表现能力,识别准确率得到提高,ReLU函数表示为f(x)=max(0,x),输出层将选择softmax函数,该函数将K维的矢量压缩成另一K维矢量,矢量中的每个元素取值都在(0,1)之间,softmax函数表示为:
其中,j=1,2.....,k,可以看出,zj比z大时,映射矢量趋于1,其他趋于0,
在训练神经网络的过程中,每层的权重和参数不断更新,前一层的更新将改变下一层的输入分布,因此,需要在训练时进行权重初始化,减小学习率,而学习率的减小又会导致网络的收敛特别慢,这种现象称为内部协方差的偏移(internal covariate shift),鉴于此,采用块层来加速网络收敛,减少计算代价和运算时间,维持各层输入的均值和方差稳定,降低内部协方差的偏移,提高训练效果,块层表示形式为
输入:β={x1.....m},输出:{yi=BatchRenorm(xi)},
更新:μ:=μ+Δ(μβ-μ)σ:=σ+Δ(σβ-σ) (14),
结果:
卷积层提取输入图像的特征之后,就能够使用该特征训练模型,但每一次卷积操作都会带来非常大的计算量,故卷积层后通常连接池化层,减少计算量和训练时间,池化的目的还在于保持某种不变性(旋转、平移等),对于同样的输入,当其中像素在邻域发生微小位移时,池化层的输出是不变的,这就使网络的鲁棒性增强,有一定抗扰动的作用,最大池化是目前广泛使用的池化方法,其表示为
其中,k*k为核窗口,d为步长,m*n为特征图尺寸;
4)训练LDCNN模型:训练步骤3)构建的模型,即设置模型优化器为Adam、学习率为0.001、批处理大小为256、dropout值为0.5、网络中的权值和偏差为随机初始化,交通标志的大小固定为32×32,采用谷歌开发的机器学习系统TensorFlow来训练LDCNN模型;
5)识别:依据步骤4)的已经训练好模型来识别交通标志,以GTSRB测试集为基准,测试准确率达到98%以上为识别成功。
这种方法使用方便,能提取交通标志更多特征,提高了交通标志识别的准确率。
附图说明
图1为实施例的方法流程示意图;
图2为NHE算法过程图;
图3为实施例中LDCNN模型的结构示意图。
具体实施方式
下面结合和附图和实施例对本发明的内容作进一步的阐述,但不是对本发明的限定。
实施例:
参照图1,基于LDCNN模型和NHE算法的交通标志识别方法,包括如下步骤:
1)GTSRB数据集预处理:采用数据增强技术对GTSRB数据集中的交通标志进行数量扩增,所述数据增强技术为水平翻转、垂直翻转、旋转和调整亮度;
2)交通标志对比度增强:采用新直方图均衡即NHE算法对步骤1)处理后的交通标志整体对比度增强,首先对交通标志进行分频处理,其次对低频数据做直方图均衡,对高频数据做线性加权,最后将低、高频数据进行数量级融合,得最终图像,如图2所示,采用NHE算法的过程,其中,E(·)表示分频滤波器,HE表示直方图过程;k表示加权系数,f(x,y)、fa(x,y)、fb(x,y)和F(x,y)分别表示原始输入、低频分量、高频分量和最终图像;
E(·)使用高斯低通滤波器,采用这种滤波器的原因是它在时域和频均具有良好的平滑性能,而且在图像分频上,不会出现图像细微结构发生极性反转现象,其次,还能将图像二维卷积分解成行、列两个方向的一维卷积,使算法速度得到提高,再次,一定尺度下的图像细节也能通过调整尺度因子来得到保护,滤波器定义:
其中,σ是滤波器的尺度因子,
图像f(x,y)经过分频处理得到低频fa(x,y)和高频fb(x,y),三者关系定义为
f(x,y)=fa(x,y)+fb(x,y) (2),
fa(x,y)执行直方图均衡,fa1(x,y)为均衡后低频图像,对fb(x,y)进行加权,fb1(x,y)为增强后高频图像,F(x,y)等于fa1(x,y)和fb1(x,y)的线性加和,也即:
F(x,y)=fa1(x,y)+fb1(x,y)=HE(fa(x,y))+k*fb(x,y) (5),
其中,k为高频部分的权系数,
NHE算法可以实现提高图像的整体对比度,突出整体图像细节,为LDCNN模型训练的交通标志打下良好的基础;
3)构建LDCNN模型:在改进卷积层、激活函数、池化层种类参数基础上,加入块层技术,构建了新的LDCNN模型,所述LDCNN模型包括顺序连接的卷积层C1、卷积池化层C2c2-C4c4、聚合层C5-C7、卷积层C8、全连接层FL9、FL10和输出层Output,其中,C1-C7层中嵌入块层,交通标志数据加载到主程序C1,C2c2-C4c4,C5-C8,经FL9-10进入Output层输出准确率结果,如图3所示;
CNN的核心是卷积层,其中权值共享和局部连接的特性能够降低训练参数数量,设l层是卷积层,则的表示形式为:
其中,是l层中的第j个特征图,
卷积操作属于线性操作,在卷积层后添加一个非线性的ReLU激活函数,并用该函数进行特征图的映射,增加浅层网络的表现能力,识别准确率得到提高,ReLU函数表示为f(x)=max(0,x),输出层将选择softmax函数,该函数将K维的矢量压缩成另一K维矢量,矢量中的每个元素取值都在(0,1)之间,softmax函数表示为:
其中,j=1,2.....,k,可以看出,zj比z大时,映射矢量趋于1,其他趋于0,
在训练神经网络的过程中,每层的权重和参数不断更新,前一层的更新将改变下一层的输入分布,因此,需要在训练时进行权重初始化,减小学习率,而学习率的减小又会导致网络的收敛特别慢,这种现象称为内部协方差的偏移(internal covariate shift),鉴于此,采用块层来加速网络收敛,减少计算代价和运算时间,维持各层输入的均值和方差稳定,降低内部协方差的偏移,提高训练效果,块层表示形式为
输入:β={x1.....m},输出:{yi=BatchRenorm(xi)},
更新:μ:=μ+Δ(μβ-μ)σ:=σ+Δ(σβ-σ) (14),
结果:
卷积层提取输入图像的特征之后,就能够使用该特征训练模型,但每一次卷积操作都会带来非常大的计算量,故卷积层后通常连接池化层,减少计算量和训练时间,池化的目的还在于保持某种不变性(旋转、平移等),对于同样的输入,当其中像素在邻域发生微小位移时,池化层的输出是不变的,这就使网络的鲁棒性增强,有一定抗扰动的作用,最大池化是目前广泛使用的池化方法,其表示为
其中,k*k为核窗口,d为步长,m*n为特征图尺寸;
4)训练LDCNN模型:训练步骤3)构建的模型,即设置模型优化器为Adam、学习率为0.001、批处理大小为256、dropout值为0.5、网络中的权值和偏差为随机初始化,交通标志的大小固定为32×32,采用谷歌开发的机器学习系统TensorFlow来训练LDCNN模型;
5)识别:依据步骤4)的已经训练好模型来识别交通标志,以GTSRB测试集为基准,测试准确率达到98%以上为识别成功。

Claims (1)

1.基于LDCNN模型和NHE算法的交通标志识别方法,其特征是,包括如下步骤:
1)GTSRB数据集预处理:采用数据增强技术对GTSRB数据集中的交通标志进行数量扩增,所述数据增强技术为水平翻转、垂直翻转、旋转和调整亮度;
2)交通标志对比度增强:采用新直方图均衡即NHE算法对步骤1)处理后的交通标志整体对比度增强,首先对交通标志进行分频处理,其次对低频数据做直方图均衡,对高频数据做线性加权,最后将低、高频数据进行数量级融合,得最终图像,E(·)表示分频滤波器,k表示加权系数,f(x,y)、fa(x,y)、fb(x,y)和F(x,y)分别表示原始输入、低频分量、高频分量和最终图像;
滤波器定义:
其中,σ是滤波器的尺度因子,
图像f(x,y)经过分频处理得到低频fa(x,y)和高频fb(x,y),三者关系定义为
f(x,y)=fa(x,y)+fb(x,y) (2),
fa(x,y)执行直方图均衡,fa1(x,y)为均衡后低频图像,对fb(x,y)进行加权,fb1(x,y)为增强后高频图像,F(x,y)等于fa1(x,y)和fb1(x,y)的线性加和,也即:
F(x,y)=fa1(x,y)+fb1(x,y)=HE(fa(x,y))+k*fb(x,y) (5)
其中,k为高频部分的权系数;
3)构建LDCNN模型:所述LDCNN模型包括顺序连接的卷积层C1、卷积池化层C2c2-C4c4、聚合层C5-C7、卷积层C8、全连接层FL9、FL10和输出层Output,其中,C1-C7层中嵌入块层,交通标志数据加载到主程序C1,C2c2-C4c4,C5-C8,经FL9-10进入Output层输出准确率结果;
4)训练LDCNN模型:训练步骤3)构建的模型,即设置模型优化器为Adam、学习率为0.001、批处理大小为256、dropout值为0.5、网络中的权值和偏差为随机初始化,交通标志的大小固定为32×32,采用谷歌开发的机器学习系统TensorFlow来训练LDCNN模型;
5)识别:依据步骤4)的已经训练好模型来识别交通标志,以GTSRB测试集为基准,测试准确率达到98%以上为识别成功。
CN201811130838.7A 2018-09-27 2018-09-27 基于ldcnn模型和nhe算法的交通标志识别方法 Pending CN109492526A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811130838.7A CN109492526A (zh) 2018-09-27 2018-09-27 基于ldcnn模型和nhe算法的交通标志识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811130838.7A CN109492526A (zh) 2018-09-27 2018-09-27 基于ldcnn模型和nhe算法的交通标志识别方法

Publications (1)

Publication Number Publication Date
CN109492526A true CN109492526A (zh) 2019-03-19

Family

ID=65689934

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811130838.7A Pending CN109492526A (zh) 2018-09-27 2018-09-27 基于ldcnn模型和nhe算法的交通标志识别方法

Country Status (1)

Country Link
CN (1) CN109492526A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109910891A (zh) * 2019-03-20 2019-06-21 奇瑞汽车股份有限公司 车辆控制方法和装置
CN110163187A (zh) * 2019-06-02 2019-08-23 东北石油大学 基于f-rcnn的远距离交通标志检测识别方法
CN111401466A (zh) * 2020-03-26 2020-07-10 广州紫为云科技有限公司 一种交通标志检测与识别标注方法、装置和计算机设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107122776A (zh) * 2017-04-14 2017-09-01 重庆邮电大学 一种基于卷积神经网络的交通标志检测与识别方法
CN108520212A (zh) * 2018-03-27 2018-09-11 东华大学 基于改进的卷积神经网络的交通标志检测方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107122776A (zh) * 2017-04-14 2017-09-01 重庆邮电大学 一种基于卷积神经网络的交通标志检测与识别方法
CN108520212A (zh) * 2018-03-27 2018-09-11 东华大学 基于改进的卷积神经网络的交通标志检测方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
IOFFE SERGEY: "《Batch renormalization: Towards reducing minibatch dependence in batch-normalized models》", 《ARXIV PREPRINT ARXIV:1702.03275 (2017)》 *
XIAOHU ZHANG,ET AL: "《LD-CNN:A Lightweight Dilated Convolutional Neural Networkfor Environmental Sound Classification》", 《IN 2018 24TH INTERNATIONAL CONFERENCE ON PATTERN RECOGNITION (ICPR) 》 *
张志龙 等: "《一种保持图像细节的直方图均衡新算法》", 《计算机工程与科学》 *
范春朋: "《基于机器学习的交通标志识别研究》", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109910891A (zh) * 2019-03-20 2019-06-21 奇瑞汽车股份有限公司 车辆控制方法和装置
CN110163187A (zh) * 2019-06-02 2019-08-23 东北石油大学 基于f-rcnn的远距离交通标志检测识别方法
CN111401466A (zh) * 2020-03-26 2020-07-10 广州紫为云科技有限公司 一种交通标志检测与识别标注方法、装置和计算机设备

Similar Documents

Publication Publication Date Title
CN110569886B (zh) 一种双向通道注意力元学习的图像分类方法
CN107423760A (zh) 基于预分割和回归的深度学习目标检测方法
CN108647583B (zh) 一种基于多目标学习的人脸识别算法训练方法
CN108985269A (zh) 基于卷积和空洞卷积结构的融合网络驾驶环境感知模型
CN109492526A (zh) 基于ldcnn模型和nhe算法的交通标志识别方法
CN114299380A (zh) 对比一致性学习的遥感图像语义分割模型训练方法及装置
CN111445488B (zh) 一种弱监督学习自动识别和分割盐体的方法
CN104463209A (zh) 一种基于bp神经网络的pcb板上数字代码识别方法
CN109583321A (zh) 一种基于深度学习的结构化道路中小物体的检测方法
CN111259827B (zh) 一种面向城市河道监管的水面漂浮物自动检测方法及装置
CN105182350A (zh) 一种应用特征跟踪的多波束声呐目标探测方法
CN111882620A (zh) 一种基于多尺度信息道路可行驶区域分割方法
CN110245587B (zh) 一种基于贝叶斯迁移学习的光学遥感图像目标检测方法
CN108960342A (zh) 基于改进SoftMax损失函数的图像相似度计算方法
CN111931814A (zh) 一种基于类内结构紧致约束的无监督对抗域适应方法
CN114463643A (zh) 多模型决策级融合的滑坡识别方法及装置
CN111126155B (zh) 一种基于语义约束生成对抗网络的行人再识别方法
CN116110022A (zh) 基于响应知识蒸馏的轻量化交通标志检测方法及系统
CN113808123B (zh) 一种基于机器视觉的药液袋动态检测方法
CN103903017B (zh) 一种基于自适应软直方图局部二值模式的人脸识别方法
CN108319924A (zh) 一种基于融合特征和elm算法的交通标志识别方法
CN113505712B (zh) 基于类平衡损失函数的卷积神经网络的海面溢油检测方法
CN117830616A (zh) 基于渐进式伪标签的遥感图像无监督跨域目标检测方法
CN107392246A (zh) 一种基于特征模型到背景模型距离的背景建模方法
CN105528791B (zh) 一种面向触摸屏手绘图像的质量评价装置及其评价方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20190319

WD01 Invention patent application deemed withdrawn after publication