CN109492526A - 基于ldcnn模型和nhe算法的交通标志识别方法 - Google Patents
基于ldcnn模型和nhe算法的交通标志识别方法 Download PDFInfo
- Publication number
- CN109492526A CN109492526A CN201811130838.7A CN201811130838A CN109492526A CN 109492526 A CN109492526 A CN 109492526A CN 201811130838 A CN201811130838 A CN 201811130838A CN 109492526 A CN109492526 A CN 109492526A
- Authority
- CN
- China
- Prior art keywords
- model
- traffic sign
- ldcnn
- layer
- frequency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/52—Surveillance or monitoring of activities, e.g. for recognising suspicious objects
- G06V20/54—Surveillance or monitoring of activities, e.g. for recognising suspicious objects of traffic, e.g. cars on the road, trains or boats
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/50—Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了基于LDCNN模型和NHE算法的交通标志识别方法,包括如下步骤:1)GTSRB数据集预处理;2)交通标志对比度增强;3)构建LDCNN模型;4)训练LDCNN模型;5)识别。这种方法使用方便,能提取交通标志更多特征,提高了交通标志识别的准确率。
Description
技术领域
本发明涉及深度学习和图像领域,具体是基于LDCNN模型和NHE算法的交通标志识别方法。
背景技术
近年来,先进驾驶辅助系统ADAS的发展受到了政府和汽车行业的广泛关注,交通标志识别系统TSRS作为ADAS的子系统之一,能为驾驶员提供警示和指导信息,提高车辆行驶安全,因此研究交通标志识别具有重要的理论意义和实用价值。
90年代初,国内外专家已经提出许多基于传统算法的TSRS,如:Liu H等提出一种基于稀疏编码特征的TSRS模型;文献中分别提出一种基于决策树、小波变换(DT-CWT)方法的TSRS模型。以上传统算法尚不能满足实际使用要求,究其原因,图像特征主要依靠人工提取,不仅耗费大量时间,而且交通标志的识别准确率较低。最近几年,CNN成为最热门的图像分类技术,相较于传统方法,其优势在于网络模型的输入是原始图像而不是人工提取的图像特征,不仅节省了大量时间,而且还实现了高识别率。CNN已经取得了很大的进展,2012年,Alex等提出AlexNet,该模型在ImageNet视觉识别比赛(ILSVRC)上取得优异成绩。2014年,牛津大学和Google共同研发了VGG16,该网络的拓展性很强,迁移到其他图片数据上的泛化性非常好,故被用于很多相关领域。鉴于此,国内外学者将CNN运用于交通标志识别领域,文献中提出一种铰链损失随机梯度下降法来训练CNN模型,并在GTSRB基准中进行了评估;Limetal等提出基于CNN的识别算法,并使用PCA和Fisher预选颜色特征以提高识别率。Sermanet等提出基于CNN模型的TSRS方法,实现了98.31%交通标志识别准确率。上述交通标志识别算法都达到较高的识别准确率,但依旧存在两个问题,一是交通标志识别准确率还有待提高,另一是传统算法和CNN算法都没有对原始图像进行增强处理,这也是导致识别准确率无法提高的原因。
发明内容
本发明的目的是针对现有技术的不足,而提供基于LDCNN模型和NHE算法的交通标志识别方法。这种方法使用方便,能提取交通标志更多特征,能提高交通标志识别的准确率。
实现本发明目的的技术方案是:
基于LDCNN模型和NHE算法的交通标志识别方法,与现有技术不同的是,包括如下步骤:
1)GTSRB数据集预处理:采用数据增强技术对GTSRB数据集中的交通标志进行数量扩增,所述数据增强技术为水平翻转、垂直翻转、旋转和调整亮度;
2)交通标志对比度增强:采用新直方图均衡即NHE算法对步骤1)处理后的交通标志整体对比度增强,首先对交通标志进行分频处理,其次对低频数据做直方图均衡,对高频数据做线性加权,最后将低、高频数据进行数量级融合,得最终图像,E(·)表示分频滤波器,k表示加权系数,f(x,y)、fa(x,y)、fb(x,y)和F(x,y)分别表示原始输入、低频分量、高频分量和最终图像;
E(·)使用高斯低通滤波器,采用这种滤波器的原因是它在时域和频均具有良好的平滑性能,而且在图像分频上,不会出现图像细微结构发生极性反转现象,其次,还能将图像二维卷积分解成行、列两个方向的一维卷积,使算法速度得到提高,再次,一定尺度下的图像细节也能通过调整尺度因子来得到保护,滤波器定义:
其中,σ是滤波器的尺度因子,
图像f(x,y)经过分频处理得到低频fa(x,y)和高频fb(x,y),三者关系定义为
f(x,y)=fa(x,y)+fb(x,y) (2),
fa(x,y)执行直方图均衡,fa1(x,y)为均衡后低频图像,对fb(x,y)进行加权,fb1(x,y)为增强后高频图像,F(x,y)等于fa1(x,y)和fb1(x,y)的线性加和,也即:
F(x,y)=fa1(x,y)+fb1(x,y)=HE(fa(x,y))+k*fb(x,y) (5)
其中,k为高频部分的权系数,NHE算法可以实现提高图像的整体对比度,突出整体图像细节,为LDCNN模型训练的交通标志打下良好的基础;
3)构建LDCNN模型:在改进卷积层、激活函数、池化层种类参数基础上,加入块层技术,构建新的LDCNN模型,所述LDCNN模型包括顺序连接的卷积层C1、卷积池化层C2c2-C4c4、聚合层C5-C7、卷积层C8、全连接层FL9、FL10和输出层Output,其中,C1-C7层中嵌入块层,交通标志数据加载到主程序C1,C2c2-C4c4,C5-C8,经FL9-10进入Output层输出准确率结果;
CNN的核心是卷积层,其中权值共享和局部连接的特性能够降低训练参数数量,设l层是卷积层,则的表示形式为:
其中,是l层中的第j个特征图,
卷积操作属于线性操作,在卷积层后添加一个非线性的ReLU激活函数,并用该函数进行特征图的映射,增加浅层网络的表现能力,识别准确率得到提高,ReLU函数表示为f(x)=max(0,x),输出层将选择softmax函数,该函数将K维的矢量压缩成另一K维矢量,矢量中的每个元素取值都在(0,1)之间,softmax函数表示为:
其中,j=1,2.....,k,可以看出,zj比z大时,映射矢量趋于1,其他趋于0,
在训练神经网络的过程中,每层的权重和参数不断更新,前一层的更新将改变下一层的输入分布,因此,需要在训练时进行权重初始化,减小学习率,而学习率的减小又会导致网络的收敛特别慢,这种现象称为内部协方差的偏移(internal covariate shift),鉴于此,采用块层来加速网络收敛,减少计算代价和运算时间,维持各层输入的均值和方差稳定,降低内部协方差的偏移,提高训练效果,块层表示形式为
输入:β={x1.....m},输出:{yi=BatchRenorm(xi)},
更新:μ:=μ+Δ(μβ-μ)σ:=σ+Δ(σβ-σ) (14),
结果:
卷积层提取输入图像的特征之后,就能够使用该特征训练模型,但每一次卷积操作都会带来非常大的计算量,故卷积层后通常连接池化层,减少计算量和训练时间,池化的目的还在于保持某种不变性(旋转、平移等),对于同样的输入,当其中像素在邻域发生微小位移时,池化层的输出是不变的,这就使网络的鲁棒性增强,有一定抗扰动的作用,最大池化是目前广泛使用的池化方法,其表示为
其中,k*k为核窗口,d为步长,m*n为特征图尺寸;
4)训练LDCNN模型:训练步骤3)构建的模型,即设置模型优化器为Adam、学习率为0.001、批处理大小为256、dropout值为0.5、网络中的权值和偏差为随机初始化,交通标志的大小固定为32×32,采用谷歌开发的机器学习系统TensorFlow来训练LDCNN模型;
5)识别:依据步骤4)的已经训练好模型来识别交通标志,以GTSRB测试集为基准,测试准确率达到98%以上为识别成功。
这种方法使用方便,能提取交通标志更多特征,提高了交通标志识别的准确率。
附图说明
图1为实施例的方法流程示意图;
图2为NHE算法过程图;
图3为实施例中LDCNN模型的结构示意图。
具体实施方式
下面结合和附图和实施例对本发明的内容作进一步的阐述,但不是对本发明的限定。
实施例:
参照图1,基于LDCNN模型和NHE算法的交通标志识别方法,包括如下步骤:
1)GTSRB数据集预处理:采用数据增强技术对GTSRB数据集中的交通标志进行数量扩增,所述数据增强技术为水平翻转、垂直翻转、旋转和调整亮度;
2)交通标志对比度增强:采用新直方图均衡即NHE算法对步骤1)处理后的交通标志整体对比度增强,首先对交通标志进行分频处理,其次对低频数据做直方图均衡,对高频数据做线性加权,最后将低、高频数据进行数量级融合,得最终图像,如图2所示,采用NHE算法的过程,其中,E(·)表示分频滤波器,HE表示直方图过程;k表示加权系数,f(x,y)、fa(x,y)、fb(x,y)和F(x,y)分别表示原始输入、低频分量、高频分量和最终图像;
E(·)使用高斯低通滤波器,采用这种滤波器的原因是它在时域和频均具有良好的平滑性能,而且在图像分频上,不会出现图像细微结构发生极性反转现象,其次,还能将图像二维卷积分解成行、列两个方向的一维卷积,使算法速度得到提高,再次,一定尺度下的图像细节也能通过调整尺度因子来得到保护,滤波器定义:
其中,σ是滤波器的尺度因子,
图像f(x,y)经过分频处理得到低频fa(x,y)和高频fb(x,y),三者关系定义为
f(x,y)=fa(x,y)+fb(x,y) (2),
fa(x,y)执行直方图均衡,fa1(x,y)为均衡后低频图像,对fb(x,y)进行加权,fb1(x,y)为增强后高频图像,F(x,y)等于fa1(x,y)和fb1(x,y)的线性加和,也即:
F(x,y)=fa1(x,y)+fb1(x,y)=HE(fa(x,y))+k*fb(x,y) (5),
其中,k为高频部分的权系数,
NHE算法可以实现提高图像的整体对比度,突出整体图像细节,为LDCNN模型训练的交通标志打下良好的基础;
3)构建LDCNN模型:在改进卷积层、激活函数、池化层种类参数基础上,加入块层技术,构建了新的LDCNN模型,所述LDCNN模型包括顺序连接的卷积层C1、卷积池化层C2c2-C4c4、聚合层C5-C7、卷积层C8、全连接层FL9、FL10和输出层Output,其中,C1-C7层中嵌入块层,交通标志数据加载到主程序C1,C2c2-C4c4,C5-C8,经FL9-10进入Output层输出准确率结果,如图3所示;
CNN的核心是卷积层,其中权值共享和局部连接的特性能够降低训练参数数量,设l层是卷积层,则的表示形式为:
其中,是l层中的第j个特征图,
卷积操作属于线性操作,在卷积层后添加一个非线性的ReLU激活函数,并用该函数进行特征图的映射,增加浅层网络的表现能力,识别准确率得到提高,ReLU函数表示为f(x)=max(0,x),输出层将选择softmax函数,该函数将K维的矢量压缩成另一K维矢量,矢量中的每个元素取值都在(0,1)之间,softmax函数表示为:
其中,j=1,2.....,k,可以看出,zj比z大时,映射矢量趋于1,其他趋于0,
在训练神经网络的过程中,每层的权重和参数不断更新,前一层的更新将改变下一层的输入分布,因此,需要在训练时进行权重初始化,减小学习率,而学习率的减小又会导致网络的收敛特别慢,这种现象称为内部协方差的偏移(internal covariate shift),鉴于此,采用块层来加速网络收敛,减少计算代价和运算时间,维持各层输入的均值和方差稳定,降低内部协方差的偏移,提高训练效果,块层表示形式为
输入:β={x1.....m},输出:{yi=BatchRenorm(xi)},
更新:μ:=μ+Δ(μβ-μ)σ:=σ+Δ(σβ-σ) (14),
结果:
卷积层提取输入图像的特征之后,就能够使用该特征训练模型,但每一次卷积操作都会带来非常大的计算量,故卷积层后通常连接池化层,减少计算量和训练时间,池化的目的还在于保持某种不变性(旋转、平移等),对于同样的输入,当其中像素在邻域发生微小位移时,池化层的输出是不变的,这就使网络的鲁棒性增强,有一定抗扰动的作用,最大池化是目前广泛使用的池化方法,其表示为
其中,k*k为核窗口,d为步长,m*n为特征图尺寸;
4)训练LDCNN模型:训练步骤3)构建的模型,即设置模型优化器为Adam、学习率为0.001、批处理大小为256、dropout值为0.5、网络中的权值和偏差为随机初始化,交通标志的大小固定为32×32,采用谷歌开发的机器学习系统TensorFlow来训练LDCNN模型;
5)识别:依据步骤4)的已经训练好模型来识别交通标志,以GTSRB测试集为基准,测试准确率达到98%以上为识别成功。
Claims (1)
1.基于LDCNN模型和NHE算法的交通标志识别方法,其特征是,包括如下步骤:
1)GTSRB数据集预处理:采用数据增强技术对GTSRB数据集中的交通标志进行数量扩增,所述数据增强技术为水平翻转、垂直翻转、旋转和调整亮度;
2)交通标志对比度增强:采用新直方图均衡即NHE算法对步骤1)处理后的交通标志整体对比度增强,首先对交通标志进行分频处理,其次对低频数据做直方图均衡,对高频数据做线性加权,最后将低、高频数据进行数量级融合,得最终图像,E(·)表示分频滤波器,k表示加权系数,f(x,y)、fa(x,y)、fb(x,y)和F(x,y)分别表示原始输入、低频分量、高频分量和最终图像;
滤波器定义:
其中,σ是滤波器的尺度因子,
图像f(x,y)经过分频处理得到低频fa(x,y)和高频fb(x,y),三者关系定义为
f(x,y)=fa(x,y)+fb(x,y) (2),
fa(x,y)执行直方图均衡,fa1(x,y)为均衡后低频图像,对fb(x,y)进行加权,fb1(x,y)为增强后高频图像,F(x,y)等于fa1(x,y)和fb1(x,y)的线性加和,也即:
F(x,y)=fa1(x,y)+fb1(x,y)=HE(fa(x,y))+k*fb(x,y) (5)
其中,k为高频部分的权系数;
3)构建LDCNN模型:所述LDCNN模型包括顺序连接的卷积层C1、卷积池化层C2c2-C4c4、聚合层C5-C7、卷积层C8、全连接层FL9、FL10和输出层Output,其中,C1-C7层中嵌入块层,交通标志数据加载到主程序C1,C2c2-C4c4,C5-C8,经FL9-10进入Output层输出准确率结果;
4)训练LDCNN模型:训练步骤3)构建的模型,即设置模型优化器为Adam、学习率为0.001、批处理大小为256、dropout值为0.5、网络中的权值和偏差为随机初始化,交通标志的大小固定为32×32,采用谷歌开发的机器学习系统TensorFlow来训练LDCNN模型;
5)识别:依据步骤4)的已经训练好模型来识别交通标志,以GTSRB测试集为基准,测试准确率达到98%以上为识别成功。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811130838.7A CN109492526A (zh) | 2018-09-27 | 2018-09-27 | 基于ldcnn模型和nhe算法的交通标志识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811130838.7A CN109492526A (zh) | 2018-09-27 | 2018-09-27 | 基于ldcnn模型和nhe算法的交通标志识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109492526A true CN109492526A (zh) | 2019-03-19 |
Family
ID=65689934
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811130838.7A Pending CN109492526A (zh) | 2018-09-27 | 2018-09-27 | 基于ldcnn模型和nhe算法的交通标志识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109492526A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109910891A (zh) * | 2019-03-20 | 2019-06-21 | 奇瑞汽车股份有限公司 | 车辆控制方法和装置 |
CN110163187A (zh) * | 2019-06-02 | 2019-08-23 | 东北石油大学 | 基于f-rcnn的远距离交通标志检测识别方法 |
CN111401466A (zh) * | 2020-03-26 | 2020-07-10 | 广州紫为云科技有限公司 | 一种交通标志检测与识别标注方法、装置和计算机设备 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107122776A (zh) * | 2017-04-14 | 2017-09-01 | 重庆邮电大学 | 一种基于卷积神经网络的交通标志检测与识别方法 |
CN108520212A (zh) * | 2018-03-27 | 2018-09-11 | 东华大学 | 基于改进的卷积神经网络的交通标志检测方法 |
-
2018
- 2018-09-27 CN CN201811130838.7A patent/CN109492526A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107122776A (zh) * | 2017-04-14 | 2017-09-01 | 重庆邮电大学 | 一种基于卷积神经网络的交通标志检测与识别方法 |
CN108520212A (zh) * | 2018-03-27 | 2018-09-11 | 东华大学 | 基于改进的卷积神经网络的交通标志检测方法 |
Non-Patent Citations (4)
Title |
---|
IOFFE SERGEY: "《Batch renormalization: Towards reducing minibatch dependence in batch-normalized models》", 《ARXIV PREPRINT ARXIV:1702.03275 (2017)》 * |
XIAOHU ZHANG,ET AL: "《LD-CNN:A Lightweight Dilated Convolutional Neural Networkfor Environmental Sound Classification》", 《IN 2018 24TH INTERNATIONAL CONFERENCE ON PATTERN RECOGNITION (ICPR) 》 * |
张志龙 等: "《一种保持图像细节的直方图均衡新算法》", 《计算机工程与科学》 * |
范春朋: "《基于机器学习的交通标志识别研究》", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109910891A (zh) * | 2019-03-20 | 2019-06-21 | 奇瑞汽车股份有限公司 | 车辆控制方法和装置 |
CN110163187A (zh) * | 2019-06-02 | 2019-08-23 | 东北石油大学 | 基于f-rcnn的远距离交通标志检测识别方法 |
CN111401466A (zh) * | 2020-03-26 | 2020-07-10 | 广州紫为云科技有限公司 | 一种交通标志检测与识别标注方法、装置和计算机设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110569886B (zh) | 一种双向通道注意力元学习的图像分类方法 | |
CN107423760A (zh) | 基于预分割和回归的深度学习目标检测方法 | |
CN108647583B (zh) | 一种基于多目标学习的人脸识别算法训练方法 | |
CN108985269A (zh) | 基于卷积和空洞卷积结构的融合网络驾驶环境感知模型 | |
CN109492526A (zh) | 基于ldcnn模型和nhe算法的交通标志识别方法 | |
CN114299380A (zh) | 对比一致性学习的遥感图像语义分割模型训练方法及装置 | |
CN111445488B (zh) | 一种弱监督学习自动识别和分割盐体的方法 | |
CN104463209A (zh) | 一种基于bp神经网络的pcb板上数字代码识别方法 | |
CN109583321A (zh) | 一种基于深度学习的结构化道路中小物体的检测方法 | |
CN111259827B (zh) | 一种面向城市河道监管的水面漂浮物自动检测方法及装置 | |
CN105182350A (zh) | 一种应用特征跟踪的多波束声呐目标探测方法 | |
CN111882620A (zh) | 一种基于多尺度信息道路可行驶区域分割方法 | |
CN110245587B (zh) | 一种基于贝叶斯迁移学习的光学遥感图像目标检测方法 | |
CN108960342A (zh) | 基于改进SoftMax损失函数的图像相似度计算方法 | |
CN111931814A (zh) | 一种基于类内结构紧致约束的无监督对抗域适应方法 | |
CN114463643A (zh) | 多模型决策级融合的滑坡识别方法及装置 | |
CN111126155B (zh) | 一种基于语义约束生成对抗网络的行人再识别方法 | |
CN116110022A (zh) | 基于响应知识蒸馏的轻量化交通标志检测方法及系统 | |
CN113808123B (zh) | 一种基于机器视觉的药液袋动态检测方法 | |
CN103903017B (zh) | 一种基于自适应软直方图局部二值模式的人脸识别方法 | |
CN108319924A (zh) | 一种基于融合特征和elm算法的交通标志识别方法 | |
CN113505712B (zh) | 基于类平衡损失函数的卷积神经网络的海面溢油检测方法 | |
CN117830616A (zh) | 基于渐进式伪标签的遥感图像无监督跨域目标检测方法 | |
CN107392246A (zh) | 一种基于特征模型到背景模型距离的背景建模方法 | |
CN105528791B (zh) | 一种面向触摸屏手绘图像的质量评价装置及其评价方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20190319 |
|
WD01 | Invention patent application deemed withdrawn after publication |