CN108154102B - 一种道路交通标志识别方法 - Google Patents
一种道路交通标志识别方法 Download PDFInfo
- Publication number
- CN108154102B CN108154102B CN201711392349.4A CN201711392349A CN108154102B CN 108154102 B CN108154102 B CN 108154102B CN 201711392349 A CN201711392349 A CN 201711392349A CN 108154102 B CN108154102 B CN 108154102B
- Authority
- CN
- China
- Prior art keywords
- traffic sign
- image
- neural network
- layer
- convolutional neural
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 36
- 238000013528 artificial neural network Methods 0.000 claims abstract description 16
- 238000012545 processing Methods 0.000 claims abstract description 15
- 238000012360 testing method Methods 0.000 claims abstract description 15
- 239000013598 vector Substances 0.000 claims abstract description 14
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 12
- 238000011176 pooling Methods 0.000 claims abstract description 11
- 238000006243 chemical reaction Methods 0.000 claims abstract description 6
- 238000012549 training Methods 0.000 claims description 29
- 238000005286 illumination Methods 0.000 claims description 10
- 230000006870 function Effects 0.000 claims description 8
- 230000000007 visual effect Effects 0.000 claims description 7
- 230000008859 change Effects 0.000 claims description 6
- 230000014509 gene expression Effects 0.000 claims description 6
- 230000033001 locomotion Effects 0.000 claims description 6
- 210000002569 neuron Anatomy 0.000 claims description 6
- 230000004913 activation Effects 0.000 claims description 5
- 238000011478 gradient descent method Methods 0.000 claims description 4
- 230000011218 segmentation Effects 0.000 claims description 4
- 238000005315 distribution function Methods 0.000 claims description 3
- 230000007246 mechanism Effects 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims description 3
- UJKWLAZYSLJTKA-UHFFFAOYSA-N edma Chemical compound O1CCOC2=CC(CC(C)NC)=CC=C21 UJKWLAZYSLJTKA-UHFFFAOYSA-N 0.000 claims 2
- 238000010586 diagram Methods 0.000 description 7
- 238000000605 extraction Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 5
- 206010039203 Road traffic accident Diseases 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 238000012567 pattern recognition method Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 238000011524 similarity measure Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/56—Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
- G06V20/58—Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads
- G06V20/582—Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads of traffic signs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/50—Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种道路交通标志识别方法,包括:构建深度卷积神经网络,选取交通标准数据库和现场采集的交通标志图像对构建的深度卷积神经网络进行训练和测试,得到训练后的深度卷积神经网络;采集实时交通标志图像;在Itti模型的基础上加入交通标志位置分布先验知识,以调整采集的交通标志图像,然后进行亮度均衡化处理和颜色增强,再通过MSER算法提取交通标志的感兴趣区域;感兴趣区域输入到训练后的深度卷积神经网络进行卷积和池化处理,得到一维的特征矢量;通过全连接的BP神经网络完成一维的特征矢量的识别,输出识别结果,进行实时显示和播报。本发明可以准确识别采集到的各种类型交通标志,并通过文字或者语音及时提醒驾驶员做出相应的反应。
Description
技术领域
本发明涉及图像处理及智能交通领域,尤其涉及一种用于辅助驾驶系统的道 路交通标志识别方法。
背景技术
近年来,随着我国汽车保有量的急剧增加,车辆交通事故的发生呈现不断 上升趋势,交通安全随之成为日益严重的社会问题,因此实时了解交通环境对 于车辆驾驶安全是非常重要的。汽车安全辅助驾驶系统中的交通标志识别 (Traffic Sign Recognition,TSR)就是通过对行驶过程中前方道路出现的交通标志 进行采集和识别,并实时将结果通过文字或语音信息提供给驾驶员的驾驶安全 判断的系统。因此TSR作为辅助驾驶系统的重要组成部分能有效的提高车辆行 驶安全性,从而减少车辆交通事故的发生。
自从上世纪八十年代日本率先运用阈值分割、模板匹配等多种模式识别方 法对限速类交通标志进行了识别研究以来。经过几十年的发展,目前交通标志 识别方法主要有以下两种:一种是采用“人工特征提取+机器学习”的识别方法, 如支持向量机(SupportVector Machine,SVM)、基于浅层神经网络的特征识别等。 这种传统的交通标志识别方法依赖研究人员的先验知识去手工提取特征,手工 调节参数,机器学习仅负责最后特征的分类或识别,所以人工先验知识设计的 特征好坏将直接影响到整个系统的性能,且复杂的特征提取需要花费大量的人 力和时间,不利于TSR的实时性。另一种是基于近些年发展起来的Deep Learning 模型中的卷积神经网络(Convolutional Neural Network,CNN)。CNN是一种受 生物神经结构启发的多层前向神经网络,具有局部感受野、权值共享等特性, 在进行交通标志识别时只需要输入原始的交通标志像素特征,即可实时地输出 高精度的结果,避免了传统识别算法中复杂的特征提取和数据重建过程,从而 受到越来越多的专家和学者的关注与研究,并在TSR中取得了一定的效果。特 别是近年来随着高性能计算机、移动互联网和智能移动终端的普及,图像采集 设备和处理能力的提高,TSR在许多中高端汽车得到了广泛应用。但当前TSR 的提示信息大多是通过地图数据获知,且大多数是对静态图像中的交通标志进 行识别,同时对自然场景的交通标志识别也大多建立在PC机,缺少建立在移动 设备上的随车实时辅助驾驶系统;其次,在车辆行驶过程中,交通标志的采集 受到运动模糊、背景干扰及光照变化等因素影响,所获得的图像质量往往不高, 从而严重影响了识别率和识别速度,因此TSR是当前汽车安全辅助驾驶系统研 究领域中的关键技术之一,同时也是难度较大的实景图像识别问题之一,其识别 的结果直接影响辅助驾驶系统的性能和用户对系统的评价。
发明内容
本发明的目的在于克服现有技术的不足,提供一种用于辅助驾驶系统的高 识别率的道路交通标志识别方法,该方法能够快速准确的识别出交通标志。
为了实现上述目的,本发明采用的技术方案为:一种道路交通标志识别方法, 包括以下步骤:
步骤一:构建深度卷积神经网络,选取交通标准数据库和现场采集的交通标志 图像对构建的深度卷积神经网络进行训练和测试,得到训练后的深度卷积神经 网络;
步骤二:采集实时交通标志图像;
步骤三:在Itti视觉注意模型基础上加入交通标志位置分布先验知识,以调整采集的交通标志图像,然后进行亮度均衡化处理和颜色增强,再通过MSER算法 提取交通标志的感兴趣区域;
步骤四:步骤三中得到的感兴趣区域输入到训练后的深度卷积神经网络进行卷积和池化处理,得到一维的特征矢量;
步骤五:通过全连接的BP神经网络完成一维的特征矢量的识别,输出识别结果,进行实时显示和播报。
进一步地,在交通标志标准数据库和现场采集的交通标志图像中选取包含运 动模糊、背景干扰、光照变化以及局部遮挡破损等多种情况的交通标志图像对 构建的深度卷积神经网络进行训练和测试。
进一步地,由Itti视觉注意模型得到图像的显著图,在此基础上利用位置分 布先验知识对交通标志图像进行调整包括:
把一幅图像平均分成4×4的子区域,依次为I11,I12,…,I14,…,I44, 通过统计大量含有交通标志的图像,获得交通标志在一幅图中每个子区域交通 标志出现的概率为P11,P12,…,P14,…,P44,得到位置经验概率分布 矩:
利用位置经验概率分布矩对图像显著图进行调整:
其中,Sij表示交通标志图像中每个4×4的子区域;
调整后的图像使用竞争学习规则——Winner-take-all机制实现目标间的竞 争,得到显著性焦点,最后以交通标志图像的颜色矩与HU不变矩联合矩为特 征向量,采用Manhattan距离度量显著区中待识别目标与先验知识库中交通标志 的相似性,其中交通标志特征的马氏经验阈值为25.462~37.754,当在这个范围 内时判定该区域有感兴趣目标,否则不存在感兴趣目标则该显著区被丢弃而不 进行进一步的分割与识别,基于此得到交通标志所在的感兴趣区域。
进一步地,对于调整后的图像,首先在YCbCr颜色模型下对图像的亮度分量 Y进行直方图均衡化处理;光照均衡化如下:
其中,Sk表示处理后的灰度值,nj表示灰度色阶j的像素数量,N是图像像 素总和,然后将处理后的图像再转为RGB模型,根据交通标志颜色特点,进行 颜色增强,最后用MSER算法提取交通标志感兴趣区域ROI。
进一步地,深度卷积神经网络是由一层卷积层C1接一层池化层S2后再加一 层卷积层C3与池化层S4构建而成,当输入交通标志图像ROI,得到特征子图, 然后将特征子图展开形成一维的特征子集。
进一步地,BP神经网络输出层的每一个神经元的输出值对应于输入图像所 属不同交通标志的概率,表达式为:
进一步地,采用DSP控制CCD摄像头采集实时的交通标志图像,将来自 CCD摄像头的交通标志视频信号通过视频解码芯片进行A/D转换,经视频端口 VP1内部的FIFO缓存后,由芯片DM6437通过EDMA将数据搬移到片外SDRAM中,对视频图像进行处理,处理后的结果由DM6437通过EDMA搬移 到视频口VP0内部的FIFO缓存后,经过视频编码芯片进行D/A转换,在显示 屏上显示识别结果,同时DM6437通过语音芯片实时播报识别结果。
进一步地,处理器DM6437连接一个外挂的FLASH存储器存储训练好的数 据。
进一步地,深度卷积神经网络训练方法包括:
图像预处理步骤:先利用邻近插值法将图像进行规格化,再利用最大类间 方差法将交通标志图像二值化;
神经网络的初始化步骤:利用随机分布函数将权值W初始化为-1到1之间 的随机数;将偏置b初始化为0;
神经网络训练与权值和偏置的调整步骤:用选取的训练集输入构建的卷积 神经网络进行训练,在梯度下降法基础上引入动量因子η依次调整权值和阈值;
判断步骤:判断误差是否满足精度要求,或训练已达到预先设定好的最大 训练次数,若是,则训练完成,否则返回调整步骤。
本发明的优点在于:本发明提出的方法能够准确及时地自动识别车辆行驶 过程中采集到的各种类型交通标志,并通过文字或者语音信息及时提醒驾驶员 做出相应的反应,从而提高了驾车的安全性和可靠性,减少交通事故的发生。
附图说明
下面对本发明说明书各幅附图表达的内容及图中的标记作简要说明:
图1为基于DM6437的TSR系统方框图;
图2为用于TSR系统的卷积神经网络结构示意图;
图3为网络训练流程图;
图4为网络测试流程图;
图5为检测交通标志ROI的流程图。
具体实施方式
下面对照附图,通过对最优实施例的描述,对本发明的具体实施方式作进 一步详细的说明。
本发明提出了一种以DM6437处理器为平台,基于感兴趣区域和改进的卷 积神经网络的交通标志识别的方法。图1是基于DM6437的TSR系统方框图。 首先,采用GTSDB和现实场景拍摄交通标志图像对网络进行训练与测试。图3 是网络训练流程图,图4是网络测试流程图。CNN采用了工作信号前向传播输 出结果,误差信号反向传播调整权值和偏置,图2是用于TSR系统的卷积神经 网络结构示意图。考虑一个样本时,则对于第n个样本的误差可表示为:
为了更新网络的权值和偏置,也就是最小化这个E。
反向传播回来的误差可以看作是每个神经元的基的灵敏度,如下:
则第l层的灵敏度为:
其中,E为误差,Wl为第l层的权值,xl-1是l-1层的输出,l层的输入,α为 学习率。在梯度下降法基础上引入动量因子η(0<η<1),使得在同一梯度方向 上的修正量增加,则所有的权值和偏置更新公式如下:
Wij(k+1)=Wij(k)+ΔWij(k+1)
bj(k+1)=bj(k)+Δbj(k+1)
其中:k表示迭代次数;ΔWij,Δbj分别表示权值和偏置的修正值; Wij,bj分别表示调整后的权值和偏置;α为学习率;η为动量因子。通过网络前 向传播输出结果和反向传播调整权值的反复交替处理,直到满足识别收敛条件 或达到训练次数要求为止。
进一步,GTSDB是Stallkamp J等人于2013年在IJCNN会议上提出来的 交通标志标准数据库。在GTSDB数据集中选取了包含运动模糊、背景干扰、光 照变化以及局部遮挡破损等不同情况的850张和现实场景拍摄的150张,共1000 张交通标志图像作为训练库,对网络进行训练;同样在GTSDB数据集中选取不 同情况下的150张和现实场景拍摄的50张,共200张交通标志图像对网络进行 测试。最后将训练好的网络数据存储到外挂的FLASH中。
进一步,通过TMS320DM6437型处理器控制CCD前置摄像头采集有效的 交通标志图像。TMS320DM6437是一款32位定点DSP达芬奇技术的处理器, 专门为高性能、低成本视频应用而开发出的产品。具有非常强大的功能,能够 支持3路D1解析度的H.264视频编码,最高工作频率可达700MHz,满足TSR 系统的实时性要求。
进一步,提取交通标志图像ROI作为CNN的输入,减小了光照变化和大部 分背景对检测和识别的影响,从而提高了TSR的识别率和识别速度。图5为提 取交通标志图像ROI流程图。
实际应用中,TSR系统都是在车辆的顶部或前方安装前视摄像头,随车辆 的移动而移动,因此交通标志在图像中的位置也在不断变化。根据道路交通法 规规定,交通标志安放的位置、高度都有一定的标准,通常情况下,当交通标 志离车辆30m左右时是检测的最佳距离。首先将采集到的大量的交通标志图像 平均分成4×4的子区域,从左到右、从上到下依次为I11,I12,…,I14,…,I44,则相应的 每个子区域交通标志出现的概率依次为P11,P12,…,P14,…P44,通过统计发现交通标 志出现在I23,I24,I33,I34的概率最大,约为78%,而出现在I41,I42,I43,I44的概率几乎 为0。因此,交通标志一般出现在一幅图像的右上或右中的位置,由Itti视觉注 意模型得到视觉显著图,在此基础上加入位置先验分布知识来调整交通标志图 像。
对于调整后的图像,为了消除光照等因素影响,首先在YCbCr颜色模型下 对交通标志图像的亮度分量Y进行直方图均衡化处理,然后将YCbCr图像转为 RGB颜色模型,根据交通标志颜色特点,在RGB模型下进行颜色增强。其中的 亮度直方图均衡化如下式:
其中,Sk表示处理后的灰度值,nj表示灰度色阶j的像素数量,N是图像像 素总和。最后用MSER算法得到交通标志图像ROI,MSER算法具有仿射不变 性、稳定性和可以检测不同精细程度的区域特点。
进一步,用构建的CNN进行交通标志特征提取。CNN通过权重共享、局 部区域感知的特性可减少参数的数目,同时对输入数据在空间上和时间上的扭 曲有很强的鲁棒性。
根据交通标志图像的特点,这里采用的CNN网络结构是由一层卷积层C1 接一层池化层S2后再加一层卷积层C3与池化层S4构建而成,当输入交通标志 图像ROI后得到特征子图,然后把特征子图全部展开形成一维的特征子集。其 中的卷积层过程如下:
其中,是第l层中第i个卷积特征子图的输出;符号*表示二维 卷积运算;r是前一层的输出的总个数;是第l中第i个卷积的权值;是 第l中第i个卷积的偏置;f(x)采用了速度较快、精度高的非线性ReLu激活函数, 若x是函数的输入,其表达式为:
对于一幅MX*NX的图像,卷积核大小为MW*NW,那么卷积后输出图像大小 为(MX-MW+1)*(NX-NW+1)。
进一步,用一个全连接的BP神经网络对一维的特征矢量进行分类,大大提 高了处理速度,实现了自动分类识别的目的。BP神经网络输出层的每一个神经 元的输出值对应于输入图像所属不同交通标志的概率,表达式为:
进一步,通过语音模块进行语音播报识别结果。DM6437通过GPIO45与语 音芯片WT588D-U的P03相连,用于传送数据和命令。语音模块的工作电压为 直流电压2.8伏到5.5伏之间可调,内部存储的空间大小为32MB;且PWM可 以直接驱动0.5W的扬声器,可以加载500段语音;可USB下载,使用方便。
下面结合附图及实施例,对本发明内容进行详细说明。但此处所描述的具 体实施例仅用于解释本发明,并不用于限定本发明,这里以禁令标志为例。
图1是本发明中提供的一种用于辅助驾驶系统的道路交通标志识别方法的 方框图,包括:
网络训练模块101:用GTSDB德国交通标志基准库和拍摄的大量现实场 景图像对网络进行训练。图2是用于TSR系统的卷积神经网络结构示意图。CNN 由卷积层与池化层交替设置构建而成进行特征提取形成特征子图,然后将特征 子图全部展开形成一维的特征子集,最后加一个全连接的BP网络对一维的特征 矢量分类识别,输出识别结果。
在GTSDB数据集中选取包含运动模糊、背景干扰、光照以及交通标志局部 遮挡破损等不同情况850张和现实场景拍摄的150张,共1000张交通标志图像 作为训练库,对网络进行训练;再在GTSDB数据集中以同样方式选取不同情况 的150张图像和现实场景拍摄的50张图像对网络进行测试。
图3是网络训练流程图,具体包括如下步骤:
步骤301图像预处理:先利用邻近插值法将图像进行规格化,再利用最大 类间方差法将交通标志图像二值化。
步骤302网络的初始化:利用随机分布函数将权值W初始化为-1到1之间 的随机数;将偏置b初始化为0。
步骤303网络训练与权值和偏置的调整:用选取的训练集输入构建的卷积 神经网络进行训练,在梯度下降法基础上引入动量因子η依次调整权值和阈值, 更新公式如下:
Wij(k+1)=Wij(k)+ΔWij(k+1)
bj(k+1)=bj(k)+Δbj(k+1)
其中:k表示迭代次数;ΔWij,Δbj分别表示权值和偏置的修正值;Wij,bj分别表示调整后的权值和偏置;α为学习率;η为动量因子。
步骤304判断指标是否满足精度要求E≤ε,或训练已达到预先设定好的最 大训练次数,进行下一步;否则,返回步骤303。其中E是总误差,ε表示精度 要求或期望。
网络测试模块102:用选取的测试集数据输入已训练好的网络进行测试。图 4是网络测试流程图,包括步骤401图像归一化,步骤402得到适合网络输入标 准的图像,步骤403网络测试参数配置,步骤404网络测试,最后输出测试结 果。
图像的采集模块103:能否获得一张清晰的交通标志图像是TSR的关键之 一,CCD摄像头将实时采集的交通标志图像传送到视频解码芯片TVP5150AM1 中进行A/D,DM6437通过I2C对TVP5150AM1芯片进行配置,TVP5150AM1 芯片在同步信号的控制下,把采集到的交通标志图像以YCbCr的格式传送到视 频处理前端进行处理。
检测提取ROI模块104:在Itti模型基础上加入交通标志位置分布先验知识 调整采集到实时交通标志图像;再对图像进行亮度直方图均衡化处理,然后将 YCbCr图像转为RGB颜色模型进行颜色增强,最后通过MSER算法提取交通 标志图像ROI。图5是检测提交通标志图像ROI的流程图。包括以下步骤:
步骤50:在Itti模型基础上利用交通标志先验分布概率知识对图像显著图进 行调整,包括步骤501计算每个子区域交通标志出现的位置分布概率,得到位 置经验概率分布矩:
步骤502利用位置经验概率分布矩对图像显著图的每个子区域进行调整:
其中,Sij表示图像显著图分成的每个4×4的子区域。调整后,交通标志出现 位置的显著性得到增强,概率小的子区域显著性小。
步骤503将调整后的显著图使用Winner-take-all竞争学习机制实现目标间 的竞争:首先,从显著图中找到注意焦点,选取候选区域得到显著注意区;然 后,在返回抑制机制的作用下,根据显著性选择下一个注意焦点,进而实现了 注意焦点的转移。
步骤504相似性度量:对于选中的显著区域,利用交通标志颜色矩与HU 不变矩联合矩特征向量用Manhattan距离度量视觉显著区中待识别目标与先验 知识库中交通标志的相似性,其中交通标志特征的马氏距离的经验阈值为 (25.462,37.754),当在这个范围内时判断这个显著区域有感兴趣目标,否则 不存在交通标志这个感兴趣目标,则该显著区被丢弃而不进行进一步的分割与 识别,基于此得到交通标志所在的感兴趣区域。
步骤51:包括步骤511对调整后的交通标志所在子区域在YCbCr颜色模型 下对其亮度分量Y进行直方图均衡化,步骤512将处理后的图像变换为RGB模 型,步骤513在RGB颜色模型下进行颜色增强。以禁令标志为例,禁令标志是 红色的,所以这里是以红色进行颜色增强,公式如下:
其中,R、G、B分别表示红色、绿色、蓝色,CA表示增强后的图像。
步骤52:采用MSER算法提取ROI。MSER算法提取过程如下:首先将图 像从一个区域到灰度S{0,1,…,255}进行映射,同时按照灰度将全部像素排序, 然后采用并查集算法建立极值区域树,最后通过稳定性函数筛选出稳定性满足 阈值要求的极值区域作为MSER。
步骤53:归一化,首先对检测到的交通标志图像的ROI利用邻近插值法进 行标准化(32*32),然后利用最大类间方差法将交通标志图像二值化,得到适 合CNN输入的图像。
识别输出模块105:将归一化后的ROI图像输入构建的CNN,进行卷积和 池化处理,得到交通标志图像的特征子图,将特征子图转化成为一维的特征矢 量,最后通过一个全连接的BP网络提高处理速度,完成特征矢量的自动分类识 别,输出结果。BP神经网络输出层的每一个神经元的输出值对应于输入图像所 属不同交通标志的概率,
表达式为:
显示模块106:识别后的结果由DM6437通过EDMA搬移到视频口VP0 内部的FIFO缓存后,经过视频编码芯片SAA7121H进行D/A转换,在显示器 上通过文字显示出来。
语音模块107:DM6437通过GPIO口与语音芯片WT588D-U的P03相连 传送数据和命令,实时播报TSR识别结果,提醒驾驶员当前的交通环境,从而 使行驶更加安全。
本发明提出了一种基于DSP嵌入式平台,用于辅助驾驶系统的道路交通标 志识别方法,与其他识别方法相比,本发明能有效地提高识别率和识别速度。 本发明首先采用TMS320DM6437型DSP控制的前置摄像头采集交通标志图像, 同时能以文字和语音信息输出结果来提醒驾驶员当前的交通环境,从而使行驶 更加安全,具有实时性;其次通过提取交通标志图像ROI输入到构建的CNN中, 能有效地解决背景干扰、光照变化等因素对的TSR的影响,并且CNN具有局 部感受野、权值共享等特点,其干扰能力强,参数数目少,训练时间短,进一 步提高了识别率和实时性。同时本方法还可以提醒交通监管部门交通标志破损情况,节省了人力物力。
显然本发明具体实现并不受上述方式的限制,只要采用了本发明的方法构 思和技术方案进行的各种非实质性的改进,均在本发明的保护范围之内。
Claims (6)
1.一种道路交通标志识别方法,其特征在于:包括以下步骤:
步骤一:构建深度卷积神经网络,选取交通标准数据库和现场采集的交通标志图像对构建的深度卷积神经网络进行训练和测试,得到训练后的深度卷积神经网络;
步骤二:采集实时交通标志图像;
步骤三:在Itti视觉注意模型基础上加入交通标志位置分布先验知识,以调整采集的交通标志图像,然后进行亮度均衡化处理和颜色增强,再通过MSER算法提取交通标志的感兴趣区域;
步骤四:步骤三中得到的感兴趣区域输入到训练后的深度卷积神经网络进行卷积和池化处理,得到一维的特征矢量;
步骤五:通过全连接的BP神经网络完成一维的特征矢量的识别,输出识别结果,进行实时显示和播报;
在交通标志标准数据库和现场采集的交通标志图像中选取包含运动模糊、背景干扰、光照变化以及局部遮挡破损等多种情况的交通标志图像对构建的深度卷积神经网络进行训练和测试;
由Itti视觉注意模型得到图像的显著图,在此基础上利用位置分布先验知识对交通标志图像进行调整包括:
把一幅图像平均分成4×4的子区域,依次为I11,I12,…,I14,…,I44,通过统计大量含有交通标志的图像,获得交通标志在一幅图中每个子区域交通标志出现的概率为p11,p12,...,p44,得到位置经验概率分布矩:
利用位置经验概率分布矩对图像显著图进行调整:
其中,Sij表示调整前交通标志图像显著图中第i行,第j列子区域显著性;pij表示交通标志在第i行,第j列子区域出现的概率;S′ij表示调整后交通标志图像显著图中第i行,第j列子区域显著性;
调整后的图像使用竞争学习规则即Winner-take-all机制实现目标间的竞争,得到显著性焦点,最后以交通标志图像的颜色矩与HU不变矩联合矩为特征向量,采用Manhattan距离度量显著区中待识别目标与先验知识库中交通标志的相似性,设定其Manhattan距离经验阈值为25.462~37.754,当在这个范围内时判定该区域有感兴趣目标,否则不存在感兴趣目标则该显著区被丢弃而不进行进一步的分割与识别,基于此得到交通标志所在的感兴趣区域;对于调整后的图像,首先在YCbCr颜色模型下对图像的亮度分量Y进行直方图均衡化处理;光照均衡化如下:
其中,k表示均衡化前的灰度级,Sk表示处均衡化后的灰度值,nr表示灰度级为r的像素个数,N是图像像素总和;然后将处理后的图像再转为RGB模型,根据交通标志颜色特点,进行颜色增强,最后用MSER算法分割交通标志感兴趣区域ROI。
2.如权利要求1所述的一种道路交通标志识别方法,其特征在于:深度卷积神经网络是由一层卷积层C1接一层池化层S2后再加一层卷积层C3与池化层S4构建而成,当输入交通标志图像ROI,得到特征子图,然后将特征子图展开形成一维的特征子集。
4.如权利要求1所述的一种道路交通标志识别方法,其特征在于:采用DSP控制CCD摄像头采集实时的交通标志图像,将来自CCD摄像头的交通标志视频信号通过视频解码芯片进行A/D转换,经视频端口VP1内部的FIFO缓存后,由芯片DM6437通过EDMA将数据搬移到片外SDRAM中,对视频图像进行处理,处理后的结果由DM6437通过EDMA搬移到视频口VP0内部的FIFO缓存后,经过视频编码芯片进行D/A转换,在显示屏上显示识别结果,同时DM6437通过语音芯片实时播报识别结果。
5.如权利要求4所述的一种道路交通标志识别方法,其特征在于:芯片DM6437连接一个外挂的FLASH存储器存储训练好的数据。
6.如权利要求1所述的一种道路交通标志识别方法,其特征在于:深度卷积神经网络训练方法包括:
图像预处理步骤:先利用邻近插值法将图像进行规格化,再利用最大类间方差法将交通标志图像二值化;
神经网络的初始化步骤:利用随机分布函数将权值W初始化为-1到1之间的随机数;将偏置b初始化为0;
神经网络训练与权值和偏置的调整步骤:用选取的训练集输入构建的卷积神经网络进行训练,在梯度下降法基础上引入动量因子η依次调整权值和阈值;
判断步骤:判断误差是否满足精度要求,或训练已达到预先设定好的最大训练次数,若是,则训练完成,否则返回调整步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711392349.4A CN108154102B (zh) | 2017-12-21 | 2017-12-21 | 一种道路交通标志识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711392349.4A CN108154102B (zh) | 2017-12-21 | 2017-12-21 | 一种道路交通标志识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108154102A CN108154102A (zh) | 2018-06-12 |
CN108154102B true CN108154102B (zh) | 2021-12-10 |
Family
ID=62464896
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711392349.4A Active CN108154102B (zh) | 2017-12-21 | 2017-12-21 | 一种道路交通标志识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108154102B (zh) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108681727B (zh) * | 2018-07-11 | 2024-06-11 | 天津天瞳威势电子科技有限公司 | 一种基于视觉的交通标示识别方法及装置 |
CN109492661B (zh) * | 2018-09-27 | 2021-08-13 | 桂林电子科技大学 | 基于wwcnn模型和tvpde算法的交通标志识别方法 |
CN109446984A (zh) * | 2018-10-26 | 2019-03-08 | 重庆大学 | 自然场景中道路交通标志识别方法 |
CN109740647A (zh) * | 2018-12-21 | 2019-05-10 | 贵阳中医学院 | 一种小花清风藤叶的识别方法 |
CN109815906B (zh) * | 2019-01-25 | 2021-04-06 | 华中科技大学 | 基于分步深度学习的交通标志检测方法及系统 |
CN109886161B (zh) * | 2019-01-30 | 2023-12-12 | 江南大学 | 一种基于可能性聚类和卷积神经网络的道路交通标识识别方法 |
CN110175561A (zh) * | 2019-05-24 | 2019-08-27 | 上海电机学院 | 一种道路交通标志检测与识别方法 |
CN110889378B (zh) * | 2019-11-28 | 2023-06-09 | 湖南率为控制科技有限公司 | 一种多视图融合交通标志检测识别方法及其系统 |
CN110826544A (zh) * | 2019-12-23 | 2020-02-21 | 深圳市豪恩汽车电子装备股份有限公司 | 交通标志检测识别系统及方法 |
CN111241916A (zh) * | 2019-12-25 | 2020-06-05 | 苏州奥易克斯汽车电子有限公司 | 一种交通标志识别模型的建立方法 |
CN111178300B (zh) * | 2019-12-31 | 2021-01-29 | 北京城市网邻信息技术有限公司 | 目标检测方法、装置、设备、介质 |
CN111428556B (zh) * | 2020-02-17 | 2024-01-19 | 浙江树人学院(浙江树人大学) | 一种基于胶囊神经网络的交通标志识别方法 |
CN112418297A (zh) * | 2020-11-19 | 2021-02-26 | 北京云从科技有限公司 | 基于图像扩展的ocr模型训练方法、系统及装置 |
CN113780148A (zh) * | 2021-09-06 | 2021-12-10 | 京东鲲鹏(江苏)科技有限公司 | 交通标志图像识别模型训练方法和交通标志图像识别方法 |
CN113762257B (zh) * | 2021-09-30 | 2024-07-05 | 时趣互动(北京)科技有限公司 | 一种美妆品牌图像中标志的识别方法及装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103810503A (zh) * | 2013-12-26 | 2014-05-21 | 西北工业大学 | 一种基于深度学习的自然图像中显著区域的检测方法 |
CN104537393A (zh) * | 2015-01-04 | 2015-04-22 | 大连理工大学 | 一种基于多分辨率卷积神经网络的交通标志识别方法 |
CN107122776A (zh) * | 2017-04-14 | 2017-09-01 | 重庆邮电大学 | 一种基于卷积神经网络的交通标志检测与识别方法 |
CN107330365A (zh) * | 2017-05-27 | 2017-11-07 | 深圳市美好幸福生活安全系统有限公司 | 基于最大稳定极值区域和svm的交通标志识别方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10332266B2 (en) * | 2014-11-18 | 2019-06-25 | Agency For Science, Technology And Research | Method and device for traffic sign recognition |
CN104517103A (zh) * | 2014-12-26 | 2015-04-15 | 广州中国科学院先进技术研究所 | 一种基于深度神经网络的交通标志分类方法 |
CN104978570B (zh) * | 2015-06-25 | 2018-10-23 | 西北工业大学 | 基于增量学习的行车视频中交通标志的检测和识别方法 |
CN107122701A (zh) * | 2017-03-03 | 2017-09-01 | 华南理工大学 | 一种基于图像显著性和深度学习的交通道路标志识别方法 |
-
2017
- 2017-12-21 CN CN201711392349.4A patent/CN108154102B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103810503A (zh) * | 2013-12-26 | 2014-05-21 | 西北工业大学 | 一种基于深度学习的自然图像中显著区域的检测方法 |
CN104537393A (zh) * | 2015-01-04 | 2015-04-22 | 大连理工大学 | 一种基于多分辨率卷积神经网络的交通标志识别方法 |
CN107122776A (zh) * | 2017-04-14 | 2017-09-01 | 重庆邮电大学 | 一种基于卷积神经网络的交通标志检测与识别方法 |
CN107330365A (zh) * | 2017-05-27 | 2017-11-07 | 深圳市美好幸福生活安全系统有限公司 | 基于最大稳定极值区域和svm的交通标志识别方法 |
Non-Patent Citations (8)
Title |
---|
"A visual attention based convolutional neural network for image classification";Yaran Chen 等;《2016 12th World Congress on Intelligent Control and Automation (WCICA)》;20160929;第764-769页 * |
"Real-Time Detection and Recognition of Road Traffic Signs";Greenhalgh J 等;《IEEE Transactions on Intelligent Transportation Systems》;20121231;第13卷(第4期);第1498-1506页 * |
"基于DPM的交通标志检测算法研究";李斌;《中国优秀硕士学位论文全文数据库信息科技辑》;20151015;第2015年卷(第10期);第10-11页、第47页1-4段,图1-1 * |
"基于TMS320DM6437的视频采集";刘德勇;《微型机与应用》;20130930;第32卷(第17期);第24-25页,图1-2 * |
"基于图模型与卷积神经网络的交通标志识别方法";刘占文 等;《交通运输工程学报》;20161231;第16卷(第5期);第122-131页 * |
"基于边缘检测的显著区域提取方法";王文正 等;《电子技术》;20141231;第43卷(第1期);第14-16页 * |
"复杂场景下交通标志检测技术研究";汪哲慎;《中国优秀硕士学位论文全文数据库信息科技辑》;20070715;第2007年卷(第1期);摘要、第19-22页、第28-29页、第45-46页,图3.4、图3.5、图3.10 * |
"移动设备上交通标志识别算法的研究与实现";张滨;《中国优秀硕士学位论文全文数据库信息科技辑》;20141015;第2014年卷(第10期);I138-1012 * |
Also Published As
Publication number | Publication date |
---|---|
CN108154102A (zh) | 2018-06-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108154102B (zh) | 一种道路交通标志识别方法 | |
Zhang et al. | Deep gated attention networks for large-scale street-level scene segmentation | |
CN109840521B (zh) | 一种基于深度学习的一体化车牌识别方法 | |
CN106909902B (zh) | 一种基于改进的层次化显著模型的遥感目标检测方法 | |
US10445602B2 (en) | Apparatus and method for recognizing traffic signs | |
CN106650731B (zh) | 一种鲁棒的车牌、车标识别方法 | |
CN107103317A (zh) | 基于图像融合和盲反卷积的模糊车牌图像识别算法 | |
CN107122776A (zh) | 一种基于卷积神经网络的交通标志检测与识别方法 | |
CN105354568A (zh) | 基于卷积神经网络的车标识别方法 | |
CN107273896A (zh) | 一种基于图像识别的车牌检测识别方法 | |
CN108009518A (zh) | 一种基于快速二分卷积神经网络的层次化交通标识识别方法 | |
CN108830196A (zh) | 基于特征金字塔网络的行人检测方法 | |
CN106650721A (zh) | 一种基于卷积神经网络的工业字符识别方法 | |
CN106682569A (zh) | 一种基于卷积神经网络的快速交通标识牌识别方法 | |
CN104200228B (zh) | 一种安全带识别方法与系统 | |
CN111191583A (zh) | 基于卷积神经网络的空间目标识别系统及方法 | |
CN110633708A (zh) | 一种基于全局模型和局部优化的深度网络显著性检测方法 | |
CN110569782A (zh) | 一种基于深度学习目标检测方法 | |
CN104299006A (zh) | 一种基于深度神经网络的车牌识别方法 | |
CN110659550A (zh) | 交通标志牌识别方法、装置、计算机设备和存储介质 | |
CN103295021A (zh) | 一种静态图片中车辆特征检测及识别的方法及系统 | |
CN111582339A (zh) | 一种基于深度学习的车辆检测与识别的方法 | |
US20240161304A1 (en) | Systems and methods for processing images | |
CN107704833A (zh) | 一种基于机器学习的前方车辆检测与跟踪方法 | |
CN110188750A (zh) | 一种基于深度学习的自然场景图片文字识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |