CN108363957A

CN108363957A - 基于级联网络的交通标志检测与识别方法

Info

Publication number: CN108363957A
Application number: CN201810053591.7A
Authority: CN
Inventors: 邵杰; 刘震; 张东阳
Original assignee: Chengdu Koala Technology Co Ltd
Current assignee: Chengdu Koala Technology Co Ltd
Priority date: 2018-01-19
Filing date: 2018-01-19
Publication date: 2018-08-03

Abstract

本发明公开一种基于级联网络的交通标志检测与识别方法，涉及图像处理和标志识别技术领域，包括如下步骤：S1：采集原始图像；S2：对原始图像进行检测，得到可能包含交通标志或交通灯的候选区域；所述检测过程为采用训练后的三阶级联网络进行检测，三阶级联网络由12‑net、24‑net、48‑net三个子网络组成；S3：对候选区域进行识别，消去不包含交通标志或交通灯的候选区域，得到交通标志和交通灯的具体类别。本发明可以同时检测交通标志和交通灯，并且解决了现有的交通标志检测与识别技术中颜色空间容易收到光照的影响造成漏检、交通标志与背景环境差别不大时造成漏检、多个交通标志相连容易造成漏检的问题。

Description

基于级联网络的交通标志检测与识别方法

技术领域

本发明涉及图像处理和标志识别技术领域，尤其涉及一种基于级联网络的交通标志检测与识别方法。

背景技术

在当下，自动驾驶技术不断发展。计算机视觉在自动驾驶技术中占有重要的地位。交通标志和交通灯的检测与识别是视觉识别中的重要一环。以前的方法分别集中在交通标志或交通灯的检测，我们提出了一个新的框架可以同时检测交通灯与交通标志。检测的难点在于待检测物体在图片中所占的比例很小，加大了检测的难度，待检测物体的背景环境的复杂。现有的交通标志检测与识别技术有三种方法。

第一种方法，专利公开号为CN105787475A的发明专利申请公开了，一种复杂环境下的交通标志检测与识别方法：首先通过RGB颜色空间，设定相应的阈值提取中红黄蓝颜色区域。接下来对提取出来的区域进行形态学处理，也就是根据长度和长宽比舍去一些后换区域，轮廓的长度范围为[120,350],长宽比范围为 [0.526,1.9]。接下来进行轮廓的凸壳处理，使得提取出来区域的轮廓更圆滑，更接近圆形，三角形和矩形。提取傅里叶系数，与标准轮廓进行欧氏距离比较，舍去形状不规则的候选区域。对剩余的候选区域提取HOG特征，使用SVM分类器得到最终结果。该方案的方法通过RGB颜色空间进行区域提取，会造成区域提取不准确，漏检。RGB颜色空间提取区域方法容易受到光照，环境因素的影响。在光线明亮与灰暗两种情况下都不能有效的提取区域。如果我们需要的区域与背景环境颜色相似，这会将背景区域一起作为候选区域，造成区域提取不准确，同时在接下来的步骤中，会造成不符合条件而舍去。第二步中，通过形态学处理步骤，造成最终的结果只能限定在固定的长度和长宽比中，使用范围不准确。如果有多个交通标志紧密相连是，会将多个交通标志提取在一个候选中，在第二部舍去，造成大量漏检。

第二种方法，专利公开号为CN105809121A的发明专利申请公开了一种在专利多特征协同的交通标志检测与识别方法：通过交通标志样本图像建立各个颜色类别交通标志的颜色概率模型，选择各个颜色类别交通标志的代表颜色,计算得到各个代表颜色的概率查找表,训练得到各个形状类别交通标志的形状分类器以及识别模型。对于待检测交通图像,先使用各个代表颜色的概率查找表得到待检测交通图像的概率图,然后转换为灰度图,利用MSER算法检测各灰度图中的灰度变化稳定区域,将符合预设高宽比范围的区域作为候选窗口,将各候选窗口采用各交通标志形状分类器判定是否存在交通标志,对存在交通标志的候选窗口,采用对应形状的识别模型进行识别。对于待检测交通图像，得到待检测交通图像在每个代表颜色下的概率图,然后转换为灰度图。利用MSER算法检测各灰度图中的灰度变化稳定区域,去除稳定区域中高宽比在预设高宽比范围以外的区域,剩余的稳定区域作为候选窗口。将候选窗口尺寸调整至形状分类器输入尺寸,提取每个候选窗口对应图像块的HOG特征,输入各个交通标志形状分类器,判断该候选窗口是否为交通标志的形状类别,如果是,则说明该候选窗口存在交通标志,交通标志的形状即为对应形状分类器所进行判定的形状,否则不存在交通标志。本方案的方法将颜色模型转化为概率模型，但没有解决当背景环境与交通标志颜色相似情况下的检测问题。一块颜色与形状与交通标志相似的无关区域，会被该方法归为交通标志。该方法没有解决多个交通标志紧密相连的情况下的检测，通过概率图提取候选区域，同样会将多个相连的标志作为一个候选窗口，将会不符合预设的高宽比，在接下来的形状分类器中同样会将这种候选窗口舍去。

第三种方法，专利公开号为CN104598912A的发明专利申请公开了一种基于 CPU与GPU协同计算的交通灯检测识别方法：1)采集原始图像,降低原始图像的分辨率,在原始图像中对交通信号灯定位,得到感兴趣区域；2)将得到的感兴趣区域映射到原始图像中,对其进行颜色分割,得到候选区域图像；3)对候选区域图像进行预处理,包括形态学处理、几何特征过滤；4)为每类交通信号灯构造样本库, 对候选区域进行特征提取,通过模板匹配识别候选区域,从而识别交通灯；5)将步骤1)至步骤4)在协同异构计算平台上进行并行化加速。该方法先用颜色信息，后用形状信息来进行交通灯的检测，缺点是基于颜色信息的提取并不稳定，在佳通灯的检测上容易受到光照的影响，同样也容易受到环境的影响，比如汽车尾灯。

综上所述，现有的交通标志检测与识别技术中颜色空间容易收到光照的影响造成漏检、交通标志与背景环境差别不大时造成漏检、多个交通标志相连容易造成漏检的问题。

发明内容

本发明的目的在于：提出一种新的检测方法可以同时检测交通标志和交通灯，同时解决现有的交通标志检测与识别技术中颜色空间容易收到光照的影响造成漏检、交通标志与背景环境差别不大时造成漏检、多个交通标志相连容易造成漏检的问题，本发明提供一种基于级联网络的交通标志检测与识别方法。

本发明的技术方案如下：

基于级联网络的交通标志检测与识别方法，包括如下步骤：

S1：采集原始图像；

S2：对原始图像进行检测，得到可能包含交通标志或交通灯的候选区域；所述检测过程为采用训练后的三阶级联网络进行检测，三阶级联网络分别为 12-net，24-net，48-net；

S3：对候选区域进行识别，消去不包含交通标志或交通灯的候选区域，得到交通标志和交通灯的具体类别。

具体地，所述S2中，对三阶级联网络进行训练的过程为：

S21：在训练12-net时，在原始图像中目标物体窗口附近随机生成12x12 大小的窗口，所述目标物体为交通标志或交通灯，然后将12x12的窗口与目标物体窗口计算IOU，IOU大于上限阈值的窗口作为正样本，下限阈值到中间阈值之间的是部分正样本，小于下限阈值的是负样本；正样本和负样本在网络中用于是否为目标物体的分类,正样本代表是为目标物体，负样本代表不是目标物体；部分正样本和负样本用于边界框回归；

S22：在训练24-net时，在原始图像中目标物体窗口附近随机生成24x24 大小的窗口，所述目标物体为交通标志或交通灯，然后将24x24的窗口与目标物体窗口计算IOU，，IOU大于上限阈值的窗口作为正样本，下限阈值到中间阈值之间的是部分正样本，小于下限阈值的是负样本；正样本和负样本在网络中用于是否为目标物体的分类，正样本代表是为目标物体，负样本代表不是目标物体，目标物体为交通标志和交通灯；部分正样本和负样本用于边界框回归；

S23：在训练48-net时，在原始图像中目标物体窗口附近随机生成48x48 大小的窗口，所述目标物体为交通标志或交通灯，然后将48x48的窗口与目标物体窗口计算IOU，IOU大于上限阈值的窗口作为正样本，下限阈值到中间阈值之间的是部分正样本，小于下限阈值的是负样本；正样本和负样本在网络中用于是否为目标物体的分类，目标物体为交通标志和交通灯，正样本代表是为目标物体，负样本代表不是目标物体；部分正样本和负样本用于边界框回归。

具体地，所述S2的检测具体步骤为：

S23：将待识别图片缩放成不同尺寸的图片，建立一个图像金字塔；

S24：将图像金字塔输入到12-net网络中，得到一系列可能为交通标志的候选窗口，通过非极大值抑制合并重合度大于0.7的窗口；

S25：将经过S25后剩下的候选窗后输入到相对复杂的24-net中，舍弃一些不包含交通标志的候选窗口，再通过非极大值抑制处理，合并重合度大于0.7 的窗口；

S26:再将经过S26后剩下的候选窗口输入到最复杂的48-net中，舍去大量不包含交通标志和交通灯的窗口，得到最终可能为交通标志或交通灯的候选窗口，同样通过非极大值抑制处理，合并重合度大于0.7的窗口。

具体地，所述三阶级联网络使用的损失函数为：

L_i＝-(y_ilog(p_i)+(1-y_i)(1-log(p_i))

其中，p_i为经过检测网络得到的是是否为交通标志或交通灯的概率，y_i为真实标签；

其中l'_i,t'_i,h'_i,w'_i分别为真实的bounding box的最左边坐标，最上边坐标，长，宽；l_i,t_i,h_i,w_i分别为经过检测网络得到的bounding box的最左边坐标，最上边坐标，长，宽。

进一步地，所述S3的具体步骤为：

S31：通过S26得到的候选窗口分为包含目标物体的候选窗后和不包含目标物体的候选窗后两部分，目标物体为交通标志和交通灯；

S32：将不包含目标的候选窗口作为一个类别，命名为‘other’类，然后将‘other’类与交通标志和交通灯的类别样本，放入识别网络中训练；识别网络是一个包含两个denseblock的神经网络，dense block是一种新的卷积网络连接方式，表现为每一层的输入来自于前面所有层的输出；在测试时，如果候选窗口经过识别网络得到的结果为‘other’类，则表明该窗口内不包含交通标志和交通灯，舍去该窗口；否则表明该窗口内为交通标志或交通灯，输出得到具体的交通标志或交通灯的类别。

采用上述方案后，本发明的有益效果如下：

(1)本发明的方法相比以前的基于颜色空间的交通标志和交通灯检测方法，采用基于深度卷积网络的方法，能够在复杂环境下以及同时进行交通标志和交通灯检测与识别，检测出交通标志与交通灯，不会受到光照条件和具体背景颜色的影响，能够极大减少光照因素带来的漏检。

(2)本发明采用三阶级联网络进行检测，三阶级联网络通过三个网络层数逐渐加深的网络，功能不断加强，可以不断的优化检测效果，是一个由粗到精的过程，相比于单个网络，其结果更加精确，更加适合小物体的检测，在检测交通标志的召回率上目前达到世界最优。

(3)本发明对标记的识别过程采用了dense block网络来进行识别，相对于通用的cnn网络，减少了训练过程中造成的梯度消失问题；加强了特征传递；减少了参数数量，加快速度，在最终的识别阶段，可以获得更好的效果。

附图说明

图1为本发明的整体流程图；

图2为本发明的检测网络的结构图；

图3为本发明的识别网络结构图。

具体实施方式

下面，下面将结合本发明实施例中的附图，对本实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明的一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明提供一种基于级联网络的交通标志检测与识别方法，涉及图像处理技术和标志识别领域，该方法可以同时检测交通标志和交通灯，同时解决了颜色空间容易收到光照影响造成漏检的问题，能够精确的检测与是被出交通标志的交通灯，解决了交通标志与背景环境颜色相似造成漏检的问题，解决了多个交通标志相连的在颜色空间检测算法下的漏检问题。

如图1所示，本发明的基于级联网络的交通标志检测与识别方法，包括如下步骤：

S1：采集原始图像；

从背景技术中我们可以看出，原有的检测交通标志的方法都是先基于颜色空间(RGB，HSV等)提取区域，然后再对提取的区域形状进行判断是否为交通标志(三角形，圆形，长方形)。在用颜色空间提取区域时，当受到光照而导致标志的颜色变化时，就不能将该标志所在的区域有效的检测出来。环境的影响为：比如当检测的是一个红色的圆形标志，单背景一个不规则的红色形状，先用颜色来提取区域就会得到这个包含标志的红色背景形状，不属于三种形状的任意一种，在形状判断阶段该区域就会被舍去，导致这个标志没有被检测到。同样当两个标志相连接是，颜色提取后的区域不属于三个形状的任意一种，在形状检测阶段被舍去。

本发明的方法通过级联网络，即通过深度学习的方法，通过深度神经网络的构架在对图像进行检测的时候，提取到的特征中包含了形状、颜色、纹理等多个特征，避免了上述的漏检的问题。

S2中检测部分的三阶级联神经网络的具体构架如图2所示，S2中，对三阶级联网络进行训练的过程为：

S21：在训练12-net时，在原始图像中目标物体窗口附近随机生成12x12 大小的窗口，所述目标物体为交通标志或交通灯，然后将12x12的窗口与目标物体窗口计算IOU，IOU大于上限阈值的窗口作为正样本，下限阈值到中间阈值之间的是部分正样本，小于下限阈值的是负样本；正样本和负样本在网络中用于是否为目标物体的分类,正样本代表是为目标物体，负样本代表不是目标物体；部分正样本和负样本用于边界框回归。

本实施例中，上限阈值取值为0.7，下限阈值取值为0.4，中间阈值为0.65。

S22：在训练24-net时，在原始图像中目标物体窗口附近随机生成24x24 大小的窗口，所述目标物体为交通标志或交通灯，然后将24x24的窗口与目标物体窗口计算IOU，IOU大于上限阈值的窗口作为正样本，下限阈值到中间阈值之间的是部分正样本，小于下限阈值的是负样本；正样本和负样本在网络中用于是否为目标物体的分类，正样本代表是为目标物体，负样本代表不是目标物体，目标物体为交通标志和交通灯；部分正样本和负样本用于边界框回归。

图2中，本实施例的级联网络的具体参数如下：

Conv-1:3x3x10

Conv-2:3x3x10

Conv-3:3x3x32

Conv-4:3x3x28

Conv-5:3x3x48

Conv-6:2x2x64

Conv-7:3x3x32

Conv-8:3x3x64

Conv-9:3x3x64

MP-1:2x2

MP-2:3x3

MP-3:3x3

MP-4:3x3

MP-5:3x3

Mp-6:2x2

值得说明的是，S2中所有的上限阈值、中间阈值和下限阈值根据用户的需要自行调整。

所述S2的检测具体步骤为：

所述三阶级联网络使用的损失函数均为：

L_k＝-(y_klog(p_k)+(1-y_k)(1-log(p_k))

其中，p_k为经过检测网络得到的是是否为交通标志或交通灯的概率，y_k为真实标签；

在现有的方案中，常见的基于神经网络的物体检测算法有R-CNN，Fast R-CNN，Faster R-CNN。

这三种方法的思路分别为：1.R-CNN；(1)在图像中确定约1000-2000个候选框(使用选择性搜索)；(2)每个候选框内图像块缩放至相同大小，并输入到 CNN内进行特征提取；(3)对候选框中提取出的特征，使用分类器判别是否属于一个特定类；(4)对于属于某一特征的候选框，用回归器进一步调整其位置。 2.Fast R-CNN；(1)在图像中确定约1000-2000个候选框(使用选择性搜索)； (2)对整张图片输进CNN特征提取，得到特征图；(3)找到每个候选框在特征图上的映射斑点，将此斑点作为每个候选框的卷积特征输入到SPP layer和之后的层；(4)对候选框中提取出的特征，使用分类器判别是否属于一个特定类；(5) 对于属于某一特征的候选框，用回归器进一步调整其位置。3.Faster R-CNN；(1) 对整张图片输进CNN，得到特征图；(2)卷积特征输入到RPN网络，得到候选框的特征信息；(3)对候选框中提取出的特征，使用分类器判别是否属于一个特定类；(4)对于属于某一特征的候选框，用回归器进一步调整其位置。

从以上三种方法中可以看出，基于R-CNN和Fast R-CNN的检测都是基于先在图像中生成候选区域，使用的算法为选择性搜索，但是这种方法在检测小物体方面不能很好的工作。经过实验，检测性搜索算法检测交通标志的平均召回率为 0.7，从数据可以得出R-CNN，Fast R-CNN不适合交通标志检测。基于Faster R-CNN 的检测使用的是先通过一个CNN得到特征图，再经过一个RPN网络得到候选框，在CNN层经过4个pooling层后，但原始图像中的信息得到了损失，在损失后的图像信息中不利于得到小物体的候选框，相对在大物体的检测上结果差了许多。

在实验对比中，分为交通标志与交通灯两个部分。在交通标志部分，采用本实施例的检测方法后，取得的召回率和正确率分别为0.931和0.842，而采用基于Fast R-CNN的检测方法后，召回率和正确率为0.568和0.504，基于Fast R-CNN 的检测方法后，召回率和正确率为0.832和0.664。由此可见，传统的基于卷积神经网络的检测方法不能很好的用于该问题，我们的方法具有更好的效果。同时对比了目前世界上效果最好的方法，在论文Traffic-Sign Detect ion and Classification in the Wild中，检测交通标志的召回率和正确率为0.912和 0.883，图片大小为2048x2048大小时耗费的时间为每张8.23秒,而该发明使用的方法为每张2.37秒，与世界最优的方法相比，该发明在召回率和速度上更加具有优势。

对比传统的交通标志检测方法，以前的交通标志检测方法都是基于颜色空间进行目标窗口提取，再辅以形状检测，最后再通过分类器进行分类。光照的影响会导致在第一步基于颜色空间提取区域的时候出现问题。目标物体颜色与背景相似，多个目标物体相连时在第二步形状检测出现问题。传统的检测方法并不能很好的解决该问题。

在交通灯的实验对比是，Traffic lights detection and recognition basedon multi-feature fusion是一篇检测交通灯的论文，论文中的方法是目前效果最好的，是使用的方法是RGB+HSV+SVM的方法来检测，论文的识别方法取得的召回率和正确率分别为0.912,0.833；而采用本实施例的检测方法后，取得召回率和准确率分别为0.931和0.842。

所述S3的具体步骤为：

S31：通过S26得到的候选窗口分为包含目标物体和不包含目标物体两部分；

S32：将不包含目标的候选窗口作为一个类别，命名为‘other’类，与包含标志的窗口放入识别网络中训练；识别网络是一个包含两个dense block的神经网络；在测试时，如果候选窗口经过识别网络得到的结果为‘other’类，则表明该窗口内不包含交通标志和交通灯，舍去该窗口；否则表明该窗口内为交通标志或交通灯，输出得到具体的交通标志或交通灯的类别。

如图3所示，为本发明的识别网络的具体结构图，它包含了两个dense block 的神经网络，具体而言，识别网络的具体参数如下：

Convolution1:1x1x32

Dense block1:

Convolution1:1x1x32

Pooling 1:2x2

Dense block2:

Pooling 2:2x2

对于本领域技术人员而言，显然本发明不限于上述示范性实施例的细节，而且在不背离本发明的精神或基本特征的情况下，能够以其他的具体形式实现本发明。因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本发明的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。

此外，应当理解，虽然本说明书按照实施方式加以描述，但并非每个实施方式仅包含一个独立的技术方案，说明书的这种叙述方式仅仅是为清楚起见，本领域技术人员应当将说明书作为一个整体，各实施例中的技术方案也可以经适当组合，形成本领域技术人员可以理解的其他实施方式。

Claims

1.基于级联网络的交通标志检测与识别方法，其特征在于，包括如下步骤：

S1：采集原始图像；

S2：对原始图像进行检测，得到可能包含交通标志或交通灯的候选区域；所述检测过程为采用训练后的三阶级联网络进行检测，三阶级联网络分别为12-net，24-net，48-net；

2.根据权利要求1所述的基于级联网络的交通标志检测与识别方法，其特征在于，所述S2中，对三阶级联网络进行训练的过程为：

S21：在训练12-net时，在原始图像中目标物体窗口附近随机生成大小为12x12的窗口，所述目标物体为交通标志或交通灯，然后将12x12的窗口与目标物体窗口计算IOU，IOU大于上限阈值的窗口作为正样本，下限阈值到中间阈值之间的是部分正样本，小于下限阈值的是负样本；正样本和负样本在网络中用于是否为目标物体的分类,正样本代表是为目标物体，负样本代表不是目标物体；部分正样本和负样本用于边界框回归；

S22：在训练24-net时，在原始图像中目标物体窗口附近随机生成24x24大小的窗口，所述目标物体为交通标志或交通灯，然后将24x24的窗口与目标物体窗口计算IOU，IOU大于上限阈值的窗口作为正样本，下限阈值到中间阈值之间的是部分正样本，小于下限阈值的是负样本；正样本和负样本在网络中用于是否为目标物体的分类，正样本代表是为目标物体，负样本代表不是目标物体，目标物体为交通标志和交通灯；部分正样本和负样本用于边界框回归；

S23：在训练48-net时，在原始图像中目标物体窗口附近随机生成48x48大小的窗口，所述目标物体为交通标志或交通灯，然后将48x48的窗口与目标物体窗口计算IOU，IOU大于上限阈值的窗口作为正样本，下限阈值到中间阈值之间的是部分正样本，小于下限阈值的是负样本；正样本和负样本在网络中用于是否为目标物体的分类，目标物体为交通标志和交通灯，正样本代表是为目标物体，负样本代表不是目标物体；部分正样本和负样本用于边界框回归。

3.根据权利要求1或2所述的基于级联网络的交通标志检测与识别方法，其特征在于，所述S2的检测具体步骤为：

S25：将经过S25后剩下的候选窗后输入到相对复杂的24-net中，舍弃一些不包含交通标志的候选窗口，再通过非极大值抑制处理，合并重合度大于0.7的窗口；

4.根据权利要求1所述的基于级联网络的交通标志检测与识别方法，其特征在于，所述三阶级联网络使用的损失函数为：

L_i＝-(y_ilog(p_i)+(1-y_i)(1-log(p_i))

其中l′_i,t′_i,h′_i,w′_i分别为真实的bounding box的最左边坐标，最上边坐标，长，宽；l_i,t_i,h_i,w_i分别为经过检测网络得到的bounding box的最左边坐标，最上边坐标，长，宽。

5.根据权利要求3所述的基于级联网络的交通标志检测与识别方法，其特征在于，所述S3的具体步骤为：