CN106326858A - 一种基于深度学习的公路交通标志自动识别与管理系统 - Google Patents
一种基于深度学习的公路交通标志自动识别与管理系统 Download PDFInfo
- Publication number
- CN106326858A CN106326858A CN201610709259.2A CN201610709259A CN106326858A CN 106326858 A CN106326858 A CN 106326858A CN 201610709259 A CN201610709259 A CN 201610709259A CN 106326858 A CN106326858 A CN 106326858A
- Authority
- CN
- China
- Prior art keywords
- traffic sign
- candidate
- traffic
- image
- identification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013135 deep learning Methods 0.000 title claims abstract description 12
- 230000006870 function Effects 0.000 claims abstract description 21
- 238000001514 detection method Methods 0.000 claims abstract description 12
- 238000012545 processing Methods 0.000 claims abstract description 10
- 238000000034 method Methods 0.000 claims description 23
- 239000013598 vector Substances 0.000 claims description 21
- 238000013527 convolutional neural network Methods 0.000 claims description 14
- 238000010586 diagram Methods 0.000 claims description 9
- 239000011159 matrix material Substances 0.000 claims description 9
- 238000011176 pooling Methods 0.000 claims description 6
- 230000008569 process Effects 0.000 claims description 6
- 238000012549 training Methods 0.000 claims description 6
- 230000005764 inhibitory process Effects 0.000 claims description 3
- 230000009466 transformation Effects 0.000 claims description 2
- 230000008859 change Effects 0.000 abstract description 4
- 238000005286 illumination Methods 0.000 abstract description 4
- 230000008447 perception Effects 0.000 abstract description 3
- 230000009286 beneficial effect Effects 0.000 abstract 1
- 238000005516 engineering process Methods 0.000 abstract 1
- 230000001603 reducing effect Effects 0.000 abstract 1
- 238000007726 management method Methods 0.000 description 20
- 230000004913 activation Effects 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 238000005562 fading Methods 0.000 description 2
- 238000003709 image segmentation Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000002411 adverse Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000013213 extrapolation Methods 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/56—Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
- G06V20/58—Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads
- G06V20/582—Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads of traffic signs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明提供了一种基于深度学习的公路交通标志自动识别与管理系统,用于智能汽车的环境感知技术领域。本发明系统包括交通标志采集模块、交通标志识别模块和交通标志管理模块。交通标志采集模块采集包含交通标志的视频,并为每帧图像匹配获取该图像时设备的经纬度。交通标志识别模块对输入的图像进行处理,对交通标志进行定位检测,获得含有交通标志的候选区域,对交通标志进行分类识别。交通标志管理模块传输交通标志与经纬度信息给交通管理部门,以判断交通标志的放置是否合理性并进行相应调整。本发明具有识别交通标志的种类多、精度高、实时性好等优势,降低了光照变化等因素对图像识别的影响,提高了抗干扰能力,识别准确率高,误识别率低。
Description
技术领域
本发明涉及智能汽车的环境感知技术领域和定位、通信技术领域,具体涉及一种基于深度学习的公路交通标志自动识别与管理系统,适用于汽车辅助驾驶系统和交通管理部门。
技术背景
随着社会的进步和经济的持续发展,我国的公路交通行业得到了持续、快速地发展,汽车的流通量也越来越大。如今,交通标志牌类型较多且地理位置上分布较为广泛,尤其是有些地方设置的交通标志牌会因为道路维修、扩建、改造或者新的房屋建设等原因需要作出相应调整。因此,交通管理部门定期根据实际路况等信息对交通标志牌的类型及其地理位置的合理性、科学性做调整和更新是非常必要的,这关乎人们的出行安全。
交通标志识别模块通常包含定位检测和分类识别两个方面。在交通标志的定位检测方面,图像分割可以定位出可能存在交通标志的区域。绝大部分学者均采用基于颜色的方法实现图像分割,适合于交通标志图像分割的颜色空间包括RGB空间、HSI空间等。但是,基于颜色的交通标志检测在强光照、昏暗和不利天气的情况下表现不佳。
在交通标志分类识别方面,道路交通标志识别模块是无人驾驶汽车环境感知的重要部分。交通标志具有特定的形状用以区分其他物体,有学者从交通标志特有的形状属性如长宽比、周长平方面积比、边的数目、质心到边缘的距离等来分类不同形状的交通标志。实际工作时,摄像机所摄取的图像中交通标志均发生了不同程度的投影失真,如正三角形变成一般形状三角形、圆形变成椭圆,加上交通标志可能被部分损坏,此方法分类正确率可能就会有所下降。有学者采用Gabor小波与支持向量机的交通标志识别方法,该方法对于光照条件不敏感,但是在交通标志出现旋转、尺度缩放等情况时识别率不佳。
在自然场景下,光照变化、颜色褪色、运动造成的模糊、复杂的背景、部分遮挡等因素,给交通标志的自动检测与识别带来了巨大挑战。采用模板匹配或者人工设计特征与SVM等分类器相结合,受光照、角度变化等影响较大。
因此,高效、准确的交通标志识别模块在智能交通系统中发挥着举足轻重的作用,而交通标志的检测与识别算法则是智能汽车环境感知部分的核心之一,决定了感知的性能,对于汽车安全驾驶以及无人驾驶汽车正确决策都有着很高的实用价值。
发明内容
本发明的目的是实现一种高效、准确的交通标志识别模块,将道路交通标志识别模块与经纬度信息相结合得到交通标志的精确标志含义和地理位置信息,以辅助汽车辅助驾驶系统和交通管理部门工作。
本发明提供了一种基于深度学习的公路交通标志自动识别与管理系统,包括交通标志采集模块、交通标志识别模块和交通标志管理模块。
所述的交通标志采集模块用于采集包含交通标志的视频,并为获取的每帧图像匹配上获取该图像时设备的经纬度。将获取的图像输入交通标志识别模块。
所述的交通标志识别模块对输入的图像进行处理,对交通标志进行定位检测,获得含有交通标志的候选区域,对交通标志进行分类识别。交通标志识别模块将识别出的交通标志与经纬度对应。
交通标志识别模块对交通标志进行定位检测的实现过程是:对输入图像进行卷积操作,将输出的特征图输入候选区域网络;所述的候选区域网络对输入的特征图采用3*3的滑动窗口得到一个256维的特征向量,将该特征向量输入到分类层和回归层。通过回归层输出候选框的坐标编码,通过分类层计算每个候选框是否是目标的概率,最后获得包含交通标志的候选区域。
交通标志识别模块对交通标志进行分类识别是将获得的候选区域输入到区域卷积神经网络,输出候选区域的类别及在图像中的位置。所述的区域卷积神经网络包括卷积层、双线性插值层、全连接层、分类器和回归器。首先通过卷积层获得候选区域的初始特征,再对初始特征采用双线性插值处理,获得大小为7*7的深度特征,将深度特征输入到全连接层中,获取最终特征向量。将最终特征向量分别输入到分类器与回归器中,利用非极大值抑制法来判断每一个候选区域的类别及其图像中的位置。
所述的交通标志管理模块用于传输交通标志与经纬度的信息给交通管理部门或汽车辅助驾驶系统,交通管理部门判断交通标志的放置是否合理性并进行相应调整。
本发明的优点和积极效果在于:
(1)本发明提供了一种基于深度学习的公路交通标志自动识别与管理系统,将交通标志识别模块的识别结果与对应的经纬度信息相结合提供给交通管理部门,方便交通管理部门能够结合现在的路况等信息更加合理、科学地进行统筹和规划交通标志牌的放置,能更加科学有效地控制车速、车流量等,进而避免交通拥堵、确保汽车的行驶安全。
(2)本发明为交通标志识别的研究提供新的角度和思路,与现有对交通标志的定位检测的研究角度不同,本发明使用候选区域网络对交通标志候选区域进行定位,在卷积特征图上进行滑动窗口操作,其维度与在原始图像上使用滑动窗口相比降低了16*16倍,降低了计算维度,并采用多尺度的候选框机制,对应了三种尺度和三种长宽比,适用性强。
(3)本发明的交通标志识别模块采用一种改进的区域卷积神经网络,对含有交通标志的图片候选区域用双线性插值、全连接和分类器以及包围盒回归器能够快速分类识别高分辨率图片中的交通标志。该区域卷积神经网络算法中采用的线性插值算法在对图像的缩放是对行列信号作两次处理,能保持图像连续性和连通性的光滑映射,不会出现像素不连续的现象,图像处理效果更佳,并且算法简单,运算量小易于实现。
(4)本发明具有识别交通标志的种类多、精度高、实时性好等优势,充分利用图像卷积的优势,降低了光照变化、颜色褪色、运动造成的模糊、复杂的背景、部分遮挡等因素对图像识别的影响,提高了抗干扰能力,识别准确率高,误识别率低。
附图说明
图1是本发明的公路交通标志自动识别与管理系统的模块工作示意图;
图2是本发明实施例获得的经纬度信息示意图;
图3是本发明实施例将视频信息与经纬度信息匹配的示意图;
图4是本发明中交通标志识别整体结构示意图;
图5是卷积网络配置表;
图6是双线性插值算法举例源图;
图7是图6所示源图中设立x、y坐标的示意图;
图8是双线性插值算法举例目标图;
图9是双线性插值算法坐标点示意图。
具体实施方式
下面结合附图和实施例对本发明的技术方案进行详细说明。
如图1所示,本发明的公路交通标志自动识别与管理系统包括三大模块:交通标志采集模块、交通标志识别模块和交通标志管理模块。其中,交通标志采集模块主要负责采集交通标志相关视频和经纬度信息的采集;交通标志识别模块主要负责使用基于深度学习的识别算法得到交通标志的识别结果;交通标志管理模块主要是交通管理部门利用识别的结果判断交通标志存在的合理性并做出相应调整。
模块一:交通标志采集模块。
本发明实施例中采用自主研发的基于Android系统的手机APP,该APP使用手机自带的摄像头进行录像操作并将视频文件保存下来。录像的同时,假定该手机录像的帧率为25帧/秒,该APP通过手机自带的GPS传感器每间隔0.04秒记录一次经纬度信息,最后将获得的所有经纬度信息以txt文件的形式保存到SD卡中,如图2所示。如图3所示,用此方法得到的视频中的每一帧图像与每一条经纬度信息为一一对应的关系。
交通标志采集模块将获取的每帧图像输入到交通标志识别模块中。
模块二:交通标志识别模块。
本发明的交通标志识别模块提出了一种基于候选区域网络和区域卷积神经网络的交通标志识别方法,整体实现架构如图4所示,包括以下几个步骤:
步骤一:交通标志定位检测阶段,获取含有交通标志的候选区域。
交通标志的定位检测阶段是整个交通标志识别的基础,本发明对输入图像进行卷积操作之后,采用候选区域网络提取候选区域完成交通标志的定位检测。
(1.1)采用候选区域网络提取含有交通标志的候选区域。
卷积操作过程使用的是如图5所示的网络结构中的13个卷积层,最终得到特征图。每组卷积层由多个卷积层组成,后面紧跟着最大值池化层。该网络使用了增加非线性ReLU(Rectified Linear Unit)激活,卷积层和全连接层的输出都经过ReLU的处理,这可以大大缩短了网络训练的时间。ReLu激活函数的公式为:
f(x)=max(0,x) (1)
x表示的是激活函数的输入值。
采用图5所示的卷积网络配置中,包括5组卷积层,前四组卷积层的输出都设置有一个最大值池化,前两组卷积层中都包含两个卷积层,后三组卷积层中都包含三个卷积层。输入的图像大小为224*224像素大小的RGB三通道图像。
然后,该特征图通过候选区域网络输出一系列被框选的、带有目标得分的候选目标。为了生成候选区域框,需要在最后一个共享的卷积层输出的卷积特征映射上滑动窗口。每个滑动窗口映射到一个低维向量上。映射得到的低维向量输出给两个同级的全连接的层:包围盒回归层和包围盒分类层。在特征映射层滑动小窗口建立一个小网络:分类:目标和非目标;回归:包围盒的位置。滑动窗口的位置提供了相对图片的定位信息。盒子的回归提供了相对滑动窗口的调整后的定位信息。
在每一个滑动窗口的位置,同时预测k个候选框,所以回归层有4k个输出,即k个候选框的坐标编码,也即k个候选框坐标偏移量。分类层通过对每个候选框是目标/非目标的概率估计输出相应的2k个得分,即给出了每个候选框包含目标的可能性大小。
(1.2)候选区域网络的损失函数。
为了训练候选区域网络,本发明给每个候选框分配一个二进制的标签(是目标、不是目标)。给两类候选框分配正标签,即是目标的标签:1)与某个真实区域包围盒有最大IoU值的候选框,IoU为真实区域和候选区域的交集面积与并集面积之比;2)与任意真实区域包围盒的IoU值大于0.7的候选框。为所有与真实区域包围盒的IoU值低于0.3的候选框分配负标签,即不是目标的标签。候选区域网络的损失函数C定义为:
其中,i是一次批量迭代中选取的候选框索引,pi为候选框i为目标的概率。如果候选框i是正标签,其对应的真实区域标签pi *为1,否则,pi *为0。ti表示预测区域的包围盒的4个参数化坐标向量,ti *是候选框i对应的真实区域包围盒的坐标向量。Ncls表示参与分类的样本个数,一般为256。Nreg表示参与回归的样本个数,一般为2400,λ为系数或者称为权重,取值范围为(0,1)。
Ccls()为分类损失函数,是针对两个类别(目标和非目标)的对数损失,表示如下:
Ccls(pi,pi *)=-log[pipi *+(1-pi)(1-pi *)] (3)
Creg()为回归损失函数,用Creg(ti,ti *)=S(ti-ti *)来计算,其中函数S(a)为:
此处的a为函数的输入。
对于回归,本发明采用4个坐标的参数:
tx=(x-xa)/wa ty=(y-ya)/ha
tw=log(w/wa) th=log(h/ha)
其中,表示某个候选框对应的真实区域包围盒的坐标向量。
t=[tx,ty,tw,th]T表示预测区域的包围盒的坐标向量。
x,y指的是预测区域的包围盒中心坐标,w,h分别是预测区域的包围盒的宽、高。
xa,ya是候选区域中心坐标,wa,ha分别是候选区域的宽、高。
x*,y*分别为真实区域包围盒中心坐标。w*,h*分别是真实区域包围盒的宽、高。
步骤二:交通标志分类识别阶段,对于已经提取出来的交通标志候选区域进行特征提取和分类识别。
(2.1)采用双线性插值算法替代区域卷积神经网络中的最大值池化,改变了网络结构。
线性插值是一阶的插值函数,它的基本思想是:把目标点附近的4个像素点的数据信息按一定的权值相加,其权值一般取为目标点和原始点之间的距离。采用线性插值算法在对图像的缩放是对行列信号作两次处理后得到的,所以也称这种方法常被为双线性插值。该算法能保持连续性和连通性的光滑映射,不会出现像素不连续的现象,图像处理效果更佳,并且算法简单,运算量小易于实现。
本发明使用双线性插值算法替代卷积神经网络中常用的最大值池化,双线性插值算法利用了需要处理的原始图像像素点周围的四个像素点的相关性,通过双线性算法计算得出目标图像中的像素值。该算法主要应用在图像的放大和缩小。其中,插值缩小技术是对原图像进行下采样处理,可以使图像用小的信息量涵盖原图像的重要信息。本发明改进后的双线性插值算法替代区域卷积神经网络中的最大值池化,改进后的区域卷积神经网络包括卷积层、双线性插值层、全连接层、分类器和回归器。
本发明中所指的图像都是点阵图,也就是用一个像素矩阵来描述图像的方法。
先举个简单的图像:4*4的256级灰度图,也就是高为4个象素,宽也是4个象素的图像,每个象素的取值可以是0-255,代表该像素的亮度:255代表最亮,也就是白色;0代表最暗,即黑色。假如图像的象素矩阵如图6所示,这个原始图叫做源图,Source:
这个矩阵中,元素坐标(i,j)是这样确定的,i从左到右,从0开始,j从上到下,从0开始,这是图像处理中最常用的坐标系,就是这样一个坐标,如图7所示。如果想把这幅图缩小为3*3大小的图像,需要进行下面步骤Step1~3。
Step1:先画出来3*3的矩阵,如图8所示,矩阵的每个像素都是未知数,等待填充,这个将要被填充的图的叫做目标图,Destination;
Step2:要往这个空的矩阵里面填值,要填的值从源图中来。先填写目标图最左上角的象素,坐标为(0,0),那么该坐标对应源图中的坐标可以由如下公式得出:
srcX=dstX*(srcWidth/dstWidth) (6)
srcY=dstY*(srcHeight/dstHeight) (7)
其中,srcX为源图的横轴坐标,srcY为源图的纵坐标,srcWidth为源图的宽,srcHeight为源图的高。dstX为目标图的横轴坐标,dstY为目标图的纵坐标,dstWidth为目标图的宽,dstHeight为目标图的高。
本例中找到对应的源图的坐标为(0*(4/3),0*(4/3))=(0*1.33,0*1.33)=(0,0),然后,就可以把源图中坐标为(0,0)处的234象素值填进去目标图的(0,0)这个位置了。类似地,寻找目标图中坐标为(1,0)的象素对应源图中的坐标,套用公式:(1*1.33,0*1.33)=(1.33,0),得到的坐标(1.33,0)里面有小数。
Step3:对于一个目标像素,设置坐标通过反向变换得到的浮点坐标为(i+u,j+v),其中i、j均为浮点坐标的整数部分,u、v为浮点坐标的小数部分,是取值[0,1)区间的浮点数,则这个像素的值f(i+u,j+v)可由源图像中坐标为(i,j),(i+1,j),(i,j+1),(i+1,j+1)所对应的周围四个像素的值决定,如图9所示,即:
f(i+u,j+v)=(1-u)(1-v)f(i,j)+(1-u)vf(i,j+1)+u(1-v)f(i+1,j)+uvf(i,j)(8)
其中,f(i+u,j+v)表示源图像(i+u,j+v)处的像素值,f(i,j)表示源图像(i,j)处的像素值,f(i,j+1)表示源图像(i,j+1)处的像素值,f(i+1,j+1)表示源图像(i+1,j+1)处的像素值。
假如目标图的象素坐标为(1,1),那么反推得到的对应于源图的坐标是(1.33,1.33),这其实只是一个概念上的虚拟象素,实际在源图中并不存在这样一个象素。那么目标图的象素(1,1)的取值不能够由这个虚拟象素来决定,而只能由源图的这四个象素共同决定:(1,1)(1,2)(2,1)(2,2),而由于(1.33,1.33)离(1,1)要更近一些,那么(1,1)所起的决定作用更大一些,这从公式中的系数0.67×0.67就可以体现出来,而(1.33,1.33)离(2,2)最远,所以(2,2)所起的决定作用就要小一些,公式中系数为0.33×0.33也体现出了这一特点。
(2.2)利用改进的区域卷积神经网络进行交通标志的识别。
在训练初期,将所有的带标注数据集输入到卷积层中,得到每一张图像的初始特征。带标注数据是指已经标记了交通标志类别的数据。随后将步骤一中得到的候选区域输入到卷积层,找到每个候选区域所对应的初始特征,对该初始特征采用双线性插值算法进行处理,得到一个大小为7*7的深度特征,并将每个候选区域的深度特征分别输入到区域卷积神经网络尾部的全连接层中,获取最终的特征向量。该特征向量就代表了图像上的每一个候选区域,最后将该特征向量分别输入到分类器与回归器中,利用非极大值抑制法来判断每一个候选区域的类别及其图像中的位置。随后,将得到的判断值与实际标注值进行对比,得到各个类别物体的损失函数,并利用反向传播算法以及梯度下降法对区域卷积神经网络结构进行优化,并得到最终优化后的网络。在测试时,将待测图像输入到区域卷积神经网络中,直接输出交通标志的类别并进行定位。
(2.3)区域卷积神经网络的损失函数。
区域卷积神经网络可以对输入区域输出k+1类目标(包含背景)的概率以及回归后的包围盒坐标。对于每一个训练候选区域定义损失函数为:
L(p,u,tu,t*)=Lcls(p,u)+[u≥1]Lloc(tu,t*) (9)
其中,Lcls(p,u)=-logpu是候选区域对应的真实目标类别u的对数损失。对于k+1类目标有p=(p0,p1…pk),pu表示类别为u的目标的概率,u为目标的真实类别。[u≥1]为示性函数,当候选区域为背景时u=0。Lloc(tu,t*)为包围盒坐标的回归损失, 其中函数S(a)的计算参见公式(4)。tu表示类别是u的预测目标对应的包围盒的坐标向量。
其中对于k类目标中的每一个目标都有t*为候选区域对应的真实目标包围盒的参数坐标向量。
(5)候选区域网络与区域卷积网络的整体训练,是采用一种端到端的整体训练方法。
模块三:交通标志管理模块。
本发明从模块二中得到了识别出的交通标志信息与其经纬度的对应关系,将交通标志信息与其经纬度结合后可以得到最新的、准确的交通标志本身信息以及其所在的地理位置,并将识别到含有交通标志图像对应的视频进行保存。
然后,交通管理部门可以根据保存好的含有交通标志的视频得到该交通标志所处位置周围的路况信息以及周围是否有学校、医院、商场、停车场等信息,进而科学地判断该交通标志在该位置存在的合理性,从而更加科学、合理地更新和调整交通标志。同时,通过该方法,交通管理部门可以将之前交通标志放置的备案信息进行更新。
Claims (5)
1.一种基于深度学习的公路交通标志自动识别与管理系统,其特征在于,包括交通标志采集模块、交通标志识别模块和交通标志管理模块;
所述的交通标志采集模块用于采集包含交通标志的视频,并为获取的每帧图像匹配上获取该图像时设备的经纬度;将获取的图像输入交通标志识别模块;所述的交通标志识别模块对输入的图像进行处理,对交通标志进行定位检测,获得含有交通标志的候选区域,并对交通标志进行分类识别;交通标志识别模块将识别出的交通标志与经纬度对应;
其中,交通标志识别模块对交通标志进行定位检测的实现过程是:对输入图像进行卷积操作,将输出的特征图输入候选区域网络;所述的候选区域网络对输入的特征图采用3*3的滑动窗口得到一个256维的特征向量,将该特征向量输入到分类层和回归层;通过回归层输出候选框的坐标编码,通过分类层计算每个候选框是否是目标的概率,最后获得包含交通标志的候选区域;
交通标志识别模块对交通标志进行分类识别是将获得的候选区域输入到区域卷积神经网络,输出候选区域的类别及在图像中的位置;所述的区域卷积神经网络中采用双线性插值代替最大值池化,区域卷积神经网络包括卷积层、双线性插值层、全连接层、分类器和回归器;首先通过卷积层获得候选区域的初始特征,再对初始特征采用双线性插值处理,获得大小为7*7的深度特征,将深度特征输入到全连接层中,获取最终特征向量;将最终特征向量分别输入到分类器与回归器中,利用非极大值抑制法来判断每一个候选区域的类别及其图像中的位置;
所述的交通标志管理模块用于传输交通标志与经纬度的信息给交通管理部门或汽车辅助驾驶系统,交通管理部门判断交通标志的放置是否合理性并进行调整。
2.根据权利要求1所述的一种基于深度学习的公路交通标志自动识别与管理系统,其特征在于,所述的交通标志采集模块采用手机APP实现,该APP控制手机摄像头采集视频,根据手机自身GPS定时获取经纬度,将获得的所有经纬度以txt文件的形式保存到SD卡中,将视频中的每一帧图像与每一条经纬度一一对应。
3.根据权利要求1所述的一种基于深度学习的公路交通标志自动识别与管理系统,其特征在于,所述的交通标志识别模块的候选区域网络,在训练时,给每个候选框分配一个二进制的标签(是目标、不是目标);给两类候选框分配正标签—是目标:1)与某个真实区域包围盒有最大IoU值的候选框,IoU为真实区域和候选区域的交集面积与并集面积之比;2)与任意真实区域包围盒的IoU值大于0.7的候选框;为所有与真实区域包围盒的IoU值低于0.3的候选框分配负标签—不是目标。
4.根据权利要求1或3所述的一种基于深度学习的公路交通标志自动识别与管理系统,其特征在于,所述的交通标志识别模块训练候选区域网络时,定义候选区域网络的损失函数C为:
其中,i是一次批量迭代中选取的候选框索引;pi为候选框i为目标的概率,如果候选框i是正标签,对应的真实区域标签pi *为1,否则,pi *为0;ti表示预测区域的包围盒的4个参数化坐标向量,ti *是对应的真实区域包围盒的坐标向量;Ncls表示参与分类的样本个数,取值256;Nreg表示参与回归的样本个数,取值2400;λ表示权重,取值在0-1之间;
Ccls()为分类损失函数,是针对两个类别——目标和非目标的对数损失,表示如下:
Ccls(pi,pi *)=-log[pipi *+(1-pi)(1-pi *)]
Creg()为回归损失函数,用Creg(ti,ti *)=S(ti-ti *)来计算,其中函数S(a)为:
其中a为输入。
5.根据权利要求1所述的一种基于深度学习的公路交通标志自动识别与管理系统,其特征在于,所述的交通标志识别模块中,对初始特征采用双线性插值处理时,设定初始特征的矩阵中元素坐标(i,j),i从左到右,从0开始,j从上到下,从0开始;
对于一个目标像素,设置坐标通过反向变换得到的浮点坐标为(i+u,j+v),其中i、j均为浮点坐标的整数部分,u、v为浮点坐标的小数部分,是取值[0,1)区间的浮点数,则目标像素的值f(i+u,j+v)由源图像中坐标为(i,j),(i+1,j),(i,j+1),(i+1,j+1)所对应的四个像素的值决定,表示如下:
f(i+u,j+v)=(1-u)(1-v)f(i,j)+(1-u)vf(i,j+1)+u(1-v)f(i+1,j)+uvf(i,j)
其中,f(i+u,j+v)表示源图像(i+u,j+v)处的像素值,f(i,j)表示源图像(i,j)处的像素值,f(i,j+1)表示源图像(i,j+1)处的像素值,f(i+1,j+1)表示源图像(i+1,j+1)处的像素值;此处的源图像是指初始特征的矩阵。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610709259.2A CN106326858A (zh) | 2016-08-23 | 2016-08-23 | 一种基于深度学习的公路交通标志自动识别与管理系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610709259.2A CN106326858A (zh) | 2016-08-23 | 2016-08-23 | 一种基于深度学习的公路交通标志自动识别与管理系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106326858A true CN106326858A (zh) | 2017-01-11 |
Family
ID=57742032
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610709259.2A Pending CN106326858A (zh) | 2016-08-23 | 2016-08-23 | 一种基于深度学习的公路交通标志自动识别与管理系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106326858A (zh) |
Cited By (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106886755A (zh) * | 2017-01-19 | 2017-06-23 | 北京航空航天大学 | 一种基于交通标志识别的交叉口车辆违章检测系统 |
CN106909886A (zh) * | 2017-01-20 | 2017-06-30 | 中国石油大学(华东) | 一种基于深度学习的高精度交通标志检测方法及系统 |
CN106919939A (zh) * | 2017-03-14 | 2017-07-04 | 潍坊学院 | 一种交通标识牌跟踪识别方法及系统 |
CN106934374A (zh) * | 2017-03-14 | 2017-07-07 | 潍坊学院 | 一种雾霾场景中交通标识牌的识别方法及系统 |
CN106980855A (zh) * | 2017-04-01 | 2017-07-25 | 公安部交通管理科学研究所 | 交通标志快速识别定位系统及方法 |
CN107038420A (zh) * | 2017-04-14 | 2017-08-11 | 北京航空航天大学 | 一种基于卷积网络的交通信号灯识别算法 |
CN107133616A (zh) * | 2017-04-02 | 2017-09-05 | 南京汇川图像视觉技术有限公司 | 一种基于深度学习的无分割字符定位与识别方法 |
CN107316001A (zh) * | 2017-05-31 | 2017-11-03 | 天津大学 | 一种自动驾驶场景中小且密集的交通标志检测方法 |
CN107368845A (zh) * | 2017-06-15 | 2017-11-21 | 华南理工大学 | 一种基于优化候选区域的Faster R‑CNN目标检测方法 |
CN107665355A (zh) * | 2017-09-27 | 2018-02-06 | 重庆邮电大学 | 一种基于区域卷积神经网络的农业害虫检测方法 |
CN108520212A (zh) * | 2018-03-27 | 2018-09-11 | 东华大学 | 基于改进的卷积神经网络的交通标志检测方法 |
CN108734225A (zh) * | 2018-06-08 | 2018-11-02 | 浙江大学 | 一种基于深度学习的输电线路施工物体图像检测方法 |
CN109002764A (zh) * | 2018-06-19 | 2018-12-14 | 长安大学 | 一种交通标志图像识别模型构建及识别方法 |
CN109325438A (zh) * | 2018-09-18 | 2019-02-12 | 桂林电子科技大学 | 实况全景交通标志的实时识别方法 |
CN109446973A (zh) * | 2018-10-24 | 2019-03-08 | 中车株洲电力机车研究所有限公司 | 一种基于深度神经网络图像识别的车辆定位方法 |
CN109635821A (zh) * | 2018-12-04 | 2019-04-16 | 北京字节跳动网络技术有限公司 | 图像区域的特征提取方法、装置、设备及可读介质 |
CN109782364A (zh) * | 2018-12-26 | 2019-05-21 | 中设设计集团股份有限公司 | 基于机器视觉的交通标志牌缺失检测方法 |
CN109829401A (zh) * | 2019-01-21 | 2019-05-31 | 深圳市能信安科技股份有限公司 | 基于双拍摄设备的交通标志识别方法及装置 |
CN109886338A (zh) * | 2019-02-25 | 2019-06-14 | 苏州清研精准汽车科技有限公司 | 一种智能汽车测试图像标注方法、装置、系统及存储介质 |
CN110135387A (zh) * | 2019-05-24 | 2019-08-16 | 李子月 | 一种基于传感器融合的图像快速识别方法 |
CN110324664A (zh) * | 2019-07-11 | 2019-10-11 | 南开大学 | 一种基于神经网络的视频补帧方法及其模型的训练方法 |
CN110501018A (zh) * | 2019-08-13 | 2019-11-26 | 广东星舆科技有限公司 | 一种服务于高精度地图生产的交通标志牌信息采集方法 |
CN110633717A (zh) * | 2018-06-21 | 2019-12-31 | 北京京东尚科信息技术有限公司 | 一种目标检测模型的训练方法和装置 |
CN110633595A (zh) * | 2018-06-21 | 2019-12-31 | 北京京东尚科信息技术有限公司 | 一种利用双线性插值的目标检测方法和装置 |
CN110738225A (zh) * | 2018-07-19 | 2020-01-31 | 杭州海康威视数字技术股份有限公司 | 图像识别方法及装置 |
CN110807430A (zh) * | 2019-11-06 | 2020-02-18 | 桂林电子科技大学 | 一种实况全景交通标志图片预处理方法 |
CN111783639A (zh) * | 2020-06-30 | 2020-10-16 | 北京百度网讯科技有限公司 | 图像检测方法、装置、电子设备及可读存储介质 |
CN111775944A (zh) * | 2019-04-04 | 2020-10-16 | 富泰华工业(深圳)有限公司 | 辅助驾驶装置、方法及计算机可读存储介质 |
CN111832388A (zh) * | 2020-05-22 | 2020-10-27 | 南京邮电大学 | 一种车辆行驶中交通标志检测与识别方法及系统 |
CN112699834A (zh) * | 2021-01-12 | 2021-04-23 | 腾讯科技(深圳)有限公司 | 交通标识检测方法、装置、计算机设备和存储介质 |
CN112784084A (zh) * | 2019-11-08 | 2021-05-11 | 阿里巴巴集团控股有限公司 | 一种图像处理方法、装置以及电子设备 |
CN112989098A (zh) * | 2021-05-08 | 2021-06-18 | 北京智源人工智能研究院 | 一种图像类侵权实体自动化检索方法、装置和电子设备 |
CN113286272A (zh) * | 2021-05-25 | 2021-08-20 | 郑州信大捷安信息技术股份有限公司 | 一种基于车联网的车辆安全驾驶方法和系统 |
TWI795447B (zh) * | 2017-10-06 | 2023-03-11 | 美商高通公司 | 基於關注提議進行視訊動作定位 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN201269758Y (zh) * | 2008-09-22 | 2009-07-08 | 交通部公路科学研究所 | 一种交通标志车载全自动检测记录系统 |
-
2016
- 2016-08-23 CN CN201610709259.2A patent/CN106326858A/zh active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN201269758Y (zh) * | 2008-09-22 | 2009-07-08 | 交通部公路科学研究所 | 一种交通标志车载全自动检测记录系统 |
Non-Patent Citations (7)
Title |
---|
F0K: "ROIPooling layer in fast and faster R-CNN", 《GITHUB开源软件托管平台:HTTPS://GITHUB.COM/LASAGNE/LASAGNE/ISSUES/565》 * |
KAREN SIMONYAN等: "VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION", 《INTERNATIONAL CONFERENCE ON LEARNING REPRESENTATION(ICLR)》 * |
MATTHEW D. ZEILER等: "Visualizing and Understanding Convolutional Networks", 《EUROPEAN CONFERENCE ON COMPUTER VISION (ECCV)》 * |
ROSS GIRSHICK: "Fast R-CNN", 《2015 IEEE INTERNATIONAL CONFERENCE ON COMPUTER VISION》 * |
ROSS GIRSHICK等: "Rich feature hierarchies for accurate object detection and semantic segmentation", 《2014 IEEE CONFERENCE ON COMPUTER VISION》 * |
SHAOQING REN等: "Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks", 《ARXIV》 * |
殷瑞: "一种卷积神经网络的图像矩正则化策略", 《智能系统学报》 * |
Cited By (46)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106886755A (zh) * | 2017-01-19 | 2017-06-23 | 北京航空航天大学 | 一种基于交通标志识别的交叉口车辆违章检测系统 |
CN106909886A (zh) * | 2017-01-20 | 2017-06-30 | 中国石油大学(华东) | 一种基于深度学习的高精度交通标志检测方法及系统 |
CN106909886B (zh) * | 2017-01-20 | 2019-05-03 | 中国石油大学(华东) | 一种基于深度学习的高精度交通标志检测方法及系统 |
CN106919939A (zh) * | 2017-03-14 | 2017-07-04 | 潍坊学院 | 一种交通标识牌跟踪识别方法及系统 |
CN106934374A (zh) * | 2017-03-14 | 2017-07-07 | 潍坊学院 | 一种雾霾场景中交通标识牌的识别方法及系统 |
CN106919939B (zh) * | 2017-03-14 | 2019-11-22 | 潍坊学院 | 一种交通标识牌跟踪识别方法及系统 |
CN106934374B (zh) * | 2017-03-14 | 2020-05-26 | 潍坊学院 | 一种雾霾场景中交通标识牌的识别方法及系统 |
CN106980855A (zh) * | 2017-04-01 | 2017-07-25 | 公安部交通管理科学研究所 | 交通标志快速识别定位系统及方法 |
CN107133616A (zh) * | 2017-04-02 | 2017-09-05 | 南京汇川图像视觉技术有限公司 | 一种基于深度学习的无分割字符定位与识别方法 |
CN107038420A (zh) * | 2017-04-14 | 2017-08-11 | 北京航空航天大学 | 一种基于卷积网络的交通信号灯识别算法 |
CN107316001A (zh) * | 2017-05-31 | 2017-11-03 | 天津大学 | 一种自动驾驶场景中小且密集的交通标志检测方法 |
CN107368845A (zh) * | 2017-06-15 | 2017-11-21 | 华南理工大学 | 一种基于优化候选区域的Faster R‑CNN目标检测方法 |
CN107665355A (zh) * | 2017-09-27 | 2018-02-06 | 重庆邮电大学 | 一种基于区域卷积神经网络的农业害虫检测方法 |
TWI795447B (zh) * | 2017-10-06 | 2023-03-11 | 美商高通公司 | 基於關注提議進行視訊動作定位 |
CN108520212A (zh) * | 2018-03-27 | 2018-09-11 | 东华大学 | 基于改进的卷积神经网络的交通标志检测方法 |
CN108734225A (zh) * | 2018-06-08 | 2018-11-02 | 浙江大学 | 一种基于深度学习的输电线路施工物体图像检测方法 |
CN109002764B (zh) * | 2018-06-19 | 2021-05-11 | 长安大学 | 一种交通标志图像识别模型构建及识别方法 |
CN109002764A (zh) * | 2018-06-19 | 2018-12-14 | 长安大学 | 一种交通标志图像识别模型构建及识别方法 |
CN110633717A (zh) * | 2018-06-21 | 2019-12-31 | 北京京东尚科信息技术有限公司 | 一种目标检测模型的训练方法和装置 |
CN110633595B (zh) * | 2018-06-21 | 2022-12-02 | 北京京东尚科信息技术有限公司 | 一种利用双线性插值的目标检测方法和装置 |
CN110633595A (zh) * | 2018-06-21 | 2019-12-31 | 北京京东尚科信息技术有限公司 | 一种利用双线性插值的目标检测方法和装置 |
CN110738225A (zh) * | 2018-07-19 | 2020-01-31 | 杭州海康威视数字技术股份有限公司 | 图像识别方法及装置 |
CN109325438A (zh) * | 2018-09-18 | 2019-02-12 | 桂林电子科技大学 | 实况全景交通标志的实时识别方法 |
CN109325438B (zh) * | 2018-09-18 | 2021-06-15 | 桂林电子科技大学 | 实况全景交通标志的实时识别方法 |
CN109446973A (zh) * | 2018-10-24 | 2019-03-08 | 中车株洲电力机车研究所有限公司 | 一种基于深度神经网络图像识别的车辆定位方法 |
CN109635821A (zh) * | 2018-12-04 | 2019-04-16 | 北京字节跳动网络技术有限公司 | 图像区域的特征提取方法、装置、设备及可读介质 |
CN109782364A (zh) * | 2018-12-26 | 2019-05-21 | 中设设计集团股份有限公司 | 基于机器视觉的交通标志牌缺失检测方法 |
CN109829401A (zh) * | 2019-01-21 | 2019-05-31 | 深圳市能信安科技股份有限公司 | 基于双拍摄设备的交通标志识别方法及装置 |
CN109886338A (zh) * | 2019-02-25 | 2019-06-14 | 苏州清研精准汽车科技有限公司 | 一种智能汽车测试图像标注方法、装置、系统及存储介质 |
CN111775944A (zh) * | 2019-04-04 | 2020-10-16 | 富泰华工业(深圳)有限公司 | 辅助驾驶装置、方法及计算机可读存储介质 |
CN110135387A (zh) * | 2019-05-24 | 2019-08-16 | 李子月 | 一种基于传感器融合的图像快速识别方法 |
CN110324664A (zh) * | 2019-07-11 | 2019-10-11 | 南开大学 | 一种基于神经网络的视频补帧方法及其模型的训练方法 |
CN110324664B (zh) * | 2019-07-11 | 2021-06-04 | 南开大学 | 一种基于神经网络的视频补帧方法及其模型的训练方法 |
CN110501018A (zh) * | 2019-08-13 | 2019-11-26 | 广东星舆科技有限公司 | 一种服务于高精度地图生产的交通标志牌信息采集方法 |
CN110501018B (zh) * | 2019-08-13 | 2021-11-02 | 广东星舆科技有限公司 | 一种服务于高精度地图生产的交通标志牌信息采集方法 |
CN110807430B (zh) * | 2019-11-06 | 2022-06-21 | 桂林电子科技大学 | 一种实况全景交通标志图片预处理方法 |
CN110807430A (zh) * | 2019-11-06 | 2020-02-18 | 桂林电子科技大学 | 一种实况全景交通标志图片预处理方法 |
CN112784084A (zh) * | 2019-11-08 | 2021-05-11 | 阿里巴巴集团控股有限公司 | 一种图像处理方法、装置以及电子设备 |
CN112784084B (zh) * | 2019-11-08 | 2024-01-26 | 阿里巴巴集团控股有限公司 | 一种图像处理方法、装置以及电子设备 |
CN111832388A (zh) * | 2020-05-22 | 2020-10-27 | 南京邮电大学 | 一种车辆行驶中交通标志检测与识别方法及系统 |
CN111832388B (zh) * | 2020-05-22 | 2022-07-26 | 南京邮电大学 | 一种车辆行驶中交通标志检测与识别方法及系统 |
CN111783639A (zh) * | 2020-06-30 | 2020-10-16 | 北京百度网讯科技有限公司 | 图像检测方法、装置、电子设备及可读存储介质 |
CN112699834A (zh) * | 2021-01-12 | 2021-04-23 | 腾讯科技(深圳)有限公司 | 交通标识检测方法、装置、计算机设备和存储介质 |
CN112989098A (zh) * | 2021-05-08 | 2021-06-18 | 北京智源人工智能研究院 | 一种图像类侵权实体自动化检索方法、装置和电子设备 |
CN113286272A (zh) * | 2021-05-25 | 2021-08-20 | 郑州信大捷安信息技术股份有限公司 | 一种基于车联网的车辆安全驾驶方法和系统 |
CN113286272B (zh) * | 2021-05-25 | 2022-03-15 | 郑州信大捷安信息技术股份有限公司 | 一种基于车联网的车辆安全驾驶方法和系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106326858A (zh) | 一种基于深度学习的公路交通标志自动识别与管理系统 | |
CN107729801B (zh) | 一种基于多任务深度卷积神经网络的车辆颜色识别系统 | |
CN111814623A (zh) | 一种基于深度神经网络的车辆车道偏离视觉检测方法 | |
CN106228125B (zh) | 基于集成学习级联分类器的车道线检测方法 | |
CN112101175A (zh) | 基于局部图像的高速公路车辆检测及多属性特征提取方法 | |
CN103049763B (zh) | 一种基于上下文约束的目标识别方法 | |
WO2021218786A1 (zh) | 一种数据处理系统、物体检测方法及其装置 | |
CN106372577A (zh) | 一种基于深度学习的交通标志自动识别与标注方法 | |
CN111553201A (zh) | 一种基于YOLOv3优化算法的交通灯检测方法 | |
CN113158768B (zh) | 基于ResNeSt和自注意力蒸馏的智能车辆车道线检测方法 | |
CN111274980B (zh) | 基于yolov3和非对称卷积的小尺寸交通标志识别方法 | |
Zhang et al. | Study on traffic sign recognition by optimized Lenet-5 algorithm | |
CN105354568A (zh) | 基于卷积神经网络的车标识别方法 | |
CN113888754B (zh) | 一种基于雷达视觉融合的车辆多属性识别方法 | |
CN109886086B (zh) | 基于hog特征和线性svm级联分类器的行人检测方法 | |
CN111582339A (zh) | 一种基于深度学习的车辆检测与识别的方法 | |
CN111666988A (zh) | 一种基于多层信息融合的目标检测算法 | |
CN112488083A (zh) | 基于heatmap提取关键点的交通信号灯的识别方法、装置、介质 | |
CN110909656B (zh) | 一种雷达与摄像机融合的行人检测方法和系统 | |
CN115909245A (zh) | 一种基于深度学习的视觉多任务处理方法 | |
CN111666953B (zh) | 一种基于语义分割的潮汐带测绘方法及设备 | |
CN111476226B (zh) | 一种文本定位方法、装置及模型训练方法 | |
CN117612136A (zh) | 一种基于增量小样本学习的自动驾驶目标检测方法 | |
CN111797795A (zh) | 一种基于YOLOv3与SSR的行人检测算法 | |
CN112053407A (zh) | 一种交通执法影像中基于ai技术的车道线自动检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170111 |
|
RJ01 | Rejection of invention patent application after publication |