CN110033002B - 基于多任务级联卷积神经网络的车牌检测方法 - Google Patents

基于多任务级联卷积神经网络的车牌检测方法 Download PDF

Info

Publication number
CN110033002B
CN110033002B CN201910316667.5A CN201910316667A CN110033002B CN 110033002 B CN110033002 B CN 110033002B CN 201910316667 A CN201910316667 A CN 201910316667A CN 110033002 B CN110033002 B CN 110033002B
Authority
CN
China
Prior art keywords
license plate
layer
neural network
convolutional
loss function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910316667.5A
Other languages
English (en)
Other versions
CN110033002A (zh
Inventor
郭文忠
丁宁
柯逍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fuzhou University
Original Assignee
Fuzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuzhou University filed Critical Fuzhou University
Priority to CN201910316667.5A priority Critical patent/CN110033002B/zh
Publication of CN110033002A publication Critical patent/CN110033002A/zh
Application granted granted Critical
Publication of CN110033002B publication Critical patent/CN110033002B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/625License plates
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种基于多任务级联卷积神经网络的车牌检测方法。针对传统的车牌检测方法可扩展性差,泛化能力差,车牌检测效果不佳造成的车牌识别率下降等问题提出了一种多任务级联卷积神经网络的车牌检测方法。为了获得复杂图像中车牌精确定位,该方法通过搭建一种新的多任务级联卷积神经网络模型再CCPD车辆数据上进行大规模训练,其中本发明的网络模型的卷积层采用和BN层相结合的方法来提高对车牌的特征提取能力,加快模型训练速度,使用Relu激活函数增加模型的非线性能力,采用多任务损失函数来提高网络对车牌的分类和回归框准确性,并且回归反馈出车牌的四个关键点信息。最后将训练好的模型应用于车牌检测中。该方法简单灵活,具有较强的实际应用性。

Description

基于多任务级联卷积神经网络的车牌检测方法
技术领域
本发明涉及涉及模式识别与计算机视觉领域,具体涉及一种基于多任务级联卷积神经网络的车牌检测方法。
背景技术
随着公共交通系统的快速发展,智能技术再许多应用中发挥着越来越重要的作用。其中,最为突出的要数视频监控、模式识别、图像处理和自动检测技术,这些技术也越来越受到人们的关注。在我们生活周围,汽车随处可见,已经大众普遍化,成为人们最重要的出行工具。众所周知,每辆汽车都配有唯一的“身份”证件,也就是所谓的车辆的车牌信息。在高效的进行车牌管理中,自动收集并自动识别大量车牌信息是极其关键的环节。因此建立车牌信息的识别和处理系统,已经成为现代社会迫不及待的需求。
传统的车牌检测方法主要有基于边缘的检测方法、基于颜色的检测方法、基于纹理的检测方法、基于字符的检测方法,其中基于边缘的检测方法对复杂场景下的类似边缘较为敏感,检测车牌率低;基于颜色的检测方法会受到光照强度方面的影响;基于纹理的检测方法由于时间复杂度较高,无法满足车牌检测的实时性;基于字符的方法由于复杂场景可能存在其他字符而检测有误。此外上述的方法很难满足大数据量的车牌检测需求,因此所取得的检测效果不令人满意,有待进一步提高。
发明内容
有鉴于此,本发明的目的在于提供一种基于多任务级联卷积神经网络的车牌检测方法,解决针对基于复杂场景下全球眼视频监控道路中车牌检测定位的问题。
为实现上述目的,本发明采用如下技术方案:
一种基于多任务级联卷积神经网络的车牌检测方法,包括以下步骤:
步骤S1:采集车辆图像和车牌图像数据,并预处理;
步骤S2:构建多任务级联卷积神经网络模型;
步骤S3:使用预处理的车辆图像数据对多任务级联卷积神经网络前两级网络进行预训练,使用预处理的车牌图像数据对多任务级联卷积神经网络后一级玩过进行预训练,得到训练好的完整的多任务卷积神经网络模型;
步骤S4:对待检测原始图像数据进行resize到不同尺度,构造待检测图像金字塔;
步骤S5:将待检测图像金字塔输入到训练好的多任务级联卷积神经网络模型进行车牌检测。
进一步的,所述车辆图像和车牌图像数据采集基于CCPD车辆数据库。
进一步的,所述步骤S2具体为:构建由三个网络构成多任务级联卷积神经网络模型,包括第一卷积神经网络P-net、第二卷积神经网络R-net、第三卷积神经网络O-net。
进一步的,所述的第一卷积神经网络P-net,包括:四个卷积层、一个次采样层、一个softmax回归层,其中构成顺序为:卷积层conv1-次采样层mp1-卷积层conv2-卷积层conv3-卷积层conv4-回归层softmax;其中卷积层采用结合 BN层的卷积层来优化网络收敛速度,激励函数使用的Relu激励函数来增加非线性,并对噪声信号和信息信号进行了有效的分离,损失函数采用多任务损失函数结合,由两部分组成,其中车牌分类损失函数采用交叉熵损失函数,车牌预测框回归损失函数采用平方损失函数;
所述第二卷积神经网络R-net,包括:三个卷积层、二个次采样层、二个全连接层、一个softmax回归层。其中构成顺序为:卷积层conv1-次采样层poo1- 卷积层conv2-次采样层pool2-卷积层conv3-全连接层conv4-全连接层conv5- 回归层softmax;其中卷积层采用结合BN层的卷积层来优化网络收敛速度,激励函数使用的Relu激励函数来增加非线性,并对噪声信号和信息信号进行了有效的分离,损失函数采用多任务损失函数结合,由两部分组成,其中车牌分类损失函数采用交叉熵损失函数,车牌预测框回归损失函数采用平方损失函数;
所述第三卷积神经网络O-net,包括:四个卷积层、三个次采样层、二个全连接层、一个softmax回归层;其中构成顺序为:卷积层conv1-次采样层poo1- 卷积层conv2-次采样层pool2-卷积层conv3-次采样层pool3-卷积层conv4-全连接层conv5-全连接层conv6-回归层softmax。其中卷积层采用结合BN层的卷积层来优化网络收敛速度,激励函数使用的Relu激励函数来增加非线性,并对噪声信号和信息信号进行了有效的分离,损失函数采用多任务损失函数结合,由三部分组成,其中车牌分类损失函数采用交叉熵损失函数,车牌预测框回归损失函数采用平方损失函数,车牌关键点回归损失函数采用平方损失函数。
进一步的,所述多任务损失函数具体为:
车牌分类损失函数公式为:
Figure RE-GDA0002065264370000031
其中车牌分类损失函数
Figure RE-GDA0002065264370000032
为交叉熵损失函数,pi为是车牌的概率,
Figure RE-GDA0002065264370000033
为非车牌的背景标签;
车牌预测框回归损失函数公式为:
Figure RE-GDA0002065264370000034
其中车牌预测框回归损失函数
Figure RE-GDA0002065264370000035
是计算网络预测的回归框坐标和实际真实回归框坐标的欧式距离,
Figure RE-GDA0002065264370000036
为通过卷积神经网络预测得到的回归框坐标,y为实际真实的回归框坐标。y值代表(x,y,w,h),其中x,y为框左上角的坐标值
车牌关键点定位损失函数为:
Figure RE-GDA0002065264370000037
其中关键点定位损失函数
Figure RE-GDA0002065264370000038
是计算网络预测的角点坐标和实际真实角点坐标的欧式距离,
Figure RE-GDA0002065264370000039
为通过卷积神经网络预测得到的角点坐标,y为实际真实的角点坐标,由于车牌角点坐标一共4个点,每个点2个坐标,故y属于八元组;
多任务损失函数由以上三部分构成,整个损失函数公式为:
Figure RE-GDA00020652643700000310
其中αi为任务的重要程度,
Figure RE-GDA00020652643700000311
为{0,1}的指示器(idicator)。其中多任务第一神经网络P-net的αj值分别为αdet=1,αbox=0.5,αlandmark=0.3,第二多任务卷积神经网络R-net的αj值分别为αdet=1,αbox=0.5,αlandmark=0.5,,第三多任务卷积神经网络O-net的αj值分别为αdet=1,αbox=0.5,αlandmark=1。
进一步的,所述步骤S3具体为:
步骤S31:对多任务级联卷积神经网络模型进行前向训练,包括采用自下而上的无监督学习方式进行前向训练;通过卷积层操作,对预处理过得车辆和车牌数据进行特征提取,其公式为:
Figure RE-GDA0002065264370000041
所述K(i+1)为第i层与第i+1层神经元之间的卷积核;所述
Figure RE-GDA0002065264370000042
为卷积运算符, b(i)为第i层与第i+1层神经元之间的偏置值;所述f(-)为ReLu激活函数,公式为:f(x)=max(0,x),所述x为该函数的自变量;
步骤S32:通过BN层将前卷积层输出的I(i)进行标准化处理,公式为:
Figure RE-GDA0002065264370000043
Figure RE-GDA0002065264370000044
Figure RE-GDA0002065264370000045
Figure RE-GDA0002065264370000046
其中m为单个mini-batch包含样本个数,ε是为了防止分母取值为零,可以取10-6,μB为对前卷积层的输入进行均值运算,
Figure RE-GDA0002065264370000047
为对前卷积层的输入进行方差运算,
Figure RE-GDA0002065264370000048
是通过进行标准化运算,γ,δ是可学习参数,作用是为了让
Figure RE-GDA0002065264370000049
的方差和均值为任意值;
步骤S33:次采样层操作,采用最大池化层的方式来进行下采样操作,公式为:
Figure RE-GDA00020652643700000410
其中fi为该层输入划分区域的像素值,Ak为次采样层I(i)的输入划分为区域其中k∈(1,n);
步骤S34:采用自顶向下的有监督学习方式进行反向调优,通过调优之后,使得卷积神经网络模型中的每一层隐层的网络权重值都能够达到最优值;卷积层的梯度计算,公式为:
Figure RE-GDA0002065264370000051
Figure RE-GDA0002065264370000052
其中L为代价函数(即损失函数),δ表示经过一次上采样后得到的特征图,
Figure RE-GDA0002065264370000053
项为
Figure RE-GDA0002065264370000054
在卷积时与
Figure RE-GDA0002065264370000055
相乘后得到的一块区域,u,v表示特征图中的像坐标,并通过以上梯度计算来更新各卷积层权值。
进一步的,所述步骤S5具体为:
步骤S51:将待检测图像金字塔输入到多任务级联卷积神经网络模型P-net 网络中,获取候选车牌窗口和边界框回归向量,用边界框回归向量校准候选车牌窗口,之后采用非极大值抑制合并候选车牌窗口,排除非感兴趣的背景图像;
步骤S52:将多任务级联卷积神经网络模型P-net网络输出的候选车牌窗口输入到训练好的多任务级联卷积神经网络模型R-net网络;对候选车牌图像进行精确的提取,过滤错误候选车牌窗口,用边界框回归校准候选车牌窗口,之后再采用非极大值抑制合并候选车牌窗口,排除不存在车牌区域的图像;
步骤S53:将多任务级联卷积神经网络模型R-net网络输出的候选车牌窗口输入到训练好的多任务级联卷积神经网络模型O-net网络,对候选车牌图像进行进一步精准提取,并标记出车牌图像中的四个关键点信息。
本发明与现有技术相比具有以下有益效果:
本发明卷积层采用和BN层相结合的方法来提高对车牌的特征提取能力,加快模型训练速度,使用Relu激活函数增加模型的非线性能力,采用多任务损失函数来提高网络对车牌的分类和回归框准确性,并且回归反馈出车牌的四个关键点信息。
附图说明
图1为本发明的方法流程图;
图2为本发明一实施例中多任务卷积神经网络P-net的结构图;
图3为本发明一实施例中多任务卷积神经网络R-net的结构图;
图4为本发明一实施例中多任务卷积神经网络O-net的结构图。
具体实施方式
下面结合附图及实施例对本发明做进一步说明。
请参照图1,本发明提供一种基于多任务级联卷积神经网络的车牌检测方法,包括以下步骤:
步骤S1:基于CCPD车辆数据库,采集车辆图像和车牌图像数据,并预处理;
步骤S2:构建由三个网络构成多任务级联卷积神经网络模型,包括第一卷积神经网络P-net、第二卷积神经网络R-net、第三卷积神经网络O-net。
所述的第一卷积神经网络P-net,包括:四个卷积层、一个次采样层、一个 softmax回归层,其中构成顺序为:卷积层conv1-次采样层mp1-卷积层conv2- 卷积层conv3-卷积层conv4-回归层softmax;其中卷积层采用结合BN层的卷积层来优化网络收敛速度,激励函数使用的Relu激励函数来增加非线性,并对噪声信号和信息信号进行了有效的分离,损失函数采用多任务损失函数结合,由两部分组成,其中车牌分类损失函数采用交叉熵损失函数,车牌预测框回归损失函数采用平方损失函数;
所述第二卷积神经网络R-net,包括:三个卷积层、二个次采样层、二个全连接层、一个softmax回归层。其中构成顺序为:卷积层conv1-次采样层poo1- 卷积层conv2-次采样层pool2-卷积层conv3-全连接层conv4-全连接层conv5- 回归层softmax;其中卷积层采用结合BN层的卷积层来优化网络收敛速度,激励函数使用的Relu激励函数来增加非线性,并对噪声信号和信息信号进行了有效的分离,损失函数采用多任务损失函数结合,由两部分组成,其中车牌分类损失函数采用交叉熵损失函数,车牌预测框回归损失函数采用平方损失函数;
所述第三卷积神经网络O-net,包括:四个卷积层、三个次采样层、二个全连接层、一个softmax回归层;其中构成顺序为:卷积层conv1-次采样层poo1- 卷积层conv2-次采样层pool2-卷积层conv3-次采样层pool3-卷积层conv4-全连接层conv5-全连接层conv6-回归层softmax。其中卷积层采用结合BN层的卷积层来优化网络收敛速度,激励函数使用的Relu激励函数来增加非线性,并对噪声信号和信息信号进行了有效的分离,损失函数采用多任务损失函数结合,由三部分组成,其中车牌分类损失函数采用交叉熵损失函数,车牌预测框回归损失函数采用平方损失函数,车牌关键点回归损失函数采用平方损失函数。
本实施例中,所述多任务损失函数具体为:
车牌分类损失函数公式为:
Figure RE-GDA0002065264370000071
其中车牌分类损失函数
Figure RE-GDA0002065264370000072
为交叉熵损失函数,pi为是车牌的概率,
Figure RE-GDA0002065264370000073
为非车牌的背景标签;
车牌预测框回归损失函数公式为:
Figure RE-GDA0002065264370000074
其中车牌预测框回归损失函数
Figure RE-GDA0002065264370000075
是计算网络预测的回归框坐标和实际真实回归框坐标的欧式距离,
Figure RE-GDA0002065264370000076
为通过卷积神经网络预测得到的回归框坐标,y为实际真实的回归框坐标。y值代表(x,y,w,h),其中x,y为框左上角的坐标值
车牌关键点定位损失函数为:
Figure RE-GDA0002065264370000077
其中关键点定位损失函数
Figure RE-GDA0002065264370000078
是计算网络预测的角点坐标和实际真实角点坐标的欧式距离,
Figure RE-GDA0002065264370000079
为通过卷积神经网络预测得到的角点坐标,y为实际真实的角点坐标,由于车牌角点坐标一共4个点,每个点2个坐标,故y属于八元组;
多任务损失函数由以上三部分构成,整个损失函数公式为:
Figure RE-GDA00020652643700000710
其中αi为任务的重要程度,
Figure RE-GDA00020652643700000711
为{0,1}的指示器(idicator)。其中多任务第一神经网络P-net的αj值分别为αdet=1,αbox=0.5,αlandmark=0.3,第二多任务卷积神经网络R-net的αj值分别为αdet=1,αbox=0.5,αlandmark=0.5,,第三多任务卷积神经网络O-net的αj值分别为αdet=1,αbox=0.5,αlandmark=1。
步骤S3:使用预处理的车辆图像数据对多任务级联卷积神经网络前两级网络进行预训练,使用预处理的车牌图像数据对多任务级联卷积神经网络后一级玩过进行预训练,得到训练好的完整的多任务卷积神经网络模型;
步骤S31:对多任务级联卷积神经网络模型进行前向训练,包括采用自下而上的无监督学习方式进行前向训练;通过卷积层操作,对预处理过得车辆和车牌数据进行特征提取,其公式为:
Figure RE-GDA0002065264370000081
所述K(i+1)为第i层与第i+1层神经元之间的卷积核;所述
Figure RE-GDA0002065264370000082
为卷积运算符, b(i)为第i层与第i+1层神经元之间的偏置值;所述f(-)为ReLu激活函数,公式为:f(x)=max(0,x),所述x为该函数的自变量;
步骤S32:通过BN层将前卷积层输出的I(i)进行标准化处理,公式为:
Figure RE-GDA0002065264370000083
Figure RE-GDA0002065264370000084
Figure RE-GDA0002065264370000085
Figure RE-GDA0002065264370000086
其中m为单个mini-batch包含样本个数,ε是为了防止分母取值为零,可以取10-6,μB为对前卷积层的输入进行均值运算,
Figure RE-GDA0002065264370000087
为对前卷积层的输入进行方差运算,
Figure RE-GDA0002065264370000088
是通过进行标准化运算,γ,δ是可学习参数,作用是为了让
Figure RE-GDA0002065264370000089
的方差和均值为任意值;
步骤S33:次采样层操作,采用最大池化层的方式来进行下采样操作,公式为:
Figure RE-GDA00020652643700000810
其中fi为该层输入划分区域的像素值,Ak为次采样层I(i)的输入划分为区域其中k∈(1,n);
步骤S34:采用自顶向下的有监督学习方式进行反向调优,通过调优之后,使得卷积神经网络模型中的每一层隐层的网络权重值都能够达到最优值;卷积层的梯度计算,公式为:
Figure RE-GDA0002065264370000091
Figure RE-GDA0002065264370000092
其中L为代价函数(即损失函数),δ表示经过一次上采样后得到的特征图,
Figure RE-GDA0002065264370000093
项为
Figure RE-GDA0002065264370000094
在卷积时与
Figure RE-GDA0002065264370000095
相乘后得到的一块区域,u,v表示特征图中的像坐标,并通过以上梯度计算来更新各卷积层权值。
步骤S4:对待检测原始图像数据进行resize到不同尺度,构造待检测图像金字塔;
步骤S5:将待检测图像金字塔输入到训练好的多任务级联卷积神经网络模型进行车牌检测。
步骤S51:将待检测图像金字塔输入到多任务级联卷积神经网络模型P-net 网络中,获取候选车牌窗口和边界框回归向量,用边界框回归向量校准候选车牌窗口,之后采用非极大值抑制合并候选车牌窗口,排除非感兴趣的背景图像;
步骤S52:将多任务级联卷积神经网络模型P-net网络输出的候选车牌窗口输入到训练好的多任务级联卷积神经网络模型R-net网络;对候选车牌图像进行精确的提取,过滤错误候选车牌窗口,用边界框回归校准候选车牌窗口,之后再采用非极大值抑制合并候选车牌窗口,排除不存在车牌区域的图像;
步骤S53:将多任务级联卷积神经网络模型R-net网络输出的候选车牌窗口输入到训练好的多任务级联卷积神经网络模型O-net网络,对候选车牌图像进行进一步精准提取,并标记出车牌图像中的四个关键点信息。
以上所述仅为本发明的较佳实施例,凡依本发明申请专利范围所做的均等变化与修饰,皆应属本发明的涵盖范围。

Claims (3)

1.一种基于多任务级联卷积神经网络的车牌检测方法,其特征在于,包括以下步骤:
步骤S1:采集车辆图像和车牌图像数据,并预处理;
步骤S2:构建多任务级联卷积神经网络模型;
步骤S3:使用预处理的车辆图像数据对多任务级联卷积神经网络前两级网络进行预训练,使用预处理的车牌图像数据对多任务级联卷积神经网络后一级网络进行预训练,得到训练好的完整的多任务卷积神经网络模型;
步骤S4:对待检测原始图像数据进行resize到不同尺度,构造待检测图像金字塔;
步骤S5:将待检测图像金字塔输入到训练好的多任务级联卷积神经网络模型进行车牌检测;
所述步骤S2具体为:构建由三个网络构成多任务级联卷积神经网络模型,包括第一卷积神经网络P-net、第二卷积神经网络R-net、第三卷积神经网络O-net;
步所述的第一卷积神经网络P-net,包括:四个卷积层、一个次采样层、一个softmax回归层,其中构成顺序为:卷积层conv1-次采样层mp1-卷积层conv2-卷积层conv3-卷积层conv4-回归层softmax;
所述第二卷积神经网络R-net,包括:三个卷积层、二个次采样层、二个全连接层、一个softmax回归层;其中构成顺序为:卷积层conv1-次采样层poo1-卷积层conv2-次采样层pool2-卷积层conv3-全连接层conv4-全连接层conv5-回归层softmax;
所述第三卷积神经网络O-net,包括:四个卷积层、三个次采样层、二个全连接层、一个softmax回归层;其中构成顺序为:卷积层conv1-次采样层poo1-卷积层conv2-次采样层pool2-卷积层conv3-次采样层pool3-卷积层conv4-全连接层conv5-全连接层conv6-回归层softmax;
其中卷积层采用结合BN层的卷积层,激励函数使用的Relu激励函数,并对噪声信号和信息信号进行分离,损失函数采用多任务损失函数结合,由三部分组成,其中车牌分类损失函数采用交叉熵损失函数,车牌预测框回归损失函数采用平方损失函数,车牌关键点回归损失函数采用平方损失函数
所述多任务损失函数具体为:
车牌分类损失函数公式为:
Figure FDA0003656095580000021
其中车牌分类损失函数
Figure FDA0003656095580000022
为交叉熵损失函数,pi为是车牌的概率,
Figure FDA0003656095580000023
为非车牌的背景标签;
车牌预测框回归损失函数公式为:
Figure FDA0003656095580000024
其中车牌预测框回归损失函数
Figure FDA0003656095580000025
是计算网络预测的回归框坐标和实际真实回归框坐标的欧式距离,
Figure FDA0003656095580000026
为通过卷积神经网络预测得到的回归框坐标,
Figure FDA0003656095580000027
为实际真实的回归框坐标;
Figure FDA0003656095580000028
值代表(x,y,w,h),其中x,y为框左上角的坐标值;
车牌关键点定位损失函数为:
Figure FDA0003656095580000029
其中关键点定位损失函数
Figure FDA00036560955800000210
是计算网络预测的角点坐标和实际真实角点坐标的欧式距离,
Figure FDA00036560955800000211
为通过卷积神经网络预测得到的角点坐标,
Figure FDA00036560955800000212
为实际真实的角点坐标,由于车牌角点坐标一共4个点,每个点2个坐标,故
Figure FDA00036560955800000213
属于八元组;
多任务损失函数由以上三部分构成,整个损失函数公式为:
Figure FDA00036560955800000214
其中αi为任务的重要程度,βi j为{0,1}的指示器;其中多任务第一神经网络P-net的αj值分别为αdet=1,αbox=0.5,αlandmark=0.3,第二多任务卷积神经网络R-net的αj值分别为αdet=1,αbox=0.5,αlandmark=0.5,第三多任务卷积神经网络O-net的αj值分别为αdet=1,αbox=0.5,αlandmark=1;
所述步骤S5具体为:
步骤S51:将待检测图像金字塔输入到多任务级联卷积神经网络模型P-net网络中,获取候选车牌窗口和边界框回归向量,用边界框回归向量校准候选车牌窗口,之后采用非极大值抑制合并候选车牌窗口,排除非感兴趣的背景图像;
步骤S52:将多任务级联卷积神经网络模型P-net网络输出的候选车牌窗口输入到训练好的多任务级联卷积神经网络模型R-net网络;对候选车牌图像进行精确的提取,过滤错误候选车牌窗口,用边界框回归校准候选车牌窗口,之后再采用非极大值抑制合并候选车牌窗口,排除不存在车牌区域的图像;
步骤S53:将多任务级联卷积神经网络模型R-net网络输出的候选车牌窗口输入到训练好的多任务级联卷积神经网络模型O-net网络,对候选车牌图像进行进一步精准提取,并标记出车牌图像中的四个关键点信息。
2.根据权利要求1所述的基于多任务级联卷积神经网络的车牌检测方法,其特征在于:所述车辆图像和车牌图像数据采集基于CCPD车辆数据库。
3.根据权利要求1所述的基于多任务级联卷积神经网络的车牌检测方法,其特征在于:所述步骤S3具体为:
步骤S31:对多任务级联卷积神经网络模型进行前向训练,包括采用自下而上的无监督学习方式进行前向训练;通过卷积层操作,对预处理过得车辆和车牌数据进行特征提取,其公式为:
Figure FDA0003656095580000031
所述K(i+1)为第i层与第i+1层神经元之间的卷积核;所述
Figure FDA0003656095580000032
为卷积运算符,b(i)为第i层与第i+1层神经元之间的偏置值;所述f(-)为ReLu激活函数,公式为:f(x)=max(0,x),所述x为该函数的自变量;
步骤S32:通过BN层将前卷积层输出的I(i)进行标准化处理,公式为:
Figure FDA0003656095580000033
Figure FDA0003656095580000041
Figure FDA0003656095580000042
Figure FDA0003656095580000043
其中m为单个mini-batch包含样本个数,ε是为了防止分母取值为零,取10-6,μB为对前卷积层的输入进行均值运算,
Figure FDA0003656095580000044
为对前卷积层的输入进行方差运算,
Figure FDA0003656095580000045
为通过进行标准化运算,γ,δ是可学习参数,作用是为了让
Figure FDA0003656095580000046
的方差和均值为任意值;
步骤S33:次采样层操作,采用最大池化层的方式来进行下采样操作,公式为:
Figure FDA0003656095580000047
其中fi为输入划分区域的像素值,Ak为次采样层I(i)的输入划分为区域其中k∈(1,n);
步骤S34:采用自顶向下的有监督学习方式进行反向调优,通过调优之后,使得卷积神经网络模型中的每一层隐层的网络权重值都能够达到最优值;卷积层的梯度计算,公式为:
Figure FDA0003656095580000048
Figure FDA0003656095580000049
其中L为代价函数,
Figure FDA00036560955800000410
表示经过一次上采样后得到的特征图,
Figure FDA00036560955800000411
项为
Figure FDA00036560955800000412
在卷积时与
Figure FDA00036560955800000413
相乘后得到的一块区域,u,v表示特征图中的像坐标,并通过以上梯度计算来更新各卷积层权值。
CN201910316667.5A 2019-04-19 2019-04-19 基于多任务级联卷积神经网络的车牌检测方法 Active CN110033002B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910316667.5A CN110033002B (zh) 2019-04-19 2019-04-19 基于多任务级联卷积神经网络的车牌检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910316667.5A CN110033002B (zh) 2019-04-19 2019-04-19 基于多任务级联卷积神经网络的车牌检测方法

Publications (2)

Publication Number Publication Date
CN110033002A CN110033002A (zh) 2019-07-19
CN110033002B true CN110033002B (zh) 2022-07-08

Family

ID=67239167

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910316667.5A Active CN110033002B (zh) 2019-04-19 2019-04-19 基于多任务级联卷积神经网络的车牌检测方法

Country Status (1)

Country Link
CN (1) CN110033002B (zh)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110598650A (zh) * 2019-09-17 2019-12-20 中控智慧科技股份有限公司 车牌虚警过滤方法、装置及电子设备和存储介质
CN110717534B (zh) * 2019-09-30 2020-09-15 中国科学院大学 一种基于网络监督的目标分类和定位方法
CN110706261A (zh) * 2019-10-22 2020-01-17 上海眼控科技股份有限公司 车辆违章检测方法、装置、计算机设备和存储介质
CN110991448A (zh) * 2019-11-27 2020-04-10 云南电网有限责任公司电力科学研究院 电力设备铭牌图像的文本检测方法及装置
CN111242038B (zh) * 2020-01-15 2024-06-07 北京工业大学 一种基于帧预测网络的动态舌颤检测方法
CN111277434A (zh) * 2020-01-16 2020-06-12 北京工业大学 一种基于vmd和lstm的网络流量多步预测方法
CN111444913B (zh) * 2020-03-22 2023-08-22 华南理工大学 一种基于边缘引导稀疏注意力机制的车牌实时检测方法
CN111429727B (zh) * 2020-04-23 2021-04-02 深圳智优停科技有限公司 一种开放式停车位中车牌识别方法及系统
CN113673668A (zh) * 2020-05-13 2021-11-19 北京君正集成电路股份有限公司 一种车辆检测训练中二级损失函数的计算方法
CN111666938B (zh) * 2020-05-21 2021-08-17 珠海大横琴科技发展有限公司 一种基于深度学习的两地双车牌检测识别方法及系统
CN111950318A (zh) * 2020-08-12 2020-11-17 上海连尚网络科技有限公司 一种二维码图像的识别方法、设备及存储介质
CN112507862B (zh) * 2020-12-04 2023-05-26 东风汽车集团有限公司 基于多任务卷积神经网络的车辆朝向检测方法及系统
CN113505759B (zh) * 2021-09-08 2022-02-11 北京科技大学 多任务处理的方法、装置及存储介质
CN113947766B (zh) * 2021-12-21 2022-04-22 之江实验室 一种基于卷积神经网络的实时车牌检测方法
CN115410184A (zh) * 2022-08-24 2022-11-29 江西山水光电科技股份有限公司 一种基于深度神经网络的目标检测车牌识别方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106022232A (zh) * 2016-05-12 2016-10-12 成都新舟锐视科技有限公司 基于深度学习的车牌检测方法
CN108268865A (zh) * 2016-12-30 2018-07-10 航天信息股份有限公司 一种基于级联卷积网络的自然场景下车牌识别方法及系统
CN108830192A (zh) * 2018-05-31 2018-11-16 珠海亿智电子科技有限公司 车载环境下基于深度学习的车辆与车牌检测方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2425778T3 (es) * 2011-03-17 2013-10-17 Kapsch Trafficcom Ag Aparcamiento con sistema de reserva

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106022232A (zh) * 2016-05-12 2016-10-12 成都新舟锐视科技有限公司 基于深度学习的车牌检测方法
CN108268865A (zh) * 2016-12-30 2018-07-10 航天信息股份有限公司 一种基于级联卷积网络的自然场景下车牌识别方法及系统
CN108830192A (zh) * 2018-05-31 2018-11-16 珠海亿智电子科技有限公司 车载环境下基于深度学习的车辆与车牌检测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Efficient Scale-Adaptive License Plate Detection System;Miguel Molina-Moreno et al.;《IEEE Transactions on Intelligent Transportation Systems》;20180815;第20卷(第06期);第2109-2121页 *
基于卷积神经网络的盲车牌识别算法研究;姜伶俏;《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》;20180115(第01期);第1-64页 *

Also Published As

Publication number Publication date
CN110033002A (zh) 2019-07-19

Similar Documents

Publication Publication Date Title
CN110033002B (zh) 基于多任务级联卷积神经网络的车牌检测方法
US10445602B2 (en) Apparatus and method for recognizing traffic signs
CN107239730B (zh) 智能汽车交通标志识别的四元数深度神经网络模型方法
Hoang et al. Enhanced detection and recognition of road markings based on adaptive region of interest and deep learning
CN110163069B (zh) 用于辅助驾驶的车道线检测方法
CN115311241B (zh) 一种基于图像融合和特征增强的煤矿井下行人检测方法
CN109635784A (zh) 基于改进的卷积神经网络的交通标志识别方法
CN109034024B (zh) 基于图像目标检测的物流车辆车型分类识别方法
CN112766229B (zh) 基于注意力机制的人脸点云图像智能识别系统及方法
CN108009548A (zh) 一种智能路牌识别方法及系统
He et al. Automatic recognition of traffic signs based on visual inspection
CN113158943A (zh) 一种跨域红外目标检测方法
CN111461006B (zh) 一种基于深度迁移学习的光学遥感图像杆塔位置检测方法
CN111462140B (zh) 一种基于区块拼接的实时图像实例分割方法
Nguyen et al. Hybrid deep learning-Gaussian process network for pedestrian lane detection in unstructured scenes
Xing et al. Traffic sign recognition using guided image filtering
CN108985145A (zh) 小尺寸交通标志检测识别的反向连接深度神经网络模型方法
CN105893941B (zh) 一种基于区域图像的人脸表情识别方法
CN104778699A (zh) 一种自适应对象特征的跟踪方法
CN116935361A (zh) 一种基于深度学习的驾驶员分心行为检测方法
CN114492634B (zh) 一种细粒度装备图片分类识别方法及系统
CN113963333B (zh) 一种基于改进yolof模型的交通标志牌检测方法
Kheder et al. Transfer learning based traffic light detection and recognition using CNN inception-V3 model
CN113269038A (zh) 一种基于多尺度的行人检测方法
CN113129336A (zh) 一种端到端多车辆跟踪方法、系统及计算机可读介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant