CN111563515A - 一种基于改进的Faster-RCNN的车牌识别方法 - Google Patents
一种基于改进的Faster-RCNN的车牌识别方法 Download PDFInfo
- Publication number
- CN111563515A CN111563515A CN202010421998.8A CN202010421998A CN111563515A CN 111563515 A CN111563515 A CN 111563515A CN 202010421998 A CN202010421998 A CN 202010421998A CN 111563515 A CN111563515 A CN 111563515A
- Authority
- CN
- China
- Prior art keywords
- license plate
- network
- recognition
- frame
- candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/62—Text, e.g. of license plates, overlay texts or captions on TV images
- G06V20/625—License plates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Health & Medical Sciences (AREA)
- Character Discrimination (AREA)
Abstract
本发明公开了一种基于改进的Faster‑RCNN的车牌识别方法,涉及车牌识别技术领域;它的方法如下:步骤一:选取特征提取网络;步骤二:用候选框生成网络检测车牌位置;步骤三:车牌检测网络;步骤四:字符识别网络;本发明对车牌图像像素没有过高的要求,并且不需要对字符进行分割,也不需要对车牌图像做车牌矫正以及其它一些繁琐的图像预处理工作;端到端车牌识别算法对输入进网络的车牌图像直接进行字符识别,系统简洁且有着较高的正确识别率。
Description
技术领域
本发明属于车牌识别技术领域,具体涉及一种基于改进的Faster-RCNN的车牌识别方法。
背景技术
在车牌定位中一般利用Sobel 算子检测车牌的边缘。Yujie Liu等人提出了一种颜色边缘特征,该方法对RGB三通道分别进行Sobel运算,利用三通道的边缘特征图通过自定义规则选取边缘点,这种方法可以很好的适应车牌边缘有噪音的情况。数字图像的RGB颜色模型是最常见的图像存储方式,直接利用RGB模型进行车牌定位比较困难,一般会将 RGB模型转换为HSV模型(色度 Hue、饱和度Saturation和纯度Value)进行车牌定位。
车牌定位完成后,需要提取每个字符区域进行字符识别,传统的车牌识别需要进行字符分割,字符分割常用的算法有投影法、模板匹配法和聚类法等。Xin Lei等人用LSTM(Long Short Memory Network)网络,结合CTC(Connectionist TemporalClassification)损失函数用来解决文字识别问题。目前深度学习技术在目标检测领域内发展迅猛,新的网络不断出现,例如2015年的ResNet(Residual Neural Network)网络,深度学习技术应用于车牌识别已有丰富的理论支撑和经验参考。
基于以上难点,需要一种基于改进的Faster-RCNN对车牌识别进行研究,提出了一种端到端的车牌识别算法,以避免分步识别带来的误差放大的问题。
发明内容
为解决现有的问题;本发明的目的在于提供一种基于改进的Faster-RCNN的车牌识别方法。
本发明的一种基于改进的Faster-RCNN的车牌识别方法,它的方法如下:
步骤一:选取特征提取网络:
选择深度残差网络作为提取车牌字符特征的基础网络;
步骤二:用候选框生成网络检测车牌位置:
采用候选框提取网络用于为图像中的目标物体生成候选框,对应卷积特征图上的每个位置,通过RPN网络可以得到k个预先生成的不同尺度、不同长宽比的锚框,车牌分类层输出2k个得分,对应于每个位置上的每个锚框是车牌的概率或者不是车牌的概率,锚框回归层输出4k个数值,分别对应于每个锚框对应的离其最近的标定框的偏置系数,给定一个中心为(Xa,Ya),长和宽分别为Wa和Ha的锚框,回归层输出的4个数值为(tx,ty,tw,th),其中,tx,ty为尺度变换因子;tw,th为锚框中心点偏移的对数值;
步骤三:车牌检测网络:
车牌检测网络的目标在于判断候选ROI是否是车牌,以及精修候选的坐标,前面得到的卷积特征图经过最后一个残差Block,得到最终用于车牌检测的特征图,上述得到的feature map经过一个全局的平均池化,此时每一个ROI区域的feature对应展开成一个向量,然后分别经过两个全连接层,分别对应于车牌分类和框回归;
步骤四:字符识别网络:
字符识别网络的目标是基于提取的ROI区域的特征,识别出ROI区域的字符;为了避免车牌分割,实现端到端的识别,且保证识别出来的车牌字符不是乱序的,采用LSTM+CTC的网络来解决。
与现有技术相比,本发明的有益效果为:
一、对车牌图像像素没有过高的要求,并且不需要对字符进行分割,也不需要对车牌图像做车牌矫正以及其它一些繁琐的图像预处理工作;
二、端到端车牌识别算法对输入进网络的车牌图像直接进行字符识别,系统简洁且有着较高的正确识别率。
具体实施方式
本具体实施方式采用以下技术方案:它的方法为:
步骤一:选取特征提取网络:
特征提取的基础网络采用ResNet网络,ResNet 已经取代大多数VGG网络作为提取特征的基础框架。ResNet对比VGG的优势在于它是一个更深层、大型的网络,因此有更大的容量去学习所需要的信息。这些结论在图片分类任务中可行,在目标探测的问题中也应该同样有效;因此选择深度残差网络作为提取车牌字符特征的基础网络;
步骤二:用候选框生成网络检测车牌位置:
Ren等人为目标检测算法设计了一种候选框提取网络(Region ProposalNetwork,RPN),用于为图像中的目标物体生成候选框。对应卷积特征图上的每个位置,通过RPN网络可以得到k个预先生成的不同尺度、不同长宽比的锚框。车牌分类层(plateclassification layer)输出2k个得分,对应于每个位置上的每个锚框是车牌的概率或者不是车牌的概率。锚框回归层(boundingboxregressionlayer)输出4k个数值,分别对应于每个锚框对应的离其最近的标定框(ground-truth)的偏置系数。给定一个中心为(Xa,Ya),长和宽分别为Wa和Ha的锚框,回归层输出的4个数值为(tx,ty,tw,th),其中,tx,ty为尺度变换因子;tw,th为锚框中心点偏移的对数值。
步骤三:车牌检测网络:
车牌检测网络的目标在于判断候选ROI(Region of Interests)是否是车牌,以及精修候选的坐标。前面得到的卷积特征图经过最后一个残差Block,得到最终用于车牌检测的特征图。上述得到的feature map经过一个全局的平均池化,此时每一个ROI区域的feature对应展开成一个向量,然后分别经过两个全连接层,分别对应于车牌分类和框回归。
步骤四:字符识别网络:
字符识别网络的目标是基于提取的ROI区域的特征,识别出ROI区域的字符。为了避免车牌分割,实现端到端的识别,且保证识别出来的车牌字符不是乱序的,采用LSTM+CTC的网络来解决。
本实施例主要研究以下几点:
一、研究车牌定位算法:
通过研究分析我国车牌的特点,通过经典的Faster R-CNN网络进行车牌定位,以适应复杂多变的实际场景。使用卷积神经网络来提取图像特征,其优点在于自然场景中的车牌模糊、车牌倾斜、图像背景复杂、图像质量不高等情况相比传统车牌定位算法具有较好的鲁棒性。Faster R-CNN是Ross Girshick在2015年对RCNN和Fast R-CNN进一步改进得到的经典目标检测网络。在检测速度和精度上都有了较大提升,Faster R-CNN检测速度为17fps,Ross Girshick在Faster R-CNN设计了一种候选区域生成网络 RPN(Region ProposalNetwork),该网络与Fast R-CNN共享特征提取网络,这种设计方式使得特征提取、候选区域生成、目标分类、位置精修这目标检测的四大基本步骤整合到了一个深度网络结构中,形成了一个完整的可训练的网络系统。
二、研究车牌字符识别算法:
车牌定位完成后,需要提取每个字符区域进行字符识别,由于我国车牌字符的复杂性和多样性,传统的图像分割识别算法很难达到较好的效果。本文针对车牌中文字符、英文字母和数字,首先基于Faster R-CNN的目标检测神经网络将含字符的车牌检测出来,然后为了避免车牌分割带来的挑战,把车牌字符识别问题看作一个序列标注问题。再用LSTM网络,结合CTC损失函数用来解决这个序列标注问题。
三、与传统车牌识别作对比:
针对车牌识别,以前的研究工作都是先进行字符分割,然后利用光学字符识别法进行逐字符的车牌识别。字符分割是字符识别的基础,因而如何实现对车牌字符的精准分割直接影响到最终车牌识别的准确率。然而,字符分割本身就是一个充满挑战的任务,非常容易受到图像中不均衡光照、阴影、噪声等因素的干扰。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。
此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。
Claims (1)
1.一种基于改进的Faster-RCNN的车牌识别方法,其特征在于:它的方法如下:
步骤一:选取特征提取网络:
选择深度残差网络作为提取车牌字符特征的基础网络;
步骤二:用候选框生成网络检测车牌位置:
采用候选框提取网络用于为图像中的目标物体生成候选框,对应卷积特征图上的每个位置,通过RPN网络可以得到k个预先生成的不同尺度、不同长宽比的锚框,车牌分类层输出2k个得分,对应于每个位置上的每个锚框是车牌的概率或者不是车牌的概率,锚框回归层输出4k个数值,分别对应于每个锚框对应的离其最近的标定框的偏置系数,给定一个中心为(Xa,Ya),长和宽分别为Wa和Ha的锚框,回归层输出的4个数值为(tx,ty,tw,th),其中,tx,ty为尺度变换因子;tw,th为锚框中心点偏移的对数值;
步骤三:车牌检测网络:
车牌检测网络的目标在于判断候选ROI是否是车牌,以及精修候选的坐标,前面得到的卷积特征图经过最后一个残差Block,得到最终用于车牌检测的特征图,上述得到的feature map经过一个全局的平均池化,此时每一个ROI区域的feature对应展开成一个向量,然后分别经过两个全连接层,分别对应于车牌分类和框回归;
步骤四:字符识别网络:
字符识别网络的目标是基于提取的ROI区域的特征,识别出ROI区域的字符;为了避免车牌分割,实现端到端的识别,且保证识别出来的车牌字符不是乱序的,采用LSTM+CTC的网络来解决。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010421998.8A CN111563515A (zh) | 2020-05-18 | 2020-05-18 | 一种基于改进的Faster-RCNN的车牌识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010421998.8A CN111563515A (zh) | 2020-05-18 | 2020-05-18 | 一种基于改进的Faster-RCNN的车牌识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111563515A true CN111563515A (zh) | 2020-08-21 |
Family
ID=72071071
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010421998.8A Pending CN111563515A (zh) | 2020-05-18 | 2020-05-18 | 一种基于改进的Faster-RCNN的车牌识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111563515A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112464938A (zh) * | 2020-12-18 | 2021-03-09 | 深圳赛安特技术服务有限公司 | 车牌检测识别方法、装置、设备及存储介质 |
CN113177552A (zh) * | 2021-05-27 | 2021-07-27 | 的卢技术有限公司 | 一种基于深度学习的车牌识别方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107203754A (zh) * | 2017-05-26 | 2017-09-26 | 北京邮电大学 | 一种基于深度学习的车牌定位方法及装置 |
CN109508715A (zh) * | 2018-10-30 | 2019-03-22 | 南昌大学 | 一种基于深度学习的车牌定位和识别方法 |
CN110334709A (zh) * | 2019-07-09 | 2019-10-15 | 西北工业大学 | 基于端到端多任务深度学习的车牌检测方法 |
-
2020
- 2020-05-18 CN CN202010421998.8A patent/CN111563515A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107203754A (zh) * | 2017-05-26 | 2017-09-26 | 北京邮电大学 | 一种基于深度学习的车牌定位方法及装置 |
CN109508715A (zh) * | 2018-10-30 | 2019-03-22 | 南昌大学 | 一种基于深度学习的车牌定位和识别方法 |
CN110334709A (zh) * | 2019-07-09 | 2019-10-15 | 西北工业大学 | 基于端到端多任务深度学习的车牌检测方法 |
Non-Patent Citations (1)
Title |
---|
曹正风 等: "基于深度学习的端到端车牌检测识别系统", 《中国交通信息化》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112464938A (zh) * | 2020-12-18 | 2021-03-09 | 深圳赛安特技术服务有限公司 | 车牌检测识别方法、装置、设备及存储介质 |
CN112464938B (zh) * | 2020-12-18 | 2024-04-12 | 深圳赛安特技术服务有限公司 | 车牌检测识别方法、装置、设备及存储介质 |
CN113177552A (zh) * | 2021-05-27 | 2021-07-27 | 的卢技术有限公司 | 一种基于深度学习的车牌识别方法 |
CN113177552B (zh) * | 2021-05-27 | 2024-04-26 | 的卢技术有限公司 | 一种基于深度学习的车牌识别方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109299274B (zh) | 一种基于全卷积神经网络的自然场景文本检测方法 | |
CN103456010B (zh) | 一种基于特征点定位的人脸卡通画生成方法 | |
CN111325203B (zh) | 一种基于图像校正的美式车牌识别方法及系统 | |
CN105046196B (zh) | 基于级联卷积神经网络的前车车辆信息结构化输出方法 | |
CN110276264B (zh) | 一种基于前景分割图的人群密度估计方法 | |
CN111310760B (zh) | 结合局部先验特征和深度卷积特征的甲骨刻辞文字检测方法 | |
CN111291629A (zh) | 图像中文本的识别方法、装置、计算机设备及计算机存储介质 | |
CN109657612B (zh) | 一种基于人脸图像特征的质量排序系统及其使用方法 | |
CN111862119A (zh) | 基于Mask-RCNN的语义信息提取方法 | |
CN110110646A (zh) | 一种基于深度学习的手势图像关键帧提取方法 | |
CN104050471A (zh) | 一种自然场景文字检测方法及系统 | |
CN107657625A (zh) | 融合时空多特征表示的无监督视频分割方法 | |
CN111507334B (zh) | 一种基于关键点的实例分割方法 | |
CN112287941B (zh) | 一种基于自动字符区域感知的车牌识别方法 | |
CN111274921A (zh) | 一种利用姿态掩模进行人体行为识别的方法 | |
CN110598698B (zh) | 基于自适应区域建议网络的自然场景文本检测方法和系统 | |
CN109191429B (zh) | 一种基于机器视觉的3d打印喷嘴检测方法 | |
CN111563515A (zh) | 一种基于改进的Faster-RCNN的车牌识别方法 | |
CN109784216B (zh) | 基于概率图的车载热成像行人检测RoIs提取方法 | |
Dupont et al. | UCP-net: unstructured contour points for instance segmentation | |
CN110363196B (zh) | 一种倾斜文本的文字精准识别的方法 | |
CN111079826A (zh) | 融合slam和图像处理的施工进度实时识别方法 | |
CN108764343B (zh) | 一种跟踪算法中的跟踪目标框的定位方法 | |
CN111612802B (zh) | 一种基于现有图像语义分割模型的再优化训练方法及应用 | |
CN110991440B (zh) | 一种像素驱动的手机操作界面文本检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20200821 |