CN110032999B - 一种汉字结构退化的低分辨率车牌识别方法 - Google Patents
一种汉字结构退化的低分辨率车牌识别方法 Download PDFInfo
- Publication number
- CN110032999B CN110032999B CN201910204188.4A CN201910204188A CN110032999B CN 110032999 B CN110032999 B CN 110032999B CN 201910204188 A CN201910204188 A CN 201910204188A CN 110032999 B CN110032999 B CN 110032999B
- Authority
- CN
- China
- Prior art keywords
- license plate
- character
- chinese character
- chinese
- characters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/62—Text, e.g. of license plates, overlay texts or captions on TV images
- G06V20/63—Scene text, e.g. street names
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/62—Text, e.g. of license plates, overlay texts or captions on TV images
- G06V20/625—License plates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Abstract
本发明公开了一种汉字结构退化的低分辨率车牌识别方法,步骤包括:1)构建VGG16网络,提取整个车牌的深度特征;2)将车牌特征矩阵转换为字符特征序列;3)将字符特征序列送入双向深度LSTM网络,输出66×T的车牌字符序列的归属概率矩阵;4)对输出的车牌字符序列的归属概率矩阵进行解码;5)对车牌汉字部分进行分割;6)对车牌汉字进行再识别的确认,获取候选的汉字模板,对车牌中的汉字再识别,取孪生网络输出的与候选的汉字模板相似度大的汉字为车牌汉字的输出结果,其它的字符结果则采用步骤4的结果。本发明的方法,识别准确率明显提高。
Description
技术领域
本发明属于车牌识别技术领域,涉及一种汉字结构退化的低分辨率车牌识别方法。
背景技术
对于停车场或者收费站这类拍摄角度固定、车辆低速或者静止、车牌分辨率能够保证的情况,车牌识别能够做到实用化。但是,对于通过监控视频追踪快速移动的违章、肇事车辆的情况,由于抓拍到的车辆距离较远,只能得到低分辨率车牌;再加上因为拍摄视角引起的图像倾斜、字符模糊等问题,使得汉字结构严重退化,影响了车牌识别准确率,导致低分辨率车牌识别成为一个难点问题。
发明内容
本发明的目的是提供一种汉字结构退化的低分辨率车牌识别方法,解决现有技术中对于低分辨率车牌,由于汉字难识别造成整个车牌识别准确率低的问题。
本发明所采用的技术方案是,一种汉字结构退化的低分辨率车牌识别方法,按照以下步骤实施:
步骤1、构建VGG16网络,提取整个车牌的深度特征
将待识别的低分辨率车牌进行图像归一化,处理到m×n大小,归一化后的车牌图像记为车牌Plate=[pla(i,j)]m×n,将车牌Plate=[pla(i,j)]m×n输入VGG16 网络后,网络输出为N×T大小的车牌特征矩阵,记为F=[f(i,j)]N×T,这个车牌特征矩阵由N个T维行向量构成,或理解成是N个T维的车牌特征向量,此外,将这个特征矩阵F=[f(i,j)]N×T的列向量来观察,则是由T个N维列向量构成,或理解成是由T个N维的字符特征向量构成,对字符的特征提取共计N 维;
步骤2、将车牌特征矩阵转换为字符特征序列
将步骤1得到的车牌特征矩阵F=[f(i,j)]N×T的每一个列向量看成是某个字符的特征向量,则车牌特征矩阵F=[f(i,j)]N×T表示了T个N维的字符特征构成的字符特征序列,则将车牌特征矩阵F=[f(i,j)]N×T的列向量表示为字符特征序列:X=[x1,x2,...,xT],xt=[f1,t,f2,t,...,fN,t]T,t=1,2,...,T;
步骤3、将字符特征序列X=[x1,x2,...,xT]送入双向深度LSTM网络,
使用双向深度LSTM网络,作为分类器,输出字符特征序列的归属概率矩阵Y=[y1,y2,...,yT],每个yt=[p1,t,p2,t,...,p66,t]T,t=1,2,...,T都是66维的归属概率向量,输出Y=[y1,y2,...,yT]是66×T的车牌字符序列的归属概率矩阵;
步骤4、对输出的车牌字符序列的归属概率矩阵进行解码
解码步骤如下:
4.1)取Y=[y1,y2,...,yT]中的每个yt=[p1,t,p2,t,...,p66,t]T的最大值对应的字符序号是:yt,max=argmax{[p1,t,p2,t,...,p66,t]T},t=1,2,...,T (1)
则输出的候选序列为:
ymax=[y1,max,y2,max,...,yT,max] (2)
4.2)消除候选序列中的空格和重复字符;
4.3)如果步骤4.2)得到的车牌汉字的归属概率大于0.99,则输出识别结果;否则,转入步骤5,对车牌中的汉字进一步再识别;
步骤5、对车牌汉字部分进行分割;
步骤6、对车牌汉字进行再识别的确认。
本发明的有益效果是,对最低分辨率为16×50的实际拍摄到的整个车牌识别准确率达97%以上,汉字识别准确率达98.5%以上,优于目前的车牌识别软件和检索到的相关文献。
附图说明
图1是本发明方法中的车牌识别整体框图;
图2是本发明方法中的汉字再识别区域与候选模板示例;
图3是本发明方法中的汉字再识别孪生网络结构示意图。
具体实施方式
下面结合附图和具体实施方式对本发明进行详细说明。
参照图1,依据LSTM循环神经网络对车牌进行无分割识别,可避免车牌字符分割误差累积,汉字识别结果TOP1到YOP2的准确率增量最大的特点,本发明提出了一种汉字结构退化的低分辨率车牌识别方法,基于LSTM 循环神经网络和Siamese孪生网络,按照以下步骤实施:
步骤1、构建VGG16网络,提取整个车牌的深度特征
将待识别的低分辨率车牌(最低分辨率为16×50)进行图像归一化,处理到m×n大小,这里优选m=32,n=100,归一化后的车牌图像记为车牌 Plate=[pla(i,j)]m×n,将车牌Plate=[pla(i,j)]m×n输入VGG16网络后,网络输出为 N×T大小的车牌特征矩阵,记为车牌特征矩阵F=[f(i,j)]N×T,这个车牌特征矩阵看成是由N个T维行向量构成,或理解成是N个T维的车牌特征向量,对于目前最多8位的车牌(按照国标,普通车的车牌是7位字符,新能源车是8位字符),优选T=26,目的是为了具有充分的冗余,平均每个字符能够被重复3次以上;此外,将这个车牌特征矩阵F=[f(i,j)]N×T的列向量来观察,则是由T个N维列向量构成,或理解成是由T个N维的字符特征向量构成,对字符的特征提取共计N维,优选N=512,即对每个字符特征也有充分的描述;
VGG16网络为文献公开的深度学习网络,可在相关论文中检索到。
步骤2、将车牌特征矩阵转换为字符特征序列
将步骤1得到的车牌特征矩阵F=[f(i,j)]N×T的每一个列向量看成是某个字符的特征向量,则车牌特征矩阵F=[f(i,j)]N×T表示了T个N维的字符特征构成的字符特征序列,则将车牌特征矩阵F=[f(i,j)]N×T的列向量表示为字符特征序列:X=[x1,x2,...,xT],xt=[f1,t,f2,t,...,fN,t]T,t=1,2,...,T;
步骤3、将字符特征序列X=[x1,x2,...,xT]送入双向深度LSTM网络
通过步骤2得到字符特征序列X=[x1,x2,...,xT]后,使用双向深度LSTM网络,作为分类器,输出字符特征序列的归属概率矩阵Y=[y1,y2,...,yT],(双向深度LSTM网络是文献公开的深度学习网络,可在相关论文中检索到),
双向深度LSTM网络输出的字符特征序列的归属概率矩阵为 Y=[y1,y2,...,yT],每个yt=[p1,t,p2,t,...,p66,t]T,t=1,2,...,T都是66维的归属概率向量,这66维分别为31个省份的标识汉字、24个字母、10个数字和1个空白,共66类标签;需要1个空白的标签是为了对每个字符之间的空白部分也作出预测,即输出Y=[y1,y2,...,yT]是66×T的车牌字符序列的归属概率矩阵;
步骤4、对输出的车牌字符序列的归属概率矩阵进行解码
因为步骤3输出的归属概率矩阵Y=[y1,y2,...,yT]中的每一列都是关于66 个字符类别的归属概率,因此,解码步骤如下:
4.1)取归属概率矩阵Y=[y1,y2,...,yT]中的每个yt=[p1,t,p2,t,...,p66,t]T的最大值对应的字符序号是:
yt,max=argmax{[p1,t,p2,t,...,p66,t]T},t=1,2,...,T (1)
则输出的候选序列为:
ymax=[y1,max,y2,max,...,yT,max] (2)
4.2)消除候选序列中的空格和重复字符,
例如,ymax=[y1,max,y2,max,...,yT,max]对应的字符序列是‘京A--------1--B --0--0---11-’,去掉重复的字符和空格后,得到的可能识别结果是“京 A1B001”;
4.3)如果步骤4.2)得到的车牌汉字的归属概率大于0.99,则输出识别结果;否则,转入步骤5,对车牌中的汉字进一步再识别;
上述的步骤1-4称为“车牌的初识别”,在一些复杂情况下,还需要进行以下步骤5和6的“车牌的再识别”。
步骤5、对车牌汉字部分进行分割
对车牌Plate=[pla(i,j)]32×100进行投影计算:
如果是由7个字符构成的普通车牌,转步骤5.1);如果是由8个字符构成的普通车牌,转步骤5.2);
5.1)对普通车牌进行分割
以分割点处设置垂直的分割线,分割出由汉字和邻近一个字符构成的汉字再识别区域,直接转入步骤6;
5.2)对新能源车牌进行分割
以分割点处设置垂直的分割线,分割出由汉字和邻近一个字符构成的汉字再识别区域,记作RC,转入步骤6;
步骤6、对车牌汉字进行再识别的确认
6.1)获取候选的汉字模板
参照图2,按照步骤4,再次计算得到概率次大的车牌识别结果,将概率最大(TOP1)和概率次大(TOP2)的两个车牌识别结果的汉字及相邻的字符,按照车牌国标规定的汉字、字符的字体和大小构造相对应的汉字模板,记TOP1汉字模板为M1,TOP2汉字模板为M2;
6.2)计算汉字区域与汉字模板的相似度
参照图3,选择一个孪生网络(孪生网络在相关的文献中可以检索到),先将TOP1汉字模板为M1与待识别汉字区域RC输入网络,输出汉字区域RC与 TOP1汉字模板M1的相似度,记作S1;之后,再将TOP2字模板为M2与待识别汉字区域RC输入网络,输出汉字区域RC与TOP2汉字模板M2的相似度,记作S2;
孪生网络训练时,正样本为低分辨率车牌和候选汉字模板中同属于一个字的汉字图像组成的图像对,负样本为汉字图像对不是同一个汉字组成的样本对;
6.3)取步骤6.2)计算得到的两个相似度S1和S2,按照下面公式计算,得到结果M*:
6.4)将M*替换待识别的汉字区域RC为车牌汉字的输出结果,其它的字符结果则采用步骤4.2)的结果。
至此,完成对低分辨率车牌的自动识别。
Claims (7)
1.一种汉字结构退化的低分辨率车牌识别方法,其特征在于,按照以下步骤实施:
步骤1、构建VGG16网络,提取整个车牌的深度特征
将待识别的低分辨率车牌进行图像归一化,处理到m×n大小,归一化后的车牌图像记为Plate=[pla(i,j)]m×n,将车牌Plate=[pla(i,j)]m×n输入VGG16网络后,网络输出为N×T大小的车牌特征矩阵,记为F=[f(i,j)]N×T,这个车牌特征矩阵由N个T维行向量构成,即N个T维的车牌特征向量,此外,将这个车牌特征矩阵F=[f(i,j)]N×T的列向量来观察,则是由T个N维列向量构成,即T个N维的字符特征向量构成,对字符的特征提取共计N维;
步骤2、将车牌特征矩阵转换为字符特征序列
将步骤1得到的车牌特征矩阵F=[f(i,j)]N×T的每一个列向量看成是某个字符的特征向量,车牌特征矩阵F=[f(i,j)]N×T表示了T个N维的字符特征构成的字符特征序列,则将车牌特征矩阵F=[f(i,j)]N×T的列向量表示为字符特征序列:X=[x1,x2,...,xT],xt=[f1,t,f2,t,...,fN,t]T,t=1,2,...,T;
步骤3、将字符特征序列X=[x1,x2,...,xT]送入双向深度LSTM网络,
使用双向深度LSTM网络,作为分类器,输出字符特征序列的归属概率矩阵Y=[y1,y2,...,yT],每个yt=[p1,t,p2,t,...,p66,t]T,t=1,2,...,T都是66维的归属概率向量,输出归属概率矩阵Y=[y1,y2,...,yT]是66×T的车牌字符序列的归属概率矩阵;
步骤4、对输出的车牌字符序列的归属概率矩阵进行解码
解码步骤如下:
4.1)取归属概率矩阵Y=[y1,y2,...,yT]中的每个yt=[p1,t,p2,t,...,p66,t]T的最大值对应的字符序号是:yt,max=argmax{[p1,t,p2,t,...,p66,t]T},t=1,2,...,T(1)
则输出的候选序列为:
ymax=[y1,max,y2,max,...,yT,max] (2)
4.2)消除候选序列中的空格和重复字符;
4.3)如果步骤4.2)得到的车牌汉字的归属概率大于0.99,则输出识别结果;
否则,转入步骤5,对车牌中的汉字进一步再识别;
步骤5、对车牌汉字部分进行分割;
步骤6、对车牌汉字进行再识别的确认。
2.根据权利要求1所述的汉字结构退化的低分辨率车牌识别方法,其特征在于:所述的步骤1中,m=32,n=100。
3.根据权利要求1所述的汉字结构退化的低分辨率车牌识别方法,其特征在于:所述的步骤1中,对于目前最多8位的车牌,T=26。
4.根据权利要求1所述的汉字结构退化的低分辨率车牌识别方法,其特征在于:所述的步骤1中,N=512。
5.根据权利要求1所述的汉字结构退化的低分辨率车牌识别方法,其特征在于:所述的步骤3中,66维分别为31个省份的标识汉字、24个字母、10个数字和1个空白,共66类标签。
6.根据权利要求1所述的汉字结构退化的低分辨率车牌识别方法,其特征在于:所述的步骤5中,具体过程如下,
对车牌Plate=[pla(i,j)]32×100进行投影计算:
如果是由7个字符构成的普通车牌,转步骤5.1);如果是由8个字符构成的普通车牌,转步骤5.2);
5.1)对普通车牌进行分割
以分割点处设置垂直的分割线,分割出由汉字和邻近一个字符构成的汉字再识别区域,直接转入步骤6;
5.2)对新能源车牌进行分割
以分割点处设置垂直的分割线,分割出由汉字和邻近一个字符构成的汉字再识别区域,记作RC,转入步骤6。
7.根据权利要求1所述的汉字结构退化的低分辨率车牌识别方法,其特征在于:所述的步骤6中,具体过程如下,
6.1)获取候选的汉字模板
按照步骤4,再次计算得到概率次大的车牌识别结果,将概率最大TOP1和概率次大TOP2的两个车牌识别结果的汉字及相邻的字符,按照车牌国标规定的汉字、字符的字体和大小构造相对应的汉字模板,记TOP1汉字模板为M1,TOP2汉字模板为M2;
6.2)计算汉字区域与汉字模板的相似度
选择一个孪生网络,先将TOP1汉字模板为M1与待识别汉字区域RC输入网络,输出汉字区域RC与TOP1汉字模板M1的相似度,记作S1;之后,再将TOP2字模板为M2与待识别汉字区域RC输入网络,输出汉字区域RC与TOP2汉字模板M2的相似度,记作S2;
孪生网络训练时,正样本为低分辨率车牌和候选汉字模板中同属于一个字的汉字图像组成的图像对,负样本为汉字图像对不是同一个汉字组成的样本对;
6.3)取步骤6.2)计算得到的两个相似度S1和S2,按照下面公式计算,得到结果M*:
6.4)将M*替换待识别的汉字区域RC为车牌汉字的输出结果,其它的字符结果则采用步骤4.2)的结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910204188.4A CN110032999B (zh) | 2019-03-18 | 2019-03-18 | 一种汉字结构退化的低分辨率车牌识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910204188.4A CN110032999B (zh) | 2019-03-18 | 2019-03-18 | 一种汉字结构退化的低分辨率车牌识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110032999A CN110032999A (zh) | 2019-07-19 |
CN110032999B true CN110032999B (zh) | 2023-04-11 |
Family
ID=67236109
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910204188.4A Active CN110032999B (zh) | 2019-03-18 | 2019-03-18 | 一种汉字结构退化的低分辨率车牌识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110032999B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112001386B (zh) * | 2020-08-31 | 2021-06-15 | 重庆紫光华山智安科技有限公司 | 一种基于车牌字符识别方法、系统、介质及终端 |
CN113204974B (zh) * | 2021-05-14 | 2022-06-17 | 清华大学 | 对抗文本的生成方法、装置、设备及存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103106402A (zh) * | 2013-03-07 | 2013-05-15 | 成都威路特软件科技有限公司 | 一种基于重建的车牌汉字识别方法 |
CN107103317A (zh) * | 2017-04-12 | 2017-08-29 | 湖南源信光电科技股份有限公司 | 基于图像融合和盲反卷积的模糊车牌图像识别算法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120275653A1 (en) * | 2011-04-28 | 2012-11-01 | Industrial Technology Research Institute | Method for recognizing license plate image, and related computer program product, computer-readable recording medium, and image recognizing apparatus using the same |
-
2019
- 2019-03-18 CN CN201910204188.4A patent/CN110032999B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103106402A (zh) * | 2013-03-07 | 2013-05-15 | 成都威路特软件科技有限公司 | 一种基于重建的车牌汉字识别方法 |
CN107103317A (zh) * | 2017-04-12 | 2017-08-29 | 湖南源信光电科技股份有限公司 | 基于图像融合和盲反卷积的模糊车牌图像识别算法 |
Non-Patent Citations (1)
Title |
---|
基于统计的车牌字符识别;肖雄等;《数字技术与应用》;20160415(第04期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN110032999A (zh) | 2019-07-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8224092B2 (en) | Word detection method and system | |
US9384423B2 (en) | System and method for OCR output verification | |
CN109784342B (zh) | 一种基于深度学习模型的ocr识别方法及终端 | |
Bai et al. | Keyword spotting in document images through word shape coding | |
CN111598004B (zh) | 一种渐进增强自学习的无监督跨领域行人再识别方法 | |
CN110032999B (zh) | 一种汉字结构退化的低分辨率车牌识别方法 | |
CN111860525A (zh) | 一种适用于端子排的自底向上光学字符识别方法 | |
Roy et al. | Date-field retrieval in scene image and video frames using text enhancement and shape coding | |
Shaw et al. | Offline handwritten Devanagari word recognition: A segmentation based approach | |
Aithal et al. | Text line script identification for a tri-lingual document | |
CN111832497B (zh) | 一种基于几何特征的文本检测后处理方法 | |
Aravinda et al. | Template matching method for Kannada handwritten recognition based on correlation analysis | |
Korichi et al. | Off-line Arabic handwriting recognition system based on ML-LPQ and classifiers combination | |
Ferrer et al. | Multiple training-one test methodology for handwritten word-script identification | |
CN108197663B (zh) | 基于对偶集合多标记学习的书法作品图像分类方法 | |
Sharma et al. | Multi-lingual text recognition from video frames | |
Madhavaraj et al. | Improved recognition of aged Kannada documents by effective segmentation of merged characters | |
Li et al. | Character recognition under severe perspective distortion | |
CN111914847B (zh) | 一种基于模板匹配的ocr识别方法及其系统 | |
Zirari et al. | A methodology to spot words in historical arabic documents | |
CN111738255A (zh) | 一种基于深度学习的路牌文本检测与识别算法 | |
Chen et al. | Chinese license plate recognition based on human vision attention mechanism | |
Choubey et al. | Bilateral Partitioning based character recognition for Vehicle License plate | |
Ghilas et al. | Arabic word spotting based on key-points features | |
CN110991449B (zh) | 一种面向字轮字符的全字半字识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20230223 Address after: 710000 No. B49, Xinda Zhongchuang space, 26th Street, block C, No. 2 Trading Plaza, South China City, international port district, Xi'an, Shaanxi Province Applicant after: Xi'an Huaqi Zhongxin Technology Development Co.,Ltd. Address before: 710048 No. 5 Jinhua South Road, Shaanxi, Xi'an Applicant before: XI'AN University OF TECHNOLOGY |
|
GR01 | Patent grant | ||
GR01 | Patent grant |