CN111461134A - 一种基于生成对抗网络的低分辨率车牌识别方法 - Google Patents
一种基于生成对抗网络的低分辨率车牌识别方法 Download PDFInfo
- Publication number
- CN111461134A CN111461134A CN202010418529.0A CN202010418529A CN111461134A CN 111461134 A CN111461134 A CN 111461134A CN 202010418529 A CN202010418529 A CN 202010418529A CN 111461134 A CN111461134 A CN 111461134A
- Authority
- CN
- China
- Prior art keywords
- image
- license plate
- resolution
- loss
- character image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 38
- 238000012549 training Methods 0.000 claims abstract description 30
- 238000012360 testing method Methods 0.000 claims abstract description 7
- 238000007781 pre-processing Methods 0.000 claims abstract description 5
- 230000000694 effects Effects 0.000 claims abstract description 4
- 230000006870 function Effects 0.000 claims description 36
- 238000010586 diagram Methods 0.000 claims description 15
- 238000005070 sampling Methods 0.000 claims description 12
- 230000011218 segmentation Effects 0.000 claims description 11
- 238000013461 design Methods 0.000 claims description 10
- 238000010606 normalization Methods 0.000 claims description 7
- 230000004913 activation Effects 0.000 claims description 6
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 5
- 238000009826 distribution Methods 0.000 claims description 5
- 238000012544 monitoring process Methods 0.000 claims description 5
- 239000004576 sand Substances 0.000 claims description 4
- 238000011176 pooling Methods 0.000 claims description 3
- 238000005457 optimization Methods 0.000 abstract 1
- 238000013527 convolutional neural network Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4053—Scaling of whole images or parts thereof, e.g. expanding or contracting based on super-resolution, i.e. the output image resolution being higher than the sensor resolution
- G06T3/4076—Scaling of whole images or parts thereof, e.g. expanding or contracting based on super-resolution, i.e. the output image resolution being higher than the sensor resolution using the original low-resolution images to iteratively correct the high-resolution images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/62—Text, e.g. of license plates, overlay texts or captions on TV images
- G06V20/625—License plates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Probability & Statistics with Applications (AREA)
- Multimedia (AREA)
- Character Discrimination (AREA)
- Image Analysis (AREA)
Abstract
本发明提供了一种基于生成对抗网络的低分辨率车牌识别方法,包括以下步骤:1)构建图像增强模块:根据输入的低分辨率的车牌字符图像集进行训练,训练得到能生成更逼近真实图像的高分辨率车牌字符的图像生成模型;2)构建图像识别模块:利用生成的高分辨率车牌字符图像和真实的车牌字符图像进行训练,通过迭代优化损失,从而提高判别模型对输入图像的真假判别能力和识别效果;3)整体框架训练:包括数据预处理、模型框架训练及测试三个阶段。本发明方法实现了端到端的低分辨率车牌自动识别,能够有效提高低分辨率车牌的辨识度和识别精度。
Description
技术领域
本发明属于车牌识别技术领域,具体涉及一种基于生成对抗网络的低分辨率车牌识别方法。
背景技术
近年来,车牌识别在公路卡口、停车场、收费站等场合的应用取得了显著的成功。然而,在监控应用中,感兴趣的对象往往远离摄像机,导致车牌区域分辨率很低、质量很差,甚至无法通过肉眼直接观测。在这种图像信息内容有限的条件下,传统的车牌识别方法的性能急剧下降,导致低分辨率车牌识别成为一个难点问题。
为解决低分辨率车牌信息有限难以识别的问题,目前主要的技术思路是利用现有的超分辨率技术对低分辨率图像进行重建,以获得可辨识度提高的车牌图像。如文献1:Chao Dong,Chen Change Loy,Kaiming He,and Xiaoou Tang,“Learning a deepconvolutional network for image super-resolution,”in European Conference onComputer Vision.Springer,2014,pp.184–199.首次提出了使用CNN结构的超分辨率网络SRCNN,该方法直接学习LR和HR图像之间的端到端映射。文献2:Lim,Bee et al.“EnhancedDeep Residual Networks for Single Image Super-Resolution.”2017IEEE Conferenceon Computer Vision and Pattern Recognition Workshops(CVPRW)(2017):1132-1140.提出了一种称为EDSR的高精度单图像超分辨率方法,该方法学习残差,去除了SRResNet多余的模块,从而可以扩大模型的尺寸来提升结果质量。文献3:Christian Ledig,LucasTheis,Ferenc Husz′ar,Jose Caballero,Andrew Cunningham,Alejandro Acosta,AndrewAitken,Alykhan Tejani,Johannes Totz,Zehan Wang,et al.,“Photo-realistic singleimage super-resolution using a generative adversarial network,”arXiv preprintarXiv:1609.04802,2016.提出了一种用于图像超分辨率的生成对抗网络(SRGAN),利用感知损失和对抗损失来提升SR图像的真实感。
虽然这些超分辨率方法可以生成高视觉质量的图像,但由于超分辨率问题的病态性,其生成的细节和原图像有很大的不同,无法为后续的识别任务提供足够有用的特征信息。
发明内容
发明目的:本发明所要解决的技术问题是针对现有技术的不足,提供一种基于生成对抗网络(Generative Aderversarial Networks,GAN)的低分辨率车牌识别方法,包括如下步骤:
步骤1,构建图像增强模块:搭建图像生成网络,将低分辨率的车牌字符图像输入到模型中,通过迭代优化图像增强模块的损失函数来使图像增强模块生成高分辨率车牌字符图像;
步骤2,构建图像识别模块:搭建图像判别网络,利用步骤1生成的高分辨率车牌字符图像和真实图像一起输入到模型中,通过迭代优化图像识别模块的损失函数以提高图像判别网络真假判别能力和识别效果;
步骤3,整体框架训练:通过分割高分辨率车牌字符图像得到原始的字符图像集,经过下采样得到低分辨率字符图像集,基于GAN对抗学习的思想交替训练图像增强模块和图像识别模块,利用训练好的图像生成和判别模型实现低分辨率车牌的增强识别。
步骤1包括以下步骤:
步骤1-1,构建图像生成网络模型G;
步骤1-2,设计图像增强模块的损失函数LG;
步骤1-1中,所述图像生成网络G包含五个残差块,每个残差块中包含两个3×3的卷积层,卷积层后连接批规范化层,选取PReLU作为激活函数,再连接两个亚像素卷积层用来增大特征尺寸,亚像素卷积层即上采样网络层。
其中r表示采样因子,x、y分别表示图像像素点的横、纵坐标,(IHR)x,y表示真实的高分辨率车牌字符图像的各个像素点,表示生成网络合成的高分辨率车牌字符图像的各个像素点,W和H分别表示图像IHR的宽度和高度,表示图像IHR和逐像素求差的平方和。
所述的VGG特征损失以文献Simonyan K,Zisserman A.Very deep convolutionalnetworks for large-scale image recognition[J].arXiv preprint arXiv:1409.1556,2014中预训练19层的VGG网络为基础,求生成的高分辨率车牌字符图像与低分辨率的车牌字符图像特征之间的欧式距离,在已经训练好的VGG网络上提取一层的特征图,将生成的高分辨率车牌字符图像当前层的特征图和低分辨率的车牌字符图像所对应的特征图进行比较:
其中表示真实高分辨率车牌字符图像IHR和生成的高分辨率车牌字符的VGG特征图之间的欧式距离;Wi,j和Hi,j分别表示VGG网络内各个特征图的宽度和高度;φi,j对应VGG网络中第i个最大池化层之前的第j个卷积获得的特征图。
所述的分类损失LC用来使预测的字符类别更准确:
步骤2包括如下步骤:
步骤2-1,构建图像判别网络模型D;
步骤2-2,设计图像识别模块的损失函数LD;
步骤2-1中所述的图像判别网络模型D包含两个卷积层,每个卷积层之后都连接批规范化层和LeakyReLU激活函数,最终通过两个预测分支:其一分支将输出值通过Sigmoid函数映射到[0,1],从而得到该模块的输入样本是否来自真实车牌字符图像IHR,如果是,输出为1,否则为0;另一分支将输出值通过Softmax函数映射到Nt维,从而得到该模块的输入样本的分类标签,其中Nt为样本总类别数。
步骤2-2中所述的图像识别模块的损失函数LD包括两部分:判别损失LS和分类损失LC,计算公式如下:
LD=LS+LC,
其中,所述判别损失LS用来使判别器区分真假数据,所述分类损失LC用来区分正确的样本类别;
所述判别损失LS表示判别器区分真假数据的能力:
所述的分类损失LC用来使图像识别模块预测的字符类别更准确:
步骤3包括如下步骤:
步骤3-1,数据预处理:对监控场景下获取的整张车牌图像集进行字符分割,去除汉字部分,得到真实的高分辨率字符图像集HR;通过下采样,得到低分辨率字符图像集LR;
步骤3-2,模型框架训练:基于GAN的对抗学习思想交替训练图像增强和识别两个模块,直到图像判别网络D无法区分输入图像的真假且能正确分类或满足迭代终止条件,则完成训练;
步骤3-3,模型框架测试:输入用于测试的低分辨率车牌,经过训练好的图像生成模型G后得到高分辨率车牌字符图像,再由图像判别模型D直接输出车牌识别结果,从而实现低分辨率车牌的增强识别。
步骤3-1包括如下步骤:
步骤3-1-1,对监控场景下获取的整张车牌图像进行垂直投影后计算峰值出现的次数:如果出现次数等于次数阈值7,则计算各峰的峰宽比,峰宽比符合条件的则利用垂直投影法进行字符分割;如果出现次数不等于阈值7,则利用模板匹配进行字符分割,去除汉字部分;
步骤3-1-2,去除汉字部分后,将分割后的高分辨率车牌字符图像归一化,处理到m×n大小,m和n分别表示图像的高度和宽度,归一化后的高分辨车牌字符图像集记为HR;
步骤3-1-3,通过k倍双三次下采样,将高分辨率车牌字符图像集HR降为分辨率大小为(m/k,n/k)的低分辨率车牌字符图像集LR;
步骤3-2包括如下步骤:
步骤3-2-1,利用步骤3-1得到的低分辨率车牌字符图像集LR作为图像增强模块的输入,经过堆叠的卷积层和上采样网络层后,即图像生成网络G,得到特征增强后的高分辨率车牌字符图像集,记为SR;
步骤3-2-2,将真实车牌字符图像集HR和生成的高分辨率车牌字符图像集SR送入图像识别模块,输出两个分支,其中一个分支输出Nt维的目标类别,Nt为字符样本类别数目;另一个分支输出1维的向量,用于判别是否为真实样本;
步骤3-1-2中,m=48,n=24。
步骤3-1-3中,k=4,6,8。
所述的字符样本类别数Nt=34,包括除字母I、O外的24类字母和10类数字。
本发明公开的方法基于GAN对抗学习的思想,联合训练图像增强模块和图像识别模块,即将两个独立的过程统一在一个端到端的框架中,使二者在不断的博弈中相互增强。此外,利用分类损失指导图像超分辨网络更关注于生成对识别有益的特征信息。
有益效果:本发明具有以下优点:首先,本发明建立了基于GAN的端到端的神经网络结构,通过对抗训练图像增强网络和识别网络,提高了车牌在低分辨率情况下的识别精度;其次,本发明通过引入分类损失指导图像增强网络,可以更多地生成与识别相关的特征信息,从而提高了低分辨率车牌的辨识度和识别效果。
附图说明
下面结合附图和具体实施方式对本发明做更进一步的具体说明,本发明的上述和/或其他方面的优点将会变得更加清楚。
图1是本发明的处理流程示意图。
图2a是高分辨率车牌字符图像集示例。
图2b是对应的低分辨率车牌图像集示例。
图2c是低分辨率车牌字符分割后的结果示例。
图2d是图像增强及其识别结果示例。
具体实施方式
本发明公开的一种基于生成对抗网络的低分辨率车牌识别方法,具体按照以下步骤实施(图1是整个方法的流程图):
1、构建图像增强模块
输入:低分辨率车牌字符图像。
输出:生成的高分辨率车牌字符图像。
1.1构建图像生成网络模型G
图像生成网络部分包含多个残差块,每个残差块中包含两个3×3的卷积层,卷积层后连接批规范化层,选取PReLU作为激活函数,再连接两个亚像素卷积层用来增大特征尺寸,即上采样网络层。
1.2设计图像增强模块的损失函数LG
其中r表示采样因子,x、y分别表示图像像素点的横、纵坐标,(IHR)x,y表示真实的高分辨率车牌字符图像的各个像素点,表示生成网络合成的高分辨率车牌字符图像的各个像素点,W和H分别表示图像IHR的宽度和高度,表示图像IHR和逐像素求差的平方和。
所述的VGG特征损失以预训练19层的VGG网络为基础,求生成图像与原图像特征之间的欧式距离,在已经训练好的VGG上提取某一层的特征图,将生成图像当前层的特征图和原图像所对应的特征图进行比较:
其中表示真实高分辨率车牌字符图像IHR和生成的高分辨率车牌字符的VGG特征图之间的欧式距离;Wi,j和Hi,j分别表示VGG网络内各个特征图的宽度和高度;φi,j对应VGG网络中第i个最大池化层之前的第j个卷积获得的特征图。该损失函数能反映更高感知层次上的误差,而均方误差损失项只能反映低层次的像素点间的误差,因此VGG损失项又称为感知损失项。
步骤3设计分类损失LC,用来使预测的字符类别更准确:
1.3生成高分辨率字符图像,并迭代优化损失LG以更新模型参数θG
将低分辨率字符图像向量化处理,除以255.0使得灰度归一化到[0,1]区间,然后输入到图像生成网络G中,以分辨率大小为8×4为例,经过一层卷积核大小为9,填充为4的CNN网络层和5个残差块后,再通过大小分别为2、3的上采样网络层,最终得到特征增强后的高分辨率车牌字符图像,其大小与原高分辨率图像大小相同,均为48×24,同时反馈损失LG并更新模型参数θG。
2、构建图像识别模块
输入:生成的高分辨率车牌字符图像
输出:真假判断及识别结果
2.1构建图像判别网络模型D
图像判别网络部分包含两个卷积层,每个卷积层之后都连接批规范化层和LeakyReLU激活函数,以及两个预测分支,分别用于判断该样本是否来自原始图像IHR以及所属类别c。
2.2设计图像识别模块的损失函数LD
该模块的损失函数目标是使图像判别网络能尽可能区分真假数据且正确分类字符,包括两部分:判别损失LS和分类损失LC,计算公式如下:
LD=LS+LC (6)
其中,所述判别损失LS用来使判别器尽可能区分真假数据,所述分类损失LC用来区分正确的样本类别。
步骤1设计判别损失LS,用于提高判别器区分真假数据的能力:
步骤2设计分类损失LC,用来使识别模块预测的字符类别更准确:
其中P(C=c|IHR)表示HR样本中某样本C分类正确的概率,P(C=c|ISR)表示SR样本中某样本C分类正确的概率。
2.3判别输入的真假及所属类别,并迭代优化损失以更新模型参数θD
将生成的高分辨率字符图像输入到判别网络D中,输入的图像分辨率为48×12.首先经过两层卷积核大小为4,步长为2,填充为1的CNN网络层,提取的特征图大小为128×12×6;再将提取的特征图送入两个预测分支,其中判别分支将输出值通过Sigmoid函数映射到[0,1],从而得到该样本是否来自真实图像,若属于为1,否则为另一分类分支将输出值通过softmax函数映射到34维,从而得到该样本的分类标签c。同时反馈损失LD并更新模型参数θD。
3、整体框架训练
基于GAN的对抗学习思想交替训练图像增强和识别两个模块,包括数据预处理、模型框架训练及测试阶段。
3.1数据预处理
通过对监控场景下获取的整张车牌图像集进行字符分割、下采样处理,去除汉字部分,获得可用于训练模型的高分辨率和低分辨率字符图像对。
输入:整张车牌图像集。
输出:低分辨率车牌字符图像集
步骤1先将输入的车牌图像二值化,并去除车牌的边框、铆钉等。进行垂直投影后计算峰值出现的次数:如果出现次数等于次数阈值7,则计算各峰的峰宽比,如果峰宽比符合条件则利用字符区域在垂直方向上的白色像素较多,而字符间白色像素较少的特性,通过检测垂直方向上的白色像素的数量来确定字符的边界,从而进行分割操作;如果出现次数不等于阈值7,则继续步骤2;
步骤2利用模板匹配进行字符分割,要先确定车牌区域的上下边界,并设置一个字符大小的窗口,从车牌区域的左侧向右滑动,找到白色像素的最大差值,将字符分割出来。
步骤3将分割后得到的高分辨率车牌字符图像归一化,处理到48×24大小,归一化后的高分辨车牌字符图像集记为HR;
步骤4通过4,6,8倍双三次下采样高分辨率车牌字符图像集HR,可得到分辨率大小为12×6、8×4和6×3的低分辨率车牌字符图像集LR。
3.2模型框架训练
输入:低分辨率字符图像集LR及对应的高分辨率字符图像集HR
输出:真假判别及分类结果
步骤1将低分辨率字符图像集LR输入图像增强模块中,经过堆叠的卷积网络层和上采样网络层后,得到特征增强后的高分辨率车牌字符图像集SR,计算该模块损失函数LG;
步骤2将高分辨率字符图像集HR和生成的高分辨率车牌字符图像集SR送入图像识别模块,通过图像判别网络判断输入是否为真实样本及其类别信息,计算该模块损失函数LD;
步骤3根据整体模型框架的优化目标函数,联合训练图像增强和识别模块,交替更新生成网络G和判别网络D的参数θG、θD,其目标是使图像生成网络能生成更逼近真实图像的数据且判别网络能尽可能判断真假数据和正确分类:
训练模型时,将所有损失的权衡权值设为1,并使用带有动量项0.9的Adam优化器。对生成网络G和鉴别网络D进行从无到有的训练,每一层的权值初始化为零均值高斯分布,标准差为0.02,偏差初始化为0。该模型采用64例批量训练,迭代100次。初始学习速率设置为0.0002。
训练模型时,将所有损失的权衡权值设为1,并使用带有动量项0.9的Adam优化器。对生成网络G和鉴别网络D进行从无到有的训练,每一层的权值初始化为零均值高斯分布,标准差为0.02,偏差初始化为0。该模型采用64例批量训练,迭代100次。初始学习速率设置为0.0002。
3.3模型框架测试
输入:低分辨率的字符图像
输出:识别结果
步骤1将输入的低分辨率字符图像送入图像增强模块中,利用训练好的生成网络模型可以得到特征增强后的高分辨率车牌字符图像;
步骤2将步骤1得到的高分辨率字符图像送入图像识别模块中,利用训练好的判别网络模型识别其类别。
本发明中,如图2a所示为高分辨率车牌集示例,通过本发明所述的基于GAN的低分辨率识别方法,可对图2b中相应的低分辨率车牌图像进行分割,如图2c,并得到图像增强后的图2d及识别结果。
本发明提供了一种基于生成对抗网络的低分辨率车牌识别方法,具体实现该技术方案的方法和途径很多,以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。本实施例中未明确的各组成部分均可用现有技术加以实现。
Claims (10)
1.一种基于生成对抗网络的低分辨率车牌识别方法,其特征在于,包括如下步骤:
步骤1,构建图像增强模块:搭建图像生成网络,将低分辨率的车牌字符图像输入到模型中,通过迭代优化图像增强模块的损失函数来使图像增强模块生成高分辨率车牌字符图像;
步骤2,构建图像识别模块:搭建图像判别网络,利用步骤1生成的高分辨率车牌字符图像和真实图像一起输入到模型中,通过迭代优化图像识别模块的损失函数以提高图像判别网络真假判别能力和识别效果;
步骤3,整体框架训练:通过分割高分辨率车牌字符图像得到原始的字符图像集,经过下采样得到低分辨率字符图像集,基于GAN对抗学习的思想交替训练图像增强模块和图像识别模块,利用训练好的图像生成和判别模型实现低分辨率车牌的增强识别。
3.根据权利要求2所述的方法,其特征在于,步骤1-1中,所述图像生成网络G包含五个残差块,每个残差块中包含两个3×3的卷积层,卷积层后连接批规范化层,选取PReLU作为激活函数,再连接两个亚像素卷积层用来增大特征尺寸,亚像素卷积层即上采样网络层。
其中r表示采样因子,x、y分别表示图像像素点的横、纵坐标,(IHR)x,y表示真实的高分辨率车牌字符图像的各个像素点,表示生成网络合成的高分辨率车牌字符图像的各个像素点,W和H分别表示图像IHR的宽度和高度;
所述的VGG特征损失以预训练19层的VGG网络为基础,求生成的高分辨率车牌字符图像与低分辨率的车牌字符图像特征之间的欧式距离,在已经训练好的VGG网络上提取一层的特征图,将生成的高分辨率车牌字符图像当前层的特征图和低分辨率的车牌字符图像所对应的特征图进行比较:
其中表示真实高分辨率车牌字符图像IHR和生成的高分辨率车牌字符的VGG特征图之间的欧式距离;Wi,j和Hi,j分别表示VGG网络内各个特征图的宽度和高度;φi,j对应VGG网络中第i个最大池化层之前的第j个卷积获得的特征图;
所述的分类损失LC用来使预测的字符类别更准确:
7.根据权利要求6所述的方法,其特征在于,步骤2-1中所述的图像判别网络模型D包含两个卷积层,每个卷积层之后都连接批规范化层和LeakyReLU激活函数,最终通过两个预测分支:其一分支将输出值通过Sigmoid函数映射到[0,1],从而得到图像识别模块的输入样本是否来自真实车牌字符图像IHR,如果是,输出为1,否则为0;另一分支将输出值通过Softmax函数映射到Nt维,从而得到图像识别模块的输入样本的分类标签,其中Nt为样本总类别数。
9.根据权利要求8所述的方法,其特征在于,步骤3包括如下步骤:
步骤3-1,数据预处理:对监控场景下获取的整张车牌图像集进行字符分割,去除汉字部分,得到真实的高分辨率字符图像集HR;通过下采样,得到低分辨率字符图像集LR;
步骤3-2,模型框架训练:基于GAN的对抗学习思想交替训练图像增强和识别两个模块,直到图像判别网络D无法区分输入图像的真假且能正确分类或满足迭代终止条件,则完成训练;
步骤3-3,模型框架测试:输入用于测试的低分辨率车牌,经过训练好的图像生成模型G后得到高分辨率车牌字符图像,再由图像判别模型D直接输出车牌识别结果,从而实现低分辨率车牌的增强识别。
10.根据权利要求9所述的方法,其特征在于,步骤3-1包括如下步骤:
步骤3-1-1,对监控场景下获取的整张车牌图像进行垂直投影后计算峰值出现的次数:如果出现次数等于次数阈值,则计算各峰的峰宽比,峰宽比符合条件的则利用垂直投影法进行字符分割;如果出现次数不等于阈值,则利用模板匹配进行字符分割,去除汉字部分;
步骤3-1-2,去除汉字部分后,将分割后的高分辨率车牌字符图像归一化,处理到m×n大小,m和n分别表示图像的高度和宽度,归一化后的高分辨车牌字符图像集记为HR;
步骤3-1-3,通过k倍双三次下采样,将高分辨率车牌字符图像集HR降为分辨率大小为(m/k,n/k)的低分辨率车牌字符图像集LR;
步骤3-2包括如下步骤:
步骤3-2-1,利用步骤3-1得到的低分辨率车牌字符图像集LR作为图像增强模块的输入,经过堆叠的卷积层和上采样网络层后,即图像生成网络G,得到特征增强后的高分辨率车牌字符图像集,记为SR;
步骤3-2-2,将真实车牌字符图像集HR和生成的高分辨率车牌字符图像集SR送入图像识别模块,输出两个分支,其中一个分支输出Nt维的目标类别,Nt为字符样本类别数目;另一个分支输出1维的向量,用于判别是否为真实样本;
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010418529.0A CN111461134B (zh) | 2020-05-18 | 2020-05-18 | 一种基于生成对抗网络的低分辨率车牌识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010418529.0A CN111461134B (zh) | 2020-05-18 | 2020-05-18 | 一种基于生成对抗网络的低分辨率车牌识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111461134A true CN111461134A (zh) | 2020-07-28 |
CN111461134B CN111461134B (zh) | 2023-04-07 |
Family
ID=71684773
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010418529.0A Active CN111461134B (zh) | 2020-05-18 | 2020-05-18 | 一种基于生成对抗网络的低分辨率车牌识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111461134B (zh) |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111915490A (zh) * | 2020-08-14 | 2020-11-10 | 深圳清研智城科技有限公司 | 一种基于多尺度特征的车牌图像超分辨率重建模型及方法 |
CN112132181A (zh) * | 2020-08-20 | 2020-12-25 | 黑龙江大学 | 一种基于生成式对抗网络的图像真伪识别方法 |
CN112215119A (zh) * | 2020-10-08 | 2021-01-12 | 华中科技大学 | 一种基于超分辨率重建的小目标识别方法、装置及介质 |
CN112288737A (zh) * | 2020-11-18 | 2021-01-29 | 中国人民解放军国防科技大学 | 一种基于超分辨率图像的舷号检测方法 |
CN112784857A (zh) * | 2021-01-29 | 2021-05-11 | 北京三快在线科技有限公司 | 一种模型训练以及图像处理方法及装置 |
CN112906699A (zh) * | 2020-12-23 | 2021-06-04 | 深圳市信义科技有限公司 | 一种车牌放大号的检测识别方法 |
CN112966792A (zh) * | 2021-05-19 | 2021-06-15 | 腾讯科技(深圳)有限公司 | 血管图像分类处理方法、装置、设备及存储介质 |
CN113139906A (zh) * | 2021-05-13 | 2021-07-20 | 平安国际智慧城市科技股份有限公司 | 一种生成器的训练方法、装置与存储介质 |
CN113344110A (zh) * | 2021-06-26 | 2021-09-03 | 浙江理工大学 | 一种基于超分辨率重建的模糊图像分类方法 |
CN113591798A (zh) * | 2021-08-23 | 2021-11-02 | 京东科技控股股份有限公司 | 文档文字的重建方法及装置、电子设备、计算机存储介质 |
CN113743218A (zh) * | 2021-08-03 | 2021-12-03 | 科大讯飞股份有限公司 | 一种车牌识别方法、车牌识别装置和计算机可读存储介质 |
CN113837179A (zh) * | 2021-09-16 | 2021-12-24 | 南京航空航天大学 | 一种处理图像的多判别gan网络构建方法、装置、系统和存储介质 |
CN114092926A (zh) * | 2021-10-20 | 2022-02-25 | 杭州电子科技大学 | 一种复杂环境下的车牌定位和识别方法 |
CN115063876A (zh) * | 2022-08-17 | 2022-09-16 | 季华实验室 | 一种图像识别率提升方法、装置、电子设备和存储介质 |
CN115546780A (zh) * | 2022-11-29 | 2022-12-30 | 城云科技(中国)有限公司 | 车牌识别方法、模型及装置 |
CN116485652A (zh) * | 2023-04-26 | 2023-07-25 | 北京卫星信息工程研究所 | 遥感影像车辆目标检测的超分辨率重建方法 |
CN113743218B (zh) * | 2021-08-03 | 2024-05-31 | 科大讯飞股份有限公司 | 一种车牌识别方法、车牌识别装置和计算机可读存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108596267A (zh) * | 2018-05-03 | 2018-09-28 | Oppo广东移动通信有限公司 | 一种图像重建方法、终端设备及计算机可读存储介质 |
CN109509152A (zh) * | 2018-12-29 | 2019-03-22 | 大连海事大学 | 一种基于特征融合的生成对抗网络的图像超分辨率重建方法 |
CN109615582A (zh) * | 2018-11-30 | 2019-04-12 | 北京工业大学 | 一种基于属性描述生成对抗网络的人脸图像超分辨率重建方法 |
CN110136063A (zh) * | 2019-05-13 | 2019-08-16 | 南京信息工程大学 | 一种基于条件生成对抗网络的单幅图像超分辨率重建方法 |
CN110211045A (zh) * | 2019-05-29 | 2019-09-06 | 电子科技大学 | 基于srgan网络的超分辨率人脸图像重建方法 |
CN111127316A (zh) * | 2019-10-29 | 2020-05-08 | 山东大学 | 一种基于sngan网络的单幅人脸图像超分辨方法及系统 |
-
2020
- 2020-05-18 CN CN202010418529.0A patent/CN111461134B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108596267A (zh) * | 2018-05-03 | 2018-09-28 | Oppo广东移动通信有限公司 | 一种图像重建方法、终端设备及计算机可读存储介质 |
CN109615582A (zh) * | 2018-11-30 | 2019-04-12 | 北京工业大学 | 一种基于属性描述生成对抗网络的人脸图像超分辨率重建方法 |
CN109509152A (zh) * | 2018-12-29 | 2019-03-22 | 大连海事大学 | 一种基于特征融合的生成对抗网络的图像超分辨率重建方法 |
CN110136063A (zh) * | 2019-05-13 | 2019-08-16 | 南京信息工程大学 | 一种基于条件生成对抗网络的单幅图像超分辨率重建方法 |
CN110211045A (zh) * | 2019-05-29 | 2019-09-06 | 电子科技大学 | 基于srgan网络的超分辨率人脸图像重建方法 |
CN111127316A (zh) * | 2019-10-29 | 2020-05-08 | 山东大学 | 一种基于sngan网络的单幅人脸图像超分辨方法及系统 |
Non-Patent Citations (3)
Title |
---|
巨春武: "《基于生成对抗网络的图像复原算法研究》" * |
王延年等: "《基于生成对抗网络的单帧图像超分辨算法》" * |
邵保泰等: "《基于生成对抗网络的单帧红外图像超分辨算法》" * |
Cited By (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111915490A (zh) * | 2020-08-14 | 2020-11-10 | 深圳清研智城科技有限公司 | 一种基于多尺度特征的车牌图像超分辨率重建模型及方法 |
CN112132181A (zh) * | 2020-08-20 | 2020-12-25 | 黑龙江大学 | 一种基于生成式对抗网络的图像真伪识别方法 |
CN112132181B (zh) * | 2020-08-20 | 2023-05-05 | 黑龙江大学 | 一种基于生成式对抗网络的图像真伪识别方法 |
CN112215119A (zh) * | 2020-10-08 | 2021-01-12 | 华中科技大学 | 一种基于超分辨率重建的小目标识别方法、装置及介质 |
CN112288737A (zh) * | 2020-11-18 | 2021-01-29 | 中国人民解放军国防科技大学 | 一种基于超分辨率图像的舷号检测方法 |
CN112906699A (zh) * | 2020-12-23 | 2021-06-04 | 深圳市信义科技有限公司 | 一种车牌放大号的检测识别方法 |
CN112784857A (zh) * | 2021-01-29 | 2021-05-11 | 北京三快在线科技有限公司 | 一种模型训练以及图像处理方法及装置 |
CN113139906A (zh) * | 2021-05-13 | 2021-07-20 | 平安国际智慧城市科技股份有限公司 | 一种生成器的训练方法、装置与存储介质 |
CN113139906B (zh) * | 2021-05-13 | 2023-11-24 | 平安国际智慧城市科技股份有限公司 | 一种生成器的训练方法、装置与存储介质 |
CN112966792B (zh) * | 2021-05-19 | 2021-08-13 | 腾讯科技(深圳)有限公司 | 血管图像分类处理方法、装置、设备及存储介质 |
CN112966792A (zh) * | 2021-05-19 | 2021-06-15 | 腾讯科技(深圳)有限公司 | 血管图像分类处理方法、装置、设备及存储介质 |
WO2022242392A1 (zh) * | 2021-05-19 | 2022-11-24 | 腾讯科技(深圳)有限公司 | 血管图像分类处理方法、装置、设备及存储介质 |
CN113344110A (zh) * | 2021-06-26 | 2021-09-03 | 浙江理工大学 | 一种基于超分辨率重建的模糊图像分类方法 |
CN113344110B (zh) * | 2021-06-26 | 2024-04-05 | 浙江理工大学 | 一种基于超分辨率重建的模糊图像分类方法 |
CN113743218A (zh) * | 2021-08-03 | 2021-12-03 | 科大讯飞股份有限公司 | 一种车牌识别方法、车牌识别装置和计算机可读存储介质 |
CN113743218B (zh) * | 2021-08-03 | 2024-05-31 | 科大讯飞股份有限公司 | 一种车牌识别方法、车牌识别装置和计算机可读存储介质 |
CN113591798A (zh) * | 2021-08-23 | 2021-11-02 | 京东科技控股股份有限公司 | 文档文字的重建方法及装置、电子设备、计算机存储介质 |
CN113591798B (zh) * | 2021-08-23 | 2023-11-03 | 京东科技控股股份有限公司 | 文档文字的重建方法及装置、电子设备、计算机存储介质 |
CN113837179A (zh) * | 2021-09-16 | 2021-12-24 | 南京航空航天大学 | 一种处理图像的多判别gan网络构建方法、装置、系统和存储介质 |
CN114092926A (zh) * | 2021-10-20 | 2022-02-25 | 杭州电子科技大学 | 一种复杂环境下的车牌定位和识别方法 |
CN115063876B (zh) * | 2022-08-17 | 2022-11-18 | 季华实验室 | 一种图像识别率提升方法、装置、电子设备和存储介质 |
CN115063876A (zh) * | 2022-08-17 | 2022-09-16 | 季华实验室 | 一种图像识别率提升方法、装置、电子设备和存储介质 |
CN115546780B (zh) * | 2022-11-29 | 2023-04-18 | 城云科技(中国)有限公司 | 车牌识别方法、模型及装置 |
CN115546780A (zh) * | 2022-11-29 | 2022-12-30 | 城云科技(中国)有限公司 | 车牌识别方法、模型及装置 |
CN116485652A (zh) * | 2023-04-26 | 2023-07-25 | 北京卫星信息工程研究所 | 遥感影像车辆目标检测的超分辨率重建方法 |
CN116485652B (zh) * | 2023-04-26 | 2024-03-01 | 北京卫星信息工程研究所 | 遥感影像车辆目标检测的超分辨率重建方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111461134B (zh) | 2023-04-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111461134B (zh) | 一种基于生成对抗网络的低分辨率车牌识别方法 | |
CN108961235B (zh) | 一种基于YOLOv3网络和粒子滤波算法的缺陷绝缘子识别方法 | |
CN108830188B (zh) | 基于深度学习的车辆检测方法 | |
CN111368886B (zh) | 一种基于样本筛选的无标注车辆图片分类方法 | |
CN111259930A (zh) | 自适应注意力指导机制的一般性目标检测方法 | |
CN111814584A (zh) | 基于多中心度量损失的多视角环境下车辆重识别方法 | |
CN107194418B (zh) | 一种基于对抗特征学习的水稻蚜虫检测方法 | |
CN111950453A (zh) | 一种基于选择性注意力机制的任意形状文本识别方法 | |
CN111986142A (zh) | 一种热轧板卷表面缺陷图像数据无监督增强的方法 | |
CN111738055A (zh) | 多类别文本检测系统和基于该系统的票据表单检测方法 | |
CN112800876A (zh) | 一种用于重识别的超球面特征嵌入方法及系统 | |
CN108681735A (zh) | 基于卷积神经网络深度学习模型的光学字符识别方法 | |
CN111539330B (zh) | 一种基于双svm多分类器的变电站数显仪表识别方法 | |
CN108108760A (zh) | 一种快速人脸识别方法 | |
CN113688821B (zh) | 一种基于深度学习的ocr文字识别方法 | |
CN115439458A (zh) | 基于深度图注意力的工业图像缺陷目标检测算法 | |
CN110852358A (zh) | 一种基于深度学习的车辆类型判别方法 | |
CN112541491A (zh) | 基于图像字符区域感知的端到端文本检测及识别方法 | |
CN113159215A (zh) | 一种基于Faster Rcnn的小目标检测识别方法 | |
CN111242046A (zh) | 一种基于图像检索的地面交通标志识别方法 | |
CN111368775A (zh) | 一种基于局部上下文感知的复杂场景密集目标检测方法 | |
CN113052215A (zh) | 基于神经网络可视化的声呐图像自动目标识别方法 | |
CN110188646B (zh) | 基于梯度方向直方图与局部二值模式融合的人耳识别方法 | |
CN115082922A (zh) | 基于深度学习的水表数字图片处理方法及系统 | |
CN113920364A (zh) | 基于注意力机制及检测变换器的宫颈细胞检测与识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |