CN111461134A

CN111461134A - 一种基于生成对抗网络的低分辨率车牌识别方法

Info

Publication number: CN111461134A
Application number: CN202010418529.0A
Authority: CN
Inventors: 孙正兴; 余佩雯; 张胜; 朱毅欢
Original assignee: Nanjing University
Current assignee: Nanjing University
Priority date: 2020-05-18
Filing date: 2020-05-18
Publication date: 2020-07-28
Anticipated expiration: 2040-05-18
Also published as: CN111461134B

Abstract

本发明提供了一种基于生成对抗网络的低分辨率车牌识别方法，包括以下步骤：1)构建图像增强模块：根据输入的低分辨率的车牌字符图像集进行训练，训练得到能生成更逼近真实图像的高分辨率车牌字符的图像生成模型；2)构建图像识别模块：利用生成的高分辨率车牌字符图像和真实的车牌字符图像进行训练，通过迭代优化损失，从而提高判别模型对输入图像的真假判别能力和识别效果；3)整体框架训练：包括数据预处理、模型框架训练及测试三个阶段。本发明方法实现了端到端的低分辨率车牌自动识别，能够有效提高低分辨率车牌的辨识度和识别精度。

Description

一种基于生成对抗网络的低分辨率车牌识别方法

技术领域

本发明属于车牌识别技术领域，具体涉及一种基于生成对抗网络的低分辨率车牌识别方法。

背景技术

近年来，车牌识别在公路卡口、停车场、收费站等场合的应用取得了显著的成功。然而，在监控应用中，感兴趣的对象往往远离摄像机，导致车牌区域分辨率很低、质量很差，甚至无法通过肉眼直接观测。在这种图像信息内容有限的条件下，传统的车牌识别方法的性能急剧下降，导致低分辨率车牌识别成为一个难点问题。

为解决低分辨率车牌信息有限难以识别的问题，目前主要的技术思路是利用现有的超分辨率技术对低分辨率图像进行重建，以获得可辨识度提高的车牌图像。如文献1：Chao Dong,Chen Change Loy,Kaiming He,and Xiaoou Tang,“Learning a deepconvolutional network for image super-resolution,”in European Conference onComputer Vision.Springer,2014,pp.184–199.首次提出了使用CNN结构的超分辨率网络SRCNN，该方法直接学习LR和HR图像之间的端到端映射。文献2：Lim,Bee et al.“EnhancedDeep Residual Networks for Single Image Super-Resolution.”2017IEEE Conferenceon Computer Vision and Pattern Recognition Workshops(CVPRW)(2017):1132-1140.提出了一种称为EDSR的高精度单图像超分辨率方法，该方法学习残差，去除了SRResNet多余的模块，从而可以扩大模型的尺寸来提升结果质量。文献3：Christian Ledig,LucasTheis,Ferenc Husz′ar,Jose Caballero,Andrew Cunningham,Alejandro Acosta,AndrewAitken,Alykhan Tejani,Johannes Totz,Zehan Wang,et al.,“Photo-realistic singleimage super-resolution using a generative adversarial network,”arXiv preprintarXiv:1609.04802,2016.提出了一种用于图像超分辨率的生成对抗网络(SRGAN)，利用感知损失和对抗损失来提升SR图像的真实感。

虽然这些超分辨率方法可以生成高视觉质量的图像，但由于超分辨率问题的病态性，其生成的细节和原图像有很大的不同，无法为后续的识别任务提供足够有用的特征信息。

发明内容

发明目的：本发明所要解决的技术问题是针对现有技术的不足，提供一种基于生成对抗网络(Generative Aderversarial Networks,GAN)的低分辨率车牌识别方法，包括如下步骤：

步骤1，构建图像增强模块：搭建图像生成网络，将低分辨率的车牌字符图像输入到模型中，通过迭代优化图像增强模块的损失函数来使图像增强模块生成高分辨率车牌字符图像；

步骤2，构建图像识别模块：搭建图像判别网络，利用步骤1生成的高分辨率车牌字符图像和真实图像一起输入到模型中，通过迭代优化图像识别模块的损失函数以提高图像判别网络真假判别能力和识别效果；

步骤3，整体框架训练：通过分割高分辨率车牌字符图像得到原始的字符图像集，经过下采样得到低分辨率字符图像集，基于GAN对抗学习的思想交替训练图像增强模块和图像识别模块，利用训练好的图像生成和判别模型实现低分辨率车牌的增强识别。

步骤1包括以下步骤：

步骤1-1，构建图像生成网络模型G；

步骤1-2，设计图像增强模块的损失函数L_G；

步骤1-3，将输入的低分辨率的车牌字符图像I^LR生成高分辨率车牌字符图像

并计算损失函数L_G，通过不断迭代优化损失函数L_G以更新生成网络模型G的参数θ_G。

步骤1-1中，所述图像生成网络G包含五个残差块，每个残差块中包含两个3×3的卷积层，卷积层后连接批规范化层，选取PReLU作为激活函数，再连接两个亚像素卷积层用来增大特征尺寸，亚像素卷积层即上采样网络层。

步骤1-2中，所述图像增强模块的损失函数L_G包括三部分：内容损失

对抗损失

和分类损失L_C，采用不同权重进行加权计算如下：

其中，所述内容损失

为生成的高分辨率车牌字符图像与低分辨率的车牌字符图像之间的欧氏距离，所述对抗损失

用来生成让判别器无法区分的数据分布

所述分类损失L_C用来区分正确的样本类别。

步骤1-2中，所述内容损失包括均方差损失和VGG特征损失，其中均方差损失

表示像素空间的最小均方差：

其中r表示采样因子，x、y分别表示图像像素点的横、纵坐标，(I^HR)_x,y表示真实的高分辨率车牌字符图像的各个像素点，

表示生成网络合成的高分辨率车牌字符图像的各个像素点，W和H分别表示图像I^HR的宽度和高度，

表示图像I^HR和

逐像素求差的平方和。

所述的VGG特征损失以文献Simonyan K,Zisserman A.Very deep convolutionalnetworks for large-scale image recognition[J].arXiv preprint arXiv:1409.1556,2014中预训练19层的VGG网络为基础，求生成的高分辨率车牌字符图像与低分辨率的车牌字符图像特征之间的欧式距离，在已经训练好的VGG网络上提取一层的特征图，将生成的高分辨率车牌字符图像当前层的特征图和低分辨率的车牌字符图像所对应的特征图进行比较：

其中

表示真实高分辨率车牌字符图像I^HR和生成的高分辨率车牌字符

的VGG特征图之间的欧式距离；W_i,j和H_i,j分别表示VGG网络内各个特征图的宽度和高度；φ_i,j对应VGG网络中第i个最大池化层之前的第j个卷积获得的特征图。

所述对抗损失

用来生成让判别器无法区分的图像：

其中

为判别器，θ_D为判别器的权重，N为样本数量；

所述的分类损失L_C用来使预测的字符类别更准确：

其中P(C＝c|I^HR)表示真实车牌字符图像I^HR分类正确的概率，

表示图像生成网络合成的高分辨率车牌字符图像

分类正确的概率。

步骤2包括如下步骤：

步骤2-1，构建图像判别网络模型D；

步骤2-2，设计图像识别模块的损失函数L_D；

步骤2-3，将生成的高分辨率字符图像

和真实的高分辨率字符图像I^HR输入图像判别网络中，并计算损失L_D，通过不断迭代优化L_C以更新生成网络模型D的参数θ_D。

步骤2-1中所述的图像判别网络模型D包含两个卷积层，每个卷积层之后都连接批规范化层和LeakyReLU激活函数，最终通过两个预测分支：其一分支将输出值通过Sigmoid函数映射到[0,1]，从而得到该模块的输入样本是否来自真实车牌字符图像I^HR，如果是，输出为1，否则为0；另一分支将输出值通过Softmax函数映射到N_t维，从而得到该模块的输入样本的分类标签，其中N_t为样本总类别数。

步骤2-2中所述的图像识别模块的损失函数L_D包括两部分：判别损失L_S和分类损失L_C，计算公式如下：

L_D＝L_S+L_C，

其中，所述判别损失L_S用来使判别器区分真假数据，所述分类损失L_C用来区分正确的样本类别；

所述判别损失L_S表示判别器区分真假数据的能力：

其中

为判别器，θ_D为判别器的权重，N为样本数量；

所述的分类损失L_C用来使图像识别模块预测的字符类别更准确：

其中P(C＝c|I^HR)表示真实的高分辨率车牌字符图像I^HR分类正确的概率，

表示图像生成网络G合成的高分辨率车牌字符图像

分类正确的概率。

步骤3包括如下步骤：

步骤3-1，数据预处理：对监控场景下获取的整张车牌图像集进行字符分割，去除汉字部分，得到真实的高分辨率字符图像集HR；通过下采样，得到低分辨率字符图像集LR；

步骤3-2，模型框架训练：基于GAN的对抗学习思想交替训练图像增强和识别两个模块，直到图像判别网络D无法区分输入图像的真假且能正确分类或满足迭代终止条件，则完成训练；

步骤3-3，模型框架测试：输入用于测试的低分辨率车牌，经过训练好的图像生成模型G后得到高分辨率车牌字符图像，再由图像判别模型D直接输出车牌识别结果，从而实现低分辨率车牌的增强识别。

步骤3-1包括如下步骤：

步骤3-1-1，对监控场景下获取的整张车牌图像进行垂直投影后计算峰值出现的次数：如果出现次数等于次数阈值7，则计算各峰的峰宽比，峰宽比符合条件的则利用垂直投影法进行字符分割；如果出现次数不等于阈值7，则利用模板匹配进行字符分割，去除汉字部分；

步骤3-1-2，去除汉字部分后，将分割后的高分辨率车牌字符图像归一化，处理到m×n大小，m和n分别表示图像的高度和宽度，归一化后的高分辨车牌字符图像集记为HR；

步骤3-1-3，通过k倍双三次下采样，将高分辨率车牌字符图像集HR降为分辨率大小为(m/k,n/k)的低分辨率车牌字符图像集LR；

步骤3-2包括如下步骤：

步骤3-2-1，利用步骤3-1得到的低分辨率车牌字符图像集LR作为图像增强模块的输入，经过堆叠的卷积层和上采样网络层后，即图像生成网络G，得到特征增强后的高分辨率车牌字符图像集，记为SR；

步骤3-2-2，将真实车牌字符图像集HR和生成的高分辨率车牌字符图像集SR送入图像识别模块，输出两个分支，其中一个分支输出N_t维的目标类别，N_t为字符样本类别数目；另一个分支输出1维的向量，用于判别是否为真实样本；

步骤3-2-3，根据整体模型框架的优化目标函数

联合训练图像增强模块和图像识别模块，交替更新图像生成网络模型G和图像判别网络模型D的参数θ_G、θ_D：

其中，I^HR为真实车牌字符图像集HR中某一样本，

为生成的高分辨率车牌字符图像集SR中某一样本，V(G,D)用来衡量样本集HR与SR相近似的程度，

表示I^HR的期望，

表示

的期望。

步骤3-1-2中，m＝48，n＝24。

步骤3-1-3中，k＝4，6，8。

所述的字符样本类别数N_t＝34，包括除字母I、O外的24类字母和10类数字。

本发明公开的方法基于GAN对抗学习的思想，联合训练图像增强模块和图像识别模块，即将两个独立的过程统一在一个端到端的框架中，使二者在不断的博弈中相互增强。此外，利用分类损失指导图像超分辨网络更关注于生成对识别有益的特征信息。

有益效果：本发明具有以下优点：首先，本发明建立了基于GAN的端到端的神经网络结构，通过对抗训练图像增强网络和识别网络，提高了车牌在低分辨率情况下的识别精度；其次，本发明通过引入分类损失指导图像增强网络，可以更多地生成与识别相关的特征信息，从而提高了低分辨率车牌的辨识度和识别效果。

附图说明

下面结合附图和具体实施方式对本发明做更进一步的具体说明，本发明的上述和/或其他方面的优点将会变得更加清楚。

图1是本发明的处理流程示意图。

图2a是高分辨率车牌字符图像集示例。

图2b是对应的低分辨率车牌图像集示例。

图2c是低分辨率车牌字符分割后的结果示例。

图2d是图像增强及其识别结果示例。

具体实施方式

本发明公开的一种基于生成对抗网络的低分辨率车牌识别方法，具体按照以下步骤实施(图1是整个方法的流程图)：

1、构建图像增强模块

输入：低分辨率车牌字符图像。

输出：生成的高分辨率车牌字符图像。

1.1构建图像生成网络模型G

图像生成网络部分包含多个残差块，每个残差块中包含两个3×3的卷积层，卷积层后连接批规范化层，选取PReLU作为激活函数，再连接两个亚像素卷积层用来增大特征尺寸，即上采样网络层。

1.2设计图像增强模块的损失函数L_G

该模块的损失函数目标是使图像生成网络G能生成更逼近于真实图像的高分辨率字符图像，且能生成更多有助于字符识别的特征信息，包括内容损失

对抗损失

和分类损失L_C。采用不同权重进行加权计算如下：

其中，所述内容损失

为生成图像与原图像之间的欧氏距离，所述对抗损失

用来生成让判别网络D无法区分的数据分布

所述分类损失L_C用来区分正确的样本类别。

步骤1设计内容损失

包括均方差损失和VGG特征损失，其中均方差损失

表示像素空间的最小均方差：

表示生成网络合成的高分辨率车牌字符图像的各个像素点，W和H分别表示图像I^HR的宽度和高度,

表示图像I^HR和

逐像素求差的平方和。

所述的VGG特征损失以预训练19层的VGG网络为基础，求生成图像与原图像特征之间的欧式距离，在已经训练好的VGG上提取某一层的特征图，将生成图像当前层的特征图和原图像所对应的特征图进行比较：

其中

的VGG特征图之间的欧式距离；W_i,j和H_i,j分别表示VGG网络内各个特征图的宽度和高度；φ_i,j对应VGG网络中第i个最大池化层之前的第j个卷积获得的特征图。该损失函数能反映更高感知层次上的误差，而均方误差损失项只能反映低层次的像素点间的误差，因此VGG损失项又称为感知损失项。

步骤2设计对抗损失

用来生成让图像判别器D无法区分的图像：

其中

为判别器，θ_D为判别器的权重，N为样本数量。

步骤3设计分类损失L_C，用来使预测的字符类别更准确：

其中P(C＝c|I^HR)表示真实车牌字符图像I^HR中样本C分类正确的概率，

表示生成网络合成的高分辨率车牌字符图像

中样本C分类正确的概率。

1.3生成高分辨率字符图像，并迭代优化损失L_G以更新模型参数θ_G

将低分辨率字符图像向量化处理，除以255.0使得灰度归一化到[0,1]区间，然后输入到图像生成网络G中，以分辨率大小为8×4为例，经过一层卷积核大小为9，填充为4的CNN网络层和5个残差块后，再通过大小分别为2、3的上采样网络层，最终得到特征增强后的高分辨率车牌字符图像，其大小与原高分辨率图像大小相同，均为48×24，同时反馈损失L_G并更新模型参数θ_G。

2、构建图像识别模块

输入：生成的高分辨率车牌字符图像

输出：真假判断及识别结果

2.1构建图像判别网络模型D

图像判别网络部分包含两个卷积层，每个卷积层之后都连接批规范化层和LeakyReLU激活函数，以及两个预测分支，分别用于判断该样本是否来自原始图像I^HR以及所属类别c。

2.2设计图像识别模块的损失函数L_D

该模块的损失函数目标是使图像判别网络能尽可能区分真假数据且正确分类字符，包括两部分：判别损失L_S和分类损失L_C，计算公式如下：

L_D＝L_S+L_C (6)

其中，所述判别损失L_S用来使判别器尽可能区分真假数据，所述分类损失L_C用来区分正确的样本类别。

步骤1设计判别损失L_S，用于提高判别器区分真假数据的能力：

其中

为判别器，θ_D为判别器的权重，N为样本数量。

步骤2设计分类损失L_C，用来使识别模块预测的字符类别更准确：

其中P(C＝c|I^HR)表示HR样本中某样本C分类正确的概率，P(C＝c|I^SR)表示SR样本中某样本C分类正确的概率。

2.3判别输入的真假及所属类别，并迭代优化损失以更新模型参数θ_D

将生成的高分辨率字符图像输入到判别网络D中，输入的图像分辨率为48×12.首先经过两层卷积核大小为4，步长为2，填充为1的CNN网络层，提取的特征图大小为128×12×6；再将提取的特征图送入两个预测分支，其中判别分支将输出值通过Sigmoid函数映射到[0,1]，从而得到该样本是否来自真实图像，若属于为1，否则为另一分类分支将输出值通过softmax函数映射到34维，从而得到该样本的分类标签c。同时反馈损失L_D并更新模型参数θ_D。

3、整体框架训练

基于GAN的对抗学习思想交替训练图像增强和识别两个模块，包括数据预处理、模型框架训练及测试阶段。

3.1数据预处理

通过对监控场景下获取的整张车牌图像集进行字符分割、下采样处理，去除汉字部分，获得可用于训练模型的高分辨率和低分辨率字符图像对。

输入：整张车牌图像集。

输出：低分辨率车牌字符图像集

步骤1先将输入的车牌图像二值化，并去除车牌的边框、铆钉等。进行垂直投影后计算峰值出现的次数：如果出现次数等于次数阈值7，则计算各峰的峰宽比，如果峰宽比符合条件则利用字符区域在垂直方向上的白色像素较多，而字符间白色像素较少的特性，通过检测垂直方向上的白色像素的数量来确定字符的边界，从而进行分割操作；如果出现次数不等于阈值7，则继续步骤2；

步骤2利用模板匹配进行字符分割，要先确定车牌区域的上下边界，并设置一个字符大小的窗口，从车牌区域的左侧向右滑动，找到白色像素的最大差值，将字符分割出来。

步骤3将分割后得到的高分辨率车牌字符图像归一化，处理到48×24大小，归一化后的高分辨车牌字符图像集记为HR；

步骤4通过4，6，8倍双三次下采样高分辨率车牌字符图像集HR，可得到分辨率大小为12×6、8×4和6×3的低分辨率车牌字符图像集LR。

3.2模型框架训练

输入：低分辨率字符图像集LR及对应的高分辨率字符图像集HR

输出：真假判别及分类结果

步骤1将低分辨率字符图像集LR输入图像增强模块中，经过堆叠的卷积网络层和上采样网络层后，得到特征增强后的高分辨率车牌字符图像集SR，计算该模块损失函数L_G；

步骤2将高分辨率字符图像集HR和生成的高分辨率车牌字符图像集SR送入图像识别模块，通过图像判别网络判断输入是否为真实样本及其类别信息，计算该模块损失函数L_D；

步骤3根据整体模型框架的优化目标函数，联合训练图像增强和识别模块，交替更新生成网络G和判别网络D的参数θ_G、θ_D，其目标是使图像生成网络能生成更逼近真实图像的数据且判别网络能尽可能判断真假数据和正确分类：

其中，I^HR为真实车牌字符图像集HR中某一样本，

表示I^HR的期望，

表示

的期望。

训练模型时，将所有损失的权衡权值设为1，并使用带有动量项0.9的Adam优化器。对生成网络G和鉴别网络D进行从无到有的训练，每一层的权值初始化为零均值高斯分布，标准差为0.02，偏差初始化为0。该模型采用64例批量训练，迭代100次。初始学习速率设置为0.0002。

3.3模型框架测试

输入：低分辨率的字符图像

输出：识别结果

步骤1将输入的低分辨率字符图像送入图像增强模块中，利用训练好的生成网络模型可以得到特征增强后的高分辨率车牌字符图像；

步骤2将步骤1得到的高分辨率字符图像送入图像识别模块中，利用训练好的判别网络模型识别其类别。

本发明中，如图2a所示为高分辨率车牌集示例，通过本发明所述的基于GAN的低分辨率识别方法，可对图2b中相应的低分辨率车牌图像进行分割，如图2c，并得到图像增强后的图2d及识别结果。

本发明提供了一种基于生成对抗网络的低分辨率车牌识别方法，具体实现该技术方案的方法和途径很多，以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。本实施例中未明确的各组成部分均可用现有技术加以实现。

Claims

1.一种基于生成对抗网络的低分辨率车牌识别方法，其特征在于，包括如下步骤：

2.根据权利要求1所述的方法，其特征在于，步骤1包括以下步骤：

步骤1-1，构建图像生成网络模型G；

步骤1-2，设计图像增强模块的损失函数L_G；

3.根据权利要求2所述的方法，其特征在于，步骤1-1中，所述图像生成网络G包含五个残差块，每个残差块中包含两个3×3的卷积层，卷积层后连接批规范化层，选取PReLU作为激活函数，再连接两个亚像素卷积层用来增大特征尺寸，亚像素卷积层即上采样网络层。

4.根据权利要求3所述的方法，其特征在于，步骤1-2中，所述图像增强模块的损失函数L_G包括三部分：内容损失

对抗损失

和分类损失L_C，采用不同权重进行加权计算如下：

其中，所述内容损失

用来生成让判别器无法区分的数据分布

所述分类损失L_C用来区分正确的样本类别。

5.根据权利要求4所述的方法，其特征在于，步骤1-2中，所述内容损失包括均方误差损失和VGG特征损失，其中均方误差损失

表示像素空间的最小均方差：

表示生成网络合成的高分辨率车牌字符图像的各个像素点，W和H分别表示图像I^HR的宽度和高度；

所述的VGG特征损失以预训练19层的VGG网络为基础，求生成的高分辨率车牌字符图像与低分辨率的车牌字符图像特征之间的欧式距离，在已经训练好的VGG网络上提取一层的特征图，将生成的高分辨率车牌字符图像当前层的特征图和低分辨率的车牌字符图像所对应的特征图进行比较：

其中

的VGG特征图之间的欧式距离；W_i,j和H_i,j分别表示VGG网络内各个特征图的宽度和高度；φ_i,j对应VGG网络中第i个最大池化层之前的第j个卷积获得的特征图；

所述对抗损失

用来生成让判别器无法区分的图像：

其中

为判别器，θ_D为判别器的权重，N为样本数量；

所述的分类损失L_C用来使预测的字符类别更准确：

表示图像生成网络合成的高分辨率车牌字符图像

分类正确的概率。

6.根据权利要求5所述的方法，其特征在于，步骤2包括如下步骤：

步骤2-1，构建图像判别网络模型D；

步骤2-2，设计图像识别模块的损失函数L_D；

步骤2-3，将生成的高分辨率车牌字符图像

和真实车牌字符图像I^HR输入图像判别网络模型中，并计算损失L_D，通过不断迭代优化L_C以更新图像判别网络模型D的参数θ_D。

7.根据权利要求6所述的方法，其特征在于，步骤2-1中所述的图像判别网络模型D包含两个卷积层，每个卷积层之后都连接批规范化层和LeakyReLU激活函数，最终通过两个预测分支：其一分支将输出值通过Sigmoid函数映射到[0,1]，从而得到图像识别模块的输入样本是否来自真实车牌字符图像I^HR，如果是，输出为1，否则为0；另一分支将输出值通过Softmax函数映射到N_t维，从而得到图像识别模块的输入样本的分类标签，其中N_t为样本总类别数。

8.根据权利要求7所述的方法，其特征在于，步骤2-2中所述的图像识别模块的损失函数L_D包括两部分：判别损失L_S和分类损失L_C，计算公式如下：

L_D＝L_S+L_C，

所述判别损失L_S表示判别器区分真假数据的能力：