WO2021196873A1

WO2021196873A1 - 车牌字符识别方法、装置、电子设备和存储介质

Info

Publication number: WO2021196873A1
Application number: PCT/CN2021/074915
Authority: WO
Inventors: 黄艳庭; 王凯; 徐红祥; 陆文涛
Original assignee: 京东方科技集团股份有限公司; 合肥京东方显示技术有限公司
Priority date: 2020-03-30
Filing date: 2021-02-02
Publication date: 2021-10-07
Also published as: CN111444917A; US20230154210A1

Abstract

一种车牌字符识别方法、装置、电子设备和存储介质，其中，该方法包括：在获取图像采集设备所采集到的车辆图像后，对车牌图像中的车辆区域进行定位，以得到车牌图像，并通过包括残差网络结构的卷积神经网络对车牌图像进行特征提取，有效避免梯度消失和减少了卷积神经网络卷积过程中的特征损失，从而使得双向循环神经网络模型可基于车牌图像的特征信息准确识别出车牌图像的车牌字符。由此，不需要对车牌进行字符分割，通过直接识别整个车牌即可得到车牌上的车牌字符，避免对车牌的字符进行切分和分开识别，提高了识别速度和识别准确度。

Description

车牌字符识别方法、装置、电子设备和存储介质

相关申请的交叉引用

本申请要求合肥京东方显示技术有限公司，京东方科技集团股份有限公司于2020年03月20日提交的、发明名称为“车牌字符识别方法、装置、电子设备和存储介质”的、中国专利申请号“202010234926.2”的优先权。

技术领域

本申请涉及图像技术领域，尤其涉及车牌字符识别方法、装置、电子设备和存储介质。

背景技术

随着中国汽车保有量的不断增加，智能车牌识别与管理系统的研究应用越来越重要。目前，智能车牌识别系统在高速公路收费站、小区停车场等区域的应用已经越来越广泛。

相关技术中，相关智能车牌识别系统中识别车牌的方式一般为：首先需要将定位到的车牌进行字符分割，然后对单个字符提取字符特征，最后进行车牌字符识别，然而，上述基于字符分割进行车牌识别的方式，字符分割的准确性难以保证，从而导致车牌识别准确性较低。

发明内容

本申请提出一种车牌字符识别方法、装置、电子设备和存储介质，不需要对车牌进行字符分割，通过直接识别整个车牌即可得到车牌上的车牌字符，避免对车牌的字符进行切分和分开识别，提高了识别速度和识别准确度的技术效果。

本申请一方面实施例提出了一种车牌字符识别方法，包括：获取图像采集设备所采集到的车辆图像；对车辆图像进行车牌区域定位，以得到车牌图像；通过卷积神经网络对所述车牌图像进行特征提取，以得到所述车牌图像的特征信息，其中，所述卷积神经网络包括残差网络结构；通过双向循环神经网络模型解析所述特征信息，以得到所述车牌图像对应的车牌字符。

本申请实施例的车牌字符识别方法，在获取图像采集设备所采集到的车辆图像后，对车牌图像中的车辆区域进行定位，以得到车牌图像，并通过包括残差网络结构的卷积神经网络对车牌图像进行特征提取，有效避免梯度消失和减少了卷积神经网络卷积过程中的特征损失，从而使得双向循环神经网络模型可基于车牌图像的特征信息准确识别出车牌图像的车牌字符。由此，不需要对车牌进行字符分割，通过直接识别整个车牌即可得到车牌上的车牌字符，避免对车牌的字符进行切分和分开识别，提高了识别速度和识别准确度。

本申请另一方面实施例提出了一种车牌字符识别装置，包括：图像采集模块，用于获取图像采集设备所采集到的车辆图像；车牌定位模块，用于对车辆图像进行车牌区域定位，以得到车牌图像；特征提取模块，用于通过卷积神经网络对所述车牌图像进行特征提取，以得到所述车牌图像的特征信息，其中，所述卷积神经网络包括残差网络结构；识别模块，用于通过双向循环神经网络模型解析所述特征信息，以得到所述车牌图像对应的车牌字符。

本申请实施例的车牌字符识别装置，在获取图像采集设备所采集到的车辆图像后，对车牌图像中的车辆区域进行定位，以得到车牌图像，并通过包括残差网络结构的卷积神经网络对车牌图像进行特征提取，有效避免梯度消失和减少了卷积神经网络卷积过程中的特征损失，从而使得双向循环神经网络模型可基于车牌图像的特征信息准确识别出车牌图像的车牌字符。由此，不需要对车牌进行字符分割，通过直接识别整个车牌即可得到车牌上的车牌字符，避免对车牌的字符进行切分和分开识别，提高了识别速度和识别准确度。

本申请另一方面实施例提出了一种电子设备，包括：一种电子设备，包括：存储器，处理器；所述存储器中存储有计算机指令，当所述计算机指令被所述处理器执行时，实现本申请实施例的车牌字符识别方法。

本申请另一方面实施例提出了一种存储有计算机指令的非瞬时计算机可读存储介质，所述计算机指令用于使所述计算机执行本申请实施例公开的车牌字符识别方法。

上述可选方式所具有的其他效果将在下文中结合具体实施例加以说明。

附图说明

附图用于更好地理解本方案，不构成对本申请的限定。其中：

图1是根据本申请一个实施例的车牌字符识别方法的流程示意图；

图2是包括第一残差网络结构和第二残差网络结构的卷积神经网络的网络结构示意图；

图3是第一残差网络结构的网络结构示意图；

图4是双向循环神经网络模型的网络结构的示意图；

图5是根据本申请另一个实施例的车牌字符识别方法的流程示意图；

图6是根据本申请一个实施例的车牌字符识别装置的结构示意图；

图7是根据本申请另一个实施例的车牌字符识别装置的结构示意图；

图8是用来实现本申请实施例的车牌字符识别方法的电子设备的框图。

具体实施方式

下面详细描述本申请的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，旨在用于解释本申请，而不能理解为对本申请的限制。

下面参考附图描述本申请实施例的车牌字符识别方法、装置和电子设备。

图1是根据本申请一个实施例的车牌字符识别方法的流程示意图。其中，需要说明的是，本实施例提供的车牌字符识别方法的执行主体为车牌字符识别装置，该车牌字符识别装置可以配置在智能车牌识别系统中，该智能车牌识别系统可以设置在电子设备中，例如，电子设备可以为终端设备、服务器等硬件设备。

如图1所示，该车牌字符识别方法可以包括：

步骤101，获取图像采集设备所采集到的车辆图像。

其中，图像采集设备可以为摄像头。

步骤102，对车辆图像进行车牌区域定位，以得到车牌图像。

在本实施例中，为了提高可快速定位出车牌图像中的车牌图像，在获取车牌图像后，可采用YOLOV3网络对车辆图像进行车牌区域定位，以得到车牌图像。

其中，YOLOV3网络是一种深度学习图像检测算法，其主要是基于回归思想，将目标识别和目标定位两个步骤同时进行，从而可提高目标检测的速度，达到了实时检测的要求。

其中，YOLOV3网络为使用一个53层的卷积网络，并且使用了softmax层。

在本实施例的一个实施例，该YOLOV3网络还可采用三个尺度特征融合进行物体检测定位，并使用K-means聚类产生九个先验框作为bounding box(即包含车牌的一个紧致矩形框)的初始尺寸，从而可达到加快收敛速度，提高检测精度的效果。

在本实施例，通过Yolov3网络能够对各种复杂环境下的各种颜色车辆的车牌进行准确的定位，识别时间在20ms左右。

步骤103，通过卷积神经网络对车牌图像进行特征提取，以得到车牌图像的特征信息，其中，该卷积神经网络包括残差网络结构。

在本实施例中，卷积神经网络中的卷积层通常对车牌图像进行特征提取，以得到对应车牌图像的特征图像，然而，卷积层对车牌图像进行特征提取时容易造成车牌图像的特征损失，并且在卷积神经网络深度增加时，出现了梯度消失问题。在本实施例中，为了提高后续车牌字符识别的准确性，可在卷积神经网络中设置残差网络结构，从而通过残差网络结构，有效防止卷积神经网络中增加深度带来的梯度消失和减少在卷积过程中的特征损失的问题。

在本申请的一个实施例中，上述卷积神经网络除了包括残差网络结构，还可以包括卷积层和池化层。在本实施实施例中，为了避免梯度消失和减少卷积过程的特征损失，本实施例中的卷积神经网络可以按照卷积层、残差网络结构和池化层顺次连接。也就是说，本实施例的卷积神经网络包括顺次连接的卷积层、残差网络结构和池化层。

具体地，在将车牌图像输入到卷积神经网络后，卷积神经网络中的卷积层将对车牌图像进行特征提取，以得到车牌图像的第一特征图像，对应地，可将第一特征图像输入到残差网络结构，并将残差结构输出的特征图像输入到池化层中进行相应处理。

在本申请的一个实施例中，为了在保证识别效率和识别准确的情况下，可在卷积神经网络中设置三层卷积层，对车牌图像进行特征提取。

在本申请的一个实施例中，在上述卷积神经网络使用三层卷积层时，为了避免梯度消失和减少卷积过程中的特征损失，在本实施例中可将第一卷积层、残差网络结构、第二卷积层、第三卷积层和池化层顺次相连，以形成本实施例的卷积神经网络，从而最大程度的减少卷积过程的特征损失。

在本实施中，为了进一步提高车牌识别准确度，可将第一卷积层设置为1*1卷积层，即，第一卷积层的P＝1x1，其中，P为padding参数。

在本申请的一个实施例中，在卷积神经网络中第一卷积层后加上批标准化Batch Normalization层，从而可有效提升网络性能，加快收敛速度。

在本申请的一个实施例中，为了能有效防止梯度消失问题，本实施例中的卷积神经网络可使用Leaky ReLU作为激活函数。

在本实施例中，为了在减少计算量的同时，有效防止卷积神经网络的梯度消失和减少在卷积过程中的特征损失，本实施例的残差网络结构包括第一残差网络结构和第二残差网络结构。对应地，卷积神经网络包括顺次相连的第一卷积层、第一残差网络结构、第二残差网络结构、第二卷积层、第三卷积层和池化层。

其中，包括第一残差网络结构和第二残差网络结构的卷积神经网络的网络结构示意图，如图2所示。图2中的卷积神经网络的网络结构具体为：第一卷积层、与第一卷积层连接的第一残差网络结构、与第一残差网络结构连接的第二残差网络结构、与第二残差网络结构连接的第二卷积层、与第二卷积层连接的第三卷积层，以及与第三卷积层连接的最大池化层。

在本申请的一个实施例中，卷积神经网络参数示意，如表1所示，其中，Filters为卷积核数，K为卷积核大小，S为步长，P为padding参数。

表2卷积神经网络参数

其中，表1中的Residual-1表示第一残差网络结构，Residual-2表示第二残差网络结构，ConvolutionN表示第N卷积层，其中，N为1到3中的任意一个整数。

在本申请的一个实施例中，为了进一步有效提升网络性能，加快收敛速度，可在卷积神经网络中的第二残差网络结构和Leaky ReLU之间设置Batch Normalization层。

在本申请的一个实施例中，第一残差网络结构和第二残差网络结构的网络结构相同，网络结构均包括第一网络子结构、第二网络子结构和加法器，第一网络子结构包括顺次相连的最大池化层、第一卷积子层、第二卷积子层、第三卷积子层和第四卷积子层，第二网络子结构包括第五卷积子网络，最大池化层和第五卷积子网络的输入端均与第一卷积层的输出层的输出端连接，第四卷积子层和第五卷积子网络的输出端均与加法器的输入端相连。

其中，第一残差网络结构的网络结构示意图，如图3所示。

在本实施例中，在卷积神经网络中的第一卷积层输出车牌图像的特征图像后，可将该特征图像输入到第一残差网络结构中，并将第一残差网络结构的输出再次输入到第二残差网络结构中，然后，将第二残差网络结构输出的特征信息输入到与第二残差网络结构连接的相应处理层，以通过相应处理层进行后续处理。

其中，本实施例中的第一残差网络结构和第二残差网络结构的网络结构虽然相同，但是两者所使用的网络参数是不同的。

本实施例中，通过以跳层连接的形式实现残差网络结构，有效防止卷积神经网络的梯度消失和减少在卷积过程中的特征损失，并且，还可以在一定程度上缓解梯度弥散问题。另外，本实施例的残差网络结构还可以使得信息前后向传播更加顺畅。

具体而言，第一残差网络结构和第二残差网络结构中卷积层所对应的卷积核数是不同的。

其中，本实施例中第一残差网络结构对应的细节参数，如表2所示，其中，Filters为卷积核数，K为卷积核大小，S为步长，P为padding参数。

表2第一残差网络结构的细节参数

其中，表中的Convolution表示卷积层，ConvolutionN表示第N卷积子层，其中，N为1到5中的任意整数。

其中，第二残差网络结构的细节参数，如表3所示。

表3第二残差网络结构的细节参数

步骤104，通过双向循环神经网络模型解析特征信息，以得到车牌图像对应的车牌字符。

在本申请实施例中，上述双向循环神经网络模型可以包括双向循环神经网络和连接时序分类(Connectionist Temporal Classification，CTC)网络。

在本申请的一个实施例中，为了提高识别车牌字符的准确性，本实施例的双向循环神经网络可以包括顺次连接的第一层双向长短时记忆网络(bidirectional long short-term memory，BLSTM)和第二层双向长短时记忆网络。

其中，本实施例中的双向长短时记忆网络中的每一个LSTM网络含有512个隐藏单元，因此，每层BLSTM的输出深度为1024，最后一层BLSTM的输出接两层全连接层，第一层全连接的深度为1024，第二层全连接的深度为车牌字符类别数(例如，66)。

在本申请的一个实施例中，为了防止过拟合情况的发生，本实施例的两层全连接层之间设置有dropout层。也就是说，本实施例的第二层双向长短时记忆网络包括：第一全连接层，与第一全连接层连接的dropout层，以及与dropout层连接的第二全连接层。

其中，本实施例中的双向循环神经网络模型的网络结构的示意图，如图4所示。

在本实施例中，在从所采集到的车辆图像中得到车牌图像后，直接通过卷积神经网络对整个车牌图像进行特征提取，并通过双向循环神经网络模型解析所提取到的特征信息，以得到车牌图像中的车牌字符。由此，可以看出，该实施例由于无需对车牌图像进行字符分割，因此，可减少车牌识别过程中的字符分割所使用的时间，进而可提高车牌识别速度。

图5是根据本申请另一个实施例的车牌字符识别方法的流程示意图。其中，需要说明的是，该实施例是对上述实施例的进一步细化或者优化。

如图5所示，该车牌字符识别方法可以包括：

步骤501，获取图像采集设备所采集到的车辆图像。

步骤502，采用YOLOV3网络对车辆图像进行车牌区域定位，以得到车牌图像。

步骤503，利用空间变换网络，对车牌图像进行倾斜校正。

在本实施例中，空间变换网络(Spatial Transformer Network，STN)可以包括本地网络、网格生成器和采样器。

具体地，在获取车牌图像后，可将车牌图像输入到本地网络中，以得用来校正车牌图像的仿射变换参数；将仿射变换参数输入至网格生成器，以得到对应的仿射变换矩阵；通过采样器基于仿射变换矩阵对车牌图像中的每个像素坐标进行仿射变换，以校正车牌图像。

其中，上述本地网络是一个用来回归变换参数θ的网络，该网络的具体参数表示，如表4，其中，Filters为卷积核数，K为卷积核大小，S为步长，P为padding参数；它的输入是灰度图像，然后经过一系列的隐藏网络层，最后输出空间变换参数。θ的形式可以多样，如需实现2D仿射变换，θ就是一个6维(2x3)向量的输出。θ的尺寸大小依赖于变换的类型，输入是2D图像，需实现2D仿射变换。在这里，该网络输出一个2*3的矩阵如公式2-1所示，表示为A _θ。

表4本地网络参数

类型	参数
Input	GrayScaleImage,W:220,H:32
Convolution1	Filters:8,K＝3,S＝1,P＝1x1
Leaky ReLU	-
Max pooling1	K＝2,S＝2,P＝0*0

Convolution1	Filters:16,K＝3,S＝1,P＝1x1
Leaky ReLU	-
Convolution1	Filters:32,K＝3,S＝1,P＝1x1
Leaky ReLU	-
FC Layer	Filters:64
Leaky ReLU	-
Dropout	-
FC Layer	Filters:6

上述网格生成器(Grid Generator)是依据预测的变换参数来构建一个采样网格，它是将一组输入图像中的点经过采样变换后得到的输出。网格生成器其实得到的是一种映射关系T _θ。假设输入图像的每个像素的坐标为

STN输出的每个像素坐标为

空间变换函数T _θ为二维仿射变换函数，那么

和

的对应关系可以表示为2-2：

采样器利用采样网格和输入的图像同时作为输入，得到了输入图像经过变换之后的结果。

上述采样器在网络生成器所得到的映射关系的基础上对输入图像特征进行采样，得到经过空间变换达到校正效果的图像特征。

其中，本实施例中所用的采样方法为双线性插值法。

本实施例通过STN在对车牌图像进行校正的同时，还可以通过本地网络过滤车牌图像周围的噪声干扰，使车牌更易于识别。

步骤504，通过卷积神经网络对车牌图像进行特征提取，以得到车牌图像的特征信息，其中，卷积神经网络包括残差网络结构。

步骤505，通过双向循环神经网络模型解析特征信息，以得到车牌图像对应的车牌字符。

其中，车牌字符可以包括汉字、字母、数字。

本申请实施例的车牌字符识别方法，在获取图像采集设备所采集到的车辆图像后，对车牌图像中的车辆区域进行定位，以得到车牌图像，并对车牌图像进行倾斜校正，并通过包括残差网络结构的卷积神经网络对校正后的车牌图像进行特征提取，有效避免梯度消失和减少了卷积神经网络卷积过程中的特征损失，从而使得双向循环神经网络模型可基于车牌图像的特征信息准确识别出车牌图像的车牌字符。

基于上述描述，可以看出，本实施例在对图片车辆中的车牌直接定位后，不需要对车牌进行字符分割，直接将定位后得到的车牌图像输入到包括残差网络结构的卷积神经网络进行特征提取，并采用双向循环神经网络模型基于车牌图像的特征信息进行车牌字符识别，可以直接识别整个车牌，避免对车牌的字符进行切分和分开识别，提高了识别速度。

本实施例对采用STN的车牌识别方法和不采用STN的车牌识别方法进行了实验，根据实验结果，确定移除STN网络的车牌识别准确率为94.6％，低于加入STN网络的车牌识别模型准确率96.1％。移除STN网络的车牌识别平均损失为0.53，高于加入STN网络的车牌平均损失为0.40。由此，可以看出，在对车牌图像输入卷积神经网络之前进行倾斜校正，可以进一步提高车牌字符的识别准确度。

为了表明本申请BLSTM的层数以及隐藏元(Hidden units)数的合理性，表5给出了本申请网络在无STN网络时，一层BLSTM、两层BLSTM和三层BLSTM在隐藏元数为128、256、512、1024时车牌识别准确率及车牌识别的平均损失，由于前面已经验证了STN网络的必要性，为了提升训练收敛速度，此处网络验证时将不再加入STN网络，通过以此获取的实验参数反映本申请所选取BLSTM参数的合理性，三层BLSTM时，车牌识别网络的收敛速度远慢于两层BLSTM和一层BLSTM，结果表明本申请网络所选择的两层BLSTM、512隐藏元是最合理的方案。

表5 BLSTM分析

其中，需要说明的是，上述表中在斜杠之前的数字为车牌识别准确率ACC的取值，斜杠之后的数字表示车牌识别平均损失loss的取值，例如，94.6/0.53表示车牌识别准确率ACC为94.6％，车牌识别平均损失为0.53。

另外，本实施例还对全连接层FC_layer进行了分析。

为了选取最佳全连接的层数，表6给出了本申请网络在无STN网络时在一层全连接、两层全连接、三层全连接时的车牌识别准确率以及模型识别车牌的平均损失，通过以此获取的实验参数即可反映本申请网络所选取的全连接参数的合理。ACC表示在相应模型下车牌识别的准确率，loss表示在相应模型下车牌识别的平均损失，F1表示第一层全连接的输出深度，F2表示第二层全连接的输出深度，F3表示第三层全连接的输出深度。结果证明本申请模型拥有最优性能。

表6全连接层分析

与上述几种实施例提供的车牌字符识别方法相对应，本申请的一种实施例还提供一种车牌字符识别装置，由于本申请实施例提供的车牌字符识别装置与上述几种实施例提供的车牌字符识别方法相对应，因此在车牌字符识别方法的实施方式也适用于本实施例提供的车牌字符识别装置，在本实施例中不再详细描述。

图6是根据本申请一个实施例的车牌字符识别装置的结构示意图。

如图6所示，该车牌字符识别装置600包括图像采集模块110、车牌定位模块120、特征提取模块130和识别模块140，其中：

图像采集模块110，用于获取图像采集设备所采集到的车辆图像。

车牌定位模块120，用于对车辆图像进行车牌区域定位，以得到车牌图像。

特征提取模块130，用于通过卷积神经网络对车牌图像进行特征提取，以得到车牌图像的特征信息，其中，卷积神经网络包括残差网络结构。

识别模块140，用于通过双向循环神经网络模型解析特征信息，以得到车牌图像对应的车牌字符。

在本申请的一个实施例中，卷积神经网络包括顺次连接的卷积层、残差网络结构和池化层。

在本申请的一个实施例中，卷积神经网络包括顺次相连的第一卷积层、残差网络结构、第二卷积层、第三卷积层和池化层。

在本申请的一个实施例中，所述卷积层包括3层，所述残差网络结构包括第一残差网络结构和第二残差网络结构，所述卷积神经网络包括顺次相连的第一卷积层、第一残差网络结构、第二残差网络结构、第二卷积层、第三卷积层和池化层。

在本申请的一个实施例中，第一残差网络结构和第二残差网络结构的网络结构相同，网络结构包括第一网络子结构、第二网络子结构和加法器，第一网络子结构包括顺次相连的最大池化层、第一卷积子层、第二卷积子层、第三卷积子层和第四卷积子层，第二网络子结构包括第五卷积子网络，最大池化层和第五卷积子网络的输入端均与第一卷积层的输出层的输出端连接，第四卷积子层和第五卷积子网络的输出端均与加法器的输入端相连。

在本申请的一个实施例中，在图6所示的实施例基础上，如图7所示，该装置还包括：

倾斜校正模块150，用于利用空间变换网络，对车牌图像进行倾斜校正。

在本申请的一个实施例中，空间变换网络包括本地网络、网格生成器和采样器，上述倾斜校正模块150，具体用于：将车牌图像输入到本地网络中，以得用来校正车牌图像的仿射变换参数；将仿射变换参数输入至网格生成器，以得到对应的仿射变换矩阵；通过采样器基于仿射变换矩阵对车牌图像中的每个像素坐标进行仿射变换，以校正车牌图像。

在本申请的一个实施中，双向循环神经网络模型包括双向循环神经网络和连接时序分类CTC网络。

在本申请的一个实施中，双向循环神经网络包括顺次连接的第一层双向长短时记忆网络和第二层双向长短时记忆网络。

在本申请的一个实施中第二层双向长短时记忆网络包括：第一全连接层；与第一全连接层连接的dropout层；与dropout层连接的第二全连接层。

根据本申请的实施例，本申请还提供了一种电子设备和一种可读存储介质。

如图8所示，是根据本申请实施例的车牌字符识别方法的电子设备的框图。

如图8所示，该电子设备该电子设备包括：

存储器1001、处理器1002及存储在存储器1001上并可在处理器1002上运行的计算机指令。

处理器1002执行指令时实现上述实施例中提供的数据库管理方法。

进一步地，电子设备还包括：

通信接口1003，用于存储器1001和处理器1002之间的通信。

存储器1001，用于存放可在处理器1002上运行的计算机指令。

存储器1001可能包含高速RAM存储器，也可能还包括非易失性存储器(non-volatile memory)，例如至少一个磁盘存储器。

处理器1002，用于执行程序时实现上述实施例的车牌字符识别方法。

如果存储器1001、处理器1002和通信接口1003独立实现，则通信接口1003、存储器1001和处理器1002可以通过总线相互连接并完成相互间的通信。总线可以是工业标准体系结构(Industry Standard Architecture，简称为ISA)总线、外部设备互连(Peripheral Component，简称为PCI)总线或扩展工业标准体系结构(Extended Industry Standard Architecture，简称为EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示，图8中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

可选的，在具体实现上，如果存储器1001、处理器1002及通信接口1003，集成在一块芯片上实现，则存储器1001、处理器1002及通信接口1003可以通过内部接口完成相互间的通信。

处理器1002可能是一个中央处理器(Central Processing Unit，简称为CPU)，或者是特定集成电路(Application Specific Integrated Circuit，简称为ASIC)，或者是被配置成实施本申请实施例的一个或多个集成电路。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

此外，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中，“多个”的含义是至少两个，例如两个，三个等，除非另有明确具体的限定。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为，表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分，并且本申请的优选实施方式的范围包括另外的实现，其中可以不按所示出或讨论的顺序，包括根据所涉及的功能按基本同时的方式或按相反的顺序，来执行功能，这应被本申请的实施例所属技术领域的技术人员所理解。

在流程图中表示或在此以其他方式描述的逻辑和/或步骤，例如，可以被认为是用于实现逻辑功能的可执行指令的定序列表，可以具体实现在任何计算机可读介质中，以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用，或结合这些指令执行系统、装置或设备而使用。就本说明书而言，"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下：具有一个或多个布线的电连接部(电子装置)，便携式计算机盘盒(磁装置)，随机存取存储器(RAM)，只读存储器(ROM)，可擦除可编辑只读存储器(EPROM或闪速存储器)，光纤装置，以及便携式光盘只读存储器(CDROM)。另外，计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质，因为可以例如通过对纸或其他介质进行光学扫描，接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序，然后将其存储在计算机存储器中。

应当理解，本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如，如果用硬件来实现和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列(PGA)，现场可编程门阵列(FPGA)等。

本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，该程序在执行时，包括方法实施例的步骤之一或其组合。

此外，在本申请各个实施例中的各功能单元可以集成在一个处理模块中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。

上述提到的存储介质可以是只读存储器，磁盘或光盘等。尽管上面已经示出和描述了本申请的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本申请的限制，本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims

一种车牌字符识别方法，其特征在于，所述方法包括：

获取图像采集设备所采集到的车辆图像；

对车辆图像进行车牌区域定位，以得到车牌图像；

通过卷积神经网络对所述车牌图像进行特征提取，以得到所述车牌图像的特征信息，其中，所述卷积神经网络包括残差网络结构；

通过双向循环神经网络模型解析所述特征信息，以得到所述车牌图像对应的车牌字符。
根据权利要求1所述的方法，其特征在于，所述卷积神经网络包括顺次连接的卷积层、所述残差网络结构和池化层。
根据权利要求2所述的方法，其特征在于，所述卷积层包括3层，所述残差网络结构包括第一残差网络结构和第二残差网络结构，所述卷积神经网络包括顺次相连的第一卷积层、第一残差网络结构、第二残差网络结构、第二卷积层、第三卷积层和池化层。
根据权利要求3所述的方法，其特征在于，所述第一残差网络结构和所述第二残差网络结构的网络结构相同，所述网络结构包括第一网络子结构、第二网络子结构和加法器，所述第一网络子结构包括顺次相连的最大池化层、第一卷积子层、第二卷积子层、第三卷积子层和第四卷积子层，所述第二网络子结构包括第五卷积子网络，所述最大池化层和所述第五卷积子网络的输入端均与所述第一卷积层的输出层的输出端连接，所述第四卷积子层和所述第五卷积子网络的输出端均与加法器的输入端相连。
根据权利要求1-4中任一项所述的方法，其特征在于，在所述通过卷积神经网络对所述车牌图像进行特征提取，以得到所述车牌图像的特征信息之前，所述方法还包括：

利用空间变换网络，对所述车牌图像进行倾斜校正。
根据权利要求1-5中任一项所述的方法，其特征在于，所述双向循环神经网络模型包括双向循环神经网络和连接时序分类CTC网络。
根据权利要求6所述的方法，其特征在于，所述双向循环神经网络包括顺次连接的第一层双向长短时记忆网络和第二层双向长短时记忆网络。
一种车牌字符识别装置，其特征在于，所述装置包括：

图像采集模块，用于获取图像采集设备所采集到的车辆图像；

车牌定位模块，用于对车辆图像进行车牌区域定位，以得到车牌图像；

特征提取模块，用于通过卷积神经网络对所述车牌图像进行特征提取，以得到所述车牌图像的特征信息，其中，所述卷积神经网络包括残差网络结构；

识别模块，用于通过双向循环神经网络模型解析所述特征信息，以得到所述车牌图像对应的车牌字符。
根据权利要求8所述的装置，其特征在于，所述卷积神经网络包括顺次连接的卷积层、所述残差网络结构和池化层。
根据权利要求9所述的装置，其特征在于，所述卷积层包括3层，所述残差网络结构包括第一残差网络结构和第二残差网络结构，所述卷积神经网络包括顺次相连的第一卷积层、第一残差网络结构、第二残差网络结构、第二卷积层、第三卷积层和池化层。
根据权利要求10所述的装置，其特征在于，所述第一残差网络结构和所述第二残差网络结构的网络结构相同，所述网络结构包括第一网络子结构、第二网络子结构和加法器，所述第一网络子结构包括顺次相连的最大池化层、第一卷积子层、第二卷积子层、第三卷积子层和第四卷积子层，所述第二网络子结构包括第五卷积子网络，所述最大池化层和所述第五卷积子网络的输入端均与所述第一卷积层的输出层的输出端连接，所述第四卷积子层和所述第五卷积子网络的输出端均与加法器的输入端相连。
根据权利要求8-11中任一项所述的装置，其特征在于，所述双向循环神经网络模型包括双向循环神经网络和连接时序分类CTC网络。
根据权利要求12所述的装置，其特征在于，所述双向循环神经网络包括顺次连接的第一层双向长短时记忆网络和第二层双向长短时记忆网络。
一种电子设备，包括：存储器，处理器；所述存储器中存储有计算机指令，当所述计算机指令被所述处理器执行时，实现如权利要求1-7中任一项所述的车牌字符识别方法。
一种存储有计算机指令的非瞬时计算机可读存储介质，其特征在于，所述计算机指令用于使所述计算机执行权利要求1-7中任一项所述的车牌字符识别方法。