CN110688880A

CN110688880A - 一种基于精简ResNet残差网络的车牌识别方法

Info

Publication number: CN110688880A
Application number: CN201810736742.9A
Authority: CN
Inventors: 杨公所
Original assignee: Shandong Huaruan Goldencis Software Co Ltd
Current assignee: Shandong Huaruan Goldencis Software Co Ltd
Priority date: 2018-07-06
Filing date: 2018-07-06
Publication date: 2020-01-14

Abstract

本发明提出了一种基于精简ResNet残差网络的车牌识别方法,包括如下步骤：一种基于精简ResNet残差网络的车牌识别方法,包括步骤：Ⅰ、输入车牌图片；Ⅱ、使用训练好的网络模型进行车牌识别；Ⅲ、输出识别出到的车牌号。本发明省去了车牌字符切割，手动特征提取等操作，简化了车牌识别过程中的步骤，通过训练好的基于精简ResNet残差网络的模型实现车牌端到端一步识别，减少之前模型的计算量及时间成本，避免误差累积，对车牌有着更好的识别效率和准确率，尤其对边界缺失，因曝光、运动、环境噪音等造成的字符模糊黏连等复杂环境下的车牌识别有着显著的性能提升。

Description

一种基于精简ResNet残差网络的车牌识别方法

技术领域

本发明涉及车辆车牌自动识别技术领域，具体涉及一种基于精简ResNet 残差网络的车牌识别方法。

背景技术

目前的车牌识别技术的总体解决方案基本上都是通过车牌图片样本训练车牌识别模型，然后在后续的应用中利用训练好的车牌模型进行识别。

现有车牌模型一般是对车牌图片使用精细的算法进行切割，将各个车牌字符分开；对各个切割好的字符图片进行特征提取；使用SVM或全连接神经网络等模型对特征进行分类实现对车牌字符的识别，最终完成车牌识别工作。通过现有车牌模型对车牌图片进行分割需要很精细的算法，不但难度大，并且对模糊的车牌图片分割效果较差，对粗略定位的车牌图片需要经过多个流程进行处理识别，容易造成误差累积，计算量大，耗时多，复杂环境(例如光照、车速、远距离、环境噪音等)下造成的车牌图片模糊及车牌字符间粘连时，容易造成无法识别的情况。

发明内容

为了解决上述问题，本发明提出一种基于精简ResNet残差网络的车牌识别方法。

为实现以上目的，本发明采用的技术方案是：

一种基于精简ResNet残差网络的车牌识别方法,包括如下步骤：

Ⅰ、输入车牌图片；

Ⅱ、使用训练好的网络模型进行车牌识别；所述网络模型训练过程如下：

a、生成或收集各种情况的车牌图片样本，包括不同倾斜度、不同模糊程度、边界缺失或多出、不同光照噪点以及不同环境干扰，使样本多样化；

b、以精简ResNet残差网络作为基础网络，构建起网络模型；

c、训练网络模型；

d、利用训练出的网络模型对车牌图片进行端到端识别及模型评估；

Ⅲ、输出识别出到的车牌号。

优选的，所述步骤Ⅱ中网络模型包括第一残差结构、第二残差结构、第三残差结构和分类层，所述第一残差结构、第二残差结构和第三残差结构均包括用于特征提取的卷积层、加快训练速度的Batch Normalization层、用于引入非线性因素的ReLu层和ELU层。

进一步的，所述第一残差结构和第二残差结构各分别包括两个卷积层，每个卷积层的卷积核为3×3，卷积步长为1×1，padding方式为SAME，神经元个数为256；

所述第三残差结构包括恒等映射卷积层和剩余映射卷积层，所述恒等映射卷积层的卷积核为1×1，步长为2×2，padding方式为VALID，神经元个数为512；所述剩余映射卷积层包括两个卷积层，分别为卷积核为3×3，步长为2×2，padding方式为VALID，神经元个数为512的卷积层和卷积核为3 ×3，步长为1×1，padding方式为SAME，神经元个数为512的卷积层。

进一步的，所述分类层包括最大池化层和两个全连接层，所述最大池化层与其中一个全连接层之间设有Flatten层，用以将输入数据转换成简单的向量；该全连接层经过用以加快训练速度的Batch Normalization层批标准化处理至另一个全连接层，然后将上述处理后的数据经过ELU层非线性变换之后使用reshape函数将数据转换成二维向量，最后通过softmax函数处理产生一系列的预测结果，就是归属分类的一个得分。

优选的，步骤Ⅱ车牌识别是利用d训练出的网络模型对待测样本进行车牌识别测试，设置置信度阈值，若检测结果置信度得分大于阈值则输出该结果；否则，丢弃。

本发明省去了车牌字符切割，手动特征提取等操作，简化了车牌识别过程中的步骤，通过训练好的基于精简ResNet残差网络的模型实现车牌端到端一步识别，减少之前模型的计算量及时间成本，避免误差累积，对车牌有着更好的识别效率和准确率，尤其对边界缺失，因曝光、运动、环境噪音等造成的字符模糊黏连等复杂环境下的车牌识别有着显著的性能提升。

附图说明

构成本发明的一部分附图用来提供对本发明的进一步理解。

在附图中：

图1为本发明一种基于精简ResNet残差网络的车牌识别方法的工作流程框图。

图2为本发明网络模型训练流程图。

图3为本发明模型网络结构图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

如图1所示，一种基于精简ResNet残差网络的车牌识别方法,包括如下步骤：

Ⅰ、输入车牌图片；

Ⅱ、使用训练好的网络模型进行车牌识别；所述网络模型训练过程如下 (如图2所示)：

b、以精简ResNet残差网络作为基础网络，添加额外辅助的网络结构作为特征提取层和分类层，构建起网络模型；

c、训练网络模型；

Ⅲ、输出识别出到的车牌号。

如图3所示，所述步骤Ⅱ中网络模型包括第一残差结构、第二残差结构、第三残差结构和分类层，所述第一残差结构、第二残差结构和第三残差结构均包括用于特征提取的卷积层、加快训练速度的Batch Normalization层、用于引入非线性因素的ReLu层和ELU层。所述第一残差结构和第二残差结构各分别包括两个卷积层，每个卷积层的卷积核为3×3，卷积步长为1×1， padding方式为SAME，神经元个数为256；所述第三残差结构包括恒等映射卷积层和剩余映射卷积层，所述恒等映射卷积层的卷积核为1×1，步长为2×2，padding方式为VALID，神经元个数为512；所述剩余映射卷积层包括两个卷积层，分别为卷积核为3×3，步长为2×2，padding方式为VALID，神经元个数为512的卷积层和卷积核为3×3，步长为1×1，padding方式为SAME，神经元个数为512的卷积层。步骤Ⅱ车牌识别是利用d训练出的网络模型对待测样本进行车牌识别测试，设置置信度阈值，若检测结果置信度得分大于阈值则输出该结果；否则，丢弃。

所述分类层包括最大池化层和两个全连接层，所述最大池化层与其中一个全连接层之间设有Flatten层，用以将输入数据转换成简单的向量；该全连接层经过用以加快训练速度的Batch Normalization层批标准化处理至另一个全连接层，然后将上述处理后的数据经过ELU层非线性变换之后使用 reshape函数将数据转换成二维向量，最后通过softmax函数处理产生一系列的预测结果，就是归属分类的一个得分。

所述网络模型的训练过程大致为：车牌样本的输入数据维度为 height*width*c，height表示样本像素高，width表示样本像素宽度，c表示样本通道数，经过一个卷积核大小为3×3，卷积步长为2×2，padding方式为SAME，神经元个数为256的卷积层，经dropout进入精简ResNet残差网络模型的第一残差结构，进行车牌样本的特征提取，提取的特征数据进入第二残差结构，对数据进行初步优化，然后进入第三残差结构进行数据的深度优化，第三残差结构输出的数据经分类层网络处理，输出数据维度为N*M，N表示一个车牌字符个数，M表示所有组成车牌的字符集个数，每个数据对应其概率，通过softmax函数计算得到M个字符集中概率最高的那个。

训练的模型目标函数可用于多目标分类，即车牌号各属车牌字符集中的哪个字符，目标的损失函数公式如下:

Loss＝-∑y_ilny′_i

其中y_i表示真实值，y'_i表示预测的类别概率。

所述网络模型的训练原理为：首先初始化网络中待训练的参数及超参数，带训练参数通过Xavier初始化。向初始化后的网络中输入训练样本数据进行网络前向传播，得到实际的输出结果。所述的训练样本数据包括归一化后的图片信息以及标签信息。使用上述的损失函数，结合反向传播BP算法调整网络参数。进行迭代训练，至损失值小于设定的阈值或达到最大迭代次数时训练结束，得到用于车牌识别的网络模型。

利用训练的基于精简ResNet残差网络模型对待测样本进行车牌识别测试。将车牌图片样本输入模型，得到识别到的车牌号和准确率。经测试本发明的基于精简ResNet残差网络结构车牌识别模型，对远景近景车牌有很高的识别率，尤其对车牌不同曝光、运动模糊、字符黏连、边界缺失、环境噪音扰动等复杂环境下的车牌图片识别效果有显著提高。故在实际应用中只需保存训练好的基于精简ResNet残差网络模型，利用模型对车牌进行端到端一步识别即可。

所述基于精简ResNet残差网络的车牌识别方法是基于计算机装置来实现的，所述计算机装置包括处理器和存储器，所述处理器读取并执行存储器中实现生成基于精简ResNet残差网络的车牌识别方法的计算机程序。

尽管参照前述实施例对本发明进行了详细的说明，对于本领域的技术人员来说，其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换,凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于精简ResNet残差网络的车牌识别方法,包括如下步骤：

Ⅰ、输入车牌图片；

b、以精简ResNet残差网络作为基础网络，构建起网络模型；

c、训练网络模型；

Ⅲ、输出识别出到的车牌号。

2.根据权利要求1所述的一种基于精简ResNet残差网络的车牌识别方法，其特征在于：所述步骤Ⅱ中网络模型包括第一残差结构、第二残差结构、第三残差结构和分类层，所述第一残差结构、第二残差结构和第三残差结构均包括用于特征提取的卷积层、加快训练速度的Batch Normalization层、用于引入非线性因素的ReLu层和ELU层。

3.根据权利要求2所述的一种基于精简ResNet残差网络的车牌识别方法，其特征在于：

所述第一残差结构和第二残差结构各分别包括两个卷积层，每个卷积层的卷积核为3×3，卷积步长为1×1，padding方式为SAME，神经元个数为256；

所述第三残差结构包括恒等映射卷积层和剩余映射卷积层，所述恒等映射卷积层的卷积核为1×1，步长为2×2，padding方式为VALID，神经元个数为512；所述剩余映射卷积层包括两个卷积层，分别为卷积核为3×3，步长为2×2，padding方式为VALID，神经元个数为512的卷积层和卷积核为3×3，步长为1×1，padding方式为SAME，神经元个数为512的卷积层。

4.根据权利要求3所述的一种基于精简ResNet残差网络的车牌识别方法，其特征在于：所述分类层包括最大池化层和两个全连接层，所述最大池化层与其中一个全连接层之间设有Flatten层，用以将输入数据转换成简单的向量；该全连接层经过用以加快训练速度的Batch Normalization层批标准化处理至另一个全连接层，然后将上述处理后的数据经过ELU层非线性变换之后使用reshape函数将数据转换成二维向量，最后通过softmax函数处理产生一系列的预测结果，就是归属分类的一个得分。

5.根据权利要求1所述的一种基于精简ResNet残差网络的车牌识别方法，其特征在于：步骤Ⅱ车牌识别是利用d训练出的网络模型对待测样本进行车牌识别测试，设置置信度阈值，若检测结果置信度得分大于阈值则输出该结果；否则，丢弃。