CN116935373A

CN116935373A - 多类型车牌识别模型的训练方法、装置、设备及存储介质

Info

Publication number: CN116935373A
Application number: CN202311201382.XA
Authority: CN
Inventors: 殷绪成; 刘琦; 陈松路; 陈�峰
Original assignee: Zhuhai Eeasy Electronic Tech Co ltd
Current assignee: Zhuhai Eeasy Electronic Tech Co ltd
Priority date: 2023-09-18
Filing date: 2023-09-18
Publication date: 2023-10-24
Anticipated expiration: 2043-09-18
Also published as: CN116935373B

Abstract

本发明适用图像识别技术领域，提供了一种多类型车牌识别模型的训练方法，该方法包括：通过编码器对车牌样本图像进行特征提取，得到车牌样本图像的样本视觉特征，通过解码器对样本视觉特征进行特征提取，得到车牌样本图像中每个样本字符的样本字符特征，根据样本字符特征，通过字符分类器获得到对应样本字符的样本分类概率，基于对比学习损失函数，根据样本字符特征确定对比学习损失值，并基于交叉熵损失函数，根据样本分类概率和预设的样本字符真值确定交叉熵损失值，根据交叉熵损失值和对比学习损失值，对多类型车牌识别模型进行训练，从而通过采用对比学习策略对模型进行训练，降低了模型对形近字错识的概率，提升了模型识别性能和训练效果。

Description

多类型车牌识别模型的训练方法、装置、设备及存储介质

技术领域

本发明属于图像识别技术领域，尤其涉及一种多类型车牌识别模型的训练方法、装置、设备及存储介质。

背景技术

在日常生活中，不同类型的车牌根据其使用用途应用于不同的车辆上，不同类型的车牌在字符字体、字号、排版以及背景底色等方面都有所不同，这对于搭建统一的多类型车牌识别模型带来了很大挑战。虽然车牌识别技术已经广泛应用于高速收费卡口、停车场卡口、交通监管等场景，但是现有的车牌识别技术大多只针对一种车牌类型，因此在识别不同种类车牌前需要先判断车牌的类型，具体来说，需要首先利用车牌分类技术将车牌进行分类，再利用其对应的车牌识别方法进行车牌识别，这类车牌识别技术需要较大的存储空间存储每个车牌类型对应的车牌识别模型，因此不利于边缘端设备即资源受限设备上的部署。

近几年来，学术界及工业界涌现出一些多类型车牌识别技术，这类车牌识别技术依托于统一的多类型车牌识别模型，因此不需要预先判断车牌类型，可以直接识别不同类型的车牌。一些研究者提出使用YOLO（You Only Look Once）或基于区域卷积网络的快速目标检测方法（Fast Region-based Convolutional Neural Network，Fast-RCNN）等目标检测网络检测字符的位置并识别字符类别，再根据字符的位置组合为完整的车牌号；相似地，一些方法提出利用mask-RCNN等图像分割算法对字符进行分割并识别，再按照一定地顺序排列识别的字符以得到完整的车牌号，以上方法虽然能够很好的应用于多类型车牌任务中，但是字符的检测或是分割需要大量的字符级标注信息进行训练，而人工标注字符位置信息成本很高，为了避免使用字符位置信息，一些方法提出将车牌识别看作为序列识别任务，采用注意力机制自适应定位字符的位置并识别，为了同时能够识别单行车牌和双行车牌，这些方法提出在二维（2D）空间中计算注意力，例如，有现有技术利用二维空间注意力算法搭建了一个统一的多类型车牌识别模型，该模型通过卷积神经网络来计算每个字符的空间注意力，从而得到每个字符的视觉特征并进行分类；EILPR（EILPR : Toward End-to-EndIrregular License Plate Recognition Based on Automatic）提出了一种引入车牌字符行数先验信息的二维注意力车牌识别方法，该方法对于双行的车牌开放所有的视觉特征，但是对于单行车牌会屏蔽掉上半部分的特征以去除干扰信息，但是以上现有技术都忽略了一个问题：形近字错识别的问题。由于每个类型的车牌都具有其对应规定的字体，多类型车牌的识别包含了多种字体的混杂，而多样的字体会导致部分不同类别的字符具有相似的字形，因此形近字相互混淆的问题更为突出，比如，1和I字形相近，容易互相错识。

发明内容

本发明的目的在于提供一种多类型车牌识别模型的训练方法、装置、设备及存储介质，旨在解决由于现有技术训练的车牌识别模型导致形近字识别的错误率高、识别性能低的问题。

一方面，本发明提供了一种多类型车牌识别模型的训练方法，所述多类型车牌识别模型包括编码器、解码器以及字符分类器，所述方法包括下述步骤：

通过所述编码器对车牌样本图像进行特征提取，得到所述车牌样本图像的样本视觉特征；

通过所述解码器对所述样本视觉特征进行特征提取，得到所述车牌样本图像中每个样本字符的样本字符特征；

根据所述样本字符特征，通过所述字符分类器获得到对应样本字符的样本分类概率；

基于预设的对比学习损失函数，根据所述样本字符特征，确定对比学习损失值，并基于预设的交叉熵损失函数，根据所述样本分类概率和预设的样本字符真值，确定交叉熵损失值；

根据所述交叉熵损失值和所述对比学习损失值，对所述多类型车牌识别模型进行训练。

优选地，所述解码器包括自注意力模块和注意力模块，所述通过所述解码器对所述样本视觉特征进行特征提取的步骤，包括：

在所述样本视觉特征中嵌入位置编码特征，得到第一特征；

通过所述自注意力模块对所述第一特征进行自注意力计算，得到第二特征；

通过所述注意力模块对所述第二特征进行注意力计算，得到所述样本字符特征。

优选地，所述通过所述注意力模块对所述第二特征进行注意力计算的步骤，包括：

基于所述注意力模块和所述第二特征，得到用于注意力计算的查询向量、键向量以及值向量；

利用双曲正切函数对所述查询向量和所述键向量的相似度进行计算，并利用归一化指数函数对计算得到的所述相似度进行归一化处理，得到注意力值；

将所述注意力值和所述值向量进行加权求和，得到所述样本字符特征。

优选地，所述基于预设的对比学习损失函数，根据所述样本字符特征，确定对比学习损失值的步骤，包括：

根据从映射到预设的特征对比空间的所述样本字符特征中确定的锚点，将所述样本字符特征分为正样本和负样本；

将所述锚点分别与所述正样本和所述负样本进行相似度计算，得到第一相似度和第二相似度；

基于所述对比学习损失函数，根据所述第一相似度和所述第二相似度进行对比损失计算，得到所述对比学习损失值。

优选地，所述编码器包含6组由一个卷积层、一个批归一化层以及一个ReLU激活层组成的卷积单元和2个的最大池化层，其中，一个最大池化层连接在第二组卷积单元和第三组卷积单元之间，另一个最大池化层连接在第四组卷积单元和第五组卷积单元之间。

另一方面，本发明提供了一种基于上述训练方法得到的多类型车牌识别模型的多类型车牌识别方法，所述方法包括下述步骤：

对待识别的车牌图像进行特征提取，得到所述车牌图像中的视觉特征；

对所述视觉特征进行特征提取，得到所述车牌图像中每个字符的字符特征；

对所述字符特征进行字符分类，得到对应字符的分类概率；

根据所述分类概率，得到所述车牌图像的识别结果。

另一方面，本发明提供了一种多类型车牌识别模型的训练装置，所述多类型车牌识别模型包括编码器、解码器以及字符分类器，所述装置包括：

视觉特征获得单元，用于通过所述编码器对车牌样本图像进行特征提取，得到所述车牌样本图像的样本视觉特征；

字符特征获得单元，用于通过所述解码器对所述样本视觉特征进行特征提取，得到所述车牌样本图像中每个样本字符的样本字符特征；

分类概率获得单元，用于根据所述样本字符特征，通过所述字符分类器获得到对应样本字符的样本分类概率；

损失值确定单元，用于基于预设的对比学习损失函数，根据所述样本字符特征，确定对比学习损失值，并基于预设的交叉熵损失函数，根据所述样本分类概率和预设的样本字符真值，确定交叉熵损失值；以及

识别模型训练单元，用于根据所述交叉熵损失值和所述对比学习损失值，对所述多类型车牌识别模型进行训练。

另一方面，本发明提供了一种基于上述训练装置得到的多类型车牌识别模型的多类型车牌识别装置，所述装置包括：

第一特征提取单元，用于对待识别的车牌图像进行特征提取，得到所述车牌图像中的视觉特征；

第二特征提取单元，用于对所述视觉特征进行特征提取，得到所述车牌图像中每个字符的字符特征；

字符特征分类单元，用于对所述字符特征进行字符分类，得到对应字符的分类概率；以及

识别结果获得单元，用于根据所述分类概率，得到所述车牌图像的识别结果。

另一方面，本发明还提供了一种计算设备，包括存储器、处理器以及存储在所述存储器中并在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如上述多类型车牌识别模型的训练方法所述的步骤。

另一方面，本发明还提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现如上述多类型车牌识别模型的训练方法所述的步骤。

本发明通过编码器对车牌样本图像进行特征提取，得到车牌样本图像的样本视觉特征，通过解码器对样本视觉特征进行特征提取，得到车牌样本图像中每个样本字符的样本字符特征，根据样本字符特征，通过字符分类器获得到对应样本字符的样本分类概率，基于对比学习损失函数，根据样本字符特征确定对比学习损失值，并基于交叉熵损失函数，根据样本分类概率和预设的样本字符真值确定交叉熵损失值，根据交叉熵损失值和对比学习损失值，对多类型车牌识别模型进行训练，从而通过采用对比学习策略对模型进行训练，降低了模型对形近字错识的概率，提升了模型识别性能和训练效果。

附图说明

图1是本发明实施例一提供的多类型车牌识别模型的训练方法的实现流程图；

图2是本发明实施例一提供的多类型车牌识别模型的训练方法中编码器的结构示意图；

图3是本发明实施例二提供的多类型车牌识别方法的实现流程图；

图4是本发明实施例三提供的多类型车牌识别模型的训练装置的结构示意图；

图5是本发明实施例四提供的多类型车牌识别装置的结构示意图；

图6是本发明实施例五提供的计算设备的结构示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

以下结合具体实施例对本发明的具体实现进行详细描述：

实施例一：

图1示出了本发明实施例一提供的多类型车牌识别模型的训练方法的实现流程，为了便于说明，仅示出了与本发明实施例相关的部分，详述如下：

在步骤S101中，通过编码器对车牌样本图像进行特征提取，得到车牌样本图像的样本视觉特征。

本发明实施例适用于计算设备，例如，个人计算机、服务器等。在本发明实施例中，基于编码器-解码器（Encoder-Decoder）结构构建包括编码器、解码器以及字符分类器的多类型车牌识别模型，其中，编码器为一个轻量级的直连卷积神经网络，用于提取车牌样本图像中的样本视觉特征，通过编码器提取出的这个视觉特征可以看作是整个车牌样本图像中的所有视觉特征。

在一个可行的实施例中，如图2所示的编码器结构，编码器包含6组卷积单元和2个的最大池化层（Max Pooling），其中，一个最大池化层连接在第二组卷积单元和第三组卷积单元之间，以对第二组卷积单元输出的特征进行二倍下采样，另一个最大池化层连接在第四组卷积单元和第五组卷积单元之间，以对第四组卷积单元输出的特征进行二倍下采样，同时，每个卷积单元包括一个卷积层、一个批归一化层（BatchNorm，BN）以及一个ReLU激活层，且卷积层、BN层以及激活层之间依次连接，从而提高了提取的视觉特征的特征显著性。作为示例地，将高度为32像素、宽度为96像素、通道数为3的车牌样本图像输入上述结构的编码器，对该车牌样本图像进行卷积、批归一化、激活以及二倍下采样处理，得到高度为8像素、宽度为24像素、通道数为64的样本视觉特征。

在步骤S102中，通过解码器对样本视觉特征进行特征提取，得到车牌样本图像中每个样本字符的样本字符特征。

在本发明实施例中，将车牌样本图像中的车牌号看作一个从左到右的序列，以避免字符分割，并采用基于注意力机制的解码器对样本视觉特征进行特征提取，以从整图的视觉特征中提取出单个字符的特征，得到车牌样本图像中每个样本字符的样本字符特征，其中，解码器包括一个由两层级联的多头自注意力层组成的自注意力模块和一个基于循环卷积神经网络（Recurrent neural network，RNNs）的注意力模块。

在一个可行的实施例中，通过下述步骤实现对样本视觉特征的特征提取：

（1）在样本视觉特征中嵌入位置编码特征，得到第一特征。

在本发明实施例中，首先将样本视觉特征F在高度和宽度维度上展平，变形为一个二维特征，再根据位置编码（Position Embedding ，PE）特征计算公式获得在高度维度和宽度维度上的位置编码特征，最后，将位置编码特征嵌入到F中，即，得到第一特征，以在第一特征中引入变形前的样本视觉特征的每个位置的高、宽位置信息，其中，是位置，是特征维度的索引，是编码器输出特征的通道数。

（2）通过自注意力模块对第一特征进行自注意力计算，得到第二特征。

在本发明实施例中，将整合了位置信息的第一特征送入自注意力模块，采用点乘（dot-product）注意力计算算法对进行自注意力计算，得到更关注字符布局的视觉特征，即第二特征，具体地，自注意力计算过程以公式表示为：，其中，均为可学习参数，此外，多头自注意力的头数经验性地设置为2，隐层维度设置为256。

（3）通过注意力模块对第二特征进行注意力计算，得到样本字符特征。

在本发明实施例中，通过下述步骤实现对第二特征的注意力计算：

①基于注意力模块和第二特征，得到用于注意力计算的查询向量、键向量以及值向量。

在本发明实施例中，将第二特征作为键向量和值向量，键-值向量对（key- value set）代表样本车牌的样本视觉特征及其索引，并将上一时刻的RNNs隐含层的输出作为查询向量（query），其代表查询字符位置的特征。

②利用双曲正切函数对查询向量和键向量的相似度进行计算，并利用归一化指数函数对计算得到的相似度进行归一化处理，得到注意力值。

在本发明实施例中，利用双曲正切函数（即tanh函数）计算查询向量和键向量的相似度，接着该相似度被归一化指数函数（即softmax函数）进行归一化，得到了加权权重，该加权权重即为注意力值，注意力值代表了样本字符在车牌样本图像中的位置。

③将注意力值和值向量进行加权求和，得到样本字符特征。

上述步骤①-③的注意力计算过程总结为下述公式：，其中，为键向量，为值向量，分别为时刻、高度以及宽度维度上的索引，为查询向量和键向量的相似度，表示计算得到的加权权重即注意力值，表示经过加权求和后新的特征即样本字符特征，均为可学习参数，和分别代表RNN算子和双曲正切函数，RNNs的输入为当前时刻的样本字符特征、当前时刻的预测结果以及上一时刻隐含层的输出。

通过上述步骤①-③实现对第二特征的注意力计算，其中，将作为键向量，使得键向量中包含了更多关于字符布局的信息，从而提高了生成的注意力值的准确性，进而提高字符位置定位的精准度。

在上述步骤（1）-（3）中，首先通过自注意力算子挖掘出字符位置关系信息，再采用注意力机制感知每个样本字符在车牌样本图像中的位置，实现从整图的视觉特征中提取出单个样本字符的特征，从而提高了提取到的样本字符特征的准确性和显著性。

在步骤S103中，根据样本字符特征，通过字符分类器获得到对应样本字符的样本分类概率。

在本发明实施例中，字符分类器是由一层全连接层组成，每个样本字符的样本字符特征经过字符分类器映射后，得到每个样本字符的样本分类概率。

在步骤S104中，基于预设的对比学习损失函数，根据样本字符特征，确定对比学习损失值，并基于预设的交叉熵损失函数，根据样本分类概率和预设的样本字符真值，确定交叉熵损失值。

在本发明实施例中，通过下述步骤实现对比学习损失值的确定：

（1）根据从映射到预设的特征对比空间的样本字符特征中确定的锚点，将样本字符特征分为正样本和负样本。

在本发明实施例中，通过预先搭建的一个包含两层全连接层的映射网络将所有样本字符的样本字符特征映射到可以对比特征的特征空间中（即特征对比空间），在该特征对比空间中，给定一个样本字符的特征作为锚点，则样本字符特征中与锚点具有相同位置和类别的特征看作正样本，不同位置或类别的特征看作负样本。在此需要说明的是，车牌样本图像中每一个样本字符对应的样本字符特征都是一个锚点，有其对应的正样本和负样本，每一个锚点都要算一次对比损失，最终的对比损失为各个锚点对比损失之和，例如，图里有8个字符，就是8个锚点，针对每个锚点算1次对比损失，再对8个锚点得到对比损失进行求和，得到最终的对比学习损失值。

（2）将锚点分别与正样本和负样本进行相似度计算，得到第一相似度和第二相似度。

在本发明实施例中，计算锚点与正样本的余弦距离，得到锚点与正样本之间的第一相似度，并计算锚点与负样本的余弦距离，得到锚点与负样本之间的第二相似度。

（3）基于对比学习损失函数，根据第一相似度和第二相似度进行对比损失计算，得到对比学习损失值。

在本发明实施例中，基于对比学习损失函数，根据第一相似度和第二相似度进行对比损失计算，得到对比学习损失值，其中，，，代表一个批次中所有样本字符特征经过映射网络映射后组成的集合，为字符特征索引的集合，M为字符特征索引最大值，即一个训练批次中的字符个数；是样本字符特征i（即锚点）的所有正样本集合，即与i具有相同位置和类别的样本字符特征；是样本字符特征i的所有负样本集合，即位置或类别与i不同的特征；为温度参数，通常选用0.01。

通过上述步骤（1）-（3）确定了对比学习损失值，从而通过在特征对比空间中，采用位置感知的对比学习算法拉近处于相同位置且字符类别相同的不同实例的字形图像，推远不同位置或不同字符类别的相似字符图像，使得字符类内间距减小，类间间距增大，增加了字符特征区分性，使得形近字更易区分。

在本发明实施例中，除了对比学习损失，还设计了交叉熵损失函数用于多类型车牌识别模型的训练，其中，N为样本字符总个数，为字符类别总数，为预设的样本字符真值，为模型输出的样本分类概率。

在步骤S105中，根据交叉熵损失值和对比学习损失值，对多类型车牌识别模型进行训练。

在本发明实施例中，对多类型车牌识别模型的训练包含两部分，一个是交叉熵损失，另一个是对比学习损失，即模型总的训练损失函数为：，其中，经验性地选择=0.1，在训练中，通过交叉熵损失值对模型的识别结果进行监督，以达到区分字符的目的，同时，通过对比学习，最大化正样本与锚点之间的余弦距离，最小化负样本与锚点之间的余弦距离，以达到让字符特征区分度更大的目的，比如，增大形近字“0和D”或“5和S”之间的区分性，从而提高模型的鲁棒性，另外，由于多类型车牌的字符个数不等，因此，引入空白字符并将空白字符补充到较短的车牌号末尾，这样所有车牌的字符个数相同，以实现模型的并行训练，并且，训练好的多类型车牌识别模型不需要对车牌类型预先进行分类，可以自适应识别多种类型车牌，例如，测试时将车牌图像输入多类型车牌识别模型，不需要对车牌类型预先进行分类，该多类型车牌识别模型可以直接准确识别出不同类型（样式）的车牌。

在一个可行的实施例中，不需要对多类型车牌识别模型进行预训练，直接从头训练多类型车牌识别模型，且在训练中，采用自适应矩估计（Adaptive Moment Estimation，Adam）优化策略对模型进行优化，具体地，训练时批大小（batchsize）设置为256，且每一种类型的车牌数量在一个批次中保持相同，初始学习率设置为0.001，权重衰减参数设置为5×10-4，动量参数为0.9。另外，对于不同地区的车牌数据集，多类型车牌识别模型是分别进行训练和测试的。

在此，结合不同地区的车牌数据集验证模型的训练效果，实验的测评指标是车牌识别的准确率，计算方式为正确识别样本数与样本总数的比值，其中，只有车牌号中每个字符都被正确识别才会看作正确识别的样本，具体实验详述如下：

实验一、利用巴西车牌数据集对多类型车牌识别模型进行训练，其中，该数据集包括四种车牌类型，分别是巴西旧版单、双行车牌以及巴西新版单、双车牌，每个类型5000张图像，一共20000张。训练、验证以及测试的划分比例是2：1：2。

将根据巴西车牌数据集训练的多类型车牌识别模型分别与卷积循环神经网络（Convolutional Recurrent Neural Network，CRNN ）模型、TRBA（TPS-ResNet-BiLSTM-Attention）模型以及层次聚类（Hierarchical Clustering，HC）模型的车牌识别性能进行比较，表1示出了这些模型在多类型的巴西车牌数据集上的测试结果，从表1可以看出本发明训练的多类型车牌识别模型的车牌识别性能远超出其他模型，尤其是在双行车牌数据集中（即摩托车车牌），这说明了本发明在多类型车牌识别任务中的优势，证明了本发明的有效性。

表1

实验二、利用中国车牌数据集对多类型车牌识别模型进行训练，其中，中国车牌数据集包含了蓝色单行车牌、绿色单行车牌、黄色双行车牌和白色单行车牌这四种类型的车牌，同时本发明利用车牌模板和随机生成的车牌号合成了10000张车牌训练集，其中每个车牌类型包含2500张。

将根据多类型的中国车牌数据集训练的多类型车牌识别模型分别与CRNN模型、HC模型以及车牌识别网络（License Plate Recognition Network，LPRNet）模型的车牌识别性能进行比较，表2示出了这些模型在多类型的中国车牌数据集上的测试结果，从表2可以看出本发明在各个子集上的整体表现显著超过其他方法，虽然CRNN方法比本发明在单行蓝牌上性能高，但是它在双行车牌上性能极差，表明它过拟合了单行车牌的数据分布，与之相反，本发明可以在多种类型的车牌上都取得了最优或是次优的性能，更适合应用于多类型车牌识别中，此外，经测量，本发明的参数量为236K，远小于其他模型的参数量（6.8M~8.5M），更适合部署到低资源的边缘端上。

表2

实验三、消融实验：搭建了一个去除对别学习损失以及自注意力层的网络作为基线模型，此外，在实验中，还将本发明提出的对比学习算法替换为普通的对比学习算法进行比较，表3示出了消融实验结果，从表3可以看出，本发明可以明显超过基线模型的性能且对于普通的对比学习也有明显的性能提升，这说明本发明设计的对比学习比起普通对比学习更适合多类型车牌识别，其保证了识别的高性能。

表3

在本发明实施例中，通过编码器对车牌样本图像进行特征提取，得到车牌样本图像的样本视觉特征，通过解码器对样本视觉特征进行特征提取，得到车牌样本图像中每个样本字符的样本字符特征，根据样本字符特征，通过字符分类器获得到对应样本字符的样本分类概率，基于对比学习损失函数，根据样本字符特征确定对比学习损失值，并基于交叉熵损失函数，根据样本分类概率和预设的样本字符真值确定交叉熵损失值，根据交叉熵损失值和对比学习损失值，对多类型车牌识别模型进行训练，从而通过采用位置感知的对比学习策略对模型进行训练，以对字符特征的区分性进行加强，降低了模型对形近字错识的概率，提升了模型识别性能和训练效果。

实施例二：

图3示出了本发明实施例二提供的多类型车牌识别方法的实现流程，为了便于说明，仅示出了与本发明实施例相关的部分，详述如下：

将待识别的车牌图像输入到实施例一训练方法得到的多类型车牌识别模型中，以对车牌图像中的车牌号进行识别，具体地，通过下述步骤实现车牌识别：

在步骤S301中，对待识别的车牌图像进行特征提取，得到车牌图像中的视觉特征。

在步骤S302中，对视觉特征进行特征提取，得到车牌图像中每个字符的字符特征。

在步骤S303中，对字符特征进行字符分类，得到对应字符的分类概率。

在本发明实施例中，由于本实施例为多类型车牌识别模型的应用过程，而模型的应用过程的原理与训练过程的原理类似，因此，步骤S301-步骤S303的具体实施方式可以参见实施例一的步骤S101-S103的描述，在此不再赘述。

在步骤S304中，根据分类概率，得到车牌图像的识别结果。

在本发明实施例中，取分类概率最大的字符类别即可得到最终的识别结果，也即是多类型车牌识别模型输出的车牌图像中的车牌号。

在本发明实施例中，直接将待识别的车牌图像输入到采用了位置感知的对比学习算法训练的多类型车牌识别模型中，不需要对车牌类型预先进行分类，多类型车牌识别模型即可自适应识别出多类型车牌，从而提高识别速度和识别准确度。

实施例三：

图4示出了本发明实施例三提供的多类型车牌识别模型的训练装置的结构，为了便于说明，仅示出了与本发明实施例相关的部分，其中包括：

视觉特征获得单元41，用于通过编码器对车牌样本图像进行特征提取，得到车牌样本图像的样本视觉特征；

字符特征获得单元42，用于通过解码器对样本视觉特征进行特征提取，得到车牌样本图像中每个样本字符的样本字符特征；

分类概率获得单元43，用于根据样本字符特征，通过字符分类器获得到对应样本字符的样本分类概率；

损失值确定单元44，用于基于预设的对比学习损失函数，根据样本字符特征，确定对比学习损失值，并基于预设的交叉熵损失函数，根据样本分类概率和预设的样本字符真值，确定交叉熵损失值；以及

识别模型训练单元45，用于根据交叉熵损失值和对比学习损失值，对多类型车牌识别模型进行训练。

在本发明实施例中，基于对比学习的多类型车牌识别装置的各单元可由相应的硬件或软件单元实现，各单元可以为独立的软、硬件单元，也可以集成为一个软、硬件单元，在此不用以限制本发明。具体地，各单元的实施方式可参考前述实施例一的描述，在此不再赘述。

实施例四：

图5示出了本发明实施例四提供的多类型车牌识别装置的结构，为了便于说明，仅示出了与本发明实施例相关的部分，其中包括：

第一特征提取单元51，用于对待识别的车牌图像进行特征提取，得到车牌图像中的视觉特征；

第二特征提取单元52，用于对视觉特征进行特征提取，得到车牌图像中每个字符的字符特征；

字符特征分类单元53，用于对字符特征进行字符分类，得到对应字符的分类概率；以及

识别结果获得单元54，用于根据分类概率，得到车牌图像的识别结果。

在本发明实施例中，基于对比学习的多类型车牌识别装置的各单元可由相应的硬件或软件单元实现，各单元可以为独立的软、硬件单元，也可以集成为一个软、硬件单元，在此不用以限制本发明。具体地，各单元的实施方式可参考前述实施例二的描述，在此不再赘述。

实施例五：

图6示出了本发明实施例五提供的计算设备的结构，为了便于说明，仅示出了与本发明实施例相关的部分。

本发明实施例的计算设备6包括处理器60、存储器61以及存储在存储器61中并可在处理器60上运行的计算机程序62。该处理器60执行计算机程序62时实现上述多类型车牌识别模型的训练方法实施例中的步骤，例如图1所示的步骤S101至S105。或者，处理器60执行计算机程序62时实现上述各装置实施例中各单元的功能，例如图4所示单元41至45的功能。

在本发明实施例中，通过编码器对车牌样本图像进行特征提取，得到车牌样本图像的样本视觉特征，通过解码器对样本视觉特征进行特征提取，得到车牌样本图像中每个样本字符的样本字符特征，根据样本字符特征，通过字符分类器获得到对应样本字符的样本分类概率，基于对比学习损失函数，根据样本字符特征确定对比学习损失值，并基于交叉熵损失函数，根据样本分类概率和预设的样本字符真值确定交叉熵损失值，根据交叉熵损失值和对比学习损失值，对多类型车牌识别模型进行训练，从而通过采用对比学习策略对模型进行训练，降低了模型对形近字错识的概率，提升了模型识别性能和训练效果。

本发明实施例的计算设备可以为个人计算机、服务器。该计算设备6中处理器60执行计算机程序62时实现多类型车牌识别模型的训练方法时实现的步骤可参考前述方法实施例的描述，在此不再赘述。

实施例六：

在本发明实施例中，提供了一种计算机可读存储介质，该计算机可读存储介质存储有计算机程序，该计算机程序被处理器执行时实现上述多类型车牌识别模型的训练方法实施例中的步骤，例如，图1所示的步骤S101至S105。或者，该计算机程序被处理器执行时实现上述各装置实施例中各单元的功能，例如图4所示单元41至45的功能。

本发明实施例的计算机可读存储介质可以包括能够携带计算机程序代码的任何实体或装置、记录介质，例如，ROM/RAM、磁盘、光盘、闪存等存储器。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

Claims

1.一种多类型车牌识别模型的训练方法，其特征在于，所述多类型车牌识别模型包括编码器、解码器以及字符分类器，所述方法包括下述步骤：

2.如权利要求1所述的方法，其特征在于，所述解码器包括自注意力模块和注意力模块，所述通过所述解码器对所述样本视觉特征进行特征提取的步骤，包括：

在所述样本视觉特征中嵌入位置编码特征，得到第一特征；

3.如权利要求2所述的方法，其特征在于，所述通过所述注意力模块对所述第二特征进行注意力计算的步骤，包括：

4.如权利要求1所述的方法，其特征在于，所述基于预设的对比学习损失函数，根据所述样本字符特征，确定对比学习损失值的步骤，包括：

5.如权利要求1所述的方法，其特征在于，所述编码器包含6组由一个卷积层、一个批归一化层以及一个ReLU激活层组成的卷积单元和2个的最大池化层，其中，一个最大池化层连接在第二组卷积单元和第三组卷积单元之间，另一个最大池化层连接在第四组卷积单元和第五组卷积单元之间。

6.一种基于权利要求1-5任一训练方法得到的多类型车牌识别模型的多类型车牌识别方法，其特征在于，所述方法包括下述步骤：

对所述字符特征进行字符分类，得到对应字符的分类概率；

根据所述分类概率，得到所述车牌图像的识别结果。

7.一种多类型车牌识别模型的训练装置，其特征在于，所述多类型车牌识别模型包括编码器、解码器以及字符分类器，所述装置包括：

8.一种基于权利要求7得到的多类型车牌识别模型的多类型车牌识别装置，其特征在于，所述装置包括：

9.一种计算设备，包括存储器、处理器以及存储在所述存储器中并在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至6任一项所述方法的步骤。

10.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至6任一项所述方法的步骤。