CN112541500B

CN112541500B - 一种端到端的车牌识别方法及装置

Info

Publication number: CN112541500B
Application number: CN202011414553.3A
Authority: CN
Inventors: 请求不公布姓名; 班华忠; 王正; 崔凯
Original assignee: Beijing Icetech Science & Technology Co ltd
Current assignee: Beijing Icetech Science & Technology Co ltd
Priority date: 2020-12-03
Filing date: 2020-12-03
Publication date: 2023-07-25
Anticipated expiration: 2040-12-03
Also published as: CN112541500A

Abstract

本发明提供了一种端到端的车牌识别方法，该方法包括：输入图像，采用主干网络，从图像中提取最后一层的特征图作为输入特征图；针对输入特征图，分别添加预测车牌中心点热力图的卷积层、预测车牌中心点偏置损失的卷积层、预测车牌矩形顶点热力图的卷积层、预测车牌矩形顶点偏置损失的卷积层，以获取特征图中车牌中心点位置和车牌顶点坐标；根据输入特征图中车牌顶点坐标，对特征图进行贝塞尔车牌对齐处理，获得输出特征图；针对输出特征图，添加车牌字符识别网络层，在训练阶段，对输出特征图进行训练，在预测阶段，对输出特征图进行车牌字符识别，输出车牌字符识别结果。与现有技术相比，本发明能快速地进行车牌识别，且识别准确率高。

Description

一种端到端的车牌识别方法及装置

技术领域

本发明涉及图像处理、智慧停车、车牌识别，特别涉及一种端到端的车牌识别方法及装置。

背景技术

目标随着城市的日益现代化，机动车的保有量持续增加，智能交通系统发挥着越来越重要的作用。不论是当今各种交通场合，还是公共安全管理系统，抑或未来无人汽车、无人驾驶领域，车牌识别都是一个不可或缺的过程，给城市健康有序管理带来了诸多便捷。

现有的车牌检测方法主要包括：(1)基于传统的非深度学习的车牌识别方法，该方法包括车牌定位、车牌分割和车牌字符识别等流程，引入了大量的先验信息和规则，对极端场景或者新的车牌类型则需要大量的改进和调优，增加了开发的难度；(2)基于深度学习的车牌识别方法，该方法主要包括基于深度学习的车牌定位、车牌矫正和基于深度车牌字符识别等流程，能够获得较高的识别率，但由于把车牌定位和车牌字符识别分开处理，在特征计算上带来了冗余，在优化角度上来讲也不是最优。

综上所述，目前迫切需要提出一种减少计算量、节省运算资源的一种端到端的车牌识别方法。

发明内容

有鉴于此，本发明的主要目的在于快速实现车牌识别，且识别准确率较高。

为达到上述目的，按照本发明的第一个方面，提供了一种端到端的车牌识别方法，该方法包括：

第一步骤，输入图像，采用主干网络，从图像中提取最后一层的特征图作为输入特征图；针对输入特征图，分别添加预测车牌中心点热力图的卷积层、预测车牌中心点偏置损失的卷积层、预测车牌矩形顶点热力图的卷积层、预测车牌矩形顶点偏置损失的卷积层，以获取特征图中车牌中心点位置和车牌顶点坐标；

第二步骤，根据输入特征图中车牌顶点坐标，对特征图进行贝塞尔车牌对齐处理，获得输出特征图；

第三步骤，针对输出特征图，添加车牌字符识别网络层，在训练阶段，对输出特征图进行训练，在预测阶段，对输出特征图进行车牌字符识别，输出车牌字符识别结果。

其中，所述预测车牌中心点热力图卷积层用于判断输入特征图中是否有车牌，其网络结构包括：第一层：3*3卷积，步长stride＝1，填充pad＝1，滤波器个数128，激活函数为Relu；第二层：1*1卷积，步长stride＝1，填充pad＝0，滤波器个数1。

所述预测车牌中心点偏置损失卷积层用于修正车牌中心点位置，使位置更准确，其结构包括：第一层：3*3卷积，步长stride＝1，填充pad＝1，滤波器个数128，激活函数为Relu；第二层：1*1卷积，步长stride＝1，填充pad＝0，滤波器个数2。

所述预测车牌矩形顶点热力图的卷积层和所述预测车牌矩形顶点偏置损失的卷积层用于输出车牌顶点坐标。

所述预测车牌矩形顶点热力图的卷积层的结构包括：第一层：3*3卷积，步长stride＝1，填充pad＝1，滤波器个数128，激活函数为Relu；第二层：1*1卷积，步长stride＝1，填充pad＝0，滤波器个数n，其中n为预测车牌顶点的个数。

所述预测车牌矩形顶点偏置损失的卷积层的结构包括：第一层：3*3卷积，步长stride＝1，填充pad＝1，滤波器个数128，激活函数为Relu；第二层：1*1卷积，步长stride＝1，填充pad＝0，滤波器个数2。

进一步地，所述第二步骤包括：

输出特征图归一化步骤：对于第n个通道的输入特征图Fin，选取第n个通道的输出特征图Fout上的任意一点P(x,y)，对点P(x,y)的坐标进行归一化处理，获得归一化的坐标点(u,v)，其中u＝x/W_out，v＝y/H_out，W_out和H_out表示输出特征图的宽度和高度，n∈[1,N]，N为输入特征图Fin的通道的个数；

贝塞尔曲线计算步骤：对于归一化的坐标点(u,v)，将曲线长度比例t＝u，根据贝塞尔曲线公式，分别获得上边缘点在X坐标轴上的贝塞尔曲线B′_x(t)和Y坐标轴上的贝塞尔曲线B′_y(t)，获得下边缘点在X坐标轴上的贝塞尔曲线B″_x(t)和Y坐标轴上的贝塞尔曲线B″_y(t)；

输入特征图映射点获取步骤，根据获取的上边缘点在X坐标轴上的贝塞尔曲线B′_x(t)和Y坐标轴上的贝塞尔曲线B′_y(t)、下边缘点在X坐标轴上的贝塞尔曲线B″_x(t)和Y坐标轴上的贝塞尔曲线B″_y(t)，分别根据公式P_c(x)＝B″_x(t)*v+B′_x(t)*(1-v)和P_c(y)＝B″_y(t)*v+B′_y(t)*(1-v)，将P_c(x)和P_c(y)作为中心点P_c(x，y)的X和Y坐标；对P_c(x)和P_c(y)分别取整后得到x_l和y_l，获取中心点P_c(x，y)的四个邻近点P_c，0(x_l，y_l)、P_c，1(x_l+1，y_l)、P_c，2(x_l，y_l+1)、P_c，3(x_l+1，y_l+1)，将四个邻近点作为第n个通道的输出特征图Fout上的点P(x，y)在第n个通道的输入特征图上的映射点；

输出特征图特征值获取步骤，根据第n个通道的输入特征图Fin的特征值，根据公式f_out(P)＝f_in(P_c，0)*w₀+f_in(P_c，1)*w₁+f_in(P_c，2)*w₂+f_in(P_c，3)*w₃，计算第n个通道的输出特征图Fout的特征值，其中f_in(P_c，0)、f_in(P_c，1)、f_in(P_c，2)、f_in(P_c，3)表示第n个通道的输入特征图上的映射点的特征值，w₀、w₁、w₂、w₃表示对应映射点P_c，0(x_l，y_l)、P_c，1(x_l+1，y_l)、P_c，2(x_l，y_l+1)、P_c，3(x_l+1，y_l+1)的权重，w₀＝(1-P_c(y)+y_l)*(1-P_c(x)+x_l)，w₁＝(1-P_c(y)+y_l)*(P_c(x)-x_l)，w₂＝(P_c(y)-y_l)*(1-P_c(x)+x_l)，w₃＝(P_c(y)-y_l)*(P_c(x)-x_l)；

输出特征图输出步骤，输出第n个通道的输入特征图Fin对应的第n个通道的输出特征图Fout。

进一步地，所述贝塞尔曲线计算步骤中如果车牌区域有2个上边缘点和2个下边缘点，采用1阶贝塞尔曲线公式B(t)＝P₀(1-t)+P₁t；如果车牌区域有3个上边缘点和3个下边缘点，采用2阶贝塞尔曲线公式B(t)＝P₀(1-t)²+2P₁t(1-t)+P₂t²；如果车牌区域有4个上边缘点和4个下边缘点，采用3阶贝塞尔曲线公式B(t)＝P₀(1-t)³+3P₁t(1-t)²+3P₂t²(1-t)+P₃t³，t∈[0，1]。其中t表示曲线长度比例，P₀、P₁、P₂、P₃表示车牌区域上边缘点或者下边缘点。

进一步地，所述第三步骤包括：

训练阶段处理步骤，针对输出特征图，添加车牌字符识别网络层，在训练阶段，把线性分类器的输出作为CTC损失的输入，计算CTC损失和总损失；

预测阶段处理步骤，针对输出特征图，添加车牌字符识别网络层，在预测阶段，计算分类器的输出的softmax得到最终的车牌字符预测结果，并输出。

其中，所述车牌字符识别网络层的结构包括：第一层：3*3卷积，步长stride＝1，填充pad＝1，滤波器个数128，激活函数为Relu；第二层：3*3卷积，步长stride＝1，填充pad＝1，滤波器个数256，激活函数为Relu；第三层：3*3卷积，步长stride＝(2，1)，填充pad＝1，滤波器个数256，激活函数为Relu；第四层：(H_out/2)*1卷积，步长stride＝1，填充pad＝0，滤波器个数256，激活函数为Relu；第五次：Permute层，把输入数据转化为宽度方向的1维序列；第六层：输入特征为256，输出为79的线性分类器。

进一步地，所述训练阶段处理步骤中总损失L_Total根据公式L_Total＝γ_{c_hm}L_{c_hm}+γ_{c_off}L_{c_off}+γ_{p_hm}L_{p_hm}+γ_{p_off}L_{p_off}+γ_ctcL_ctc计算得到，其中L_{c_hm}为车牌中心点热力图损失，L_{c_off}为车牌中心点偏置损失，L_{p_hm}为车牌矩形顶点热力图损失，L_{p_off}为车牌矩形顶点偏置损失，L_ctc为车牌字符识别CTC损失，γ_{c_hm}、γ_{c_off}、γ_{p_hm}、γ_{p_off}、γ_ctc分别为L_{c_hm}、L_{c_off}、L_{p_hm}、L_{p_off}、L_ctc对应的权重。

按照本发明的另一个方面，提供了一种端到端的车牌识别装置，该装置包括：

特征图和车牌信息获取模块，用于输入图像，采用主干网络，从图像中提取最后一层的特征图作为输入特征图；针对输入特征图，分别添加预测车牌中心点热力图的卷积层、预测车牌中心点偏置损失的卷积层、预测车牌矩形顶点热力图的卷积层、预测车牌矩形顶点偏置损失的卷积层，以获取特征图中车牌中心点位置和车牌顶点坐标；

贝塞尔车牌对齐处理模块，用于根据输入特征图中车牌顶点坐标，对特征图进行贝塞尔车牌对齐处理，获得输出特征图；

输出特征图训练和预测模块，用于针对输出特征图，添加车牌字符识别网络层，在训练阶段，对输出特征图进行训练，在预测阶段，对输出特征图进行车牌字符识别，输出车牌字符识别结果。

其中，所述特征图和车牌信息获取模块中主干网络为DLA网络。

所述预测车牌中心点热力图卷积层用于判断输入特征图中是否有车牌，其网络结构包括：第一层：3*3卷积，步长stride＝1，填充pad＝1，滤波器个数128，激活函数为Relu；第二层：1*1卷积，步长stride＝1，填充pad＝0，滤波器个数1。

进一步地，所述输出特征图训练和预测模块包括：

输出特征图归一化模块：用于对于第n个通道的输入特征图Fin，选取第n个通道的输出特征图Fout上的任意一点P(x,y)，对点P(x,y)的坐标进行归一化处理，获得归一化的坐标点(u,v)，其中u＝x/W_out，v＝y/H_out，W_out和H_out表示输出特征图的宽度和高度，n∈[1,N]，N为输入特征图Fin的通道的个数；

贝塞尔曲线计算模块：用于对于归一化的坐标点(u,v)，将曲线长度比例t＝u，根据贝塞尔曲线公式，分别获得上边缘点在X坐标轴上的贝塞尔曲线B′_x(t)和Y坐标轴上的贝塞尔曲线B′_y(t)，获得下边缘点在X坐标轴上的贝塞尔曲线B″_x(t)和Y坐标轴上的贝塞尔曲线B″_y(t)；

输入特征图映射点获取模块，用于根据获取的上边缘点在X坐标轴上的贝塞尔曲线B′_x(t)和Y坐标轴上的贝塞尔曲线B′_y(t)、下边缘点在X坐标轴上的贝塞尔曲线B″_x(t)和Y坐标轴上的贝塞尔曲线B″_y(t)，分别根据公式P_c(x)＝B″_x(t)*v+B′_x(t)*(1-v)和P_c(y)＝B″_y(t)*v+B′_y(t)*(1-v)，将P_c(x)和P_c(y)作为中心点P_c(x,y)的X和Y坐标；对P_c(x)和P_c(y)分别取整后得到x_l和y_l，获取中心点P_c(x,y)的四个邻近点P_c,0(x_l,y_l)、P_c,1(x_l+1,y_l)、P_c,2(x_l,y_l+1)、P_c,3(x_l+1,y_l+1)，将四个邻近点作为第n个通道的输出特征图Fout上的点P(x,y)在第n个通道的输入特征图上的映射点；

输出特征图特征值获取模块，用于根据第n个通道的输入特征图Fin的特征值，根据公式f_out(P)＝f_in(P_c,0)*w₀+f_in(P_c,1)*w₁+f_in(P_c,2)*w₂+f_in(P_c,3)*w₃，计算第n个通道的输出特征图Fout的特征值，其中f_in(P_c，0)、f_in(P_c，1)、f_in(P_c，2)、f_in(P_c，3)表示第n个通道的输入特征图上的映射点的特征值，w₀、w₁、w₂、w₃表示对应映射点P_c，0(x_l，y_l)、P_c，1(x_l+1，y_l)、P_c，2(x_l，y_l+1)、P_c，3(x_l+1，y_l+1)的权重，w₀＝(1-P_c(y)+y_l)*(1-P_c(x)+x_l)，w₁＝(1-P_c(y)+y_l)*(P_c(x)-x_l)，w₂＝(P_c(y)-y_l)*(1-P_c(x)+x_l)，w₃＝(P_c(y)-y_l)*(P_c(x)-x_l)；

输出特征图输出模块，用于输出第n个通道的输入特征图Fin对应的第n个通道的输出特征图Fout。

进一步地，所述贝塞尔曲线计算模块中如果车牌区域有2个上边缘点和2个下边缘点，采用1阶贝塞尔曲线公式B(t)＝P₀(1-t)+P₁t；如果车牌区域有3个上边缘点和3个下边缘点，采用2阶贝塞尔曲线公式B(t)＝P₀(1-t)²+2P₁t(1-t)+P₂t²；如果车牌区域有4个上边缘点和4个下边缘点，采用3阶贝塞尔曲线公式B(t)＝P₀(1-t)³+3P₁t(1-t)²+3P₂t²(1-t)+P₃t³，t∈[0，1]。其中t表示曲线长度比例，P₀、P₁、P₂、P₃表示车牌区域上边缘点或者下边缘点。

进一步地，所述输出特征图训练和预测模块包括：

训练阶段处理模块，用于针对输出特征图，添加车牌字符识别网络层，在训练阶段，把线性分类器的输出作为CTC损失的输入，计算CTC损失和总损失；

预测阶段处理模块，用于针对输出特征图，添加车牌字符识别网络层，在预测阶段，计算分类器的输出的softmax得到最终的车牌字符预测结果，并输出。

进一步地，所述训练阶段处理模块中总损失L_Total根据公式L_Total＝γ_{c_hm}L_{c_hm}+γ_{c_off}L_{c_off}+γ_{p_hm}L_{p_hm}+γ_{p_off}L_{p_off}+γ_ctcL_ctc计算得到，其中L_{c_hm}为车牌中心点热力图损失，L_{c_off}为车牌中心点偏置损失，L_{p_hm}为车牌矩形顶点热力图损失，L_{p_off}为车牌矩形顶点偏置损失，L_ctc为车牌字符识别CTC损失，γ_{c_hm}、γ_{c_off}、γ_{p_hm}、γ_{p_off}、γ_ctc分别为L_{c_hm}、L_{c_off}、L_{p_hm}、L_{p_off}、L_ctc对应的权重。

与现有的车牌识别技术相比，本发明的一种端到端的车牌识别方法及装置充分利用车牌定位网络的特征图，结合车牌坐标位置，采用贝塞尔车牌对齐方法，可以处理车牌任意角度的形变，在特征图上扣取车牌区域特征作为字符分割网络的初始特征，并联合训练车牌定位网络和车牌字符分割网络。本发明的一种端到端的车牌识别方法减少了重复计算检测网络特征和字符识别网络特征的冗余，使车牌定位网络和车牌字符识别网络联合学习达到检测和识别效果最优。

附图说明

图1示出了按照本发明的一种端到端的车牌识别方法的流程图。

图2示出了按照本发明的一种端到端的车牌识别装置的框架图。

具体实施方式

为使本领域的技术人员能进一步了解本发明的结构、特征及其他目的，现结合所附较佳实施例详细说明如下，所说明的较佳实施例仅用于说明本发明的技术方案，并非限定本发明。

图1给出了按照本发明的一种端到端的车牌识别方法的流程图。如图1所示，按照本发明的一种端到端的车牌识别方法包括：

第一步骤S1，输入图像，采用主干网络，从图像中提取最后一层的特征图作为输入特征图；针对输入特征图，分别添加预测车牌中心点热力图的卷积层、预测车牌中心点偏置损失的卷积层、预测车牌矩形顶点热力图的卷积层、预测车牌矩形顶点偏置损失的卷积层，以获取特征图中车牌中心点位置和车牌顶点坐标；

第二步骤S2，根据输入特征图中车牌顶点坐标，对特征图进行贝塞尔车牌对齐处理，获得输出特征图；

第三步骤S3，针对输出特征图，添加车牌字符识别网络层，在训练阶段，对输出特征图进行训练，在预测阶段，对输出特征图进行车牌字符识别，输出车牌字符识别结果。

其中，所述第一步骤S1中主干网络为DLA(Deep Layer Aggregation)网络。所述DLA网络可参见文献：“Deep Layer Aggregation,Yu,Fisher，Wang,Dequan，Shelhamer,Evan，Darrell,Trevor,Computer Science-Computer Vision and Pattern Recognition2017”。

进一步地，所述第二步骤S2包括：

输出特征图归一化步骤S21：对于第n个通道的输入特征图Fin，选取第n个通道的输出特征图Fout上的任意一点P(x,y)，对点P(x,y)的坐标进行归一化处理，获得归一化的坐标点(u,v)，其中u＝x/W_out，v＝y/H_out，W_out和H_out表示输出特征图的宽度和高度，n∈[1,N]，N为输入特征图Fin的通道的个数；

贝塞尔曲线计算步骤S22：对于归一化的坐标点(u,v)，将曲线长度比例t＝u，根据贝塞尔曲线公式，分别获得上边缘点在X坐标轴上的贝塞尔曲线B′_x(t)和Y坐标轴上的贝塞尔曲线B′_y(t)，获得下边缘点在X坐标轴上的贝塞尔曲线B″_x(t)和Y坐标轴上的贝塞尔曲线B″_y(t)；

输入特征图映射点获取步骤S23，根据获取的上边缘点在X坐标轴上的贝塞尔曲线B′_x(t)和Y坐标轴上的贝塞尔曲线B′_y(t)、下边缘点在X坐标轴上的贝塞尔曲线B″_x(t)和Y坐标轴上的贝塞尔曲线B″_y(t)，分别根据公式P_c(x)＝B″_x(t)*v+B′_x(t)*(1-v)和P_c(y)＝B″_y(t)*v+B′_y(t)*(1-v)，将P_c(x)和P_c(y)作为中心点P_c(x，y)的X和Y坐标；对P_c(x)和P_c(y)分别取整后得到x_l和y_l，获取中心点P_c(x，y)的四个邻近点P_c，0(x_l，y_l)、P_c，1(x_l+1，y_l)、P_c，2(x_l，y_l+1)、P_c，3(x_l+1，y_l+1)，将四个邻近点作为第n个通道的输出特征图Fout上的点P(x，y)在第n个通道的输入特征图上的映射点；

输出特征图特征值获取步骤S24，根据第n个通道的输入特征图Fin的特征值，根据公式f_out(P)＝f_in(P_c，0)*w₀+f_in(P_c，1)*w₁+f_in(P_c，2)*w₂+f_in(P_c，3)*w₃，计算第n个通道的输出特征图Fout的特征值，其中f_in(P_c，0)、f_in(P_c，1)、f_in(P_c，2)、f_in(P_c，3)表示第n个通道的输入特征图上的映射点的特征值，w₀、w₁、w₂、w₃表示对应映射点P_c，0(x_l，y_l)、P_c，1(x_l+1，y_l)、P_c，2(x_l，y_l+1)、P_c，3(x_l+1，y_l+1)的权重，w₀＝(1-P_c(y)+y_l)*(1-P_c(x)+x_l)，w₁＝(1-P_c(y)+y_l)*(P_c(x)-x_l)，w₂＝(P_c(y)-y_l)*(1-P_c(x)+x_l)，w₃＝(P_c(y)-y_l)*(P_c(x)-x_l)；

输出特征图输出步骤S25，输出第n个通道的输入特征图Fin对应的第n个通道的输出特征图Fout。

其中，所述输出特征图的宽度W_out和高度H_out人为设置。示例性地，W_out设为24或者32，H_out设为8。

进一步地，所述贝塞尔曲线计算步骤S22中如果车牌区域有2个上边缘点和2个下边缘点，采用1阶贝塞尔曲线公式B(t)＝P₀(1-t)+P₁t；如果车牌区域有3个上边缘点和3个下边缘点，采用2阶贝塞尔曲线公式B(t)＝P₀(1-t)²+2P₁t(1-t)+P₂t²；如果车牌区域有4个上边缘点和4个下边缘点，采用3阶贝塞尔曲线公式B(t)＝P₀(1-t)³+3P₁t(1-t)²+3P₂t²(1-t)+P₃t³，t∈[0，1]。其中t表示曲线长度比例，P₀、P₁、P₂、P₃表示车牌区域上边缘点或者下边缘点。

示例性地，所述贝塞尔曲线计算步骤S22包括：车牌区域有2个上边缘点和2个下边缘点，利用输入特征图Fin上车牌区域的2个上边缘点P₀、P₁，根据公式B′_x(t)＝P_0，x(1-t)+P_1，xt和B′_y(t)＝P_0，y(1-t)+P_1，yt，分别计算上边缘点P₀、P₁在X坐标轴上的贝塞尔曲线B′_x(t)和Y坐标轴上的贝塞尔曲线B′_y(t)；利用输入特征图Fin上车牌区域的2个下边缘点P₂、P₃，根据公式B″_x(t)＝P_2，x(1-t)+P_3，xt和B″_y(t)＝P_2，y(1-t)+P_3，yt，分别计算下边缘点P₂、P₃在X坐标轴上的贝塞尔曲线B″_x(t)和Y坐标轴上的贝塞尔曲线B″_y(t)。

示例性地，所述贝塞尔曲线计算步骤S22包括：车牌区域有3个上边缘点和3个下边缘点，利用输入特征图Fin上车牌区域的3个上边缘点P₀、P₁、P₂，根据公式B′_x(t)＝P_0，x(1-t)²+2P_1，xt(1-t)+P_2，xt²和B′_y(t)＝P_0，y(1-t)²+2P_1，yt(1-t)+P_2，yt²，分别计算上边缘点P₀、P₁、P₂在X坐标轴上的贝塞尔曲线B′_x(t)和Y坐标轴上的贝塞尔曲线B′_y(t)；利用输入特征图Fin上车牌区域的3个下边缘点P₃、P₄、P₅，根据公式B″_x(t)＝P_3，x(1-t)²+2P_4，xt(1-t)+P_5，xt²和，分别计算下边缘点P₃、P₄、P₅在X坐标轴上的贝塞尔曲线B″_x(t)和Y坐标轴上的贝塞尔曲线B″_y(t)。

示例性地，所述贝塞尔曲线计算步骤S22包括：车牌区域有4个上边缘点和4个下边缘点，利用输入特征图Fin上车牌区域的4个上边缘点P₀、P₁、P₂、P₃，根据公式B′_x(t)＝P_0，x(1-t)³+3P_1，xt(1-t)²+3P_2，xt²(1-t)+P_3，xt³和B′_y(t)＝P_0，y(1-t)³+3P_1，yt(1-t)²+3P_2，yt²(1-t)+P_3， _yt³，分别计算上边缘点P₀、P₁、P₂、P₃在X坐标轴上的贝塞尔曲线B′_x(t)和Y坐标轴上的贝塞尔曲线B′_y(t)；利用输入特征图Fin上车牌区域的4个下边缘点P₄、P₅、P₆、P₇，根据公式B″_x(t)＝P_4，x(1-t)³+3P_5，xt(1-t)²+3P_6，xt²(1-t)+P_7，xt³和B″_y(t)＝P_4，y(1-t)³+3P_5，yt(1-t)²+3P_6，yt²(1-t)+P_7，yt³，分别计算下边缘点P₄、P₅、P₆、P₇在X坐标轴上的贝塞尔曲线B″_x(t)和Y坐标轴上的贝塞尔曲线B″_y(t)。

其中，所述P_0，x、P_1，x、P_2，x、P_3，x、P_4，x、P_5，x、P_6，x、P_7，x分别表示点P₀、P₁、P₂、P₃、P₄、P₅、P₆、P₇的X坐标，所述P_0，y、P_1，y、P_2，y、P_3，y、P_4，y、P_5，y、P_6，y、P_7，y分别表示点P₀、P₁、P₂、P₃、P₄、P₅、P₆、P₇的Y坐标。

进一步地，所述第三步骤S3包括：

训练阶段处理步骤S31，针对输出特征图，添加车牌字符识别网络层，在训练阶段，把线性分类器的输出作为CTC损失的输入，计算CTC损失和总损失；

预测阶段处理步骤S32，针对输出特征图，添加车牌字符识别网络层，在预测阶段，计算分类器的输出的softmax得到最终的车牌字符预测结果，并输出。

进一步地，所述训练阶段处理步骤S31中总损失L_Tot，根据公式L_Total＝γ_{c_hm}L_{c_hm}+γ_{c_off}L_{c_off}+γ_{p_hm}L_{p_hm}+γ_{p_off}L_{p_off}+γ_ctcL_ctc计算得到，其中L_{c_hm}为车牌中心点热力图损失，L_{c_off}为车牌中心点偏置损失，L_{p_hm}为车牌矩形顶点热力图损失，L_{p_off}为车牌矩形顶点偏置损失，L_ctc为车牌字符识别CTC损失，γ_{c_hm}、γ_{c_off}、γ_{p_hm}、γ_{p_off}、γ_ctc分别为L_{c_hm}、L_{c_off}、L_{p_hm}、L_{p_off}、L_ctc对应的权重。

进一步地，所述权重γ_{c_hm}的取值范围为1～10，所述权重γ_{c_off}的取值范围为1～10，所述权重γ_{p_hm}的取值范围为1～10，所述权重γ_{p_off}的取值范围为1～10，所述权重γ_ctc的取值范围为2～10。示例性地，所述权重γ_{c_hm}、γ_{c_off}、γ_{p_hm}、γ_{p_off}选为1，所述权重γ_ctc选为5。

图2给出了按照本发明的一种端到端的车牌识别装置的框架图。如图2所示，按照本发明的一种端到端的车牌识别装置包括：

特征图和车牌信息获取模块1，用于输入图像，采用主干网络，从图像中提取最后一层的特征图作为输入特征图；针对输入特征图，分别添加预测车牌中心点热力图的卷积层、预测车牌中心点偏置损失的卷积层、预测车牌矩形顶点热力图的卷积层、预测车牌矩形顶点偏置损失的卷积层，以获取特征图中车牌中心点位置和车牌顶点坐标；

贝塞尔车牌对齐处理模块2，用于根据输入特征图中车牌顶点坐标，对特征图进行贝塞尔车牌对齐处理，获得输出特征图；

输出特征图训练和预测模块3，用于针对输出特征图，添加车牌字符识别网络层，在训练阶段，对输出特征图进行训练，在预测阶段，对输出特征图进行车牌字符识别，输出车牌字符识别结果。

其中，所述特征图和车牌信息获取模块1中主干网络为DLA(Deep LayerAggregation)网络。

进一步地，所述输出特征图训练和预测模块2包括：

输出特征图归一化模块21：用于对于第n个通道的输入特征图Fin，选取第n个通道的输出特征图Fout上的任意一点P(x,y)，对点P(x,y)的坐标进行归一化处理，获得归一化的坐标点(u,v)，其中u＝x/W_out，v＝y/H_out，W_out和H_out表示输出特征图的宽度和高度，n∈[1,N]，N为输入特征图Fin的通道的个数；

贝塞尔曲线计算模块22：用于对于归一化的坐标点(u,v)，将曲线长度比例t＝u，根据贝塞尔曲线公式，分别获得上边缘点在X坐标轴上的贝塞尔曲线B′_x(t)和Y坐标轴上的贝塞尔曲线B′_y(t)，获得下边缘点在X坐标轴上的贝塞尔曲线B″_x(t)和Y坐标轴上的贝塞尔曲线B″_y(t)；

输入特征图映射点获取模块23，用于根据获取的上边缘点在X坐标轴上的贝塞尔曲线B′_x(t)和Y坐标轴上的贝塞尔曲线B′_y(t)、下边缘点在X坐标轴上的贝塞尔曲线B″_x(t)和Y坐标轴上的贝塞尔曲线B″_y(t)，分别根据公式P_c(x)＝B″_x(t)*v+B′_x(t)*(1-v)和P_c(y)＝B′_y(t)*v+B′_y(t)*(1-v)，将P_c(x)和P_c(y)作为中心点P_c(x,y)的X和Y坐标；对P_c(x)和P_c(y)分别取整后得到x_l和y_l，获取中心点P_c(x,y)的四个邻近点P_c,0(x_l,y_l)、P_c,1(x_l+1,y_l)、P_c,2(x_l,y_l+1)、P_c,3(x_l+1,y_l+1)，将四个邻近点作为第n个通道的输出特征图Fout上的点P(x,y)在第n个通道的输入特征图上的映射点；

输出特征图特征值获取模块24，用于根据第n个通道的输入特征图Fin的特征值，根据公式f_out(P)＝f_in(P_c,0)*w₀+f_in(P_c,1)*w₁+f_in(P_c,2)*w₂+f_in(P_c,3)*w₃，计算第n个通道的输出特征图Fout的特征值，其中f_in(P_c,0)、f_in(P_c,1)、f_in(P_c,2)、f_in(P_c,3)表示第n个通道的输入特征图上的映射点的特征值，w₀、w₁、w₂、w₃表示对应映射点P_c,0(x_l,y_l)、P_c,1(x_l+1,y_l)、P_c,2(x_l,y_l+1)、P_c,3(x_l+1,y_l+1)的权重，w₀＝(1-P_c(y)+y_l)*(1-P_c(x)+x_l)，w₁＝(1-P_c(y)+y_l)*(P_c(x)-x_l)，w₂＝(P_c(y)-y_l)*(1-P_c(x)+x_l)，w₃＝(P_c(y)-y_l)*(P_c(x)-x_l)；

输出特征图输出模块25，用于输出第n个通道的输入特征图Fin对应的第n个通道的输出特征图Fout。

进一步地，所述贝塞尔曲线计算模块22中如果车牌区域有2个上边缘点和2个下边缘点，采用1阶贝塞尔曲线公式B(t)＝P₀(1-t)+P₁t；如果车牌区域有3个上边缘点和3个下边缘点，采用2阶贝塞尔曲线公式B(t)＝P₀(1-t)²+2P₁t(1-t)+P₂t²；如果车牌区域有4个上边缘点和4个下边缘点，采用3阶贝塞尔曲线公式B(t)＝P₀(1-t)³+3P₁t(1-t)²+3P₂t²(1-t)+P₃t³，t∈[0,1]。其中t表示曲线长度比例，P₀、P₁、P₂、P₃表示车牌区域上边缘点或者下边缘点。

进一步地，所述输出特征图训练和预测模块3包括：

训练阶段处理模块31，用于针对输出特征图，添加车牌字符识别网络层，在训练阶段，把线性分类器的输出作为CTC损失的输入，计算CTC损失和总损失；

预测阶段处理模块32，用于针对输出特征图，添加车牌字符识别网络层，在预测阶段，计算分类器的输出的softmax得到最终的车牌字符预测结果，并输出。

进一步地，所述训练阶段处理模块31中总损失L_Tot根据公式L_Total＝γ_{c_hm}L_{c_hm}+γ_{c_off}L_{c_off}+γ_{p_hm}L_{p_hm}+γ_{p_off}L_{p_off}+γ_ctcL_ctc计算得到，其中L_{c_hm}为车牌中心点热力图损失，L_{c_off}为车牌中心点偏置损失，L_{p_hm}为车牌矩形顶点热力图损失，L_{p_off}为车牌矩形顶点偏置损失，L_ctc为车牌字符识别CTC损失，γ_{c_hm}、γ_{c_off}、γ_{p_hm}、γ_{p_off}、γ_ctc分别为L_{c_hm}、L_{c_off}、L_{p_hm}、L_{p_off}、L_ctc对应的权重。

进一步地，所述权重γ_{c_hm}的取值范围为1～10，所述权重γ_{c_off}的取值范围为1～10，所述权重γ_{p_hm}的取值范围为1～10，所述权重γ_{p_off}的取值范围为1～10，所述权重γ_ctc的取值范围为2～10。

以上所述，仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围，应当理解，本发明并不限于这里所描述的实现方案，这些实现方案描述的目的在于帮助本领域中的技术人员实践本发明。任何本领域中的技术人员很容易在不脱离本发明精神和范围的情况下进行进一步的改进和完善，因此本发明只受到本发明权利要求的内容和范围的限制，其意图涵盖所有包括在由所附权利要求所限定的本发明精神和范围内的备选方案和等同方案。

Claims

1.一种端到端的车牌识别方法，其特征在于，该方法包括：

第三步骤，针对输出特征图，添加车牌字符识别网络层，在训练阶段，对输出特征图进行训练，在预测阶段，对输出特征图进行车牌字符识别，输出车牌字符识别结果；

其中，所述主干网络为DLA网络；

所述预测车牌中心点热力图卷积层用于判断输入特征图中是否有车牌，其网络结构包括：第一层：3*3卷积，步长stride＝1，填充pad＝1，滤波器个数128，激活函数为Relu；第二层：1*1卷积，步长stride＝1，填充pad＝0，滤波器个数1；

所述预测车牌中心点偏置损失卷积层用于修正车牌中心点位置，使位置更准确，其结构包括：第一层：3*3卷积，步长stride＝1，填充pad＝1，滤波器个数128，激活函数为Relu；第二层：1*1卷积，步长stride＝1，填充pad＝0，滤波器个数2；所述预测车牌矩形顶点热力图的卷积层和所述预测车牌矩形顶点偏置损失的卷积层用于输出车牌顶点坐标；

所述预测车牌矩形顶点热力图的卷积层的结构包括：第一层：3*3卷积，步长stride＝1，填充pad＝1，滤波器个数128，激活函数为Relu；第二层：1*1卷积，步长stride＝1，填充pad＝0，滤波器个数n，其中n为预测车牌顶点的个数；

2.如权利要求1所述的方法，其特征在于，所述第二步骤包括：

输入特征图映射点获取步骤，根据获取的上边缘点在X坐标轴上的贝塞尔曲线B′_x(t)和Y坐标轴上的贝塞尔曲线B′_y(t)、下边缘点在X坐标轴上的贝塞尔曲线B″_x(t)和Y坐标轴上的贝塞尔曲线B″_y(t)，分别根据公式P_c(x)＝B″_x(t)*v+B′_x(t)*(1-v)和P_c(y)＝B″_y(t)*v+B′_y(t)*(1-v)，将P_c(x)和P_c(y)作为中心点P_c(x,y)的X和Y坐标；对P_c(x)和P_c(y)分别取整后得到x_l和y_l，获取中心点P_c(x,y)的四个邻近点P_c,0(x_l,y_l)、P_c,1(x_l+1,y_l)、P_c,2(x_l,y_l+1)、P_c,₃(x_l+1,y_l+1)，将四个邻近点作为第n个通道的输出特征图Fout上的点P(x,y)在第n个通道的输入特征图上的映射点；

输出特征图特征值获取步骤，根据第n个通道的输入特征图Fin的特征值，根据公式f_out(P)＝f_in(P_c,0)*w₀+f_in(P_c,1)*w₁+f_in(P_c,2)*w₂+f_in(P_c,3)*w₃，计算第n个通道的输出特征图Fout的特征值，其中f_in(P_c,0)、f_in(P_c,1)、f_in(P_c,2)、f_in(P_c,3)表示第n个通道的输入特征图上的映射点的特征值，w₀、w₁、w₂、w₃表示对应映射点P_c,0(x_l,y_l)、P_c,1(x_l+1,y_l)、P_c,2(x_l,y_l+1)、P_c,3(x_l+1,y_l+1)的权重，w₀＝(1-P_c(y)+y_l)*(1-P_c(x)+x_l)，w₁＝(1-P_c(y)+y_l)*(P_c(x)-x_l)，w₂＝(P_c(y)-y_l)*(1-P_c(x)+x_l)，w₃＝(P_c(y)-y_l)*(P_c(x)-x_l)；

3.如权利要求2所述的方法，其特征在于，所述贝塞尔曲线计算步骤中如果车牌区域有2个上边缘点和2个下边缘点，采用1阶贝塞尔曲线公式B(t)＝P₀(1-t)+P₁t；如果车牌区域有3个上边缘点和3个下边缘点，采用2阶贝塞尔曲线公式B(t)＝P₀(1-t)²+2P₁t(1-t)+P₂t²；如果车牌区域有4个上边缘点和4个下边缘点，采用3阶贝塞尔曲线公式B(t)＝P₀(1-t)³+3P₁t(1-t)²+3P₂t²(1-t)+P₃l³，t∈[0,1]；其中t表示曲线长度比例，P₀、P₁、P₂、P₃表示车牌区域上边缘点或者下边缘点。

4.如权利要求2所述的方法，其特征在于，所述W_out设为24或者32，H_out设为8。

5.如权利要求2所述的方法，其特征在于，所述第三步骤包括：

预测阶段处理步骤，针对输出特征图，添加车牌字符识别网络层，在预测阶段，计算分类器的输出的softmax得到最终的车牌字符预测结果，并输出；

其中，所述车牌字符识别网络层的结构包括：第一层：3*3卷积，步长stride＝1，填充pad＝1，滤波器个数128，激活函数为Relu；第二层：3*3卷积，步长stride＝1，填充pad＝1，滤波器个数256，激活函数为Relu；第三层：3*3卷积，步长stride＝(2,1)，填充pad＝1，滤波器个数256，激活函数为Relu；第四层：(H_out/2)*1卷积，步长stride＝1，填充pad＝0，滤波器个数256，激活函数为Relu；第五层：Permute层，把输入数据转化为宽度方向的1维序列；第六层：输入特征为256，输出为79的线性分类器；

进一步地，所述训练阶段处理步骤中总损失L_Total根据公式L_Total＝γ_{c_hm}L_{c_hm}+γ_{c_} _offL_{c_off}+γ_{p_hm}L_{p_hm}+γ_{p_off}L_{p_off}+γ_ctcL_ctc计算得到，其中L_{c_hm}为车牌中心点热力图损失，L_{c_off}为车牌中心点偏置损失，L_{p_hm}为车牌矩形顶点热力图损失，L_{p_off}为车牌矩形顶点偏置损失，L_ctc为车牌字符识别CTC损失，γ_{c_hm}、γ_{c_off}、γ_{p_hm}、γ_{p_off}、γ_ctc分别为L_{c_hm}、L_{c_off}、L_{p_hm}、L_{p_off}、L_ctc对应的权重。

6.如权利要求5所述的方法，其特征在于，所述权重γ_{c_hm}的取值范围为1～10，所述权重γ_{c_off}的取值范围为1～10，所述权重γ_{p_hm}的取值范围为1～10，所述权重γ_{p_off}的取值范围为1～10，所述权重γ_ctc的取值范围为2～10。

7.一种端到端的车牌识别装置，其特征在于，该装置包括：

输出特征图训练和预测模块，用于针对输出特征图，添加车牌字符识别网络层，在训练阶段，对输出特征图进行训练，在预测阶段，对输出特征图进行车牌字符识别，输出车牌字符识别结果；

其中，所述特征图和车牌信息获取模块中主干网络为DLA网络；

8.如权利要求7所述的装置，其特征在于，所述输出特征图训练和预测模块包括：

输入特征图映射点获取模块，用于根据获取的上边缘点在X坐标轴上的贝塞尔曲线B′_x(t)和Y坐标轴上的贝塞尔曲线B′_y(t)、下边缘点在X坐标轴上的贝塞尔曲线B″_x(t)和Y坐标轴上的贝塞尔曲线B″_y(t)，分别根据公式P_c(x)＝B″_x(t)*v+B′_x(t)*(1-v)和P_c(y)＝B″_y(t)*v+B′_y(t)*(1-v)，将P_c(x)和P_c(y)作为中心点P_c(x,y)的X和Y坐标；对P_c(x)和P_c(y)分别取整后得到x_l和y_l，获取中心点P_c(x,y)的四个邻近点P_c,0(x_l,y_l)、P_c,1(x_l+1,y_l)、P_c,2(x_l,y_l+1)、P_c,₃(x_l+1,y_l+1)，将四个邻近点作为第n个通道的输出特征图Fout上的点P(x,y)在第n个通道的输入特征图上的映射点；

输出特征图特征值获取模块，用于根据第n个通道的输入特征图Fin的特征值，根据公式f_out(P)＝f_in(P_c,0)*w₀+f_in(P_c,1)*w₁+f_in(P_c,2)*w₂+f_in(P_c,3)*w₃，计算第n个通道的输出特征图Fout的特征值，其中f_in(P_c,0)、f_in(P_c,1)、f_in(P_c,2)、f_in(P_c,3)表示第n个通道的输入特征图上的映射点的特征值，w₀、w₁、w₂、w₃表示对应映射点P_c,0(x_l,yl)、P_c,1(x_l+1,y_l)、P_c,2(x_l,y_l+1)、P_c,3(x_l+1,y_l+1)的权重，w₀＝(1-P_c(y)+y_l)*(1-P_c(x)+x_l)，w₁＝(1-P_c(y)+y_l)*(P_c(x)-x_l)，w₂＝(P_c(y)-y_l)*(1-P_c(x)+x_l)，w₃＝(P_c(y)-y_l)*(P_c(x)-x_l)；

9.如权利要求8所述的装置，其特征在于，所述贝塞尔曲线计算模块中如果车牌区域有2个上边缘点和2个下边缘点，采用1阶贝塞尔曲线公式B(t)＝P₀(1-t)+P₁t；如果车牌区域有3个上边缘点和3个下边缘点，采用2阶贝塞尔曲线公式B(t)＝P₀(1-t)²+2P₁t(1-t)+P₂t²；如果车牌区域有4个上边缘点和4个下边缘点，采用3阶贝塞尔曲线公式B(t)＝P₀(1-t)³+3P₁t(1-t)²+3P₂t²(1-t)+P₃t³，t∈[0，1]；其中t表示曲线长度比例，P₀、P₁、P₂、P₃表示车牌区域上边缘点或者下边缘点。

10.如权利要求8所述的装置，其特征在于，所述输出特征图训练和预测模块包括：

预测阶段处理模块，用于针对输出特征图，添加车牌字符识别网络层，在预测阶段，计算分类器的输出的softmax得到最终的车牌字符预测结果，并输出；

进一步地，所述训练阶段处理模块中总损失L_Total根据公式L_Total＝γ_{c_hm}L_{c_hm}+γ_{c_} _offL_{c_off}+γ_{p_hm}L_{p_hm}+γ_{p_off}L_{p_off}+γ_ctcL_ctc计算得到，其中L_{c_hm}为车牌中心点热力图损失，L_{c_off}为车牌中心点偏置损失，L_{p_hm}为车牌矩形顶点热力图损失，L_{p_off}为车牌矩形顶点偏置损失，L_ctc为车牌字符识别CTC损失，γ_{c_hm}、γ_{c_off}、γ_{p_hm}、γ_{p_off}、γ_ctc分别为L_{c_hm}、L_{c_off}、L_{p_hm}、L_{p_off}、L_ctc对应的权重。