CN112329776B

CN112329776B - 基于改进CenterNet网络的车牌检测方法及装置

Info

Publication number: CN112329776B
Application number: CN202011408838.6A
Authority: CN
Inventors: 李文杰; 班华忠; 王正; 崔凯
Original assignee: Beijing Icetech Science & Technology Co ltd
Current assignee: Beijing Icetech Science & Technology Co ltd
Priority date: 2020-12-03
Filing date: 2020-12-03
Publication date: 2023-10-27
Anticipated expiration: 2040-12-03
Also published as: CN112329776A

Abstract

本发明提供了基于改进CenterNet网络的车牌检测方法，该方法包括：输入或者采集视频图像；对视频图像进行车辆检测，获取车辆检测区域；对车辆检测区域进行外扩，外扩为正方形；将正方形的车辆检测区域宽度和高度缩放为固定尺度的车辆检测区域；基于改进的CenterNet网络，输入车牌样本图像，对改进的CenterNet网络进行训练，获取车牌检测网络；将固定尺度的车辆检测区域输入到车牌检测网络中，获取车牌检测信息并输出；将车牌检测信息映射回视频图像中，获取视频图像中的车牌区域并输出。与现有技术相比，本发明能快速地进行车牌检测，且检测准确率高。

Description

基于改进CenterNet网络的车牌检测方法及装置

技术领域

本发明涉及图像处理、智慧停车、车牌识别，特别涉及基于改进CenterNet网络的车牌检测方法及装置。

背景技术

车牌区域随着城市的日益现代化，机动车的保有量持续增加，智能交通系统发挥着越来越重要的作用。不论是当今各种交通场合，还是公共安全管理系统，抑或未来无人汽车、无人驾驶领域，车牌检测系统都是一个不可或缺的过程，给城市健康有序管理带来了诸多便捷。

现有的车牌检测方法主要包括：(1)基于传统方案的车牌检测方法，例如基于梯度的车牌检测方法、基于颜色空间的车牌检测方法，这类方法检测速度快，但存在车牌误检过多、车牌位置检测不准确，对污损车牌、遮挡车牌检测效果较差等问题；(2)基于深度学习网络的车牌检测方法，这类方法检测准确率高，但为了解决不同国家或地区的车牌样式差异过大的问题，需要去匹配不同样式的车牌，而且往往需要较大的计算量和结构设计去适配车牌的各个尺寸，因此计算量极大，且存在较多的无效区域，从而浪费运算资源。

综上所述，目前迫切需要提出一种减少计算量、节省运算资源的基于改进CenterNet网络的车牌检测方法。

发明内容

有鉴于此，本发明的主要目的在于快速实现车牌检测，且检测准确率较高。

为达到上述目的，按照本发明的第一个方面，提供了基于改进CenterNet网络的车牌检测方法，该方法包括：

第一步骤，输入或者采集视频图像；

第二步骤，对视频图像进行车辆检测，获取车辆检测区域；

第三步骤，对车辆检测区域进行外扩，外扩为正方形；将正方形的车辆检测区域宽度和高度缩放为固定尺度的车辆检测区域；

第四步骤，基于改进的CenterNet网络，输入车牌样本图像，对改进的CenterNet网络进行训练，获取车牌检测网络；将固定尺度的车辆检测区域输入到车牌检测网络中，获取车牌检测信息并输出；

第五步骤，将车牌检测信息映射回视频图像中，获取视频图像中的车牌区域并输出。

其中，所述第三步骤中对车辆检测区域进行外扩是将车辆检测区域外扩成宽度和高度相同的正方形，外扩的部分以0填充；所述固定尺度为32(像素)的k倍，k表示缩放倍数。

进一步地，所述第四步骤包括：

CenterNet网络结构改进步骤，输入图像，采用轻量级骨干网络作为CenterNet框架下的主干网络；在特征金字塔FPN和检测头间增加一个单阶段无头检测模块，获取待检测特征图；对待检测特征图进行卷积操作，计算图像的热力图，通过寻找热力图的峰值得到输入图像中各车牌区域的中心点，并通过回归计算得到图像中车牌区域尺寸、车牌区域角点、车牌区域垂直倾斜角度和水平倾斜角度，根据车牌区域中心点和车牌区域尺寸确定车牌区域检测框；

改进CenterNet网络训练和识别步骤，当输入车牌样本图像时，对改进CenterNet网络进行训练，获取车牌检测网络；当输入固定尺度的车辆检测区域时，对改进CenterNet网络进行识别，获取车牌检测信息；其中网络总损失函数采用Loss＝αL_HM+βL_REG+γL_HW+ηL_PTS+λL_Angle，获得车牌检测网络，其中L_HM、L_REG、L_HW、L_PTS、L_Angle分别为车牌矩形框中心点损失、车牌矩形框中心点偏移损失、车牌矩形框宽高损失、车牌角点相对于车牌矩形框中心点偏移损失、车牌矩形框倾斜角度损失，α、β、γ、η、λ分别为L_HM、L_REG、L_HW、L_PTS、L_Angle对应的权重；

车牌检测信息输出步骤，当输入固定尺度的车辆检测区域时，输出车牌检测信息，即车牌区域中心点、宽度和高度、车牌的4个角点、车牌垂直倾斜角度和水平倾斜角度。

进一步地，所述CenterNet网络结构改进步骤中可以使用参考论文中描述的方法，将车牌区域作为目标，计算图像的热力图，获得车牌区域的中心点C(x,y)，获取车牌区域中心点4个横坐标偏移值Δx₁、Δx₂、Δx₃、Δx₄，获取车牌区域中心点4个纵坐标偏移值Δy₁、Δy₂、Δy₃、Δy₄，获取车牌区域中心点的4个角点P₁(x+Δx₁,y+Δy₁)、P₂(x+Δx₂,y+Δy₂)、P₃(x+Δx₃,y+Δy₃)、P₄(x+Δx₄,y+Δy₄)；计算车牌区域水平倾斜角度θ_x＝arctan[(Δy₃-Δy₄)/(Δx₃-Δx₄)]，计算车牌区域垂直倾斜角度θ_y＝arctan[(Δx₁-Δx₄)/(Δy₁-Δy₄)]；将参考论文中的损失函数由L1loss换成CIOUloss，获得车牌区域尺寸；根据车牌区域的中心点C(x,y)和车牌区域尺寸，确定车牌区域检测框。其中，所述车牌区域尺寸包括车牌区域的宽度和高度。

进一步地，所述轻量级骨干网络包括以下的一种：mobilenet系列(例如V1-V3)、shufflenet系列(例如V1-V2)、squeezenet。示例性地，选择mobilenet V2作为CenterNet框架下的主干网络。

进一步地，改进CenterNet网络训练和识别步骤中车牌矩形框宽高损失L_HW是将参考论文中宽高回归所用的损失改为CIOU损失，计算车牌矩形框宽高。

进一步地，所述车牌矩形框宽高损失L_HW采用公式计算得到，其中其中N为图像中车牌区域的个数，b_i、b_i ^gt分别为第i个车牌区域矩形框中心点和车牌区域预测矩形框中心点，ρ_i ²表示第i个车牌区域与预测车牌区域中心点的欧氏距离，dc_i ²为第i个车牌区域的预测框与车牌区域框最小外接矩形对角线距离,w_i ^gt、h_i ^gt、w_i、h_i分别为第i个车牌区域的矩形框真实宽度、矩形框真实高度和矩形框预测的宽度、矩形框预测的高度，B_i、B_i ^gt分别为第i个车牌区域的预测矩形框和真实矩形框。

所述车牌角点相对于车牌矩形框中心点偏移损失L_PTS采用公式计算得到，其中p_ijx、p_ijy分别为真实的第i个车牌区域对应的第j个角点的横坐标、纵坐标，c_ix、c_iy分别为真实的第i个车牌区域中心点的横坐标、纵坐标，/>分别为预测的第i个车牌区域对应的第j个角点的横坐标、纵坐标，/>分别为预测的第i个车牌区域中心点的横坐标、纵坐标，N为图像中车牌区域的个数。

所述车牌矩形框倾斜角度损失L_Angle采用公式计算得到，其中θ_ix、θ_iy分别为真实的第i个车牌区域的水平倾斜角度和垂直倾斜角度，/>分别为预测的第i个车牌区域的水平倾斜角度和垂直倾斜角度。

进一步地，所述第五步骤包括：对于第i个车牌区域，将车牌区域中心点坐标C_i(x,y)乘以下采样率r，以获得视频图像中对应的车牌区域的中心点坐标C_i′(x×r,y×r)；将车牌区域宽度W_i和高度H_i乘以下采样率r，以获得视频图像中对应的车牌区域的宽度W_i′＝r×W_i和高度H_i′＝r×H_i；分别将将车牌区域的4个角点坐标p_i1(x,y)、p_i2(x,y)、p_i3(x,y)、p_i4(x,y)，乘以下采样率r，以获得视频图像中对应的车牌区域的4个角点坐标p′_i1(x×r,y×r)、p′_i2(x×r,y×r)、p′_i3(x×r,y×r)、p′_i4(x×r,y×r)；将车牌垂直倾斜角度θ_iy和水平倾斜角度θ_ix作为视频图像中对应的车牌区域的垂直倾斜角度θ′_iy和水平倾斜角度θ′_ix，即θ′_iy＝θ_iy，θ′_ix＝θ_ix；根据视频图像中第i个车牌区域的中心点坐标C_i′(x×r,y×r)、车牌区域宽度W_i′和高度H_i′、车牌区域的垂直倾斜角度θ′_iy和水平倾斜角度θ′_ix、以及4个角点坐标p′_i1(x×r,y×r)、p′_i2(x×r,y×r)、p′_i3(x×r,y×r)、p′_i4(x×r,y×r)，获取视频图像中第i个车牌区域；输出视频图像中所有的车牌区域。

按照本发明的另一个方面，提供了基于改进CenterNet网络的车牌检测装置，该装置包括：

图像输入或采集模块，用于输入或者采集视频图像；

车辆检测模块，用于对视频图像进行车辆检测，获取车辆检测区域；

车辆检测区域外扩和缩放模块，用于对车辆检测区域进行外扩，外扩为正方形；将正方形的车辆检测区域宽度和高度缩放为固定尺度的车辆检测区域；

改进CenterNet网络训练或检测模块，用于基于改进的CenterNet网络，输入车牌样本图像，对改进的CenterNet网络进行训练，获取车牌检测网络；将固定尺度的车辆检测区域输入到车牌检测网络中，获取车牌检测信息并输出；

车牌区域映射模块，用于将车牌检测信息映射回视频图像中，获取视频图像中的车牌区域并输出。

其中，所述车辆检测区域外扩和缩放模块中对车辆检测区域进行外扩是将车辆检测区域外扩成宽度和高度相同的正方形，外扩的部分以0填充；所述固定尺度为32(像素)的k倍，k表示缩放倍数。

进一步地，所述改进CenterNet网络训练或检测模块包括：

CenterNet网络结构改进模块，用于输入图像，采用轻量级骨干网络作为CenterNet框架下的主干网络；在特征金字塔FPN和检测头间增加一个单阶段无头检测模块，获取待检测特征图；对待检测特征图进行卷积操作，计算图像的热力图，通过寻找热力图的峰值得到输入图像中各车牌区域的中心点，并通过回归计算得到图像中车牌区域尺寸、车牌区域角点、车牌区域垂直倾斜角度和水平倾斜角度，根据车牌区域中心点和车牌区域尺寸确定车牌区域检测框；

改进CenterNet网络训练和识别模块，用于当输入车牌样本图像时，对改进CenterNet网络进行训练，获取车牌检测网络；当输入固定尺度的车辆检测区域时，对改进CenterNet网络进行识别，获取车牌检测信息；其中网络总损失函数采用Loss＝αL_HM+βL_REG+γL_HW+ηL_PTS+λL_Angle，获得车牌检测网络，其中L_HM、L_REG、L_HW、L_PTS、L_Angle分别为车牌矩形框中心点损失、车牌矩形框中心点偏移损失、车牌矩形框宽高损失、车牌角点相对于车牌矩形框中心点偏移损失、车牌矩形框倾斜角度损失，α、β、γ、η、λ分别为L_HM、L_REG、L_HW、L_PTS、L_Angle对应的权重；

车牌检测信息输出模块，用于当输入固定尺度的车辆检测区域时，输出车牌检测信息，即车牌区域中心点、宽度和高度、车牌的4个角点、车牌垂直倾斜角度和水平倾斜角度。

进一步地，所述CenterNet网络结构改进模块中将车牌区域作为目标，计算图像的热力图，获得车牌区域的中心点C(x,y)，获取车牌区域中心点4个横坐标偏移值Δx₁、Δx₂、Δx₃、Δx₄，获取车牌区域中心点4个纵坐标偏移值Δy₁、Δy₂、Δy₃、Δy₄，获取车牌区域中心点的4个角点P₁(x+Δx₁,y+Δy₁)、P₂(x+Δx₂,y+Δy₂)、P₃(x+Δx₃,y+Δy₃)、P₄(x+Δx₄,y+Δy₄)；计算车牌区域水平倾斜角度θ_x＝arctan[Δy₃-Δy₄)/(Δx₃-Δx₄)]，计算车牌区域垂直倾斜角度θ_y＝arctan[Δx₁-Δx₄)/(Δy₁-Δy₄)]；将CenterNet网络的损失函数由L1loss换成CIOUloss，获得车牌区域尺寸；根据车牌区域的中心点C(x,y)和车牌区域尺寸，确定车牌区域检测框。其中，所述车牌区域尺寸包括车牌区域的宽度和高度。

所述改进CenterNet网络训练模块中车牌矩形框中心点损失L_HM和车牌矩形框中心点偏移损失L_REG可以通过参考论文中描述的方法获得；所述车牌矩形框宽高损失L_HW是将参考论文中宽高回归所用的损失改为CIOU损失，计算车牌矩形框宽高。

进一步地，所述车牌区域映射模块包括：用于对于第i个车牌区域，将车牌区域中心点坐标C_i(x,y)乘以下采样率r，以获得视频图像中对应的车牌区域的中心点坐标C_i′(x×r,y×r)；将车牌区域宽度W_i和高度H_i乘以下采样率r，以获得视频图像中对应的车牌区域的宽度W_i′＝r×W_i和高度H_i′＝r×H_i；分别将将车牌区域的4个角点坐标p_i1(x,y)、p_i2(x,y)、p_i3(x,y)、p_i4(x,y)，乘以下采样率r，以获得视频图像中对应的车牌区域的4个角点坐标p′_i1(x×r，y×r)、p′_i2(x×r,y×r)、p′_i3(x×r,y×r)、p′_i4(x×r,y×r)；将车牌垂直倾斜角度θ_iy和水平倾斜角度θ_ix作为视频图像中对应的车牌区域的垂直倾斜角度θ′_iy和水平倾斜角度θ′_ix，即θ′_iy＝θ_iy，θ′_ix＝θ_ix；根据视频图像中第i个车牌区域的中心点坐标C_i′(x×r,y×r)、车牌区域宽度W_i′和高度H_i′、车牌区域的垂直倾斜角度θ′_iy和水平倾斜角度θ′_ix、以及4个角点坐标p′_i1(x×r,y×r)、p′_i2(x×r,y×r)、p′_i3(x×r,y×r)、p′_i4(x×r,y×r)，获取视频图像中第i个车牌区域；输出视频图像中所有的车牌区域。

与现有的车牌检测技术相比，本发明的基于改进CenterNet网络的车牌检测方法及装置具有以下优点：(1)采用车辆检测和车牌检测的结合，能有效降低车牌误检提升车牌检测效果；(2)将车辆检测区域外扩正方形后缩放到固定尺寸，降低深度学习模型算力要求，确保应用中在某个范围内具有检测效果；(3)采用改进CenterNet网络对车牌进行检测，能同时输出车牌四个角点和车牌倾斜角度，适用有无角点的车牌样式，并且便于后续车牌矫正并提升识别效果。

附图说明

图1示出了按照本发明的基于改进CenterNet网络的车牌检测方法的流程图。

图2示出了按照本发明的基于改进CenterNet网络的车牌检测装置的框架图。

具体实施方式

为使本领域的技术人员能进一步了解本发明的结构、特征及其他目的，现结合所附较佳实施例详细说明如下，所说明的较佳实施例仅用于说明本发明的技术方案，并非限定本发明。

图1给出了按照本发明的基于改进CenterNet网络的车牌检测方法的流程图。如图1所示，按照本发明的基于改进CenterNet网络的车牌检测方法包括：

第一步骤S1，输入或者采集视频图像；

第二步骤S2，对视频图像进行车辆检测，获取车辆检测区域；

第三步骤S3，对车辆检测区域进行外扩，外扩为正方形；将正方形的车辆检测区域宽度和高度缩放为固定尺度的车辆检测区域；

第四步骤S4，基于改进的CenterNet网络，输入车牌样本图像，对改进的CenterNet网络进行训练，获取车牌检测网络；将固定尺度的车辆检测区域输入到车牌检测网络中，获取车牌检测信息并输出；

第五步骤S5，将车牌检测信息映射回视频图像中，获取视频图像中的车牌区域并输出。

其中，所述第二步骤S2中车辆检测可以采用现有的车辆检测方法，从视频图像中检测出车辆区域，包括但不限于以下一种或者多种方法的组合：基于背景建模的车辆检测、基于帧差法的车辆检测、基于光流法的车辆检测、基于分类器的车辆检测、基于神经网络的车辆检测。示例性地，采用基于神经网络的车辆检测方法，从视频图像中获取一个或者多个车辆检测区域R_V(x_i,y_i,w_i,h_i)，其中i表示第i个车辆检测区域，x_i和y_i分别表示第i个车辆检测区域R_V(x_i,y_i,w_i,h_i)左上角点的横坐标和纵坐标，w_i和h_i分别表示第i个车辆检测区域R_V(x_i,y_i,w_i,h_i)的宽度和高度，i∈[1,N]，N为视频图像中获取的车辆检测区域的个数。

其中，所述第三步骤S3中对车辆检测区域进行外扩是将车辆检测区域外扩成宽度和高度相同的正方形，外扩的部分以0填充；所述固定尺度为32(像素)的k倍，k表示缩放倍数。

进一步地，所述第三步骤S3包括：对于车辆检测区域R_V(x_i,y_i,w_i,h_i)，如果宽度w_i大于高度h_i，将车辆检测区域的下边界向下进行外扩，如果高度h_i大于宽度，将车辆检测区域的右边界向右进行外扩，扩充成宽度与高度大小相同，外扩的区域用0填充，以获得外扩后的正方形的车辆检测区域R_V′(x_i,y_i,w_i,h_i)；对外扩后的正方形的车辆检测区域R_V′(x_i,y_i,w_i,h_i)进行缩放，缩放到宽度和高度为32(像素)的k倍，以获得固定尺度的车辆检测区域R_V″(x_i,y_i,w_i,h_i)。其中，k的取值范围为3～6。示例性地，当k为5时，固定尺度的车辆检测区域R_V″(x_i,y_i,w_i,h_i)的宽度和高度为32(像素)×5＝160(像素)。

其中，所述第四步骤S4中CenterNet网络为参考论文“Objects as Points,Zhou,Xingyi，Wang,Dequan，Krhenbühl,Philipp,Computer Vision and Pattern Recognition2019”(以下简称参考论文)中提出的一种深度学习网络。CenterNet网络采用四元组——中心点、中心点偏移、区域的宽度和高度——来实现对车牌区域的检测识别，其效果逼近以高准确度著称的两阶段网络中最好的检测数据，然而CenterNet网络存在检测速度非常慢，每秒约3帧的缺陷。

进一步地，所述第四步骤S4包括：

CenterNet网络结构改进步骤S41，输入图像，采用轻量级骨干网络作为CenterNet框架下的主干网络；在特征金字塔FPN和检测头间增加一个单阶段无头检测模块，获取待检测特征图；对待检测特征图进行卷积操作，计算图像的热力图，通过寻找热力图的峰值得到输入图像中各车牌区域的中心点，并通过回归计算得到图像中车牌区域尺寸、车牌区域角点、车牌区域垂直倾斜角度和水平倾斜角度，根据车牌区域中心点和车牌区域尺寸确定车牌区域检测框；

改进CenterNet网络训练和识别步骤S42，当输入车牌样本图像时，对改进CenterNet网络进行训练，获取车牌检测网络；当输入固定尺度的车辆检测区域时，对改进CenterNet网络进行识别，获取车牌检测信息；其中网络总损失函数采用Loss＝αL_HM+βL_REG+γL_HW+ηL_PTS+λL_Angle，获得车牌检测网络，其中L_HM、L_REG、L_HW、L_PTS、L_Angle分别为车牌矩形框中心点损失、车牌矩形框中心点偏移损失、车牌矩形框宽高损失、车牌角点相对于车牌矩形框中心点偏移损失、车牌矩形框倾斜角度损失，α、β、γ、η、λ分别为L_HM、L_REG、L_HW、L_PTS、L_Angle对应的权重；

车牌检测信息输出步骤S43，当输入固定尺度的车辆检测区域时，输出车牌检测信息，即车牌区域中心点、宽度和高度、车牌的4个角点、车牌垂直倾斜角度和水平倾斜角度。

进一步地，所述CenterNet网络结构改进步骤S41中将车牌区域作为目标，计算图像的热力图，获得车牌区域的中心点C(x,y)，获取车牌区域中心点4个横坐标偏移值Δx₁、Δx₂、Δx₃、Δx₄，获取车牌区域中心点4个纵坐标偏移值Δy₁、Δy₂、Δy₃、Δy₄，获取车牌区域中心点的4个角点P₁(x+Δx₁,y+Δy₁)、P₂(x+Δx₂,y+Δy₂)、P₃(x+Δx₃,y+Δy₃)、P₄(x+Δx₄,y+Δy₄)；计算车牌区域水平倾斜角度θ_x＝arctan[Δy₃-Δy₄)/(Δx₃-Δx₄)]，计算车牌区域垂直倾斜角度θ_y＝arctan[Δx₁-Δx₄)/(Δy₁-Δy₄)]；将CenterNet网络中的损失函数由L1loss换成CIOUloss，获得车牌区域尺寸；根据车牌区域的中心点C(x,y)和车牌区域尺寸，确定车牌区域检测框。其中，所述车牌区域尺寸包括车牌区域的宽度和高度。

与CenterNet网络相比，所述改进的CenterNet网络有以下优点：(1)与传统的CenterNet车牌区域检测框架常采用ResNet、DLA、Hourglass等作为主干网络(Backbone)不同，改进的CenterNet网络采用轻量级骨干网络作为主干网络(Backbone)进行车牌特性的特征图计算，具有较少的参数量和计算量低的优点，能够降低资源消耗和耗时；(2)增加单阶段无头检测模块，能够提升网络的有效感受野和特征表达能力；(3)增加角点和车牌倾斜角度输出，以满足有无角点车牌的情况。

所述改进CenterNet网络训练步骤S42中车牌矩形框中心点损失L_HM和车牌矩形框中心点偏移损失L_REG可以通过参考论文中描述的方法获得。

所述车牌矩形框宽高损失L_HW是将CenterNet网络中宽高回归所用的损失改为CIOU损失，计算车牌矩形框宽高。

所述权重α、β、γ、η、λ通过人为设定，取值范围为0～10。示例性地，所述权重α、β、γ、η、λ分别选为1、1、0.1、1、1。

进一步地，所述第五步骤S5包括：对于第i个车牌区域，将车牌区域中心点坐标C_i(x,y)乘以下采样率r，以获得视频图像中对应的车牌区域的中心点坐标C_i′(x×r,y×r)；将车牌区域宽度W_i和高度H_i乘以下采样率r，以获得视频图像中对应的车牌区域的宽度W_i′＝r×W_i和高度H_i′＝r×H_i；分别将将车牌区域的4个角点坐标p_i1(x,y)、p_i2(x,y)、p_i3(x,y)、p_i4(x,y)，乘以下采样率r，以获得视频图像中对应的车牌区域的4个角点坐标p′_i1(x×r,y×r)、p′_i2(x×r,y×r)、p′_i3(x×r,y×r)、p′_i4(x×r,y×r)；将车牌垂直倾斜角度θ_iy和水平倾斜角度θ_ix作为视频图像中对应的车牌区域的垂直倾斜角度θ′_iy和水平倾斜角度θ′_ix，即θ′_iy＝θ_iy，θ′_ix＝θ_ix；根据视频图像中第i个车牌区域的中心点坐标C_i′(x×r,y×r)、车牌区域宽度W_i′和高度H_i′、车牌区域的垂直倾斜角度θ′_iy和水平倾斜角度θ′_ix、以及4个角点坐标p′_i1(x×r,y×r)、p′_i2(x×r,y×r)、p′_i3(x×r,y×r)、p′_i4(x×r,y×r)，获取视频图像中第i个车牌区域；输出视频图像中所有的车牌区域。其中，所述下采样率r为8。

图2给出了按照本发明的基于改进CenterNet网络的车牌检测装置的框架图。如图2所示，按照本发明的基于改进CenterNet网络的车牌检测装置包括：

图像输入或采集模块1，用于输入或者采集视频图像；

车辆检测模块2，用于对视频图像进行车辆检测，获取车辆检测区域；

车辆检测区域外扩和缩放模块3，用于对车辆检测区域进行外扩，外扩为正方形；将正方形的车辆检测区域宽度和高度缩放为固定尺度的车辆检测区域；

改进CenterNet网络训练或检测模块4，用于基于改进的CenterNet网络，输入车牌样本图像，对改进的CenterNet网络进行训练，获取车牌检测网络；将固定尺度的车辆检测区域输入到车牌检测网络中，获取车牌检测信息并输出；

车牌区域映射模块5，用于将车牌检测信息映射回视频图像中，获取视频图像中的车牌区域并输出。

其中，所述车辆检测区域外扩和缩放模块3中对车辆检测区域进行外扩是将车辆检测区域外扩成宽度和高度相同的正方形，外扩的部分以0填充；所述固定尺度为32(像素)的k倍，k表示缩放倍数。

进一步地，所述车辆检测区域外扩和缩放模块3包括：用于对于车辆检测区域R_V(x_i,y_i,w_i,h_i)，如果宽度w_i大于高度h_i，将车辆检测区域的下边界向下进行外扩，如果高度h_i大于宽度，将车辆检测区域的右边界向右进行外扩，扩充成宽度与高度大小相同，外扩的区域用0填充，以获得外扩后的正方形的车辆检测区域R_V′(x_i,y_i,w_i,h_i)；对外扩后的正方形的车辆检测区域R_V′(x_i,y_i,w_i,h_i)进行缩放，缩放到宽度和高度为32(像素)的k倍，以获得固定尺度的车辆检测区域R_V″(x_i,y_i,w_i,h_i)。其中，k的取值范围为3～6。

其中，所述改进CenterNet网络训练或检测模块4中参考论文“Objects asPoints,Zhou,Xingyi，Wang,Dequan，Krhenbühl,Philipp,Computer Vision and PatternRecognition 2019”中提出的一种深度学习网络。

进一步地，所述改进CenterNet网络训练或检测模块4包括：

CenterNet网络结构改进模块41，用于输入图像，采用轻量级骨干网络作为CenterNet框架下的主干网络；在特征金字塔FPN和检测头间增加一个单阶段无头检测模块，获取待检测特征图；对待检测特征图进行卷积操作，计算图像的热力图，通过寻找热力图的峰值得到输入图像中各车牌区域的中心点，并通过回归计算得到图像中车牌区域尺寸、车牌区域角点、车牌区域垂直倾斜角度和水平倾斜角度，根据车牌区域中心点和车牌区域尺寸确定车牌区域检测框；

改进CenterNet网络训练和识别模块42，用于当输入车牌样本图像时，对改进CenterNet网络进行训练，获取车牌检测网络；当输入固定尺度的车辆检测区域时，对改进CenterNet网络进行识别，获取车牌检测信息；其中网络总损失函数采用Loss＝αL_HM+βL_REG+γL_HW+ηL_PTS+λL_Ang，获得车牌检测网络，其中L_HM、L_REG、L_HW、L_PTS、L_Angle分别为车牌矩形框中心点损失、车牌矩形框中心点偏移损失、车牌矩形框宽高损失、车牌角点相对于车牌矩形框中心点偏移损失、车牌矩形框倾斜角度损失，α、β、γ、η、λ分别为L_HM、L_REG、L_HW、L_PTS、L_Angle对应的权重；

车牌检测信息输出模块43，用于当输入固定尺度的车辆检测区域时，输出车牌检测信息，即车牌区域中心点、宽度和高度、车牌的4个角点、车牌垂直倾斜角度和水平倾斜角度。

进一步地，所述CenterNet网络结构改进模块41中将车牌区域作为目标，计算图像的热力图，获得车牌区域的中心点C(x,y)，获取车牌区域中心点4个横坐标偏移值Δx₁、Δx₂、Δx₃、Δx₄，获取车牌区域中心点4个纵坐标偏移值Δy₁、Δy₂、Δy₃、Δy₄，获取车牌区域中心点的4个角点P₁(x+Δx₁,y+Δy₁)、P₂(x+Δx₂,y+Δy₂)、P₃(x+Δx₃,y+Δy₃)、P₄(x+Δx₄,y+Δy₄)；计算车牌区域水平倾斜角度θ_x＝arctan[Δy₃-Δy₄)/(Δx₃-Δx₄)]，计算车牌区域垂直倾斜角度θ_y＝arctan[(Δx₁-Δx₄)/(Δy₁-Δy₄)]；将CenterNet网络的损失函数由L1loss换成CIOUloss，获得车牌区域尺寸；根据车牌区域的中心点C(x,y)和车牌区域尺寸，确定车牌区域检测框。其中，所述车牌区域尺寸包括车牌区域的宽度和高度。

所述改进CenterNet网络训练模块42中车牌矩形框中心点损失L_HM和车牌矩形框中心点偏移损失L_REG可以通过参考论文中描述的方法获得。

所述车牌矩形框宽高损失L_HW是将参考论文中宽高回归所用的损失改为CIOU损失，计算车牌矩形框宽高。

所述权重α、β、γ、η、λ通过人为设定，取值范围为0～10。

进一步地，所述车牌区域映射模块5包括：用于对于第i个车牌区域，将车牌区域中心点坐标C_i(x,y)乘以下采样率r，以获得视频图像中对应的车牌区域的中心点坐标C_i′(x×r,y×r)；将车牌区域宽度W_i和高度H_i乘以下采样率r，以获得视频图像中对应的车牌区域的宽度W_i′＝r×W_i和高度H_i′＝r×H_i；分别将将车牌区域的4个角点坐标p_i1(x,y)、p_i2(x,y)、p_i3(x,y)、p_i4(x,y)，乘以下采样率r，以获得视频图像中对应的车牌区域的4个角点坐标p′_i1(x×r，y×r)、p′_i2(x×r,y×r)、p′_i3(x×r,y×r)、p′_i4(x×r,y×r)；将车牌垂直倾斜角度θ_iy和水平倾斜角度θ_ix作为视频图像中对应的车牌区域的垂直倾斜角度θ′_iy和水平倾斜角度θ′_ix，即θ′_iy＝θ_iy，θ′_ix＝θ_ix；根据视频图像中第i个车牌区域的中心点坐标C_i′(x×r,y×r)、车牌区域宽度W_i′和高度H_i′、车牌区域的垂直倾斜角度θ′_iy和水平倾斜角度θ′_ix、以及4个角点坐标p′_i1(x×r,y×r)、p′_i2(x×r,y×r)、p′_i3(x×r,y×r)、p′_i4(x×r,y×r)，获取视频图像中第i个车牌区域；输出视频图像中所有的车牌区域。其中，所述下采样率r为8。

以上所述，仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围，应当理解，本发明并不限于这里所描述的实现方案，这些实现方案描述的目的在于帮助本领域中的技术人员实践本发明。任何本领域中的技术人员很容易在不脱离本发明精神和范围的情况下进行进一步的改进和完善，因此本发明只受到本发明权利要求的内容和范围的限制，其意图涵盖所有包括在由所附权利要求所限定的本发明精神和范围内的备选方案和等同方案。

Claims

1.基于改进CenterNet网络的车牌检测方法，其特征在于，该方法包括：

第一步骤，输入或者采集视频图像；

第二步骤，对视频图像进行车辆检测，获取车辆检测区域；

第五步骤，将车牌检测信息映射回视频图像中，获取视频图像中的车牌区域并输出；

其中，所述第三步骤中对车辆检测区域进行外扩是将车辆检测区域外扩成宽度和高度相同的正方形，外扩的部分以0填充；所述固定尺度为32像素的k倍，k表示缩放倍数。

2.如权利要求1所述的方法，其特征在于，所述第四步骤包括：

车牌检测信息输出步骤，当输入固定尺度的车辆检测区域时，输出车牌检测信息，即车牌区域中心点、宽度和高度、车牌的4个角点、车牌垂直倾斜角度和水平倾斜角度；

其中，CenterNet网络为参考论文“Objects as Points,Zhou,Xingyi，Wang,Dequan，Krhenbühl,Philipp,Computer Vision and Pattern Recognition 2019”中提出的一种深度学习网络。

3.如权利要求2所述的方法，其特征在于，所述CenterNet网络结构改进步骤中将车牌区域作为目标，计算图像的热力图，获得车牌区域的中心点C(x,y)，获取车牌区域中心点4个横坐标偏移值Δx₁、Δx₂、Δx₃、Δx₄，获取车牌区域中心点4个纵坐标偏移值Δy₁、Δy₂、Δy₃、Δy₄，获取车牌区域中心点的4个角点P₁(x+Δx₁,y+Δy₁)、P₂(x+Δx₂,y+Δy₂)、P₃(x+Δx₃,y+Δy₃)、P₄(x+Δx₄,y+Δy₄)；计算车牌区域水平倾斜角度θ_x＝arctan[(Δy₃-Δy₄)/(Δx₃-Δx₄)]，计算车牌区域垂直倾斜角度θ_y＝arctan[(Δx₁-Δx₄)/(Δy₁-Δy₄)]；将CenterNet网络中的损失函数由L1loss换成CIOUloss，获得车牌区域尺寸；根据车牌区域的中心点C(x,y)和车牌区域尺寸，确定车牌区域检测框；其中，所述车牌区域尺寸包括车牌区域的宽度和高度。

4.如权利要求2所述的方法，其特征在于，所述轻量级骨干网络包括以下的一种：mobilenet系列V1-V3、shufflenet系列V1-V2、squeezenet。

5.如权利要求2所述的方法，其特征在于，所述改进CenterNet网络训练和识别步骤中车牌矩形框中心点损失L_HM和车牌矩形框中心点偏移损失L_REG通过参考论文中描述的方法获得；车牌矩形框宽高损失L_HW是将参考论文中宽高回归所用的损失改为CIOU损失，计算车牌矩形框宽高；

进一步地，所述车牌矩形框宽高损失L_HW采用公式计算得到，其中其中N为图像中车牌区域的个数，b_i、b_i ^gt分别为第i个车牌区域矩形框中心点和车牌区域预测矩形框中心点，ρ_i ²表示第i个车牌区域与预测车牌区域中心点的欧氏距离，dc_i ²为第i个车牌区域的预测框与车牌区域框最小外接矩形对角线距离,w_i ^gt、h_i ^gt、w_i、h_i分别为第i个车牌区域的矩形框真实宽度、矩形框真实高度和矩形框预测的宽度、矩形框预测的高度，B_i、B_i ^gt分别为第i个车牌区域的预测矩形框和真实矩形框；

所述车牌角点相对于车牌矩形框中心点偏移损失L_PTS采用公式计算得到，其中p_ijx、p_ijy分别为真实的第i个车牌区域对应的第j个角点的横坐标、纵坐标，c_ix、c_iy分别为真实的第i个车牌区域中心点的横坐标、纵坐标，/>分别为预测的第i个车牌区域对应的第j个角点的横坐标、纵坐标，/>分别为预测的第i个车牌区域中心点的横坐标、纵坐标，N为图像中车牌区域的个数；

6.如权利要求2所述的方法，其特征在于，所述权重α、β、γ、η、λ取值范围为0～10。

7.如权利要求1所述的方法，其特征在于，所述第五步骤包括：对于第i个车牌区域，将车牌区域中心点坐标C_i(x,y)乘以下采样率r，以获得视频图像中对应的车牌区域的中心点坐标C′_i(x×r,y×r)；将车牌区域宽度W_i和高度H_i乘以下采样率r，以获得视频图像中对应的车牌区域的宽度W_i′＝r×W_i和高度H′_i＝r×H_i；分别将将车牌区域的4个角点坐标p_i1(x,y)、p_i2(x,y)、p_i3(x,y)、p_i4(x,y)，乘以下采样率r，以获得视频图像中对应的车牌区域的4个角点坐标p′_i1(x×r,y×r)、p′_i2(x×r,y×r)、p′_i3(x×r,y×r)、p′_i4(x×r,y×r)；将车牌垂直倾斜角度θ_iy和水平倾斜角度θ_ix作为视频图像中对应的车牌区域的垂直倾斜角度θ′_iy和水平倾斜角度θ′_ix，即θ′_iy＝θ_iy，θ′_ix＝θ_ix；根据视频图像中第i个车牌区域的中心点坐标C′_i(x×r,y×r)、车牌区域宽度W_i′和高度H_i′、车牌区域的垂直倾斜角度θ′_iy和水平倾斜角度θ′_ix、以及4个角点坐标p′_i1(x×r,y×r)、p′_i2(x×r,y×r)、p′_i3(x×r,y×r)、p′_i4(x×r,y×r)，获取视频图像中第i个车牌区域；输出视频图像中所有的车牌区域；

其中，所述下采样率r为8。

8.基于改进CenterNet网络的车牌检测装置，其特征在于，该装置包括：

图像输入或采集模块，用于输入或者采集视频图像；

车辆检测区域外扩和缩放模块，用于对车辆检测区域进行外扩，外扩为正方形；

将正方形的车辆检测区域宽度和高度缩放为固定尺度的车辆检测区域；

车牌区域映射模块，用于将车牌检测信息映射回视频图像中，获取视频图像中的车牌区域并输出；

其中，车辆检测区域外扩和缩放模块中对车辆检测区域进行外扩是将车辆检测区域外扩成宽度和高度相同的正方形，外扩的部分以0填充；所述固定尺度为32像素的k倍，k表示缩放倍数。

9.如权利要求8所述的装置，其特征在于，所述改进CenterNet网络训练或检测模块包括：

车牌检测信息输出模块，用于当输入固定尺度的车辆检测区域时，输出车牌检测信息，即车牌区域中心点、宽度和高度、车牌的4个角点、车牌垂直倾斜角度和水平倾斜角度；

10.如权利要求9所述的装置，其特征在于，所述CenterNet网络结构改进模块中将车牌区域作为目标，计算图像的热力图，获得车牌区域的中心点C(x,y)，获取车牌区域中心点4个横坐标偏移值Δx₁、Δx₂、Δx₃、Δx₄，获取车牌区域中心点4个纵坐标偏移值Δy₁、Δy₂、Δy₃、Δy₄，获取车牌区域中心点的4个角点P₁(x+Δx₁,y+Δy₁)、P₂(x+Δx₂,y+Δy₂)、P₃(x+Δx₃,y+Δy₃)、P₄(x+Δx₄,y+Δy₄)；计算车牌区域水平倾斜角度θ_x＝arctan[(Δy₃-Δy₄)/(Δx₃-Δx₄)]，计算车牌区域垂直倾斜角度θ_y＝arctan[(Δx₁-Δx₄)/(Δy₁-Δy₄)]；将CenterNet网络的损失函数由L1loss换成CIOUloss，获得车牌区域尺寸；根据车牌区域的中心点C(x,y)和车牌区域尺寸，确定车牌区域检测框；其中，所述车牌区域尺寸包括车牌区域的宽度和高度。

11.如权利要求9所述的装置，其特征在于，所述改进CenterNet网络训练模块中车牌矩形框中心点损失L_HM和车牌矩形框中心点偏移损失L_REG通过参考论文中描述的方法获得；所述车牌矩形框宽高损失L_HW是将参考论文中宽高回归所用的损失改为CIOU损失，计算车牌矩形框宽高；

所述车牌矩形框宽高损失L_HW采用公式计算得到，其中其中N为图像中车牌区域的个数，b_i、b_i ^gt分别为第i个车牌区域矩形框中心点和车牌区域预测矩形框中心点，ρ_i ²表示第i个车牌区域与预测车牌区域中心点的欧氏距离，dc_i ²为第i个车牌区域的预测框与车牌区域框最小外接矩形对角线距离,w_i ^gt、h_i ^gt、w_i、h_i分别为第i个车牌区域的矩形框真实宽度、矩形框真实高度和矩形框预测的宽度、矩形框预测的高度，B_i、B_i ^gt分别为第i个车牌区域的预测矩形框和真实矩形框；

12.如权利要求9所述的装置，其特征在于，所述车牌区域映射模块包括：用于对于第i个车牌区域，将车牌区域中心点坐标C_i(x,y)乘以下采样率r，以获得视频图像中对应的车牌区域的中心点坐标C′_i(x×r,y×r)；将车牌区域宽度W_i和高度H_i乘以下采样率r，以获得视频图像中对应的车牌区域的宽度W_i′＝r×W_i和高度H′_i＝r×H_i；分别将将车牌区域的4个角点坐标p_i1(x,y)、p_i2(x,y)、p_i3(x,y)、p_i4(x,y)，乘以下采样率r，以获得视频图像中对应的车牌区域的4个角点坐标p′_i1(x×r,y×r)、p′_i2(x×r,y×r)、p′_i3(x×r,y×r)、p′_i4(x×r,y×r)；将车牌垂直倾斜角度θ_iy和水平倾斜角度θ_ix作为视频图像中对应的车牌区域的垂直倾斜角度θ′_iy和水平倾斜角度θ′_ix，即θ′_iy＝θ_iy，θ′_ix＝θ_ix；根据视频图像中第i个车牌区域的中心点坐标C′_i(x×r,y×r)、车牌区域宽度W_i′和高度H_i′、车牌区域的垂直倾斜角度θ′_iy和水平倾斜角度θ′_ix、以及4个角点坐标p′_i1(x×r,y×r)、p′_i2(x×r,y×r)、p′_i3(x×r,y×r)、p′_i4(x×r,y×r)，获取视频图像中第i个车牌区域；输出视频图像中所有的车牌区域；

其中，所述下采样率r为8。