CN111915490A

CN111915490A - 一种基于多尺度特征的车牌图像超分辨率重建模型及方法

Info

Publication number: CN111915490A
Application number: CN202010820206.4A
Authority: CN
Inventors: 王洪剑; 孙国梁; 黄向军; 陈涛
Original assignee: Shenzhen Qingyan Zhicheng Technology Co ltd
Current assignee: Shenzhen Qingyan Zhicheng Technology Co ltd
Priority date: 2020-08-14
Filing date: 2020-08-14
Publication date: 2020-11-10

Abstract

本发明公开了一种基于多尺度特征的车牌图像超分辨率重建模型及方法，该模型包括：数据集构建模块，用于构建训练用车牌图像超分辨率重建数据集，所述数据集中的数据以低分辨率图像和对应高分辨率真值为一个训练样本；训练样本加载模块，用于加载训练样本；多尺度特征模型，用于使用不同扩张率的空洞卷积在不引入额外参数的情况下扩大感受野来提取多尺度特征语义信息，然后聚合多尺度特征和输入低分辨率图像为一个多通道的特征图，并以RDB为基础块进行堆叠，并通过上采样网络输出重建后的高分辨率图像；判别器，用于对经所述多尺度特征模型重建得到的高分辨率图像与所述训练样本的高分辨率真值进行判别，输出判别结果。

Description

一种基于多尺度特征的车牌图像超分辨率重建模型及方法

技术领域

本发明涉及计算机图像处理技术领域，特别是涉及一种使用生成对抗网络对车牌图像的多尺度特征进行学习进而实现超分辨率重建的基于多尺度特征的车牌图像超分辨率重建模型及方法。

背景技术

有监督的自然图像的超分辨率重建技术已经发展的比较成熟，目前已有多种技术可以实现，如RDN、EDSR、SRGAN等基于深度学习的超分辨率重建方法，但这些方法未对待重建图像的多尺度特征进行关注，导致低分辨率的车牌图像超分重建的效果不理想。

举例来说，现有超分辨率重建方法在特征提取模块只对单一尺度的特征进行编码解码，忽略了其他尺度语义信息对超分辨率重建过程的贡献。在这种情况下，要得到高质量的超分辨率重建结果，必须加大模型深度导致参数量很大。此外，现有超分辨率重建方法判别器部分基于全连接层或者PatchGAN进行类别判断，未从多尺度特征的角度进行判别器设计，导致车牌图像部分小区域的重建质量不高，有显著伪影存在。

发明内容

为克服上述现有技术存在的不足，本发明之目的在于提供一种基于多尺度特征的车牌图像超分辨率重建模型及方法，以达到使用生成对抗网络对车牌图像的多尺度特征进行学习进而实现超分辨率重建的目的。

为达上述目的，本发明提出一种基于多尺度特征的车牌图像超分辨率重建模型，包括：

数据集构建模块，用于构建训练用车牌图像超分辨率重建数据集，所述数据集中的数据以低分辨率图像和对应高分辨率真值为一个训练样本；

训练样本加载模块，用于加载训练样本；

多尺度特征模型，用于使用不同扩张率的空洞卷积在不引入额外参数的情况下扩大感受野来提取多尺度特征语义信息，然后聚合多尺度特征和输入低分辨率图像为一个多通道的特征图，并以residual dense block为基础块进行堆叠，并通过上采样网络输出重建后的高分辨率图像；

判别器，用于对经所述多尺度特征模型重建得到的高分辨率图像与所述训练样本的高分辨率真值进行判别，输出判别结果。

优选地，所述多尺度特征模型包括：

多尺度特征提取模块，用于加载训练样本的低分辨率图像，对所述低分辨率图像使用不同扩张率的空洞卷积在不引入额外参数的情况下扩大感受野来提取输入的低分辨率图像的各尺度特征语义信息，并在提取完各尺度的特征最后进行级联以实现聚合；

多尺度特征编码解码网络，用于获取所述多尺度特征提取模块输出的多尺度特征级联在一起的特征图，提取高层语义特征和高频信息；

上采样模块，连接在所述多尺度特征编码解码网络后，使用pixelshuffle模块作为上采样网络，输出重建后高分辨率图像。

优选地，所述训练样本加载模块采用批量加载，每次加载若干个样本，每个训练样本包括一远景图像以及随机抽取的近景图像，在加载时调整每帧图片尺寸，使用旋转、翻转进行数据增强，并对各图片的像素值进行归一化处理。

优选地，所述判别器对输入的真值和所述多尺度特征模型的重建结果，先提取各自多尺度特征，然后对每一种尺度的特征进行判断，最后将不同尺度特征的判别结果进行加权求和，输出判别结果。

优选地，使用生成对抗的方式对所述重建模型进行完整过程的训练。

优选地，利用Adam作为所述多尺度特征模型和所述判别器的优化器，学习率衰减方式使用ReduceLROnPlateau方式。

为达到上述目的，本发明还提供一种基于多尺度特征的车牌图像超分辨率重建方法，包括如下步骤：

步骤S1，加载训练样本，并于加载时对加载的训练样本进行预处理，所加载的训练样本包括远景图像和近景图像；

步骤S2，以迭代方式加载训练样本的低分辨率图像输入到多尺度特征模型，使用不同扩张率的空洞卷积在不引入额外参数的情况下扩大感受野来提取多尺度特征语义信息，然后聚合多尺度特征和输入低分辨率图像为一个多通道的特征图，并以residualdense block为基础块进行堆叠，并通过上采样网络输出重建后的高分辨率图像；

步骤S3，将经多尺度特征模型重建得到的高分辨率图像与所述训练样本中对应高分辨率真值输入到判别器，输出判别结果；

步骤S4，计算判别器损失，并根据该损失进行反向传播更新判别器参数；

步骤S5，计算作为生成器的所述多尺度特征模型的损失，根据求得的损失进行反向传播更新生成器参数；

步骤S6，在每一轮训练后利用验证集中的样本进行一轮验证，并于验证过程中，根据生成器和判别器的平均损失减小生成器和判别器学习率；

步骤S7，重复步骤S1-S6，进行迭代优化直到训练完毕。

优选地，于步骤S1中，批量加载若干训练样本，并在加载时调整每帧图片尺寸，并使用旋转、翻转进行数据增强，并对各图片的像素值进行归一化处理。

优选地，于步骤S3中，对输入的真值和所述多尺度特征模型的重建结果，先提取各自的多尺度特征，然后对每一种尺度的特征进行判断，最后将不同尺度特征的判别结果进行加权求和。

优选地，利用Adam作为生成器和判别器的优化器，学习率衰减方式使用ReduceLROnPlateau方式。

优选地，于步骤S6中，判断生成器的平均损失是否一直减小，若保持连续patience次不减小，则以设定倍数减小生成器学习率；若判别器的的平均损失连续patience次不减小，则以设定倍数减小判别器学习率。

与现有技术相比，本发明一种基于多尺度特征的车牌图像超分辨率重建模型及方法通过以迭代方式加载训练样本的低分辨率图像到多尺度特征模型，使用不同扩张率的空洞卷积在不引入额外参数的情况下扩大感受野来提取多尺度特征语义信息，然后聚合多尺度特征和输入低分辨率图像为一个多通道的特征图，并以residual dense block为基础块进行堆叠，并通过上采样网络输出重建后的高分辨率图像，并将经多尺度特征模型重建得到的高分辨率图像与所述训练样本中对应高分辨率真值输入到判别器，从而实现使用生成对抗网络对车牌图像的多尺度特征进行学习进而达到超分辨率重建的目的。

附图说明

图1为本发明一种基于多尺度特征的车牌图像超分辨率重建模型的系统架构图；

图2为本发明具体实施例中多尺度特征模型的网络示意图；

图3为本发明一种基于多尺度特征的车牌图像超分辨率重建方法的步骤流程图；

图4为本发明实施例中一种基于多尺度特征的车牌图像超分辨率重建流程图。

具体实施方式

以下通过特定的具体实例并结合附图说明本发明的实施方式，本领域技术人员可由本说明书所揭示的内容轻易地了解本发明的其它优点与功效。本发明亦可通过其它不同的具体实例加以施行或应用，本说明书中的各项细节亦可基于不同观点与应用，在不背离本发明的精神下进行各种修饰与变更。

图1为本发明一种基于多尺度特征的车牌图像超分辨率重建模型的系统架构图。如图1所示本发明一种基于多尺度特征的车牌图像超分辨率重建模型，包括：

数据集构建模块101，用于构建训练用车牌图像超分辨率重建数据集。

在本发明具体实施例中，数据集构建模块101通过分别采集抓拍到的低分辨率图像和静止下的高分辨率车牌图像构建训练用车牌图像超分辨率重建数据集，所构建的数据集中的数据配对低分辨率图像和对应高分辨率真值为一个训练样本，数据集包括训练集、验证集和测试集三部分，在本发明具体实施例中，将获得的图像随机按比例1：1：3分别分成测试集、验证集和训练集，其中训练集在训练的时候使用，验证集在每进行一个epoch(当前训练轮数)的训练后，输入模型分别计算生成器损失函数和判别器损失函数，通过损失函数来判断目前模型训练的效果，测试集则用于最终评估模型的超分辨率重建效果。.

训练样本加载模块102，用于加载训练样本，并于加载时对所加载的训练样本进行预处理。

在本发明具体实施例中，加载训练样本采用批量加载，每次加载若干个样本，在加载时调整每帧图片尺寸为256*256，并使用旋转、翻转进行数据增强，并对各图片的像素值进行归一化处理。

多尺度特征模型103，用于使用不同扩张率的dilate卷积(空洞卷积)在不引入额外参数的情况下扩大感受野来提取多尺度特征语义信息，然后聚合多尺度特征和输入低分辨率图像为一个多通道的特征图，并以residual dense block为基础块进行堆叠，在有利于在学习到更深更高语义的特征的同时，减少网络计算复杂度和避免梯度消失，并通过上采样网络输出重建后的高分辨率图像。多尺度特征模型103即指生成器，包括多尺度特征提取和上采样两个环节。

具体地，如图2所示，多尺度特征模型103进一步包括：

多尺度特征提取模块(Dilated Feature Extractor)，用于加载训练样本的低分辨率图像，对所述低分辨率图像使用不同扩张率的dilate卷积(空洞卷积)在不引入额外参数的情况下扩大感受野来提取输入的低分辨率图像的各尺度特征语义信息，并在提取完各尺度的特征最后进行concatation(级联)以实现聚合。

在本发明具体实施例中，多尺度特征提取模块具有7个层，这些层应用具有不同膨胀因子的3×3卷积。膨胀为1、1、2、4、8、16和1。每个卷积都在所有层上运行：严格来说，这些是3×3×C卷积，且在前两个维中都有膨胀。这些卷积中的每一个随后是逐点截断max(〃，0)。最后一层执行1×1×C卷积产生模块的输出。如下表1总结了该体系结构。需注意的是，向上下文网络提供输入的前端模块会生成特征图，分辨率为64×64，因此，停止了第6层之后感受野的指数扩展。

表1

多尺度特征编码解码网络(RDN)，用于获取多尺度特征提取模块输出的多尺度特征级联在一起的特征图，提取高层语义特征和高频信息。如图2所示，RDN模块负责提取高层语义特征和高频信息，主要实现编码器的作用，其以residual dense block为基础块进行堆叠，RDB为超分辨率领域常见的block块，是将残差模块residual block和dense block模块进行了整合,将两者集合起来形成了residual dense block，由于这里的RDN模块以及RDB均不是本发明的创新点，在此不予赘述。本发明利用RDN模块可以在有利于在学习到更深更高语义的特征的同时，减少网络计算复杂度和避免梯度消失。

上采样模块(PixelShuffle)，连接在多尺度特征编码解码网络后，使用pixelshuffle模块作为上采样网络，输出重建后高分辨率图像，也就是说，这里的上采样用于从低分辨率映射到高分辨率，因为上采样之前的特征编码解码都在低分辨率尺度下进行的。

判别器104，用于对经多尺度特征模型103重建得到的高分辨率图像与所述训练样本的高分辨率真值进行判别，输出判别结果。具体地，将真值和多尺度特征模型103的重建结果输入到判别器104中，先提取各自多尺度特征，然后对每一种尺度的特征进行判断，最后将不同尺度特征的判别结果进行加权求和，输出判别结果。

本发明在训练策略上，使用生成对抗的方式对模型进行训练，首先对多尺度特征模型103(也可称之为生成器)进行预训练，获得预训练后多尺度特征模型权重，接着使用生成对抗方式进行微调(fine-tune)，将真值和多尺度特征模型的重建结果输入到判别器中，先提取各自多尺度特征，然后对每一种尺度的特征进行判断，最后将不同尺度特征的判别结果进行加权求和，在本发明具体实施例中，判别器和多尺度特征模型(即生成器)都使用谱归一化，生成器激活函数使用PRELU，判别器激活函数使用LeakyRELU。

本发明中，在每一轮的训练完成后，还利用验证集中的样本进行验证步骤，即将模型切换为评估模式，然后从验证集加载数据，计算损失函数和PSNR、SSIM评价指标。测试步骤则在整个训练过程完成后进行，具体过程和验证步骤类似，由于验证和测试的过程与训练类似，在此不予赘述。

具体地，本发明使用Adam作为生成器和判别器的优化器，学习率衰减方式使用ReduceLROnPlateau方式。在损失函数部分，生成器采用的损失函数包含三部分：对抗损失、均方差损失和内容损失，对抗损失有助于提升生成对抗方式的结果，均方差损失负责在像素尺度对生成帧进行约束，内容损失在特征尺度对生成帧进行约束，有助于提升生成中间帧的结构化信息和纹理信息，求取损失后进行反向传播更新网络参数，重复完成迭代优化直到训练完毕。

图3为本发明一种基于多尺度特征的车牌图像超分辨率重建重建方法的步骤流程图。如图3所示，本发明一种基于多尺度特征的车牌图像超分辨率重建方法，包括如下步骤：

步骤S1，加载训练样本，并于加载时对加载的训练样本进行预处理，所加载的训练样本包括配对的低分辨率图像和对应高分辨率真值。

在本发明具体实施例中，首先需构建训练用车牌图像超分辨率重建数据集，该数据集中的数据以配对低分辨率图像和对应高分辨率真值为一个训练样本，数据集包括训练集、验证集和测试集三部分。

在本发明具体实施例中，加载训练样本采用批量加载，每次加载若干个样本，每个训练样本包括一配对的低分辨率图像和对应高分辨率真值，在加载时调整每帧图片尺寸为256*256，并使用旋转、翻转进行数据增强，并对各图片的像素值进行归一化处理。

步骤S2，以迭代方式加载训练样本的低分辨率图像输入到多尺度特征模型，使用不同扩张率的dilate卷积(空洞卷积)在不引入额外参数的情况下扩大感受野来提取多尺度特征语义信息，然后聚合多尺度特征和输入低分辨率图像为一个多通道的特征图，并以residual dense block为基础块进行堆叠，在有利于在学习到更深更高语义的特征的同时，减少网络计算复杂度和避免梯度消失，并通过上采样网络输出重建后的高分辨率图像。

步骤S3，将经多尺度特征模型重建得到的高分辨率图像与所述训练样本中对应高分辨率真值输入到判别器，输出判别结果。

在本发明具体实施例中，于判别器中，先提取各自的多尺度特征，然后对每一种尺度的特征进行判断，最后将不同尺度特征的判别结果进行加权求和。

在训练策略上，本发明使用生成对抗的方式进行训练，首先对生成器部分(多尺度特征模型)进行预训练，获得预训练后生成器模型权重，接着使用生成对抗方式进行fine-tune，这里将真值和重建结果输入到判别器中，先提取各自多尺度特征，然后对每一种尺度的特征进行判断，最后将不同尺度特征的判别结果进行加权求和，判别器和生成器都使用谱归一化，生成器激活函数使用PRELU，判别器激活函数使用LeakyRELU。

步骤S4，计算判别器损失，并根据该损失进行反向传播更新判别器参数。

在本发明中，判别器损失为典型的生成对抗网络的判别器损失，损失函数可形如如下公式：

由于该判别器损失的损失函数为现有技术中典型的生成对抗网络的判别器损失函数，在此不予赘述

步骤S5，计算多尺度特征模型(即生成器)损失，根据求得的损失进行反向传播更新多尺度特征模型(即生成器)参数。

在本发明具体实施例中，多尺度特征模型(即生成器)采用的损失函数包含三部分：对抗损失、均方差损失和内容损失，对抗损失有助于提升生成对抗方式的结果，均方差损失负责在像素尺度对生成帧进行约束，内容损失在特征尺度对生成帧进行约束，有助于提升生成中间帧的结构化信息和纹理信息，求取损失后进行反向传播更新网络参数，重复完成迭代优化直到训练完毕。由于本发明所采用的生成器网络为现有典型的生成器网络结构，其损失函数也是现有技术中已经揭露的，在此不予赘述

步骤S6，在每一轮训练后利用验证集中的样本进行一轮验证，并于验证过程中，判断多尺度特征模型(即生成器)的平均损失是否一直减小，若保持连续patience次不减小，则以设定倍数减小生成器学习率(即当验证集上损失连续patience次不减少时，则减小学习率)，这里生成器的平均损失指一轮训练迭代下来的生成器损失的平均值；若判别器的的平均损失连续patience次不减小，则以设定倍数减小判别器学习率，这里判别器的平均损失指一轮训练迭代下来的判别器损失的平均值。减小学习率是用于减小搜索步长来寻找模型局部最优点，一开始设定大的学习率用于加速训练过程。调整学习率的目的则是为了在验证集上获得更好地评价指标。

在本发明中，验证过程与训练过程一样，只是验证过程加载的是验证集中的验证数据，在此不予赘述。

步骤S7，重复步骤S1-S6，进行迭代优化直到训练完毕，例如达到设定轮数训练停止。

实施例

如图4所示，在本实施例中，一种基于多尺度特征的车牌图像超分辨率重建流程如下：

S1，制作训练用车牌图像超分辨率重建数据集，数据集包括训练集、验证集和测试集三部分，数据以配对低分辨率图像和对应高分辨率真值为一个训练样本。

S2，加载数据采用批量加载，每次加载若干个样本，在加载时调整每帧图片尺寸为256*256，使用旋转、翻转进行数据增强，然后对像素值进行归一化。

S3，将低分辨率车牌图像输入到多尺度特征模型中，这里多尺度特征模型首先使用不同扩张率的dilate卷积在不引入额外参数的情况下扩大感受野来提取多尺度特征语义信息，然后聚合多尺度特征和输入低分辨率图像为一个多通道的特征图，接着以residual dense block为基础块进行堆叠，在有利于在学习到更深更高语义的特征的同时，减少网络计算复杂度和避免梯度消失。

S4，紧接多尺度特征编码解码网络的是上采样模块，这里使用pixelshuffle模块作为上采样网络，输出重建后高分辨率图像。

S5，使用生成对抗的方式进行训练，首先对生成器部分(即多尺度特征模型)进行预训练，获得预训练后生成器模型权重，接着使用生成对抗方式进行fine-tune，这里将真值和重建结果输入到判别器中，先提取各自多尺度特征，然后对每一种尺度的特征进行判断，最后将不同尺度特征的判别结果进行加权求和，判别器和生成器都使用谱归一化，生成器激活函数使用PRELU，判别器激活函数使用LeakyRELU。

S6，使用Adam作为生成器和判别器的优化器，学习率衰减方式使用ReduceLROnPlateau方式。在损失函数部分，生成器采用的损失函数包含三部分：对抗损失、均方差损失和内容损失，对抗损失有助于提升生成对抗方式的结果，均方差损失负责在像素尺度对生成帧进行约束，内容损失在特征尺度对生成帧进行约束，有助于提升生成中间帧的结构化信息和纹理信息，求取损失后进行反向传播更新网络参数，重复完成迭代优化直到训练完毕。

S7，重复S2到S6步骤，进行迭代优化直到训练完毕，在训练过程中采用生成对抗的思想，将上述网络部分定义为生成器，同时设计了一个多尺度判别器，在同一个epoch下交替对抗训练，其中Epoch表示当前训练轮数，epochs表示总的要训练多少轮。

综上所述，本发明一种基于多尺度特征的车牌图像超分辨率重建模型及方法通过以迭代方式加载训练样本的低分辨率图像到多尺度特征模型，使用不同扩张率的空洞卷积在不引入额外参数的情况下扩大感受野来提取多尺度特征语义信息，然后聚合多尺度特征和输入低分辨率图像为一个多通道的特征图，并以residual dense block为基础块进行堆叠，并通过上采样网络输出重建后的高分辨率图像，并将经多尺度特征模型重建得到的高分辨率图像与所述训练样本中对应高分辨率真值输入到判别器，从而实现使用生成对抗网络对车牌图像的多尺度特征进行学习进而达到超分辨率重建的目的。

上述实施例仅例示性说明本发明的原理及其功效，而非用于限制本发明。任何本领域技术人员均可在不违背本发明的精神及范畴下，对上述实施例进行修饰与改变。因此，本发明的权利保护范围，应如权利要求书所列。

Claims

1.一种基于多尺度特征的车牌图像超分辨率重建模型，包括：

训练样本加载模块，用于加载训练样本；

2.如权利要求1所述的一种基于多尺度特征的车牌图像超分辨率重建模型，其特征在于，所述多尺度特征模型包括：

3.如权利要求2所述的一种基于多尺度特征的车牌图像超分辨率重建模型，其特征在于：所述训练样本加载模块采用批量加载，每次加载若干个样本，每个训练样本包括一远景图像以及随机抽取的近景图像，在加载时调整每帧图片尺寸，使用旋转、翻转进行数据增强，并对各图片的像素值进行归一化处理。

4.如权利要求1所述的一种基于多尺度特征的车牌图像超分辨率重建模型，其特征在于：所述判别器对输入的真值和所述多尺度特征模型的重建结果，先提取各自多尺度特征，然后对每一种尺度的特征进行判断，最后将不同尺度特征的判别结果进行加权求和，输出判别结果；使用生成对抗的方式对所述重建模型进行完整过程的训练。

5.如权利要求1所述的一种基于多尺度特征的车牌图像超分辨率重建模型，其特征在于：利用Adam作为所述多尺度特征模型和所述判别器的优化器，学习率衰减方式使用ReduceLROnPlateau方式。

6.一种基于多尺度特征的车牌图像超分辨率重建方法，包括如下步骤：

步骤S2，以迭代方式加载训练样本的低分辨率图像输入到多尺度特征模型，使用不同扩张率的空洞卷积在不引入额外参数的情况下扩大感受野来提取多尺度特征语义信息，然后聚合多尺度特征和输入低分辨率图像为一个多通道的特征图，并以residual denseblock为基础块进行堆叠，并通过上采样网络输出重建后的高分辨率图像；

步骤S7，重复步骤S1-S6，进行迭代优化直到训练完毕。

7.如权利要求6所述的一种基于多尺度特征的车牌图像超分辨率重建方法，其特征在于，于步骤S1中，批量加载若干训练样本，并在加载时调整每帧图片尺寸，并使用旋转、翻转进行数据增强，并对各图片的像素值进行归一化处理。

8.如权利要求6所述的一种基于多尺度特征的车牌图像超分辨率重建方法，其特征在于：于步骤S3中，对输入的真值和所述多尺度特征模型的重建结果，先提取各自的多尺度特征，然后对每一种尺度的特征进行判断，最后将不同尺度特征的判别结果进行加权求和。

9.如权利要求6所述的一种基于多尺度特征的车牌图像超分辨率重建方法，其特征在于：利用Adam作为生成器和判别器的优化器，学习率衰减方式使用ReduceLROnPlateau方式。

10.如权利要求6所述的一种基于多尺度特征的车牌图像超分辨率重建方法，其特征在于：于步骤S6中，判断生成器的平均损失是否一直减小，若保持连续patience次不减小，则以设定倍数减小生成器学习率；若判别器的的平均损失连续patience次不减小，则以设定倍数减小判别器学习率。