CN112686119A

CN112686119A - 基于自注意力生成对抗网络的车牌运动模糊图像处理方法

Info

Publication number: CN112686119A
Application number: CN202011557456.XA
Authority: CN
Inventors: 陈昱莅; 任敬; 马苗; 裴炤; 李雪; 贾宇航
Original assignee: Shaanxi Normal University
Current assignee: Shaanxi Normal University
Priority date: 2020-12-25
Filing date: 2020-12-25
Publication date: 2021-04-20
Anticipated expiration: 2040-12-25
Also published as: CN112686119B

Abstract

一种基于自注意力生成对抗网络的车牌运动模糊图像处理方法，由数据集预处理、构建网络模型、训练生成对抗网络、保存权重文件、测试网络步骤组成。由于本发明采用了生成对抗网络，生成对抗网络是在特征金字塔网络的生成器和双重判别器上添加了自注意力机制构成，训练集在生成对抗网络中进行训练，测试集采用保存训练过程中的权重文件进行测试，充分地利用了图像中结构和几何信息，去除了车牌图像中的运动模糊，解决了车牌运动模糊图像处理方法复杂，处理速度慢的技术问题。与现有技术相比，本发明具有方法简单、处理速度快、处理后车牌的文字清晰等优点，可用于车牌运动模糊图像处理。

Description

基于自注意力生成对抗网络的车牌运动模糊图像处理方法

技术领域

本发明属于计算机视觉技术领域，具体地涉及到车牌运动模糊图片处理。

背景技术

运动模糊图片处理旨在去除存在运动模糊的图片中的运动模糊。随着互联网的发展和个人智能移动设备的大量增加，人们正产生、存储和使用大量的图片；图片中有时存在运动模糊而影响正常的识别操作等，需要对运动模糊图片处理和恢复，在计算机视觉中是基础。由于其广泛的应用场景和研究价值，该技术在学术界和工业界均引起了越来越多的关注。

目前大部分运动模糊图片处理方法可以分成两大类别：一类是传统上通过盲或非盲方式对图像运动去模糊处理作为反卷积问题处理，第二类是使用卷积神经网络对模糊核进行估计，近年来使用GAN用于图像恢复的成功也实现了运动模糊图片处理。其中包括Orest Kupyn等人提出的DeblurGANv2进行图像运动模糊移除。然而由于车牌图像中文字和数字有特定的结构和几何特征的情况，以及网络中需要考虑同个特征图内不同部分细节之间的影响，现有的方法无法全面考虑到图像中的结构几何信息和网络特征图间各部分的影响。

针对现有方法存在的技术问题，本发明提出基于自注意力生成对抗网络的车牌运动模糊图像处理方法。

发明内容

本发明所要解决的技术问题在于克服上述现有技术的缺点，提供一种方法简单、恢复效果好的基于自注意力生成对抗网络的车牌运动模糊图像处理方法。

解决上述技术问题所采用的技术方案是由下述步骤组成：

(1)数据集预处理

取车牌清晰图片数据集S0共4994张，图片大小为500×500像素。

1)随机生成角度τ，角度范围是(0,2π),对τ采用马尔可夫随机过程方法生成运动轨迹矢量，对运动轨迹矢量采用亚像素插值法生成模糊内核，模糊内核与清晰图片数据集S0卷积生成车牌模糊图片数据集B0。

2)将车牌清晰图片数据集S0与相对应的车牌模糊图片数据集B0构成清晰-模糊图片对数据集；

3)清晰-模糊图片对数据集中按3：1的比例划分为训练集P和测试集Q，其中训练集P内车牌清晰图片数据集为S，车牌模糊图片数据集为B；训练集Q内车牌清晰图片数据集为S1，车牌模糊图片数据集为B1。

(2)构建网络模型

1)构建生成对抗网络模型的生成器G

A构建自注意力机制的基础特征提取网络

a模块1-1用基础E1卷积层块卷积操作得特征图C1，连接自注意力机制卷积层网络I，自注意力机制卷积层网络I卷积核输入通道数为32。

b模块1-2用基础E2卷积层块对模块1-1输出的特征图卷积操作，连接自注意力机制卷积层网络I，自注意力机制卷积层网络I卷积核输入通道数为64，得到特征图C2。

c模块1-3用基础E3卷积层块对特征图C2卷积操作，连接自注意力机制卷积层网络I，自注意力机制卷积层网络I卷积核输入通道数为192，得到特征图C3。

d模块1-4用基础E4卷积层块对特征图C3卷积操作，连接自注意力机制卷积层网络I，自注意力机制卷积层网络I卷积核输入通道数为1088，得到特征图C4。

e模块1-5用基础E5卷积层块对特征图C4卷积操作，得到特征图C5。

B构建特征图融合网络

a模块1-6是卷积核大小为1×1的卷积层，对特征图C5卷积操作，得到特征图D5，用最近邻上采样法对特征图D5进行上采样，得到特征图K5。

b模块1-7是卷积核大小为1×1的卷积层，对特征图C4卷积操作与特征图K5叠加，连接卷积核大小为3×3的卷积层卷积操作，得到特征图D4，用最近邻上采样法对特征图D4进行上采样，得到特征图K4。

c模块1-8是卷积核大小为1×1的卷积层，对特征图C3卷积操作与特征图K4叠加，连接卷积核大小为3×3的卷积层卷积操作得到特征图D3，用最近邻上采样法对特征图D3进行上采样，得到特征图K3。

d模块1-9是卷积核大小为1×1的卷积层，对特征图C2卷积操作与特征图K3叠加，连接卷积核大小为3×3的卷积层卷积操作得到特征图D2。

e模块1-10是卷积核大小为1×1的卷积层，对特征图C1卷积操作得到特征图D1。

f模块1-11是对特征图集合{D2，D3，D4，D5}分别进行扩大因子为1，2，4，8的最近邻上采样法上采样操作，得到的结果拼接融合为特征图R1。

g模块1-12是卷积核大小为3×3的卷积层，对特征图R1卷积操作，串联自注意力机制卷积层网络I，用最近邻上采样法进行上采样操作，与特征图D1叠加，其后连接3×3卷积核的平滑卷积层。

2)构建生成对抗网络模型的判别器D

判别器D的构建方法如下：

A模块2-1是基础H1卷积层依次连接基础H2卷积层、自注意力机制卷积层网络I，自注意力机制卷积层网络I的输入通道数为256。

B模块2-2基础H3卷积层连接自注意力机制卷积层网络I，自注意力机制卷积层网络I输入通道数为512，得到局部信息判别器的概率值P_l。

C模块2-3基础H4卷积层连接自注意力机制卷积层网络I，自注意力机制卷积层网络I输入通道数为512。

D模块2-4基础H5卷积层连接自注意力机制卷积层网络I，自注意力机制卷积层网络I输入通道数为512，得到全局信息判别器的概率值P_g。

3)自注意力机制卷积层网络I的构建方法

上述的自注意力机制卷积层网络I的构建方法如下：

A构建注意力影响权重分布层

按下式得到自注意力机制的影响权重分布图α_j,i：

s_ij＝f(x_i)^Tg(x_j)

其中x_i表示输入的特征图x上位置i的值，x_j表示输入的特征图x上位置j的值，g(x_j)，f(x_i)分别表示卷积核大小为1×1的卷积层对输入的特征图x上像素i,j卷积操作，i,j∈{1,2,...,N}，N是图像上的位置总数，N为有限的正整数，μ的值是10，ω的值是0.5。

B构建自注意力特征图层

按下式得到自注意力机制特征图o_j：

其中h(x_i)表示卷积核大小为1×1的卷积层对输入的特征图x上像素i卷积操作，α_j,i是影响权重分布层得到的输出结果。

C构建输出层

按下式得卷积层输出y_j：

y_j＝γo_j+x_j

其中o_j是自注意力层的输出结果，γ表示可训练权重，被初始化为0，表示模型将探索局部空间信息。

(3)训练生成对抗网络

1)确定损失函数

损失函数Loss由下式确定:

L_G＝0.5×L_p+0.006×L_X+0.01×L_adv

其中L_p为均方误差损失，L_X欧氏距离损失，L_adv对抗损失，L_adv由下式定义：

L_adv＝E_s～p(S)[(D(s)-E_b～p(B)D(G(b))-1)²]+E_b～p(B)[(D(G(b))-E_s～p(S)D(s)+1)²]

其中s～p(S)表示从车牌清晰图片数据集S中取出清晰图片s，p(S)表示车牌清晰图片数据集S中的概率分布；b～p(B)表示从车牌模糊图片数据集B中取出模糊图片b，p(B)表示车牌模糊图片数据集B中的概率分布；D(s)表示判别器对输入的清晰图片s判别为真的概率，G(b)表示输入模糊图片b后生成器G的输出结果图片，D(G(b))表示判断生成器在输入模糊图片b后的输出是否为真的概率，E[·]表示对括号内部值取期望。

2)训练生成对抗网络的判别器D和生成器G

生成对抗网络的生成器G输入为训练集P中车牌模糊图片数据集B的模糊车牌图像，输出的图像作为生成对抗网络判别器D的输入，判别器D判断生成器G输出的图像是否是真实图像的概率，在训练判别器D和生成器G过程中，生成对抗网络的学习率γ为0.0001，优化器为自适应矩估计优化器，每次迭代使用图片的数量为Z，Z取值范围是[4,16]，训练迭代直至生成对抗网络的损失函数Loss收敛。

(4)保存权重文件

每迭代M次保存一次相应的参数及权重文件，其中M取值范围是[100,10000]。

(5)测试网络

将测试集Q中车牌模糊图片数据集B1中的模糊图像输入到基于自注意力机制的生成对抗网络模型，加载保存的参数和权重文件，输出清晰车牌图像。

在本发明的训练生成对抗网络的判别器D和生成器G步骤(3)的步骤2)中，Z最佳取值为8。

在本发明的保存权重文件步骤(4)中，M最佳取值为5000。

由于本发明采用了将车牌图片数据集分割成训练集、测试集，在特征金字塔网络的生成器和双重判别器上添加了自注意力机制构成生成对抗网络，训练集在生成对抗网络中进行训练，测试集采用保存训练过程中的权重文件进行测试，充分地利用了图像中结构和几何信息，去除了车牌图像中的运动模糊，解决了车牌运动模糊图像处理方法复杂，处理速度慢的技术问题。与现有技术相比，本发明具有方法简单、处理速度快、处理后车牌的文字清晰等优点，可用于车牌运动模糊图像处理。

附图说明

图1本发明实施例1的流程图。

图2是图1中构建网络模型的构建生成对抗网络模型的生成器流程图。

图3是图1中构建网络模型的构建生成对抗网络模型的判别器流程图。

图4是车牌模糊图片数据集B1中1张车牌模糊图片。

图5是采用实例1方法对图4的处理结果图。

具体实施方式

下面结合附图和实例对本发明进一步详细说明，但本发明不限于下述实施例。

实施例1

以在图片来自车牌清晰图片数据集中取4994张图片为例，本实施例的基于自注意力生成对抗网络的车牌运动模糊图像处理方法由下述步骤组成(参见图1)：

(1)数据集预处理

取车牌清晰图片数据集S0共4994张，图片大小为500×500像素。

1)随机生成角度τ，角度范围是(0,2π)，本实施例的生成角度τ取值为π，对τ采用马尔可夫随机过程方法生成运动轨迹矢量，对运动轨迹矢量采用亚像素插值法生成模糊内核，模糊内核与清晰图片数据集S0卷积生成车牌模糊图片(如图4所示)数据集B0。

(2)构建网络模型

在图2、图3中，本实施例的构建网络模型的方法如下：

1)构建生成对抗网络模型的生成器G

A构建自注意力机制的基础特征提取网络

e模块(1-5)用基础E5卷积层块对特征图C4卷积操作，得到特征图C5。

B构建特征图融合网络

2)构建生成对抗网络模型的判别器D

本实施例判别器D的构建方法如下：

3)自注意力机制卷积层网络I的构建方法

上述的自注意力机制卷积层网络I的构建方法如下：

A构建注意力影响权重分布层

按下式得到自注意力机制的影响权重分布图α_j,i：

s_ij＝f(x_i)^Tg(x_j)

B构建自注意力特征图层

按下式得到自注意力机制特征图o_j：

C构建输出层

按下式得卷积层输出y_j：

y_j＝γo_j+x_j

(3)训练生成对抗网络

1)确定损失函数

损失函数Loss由下式确定:

L_G＝0.5×L_p+0.006×L_X+0.01×L_adv

2)训练生成对抗网络的判别器D和生成器G

生成对抗网络的生成器G输入为训练集P中车牌模糊图片数据集B的模糊车牌图像，输出的图像作为生成对抗网络判别器D的输入，判别器D判断生成器G输出的图像是否是真实图像的概率，在训练判别器D和生成器G过程中，生成对抗网络的学习率γ为0.0001，优化器为自适应矩估计优化器，每次迭代使用图片的数量为Z，Z取值范围是[4,16]，本实施例的Z取值为8，训练迭代直至生成对抗网络的损失函数Loss收敛。

(4)保存权重文件

每迭代M次保存一次相应的参数及权重文件，其中M取值范围是[100,10000]，本实施例的M取值为5000。

(5)测试网络

将测试集Q中车牌模糊图片数据集B1中的模糊图像输入到基于自注意力机制的生成对抗网络模型，加载保存的参数和权重文件，输出清晰车牌图像，如图5所示。

实施例2

以在图片来自车牌清晰图片数据集中取4994张图片为例，本实施例的基于自注意力生成对抗网络的车牌运动模糊图像处理方法由下述步骤组成：

(1)数据集预处理

取车牌清晰图片数据集S0共4994张，图片大小为500×500像素。

随机生成角度τ，角度范围是[0,2π]，本实施例的生成角度τ取值为

对τ采用马尔可夫随机过程方法生成运动轨迹矢量，对运动轨迹矢量采用亚像素插值法生成模糊内核，模糊内核与清晰图片数据集S0卷积生成车牌模糊图片数据集B0。

该步骤的其它步骤与实施例1相同。

(2)构建网络模型

该步骤与实施例1相同

(3)训练生成对抗网络

1)确定损失函数

该步骤与实施例1相同。

2)训练生成对抗网络的判别器D和生成器G

生成对抗网络的生成器G输入为训练集P中车牌模糊图片数据集B的模糊车牌图像，输出的图像作为生成对抗网络判别器D的输入，判别器D判断生成器G输出的图像是否是真实图像的概率，在训练判别器D和生成器G过程中，生成对抗网络的学习率γ为0.0001，优化器为自适应矩估计优化器，每次迭代使用图片的数量为Z，Z取值范围是[4,16]，本实施例的Z取值为4，训练迭代直至生成对抗网络的损失函数Loss收敛。

(4)保存权重文件

每迭代M次保存一次相应的参数及权重文件，其中M取值范围是[100,10000]，本实施例的M取值为100。

其它步骤与实施例1相同。输出清晰车牌图像。

实施例3

(1)数据集预处理

取车牌清晰图片数据集S0共4994张，图片大小为500×500像素。

该步骤的其它步骤与实施例1相同。

(2)构建网络模型

该步骤与实施例1相同

(3)训练生成对抗网络

1)确定损失函数

该步骤与实施例1相同。

2)训练生成对抗网络的判别器D和生成器G

生成对抗网络的生成器G输入为训练集P中车牌模糊图片数据集B的模糊车牌图像，输出的图像作为生成对抗网络判别器D的输入，判别器D判断生成器G输出的图像是否是真实图像的概率，在训练判别器D和生成器G过程中，生成对抗网络的学习率γ为0.0001，优化器为自适应矩估计优化器，每次迭代使用图片的数量为Z，Z取值范围是[4,16]，本实施例的Z取值为16，训练迭代直至生成对抗网络的损失函数Loss收敛。

(4)保存权重文件

每迭代M次保存一次相应的参数及权重文件，其中M取值范围是[100,10000]，本实施例的M取值为10000。

其它步骤与实施例1相同，输出清晰车牌图像。

Claims

1.一种基于自注意力生成对抗网络的车牌运动模糊图像处理方法，其特征在于由下述步骤组成：

(1)数据集预处理

取车牌清晰图片数据集S0共4994张，图片大小为500×500像素；

1)随机生成角度τ，角度范围是(0,2π)，对τ采用马尔可夫随机过程方法生成运动轨迹矢量，对运动轨迹矢量采用亚像素插值法生成模糊内核，模糊内核与清晰图片数据集S0卷积生成车牌模糊图片数据集B0；

3)清晰-模糊图片对数据集中按3：1的比例划分为训练集P和测试集Q，其中训练集P内车牌清晰图片数据集为S，车牌模糊图片数据集为B；训练集Q内车牌清晰图片数据集为S1，车牌模糊图片数据集为B1；

(2)构建网络模型

1)构建生成对抗网络模型的生成器G

A构建自注意力机制的基础特征提取网络

a模块(1-1)用基础E1卷积层块卷积操作得特征图C1，连接自注意力机制卷积层网络I，自注意力机制卷积层网络I卷积核输入通道数为32；

b模块(1-2)用基础E2卷积层块对模块(1-1)输出的特征图卷积操作，连接自注意力机制卷积层网络I，自注意力机制卷积层网络I卷积核输入通道数为64，得到特征图C2；

c模块(1-3)用基础E3卷积层块对特征图C2卷积操作，连接自注意力机制卷积层网络I，自注意力机制卷积层网络I卷积核输入通道数为192，得到特征图C3；

d模块(1-4)用基础E4卷积层块对特征图C3卷积操作，连接自注意力机制卷积层网络I，自注意力机制卷积层网络I卷积核输入通道数为1088，得到特征图C4；

e模块(1-5)用基础E5卷积层块对特征图C4卷积操作，得到特征图C5；

B构建特征图融合网络：

a模块(1-6)是卷积核大小为1×1的卷积层，对特征图C5卷积操作，得到特征图D5，用最近邻上采样法对特征图D5进行上采样，得到特征图K5；

b模块(1-7)是卷积核大小为1×1的卷积层，对特征图C4卷积操作与特征图K5叠加，连接卷积核大小为3×3的卷积层卷积操作，得到特征图D4，用最近邻上采样法对特征图D4进行上采样，得到特征图K4；

c模块(1-8)是卷积核大小为1×1的卷积层，对特征图C3卷积操作与特征图K4叠加，连接卷积核大小为3×3的卷积层卷积操作得到特征图D3，用最近邻上采样法对特征图D3进行上采样，得到特征图K3；

d模块(1-9)是卷积核大小为1×1的卷积层，对特征图C2卷积操作与特征图K3叠加，连接卷积核大小为3×3的卷积层卷积操作得到特征图D2；

e模块(1-10)是卷积核大小为1×1的卷积层，对特征图C1卷积操作得到特征图D1；

f模块(1-11)是对特征图集合{D2，D3，D4，D5}分别进行扩大因子为1，2，4，8的最近邻上采样法上采样操作，得到的结果拼接融合为特征图R1；

g模块(1-12)是卷积核大小为3×3的卷积层，对特征图R1卷积操作，串联自注意力机制卷积层网络I，用最近邻上采样法进行上采样操作，与特征图D1叠加，其后连接3×3卷积核的平滑卷积层；

2)构建生成对抗网络模型的判别器D

判别器D的构建方法如下：

A模块(2-1)是基础H1卷积层依次连接基础H2卷积层、自注意力机制卷积层网络I，自注意力机制卷积层网络I的输入通道数为256；

B模块(2-2)基础H3卷积层连接自注意力机制卷积层网络I，自注意力机制卷积层网络I输入通道数为512，得到局部信息判别器的概率值P_l；

C模块(2-3)基础H4卷积层连接自注意力机制卷积层网络I，自注意力机制卷积层网络I输入通道数为512；

D模块(2-4)基础H5卷积层连接自注意力机制卷积层网络I，自注意力机制卷积层网络I输入通道数为512，得到全局信息判别器的概率值P_g；

3)自注意力机制卷积层网络I的构建方法

上述的自注意力机制卷积层网络I的构建方法如下：

A构建注意力影响权重分布层

按下式得到自注意力机制的影响权重分布图α_j,i：

s_ij＝f(x_i)^Tg(x_j)

其中x_i表示输入的特征图x上位置i的值，x_j表示输入的特征图x上位置j的值，g(x_j)，f(x_i)分别表示卷积核大小为1×1的卷积层对输入的特征图x上像素i,j卷积操作，i,j∈{1,2,...,N}，N是图像上的位置总数，N为有限的正整数，μ的值是10，ω的值是0.5；

B构建自注意力特征图层

按下式得到自注意力机制特征图o_j：

其中h(x_i)表示卷积核大小为1×1的卷积层对输入的特征图x上像素i卷积操作，α_j,i是影响权重分布层得到的输出结果；

C构建输出层

按下式得卷积层输出y_j：

y_j＝γo_j+x_j

其中o_j是自注意力层的输出结果，γ表示可训练权重，被初始化为0，表示模型将探索局部空间信息；

(3)训练生成对抗网络

1)确定损失函数

损失函数Loss由下式确定:

L_G＝0.5×L_p+0.006×L_X+0.01×L_adv

其中s～p(S)表示从车牌清晰图片数据集S中取出清晰图片s，p(S)表示车牌清晰图片数据集S中的概率分布；b～p(B)表示从车牌模糊图片数据集B中取出模糊图片b，p(B)表示车牌模糊图片数据集B中的概率分布；D(s)表示判别器对输入的清晰图片s判别为真的概率，G(b)表示输入模糊图片b后生成器G的输出结果图片，D(G(b))表示判断生成器在输入模糊图片b后的输出是否为真的概率，E[·]表示对括号内部值取期望；

2)训练生成对抗网络的判别器D和生成器G

生成对抗网络的生成器G输入为训练集P中车牌模糊图片数据集B的模糊车牌图像，输出的图像作为生成对抗网络判别器D的输入，判别器D判断生成器G输出的图像是否是真实图像的概率，在训练判别器D和生成器G过程中，生成对抗网络的学习率γ为0.0001，优化器为自适应矩估计优化器，每次迭代使用图片的数量为Z，Z取值范围是[4,16]，训练迭代直至生成对抗网络的损失函数Loss收敛；

(4)保存权重文件

每迭代M次保存一次相应的参数及权重文件，其中M取值范围是[100,10000]；

(5)测试网络

2.根据权利要求1所述的基于自注意力生成对抗网络的车牌运动模糊图像处理方法，其特征在于：在训练生成对抗网络的判别器D和生成器G步骤(3)的步骤2)中，所述的Z取值为8。

3.根据权利要求1所述的基于自注意力生成对抗网络的车牌运动模糊图像处理方法，其特征在于：在保存权重文件步骤(4)中，所述的M取值为5000。