CN113436104A

CN113436104A - 一种基于特征金字塔模型的运动模糊图像去模糊方法

Info

Publication number: CN113436104A
Application number: CN202110725569.4A
Authority: CN
Inventors: 高俊山; 李敬远; 张陶
Original assignee: Harbin University of Science and Technology
Current assignee: Harbin University of Science and Technology
Priority date: 2021-06-29
Filing date: 2021-06-29
Publication date: 2021-09-24

Abstract

本发明公开了一种基于特征金字塔模型的运动模糊图像去模糊方法，包括以下步骤：S1.获取多个运动模糊图像和与之相对应的多个清晰图像组成图像对作为训练集，并获取多个待去模糊的运动图像作为测试集；S2.采用特征金字塔模型对生成对抗网络搭建；S3.设计用于生成对抗网络训练的损失函数；S4.采用步骤S1获取的训练集和步骤S3设计的损失函数对特征金字塔生成对抗网络进行训练；S5.将步骤S1获取的测试集输入到步骤S4训练好的网络模型中得到相应的去模糊图像。本发明采用的基于特征金字塔模型的运动模糊图像去模糊方法，可以获取更多特征信息，减少噪声，有效提高了运动模糊图像去模糊的效率与质量。

Description

一种基于特征金字塔模型的运动模糊图像去模糊方法

技术领域

本发明涉及图像处理技术领域，具体为一种基于特征金字塔模型的运动模糊图像去模糊方法。

背景技术

在不断趋于科技化、数字化、智能化的大时代背景下，图像在获取信息上扮演着愈来愈重要的角色。有研究表明，人类视觉系统所获取的信息占人类获取所有信息的比重高达83％，可谓是一张图像胜过千言万语。近几年，人工智能和虚拟现实的应用越来越普遍，各种拍照设备获取图像也更加的方便，图像成为了人类传递和获取信息的重要方式。但这些图像在获取、处理、传输和保存的过程中由于多种原因的影响，容易导致图像出现严重的质量退化现象，为人们的生活、学习和工作带来很大的困扰，模糊图像就是其中常见的一种。

模糊图像去模糊的主要目的是以相对最小的代价从退化图像中恢复出贴合实际的、并含有丰富纹理细节的清晰图像。而传统模糊图像恢复的方法大部分都是建立在模糊核已知或先决调节预估、假设的前提下，存在相当大的局限性。并且现实场景的模糊核估计难度很大，噪声和场景也存在不确定性，使传统模糊图像恢复无法解决生活、学习和工作中的需求。同时，随着各种成像设备应用于天文检测、医学成像、军事航空、天眼工程等领域，对于图像的质量要求越来越高，而稳定的拍摄器件成本高、操作难度大、实际模糊情况复杂等特点限制了其模糊图像恢复的效果。

发明内容

针对上述研究的问题，本发明的目的在于：为了有效提高了运动模糊图像去模糊的效率与质量，提出了一种基于特征金字塔模型的运动模糊图像去模糊方法。

为了解决上述技术问题，本发明采用的技术方案如下：

一种基于特征金字塔模型的运动模糊图像去模糊方法，包括如下步骤：

S1：获取多个运动模糊图像和与之相对应的多个清晰图像组成图像对作为训练集，并获取多个待去模糊的运动图像作为测试集；

S2：采用特征金字塔模型对生成对抗网络搭建；

进一步的，所述S2的具体步骤为：

S2.1：采用五层由下至上的特征金字塔结构作为生成器的特征提取模块；

S2.2：采用上采样模块根据每层提取的特征生成得到每层的生成图；

S2.3：采用并接模块对每层的生成图进行并接；

S2.4：使用二分类的分类器作为鉴别器模块；

S3：设计用于生成对抗网络训练的损失函数；

S4：采用步骤A获取的训练集和步骤C设计的损失函数对特征金字塔生成对抗网络进行训练；

进一步的，所述S4的具体步骤为：

S4.1：将权力要求1步骤A所获取的训练集输入到权利要求1步骤B搭建的网络中；

S4.2：生成器通过特征提取、上采样、并接生成所述清晰的生成图像；

S4.3：将生成图像与真实图像输入到判别器中；

S4.4：判别器通过损失函数计算得到判别损失，根据计算的损失更新判别器参数；

S4.5：通过更新的判别器计算生成图像与清晰图像的误差；

S4.6：将误差反向传输给生成器；

S4.7：生成器通过生成器损失函数计算得到生成损失，根据计算的损失更新生成器的参数；

S4.8：重复步骤S4.2到步骤S4.7直到达成训练条件，得到训练完成的生成对抗网络模型；

与现有技术相比，本发明的有益效果是：所提出的基于特征金字塔模型的运动模糊图像去模糊方法，采取特征金字塔结构作为图像的特征提取部分，能够多尺度，精细的提取到更多的特征信息，减少噪声的影响，提升了主观评价指标的视觉效果和客观评价指标的数值。采取感知损失和对抗损失结合的损失函数，确保本发明提出的方法有更好的准确性与鲁棒性。设计的网络结构能够更加快速的对运动模糊图像进行去模糊，提高了训练网络的速度，节省时间。

附图说明

图1为本发明流程图；

图2为本发明特征金字塔生成对抗网络训练流程图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，提出相应具体实施方案，对本发明进一步详细说明。

如图1所示，一种基于特征金字塔模型的运动模糊图像去模糊方法，其具体步骤如下：

S2：采用特征金字塔模型对生成对抗网络搭建；

S3：设计用于生成对抗网络训练的损失函数；

如图2所示，一种基于特征金字塔模型的运动模糊图像去模糊方法，包括以下步骤：

S1：将权力要求1步骤S1所获取的训练集输入到权利要求1步骤S2搭建的网络中；

S2：生成器通过特征提取、上采样、并接生成所述清晰的生成图像；

S3：将生成图像与真实图像输入到判别器中；

S4：判别器通过损失函数计算得到判别损失，根据计算的损失更新判别器参数；

S5：通过更新的判别器计算生成图像与清晰图像的误差；

S6：将误差反向传输给生成器；

S7：生成器通过生成器损失函数计算得到生成损失，根据计算的损失更新生成器的参数；

S8：重复步骤S2到步骤S7直到达成训练条件，得到训练完成的生成对抗网络模型；

综上所述，本发明采用的模块化的形式，模块化提高了网络的清晰度，并便于移植与学习；采用基于特征金字塔模型的生成对抗网络，能够多尺度提取到更多的特征信息，减少噪声的影响，提升了主观评价指标的视觉效果和客观评价指标的数值；设计训练流程进行训练。介于模糊图像信息较多，建立特征金字塔结构，通过多尺度提取图像的多尺度特征。采用内插值法上采样对特征进行有效的还原。对还原后的分块图像并接，恢复出完整的生成清晰图像，并利用二分类的判别器对生成清晰图像进行判别分类，将得到的结果信息反馈给判别器和生成器，使其更新参数，从而训练出本发明中的特征金字塔生成对抗网络去模糊模型。本发明采用的基于特征金字塔模型的运动模糊图像去模糊方法，可以获取更多特征信息，减少噪声，有效提高了运动模糊图像去模糊的效率与质量。

以上所述仅为本发明的一个实施方式，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于特征金字塔模型的运动模糊图像去模糊方法，其特征在于，包括以下步骤：

S2：采用特征金字塔模型对生成对抗网络进行搭建；

S3：设计用于生成对抗网络训练的损失函数；

S4：采用步骤S1获取的训练集和步骤S3设计的损失函数对特征金字塔生成对抗网络进行训练；

S5：将步骤S1获取的测试集输入到步骤S4训练好的网络模型中得到相应的去模糊图像，验证图像质量。

2.根据权利要求1所述的一种基于特征金字塔模型的运动模糊图像去模糊方法，其特征在于，所述步骤S1中训练集与测试集获取方法如下：

S1.1：使用Gopro运动相机拍摄n张不同场景下的清晰图像与模糊图像，组成训练集的图像对；

S1.2：使用Gopro运动相机拍摄0.1n张不同于步骤S1.1场景的清晰图像与模糊图像作为测试集。

3.根据权利要求1所述的一种基于特征金字塔模型的运动模糊图像去模糊方法，其特征在于：所述步骤S2中特征金字塔生成对抗网络搭建方法如下：

S2.3：采用并接模块对每层的生成图进行并接；

S2.4：使用二分类的分类器作为鉴别器模块。

4.根据权利要求3所述方法，其特征在于：所述特征提取模块，包含五层特征金字塔结构，每层由两层卷积核大小为3×3，步长为1的卷积层和步长为2的池化层组成，每层后紧跟着归一化层和RELU激活函数层；所述上采样模块，采用内插值方法，即在原有图像像素的基础上在像素点之间采用合适的插值算法插入新的元素，将原有图像大小扩大一倍；所述并接模块，将特征提取与上采样模块采用卷积核为1×1的卷积层连接，改变特征图通道数，以达到各个水平特征图处理大小相同，将图片并接成一个完整的图像。再采用3×3的卷积核对每个融合结果进行卷积，消除上采样的混叠效应。

5.根据权利要求1所述的一种基于特征金字塔模型的运动模糊图像去模糊方法，其特征在于，所述步骤S3生成对抗网络损失函数如下：

生成器整体损失函数为：

L_G＝0.5*l_p+0.006*l_x+0.01*l_a

其中l_p表示均方方差，其函数为：

所述N为数据总量，y_i是真实数据，

是拟合数据；

其中l_x表示感知损失，其函数为：

所述M为特征图的宽，N为特征图的高x_i,j表示网络中第i个池化层前的第j个卷积层的特征；

判别器整体损失函数为：

其中x～P_d(X)表示清晰图像x取自于清晰图像集X，P_d(X)表示清晰图像集X的概率分布；y～P_z(Y)表示模糊图像y取自于模糊图像集Y,P_z(Y)表示模糊图像集Y的概率分布；D(x)表示判别器对输入图像x的判别概率，G(z)表示由输入图像经生成器生成的结果图像，Z[·]表示对括号内取期望。

6.根据权利要求1所述的一种基于特征金字塔模型的运动模糊图像去模糊方法，其特征在于：所述步骤S4特征金字塔生成对抗网络进行训练方法如下：

S4.1：将权力要求1步骤S1所获取的训练集输入到权利要求1步骤S2搭建的网络中；

S4.3：将生成图像与真实图像输入到判别器中；

S4.5：通过更新的判别器计算生成图像与清晰图像的误差；

S4.6：将误差反向传输给生成器；

S4.8：重复步骤S4.2到步骤S4.7直到达成训练条件，得到训练完成的生成对抗网络模型。