CN113538258A

CN113538258A - 基于掩码的图像去模糊模型及方法

Info

Publication number: CN113538258A
Application number: CN202110659150.3A
Authority: CN
Inventors: 高钦泉; 李茹; 郑伟鑫; 郭立; 谢军伟; 童同
Original assignee: Fuzhou University
Current assignee: Fuzhou University
Priority date: 2021-06-15
Filing date: 2021-06-15
Publication date: 2021-10-22
Anticipated expiration: 2041-06-15
Also published as: CN113538258B

Abstract

本发明提出一种基于掩码的图像去模糊模型及方法，其特征在于：其首先提出了一个掩码预测模型以实现对各种模糊核的准确预测。然后，提出了一个基于掩码的去模糊模型，该模型利用模糊估计模块和去模糊模块，以交替迭代的方式实现图像模糊掩码的去除。最后,本发明采用两阶段的训练方式，第一阶段单独进行掩码预测模型的实现，将得到的掩码图像送入第二阶段，第二阶段进行去模糊工作，实现图像模糊的准确去除。

Description

基于掩码的图像去模糊模型及方法

技术领域

本发明属于计算机视觉、图像处理技术领域，尤其涉及一种基于掩码的图像去模糊模型及方法。

背景技术

图像模糊是在图像捕获过程中发生的较常见和较明显的伪影之一。模糊图像主要通过估计未知模糊核类型实现去模糊，近几年随着深度学习的兴起，多种基于神经网络的算法被提出用于计算机视觉任务，如图像修复、目标检测等。目前，利用CNN进行图像去模糊的各种方算法已被提出，利用监督学习以端对端的方式训练去模糊网络显示出其优异性，编码器-解码器结构和多尺度结构网络在图像去模糊任务也展现出其有效性。

针对当前限制图像修复发展的种种问题，研究者将图像修复任务与计算机技术融合，研究方法可分为两大类：基于传统算法和基于深度学习算法。

传统方法通常对模糊图像的模糊核类型进行建模，即对模糊核估计进行约束，并且具有用于去除模糊的正则化项，但是这些方法无法概括复杂的实际模糊图像，导致泛化性不强，效果不佳。此外，基于总变化量，稀疏编码，自相似性，先验梯度等方法也常用于单张图像去模糊任务中，但均未实现较好的去模糊效果。

基于深度学习的去模糊算法采用编码器-解码器结构学习模糊图像与高清图像对之间的非线性映射关系，实现单张图像的模糊去除。早期的学习方法通常分为两个步骤：首先，使用深层神经网络估计模糊核，然后使用传统的反卷积方法获得清晰的图像。通过分类和回归分析对模糊核进行估计，并使用CNN代替传统方法来估计未知的模糊内核，这些方法始终遵循着传统框架。基于生成对抗网络的算法可以去除图像模糊，但是该方法无法很好的解决动态场景中的非均匀模糊问题，在去模糊结果中会造成模糊伪影。

近年来，研究者们提出无需估计模糊核的端到端单张图像去模糊。基于多尺度的方法以迭代的方式提取模糊图像的多尺度信息，从而还原出清晰的图像，但是该方法以相同的网络权重恢复模糊图像，缺少处理非均匀模糊图像的自适应机制。基于全卷积估计运动流的方法在实际情况中无法取得较好的估计效果，以至于无法正确的对现实世界的非均匀且复杂的模糊进行建模。

发明内容

当前现有的技术只能针对特定类型模糊的独有特征进行去除，没能充分利用上下文信息，泛化性弱，无法达到实际工程需求。有鉴于此，为了弥补现有技术的空白和不足，本发明的目的在于提供一种基于掩码的图像去模糊模型及方法，该算法可以有效预测模糊图像的掩码图像，有效实现单张图像的模糊去除，可以得到质量较高的去模糊图像。

由于图像模糊是图像捕获过程中发生的常见和较明显的伪影之一,本发明方案解决了无法准确预测各种类型模糊核的问题，利用掩码实现图像模糊的精确去除，提升了图像去模糊的质量效果，使其可以达到实际工业需求。其首先提出了一个掩码预测模型以实现对各种模糊核的准确预测。然后，提出了一个基于掩码的去模糊模型，该模型利用模糊估计模块和去模糊模块，以交替迭代的方式实现图像模糊掩码的去除。最后,本发明采用两阶段的训练方式，第一阶段单独进行掩码预测模型，将得到的掩码图像送入第二阶段，第二阶段进行去模糊工作，实现图像模糊的准确去除。

考虑到相机拍摄时抖动或者场景的变化等因素导致图像模糊是非常常见的问题，去除模糊图像中的模糊是图像修复工作中重要的一环。目前很多研究都已证实上述模糊图像均属于非均匀模糊图像,但是很少方法在确保精确模拟非均匀模糊的同时考虑到模型的复杂度。本发明所设计的方法可以准确预测模糊图像的模糊核，并且实现较好的去模糊效果，可达工业要求，泛化性好，可以适用于各种模糊类型。

本发明具体采用以下技术方案：

一种基于掩码的图像去模糊模型，其特征在于，包括：掩码生成网络和去伪影网络；

所述掩码生成网络为编码器-解码器结构，用于生成伪影掩码图像；

所述去伪影网络采用浅层特征与深层特征相融合的多分辨率去伪影网络结构，用于在生成的伪影掩码图像的基础上保留图像浅层信息获得去模糊图像。

进一步地，所述掩码生成网络包括第一编码器、特征提取层和第一解码器；

所述第一编码器为一个普通卷积；所述特征提取层由八个Resblock模块组成，所述第一解码器为一个普通卷积。

进一步地，所述去伪影网络包括第二编码器、非线性映射层和第二解码器；

所述第二编码器的结构为：

I_en1＝↓(conv(cat(I_input，I_mask)))

I_en2＝↓(conv(I_enc1))

I_en3＝conv(I_enc2)；

其中，I_en表示第二编码器结构中每一层的输出结果，I_mask表示伪影掩码图像，cat(·)表示concatenate操作，conv(·)表示普通卷积操作，↓表示将特征图分辨率下采样为输入特征图分辨率的一半；

所述非线性映射层由多个Resblock模块组成，具体表示为：

F＝Res(Res(Res(…Res(I_enc3))))

其中，F表示特征图经过非线性映射层得到的输出结果，Res(·)表示Resblock 操作；

所述第二解码器的结构为：

I_de1＝↑(conv(F))

I_de2＝↑(cat(conv(I_de1)，I_mix1))

I_de3＝cat(conv(I_de2)，I_mix2)

I_output＝conv(I_de3)；

其中，I_de表示第二解码器每一层的输出结果，I_output表示去伪影网络最终输出的去除模糊的结果图，↑表示将特征图分辨率上采样为输入特征图分辨率的两倍，I_mix表示特征图经mix(·)操作的输出结果，

其中，mix(·)具体如下式所示：

I_mix-en＝↓(↓(I_en))

I_mix-de1＝↓(I_de)

I_mix-de2＝↓(I_mix-de1)

I_mix＝↑(I_mix-de1+↑(I_mix-de2+I_mix-en))

其中，I_mix-en表示第二编码器输出经由mix(·)操作所得特征图，I_mix-de1与 I_mix-de2分别表示第二解码器输出经过mix(·)操作所得中间特征图，I_mix表示 mix(·)操作的最终输出结果。

进一步地，整个网络模型的损失函数表示为：

L_mask＝L₁(I_mask，I_clean-I_input)

L_debkur＝L₁(I_input，I_vlean)

L＝L_deblur+β·L_mask；

其中，L_mask和L_deblur分别表示掩码生成网络的损失函数和去伪影网络的损失函数,L₁(·)表示L₁损失函数，β表示掩码生成网络的损失函数的权重。

以及，根据基于掩码的图像去模糊模型的去模糊方法，其特征在于：第一阶段通过所述掩码生成网络对模糊图像的掩码进行预测；第二阶段将生成的掩码图像传递到去伪影网络与对应输入的模糊图像合并进行学习，实现模糊图像的去模糊。

基于掩码的图像去模糊模型的去模糊方法，其特征在于，包括：

步骤S1：获取清晰的高清图像和模糊图像的成对图像，进行数据增强，构建图像数据集；

步骤S2：将待处理的模糊图像与高清图像对逐对图像对输入由掩码生成网络和去伪影网络构成的去模糊网络模型，得到消除了模糊的去模糊图像。

进一步地，所述数据增强包括对图像进行随机剪裁、翻转和旋转操作。

进一步地，首先训练所述掩码生成网络，以准确预测掩码图像；之后交替式训练掩码生成网络与去伪影网络，以实现模糊去除效果。

进一步地，模型训练采用渐进式训练策略，将训练过程分为多个子训练周期，一次进行一个子训练周期的训练，训练开始时以大学习率开始训练，学习率衰减方式为余弦退火方式，当执行完一个子训练周期时，学习率增加以重启训练过程，直至迭代完成。

由于图像模糊在生活中是广泛存在的，图像去模糊问题从上个世纪起就得到了关注和研究。随着时间的发展，为了解决图像去模糊问题，去模糊问题已经衍生出许多的方法和类别，按照退化类型进行分类可以分为运动模糊，高斯模糊，散焦模糊，湍流模糊等。本发明的工作立足于解决图像成像过程中的模糊问题，可运用于各种类型模糊图像的模糊去除。

与现有技术相比，本发明及其优选方案，可以准确预测掩码并实现较好的图像去模糊效果，且该算法泛化性好，可以应用于多种场景的图像修复问题，可达到实际工业需求。

其将去模糊任务一分为二：模糊预测和去模糊双任务，利用对模糊情况的估计去除图像模糊有助于准确去除模糊图像的模糊；上述两个网络均堆叠多个 Resblock以充分学习图像深层特征。CNN浅层部分可获取浅层特征(如边缘和轮廓)，但随着网络深度的增加，浅层特征会逐渐退化，为了解决这一问题，本发明将网络中的浅层特征和深层特征结合，通过具有串联和跳跃链接等方式生成新的特征图。在去模糊网络中，下采样层和上采样层特征之间缺少连接，这会导致浅层信息的丢失，因此应用mix(·)操作融合编码器部分特征和解码器部分特征以保留图像信息。

此外，若第一阶段的掩码生成模型存在误差，会严重影响第二阶段的去模糊性能，故此本发明在第二阶段采取掩码生成网络与去伪影网络交替进行的方式，以减小第一阶段的不良影响，该模型结构有助于第二阶段去伪影模型性能的提升。

附图说明

下面结合附图和具体实施方式对本发明进一步详细的说明：

图1为本发明实施例网络模型总体框架流程示意图。

图2为本发明实施例总体网络结构示意图。

图3为本发明实施例Resblock模块结构示意图。

图4为本发明实施例掩码生成网络结构示意图。

图5为本发明实施例去伪影网络结构示意图。

具体实施方式

为让本专利的特征和优点能更明显易懂，下文特举实施例，作详细说明如下：

如图1-图5所示，为了实现本发明目的，本实施例设计了两阶段的网络模型，总体框架流程图如图1所示：

首先第一阶段为伪影掩码生成模型，掩码生成网络研究了模糊图像掩码的形成，通过搭建掩码网络实现对模糊图像的掩码精确预测。其次，第二阶段为去伪影模型，掩码生成模型将生成的掩码图像传递到去伪影模型与对应输入模糊图像合并进行学习，实现模糊图像的准确去模糊。总体网络结构图如图2所示。

具体步骤如下：

1、数据集准备

收集模糊图像和高清图像的成对图像，并对数据进行增强，构建图像数据集。数据增强包括对图像进行旋转和翻转操作。

2、掩码建模

I_mask＝I_blur-I_clean (1)

其中，I_mask，I_blur和I_clean分别表示掩码图像、模糊图像和对应高清图像。

3、掩码生成模型

第一阶段首先构建掩码生成网络，并基于图像数据集进行第一阶段训练，得到掩码图像，掩码生成网络为编码器-解码器结构；

编码器部分为一个普通卷积，将训练集的模糊图像输入至编码器模型进行学习得到浅层特征；

将上述浅层特征传递到特征提取层进行充分的特征学习，特征提取层由八个Resblock模块组成，Resblock模块结构图如图3所示。

将上述特征图传递至解码器解码，上述解码器由单个普通卷积组成，最终上述特征图经过解码得到预期的对应掩码图像，掩码生成网络如图4所示。

4、去伪影网络

掩码生成网络将生成的掩码图像传递至第二阶段，与对应模糊图像合并输入至网络学习，最终得到消除了模糊的结果图像。如图5所示，去伪影网络包括编码器、非线性映射层和解码器部分；

编码器部分，将模糊图像和对应掩码图像合并输入编码器网络执行特征提取阶段，具体步骤详情如下：

I_en1＝↓(conv(cat(I_input，I_mask))) (2)

I_en2＝↓(conv(I_enc1)) (3)

I_en3＝conv(I_enc2) (4)

其中，I_en表示编码器结构中每一层的输出结果，I_mask表示第一阶段输出模糊图像与输入模糊图像对应的掩码图像，cat(·)表示concatenate操作，conv(·) 表示普通卷积操作，↓表示将特征图分辨率下采样为输入特征图分辨率的一半。去伪影网络结构图如图5所示。

编码器输出特征图经由非线性映射层进行充分的特征学习，学习模糊图像的深层次特征，非线性映射层由多个Resblock模块组成，具体表示为：

F＝Res(Res(Res(…Res(I_enc3)))) (5)

F表示上述特征图经过非线性映射层得到的输出结果，Res(·)表示Resblock 操作。

输入图像经过编码器和非线性映射层的充分学习，最终传递到解码器部分，解码器由以下步骤组成：

I_de1＝↑(conv(F)) (6)

I_de2＝↑(cat(conv(I_de1)，I_mix1)) (7)

I_de3＝cat(conv(I_de2)，I_mix2) (8)

I_output＝conv(I_de3) (9)

其中，I_de表示解码器每一层的输出结果，I_output表示去伪影网络最终输出的去除模糊的结果图，↑表示将特征图分辨率上采样为输入特征图分辨率的两倍， I_mix表示上述特征图经mix(·)操作的输出结果，mix(·)具体如下式所示：

I_mix-en＝↓(↓(I_en)) (10)

I_mix-de1＝↓(I_de) (11)

I_mix-de2＝↓(I_mix-de1) (12)

I_mix＝↑(I_mix-de1+↑(I_mix-de2+I_mix-en)) (13)

其中，I_mix-en表示上述编码器输出经由mix(·)操作所得特征图，I_mix-de1与 I_mix-de2分别表示上述解码器输出经过mix(·)操作所得中间特征图，I_mix表示 mix(·)操作的最终输出结果。该操作有助于将上述编码器输出特征与解码器输出特征充分融合，使去伪影网络充分学习多尺度信息。

5、损失函数

根据上述两阶段网络模型的要求，掩码生成网络和去伪影网络的损失函数表示为：

L_mask＝L₁(I_mask，I_clean-I_input) (14)

L_deblur＝L₁(I_input，I_clean) (15)

L＝L_deblur+β·L_mask (16)

其中，L_mask和L_deblur分别表示第一阶段的掩码生成网络的损失函数和第二阶段的去伪影网络的损失函数,L₁(·)表示L₁损失函数，β表示掩码生成网络的损失函数的权重，β＝0.05。

基于以上设计，本实施例实现过程如下：

步骤1：获取清晰的高清图像和模糊图像的成对图像，并对数据进行加强，构建图像数据集。

步骤2：构建两阶段的去模糊网络。

步骤3：将待处理的模糊图像与高清图像对逐对图像对输入去模糊网络模型，得到了消除了模糊的去模糊图像。

其中，数据增强包括对图像进行随机剪裁、翻转和旋转操作。

两阶段的网络模型即为第一阶段掩码生成模型和第二阶段去伪影模型。

以上模型训练方式首先训练第一阶段的所述掩码生成网络，以准确预测掩码图像；第二阶段交替式训练掩码生成网络与去伪影网络，以实现较好的模糊去除效果。上述模型训练采用渐进式训练策略，将训练过程分为多个子训练周期，一次进行一个子训练周期的训练，训练开始时以大学习率开始训练，学习率衰减方式为余弦退火方式，当执行完一个子训练周期时，学习率增加以重启训练过程，直至迭代完成。

本专利不局限于上述最佳实施方式，任何人在本专利的启示下都可以得出其它各种形式的基于掩码的图像去模糊模型及方法，凡依本发明申请专利范围所做的均等变化与修饰，皆应属本专利的涵盖范围。

Claims

1.一种基于掩码的图像去模糊模型，其特征在于，包括：掩码生成网络和去伪影网络；

2.根据权利要求1所述的基于掩码的图像去模糊模型，其特征在于：所述掩码生成网络包括第一编码器、特征提取层和第一解码器；

3.根据权利要求1所述的基于掩码的图像去模糊模型，其特征在于：所述去伪影网络包括第二编码器、非线性映射层和第二解码器；

所述第二编码器的结构为：

I_en1＝↓(conv(cat(I_input，I_mask)))

I_en2＝↓(conv(I_enc1))

I_en3＝conv(I_enc2)；

所述非线性映射层由多个Resblock模块组成，具体表示为：

F＝Res(Res(Res(…Res(I_enc3))))

其中，F表示特征图经过非线性映射层得到的输出结果，Res(·)表示Resblock操作；

所述第二解码器的结构为：

I_de1＝↑(conv(F))

I_de2＝↑(cat(conv(I_de1)，I_mix1))

I_de3＝cat(conv(I_de2)，I_mix2)

I_output＝conv(I_de3)；

其中，mix(·)具体如下式所示：

I_mix-en＝↓(↓(I_en))

I_mix-de1＝↓(I_de)

I_mix-de2＝↓(I_mix-de1)

I_mix＝↑(I_mix-de1+T(I_mix-de2+I_mix-en))

其中，I_mix-en表示第二编码器输出经由mix(·)操作所得特征图，I_mix-de1与I_mix-de2分别表示第二解码器输出经过mix(·)操作所得中间特征图，I_mix表示mix(·)操作的最终输出结果。

4.根据权利要求1所述的基于掩码的图像去模糊模型，其特征在于：整个网络模型的损失函数表示为：

L_mask＝L₁(I_mask，I_clean-I_input)

L_deblur＝L₁(I_input，I_clean)

L＝L_deblur+β·L_mask；

其中，L_mask和L_deblur分别表示掩码生成网络的损失函数和去伪影网络的损失函数，L₁(·)表示L₁损失函数，β表示掩码生成网络的损失函数的权重。

5.根据权利要求1-4其中任一所述的基于掩码的图像去模糊模型的去模糊方法，其特征在于：第一阶段通过所述掩码生成网络对模糊图像的掩码进行预测；第二阶段将生成的掩码图像传递到去伪影网络与对应输入的模糊图像合并进行学习，实现模糊图像的去模糊。

6.根据权利要求1-4其中任一所述的基于掩码的图像去模糊模型的去模糊方法，其特征在于，包括：

7.根据权利要求6所述的基于掩码的图像去模糊模型的去模糊方法，其特征在于：所述数据增强包括对图像进行随机剪裁、翻转和旋转操作。

8.根据权利要求1-4其中任一所述的基于掩码的图像去模糊模型的去模糊方法，其特征在于：首先训练所述掩码生成网络，以准确预测掩码图像；之后交替式训练掩码生成网络与去伪影网络，以实现模糊去除效果。

9.根据权利要求8所述的基于掩码的图像去模糊模型的去模糊方法，其特征在于：模型训练采用渐进式训练策略，将训练过程分为多个子训练周期，一次进行一个子训练周期的训练，训练开始时以大学习率开始训练，学习率衰减方式为余弦退火方式，当执行完一个子训练周期时，学习率增加以重启训练过程，直至迭代完成。