CN112884669B

CN112884669B - 基于多尺度内容注意力机制的图像修复方法、存储介质和终端

Info

Publication number: CN112884669B
Application number: CN202110211937.3A
Authority: CN
Inventors: 匡平; 杜雪梅
Original assignee: University of Electronic Science and Technology of China
Current assignee: University of Electronic Science and Technology of China
Priority date: 2021-02-25
Filing date: 2021-02-25
Publication date: 2022-12-06
Anticipated expiration: 2041-02-25
Also published as: CN112884669A

Abstract

本发明公开了基于多尺度内容注意力机制的图像修复方法、存储介质和终端，包括以下步骤：将待修复图像输入至训练完成的图像修复网络中进行图像修复；所述图像修复网络包括顺次连接的边缘检测模块、边缘生成对抗网络和内容生成对抗网络；所述边缘生成对抗网络包括边缘生成器G₁，所述内容生成对抗网络包括内容生成器G₂；所述边缘生成器G₁和内容生成器G₂均包括若干卷积层、若干残差块和若干反卷积层，在所述反卷积层之间还包括一个多尺度内容注意力模块。本发明利用已知补丁的特征作为卷积过滤器来处理预生成的补丁，并利用多尺度补丁实现残缺生成区域与周围背景区域的基本特征和整体风格的一致性。

Description

基于多尺度内容注意力机制的图像修复方法、存储介质和终端

技术领域

本发明涉及图像修复领域，尤其涉及基于多尺度内容注意力机制的图像修复方法、存储介质和终端。

背景技术

图像补全算法对需要移除的内容添加特殊遮挡的标记并处理，生成满足视觉要求逼真的照片。图像补全技术是一种介于图像编辑和图像生成的技术，利用破损部分的领域图像信息和整体结构信息对缺失部分进行填充和修复。修补部分能与原始图像需要达到风格统一、过渡自然、符合图像语义的要求，满足观察者的视觉需求，使观察者无法分辨出真实图像与生成图像。

针对图像补全任务，研究人员提出了多种不同的方法，大致可分为三类：(1)基于像素点传播扩散的方法(Diffusion-based methods)，通过引入欧拉弹性来传播缺失部分周围的局部信息来填充该区域。(2)基于补丁的方法(Patch-based methods)，通过从相同图像(或图像集合)的相似区域(即源)复制信息来填充缺失的区域(即目标)。(3)基于深度学习的方法(Deep learning-based methods)，通过生成对抗网络(GAN)来学习图像特征，使用卷积神经网络来训练生成模型补全缺损图像，添加辅助网络进行训练鉴别器，判断输出图像是生成图像还是真实图像。

目前，图像修复算法存在的主要缺陷是：(1)目前图像修复算法在大面积丢失时或高纹理区域缺失时，补全结果不符合图像语义；(2)修复结果与原始图像的过渡不够自然、风格不够统一、细节纹理模糊不清。

发明内容

本发明的目的在于克服现有技术的不足，提供基于多尺度内容注意力机制的图像修复方法、存储介质和终端。

本发明的目的是通过以下技术方案来实现的：

本发明的第一方面，提供基于多尺度内容注意力机制的图像修复方法，包括以下步骤：

将待修复图像输入至训练完成的图像修复网络中进行图像修复；

所述图像修复网络包括顺次连接的边缘检测模块、边缘生成对抗网络和内容生成对抗网络；所述边缘生成对抗网络包括边缘生成器G₁和边缘鉴别器D₁，所述内容生成对抗网络包括内容生成器G₂和内容鉴别器D₂；

所述边缘生成器G₁和内容生成器G₂均包括若干卷积层、若干残差块和若干反卷积层，在所述反卷积层之间还包括一个多尺度内容注意力模块；所述多尺度内容注意力模块分别利用侧重提取图像风格特征的第一补丁和侧重提取图像基本特征的第二补丁，作为卷积滤波器来处理预生成的特征补丁，合并特征后输出。

进一步地，所述图像修复网络的训练包括以下子步骤：

获取残缺图样本

完整图样本I_gt和遮罩图样本M；

将残缺图样本

输入至边缘检测模块中得到残缺图的边缘图

并将完整图样本输入至边缘检测模块中得到完整图的边缘图C_gt；

将残缺图的边缘图

残缺图的灰度图

和遮罩图M输入至边缘生成对抗网络，得到边缘假想图C_pred；

利用所述边缘假想图C_pred、遮罩图M、完整图的边缘图C_gt计算得到完整图的边缘假想图C_comp，将所述完整图的边缘假想图C_comp和残缺图样本

输入至内容生成对抗网络，得到内容修复图I_pred；

利用边缘假想图C_pred、完整图的边缘图C_gt、完整图的灰度图I_gray计算边缘生成对抗网络的损失，对边缘生成对抗网络进行更新；

利用完整图样本I_gt、完整图的边缘假想图C_comp、内容修复图I_pred、残缺图的边缘图

非残缺区域的内容再次生成图

计算内容生成对抗网络的损失，对内容生成对抗网络进行更新。

进一步地，所述利用边缘假想图C_pred、完整图的边缘图C_gt、完整图的灰度图I_gray计算边缘生成对抗网络的损失，包括：

利用边缘假想图C_pred、完整图的边缘图C_gt、完整图的灰度图I_gray计算得到对抗性损失L_adv,1；

利用边缘假想图C_pred、完整图的边缘图C_gt计算得到特征匹配损失L_FM；

利用对抗性损失L_adv,1和特征匹配损失L_FM计算边缘生成对抗网络的损失。

进一步地，所述利用完整图样本I_gt、完整图的边缘假想图C_comp、内容修复图I_pred、残缺图的边缘图

非残缺区域的内容再次生成图

计算内容生成对抗网络的损失，包括：

利用完整图样本I_gt、完整图的边缘假想图C_comp、内容修复图I_pred计算得到对抗性损失L_adv,2；

利用完整图样本I_gt、内容修复图I_pred计算得到感知损失L_perc；

利用残缺图样本

(即非残缺区域的真实图)、非残缺区域的内容再次生成图

计算得到风格损失L_style；

利用完整图的边缘假想图C_comp、残缺图的边缘图

计算得到一致性损失L_cycle；

利用对抗性损失L_adv,2、感知损失L_perc、风格损失L_style、一致性损失L_cycle和l₁损失计算内容生成对抗网络的损失。

进一步地，所述对抗性损失L_adv,2采用多区域鉴别器计算，所述多区域鉴别器包括多局部鉴别单元和全局鉴别单元，所述多局部鉴别单元通过单独处理多个特征图来检测图像中任意形状、区域的空洞修复结果，所述全局鉴别单元将整张图像作为作用域，用于判定整体风格的一致性修复结果；

所述多局部鉴别单元和全局鉴别单元均包括若干顺次连接的卷积层，在除最后一个卷积层以外的其他卷积层的后方连接有BN层和激活层；

对于全局鉴别单元，在最后一个卷积层后接入一个全连接层，将最后一个卷积层输出的特征处理为多通道的特征图，最后再通过一个全连接层和Sigmoid回归器判定全局图像的真假；

对于多局部鉴别单元，最后一层的全连接层使用不同的像素权重进行1×1卷积运算，并对最后层的每个像素采用单独的回归器判别其真假；

将全局鉴别单元和多局部鉴别单元得到的各输出值进行均值化处理，得到最终的判别结果。

进一步地，所述多尺度内容注意力模块的具体实现包括：

利用侧重提取图像风格特征的3*3补丁和侧重提取图像基本特征的1*1补丁作为卷积滤波器提取背景特征；

利用欧式距离度量补丁的相似度得分d_{(x,y),(x',y')}；

采用核大小为k的自左向右，再自顶向下的进行注意力传播；

将生成的特征图和原始特征图连接起来；

利用逐像素卷积运算对所有特征图进行合并，将通道数减少到原始通道数。

进一步地，所述将生成的特征图和原始特征图连接起来，用＜g_in,μg_att1*1,γg_att3*3＞表示，其中μ和γ分别表示g_att1*1特征图和g_att3*3特征图的贡献权重；在所述边缘生成器G₁中，预设μ＞γ；所述内容生成器G₂中，预设γ＞μ。

进一步地，所述残差块为AdaIN残差块，所述AdaIN残差块包括：顺次连接的拓展卷积层、第一AdaIN函数模块、第一ReLU激活模块、卷积层、第二AdaIN函数模块、加法器和第二ReLU激活模块，所述加法器的第二输入端接入AdaIN残差块的输入特征。

本发明的第二方面，提供一种存储介质，其上存储有计算机指令，所述计算机指令运行时执行所述的基于多尺度内容注意力机制的图像修复方法的步骤。

本发明的第三方面，提供一种终端，包括存储器和处理器，所述存储器上存储有可在所述处理器上运行的计算机指令，所述处理器运行所述计算机指令时执行所述的基于多尺度内容注意力机制的图像修复方法的步骤。

本发明的有益效果是：

(1)在本发明的一示例性实施例中，基于图像修复方法提出了一种新的多尺度内容注意力模块，相较于现有技术，该模块利用已知补丁的特征作为卷积过滤器来处理预生成的补丁，并利用多尺度补丁实现残缺生成区域与周围背景区域的基本特征和整体风格的一致性。

(2)在本发明的又一示例性实施例中，受艺术家绘画时“先线后色”的工作方式启发，我们将图像修复分为边缘轮廓(高频)和色彩内容(低频)，因为线条不仅勾勒和定义空间和形状，而且在构图中起着至关重要的作用。完整的边缘信息能给予网络丰富且关键的特征信息，最终让图像的修复结果更符合视觉效果。

(3)在本发明的又一示例性实施例中，提出了多区域鉴别器，用于训练不规则空洞的修复。传统的图像修复网络同时使用全局和单个局部鉴别器来确定图像是否被一致地完成，但单个局部鉴别器只能处理大小固定的正方形孔洞区域。多区域鉴别器则较好的解决了该问题。

(4)在本发明的又一示例性实施例中，在残差块中同时使用扩展卷积层和AdaIN函数，而现有技术仅仅只是在编码器和解码器中使用AdaIN函数。因此，本示例性实施例将AdaIN函数引入到残差块中，在特征图层面上通过改变特征的数据分布来实现图像生成，计算开销和存储开销都较小，且易实现。扩展卷积层通过提升感受野，可增大残差块的特征图像的有效面积和空间结构。

附图说明

图1为本发明一示例性实施例公开的图像修复网络结构示意图；

图2为本发明一示例性实施例公开的多区域鉴别器结构示意图；

图3为本发明一示例性实施例公开的多尺度内容注意力模块结构示意图；

图4为现有技术中残差块的结构示意图；

图5为本发明一示例性实施例公开的AdaIN残差块结构示意图。

具体实施方式

下面结合附图对本发明的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

在本申请使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义。还应当理解，本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。

应当理解，尽管在本申请可能采用术语第一、第二、第三等来描述各种信息，但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如，在不脱离本申请范围的情况下，第一信息也可以被称为第二信息，类似地，第二信息也可以被称为第一信息。取决于语境，如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。

此外，下面所描述的本发明不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。

如图1所示，本发明的第一方面，提供基于多尺度内容注意力机制的图像修复方法，包括以下步骤：

如图1所示，所述图像修复网络包括顺次连接的边缘检测模块、边缘生成对抗网络和内容生成对抗网络；所述边缘生成对抗网络包括边缘生成器G₁和边缘鉴别器D₁，所述内容生成对抗网络包括内容生成器G₂和内容鉴别器D₂；

具体地，在该示例性实施例中，基于图像修复方法提出了一种新的多尺度内容注意力模块，相较于现有技术，该模块利用已知补丁的特征作为卷积过滤器来处理预生成的补丁，并利用多尺度补丁实现残缺生成区域与周围背景区域的基本特征和整体风格的一致性。

更优地，在一示例性实施例中，如图1所示，所述图像修复网络的训练包括以下子步骤：

S101：获取残缺图样本

完整图样本I_gt和遮罩图样本M。

其中，该步骤用于搜集整理数据样本，将所有残缺图样本、完整图样本、遮罩图Mask处理为相同大小尺寸256×256。

S103：将残缺图样本

输入至边缘检测模块中得到残缺图的边缘图

并将完整图样本输入至边缘检测模块中得到完整图的边缘图C_gt。

具体地，在其中一示例性实施例中，边缘检测模块采用Canny边缘检测算法。

S105：将残缺图的边缘图

残缺图的灰度图

和遮罩图M输入至边缘生成对抗网络，得到边缘假想图C_pred。

具体地，在该步骤中，基于步骤S103中提取的残缺图的边缘图

通过一个边缘(高频信息)生成对抗网络，生成不规则缺失区域的边缘假想图C_pred。

并且在又一示例性实施例中，在不规则缺失区域的边缘假想图C_pred的基础上，可手动调整边缘以给予下一个内容修复网络更真实的特征信息，即添加关键边缘、擦去不合理边缘。

同时，对于边缘生成对抗网络的具体结构，该步骤主要适用于边缘生成对抗网络中的边缘生成器G₁，边缘生成器G₁的输入图像包括残缺图像的边缘图

灰度图

和遮罩图M(1代表缺失区域，0代表背景)，通过网络的特征学习，边缘生成器G₁的输出图为边缘假想图

S107：利用所述边缘假想图C_pred、遮罩图M、完整图的边缘图C_gt计算得到完整图的边缘假想图C_comp，将所述完整图的边缘假想图C_comp和残缺图样本

输入至内容生成对抗网络，得到内容修复图I_pred。

具体地，在该步骤中，根据边缘假想图和原始残缺图，另一个内容(低频信息)生成对抗网络对缺失区域的色彩以及上下文信息进行RGB像素值填充。

同时，对于内容生成对抗网络的具体结构，该步骤主要适用于内容生成对抗网络的内容生成器G₂，内容生成器G₂的输入包括残缺图样本

和完整图的边缘假想图C_comp＝C_gt⊙(1-M)+C_pred⊙M，输出是内容修复图

S109：利用边缘假想图C_pred、完整图的边缘图C_gt、完整图的灰度图I_gray计算边缘生成对抗网络的损失，对边缘生成对抗网络进行更新。

具体地，在该步骤中，对于边缘生成对抗网络的具体结构，该步骤主要适用于边缘生成对抗网络中的边缘鉴别器D₁，边缘鉴别器D₁的输入图像是真实的边缘图C_gt和生成的边缘假想图C_pred，通过网络来预测该边缘图是否为真实的。

S111：利用完整图样本I_gt、完整图的边缘假想图C_comp、内容修复图I_pred、残缺图的边缘图

非残缺区域的内容再次生成图

具体地，在该步骤中，对于内容生成对抗网络的具体结构，该步骤主要适用于内容生成对抗网络的内容鉴别器D₂，内容鉴别器D₂的输入图像是真实的完整图像I_gt和生成的内容修复图I_pred，通过网络来预测该内容图是否为真实的。

需要说明的是，本示例性实施例先受艺术家绘画时“先线后色”的工作方式启发，我们将图像修复分为边缘轮廓(高频)和色彩内容(低频)，因为线条不仅勾勒和定义空间和形状，而且在构图中起着至关重要的作用。完整的边缘信息能给予网络丰富且关键的特征信息，最终让图像的修复结果更符合视觉效果。

更优地，在一示例性实施例中，所述利用边缘假想图C_pred、完整图的边缘图C_gt、完整图的灰度图I_gray计算边缘生成对抗网络的损失，包括：

S201：利用边缘假想图C_pred、完整图的边缘图C_gt、完整图的灰度图I_gray计算得到对抗性损失L_adv,1。

具体地，在一示例性实施例中，对抗性损失L_adv,1的定义为：

式中，E表示期望。

S203：利用边缘假想图C_pred、完整图的边缘图C_gt计算得到特征匹配损失L_FM。

具体地，在一示例性实施例中，特征匹配损失L_FM的定义为：

式中，L是边缘鉴别器D₁的最终卷积层，N_i是第i激活层(例如ReLU)中的元素数，

是边缘鉴别器D₁第i层的激活值。

S205：利用对抗性损失L_adv,1和特征匹配损失L_FM计算边缘生成对抗网络的损失。

具体地，在一示例性实施例中，边缘生成对抗网络的训练目标包括对抗性损失L_adv,1和特征匹配损失L_FM：

式中，λ_adv,1和λ_FM是正则化参数。

更优地，在一示例性实施例中，所述利用完整图样本I_gt、完整图的边缘假想图C_comp、内容修复图I_pred、残缺图的边缘图

非残缺区域的内容再次生成图

计算内容生成对抗网络的损失，包括：

S301：利用完整图样本I_gt、完整图的边缘假想图C_comp、内容修复图I_pred计算得到对抗性损失L_adv,2。

具体地，在一示例性实施例中，对抗性损失L_adv,2的定义如下：

式中，N是多区域鉴别器中多局部鉴别单元的总个数，当k∈[1,N]时，

都是指多局部鉴别单元，而

则是指全局鉴别单元。(该内容在下一示例性实施例进行展开说明)

S303：利用完整图样本I_gt、内容修复图I_pred计算得到感知损失L_perc。

具体地，在一示例性实施例中，感知损失函数将网络的中间层激活值作为目标，计算真实图像和生成图像经过鉴别器中间层的两个激活值的欧氏距离，具体公式如下：

其中，φ_i是鉴别器网络第i层的激活映射。在本示例性实施例中，φ_i对应于鉴别器中各ReLU层的激活图。同时，这些激活图还用于计算风格损失L_style。

S305：利用残缺图样本

非残缺区域的内容再次生成图

计算得到风格损失L_style。

具体地，损失函数L_style测量激活图的协方差差异值。给定尺寸为C_j×H_j×W_j的特征图，

是由激活图φ_j构成的C_j×C_jGram矩阵，具体的L_style计算公式如下：

S307：利用完整图的边缘假想图C_comp、残缺图的边缘图

计算得到一致性损失L_cycle。

内容生成网络产生的完整RGB内容图I_pred，可再通过Canny算法提取出边缘图

一致性损失函数L_cycle则是将重新生成的边缘图

与边缘生成对抗网络产生的边缘图C_comp做比较，测量两个边缘图的差异性，定义如下：

S309：利用对抗性损失L_adv,2、感知损失L_perc、风格损失L_style、一致性损失L_cycle和l₁损失计算内容生成对抗网络的损失。

式中的损失函数前面的参数为权重设置参数。

更优地，如图2所示，所述对抗性损失L_adv,2采用多区域鉴别器计算(由区域集成网络启发的多区域鉴别器)，所述多区域鉴别器包括多局部鉴别单元和全局鉴别单元，所述多局部鉴别单元通过单独处理多个特征图来检测图像中任意形状、区域的空洞修复结果，所述全局鉴别单元将整张图像作为作用域，用于判定整体风格的一致性修复结果；

所述多局部鉴别单元和全局鉴别单元均包括若干顺次连接的卷积层(在一示例性实施例中，核大小为5×5和步长2的6个卷积层叠加以捕获整个图像的特征)，在除最后一个卷积层以外的其他卷积层的后方连接有BN层(Batch Normalization函数)和激活层(LeakyReLU激活函数)，且每层卷积都进行了光谱归一化处理；

对于多局部鉴别单元，最后一层的全连接层使用不同的像素权重进行1×1卷积运算，并对最后层的每个像素采用单独的回归器判别其真假。由于最后一层的卷积特征图中的每个激活值都是由输入图像中的一个感受野贡献的，因此我们可以将输入图像中的任意残缺区域投影到卷积特征图的各个区域。

最后，将全局鉴别单元和多局部鉴别单元得到的各输出值进行均值化处理，得到最终的判别结果。

该示例性实施例提出了多区域鉴别器，用于训练不规则空洞的修复。传统的图像修复网络同时使用全局和单个局部鉴别器来确定图像是否被一致地完成，但单个局部鉴别器只能处理大小固定的正方形孔洞区域。多区域鉴别器则较好的解决了该问题。

更优地，在一示例性实施例中，如图3所示，所述多尺度内容注意力模块的具体实现包括：

S401：利用侧重提取图像风格特征的3*3补丁和侧重提取图像基本特征的1*1补丁作为卷积滤波器提取背景特征。

具体地，在该示例性实施例中，首先在背景中分别以3*3补丁和1*1补丁(即像素)作为卷积滤波器提取背景特征。3*3补丁更侧重提取图像风格特征，而1*1补丁侧重提取图像的基本特征(如轮廓)。通过3*3补丁和1*1补丁得到的特征图都为进行后续操作。

S403：利用欧式距离度量补丁的相似度得分d_{(x,y),(x',y')}。

具体地，在该示例性实施例中，利用欧氏距离(Euclidean distance)代替余弦相似度来度量补丁的相似度得分d_{(x,y),(x',y')}，且不需要标准化过程。因为欧式距离同时考虑了特征补丁的两个向量之间的夹角和其大小，更适合于特征补丁的重构。

d_{(x,y),(x',y')}＝||f_x,y-b_x',y'||

式中，(x,y)和(x’,y’)表示补丁的坐标值，f_x,y表示前景补丁，b_x’,y’表示背景补丁的大小。

然而，由于欧氏距离的取值范围为[0,∞)，很难直接应用于softmax函数。为了解决这个问题，我们定义截断距离相似性得分

如下：

式中，σ(d_{(x，y)，(x′，y′)})表示d_{(x,y),(x',y')}的方差，m(d_{(x,y),(x',y')})表示d_{(x,y),(x',y')}的期望值。

为了计算每个补丁的权重，该示例性实施例在利用欧式距离得到的分数图的通道上使用softmax，得到softmax相似度

式中，λ表示是调节可缩放softmax函数的超参数。

S405：采用核大小为k的自左向右，再自顶向下的进行注意力传播。

具体地，在该示例性实施例中，由于前景补丁的偏移可能对应于背景补丁的相等偏移，因此我们采用核大小为k的自左向右，再自顶向下的注意力传播，达到更好合并补丁的目的。

S407：将生成的特征图和原始特征图连接起来。

具体地，将生成的特征图和原始特征图连接起来，用<g_in,μg_att1*1,γg_att3*3>表示，其中μ和γ分别表示g_att1*1特征图和g_att3*3特征图的贡献权重。而在又一示例性实施例中，在本示例性实施例中的灰度边缘生成阶段中，网络(即边缘生成对抗网络)更关注基本特征(如轮廓)，因此在一优选示例性实施例中预设μ＞γ，而在RGB内容生成阶段中，网络(即内容生成对抗网络)更关注图像的整体风格，因此在该优选示例性实施例中预设γ＞μ。

最终，为了确定当前各类特征图上哪个细节级别是最重要的，这些特征图随后被输入到压缩-激励模块中，以重新加权不同的通道。本示例性实施例用f_SE()表示压缩和激励函数，该模块的输出可用f_SE<g_in,μg_att1*1,γg_att3*3>表示。

S409：利用逐像素卷积运算对所有特征图进行合并，将通道数减少到原始通道数。

具体地，在该步骤中，利用逐像素卷积运算对所有特征图进行合并，将通道数减少到原始通道数。由于输出通道数与输入通道数相同，因此我们提出的模块很容易添加到任何其他修复模型中。模块最终的输出可以表示为：

g_out＝f_Conv(f_SE(<g_in,μg_att1*1,γg_att3*3>))

该机制利用已知补丁的特征作为卷积过滤器来处理预生成的补丁，并利用多尺度补丁实现残缺生成区域与周围背景区域的基本特征和整体风格的一致性。

更优地，在一示例性实施例中，所述残差块为AdaIN残差块，所述AdaIN残差块包括：顺次连接的拓展卷积层、第一AdaIN函数模块、第一ReLU激活模块、卷积层、第二AdaIN函数模块、加法器和第二ReLU激活模块，所述加法器的第二输入端接入AdaIN残差块的输入特征。

具体地，现有技术的原始残差块如图4所示，原始残差块分为两部分：恒等映射部分x_l，反应在下图右边的连接线；残差部分F(x_l)，该部分通常由两到三个卷积操作组成。

而该示例性实施例中的AdaIN残差块，与原始残差块相比，本文改进的残差块1)引入了AdaIN函数；2)在第一个卷积模块中，使用了扩展卷积层。改进的残差块实现了网络更快的收敛速度和更低的损失值。AdaIN残差块的具体结构如图5所示。

具体地，需要说明的是，本示例性实施例是在残差块中同时使用扩展卷积层和AdaIN函数，而现有技术仅仅只是在编码器和解码器中使用AdaIN函数。因此，本示例性实施例将AdaIN函数引入到残差块中，在特征图层面上通过改变特征的数据分布来实现图像生成，计算开销和存储开销都较小，且易实现。扩展卷积层通过提升感受野，可增大残差块的特征图像的有效面积和空间结构。

基于上述任一示例性实施例，本发明的又一示例性实施例提供一种存储介质，其上存储有计算机指令，所述计算机指令运行时执行所述的基于多尺度内容注意力机制的图像修复方法的步骤。

基于上述任一示例性实施例，本发明的又一示例性实施例提供一种终端，包括存储器和处理器，所述存储器上存储有可在所述处理器上运行的计算机指令，所述处理器运行所述计算机指令时执行所述的基于多尺度内容注意力机制的图像修复方法的步骤。

基于这样的理解，本实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该软件产品存储在一个存储介质中，包括若干指令用以使得装置执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(Read-OnlyMemory，ROM)、随机存取存储器(RandomAccessMemory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

显然，上述实施例仅仅是为清楚地说明所作的举例，而并非对实施方式的限定，对于所属领域的普通技术人员来说，在上述说明的基础上还可以做出其他不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引申出的显而易见的变化或变动仍处于本发明创造的保护范围之中。

Claims

1.基于多尺度内容注意力机制的图像修复方法，其特征在于：包括以下步骤：

所述边缘生成器G₁和内容生成器G₂均包括若干卷积层、若干残差块和若干反卷积层，在所述反卷积层之间还包括一个多尺度内容注意力模块；所述多尺度内容注意力模块分别利用侧重提取图像风格特征的第一补丁和侧重提取图像基本特征的第二补丁，作为卷积滤波器来处理预生成的特征补丁，合并特征后输出；

所述多尺度内容注意力模块的具体实现包括：

利用欧式距离度量补丁的相似度得分d_{(x,y),(x',y')}；

采用核大小为k的自左向右，再自顶向下的进行注意力传播；

将生成的特征图和原始特征图连接起来；

利用逐像素卷积运算对所有特征图进行合并，将通道数减少到原始通道数；

所述将生成的特征图和原始特征图连接起来，用<g_in,μg_att1*1,γg_att3*3>表示，其中μ和γ分别表示g_att1*1特征图和g_att3*3特征图的贡献权重；在所述边缘生成器G₁中，预设μ＞γ；所述内容生成器G₂中，预设γ＞μ。

2.根据权利要求1所述的基于多尺度内容注意力机制的图像修复方法，其特征在于：所述图像修复网络的训练包括以下子步骤：

获取残缺图样本

完整图样本I_gt和遮罩图样本M；

将残缺图样本

输入至边缘检测模块中得到残缺图的边缘图

将残缺图的边缘图

残缺图的灰度图

和遮罩图M输入至边缘生成对抗网络，得到边缘假想图C_pred；

利用所述边缘假想图C_pred、遮罩图M、完整图的边缘图C_gt计算得到完整图的边缘假想图C_comp＝C_gt⊙(1-M)+C_pred⊙M，将所述完整图的边缘假想图C_comp和残缺图样本

输入至内容生成对抗网络，得到内容修复图I_pred；

非残缺区域的内容再次生成图

3.根据权利要求2所述的基于多尺度内容注意力机制的图像修复方法，其特征在于：所述利用边缘假想图C_pred、完整图的边缘图C_gt、完整图的灰度图I_gray计算边缘生成对抗网络的损失，包括：

4.根据权利要求2所述的基于多尺度内容注意力机制的图像修复方法，其特征在于：所述利用完整图样本I_gt、完整图的边缘假想图C_comp、内容修复图I_pred、残缺图的边缘图

非残缺区域的内容再次生成图

计算内容生成对抗网络的损失，包括：

利用残缺图样本

非残缺区域的内容再次生成图

计算得到风格损失L_style；

利用完整图的边缘假想图C_comp、残缺图的边缘图

计算得到一致性损失L_cycle；

5.根据权利要求4所述的基于多尺度内容注意力机制的图像修复方法，其特征在于：所述内容鉴别器D₂为多区域鉴别器，对抗性损失L_adv,2采用多区域鉴别器计算，所述多区域鉴别器包括多局部鉴别单元和全局鉴别单元，所述多局部鉴别单元通过单独处理多个特征图来检测图像中任意形状、区域的空洞修复结果，所述全局鉴别单元将整张图像作为作用域，用于判定整体风格的一致性修复结果；

6.根据权利要求1所述的基于多尺度内容注意力机制的图像修复方法，其特征在于：所述残差块为AdaIN残差块，所述AdaIN残差块包括：顺次连接的拓展卷积层、第一AdaIN函数模块、第一ReLU激活模块、卷积层、第二AdaIN函数模块、加法器和第二ReLU激活模块，所述加法器的第二输入端接入AdaIN残差块的输入特征。

7.一种存储介质，其上存储有计算机指令，其特征在于：所述计算机指令运行时执行权利要求1至6中任一项所述的基于多尺度内容注意力机制的图像修复方法的步骤。

8.一种终端，包括存储器和处理器，所述存储器上存储有可在所述处理器上运行的计算机指令，其特征在于，所述处理器运行所述计算机指令时执行权利要求1至6中任一项所述的基于多尺度内容注意力机制的图像修复方法的步骤。