CN112801914A

CN112801914A - 一种基于纹理结构感知的二段式图像修复方法

Info

Publication number: CN112801914A
Application number: CN202110181043.4A
Authority: CN
Inventors: 王瑾; 张熙; 王琛; 高颖; 朱青
Original assignee: Beijing University of Technology
Current assignee: Beijing University of Technology
Priority date: 2021-02-09
Filing date: 2021-02-09
Publication date: 2021-05-14

Abstract

本发明涉及一种基于纹理结构感知的二段式图像修复方法，用于解决图像修复的技术问题，具体包括两个阶段：图像结构生成阶段用于生成图像缺失区域的结构信息；图像内容生成阶段将获得的结构信息作为先验，结合受损图像的纹理和颜色信息来完成图像；每个阶段对应一个生成对抗网络，两个生成对抗网络结构相同；图像结构生成阶段将受损图像的灰度图、结构图和受损图像的掩膜三种图输入图像结构生成阶段训练完成的编码器中，经过九个残差块和解码器得到重构的结构图；图像内容生成阶段：将重构得到的结构图、受损图像以及受损图像的掩膜输入到图像内容生成阶段训练完成的编码器，依次经过九个残差块和解码器得到修复完成的图像。

Description

一种基于纹理结构感知的二段式图像修复方法

技术领域：

本发明涉及计算机图像处理领域，具体涉及一种基于纹理结构感知的二段式图像修复方法。

背景技术：

图像修复是用视觉上的真实和语义上的相似的内容填充缺失区域的过程。这是一个经典的、具有挑战性的图像处理课题，广泛应用于图像编辑、基于图像的渲染和计算摄影等领域。传统的基于图像块的图像修复方法是从已知区域搜索并复制最匹配的图像块到缺失的区域。这种传统的图像修复方法对静态纹理的处理效果较好，但对人脸等复杂或非重复结构的纹理处理效果有限，不适用于高层语义信息的捕获。

近年来，基于卷积神经网络的方法在图像修复领域取得了巨大的成功。Pathak等人首先利用对抗损失函数训练深度神经网络来预测缺失区域，这有利于捕获大面积缺失区域的边缘和全局结构。Ishikawa等人通过结合全局和局部的对抗损失函数来改进它，以产生更精细的纹理。Yu等人提出了一个上下文注意层来搜索背景区域中相似度最高的图像块。Yan等人引入了一种带导向损失的转换操作。Yang等人提出了一种多尺度神经片综合(MNPs)方法，结合了基于CNN的方法和基于图像块的方法。Liu等人提出了部分卷积来避免生成的结果失真。然而，大多数这些现有的方法无法同时生成合理的结构和精细的纹理细节。

综上，现有的图像修复算法生成图像质量较低，结构扭曲、纹理细节模糊，具有一定的局限性。

发明内容

本发明的目的是克服上述现有技术的缺点，提供一种质量高的图像修复方法，该方法能有效地重构出合理的结构和精细的纹理，处理任意形状的缺失区域，在视觉上生成合理的结果。

本发明的基于纹理结构感知的二段式图像修复方法，将图像修复任务分为两个部分：图像结构生成和图像内容生成。在第一阶段，网络生成缺失区域的结构信息；而在第二阶段，网络将这些结构信息作为先验，结合已有的纹理和颜色信息来完成图像。整个网络由两个生成对抗网络组成，生成器由编码器、九个带有空洞卷积的残差块和解码器组成。采用PatchGAN架构来设计判别器。其中，编码器由三个卷积层组成，解码器由三个卷积层组成，判别器由5个卷积层构成。

利用训练完成的两阶段生成器进行图像修复：

第一阶段：将受损图像的灰度图、结构图和受损图像掩膜三种图输入图像结构生成阶段训练完成的编码器中，经过九个残差块和解码器得到重构的结构图。

第二阶段：将第一阶段重构得到的结构图、受损图像以及受损图像的掩膜输入图像内容生成阶段训练完成的编码器中，依次经过九个残差块和解码器得到修复完成的图像。

在图像修复前需要对两阶段生成对抗网络进行训练，具体训练过程如下

步骤一：将训练集中受损图像的灰度图、结构图和掩膜输入第一阶段生成器网络中，第一阶段判别器判别图像真伪，通过损失函数迭代地调整参数，最终得到重建的结构图

步骤二：将步骤一重建得到的结构图和训练集中受损图像输入第二阶段的生成器网络，通过第二阶段的判别器判别图像真伪，通过损失函数迭代地调整参数，生成修复后的图像

每个步骤的具体操作如下：

步骤一的具体操作：对真实图像I_gt，取该图像的灰度对应图I_gray和结构图S_gt，得到训练集中受损图像的掩膜为M，生成器根据下式预测缺失区域的结构：

式中，G_s表示第一阶段的生成器,

表示受损图像的灰度图，

表示受损图像的结构图，M是一个二值掩膜(含义是，输入的受损图像相对于真实图像而言，受损的区域值为1，其他区域值为0)，

表示重建的结构图。

第一阶段网络的训练目标函数由L1损失函数

对抗性损失函数

和特征匹配损失函数L_fm组成。

其中，对抗性损失函数如下：

式中，D_s是第一阶段的判别器，E是指数学期望，即符合真实图像的概率分布的数学期望。

特征匹配损失函数如下：

式中，

是第一阶段判别器第i层(i＝1，2，...，5)的激活值，N_i是第一阶段判别器经过第i层卷积之后的元素个数，l是指判别器的卷积层的个数。

第一阶段网络的目标函数为：

步骤二的具体操作：将步骤一重建的结构图

和受损图像

以及掩膜M输入第二阶段的生成网络，第二阶段的生成器根据下式生成最后的图像结果：

式中，G_c表示第二阶段的生成器。

第二阶段网络的训练目标函数由对抗性损失函数

感知损失函数L_per和风格损失函数L_style组成。

其中，对抗损失函数函数如下：

式中，D_c是第二阶段的判别器。

引入感知损失函数是为了使修复完成的图像

在高层语义上与真实图像相似，我们使用VGG-19网络来提取图像的高层语义信息。感知损失函数的定义如下：

式中，Φⁱ(·)表示预训练VGG-19网络中第i层的激活图，l是指预训练VGG-19网络中的层数。

风格损失度量的是激活图的协方差之间的差异，它可以减轻由转置卷积引起的图像失真。风格损失函数的定义如下：

式中，

表示由激活图Фⁱ(·)构造的格拉姆矩阵。

第二阶段网络的目标函数为：

与现有的技术相比，本发明在生成对抗网络的基础上，将图像修复工作分成两个阶段进行：结构生成网络和图像完成网络。在第一阶段重建图像的结构，第二阶段在以第一阶段为前提，得到修复后的图像。其有益的效果是：我们的模型不仅可以合成清晰的图像结构，而且还可以在缺失区域生成精细的纹理，明显优于最先进的方法。

附图说明：

图1在人脸数据集上的修复结果示例图；

图2基于纹理结构感知的二段式图像修复技术框架图；

图3与不同算法的视觉结果比较；

图4结构信息对图像修复结果的影响；

具体实施方式：

为了能够更清楚地描述本发明的技术内容，下面结合具体实例来进一步的描述：

本发明的示例结果如图1所示。

在本发明中，我们提出了一种图像修复两段式的架构，将图像修复任务分为结构生成网络和图像完成网络，每个网络上都是基于生成对抗网络，生成器部分由编码器、残差块和解码器构成，根据PatchGAN架构设计判别器，有效地解决图像修复中的实际问题。本发明的框架图如图2所示。

将受损图像的掩膜、结构图以及灰度图输入到由三个卷积层组成的编码器中，再经过九个残差块后输入到由三个卷积层组成的解码器，得到重建后的结构图，与真实图像的结构图组成对抗训练样本输入到图像结构生成阶段的判别器中进行训练，迭代地调整前面的卷积块的参数，最终得到重建的结构图。将图像结构生成阶段生成的结构图结合受损图像一起输入到由三个卷积层组成的编码器中，再经过九个残差块后输入到由三个卷积层组成的解码器，得到修复完成的结果，将图像内容生成阶段生成的图像与真实图像形成对抗训练样本输入到图像内容生成阶段的判别器中判别真伪，迭代地调整图像内容生成阶段的卷积层的参数，最终得到修复完成的图像。

图像质量评价：

如图3所示，Context Encoder(CE)产生了模糊的结果。GLGAN和ContextualAttention(CA)生成的图像失真。此外，这些方法不能生成复杂的结构和逼真的纹理。与这些方法相比，本发明能更好地处理这些问题，产生更直观、更真实的结果。我们还使用通用的评价指标进行了定量比较。表1表明我们的方法达到了最好的性能。

消融实验：

对重建结构图的效果进行了实验分析。如图4所示，左边第一列为真实图片，左边第二列为输入的图片，左边第三列为未重建结构图的修复结果，左边第四列为重建的结构图，左边第五列为本文提出的二段式图像修复结果。结果表明，进行图像结构的修复是有效的。

表1不同算法的客观质量比较

Claims

1.一种基于纹理结构感知的二段式图像修复方法，其特征在于：将图像修复任务分为两个阶段：图像结构生成阶段和图像内容生成阶段；所述的图像结构生成阶段用于生成图像缺失区域的结构信息；所述的图像内容生成阶段，将获得的结构信息作为先验，结合受损图像的纹理和颜色信息来完成图像；每个阶段对应一个生成对抗网络，两个生成对抗网络结构相同，所述生成对抗网络包括生成器和判别器；

图像结构生成阶段：将受损图像的灰度图、结构图和受损图像的掩膜三种图输入图像结构生成阶段训练完成的编码器中，经过九个残差块和解码器得到重构的结构图；

图像内容生成阶段：将重构得到的结构图、受损图像以及受损图像的掩膜输入到图像内容生成阶段训练完成的编码器，依次经过九个残差块和解码器得到修复完成的图像。

2.根据权利要求1所述的一种基于纹理结构感知的二段式图像修复方法，其特征在于：所述生成器由依次串联的编码器、残差块和解码器组成。

3.根据权利要求2所述的一种基于纹理结构感知的二段式图像修复方法，其特征在于：编码器由三个卷积层串联组成，残差块为九个带有空洞卷积的残差块串联组成，解码器由三个卷积层串联组成，判别器由5个卷积层串联构成，判别器采用PatchGAN架构。

4.根据权利要求1所述的一种基于纹理结构感知的二段式图像修复方法，其特征在于：两阶段生成对抗网络的训练过程如下，

步骤一：将训练集中受损图像的灰度图、结构图和受损图像的掩膜输入图像结构生成阶段的生成器网络中，图像结构生成阶段的判别器判别图像真伪，通过损失函数迭代地调整参数，最终得到重建的结构图