CN113034390B

CN113034390B - 一种基于小波先验注意力的图像修复方法及系统

Info

Publication number: CN113034390B
Application number: CN202110286255.9A
Authority: CN
Inventors: 付彦伟; 曹辰捷
Original assignee: Fudan University
Current assignee: Fudan University
Priority date: 2021-03-17
Filing date: 2021-03-17
Publication date: 2022-10-18
Anticipated expiration: 2041-03-17
Also published as: CN113034390A

Abstract

本发明涉及一种基于小波先验注意力的图像修复方法及系统，包括以下步骤：获取多张原始图像；基于原始图像构筑遮掩图像；分别对各个遮掩图像进行Haar小波变换，得到遮掩图像在不同分辨率下的高频小波信息，以及分辨率为遮掩图像的1/2的训练图像；建立图像修复网络，基于原始图像、训练图像和遮掩图像的高频小波信息进行图像修复网络的训练，得到图像修复模型；使用图像修复模型进行图像修复。与现有技术相比，本发明利用原始图像、遮掩图像和遮掩图像的高频小波信息进行图像修复网络的训练，提供了图像修复中一些关键的结构信息和高频信息，同时引入了注意力偏移模块，提升了图像修复模型的效率，得到的图像修复模型能更好的还原结构信息。

Description

一种基于小波先验注意力的图像修复方法及系统

技术领域

本发明涉及图像生成领域，尤其是涉及一种基于小波先验注意力的图像修复方法及系统。

背景技术

图像修复是一种将图片中缺省的区域进行填充修补的技术，图像修复的目的是确保修复的图像区域的纹理细节的真实性和合理性，图像修复可以为许多现实应用服务，例如图像恢复，图像编辑，对象移除等等。

作为计算机视觉近年来的研究热门，基于深度学习的图像修复算法已经有了许多有价值的工作，能够更好适应修复区域大小不统一的问题，也能更好的解决图像颜色差异带来的修复效果较差的问题。其中不少工作致力于通过对模型的改进来改善填补区域的纹理细节，例如基于门控卷积的图像修复算法有效提升了不规则遮掩的图像修复效果，多尺度的注意力模型进一步提升了图像修复的纹理效果，然而这些模型并没有考虑到使用图像的先验信息，图像修复效果有待提升。

现有的一些工作利用了图像的先验信息来提升图像修复的性能，如中国专利CN202010602760.5公开的一种图像修复模型训练方法及系统及图像修复方法，修复的目标能够根据用户提供的边缘信息进行生成，能够满足目标图像一定程度的变化，修复的效果更自然。也有一些图像修复方法，使用边缘结构先验信息、平滑色块的结构信息、将人脸关键点引入到人脸图像修复上、使用基于梯度的结构信息以及使用语义分割信息来完善纹理先验等。然而，这些先验方法存在一些问题。首先，语义分割和人脸关键点等先验对原图像的完整度有着很强的依赖性。另一方面，许多基于先验的生成模型都有着多阶段的训练过程，使得整体复杂度偏高。

发明内容

本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种基于小波先验注意力的图像修复方法及系统，利用原始图像、遮掩图像和遮掩图像的高频小波信息进行图像修复网络的训练，提供了图像修复中一些关键的结构信息和高频信息，同时引入了注意力偏移模块，提升了图像修复模型的效率，得到的图像修复模型能更好的还原结构信息。

本发明的目的可以通过以下技术方案来实现：

一种基于小波先验注意力的图像修复方法，包括以下步骤：

S1：获取多张原始图像；

S2：基于原始图像构筑遮掩图像；

S3：分别对各个遮掩图像进行Haar小波变换，得到遮掩图像在不同分辨率下的高频小波信息，以及分辨率为遮掩图像的1/2的训练图像；

S4：建立图像修复网络，基于原始图像、训练图像和遮掩图像的高频小波信息进行图像修复网络的训练，得到图像修复模型；

S5：使用图像修复模型进行图像修复。

进一步的，所述原始图像为包含人脸或场景的图片。

进一步的，步骤S2中，构筑遮掩图像具体为：

遍历所有的原始图像，分别将每一张原始图像转化为遮掩图像，每一张原始图像有50％的概率转化为第一类遮掩图像，有50％的概率转化为第二类遮掩图像，转化为第一类遮掩图像具体为：在原始图像上随机添加一张语义图层，转化为第二类遮掩图像具体为：在原始图像上随机生成涂抹笔刷；所述语义图层是从预设置的语义图层集中随机获取的。

进一步的，步骤S3中，建立4个Haar滤波算子：[[1,1][1,1]]、[[1,-1][1,-1]]、[[1,1][-1,-1]]、[[1,-1][-1,1]]，使用4个Haar滤波算子对遮掩图像进行多次Haar小波抽取，得到遮掩图像在不同分辨率下的高频小波信息，以及分辨率为遮掩图像的1/2的训练图像；

其中，对图像使用第1个Haar滤波算子得到分辨率为该图像的1/2低分辨率图像，对图像使用第2个、第3个和第4个Haar滤波算子分别得到该图像垂直方向、水平方向和对角方向的高频小波信息。

进一步的，所述图像修复网络包括生成器和判别器，所述生成器包括编码模块、中间残差模块、注意力模块和解码模块；

所述生成器的输入为训练图像，生成器的输出为训练图像的修复图像；

对遮掩图像所对应的原始图像进行Haar小波变换，得到原始图像在不同分辨率下的高频小波信息，以及多张不同分辨率的采样图像，原始图像的高频小波信息所对应的分辨率与遮掩图像的高频小波信息所对应的分辨率一一对应，采样图像的分辨率与遮掩图像的高频小波信息所对应的分辨率一一对应；

所述判别器的输入为真实图像和修复图像，输出为判别器损失值；所述真实图像为与修复图像的分辨率相同的采样图像；

所述生成器的注意力模块还包括注意力偏移模块，用于获取放大的偏移值；

基于放大的偏移值对遮掩图像在不同分辨率下的高频小波信息进行小波聚合，得到修复小波信息；

基于修复小波信息，对不同分辨率的采样图像进行逆Haar小波变换，得到多张复原图像，将复原图像与采样图像和原始图像对比，计算得到生成器损失值；

基于判别器损失值和生成器损失值调整图像修复网络的参数。

更进一步的，所述生成器中编码模块和解码模块是由门控卷积构成的，前向过程为：

GateConv(X)＝σ(G)·F

F＝Conv_f(X)，G＝Conv_g(X)

其中，X是训练图像的输入特征，F和G表示图像特征，σ为sigmoid激活函数；

所述注意力模块计算训练图像中被遮掩区域的图像特征和未被遮掩区域的图像特征的相似度关系R_v,m，并基于相似度关系R_v,m和未被遮掩区域的图像特征重构被遮掩区域的图像特征，相似度关系R_v,m的计算如下：

R_v,m＝softmax_v(λcos_v,m)

其中，cos_v,m表示被遮掩区域的图像特征和未被遮掩区域的图像特征的余弦相似度，softmax表示指数归一化函数，F_v和F_m分别表示未被遮掩区域的图像特征和被遮掩区域的图像特征，λ取值为10；

重构被遮掩区域的图像特征如下所示：

其中，F′_m表示重构得到的被遮掩区域的图像特征；

所述注意力偏移模块用于获取放大的偏移值T′，具体为：

T′＝λ_max T+λ

其中，λ_max取值为120，T表示偏移值，λ取值为10，

表示矩阵的维度为

和

表示F′_m的尺寸；

基于相似度关系R_v,m和放大的偏移值T′得到小波聚合的相似度关系R′_v,m，R′_v,m为偏移后的相似度关系：

R′_v,m＝softmax_v(T′cos_v,m)

将遮掩图像在不同分辨率下的高频小波信息切块展开：

其中，H^(l)表示遮掩图像第l层的高频小波信息，第l层的分辨率为遮掩图像的1/2^l，

表示第l层的高频小波信息切块展开后得到的切块小波信息，

表示行和列，表示遮掩图像的高度，w表示遮掩图像的宽度，c＝3代表RGB输入；

表示矩阵的维度为

对切块小波信息进行修复：

其中，H′_j ^(l)表示对切块小波信息

进行修复得到的修复小波信息；

使用修复小波信息对不同分辨率的采样图像进行逆Haar小波变换，得到多张复原图像：

其中，

表示采样图像，

表示复原图像，L的值等于高频小波信息的总层数。

更进一步的，基于判别器损失值和生成器损失值调整图像修复网络的参数具体为：

判别器损失值

和对抗损失

为：

生成器损失值

为：

其中，

表示原始图像第l层的高频小波信息，

表示图像重构L1损失，

表示感知损失，

表示风格损失，λ_adv取值为0.1，λ_per取值为0.1，λ_sty取值为250，λ_IHT取值为0.2，

表示期望，M表示遮掩图像的二值化图像，N_M表示遮掩图像的二值化图像中灰度值为1的像素点的数量，N_(1-M)表示遮掩图像的二值化图像中灰度值为1的像素点的数量。

一种基于小波先验注意力的图像修复系统，包括图像获取模块和图像修复模块，所述图像获取模块用于获取待修复的图像，所述图像修复模块基于预先训练的图像修复模型对待修复的图像进行图像修复。

进一步的，所述图像修复模型的训练步骤如下：

获取多张原始图像；

基于原始图像构筑遮掩图像；

分别对各个遮掩图像进行Haar小波变换，得到遮掩图像在不同分辨率下的高频小波信息，以及分辨率为遮掩图像的1/2的训练图像；

建立图像修复网络，基于原始图像、训练图像和遮掩图像的高频小波信息进行图像修复网络的训练，得到图像修复模型。

更进一步的，所述原始图像为包含人脸或场景的图片。

与现有技术相比，本发明利用原始图像、遮掩图像和遮掩图像的高频小波信息进行图像修复网络的训练，提供了图像修复中一些关键的结构信息和高频信息，同时引入了注意力偏移模块，提升了图像修复模型的效率，得到的图像修复模型能更好的还原结构信息。

附图说明

图1为本发明的流程图；

图2为实施例中图像修复网络的系统概述图；

图3为实施例中注意力模块的结构图。

具体实施方式

下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施，给出了详细的实施方式和具体的操作过程，但本发明的保护范围不限于下述的实施例。

在附图中，结构相同的部件以相同数字标号表示，各处结构或功能相似的组件以相似数字标号表示。附图所示的每一组件的尺寸和厚度是任意示出的，本发明并没有限定每个组件的尺寸和厚度。为了使图示更清晰，附图中有些地方适当夸大了部件。

实施例1：

一种基于小波先验注意力的图像修复方法，如图1所示，包括以下步骤：

S1：获取多张原始图像；

S2：基于原始图像构筑遮掩图像；

S5：使用图像修复模型进行图像修复。

一种基于小波先验注意力的图像修复系统，包括图像获取模块和图像修复模块，图像获取模块用于获取待修复的图像，图像修复模块基于预先训练的图像修复模型对待修复的图像进行图像修复。

图像修复模型的训练步骤如下：

获取多张原始图像(原始图像为包含人脸或场景的图片)；

基于原始图像构筑遮掩图像；

本实施例中，以CelebaHQ人脸数据集和Places2中10个包含室内外场景图片的数据集作为原始图像，在CelebaHQ人脸数据集中划分29000张图片为原始图像，其余1000张图片作为测试图像，用于测试图像修复网络；一共得到50000张原始图像和1000张测试图像。

将每一张原始图像分别转换为遮掩图像，考虑到遮掩的多样性，每一张原始图像有50％的概率转化为第一类遮掩图像，有50％的概率转化为第二类遮掩图像。

引入COCO数据集的语义分割标签图层，构筑了91707张语义图层，这些语义图层均为现实事物的语义图层，在原始图像上随机添加一张语义图层得到第一类遮掩图像。

使用程序模拟人类的涂鸦习惯，通过随机的角度对笔刷进行迭代涂抹，将随机次数设置在2到5次，在原始图像上随机生成涂抹笔刷得到第二类遮掩图像。

对各个遮掩图像进行Haar小波变换，本申请建立4个Haar滤波算子：[[1,1][1,1]]、[[1,-1][1,-1]]、[[1,1][-1,-1]]、[[1,-1][-1,1]]，使用4个Haar滤波算子对遮掩图像进行多次Haar小波抽取，得到遮掩图像在不同分辨率下的高频小波信息，以及分辨率为遮掩图像的1/2的训练图像；其中，对图像使用第1个Haar滤波算子得到分辨率为该图像的1/2低分辨率图像，对图像使用第2个、第3个和第4个Haar滤波算子分别得到该图像垂直方向、水平方向和对角方向的高频小波信息。

假定遮掩图像为2*2的图块，[[a,b],[c,d]]，通过第1个Haar滤波算子得到((a+b+c+d)/4)，得到遮掩图像1/2分辨率的图像，相当于每2*2的patch均值化。通过第2个Haar滤波算子得到((a-b+c-d)/4)，其余算子同理，分别得到垂直方向，水平方向，对角方向的高频小波信息。

本实施例中，原始图像和遮掩图像的分辨率均为512*512，对遮掩图像进行多次Haar小波变换，得到分辨率为256*256的训练图像，以及遮掩图像在256*256分辨率、128*128分辨率、64*64分辨率、32*32分辨率下的高频小波信息。

建立图像修复网络，如图2所示，基于原始图像、训练图像和遮掩图像的高频小波信息进行图像修复网络的训练。将256*256的训练图像输入生成器，依次经过编码模块、残差模块、注意力模块、残差模块和解码模块，得到256*256的修复图像，在生成器中，基于256*256的训练图像中未被遮掩区域的图像特征重构被遮掩区域的图像特征，得到修复图像。

其中，编码模块和解码模块是由门控卷积构成的，前向过程为：

GateConv(X)＝σ(G)·F

F＝Conv_f(X)，G＝Conv_g(X)

上式中，X是训练图像的输入特征，F和G表示图像特征，σ为sigmoid激活函数；

本申请中，注意力模块计算训练图像中被遮掩区域的图像特征和未被遮掩区域的图像特征的相似度关系R_v,m，并基于相似度关系R_v,m和未被遮掩区域的图像特征重构被遮掩区域的图像特征，相似度关系R_v,m的计算如下：

R_v,m＝softmax_v(λcos_v,m)

上式中，cos_v,m表示被遮掩区域的图像特征和未被遮掩区域的图像特征的余弦相似度，softmax表示指数归一化函数，F_v和F_m分别表示未被遮掩区域的图像特征和被遮掩区域的图像特征，λ为固定偏移值，取值为10；

重构被遮掩区域的图像特征如下所示：

其中，F′_m表示重构得到的被遮掩区域的图像特征；最后，基于重构的被遮掩区域的图像特征得到修复图像。

为了更好的训练图像修复网络，本申请在注意力模块中引入了注意力偏移模块，如图3所示，在注意力偏移模块中计算放大的偏移值。注意力偏移模块获取放大的偏移值T′，具体为：

T′＝λ_max T+λ

其中，λ_max取值为120，表示偏移值，λ取值为10，

表示矩阵的维度为

和

表示F′_m的尺寸，本实施例中均为32；

R′_v,m＝softmax_v(T′cos_v,m)

将遮掩图像在256*256分辨率、128*128分辨率、64*64分辨率、32*32分辨率下的高频小波信息切块展开：

H^(l)表示遮掩图像第l层的高频小波信息，第l层的分辨率为遮掩图像的1/2^l，

表示第l层的高频小波信息切块展开后得到的切块小波信息，

表示矩阵的维度为

对切块小波信息进行修复：

其中，H′_j ^(l)表示对切块小波信息

进行修复得到的修复小波信息；

对512*512的原始图像进行Haar小波变换，得到分辨率为256*256、128*128、64*64、32*32的采样图像，以及原始图像在分辨率256*256、128*128、64*64、32*32下的高频小波信息。

使用修复小波信息对这些采样图像进行逆Haar小波变换(IHT)，得到512*512、256*256、128*128、64*64的复原图像。

使用修复小波信息对不同分辨率的采样图像进行逆Haar小波变换(IHT)如下所示：

其中，

表示采样图像，

表示复原图像，L的值等于高频小波信息的总层数，本实施例中，L取4。

为了判断生成器得到的修复图像的真实性，在判别器中输入256*256的修复图像和256*256的采样图像，计算判别器损失。

本申请引入了判别器损失值

和对抗损失

如下，其中，

表示期望：

将相同分辨率的复原图像与采样图像进行对比，512*512的复原图像、256*256的复原图像、128*128的复原图像、64*64的复原图像分别与原始图像、256*256的采样图像、128*128的采样图像、64*64的采样图像对比，计算生成器损失。

生成器损失值

为：

其中，

表示原始图像第l层的高频小波信息，

表示图像重构L1损失，

表示感知损失，

在图像修复网络的训练过程中，使用1000张测试图像对图像修复网络进行测试，直至得到训练好的图像修复网络。完成图像修复网络的训练后，得到图像修复模型，使用图像修复模型对被遮掩的图像进行图像修复，同时，还可以通过注意力模块对小波信息进行修复，得到高分辨率的图像。

以上详细描述了本发明的较佳具体实施例。应当理解，本领域的普通技术人员无需创造性劳动就可以根据本发明的构思作出诸多修改和变化。因此，凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案，皆应在由权利要求书所确定的保护范围内。

Claims

1.一种基于小波先验注意力的图像修复方法，其特征在于，包括以下步骤：

S1：获取多张原始图像；

S2：基于原始图像构筑遮掩图像；

S5：使用图像修复模型进行图像修复；

所述图像修复网络包括生成器和判别器，所述生成器包括编码模块、中间残差模块、注意力模块和解码模块；

所述判别器的输入为真实图像和修复图像，输出为判别器损失值；所述真实图像是与修复图像的分辨率相同的采样图像；

基于判别器损失值和生成器损失值调整图像修复网络的参数；

所述生成器中编码模块和解码模块是由门控卷积构成的，前向过程为：

GateConv(X)＝σ(G)·F

F＝Conv_f(X)，G＝Conv_g(X)

所述注意力模块计算训练图像中被遮掩区域的图像特征和未被遮掩区域的图像特征的相似度关系R_v，m，并基于相似度关系R_v，m和未被遮掩区域的图像特征重构被遮掩区域的图像特征，相似度关系R_v，m的计算如下：

R_v，m＝softmax_v(λcos_v，m)

其中，cos_v，m表示被遮掩区域的图像特征和未被遮掩区域的图像特征的余弦相似度，softmax表示指数归一化函数，F_v和F_m分别表示未被遮掩区域的图像特征和被遮掩区域的图像特征，λ取值为10；

重构被遮掩区域的图像特征如下所示：

其中，F′_m表示重构得到的被遮掩区域的图像特征；

所述注意力偏移模块用于获取放大的偏移值T′，具体为：

T′＝λ_maxT+λ

其中，λ_max取值为120，T表示偏移值，λ取值为10，

表示矩阵的维度为

和

表示F′_m的尺寸；

基于相似度关系R_v，m和放大的偏移值T′得到小波聚合的相似度关系R′_v，m，R′_v，m为偏移后的相似度关系：

R′_v，m＝softmax_v(T′cos_v，m)

将遮掩图像在不同分辨率下的高频小波信息切块展开：

表示第l层的高频小波信息切块展开后得到的切块小波信息，

表示行和列，h表示遮掩图像的高度，w表示遮掩图像的宽度，c＝3代表RGB输入；

表示矩阵的维度为

对切块小波信息进行修复：

其中，

表示对切块小波信息

进行修复得到的修复小波信息；

其中，

表示采样图像，

表示复原图像，L的值等于高频小波信息的总层数。

2.根据权利要求1所述的一种基于小波先验注意力的图像修复方法，其特征在于，所述原始图像为包含人脸或场景的图片。

3.根据权利要求1所述的一种基于小波先验注意力的图像修复方法，其特征在于，步骤S2中，构筑遮掩图像具体为：

遍历所有的原始图像，分别将每一张原始图像转化为遮掩图像，每一张原始图像有50％的概率转化为第一类遮掩图像，有50％的概率转化为第二类遮掩图像，转化为第一类遮掩图像具体为：在原始图像上随机添加一张语义图层；转化为第二类遮掩图像具体为：在原始图像上随机生成涂抹笔刷；所述语义图层是从预设置的语义图层集中随机获取的。

4.根据权利要求1所述的一种基于小波先验注意力的图像修复方法，其特征在于，步骤S3中，建立4个Haar滤波算子：[[1，1][1，1]]、[[1，-1][1，-1]]、[[1，1][-1，-1]]、[[1，-1][-1，1]]，使用4个Haar滤波算子对遮掩图像进行多次Haar小波抽取，得到遮掩图像在不同分辨率下的高频小波信息，以及分辨率为遮掩图像的1/2的训练图像；

其中，对图像使用第1个Haar滤波算子得到分辨率为该图像的1/2的低分辨率图像，对图像使用第2个、第3个和第4个Haar滤波算子分别得到该图像垂直方向、水平方向和对角方向的高频小波信息。

5.根据权利要求1所述的一种基于小波先验注意力的图像修复方法，其特征在于，基于判别器损失值和生成器损失值调整图像修复网络的参数具体为：

判别器损失值