CN113129234A

CN113129234A - 一种场内外特征融合的残缺图像精细修复方法

Info

Publication number: CN113129234A
Application number: CN202110423212.0A
Authority: CN
Inventors: 徐涛; 周纪勇; 蔡磊; 吴韶华; 赵未硕; 马玉琨; 蔡豪杰
Original assignee: Henan Institute of Science and Technology
Current assignee: Henan Institute of Science and Technology
Priority date: 2021-04-20
Filing date: 2021-04-20
Publication date: 2021-07-16
Anticipated expiration: 2041-04-20
Also published as: CN113129234B

Abstract

本发明提出了一种场内外特征融合的残缺图像精细修复方法，其步骤为：检测残缺图像中存在的目标，利用知识库检索与目标相关的常识性知识，基于RNN的编码器将常识性知识转化为场外特征；提取残缺图像的目标特征信息并进行处理得到场内特征，利用改进的DMN+模型场外特征与场内特征进行融合，得到融合特征；将融合特征输入到带有环境注意机制的粗修复网络，得到粗修复图像；将粗修复图像输入到精细修复网络中进一步细化，从而实现残缺图像的修复。本发明利用知识库中的常识性知识弥补目标信息的不足；环境注意机制更大程度上利用背景信息；增加相关特征连贯层解决了残缺区域的语义相关性和特征连续性的问题，提高图像的修复结果。

Description

一种场内外特征融合的残缺图像精细修复方法

技术领域

本发明涉及图像修复的技术领域，尤其涉及一种场内外特征融合的残缺图像精细修复方法。

背景技术

图像修复是指因遮挡、模糊、传输干扰等各种因素造成信息缺失或损坏的图片，可通过利用图像缺失部分邻域的信息和图像整体的结构等信息，按照一定的信息复原技术对图像的缺失或损坏的区域进行修复。但由于图像修复技术具有独特的功能经常被应用到许多图像处理的场景中，例如删除图像中不需要的物体、去除目标物上的遮挡物体、修复损坏等任务，图像修复的核心技术是图像修复区域既要保持全局语义结构，又要保证生成逼真的纹理细节。随着深度学习方法的快速发展，同时也为图像修复模型开辟了一条新的路径。基于深度学习的图像修复模型是将一个深度神经网络通过在数据库中经过大量的训练，学习到图像更多深层次的特征信息，从而得到了更加逼真的图像修复效果。随着生成式对抗网络(GANs)作为一种无监督的深度学习模型被应用于图像修复领域，使得基于深度学习的图像修复得到了进一步的发展。

公开号为CN112381725A的发明专利公开了一种基于深度卷积对抗生成网络的图像修复方法及装置，通过对待修复图像进行预处理以获得边缘原图，然后利用预先训练的深度卷积对抗生成网络，根据边缘原图生成与待修复图像对应的目标生成图像。然而该方法忽略了残缺区域的语义相关性和特征连续性而导致图像的修复效果并不理想。同时上述修复方法面对特征信息严重缺失信息不足的残缺图像时，其修复效果就会显示出不能有效修复的现象。因此，本发明提出了基于场内外特征融合的残缺图像精细修复方法解决上述问题。

发明内容

针对现有图像修复方法的修复效果不理想，不能有效修复的技术问题，本发明提出一种场内外特征融合的残缺图像精细修复方法，利用知识库中的常识性知识，弥补原图像目标信息的不足，利用背景信息及残缺区域的语义相关性和特征连续性，从而提高图像的修复效果。

为了达到上述目的，本发明的技术方案是这样实现的：一种场内外特征融合的残缺图像精细修复方法，其步骤如下：

步骤一：检测残缺图像中存在的目标，利用知识库检索与目标相关的常识性知识，基于RNN的编码器将常识性知识转化为场外特征；

步骤二：提取残缺图像的目标特征信息并进行处理得到场内特征，利用改进的DMN+模型将步骤一得到的场外特征与场内特征进行融合，得到融合特征；

步骤三：将步骤二得到的融合特征输入到带有环境注意机制的粗修复网络，得到粗修复图像；

步骤四：将步骤三得到的粗修复图像输入到精细修复网络中，通过精细修复网络对粗修复图像进一步细化获得精细修复图像，从而实现残缺图像的修复。

所述步骤一中场外特征的获取方法为：

根据知识库中的常识性知识，对残缺图像I_in中的目标β判断推理，推测出可能相关的目标{α₁，α₂，....，α_k}；

从知识库中检索与目标α_k相关的常识性描述为：

其中，{m₁，m₂，...，m_n}是从知识库中检索到的目标α_k的常识性描述，n表示每个目标的常识性描述的个数；

将常识性描述{m₁，m₂，...，m_n}编码转换成单词序列{M¹，M²，...，M^t}，通过x^t＝w_eM^t的映射关系将常识性描述中的每一个单词映射到一个连续的向量空间中；其中，x^t表示目标α_k的第t个单词的映射向量，w_e为映射权重；

通过基于RNN的编码器将映射向量x^t进行编码：

其中，T^t-1表示编码器的隐藏状态，RNN_fast()表示基于RNN的编码器的编码函数，

表示第t个单词的映射向量通过基于RNN的编码器所得的特征向量；

将通过基于RNN的编码器得到的特征向量x′_E定义为场外特征X_E，即

所述目标β是通过YOLOv3目标识别模型检测残缺图像I_in得到的。

所述场内特征的提取方法为：

将信息残缺图像I_in输入到改进的DMN+模型中，改进的DMN+模型的第一层提取目标特征信息

目标特征信息

作为改进的DMN+模型的第二层输入，改进的DMN+模型的第三层及以上的层的输入

为目标特征信息

和前一层输出

的总和：

其中，i＝2，……，ni，ni为改进的DMN+模型的层数；

则场内特征为：

其中，W₁和b₁表示映射参数；tanh()为映射函数。

所述改进的DMN+模型对目标特征信息进行学习，并将提取的特征之间进行信息交互，获取更多的与目标特征信息相关的场外特征；所述改进的DMN+模型将场外特征与场内特征进行融合的方法为：

f^t＝soft max(W₃tanh(W₂z^t+b₂)+b₃)，

g^t＝AGRU(X_E，f^t)；

其中，γ^t-1表示第t-1个场外特征与图像特征在改进的DMN+模型的记忆模块中交互运算后输出的情景记忆状态，z^t表示相关的场外特征X_E、情景记忆状态γ^t-1和场内特征X之间的交互运算后的向量，

表示向量相乘的运算符号，|·|表示元素的绝对值，[：]表示是多个元素交互运算；f^t表示全连接层的输出，W₂、W₃、b₂和b₃均表示学习参数，soft max(·)表示输出激活函数，AGRU(·)表示改进的DMN+模型的注意机制循环模块的函数；g^t表示第t个场外特征被检测后门循环模块的状态，且：g^t＝f^tGRU(X_E，g^t-1)+(1-f^t-1)g^t-1；

通过注意力机制利用当前的状态和改机的DMN+模型的情景记忆状态更新储存器的记忆状态为：γ^t＝ReLU(W₄[γ^t-1：g^t：X]+d₄)；其中，γ^t表示更新后的情景记忆状态，ReLU()为整流线性激活函数，W₄和d₄均表示学习参数；

通过改进的DMN+模型提取的场外特征为：

X_r＝[X，X_E]；

其中，

表示改进的DMN+模型最后一层输出的具有场外知识弥补的图像信息，W₅和d₅均表示学习参数；X_E表示具有相关性的场外特征，X_r表示融合后的特征；

最后将

输入到改进的DMN+模型的输出层，得到经场外知识优化的残缺图像I_opt。

所述粗修复网络是基于对抗性神经网络策略的WGAN-GP修复模型，WGAN-GP修复模型利用Wasserstein-1距离构成惩罚梯度函数对生成器形成约束为：

其中，

表示从生成特征分布P_r和原始特征分布P_g采样点之间的直线上采样的特征，

表示特征

通过判别器D的输出值，

表示1-Lipschithz函数约束下的采样样本，

表示特征

的分布距离函数，||·||₂表示所有矩阵列向量绝对值之和的最大值；S表示掩膜矩阵，λ表示惩罚函数的权重；

Wasserstein-1距离为：

其中，P_r表示残缺区域的生成特征X_rs的分布，P_g表示残缺图像对应的原始特征X_rc的分布，∏(P_r，P_g)表示生成特征分布P_r和原始特征分布P_g采样点分布的边际，E[·]为分布特征之间距离函数，inf表示取下限函数，W(P_r，P_g)表示生成特征分布和原始特征分布的距离；

所述WGAN-GP修复模型利用梯度惩罚约束条件训练和优化原始的WGAN-GP网络的生成器，即：

Wasserstein-1距离W(P_r，P_g)通过比较生成数据分布和原始数据分布，目标函数为：

其中，L表示1-Lipschitz函数的集合，P_r表示残缺区域的生成特征分布，P_g表示残缺图像对应的原始特征分布，G表示生成器，D表示判别器，D(X_rs)和D(X_rc)分别表示生成特征和原始特征通过判别器D的输出值；

和

分别表示生成特征分布和原始特征分布的分布距离函数。

所述粗修复网络的WGAN-GP修复模型的变分自编码器提取具有场外知识弥补的残缺图像信息

的深度特征得到原始特征为

WGAN-GP修复模型的生成器依据向量元素

生成残缺区域特征得到生成特征为

其中，

表示具有场外知识弥补的图像信息

的深度特征的向量元素，k₁表示深度特征向量元素的个数其中，

表示生成残缺区域特征的向量元素，k₂表示生成残缺区域特征向量元素的个数；

在经场外知识优化的残缺图像I_opt的完整区域中提取与残缺区域的生成特征

相关的环境特征

并整形为卷积滤波器，使用余弦相似度检测提取的环境特征

和残缺区域的生成特征

的匹配程度，即：

其中，

表示环境特征

和残缺区域的生成特征

之间相似度，<·>表示向量间的数量积；

环境特征

和残缺区域的生成特征

之间相似度权衡注意权重，即每个像素的注意程度为

其中，soft max₁表示环境注意机制的softmax函数，权重α是一个常数；

通过与注意程度

最相关的

的值先进行左右传播、再进行自上而下的传播，最终获得环境特征

的相似度

为：

其中，a∈(0，k₂)，k₂表示相关环境的个数；

得到具有相似度的局部环境特征为

其中，

表示具有相似度的局部环境特征的向量元素，k₃表示具有相似度的局部环境特征的向量元素个数；

在完整区域中提取与原始特征X_rc相关的完整区域的环境特征：

X′_rg＝f_rgA(X_rs，H_rs，W_rs)；

其中，H_rs表示输入图像的高度，W_rs表示输入图片的宽度，f_rgA(c)为全局环境特征的提取函数；

通过1×1卷积层将这局部环境注意机制和全局环境注意机制的背景特征信息进行融合，得到分层的环境注意机制，通过分层的环境注意机制得到的背景特征为：

X′_rs-g＝f_conv([X′_rs：X′_rg])；

其中，f_conv(c)表示卷积运算，[：]是交互运算；

WGAN-GP模型的解码器对残缺区域的生成特征X_rs、原始特征X_rc和背景特征X′_rs-g进行解码生成粗修复图像I_rou。

所述精细修复网络增加了相关特征连贯层的WGAN-GP修复模型，并通过特征相关性对上下语义情景结构进行保留。

所述精细修复网络的WGAN-GP修复模型的变分自编码器提取粗修复图像I_rou的深度特征为X_fc＝{x_fc1，x_fc2...，x_fck4}，其中，

表示粗修复图像I_rou深度特征的向量元素，k₄表示深度特征向量元素的个数；WGAN-GP修复模型的生成器依据向量元素

生成残缺区域特征为

其中，

表示生成残缺区域特征向量元素，k₅表示生成残缺区域特征向量元素的个数；

在残缺图像信息完整区域中搜索最匹配的特征

用于初始化x_fsa；然后，将特征

作为主要的特征信息，参考已经生成的特征x_fsa-1，在生成的特征过程中还原特征x_fsa，判断特征之间的相关度：

其中，D_a表示生成特征x_fsa和邻近特征x_fsa-1之间的相似性，

表示最匹配的特征

和生成特征x_fsa之间的相似性；

将相似性

和

视为生成特征的权重，生成的特征表示为：

通过精细修复网络的解码器将通过相关特征连贯层生成的残缺区域生成特征

和变分自编码器提取的深度特征X_fc进行解码生成精细修复图像I_rou。

所述改进的DMN+模型的优化损失函数L_d为：L_d＝max(0，W₆-S_o(X_E，γ^t)+S_R(X_E，X))；

其中，S_O(·)表示情景记忆状态γ^t和场外特征X_E之间的匹配度，S_R(·)表示场内特征X和场外特征X_E之间的匹配度，W₆表示权重，一般取值为0～1；

所述WGAN-GP模型的对抗性损失函数D_R为：

其中，D代表WGAN-GP网络的判别器，I_gt表示没有经过掩膜处理的原图像，

表示对判别器鉴定后的原始数据取平均值的操作，

表示对判别器鉴定后的生成数据取平均值的操作；

所述精细修复网络将变分自编码器和解码器对应层的特征空间设定为目标计算出距离L_c，从而得到一致性损失为：

其中，

表示精细修复网络中经训练得到的参数，W(·)表示编码器中相关特征连贯层的特征空间，W_d(·)是解码器中相关特征连贯层的对应层特征空间。

与现有技术相比，本发明的有益效果：主要分为三个部分：场内外特征融合部分、粗糙修复部分和精细修复部分，将信息残缺的图像I_in输入到场内外特征融合网络得到一个特征信息更加丰富的输出结果，并将其输入到粗糙修复网络中，得到一个粗糙修复图像I_rou；将粗糙修复图像I_rou输入到精细修复网络中，精细修复网络会迅速的提取叠加区域的有效特征信息；经精细修复网络后，输出一个精细修复图像I_fin，从而实现残缺图像的修复。

本发明提出利用知识库中的常识性知识，弥补原图像目标信息的不足：从知识库中提取关于目标的文字特征描述，并将文字转化成单个单词，通过基于RNN的编码器将场外的文字特征描述编码成特征向量并存储到知识存储单元的内存槽中；并通过改进的DMN+(动态内存网络DMN))模型检索与目标信息相关的特征向量实现融合，从而解决目标信息不足的问题。

由于残缺图像的目标特征严重缺失，极大的影响了残缺图像的修复效果，本发明提出环境注意机制检索相关的环境特征信息：首先利用对抗神经网络构建粗修复网络模型，并在模型中引入分层的环境注意机制，分层的环境注意机制在测试中能够更大程度上利用背景信息，从而得到一个效果较好的图像修复结果。

现有的修复方法往往忽略了残缺区域的语义相关性和特征连续性而导致修复并不理想，因此本发明在粗修复网络模型上再构建一个精细修复网络模型，其网络结构与粗修复网络基本相同，不同的是为了提高语义相关性和特征连续性，本发明提出相关特征连贯层，特征相关性分为两个阶段：搜索阶段和生成阶段，在图像信息完整的区域中寻找与生成特征最匹配特征，同时参考邻近已经生成的特征生成具有特征相关性的特征信息，解决了残缺区域的语义相关性和特征连续性的问题，提高图像的修复结果。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明的流程图。

图2为本发明场内特征和场外特征融合的流程图。

图3为本发明修复结果的对比图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有付出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

如图1所示，一种场内外特征融合的残缺图像精细修复方法，其步骤为：

步骤一：检测残缺图像中存在的目标，利用知识库检索与目标相关的常识性知识，基于RNN的编码器将常识性知识转化为场外特征。

本发明利用知识库中的常识性知识，弥补原图像目标信息的不足。图像中目标α是残缺的，由于特征信息的不足无法实现对其准确地识别。然而，通过YOLOv3目标识别模型已经检测出残缺图像I_in中存在目标β，根据知识库中相应的常识性知识，对已经检测出的目标β判断推理，从而可以推测出与其可能相关的目标{α₁，α₂，...，α_k}。因此，依据常识性知识得到目标与对象之间的关系可以表示为：

这些目标{α₁，α₂，...，α_k}是根据知识库中的常识性知识推理出来。同时，知识库中还包含着物体的基本特征信息，通过从知识库获得目标相关的常识性知识去弥补原目标信息的不足，从而解决信息不足的问题。从知识库中检索到对目标相关的常识性知识，并且保证检索出来的常识性知识与知识库中相应的语义实体进行匹配，最终从知识库中检索到的目标相关常识性知识可以表示为：

其中，{m₁，m₂，...，m_n}是从知识库中检索到的目标α_k的常识性描述，n表示每个目标的常识性描述的个数。为了对检测到的目标相关常识性知识进行编码，将这些常识性描述{m₁，m₂，...，m_n}转换成单词序列{M¹，M²，...，M^t}，并且通过x^t＝w_eM^t的映射关系将目标相关常识性知识中的每一个单词映射到一个连续的向量空间中，其中，x^t表示映射向量，w_e为映射权重，然后将通过基于RNN的编码器映射向量进行编码：

其中，x^t表示检索到的关于目标α_k的第t个单词的映射向量，T^t-1表示编码器的隐藏状态，RNN_fast()表示基于RNN的编码器的编码函数，

表示第t个单词的映射向量通过基于RNN编码器所得的特征向量，将通过基于RNN的编码器得到的特征向量其定义为场外特征X_E，可以表示为

步骤二：提取残缺图像的目标特征信息并进行处理得到场内特征，利用改进的DMN+模型将步骤一得到的场外特征与场内特征进行融合，得到融合特征。

知识库中得到的自然知识编码成向量存储到知识存储单元的内存槽中，并将外部知识融入到目标特征提取的过程中，弥补原目标物特征的不足，从而提高修复模型的修复能力。将k个目标α_k在知识库相对应的特征语义描述通过基于RNN的编码器编码到场内外特征融合模型的储存空间中，那么存储空间中就含有k×n个相关的特征向量。然而当储存空间的向量足够大时，将会增加从候选知识中提取有用的信息的难度。为了解决这一问题，提出改进的DMN+模型。同时为了保证改进的DMN+模型对上下文信息的理解和原始输入的记忆，改进了DMN+的输入，将信息残缺图像I_in作为输入信息输入到改进的DMN+模型中，改进的DMN+模型的第一层有效地提取目标特征信息

目标特征信息

作为改进的DMN+模型的第二层输入，第三层及以上的层的输入

为原始输入的目标特征信息

和前一层输出

的总和：

其中，i＝2，……，ni；ni为改进的DMN+模型的层数，ni层数一般大于单词向量的个数。

通过改进的DMN+模型对目标特征的学习，让DNM+模型提取到的特征之间进行信息交互，以获取更多的与目标信息相关的场外特征信息，更有利于实现图像的修复。将待修复目标融合后的特征向量输入到改进的DMN+模型中，其处理过程如下式所示：

f^t＝soft max(W₃ tanh(W₂z^t+b₂)+b₃) (7)

g^t＝AGRU(X_E，f^t) (8)

其中，X表示图像目标映射后的目标向量，即场内特征，W₁和b₁表示映射参数，其取值为[0，1]，γ^t-1表示第t-1个单词对应的场外特征向量与图像特征在改进的DMN+模型的记忆模块交互运算后输出的模型情景记忆状态，记忆模块的作用是结合图像特征和场外特征进行迭代生成记忆，并且检索相关的场外向量。z^t表示相关的场外特征X_E、模型情景记忆状态γ^t-1和被映射的目标向量X之间的交互运算后的向量，

表示向量相乘的运算符号，|·|表示元素的绝对值，[：]表示是多个元素交互运算。值得说明的是，模型情景记忆γ^t-1和被映射的目标向量X需要先通过复制扩展达到具有相同维度，才能与场外特征X_E进行交互运算。f^t表示全连接层的输出，W₂、W₃、b₂和b₃均表示学习参数，其取值一般在0～0.5之间。softmax(c)表示输出激活函数，AGRU(·)表示改进的DMN+模型的注意机制循环模块(AGRU)的函数；g^t表示第t个场外特征被检测后门循环模块(GRU)的状态，其工作原理如下：

g^t＝f^tGRU(X_E，g^t-1)+(1-f^t-1)g^t-1 (9)

通过注意力机制利用当前的状态和DMN+模型的情景记忆更新储存器的记忆状态，如公式(10)所示：

γ^t＝Re LU(W₄[γ^t-1：g^t：X]+d₄) (10)

其中，γ^t表示更新后的模型情景记忆状态，ReLU()为整流线性激活函数，W₄和d₄均表示学习参数，其取值一般为0.001～0.1。通过改进的DMN+模型提取场外特征表示为：

X_r＝[X，X_E] (12)

其中，

表示改进的DMN+模型最后一层输出的具有场外知识弥补的图像信息，W₅和d₅均表示学习参数，其取值为[0，0.5]。X_E表示具有相关性的场外特征，X_r表示融合后的特征。最后将

输入到改进的DMN+模型输出层，得到经过场外知识优化的残缺图像I_opt。通过公式(4)-公式(12)实现了残缺目标的场内外特征信息的融合，丰富了残缺图像原有的特征信息，解决了缺失目标物的特征信息不足的问题。

如图2所示，模型情景记忆状态γ^t与场外特征X_E交互运算实现相关场外特征的检索，目标共有t个场外特征向量，第一层通过提取目标特征，并依据目标特征检索第一个场外特征向量通过公式(6)、(7)、(9)、(10)的运算输出结果，同时将第一个场外特征向量进行记忆，将具有情景记忆的目标特征检索第2个场外特征向量通过公式(6)、(7)、(9)、(10)的运算输出结果，.....，将第t-1个场外特征向量进行记忆，将具有情景记忆的目标特征检索第t个场外特征向量通过公式(6)、(7)、(9)、(10)的运算输出结果，最终得到公式(11)和公式(12)。

为提高场内外特征融合网络检索相关场外特征的能力和优化注意机制参数，在采用改进的DMN+模型进行场内外特征融合时定义一个优化损失函数L_d，如下式所示：

L_d＝max(0，W₆-S_o(X_E，γ^t)+S_R(X_E，X)) (13)

其中，S_O(c)表示情景记忆状态γ^t和场外特征X_E之间的匹配度，S_R(·)表示场内特征X和场外特征X_E之间的匹配度，W₆表示权重，一般取值为0～1。

步骤三：将步骤二得到的融合特征输入到带有环境注意机制的粗修复网络，得到粗修复图像。

本发明的粗略修复网络是基于对抗性神经网络策略的修复模型，是将变分自编码器(VAE)的每一层都与解码器对应层的特征关联起来。编码器生成待修复图像的深度特征表示，通过解码器依据该深度特征预测并生成缺失区域信息。首先通过WGAN-GP修复模型的变分自编码器提取具有场外知识弥补的图像信息

信息

是最后改进的DNM+输出的图像信息，这个输出的图像信息所包含特征就是X_r。经场外知识优化的残缺图像I_opt的深度特征，并将其表示

其中，

表示具有场外知识弥补的图像信息

(经场外知识优化的残缺图像I_opt)的深度特征的第k₁个向量元素，k₁表示深度特征向量元素的个数；通过WGAN-GP修复模型的生成器依据向量元素

生成残缺区域特征表示为

其中，

表示生成残缺区域特征的第k₂个向量元素，k₂表示生成残缺区域特征向量元素的个数。为了更好地提取残缺区域特征，本发明引入Wasserstein-1距离构成惩罚梯度函数对生成器形成约束，其原理为：

其中，

表示特征

通过判别器D的输出值，

表示1-Lipschithz函数约束下的采样样本，

表示特征

的分布距离函数，||·||₂表示所有矩阵列向量绝对值之和的最大值。S表示掩膜矩阵，缺失像素的掩膜值为0，其它部分的掩膜值为1。λ表示惩罚函数的权重，其取值为[0，0.5]。

图像的WGAN-GP修复模型中的Wasserstein-1距离表示为：

其中，P_r表示残缺区域的生成特征X_rs的分布，P_g表示残缺图像对应的原始特征X_rc分布，∏(P_r，P_g)表示生成特征分布P_r和原始特征分布P_g采样点分布的边际，E[·]分布特征之间距离函数，inf表示取下限函数，W(P_r，P_g)表示生成特征分布和原始特征分布的距离。

利用梯度惩罚约束条件训练和优化原始WGAN-GP网络的生成器，使其更易学习并匹配出待修复区域的有效信息，提升粗修复网络模型的稳定性，其原理如下：

Wasserstein-1距离W(P_r，P_g)是通过比较生成数据分布和原始数据分布，其目标函数为：

其中，L表示1-Lipschitz函数的集合，P_r表示残缺区域的生成特征分布，P_g表示残缺图像对应的原始特征分布，G表示生成器，D表示判别器，D(X_rs)和D(X_rc)分别表示生成特征和原始特征通过判别器D的输出值。

和

分别表示生成特征分布和原始特征分布的分布距离函数。

为了提高修复模型效果，在粗修复网络中引入环境注意机制，通过分层的环境注意机制对相关环境检索并利用，可以更多的关注背景信息提高修复的效果。为了生成与环境特征匹配的特征，在完整区域中提取与残缺区域的生成特征

Claims

1.一种场内外特征融合的残缺图像精细修复方法，其特征在于，其步骤如下：

2.根据权利要求1所述的场内外特征融合的残缺图像精细修复方法，其特征在于，所述步骤一中场外特征的获取方法为：

根据知识库中的常识性知识，对残缺图像I_in中的目标β判断推理，推测出可能相关的目标{α₁,α₂,...,α_k}；

从知识库中检索与目标α_k相关的常识性描述为：

其中，{m₁,m₂,...,m_n}是从知识库中检索到的目标α_k的常识性描述，n表示每个目标的常识性描述的个数；

将常识性描述{m₁,m₂,...,m_n}编码转换成单词序列{M¹,M²,...,M^t}，通过x^t＝w_eM^t的映射关系将常识性描述中的每一个单词映射到一个连续的向量空间中；其中，x^t表示目标α_k的第t个单词的映射向量，w_e为映射权重；

通过基于RNN的编码器将映射向量x^t进行编码：

将通过基于RNN的编码器得到的特征向量

定义为场外特征X_E，即

3.根据权利要求2所述的场内外特征融合的残缺图像精细修复方法，其特征在于，所述目标β是通过YOLOv3目标识别模型检测残缺图像I_in得到的。

4.根据权利要求1或2所述的场内外特征融合的残缺图像精细修复方法，其特征在于，所述场内特征的提取方法为：

目标特征信息

为目标特征信息

和前一层输出

的总和：

其中，i＝2,……,ni，ni为改进的DMN+模型的层数；

则场内特征为：

其中，W₁和b₁表示映射参数；tanh()为映射函数。

5.根据权利要求4所述的场内外特征融合的残缺图像精细修复方法，其特征在于，所述改进的DMN+模型对目标特征信息进行学习，并将提取的特征之间进行信息交互，获取更多的与目标特征信息相关的场外特征；所述改进的DMN+模型将场外特征与场内特征进行融合的方法为：

f^t＝softmax(W₃tanh(W₂z^t+b₂)+b₃)，

g^t＝AGRU(X_E,f^t)；

表示向量相乘的运算符号，|·|表示元素的绝对值，[:]表示是多个元素交互运算；f^t表示全连接层的输出，W₂、W₃、b₂和b₃均表示学习参数，softmax(·)表示输出激活函数，AGRU(·)表示改进的DMN+模型的注意机制循环模块的函数；g^t表示第t个场外特征被检测后门循环模块的状态，且：g^t＝f^tGRU(X_E,g^t-1)+(1-f^t-1)g^t-1；

通过注意力机制利用当前的状态和改机的DMN+模型的情景记忆状态更新储存器的记忆状态为：γ^t＝ReLU(W₄[γ^t-1:g^t:X]+d₄)；其中，γ^t表示更新后的情景记忆状态，ReLU()为整流线性激活函数，W₄和d₄均表示学习参数；

通过改进的DMN+模型提取的场外特征为：