CN111127346A - 基于部分到整体注意力机制的多层次图像修复方法 - Google Patents
基于部分到整体注意力机制的多层次图像修复方法 Download PDFInfo
- Publication number
- CN111127346A CN111127346A CN201911246343.5A CN201911246343A CN111127346A CN 111127346 A CN111127346 A CN 111127346A CN 201911246343 A CN201911246343 A CN 201911246343A CN 111127346 A CN111127346 A CN 111127346A
- Authority
- CN
- China
- Prior art keywords
- conv
- size
- loss
- convolution
- output
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 35
- 230000007246 mechanism Effects 0.000 title claims abstract description 20
- 238000012549 training Methods 0.000 claims abstract description 20
- 230000006870 function Effects 0.000 claims abstract description 16
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 13
- 230000008569 process Effects 0.000 claims abstract description 3
- 230000000694 effects Effects 0.000 claims description 6
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 claims description 5
- 230000006835 compression Effects 0.000 claims description 5
- 238000007906 compression Methods 0.000 claims description 5
- 230000004913 activation Effects 0.000 claims description 4
- 238000013528 artificial neural network Methods 0.000 claims description 4
- 238000010586 diagram Methods 0.000 claims description 4
- 239000011159 matrix material Substances 0.000 claims description 4
- 238000005070 sampling Methods 0.000 claims description 4
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims description 3
- 101150071716 PCSK1 gene Proteins 0.000 claims description 2
- 239000011800 void material Substances 0.000 claims description 2
- 206010008909 Chronic Hepatitis Diseases 0.000 claims 1
- 208000006454 hepatitis Diseases 0.000 claims 1
- 238000012545 processing Methods 0.000 abstract description 4
- 230000008447 perception Effects 0.000 abstract description 2
- 230000008439 repair process Effects 0.000 description 7
- 230000009471 action Effects 0.000 description 5
- 238000013459 approach Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000009792 diffusion process Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000011158 quantitative evaluation Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 208000002874 Acne Vulgaris Diseases 0.000 description 1
- 206010000496 acne Diseases 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 238000003709 image segmentation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/77—Retouching; Inpainting; Scratch removal
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明属于数字图像智能处理技术领域,具体为一种基于部分到整体注意力机制的多层次图像修复方法。图像修复是指利用算法来替换和生成丢失或缺损的图像数据。本发明方法包括:一种多层次的深度卷积神经网络生成器结构;一个部分到整体的注意力机制卷积层,分别集成到网络的生成器和判别器中。在网络的训练过程中引入了图像块判别器和重构损失、感知损失、风格损失、对抗损失四种损失函数来辅助生成器学习图像修复任务。实验结果表明,本发明可以生成细节逼真且整体结构合理的修复图像,有效解决图像修复问题。
Description
技术领域
本发明属于数字图像智能处理技术领域,涉及一种图像修复方法,更具体的说,涉及一种基于部分到整体注意力机制的多层次图像修复方法。
背景技术
随着人们用来存储信息的介质的改变,图像修复这一任务的定义也在相应地发生变化,从文艺复兴时期对受损的壁画的修复,到早些年对老化的纸质照片的修复,再到目前对计算机上储存的数字图片的处理。需要强调的是,图像修复的应用已经不仅仅局限于“修复”这一功能,除此以外,现在的修复技术还可以应用在物体去除、去水印、去遮挡、人脸祛痘、磨皮等场景。
早期的图像修复技术从其针对的待修复区域大小出发,主要分为两类:基于信息扩散的方法和基于图像块匹配的方法。基于信息扩散的方法采用迭代补全的思路,每一步迭代将图像的信息沿着等照度线方向向缺失区域内传播,从而将信息从缺失区域的边界逐步扩散到缺失区域内。这种方法只适用于处理细小的缺失区域,例如斑点、划痕等。基于图像块匹配的方法可以处理图像中规模较大的缺失区域,其核心思想是通过图像特征来进行图像块的配对和替换。然而,这种方法假设缺失区域的内容可以在背景区域内找到,但这并不总是成立的。除此以外,上述所有早期的传统修复技术都无法理解图像的结构等高层次语义信息,且无法生成新的、独特的图像内容。
近年来,卷积神经网络(CNN)的发展为计算机视觉领域带来了新的突破,由此也产生了一系列基于深度学习技术的图像修复算法。这些算法克服了传统算法的不足,可以生成视觉上较为真实且整体结构一致的修复结果。特别地,由于图像修复是一种生成任务,所以可以很好地运用生成对抗网络(GenerativeAdversarialNetworks,GANs)[1]。GAN是一种特殊的深度卷积神经网络,它包括一个生成器用于生成图像、一个可学习的判别器用于判断生成的图像是否是真实的。
对目前已有的网络来说,其生成器多采用类似U-Net[2]的网络结构,这种结构最早被用在医疗图像分割中,且取得了较好的效果。其中,跳跃连接是U-Net的关键部件,可以整合不同层次的图像信息。然而,Yu等人指出[3],将跳跃连接用于中心大规模缺失区域的修复无法得到理想的效果,原因是中心缺失区域在跳跃连接中无法传递有价值的纹理、颜色等信息。
此外,注意力机制的应用也使得图像修复网络可以对图像中的长距离相关性进行建模。Yu等人提出了一种上下文注意力模块(Contextual Attention,简称CA)[4],可以较好地利用背景区域中的已有信息进行修复。然而,这种方法过度关注对已有信息的利用,忽略了缺失区域内部的语义连续性,因此可能产生视觉上不合理的修复结果。
发明内容
为了克服现有技术的不足,本发明的目的在于提供一种产生真实、自然的修复结果的基于部分到整体注意力机制的多层次图像修复方法。
本发明提供的基于部分到整体注意力机制的多层次图像修复方法,主要针对图像中心正方形缺失场景进行修复,其中缺失区域占整体图像大小的25%左右;本发明首先构建一个多层次的深度卷积神经网络生成器,然后将所提出的部分到整体注意力层分别集成到生成器和判别器中,同时引入重构损失、感知损失、风格损失、对抗损失四种损失函数来约束网络的训练;最后利用训练的多层次的深度卷积神经网络生成器,得到修复的图像。本发明提出的修复方法可以产生真实、自然的修复结果。
本发明提供的基于部分到整体注意力机制的多层次图像修复方法,具体步骤包括:
(1)在U-Net[2]结构的基础上构建多层次的深度卷积神经网络生成器;
(2)将部分到整体的注意力机制卷积层分别集成到深度卷积神经网络生成器和判别器中;训练深度卷积神经网络生成器,得到图像修复模型;
(3)利用训练的深度卷积神经网络生成器(图像修复模型),得到修复的图像。
本发明步骤(1)中,所述多层次的深度卷积神经网络生成器,是在U-Net结构的基础上构建,去除U-Net结构的最后一个下采样层后,将其中原有的跳跃连接结构均替换为一系列空洞卷积组成的残差块网络结构。
本发明中,生成器主干网络包括:
1个输入特征提取层conv_in,其卷积核大小为7,步长为1,边缘填充大小为3,输入通道数为4,输出通道数为32;
3个下采样卷积层,分别记为conv_1,conv_2,conv_3,其卷积核大小为4,步长为2,边缘填充大小为1,输入通道数分别为32、64、128,输出通道数分别为64、128、256;
3个空洞残差块,分别记为drconv_1,drconv_2,drconv_3,分别连接在3个下采样卷积层conv_1,conv_2,conv_3之后;其中子块个数分别为16个、8个和4个,每个子块由卷积核大小为3,步长为1,边缘填充大小为2,扩张率为2,输出通道数维持不变的空洞卷积核和卷积核大小为3,步长为1,边缘填充大小为1,输出通道数维持不变的普通卷积核构成,每个子块的输出为输入经过上述卷积核得到的结果与输入的求和;
3个上采样反卷积层,分别记为deconv_1,deconv_2,deconv_3,其卷积核大小为4,步长为2,边缘填充大小为1,输入通道数分别为256、128、64,输出通道数分别为128、64、32;
2个特征通道压缩层记为conv_4,conv_5,其中conv_4的卷积核大小为3,步长为1,边缘填充大小为1,输入通道数为256,输出通道数为128;conv_5的卷积核大小为5,步长为1,边缘填充大小为2,输入通道数为128,输出通道数为64;
2个注意力机制卷积特征层att_1和att_2,分别连接在2个特征通道压缩层conv_4,conv_5之后;
1个输出卷积层conv_out,其卷积核大小为7,步长为1,边缘填充大小为3,输入通道数为32,输出通道数为3;
所述判别器中,2个注意力层分别连接在第2、第3个卷积层之后;
上述所有卷积层除输出卷积层conv_out以外均采用ReLU激活函数,输出卷积层采用Tanh激活函数。
本发明步骤(2)中,所述将部分到整体的注意力机制卷积层,分别集成到深度卷积神经网络生成器和判别器中,是将生成器或判别器网络某一层特征图M作为注意力机制卷积层的输入;具体是将整个特征图M和其中心占总大小25%左右(一般为22%-28%)的正方形区域m分别通过1×1卷积(输出通道数为输入通道数的八分之一)操作得到M_1与m_1,然后将其尺寸分别调整为N×C/8和C/8×n,其中N、n为相应的高、宽,C/8为通道数,然后进行矩阵相乘,将结果按列进行softmax运算后得到注意力图A,注意力图A的尺寸为N×n;最后,将特征图M再次通过1×1卷积(输出通道数不变)的结果M_2的尺寸调整为C×N并与注意力图A进行矩阵相乘,得到特征图F,并特征图将F的尺寸调整为C×h×w,其中h、w分别为特征图的高和宽。最后,该卷积层的输出O为:
O=M-m+αm+βF
其中,α、β为可学习的参数,初始值分别为1和0。
本发明中,网络训练所采用的损失函数共4个,分别为重构损失对抗损失感知损失和风格损失设Iinput为输入网络的待修复图像以及缺失区域掩膜,Igt为对应的真实图像,G(Iinput)为网络输出的图像,D(Iinput)为判别器的输出(输出大于1表示判别器认为输入为真,小于-1表示判别器认为输入为假),则:
其中,φi代表预训练的VGG-19网络的第i层的特征图,具体来说,指的是在ImageNet数据集上预训练的VGG-19网络中的relu1_1、relu2_1、relu3_1、relu4_1和relu5_1五个层中的特征图。
训练过程中总体损失函数为:
进一步的,网络模型的训练方法如下:
对生成器和判别器均采用Adam优化器,其中生成器的学习率为0.0001,判别器的学习率为生成器学习率大小的十分之一。每次训练同步更新生成器和判别器的网络参数,直至损失函数收敛。然后,将生成器的学习率降低至0.00001,判别器的学习率仍为其十分之一,进一步进行训练直至网络输出达到理想的效果。
本发明步骤(3)中,修复图像时,网络只需要使用生成器。
本发明的有益效果在于:本发明设计了一个基于部分到整体注意力机制的多层次图像修复方法,通过端到端的生成器网络,对中心缺失的图像进行修复。该方法合理利用了输入图像不同层次的特征,能够生成比以往修复方法更加精细的修复结果;同时,由于采用了部分到整体的注意力机制,该方法可以从背景区域中合理选择所需要的信息用来进行修复,且不会产生修复结果不连贯不合理的问题。
附图说明
图1为本发明的网络框架图。
图2为本发明的部分到整体注意力机制层示意图。
图3为本发明的修复效果图。
具体实施方式
下面对本发明实施方案进行详细说明,但是本发明的保护范围不局限于所述实施例。
采用图1所示的网络结构,用数据集Paris StreetView[5](巴黎街景数据集,共包括14900张训练图片,100张测试图片)训练该网络,获得图像修复模型。
具体步骤是:
(1)训练前,随机初始化网络参数,并将训练集中的图像大小统一调整到610×350;
(2)训练时,随机裁剪图像尺寸到256×256,并归一化到[0,1]区间内。使用Adam优化器进行模型参数更新,生成器的初始学习率为0.0001,判别器的学习率为生成器的十分之一。用小批量随机梯度下降的方法,最小化损失函数。批大小设为3。待网络收敛后,将生成器的学习率更新为0.00001,判别器的学习率更新为当前生成器学习率的十分之一,继续训练到网络重新收敛;
(3)测试时,生成一个与图像大小相同(均为256×256)的单通道缺失区域掩膜,其中用1表示背景区域,用0表示缺失区域,将其与待修复的三通道RGB格式图像按通道拼接后送入生成器,得到输出结果。将输出结果的背景区域替换成原图的背景区域,即得到最终修复结果。
本发明的图像修复定量评测结果,见表1。第一行为Contextual Attention[4](简称CA)的评测结果,第二行为本发明的评测结果,其中L1值越小越好,PSNR、SSIM值越大越好。
图3为本发明图像修复效果图,第1行为输入待修复图像,第2行为CA的修复结果,第3行为本发明的修复结果,第4行为真实图像。可以看出,本发明的修复效果更加真实,且修复区域的连续性更好。此外,从第5列图片可以看出,本发明的方法不会滥用背景区域的已知信息,生成结果更加合理。
表1本发明的修复图像定量评测结果
L1 | PSNR | SSIM | |
CA | 3.231% | 23.961 | 0.811 |
Ours | 2.988% | 24.728 | 0.818 |
。
参考文献
[1]Goodfellow I,Pouget-Abadie J,Mirza M,et al.Generative adversarialnets[C]//Advances in Neural Information Processing Systems.2014:2672-2680.
[2]Ronneberger O,Fischer P,Brox T.U-net:Convolutional networks forbiomedical image segmentation[C]//International Conference on Medical ImageComputing and Computer-assisted Intervention.Springer,Cham,2015:234-241.
[3]Yu J,Lin Z,Yang J,et al.Free-form image inpainting with gatedconvolution[C]//Proceedings of the IEEE International Conference on ComputerVision.2019:4471-4480.
[4]Yu J,Lin Z,Yang J,et al.Generative image inpainting withcontextual attention[C]//Proceedings of the IEEE Conference on ComputerVision and Pattern Recognition.2018:5505-5514.
[5]DoerschC,Singh S,Gupta A,et al.What makes Paris look like Paris?[J].ACM Transactions on Graphics,2012.。
Claims (6)
1.一种基于部分到整体注意力机制的多层次图像修复方法,其特征在于,具体步骤为:
(1)在U-Net结构的基础上构建多层次的深度卷积神经网络生成器,即去除U-Net结构的最后一个下采样层,并将其中原有的跳跃连接结构均替换为一系列空洞卷积组成的残差块网络结构;
(2)将部分到整体的注意力机制卷积层分别集成到深度卷积神经网络生成器和判别器中;训练深度卷积神经网络生成器,得到图像修复模型;
(3)利用图像修复模型,得到修复的图像。
2.根据权利要求1所述的基于部分到整体注意力机制的多层次图像修复方法,其特征在于,所构建的多层次的深度卷积神经网络生成器中:
主干网络包括:1个输入特征提取层conv_in;3个下采样卷积层,分别记为conv_1,conv_2,conv_3;3个空洞残差块,分别记为drconv_1,drconv_2,drconv_3,分别连接在3个下采样卷积层conv_1,conv_2,conv_3之后;2个特征通道压缩层,记为conv_4,conv_5;2个注意力机制卷积特征层att_1和att_2,分别连接在2个特征通道压缩层conv_4,conv_5之后;1个输出卷积层conv_out;
所述判别器中,2个注意力层分别连接在第2、第3个卷积层之后;上述所有卷积层除输出卷积层conv_out以外均采用ReLU激活函数,输出卷积层采用Tanh激活函数。
3.根据权利要求2所述的基于部分到整体注意力机制的多层次图像修复方法,其特征在于,步骤(2)中所述将部分到整体的注意力机制卷积层,分别集成到深度卷积神经网络生成器和判别器中,是将生成器或判别器网络某一层特征图M作为注意力机制卷积层的输入;具体是将整个特征图M和其中心占总大小25%左右的正方形区域m分别通过1×1卷积操作得到M_1与m_1,这里,1×1卷积输出通道数为输入通道数的八分之一;然后将其尺寸分别调整为N×C/8和C/8×n,其中N、n为相应的高、宽,C/8为通道数,然后进行矩阵相乘,将结果按列进行softmax运算后得到注意力图A,注意力图A的尺寸为N×n;最后,将特征图M再次通过1×1卷积(输出通道数不变)的结果M_2的尺寸调整为C×N并与注意力图A进行矩阵相乘,得到特征图F,并特征图将F的尺寸调整为C×h×w,其中h、w分别为特征图的高和宽;最后,该卷积层的输出O为:
O=M-m+αm+βF
其中,α、β为可学习的参数,初始值分别为1和0。
4.根据权利要求3所述的基于部分到整体注意力机制的多层次图像修复方法,其特征在于,生成器主干网络中,输入特征提取层conv_in的卷积核大小为7,步长为1,边缘填充大小为3,输入通道数为4,输出通道数为32;下采样卷积层conv_1,conv_2,conv_3的卷积核大小为4,步长为2,边缘填充大小为1,输入通道数分别为32、64、128,输出通道数分别为64、128、256;3个空洞残差块drconv_1,drconv_2,drconv_3中子块个数分别为16个、8个和4个,每个子块由卷积核大小为3,步长为1,边缘填充大小为2,扩张率为2,输出通道数维持不变的空洞卷积核和卷积核大小为3,步长为1,边缘填充大小为1,输出通道数维持不变的普通卷积核构成,每个子块的输出为输入经过上述卷积核得到的结果与输入的求和;2个特征通道压缩层conv_4,conv_5中,conv_4的卷积核大小为3,步长为1,边缘填充大小为1,输入通道数为256,输出通道数为128;conv_5的卷积核大小为5,步长为1,边缘填充大小为2,输入通道数为128,输出通道数为64;上采样反卷积层deconv_1,deconv_2,deconv_3的卷积核大小为4,步长为2,边缘填充大小为1,输入通道数分别为256、128、64,输出通道数分别为128、64、32;输出卷积层conv_out的卷积核大小为7,步长为1,边缘填充大小为3,输入通道数为32,输出通道数为3。
5.根据权利要求4所述的基于部分到整体注意力机制的多层次图像修复方法,其特征在于,训练网络所采用的损失函数共4个,分别为重构损失对抗损失感知损失和风格损失设Iinput为输入网络的待修复图像以及缺失区域掩膜,Igt为对应的真实图像,G(Iinput)为网络输出的图像,D(Iinput)为判别器的输出(输出大于1表示判别器认为输入为真,小于-1表示判别器认为输入为假),则:
其中,φi代表预训练的VGG-19网络的第i层的特征图,具体来说,指的是在ImageNet数据集上预训练的VGG-19网络中的relu1_1、relu2_1、relu3_1、relu4_1和relu5_1五个层中的特征图;
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911246343.5A CN111127346B (zh) | 2019-12-08 | 2019-12-08 | 基于部分到整体注意力机制的多层次图像修复方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911246343.5A CN111127346B (zh) | 2019-12-08 | 2019-12-08 | 基于部分到整体注意力机制的多层次图像修复方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111127346A true CN111127346A (zh) | 2020-05-08 |
CN111127346B CN111127346B (zh) | 2023-09-05 |
Family
ID=70497761
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911246343.5A Active CN111127346B (zh) | 2019-12-08 | 2019-12-08 | 基于部分到整体注意力机制的多层次图像修复方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111127346B (zh) |
Cited By (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111531546A (zh) * | 2020-05-22 | 2020-08-14 | 济南浪潮高新科技投资发展有限公司 | 一种机器人位姿估计方法、装置、设备及存储介质 |
CN111612715A (zh) * | 2020-05-20 | 2020-09-01 | 北京字节跳动网络技术有限公司 | 图像修复方法、装置和电子设备 |
CN111612714A (zh) * | 2020-05-20 | 2020-09-01 | 北京字节跳动网络技术有限公司 | 图像修复方法、装置和电子设备 |
CN111696168A (zh) * | 2020-06-13 | 2020-09-22 | 中北大学 | 基于残差自注意力图像增强的高倍速采mri重建方法 |
CN111918144A (zh) * | 2020-08-12 | 2020-11-10 | 桂林电子科技大学 | 一种基于深度学习的去除视频水印的方法 |
CN111915591A (zh) * | 2020-08-03 | 2020-11-10 | 中国海洋大学 | 一种用于高质量图像外推的螺旋生成网络 |
CN111915522A (zh) * | 2020-07-31 | 2020-11-10 | 天津中科智能识别产业技术研究院有限公司 | 一种基于注意力机制的图像修复方法 |
CN112184582A (zh) * | 2020-09-28 | 2021-01-05 | 中科人工智能创新技术研究院(青岛)有限公司 | 一种基于注意力机制的图像补全方法及装置 |
CN112288738A (zh) * | 2020-11-18 | 2021-01-29 | 新疆大学 | 基于深度学习的单幅图像去雪花方法、装置及存储介质 |
CN112365422A (zh) * | 2020-11-17 | 2021-02-12 | 重庆邮电大学 | 基于深层聚合网络的不规则缺失图像修复方法及其系统 |
CN112488942A (zh) * | 2020-12-02 | 2021-03-12 | 北京字跳网络技术有限公司 | 修复图像的方法、装置、设备和计算机可读介质 |
CN112508800A (zh) * | 2020-10-20 | 2021-03-16 | 杭州电子科技大学 | 一种基于注意力机制的单张灰度图像的金属零件表面高光去除方法 |
CN112669284A (zh) * | 2020-12-29 | 2021-04-16 | 天津大学 | 一种利用生成对抗网络来实现肺结节检测的方法 |
CN112686816A (zh) * | 2020-12-25 | 2021-04-20 | 天津中科智能识别产业技术研究院有限公司 | 一种基于内容注意力机制和掩码先验的图像补全方法 |
CN112837329A (zh) * | 2021-03-01 | 2021-05-25 | 西北民族大学 | 一种藏文古籍文档图像二值化方法及系统 |
CN112884669A (zh) * | 2021-02-25 | 2021-06-01 | 电子科技大学 | 基于多尺度内容注意力机制的图像修复方法、存储介质和终端 |
CN113313102A (zh) * | 2021-08-02 | 2021-08-27 | 南京天朗防务科技有限公司 | 基于变种差分进化算法的随机共振混沌小信号检测方法 |
CN113393371A (zh) * | 2021-06-28 | 2021-09-14 | 北京百度网讯科技有限公司 | 一种图像处理方法、装置及电子设备 |
CN113643196A (zh) * | 2021-07-12 | 2021-11-12 | 浙江工业大学 | 一种基于注意力机制的递归推理图像修复方法 |
WO2021227915A1 (zh) * | 2020-05-09 | 2021-11-18 | 深圳市中兴微电子技术有限公司 | 图像恢复模型的训练方法及装置、电子设备,及计算机可读存储介质 |
CN113674176A (zh) * | 2021-08-23 | 2021-11-19 | 北京市商汤科技开发有限公司 | 图像修复方法及装置、电子设备和存储介质 |
CN113793286A (zh) * | 2021-11-18 | 2021-12-14 | 成都索贝数码科技股份有限公司 | 一种基于多阶注意力神经网络的媒体图像水印移除方法 |
CN114022506A (zh) * | 2021-11-16 | 2022-02-08 | 天津大学 | 一种边缘先验融合多头注意力机制的图像修复方法 |
CN114359062A (zh) * | 2021-12-03 | 2022-04-15 | 华南理工大学 | 基于阶梯流特征融合的图像修复方法、系统及存储介质 |
CN114627006A (zh) * | 2022-02-28 | 2022-06-14 | 复旦大学 | 一种基于深度解耦网络的渐进式图像修复方法 |
CN114998683A (zh) * | 2022-06-01 | 2022-09-02 | 北京理工大学 | 一种基于注意力机制的ToF多径干扰去除方法 |
CN116739951A (zh) * | 2023-07-20 | 2023-09-12 | 苏州铸正机器人有限公司 | 一种图像生成器、图像风格转换装置及方法 |
CN117094919A (zh) * | 2023-10-20 | 2023-11-21 | 中国传媒大学 | 基于扩散模型的壁画数字化修复系统及方法 |
CN114998683B (zh) * | 2022-06-01 | 2024-05-31 | 北京理工大学 | 一种基于注意力机制的ToF多径干扰去除方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105518743A (zh) * | 2013-03-13 | 2016-04-20 | 微软技术许可有限责任公司 | 深度图像的处理 |
WO2017031356A1 (en) * | 2015-08-19 | 2017-02-23 | D-Wave Systems Inc. | Discrete variational auto-encoder systems and methods for machine learning using adiabatic quantum computers |
WO2018028255A1 (zh) * | 2016-08-11 | 2018-02-15 | 深圳市未来媒体技术研究院 | 基于对抗网络的图像显著性检测方法 |
CN109712203A (zh) * | 2018-12-29 | 2019-05-03 | 福建帝视信息科技有限公司 | 一种基于自注意力生成对抗网络的图像着色方法 |
-
2019
- 2019-12-08 CN CN201911246343.5A patent/CN111127346B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105518743A (zh) * | 2013-03-13 | 2016-04-20 | 微软技术许可有限责任公司 | 深度图像的处理 |
WO2017031356A1 (en) * | 2015-08-19 | 2017-02-23 | D-Wave Systems Inc. | Discrete variational auto-encoder systems and methods for machine learning using adiabatic quantum computers |
WO2018028255A1 (zh) * | 2016-08-11 | 2018-02-15 | 深圳市未来媒体技术研究院 | 基于对抗网络的图像显著性检测方法 |
CN109712203A (zh) * | 2018-12-29 | 2019-05-03 | 福建帝视信息科技有限公司 | 一种基于自注意力生成对抗网络的图像着色方法 |
Non-Patent Citations (2)
Title |
---|
刘云鹏;蔡文立;洪国斌;王仁芳;金冉;: "应用图像块和全卷积神经网络的肩关节MRI自动分割", 中国图象图形学报 * |
陈俊周;王娟;龚勋;: "基于级联生成对抗网络的人脸图像修复", 电子科技大学学报 * |
Cited By (45)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021227915A1 (zh) * | 2020-05-09 | 2021-11-18 | 深圳市中兴微电子技术有限公司 | 图像恢复模型的训练方法及装置、电子设备,及计算机可读存储介质 |
CN111612715B (zh) * | 2020-05-20 | 2022-09-23 | 北京字节跳动网络技术有限公司 | 图像修复方法、装置和电子设备 |
CN111612715A (zh) * | 2020-05-20 | 2020-09-01 | 北京字节跳动网络技术有限公司 | 图像修复方法、装置和电子设备 |
CN111612714A (zh) * | 2020-05-20 | 2020-09-01 | 北京字节跳动网络技术有限公司 | 图像修复方法、装置和电子设备 |
CN111612714B (zh) * | 2020-05-20 | 2022-11-15 | 北京字节跳动网络技术有限公司 | 图像修复方法、装置和电子设备 |
CN111531546A (zh) * | 2020-05-22 | 2020-08-14 | 济南浪潮高新科技投资发展有限公司 | 一种机器人位姿估计方法、装置、设备及存储介质 |
CN111696168A (zh) * | 2020-06-13 | 2020-09-22 | 中北大学 | 基于残差自注意力图像增强的高倍速采mri重建方法 |
CN111696168B (zh) * | 2020-06-13 | 2022-08-23 | 中北大学 | 基于残差自注意力图像增强的高倍速采mri重建方法 |
CN111915522A (zh) * | 2020-07-31 | 2020-11-10 | 天津中科智能识别产业技术研究院有限公司 | 一种基于注意力机制的图像修复方法 |
CN111915591A (zh) * | 2020-08-03 | 2020-11-10 | 中国海洋大学 | 一种用于高质量图像外推的螺旋生成网络 |
CN111915591B (zh) * | 2020-08-03 | 2022-03-22 | 中国海洋大学 | 一种基于螺旋生成网络的高质量图像外推系统 |
CN111918144A (zh) * | 2020-08-12 | 2020-11-10 | 桂林电子科技大学 | 一种基于深度学习的去除视频水印的方法 |
CN112184582B (zh) * | 2020-09-28 | 2022-08-19 | 中科人工智能创新技术研究院(青岛)有限公司 | 一种基于注意力机制的图像补全方法及装置 |
CN112184582A (zh) * | 2020-09-28 | 2021-01-05 | 中科人工智能创新技术研究院(青岛)有限公司 | 一种基于注意力机制的图像补全方法及装置 |
CN112508800A (zh) * | 2020-10-20 | 2021-03-16 | 杭州电子科技大学 | 一种基于注意力机制的单张灰度图像的金属零件表面高光去除方法 |
CN112365422A (zh) * | 2020-11-17 | 2021-02-12 | 重庆邮电大学 | 基于深层聚合网络的不规则缺失图像修复方法及其系统 |
CN112365422B (zh) * | 2020-11-17 | 2023-02-28 | 重庆邮电大学 | 基于深层聚合网络的不规则缺失图像修复方法及其系统 |
CN112288738A (zh) * | 2020-11-18 | 2021-01-29 | 新疆大学 | 基于深度学习的单幅图像去雪花方法、装置及存储介质 |
CN112488942A (zh) * | 2020-12-02 | 2021-03-12 | 北京字跳网络技术有限公司 | 修复图像的方法、装置、设备和计算机可读介质 |
CN112686816A (zh) * | 2020-12-25 | 2021-04-20 | 天津中科智能识别产业技术研究院有限公司 | 一种基于内容注意力机制和掩码先验的图像补全方法 |
CN112669284A (zh) * | 2020-12-29 | 2021-04-16 | 天津大学 | 一种利用生成对抗网络来实现肺结节检测的方法 |
CN112884669A (zh) * | 2021-02-25 | 2021-06-01 | 电子科技大学 | 基于多尺度内容注意力机制的图像修复方法、存储介质和终端 |
CN112837329A (zh) * | 2021-03-01 | 2021-05-25 | 西北民族大学 | 一种藏文古籍文档图像二值化方法及系统 |
CN112837329B (zh) * | 2021-03-01 | 2022-07-19 | 西北民族大学 | 一种藏文古籍文档图像二值化方法及系统 |
CN113393371A (zh) * | 2021-06-28 | 2021-09-14 | 北京百度网讯科技有限公司 | 一种图像处理方法、装置及电子设备 |
CN113393371B (zh) * | 2021-06-28 | 2024-02-27 | 北京百度网讯科技有限公司 | 一种图像处理方法、装置及电子设备 |
CN113643196A (zh) * | 2021-07-12 | 2021-11-12 | 浙江工业大学 | 一种基于注意力机制的递归推理图像修复方法 |
CN113643196B (zh) * | 2021-07-12 | 2024-02-06 | 浙江工业大学 | 一种基于注意力机制的递归推理图像修复方法 |
CN113313102A (zh) * | 2021-08-02 | 2021-08-27 | 南京天朗防务科技有限公司 | 基于变种差分进化算法的随机共振混沌小信号检测方法 |
CN113313102B (zh) * | 2021-08-02 | 2021-11-05 | 南京天朗防务科技有限公司 | 基于变种差分进化算法的随机共振混沌小信号检测方法 |
CN113674176B (zh) * | 2021-08-23 | 2024-04-16 | 北京市商汤科技开发有限公司 | 图像修复方法及装置、电子设备和存储介质 |
CN113674176A (zh) * | 2021-08-23 | 2021-11-19 | 北京市商汤科技开发有限公司 | 图像修复方法及装置、电子设备和存储介质 |
CN114022506B (zh) * | 2021-11-16 | 2024-05-17 | 天津大学 | 一种边缘先验融合多头注意力机制的图像修复方法 |
CN114022506A (zh) * | 2021-11-16 | 2022-02-08 | 天津大学 | 一种边缘先验融合多头注意力机制的图像修复方法 |
CN113793286A (zh) * | 2021-11-18 | 2021-12-14 | 成都索贝数码科技股份有限公司 | 一种基于多阶注意力神经网络的媒体图像水印移除方法 |
CN114359062B (zh) * | 2021-12-03 | 2024-05-14 | 华南理工大学 | 基于阶梯流特征融合的图像修复方法、系统及存储介质 |
CN114359062A (zh) * | 2021-12-03 | 2022-04-15 | 华南理工大学 | 基于阶梯流特征融合的图像修复方法、系统及存储介质 |
CN114627006B (zh) * | 2022-02-28 | 2022-12-20 | 复旦大学 | 一种基于深度解耦网络的渐进式图像修复方法 |
CN114627006A (zh) * | 2022-02-28 | 2022-06-14 | 复旦大学 | 一种基于深度解耦网络的渐进式图像修复方法 |
CN114998683A (zh) * | 2022-06-01 | 2022-09-02 | 北京理工大学 | 一种基于注意力机制的ToF多径干扰去除方法 |
CN114998683B (zh) * | 2022-06-01 | 2024-05-31 | 北京理工大学 | 一种基于注意力机制的ToF多径干扰去除方法 |
CN116739951A (zh) * | 2023-07-20 | 2023-09-12 | 苏州铸正机器人有限公司 | 一种图像生成器、图像风格转换装置及方法 |
CN116739951B (zh) * | 2023-07-20 | 2024-03-05 | 苏州铸正机器人有限公司 | 一种图像生成器、图像风格转换装置及方法 |
CN117094919A (zh) * | 2023-10-20 | 2023-11-21 | 中国传媒大学 | 基于扩散模型的壁画数字化修复系统及方法 |
CN117094919B (zh) * | 2023-10-20 | 2023-12-15 | 中国传媒大学 | 基于扩散模型的壁画数字化修复系统及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111127346B (zh) | 2023-09-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111127346B (zh) | 基于部分到整体注意力机制的多层次图像修复方法 | |
Zhang et al. | Semantic image inpainting with progressive generative networks | |
CN111784602B (zh) | 一种生成对抗网络用于图像修复的方法 | |
CN109087258B (zh) | 一种基于深度学习的图像去雨方法及装置 | |
CN107403415B (zh) | 基于全卷积神经网络的压缩深度图质量增强方法及装置 | |
CN111539887B (zh) | 一种基于混合卷积的通道注意力机制和分层学习的神经网络图像去雾方法 | |
CN109903236B (zh) | 基于vae-gan与相似块搜索的人脸图像修复方法及装置 | |
CN111986075B (zh) | 一种目标边缘清晰化的风格迁移方法 | |
CN111161360A (zh) | 基于Retinex理论的端到端网络的图像去雾方法 | |
CN112967218B (zh) | 一种基于线框和边缘结构的多尺度图像修复系统 | |
CN110895795A (zh) | 改进的语义图像修补模型方法 | |
WO2023212997A1 (zh) | 基于知识蒸馏的神经网络训练方法、设备及存储介质 | |
CN112767283A (zh) | 一种基于多图像块划分的非均匀图像去雾方法 | |
CN112184582B (zh) | 一种基于注意力机制的图像补全方法及装置 | |
Liu et al. | Facial image inpainting using multi-level generative network | |
CN111260585A (zh) | 基于类凸集投影算法的图像恢复方法 | |
CN113034388B (zh) | 一种古代绘画虚拟修复方法及修复模型的构建方法 | |
CN112686817B (zh) | 一种基于不确定性估计的图像补全方法 | |
CN116523985B (zh) | 一种结构和纹理特征引导的双编码器图像修复方法 | |
CN116385289B (zh) | 一种基于渐进式的碑文文字图像修复模型及修复方法 | |
CN113096133A (zh) | 一种基于注意力机制的语义分割网络的构建方法 | |
Yu et al. | MagConv: Mask-guided convolution for image inpainting | |
CN117237641A (zh) | 一种基于双分支特征融合网络的息肉分割方法及系统 | |
CN115908205A (zh) | 图像修复方法、装置、电子设备和存储介质 | |
CN116681631A (zh) | 基于对偶网络的低质量胶片图像修复增强方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |