CN113592715A - 一种面向小样本图像集的超分辨率图像重构方法 - Google Patents

一种面向小样本图像集的超分辨率图像重构方法 Download PDF

Info

Publication number
CN113592715A
CN113592715A CN202110898675.2A CN202110898675A CN113592715A CN 113592715 A CN113592715 A CN 113592715A CN 202110898675 A CN202110898675 A CN 202110898675A CN 113592715 A CN113592715 A CN 113592715A
Authority
CN
China
Prior art keywords
image
layer
generator
training
discriminator
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110898675.2A
Other languages
English (en)
Other versions
CN113592715B (zh
Inventor
王蒙
李鑫凯
王强
陈家兴
邵逸轩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kunming University of Science and Technology
Original Assignee
Kunming University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kunming University of Science and Technology filed Critical Kunming University of Science and Technology
Priority to CN202110898675.2A priority Critical patent/CN113592715B/zh
Publication of CN113592715A publication Critical patent/CN113592715A/zh
Application granted granted Critical
Publication of CN113592715B publication Critical patent/CN113592715B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4053Scaling of whole images or parts thereof, e.g. expanding or contracting based on super-resolution, i.e. the output image resolution being higher than the sensor resolution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Linguistics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明涉及一种面向小样本图像集的超分辨率图像重构方法,属于人工智能、计算机视觉领域。本发明结合了生成对抗学习、小样本图像训练、金字塔GAN和超分辨率重构的图像生成方法,包括基于残差网络的生成网络模块、金字塔对抗学习网络、生成样本的上下采样模块。其中,金字塔对抗学习网络由多层不同尺度训练的GAN组成,上一层的输出在上采样之后作为下一层的输入之一进行训练。生成对抗网络以卷积神经网络为基础的残差神经网络,可加深训练网络,同时稳定训练收敛。本发明着眼于小样本学习在超分辨率场景下的应用,提高了在训练图像稀缺情况下获得超分辨率图像的清晰度,减少了训练时间和训练样本的数量,使重构图像质量得到了提升和保证。

Description

一种面向小样本图像集的超分辨率图像重构方法
技术领域
本发明涉及一种面向小样本图像集的超分辨率图像重构方法,具体设计是一种基于小样本图像的GAN金字塔结构训练的超分辨率学习方法,属于人工智能、计算机视觉领域。
背景技术
在计算机视觉领域中,大致分为两个主要方向,分别是图像识别和图像生成。图像识别在日常生活中的使用非常普遍,现如今人们最常使用的人脸支付就是其中一种应用。图像生成的应用领域也非常广,例如可以将模糊图像进行放大并使得其细节变清晰的超分辨率,或者让一个图像可以平滑的改变风格的风格迁移等。
在多年来的计算机视觉研究中,卷积神经网络和残差网络已经得到了广泛的研究,并已用于提高现代深度神经网络的性能。事实证明,卷积神经网络和残差网络在提升深度神经网络的学习效率和学习精度上有很好的效果,提升了多种场景应用的效果,例如图像分类和超分辨率。
在2014年Goodfellow等人提出了生成对抗学习网络GAN,让图像生成这一任务方向取得了显著进展,但仍存在许多未解决的问题,比如原始的GAN模型训练容易遇到梯度爆炸和图像细节学习不足等问题。之后有人提出将卷积神经网络CNN加入到GAN中,组成了深度卷积生成对抗网络DCGAN,目前来看这种尝试非常成功,解决了GAN梯度爆炸等问题。然而,通过仔细检查这些生成的样本,尽管先进的ImageNet GAN模型擅长在结构约束较少的情况下生成图像类别(例如,海洋、天空和景观类别,这些类别更多地通过纹理而不是几何结构来区分),它无法捕捉某些类别中持续出现的几何或结构模式,这就使得它难以进行复杂的超分辨率任务。
生成对抗网络包括两种模型,分别是生成器G和判别器D,它们的训练同时进行:通过训练D使训练样本和来自G的样本的正确标签的概率最大化;同时通过最小化log(1-D(G(z)))来调整生成器G的参数。
Christian Ledig等人在2017年首次提出将残差网络融入到GAN中来加强模型的学习效率,残差网络的思想是将原来的输入加到经过卷积操作后的输出上,这样可以稳定训练,保证网络不会丢失原先已经学习到的细节,同时也让网络的学习深度有了较大的提升,使网络的学习精度有了长足的进步。Christian Ledig等人同时提出将这种新型的网络运用到超分辨率(Super-Resolution,SR)的场景当中,在这之前SR的任务的效果都难以满足人们的要求,而这篇论文的结果直接获得了sota(state of the art)。
不过这个方法面向的是拥有较多数据集的情况下,它在小样本场景下的生成效果并不令人满意。
发明内容
本发明的目的是针对上述已有技术存在的不足和缺陷,在小样本图像集实现超分辨率的任务中,提供了一种面向小样本图像集的超分辨率图像重构方法。
本发明采用的技术方案是:一种面向小样本图像集的超分辨率图像重构方法,本发明面向的对象是小样本图像集、本发明使用多层GAN组成的串行金字塔结构来训练;
金字塔GAN中包括多尺度生成模块和多尺度判别模块,其中生成器使用的是以卷积神经网络为基础的残差神经网络;
多尺度生成模块,包括多层的样本空间生成器GN~G0
多尺度鉴别模块,包括多层的样本空间判别器DN~D0
在基础的生成对抗学习模型的前提下,基于卷积神经网络并融合残差网络的新型GAN在对待超分辨率这一任务时表现出了较好的效果。这种新型的GAN保证了模型对图像学习的稳定性,保证模型不会出现梯度爆炸的现象,同时还降低了模型训练的时间,大大提升了模型的性能。
通过结合上述的方法,提出一种串行的多尺度GAN金字塔训练结构,这个结构根据不同尺度对应的不同尺寸就行对应的学习,上一个尺寸的图像训练完成才进行下一层的训练,将上一层的输出上采样后作为下一层的输入进行学习。这个结构提高了模型对图像细节的学习精度,让模型非常适合小样本领域,同时也非常适用于超分辨率这一训练场景。
整体的方法架构如图1所示,整体的训练用公式表示为:
Figure BDA0003198974650000021
其中,
Figure BDA0003198974650000031
为金字塔GAN中每一层生成器Gn的输出图像,Gn()表示生成器的生成过程,zn表示高斯噪声,
Figure BDA0003198974650000032
表示上一层输出图像的上采样。因为第N层没有上一层的输出,所以这一层的输入只有高斯噪声zN,具体公式如下:
Figure BDA0003198974650000033
其中,
Figure BDA0003198974650000034
为金字塔GAN中第N层生成器GN的输出图像,GN()表示生成器生成过程,zN表示高斯噪声。
上述的公式再细化可以得到以下公式:
Figure BDA0003198974650000035
其中,
Figure BDA0003198974650000036
为金字塔GAN中每一层生成器Gn的输出图像,
Figure BDA0003198974650000037
表示上一层GAN输出图像的上采样,ψn()表示由5个Conv(3×3)-BatchNorm-LeakyReLU卷积块组成的完全卷积网络。在训练阶段的最低尺度中,每个卷积块包括32个卷积核,每经过4个尺度,卷积核的数量翻倍。因为生成器是完全卷积的,所以可以在测试时生成任意大小和纵横比的图像(通过改变噪声图的维度)。
上述方法的具体步骤如下:
(1)在训练开始阶段,先对图像进行预处理,选择一个特定的比例1/r把原始的真实图像进行N次迭代下采样,下采样使用求像素均值的方法。得到迭代后的共N+1个尺度的图像,将这N+1个尺度图像保存为I0~IN,I0是原始图像,IN是N次下采样后尺寸最小的图像,这些图像将作为各级判别器的输入。
(2)图像预处理过后,开始第N层的GAN(生成对抗网络)学习,第N层生成器GN的输入为一个和IN尺寸相同的高斯噪声图像zN,之后第N层生成器GN通过学习后生成质量较低的图像
Figure BDA0003198974650000038
再把图像
Figure BDA0003198974650000039
和步骤(1)中得到的下采样后的真实图像IN作为第N层判别器的输入,判别器判别后促使生成器改进生成效果,不断的更新生成图像,使最后的生成图像更接近于输入的真实图像IN,本层训练结束得到更新完成后质量最高的生成图像
Figure BDA00031989746500000310
(3)下面开始第N-1层GAN的训练,在第N层GAN训练完毕后,将该层的输出图像
Figure BDA00031989746500000311
用双线性插值法进行比例为r的上采样,将得到的图像
Figure BDA00031989746500000312
和相同尺寸的高斯噪声图像zN-1作为生成器GN-1的输入进行学习,然后得到生成的质量较低的图像
Figure BDA00031989746500000313
然后把
Figure BDA00031989746500000314
和真实图像IN-1作为判别器DN-1的输入进行判别,和GN-1进行对抗,最后得到更新完成后质量较高的生成图像
Figure BDA00031989746500000315
(4)迭代的运行步骤(3),对每一个尺度的图像都进行训练,到第0层训练完成后结束迭代,这时我们就得到了包括最小尺度的GN到最大尺度的G0共N+1个尺度的生成器,这时代表本模型的训练阶段结束。
(5)训练阶段结束后,并不能立即进行超分辨率操作。在进行实际的测试时,会对输入图像进行二次训练。二次训练的过程和一次训练的类似,不过训练尺度不同,都是先运行步骤(1)和(2),然后迭代的运行步骤(3)(4),直到训练结束。
(6)二次训练结束后,得到训练好的生成器G0,通过G0生成超分辨率重构后的图像,在本发明中,设置生成超分辨率的倍数为4倍,所以最后生成的图像是放大四倍并且细节更清晰的图像。
在步骤(2)(3)中判别器返回的损失定义为两个部分,分别是对抗损失和重构损失。对抗损失就是生成器G和判别器D的基于代价函数L(G,D)的极大极小博弈的训练过程,这里用
Figure BDA0003198974650000041
来表示。重构损失是指图像在经过生成器G中的卷积或反卷积等操作时,会损失一些图像精度,这里用αLrec(G)来表示,其中α表示的是残差网络中规定的学习率。
把上述的损失函数加在一起,就构成了每一层GAN中的损失函数,可以得到以下的计算公式为:
Figure BDA0003198974650000042
其中,
Figure BDA0003198974650000043
表示的是每一层GAN中的生成器Gn和判别器Dn在进行基于函数Ladv(G,D)的极大极小博弈,这个函数实际上是通过计算均方误差来得到的,αLrec(Gn)中α是残差网络中规定的学习率,Lrec(Gn)表示的是生成器Gn在生成过程中的损失,具体计算公式如下:
Figure BDA0003198974650000044
其中,
Figure BDA0003198974650000045
表示的是上一层的输出
Figure BDA0003198974650000046
进行比例为r的上采样,
Figure BDA0003198974650000047
表示生成器Gn的生成结果,In是这一层的真实图像,||||2表示的是||||中的公式取范数后平方。因为金字塔的第N层的输入只有高斯噪声zN,所以这一层Lrec(GN)计算公式为:
Lrec=‖GN(zN)-IN2
其中,GN(zN)表示的是第一层生成器GN的生成结果,zN表示的是第N的输入噪声,IN是这一层的真实图像,||||2表示的是||||中的公式取范数后平方。
进一步地,步骤(2)、(3)中所述的GAN模型是由生成器G0-N和判别器D0-N组成,其架构详见图2、3。具体运行步骤包括:
(2.1)生成器Gn的输入为高斯噪声zn和上一层输出的上采样
Figure BDA0003198974650000051
(2.2)根据残差网络的思想,在生成器Gn中要进行多次迭代,如图2所示,图中的Conv层表示每次迭代操作,每次迭代包括卷积层Conv,归一化层BN和激活层ReLU。对生成器Gn的输入进行迭代,每隔5次迭代后得到一个张量,然后将得到的张量以一定比例和输入图像
Figure BDA0003198974650000052
所表示的张量相加,得到最终的张量,然后再将这个张量转化成图像作为生成器Gn的输出
Figure BDA0003198974650000053
(2.3)通过步骤(2.2)得到生成器Gn的输出图像
Figure BDA0003198974650000054
再结合真实图像In组成判别器Dn的输入,之后判别器Dn的结构和生成器Gn类似,如图3所示,不过在5个Conv卷积层后会有一个全连接层(Dense),这个层是根据权重来分类的,Dense全连接层后跟一个ReLU激活函数,然后再跟一个Dense全连接层,最后是一个Sigmoid激活层,这个层的作用是用来实现前向或后向的计算。判别器Dn的作用是判断
Figure BDA0003198974650000055
和真实图像In是否相近,如果相差较大的话判别器Dn会返回一个损失函数,并促使生成器Gn重新生成,直到生成的结果可以通过判别器。
本发明的有益效果是:提出了一种新型的GAN金字塔结构,并且结合以卷积神经网络的残差网络为基础组成的新型GAN。首先,本发明增强了模型训练的稳定性,大大降低了出现梯度爆炸情况的概率。第二,本发明加深了模型网络的可训练深度,这使得网络对图像细节的学习有了极大的进步。第三,GAN金字塔结构串行训练,每一层对应不同的尺度和尺寸,从小到大依次训练,上一层输出的上采样作为下一层的输入,串联起各层的训练。这个设计大大提高模型对每张图像的学习效果。最后,通过上述的设计,本发明适用于很多小样本图像乃至单图像领域的任务,本发明选取小样本图像领域的超分辨率这一具有挑战的任务,取得了较好的效果。
附图说明
图1是基于小样本图像的GAN金字塔结构训练的超分辨率学习方法框架图;
图2是GAN金字塔中每层GAN的生成器Gn的结构图;
图3是GAN金字塔中每层GAN的判别器Dn的结构图;
图4是本发明与其他先进的对抗学习网络以小样本中一张图片为例所做的对比实验结果。
具体实施方式
下面结合附图和在小样本数据集上的训练对发明内容作进一步说明。
实施例1:如图1-4所示,一种面向小样本图像集的超分辨率图像重构方法,本发明使用多层GAN组成的串行金字塔结构来训练;
本发明在训练前会进行图像的预处理,会将原始的输入图片进行N次的下采样,原始图像记为I0,第一次下采样得到的图像记为I1,以此类推,最后一次下采样得到的图像记为IN
在多层GAN组成的串行金字塔结构中,每一层代表一个尺度,每一个尺度运用不同尺寸的图像进行训练,分别对应上述图像预处理的结果I0~N
训练时从最小的尺度IN开始,所以把第N层GAN中的生成器记为GN,判别器记为DN,训练完毕后将得到的输出
Figure BDA0003198974650000063
用双线性插值法进行上采样,,之后把上采样得到的图像作为第N-1层GAN的输入。这个过程以此类推,最后一层,也就是第0层GAN使用的尺度就是I0,故这一层的生成器记为G0,判别器记为D0,具体流程可以参考图1。
在多层GAN组成的串行金字塔结构中,包括多尺度生成模块和多尺度鉴别模块,其中生成器使用的是以卷积神经网络为基础的残差神经网络;
多尺度生成模块,包括多层的样本空间生成器GN~G0
多尺度鉴别模块,包括多层的样本空间判别器DN~D0
所述方法的网络结构如图1所示,具体运行步骤如下:
(1)在训练开始阶段,先对图像进行预处理,选择一个特定的比例1/r把原始的真实图像进行N次迭代下采样,下采样使用求像素均值的方法。得到迭代后的共N+1个尺度的图像,将这N+1个尺度图像保存为I0~IN,I0是原始图像,IN是N次下采样后尺寸最小的图像,这些图像将作为各级判别器的输入。
(2)图像预处理过后,开始第N层的GAN(生成对抗网络)学习,第N层生成器GN的输入为一个和IN尺寸相同的高斯噪声图像zN,之后第N层生成器GN通过学习后生成质量较低的图像
Figure BDA0003198974650000061
再把图像
Figure BDA0003198974650000062
和步骤(1)中得到的下采样后的真实图像IN作为第N层判别器的输入,判别器判别后促使生成器改进生成效果,不断的更新生成图像,使最后的生成图像更接近于输入的真实图像IN,本层训练结束得到更新完成后质量最高的生成图像
Figure BDA0003198974650000071
(3)下面开始第N-1层GAN的训练,在第N层GAN训练完毕后,将该层的输出图像
Figure BDA0003198974650000072
用双线性插值法进行比例为r的上采样,将得到的图像
Figure BDA0003198974650000073
和相同尺寸的高斯噪声图像zN-1作为生成器GN-1的输入进行学习,然后得到生成的质量较低的图像
Figure BDA0003198974650000074
然后把
Figure BDA0003198974650000075
和真实图像IN-1作为判别器DN-1的输入进行判别,和GN-1进行对抗,最后得到更新完成后质量较高的生成图像
Figure BDA0003198974650000076
(4)迭代的运行步骤(3),对每一个尺度的图像都进行训练,到第0层训练完成后结束迭代,这时我们就得到了包括最小尺度的GN到最大尺度的G0共N+1个尺度的生成器,这时代表本模型的训练阶段结束。
(5)训练阶段结束后,并不能立即进行超分辨率操作。在进行实际的测试时,会对输入图像进行二次训练。二次训练的过程和一次训练的类似,不过训练尺度不同,都是先运行步骤(1)和(2),然后迭代的运行步骤(3)(4),直到训练结束。
(6)二次训练结束后,得到训练好的生成器G0,通过G0生成超分辨率重构后的图像,在本发明中,设置生成超分辨率的倍数为4倍,所以最后生成的图像是放大四倍并且细节更清晰的图像。
对步骤(2)、(3)进行详细讨论,其具体运行步骤包括:
(2.1)生成器Gn的输入为高斯噪声zn和上一层输出的上采样
Figure BDA0003198974650000077
(2.2)根据残差网络的思想,在生成器Gn中要进行多次迭代,如图2所示,图中的Conv层表示每次迭代操作,每次迭代包括卷积层Conv,归一化层BN和激活层ReLU。对生成器Gn的输入进行迭代,每隔5次迭代后得到一个张量,然后将得到的张量以一定比例和输入图像
Figure BDA0003198974650000078
所表示的张量相加,得到最终的张量,然后再将这个张量转化成图像作为生成器Gn的输出
Figure BDA0003198974650000079
(2.3)通过步骤(2.2)得到生成器Gn的输出图像
Figure BDA00031989746500000710
再结合真实图像In组成判别器Dn的输入,之后判别器Dn的结构和生成器Gn类似,如图3所示,不过在5个Conv卷积层后会有一个全连接层(Dense),这个层是根据权重来分类的,Dense全连接层后跟一个ReLU激活函数,然后再跟一个Dense全连接层,最后是一个Sigmoid激活层,这个层的作用是用来实现前向或后向的计算。判别器Dn的作用是判断
Figure BDA0003198974650000081
和真实图像In是否相近,如果相差较大的话判别器Dn会返回一个损失函数,并促使生成器Gn重新生成,直到生成的结果可以通过判别器。
本发明有着广泛的应用领域,不止可以应用在超分辨率这一任务上,在其他很多图像生成范围内的热门任务都可以使用,例如风格迁移、图像填充、Paint-to-Image、图像融合等。本发明着眼于小样本领域,针对小样本图像领域存在的数据集不充足和图像信息缺失等问题进行解决,大大提高了小样本图像乃至单图像领域的超分辨率任务的生成效果,在基础图像稀缺的情况下得到可以满足人们要求的超分辨率图像。
本发明实验过程中,使用系统Ubuntu 18.04,采用硬件CPU为AMD Ryzen52600SiI-Core Processor 3.85GHz,编程语言为Python 3.6,显卡为英伟达GeForce RTI2070,深度学习框架为Pytorch 1.4。所用数据集为小样本模糊数据集BSD100,图片都是清晰图片经过模糊处理后得到的,分辨率集中在80×80像素到120×120像素之间。本发明与其他先进的对抗学习网络以此数据集为例所做的对比实验结果如图4,对比实验结果评估参数如下表:
模型 RMSE NIQE
EDSR 12.29 6.50
DIP 13.82 6.35
ZSSP 13.08 7.13
本发明 16.22 3.71
其中:RMSE为Root Mean Squared Error,是均方误差的意思,在这里用于评估生成图像的质量,数值越大越好;NIQE为Natural image quality evaluator,用于评估生成图像和原始图像的失真程度,数值越小越好。
综上所述,根据本发明实施的一种基于小样本图像的GAN金字塔结构训练的超分辨率学习方法,是一种使用新型的以卷积神经网络为基础的残差网络组成的生成对抗网络(GAN),利用这种新型GAN构建一个存在多个尺度的GAN金字塔结构。与之前的方法不同,本发明采用不同尺度串行训练的结构,上一层的输出上采样后作为下一层的输入进行训练,这样的结构让不同的尺度的训练可以有机的联系起来,不再是毫无联系的并行训练,加强了模型对每张图像的学习效果,进一步增强了图像的细节生成效果,在数据集较少的情况下取得了令人满意的效果。
本发明着眼于小样本学习在超分辨率场景下的应用,提高了在训练图像稀缺情况下获得超分辨率图像的清晰度,减少了训练时间和训练样本的数量,使重构图像质量得到了提升和保证。本发明的实际应用价值很高,比如追查犯罪嫌疑人时,原来的图片不够清晰且数量很少,这时可以用本发明生成高像素的清晰图片,还可以用于老照片清晰度提升等场景。
上面结合附图对本发明的具体实施方式做了详细说明,但是本发明并不局限于上述实施方式,在进行不同任务场景的开发时,可以对本发明进行一定的改进,根据不同任务侧重点的不同来设计模型的结构,或者选择不同的训练尺度来调整图像学习的效率。

Claims (4)

1.一种面向小样本图像集的超分辨率图像重构方法,其特征在于:面向的对象是小样本图像集、使用多层GAN组成的串行金字塔结构来训练;
金字塔GAN中包括多尺度生成模块和多尺度判别模块,其中生成器使用的是以卷积神经网络为基础的残差神经网络;
多尺度生成模块,包括多层的样本空间生成器GN~G0
多尺度判别模块,包括多层的样本空间判别器DN~D0
所述方法的具体步骤如下:
(1)在训练开始阶段,先对图像进行预处理,选择一个特定的比例1/r把原始的真实图像进行N次迭代下采样,下采样使用求像素均值的方法,得到迭代后的共N+1个尺度的图像,将这N+1个尺度图像保存为I0~IN,I0是原始图像,IN是N次下采样后尺寸最小的图像,这些图像将作为各级判别器的输入;
(2)图像预处理过后,开始第N层的GAN学习,第N层生成器GN的输入为一个和IN尺寸相同的高斯噪声图像zN,之后第N层生成器GN通过学习后生成质量较低的图像
Figure FDA0003198974640000011
再把图像
Figure FDA0003198974640000012
和步骤(1)中得到的下采样后的真实图像IN作为第N层判别器的输入,判别器判别后促使生成器改进生成效果,不断的更新生成图像,本层训练结束得到更新完成后质量最高的生成图像
Figure FDA0003198974640000013
(3)下面开始第N-1层GAN的训练,在第N层GAN训练完毕后,将该层的输出图像
Figure FDA0003198974640000014
用双线性插值法进行比例为r的上采样,将得到的图像
Figure FDA0003198974640000015
和相同尺寸的高斯噪声图像zN-1作为生成器GN-1的输入进行学习,然后得到生成的质量较低的图像
Figure FDA0003198974640000016
然后把
Figure FDA0003198974640000017
和真实图像IN-1作为判别器DN-1的输入进行判别,和GN-1进行对抗,最后得到更新完成后质量较高的生成图像
Figure FDA0003198974640000018
(4)迭代的运行步骤(3),对每一个尺度的图像都进行训练,到第0层训练完成后结束迭代,这时得到了包括最小尺度的GN到最大尺度的G0共N+1个尺度的生成器,这时代表本模型的训练阶段结束;
(5)训练阶段结束后,对输入图像进行二次训练,二次训练的过程为:采用不同的训练尺度,重复进行步骤(1)至步骤(4),直到训练结束;
(6)二次训练结束后,得到训练好的生成器G0,通过G0生成超分辨率重构后的图像,在本发明中,设置生成超分辨率的倍数为4倍,所以最后生成的图像是放大四倍并且细节更清晰的图像。
2.根据权利要求1所述的一种面向小样本图像集的超分辨率图像重构方法,其特征在于:步骤(6)中设置生成超分辨率的倍数为4倍。
3.根据权利要求1所述的一种面向小样本图像集的超分辨率图像重构方法,其特征在于:以卷积神经网络为基础的残差神经网络,其具体运行步骤包括:
(2.1)生成器Gn的输入为高斯噪声zn和上一层的上采样图像
Figure FDA0003198974640000021
(2.2)根据残差网络的思想,在生成器Gn中要进行多次迭代,每次迭代包括卷积层Conv,归一化层BN和激活层ReLU,对生成器Gn的输入进行迭代,每隔5次迭代后得到一个张量,然后将得到的张量以一定比例和输入图像
Figure FDA0003198974640000022
所表示的张量相加,得到最终的张量,然后再将这个张量转化成图像作为生成器Gn的输出
Figure FDA0003198974640000023
(2.3)通过步骤(2.2)得到生成器Gn的输出图像
Figure FDA0003198974640000024
再结合真实图像In组成判别器Dn的输入,之后判别器Dn的结构和生成器Gn类似,不过在5个Conv卷积层后会有一个全连接层Dense,这个层是根据权重来分类的,Dense后跟一个ReLU激活函数,然后再跟一个Dense,最后是一个Sigmoid激活层,这个层的作用是用来实现前向或后向的计算,判别器Dn的作用是判断
Figure FDA0003198974640000025
和真实图像In是否相近,如果相差较大的话判别器Dn会返回一个损失函数,并促使生成器Gn重新生成,直到生成的结果可以通过判别器;
在步骤(2.2)中,生成器Gn生成图像的过程可以用以下公式理解:
Figure FDA0003198974640000026
其中,
Figure FDA0003198974640000027
为金字塔GAN中每一层生成器Gn的输出图像,Gn()表示生成器的生成过程,zn表示高斯噪声,
Figure FDA0003198974640000028
表示上一层输出图像的上采样,因为第N层没有上一层的输出,所以这一层的输入只有高斯噪声zN,具体公式如下:
Figure FDA0003198974640000029
其中,
Figure FDA00031989746400000210
为金字塔GAN中第N层生成器GN的输出图像,GN()表示生成器生成过程,zN表示高斯噪声;
上述的公式再细化可以得到以下公式:
Figure FDA00031989746400000211
其中,
Figure FDA00031989746400000212
为金字塔GAN中每一层生成器Gn的输出图像,
Figure FDA00031989746400000213
表示上一层GAN输出图像的上采样,ψn()表示由5个Conv(3×3)-BatchNorm-LeakyReLU卷积块组成的完全卷积网络,在训练阶段的最低尺度中,每个卷积块包括32个卷积核,每经过4个尺度,卷积核的数量翻倍,因为生成器是完全卷积的,所以可以在测试时通过改变噪声图的维度生成任意大小和纵横比的图像,这些Conv卷积块的运算公式为:
T=ReLU(Convk×k(I))
其中,I为输入图像,ReLU为激活函数,Conv为卷积操作,k表示卷积核大小,T表示步骤(2.2)中每一次Conv卷积块运行后得到的高维向量。
4.根据权利要求3所述的一种面向小样本图像集的超分辨率图像重构方法,其特征在于:步骤(2.3)中,判别器返回的损失定义为两个部分,分别是对抗损失和重构损失,对抗损失就是生成器G和判别器D的基于代价函数L(G,D)的极大极小博弈的训练过程,这里用
Figure FDA0003198974640000031
来表示,重构损失是指图像在经过生成器G中的卷积或反卷积等操作时,会损失一些图像精度,这里用αLrec(G)来表示,其中α表示的是残差网络中规定的学习率;
把上述的损失函数加在一起,就构成了每一层GAN中的损失函数,可以得到以下的计算公式为:
Figure FDA0003198974640000032
其中,
Figure FDA0003198974640000033
表示的是每一层GAN中的生成器Gn和判别器Dn在进行基于函数Ladv(G,D)的极大极小博弈,这个函数实际上是通过计算均方误差来得到的,αLrec(Gn)中α是残差网络中规定的学习率,Lrec(Gn)表示的是生成器Gn在生成过程中的损失,具体计算公式如下:
Figure FDA0003198974640000034
其中,
Figure FDA0003198974640000035
表示的是上一层的输出
Figure FDA0003198974640000036
进行比例为r的上采样,
Figure FDA0003198974640000037
表示生成器Gn的生成结果,In是这一层的真实图像,|| ||2表示的是|| ||中的公式取范数后平方,因为金字塔的第N层的输入只有高斯噪声zN,所以这一层Lrec(GN)计算公式为:
Lrec=‖GN(zN)-IN2
其中,GN(zN)表示的是第一层生成器GN的生成结果,IN是这一层的真实图像,|| ||2表示的是|| ||中的公式取范数后平方。
CN202110898675.2A 2021-08-05 2021-08-05 一种面向小样本图像集的超分辨率图像重构方法 Active CN113592715B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110898675.2A CN113592715B (zh) 2021-08-05 2021-08-05 一种面向小样本图像集的超分辨率图像重构方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110898675.2A CN113592715B (zh) 2021-08-05 2021-08-05 一种面向小样本图像集的超分辨率图像重构方法

Publications (2)

Publication Number Publication Date
CN113592715A true CN113592715A (zh) 2021-11-02
CN113592715B CN113592715B (zh) 2024-05-24

Family

ID=78255587

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110898675.2A Active CN113592715B (zh) 2021-08-05 2021-08-05 一种面向小样本图像集的超分辨率图像重构方法

Country Status (1)

Country Link
CN (1) CN113592715B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114092520A (zh) * 2021-11-19 2022-02-25 电子科技大学长三角研究院(湖州) 基于生成对抗网络的地面运动目标重聚焦方法及系统
CN114723633A (zh) * 2022-04-02 2022-07-08 北京理工大学 内镜图像偏色失真颜色实时补偿方法及装置
CN115410083A (zh) * 2022-08-24 2022-11-29 南京航空航天大学 一种基于对抗域适应的小样本sar目标分类方法及装置
CN116912675A (zh) * 2023-09-13 2023-10-20 吉林大学 一种基于特征迁移的水下目标检测方法及系统

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110349103A (zh) * 2019-07-01 2019-10-18 昆明理工大学 一种基于深度神经网络和跳跃连接的无干净标签图像去噪方法
CN110490796A (zh) * 2019-04-11 2019-11-22 福建师范大学 一种高低频成分融合的人脸超分辨率处理方法及系统
CN110532897A (zh) * 2019-08-07 2019-12-03 北京科技大学 零部件图像识别的方法和装置
CN110647820A (zh) * 2019-08-28 2020-01-03 电子科技大学 基于特征空间超分辨映射的低分辨率人脸识别方法
CN110827213A (zh) * 2019-10-11 2020-02-21 西安工程大学 一种基于生成式对抗网络的超分辨率图像修复方法
CN111507898A (zh) * 2020-03-16 2020-08-07 徐州工程学院 基于自适应调整的图像超分辨率重建方法
WO2020180755A1 (en) * 2019-03-01 2020-09-10 Sri International Apparatuses and methods involving multi-modal imaging of a sample
WO2021056969A1 (zh) * 2019-09-29 2021-04-01 中国科学院长春光学精密机械与物理研究所 超分辨率图像重构方法和装置
CN112733950A (zh) * 2021-01-18 2021-04-30 湖北工业大学 一种基于图像融合与目标检测结合的电力设备故障诊断方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020180755A1 (en) * 2019-03-01 2020-09-10 Sri International Apparatuses and methods involving multi-modal imaging of a sample
CN110490796A (zh) * 2019-04-11 2019-11-22 福建师范大学 一种高低频成分融合的人脸超分辨率处理方法及系统
CN110349103A (zh) * 2019-07-01 2019-10-18 昆明理工大学 一种基于深度神经网络和跳跃连接的无干净标签图像去噪方法
CN110532897A (zh) * 2019-08-07 2019-12-03 北京科技大学 零部件图像识别的方法和装置
CN110647820A (zh) * 2019-08-28 2020-01-03 电子科技大学 基于特征空间超分辨映射的低分辨率人脸识别方法
WO2021056969A1 (zh) * 2019-09-29 2021-04-01 中国科学院长春光学精密机械与物理研究所 超分辨率图像重构方法和装置
CN110827213A (zh) * 2019-10-11 2020-02-21 西安工程大学 一种基于生成式对抗网络的超分辨率图像修复方法
CN111507898A (zh) * 2020-03-16 2020-08-07 徐州工程学院 基于自适应调整的图像超分辨率重建方法
CN112733950A (zh) * 2021-01-18 2021-04-30 湖北工业大学 一种基于图像融合与目标检测结合的电力设备故障诊断方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
"基于生成对抗网络的图像翻译方法研究", 知网研学, 1 March 2023 (2023-03-01) *
MINGWEN SHAO等: "Multi-scale generative adversarial inpainting network based on cross-layer attention transfer mechanism", KNOWLEDGE-BASED SYSTEMS 196 (2020) 105778, 24 March 2020 (2020-03-24) *
樊国华;: "基于卷积神经网络的小样本图像分辨率改进方法", 电子技术与软件工程, no. 14, 15 July 2020 (2020-07-15), pages 171 - 173 *
罗月童;卞景帅;张蒙;饶永明;闫峰;: "基于卷积去噪自编码器的芯片表面弱缺陷检测方法", 计算机科学, no. 02, 31 December 2020 (2020-12-31), pages 124 - 131 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114092520A (zh) * 2021-11-19 2022-02-25 电子科技大学长三角研究院(湖州) 基于生成对抗网络的地面运动目标重聚焦方法及系统
CN114092520B (zh) * 2021-11-19 2023-12-26 电子科技大学长三角研究院(湖州) 基于生成对抗网络的地面运动目标重聚焦方法及系统
CN114723633A (zh) * 2022-04-02 2022-07-08 北京理工大学 内镜图像偏色失真颜色实时补偿方法及装置
CN115410083A (zh) * 2022-08-24 2022-11-29 南京航空航天大学 一种基于对抗域适应的小样本sar目标分类方法及装置
CN115410083B (zh) * 2022-08-24 2024-04-30 南京航空航天大学 一种基于对抗域适应的小样本sar目标分类方法及装置
CN116912675A (zh) * 2023-09-13 2023-10-20 吉林大学 一种基于特征迁移的水下目标检测方法及系统
CN116912675B (zh) * 2023-09-13 2023-11-28 吉林大学 一种基于特征迁移的水下目标检测方法及系统

Also Published As

Publication number Publication date
CN113592715B (zh) 2024-05-24

Similar Documents

Publication Publication Date Title
Yang et al. DRFN: Deep recurrent fusion network for single-image super-resolution with large factors
CN110136062B (zh) 一种联合语义分割的超分辨率重建方法
Yan et al. Fine-grained attention and feature-sharing generative adversarial networks for single image super-resolution
CN113592715A (zh) 一种面向小样本图像集的超分辨率图像重构方法
CN112541864A (zh) 一种基于多尺度生成式对抗网络模型的图像修复方法
CN113538246B (zh) 基于无监督多阶段融合网络的遥感图像超分辨率重建方法
CN112215755A (zh) 一种基于反投影注意力网络的图像超分辨率重建方法
CN110211035A (zh) 融合互信息的深度神经网络的图像超分辨率方法
CN111861886B (zh) 一种基于多尺度反馈网络的图像超分辨率重建方法
CN111899168A (zh) 一种基于特征增强的遥感影像超分辨率重建方法和系统
CN114463176B (zh) 基于改进esrgan的图像超分辨重建方法
CN115457568B (zh) 一种基于生成对抗网络的历史文档图像降噪方法及系统
CN111414988B (zh) 基于多尺度特征自适应融合网络的遥感影像超分辨率方法
CN115731597A (zh) 一种人脸口罩掩膜图像自动分割与修复管理平台及方法
Muqeet et al. Hybrid residual attention network for single image super resolution
CN116258632A (zh) 一种基于文本辅助的文本图像超分辨率重建方法
An et al. RBDN: Residual bottleneck dense network for image super-resolution
CN114862699B (zh) 基于生成对抗网络的人脸修复方法、装置及存储介质
Yang et al. Deep networks for image super-resolution using hierarchical features
Wang et al. Deep residual network for single image super-resolution
CN115115860A (zh) 一种基于深度学习的图像特征点检测匹配网络
CN111951177B (zh) 一种基于图像超分辨损失函数的红外图像细节增强方法
Lugo-Torres et al. Enhancing Document Digitization: Image Denoising with a Cycle Generative Adversarial Network
CN113763282B (zh) 一种车牌图像的模糊图像生成方法
CN117455813B (zh) 基于门控卷积和scpam注意力模块的遮挡手写病历汉字图像修复方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant