CN110689482A - 一种基于有监督逐像素生成对抗网络的人脸超分辨率方法 - Google Patents
一种基于有监督逐像素生成对抗网络的人脸超分辨率方法 Download PDFInfo
- Publication number
- CN110689482A CN110689482A CN201910879159.8A CN201910879159A CN110689482A CN 110689482 A CN110689482 A CN 110689482A CN 201910879159 A CN201910879159 A CN 201910879159A CN 110689482 A CN110689482 A CN 110689482A
- Authority
- CN
- China
- Prior art keywords
- pixel
- resolution
- super
- face image
- network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 239000011159 matrix material Substances 0.000 claims abstract description 25
- 238000012549 training Methods 0.000 claims abstract description 22
- 230000006870 function Effects 0.000 claims description 31
- 238000013461 design Methods 0.000 claims description 7
- 238000005070 sampling Methods 0.000 claims description 6
- 238000012216 screening Methods 0.000 claims description 3
- 238000012360 testing method Methods 0.000 claims description 3
- 230000003042 antagnostic effect Effects 0.000 claims 1
- 238000004140 cleaning Methods 0.000 abstract 1
- 238000007781 pre-processing Methods 0.000 abstract 1
- 238000000605 extraction Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 4
- 238000012544 monitoring process Methods 0.000 description 4
- 238000013507 mapping Methods 0.000 description 3
- 238000003909 pattern recognition Methods 0.000 description 3
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 208000004547 Hallucinations Diseases 0.000 description 1
- 230000008485 antagonism Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4053—Scaling of whole images or parts thereof, e.g. expanding or contracting based on super-resolution, i.e. the output image resolution being higher than the sensor resolution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明涉及一种基于有监督逐像素生成对抗网络的人脸超分辨率方法,首先读取原始人脸图片数据集;然后进行数据裁剪清洗等预处理工作;第三读取高分辨率人脸图像进行双三次插值下采样,获得高分辨率人脸图像‑低分辨率人脸图像对;第四将低分辨率人脸图像输入到生成器网络生成超分辨率人脸图像;第五再将高分辨率人脸图像和超分辨率图像分别输入到逐像素判别器网络,使用逐像素判别器网络输出的逐像素判别矩阵计算有监督的逐像素对抗损失函数,使用误差反向传播训练生成器网络。
Description
技术领域
本发明涉及图像重建方法领域,具体涉及一种基于有监督逐像素生成对抗网络的人脸超分辨率方法。
背景技术
随着机场、地铁、购物中心等拥挤区域的安防标准不断提高,基于机器视觉的智能监控系统受到了越来越多的关注。大多数监控视频为了得到更广阔的视野,通常采集到的人脸通常分辨率较小,相对于清晰、高分辨率图片,小尺度人脸图片区分度和信息量都大大降低,因此监控视频人脸识别系统需要针对小尺度人脸图片进行超分辨率重建。超分辨率重建方法可以恢复人脸图片的纹理细节,提高低分辨率图片人脸识别准确度。
目前,关于人脸图像超分辨重建的算法已经被研究了许多年,但是大多数基于深度学习的人脸图像超分辨率重建算法仅使用均方误差作为损失函数,造成重建的人脸图片过于平滑,缺少纹理细节,不利于后续的人脸识别。基于生成对抗网络的图像超分辨率重建方法使用无监督的方式,容易引入噪声影响人脸识别精度。因此如何针对低分辨率人脸图片,研究更加有效的超分辨率重建方法,提高低分辨率人脸识别准确度,成为监控视频低分辨率人脸识别的关键问题。
现有的人脸图像超分辨率方法可以分为三种类型:基于插值的方法,基于统计的方法和基于学习的方法。在早期,前两类方法因其计算效率优势而得到广泛的关注。但是,这两类方法总是局限于较小的超分辨率倍数(2×超分辨),超分辨率倍数增大时(4×或者8×超分辨)效果较差。基于学习的方法【1】使用大量的低分辨率-高分辨率图像对来训练人脸超分辨率重建模型,使得训练好的模型可以根据输入数据来推断出低分辨率图片所缺失的高频信息,并且在较大放大倍数时也可以得到较好的超分辨率重建效果。基于深度学习的方法具有从大规模数据库中学习知识的强大能力,因而被引入到图像超分辨率重建问题。但是这些基于卷积神经网络的方法大多数主要使用均方误差(MSE)损失函数【2】来学习低分辨率图像到高分辨率图像之间的映射关系,当输入图像分辨率非常低并且放大倍数很大时,就会导致输出过度平滑。
目前人脸图像超分辨率重建领域主要有三种方法来缓解过度平滑问题。第一种是利用人脸分析技术来学习人脸图像的结构先验信息。刘等人【3】在重建高分辨率人脸图像之前估计人脸的关键点和面部姿势先验信息,然后使用这些先验信息进行人脸图像超分辨率重建工作,但是当人脸图像分辨率较小时先验信息很难准确估计。朱等人【4】提出了人脸超分辨率重建和场景估计的统一框架,以恢复纹理细节。他们在较小的人脸图像上实现了最先进的结果,但是在各种姿态和遮挡条件下,由于难以进行准确的场景估计,超分辨重建结果并不理想。第二种方法是引入语义损失函数,直接提升输出图像所包含的语义信息。约翰逊等人【5】使用预先训练好的分类模型提取特征计算损失作为语义损失来恢复更多的语义信息。然而,其缺点是特征作为损失函数并不是非常直观。最后一种方式【6】是用生成对抗网络引入图像先验知识。于等人【7】提出一个生成对抗网络(GAN【8】)来对16×16像素大小的人脸图像进行8×超分辨。生成对抗网络可以恢复更加真实的纹理细节,但是传统无监督的生成对抗网络学习方式使得生成的图像与原始图像差距较大,无法用于进行人脸识别,因此需要针对这一问题加以改进。
【1】Dong C,Loy C C,He K,et al.Image super-resolution using deepconvolutional networks[J].IEEE transactions on pattern analysis and machineintelligence,2015,38(2):295-307.
【2】Shi W,Caballero J,Huszár F,et al.Real-time single image and videosuper-resolution using an efficient sub-pixel convolutional neural network[C]//Proceedings of the IEEE conference on computer vision and patternrecognition.2016:1874-1883.
【3】Liu W,Lin D,Tang X.Hallucinating faces:Tensorpatch super-resolution and coupled residue compensation[C]//2005IEEE Computer SocietyConference on Computer Vision and Pattern Recognition(CVPR′05).IEEE,2005,2:478-484.
【4】Zhu S,Liu S,Loy C C,et al.Deep cascaded bi-networkfor facehallucination[C]//European conference on computer vision.Springer,Cham,2016:614-630.
【5】Johnson J,Alahi A,Fei-Fei L.Perceptual losses for real-time styletransfer and super-resolution[C]//European conference on computervision.Springer,Cham,2016:694-711.
【6】Ledig C,Theis L,Huszár F,et al.Photo-realistic single image super-resolution using a generative adversarial network[C]//Proceedings of the IEEEconference on computer vision and pattern recognition.2017:4681-4690.
【7】Yu X,Porikli F.Ultra-resolving face images by discriminativegenerative networks[C]//European conference on computer vision.Springer,Cham,2016:318-333.
【8】Goodfellow I,Pouget-Abadie J,Mirza M,et al.Generative adversarialnets[C]//Advances in neural information processing systems.2014:2672-2680.
发明内容
本发明的技术解决问题是:克服现有技术的不足,提供一种基于有监督逐像素生成对抗网络的人脸超分辨率方法,提高监控视频低分辨率人脸识别精度,使用逐像素生成对抗网络来增加超分辨重建人脸图像的纹理细节,使用有监督的生成对抗网络来提高超分辨率重建人脸图像的人脸识别精度。
本发明的技术方案:一种基于有监督逐像素生成对抗网络的人脸超分辨率方法,包括以下步骤:
Step 1:建立用于训练有监督逐像素的生成对抗网络的原始人脸图片数据集,将数据集分为训练集和测试集;生成对抗网络包含生成器网络和逐像素判别器网络;
Step 2:对数据集中的人脸图片进行检测和裁剪,并筛选出符合条件的训练集中的人脸图片;
Step 3:随机分批提取训练集中的人脸图片作为高分辨率人脸图片,将高分辨率人脸图片进行双三次插值下采样到指定分辨率作为低分辨率人脸图片,获得用于训练有监督逐像素生成对抗网络的高分辨率人脸图像-低分辨率人脸图像对;
Step4:将低分辨率人脸图像输入到生成器网络,生成超分辨率人脸图像,生成器网络生成的人脸图像即超分辨率人脸图像;
Step5:将高分辨率人脸图像和超分辨率人脸图像分别输入到逐像素判别器网络中,使用逐像素判别器网络输出的逐像素判别矩阵计算有监督的逐像素对抗损失函数,使用误差反向传播训练生成器网络;
Step6;计算验证集中高分辨率人脸图像和超分辨率人脸图像之间的峰值信噪比是否达到设计要求,即峰值信噪比不再提高即符合设计要求;如果达到设计要求,则输出最终训练好的生成器网络,否则继续继续提取训练集中的人脸图片;
Step7:最终得到训练完成的生成器网络作为低分辨率人脸超分辨率重建模型,输入低分辨率人脸图像得到超分辨率人脸图像。
所述Step 4中,生成器网络结构如下:
生成器网络输入为低分辨率人脸图像,首先使用9个卷积核大小3×3、步长为1的卷积层提取特征,卷积层通道数分别为128->128->128->256->256->512->512->1024->1024;然后使用卷积核大小3×3步长为1的子像素卷积层将特征图放大到高分辨率图像大小,输出通道数为64;最后使用通道数为3、卷积核大小为3×3、步长为1的卷积层输出超分辨率人脸图像。
所述Step 5中,逐像素判别器网络的结构如下:
逐像素判别器网络输入为高分辨率人脸图像或者超分辨率人脸图像,然后使用9个卷积核大小为3×3、步长为1的卷积层提取特征,卷积层通道数分别为8->8->8->16->16->32->32->64->64;然后通过卷积核大小为3×3、步长为1、通道数为1的卷积层,输出通道数为1的逐像素判别矩阵
其中:W和H代表低分辨率图像的宽和高,r代表超分辨率倍数;D(·,·)代表逐像素判别器网络,输入为超分辨率图像或者高分辨率图片y和上采样的低分辨率图像x;输出矩阵上的每个值pi,j代表输入图像第i行第j列像素属于高分辨率的概率。
所述Step5中,有监督的逐像素对抗损失函数为:包含生成器损失函数和判别器损失函数:
Dsp(x,y)=D(x,y)-D(x,G(x))
其中:L(D)是判别器损失函数,L(G)是生成器损失函数,生成器和判别器分别使用对应损失函数交替训练;D(x,y)是高分辨率人脸图像的逐像素判别器输出,G(x)是超分辨率人脸图像,D(x,G(x))是超分辨率人脸图像的逐像素判别器输出,Dsp(x,y)是根据逐像素判别器输出计算的有监督逐像素判别矩阵,Dsp(x,y)i,j是逐像素判别矩阵第i行第j列元素;αi,j是逐像素判别矩阵第i行第j列元素监督参数,a是逐像素判别矩阵元素小于0时的监督参数,当a<0时,生成的超分辨率图像被强制与真实的高分辨率图像相同,当a≥0时,生成的超分辨率图像比相应的高分辨率图像更逼真。
本发明与现有技术相比的优点在于:
(1)本发明能够有效的提高人脸超分辨率重建相似度
传统基于生成对抗网络的人脸图片超分辨率重建方法使用无监督的对抗损失函数,因此超分辨率重建出的人脸图片与原图差别较大,相似度较低。本发明针对监控视频人脸识别问题对相似度要求较高的特点,引入有监督的逐像素对抗损失函数,提高超分辨率重建出的人脸与原图的相似度。
(2)本发明能够有效提高低分辨率图像人脸识别准确度
传统基于均方误差损失函数的人脸图像超分辨率重建方法模糊了人脸细节,因此用于人脸识别问题效果并不理想。本发明使用逐像素对抗损失函数,在恢复人脸图片纹理细节的同时,最大程度保证超分辨率重建人脸图片与原图的相似度,更加有利于提高低分辨率人脸识别问题准确度。
附图说明
图1为本发明的人脸超分辨率重建网络训练流程图;
图2为本发明提出的带有r×放大因子的有监督像素生成对抗网络的整体结构。图中所有方块代表卷积层,卷积核大小为3×3,步幅为1,通道大小为每层下的数字。生成器末端的S指示子像素卷积以构建超分辨率人脸图像。判别器的输入是上采样后的低分辨率输入人脸图像和高分辨率(或超分辨率)人脸图像在通道方向上拼接。判别器的输出是与输入人脸图像大小相同的逐像素判别矩阵,其用于计算有监督的逐像素判别差异;
图3为在不同的监督参数a下的有监督的逐像素判别差Dsp(x,y);
图4为不同方法8×超分辨率重建结果与细节放大比较(a).双三次插值,(b).原始高分辨率图像(c).传统生成对抗网络(d).本发明提出的基于有监督逐像素生成对抗网络的人脸图像超分辨率重建方法。
具体实施方式
下面结合附图及实施例对本发明进行详细说明。
如图1所示,本发明方法具体实现如下:
Step 1):读取原始人脸图片数据集;
建立用于训练有监督逐像素生成对抗网络(包含生成器和判别器)的原始人脸图片数据集,将数据集分为训练集和测试集
Step 2):对数据中的图片进行人脸检测、裁剪,并筛选出符合条件的训练图片;
Step 3):随机分批读取高分辨率人脸图像进行双三次插值下采样,获得用于有监督生成对抗网络的高分辨率-低分辨率人脸图像对;
随机分批提取训练集中的人脸图片作为高分辨率人脸图片,将高分辨率人脸图片进行双三次插值下采样到指定分辨率作为低分辨率人脸图片,获得用于训练有监督生成对抗网络的高分辨率人脸图像-低分辨率人脸图像对;
Step 4):将低分辨率人脸图像输入到生成器网络生成超分辨率人脸图像;
作为基于学习的人脸超分辨率重建方法,本发明旨在学习从低分辨率人脸图像到高分辨率人脸图像的映射函数。将低分辨率输入人脸图像表示为x,将高分辨率目标人脸图像表示为y,将超分辨率输出人脸图像表示为从低分辨率输入人脸图像到超分辨率输出人脸图像具有参数θ的的映射函数G(·)可以表示为:
将人脸图像超分辨率重建应用于监控视频人脸识别问题,需要保证超分辨率重建生成器网络的速度。为了减少网络计算量,使用低分辨率输入人脸图片来进行特征提取,同时使用子像素卷积操作来减少上采用部分的计算量。
基于子像素卷积的生成器网络结构如图2所示。该生成器包括特征提取网络、子像素预测网络和构建最终超分辨率图像的子像素卷积网络。特征提取网络为9个卷积核大小3×3、步长为1的卷积层提取特征,卷积层通道数分别为128->128->128->256->256->512->512->1024->1024,将低分辨率人脸图像作为输入并提取用于子像素预测的人脸特征。特征提取网络的卷积层的信道数逐渐增加。在特征提取网络中使用残差连接来完全混合底层和高层特征。残差连接作为单位映射,其保留来自先前层的信息并限制网络仅学习残差,并允许通过跳转连接路径反向传播梯度,防止梯度消失。子像素预测网络接收特征提取网络的提取到的人脸特征作为输入,并计算出r2个子像素。这些子像素和输入低分辨率人脸图像的尺寸W×H相同。最后使用子像素卷积操作将这r2个W×H尺寸的子像素组合在一起以构建尺寸为rW×rH的超分辨率人脸图像。
Step 5):将高分辨率和超分辨率人脸图像分别输入到逐像素判别器网络中,使用逐像素判别器网络输出的逐像素判别矩阵计算有监督的逐像素对抗损失函数,使用误差反向传播训练生成器网络;
为了增加超分辨率人脸图像的纹理细节信息,本发明采用了生成对抗网络框架。传统的生成对抗网络输入单张图片输出单个标量数字来表示输入图像属于真实高分辨率图像的概率。但是传统的生成对抗网络仅仅关注图像全局信息,而忽略图像的局部信息。因此与传统生成对抗网络框架不同,本发明提出的有监督逐像素生成对抗网络的逐像素判别器网络输出与输入图片大小相同的逐像素判别矩阵,如图2所示。本发明的鉴别器采用全卷积网络架构,没有下采样层和全连接层。由于全卷积网络架构可以端到端和像素到像素的进行训练,因此非常适合本发明提出的逐像素判别器网络。同时判别器网络通过1×1卷积层引入残差连接,使得底层特征可以直接传递到高层特征图。通过残差连接,本发明的判别器可以设计得更深,以便输出逐像素判别矩阵的每个元素都可以实现更大的视野和更强的拟合能力。
在训练人脸超分辨率重建网络时,每一个超分辨率人脸图像都具有其对应的高分辨率人脸图像作为真实值,即,超分辨率图像的每一个像素在高分辨率图像中都具有对应的像素作为监督项。为了充分利用高分辨率-超分辨率图像对,本发明提出了一种用于人脸超分辨率重建的有监督逐像素生成对抗网络。由于将单个数字作为整个图像的监督项很容易在生成图像中引入噪声,因此本发明引入逐像素判别器网络以生成与输入图像大小相同的逐像素判别矩阵
其中:W和H代表低分辨率图像的宽和高,r代表超分辨率倍数;代表判别器网络,输入为超分辨率图像(或者高分辨率图片y)和上采样的低分辨率图像x;输出矩阵上的每个值pi,j代表输入图像第i行第j列像素属于高分辨率的概率。基于上述逐像素判别器网络可以以强监督方式利用生成对抗网络。更具体地,真实高分辨率人脸图像的每个像素通过的对应元素监督所生成的超分辨率图像的对应像素,使得真实高分辨率图像与生成的超分辨率图像之间的每个像素的差异可以尽可能的小,进而大大减少噪声引入。基于逐像素判别器有监督的逐像素对抗损失可以定义为:
Dsp(x,y)=D(x,y)-D(x,G(x))
其中:有监督的逐像素对抗损失函数包含生成器损失函数和判别器损失函数,L(D)是判别器损失函数,L(G)是生成器损失函数,生成器和判别器分别使用对应损失函数交替训练;D(x,y)是高分辨率人脸图像的逐像素判别器输出,G(x)是超分辨率人脸图像,D(x,G(x))是超分辨率人脸图像的逐像素判别器输出,Dsp(x,y)是根据逐像素判别器输出计算的有监督逐像素判别矩阵,Dsp(x,y)i,j是逐像素判别矩阵第i行第j列元素;αi,j是逐像素判别矩阵第i行第j列元素监督参数,a是逐像素判别矩阵元素小于0时的监督参数,当a<0时,生成的超分辨率图像被强制与真实的高分辨率图像相同,当a≥0时,生成的超分辨率图像比相应的高分辨率图像更逼真。因此,判别器不只是简单地将输入人脸图像分类为真实或假的。相反,它定量地评估所生成的超分辨率人脸图像与其对应的高分辨率人脸图像之间的像素级的差异。基于判别器的这种像素级输出,生成器可以学习如何补偿所生成的超分辨率人脸图像与其对应的真实高分辨率人脸图像之间的差异并改善其超分辨效果。图4展示了本发明提出的逐像素生成对抗网络人脸超分辨率重建方法与传统方法比较结果,可以看出本发明提出的方法可以在恢复更多纹理信息的同时保证超分辨结果的准确性。
Step6);计算验证集上高分辨率人脸图像和超分辨率人脸图像之间的峰值信噪比是否达到设计要求;
计算验证集上超分辨率重建人脸图像和高分辨率人脸图像之间的峰值信噪比:
其中:y(i,j)表示高分辨率人脸图像坐标(i,j)位置的像素值,表示超分辨率人脸图像坐标(i,j)位置的像素值,W、H分别表示图像的宽度和高度;MSE是高分辨率人脸图像和超分辨率人脸图像之间的均方误差,PSNR是高分辨率人脸图像和超分辨率人脸图像之间的峰值信噪比。
Step 7):最终得到训练完成的生成器网络作为低分辨率人脸超分辨率重建模型,输入低分辨率人脸图像可以得到超分辨率人脸图像。
提供以上实施例仅仅是为了描述本发明的目的,而并非要限制本发明的范围。本发明的范围由所附权利要求限定。不脱离本发明的精神和原理而做出的各种等同替换和修改,均应涵盖在本发明的范围之内。
Claims (4)
1.一种基于有监督逐像素生成对抗网络的人脸超分辨率方法,其特征在于,包括以下步骤:
Step 1:建立用于训练有监督逐像素的生成对抗网络的原始人脸图片数据集,将数据集分为训练集和测试集;生成对抗网络包含生成器网络和逐像素判别器网络;
Step 2:对数据集中的人脸图片进行检测和裁剪,并筛选出符合条件的训练集中的人脸图片;
Step 3:随机分批提取训练集中的人脸图片作为高分辨率人脸图片,将高分辨率人脸图片进行双三次插值下采样到指定分辨率作为低分辨率人脸图片,获得用于训练有监督逐像素生成对抗网络的高分辨率人脸图像-低分辨率人脸图像对;
Step 4:将低分辨率人脸图像输入到生成器网络,生成超分辨率人脸图像,生成器网络生成的人脸图像即超分辨率人脸图像;
Step 5:将高分辨率人脸图像和超分辨率人脸图像分别输入到逐像素判别器网络中,使用逐像素判别器网络输出的逐像素判别矩阵计算有监督的逐像素对抗损失函数,使用误差反向传播训练生成器网络;
Step 6;计算验证集中高分辨率人脸图像和超分辨率人脸图像之间的峰值信噪比是否达到设计要求,即峰值信噪比不再提高即符合设计要求;如果达到设计要求,则输出最终训练好的生成器网络,否则继续继续提取训练集中的人脸图片;
Step 7:最终得到训练完成的生成器网络作为低分辨率人脸超分辨率重建模型,输入低分辨率人脸图像得到超分辨率人脸图像。
2.根据权利要求1所述的一种基于有监督逐像素生成对抗网络的人脸超分辨率方法,其特征在于:所述Step 4中,生成器网络结构如下:
生成对抗网络输入为低分辨率人脸图像,首先使用9个卷积核大小3×3、步长为1的卷积层提取特征,卷积层通道数分别为128->128->128->256->256->512->512->1024->1024;然后使用卷积核大小3×3步长为1的子像素卷积层将特征图放大到高分辨率图像大小,输出通道数为64;最后使用通道数为3、卷积核大小为3×3、步长为1的卷积层输出超分辨率人脸图像。
3.根据权利要求1所述的一种基于有监督逐像素生成对抗网络的人脸超分辨率方法,其特征在于:所述Step 5中,逐像素判别器网络的结构如下:
逐像素判别器网络输入为高分辨率人脸图像或者超分辨率人脸图像,然后使用9个卷积核大小为3×3、步长为1的卷积层提取特征,卷积层通道数分别为8->8->8->16->16->32->32->64->64;然后通过卷积核大小为3×3、步长为1、通道数为1的卷积层,输出通道数为1的逐像素判别矩阵
其中:W和H代表低分辨率图像的宽和高,r代表超分辨率倍数;D(·,·)代表逐像素判别器网络,输入为超分辨率图像或者高分辨率图片y和上采样的低分辨率图像x;输出矩阵上的每个值pi,j代表输入图像第i行第j列像素属于高分辨率的概率。
4.根据权利要求3所述的一种基于有监督逐像素生成对抗网络的人脸超分辨率方法,其特征在于:所述Step5中,有监督的逐像素对抗损失函数为:包含生成器损失函数和判别器损失函数:
Dsp(x,y)=D(x,y)-D(x,G(x))
其中:L(D)是判别器损失函数,L(G)是生成器损失函数,生成器和判别器分别使用对应损失函数交替训练;D(x,y)是高分辨率人脸图像的逐像素判别器输出,G(x)是超分辨率人脸图像,D(x,G(x))是超分辨率人脸图像的逐像素判别器输出,Dsp(x,y)是根据逐像素判别器输出计算的有监督逐像素判别矩阵,Dsp(x,y)i,j是逐像素判别矩阵第i行第j列元素;αi,j是逐像素判别矩阵第i行第j列元素监督参数,a是逐像素判别矩阵元素小于0时的监督参数,当a≤0时,生成的超分辨率图像被强制与真实的高分辨率图像相同,当a>0时,生成的超分辨率图像比相应的高分辨率图像更逼真。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910879159.8A CN110689482B (zh) | 2019-09-18 | 2019-09-18 | 一种基于有监督逐像素生成对抗网络的人脸超分辨率方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910879159.8A CN110689482B (zh) | 2019-09-18 | 2019-09-18 | 一种基于有监督逐像素生成对抗网络的人脸超分辨率方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110689482A true CN110689482A (zh) | 2020-01-14 |
CN110689482B CN110689482B (zh) | 2022-09-30 |
Family
ID=69109544
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910879159.8A Active CN110689482B (zh) | 2019-09-18 | 2019-09-18 | 一种基于有监督逐像素生成对抗网络的人脸超分辨率方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110689482B (zh) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111553840A (zh) * | 2020-04-10 | 2020-08-18 | 北京百度网讯科技有限公司 | 图像超分辨的模型训练和处理方法、装置、设备和介质 |
CN111915491A (zh) * | 2020-08-14 | 2020-11-10 | 深圳清研智城科技有限公司 | 一种基于远近景的弱监督超分辨率重建模型及方法 |
CN112070022A (zh) * | 2020-09-09 | 2020-12-11 | 北京字节跳动网络技术有限公司 | 人脸图像识别方法、装置、电子设备和计算机可读介质 |
CN112288627A (zh) * | 2020-10-23 | 2021-01-29 | 武汉大学 | 一种面向识别的低分辨率人脸图像超分辨率方法 |
CN112419184A (zh) * | 2020-11-19 | 2021-02-26 | 重庆邮电大学 | 一种综合局部信息和全局信息的空间注意力图像去噪方法 |
CN112508929A (zh) * | 2020-12-16 | 2021-03-16 | 奥比中光科技集团股份有限公司 | 一种训练生成对抗网络的方法和装置 |
CN112598581A (zh) * | 2020-12-30 | 2021-04-02 | 中国科学院信息工程研究所 | 一种rdn超分辨网络的训练方法及图像生成方法 |
CN112950478A (zh) * | 2021-03-18 | 2021-06-11 | 武汉工程大学 | 基于双重身份属性约束的人脸超分辨率方法及系统 |
CN113435334A (zh) * | 2021-06-28 | 2021-09-24 | 中国科学院上海微系统与信息技术研究所 | 一种基于深度学习的小目标人脸识别方法 |
CN113705341A (zh) * | 2021-07-16 | 2021-11-26 | 国家石油天然气管网集团有限公司 | 一种基于生成对抗网络的小尺度人脸检测方法 |
CN113888406A (zh) * | 2021-08-24 | 2022-01-04 | 厦门仟易网络科技有限公司 | 一种通过深度学习的摄像头超分辨率方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107154023A (zh) * | 2017-05-17 | 2017-09-12 | 电子科技大学 | 基于生成对抗网络和亚像素卷积的人脸超分辨率重建方法 |
US20180075581A1 (en) * | 2016-09-15 | 2018-03-15 | Twitter, Inc. | Super resolution using a generative adversarial network |
CN109615582A (zh) * | 2018-11-30 | 2019-04-12 | 北京工业大学 | 一种基于属性描述生成对抗网络的人脸图像超分辨率重建方法 |
-
2019
- 2019-09-18 CN CN201910879159.8A patent/CN110689482B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180075581A1 (en) * | 2016-09-15 | 2018-03-15 | Twitter, Inc. | Super resolution using a generative adversarial network |
CN107154023A (zh) * | 2017-05-17 | 2017-09-12 | 电子科技大学 | 基于生成对抗网络和亚像素卷积的人脸超分辨率重建方法 |
CN109615582A (zh) * | 2018-11-30 | 2019-04-12 | 北京工业大学 | 一种基于属性描述生成对抗网络的人脸图像超分辨率重建方法 |
Non-Patent Citations (1)
Title |
---|
呼延康等: "图神经网络回归的人脸超分辨率重建", 《软件学报》 * |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111553840A (zh) * | 2020-04-10 | 2020-08-18 | 北京百度网讯科技有限公司 | 图像超分辨的模型训练和处理方法、装置、设备和介质 |
CN111915491A (zh) * | 2020-08-14 | 2020-11-10 | 深圳清研智城科技有限公司 | 一种基于远近景的弱监督超分辨率重建模型及方法 |
CN112070022A (zh) * | 2020-09-09 | 2020-12-11 | 北京字节跳动网络技术有限公司 | 人脸图像识别方法、装置、电子设备和计算机可读介质 |
CN112288627A (zh) * | 2020-10-23 | 2021-01-29 | 武汉大学 | 一种面向识别的低分辨率人脸图像超分辨率方法 |
CN112419184B (zh) * | 2020-11-19 | 2022-11-04 | 重庆邮电大学 | 一种综合局部信息和全局信息的空间注意力图像去噪方法 |
CN112419184A (zh) * | 2020-11-19 | 2021-02-26 | 重庆邮电大学 | 一种综合局部信息和全局信息的空间注意力图像去噪方法 |
CN112508929A (zh) * | 2020-12-16 | 2021-03-16 | 奥比中光科技集团股份有限公司 | 一种训练生成对抗网络的方法和装置 |
CN112598581A (zh) * | 2020-12-30 | 2021-04-02 | 中国科学院信息工程研究所 | 一种rdn超分辨网络的训练方法及图像生成方法 |
CN112598581B (zh) * | 2020-12-30 | 2023-10-24 | 中国科学院信息工程研究所 | 一种rdn超分辨网络的训练方法及图像生成方法 |
CN112950478A (zh) * | 2021-03-18 | 2021-06-11 | 武汉工程大学 | 基于双重身份属性约束的人脸超分辨率方法及系统 |
CN112950478B (zh) * | 2021-03-18 | 2022-07-19 | 武汉工程大学 | 基于双重身份属性约束的人脸超分辨率方法及系统 |
CN113435334A (zh) * | 2021-06-28 | 2021-09-24 | 中国科学院上海微系统与信息技术研究所 | 一种基于深度学习的小目标人脸识别方法 |
CN113435334B (zh) * | 2021-06-28 | 2024-02-27 | 中国科学院上海微系统与信息技术研究所 | 一种基于深度学习的小目标人脸识别方法 |
CN113705341A (zh) * | 2021-07-16 | 2021-11-26 | 国家石油天然气管网集团有限公司 | 一种基于生成对抗网络的小尺度人脸检测方法 |
CN113888406A (zh) * | 2021-08-24 | 2022-01-04 | 厦门仟易网络科技有限公司 | 一种通过深度学习的摄像头超分辨率方法 |
CN113888406B (zh) * | 2021-08-24 | 2024-04-23 | 厦门仟易网络科技有限公司 | 一种通过深度学习的摄像头超分辨率方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110689482B (zh) | 2022-09-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110689482B (zh) | 一种基于有监督逐像素生成对抗网络的人脸超分辨率方法 | |
CN110706157B (zh) | 一种基于身份先验生成对抗网络的人脸超分辨率重建方法 | |
CN111639692B (zh) | 一种基于注意力机制的阴影检测方法 | |
Engin et al. | Cycle-dehaze: Enhanced cyclegan for single image dehazing | |
CN113362223B (zh) | 基于注意力机制和双通道网络的图像超分辨率重建方法 | |
CN112288627B (zh) | 一种面向识别的低分辨率人脸图像超分辨率方法 | |
CN113673590B (zh) | 基于多尺度沙漏密集连接网络的去雨方法、系统和介质 | |
CN114898284B (zh) | 一种基于特征金字塔局部差异注意力机制的人群计数方法 | |
CN113139489A (zh) | 基于背景提取和多尺度融合网络的人群计数方法及系统 | |
Zhang et al. | Infrared thermal imaging super-resolution via multiscale spatio-temporal feature fusion network | |
Yu et al. | Background subtraction based on GAN and domain adaptation for VHR optical remote sensing videos | |
Luo et al. | Bi-GANs-ST for perceptual image super-resolution | |
Wang et al. | Single image haze removal via attention-based transmission estimation and classification fusion network | |
Wang et al. | Underwater image super-resolution using multi-stage information distillation networks | |
CN117173025A (zh) | 基于跨层混合注意力Transformer的单帧图像超分辨率方法及系统 | |
CN112435165A (zh) | 基于生成对抗网络的两阶段视频超分辨率重建方法 | |
Tang et al. | MPCFusion: Multi-scale parallel cross fusion for infrared and visible images via convolution and vision Transformer | |
CN114612456B (zh) | 一种基于深度学习的钢坯自动语义分割识别方法 | |
CN114120076B (zh) | 基于步态运动估计的跨视角视频步态识别方法 | |
CN112950481B (zh) | 一种基于图像拼接网络的水花遮挡图像数据集采集方法 | |
CN112446292B (zh) | 一种2d图像显著目标检测方法及系统 | |
CN112132746A (zh) | 面向智能路侧设备的小尺度行人目标快速超分辨率化方法 | |
Liu et al. | Super-resolution reconstruction of thermal imaging of power equipment based on Generative Adversarial Network with Channel Filtering | |
CN117474801B (zh) | 一种融合时空频信息的非均匀遥感视频影像去雾方法 | |
Han et al. | Dual discriminators generative adversarial networks for unsupervised infrared super-resolution |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |