CN108629753A

CN108629753A - 一种基于循环神经网络的人脸图像恢复方法及装置

Info

Publication number: CN108629753A
Application number: CN201810498025.7A
Authority: CN
Inventors: 钱广遴; 武筱林; 陈祥
Original assignee: GUANGZHOU HONGSEN TECHNOLOGY Co Ltd
Current assignee: GUANGZHOU HONGSEN TECHNOLOGY Co Ltd
Priority date: 2018-05-22
Filing date: 2018-05-22
Publication date: 2018-10-09

Abstract

本发明公开了一种基于循环神经网络的人脸图像恢复方法及装置，所述方法包括：获取低分辨率图像，并对所述低分辨率图像进行人脸检测，得到待恢复人脸图像；将所述待恢复人脸图像输入预先构建并训练好的神经网络模型，按照预设像素大小对所述待恢复人脸图像进行特征图的提取；将提取到的特征图进行非线性映射，得到优化的特征图；根据优化后的特征图，对所述待恢复人脸图像进行高维重构，输出相应的高分辨率人脸图像。本发明通过将双向循环神经网络技术和生成对抗网络技术进行结合，构建并训练恢复性能最优化的神经网络模型，从而能够有效地将低分辨率的人脸图像恢复出高分辨率的人脸图像。

Description

一种基于循环神经网络的人脸图像恢复方法及装置

技术领域

本发明涉及人脸识别技术领域，尤其涉及一种基于循环神经网络的人脸图像恢复方法及装置。

背景技术

目前主流的人脸图像恢复的方法有很多种，按获取目标图像的方式不同又可以分为三大类：1、基于插值的传统算法，其原理主要是通过对同一场景下的多幅图像进行对比，并且从这些图像中获得对应的亚像素信息，再通过对这些亚像素的计算获得采样点的样素信息；2、基于重建的算法：通过研究图像的高分辨率细节在低分辨率下的表现形式，建立两者之间的对应关系，并利用某种模型来刻画这种映射关系；3、基于传统机器学习方法：使用支持向量机预分类筛选出与重建人脸特征相似的样本子库，再在样本子库中精确匹配与低分辨率人脸之间相关性最高的样本子块，并利用样本子块辅助重建高分辨率人脸，这三类较为传统的恢复方法可以将人脸图像恢复到原有分辨率的2-4倍。

现有的上述三种人脸图像恢复方法都存在着一些缺陷和不足：基于插值的方法恢复的图像，没有增加图片信息，恢复倍率低；使用基于重建的算法，随着恢复倍数的增加，需要提供的输入图像样本数量急剧增加，直到达到一定的上限后，无论增加多少输入图像样本，都无法再改善重建效果；基于传统机器学习方法恢复出的人脸不够清晰，只有大概的人脸轮廓，没有清晰的五官特征。

发明内容

本发明实施例所要解决的技术问题在于，提供一种基于循环神经网络的人脸图像恢复方法及装置，通过将双向循环神经网络技术和生成对抗网络技术进行结合，构建并训练恢复性能最优化的神经网络模型，从而能够有效地将低分辨率的人脸图像恢复出高分辨率的人脸图像。

为了解决上述技术问题，本发明实施例提供了一种基于循环神经网络的人脸图像恢复方法，包括如下步骤：

获取低分辨率图像，并对所述低分辨率图像进行人脸检测，得到待恢复人脸图像；

将所述待恢复人脸图像输入预先构建并训练好的神经网络模型，按照预设像素大小对所述待恢复人脸图像进行特征图的提取；

将提取到的特征图进行非线性映射，得到优化的特征图；

根据优化后的特征图，对所述待恢复人脸图像进行高维重构，输出相应的高分辨率人脸图像。

进一步地，所述按照预设像素大小对所述待恢复人脸图像进行特征图的提取，具体为：

对所述待恢复人脸图像进行若干次卷积运算，得到预设像素大小的特征图；其中，所述预设像素大小为1×1；

将该特征图作为循环神经网络的输入，进行相应的特征图的迭代提取。

进一步地，所述神经网络模型的构建步骤为：

在搭建的循环神经网络中引入生成对抗网络；

输入预先获取的人脸图像训练样本，并通过所述人脸图像训练样本对两个卷积神经网络进行生成对抗网络的训练；

输出恢复性能最优化的神经网络模型。

进一步地，所述两个卷积神经网络分别为生成网络和判别网络；

所述人脸图像训练样本包括人脸模糊图像和人脸清晰图像，所述人脸模糊图像和所述人脸清晰图像一一对应。

进一步地，所述通过所述人脸图像训练样本对两个卷积神经网络进行生成对抗网络的训练，具体为：

将所述人脸图像训练样本中的人脸模糊图像输入生成网络，得到人脸恢复图像；

将所述人脸图像训练样本中的人脸清晰图像和所述人脸恢复图像输入判别网络进行清晰度判断，并根据判断结果捕捉人脸恢复图像和人脸清晰图像的数据分布；

根据所述数据分布和预设的恢复性能最优化目标函数计算最优参数，并根据所述最优参数生成神经网络模型。

进一步地，所述获取低分辨率图像，并对所述低分辨率图像进行人脸检测，得到待恢复人脸图像，具体为：

获取低分辨率图像；

采用模板匹配算法计算所述低分辨率图像区域的均值，以及方差；

当利用预先构建的人脸模板匹配到所述低分辨率图像区域时，计算所述人脸模板和所述低分辨率图像区域的相关系数；

将所述相关系数与预设阈值进行比较，以确定人脸区域，并筛选出至少包含一张人脸的待恢复人脸图像。

本发明实施例还提供了一种基于循环神经网络的人脸图像恢复装置，包括：

待恢复人脸图像获取单元，用于获取低分辨率图像，并对所述低分辨率图像进行人脸检测，得到待恢复人脸图像；

特征图提取单元，用于将所述待恢复人脸图像输入预先构建并训练好的神经网络模型，按照预设像素大小对所述待恢复人脸图像进行特征图的提取；

非线性映射单元，用于将提取到的特征图进行非线性映射，得到优化的特征图；

高维重构单元，用于根据优化后的特征图，对所述待恢复人脸图像进行高维重构，输出相应的高分辨率人脸图像。

进一步地，所述神经网络模型的构建步骤为：

在搭建的循环神经网络中引入生成对抗网络；

输出恢复性能最优化的神经网络模型；其中，

所述两个卷积神经网络分别为生成网络和判别网络；

将所述人脸图像训练样本中人脸清晰图像和所述人脸恢复图像输入判别网络进行清晰度判断，并根据判断结果捕捉人脸恢复图像和人脸清晰图像的数据分布；

实施本发明实施例，具有如下有益效果：

本发明实施例提供的一种基于循环神经网络的人脸图像恢复方法及装置，所述方法包括：获取低分辨率图像，并对所述低分辨率图像进行人脸检测，得到待恢复人脸图像；将所述待恢复人脸图像输入预先构建并训练好的神经网络模型，按照预设像素大小对所述待恢复人脸图像进行特征图的提取；将提取到的特征图进行非线性映射，得到优化的特征图；根据优化后的特征图，对所述待恢复人脸图像进行高维重构，输出相应的高分辨率人脸图像。本发明通过将双向循环神经网络技术和生成对抗网络技术进行结合，构建并训练恢复性能最优化的神经网络模型，从而能够有效地将低分辨率的人脸图像恢复出高分辨率的人脸图像。

附图说明

图1是本发明第一实施例提供的一种基于循环神经网络的人脸图像恢复方法的流程示意图；

图2是本发明第一实施例中按照预设像素大小对待恢复人脸图像进行特征图的提取的示意图；

图3是本发明第一实施例中神经网络模型的构建方法的流程示意图；

图4是本发明第一实施例中神经网络模型的构建方法的另一流程示意图；

图5是本发明第二实施例提供的一种基于循环神经网络的人脸图像恢复装置的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明第一实施例：

请参阅图1，图1是本发明第一实施例提供的一种基于循环神经网络的人脸图像恢复方法的流程示意图。

所述基于循环神经网络的人脸图像恢复方法，包括如下步骤：

S101、获取低分辨率图像，并对所述低分辨率图像进行人脸检测，得到待恢复人脸图像。

具体的，获取低分辨率图像；采用模板匹配算法计算所述低分辨率图像区域的均值，以及方差；当利用预先构建的人脸模板匹配到所述低分辨率图像区域时，计算所述人脸模板和所述低分辨率图像区域的相关系数；将所述相关系数与预设阈值进行比较，以确定人脸区域，并筛选出至少包含一张人脸的待恢复人脸图像。

在本实施例中，所述人脸模板的构建方法为：

搜集人脸样本，并将所述人脸样本转换为灰度图像；所述人脸样本包括人脸图像、性别、年龄和种族；

截取所述人脸图像中包含眼睛、鼻子、嘴巴、下巴和眉毛的人脸区域；

对所述人脸区域的尺寸大小进行规范化，以满足人脸区域的长宽比和面积大小的要求，得到初步人脸模板；

计算出每个初步人脸模板的均值和方差，对每个初步人脸模板，按照设定的灰度平均值和方差进行标准化，以消除光照对肤色的影响和相比于灰度均衡化，得到最终的人脸模板。

S102、将所述待恢复人脸图像输入预先构建并训练好的神经网络模型，按照预设像素大小对所述待恢复人脸图像进行特征图的提取。

请参阅图2，图2是本发明第一实施例中按照预设像素大小对待恢复人脸图像进行特征图的提取的示意图。

在本实施例中，所述按照预设像素大小对所述待恢复人脸图像进行特征图的提取，具体为：

需要说明的是，待恢复人脸图像的特征提取是经过卷积神经网络(CNNConvolutional Neural Networks)结构进行处理的，图2为CNN卷积神经网络的经典结构，图中32*32像素的图片(图中的字母是“A”)，经过卷积运算，得到6个大小为28*28的特征图；每个28*28的特征图经过下采样可得到14*14大小的图片，14*14的图片经过卷积运算得到16个10*10的特征图，经过如此多次卷积运算，最后可以得到一个120个1*1的特征图，然后将这些1*1的特征图作为RNN循环神经网络的输入。

其中，卷积神经网络由一个或多个卷积层组成，卷积神经网络中每层卷积层由若干卷积单元组成，每个卷积单元的参数都是通过反向传播算法最佳化得到的。卷积运算的目的是提取输入的不同特征，第一层卷积层可能只能提取一些低级的特征如边缘、线条和角等层级，更多层的网络能从低级特征中迭代提取更复杂的特征。

在本实施例中，请一并参阅图3-4，图3是本发明第一实施例中神经网络模型的构建方法的流程示意图，图4是本发明第一实施例中神经网络模型的构建方法的另一流程示意图。

所述神经网络模型的构建步骤为：

S201、在搭建的循环神经网络中引入生成对抗网络；

S202、输入预先获取的人脸图像训练样本，并通过所述人脸图像训练样本对两个卷积神经网络进行生成对抗网络的训练；

S203、输出恢复性能最优化的神经网络模型。

具体的，搭建双向循环神经网络的步骤为：

1)、定义LSTMcell类和GRUcell类：定义LSTMcell及GRUcell包含所有学习所需要的参数以及每一时刻所要运行的step方法；

2)、定义RNN函数：用于接受cell的实例，并用scan计算所有time steps的hiddenstates；

3)、编写权重初始化方法：合理的初始化权重，可以降低网络在学习时卡在鞍点或极小值的损害，增加学习速度和效果；

4)、构建网络；

5)、训练网络：利用tensorboard来记录和分析所学习的权重矩阵和loss的下降，防止训练出的模型过拟合。

可以理解的是，循环神经网络(RNN：recurrent neural networks)：是时间递归神经网络(recurrent neural network)和结构递归神经网络(recursive neural network)，两种人工神经网络的总称。循环神经网络(RNN)能够有效处理基于时间序列的问题，具体的表现形式为循环神经网络网络会对前面的信息进行记忆并应用于当前输出的计算中，即隐藏层之间的节点不再是无连接而是有连接的，并且隐藏层的输入不仅包括输入层的输出还包括上一时刻隐藏层的输出。

引入生成对抗网络的步骤为：

1)、搭建discriminator网络(判别网络)；

2)、定义D网络损失函数：D网络使用同一套参数分辨两种输入，一种是groundtruth，另一种是G网络的输出。对于ground truth，训练目标为尽可能判为1，对于G网络的输出，训练目标为尽可能判为0；

3)、对抗训练。

可以理解的是，生成对抗网络(GAN:Generative Adversarial Nets)：是一种深度学习模型。模型通过框架中(至少)两个模块：生成模型(Generative Model)和判别模型(Discriminative Model)的互相博弈学习产生相当好的输出。原始GAN理论中，并不要求G和D都是神经网络，只需要是能拟合相应生成和判别的函数即可。一个优秀的GAN应用需要有良好的训练方法，否则可能由于神经网络模型的自由性而导致输出不理想。

在本实施例中，所述两个卷积神经网络分别为生成网络和判别网络；所述人脸图像训练样本包括人脸模糊图像和人脸清晰图像，所述人脸模糊图像和所述人脸清晰图像一一对应。

所述通过所述人脸图像训练样本对两个卷积神经网络进行生成对抗网络的训练，具体为：

其中，所述预设的恢复性能最优化目标函数为：

其中，D(x)表示x属于分布M的概率，x～p_data(x)表示x取自清晰人脸分布，z～p_z(z)表示z取自重建人脸的分布，G表示生成网络，D表示判别网络。

S103、将提取到的特征图进行非线性映射，得到优化的特征图。

可以理解的是，非线性映射是对卷积神经网络处理得到的特征图进行非线性处理，利用训练得到的特征(特征可以看做是为非线性函数)，对低像素人脸相关特征进行优化。引入非线性因素，是解决线性模型所不能解决的问题。

S104、根据优化后的特征图，对所述待恢复人脸图像进行高维重构，输出相应的高分辨率人脸图像。

可以理解的是，高维重构是指，经过循环神经网络和生成对抗网络训练后的模型可以获得一些特征，低像素的人脸包含的人脸特征相对高像素的人脸是比较少的，神经网络利用训练得到特征对人脸图像进行更多特征维度的逆向重构，恢复出高像素的人脸图像。

根据上述实施例，本发明运用了双向循环神经网络(RNN)，能够有效处理基于时间序列的问题，可以对前面的信息进行记忆并应用于当前输出的计算中，即隐藏层之间的节点不再是无连接而是有连接的，并且隐藏层的输入不仅包括输入层的输出还包括上一时刻隐藏层的输出；该神经结构在输入和目标之间添加延迟，进而可以给网络加入未来的上下文信息，提供给输出层输入序列中每一个点的完整的过去和未来的上下文信息。利用此项技术可以解决目前现有人脸图像恢复方法恢复倍率低(传统方法可恢复2～4倍)的问题，可将人脸序列恢复到原有分辨率的2～8倍。

在双向循环神经网络基础上结合生成对抗网络(GAN)技术，编写定义了判别网络，通过生成网络和判别网络相互博弈的方式进行学习：即在人脸图像恢复的应用中，生成网络(双向循环神经网络)从低分辨率的人脸图片恢复出高分辨率人脸图片，判别网络目的是将生成网络的恢复的人脸图片从真实样本中分辨出来，而生成网络则要尽可能地欺骗判别网络。两个网络相互对抗、不断调整参数，共同优化，最终生成网络可以恢复出足够逼真的高分辨率人脸图像，解决了传统机器学习方法恢复出的人脸不够清晰，五官特征不明显的问题。

本实施例提供的一种基于循环神经网络的人脸图像恢复方法，包括：获取低分辨率图像，并对所述低分辨率图像进行人脸检测，得到待恢复人脸图像；将所述待恢复人脸图像输入预先构建并训练好的神经网络模型，按照预设像素大小对所述待恢复人脸图像进行特征图的提取；将提取到的特征图进行非线性映射，得到优化的特征图；根据优化后的特征图，对所述待恢复人脸图像进行高维重构，输出相应的高分辨率人脸图像。本实施例通过将双向循环神经网络技术和生成对抗网络技术进行结合，构建并训练恢复性能最优化的神经网络模型，从而能够有效地将低分辨率的人脸图像恢复出高分辨率的人脸图像。

本发明第二实施例：

请参阅图5，图5是本发明第二实施例提供的一种基于循环神经网络的人脸图像恢复装置的结构示意图。

所述基于循环神经网络的人脸图像恢复装置，包括：

待恢复人脸图像获取单元301，用于获取低分辨率图像，并对所述低分辨率图像进行人脸检测，得到待恢复人脸图像。

在本实施例中，所述人脸模板的构建方法为：

特征图提取单元302，用于将所述待恢复人脸图像输入预先构建并训练好的神经网络模型，按照预设像素大小对所述待恢复人脸图像进行特征图的提取。

所述神经网络模型的构建步骤为：

S201、在搭建的循环神经网络中引入生成对抗网络；

S203、输出恢复性能最优化的神经网络模型。

具体的，搭建双向循环神经网络的步骤为：

4)、构建网络；

引入生成对抗网络的步骤为：

1)、搭建discriminator网络(判别网络)；

3)、对抗训练。

其中，所述预设的恢复性能最优化目标函数为：

非线性映射单元303，用于将提取到的特征图进行非线性映射，得到优化的特征图，

高维重构单元304，用于根据优化后的特征图，对所述待恢复人脸图像进行高维重构，输出相应的高分辨率人脸图像。

本实施例提供的一种基于循环神经网络的人脸图像恢复装置，通过获取低分辨率图像，并对所述低分辨率图像进行人脸检测，得到待恢复人脸图像；将所述待恢复人脸图像输入预先构建并训练好的神经网络模型，按照预设像素大小对所述待恢复人脸图像进行特征图的提取；将提取到的特征图进行非线性映射，得到优化的特征图；根据优化后的特征图，对所述待恢复人脸图像进行高维重构，输出相应的高分辨率人脸图像。本实施例通过将双向循环神经网络技术和生成对抗网络技术进行结合，构建并训练恢复性能最优化的神经网络模型，从而能够有效地将低分辨率的人脸图像恢复出高分辨率的人脸图像。

以上所述是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和变形，这些改进和变形也视为本发明的保护范围。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)或随机存储记忆体(Random AccessMemory，RAM)等。

Claims

1.一种基于循环神经网络的人脸图像恢复方法，其特征在于，包括如下步骤：

将提取到的特征图进行非线性映射，得到优化的特征图；

2.根据权利要求1所述的基于循环神经网络的人脸图像恢复方法，其特征在于，所述按照预设像素大小对所述待恢复人脸图像进行特征图的提取，具体为：

3.根据权利要求1所述的基于循环神经网络的人脸图像恢复方法，其特征在于，所述神经网络模型的构建步骤为：

在搭建的循环神经网络中引入生成对抗网络；

输出恢复性能最优化的神经网络模型。

4.根据权利要求3所述的基于循环神经网络的人脸图像恢复方法，其特征在于，所述两个卷积神经网络分别为生成网络和判别网络；

5.根据权利要求3所述的基于循环神经网络的人脸图像恢复方法，其特征在于，所述通过所述人脸图像训练样本对两个卷积神经网络进行生成对抗网络的训练，具体为：

6.根据权利要求1所述的基于循环神经网络的人脸图像恢复方法，其特征在于，所述获取低分辨率图像，并对所述低分辨率图像进行人脸检测，得到待恢复人脸图像，具体为：

获取低分辨率图像；

7.一种基于循环神经网络的人脸图像恢复装置，其特征在于，包括：

8.根据权利要求7所述的基于循环神经网络的人脸图像恢复装置，其特征在于，所述按照预设像素大小对所述待恢复人脸图像进行特征图的提取，具体为：

9.根据权利要求7所述的基于循环神经网络的人脸图像恢复装置，其特征在于，所述神经网络模型的构建步骤为：

在搭建的循环神经网络中引入生成对抗网络；

输出恢复性能最优化的神经网络模型；其中，

所述两个卷积神经网络分别为生成网络和判别网络；

10.根据权利要求9所述的基于循环神经网络的人脸图像恢复装置，其特征在于，所述通过所述人脸图像训练样本对两个卷积神经网络进行生成对抗网络的训练，具体为：