CN111626937A

CN111626937A - 一种人像超分辨率重建方法

Info

Publication number: CN111626937A
Application number: CN202010464604.7A
Authority: CN
Inventors: 贾宇; 沈宜; 张家亮; 陈鹏; 董弋粲
Original assignee: Chengdu 30kaitian Communication Industry Co ltd
Current assignee: Shenzhen Wanglian Anrui Network Technology Co ltd
Priority date: 2020-05-28
Filing date: 2020-05-28
Publication date: 2020-09-04

Abstract

本发明公开了一种人像超分辨率重建方法，包括如下步骤：步骤1，获取人像高分辨率图像；步骤2，对获取的人像高分辨率图像重建，以得到与之对应的人像低分辨率图像；步骤3，对人像高分辨率图像和与之对应的人像低分辨率图像进行图像预处理；步骤4，把图像预处理后的人像高分辨率图像和与之对应的人像低分辨率图像作为成对人像，将所述成对人像输入深度神经网络进行训练，学习人像低分辨率图像与人像高分辨率图像之间的特征映射，训练完成后得到人脸图片超分辨重建模型；步骤5，将测试图像输入人脸图片超分辨重建模型进行人脸图片超分辨重建。本发明实现了基于深度神经网络的人像超分辨率重建方法。

Description

一种人像超分辨率重建方法

技术领域

本发明涉及人脸超分辨率重建的技术，特别涉及一种基于人脸选取与人脸修改相结合、网络结构修整的多通道的人像超分辨率重建方法。

背景技术

图像超分辨率(SR)问题，尤其是单一图像超分辨率(SISR)问题，在近几十年中已经受到了广泛的研究关注。SISR问题旨在从一个单一低分辨率图像中重构出一个高分辨率图像。通常情况下，低分辨率图像和原始的高分辨率图像可根据情境而产生变化。传统算法是采用插值的方式填充图像变换时像素之间的空隙，存在着得到的图像质量不高，放大后锯齿的情况。

发明内容

本发明的目的是提供一种人像超分辨率重建方法，该方法基于人像低-高分辨率图像成对重建、基于深度学习的SR通过神经网络直接学习人像低分辨率图像到人像高分辨率图像的特征映射，用于对互联网新媒体传播通道中传播的人脸图片、视频中人像图片等视图像进行超分辨重建。

本发明采用的技术方案为：一种人像超分辨率重建方法，包括如下步骤：

步骤1，获取人像高分辨率图像；

步骤2，对获取的人像高分辨率图像重建，以得到与之对应的人像低分辨率图像；

步骤3，对人像高分辨率图像和与之对应的人像低分辨率图像进行图像预处理；

步骤4，把图像预处理后的人像高分辨率图像和与之对应的人像低分辨率图像作为成对人像，将所述成对人像输入深度神经网络进行训练，学习人像低分辨率图像与人像高分辨率图像之间的特征映射，训练完成后得到人脸图片超分辨重建模型；

步骤5，将测试图像输入人脸图片超分辨重建模型进行人脸图片超分辨重建。

进一步地，步骤1中获取的人像高分辨率图像为从网络中下载的无损人脸图片。

进一步地，步骤2中，对获取的人像高分辨率图像进行重建的方法包括：散焦模糊、随机旋转、仿射变换和双三次插值编码。

进一步地，步骤2中，采用多线程的方式对获取的人像高分辨率图像进行重建。

进一步地，步骤3中对人像高分辨率图像和与之对应的人像低分辨率图像进行图像预处理的方法为：先将人像高分辨率图像和人像低分辨率图像拆分成红绿蓝RGB三通道，然后转化为YCbCr格式。

进一步地，步骤4中的深度神经网络为：依次连接的1个通用卷积层、4个残差块、1个通用卷积层、若干上采样层和1个通用卷积层；其中，

所述通用卷积层为一个卷积核大小为3×3、步长为1、输出通道为128的卷积层；

所述残差块包括1个所述通用卷积层，设置的激活函数为ReLU，并采用正则化规范处理；每两层残差块之间增加一个捷径，即将上一个残差块的输入直接向下一个残差块的输入连接了一条传递线来进行恒等映射，以进行残差计算；

所述上采样层包括1个特殊卷积层，其后进行像素缩放，设置的激活函数为ReLU，并采用正则化规范处理；所述特殊卷积层为一个卷积核大小为3×3、步长为1、输出通道为512的卷积层。

进一步地，所述深度神经网络采用L1范数损失函数作为损失函数。

进一步地，步骤4中在所述深度神经网络训练过程中，学习率随着迭代次数逐步衰减。

综上所述，由于采用了上述技术方案，本发明的有益效果是：

本发明基于人像低-高分辨率图像成对重建、基于深度学习的SR通过神经网络直接学习人像低分辨率图像到人像高分辨率图像的特征映射，从而实现了基于深度神经网络的人像超分辨率重建方法。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本发明的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1为本发明的原理图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明，即所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此，以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围，而是仅仅表示本发明的选定实施例。基于本发明的实施例，本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本发明保护的范围。

以下结合实施例对本发明的特征和性能作进一步的详细描述。

本实施例提供的一种人像超分辨率重建方法，包括如下步骤：

步骤1，获取人像高分辨率图像：可以通过网络爬虫技术从互联网中下载无损人脸图片作为本实施例需要的人像高分辨率图像。

步骤2，对获取的人像高分辨率图像重建，以得到与之对应的人像低分辨率图像；为了提高效率，本实施例采用多线程的方式对获取的人像高分辨率图像进行重建，保证每一张图像快速而独立地进行人像高分辨图像到人像低分辨图像的转换；具体地，对获取的人像高分辨率图像进行重建的方法包括：

步骤2.1，散焦模糊：散焦模糊在摄影上又称景深，通过更大的光圈来收集光线增加人像高分辨率图像的亮度，以便后续得到模糊的人像低分辨率图像。

步骤2.2，随机旋转：首先获得经过步骤2.1处理后的图像像素中心点，通过随机设定旋转的角度进行旋转，其中角度为正则表示逆时针旋转，角度为负表示逆时针旋转。

步骤2.3，仿射变换：对步骤2.2处理后的图像进行放射变换，实现该图像从二维坐标到二维坐标之间的线性变换，且保持二维图像的平直性和平行性。

步骤2.4，双三次插值编码：通过双三次插值编码对步骤2.3处理后的图像进行缩放。本实施例设定缩放因子为4，即可以将人像高分辨率图像压缩为4倍的人像低分辨率图像。

步骤3，对人像高分辨率图像和与之对应的人像低分辨率图像进行图像预处理；具体地：先将人像高分辨率图像和人像低分辨率图像拆分成红绿蓝RGB三通道，然后转化为YCbCr格式；其中Y表示明亮度，也就是灰阶值；Cb反映的是红绿蓝RGB三通道中蓝色部分与亮度值之间的差异；Cr反映的是红绿蓝RGB三通道中红色部分与亮度值之间的差异。

所述深度神经网络为：依次连接的1个通用卷积层、4个残差块、1个通用卷积层、若干上采样层和1个通用卷积层；也就是说，成对人像通过1个通用卷积层提取特征，其后输出到4个残差块，再次通过1个通用卷积层提取特征，接着通过上采样层放大，最后再跟着1个通用卷积层。

其中，

所述残差块包括1个所述通用卷积层，设置的激活函数为ReLU，并采用正则化规范处理；每两层残差块之间增加一个捷径，即将上一个残差块的输入直接向下一个残差块的输入连接了一条传递线来进行恒等映射，以进行残差计算；通过残差计算，可以解决可能存在的梯度消失，网络退化的问题。

所述上采样层包括1个特殊卷积层，其后进行像素缩放，缩放倍数可以设置为2，设置的激活函数为ReLU，并采用正则化规范处理；所述特殊卷积层为一个卷积核大小为3×3、步长为1、输出通道为512的卷积层。上采样层可以执行2-3次。

在成对人像输入深度神经网络进行训练前，预先设置模型参数，包括：模型名称、激活函数的选择，以及每轮训练输入的成对人像的数量。也就是说，可以将步骤1～3得到的成对人像分为若干个批次，以数据量较小的一块块进行训练可以节约时间；另外，可以设置在进行多少个批次的训练后进行测试。其中，每轮训练输入的成对人像的数量，可以根据配置的线程数量、GPU数量等进行设置。

损失函数通过对预测样本和真实样本标记产生的误差反向传播指导网络参数学习，极为重要。在本实施例中，所述深度神经网络采用L1范数损失函数作为损失函数，它能把目标值与估计值的绝对差值的总和最小化，公式如下：

其中，

表示目标值，y表示估计值。此处目标值为高分辨图像，估计值为低分辨图像，由于目标值存在噪点，对数据来说即为噪点，而L1范数损失函数因为是绝对差值的总和最小化，所以能够非常好的处理数据中的异常值。

在训练过程中，可能出现训练集的损失下降到一定的程度后就不在下降了，这和学习率的设定值息息相关，因为学习率决定着目标函数的损失能收敛到局部最小值。面对这种情况，采用学习率随着迭代次数逐步衰减的方式来让损失能收敛到局部最小值，例如，在整个数据集上5轮迭代训练后学习率减半，下降至设定值后就不在下降了，一般可以设定其中初始学习率为1e-4，最终学习率为1e-5。另外，还需要时刻记录损失的变化来观察模型是否达到拟合，保存模型中间的输出结果，，以防止服务器宕机的状况。

步骤5，将测试图像输入人脸图片超分辨重建模型进行人脸图片超分辨重建。测试图像输入人脸图片超分辨重建模型进行的处理过程与前述训练过程类似，在此不再赘述。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

Claims

1.一种人像超分辨率重建方法，其特征在于，包括如下步骤：

步骤1，获取人像高分辨率图像；

2.根据权利要求1所述的人像超分辨率重建方法，其特征在于，步骤1中获取的人像高分辨率图像为从网络中下载的无损人脸图片。

3.根据权利要求1所述的人像超分辨率重建方法，其特征在于，步骤2中，对获取的人像高分辨率图像进行重建的方法包括：散焦模糊、随机旋转、仿射变换和双三次插值编码。

4.根据权利要求1或3所述的人像超分辨率重建方法，其特征在于，步骤2中，采用多线程的方式对获取的人像高分辨率图像进行重建。

5.根据权利要求1所述的人像超分辨率重建方法，其特征在于，步骤3中对人像高分辨率图像和与之对应的人像低分辨率图像进行图像预处理的方法为：先将人像高分辨率图像和人像低分辨率图像拆分成红绿蓝RGB三通道，然后转化为YCbCr格式。

6.根据权利要求1所述的人像超分辨率重建方法，其特征在于，步骤4中的深度神经网络为：依次连接的1个通用卷积层、4个残差块、1个通用卷积层、若干上采样层和1个通用卷积层；其中，

7.根据权利要求6所述的人像超分辨率重建方法，其特征在于，所述深度神经网络采用L1范数损失函数作为损失函数。

8.根据权利要求7所述的人像超分辨率重建方法，其特征在于，步骤4中在所述深度神经网络训练过程中，学习率随着迭代次数逐步衰减。