CN112184552A

CN112184552A - 一种基于高频特征学习的子像素卷积图像超分辨方法

Info

Publication number: CN112184552A
Application number: CN202011006454.1A
Authority: CN
Inventors: 谢业华; 阎乃臣; 孙树才; 张传羽; 姬海超; 姜啸远; 江涛; 刘宏坤
Original assignee: Nari Technology Co Ltd; NARI Nanjing Control System Co Ltd
Current assignee: Nari Technology Co Ltd; NARI Nanjing Control System Co Ltd
Priority date: 2020-09-23
Filing date: 2020-09-23
Publication date: 2021-01-05
Anticipated expiration: 2040-09-23
Also published as: CN112184552B

Abstract

本发明公开了一种基于高频特征学习的子像素卷积图像超分辨方法，使用低分辨率的图像输入到网络中，对低分辨率图像进行特征学习；在生成网络中引入卷积残差层，将输入作为特征图与卷积特征图级联，卷积残差层自适应学习级联特征图的权重，将残差学习下沉到各子像素特征层；通过映射获得多通道特征图，并视为高分辨图像的子像素层；基于卷积网络结构获取高频特征映射参数，引入高频特征映射对比损失与像素级误差损失的多任务损失函数，使生成的图像与超分辨图像在高频域上更接近。本发明引入卷积残差层，减少整个网络低频域的误差；将残差学习下沉到各子像素特征层，获得图像更多高频纹理信息；展示图像更多高频细节，提高超分辨重构后的视觉体验。

Description

一种基于高频特征学习的子像素卷积图像超分辨方法

技术领域

本发明属于管廊安防监控、特征学习、图像处理等领域，具体地涉及一种基于高频特征学习的子像素卷积图像超分辨方法。

背景技术

图像超分辨技术是基于低分辨率小尺度图像，通过重构技术生成超分辨率，能够展现更多细节信息的图像，超分辨重构技术在安防监控、医疗影像、遥感测绘等领域有广泛的应用前景。近些年来，深度学习技术快速发展，超分辨重构可以通过深度网络端到端自动学习低分率到超分辨重构复杂的映射关系，避免传统算法的局限性。

超像素卷积神经网络是一种基于卷积神经网络端到端的图像重构方法，低分辨率图像块插值上采样后作为超分辨网络的输入,通过训练卷积层的映射参数，生成高分辨图像。但使用上采样作为输入的方法增加计算复杂度和训练困难度，影响了图像超分辨重构的时效性。

超分辨网络使用更深的、尺度更小的权重层来更精确提取图片的语义信息。此外，还使用残差的方法，使网络学习低分辨率与目标高分辨图像的差异来加快训练，能够学习更多的高频纹理信息。

发明内容

发明目的：本发明提供了一种基于高频特征学习的子像素卷积图像超分辨方法，从改进生成网络的结构和改善损失函数局限性两方面，目的是使改进后的网络有更好的高频特征学习能力。

技术方案：本发明所述的一种基于高频特征学习的子像素卷积图像超分辨方法，包括以下步骤：

(1)使用低分辨率的图像输入到子像素卷积网络中，对低分辨率图像进行特征学习；

(2)在子像素卷积网络中引入卷积残差层，将输入作为特征图与卷积特征图级联，卷积残差层自适应学习级联特征图的权重，将残差学习下沉到各子像素特征层，减少子像素卷积网络低频域的误差；

(4)通过映射获得多通道特征图，将特征图视为高分辨图像的子像素层；

(5)基于子像素卷积网络结构获取高频特征映射参数φ_p；选取目标高分辨图像和对应的低分辨率图像双三次插值上采样后图像，输入到映射的卷积网络中，优化参数最大化两者在高频特征层上的距离；

(6)引入高频特征映射对比损失与像素级误差损失的多任务损失函数，使生成的图像与超分辨图像在高频域上更接近。

进一步地，所述步骤(2)的实现过程如下：

在传统的子像素卷积超分辨的最后一层隐藏层和子像素卷积重构层之间增加残差卷积层，卷积特征层的实现公式如下：

Xⁿ＝F_n(Concat(F_1m-1(I)，l))

其中，I是输入低分辨率图像，F_1n：n-1是隐藏层的映射参数,F_n是残差卷积层的参数。

进一步地，所述步骤(5)通过以下公式实现：

其中，I^SR，I^B分别为输入的高分辨图像和其对应的低分辨率双三次插值上采样后的图像，φ_p为对应高频特征的映射参数，C，W_p，H_p分别为高频特征层的特征图层数，宽度和高度；学习目标通过学习φ_p最大化I^SR，I^B经过φ_p后特征层的均方误差，通过对其取负对数运算，可以使用梯度下降迭代方法求取最优值φ_p。

进一步地，步骤(6)所述的多任务损失函数为：

获取φ_p之后，通过一个像素级误差损失和高频特征误差损失多的任务学习的目标函数来训练生成网络的参数θ_g，

为生成图像与高分辨图像的像素级的损失，

为生成图像与高分辨图像高频感知特征的损失，α为

的系数。

有益效果：与现有技术相比，本发明的有益效果：本发明在传统子像素卷积超分辨重构网络中，引入残差块可以解决更深的网络引起的梯度爆炸和梯度消失的问题，避免网络层数增多的退化现象；先输入的信息直接传递到后层参与运算，迫使重构网络更多学习到残差信息，对应图像的高频细节特征，减轻低频信息对超分辨重构的干扰。

附图说明

图1为本发明的流程图；

图2为引入残差卷积层的子像素卷积生成网络级联图；

图3为高频特征映射的网络结构图。

具体实施方式

下面结合附图对本发明作进一步详细说明。

本发明提供了一种基于高频特征学习的子像素卷积图像超分辨方法，从改进生成网络的结构和改善损失函数局限性两方面，目的是使改进后的网络有更好的高频特征学习能力，如图1所示，主要包括以下步骤。

1、子像素卷积超分辨重构网络

使用低分辨率的图像输入到子像素卷积网络中，对低分辨率图像进行特征学习；在子像素卷积网络中引入卷积残差层，将输入作为特征图与卷积特征图级联，卷积残差层自适应学习级联特征图的权重，将残差学习下沉到各子像素特征层，减少子像素卷积网络低频域的误差。

在深度学习网络中引入残差块可以解决更深的网络引起的梯度爆炸和梯度消失的问题，避免网络层数增多的退化现象。如图2所示，引入残差卷积层的子像素卷积生成网络级联图，在传统的子像素卷积超分辨的最后一层隐藏层和子像素卷积重构层之间增加残差卷积层。先输入的信息直接传递到后层参与运算，迫使重构网络更多学习到残差信息，对应图像的高频细节特征，减轻低频信息对超分辨重构的干扰。

在子像素卷积超分辨重构网络中，若输入低分辨率图像尺寸为W，H，重构比例为r，超分辨图像的尺寸为rW，rH，直接把输入数值加到输出端存在习残差，把输入与隐藏层的特征图级联，作为新增低频信息的特征图，通过卷积操作，让各子像素层自适应利用输入的低分辨率的信息，确保隐藏能更好学习高频特征。

引入残差思想的卷积层改进超分辨的生成网络，在传统的子像素卷积超分辨的最后一层隐藏层和子像素卷积重构层之间增加残差卷积层，卷积特征层的实现公式如下：

Xⁿ＝F_n(Concat(F_1：n-1(I)，I))

其中I是输入低分辨率图像，F_1：n-1是隐藏层的映射参数,F_n是残差卷积层的参数。残差卷积层可以在子像素重构层之前引入输入信息，学习更多的细节高频信息，而且通过学习权重，学习各子像素特征图与级联后特征图的权重映射关系，让重构的图像自适应得利用输入低分辨率图像信息，避免直接引入残差带来的刚性误差。

2、高频特征映射

通过映射获得多通道特征图，将特征图视为高分辨图像的子像素层；基于子像素卷积网络结构获取高频特征映射参数φ_p；选取目标高分辨图像和对应的低分辨率图像双三次插值上采样后图像，输入到映射的卷积网络中，优化参数最大化两者在高频特征层上的距离。

高频特征映射p的网络结构如图2所示，基于卷积网络结构获取高频特征映射参数φ_p，训练映射参数φ_p时，选取目标高分辨图像和对应的低分辨率图像双三次插值上采样后图像，输入到映射的卷积网络中，优化参数最大化两者在高频特征层上的距离。高频特征映射原理，先在像素级层面上超分辨和上采样的低分辨率图片距离接近，通过映射后在高频空间两者距离增大。映射过程过滤低频信息，使低分辨率和高分辨图像特征映射后响应值差异增大，生成图像特征通过p映射后可以作为反映超分辨重构高频锐化能力的有效特征，如图3所示。

在训练φ_p过程中，优化函数如公式如下：

其中I^SR，I^B分别为输入的高分辨图像和其对应的低分辨率双三次插值上采样后的图像。φ_p为对应高频特征的映射参数，C，W_p，H_p分别为高频特征层的特征图层数，宽度和高度。学习目标通过学习φ_p最大化I^SR，I^B经过φ_p后特征层的均方误差，通过对其取负对数运算，可以使用梯度下降迭代方法求取最优值φ_p。

3、多任务损失函数

引入高频特征映射对比损失与像素级误差损失的多任务损失函数，使生成的图像与超分辨图像在高频域上更接近。

获取了φ_p之后，通过一个像素级误差损失和高频特征误差损失多的任务学习的目标函数来训练生成网络的参数θ_g，

为生成图像与高分辨图像的像素级的损失，

为生成图像与高分辨图像高频感知特征的损失，α为

的系数。

使用CelebA数据集中标准化剪裁过的人脸图像的部分，使用其中的200000张作为训练样本，其余2599张作为测试样本。CelebA是香港中文大学公开的包含一万多位名人的，数十万张人脸照片的数据集，在基于深度学习的人脸识别、检测、超像素实验中被广泛使用。

对数据集中的人脸图像从中间部位提取128*128像素部分作为高分辨图像，把高分辨图像下采样r＝4，32*32的图像作为输入的低分率图像。训练过程中为了求取高频特征映射参数，对训练数据采用插值生成与目标高分辨尺度一致的图像。首先训练求取φ_p，把训练数据集高分辨图像和对应上采样后的低分辨率图像同时输入特征映射的卷积网络。通过学习参数使得两者在高频域内的距离最大，学习率设置为0.0002，迭代10000次后损失值无明显的下降，保存对应网络参数即为φ_p。接下来训练生成网络，把训练数据集中的低分辨图输入到网络中生成图片，通过与目标超分辨图片的像素级损失和高频特征损失值的联合损失反向传播，学习超分辨生成网络的参数。训练感知损失的系数设置为0.01,学习率是0.0002，迭代50000次后学习率降为0.00002。

本发明实施例提供的使用本发明方法基于高频特征学习的子像素卷积超分辨技术的结果；对比双三次插值和传统子像素卷积网络的结果,明显表明本发明在锐化特征学习方面有优势，能更好的学习人脸的细节特征。在PSNR、SSIM和MOS等评价体系下，本发明优势明显，可见基于高频特征学习的子像素卷积网络对传统的子像素卷积网络方法在超分辨的质量上有大幅提升。

Claims

1.一种基于高频特征学习的子像素卷积图像超分辨方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的基于高频特征学习的子像素卷积图像超分辨方法，其特征在于，所述步骤(2)的实现过程如下：

Xⁿ＝F_n(Concat(F_1：n-1(I)，I))

其中，I是输入低分辨率图像，F_1：n-1是隐藏层的映射参数，F_n是残差卷积层的参数。

3.根据权利要求1所述的基于高频特征学习的子像素卷积图像超分辨方法，其特征在于，所述步骤(5)通过以下公式实现：

4.根据权利要求1所述的基于高频特征学习的子像素卷积图像超分辨方法，其特征在于，步骤(6)所述的多任务损失函数为：

为生成图像与高分辨图像的像素级的损失，

为生成图像与高分辨图像高频感知特征的损失，α为

的系数。