CN110310227A

CN110310227A - 一种基于高低频信息分解的图像超分辨率重建方法

Info

Publication number: CN110310227A
Application number: CN201910569333.9A
Authority: CN
Inventors: 李帅; 朱策; 于嘉山; 方嘉仪; 高艳博
Original assignee: University of Electronic Science and Technology of China
Current assignee: University of Electronic Science and Technology of China
Priority date: 2019-06-27
Filing date: 2019-06-27
Publication date: 2019-10-08
Anticipated expiration: 2039-06-27
Also published as: CN110310227B

Abstract

本发明公开了一种基于高低频信息分解的图像超分辨率重建方法，包括以下步骤：对超分辨率数据集做数据预处理，得到训练神经网络所需的LR‑HR图像块对；将HR图像块G进行高低频信息分解；构建卷积神经网络模型；利用前述步骤生成的训练样本数据对构建的卷积神经网络模型进行训练，得到优化后的卷积神经网络模型；利用优化后的卷积神经网络模型，输入LR图像，生成对应的HR图像。本发明设计了优化的神经网络结构，有效生成HR图像的低频和高频信息，更好地重建高分辨率的图像。

Description

一种基于高低频信息分解的图像超分辨率重建方法

技术领域

本发明涉及图像处理技术领域，特别是一种基于高低频信息分解的图像超分辨率重建方法。

背景技术

图像的超分辨率问题(Super-Resolution)是计算机视觉中的一类重要问题，是指从一张或多张低分辨率(Low-Resolution，LR)图像中，重构出相应的高分辨率(High-Resolution，HR)图像。主要分为两类，一是从单张低分辨率图像中重建出高分辨率图像，二是从多张低分辨率图像中重建出高分辨率图像。超分辨率问题的核心是如何利用低分辨率图像的内部相关信息来生成图像的高频细节信息。

目前，深度学习在计算机领域中表现出巨大潜力，基于神经网络学习的方法可以自动的从大量数据中学习特征提取方法，而且由于深度模型极高的复杂度，使得它可以建立由低分辨率图像到复杂特征再到高分辨率图像的非线性变换，充分利用有限信息来直接进行从低分辨图像到高分辨图像的端到端学习，带来了更好的性能和表现，在图像超分辨问题中成为主流。

近些年的图像超分辨率网络主要分为两种：一种是只有局部的跳过连接(SkipConnection)，即只在上采样网络前进行跳过连接。EDSR、SRDenseNet、RCAN等图像超分辨率网络都采用这类结构；另一种是有全局的SkipConnection，即只通过神经网络来生成HR图像中的细节信息，而HR图像的结构信息则通过直接地双三次插值放大获得。IDN、WDSR等图像超分辨率网络都采用这类结构。因为人眼对图像质量的感知结果主要表现在细节信息上，而后者可以利用同等规模的网络来更好地学习细节信息表征，因此，后者在理论和直观上都具有更好的性能。

随着信息技术的发展，低分辨率图像已经难以满足人们对于高清影像的需求。高分辨率图像的像素密度高，细节清晰，信息丰富，因而能够满足图像分析，图像理解的实际应用需求。图像分辨率的提升有助于图像细节的观察和分析，从而为后续的图像处理如目标检测，图像分割等提供更多有用的信息，高分辨率图像的获取是后续图像处理取得良好效果的重要保障。

超分辨技术从出现以来，大致经历了插值、重建、学习三个阶段的发展过程。其中插值的方法出现的最早，其假设图像具有连续的灰度值，待插像素的灰度值可以根据邻域像素估计得到。在实际应用中获取的图像往往不符合这种假设，因而重建出的图像容易出现锯齿、模糊等现象。其更多的是作为一种上采样的策略，很多时候会作为后两种方法的一个预处理工作被使用。而基于重建的方法通常需要将同一场景的多幅图像进行信息融合，主要包括配准、插值、重构3个步骤。目前主要有正则化方法，凸集投影法(POCS)和迭代反投影法(IBP)等算法。这一类算法之间的区别主要在于重构部分，严重依赖高分辨率图像的先验知识，性能表现波动很大。当放大倍数较高时，图像重建质量会迅速下滑，导致图像细节严重丢失。基于学习的算法，即通过机器学习的算法对从低分辨率图像到高分辨率图像的转化过程进行建模，可以实现单幅图像的超分辨率重建。相较于其他两类方法，基于学习的方法可以更好地表达和利用图像的先验知识，具有更突出的性能，恢复出的图像具有更优秀的视觉效果，是目前的研究热点之一。

2014年，Chao Dong等人设计的深度卷积网路SRCNN是第一个基于深度学习的超分辨率重建算法，其网络架构非常简单，用三个卷积层分别代表特征提取，非线性变换，图像重构的步骤，实现了端到端的超分辨技术，并在当时取得了最好的效果，自SRCNN之后，基于深度学习的方法呈现出迅猛的发展势头，时隔一年Chao Dong团队2016年最先出手，在SRCNN上进行了改进，得到FSRCNN网络，增加了模型的深度并且增加了膨胀压缩的操作，使得网络结构更合理，运算速度精度都得到了提高，之后Shi W在ESPCN结构中创造性的提出亚像素卷积层的概念，依靠卷积而不是反卷积或插值来上采样，大大提高了速度，同年，KimJ等人提出两种网络架构DRCN和VDCN，分别将循环网络结构和VGG网络结构经过改进应用到超分辨领域，取得了更高的精度，二者是深度学习领域成熟思想应用到超分辨领域的典范。Wang Y等人提出一种EED网络，将深浅层网络相互结合，使得他们分工合作，以结合两个的优点，同时，EED还提出不同尺寸的卷积核提取到的不同感知野大小的特征在还原图像中的作用。

2017年，深度学习上先进的算法如残差网络和对抗生成网络结构被引入到了超分辨的领域，分别生成了EDSR网络和SRGAN网络，并分别取得了最好的信噪比指标和最好的视觉效果。同时，Huang H针对人脸识别，以小波变换算法为基础，提出一种Wavelet结构，这种基于算法设计网络的结构可以使得网络具有更优良的结构和更强的针对性。自2014年以来，深度学习引入到超分辨领域，从此便迅猛的发展起来，产生了一系列优秀的工作。但是，两者相互结合的潜力远远没有发掘完全，由两者相互结合产生何种更有针对性的网络架构，是后续需要努力的重要方向。

图像卡通-纹理分解基本理论：卡通-纹理分解又称为结构-纹理分解，一个灰度级图像f可以分解为f＝u+v，其中u表示图像的结构分量，包含图像的大部分低频和部分中高频信息，是图像的结构特征信息，是图像f的简化逼近，称为卡通；v表示图像的纹理特征信息，包含图像的大部分高频和部分中频信息，由纹理和噪声组成。卡通纹理分解理论由Meyer提出，其模型理论是根据能量极小化原理来把图像分解成卡通部分和纹理部分，由于其很高的计算复杂度，实际中实现极其困难。

一种简化的计算方法是利用非线性的低通滤波器来对原始图像进行快速有效的近似解法。该方法的主要步骤是首先计算图像像素点的周围像素共同的局部总变分(LTV)，通过局部总变分的值来判定该像素点是属于卡通点还是纹理点，然后再对图像通过一个低通滤波器。对于每个像素点来说，其局部总变分变化大的点作为纹理点，而变化小的像素点作为卡通点。分解结果中，卡通部分就是判断为卡通点的位置像素值不变，判断为纹理点的位置的像素值为经过低通滤波器后的像素值；而纹理部分是原始图像像素点与卡通部分图像像素点的插值，该方法虽然不能精确的代替变分问题来分解图像，但它方便处理并具有可行性。

2019年3月发表在浙江理工大学学报上的“基于生成对抗网络的图像超分辨率方法”一文。文中采用生成对抗网络来生成逼真的图片，输入的LR图片作为两个特征提取子网络的共同输入，用来提取不同尺度的特征信息，之后将两种特征信息进行线性叠加，再通过卷积层作低分辨率特征到高分辨率特征的非线性映射，最后用上采样层做特征域到像素域的映射，即图像重建，最终输出生成的HR图像。该文用两个尺度做特征域的信息分解，而本发明是在像素域做信息分解；该文中说到两个分支分别用来提取高频细节信息和低频结构信息，但没法用特征域中的Ground Truth进行约束，整个网络是端到端训练的。因此，这样的分解不一定就是高频细节信息和低频特征信息的分解，而是自适应的。而本发明通过良好的先验信息进行约束，使得两个网络(分支)可以有方向性的学习。

2018CVPR的Deep Video Super-Resolution Network Using DynamicUpsampling Filters Without Explicit Motion Compensation一文。其主要思想将LR图像双三次插值放大的部分换成动态上采样滤波器。具体方法为：首先将输入图像序列经过滤波器生成网络，动态生成上采样滤波器，然后将该上采样滤波器作用在当前帧的每个像素上，生成处理后的近似HR图像。再通过另一个网络学习该近似HR图像与真实值(GroundTruth)的残差。该方法可以较好的提高超分辨网络的性能，但缺点也很明显：(1)图像域的每个像素位置都有一组滤波器，因此滤波器数量巨大，给整个网络带来了很大的参数量和计算花销，测试时的时间也大大加长。(2)因为要通过滤波器生成网络学习上采样滤波器，且每个像素位置都有一组滤波器，因此训练和测试时必须接受相同尺寸的图片。

采用SR网络中没有区别结构信息和细节信息，而是糅合在一起，这样网络在使用L2损失做代价函数在生成HR图像时，不会过多考虑细节信息的生成，在确定规模的网络下不会生成较好的细节信息。

采用双三次插值近似生成HR图像的结构信息，使用残差来近似生成图像的细节信息，在相同规模的网络下，可以更好的学习残差信息。但该种图像分解和真实的高频低频信息分解仍存在差别。残差信息有时在图像中不具有很好的物理意义，相比而言高频低频信息具有更好的信息表征。

在SR问题中采用动态上采样滤波器的方法，旨在生成更好的结构信息，但会引入大量的参数量和计算量，测试时间也大大加长。该方法没有很好的权衡图像的细节信息和结构信息，花费大量成本在生成图像结构信息上，虽会一定程度上会提高超分辨网络的性能，但代价太高且不能有效地用在实际问题上。

发明内容

本发明所要解决的技术问题是提供一种基于高低频信息分解的图像超分辨率重建方法，设计优化的神经网络结构，以有效地生成高分辨率图像的低频和高频信息，从而更好地重建高分辨率的图像。

为解决上述技术问题，本发明采用的技术方案是：

一种基于高低频信息分解的图像超分辨率重建方法，包括以下步骤：

步骤1：对超分辨率数据集做数据预处理，得到训练神经网络所需的LR-HR图像块对，具体为：

1)先对超分辨率数据集中HR图像做双三次插值得到其对应的LR图像，构成LR-HR图像对；

2)再对LR-HR图像对做数据增强，以增强训练样本的数据量；

3)最后从数据增强后的每张HR图像中随机选取图像块，每个HR图像块与其对应的LR图像块构成LR-HR图像块对；

步骤2：将HR图像块G进行高低频信息分解，具体如下：

1)HR图像块G的每点像素值乘以(-1)^x+y进行中心变换，得到图像块G'；其中x＝0,1,...,127，y＝0,1,...,127，(x,y)表示HR图像块G的每一像素点位置；

2)对图像块G'做二维离散傅里叶变换，即根据下式对离散变量u和v在规定范围内求值，得到频谱函数F(u,v)；

其中，M＝N＝128，即HR图像块G尺寸为128×128，u＝0,1,2,...,127，v＝0,1,2,...,127；u，v表示图像频域空间位置；

3)用滤波器函数H(u,v)乘以频谱函数F(u,v)进行滤波；滤波后的图像F'(u,v)为：

F'(u,v)＝H(u,v)×F(u,v)

其中，D₀为高斯核的标准差；

4)对滤波后的图像F'(u,v)做二维离散傅里叶反变换，并取变换后结果的实部；变换公式如下：

其中，x＝0,1,2,...,M-1，y＝0,1,2,...,N-1；

5)用(-1)^x+y乘以步骤4)中变换结果Re(f'(x,y))，再取消步骤1)中对HR图像块G的乘数(-1)^x+y，即将频域中心平移回来，得到HR图像块G的低频信息图像G₁，其包含原HR图像块G的低频信息和部分中频信息，高频信息图像G₂为HR图像块G与低频信息图像G₁的差，即G₂＝G-G₁，其包含G的高频信息和部分中频信息；

步骤3：构建卷积神经网络模型；

所述卷积神经网络模型具有两条分支，都采用同一LR图像作为输入；其中，一个分支依次通过卷积层、若干残差块、卷积层、上采样层和卷积层生成HR高频信息的图像，另一分支依次通过卷积层、若干残差块、卷积层、上采样层和卷积层生成HR低频信息的图像，且生成HR高频图像时采用的残差块数量多于生成HR低频图像时采用的残差块数量；再将HR高频信息的图像和HR低频信息的图像相加，输出最终的HR图像；

步骤4：利用步骤1和步骤2生成的训练样本数据对步骤3构建的卷积神经网络模型进行训练，得到优化后的卷积神经网络模型；

步骤5：利用优化后的卷积神经网络模型，输入LR图像，生成对应的HR图像。

进一步的，在步骤1中，对LR-HR图像对做数据增强具体是：对LR-HR图像对做水平和垂直翻转以及90°旋转，从而得到16倍的训练数据数量。

进一步的，所述步骤3还包括：使用L₁范数损失函数作为代价函数，训练神经网络并更新权重；L₁范数损失函数是把目标值(Y_i)与估计值(f(x_i))的绝对插值的总和(S)最小化，即

进一步的，在步骤2中，滤波器函数H(u,v)选用高斯低通滤波器核。

进一步的，所述步骤3中，卷积神经网络模型中残差块结构都相同，即采用卷积层-ReLU非线性激活层-卷积层加上一条跳过连接的结构。

进一步的，在步骤3中，所述卷积神经网络模型网络中的卷积层都采用3×3结构，通道数为256个。

与现有技术相比，本发明的有益效果是：从图像的结构组成出发，通过更好的方法来生成图像的细节和结构信息，最终重建出高分辨率图像。本发明将图像进行高低频信息分解，具有很好的物理意义。在生成低频信息时采用卷积神经网络来实现，相对于简单的双三次差值方法而言，有更大的感受野和较复杂的非线性变换，从而能生成很好的图像结构信息。相比于动态上采样滤波器的方法，大大简化了图像结构信息的生成过程，从而具有实际的可行性。

附图说明

图1是本发明中卷积神经网络模型结构示意图；

图2是本发明中残差块结构示意图。

具体实施方式

下面结合附图和具体实施方式对本发明作进一步详细的说明。

本发明以EDSR网络模型为基础，EDSR网络模型是NTIRE2017超分辨率挑战赛上获得冠军的方案。整个网络先经过1层卷积层，之后经过16个残差块(Residual Block)，每个残差块都采用卷积层-ReLU非线性激活层-卷积层(conv-ReLU-conv)结构，其在SRResNet网络的基础上移除BN层，上采样方法采用的是ESPCN中的Pixel Shuffling(Depth to Space，即通道深度到空间域的混洗)操作。

一、设计卷积神经网络模型

如图1所示，所述卷积神经网络模型分为两条分支，都采用同一LR图像作为输入。其中，一个分支通过一系列卷积层、若干残差块和上采样层，生成HR高频信息(细节信息)的图像，另一分支也通过一系列卷积层、若干残差块和上采样层，生成HR低频信息(结构信息)的图像，再将两幅图像相加，输出最终的HR图像。

卷积神经网络模型中都采用相同的残差块结构，即卷积层-ReLU非线性激活层-卷积层加上一条跳过连接的结构，如图2所示。考虑到高频信息相对于低频信息来说更为复杂，且是否具有较高质量的细节信息是衡量生成的高分辨率图像质量的关键，因此在生成HR高频图像时采用更多的残差块(16个)，生成HR低频图像时采用较少数量的残差块(8个)。网络中的卷积层都采用3×3结构，通道数为256个。

二、生成训练样本数据对上述卷积神经网络模型进行训练，得到优化的卷积神经网络模型，具体如下：

1、对超分辨率数据集(DIV2K)做数据预处理，得到训练神经网络所需的LR-HR图像块对，具体操作为：1)先对DIV2K数据集的图像(HR图像)做双三次插值得到其对应的LR图像，构成LR-HR图像对；2)再对这些LR-HR图像对做数据增强，以增强训练样本的数据量，具体操作为对图像对做水平和垂直翻转以及90°旋转，从而得到16倍的训练数据数量；3)最后从数据增强后的每张HR图像中随机选取1000个192×192的块，每个HR图像块与其对应的LR图像块构成LR-HR图像块对，共有900000个LR-HR图像块对，其中LR图像块尺寸为48×48，相应HR图像块尺寸为192×192，放大倍数为4倍。

2、将步骤1得到的LR-HR图像块对中的HR图像块G进行高低频信息分解，具体如下：

2.1、HR图像块G的每点像素值乘以(-1)^x+y进行中心变换，得到图像块G'；其中x＝0,1,...,127，y＝0,1,...,127，(x,y)表示HR图像块G的每一像素点位置，该步骤的目的是为了在做二维离散傅里叶变换时，将原来的G频谱图中心平移到处，便于后续滤波操作的处理。

2.2、对图像G'做二维离散傅里叶变换(DCT)，即根据下式对离散变量u和v在规定范围内求值，得到频谱函数F(u,v)。

其中，M＝N＝128，即HR图像块G尺寸为128×128，u＝0,1,2,...,127，v＝0,1,2,...,127；u，v表示图像频域空间位置。

2.3、用滤波器函数H(u,v)乘以F(u,v)进行滤波，滤波器函数H(u,v)选用高斯低通滤波器核。滤波后的图像F'(u,v)为：

F'(u,v)＝H(u,v)×F(u,v)

其中，D₀为高斯核的标准差，可取定值为8。

2.4、对滤波后的图像F'(u,v)做二维离散傅里叶反变换(IDFT)，并取变换后结果的实部。变换公式如下：

其中，x＝0,1,2,...,M-1，y＝0,1,2,...,N-1。

2.5、用(-1)^x+y乘以步骤2.4中变换结果Re(f'(x,y))，取消步骤2.1中对HR图像块G的乘数(-1)^x+y，把频域中心平移回来，得到HR图像块G的低频信息图像G₁，其包含原HR图像块G的低频信息和部分中频信息，高频信息图像G₂为HR图像块G与低频信息图像G₁的差，即G₂＝G-G₁，其包含G的高频信息和部分中频信息。至此，对HR图像块G的分解完毕。

3、利用步骤1和步骤2生成的训练样本数据对卷积神经网络模型进行训练，得到优化后的卷积神经网络模型。

使用L₁范数损失函数作为代价函数，训练神经网络并更新权重。L₁范数损失函数是把目标值(Y_i)与估计值(f(x_i))的绝对插值的总和(S)最小化，即

三、根据优化后的卷积神经网络模型，输入LR图像，生成对应的HR图像。

Claims

1.一种基于高低频信息分解的图像超分辨率重建方法，其特征在于，包括以下步骤：

2)再对LR-HR图像对做数据增强，以增强训练样本的数据量；

步骤2：将HR图像块G进行高低频信息分解，具体如下：

F'(u,v)＝H(u,v)×F(u,v)

其中，D₀为高斯核的标准差；

其中，x＝0,1,2,...,M-1，y＝0,1,2,...,N-1；

步骤3：构建卷积神经网络模型；

2.如权利要求1所述的一种基于高低频信息分解的图像超分辨率重建方法，其特征在于，在步骤1中，对LR-HR图像对做数据增强具体是：对LR-HR图像对做水平和垂直翻转以及90°旋转，从而得到16倍的训练数据数量。

3.如权利要求1所述的一种基于高低频信息分解的图像超分辨率重建方法，其特征在于，所述步骤3还包括：使用L₁范数损失函数作为代价函数，训练神经网络并更新权重；L₁范数损失函数是把目标值(Y_i)与估计值(f(x_i))的绝对插值的总和(S)最小化，即

4.如权利要求1所述的一种基于高低频信息分解的图像超分辨率重建方法，其特征在于，在步骤2中，滤波器函数H(u,v)选用高斯低通滤波器核。

5.如权利要求1所述的一种基于高低频信息分解的图像超分辨率重建方法，其特征在于，所述步骤3中，卷积神经网络模型中残差块结构都相同，即采用卷积层-ReLU非线性激活层-卷积层加上一条跳过连接的结构。

6.如权利要求1所述的一种基于高低频信息分解的图像超分辨率重建方法，其特征在于，在步骤3中，所述卷积神经网络模型网络中的卷积层都采用3×3结构，通道数为256个。