CN110706155A

CN110706155A - 一种视频超分辨率重建方法

Info

Publication number: CN110706155A
Application number: CN201910863808.5A
Authority: CN
Inventors: 王中元; 易鹏; 江奎; 韩镇; 胡瑞敏
Original assignee: Wuhan University WHU
Current assignee: Wuhan University WHU
Priority date: 2019-09-12
Filing date: 2019-09-12
Publication date: 2020-01-17
Anticipated expiration: 2039-09-12
Also published as: CN110706155B

Abstract

本发明公开了一种视频超分辨率重建方法，包括非局部时空网络和渐进式融合网络两个部分。在非局部时空网络中，将输入的多帧融合到一起形成整块高维特征张量图，对其进行变形，分离，计算并提取非局部时空相关性，进而得到混合了非局部时空相关性的多帧视频。在渐进式融合网络中，将非局部时空网络输出的多帧送入渐进式融合残差块，逐渐地融合多帧之间的时空相关性。最后，将融合好的低分辨率特征张量图放大，得到最终的高分辨率视频帧。本发明有效融合了多帧之间的时空相关性，能够在增强视频分辨率的同时恢复丰富的纹理细节。

Description

一种视频超分辨率重建方法

技术领域

本发明属于数字图像处理技术领域，涉及一种视频超分辨率重建方法，具体涉及一种基于非局部时空相关性及渐进式融合网络的视频超分辨率重建方法。

背景技术

随着科学技术的发展，人们对于高清视频的需要也在日益增长，从720P(1280×720)到1080P(1920×1080)高清，再到4K(3840×2160)甚至是8K(7680×4320)的超高清。因此，作为一种能从给定的低分辨率视频生成高分辨率视频的技术，视频超分辨率便有了重要用途。目前，视频超分辨率被广泛应用于如视频监控，数字电视，卫星遥感等领域。

传统的超分辨率方法有基于插值的方法，如双三次插值方法。这类方法从给定的低分辨率图像，计算对应高分辨率图像中未知的像素值。图像插值方法计算量少，处理速度快，在工业界得到了广泛的应用。然而，这种方法过于简单，重建效果往往过于模糊，画面过光滑而缺少纹理细节。而且，他们大都针对单张图像超分辨率，只能利用帧内空间相关性，无法利用连续视频帧的帧间时间相关性。

最近，基于深度学习，特别是卷积神经网络(CNN)的超分辨率方法取得了巨大的成功。目前的一些视频超分辨率方法通常采用显式或隐式的运动补偿，利用视频帧间的时间相关性。然而，这种方法需要引入额外的光流网络，增加了额外的参数量和计算量，也使得训练网络的难度加大。此外，一些视频超分辨率方法采用直接融合、慢融合或是3D卷积神经网络的方法来融合时域多帧互补信息。但是，直接融合与慢融合方式过于简单，难以有效地利用多帧相关性；3D卷积神经网络的融合效果相对较好，但计算量过大，严重影响处理速度。

Sajjadi等人提出了一种帧递归视频超分辨率CNN网络，先放大第一个低分辨率视频帧，再利用放大后的高分辨率视频帧监督处理下一个低分辨率视频帧，从而重建整个视频。该方法每一帧只需处理一次，速度较快，但它不能利用下一延时帧的信息来帮助恢复当前帧。Jo等人提出了一种基于3D卷积的视频超分辨率网络，该网络利用3D卷积，能较好地利用帧间的时空相关性，但存在计算量巨大、效率低的弊端。

发明内容

为了解决上述技术问题，本发明提供了一种基于非局部时空相关性及渐进式融合网络的视频超分辨率重建方法。在非局部时空网络中采用非局部残差块，直接提取多帧的非局部时空相关性；在渐进式融合网络中，利用渐进式融合残差块，更有效地融合多帧之间的时空相关性。同时采用一种跨通道参数共享技术，极大地减少了渐进式融合网络的参数需求。

本发明所采用的技术方案为：一种基于非局部时空相关性及渐进式融合网络的视频超分辨率重建方法，其特征在于，包括以下步骤：

步骤1：选取若干视频数据作为训练样本，从每个视频帧中相同的位置截取大小为T×H×s×W×s×C像素的图像作为高分辨率学习目标，将其下采样s倍，得到大小为T×H×W×C的低分辨率图像，作为网络的输入；其中，T为帧数，H和W分别为图像的高和宽，C为图像的通道数，s为下采样倍数；

步骤2：将低分辨率帧输入现有的非局部时空网络融合，形成一整块高维特征张量，对高维特征张量进行变形，分离，计算并提取非局部时空相关性，进而得到混合了非局部时空相关性的多帧视频；

步骤3：将混合了非局部时空相关性的多帧视频输入渐进式融合网络，逐渐地融合多帧之间的时空相关性；

步骤4：提取渐进式融合网络中卷积层的参数，并把参数共享给相同深度的其他卷积层；

步骤5：将融合了时空相关性的多帧继续融合，进而得到一个低分辨率特征张量图；

步骤6：将低分辨率特征张量图放大，获得高分辨率图像。

本发明使用了非局部残差块，直接提取多帧的非局部时空相关性，并使用渐进式融合残差块，加强多帧之间时空相关性的融合效果，使得能够提取更加丰富的纹理细节。此外，通过采用跨通道参数共享技术，极大地减少了渐进式融合网络的参数量，提升了网络存储和运算效率。

附图说明

图1为本发明实施例的非局部残差块结构图；

图2为本发明实施例的渐进式融合残差块结构图。

具体实施方式

为了便于本领域普通技术人员理解和实施本发明，下面结合附图及实施例对本发明作进一步的详细描述，应当理解，此处所描述的实施示例仅用于说明和解释本发明，并不用于限定本发明。

请见图1和图2，一种基于非局部时空相关性及渐进式融合网络的视频超分辨率重建方法，包括以下步骤：

步骤1：选取若干视频数据作为训练样本，从每个视频帧中相同的位置截取大小为T×H×s×W×s×C像素的图像作为高分辨率学习目标，将其下采样s倍，得到大小为T×H×W×C的低分辨率图像，作为网络的输入。其中T为帧数，H和W分别为图像的高和宽，C为图像的通道数，s为下采样倍数；

步骤2：将低分辨率帧输入非局部时空网络，将它们融合在一起形成一整块高维特征张量，对其进行变形，分离，计算并提取非局部时空相关性，进而得到混合了非局部时空相关性的多帧视频；

本发明采用一种非局部残差块，对输入进行变形，分离，计算等操作，提取视频帧的非局部时空相关性。

非局部残差块的输入X尺寸为T×H×W×C，其中T为帧数，H和W分别为图像的高和宽，C为图像的通道数。改变X的形状，进而得到X₁以及X₂，进一步将X₂变形分别得到X₃和X₄。同时，对X₂进行卷积，得到输入的一种特征表示G。将X₃和X₄相乘得到F，对F做指数归一化，得到非局部时空关系图。将非局部时空关系图与输入的特征表示G相乘，就得到了提取了非局部时空相关性的特征图Y。将Y进一步变形并卷积，使其与输入X的尺寸相同，并与X相加，最终得到了输出Z。

具体实现过程为：

S(X)＝T×H×W×C (1)其中，S(X)表示输入帧X的形状；

将X变形得到X₁，再将X₁的空间尺寸转化部分为通道数得到X₂，进一步将X₂变形得到X₃和X₄；

S(X₁)＝H×W×(C×T) (2)

S(X₂)＝(H/r)×(W/r)×(C×T×r²) (3)

S(X₃)＝(H×W/r²)×(C×T×r²) (4)

S(X₄)＝(C×T×r²)×(H×W/r²) (5)

其中，r为转化倍数；

F＝X₃×X₄ (6)

G＝g(X2) (7)

Y＝softmax(F)×G (8)

Z＝w(Y)+X (9)

其中，将X₃和X₄相乘得到F，F为输入X的非局部时空关系图，将X₂进行卷积得到G，G为输入X的一种特征表示；softmax(F)表示将F指数化归一，将其与变形的G相乘得到Y，Y为获得了非局部时空关系的多帧；将Y进行卷积并变形后，与输入X相加得到输出Z，Z为非局部残差块的输出多帧。

本实施例采用一种渐进式融合残差块，逐渐地融合多帧之间的时空相关性；

其中，

表示输入的第t帧，表示第1层的第t个卷积，

表示将输入

送入

卷积得到的特征张量图；I₁表示将所有帧的特征张量图

融合后得到的混合特征张量图，I₂表示把I₁送入C²卷积得到的特征张量图；将I₂与

融合后，送入

卷积，并与

相加，就得到了输出O_t，O_t为经过了渐进式融合后的多帧。

本实施例以输入5帧为例。渐进式融合残差块首先使用5个卷积，分别处理对应的5个视频帧。将得到的5个特征张量图融合为1个，并利用1个卷积来压缩它的通道数，得到1个混合有所有帧信息的混合特征张量图。将输入的5帧依次与该混合特征张量图拼接，并使用新的5个卷积处理这5个新的混合特征张量图。将得到的5个混合特征张量图与5个输入帧依次相加，最终得到5个输出。

步骤4：将渐进式融合网络中卷积层的参数提取出来，并把参数共享给相同深度的其他卷积层；

本实施例采用现有的跨通道参数共享方法，将渐进式融合残差块中卷积参数提取出来，并共享给其它相同层数的卷积块。

本实施例以输入5帧为例。在卷积的过程中，把网络中相同深度的5个卷积层的参数共享为一致，以减小网络参数量。

步骤6：将低分辨率特征张量图放大，获得高分辨率图像；

本发明能够利用多帧的非局部时空相关性保证重建效果，并利用跨通道参数共享技术减小网络参数量。

应当理解的是，本说明书未详细阐述的部分均属于现有技术；上述针对较佳实施例的描述较为详细，并不能因此而认为是对本发明专利保护范围的限制，本领域的普通技术人员在本发明的启示下，在不脱离本发明权利要求所保护的范围情况下，还可以做出替换或变形，均落入本发明的保护范围之内，本发明的请求保护范围应以所附权利要求为准。