CN112016456B

CN112016456B - 基于自适应反向投影深度学习的视频超分辨率方法及系统

Info

Publication number: CN112016456B
Application number: CN202010880004.9A
Authority: CN
Inventors: 潘金山; 李倩; 唐金辉
Original assignee: Nanjing University of Science and Technology
Current assignee: Nanjing University of Science and Technology
Priority date: 2020-08-27
Filing date: 2020-08-27
Publication date: 2021-06-22
Anticipated expiration: 2040-08-27
Also published as: CN112016456A

Abstract

本发明涉及一种基于自适应反向投影深度学习的视频超分辨率方法及系统，包括：根据待处理视频帧序列块确定运动补偿邻帧特征；采用多幅图像神经网络得放大运动补偿邻帧特征集合；采用第二卷积层得参考帧特征；采用深度反向投影网络得放大参考帧特征；将放大参考帧特征与邻帧的放大运动补偿邻帧特征作差，对差值特征提取得差值特征；根据参考帧特征确定标准化注意力参数；差值特征点乘标准化注意力参数加上放大参考帧特征得隐藏特征；将隐藏特征保存于列表中；将缩小隐藏特征更新为参考帧特征，重复上述步骤，直到确定每个邻帧的隐藏特征；将列表中的隐藏特征拼接，采用第三卷积层得超分辨率图像。通过本发明上述方法能有效提升视频图像的重建结果。

Description

基于自适应反向投影深度学习的视频超分辨率方法及系统

技术领域

本发明涉及视频处理技术领域，特别是涉及一种基于自适应反向投影深度学习的视频超分辨率方法及系统。

背景技术

近年来，随着高清显示设备的普及，低分辨率视频无法满足现有的高清显示设备的需求，视频超分辨技术作为一种低成本获得高清视频的技术，受到了很多关注。视频超分辨率的目标是用低分辨率图像或视频帧序列恢复出图像中丢失的细节，从而获得高分辨率图像或视频帧。

现有的反向投影方法在反馈过程中没有判别性，不能有效地区分有用的和无用的特征信息，从而影响了视频重建结果。

发明内容

本发明的目的是提供一种基于自适应反向投影深度学习的视频超分辨率方法及系统，在视觉注意力模型的约束下，反向投影的反馈过程中能够有效地提取有用的特征信息，从而有效地提升视频图像的重建结果。

为实现上述目的，本发明提供了如下方案：

一种基于自适应反向投影深度学习的视频超分辨率方法，包括：

获取待处理视频帧序列块；所述待处理视频帧序列块为多个；所述待处理视频帧序列块中包括一个参考帧和多个邻帧；

根据所述待处理视频帧序列块，采用光流估计方法和第一卷积层确定所述待处理视频帧序列块中每个邻帧的运动补偿邻帧特征，得到运动补偿邻帧特征集合；

采用多幅图像神经网络对所述运动补偿邻帧特征集合中每个邻帧的运动补偿邻帧特征进行放大，得到放大运动补偿邻帧特征集合；所述放大运动补偿邻帧特征集合中包括每个邻帧的放大运动补偿邻帧特征；

采用第二卷积层对所述参考帧进行特征提取，得到参考帧特征；

采用深度反向投影网络对所述参考帧特征进行放大，得到放大参考帧特征；

将所述放大参考帧特征与所述放大运动补偿邻帧特征集合中的一个邻帧的放大运动补偿邻帧特征作差，并采用残差神经网络对差值进行特征提取，得到差值特征；

根据所述参考帧特征，采用所述多幅图像神经网络确定注意力参数；

采用sigmoid函数对所述注意力参数进行标准化，得到标准化注意力参数；

所述差值特征点乘所述标准化注意力参数，然后再加上所述放大参考帧特征，得到隐藏特征；

将所述隐藏特征保存于列表中，并将所述隐藏特征采用解码器进行缩小，得到缩小隐藏特征，并将所述缩小隐藏特征更新为参考帧特征，返回步骤“采用深度反向投影网络对所述参考帧特征进行放大，得到放大参考帧特征”，直到确定所述放大运动补偿邻帧特征集合中每个邻帧的放大运动补偿邻帧特征与所述放大参考帧特征差值对应的隐藏特征；

将所述列表中的隐藏特征进行拼接，并采用第三卷积层对拼接后的特征进行特征提取，得到超分辨率图像。

可选的，所述获取待处理视频帧序列块，之前还包括：

获取待处理视频帧序列；

将所述待处理视频帧序列按照时间顺序划分为多个视频帧序列块，得到待处理视频帧序列块；每个所述视频帧序列块中的视频帧个数相同。

可选的，所述根据所述待处理视频帧序列块，采用光流估计方法和第一卷积层确定所述待处理视频帧序列块中每个邻帧的运动补偿邻帧特征，得到运动补偿邻帧特征集合，具体包括：

采用光流估计方法估计所述待处理视频帧序列块中每个邻帧与参考帧间的光流图，得到光流图集合；所述光流图集合中包括多个光流图，所述光流图的个数和所述邻帧的个数相同；

根据所述待处理视频帧序列块和所述光流图集合，采用第一卷积层对每个所述邻帧进行运动补充，得到运动补偿邻帧特征集合。

一种基于自适应反向投影深度学习的视频超分辨率系统，包括：

待处理视频帧序列块获取模块，用于获取待处理视频帧序列块；所述待处理视频帧序列块为多个；所述待处理视频帧序列块中包括一个参考帧和多个邻帧；

运动补偿邻帧特征确定模块，用于根据所述待处理视频帧序列块，采用光流估计方法和第一卷积层确定所述待处理视频帧序列块中每个邻帧的运动补偿邻帧特征，得到运动补偿邻帧特征集合；

运动补偿邻帧特征放大模块，用于采用多幅图像神经网络对所述运动补偿邻帧特征集合中每个邻帧的运动补偿邻帧特征进行放大，得到放大运动补偿邻帧特征集合；所述放大运动补偿邻帧特征集合中包括每个邻帧的放大运动补偿邻帧特征；

参考帧特征提取模块，用于采用第二卷积层对所述参考帧进行特征提取，得到参考帧特征；

参考帧特征放大模块，用于采用深度反向投影网络对所述参考帧特征进行放大，得到放大参考帧特征；

差值特征提取模块，用于将所述放大参考帧特征与所述放大运动补偿邻帧特征集合中的一个邻帧的放大运动补偿邻帧特征作差，并采用残差神经网络对差值进行特征提取，得到差值特征；

注意力参数确定模块，用于根据所述参考帧特征，采用所述多幅图像神经网络确定注意力参数；

标准化模块，用于采用sigmoid函数对所述注意力参数进行标准化，得到标准化注意力参数；

隐藏特征获得模块，用于所述差值特征点乘所述标准化注意力参数，然后再加上所述放大参考帧特征，得到隐藏特征；

更新模块，用于将所述隐藏特征保存于列表中，并将所述隐藏特征采用解码器进行缩小，得到缩小隐藏特征，并将所述缩小隐藏特征更新为参考帧特征，返回所述参考帧特征放大模块，直到确定所述放大运动补偿邻帧特征集合中每个邻帧的放大运动补偿邻帧特征与所述放大参考帧特征差值对应的隐藏特征；

超分辨率图像获得模块，用于将所述列表中的隐藏特征进行拼接，并采用第三卷积层对拼接后的特征进行特征提取，得到超分辨率图像。

可选的，所述基于自适应反向投影深度学习的视频超分辨率系统还包括：

待处理视频帧序列获取模块，用于获取待处理视频帧序列；

视频帧序列块划分模块，用于将所述待处理视频帧序列按照时间顺序划分为多个视频帧序列块，得到待处理视频帧序列块；每个所述视频帧序列块中的视频帧个数相同。

可选的，所述运动补偿邻帧特征确定模块具体包括：

光流图估计单元，用于采用光流估计方法估计所述待处理视频帧序列块中每个邻帧与参考帧间的光流图，得到光流图集合；所述光流图集合中包括多个光流图，所述光流图的个数和所述邻帧的个数相同；

运动补偿邻帧特征确定单元，用于根据所述待处理视频帧序列块和所述光流图集合，采用第一卷积层对每个所述邻帧进行运动补充，得到运动补偿邻帧特征集合。

根据本发明提供的具体实施例，本发明公开了以下技术效果：

本发明提供了一种基于自适应反向投影深度学习的视频超分辨率方法及系统，根据参考帧特征采用多幅图像神经网络确定注意力参数，并对注意力参数进行标准化，将差值特征点乘标准化注意力参数再加上放大参考帧特征，得到隐藏特征；将隐藏特征保存于列表中；并将隐藏特征采用解码器进行缩小，得到缩小隐藏特征，将缩小隐藏特征更新为参考帧特征，直到确定每个邻帧的运动补偿邻帧特征与放大参考帧特征差值对应的隐藏特征；最后将列表中的隐藏特征进行拼接，并采用第三卷积层对拼接后的特征进行特征提取，得到超分辨率图像。在注意力参数的约束下，反向投影的反馈过程中能够有效地提取有用的特征信息，从而有效地提升视频图像的重建结果。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例所提供的一种基于自适应反向投影深度学习的视频超分辨率方法的流程图；

图2为本发明实施例所提供的一种基于自适应反向投影深度学习的视频超分辨率系统的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

为使本发明的上述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式对本发明作进一步详细的说明。

图1为本发明实施例所提供的一种基于自适应反向投影深度学习的视频超分辨率方法的流程图，如图1所示，本发明一种基于自适应反向投影深度学习的视频超分辨率方法包括：

S101之前包括：

获取待处理视频帧序列。本发明实施例中下载了REDS(REalistic and DynamicScenes dataset)，它是包含270个文件夹的数据集，文件夹按顺序进行编号000-269，每个文件夹里有100帧图像并按顺序进行编号。将REDS数据集去除000，011，015和020文件夹用于训练集，包括26600张高分辨率图像和对应的低分辨率图像，每5帧低分辨率图像重建1帧高分辨率图像。将000，011，015和020文件夹组成REDS4数据集作为测试，包括400张高分辨率图像和对应的低分辨率图像，每5帧低分辨率图像重建1帧高分辨率图像。

将所述待处理视频帧序列按照时间顺序划分为多个视频帧序列块，得到待处理视频帧序列块；每个所述视频帧序列块中的视频帧个数相同。本发明实施例中一个视频帧序列块中包括5帧视频帧，5帧中的中间帧为参考帧，前2帧和后2帧为邻帧，例如若五帧的视频帧的序号为1、2、3、4、5，那么第3帧为参考帧，1、2、4、5为对应的邻帧。

S101，获取待处理视频帧序列块；所述待处理视频帧序列块为多个；所述待处理视频帧序列块中包括一个参考帧和多个邻帧。

S102，根据所述待处理视频帧序列块，采用光流估计方法和第一卷积层确定所述待处理视频帧序列块中每个邻帧的运动补偿邻帧特征，得到运动补偿邻帧特征集合。S102具体包括：

步骤201，采用光流估计方法估计所述待处理视频帧序列块中每个邻帧与参考帧间的光流图，得到光流图集合；所述光流图集合中包括多个光流图，所述光流图的个数和所述邻帧的个数相同。

步骤202，根据所述待处理视频帧序列块和所述光流图集合，采用第一卷积层对每个所述邻帧进行运动补充，得到运动补偿邻帧特征集合。

采用光流估计方法获取参考帧与每个邻帧间的运动估计即光流图，利用一个卷积层即第一卷积层得到运动补偿后的视频帧特征。输入的待处理视频帧序列块中包括5帧低分辨率图像序列，可以表示为{I₁,I₂,I₃,I₄,I₅}，I₃为参考帧，{I₁,I₂,I₄,I₅}为邻帧，每帧邻帧可以表示为I_k,k＝1,2,4,5，每帧运动补偿后的视频帧特征可以表示为M_k,k＝1,2,4,5，得到运动补偿邻帧特征集合为{M₁,M₂,M₄,M₅}。具体的，计算第1帧到第3帧，第2帧到第3帧，第4帧到第3帧，第5帧到第3帧的光流，进行四次循环，第一次循环输入为第1帧，第3帧(参考帧)，第1帧和第3帧之间的光流，将它们三个在通道维度上堆叠起来，得到8通道的特征图，再经过一层卷积得到融合特征图即运动补偿邻帧特征M₁；第二次循环输入为第2帧，第3帧(参考帧)，第2帧和第3帧之间的光流，将它们三个在通道维度上堆叠起来，得到8通道的特征图，再经过一层卷积得到融合特征图即运动补偿邻帧特征M₂。依次类推。循环结束得到对应每帧邻帧的四张融合特征图即得到运动补偿邻帧特征集合。

S103，采用多幅图像神经网络对所述运动补偿邻帧特征集合中每个邻帧的运动补偿邻帧特征进行放大，得到放大运动补偿邻帧特征集合；所述放大运动补偿邻帧特征集合中包括每个邻帧的放大运动补偿邻帧特征。

具体的，将对应的运动补偿邻帧特征M_k通过多幅图像神经网络Net_misr得到放大的运动补偿特征

多幅图像神经网络中包括五个残差块和一个反卷积层，即

S104，采用第二卷积层对所述参考帧进行特征提取，得到参考帧特征L₃。

S105，采用深度反向投影网络对所述参考帧特征进行放大，得到放大参考帧特征。

具体的，将参考帧特征L₃通过深度反向投影网络(DBPN网络)得到放大的参考帧特征

即

S106，将所述放大参考帧特征与所述放大运动补偿邻帧特征集合中的一个邻帧的放大运动补偿邻帧特征作差，并采用残差神经网络对差值进行特征提取，得到差值特征e_k。

具体的，将放大的参考帧特征

与放大运动补偿邻帧特征

作差，然后通过残差神经网络Net_res提取差的特征e_k，采用残差神经网络中包括五个残差块和一个卷积层即

S107，根据所述参考帧特征，采用所述多幅图像神经网络确定注意力参数，所述多幅图像神经网络中包括五个残差块和一个反卷积层即γ＝Net_misr(L₃；θ_misr)。

S108，采用sigmoid函数对所述注意力参数进行标准化，得到标准化注意力参数，即

其中γ′为标准化注意力参数。

S109，所述差值特征点乘所述标准化注意力参数，然后再加上所述放大参考帧特征，得到隐藏特征H_k，即

S110，将所述隐藏特征保存于列表H中，并将所述隐藏特征采用解码器进行缩小，得到缩小隐藏特征L_k，并将所述缩小隐藏特征更新为参考帧特征，返回S105，直到确定所述放大运动补偿邻帧特征集合中每个邻帧的放大运动补偿邻帧特征与所述放大参考帧特征差值对应的隐藏特征。具体的，本发明实施例中放大运动补偿邻帧特征集合中包括4个邻帧的放大运动补偿邻帧特征，分别为

和

采用S105-S109对第1邻帧的放大运动补偿邻帧特征H₁ ^m进行处理，得到第1邻帧对应的隐藏特征H₁，采用S110对隐藏特征H₁进行处理，得到第1邻帧对应的缩小隐藏特征L₁，将缩小隐藏特征L₁更新为参考帧特征即L₃＝L₁。然后基于更新后的参考特征，采用S105-S109对第2邻帧的放大运动补偿邻帧特征

进行处理，得到第2邻帧对应的隐藏特征H₂，采用S110对隐藏特征H₂进行处理，得到第2邻帧对应的缩小隐藏特征L₂，将缩小隐藏特征L₂更新为参考帧特征即L₃＝L₂。循环上述方法直到得到隐藏特征H₄和隐藏特征H₅。其中，所述解码器中包括五个残差块和一个卷积层，即L_k＝Net_D(H_k；θ_D)。

S111，将所述列表H中的隐藏特征进行拼接，并采用第三卷积层对拼接后的特征进行特征提取，得到超分辨率图像。

本发明还提供了一种基于自适应反向投影深度学习的视频超分辨率系统，如图2所示，视频超分辨率系统包括：

待处理视频帧序列块获取模块1，用于获取待处理视频帧序列块；所述待处理视频帧序列块为多个；所述待处理视频帧序列块中包括一个参考帧和多个邻帧。

运动补偿邻帧特征确定模块2，用于根据所述待处理视频帧序列块，采用光流估计方法和第一卷积层确定所述待处理视频帧序列块中每个邻帧的运动补偿邻帧特征，得到运动补偿邻帧特征集合。

运动补偿邻帧特征放大模块3，用于采用多幅图像神经网络对所述运动补偿邻帧特征集合中的每个邻帧的运动补偿邻帧特征进行放大，得到放大运动补偿邻帧特征集合；所述放大运动补偿邻帧特征集合中包括每个邻帧的放大运动补偿邻帧特征。

参考帧特征提取模块4，用于采用第二卷积层对所述参考帧进行特征提取，得到参考帧特征。

参考帧特征放大模块5，用于采用深度反向投影网络对所述参考帧特征进行放大，得到放大参考帧特征。

差值特征提取模块6，用于将所述放大参考帧特征与所述放大运动补偿邻帧特征集合中的一个邻帧的放大运动补偿邻帧特征作差，并采用残差神经网络对差值进行特征提取，得到差值特征。

注意力参数确定模块7，用于根据所述参考帧特征，采用所述多幅图像神经网络确定注意力参数。

标准化模块8，用于采用sigmoid函数对所述注意力参数进行标准化，得到标准化注意力参数。

隐藏特征获得模块9，用于所述差值特征点乘所述标准化注意力参数，然后再加上所述放大参考帧特征，得到隐藏特征。

更新模块10，用于将所述隐藏特征保存于列表中，并将所述隐藏特征采用解码器进行缩小，得到缩小隐藏特征，将所述缩小隐藏特征更新为参考帧特征，返回所述参考帧特征放大模块，直到确定所述放大运动补偿邻帧特征集合中每个邻帧的放大运动补偿邻帧特征与所述放大参考帧特征差值对应的隐藏特征。

超分辨率图像获得模块11，用于将所述列表中的隐藏特征进行拼接，并采用第三卷积层对拼接后的特征进行特征提取，得到超分辨率图像。

优选的，所述基于自适应反向投影深度学习的视频超分辨率系统还包括：

待处理视频帧序列获取模块，用于获取待处理视频帧序列。

优选的，所述运动补偿邻帧特征确定模块2具体包括：

光流图估计单元，用于采用光流估计方法估计所述待处理视频帧序列块中每个邻帧与参考帧间的光流图，得到光流图集合；所述光流图集合中包括多个光流图，所述光流图的个数和所述邻帧的个数相同。

本发明中引入标准化注意力参数γ′使得在反馈过程中能够判别性地选择对视频重建有用的特征。参考帧和邻帧联合引导训练多幅图像神经网络Net_misr，让此模块通过反向传播自身学到低分辨率图像中没有的细节并将图像放大。参考帧特征L₃通过多幅图像神经网络Net_misr放大后，再通过sigmoid函数得到标准化注意力参数γ′，并将γ′和邻帧补充给参考帧的额外信息，即差值特征e_k进行像素级的一对一点乘。因为这个额外信息e_k不一定全是有用的特征信息，也有无用的对重建有负面影响的特征信息，需要对额外信息进行判断。通过反向传播网络会自适应的调整γ′的值。在γ′的约束下，反向投影的反馈过程中能够有效地提取有用的特征信息，从而有效地提升视频图像的重建结果。本发明在视觉注意力模型的约束下，反向投影的反馈过程中能够有效地提取有用的特征信息，从而有效地提升视频图像的重建结果。

本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。

本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处。综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种基于自适应反向投影深度学习的视频超分辨率方法，其特征在于，包括：

将所述隐藏特征保存于列表中，并将所述隐藏特征采用解码器进行缩小，得到缩小隐藏特征，将所述缩小隐藏特征更新为参考帧特征，返回步骤“采用深度反向投影网络对所述参考帧特征进行放大，得到放大参考帧特征”，直到确定所述放大运动补偿邻帧特征集合中每个邻帧的放大运动补偿邻帧特征与所述放大参考帧特征差值对应的隐藏特征；

2.根据权利要求1所述的基于自适应反向投影深度学习的视频超分辨率方法，其特征在于，所述获取待处理视频帧序列块，之前还包括：

获取待处理视频帧序列；

3.根据权利要求1所述的基于自适应反向投影深度学习的视频超分辨率方法，其特征在于，所述根据所述待处理视频帧序列块，采用光流估计方法和第一卷积层确定所述待处理视频帧序列块中每个邻帧的运动补偿邻帧特征，得到运动补偿邻帧特征集合，具体包括：

4.一种基于自适应反向投影深度学习的视频超分辨率系统，其特征在于，包括：

5.根据权利要求4所述的基于自适应反向投影深度学习的视频超分辨率系统，其特征在于，所述基于自适应反向投影深度学习的视频超分辨率系统还包括：

待处理视频帧序列获取模块，用于获取待处理视频帧序列；

6.根据权利要求4所述的基于自适应反向投影深度学习的视频超分辨率系统，其特征在于，所述运动补偿邻帧特征确定模块具体包括：