WO2023082685A1

WO2023082685A1 - 视频增强方法、装置、计算机设备和存储介质

Info

Publication number: WO2023082685A1
Application number: PCT/CN2022/105653
Authority: WO
Inventors: 周昆; 李文博; 卢丽莹; 蒋念娟; 沈小勇; 吕江波
Original assignee: 深圳思谋信息科技有限公司; 上海思谋科技有限公司
Priority date: 2021-11-11
Filing date: 2022-07-14
Publication date: 2023-05-19
Also published as: CN113781312A; CN113781312B

Abstract

本申请涉及一种视频增强方法、装置、计算机设备和存储介质。方法包括：获取连续视频帧；连续视频帧中包括参考帧和与参考帧相邻的时序帧；提取出参考帧的特征信息和各时序帧的特征信息，将参考帧的特征信息，作为参考帧的参考帧信息，以及将各时序帧的特征信息进行对齐处理，得到各时序帧的时序帧信息；根据参考帧信息，对各时序帧信息进行聚合处理，得到各时序帧的聚合信息；根据参考帧信息和各聚合信息，重建出参考帧的目标视频帧；目标视频帧的图像质量高于参考帧的图像质量。采用本方法，使得重建出的视频帧拥有更高的信噪比和结构相似性，视觉效果也更为逼真，从而提高了重建出的视频帧的图像质量。

Description

视频增强方法、装置、计算机设备和存储介质

本申请要求于2021年11月11日提交中国国家知识产权局、申请号为202111330266.9、发明名称为“视频增强方法、装置、计算机设备和存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及视频处理技术领域，特别是涉及一种视频增强方法、装置、计算机设备和存储介质。

背景技术

视频超分辨率旨在将低分辨率的图像序列重建成高分辨率的图像，随着网络带宽的增加，人们对于高清图像的需求也在快速增长。如今，视频超分技术成功的应用于各个领域中，例如手机拍照、老旧影视内容的高清化、智能监控等。

传统技术中，一般是通过神经网络直接学习低分辨率图像到高分辨率图像的非线性映射，来重建出高分辨率的图像。但是，该方法得到的图像容易存在伪影、噪声等错误的信号，很难重建出高质量的图像。

发明内容

基于此，有必要针对上述技术问题，提供一种能够提高重建出的图像的图像质量的视频增强方法、装置、计算机设备和存储介质。

第一方面，提供一种视频增强方法，包括：

获取连续视频帧；其中，所述连续视频帧包括参考帧和与所述参考帧相邻的时序帧；

提取出所述参考帧的特征信息和各所述时序帧的特征信息；将所述参考帧的特征信息，作为所述参考帧的参考帧信息，以及将各所述时序帧的特征信息进行对齐处理，得到各所述时序帧的时序帧信息；

根据所述参考帧信息，对各所述时序帧信息进行聚合处理，得到各所述时序帧的聚合信息；

根据所述参考帧信息和各所述聚合信息，重建出所述参考帧的目标视频帧；其中，所述目标视频帧的图像质量高于所述参考帧的图像质量。

在一些实施例中，所述将各所述时序帧的特征信息进行对齐处理，得到各所述时序帧的时序帧信息，包括：

以所述参考帧为对齐目标，分别基于各所述时序帧的特征信息的历史运动信息，将各所述时序帧的特征信息进行对齐处理，得到各所述时序帧的时序帧信息。

在一些实施例中，所述以所述参考帧为对齐目标，分别基于各所述时序帧的特征信息的历史运动信息，将各所述时序帧的特征信息进行对齐处理，得到各所述时序帧的时序帧信息，包括：

若所述时序帧与所述参考帧之间包含中间帧，则以所述中间帧为对齐目标，基于所述时序帧的特征信息的历史运动信息，对所述时序帧的特征信息进行对齐处理，得到所述时序帧的初始对齐信息；

以所述参考帧为对齐目标，基于所述初始对齐信息的历史运动信息，对所述初始对齐信息进行再次对齐处理，得到所述时序帧的时序帧信息。

在一些实施例中，所述根据所述参考帧信息，对各所述时序帧信息进行聚合处理，得到各所述时序帧的聚合信息，包括：

根据所述参考帧信息和各所述时序帧信息，确定各所述时序帧信息的第一聚合权重和第二聚合权重；

根据各所述时序帧信息的第一聚合权重，对各所述时序帧信息进行聚合处理，得到各所述时序帧信息的初始聚合信息；

根据各所述时序帧信息的第二聚合权重，对各所述时序帧信息的初始聚合信息进行再次聚合处理，得到各所述时序帧的聚合信息。

在一些实施例中，所述各所述时序帧信息的第一聚合权重通过下述方式得到：

分别获取各所述时序帧信息与所述参考帧信息之间的差异信息；

根据各所述时序帧信息与所述参考帧信息之间的差异信息，确定各所述时序帧信息的第一聚合权重。

在一些实施例中，所述各所述时序帧信息的第二聚合权重通过下述方式得到：

获取各所述时序帧信息的平均值；

获取各所述时序帧信息与所述平均值之间的距离；

根据各所述时序帧信息与所述平均值之间的距离，确定各所述时序帧信息的第二聚合权重。

在一些实施例中，所述根据所述参考帧信息和各所述聚合信息，重建出所述参考帧的目标视频帧，包括：

将所述参考帧信息和各所述聚合信息进行拼接处理，得到拼接信息；

对所述拼接信息进行卷积处理，得到所述参考帧的目标视频帧。

在一些实施例中，所述将所述参考帧信息和各所述聚合信息进行拼接处理，得到拼接信息，包括：

将所述参考帧信息和各所述聚合信息输入信息重建模型，通过所述信息重建模型将所述参考帧信息和各所述聚合信息进行拼接处理，得到拼接信息。

在一些实施例中，所述时序帧信息与所述参考帧信息之间的差异信息是通过计算所述时序帧信息与所述参考帧信息的余弦距离得到的。

第二方面，提供一种视频增强装置，包括：

视频帧获取模块，用于获取连续视频帧；其中，所述连续视频帧包括参考帧和与所述参考帧相邻的时序帧；

信息提取模块，用于提取出所述参考帧的特征信息和各所述时序帧的特征信息；将所述参考帧的特征信息，作为所述参考帧的参考帧信息，以及将各所述时序帧的特征信息进行对齐处理，得到各所述时序帧的时序帧信息；

信息聚合模块，用于根据所述参考帧信息，对各所述时序帧信息进行聚合处理，得到各所述时序帧的聚合信息；

视频帧重建模块，用于根据所述参考帧信息和各所述聚合信息，重建出所述参考帧的目标视频帧；其中，所述目标视频帧的图像质量高于所述参考帧的图像质量。

在一些实施例中，所述信息提取模块，具体用于以参考帧为对齐目标，分别基于各时序帧的特征信息的历史运动信息，将各时序帧的特征信息进行对齐处理，得到各时序帧的时序帧信息。

在一些实施例中，所述信息提取模块，具体用于若时序帧与参考帧之间包含中间帧，则以中间帧为对齐目标，基于时序帧的特征信息的历史运动信息，对时序帧的特征信息进行对齐处理，得到时序帧的初始对齐信息；以参考帧为对齐目标，基于初始对齐信息的历史运动信息，对初始对齐信息进行再次对齐处理，得到时序帧的时序帧信息。

在一些实施例中，所述信息聚合模块，具体用于根据参考帧信息和各时序帧信息，确定各时序帧信息的第一聚合权重和第二聚合权重；根据各时序帧信息的第一聚合权重，对各时序帧信息进行聚合处理，得到各时序帧信息的初始聚合信息；根据各时序帧信息的第二聚合权重，对各时序帧信息的初始聚合信息进行再次聚合处理，得到各时序帧的聚合信息。

在一些实施例中，所述信息聚合模块，还用于分别获取各时序帧信息与参考帧信息之间的差异信息；根据各时序帧信息与参考帧信息之间的差异信息，确定各时序帧信息的第一聚合权重。

在一些实施例中，所述信息聚合模块，还用于获取各时序帧信息的平均值；获取各时序帧信息与平均值之间的距离；根据各时序帧信息与平均值之间的距离，确定各时序帧信息的第二聚合权重。

在一些实施例中，所述视频帧重建模块，具体用于将参考帧信息和各聚合信息进行拼接处理，得到拼接信息；对拼接信息进行卷积处理，得到参考帧的目标视频帧。

在一些实施例中，所述视频帧重建模块，具体用于将所述参考帧信息和各所述聚合信息输入信息重建模型，通过所述信息重建模型将所述参考帧信息和各所述聚合信息进行拼接处理，得到拼接信息。

第三方面，提供一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现以下步骤：

提取出所述参考帧的特征信息和各所述时序帧的特征信息，将所述参考帧的特征信息；作为所述参考帧的参考帧信息，以及将各所述时序帧的特征信息进行对齐处理，得到各所述时序帧的时序帧信息；

第四方面，提供一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现以下步骤：

第五方面，提供一种计算机程序产品，所述计算机程序产品包括计算机程序，所述计算机程序被处理器执行时实现以下步骤：

本申请实施例通过对与参考帧相邻的各时序帧的特征信息进行对齐和聚合处理，并结合参考帧信息和各时序帧的聚合信息，使得重建出的视频帧拥有更高的信噪比和结构相似性，视觉效果也更为逼真，从而提高了重建出的视频帧的图像质量。避免了通过神经网络直接学习低分辨率图像到高分辨率图像的非线性映射，导致得到的图像容易存在伪影、噪声等错误的信号，很难重建出高质量的图像的缺陷。

附图说明

图1为一个实施例中视频增强方法的流程示意图；

图2为一个实施例中运动对齐的流程示意图；

图3为一个实施例中自适应的信息重聚合的流程示意图；

图4为另一个实施例中视频增强方法的流程示意图；

图5为一个实施例中一种用于时序对齐的视频增强方法的流程示意图；

图6为一个实施例中视频增强装置的结构框图；

图7为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请实施例的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请实施例进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请实施例，并不用于限定本申请实施例。

在一个实施例中，如图1所示，提供了一种视频增强方法，本实施例以该方法应用于服务器进行举例说明。可以理解的是，该方法也可以应用于终端，还可以应用于包括终端和服务器的系统，并通过终端和服务器的交互实现。本实施例中，该方法包括以下步骤：

步骤S101，获取连续视频帧；其中，连续视频帧包括参考帧和与参考帧相邻的时序帧。

其中，视频是由众多个静止的画面组成，这些静止的画面称为视频帧；比如一个视频中，一秒的视频至少包括24个视频帧。

其中，连续视频帧是指多帧连续的低分辨率视频帧，比如监控摄像头拍摄到的多帧连续的低分辨率的车辆行驶视频帧，适用于快速运动的物体场景。参考帧是指连续视频帧中具有参考意义的视频帧，比如连续视频帧中的中间视频帧。

需要说明的是，连续视频帧还可以是指需要进行视频去模糊和视频去噪的连续的视频帧。

具体地，服务器获取需要进行视频增强处理的连续视频帧，并从连续视频帧中确定出参考帧，同时将连续视频帧中与参考帧相邻的视频帧，作为时序帧。

举例说明，服务器将连续的五帧低分辨率的视频帧作为输入，这五帧视频帧中，第三帧视频帧是参考帧，与最终输出的高分辨率视频帧对应，而其他的四帧视频帧则是与参考帧相邻的时序帧。

步骤S102，提取出参考帧的特征信息和各时序帧的特征信息；将参考帧的特征信息，作为参考帧的参考帧信息，以及将各时序帧的特征信息进行对齐处理，得到各时序帧的时序帧信息。

其中，参考帧的特征信息是指参考帧的图像特征，时序帧的特征信息是指时序帧的图像特征，均可以通过特征提取模型提取得到。

其中，将各时序帧的特征信息进行对齐处理，是指分别将各时序帧的特征信息向参考帧的参考帧信息进行运动对齐。需要说明的是，假设时序帧与参考帧之间包括中间帧，则采用渐进式的运动对齐策略，先将该时序帧向中间帧对齐，再向参考帧对齐。

其中，时序帧的时序帧信息，是指对时序帧的特征信息进行运动对齐后得到的信息。

具体地，服务器将参考帧和各时序帧输入预先训练的特征提取模型，通过特征提取模型对参考帧和各时序帧进行特征提取处理，得到参考帧的特征信息和各时序帧的特征信息。将参考帧的特征信息，识别为参考帧的参考帧信息。分别将各时序帧的特征信息向参考帧的参考帧信息进行运动对齐，得到各时序帧的对齐信息，对应作为各时序帧的时序帧信息。

步骤S103，根据参考帧信息，对各时序帧信息进行聚合处理，得到各时序帧的聚合信息。

其中，时序帧的聚合信息是指对时序帧的时序帧信息进行重聚合后得到的信息。

具体地，服务器将参考帧信息和各时序帧信息输入信息聚合模型，通过信息聚合模型基于参考帧信息，对各时序帧信息进行聚合处理，得到各时序帧的聚合信息。其中，信息聚合模型是一种用于对时序帧的时序帧信息进行聚合处理的网络模型。

步骤S104，根据参考帧信息和各聚合信息，重建出参考帧的目标视频帧；其中，目标视频帧的图像质量高于参考帧的图像质量。

其中，目标视频帧的图像质量高于参考帧的图像质量，是指目标视频帧的图像分辨率高于参考帧的图像分辨率，且拥有更高的信噪比和结构相似性，视觉效果也更为逼真。

具体地，服务器将参考帧信息和各时序帧的聚合信息输入信息重建模型，通过信息重建模型对参考帧信息和各时序帧的聚合信息进行卷积计算，得到参考帧的高质量视频帧，作为参考帧的目标视频帧，比如车辆行驶视频帧的高质量视频帧。

需要说明的是，假设连续视频帧是指需要进行视频去模糊和视频去噪的连续的视频帧，那么目标视频帧还可以是指视频去模糊和视频去噪后的视频帧。

上述视频增强方法中，通过获取连续视频帧；连续视频帧中包括参考帧和与参考帧相邻的时序帧。接着提取出参考帧的特征信息和各时序帧的特征信息，将参考帧的特征信息，作为参考帧的参考帧信息，以及将各时序帧的特征信息进行对齐处理，得到各时序帧的时序帧信息。然后根据参考帧信息，对各时序帧信息进行聚合处理，得到各时序帧的聚合信息。最后根据参考帧信息和各聚合信息，重建出参考帧的目标视频帧。目标视频帧的图像质量高于参考帧的图像质量。这样，通过对与参考帧相邻的各时序帧的特征信息进行对齐和聚合处理，并结合参考帧信息和各时序帧的聚合信息，使得重建出的视频帧拥有更高的信噪比和结构相似性，视觉效果也更为逼真，从而提高了重建出的视频帧的图像质量。避免了通过神经网络直接学习低分辨率图像到高分辨率图像的非线性映射，导致得到的图像容易存在伪影、噪声等错误的信号，很难重建出高质量的图像的缺陷。

在一个实施例中，上述步骤S102，将各时序帧的特征信息进行对齐处理，得到各时序帧的时序帧信息，具体包括：以参考帧为对齐目标，分别基于各时序帧的特征信息的历史运动信息，将各时序帧的特征信息进行对齐处理，得到各时序帧的时序帧信息。

其中，历史运动信息，是指连续性(C-Prop)、唯一性(U-Prop)和转移性(T-Prop)这三种运动信息。

具体地，服务器采用渐进式的运动对齐策略，以参考帧为对齐目标，将各时序帧的特征信息的历史运动信息作为已知条件，将各时序帧的特征信息进行运动对齐处理，得到各时序帧的对齐信息，对应作为各时序帧的时序帧信息。这样，将历史运动信息作为已知条件，有利于帮助到当前时序帧的对齐。

进一步地，以参考帧为对齐目标，分别基于各时序帧的特征信息的历史运动信息，将各时序帧的特征信息进行对齐处理，得到各时序帧的时序帧信息，具体可以通过下述方式实现：若时序帧与参考帧之间包含中间帧，则以中间帧为对齐目标，基于时序帧的特征信息的历史运动信息，对时序帧的特征信息进行对齐处理，得到时序帧的初始对齐信息。以参考帧为对齐目标，基于初始对齐信息的历史运动信息，对初始对齐信息进行再次对齐处理，得到时序帧的时序帧信息。

举例说明，参考图2，A表示一次对齐任务的集合，A包含了多个a，每个a是一个对齐单元；A1，A2的下标表示了相邻帧的序号“1”，“2”；

表示了两对齐单元之间的信息传递，箭头表示信息从

传递到了

和

都表示了将时刻“1”的信息对齐到时刻“0”，而它们的下标分别是“1”和“2”，说明了它们的信号分别来自视频帧“1”和视频帧“2”。M表示运动向量，比如

C-Prop、U-Prop、T-Prop分别表示连续性、唯一性、转移性这三种运动信息。

具体实现中，参考图2，假设有五个连续帧，编号分别为“-2”，“-1”，“0”，“+1”，“+2”；运动对齐的目标是为了把四个相邻帧“-2”，“-1”，“+1”，“+2”对齐到参考帧“0”上，这样四个对齐的任务定义成A-2，A-1，A1，A2；根据定义，A1表示了“+1”→“0”这个对齐任务，这个任务“+1”和“0”之间不存在中间帧，因此只有一个对齐单元

A2表示了“+2”→“0”这个对齐任务，而“+2”和“0”存在一个中间帧“1”，因此A2包含了两个对齐单元

“+2”→“+1”，

“+1”→“0”。A2中包含的两个对齐单元

和

在时序上是相邻的，定义运动连续性的传递规则“C”：

相邻的两个对齐任务，例如A1和A2中的

和

表示的对齐起始时刻和终止时刻一样，即“+1”→“0”，但隶属于对齐任务A1和A2，因此他们的源信息分别来自于时序帧“+1”和“+2”，这里定义了运动对齐信息的第二种传递规则“U”：

而基于前面给出的两种传递规则，衍生出了第三种传递规则“T”：

参考图2，可以简单表示为：

A1:(“+1”→“0”)

A2:(“+2”→“+1”，“+1”→“+0”)

A3：以此类推。

这样，对于不同帧的信息，采用了渐进式的对齐策略，解决了长距离直接对齐困难的问题；于此同时，充分地考虑了历史对齐信息，比如三种相关的历史运动信息：“C”，“U”，“T”；在每次执行当前对齐步骤时，将历史的运动信号作为已知的条件，帮助到当前的对齐。

本实施例中，通过渐进的对齐方案，充分挖掘了不同帧运动之间的关系，从而能够准确的实现时序的对齐，使得得到的时序帧的时序帧信息比较准确，同时解决了长距离直接对齐困难的问题。

在一个实施例中，上述步骤S103，根据参考帧信息，对各时序帧信息进行聚合处理，得到各时序帧的聚合信息，具体包括：根据参考帧信息和各时序帧信息，确定各时序帧信息的第一聚合权重和第二聚合权重；根据各时序帧信息的第一聚合权重，对各时序帧信息进行聚合处理，得到各时序帧信息的初始聚合信息；根据各时序帧信息的第二聚合权重，对各时序帧信息的初始聚合信息进行再次聚合处理，得到各时序帧的聚合信息。

其中，第一聚合权重是指准确性聚合权重，比如图3中的W _k；第二聚合权重是指一致性聚合权重，比如图3中的C _k。

具体实现中，各时序帧信息的第一聚合权重通过下述方式得到：分别获取各时序帧信息与参考帧信息之间的差异信息；根据各时序帧信息与参考帧信息之间的差异信息，确定各时序帧信息的第一聚合权重。例如，服务器分别获取各时序帧信息与参考帧信息之间的差异信息；根据各时序帧信息与参考帧信息之间的差异信息，查询预设的差异信息与第一聚合权重的对应关系，得到各时序帧信息的第一聚合权重。

具体实现中，各时序帧信息的第二聚合权重通过下述方式得到：获取各时序帧信息的平均值；获取各时序帧信息与平均值之间的距离；根据各时序帧信息与平均值之间的距离，确定各时序帧信息的第二聚合权重。例如，服务器先计算各时序帧信息的平均值，然后分别获取各时序帧信息与平均值之间的平方根距离，对应作为各时序帧信息与平均值之间的距离。最后根据各时序帧信息与平均值之间的距离，查询预设的距离与第二聚合权重的对应关系，得到各时序帧信息的第二聚合权重。

举例说明，参考图3，有两种聚合策略，分别是基于准确性的信息重聚合策略和基于一致性的信息聚合策略；F表示时序帧信息，P表示图像块。

针对图3中的(a)基于准确性的信息重聚合策略：首先有一个时序帧信息

对任意的一个位置取3*3的块，同时将相同位置的参考帧信息取出，逐一的将参考帧的信息和这个对应的块进行乘法运算。之后将乘积的结果进行归一化处理(比如softmax处理)，得到了这个3*3块的权重W _k。最后再将这个3*3的权重乘以这个3*3块并求和，这样就得到了一个新的值。这个新的值则是基于准确性的信息重聚合得到像素值，所有位置经过计算后就生成了初始聚合信息

需要说明的是，时序帧信息和参考帧信息之间的差异，通过计算余弦距离(向量点积)得到的，值越大，表示时序帧信息和参考帧信息之间的差异越小，则权重越大。

针对图3中的(b)基于一致性的信息聚合策略：先将所有的相邻时序帧信息求平均，这样就得到了平均时序帧信息

每个相邻时序帧信息都逐元素的和平均时序帧信息进行求平方根，通过指数函数“exp ^-(*)”就得到了新的一张权重图C _k。需要说明的是，平方根距离(体现为差异性)越大，说明该时序帧的信息不连续性越强，则应该降低权重的大小。

最后，使用逐元素相乘结合两种策略的输出结果：

这样就得到了一时序帧重聚合之后的信息

需要说明的是，基于这两种权重，既能够过滤掉不准确的时序信息，又可以增强准确、可靠的时序信息。当时序信息不准确时，权重W _k就相应的比较小，从而聚合的程度就小，达到过滤不准确的时序信息的目的。同理，当时序信息不连续时，C _k就较小，同样聚合程度也小，从而同样可以过滤掉不连续，也就是不准确的时序信息。相反，当C _k和W _k都大时，他们的乘积才大，因此又可以用来增强准确、可靠的时序信息。本申请实施例结合这两种度量方式，实现信息重聚合。

本实施例中，根据各时序帧信息的第一聚合权重和第二聚合权重，对各时序帧的时序帧信息进行聚合处理，得到各时序帧的聚合信息，既能够过滤掉不准确的时序信息，又可以增强准确、可靠的时序信息。

在一个实施例中，上述步骤S104，根据参考帧信息和各聚合信息，重建出参考帧的目标视频帧，具体包括：将参考帧信息和各聚合信息进行拼接处理，得到拼接信息；对拼接信息进行卷积处理，得到参考帧的目标视频帧。

具体地，服务器将参考帧信息和各聚合信息输入信息重建模型，通过信息重建模型将参考帧信息和各聚合信息进行拼接处理，得到拼接信息，并对拼接信息进行一系列卷积处理，得到高质量的视频帧，作为参考帧的目标视频帧。

本实施例中，根据参考帧信息和各聚合信息，有利于重建高质量的目标视频帧，避免了通过神经网络直接学习低分辨率图像到高分辨率图像的非线性映射，导致得到的图像容易存在伪影、噪声等错误的信号，很难重建出高质量的图像的缺陷。

在一个实施例中，如图4所示，提供了另一种视频增强方法，以该方法应用于服务器为例进行说明，包括以下步骤：

步骤S401，获取连续视频帧；其中，连续视频帧包括参考帧和与参考帧相邻的时序帧。

步骤S402，提取出参考帧的特征信息和各时序帧的特征信息，将参考帧的特征信息，作为参考帧的参考帧信息。

步骤S403，以参考帧为对齐目标，分别基于各时序帧的特征信息的历史运动信息，将各时序帧的特征信息进行对齐处理，得到各时序帧的时序帧信息。

步骤S404，分别获取各时序帧信息与参考帧信息之间的差异信息；根据各时序帧信息与参考帧信息之间的差异信息，确定各时序帧信息的第一聚合权重。

步骤S405，获取各时序帧信息的平均值；获取各时序帧信息与平均值之间的距离；根据各时序帧信息与平均值之间的距离，确定各时序帧信息的第二聚合权重。

步骤S406，根据各时序帧信息的第一聚合权重，对各时序帧信息进行聚合处理，得到各时序帧信息的初始聚合信息。

步骤S407，根据各时序帧信息的第二聚合权重，对各时序帧信息的初始聚合信息进行再次聚合处理，得到各时序帧的聚合信息。

步骤S408，将参考帧信息和各聚合信息进行拼接处理，得到拼接信息；对拼接信息进行卷积处理，得到参考帧的目标视频帧。

上述视频增强方法中，通过对与参考帧相邻的各时序帧的特征信息进行对齐和聚合处理，并结合参考帧信息和各时序帧的聚合信息，使得重建出的视频帧拥有更高的信噪比和结构相似性，视觉效果也更为逼真，从而提高了重建出的视频帧的图像质量。避免了通过神经网络直接学习低分辨率图像到高分辨率图像的非线性映射，导致得到的图像容易存在伪影、噪声等错误的信号，很难重建出高质量的图像的缺陷。

在一个实施例中，如图5所示，本申请实施例还提出了一种用于时序对齐的视频增强方法，该方法不同于以前的方法直接对长距离的相邻帧进行运动估计，本申请实施例采用了一种渐进式的对齐策略。该对齐的策略充分利用了历史的运动信息，从而可以更加准确的实现长距离的帧间对齐、获取更可靠的时序信息。于此同时，为了过滤掉不可靠的对齐信息，本申请实施例提出了一种基于时序信息一致性和准确性的信息聚合策略。通过所提出的策略，使得本申请实施例的方法能够在剔除不可靠的对齐信息的同时增强可靠对齐信息的权重。该方法所生成的图像拥有更高的信噪比和结构相似性，视觉效果也更为逼真。可以有效的处理视频模糊和噪声，并提高视频的分辨率，从而生成高质量的视频画面。具体包括如下内容：

首先通过特征提取器来提取每个视频帧的信息，接着通过渐进式的运动对齐器将提取的信息进行初步的对齐。然后通过信息聚合器对不同的对齐信息进行聚合，最后通过重建器将聚合后的信息进行计算，并重建出高质量的视频帧。

其中，运动对齐是视频修复任务的一个重要组成模块，本申请实施例提出的运动对齐模块流程如图2左边的图所示，对于不同帧的信息，采用了渐进式的对齐策略，解决了长距离直接对齐困难的问题。于此同时，充分地考虑了历史对齐信息，如图2右边的图所示，定义了三种相关的历史运动信息：“C”，“U”，“T”。在每次执行当前对齐步骤时，将历史的运动信号作为已知条件，帮助到当前的对齐。通过这次渐进式的对齐方案，充分挖掘了不同帧运动之间的关系，从而能够准确的实现时序的对齐。

其中，对于视频修复任务而言，每个对齐的时序帧信息的重要性是存在差异性的，而且在对齐模块中不可避免的会引入一定的误差。为了更好的消除掉对齐模块产生的误差，同时给于不同时序帧信息自适应的聚合权重，本申请实施例提出了一种有效的信息重聚合模块。如图3所示：对于给定的某个相邻的时序帧信息，本申请实施例共采用了两种策略来实现自适应的聚合：(1)基于准确性的信息重聚合策略：如图3中的(a)所示，对于每一个时序帧信息，计算该时序帧信息和参考帧信息之间的差异，根据差异性计算了基于信息准确性的聚合权重。(2)基于一致性的信息聚合策略：如图3中的(b)所示，对于每个时序帧信息，统计该时序帧信息和平均的时序帧信息之间的距离，根据距离的大小，计算了基于信息一致性的聚合权重。基于这两种权重，既能够过滤掉不准确的时序信息，又可以增强准确、可靠的时序信息。

上述用于时序对齐的视频增强方法，可以达到以下技术效果：(1)本方法突破了相关视频修复方法只能处理某种特定任务的限制，可以在一种框架中同时处理三种不同的视频问题，同时生成质量更高的视频帧；相比于相关视频修复方法，本方法在视频去模糊任务、视频去噪声任务和视频超分任务，都取得了最佳的结果；(2)克服了相关技术对于快速运动的物体难以进行帧间的信息对齐和聚合，从而很难重建出高质量的图像的缺陷；同时避免了相关技术对于有效信息的聚合存在偏差，使得产生的图像存在伪影、噪声等错误的信号的缺陷。

应该理解的是，虽然图1-5的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，图1-5中的至少一部分步骤可以包括多个步骤或者多个阶段，这些步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中，如图6所示，提供了一种视频增强装置，包括：

视频帧获取模块610，用于获取连续视频帧；其中，连续视频帧包括参考帧和与参考帧相邻的时序帧。

信息提取模块620，用于提取出参考帧的特征信息和各时序帧的特征信息；将参考帧的特征信息，作为参考帧的参考帧信息，以及将各时序帧的特征信息进行对齐处理，得到各时序帧的时序帧信息。

信息聚合模块630，用于根据参考帧信息，对各时序帧信息进行聚合处理，得到各时序帧的聚合信息。

视频帧重建模块640，用于根据参考帧信息和各聚合信息，重建出参考帧的目标视频帧；其中，目标视频帧的图像质量高于参考帧的图像质量。

在一些实施例中，信息提取模块620，具体用于以参考帧为对齐目标，分别基于各时序帧的特征信息的历史运动信息，将各时序帧的特征信息进行对齐处理，得到各时序帧的时序帧信息。

在一些实施例中，信息提取模块620，具体用于若时序帧与参考帧之间包含中间帧，则以中间帧为对齐目标，基于时序帧的特征信息的历史运动信息，对时序帧的特征信息进行对齐处理，得到时序帧的初始对齐信息；以参考帧为对齐目标，基于初始对齐信息的历史运动信息，对初始对齐信息进行再次对齐处理，得到时序帧的时序帧信息。

在一些实施例中，信息聚合模块630，具体用于根据参考帧信息和各时序帧信息，确定各时序帧信息的第一聚合权重和第二聚合权重；根据各时序帧信息的第一聚合权重，对各时序帧信息进行聚合处理，得到各时序帧信息的初始聚合信息；根据各时序帧信息的第二聚合权重，对各时序帧信息的初始聚合信息进行再次聚合处理，得到各时序帧的聚合信息。

在一些实施例中，信息聚合模块630，还用于分别获取各时序帧信息与参考帧信息之间的差异信息；根据各时序帧信息与参考帧信息之间的差异信息，确定各时序帧信息的第一聚合权重。

在一些实施例中，信息聚合模块630，还用于获取各时序帧信息的平均值；获取各时序帧信息与平均值之间的距离；根据各时序帧信息与平均值之间的距离，确定各时序帧信息的第二聚合权重。

在一些实施例中，视频帧重建模块640，具体用于将参考帧信息和各聚合信息进行拼接处理，得到拼接信息；对拼接信息进行卷积处理，得到参考帧的目标视频帧。

在一些实施例中，视频帧重建模块640，具体用于将参考帧信息和各聚合信息输入信息重建模型，通过信息重建模型将参考帧信息和各聚合信息进行拼接处理，得到拼接信息。

在一些实施例中，时序帧信息与参考帧信息之间的差异信息是通过计算时序帧信息与参考帧信息的余弦距离得到的。

关于视频增强装置的具体限定可以参见上文中对于视频增强方法的限定，在此不再赘述。上述视频增强装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是服务器，其内部结构图可以如图7所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储参考帧的特征信息、各时序帧的特征信息、各时序帧的时序帧信息、各时序帧的聚合信息、目标视频帧等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种视频增强方法。

本领域技术人员可以理解，图7中示出的结构，仅仅是与本申请实施例方案相关的部分结构的框图，并不构成对本申请实施例方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，还提供了一种计算机设备，包括存储器和处理器，存储器中存储有计算机程序，该处理器执行计算机程序时实现上述各方法实施例中的步骤。

在一个实施例中，提供了一种计算机可读存储介质，存储有计算机程序，该计算机程序被处理器执行时实现上述各方法实施例中的步骤。

在一个实施例中，提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述各方法实施例中的步骤。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请实施例所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory，ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory，RAM)或外部高速缓冲存储器。作为说明而非局限，RAM可以是多种形式，比如静态随机存取存储器(Static Random Access Memory，SRAM)或动态随机存取存储器(Dynamic Random Access Memory，DRAM)等。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请实施例的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请实施例构思的前提下，还可以做出若干变形和改进，这些都属于本申请实施例的保护范围。因此，本申请实施例专利的保护范围应以所附权利要求为准。

Claims

一种视频增强方法，其特征在于，包括：

获取连续视频帧；其中，所述连续视频帧包括参考帧和与所述参考帧相邻的时序帧；

提取出所述参考帧的特征信息和各所述时序帧的特征信息；将所述参考帧的特征信息，作为所述参考帧的参考帧信息，以及将各所述时序帧的特征信息进行对齐处理，得到各所述时序帧的时序帧信息；

根据所述参考帧信息，对各所述时序帧信息进行聚合处理，得到各所述时序帧的聚合信息；

根据所述参考帧信息和各所述聚合信息，重建出所述参考帧的目标视频帧；其中，所述目标视频帧的图像质量高于所述参考帧的图像质量。
根据权利要求1所述的方法，其特征在于，所述将各所述时序帧的特征信息进行对齐处理，得到各所述时序帧的时序帧信息，包括：

以所述参考帧为对齐目标，分别基于各所述时序帧的特征信息的历史运动信息，将各所述时序帧的特征信息进行对齐处理，得到各所述时序帧的时序帧信息。
根据权利要求2所述的方法，其特征在于，所述以所述参考帧为对齐目标，分别基于各所述时序帧的特征信息的历史运动信息，将各所述时序帧的特征信息进行对齐处理，得到各所述时序帧的时序帧信息，包括：

若所述时序帧与所述参考帧之间包含中间帧，则以所述中间帧为对齐目标，基于所述时序帧的特征信息的历史运动信息，对所述时序帧的特征信息进行对齐处理，得到所述时序帧的初始对齐信息；

以所述参考帧为对齐目标，基于所述初始对齐信息的历史运动信息，对所述初始对齐信息进行再次对齐处理，得到所述时序帧的时序帧信息。
根据权利要求1所述的方法，其特征在于，所述根据所述参考帧信息，对各所述时序帧信息进行聚合处理，得到各所述时序帧的聚合信息，包括：

根据所述参考帧信息和各所述时序帧信息，确定各所述时序帧信息的第一聚合权重和第二聚合权重；

根据各所述时序帧信息的第一聚合权重，对各所述时序帧信息进行聚合处理，得到各所述时序帧信息的初始聚合信息；

根据各所述时序帧信息的第二聚合权重，对各所述时序帧信息的初始聚合信息进行再次聚合处理，得到各所述时序帧的聚合信息。
根据权利要求4所述的方法，其特征在于，所述各所述时序帧信息的第一聚合权重通过下述方式得到：

分别获取各所述时序帧信息与所述参考帧信息之间的差异信息；

根据各所述时序帧信息与所述参考帧信息之间的差异信息，确定各所述时序帧信息的第一聚合权重。
根据权利要求4所述的方法，其特征在于，所述各所述时序帧信息的第二聚合权重通过下述方式得到：

获取各所述时序帧信息的平均值；

获取各所述时序帧信息与所述平均值之间的距离；

根据各所述时序帧信息与所述平均值之间的距离，确定各所述时序帧信息的第二聚合权重。
根据权利要求1所述的方法，其特征在于，所述根据所述参考帧信息和各所述聚合信息，重建出所述参考帧的目标视频帧，包括：

将所述参考帧信息和各所述聚合信息进行拼接处理，得到拼接信息；

对所述拼接信息进行卷积处理，得到所述参考帧的目标视频帧。
根据权利要求7所述的方法，其特征在于，所述将所述参考帧信息和各所述聚合信息进行拼接处理，得到拼接信息，包括：

将所述参考帧信息和各所述聚合信息输入信息重建模型，通过所述信息重建模型将所述参考帧信息和各所述聚合信息进行拼接处理，得到拼接信息。
根据权利要求5所述的方法，其特征在于，所述时序帧信息与所述参考帧信息之间的差异信息是通过计算所述时序帧信息与所述参考帧信息的余弦距离得到的。
一种视频增强装置，其特征在于，包括：

视频帧获取模块，用于获取连续视频帧；其中，所述连续视频帧包括参考帧和与所述参考帧相邻的时序帧；

信息提取模块，用于提取出所述参考帧的特征信息和各所述时序帧的特征信息；将所述参考帧的特征信息，作为所述参考帧的参考帧信息，以及将各所述时序帧的特征信息进行对齐处理，得到各所述时序帧的时序帧信息；

信息聚合模块，用于根据所述参考帧信息，对各所述时序帧信息进行聚合处理，得到各所述时序帧的聚合信息；

视频帧重建模块，用于根据所述参考帧信息和各所述聚合信息，重建出所述参考帧的目标视频帧；其中，所述目标视频帧的图像质量高于所述参考帧的图像质量。
根据权利要求10所述的装置，其特征在于，所述信息提取模块，具体用于以参考帧为对齐目标，分别基于各时序帧的特征信息的历史运动信息，将各时序帧的特征信息进行对齐处理，得到各时序帧的时序帧信息。
根据权利要求11所述的装置，其特征在于，所述信息提取模块，具体用于若时序帧与参考帧之间包含中间帧，则以中间帧为对齐目标，基于时序帧的特征信息的历史运动信息，对时序帧的特征信息进行对齐处理，得到时序帧的初始对齐信息；以参考帧为对齐目标，基于初始对齐信息的历史运动信息，对初始对齐信息进行再次对齐处理，得到时序帧的时序帧信息。
根据权利要求10所述的装置，其特征在于，所述信息聚合模块，具体用于根据参考帧信息和各时序帧信息，确定各时序帧信息的第一聚合权重和第二聚合权重；根据各时序帧信息的第一聚合权重，对各时序帧信息进行聚合处理，得到各时序帧信息的初始聚合信息；根据各时序帧信息的第二聚合权重，对各时序帧信息的初始聚合信息进行再次聚合处理，得到各时序帧的聚合信息。
根据权利要求13所述的装置，其特征在于，所述信息聚合模块，还用于分别获取各时序帧信息与参考帧信息之间的差异信息；根据各时序帧信息与参考帧信息之间的差异信息，确定各时序帧信息的第一聚合权重。
根据权利要求13所述的装置，其特征在于，所述信息聚合模块，还用于获取各时序帧信息的平均值；获取各时序帧信息与平均值之间的距离；根据各时序帧信息与平均值之间的距离，确定各时序帧信息的第二聚合权重。
根据权利要求10所述的装置，其特征在于，所述视频帧重建模块，具体用于将参考帧信息和各聚合信息进行拼接处理，得到拼接信息；对拼接信息进行卷积处理，得到参考帧的目标视频帧。
根据权利要求16所述的装置，其特征在于，所述视频帧重建模块，具体用于将所述参考帧信息和各所述聚合信息输入信息重建模型，通过所述信息重建模型将所述参考帧信息和各所述聚合信息进行拼接处理，得到拼接信息。
一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至9中任一项所述的方法的步骤。
一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至9中任一项所述的方法的步骤。
一种计算机程序产品，其特征在于，所述计算机程序产品包括计算机程序，所述计算机程序被处理器执行时实现权利要求1至9任一项所述的方法的步骤。