CN112465730A

CN112465730A - 一种运动视频去模糊的方法

Info

Publication number: CN112465730A
Application number: CN202011507053.4A
Authority: CN
Inventors: 潘斌; 汤永恒; 杨楠楠; 陈欢; 田梦娇; 刘璐璐
Original assignee: Liaoning Shihua University
Current assignee: Liaoning Shihua University
Priority date: 2020-12-18
Filing date: 2020-12-18
Publication date: 2021-03-09

Abstract

本发明提供一种运动视频去模糊的方法，包括构建视频去模糊模型；获取原视频序列，利用视频去模糊中的DSMAP‑GAN网络对输入的模糊视频图像帧进行预处理，得到一个初步去模糊处理的视频图像帧；将已得到的视频图像帧输入到光流估计模块进行光流估计，再通过时间锐度先验模块得到时间锐度先验信息，最后将上述内容输入到图像隐藏帧恢复网络模块中进行处理，最终输出清晰的视频图像帧，并将其合成流畅的清晰视频。从而能解决现有技术所存在的问题。

Description

一种运动视频去模糊的方法

技术领域

本发明涉及视频图像处理技术领域，主要涉及一种运动视频去模糊的方法。

背景技术

随着移动互联网的快速发展，海量的视频数据随之产生。当代人们获取的大部分信息都是通过人眼视觉系统所得到的，而图像和视频作为主要的视觉信息，逐渐成为了人们日常生活中必不可少的组成部分。

然而，在视频的实际拍摄过程中，由于所拍摄目标的运动以及拍摄设备不可避免的抖动，都会使得所拍摄的视频存在一定的模糊。与此同时，在视频的传输存储过程中，视频图像的格式改变以及存储介质的性质改变都可能引起视频图像失真模糊。这时，视频质量的改变将会在安防领域、自动驾驶系统、医学影像分析、遥感图像等领域内产生严重影响。因此，为了获取到质量更好的视频图像并将其应用到更充分的应用领域内，视频去模糊是必不可少的前期工作。

对于运动视频去模糊是计算机视觉中的基本问题，模糊视频处理主要分为三大类：（1）视频图像的非盲运动去模糊，最早提出的去模糊方法是逆滤波去卷积方法，随着研究的不断深入，由Donatelli等人将偏微分方程理论应用于视频图像的恢复处理。（2）视频图像的盲运动去模糊，最早由Fergus等人基于研究对比运动模糊退化的视频图像，以及原始清晰的视频图像各自的梯度分布，提出的一种基于分布统计模型的盲运动去模糊算法。（3）基于视频的运动去模糊，由Takeda等人针对视频图像序列的特性，充分利用时域上的信息，建立三维的时空不变的点扩散函数模型来对视频进行去模糊处理。

目前，视频图像的去模糊方法大都是将多帧图像一起送入卷积神经网络模型，使用2D卷积核来提取单帧图像，使用重构损失函数作为监督，来对模糊的视频进行多次优化处理，达到去模糊的效果，然而这些方法过于依赖卷积神经网络，导致视频去模糊的时效性不佳，同时去模糊模型在实际应用中出现很多制约。此外，上述方法往往过于注重输入帧序列之间的时序联系，而忽视了生成的视频中帧与帧的连续性，导致恢复出来的视频出现一定的不连续性。

我们注意到，这些算法在视频去模糊方面的成功主要是对大容量模型的使用。与这些方法不同的是，我们探索了简单而成熟的原理，使去模糊模型更紧凑，而不仅仅是扩大网络模型的容量来进行视频去模糊。

发明内容

针对现有技术存在的不足，本发明提供一种运动去模糊的方法，目的在于消除拍摄设备摄像过程中模糊视频图像的模糊像素。该方法首先使用DSMAP-GAN网络对输入的模糊视频图像帧进行预处理，得到一个初步去模糊处理的视频图像帧；将已得到的视频图像帧输入到光流估计模块进行光流估计，再通过时间锐度先验模块得到时间锐度先验信息，最后将上述内容输入到图像隐藏帧恢复网络模块中进行处理，最终输出清晰的视频图像帧，并将其合成流畅的清晰视频。从而解决现有技术所存在的问题。

为实现上述目的，本发明提供了如下技术方案：一种运动视频去模糊的方法，包括以下步骤。

S1、构建视频去模糊模型；其中去模糊模型包括DSMAP-GAN网络预处理模块、光流估计模块、时间锐度模块和恢复网络模块。

S2、获取原始视频序列，将模糊视频每一帧分为一个模糊图像。然后输入到DSMAP-GAN模块中进行预处理达到初步去模糊。

S3、DSMAP-GAN模块训练过程是将模糊视频图像帧序列定为训练集A，清晰视频图像帧序列定为训练集B，然后输入到DSMAP-GAN网络中进行对抗训练得到最优的网络模型。

S4、将步骤2中生成的多张连续的初步去模糊图像帧输入到后续去模糊模块中去。

S5、在后续去模糊模块中，首先利用光流估计模块进行光流估计。

S6、将步骤2生成的初步去模糊图像帧输入到时间锐度先验模块上，得到时间锐度先验信息。

S7、将经过上述步骤处理后的图像帧序列和光流信息以及时间锐度信息一起输入到恢复网络模块上，恢复网络是一个编码器-解码器构造，经过它的进一步处理，最终得到更清晰的图像。

S8、将经步骤7处理后的图像帧序列合成流畅的清晰视频，然后将去模糊的运动视频结果进行可视化。

与现有技术相比，本发明具有如下有益效果。

1. 与现有技术相比，本发明使用光流估计模块，模型借助于该模块可以为后面的恢复网路提供更精确的运动光流信息，有助于视频去模糊。

与现有技术相比，本发明使用时间锐度先验模块，利用该模块模型可以提取相邻视频帧之间清晰的像素信息，有助于隐藏帧恢复网络对隐藏帧进行恢复。

下面结合说明书附图和具体实施例对本发明作进一步说明。

附图说明

图1为本发明的操作原理框图。

图2为本发明的DSMAP-GAN的网络流程图。

图3为本发明的去模糊模块中恢复网络结构图。

具体实施方式

本发明提供了一种运动视频去模糊方法，用于提高运动视频去模糊的效果。

为了使发明的目的、特征和优点更加清晰，下面结合附图和具体实施方案，对本发明进一步的详细描述。需要说明的是，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。

请参阅图1到图3，首先将视频采集设备所采集到的由于目标运动所产生的模糊视频传输到DSMAP-GAN视频图像预处理模块组，在这里进行视频图像预处理，然后将预处理后的视频图像输入到视频图像去模糊模块组，最终将清晰的去模糊视频图像在显示终端进行可视化输出。

在视频图像去模糊模块组内部，由光流估计模块，时间锐度先验模块，隐藏帧恢复模块组成。

具体实施步骤如下。

S1、首先将模糊视频序列处理为一帧帧的视频图像序列，然后将视频图像序列输入到DSMAP-GAN视频图像预处理模块进行初步去模糊。

S2、在DSMAP-GAN模型上，将模糊视频帧序列A经过最优网络模型处理，生成初步去模糊视频图像帧A1，此时由于模型的鲁棒性很高，生成的初步去模糊视频图像帧A1清晰度已介于模糊视频与清晰视频之间，但是此时的去模糊图像帧A1不足以满足实际的应用需求，同时图像还可以进一步进行去模糊处理来达到更高质量的效果。

S3、将步骤S2中所生成的初步去模糊视频图像帧A1输入到视频图像去模糊模块组内。

S4、在视频图像去模糊模块组中，首先利用光流估计模块进行光流估计，光流估计模块主要为潜在帧的恢复提供运动信息。在给定的两帧图像中，下一帧图像和上一帧图像中每一个点有什么不同，而且不同点移动到了什么位置，从而估计的光流为图像恢复提供运动信息，利用估计的光流，我们可以根据现有的方法（Tae Hyun Kim和Kyung Mu Lee）使用变分模型来恢复潜在帧。

S5、将S2生成的初步去模糊视频序列帧输入到时间锐度先验模块上，时间锐度先验模块主要的作用是探索出相邻帧中清晰的像素信息，帮助后面的恢复网络进行隐藏帧的恢复。

S6、将S2处理的初步去模糊视频序列帧、光流估计信息以及时间锐度先验信息一起输入到隐藏帧恢复模块上。首先把输入图像以在不同比例下采样得到的一系列模糊图像作为输入，编码器模块包含几个阶段的卷积层，解码器模块是使用一系列解卷积层来调整大小，然后在编码器-解码器模块先通过编码器逐步将输入数据转换成具有较小空间尺寸和较多通道的特征映射，再利用解码器将其转换回输入状态；在递归模块，在隐藏状态的瓶颈层中插入卷积层以连接连续的尺度；最后对每个卷积层使用不同尺寸的卷积核；从而产生一系列更清晰的图像。

S7、最后将处理好的图像合成为视频，然后将去模糊清晰化视频结果进行可视化输出。

上述实施例为本发明的一种实施方式，但本发明的实施方式不限定于此，从事该技术人员在未背离本发明精神和原则下所做的非本质的任何修改、替换、改进，均包含在发明的保护范围。

Claims

1.一种运动视频去模糊方法，其特征在于，该方法采用模糊图像预处理模块和去模糊模块对模糊视频进行去模糊处理。

2.根据权利要求1所述的一种运动视频去模糊方法，其特征在于，所述的模糊图像预处理模块采用了DSMP-GAN网络结构。

3.根据权利要求1所述的一种运动视频去模糊方法，其特征在于，所述的视频去模糊模块采用了光流估计和时间锐度先验方法以及恢复网络处理。

4.根据权利要求1、2、3所述的一种运动视频去模糊方法，其特征在于，具体包括以下步骤；

S1、将视频图像以每秒n帧的速率分为图片传输给视频去模糊预处理模块；

S2、将模糊的图像帧在DSMP-GAN进行预处理，生成网络结构；

S3、将经DSMP-GAN生成网络结构处理后的图像输入到去模糊模块中；

S4、将去模糊中的图像经过光流估计和时间锐度先验方法以及恢复网络的处理，得到一张较清晰的图像；

S5、最后将处理好的图像按照正确的序列顺序合成为视频，然后将去模糊清晰化视频结果进行可视化输出。