CN112651898B

CN112651898B - 一种基于记忆增强的视频去雨方法与装置

Info

Publication number: CN112651898B
Application number: CN202110034912.0A
Authority: CN
Inventors: 刘家瑛; 胡煜章; 杨文瀚; 郭宗明
Original assignee: Peking University
Current assignee: Peking University
Priority date: 2021-01-12
Filing date: 2021-01-12
Publication date: 2023-04-07
Anticipated expiration: 2041-01-12
Also published as: CN112651898A

Abstract

本发明公开了一种基于记忆增强的视频去雨方法与装置，其步骤包括：1)将卷积长短期记忆网络的内部状态作为全局长期记忆；对于待去雨处理的目标视频，将该目标视频的前n帧分别输入记忆增强去雨网络，获得各帧对应的去雨结果；2)对于该目标视频的第n帧之后的每一帧，执行步骤a)～c)，获得该目标视频对应的去雨视频：a)将当前待去雨帧的前多帧的去雨结果、全局长期记忆、当前待去雨帧输入记忆增强去雨网络进行去雨，得到当前帧的去雨结果；b)计算当前待去雨帧与其去雨结果之间的差值，作为当前待去雨帧的雨痕图；c)将雨痕图输入卷积长短期记忆网络，更新该卷积长短期记忆网络的内部状态作为新的全局长期记忆。

Description

一种基于记忆增强的视频去雨方法与装置

技术领域

本发明属于软件技术领域，涉及一种视频去雨方法，尤其涉及一种基于记忆增强的视频去雨方法与装置。

背景技术

在雨天条件下拍摄得到的视频数据，在视频帧中会出现雨痕，同时局部区域还会由于水汽的聚集而产生雾化的效果，这些现象会导致视频的质量受到很大的影响，主要体现在两个方面：首先视频的主观图像质量会受到影响，导致其视觉效果不佳。此外，随着计算机视觉的快速发展，对雨天拍摄的视频的相关计算机视觉分析任务的性能也会受到下降，比如对于雨天视频中的目标检测，会由于雨痕、雾化的现象导致准确率降低，这也是自动驾驶真正投入实际应用过程中所必须面对的问题。因此，视频去雨方法逐渐成为了研究热点。近年来，随着深度学习的快速发展，基于深度学习进行视频去雨逐渐成为可能。

对于视频去雨问题，需要从单张图像的去雨与多帧之间的时域连续性结合来考虑。经过去雨得到的结果，不仅本身需要有较好的视觉效果，还需要保证所有的去雨后的帧之间依然保有较好的时域连续性，否则，即使单个视频帧能够取得较好的去雨效果，如果缺乏对于去雨结果的时域连续性约束，那么相邻帧之间由于去雨过程可能会产生了不一致的图像变形，那么会严重影响去雨后的视频的质量。

发明内容

针对上述问题和相关方法的缺陷，本发明的目的在于提供一种基于记忆增强的视频去雨方法与装置。在每一帧的去雨过程中，本发明所提出的记忆增强去雨网络的输入，除了当前待去雨帧外，还会将当前待去雨帧的前两帧的去雨结果以及一个全局长期记忆作为输入，其中，前者负责引入短期时域信息，后者引入长期时域信息，从而进行时域上的约束，并引导模型生成时域连续的去雨结果。在当前帧的去雨过程结束后，还会根据去雨结果动态更新全局长期记忆，并用于下一帧的去雨过程。

本发明主要包括以下步骤：

(1)对于视频的前两帧，将长期记忆设置初始化为0，并将其自身直接输入去雨网络获得去雨结果。

(2)从第三帧开始，将当前帧的前两帧的去雨结果、全局长期记忆、当前待去雨帧输入记忆增强去雨网络进行去雨，得到当前帧的去雨结果。

(3)计算当前待去雨帧与其去雨结果之间的差值，即当前帧的雨痕图。

(4)将当前帧的雨痕图输入卷积长短期记忆网络(卷积LSTM网络)，将该卷积长短期记忆网络新的内部状态作为新的全局长期记忆，从而更新全局长期记忆。

(5)重复第2步到第4步，直到所有的视频帧都完成去雨过程，获得完整去雨视频。

本发明的技术方案为：

一种基于记忆增强的视频去雨方法，其步骤包括：

1)将卷积长短期记忆网络的内部状态作为全局长期记忆；对于待去雨处理的目标视频，将该目标视频的前n帧分别输入记忆增强去雨网络，获得各帧对应的去雨结果；

2)对于该目标视频的第n帧之后的每一帧，执行步骤a)～c)，获得该目标视频对应的去雨视频；

a)将当前待去雨帧的前多帧的去雨结果、当前的全局长期记忆、当前待去雨帧输入记忆增强去雨网络进行去雨，得到当前帧的去雨结果；

b)计算当前待去雨帧与其去雨结果之间的差值，作为当前待去雨帧的雨痕图；

c)将当前待去雨帧的雨痕图输入卷积长短期记忆网络，更新该卷积长短期记忆网络的内部状态作为新的全局长期记忆，即更新所述全局长期记忆。

进一步的，所述步骤1)中，n取值为2，即将该目标视频的前两帧I₁以及I₂分别输入记忆增强去雨网络，获得对应的去雨结果I₁以及I₂；将全局长期记忆初始化为0，即ε₀＝0。

进一步的，步骤a)中，将当前待去雨帧的前两帧的去雨结果、当前的全局长期记忆、当前待去雨帧输入记忆增强去雨网络进行去雨，得到当前帧的去雨结果。

进一步的，所述记忆增强去雨网络包括U-Net网络、卷积网络Conv和局部卷积网络；其中，所述U-Net网络，用于根据当前待去雨帧I_t的前多帧的去雨结果提取短期时域信息γ_t并将其输入所述卷积网络Conv；所述卷积网络Conv，用于根据短期时域信息γ_t和当前的全局长期记忆ε_t生成局部卷积系数C_t，并将其输入所述局部卷积网络；所述局部卷积网络，用于根据局部卷积系数C_t和当前待去雨帧I_t，生成当前待去雨帧I_t的去雨结果I_t。

进一步的，所述卷积网络Conv由三层卷积层依次连接组成。

一种基于记忆增强的视频去雨装置，其特征在于，包括卷积长短期记忆网络、记忆增强去雨网络；其中

所述记忆增强去雨网络，用于将当前待去雨帧的前多帧的去雨结果、当前的全局长期记忆、当前待去雨帧输入记忆增强去雨网络进行去雨，得到当前帧的去雨结果；

所述卷积长短期记忆网络，用于将当前待去雨帧的雨痕图更新卷积长短期记忆网络的内部状态作为新的全局长期记忆，即更新所述全局长期记忆；其中，通过计算当前待去雨帧与其去雨结果之间的差值，作为当前待去雨帧的雨痕图。

与现有技术相比，本发明的积极效果为：

本发明能够结合短期时域信息和长期记忆，对于视频帧进行去雨，更好地利用了视频帧之间存在的时域关联性。

附图说明

图1为本发明所使用的记忆增强去雨方法框架示意图。

图2为本发明所使用的记忆增强去雨网络结构图。

具体实施方式

下面对本发明的详细方法流程作进一步地描述：

步骤1：初始化长期记忆。

对于视频的前两帧I₁以及I₂，将全局长期记忆ε₀初始化为0，并各自输入记忆增强去雨网络获得去雨结果I₁以及I₂。

步骤2：进行每一帧的去雨过程。

对于后续待去雨的视频帧I_t，将其前两帧的去雨结果I_t-1和I_t-2、当前时间点的全局长期记忆ε_t以及I_t共同输入到记忆增强去雨网络中，从而获得当前待去雨帧的去雨结果I_t。

记忆增强去雨网络结构如图2所示，具体而言，首先利用U-Net网络(参考Ronneberger,Olaf,Philipp Fischer,and Thomas Brox."U-net:Convolutionalnetworks for biomedical image segmentation."International Conference onMedical image computing and computer-assisted intervention.Springer,Cham,2015.)，根据I_t-1和I_t-2提取短期时域信息γ_t。

γ_t＝UNet(I_t-2,I_t-1)

之后，将当前时间点的长期记忆ε_t以及短期时域信息γ_t输入由三层卷积层组成的简单卷积网络(标记为Conv)，生成局部卷积系数C_t。

C_t＝Conv(ε_t,γ_t)

最后，将计算所得的局部卷积系数C_t与输入的当前待去雨帧I_t进行局部卷积(局部卷积可以参考Niklaus et.al.Video Frame Interpolation via Adaptive SeparableConvolution ICCV2017)，得到当前帧的去雨结果I_t。

步骤3：计算每一帧的雨痕图。

对于当前待去雨帧I_t以及利用去雨网络去雨得到的结果I_t，计算二者之间的差值R_t，并将其视为当前帧的雨痕图。

步骤4：长期记忆更新。

将当前帧的雨痕图输入卷积长短期记忆网络，从而更新其内部状态，并将更新后的新状态作为新的全局长期记忆，即ε_t+1。

更新方式即为传统卷积LSTM网络的更新方式：

ε_t+1＝LSTM(ε_t,R_t)

步骤5：完成所有视频帧去雨。

重复步骤2-4，在这个过程中不断更新长期记忆，直到所有视频帧完成去雨过程。

需要注意的是，公布实施例的目的在于帮助进一步理解本发明，但是本领域的技术人员可以理解：在不脱离本发明及所附权利要求的精神和范围内，各种替换和修改都是可能的。因此，本发明不应局限于实施例所公开的内容，本发明要求保护的范围以权利要求书界定的范围为准。

Claims

1.一种基于记忆增强的视频去雨方法，其步骤包括：

1)将卷积长短期记忆网络的内部状态作为全局长期记忆；对于待去雨处理的目标视频，将该目标视频的前n帧分别输入记忆增强去雨网络，获得各帧对应的去雨结果；所述记忆增强去雨网络包括U-Net网络、卷积网络Conv和局部卷积网络；其中，所述U-Net网络，用于根据当前待去雨帧I_t的前多帧的去雨结果提取短期时域信息γ_t并将其输入所述卷积网络Conv；所述卷积网络Conv，用于根据短期时域信息γ_t和当前的全局长期记忆ε_t生成局部卷积系数C_t，并将其输入所述局部卷积网络；所述局部卷积网络，用于根据局部卷积系数C_t和当前待去雨帧I_t，生成当前待去雨帧I_t的去雨结果

2.如权利要求1所述的方法，其特征在于，所述步骤1)中，n取值为2，即将该目标视频的前两帧I₁以及I₂分别输入记忆增强去雨网络，获得对应的去雨结果

以及

将全局长期记忆初始化为0，即ε₀＝0。

3.如权利要求1或2所述的方法，其特征在于，步骤a)中，将当前待去雨帧的前两帧的去雨结果、当前的全局长期记忆、当前待去雨帧输入记忆增强去雨网络进行去雨，得到当前帧的去雨结果。

4.如权利要求1所述的方法，其特征在于，所述卷积网络Conv由三层卷积层依次连接组成。

5.一种基于记忆增强的视频去雨装置，其特征在于，包括卷积长短期记忆网络、记忆增强去雨网络；其中

所述记忆增强去雨网络，用于将当前待去雨帧的前多帧的去雨结果、当前的全局长期记忆、当前待去雨帧输入记忆增强去雨网络进行去雨，得到当前帧的去雨结果；所述记忆增强去雨网络包括U-Net网络、卷积网络Conv和局部卷积网络；其中，所述U-Net网络，用于根据当前待去雨帧I_t的前多帧的去雨结果提取短期时域信息γ_t并将其输入所述卷积网络Conv；所述卷积网络Conv，用于根据短期时域信息γ_t和当前的全局长期记忆ε_t生成局部卷积系数C_t，并将其输入所述局部卷积网络；所述局部卷积网络，用于根据局部卷积系数C_t和当前待去雨帧I_t，生成当前待去雨帧I_t的去雨结果

6.如权利要求5所述的视频去雨装置，其特征在于，所述卷积网络Conv由三层卷积层依次连接组成。

7.如权利要求5所述的视频去雨装置，其特征在于，对于待去雨处理的目标视频，将该目标视频的前n帧分别输入记忆增强去雨网络，获得各帧对应的去雨结果；将全局长期记忆初始化为0。

8.如权利要求5所述的视频去雨装置，其特征在于，将当前待去雨帧的前两帧的去雨结果、当前的全局长期记忆、当前待去雨帧输入记忆增强去雨网络进行去雨，得到当前帧的去雨结果。