CN111147924A

CN111147924A - 一种视频增强处理方法及系统

Info

Publication number: CN111147924A
Application number: CN201911352154.6A
Authority: CN
Inventors: 王栋; 陆明; 魏晨朝; 姜东�
Original assignee: Shuhang Technology Beijing Co Ltd
Current assignee: Shuhang Technology Beijing Co Ltd
Priority date: 2019-12-24
Filing date: 2019-12-24
Publication date: 2020-05-12
Anticipated expiration: 2039-12-24
Also published as: CN111147924B

Abstract

本发明公开了一种视频增强处理方法及系统，方法包括：获取目标视频，确定目标视频的类别标签是否满足第一预设条件，若是，将目标视频转换为YUV格式，并进行通道分离为亮度通道和色度通道；提取目标视频每帧的亮度通道，分别判断每帧的亮度通道是否满足第一预设条件，若是，则：将该帧的亮度通道输入深度学习网络，生成增强的亮度通道；将增强的亮度通道与色度通道合并，生成增强的帧。本发明能够通过深度学习网络对目标视频的亮度通道的对比度进行增强，有效的提升视频主观质量，自适应提高视频对比度，增强视频的细节特征。

Description

一种视频增强处理方法及系统

技术领域

本发明涉及视频处理技术领域，尤其涉及一种视频增强处理方法及系统。

背景技术

目前，对视频对比度的提高大都利用传统的方法，如，Gamma校正、Retinex算法、直方图均衡化等，或者通过简单调节某些颜色通道的值来实现。现有方案的缺点是：1)普适性较差，对不同类别视频做自适应性处理，需要增加繁琐的判断逻辑；2)鲁棒性较差，处理后的视频或图片容易出现颜色失真、过曝等情况。

因此，如何有效的提升视频主观质量，自适应提高视频对比度，增强视频的细节特征，是一项亟待解决的问题。

发明内容

有鉴于此，本发明提供了一种视频增强处理方法，能够有效的提升视频主观质量，自适应提高视频对比度，增强视频的细节特征。

本发明提供了

一种视频增强处理方法，包括：

获取目标视频；

确定所述目标视频的类别标签是否满足第一预设条件，若是，则：

将所述目标视频转换为YUV格式，并将通道分离为亮度通道和色度通道；

提取所述目标视频每帧的亮度通道，分别判断每帧的亮度通道是否满足第二预设条件，若是，则：

将该帧的亮度通道输入训练好的深度学习网络，生成增强的亮度通道；

将所述增强的亮度通道与所述色度通道合并，生成增强的帧。

优选地，所述方法还包括：

训练所述深度学习网络。

优选地，训练所述深度学习网络，包括：

准备训练数据集，其中，所述训练数据集包括：iPhone 3gs和单反相机在室外同步拍摄的图像；

训练教师网络，将所述iPhone 3gs拍摄的图像的亮度通道输入网络，得到增强的亮度通道，然后计算输入对应的所述单反相机拍摄图像的亮度图像与增强的亮度通道的损失，其中，所述教师网络损失等于第一生成损失与原始损失之和，其中，所述第一生成损失等于深度学习网络生成图像与目标图像亮度通道的均方误差，所述原始损失等于深度学习网络生成图像与输入网络图像的均方误差；不断减小所述损失，直到该损失趋于平稳，得到训练好的教师网络；

基于所述教师网络训练学生网络，减小网络耗时；将所述iPhone 3gs拍摄的图像的亮度通道输入网络，得到增强的亮度通道，然后计算输入对应的所述单反相机拍摄图像的亮度图像与增强的亮度通道的损失，其中，所述学生网络损失等于蒸馏损失与第二生成损失之和，其中，所述蒸馏损失等于教师网络中间层输出与学生网络相对应中间层输出的均方误差，所述第二生成损失等于学生网络生成图像与教师网络生成图像的均方误差，不断减小所述损失，直到该损失趋于平稳，得到训练好的学生网络。

优选地，所述提取所述目标视频每帧的亮度通道，分别判断每帧的亮度通道是否满足第二预设条件，包括：

提取所述目标视频每帧的亮度通道，分别判断每帧的亮度通道像素均值，以及与上一帧的像素均值之差的绝对值是否满足第二预设条件。

一种视频增强处理系统，包括：

获取模块，用于获取目标视频；

确定模块，用于确定所述目标视频的类别标签是否满足第一预设条件；

转换模块，用于当所述目标视频的类别标签满足第一预设条件时，将所述目标视频转换为YUV格式，并进行通道分离为亮度通道和色度通道；

判断模块，用于提取所述目标视频每帧的亮度通道，分别判断每帧的亮度通道是否满足第二预设条件；

第一生成模块，用于当每帧的亮度通道满足第二预设条件时，将该帧的亮度通道输入训练好的深度学习网络，生成增强的亮度通道；

合并模块，用于将所述增强的亮度通道的帧与所述色度通道的帧合并，生成增强的帧。

优选地，所述系统还包括：

第二生成模块，用于训练所述深度学习网络。

优选地，所述第二生成模块在执行训练所述深度学习网络时，具体用于：

训练教师网络，将所述iPhone 3gs拍摄的图像的亮度通道输入网络，得到增强的亮度通道，然后计算输入对应的所述单反相机拍摄图像的亮度图像与增强的亮度通道的损失，其中，所述教师网络损失等于第一生成损失与原始损失之和，其中，所述第一生成损失等于深度学习网络生成图像与目标图像的均方误差，所述原始损失等于深度学习网络生成图像与原始图像的均方误差；不断减小所述损失，直到该损失趋于平稳，得到训练好的教师网络；

基于所述教师网络训练学生网络，将所述iPhone 3gs拍摄的图像的亮度通道输入网络，得到增强的亮度通道，然后计算输入对应的所述单反相机拍摄图像的亮度图像与增强的亮度通道的损失，其中，所述学生网络损失等于蒸馏损失与第二生成损失之和，其中，所述蒸馏损失等于教师网络中间层输出与学生网络相对应中间层输出的均方误差，所述第二生成损失等于学生网络生成图像与教师网络生成图像的均方误差，不断减小所述损失，直到该损失趋于平稳，得到训练好的学生网络。

优选地，所述判断模块在执行提取所述目标视频每帧的亮度通道，分别判断每帧的亮度通道是否满足第二预设条件时，具体用于：

综上所述，本发明公开了一种视频增强处理方法，当需要对视频进行增强处理时，首先获取目标视频，确定目标视频的类别标签满足第一预设条件时，将目标视频转换为YUV格式，并进行通道分离为亮度通道和色度通道，提取目标视频每帧的亮度通道，分别判断每帧的亮度通道是否满足第一预设条件，若是，则：将该帧的亮度通道输入训练好的深度学习网络，生成增强的亮度通道；然后将增强的亮度通道的帧与所述色度通道的帧合并，生成增强的帧。本发明能够通过深度学习网络对目标视频的亮度通道的对比度进行增强，有效的提升视频主观质量，自适应提高视频对比度，增强视频的细节特征。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明公开的一种视频增强处理方法实施例1的方法流程图；

图2为本发明公开的一种视频增强处理方法实施例2的方法流程图；

图3为本发明公开的一种视频增强处理系统实施例1的结构示意图；

图4为本发明公开的一种视频增强处理系统实施例2的结构示意图；

图5为本发明公开的教师网络结构示意图；

图6为本发明公开的学生网络结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

如图1所示，为本发明公开的一种视频增强处理方法实施例1的方法流程图，所述方法可以包括以下步骤：

S101、获取目标视频；

当需要对视频进行增强处理时，首先获取目标视频，即，首先获取需要进行增强处理的视频。

S102、确定目标视频的类别标签是否满足第一预设条件，若是，则进入S103：

在获取到目标视频后，进一步判断目标视频的类别标签是否满足第一预设条件，如果目标视频的类别标签不满足第一预设条件，将不再对目标视频进行增强处理。通过判断目标视频的类别标签是否满足第一预设条件，能够区分出某些颜色敏感类视频，如美妆等。

S103、将目标视频转换为YUV格式，并进行通道分离为亮度通道和色度通道；

在确定目标视频的类别标签满足第一预设条件后，进一步对目标视频进行格式转换，将目标视频转换为YUV格式。其中，YUV格式是一种图片格式，是由Y、U、V三种部分组成，Y表示亮度，U、V表示颜色的色度。在将目标视频转换为YUV格式后，进一步将目标视频分离为亮度通道和色度通道。

S104、提取目标视频每帧的亮度通道，分别判断每帧的亮度通道是否满足第二预设条件，若是，则进入S105：

在将目标视频通道分离为亮度通道和色度通道后，进一步提取出目标视频每帧的亮度通道，并对提取出的每帧的亮度通道进行判断，判断亮度通道是否满足第二预设条件，即，判断亮度通道是否满足增强处理条件。

S105、将该帧的亮度通道输入训练好的深度学习网络，生成增强的亮度通道；

当判断亮度通道满足第一预设条件时，将满足第二预设条件的亮度通道输入预先训练好的深度学习网络，生成增强的亮度通道。

S106、将增强的亮度通道的帧与色度通道的帧合并，生成增强的帧。

然后将生成的增强的亮度通道的帧与目标视频色度通道的帧合并，合成增强的帧，直至所有增强的亮度通道的帧合并后，完成增强的视频。

综上所述，在上述实施例中，当需要对视频进行增强处理时，首先获取目标视频，确定目标视频的类别标签满足第一预设条件时，将目标视频转换为YUV格式，并进行通道分离为亮度通道和色度通道，提取目标视频每帧的亮度通道，分别判断每帧的亮度通道是否满足第一预设条件，若是，则：将该帧的亮度通道输入训练好的深度学习网络，生成增强的亮度通道；然后将增强的亮度通道的帧与所述色度通道的帧合并，生成增强的帧。本发明能够通过深度学习网络对目标视频的亮度通道的对比度进行增强，有效的提升视频主观质量，自适应提高视频对比度，增强视频的细节特征。

如图2所示，为本发明公开的一种视频增强处理方法实施例2的方法流程图，所述方法可以包括以下步骤：

S201、训练深度学习网络；

当需要对视频进行增强处理时，首先训练用于对比度增强的深度学习网络。

具体的，在训练深度学习网络时，首先准备训练数据集，其中，训练数据集包括：iPhone 3gs和单反相机在室外同步拍摄的约22K张图像；

然后，训练教师网络，将iPhone 3gs拍摄的图像的亮度通道输入网络，得到增强的亮度通道，然后计算输入对应的单反相机拍摄图像的亮度图像与增强的亮度通道的损失，其中，教师网络损失等于第一生成损失与原始损失之和，其中，第一生成损失等于深度学习网络生成图像与目标图像亮度通道的均方误差，原始损失等于深度学习网络生成图像与输入网络图像的均方误差；不断减小所述损失，直到该损失趋于平稳，得到训练好的教师网络；

然后，基于教师网络训练学生网络，减小网络耗时；将iPhone 3gs拍摄的图像的亮度通道输入网络，得到增强的亮度通道，然后计算输入对应的单反相机拍摄图像的亮度图像与增强的亮度通道的损失，其中，学生网络损失等于蒸馏损失与第二生成损失之和，其中，蒸馏损失等于教师网络中间层输出与学生网络相对应中间层输出的均方误差，第二生成损失等于学生网络生成图像与教师网络生成图像的均方误差，不断减小所述损失，直到该损失趋于平稳，得到训练好的学生网络。

具体的，如图5所示，为教师网络的结构示意图，如图6所示，为学生网络的结构示意图。

S202、获取目标视频；

在对视频进行增强处理时，获取目标视频，即，首先获取需要进行增强处理的视频。

S203、确定目标视频的类别标签是否满足第一预设条件，若是，则进入S204：

S204、将目标视频转换为YUV格式，并进行通道分离为亮度通道和色度通道；

S205、提取目标视频每帧的亮度通道，分别判断每帧的亮度通道是否满足第二预设条件，若是，则进入S206：

S206、将该帧的亮度通道输入深度学习网络，生成增强的亮度通道；

当判断亮度通道满足第二预设条件时，将满足第二预设条件的亮度通道输入训练好的深度学习网络，生成增强的亮度通道。

S207、将增强的亮度通道的帧与色度通道的帧合并，生成增强的帧。

然后将生成的增强的亮度通道的帧与目标视频色度通道的帧合并，合成增强的帧，直至所有增强的亮度通道的帧合并后，完成对比度增强的视频。

综上所述，本实施例在上述实施例的基础上，在训练深度学习网络时，能够采用训练生成的教师网络去指导训练学生网络，在保持主观质量一致的情况下，能够使得网络预测时间缩小一倍；另外，通过提取目标视频每帧的亮度通道，只对亮度通道进行处理，能够在尽可能保留原始图像/视频的颜色风格的基础上，加快处理速度，进一步提升了用户体验；在对目标视频进行增强处理时，通过预先判断目标视频的类别标签是否满足第一预设条件，能够有效的跳过某些颜色敏感类视频，实现只对目标视频的类别标签满足第一预设条件的目标视频进行增强处理，以达到更好的视频增强处理效果。

如图3所示，为本发明公开的一种视频增强处理系统实施例1的结构示意图，所述系统可以包括：

获取模块301，用于获取目标视频；

确定模块302，用于确定目标视频的类别标签是否满足第一预设条件；

转换模块303，用于当目标视频的类别标签满足第一预设条件时，将目标视频转换为YUV格式，并进行通道分离为亮度通道和色度通道；

判断模块304，用于提取目标视频每帧的亮度通道，分别判断每帧的亮度通道是否满足第二预设条件；

第一生成模块305，用于当每帧的亮度通道满足第二预设条件时，将该帧的亮度通道输入训练好的深度学习网络，生成增强的亮度通道；

当判断亮度通道满足第二预设条件时，将满足第二预设条件的亮度通道输入预先训练好的深度学习网络，生成增强的亮度通道。

合并模块306，用于将增强的亮度通道的帧与色度通道的帧合并，生成增强的帧。

如图4所示，为本发明公开的一种视频增强处理系统实施例2的结构示意图，所述系统可以包括：

第二生成模块401，用于训练深度学习网络；

获取模块402，用于获取目标视频；

确定模块403，用于确定目标视频的类别标签是否满足第一预设条件；

转换模块404，用于当目标视频的类别标签是否满足第一预设条件时，将目标视频转换为YUV格式，并进行通道分离为亮度通道和色度通道；

判断模块405，用于提取目标视频每帧的亮度通道，分别判断每帧的亮度通道是否满足第二预设条件；

第一生成模块406，用于当每帧的亮度通道满足第二预设条件时，将该帧的亮度通道输入深度学习网络，生成增强的亮度通道；

合并模块407，用于将增强的亮度通道的帧与色度通道的帧合并，生成增强的帧。

本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。

专业人员还可以进一步意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块，或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。

对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下，在其它实施例中实现。因此，本发明将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

1.一种视频增强处理方法，其特征在于，包括：

获取目标视频；

2.根据权利要求1所述的方法，其特征在于，还包括：

训练所述深度学习网络。

3.根据权利要求2所述的方法，其特征在于，训练所述深度学习网络，包括：

4.根据权利要求1所述的方法，其特征在于，所述提取所述目标视频每帧的亮度通道，分别判断每帧的亮度通道是否满足第二预设条件，包括：

5.一种视频增强处理系统，其特征在于，包括：

获取模块，用于获取目标视频；

6.根据权利要求5所述的系统，其特征在于，还包括：

第二生成模块，用于训练所述深度学习网络。

7.根据权利要求6所述的系统，其特征在于，所述第二生成模块在执行训练所述深度学习网络时，具体用于：

8.根据权利要求5所述的系统，其特征在于，所述判断模块在执行提取所述目标视频每帧的亮度通道，分别判断每帧的亮度通道是否满足第二预设条件时，具体用于：