WO2023178648A1

WO2023178648A1 - 视频处理方法及装置、电子设备、计算机可读存储介质

Info

Publication number: WO2023178648A1
Application number: PCT/CN2022/083016
Authority: WO
Inventors: 陈冠男; 朱丹
Original assignee: 京东方科技集团股份有限公司
Priority date: 2022-03-25
Filing date: 2022-03-25
Publication date: 2023-09-28
Also published as: CN117157665A

Abstract

本公开涉及一种视频处理方法及装置、电子设备和存储介质，视频处理方法包括：获取待处理视频的视频帧；利用色彩增强模型池中的至少一个色彩增强模型对视频帧进行色彩调整，得到色彩调整后的视频输出帧；其中，色彩增强模型池包含针对多种视频内容类型的不同风格需求的视频进行色彩调整的模型集合。

Description

视频处理方法及装置、电子设备、计算机可读存储介质

技术领域

本公开涉及图像处理技术和人工智能领域，具体涉及视频处理方法及装置、电子设备、计算机可读存储介质。

背景技术

色彩增强是图像处理领域的重要技术，该技术通过调整图片和视频的画面色彩，使图像画面更加丰富和逼真，使视频画质得到较大提升。该技术可以应用于视频色彩创作、片源画质增强等计算机视觉场景。

发明内容

本公开实施例提出了一种视频处理方法及装置、电子设备、计算机可读存储介质。

第一方面，本公开实施例提供一种视频处理方法，包括：获取待处理视频的视频帧；利用色彩增强模型池中的至少一个色彩增强模型对所述视频帧进行色彩调整，得到色彩调整后的视频输出帧；其中，所述色彩增强模型池包含针对多种视频内容类型的不同风格需求的视频进行色彩调整的模型集合。

其中，所述利用色彩增强模型池中的至少一个色彩增强模型对所述视频帧进行色彩调整，得到色彩调整后的视频输出帧，包括：

接收包含所述视频帧的视频内容类型和风格需求的信息；从所述色彩增强模型池中选择与所述视频内容类型和风格需求对应的色彩增强模型；利用选择的色彩增强模型对所述视频帧进行处理，得到所述色彩调整后的视频输出帧。

其中，所述利用色彩增强模型池中的至少一个色彩增强模型对所述视频帧进行色彩调整，得到色彩调整后的视频输出帧，包括：利用色彩增强模型池中的每个色彩增强模型处理所述视频帧，得到所述每个色彩增强模型输出的色彩调整后的视频帧；基于内容分析模型处理所述视频帧，生成所述每个色彩增强模型与所述视频帧对应的权重值；其中，所述内容分析模型配置为根据所述视频帧确定所述色彩增强模型池中的每个色彩增强模型的权重值；使用所述每个色彩增强模型与所述视频帧对应的权重值，对所述每个色彩增强模型输出的色彩调整后的视频帧进行加权融合处理，生成所述视频输出帧。

其中，所述色彩增强模型中包括：图像重建分支模型和色彩增强分支模型；所述利用选择的色彩增强模型对所述视频帧进行处理，得到所述色彩调整后的视频输出帧，包括：

对所述视频帧进行特征提取，得到第一图像特征；对所述视频帧进行滤波处理，并对滤波处理后的视频帧进行特征提取，得到第二图像特征；将所述第一图像特征输入所述图像重建分支模型，所述第二图像特征输入所述色彩增强分支模型，以根据所述第一图像特征和所述第二图像特征进行图像重建和色彩调整；对所述图像重建分支模型的输出结果和所述色彩增强分支模型的输出结果进行特征融合处理，得到融合结果；根据所述融合结果，生成色彩调整后的视频输出帧。

其中，所述图像重建分支模型和所述色彩增强分支模型中均包括：N个密集残差连接网络模块RDB；所述色彩增强模型中还包括N个全连接层；其中，N为大于或等于1的整数；所述将所述第一图像特征输入所述图像重建分支模型，所述第二图像特征输入所述色彩增强分支模型，以根据所述第一图像特征和所述第二图像特征进行图像重建和色彩调整，包括：

获取所述图像重建分支模型中的首个RDB和所述色彩增强分支模型中的首个RDB，作为第一分支模型当前RDB和第二分支模型当前RDB；通过所述第一分支模型当前RDB处理所述第一图像特征，通过所述第二分支模型当前RDB处理所述第二图像特征，得到所述第一分支模型当前RDB输出的特征图和所述第二分支模型当前RDB输出的低频色彩特征；对于所述第二分支模型当前RDB输出的低频色彩特征，经一个全连接层处理后得到特征向量，将所述特征向量与所述第一分支模型当前RDB输出的特征图对应相乘，得到经局部色彩特征调整的特征图；将所述经局部色彩特征调整的特征图作为新的第一图像特征，将所述第二分支模型当前RDB输出的低频色彩特征作为新的第二图像特征；获取所述图像重建分支模型中的下一个RDB和所述色彩增强分支模型中的下一个RDB，作为新的第一分支模型当前RDB和新的第二分支模型当前RDB，直到获取次数等于N，将新得到的经局部色彩特征调整的特征图作为所述图像重建分支模型的输出结果，并将新得到的低频色彩特征作为所述色彩增强分支模型的输出结果。

其中，所述RDB中包括密集连接网络层和局部特征融合层；所述局部特征融合层用于：利用局部残差学习将所述RDB的输入特征与所述密集连接网络层的输出特征进行特征相加，得到所述RDB的输出特征；所述密集连接层包括：M个密集连接模块和1个连接模块，M为大于或等于1的整数；

其中，首个密集连接模块的输入为所述RDB的输入特征；第i个密集连接模块的输入特征为：所述RDB的输入特征和位于第i个密集连接模块之前的每个密集连接模块的输出特征，i为大于1且小于或等于M的整数；所述连接模块的输入为：所述RDB的输入特征和每个密集连接模块的输出特征。

其中，所述色彩增强模型池中的每个所述色彩增强模型具有相同的模型结构；所述色彩增强模型池中的色彩增强模型，是预先针对不同视频内容类型的色彩风格采用不同的色彩增强数据对，对初始色彩增强模型进行训练得到的训练好的色彩增强模型；所述色彩增强数据对包括：从未调色图像和第一已调色图像中的相同图像位置选取的具有相同图像尺寸的未调色图像块和已调色图像块，所述第一已调色图像是预先获取的基于图像色彩风格特征对所述未调色图像进行调色后的图像。

对所述初始色彩增强模型进行的训练包括：使用所述初始色彩增强模型处理从所述未调色图像中选取的未调色图像块，得到所述未调色图像块的色彩调整结果，并从所述色彩增强数据对中，获取与所述未调色图像块相对应的已调色图像块，作为色彩调整参考结果；基于所述色彩调整结果和所述色彩调整参考结果，构建初始色彩增强模型的损失函数；利用初始色彩增强模型的损失函数调整所述初始色彩增强模型的模型参数，得到更新的色彩增强模型；将所述更新的色彩增强模型作为新的初始色彩增强模型，并使用所述新的初始色彩增强模型处理从所述未调色图像中选取的未调色图像块，直到所述初始色彩增强模型的训练过程满足第一训练结束条件，得到所述训练好的色彩增强模型；其中，所述第一训练结束条件包括如下条件项的至少一项：根据所述初始色彩增强模型的损失函数计算的训练损失小于或者等于设定的第一损失阈值、对所述初始色彩增强模型的训练次数达到设定的第一次数阈值。

其中，所述基于所述色彩调整结果和所述色彩调整参考结果，构建初始色彩增强模型的损失函数，包括：计算所述色彩调整结果和所述色彩调整参考结果之间的最小化平方误差，得到最小化平方误差损失；计算所述色彩调整结果的高斯滤波输出结果和所述色彩调整参考结果的高斯滤波输出结果，得到色彩损失；对所述最小化平方误差损失和所述色彩损失进行加权求和，生成所述初始色彩增强模型的损失函数。

其中，所述内容分析模型包括：依次连接的K个层叠卷积结构的卷积网和两个全连接层，前K-1个层叠卷积结构中的每个层叠卷积结构中均包括一个卷积层、一个激活层和一个池化层，第K层叠卷积结构中包括一个卷积层和一个激活层。

其中，所述内容分析模型，是基于预先训练好的所述色彩增强模型池中的每个色彩增强模型，预先采用不同风格的图像数据对，对初始内容分析模型进行训练得到的训练好的内容分析模型；其中，所述图像数据对包括：从未调色图像和第二已调色图像中的相同图像位置选取的具有相同图像尺寸的未调色图像块和已调色图像块，所述第二已调色图像是预先获取的基于不同视频内容类型对未调色图像进行调色后的图像。

其中，对所述初始内容分析模型进行的训练包括：

利用预先训练好的色彩增强模型池中的每个色彩增强模型，处理从所述未调色图像中选取的未调色图像块，得到所述每个色彩增强模型对所述未调色图像块的色彩调整结果；使用初始内容分析模型对所述未调色图像块进行处理，得到预定数量的权重值，所述预定数量与所述色彩增强模型池中的色彩增强模型的数量相同；

根据所述预定数量的权重值，对所述每个色彩增强模型对所述未调色图像块的色彩调整结果进行加权融合处理，得到所述未调色图像块的色彩增强结果，并从所述图像数据对中获取与所述未调色图像块相对应的已调色图像块，作为所述色彩增强参考结果；基于所述未调色图像块的色彩增强结果和所述色彩增强参考结果，构建所述初始内容分析模型的损失函数；利用初始内容分析模型的损失函数调整所述内容分析模型的模型参数，以利用调整后的模型参数，得到更新的内容分析模型；将所述更新的内容分析模型作为新的初始内容分析模型，并使用所述新的初始内容分析模型对所述未调色图像块进行处理，直到所述初始内容分析模型的训练过程满足第二训练结束条件，得到所述训练好的内容分析模型；其中，所述第二训练结束条件包括如下条件项的至少一项：根据所述初始内容分析模型的损失函数计算的训练损失小于或者等于设定的第二损失阈值、所述初始内容分析模型的训练次数达到设定的第二次数阈值。

其中，所述初始内容分析模型的损失函数，是根据所述未调色图像块的色彩增强结果和所述色彩增强参考结果的最小化平方误差构建的损失函数。

第二方面，本公开实施例提供一种视频处理装置，包括：获取模块，用于获取待处理的视频帧；处理模块，用于利用色彩增强模型池中的至少一个色彩增强模型对所述视频帧进行色彩调整，得到色彩调整后的视频输出帧；其中，所述色彩增强模型池包含针对多种视频内容类型的不同风格需求的视频进行色彩调整的模型集合。

第三方面，本公开实施例提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现本公开实施例任意一种视频处理方法。

第四方面，本公开实施例提供一种计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现本公开实施例任意一种视频处理方法。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，而非限制本公开。根据下面参考附图对示例性实施例的详细说明，本公开的其它特征及方面将变得清楚。

附图说明

附图是用来提供对本公开的进一步理解，并且构成说明书的一部分，与下面的具体实施方式一起用于解释本公开，但并不构成对本公开的限制。在附图中：

图1为本公开的一些实施例中的视频处理方法的流程图；

图2为本公开一些实施例中的进行色彩调整处理的流程图；

图3为本公开一些实施例中的进行色彩调整处理的流程图；

图4a为本公开一些实施例的视频处理系统的结构示意图；

图4b为本公开一些实施例的视频处理系统的结构示意图；

图5为本公开实施例的色彩增强模型的具体架构示意图；

图6为本公开实施例中利用色彩增强模型对视频帧进行色彩调整的具体流程图；

图7为本公开实施例中进行图像重建和色彩调整的具体流程图；

图8为本公开实施例中密集残差连接网络模块的具体架构图；

图9为本公开实施例中内容分析模型的具体架构示意图；

图10为本公开实施例的视频处理装置的结构示意图；

图11为实现本公开实施例的视频处理方法的电子设备的框图。

具体实施方式

以下结合附图对本公开的具体实施方式进行详细说明。应当理解的是，此处所描述的具体实施方式仅用于说明和解释本公开，并不用于限制本公开。

在实际应用场景中，随着图像显示技术的发展，用户对收视体验提出了更高的要求，视频画质增强的显示应用例如超高清显示应用逐渐出现在生活场景中。目前，我国超高清显示的产业链也在不断完善中。为了获得更佳的视频画质，对视频图像质量和显示终端的硬件能力都提出了更高的要求，从采集端的超高清摄像机，显示端的超高清分辨率大屏幕，高动态范围(High Dynamic Range，HDR)电视，传输端新一代宽带移动通讯技术连接网络，超高清电视台等，都有大量的企事业单位在其中布局，推动超高清显示等画质增强显示技术的快速发展。

在本公开实施例中，显示端的分辨率可以包括标清(Standard Definition，SD)、高清(High Definition，HD)、全高清(Full High Definition， FHD)和超高清(Ultra High-Definition，Ultra HD)等多种显示格式。

示例性地，标清分辨率例如可以是480×320个像素或640×480个像素，高清分辨率例如可以是1024×720个像素，全高清分辨率例如可以是1920×1080个像素，而超高清分辨率例如可以是3840×2160个像素，即整个显示屏幕上水平方向可以显示3840个像素，垂直方向可以显示2160个像素，由于超高清分辨率可以达到全高清分辨率的四倍，因此也可以将超高清分辨率称为4k分辨率。

示例性地，8k分辨率例如可以是7680×4320个像素，即整个显示屏幕上水平方向可以显示7680个像素，垂直方向可以显示4320个像素。在本公开实施例中，可以将8k分辨率也命名为超高清分辨率。

示例性地，新一代宽带移动通讯技术连接网络例如可以是第五代移动通信技术(5th Generation Mobile Communication Technology，5G)或更高网络制式的通信网络。随着显示技术和移动通信技术的提升，借助新一代宽带移动通讯技术提供的具有高速率和低时延特性的通信网络，为超清视频普及提供了更好的支持。

示例性地，动态范围是指图像中所包含的从“最亮”至“最暗”的比值，也就是图像从“最亮”到“最暗”之间灰度划分的等级数，动态范围越大，所能表示的层次越丰富，所包含的色彩空间也越广；高动态范围是指从“最亮”到“最暗”可以达到非常高(超过预定阈值)的比值；通过灰度的量化，高动态范围图像(即HDR图像)可以提供更多的动态范围和图像细节。HDR电视是可以支持HDR技术的电池，HDR技术的使用可增加画面中细节的表现，提高画质，保持图像色彩的真实度。

在一些应用场景中，超高清设备平台的技术发展较快，而超高清视频内容的生产制作却较为落后。4K/8K的片源存量往往不能满足超高清播放需求，但标清、高清视频却有大量的库存无法在超高清显示平台上播放。因此，对标清、高清片源进行超高清重制是可以解决超高清片源不足最快速最直接的手段。

由于超高清视频采用新一代超高清视频制作与显示系统的电视显示标准中色彩空间的定义，例如4K/8K视频可以采用BT.2020色域，该色域规定了迄今为止使用三原色可以达到的最大色域，使得色彩创作有了更大的空间。但目前的视频色彩创作往往靠人工完成，低清片源的超高清重制往往依靠人工处理，无法自动化，导致片源生产周期长，人力成本高，处理效率低。

本公开实施例提供一种视频处理方法及装置、电子设备、计算机可读存储介质，该方法可以由终端设备或服务器等电子设备执行，终端设备可以包括但不限于：个人电脑、智能手机、平板电脑、个人数字助理(Personal Digital Assistant，PDA)、服务器等；该视频处理方法可以通过处理器调用存储器中存储的计算机可读程序指令的方式来实现；或者，可通过服务器执行该方法。

为了更好地理解本公开，下面将结合附图，详细描述根据本公开实施例的视频处理方法，应注意，这些实施例并不是用来限制本公开公开的范围。

图1为本公开的一些实施例中的视频处理方法的流程图。如图1所示，该视频处理方法包括如下步骤。

S110，获取待处理视频的视频帧。

在该步骤中，执行设备可以通过通信网络接收待处理视频，可以从执行设备的内部存储装置或外部存储装置中读取待处理视频，也可以通过执行设备上的搜索引擎从互联网上下载得到待处理视频，还可以通过执行设备上的拍摄装置，例如照相机、摄像头等拍摄得到待处理视频，更可以从视频处理指令中获取该指令携带的待处理视频的视频帧。应理解，本公开实施例中的待处理视频的获取方式还可以是其它获取方式，具体内容在此处不作限定。

S120，利用色彩增强模型池中的至少一个色彩增强模型对视频帧进行色彩调整，得到色彩调整后的视频输出帧。

其中，色彩增强模型池包含针对多种视频内容类型的不同风格需求的视频进行色彩调整的模型集合。

在一些实施例中，色彩增强模型池可以包括至少一个色彩增强模型，色彩增强模型池中的每个色彩增强模型可用于对一种视频内容类型的一种风格需求的视频帧进行色彩调整。

作为示例，视频内容类型可以包括如下类型中的至少一种：电视剧类、记录片类、电影类、动漫类、体育类、新闻类、戏剧类、娱乐类和教育类；在实际应用场景中，视频内容类型还可以是其它类型，在此不做具体限定。

作为示例，风格需求是指对待处理视频的风格特征的需求；对于某一种视频内容类型的视频而言，其所包括的视频内容一般具有较为统一的风格特征，风格特征可以包括如下特征项中的至少一种：画风、画质、色调、亮度。

其中，画风是指观看视频给观看者形成的一种整体视听感受和视觉风格；画质即画面质量，包括清晰度、锐度、镜头畸变、色散度、分辨率、色域范围、色彩纯度(或色彩艳度)、色彩平衡等指标；色调是指图像的相对明暗颜色；亮度是指图像画面的明亮程度。在实际应用场景中，视频内容的风格特征还可以包括其它特征项，在此不做具体限定。

根据本公开实施例的视频处理方法，色彩增强模型池包含针对多种视频种类的风格需求的视频进行调整的模型集合，根据该模型池中的至少一个色彩增强模型对获取到的待处理视频的视频帧进行色彩调整，可以自动生成与该视频帧的视频内容类型和风格需求对应的调色效果，视频处理过程可以由执行设备调用模型进行自动化实现，从而可以自动化进行视频色彩创作，自动化完成低清片源的超高清重制，缩短片源生产周期，节约人力成本，提高视频处理效率。

图2示出本公开一些实施例中的进行色彩调整处理的流程图。如图2所示，在一些实施例中，步骤S120具体可以包括如下步骤。

S21，接收包含视频帧的视频内容类型和风格需求的信息。

在一些实施例中，在接收到待处理视频的视频帧的情况下，还可以接收包含视频帧的视频内容类型和风格需求的信息，以用于根据该视频内容类型和风格需求从色彩增强模型池中进行相应模型的选择。示例性地，步骤S21执行顺序可以是在执行步骤S110之前或之后，步骤S21也可以与步骤S110同步执行，即执行设备可以在接收待处理视频的视频帧时，同步接收包含该视频帧的视频内容类型和风格需求的信息；在实际应用场景中，只要在选择色彩增强模型之前，获取到待处理视频的视频帧和视频内容类型和风格需求即可，步骤S110和步骤S21的执行先后顺序可以根据实际需要进行灵活设置。

S22，从色彩增强模型池中选择与视频内容类型和风格需求对应的色彩增强模型。

在一些实施例中，不同视频内容类型可以具有不同风格需求，同一视频内容类型的风格需求也可以有所不同；因此，根据接收到的包含视频帧的视频内容类型和风格需求的信息，可以从色彩增强模型池中选择一个与该视频内容类型和风格需求相匹配的色彩增强模型。

S23，利用选择的色彩增强模型对视频帧进行处理，得到色彩调整后的视频输出帧。

在一些实施例中，根据接收到的包含视频帧的视频内容类型和风格需求的信息，可以从色彩增强模型池中选择出一个与该视频内容类型和风格需求相匹配的色彩增强模型，则可以根据该相匹配的色彩增强模型对视频帧进行处理，得到色彩调整后的视频输出帧。

在另一些实施例中，若从色彩增强模型池中选择至少两个色彩增强模型，该至少两个色彩增强模型的其中一个模型是与该视频内容类型和风格需求相匹配的模型，则可以分别使用该至少两个色彩增强模型中的每个模型对视频帧进行处理，得到选择的每个色彩增强模型的输入结果，并根据预设的每个色彩增强模型与视频帧对应的权重值，对选择的每个色彩增强模型的输入结果进行加权融合处理，生成视频输出帧。

在本公开实施例中，在利用色彩增强模型池中的至少一个色彩增强模型对视频帧进行色彩调整时，对于获取到的待处理视频的视频帧，可以先根据接收到的包含视频帧的视频内容类型和风格需求的信息，从色彩增强模型池中选择相匹配的色彩增强模型，再利用该选择的色彩增强模型对待处理视频的视频帧进行处理，生成与接收的视频内容类型和风格需求对应的调色效果，实现对待处理视频的自动化调整，满足相应视频内容类型的色彩风格需求，提高视频色彩调整的数据处理效率。

图3示出本公开一些实施例中的进行色彩调整处理的流程图。如图3所示，在一些实施例中，步骤S120具体可以包括如下步骤。

S31，利用色彩增强模型池中的每个色彩增强模型处理视频帧，得到每个色彩增强模型输出的色彩调整后的视频帧。

在该步骤中，色彩增强模型池中的每个色彩增强模型均对待处理视频的视频帧进行处理，得到每个色彩增强模型根据自个对应的视频内容类型的风格需求对视频帧的色彩调整结果。

S32，基于内容分析模型处理视频帧，生成每个色彩增强模型与视频帧对应的权重值；其中，内容分析模型配置为根据视频帧确定色彩增强模型池中的每个色彩增强模型的权重值。

在该步骤中，内容分析模型可以通过分析视频帧的视频内容类型，为色彩增强模型池中的每个色彩增强模型分配权重值(也可以称为是权重系数)，从而通过内容分析模型输出的每个色彩增强模型与视频帧对应的权重值对模型池中每个模型的输出结果进行权重分配。

S33，使用每个色彩增强模型与视频帧对应的权重值，对每个色彩增强模型输出的色彩调整后的视频帧进行加权融合处理，生成视频输出帧。

在该步骤中，加权融合处理包括：将每个色彩增强模型与视频帧对应的权重值，与相应色彩增强模型输出的色彩调整后的视频帧进行矩阵相乘运算；再将每个矩阵相乘运算结果进行矩阵相加，得到矩阵形式的视频输出帧。

在本公开实施例的视频处理方法中，可以通过内容分析模型输出的每个色彩增强模型与视频帧对应的权重值，对色彩增强模型池中的每个色彩增强模型进行权重分配，最后输出该模型池中每个色彩增强模型的处理结果的融合后的色彩调整结果，该色彩调整结果基于待处理视频的视频内容类型分析，得到更加符合视频内容类型的视频色彩调整结果。

下面结合图4a和图4b，描述本公开示例性实施例的视频处理系统和相应的视频处理方法。图4a示出本公开一些实施例的视频处理系统的结构示意图；图4b示出本公开一些实施例的视频处理系统的结构示意图；图4a和图4b中相同的标号可以表示相同的结构。

如图4a所示，在一些实施例中，视频处理系统包括：视频帧输入模块41、色彩增强模型池处理模块42、内容分析模型处理模块43、权重值输出模块44、融合处理模块45和视频帧输出模块46。

在一些实施例中，视频帧输入模块41可以用于获取输入的视频帧。

在一些实施例中，执行设备可以从接收到的视频处理指令中，获取该指令中携带的视频帧。

色彩增强模型池处理模块42，用于利用色彩增强模型池中的至少一个色彩增强模型对视频帧进行色彩调整，得到色彩调整后的视频输出帧。

在一些实施例中，色彩增强模型池处理模块可以简称为色彩增强模型池。

在一些实施例中，在获取输入的视频帧的情况下，若还接收包含该视频帧的视频内容类型和风格需求的信息，则可以从色彩增强模型池中选择与视频内容类型和风格需求对应的色彩增强模型，利用选择的色彩增强模型对视频帧进行处理，得到色彩调整后的视频输出帧。

在一些实施例中，无论是否接收到包含该视频帧的视频内容类型和风格需求的信息，均可以利用色彩增强模型池中的每个色彩增强模型处理视频帧，得到每个色彩增强模型输出的色彩调整后的视频帧。

内容分析模型处理模块43，用于基于内容分析模型处理视频帧，生成每个色彩增强模型与视频帧对应的权重值。

在一些实施例中，可以预先设置色彩增强模型池中每个色彩增强模型与视频帧对应的权重值；例如，在大批量的处理同一视频内容类型的相同风格需求的待处理视频时，可以预先根据多次测试结果或实际经验为色彩增强模型池中每个色彩增强模型分配的权重值。

在另一些实施例中，基于内容分析模型处理视频帧，可自动生成每个色彩增强模型与视频帧对应的权重值，减少人工处理的参与，有利于实现对视频进行色彩创作自动化，大幅降低视频重制成本，提高视频处理效率。

权重值输出模块44，用于输出每个色彩增强模型与视频帧对应的权重值。

融合处理模块45，用于使用每个色彩增强模型与视频帧对应的权重值，对每个色彩增强模型输出的色彩调整后的视频帧进行加权融合处理，得到融合结果。

视频帧输出模块46，用于根据融合结果生成色彩调整后的视频输出帧。

在本公开实施例中，可以根据色彩增强模型池中的至少一个色彩增强模型对获取的视频帧进行色彩调整，自动生成与该视频帧的视频内容类型和风格需求对应的调色效果；并可以通过内容分析模型输出的每个色彩增强模型与视频帧对应的权重值，对色彩增强模型池中的每个色彩增强模型进行权重分配，输出每个色彩增强模型的处理结果的融合后的色彩调整结果，得到更加符合视频内容类型的风格需求的视频色彩调整结果，实现对视频色彩的自动化调整，从而可以降低视频重制成本，提高视频处理效率。

如图4b所示，该视频处理系统与图4a的视频处理系统基本相同，不同之处在于，图4b中示出了色彩增强模型池中的多个色彩增模型。

在图4中，色彩增强模型池中包括至少一组色彩增强模型，每组色彩增强模型对应于一个视频内容类型；每组色彩增强模型中包括至少一个色彩增强模型，每个色彩增强模型对应于一个风格需求。

示例性地，第一组色彩增强模型是与电视剧类视频对应的一组模型，该组模型中包括N1个模型，例如电视剧风格模型1，电视剧风格模型2，……，电视剧风格模型N1；该组模型中的每个模型可以对应于电视剧类视频的不同风格需求；第二组色彩增强模型是与纪录片类视频对应的一组模型，该组模型中包括N2个模型，例如纪录片风格模型1，纪录片风格模型2，……，纪录片风格模型N2，该组模型中的每个模型可以对应于纪录片类视频的不同风格需求；……；第三组色彩增强模型是与电影类视频对应的一组模型，该组模型中包括N3个模型，例如电影风格模型1，电影风格模型2，……，电影风格模型N3；该组模型中的每个模型可以对应于电影类视频的不同风格需求。N1、N2和N3均为大于或等于1的整数。

应理解，色彩增强模型池中还可以包括其它对应于其它视频内容类型的至少一种风格需求的模型组；具体可以根据实际情况进行设置，本公开实施例不做具体限定。

继续参考图4b，图4b中示出了融合模块中的具体处理单元，其中，符号

表示矩阵乘法运算，符号∑表示矩阵加法运算。在一些实施例中，上述融合模块具体可以用于：将内容分析模型输出的每个色彩增强模型与视频帧对应的权重值，与相应色彩增强模型输出的色彩调整后的视频帧进行矩阵相乘运算；以及，将每个矩阵相乘运算结果进行矩阵相加，得到矩阵相加结果，以用于根据该矩阵相加结果生成视频输出帧。

在本公开实施例中，视频处理方法可以由执行设备使用人工智能(Artificial Intelligence，AI)模型进行自动化实现。AI模型可以是基于卷积神经网络实现的模型，并可以用于图像检测、图像分类、图像内容分析等图像处理领域。本公开实施例中的色彩增强模型和内容分析模型均为AI模型。

在一些实施例中，色彩增强模型池中的模型具有相同的模型结构。下面通过图5-图8，详细描述色彩增强模型的具体结构和工作原理。

图5示出本公开实施例的色彩增强模型的具体架构示意图。

在图5中，色彩增强模型包括2N个密集残差连接网络模块(Residual Dense Block，RDB)51和N个全连接(Fully Connected)层52，N为大于或等于1的整数。示例性地，色彩增强模型包括：至少两个密集残差连接网络模块(Residual Dense Block，RDB)51和至少一个全连接层52。

在图5示出的色彩增强模型的网络结构中，上述2N个RDB可以被设置为两个任务分支模型：图像重建(Image Reconstruction，IR)分支模型和色彩增强(Color Enhancement)分支模型，每个任务分支模型中均包括N个RDB51。

继续参考图5，色彩增强模型中还可以包括：第一卷积层53、滤波单元54、第二卷积层55、第三卷积层56、第四卷积层57。

下面通过图6和图7，介绍如何通过图5中的色彩增强模型进行视频帧的色彩调整。图6示出本公开实施例中利用色彩增强模型对视频帧进行色彩调整的具体流程图；图7示出本公开实施例中进行图像重建和色彩调整的具体流程图。

如图6所示，上述步骤S23中利用选择的色彩增强模型对视频帧进行处理，得到色彩调整后的视频输出帧的步骤，具体可以包括如下步骤。

S601，对视频帧进行特征提取，得到第一图像特征。

在该步骤中，可以通过色彩增强模型中的第一卷积层53对输入色彩增强模型视频帧进行特征提取，得到第一图像特征。

S602，对视频帧进行滤波处理，并对滤波处理后的视频帧进行特征提取，得到第二图像特征。

在该步骤中，可以通过滤波单元54对输入色彩增强模型的视频帧进行滤波处理，并通过第二卷积层55对滤波处理后的视频帧进行特征提取，得到第二图像特征。

在一些实施例中，滤波单元54可以是高斯滤波单元、均值滤波单元和中值滤波单元中的一种。其中，高斯滤波单元用于对视频帧进行高斯滤波；均值滤波单元用于对视频帧进行均值滤波；中值滤波单元用于对视频帧进行中值滤波。

具体地，高斯滤波是一种线性平滑滤波，适用于消除高斯噪声，在一些场景中，高斯平滑滤波器对于抑制服从正态分布的噪声非常有效；均值滤波可以将视频帧中的图像像素点的局部图像信息的像素均值，作为该图像像素点处理后的像素值，滤波算法简单，计算速度快；中值滤波可以将视频帧中的像素点的视频帧中的图像像素点的灰度从大到小顺序排列，将灰度中间值作为该图像像素点的灰度值；在一些场景中，中值滤波在对图像降噪时，有利于更好地保留图像的边界。

本公开实施例中，通过滤波单元对视频帧进行滤波处理，不仅有利于去除视频帧的噪声，实现视频帧中图像的平滑过渡，同时也有利于对视频帧中的图像进行低频特征增强，得到视频帧中的图像的低频信息。

在一些实施例中，若图像中的一个区域内相邻像素的像素值相差较小(小于或等于像素值阈值)，则该区域的信息为低频信息；若图像中的一个区域内相邻像素的像素值相差较大(超过像素值阈值)，则该区域的信息为高频信息。

在一些实施例中，低频信息可以是图像的颜色信息、灰度信息等，高频信息可以是指图像的纹理信息、边缘信息等；经滤波单元的滤波处理后，有利于后续提取的图像特征，较少的受到图像噪声和图像纹理等高频信息的影响，从而保留较多的低频颜色特征(也可以称为是低频色彩特征)。

应理解，滤波单元还可以是其它类型滤波单元，以用于对视频帧进行其它类型的滤波处理；具体可以根据实际需要进行滤波单元类型的选择，本公开实施例不做具体限定。

S603，将第一图像特征输入图像重建分支模型，第二图像特征输入色彩增强分支模型，以根据第一图像特征和第二图像特征进行图像重建和色彩调整。

图像重建(Image Reconstruction，IR)是将已有的低分辨率(Low-resolution，LR)图像进行处理，转化成高分辨率(High-resolution，HR)图像的技术。

在该步骤中，图像重建分支模型通过RDB对视频帧的第一图像特征进行特征提取，并对输出图像进行粗精度重建；粗精度重建是将待处理视频的视频帧作为初始图像，初始图像经过卷积层的特征提取后得到初始图像的特征信息，利用RDB提取初始图像的特征信息，根据该初始图像的特征信息进行重建得到的图像可以称为是粗精度重建的图像。

在该步骤中，对滤波单元的滤波处理后得到的第二图像特征(即低频色彩特征)进行分析提取，以用于后续根据分析提取的特征进行色彩调整。

S604，对图像重建分支模型的输出结果和色彩增强分支模型的输出结果进行特征融合处理，得到融合结果。

在该步骤中，对图像重建分支模型的输出结果和色彩增强分支模型的输出结果进行对应特征通道相乘，再将特征通道相乘运算结果进行特征通道相加，得到融合结果。

S605，根据融合结果，生成色彩调整后的视频输出帧。

在该步骤中，根据融合结果得到输入视频帧的全局的色彩调整输出结果。

示例性地，使用第三卷积层56对图像重建分支模型的输出结果进行特征提取，以及使用第四卷积层57对图像重新分支模型进行特征提取；并将第三卷积层56的特征提取结果和第四卷积层57的特征提取结果进行对应特征通道相乘，以及进行两个任务分支模型的特征融合，得到该色彩增强模型的色彩调整输出结果。

在本公开实施例中，在使用色彩增强模型对视频帧进行处理时，可以通过图像重建分支模型和色彩增强分支模型对输入的视频帧进行图像重建和色彩调整，并对图像重建分支模型的输出结果和色彩增强分支模型的输出结果进行特征融合处理，得到该色彩增强模型的色彩调整输出结果。

在图5中，每个RDB51中卷积核的尺寸(即，宽度和高度)相同，例如RDB51中卷积核的尺寸为3×3，输出特征通道数为64，滤波单元54中滤波核的尺寸为21×21，第一卷积层53的尺寸和第二卷积层55的尺寸相同，例如二者的尺寸均为3×64，第三卷积层56的尺寸和第四卷积层57的尺寸相同，例如二者的尺寸均为64×3。

需要说明的是，本公开实施例中用于提取特征的卷积核的数量和尺寸、每个RDB51中的卷积核的数量和尺寸，以及滤波单元54中滤波核的数量和尺寸均可以根据需要进行设置，本公开实施例不做具体限定。

在一些实施例中，对于图5示出的色彩增强模型中的两个任务分支模型：图像重建分支模型和色彩增强分支模型，每个分支模型中均可以包括N个密集残差连接网络模块RDB；色彩增强模型中还包括N个全连接层；其中，N为大于或等于1的整数；下面通过具体实施例描述基于该两个任务分支模型的模型架构所进行的图像重建和色彩调整处理过程。

如图7所示，上述步骤S603中，将第一图像特征输入图像重建分支模型，第二图像特征输入色彩增强分支模型，以根据第一图像特征和第二图像特征进行图像重建和色彩调整的步骤，具体可以包括如下步骤。

S701，获取图像重建分支模型中的首个RDB和色彩增强分支模型中的首个RDB，作为第一分支模型当前RDB和第二分支模型当前RDB。

S702，通过第一分支模型当前RDB处理第一图像特征，通过第二分支模型当前RDB处理第二图像特征，得到第一分支模型当前RDB输出的特征图和第二分支模型当前RDB输出的低频色彩特征。

S703，对于第二分支模型当前RDB输出的低频色彩特征，经一个全连接层处理后得到特征向量，将特征向量与第一分支模型当前RDB输出的特征图对应相乘，得到经局部色彩特征调整的特征图。

在该步骤中，可以通过图像重建分支模型中的当前RDB(例如卷积核为3×3，输出特征通道64)进行图像特征提取；通过色彩增强分支模型中的当前RDB(例如卷积核为3×3，输出特征通道64)对图像的低频色彩特征进行分析提取，并将提取的低频色彩特征的各层特征通过全连接层转换成宽度为1的特征向量(例如尺寸为1×64的特征向量)，经该全连接层输出的特征向量中各元素分别与图像重建分支模型中当前RDB输出的特征图进行对应特征通道的相乘，可实现局部色彩特征的精细化调整。

S704，将经局部色彩特征调整的特征图作为新的第一图像特征，将第二分支模型当前RDB输出的低频色彩特征作为新的第二图像特征。

S705，获取图像重建分支模型中的下一个RDB和色彩增强分支模型中的下一个RDB，作为新的第一分支模型当前RDB和新的第二分支模型当前RDB，直到获取次数等于N，将新得到的经局部色彩特征调整的特征图作为图像重建分支模型的输出结果，并将新得到的低频色彩特征作为色彩增强分支模型的输出结果。

通过上述步骤S701-S705，得到色彩增强分支模型中最后一个RDB提取的低频色彩特征，将该低频色彩特征通过最后一个全连接层转换成宽度为1的特征向量，再将该最后一个全连接层输出的特征向量中各元素分别与图像重建分支模型中最后一个RDB输出的特征图进行对应特征通道的相乘，得到色彩增强模型中图像重建分支模型的输出结果；将色彩增强分支模型中最后一个RDB提取的低频色彩特征作为色彩增强模型中色彩增强分支模型的输出结果；基于图像重建分支模型的输出结果和色彩增强分支模型的输入结果进行特征融合处理，得到色彩增强模型的色彩调整输出结果，从而实现全局的色彩风格增强。

图8示出本公开实施例中密集残差连接网络模块的具体架构图。如图8所示，在一些实施例中，每个RDB中包括密集连接网络层(Dense Net)511和局部特征融合层512。

在该实施例中，局部特征融合层512用于：利用局部残差学习将RDB的输入特征与密集连接网络层511的输出特征进行特征融合处理，得到RDB的输出特征。

在一些实施例中，密集连接网络层511包括：M个密集连接模块5111，M为大于或等于1的整数；其中，首个密集连接模块5111的输入为RDB的输入特征；第i个密集连接模块5111的输入特征为：RDB的输入特征和位于第i个密集连接模块5111之前的每个密集连接模块5111的输出特征，i为大于1且小于或等于M的整数。

在图8中，示出在M＝3的情况下，密集连接网络层511中包含的3 个密集连接模块5111。在实际应用场景中，密集连接模块5111的数量可以根据实际需要进行设置。

继续参考图8，局部特征融合层512的输入包括：RDB的输入特征(例如可以记为F _d-1)和每个密集连接模块5111的输出特征(例如可以记为F _d,1、F _d,C等)；局部特征融合层512中可以包括一个合并(Concat)层和一个尺寸为1×1的卷积层；其中，合并层采用连结的方式对输入该合并层的特征融合，1×1的卷积层用于自适应融合一系列不同层次的特征，生成局部特征融合的输出特征(例如可以记为F _d,LF)；将局部特征融合的输出特征与该RDB的输入特征进行对应通道的特征相加，生成全局特征融合结果(例如可以记为F _d)，将该全局特征融合结果作为该RDB的输出特征。

在本公开实施例中，RDB是一种将残差网络和密集连接网络相结合的网络结构，在密集连接、特征融合和残差学习的共同作用下，通过保留低层级信息实现信息共享，通过特征融合自适应的获取不同卷积层获取的信息，在图像处理方向上有较好的性能体现。具体地，RDB的中间层可以使用密集连接模块5121的密集连接模式，最后一层的连接模块5122通过残差跳接的方式输出该RDB的处理结果。

在该实施例中，RDB中每个密集连接模块都可以向后面的密集连接模块传递需保存的特征信息，该网络结构可以充分保证特征信息在每一层之间的传递和流通，在实现特征复用的同时减少了参数量，并且在网络参数量较大的情况下，也可以保证更优的处理速度。

在一些实施例中，色彩增强模型池中的每个色彩增强模型具有相同的模型结构；色彩增强模型池中的色彩增强模型，是预先针对不同视频内容类型的色彩风格采用不同的色彩增强数据对，对初始色彩增强模型进行训练得到的训练好的色彩增强模型；色彩增强数据对包括：从未调色图像和第一已调色图像中的相同图像位置选取的具有相同图像尺寸的未调色图像块和已调色图像块，第一已调色图像是预先获取的基于图像色彩风格特征对未调色图像进行调色后的图像。

在该实施例中，初始色彩增强模型与色彩增强模型池中的每个色彩增强模型具有相同的模型结构；初始色彩增强模型的模型参数的初始值，可以是该模型的参数随机值，也可以是该模型的参数经验值；第一已调色图像可以是预先获取的经调色师进行色彩调整的图像；色彩增强网络模型的训练数据包括：从未调色图像和第一已调色图像中的相同图像位置选取的具有相同图像尺寸的图像块。示例性地，可以在每个色彩增强模型的训练过程中随机抽取图像中某一位置的尺寸为256×256图像块输入网络进行训练。

应理解，训练过程中所需图像块的尺寸可以根据实际需要进行选择，本公开实施例不做具体限定。

在一些实施例中，对初始色彩增强模型即色彩增强模型进行的训练可以包括：使用初始色彩增强模型处理从未调色图像中选取的未调色图像块，得到未调色图像块的色彩调整结果，并从色彩增强数据对中，获取与未调色图像块相对应的已调色图像块，作为色彩调整参考结果；基于色彩调整结果和色彩调整参考结果，构建初始色彩增强模型的损失函数；利用初始色彩增强模型的损失函数调整初始色彩增强模型的模型参数，得到更新的色彩增强模型；将更新的色彩增强模型作为新的初始色彩增强模型，并使用新的初始色彩增强模型处理从未调色图像中选取的未调色图像块，直到初始色彩增强模型的训练过程满足第一训练结束条件，得到训练好的色彩增强模型。

其中，第一训练结束条件包括如下条件项的至少一项：根据初始色彩增强模型的损失函数计算的训练损失小于或者等于设定的第一损失阈值、对初始色彩增强模型的训练次数达到设定的第一次数阈值。

在本公开实施例中，损失函数可以用于估计每次模型训练的结果与训练目标之间的差距；对于初始色彩增强模型，每次模型训练的结果是初始色彩增强模型输出的未调色图像块的色彩调整结果，训练目标是相应的色彩调整参考结果；第一损失阈值和第一次数阈值可以根据实际训练要求进行自定义设置。

在一些实施例中，色彩增强模型的训练过程中，基于色彩调整结果和色彩调整参考结果，构建初始色彩增强模型的损失函数的步骤，具体可以包括：计算色彩调整结果和色彩调整参考结果之间的最小化平方误差，得到最小化平方误差损失；计算色彩调整结果的高斯滤波输出结果和色彩调整参考结果的高斯滤波输出结果，得到色彩损失；对最小化平方误差损失和色彩损失进行加权求和，生成初始色彩增强模型的损失函数。

示例性地，初始色彩增强模型的损失函数可以表示为下面的表达式(1)：

彩调整结果，I _gt1为色彩调整参考结果，Gauss()为计算高斯滤波输出结果的函数，该滤波核的尺寸即被训练的色彩增强模型中的滤波单元的滤波核尺寸，

为色彩调整结果与色彩调整参考结果的差值的L2范数，即初始色彩增强模型的每次模型训练的图像特征的L2损失，

为初始色彩增强模型的每次模型训练的色彩调整结果的高斯滤波输出结果和色彩调整参考结果的高斯滤波输出结果的差值的L2范式，即每次模型训练的色彩损失；a为该L2损失的权值，b为该色彩损失的权值；a和b可以根据实际训练需要或经验值进行预先设置。

在一些实施例中，该模型的训练过程中，可以采用网络优化器例如Adam优化器，保证每次模型训练的输出结果(色彩调整结果)更接近于模型训练的目标(色彩调整参考结果)。

在本公开实施例中，针对不同视频内容类型的风格需求可以采用不同的色彩增强数据对，对色彩增强模型进行训练，得到针对根据不同视频内容类型的不同风格需求对视频帧进行色彩调整，从而生成不同调色效果的模型集合，得到色彩增强模型池，以用于根据色彩增强模型池对待处理视频的视频帧进行自动化的色彩调整，提高色彩调整效率。

图9示出本公开实施例中内容分析模型的具体架构示意图。如图9所示，在一些实施例中，内容分析模型包括：依次连接的K个层叠卷积结构91的卷积网和两个全连接层。

其中，前K-1个层叠卷积结构91中的每个层叠卷积结构91中均包括一个卷积层911、一个激活层(The Rectified Linear Unit，ReLU)912和一个池化层(Max Pooling)913，第K层叠卷积结构92中包括一个卷积层911和一个激活层912；两个全连接层为全连接层93和全连接层94。

在本公开实施例中，激活层912可以用于将相应卷积层输出结果做非线性映射，用于加快模型的收敛速度；池化层913可以用于进行图像下采样(Under Sampling)，通过下采样可以降低图像特征维度，提高精度和避免过拟合。

在图9中，作为示例，输入图像的尺寸是256×256×3(长度、宽度和高度)，内容分析模型汇中每个层叠卷积结构91中，卷积层的尺寸可以是3×3；以K＝5为例，对于依次连接的5个层叠卷积结构91，第1个层叠卷积结构91中可以将输入图像的尺寸缩放到128×128×32，第2个层叠卷积结构91中可以将输入图像的尺寸缩放到64×64×64，第3个层叠卷积结构91中可以将输入图像的尺寸缩放到32×32×128，第4个层叠卷积结构91中可以将输入图像的尺寸缩放到16×16×256，第5个层叠卷积结构91中可以将输入图像的尺寸缩放到8×8×512。

继续参考图9，全连接层93将最后一个层叠卷积结构91的输出结果转换为指定维度的一维向量(例如1×1024)，全连接层94用于将该一维向量转化为维度为L的一维向量，L为色彩增强模型池中的模型总数量。

在一些实施例中，图9中的色彩增强模型池与上述实施例中结合图4a和图4b描述的色彩增强模型池具有相同的模型结构。

在本公开实施例中，内容分析模型中的层叠卷积网络结构可以通过层叠卷积层的方式分析和提取图像特征，通过卷积层进行特征提取，最后的卷积层输出通过两个全连接层转换为L个权重值，L为大于或等于1的整数，每个权重值与相应的色彩增强模型的输出结果相乘，再将每个相乘运算结果进行相应特征通道的特征相加求和，生成最终的色彩增强结果，从而通过对视频帧内容的分析，将不同权重分配给不同的色彩增强模型，以达到根据内容进行色彩自适应调整的目的。

在一些实施例中，内容分析模型，是基于预先训练好的色彩增强模型池中的每个色彩增强模型，采用不同风格的图像数据对，对初始内容分析模型进行训练得到的训练好的内容分析模型；其中，图像数据对包括：从未调色图像和第二已调色图像中的相同图像位置选取的具有相同图像尺寸的未调色图像块和已调色图像块，第二已调色图像是预先获取的基于不同视频内容类型对未调色图像进行调色后的图像。

在该实施例中，初始内容分析模型的模型结构与内容分析模型的模型结构相同；初始内容分析模型的模型参数的初始值，可以是该模型的参数随机值，也可以是该模型的参数经验值；第二已调色图像可以是预先获取的经调色师进行色彩调整的图像；第二已调色图像与上述实施例中的第一已调色图像不同。

其中，内容分析模型的训练数据包括：从未调色图像和第二已调色图像中的相同图像位置选取的具有相同图像尺寸的图像块。示例性地，可以在每个色彩增强模型的训练过程中随机抽取图像中某一位置的尺寸为256×256图像块输入网络进行训练，随机抽取的方式可以保证模型不会出现对某种风格过拟合的情况。

在一些实施例中，对初始内容分析模型进行的训练包括：利用预先训练好的色彩增强模型池中的每个色彩增强模型，处理从未调色图像中选取的未调色图像块，得到每个色彩增强模型对未调色图像块的色彩调整结果；使用初始内容分析模型对未调色图像块进行处理，得到预定数量的权重值，预定数量与色彩增强模型池中的色彩增强模型的数量相同；根据预定数量的权重值，对每个色彩增强模型对未调色图像块的色彩调整结果进行加权融合处理，得到未调色图像块的色彩增强结果，并从图像数据对中获取与未调色图像块相对应的已调色图像块，作为色彩增强参考结果；基于未调色图像块的色彩增强结果和色彩增强参考结果，构建初始内容分析模型的损失函数；利用初始内容分析模型的损失函数调整初始内容分析模型的模型参数，得到更新的内容分析模型；将更新的内容分析模型作为新的初始内容分析模型，并使用新的初始内容分析模型对未调色图像块进行处理，直到初始内容分析模型的训练过程满足第二训练结束条件，得到训练好的内容分析模型。

其中，第二训练结束条件包括如下条件项的至少一项：根据初始内容分析模型的损失函数计算的训练损失小于或者等于设定的第二损失阈值、初始内容分析模型的训练次数达到设定的第二次数阈值。

在该实施例中，对于初始内容分析模型，每次模型训练的结果是内容分析模型输出的未调色图像块的色彩增强结果，训练目标是相应的色彩增强参考结果；并根据初始内容分析模型的每次模型训练的结果和训练目标构建初始内容分析模型的损失函数；应理解，第二损失阈值和第二次数阈值可以根据实际训练要求进行自定义设置。

在一些实施例中，内容分析模型的训练过程中，初始内容分析模型的损失函数，是根据未调色图像块的色彩增强结果和色彩增强参考结果的最小化平方误差构建的损失函数。

示例性地，初始内容分析模型的损失函数可以表示为下面的表达式(2)：

色彩增强结果，I _gt1为色彩增强参考结果，

为色彩增强结果与色彩增强参考结果的差值的L2范数，即初始内容分析模型的每次模型训练的图像特征的L2损失。

在一些实施例中，该模型的训练过程中，也可以采用网络优化器例如Adam优化器，保证每次模型训练的输出结果(色彩增强结果)更接近于模型训练的目标(色彩增强参考结果)。

在本公开色彩增强模型和内容分析模型的训练过程中，可以设置模型训练的学习率(Learning Rate)；学习率决定了损失函数能否收敛到局部最小值以及何时收敛到最小值；作为示例，对于色彩增强模型的训练过程和内容分析模型的训练过程，学习率可以相同例如均为1e-4；在另一些示例中，该两个模型的模型训练过程中的学习率也可以不同，学习率的具体取值可以根据实际情况进行设置。

在本公开实施例中，针对不同视频内容类型的风格需求可以采用不同的色彩增强数据对，对初始内容分析模型进行训练，训练后的内容分析模型可以输出色彩增强模型池中每个色彩增强模型与视频帧对应的权重值，将色彩增强模型池中每个色彩增强模型与视频帧对应的权重值与相应色彩增强模型的输出结果，通过加权融合处理，实现对视频帧进行自适应色彩风格增强处理，提升视频色彩增强效率。

可以理解，本公开提及的上述各个方法实施例，在不违背原理逻辑的情况下，均可以彼此相互结合形成结合后的实施例，限于篇幅，本公开不再赘述。本领域技术人员可以理解，在具体实施方式的上述方法中，各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。

此外，本公开还提供了视频处理装置、电子设备、计算机可读存储介质，上述均可用来实现本公开提供的任一种视频处理方法，相应技术方案和描述和参见方法部分的相应记载，不再赘述。

本公开实施例提供一种视频处理装置，其是实现本公开上述实施例提供的视频处理方法的相应装置，该装置可采用软件和/或硬件的方式实现，并一般可集成于电子设备中。

图10为本公开实施例的视频处理装置的结构示意图。

参照图10，本公开实施例提供的一种视频处理装置1000包括如下模块。

获取模块1010，用于获取待处理的视频帧。

处理模块1020，用于利用色彩增强模型池中的至少一个色彩增强模型对视频帧进行色彩调整，得到色彩调整后的视频输出帧。

根据本公开实施例的视频处理装置，根据该模型池中的至少一个色彩增强模型对获取到的待处理视频的视频帧进行色彩调整，可以自动生成与该视频帧的视频内容类型和风格需求对应的调色效果，视频处理过程可以由执行设备调用模型进行自动化实现，从而可以自动化进行视频色彩创作，节约人力成本，提高视频处理效率。

在一些实施例中，处理模块1020具体可以包括：接收单元，用于接收包含视频帧的视频内容类型和风格需求的信息；选择单元，用于从色彩增强模型池中选择与视频内容类型和风格需求对应的色彩增强模型；模型处理单元，用于利用选择的色彩增强模型对视频帧进行处理，得到色彩调整后的视频输出帧。

在一些实施例中，处理模块1020具体可以包括：色彩调整单元，用于利用色彩增强模型池中的每个色彩增强模型处理视频帧，得到每个色彩增强模型输出的色彩调整后的视频帧；内容分析单元，用于基于内容分析模型处理视频帧，生成每个色彩增强模型与视频帧对应的权重值；其中，内容分析模型配置为根据视频帧确定色彩增强模型池中的每个色彩增强模型的权重值；融合处理单元，用于使用每个色彩增强模型与视频帧对应的权重值，对每个色彩增强模型输出的色彩调整后的视频帧进行加权融合处理，生成视频输出帧。

在一些实施例中，色彩增强模型中包括：图像重建分支模型和色彩增强分支模型；模型处理单元具体可以包括：提取子单元，用于对视频帧进行特征提取，得到第一图像特征；滤波子单元，用于对视频帧进行滤波处理，并对滤波处理后的视频帧进行特征提取，得到第二图像特征；分支模型处理子单元，用于将第一图像特征输入图像重建分支模型，第二图像特征输入色彩增强分支模型，以根据第一图像特征和第二图像特征进行图像重建和色彩调整；结果融合子单元，用于对图像重建分支模型的输出结果和色彩增强分支模型的输出结果进行特征融合处理，得到融合结果；结果生成子单元，用于根据融合结果，生成色彩调整后的视频输出帧。

在一些实施例中，图像重建分支模型和色彩增强分支模型中均包括：N个密集残差连接网络模块RDB；色彩增强模型中还包括N个全连接层；其中，N为大于或等于1的整数；分支模型处理子单元具体用于：获取图像重建分支模型中的首个RDB和色彩增强分支模型中的首个RDB，作为第一分支模型当前RDB和第二分支模型当前RDB；通过第一分支模型当前RDB处理第一图像特征，通过第二分支模型当前RDB处理第二图像特征，得到第一分支模型当前RDB输出的特征图和第二分支模型当前RDB输出的低频色彩特征；对于第二分支模型当前RDB输出的低频色彩特征，经一个全连接层处理后得到特征向量，将特征向量与第一分支模型当前RDB输出的特征图对应相乘，得到经局部色彩特征调整的特征图；将经局部色彩特征调整的特征图作为新的第一图像特征，将第二分支模型当前RDB输出的低频色彩特征作为新的第二图像特征；获取图像重建分支模型中的下一个RDB和色彩增强分支模型中的下一个RDB，作为新的第一分支模型当前RDB和新的第二分支模型当前RDB，直到获取次数等于N，将新得到的经局部色彩特征调整的特征图作为图像重建分支模型的输出结果，并将新得到的低频色彩特征作为色彩增强分支模型的输出结果。

在一些实施例中，RDB中包括密集连接网络层和局部特征融合层；局部特征融合层用于：利用局部残差学习将RDB的输入特征与密集连接网络层的输出特征进行特征相加，得到RDB的输出特征；密集连接层包括：M个密集连接模块和1个连接模块，M为大于或等于1的整数；其中，首个密集连接模块的输入为RDB的输入特征；第i个密集连接模块的输入特征为：RDB的输入特征和位于第i个密集连接模块之前的每个密集连接模块的输出特征，i为大于1且小于或等于M的整数；连接模块的输入为：RDB的输入特征和每个密集连接模块的输出特征。

在一些实施例中，视频处理装置1000还包括色彩增强模型训练模块，用于对初始色彩增强模型进行训练；色彩增强训练模块包括：第一调整结果获得单元，用于使用初始色彩增强模型处理从未调色图像中选取的未调色图像块，得到未调色图像块的色彩调整结果；第一参考结果获取单元，用于从色彩增强数据对中，获取与未调色图像块相对应的已调色图像块，作为色彩调整参考结果；第一损失函数构建单元，用于基于色彩调整结果和色彩调整参考结果，构建初始色彩增强模型的损失函数；第一参数调整单元，用于利用初始色彩增强模型的损失函数调整初始色彩增强模型的模型参数，得到更新的色彩增强模型；第一迭代训练单元，用于将更新的色彩增强模型作为新的初始色彩增强模型，并使用新的初始色彩增强模型处理从未调色图像中选取的未调色图像块，直到初始色彩增强模型的训练过程满足第一训练结束条件，得到训练好的色彩增强模型；其中，第一训练结束条件包括如下条件项的至少一项：根据初始色彩增强模型的损失函数计算的训练损失小于或者等于设定的第一损失阈值、对初始色彩增强模型的训练次数达到设定的第一次数阈值。

在一些实施例中，色彩增强训练模块，在用于基于色彩调整结果和色彩调整参考结果，构建初始色彩增强模型的损失函数时，具体用于：计算色彩调整结果和色彩调整参考结果之间的最小化平方误差，得到最小化平方误差损失；计算色彩调整结果的高斯滤波输出结果和色彩调整参考结果的高斯滤波输出结果，得到色彩损失；对最小化平方误差损失和色彩损失进行加权求和，生成初始色彩增强模型的损失函数。

在一些实施例中，内容分析模型包括：依次连接的K个层叠卷积结构的卷积网和两个全连接层，前K-1个层叠卷积结构中的每个层叠卷积结构中均包括一个卷积层、一个激活层和一个池化层，第K层叠卷积结构中包括一个卷积层和一个激活层。

在一些实施例中，内容分析模型，是预先基于预先训练好的色彩增强模型池中的每个色彩增强模型，采用不同风格的图像数据对，对初始内容分析模型进行训练得到的训练好的内容分析模型；其中，图像数据对包括：从未调色图像和第二已调色图像中的相同图像位置选取的具有相同图像尺寸的未调色图像块和已调色图像块，第二已调色图像是预先获取的基于不同视频内容类型对未调色图像进行调色后的图像。

在一些实施例中，视频处理装置1000还包括内容分析模型训练模块，用于对初始内容分析模型进行训练；内容分析模型训练模块包括：第二调整结果获得单元，用于利用预先训练好的色彩增强模型池中的每个色彩增强模型，处理从未调色图像中选取的未调色图像块，得到每个色彩增强模型对未调色图像块的色彩调整结果；权重值获得单元，用于使用初始内容分析模型对未调色图像块进行处理，得到预定数量的权重值，预定数量与色彩增强模型池中的色彩增强模型的数量相同；增强结果获得单元，用于根据预定数量的权重值，对每个色彩增强模型对未调色图像块的色彩调整结果进行加权融合处理，得到未调色图像块的色彩增强结果；第二参考结果获取单元，用于从图像数据对中获取与未调色图像块相对应的已调色图像块，作为色彩增强参考结果；第二损失函数构建单元，用于基于未调色图像块的色彩增强结果和色彩增强参考结果，构建初始内容分析模型的损失函数；第二参数调整单元，用于利用初始内容分析模型的损失函数调整初始内容分析模型的模型参数，得到更新的内容分析模型；第二迭代训练单元，用于将更新的内容分析模型作为新的初始内容分析模型，并使用新的初始内容分析模型对未调色图像块进行处理，直到初始内容分析模型的训练过程满足第二训练结束条件，得到训练好的内容分析模型；其中，第二训练结束条件包括如下条件项的至少一项：根据初始内容分析模型的损失函数计算的训练损失小于或者等于设定的第二损失阈值、初始内容分析模型的训练次数达到设定的第二次数阈值。

在一些实施例中，初始内容分析模型的损失函数，是根据未调色图像块的色彩增强结果和色彩增强参考结果的最小化平方误差构建的损失函数。

根据本公开实施例的视频处理装置，可以利用色彩增强模型池中的色彩增强模型和内容分析模型分别处理输入的视频帧，从而可利用内容分析模型输出的色彩增强模型池中的每个色彩增强模型与视频帧对应的权重值，以对色彩增强模型池中的每个色彩增强模型进行与视频帧对应的权重分配，最后输出对色彩增强模型池中的每个色彩增强模型的处理结果进行加权融合后的色彩调整结果，该色彩调整结果基于待处理视频的视频内容类型分析，得到更加符合视频内容类型的视频色彩调整结果，从而基于内容分析模型的权重分配对待处理视频的自动化调整，满足相应视频内容类型的色彩风格需求，提高视频色彩调整的数据处理效率。

需要明确的是，本公开并不局限于上文实施例中所描述并在图中示出的特定配置和处理。为了描述的方便和简洁，这里省略了对已知方法的详细描述，并且上述描述的系统、模块和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

图11为本公开实施例提供的一种电子设备的框图。

参照图11，本公开实施例提供了一种电子设备，该电子设备包括：至少一个处理器1101；至少一个存储器1102，以及一个或多个I/O接口1103，连接在处理器1101与存储器1102之间；其中，存储器1102存储有可被至少一个处理器1101执行的一个或多个计算机程序，一个或多个计算机程序被至少一个处理器1101执行，以使至少一个处理器1101能够执行上述的视频处理方法。

可以理解的是，以上实施方式仅仅是为了说明本公开的原理而采用的示例性实施方式，然而本公开并不局限于此。对于本领域内的普通技术人员而言，在不脱离本公开的精神和实质的情况下，可以做出各种变型和改进，这些变型和改进也视为本公开的保护范围。

本公开实施例还提供了一种计算机可读存储介质，其上存储有计算机程序，其中，计算机程序在被处理器/处理核执行时实现上述的视频处理方法。计算机可读存储介质可以是易失性或非易失性计算机可读存储介质。

本公开实施例还提供了一种计算机程序产品，包括计算机可读代码，或者承载有计算机可读代码的非易失性计算机可读存储介质，当计算机可读代码在电子设备的处理器中运行时，电子设备中的处理器执行上述视频处理方法。

本领域普通技术人员可以理解，上文中所公开方法中的全部或某些步骤、系统、装置中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。在硬件实施方式中，在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分；例如，一个物理组件可以具有多个功能，或者一个功能或步骤可以由若干物理组件合作执行。某些物理组件或所有物理组件可以被实施为由处理器，如中央处理器、数字信号处理器或微处理器执行的软件，或者被实施为硬件，或者被实施为集成电路，如专用集成电路。这样的软件可以分布在计算机可读存储介质上，计算机可读存储介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。

如本领域普通技术人员公知的，术语计算机存储介质包括在用于存储信息(诸如计算机可读程序指令、数据结构、程序模块或其它数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM)、静态随机存取存储器(SRAM)、闪存或其它存储器技术、便携式压缩盘只读存储器

(CD-ROM)、数字多功能盘(DVD)或其它光盘存储、磁盒、磁带、磁盘存储或其它磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其它的介质。此外，本领域普通技术人员公知的是，通信介质通常包含计算机可读程序指令、数据结构、程序模块或者诸如载波或其它传输机制之类的调制数据信号中的其它数据，并且可包括任何信息递送介质。

这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备，或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令，并转发该计算机可读程序指令，以供存储在各个计算/处理设备中的计算机可读存储介质中。

用于执行本公开操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码，所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等，以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中，通过利用计算机可读程序指令的状态信息来个性化定制电子电路，例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA)，该电子电路可以执行计算机可读程序指令，从而实现本公开的各个方面。

这里所描述的计算机程序产品可以具体通过硬件、软件或其结合的方式实现。在一个可选实施例中，所述计算机程序产品具体体现为计算机存储介质，在另一个可选实施例中，计算机程序产品具体体现为软件产品，例如软件开发包(Software Development Kit，SDK)等等。

这里参照根据本公开实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的各个方面。应当理解，流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合，都可以由计算机可读程序指令实现。

这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器，从而生产出一种机器，使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时，产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中，这些指令使得计算机、可编程数据处理装置和/或其它设备以特定方式工作，从而，存储有指令的计算机可读介质则包括一个制造品，其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。

也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上，使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤，以产生计算机实现的过程，从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。

附图中的流程图和框图显示了根据本公开的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分，所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个连续的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或动作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

本文已经公开了示例实施例，并且虽然采用了具体术语，但它们仅用于并仅应当被解释为一般说明性含义，并且不用于限制的目的。在一些实例中，对本领域技术人员显而易见的是，除非另外明确指出，否则可单独使用与特定实施例相结合描述的特征、特性和/或元素，或可与其它实施例相结合描述的特征、特性和/或元件组合使用。因此，本领域技术人员将理解，在不脱离由所附的权利要求阐明的本公开的范围的情况下，可进行各种形式和细节上的改变。

Claims

一种视频处理方法，包括：

获取待处理视频的视频帧；

利用色彩增强模型池中的至少一个色彩增强模型对所述视频帧进行色彩调整，得到色彩调整后的视频输出帧；

其中，所述色彩增强模型池包含针对多种视频内容类型的不同风格需求的视频进行色彩调整的模型集合。
根据权利要求1所述的方法，其中，所述利用色彩增强模型池中的至少一个色彩增强模型对所述视频帧进行色彩调整，得到色彩调整后的视频输出帧，包括：

接收包含所述视频帧的视频内容类型和风格需求的信息；

从所述色彩增强模型池中选择与所述视频内容类型和风格需求对应的色彩增强模型；

利用选择的色彩增强模型对所述视频帧进行处理，得到所述色彩调整后的视频输出帧。
根据权利要求1所述的方法，其中，所述利用色彩增强模型池中的至少一个色彩增强模型对所述视频帧进行色彩调整，得到色彩调整后的视频输出帧，包括：

利用色彩增强模型池中的每个色彩增强模型处理所述视频帧，得到所述每个色彩增强模型输出的色彩调整后的视频帧；

基于内容分析模型处理所述视频帧，生成所述每个色彩增强模型与所述视频帧对应的权重值；其中，所述内容分析模型配置为根据所述视频帧确定所述色彩增强模型池中的每个色彩增强模型的权重值；

使用所述每个色彩增强模型与所述视频帧对应的权重值，对所述每个色彩增强模型输出的色彩调整后的视频帧进行加权融合处理，生成所述视频输出帧。
根据权利要求2所述的方法，其中，所述色彩增强模型中包括：图像重建分支模型和色彩增强分支模型；所述利用选择的色彩增强模型对所述视频帧进行处理，得到所述色彩调整后的视频输出帧，包括：

对所述视频帧进行特征提取，得到第一图像特征；

对所述视频帧进行滤波处理，并对滤波处理后的视频帧进行特征提取，得到第二图像特征；

将所述第一图像特征输入所述图像重建分支模型，所述第二图像特征输入所述色彩增强分支模型，以根据所述第一图像特征和所述第二图像特征进行图像重建和色彩调整；

对所述图像重建分支模型的输出结果和所述色彩增强分支模型的输出结果进行特征融合处理，得到融合结果；

根据所述融合结果，生成色彩调整后的视频输出帧。
根据权利要求4所述的方法，其中，所述图像重建分支模型和所述色彩增强分支模型中均包括：N个密集残差连接网络模块RDB；所述色彩增强模型中还包括N个全连接层；其中，N为大于或等于1的整数；

所述将所述第一图像特征输入所述图像重建分支模型，所述第二图像特征输入所述色彩增强分支模型，以根据所述第一图像特征和所述第二图像特征进行图像重建和色彩调整，包括：

获取所述图像重建分支模型中的首个RDB和所述色彩增强分支模型中的首个RDB，作为第一分支模型当前RDB和第二分支模型当前RDB；

通过所述第一分支模型当前RDB处理所述第一图像特征，通过所述第二分支模型当前RDB处理所述第二图像特征，得到所述第一分支模型当前RDB输出的特征图和所述第二分支模型当前RDB输出的低频色彩特征；

对于所述第二分支模型当前RDB输出的低频色彩特征，经一个全连接层处理后得到特征向量，将所述特征向量与所述第一分支模型当前RDB输出的特征图对应相乘，得到经局部色彩特征调整的特征图；

将所述经局部色彩特征调整的特征图作为新的第一图像特征，将所述第二分支模型当前RDB输出的低频色彩特征作为新的第二图像特征；

获取所述图像重建分支模型中的下一个RDB和所述色彩增强分支模型中的下一个RDB，作为新的第一分支模型当前RDB和新的第二分支模型当前RDB，直到获取次数等于N，将新得到的经局部色彩特征调整的特征图作为所述图像重建分支模型的输出结果，并将新得到的低频色彩特征作为所述色彩增强分支模型的输出结果。
根据权利要求5所述的方法，其中，

所述RDB中包括密集连接网络层和局部特征融合层；

所述局部特征融合层用于：利用局部残差学习将所述RDB的输入特征与所述密集连接网络层的输出特征进行特征相加，得到所述RDB的输出特征；

所述密集连接层包括：M个密集连接模块和1个连接模块，M为大于或等于1的整数；其中，

首个密集连接模块的输入为所述RDB的输入特征；

第i个密集连接模块的输入特征为：所述RDB的输入特征和位于第i个密集连接模块之前的每个密集连接模块的输出特征，i为大于1且小于或等于M的整数；

所述连接模块的输入为：所述RDB的输入特征和每个密集连接模块的输出特征。
根据权利要求1-6中任一项所述的方法，其中，所述色彩增强模型池中的每个所述色彩增强模型具有相同的模型结构；

所述色彩增强模型池中的色彩增强模型，是预先针对不同视频内容类型的色彩风格采用不同的色彩增强数据对，对初始色彩增强模型进行训练得到的训练好的色彩增强模型；

所述色彩增强数据对包括：从未调色图像和第一已调色图像中的相同图像位置选取的具有相同图像尺寸的未调色图像块和已调色图像块，所述第一已调色图像是预先获取的基于图像色彩风格特征对所述未调色图像进行调色后的图像。
根据权利要求7所述的方法，其中，对所述初始色彩增强模型进行的训练包括：

使用所述初始色彩增强模型处理从所述未调色图像中选取的未调色图像块，得到所述未调色图像块的色彩调整结果，并从所述色彩增强数据对中，获取与所述未调色图像块相对应的已调色图像块，作为色彩调整参考结果；

基于所述色彩调整结果和所述色彩调整参考结果，构建初始色彩增强模型的损失函数；

利用初始色彩增强模型的损失函数调整所述初始色彩增强模型的模型参数，得到更新的色彩增强模型；

将所述更新的色彩增强模型作为新的初始色彩增强模型，并使用所述新的初始色彩增强模型处理从所述未调色图像中选取的未调色图像块，直到所述初始色彩增强模型的训练过程满足第一训练结束条件，得到所述训练好的色彩增强模型；其中，

所述第一训练结束条件包括如下条件项的至少一项：根据所述初始色彩增强模型的损失函数计算的训练损失小于或者等于设定的第一损失阈值、对所述初始色彩增强模型的训练次数达到设定的第一次数阈值。
根据权利要求8所述的方法，其中，所述基于所述色彩调整结果和所述色彩调整参考结果，构建初始色彩增强模型的损失函数，包括：

计算所述色彩调整结果和所述色彩调整参考结果之间的最小化平方误差，得到最小化平方误差损失；

计算所述色彩调整结果的高斯滤波输出结果和所述色彩调整参考结果的高斯滤波输出结果，得到色彩损失；

对所述最小化平方误差损失和所述色彩损失进行加权求和，生成所述初始色彩增强模型的损失函数。
根据权利要求3所述的方法，其中，所述内容分析模型包括：依次连接的K个层叠卷积结构的卷积网和两个全连接层，前K-1个层叠卷积结构中的每个层叠卷积结构中均包括一个卷积层、一个激活层和一个池化层，第K层叠卷积结构中包括一个卷积层和一个激活层。
根据权利要求3或10所述的方法，其中，

所述内容分析模型，是基于预先训练好的所述色彩增强模型池中的每个色彩增强模型，采用不同风格的图像数据对，对初始内容分析模型进行训练得到的训练好的内容分析模型；其中，

所述图像数据对包括：从未调色图像和第二已调色图像中的相同图像位置选取的具有相同图像尺寸的未调色图像块和已调色图像块，所述第二已调色图像是预先获取的基于不同视频内容类型对未调色图像进行调色后的图像。
根据权利要求11所述的方法，其中，对所述初始内容分析模型进行的训练包括：

利用预先训练好的色彩增强模型池中的每个色彩增强模型，处理从所述未调色图像中选取的未调色图像块，得到所述每个色彩增强模型对所述未调色图像块的色彩调整结果；

使用初始内容分析模型对所述未调色图像块进行处理，得到预定数量的权重值，所述预定数量与所述色彩增强模型池中的色彩增强模型的数量相同；

根据所述预定数量的权重值，对所述每个色彩增强模型对所述未调色图像块的色彩调整结果进行加权融合处理，得到所述未调色图像块的色彩增强结果，并从所述图像数据对中获取与所述未调色图像块相对应的已调色图像块，作为所述色彩增强参考结果；

基于所述未调色图像块的色彩增强结果和所述色彩增强参考结果，构建所述初始内容分析模型的损失函数；

利用初始内容分析模型的损失函数调整所述内容分析模型的模型参数，以利用调整后的模型参数，得到更新的内容分析模型；

将所述更新的内容分析模型作为新的初始内容分析模型，并使用所述新的初始内容分析模型对所述未调色图像块进行处理，直到所述初始内容分析模型的训练过程满足第二训练结束条件，得到所述训练好的内容分析模型；

其中，所述第二训练结束条件包括如下条件项的至少一项：根据所述初始内容分析模型的损失函数计算的训练损失小于或者等于设定的第二损失阈值、所述初始内容分析模型的训练次数达到设定的第二次数阈值。
根据权利要求12所述的方法，其中，

所述初始内容分析模型的损失函数，是根据所述未调色图像块的色彩增强结果和所述色彩增强参考结果的最小化平方误差构建的损失函数。
一种视频处理装置，包括：

获取模块，用于获取待处理的视频帧；

处理模块，用于利用色彩增强模型池中的至少一个色彩增强模型对所述视频帧进行色彩调整，得到色彩调整后的视频输出帧；

其中，所述色彩增强模型池包含针对多种视频内容类型的不同风格需求的视频进行色彩调整的模型集合。
一种电子设备，包括存储器和处理器，所述存储器上存储有计算机程序，其中，所述计算机程序被所述处理器执行时实现权利要求1至13中任意一项所述的视频处理方法。
一种非瞬态计算机可读存储介质，其上存储有计算机程序，其中，该计算机程序被处理器执行时实现权利要求1至13中任意一项所述的视频处理方法。