CN115205188A

CN115205188A - 基于逼近值评估图像视频质量的方法和相关装置

Info

Publication number: CN115205188A
Application number: CN202110395015.2A
Authority: CN
Inventors: 金飞剑
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2021-04-13
Filing date: 2021-04-13
Publication date: 2022-10-18
Also published as: JP2024511103A; US20230072918A1; WO2022218072A1

Abstract

本申请提供了一种基于逼近值评估图像视频质量的方法和相关装置，涉及人工智能的计算机视觉(图像)或机器学习等技术领域，该方法包括获取待评价样本；基于该待评价样本的参数，利用线上的第一模型计算逼近该待评价样本的主观真值的第一逼近值；该第一模型为基于离线的第二模型得到的模型，该第二模型为以k个样本和该k个样本的主观真值作为训练集得到的模型，该第一模型为利用该第二模型获取的该k个样本的逼近值为参考，对该k个样本的参数进行拟合得到的模型，k＞0；基于该第一逼近值评估图像视频质量。能够在不增加服务器端硬件成本和保证评估准确度的情况下，基于实时反馈的逼近主观真值的逼近值评估图像视频质量。

Description

基于逼近值评估图像视频质量的方法和相关装置

技术领域

本申请实施例涉及人工智能的计算机视觉(图像)或机器学习等技术领域，并且更具体地，涉及基于逼近值评估图像视频质量的方法和相关装置。

背景技术

图像/视频的质量一般可采用算法模型计算出视频/图像的质量指标。

通常情况下，视频主观打分模型和计算值可以反馈视频主客观质量情况，但是从计算复杂度和准确性都不是很理想。例如可以单纯利用编码器的量化参数(QP)、峰值信噪比(Peak Signal-to-Noise Ratio，PSNR)、结构相似性(Structural SIMilarity，SSIM)反馈游戏视频客观质量分值，这种方式的复杂度虽然不高，但是与主观质量评价相关性偏低，有一定的局限性，而且会引入一定的时延影响。再如可通过视频多评估融合(VideoMultimethod Assessment Fusion，VAMF)等模型获取游戏视频客观质量分值，这种方式相对PSNR而言准确度要高，但是计算复杂度高很多，无法做到高帧率，高分辨率视频实时计算。

此外，现有云游戏种类繁多，视频海量数据需要实时获取视频主观分值，但相关技术中并没有用于实时反馈主观质量的模型以及相关方案。

因此，本领亟需提供一种能够基于实时反馈主观质量评估图像视频质量的方法。

发明内容

本申请提供了一种基于逼近值评估图像视频质量的方法和相关装置，能够在不增加服务器端硬件成本和保证评估准确度的情况下，基于实时反馈的逼近主观真值的逼近值评估图像视频质量。

一方面，本申请提供了一种基于逼近值评估图像视频质量的方法，包括：

获取待评价样本，该待评价样本包括待评价视频或待评价图像；

基于该待评价样本的参数，利用线上的第一模型计算逼近该待评价样本的主观真值的第一逼近值；

其中，该第一模型为基于离线的第二模型得到的模型，该第二模型为以k个样本和该k个样本的主观真值作为训练集得到的模型，该k个样本的主观真值以主观打分的方式获取，该第一模型为利用该第二模型获取的该k个样本的逼近值为参考，对该k个样本的参数进行拟合得到的模型，k＞0；

基于该第一逼近值评估该待评价视频或该待评价图像的质量。

另一方面，本申请提供了一种基于逼近值评估图像视频质量的装置，包括：

获取单元，用于获取待评价样本，该待评价样本包括待评价视频或待评价图像；

计算单元，用于基于该待评价样本的参数，利用线上的第一模型计算逼近该待评价样本的主观真值的第一逼近值；

评估单元，用于基于该第一逼近值评估该待评价视频或该待评价图像的质量。

另一方面，本申请提供了一种第一模型的训练方法，包括：

获取k个样本，该k个样本的主观真值以主观打分的方式获取；

以该k个样本和该k个样本的主观真值作为训练集，得到第二模型；

以该k个样本作为输入，利用该第二模型获取该k个样本的逼近主观真值的逼近值；

利用该k个样本的逼近值为参考，对该k个样本的参数进行拟合以得到该第一模型。

另一方面，本申请提供了一种第一模型的训练装置，包括：

第一获取单元，用于获取k个样本，该k个样本的主观真值以主观打分的方式获取；

第一训练单元，用于以该k个样本和该k个样本的主观真值作为训练集，得到第二模型；

第二获取单元，用于以该k个样本作为输入，利用该第二模型获取该k个样本的逼近主观真值的逼近值；

第二训练单元，用于利用该k个样本的逼近值为参考，对该k个样本的参数进行拟合以得到该第一模型。

另一方面，本申请提供了一种电子设备，包括：

处理器，适于实现计算机指令；以及，

计算机可读存储介质，计算机可读存储介质存储有计算机指令，计算机指令适于由处理器加载并执行上述基于逼近值评估图像视频质量的方法或上述第一模型的训练方法。

另一方面，本申请实施例提供一种计算机可读存储介质，该计算机可读存储介质存储有计算机指令，该计算机指令被计算机设备的处理器读取并执行时，使得计算机设备执行上述基于逼近值评估图像视频质量的方法或上述第一模型的训练方法。

另一方面，本申请实施例提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述基于逼近值评估图像视频质量的方法或上述第一模型的训练方法。

本申请实施例中，基于待评价样本的参数，利用线上的第一模型计算逼近该待评价样本的主观真值的第一逼近值；进而基于该第一逼近值评估该待评价视频或该待评价图像的质量。一方面，通过线上的第一模型，能够实时计算并反馈该第一逼近值，进而，可以基于实时反馈的逼近主观真值的逼近值评估图像视频质量。另一方面，将该第一模型构造为基于离线的第二模型得到的模型，且将该第二模型构造为以k个样本和该k个样本的主观真值作为训练集得到的模型，该k个样本的主观真值以主观打分的方式获取，该第一模型为利用该第二模型获取的该k个样本的逼近值为参考，对该k个样本的参数进行拟合得到的模型，k＞0；相当于，利用训练得到的第二模型通过拟合的方式得到第一模型，能够在不增加服务器端硬件成本下，保证第一模型的评估准确度。

综上，本申请提供的方法，能够在不增加服务器端硬件成本和保证评估准确度的情况下，基于实时反馈的逼近主观真值的逼近值评估图像视频质量。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的主观打分平台的界面的示意图。

图2是本申请实施例提供的基于随机选择的样本训练质量评价模型的方法的示意性流程图。

图3是本申请实施例提供的基于逼近值评估图像视频质量的方法的示意性流程图。

图4是本申请实施例提供的第一模型的工作原理的示意性框图。

图5是本申请实施例提供的第一模型的训练原理和评估原理的示意性框图。

图6是本申请实施例提供的第一模型的优化原理的示意性框图。

图7是本申请实施例提供的包括第一模型的服务系统的示意性框图。

图8是本申请实施例提供的第一模型的训练方法的示意性流程图。

图9是本申请实施例提供的基于逼近值评估图像视频质量的装置的示意性框图。

图10是本申请实施例提供的第一模型的训练装置的示意性框图。

图11是本申请实施例提供的电子设备的示意性框图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请提供的方案可涉及人工智能技术。

其中，人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。

应理解，人工智能技术是一门综合学科，涉及领域广泛，既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

随着人工智能技术研究和进步，人工智能技术在多个领域展开研究和应用，例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服等，相信随着技术的发展，人工智能技术将在更多的领域得到应用，并发挥越来越重要的价值。

本申请实施例可涉及人工智能技术中的计算机视觉(Computer Vision,CV)技术，计算机视觉是一门研究如何使机器“看”的科学，更进一步的说，就是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉，并进一步做图形处理，使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科，计算机视觉研究相关的理论和技术，试图建立能够从图像或者多维数据中获取信息的人工智能系统。计算机视觉技术通常包括图像处理、图像识别、图像语义理解、图像检索、OCR、视频处理、视频语义理解、视频内容/行为识别、三维物体重建、3D技术、虚拟现实、增强现实、同步定位与地图构建等技术，还包括常见的人脸识别、指纹识别等生物特征识别技术。

本申请实施例也可以涉及人工智能技术中的机器学习(Machine Learning,ML)，ML是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。

为便于对本申请方案的理解，下面对本申请涉及的相关术语进行说明。

(1)图像视频质量评价：指通过主客观的方式对图像或是视频帧的失真进行感知、衡量与评价。主观评分方式一般利用平均主观得分(mean opinion score,MOS)或平均主观得分差(difference mean opinion score,DMOS)来表示，主观评分方式也可称为主观打分方式。客观评分方式一般采用算法模型计算出视频/图像的质量指标，客观评分方式也可称为利用质量评价模型输出质量评分的方式。

(2)主观打分平台：针对图像和视频做主观打分的标注平台，主观打分是指评测员/标注员针对某一张图片或是某一段视频的画质或是美学等做出评分。

图1是本申请实施例提供的主观打分平台的界面的示意图。

如图1所示，主观打分平台的界面可以包括待打分的视频，以及打分的选项。具体地，可以采用五分制打分，分别对应：很好、好、一般、差、很差共5档。一个样本一般由多个评测员进行评分，评测员选出某一档的评分，该样本最终的质量分数根据所有评测员评分的均值获取得到。还有其他的主观打分方式，比如配对比较，通过让评测员看两张图片或是视频，给出哪一个更好的选择。

(3)主动学习(active learning)：主观打分平台需要从海量的图像视频库挑选出一部分样本提供给评测员做主观评分，通过评测员对样本进行主观打分的方式获取主观评分可称为以主观打分的方式获取样本的主观评分，标注有主观评分的样本可称为已标注样本。主动学习(active learning)能够通过特定的选择策略主动挑选出当前模型认为最难区分或是信息量较大的样本给评测员进行打分，通过这种方式可以在保证模型性能的同时，有效地减少需要标注的样本量。

(4)被动学习(passive learning)：一般采用随机挑选的样本训练模型。

如图2所示，质量评价模型的训练过程是一个“瀑布式”式的算法开发流程，在海量的数据库中随机挑选若干(n)个样本放到主观打分平台供评测员(即评测员1至评测员t)打分，打分完成后再训练得到模型。针对这种训练质量评价模型的方法，随机挑选样本的方法很容易挑选到很多无价值的样本，特别是海量图像视频库中会有很多相似、冗余的数据。而且选择的样本数需要提前设定，不容易控制。此外，将主观打分和模型训练完全孤立，这样”瀑布式“式的开发流程会导致如果发现主观打分后的数据集质量不高，则需要重新打分，耗时耗力且容错率很低。

(5)平均主观得分(mean opinion score，MOS)，即上面提到的某个样本最终的质量分数，这个值的具体数值可以根据所有评测员的评分的均值获取得到。例如本申请中涉及的主观真值可以是MOS。

(6)拟合：拟合就是把平面上一系列的点，用一条光滑的曲线连接起来。因为连接的曲线有无数种可能，从而有各种拟合方法。拟合的曲线一般可以用函数表示，根据这个函数的不同有不同的拟合名字。常用的拟合方法有最小二乘曲线拟合法等。如果待定函数是线性，就叫线性拟合或者线性回归(主要在统计中)，否则叫作非线性拟合或者非线性回归。表达式也可以是分段函数，这种情况下叫作样条拟合。例如本申请涉及的第一模型可以是一个通过拟合的方式得到的模型。该第一模型的预测结果可以是逼近主观真值的逼近值。

(7)训练：将主观打分后的图片/视频数据集作为输入，通过训练可得到一个模型。例如本申请涉及的第二模型可以是一个通过训练的方式得到的模型。该第二模型的预测结果可以是逼近主观真值的逼近值。

(8)图像质量评价(image quality assessment，IQA)：是图像处理中的基本技术之一，主要通过对图像进行特性分析研究，然后评估出图像优劣(图像失真程度)。图像质量评价在图像处理系统中，对于算法分析比较、系统性能评估等方面有着重要的作用。近年来，随着对数字图像领域的广泛研究，图像质量评价的研究也越来越受到研究者的关注，提出并完善了许多图像质量评价的指标和方法。

(9)视频质量评价(video quality assessment，VQA)：是视频处理中的基本技术之一，主要通过对视频进行特性分析研究，然后评估出视频优劣(视频客观质量)。

因此，本申请提供了一种基于逼近值评估图像视频质量的方法，能够在不增加服务器端硬件成本和保证评估准确度的情况下，基于实时反馈的逼近主观真值的逼近值评估图像视频质量。

图3是本申请实施例提供的基于逼近值评估图像视频质量的方法100的示意性流程图。需要说明的，本申请实施例提供的方案可通过任何具有数据处理能力的电子设备执行。例如，该电子设备可实施为服务器。服务器可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、以及大数据和人工智能平台等基础云计算服务的云服务器，服务器可以通过有线或无线通信方式进行直接或间接地连接，本申请在此不做限制。为便于描述，下面以服务系统为例进行说明。

如图3所示，该方法100可包括以下中的部分或全部内容：

S110，获取待评价样本，该待评价样本包括待评价视频或待评价图像；

S120，基于该待评价样本的参数，利用线上的第一模型计算逼近该待评价样本的主观真值的第一逼近值；

S130，基于该第一逼近值评估该待评价视频或该待评价图像的质量。

在云游戏运行模式下，游戏在服务器端运行，然后通过抓屏的方式获取渲染的游戏视频画面，利用视频编码器压缩后通过网络传送给用户客户端。基于此，用户客户端可以基于逼近值评估图像视频质量的方法，基于实时反馈的逼近主观真值的逼近值评估图像视频质量。

综上，本申请提供的方法，能够在不增加服务器端硬件成本和保证评估准确度的情况下，基于实时反馈的逼近主观真值的逼近值评估图像视频质量。换言之，通过第一模型能够在线计算出逼近待评价样本的主观真值的逼近值，然后通过该第一模型计算的逼近值评估云游戏视频质量。相当于，能够解决在线玩游戏的过程中实时评估视频主观质量。例如可用于在线监控云游戏大盘质量。

需要说明的是，本申请实施例中，用户可在用户客户端上利用一套贴近应用场景的云游戏视频质量评估方案，以主观打分的方式获取主观真值，作为第二模型的训练样本。例如可以采用图1所示的主观打分平台的界面，再如，可以采用图2所示的流程基于随机选择的样本训练第二模型，但本申请不限于此。

在一些实施例中，该待评价样本的参数包括以下参数中的至少一项：网络模块的反馈参数，云游戏模块的设定参数以及编解码模块的计算参数。在一种实现方式中，该待评价样本的参数的类型可以基于软件开发工具包(Software Development Kit，SDK)的分类进行定义。例如SDK包括但不限于网络SDK、云游戏SDK以及编解码SDK等。

如图4所示，第一模型利用输入待评价样本的参数1～参数n(例如根据场景选择参数，场景包括但不限于与待评价样本的编码参数。例如与编码帧的参数和码流相关。例如与量化参数(QP)，MV，帧率，帧长、帧复杂度参数以及帧类型等。帧复杂度参数例如可以是绝对变换差的和(Sum of Absolute Transformed Difference，SATD)。帧率可以指的就是每秒钟播放的图片数量，如24帧即每秒钟播放24张图片，60帧即每秒钟播放60张图片，以此类推。帧长可以指数据帧的长度。通过对输入的参数1～参数n的计算可获得逼近待评价样本的主观真值的第一逼近值。

在一些实施例中，该基于该待评价样本的参数，S120之前，该方法100还可包括：

基于该k个样本的参数，利用该第一模型计算该k个样本的逼近值；基于利用该第二模型获取的该k个样本的逼近值和利用该第一模型计算得到的该k个样本的逼近值，对该第一模型进行评估；针对该k个样本中每一个样本，若利用该第一模型计算的逼近值和利用该第二模型获取的逼近值之间的差值小于或等于第一预设阈值，则确定对该第一模型的评估结果为正向，否则确定对该第一模型的评估结果为负向。例如，针对该k个样本中任一个样本，若利用该第一模型计算的逼近值和利用该第二模型获取的逼近值之间的差值大于该第一预设阈值，则确定对该第一模型的评估结果为负向。

简言之，可利用第二模型的获取的逼近值对第一模型的性能或准确度进行评估。

基于该k个样本的主观真值和利用该第一模型计算得到的该k个样本的逼近值，对该第一模型进行评估；针对该k个样本中每一个样本，若利用该第一模型计算的逼近值和主观真值之间的差值小于或等于第二预设阈值，则确定对该第一模型的评估结果为正向，否则确定对该第一模型的评估结果为负向。例如，针对该k个样本中任一个样本，若利用该第一模型计算的逼近值和主观真值之间的差值大于该第二预设阈值，则确定对该第一模型的评估结果为负向。

简言之，可利用主观真值对第一模型的性能或准确度进行评估。

如图5所示，针对第一模型的拟合过程可如图5中虚线单箭头表示的部分，一方面，需要以主观打分的方式获取解码后的序列集中的图像帧的主观真实值A，以便以获取到的主观真实值A作为训练集训练第二模型；另一方面，需要基于第二模型和待输入的参数集得到第一模型。针对第一模型的优化过程可如实线双箭头表示的部分，一方面，可以基于第二模型输出的主观逼近值B和第一模型输出的主观逼近值A对该第一模型进行评估，另一方面，也可以基于主观真实值A和第一模型输出的主观逼近值A对该第一模型进行评估。

在训练第二模型的过程中，可以包括以下步骤：

(1)、获取解码后序列集。

由于云游戏的种类比较繁多，复杂度不相同，主观感受也不相同。本申请可通过对云游戏视频进行场景分类，以便针对一种场景可以训练处第二模型中的一个第二子模型以及第一模型中的一个第一子模型。当然，也可以对基于场景分类的云游戏视频再基于游戏场合进行切分，以便针对一种场景下的一种游戏场合可以训练处第二模型中的一个第二子模型以及第一模型中的一个第一子模型。本申请实施例对场景和游戏场合的具体分类不作限定。例如，场景可以是用于播放该待评价视频或该待评价图像的设备的类型。游戏场合可以是游戏画面的场景，例如战斗场景或非战斗场景。针对分类后的某一类视频，可以对该某一类视频根据编码配置方案(针对云游戏特点帧率，码率，分辨率等适配)进行编码并压缩，以得到编码并压缩后的序列集，编码压缩序列集相对于采集源序列集进行了有损失的压缩，会带来视频图像质量细节上损失。然后针对编码并压缩后的序列集进行解码，得到解码后序列集。可选的，该解码后序列集即可为上述k个样本。

(2)、以主观打分的方式获取解码后序列集中的图像帧的主观真实值A。

由于云游戏的场景不同于实时通信主观视频场景，例如云游戏的场景可涉及手机移动端，固定PC以及电视TV终端。而且游戏玩家对体验的要求也不同于实时通信的用户对体验的要求。本申请中可通过一套云游戏视频主观评价的标准体系，以主观打分的方式获取解码后的序列集中的图像帧的主观真实值A。例如，编码并压缩后的序列集通过第三方解码播放，然后组织人工(即评测员)根据云游戏视频主观评价的标准体系，以主观打分的方式获取解码后的序列集中的图像帧的主观真实值A。

(3)、基于解码后序列集中的图像帧的主观真实值A训练第二模型。

针对编码压缩序列集通过第三方解码制作解码后序列集，然后可作为第二模型的训练集训练第二模型，并利用训练好的第二模型获得解码后序列集中的图像帧的主观逼近值B(无限的接近主观真实值A)。本申请对第二模型的性能复杂度基本不做要求，只要求准确性比较高，即该第二模型可以是很复杂且准确性非常高的模型。

(4)、基于该第二模型得到该第一模型。

利用训练好的第二模型获得解码后序列集中的图像帧的主观逼近值B后，可基于解码后序列集中的图像帧的主观逼近值B以及解码后序列集中的图像帧的参数进行拟合计算，以得到第一模型。拟合就是把平面上一系列的点，用一条光滑的曲线连接起来。因为连接的曲线有无数种可能，从而有各种拟合方法。拟合的曲线一般可以用函数表示，根据这个函数的不同有不同的拟合名字。常用的拟合方法有最小二乘曲线拟合法等。如果待定函数是线性，就叫线性拟合或者线性回归(主要在统计中)，否则叫作非线性拟合或者非线性回归。表达式也可以是分段函数，这种情况下叫作样条拟合。例如本申请涉及的第一模型可以是一个通过拟合的方式得到的模型。该第一模型的预测结果可以是逼近主观真值的逼近值。

在一些实施例中，该方法100还可包括：

若对该第一模型的评估结果为正向，则将该第一模型集成至服务系统；若对该第一模型的评估结果为负向，则重新拟合该第一模型，直至对该第一模型的评估结果为正向。

换言之，若该第一模型达到预期评估效果，则可以将该第一模型集成至服务系统，拖该第一模型未达到预期效果，则需要重新拟合该第一模型，直至该第一模型达到预期效果。

在一些实施例中，该方法100还可包括：

通过统计模块将该第一逼近值上报给该第二模型；利用该第二模型获取该待评价样本的第二逼近值；基于该第一逼近值和该第二逼近值，确定是否对该第一模块进行优化；若该第一逼近值和该第二逼近值之间的差值大于第三预设阈值，则利用该待评价样本的参数和该第二逼近值对该第一模型进行优化；若该第一逼近值和该第二逼近值之间的差值小于或等于该第三预设阈值，则确定不需要对该第一模块进行优化。

简言之，可以利用该第一逼近值对第一模型进行优化，以提升第一模型的准确度。

在一些实施例中，该基于该第一逼近值和该第二逼近值，确定是否对该第一模块进行优化之前，获取该待评价样本的主观真实值；若该第二逼近值和该待评价样本的主观真实值之间的差值大于第四预设阈值，则利用该待评价样本和该待评价样本的主观真实值，优化该第二模型。

简言之，可以利用该第一逼近值对该第二模型进行优化，以提升第二模型的准确度。

如图6所示，首先得到用于计算逼近主观真值的逼近值的第一模型，然后将第一模型放到云游戏服务端系统中。基于此，首先获取采集帧(即待评价样本)后对采集帧进行编码，以得到编码帧；然后通过编码帧带过来的参数和码流信息，得到需要输入到第一模型的待评价样本的参数，将该待评价样本的参数输入到该第一模型后，该第一模型基于该待评价样本的参数进行计算，并得到该待评价样本的第一逼近值；此时，可以通过数据统计模块将该第一逼近值反馈至平台统计模块，以便平台统计模块基于该第一逼近值确定是否对第一模型或第二模型进行优化。

如图7所示，将拟合完成的第一模型集成到服务系统中的编解码模块中，利用服务系统中可以获取输入参数，如参数P1，参数P2以及参数P3等。参数P1表示网络模块的反馈参数，参数P2表示云游戏模块的设定参数，参数P3表示编解码模块的计算参数。然后，第一模型基于参数P1，参数P2以及参数P3计算待评价样本的第一逼近值。可选的，该第一逼近值可通过数据统计模块上报至服务系统的平台统计模块，以便平台统计模块确定基于该第一逼近值确定是否需要对第二模型以及是否需要对第一模型进行优化。例如平台统计模块可进行统计分类，并确定是否需要对分类对应的第一子模型或第二子模型进行优化。当然，也可以在优化第二模型后，基于优化后的第二模型优化该第一模型，本申请实施例对此不作具体限定，通过优化第一模型，能够提升逼近值的准确度。

在一些实施例中，该第一模型包括多个场景对应的多个第一子模型，该第二模型包括该多个场景对应的多个第二子模型，该多个第一子模型分别为基于该多个第二子模型得到的模型，该多个场景包括该待评价样本所在的第一场景；基于此，该S120可包括：确定该第一场景对应的第一子模型；基于该待评价样本的参数，利用该第一场景对应的第一子模型，计算该第一逼近值。

换言之，基于不同的场景下的样本的参数可拟合为不同的第一子模型，基于不同的场景下的样本可以通过训练的方式得到不同的第二子模型。由此，可以提升第一子模型和第二子模型的准确度。

在一些实施例中，该多个场景包括用于播放该待评价视频或该待评价图像的设备的类型。

当然，在本申请的其他可替代实施例中，该多个场景也可以包括该待评价视频或待评价图像所属的应用程序或者播放方式等，本申请对此不作具体限定。

在一些实施例中，该第一模型为半参考模型或无参考模型，该第二模型为全参考模型或无参考模型，该半参考模型指参考压缩前的图像帧中的部分参数和压缩后的图像帧得到的模型，该无参考模型指仅参考压缩后的图像帧得到的模型，该全参考模型指参考压缩前的图像帧和压缩后的图像帧得到的模型。

当然，该半参考模型也可以指参考编码前的图像帧中的部分参数和编码后的图像帧得到的模型，该无参考模型也可以指仅参考编码后的图像帧得到的模型，该全参考模型也可以指参考编码前的图像帧和编码后的图像帧得到的模型，本申请对此不作具体限定。

综上，本申请提供了一种基于逼近值评估图像视频质量的方法，该方法能够实时评估视频主观质量。可选的，可以通过对云游戏种类以及平台等信息进行分类，针对某一分类，获取k个样本的主观真值A。然后通过离线的第二模型获取k个样本的逼近主观真值A的逼近值B(非常接近A)。然后利用获取到的逼近值B作为参考真值，同时利用输入k个样本的多个参数拟合成第一模型(用于计算逼近主观真值A的逼近值C且能快速计算逼近值C)。基于此，可通过该第一模型在线获取云游戏实时视频的逼近主观真值的逼近值。可选的，针对后续新增游戏，可以通过更新第二模型的方式基于更新后的第二模型优化在线第一模型。

图8是本申请实施例提供的第一模型的训练方法200的示意性流程图。需要说明的，本申请实施例提供的方案可通过任何具有数据处理能力的电子设备执行。例如，该电子设备可实施为服务器。服务器可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、以及大数据和人工智能平台等基础云计算服务的云服务器，服务器可以通过有线或无线通信方式进行直接或间接地连接，本申请在此不做限制。

如图8所示，该方法200可包括：

S210，获取k个样本，该k个样本的主观真值以主观打分的方式获取；

S220，以该k个样本和该k个样本的主观真值作为训练集，得到第二模型；

S230，以该k个样本作为输入，利用该第二模型获取该k个样本的逼近主观真值的逼近值；

S240，利用该k个样本的逼近值为参考，对该k个样本的参数进行拟合以得到该第一模型。

需要说明的是，该方法200还可包括方法100中与第一模型评估和优化相关的方案，换言之，该方法200中的由于第一模型的评估优化等相关方案，可参考方法100中的相应方案，为避免重复，此处不再赘述。

以上结合附图详细描述了本申请的优选实施方式，但是，本申请并不限于上述实施方式中的具体细节，在本申请的技术构思范围内，可以对本申请的技术方案进行多种简单变型，这些简单变型均属于本申请的保护范围。例如，在上述具体实施方式中所描述的各个具体技术特征，在不矛盾的情况下，可以通过任何合适的方式进行组合，为了避免不必要的重复，本申请对各种可能的组合方式不再另行说明。又例如，本申请的各种不同的实施方式之间也可以进行任意组合，只要其不违背本申请的思想，其同样应当视为本申请所公开的内容。

还应理解，在本申请的各种方法实施例中，上述各过程的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本申请实施例的实施过程构成任何限定。另外，本申请实施例中，术语“和/或”，仅仅是一种描述关联对象的关联关系，表示可以存在三种关系。具体地，A和/或B可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本文中字符“/”，一般表示前后关联对象是一种“或”的关系。

上文对本申请实施例提供的方法进行了说明，下面对本申请实施例提供的装置进行说明。

图9是本申请实施例提供的基于逼近值评估图像视频质量的装置300的示意性框图。

获取单元310，用于获取待评价样本，该待评价样本包括待评价视频或待评价图像；

计算单元320，用于基于该待评价样本的参数，利用线上的第一模型计算逼近该待评价样本的主观真值的第一逼近值；

评估单元330，用于基于该第一逼近值评估该待评价视频或该待评价图像的质量。

在一些实施例中，该待评价样本的参数包括以下参数中的至少一项：网络模块的反馈参数，云游戏模块的设定参数以及编解码模块的计算参数。

在一些实施例中，该计算单元320基于该待评价样本的参数，利用线上的第一模型计算逼近该待评价样本的主观真值的第一逼近值之前，该评估单元330还用于：

基于该k个样本的参数，利用该第一模型计算该k个样本的逼近值；

基于利用该第二模型获取的该k个样本的逼近值和利用该第一模型计算得到的该k个样本的逼近值，对该第一模型进行评估；

针对该k个样本中每一个样本，若利用该第一模型计算的逼近值和利用该第二模型获取的逼近值之间的差值小于或等于第一预设阈值，则确定对该第一模型的评估结果为正向，否则确定对该第一模型的评估结果为负向。

基于该k个样本的主观真值和利用该第一模型计算得到的该k个样本的逼近值，对该第一模型进行评估；

针对该k个样本中每一个样本，若利用该第一模型计算的逼近值和主观真值之间的差值小于或等于第二预设阈值，则确定对该第一模型的评估结果为正向，否则确定对该第一模型的评估结果为负向。

在一些实施例中，该评估单元330还用于：

通过统计模块将该第一逼近值上报给该第二模型；

利用该第二模型获取该待评价样本的第二逼近值；

基于该第一逼近值和该第二逼近值，确定是否对该第一模块进行优化；

若该第一逼近值和该第二逼近值之间的差值大于第三预设阈值，则利用该待评价样本的参数和该第二逼近值对该第一模型进行优化；若该第一逼近值和该第二逼近值之间的差值小于或等于该第三预设阈值，则确定不需要对该第一模块进行优化。

在一些实施例中，该评估单元330基于该第一逼近值和该第二逼近值，确定是否对该第一模块进行优化之前，该评估单元330还用于：

获取该待评价样本的主观真实值；

若该第二逼近值和该待评价样本的主观真实值之间的差值大于第四预设阈值，则利用该待评价样本和该待评价样本的主观真实值，优化该第二模型。

在一些实施例中，该第一模型包括多个场景对应的多个第一子模型，该第二模型包括该多个场景对应的多个第二子模型，该多个第一子模型分别为基于该多个第二子模型得到的模型，该多个场景包括该待评价样本所在的第一场景；其中，计算单元320具体用于：

确定该第一场景对应的第一子模型；

基于该待评价样本的参数，利用该第一场景对应的第一子模型，计算该第一逼近值。

图10是本申请实施例提供的第一模型的训练装置400的示意性框图。

如图10所示，该装置400可包括：

第一获取单元410，用于获取k个样本，该k个样本的主观真值以主观打分的方式获取；

第一训练单元420，用于以该k个样本和该k个样本的主观真值作为训练集，得到第二模型；

第二获取单元430，用于以该k个样本作为输入，利用该第二模型获取该k个样本的逼近主观真值的逼近值；

第二训练单元440，用于利用该k个样本的逼近值为参考，对该k个样本的参数进行拟合以得到该第一模型。

应理解，装置实施例与方法实施例可以相互对应，类似的描述可以参照方法实施例。为避免重复，此处不再赘述。具体地，该装置300可以对应于执行本申请实施例的方法100中的相应主体，并且该装置300中的各个单元分别为了实现方法100中的相应流程，类似的，装置400可对应于执行本申请实施例的方法200中的相应主体，并且该装置400中的单元可用于实现方法200中的流程，为了简洁，在此不再赘述。

还应当理解，本申请实施例涉及的视频处理装置中的各个单元可以分别或全部合并为一个或若干个另外的单元来构成，或者其中的某个(些)单元还可以再拆分为功能上更小的多个单元来构成，这可以实现同样的操作，而不影响本申请的实施例的技术效果的实现。上述单元是基于逻辑功能划分的，在实际应用中，一个单元的功能也可以由多个单元来实现，或者多个单元的功能由一个单元实现。在本申请的其它实施例中，该装置300或该装置400也可以包括其它单元，在实际应用中，这些功能也可以由其它单元协助实现，并且可以由多个单元协作实现。根据本申请的另一个实施例，可以通过在包括例如中央处理单元(CPU)、随机存取存储介质(RAM)、只读存储介质(ROM)等处理元件和存储元件的通用计算机的通用计算设备上运行能够执行相应方法所涉及的各步骤的计算机程序(包括程序代码)，来构造本申请实施例涉及的装置300或该装置400，以及来实现本申请实施例提供的基于逼近值评估图像视频质量的方法或第一模型的训练方法。计算机程序可以记载于例如计算机可读存储介质上，并通过计算机可读存储介质装载于电子设备中，并在其中运行，来实现本申请实施例的相应方法。

换言之，上文涉及的单元可以通过硬件形式实现，也可以通过软件形式的指令实现，还可以通过软硬件结合的形式实现。具体地，本申请实施例中的方法实施例的各步骤可以通过处理器中的硬件的集成逻辑电路和/或软件形式的指令完成，结合本申请实施例公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件组合执行完成。可选地，软件可以位于随机存储器，闪存、只读存储器、可编程只读存储器、电可擦写可编程存储器、寄存器等本领域的成熟的存储介质中。该存储介质位于存储器，处理器读取存储器中的信息，结合其硬件完成上述方法实施例中的步骤。

图11是本申请实施例提供的电子设备500的示意结构图。

如图11所示，该电子设备500至少包括处理器510以及计算机可读存储介质520。其中，处理器510以及计算机可读存储介质520可通过总线或者其它方式连接。计算机可读存储介质520用于存储计算机程序521，计算机程序521包括计算机指令，处理器510用于执行计算机可读存储介质520存储的计算机指令。处理器510是电子设备500的计算核心以及控制核心，其适于实现一条或多条计算机指令，具体适于加载并执行一条或多条计算机指令从而实现相应方法流程或相应功能。

作为示例，处理器510也可称为中央处理器(CentralProcessingUnit，CPU)。处理器510可以包括但不限于：通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等等。

作为示例，计算机可读存储介质520可以是高速RAM存储器，也可以是非不稳定的存储器(Non-VolatileMemory)，例如至少一个磁盘存储器；可选的，还可以是至少一个位于远离前述处理器510的计算机可读存储介质。具体而言，计算机可读存储介质520包括但不限于：易失性存储器和/或非易失性存储器。其中，非易失性存储器可以是只读存储器(Read-Only Memory，ROM)、可编程只读存储器(Programmable ROM，PROM)、可擦除可编程只读存储器(Erasable PROM，EPROM)、电可擦除可编程只读存储器(Electrically EPROM，EEPROM)或闪存。易失性存储器可以是随机存取存储器(Random Access Memory，RAM)，其用作外部高速缓存。通过示例性但不是限制性说明，许多形式的RAM可用，例如静态随机存取存储器(Static RAM，SRAM)、动态随机存取存储器(Dynamic RAM，DRAM)、同步动态随机存取存储器(Synchronous DRAM，SDRAM)、双倍数据速率同步动态随机存取存储器(Double DataRate SDRAM，DDR SDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM，ESDRAM)、同步连接动态随机存取存储器(synch link DRAM，SLDRAM)和直接内存总线随机存取存储器(Direct Rambus RAM，DR RAM)。

在一种实现方式中，该电子设备500可以是图9所示的基于逼近值评估图像视频质量的装置300；该计算机可读存储介质520中存储有计算机指令；由处理器510加载并执行计算机可读存储介质520中存放的计算机指令，以实现图3所示方法实施例中的相应步骤；具体实现中，计算机可读存储介质520中的计算机指令由处理器510加载并执行相应步骤，为避免重复，此处不再赘述。

在一种实现方式中，该电子设备500可以是图10所示的第一模型的训练装置400；该计算机可读存储介质520中存储有计算机指令；由处理器510加载并执行计算机可读存储介质520中存放的计算机指令，以实现图8所示方法实施例中的相应步骤；具体实现中，计算机可读存储介质520中的计算机指令由处理器510加载并执行相应步骤，为避免重复，此处不再赘述。

根据本申请的另一方面，本申请实施例还提供了一种计算机可读存储介质(Memory)，计算机可读存储介质是电子设备500中的记忆设备，用于存放程序和数据。例如，计算机可读存储介质520。可以理解的是，此处的计算机可读存储介质520既可以包括电子设备500中的内置存储介质，当然也可以包括电子设备500所支持的扩展存储介质。计算机可读存储介质提供存储空间，该存储空间存储了电子设备500的操作系统。并且，在该存储空间中还存放了适于被处理器510加载并执行的一条或多条的计算机指令，这些计算机指令可以是一个或多个的计算机程序521(包括程序代码)。

根据本申请的另一方面，提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。例如，计算机程序521。此时，电子设备500可以是计算机，处理器510从计算机可读存储介质520读取该计算机指令，处理器510执行该计算机指令，使得该计算机执行上述各种可选方式中提供的基于逼近值评估图像视频质量的方法或第一模型的训练方法。

换言之，当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。该计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行该计算机程序指令时，全部或部分地运行本申请实施例的流程或实现本申请实施例的功能。该计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。该计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质进行传输，例如，该计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(digital subscriber line，DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元以及流程步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

最后需要说明的是，以上所述，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应所述以权利要求的保护范围为准。

Claims

1.一种基于逼近值评估图像视频质量的方法，其特征在于，包括：

获取待评价样本，所述待评价样本包括待评价视频或待评价图像；

基于所述待评价样本的参数，利用线上的第一模型计算逼近所述待评价样本的主观真值的第一逼近值；

其中，所述第一模型为基于离线的第二模型得到的模型，所述第二模型为以k个样本和所述k个样本的主观真值作为训练集得到的模型，所述k个样本的主观真值以主观打分的方式获取，所述第一模型为利用所述第二模型获取的所述k个样本的逼近值为参考，对所述k个样本的参数进行拟合得到的模型，k＞0；

基于所述第一逼近值评估所述待评价视频或所述待评价图像的质量。

2.根据权利要求1所述的方法，其特征在于，所述待评价样本的参数包括以下参数中的至少一项：网络模块的反馈参数，云游戏模块的设定参数以及编解码模块的计算参数。

3.根据权利要求1所述的方法，其特征在于，所述基于所述待评价样本的参数，利用线上的第一模型计算逼近所述待评价样本的主观真值的第一逼近值之前，所述方法还包括：

基于所述k个样本的参数，利用所述第一模型计算所述k个样本的逼近值；

基于利用所述第二模型获取的所述k个样本的逼近值和利用所述第一模型计算得到的所述k个样本的逼近值，对所述第一模型进行评估；

针对所述k个样本中每一个样本，若利用所述第一模型计算的逼近值和利用所述第二模型获取的逼近值之间的差值小于或等于第一预设阈值，则确定对所述第一模型的评估结果为正向，否则确定对所述第一模型的评估结果为负向。

4.根据权利要求1所述的方法，其特征在于，所述基于所述待评价样本的参数，利用线上的第一模型计算逼近所述待评价样本的主观真值的第一逼近值之前，所述方法还包括：

基于所述k个样本的主观真值和利用所述第一模型计算得到的所述k个样本的逼近值，对所述第一模型进行评估；

针对所述k个样本中每一个样本，若利用所述第一模型计算的逼近值和主观真值之间的差值小于或等于第二预设阈值，则确定对所述第一模型的评估结果为正向，否则确定对所述第一模型的评估结果为负向。

5.根据权利要求3或4所述的方法，其特征在于，所述方法还包括：

若对所述第一模型的评估结果为正向，则将所述第一模型集成至服务系统；若对所述第一模型的评估结果为负向，则重新拟合所述第一模型，直至对所述第一模型的评估结果为正向。

6.根据权利要求1所述的方法，其特征在于，所述方法还包括：

通过统计模块将所述第一逼近值上报给所述第二模型；

利用所述第二模型获取所述待评价样本的第二逼近值；

基于所述第一逼近值和所述第二逼近值，确定是否对所述第一模块进行优化；

若所述第一逼近值和所述第二逼近值之间的差值大于第三预设阈值，则利用所述待评价样本的参数和所述第二逼近值对所述第一模型进行优化；若所述第一逼近值和所述第二逼近值之间的差值小于或等于所述第三预设阈值，则确定不需要对所述第一模块进行优化。

7.根据权利要求6所述的方法，其特征在于，所述基于所述第一逼近值和所述第二逼近值，确定是否对所述第一模块进行优化之前，所述方法还包括：

获取所述待评价样本的主观真实值；

若所述第二逼近值和所述待评价样本的主观真实值之间的差值大于第四预设阈值，则利用所述待评价样本和所述待评价样本的主观真实值，优化所述第二模型。

8.根据权利要求1所述的方法，其特征在于，所述第一模型包括多个场景对应的多个第一子模型，所述第二模型包括所述多个场景对应的多个第二子模型，所述多个第一子模型分别为基于所述多个第二子模型得到的模型，所述多个场景包括所述待评价样本所在的第一场景；

其中，所述基于所述待评价样本的参数，利用线上的第一模型计算逼近所述待评价样本的主观真值的第一逼近值，包括：

确定所述第一场景对应的第一子模型；

基于所述待评价样本的参数，利用所述第一场景对应的第一子模型，计算所述第一逼近值。

9.根据权利要求8所述的方法，其特征在于，所述多个场景包括用于播放所述待评价视频或所述待评价图像的设备的类型。

10.根据权利要求1～9任一项所述的方法，其特征在于，所述第一模型为半参考模型或无参考模型，所述第二模型为全参考模型或无参考模型，所述半参考模型指参考压缩前的图像帧中的部分参数和压缩后的图像帧得到的模型，所述无参考模型指仅参考压缩后的图像帧得到的模型，所述全参考模型指参考压缩前的图像帧和压缩后的图像帧得到的模型。

11.一种基于逼近值评估图像视频质量的装置，其特征在于，包括：

获取单元，用于获取待评价样本，所述待评价样本包括待评价视频或待评价图像；

计算单元，用于基于所述待评价样本的参数，利用线上的第一模型计算逼近所述待评价样本的主观真值的第一逼近值；

评估单元，用于基于所述第一逼近值评估所述待评价视频或所述待评价图像的质量。

12.一种第一模型的训练方法，其特征在于，包括：

获取k个样本，所述k个样本的主观真值以主观打分的方式获取；

以所述k个样本和所述k个样本的主观真值作为训练集，得到第二模型；

以所述k个样本作为输入，利用所述第二模型获取所述k个样本的逼近主观真值的逼近值；

利用所述k个样本的逼近值为参考，对所述k个样本的参数进行拟合以得到所述第一模型。

13.一种第一模型的训练装置，其特征在于，包括：

第一获取单元，用于获取k个样本，所述k个样本的主观真值以主观打分的方式获取；

第一训练单元，用于以所述k个样本和所述k个样本的主观真值作为训练集，得到第二模型；

第二获取单元，用于以所述k个样本作为输入，利用所述第二模型获取所述k个样本的逼近主观真值的逼近值；

第二训练单元，用于利用所述k个样本的逼近值为参考，对所述k个样本的参数进行拟合以得到所述第一模型。

14.一种电子设备，其特征在于，包括：

处理器，适于执行计算机程序；

计算机可读存储介质，所述计算机可读存储介质中存储有计算机程序，所述计算机程序被所述处理器执行时，实现如权利要求1至10中任一项所述的基于逼近值评估图像视频质量的方法或如权利要求12所述的第一模型的训练方法。

15.一种计算机可读存储介质，其特征在于，用于存储计算机程序，所述计算机程序使得计算机执行如权利要求1至10中任一项所述的基于逼近值评估图像视频质量的方法或如权利要求12所述的第一模型的训练方法。