CN114630111B

CN114630111B - 一种基于编码信息的无参考压缩视频质量评估方法

Info

Publication number: CN114630111B
Application number: CN202210526286.1A
Authority: CN
Inventors: 朱树元; 胡术明
Original assignee: University of Electronic Science and Technology of China
Current assignee: University of Electronic Science and Technology of China
Priority date: 2022-05-13
Filing date: 2022-05-13
Publication date: 2022-10-14
Anticipated expiration: 2042-05-13
Also published as: CN114630111A

Abstract

本发明属于无参考视频质量评估领域，具体提供一种基于编码信息的无参考压缩视频质量评估方法，实现在不解码的情况下以更低的时间复杂度获取与人眼主观感受更一致的评估结果。本发明首先提取HEVC码流中与质量相关的特征：编码树划分深度、运动矢量幅值、量化参数值以及跳过模式占比，并计算得到多个帧级特征值；然后利用邻近帧最小值池化与加权池化的结果加权得到池化后帧级特征值，再对池化后帧级特征值进行平均池化，得到视频级编码特征；最后通过GBRT回归的无参考压缩视频质量评估模型得到视觉质量预测分数。综上，本发明实现了在不解码情况下的视频质量评估，且以更低的时间复杂度获取与人眼主观感受更一致的评估结果。

Description

一种基于编码信息的无参考压缩视频质量评估方法

技术领域

本发明属于无参考视频质量评估领域，具体提供一种利用高效视频编码(HighEfficiency Video Coding，HEVC)码流编码信息的无参考压缩视频质量评估方法。

背景技术

伴随着互联网的快速发展，越来越多的短视频在网上快速传播；由于智能设备的普及，用户只需要一部手机就能够完成短视频的拍摄全程，为了能够实现对用户原创视频内容(User Generated Content，UGC)的视觉质量评估，无参考视频质量评估逐渐成为当今的研究热点。

视频在拍摄完成之后，受到硬件存储成本和网络带宽成本的限制，需要对视频进行编码，从而降低视频的文件大小。视频在编码过程中存在与其质量相关的编码信息，比如能够表征视频内容复杂程度的编码树划分深度、与视频质量相关度较高的量化参数值、进一步消除视频时间冗余的运动估计等；基于此，本发明提出一种基于编码信息的无参考压缩视频质量评估方法。

发明内容

本发明的目的在于提供一种基于编码信息的无参考压缩视频质量评估方法，用以实现在不解码情况下完成视频质量评估，以更低的时间复杂度获取与人眼主观感受更一致的评估结果。

为实现上述目的，本发明采用的技术方案为：

一种基于编码信息的无参考压缩视频质量评估方法，其特征在于，包括以下步骤：

步骤1. 编码特征提取；

步骤1.1 通过HM解码软件提取码流视频的编码信息，包含：编码树划分深度、运动矢量幅值、量化参数值、以及每个像素点的跳过模式标记；

步骤1.2针对码流视频的第k帧图像：计算该帧图像的编码树划分深度平均值作为帧级特征值

，计算该帧图像的编码树划分深度标准差作为帧级特征值

，计算该帧图像的运动矢量幅值平均值作为帧级特征值

，计算该帧图像的运动矢量幅值标准差作为帧级特征值

，计算该帧图像中零运动矢量像素点个数占像素点总数的比例作为帧级特征值

，计算该帧图像中采用跳过模式的像素点个数占像素点总数的比例并取其相反数作为帧级特征值

，取该帧图像的量化参数值的相反数作为帧级特征值

；

步骤2. 编码特征的时间池化；

步骤2.1针对码流视频的第k帧图像：对每一个帧级特征值分别进行池化处理，分别得到池化后帧级特征值

、

、

、

、

、

、

；

步骤2.2 针对码流视频的第k帧图像：计算该帧图像与前一帧图像的帧级特征值

差值作为帧级特征值

，计算该帧图像与前一帧图像的帧级特征值

差值作为帧级特征值

；

步骤2.3 针对码流视频：对步骤2.1得池化后帧级特征值与步骤2.2得帧级特征值的每一个帧级特征值分别进行平均池化，得到视频级编码特征

：

，

其中，

、

、

、

、

、

、

、

、

依次表示

、

、

、

、

、

、

、

、

的平均池化结果；

步骤3. 编码特征融合；

将视频级编码特征输入至预训练无参考压缩视频质量评估模型中，由无参考压缩视频质量评估模型输出视频质量预测分数。

进一步的，所述步骤3中，无参考压缩视频质量评估模型为GBRT回归树，GBRT回归树的个数设置为64、损失函数为平方误差；GBRT回归树的训练样本为带标签的码流视频，将训练样本经步骤1、步骤2提取得到视频级编码特征作为输入，GBRT回归树的训练目标为样本标签。

进一步的，所述步骤2.1中，池化处理具体为：对帧级特征值进行邻近帧最小值池化与Softmin加权池化，对两个池化结果进行线性加权得到池化后帧级特征值。

本发明的有益效果在于：

本发明提出了一种基于编码信息的无参考压缩视频质量评估方法，首先提取HEVC码流中与质量相关的特征：编码树划分深度、运动矢量幅值、量化参数值以及每个像素点的跳过模式标记，并计算得到多个帧级特征值；然后利用邻近帧最小值池化与加权池化的结果加权得到池化后帧级特征值，再对池化后帧级特征值进行平均池化，得到视频级编码特征；最后通过GBRT回归的无参考压缩视频质量评估模型得到视觉质量预测分数。综上所述，本发明提出了一种仅利用HEVC编码信息的无参考压缩视频质量评估模型，实现了在不解码情况下的视频质量评估，且以更低的时间复杂度获取与人眼主观感受更一致的评估结果。

附图说明

图1为本发明中基于编码信息的无参考压缩视频质量评估方法的流程图。

图2为本发明实施例与对比例在HEVC码流视频质量评估数据集下的性能表现箱型图。

具体实施方式

下面将结合附图对本发明中的技术方案进行进一步详细说明，以使本发明的目的与有益效果更加清楚。

本实施例提供一种基于高效视频编码(High Efficiency Video Coding，HEVC)码流编码信息的无参考压缩视频质量评估方法，其流程如图1所示，主要包括：编码特征提取、编码特征的时间池化、编码特征融合三个部分；具体步骤如下：

步骤1. 编码特征提取；

步骤1.1 通过HM解码软件提取HEVC码流视频的编码信息，包含：编码树划分深度、运动矢量幅值、量化参数值、以及每个像素点的跳过模式标记；

步骤1.2 针对码流视频的第k帧图像：

计算该帧图像的编码树划分深度平均值与编码树划分深度标准差，分别作为帧级特征值

与

，具体为：

其中，M与N表示码流视频的宽与高，

表示第k帧图像的像素点

的编码树划分深度；

计算该帧图像的运动矢量幅值平均值与运动矢量幅值标准差，分别作为帧级特征值

与

，具体为：

其中，

表示第k帧图像的像素点

的运动矢量幅值；

计算该帧图像中零运动矢量像素点个数占像素点总数的比例作为帧级特征值

；

计算该帧图像中采用跳过模式的像素点个数占像素点总数的比例，并取其相反数作为帧级特征值

，由于此比例与视频主观质量得分成负相关，故本发明中取其相反数作为特征；

取该帧图像的量化参数值的相反数作为帧级特征值

，由于量化参数值与视频主观质量得分成负相关，故本发明中取其相反数作为特征；

零运动矢量像素点为运动矢量幅值为零的像素点，采用跳过模式的像素点为跳过模式标记为1的像素点；

步骤2. 编码特征的时间池化；

步骤2.1针对码流视频的第k帧图像：

对每一个帧级特征值分别进行池化处理，分别得到池化后帧级特征值

、

、

、

、

、

、

；

所述池化处理的具体为：对帧级特征值进行邻近帧最小值池化与Softmin加权池化，再进行线性加权得到池化后帧级特征值；邻近帧最小值池化具体为：

，

Softmin加权池化具体为：

，

线性加权具体为：

，

其中，L表示邻近帧的范围，α表示预设权重，本实施例中：L=12、α=0.4；

表示帧级特征值，

表示邻近帧最小值池化结果，

表示Softmin加权池化结果，

表示池化后帧级特征值；

步骤2.2 针对码流视频的第k帧图像：

计算该帧图像与前一帧图像的帧级特征值

差值作为帧级特征值

，计算该帧图像与前一帧图像的帧级特征值

差值作为帧级特征值

，用于表征时间上的空间质量变化情况，具体为：

；

步骤2.3 针对码流视频：

对步骤2.1得池化后帧级特征值与步骤2.2得帧级特征值的每一个帧级特征值分别进行平均池化、即在时间维度上对每一个帧级特征值进行取平均操作，得到视频级编码特征

：

，

其中，

、

、

、

、

、

、

、

、

依次表示

、

、

、

、

、

、

、

、

的平均池化结果；

步骤3. 编码特征融合；

将视频级编码特征输入至预训练无参考压缩视频质量评估模型中，由无参考压缩视频质量评估模型输出视频质量预测分数；

所述无参考压缩视频质量评估模型为GBRT回归树，GBRT回归树的个数设置为64、损失函数为平方误差；GBRT回归树的训练样本为带标签的码流视频，将训练样本经步骤1、步骤2提取样本的视频级编码特征作为输入，GBRT回归树的训练目标为样本标签。

本实施例还提供两个对比例，其中，对比例1：国际电信联盟组织提出的利用编码信息的视频质量评估方法ITU-P1204.3，对比例2：使用多特征融合的质量评估方法TLVQM；本实施例与对比例在相同测试集上进行测试，测试采用1000次随机划分，采用SROCC、PLCC、KROCC、RMSE、单视频平均耗时作为性能指标，测试结果如表1所示，进一步绘制性能表现箱型图如图2所示；

表1

由表1与图2可见，本发明提出基于编码信息的视频质量评估方法优于对比例1与对比例2，表面利用编码信息进行视频质量评估的有效性和优越性。

综上所述，本发明提出的基于编码信息的视频质量评估方法能够在不解码的情况下、以更低的时间复杂度获取与人眼主观感受更一致的评估结果。

以上所述，仅为本发明的具体实施方式，本说明书中所公开的任一特征，除非特别叙述，均可被其他等效或具有类似目的的替代特征加以替换；所公开的所有特征、或所有方法或过程中的步骤，除了互相排斥的特征和/或步骤以外，均可以任何方式组合。

Claims

1.一种基于编码信息的无参考压缩视频质量评估方法，其特征在于，包括以下步骤：

步骤1. 编码特征提取；

步骤1.2 针对码流视频的第k帧图像：计算该帧图像的编码树划分深度平均值作为帧级特征值

，计算该帧图像的编码树划分深度标准差作为帧级特征值

，计算该帧图像的运动矢量幅值平均值作为帧级特征值

，计算该帧图像的运动矢量幅值标准差作为帧级特征值

，取该帧图像的量化参数值的相反数作为帧级特征值

；

步骤2. 编码特征的时间池化；

、

、

、

、

、

、

；所述池化处理具体为：对帧级特征值进行邻近帧最小值池化与Softmin加权池化，对两个池化结果进行线性加权得到池化后帧级特征值；

差值作为帧级特征值

，计算该帧图像与前一帧图像的帧级特征值

差值作为帧级特征值

；

步骤2.3 针对码流视频：对步骤2.1的池化后帧级特征值与步骤2.2的帧级特征值的每一个帧级特征值分别进行平均池化，得到视频级编码特征

：

，

其中，

、

、

、

、

、

、

、

、

依次表示

、

、

、

、

、

、

、

、

的平均池化结果；

步骤3. 编码特征融合；

2.按权利要求1所述基于编码信息的无参考压缩视频质量评估方法，其特征在于，所述步骤3中，无参考压缩视频质量评估模型为GBRT回归树，GBRT回归树的个数设置为64、损失函数为平方误差；GBRT回归树的训练样本为带标签的码流视频，将训练样本经步骤1、步骤2提取得到视频级编码特征作为输入，GBRT回归树的训练目标为样本标签。