WO2014114098A1

WO2014114098A1 - 终端侧时间域视频质量评价方法及装置

Info

Publication number: WO2014114098A1
Application number: PCT/CN2013/083650
Authority: WO
Inventors: 吴宝春; 魏芳; 许佳琦
Original assignee: 中兴通讯股份有限公司
Priority date: 2013-01-23
Filing date: 2013-09-17
Publication date: 2014-07-31
Also published as: US9836832B2; EP2958322A1; EP2958322B1; WO2014114098A9; CN103945214B; CN103945214A; US20150348251A1; EP2958322A4

Abstract

本发明公开了终端侧时间域视频质量评价方法及装置，其中，该方法包括：计算各个视频帧的显著运动面积比例，根据显著运动面积比例将所有视频帧分为绝对普通帧和疑似失真帧；对疑似失真帧进行冻结帧检测、场景转换帧检测、抖动帧检测、以及鬼影帧检测；根据场景转换帧检测结果对视频进行场景分割，计算各个场景的场景信息权值等，确定终端侧时间域视频质量。本发明解决了现有技术中终端侧时间域无参考技术中存在的评测误差较大、忽略运动性、指标单一的问题，提高了评价结果与主观感受的接近程度，扩展了视频时间域失真的评价体系，降低了误判发生的概率。

Description

终端侧时间域视频质量评价方法及装置技术领域本发明涉及视频客观质量评价技术领域，特别是涉及一种终端侧时间域视频质量评价方法及装置。背景技术在现有技术中，视频的客观质量评价可以分别在网络侧和终端侧实现，其中终端侧评价是在用户终端解码视频后进行的。虽然在效率和反馈能力上不及网络侧评价，但它针对用户最终观看到的视频进行评价，可以充分体现从服务到网络、最终到终端接收、以及视频解码对视频质量的影响，可以更好地反映用户对视频业务的主观感受。视频的时间域质量是指其仅存在于视频帧间的质量因素，也就是整帧丢失对视频带来的影响。目前视频空间域质量已经有了大量成熟的研究成果，而时间域质量的相关评价方法则相对较少。目前，视频在时间域上的客观质量评价仍主要停留在全参考评价上，通过将被测视频与原始视频逐帧对齐的方式辨别是否发生了帧重复、帧抖动等现象，但这方法完全不能适应当今的视频业务，例如，流媒体和视频会话的实时性以及不可溯源性。这些业务需要将视频客观质量评价通过无参考的方式实现，即抛开原始视频，仅利用被测视频的相关特征来对实时视频进行评价。虽然无参考评价相比全参考评价会牺牲一定的准确度，但它可以很好地完成实时性的要求，同时也不需要获取原始视频。现今已有的视频终端侧时间域无参考质量评价方法相对较少，主要通过计算帧间差异实现，包括计算帧间亮度差、均方误差等方法，将结果通过阈值判断是否为丢失帧。这些方法往往误差较大，没有考虑到视频运动性对时间域质量的影响，对于场景转换帧的区别度很低，并且只考虑了 "冻结 "这一种时间域质量指标。发明内容本发明实施例提供一种终端侧时间域视频质量评价方法及装置，以解决现有技术中终端侧时间域无参考技术中存在的评测误差较大、忽略运动性、指标单一的问题。本发明实施例提供一种终端侧时间域视频质量评价方法，包括：计算各个视频帧的显著运动面积比例，其中，显著运动面积比例是指：相邻两视频帧之间发生显著变化的面积占一个视频帧面积的比例；根据显著运动面积比例将所有视频帧分为绝对普通帧和疑似失真帧；对疑似失真帧进行冻结帧检测、场景转换帧检测、抖动帧检测、以及鬼影帧检测；根据场景转换帧检测结果对视频进行场景分割，计算各个场景的场景信息权值，并根据冻结帧检测结果、抖动帧检测结果、以及鬼影帧检测结果计算失真系数，根据显著运动面积比例、场景信息权值、以及失真系数确定终端侧时间域视频质量。优选地，计算各个视频帧的显著运动面积比例包括：根据播放进度将当前第 k视频帧解码到明亮度色度 YUV空间，获取亮度矩阵 Y_k; 如果确定当前第 k视频帧为视频的第一帧，则设当前第 k视频帧的前一帧为像素值全零帧，并执行步骤 13，否则，直接执行步骤 13; 步骤 13，对当前第 k视频帧的亮度矩阵 Y_k进行高斯滤波，并对滤波结果进行下采样；步骤 14，重复执行步骤 13 n-1次，得到含有 n个不同尺度的矩阵的高斯图像金字塔 PMD_k，其中，尺度表示当前矩阵已进行高斯滤波与下采样操作的次数，当尺度为 1时的矩阵为源矩阵 Y_k， n为尺度的总个数；步骤 15，对当前第 k视频帧和第 k-1视频帧的高斯图像金字塔 PMD_k和 PMDn在尺度 s上求矩阵中每个元素之差的绝对值，得到差异矩阵 M_k，_s，并根据各尺度上的差异矩阵组成差异金字塔 DPMD_k，其中，差异矩阵 M_k，_s中的为全零矩阵；步骤 16，对 DPMD_k中除尺度 1 以外的所有尺度上的差异矩阵进行双线性插值，将差异矩阵大小归一到与源矩阵 Y_k 相同，并对包括 Y_k在内的 DPMD_k插值后的 n个差异矩阵求平均得到归一差异矩阵 Z_k; 步骤 17，对 Z_k进行中值滤波去噪得到 Z_km，并设置阈值 θ，将中大于等于 Θ的元素赋值为 1，小于 Θ的元素赋值为 0，得到二值矩阵 BI_k; 步骤 18，对 BI_k求和后除以当前第 k视频帧的帧像素面积，得到当前第 k视频帧的显著运动面积比例。优选地，步骤 13包括：对当前第 k帧的亮度矩阵 Y_k做帧窗口大小为 3x3、均值为 0、标准差为 0.5的高斯滤波，并对对滤波结果进行 l/4^a下采样，其中， a为自然数。优选地，根据显著运动面积比例将所有视频帧分为绝对普通帧和疑似失真帧包括：步骤 21，在当前第 k视频帧的显著运动面积比例为 0的情况下，确定当前第 k视频帧为疑似冻结帧，其中， k>l _; 步骤 22，在当前第 k视频帧的显著运动面积比例大于前一视频帧的两倍且大于第一预定阈值、且其前一视频帧为非冻结帧的情况下，确定当前第 k视频帧为疑似场景转换帧；步骤 23，在当前第 k视频帧和第 k+1视频帧的显著运动面积比例相等的情况下，确定上述两视频帧为疑似抖动帧或疑似鬼影帧；步骤 24，在当前第 k视频帧的显著运动面积比例不符合步骤 21至 23的情况、且前一视频帧为非冻结帧的情况下，确定当前第 k视频帧为绝对普通帧。优选地，对疑似失真帧进行冻结帧检测包括：步骤 31，对尺度为 1 的差异矩阵中所有元素求和，若结果为 0，执行步骤 32，否则确定当前第 k视频帧为正常帧，并退出整个当前第 k视频帧的失真检测；步骤 32，若判断第 k-1视频帧为冻结帧，则确定当前第 k视频帧也为冻结帧，并退出整个当前第 k视频帧的失真检测，否则，执行步骤 33; 步骤 33，若判断第 k-1视频帧为幕帧，则确定当前第 k视频帧也为幕帧，并退出整个当前第 k视频帧的失真检测，否则，执行步骤 34; 步骤 34，计算当前第 k 视频帧的空间复杂度 O_s以及色彩复杂度 O_c; 步骤 35，计算当前第 k视频帧的幕系数 P=l-0.6O_s-0.4O_c+0.2b, 若 P大于等于第二预定阈值，则确定当前第 k视频帧为幕帧，不是冻结帧，否则，确定当前第 k视频帧为冻结帧，其中， b为二值型参数，当第 k-1 视频帧为场景转换帧或第 k-1视频帧和第 k-2视频帧的显著运动面积比例非 0且相等时， b=l，否则 b=0。优选地，对疑似失真帧进场景转换帧检测包括：步骤 41，在宽为 w、高为 h的二值矩阵 BI_k的中间划分出前景矩形区域 BI_k，_f，并确定 BI_k的其他区域为背景区域 BI_k，_b，计算 BI_k在 BI_k，_b中的元素总和与在 BI_k，_f中的元素总和之比 R_k，其中， BI_k，_f的高为 BI_k 的第 Lh/8+lj行到第【7h/8j行，宽为 BI_k的第 v/8+lj列到第【7w/8j列，上述符号" U"是指向下取整；步骤 42，以 BI_k的第 [h/2]行和第 [h/2]列为界，将 BI_k，_b划分为四个部分，并分别计算四个部分中数值为 1的元素个数所占该部分的比例，统计这四个比例中大于等于第三预定阈值的个数 N_1V; 步骤 43，若 R_k大于等于第四预定阈值且 N_1V大于等于第五预定阈值，则确定当前第 k视频帧为场景转换帧，否则，确定当前第 k视频帧为正常帧。优选地，对疑似失真帧进抖动帧检测、以及鬼影帧检测包括：步骤 51，若第 k-1 视频帧为渐变帧，则确定当前第 k视频帧也为渐变帧，退出整个当前第 k视频帧的失真检测，否则执行步骤 52; 步骤 52，若当前第 k视频帧的显著运动面积比例与第 k-1 视频帧相等，则当前第 k视频帧为渐变帧，并退出整个当前第 k视频帧的失真检测，否则执行步骤 53; 步骤 53，计算第 k-1视频帧和第 k+1视频帧亮度矩阵的差值矩阵，取其绝对值后将所有元素求和，若和为 0，则第 k+1视频帧为抖动帧，且第 k帧为正常帧，并退出整个当前第 k视频帧的失真检测，并执行步骤 54，否则，直接执行步骤 54；步骤 54，若当前第 k视频帧的显著运动面积比例大于等于第六预定阈值，则确定当前第 k视频帧为鬼影帧，且第 k+1帧为正常帧，否则确定第 k视频帧为正常帧。优选地，根据场景转换帧检测结果对视频进行场景分割，计算各个场景的场景信息权值包括：根据场景转换帧检测结果对视频进行场景分割，如果当前第 k视频为最近的场景转换帧之后的第一个绝对普通帧，则将当前第 k视频的空间复杂度、色彩复杂度、亮度均值以及显著运动面积比例进行求和，获取该场景内用于加权的场景信息权值。优选地，根据冻结帧检测结果、抖动帧检测结果、以及鬼影帧检测结果计算失真系数包括：根据公式 1计算失真系数 K;

公式 _{1 ;} 其中， F_&z、 _t、 F_gst分别为当前帧的冻结帧、抖动帧、鬼影帧标志位，上述三个标志位中有且仅有一项为 1，其他标志位均为 0， 1表示所评价的视频帧存在相应类型的失真， 0 表示所评价的视频帧不存在相应类型的失真， P_&z为冻结持续性系数， P_frz = n \og₂ (2 + t) ^ 上式中 _n为本次冻结的连续累计帧数， t为在此次冻结发生前第一预定时间内单次持续第二预定时间以上的冻结的次数，第二预定时间小于第一预定时间。优选地，根据显著运动面积比例、场景信息权值、以及失真系数确定终端侧时间域视频质量包括：根据公式 2计算终端侧时间域视频质量

Q = \ - m^A_q~ Expr K 公式 2. 其中， m为扩展系数， _q为发生失真的视频帧的前一个正常帧的显著运动面积比例， Expr为场景信息权值， K为失真系数。本发明实施例还提供了一种终端侧时间域视频质量评价装置，包括：计算模块，用于计算各个视频帧的显著运动面积比例，其中，显著运动面积比例是指：相邻两视频帧之间发生显著变化的面积占一个视频帧面积的比例；划分模块，设置为根据显著运动面积比例将所有视频帧分为绝对普通帧和疑似失真帧；检测模块，设置为对疑似失真帧进行冻结帧检测、场景转换帧检测、抖动帧检测、以及鬼影帧检测；评估模块，设置为根据场景转换帧检测结果对视频进行场景分割，计算各个场景的场景信息权值，并根据冻结帧检测结果、抖动帧检测结果、以及鬼影帧检测结果计算失真系数，根据显著运动面积比例、场景信息权值、以及失真系数确定终端侧时间域视频质量。优选地，计算模块包括：亮度矩阵获取子模块，设置为根据播放进度将当前第 k 视频帧解码到明亮度色度 YUV空间，获取亮度矩阵 Y_k; 设置子模块，设置为在确定当前第 k视频帧为视频的第一帧时，设当前第 k视频帧的前一帧为像素值全零帧，并调用滤波采样子模块，否则，直接调用滤波采样子模块；滤波采样子模块，设置为对当前第 k视频帧的亮度矩阵 Y_k进行高斯滤波，并对滤波结果进行下采样；高斯图像金字塔获取子模块，设置为重复调用滤波采样子模块 ti-1次，得到含有 n个不同尺度的矩阵的高斯图像金字塔 PMD_k，其中，尺度表示当前矩阵已进行高斯滤波与下采样操作的次数，当尺度为 1时的矩阵为源矩阵 Y_k， n为尺度的总个数；差异金字塔获取子模块，设置为对当前第 k视频帧和第 k-1视频帧的高斯图像金字塔 PMD_k和 PMDn 在尺度 s上求矩阵中每个元素之差的绝对值，得到差异矩阵 M_k，_s，并根据各尺度上的差异矩阵组成差异金字塔 DPMD_k，其中，差异矩阵 M_k，_s中的为全零矩阵；归一差异矩阵获取子模块，设置为对 DPMD_k中除尺度 1 以外的所有尺度上的差异矩阵进行双线性插值，将差异矩阵大小归一到与源矩阵 Y_k相同，并对包括 Y_k在内的 DPMD_k 插值后的 n个差异矩阵求平均得到归一差异矩阵 Z_k; 二值矩阵获取子模块，设置为对 Z_k进行中值滤波去噪得到 Z_km，并设置阈值 θ，将 Z_km中大于等于 Θ的元素赋值为 1，小于 Θ的元素赋值为 0，得到二值矩阵 BI_k; 显著运动面积比例获取子模块，设置为对 BI_k求和后除以当前第 k视频帧的帧像素面积，得到当前第 k视频帧的显著运动面积比例。优选地，滤波采样子模块设置为：对当前第 k帧的亮度矩阵 Y_k做帧窗口大小为

3 x3、均值为 0、标准差为 0.5的高斯滤波，并对对滤波结果进行 l/4^a下采样，其中， a 为自然数。优选地，划分模块包括：疑似冻结帧确定子模块，设置为在当前第 k视频帧的显著运动面积比例为 0的情况下，确定当前第 k视频帧为疑似冻结帧，其中， k> l _; 疑似场景转换帧确定子模块，设置为在当前第 k视频帧的显著运动面积比例大于前一视频帧的两倍且大于第一预定阈值、且其前一视频帧为非冻结帧的情况下，确定当前第 k 视频帧为疑似场景转换帧；疑似抖动帧和疑似鬼影帧确定子模块，设置为在当前第 k 视频帧和第 k+1视频帧的显著运动面积比例相等的情况下，确定上述两视频帧为疑似抖动帧或疑似鬼影帧；绝对普通帧确定子模块，设置为在当前第 k视频帧的显著运动面积比例不符合上述各子模块的情况、且前一视频帧为非冻结帧的情况下，确定当前第 k视频帧为绝对普通帧。优选地，检测模块包括：冻结帧检测模块，其中，冻结帧检测模块包括：求和子模块，设置为对尺度为 1的差异矩阵 Miu中所有元素求和，若结果为 0，调用第一判断子模块，否则确定当前第 k视频帧为正常帧，并退出整个当前第 k视频帧的失真检测；第一判断子模块，设置为在判断第 k-1视频帧为冻结帧时，则确定当前第 k视频帧也为冻结帧，并退出整个当前第 k视频帧的失真检测，否则，调用幕帧判断子模块；幕帧判断子模块，设置为在判断第 k-1视频帧为幕帧时，则确定当前第 k视频帧也为幕帧，并退出整个当前第 k视频帧的失真检测，否则，调用计算子模块；计算子模块，计算当前第 k视频帧的空间复杂度 O_s以及色彩复杂度 O_c; 冻结帧幕帧区分子模块，设置为计算当前第 k视频帧的幕系数 P=l-0.6O_s-0.4O。+0.2b，若 P大于等于第二预定阈值，则确定当前第 k视频帧为幕帧，不是冻结帧，否则，确定当前第 k视频帧为冻结帧，其中， b为二值型参数，当第 k-1视频帧为场景转换帧或第 k-1视频帧和第 k-2 视频帧的显著运动面积比例非 0且相等时， b=l，否则 b=0。优选地，检测模块包括：场景转换帧检测模块，其中，场景转换帧检测模块包括：前景矩形区域划分子模块，设置为在宽为 w、高为 h的二值矩阵 BI_k的中间划分出前景矩形区域 BI_k，_f，并确定 BI_k的其他区域为背景区域 BI_k，_b，计算 BI_k在 BI_k，_b中的元素总和与在 BI_k，_f中的元素总和之比 R_k，其中， BI_k，_f的高为 BI_k的第 Lh/8+lj行到第【7h/8J 行，宽为 BI_k的第 v/8+lj列到第【7W8j列，上述符号" U"是指向下取整；二值矩阵划分子模块，设置为以 BI_k的第 [h/2]行和第 [h/2]列为界，将 BI_k，_b划分为四个部分，并分别计算四个部分中数值为 1的元素个数所占该部分的比例，统计这四个比例中大于等于第三预定阈值的个数 N_1V; 场景转换帧判断子模块，设置为在 R_k大于第四预定阈值且 N_1V大于第五预定阈值时，则确定当前第 k视频帧为场景转换帧，否则，确定当前第 k 视频帧为正常帧。优选地，检测模块包括：抖动帧以及鬼影帧检测模块，其中，抖动帧以及鬼影帧检测模块包括：渐变帧第一确定子模块，设置为在第 k-1视频帧为渐变帧时，则确定当前第 k视频帧也为渐变帧，并退出整个当前第 k视频帧的失真检测，否则调用渐变帧第二确定子模块；渐变帧第二确定子模块，设置为在当前第 k视频帧的显著运动面积比例与第 k-1视频帧相等时，则确定当前第 k视频帧为渐变帧，并退出整个当前第 k视频帧的失真检测，否则调用抖动帧检测子模块；抖动帧检测子模块，设置为计算第 k-1视频帧和第 k+1视频帧亮度矩阵的差值矩阵，取其绝对值后将所有元素求和，若和为 0，则第 k+1视频帧为抖动帧，且第 k视频帧为正常帧，并退出整个当前第 k 视频帧的失真检测，否则，调用鬼影帧检测子模块；鬼影帧检测子模块，设置为在当前第 k视频帧的显著运动面积比例大于等于第六预定阈值时，则确定当前第 k视频帧为鬼影帧，且第 k+1视频帧为正常帧，否则，确定当前第 k视频帧为正常帧。优选地，评估模块包括：场景信息权值计算子模块，设置为根据场景转换帧检测结果对视频进行场景分割，如果当前第 k视频为最近的场景转换帧之后的第一个绝对普通帧，则将当前第 k视频的空间复杂度、色彩复杂度、亮度均值以及显著运动面积比例进行求和，获取该场景内用于加权的场景信息权值。优选地，评估模块包括：失真系数计算子模块，设置为根据公式 1计算失真系数

K;

^ ^0.071n(44 _/re -41.28)x ^ +0.29 ., +0.19 _g, 公式 _1; 其中， F_&z、 _t、 F_gst分别为当前帧的冻结帧、抖动帧、鬼影帧标志位，上述三个标志位中有且仅有一项为 1，其他标志位均为 0， 1表示所评价的视频帧存在相应类型的失真， 0 表示所评价的视频帧不存在相应类型的失真， P_&z为冻结持续性系数， ^_z -«xl g₂(2 + _; 上式中 _n为本次冻结的连续累计帧数， t为在此次冻结发生前第一预定时间内单次持续第二预定时间以上的冻结的次数，第二预定时间小于第一预定时间。优选地，评估模块包括：视频质量确定子模块，设置为根据公式 2计算终端侧时间域视频质量

Q = \-m^[A_q~ Expr K 公式 2. 其中， m为扩展系数， _q为发生失真的视频帧的前一个正常帧的显著运动面积比例， Expr为场景信息权值， K为失真系数。本发明实施例有益效果如下：通过引入了视频显著运动区域提取技术和视频场景转换检测技术，提取运动性等视频特征来降低评价误差，同时针对视频解码恢复策略对失真类型进行了扩展分类，解决了现有技术中终端侧时间域无参考技术中存在的评测误差较大、忽略运动性、指标单一的问题，与现有技术相比，突出了运动性以及视频内容对视频质量的影响，提高了评价结果与主观感受的接近程度，扩展了视频时间域失真的评价体系，降低了误判发生的概率。上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明实施例的技术手段，而可依照说明书的内容予以实施，并且为了让本发明实施例的上述和其它目的、特征和优点能够更明显易懂，以下特举本发明实施例的具体实施方式。附图说明通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本发明的限制。而且在整个附图中，用相同的参考符号表示相同的部件。在附图中：图 1是本发明实施例的终端侧时间域视频质量评价方法的流程图；图 2是本发明实施例的显著运动面积比例的示意图；图 3是本发明实施例的冻结失真的示意图；图 4是本发明实施例的抖动失真的示意图；图 5是本发明实施例的鬼影失真的示意图；图 6是本发明实施例的提取显著运动面积比例的流程图；图 7是本发明实施例的初步失真分析的流程图；图 8是本发明实施例的终端侧时间域视频质量评价装置的结构示意图；以及图 9是本发明实施例的终端侧时间域视频质量评价装置的优选结构示意图。具体实施方式下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。为了解决现有技术中终端侧时间域无参考技术中存在的评测误差较大、忽略运动性、指标单一的问题，本发明实施例提供了一种终端侧时间域无参考视频质量评价方法及装置，引入了视频显著运动区域提取技术和视频场景转换检测技术，提取运动性等视频特征来降低评价误差，同时针对视频解码恢复策略对失真类型进行了扩展分类。以下结合附图以及实施例，对本发明实施例进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不限定本发明。方法实施例根据本发明的实施例，提供了一种终端侧时间域视频质量评价方法，图 1是本发明实施例的终端侧时间域视频质量评价方法的流程图，如图 1所示，根据本发明实施例的终端侧时间域视频质量评价方法包括如下处理：步骤 101，计算各个视频帧的显著运动面积比例，其中，显著运动面积比例是指: 相邻两视频帧之间发生显著变化的面积占一个视频帧面积的比例；也就是说，在步骤 101中，需要计算视频帧间的亮度差异，上述亮度差异的计算引入了视频显著运动区域提取技术并针对应用进行优化，使用"显著运动面积比例"指标作为评价视频时间域质量的核心，即帧间发生人眼较敏感的运动部分所占整帧的面积比例。本发明实施例主要围绕这一技术指标对视频时间域质量进行评价，通过对该指标属性的分析来衡量运动性对视频质量的影响，提高了评价的准确性。此外，显著运动面积比例的计算引入高斯金字塔技术，增强了方法对于视频尺寸变化的适应性。利用基于中值滤波去噪的二值化阈值异常检测方法提取显著运动区域。计算显著运动区域占整帧的面积比例。优选的，在步骤 101中，计算各个视频帧的显著运动面积比例包括：步骤 1011，根据播放进度将当前第 k视频帧解码到明亮度色度 YUV空间，获取亮度矩阵 Y_k; 步骤 1012，如果确定当前第 k视频帧为视频的第一帧，则设当前第 k视频帧的前一帧为像素值全零帧，并执行步骤 1013，否则，直接执行步骤 1013; 步骤 1013，对当前第 k视频帧的亮度矩阵 Y_k进行高斯滤波，并对滤波结果进行下采样；优选的，在步骤 1013中：可以对当前第 k帧的亮度矩阵 Yk做帧窗口大小为 3x3、均值为 0、标准差为 0.5的高斯滤波，并对对滤波结果进行 l/4a下采样，其中， a为自然数。步骤 1014，重复执行步骤 13 n-l次，得到含有 n个不同尺度的矩阵的高斯图像金字塔 PMD_k，其中，尺度表示当前矩阵已进行高斯滤波与下采样操作的次数，当尺度为 1时的矩阵为源矩阵 Y_k， n为尺度的总个数，在本发明实施例中， n可以设置为 3-5; 步骤 1015，对当前第 k视频帧和第 k-1视频帧的高斯图像金字塔 PMD_k和 PMD^ 在尺度 s上求矩阵中每个元素之差的绝对值，得到差异矩阵 M_k，_s，并根据各尺度上的差异矩阵组成差异金字塔 DPMD_k，其中，差异矩阵 M_k，_s中的为全零矩阵；步骤 1016，对 DPMD_k中除尺度 1以外的所有尺度上的差异矩阵进行双线性插值，将差异矩阵大小归一到与源矩阵 Y_k相同，并对包括 Y_k在内的 DPMD_k插值后的 n个差异矩阵求平均得到归一差异矩阵 Z_k; 步骤 1017，对 Z_k进行中值滤波去噪得到 Z_km，并设置阈值 θ，将中大于等于 Θ的元素赋值为 1，小于 Θ的元素赋值为 0，得到二值矩阵 BI_k; 步骤 1018，对 BI_k求和后除以当前第 k视频帧的帧像素面积，得到当前第 k视频帧的显著运动面积比例。其中，高斯滤波和高斯图像金字塔能够保证获取相邻两视频帧之间发生显著变化的面积。步骤 102，根据显著运动面积比例将所有视频帧分为绝对普通帧和疑似失真帧；在步骤 102中，通过帧间差异初步分析将所有帧分为确定无失真的"绝对普通帧" 以及需要进行进一步检测的 "疑似失真帧"。优选的，步骤 102中包括如下处理：步骤 1021，在当前第 k视频帧的显著运动面积比例为 0的情况下，确定当前第 k 视频帧为疑似冻结帧，其中， k>l _; 步骤 1022，在当前第 k视频帧的显著运动面积比例大于前一视频帧的两倍且大于第一预定阈值（优选地，在本发明实施例中，上述第一预定阈值可以为 0.1，该第一阈值可以根据本领域技术人员的经验值确定）、且其前一视频帧为非冻结帧的情况下，确定当前第 k视频帧为疑似场景转换帧；步骤 1023，在当前第 k视频帧和第 k+1视频帧的显著运动面积比例相等的情况下，确定上述两视频帧为疑似抖动帧或疑似鬼影帧；步骤 1024，在当前第 k视频帧的显著运动面积比例不符合步骤 1021至 1023的情况、且前一视频帧为非冻结帧的情况下，确定当前第 k视频帧为绝对普通帧。步骤 103，对疑似失真帧进行冻结帧检测、场景转换帧检测、抖动帧检测、以及鬼影帧检测；在本发明实施例中，在数据分析时建立了视频时间域质量的三指标体系： "冻结"、 "鬼影 "和"抖动"。其中"鬼影"和"抖动"仅在视频图像组（Group of Picture,简称为 GOP) 中存在 B帧时可能出现。三种指标的检测均围绕当前帧及其附近帧的显著运动面积比例窗口进行分析。此外，在步骤 102和步骤 103中，使用了针对时间域失真两步分析检测法，第一步（步骤 102) 根据三种失真发生时显著运动面积比例的特点识别出视频中的疑似失真帧以及该帧的可能失真类型；第二步（步骤 103 ) 则只对疑似失真帧进行进一步检测分析。如此可以减少中间数据量，避免大量的重复检测，降低了算法的复杂度。在上述两步分析检测法的第二步中，引入了空间复杂度的计算，用来表示视频帧内容的细致程度。同时提出了"色彩复杂度"，用来表示视频帧内容的色彩丰富程度。此外，在两步分析检测法的第二步中，三个指标均利用临近帧的显著运动面积进行误判检测，防止将视频正常效果误判为失真。提出了两种误判可能类型，包括可能误判为冻结的 "幕帧 "和可能误判为鬼影的"渐变帧"。并且，在步骤 103 中还提出基于显著运动面积比例的分场景评价方法，利用显著运动面积比例的突变以及显著运动在帧背景部分的比例检测出场景转换帧。优选的，在步骤 103中，对疑似失真帧进行冻结帧检测是指：检测疑似失真帧是否为冻结帧，同时排除"幕帧（原始视频中的静止帧） "的干扰。优选的包括如下处理: 步骤 1031a，对尺度为 1的差异矩阵中所有元素求和，若结果为 0，执行步骤 1032a, 否则确定当前第 k视频帧为正常帧，并退出整个当前第 k视频帧的失真检测；步骤 1032a，若判断第 k-1视频帧为冻结帧，则确定当前第 k视频帧也为冻结帧，并退出整个当前第 k视频帧的失真检测，否则，执行步骤 1033a; 步骤 1033a，若判断第 k_l视频帧为幕帧，则确定当前第 k视频帧也为幕帧，并退出整个当前第 k视频帧的失真检测，否则，执行步骤 1034a; 步骤 1034a，计算当前第 k视频帧的空间复杂度 O_s以及色彩复杂度 O_c; 步骤 1035a，计算当前第 k视频帧的幕系数 P=l-0.6O_s-0.4O_c+0.2b，若 P大于等于第二预定阈值（优选地，在本发明实施例中，上述第二预定阈值可以为 0.5，该第二阈值可以根据本领域技术人员的经验值确定），则确定当前第 k视频帧为幕帧，不是冻结帧，否则，确定当前第 k视频帧为冻结帧，其中， b为二值型参数，当第 k-1视频帧为场景转换帧或第 k-1视频帧和第 k-2视频帧的显著运动面积比例非 0且相等时， b=l，否则 b=0。对疑似失真帧进场景转换帧检测是指：检测场景转换帧，以便后续以场景转换帧为边界准备计算场景信息权值。包括如下处理：步骤 1031b，在宽为 w、高为 h的二值矩阵 BI_k的中间划分出前景矩形区域 BI_k，_f，并确定 BI_k的其他区域为背景区域 BI_k，_b，计算 BI_k在 BI_k，_b中的元素总和与在 BI_k，_f中的元素总和之比 R_k，其中， BI_k，_f的高为 BI_k的第 Lh/8+lj行到第【7h/8j行，宽为 BI_k的第 Lw/8+lj列到第 L7w/8j列，上述符号' j"是指向下取整；步骤 1032b，以 BI_k的第 [h/2]行和第 [h/2]列为界，将 BI_k，_b划分为四个部分，并分别计算四个部分中数值为 1的元素个数所占该部分的比例，统计这四个比例中大于等于第三预定阈值的个数 N_1V (优选地，在本发明实施例中，上述第三预定阈值可以为 0.3，该第三阈值可以根据本领域技术人员的经验值确定）；步骤 1033b，若 R_k大于等于第四预定阈值且 N_1V大于等于第五预定阈值（优选地，在本发明实施例中，上述第四预定阈值可以为 0.3，上述第五预定阈值可以为 3，该第四、五阈值可以根据本领域技术人员的经验值确定），则确定当前第 k视频帧为场景转换帧，否则，退出对当前第 k视频帧的场景转换帧检测。对疑似失真帧进抖动帧检测、以及鬼影帧检测是指：检测疑似失真帧是否为鬼影帧或抖动帧，同时排除"渐变帧（原始视频中处于均勾变化中的帧） "的干扰。包括如下处理：步骤 1031c，若第 k-1视频帧为渐变帧，则确定当前第 k视频帧也为渐变帧，并退出整个当前第 k视频帧的失真检测，否则执行步骤 1032c; 步骤 1032c，若当前第 k视频帧的显著运动面积比例与第 k-1视频帧相等，则当前第 k视频帧为渐变帧，并退出整个当前第 k视频帧的失真检测，否则执行步骤 1033c; 步骤 1033c，计算第 k-1视频帧和第 k+1视频帧亮度矩阵的差值矩阵，取其绝对值后将所有元素求和，若和为 0，则第 k+1视频帧为抖动帧，且第 k帧为正常帧，并退出整个当前第 k视频帧的失真检测，并执行步骤 1034c，否则，直接执行步骤 1034c; 步骤 1034c，若当前第 k视频帧的显著运动面积比例大于等于第六预定阈值（优选地，在本发明实施例中，上述第六预定阈值可以为 0.03，该第六阈值可以根据本领域技术人员的经验值确定），则确定当前第 k视频帧为鬼影帧，且第 k+1视频帧为正常帧，否则确定当前第 k视频帧为正常帧。步骤 104，根据场景转换帧检测结果对视频进行场景分割，计算各个场景的场景信息权值，并根据冻结帧检测结果、抖动帧检测结果、以及鬼影帧检测结果计算失真系数，根据显著运动面积比例、场景信息权值、以及失真系数确定终端侧时间域视频质量。在步骤 104中，根据场景转换帧检测结果对视频进行场景分割，计算各个场景的场景信息权值包括：根据场景转换帧检测结果对视频进行场景分割，同时提供场景片段的运动性和内容空间、色彩丰富程度等信息，如果当前第 k视频为最近的场景转换帧之后的第一个绝对普通帧，则将当前第 k视频的空间复杂度、色彩复杂度、亮度均值以及显著运动面积比例进行求和，获取该场景内用于加权的场景信息权值。优选的，在步骤 104中，利用三个指标的主观实验结果得到各自的失真系数，作为评价总分的基础。其中对冻结的评价提出了冻结时长系数，衡量冻结失真中冻结持续时长的影响。在步骤 104中，根据冻结帧检测结果、抖动帧检测结果、以及鬼影帧检测结果计算失真系数包括：根据公式 1计算失真系数 K; ^ -0.071n(44 _/re -41.28)x ^ +0.29 ., +0.19 _gii 公式 _1; 其中， F_&z、 _t、 F_gst分别为当前帧的冻结帧、抖动帧、鬼影帧标志位，上述三个标志位中有且仅有一项为 1，其他标志位均为 0， 1表示所评价的视频帧存在相应类型的失真， 0 表示所评价的视频帧不存在相应类型的失真， P_&z为冻结持续性系数， ^_z -«xl g₂(2 + _; 上式中 _n为本次冻结的连续累计帧数， t为在此次冻结发生前第 —预定时间内单次持续第二预定时间以上的冻结的次数，第二预定时间小于第一预定时间。在步骤 104中，根据显著运动面积比例、场景信息权值、以及失真系数确定终端侧时间域视频质量包括：根据公式 2计算终端侧时间域视频质量

Q = \-m^A_q~ Expr K 公式 2. 其中， m为扩展系数，为发生失真的视频帧的前一个正常帧的显著运动面积比例， Expr为场景信息权值， K为失真系数。以下结合附图，对本发明上述实施例的技术方案进行详细的说明。首选需要计算作为帧间差异指标的显著运动面积比例。本发明实施例主要以运动性特征为基础，提出了符合包括实时应用在内的视频"显著运动面积比例"。显著运动面积比例是指相邻两帧之间发生显著变化部分的面积占整个帧面积的比例，优选的，图 2是本发明实施例的显著运动面积比例的示意图，为了对视频帧的时间域失真进行特征提取，并针对特征值进行计算分析，需要计算某个可以较好地表示两帧之间的差异，同时数据量又较小（维度较少）的指标。显著运动面积比例作为这样一种指标，需要通过一系列步骤提取出运动区域中的显著部分。如图 2所示，在二值差异图中，白色为显著运动部分，黑色为非显著运动部分。在得到当前帧以及前一帧的高斯图像金字塔之后，需要对二者逐像素求差得到差异金字塔，以适应不同分辨率下的视觉感受。对差异金字塔的进一步计算需要使其各尺度层恢复成原始的分辨率，得到归一差异矩阵。对归一差异矩阵进行异常检测，将结果求和并除以矩阵大小求出显著运动面积比例，这样就将原始亮度矩阵的大量数据浓缩为一个 0到 1的数字，从而最终得到显著运动面积比例。图 3是本发明实施例的冻结失真的示意图，图 4是本发明实施例的抖动失真的示意图，图 5是本发明实施例的鬼影失真的示意图，如图 3-5所示，本发明实施例中归纳的针对含有 B帧的视频的三种失真形式分别为冻结、抖动和鬼影。其中，冻结，即视频在进行缓冲或解码时，出现画面停顿的情况。其特征为某帧与前一帧完全没有差异。抖动，即在原本流畅的视频中出现画面瞬间倒退又恢复的情况。其特征为在发生抖动的连续三帧中，第一、二帧的差异与第二、三帧相同，且第二、三帧之间没有差异。仅在 GoP中有 B帧时可能出现。鬼影，即运动的物体突然轨迹模糊，甚至出现重影，造成时间的粘滞感的情况。其特征为某帧与前后两帧差异都相同，但前后两帧之间是有差异的。仅在 GoP中有 B帧时可能出现。根据以上失真特征映射在显著运动面积比例上的表现，通过初步分析将所有帧分为"绝对普通帧"以及需要进行进一步检测的 "疑似失真帧"。在第二次分析中则只对疑似失真帧进行处理，排除特殊情况的干扰，进一步确定失真类型。优选的，首先对疑似冻结的帧进行进一步检测。出现细微的可识别差异（如微光、风吹等）的帧不属于冻结帧，需要通过求这两帧亮度矩阵之差的绝对值总和来鉴别。当视频中本身就存在着某些静态的帧时，为了防止被误判为冻结帧，本发明实施例对该类帧中的典型情况取名为 "幕帧"，其主要包括一些节目 LOGO、标语或致谢等情况，具有细节信息少、颜色较单一且常由场景转换帧直接跳转或渐变而来的特点。随后，需要检测场景转换帧。场景转换不属于失真，但它标识了一个新场景的到来。场景转换帧之间的同一场景往往包含着相似的空间、色彩和运动性等信息，对场景相关的评价权值的计算有着重要作用。场景转换帧主要有两个特点，一是显著运动面积比例较高，且高出相邻帧很多；二是显著运动变化的部分分布在图像各个方位。根据以上特点计算，检测某帧是否为场景转换帧。最后，还需要对疑似鬼影 /抖动的帧进行进一步检测。抖动与鬼影虽然表现形式不同，但在显著运动面积比例的关系上十分相似：前者为当前帧与其前一帧的显著运动面积比例相同；后者为当前帧与其后一帧的显著运动面积比例相同。但抖动因为帧的重复而存在着 "隔帧冻结"的现象，而鬼影则没有。另外抖动帧和鬼影帧一般都是独立存在，其相邻帧一般是普通帧。当有连续的几帧出现类似于鬼影帧的情况时，则为"渐变帧"，须通过鬼影帧是否相邻存在来判断。此外，还需要计算场景信息权值，失真对视频的影响程度除了与瞬时运动量有关以外，还与当前画面的细致程度、色彩丰富度、亮度等内容信息紧密相关。由于在多场景视频中各个场景在这些信息上往往是不同的，因此需要对每个场景将以上信息汇总为"场景信息权值"，其值越高表示着视频内容越容易受到时间域失真的影响。综上所述，本发明实施例为了引入视频场景内容对评价的影响，本发明实施例利用显著运动面积比例进行场景转换检测，并针对场景内容计算场景信息权值，用于对评价得分进行加权，综合上述计算结果，确定视频质量。图 6是本发明实施例的提取显著运动面积比例的流程图，如图 6所示，包括如下处理：步骤 610，根据播放进度将当前帧解码到 YUV空间。步骤 620，若当前帧为第一帧，则设其前一帧为像素值全零帧。步骤 630，对当前第帧的亮度矩阵做窗口大小为 3x3、均值为 0、标准差为 0.5的高斯滤波，并对结果进行四分之一下采样。如此重复《-1次，得到含有 w个不同尺度矩阵的高斯图像金字塔（尺度 1的矩阵为源矩阵 )。尺度的总数 n设为 3~5，可根据解码后分辨率的增大而适当增大。步骤 640，对当前第 k帧和第 k-\帧的高斯图像金字塔 PA©_k和 PMDH在尺度 _S 上求矩阵中每个元素之差的绝对值，得到差异矩阵 M_k，_s 。其中 M，_s为全零矩阵。各尺度上的差异矩阵组成差异金字塔 DPMD_K。步骤 650，对！) PA©_k除尺度 1以外所有尺度上的差异矩阵进行双线性插值，将矩阵大小归一到与源矩阵 ¾相同。对包括 ¾在内的 Ι)ΡΜΖ\插值后的 w个矩阵求平均得到归一差异矩阵 Z_k。步骤 660，对 Z_k进行中值滤波去噪得到 Z_km，对其进行异常检测，即设阈值将 Z_km二值化，大于等于 Θ的元素赋值为 1，小于 Θ的元素赋值为 0，得到二值矩阵 BI_k 。图 7是本发明实施例的初步失真分析的流程图，如图 7所示，包括如下处理：步骤 710，若当前第帧（除整个视频第一帧以外）的显著运动面积比例为 0，则将该帧视为疑似冻结帧，并将该帧的 YUV数据、尺度 1上的差异矩阵 M_w以及第 H 帧和第 -2帧的显著运动面积比例送入冻结检测模块进行进一步检测。步骤 720，若当前第帧的显著运动面积比例出现阶跃现象，即该帧的显著运动面积比例大于前一帧的两倍且大于 0.1，且其前一帧为非冻结帧，则将该帧视为疑似场景转换帧，并将该帧以及前一帧的 YUV数据以及该帧的二值差异矩阵 B/_k送入场景转换检测模块进行进一步检测。步骤 730，若第帧和第 +1帧的显著运动面积比例相等，，则将这两帧视为疑似抖动 /鬼影帧，并将从第 k-1到第 +1帧的所有显著运动面积比例以及 YUV数据送入抖动 /鬼影检测模块进行进一步检测。步骤 740，若当前第帧的显著运动面积比例不符合步骤 710-730所述，且前一帧为非冻结帧，则该帧为普通帧。若该帧为最近的场景转换帧之后的第一个普通帧，则将该帧 YUV数据以及其显著运动面积比例送入场景权值计算模块。其中，冻结检测模块包括以下步骤：步骤 1，对 ^矩阵中所有元素求和，若结果为 0，则继续检测。否则说明第 k 帧为正常帧，并退出整个当前第 k视频帧的失真检测。步骤 2，若第 k- 帧为冻结帧，则判断第 k帧也为冻结帧，并退出整个当前第 k 视频帧的失真检测；若第 -1帧为幕帧（本身在原视频中就与前一帧相对静止的帧，判断方式见步骤 4)，则第帧也为幕帧，也即不是冻结帧，并退出整个第 k帧的失真检测。否则继续进行冻结检测。步骤 3，计算第 k帧的空间复杂度 O_s以及色彩复杂度 O_c。空间复杂度 O_s为对矩阵进行水平竖直两个方向上的 Sobel滤波后平方和开根号的结果，表征了该帧图像内容的丰富程度。色彩复杂度为帧内出现较多的颜色的面积占整帧面积的比例，所取颜色为按照帧图像转换成的索引图像按照 64档均勾量化的结果，如果比例值比较大，则说明颜色丰富程度较低。步骤 4，求得该帧的幕系数 P=l-0.6O_s_0.4 +0.26，其中 b为二值型参数，当第 k-l帧为场景转换帧或第 k-\帧和第 k-2帧的显著运动面积比例非 0且相等时 6取 1，否则取 0。若 P大于等于 0.5，则第帧为幕帧，也即不是冻结帧，并退出对第 k帧的检测；否则第帧为冻结帧。场景转换检测模块包括以下步骤：步骤 1，在宽为、高为的矩阵 B/_k的中间划出前景矩形区域 B/_k，_f，高为原矩阵的第 μ/8+lj行到第 ^/8j行，宽为原矩阵的第 v/8+lj列到第【7w/8j列。矩阵 B/_k的其他区域为背景区域 B/_k，_b。求出矩阵 B/_k在 B/_k，_b中的元素总和与在 B/_k，_f中的元素总和之比 ¾。以上" U"是指向下取整。步骤 2，以矩阵 B/_k的第 [A/2]行和第 [A/2]列为界，将背景区域矩阵 /^划分为四个部分，分别求出四个部分中数值为 1的元素个数所占该部分的比例，并统计这四个比例中大于等于 0.3的个数 N_1V。步骤 3，若 ?_k≥0.3且 N_1V≥3，则第帧为场景转换帧。否则为普通帧，也即不是场景转换帧，并退出对第 k帧的检测。抖动 /鬼影检测模块包括以下步骤：步骤 1，若第 -1帧为渐变帧（帧内所有像素值处于勾速升高或降低状态中的帧，检测方法见步骤 2)，则第帧也为渐变帧，并退出对第 k帧的检测，否则继续抖动 / 鬼影检测。步骤 2，若第帧的显著运动面积比例与第 -1帧相等，则第帧为渐变帧，并退出对第 k帧的检测，否则继续检测。步骤 3，计算第 k- 帧和第 +1帧亮度矩阵的差值矩阵，取其绝对值后将所有元素求和，若和为 0，则第 +1帧为抖动帧,并退出对第 k帧的检测，否则继续抖动 /鬼影检测。由于抖动虽与鬼影发生时连续三帧的显著运动面积比例特征相似，但实际发生抖动的是这连续三帧中的第三帧，因此这种情况下第^：+l帧才被称作"抖动帧"。步骤 4，若第帧的显著运动面积比例大于等于 0.03，则第帧为鬼影帧，且第 k+1帧为正常帧，否则确定第 k帧为正常帧。场景信息权值计算模块的计算过程为：如果当前帧为场景转换帧后的第一个普通帧，则将该帧的空间复杂度、色彩复杂度、亮度均值以及显著运动面积比例,求和后即可得到该场景内用于加权的场景信息权值。确定终端侧时间域视频质量的计算过程包括：建立评价模型即可将上述分析得到的失真情考评分。评分的模型主要由四个系数相乘得到，公式如下：

这四个系数分别为：

1、扩展系数 m: 作用为调节评分的范围，根据评分趋势的实际情况可在 2~5之间调整。

2、瞬时显著运动面积比例 Aq的开方值： Aq为发生失真的帧的前一个正常帧的显著运动面积比例。可以表示此次失真对当前时刻的影响程度：当前瞬时运动量越大，失真造成的影响也就越大。这里取开方值是为了降低 Aq对评分范围的影响。

3、场景信息权值 Expr: 由场景信息权值模块得到，两个场景转换帧之间的帧的场景信息权值是相同的。

4、失真系数 K: 与失真类型直接挂钩的系数，不同的失真类型对应一个相应的系数。其中冻结系数还包含冻结时长系数。公式如下： K = 0.07 \n(44P_frz - 4i .2S) x F_frz + 0.29F_jit + 0. i9F_gst 其中 F_fc、 ¾、 F_gst分别为当前帧的冻结、抖动、鬼影标志位。三个标志位中有且仅有一项为 1，该标志位表示所评价帧存在该类失真，其他标志位均为 0。式中的系数 0.07、 0.29和 0.19为借鉴的主观评价结果，其意义分别为在主观试验中单帧冻结、抖动和鬼影在大量测试视频中被观测者识别出的平均概率，可根据新的主观实验或实际需要做适当调整。其中， P_&z为冻结持续性系数，其计算公式为： = « ^x i。g₂ ^ ⁺ 其中 _n为本次冻结的连续累计帧数， t为在此次冻结发生前 300秒内单次持续 0.4秒以上的冻结的次数。需要说明的是，本发明实施例中场景转换检测的实现不局限于本发明实施例中上述提出的方式，在另一实施例中，可通过与镜头移动检测的相配合，来进行复杂场景切割。例如，可利用灰度显著性检测划分 ROI，根据 ROI的形状变化进行场景检测。此外，在本发明实施例中，还可根据评测精度要求选择部分参数的计算方法。例如空间复杂度可使用灰度信息熵、边缘能量等方法进行评测，色彩复杂度可使用色彩局部相关性等方法进行评测。综上所述，借助于本发明实施例的技术方案，通过引入了视频显著运动区域提取技术和视频场景转换检测技术，提取运动性等视频特征来降低评价误差，同时针对视频解码恢复策略对失真类型进行了扩展分类，解决了现有技术中终端侧时间域无参考技术中存在的评测误差较大、忽略运动性、指标单一的问题，与现有技术相比，突出了运动性以及视频内容对视频质量的影响，提高了评价结果与主观感受的接近程度，扩展了视频时间域失真的评价体系，降低了误判发生的概率。装置实施例根据本发明的实施例，提供了一种终端侧时间域视频质量评价装置，图 8是本发明实施例的终端侧时间域视频质量评价装置的结构示意图，如图 8所示，根据本发明实施例的终端侧时间域视频质量评价装置包括：计算模块 80、划分模块 82、检测模块 84、以及评估模块 86，以下对本发明实施例的各个模块进行详细的说明。计算模块 80，设置为计算各个视频帧的显著运动面积比例，其中，显著运动面积比例是指：相邻两视频帧之间发生显著变化的面积占一个视频帧面积的比例；计算模块 80包括：亮度矩阵获取子模块，设置为根据播放进度将当前第 k视频帧解码到明亮度色度 YUV空间，获取亮度矩阵 Y_k; 设置子模块，设置为在确定当前第 k视频帧为视频的第一帧时，设当前第 k视频帧的前一帧为像素值全零帧，并调用滤波采样子模块，否则，直接调用滤波采样子模块；滤波采样子模块，设置为对当前第 k视频帧的亮度矩阵 Y_k进行高斯滤波，并对滤波结果进行下采样；滤波采样子模块设置为：对当前第 k帧的亮度矩阵 Y_k做帧窗口大小为 3x3、均值为 0、标准差为 0.5的高斯滤波，并对对滤波结果进行 l/4^a下采样，其中， a为自然数。高斯图像金字塔获取子模块，设置为重复调用滤波采样子模块 _n-l次，得到含有 n个不同尺度的矩阵的高斯图像金字塔 PMD_k，其中，尺度表示当前矩阵已进行高斯滤波与下采样操作的次数，当尺度为 1时的矩阵为源矩阵 Y_k， n为尺度的总个数；差异金字塔获取子模块，设置为对当前第 k视频帧和第 k-1视频帧的高斯图像金字塔 PMD_k和 PMDn在尺度 s上求矩阵中每个元素之差的绝对值，得到差异矩阵 M_k，_s，并根据各尺度上的差异矩阵组成差异金字塔 DPMD_k，其中，差异矩阵 M_k，_s中的为全零矩阵；归一差异矩阵获取子模块，设置为对 DPMD_k中除尺度 1 以外的所有尺度上的差异矩阵进行双线性插值，将差异矩阵大小归一到与源矩阵 Y_k相同，并对包括 Y_k在内的 DPMD_k插值后的 n个差异矩阵求平均得到归一差异矩阵 Z_k; 二值矩阵获取子模块，设置为对 Z_k进行中值滤波去噪得到 Z_km，并设置阈值 θ，将 Z_km中大于等于 Θ的元素赋值为 1，小于 Θ的元素赋值为 0，得到二值矩阵 BI_k; 显著运动面积比例获取子模块，设置为对 BI_k求和后除以当前第 k视频帧的帧像素面积，得到当前第 k视频帧的显著运动面积比例。划分模块 82，设置为根据显著运动面积比例将所有视频帧分为绝对普通帧和疑似失真帧；划分模块 82包括- 疑似冻结帧确定子模块，设置为在当前第 k视频帧的显著运动面积比例为 0的情况下，确定当前第 k视频帧为疑似冻结帧，其中， k>l _; 疑似场景转换帧确定子模块，设置为在当前第 k视频帧的显著运动面积比例大于前一视频帧的两倍且大于第一预定阈值、且其前一视频帧为非冻结帧的情况下，确定当前第 k视频帧为疑似场景转换帧; 疑似抖动帧和疑似鬼影帧确定子模块，设置为在当前第 k视频帧和第 k+1视频帧的显著运动面积比例相等的情况下，确定上述两视频帧为疑似抖动帧或疑似鬼影帧；绝对普通帧确定子模块，设置为在当前第 k视频帧的显著运动面积比例不符合上述各子模块的情况、且前一视频帧为非冻结帧的情况下，确定当前第 k视频帧为绝对普通帧。检测模块 84，设置为对疑似失真帧进行冻结帧检测、场景转换帧检测、抖动帧检测、以及鬼影帧检测；检测模块 84包括：冻结帧检测模块 84，其中，冻结帧检测模块 84包括：求和子模块，设置为对尺度为 1的差异矩阵中所有元素求和，若结果为 0，调用第一判断子模块，否则确定当前第 k视频帧不是冻结帧，并结束冻结检测；第一判断子模块，设置为在判断第 k-1视频帧为冻结帧时，则确定当前第 k视频帧也为冻结帧，并退出整个当前第 k视频帧的失真检测，否则，调用幕帧判断子模块；幕帧判断子模块，设置为在判断第 k-1视频帧为幕帧时，则确定当前第 k视频帧也为幕帧，并退出整个当前第 k视频帧的失真检测，否则，调用计算子模块；计算子模块，计算当前第 k视频帧的空间复杂度 O_s以及色彩复杂度 O_c; 冻结帧幕帧区分子模块，设置为计算当前第 k 视频帧的幕系数 P=l-0.6O_s-0.4O_c+0.2b，若 P大于等于第二预定阈值，则确定当前第 k视频帧为幕帧，不是冻结帧，并退出整个当前第 k视频帧的失真检测，否则，确定当前第 k视频帧为冻结帧，其中， b为二值型参数，当第 k-1视频帧为场景转换帧或第 k-1视频帧和第 k-2视频帧的显著运动面积比例非 0且相等时， b=l，否则 b=0。检测模块 84包括：场景转换帧检测模块 84，其中，场景转换帧检测模块 84包括：前景矩形区域划分子模块，设置为在宽为 w、高为 h的二值矩阵 BI_k的中间划分出前景矩形区域 BI_k，_f，并确定 BI_k的其他区域为背景区域 BI_k，_b，计算 BI_k在 BI_k，_b中的元素总和与在 BI_k，_f中的元素总和之比 R_k，其中， BI_k，_f的高为 BI_k的第 Lh/8+lj行到第【7h/8J 行，宽为 BI_k的第 v/8+lj列到第【7 8j列，上述符号" U"是指向下取整；二值矩阵划分子模块，设置为以 BI_k的第 [h/2]行和第 [h/2]列为界，将 BI_k，_b划分为四个部分，并分别计算四个部分中数值为 1的元素个数所占该部分的比例，统计这四个比例中大于等于第三预定阈值的个数 N_1V; 场景转换帧判断子模块，设置为在 R_k大于第四预定阈值且 N_1V大于第五预定阈值时，则确定当前第 k视频帧为场景转换帧，否则，退出对当前第 k视频帧的场景转换帧检测。优选地，检测模块 84包括：抖动帧以及鬼影帧检测模块 84，其中，抖动帧以及鬼影帧检测模块 84包括:渐变帧第一确定子模块，设置为在第 k-1视频帧为渐变帧时，则确定当前第 k视频帧也为渐变帧，并退出对当前第 k视频帧的失真检测，否则调用渐变帧第二确定子模块；渐变帧第二确定子模块，设置为在当前第 k视频帧的显著运动面积比例与第 k-1视频帧相等时，则确定当前第 k视频帧为渐变帧，并退出对当前第 k视频帧的失真检测，否则调用抖动帧检测子模块；抖动帧检测子模块，设置为计算第 k-1视频帧和第 k+1视频帧亮度矩阵的差值矩阵，取其绝对值后将所有元素求和，若和为 0，则第 k+1视频帧为抖动帧，且第 k帧为正常帧，并退出对当前第 k视频帧的失真检测，否则，调用鬼影帧检测子模块；鬼影帧检测子模块，设置为在当前第 k 视频帧的显著运动面积比例大于等于第六预定阈值时，则确定当前第 k视频帧为鬼影帧，且第 k+1帧为正常帧，否则确定第 k帧为正常帧。评估模块 86，设置为根据场景转换帧检测结果对视频进行场景分割，计算各个场景的场景信息权值，并根据冻结帧检测结果、抖动帧检测结果、以及鬼影帧检测结果计算失真系数，根据显著运动面积比例、场景信息权值、以及失真系数确定终端侧时间域视频质量。评估模块 86包括：场景信息权值计算子模块，设置为根据场景转换帧检测结果对视频进行场景分割，如果当前第 k视频为最近的场景转换帧之后的第一个绝对普通帧，则将当前第 k视频的空间复杂度、色彩复杂度、亮度均值以及显著运动面积比例进行求和，获取该场景内用于加权的场景信息权值。评估模块 86包括：失真系数计算子模块，设置为根据公式 1计算失真系数 K;

^ ^ 0.071n(44^ - 41.28) x ^ + 0.29 ., + 0.19 _gii 公式 _{1 ;} 其中， F_&z、 _t、 F_gst分别为当前帧的冻结帧、抖动帧、鬼影帧标志位，上述三个标志位中有且仅有一项为 1，其他标志位均为 0， 1表示所评价的视频帧存在相应类型的失真， 0 表示所评价的视频帧不存在相应类型的失真， P_&z为冻结持续性系数， P_frz - n \og₂ (2 + t) ^ 上式中 _n为本次冻结的连续累计帧数， t为在此次冻结发生前第一预定时间内单次持续第二预定时间以上的冻结的次数，第二预定时间小于第一预定时间。评估模块 86包括：视频质量确定子模块，设置为根据公式 2计算终端侧时间域视频质量 Q;

Q

Expr x K 公式 2. 其中， m为扩展系数， _q为发生失真的视频帧的前一个正常帧的显著运动面积比例， Expr为场景信息权值， K为失真系数。需要说明的是，上述功能模块的划分只是本发明实施例的一个应用实例，在本发明实施例中，还可以采用其他的模块划分方法完成本发明实施例的技术方案。图 9是本发明实施例的终端侧时间域视频质量评价装置的优选结构示意图，如图 9所示，本发明实施例的装置包括以下相关模块：显著运动面积比例提取模块、初步失真分析模块、冻结检测模块、场景转换检测模块、鬼影 /抖动检测模块、场景信息权值计算模块和评价模块。其中，显著运动面积比例提取模块设置为计算作为帧间差异指标的显著运动面积比例。本发明实施例主要以运动性特征为基础，提出了符合包括实时应用在内视频的 "显著运动面积比例"。显著运动面积比例是指相邻两帧之间发生显著变化部分的面积占整个帧面积的比例，是本发明实施例提出的一种对视频实时运动性的一项评价指标。所述初步失真分析模块设置为将所有帧分为"绝对普通帧"以及需要进行进一步检测的"疑似失真帧"。所述冻结检测模块设置为对疑似冻结的帧进行进一步检测。出现细微的可识别差异（如微光、风吹等）的帧不属于冻结帧，需要通过求这两帧亮度矩阵之差的绝对值总和来鉴别。当视频中本身就存在着某些静态的帧时，为了防止被误判为冻结帧，本发明实施例对该类帧中的典型情况取名为 "幕帧"，其主要包括一些节目 LOGO、标语或致谢等情况，具有细节信息少、颜色较单一且常由场景转换帧直接跳转或渐变而来的特点。所述场景转换检测模块设置为检测场景转换帧。场景转换不属于失真，但它标识了一个新场景的到来。场景转换帧之间的同一场景往往包含着相似的空间、色彩和运动性等信息，对场景相关的评价权值的计算有着重要作用。场景转换帧主要有两个特点，一是显著运动面积比例较高，且高出相邻帧很多；二是显著运动变化的部分分布在图像各个方位。根据以上特点计算，检测某帧是否为场景转换帧。所述鬼影 /抖动检测模块设置为对疑似鬼影 /抖动的帧进行进一步检测。抖动与鬼影虽然表现形式不同，但在显著运动面积比例的关系上十分相似：前者为当前帧与其前一帧的显著运动面积比例相同；后者为当前帧与其后一帧的显著运动面积比例相同。但抖动因为帧的重复而存在着"隔帧冻结"的现象，而鬼影则没有。另外抖动帧和鬼影帧一般都是独立存在，其相邻帧一般是普通帧。当有连续的几帧出现类似于鬼影帧的情况时，则为"渐变帧"，须通过鬼影帧是否相邻存在来判断。所述场景信息权值计算模块设置为计算场景信息权值。失真对视频的影响程度除了与瞬时运动量有关以外，还与当前画面的细致程度、色彩丰富度、亮度等内容信息紧密相关。由于在多场景视频中各个场景在这些信息上往往是不同的，因此需要对每个场景将以上信息汇总为"场景信息权值"，其值越高表示着视频内容越容易受到时间域失真的影响。所述评价模块设置为计算视频帧的评价得分。本装置实施例中相关模块的详细内容可以参照上述方法实施例中的相关描述进行理解，在此不再赘述。需要说明的是，本发明实施例中场景转换检测的实现不局限于本发明实施例中上述提出的方式，在另一实施例中，可通过与镜头移动检测的相配合，来进行复杂场景切割。例如，可利用灰度显著性检测划分 ROI，根据 ROI的形状变化进行场景检测。此外，在本发明实施例中，还可根据评测精度要求选择部分参数的计算方法。例如空间复杂度可使用灰度信息熵、边缘能量等方法进行评测，色彩复杂度可使用色彩局部相关性等方法进行评测。综上所述，借助于本发明实施例的技术方案，通过引入了视频显著运动区域提取技术和视频场景转换检测技术，提取运动性等视频特征来降低评价误差，同时针对视频解码恢复策略对失真类型进行了扩展分类，解决了现有技术中终端侧时间域无参考技术中存在的评测误差较大、忽略运动性、指标单一的问题，与现有技术相比，突出了运动性以及视频内容对视频质量的影响，提高了评价结果与主观感受的接近程度，扩展了视频时间域失真的评价体系，降低了误判发生的概率。在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述，构造这类系统所要求的结构是显而易见的。此外，本发明实施例也不针对任何特定编程语言。应当明白，可以利用各种编程语言实现在此描述的本发明实施例的内容，并且上面对特定语言所做的描述是为了披露本发明实施例的最佳实施方式。在此处所提供的说明书中，说明了大量细节。然而，能够理解，本发明的实施例可以在没有这些细节的情况下实践。在一些实例中，并未详细示出公知的方法、结构和技术，以便不模糊对本说明书的理解。类似地，应当理解，为了精简本公开并帮助理解各个发明方面中的一个或多个，在上面对本发明的示例性实施例的描述中，本发明实施例的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而，并不应将该公开的方法解释成反映如下意图：即所要求保护的本发明实施例要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说，如下面的权利要求书所反映的那样，发明方面在于少于前面公开的单个实施例的所有特征。因此，遵循实施方式的权利要求书由此明确地并入该实施方式，其中每个权利要求本身都作为本发明的单独实施例。本领域那些技术人员可以理解，可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件，以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和 /或过程或者单元中的至少一些是相互排斥之外，可以采用任何组合对本说明书（包括伴随的权利要求、摘要和附图）中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述，本说明书（包括伴随的权利要求、摘要和附图）中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。此外，本领域的技术人员能够理解，尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征，但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如，在下面的权利要求书中，所要求保护的实施例的任意之一都可以以任意的组合方式来使用。本发明的各个部件实施例可以以硬件实现，或者以在一个或者多个处理器上运行的软件模块实现，或者以它们的组合实现。本领域的技术人员应当理解，可以在实践中使用微处理器或者数字信号处理器（DSP) 来实现根据本发明实施例的终端侧时间域视频质量评价装置中的一些或者全部部件的一些或者全部功能。本发明实施例还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序（例如，计算机程序和计算机程序产品）。这样的实现本发明实施例的程序可以存储在计算机可读介质上，或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到，或者在载体信号上提供，或者以任何其他形式提供。应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制，并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中，不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词"包含"不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词 "一"或"一个"不排除存在多个这样的元件。本发明实施例可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中，这些装置中的若干个可以是通过同一个硬件项来体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。工业实用性本发明实施例的技术方案可以应用于视频客观质量技术评价领域，解决了现有技术中终端侧时间域无参考技术中存在的评测误差较大、忽略运动性、指标单一的问题，突出了运动性以及视频内容对视频质量的影响，提高了评价结果与主观感受的接近程度，扩展了视频时间域失真的评价体系，降低了误判发生的概率。

Claims

权利要求书、一种终端侧时间域视频质量评价方法，包括：

计算各个视频帧的显著运动面积比例，其中，所述显著运动面积比例是指: 相邻两视频帧之间发生显著变化的面积占一个视频帧面积的比例；

根据所述显著运动面积比例将所有视频帧分为绝对普通帧和疑似失真帧；对所述疑似失真帧进行冻结帧检测、场景转换帧检测、抖动帧检测、以及鬼影帧检测；

根据场景转换帧检测结果对视频进行场景分割，计算各个场景的场景信息权值，并根据冻结帧检测结果、抖动帧检测结果、以及鬼影帧检测结果计算失真系数，根据所述显著运动面积比例、所述场景信息权值、以及所述失真系数确定终端侧时间域视频质量。、如权利要求 1所述的方法，其中，计算各个视频帧的显著运动面积比例包括：步骤 11，根据播放进度将当前第 k视频帧解码到明亮度色度 YUV空间，获取亮度矩阵 Y_k;

步骤 12，如果确定当前第 k视频帧为视频的第一帧，则设所述当前第 k视频帧的前一帧为像素值全零帧，并执行步骤 13，否则，直接执行步骤 13; 步骤 13，对当前第 k视频帧的亮度矩阵 Y_k进行高斯滤波，并对滤波结果进行下采样；

步骤 14，重复执行步骤 13 _n-l次，得到含有 n个不同尺度的矩阵的高斯图像金字塔 PMD_k，其中，尺度表示当前矩阵已进行高斯滤波与下采样操作的次数，当尺度为 1时的矩阵为源矩阵 Y_k， n为尺度的总个数；

步骤 15，对当前第 k视频帧和第 k-1视频帧的高斯图像金字塔 PMD_k和 PMD_k-!在尺度 s上求矩阵中每个元素之差的绝对值，得到差异矩阵 M_k，_s，并根据各尺度上的差异矩阵组成差异金字塔 DPMD_k，其中，差异矩阵 M_k，_s中的 M 为全零矩阵；

步骤 16，对所述 DPMD_k中除尺度 1以外的所有尺度上的差异矩阵进行双线性插值，将差异矩阵大小归一到与源矩阵 Y_k相同，并对包括 Y_k在内的 DPMD_k 插值后的 n个差异矩阵求平均得到归一差异矩阵 Z_k; 步骤 17，对 Z_k进行中值滤波去噪得到 Z_km，并设置阈值 θ，将所述 Zi^中大于等于 Θ的元素赋值为 1，小于 Θ的元素赋值为 0，得到二值矩阵 BI_k;

步骤 18，对 BI_k求和后除以当前第 k视频帧的帧像素面积，得到当前第 k 视频帧的显著运动面积比例。、如权利要求 2所述的方法，其中，步骤 13包括：

对当前第 k帧的亮度矩阵 Y_k做帧窗口大小为 3x3、均值为 0、标准差为 0.5 的高斯滤波，并对对滤波结果进行 l/4^a下采样，其中， a为自然数。、如权利要求 1或 2或 3所述的方法，其中，根据所述显著运动面积比例将所有视频帧分为绝对普通帧和疑似失真帧包括：

步骤 21，在当前第 k视频帧的显著运动面积比例为 0的情况下，确定所述当前第 k视频帧为疑似冻结帧，其中， k>l _;

步骤 22，在当前第 k视频帧的显著运动面积比例大于前一视频帧的两倍且大于第一预定阈值、且其前一视频帧为非冻结帧的情况下，确定所述当前第 k 视频帧为疑似场景转换帧；

步骤 23，在当前第 k视频帧和第 k+1视频帧的显著运动面积比例相等的情况下，确定上述两视频帧为疑似抖动帧或疑似鬼影帧；

步骤 24，在当前第 k视频帧的显著运动面积比例不符合步骤 21至 23所述的情况、且前一视频帧为非冻结帧的情况下，确定所述当前第 k视频帧为绝对普通帧。、如权利要求 2或 3所述的方法，其中，对所述疑似失真帧进行冻结帧检测包括：步骤 31，对尺度为 1的差异矩阵中所有元素求和，若结果为 0，执行步骤 32，否则确定当前第 k视频帧为正常帧，并退出整个当前第 k视频帧的失真检测；

步骤 32，若判断第 k-1视频帧为冻结帧，则确定当前第 k视频帧也为冻结帧，并退出整个当前第 k视频帧的失真检测，否则，执行步骤 33;

步骤 33，若判断第 k-1视频帧为幕帧，则确定当前第 k视频帧也为幕帧，并退出整个当前第 k视频帧的失真检测，否则，执行步骤 34;

步骤 34，计算当前第 k视频帧的空间复杂度 O_s以及色彩复杂度 O_c; 步骤 35，计算当前第 k视频帧的幕系数 P=l-0.6O_s-0.4O_c+0.2b，若 P大于等于第二预定阈值，则确定当前第 k视频帧为幕帧，不是冻结帧，否则，确定当前第 k视频帧为冻结帧，其中， b为二值型参数，当第 k-1视频帧为场景转换帧或第 k-1视频帧和第 k-2视频帧的显著运动面积比例非 0且相等时， b=l，否则 b=0。、如权利要求 2或 3所述的方法，其中，对所述疑似失真帧进场景转换帧检测包括- 步骤 41，在宽为 w、高为 h的二值矩阵 BI_k的中间划分出前景矩形区域 BI_k，_f，并确定 BI_k的其他区域为背景区域 BI_k，_b，计算 BI_k在 BI_k，_b中的元素总和与在 BI_k，_f 中的元素总和之比 R_k，其中，所述 BI_k，_f的高为 BI_k的第 Lh/8+lj行到第【7h/8j行，宽为 BI_k的第 v/8+lj列到第 L7 8j列，上述符号" U"是指向下取整；

步骤 42，以 BI_k的第 [h/2]行和第 [h/2]列为界，将 BI_k，_b划分为四个部分，并分别计算四个部分中数值为 1的元素个数所占该部分的比例，统计这四个比例中大于等于第三预定阈值的个数 N_1V;

步骤 43，若 R_k大于等于第四预定阈值且 N_1V大于等于第五预定阈值，则确定当前第 k视频帧为场景转换帧，否则，退出对当前第 k视频帧的场景转换帧检测。、如权利要求 1或 2或 3所述的方法，其中，对所述疑似失真帧进抖动帧检测、以及鬼影帧检测包括：

步骤 51，若第 k-1视频帧为渐变帧，则确定当前第 k视频帧也为渐变帧，并退出整个当前第 k视频帧的失真检测，否则执行步骤 52;

步骤 52，若当前第 k视频帧的显著运动面积比例与第 k-1视频帧相等，则当前第 k视频帧为渐变帧，并退出整个当前第 k视频帧的失真检测，否则执行步骤 53;

步骤 53，计算第 k-1视频帧和第 k+1视频帧亮度矩阵的差值矩阵，取其绝对值后将所有元素求和，若和为 0，则第 k+1视频帧为抖动帧，且第 k帧为正常帧，并退出整个当前第 k视频帧的失真检测，并执行步骤 54，否则，执行步骤 54;

步骤 54，若当前第 k视频帧的显著运动面积比例大于等于第六预定阈值，则确定当前第 k视频帧为鬼影帧，且第 k+1帧为正常帧，否则确定第 k帧为正常帧。、如权利要求 1或 2或 3所述的方法，其中，根据场景转换帧检测结果对视频进行场景分割，计算各个场景的场景信息权值包括：

根据场景转换帧检测结果对视频进行场景分割，如果当前第 k视频帧为最近的场景转换帧之后的第一个绝对普通帧，则将当前第 k视频帧的空间复杂度、色彩复杂度、亮度均值以及显著运动面积比例进行求和，获取该场景内用于加权的场景信息权值。、如权利要求 1或 2或 3所述的方法，其中，根据冻结帧检测结果、抖动帧检测结果、以及鬼影帧检测结果计算失真系数包括：

根据公式 1计算失真系数 K;

= 0.07 ln(44 ^ - 41.28) x F_frz + 0.29 ., + 0.19F_gst

公式 1 ;

其中， F_&z、 _t、 F_gst分别为当前帧的冻结帧、抖动帧、鬼影帧标志位，上述三个标志位中有且仅有一项为 1，其他标志位均为 0， 1表示所评价的视频帧存在相应类型的失真， 0表示所评价的视频帧不存在相应类型的失真， P_&z为冻结持续性系数， ^ = " ^{x l}。g²(² + ，上式中 _n 为本次冻结的连续累计帧数， t 为在此次冻结发生前第一预定时间内单次持续第二预定时间以上的冻结的次数，第二预定时间小于第一预定时间。、如权利要求 1或 2或 3所述的方法，其中，根据所述显著运动面积比例、所述场景信息权值、以及所述失真系数确定终端侧时间域视频质量包括：

根据公式 2计算终端侧时间域视频质量

Q = \ - m^A^ χ Expr x K 公式

2；

其中， m为扩展系数， _q为发生失真的视频帧的前一个正常帧的显著运动面积比例， Expr为场景信息权值， K为失真系数。 1、一种终端侧时间域视频质量评价装置，包括：

计算模块，设置为计算各个视频帧的显著运动面积比例，其中，所述显著运动面积比例是指：相邻两视频帧之间发生显著变化的面积占一个视频帧面积的比例；、如权利要求 1或 2或 3所述的方法，其中，根据场景转换帧检测结果对视频进行场景分割，计算各个场景的场景信息权值包括：

根据公式 1计算失真系数 K;

= 0.07 ln(44 ^ - 41.28) x F_frz + 0.29 ., + 0.19F_gst

公式 1 ;

根据公式 2计算终端侧时间域视频质量

Q = \ - m^A^ χ Expr x K 公式

2；

计算模块，设置为计算各个视频帧的显著运动面积比例，其中，所述显著运动面积比例是指：相邻两视频帧之间发生显著变化的面积占一个视频帧面积的比例；

30 划分模块，设置为根据所述显著运动面积比例将所有视频帧分为绝对普通帧和疑似失真帧；

检测模块，设置为对所述疑似失真帧进行冻结帧检测、场景转换帧检测、抖动帧检测、以及鬼影帧检测；

评估模块，设置为根据场景转换帧检测结果对视频进行场景分割，计算各个场景的场景信息权值，并根据冻结帧检测结果、抖动帧检测结果、以及鬼影帧检测结果计算失真系数，根据所述显著运动面积比例、所述场景信息权值、以及所述失真系数确定终端侧时间域视频质量。如权利要求 11所述的装置，其中，所述计算模块包括- 亮度矩阵获取子模块，设置为根据播放进度将当前第 k视频帧解码到明亮度色度 YUV空间，获取亮度矩阵 Y_k;

设置子模块，设置为在确定当前第 k视频帧为视频的第一帧时，设所述当前第 k视频帧的前一帧为像素值全零帧，并调用滤波采样子模块，否则，直接调用滤波采样子模块；

滤波采样子模块，设置为对当前第 k视频帧的亮度矩阵 Y_k进行高斯滤波，并对滤波结果进行下采样；

高斯图像金字塔获取子模块，设置为重复调用滤波采样子模块 _η-ι次，得到含有 n个不同尺度的矩阵的高斯图像金字塔 PMD_k，其中，尺度表示当前矩阵已进行高斯滤波与下采样操作的次数，当尺度为 1时的矩阵为源矩阵 Y_k， n 为尺度的总个数；

差异金字塔获取子模块，设置为对当前第 k视频帧和第 k-1视频帧的高斯图像金字塔 PMD_k和 PMD^在尺度 s上求矩阵中每个元素之差的绝对值，得到差异矩阵 M_k，_s，并根据各尺度上的差异矩阵组成差异金字塔 DPMD_k，其中，差异矩阵 M_k，_s中的 Mi，_s为全零矩阵；

归一差异矩阵获取子模块，设置为对所述 DPMD_k中除尺度 1 以外的所有尺度上的差异矩阵进行双线性插值，将差异矩阵大小归一到与源矩阵 Y_k相同，并对包括 Y_k在内的 DPMD_k插值后的 n个差异矩阵求平均得到归一差异矩阵 Z_k;

二值矩阵获取子模块，设置为对 Z_k进行中值滤波去噪得到 Z_km，并设置阈值0，将所述 Z_km中大于等于 Θ的元素赋值为 1，小于 Θ的元素赋值为 0，得到二值矩阵 BI_k;

31 显著运动面积比例获取子模块，设置为对 BI_k求和后除以当前第 k视频帧的帧像素面积，得到当前第 k视频帧的显著运动面积比例。、如权利要求 12 所述的装置，其中，所述滤波采样子模块设置为：对当前第 k 帧的亮度矩阵 Y_k做帧窗口大小为 3x3、均值为 0、标准差为 0.5的高斯滤波，并对对滤波结果进行 l/4^a下采样，其中， a为自然数。、如权利要求 11或 12或 13所述的装置，其中，所述划分模块包括：

疑似冻结帧确定子模块，设置为在当前第 k视频帧的显著运动面积比例为 0的情况下，确定所述当前第 k视频帧为疑似冻结帧，其中， k>l _;

疑似场景转换帧确定子模块，设置为在当前第 k视频帧的显著运动面积比例大于前一视频帧的两倍且大于第一预定阈值、且其前一视频帧为非冻结帧的情况下，确定所述当前第 k视频帧为疑似场景转换帧；

疑似抖动帧和疑似鬼影帧确定子模块，设置为在当前第 k视频帧和第 k+1 视频帧的显著运动面积比例相等的情况下，确定上述两视频帧为疑似抖动帧或疑似鬼影帧；

绝对普通帧确定子模块，设置为在当前第 k视频帧的显著运动面积比例不符合上述各子模块所述的情况、且前一视频帧为非冻结帧的情况下，确定所述当前第 k视频帧为绝对普通帧。、如权利要求 12或 13所述的装置，其中，所述检测模块包括：冻结帧检测模块，其中，所述冻结帧检测模块包括：

求和子模块，设置为对尺度为 1的差异矩阵中所有元素求和，若结果为 0，调用第一判断子模块，否则确定当前第 k视频帧为正常帧，并退出整个当前第 k视频帧的失真检测；

第一判断子模块，设置为在判断第 k-1视频帧为冻结帧时，则确定当前第 k视频帧也为冻结帧，并退出整个当前第 k视频帧的失真检测，否则，调用幕帧判断子模块；

幕帧判断子模块，设置为在判断第 k-1视频帧为幕帧时，则确定当前第 k 视频帧也为幕帧，并退出整个当前第 k视频帧的失真检测，否则，调用计算子模块；

计算子模块，计算当前第 k视频帧的空间复杂度 O_s以及色彩复杂度 O_c;

32 冻结帧幕帧区分子模块，设置为计算当前第 k 视频帧的幕系数

P=l-0.6O_s-0.4O_c+0.2b, 若 P大于等于第二预定阈值，则确定当前第 k视频帧为幕帧，不是冻结帧，否则，确定当前第 k视频帧为冻结帧，其中， b为二值型参数，当第 k-1视频帧为场景转换帧或第 k-1视频帧和第 k-2视频帧的显著运动面积比例非 0且相等时， b=l，否则 b=0。、如权利要求 12或 13所述的装置，其中，所述检测模块包括：场景转换帧检测模块，其中，所述场景转换帧检测模块包括：

前景矩形区域划分子模块，设置为在宽为 w、高为 h的二值矩阵 BI_k的中间划分出前景矩形区域 BI_k，_f，并确定 BI_k的其他区域为背景区域 BI_k，_b，计算 BI_k 在 BI_k，_b中的元素总和与在 BI_k，_f中的元素总和之比 R_k，其中，所述 BI_k，_f的高为 BI_k的第 Lh/8+lj行到第【7h/8j行，宽为 BI_k的第 Lw/8+lj列到第【7w/8j列，上述符号" U"是指向下取整；

二值矩阵划分子模块，设置为以 BI_k的第 [h/2]行和第 [h/2]列为界，将 BI_k，_b 划分为四个部分，并分别计算四个部分中数值为 1的元素个数所占该部分的比例，统计这四个比例中大于等于第三预定阈值的个数 N_1V;

场景转换帧判断子模块，设置为在 R_k大于第四预定阈值且 N_1V大于第五预定阈值时，则确定当前第 k视频帧为场景转换帧，否则，退出对当前第 k视频帧的场景转换帧检测。、如权利要求 11或 12或 13所述的装置，其中，所述检测模块包括：抖动帧以及鬼影帧检测模块，其中，所述抖动帧以及鬼影帧检测模块包括：

渐变帧第一确定子模块，设置为在第 k-1视频帧为渐变帧时，则确定当前第 k视频帧也为渐变帧，并退出整个当前第 k视频帧的失真检测，否则调用渐变帧第二确定子模块；

渐变帧第二确定子模块，设置为在当前第 k视频帧的显著运动面积比例与第 k-1视频帧相等时，则确定当前第 k视频帧为渐变帧，并退出整个当前第 k 视频帧的失真检测，否则调用抖动帧检测子模块；

抖动帧检测子模块，设置为计算第 k-1视频帧和第 k+1视频帧亮度矩阵的差值矩阵，取其绝对值后将所有元素求和，若和为 0，则第 k+1视频帧为抖动帧，且第 k帧为正常帧，并退出整个当前第 k视频帧的失真检测，否则，调用鬼影帧检测子模块；

33 鬼影帧检测子模块，设置为在当前第 k视频帧的显著运动面积比例大于等于第六预定阈值时，则确定当前第 k视频帧为鬼影帧，且第 k+1帧为正常帧，否则确定第 k帧为正常帧。、如权利要求 11或 12或 13所述的装置，其中，所述评估模块包括：

场景信息权值计算子模块，设置为根据场景转换帧检测结果对视频进行场景分割，如果当前第 k视频帧为最近的场景转换帧之后的第一个绝对普通帧，则将当前第 k视频帧的空间复杂度、色彩复杂度、亮度均值以及显著运动面积比例进行求和，获取该场景内用于加权的场景信息权值。、如权利要求 11或 12或 13所述的装置，其中，所述评估模块包括：失真系数计算子模块，设置为根据公式 1计算失真系数 K;

= 0.07 ln(44 ^ - 41.28) x F_frz + 0.29 ., + 0.19F_gst

公式 1 ;

其中， F_&z、 Fj_lt、 F_gst分别为当前帧的冻结帧、抖动帧、鬼影帧标志位，上述三个标志位中有且仅有一项为 1，其他标志位均为 0， 1表示所评价的视频帧存在相应类型的失真， 0表示所评价的视频帧不存在相应类型的失真， P_&z为冻结持续性系数， = " ^{x lQ}g²(²")，上式中 _n为本次冻结的连续累计帧数， t 为在此次冻结发生前第一预定时间内单次持续第二预定时间以上的冻结的次数，第二预定时间小于第一预定时间。、如权利要求 11或 12或 13所述的装置，其中，所述评估模块包括：视频质量确定子模块，设置为根据公式 2计算终端侧时间域视频质量

Q = \ - m^A^ χ Expr x K 公式

2；

其中， m为扩展系数， _q为发生失真的视频帧的前一个正常帧的显著运动面积比例， Expr为场景信息权值， K为失真系数。

34