CN103634591A - 一种视频质量评估的方法、装置和系统 - Google Patents

一种视频质量评估的方法、装置和系统 Download PDF

Info

Publication number
CN103634591A
CN103634591A CN201310589771.4A CN201310589771A CN103634591A CN 103634591 A CN103634591 A CN 103634591A CN 201310589771 A CN201310589771 A CN 201310589771A CN 103634591 A CN103634591 A CN 103634591A
Authority
CN
China
Prior art keywords
video
frame
file
quality
ssim
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201310589771.4A
Other languages
English (en)
Inventor
傅峻
谢永明
胡嘉凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201310589771.4A priority Critical patent/CN103634591A/zh
Publication of CN103634591A publication Critical patent/CN103634591A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

本发明公开了一种视频质量评估的方法、装置和系统,涉及视频技术领域,用以在没有原始非失真参考视频的情况下,对视频质量进行评估,扩大其应用范围。所述视频质量评估的方法包括:从视频文件中获取第一视频帧;所述第一视频帧为所述视频文件中的任一视频帧;对所述第一视频帧进行质量还原处理,得到第二视频帧;所述第二视频帧作为所述第一视频帧的参考视频帧;对所述第一视频帧和所述第二视频帧进行质量评估处理,获取所述第一视频帧的视频质量参数。

Description

一种视频质量评估的方法、装置和系统
技术领域
本发明涉及视频技术领域,尤其涉及一种视频质量评估的方法、装置和系统。
背景技术
现有的视频质量评估可以分为两类:主观视频质量评估和客观视频质量评估;主观视频质量评估凭借感知者主观感受来对视频质量进行评估,该方法过于复杂且受各种因素的影响;客观视频质量评估依据模型给出的量化指标衡量视频质量。其中,客观视频质量评估又可分为:全参考(Full Reference,简称FR)视频质量评估、部分参考(Reduced Reference,简称RR)视频质量评估和无参考(NoReference,简称NR)视频质量评估三种。在全参考视频质量评估中,需已知原始视频和失真视频;在部分参考视频质量评估中,需已知原始视频的部分特征;在无参考视频质量评估中,原始视频是完全未知的。
目前,最为典型的全参考视频质量评估方法之一是基于结构相似度(structural similarity index measurement,简称SSIM)的视频质量评估,但是基于SSIM的视频质量评估必须借助原始的非失真视频作为参考,然而在很多情况下都无法或较难获得原始的非失真视频,影响了对视频质量的评估,也使得其应用范围较窄。
发明内容
本发明的实施例提供一种视频质量评估的方法、装置和系统,用以在没有原始非失真参考视频的情况下,对视频质量进行评估,扩大其应用范围。
为达到上述目的,本发明的实施例采用如下技术方案:
第一方面,本发明实施例提供一种视频质量评估的方法,包括:
从视频文件中获取第一视频帧;所述第一视频帧为所述视频文件中的任一视频帧;
对所述第一视频帧进行质量还原处理,得到第二视频帧;所述第二视频帧作为所述第一视频帧的参考视频帧;
对所述第一视频帧和所述第二视频帧进行质量评估处理,获取所述第一视频帧的视频质量参数。
在第一方面的第一种可能的实现方式中,所述对所述第一视频帧进行质量还原处理,得到第二视频帧包括:
在所述第一视频帧中添加噪声,得到加噪第一视频帧;
计算所述加噪第一视频帧中的噪声方差;
若所述噪声方差大于预先设定的阈值,则采用自适应全变差ATV方式对所述加噪第一视频帧进行滤波,得到第二视频帧;或者,
若所述噪声方差小于预先设定的阈值,则采用非局部均值NLM方式对所述加噪第一视频帧进行滤波,得到第二视频帧;所述预先设定的阈值为通过对不同视频文件中每一视频帧进行滤波处理统计得到。
在第一方面的第二种可能的实现方式中,所述对所述第一视频帧和所述第二视频帧进行质量评估处理,获取所述第一视频帧的视频质量参数包括:
利用相似性度量算法,获取所述第一视频帧与所述第二视频帧之间的结构相似度SSIM值;
对所述第一视频帧进行稠密时空显著性KR处理,获取所述第一视频帧的视觉注意信息权值;
对所述第一视频帧与所述第二视频帧之间的SSIM值和所述第一视频帧的视觉注意信息权值进行加权处理,得到所述第一视频帧的视频质量参数。
在第一方面的第二种可能的实现方式中,还提供了第一方面的第三种可能的实现方式,所述利用相似性度量算法,获取所述第一视频帧与所述第二视频帧之间的结构相似度SSIM值包括:
对所述第一视频帧和所述第二视频帧分别进行相同的采样分块;
计算所述第一视频帧和所述第二视频帧相对应分块之间的SSIM值;
对所述各个SSIM值进行修正处理,得到所述第一视频帧中所有分块与对应的所述第二视频帧中的分块之间的SSIM值。
在第一方面的第三种可能实现的方式中,还提供了第四种可能的实现方式,所述对所述各个SSIM值进行修正处理包括:根据第一公式对所述各个SSIM值进行修正;
所述第一公式为:
SSIMf=(J-SSIMt)×w;
其中,SSIMf表示修正后所述第一视频帧中所有分块与对应的所述第二视频帧中的分块之间的SSIM值,SSIMt表示修正前所述第一视频帧中所有分块与对应的所述第二视频帧中的分块之间的SSIM值,J表示修正常量,w表示修正因子。
在第一方面的第四种可能的实现方式中,还提供了第一方面的第五种可能的实现方式,所述根据对所述第一视频帧与所述第二视频帧之间的SSIM值和所述第一视频帧的视觉注意信息权值进行加权处理,得到所述第一视频帧的视频质量参数包括:
根据第二公式得到所述第一视频帧的视频质量参数;所述第二公式为:
VQ f = Σ m = 1 M Σ n = 1 N S 1 f . × SSIM f Σ m = 1 M Σ n = 1 N S 1 f ( m , n ) ;
其中,VQf表示所述第一视频帧的视频质量参数,M和N分别表示对所述第一视频帧或所述第二视频帧进行采样分块后得到的垂直方向和水平方向的分块个数,SSIMf表示修正后所述第一视频帧中所有分块与对应的所述第二视频帧中的分块之间的SSIM值,S1f表示所述第一视频帧所有分块的视觉注意信息权值,S1f(m,n)表示所述第一视频帧采样分块后第(m,n)个分块的视觉注意信息权值,1<m<M,1<n<N。
第二方面,本发明实施例提供了一种视频质量评估的装置,包括:
获取视频文件;所述视频文件包括:至少两个视频帧;
按照第一方面或者第一方面中任一可能的实现方式,得到所述视频文件中每一视频帧的视频质量参数;
对所述视频文件中的每一视频帧进行运动估计,得到所述视频文件中每一视频帧的视频质量权值;
对所述视频文件中每一视频帧的视频质量参数、以及每一视频帧相对应的视频质量权值进行加权处理,得到所述视频文件的视频质量参数。
在第二方面的第一种可能的实现方式中,所述对所述视频文件中的每一视频帧进行运动估计,得到视频文件中每一视频帧的视频质量权值包括:
计算所述视频文件中每一视频帧的平均绝对误差MAD;
若所述视频帧不是所述视频文件的最后一个视频帧,则根据所述视频帧的MAD、以及所述视频帧的后一个视频帧的MAD,计算所述视频帧的视频运动信息,将得到的所述视频帧的视频运动信息作为所述视频帧的视频质量权值;或者,
若所述视频帧为所述视频文件的最后一个视频帧,则根据所述视频帧的MAD、以及所述视频帧的前一个视频帧的MAD,计算所述视频帧的视频运动信息,将得到的所述视频帧的视频运动信息作为所述视频帧的视频质量权值。
在第二方面的第一种可能的实现方式中,还提供了第二方面的第二种可能的实现方式,所述若所述视频帧不是所述视频文件的最后一个视频帧,则根据所述视频帧的MAD、以及所述视频帧的后一个视频帧的MAD,计算所述视频帧的视频运动信息,将得到的所述视频帧的视频运动信息作为所述视频帧的视频质量权值包括:
根据第三公式计算所述视频帧的视频运动信息;所述第三公式为:
&beta; i = m e i + 1 / m e i ;
其中,i表示所述视频帧,βi表示所述视频帧的视频运动信息,
Figure BDA0000418364350000042
表示所述视频帧的后一个视频帧的MAD,
Figure BDA0000418364350000043
表示所述视频帧的MAD。
在第二方面的第一种可能的实现方式中,还提供了第二方面的第三种可能的实现方式,所述若所述视频帧为所述视频文件的最后一个视频帧,则根据所述视频帧的MAD、以及所述视频帧的前一个视频帧的MAD,计算所述视频帧的视频运动信息,将得到的所述视频帧的视频运动信息作为所述视频帧的视频质量权值包括:
根据第四公式计算所述视频帧的视频运动信息;所述第四公式为:
&beta; i = m e i - 1 / m e i ;
其中,i表示所述视频帧,βi表示所述视频帧的视频运动信息,
Figure BDA0000418364350000052
表示所述视频帧的前一个视频帧的MAD,
Figure BDA0000418364350000053
表示所述视频帧的MAD。
在第二方面或者第二方面的任一可能的实现方式中,还提供了第二方面的第四种可能的实现方式,所述对所述视频文件中每一视频帧的视频质量参数、以及每一视频帧相对应的视频质量权值进行加权处理,得到所述视频文件的视频质量参数包括:
根据第五公式得到所述视频文件的视频质量参数;所述第五公式为:
VQ = &Sigma; j = 1 F w j V Q f j ;
其中,VQ表示所述视频文件的视频质量参数,j表示所述视频文件的第j个视频帧,F表示所述视频文件总的视频帧数,
Figure BDA0000418364350000056
表示所述视频文件的第j个视频帧的视频质量参数,wj表示视频文件的第j个视频帧的视频质量权值, w j = 1 2 + &Sigma; i = 1 F - 2 &beta; i , j = 1,2 &beta; j - 2 2 + &Sigma; i = 1 F - 2 &beta; i , j = 3 , &CenterDot; &CenterDot; &CenterDot; , F , βi表示第i个视频帧的视频运动信息。
第三方面,本发明实施例提供了一种视频质量评估的装置,包括:
第一获取模块,用于从视频文件中获取第一视频帧;所述第一视频帧为所述视频文件中的任一视频帧;
质量还原模块,用于对所述第一获取模块得到的第一视频帧进行质量还原处理,得到第二视频帧;所述第二视频帧作为所述第一视频帧的参考视频帧;
第二获取模块,用于对所述第一获取模块得到的第一视频帧和所述质量还原模块得到的第二视频帧进行质量评估处理,获取所述第一视频帧的视频质量参数。
在第三方面的第一种可能的实现方式中,所述质量还原模块包括:加噪单元、计算单元、滤波单元;
所述加噪单元,用于在所述第一获取模块得到的第一视频帧中添加噪声,得到加噪第一视频帧;
所述计算单元,用于计算所述加噪单元得到的加噪第一视频帧中的噪声方差;
所述滤波单元,用于若所述计算单元计算得到的噪声方差大于预先设定的阈值,则采用自适应全变差ATV方式对所述加噪第一视频帧进行滤波,得到第二视频帧;或者,若所述计算单元计算得到的噪声方差小于预先设定的阈值,则采用非局部均值NLM方式对所述加噪第一视频帧进行滤波,得到第二视频帧;所述预先设定的阈值为通过对不同视频文件中每一视频帧进行滤波处理统计得到。
在第二方面的第二种可能的实现方式中,所述第二获取模块包括:第一获取单元、第二获取单元、第三获取单元;
所述第一获取单元,用于利用相似性度量算法,获取所述第一获取模块得到的第一视频帧和所述质量还原模块得到的第二视频帧之间的结构相似度SSIM值;
所述第二获取单元,用于对所述第一获取模块得到的第一视频帧进行稠密时空显著性KR处理,获取所述第一视频帧的视觉注意信息权值;
所述第三获取单元,用于对所述第一获取模块得到的第一视频帧与所述质量还原模块得到的第二视频帧之间的SSIM值、以及所述第二获取单元得到的所述第一视频帧的视觉注意信息权值进行加权处理,得到所述第一视频帧的视频质量参数。
在第三方面的第二种可能的实现方式中,还提供了第三方面的第三种可能的实现方式,所述第一获取单元包括:采样子单元、计算子单元、修正子单元;
所述采样子单元,用于对所述第一视频帧和所述第二视频帧分别进行相同的采样分块;
所述计算子单元,用于计算所述采样子单元得到的所述第一视频帧和所述第二视频帧相对应分块之间的SSIM值;
所述修正子单元,用于对所述计算子单元得到的各个SSIM值进行修正处理,得到所述第一视频帧中所有分块与对应的所述第二视频帧中的分块之间的SSIM值。
在第三方面的第三种可能的实现方式中,还提供了第三方面的第四种可能的实现方式,所述修正子单元用于根据第一公式对所述各个SSIM值进行修正;所述第一公式为:
SSIMf=(J-SSIMt)×w;
其中,SSIMf表示修正后所述第一视频帧中所有分块与对应的所述第二视频帧中的分块之间的SSIM值,SSIMt表示修正前所述第一视频帧中所有分块与对应的所述第二视频帧中的分块之间的SSIM值,J表示修正常量,w表示修正因子。
第三方面的第四种可能的实现方式中,还提供了第三方面的第五种可能的实现方式,所述第三获取单元用于根据第二公式得到所述第一视频帧的视频质量参数;所述第二公式为:
VQ f = &Sigma; m = 1 M &Sigma; n = 1 N S 1 f . &times; SSIM f &Sigma; m = 1 M &Sigma; n = 1 N S 1 f ( m , n ) ;
其中,VQf表示所述第一视频帧的视频质量参数,M和N分别表示对所述第一视频帧或所述第二视频帧进行采样分块后得到的垂直方向和水平方向的分块个数,SSIMf表示修正后所述第一视频帧中所有分块与对应的所述第二视频帧中的分块之间的SSIM值,S1f表示所述第一视频帧所有分块的视觉注意信息权值,S1f(m,n)表示所述第一视频帧采样分块后第(m,n)个分块的视觉注意信息权值,1<m<M,1<n<N。
第四方面,本发明实施例提供了一种视频质量评估的装置,包括:
第一获取模块,用于获取视频文件;所述视频文件包括:至少两个视频帧;
第二获取模块,用于按照权利要求1-6任一项所述的方法,得到所述视频文件中每一视频帧的视频质量参数;
运动估计模块,用于所述视频文件中的每一视频帧进行运动估计,得到所述视频文件中每一视频帧的视频质量权值;
加权处理模块,用于对第二获取模块得到的所述视频文件中每一视频帧的视频质量参数、以及所述运动估计模块得到的每一视频帧相对应的视频质量权值进行加权处理,得到所述视频文件的视频质量参数。
在第四方面的第一种可能的实现方式中,所述运动估计模块包括:第一计算单元、第二计算单元;
所述第一计算单元,用于计算所述视频文件中的每一视频帧的平均绝对误差MAD;
所述第二计算单元,用于若所述视频帧不是所述视频文件的最后一个视频帧,则根据所述视频帧的MAD、以及所述视频帧的后一个视频帧的MAD,计算所述视频帧的视频运动信息,将得到的所述视频帧的视频运动信息作为所述视频帧的视频质量权值;或者,若所述视频帧为所述视频文件的最后一个视频帧,则根据所述视频帧的MAD、以及所述视频帧的前一个视频帧的MAD,计算所述视频帧的视频运动信息,将得到的所述视频帧的视频运动信息作为所述视频帧的视频质量权值。
在第四方面的第一种可能的实现方式中,还提供了第四方面的第二种可能的实现方式,所述第二计算单元具体用于根据第三公式计算所述视频帧的视频运动信息;所述第三公式为:
&beta; i = m e i + 1 / m e i ;
其中,i表示所述视频帧,βi表示所述视频帧的视频运动信息,
Figure BDA0000418364350000091
表示所述视频帧的后一个视频帧的MAD,
Figure BDA0000418364350000092
表示所述视频帧的MAD。
在第四方面的第一种可能的实现方式中,还提供了第四方面的第三种可能的实现方式,所述第二计算单元具体用于根据第四公式计算所述视频帧的视频运动信息;所述第四公式为:
&beta; i = m e i - 1 / m e i ;
其中,i表示所述视频帧,βi表示所述视频帧的视频运动信息,
Figure BDA0000418364350000094
表示所述视频帧的前一个视频帧的MAD,
Figure BDA0000418364350000095
表示所述视频帧的MAD。
在第四方面或者第四方面的任一可能的实现方式中,还提供了第四方面的第四种可能的实现方式,所述加权处理模块用于根据第五公式得到所述视频文件的视频质量参数;所述第五公式为:
VQ = &Sigma; j = 1 F w j V Q f j ;
其中,VQ表示所述视频文件的视频质量参数,j表示所述视频文件的第j个视频帧,F表示所述视频文件总的视频帧数,
Figure BDA0000418364350000097
表示所述视频文件的第j个视频帧的视频质量参数,wj表示视频文件的第j个视频帧的视频质量权值, w j = 1 2 + &Sigma; i = 1 F - 2 &beta; i , j = 1,2 &beta; j - 2 2 + &Sigma; i = 1 F - 2 &beta; i , j = 3 , &CenterDot; &CenterDot; &CenterDot; , F , βi表示第i个视频帧的视频运动信息。
第五方面,本发明实施例提供了一种视频质量评估的系统,包括:存储器和处理器,其中,所述存储器存储有操作指令,所述处理器用于调用存储器存储的操作指令,以执行第一方面或第一方面中任一可能的实现方式,和/或,第二方面或第二方面中任一可能的实现方式。
本发明实施例提供了一种视频质量评估的方法、装置和系统,通过对视频文件中的任一视频帧进行质量还原处理,得到该视频帧的参考视频帧,并对该视频帧及其参考视频帧进行质量评估处理,得到该视频帧的视频质量参数,实现了在没有原始非失真参考视频的情况下,对视频质量进行评估,扩大了应用范围;进一步的,按照上述方法得到视频文件中每一视频帧的视频质量参数,并对视频文件中的每一视频帧进行运动估计,得到视频文件中每一视频帧的视频质量权值,对视频文件中每一视频帧的视频质量参数、以及相对应的视频质量权值进行加权处理,得到视频文件的视频质量参数,通过运动估计考虑了人眼了视觉特性,从而能获得与主观感知更为一致的视频质量指标,提高了视频质量评估的准确度。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种视频质量评估的方法示意图;
图2为本发明实施例提供的另一种视频质量评估的方法示意图;
图3为本发明实施例提供的一种视频质量评估的应用场景示意图;
图4为本发明实施例提供的一种视频质量评估的方法流程示意图;
图5为本发明实施例提供的一种视频质量评估的装置示意图;
图6为本发明实施例提供的另一种视频质量评估的装置示意图;
图7为本发明实施例提供的另一种视频质量评估的装置示意图;
图8为本发明实施例提供的另一种视频质量评估的装置示意图;
图9为本发明实施例提供的一种视频质量评估的实体装置示意图;
图10为本发明实施例提供的另一种视频质量评估的实体装置示意图;
图11为本发明实施例提供的一种视频质量评估的系统示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一、
本发明提供了一种视频质量评估的方法,如图1所示,包括:
S101、从视频文件中获取第一视频帧;所述第一视频帧为所述视频文件中的任一视频帧。
其中,视频文件是由一系列的单帧图像构成的,即由一系列的视频帧构成的。
S102、对所述第一视频帧进行质量还原处理,得到第二视频帧;所述第二视频帧作为所述第一视频帧的参考视频帧。
其中,所述对所述第一视频帧进行质量还原处理,得到第二视频帧包括:
在所述第一视频帧中添加噪声,得到加噪第一视频帧;
计算所述加噪第一视频帧中的噪声方差;
若所述噪声方差大于预先设定的阈值,则采用自适应全变差(Adaptive total variation,简称ATV)方式对所述加噪第一视频帧进行滤波,得到第二视频帧;或者,
若所述噪声方差小于预先设定的阈值,则采用非局部均值(Non-local Means,简称NLM)方式对所述加噪第一视频帧进行滤波,得到第二视频帧。
其中,所述预先设定的阈值可以是任意设定的阈值,也可以是根据实验统计得到的经验值进行设定;根据实验统计得到的经验值可以为在实际的实验中,设置信噪比和误差指数两个指标,然后利用不同视频文件中每一视频帧在不同信噪比下的加噪视频帧,测试ATV算法和NLM算法的误差指数,进而确定采用哪种算法可以有效的消除噪声,通过比较,ATV和NLM这两种算法在12-18之间有交集,即预先设定的阈值可以分布在12-18之间,同时考虑到不同视频文件的差异性,可以选取中间值15作为经验阈值,当然对于阈值的设定方法,不限于此。
S103、对所述第一视频帧和所述第二视频帧进行质量评估处理,获取所述第一视频帧的视频质量参数。
其中,所述对所述第一视频帧和所述第二视频帧进行质量评估处理,获取所述第一视频帧的视频质量参数波包括:
利用相似性度量算法,得到所述第一视频帧与所述第二视频帧之间的结构相似度SSIM值;
对所述第一视频帧进行稠密时空显著性模型(Dense SpatiotemporalSalient Model,简称KR模型)处理,获取所述第一视频帧的视觉注意信息权值;
对所述第一视频帧与所述第二视频帧之间的SSIM值、以及所述第一视频帧的视觉注意信息权值进行加权处理,得到所述第一视频帧的视频质量参数。
具体的,所述利用相似性度量算法,获取所述第一视频帧与所述第二视频帧之间的结构相似度SSIM值包括:
对所述第一视频帧和所述第二视频帧分别进行相同的采样分块;
计算所述第一视频帧和所述第二视频帧相对应分块之间的SSIM值;
对所述各个SSIM值进行修正处理,得到所述第一视频帧中所有分块与对应的所述第二视频帧中的分块之间的SSIM值
其中,所述对所述各个SSIM值进行修正处理包括:根据第一公式对所述各个SSIM值进行修正;
所述第一公式为:
SSIMf=(J-SSIMt)×w;
其中,SSIMf表示修正后所述第一视频帧中所有分块与对应的所述第二视频帧中的分块之间的SSIM值,SSIMt表示修正前所述第一视频帧中所有分块与对应的所述第二视频帧中的分块之间的SSIM值,J表示修正常量,w表示修正因子。
其中,对所述第一视频帧和所述第二视频帧分别进行相同的采样分块的大小可以是任意设定的采样大小,也可以是根据实验统计得到的经验值进行设定,当然不限于此。
示例的,假设所述第一视频帧和所述第二视频帧的大小为W×H,其中,W表示所述第一视频帧和所述第二视频帧的高,H表示所述第一视频帧和所述第二视频帧的宽;采样窗口的大小为g×t,其中,g为对所述第一视频帧和所述第二视频帧进行高度采样的大小,t为对所述第一视频帧和所述第二视频帧进行宽度采样的大小;按照采样窗口的大小对所述第一视频帧和第二视频帧分别采样,得到每一个视频帧的分块数分别为M=W/g,N=H/t,其中,M为对所述第一视频帧和所述第二视频帧进行高度采样后的分块数,N为对所述第一视频帧和所述第二视频帧进行宽度采样后的分块数。
具体的,所述对所述第一视频帧与所述第二视频帧之间的SSIM值、以及所述第一视频帧的视觉注意信息权值进行加权处理,得到所述第一视频帧的视频质量参数包括:
根据第二公式得到所述第一视频帧的视频质量参数;所述第二公式为:
VQ f = &Sigma; m = 1 M &Sigma; n = 1 N S 1 f . &times; SSIM f &Sigma; m = 1 M &Sigma; n = 1 N S 1 f ( m , n ) ;
其中,VQf表示所述第一视频帧的视频质量参数,M和N分别表示对所述第一视频帧或所述第二视频帧进行采样分块后得到的垂直方向和水平方向的分块个数,SSIMf表示修正后所述第一视频帧中所有分块与对应的所述第二视频帧中的分块之间的SSIM值,S1f表示所述第一视频帧所有分块的视觉注意信息权值,S1f(m,n)表示所述第一视频帧采样分块后第(m,n)个分块的视觉注意信息权值,1<m<M,1<n<N。
根据所述第二公式得到的所述第一视频帧的视频质量参数来对所述第一视频帧进行视频质量评估,以判断所述第一视频帧的视频质量是优质的还是劣质的。
本发明实施例提供了一种视频质量评估的方法,通过对视频文件中的任一视频帧进行质量还原处理,得到该视频帧的参考视频帧,并对该视频帧及其参考视频帧进行质量评估处理,得到该视频帧的视频质量参数,实现了在没有原始非失真参考视频的情况下,对视频质量进行评估,扩大了应用范围。
实施例二、
本发明实施例提供了一种视频质量评估的方法,用于获取整个视频文件进行视频质量参数,以便对整个视频文件进行视频质量评估;而获取整个视频文件的视频质量参数,需要获取视频文件中每一个视频帧的视频质量参数,对于视频文件中每一个视频帧的视频质量参数的获取参考步骤S101-S103,在此不再赘述。如图2所示,本发明实施例提供的一种视频质量评估的方法包括:
S201、获取视频文件;所述视频文件包括:至少两个视频帧。
其中,所述视频文件可以是预先已经存储的,也可以是实时拍摄的,当然不限于此。
S201、按照步骤S101-S103所述的方法,得到所述视频文件中每一视频帧的视频质量参数。
S203、对所述视频文件中的每一视频帧进行运动估计,得到所述视频文件中每一视频帧的视频质量权值。
其中,步骤S203具体包括:
计算所述视频文件中每一视频帧的平均绝对误差MAD;
若所述视频帧不是所述视频文件的最后一个视频帧,则根据所述视频帧的MAD、以及所述视频帧的后一个视频帧的MAD,计算所述视频帧的视频运动信息,将得到的所述视频帧的视频运动信息作为所述视频帧的视频质量权值;或者,
若所述视频帧为所述视频文件的最后一个视频帧,则根据所述视频帧的MAD、以及所述视频帧的前一个视频帧的MAD,计算所述视频帧的视频运动信息,将得到的所述视频帧的视频运动信息作为所述视频帧的视频质量权值。
若所述视频帧不是所述视频文件的最后一个视频帧,则根据第三公式计算所述视频帧的视频运动信息;所述第三公式为:
&beta; i = m e i + 1 / m e i ;
其中,i表示所述视频帧,βi表示所述视频帧的视频运动信息,
Figure BDA0000418364350000152
表示所述视频帧的后一个视频帧的MAD,
Figure BDA0000418364350000153
表示所述视频帧的MAD。
若所述视频帧为所述视频文件的最后一个视频帧,则根据第四公式计算所述视频帧的视频运动信息;所述第四公式为:
&beta; i = m e i - 1 / m e i ;
其中,i表示所述视频帧,βi表示所述视频帧的视频运动信息,表示所述视频帧的前一个视频帧的MAD,
Figure BDA0000418364350000156
表示所述视频帧的MAD。
S204、对所述视频文件中每一视频帧的视频质量参数、以及每一视频帧相对应的视频质量权值进行加权处理,得到所述视频文件的视频质量参数。
具体的,通过步骤S201得到的所述视频文件中每一视频帧的视频质量参数,以及步骤S203得到的每一视频帧的视频质量权值,根据第五公式得到所述视频文件的视频质量参数;其中,所述第五公式为:
VQ = &Sigma; j = 1 F w j V Q f j ;
其中,VQ表示所述视频文件的视频质量参数,j表示所述视频文件的第j个视频帧,F表示所述视频文件总的视频帧数,
Figure BDA0000418364350000158
表示所述视频文件的第j个视频帧的视频质量参数,wj表示视频文件的第j个视频帧的视频质量权值, w j = 1 2 + &Sigma; i = 1 F - 2 &beta; i , j = 1,2 &beta; j - 2 2 + &Sigma; i = 1 F - 2 &beta; i , j = 3 , &CenterDot; &CenterDot; &CenterDot; , F , βi表示第i个视频帧的视频运动信息。
本发明实施例提供的一种视频质量评估的方法,通过对视频文件中的任一视频帧进行质量还原处理,得到该视频帧的参考视频帧,并对该视频帧及其参考视频帧进行质量评估处理,得到该视频帧的视频质量参数,实现了在没有原始非失真参考视频的情况下,对视频质量进行评估,扩大了应用范围;进一步的,按照上述方法得到视频文件中每一视频帧的视频质量参数,并对视频文件中的每一视频帧进行运动估计,得到视频文件中每一视频帧的视频质量权值,对视频文件中每一视频帧的视频质量参数、以及相对应的视频质量权值进行加权处理,得到视频文件的视频质量参数,通过运动估计考虑了人眼了视觉特性,从而能获得与主观感知更为一致的视频质量指标,提高了视频质量评估的准确度。
实施例三、
本发明提供了一种视频质量评估的方法,其应用场景为如图3所示,对输入视频进行编码,经过传输后进行解码处理,得到待评估视频,对经过编解码的待评估视频进行质量评估,如图4所示,包括:
步骤401、获取待评估视频。
步骤402、对输入的待评估视频进行分帧处理,获取待评估视频的待评估视频帧。
一般情况下,视频是由一系列的单帧图像(也可称为单帧视频或者视频帧)构成,这里的分帧处理是指按照视频的格式,依次读取视频文件里的单帧图像数据,分别进行保存,以便后续的计算的使用;本实施例中待评估视频文件的每一个单帧视频称为待评估视频帧。
假设,待评估视频共有F个待评估视频帧,且每一个待评估视频帧的大小为W×H,其中,W表示每一个待评估视频帧的高、H表示每一个待评估视频帧的宽。
步骤403、对待评估视频中每一个待评估视频帧添加噪声,得到加噪后的待评估视频帧。
其中,所述噪声可以是高斯噪声,也可以是白噪声,当然不限于此。
步骤404、计算加噪后的待评估视频帧中的噪声方差。
具体的,对第i个待评估视频帧添加噪声ni,其中1≤i≤F,计算F个噪声的平均值m,然后计算F个待评估视频帧中每一个待评估视频帧中的噪声方差。
步骤405、若计算得到的待评估视频帧中的噪声方差大于15,则采用ATV滤波算法对加噪后的待评估视频帧进行滤波,得到待评估视频帧的参考视频帧;若计算得到的待评估视频帧中的噪声方差小于等于15,则采用NLM滤波算法对加噪后的待评估视频帧进行滤波,得到待评估视频帧的参考视频帧。
其中,对于ATV滤波算法通过第六公式对其进行具体说明,所述第六公式为:
arg min { 1 2 &Integral; &Omega; &lambda; &times; | u - f | 2 d&Omega; + &Integral; &Omega; | &dtri; u | &tau; d&Omega; } ;
其中,u表示全变差(total variation,简称TV)基准,f表示添加噪声后待评估视频帧的失真率,Ω表示待评估视频帧的像素域,|u-f|2表示待评估视频帧的保真项,
Figure BDA0000418364350000172
表示正则化项,λ表示正则化参数,且λ>0,系数τ通过第七公式自适应获得,所述第七公式为边缘指示函数,具体为:
&tau; = 1 + 1 1 + k &times; | &dtri; &CircleTimes; u | 2 ;
其中,系数τ在1-2之间,k表示参考因子,u表示TV基准,表示待评估视频帧中像素块的边缘化程度,其中,
Figure BDA0000418364350000175
表示梯度算子,如果在待评估视频帧的边缘区域时,则
Figure BDA0000418364350000176
那么τ→1,此时ATV的作用主要起保留待评估视频帧的边缘;如果在待评估视频帧的同质区域(即灰度比较均一的区域)时,则
Figure BDA0000418364350000177
那么τ→2,此时ATV的作用主要是用来平滑图像中的噪声,因此所提出的ATV滤波算法通过自适应的选择系数τ,很自然的结合了L2范数空间的谐波去噪模型和L1空间的TV模型,能在平滑噪声和保留边缘之间保持平衡。
对于NLM滤波算法,通过第八公式对其进行具体说明,所述第八公式为:
NLM f ( x ) : = 1 C ( x ) &Integral; &Omega; s ( x ) &omega; ( x , x + z ) f ( x + z ) dz ;
其中,f表示定义在一个有界区域
Figure BDA00004183643500001810
的待评估视频帧,C(x)为归一化因子,Ωs(x)=[-Rs,Rs]×[-Rs,Rs]表示x∈Ω附近的搜索窗口,RS表示搜索尺度,ω(x,x+z)为加权函数,定义为ω(x,o),f(x+z)表示待评估视频帧的参考视频帧;用第九公式定义加权函数ω(x,o),用第十公式定义归一化因子C(x)。
所述第九公式和第十公式分别为:
&omega; ( x , o ) = exp [ - 1 &rho; 2 &Integral; &Omega; N G &sigma; ~ ( z ) | f ( x + z ) - f ( o + z ) | 2 dz ] ;
C ( x ) = &Integral; &Omega; s ( x ) &omega; ( x , x + z ) dz ;
其中,ρ为控制滤波程度的正的平滑因子,ΩN=[-RN,RN]×[-RN,RN]为临近窗口,RN表示搜索窗口旁边的第n个临近窗口,
Figure BDA00004183643500001811
是标准差为
Figure BDA00004183643500001812
的高斯核函数,x和o表示同一像素的不同位置,f(x+z)和f(o+z)表示同一像素在不同位置的像素值,z表示搜索窗口内该像素的位置。
其中,每一个待评估视频帧相对应的参考视频帧的大小相同,仍为W×H,其中,W表示每一个待评估视频帧及其相对应的参考视频帧的高、H表示每一个待评估视频帧及其相对应的参考视频帧的宽。
步骤406、计算待评估视频帧和与待评估视频帧相对应的参考视频帧之间的SSIM值。
具体的,对待评估视频中的每一个待评估视频帧和与待评估视频帧对应的参考视频帧分别进行相同的采样,将每一个待评估视频帧和与待评估视频帧相对应的参考视频帧分为g×t大小的像素块,然后根据第十一公式计算相对应的两个像素块的局部SSIM值,得到每一个待评估视频帧的SSIM图。在本实施例中,令g=13,t=13。
所述第十一公式为:
SSIM ( &mu; u i , &mu; u i &OverBar; ) = ( 2 &mu; u i &mu; u i &OverBar; + C 1 ) ( 2 &sigma; u i u i &OverBar; + C 2 ) ( &mu; u i 2 + &mu; u i &OverBar; 2 + C 1 ) ( &sigma; u i 2 + &sigma; u i &OverBar; 2 + C 2 ) ;
其中,i表示第i个局部窗口的像素块,ui
Figure BDA0000418364350000184
分别表示待评估视频帧和与待评估视频帧相对应的参考视频帧的第i个局部窗口的像素块,
Figure BDA0000418364350000186
分别表示待评估视频帧和与待评估视频帧相对应的参考视频帧的第i个局部窗口的像素块ui
Figure BDA0000418364350000187
的亮度均值,
Figure BDA0000418364350000188
Figure BDA0000418364350000189
分别表示待评估视频帧和与待评估视频帧相对应的参考视频帧的第i个局部窗口的像素块ui
Figure BDA0000418364350000191
的方差,
Figure BDA0000418364350000192
表示待评估视频帧和与待评估视频帧相对应的参考视频帧的第i个局部窗口的像素块ui
Figure BDA0000418364350000193
的相关系数,C1和C2表示为了避免第十一公式中分母值较小时引起的不稳定而增加的常量。
进一步的,对第十一公式计算得到的SSIM值按照第一公式进行修正,得到修正后的SSIM值。
所述第一公式为:
SSIMf=(J-SSIM)×w;
其中,SSIMf表示修正后待评估视频帧中所有分块与对应的参考视频帧分块之间的SSIM值,SSIMt表示修正前待评估视频帧中所有分块与对应的参考视频帧中的分块之间的SSIM值,J表示修正常量,w表示修正因子。在本实施例中,令J=1,w=100。
步骤407、对待评估视频中每一个待评估视频帧进行KR处理,得到待评估视频中每一个待评估视频帧的视觉注意信息权值。
由于大脑对人眼接收到信息的受刺激程度不同,表现为感兴趣区域(或显著性较高的区域),即人眼视觉系统(Human Visual System,简称HVS)视觉注意,其中,KR模型是一种模拟人眼视觉系统的模型,用于视觉注意信息的提取计算;KR模型采用亮度、颜色、运动等多个特征(或显著性体)来表征视频,通过一个全局最小化的过程来进行显著性的计算,其中,显著性响应的极值被认为是显著性点。主要计算步骤:
(1)将待评估视频的每一个待评估视频帧分解为亮度、颜色和运动3个显著性体,记为Ci(i=1,2,3)。
其中,C1表示待评估视频帧的亮度,C2表示待评估视频帧的颜色,C3表示待评估视频帧的运动。
(2)将每一个显著性体进一步分解为不同的尺度j,得到一系列的高斯塔,记为C={Ci,j},其中i=1,2,3,j=1,2,L,L。
(3)将各个显著性体通过最小化能力函数进行调整,得到一组显著值集合,即调整后的最小化高斯塔,记为其中,i=1,2,3,j=1,2,L,L。
其中,用第十二公式表示最小化能力函数,所述第十二公式为:
E(C)=λd×Ed(C)+λs×Es(C);
其中,λd表示数据项系数,λs表示平滑因子系数,Ed(C)表示数据项,Es(C)表示平滑因子;数据项Ed(C)和平滑因子Es(C)分别定义为第十三公式和第十四公式。
所述第十三公式为:
E d ( C ) = &Sigma; i &Sigma; l &Sigma; q ( C i , l ( q ) - C i , l 0 ( q ) ) 2 ;
其中,i表示第i个显著性体,1<i<3,j表示第j尺度,1<j<L,q表示待评估视频帧中单独的时空点,Ci,j(q)表示待评估视频中第i个显著性体第j尺度时第q个时空点的高斯塔,
Figure BDA0000418364350000202
表示待评估视频中第i个显著性体第j尺度时第q个时空点的初始估计值。
所述第十四公式为:
ES(C)=E1(C)+E2(C)+E3(C);
其中,E1、E2和E3分别为:
E 1 ( C ) = &Sigma; i &Sigma; j &Sigma; q ( C i , j ( q ) - 1 | N q | &Sigma; r &Element; N q C i , j ( r ) ) 2 ;
E 1 ( C ) = &Sigma; i &Sigma; j &Sigma; q ( C i , j ( q ) - 1 B - 1 &Sigma; k &NotEqual; i C k , j ( q ) ) 2 ;
E 3 ( C ) = &Sigma; i &Sigma; j &Sigma; q ( C i , j ( q ) - 1 L - 1 &Sigma; n &NotEqual; j C i , n ( q ) ) 2 ;
其中,B表示显著性体的总个数,L表示分解的尺度总个数,i表示第i个显著性体,1<i<B,j表示第j尺度,1<j<L,q表示待评估视频帧中单独的时空点,Nq表示q的26个相邻点集合,Ci,j(q)表示待评估视频中第i个显著性体第j尺度时第q个时空点的高斯塔,Ci,j(r)表示待评估视频中第i个显著性体第j尺度时第r个时空点的高斯塔,Ci,n(q)表示表示待评估视频中第i个显著性体第n尺度时第q个时空点的高斯塔,1<n<L且n≠j,Ck,j(q)表示待评估视频中第k个显著性体第j尺度时第q个时空点的高斯塔,1<k<M且k≠i。在本实施例中,令B=3。
(4)对调整后的最小化高斯塔通过第十五公式求平均,得到最后的显著性。
所述第十五公式为:
S = { S j } = 1 3 &Sigma; i = 1 3 C &OverBar; i , j , j = 1,2 , &CenterDot; &CenterDot; &CenterDot; , L
其中,i表示第i个显著性体,1<i<3,
Figure BDA0000418364350000212
表示调整后的显著性值,S为显著性体的平均值。
进一步的,选取第一尺度的结果为最终的显著性图,第一尺度为令j=1,则
S 1 = 1 3 &Sigma; i = 1 3 C &OverBar; i , 1 ;
假设待评估视频共有F个视频帧,则每一视频帧用S1f表示,其中,1≤f≤F。
步骤408、根据待评估视频帧的视觉注意信息权值、以及待评估视频帧的SSIM值,根据第二公式获得待评估视频帧的视频质量。
其中,所述第二公式为:
VQ f = &Sigma; m = 1 M &Sigma; n = 1 N S 1 f . &times; SSIM f &Sigma; m = 1 M &Sigma; n = 1 N S 1 f ( m , n ) ;
其中,VQf表示待评估视频帧的视频质量参数,M和N分别表示对待评估视频帧与参考视频帧进行采样分块后得到的垂直方向和水平方向的分块个数,SSIMf表示修正后待评估视频帧中所有分块与对应的参考视频帧中的分块之间的SSIM值,S1f表示所述待评估视频帧所有分块的视觉注意信息权值,S1f(m,n)表示所述待评估视频帧采样分块后第(m,n)个分块的视觉注意信息权值,1<m<M,1<n<N。
步骤409、对待评估视频中的每一待评估视频帧进行运动估计,获得待评估视频中每一个待评估视频帧的视频质量权值。
其中,运动估计的基本思想是将图像序列的每一帧分成许多互不重叠的宏块,并认为宏块内所有像素的位移量都相同,然后对每个宏块到参考帧某一给定特定搜索范围内根据一定的匹配准则找出与当前块最相似的块,即匹配块,匹配块与当前块的相对位移即为运动矢量。视频压缩的时候,只需保存运动矢量和残差数据就可以完全恢复出当前块。
一般情况下,运动估计的准则主要包括:最小均方差函数(meansquare error,简称MSE)、平均绝对误差、阈值差别计数;其中,平均绝对误差用于描述连续运动的视频内图像在时间上的距离,本实施例采用平均绝对误差来获得待评估视频帧的运动信息。
其中,用me或MAD表示待评估视频帧的平均绝对误差。
具体的,计算第i个待评估视频帧的平均绝对误差包括:计算采样分块后第i个待评估视频帧中每一个分块的中心点在运动(d1,d2)后的位置矢量变化,然后对第i个待评估视频帧中所有分块求和取平均,得到第i个待评估视频帧的平均绝对误差,假定第i个待评估视频帧中的第(m,n)个分块的中心点为(am,bn),在运动矢量(d1,d2)之后得到的第i个待评估视频帧的平均绝对误差用第十六公式来进行表述;所述第十六公式为:
MAD i ( d 1 , d 2 ) = 1 g &times; t &Sigma; ( a m , b n ) &Element; B | s ( a m , b n , i ) - s ( a m + d 1 , b n + d 2 , i + 1 ) | ;
其中,i表示第i个待评估视频帧,1<i<Q,(d1,d2)表示第i个待评估视频帧中的每一个小分块的中心点的运动位置大小,g表示待评估视频帧采样后的视频分块的宽,t表示待评估视频帧采样后的视频分块的高,B表示第i个待评估视频帧的位置区域范围,s(am,bn,i)表示第i个待评估视频帧中第(m,n)个分块的中心点当前所处的位置,s(am+d1,bn+d2,i+1)表示第i个待评估视频帧中第(m,n)个分块的中心点在运动(d1,d2)后所处的位置,1<m<M,1<n<N。
根据得到的待评估视频中每一个待评估视频帧的MAD,根据第十五公式计算得到待评估视频中每一个待评估视频帧的视频运动信息,并将该视频运动信息作为待评估视频帧的视频质量权值。
若所述待评估视频帧不是所述视频文件的最后一个视频帧,则根据第三公式计算待评估视频帧的视频运动信息;所述第三公式为:
&beta; i = m e i + 1 / m e i ;
其中,i表示待评估视频帧,βi表示待评估视频帧的视频运动信息,
Figure BDA0000418364350000223
表示待评估视频帧的后一个视频帧的MAD,
Figure BDA0000418364350000224
表示待评估视频帧的MAD。
若所述待评估视频帧为所述视频文件的最后一个视频帧,则根据第四公式计算所述待评估视频帧的视频运动信息;所述第四公式为:
&beta; i = m e i - 1 / m e i ;
其中,i表示待评估视频帧,βi表示待评估视频帧的视频运动信息,表示待评估视频帧的前一个视频帧的MAD,
Figure BDA0000418364350000233
表示待评估视频帧的MAD。
进一步的,对于不同的视频序列,视频运动信息值波动越大,表明视频的运动信息越丰富,场景变化也越明显。
步骤410、对待评估视频中每一个待评估视频帧的视频质量参数、以及相对应的待评估视频帧的视频质量权值进行加权处理,根据第五公式得到待评估视频的视频质量。
其中,所述第五公式为:
VQ = &Sigma; j = 1 F w j V Q f j ;
其中,VQ表示待评估视频的视频质量参数,j表示待评估视频的第j个视频帧,F表示待评估视频总的视频帧数,
Figure BDA0000418364350000235
表示待评估视频的第j个视频帧的视频质量参数,wj表示待评估视频的第j个视频帧的视频质量权值, w j = 1 2 + &Sigma; i = 1 F - 2 &beta; i , j = 1,2 &beta; j - 2 2 + &Sigma; i = 1 F - 2 &beta; i , j = 3 , &CenterDot; &CenterDot; &CenterDot; , F , βi表示第i个视频帧的视频运动信息。
需要说明的是,本实施例中所述的方法还可以应用到实时视频质量的评估中,在一般的无参考视频的情况下,对获取的实时视频的质量进行评估。具体的,在评估实时监控视频系统的性能时,用具有摄像功能的设备拍摄一段视频,利用本实施例中所述的方法实现在无参考视频下对实时监控的视频进行全参考的SSIM评估,同时引入视觉注意信息和视频运动信息,通过综合考虑,实现与主观评估相符合的实时无参考视频质量的评估。
本发明实施例提供了一种视频质量评估的方法,通过对视频文件中的任一视频帧进行质量还原处理,得到该视频帧的参考视频帧,并对该视频帧及其参考视频帧进行质量评估处理,得到该视频帧的视频质量参数,实现了在没有原始非失真参考视频的情况下,对视频质量进行评估,扩大了应用范围;进一步的,按照上述方法得到视频文件中每一视频帧的视频质量参数,并对视频文件中的每一视频帧进行运动估计,得到视频文件中每一视频帧的视频质量权值,对视频文件中每一视频帧的视频质量参数、以及相对应的视频质量权值进行加权处理,得到视频文件的视频质量参数,通过运动估计考虑了人眼了视觉特性,从而能获得与主观感知更为一致的视频质量指标,提高了视频质量评估的准确度。
实施例四、
本发明提供了一种视频质量评估的装置50,如图5所示,包括:
第一获取模块501,用于从视频文件中获取第一视频帧;所述第一视频帧为所述视频文件中的任一视频帧;
质量还原模块502,用于对所述第一获取模块501得到的第一视频帧进行质量还原处理,得到第二视频帧;所述第二视频帧作为所述第一视频帧的参考视频帧;
第二获取模块503,用于对所述第一获取模块501得到的第一视频帧和所述质量还原模块502得到的第二视频帧进行质量评估处理,获取所述第一视频帧的视频质量参数。
可选的,如图6所示,所述质量还原模块502包括:加噪单元504、计算单元505、滤波单元506;
所述加噪单元504,用于在所述第一获取模块501得到的第一视频帧中添加噪声,得到加噪第一视频帧;
所述计算单元505,用于计算所述加噪单元504得到的加噪第一视频帧中的噪声方差;
所述滤波单元506,用于若所述计算单元505计算得到的噪声方差大于预先设定的阈值,则采用自适应全变差ATV方式对所述加噪第一视频帧进行滤波,得到第二视频帧;或者,若所述计算单元505计算得到的噪声方差小于预先设定的阈值,则采用非局部均值NLM方式对所述加噪第一视频帧进行滤波,得到第二视频帧;所述预先设定的阈值为通过对不同视频文件中每一视频帧进行滤波处理统计得到。
可选的,如图6所示,所述第二获取模块503包括:第一获取单元507、第二获取单元508、第三获取单元509;
所述第一获取单元507,用于利用相似性度量算法,获取所述第一获取模块501得到的第一视频帧和所述质量还原模块502得到的第二视频帧之间的结构相似度SSIM值;
所述第二获取单元508,用于对所述第一获取模块501得到的第一视频帧进行稠密时空显著性KR处理,获取所述第一视频帧的视觉注意信息权值;
所述第三获取单元509,用于对所述第一获取单元507得到的第一视频帧与第二视频帧之间的SSIM值、以及所述第二获取单元508得到的所述第一视频帧的视觉注意信息权值进行加权处理,得到所述第一视频帧的视频质量参数。
可选的,如图6所示,所述第一获取单元507包括:采样子单元510、计算子单元511、修正子单元512;
所述采样子单元510,用于对所述第一视频帧和所述第二视频帧分别进行相同的采样分块;
所述计算子单元511,用于计算所述采样子单元511得到的所述第一视频帧和所述第二视频帧相对应分块之间的SSIM值;
所述修正子单元512,用于对所述计算子单元512得到的各个SSIM值进行修正处理,得到所述第一视频帧中所有分块与对应的所述第二视频帧中的分块之间的SSIM值。
可选的,所述修正子单元512具体用于根据第一公式对所述各个SSIM值进行修正;
所述第一公式为:
SSIMf=(J-SSIMt)×w;
其中,SSIMf表示修正后所述第一视频帧中所有分块与对应的所述第二视频帧中的分块之间的SSIM值,SSIMt表示修正前所述第一视频帧中所有分块与对应的所述第二视频帧中的分块之间的SSIM值,J表示修正常量,w表示修正因子。
可选的,所述第三获取单元509用于根据第二公式得到所述第一视频帧的视频质量参数;所述第二公式为:
VQ f = &Sigma; m = 1 M &Sigma; n = 1 N S 1 f . &times; SSIM f &Sigma; m = 1 M &Sigma; n = 1 N S 1 f ( m , n ) ;
其中,VQf表示所述第一视频帧的视频质量参数,M和N分别表示对所述第一视频帧或所述第二视频帧进行采样分块后得到的垂直方向和水平方向的分块个数,SSIMf表示修正后所述第一视频帧中所有分块与对应的所述第二视频帧中的分块之间的SSIM值,S1f表示所述第一视频帧所有分块的视觉注意信息权值,S1f(m,n)表示所述第一视频帧采样分块后第(m,n)个分块的视觉注意信息权值,1<m<M,1<n<N。
本发明实施例提供了一种视频质量评估的方法、装置和系统,通过对视频文件中的任一视频帧进行质量还原处理,得到该视频帧的参考视频帧,并对该视频帧及其参考视频帧进行质量评估处理,得到该视频帧的视频质量参数,实现了在没有原始非失真参考视频的情况下,对视频质量进行评估,扩大了应用范围。
实施例五、
本发明实施例提供了一种视频质量评估的装置,如图7所示,包括:
第一获取模块701,用于获取视频文件;所述视频文件包括:至少两个视频帧;
第二获取模块702,用于按照权利要求1-6任一项所述的方法,得到所述第一获取模块701得到的视频文件中每一视频帧的视频质量参数;
运动估计模块703,用于所述第一获取模块701得到的视频文件中的每一视频帧进行运动估计,得到所述视频文件中每一视频帧的视频质量权值。
加权处理模块704,用于对第二获取模块702得到的所述视频文件中每一视频帧的视频质量参数、以及所述运动估计模块703得到的每一视频帧相对应的视频质量权值进行加权处理,得到所述视频文件的视频质量参数。
可选的,如图8所示,所述运动估计模块703包括:第一计算单元705、第二计算单元706;
其中,所述第一计算单元705,用于计算所述视频文件中的每一视频帧的平均绝对误差MAD;
所述第二计算单元706,用于若所述视频帧不是所述视频文件的最后一个视频帧,则根据所述第一计算单元705计算得到的所述视频帧的MAD、以及所述视频帧的后一个视频帧的MAD,计算所述视频帧的视频运动信息,将得到的所述视频帧的视频运动信息作为所述视频帧的视频质量权值;或者,若所述视频帧为所述视频文件的最后一个视频帧,则根据所述第一计算单元705计算得到的所述视频帧的MAD、以及所述视频帧的前一个视频帧的MAD,计算所述视频帧的视频运动信息,将得到的所述视频帧的视频运动信息作为所述视频帧的视频质量权值。
可选的,所述第二计算单元706具体用于根据第三公式计算所述视频帧的视频运动信息;所述第三公式为:
&beta; i = m e i + 1 / m e i ;
其中,i表示所述视频帧,βi表示所述视频帧的视频运动信息,表示所述视频帧的后一个视频帧的MAD,
Figure BDA0000418364350000273
表示所述视频帧的MAD。
可选的,第二计算单元706具体用于根据第四公式计算所述视频帧的视频运动信息;所述第四公式为:
&beta; i = m e i - 1 / m e i ;
其中,i表示所述视频帧,βi表示所述视频帧的视频运动信息,
Figure BDA0000418364350000275
表示所述视频帧的前一个视频帧的MAD,
Figure BDA0000418364350000281
表示所述视频帧的MAD。
可选的,所述加权处理模块704用于根据第五公式得到所述视频文件的视频质量参数;所述第五公式为:
VQ = &Sigma; j = 1 F w j V Q f j ;
其中,VQ表示所述视频文件的视频质量参数,j表示所述视频文件的第j个视频帧,F表示所述视频文件总的视频帧数,表示所述视频文件的第j个视频帧的视频质量参数,wj表示视频文件的第j个视频帧的视频质量权值, w j = 1 2 + &Sigma; i = 1 F - 2 &beta; i , j = 1,2 &beta; j - 2 2 + &Sigma; i = 1 F - 2 &beta; i , j = 3 , &CenterDot; &CenterDot; &CenterDot; , F , βi表示第i个视频帧的视频运动信息。
本发明实施例提供了一种视频质量评估的装置,通过对视频文件中的任一视频帧进行质量还原处理,得到该视频帧的参考视频帧,并对该视频帧及其参考视频帧进行质量评估处理,得到该视频帧的视频质量参数,实现了在没有原始非失真参考视频的情况下,对视频质量进行评估,扩大了应用范围;进一步的,按照上述方法得到视频文件中每一视频帧的视频质量参数,并对视频文件中的每一视频帧进行运动估计,得到视频文件中每一视频帧的视频质量权值,对视频文件中每一视频帧的视频质量参数、以及相对应的视频质量权值进行加权处理,得到视频文件的视频质量参数,通过运动估计考虑了人眼了视觉特性,从而能获得与主观感知更为一致的视频质量指标,提高了视频质量评估的准确度。
实施例六、
本发明提供了一种视频质量评估的装置90,如图9所示,包括:存储器901、处理器902、总线系统903。
其中,所述存储器901和所述处理器902之间是通过总线系统903耦合在一起的,其中总线系统903除包括数据总线之外,还可以包括电源总线、控制总线和状态信号总线等。但是为了清楚说明起见,在图中将各种总线都标为总线系统903。
所述存储器901可以包括只读存储器和随机存取存储器,并向处理器902提供指令和数据。所述存储器901的一部分还可以包括非易失性随机存取存储器(NVRAM)。
所述存储器901存储了如下的元素,可执行模块或者数据结构,或者它们的子集,或者它们的扩展集:
操作指令:包括各种操作指令,用于实现各种操作。
操作系统:包括各种系统程序,用于实现各种基础业务以及处理基于硬件的任务。
所述处理器902通过调用存储器901存储的操作指令(该操作指令可存储在操作系统中),执行如下操作:从视频文件中获取第一视频帧;所述第一视频帧为所述视频文件中的任一视频帧;对所述第一视频帧进行质量还原处理,得到第二视频帧;所述第二视频帧作为所述第一视频帧的参考视频帧;对所述第一视频帧和所述第二视频帧进行质量评估处理,获取所述第一视频帧的视频质量参数。
可选的,所述处理器902还用于,在所述第一视频帧中添加噪声,得到加噪第一视频帧;计算所述加噪第一视频帧中的噪声方差;若所述噪声方差大于预先设定的阈值,则采用自适应全变差ATV方式对所述加噪第一视频帧进行滤波,得到第二视频帧;或者,若所述噪声方差小于预先设定的阈值,则采用非局部均值NLM方式对所述加噪第一视频帧进行滤波,得到第二视频帧;所述预先设定的阈值为通过对不同视频文件中每一视频帧进行滤波处理统计得到。
可选的,所述处理器902还用于,利用相似性度量算法,得到所述第一视频帧与所述第二视频帧之间的结构相似度SSIM值;
对所述第一视频帧进行稠密时空显著性KR处理,获取所述第一视频帧的视觉注意信息权值;
对所述第一视频帧与所述第二视频帧之间的SSIM值、以及所述第一视频帧的视觉注意信息权值进行加权处理,得到所述第一视频帧的视频质量参数。
可选的,所述处理器902还用于,对所述第一视频帧和所述第二视频帧分别进行相同的采样分块;
计算所述第一视频帧和所述第二视频帧相对应分块之间的SSIM值;
对所述各个SSIM值进行修正处理,得到所述第一视频帧中所有分块与对应的所述第二视频帧中的分块之间的SSIM值。
可选的,所述处理器902还用于,根据第一公式对所述各个SSIM值进行修正;
所述第一公式为:
SSIMf=(J-SSIMt)×w;
其中,SSIMf表示修正后所述第一视频帧中所有分块与对应的所述第二视频帧中的分块之间的SSIM值,SSIMt表示修正前所述第一视频帧中所有分块与对应的所述第二视频帧中的分块之间的SSIM值,J表示修正常量,w表示修正因子。
可选的,所述处理器902还用于,根据第二公式得到所述第一视频帧的视频质量参数;所述第二公式为:
VQ f = &Sigma; m = 1 M &Sigma; n = 1 N S 1 f . &times; SSIM f &Sigma; m = 1 M &Sigma; n = 1 N S 1 f ( m , n ) ;
其中,VQf表示所述第一视频帧的视频质量参数,M和N分别表示对所述第一视频帧或所述第二视频帧进行采样分块后得到的垂直方向和水平方向的分块个数,SSIMf表示修正后所述第一视频帧中所有分块与对应的所述第二视频帧中的分块之间的SSIM值,S1f表示所述第一视频帧所有分块的视觉注意信息权值,S1f(m,n)表示所述第一视频帧采样分块后第(m,n)个分块的视觉注意信息权值,1<m<M,1<n<N。
上述本发明实施例揭示的方法可以应用于处理器902中,或者由处理器902实现。处理器902可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器902中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器902可以是通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器901,处理器902读取存储器901中的信息,结合其硬件完成上述方法的步骤。
本发明实施例提供了一种视频质量评估的装置,通过对视频文件中的任一视频帧进行质量还原处理,得到该视频帧的参考视频帧,并对该视频帧及其参考视频帧进行质量评估处理,得到该视频帧的视频质量参数,实现了在没有原始非失真参考视频的情况下,对视频质量进行评估,扩大了应用范围。
实施例七、
本发明提供了一种视频质量评估的装置100,如图10所示,包括:存储器1001、处理器1002、总线系统1003。
其中,所述存储器1001和所述处理器1002之间是通过总线系统1003耦合在一起的,其中总线系统1003除包括数据总线之外,还可以包括电源总线、控制总线和状态信号总线等。但是为了清楚说明起见,在图中将各种总线都标为总线系统1003。
所述存储器1001可以包括只读存储器和随机存取存储器,并向处理器1002提供指令和数据。所述存储器1001的一部分还可以包括非易失性随机存取存储器(NVRAM)。
所述存储器1001存储了如下的元素,可执行模块或者数据结构,或者它们的子集,或者它们的扩展集:
操作指令:包括各种操作指令,用于实现各种操作。
操作系统:包括各种系统程序,用于实现各种基础业务以及处理基于硬件的任务。
所述处理器1002通过调用存储器1001存储的操作指令(该操作指令可存储在操作系统中),执行如下操作:获取视频文件;所述视频文件包括:至少两个视频帧;按照实施例一中所述的方法,得到所述视频文件中每一视频帧的视频质量参数;对所述视频文件中的每一视频帧进行运动估计,得到所述视频文件中每一视频帧的视频质量权值;对所述视频文件中每一视频帧的视频质量参数、以及每一视频帧相对应的视频质量权值进行加权处理,得到所述视频文件的视频质量参数。
可选的,所述处理器1002用于,计算所述视频文件中每一视频帧的平均绝对误差MAD;
若所述视频帧不是所述视频文件的最后一个视频帧,则根据所述视频帧的MAD、以及所述视频帧的后一个视频帧的MAD,计算所述视频帧的视频运动信息,将得到的所述视频帧的视频运动信息作为所述视频帧的视频质量权值;或者,
若所述视频帧为所述视频文件的最后一个视频帧,则根据所述视频帧的MAD、以及所述视频帧的前一个视频帧的MAD,计算所述视频帧的视频运动信息,将得到的所述视频帧的视频运动信息作为所述视频帧的视频质量权值。
可选的,所述处理器1002具体用于,若所述视频帧不是所述视频文件的最后一个视频帧,则根据第三公式计算所述视频帧的视频运动信息;所述第三公式为:
&beta; i = m e i + 1 / m e i ;
其中,i表示所述视频帧,βi表示所述视频帧的视频运动信息,
Figure BDA0000418364350000322
表示所述视频帧的后一个视频帧的MAD,
Figure BDA0000418364350000323
表示所述视频帧的MAD。
可选的,所述处理器1002具体用于,若所述视频帧为所述视频文件的最后一个视频帧,则根据第四公式计算所述视频帧的视频运动信息;所述第四公式为:
&beta; i = m e i - 1 / m e i ;
其中,i表示所述视频帧,βi表示所述视频帧的视频运动信息,
Figure BDA0000418364350000331
表示所述视频帧的前一个视频帧的MAD,
Figure BDA0000418364350000332
表示所述视频帧的MAD。
可选的,所述处理器1002还用于,根据第五公式得到所述视频文件的视频质量参数;所述第五公式为:
VQ = &Sigma; j = 1 F w j V Q f j ;
其中,VQ表示所述视频文件的视频质量参数,j表示所述视频文件的第j个视频帧,F表示所述视频文件总的视频帧数,
Figure BDA0000418364350000334
表示所述视频文件的第j个视频帧的视频质量参数,wj表示视频文件的第j个视频帧的视频质量权值, w j = 1 2 + &Sigma; i = 1 F - 2 &beta; i , j = 1,2 &beta; j - 2 2 + &Sigma; i = 1 F - 2 &beta; i , j = 3 , &CenterDot; &CenterDot; &CenterDot; , F , βi表示第i个视频帧的视频运动信息。
上述本发明实施例揭示的方法可以应用于处理器1002中,或者由处理器1002实现。处理器1002可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器1002中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器1002可以是通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器1001,处理器1002读取存储器1001中的信息,结合其硬件完成上述方法的步骤。
本发明实施例提供了一种视频质量评估的装置,通过对视频文件中的任一视频帧进行质量还原处理,得到该视频帧的参考视频帧,并对该视频帧及其参考视频帧进行质量评估处理,得到该视频帧的视频质量参数,实现了在没有原始非失真参考视频的情况下,对视频质量进行评估,扩大了应用范围;进一步的,按照上述方法得到视频文件中每一视频帧的视频质量参数,并对视频文件中的每一视频帧进行运动估计,得到视频文件中每一视频帧的视频质量权值,对视频文件中每一视频帧的视频质量参数、以及相对应的视频质量权值进行加权处理,得到视频文件的视频质量参数,通过运动估计考虑了人眼了视觉特性,从而能获得与主观感知更为一致的视频质量指标,提高了视频质量评估的准确度。
实施例八、
本发明实施例提供了一种视频质量评估的系统,如图11所示,包括:存储器1101、处理器1102、总线系统1103;
其中,所述存储器1101和所述处理器1102之间是通过总线系统1103耦合在一起的,其中总线系统1103除包括数据总线之外,还可以包括电源总线、控制总线和状态信号总线等。但是为了清楚说明起见,在图中将各种总线都标为总线系统1103。
所述存储器1101可以包括只读存储器和随机存取存储器,并向处理器1102提供指令和数据。所述存储器1101的一部分还可以包括非易失性随机存取存储器(NVRAM)。
所述存储器1101存储了如下的元素,可执行模块或者数据结构,或者它们的子集,或者它们的扩展集:
操作指令:包括各种操作指令,用于实现各种操作。
操作系统:包括各种系统程序,用于实现各种基础业务以及处理基于硬件的任务。
所述处理器1102通过调用存储器1101存储的操作指令(该操作指令可存储在操作系统中),以执行实施例一,和/或实施例二所述的视频质量评估的方法。
上述本发明实施例揭示的视频质量评估的方法可以应用于处理器1102中,或者由处理器1102实现。处理器1102可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器1102中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器1102可以是通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器1101,处理器1102读取存储器1101中的信息,结合其硬件完成上述方法的步骤。
本发明实施例提供了一种视频质量评估的系统,通过对视频文件中的任一视频帧进行质量还原处理,得到该视频帧的参考视频帧,并对该视频帧及其参考视频帧进行质量评估处理,得到该视频帧的视频质量参数,实现了在没有原始非失真参考视频的情况下,对视频质量进行评估,扩大了应用范围;进一步的,按照上述方法得到视频文件中每一视频帧的视频质量参数,并对视频文件中的每一视频帧进行运动估计,得到视频文件中每一视频帧的视频质量权值,对视频文件中每一视频帧的视频质量参数、以及相对应的视频质量权值进行加权处理,得到视频文件的视频质量参数,通过运动估计考虑了人眼了视觉特性,从而能获得与主观感知更为一致的视频质量指标,提高了视频质量评估的准确度。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理包括,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (23)

1.一种视频质量评估的方法,其特征在于,包括:
从视频文件中获取第一视频帧;所述第一视频帧为所述视频文件中的任一视频帧;
对所述第一视频帧进行质量还原处理,得到第二视频帧;所述第二视频帧作为所述第一视频帧的参考视频帧;
对所述第一视频帧和所述第二视频帧进行质量评估处理,获取所述第一视频帧的视频质量参数。
2.根据权利要求1所述的方法,其特征在于,所述对所述第一视频帧进行质量还原处理,得到第二视频帧包括:
在所述第一视频帧中添加噪声,得到加噪第一视频帧;
计算所述加噪第一视频帧中的噪声方差;
若所述噪声方差大于预先设定的阈值,则采用自适应全变差ATV方式对所述加噪第一视频帧进行滤波,得到第二视频帧;或者,
若所述噪声方差小于预先设定的阈值,则采用非局部均值NLM方式对所述加噪第一视频帧进行滤波,得到第二视频帧;所述预先设定的阈值为通过对不同视频文件中每一视频帧进行滤波处理统计得到。
3.根据权利要求1所述的方法,其特征在于,所述对所述第一视频帧和所述第二视频帧进行质量评估处理,获取所述第一视频帧的视频质量参数包括:
利用相似性度量算法,得到所述第一视频帧与所述第二视频帧之间的结构相似度SSIM值;
对所述第一视频帧进行稠密时空显著性KR处理,获取所述第一视频帧的视觉注意信息权值;
对所述第一视频帧与所述第二视频帧之间的SSIM值、以及所述第一视频帧的视觉注意信息权值进行加权处理,得到所述第一视频帧的视频质量参数。
4.根据权利要求3所述的方法,其特征在于,所述利用相似性度量算法,获取所述第一视频帧与所述第二视频帧之间的结构相似度SSIM值包括:
对所述第一视频帧和所述第二视频帧分别进行相同的采样分块;
计算所述第一视频帧和所述第二视频帧相对应分块之间的SSIM值;
对所述各个SSIM值进行修正处理,得到所述第一视频帧中所有分块与对应的所述第二视频帧中的分块之间的SSIM值。
5.根据权利要求4所述的方法,其特征在于,所述对所述各个SSIM值进行修正处理包括:根据第一公式对所述各个SSIM值进行修正;
所述第一公式为:
SSIMf=(J-SSIMt)×w;
其中,SSIMf表示修正后所述第一视频帧中所有分块与对应的所述第二视频帧中的分块之间的SSIM值,SSIMt表示修正前所述第一视频帧中所有分块与对应的所述第二视频帧中的分块之间的SSIM值,J表示修正常量,w表示修正因子。
6.根据权利要求5所述的方法,其特征在于,所述对所述第一视频帧与所述第二视频帧之间的SSIM值、以及所述第一视频帧的视觉注意信息权值进行加权处理,得到所述第一视频帧的视频质量参数包括:
根据第二公式得到所述第一视频帧的视频质量参数;所述第二公式为:
VQ f = &Sigma; m = 1 M &Sigma; n = 1 N S 1 f . &times; SSIM f &Sigma; m = 1 M &Sigma; n = 1 N S 1 f ( m , n ) ;
其中,VQf表示所述第一视频帧的视频质量参数,M和N分别表示对所述第一视频帧或所述第二视频帧进行采样分块后得到的垂直方向和水平方向的分块个数,SSIMf表示修正后所述第一视频帧中所有分块与对应的所述第二视频帧中的分块之间的SSIM值,S1f表示所述第一视频帧所有分块的视觉注意信息权值,S1f(m,n)表示所述第一视频帧采样分块后第(m,n)个分块的视觉注意信息权值,1<m<M,1<n<N。
7.一种视频质量评估的方法,其特征在于,包括:
获取视频文件;所述视频文件包括:至少两个视频帧;
按照权利要求1-6任一项所述的方法,得到所述视频文件中每一视频帧的视频质量参数;
对所述视频文件中的每一视频帧进行运动估计,得到所述视频文件中每一视频帧的视频质量权值;
对所述视频文件中每一视频帧的视频质量参数、以及每一视频帧相对应的视频质量权值进行加权处理,得到所述视频文件的视频质量参数。
8.根据权利要求7所述的方法,其特征在于,所述对所述视频文件中的每一视频帧进行运动估计,得到视频文件中每一视频帧的视频质量权值包括:
计算所述视频文件中每一视频帧的平均绝对误差MAD;
若所述视频帧不是所述视频文件的最后一个视频帧,则根据所述视频帧的MAD、以及所述视频帧的后一个视频帧的MAD,计算所述视频帧的视频运动信息,将得到的所述视频帧的视频运动信息作为所述视频帧的视频质量权值;或者,
若所述视频帧为所述视频文件的最后一个视频帧,则根据所述视频帧的MAD、以及所述视频帧的前一个视频帧的MAD,计算所述视频帧的视频运动信息,将得到的所述视频帧的视频运动信息作为所述视频帧的视频质量权值。
9.根据权利要求8所述的方法,其特征在于,所述若所述视频帧不是所述视频文件的最后一个视频帧,则根据所述视频帧的MAD、以及所述视频帧的后一个视频帧的MAD,计算所述视频帧的视频运动信息,将得到的所述视频帧的视频运动信息作为所述视频帧的视频质量权值包括:
根据第三公式计算所述视频帧的视频运动信息;所述第三公式为:
&beta; i = m e i + 1 / m e i ;
其中,i表示所述视频帧,βi表示所述视频帧的视频运动信息,
Figure FDA0000418364340000032
表示所述视频帧的后一个视频帧的MAD,表示所述视频帧的MAD。
10.根据权利要求8所述的方法,其特征在于,所述若所述视频帧为所述视频文件的最后一个视频帧,则根据所述视频帧的MAD、以及所述视频帧的前一个视频帧的MAD,计算所述视频帧的视频运动信息,将得到的所述视频帧的视频运动信息作为所述视频帧的视频质量权值包括:
根据第四公式计算所述视频帧的视频运动信息;所述第四公式为:
&beta; i = m e i - 1 / m e i ;
其中,i表示所述视频帧,βi表示所述视频帧的视频运动信息,
Figure FDA0000418364340000042
表示所述视频帧的前一个视频帧的MAD,
Figure FDA0000418364340000043
表示所述视频帧的MAD。
11.根据权利要求7-10任一项所述的方法,其特征在于,所述对所述视频文件中每一视频帧的视频质量参数、以及每一视频帧相对应的视频质量权值进行加权处理,得到所述视频文件的视频质量参数包括:
根据第五公式得到所述视频文件的视频质量参数;所述第五公式为:
VQ = &Sigma; j = 1 F w j V Q f j ;
其中,VQ表示所述视频文件的视频质量参数,j表示所述视频文件的第j个视频帧,F表示所述视频文件总的视频帧数,
Figure FDA0000418364340000045
表示所述视频文件的第j个视频帧的视频质量参数,wj表示视频文件的第j个视频帧的视频质量权值, w j = 1 2 + &Sigma; i = 1 F - 2 &beta; i , j = 1,2 &beta; j - 2 2 + &Sigma; i = 1 F - 2 &beta; i , j = 3 , &CenterDot; &CenterDot; &CenterDot; , F , βi表示第i个视频帧的视频运动信息。
12.一种视频质量评估的装置,其特征在于,包括:
第一获取模块,用于从视频文件中获取第一视频帧;所述第一视频帧为所述视频文件中的任一视频帧;
质量还原模块,用于对所述第一获取模块得到的第一视频帧进行质量还原处理,得到第二视频帧;所述第二视频帧作为所述第一视频帧的参考视频帧;
第二获取模块,用于对所述第一获取模块得到的第一视频帧和所述质量还原模块得到的第二视频帧进行质量评估处理,获取所述第一视频帧的视频质量参数。
13.根据权利要求12所述的装置,其特征在于,所述质量还原模块包括:加噪单元、计算单元、滤波单元;
所述加噪单元,用于在所述第一获取模块得到的第一视频帧中添加噪声,得到加噪第一视频帧;
所述计算单元,用于计算所述加噪单元得到的加噪第一视频帧中的噪声方差;
所述滤波单元,用于若所述计算单元计算得到的噪声方差大于预先设定的阈值,则采用自适应全变差ATV方式对所述加噪第一视频帧进行滤波,得到第二视频帧;或者,若所述计算单元计算得到的噪声方差小于预先设定的阈值,则采用非局部均值NLM方式对所述加噪第一视频帧进行滤波,得到第二视频帧,所述预先设定的阈值为通过对不同视频文件中每一视频帧进行滤波处理统计得到。
14.根据权利要求12所述的装置,其特征在于,所述第二获取模块包括:第一获取单元、第二获取单元、第三获取单元;
所述第一获取单元,用于利用相似性度量算法,获取所述第一获取模块得到的第一视频帧和所述质量还原模块得到的第二视频帧之间的结构相似度SSIM值;
所述第二获取单元,用于对所述第一获取模块得到的第一视频帧进行稠密时空显著性KR处理,获取所述第一视频帧的视觉注意信息权值;
所述第三获取单元,用于对所述第一获取单元得到的所述第一视频帧与所述第二视频帧之间的SSIM值、以及所述第二获取单元得到的所述第一视频帧的视觉注意信息权值进行加权处理,得到所述第一视频帧的视频质量参数。
15.根据权利要求14所述的装置,其特征在于,所述第一获取单元包括:采样子单元、计算子单元、修正子单元;
所述采样子单元,用于对所述第一视频帧和所述第二视频帧分别进行相同的采样分块;
所述计算子单元,用于计算所述采样子单元得到的所述第一视频帧和所述第二视频帧相对应分块之间的SSIM值;
所述修正子单元,用于对所述计算子单元得到的各个SSIM值进行修正处理,得到所述第一视频帧中所有分块与对应的所述第二视频帧中的分块之间的SSIM值。
16.根据权利要求15所述的装置,其特征在于,所述修正子单元用于根据第一公式对所述各个SSIM值进行修正;所述第一公式为:
SSIMf=(J-SSIMt)×w;
其中,SSIMf表示修正后所述第一视频帧中所有分块与对应的所述第二视频帧中的分块之间的SSIM值,SSIMt表示修正前所述第一视频帧中所有分块与对应的所述第二视频帧中的分块之间的SSIM值,J表示修正常量,w表示修正因子。
17.根据权利要求16所述的装置,其特征在于,所述第三获取单元用于根据第二公式得到所述第一视频帧的视频质量参数;所述第二公式为:
VQ f = &Sigma; m = 1 M &Sigma; n = 1 N S 1 f . &times; SSIM f &Sigma; m = 1 M &Sigma; n = 1 N S 1 f ( m , n ) ;
其中,VQf表示所述第一视频帧的视频质量参数,M和N分别表示对所述第一视频帧或所述第二视频帧进行采样分块后得到的垂直方向和水平方向的分块个数,SSIMf表示修正后所述第一视频帧中所有分块与对应的所述第二视频帧中的分块之间的SSIM值,S1f表示所述第一视频帧所有分块的视觉注意信息权值,S1f(m,n)表示所述第一视频帧采样分块后第(m,n)个分块的视觉注意信息权值,1<m<M,1<n<N。
18.一种视频质量评估的装置,其特征在于,包括:
第一获取模块,用于获取视频文件;所述视频文件包括:至少两个视频帧;
第二获取模块,用于按照权利要求1-6任一项所述的方法,得到所述第一获取模块得到的视频文件中每一视频帧的视频质量参数;
运动估计模块,用于所述视频文件中的每一视频帧进行运动估计,得到所述视频文件中每一视频帧的视频质量权值;
加权处理模块,用于对第二获取模块得到的所述视频文件中每一视频帧的视频质量参数、以及所述运动估计模块得到的每一视频帧相对应的视频质量权值进行加权处理,得到所述视频文件的视频质量参数。
19.根据权利要求18所述的装置,其特征在于,所述运动估计模块包括:第一计算单元、第二计算单元;
所述第一计算单元,用于计算所述视频文件中的每一视频帧的平均绝对误差MAD;
所述第二计算单元,用于若所述视频帧不是所述视频文件的最后一个视频帧,则根据所述第一计算单元计算得到的所述视频帧的MAD、以及所述视频帧的后一个视频帧的MAD,计算所述视频帧的视频运动信息,将得到的所述视频帧的视频运动信息作为所述视频帧的视频质量权值;或者,若所述视频帧为所述视频文件的最后一个视频帧,则根据所述第一计算单元计算得到的所述视频帧的MAD、以及所述视频帧的前一个视频帧的MAD,计算所述视频帧的视频运动信息,将得到的所述视频帧的视频运动信息作为所述视频帧的视频质量权值。
20.根据权利要求19所述的装置,其特征在于,所述第二计算单元具体用于根据第三公式计算所述视频帧的视频运动信息;所述第三公式为:
&beta; i = m e i + 1 / m e i ;
其中,i表示所述视频帧,βi表示所述视频帧的视频运动信息,
Figure FDA0000418364340000072
表示所述视频帧的后一个视频帧的MAD,
Figure FDA0000418364340000073
表示所述视频帧的MAD。
21.根据权利要求19所述的装置,其特征在于,所述第二计算单元具体用于根据第四公式计算所述视频帧的视频运动信息;所述第四公式为:
&beta; i = m e i - 1 / m e i ;
其中,i表示所述视频帧,βi表示所述视频帧的视频运动信息,
Figure FDA0000418364340000082
表示所述视频帧的前一个视频帧的MAD,
Figure FDA0000418364340000083
表示所述视频帧的MAD。
22.根据权利要求18-21任一项所述的装置,其特征在于,所述加权处理模块用于根据第五公式得到所述视频文件的视频质量参数;所述第五公式为:
VQ = &Sigma; j = 1 F w j V Q f j ;
其中,VQ表示所述视频文件的视频质量参数,j表示所述视频文件的第j个视频帧,F表示所述视频文件总的视频帧数,
Figure FDA0000418364340000085
表示所述视频文件的第j个视频帧的视频质量参数,wj表示视频文件的第j个视频帧的视频质量权值, w j = 1 2 + &Sigma; i = 1 F - 2 &beta; i , j = 1,2 &beta; j - 2 2 + &Sigma; i = 1 F - 2 &beta; i , j = 3 , &CenterDot; &CenterDot; &CenterDot; , F , βi表示第i个视频帧的视频运动信息。
23.一种视频质量评估的系统,其特征在于,包括:存储器和处理器,其中,所述存储器存储有操作指令,所述处理器用于调用所述存储器存储的操作指令,以执行权利要求1-6任一项所述的视频质量评估方法,和/或,权利要求7-11任一项所述的视频质量评估方法。
CN201310589771.4A 2013-11-20 2013-11-20 一种视频质量评估的方法、装置和系统 Pending CN103634591A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310589771.4A CN103634591A (zh) 2013-11-20 2013-11-20 一种视频质量评估的方法、装置和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310589771.4A CN103634591A (zh) 2013-11-20 2013-11-20 一种视频质量评估的方法、装置和系统

Publications (1)

Publication Number Publication Date
CN103634591A true CN103634591A (zh) 2014-03-12

Family

ID=50215168

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310589771.4A Pending CN103634591A (zh) 2013-11-20 2013-11-20 一种视频质量评估的方法、装置和系统

Country Status (1)

Country Link
CN (1) CN103634591A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110213573A (zh) * 2019-06-14 2019-09-06 北京字节跳动网络技术有限公司 一种视频质量评估方法、装置和电子设备
CN110290381A (zh) * 2019-08-01 2019-09-27 字节跳动(香港)有限公司 视频质量评估方法、装置、电子设备及计算机存储介质
CN110366001A (zh) * 2018-04-09 2019-10-22 腾讯科技(深圳)有限公司 视频清晰度的确定方法和装置、存储介质、电子装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101621709A (zh) * 2009-08-10 2010-01-06 浙江大学 一种全参考型图像客观质量评价方法
CN101695141A (zh) * 2009-10-20 2010-04-14 浙江大学 一种视频质量评估方法和装置
CN102622734A (zh) * 2010-12-15 2012-08-01 特克特朗尼克公司 从不具有参考的源测量噪声并产生图片质量预测的方法
CN102845071A (zh) * 2010-04-19 2012-12-26 杜比实验室特许公司 高动态范围、视觉动态范围和宽色域的图像与视频的质量评估

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101621709A (zh) * 2009-08-10 2010-01-06 浙江大学 一种全参考型图像客观质量评价方法
CN101695141A (zh) * 2009-10-20 2010-04-14 浙江大学 一种视频质量评估方法和装置
CN102845071A (zh) * 2010-04-19 2012-12-26 杜比实验室特许公司 高动态范围、视觉动态范围和宽色域的图像与视频的质量评估
CN102622734A (zh) * 2010-12-15 2012-08-01 特克特朗尼克公司 从不具有参考的源测量噪声并产生图片质量预测的方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110366001A (zh) * 2018-04-09 2019-10-22 腾讯科技(深圳)有限公司 视频清晰度的确定方法和装置、存储介质、电子装置
CN110366001B (zh) * 2018-04-09 2022-05-27 腾讯科技(深圳)有限公司 视频清晰度的确定方法和装置、存储介质、电子装置
CN110213573A (zh) * 2019-06-14 2019-09-06 北京字节跳动网络技术有限公司 一种视频质量评估方法、装置和电子设备
WO2020248890A1 (zh) * 2019-06-14 2020-12-17 北京字节跳动网络技术有限公司 一种视频质量评估方法、装置和电子设备
CN110290381A (zh) * 2019-08-01 2019-09-27 字节跳动(香港)有限公司 视频质量评估方法、装置、电子设备及计算机存储介质

Similar Documents

Publication Publication Date Title
US11093789B2 (en) Method and apparatus for object re-identification
US10360664B2 (en) Image processing apparatus and method using machine learning
Huang et al. Bidirectional recurrent convolutional networks for multi-frame super-resolution
US10963993B2 (en) Image noise intensity estimation method, image noise intensity estimation device, and image recognition device
CN108416343B (zh) 一种人脸图像识别方法及装置
US10013741B2 (en) Method for deblurring video using modeling blurred video with layers, recording medium and device for performing the method
WO2014070273A1 (en) Recursive conditional means image denoising
CN109903315B (zh) 用于光流预测的方法、装置、设备以及可读存储介质
EP2851867A2 (en) Method and apparatus for filtering an image
CN108109121A (zh) 一种基于卷积神经网络的人脸模糊快速消除方法
CN109685830B (zh) 目标跟踪方法、装置和设备及计算机存储介质
CN104881845A (zh) 用于处理图像的方法和设备
Kim et al. Event-guided deblurring of unknown exposure time videos
US8428369B2 (en) Information processing apparatus, information processing method, and program
CN103634591A (zh) 一种视频质量评估的方法、装置和系统
CN111325671B (zh) 网络训练方法、装置、图像处理方法及电子设备
EP3316212A1 (en) Method for deblurring a video, corresponding device and computer program product
Dutta et al. Weighted low rank approximation for background estimation problems
US9196025B2 (en) Image processing apparatus, image processing method and image processing program
EP2823467B1 (en) Filtering a displacement field between video frames
US11823352B2 (en) Processing video frames via convolutional neural network using previous frame statistics
CN113012061A (zh) 降噪处理方法、装置及电子设备
US11205257B2 (en) Method and apparatus for measuring video quality based on detection of change in perceptually sensitive region
Park et al. Improvement of optical flow estimation by using the hampel filter for low-end embedded systems
US20170161883A1 (en) Image processing apparatus and image processing method

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20140312