CN104185022A - 基于视觉信息失真分解的全参考视频质量评估方法 - Google Patents

基于视觉信息失真分解的全参考视频质量评估方法 Download PDF

Info

Publication number
CN104185022A
CN104185022A CN201410427508.XA CN201410427508A CN104185022A CN 104185022 A CN104185022 A CN 104185022A CN 201410427508 A CN201410427508 A CN 201410427508A CN 104185022 A CN104185022 A CN 104185022A
Authority
CN
China
Prior art keywords
video
distortion
pixel
value
packet loss
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410427508.XA
Other languages
English (en)
Other versions
CN104185022B (zh
Inventor
李宏亮
熊健
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN201410427508.XA priority Critical patent/CN104185022B/zh
Publication of CN104185022A publication Critical patent/CN104185022A/zh
Application granted granted Critical
Publication of CN104185022B publication Critical patent/CN104185022B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)

Abstract

本发明公开了一种基于视觉信息失真分解的全参考视频质量评估方法,属于视频处理技术领域。本发明基于人眼视觉系统对加性噪声SA、信道丢包失真ST、压缩失真SC综合的失真敏感程度不同,而分别采用不同的衡量来评估其失真性,在首先是将加性噪声与主要视觉进行区分后,首先基于现有的评估方式获得加性噪声SA,再对主视觉信息进行修道丢包失真和压缩失真区域区分后获取信道丢包失真ST、压缩失真SC,再将三者结合起来得到单个帧的质量评估值,最后取各视频帧的质量评估值SF的均值,为整个视频的质量评估结果并输出。本发明所提出的基于视觉信息分解的全参考视频质量评估方法,具有评估准确,对不同失真类型鲁棒性较高,计算复杂度相对较低的特点。

Description

基于视觉信息失真分解的全参考视频质量评估方法
技术领域
本发明属于视频图像处理技术领域,具体涉及一种基于视觉信息失真分解的全参考视频质量评估方法。
背景技术
伴随着视频多媒体技术的日益发展与成熟,人们日常生活中涌现了大量的视频应用。通常视频信号在经过压缩和传输之后会导致不同程度的失真。如何去评估这些失真视频的主观质量,对于压缩和传输系统的设计、性能的评估和控制都有重要的意义,一方面,可以用于独立的评价系统,为系统的设计,优化和改进做出精确的度量;另一方面,也可以作为质量监视装置,嵌入到实时在线系统,控制系统参数。
视频主观质量的好坏最直观的体现就是通过人工来打分。因此,人工打分在视频质量评估方法研究中往往是作为标准。然而实际应用中这种方法成本太高,可实施性太低。视频主观质量评估方法研究的目的就是设计出相应测度来计算视频质量,使得计算出来的视频质量和人工打分相关性很高。
目前的视频质量评估方法主要分为三大类:全参考视频质量评估,弱参考视频质量评估,和无参考视频质量评估。全参考是指在对失真视频主观质量进行评估过程中,可以获得完整的参考视频,通过比较失真视频和参考视频的相关特征,计算视频质量;弱参考则只能获得参考视频的部分信息,如变换域的部分信息等;无参考则不能获得参考视频的任何信息,通过训练、统计等方式获取失真图像的质量特征,设计出只利用失真视频本身信息来评估其主观质量的模型。
感知质量失真可以分为内容无关失真和内容相关失真。内容无关失真主要是一些随机的加性噪声,这类失真可以用基于均方误差的方法来描述。内容相关失真则主要体现为图像结构信息的变化。目前对于内容相关失真的描述方法有结构相似指数(Structural Similarity indexSSIM),以及梯度相似的方法。相比SSIM,梯度相似的方法能够更好的描述这类失真。但是,基于梯度相似的视频质量评估算法仍然不能很准确地描述一些失真,如信道丢包,块效应之类的,尤其是块状失真发生在原视频中平坦的区域。这是因为块状失真区域内容的梯度往往不明显,而原视频中平坦区域的梯度也不明显。这样利用梯度相似不能很好检测出这部分失真。
但是在现有的全参考视频质量评估中,通常是基于一种测度(如基于均方误差的方法来描述或梯度相似的方法等)实现对视频质量的评估工作,但人眼视觉系统对不同类型的失真(如加性噪声,信道丢包,压缩失真等)的失真敏感程度不同,因此,有必要对现有的全参考视频质量评估进行改进。
发明内容
本发明的发明目的在于:针对上述存在的问题,提供一种基于视觉信息失真分解的全参考视频质量评估算法,使得评估分数和人工打分拟合程度(相关系数)更高。
本发明的基于视觉信息失真分解的全参考视频质量评估方法,包括下列步骤:
步骤1:
输入参考视频R和待评估视频T,并对各视频帧进行去噪处理,得到视频R的加性噪声Ar、主要视觉信息Pr,视频T的加性噪声At、主要视觉信息Pt
步骤2:
基于所述加性噪声Ar、At,得到加性噪声失真SA
基于主要视觉信息Pr、Pt,获取主要视觉信息失真Pd,所述Pd为Pr与Pt对应像素值的绝对差值,对Pd进行信道丢包区域和压缩失真区域区分,并计算信道丢包失真ST、压缩失真SC
将Pd分割成多个相同大小的方块,对每个方块,若所有的像素值均大于预设阈值T1,则将该方块的各像素值均置为m;否则,置为n,且m≠n;
基于像素值为m的连通区域,取K个最大连通区域,并将其中面积大于预设值S的连通区域,确定为信道丢包区域,而非信道丢包区域则确定为压缩失真区域;
根据公式计算信道丢包失真ST,其中C1=lg(255·W2·H2),W和H分别为视频T或视频R的当前视频帧的宽和高,k为确定为信道丢包区域的连通区域个数,参数Li表示第i个连通区域所对应的主要视觉信息失真Pd的像素平均值,Si表示第i个连通区域所包含的像素个数,其中i=1,2...,k;
分别提取Pr和Pt当前视频帧的时空梯度向量gr、gt,基于公式
S p ( x r , x t ) = ( 2 | | g r | | | | g t | | + C 2 ( g r ) 2 + ( g t ) 2 + C 2 ) α · ( g r · g t + C 2 | | g r | | | | g r | | + C 2 ) β 得到像素级相似性Sp(xr,xt),其中,xr为参考像素,表示参考视频R各视频帧的像素,xt为待评估像素,表示待评估视频T各视频帧的像素,
基于水平垂直相同采样率分别对Pr和Pt当前视频帧进行下采样处理后,再提取空间梯度向量gbr、gbt,基于公式 S b ( b r , b t ) = ( 2 | | g br | | | | g bt | | + C 2 ( g br ) 2 + ( g bt ) 2 + C 2 ) α · ( g br · g bt + C 2 | | g br | | | | g bt | | + C 2 ) β 得到块相似性Sb(xr,xt),其中像素块br表示参考视频R当前频帧的像素块,像素块bt表示待评估视频T当前频帧的像素块;
α和β的对应取值为1、1或2、1或1、0,常数项C2为大于0的常数;
基于像素级相似性Sp(xr,xt)、块相似性Sb(xr,xt),并结合像素的结构相似性Ss(xr,xt)和显著区域Z,得到压缩失真 S C = Avg x r ∈ Z ( Σ ( S p ( x r , x t ) S s ( x r , x t ) S b ( b r , b t ) ) ) ;
步骤3:
根据加性噪声失真SA、信道丢包失真ST、压缩失真SC,基于公式获取视频T的单个视频帧的质量评估值SF
步骤4:
取视频T的各视频帧的质量评估值SF的均值,为视频T的质量评估结果并输出。
本发明的有益效果是:由于本发明把主要视觉信息失真分成了压缩失真和传输失真,并分别设计出新的测度来衡量各类失真的大小,使得本发明所提出的基于视觉信息分解的全参考视频质量评估方法,具有评估准确,对不同失真类型鲁棒性较高,计算复杂度相对较低的特点。
具体实施方式
本说明书中公开的所有特征,或公开的所有方法或过程中的步骤,除了互相排斥的特征和/或步骤以外,均可以以任何方式组合。
本说明书(包括任何附加权利要求、摘要)中公开的任一特征,除非特别叙述,均可被其他等效或具有类似目的的替代特征加以替换。即,除非特别叙述,每个特征只是一系列等效或类似特征中的一个例子而已。
本发明中,首先对输入的参考视频(R)和待评估视频(T)分别进行去噪处理,把每个视频帧分成加性噪声部分(Ar和At)和主要视觉信息(Pr和Pt)部分。去噪处理可以采用现有任一方法均可。其中,At和Pt分别表示评估视频的加性噪声部分和主要视觉信息部分,Ar和Pr分别表示参考视频的加性噪声部分和主要视觉信息部分。
第二,基于Ar和At描述加性噪声失真SA,其衡量采用现有方式实现,如采用公式(1)来衡量:
S A ( A r , A t ) = 1 - log 10 ( 1 + MSE ( A r , A t ) ) log 10 ( 255 2 ) - - - ( 1 )
其中,MSE(Ar,At)表示Ar和At的均方误差,log10(2552)是一个归一化项,使得上式的计算结构在0到1之间。
第三,对参考视频R和待评估视频T的当前处理帧的主要视觉信息Pr和Pt,进行信道丢包失真ST、压缩失真SC的区分和衡量:
Pr和Pt之间绝对差值(Pd)则为主要视觉信息失真,而这些失真可以分为信道丢包和压缩失真。本发明采用最大失真区域检测的方法来分离两类失真。具体方法如下:
步骤(3.1):将Pd分割成多个相同大小(具体大小可根据具体需求设定,如4x4,8x8等,本具体实施方式中,优选为4x4)的方块,对每个方块,若所有的像素值均大于预设阈值T1,则将该方块的各像素值均置为m;否则,置为n,且m≠n,为了简化处理,本发明中可将设m=1,n=0;
步骤(3.2):基于像素值为1的连通区域,取K个最大连通区域,并将其中面积大于预设值S的连通区域(k个,k≤K),确定为信道丢包区域,而非信道丢包区域则确定为压缩失真区域;
步骤(3.3):并根据公式(2)计算信道丢包失真ST,其中C1=lg(255·W2·H2),W和H分别为视频T或视频R的当前视频帧的宽和高,k为确定为信道丢包区域的连通区域个数,参数Li表示第i个连通区域所对应的主要视觉信息失真Pd的像素平均值,Si表示第i个连通区域所包含的像素个数,其中i=1,2...,k;
S T = C 1 - lg ( Σ i = 1 k L i · S i 2 ) C 1 - lg ( S · T 1 ) - - - ( 2 )
其中,K、S、T的具体取值基于使用需求设定,通常可设定其范围依次分别为:[4,20]、[10,20]、[20,50],本实施方式中取值分为8、32、12。
步骤(3.4):分别提取Pr和Pt当前视频帧的时空梯度向量gr、gt(具体提取方式采用现有常用的即可,如基于3维索贝尔Sobel算子提取等),由公式(3)得到像素级相似性Sp(xr,xt),其中,xr为参考像素,表示参考视频R各视频帧的像素,xt为待评估像素,表示待评估视频T各视频帧的像素。
S p ( x r , x t ) = ( 2 | | g r | | | | g t | | + C 2 ( g r ) 2 + ( g t ) 2 + C 2 ) α · ( g r · g t + C 2 | | g r | | | | g r | | + C 2 ) β - - - ( 3 )
步骤(3.5):基于水平垂直相同采样率分别对Pr和Pt当前视频帧进行下采样处理后(下采样率可基于需求自行设定,通常为1/4、1/8、1/16等),再提取空间梯度向量gbr、gbt(具体提取方式采用现有常用的即可,如基于2维Sobel算子等),基于公式(4)得到块相似性Sb(xr,xt),其中像素块br表示参考视频R当前频帧的像素块,像素块bt表示待评估视频T当前频帧的像素块;
S b ( b r , b t ) = ( 2 | | g br | | | | g bt | | + C 2 ( g br ) 2 + ( g bt ) 2 + C 2 ) α · ( g br · g bt + C 2 | | g br | | | | g bt | | + C 2 ) β - - - ( 4 )
在上述公式(3)(4)中,α和β的对应取值为1、1或2、1或1、0,常数项C2为大于0的常数,为为避免分母为零,优选可取常数项C2=0.03×2552
步骤(3.6):基于像素级相似性Sp(xr,xt)、块相似性Sb(xr,xt),并结合像素的结构相似性Ss(xr,xt)和显著区域Z,根据公式(5)得到压缩失真SC
S C = Avg x r ∈ Z ( Σ ( S p ( x r , x t ) S s ( x r , x t ) S b ( b r , b t ) ) ) - - - ( 5 )
相似性Ss(xr,xt)的具体处理为现有方式,可参考文献Z.Wang,A.Bovik,H.Sheikh,andE.Simoncelli,”Image quality assessment:form error visibility to structuralsimilarity,”IEEE Trans.Image Process.,vol.13,no.4,pp.600-612,april 2004.
第四:根据已获取的加性噪声失真SA、信道丢包失真ST、压缩失真SC,基于公式(6)获取视频T的单个视频帧的质量评估值SF
S F = S T S A · S C 1 - S A - - - ( 6 )
第五:取视频T的各视频帧的质量评估值SF的均值,为视频T的质量评估结果并输出。
本发明并不局限于前述的具体实施方式。本发明扩展到任何在本说明书中披露的新特征或任何新的组合,以及披露的任一新的方法或过程的步骤或任何新的组合。

Claims (7)

1.基于视觉信息失真分解的全参考视频质量评估方法,其特征在于,包括下列步骤:
步骤1:
输入参考视频R和待评估视频T,并对各视频帧进行去噪处理,得到视频R的加性噪声Ar、主要视觉信息Pr,视频T的加性噪声At、主要视觉信息Pt
步骤2:
基于所述加性噪声Ar、At,得到加性噪声失真SA
基于主要视觉信息Pr、Pt,获取主要视觉信息失真Pd,所述Pd为Pr与Pt对应像素值的绝对差值,对Pd进行信道丢包区域和压缩失真区域区分,并计算信道丢包失真ST、压缩失真SC
将Pd分割成多个相同大小的方块,对每个方块,若所有的像素值均大于预设阈值T1,则将该方块的各像素值均置为m;否则,置为n,且m≠n;
基于像素值为m的连通区域,取K个最大连通区域,并将其中面积大于预设值S的连通区域,确定为信道丢包区域,而非信道丢包区域则确定为压缩失真区域;
根据公式计算信道丢包失真ST,其中C1=lg(255·W2·H2),W和H分别为视频T或视频R的当前视频帧的宽和高,k为确定为信道丢包区域的连通区域个数,参数Li表示第i个连通区域所对应的主要视觉信息失真Pd的像素平均值,Si表示第i个连通区域所包含的像素个数,其中i=1,2...,k;
分别提取Pr和Pt当前视频帧的时空梯度向量gr、gt,基于公式
S p ( x r , x t ) = ( 2 | | g r | | | | g t | | + C 2 ( g r ) 2 + ( g t ) 2 + C 2 ) α · ( g r · g t + C 2 | | g r | | | | g r | | + C 2 ) β 得到像素级相似性Sp(xr,xt),其中,xr为参考像素,表示参考视频R各视频帧的像素,xt为待评估像素,表示待评估视频T各视频帧的像素,
基于水平垂直相同采样率分别对Pr和Pt当前视频帧进行下采样处理后,再提取空间梯度向量gbr、gbt,基于公式 S b ( b r , b t ) = ( 2 | | g br | | | | g bt | | + C 2 ( g br ) 2 + ( g bt ) 2 + C 2 ) α · ( g br · g bt + C 2 | | g br | | | | g bt | | + C 2 ) β 得到块相似性Sb(xr,xt),其中像素块br表示参考视频R当前频帧的像素块,像素块bt表示待评估视频T当前频帧的像素块;
α和β的对应取值为1、1或2、1或1、0,常数项C2为大于0的常数;
基于像素级相似性Sp(xr,xt)、块相似性Sb(xr,xt),并结合像素的结构相似性Ss(xr,xt)和显著区域Z,得到压缩失真 S C = Avg x r ∈ Z ( Σ ( S p ( x r , x t ) S s ( x r , x t ) S b ( b r , b t ) ) ) ;
步骤3:
根据加性噪声失真SA、信道丢包失真ST、压缩失真SC,基于公式获取视频T的单个视频帧的质量评估值SF
步骤4:
取视频T的各视频帧的质量评估值SF的均值,为视频T的质量评估结果并输出。
2.如权利要求1所述的方法,其特征在于,所述步骤2中,m的取值为1,n的取值为0。
3.如权利要求1或2所述的方法,其特征在于,所述步骤2中,常数项C2=0.03×2552
4.如权利要求1或2所述的方法,其特征在于,所述步骤2中,基于3维索贝尔Sobel算子提取Pr和Pt当前视频帧的时空梯度向量gr、gt,基于2维Sobel算子提取Pr和Pt当前视频帧的空间梯度向量gbr、gbt
5.如权利要求1所述的方法,其特征在于,所述步骤2中,将Pd分割成4x4大小的方块。
6.如权利要求1所述的方法,其特征在于,所述步骤2中,预设阈值T1的取值为[10,20],预设值S的取值为[20,50]。
7.如权利要求1所述的方法,其特征在于,所述步骤2中,基于水平垂直采样率为1/4或1/8或1/16,分别对Pr和Pt当前视频帧进行下采样处理。
CN201410427508.XA 2013-09-18 2014-08-27 基于视觉信息失真分解的全参考视频质量评估方法 Expired - Fee Related CN104185022B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410427508.XA CN104185022B (zh) 2013-09-18 2014-08-27 基于视觉信息失真分解的全参考视频质量评估方法

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
CN201310428740.0 2013-09-18
CN2013104287400 2013-09-18
CN201310428740 2013-09-18
CN201410427508.XA CN104185022B (zh) 2013-09-18 2014-08-27 基于视觉信息失真分解的全参考视频质量评估方法

Publications (2)

Publication Number Publication Date
CN104185022A true CN104185022A (zh) 2014-12-03
CN104185022B CN104185022B (zh) 2016-03-30

Family

ID=51965714

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410427508.XA Expired - Fee Related CN104185022B (zh) 2013-09-18 2014-08-27 基于视觉信息失真分解的全参考视频质量评估方法

Country Status (1)

Country Link
CN (1) CN104185022B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106713918A (zh) * 2017-01-17 2017-05-24 燕山大学 图像压缩方法
CN108462872A (zh) * 2018-05-04 2018-08-28 南京邮电大学 一种基于低频显著性的梯度相似视频质量评估方法
CN109783475A (zh) * 2019-01-23 2019-05-21 福州大学 一种视频失真效应标记大规模数据库的构建方法
CN114332088A (zh) * 2022-03-11 2022-04-12 电子科技大学 一种基于运动估计的全参考视频质量评估方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101621709A (zh) * 2009-08-10 2010-01-06 浙江大学 一种全参考型图像客观质量评价方法
CN102740108A (zh) * 2011-04-11 2012-10-17 华为技术有限公司 一种视频数据质量评估方法和装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101621709A (zh) * 2009-08-10 2010-01-06 浙江大学 一种全参考型图像客观质量评价方法
CN102740108A (zh) * 2011-04-11 2012-10-17 华为技术有限公司 一种视频数据质量评估方法和装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
杨付正等: "基于图像内容失真的全参考视频质量评估方法", 《西安电子科技大学学报(自然科学版)》 *
田魁等: "一种新型的基于全参考的视频质量评价方法", 《现代电信科技》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106713918A (zh) * 2017-01-17 2017-05-24 燕山大学 图像压缩方法
CN108462872A (zh) * 2018-05-04 2018-08-28 南京邮电大学 一种基于低频显著性的梯度相似视频质量评估方法
CN109783475A (zh) * 2019-01-23 2019-05-21 福州大学 一种视频失真效应标记大规模数据库的构建方法
CN109783475B (zh) * 2019-01-23 2022-06-14 福州大学 一种视频失真效应标记大规模数据库的构建方法
CN114332088A (zh) * 2022-03-11 2022-04-12 电子科技大学 一种基于运动估计的全参考视频质量评估方法
CN114332088B (zh) * 2022-03-11 2022-06-03 电子科技大学 一种基于运动估计的全参考视频质量评估方法

Also Published As

Publication number Publication date
CN104185022B (zh) 2016-03-30

Similar Documents

Publication Publication Date Title
CN100559881C (zh) 一种基于人工神经网络的视频质量评价方法
CN101562675B (zh) 基于Contourlet变换的无参考型图像质量评测方法
CN100559880C (zh) 一种基于自适应st区的高清视频图像质量评价方法及装置
CN101482973B (zh) 基于早期视觉的部分参考图像质量评价方法
CN104185022B (zh) 基于视觉信息失真分解的全参考视频质量评估方法
CN103517065B (zh) 一种质降参考立体图像质量客观评价方法
CN101872479A (zh) 一种立体图像客观质量评价方法
CN109345502A (zh) 一种基于视差图立体结构信息提取的立体图像质量评价方法
CN104103064A (zh) 基于梯度相似度的无参考噪声图像质量评价方法
Li et al. GridSAR: Grid strength and regularity for robust evaluation of blocking artifacts in JPEG images
CN104574424B (zh) 基于多分辨率dct边缘梯度统计的无参照图像模糊度评价方法
Dimauro A new image quality metric based on human visual system
CN103686178A (zh) 一种基于hvs的视频感兴趣区域提取方法
Gu et al. An improved full-reference image quality metric based on structure compensation
Yalman Histogram based perceptual quality assessment method for color images
CN104159104A (zh) 基于多级梯度相似的全参考视频质量评估方法
Patil et al. Survey on image quality assessment techniques
CN105139373B (zh) 基于独立子空间分析的无参考图像质量客观评价方法
CN104394405B (zh) 一种基于全参考图像的客观质量评价方法
Devnani et al. Comparative analysis of image quality measures
Gao et al. A content-based image quality metric
Mokhtar et al. Analysis of wavelet-based full reference image quality assessment algorithm
CN104952052A (zh) 一种对emccd图像进行增强的方法
Qi et al. Non-Reference Image Quality Assessment Based on Super-Pixel Segmentation and Information Entropy
CN102196259B (zh) 一种适用于压缩域的运动目标检测系统及方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160330

Termination date: 20190827

CF01 Termination of patent right due to non-payment of annual fee