CN101356827B - 非介入式视频质量测量 - Google Patents
非介入式视频质量测量 Download PDFInfo
- Publication number
- CN101356827B CN101356827B CN200680050424.2A CN200680050424A CN101356827B CN 101356827 B CN101356827 B CN 101356827B CN 200680050424 A CN200680050424 A CN 200680050424A CN 101356827 B CN101356827 B CN 101356827B
- Authority
- CN
- China
- Prior art keywords
- quality metrics
- pixel
- adjacent area
- frame
- step size
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000005259 measurement Methods 0.000 title description 8
- 238000000034 method Methods 0.000 claims abstract description 38
- 230000006835 compression Effects 0.000 claims abstract description 13
- 238000007906 compression Methods 0.000 claims abstract description 13
- 238000013442 quality metrics Methods 0.000 claims description 23
- 238000013139 quantization Methods 0.000 claims description 6
- 238000000691 measurement method Methods 0.000 abstract description 2
- 238000012549 training Methods 0.000 description 24
- 238000012360 testing method Methods 0.000 description 20
- 230000033001 locomotion Effects 0.000 description 12
- 238000012935 Averaging Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 6
- 238000000611 regression analysis Methods 0.000 description 6
- 230000000873 masking effect Effects 0.000 description 5
- 230000015556 catabolic process Effects 0.000 description 4
- 239000002131 composite material Substances 0.000 description 4
- 238000006731 degradation reaction Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000001419 dependent effect Effects 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 230000002123 temporal effect Effects 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- 238000004091 panning Methods 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 239000011435 rock Substances 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000001303 quality assessment method Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 239000010409 thin film Substances 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 238000009827 uniform distribution Methods 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N17/00—Diagnosis, testing or measuring for television systems or their details
- H04N17/004—Diagnosis, testing or measuring for television systems or their details for digital television systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/154—Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/44—Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
Abstract
本申请涉及一种非介入式视频质量测量方法,具体地说,其中视频信号具有:原始形式;编码形式,在该形式中已经利用压缩算法对该视频信号进行了编码,该压缩算法利用了可变量化器步长,从而使所述编码信号具有与其相关的量化器步长参数;及解码形式,在此形式中已经至少部分地将所述编码视频信号重新转换为所述原始形式,该方法包括:a)产生第一质量量度,该第一质量量度为所述量化器步长参数的函数;b)产生第二质量量度,该第二质量量度为由所述解码形式的该视频信号表示的至少一部分帧的空间复杂度的函数;及c)将所述第一量度与第二量度组合起来,以获得对解码视频的主观视频质量的估计。
Description
技术领域
本发明涉及视频质量量度(measure),具体地说,涉及在已经利用压缩算法对视频信号进行编码的情形下的视频质量量度。
背景技术
当将视频信号从一个位置发送到另一个位置时,利用编码算法对信号进行编码或压缩是已知的,从而能够利用比没有编码时所需要的带宽更窄的带宽来发送编码后的信号。当接收到时,编码信号被解码从而提取出原始信号。在许多编码技术中进行二维余弦变换,得到一系列其幅度被量化的变换系数。从而可以有效地分配带宽,并且允许量化粒度即步长变化。
对视频序列进行编码和解码的处理会引起失真或者以别的方式降低信号质量。测量失真程度的一种方法涉及到将观者对失真视频序列中可感知的失真程度的意见记录下来,并且对结果进行平均,从而获得平均意见分值(MOS,Mean Opinion Score)。然而,这会是一个耗时的处理。结果,需要预测观者在视频序列中所感知到的质量损失。虽然能够通过参考原始序列而获得作为编码/解码及传送过程的结果的视频质量的恶化,但此方法通常不方便。
发明内容
根据本发明的一方面,提供一种针对表示多个帧的视频信号生成质量量度的方法,所述视频信号具有:原始形式;编码形式,在该编码形式中已经利用压缩算法对所述视频信号进行了编码,该压缩算法利用了可变量化器(quantiser)步长,从而使编码后的信号具有与其相关的量化器步长参数;及解码形式,在此解码形式中已经至少部分地将所述编码视频信号重新转换为所述原始形式,该方法包括步骤:a)产生第一质量量度,该第一质量量度为所述量化器步长参数的函数;b)产生第二质量量度,该第二质量量度为由所述解码形式的视频信号表示的至少一部分帧的空间复杂度的函数;及c)将所述第一量度与所述第二量度组合起来。
因为可以从所述编码视频序列中可导出所述步长,并且由于复杂度量度是从所述解码信号中获取的,因此减小了对原始信号参考的需求。另外,由于在许多编码方案中,步长作为参数而与视频序列一起发送,可以方便地利用该参数来预测视频质量而不必重新计算该参数。重要的是已经发现:相对于根据步长可靠性或单独根据作为视频质量指示器的复杂度所能简单地期望到的可靠性相比,使用复杂度量度与步长相结合更加改善了质量量度的可靠性。
根据本发明的另一方面,提供一种针对表示多个帧的视频信号生成质量量度的设备,所述视频信号具有:原始形式;编码形式,在该编码形式中已经利用压缩算法对所述视频信号进行了编码,该压缩算法利用了可变量化器步长,从而使所述编码信号具有与其相关的量化器步长参数;及解码形式,在此解码形式中已经至少部分地将编码后的视频信号重新转换为所述原始形式,该设备包括:a)产生第一质量量度的装置,该第一质量量度为量化器步长参数的函数;b)产生第二质量量度的装置,该第二质量量度为由所述解码形式的视频信号表示的至少一部分帧的空间复杂度的函数;及c)将所述第一量度与所述第二量度组合起来的装置,用于产生视频信号的质量量度。
附图说明
现在通过仅参考附图的示例来进一步描述本发明,其中:
图1为从功能性上示出用于估计视频序列质量的设备的框图;
图2示出如何针对图像中的像素计算水平对比度量度;
图3示出如何针对图2的图像中的像素计算垂直对比度量度;
图4示出训练序列的AvPSNR与测量MOS的关系图;
图5示出训练序列的AvQP与测量MOS的关系图;
图6示出训练序列的CS与测量MOS的关系图;
图7示出AvQP/CS模型的测量MOS与估计MOS的关系图。
具体实施方式
以下实施方式涉及到无参考的、基于解码器的视频质量评估工具。用于该工具的算法可在视频解码器内部运行,其利用针对每个解码宏块的量化器步长参数(通常为包含于输入编码视频流中的变量)和来自每个解码图像的像素强度值(pixel intensity value)来对解码视频的主观质量进行估计。对每个帧的解码像素执行滑动窗口平均像素强度差值(像素对比度量度)计算,并且将作为结果的平均(TCF)用作视频的噪声掩蔽(mask)特性的量度。然后根据TFC参数和平均步长参数的加权函数来作出质量估计。通过对特征解码序列的训练数据库及先前获取的针对该序列的主观分值进行多次回归分析而预先确定加权函数。用来估计复杂度的、对一方面是步长另一方面是滑动窗口平均像素强度差值量度的组合的使用提供了良好的主观质量估计。
所使用的测量处理原则上通常可应用于这样的视频信号,该视频信号利用了使用变换编码且具有可变量化器步长的压缩技术来进行编码。然而,待描述的方案设计成用于根据H.264标准编码的信号(虽然待描述的方案基于H.264视频编解码,它也应用其他基于DCT的标准的编解码,比如H.261、H.263、(基于帧的)MPEG-2等)。
本测量方法属于非介入式或“无参考式”,即它不需要使用原始信号的拷贝。该方法设计为在适当的解码器内使用,因为它同时需要从编码的比特流和解码的视频图片(picture)中获取参数。
在图1所示的设备中,在输入端1处接收到输入信号,并且输入信号传到视频解码器,该视频解码器进行解码并针对每个图像输出下列参数:
解码图像(D)
水平解码图片像素大小(PX)
垂直解码图片像素大小(PY)
水平解码图片宏块大小(MX)
垂直解码图片宏块大小(MY)
量化器步长参数集合(Q)。
该设备中具有两个分析路径,用于计算图片平均量化器步长信号QPF(单元3)及图片平均对比度量度CF(单元4)。然后单元5对信号QPF和CF进行时间平均,从而分别得出信号TQPF和TCF。最后,这些信号在单元6内组合起来,从而得出对解码视频序列D的主观质量的估计PMOS。元件3-6可由单独的硬件元件实现,但更方便的实现方式是利用适当的编程处理器执行所有这些阶段。
图像平均值Q
这使用了从解码器输出的量化器步长信号Q。Q包含了当前解码图片中的每个宏块的一个量化器步长参数值QP。对于H.264,量化器步长参数值QP定义了用于对变换系数进行编码的线性量化器的间隔QSTEP。事实上,QP为预定义间隔表编索引,其中,QP中每增加6时QSTEP大小加倍。根据下式而在单元3中计算出图片平均量化器参数QPF:
其中MX和MY分别是图片中水平和垂直宏块的数量,而Q(i,j)则是在位置(i,j)的宏块的量化器步长参数。
计算对比度量度
图2示出如何在水平方向PX像素及垂直方向PY像素大小的图片内的位置(x,y)处计算像素P(x,y)的对比度量度。
图2示出对水平对比度量度进行计算的分析。这里,相对于由阴影区域示出的像素P(x,y)计算对比度量度。选出大小相当的相邻区域(其中一个区域包含阴影像素)。每个区域由来自阴影像素所在的行的一组(优选地为连续的)像素形成。对每个区域内的像素强度进行平均,然后根据下面的式(2)计算出平均值的绝对差,对比度量度即为该差值。如图3所示,以类似的方式计算出垂直对比度量度。这里,选择上组像素和下组像素。每个选出的像素位于同一列上,并且阴影像素相邻于上组与下组之间的边界。对上组和下组中的像素强度进行平均,然后评估每组的平均强度的差,如下面的式(3)所示,该差的绝对值即为垂直对比度量度,即垂直方向上的对比度的量度。在本例子中,阴影像素包含在下组中。然而,对比度量度相关联的像素的位置是任意的,只要其位于由正在被比较的像素组所共享的边界附近即可。
因此,为了获得水平对比度量度,比较长度为H的行部,而为了获得垂直对比度量度,比较长度为V的列部(column portion)(长度H和V可以相同但不是必需相同)。对比度量度与位置对于在一方面是行部而另一方面是列部的公共边界为本地的像素相关。
然后对如此计算出的水平对比度量度及垂直对比度量度进行比较,并且将这两个值(即在式(4)中设定的水平-垂直量度)中最大的一个与阴影像素相关联,并存储在存储器中。
对于图片(在分别离图片的垂直边缘和水平边缘的垂直距离V和水平距离H内)中的每个像素重复该过程,由此提供了对像素进行的滑动窗口分析,窗口大小为H或V。然后对图片(帧)中的每个像素的水平-垂直量度进行平均,从而得出综合像素差量度CF(见式(5))。然后在多个图片上对该与每个像素关联的综合量度进行平均,从而获得序列平均量度,即根据式(7)的时间平均量度TCF。对综合量度(CF)进行平均的图片的数量将依赖于视频序列的属性及情景变化之间的时间,并且可以长达数秒钟。显然,仅仅需要对图片的一部分以这种方式进行分析,尤其是当量化步长在整个图像上变化。
通过测量图片中不同位置处的对比度并且取平均,就能获得对图片复杂度的简单量度。由于图片中的复杂度能够掩蔽失真,并且由此使得观察者相信:对于给定的失真,图片具有较好的质量,图片中的复杂程度能够在一定程度上用来预测观者将与视频信号关联起来的主观质量水平。
围绕阴影像素的各区域的宽度(H)或高度(V)与观赏者将会注意到复杂度的细节层次(detail level)有关。因此,如果从远处观察图像,则将H和V选择为比想象到的观者更靠近图片的情形更大。因为一般地说,观者会感觉到舒适的图片距离依赖于图片大小,H和V的大小也会依赖于像素大小和像素维数(更大的显示器典型地具有更大的像素而不是具有更多的像素,尽管对于给定的像素密度,显示器尺寸也可能是一个因素)。典型地,可以预料到:H和V中的每一个都在对应图片长宽尺寸的0.5%到2%之间。例如,水平值可以为4*100/720=0.56%,其中水平方向存在720个像素,并且每组平均包含4个像素,而在垂直方向的值可以为4*100/576=0.69%,其中垂直方向存在576个像素。
可以参考下式而对计算对比度量度的分析描述如下:该计算利用解码视频图片D,并确定每个图片的图片平均复杂度量度CF。通过首先对解码视频图片执行滑动窗口像素分析来确定CF。在示出对大小在水平方向上为PX而垂直方向上为PY的图片内的像素p(x,y)进行水平分析的图2中,根据下式计算出解码序列D的第n图片的水平对比度量度Ch:
x=H-1...PX-H-1 (2)
y=0...PY-1
H是水平像素分析的窗口长度。Ch(n,x,y)是解码视频序列D的第n图片的像素p(x,y)的水平对比度参数。D(n,x,y)是解码视频序列D的第n图片的像素p(x,y)的强度。
在示出对应垂直像素分析的图3中,根据下式计算出垂直对比度量度Cv:
这里,V是垂直像素分析的窗口长度。
然后可以将Ch和Cv组合起来,从而得出水平-垂直量度Chv,其中
Chv(n,x,y)=max(Ch(n,x,y),Cv(n,x,y))
x=H-1..PX-H-1 (4)
y=V-1..PY-V-1
这里应当注意:对于某些应用,将水平分量与垂直分量分开从而能够在对主观质量(单元6)的估计中将不同的加权参数应用于水平分量与垂直分量中的每一个。
最后,根据下式根据对比度值Ch、Cv及/或Chv计算出综合图片平均像素差量度CF:
时间平均
这利用图片平均参数QPF和CF,并根据下式确定对应的时间平均参数TQPF和TCF:
应当在需要MOS估计的时间间隔上执行参数的平均化。这可以是产生单对TQPF和TCF参数的单个分析阶段,或者可以是产生一系列参数的一系列间隔。可以通过CF和QPF时间序列在时间上“滑动”分析窗口(典型地具有一秒钟长度量级的窗口间隔)而实现连续分析。
估计MOS
这利用时间平均参数TQPF和TCF,从而对解码序列D的对应时间间隔的主观测量平均意见分值进行PMOS估计。TQPF有助于估计解码序列中存在的噪声,而TCF有助于估计噪声可能由视频序列的内容所屏蔽的程度。根据下式由参数的组合来计算出PMOS:
PMOS=F1(TPQF)+F2(TCF)+K0 (8)
F1和F2为AvQp和CS中的适当线性函数或非线性函数。
K0为常数。
PMOS为预测平均意见分值,且在1-5的范围内,其中5即是质量极好,而1即为质量低劣。F1、F2和K0可以通过许多商业统计软件包中可用的适当回归分析(比如线性、多项式或对数)来确定。这种分析需要具有已知主观质量的一组训练序列。然后以MOS为因变量而TQPF和TCF为自变量通过回归分析可以导出由F1、F2和K0定义的模型。作为结果的模型典型地用来预测与训练中使用的序列类似地已经经受恶化(编解码类型和压缩率)的测试序列的质量。然而,视频内容可能不同。
对于全分辨率广播材料的H.264压缩,发现适当的线性模型为:
PMOS=-0.135*TPQF+0.04*CS+7.442 (9)
然后将根据下式对作为结果的估计进行限定:
if(PMOS>5)PMOS=5
if(PMOS<1)PMOS=1 (10)
以下对上述实施方式的多个方面进行了另外讨论。
分绍:已经显示出在分析时同时利用源视频序列和恶化视频序列的全参考视频质量测量工具能够对广播视频的视频质量进行高度精确的预测。未获取预削弱“参考”序列的无参考(no-reference)设计技术是一项更为艰难的提议。无参考分析的另一种形式可以通过获取位于网络中的解码器内或其它位置的编码比特流而实现。这种“比特流”分析的好处在于容易获得帧缓冲器分析无法获得的编码参数,比如量化器步长、运动向量和块统计。比特流分析的范围从不具有逆变或运动预测宏块重构的解码参数的计算性轻分析(light analysis)到视频序列的全解码。
PSNR是一种在视频编码器和全参考视频质量测量工具中进行主观视频质量估计时使用的量度。在无参考工具中,不能直接计算出PSNR,但可以对其进行估计。这里给出一种无参考视频质量预测技术,该技术在比全参考PSNR量度更加优越的H.264/AVC解码器内运行。
首先,利用PSNR量度对多个H.264编码序列对基准质量估计给出结果。其次,考虑到比特流技术,该比特流技术使用平均量化器步长(AvQP)的量度来估计主观质量。已经显示:这种比特流无参考量度不是仅仅作为PSNR的逼近值,而是可以更加优于用于质量估计的全参考PSNR量度。最后引入噪音掩蔽(CS)量度,其进一步增强了基于PSNR和量化器步长的质量估计技术的性能。该量度基于解码图像序列的像素差分析,并在视频解码器内计算出。已经显示:基于作为结果的解码器的无参考模型实现了测量主观分值与估计主观分值之间的0.91以上的相关度。
视频测试材料-训练和测试数据库:用来训练和测试技术的视频数据库由均为625广播格式的18个不同的8-秒序列。训练组由9个序列组成,并且序列中的6个来自VQEG1数据库,而剩余的3个则来自其它地方。测试组包含9个序列。VQEG1内容已为人知并且可以从VQEG网站下载。由于质量参数是基于在每个序列持续时间上的平均,选择具有一致的运动和细节属性的内容是重要的。序列的细节如表1所示。
表1训练和测试序列
训练序列 | 特性 | 测试序列 | 特性 |
巴塞罗那 | 饱和色彩,缓慢缩放 | 艇(boat) | 水,缓慢运动 |
竖琴 | 缓慢缩放,弱清晰(thin detail) | 桥 | 清晰,缓慢运动 |
独木舟 | 水运动,平移(pan),清晰 | 舞厅 | 图案和运动 |
橄榄球 | 运动,快速平移 | 人群 | 运动 |
日历 | 高清楚,缓慢平移 | 动物 | 色调,运动 |
油炸食物 | 快速平移,薄膜 | 喷泉 | 水运动 |
岩石 | 运动,对比度变化 | 儿童 | 运动 |
运动会 | 弱清晰,运动 | 游乐场 | 局部高速运动 |
风景 | 缓慢运动,清晰 | 街道 | 某些运动 |
视频测试材料-编码:利用对每个训练和测试序列设定相同的编码器选项的H.264编码器JM7.5c对所有的训练和测试序列进行编码。
编码器设定的键值为:I、P、B、P、B、P、...帧模式;速度控制禁用;量化参数(QP)固定;适应性帧/字节编码启用;循环滤波禁用。
利用许多不同的可能的编码器设定,决定保持上述设定恒定,而仅仅在每个源文件的测试之间改变量化器步长参数。
针对训练组和测试组利用12个被试者来执行正式的单个刺激主观测试。平均MOS结果如表2(训练组)和表3(测试组)所示。
表2训练序列的主观分值
表3测试序列的主观分值
质量估计-峰值信噪比:峰值信噪比(PSNR)是一种经常使用的全参考质量量度,并且是一种对许多视频编码器优化的关键量度。利用正确对准的参考和恶化的序列,PSNR是一种用于计算的直接量度,并且可以根据下式计算出时间平均量度(AvPSNR):
其中s(n,x,y)和d(n,x,y)为来自源s和尺寸为X个(x=0...X-1)水平像素和Y个(y=0...Y-1)垂直像素恶化序列d的N个帧中的第n帧内的对应像素强度值(0...255)。该式用来计算9个训练序列中的每一个的8秒钟内的平均PSNR。平均PSNR相对于平均测量MOS的图表如图4所示。
当考虑25dB的平均PSNR处的MOS分值时,解释了数据的内容依赖特性。数据中的3个MOS-点范围显示了使用PSNR来估计感知质量的潜在不精确性。多项式回归分析产生了MOS与AvPSNR数据之间的0.78的相关度及0.715的RMS余差(residual)。
质量估计-量化器步长:对于H.264,量化器参数QP定义了用于对变换系数进行编码的线性量化器的间隔QSTEP。QP为预定间隔表编索引,在表中,QP每增加6时QSTEP的大小加倍。
对于训练组中的每次测试,对于P和I宏块,QP固定为20、28、32、36、40或44中的一个值,而对于B宏块QP则大2。图5展示了平均QP相对于9个训练序列中的每一个的平均MOS的图表。
MOS与平均QP之间的多项式回归分析产生了0.924的相关度及0.424的RMS余差。同时显然:在多个QP值处的期望MOS范围远小于AvPSNR的MOS。
根据量化器步长对PSNR进行的一次估计依赖于量化范围内的误差值均匀分布的近似。然而,当大多数系数“中心裁剪(centre-clipped)”到0时,该近似并不适用于大步长的低比特率的情况。有些令人吃惊的是,结果示出与PSNR相比,AvQP可能是更好的主观分值预测器。这里应当注意:QP与H.264内的实际量化器步长之间的非线性映射可能一定程度上使多项式分析变得容易的可能性已经减小,结果与针对实际步长对MOS达到的结果类似。
像素对比度量度-失真掩蔽:失真掩蔽是影响编码视频序列中的失真感知度的重要因素。由于人类的感知机制无法在相同的频谱、时间或空间位置内区别信号分量与噪音分量,因此发生了这种屏蔽。在设计视频编码器时这种考虑至关重要,其中比特位的有效分配是基本的。该领域内的研究已经同时在变换域和像素域内展开。这里,仅仅考虑像素域。
像素对比度量度-像素差值对比度量度:这里,将通过像素域内的分析而确定图像序列的掩蔽属性的构思应用于视频质量估计。实验揭示:通过滑动窗口像素差分析计算的对比度量度表现特别良好。
根据上式(2)和(3)计算出像素差值对比度量度Ch和CV,其中H是用于水平像素分析的窗口长度,而V是用于垂直像素分析的窗口长度。然后可以根据式(4)将Ch和CV组合起来得出水平-垂直量度Chv。然后根据式(5)可将Chv用来计算帧的综合像素差量度CF,然后又计算出上式(6)中定义的序列平均量度CS。利用H=4及V=2计算出每个解码训练序列的序列平均量度CS(以上称为TCF),并且相对于平均量化器步长而绘制出的结果如图6所示。
对于图4中的PSNR对MOS结果,图6中的结果显示出调度显著的相似性,对于图5中的AvQstep对MOS结果则相似程度要差一些。“日历”和“岩石”序列具有最高CS值,并且在PSNR和AvQstep的很大范围上具有最高MOS值。类似地,“独木舟”和“油炸食物”序列具有最低CS值和最低MOS数值。因此,根据解码像素计算出的CS量度看起来与序列的噪音掩蔽属性有关。对于给定的PSNR,较高的CS意味着较高的掩蔽性以及更高的MOS。无参考质量估计中的CS量度的潜在使用通过将其包含在下述多个回归分析中而得到测试。
结果:首先,通过PSNR(自变量)利用在许多商业统计软件包中可用的标准多项式/对数回归分析而对训练组的平均MOS(因变量)进行建模[14]。然后将作为结果的模型用于该测试序列。然后通过将AvQP用作自变量而重复该过程。该过程在每种情况中被重复,并且以CS作为附加自变量,并且作为结果的估计MOS与测量MOS之间的相关度及RMS余差如表4所示。
表4估计MOS与测量MOS之间的相关度及RMS余差。
结果显示:将序列平均对比度量度(CS)包含在基于PSNR或AvQP的MOS估计模型中增加了训练数据组和测量数据组的性能。利用了AvQP及CS参数的模型性能特别良好,从而既针对训练序列实现了超过0.9的相关度(0.95),也对测试序列实现了超过0.9的相关度(0.916)。
对于AvQP/CS模型的单独训练和测试结果以分散绘图(scatter plot)的形式示于图7中。
结论:已经给出了一种用于在H.264视频解码器中估计主观视频质量的双参数模型。对应于在视频序列上平均化的H.264量化器步长指数的AvQP参数有助于对噪音的估计。利用对解码像素进行滑动窗口差值分析而计算出的CS参数增加了对视频内容噪声掩蔽属性的指示。已经显示出:一起使用这些参数时,可在解码器中获得惊人地精确的主观质量估计。
将8秒钟的训练和测试序列选出,以便减小图像属性在时间上的显著变化。目的是使用具有一致恶化属性的解码序列,从而使测量MOS分值不会不适当地通过短暂和明显失真而进行加权。通过这种方式,具有序列平均参数的MOS分值建模变为更加灵敏和精确的处理。
在式(5)中定义的对比度量度CF取决于在整个修剪图像的每个像素上正在执行的平均化。应当认识到:在空间-时间块上对CF进行分析可能是有利的。
Claims (18)
1.一种针对表示多个帧的视频信号生成质量量度的方法,所述视频信号具有:原始形式;编码形式,在所述编码形式中已经利用压缩算法对所述视频信号进行了编码,所述压缩算法利用了可变量化器步长,从而使所述编码信号具有与其相关的量化器步长参数;及解码形式,在此解码形式中已经至少部分地将所述编码视频信号重新转换为所述原始形式,所述方法包括步骤:
a)产生第一质量量度,所述第一质量量度为所述量化器步长参数的函数;
b)产生第二质量量度,所述第二质量量度为由所述解码形式的视频信号表示的至少一部分帧的空间复杂度的函数;以及
c)将所述第一质量量度与第二质量量度组合起来。
2.根据权利要求1所述的方法,其中,通过在帧内的多个位置确定局部对比度量度并且取平均来测量所述空间复杂度。
3.根据权利要求2所述的方法,其中,通过对帧内像素附近的相邻区域的强度进行比较而获得各个局部对比度量度。
4.根据权利要求3所述的方法,其中,每个帧包括多个像素,且其中对选择的像素附近的区域的强度进行比较,并且由此获得相关于该像素的比较值。
5.根据权利要求3所述的方法,其中,所述相邻区域是细长形的。
6.根据权利要求5所述的方法,其中,每个帧包括以栅格形式排列的多个像素,所述栅格具有多个行和多个列,并且每个细长区域由沿着行部或列部而排列的多个像素形成。
7.根据权利要求3所述的方法,其中,对沿第一方向延伸的相邻区域对进行比较。
8.根据权利要求7所述的方法,其中,对沿第二方向延伸的相邻区域对进行比较。
9.根据权利要求8所述的方法,其中,所述第一方向和所述第二方向互相垂直。
10.根据权利要求3所述的方法,其中,所述比较包括对相邻区域对的强度差进行评估。
11.根据权利要求3所述的方法,其中,对于像素附近的相邻区域,所述比较包括对沿第一方向延伸的第一相邻区域对的强度差进行评估,并且对沿第二方向延伸的相邻区域对的强度差进行评估。
12.根据权利要求11所述的方法,其中,所述比较还包括选择所述第一方向和所述第二方向上的差中较大的一个。
13.根据权利要求3所述的方法,其中,相邻区域的强度根据该区域内像素的平均强度而获得。
14.根据权利要求2所述的方法,其中,利用在帧内不同位置获取的局部对比度量度的平均而计算出帧的空间复杂度。
15.根据权利要求2所述的方法,其中,对多个帧的所述空间复杂度求平均。
16.根据权利要求3所述的方法,其中,通过对帧内的相邻区域进行比较而获得所述空间复杂度,所述相邻区域在垂直方向和水平方向具有不同的宽度,并且两个宽度中较大的一个介于所述帧尺寸的0.5%到2%之间。
17.根据权利要求16所述的方法,其中,所述两个宽度中较小的一个对应于单个像素的宽度。
18.一种针对表示多个帧的视频信号生成质量量度的设备,所述视频信号具有:原始形式;编码形式,在所述编码形式中已经利用压缩算法对所述视频信号进行了编码,所述压缩算法利用了可变量化器步长,从而使所述编码信号具有与其相关的量化器步长参数;及解码形式,在此解码形式中已经至少部分地将所述编码视频信号重新转换为所述原始形式,所述设备包括:
a)产生第一质量量度的装置,所述第一质量量度为所述量化器步长参数的函数;
b)产生第二质量量度的装置,所述第二质量量度为由解码形式的视频信号表示的至少一部分帧的空间复杂度的函数;以及
c)将所述第一质量量度与第二质量量度组合起来、产生所述视频信号的质量量度的装置。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP05257467.0 | 2005-12-05 | ||
EP05257467 | 2005-12-05 | ||
PCT/GB2006/004155 WO2007066066A2 (en) | 2005-12-05 | 2006-11-07 | Non-intrusive video quality measurement |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101356827A CN101356827A (zh) | 2009-01-28 |
CN101356827B true CN101356827B (zh) | 2011-02-02 |
Family
ID=36295371
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200680050424.2A Active CN101356827B (zh) | 2005-12-05 | 2006-11-07 | 非介入式视频质量测量 |
Country Status (6)
Country | Link |
---|---|
US (1) | US8254438B2 (zh) |
EP (1) | EP1958454B1 (zh) |
JP (1) | JP5043856B2 (zh) |
CN (1) | CN101356827B (zh) |
CA (1) | CA2632403C (zh) |
WO (1) | WO2007066066A2 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103428523A (zh) * | 2012-05-22 | 2013-12-04 | 华为技术有限公司 | 评估视频质量的方法和装置 |
Families Citing this family (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1937002B1 (en) * | 2006-12-21 | 2017-11-01 | Rohde & Schwarz GmbH & Co. KG | Method and device for estimating the image quality of compressed images and/or video sequences |
EP2059049A1 (en) | 2007-11-07 | 2009-05-13 | British Telecmmunications public limited campany | Video coding |
JP4802200B2 (ja) * | 2008-02-14 | 2011-10-26 | 日本電信電話株式会社 | 映像品質推定装置、方法、およびプログラム |
EP2101503A1 (en) * | 2008-03-11 | 2009-09-16 | British Telecommunications Public Limited Company | Video coding |
JP2009260940A (ja) * | 2008-03-21 | 2009-11-05 | Nippon Telegr & Teleph Corp <Ntt> | 映像品質客観評価方法、映像品質客観評価装置、およびプログラム |
EP2144449A1 (en) * | 2008-07-07 | 2010-01-13 | BRITISH TELECOMMUNICATIONS public limited company | Video quality measurement |
US8098262B2 (en) * | 2008-09-05 | 2012-01-17 | Apple Inc. | Arbitrary fractional pixel movement |
EP2396768B1 (en) | 2009-02-12 | 2013-04-17 | Dolby Laboratories Licensing Corporation | Quality evaluation of sequences of images |
WO2010103112A1 (en) * | 2009-03-13 | 2010-09-16 | Thomson Licensing | Method and apparatus for video quality measurement without reference |
CN102349296B (zh) * | 2009-03-13 | 2016-03-09 | 瑞典爱立信有限公司 | 用于处理编码比特流的方法和装置 |
US8718145B1 (en) * | 2009-08-24 | 2014-05-06 | Google Inc. | Relative quality score for video transcoding |
BR112012008605B1 (pt) * | 2009-10-22 | 2021-09-08 | Nippon Telegraph And Telephone Corporation | Aparelho e método de estimação de qualidade de vídeo |
US20110221901A1 (en) * | 2010-03-11 | 2011-09-15 | Gm Global Technology Operations, Inc. | Adaptive Scene Rendering and V2X Video/Image Sharing |
JP5484140B2 (ja) * | 2010-03-17 | 2014-05-07 | Kddi株式会社 | 映像品質の客観画質評価装置 |
EP2373049A1 (en) * | 2010-03-31 | 2011-10-05 | British Telecommunications Public Limited Company | Video quality measurement |
EP2472868A1 (en) | 2010-12-29 | 2012-07-04 | British Telecommunications Public Limited Company | Video coding |
JP6024654B2 (ja) | 2011-03-09 | 2016-11-16 | 日本電気株式会社 | 映像符号化装置、映像復号装置、映像符号化方法及び映像復号方法 |
CN104883563B (zh) * | 2011-04-11 | 2017-04-12 | 华为技术有限公司 | 一种视频数据质量评估方法和装置 |
EP2541935A1 (en) | 2011-06-29 | 2013-01-02 | British Telecommunications Public Limited Company | Video coding with quality control and rate control |
US8804815B2 (en) * | 2011-07-29 | 2014-08-12 | Dialogic (Us) Inc. | Support vector regression based video quality prediction |
GB2497915B (en) * | 2011-10-25 | 2015-09-09 | Skype | Estimating quality of a video signal |
AU2011383036B2 (en) | 2011-12-15 | 2017-03-16 | Thomson Licensing | Method and apparatus for video quality measurement |
US8826314B2 (en) | 2012-01-30 | 2014-09-02 | At&T Intellectual Property I, Lp | Method and apparatus for managing quality of service |
US9125073B2 (en) * | 2012-08-03 | 2015-09-01 | Intel Corporation | Quality-aware adaptive streaming over hypertext transfer protocol using quality attributes in manifest file |
CN104780369B (zh) | 2012-08-21 | 2018-04-17 | 华为技术有限公司 | 一种获得视频编码压缩质量的方法及装置 |
GB2513090B (en) | 2013-01-28 | 2019-12-11 | Microsoft Technology Licensing Llc | Conditional concealment of lost video data |
EP2784996A1 (en) | 2013-03-27 | 2014-10-01 | British Telecommunications public limited company | Deadline driven content delivery |
GB2529446A (en) * | 2014-07-17 | 2016-02-24 | British Academy Of Film And Television Arts The | Measurement of video quality |
US10298985B2 (en) | 2015-05-11 | 2019-05-21 | Mediamelon, Inc. | Systems and methods for performing quality based streaming |
US11076187B2 (en) | 2015-05-11 | 2021-07-27 | Mediamelon, Inc. | Systems and methods for performing quality based streaming |
CN106713901B (zh) * | 2015-11-18 | 2018-10-19 | 华为技术有限公司 | 一种视频质量评价方法及装置 |
US10511846B1 (en) | 2016-09-01 | 2019-12-17 | Google Llc | Real-time adaptive video denoiser with moving object detection |
CN110166796B (zh) * | 2018-05-16 | 2021-09-17 | 腾讯科技(深圳)有限公司 | 视频帧的处理方法、装置、计算机可读介质及电子设备 |
US11875495B2 (en) * | 2020-08-10 | 2024-01-16 | Tencent America LLC | Methods of video quality assessment using parametric and pixel level models |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1422498A (zh) * | 2000-12-12 | 2003-06-04 | 皇家菲利浦电子有限公司 | 提供一个可分级动态客观量度的自动视频质量评价的系统和方法 |
CN1656824A (zh) * | 2002-05-24 | 2005-08-17 | 皇家飞利浦电子股份有限公司 | 根据局部边缘统计分布估计清晰度度量的方法和系统 |
CN1656823A (zh) * | 2002-05-24 | 2005-08-17 | 皇家飞利浦电子股份有限公司 | 用于评估压缩视频数据的客观质量的方法和系统 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040156559A1 (en) * | 2002-11-25 | 2004-08-12 | Sarnoff Corporation | Method and apparatus for measuring quality of compressed video sequences without references |
GB0228556D0 (en) * | 2002-12-06 | 2003-01-15 | British Telecomm | Video quality measurement |
US7170933B2 (en) * | 2002-12-13 | 2007-01-30 | International Business Machines Corporation | Method and system for objective quality assessment of image and video streams |
-
2006
- 2006-11-07 EP EP06808450.8A patent/EP1958454B1/en active Active
- 2006-11-07 JP JP2008543884A patent/JP5043856B2/ja active Active
- 2006-11-07 CA CA2632403A patent/CA2632403C/en active Active
- 2006-11-07 US US12/096,097 patent/US8254438B2/en active Active
- 2006-11-07 CN CN200680050424.2A patent/CN101356827B/zh active Active
- 2006-11-07 WO PCT/GB2006/004155 patent/WO2007066066A2/en active Application Filing
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1422498A (zh) * | 2000-12-12 | 2003-06-04 | 皇家菲利浦电子有限公司 | 提供一个可分级动态客观量度的自动视频质量评价的系统和方法 |
CN1656824A (zh) * | 2002-05-24 | 2005-08-17 | 皇家飞利浦电子股份有限公司 | 根据局部边缘统计分布估计清晰度度量的方法和系统 |
CN1656823A (zh) * | 2002-05-24 | 2005-08-17 | 皇家飞利浦电子股份有限公司 | 用于评估压缩视频数据的客观质量的方法和系统 |
Non-Patent Citations (8)
Title |
---|
Makoto Miyahara ET AL.Objective picture quality scale (PQS) for image coding.IEEE TRANSCATIONS ON COMMUNICATIONSvol.46 no.9.1998,vol.46(no.9),全文. * |
MakotoMiyaharaETAL.Objectivepicturequalityscale(PQS)forimagecoding.IEEETRANSCATIONSONCOMMUNICATIONSvol.46no.9.1998 vol.46(no.9) |
SONS,WEST SUSSEX,GB,2005,section 4.1. * |
Stefan Winkler.digital video quality:vision models and metrics.HOHN WILEY & SONS,WEST SUSSEX,GB,2005,section 4.1. |
Stefan Winkler.digital video quality:vision models and metrics.HOHN WILEY & * |
Stephen Wolf ET AL.Spatial-temporal distortion metrics for in-servicequality monitoring of any digital video system.Proceedings of the SPIEvol.3845.1999,vol.3845266-277. * |
Weisi Lin ET AL.Visual distortion gauge based on discrimination of noticeablecontrast changes.IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMSvol.15 no.7.2005,vol.15(no.7),900-909. * |
WeisiLinETAL.Visualdistortiongaugebasedondiscriminationofnoticeablecontrastchanges.IEEETRANSACTIONSONCIRCUITSANDSYSTEMSvol.15no.7.2005 vol.15(no.7) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103428523A (zh) * | 2012-05-22 | 2013-12-04 | 华为技术有限公司 | 评估视频质量的方法和装置 |
CN103428523B (zh) * | 2012-05-22 | 2015-07-08 | 华为技术有限公司 | 评估视频质量的方法和装置 |
US10045051B2 (en) | 2012-05-22 | 2018-08-07 | Huawei Technologies Co., Ltd. | Method and apparatus for assessing video quality |
Also Published As
Publication number | Publication date |
---|---|
JP5043856B2 (ja) | 2012-10-10 |
US20080317111A1 (en) | 2008-12-25 |
JP2009518915A (ja) | 2009-05-07 |
US8254438B2 (en) | 2012-08-28 |
WO2007066066A3 (en) | 2007-08-02 |
CN101356827A (zh) | 2009-01-28 |
WO2007066066A2 (en) | 2007-06-14 |
CA2632403C (en) | 2015-05-26 |
EP1958454A2 (en) | 2008-08-20 |
EP1958454B1 (en) | 2016-04-27 |
CA2632403A1 (en) | 2007-06-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101356827B (zh) | 非介入式视频质量测量 | |
KR101558636B1 (ko) | 비디오 품질 측정 방법 | |
CN102918862B (zh) | 产生质量测量值的方法和设备 | |
US7038710B2 (en) | Method and apparatus for measuring the quality of video data | |
US20100061446A1 (en) | Video signal encoding | |
KR101188833B1 (ko) | 비디오 품질을 객관적으로 평가하기 위한 방법, 장치, 및 프로그램 | |
Kanumuri et al. | Predicting H. 264 packet loss visibility using a generalized linear model | |
US20090060027A1 (en) | Compressed Signal Subjective Quality Ratings Prediction | |
MX2014007041A (es) | Metodo y aparato para medicion de calidad de video. | |
Singam | Computational Complexity of Human Visualization Characteristics based on Well Known Metric | |
Davis et al. | Hybrid no-reference video quality prediction | |
KR101015253B1 (ko) | 압축/복원된 영상에 대한 주관적 화질 평가 방법 및 장치 | |
Lin et al. | Network-based packet loss visibility model for SDTV and HDTV for H. 264 videos | |
Yamada et al. | No-reference quality estimation for video-streaming services based on error-concealment effectiveness | |
Li et al. | A quality prediction model for JPEG2000-based color images | |
Önür et al. | A complexity-utility framework for modeling decoding complexity towards optimizing subjective quality of video for mobile devices | |
KR20050019867A (ko) | 비디오 데이터의 품질을 측정하기 위한 방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |