CN101523441B - 空间活动量度和用于评价空间活动量度的方法 - Google Patents

空间活动量度和用于评价空间活动量度的方法 Download PDF

Info

Publication number
CN101523441B
CN101523441B CN2007800365066A CN200780036506A CN101523441B CN 101523441 B CN101523441 B CN 101523441B CN 2007800365066 A CN2007800365066 A CN 2007800365066A CN 200780036506 A CN200780036506 A CN 200780036506A CN 101523441 B CN101523441 B CN 101523441B
Authority
CN
China
Prior art keywords
spatial activity
image
spatial
noise
circulation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2007800365066A
Other languages
English (en)
Other versions
CN101523441A (zh
Inventor
路小安
翟杰夫
克里斯蒂娜·古米拉
Original Assignee
汤姆逊许可证公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 汤姆逊许可证公司 filed Critical 汤姆逊许可证公司
Publication of CN101523441A publication Critical patent/CN101523441A/zh
Application granted granted Critical
Publication of CN101523441B publication Critical patent/CN101523441B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/40Analysis of texture
    • G06T7/41Analysis of texture based on statistical description of texture

Abstract

通常基于图像方差、图像梯度或DCT系数中的一种来建立用于对图像进行表征的空间活动量度。然后,将空间活动量度减小所估计的图像中的噪声量,以使得当空间活动量度与空间掩蔽相结合时将会降低因诸如胶片颗粒之类的噪声的存在而引起的未掩蔽失真的似然性。通过确定空间活动量度对图像中具有相似纹理的区域做出的测量的相似性以及确定空间活动量度对图像中具有不同纹理的区域做出的测量的差异,来确定这种空间活动量度的有效性。

Description

空间活动量度和用于评价空间活动量度的方法
相关申请的交叉引用
根据35U.S.C119(e),本申请要求2006年9月29日提交的美国临时专利申请No.60/848,296的优先权,其教导被结合于此。
技术领域
本发明涉及通过空间活动量度(spatial activity metric)对图像进行表征。
背景技术
在图像处理领域,空间活动量度提供了对图像的规定区域内的纹理(texture)的测量。利用此对纹理的测量使得许多通常的图像处理应用能够利用人类视觉系统的空间掩蔽效应(spatial masking effect)。空间掩蔽的发生是因为人类视觉系统机制可以容忍引入到图像的纹理化区域中的更多失真(与引入到图像的平滑区域中的失真相比而言)。在经过压缩的视频图像的情况中,引入到图像中的失真对应于因量化引起的压缩噪声。在对视频图像加水印的情况中,引入的失真对应于嵌入的数据。
许多图像处理应用使用空间活动量度来在平坦的或者低细节的区域(在此区域中,引入的失真对人眼来说表现为较明显)和繁杂的或纹理化的区域(在此区域中,引入的失真表现为较不明显)之间进行区分。虽然现有的空间活动量度提供了对无颗粒(grain-free)图像(诸如与动画有关的图像或者其他具有诸如低胶片颗粒强度(film grain strength)的低分辨率噪声的图像)的良好测量,但是这些量度不能在存在这种噪声的情况下对空间活动进行表征。因此,对于包含噪声的图像,空间掩蔽可能产生引入的失真未被掩蔽的图像部分。
现有的空间活动量度可以被分成三类:(1)基于方差(variance)的;(2)基于梯度(gradient)的;以及(3)基于DCT的。下面给出每类的说明,所有说明都基于16×16的块。
基于方差的量度
此量度利用亮度(luminance)的方差来测量空间活动。此类中的一种代表性量度是在MPEG-2参考软件的速率控制算法中所使用的量度。
ACT var = 1 + min i = 1,2,3,4 ( var i ) , - - - ( 1 )
其中,vari是第i个8×8的子块的方差。利用此量度,MPEG-2参考软件允许纹理化区域中的较多失真以及平滑区域中的较少失真,并且因此以相同的比特率为整个画面获得了较高的视觉质量。
基于梯度的量度
在此类中存在两种量度。第一量度ACTgra 1考虑了水平和竖直梯度:
ACT gra 1 = 1 16 × 15 { Σ i = 0 14 Σ j = 0 15 | I i , j - I i + 1 , j | + Σ i = 0 15 Σ j = 0 14 I i , j - I i , j + 1 | } , - - - ( 2 )
其中,Ii,j是像素(i,j)处的亮度值。第二量度ACTgra 2考虑了对角线方向:
ACT gra 2 = Σ i = 0 15 Σ j = 0 15 max n ( grad i , j , 1 , . . . , grad i , j , 4 ) , - - - ( 3 )
其中,gradi,j,n是通过下面的4个5×5的定向高通滤波器在像素(i,j)[3]处计算得到的局部梯度:
Figure G2007800365066D00024
基于DCT的量度
此量度利用了亮度值的DCT系数的AC成分。第一量度考虑了AC系数的绝对值:
ACT DCT 1 = Σ i = 1 15 Σ j = 1 15 | F ( i , j ) | , - - - ( 5 )
其中,F(i,j)是频率(i,j)的DCT系数。另一量度通过DC系数[3]对AC系数进行归一化(normalize):
ACT DCT 2 = 1 16 × 16 Σ i = 0 15 Σ j = 0 15 F 2 ( i , j ) F 2 ( 0,0 ) - 1 . - - - ( 6 )
上述量度提供了对具有低噪声(诸如胶片颗粒强度)的无颗粒或低分辨率图像的良好测量。但是,这些量度将诸如胶片颗粒之类的噪声作为纹理来对待,并且对主要由强噪声(诸如胶片颗粒)构成的平滑区域分配了相对高的值。因此,这些量度将错误地把具有强噪声的平滑区域认为是纹理化区域。因此,这样的量度将很可能引入比这些平滑区域可以掩蔽的失真更多的失真。
因此,需要一种有效地对存在诸如胶片颗粒之类的噪声的区域的空间活动进行测量的新的空间活动量度。
当空间活动量度测量与空间掩蔽一起被用于改善显示图像的质量时,图像的视觉质量用作对量度的有效性的测量。在视频压缩的情况中,经解码的画面用作显示画面。在加水印的应用中,显示的画面将具有嵌入的数据。对空间活动量度的有效性的测量涉及大量主观评价。
为了减少评价时间,需要一种对空间活动量度的性能进行评估的客观方法。
发明内容
简要地,根据当前原理的一个优选实施例,提供了一种建立用于对图像进行表征的空间活动量度的方法。该方法通过首先确定空间活动量度而开始。之后,估计图像内的噪声(该噪声可以包括胶片颗粒)。然后,将空间活动量度减少所估计的噪声量,以使得在结合空间掩蔽使用该空间活动量度时降低因噪声(诸如胶片颗粒)的存在而引起的未掩蔽的失真的似然性(likelihood)。
根据当前原理的另一方面,提供了一种对空间活动量度的有效性进行表征的方法,该空间活动量度具有用于提供对图像中的纹理的测量的类型。该方法通过确定由空间活动量度针对图像中具有相似纹理的区域做出的测量的相似性而开始。还要确定由空间活动量度针对图像中具有不同纹理的区域做出的测量的差异。空间活动测量对相似地纹理化的区域提供相似测量以及对具有不同纹理的区域的测量之间的较大差距(large spread)的程度反映了该量度的高性能程度。
附图说明
图1以流程图的形式示出用于将根据当前原理的第一实施例所建立的空间活动量度应用于图像的处理的步骤;
图2以流程图的形式示出用于将根据当前原理的第二实施例所建立的空间活动量度应用于图像的处理的步骤;
图3以流程图的形式示出用于将根据当前原理的第三实施例所建立的空间活动量度应用于图像的处理的步骤;
图4以流程图的形式示出根据当前原理的另一方面的用于对空间活动量度的有效性进行表征的处理的步骤;
图5示出一种示例性视频编码器的示意框图,其示出针对编码器所使用的速率控制算法可以如何应用空间活动量度;
图6以流程图的形式示出根据当前原理的另一方面的用于在图5的编码器中实现速率控制的处理的步骤;以及
图7示出应用空间活动量度对视频质量进行分级的视觉质量分析器的示意框图。
具体实施方式
虽然现有的空间活动量度提供了对胶片颗粒强度较低的无颗粒或低分辨率图像的良好测量,但是在存在胶片颗粒时,这些量度不仅对空间活动表现出强的依赖性,而且对明度(brightness)表现出强的依赖性。为了论述的目的,胶片颗粒一般是作为胶片显影期间生成的随机纹理而出现在图像中的。胶片颗粒一般被认为是附加的、依赖于信号的噪声,其依赖胶片库存(film stock)、光照条件和显影处理而在大小、形状和强度上不同。胶片颗粒的灰度(intensity)表现为与像素灰度非常相关,这解释了为什么现有空间活动量度强烈地依赖于明度。
根据当前原理,提供了一种用于建立空间活动量度的方法,该空间活动量度大大降低了对明度的依赖性。当前原理的方法通过下述两方面来降低对明度的依赖性:(1)估计胶片颗粒(通常通过建模),以及(2)从空间活动量度去除胶片颗粒强度。
胶片颗粒估计
可以根据下面的关系通常通过建模来估计胶片颗粒:
g(i,j)=f(i,j)+f(i,j)γ×n(i,j),                        (7)
其中g(i,j)和f(i,j)分别构成位置(i,j)处的观察到的像素值和无噪声像素值,γ是给出胶片库存和拍摄条件的常数,且n(i,j)是零均值正态分布噪声。乘积f(i,j)γ×n(i,j)表征了胶片颗粒。通常,γ落在0.3-0.7的范围内,并且在大多数情况中具有约为0.5的值。对于f(i,j)紧密聚在一起的平滑区域,式(8)可近似为:
g(i,j)=f(i,j)+fγ×n(i,j),                     (8)
其中, f ‾ = 1 M × N Σ i = 1 M Σ j = 1 N f ( i , j ) ≈ f ( i , j ) . 假定n(i,j)独立于f(i,j),则可以得到如下的方差关系:
σ g 2 = σ f 2 + f ‾ 2 γ × σ n 2 = σ f 2 + σ grain 2 , - - - ( 9 )
其中,σg 2、σf 2和σn 2分别是g(i,j)、f(i,j)和n(i,j)的方差,σgrain 2是胶片颗粒的方差。
对于最初记录在胶片上并且之后被转换成高分辨率视频的图像,通常大部分区域表现为平坦或者几乎平坦,也就是它们没有纹理。这些区域的方差主要依赖于胶片颗粒,即, σ f 2 ≈ 0 并且 σ g 2 ≈ σ n 2 . 对于具有相似明度的平坦区域,颗粒的特性是均一的,这产生了比纹理化区域的方差更小的非常接近的σg 2。因此,方差的直方图通常具有较小的峰。因此,基于直方图的用于估计颗粒强度的方法将产生良好的结果。
为了利用基于直方图的方法,首先根据分开的明度范围将图像中的区域分类成为多个组。对于每个组,计算方差的直方图,以使得能够识别出第一峰σpeak,i 2。利用来自所有明度范围的σpeak,i 2,可以利用线性回归得出σgrain 2作为明度的线性函数。
为了消除胶片颗粒的影响,根据下述关系式从现有的基于方差的量度ACTvar导出胶片颗粒项:
ACT var new = A CT var - m ( σ grain 2 ) , - - - ( 10 )
其中,m(σgrain 2)是σgrain 2的函数。在特定实施例中,胶片颗粒的影响可以被认为是胶片颗粒的方差,即, m ( σ grain 2 ) = σ grain 2 .
当考虑胶片颗粒以外的噪声时,类似的方法可用于对噪声进行建模并且去除其对空间活动量度的影响。扩展从其它现有空间活动量度去除诸如胶片颗粒之类的噪声影响的方法将为具有噪声的画面产生改善的性能。
图1以流程图的形式示出用于将根据当前原理的第一实施例所建立的空间活动量度应用于图像的处理的步骤。图1的处理在步骤100开始,在该步骤中,各种变量被初始化。在步骤100之后,执行步骤110以发起第一迭代循环,该循环被示出为循环(1),该循环的循环索引值(loopindex value)i最初等于1。在每次执行此循环时,循环索引值i增加1。循环(1)包括步骤120-170。步骤120被执行以发起从图像读取第i组数据。之后,步骤130被执行,并且通常通过前面描述的建模处理来进行胶片颗粒估计。
在步骤130之后是步骤140,并且第二迭代循环开始,该循环被示出为循环(2),该循环的循环索引值j最初等于1。在每次执行此循环时,循环索引值j增加1。循环(2)包括步骤150-160。步骤150被执行以计算第j区域的空间活动量度。步骤150的重复执行使得能够为第i组数据的每个区域计算空间活动量度。对于基于块的视频压缩应用(诸如MPEG-4AVC),一个区域指16×16的宏块(macroblock)。
步骤150中对空间活动量度的计算是通过最初建立量度(通常利用前面所述的已知技术之一)而开始的。这样,最初建立的空间活动量度可以构成基于方差、基于梯度或者基于DCT的量度。在最初建立量度之后,从此量度减去通常根据建模而获得的估计的噪声(例如胶片颗粒),以去除这种噪声的影响。然后,在步骤160中将步骤150中计算出的空间活动量度应用于图像。当被应用于图像时,空间活动量度提供对纹理的测量,以通过引入失真而允许空间掩蔽,使得在平坦区域(在此区域中,失真相对于人眼是较明显的)中引入的失真表现较不明显。在步骤170中,第二循环(循环(2))结束。换句话,循环(2)内的步骤被重复执行,直到循环变量j达到其最大值(对应于总区域数)时为止。在步骤180中,第一循环(循环(1))结束。换句话,循环(1)内的步骤被重复执行,直到循环变量i达到其最大值(对应于要被读取的总数据组数)时为止。在所有数据组的每个区域都经过处理之后,整个处理在步骤190结束。
图2以流程图的形式示出用于将根据当前原理的第二实施例所建立的空间活动量度应用于图像的处理的步骤。如在下文中将会更好地理解的,图2的处理包括许多与图1相同的步骤。然而,图2的处理实质区别在于通过利用与模型所操作的那组数据不同的一组数据来对胶片颗粒进行建模。在特定实施例中,序列中的最初n个画面可用于对胶片颗粒进行建模,但是该模型被应用于该序列中的每个画面。
参考图2,一旦执行进行初始化的开始步骤(步骤200),就开始空间活动量度应用处理。之后,步骤210被执行,在该步骤中,读取用于胶片颗粒建模的一组数据,之后在步骤220中提取模型参数(例如对颗粒的建模)以估计噪声。
然后,步骤230被执行以发起第一迭代循环,该循环被示出为循环(1),该循环的循环索引值i最初等于1。在每次执行此循环时,循环索引值i增加1。此循环包括步骤240-280。步骤240被执行以发起从图像读取第i组数据。步骤250发起第二迭代循环,该循环被示出为循环(2),该循环的循环索引值j最初等于1。在每次执行此循环时,循环索引值j增加1。循环(2)包括步骤260-270。步骤260被执行以计算第j区域的空间活动量度。步骤260的重复执行确保为此组数据的每个区域计算空间活动量度。
步骤260中对空间活动量度的计算是通过最初建立量度(通常利用前面所述的已知技术之一)而开始的。最初,空间活动量度可以构成基于方差、基于梯度或者基于DCT的量度。在最初建立量度之后,减去通常根据建模而获得的估计的噪声(例如胶片颗粒),以去除这种噪声对量度的影响。然后,在步骤270中将步骤260中计算出的空间活动量度应用于图像。此空间活动量度提供对纹理的测量,以通过引入失真来允许空间掩蔽,使得在失真相对于人眼较明显的平坦区域中引入的失真表现较不明显。在步骤280中,第二循环(循环(2))结束。换句话,循环(2)内的步骤被重复执行,直到循环变量j达到其最大值(对应于总区域数)时为止。在步骤290中,第一循环(循环(1))结束。换句话,循环(1)内的步骤被重复执行,直到循环变量i达到其最大值(对应于要被读取的总数据组数)时为止。在所有数据组的每个区域都经过处理之后,整个处理在步骤295结束。
与图1的处理相比,图2的处理的优点在于通过利用可能与模型被应用于的数据不同的一组数据来进行图2中的胶片颗粒的建模。通过增大建模的样本数,模型精度增大。将所有数据组中的一部分用于建模将会增大处理速度。
图3以流程图的形式示出用于将根据当前原理的第三实施例所建立的空间活动量度应用于图像的处理的步骤。图3的处理通过利用作为元数据而提供的胶片颗粒模型,构成图1的处理的变体。
图3的处理在步骤300开始,在该步骤中,各种变量被初始化。在步骤300之后,步骤310被执行以从元数据获得胶片颗粒模型。之后,步骤320被执行以开始第一迭代循环,该循环被示出为循环(1),该循环的循环索引值i最初等于1。在每次执行此循环时,循环索引值i增加1。该循环包括步骤330-370。步骤330被执行以发起从图像读取第i组数据。步骤330之后为步骤340,并且第二迭代循环开始,该循环被示出为循环(2),该循环的循环索引值j最初等于1。在每次执行此循环(2)时,循环索引值j增加1。循环(2)包括步骤350-360。步骤350被执行以计算第j区域的空间活动量度。步骤350的重复执行使得能够为此组数据的每个区域来计算空间活动量度。
步骤350中对空间活动量度的计算是通过最初建立量度(通常利用前面所述的已知技术之一)而开始的。最初,空间活动量度可以构成基于方差、基于梯度或者基于DCT的量度。在最初建立量度之后,减去通常根据建模而获得的估计的噪声(例如胶片颗粒),以去除这种噪声对量度的影响。然后,在步骤360中将步骤350中计算出的空间活动量度应用于图像。此活动量度提供对纹理的测量,以通过引入失真来允许空间掩蔽,使得在失真相对于人眼较明显的平坦区域中引入的失真表现为较不明显。
在步骤370中,第二循环(循环(2))结束。换句话,循环(2)内的步骤被重复执行,直到循环变量j达到其最大值(对应于总区域数)时为止。在步骤380中,第一循环(循环(1))结束。换句话,循环(1)内的步骤被重复执行,直到循环变量i达到其最大值(对应于要被读取的总数据组数)时为止。在所有数据组的每个区域都经过处理之后,整个处理在步骤390结束。
空间活动量度性能评估方法
一般而言,空间活动量度有助于充分利用空间掩蔽效应。例如,为了在视频压缩应用中获得均一的高视觉质量,与较小的空间活动量度测量相关联的区域被以较低的量化步长压缩。相反,与较大的空间活动量度测量相关联的区域被以较高的量化步长压缩。因此,空间活动量度的性能将强烈地影像显示画面的视觉质量。通过评估显示画面的视觉质量来判断空间活动量度的性能是常见的。这样的处理涉及大量主观评价。
根据当前原理的另一方面,提供了一种用于评估空间活动量度的性能的方法。如下文所述,该方法通过针对平滑区域和纹理化区域二者客观地评估量度的性能来作出这样的评估。
平滑区域集中(concentration)
优选地,有效的空间活动量度应当对具有相似视觉平滑度的区域分配相似的测量,即,对于所有平滑区域,空间活动量度测量应当集中在一个水平。
平滑区域和繁杂区域之间的差距
为了使给定的图像处理应用(例如,视频压缩)充分利用掩蔽效应并允许纹理化区域中的更多失真,空间活动量度测量应当提供平滑区域和纹理化区域(例如繁杂区域)之间的差距。
根据上面两个标准,评估(下文中称为“平滑繁杂区域差距(SBAS)”)可以被定义,用于对以下二者进行量化:(1)空间量度如何对具有相似视觉平滑度的区域分配测量,以及(2)空间量度如何将平滑区域和繁杂区域分开。
数学上,平滑繁杂区域差距可以通过下式表达:
SBAS = | avg pic - avg flat | σ flat , - - - ( 11 )
其中,avgpic是用于整个画面的平均量度,avgflat和σflat分别是平滑区域中的量度的平均值和标准偏差。注意,对于本方法,平滑区域被手动选择并且用作该方法的视觉提示。当空间活动量度为具有相似视觉平滑度的区域分配相似测量时,σflat将较小。另一方面,当空间活动量度将平滑区域和纹理化区域分开时,|avgpic-avgflat|变大。因此,SBAS的值越大,空间活动量度越有效。
图4示出根据当前原理的说明性实施例的用于对空间活动量度的有效性进行评估的方法。本评估方法以步骤400的执行开始,在步骤400中,进行初始化。之后,步骤410被执行,并且读取一组图像数据。在步骤420中,手动选择图像内的平滑区域。接着,在步骤430中,第一循环开始,其中循环索引值i最初等于1。该循环包括步骤440,并且在每次执行此循环时,索引值i增大,直到所有空间活动量度中的最后一个已经经过分析为止,如下所述。
在每次执行步骤440时,为每个空间活动量度i来计算如根据式(11)所述的SBAS的值。该循环在步骤450结束。换句话,该循环内的步骤被重新执行,直到循环变量i达到其最大值(对应于经过评价的空间活动量度数)时为止。在步骤460,对空间活动量度进行总的评价。具有最大SBAS的空间活动量度成为“最佳”量度。
图5示出示例性视频编码器的示意框图,其示出针对编码器所采用的速率控制算法可以如何应用空间活动量度。图5的编码器包括对进入的视频信号进行缓冲的帧排序缓冲器500。帧排序缓冲器500将其输出端耦合到求和块502的第一输入端,求和块502的输出端连接到变换和量化块505,变换和量化块505用于在熵编码块510执行熵编码之前对来自求和块的进入视频数据执行变换和量化。熵编码块510将其输出端连接到求和块515的第一输入端,求和块515的输出端连接到输出缓冲器520,输出缓冲器520在编码器进行输出之前存储经编码的视频。该求和块的第二输入端接收来自SEI插入器518的补充增强信息(SEI)消息,SEI插入器518根据输入的元数据来产生这种消息。
由熵编码块510执行的编码依赖于由运动估计块525对存储在参考画面存储器527中的参考画面执行的运动估计。运动补偿块530确定由运动估计块525建立的运动估计所需的运动补偿量。在帧间预测(inter-prediction)模式中,运动估计在编码器的操作期间被经由开关535而施加到求和块502的第二输入端。宏块(MB)确定块540控制开关535,以基于哪种模式对目前的宏块提供最佳编码来在帧间预测和内部预测之间进行选择。
当在内部预测模式下操作时,开关535耦合到内部预测块545的输出端,内部预测块545基于逆变换和量化块550和宏块确定块540的输出信号的和(如求和块555所提供的)来提供相同画面的预测。逆变换和量化块550对由变换和量化块505产生的输出信号执行逆变换和量化。求和块555的输出端连接到解块滤波器(deblocking filter)560,解块滤波器560对画面执行操作以便随后存储在参考画面缓冲器527中。
图5的编码器包括速率控制块570,速率控制块570控制变换和量化块505的量化水平。另外,速率控制块570还控制画面类型确定块580,以控制进行编码的画面的类型。此外,速率控制块570还控制序列参数集(SPS)和画面参数集(PPS)插入器590,SPS和PPS插入器590将序列集提供到求和块以插入到经编码的视频中。
在图5中看到,速率控制块570响应于空间活动量度而操作。图6以流程图的形式示出在图5的编码器的速率控制块570内应用空间活动量度的处理的步骤。处理在步骤600开始,在该步骤期间进行初始化。之后,步骤610被执行,在步骤610期间,通常操作员的帮助下进行编码器设置。编码器设置可涉及对目标比特率和与编码处理有关的一个或多个参数的规范的设置。在步骤610之后是步骤620,用于开始一个循环,该循环的索引值i对应于宏块(MB)数。最初,索引值i等于1。该循环包括步骤630-650。在每次执行步骤630时,计算第i个宏块(MBi)的空间活动量度ACTnew的值。在每次执行步骤640时,根据以下关系式计算第i个宏块的量化偏移:
ΔQP=q(ACTnew)                         (12)
按照这种方式,空间活动量度将映射到量化步长或者QP参数偏移。在步骤650期间,编码器将对第i个宏块(MBi)进行编码,通常利用现有的压缩标准,诸如MPEG-2、MPEG-4 AVC或VC-1。该循环在步骤660结束。换句话,这些步骤重复执行,直到循环变量i达到其最大值(对应于宏块数)时为止。之后,处理在步骤670结束。
图7描述在对视频质量进行分类时应用空间活动量度的视觉质量分析器的示意框图。该视频质量分析器包括应用于输入画面的空间活动量度700。空间活动量度700提供的对纹理的测量控制着块705所执行的空间噪声掩蔽。
第一质量分析器710针对参考画面对输入画面进行客观质量分析。第二质量分析器720接收第一分析器的输出以及来自块705的经过空间掩蔽的画面,以与这组参考画面相比较。第二分析器720的输出提供质量评估结果。
前面描述了利用考虑了图像噪声的空间活动量度对图像进行表征的技术。

Claims (7)

1.一种通过空间活动量度对图像进行表征的方法,包括以下步骤:
建立用于对图像的纹理进行表征的空间活动量度(150);
估计所述图像内的噪声(130);以及
通过减去所估计的噪声来修改所建立的空间活动量度(150),以便于在对有噪声图像的图像处理中使用修改后的空间活动量度,从而利用人类视觉系统的空间掩蔽。
2.根据权利要求1所述的方法,其中,根据所述图像内的方差、图像梯度或离散余弦变换系数中的一者来最初建立所述空间活动量度。
3.根据权利要求1所述的方法,其中,根据公共的图像数据组来建立所述空间活动量度并估计所述噪声。
4.根据权利要求1所述的方法,其中,根据不同的数据组来建立所述空间活动量度并估计所述噪声。
5.根据权利要求1所述的方法,其中,利用通过元数据获得的模型来估计所述噪声。
6.根据权利要求1所述的方法,还包括以下步骤:将修改后的空间活动量度应用于编码器,以改变编码器速率控制。
7.根据权利要求1所述的方法,还包括以下步骤:将修改后的空间活动量度应用于编码器,以控制编码器量化偏移。
CN2007800365066A 2006-09-29 2007-09-18 空间活动量度和用于评价空间活动量度的方法 Expired - Fee Related CN101523441B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US84829606P 2006-09-29 2006-09-29
US60/848,296 2006-09-29
PCT/US2007/020227 WO2008042112A2 (en) 2006-09-29 2007-09-18 Spatial activity metric and method for evaluating the same

Publications (2)

Publication Number Publication Date
CN101523441A CN101523441A (zh) 2009-09-02
CN101523441B true CN101523441B (zh) 2012-01-18

Family

ID=39268952

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2007800365066A Expired - Fee Related CN101523441B (zh) 2006-09-29 2007-09-18 空间活动量度和用于评价空间活动量度的方法

Country Status (7)

Country Link
US (1) US20090268981A1 (zh)
EP (1) EP2070048B1 (zh)
JP (1) JP5048071B2 (zh)
KR (1) KR20090068222A (zh)
CN (1) CN101523441B (zh)
DE (1) DE602007010493D1 (zh)
WO (1) WO2008042112A2 (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102567961B (zh) * 2010-12-30 2016-05-18 意法半导体研发(深圳)有限公司 感知块屏蔽估算系统
CN103428523B (zh) * 2012-05-22 2015-07-08 华为技术有限公司 评估视频质量的方法和装置
GB2513112B (en) * 2013-04-08 2020-01-08 Snell Advanced Media Ltd Video sequence processing
JP6300565B2 (ja) * 2014-02-19 2018-03-28 株式会社メガチップス 動画像符号化装置、プログラム、および、集積回路
EP3275166A1 (en) 2015-07-24 2018-01-31 Hp Indigo B.V. Gray component replacement
EP3685578A1 (en) 2017-09-21 2020-07-29 Fraunhofer Gesellschaft zur Förderung der Angewand Concept for varying a coding quantization parameter across a picture, coding quantization parameter adjustment, and coding quantization parameter adaptation of a multi-channel picture

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5214507A (en) * 1991-11-08 1993-05-25 At&T Bell Laboratories Video signal quantization for an mpeg like coding environment
CN1578470A (zh) * 2003-07-04 2005-02-09 法国耐思讯公司 用于编码视频数据的设备和方法
CN1708991A (zh) * 2002-11-08 2005-12-14 苹果电脑有限公司 利用拉格朗日乘子和视觉掩蔽来控制速率-失真折中的方法和装置
CN1720751A (zh) * 2002-12-06 2006-01-11 英国电讯有限公司 视频质量测量

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0479510B1 (en) * 1990-09-29 2000-06-28 Victor Company Of Japan, Ltd. Image signal coding/decoding system using adaptive quantization
US5764307A (en) * 1995-07-24 1998-06-09 Motorola, Inc. Method and apparatus for spatially adaptive filtering for video encoding
US5974181A (en) * 1997-03-20 1999-10-26 Motorola, Inc. Data compression system, method, and apparatus
EP1230805B1 (en) * 1999-11-11 2008-11-19 STMicroelectronics Asia Pacific Pte Ltd. Video signal noise level estimator
US6580062B2 (en) * 2001-05-29 2003-06-17 Hewlett-Packard Development Company, L.P. Contrast focus figure-of-merit method that is insensitive to scene illumination level
US7062108B2 (en) * 2001-06-12 2006-06-13 Eastman Kodak Company Method for estimating the appearance of noise in images
KR100584552B1 (ko) * 2003-01-14 2006-05-30 삼성전자주식회사 동영상 부호화 및 복호화 방법과 그 장치
JP4723483B2 (ja) * 2003-04-10 2011-07-13 トムソン ライセンシング 符号化ビデオに於いてフィルム粒子をシミュレートする技術
JP2006067302A (ja) * 2004-08-27 2006-03-09 Toshiba Corp 画像符号化装置、画像符号化方法および画像符号化プログラム
FR2893738B1 (fr) * 2005-11-18 2007-12-28 Pascal Hannequin Reduction de bruit dans une image numerique par transformee en cosinus discrete.

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5214507A (en) * 1991-11-08 1993-05-25 At&T Bell Laboratories Video signal quantization for an mpeg like coding environment
CN1708991A (zh) * 2002-11-08 2005-12-14 苹果电脑有限公司 利用拉格朗日乘子和视觉掩蔽来控制速率-失真折中的方法和装置
CN1720751A (zh) * 2002-12-06 2006-01-11 英国电讯有限公司 视频质量测量
CN1578470A (zh) * 2003-07-04 2005-02-09 法国耐思讯公司 用于编码视频数据的设备和方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
MARK R.Pickering,John F.Arnold.《A PERCEPTUALLY EFFICIENT VBR RATE CONTROL ALGORITHM》.《IEEE TRANSACTIONS ON IMAGE PROCESSING》.1994,第3卷(第5期),527-532. *

Also Published As

Publication number Publication date
JP2010505342A (ja) 2010-02-18
CN101523441A (zh) 2009-09-02
DE602007010493D1 (de) 2010-12-23
WO2008042112A2 (en) 2008-04-10
EP2070048A2 (en) 2009-06-17
KR20090068222A (ko) 2009-06-25
US20090268981A1 (en) 2009-10-29
JP5048071B2 (ja) 2012-10-17
WO2008042112A3 (en) 2008-05-29
EP2070048B1 (en) 2010-11-10

Similar Documents

Publication Publication Date Title
Pan et al. A locally-adaptive algorithm for measuring blocking artifacts in images and videos
Eden No-reference estimation of the coding PSNR for H. 264-coded sequences
US10134121B2 (en) Method and system of controlling a quality measure
CN101523441B (zh) 空间活动量度和用于评价空间活动量度的方法
Ma et al. Reduced-reference image quality assessment in reorganized DCT domain
CN101485209B (zh) 在多步视频编码器中增强性能的方法和装置
US8315475B2 (en) Method and apparatus for detecting image blocking artifacts
Sheikh et al. Blind quality assessment for JPEG2000 compressed images
CN104378636B (zh) 一种视频图像编码方法及装置
KR20050004862A (ko) 압축된 비디오 데이터의 객관적인 품질을 추정하기 위한방법 및 시스템
Zhang et al. Reduced reference image quality assessment based on statistics of edge
CN104992419A (zh) 基于jnd因子的超像素高斯滤波预处理方法
US10129565B2 (en) Method for processing high dynamic range video in order to improve perceived visual quality of encoded content
Zhu et al. No-reference quality assessment of H. 264/AVC encoded video based on natural scene features
US10708624B1 (en) Pre-processing for video compression
Zhang et al. Quality assessment methods for perceptual video compression
De Angelis et al. Image quality assessment: an overview and some metrological considerations
Kumar et al. Quality assessment of compressed MR medical images using general regression neural network.
Rao et al. Image quality assessment based on perceptual structural similarity
Wang et al. New no-reference blocking artifacts metric based on human visual system
Aja-Fernández et al. Full reference image quality assessment based on local statistics
Park et al. Structural similarity based image compression for LCD overdrive
Liu et al. A wavelet-domain structure similarity for image quality assessment
Lin et al. A no-reference blockiness metric for videoconference
Rao et al. Weighted structural similarity based on edge strength for image quality assessment

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120118

Termination date: 20140918

EXPY Termination of patent right or utility model