CN101156453B - 局部调整量化阶的方法和编码图像序列的方法和设备 - Google Patents

局部调整量化阶的方法和编码图像序列的方法和设备 Download PDF

Info

Publication number
CN101156453B
CN101156453B CN2006800112157A CN200680011215A CN101156453B CN 101156453 B CN101156453 B CN 101156453B CN 2006800112157 A CN2006800112157 A CN 2006800112157A CN 200680011215 A CN200680011215 A CN 200680011215A CN 101156453 B CN101156453 B CN 101156453B
Authority
CN
China
Prior art keywords
quantization step
image
interest
area
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2006800112157A
Other languages
English (en)
Other versions
CN101156453A (zh
Inventor
莱拉·于格内尔
多米尼克·索罗
菲利浦·吉约泰尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
InterDigital VC Holdings Inc
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Publication of CN101156453A publication Critical patent/CN101156453A/zh
Application granted granted Critical
Publication of CN101156453B publication Critical patent/CN101156453B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/192Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/167Position within a video image, e.g. region of interest [ROI]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/152Data rate or code amount at the encoder output by measuring the fullness of the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/154Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/179Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scene or a shot
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明涉及一种用于对n个图像的序列中的图像的每个区域的量化阶进行局部调整的方法。所述方法包括以下步骤:针对序列中的每个图像,计算在以第一量化阶对潜在的掩蔽区域进行量化时在该潜在的掩蔽区域上所节省的第一比特差和在以第二量化阶对感兴趣区域进行量化时该感兴趣区域所需要的第二比特差;以及在序列的每个图像中,将第一量化阶分配给潜在的掩蔽区域,并且如果n个第一比特差之和(GPOT)大于n个第二比特差之和(DROI),则将所述第二量化阶分配给所述感兴趣区域,否则将第三量化阶分配给所述感兴趣区域,以便根据重构质量准则,将所述n个第一比特差之和分布在感兴趣区域之间。

Description

局部调整量化阶的方法和编码图像序列的方法和设备
技术领域
本发明涉及一种使用对图像序列进行预分析的步骤来对图像序列中的量化阶进行局部调整的方法。 
背景技术
本发明应用于视频压缩领域,具体为选择性压缩。对具有感兴趣区域的图像进行选择性压缩的任何方法都包括两种机制:先验选择机制和先验压缩机制: 
-对信息的选择是视觉注意机制,该机制定义了图像中所包含的感兴趣事件的位置以及这些事件相互间的相对重要性; 
-先验压缩机制表征了图像的特性和编码以及针对编码资源(即,比特率或质量)的分配准则。 
任何压缩方法都包括用于对要编码的数据进行量化的量化方法。更具体地,本发明涉及对图像中的每个区域的量化阶的局部调整。根据传统方法,针对每个宏块(或针对每个像素块),根据其在图像内的心理视觉重要性来执行量化阶的局部调整。这些方法具体用于加强对较不重要的宏块的量化,以及相反地,通过减少关联的量化阶来保护重要的宏块(即吸引注意的宏块)。然而,通过使用这些方法,重要宏块的重构质量(即解码之后的质量)可以在从一个图像到下一个图像之间剧烈变化,这对于观察者而言是一个问题。此外,重构质量还会在感兴趣区域内变化。 
发明内容
本发明的目的是解决现有技术中的至少一个缺点。本发明涉及一  种用于相对于设定点(setpoint)量化阶(quantization step)(QP*)来对n个图像的序列中的图像的量化阶进行局部调整的方法。每个图像都包括至少一个感兴趣区域和一个潜在的掩蔽(masking)区域,每个区域都可能包括多个不相交的像素组。当以设定点量化阶来对感兴趣区域和潜在的掩蔽区域进行量化时,分别以第一和第二比特数来对该感兴趣区域和潜在的掩蔽区域进行编码。根据本发明,该方法包括以下步骤: 
-针对序列中的每个图像,计算第二比特数和用于对以大于或等于设定点量化阶(QP*)的第一量化阶(QP_POT_MAXj)所量化的潜在的掩蔽区域进行编码的比特数之间的第一比特差,以及用于对以小于或等于设定点量化阶(QP*)的第二量化阶(QP_ROI_MINj)所量化的感兴趣区域进行编码的比特数和第一比特数之间的第二比特差;以及 
-在序列的每个图像中,将第一量化阶分配给潜在的掩蔽区域,以及,对于序列中的n个图像,如果n个第一比特差之和(GPOT)大于n个第二比特差之和(DROI),则将第二量化阶分配给感兴趣区域,否则给该感兴趣区域分配大于或等于第二量化阶的第三量化阶,以便根据针对每个图像所计算的重构质量准则,将n个第一比特差之和分布在序列的图像的感兴趣区域之间。 
根据特定实施例,确定第一量化阶(QP_POT_MAXj),以便在将第一量化阶用于对潜在的掩盖区域进行编码时保证该潜在的掩盖区域的第一预定重构质量(PSNRmin POT)。确定第二量化阶(QP_ROI_MINj),以便在将第二量化阶(QP_ROI_MINj)用于对感兴趣区域进行编码时保证该感兴趣区域的第二预定重构质量(PSNRmax ROI)。 
优选地,对于序列中的n个图像,在将设定点量化阶(QP*)用于对感兴趣区域进行编码时,如果n个第一比特差之和(GPOT)小于n个第二比特差之和(DROI),则与第二预定重构质量(PSNRmax ROI)和该感兴趣区域的重构质量之差成比例地,将该n个第一比特差之和(GPOT)分布在序列中的n个图像的感兴趣区域之间。 
根据另一个实施例,该图像还包括可能包括不相交的像素组的中  性(neutral)区域,将设定点量化阶(QP*)分配给该中性区域。 
本发明还涉及一种用于对n个图像的序列进行编码的方法,该方法包括:用于以一组系数对n个图像进行变换的步骤、按照量化阶对每个系数进行量化的步骤、以及对量化后的系数进行编码的步骤,其中根据上述方法对该量化阶进行局部调整。 
本发明还涉及一种用于对n个图像的序列进行编码的编码设备,该图像包括至少一个感兴趣区域和一个潜在的掩蔽区域。该设备包括: 
-装置,用于以一组系数对n个图像中的每一个图像进行变换; 
-量化装置,用于以量化阶来对该系数进行量化,在序列的每个图像中,相对于设定点量化阶(QP*)来对该量化阶进行局部调整,当以设定点量化阶(QP*)来对感兴趣区域和潜在的掩蔽区域进行量化时,以第一和第二比特数来对该感兴趣区域和潜在的掩蔽区域进行编码;以及 
-编码装置,用于对量化后的系数进行编码。 
根据本发明,该量化装置包括: 
-装置,针对序列中的每个图像,计算第二比特数和用于对以大于或等于设定点量化阶(QP*)的第一量化阶(QP_POT_MAXj)所量化的潜在的掩蔽区域进行编码的比特数之间的第一比特差,以及用于对以小于或等于设定点量化阶(QP*)的第二量化阶(QP_ROI_MINj)所量化的感兴趣区域进行编码的比特数和第一比特数之间的第二比特差;以及 
-装置,在序列的每个图像中,将第一量化阶分配给潜在的掩蔽区域,以及,对于序列中的n个图像,如果n个第一比特差之和(GPOT)大于n个第二比特差之和(DROI),则将第二量化阶分配给感兴趣区域,否则给该感兴趣区域分配大于或等于第二量化阶的第三量化阶,以便根据针对每个图像所计算的重构质量准则,将n个第一比特差之和分布在序列的图像的感兴趣区域之间。 
有利地,该编码设备还包括用于给量化装置提供设定点量化阶(QP*)的速率控制装置。 
附图说明
参考附图,示例性实施例和有利实施方式非限制性地例证了本发明,并且本发明可被更好地理解,在附图中: 
-图1示出了待编码的序列中的每个图像的感兴趣区域的PSNR趋势; 
-图2描述了根据本发明的编码设备。 
具体实施方式
本发明涉及一种用于相对于设定点量化阶(QP*)来对图像的每个感兴趣区域(即吸引更多注意的区域)的量化阶进行局部调整的方法。作为多个图像的序列中的一部分的图像由像素块组成。在对量化阶进行局部改变的方法中,通过以图像中的其他区域为代价,以有利于空间感兴趣区域,提高了针对给定的总比特率所涉及的区域的视觉质量。基于对图像中的感兴趣区域的选择,根据对这些区域的兴趣来局部调整量化阶。以这样的方式来执行该调整,以便加强对较不重要的区域的压缩,并沿着该序列将可能尚未使用的编码资源(即比特数)重新分配给感兴趣区域。这种将比特从一个图像重新分配给另一个图像的重新分配使得可以获得对于感兴趣区域更加稳定的重构质量(即解码后的质量)。根据本发明的方法使用图像序列预分析步骤,具体用于表征(characterize)整个序列中的感兴趣区域在比特数方面的需求,从而在整个序列上平滑感兴趣区域的重构质量。 
更具体地,根据本发明的方法可以用于将比特率从非感兴趣区域转移到感兴趣区域。为此,所提出的解决方案对于图像中的每个区域的量化阶QP使用变化或者使用量化阶的局部调整。该调整是相对于表示为QP*的量化阶的值的初始设定点(例如,从针对每个图像的比特率调整中导出的)而进行的,QP*与设定点比特率D*相对应。在序列中,该量化阶可以(如果必要的话)在不同图像之间变化。更具体地,根据本发明,根据视觉感兴趣区域来修改图像中的每个区域的量化阶。量化阶的正变差(positive variation)提供了更强的压缩,即以损失质量为代价的比特率增益。负变差(negative variation)提供了更  精细的压缩,即以增加编码成本为代价来提高重构质量。 
因此,本发明需要关于内容的先验信息的知识。由根据本发明的方法所使用的先验信息分成两类。关于内容的第一类先验信息涉及吸引更多注意的区域(所谓感兴趣区域)在序列的每个图像中的位置。该区域可以由不相交的像素块的组构成;然而,将该区域定义为同一区域。该信息可以由二进制兴趣映射(map)I给出,对于图像中的每个块bi,I指示出人类视觉系统的感兴趣等级:针对感兴趣块bi,I(bi)=1,针对不感兴趣块bi,I(bi)=0。例如,这个映射可以通过对显著性映射(saliency map)取阈值而获得。显著性映射是对于图像中的每个像素指示出感知兴趣的映射。可以通过考虑多种信息(例如运动信息)来构造该映射。与像素相关联的值越大,该像素越引人注意。为了获得每个块的显著性值,针对给定块,可以对与属于该块的像素相关联的值进行平均,或者取显著性值的中间值。一般地说,本发明可以应用于非二进制感兴趣映射的情况,其针对每个块bi表征了其感兴趣等级。关于内容的第二类先验知识涉及对视觉假象(artifact)具有很强的掩蔽能力的图像区域在序列的每个图像中的位置。该区域可以由不相交的像素块的组构成。用于数字视频系统中的有损压缩方法产生假象,该假象的可见度很大程度上取决于所处理的图像的内容。对比度掩蔽效果将信号可见度的这种修改转化为另一个信号的存在。这种修改可以在可见度阈值减少的方向(促进)上,或者甚至在可见度阈值增加的方向(掩蔽)上进行。为了限制作为非感兴趣区域的一部分的块中的新伪像的出现,也由二进制映射P给出关于内容的先验知识,二进制映射P对于每个块bi,指示出视觉掩蔽能力:针对具有较强掩蔽能力的块,P(bi)=1;针对具有较弱掩蔽能力的块,P(bi)=0。例如,这个映射可以通过对活动映射(activity map)取阈值而获得。活动映射是指示给定块的活动等级的映射。例如,该等级可以通过测量该块的变化量(variance)来计算。在本文的其余部分,将具有较强掩蔽能力的图像中的非感兴趣块bi的集合称为“潜在的掩蔽区域”。将不属于潜在的掩蔽区域的非感兴趣块bi的集合称为“中性区域”。将分别涉及感兴趣区域的位置和具有较强掩蔽能力的区域的位置的两个二进制  映射相结合,以获得用于对量化阶进行局部调整以及与图像中的每个块bi相关联的单个映射Ifinal,Ifinal具有值0、1或2,如下所示: 
Figure DEST_PATH_S2006800112157D00061
其中: 
-Ifinal是传送给编码器的新映射,指示了将比特转移应用于其中的感兴趣区域以及潜在的掩蔽区域; 
-P是定义了潜在的掩蔽区域的二进制映射;以及 
-I是定义了感兴趣和非感兴趣区域的二进制映射。 
该方法还利用特定的并且与序列的每个图像中的每个感兴趣区域和潜在的掩蔽区域相关联的PSNR(QP)曲线(作为量化阶的函数来表示最大信躁比的曲线)和NbBit(QP)曲线(作为量化阶的函数来表示比特数的曲线)。PSNR是用于表征图像质量的准则。在这种情况下,将PSNR用于表征对图像、图像中的块或区域进行解码后的重构质量。然后,对PSNR进行如下定义: 
PSNR = - 10 lo g 10 ( ( SSE ) N · M · 255 2 )
其中,SSE是均方误差之和。SSE是针对块,对与源图像中的像素相关联的值和与重构图像(即解码图像)中的相应像素相关联的值之间的逐像素之差求和所定义的。 
根据本发明,可以使用其他质量准则。在将比特从图像的某些区域重新分配到其他区域之前,针对序列中的每个图像j都需要学习步骤,以便在值QP*周围构造上面所定义的曲线的部分。曲线的这些部分还可以由外部装置来提供,例如通过数据文件来提供。本发明在于:通过使用三个不同的量化阶:QP*-L、QP*+K和QP*,对属于图像j的感兴趣区域或潜在的掩蔽区域的每个像素块(例如,大小为16×16个像素的宏块)进行编码。在对属于感兴趣区域的编码块的重构(即解码)之后,针对给定量化阶值(QP*-L、QP*+K和QP*),对与这些块相关的数据(PSNR和NbBit)进行平均,以获得针对图像j中的感兴趣区域以及针对三个量化阶值中的每个值的PSNR值(PSNRj ROI)和比特数值(NbBitj ROI)。类似地,对与属于潜在掩蔽区域的块相关的数据进行平均,以获得针对图像j中的潜在掩蔽区域以及针对三个量化阶值中的每个值的PSNR值(PSNRj POT)和比特数值(NbBitj POT)。然后通过三个值QP*-L、QP*+K和QP*之间的线性内插,对曲线PSNRj(QP)和NbBitj(QP)进行内插,以便针对图像j获得:针对感兴趣区域,获得曲线PSNRj ROI(QP)和曲线NbBitj ROI(QP),以及针对潜在的掩蔽区域,获得曲线PSNRj POT(QP)和曲线NbBitj POT(QP)。
比特的转移或重新分配的原理在于:加强(与基于设定点量化阶QP*的初始编码相比)对属于潜在的掩蔽区域的块的压缩,并使用未用于对潜在的掩蔽区域进行编码的比特来对感兴趣区域进行编码(与NbBitj POT(QP*)相比)。假设考虑了与潜在的掩蔽区域相关联的重构质量的最小预定值PSNRmin POT(例如20dB),根据该方法,可以使用更强的量化阶来对潜在的掩蔽区域的块进行量化。类似地,针对感兴趣区域来设置重构质量的最大预定值PSNRmax ROI(例如35dB)。这些值可以自动或手动设置(例如,由操作者设置)。根据本发明的方法在于:在小心保持以使序列的总比特率与设定点比特率D*大体相似的同时,通过将比特从潜在的掩蔽区域转移到感兴趣区域来对量化阶进行局部调整。根据本发明的方法使用第一序列预分析步骤。在这个步骤中,计算可以通过增大分配给潜在的掩蔽区域的量化阶而在整个序列上恢复或节省的比特数,以及同样地计算用于以较低量化阶对感兴趣区域进行编码而在整个序列上需要的附加比特数。为此,针对选择性压缩系统中所包括的每个区域(即感兴趣区域和潜在的掩蔽区域),并针对序列中的每个图像j,定义针对量化阶的一组所谓的有效值。根据PSNR(QP)曲线(针对每个区域并针对每个图像而建模)来确定这些值,以便考虑满足PSNR需求的重构质量,即在潜在的掩蔽区域和感兴趣区域中分别为最小值和最大值。针对图像j中的潜在的掩蔽区域,可以分配给潜在的掩蔽区域的量化阶的值在设定点值(表示为QP*)和可以保证最小重构质量PSNRmin POT的最大值(表示为QP_POT_MAXj)之间变化。相同的原理应用于感兴趣区域。可以分  配给图像j的感兴趣区域的量化阶的值在可以实现目标重构质量PSNRmax ROI的量化阶的最小值(表示为QP_ROI_MINj)和设定点值QP*之间变化。 
根据本发明,预分析步骤在于,首先针对序列中的每个图像,收集在感兴趣区域的比特数和潜在的掩蔽区域可以提供的比特数方面的需求。其次,比特转移将基于由整个序列上的潜在的掩蔽区域所提供的可能性。可以考虑两种可能:潜在的掩蔽区域可以满足要求,或者不能满足。在后一种情况下,与相对于基于PSNR质量的设定点的感兴趣区域的PSNR不足(deficit)成比例地,执行对比特的重新分配。 
在预分析中,针对序列中的每个图像j,根据与潜在的掩蔽区域相关联的曲线NbBitj POT(QP)来确定可以基于在用QP_POT_MAXj对所述区域进行编码时所节省的比特数。还对感兴趣区域在用于实现目标重构质量PSNRmax ROI的附加比特方面的需求进行估计。如果将项gainj(QP_POT_MAXj)用于表示为了以提供最小重构质量的最大量化阶来进行编码而从图像j的潜在的掩蔽区域中所节省的比特数,则gainj(QP_POT_MAXj)=NbBitj POT(QP*)-NbBitj POT(QP_POT_MAXj
其中: 
-NbBitj POT(QP)是与图像j的潜在的掩蔽区域相关联的曲线。 
-QP_POT_MAXj是可用于提供潜在的掩蔽区域的最小重构质量的量化阶的值。 
如果将项requirementj(QP_ROI_MINj)用于表示图像j的感兴趣区域需要用以满足目标重构质量的比特数, 
则,requirementj(QP_ROI_MINj)=NbBitj ROI(QP_ROI_MINj)-NbBitj ROI(QP*
其中: 
-NbBitj ROI(QP)是与图像j的感兴趣区域相关联的曲线NbBit(QP);以及 
-QP_ROI_MINj是可以用于保证逼近目标重构质量的感兴趣区域的重构质量的量化阶的值。 
在该图像分析中,在整个序列上,将在潜在的掩蔽区域上所节省  的比特数(表示为GPOT)以及感兴趣区域所需要的比特数(表示为DROI)合计。 
G POT = Σ j = 0 N - 1 ( gain j ( QP _ POT _ MA X j ) )
D ROI = Σ j = 0 N - 1 ( requiremen t j ( QP _ ROI _ MI N j ) )
其中,N是待编码的图像数。 
此外,如图1所示,针对序列中的每个图像j,计算以设定点的阶所量化的感兴趣区域的重构质量和目标重构质量PSNRmax ROI之间的质量差(在本方案中,由PSNR进行估计,但这是并非限制性的)。假设ΔPSNRROI是整个序列上的这些质量差的总值,因此 
ΔPSNR ROI = Σ j = 0 N - 1 δPSN R j ROI
其中: 
-δPSNRj ROI=MAX(0,PSNRmax ROI-PSNRj ROI(QP*))是图像j的感兴趣区域的质量差; 
-N是待编码的序列中的图像数;以及 
-PSNRj ROI(QP*)是图像j中的感兴趣区域中的PSNR的值。 
在此预分析结尾处,已知以下值: 
-在图像等级: 
-感兴趣区域到目标重构质量的质量距离;以及 
-分别应用于潜在的掩蔽区域和感兴趣区域以便分别实现最小重构质量PSNRmin POT和目标重构质量PSNRmax ROI的量化阶QP_POT_MAXj和QP_ROI_MINj。 
-在序列等级: 
-与目标重构质量相比的感兴趣区域的质量差的总值ΔPSNRROI
-在潜在的掩蔽区域上所节省的总比特数:GPOT;以及 
-感兴趣区域需要用以实现目标重构质量的总比特数:DROI。 
本发明方法的第二步骤的目的是通过将在整个序列上所节省的比特数GPOT进行重新分配,以便对序列的每个图像中的每个区域的量化阶进行分配,比特数GPOT是以量化阶QP_POT_MAXj对潜在的掩蔽区域进行编码而得到的,以便在适当的情况下满足感兴趣区域的目标重构质量。GPOT是在预分析步骤中计算的。实际上,此分配是根据由潜在的掩蔽区域所提供的能力而进行的:潜在的掩蔽区域可以满足需求(情况1)或不能满足(情况2)。
情况1:GPOT≥DROI
在整个序列上所节省的总比特数大于或等于感兴趣区域需要用以实现目标重构质量的总比特数。可以在整个序列上将从潜在的掩蔽区域所节省的比特重新分配到感兴趣区域。在这种情况下可以降低总比特率。 
基于各自值QP_ROI_MINj和QP_POT_MAXj,针对每个图像j,直接执行对感兴趣区域和潜在的掩蔽区域的量化阶的局部调整,即,将QP_POT_MAXj分配给潜在的掩蔽区域,并且将QP_ROI_MINj分配给感兴趣区域。 
情况2:GPOT<DROI
在整个序列上所节省的总比特率不能完全满足感兴趣区域的需求。 
为了在对量化阶进行局部调整之后保持与设定点比特率(由设定点量化阶获得)大体相似的总比特率,针对每个图像j,必须估计大于当前值QP_ROI_MINj的感兴趣区域的新量化阶值QP_ROIj。然后,相对于基于PSNR的质量设定点,与感兴趣区域的PSNR不足成比例地,对比特进行重新分配。针对每个图像j,根据从潜在的掩蔽区域中所获得的总比特数GPOT,与当前质量差δPSNRj ROI成比例地,计算用于对当前感兴趣区域进行编码所增加的附加比特数NbAdditionalBitsj ROI,如下所示: 
NbAdditionalBits j ROI = δPSNR j ROI ΔPSNR ROI × G POT
根据曲线NbBitjROI(QP),估计出可用于逼近新的目标比特数NbBitj ROI(QP*)+NbAdditionalBitsj ROI的感兴趣区域的量化阶QP_ROIj的 值。 
基于各自的值QP_ROIj和QP_POT_MAXj,针对每个图像j,执行对感兴趣区域和潜在的掩蔽区域的量化阶的局部调整。至于中性区域中的块,认为它们相对于选择性编码策略是中性的,即分配给这些块的量化阶与设定点量化阶QP*相对应,即不对量化阶进行局部适配。 
本发明还涉及一种用于实现根据本发明的量化方法的编码方法,该编码方法用于对n个图像的序列进行编码。因此,该编码方法包括:用于以一组系数(例如使用DCT)来对序列中的n个图像进行变换的步骤;用于按照量化阶对所述系数进行量化的步骤,其中根据上述方法,在序列的n个图像内对该量化阶进行局部调整;以及用于对所述量化后的系数进行编码的过程(例如使用熵编码处理)。 
本发明还涉及一种如图2所示的编码设备10,用于对图像序列进行编码。在图2中只描述了重要的模块,并在下文中对其进行描述。该编码设备包括模块110,用于以一组系数(例如DCT系数)对该编码设备的输入端处的源图像进行变换。例如,模块110实现DCT变换。然后,由量化模块120对该系数进行量化,以获得量化后的系数。量化模块120适配用于实现根据本发明的对量化阶进行局部调整的方法。更具体地,量化模块120给序列中的每个图像中的感兴趣区域分配量化阶,以便在所节省的比特数GPOT充足的情况下保证目标重构质量,或者与目标重构质量和设定点重构(即以QP*对所述感兴趣区域进行量化时所得到的质量)之差成比例地,将所节省的比特GPOT分布在整个序列中的感兴趣区域之间。然后,通过本领域技术人员所知的编码模块130(例如熵编码器),对量化后的系数进行编码。根据特定实施例,编码设备10包括速率控制模块140。模块140能够给量化模块120提供设定点量化阶QP*。 
当然,本发明并不局限于上面所提到的实施例。具体地,本领域的技术人员可以对所公开的实施例进行任何变化,并使其结合以便产生各种有益效果。可以将传统PSNR之外的准则用于表征图像、像素的块或图像中的区域的重构质量,例如根据变化量加权的PSNR、基于心理学视觉建模的准则。类似地,曲线PSNR(QP)和NbBit(QP)  可以由所描述的装置以外的装置获得。因此,可以使用多于三个的量化阶来对曲线进行内插。类似地,可以使用另一类型内插,例如多项式内插。 
兴趣映射可以是表征了图像中每个块的较高或较低兴趣等级的非二进制映射。可以将这些映射用于在图像中定义多个感兴趣区域,根据其感兴趣等级给每个区域重新分配比特。 

Claims (7)

1.一种用于相对于设定点量化阶(QP*)来对n个图像的序列中的图像的量化阶进行局部调整的方法,所述图像包括至少一个感兴趣区域和一个潜在的掩蔽区域,当以所述设定点量化阶(QP*)对所述感兴趣区域和潜在的掩蔽区域进行量化时,分别以第一和第二比特数来对所述感兴趣区域和潜在的掩蔽区域进行编码,所述方法的特征在于包括以下步骤:
-针对序列中的每个图像,计算所述第二比特数和用于对以大于或等于设定点量化阶(QP*)的第一量化阶(QP_POT_MAXj)所量化的所述潜在的掩蔽区域进行编码的比特数之间的第一比特差,以及用于对以小于或等于设定点量化阶(QP*)的第二量化阶(QP_ROI_MINj)所量化的所述感兴趣区域进行编码的比特数和所述第一比特数之间的第二比特差;以及
-在序列的每个图像中,将所述第一量化阶分配给潜在的掩蔽区域,以及,对于序列中的所述n个图像,如果n个第一比特差之和(GPOT)大于或等于n个第二比特差之和(DROI),则将所述第二量化阶分配给所述感兴趣区域,否则给所述感兴趣区域分配大于所述第二量化阶的第三量化阶,以便根据针对每个图像所计算的重构质量准则,将所述n个第一比特差之和分布在序列的图像的感兴趣区域之间。
2.如权利要求1所述的方法,其中,确定所述第一量化阶(QP_POT_MAXj),以便在将所述第一量化阶用于对所述潜在的掩蔽区域进行编码时保证所述潜在的掩蔽区域的第一预定重构质量(PSNRmin POT)。
3.如权利要求1或2所述的方法,其中,确定所述第二量化阶(QP ROI MINj),以便在将所述第二量化阶(QP ROI MINj)用于对所述感兴趣区域进行编码时保证所述感兴趣区域的第二预定重构质量(PSNRmax ROI)。
4.如权利要求3所述的方法,其中,在将所述设定点量化阶(QP*)用于对所述感兴趣区域进行编码时,对于序列中的所述n个图像,如果所述n个第一比特差之和(GPOT)小于所述n个第二比特差之和(DROI),则与所述第二预定重构质量(PSNRmax ROI)和所述感兴趣区域的重构质量之差成比例地,将所述n个第一比特差之和(GPOT)分布在序列中的所述n个图像的感兴趣区域之间。
5.如权利要求1或2所述的方法,其中,所述图像还包括中性区域,所述中性区域不同于所述感兴趣区域和所述潜在的掩蔽区域,将设定点量化阶(QP*)分配给所述中性区域。
6.一种用于对n个图像的序列进行编码的方法,包括:用于以一组系数对所述n个图像进行变换的步骤、按照量化阶对所述系数中的每个进行量化的步骤、以及对所述量化后的系数进行编码的步骤,其中根据权利要求1或5来对所述量化阶进行局部调整。
7.一种用于相对于设定点量化阶(QP*)来对n个图像的序列中的图像的量化阶进行局部调整的设备,所述图像包括至少一个感兴趣区域和一个潜在的掩蔽区域,当以所述设定点量化阶(QP*)来对所述感兴趣区域和潜在的掩蔽区域进行量化时,分别以第一和第二比特数来对所述感兴趣区域和潜在的掩蔽区域进行编码,所述设备的特征在于,所述设备包括:
-用于针对序列中的每个图像,计算所述第二比特数和用于对以大于或等于设定点量化阶(QP*)的第一量化阶(QP_POT_MAXj)所量化的所述潜在的掩蔽区域进行编码的比特数之间的第一比特差,以及用于对以小于或等于设定点量化阶(QP*)的第二量化阶(QP_ROI_MINj)所量化的所述感兴趣区域进行编码的比特数和所述第一比特数之间的第二比特差的装置;以及
-用于在序列的每个图像中,将所述第一量化阶分配给潜在的掩蔽区域,以及,对于序列中的所述n个图像,如果n个第一比特差之和(GPOT)大于或等于n个第二比特差之和(DROI),则将所述第二量化阶分配给所述感兴趣区域,否则给所述感兴趣区域分配大于所述第二量化阶的第三量化阶,以便根据针对每个图像所计算的重构质量准则,将所述n个第一比特差之和分布在序列的图像的感兴趣区域之间的装置。
CN2006800112157A 2005-04-05 2006-03-16 局部调整量化阶的方法和编码图像序列的方法和设备 Expired - Fee Related CN101156453B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
FR0503369 2005-04-05
FR0503369 2005-04-05
PCT/EP2006/060804 WO2006106032A1 (en) 2005-04-05 2006-03-16 Method for locally adjusting a quantization step

Publications (2)

Publication Number Publication Date
CN101156453A CN101156453A (zh) 2008-04-02
CN101156453B true CN101156453B (zh) 2012-07-18

Family

ID=36299345

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2006800112157A Expired - Fee Related CN101156453B (zh) 2005-04-05 2006-03-16 局部调整量化阶的方法和编码图像序列的方法和设备

Country Status (6)

Country Link
US (1) US8139882B2 (zh)
EP (1) EP1867175B1 (zh)
JP (1) JP5123168B2 (zh)
KR (1) KR101194518B1 (zh)
CN (1) CN101156453B (zh)
WO (1) WO2006106032A1 (zh)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8808195B2 (en) * 2009-01-15 2014-08-19 Po-He Tseng Eye-tracking method and system for screening human diseases
US10812829B2 (en) 2012-10-03 2020-10-20 Avago Technologies International Sales Pte. Limited 2D block image encoding
US9805442B2 (en) 2012-10-03 2017-10-31 Avago Technologies General Ip (Singapore) Pte. Ltd. Fine-grained bit-rate control
US9883180B2 (en) 2012-10-03 2018-01-30 Avago Technologies General Ip (Singapore) Pte. Ltd. Bounded rate near-lossless and lossless image compression
US9813711B2 (en) 2012-10-03 2017-11-07 Avago Technologies General Ip (Singapore) Pte. Ltd. Hybrid transform-based compression
US9978156B2 (en) 2012-10-03 2018-05-22 Avago Technologies General Ip (Singapore) Pte. Ltd. High-throughput image and video compression
US9363517B2 (en) 2013-02-28 2016-06-07 Broadcom Corporation Indexed color history in image coding
US20140269901A1 (en) * 2013-03-13 2014-09-18 Magnum Semiconductor, Inc. Method and apparatus for perceptual macroblock quantization parameter decision to improve subjective visual quality of a video signal
GB201312382D0 (en) * 2013-07-10 2013-08-21 Microsoft Corp Region-of-interest aware video coding
US9386275B2 (en) 2014-01-06 2016-07-05 Intel IP Corporation Interactive video conferencing
US10979705B2 (en) * 2014-08-08 2021-04-13 Qualcomm Incorporated Method for video coding with spatial prediction mode for multi-mode video coding
US9516220B2 (en) 2014-10-02 2016-12-06 Intel Corporation Interactive video conferencing
US10021346B2 (en) 2014-12-05 2018-07-10 Intel IP Corporation Interactive video conferencing
EP3324628B1 (en) * 2016-11-18 2021-12-29 Axis AB Method and encoder system for encoding video
EP3328083A1 (en) * 2016-11-23 2018-05-30 Thomson Licensing Method and apparatus for encoding a video applying adaptive quantisation
JP6611748B2 (ja) * 2017-03-23 2019-11-27 Kddi株式会社 画質情報でセグメント受信を制御するクライアント、システム、プログラム及び方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6490319B1 (en) * 1999-06-22 2002-12-03 Intel Corporation Region of interest video coding
US6529631B1 (en) * 1996-03-29 2003-03-04 Sarnoff Corporation Apparatus and method for optimizing encoding and performing automated steerable image compression in an image coding system using a perceptual metric

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4208315B2 (ja) * 1998-12-25 2009-01-14 キヤノン株式会社 データ通信制御装置及びその制御方法、データ通信システム、記録媒体

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6529631B1 (en) * 1996-03-29 2003-03-04 Sarnoff Corporation Apparatus and method for optimizing encoding and performing automated steerable image compression in an image coding system using a perceptual metric
US6490319B1 (en) * 1999-06-22 2002-12-03 Intel Corporation Region of interest video coding

Also Published As

Publication number Publication date
JP5123168B2 (ja) 2013-01-16
US8139882B2 (en) 2012-03-20
WO2006106032A1 (en) 2006-10-12
KR20080002808A (ko) 2008-01-04
KR101194518B1 (ko) 2012-10-24
JP2008535423A (ja) 2008-08-28
CN101156453A (zh) 2008-04-02
US20090169125A1 (en) 2009-07-02
EP1867175B1 (en) 2012-08-15
EP1867175A1 (en) 2007-12-19

Similar Documents

Publication Publication Date Title
CN101156453B (zh) 局部调整量化阶的方法和编码图像序列的方法和设备
DE10300048B4 (de) Verfahren und Vorrichtung zur Bildcodierung und -decodierung
CN101233697B (zh) 编码设备、编码方法、解码设备、解码方法以及其程序
DE69215997T2 (de) Videosignalübertragungsgerät und Verfahren davon
CN101018336B (zh) 基于质量的图像压缩
DE69624669T2 (de) Videokodierer und -dekodierersystem und -methoden
DE69831894T2 (de) Signalkodierung, -aufnahme und -übertragung
DE69425179T2 (de) Kodierungsvorrichtung und -verfahren
CN101601303B (zh) 对图像进行编码的方法及实现所述方法的装置
DE69813349T2 (de) Vorrichtung zur Kontrolle der Datenmenge und Kodierer dieselbige anwendend
CN101151905B (zh) 用于局部调整量化阶的方法和对n个图像的序列进行编码的编码设备
DE69837497T2 (de) Verfahren und vorrichtung zum kodieren eines videosignals
CN104885457A (zh) 用于具有增强动态范围的超高清视频信号的向后兼容编码
DE112012006541B4 (de) Verfahren zur Videokompression
CN102970536B (zh) 一种改进的带有预测残差调整的视频编码方法
DE102019103346A1 (de) Ssim-basierte rate-distortion-optimierung für eine verbesserte wahrnehmbare qualität bei videos
CN101222631A (zh) 在视频压缩系统中选择量化器值的方法
DE10204617B4 (de) Verfahren und Vorrichtungen zur Kompression und Dekompression eines Videodatenstroms
EP1425920A2 (de) Verfahren zur videocodierung und computerprogrammprodukt
DE69625501T2 (de) Vorrichtung und verfahren zur auswahl des codierungsmodus in einem blockbasierten codierungssystem
EP2243299B1 (en) Method and device for compressing an image and storage medium carrying an image compressed by said method
CN101977309B (zh) 码率控制方法及装置
Nobakht et al. An image coding technique using a human visual system model and image analysis criteria
CN104335583A (zh) 用于视频编码的动态量化方法
WO2004002161A1 (de) Verfahren und vorrichtung zur vorbereitung der ubertragung von bildfolgen über einen zeitlich änderlichen kanal

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CP02 Change in the address of a patent holder
CP02 Change in the address of a patent holder

Address after: I Si Eli Murli Nor, France

Patentee after: THOMSON LICENSING

Address before: French Boulogne - Bilang Kurt

Patentee before: THOMSON LICENSING

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20190606

Address after: American Delaware

Patentee after: Interactive Digital VC Holdings

Address before: I Si Eli Murli Nor, France

Patentee before: THOMSON LICENSING

CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120718

Termination date: 20200316