CN1846446B - 编码视频图像的方法和布置 - Google Patents

编码视频图像的方法和布置 Download PDF

Info

Publication number
CN1846446B
CN1846446B CN2004800249061A CN200480024906A CN1846446B CN 1846446 B CN1846446 B CN 1846446B CN 2004800249061 A CN2004800249061 A CN 2004800249061A CN 200480024906 A CN200480024906 A CN 200480024906A CN 1846446 B CN1846446 B CN 1846446B
Authority
CN
China
Prior art keywords
parameter
macro block
lagrangian
motion
quantization parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2004800249061A
Other languages
English (en)
Other versions
CN1846446A (zh
Inventor
托比亚斯·欣茨
海科·施瓦茨
托马斯·维甘德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Licensing SAS
International Digital Madison Patent Holding SAS
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Publication of CN1846446A publication Critical patent/CN1846446A/zh
Application granted granted Critical
Publication of CN1846446B publication Critical patent/CN1846446B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/19Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding using optimisation based on Lagrange multipliers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/192Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive
    • H04N19/194Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive involving only two passes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/115Selection of the code volume for a coding unit prior to coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

如今的视频编码器需要在许多编码选项之间做出智能选择。利用拉格朗日编码控制能够有效地进行该选择。但是拉格朗日编码控制仅提供了给定特定拉格朗日参数的结果,对应于一些未知传输速率。另一方面,速率控制算法提供了给定比特率处的编码结果,但是不具有拉格朗日编码控制的优化性能。对用于混合视频编码的速率控制和拉格朗日优化的组合进行了研究。新方法提出将这两个已知方法合并为利用宏块模式判定和量化适配的视频编码控制。通过试验结果验证和分析了所提出的方法的速率失真性能。结果表明,对于大多数比特率,每一个图像产生恒定比特数的组合的速率控制和拉格朗日优化实现了与仅利用拉格朗日优化的恒定斜率的情况相似的速率性能。

Description

编码视频图像的方法和布置
技术领域
本发明涉及一种对视频图像进行编码的方法和布置(arrangement)。特别地,其涉及宏块层的操作控制,并且可用于编码视频序列。
背景技术
包括MPEG-2Visual[1],H.263[2],MPEG-4Visual[3]和H.264/AVC[4]的大多数基于块的混合视频编码标准的规范仅提供比特流语法和解码处理,以便允许互可操作性。使编码处理处于范围之外以允许灵活的实现。然而,源编码器的操作控制是视频压缩的关键问题。对于视频源的编码,必须确定各种编码参数,例如量化参数、宏块和块模式、运动矢量和量化变换系数。一方面,所选的值针对给定的解码器来确定所产生的比特流的速率失真效率。另一方面,这些参数还确定所需的传输速率和解码延迟。
在基于固定速率信道的实时视频通信中,操作编码控制的一般目的是获得最佳可能视频质量,同时保持传输速率和解码延迟上的给定条件。由于所涉及的较大参数空间,这并非是微不足道的问题。另外,需要操作编码控制具有较低的复杂度,从而其能够应用于实时应用。
针对速率失真最佳化编码的广泛接受的方法是拉格朗日比特分配技术。该方法的普及是由于其效率和简单性而产生的。给定了针对宏块的固定量化参数QP,通过使拉格朗日代价函数最小化来确定宏块模式以及相关的块模式和运动矢量:
D+λ(QP)·R,
其中利用拉格朗日乘子λ相对于速率项R对失真测量值D进行加权。拉格朗日乘子λ仅取决于给定宏块量化参数QP。该拉格朗日编码控制被作者[5,6,7,8]成功地应用于H.263,MPEG-4Visual和H.264/AVC。在所有情况下,当利用固定量化参数QP对视频源进行编码时,该改进的编码策略分别与先前的H.263,MPEG-4Visual和H.264/AVC的编码策略相比,提供了可见的性能增益。
在[9]提出了用于操作基于块的混合视频编码器的简单和有效宏块速率控制算法。给定针对图像的目标比特数和该图像内的所有宏块的预测差错信号,按照非常精确地命中目标比特数的方式来调整宏块量化参数QP,同时使图像的失真最小。
由于必须考虑以下相互依赖性,这两个编码控制策略(拉格朗日比特分配技术和基于宏块的速率控制算法)的组合并非直接了当的:
-对于速率控制,宏块量化参数QP的确定取决于残余信号,并因而取决于估计的运动矢量以及所选的宏块和块编码模式。
-对于拉格朗日优化,运动估计和宏块/块模式判定基于拉格朗日代价函数的最小化,其中利用拉格朗日乘子λ相对于速率项对失真测量值进行加权。由于拉格朗日乘子λ(QP)是量化参数QP的函数,残余信号还取决于量化参数。
另外,必须总是结合复杂度考虑来观察操作编码控制的性能,包括避免由于参数QP和λ的相互依赖性造成的如以上两项所表现出的多重编码。
因此,本发明所要解决的技术问题是提供一种对视频图像进行编码的方法和布置(arrangement),以及一种适当的计算机程序和适当的存储介质,其提供了拉格朗日比特分配技术的速率失真效率以及速率控制属性。
发明内容
根据本发明,通过权利要求1、10、11和12的特征来解决该任务分配。
本发明按照以下的方式来解决该问题,其中执行图像的预分析,其中针对宏块的至少一部分,根据至少一个估计的参数来确定有助于编码处理的至少一个控制参数,在第二步骤中,利用基于在预分析步骤中所确定的控制参数计算出的编码参数来对图像进行编码。
一种编码视频图像的布置(arrangement)包括至少一个芯片和/或处理器,其中按照以下方式安装芯片和/或处理器,按照该方式,能够执行一种编码视频图像的方法,从而执行图像的预分析,其中针对宏块的至少一部分,根据至少一个估计的参数来确定有助于编码处理的至少一个控制参数,在第二步骤中,利用基于在预分析步骤中所确定的控制参数计算出的编码参数来对图像进行编码。
在一些情况下,有利地,通过计算机程序来执行用于编码视频图像的方法。在将所述程序存储到计算机存储器中之后,这样的计算机程序使计算机能够运行编码视频图像的方法,其中计算机程序包含程序代码,用于执行一种编码视频图像的方法,其中执行图像的预分析,其中针对宏块的至少一部分,根据至少一个估计的参数来确定有助于编码处理的至少一个控制参数,在第二步骤中,利用基于在预分析步骤中所确定的控制参数计算出的编码参数来对图像进行编码。
例如,在通信网络或用于数据传输的网络中,可以得到这样的计算机程序(收费或免费),作为可下载的数据文件。可以通过一种将权利要求11所述的计算机程序从用于数据传输的诸如因特网的网络下载到与所述网络相连的数据处理单元的方法来获取可按照该方式得到的计算机程序。
为了执行视频图像的编码,有利地,使用了一种在其上存储了程序的计算机可读存储介质,在将所述程序存储到计算机存储器中之后,所述程序使计算机能够运行编码视频图像的方法,其中计算机程序包含程序代码,用于执行一种编码视频图像的方法,其中执行图像的预分析,其中针对宏块的至少一部分,根据至少一个估计的参数来确定有助于编码处理的至少一个控制参数,在第二步骤中,利用基于在预分析步骤中所确定的控制参数计算出的编码参数来对图像进行编码。
在本发明的优选实施例中,将表示原始宏块样本和其预测之间的差别的宏块的残余信号的能量测量值用作控制参数,所述控制参数是基于预分析步骤中的至少一个估计的参数而确定的。
在本发明的另一优选实施例中,根据以下公式来计算用作控制参数的残余信号的能量测量值,作为宏块内用于变换编码的亮度和色度块的残余信号的方差的平均值: σ i 2 = 1 N R · N P Σ i = 1 N B Σ k = 1 N P ( d i , j ( k ) - d i , j ‾ ) 2 ; 其中NB和NP分别是宏块内用于变换编码的块(亮度和色度)数和这样的块内的样本数;di,j是宏块i内的块j的残余信号;以及
Figure S04824906120060315D000042
表示di,j的平均值。
在本发明的另一优选实施例中,假定帧内编码图像中的宏块的预测信号由具有零值的样本构成,并因而残余信号对应于原始宏块样本,针对预测编码图像,利用在预分析步骤中所估计的一个或多个位移矢量和参考索引,通过运动补偿预测来估计用于确定控制参数的宏块的预测信号。
在本发明的另一优选实施例中,所述预分析步骤包括通过使以下拉格朗日代价函数最小化来估计位移矢量m和参考索引r:
[ m ^ , r ^ ] = arg min m , r { D DFD ( m , r ) + λ motion · R MV ( m , r ) } ,
其中,
D DFD ( m , r ) = Σ ( x , y ) ∈ B | s ( x , y , t ) - s ′ ( x - m x , y - m y , t r ) |
确定了失真项,s(…,t)和s’(…,tr)分别表示原始图像和由参考索引r所给定的已解码参考图像的亮度样本的数组;RMV(m,r)指定了传送位移矢量[mx,my]T的所有分量和参考索引r所需的比特数;B是针对其估计位移矢量和参考索引的宏块、宏块分区或子宏块分区的区域;以及λmotion≥0是拉格朗日乘子。
在本发明的另一优选实施例中,根据以下公式来设置在预分析步骤中用于位移矢量估计的拉格朗日乘子λmotion
λ motion = 0.85 · QP ‾ 2 , 针对H.263,MPEG-4,或者
λ motion = 0.85 · 2 ^ ( ( QP ‾ - 12 ) / 3 ) , 针对H.264/AVC,
其中
Figure S04824906120060315D000047
表示相同图像类型的最后编码图像的平均量化参数。
在本发明的另一优选实施例中,针对覆盖16×16亮度样本的区域的整个宏块来进行预分析步骤中的位移矢量估计,并且所述参考索引r并非是估计的,而是按照参考已解码图像缓冲器中所存储的时间最近参考图像的方式而确定的。
利用本发明,能够执行对基于块的混合视频编解码器的操作编码控制,提供了速率失真优化编码器[5,6,7,8]的速率失真效率、以及适合于低延迟交互应用的精确速率控制。针对MPEG-4Visual和H.264/AVC的仿真结果显示:所提出的编码策略实现了与没有速率控制的速率失真优化编码器几乎相同的速率失真性能。
本发明涉及对宏块层的操作控制。假定给定的全局速率控制设置了针对图像的目标比特数,从而保持了传输速率和解码延迟的条件。宏块层的操作控制以尽可能精确地命中了该目标比特数同时使图像的失真最小的方式确定了量化参数、宏块和块模式、运动矢量和量化变换系数。
附图说明
提供了以下示例来进一步详细地描述本发明。这些示例用于说明而非限定本发明。
图1是针对Foreman序列(QCIF,每秒10个图像),本发明所提出的编码策略(点)与没有速率控制的速率失真优化编码策略[8](实线)相比的速率失真性能;
图2是针对Tempete序列(CIF,每秒30个图像),本发明所提出的编码策略(点)与没有速率控制的速率失真优化编码策略[8](实线)相比的速率失真性能;
图3是针对所提出的编码策略,与目标比特速率相比所获得的平均比特率。
具体实施方式
在以下部分中,通过利用针对视频图像的本发明编码处理的操作编码控制来描述本发明。所述操作编码控制组合了两个方法的优点,即,拉格朗日比特分配技术的速率失真效率、以及[9]的速率控制属性。
在[5]中,已经观察到:当用于H.263基线编码时,拉格朗日运动估计对速率失真性能具有非常小的影响。这是因为由分配给16×16块的运动矢量所占用的比特速率非常小,并且用于运动估计处理的对λ的不适当的选择的影响非常小。因此,在本发明的新编码策略中,仅利用16×16块,根据对残余信号的最初估计来进行宏块量化参数QP的确定。对此,采用相同图像类型的最后编码图像的平均量化参数
Figure S04824906120060315D000061
来设置拉格朗日参数λ。类似于[9]的方法,利用估计的预测差错信号和剩余比特预算来选择量化参数(并因而选择相应的拉格朗日参数λ)。根据这些参数,通过使相应拉格朗日代价函数最小化,来选择运动矢量以及宏块和块模式。
由于本发明的主题是涉及宏块层的操作控制的两种方法的适当组合,简要描述整个操作控制算法来避免对该概念的误解。主要贡献在于拉格朗日比特分配技术和速率控制方法之间的相互依赖性问题的简单的低代价解决方案。通过仅利用16×16块和单个的参考图像来引入低代价预分析/预估计步骤,解决了该问题。结果,必须对[9]中的速率控制方法的一些算法细节进行适配。
在以下部分1和2中,将描述宏块层的操作控制的整个算法。在部分3中给出了将所提出的算法的性能与仅利用拉格朗日优化的恒定斜率方法进行比较的试验结果。
1、宏块层操作控制的初始化
通过全局速率控制算法来设置针对图像的目标比特数Rtotal。将用于传送该图像的宏块层语法元素的比特预算RB初始化为:
RB=Rtotal-Rheader(1)
其中Rheader表示编码图像和/或给定图像类型的片段报头信息所需的平均比特数。
对于预测编码图像,针对图像的所有宏块i执行针对16×16块和时间上最近参考图像的初始运动估计步骤。通过使拉格朗日代价函数最小化来获得相应的初始运动矢量
Figure S04824906120060315D000062
m ^ i = arg min m ∈ M { D DFD ( i , m ) + λ motion · R MV ( i , m ) } - - - ( 2 )
其中失真项给定为:
D DFD ( i , m ) = Σ ( x , y ) ∈ B i | s ( x , y , t ) - s ′ ( x - m x , y - m y , Δt ) | . - - - ( 3 )
s(…,t)和s’(…,t-Δt)分别表示原始图像和解码参考图像的亮度信号。RMV(i,m)指定了传送运动矢量[mx,my]T的所有分量所需的比特数,M是运动矢量搜索范围,而Bi表示第i宏块的区域。
对于该初始估计步骤,利用相同图像类型的最后编码图像的平均量化参数
Figure S04824906120060315D000072
来设置拉格朗日乘子λmotion
H.263,MPEG-4 λ motion = 0.85 · QP ‾ 2 - - - ( 4 )
JVT/H.264: λ motion = 0.85 · 2 ^ ( ( QP ‾ - 12 ) / 3 ) - - - ( 5 )
根据该初始估计或根据初始源数据(针对帧内图像),根据本发明,针对每一个宏块来计算方差测量值σi 2
σ i 2 = 1 N B · N P Σ j = 1 N B Σ k = 1 N P ( d i , j ( k ) - d i , j ‾ ) 2 . - - - ( 6 )
NB和NP分别是在宏块内用于变换编码的块数(亮度和色度)、以及在这样的块内的样本数。di,j表示宏块i内的块j的残余信号,其平均值由表示。对于帧内图像,该残余信号对应于原始宏块样本,对于预测编码图像,其表示预测差错信号。
根据方差测量,根据以下公式(参见[9])将加权因子αi分配给每一个宏块i:
其中N是图像内的宏块数。将以下参数设置为其初始值[9]:
-剩余复杂度测量值: S 1 = Σ i = 1 N α i · σ i
-剩余宏块:N1=N
-剩余比特预算:B1=RB
-模型参数:K1=KN(相同类型的最后图像)
C1=CN(相同类型的最后图像)
jK=0
对于序列的第一图像,将模型参数K1和C1设置为一些预定值。
2、宏块层的操作控制
2.1.目标量化参数设置
根据以下公式(参见[9])来设置针对第i宏块的目标量化步骤尺寸Qi *
Q i * = max ( Q min , min ( Q max , K i · σ i · S i α i · ( B i - N i · C i ) ) ) : B i > N i · C i Q max : B i ≤ N i · C i - - - ( 8 )
其中Qmin和Qmax是语法所支持的最小和最大量化步骤尺寸。
根据目标量化步骤尺寸,根据以下公式(参见[9])来设置目标量化参数QPi *
Q P i * = max ( Q P i - 1 - ΔQ P max , min ( Q P i - 1 + ΔQ P max , f Q ( Q i * ) ) ) , - - - ( 9 )
其中QPi-1是最后宏块的量化参数,而ΔQPmax是最大容许量化变化(通过语法给定或用户定义)。函数fQ(..)指定了量化步骤尺寸到量化参数上的映射;其取决于下层语法。
2.2.宏块运动估计和模式判决
基于所选的目标量化参数,根据[5]如下设置用于宏块i的运动估计和模式判定的拉格朗日乘子:
H . 263 , MPEG - 4 : ( λ motion , i ) 2 = λ mode , i = 0.85 · Q P i * 2 - - - ( 10 )
H.264/AVC:(λmotion,i)2=λmode,i=0.85·2^((QP* i-12)/3)(11)
对于所有运动补偿后的宏块/块模式,通过使拉格朗日函数最小化(参见(2))来获得相关运动矢量mi和参考索引ri(H.263附件U和H.264/AVC):
[ m i , r i ] = arg min m ∈ M , r ∈ R { D DFD ( i , m , r ) + λ motion , i · R MV ( i , m , r ) } - - - ( 12 )
其中失真项给定为:
D DFD ( i , m , r ) = Σ ( x , y ) ∈ B i | s ( x , y , t ) - s ′ ( x - m x , y - m y , t r ) | - - - ( 13 )
在此,R表示解码图像缓冲器中所存储的参考图像的集合,M指定了参考图像内的运动矢量搜索范围,tr是由参考索引r所参考的参考图像的采样时间,s(…,t)和s’(…,tr)分别表示原始图像和解码的参考图像的亮度信号;而RMV(i,m,r)指定了传送运动矢量m=[mx,my]T的所有分量、以及参考索引r所需的比特数。
针对给定宏块(块)的宏块(或块)模式的确定基本上遵循相同的方法。从给定的可能宏块/块模式Smode的集合中,选择使以下拉格朗日代价函数最小的模式pi
p i = arg min p ∈ S mode { D REC ( i , p | Q P i * ) + λ mode · R all ( i , p | Q P i * ) } . - - - ( 14 )
失真测量值表示原始宏块/块样本s和重构样本s’之间的平方差的和:
D REC ( i , p | Q P i * ) = Σ ( x , y ) ∈ B ( s ( x , y ) - s ′ ( x , y | p , Q P i * ) ) 2 , - - - ( 15 )
其中,B指定了相应的宏块/块样本的集合。Rall(i,p|QPi *)是与选择模式p和量化参数QPi *相关的比特数,其包括针对宏块报头的比特、运动矢量和参考索引、以及所有亮度和色度块的量化变换系数。
2.3.量化参数的最终设置
用于传送宏块语法元素的QPi取决于所选的宏块模式和作为量化变换系数的其相关参数。如果语法允许针对所选宏块参数的量化变化,则选择量化参数QPi=QPi *。否则,取来自最后宏块的量化参数:QPi=QPi-1
2.4.针对操作宏块层控制的模式更新
在完成宏块的编码之后,对操作编码控制的模型参数进行更新。在第一步骤中,根据本发明来计算所谓的宏块参数KMB和CMB
K MB = Q i * * · ( R all , i - R MV ( m ^ i ) ) / σ i 2 - - - ( 16 )
C MB = R MV ( m ^ i ) - - - ( 17 )
其中,Qi **表示与目标量化参数QPi *相对应的量化步骤尺寸:
Q i * * = f Q - 1 ( Q P i * ) .
Rall是用于对包括所有语法元素的所考虑宏块进行编码的比特数,而
Figure S04824906120060315D000102
是与运动矢量
Figure S04824906120060315D000103
相关的比特数,已经在初始化步骤中对其进行了估计(部分1)。
根据以下公式(参见[9])来设置当前编码图像的平均模型参数KF和CF
CF=CF·(i-1)/i+CMB/i  (18)
if(KMB>0andKMB<1000)
{
jK=jK+1(19)
KF=KF·(jK-1)/jK+KMB/jK(20)
}
根据这些参数,对用于编码以下宏块的模型参数进行更新,具体如下(参见[9]):
-剩余复杂度测量值:Si+1=Sii·σi
-剩余宏块:Ni+1=Ni-1
-剩余比特预算:Bi+1=Bi-Rall,i
-模型参数:Ki+1=KF·i/N+K1·(N-i)/N  (21)
Ci+1=CF·i/N+C1·(N-i)/N  (22)
3、试验结果
对于H.264/AVC视频编码标准,通过将其与仅利用拉格朗日优化的编码策略进行比较,演示了本发明的新编码策略的效率(针对整个序列的量化参数的固定值)。两种编码器仅使用序列开始处的一个帧内图像,将所有随后图像编码为预测编码P图像。在两种情况下,使用了5个参考图像。通过在[-32...32]×[-32...32]样本的范围上的对数整数像素搜索和随后的一半和四分之一像素提炼,进行运动估计。利用环境自适应二进制算术编码(CABAC)来进行熵编码。
对于本发明的新的编码策略,使用以下的简单的全局速率控制技术。给定要进行编码的图像数N、单位为千比特/秒的目标平均比特率R、以及单位为Hz的图像率F,通过以下公式来确定针对第一帧内图像i=1的目标比特数B1 *
B 1 * = 6000 · N · R F · ( N + 5 ) ·
对于所有剩余P图像i>1,将目标比特预算设置为:
B i * = 1 N - i + 1 ( 1000 · N · R F - Σ k = 1 i - 1 B k )
其中Bk表示由第k图像所实际占用的比特数。
在图1和2中,针对具有不同特性的两个测试序列,比较两个编码器的速率失真性能。这些曲线示出了亮度分量的平均PSNR相对于完整的比特流的平均测量比特速率的关系。可以看到,本发明的编码策略提供了与没有速率控制的速率失真优化编码器[8]几乎相同的速率失真效率,同时精确地命中了目标比特速率。将针对本发明所提出的编码器的获得的平均比特速率与目标比特速率一起显示在表1中。
参考文献
ITU-T and ISO/IEC JTC1,“Generic coding of movingpictures and associated audio information-Part 2:Video,”ITU-T Recommendation H.262-ISO/IEC 13818-2(MPEG-2),Nov.1994.
ITU-T,“Video coding for low bitrate communication,”ITU-T Recommendation H.263;version 1,Nov.1995;version 2,Jan.1998.
ISO/IEC JTC1,“Coding of audio-visual objects-Part2:Visual,”ISO/IEC 14496-2(MPEG-4visual version 1),Apr.1999;Amendment 1(version 2),Feb.2000.
T.Wiegand,G.Sullivan,A.Luthra,“Draft ITU-TRecommendation and Final Draft International Standard of JointVideo Specification(ITU-T Rec.H.264|ISO/IEC 14496-10AVC),”Joint Video Team(JVT)of ISO/IEC MPEG and ITU-T VCEG,JVT-G050rl,May 2003.
T.Wiegand,B.D.Andrews,“An Improved H.263 CoderUsing Rate-Distortion Optimization,”Doc.ITU-T/SG17/Q15-D-13,Apr.1998.
G.J.Sullivan,T.Wiegand,“Rate-DistortionOptimization for Video Compression,”in IEEE Signal ProcessingMagazine,vol.15,no.6,pp.74-90,Nov.1998.
H.Schwarz,T.Wiegand,“An Improved MPEG-4 CoderUsing Lagrangian Coder Control,”ITU-T/SG16/Q6/VCEG-M49,April 2001,Austin,Texas,USA.
H.Schwarz,T.Wiegand,“An Improved H.26L Coder UsingLagrangian Coder Control,”ITU-T/SG16/Q6/VCEG-D146,June 2001,Porto Seguro,Brasil.
J.Ribas-Corbera,S.Lei,“Rate Control in DCT VideoCoding for Low-Delay Communications,”in IEEE Transactions onCircuit and Systems for Video Technology,vol.9,no.1,Feb.1999.

Claims (7)

1.一种对视频图像中的宏块进行编码的方法,该方法包括步骤:
-针对视频图像,通过对相同图像类型的前一图像的宏块的量化参数进行平均,计算第一量化参数
-基于第一量化参数,计算初始拉格朗日参数(λ),
-计算预测差错信号(σi 2),其中,使用宏块中块的各自的残余信号和平均残余信号,
-基于预测差错信号,计算针对宏块的加权因子,
-基于加权因子、预测差错信号和剩余比特预算,计算目标量化步骤尺寸(Qi *)和相应的目标量化参数(QPi *),
-基于目标量化参数(QPi *),计算优化拉格朗日参数(λmotion),
-使用优化拉格朗日参数(λmotion),基于拉格朗日函数,为宏块选择运动矢量和/或编码模式,
-使用所计算和所选择的参数,对宏块进行编码,以及
-为下一宏块计算剩余比特预算(Bi)。
2.根据权利要求1所述的方法,其中,基于目标量化参数(QPi *),计算优化拉格朗日参数(λmotion)的步骤根据如下公式进行:
在H.263或MPEG-4编码的情况下:以及
在H.264/AVC    编码的情况下:(λmotion,i)2λmode,i=0.85·2^((QP* i-12)/3),
其中,i是宏块索引,λmotion是优化拉格朗日参数,λmode是优化拉格朗日参数λmotion的平方,且QPi *是目标量化参数。
3.根据权利要求1或2所述的方法,其中,使用优化拉格朗日参数(λmotion),基于拉格朗日函数,为宏块选择运动矢量的步骤根据如下公式进行:
[ m i , r i ] = arg min m ∈ M , r ∈ R { D DFD ( i , m , r ) + λ motion , i · R MV ( i , m , r ) } ,
其中,i是宏块索引,m是运动矢量,M是运动矢量搜索范围,R表示所存储的参考图像的集合,且r是参考索引,
其中,失真项为 D DFD ( i , m , r ) = Σ ( x , y ) ∈ B i | s ( x , y , t ) - s ′ ( x - m x , y - m y , t r ) | ,
s(…,t)和s’(…,tr)分别表示原始图像和由参考索引r所给定的已解码参考图像的亮度样本的数组,
RMV(m,r)指定了传送位移矢量[mx,my]T的所有分量和参考索引r所需的比特数,
B是针对其估计位移矢量和参考索引的宏块、宏块分区或子宏块分区的区域,以及
λmotion是优化拉格朗日参数。
4.根据权利要求1或2所述的方法,其中,使用优化拉格朗日参数(λmotion),基于拉格朗日函数,为宏块选择编码模式的步骤根据如下公式进行:
p i = arg min p ∈ S mode { D REC ( i , p | QP i * ) + λ mode · R all ( i , p | QP i * ) } ,
其中,i是宏块索引,pi是索引为i的宏块的编码模式,Smode是可能宏块/块模式的给定集合,λmode是优化拉格朗日参数λmotion的平方,失真测量DREC表示原始宏块/块样本与重构样本之间的平方差之和,Rall是与选择模式p和量化参数QPi *相关的比特数。
5.根据权利要求1或2所述的方法,其中,计算目标量化步骤尺寸(Qi *)和相应的目标量化参数(QPi *)的步骤根据如下公式进行:
Q i * = max ( Q min , min ( Q max , K i · σ i · S i α i · ( B i - N i · C i ) ) ) : B i > N i · C i Q max : B i ≤ N i · C i
其中,Qmin和Qmax分别是所支持的最小量化步骤尺寸和最大量化步骤尺寸,以及
QP i * = max ( QP i - 1 - Δ QP max , min ( QP i - 1 + Δ QP max , f Q ( Q i * ) ) ) ,
其中,i是宏块索引,Qi *是目标量化步骤尺寸,QPi *是相应的目标量化参数,QPi-1是前一宏块的量化参数,ΔQPmax是最大容许量化变化,Bi是当前剩余比特预算,Ni是当前剩余宏块的数目,Ki和Ci是当前模型参数,αi是加权因子,Si是当前剩余复杂度测量值,σi 2表示预测差错信号,且fQ(..)是指定了量化步骤尺寸到量化参数上的映射的函数。
6.根据权利要求1或2所述的方法,其中,基于预测差错信号,计算针对宏块的加权因子的步骤根据如下公式进行:
Figure FSB00000277533300031
其中,RB是用于传送图像的宏块层语法元素的比特预算,且N是图像内宏块的数目,σi 2表示预测差错信号。
7.一种对视频图像中的宏块进行编码的系统,该系统包括:
-用于针对视频图像,通过对相同图像类型的前一图像的宏块的量化参数进行平均,计算第一量化参数的装置,
-用于基于第一量化参数,计算初始拉格朗日参数(λ)的装置,
-用于计算预测差错信号(σi 2)的装置,其中,使用宏块中块的各自的残余信号和平均残余信号,
-用于基于预测差错信号,计算针对宏块的加权因子的装置,
-用于基于加权因子、预测差错信号和剩余比特预算,计算目标量化步骤尺寸(Qi *)和相应的目标量化参数(QPi *)的装置,
-用于基于目标量化参数(QPi *),计算优化拉格朗日参数(λmotion)的装置,
-用于使用优化拉格朗日参数(λmotion),基于拉格朗日函数,为宏块选择运动矢量和/或编码模式的装置,
-用于使用所计算和所选择的参数,对宏块进行编码的转置,以及
-用于为下一宏块计算剩余比特预算(Bi)的装置。
CN2004800249061A 2003-09-03 2004-08-23 编码视频图像的方法和布置 Expired - Fee Related CN1846446B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP03090282.9 2003-09-03
EP03090282A EP1513350A1 (en) 2003-09-03 2003-09-03 Process and arrangement for encoding video pictures
PCT/EP2004/009391 WO2005022924A1 (en) 2003-09-03 2004-08-23 Process and arrangement for encoding video pictures

Publications (2)

Publication Number Publication Date
CN1846446A CN1846446A (zh) 2006-10-11
CN1846446B true CN1846446B (zh) 2010-12-29

Family

ID=34130266

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2004800249061A Expired - Fee Related CN1846446B (zh) 2003-09-03 2004-08-23 编码视频图像的方法和布置

Country Status (7)

Country Link
US (1) US8014447B2 (zh)
EP (2) EP1513350A1 (zh)
JP (1) JP2007504727A (zh)
KR (1) KR20060133953A (zh)
CN (1) CN1846446B (zh)
MX (1) MXPA06002367A (zh)
WO (1) WO2005022924A1 (zh)

Families Citing this family (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6735253B1 (en) 1997-05-16 2004-05-11 The Trustees Of Columbia University In The City Of New York Methods and architecture for indexing and editing compressed video over the world wide web
US7143434B1 (en) 1998-11-06 2006-11-28 Seungyup Paek Video description system and method
AU2002351310A1 (en) 2001-12-06 2003-06-23 The Trustees Of Columbia University In The City Of New York System and method for extracting text captions from video and generating video summaries
US7720154B2 (en) * 2004-11-12 2010-05-18 Industrial Technology Research Institute System and method for fast variable-size motion estimation
WO2006096612A2 (en) * 2005-03-04 2006-09-14 The Trustees Of Columbia University In The City Of New York System and method for motion estimation and mode decision for low-complexity h.264 decoder
EP1874059A4 (en) * 2005-03-22 2011-05-04 Panasonic Corp CODING DEVICE AND DYNAMIC IMAGE RECORDING SYSTEM WITH THE CODING DEVICE
US8135063B2 (en) * 2006-09-08 2012-03-13 Mediatek Inc. Rate control method with frame-layer bit allocation and video encoder
US20100111163A1 (en) * 2006-09-28 2010-05-06 Hua Yang Method for p-domain frame level bit allocation for effective rate control and enhanced video encoding quality
US8804829B2 (en) * 2006-12-20 2014-08-12 Microsoft Corporation Offline motion description for video generation
US20080225947A1 (en) * 2007-03-13 2008-09-18 Matthias Narroschke Quantization for hybrid video coding
US8908765B2 (en) 2007-11-15 2014-12-09 General Instrument Corporation Method and apparatus for performing motion estimation
WO2009126785A2 (en) 2008-04-10 2009-10-15 The Trustees Of Columbia University In The City Of New York Systems and methods for image archaeology
WO2009155281A1 (en) 2008-06-17 2009-12-23 The Trustees Of Columbia University In The City Of New York System and method for dynamically and interactively searching media data
CN101742299B (zh) * 2008-11-21 2012-06-27 中国科学院空间科学与应用研究中心 一种符合ccsds标准的图像无损压缩处理系统及方法
US8671069B2 (en) 2008-12-22 2014-03-11 The Trustees Of Columbia University, In The City Of New York Rapid image annotation via brain state decoding and visual pattern mining
US9729888B2 (en) 2009-09-10 2017-08-08 Dolby Laboratories Licensing Corporation Speedup techniques for rate distortion optimized quantization
US9137545B2 (en) * 2009-10-21 2015-09-15 Sk Telecom Co., Ltd. Image encoding and decoding apparatus and method
KR101040087B1 (ko) * 2010-01-13 2011-06-09 전자부품연구원 H.264 svc를 위한 효율적인 부호화 방법
US8824554B2 (en) 2010-09-02 2014-09-02 Intersil Americas LLC Systems and methods for video content analysis
JP5426506B2 (ja) * 2010-09-06 2014-02-26 日本電信電話株式会社 適応量子化方法,適応量子化装置および適応量子化プログラム
CN107517384B (zh) 2011-06-16 2020-06-30 Ge视频压缩有限责任公司 解码器、编码器、解码方法、编码方法以及存储介质
CN102256126A (zh) * 2011-07-14 2011-11-23 北京工业大学 混合图像的编码方法
UA114674C2 (uk) 2011-07-15 2017-07-10 ДЖ.І. ВІДІЕУ КЕМПРЕШН, ЛЛСі Ініціалізація контексту в ентропійному кодуванні
US9781449B2 (en) * 2011-10-06 2017-10-03 Synopsys, Inc. Rate distortion optimization in image and video encoding
US9338463B2 (en) 2011-10-06 2016-05-10 Synopsys, Inc. Visual quality measure for real-time video processing
CA2996158C (en) * 2012-01-17 2020-10-27 Infobridge Pte. Ltd. Method of applying edge offset
US10230956B2 (en) 2012-09-26 2019-03-12 Integrated Device Technology, Inc. Apparatuses and methods for optimizing rate-distortion of syntax elements
US10277907B2 (en) 2012-10-25 2019-04-30 Integrated Device Technology, Inc. Rate-distortion optimizers and optimization techniques including joint optimization of multiple color components
KR102242721B1 (ko) * 2012-12-26 2021-04-22 소니 주식회사 화상 처리 장치 및 방법
CN103313058B (zh) * 2013-06-08 2016-08-17 中国计量学院 针对芯片实现的hevc视频编码多模块优化方法和系统
KR102281282B1 (ko) 2013-12-26 2021-07-23 삼성전자주식회사 서브블록 기반 예측을 수행하는 인터 레이어 비디오 복호화 방법 및 그 장치 및 서브블록 기반 예측을 수행하는 인터 레이어 비디오 부호화 방법 및 그 장치
GB2523736B (en) * 2014-02-19 2020-03-25 Advanced Risc Mach Ltd Rate control in video encoding
TWI508531B (zh) * 2014-06-04 2015-11-11 Hon Hai Prec Ind Co Ltd 視訊編碼裝置及方法
US20150373326A1 (en) * 2014-06-19 2015-12-24 Magnum Semiconductor, Inc. Apparatuses and methods for parameter selection during rate-distortion optimization
CN104320657B (zh) * 2014-10-31 2017-11-03 中国科学技术大学 Hevc无损视频编码的预测模式选择方法及相应的编码方法
US10432952B2 (en) * 2015-11-19 2019-10-01 Qualcomm Incorporated System and methods for fixed-point approximations in display stream compression (DSC)
CN108696750A (zh) * 2017-04-05 2018-10-23 深圳市中兴微电子技术有限公司 一种预测模式的判决方法及装置
US20220201317A1 (en) * 2020-12-22 2022-06-23 Ssimwave Inc. Video asset quality assessment and encoding optimization to achieve target quality requirement
CN112929663B (zh) * 2021-04-08 2022-07-15 中国科学技术大学 一种基于知识蒸馏的图像压缩质量增强方法
CN113706368A (zh) * 2021-10-29 2021-11-26 湖北亿咖通科技有限公司 图像数据处理方法和装置、电子设备、存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5579121A (en) * 1993-12-16 1996-11-26 Pioneer Video Corporation Real-time image compression processor
EP0892560A2 (en) * 1993-04-09 1999-01-20 Sony Corporation Picture encoding method, picture encoding apparatus and picture recording medium
US6192154B1 (en) * 1998-01-26 2001-02-20 International Business Machines Corporation Two-pass encoding method of digital motion video sequences for constant-or variable bit rate
EP1189451A1 (en) * 2000-09-13 2002-03-20 Kabushiki Kaisha Toshiba Digital video encoder

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3358620B2 (ja) * 1993-04-09 2002-12-24 ソニー株式会社 画像符号化方法及び画像符号化装置
JPH07322267A (ja) * 1994-05-25 1995-12-08 Nippon Telegr & Teleph Corp <Ntt> 画像信号符号化装置
JPH09322176A (ja) * 1995-12-20 1997-12-12 Sanyo Electric Co Ltd 符号化モード選択方法、動画像符号化装置、符号化方法、記録方法、及び伝送方法
JP3630565B2 (ja) * 1998-08-26 2005-03-16 沖電気工業株式会社 動画像の符号化方法及び装置
US7177358B2 (en) * 2000-06-27 2007-02-13 Mitsubishi Denki Kabushiki Kaisha Picture coding apparatus, and picture coding method
JP4644939B2 (ja) * 2001-01-17 2011-03-09 日本電気株式会社 動画像符号化装置および動画像符号化方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0892560A2 (en) * 1993-04-09 1999-01-20 Sony Corporation Picture encoding method, picture encoding apparatus and picture recording medium
US5579121A (en) * 1993-12-16 1996-11-26 Pioneer Video Corporation Real-time image compression processor
US6192154B1 (en) * 1998-01-26 2001-02-20 International Business Machines Corporation Two-pass encoding method of digital motion video sequences for constant-or variable bit rate
EP1189451A1 (en) * 2000-09-13 2002-03-20 Kabushiki Kaisha Toshiba Digital video encoder

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Heiko Schwarz,Thomas Wiegand.Lgrangian Coder Control and ComparisonofMpeg-4andH.26LVideo Codecs.ITG FACHBERICHTE,VDE VERLAG,BERLIN,DE 20.2002,(20),301-308.
Heiko Schwarz,Thomas Wiegand.Lgrangian Coder Control and ComparisonofMpeg-4andH.26LVideo Codecs.ITG FACHBERICHTE,VDE VERLAG,BERLIN,DE 20.2002,(20),301-308. *

Also Published As

Publication number Publication date
MXPA06002367A (es) 2006-06-20
KR20060133953A (ko) 2006-12-27
WO2005022924A1 (en) 2005-03-10
JP2007504727A (ja) 2007-03-01
US20080298464A1 (en) 2008-12-04
CN1846446A (zh) 2006-10-11
EP1513350A1 (en) 2005-03-09
US8014447B2 (en) 2011-09-06
EP1661410A1 (en) 2006-05-31

Similar Documents

Publication Publication Date Title
CN1846446B (zh) 编码视频图像的方法和布置
CN100463523C (zh) 帧层速率控制的视讯编码方法和系统
US7280597B2 (en) System and method for determining coding modes, DCT types and quantizers for video coding
US7782953B2 (en) Optimal encoding of motion compensated video
US20080056354A1 (en) Transcoding Hierarchical B-Frames with Rate-Distortion Optimization in the DCT Domain
US20070009025A1 (en) Method and apparatus for operational frame-layer rate control in video encoder
US20080008238A1 (en) Image encoding/decoding method and apparatus
US8295623B2 (en) Encoding and decoding with elimination of one or more predetermined predictors
US8165411B2 (en) Method of and apparatus for encoding/decoding data
KR20010080644A (ko) 기저층 양자화 데이터를 이용하여 향상층 데이터를 엔코딩및 디코딩하는 시스템 및 방법
EP3207701A1 (en) Metadata hints to support best effort decoding
KR20120084168A (ko) 비디오 인코딩 모드 선택 방법 및 이를 수행하는 비디오 인코딩 장치
Chung et al. An efficient motion estimation technique based on a rate-distortion criterion
Mansour et al. Rate and distortion modeling of CGS coded scalable video content
Tan et al. Single-pass rate control with texture and non-texture rate-distortion models
US20180199032A1 (en) Method and apparatus for determining prediction of current block of enhancement layer
US9628791B2 (en) Method and device for optimizing the compression of a video stream
Grois et al. Optimization methods for H. 264/AVC video coding
WO2004070950A2 (en) Device for encoding a video data stream
KR19990067016A (ko) 블록-기반 코딩 시스템에서 코딩 모드를선택하기 위한 방법 및 장치
KR100809013B1 (ko) 복잡도 가변형 동영상 부호화 장치 및 그 방법
Hoang et al. Rate-distortion optimizations for motion estimation in low-bit-rate video coding
KR100555750B1 (ko) 저전송율 비디오 부호화 장치 및 방법
Atta Optimal bit allocation for subband video coding
KR20100004009A (ko) 실시간 h.264를 위한 적응적 프레임 비트율 제어 방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CP02 Change in the address of a patent holder

Address after: Issy-les-Moulineaux, France

Patentee after: THOMSON LICENSING

Address before: French Boulogne

Patentee before: THOMSON LICENSING

CP02 Change in the address of a patent holder
TR01 Transfer of patent right

Effective date of registration: 20190129

Address after: Paris France

Patentee after: International Digital Madison Patent Holding Co.

Address before: Issy-les-Moulineaux, France

Patentee before: THOMSON LICENSING

Effective date of registration: 20190129

Address after: Issy-les-Moulineaux, France

Patentee after: THOMSON LICENSING

Address before: Issy-les-Moulineaux, France

Patentee before: THOMSON LICENSING

TR01 Transfer of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20101229

Termination date: 20200823

CF01 Termination of patent right due to non-payment of annual fee