CN107846593B - 一种率失真优化方法及装置 - Google Patents

一种率失真优化方法及装置 Download PDF

Info

Publication number
CN107846593B
CN107846593B CN201610839137.5A CN201610839137A CN107846593B CN 107846593 B CN107846593 B CN 107846593B CN 201610839137 A CN201610839137 A CN 201610839137A CN 107846593 B CN107846593 B CN 107846593B
Authority
CN
China
Prior art keywords
coding mode
coded
candidate coding
candidate
macro block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610839137.5A
Other languages
English (en)
Other versions
CN107846593A (zh
Inventor
田卉
郭勐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
China Mobile Communications Ltd Research Institute
Original Assignee
China Mobile Communications Group Co Ltd
China Mobile Communications Ltd Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, China Mobile Communications Ltd Research Institute filed Critical China Mobile Communications Group Co Ltd
Priority to CN201610839137.5A priority Critical patent/CN107846593B/zh
Publication of CN107846593A publication Critical patent/CN107846593A/zh
Application granted granted Critical
Publication of CN107846593B publication Critical patent/CN107846593B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/149Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/19Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding using optimisation based on Lagrange multipliers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明公开了一种率失真优化方法及装置,可按照编码可变块从大到小的顺序对当前待编码宏块的候选编码模式进行优化计算,并根据优化计算结果确定当前待编码宏块的率失真统计特征,以达到通过逐步求精的方式逼近当前待编码宏块的率失真统计特征的真实值并基于该真实值更新拉格朗日乘子的效果,从而在提高视频编码控制效率的基础上,提高了率失真优化的效果。

Description

一种率失真优化方法及装置
技术领域
本发明涉及视频压缩技术领域,尤其涉及一种率失真优化方法及装置。
背景技术
目前,常见的视频压缩系统(如H.261/3/4/5以及MPEG-2/4等)基本上都采用了有损压缩的Hybrid(混合式)编码架构。在该架构下,视频编码器可以针对各种具有复杂率失真统计特征的视频信号,使用不同的编码工具(及组合)消除各种冗余信息,从而压缩视频数据。
具体地,典型的视频压缩处理过程主要包括预测编码、预测残差DCT(DiscreteCosine Transform,离散余弦变换)系数量化及熵编码等环节。其中,在预测编码环节,视频编码器通过模式选择和运动补偿,消除视频信号的时-空域相关性;在码率控制环节,通过DCT系数量化控制预测残差的码率及失真。视频编码控制技术就是研究相关参数(包括编码模式MD、运动矢量MV和量化参数QP)的计算问题,以期用尽可能少的比特获得高质量的重建视频图像。
据信息论,视频压缩的码率和失真满足下凸非递减关系。一般地,码率越低则失真越大,反之亦然,码率极低和失真极小二者不可兼得。惟有在失真与码率之间实现恰当的折衷,才能实现编码控制的优化计算,获得较高的编码效率。考虑到信道带宽对多媒体通讯的客观限制,该问题实质上是一个有约束极值求解,其数学表达形式如下:
Figure BDA0001117938640000011
其中,
Figure BDA0001117938640000012
Figure BDA0001117938640000013
分别表示编码模式、运动矢量和量化参数的取值范围,D(MD,MV,QP)表示图像失真,R(MD,MV,QP)表示输出码率,而Rc表示信道带宽。
对凸函数有约束极值问题的求解,可以采用Lagrange乘子法,转换为等价的无约束极值问题进行求解,如下式所示:
Figure BDA0001117938640000021
可以根据上式的最小值选择编码工具(及组合),在码率和失真之间实现折衷。该式能否实现高效的编码效率,关键在于λ(拉格朗日乘子)值的选取。
具体地,目前业界存在以下几种λ值的计算方式:
第一种:在Rc已知的条件下,根据码率-失真关系的单调性,利用二分法通过多次编码快速逼近λ的最佳值。但是,采用二分法计算λ存在计算复杂度高,编码延迟大,难以投入实际应用等问题。
第二种:根据率失真理论建立λ关于量化参数的数学模型
Figure BDA0001117938640000022
(即QP-L模型),并基于该模型计算λ;其中Q为QP对应的量化步长,c为某个常数。
虽然QP-L算法可以有效地提高视频压缩的编码效率,在H.26L及H.264/AVC等标准中得到应用,但是,由于视频信号的率失真统计特征关联诸元在QP-L模型中的缺位,其计算结果不可能对任意视频序列都为最优。此外,QP-L模型对量化参数存在依赖性,不利于实现高效的视频编码控制:一般地,量化参数主要用于控制预测残差的码率及失真,其值在预测编码后才能有效计算,而QP-L在预测编码计算时就需要预先知道量化参数,二者内在相互抵触,属于“鸡与蛋”逻辑悖论。
第三种:建立Adapt-L模型(调整后的拉格朗日乘子模型)以采用Adapt-L算法计算λ。
具体地,可通过以下方式建立Adapt-L模型:
在图像宏块编码时,针对编码模式及运动估计的所有可能选项及其组合,计算图像失真及码率均值:
Figure BDA0001117938640000024
其中
Figure BDA0001117938640000031
表示编码模式和运动估计不同组合的基数,n表示当前帧内当前宏块的序号,SSD(Sum of Squared Difference)是原始像素和重建像素之间的差值平方和(即,可以SSD表示图像失真)。针对不同的量化参数,分析
Figure BDA0001117938640000032
Figure BDA0001117938640000033
之间的函数关系,其中大量实验表明
Figure BDA0001117938640000035
Figure BDA0001117938640000036
具有线性关系。由此,可以得到式(3)所示的一个启发式的λ关于视频信号率失真统计特性的函数模型,与量化参数无关:
Figure BDA0001117938640000037
一般地,由于视频信号经过预测编码以及DCT变换之后,预测残差DCT分量之间的相关性很小(可以认为它们“近似”不相关),且满足Laplacian分布规律。如果使用重建图像与原始图像像素值之间的平均绝对值误差(MAD,Mean Absolute Difference)表示图像失真,也即是
Figure BDA0001117938640000038
那么在预测残差的码率与失真之间存在如下函数关系:
对式(4)泰勒级数展开,并舍弃高阶项,可以得到如下模型:
Figure BDA00011179386400000310
其中,X2和X1是模型参数,其值可以根据线性回归技术加以确定,σ2为预测残余方差。
将式(5)代入式(2)中,则视频编码控制的率失真优化问题可以表述为如下的表达式:
利用Lagrange乘子技术,经过数学推导,可以得到:
可以看出,上式(7)与式(3)在数学表达上是一致的。在式(7)中,X2是唯一的未定量。由实验分析可知X2与预测残余方差σ2之间的函数关系,采用分段拟合函数,得到X2与预测残余方差σ2的数学表达式为:
其中,a1,…,a5为常数。
相应地,根据以上理论及实验分析,可以获得如下所示的拉格朗日乘子的一个新计算公式(即Adapt-L模型):
Figure BDA0001117938640000043
进一步地,在得到Adapt-L模型后,可采用如下算法计算λ:
步骤1:为待编码的视频图像序列分配缓冲区,用于保存当前帧以及前一帧每个宏块的平均失真、预测残余平均码率及平均方差;
步骤2:针对第一个I帧的每一个图像宏块,采用QP-L算法进行优化计算,记录每次编码处理的失真、预测残余码率、方差等信息,并把相关均值保存在缓冲区中;
步骤3:对于P帧宏块,在当前帧及前一帧搜索与当前宏块相邻的已编码宏块,并根据该已编码宏块对当前宏块进行编码处理,得到各统计信息均值,即,得到平均失真、预测残余平均码率以及平均方差等;以及,将所得到的平均失真、预测残余平均码率以及平均方差代入到式(9)中,计算得到λ。
另外,为了避免λ变化太大,可以根据历史平均值
Figure BDA0001117938640000051
对λ进行限制。获得的λ可直接用于模式选择,对于运动补偿,可采用
Figure BDA0001117938640000052
再有,在优化计算时,需要记录每次编码处理的失真、预测残余码率、方差等信息,并把相关均值保存在缓冲区中。
由上述步骤可知,在采用Adapt-L算法计算λ时,需要获得当前宏块的率失真统计特征。由于对于H.264/AVC等新一代编码标准而言,编码参数选项(或组合)众多(如具备多种编码模式选项以及编码可变块选项),不同编码方案的率失真统计特性差异较大,以某一个具体编码方案的率失真统计数据来表示这个宏块的率失真统计特征,由此带来的误差不可避免,从而导致λ的计算结果并不十分准确。
也就是说,现有的率失真优化方法存在λ的计算方式复杂、或者计算结果不准确等问题,导致现有的率失真优化方法效果并不佳。因此,亟需提供一种新的率失真优化方法以解决上述问题。
发明内容
本发明实施例提供了一种率失真优化方法及装置,用以提高拉格朗日乘子计算过程的简便性以及计算结果的准确性,以提高率失真优化的效果。
一方面,本发明实施例提供了一种率失真优化方法,包括:
按照编码可变块从大到小的顺序对当前待编码宏块的各候选编码模式进行优化计算,得到各候选编码模式的编码代价函数值;
根据计算得到的各候选编码模式的编码代价函数值,从当前待编码宏块的各候选编码模式中选取对应的编码代价函数值最小的候选编码模式作为当前待编码宏块的最优编码模式,并根据当前待编码宏块在所述最优编码模式下的率失真统计特征估计当前待编码宏块的率失真统计特征;
根据估计得到的所述当前待编码宏块的率失真统计特征以及调整后的拉格朗日乘子模型Adapt-L模型确定新的拉格朗日乘子,以根据该新的拉格朗日乘子进行率失真优化。
另一方面,本发明实施例提供了一种率失真优化装置,包括:
编码代价函数值计算单元,用于按照编码可变块从大到小的顺序对当前待编码宏块的各候选编码模式进行优化计算,得到各候选编码模式的编码代价函数值;
率失真统计特征估计单元,用于根据计算得到的各候选编码模式的编码代价函数值,从当前待编码宏块的各候选编码模式中选取对应的编码代价函数值最小的候选编码模式作为当前待编码宏块的最优编码模式,并根据当前待编码宏块在所述最优编码模式下的率失真统计特征估计当前待编码宏块的率失真统计特征;
拉格朗日乘子更新单元,用于根据估计得到的所述当前待编码宏块的率失真统计特征以及调整后的拉格朗日乘子模型Adapt-L模型确定新的拉格朗日乘子,以根据该新的拉格朗日乘子进行率失真优化。
本发明有益效果如下:
本发明实施例提供了一种率失真优化方法及装置,可按照编码可变块从大到小的顺序对当前待编码宏块的候选编码模式进行优化计算,并根据优化计算结果确定当前待编码宏块的率失真统计特征,以达到通过逐步求精的方式逼近当前待编码宏块的率失真统计特征的真实值并基于该真实值更新拉格朗日乘子的效果,从而在提高视频编码控制效率的基础上,提高了率失真优化的效果。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1所示为本发明实施例提供的一种率失真优化方法的流程示意图;
图2所示为本发明实施例提供的一种率失真优化装置的结构示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
实施例一:
为了解决现有的率失真优化方法存在λ的计算方式复杂、或者计算结果不准确等所导致的效果并不佳的问题,本申请实施例提供了一种新的率失真优化方法。如图1所示,所述率失真优化方法可包括以下步骤:
步骤101:按照编码可变块从大到小的顺序对当前待编码宏块的各候选编码模式进行优化计算,得到各候选编码模式的编码代价函数值;
步骤102:根据计算得到的各候选编码模式的编码代价函数值,从当前待编码宏块的各候选编码模式中选取对应的编码代价函数值最小的候选编码模式作为当前待编码宏块的最优编码模式,并根据当前待编码宏块在所述最优编码模式下的率失真统计特征估计当前待编码宏块的率失真统计特征;
步骤103:根据估计得到的所述当前待编码宏块的率失真统计特征以及Adapt-L模型确定新的拉格朗日乘子,以根据该新的拉格朗日乘子进行率失真优化。
也就是说,可按照编码可变块(即运动补偿块)从大到小的顺序对当前待编码宏块的候选编码模式进行优化计算,并根据优化计算结果确定当前待编码宏块的率失真统计特征,由于一般而言,块越大,相似性表达的颗粒度越粗,预测残差的能量(方差)越大,视频压缩的图像失真和码率也越大;块变小,相似性表达的颗粒度就越小,预测残差能量也就越小,图像失真和码率也就越小,因而,可达到通过逐步求精的方式逼近当前待编码宏块的率失真统计特征的真实值并基于该真实值更新拉格朗日乘子的效果,从而在提高视频编码控制效率的基础上,提高了率失真优化的效果。
下面,将对本发明实施例所述的各步骤进行详细说明:
可选地,在步骤101中,针对当前待编码宏块的任一候选编码模式,可通过以下公式计算该候选编码模式的编码代价函数值Cost1:
Cost1=MSD+λ*P;其中,MSD(Mean Squared Difference)(等同于MSE(MeanSquared Error))表示当前待编码宏块在该候选编码模式以及该候选编码模式的最优运动矢量下的预测残差的均方差(也即,当前待编码宏块在该候选编码模式以及该候选编码模式的最优运动矢量下的图像编码失真的均方差),P表示当前待编码宏块的控制头信息和、当前待编码宏块在该候选编码模式以及该候选编码模式的最优运动矢量下的残差编码的长度(对残差进行熵编码处理后所得到的编码长度)之和,λ为设定的初始拉格朗日乘子。
其中,初始拉格朗日乘子可采用现有的Adapt-L算法计算得到,或者采用现有的QP-L模型或者二分法计算得到,对此不作限定。
另外,可选地,针对当前待编码宏块的任一候选编码模式,可通过以下方式计算该候选编码模式的最优运动矢量:
针对当前待编码宏块在该候选编码模式下的每一种可能的运动矢量,计算其对应的运动估计代价函数值
Figure BDA0001117938640000081
其中,SAD(Sum of Absolute Difference)表示当前待编码宏块在该候选编码模式以及该运动矢量下的预测残差分量的绝对值和,H表示当前待编码宏块的控制头信息编码长度,λ为设定的初始拉格朗日乘子;
将对应的Cost2最小的运动矢量作为该候选编码模式的最优运动矢量。
再有,需要说明的是,步骤101中所述的编码可变块至少可包括:Inter 16X16,Inter 16X8,Inter 8X16,Inter 8X8,Inter 8X4,Inter 4X8,以及Inter 4X4等。且,在按照编码可变块从大到小的顺序对当前待编码宏块的各候选编码模式进行优化计算时,一般可按照如下顺序依次进行:Inter 16X16,Inter 16X8,Inter 8X16,Inter 8X8,Inter 8X4,Inter 4X8,Inter 4X4,对此不作赘述。
进一步地,在按照上述方式计算得到当前待编码宏块的各候选编码模式的编码代价函数值,且选取对应的编码代价函数值最小的候选编码模式作为当前待编码宏块的最优编码模式后,可按照如下方式执行步骤102所述的根据当前待编码宏块在所述最优编码模式下的率失真统计特征估计当前待编码宏块的率失真统计特征的操作:
将当前待编码宏块在所述最优编码模式以及所述最优编码模式的最优运动矢量下的率失真统计特征作为当前待编码宏块的率失真统计特征。当然,也可将当前待编码宏块在所述最优编码模式以及所述最优编码模式的所有可能的运动矢量下的率失真统计特征的相关均值作为当前待编码宏块的率失真统计特征。
其中,以计算当前待编码宏块在所述最优编码模式以及所述最优编码模式的最优运动矢量下的率失真统计特征为例,其具体实施方式可为:
基于该候选编码模式以及该候选编码模式的最优运动矢量,计算当前待编码宏块在该候选编码模式以及该候选编码模式的最优运动矢量下的预测残差的MAD(MeanAbsolute Difference,平均绝对值误差),并基于计算得到的MAD以及设定的二次码率模型(Q2码率模型)计算QP(量化参数);其中,二次码率模型可表示如下:
Figure BDA0001117938640000091
其中,R'代表编码量化系数所需的码字位数;X1和X2是模型参数,其值可以用线性回归技术加以确定;Q表示量化步长(其中,Q与QP的关系为:QP是Q的序号,当Q确定后,QP也随之确定);
根据计算得到的QP对当前待编码宏块在该候选编码模式以及该候选编码模式的最优运动矢量下的预测残差进行编码处理,得到当前待编码宏块在该候选编码模式以及该候选编码模式的最优运动矢量下的图像编码失真(可以SSD表示)、码率以及残余方差,并将得到的图像编码失真、码率以及残余方差作为当前待编码宏块在该该候选编码模式以及该候选编码模式的最优运动矢量下的率失真统计特征。
相应地,在估计得到所述当前待编码宏块的率失真统计特征之后,即可将估计得到的所述当前待编码宏块的率失真统计特征代入公式(9)所述的Adapt-L模型中以更新拉格朗日乘子,以便后续可根据该新的拉格朗日乘子进行率失真优化。
进一步地,在计算得到当前候选编码模式的编码代价函数值之后,计算下一候选编码模式的编码代价函数值之前,所述方法还可包括:
确定当前待编码宏块在该当前候选编码模式下的率失真统计特征所对应的二次码率模型参数分组;并
根据当前待编码宏块在该当前候选编码模式下的率失真统计特征,通过线性回归方式,更新其所对应的分组的二次码率模型参数(即X1和X2)。
例如,以对残余方差按照一定间隔进行划分,按照分组计算二次码率模型参数为例,可根据当前待编码宏块在该当前候选编码模式下的残余方差,确定当前待编码宏块在该当前候选编码模式下的率失真统计特征所对应的二次码率模型参数分组,并根据当前待编码宏块在该当前候选编码模式下的率失真统计特征,通过线性回归方式,更新其所对应的分组的二次码率模型参数。
或者,以对残差MSE按照一定间隔进行划分,按照分组计算二次码率模型参数为例,若率失真统计特征中包括残差MSE参数,则可根据当前待编码宏块在该当前候选编码模式下的残差MSE,确定当前待编码宏块在该当前候选编码模式下的率失真统计特征所对应的二次码率模型参数分组,并根据当前待编码宏块在该当前候选编码模式下的率失真统计特征,通过线性回归方式,更新其所对应的分组的二次码率模型参数。
也就是说,在进行二次码率模型参数的更新时,可按照一定间隔对残差MSE或残余方差进行划分,按照分组对二次码率模型参数进行回归计算,以提高码率模型的预测精度。
由本发明实施例所述的内容可知,在本发明所述实施例中,可按照编码可变块(即运动补偿块)从大到小的顺序对当前待编码宏块的候选编码模式进行优化计算,并根据优化计算结果确定当前待编码宏块的率失真统计特征,由于一般而言,块越大,相似性表达的颗粒度越粗,预测残差的能量(方差)越大,视频压缩的图像失真和码率也越大;块变小,相似性表达的颗粒度就越小,预测残差能量也就越小,图像失真和码率也就越小,因而,可达到通过逐步求精的方式逼近当前待编码宏块的率失真统计特征的真实值并基于该真实值更新拉格朗日乘子的效果,从而在提高视频编码控制效率的基础上,提高了率失真优化的效果。
另外,由于在进行二次码率模型参数的更新时,可按照一定间隔对残差MSE或残余方差进行划分,按照分组对二次码率模型参数进行回归计算,因而,还可提高码率模型的预测精度。
实施例二:
基于同样的发明构思,本申请实施例二提供了一种率失真优化装置,所述率失真优化装置的具体实施可参见本发明实施例一中的相关描述,对此不作赘述。具体地,如图2所示,所述率失真优化装置可包括:
编码代价函数值计算单元21,可用于按照编码可变块从大到小的顺序对当前待编码宏块的各候选编码模式进行优化计算,得到各候选编码模式的编码代价函数值;
率失真统计特征估计单元22,可用于根据计算得到的各候选编码模式的编码代价函数值,从当前待编码宏块的各候选编码模式中选取对应的编码代价函数值最小的候选编码模式作为当前待编码宏块的最优编码模式,并根据当前待编码宏块在所述最优编码模式下的率失真统计特征估计当前待编码宏块的率失真统计特征;
拉格朗日乘子更新单元23,可用于根据估计得到的所述当前待编码宏块的率失真统计特征以及Adapt-L模型确定新的拉格朗日乘子,以根据该新的拉格朗日乘子进行率失真优化。
可选地,所述编码代价函数值计算单元21,具体可用于针对当前待编码宏块的任一候选编码模式,通过以下公式计算该候选编码模式的编码代价函数值Cost1:
Cost1=MSD+λ*P;其中,MSD表示当前待编码宏块在该候选编码模式以及该候选编码模式的最优运动矢量下的预测残差的均方差,P表示当前待编码宏块的控制头信息和当前待编码宏块在该候选编码模式以及该候选编码模式的最优运动矢量下的残差编码的长度和,λ为设定的初始拉格朗日乘子。
进一步地,所述率失真统计特征估计单元22,具体可用于将当前待编码宏块在所述最优编码模式以及所述最优编码模式的最优运动矢量下的率失真统计特征作为当前待编码宏块的率失真统计特征;
其中,当前待编码宏块在每一候选编码模式以及该候选编码模式的最优运动矢量下的率失真统计特征是通过以下方式计算得到的:
基于该候选编码模式以及该候选编码模式的最优运动矢量,计算当前待编码宏块在该候选编码模式以及该候选编码模式的最优运动矢量下的预测残差的MAD,并基于计算得到的MAD以及设定的二次码率模型计算QP;
根据计算得到的QP对当前待编码宏块在该候选编码模式以及该候选编码模式的最优运动矢量下的预测残差进行编码处理,得到当前待编码宏块在该候选编码模式以及该候选编码模式的最优运动矢量下的图像编码失真、码率以及残余方差,并将得到的图像编码失真、码率以及残余方差作为当前待编码宏块在该该候选编码模式以及该候选编码模式的最优运动矢量下的率失真统计特征。
可选地,所述率失真优化装置还可包括模型参数更新单元24:
所述模型参数更新单元24,可用于在计算得到当前候选编码模式的编码代价函数值之后,计算下一候选编码模式的编码代价函数值之前,确定当前待编码宏块在该当前候选编码模式下的率失真统计特征所对应的二次码率模型参数分组;并根据当前待编码宏块在该当前候选编码模式下的率失真统计特征,通过线性回归方式,更新其所对应的分组的二次码率模型参数。
本领域技术人员应明白,本发明的实施例可提供为方法、装置(设备)、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、装置(设备)和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (8)

1.一种率失真优化方法,其特征在于,包括:
按照编码可变块从大到小的顺序对当前待编码宏块的各候选编码模式进行优化计算,得到各候选编码模式的编码代价函数值;
根据计算得到的各候选编码模式的编码代价函数值,从当前待编码宏块的各候选编码模式中选取对应的编码代价函数值最小的候选编码模式作为当前待编码宏块的最优编码模式,并根据当前待编码宏块在所述最优编码模式下的率失真统计特征估计当前待编码宏块的率失真统计特征;
根据估计得到的所述当前待编码宏块的率失真统计特征以及调整后的拉格朗日乘子模型Adapt-L模型确定新的拉格朗日乘子,以根据该新的拉格朗日乘子进行率失真优化;
其中,根据当前待编码宏块在所述最优编码模式下的率失真统计特征估计当前待编码宏块的率失真统计特征,包括:
将当前待编码宏块在所述最优编码模式以及所述最优编码模式的最优运动矢量下的率失真统计特征作为当前待编码宏块的率失真统计特征;
其中,当前待编码宏块在每一候选编码模式以及该候选编码模式的最优运动矢量下的率失真统计特征是通过以下方式计算得到的:
基于该候选编码模式以及该候选编码模式的最优运动矢量,计算当前待编码宏块在该候选编码模式以及该候选编码模式的最优运动矢量下的预测残差的平均绝对值误差MAD,并基于计算得到的MAD以及设定的二次码率模型计算量化参数QP;
根据计算得到的QP对当前待编码宏块在该候选编码模式以及该候选编码模式的最优运动矢量下的预测残差进行编码处理,得到当前待编码宏块在该候选编码模式以及该候选编码模式的最优运动矢量下的图像编码失真、码率以及残余方差,并将得到的图像编码失真、码率以及残余方差作为当前待编码宏块在该该候选编码模式以及该候选编码模式的最优运动矢量下的率失真统计特征。
2.如权利要求1所述的方法,其特征在于,针对当前待编码宏块的任一候选编码模式,通过以下公式计算该候选编码模式的编码代价函数值Cost1:
Cost1=MSD+λ*P;其中,MSD表示当前待编码宏块在该候选编码模式以及该候选编码模式的最优运动矢量下的预测残差的均方差,P表示当前待编码宏块的控制头信息和、当前待编码宏块在该候选编码模式以及该候选编码模式的最优运动矢量下的残差编码的长度和,λ为设定的初始拉格朗日乘子。
3.如权利要求1或2所述的方法,其特征在于,针对当前待编码宏块的任一候选编码模式,通过以下方式计算该候选编码模式的最优运动矢量:
针对当前待编码宏块在该候选编码模式下的每一种可能的运动矢量,计算其对应的运动估计代价函数值
Figure FDA0002189118340000021
其中,SAD表示当前待编码宏块在该候选编码模式以及该运动矢量下的预测残差分量的绝对值和,H表示当前待编码宏块的控制头信息编码长度,λ为设定的初始拉格朗日乘子;
将对应的Cost2最小的运动矢量作为该候选编码模式的最优运动矢量。
4.如权利要求1所述的方法,其特征在于,在计算得到当前候选编码模式的编码代价函数值之后,计算下一候选编码模式的编码代价函数值之前,还包括:
确定当前待编码宏块在该当前候选编码模式下的率失真统计特征所对应的二次码率模型参数分组;并
根据当前待编码宏块在该当前候选编码模式下的率失真统计特征,通过线性回归方式,更新其所对应的分组的二次码率模型参数。
5.如权利要求1所述的方法,其特征在于,所述编码可变块至少可包括:Inter 16X16,Inter 16X8,Inter 8X16,Inter 8X8,Inter 8X4,Inter 4X8,以及Inter 4X4。
6.一种率失真优化装置,其特征在于,包括:
编码代价函数值计算单元,用于按照编码可变块从大到小的顺序对当前待编码宏块的各候选编码模式进行优化计算,得到各候选编码模式的编码代价函数值;
率失真统计特征估计单元,用于根据计算得到的各候选编码模式的编码代价函数值,从当前待编码宏块的各候选编码模式中选取对应的编码代价函数值最小的候选编码模式作为当前待编码宏块的最优编码模式,并根据当前待编码宏块在所述最优编码模式下的率失真统计特征估计当前待编码宏块的率失真统计特征;
拉格朗日乘子更新单元,用于根据估计得到的所述当前待编码宏块的率失真统计特征以及调整后的拉格朗日乘子模型Adapt-L模型确定新的拉格朗日乘子,以根据该新的拉格朗日乘子进行率失真优化;
其中,所述率失真统计特征估计单元,具体用于将当前待编码宏块在所述最优编码模式以及所述最优编码模式的最优运动矢量下的率失真统计特征作为当前待编码宏块的率失真统计特征;
其中,当前待编码宏块在每一候选编码模式以及该候选编码模式的最优运动矢量下的率失真统计特征是通过以下方式计算得到的:
基于该候选编码模式以及该候选编码模式的最优运动矢量,计算当前待编码宏块在该候选编码模式以及该候选编码模式的最优运动矢量下的预测残差的平均绝对值误差MAD,并基于计算得到的MAD以及设定的二次码率模型计算量化参数QP;
根据计算得到的QP对当前待编码宏块在该候选编码模式以及该候选编码模式的最优运动矢量下的预测残差进行编码处理,得到当前待编码宏块在该候选编码模式以及该候选编码模式的最优运动矢量下的图像编码失真、码率以及残余方差,并将得到的图像编码失真、码率以及残余方差作为当前待编码宏块在该该候选编码模式以及该候选编码模式的最优运动矢量下的率失真统计特征。
7.如权利要求6所述的装置,其特征在于,所述编码代价函数值计算单元,具体用于针对当前待编码宏块的任一候选编码模式,通过以下公式计算该候选编码模式的编码代价函数值Cost1:
Cost1=MSD+λ*P;其中,MSD表示当前待编码宏块在该候选编码模式以及该候选编码模式的最优运动矢量下的预测残差的均方差,P表示当前待编码宏块的控制头信息和当前待编码宏块在该候选编码模式以及该候选编码模式的最优运动矢量下的残差编码的长度和,λ为设定的初始拉格朗日乘子。
8.如权利要求6所述的装置,其特征在于,还包括模型参数更新单元:
所述模型参数更新单元,用于在计算得到当前候选编码模式的编码代价函数值之后,计算下一候选编码模式的编码代价函数值之前,确定当前待编码宏块在该当前候选编码模式下的率失真统计特征所对应的二次码率模型参数分组;并根据当前待编码宏块在该当前候选编码模式下的率失真统计特征,通过线性回归方式,更新其所对应的分组的二次码率模型参数。
CN201610839137.5A 2016-09-21 2016-09-21 一种率失真优化方法及装置 Active CN107846593B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610839137.5A CN107846593B (zh) 2016-09-21 2016-09-21 一种率失真优化方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610839137.5A CN107846593B (zh) 2016-09-21 2016-09-21 一种率失真优化方法及装置

Publications (2)

Publication Number Publication Date
CN107846593A CN107846593A (zh) 2018-03-27
CN107846593B true CN107846593B (zh) 2020-01-03

Family

ID=61657559

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610839137.5A Active CN107846593B (zh) 2016-09-21 2016-09-21 一种率失真优化方法及装置

Country Status (1)

Country Link
CN (1) CN107846593B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022164853A1 (en) * 2021-01-26 2022-08-04 Meta Platforms, Inc. Dynamically biasing mode selection in video encoding

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108737839B (zh) * 2018-04-11 2020-09-25 西安理工大学 一种面向帧内码率控制的拉格朗日因子计算方法
WO2020107288A1 (zh) * 2018-11-28 2020-06-04 Oppo广东移动通信有限公司 视频编码优化方法、装置及计算机存储介质
CN109741715B (zh) * 2019-02-25 2020-10-16 深圳市华星光电技术有限公司 显示面板的补偿方法、补偿装置及存储介质
CN109889837B (zh) * 2019-03-12 2022-05-27 电子科技大学 最优拉格朗日乘子基准定点标定方法
CN112153385B (zh) * 2020-11-25 2021-03-02 腾讯科技(深圳)有限公司 编码处理方法、装置、设备及存储介质
CN112637608B (zh) * 2020-12-18 2022-11-29 南京邮电大学 一种动态点云几何信息压缩率失真优化方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1471319A (zh) * 2002-07-22 2004-01-28 中国科学院计算技术研究所 结合率失真优化的码率控制的方法及其装置
CN101674480A (zh) * 2009-10-21 2010-03-17 杭州华三通信技术有限公司 一种编码模式的选择方法和装置
CN104796705A (zh) * 2015-04-22 2015-07-22 福州大学 一种基于ssim的hevc视频编码率失真优化与码率控制算法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1471319A (zh) * 2002-07-22 2004-01-28 中国科学院计算技术研究所 结合率失真优化的码率控制的方法及其装置
CN101674480A (zh) * 2009-10-21 2010-03-17 杭州华三通信技术有限公司 一种编码模式的选择方法和装置
CN104796705A (zh) * 2015-04-22 2015-07-22 福州大学 一种基于ssim的hevc视频编码率失真优化与码率控制算法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
不依赖于量化参数的视频编码控制优;袁武 等;《计算机学报》;20110831;第34卷(第8期);第1519-1527页 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022164853A1 (en) * 2021-01-26 2022-08-04 Meta Platforms, Inc. Dynamically biasing mode selection in video encoding

Also Published As

Publication number Publication date
CN107846593A (zh) 2018-03-27

Similar Documents

Publication Publication Date Title
CN107846593B (zh) 一种率失真优化方法及装置
JP6275889B2 (ja) 縮小された予測動きベクトルの候補に基づいて、動きベクトルを符号化/復号化する方法及び装置
US10841583B2 (en) Coding unit depth determining method and apparatus
JP4898467B2 (ja) 可変ブロックサイズ動き予測のための符号化モードの決定方法及び装置
CN102137263B (zh) 基于cnm关键帧分类的分布式视频编码及解码方法
CN102301716B (zh) 解码代表画面序列的流的方法,编码画面序列的方法以及编码的数据结构
JP2006140758A (ja) 動画像符号化方法、動画像符号化装置および動画像符号化プログラム
CN103873861A (zh) 一种用于hevc的编码模式选择方法
CN102413323B (zh) 一种基于h.264的视频压缩方法
CN102932642B (zh) 一种帧间编码快速模式选择方法
CN104320657B (zh) Hevc无损视频编码的预测模式选择方法及相应的编码方法
US9210435B2 (en) Video encoding method and apparatus for estimating a code amount based on bit string length and symbol occurrence frequency
KR20110003438A (ko) 움직임 추정 방법, 시스템 및 컴퓨터 판독가능 매체
KR20090081672A (ko) 시공간적 복잡도를 이용한 부호화 모드 결정 방법 및 장치
CN103733621A (zh) 基于低复杂度差错传播追踪的速率失真优化的视频编码模式选择
CN104796705A (zh) 一种基于ssim的hevc视频编码率失真优化与码率控制算法
CN102595130B (zh) 图像编码装置和图像解码装置
CN101331773B (zh) 使用速率失真特性进行速率受控视频编码的装置和方法
CN103248895A (zh) 一种用于hevc帧内编码的快速模式估计方法
TW201301900A (zh) 視訊解碼器之編碼成位元串之解碼方法
CN103945222A (zh) 一种基于hevc视频编码标准的码率控制模型更新方法
CN101313581A (zh) 视频图像编码方法及设备
CN106060555A (zh) 一种基于多核处理器的编码器
WO2022021422A1 (zh) 视频编码方法、编码器、系统以及计算机存储介质
Van et al. Fast motion estimation for closed-loop HEVC transrating

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant