CN107040782B - 基于拉格朗日方法的视频编码全局率失真优化方法 - Google Patents

基于拉格朗日方法的视频编码全局率失真优化方法 Download PDF

Info

Publication number
CN107040782B
CN107040782B CN201710265099.1A CN201710265099A CN107040782B CN 107040782 B CN107040782 B CN 107040782B CN 201710265099 A CN201710265099 A CN 201710265099A CN 107040782 B CN107040782 B CN 107040782B
Authority
CN
China
Prior art keywords
satd
block
referenced
rate
pixel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710265099.1A
Other languages
English (en)
Other versions
CN107040782A (zh
Inventor
王向文
张娜娜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai University of Electric Power
Original Assignee
Shanghai University of Electric Power
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai University of Electric Power filed Critical Shanghai University of Electric Power
Priority to CN201710265099.1A priority Critical patent/CN107040782B/zh
Publication of CN107040782A publication Critical patent/CN107040782A/zh
Application granted granted Critical
Publication of CN107040782B publication Critical patent/CN107040782B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/19Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding using optimisation based on Lagrange multipliers

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明涉及一种基于拉格朗日方法的视频编码全局率失真优化方法,本发明基于标准的视频编码标准,如AVS,H.264以及HEVC等。首先进行基于运动估计的预分析,分析出待编码图像的每一像素的编码失真对其以后编码图像的率失真的影响因子;随后利用该率失真传递因子,在编码时,计算出每个编码块单元的率失真传递因子,对基于拉格朗日优化方法中的率失真优化方法中的率失真代价值计算方案进行调整。基于调整后的率失真代价值进行视频编码参数的选择,以此提高率失真性能。该方法通过解耦编码单元率失真性能的相互依赖关系,通过一次简单的运动估计预分析和一次编码,可以达到接近全局优化的率失真性能。在节省编码复杂度同时,大大提高了编码率失真性能。

Description

基于拉格朗日方法的视频编码全局率失真优化方法
技术领域
本发明涉及一种视频编码通信技术,特别涉及一种基于拉格朗日方法的视频编码全局率失真优化方法。
背景技术
视频编码的率失真优化是针对编码失真和比特数之间的一种约束关系的优化,在满足该图像组编码比特数限制的情况下获取一组失真最小的编码参数集,即在目标比特数RT的约束下实现失真的最小化:
其中N表示图像组的图像数,Di和Ri表示第i幅图像的失真和比特数。
拉格朗日优化方法就是将这种约束问题转化为等价的无约束问题:
其中J和λ分别表示率失真代价和拉格朗日因子。
如果假设图像间的编码比特数和失真互不相关,如目前绝大多数视频编码器设计方案,如AVS、H.264以及HEVC视频编码器方案,那么总的率失真优化可以通过独立优化每一幅图像每一个编码单元的率失真来实现,即等效为
然而,在实际的视频编码中,广泛的应用了帧间预测编码技术,这种帧间预测技术使得前后图像编码单元的编码比特数和失真具有一定的相互依赖关系,如果简单忽略这种依赖关系,通过假设各个编码单元之间率失真性能是独立的,进行如(3)所示进行模式选择、编码块大小选择以及运动估计,达不到全局最优的率失真性能。因此为了提高编码性能以节省码率或者提高图像质量,在编码时必须考虑前后编码单元的率失真的依赖关系。
目前,有一些关于全局率失真优化的策略已经被提出。但是,那些策略的计算复杂度很高,需要进行多次编码,或者在编码第一个编码单元时就需要所有以后的编码单元信息,这些策略在实际中并不适用。典型的策略如:解决依赖性率失真优化的动态规划策略(K.Ramchandran and M.Vetterli,"Best wavelet packet bases in a rate-distortionsense",IEEE Trans.on Image Processing,vol.2,no.2,pp.160-175,Apr.1993),需要编码的次数非常多,其复杂度是需要编码单元的指数次,很难在实际中应用。这类的算法并不适合于实时编码场合。
发明内容
本发明是针对传统视频编码的全局率失真优化存在的问题,提出了一种基于拉格朗日方法的视频编码全局率失真优化方法,基于拉格朗日优化方法,本发明通过修改率失真优化中的率失真代价计算公式,对有依赖关系的全局率失真优化进行解耦,实现单次编码就能获得较高的全局率失真性能。
本发明的技术方案为:一种基于拉格朗日方法的视频编码全局率失真优化方法,具体包括如下步骤:
1)选定编码标准,并明确一种帧结构,选帧结构为:直接按照后一帧图像参考前一帧图像的帧结构或者将帧结构与最后编码的帧结构保持一致,最后编码帧结构在H.264/AVC中的IPPP…或IBBPBBP…帧结构以及HEVC中的标准Low Delay和Hierarchical B帧结构中选择,根据帧结构把每一帧分为帧内预测I帧和帧间预测P/B帧;
对于I帧,把每一帧图像分成固定大小块,根据编码标准所允许的预测方式进行预测。获得每一个块的预测残差块,求预测残差块的SATD值,再除以块内像素个数,获得每个像素的预测残差SATD值,记为Satd_resi(x,y),其中SATD表示哈达玛变换后系数的绝对值的和;
2)对于P/B帧,把每一帧图像分成固定大小块,对每个块进行运动估计,获得每个块的运动矢量;
3)按顺序对一个块采用其运动矢量做运动补偿,求出该块的预测残差块,进而求预测残差块的SATD值,SATD值除以块内像素个数,获得每个像素的预测残差SATD值,记为Satd_resi(x,y),(x,y)为该像素的坐标;
继续采用运动矢量在被参考图像中找到被参考块位置,所求得的Satd_resi(x,y)值即为被参考块内每个被参考像素的被参考SATD值,被参考像素坐标为(x+Δx,y+Δy),因此被参考像素的被参考SATD值即为Satd_refed(x+Δx,y+Δy)=Satd_resi(x,y);
4)对所有P/B帧的所有块进行步骤3)操作,可计算出所有被参考帧内所有像素的预测残差Satd_resi(x,y)值;
对所有P/B帧的所有块进行步骤3)操作还得到所有被参考像素的被参考次数,记为K(x,y),以及每次被参考的SATD值,记为Satd_refedk(x,y),k代表第k次被参考;
Satd_refedk(x,y)值和Satd_refed(x+Δx,y+Δy)之间通过运动矢量映射赋值,具体如下:令第k次来参考的像素坐标为(xk,yk),运动矢量为MVk=(Δxk,Δyk),赋值满足坐标关系:(xk+Δxk,yk+Δyk)=(x,,y)因此赋值公式:Satd_refedk(x,y)=Satd_refed(xk+Δxk,yk+Δyk);
以上4步为预分析,接下来进行视频编码,采用如下方法进行模式选择和运估计:
5)根据Satd_resi(x,y),K(x,y)以及每次被参考的Satd_refedk(x,y),计算出将要编码块的率失真传递因子β,方法如下:
其中M为编码块内像素个数,m为块内像素的坐标索引号,K则为对应第m个像素总共被参考的次数,mk为块内第m个像素被第k次参考的索引号,(x,y)为块内第m个像素的坐标;
6)在编码率失真优化的模式选择和运动估计环节,率失真代价值计算公式如下:
其中O*为视频编码的优化编码参数集,δi(Oi)和r(Oi)分别表示由编码参数集Oi所产生的失真和码率,λ为拉格朗日因子,运动估计过程中的δi(Oi)为残差图像的绝对差和,而拉格朗日因子则是以上λ的开根号值。
本发明的有益效果在于:本发明基于拉格朗日方法的视频编码全局率失真优化方法,该方法通过解耦编码单元率失真性能的相互依赖关系,只需通过一次基于运动估计的预分析和一次编码,可以达到接近全局优化的率失真性能。在节省编码复杂度同时,大大提高了编码率失真性能。
具体实施方式
一种基于拉格朗日方法的视频编码全局率失真优化方法,具体包括如下步骤:
1)选定编码标准,并明确一种帧结构,选帧结构如:直接按照后一帧图像参考前一帧图像的帧结构或者将帧结构与最后编码的帧结构保持一致,最后编码帧结构可以如H.264/AVC中的IPPP…或IBBPBBP…帧结构以及HEVC中的标准Low Delay和Hierarchical B帧结构,根据帧结构把每一帧分为帧内预测I帧和帧间预测P/B帧。对于I帧,把每一帧图像分成固定大小块,根据编码标准所允许的预测方式进行预测。获得每一个块的预测残差块,求预测残差块的SATD值,再除以块内像素个数,获得每个像素的预测残差SATD值,记为Satd_resi(x,y)。其中SATD表示哈达玛变换后系数的绝对值的和。
2)对于P/B帧,把每一帧图像分成固定大小块,对每个块进行运动估计,获得每个块的运动矢量。
3)按顺序对一个块采用其运动矢量做运动补偿,求出该块的预测残差块,进而求预测残差块的SATD值,SATD值除以块内像素个数,获得每个像素的预测残差SATD值,记为Satd_resi(x,y),(x,y)为该像素的坐标。继续采用运动矢量在被参考图像中找到被参考块位置,所求得的Satd_resi(x,y)值即为被参考块内每个被参考像素的被参考SATD值,被参考像素坐标为(x+Δx,y+Δy),因此被参考像素的被参考SATD值即为Satd_refed(x+Δx,y+Δy)=Satd_resi(x,y)。
4)对所有P/B帧的所有块进行3)操作,可计算出所有被参考帧内所有像素的预测残差Satd_resi(x,y)值。由于运动矢量MV的值自动确定并且一般视频编码标准允许多参考帧,因此每个像素可能被多次参考。对所有P/B帧的所有块进行3)操作还可以得到所有被参考像素的被参考次数,记为K(x,y),以及每次被参考的SATD值,记为Satd_refedk(x,y),k代表第k次被参考。Satd_refedk(x,y)值和Satd_refed(x+Δx,y+Δy)之间通过运动矢量映射赋值。具体如下:令第k次来参考的像素坐标为(xk,yk),运动矢量为MVk=(Δxk,Δyk),赋值满足坐标关系:(xk+Δxk,yk+Δyk)=(x,y)。因此赋值公式:Satd_refedk(x,y)=Satd_refed(xk+Δxk,yk+Δyk)。
以上4步为预分析,接下来进行视频编码,本专利采用如下方法进行模式选择和运估计:
5)根据Satd_resi(x,y),K(x,y)以及每次被参考的Satd_refedk(x,y),计算出将要编码块的率失真传递因子β,方法如下:
其中M为编码块内像素个数,m为块内像素的坐标索引号,K则为对应第m个像素总共被参考的次数,mk为块内第m个像素被第k次参考的索引号,(x,y)为块内第m个像素的坐标。
6)在编码率失真优化的模式选择和运动估计环节,率失真代价值计算公式如下:
其中O*为视频编码的优化编码参数集,δi(Oi)和r(Oi)分别表示由编码参数集Oi所产生的失真和码率,λ为拉格朗日因子,运动估计过程中的δi(Oi)为残差图像的绝对差和,而拉格朗日因子则是以上λ的开根号值。
基于调整后的率失真代价值进行视频编码参数的选择,以此提高率失真性能。该方法通过解耦编码单元率失真性能的相互依赖关系,通过一次简单的运动估计预分析和一次编码,可以达到接近全局优化的率失真性能。在节省编码复杂度同时,大大提高了编码率失真性能。

Claims (1)

1.一种基于拉格朗日方法的视频编码全局率失真优化方法,其特征在于,具体包括如下步骤:
1)选定编码标准,并明确一种帧结构,选帧结构为:直接按照后一帧图像参考前一帧图像的帧结构或者将帧结构与最后编码的帧结构保持一致,最后编码帧结构在H.264/AVC中的IPPP…或IBBPBBP…帧结构以及HEVC中的标准Low Delay和Hierarchical B帧结构中选择,根据帧结构把每一帧分为帧内预测I帧和帧间预测P/B帧;
对于I帧,把每一帧图像分成固定大小块,根据编码标准所允许的预测方式进行预测,获得每一个块的预测残差块,求预测残差块的SATD值,再除以块内像素个数,获得每个像素的预测残差SATD值,记为Satd_resi(x,y),其中SATD表示哈达玛变换后系数的绝对值的和;
2)对于P/B帧,把每一帧图像分成固定大小块,对每个块进行运动估计,获得每个块的运动矢量;
3)按顺序对一个块采用其运动矢量做运动补偿,求出该块的预测残差块,进而求预测残差块的SATD值,SATD值除以块内像素个数,获得每个像素的预测残差SATD值,记为Satd_resi(x,y),(x,y)为该像素的坐标;
继续采用运动矢量在被参考图像中找到被参考块位置,所求得的Satd_resi(x,y)值即为被参考块内每个被参考像素的被参考SATD值,被参考像素坐标为(x+Δx,y+Δy),因此被参考像素的被参考SATD值即为Satd_refed(x+Δx,y+Δy)=Satd_resi(x,y);
4)对所有P/B帧的所有块进行步骤3)操作,可计算出所有被参考帧内所有像素的预测残差Satd_resi(x,y)值;
对所有P/B帧的所有块进行步骤3)操作还得到所有被参考像素的被参考次数,记为K(x,y),以及每次被参考的SATD值,记为Satd_refedk(x,y),k代表第k次被参考;
Satd_refedk(x,y)值和Satd_refed(x+Δx,y+Δy)之间通过运动矢量映射赋值,具体如下:令第k次来参考的像素坐标为(xk,yk),运动矢量为MVk=(Δxk,Δyk),赋值满足坐标关系:(xk+Δxk,yk+Δyk)=(x,y),因此赋值公式:Satd_refedk(x,y)=Satd_refed(xk+Δxk,yk+Δyk);
以上4步为预分析,接下来进行视频编码,采用如下方法进行模式选择和运估计:
5)根据Satd_resi(x,y),K(x,y)以及每次被参考的Satd_refedk(x,y),计算出将要编码块的率失真传递因子β,方法如下:
其中M为编码块内像素个数,m为块内像素的坐标索引号,K则为对应第m个像素总共被参考的次数,mk为块内第m个像素被第k次参考的索引号,(x,y)为块内第m个像素的坐标;
6)在编码率失真优化的模式选择和运动估计环节,率失真代价值计算公式如下:
其中O*为视频编码的优化编码参数集,δi(Oi)和r(Oi)分别表示由编码参数集Oi所产生的失真和码率,λ为拉格朗日因子,运动估计过程中的δi(Oi)为残差图像的绝对差和,而拉格朗日因子则是以上λ的开根号值。
CN201710265099.1A 2017-04-21 2017-04-21 基于拉格朗日方法的视频编码全局率失真优化方法 Active CN107040782B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710265099.1A CN107040782B (zh) 2017-04-21 2017-04-21 基于拉格朗日方法的视频编码全局率失真优化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710265099.1A CN107040782B (zh) 2017-04-21 2017-04-21 基于拉格朗日方法的视频编码全局率失真优化方法

Publications (2)

Publication Number Publication Date
CN107040782A CN107040782A (zh) 2017-08-11
CN107040782B true CN107040782B (zh) 2019-10-01

Family

ID=59535093

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710265099.1A Active CN107040782B (zh) 2017-04-21 2017-04-21 基于拉格朗日方法的视频编码全局率失真优化方法

Country Status (1)

Country Link
CN (1) CN107040782B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107277506B (zh) * 2017-08-15 2019-12-03 中南大学 基于自适应运动矢量精度的运动矢量精度选择方法及装置
CN108235018B (zh) * 2017-12-13 2019-12-27 北京大学 一种基于拉格朗日乘子模型的点云帧内编码优化方法及装置
CN109889837B (zh) * 2019-03-12 2022-05-27 电子科技大学 最优拉格朗日乘子基准定点标定方法
CN110933430B (zh) * 2019-12-16 2022-03-25 电子科技大学 二次编码优化方法
CN112422975A (zh) * 2020-11-13 2021-02-26 电子科技大学 一种基于二维层次编码结构的光场集成图片编码优化方法
CN114554224B (zh) * 2021-09-10 2023-10-27 电子科技大学 基于核心参考帧的块级拉格朗日乘子优化方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1727370A1 (en) * 2005-05-25 2006-11-29 Thomson Licensing Rate-distortion based video coding mode selection foreseeing the esitmation of bit rate and distortion using a simplified transform on low activity prediction residuals
CN101771870A (zh) * 2009-01-06 2010-07-07 上海中科计算技术研究所 一种视频编码技术中块运动匹配的快速搜索方法
US8155195B2 (en) * 2006-04-07 2012-04-10 Microsoft Corporation Switching distortion metrics during motion estimation
CN102752596A (zh) * 2012-07-05 2012-10-24 深圳广晟信源技术有限公司 一种率失真优化方法
CN104469336A (zh) * 2013-09-25 2015-03-25 中国科学院深圳先进技术研究院 多视点深度视频信号的编码方法
CN106534855A (zh) * 2016-11-04 2017-03-22 西安理工大学 一种面向satd的拉格朗日因子计算方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070014365A1 (en) * 2005-07-18 2007-01-18 Macinnis Alexander Method and system for motion estimation
JP4752631B2 (ja) * 2006-06-08 2011-08-17 株式会社日立製作所 画像符号化装置、及び画像符号化方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1727370A1 (en) * 2005-05-25 2006-11-29 Thomson Licensing Rate-distortion based video coding mode selection foreseeing the esitmation of bit rate and distortion using a simplified transform on low activity prediction residuals
US8155195B2 (en) * 2006-04-07 2012-04-10 Microsoft Corporation Switching distortion metrics during motion estimation
CN101771870A (zh) * 2009-01-06 2010-07-07 上海中科计算技术研究所 一种视频编码技术中块运动匹配的快速搜索方法
CN102752596A (zh) * 2012-07-05 2012-10-24 深圳广晟信源技术有限公司 一种率失真优化方法
CN104469336A (zh) * 2013-09-25 2015-03-25 中国科学院深圳先进技术研究院 多视点深度视频信号的编码方法
CN106534855A (zh) * 2016-11-04 2017-03-22 西安理工大学 一种面向satd的拉格朗日因子计算方法

Also Published As

Publication number Publication date
CN107040782A (zh) 2017-08-11

Similar Documents

Publication Publication Date Title
CN107040782B (zh) 基于拉格朗日方法的视频编码全局率失真优化方法
CN103248893B (zh) 从h.264/avc标准到hevc标准的快速帧间转码方法及其转码器
CN110087087A (zh) Vvc帧间编码单元预测模式提前决策及块划分提前终止方法
CN105338357B (zh) 一种分布式视频压缩感知编解码方法
CN107071422B (zh) 基于图像相关模型的低复杂度hevc码率适配转换编码方法
CN101247525B (zh) 一种提高图像帧内编码速率的方法
TW201004357A (en) Rate-distortion quantization for context-adaptive variable length coding (CAVLC)
CN104702950A (zh) 以帧内预测模式解码图像的方法
CN103442228B (zh) 从h.264/avc标准到hevc标准的快速帧内转码方法及其转码器
CN101860748A (zh) 基于分布式视频编码的边信息生成系统及方法
CN107623850A (zh) 一种基于时空相关性的快速屏幕内容编码方法
CN101022555B (zh) 帧间预测编码的模式快速选择方法
CN104702959B (zh) 一种视频编码的帧内预测方法及系统
CN106210721A (zh) 一种hevc快速码率转码方法
CN102932642A (zh) 一种帧间编码快速模式选择方法
CN102186081B (zh) 一种基于梯度向量的h.264帧内模式选择方法
CN107018412B (zh) 一种基于关键帧编码单元划分模式的dvc-hevc视频转码方法
CN105681797A (zh) 一种基于预测残差的dvc-hevc视频转码方法
CN110365975A (zh) 一种avs2视频编解码标准优化方案
CN101304529A (zh) 宏块模式的选择方法和装置
CN110351552B (zh) 视频编码中一种快速编码方法
CN106101709A (zh) 一种联合增强层的shvc质量可分级的基本层帧间预测方法
CN103442229B (zh) 适用于hevc标准的编码器中sao模式判决的比特率估计方法
CN101102492A (zh) 实现基于感兴趣区域的压缩域mpeg-2到h.264视频转换的方法
CN105611301B (zh) 基于小波域残差的分布式视频编解码方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant