CN105872544A - 低延迟视频编码中时域率失真优化方法 - Google Patents
低延迟视频编码中时域率失真优化方法 Download PDFInfo
- Publication number
- CN105872544A CN105872544A CN201610242849.9A CN201610242849A CN105872544A CN 105872544 A CN105872544 A CN 105872544A CN 201610242849 A CN201610242849 A CN 201610242849A CN 105872544 A CN105872544 A CN 105872544A
- Authority
- CN
- China
- Prior art keywords
- frame
- unit
- distortion
- time domain
- coding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/147—Data rate or code amount at the encoder output according to rate distortion criteria
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本发明属于视频编码技术领域,尤其涉及低延迟视频编码中基于时域依赖性的率失真优化方法。本发明采用循环的图像组(group of picture,GOP)结构,每4帧为一个GOP,将所述GOP内的帧分别分配到不同的层,相同层的帧遵循相似的参考帧及QP分配规则。分析低延迟编码中层次结构的时域依赖性,并根据低延迟编码中时域依赖性建立时域传播链,如图2所示,进而进行时域依赖性的率失真优化建模。求取传播因子ωa和全局拉格朗日乘子λg。最后,本发明根据传播因子ωa,仅通过对全局拉格朗日乘子λg的调整实现时域率失真优化。
Description
技术领域
本发明属于视频编码技术领域,尤其涉及低延迟视频编码中基于时域依赖性的率失真优化方法。
背景技术
为了顺应视频高清化的趋势,新一代视频编码标准HEVC于2013年初制定完成,较前一代标准H.264/AVC性能提升了近1倍。许多新的技术被HEVC接受,其中包括四叉树块分割,更多的帧内模式,合并模式,层次编码结构。其中,层次编码结构是一种配合编码质量调整的参考帧管理方法,以实时编解码为目标,尽可能的降低时延。
率失真优化技术致力于在目标码率限制下最小化编码失真,在传统视频编解码框架下通常采用拉格朗日乘子法解上述问题,即min{J},where J=Di+λRi,其中,Ri表示一个当前编码单元的码率,Di表示当前编码单元的失真。该方法对每一个编码单元进行独立编码优化,将各个单元最优编码结果作为整个视频序列的最优结果,忽视了各编码单元之间的相关性。文献“E.H.Yang and X.Yu,“Rate Distortion Optimization forH.264Interframe Coding:A General Framework and Algorithms”,IEEE Trans.ImageProcessing,vol.16,no.7,pp.1774-1784,July.2007”考虑各编码单元相关性,采用动态规划方法联合所有编码单元进行全局率失真优化,复杂度高,无法实时实现,但该方法从侧面证明全局率失真优化可以提升编码性能。
文献“T.W.Yang,C.Zhu and X.J.Fan,Q.Peng,“Source distortion temporalpropagation model for motion compensated video coding optimization,”IEEEInternational Conference on Multimedia and Expo(ICME 2012),Melbourne,Australia,Jul.2012,pp.85-90.”,考虑非层次编码中时域依赖关系,如H.264/AVC中编码结构,其中单参考帧的使用具有绝对优势,探索全局率失真优化实现方法。具体来说,获得一组视频编码参数,使得在一定的码率限制下最小化整个序列的编码失真,归纳为其中,oi表示第i个编码单元的编码参数,如编码模式,运动矢量,参考帧索引,量化参数,量化后的变换系数等,N代表在整个序列中具有时域依赖性的编码单元个数(假设每帧一个),λg为全局拉格朗日乘子,并简化为 *代表该编码模式为假设可以得到最优编码参数。在新一代标准HEVC中,采用层次编码结构,如在低延迟编码中的编码结构,极大的提升了编码效率,其中多参考帧的使用占绝对优势,使得时域中多个编码单元之间存在依赖关系,因此相对非层次编码结构,层次编码结构的依赖关系更复杂。而且低延迟编码结构仅仅给出了固定的层次编码结构,并没有根据动态变化的时域依赖性进行率失真优化,需要重新探索适用于新一代标准HEVC,在低延迟视频编码中基于时域依赖性的率失真优化方法。
发明内容
本发明根据时域依赖性的动态变化特性,提出了一种在低延迟视频编码中时域率失真优化方法。
本发明的技术方案为:
在HEVC延迟视频编码默认配置中,采用循环的图像组(group of picture,GOP)结构,每4帧为一个GOP,将所述GOP内的帧分别分配到不同的层,相同层的帧遵循相似的参考帧及QP分配规则。分析低延迟编码中层次结构的时域依赖性,并根据低延迟编码中时域依赖性建立时域传播链,如图2所示,进而进行时域依赖性的率失真优化建模。求取传播因子ωa和全局拉格朗日乘子λg。最后,本发明根据传播因子ωa,仅通过对全局拉格朗日乘子λg的调整实现时域率失真优化。
为了方便对本发明进行描述,现在对HEVC中低延迟视频编码结构进行介绍:
HEVC中低延迟视频编码结构为:
每4帧为一个GOP,将所述GOP内的帧分别分配到不同的层,相同层的帧遵循一定的参考帧管理规则及QP分配规则,每帧的POC代表该帧在整个编码序列中的绝对播放顺序号,每帧的rPOC代表该帧在所属GOP中的相对播放顺序号,如图1,每个GOP的第一帧的rPOC=1,具有相同rPOC的帧具有相同的参考帧管理方法及QP分配规则,如表1所示,Ref 1/2/3/4代表第一/二/三/四个参考帧,所述量化参数(quantization parameter,QP)分配规则具体为:分配给第1层中的编码单元最小的QP补偿值,因此拥有最低的QP,随着层数增加QP也增加,第1层的视频帧称作关键帧,即key帧,获得相对较高的视频质量,为在其他层中的视频帧提供更好的参考帧,在整个视频范围内获得更好的编码质量,所述一定的参考帧管理规则为:每帧有四个参考帧,所述四个参考帧分别为前一帧和前向最近的三个key帧(在低延迟视频编码中编码顺序和解码顺序一致,只考虑前向参考,所述前向参考为前向参考帧的图像播放顺序(picture order count,POC)小于当前帧的POC,本发明通过统计实验得到各参考帧被参考比例,如表2所示:rPOC=1的帧以前一帧为参考帧的比例最大,rPOC=2、3、4的帧以前一帧及前向最近的key帧为参考帧的参考比例相对最大。
低延迟视频编码中时域率失真优化方法,具体步骤如下:
S1、根据低延迟视频编码中时域依赖性,建立时域传播链,其中,所述时域传播链具有如下特性:低延迟视频编码中每个GOP中第一帧,即rPOC=1的帧仅考虑前一帧对其的影响,每个GOP内的其他三帧,即rPOC=2、3、4的帧仅考虑前一帧及前向最近的key帧对其的影响,如图2所示;
S2、建立当前编码单元Ui的时域率失真优化目标方程其中,i=1,2,3,...,N,N表示低延迟视频编码的总帧数,A代表一帧中所有的编码单元,为Uj的期望失真,oi表示第i个编码单元的编码参数,Ri(oi)表示第i个编码单元的码率,Di为当前编码单元的失真,表示第j个受到当前编码单元Ui影响的后续编码单元的失真,λg为全局拉格朗日乘子,*代表编码模式为可以得到的最优编码参数,定义当前编码单元Ui为帧fi中第a个编码单元,j=i+1,...,N,a=1,2,3,...,A;
S3、根据S2所述时域率失真优化目标方程,求受到当前编码单元Ui影响的后续编码单元的期望失真具体为:rPOC=1的帧中的编码单元Ui+4m+1的期望失真为E(Di+4m+1),rPOC=2的帧中的编码单元Ui+4m+2的期望失真为E(Di+4m+2),rPOC=3的帧中的编码单元Ui+4m+3的期望失真为E(Di+4m+3),rPOC=4的帧中的编码单元Ui+4m+4的期望失真为E(Di+4m+4),其中,Ki+4m+1为常数,Pi+4m,i+4m+1代表在帧fi+4m+1中以fi+4m为参考帧的块的比例, 其中,Ki+4m+2为常数,Pi+4m+1,i+4m+2代表在帧fi+4m+2中以fi+4m+1为参考帧的块的比例,Pi+4m,i+4m+2代表在帧fi+4m+2中以fi+4m为参考帧的块的比例, 其中,Ki+4m+3为常数,Pi+4m+2,i+4m+3代表在帧fi+4m+3中以fi+4m+2为参考帧的块的比例,Px+4m,i+4m+3代表在帧fi+4m+3中以fi+4m为参考帧的块的比例, Ki+4m+4为常数,Pi+4m+3,i+4m+4代表在帧fi+4m+4中以fi+4m+3为参考帧的块的比例,Pi+4m,i+4m+4代表在帧fi+4m+4中以fi+4m为参考帧的块的比例,m=0,1,2,...,M表示第m个GOP,共有M个GOP,o1上标“1”表示前一帧为参考帧,o2上标“2”表示前向最近key帧为参考帧;
S4、将所述S3中的受到当前编码单元Ui影响的后续编码单元的期望失真代入S2所述当前编码单元Ui的时域率失真优化目标方程,并删除所有常数项K*,进行简化,具体简化为:
当前编码单元Ui属于key帧(rPOC=4)时,则简化为:
当前编码单元Ui所在非key帧的rPOC分别为1、2、3时,则简化为:
S5、求S4中所述目标方程中的当前编码单元Ui及后续编码单元的失真,具体步骤为:
βi+4m,i+4m+1表示编码单元Ui+4m对Ui+4m+1的影响程度的经验值,βi+4m,i+4m+1=α·F(θi+4m,i+4m+1),且F(θ)为经验值,原始编码单元Ui+4m与Ui+4m+1的运动补偿误差,α为常数,
βi+4m+1,i+4m+2表示编码单元Ui+4m+1对Ui+4m+2的影响程度的经验值,βi+4m+1,i+4m+2=α·F(θi+4m+1,i+4m+2),且 原始编码单元Ui+4m+1与Ui+4m+2的运动补偿误差,
βi+4m,i+4m+2表示编码单元Ui+4m对Ui+4m+2的影响程度的经验值,βi+4m,i+4m+2=α·F(θi+4m,i+4m+2),且 原始编码单元Ui+4m与Ui+4m+2的运动补偿误差,
βi+4m+2,i+4m+3表示编码单元Ui+4m+2对Ui+4m+3的影响程度的经验值,βi+4m+2,i+4m+3=α·F(θi+4m+2,i+4m+3),且 原始编码单元Ui+4m+2与Ui+4m+3的运动补偿误差,
βi+4m,i+4m+3表示编码单元Ui+4m对Ui+4m+3的影响程度的经验值,βi+4m,i+4m+3=α·F(θi+4m,i+4m+3),且 原始编码单元Ui+4m与Ui+4m+3的运动补偿误差,
βi+4m+3,i+4m+4表示编码单元Ui+4m+3对Ui+4m+4的影响程度的经验值,βi+4m+3,i+4m+4=α·F(θi+4m+3,i+4m+4),且 原始编码单元Ui+4m+3与Ui+4m+4的运动补偿误差,
βi+4m,i+4m+4表示编码单元Ui+4m对Ui+4m+4的影响程度的经验值,βi+4m,i+4m+4=α·F(θi+4m,i+4m+4),且 原始编码单元Ui+4m与Ui+4m+4的运动补偿误差;
S6、将S5中所述当前编码单元Ui及后续编码单元的失真代入S4中所述当前编码单元Ui的时域率失真优化目标方程,得到所述ωa为传播因子,具体为:
当前编码单元Ui属于key帧时,
当前编码单元Ui属于非key帧时,
,其中,β=α·F(θ),且m=1,2,3,...,M,M为一个测试序列的GOP总数;
S7、将全局拉格朗日乘子λg和S6所述传播因子ωa代入进行时域率失真优化,初始化当前帧的λg为λHM,λHM为标准HEVC中设定的当前帧的拉格朗日乘子;
S8、依次对当前帧中A个编码单元,进行步骤S2-S7的所述的率失真优化处理;
S9、对S7所述全局拉格朗日乘子λg进行更新,更新得到其中,A代表一帧中所有的编码单元,为Ui的时域累积失真;
S10、对S1所述低延迟视频编码中其他帧进行步骤S2-S9的所述率失真优化处理。
进一步地,S5所述α为0.94±0.3。
进一步地,S5所述F(θ)的取值范围为(0,1]。
本发明的有益效果是:
与高复杂度的全局率失真优化方案不同,本发明提出了一种可操作的、高效的时域率失真优化方案,并在新一代视频编码标准HEVC中低延迟层次结构下实现,在HEVC的低延迟P帧及B帧测试条件下,包括16个测试序列,4种不同分辨率(1080p,720p,WVGA,WQVGA),分别获得平均增益2.9%、2.8%,其中背景不变序列“FourPeople”获得编码增益为7.2%,本方案适用于背景不变或者运动缓慢的序列,如新闻、视频会议、监控视频等。
附图说明
图1低延迟层次编码结构。
图2低延迟视频编码中时域传播链。
图3在时域中具有依赖性的编码块的确定。
图4序列FourPeople在Low-delay P下率失真曲线图。
图5为本发明的流程图。
具体实施方式
下面结合实施例和附图,详细说明本发明的技术方案。
实施例采用开发环境为Visual Studio2008,实施例基于HEVC的参考软件HM13.0进行实现。
如图5所示:
S1、分析低延迟编码中层次结构的时域依赖性,并根据低延迟编码中时域依赖性建立时域传播链,即第i个编码单元Ui在key帧fi中,所述Ui的后向受影响编码单元为Ui+1,Ui+2,...,考虑第第i个编码单元Ui在非key帧fi′中,所述Ui的后向受影响编码单元为Ui+1,Ui+2,…。
Ui+1的确定:以Ui为起点,在下一帧fi+1中进行运动估计搜索得到Ui+1。
Ui+2的确定:以Ui为起点,在下一帧fi+2中进行运动估计搜索得到U"i+2,以Ui+1为起点,在下一帧fi+2中进行运动估计搜索得到U′i+2,U′i+2与U′i+2的中间位置为Ui+2,
其中,i=1,2,3,...,N,N代表在整个编码序列中的帧数,Ui为当前编码单元,所述Ui的后向受影响编码单元的确定具体方式如图3所示,其中,所述层次结构具体为:每4帧为一个GOP,将所述GOP内的帧分别分配到不同的层,相同层的帧遵循一定的参考帧管理规则及QP分配规则,每帧的POC代表该帧在整个编码序列中的绝对播放顺序号,每帧的rPOC代表该帧在所属GOP中的相对播放顺序号,如图1所示,每个GOP的第一帧的rPOC=1,具有相同rPOC的帧具有相同的参考帧管理方法及QP分配规则,如表1所示,Ref 1/2/3/4代表第一/二/三/四个参考帧,所述量化参数(quantization parameter,QP)分配规则具体为:分配给第1层中的编码单元最小的QP补偿值,因此拥有最低的QP,随着层数增加QP也增加,第1层的视频帧称作关键帧,即key帧,获得相对较高的视频质量,为在其他层中的视频帧提供更好的参考帧,在整个视频范围内获得更好的编码质量,所述一定的参考帧管理规则为:每帧有四个参考帧,所述四个参考帧分别为前一帧和前向最近的三个key帧(在低延迟视频编码中编码顺序和解码顺序一致,只考虑前向参考,所述前向参考为前向参考帧的图像播放顺序(picture order count,POC)小于当前帧的POC)。
表1低延迟视频编码中参考帧集合及量化参数设置
通过统计实验可以得到各参考帧被参考比例,如表2所示,rPOC=1的帧仅考虑前一帧对其的影响,rPOC=2、3、4的帧仅考虑前一帧及前向最近key帧对其的影响,连接时域传播链,如图2所示。
表2参考比例表
S2、建立第i个编码单元Ui在key帧fi中时域率失真优化目标方程其中,i=1,2,3,...,N,N表示低延迟视频编码的总帧数,A代表一帧中所有的编码单元,为Uj的期望失真,oi表示第i个编码单元的编码参数,Ri(oi)表示第i个编码单元的码率,Di为当前编码单元的失真,表示第j个受到当前编码单元Ui影响的后续编码单元的失真,λg为全局拉格朗日乘子,*代表编码模式为可以得到的最优编码参数,定义当前编码单元Ui为帧fi中第a个编码单元,j=i+1,...,N,a=1,2,3,...,A,*代表编码模式为可以得到的最优编码参数,所述编码参数包括编码模式,运动矢量,参考帧索引,量化参数和量化后的变换系数;
S3、根据S2所述时域率失真优化目标方程,求受到当前编码单元Ui影响的后续编码单元的期望失真
具体为:
rPOC=1的帧中的编码单元Ui+4m+1的期望失真为E(Di+4m+1),rPOC=2的帧中的编码单元Ui+4m+2的期望失真为E(Di+4m+2),rPOC=3的帧中的编码单元Ui+4m+3的期望失真为E(Di+4m+3),rPOC=4的帧中的编码单元Ui+4m+4的期望失真为E(Di+4m+4),其中,Ki+4m+1为常数,Pi+4m,i+4m+1代表在帧fi+4m+1中以fi+4m为参考帧的块的比例, 其中,Ki+4m+2为常数,Pi+4m+1,i+4m+2代表在帧fi+4m+2中以fi+4m+1为参考帧的块的比例,Pi+4m,i+4m+2代表在帧fi+4m+2中以fi+4m为参考帧的块的比例, 其中,Ki+4m+3为常数,Pi+4m+2,i+4m+3代表在帧fi+4m+3中以fi+4m+2为参考帧的块的比例,Pi+4m,i+4m+3代表在帧fi+4m+3中以fi+4m为参考帧的块的比例, Ki+4m+4为常数,Pi+4m+3,i+4m+4代表在帧fi+4m+4中以fi+4m+3为参考帧的块的比例,Pi+4m,i+4m+4代表在帧fi+4m+4中以fi+4m为参考帧的块的比例,m=0,1,2,...,M表示第m个GOP,共有M个GOP,o1上标“1”表示前一帧为参考帧,o2上标“2”表示前向最近key帧为参考帧;
S4、将所述S3中的受到当前编码单元Ui影响的后续编码单元的期望失真代入S2所述当前编码单元Ui的时域率失真优化目标方程,并删除所有常数项K*,进行简化,具体简化为:
当前编码单元Ui属于key帧(rPOC=4)时,则简化为:
当前编码单元Ui所在非key帧的rPOC分别为1、2、3时,则简化为:
S5、求S4中所述目标方程中的当前编码单元Ui及后续编码单元的失真,具体步骤为:
βi+4m,i+4m+1表示编码单元Ui+4m对Ui+4m+1的影响程度的经验值,βi+4m,i+4m+1=α·F(θi+4m,i+4m+1),且F(θ)为经验值,原始编码单元Ui+4m与Ui+4m+1的运动补偿误差,α为常数,
βi+4m+1,i+4m+2表示编码单元Ui+4m+1对Ui+4m+2的影响程度的经验值,βi+4m+1,i+4m+2=α·F(θi+4m+1,i+4m+2),且 原始编码单元Ui+4m+1与Ui+4m+2的运动补偿误差,
βi+4m,i+4m+2表示编码单元Ui+4m对Ui+4m+2的影响程度的经验值,βi+4m,i+4m+2=α·F(θi+4m,i+4m+2),且 原始编码单元Ui+4m与Ui+4m+2的运动补偿误差,
βi+4m+2,i+4m+3表示编码单元Ui+4m+2对Ui+4m+3的影响程度的经验值,βi+4m+2,i+4m+3=α·F(θi+4m+2,i+4m+3),且 原始编码单元Ui+4m+2与Ui+4m+3的运动补偿误差,
βi+4m,i+4m+3表示编码单元Ui+4m对Ui+4m+3的影响程度的经验值,βi+4m,i+4m+3=α·F(θi+4m,i+4m+3),且 原始编码单元Ui+4m与Ui+4m+3的运动补偿误差,
βi+4m+3,i+4m+4表示编码单元Ui+4m+3对Ui+4m+4的影响程度的经验值,βi+4m+3,i+4m+4=α·F(θi+4m+3,i+4m+4),且 原始编码单元Ui+4m+3与Ui+4m+4的运动补偿误差,
βi+4m,i+4m+4表示编码单元Ui+4m对Ui+4m+4的影响程度的经验值,βi+4m,i+4m+4=α·F(θi+4m,i+4m+4),且 原始编码单元Ui+4m与Ui+4m+4的运动补偿误差。
S6、将S5中所述当前编码单元Ui及后续编码单元的失真代入S4中所述当前编码单元Ui的时域率失真优化目标方程,得到所述ωa为传播因子,具体为:
当前编码单元Ui属于key帧时,
当前编码单元U属于非key帧时,
,其中,β=α·F(θ),且m=1,2,3,...,M,M为一个测试序列的GOP总数。
S7、将全局拉格朗日乘子λg和S6所述传播因子ωa代入进行时域率失真优化,初始化当前帧的λg为λHM,λHM为标准HEVC中设定的当前帧的拉格朗日乘子。
S8、依次对当前帧中A个编码单元,进行步骤S2-S7的所述的率失真优化处理。
S9、对S7所述全局拉格朗日乘子λg进行更新,更新得到其中,A代表一帧中所有的编码单元,为Ui的时域累积失真。
S10、对S1所述低延迟视频编码中其他帧进行步骤S2-S9的所述率失真优化处理。
例1、
如图2所示,将当前原始帧分成不重叠的16x16大小的编码单元,每个编码单元在下一原始帧中进行运动估计,得到最佳匹配单元,差值记作原始帧的运动补偿误差DOMCP。依次得到每个编码单元的DOMCP,具体的如同理获得整个序列所有帧中各个编码单元的DOMCP。同时,对key帧中的编码单元,仍需要在下一GOP中的三帧(rPOC为2、3、4)中寻找最佳匹配单元,并获得原始帧的运动补偿误差,如
如图3所示,在帧fi中实线框代表当前编码单元Ui,根据上述原始帧域运动估计,得到与其相关性最强的编码单元Ui+1,也即受编码Ui影响最大的块。以Ui+1为起点,使用与其重合最大的块(如虚线块)的运动矢量,在帧fi+2中寻找最匹配的块U′i+2(如实线块)。同时,当前编码单元Ui,可以直接在帧fi+2中寻找最佳匹配块U″i+2(如斜线块)。取块U′i+2和块U″i+2坐标平均值得到全黑块Ui+2。以此类推,可以确定时域中具有依赖关系的后续编码单元。
根据S6可知,为了求得传播因子ωa,需要获得参考比例P及β。低延迟编码中层次编码结构的定义如表1所示,具有相同rPOC的帧遵循相同的规律,如每个测试序列以I帧(帧内编码)开始,四帧组成一个GOP,每个GOP中第一帧的rPOC为1,其参考帧集合中有4个参考帧,表2列出了参考帧与该帧的POC之差,以及该帧所使用的QP偏移值,并将该QP偏移值与I帧的QP之和作为该帧的QP。相应的通过大量实验,求得平均参考比列,也即当前帧中编码单元将参考帧集合中某帧选为最佳参考帧的平均比例。如rPOC为1的当前帧中选择第一个参考帧(即前一帧,因为当前帧与第一个参考帧POC差值为-1)的编码单元比例为0.89。
如前所述,β=α·D/DMCP,且D=DMCP·F(θ),因此β=α·F(θ),
首先考虑当前编码单元Ui在key帧中,估计Di(oi)。先根据在当前帧的前一帧找到影响编码Ui的单元Ui-1,进而得到Di-1和其中α=0.94,求得和其中量化步长Q与量化参数QP的关系是通过θi查表F(θ)得到
估计βi,i+1=α·F(θi,i+1),其中前一步中已经求出Di(oi),可根据时域传播链获得。由于计算量大,单元Ui+1所在帧的rPOC为1,根据表2及所建时域传播链,其期望失真仅与第一项具有较强相关性,因此使用经验值代替E(Di+1)。
估计βi+1i+2=α·F(θi+1i+2),且进而得到其中E(Di+1)使用经验值同理βi,i+2=α·F(θi,i+2),且进而得到对于编码单元所在帧rPOC为2、3、4时,其期望失真仅与前一帧及最近的key帧具有强相关性,因此E(Di+2)的经验值为
同理,可以迭代求取β,最终求得传播因子ωa,求得
通过求Ui的最佳编码参数oi。
HEVC中基本编码单元CU尺寸为64x64,根据本发明求出每个CU的16个16x16块的传播因子ωi,求均值结合所求的λg,对该CU进行编码。
实验低延迟P/B测试条件,其中标准测试序列如表3所示,标准测试条件为使用低延迟下推荐测试结构,QP采用27,32,37,42,16个测试序列,四种分别率(1080P,720P,WVGA,WQVGA),相对比较结果为HEVC的参考软件HM13.0。
表3在低延迟测试条件下亮度码率节省
测试结果如表3所示。从表3中可以看出采用该方法后可获得BD平均码率节省分别为2.9%、2.8%,且对于部分测试序列,可节省BD码率达7.2%。其中测试序列FourPeople在Low-delay P下率失真曲线图如图4所示。由图4可以看出本方法的性能表现优于原始的HEVC参考软件HM13.0的性能。表4给出了本发明测试时间比较,与HM13.0相比编码时间仅平均增长了0.6%。
表4低延迟B帧测试条件下本发明测试时间比较(单位为秒)
Claims (3)
1.低延迟视频编码中时域率失真优化方法,其特征在于,包括如下步骤:
S1、根据低延迟视频编码中时域依赖性,建立时域传播链,其中,所述时域传播链具有如下特性:低延迟视频编码中每个GOP中第一帧,即rPOC=1的帧仅考虑前一帧对其的影响,每个GOP内的其他三帧,即rPOC=2、3、4的帧仅考虑前一帧及前向最近的key帧对其的影响,如图2所示;
S2、建立当前编码单元Ui的时域率失真优化目标方程其中,i=1,2,3,...,N,N表示低延迟视频编码的总帧数,A代表一帧中所有的编码单元,为Uj的期望失真,oi表示第i个编码单元的编码参数,Ri(oi)表示第i个编码单元的码率,Di为当前编码单元的失真,表示第j个受到当前编码单元Ui影响的后续编码单元的失真,λg为全局拉格朗日乘子,*代表编码模式为可以得到的最优编码参数,定义当前编码单元Ui为帧fi中第a个编码单元,j=i+1,...,N,a=1,2,3,...,A;
S3、根据S2所述时域率失真优化目标方程,求受到当前编码单元Ui影响的后续编码单元的期望失真具体为:rPOC=1的帧中的编码单元Ui+4m+1的期望失真为E(Di+4m+1),rPOC=2的帧中的编码单元Ui+4m+2的期望失真为E(Di+4m+2),rPOC=3的帧中的编码单元Ui+4m+3的期望失真为E(Di+4m+3),rPOC=4的帧中的编码单元Ui+4m+4的期望失真为E(Di+4m+4),其中,Ki+4m+1为常数,Pi+4m,i+4m+1代表在帧fi+4m+1中以fi+4m为参考帧的块的比例,其中,Ki+4m+2为常数,Pi+4m+1,i+4m+2代表在帧fi+4m+2中以fi+4m+1为参考帧的块的比例,Pi+4m,i+4m+2代表在帧fi+4m+2中以fi+4m为参考帧的块的比例,其中,Ki+4m+3为常数,Pi+4m+2,i+4m+3代表在帧fi+4m+3中以fi+4m+2为参考帧的块的比例,Pi+4m,i+4m+3代表在帧fi+4m+3中以fi+4m为参考帧的块的比例,Ki+4m+4为常数,Pi+4m+3,i+4m+4代表在帧fi+4m+4中以fi+4m+3为参考帧的块的比例,Pi+4m,i+4m+4代表在帧fi+4m+4中以fi+4m为参考帧的块的比例,m=0,1,2,...,M表示第m个GOP,共有M个GOP,o1上标“1”表示前一帧为参考帧,o2上标“2”表示前向最近key帧为参考帧;
S4、将所述S3中的受到当前编码单元Ui影响的后续编码单元的期望失真代入S2所述当前编码单元Ui的时域率失真优化目标方程,并删除所有常数项K*,进行简化,具体简化为:
当前编码单元Ui属于key帧(rPOC=4)时,则简化为:
当前编码单元Ui所在非key帧的rPOC分别为1、2、3时,则简化为:
S5、求S4中所述目标方程中的当前编码单元Ui及后续编码单元的失真,具体步骤为:
βi+4m,i+4m+1表示编码单元Ui+4m对Ui+4m+1的影响程度的经验值,βi+4m,i+4m+1=α·F(θi+4m,i+4m+1),且F(θ)为经验值,原始编码单元Ui+4m与Ui+4m+1的运动补偿误差,α为常数,
βi+4m+1,i+4m+2表示编码单元Ui+4m+1对Ui+4m+2的影响程度的经验值,βi+4m+1,i+4m+2=α·F(θi+4m+1,i+4m+2),且 原始编码单元Ui+4m+1与Ui+4m+2的运动补偿误差,
βi+4m,i+4m+2表示编码单元Ui+4m对Ui+4m+2的影响程度的经验值,βi+4m,i+4m+2=α·F(θi+4m,i+4m+2),且 原始编码单元Ui+4m与Ui+4m+2的运动补偿误差,
βi+4m+2,i+4m+3表示编码单元Ui+4m+2对Ui+4m+3的影响程度的经验值,βi+4m+2,i+4m+3=α·F(θi+4m+2,i+4m+3),且 原始编码单元Ui+4m+2与Ui+4m+3的运动补偿误差,
βi+4m,i+4m+3表示编码单元Ui+4m对Ui+4m+3的影响程度的经验值,βi+4m,i+4m+3=α·F(θi+4m,i+4m+3),且 原始编码单元Ui+4m与Ui+4m+3的运动补偿误差,
βi+4m+3,i+4m+4表示编码单元Ui+4m+3对Ui+4m+4的影响程度的经验值,βi+4m+3,i+4m+4=α·F(θi+4m+3,i+4m+4),且 原始编码单元Ui+4m+3与Ui+4m+4的运动补偿误差,
βi+4m,i+4m+4表示编码单元Ui+4m对Ui+4m+4的影响程度的经验值,βi+4m,i+4m+4=α·F(θi+4m,i+4m+4),且 原始编码单元Ui+4m与Ui+4m+4的运动补偿误差;
S6、将S5中所述当前编码单元Ui及后续编码单元的失真代入S4中所述当前编码单元Ui的时域率失真优化目标方程,得到所述ωa为传播因子,具体为:
当前编码单元Ui属于key帧时,
当前编码单元Ui属于非key帧时,
其中,β=α·F(θ),且m=1,2,3,...,M,M为一个测试序列的GOP总数;
S7、将全局拉格朗日乘子λg和S6所述传播因子ωa代入进行时域率失真优化,初始化当前帧的λg为λHM,λHM为标准HEVC中设定的当前帧的拉格朗日乘子;
S8、依次对当前帧中A个编码单元,进行步骤S2-S7的所述的率失真优化处理;
S9、对S7所述全局拉格朗日乘子λg进行更新,更新得到其中,A代表一帧中所有的编码单元,为Ui的时域累积失真;
S10、对S1所述低延迟视频编码中其他帧进行步骤S2-S9的所述率失真优化处理。
2.根据权利要求1所述低延迟视频编码中时域率失真优化方法,其特征在于:S5所述α为0.94±0.3。
3.根据权利要求1所述低延迟视频编码中时域率失真优化方法,其特征在于:S5所述F(θ)的取值范围为(0,1]。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610242849.9A CN105872544B (zh) | 2016-04-19 | 2016-04-19 | 低延迟视频编码中时域率失真优化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610242849.9A CN105872544B (zh) | 2016-04-19 | 2016-04-19 | 低延迟视频编码中时域率失真优化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105872544A true CN105872544A (zh) | 2016-08-17 |
CN105872544B CN105872544B (zh) | 2019-01-01 |
Family
ID=56632361
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610242849.9A Active CN105872544B (zh) | 2016-04-19 | 2016-04-19 | 低延迟视频编码中时域率失真优化方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105872544B (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107295334A (zh) * | 2017-08-15 | 2017-10-24 | 电子科技大学 | 自适应的参考图像抉择方法 |
CN107426570A (zh) * | 2016-10-28 | 2017-12-01 | 福州大学 | 一种低延迟视频编码的自适应Qp级联方法 |
CN108235025A (zh) * | 2018-03-13 | 2018-06-29 | 电子科技大学 | 自适应帧间参考结构的拉格朗日乘子优化方法 |
CN112351285A (zh) * | 2020-11-04 | 2021-02-09 | 北京金山云网络技术有限公司 | 视频编码、解码方法和装置、电子设备和存储介质 |
WO2021196682A1 (zh) * | 2020-03-31 | 2021-10-07 | 电子科技大学 | 一种基于失真类型传播分析的时域率失真优化方法 |
WO2022027881A1 (zh) * | 2020-08-05 | 2022-02-10 | 电子科技大学 | 基于视频序列特征和QP-λ修正的时域率失真优化方法 |
CN114422797A (zh) * | 2021-12-28 | 2022-04-29 | 重庆邮电大学 | 一种基于时间依赖率失真优化的h.264到h.265转码方法 |
US11418795B2 (en) | 2020-08-05 | 2022-08-16 | University Of Electronic Science And Technology Of China | Temporal domain rate distortion optimization based on video content characteristic and QP-λcorrection |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102740081A (zh) * | 2012-06-21 | 2012-10-17 | 西南交通大学 | 一种基于分布式编码技术的多视点视频传输差错控制方法 |
CN104349167A (zh) * | 2014-11-17 | 2015-02-11 | 电子科技大学 | 一种视频编码率失真优化的调整方法 |
CN105120282A (zh) * | 2015-08-07 | 2015-12-02 | 上海交通大学 | 一种时域依赖的码率控制比特分配方法 |
-
2016
- 2016-04-19 CN CN201610242849.9A patent/CN105872544B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102740081A (zh) * | 2012-06-21 | 2012-10-17 | 西南交通大学 | 一种基于分布式编码技术的多视点视频传输差错控制方法 |
CN104349167A (zh) * | 2014-11-17 | 2015-02-11 | 电子科技大学 | 一种视频编码率失真优化的调整方法 |
CN105120282A (zh) * | 2015-08-07 | 2015-12-02 | 上海交通大学 | 一种时域依赖的码率控制比特分配方法 |
Non-Patent Citations (1)
Title |
---|
TIANWU YANG等: "Source Distortion Temporal Propagation Model for Motion Compensated Video Coding Optimization", 《2012 IEEE INTERNATIONAL CONFERENCE ON MULTIMEDIA AND EXPO (ICME)》 * |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107426570A (zh) * | 2016-10-28 | 2017-12-01 | 福州大学 | 一种低延迟视频编码的自适应Qp级联方法 |
CN107426570B (zh) * | 2016-10-28 | 2020-11-03 | 福州大学 | 一种低延迟视频编码的自适应Qp级联方法 |
CN107295334A (zh) * | 2017-08-15 | 2017-10-24 | 电子科技大学 | 自适应的参考图像抉择方法 |
CN107295334B (zh) * | 2017-08-15 | 2019-12-03 | 电子科技大学 | 自适应的参考图像抉择方法 |
CN108235025A (zh) * | 2018-03-13 | 2018-06-29 | 电子科技大学 | 自适应帧间参考结构的拉格朗日乘子优化方法 |
CN108235025B (zh) * | 2018-03-13 | 2021-10-26 | 电子科技大学 | 自适应帧间参考结构的拉格朗日乘子优化方法 |
WO2021196682A1 (zh) * | 2020-03-31 | 2021-10-07 | 电子科技大学 | 一种基于失真类型传播分析的时域率失真优化方法 |
US11330270B2 (en) | 2020-03-31 | 2022-05-10 | University Of Electronic Science And Technology Of China | Temporal domain rate distortion optimization considering coding-mode adaptive distortion propagation |
WO2022027881A1 (zh) * | 2020-08-05 | 2022-02-10 | 电子科技大学 | 基于视频序列特征和QP-λ修正的时域率失真优化方法 |
US11418795B2 (en) | 2020-08-05 | 2022-08-16 | University Of Electronic Science And Technology Of China | Temporal domain rate distortion optimization based on video content characteristic and QP-λcorrection |
CN112351285A (zh) * | 2020-11-04 | 2021-02-09 | 北京金山云网络技术有限公司 | 视频编码、解码方法和装置、电子设备和存储介质 |
CN112351285B (zh) * | 2020-11-04 | 2024-04-05 | 北京金山云网络技术有限公司 | 视频编码、解码方法和装置、电子设备和存储介质 |
CN114422797A (zh) * | 2021-12-28 | 2022-04-29 | 重庆邮电大学 | 一种基于时间依赖率失真优化的h.264到h.265转码方法 |
Also Published As
Publication number | Publication date |
---|---|
CN105872544B (zh) | 2019-01-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105872544A (zh) | 低延迟视频编码中时域率失真优化方法 | |
CN105049850B (zh) | 基于感兴趣区域的hevc码率控制方法 | |
US9615085B2 (en) | Method and system for structural similarity based rate-distortion optimization for perceptual video coding | |
CN100362863C (zh) | 在视频编码器中选择宏块量化参数的方法和装置 | |
CN102067610B (zh) | 基于视频编码的切片依赖性的码率控制模型适配 | |
CN103517069B (zh) | 一种基于纹理分析的hevc帧内预测快速模式选择方法 | |
CN103155559B (zh) | 用于帧兼容视频传输的联合层优化 | |
CN1794815A (zh) | 产生对图像或图像序列进行编码的量化矩阵的方法和设备 | |
CN105120282B (zh) | 一种时域依赖的码率控制比特分配方法 | |
CN101222630B (zh) | 一种实现实时双帧参考的时域可分级视频编码方法 | |
Yang et al. | Perceptual Learned Video Compression with Recurrent Conditional GAN. | |
US11330270B2 (en) | Temporal domain rate distortion optimization considering coding-mode adaptive distortion propagation | |
CN104853191B (zh) | 一种hevc的快速编码方法 | |
Liu et al. | Low-complexity rate control based on ρ-domain model for scalable video coding | |
CN103634601B (zh) | 基于结构相似度的高效视频编码感知码率控制优化方法 | |
CN101242532A (zh) | 一种面向多视点视频的码率控制方法 | |
CN105872545A (zh) | 一种随机接入视频编码中层次化时域率失真优化方法 | |
CN100551070C (zh) | 金字塔式双向预测模式的视频恒定质量控制方法 | |
CN101056408A (zh) | 用于确定视频编码中跳跃模式的阈值的方法和装置 | |
CN107343202B (zh) | 基于附加码率的无反馈分布式视频编解码方法 | |
Wu et al. | Encoding parameters prediction for convex hull video encoding | |
Ringis et al. | Per Clip Lagrangian Multiplier Optimisation for HEVC | |
Sun et al. | Rate-distortion analysis of dead-zone plus uniform threshold scalar quantization and its application—Part II: Two-pass VBR coding for H. 264/AVC | |
Yokoyama | Adaptive GOP structure selection for real-time MPEG-2 video encoding | |
CN103237210B (zh) | 一种视频编码中比特分配的方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |