CN111314703B - 一种基于失真类型传播分析的时域率失真优化方法 - Google Patents

一种基于失真类型传播分析的时域率失真优化方法 Download PDF

Info

Publication number
CN111314703B
CN111314703B CN202010241861.4A CN202010241861A CN111314703B CN 111314703 B CN111314703 B CN 111314703B CN 202010241861 A CN202010241861 A CN 202010241861A CN 111314703 B CN111314703 B CN 111314703B
Authority
CN
China
Prior art keywords
distortion
coding
frame
inter
coding unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010241861.4A
Other languages
English (en)
Other versions
CN111314703A (zh
Inventor
朱策
邓玲玲
蒋妮
王秋月
丁可可
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN202010241861.4A priority Critical patent/CN111314703B/zh
Publication of CN111314703A publication Critical patent/CN111314703A/zh
Priority to PCT/CN2020/132812 priority patent/WO2021196682A1/zh
Priority to US17/412,292 priority patent/US11330270B2/en
Application granted granted Critical
Publication of CN111314703B publication Critical patent/CN111314703B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/109Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/567Motion estimation based on rate distortion criteria

Abstract

本发明属于视频编解码技术领域,具体涉及一种基于失真类型传播分析的时域率失真优化方法。本发明根据LD结构下的时域依赖关系以及skip模式和inter模式下失真传播分析,重新归纳了基于时域失真传播的依赖率失真优化问题,通过构造了时间传播链,估计当前编码单元及受影响的未来编码单元的聚合失真,计算时域失真传播模型中编码单元的传播因子,进而通过更加准确的传播因子调整拉格朗日乘子实现时域依赖率失真优化,同时对I帧使用二次编码技术实现I帧的时域依赖率失真优化。

Description

一种基于失真类型传播分析的时域率失真优化方法
技术领域
本发明属于视频编解码技术领域,具体涉及一种基于失真类型传播分析的时域率失真优化方法。
背景技术
率失真理论(Rate Distortion Theory)是有损编码的基础理论,基于该理论发展而来的率失真优化技术RDO(Rate Distortion Optimization)是提升编码效率的重要工具之一,已广泛应用于视频编码领域。
视频编码的性能需要编码比特和重建失真共同衡量,一方面,当我们想要更好的视频质量时,视频的编码比特会提高,另一方面在较低的编码比特水平下,视频的失真又会大大增加,故编码比特和重建失真存在相互矛盾、相互制约的关系。率失真优化技术就是让编码器选择一组最优的编码参数集使得在编码比特小于目标比特的前提下,编码失真最小,其数学表达如公式(1.1)所示:
Figure BDA0002432833160000011
其中Di和Ri表示编码单元的失真和比特数,N为编码单元总数,Rc表示目标比特数。
为了解决上述约束性率失真优化问题,可以引入全局拉格朗日乘子λg,将约束性问题转换为公式(1.2)的无约束问题,其中J被称为率失真代价函数。
Figure BDA0002432833160000012
图1给出了经典R-D曲线,当使用一组编码参数对视频进行编码时,便可得到该编码参数条件下的失真和码率,我们以点的形式绘制不同编码参数下的(R,D)组合,这些点被称为实际率失真可操作点。我们可以观察到对于给定的速率R*,总能找到一个D最小的可操作点,这些点被称为实际可达到的最优可操作点,将这些最优可操作点连接起来,即可得到实际可操作R-D曲线。
在独立率失真优化的条件下,即不同编码单元之间的率失真性能相互独立,对公式(1.2)关于Ri求导可得
Figure BDA0002432833160000021
由此可见,λg是率失真曲线上某点的负斜率,较大的λg对应码率较小,失真较大的可操作点,而较小的λg对应着码率较大,失真较小的可操作点,是影响率失真性能最主要的决定因素,因此拉格朗日乘子λg的选取至关重要,目前VVC中λg的大小主要由预先设置好的量化参数QP决定,与输入视频序列无关。
然而由于帧内\帧间预测会在不同编码单元间引入依赖性,对每个编码单元采用独立率失真优化技术并不能使编码性能达到最优。因此需要一种复杂度可以接受的全局率失真优化方法,进一步提升编码效率。
文献Temporally dependent rate-distortion optimization for low-delayhierarchical video coding中就研究了一种LD编码结构下时域率失真优化算法。根据LD配置下的时域依赖关系,建立了多参考帧下的时域失真传播链,估计失真传播程度,计算传播因子,进而根据聚合传播因子调整全局拉格朗日乘子,实现时域率失真优化,解决全局率失真优化问题。
图2中给出了LD编码结构下时域失真传播链的构造方法,由于采用了多参考帧编码方式,关键帧中的一个编码块可能直接影响后续不同帧中的多个块,并继续间接地向前扩展。因此,需要利用大量的实验统出GOP中每个参考帧的利用率,对多个可能的影响块使用加权平均计算对后续编码块的期望失真。基于图3的LD编码结构下的时域依赖关系以及采用前向运动搜索可以确定后续帧中受影响的编码块。
在LD编码结构下在考虑关键帧fi中的编码单元Bi的时域率失真优化时,编码帧fi+1中受影响的编码单元Bi+1的期望失真为:
Figure BDA0002432833160000022
假设Pi,j是编码帧fi被编码帧fj参考的概率,oi是Bi的编码参数。由于后三项与Bi的编码参数oi无关,因此公式(1.3)可简化为
Figure BDA0002432833160000023
同理编码单元Bi+2的期望失真可写为:
Figure BDA0002432833160000031
其中
Figure BDA0002432833160000032
与Bi的编码参数oi无关,使用类似的方法可以得到对后续有影响的编码单元的期望失真。
基于期望失真的概念下,公式(1.2)的率失真问题可重新表示为:
Figure BDA0002432833160000033
由于该算法对当前编码单元和后续编码单元估计的期望失真相对粗糙,使得传播因子难以准确衡量当前编码单元的失真对后续编码失真的影响,在新一代视频编码标准VVC中反而产生损失,同时该算法没有对I帧进行时域率失真优化,而I帧的编码性能在LD编码结构中非常重要。
发明内容
针对上述问题,为了进一步优化LD编码结构下的时域率失真优化方案,本发明根据LD编码结构下的时域依赖关系以及skip模式和inter模式下失真传播分析,重新归纳了基于时域失真传播的依赖率失真优化问题,通过构造时域失真传播链,估计当前编码单元及受影响的未来编码单元的聚合失真,计算时域失真传播模型中编码单元的传播因子,进而通过更加准确的传播因子调整拉格朗日乘子实现时域依赖率失真优化,同时对I帧使用二次编码技术实现I帧的时域依赖率失真优化。
本发明采用的技术方案是:
假设编码单元Bi重建失真为Di。由于帧间预测存在skip模式,在该模式下不需传输残差,直接使用帧间预测值作为重建值,其余模式需要传输残差,称为inter模式,因此当前编码单元的失真可以由skip模式和inter模式带来的失真共同组成:
Figure BDA0002432833160000034
只有当前编码单元inter模式下的部分失真dinter会对后续编码单元的带来影响,因为在skip模式下使用已编码的参考单元作为预测块时不需要传输预测残差,当前编码单元的失真由前面已编码的参考单元失真决定,所以对后续编码单元的影响也是由前面已编码单元决定,所以在考虑当前编码单元的对后续编码单元的影响时应当将skip模式下的失真剔除。假设
Figure BDA0002432833160000041
Figure BDA0002432833160000042
分别是当前编码单元选择inter模式和skip模式的编码失真,pinter和pskip分别是当前编码单元选择inter模式和skip模式的概率,两者之和为1。如果当前编码单元与预测单元之间的误差越大,将会导致编码器选择inter模式的概率越大,同时较大的量化步长会导致编码器选择skip模式的概率增大。因此,将pinter定义为:
Figure BDA0002432833160000043
其中
Figure BDA0002432833160000044
为Bi在原始帧中通过运动搜索得到的原始运动补偿误差,Fi、Fi-1分别代表编码单元Bi和参考单元Bi-1的原始像素,Δ为量化步长。
在编码Bi时,对公式(1.6)关于Ri求偏导,可求得全局拉格朗日乘子λg
Figure BDA0002432833160000045
在公式(1.9)两端同乘一个
Figure BDA0002432833160000046
同时假设
Figure BDA0002432833160000047
可以得到:
Figure BDA0002432833160000048
λi是在全局率失真性能下编码单元Bi的拉格朗日乘子。此外,κi代表编码单元Bi对后续视频序列编码失真的影响,称为该编码单元Bi的传播因子。
在高码率inter模式下的失真函数可以表示为
Figure BDA0002432833160000049
skip模式下的失真函数可以表示为
Figure BDA00024328331600000410
Ri+1为码率,b是与信源分布有关的常数,
Figure BDA00024328331600000411
为Bi+1的运动补偿预测误差。
Figure BDA0002432833160000051
Fi代表编码单元Bi的原始像素,
Figure BDA0002432833160000052
代表编码单元Bi的重建像素、Fi+1代表编码单元Bi+1的原始像素。
根据实验观察,α约等于一个常数,此时编码单元Bi+1的失真可表示为:
Figure BDA0002432833160000053
Figure BDA0002432833160000054
分别表示编码单元Bi+1参考编码单元Bi时使用inter模式和skip模式的概率,
Figure BDA0002432833160000055
表示编码单元Bi+1的原始运动补偿误差。
此时由公式(1.4)和(1.7)可得编码帧fi+1中受编码单元Bi影响的编码单元Bi+1的期望失真为:
Figure BDA0002432833160000056
其中
Figure BDA0002432833160000057
Figure BDA0002432833160000058
仅与编码单元Bi+1的码率Ri+1有关,与编码单元Bi的编码参数oi无关,
Figure BDA0002432833160000059
也与Bi的编码参数oi无关,仅有编码帧fi被编码帧fi+1参考的概率Pi,i+1和编码单元Bi使用inter模式下的编码失真
Figure BDA00024328331600000510
以及参数γi,i+1与编码参数oi有关。
同理可得,编码帧fi+2中受Bi影响的编码单元Bi+2的期望失真为:
Figure BDA00024328331600000511
其中
Figure BDA00024328331600000512
Figure BDA00024328331600000513
分别表示编码单元Bi+2参考编码单元Bi+1时使用inter模式和skip模式的概率,
Figure BDA00024328331600000514
Figure BDA00024328331600000515
分别表示编码单元Bi+2参考编码单元Bi时使用inter模式和skip模式的概率,Ri+2表示编码单元Bi+2的码率,Pi+1,i+2和Pi,i+2分别表示编码帧fi+1和fi被编码帧fi+2参考的概率。ci+2为与编码单元Bi的编码参数oi不相干的无关项。
同理,编码帧fi+3中受Bi影响的编码单元Bi+3的期望失真为:
Figure BDA0002432833160000061
其中
Figure BDA0002432833160000062
Figure BDA0002432833160000063
分别表示编码单元Bi+3参考编码单元Bi+2时使用inter模式和skip模式的概率,
Figure BDA0002432833160000064
Figure BDA0002432833160000065
分别表示编码单元Bi+3参考编码单元Bi时使用inter模式和skip模式的概率,Ri+3表示编码单元Bi+3的码率,Pi+2,i+3和Pi,i+3分别表示编码帧fi+2和fi被编码帧fi+3参考的概率。ci+3为与编码单元Bi的编码参数oi不相干的无关项。
因此,当前GOP中的四个编码帧中受编码单元Bi影响的所有编码单元的聚合失真为:
Figure BDA0002432833160000066
Figure BDA0002432833160000067
Figure BDA0002432833160000068
分别表示编码单元Bi+k+1-t参考编码单元Bi时使用inter模式和skip模式的概率,
Figure BDA0002432833160000069
Figure BDA00024328331600000610
分别表示编码单元Bj+1参考编码单元Bj时使用inter模式和skip模式的概率,Pi,i+k+1-t表示编码帧fi被编码帧fi+k+1-t参考的概率,Pj,j+1表示编码帧fj被编码帧fj+1参考的概率,其中
Figure BDA00024328331600000611
与编码单元Bi的编码参数oi无关。
同理可得,第m个GOP中的四个编码帧中受编码单元Bi影响的所有编码单元的聚合失真为:
Figure BDA0002432833160000071
Figure BDA0002432833160000072
Figure BDA0002432833160000073
分别表示编码单元Bi+4m+k+1-t参考编码单元Bi+4m时使用inter模式和skip模式的概率,Pi+4m,i+4m+k+1-t表示编码帧fi+4m被编码帧fi+4m+k+1-t参考的概率,Pj,j+1表示编码帧fj被编码帧fj+1参考的概率,其中
Figure BDA0002432833160000074
与编码单元Bi的编码参数oi无关。
从编码帧fi+1到编码最后一帧fN的所有后续编码帧中受Bi影响的编码单元的聚合失真为:
Figure BDA0002432833160000075
M为从编码帧fi+1到编码最后一帧fN的GOP总数,L表示与oi无关的项。
由公式(1.8)可知当前编码单元Bi的使用inter模式的编码失真
Figure BDA0002432833160000076
与实际编码失真Di关系如下:
Figure BDA0002432833160000077
Figure BDA0002432833160000078
Figure BDA0002432833160000079
是编码单元Bi选择inter模式的概率,公式(1.19)可表示为:
Figure BDA00024328331600000710
根据公式(1.10),传播因子κi的计算公式为:
Figure BDA0002432833160000081
使用传播因子κi可对CTU级的全局拉格朗日乘子λg自适应调整,并进一步调整CTU级QP,同时使用帧级平均传播因子调整所有B帧的帧级QP。
由于I帧在LD编码结构下尤其重要,后续编码帧均需参考I帧。目前VTM中统一将I帧QP下调1,但在不同序列中I帧的重要性是不同的,所以可采用I帧2次编码的方式,用第一次编码得到的编码失真建立失真传播链计算I帧中每个16×16的块的传播因子,使用帧级平均传播因子对I帧的QP调整,使得I帧QP可以根据I帧对后续编码帧的影响进行调整,调整值不局限于-1。
本发明的有益效果为,本发明解决了传统方法没有对I帧进行时域率失真优化的问题,使得I帧的全局率失真性能达到最优,根据LD编码结构下的时域依赖关系以及skip模式和inter模式下失真传播分析,重新归纳了基于时域失真传播的依赖率失真优化问题,提高LD编码结构下的率失真优化性能。
附图说明
图1为可操作率失真曲线
图2为LD编码结构下时域失真传播链的构造示意图
图3为LD编码结构示意图
图4为Fourpeople序列的率失真曲线图。
具体实施方式
下面结合实施例对本发明进行详细的描述:
为了简化全局率失真算法的实现过程,可以通过传播因子κi直接在VTM中修改全局拉格朗日乘子λg。由于后续编码单元在推导传播因子κi时并没有真正被编码,因此需对后续编码单元的失真进行估计。
在高码率情况下,后续编码单元的编码失真大概率是inter失真,此时存在
Figure BDA0002432833160000091
由于Bi+1没有被编码,Ri+1无法获得,Di+1无法使用(1.21)计算,但在量化步长为Qstep下Bi+1的编码失真可表示为
Figure BDA0002432833160000092
Figure BDA0002432833160000093
其中
Figure BDA0002432833160000094
基于大量不同量化步长和编码单元的实验可拟合出一条F(θ)曲线,根据曲线建立一个查询表计算θ查询得到F(θ)的值,进而估计编码块的inter失真,同时本发明中将α设置为0.94。
根据公式(1-9),可得全局拉格朗日乘子:
Figure BDA0002432833160000095
同时VTM的拉格朗日乘子
Figure BDA0002432833160000096
因此λg和λVTM存在以下关系:
Figure BDA0002432833160000097
对于所有编码单元存在:
Figure BDA0002432833160000098
利用公式(1-24)可求得全局拉格朗日乘子λg,其中N是所有编码单元个数,所有编码单元的失真和编码过程中不能全部获得,此时失真和使用已编码帧的失真以及刚完成的编码帧的失真的加权和,对λg进行更新。由于
Figure BDA0002432833160000099
在集成了本节提出的率失真算法的编码器中是不可得的,因此使用Di替代。
在建立失真传播链时,基于16×16大小的块做运动搜索,并计算每个块的传播因子,由于VTM中以大小为128×128的CTU进行独立划分编码,所以对CTU内所有16×16的块的传播因子取平均值,作为CTU的传播因子,调整CTU级的拉格朗日乘子和QP,同时使用一整幅图像的平均传播因子调整帧级QP。
I帧采用二次编码优化调整I帧QP,为了降低编码复杂度,对I帧第一次编码过程进行优化,跳过二叉树以及三叉树划分模式,仅使用四叉树划分模式对CTU进行划分,并且编码单元最小划分尺寸设置为16×16,不再进行更小尺寸的划分,基于I帧第一次编码得到的失真可以估计处于I帧的编码单元的失真对后续编码单元的影响,实现I帧QP自适应调整。
本发明采用VVC参考软件VTM5.0作为实验平台,实验环境根据JVET规定的通用测试条件CTC(Common Test Conditions)和参考软件配置,仅在LDB编码结构下进行实验,实验测试序列为CTC建议的Class B、C、D、E共16个视频序列,每个测试序列使用四个QP点(22,27,32,37)进行编码。
表1本发明相比于VTM5.0的测试结果
Figure BDA0002432833160000101
Figure BDA0002432833160000111
编码实验结果如表1所示,表中显示了测试序列在LDB编码结构下Y分量取得了2.57%的编码性能。对于大部分测试序列,本发明性能提升明显,尤其是ClassE,性能提升显著,Y分量下取得了10.13%的码率节省。主要是因为Class E是场景较为固定的视频序列,各视频帧相似度较高,时域依赖性强,本发明对这种序列能取得较好的效果。接下来选取部分序列,基于率失真优化曲线对比图,观察它们的编码性能提升情况,如图4为Fourpeople序列的率失真曲线图,横坐标为编码码率Rate,纵坐标为重建视频峰值信噪比PSNR,其中圆形标记曲线是该全局率失真优化算法的率失真曲线,方形标记曲线是原始VTM5.0的率失真曲线,可以看出,对于时域依赖性较强的序列,该算法编码效率提升明显。
同样,在编码复杂度方面,该时域率失真优化算法在LDB编码结构下的编码复杂度平均增加15%,主要是由于算法中需要耗费一定的时间对每个16×16的块做运动搜索找到受影响的编码块从而建立失真传播链,同时对I帧使用了二次编码优化,尽管对I帧第一次编码过程进行了简化,但也增加了少量的编码复杂度。
表2本发明相比于VTM5.0的编码时间百分比
Figure BDA0002432833160000112
Figure BDA0002432833160000121

Claims (1)

1.一种基于失真类型传播分析的时域率失真优化方法,其特征在于,包括以下步骤:
S1、定义编码单元Bi的重建失真Di为:
Figure FDA0002432833150000011
其中,
Figure FDA0002432833150000012
Figure FDA0002432833150000013
分别是当前编码单元选择inter模式和skip模式的编码失真,pinter和pskip分别是当前编码单元选择inter模式和skip模式的概率,dinter是inter模式下的部分失真,dskip是skip模式下的部分失真,pinter+pskip=1;
pinter的定义为:
Figure FDA0002432833150000014
其中
Figure FDA0002432833150000015
为Bi在原始帧中通过运动搜索得到的原始运动补偿误差,Fi、Fi-1分别代表编码单元Bi和参考单元Bi-1的原始像素,Δ为量化步长;
S2、在编码Bi时,对Bi时域依赖率失真优化问题
Figure FDA0002432833150000016
关于Ri求偏导,得到全局拉格朗日乘子λg
Figure FDA0002432833150000017
oi为Bi的编码参数,Ri表示编码单元的比特数;
在公式两端同乘一个
Figure FDA0002432833150000018
同时令
Figure FDA0002432833150000019
得到:
Figure FDA00024328331500000110
λi是在全局率失真性能下编码单元Bi的拉格朗日乘子,κi代表编码单元Bi对后续视频序列编码失真的影响,定义为编码单元Bi的传播因子;
S3、建立当前GOP中的四个编码帧中受编码单元Bi影响的所有编码单元的聚合失真为:
Figure FDA0002432833150000021
其中,
Figure FDA0002432833150000022
α是一个常数,
Figure FDA0002432833150000023
分别表示编码单元Bi+k+1-t参考编码单元Bi时使用inter模式和skip模式的概率,
Figure FDA0002432833150000024
Figure FDA0002432833150000025
分别表示编码单元Bj+1参考编码单元Bj时使用inter模式和skip模式的概率,Pi,i+k+1-t表示编码帧fi被编码帧fi+k+1-t参考的概率,Pj,j+1表示编码帧fj被编码帧fj+1参考的概率,其中
Figure FDA0002432833150000026
与编码单元Bi的编码参数oi无关,即ci+k+1为与编码单元Bi的编码参数oi不相干的无关项;
第m个GOP中的四个编码帧中受编码单元Bi影响的所有编码单元的聚合失真为:
Figure FDA0002432833150000027
Figure FDA0002432833150000028
Figure FDA0002432833150000029
分别表示编码单元Bi+4m+k+1-t参考编码单元Bi+4m时使用inter模式和skip模式的概率,Pi+4m,i+4m+k+1-t表示编码帧fi+4m被编码帧fi+4m+k+1-t参考的概率,Pj,j+1表示编码帧fj被编码帧fj+1参考的概率,其中
Figure FDA00024328331500000210
与编码单元Bi的编码参数oi无关,即ci+4m+k+1为与编码单元Bi的编码参数oi不相干的无关项;
得到编码帧fi+1到编码最后一帧fN的所有后续编码帧中受Bi影响的编码单元的聚合失真为:
Figure FDA0002432833150000031
M为从编码帧fi+1到编码最后一帧fN的GOP总数,L表示与oi无关的项;
S4、根据步骤S1中pinter的定义,得到当前编码单元的inter失真
Figure FDA0002432833150000032
与实际失真Di关系为:
Figure FDA0002432833150000033
b是与信源分布有关的常数,令
Figure FDA0002432833150000034
将上式简化表示为
Figure FDA0002432833150000035
根据步骤S2中λi的表达式,得到传播因子κi的计算公式为:
Figure FDA0002432833150000036
使用传播因子κi对CTU级的全局拉格朗日乘子λg自适应调整,根据上述步骤通过对CTU分块求传播因子取平均值,获得CTU的传播因子,进一步调整CTU级QP,同时使用帧级平均传播因子调整所有B帧的帧级QP;对于I帧,采用2次编码的方式,用第一次编码得到的编码失真建立失真传播链并根据上述步骤计算I帧中每个16×16的块的传播因子,使用帧级平均传播因子对I帧的QP调整,使得I帧QP可以根据I帧对后续编码帧的影响进行调整。
CN202010241861.4A 2020-03-31 2020-03-31 一种基于失真类型传播分析的时域率失真优化方法 Active CN111314703B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN202010241861.4A CN111314703B (zh) 2020-03-31 2020-03-31 一种基于失真类型传播分析的时域率失真优化方法
PCT/CN2020/132812 WO2021196682A1 (zh) 2020-03-31 2020-11-30 一种基于失真类型传播分析的时域率失真优化方法
US17/412,292 US11330270B2 (en) 2020-03-31 2021-08-26 Temporal domain rate distortion optimization considering coding-mode adaptive distortion propagation

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010241861.4A CN111314703B (zh) 2020-03-31 2020-03-31 一种基于失真类型传播分析的时域率失真优化方法

Publications (2)

Publication Number Publication Date
CN111314703A CN111314703A (zh) 2020-06-19
CN111314703B true CN111314703B (zh) 2022-03-08

Family

ID=71147494

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010241861.4A Active CN111314703B (zh) 2020-03-31 2020-03-31 一种基于失真类型传播分析的时域率失真优化方法

Country Status (3)

Country Link
US (1) US11330270B2 (zh)
CN (1) CN111314703B (zh)
WO (1) WO2021196682A1 (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111314703B (zh) * 2020-03-31 2022-03-08 电子科技大学 一种基于失真类型传播分析的时域率失真优化方法
CN111918068B (zh) * 2020-08-05 2022-03-08 电子科技大学 基于视频序列特征和QP-λ修正的时域率失真优化方法
US11418795B2 (en) 2020-08-05 2022-08-16 University Of Electronic Science And Technology Of China Temporal domain rate distortion optimization based on video content characteristic and QP-λcorrection
CN113596483B (zh) * 2021-08-20 2024-03-12 红河学院 一种编码树单元的参数确定方法及系统
CN116723330B (zh) * 2023-03-28 2024-02-23 成都师范学院 一种自适应球域失真传播链长度的全景视频编码方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102625102A (zh) * 2011-12-22 2012-08-01 北京航空航天大学 一种面向h.264/svc mgs编码的率失真模式选择方法
CN105120282A (zh) * 2015-08-07 2015-12-02 上海交通大学 一种时域依赖的码率控制比特分配方法
CN110351557A (zh) * 2018-04-03 2019-10-18 朱政 视频编码中一种快速帧间预测编码方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20050061762A (ko) * 2003-12-18 2005-06-23 학교법인 대양학원 부호화 모드 결정방법, 움직임 추정방법 및 부호화 장치
BRPI0611672A2 (pt) * 2005-07-22 2009-01-13 Mitsubishi Electric Corp codificador e decodificador de imagem, mÉtodo de codificaÇço de imagem, programa de codificaÇço de imagem, meio de gravaÇço legÍvel por computador, mÉtodo de decodificaÇço de imagem, programa de decodificaÇço de imagem, e, corrente de bits codificada por imagem
EP3399748A1 (en) * 2009-09-10 2018-11-07 Guangdong OPPO Mobile Telecommunications Corp., Ltd. Speedup techniques for rate distortion optimized quantization
GB2495469B (en) * 2011-09-02 2017-12-13 Skype Video coding
JP2015526013A (ja) * 2012-07-02 2015-09-07 エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュートElectronics And Telecommunications Research Institute 映像符号化方法及び装置、並びに映像復号化方法及び装置
WO2015133320A1 (ja) * 2014-03-05 2015-09-11 ソニー株式会社 画像符号化装置および方法
CN104796705B (zh) * 2015-04-22 2018-01-12 福州大学 一种基于ssim的hevc视频编码率失真优化与码率控制算法
CN105872544B (zh) * 2016-04-19 2019-01-01 电子科技大学 低延迟视频编码中时域率失真优化方法
CN111314703B (zh) * 2020-03-31 2022-03-08 电子科技大学 一种基于失真类型传播分析的时域率失真优化方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102625102A (zh) * 2011-12-22 2012-08-01 北京航空航天大学 一种面向h.264/svc mgs编码的率失真模式选择方法
CN105120282A (zh) * 2015-08-07 2015-12-02 上海交通大学 一种时域依赖的码率控制比特分配方法
CN110351557A (zh) * 2018-04-03 2019-10-18 朱政 视频编码中一种快速帧间预测编码方法

Also Published As

Publication number Publication date
CN111314703A (zh) 2020-06-19
US11330270B2 (en) 2022-05-10
US20220007031A1 (en) 2022-01-06
WO2021196682A1 (zh) 2021-10-07

Similar Documents

Publication Publication Date Title
CN111314703B (zh) 一种基于失真类型传播分析的时域率失真优化方法
CN111918068B (zh) 基于视频序列特征和QP-λ修正的时域率失真优化方法
US6891889B2 (en) Signal to noise ratio optimization for video compression bit-rate control
RU2475999C2 (ru) Квантование, основанное на моделировании искажения скорости передачи, для кодеров cabac
US8369628B2 (en) Video encoding device, video encoding method, video encoding program, video decoding device, video decoding method, and video decoding program
US7280597B2 (en) System and method for determining coding modes, DCT types and quantizers for video coding
US20070274396A1 (en) Complexity adaptive skip mode estimation for video encoding
CN103609122B (zh) 用于视频编码的率失真优化
US7817723B2 (en) Apparatus and method of optimizing motion estimation parameters for encoding a video signal
CN104320657B (zh) Hevc无损视频编码的预测模式选择方法及相应的编码方法
US9118918B2 (en) Method for rate-distortion optimized transform and quantization through a closed-form operation
KR20100061756A (ko) 비디오 인코딩 생성 방법
CN107846593B (zh) 一种率失真优化方法及装置
CN103945222B (zh) 一种基于hevc视频编码标准的码率控制模型更新方法
JP4994877B2 (ja) ビデオのフレームシーケンスにおけるマクロブロックの符号化モードを選択する方法及びシステム
JP5100658B2 (ja) ビデオ画像符号化方法及び装置
CN115695801A (zh) 一种考虑时域失真传播的低复杂度全景视频编码方法
Ropert et al. RD spatio-temporal adaptive quantization based on temporal distortion backpropagation in HEVC
Liu et al. Inter-frame dependency-based rate control for vvc low-delay coding
Ascenso et al. Low complexity intra mode selection for efficient distributed video coding
Guo et al. Temporal dependency based Lagrange multiplier adaptation for HEVC
KR100961742B1 (ko) H.264/avc의 매크로블록 단위 비트율 제어 방법
Guo et al. A Bayesian approach to block structure inference in AV1-based multi-rate video encoding
CN116405690B (zh) 一种快速帧级自适应拉格朗日乘子优化方法、系统及设备
Lou et al. Rate-distortion optimized rate-allocation for motion-compensated predictive video codecs using PixelRank

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant