CN111918068B - 基于视频序列特征和QP-λ修正的时域率失真优化方法 - Google Patents

基于视频序列特征和QP-λ修正的时域率失真优化方法 Download PDF

Info

Publication number
CN111918068B
CN111918068B CN202010776206.9A CN202010776206A CN111918068B CN 111918068 B CN111918068 B CN 111918068B CN 202010776206 A CN202010776206 A CN 202010776206A CN 111918068 B CN111918068 B CN 111918068B
Authority
CN
China
Prior art keywords
time domain
frame
coding
lambda
distortion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010776206.9A
Other languages
English (en)
Other versions
CN111918068A (zh
Inventor
朱策
秦晗
王永华
刘翼鹏
刘凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN202010776206.9A priority Critical patent/CN111918068B/zh
Publication of CN111918068A publication Critical patent/CN111918068A/zh
Priority to PCT/CN2020/132813 priority patent/WO2022027881A1/zh
Priority to US17/460,360 priority patent/US11418795B2/en
Application granted granted Critical
Publication of CN111918068B publication Critical patent/CN111918068B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/19Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding using optimisation based on Lagrange multipliers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock

Abstract

本发明属于视频编解码技术领域,具体涉及一种基于视频序列特征和QP‑λ修正的时域率失真优化方法。本发明对新一代编码器AV1提出了一种基于视频序列特征以及QP‑λ修正的时域率失真优化方法,根据此前在HEVC‑RA编码结构下的时域依赖关系以及AV1的特性和视频序列特征,通过构造时域失真传播链,估计当前编码单元及受影响的未来编码单元的聚合失真,计算时域失真传播模型中编码单元的传播因子,进而通过更加准确的传播因子调整拉格朗日乘子实现时域依赖率失真优化,同时对QP‑λ的关系进行重新修正,调整I帧以获得更好的编码效果。

Description

基于视频序列特征和QP-λ修正的时域率失真优化方法
技术领域
本发明属于视频编解码技术领域,具体涉及一种基于视频序列特征和QP-λ修正的时域率失真优化方法。
背景技术
率失真理论(Rate Distortion Theory)是视频编码的理论基础。率失真理论提供了在给定失真的条件下对信源压缩的极限值,或者是在给定码率的条件下能达到的最小失真。率失真优化问题是在比特消耗的限制下,最小化视频编码的失真,从本质上说是一有约束的优化问题,其数学表达如公式所示:
min{D} s.t.R≤Rmax (1.1)
其中D代表失真,R代表编码比特率,Rmax代表最大编码比特率。
但在实际使用当中,有约束的优化问题的求解相对困难,(Sullivan,et al.,1998)中提出了利用拉格朗日乘数法,将有约束的优化问题转化成无约束的优化问题的方法。从根本上来说,(Sullivan,et al.,1998)中的方法是利用拉格朗日乘子将比特消耗折算成失真,进而将有约束的优化问题转换成无约束的优化问题。(Sullivan,et al.,1998)中提出的率失真优化方法,也是视频编码中最常使用的优化方法。
而量化操作是视频编码中产生失真的主要因素,提高量化器性能对提高编码压缩效率有着重要意义。率失真优化的量化就是在给定码率的约束条件下,寻找能使失真最小的量化参数设置。要想确定编码块的最佳量化参数,首先必须确定拉格朗日乘子λ。大量的实验结果表明,λ与量化参数QP之间存在着密切的关系。但随着视频编码的发展,更为复杂的编码结构的引入,比如分级-B(Hierarchical-B)编码结构,以及不同的编码器,都会对(Sullivan,et al.,1998)中发现的λ与QP的关系造成一定的影响。针对不同编码器采用与之相应的λ与QP关系的调整方案,给每一个特定的λ值分配最优的QP,从而提高编码效率。
在使用率失真优化方法的时候,编码器默认的情况是,待优化的编码单元(编码块)之间是相互独立的,即各个编码单元的码率、失真、参数和其他单元没有关系。例如,第k个单元的编码参数(如量化步长、编码模式、运动矢量等)为ok,对应的编码比特为R(ok)、编码失真为D(ok),则上述的率失真优化问题,通过引入全局拉格朗日乘子λg,转换为公式的无约束问题,其中J被称为率失真代价函数。
Figure BDA0002618512220000021
事实上,上式的最优解可看成是代价函数Jk(λ)=Dk(ok)+λgRk(ok)取得极小值时的参数ok,代价函数表示了图1中R-D平面上的一条斜率为λ的直线。实际上,这种将各个编码单元独立处理的方法,实际上是一种局部最优的方法,因为实际视频的各个编码单元是存在依赖关系的。对公式求导可得
Figure BDA0002618512220000022
由此可见,λg是率失真曲线上某个点的负斜率较大的λg对应码率较小,失真较大的可操作点,而较小的λg对应着码率较大,失真较小的可操作点,是影响率失真性能最主要的决定因素,因此拉格朗日乘子λg的选取至关重要,目前AV1(AOMedia Video 1)中λg的大小主要由预先设置好的量化参数QP决定,与输入视频序列无关。
然而由于帧内\帧间预测会在不同编码单元间引入依赖性,对每个编码单元采用独立率失真优化技术并不能使编码性能达到最优。因此需要一种复杂度可以接受的全局率失真优化方法,进一步提升编码效率。
文献Source Distortion Temporal Propagation Analysis for Random-AccessHierarchical Video Coding Optimization中研究了一种RA编码结构下时域率失真优化算法。根据RA配置下的时域依赖关系,建立了多参考帧下的时域失真传播链,估计失真传播程度,计算传播因子,进而根据聚合传播因子调整全局拉格朗日乘子,实现时域率失真优化,解决全局率失真优化问题。
图2给出了AV1默认的时域层级关系,由于AV1默认的GOP大小是16,除时域层级最高的帧以外,其余帧的编码块都会对更高时域层级的帧以及后续帧产生直接或者间接的影响。(AV1默认编码结构类似于HEVC的随机接入视频编码,其编码顺序于解码顺序不一致,需要考虑前向参考和后向参考,所述前向参考为前向参考帧的播放顺序大于当前帧的POC(Picture Order Count,图片顺序计数),反之为后向参考)。图3给出了AV1中主要的参考关系。
在AV1默认编码结构下,对于时域层级最高(TL5)的帧,即rPOC(rPOC即relativePOC,是出现在GOP(Group of Pictures)中相同位置的帧)为1,3,5...15的帧,其优化问题为:
Figure BDA0002618512220000031
对于时域层级TL4的帧,即rPOC为2,6,10,14的帧,其优化问题为:
Figure BDA0002618512220000032
对于时域层级TL3的帧,即rPOC为4,12的帧,其优化问题为:
Figure BDA0002618512220000033
对于时域层级TL2的帧,即rPOC为8的帧,其优化问题为:
Figure BDA0002618512220000034
对于时域层级TL1的帧,即rPOC为0,16的帧,其优化问题为:
Figure BDA0002618512220000035
在高码率情况下,后续编码单元的编码失真可用公式表示:
Figure BDA0002618512220000036
Figure BDA0002618512220000037
是比编码单元Bi+1的运动补偿误差:
Figure BDA0002618512220000038
Fi代表编码单元Bi的原始像素,
Figure BDA0002618512220000041
代表编码单元Bi的重建像素、Fi+1代表编码单元Bi+1的原始像素。
由于该算法此前针对的视频编码标准是HEVC,没有对新一代编码器AV1的特性以及视频序列特征进行相应的调整,也没有对AV1中QP-λ的关系进行重新修正,同时该算法没有对I帧进行调整,而I帧对后续帧的影响非常重要。
发明内容
本发明针对上述问题,对新一代编码器AV1提出了一种基于视频序列特征以及QP-λ修正的时域率失真优化方法,根据此前在HEVC-RA编码结构下的时域依赖关系以及AV1的特性和视频序列特征,通过构造时域失真传播链,估计当前编码单元及受影响的未来编码单元的聚合失真,计算时域失真传播模型中编码单元的传播因子,进而通过更加准确的传播因子调整拉格朗日乘子实现时域依赖率失真优化,同时对QP-λ的关系进行重新修正,调整I帧以获得更好的编码效果。
本发明的技术方案是:
一种基于视频序列特征以及QP-λ修正的时域率失真优化方法的具体步骤如下:
S1、根据AV1默认编码结构中主要时域依赖关系,建立时域传播链(如图4),通过前向运动搜索找出每个原始编码块所影响的匹配块,并记录下相应的原始运动补偿误差(OMCP,Original Motion Compensation Predicted error)和运动矢量;
S2、定义关系模型中的拉格朗日乘子为λnew,量化步长Qstep,根据编码器自带的量化参数QP与量化步长Qstep对应列表,对不同QP的不同序列的拉格朗日乘子与其对应的量化步长Qstep进行统计,构造拉格朗日乘子λnew与量化步长Qstep之间的关系模型,得到关系模型用公式(1.9)-(1.10)表示;
λnew=3.667*Qstep2-5.198e-07*Qstep-0.6664 (1.9)
Figure BDA0002618512220000042
其中λorg是编码器中的拉格朗日乘子
对原始视频序列进行简要分类,采用类似帧差法的方式,计算后续10,20,30...帧相对于初始第一帧的差值的绝对值之和,最后求得累积之和的像素级的平均值,用E表示。对所求结果,按照阈值设置不同的QP和λ调整范围,以及相应的α和I帧QP:
SADi=∑|p0-p10*i| (1.11)
Figure BDA0002618512220000051
Figure BDA0002618512220000052
Figure BDA0002618512220000053
α=clip3(0.90,0.98,1-0.0006*(0.8*E-20)) (1.15)
Figure BDA0002618512220000054
其中SADi指的是第i个差值的绝对值之和,p0代表初始帧的像素值,p10*i代表后续10,20,30...帧的像素值,视频序列总帧数用F表示,宽用W表示,高用H表示。constrainQPrange代表QP最大可调节范围。公式(1.13)是λ的调整范围,λorg代表AV1预先设置的λ。QP0代表I帧的QP(0~255),α代表公式(1.8)的系数,clip3()函数用于将1-0.0006*(0.8*E-20)的计算结果限制在0.90~0.98之间。
S3、在实际编码当前帧前,利用S1获得的原始运动补偿误差和运动矢量计算得到当前帧每个编码块16×16的传播因子,用调和平均的方式求得每个Superblock的平均传播因子。由于AV1默认采用二次编码,利用AV1内置变量pcnt_neutral区分屏幕内容序列,结合S2得到的调整范围对不同视频序列的拉格朗日乘子进行针对性的调整。
S4、根据步骤S2得到的关系模型,定义λnew为通过关系模型计算得到的拉格朗日乘子,计算编码器中拉格朗日乘子λorg与λnew的差值,对不同的差值,利用关系模型公式(1.9)-(1.10)对编码器中的拉格朗日乘子λorg进行修正。
S5、由于AV1中对rPOC为16的帧采用了特殊的ALT帧进行编码,同时rPOC为16的帧处于时域层级TL1,类似于HEVC中的关键帧,其失真会对后续多帧失真产生影响。因此,在AV1编码器对ALT帧内块级拉格朗日乘子调整的基础上,再对其进行缩放以及QP-λ修正,以提高编码效果。
本发明的方案与此前方法的区别点包括,针对不同序列采用了不同的编码策略,以及对AV1中的QP-λ关系进行重新修正,并根据AV1特性进行调整,包括对ALT帧的调整以及对满足阈值序列的I帧进行调整。
本发明的有益效果:
通过对不同序列采用不同的编码策略,以及当前帧中各编码块对后续编码的影响,并对编码器中的拉格朗日乘子λ进行修正,在AV1官方源码libaom-1.0的版本下,在Y分量下获得了平均1.66%的码率节省。
附图说明
图1为率失真曲线;
图2为AV1默认编码结构;
图3为AV1中主要时域依赖关系;
图4为时域失真传播链的构造示意图;
图5为BasketballDrill序列的率失真曲线;
具体实施方式
为了使本发明的目的,技术方案和优点更加清楚,下面结合附图和实施例,详细描述本发明的技术方案。实施例采用开发环境为Visual Studio 2015,实施例基于AV1参考软件libaom-1.0实现。
为了简化全局率失真算法的实现过程,可以通过传播因子κi直接在AV1中修改全局拉格朗日乘子λg。由于后续编码单元在推导传播因子κi时并没有真正被编码,因此需对后续编码单元的失真进行估计。
在高码率情况下,后续编码单元的编码失真可用公式表示:
Figure BDA0002618512220000071
由于编码单元Bi+1没有被编码,Ri+1无法获得,Di+1无法使用公式计算,但在量化步长Qstep下Bi+1的编码失真可表示为
Figure BDA0002618512220000072
Figure BDA0002618512220000073
其中
Figure BDA0002618512220000074
可通过大量量化步长和编码单元的实验拟合出一条F(θ)曲线,此前算法的F(θ)曲线是针对HEVC编码器,在AV1上已经不再适用,在AV1上重新进行实验得到新的曲线,并对曲线上的点进行采样,建立一个F(θ)与θ的查询表,进而估计编码块的失真。同时,本发明将此前设置为固定值的α改为根据视频序列自适应的α。
本发明主要步骤包括:
步骤1:根据AV1默认编码结构中主要时域依赖关系,建立时域传播链(如图4),通过前向运动搜索找出每个原始编码块所影响的匹配块,并记录下相应的OMCP和运动矢量;
步骤2:定义关系模型中的拉格朗日乘子为λnew,量化步长Qstep,根据编码器自带的量化参数QP与量化步长Qstep对应列表,对不同QP的不同序列的拉格朗日乘子与其对应的量化步长Qstep进行统计,构造拉格朗日乘子λnew与量化步长Qstep之间的关系模型,得到关系模型用公式(1.9)-(1.10)表示;
步骤3:对原始视频序列进行简要分类,采用类似帧差法的方式,计算后续10,20,30...帧相当于初始第一帧的差值的绝对值之和,最后求得累积之和的像素级的平均值。对所求结果,按照阈值设置不同的QP和λ调整范围,以及相应的α和I帧QP,用公式(1.11)-(1.16)表示。
步骤4:在实际编码当前帧前,利用S1获得的原始运动补偿误差和运动矢量计算得到当前帧每个编码块16×16的传播因子,用调和平均的方式求得每个Superblock的平均传播因子。由于AV1默认采用二次编码,利用AV1内置变量pcnt_neutral区分屏幕内容序列,结合S21得到的调整范围对不同视频序列的拉格朗日乘子进行针对性的调整。
步骤5:根据步骤S2得到的关系模型,定义λnew为通过关系模型计算得到的拉格朗日乘子,计算编码器中拉格朗日乘子λorg与λnew的差值,对不同的差值,利用关系模型公式(1.9)-(1.10)对编码器中的拉格朗日乘子λorg进行修正。
步骤6:由于AV1中对rPOC为16的帧采用了特殊的ALT帧进行编码,同时rPOC为16的帧处于时域层级TL1,类似于HEVC中的关键帧,其失真会对后续多帧失真产生影响。因此,在AV1编码器对ALT帧内块级拉格朗日乘子调整的基础上,再对其进行缩放以及QP-λ修正,以提高编码效果。
在建立时域传播链时,用大小为16×16的块进行运动搜索,并计算每个块的传播因子,由于AV1中对分辨率大于等于720P的视频序列采用128×128的SuperBlock进行独立划分编码,对小于720P的视频序列采用64×64的SuperBlock进行独立划分编码,所以对SuperBlock内所有16×16的块的传播因子取平均值,作为SuperBlock的传播因子,调整SuperBlock级的拉格朗日乘子和QP。I帧根据所求阈值对部分序列进行调整,
本发明采用AV1参考软件libaom-1.0作为实验平台,实验环境参照JVET规定的通用测试条件CTC(Common Test Conditions),仅在AV1默认编码结构下进行实验,实验测试序列为Class B、C、D、E、F共20个视频序列,每个测试序列使用四个QP点(32,43,53,63)进行编码。参考软件配置为,以BasketballDrill序列为例,--codec=av1-w 832-h 480--fps=50/1--cpu-used=1--threads=0--profile=0--drop-frame=0--static-thresh=0--sharpness=0--frame-parallel=0--tile-columns=0--end-usage=q-v--cq-level=32--psnr--limit=500-o BasketballDrill_832x480_50.yuv.ivf BasketballDrill_832x480_50.yuv
表1本发明相比于libaom-1.0的测试结果
Figure BDA0002618512220000081
Figure BDA0002618512220000091
Figure BDA0002618512220000101
编码实验结果如表1所示,表中显示了测试序列在AV1默认编码结构下Y分量取得了1.66%的编码性能。对于大部分测试序列,本发明性能提升明显,尤其是ClassE,性能提升显著,Y分量下取得了5.03%的码率节省。主要是因为Class E是场景较为固定的视频序列,各视频帧相似度较高,时域依赖性强,本发明对这种序列能取得较好的效果。除此之外,BasketballDrill序列在Y分量下取得了6.21%的码率节省,也是因其背景相对静止。接下来选取部分序列,基于率失真优化曲线对比图,观察它们的编码性能提升情况,如图5为BasketballDrill序列的率失真曲线图,横坐标为编码码率Rate,纵坐标为重建视频峰值信噪比PSNR,其中蓝色曲线是该全局率失真优化算法的率失真曲线,红色曲线是原始libaom-1.0的率失真曲线,可以看出,对于时域依赖性较强的序列,该算法编码效率提升明显。
同样,在编码复杂度方面,该时域率失真优化算法在AV1默认编码结构下的编码复杂度平均减少6%,主要是由于算法中所计算得到的自适应的拉格朗日乘子可使编码单元得到更好的预测效果,虽然在建立时域传播链上耗费了一定的时间,但高质量的预测可使编码残差变小,进而加速变换,量化和熵编码的一系列过程,从而使总体的时间减少。
表2本发明相比于libaom-1.0的编码时间百分比
序列 Class B Class C Class D Class E Class F △EncT
95% 94% 97% 91% 92% 94%

Claims (1)

1.基于视频序列特征和QP-λ修正的时域率失真优化方法,其特征在于,包括以下步骤:
S1、根据AV1默认编码结构中时域依赖关系,建立时域传播链,通过前向运动搜索找出每个原始编码块所影响的匹配块,并记录下相应的原始运动补偿误差和运动矢量;
S2、定义拉格朗日乘子为λnew,量化步长Qstep,根据编码器自带的量化参数QP与量化步长Qstep对应列表,对不同QP的不同序列的拉格朗日乘子λ与其对应的量化步长Qstep进行统计,构造拉格朗日乘子λnew与量化步长Qstep之间的关系模型,得到关系模型为:
λnew=3.667*Qstep2-5.198e-07*Qstep-0.6664
Figure FDA0002618512210000011
其中λorg是编码器中的拉格朗日乘子;
对原始视频序列进行分类,采用帧差法的方式,计算后续10,20,30...帧相对于初始第一帧的差值的绝对值之和,最后求得累积之和的像素级的平均值,用E表示,对所求结果,按照阈值设置不同的QP和λ调整范围,以及相应的α和I帧QP:
SADi=∑|p0-p10*i|
Figure FDA0002618512210000012
Figure FDA0002618512210000013
Figure FDA0002618512210000014
α=clip3(0.90,0.98,1-0.0006*(0.8*E-20))
Figure FDA0002618512210000021
其中SADi指的是第i个差值的绝对值之和,p0代表初始帧的像素值,p10*i代表后续10,20,30...帧的像素值,视频序列总帧数用F表示,宽用W表示,高用H表示,constrainQPrange代表QP最大可调节范围,QP0代表I帧的QP(0~255),α为系数,clip3()函数用于将1-0.0006*(0.8*E-20)的计算结果限制在0.90~0.98之间;
S3、在实际编码当前帧前,利用S1获得的原始运动补偿误差和运动矢量计算得到当前帧每个编码块16×16的传播因子,用调和平均的方式求得每个Superblock的平均传播因子,由于AV1默认采用二次编码,利用AV1内置变量区分屏幕内容序列,结合S2得到的调整范围对不同视频序列的拉格朗日乘子进行针对性的调整;
S4、根据步骤S2得到的关系模型,λnew为通过关系模型计算得到的拉格朗日乘子,计算编码器中拉格朗日乘子λorg与λnew的差值,对不同的差值,利用关系模型公式对编码器中的拉格朗日乘子λorg进行修正;
S5、由于AV1中对rPOC为16的帧采用了特殊的ALT帧进行编码,同时rPOC为16的帧处于时域层级TL1,其失真会对后续多帧失真产生影响,因此,在AV1编码器对ALT帧内块级拉格朗日乘子调整的基础上,再对其进行缩放以及QP-λ修正,以提高编码效果。
CN202010776206.9A 2020-08-05 2020-08-05 基于视频序列特征和QP-λ修正的时域率失真优化方法 Active CN111918068B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN202010776206.9A CN111918068B (zh) 2020-08-05 2020-08-05 基于视频序列特征和QP-λ修正的时域率失真优化方法
PCT/CN2020/132813 WO2022027881A1 (zh) 2020-08-05 2020-11-30 基于视频序列特征和QP-λ修正的时域率失真优化方法
US17/460,360 US11418795B2 (en) 2020-08-05 2021-08-30 Temporal domain rate distortion optimization based on video content characteristic and QP-λcorrection

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010776206.9A CN111918068B (zh) 2020-08-05 2020-08-05 基于视频序列特征和QP-λ修正的时域率失真优化方法

Publications (2)

Publication Number Publication Date
CN111918068A CN111918068A (zh) 2020-11-10
CN111918068B true CN111918068B (zh) 2022-03-08

Family

ID=73287127

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010776206.9A Active CN111918068B (zh) 2020-08-05 2020-08-05 基于视频序列特征和QP-λ修正的时域率失真优化方法

Country Status (2)

Country Link
CN (1) CN111918068B (zh)
WO (1) WO2022027881A1 (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111918068B (zh) * 2020-08-05 2022-03-08 电子科技大学 基于视频序列特征和QP-λ修正的时域率失真优化方法
US11418795B2 (en) 2020-08-05 2022-08-16 University Of Electronic Science And Technology Of China Temporal domain rate distortion optimization based on video content characteristic and QP-λcorrection
CN114554219A (zh) * 2022-02-21 2022-05-27 翱捷科技股份有限公司 一种基于运动检测的率失真优化方法及装置
CN114584536B (zh) * 2022-02-22 2024-03-12 重庆大学 一种基于分区率失真建模的360度流媒体传输方法
CN114915789B (zh) * 2022-04-13 2023-03-14 中南大学 一种帧间的拉格朗日乘子优化方法、系统、设备及介质
CN114866773B (zh) * 2022-05-09 2023-02-28 西安邮电大学 消除时域抖动效应的量化参数级联方法
CN115695801A (zh) * 2022-10-18 2023-02-03 电子科技大学 一种考虑时域失真传播的低复杂度全景视频编码方法
CN116723330B (zh) * 2023-03-28 2024-02-23 成都师范学院 一种自适应球域失真传播链长度的全景视频编码方法
CN116405690B (zh) * 2023-06-01 2023-09-01 中南大学 一种快速帧级自适应拉格朗日乘子优化方法、系统及设备
CN117676136A (zh) * 2023-11-16 2024-03-08 广州群接龙网络科技有限公司 一种群接龙数据处理方法及系统
CN117440158B (zh) * 2023-12-20 2024-04-12 华侨大学 基于三维几何失真的miv沉浸式视频编码率失真优化方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104994382A (zh) * 2015-04-30 2015-10-21 西安电子科技大学 一种感知率失真的优化方法
CN105872545A (zh) * 2016-04-19 2016-08-17 电子科技大学 一种随机接入视频编码中层次化时域率失真优化方法
CN110830801A (zh) * 2018-08-13 2020-02-21 华为技术有限公司 视频编码速率控制方法以及相关装置

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002152759A (ja) * 2000-11-10 2002-05-24 Sony Corp 画像情報変換装置および画像情報変換方法
CN1206864C (zh) * 2002-07-22 2005-06-15 中国科学院计算技术研究所 结合率失真优化的码率控制的方法及其装置
JP5061122B2 (ja) * 2006-01-09 2012-10-31 マティアス・ナロシュケ ハイブリッドなビデオ符号化における予測誤差の適応符号化
US9386317B2 (en) * 2014-09-22 2016-07-05 Sony Interactive Entertainment Inc. Adaptive picture section encoding mode decision control
CN105120282B (zh) * 2015-08-07 2018-08-31 上海交通大学 一种时域依赖的码率控制比特分配方法
CN105872544B (zh) * 2016-04-19 2019-01-01 电子科技大学 低延迟视频编码中时域率失真优化方法
EP3306922A1 (en) * 2016-10-05 2018-04-11 Thomson Licensing Method and apparatus for encoding a picture using rate-distortion based block splitting
CN111314703B (zh) * 2020-03-31 2022-03-08 电子科技大学 一种基于失真类型传播分析的时域率失真优化方法
CN111918068B (zh) * 2020-08-05 2022-03-08 电子科技大学 基于视频序列特征和QP-λ修正的时域率失真优化方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104994382A (zh) * 2015-04-30 2015-10-21 西安电子科技大学 一种感知率失真的优化方法
CN105872545A (zh) * 2016-04-19 2016-08-17 电子科技大学 一种随机接入视频编码中层次化时域率失真优化方法
CN110830801A (zh) * 2018-08-13 2020-02-21 华为技术有限公司 视频编码速率控制方法以及相关装置

Also Published As

Publication number Publication date
WO2022027881A1 (zh) 2022-02-10
CN111918068A (zh) 2020-11-10

Similar Documents

Publication Publication Date Title
CN111918068B (zh) 基于视频序列特征和QP-λ修正的时域率失真优化方法
US8331449B2 (en) Fast encoding method and system using adaptive intra prediction
US7580584B2 (en) Adaptive multiple quantization
US8743956B2 (en) Image encoding method, device thereof, and control program thereof
US9118918B2 (en) Method for rate-distortion optimized transform and quantization through a closed-form operation
WO2021196682A1 (zh) 一种基于失真类型传播分析的时域率失真优化方法
US20070274396A1 (en) Complexity adaptive skip mode estimation for video encoding
US8218624B2 (en) Fractional quantization step sizes for high bit rates
KR20110056326A (ko) 적응형 비디오 인코더 제어 방법
WO2016011796A1 (zh) 一种视频编码中自适应反量化方法及装置
US11356678B2 (en) Decoding jointly coded transform type and subblock pattern information
KR20110051607A (ko) 칼만 필터와 fir 필터를 사용한 동영상 인코더에서의 비트율 제어 방법
WO2024082580A1 (zh) 一种考虑时域失真传播的低复杂度全景视频编码方法
US11418795B2 (en) Temporal domain rate distortion optimization based on video content characteristic and QP-λcorrection
US8194740B2 (en) Apparatus and method for compression-encoding moving picture
Ropert et al. RD spatio-temporal adaptive quantization based on temporal distortion backpropagation in HEVC
KR20090017724A (ko) 동영상 부호화에 있어서 비트 발생 가능성 예측을 이용한블록 모드 결정 방법 및 장치
Pitié et al. Frame-Type Sensitive RDO Control for Content-Adaptive Encoding
Milani et al. A rate control algorithm for the H. 264 encoder
CN116016927A (zh) 一种考虑时域相关性和熵平衡的低延时全景视频编码方法
EP1940176A2 (en) Method and device for coding a sequence of digitized images
Tang et al. A Generalized Rate-Distortion-${\lambda} $ Model Based HEVC Rate Control Algorithm
Huang et al. A novel two-pass VBR coding algorithm for the H. 264/AVC video coder based on a new analytical RD model
Jung et al. HEVC encoder optimization for HDR video coding based on perceptual block merging
JP2024000443A (ja) 映像符号化装置及びプログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant