CN108429911A - 一种高效视频编码率失真优化量化方法 - Google Patents
一种高效视频编码率失真优化量化方法 Download PDFInfo
- Publication number
- CN108429911A CN108429911A CN201710081906.4A CN201710081906A CN108429911A CN 108429911 A CN108429911 A CN 108429911A CN 201710081906 A CN201710081906 A CN 201710081906A CN 108429911 A CN108429911 A CN 108429911A
- Authority
- CN
- China
- Prior art keywords
- path
- sub
- block
- subpath
- video coding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/13—Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/147—Data rate or code amount at the encoder output according to rate distortion criteria
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本发明公开了一种高效视频编码率失真优化量化方法,该方法将待处理的TB分割为子块,将扫描顺序上连续的多个系数称为路径,将子块内部的路径部分称为子路径,将该率失真优化量化方法转换为TB内部的最佳路径搜索以及各子块内部的最佳路径搜索,最佳路径搜索均以找到度量最低的合法路径为目标,路径的度量为其拉格朗日代价,本发明在硬件上更容易执行,可以配合精确码率估计,并具有固定的延迟以及合理的吞吐率。
Description
技术领域
本发明涉及数字视频处理领域,特别是涉及一种高效视频编码率失真优化量化方法。
背景技术
为了支持下一代的高清视频应用HEVC,联合视频编码组(Joint CollaborativeTeam on Video Coding,JVT-VC)提出了高效视频编码(High Efficiency Video Coding,HEVC)作为新一代的通用视频编码标准。借助可扩展的4叉树分解及各类先进的编码工具,HEVC可以适应多变的分辨率/终端/场景,并能够在一半的比特率下提供接近于先进视频编码(Advanced Video Coding,AVC)质量的视频。
在这些先进编码工具中,率失真优化方法(Rate-Distortion Optimization,RDO)是重要的一项。RDO引入编码过程自AVC起,但在HEVC中RDO的应用范围更为广泛,其贯穿HEVC的整个编码流程。
对于一个有损视频编码标准,码率与失真通常为负相关。更高的压缩率带来更低的码率但同时会增加失真,反之亦然。为了做出适当的折衷,考虑拉格朗日率失真(Rate-Distortion,RD)公式:
J=D+λR
其中J为代价,D为失真,R为码率(率),λ为拉格朗日系数。则RDO过程即调整编码过程使J最小化的过程。
理论上RDO在编码的各个牵涉选择的环节中都可以应用,在量化环节中,RDO与量化结合的产物即率失真优化量化(Rate-Distortion Optimized Quantization,RDOQ)。与普通的量化方法中独立的处理每一个变换系数不同,RDOQ在编码过程中通过RDO方法对变换系数的多个量化值进行选择,从而提升编码器在RD指标下编码性能的过程。相比普通的量化步骤,RDOQ可以提升0.5dB的编码性能之多。
HEVC的量化编码基本单元是变换块(Transform Block,TB)。亮度TB及相关的色度TB组成量化单元(Transform Unit,TU)。本质上,HEVC的RDOQ是在TB内所有系数构成的空间内以拉格朗日率失真公式为代价函数,寻找RD代价最小点的过程。HEVC的可伸缩特性导致TB的尺寸可以小到4×4块,大到32×32块。HEVC的TB最多可包含32×32=1024个系数,考虑到变换系数空间的体积随系数数量增加呈指数方式增长,因此一般来说对整个系数空间进行测试是不可能的。为了解决这个问题,HEVC的参考模型HM中按照以下的步骤实现RDOQ以将运算量降低至可以软件实现的程度:
步骤一,块扫描:待处理的TB被分割为子块,每个子块大小为4x4个变换系数。各个子块按HEVC规定的扫描顺序依次进行处理。不同的预测模式下扫描顺序可能不同,但高频系数通常总是排在前面。这一步骤与所述普通的量化步骤相同。
1.1扫描:对于当前正在处理的子块Bi,按HEVC标准所指定的扫描顺序将其转化为16x1的一维数组(不同的预测模式下扫描顺序可能不同,但高频系数通常总是排在前面)。这一步骤与所述普通的量化步骤相同。
1.1.1量化及单系数的优化:依次重复对于每一个16×1的系数进行量化操作。
sgn(c)=sgn(Yi,j)
其中|c|为量化后系数的幅值,sgn(c)为量化后系数的符号。
GMF为乘数因子,是一个与量化参数(quantization parameter,QP)相关的常数。f为量化偏移。为向下取整操作。i为子块的索引,j为子块内系数的索引,两者均按HEVC标准的扫描顺序。
由于在HEVC码流中|c|与sgn(c)分别存储,因此并不需要确实将系数c计算出来。
以上过程与HEVC普通的量化步骤相同,但f的定义存在差异,细节不再赘述。
1.1.2 RDOQ过程中,对每一个系数Yi,j,会尝试将其量化为以下的量化值:
sgn(ci,j)=sgn(c)
注意多个分支可以同时成立,|ci,j|最多有三种可能性。
对于每一个不同的量化值ci,j分别计算其R及D,并使用RD代价函数计算其代价J,随后在三者中选出使得J取得最小的ci,j,记其为由于J的精确值对于选择量化系数而言并不重要,此处可以仅计算不同量化值下J的差异。
J的计算中,D由于变换的正交性因此可以直接在变换域中计算,不再赘述。而R的计算相对比较复杂。HEVC中与TB相关的率包含以下部分:
首先是每个TB只存在一份的语法元素引入的率,方便起见我们称其为子块间率,其中:
R0:编码TskipFlag引入的率(对应语法元素transform_skip_flag);
R1:编码LastXY引入的率(对应语法元素last_sig_coeff_x_prefix/last_sig_coeff_y_prefix/last_sig_coeff_x_suffix/last_sig_coeff_y_prefix);
而后是各子块Bi引入的率,方便起见我们称其为子块内率,其中:
R2,i:子块Bi的CBF(Coefficient Block Flag,对应语法元素significant_coeff_group_flag)引入的率
R3,i:子块Bi的SCF(Significant Coefficient Flag,对应语法元素significant_coeff_flag)/GTR1(Greater than 1,对应语法元素coeff_abs_level_greater1_flag)/GTR2(Greater than 2,对应语法元素coeff_abs_level_greater2_flag)/CSF(对应语法元素coeff_sign_flag)/CR(对应语法元素coeff_abs_level_remaining)引入的率。
TB的率R就是以上各项之和
其中NTB为TB包含的子块数量。
由于HEVC采用基于句法的上下文自适应二进制算术编码(Syntax-basedcontext-adaptive Binary Arithmetic Coding,Syntax-based CABAC),率的估计是一个较为复杂的问题,。本质上率估计方法是对于CABAC编码器生成码流长度的估计,而这个长度是由CABAC编码器内部上下文所经历的编码内容历史所决定的,也就是说任何一个系数所带来的率,受到之前所有共享同一上下文索引的系数的影响。因此对于所有共用上下文模型的系数而言,一个精确的估计需要严格的按照编码顺序逐个的进行。这严格的限制了率估计算法的并行度,也意味着对率估计算法吞吐率的限制。为此HM使用了基于表的快速率估计方法,对于其细节不再赘述,但这一方法并不适合硬件实现。
1.2计算完成Bi内所有后,计算Bi的总率R2,i+R3,i与总失真Di,并使用RD代价函数计算Bi的总代价Ji。
1.3如果Bi包含第一个非零系数或者i=NTB-1,那么执行步骤0。否则计算将设置为全0时的代价J′i,并将其与Ji相比。如果更小则将设置为全0,反之维持不变。
1.4若i=NTB则跳至步骤二,否则i←i+1并重复步骤0。
步骤二,按HEVC标准规定的扫描顺序,从TB内第一个系数开始依次检查每一个绝对值等于1的计算将及之前的所有系数置0后TB的总代价,直到发现一个绝对值大于1的系数或者检查完所有的系数为止。将这个过程中找到的具有最小总代价的系数位置及其之前的系数全部置为0。
步骤三,如果语法元素sign_data_hide_enable_flag置0,那么RDOQ过程到此结束,否则进行步骤四。
步骤四,按HEVC规定的扫描顺序对于每一个子块Bi,按HEVC规定的扫描顺序对每一个系数依次进行。
步骤4.1,检查当前子块Bi内最后一个系数的极性,如果是正的且子块内所有系数和为偶数或者为负的且所有系数为奇数,则选择下一个子块,并重复步骤4.1,如果没有下一个子块,则结束RDOQ过程。
步骤4.2,从子块的第一个系数开始,将一个系数-1或者+1,如果系数原先为0则只选择与Yi,j相同的1或者-1。计算修改后的总代价。重复以上步骤并比较依次修改所有16个系数后的总代价,选择总代价最低的修改方式。
步骤4.3,跳转步骤4.1直至TB内全部子块被处理完毕。
HM中的RDOQ过程相当复杂,需要依次的执行4个步骤。特别的,四个步骤中需要反复的扫描系数以更新率估计,无法并行化,这对于实现一个具有可接受吞吐率的RDOQ硬件模块不利。
发明内容
为克服上述现有技术存在的不足,本发明之目的在于提供一种适用于HEVC硬件编码器的率失真优化量化方法,其在硬件上更容易执行,可以配合精确率估计,并具有固定的延迟以及合理的吞吐率。
为达上述及其它目的,本发明提出一种高效视频编码率失真优化量化方法,其特征在于:将待处理的TB分割为子块,将扫描顺序上连续的多个系数称为路径,将子块内部的路径部分称为子路径,将该率失真优化量化方法转换为TB内部的最佳路径搜索以及各子块内部的最佳路径搜索,最佳路径搜索均以找到度量最低的合法路径为目标,路径的度量为其拉格朗日代价
进一步地,于TB内部的最佳路径搜索中,将各个子路径的全0/非全0状态视为状态空间,并使用M算法进行搜索以获取最低代价的路径。
进一步地,于TB内部的最佳路径搜索中,限制路径为一条非全0路径以及一条全0路径。
进一步地,该TB内部的最佳路径搜索的搜索过程为:
将非全0路径P0初始化代价Γ0为Γinf,Γinf为无穷大,全0路径P′0初始化代价Γ′0为0,子块的索引值i=0,n按HEVC标准规定的扫描顺序对子块进行索引;
对当前子块Bi进行搜索,执行子块Bi内部的最佳路径搜索,得到通过Bi的最优路径pi及其度量ρi、全零路径及其度量
计算将Bi编码为非0/全0块需要的率R2,i及R′2,i;
更新路径;
更新i←i+1,←表示赋值操作。
重复以上步骤直至i=NTB;
比较与
若那么
否则
其中PRDOQ即为TB通过RDOQ后获得的量化结果。
进一步地,更新路径操作如下:
Γi+1=ρi+λR2,i
Pi+1=pi
对路径及子路径的“+”操作表示连接以获得延长后的路径。
进一步地,于子块内部的最佳路径搜索中,将每个子块按照HEVC标准规定的扫描顺序转化为16×1的序列。而每一个系数Yi,j选择两个或者三个量化值,子块内所有的系数的可能状态组成了一个16×3的空间。
进一步地,将子块内的子路径搜索问题转换为在16×3的格点上寻找最优路径的问题。
进一步地,于子块内部的最佳路径搜索中,使用M算法在格点上进行搜索。
进一步地,子块内部的最佳路径搜索过程如下:
首先初始化子路径,子路径pi,0,0~pi,0,1起始于两个起始状态,起始点对应子块外部的路径,分别等于Pi及P′i,路径度量ρi,0,0~ρi,0,1使用对应Γi及Γi′进行初始化,ρi,0,2~ρi,0,M-1则初始化为ρinf,
每一个系数Yi,j的量化值有2或者3种可能,将其记为si,j,0~si,j,2,分别对应于系数Yi,j被量化为不同的值,其中
si,j,0:|ci,j|=0
其中某些量化值si,j,x可能小于0或者与其他量化值si,j,y重复且y<x,此时设定bi,j,m,x=ρinf,否则令bi,j,m,x为将路径pi,j,m延伸至系数si,j,x所增加的度量值,称为分支度量,此延伸称为分支,此系数si,j,m称为si,j,m,x;
每一步的搜索中子路径的数量从M增加为3M条:
ρ′i,j+1,m,x=ρi,j,m+bi,j,m,x
p′i,j+1,m,x=pi,j,m+si,j,m,x;
其中x∈[0,2]
对ρ′i,j+1,m,j进行排序,选出对应ρ最小的M条子路径保存下来,即留存子路径pi,j+1,m;在排序过程中保留一条路径它始于P′i且在每个分支上都选择si,j,0,即有:
如果语法元素sign_data_hide_enable_flag置1,那么保证所有留存路径被排序时在路径以外有一条路径满足以下约束之一:
js≥12
如果度量最小的M条子路径(不包括)中没有满足约束的子路径,则按ρ′i+1,m,j从小到大顺序第一条满足上述约束的子路径用来取代M条路径中度量最大的一条路径(不包括),
以上过程将重复,且每一步j会递增直至j=16。
此时,若sign_data_hide_enable_flag=0,则
pi=p′i,M,0
其他情况下,
pi=p′i,M,t
其中t为满足约束
js≥12
的最小自然数,即为当前子块Bi的子路径搜索结果,对当前子块Bi进行搜索过程结束。
与现有技术相比,本发明是一种适用于HEVC硬件编码器的率失真优化量化方法,通过将RDOQ问题转化为TB内部的最佳路径搜索问题以及子块内的最佳路径搜索问题,整个最佳路径搜索过程中每一个变换系数都只需要一次处理,无需反复的扫描过程,使得其在硬件上更容易执行,能够配合精确率估计,并具有固定的延迟以及合理的吞吐率。
附图说明
图1为本发明较佳实施例中子块间路径搜索示意图;
图2为本发明较佳实施例中子块内部的路径搜索示意图。
具体实施方式
以下通过特定的具体实例并结合附图说明本发明的实施方式,本领域技术人员可由本说明书所揭示的内容轻易地了解本发明的其它优点与功效。本发明亦可通过其它不同的具体实例加以施行或应用,本说明书中的各项细节亦可基于不同观点与应用,在不背离本发明的精神下进行各种修饰与变更。
本发明将量化后系数全部为0的子块称为全0子块,其余情况则称为非全零子块。将扫描顺序上连续的多个系数称为路径,将子块内部的路径部分称为子路径,则本发明把RDOQ问题分解为两个部分:TB内部的最佳路径搜索以及子块内部的最佳路径搜索。最佳路径搜索均以找到度量最低的合法路径为目标,而路径的度量即其拉格朗日代价。
先来看TB子块间的搜索,请参考图1所示。可以将各个子路径的全0/非全0状态视为状态空间,并使用M算法(通信领域常用的一类算法)进行搜索以获取最低代价的路径,称为块间路径。但由于块间路径会通过CBF以及CABAC编码器的上下文状态影响子路径的最优值。因此每一块间路径都可能对应子块内不同的最优解,这带来子块内搜索额外的运算量。因此本发明中限制块间路径为一条非全0路径(路径上存在至少一个子块非全0)以及一条全0路径(路径上所有子块都是全0)。由于计算全0路径的代价不需要搜索,因此在子块内搜索最佳子路径时只需要对非0路径进行搜索操作,这降低了运算量,简化了硬件实现。
具体地,TB子块间的搜索过程如下:
将非全0路径P0初始化代价Γ0为Γinf,Γinf为正无穷大,全0路径P′0初始化代价Γ′0为0,子块的索引值i=0,按HEVC标准规定的扫描顺序对子块进行索引。
首先对当前子块Bi进行搜索,执行后续子块内的最佳路径搜索,得到通过Bi的最优路径pi及其度量ρi、全零路径及其度量
而后计算将Bi编码为非0/全0块需要的率R2,i及R′2,i。
随后更新路径:
Γi+1=ρi+λR2,i
Pi+1=pi
对路径及子路径的“+”操作表示连接以获得延长后的路径。
而后更新i←i+1,←表示赋值操作。
重复以上步骤直至i=NTB。
此时比较与
如果那么
否则
其中PRDOQ即为TB通过RDOQ后获得的量化结果。
以下说明子块内的最佳路径搜索问题,请参考图2所示:
一个子块按照HEVC标准规定的扫描顺序可以转化为16×1的序列。而每一个系数Yi,j可以选择两个或者三个量化值,与背景技术中的步骤0一致,对应着两个或者三个状态。简单起见认为所有系数都可以量化为3个值,但其中某个状态在搜索中不可到达。则子块内所有的系数的可能状态组成了一个16×3的空间。那么子块内的子路径搜索问题也就转换为在16×3的格点上寻找最优路径的问题,其中最优的含义为子路径对应的量化系数在RD判据下具有最低的代价。由于率与路径相关的特性,路径上各个格点所带来的代价与路径历史本身相关,因此在16×3的格点上的Viterbi算法并不能保证获得最优解。因此本发明使用M算法在格点上进行搜索工作。
在搜索过程中,对于每一个系数Yi,j,一共保留M条子路径pi,j,0~pi,j,M-1,其对应的子路径度量为ρi,j,0~ρi,j,M-1。且ρi,j,x≤ρi,j,y,0≤x≤y<M。此处的路径为前述路径Pn及P′n在子块中的延伸部分。i表示正在处理的系数在子块内的索引,i也表示子路径的长度,且i∈[0,16]。特别的,p0,0~p0,M-1为初始状态。但由于搜索起始路径只有两个(Pn及P′n),因此最开始有可能有效子路径数<M,此时只保持部分子路径有效。其余子路径的度量将被设置为无穷大ρinf(但实现可能使用一个无法达到的大数字),这使得它们无效。一般的,随着搜索的进行,有效子路径数会迅速的增加以至于它会大于任何合理的M值。
首先初始化子路径,子路径pi,0,0~pi,0,1起始于两个起始状态,起始点对应子块外部的路径,分别等于Pi及P′i。路径度量ρi,0,0~ρi,0,1使用对应Γi及Γi′进行初始化。ρi,0,2~ρi,0,M-1则初始化为ρinf。
由于每一个系数Yi,j的量化值有2或者3种可能,我们将其记为si,j,0~si,j,2,分别对应于系数Yi,j被量化为不同的值。
si,j,0:|ci,j|=0
此过程与背景技术中的步骤0一致,不同之处在于si,j,0对于任何Yi,j都可用,某些量化值si,j,x可能小于0或者与其他量化值si,j,y重复且y<x,此时设定bi,j,m,x=ρinf,否则令bi,j,m,x为将路径pi,j,m延伸至系数si,j,x所增加的度量值,称为分支度量,此延伸称为分支,此系数si,j,m称为si,j,m,x。这是为了简化全0路径的处理。
因此在每一步的搜索中,j增加1,对应于每一条子路径pi,j,m存在分支到达状态s0~s2,分支对应的度量为bi,j,m,0~bi,j,m,2,即编码Yi,j增加的代价。考虑到代价的定义,即有ΔJ=ΔD+λΔR,即可以通过编码Yi,j所增加的失真ΔD以及率ΔR算出。由于每次仅需考虑一个系数的增量,这一过程适合硬件实现,并可使用精确的率估计方法以相对HM的近似率估计算法进一步的提升性能,细节不再赘述。对于不可到达或者由于重复需要删除的状态则通过设定其度量为无穷大实现。因此每一步的搜索中子路径的数量从M增加为3M:
ρ′i,j+1,m,x=ρi,j,m+bi,j,m,x
p′i,j+1,m,x=pi,j,m+si,j,m,x
在标准的M算法中,后续会对ρ′i,j+1,m,j进行排序,选出对应ρ最小的M条子路径保存下来,即留存子路径pi,j+1,m。但由于RDOQ的一些特别的要求,在排序过程中增加了以下的特别处理:
由于削除高频系数中幅值等于1的尾部可能带来额外的收益,因此在排序过程中会特别保留一条路径它始于P′i且在每个分支上都选择si,j,0。即有:
特别的,当向任何一个非0状态分支时,这个状态都对应TB内第一个非零系数,因此这一分支所带来的代价需要计入λR1。相对的,其他所有的分支都不需要考虑这一代价,这简化了计算。在所述排序过程中,不会被丢弃:如果不能排入ρ′i,j+1,m,j的M个最小值之一,则会在排序完成后取代pi,j+1,M-1
另外一方面,HEVC标准规定,如果sign_data_hide_enable_flag置1,那么需要保证最后选择的子路径p满足以下约束之一:
js-je≥4
其中js,je∈[0,15]。且ci,x=0,x∈[0,js-1]。ci,x=0,x∈[je+1,15]
此约束通过保证所有留存路径被排序时在路径以外有一条路径满足以下约束之一:
js≥12
注意一定满足约束,但它的代价可能很大,因此它被排除在外。如果度量最小的M条子路径(不包括)中没有满足约束的子路径,则按ρ′i+1,m,j从小到大顺序第一条满足上述约束的子路径将被用来取代M条路径中代价最大的一条路径(不包括)。可以证明在任何情况下这一过程一定可以实施。这保证当搜索达到子块内终点时,一定存在一条路径满足约束。相比HM的RDOQ搜索过程,这一过程的性能损失可以忽略。
以上过程将重复,且每一步j会递增直至j=16。
此时,若sign_data_hide_enable_flag=0,则
pi=p′i,16,0
其他情况下,
pi=p′i,16,t
其中t为满足约束
js≥12
的最小自然数,即为这个子块的子路径搜索结果。
由于整个过程中每一个系数都只需要一次处理,无需反复的扫描过程,因此以上的过程可以在硬件上容易的执行,并具有固定的延迟以及合理的吞吐率。特别的,由于只需要扫描一次系数并逐个的处理,本方法可以方便的与精确的CABAC码率计算而不只是近似码率估计相结合。M=3时,RD性能与HM的RDOQ方法相当,且M越大RD性能越好。通过调整M值,即可获得不同的性能-硬件复杂度折中,这使本发明可以适应更大的应用范围。
上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何本领域技术人员均可在不违背本发明的精神及范畴下,对上述实施例进行修饰与改变。因此,本发明的权利保护范围,应如权利要求书所列。
Claims (9)
1.一种高效视频编码率失真优化量化方法,其特征在于:该方法将待处理的TB分割为子块,将扫描顺序上连续的多个系数称为路径,将子块内部的路径部分称为子路径,将该率失真优化量化方法转换为TB内部的最佳路径搜索以及各子块内部的最佳路径搜索,最佳路径搜索均以找到度量最低的合法路径为目标,路径的度量为其拉格朗日代价。
2.如权利要求1所述的一种高效视频编码率失真优化量化方法,其特征在于:于TB内部的最佳路径搜索中,将各个子路径的全0/非全0状态视为状态空间,并使用M算法进行搜索以获取最低代价的路径。
3.如权利要求2所述的一种高效视频编码率失真优化量化方法,其特征在于:于TB内部的最佳路径搜索中,限制路径为一条非全0路径以及一条全0路径。
4.如权利要求3所述的一种高效视频编码率失真优化量化方法,其特征在于,该TB内部的最佳路径搜索的搜索过程为:
将非全0路径P0初始化代价Γ0为Γinf,Γinf为正无穷大,全0路径P′0初始化代价Γ′0为0,子块的索引值i=0,按HEVC标准规定的扫描顺序对子块进行索引;
对当前子块Bi进行搜索,执行子块Bi内部的最佳路径搜索,得到通过Bi的最佳路径pi及其度量ρi、全零路径及其度量
计算将Bi编码为非0/全0块需要的率R2,i及R′2,i;
更新路径;
更新i←i+1,←表示赋值操作。
重复以上步骤直至i=NTB;
比较与
若那么
否则
其中PRDOQ即为TB通过RDOQ后获得的量化结果。
5.如权利要求4所述的一种高效视频编码率失真优化量化方法,其特征在于,更新路径操作如下:
Γi+1=ρi+λR2,i
Pi+1=pi
对路径及子路径的“+”操作表示连接以获得延长后的路径。
6.如权利要求5所述的一种高效视频编码率失真优化量化方法,其特征在于,于子块内部的最佳路径搜索中,将每个子块按照HEVC标准规定的扫描顺序转化为16×1的序列,而每一个系数Yi,j选择两个或者三个量化值,子块内所有的系数的可能状态组成了一个16×3的空间。
7.如权利要求6所述的一种高效视频编码率失真优化量化方法,其特征在于:将子块内的子路径搜索问题转换为在16×3的格点上寻找最优路径的问题。
8.如权利要求7所述的一种高效视频编码率失真优化量化方法,其特征在于:于子块内部的最佳路径搜索中,使用M算法在格点上进行搜索。
9.如权利要求8所述的一种高效视频编码率失真优化量化方法,其特征在于,子块内部的最佳路径搜索过程如下:
首先初始化子路径,子路径pi,0,0~pi,0,1起始于两个起始状态,起始点对应子块外部的路径,分别等于Pi及P′i,路径度量ρi,0,0~ρi,0,1使用对应Γi及Γi′进行初始化,ρi,0,2~ρi,0,M-1则初始化为ρinf,ρinf为正无穷大。
每一个系数Yi,j的量化值有2或者3种可能,将其记为si,j,0~si,j,2,分别对应于系数Yi,j被量化为不同的值,其中
si,j,0:|ci,j|=0
其中某些量化值si,j,x可能小于0或者与其他量化值si,j,y重复且y<x,此时设定bi,j,m,x=ρinf,否则令bi,j,m,x为将路径pi,j,m延伸至系数si,j,x所增加的度量值,称为分支度量,此延伸称为分支,此系数si,j,m称为si,j,m,x;
每一步的搜索中,子路径的数量从M增加为3M条:
ρ′i,j+1,m,x=ρi,j,m+bi,j,m,x
p′i,j+1,m,x=pi,j,m+si,j,m,x;
其中x∈[0,2]
对ρ′i,j+1,m,j进行排序,选出对应ρ最小的M条子路径保存下来,即留存子路径pi,j+1,m在排序过程中保留一条路径它始于P′i且在每个分支上都选择si,j,0,即有:
如果语法元素sign_data_hide_enable_flag置1,那么保证所有子路径被排序时,在路径以外有一条路径满足以下约束之一:
js≥12
如果度量最小的M条子路径(不包括)中没有满足所述约束的子路径,则用ρ′i+1,m,j从小到大顺序的第一条满足上述约束的子路径取代M条路径中度量最大的一条路径(不包括),
以上过程将重复,且每一步j会递增直至j=16。
此时,若sign_data_hide_enable_flag=0,则
pi=p′i,16,0
其他情况下,
pi=p′i,16,t
其中t为满足约束
js≥12
的最小自然数,即为当前子块Bi的子路径搜索结果,对当前子块Bi进行搜索过程结束。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710081906.4A CN108429911B (zh) | 2017-02-15 | 2017-02-15 | 一种高效视频编码率失真优化量化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710081906.4A CN108429911B (zh) | 2017-02-15 | 2017-02-15 | 一种高效视频编码率失真优化量化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108429911A true CN108429911A (zh) | 2018-08-21 |
CN108429911B CN108429911B (zh) | 2020-10-27 |
Family
ID=63155519
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710081906.4A Active CN108429911B (zh) | 2017-02-15 | 2017-02-15 | 一种高效视频编码率失真优化量化方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108429911B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109951392A (zh) * | 2019-01-31 | 2019-06-28 | 武汉大学 | 一种基于深度学习的中大型网络智能路由选择方法 |
CN111726618A (zh) * | 2020-06-29 | 2020-09-29 | 上海富瀚微电子股份有限公司 | Rdoq的最优量化值的计算方法 |
WO2023202158A1 (zh) * | 2022-04-18 | 2023-10-26 | 上海哔哩哔哩科技有限公司 | 视频编码方法及装置 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007079964A1 (en) * | 2006-01-09 | 2007-07-19 | Matthias Narroschke | Adaptive coding of a prediction error in hybrid video coding |
CN101014128A (zh) * | 2007-02-02 | 2007-08-08 | 清华大学 | H.264/avc视频编码中速率和失真的快速估计方法 |
CN102055980A (zh) * | 2010-12-31 | 2011-05-11 | 北京大学深圳研究生院 | 用于视频编码器的帧内预测电路及其实现方法 |
FR2927758B1 (fr) * | 2008-02-15 | 2011-08-26 | Ateme Sa | Procede et dispositif de codage-decodage d'images video successives selon un flux video principal en pleine resolution et selon un flux video secondaire en qualite reduite |
CN104010196A (zh) * | 2014-03-14 | 2014-08-27 | 北方工业大学 | 基于hevc的3d质量可伸缩视频编码 |
US20160150230A1 (en) * | 2014-11-25 | 2016-05-26 | Blackberry Limited | Perceptual image and video coding |
CN106331715A (zh) * | 2016-08-24 | 2017-01-11 | 上海富瀚微电子股份有限公司 | 基于视频压缩编码标准h.265的熵编码系统及其编码方法 |
-
2017
- 2017-02-15 CN CN201710081906.4A patent/CN108429911B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007079964A1 (en) * | 2006-01-09 | 2007-07-19 | Matthias Narroschke | Adaptive coding of a prediction error in hybrid video coding |
CN101014128A (zh) * | 2007-02-02 | 2007-08-08 | 清华大学 | H.264/avc视频编码中速率和失真的快速估计方法 |
FR2927758B1 (fr) * | 2008-02-15 | 2011-08-26 | Ateme Sa | Procede et dispositif de codage-decodage d'images video successives selon un flux video principal en pleine resolution et selon un flux video secondaire en qualite reduite |
CN102055980A (zh) * | 2010-12-31 | 2011-05-11 | 北京大学深圳研究生院 | 用于视频编码器的帧内预测电路及其实现方法 |
CN104010196A (zh) * | 2014-03-14 | 2014-08-27 | 北方工业大学 | 基于hevc的3d质量可伸缩视频编码 |
US20160150230A1 (en) * | 2014-11-25 | 2016-05-26 | Blackberry Limited | Perceptual image and video coding |
CN106331715A (zh) * | 2016-08-24 | 2017-01-11 | 上海富瀚微电子股份有限公司 | 基于视频压缩编码标准h.265的熵编码系统及其编码方法 |
Non-Patent Citations (1)
Title |
---|
郭龙盛,殷海兵,徐宁: "基于失真-量化模型的视频编码算法优化", 《电视技术》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109951392A (zh) * | 2019-01-31 | 2019-06-28 | 武汉大学 | 一种基于深度学习的中大型网络智能路由选择方法 |
CN109951392B (zh) * | 2019-01-31 | 2021-07-02 | 武汉大学 | 一种基于深度学习的中大型网络智能路由选择方法 |
CN111726618A (zh) * | 2020-06-29 | 2020-09-29 | 上海富瀚微电子股份有限公司 | Rdoq的最优量化值的计算方法 |
CN111726618B (zh) * | 2020-06-29 | 2022-11-18 | 上海富瀚微电子股份有限公司 | Rdoq的最优量化值的计算方法 |
WO2023202158A1 (zh) * | 2022-04-18 | 2023-10-26 | 上海哔哩哔哩科技有限公司 | 视频编码方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN108429911B (zh) | 2020-10-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI748201B (zh) | 適於相依純量量化之變換係數熵寫碼技術 | |
CN104221373B (zh) | 用于采样自适应偏移代码化和/或信号通知的设备和方法 | |
KR102314801B1 (ko) | 비디오 압축에서의 엔트로피 코딩을 위한 선택적 혼합 | |
JP6284954B2 (ja) | イントラ予測のためのモード決定の簡略化 | |
JP6445001B2 (ja) | ビデオコーディングプロセスにおける係数レベルコーディングのためのライスパラメータ初期化 | |
JP5944459B2 (ja) | サイズとイントラモードとに基づいて又はエッジ検出に基づいてイントラブロック符号化の周波数変換を適応させること | |
KR101632776B1 (ko) | 비디오 코딩에 대한 구문 엘리먼트들의 공동 코딩 | |
JP5940726B2 (ja) | ビデオコーディングにおけるバイパスコーディングされたシンタックス要素のグループ化 | |
KR102613155B1 (ko) | 종속 스칼라 양자화를 사용하거나 이와 조합하는 데에적합한 변환 계수의 효율적인 코딩 | |
CN107743239B (zh) | 一种视频数据编码、解码的方法及装置 | |
EP2596634A1 (en) | Video compression using multiple variable length coding methods for multiple types of transform coefficient blocks | |
CN105828076A (zh) | 在hevc中的采样自适应偏移中的灵活带偏移模式 | |
CN108429911A (zh) | 一种高效视频编码率失真优化量化方法 | |
Sze et al. | A comparison of cabac throughput for hevc/h. 265 vs. avc/h. 264 | |
TW201919398A (zh) | 視頻數據解碼方法及裝置 | |
KR20120084168A (ko) | 비디오 인코딩 모드 선택 방법 및 이를 수행하는 비디오 인코딩 장치 | |
Tan et al. | Image compression technique utilizing reference points coding with threshold values | |
Zhou et al. | Distributed video coding using interval overlapped arithmetic coding | |
Lan et al. | Compound image compression using lossless and lossy LZMA in HEVC | |
Arrufat et al. | Mode-dependent transform competition for HEVC | |
Li et al. | High-speed rate estimation based on parallel processing for H. 264/AVC CABAC encoder | |
Wahiba et al. | Implementation of parallel-pipeline H. 265 CABAC decoder on FPGA | |
CN114731446A (zh) | 用于信息值序列的编码概念 | |
Kim et al. | Improved Lossless Compression Algorithm in HEVC | |
EP2636219A1 (en) | Joint coding of syntax elements for video coding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |