CN107257461B - 基于上下文自适应偏移模型的视音频编码硬判决量化方法 - Google Patents

基于上下文自适应偏移模型的视音频编码硬判决量化方法 Download PDF

Info

Publication number
CN107257461B
CN107257461B CN201710273935.0A CN201710273935A CN107257461B CN 107257461 B CN107257461 B CN 107257461B CN 201710273935 A CN201710273935 A CN 201710273935A CN 107257461 B CN107257461 B CN 107257461B
Authority
CN
China
Prior art keywords
coefficient
saved
adaptive
quantization
hdq
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710273935.0A
Other languages
English (en)
Other versions
CN107257461A (zh
Inventor
夏哲雷
魏新秀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Jiliang University
Original Assignee
China Jiliang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Jiliang University filed Critical China Jiliang University
Priority to CN201710273935.0A priority Critical patent/CN107257461B/zh
Publication of CN107257461A publication Critical patent/CN107257461A/zh
Application granted granted Critical
Publication of CN107257461B publication Critical patent/CN107257461B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding

Abstract

本发明公开了一种基于上下文自适应的HDQ量化方法,采用上下文自适应量化偏移模型,实现上下文及码率阈值自适应的量化算法。该模型通过模拟最佳软判决量化特点,引入系数间的相关性,在硬判决量化基础上提出一种新的CABAC上下文自适应偏移模型。该模型统计了码率实际节省情况,利用贝叶斯二值判别法计算出可区分量化结果的最佳阈值,利用模型实现阈值与码率对偏移量的动态调节。实验表明基于本文的上下文自适应偏移模型适合硬件编码器架构设计实现,算法性能逼近最优SDQ量化,且比固定偏移量HDQ量化获得更高率失真性能提升。

Description

基于上下文自适应偏移模型的视音频编码硬判决量化方法
技术领域
本发明算法适用于H.264视频编码器的量化器设计,同样适用于H.265/HEVC 视频编码器的量化器设计,具体是一种基于上下文自适应偏移模型的视频编码硬判决量化方法。
背景技术
在视频压缩编码中,采取了一系列措施以实现更高的视频压缩性能。量化可以有效的减小信号取值空间,从而达到更好的压缩效果。量化决定着视频压缩前后失真大小,对码率控制也有极大的影响。其中每个系数不同字段的量化与Cabac 上下文概率索引有关,相同字段下索引值不同,被量化为不同值的可能性不同,根据这一可能性,可在量化过程中更准确的量化为一个“携带更少自信息”的量化幅值。
在早期的视频编解码器中,变换系数的量化采用了标量量化(uniform scalarquantizer,USQ)。后来,在MPEG-4和早期的H.264/AVC等相关编码标准中采用了基于简单四舍五入的硬判决量化算法(hard-decision quantization HDQ)。后来又有学者提出,采用固定偏移量的HDQ算法,软判决量化算法(soft-decision quantization SDQ)以及SDQ算法的简化算法,即率失真优化量化算法(Rate distortion optimization quantizationRDOQ)。
以上所提到的量化算法,各有优缺,本发明充分利用了上述算法中的优点,同时又弥补上述算法中的部分缺陷。
最接近的已有技术1:采用自适应固定偏移量的HDQ算法
该算法利用了熵编码的统计特性,对帧内预测块以及帧间预测块分别采用了不同的偏移量。实验验证,帧内预测块的偏移量取1/3,帧间预测块的偏移量取 1/6较为合适。相比于早期量化器中所采用的简单四舍五入的HDQ算法,采用固定偏移量的HDQ算法可以提升较大的率失真性能。H.264/AVC以及HEVC标准的相关编码器均采用了该算法。
该已有技术的缺陷:
该算法仍然属于HDQ算法,认为块内相邻系数相互独立,因此,认为信号源为无记忆信源。但是,在基于上下文的熵编码算法中,无记忆信号源的假设是不成立的。所以在率失真性能上,该算法并不是最优的。
最接近的已有技术2:软判决量化(SDQ)算法
SDQ算法采用HDQ算法做为预量化算法,将处于零到预量化值之间的所有整数作为候选量化值,而后,利用维特比全搜索方法,在率失真优化准则下选择出量化块中所有系数对应的最佳量化值。该算法对块中部分系数的量化结果进行微调,调整时考虑率失真编码代价以及系数间的相互影响,在性能上相比于HDQ 有很大提升。
该技术已有技术的缺陷:
该算法充分考虑系数间的相关性,同时采用了维特比全搜索的方法,虽在性能上表现优异,但是,由维特比搜索带来的计算复杂度,系数时序间的相关性以及串行性严重阻碍SDQ算法在硬件上的有效实现。
最接近的已有技术3:RDOQ算法
RDOQ算法是在SDQ算法的基础上,为降低SDQ算法的复杂度而提出的简化算法。RDOQ算法,同样采用HDQ算法进行预量化,但该算法一般只选取3 个可能的最佳候选量化值;用局部路径代替完整网格,从而大大的降低了计算复杂度。在性能上仍能获得大部分SDQ算法编码增益。目前,H.264标准的JM参考代码和HEVC标准的HM参考代码均采用了RDOQ算法。
已有技术的缺陷:该算法是对SDQ算法的简化,但主要针对都是基于软件实现的视频编码器,且未能消除由维特比算法分支选择以及上下文算术编码导致的串行性。因此,数据间极高的相关性仍然阻碍该算法在硬件上的实现。
最接近的已有技术4:一种采用内容自适应偏移模型的硬判决量化算法
该模型算法的研究主要是基于内容自适应的偏移模型。主要是通过对DCT系数的统计分析,得到其较为准确的分布参数,利用分布参数以及量化参数构建一个系数自适应的偏移模型。在量化时,调用该模型,实现DCT系数的自适应量化。
已有技术的缺陷:
该算法是在HDQ算法基础上进一步的优化量化,认为系数间是独立的,没有考虑系数之间的相关性,有一定率失真性能损失。
最接近的已有技术5:一种基于SDQ率失真优化量化的自适应预判算法
该模型提出了一种基于准确预选的动态网格图,用于打破SDQ算法中的数据依赖。通过提前选择一些“安全”系数。假设量化取不同候选量化值,准确估计 Sig和Last字段码率消耗的变化,以及Bin0和Bin1字段码率消耗变化,计算不同候选量化结果的编码率失真代价改变,基于代价变化实现和阈值比较结果的预选。
已有技术的缺点:
基于SDQ算法,计算复杂度较高,且一个系数候选量化值的码率消耗和当前及临近块中的临近系数的量化结果有关,系数间这种紧密的相关性和串行性使得该算法在硬件实现面临挑战。
发明内容
为了解决现有技术中存在的上述技术问题,本发明主要研究一个在HDQ算法基础上,加入系数间相关性CABAC上下文自适应的新偏移模型。该模型要求可以根据视频内容不同,通过代价变化实现和阈值比较结果的预选,从而实现对量化值的自适应预选。在率失真性能上,相较于采用固定偏移量认为系数独立的 HDQ算法有显著提高;相较计算复杂度较高的SDQ算法,更易于在硬件上实现。
本发明需解决的技术问题:
(1)研究系数被量化为0或1对应的码率节省值Rsaved的具体分布,得到不同字段下(不同语法元素)、不同位置系数i、不同量化参数Qp、不同余数多种分类下,Rsaved的分布情况并进行统计分析,得到准确的分布参数用于构建新偏移模型;
(2)探索变换块中每一个系数所对应的最佳偏移量δ;
(3)探索变换块中每一个位置系数对应的最佳阈值Rsaved,建立Rth与Qp、位置系数i之间的函数关系,确定自适应阈值;
(4)探索最佳阈值Rth、每个位置码率节省值Rsaved(注:Rsaved=Rreal-Rth)与量化偏移量δ、的具体函数关系;
为此本发明提出了如下技术方案:
一种基于上下文自适应偏移模型的视频编码硬判决量化方法,包括如下步骤:
(1)上下文自适应偏移量建模;
(2)利用RDQ=1、RDQ=0两种不同量化情况,进行数据采集及统计得到码率节省Rsaved和最佳偏移量相对应的两类数据,根据采集的数据进行分析,构建码率节省Rsaved与最佳偏移量的函数模型;
(3)通过码率节省Rsaved计算得到最佳自适应阈值Rth,在位置系数i、量化参数 Qp不同、不同分段余数约束的条件下,选取在这些不同组合下的最佳阈值Rth,分析Rth与Qp、i的联系,并建立三者的函数关系,找到自适应阈值表达式 Rth=f(Qp,i);
(4)将步骤(3)中自适应阈值引入到模型中构建上下文及阈值自适应新模型,并提升视频编码性能。
进一步的,所述步骤(1)上下文自适应建模过程包含数据统计,离线数据分组分析以及启发式建模过程;数据统计包含不同位置、Qp、余数下,量化为0 或1的系数对应的码率节省Rsaved的分布,最佳偏移量的统计以及合理的自适应阈值的计算。数据离线分析主要是Rsaved的分布情况,确定自适应最佳阈值范围;分析码率节省Rsaved、阈值Rth、实际量化码率值Rreal与最佳偏移量δ的关系,并将自适应阈值Rth=f(Qp,i)引入模型,从而构建几者间的函数模型。
进一步的,所述步骤(2)的数据采集及统计分析,包括:
a)对比HDQ和SDQ量化结果,研究最终量化为0或者1对码率的节省情况,分别对二者量化结果相同和不同时,不同语法元素上下文的自信息进行码率节省值Rsaved的统计,得到两类码率节省值Rsaved的数据。
b)对最佳偏移量的统计,若两种算法量化结果一致,不断修正HDQ算法的偏移量,得到一个可保证两种量化结果一致的正相偏移量取值范围;若两种算法的量化结果不一致,修正HDQ算法的偏移量,同样得到一个可保证两种量化结果一致的反相偏移量取值范围。根据量化参数的不同组合,对所有系数的正反偏移量取值范围分组分析,确定不同组合下的系数所取的最佳正相偏移量取值范围以及最佳反相偏移量取值范围;
进一步的,步骤a)中上下文自适应模型由上下文状态转换过程决定,由于 HDQ量化结果为零的系数对SDQ算法是至关重要的,HDQ量化结果从零改为其他非零值,会增加码率的消耗,HDQ量化结果用于表示非零系数标识(sig)、最后非零系数标识(last)以及非零系数幅度字段(abs),
本模型的建立就是在此基础上,考虑HDQ量化幅度u=1时:
情况1:如果一个块内仅只有一个非零系数ui,即nz_last=1,那么u=1变为0 所节省的码率Rsaved被估计为:
Rsaved(u)=Rsig1(ui)+Rlast1(ui)+ψsig0(ui)+RBin0(ui,0)+Rsign(ui) (1)
其中,位置系数i=1,Rsig1、Rlast1和Rsign分别表示sig=1、last=1以及ui系数的符号编码比特数;而Rbin0是u=1时Bin0字段的编码比特。假设有几个HDQ结果为零的系数位于当前这个唯一非零系数和直流系数之间,这些夹在中间的所有零系数sig=0字段的编码比特消耗可以节省为
情况2:如果系数ui是最后一个非零系数,但在它和直流系数之间有其他非零系数。u=1变为零可以节省编码比特估计为
其中,Rlast1(ui)+Rlast0(ui-1)-Rlast1(ui-1)为last字段码率节省,这里需要考虑下一个非零系数last字段由1变为0导致的编码码率变化。可能会有一些HDQ量化零系数处于当前非零系数和下一个非零系数之间,这些零系数sig字段编码比特节省可以估计为
情况3:如果系数ui不是最后一个非零系数,或它后面有一个非零系数被选为“不安全”非零系数,加在中间连续零系数,sig字段编码比特消耗没有发生变化。 u从1变为0导致的编码比特节省如下:
Rsaved(u)=Rsig1(ui)+Rlast0(ui)-Rsig0(ui,0)+Rsign(ui) (5)
进一步的,步骤b)中最佳偏移量的选取模拟SDQ算法的行为特征,基于统计分析方法在最大正判概率和最小误判概率的双重约束下,估计最优死区偏移量。具体而言,对比SDQ及HDQ算法的量化结果,若两种量化结果一致,调整HDQ 偏移量,得到HDQ与SDQ量化结果一致的偏移量范围(δmin1max1),该范围的上下限按照下式确定:
δmax1=1/2 (6)
mod是取余操作计算符,u为DCT系数,q为量化步长,δopt为偏移量。收集所
有处于范围(δminmax)中的偏移量,该范围称为正相偏移量范围;若两种
量化结果不一致,修正HDQ的偏移量,迫使得到与SDQ算法一致的量化结果,
修正的偏移量范围(δmin2max2)上下限按照下式确定:
mod是取余操作计算符,u为DCT系数,q为量化步长,δopt为偏移量。该范围为反相偏移量范围。
进一步的,分别以Rsaved及最佳偏移量为参量,利用matlab绘制散点图,构建相应函数模型;在已有模型δ=f(Λ,Qp)基础上,建立一个新的模型
δ=f(Qp,δopt,i,Rth),所述函数模型为:
引入一个对偏移量δopt的微调因子ω,
其中,Rsaved=ΔR=Rreal-Rth (10)
并确定A、B参数最佳组合,由于ω微调δopt,可先假设δ为0.7~1.2倍δopt的上下波动,
即,
δ=(0.7~1.2)·δopt (11)
根据式(9)、式(11)得
由(12)式可推出A、B的范围,组合A、B取值,与调节量ω=0的情况对比,观察A-B-BDpsnr三维曲面图并找出最佳A、B组合;
最终新模型确立为:
进一步的,通过码率节省Rsaved计算得到的最佳阈值Rth,在位置系数i、量化参数Qp不同、不同分段余数约束的条件下,选取在这些不同组合下的最佳阈值 Rth,分析Rth与Qp、i的联系,并建立三者的函数关系,自适应阈值表达式Rth=f(Qp,i) 为:
对应的自适应阈值Rth=f(Qp,i)函数关系如下所示:
Rth=f(Qp,i)=
p00+p10·Qp+p01·i+
p20·Qp2+p11·Qp·i+p02·i2+
p30·Qp3+p21·Qp2·i+p12·Qp·i2+p03·i3+
p40·Qp4+p31·Qp3·i+p22·Qp2·i2+p13·Qp·i3+p04·i4+
p50·Qp5+p41·Qp4·i+p32·Qp3·i2+p23·Qp2·i3+p14·Qp·i4+p05·i5 (14)
对应各阶系数取值表如表所示:
该技术方案的技术效果
(1)该方案采用影响因素分类分析的方法得到Rsaved的分布,影响因素越多,分类越细致得到的Rsaved特征越明显,由Rsaved分析得到的Rth区分量化为0或1的效果越好;在性能上,考虑了系数间相关性对量化结果的影响,考虑了每个位置量化结果与码率节省的关系,比采用固定偏移量的HDQ算法有所提升;
(2)该方案通过对比HDQ与RDOQ算法的量化结果,得到不同Qp、位置系数i 下可区分量化为0或1更节省码率的最佳自适应阈值Rth,将会对决判结果的预选有着重要作用。
(3)该方案考虑量化中CACAC上下文几个重要语法元素对偏移模型的影响,引入了系数间的相关性,可以得到更为合理的偏移量模型。调用系数相关的上下文自适应偏移量模型相对于无记忆信源的固定偏移量HDQ算法来说,节省码率,大大提升了压缩编码性能。
该算法相对原来的内容自适应偏移模型的硬判决量化算法,充分考虑不同位置系数的相关性,利用Rsaved的分布特点与最佳偏移量δ构建模型,同时加入自适应阈值Rth=f(Qp,i)对新模型的影响,在率失真性能上将会有显著提高;同时,该算法不是SDQ的维特比网格算法,基于HDQ算法的研究因此可以很好的在硬件上得以实现。
附图说明
图1是CABAC上下文自适应偏移量建模流程图;
图2是Rsaved-偏移量的关系散点图;
图3是SDQ=1和SDQ=0两类样本的CDF图;
图4是确定自适应阈值函数关系Qp、i、Rth三者的三维曲面图;
图5是确定自适应模型系数值图;
图6是CABAC编码流程图。
具体实施方式
下面结合附图对本发明作进一步说明。
(1)上下文自适应建模过程
上下文自适应建模过程包含数据统计,离线数据分组分析以及启发式建模过程。数据统计包含不同位置、Qp、余数下,量化为0或1的系数对应的码率节省Rsaved的分布,最佳偏移量的统计以及合理的自适应阈值的计算。数据离线分析主要是Rsaved的分布情况,确定自适应最佳阈值范围;分析码率节省Rsaved、阈值Rth、实际量化码率值Rreal与最佳偏移量δ的关系,并将自适应阈值Rth=f(Qp,i) 引入模型,从而构建几者间的函数模型。
(2)数据统计过程
a)Rsaved的统计
CABAC中上下文模型由上下文状态转换过程决定,由于HDQ量化结果为零的系数对SDQ算法是至关重要的,HDQ量化结果从零改为其他非零值,会增加码率的消耗,HDQ量化结果用于表示非零系数标识(sig)、最后非零系数标识(last) 以及非零系数幅度字段(abs)。
本模型的建立就是在此基础上,考虑HDQ量化幅度u=1时:
情况1:如果一个块内仅只有一个非零系数ui,即nz_last=1,那么u=1变为0所节省的码率Rsaved
被估计为:
Rsaved(u)=Rsig1(ui)+Rlast1(ui)+ψsig0(ui)+RBin0(ui,0)+Rsign(ui) (1)
其中,位置系数i=1,Rsig1、Rlast1和Rsign分别表示sig=1、last=1以及ui系数的符号编码比特数;而Rbin0是u=1时Bin0字段的编码比特。假设有几个HDQ结果为零的系数位于当前这个唯一非零系数和直流系数之间,这些夹在中间的所有零系数sig=0字段的编码比特消耗可以节省为
情况2:如果系数ui是最后一个非零系数,但在它和直流系数之间有其他非零系数。u=1变为零可以节省编码比特估计为
其中,Rlast1(ui)+Rlast0(ui-1)-Rlast1(ui-1)为last字段码率节省,这里需要考虑下一个非零系数last字段由1变为0导致的编码码率变化。可能会有一些HDQ量化零系数处于当前非零系数和下一个非零系数之间,这些零系数sig字段编码比特节省可以估计为
情况3:如果系数ui不是最后一个非零系数,或它后面有一个非零系数被选为“不安全”非零系数,加在中间连续零系数,sig字段编码比特消耗没有发生变化。
u从1变为0导致的编码比特节省如下:
Rsaved(u)=Rsig1(ui)+Rlast0(ui)-Rsig0(ui,0)+Rsign(ui) (5)
b)最佳偏移量的选取
模拟SDQ算法的行为特征,基于统计分析方法在最大正判概率和最小误判概率的双重约束下,估计最优死区偏移量。具体而言,对比SDQ及HDQ算法的量化结果,若两种量化结果一致,调整HDQ偏移量,得到HDQ与SDQ量化结果一致的偏移量范围(δmin1max1),该范围的上下限按照下式确定:
δmax1=1/2 (6)
mod是取余操作计算符,u为DCT系数,q为量化步长,δopt为偏移量。
收集所有处于范围(δminmax)中的偏移量,该范围称为正相偏移量范围;若两种量化结果不一致,修正HDQ的偏移量,迫使得到与SDQ算法一致的量化结果。修正的偏移量范围(δmin2max2)上下限按照下式确定:
mod是取余操作计算符,u为DCT系数,q为量化步长,δopt为偏移量。该范围为反相偏移量范围。
c)对比HDQ和SDQ量化结果,结合所统计的两类Rsaved和最佳偏移量取值。绘制散点图,找出Rsaved-δ偏移量的关系构建函数模型。如图2所示。
(3)自适应最佳阈值的计算
自适应最佳阈值Rth,最佳阈值将SDQ最终量化结果分为两类,一类对SDQ 量化为0起正向贡献,另一类对SDQ量化为0非正向贡献。根据CABAC熵编码原理,计算分析每个系数位置这两类量化结果分别对应的码率节省值Rsaved,再运用贝叶斯二值判别法,确定能够区分两类样本的自适应最佳阈值Rth,将Rth和量化块中每个位置系数的实际量化码率值Rreal,作为硬判决量化中对偏移量的影响因素应用于偏移量建模。其中,
Rsaved=ΔR=Rreal-Rth (8)
将不同分段余数、不同Qp时,对4x4块每个系数位置,SDQ最终量化为0 和1这两类样本,码率节省Rsaved的统计直方图,基于最小误判概率的原则,确定每个位置的最佳阈值。绘制两类样本的CDF图,如图3示。计算每个位置能够区分SDQ量化为0或SDQ量化为1两类样本的最佳阈值Rth。最终测得在不同Qp下不同位置系数对应的最佳阈值并绘制成以Qp、i、Rth三者为x、y、z 轴的三维曲面图如图4示。
在以构建的最佳偏移量与Rsaved模型基础上,引入自适应阈值Rth=f(Qp, i),更新函数模型,提升模型性能。

Claims (3)

1.一种基于上下文自适应偏移模型的视频编码硬判决量化方法,包括如下步骤:
(1)上下文自适应偏移量建模;
(2)利用RDQ=1、RDQ=0两种不同量化情况,进行数据采集及统计得到码率节省Rsaved和最佳偏移量相对应的两类数据,根据采集的数据进行分析,构建码率节省Rsaved与最佳偏移量的函数模型;
(3)通过码率节省Rsaved计算得到最佳自适应阈值Rth,在位置系数i、量化参数Qp不同、不同分段余数约束的条件下,选取在这些不同组合下的最佳阈值Rth,分析Rth与Qp、i的联系,并建立三者的函数关系,找到自适应阈值表达式Rth=f(Qp,i);
(4)将步骤(3)中自适应阈值引入到模型中构建上下文及阈值自适应新模型,并提升视频编码性能;
所述步骤(2)的数据采集及统计分析,包括:
a)对比HDQ和SDQ量化结果,研究最终量化为0或者1对码率的节省情况,分别对二者量化结果相同和不同时,不同语法元素上下文的自信息进行码率节省值Rsaved的统计,得到两类码率节省值Rsaved的数据;
b)对最佳偏移量的统计,若两种算法量化结果一致,不断修正HDQ算法的偏移量,得到一个可保证两种量化结果一致的正相偏移量取值范围;若两种算法的量化结果不一致,修正HDQ算法的偏移量,同样得到一个可保证两种量化结果一致的反相偏移量取值范围;根据量化参数的不同组合,对所有系数的正反偏移量取值范围分组分析,确定不同组合下的系数所取的最佳正相偏移量取值范围以及最佳反相偏移量取值范围;
步骤a)中上下文自适应模型由上下文状态转换过程决定,由于HDQ量化结果为零的系数对SDQ算法是至关重要的,HDQ量化结果从零改为其他非零值,会增加码率的消耗,HDQ量化结果用于表示非零系数标识(sig)、最后非零系数标识(last)以及非零系数幅度字段(abs),
本模型的建立就是在此基础上,考虑HDQ量化幅度u=1时:
情况1:如果一个块内仅只有一个非零系数ui,即nz_last=1,那么u=1变为0所节省的码率Rsaved被估计为:
Rsaved(u)=Rsig1(ui)+Rlast1(ui)+ψsig0(ui)+RBin0(ui,0)+Rsign(ui) (1)
其中,位置系数i=1,Rsig1、Rlast1和Rsign分别表示sig=1、last=1以及ui系数的符号编码比特数;而Rbin0是u=1时Bin0字段的编码比特;假设有几个HDQ结果为零的系数位于当前这个唯一非零系数和直流系数之间,这些夹在中间的所有零系数sig=0字段的编码比特消耗可以节省为
情况2:如果系数ui是最后一个非零系数,但在它和直流系数之间有其他非零系数;u=1变为零可以节省编码比特估计为
其中,Rlast1(ui)+Rlast0(ui-1)-Rlast1(ui-1)为last字段码率节省,这里需要考虑下一个非零系数last字段由1变为0导致的编码码率变化;可能会有一些HDQ量化零系数处于当前非零系数和下一个非零系数之间,这些零系数sig字段编码比特节省可以估计为
情况3:如果系数ui不是最后一个非零系数,或它后面有一个非零系数被选为“不安全”非零系数,加在中间连续零系数,sig字段编码比特消耗没有发生变化;u从1变为0导致的编码比特节省如下:
Rsaved(u)=Rsig(ui)+Rlast0(ui)-Rsig0(ui,0)+Rsign(ui) (5)
步骤b)中最佳偏移量的选取模拟SDQ算法的行为特征,基于统计分析方法在最大正判概率和最小误判概率的双重约束下,估计最优死区偏移量;具体而言,对比SDQ及HDQ算法的量化结果,若两种量化结果一致,调整HDQ偏移量,得到HDQ与SDQ量化结果一致的偏移量范围(δmin1max1),该范围的上下限按照下式确定:
mod是取余操作计算符,u为DCT系数,q为量化步长,δopt为偏移量;
收集所有处于范围(δminmax)中的偏移量,该范围称为正相偏移量范围;若两种量化结果不一致,修正HDQ的偏移量,迫使得到与SDQ算法一致的量化结果,修正的偏移量范围(δmin2max2)上下限按照下式确定:
mod是取余操作计算符,u为DCT系数,q为量化步长,δopt为偏移量;该范围为反相偏移量范围;
分别以Rsaved及最佳偏移量为参量,利用matlab绘制散点图,构建相应函数模型;
在已有模型δ=f(Λ,Qp)基础上,建立一个新的模型δ=f(Qp,δopt,i,Rth),所述函数模型为:
引入一个对偏移量δopt的微调因子ω,
其中,Rsaved=ΔR=Rreal-Rth (10)
并确定A、B参数最佳组合,由于ω微调δopt,可先假设δ为0.7~1.2倍δopt的上下波动,
即,
δ=(0.7~1.2)·δopt (11)
根据式(9)、式(11)得
由(12)式可推出A、B的范围,组合A、B取值,与调节量ω=0的情况对比,观察A-B-BDpsnr三维曲面图并找出最佳A、B组合;
最终新模型确立为:
2.如权利要求1所述的基于上下文自适应偏移模型的视频编码硬判决量化方法,其特征在于:
所述步骤(1)上下文自适应建模过程包含数据统计,离线数据分组分析以及启发式建模过程;数据统计包含不同位置、Qp、余数下,量化为0或1的系数对应的码率节省Rsaved的分布,最佳偏移量的统计以及合理的自适应阈值的计算;数据离线分析主要是Rsaved的分布情况,确定自适应最佳阈值范围;分析码率节省Rsaved、阈值Rth、实际量化码率值Rreal与最佳偏移量δ的关系,并将自适应阈值Rth=f(Qp,i)引入模型,从而构建几者间的函数模型。
3.如权利要求1所述的基于上下文自适应偏移模型的视频编码硬判决量化方法,其特征在于:
通过码率节省Rsaved计算得到的最佳阈值Rth,在位置系数i、量化参数Qp不同、不同分段余数约束的条件下,选取在这些不同组合下的最佳阈值Rth,分析Rth与Qp、i的联系,并建立三者的函数关系,自适应阈值表达式Rth=f(Qp,i)为:对应的自适应阈值Rth=f(Qp,i)函数关系如下所示:
Rth=f(Qp,i)=p00+p10·Qp+p01·i+p20·Qp2+p11·Qp·i+p02·i2+p30·Qp3+p21·Qp2·i+p12·Qp·i2+p03·i3+p40·Qp4+p31·Qp3·i+p22·Qp2·i2+p13·Qp·i3+p04·i4+p50·Qp5+p41·Qp4·i+p32·Qp3·i2+p23·Qp2·i3+p14·Qp·i4+p05·i5 (14)
对应各阶系数取值表如表所示:
CN201710273935.0A 2017-04-21 2017-04-21 基于上下文自适应偏移模型的视音频编码硬判决量化方法 Active CN107257461B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710273935.0A CN107257461B (zh) 2017-04-21 2017-04-21 基于上下文自适应偏移模型的视音频编码硬判决量化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710273935.0A CN107257461B (zh) 2017-04-21 2017-04-21 基于上下文自适应偏移模型的视音频编码硬判决量化方法

Publications (2)

Publication Number Publication Date
CN107257461A CN107257461A (zh) 2017-10-17
CN107257461B true CN107257461B (zh) 2019-08-20

Family

ID=60027225

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710273935.0A Active CN107257461B (zh) 2017-04-21 2017-04-21 基于上下文自适应偏移模型的视音频编码硬判决量化方法

Country Status (1)

Country Link
CN (1) CN107257461B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108322749B (zh) * 2018-03-15 2021-03-16 北京数码视讯科技股份有限公司 Rdoq的系数优化方法、rdoq的加速方法及装置
CN109274967B (zh) * 2018-09-25 2020-11-10 杭州电子科技大学 一种快速rdoq量化零系数比例估计方法
CN110365978B (zh) * 2019-07-15 2021-11-23 杭州电子科技大学 一种基于机器学习算法多层次全零块预判决方法及系统
CN113422957B (zh) * 2021-05-17 2022-11-01 北京百度网讯科技有限公司 视频编码中的量化方法、装置、设备和存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101779468A (zh) * 2008-06-27 2010-07-14 索尼公司 图像处理装置和图像处理方法
KR20120008323A (ko) * 2010-07-16 2012-01-30 광운대학교 산학협력단 쿼드트리 기반의 매크로블록을 위한 멀티 레벨의 양자화 파라미터 기록 방법 및 장치
CN105075265A (zh) * 2013-03-19 2015-11-18 高通股份有限公司 3d视频译码中针对跳过和直接模式的视差向量导出
CN105208389A (zh) * 2015-09-24 2015-12-30 中国计量学院 一种基于内容自适应偏移模型的视频编码硬判决量化方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2544978T3 (es) * 2006-01-09 2015-09-07 Matthias Narroschke Codificación adaptativa de un error de predicción en la codificación de vídeo híbrida

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101779468A (zh) * 2008-06-27 2010-07-14 索尼公司 图像处理装置和图像处理方法
KR20120008323A (ko) * 2010-07-16 2012-01-30 광운대학교 산학협력단 쿼드트리 기반의 매크로블록을 위한 멀티 레벨의 양자화 파라미터 기록 방법 및 장치
CN105075265A (zh) * 2013-03-19 2015-11-18 高通股份有限公司 3d视频译码中针对跳过和直接模式的视差向量导出
CN105208389A (zh) * 2015-09-24 2015-12-30 中国计量学院 一种基于内容自适应偏移模型的视频编码硬判决量化方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Fast Soft Decision Quantization With Adaptive Preselection and Dynamic Trellis Graph;HaiBing Yin;En-Hui Yang;Xiang Yu;Zhelei Xia;《IEEE Transactions on Circuits and Systems for Video Technology》;20150831;1362 - 1375 *

Also Published As

Publication number Publication date
CN107257461A (zh) 2017-10-17

Similar Documents

Publication Publication Date Title
CN107257461B (zh) 基于上下文自适应偏移模型的视音频编码硬判决量化方法
CN105208389B (zh) 一种基于内容自适应偏移模型的视频编码硬判决量化方法
CN101218830B (zh) 图像编码装置和方法、以及图像解码装置和方法
CN102238387B (zh) 一种视频熵编码、熵解码方法、装置
TWI748201B (zh) 適於相依純量量化之變換係數熵寫碼技術
CN100508610C (zh) H.264/avc视频编码中速率和失真的快速估计方法
CN102685548A (zh) 视频质量的无参评估方法
CN102186087B (zh) 用于二进制算术编码可并行的非零系数上下文建模方法
CN103797803A (zh) 用于熵编码/解码的方法和设备
Mrak et al. A context modeling algorithm and its application in video compression
Kim et al. Fast intra-prediction model selection for H. 264 codec
Ma et al. Convolutional neural network-based arithmetic coding for HEVC intra-predicted residues
CN103501438B (zh) 一种基于主成分分析的内容自适应图像压缩方法
CN106791828A (zh) 基于机器学习的高性能视频转码方法及其转码器
Yin et al. Fast soft decision quantization with adaptive preselection and dynamic trellis graph
CN102572428A (zh) 面向多媒体传感网分布式编解码的边信息估计方法
CN107547902B (zh) 面向监控视频编码的自适应率失真优化方法
CN105704494B (zh) 基于深度相关性的屏幕内容编码帧间快速编码方法
CN103686176B (zh) 一种用于视频编码的码率估计方法
CN109274967A (zh) 一种快速rdoq量化零系数比例估计方法
CN109286817A (zh) 一种视频编码中dct系数的量化失真信息处理方法
CN115174918A (zh) 一种基于统计建模的vvc快速码率估计方法
Zhang et al. Context-based arithmetic coding reexamined for DCT video compression
CN101854534A (zh) 一种h.264快速帧间模式选择方法
Deng et al. Decoder Derived Cross-Component Linear Model Intra-Prediction for Video Coding

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant