CN114143537B - 一种基于可能性大小的全零块预测方法 - Google Patents

一种基于可能性大小的全零块预测方法 Download PDF

Info

Publication number
CN114143537B
CN114143537B CN202111491107.7A CN202111491107A CN114143537B CN 114143537 B CN114143537 B CN 114143537B CN 202111491107 A CN202111491107 A CN 202111491107A CN 114143537 B CN114143537 B CN 114143537B
Authority
CN
China
Prior art keywords
coding unit
mode
current coding
current
block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111491107.7A
Other languages
English (en)
Other versions
CN114143537A (zh
Inventor
汪大勇
王倩敏
解乐乐
宋丽娟
王欣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Dayu Chuangfu Technology Co ltd
Original Assignee
Chongqing University of Post and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University of Post and Telecommunications filed Critical Chongqing University of Post and Telecommunications
Priority to CN202111491107.7A priority Critical patent/CN114143537B/zh
Publication of CN114143537A publication Critical patent/CN114143537A/zh
Application granted granted Critical
Publication of CN114143537B publication Critical patent/CN114143537B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/625Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using discrete cosine transform [DCT]

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明属于视频通信,具体涉及一种基于可能性大小的全零块预测方法,包括:获取相邻编码单元的编码模式,并计算当前编码单元采用ILR模式的可能性;计算全零块的阈值,根据当前编码单元采用ILR模式的可能性修正全零块的阈值;判断当前编码单元是否为全零块,若是,则跳过帧内编码模式;若不是,则判断当前编码单元得到的残差块是否服从高斯分布,满足则进行变换量化,否则判断当前编码单元是否是部分零块,若是,则跳过帧内编码模式,否则进行变换量化,最后判断当前宏块中所有编码单元产生的残差块是否处理完毕,本发明在保证视频编码质量的基础上,提高了全零块的预测精度,进一步提升了编码效率。

Description

一种基于可能性大小的全零块预测方法
技术领域
本发明属于视频通信,具体涉及一种基于可能性大小的全零块预测方法。
背景技术
为满足快速增长的视频传输与存储需求,联合编码小组在2013年推出最新一代视频编码标准H.265/HEVC,与上一代视频编码标准H.264/AVC相比,HEVC保留了一些AVC原有的技术,改进相关技术的同时采用了新技术,减少了时延,改善了码流的传输,提高了编码效率,HEVC在保证重建视频图像质量的前提下,视频编码效率能提升50%以上。虽然HEVC相比AVC很大程度的改善了传输带宽要求过高的问题,但随着终端设备多样性、用户需求的差异性以及网络异构性等问题的出现和加剧,现有的视频编码技术已经不能满足现实中的各种需求,因而基于HEVC的可伸缩视频编码技术SHVC应运而生。
可伸缩高性能视频编码是在高效视频编码基础上开发的新一代视频压缩编码标准。可伸缩视频编码主要包含时间、空间和质量可伸缩三种类型,质量可伸缩型视频编码能够根据网络状态提供不同的显示质量,具有很强的适应性。可伸缩视频编码可以通过简单的丢包或截断码流等操作扔掉部分比特流形成一个新的子比特流,该子比特流能够适应用户的爱好、终端能力和网络的状态,与之前的标准相比,解决了异构型网络和终端多样性的问题。虽然SHVC具有很高的编码效率,但是其编码复杂度也非常高,这就严重阻碍了SHVC的广泛应用。
在SHVC编码过程过中,编码单元CU在编码过程中需要进行DCT变化,以及量化的过程,在这个过程过中会出现一部分的全零块,对全零块的变换和量化都是多余的,如果能提前预测出全零块,从而避免后续的变换和量化的过程,那么就能提高视频编码的效率,并且不会影响编码的质量。
现有的一些算法中可以在一定程度上提高编码速度,但质量可伸缩视频编码仍存在一些问题需要去解决:
(1)在预测全零块时,通常选取残差块的SAD值与全零块阈值进行比较,这种方式进行的预测不够精确。
(2)在推导全零块的阈值时,没有考虑到与当前编码单元的模式,这样会在一定程度上影响编码的效率和准确性。
发明内容
为解决上述问题,本发明提出一种基于可能性大小的全零块预测方法,包括以下步骤:
S1.获取相邻编码单元的编码模式,并计算当前编码单元采用ILR模式的可能性;
S2.计算当前编码单元的SSD值,将根号SSD值与全零块阈值进行比较,若根号SSD值小于全零块阈值,则当前编码单元为全零块并进入步骤S6,否则进入步骤S3;
S3.判断当前编码单元生成的残差块是否服从高斯分布,若不是,则进入步骤S5,若是,则进入步骤S4;
S4.判断当前编码单元是否是部分零块,若不是,则进入步骤S5,若是,则进入步骤S6;
S5.对当前编码单元得到的残差块进行变换量化,变换量化后得到系数块,再对系数块进行反量化反变换后进入步骤S7;
S6.对当前编码单元中判断其是否为全零块和部分零块的标识变量赋值后进入步骤S7;
S7.判断当前宏块中所有编码单元产生的残差块是否处理完毕,若不是,则返回步骤S1,若是,则结束操作。
进一步的,步骤S2中,判断当前编码单元是否为全零块的过程包括:
根据当前编码单元的N×N残差矩阵Rr得到当前编码单元的SSD值:SSD=∑|Rr(i,j)×Rr(i,j)|,
计算N×N全零块阈值D,表示为
Figure GDA0003713451460000031
Figure GDA0003713451460000032
则当前编码单元为全零块;
其中,f是一个舍入偏移参数,q是量化步长。
进一步的,利用修正参数对全零块阈值D进行修正,具体包括:
获取相邻编码单元的编码模式,并计算当前编码单元采用ILR模式的可能性;
基于当前编码单元采用ILR模式的可能性,利用最小二乘法计算获得修正参数,该参数表示为:
α=20.83f(cm)3-25.89f(cm)2+16.93f(cm)-0.4268;
修正后的全零块判断条件表示为:
Figure GDA0003713451460000033
其中,f(cm)表示当前编码单元的模式可能性。
进一步的,计算当前编码单元的模式可能性f(cm)的过程包括:
S11.首先获取当前编码单元的相邻编码单元所采用的编码模式;
S12.统计编码单元采用帧内模式或ILR模式的概率,以及当前编码单元采用帧内模式或ILR模式时,其相邻编码单元采用帧内模式或ILR模式的概率;
S13.将步骤S11获取的数据代入步骤S12,采用贝叶斯公式计算当前编码单元采用ILR模式的可能性。
进一步的,步骤S13通过一个相邻编码单元,采用贝叶斯公式计算当前编码单元采用帧内模式或ILR模式的可能性,其可能性表示为:
Figure GDA0003713451460000034
其中,cm是当前编码单元的模式向量,nm是当前编码单元的相邻编码单元的模式向量,p(cm)表示当前编码单元采用cm模式的可能性,p(nm|cm)表示当前编码单元采用cm模式时,其相邻编码单元采用nm模式的可能性。
进一步的,若每个相邻编码单元采用帧内模式或ILR模式的可能性相互独立,通过多个相邻编码单元计算当前编码单元采用帧内模式或ILR模式的可能性,其可能性表示为:
Figure GDA0003713451460000041
其中,K表示相邻编码单元的个数,p(nmi|cm)表示当前编码单元采用cm模式时,第i个相邻编码单元采用nm模式的可能性,p(nmi)表示第i个相邻编码单元采用nm模式的可能性。
进一步的,通过多个相邻编码单元计算当前编码单元采用帧内模式或ILR模式的可能性时存在误差,为减小误差进行修正,表示为:
Figure GDA0003713451460000042
其中,f(cm)表示修正后的通过多个相邻编码单元计算当前编码单元采用帧内模式或ILR模式的可能性,fm(cm)表示修正前通过多个相邻编码单元计算当前编码单元采用帧内模式或ILR模式的可能性,fm(mILR)是当前编码单元采用ILR模式的可能性,fm(mintra)是当前编码单元采用帧内模式的可能性。
进一步的,判断当前编码单元是否是部分零块的过程包括:
设置阈值M并获取当前编码单元生成的N×N残差块;
从残差块第一个位置开始进行DCT变化和量化,判断残差块当前位置量化后的值是否小于1,若是,则当前位置被量化为0;
当前位置判断完成后,按照z字形扫描顺序判断下一个位置,记录整个N×N块残差块中被量化为0的位置个数;
判断被量化为0的位置个数是否大于M,若是,则当前编码单元是部分零块。
本发明的有益效果:
本发明采用残差块的SSD与全零块阈值进行比较,提升了全零块的预测精度,在一定程度上缓解了编码复杂度,减少了计算量,同时在推导全零块阈值时,结合当前编码的模式可能性,修正了全零块阈值进一步提升预测精度,在质量可伸缩视频编码中保证视频质量几乎不变的前提下,避免对全零块进行DCT变换和量化而产生的冗余操作来降低编码的复杂度,从而提高视频编码算法的编码速度。
附图说明
图1为本发明基于可能性大小的全零块预测方法流程图;
图2为本发明的当前编码单元及其5个相关编码单元示意图;
图3为本发明的z字形扫描顺序示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
一种基于可能性大小的全零块预测方法,如图1所示,包括以下步骤:
S1.获取相邻编码单元的编码模式,并计算当前编码单元采用ILR模式的可能性;
S2.计算全零块的阈值,根据步骤S1得到的当前编码单元采用ILR模式的可能性修正全零块的阈值;
S3.判断当前编码单元是否为全零块,若不是,则进入步骤S4;若是,则进入步骤S7;
S4.判断当前编码单元得到的残差块是否服从高斯分布,若不是,则进入步骤S6,若是,则进入步骤S5;
S5.判断当前编码单元是否是部分零块,若不是,则进入步骤S6,若是,则进入步骤S7;
S6.对当前编码单元得到的残差块进行变换量化,变换量化后得到系数块,再对系数块进行反量化反变换后进入步骤S8;
S7.跳过变换量化操作,对当前编码单元中判断其是否为全零块和部分零块的标识变量赋值后进入步骤S8;
具体地,每个编码单元都设置一个标识变量并赋值为假,当判断编码单元为全零块或部分零块后,对其标识变量赋值为真,之后如果想知道当前编码单元是否为全零块和部分零块,可以通过标识变量进行判断。
S8.判断当前宏块中所有编码单元产生的残差块是否处理完毕,若不是,则返回步骤S1,若是,则结束操作。
优选地,步骤S1的具体过程包括:
S11.首先获取当前编码单元的相邻编码单元所采用的编码模式;
S12.统计编码单元采用帧内模式或ILR模式的概率,以及当前编码单元采用帧内模式或ILR模式时,其相邻编码单元采用帧内模式或ILR模式的概率;
S13.将步骤S11获取的数据代入步骤S12,采用贝叶斯公式计算当前编码单元采用ILR模式的可能性。
由于自然场景的连续性,相邻的编码单元通常比较相似。本发明利用相邻编码单元来预测当前编码单元。在当前编码单元的相关编码单元中,分别选取5个相邻编码单元作为参考单元,来预测当前编码单元采用ILR模式的概率。如图2所示为相关编码单元,其中C是当前编码单元,UL是C的左上相邻编码单元,U是C的上相邻编码单元,UR是C的右上相邻编码单元,L是C的左相邻编码单元,FC是C前一帧相同位置的编码单元。
获取上述相邻编码单元的模式信息之后,利用下面的贝叶斯公式计算出当前编码单元的模式可能性:
Figure GDA0003713451460000071
其中,cm是当前编码单元的模式向量,nm是当前编码单元的相邻编码单元的模式向量,p(cm)表示当前编码单元采用cm模式的可能性,p(nm|cm)表示当前编码单元采用cm模式时,其相邻编码单元采用nm模式的可能性。
在一实施例中,本发明使用当前编码单元的5个相邻的编码单元作为参考,将一个当前编码单元看做一个向量,该当前编码单元的相邻编码单元看做分量,则一个向量有5个分量,每个分量有两种取值,如果直接使用上面的贝叶斯公式会比较困难,为了简化计算过程,使用朴素贝叶斯分类器,假设每个相邻CU各自采用某种模式是相互独立的,这也就意味着,一个向量的不同分量是相互独立的,根据这个独立性假设,将上面的贝叶斯公式整理为:
Figure GDA0003713451460000072
因为在计算中可能存在四舍五入的误差,因此当前编码单元的帧内模式可能性和ILR模式可能性相加的和并不一定总是等于1,所以做出如下修正:
Figure GDA0003713451460000073
其中,f(cm)表示修正后的通过多个相邻编码单元计算当前编码单元采用帧内模式或ILR模式的可能性,fm(cm)表示修正前通过多个相邻编码单元计算当前编码单元采用帧内模式或ILR模式的可能性,fm(mILR)是当前编码单元采用ILR模式的可能性,fm(mintra)是当前编码单元采用帧内模式的可能性。
在一实施例中,步骤S2中,修正全零块阈值的过程包括:
S21.根据当前编码单元的N×N残差矩阵Rr得到当前编码单元的SSD值:
SSD=∑|Rr(i,j)×Rr(i,j)|
S22.计算N×N全零块的阈值:
Figure GDA0003713451460000081
其中,f是一个舍入偏移参数,q是量化步长,λdct是DCT系数的拉普拉斯模型参数;
S23.通过最小二乘法得到SSD与全零块阈值的关系:
Figure GDA0003713451460000082
S24.根据当前编码单元的模式可能性,利用最小二乘法获取SSD阈值的具体系数α,并返回步骤S23修正全零块阈值:
α=20.83f(cm)3-25.89f(cm)2+16.93f(cm)-0.4268
其中,f(cm)表示当前编码单元的模式可能性。
在一实施例中,以编码单元生成的8×8残差块为例,该残差块均值为0,方差为σ2的拉普拉斯分布,表示为:
E(x(i,j)2)=D(x(i,j))-(E(x(i,j)))2
其中,E(x(i,j)2)是x(i,j)的期望值,D(x(i,j))是x(i,j)的方差。由于残差均值为0,故E(x(i,j))=0,进一步可以得到:E(x(i,j)2)=D(x(i,j))=σ2,由概率论可知,均值近似于期望值,则
Figure GDA0003713451460000083
优选地,为了获得N×N残差块中DCT的拉普拉斯模型参数,有以下两个关系:
Figure GDA0003713451460000084
Figure GDA0003713451460000085
其中u,v分别表示N×N残差块中的横坐标和纵坐标,Rh是对角线元素全为1的沃尔森哈达玛变换(WHT)系数矩阵,A是N×N矩阵的变换核,AT表示A的转置矩阵。
Rh表示为
Figure GDA0003713451460000091
其中ρ是残差矩阵的相关系数。
Figure GDA0003713451460000092
Figure GDA0003713451460000093
可得:
Figure GDA0003713451460000094
用熵简化N×N残差块变换量化后的非零系数的总数,
Figure GDA0003713451460000095
其中,f是一个舍入偏移参数,q是量化步长,λdct是DCT系数的拉普拉斯模型参数。如果上式中的R(q)小于1,表明N×N残差块中所有的系数都被量化为零,因此,可以用来示的不等式作为N×N块被量化为全零块的条件:
Figure GDA0003713451460000096
上面的不等式中,0.5是四舍五入的阈值偏移值,如果量化的非零系数总数小于1,则在N×N残差块中不存在明显的需要编码的系数。最后,可以得出来全零块的阈值和SSD的关系表达式:
Figure GDA0003713451460000097
其中,α是一个系数,根据当前编码单元采用ILR模式的可能性大小来确定。优选地,本发明提出一种系数选择方法,当前编码单元的模式可能性大小在0%-20%区间时,将全零块的阈值和SSD的关系表达式中的
Figure GDA0003713451460000098
部分记做t,然后为α分别设置一些具体的常数,例如1,2,3...,进行测试,以标准编码器的编码效果作为参考,测试不同系数的BDBR值,BDBR表示了在同样的客观质量下,两种方法的码率节省情况,正值表示编码效率减少,相应的负值就表示编码效率的增加,具体的系数和不同视频序列对应的BDBR值如表1所示。
表1不同测试条件下的编码效率
Figure GDA0003713451460000101
由表可知,当计算出的模式可能性在0%到20%这个区间时,α选择1作为系数值,采取同样的方法,依次得到模式可能性在20%-40%,40%-60%,60%-80%,80%-100%四个区间时,对应的α值分别为:3、4、6、9。显然,在0%-20%区间内时,α取1并不是一个绝对最优值,但是它可以看做是0%-20%的中间值,即10%的最优值,按照相同的思路,可以得出3、4、6、9分别也是30%、50%、70%、90%的最优值,这样就得到了五组数据:(10%,1)、(30%,3)、(50%,4)、(70%,6)、(90%,9)。
最后将得到的5组值作为数据,利用最小二乘法得到模式可能性和对应的α系数之间的关系表达式:
α=20.83f(cm)3-25.89f(cm)2+16.93f(cm)-0.4268
通过上述条件就得到了SSD阈值的具体系数,将该系数带入全零块的阈值和SSD的关系表达式中,判断是否满足条件,如果满足条件,则说明当前编码单元是全零块,就可以跳过变换和量化过程。
在QSHVC中,由于基本层和增强层内容完全相同,具有很强的层间相关性,因而增强层和基本层划分必然比较相似;但是基本层和增强层量化参数不同,这就导致增强层和基本层划分必然存在着一定的差异。
本发明通过包含不同的分辨率、运动和纹理的视频序列,如“sunflower”、“tractor”、“Flowervase”、“PartyScene”、“BlowingBubbles”、“Keiba”、“Parkruner”和“town”,采用联合视频编码组(JCT-VC)推荐的通测条件(Common SHM test conditionsand software reference configurations)进行测试。
表2是当基本层采用某一划分时增强层采用各种划分的比例,BL指基本层采用的划分,EL指增强层采用的划分。其中,增强层采用2Nx2N划分占有很大的比例,这是由于存在着较强的层间相关性,增强层很多编码单元采用基本层进行预测;此外,增强层编码单元采用基本层的划分也占有一定的比例,这两种划分占了整个划分的80%左右;采用其它划分的可能性较小,但是其比例和仍然占了20%左右。
表2层间划分的分布比例
Figure GDA0003713451460000111
根据以上分析,如果增强层只采用2Nx2N划分和基本层划分这两种划分编码,则编码效率会显著降低;但是增强层采用所有的划分,则编码复杂度很高。对此,本发明首先只编码这两种划分,然后判断它们是否最优划分,如果是则跳过其它划分的编码,既提高了编码速度又保证了编码效率。为了准确地判断这两种划分是否为最优划分,判断其划分的残差系数是否服从高斯分布。
优选地,为了判断划分的残差系数是否从高斯分布,可以采用“分布拟合检验”或者“峰度和偏度检验”进行检验。分布拟合检验如下:
Figure GDA0003713451460000121
其中,fi是第i个区域的实际个数,pi是理论概率,n是总个数,
Figure GDA0003713451460000122
可以通过查表得到。
峰度和偏度检验如下:
Figure GDA0003713451460000123
其中Bk是样本k阶中心矩,g1和g2分别是偏度和峰度,若残差系数服从高斯分布,n充分大时,近似地有
Figure GDA0003713451460000124
残差系数服从高斯分布只是最优划分的必要条件,当残差系数不满足提前终止条件时,为了进一步提高编码速度,可以根据纹理进行预测,研究其它划分的方差与可能性较大划分的方差之间的关系从而排除可能性较小的划分以提高编码速度。
优选地,判断当前编码单元是否是部分零块的过程包括:
设置阈值M并获取当前编码单元生成的N×N残差块;
从残差块第一个位置开始进行DCT变化和量化,判断残差块当前位置量化后的值是否小于1,若是,则当前位置被量化为0;
当前位置判断完成后,按照z字形扫描顺序判断下一个位置,记录整个N×N块残差块中被量化为0的位置个数;
判断被量化为0的位置个数是否大于M,若是,则当前编码单元是部分零块,本发明中采用N=8的8×8残差矩阵,根据测试确定阈值M=42。
DCT系数方差矩阵的具体计算方法如下:
Figure GDA0003713451460000125
其中,
Figure GDA0003713451460000126
表示的是DCT系数方差矩阵
Figure GDA0003713451460000127
中第i行,第j列,即位置为(i,j)时的DCT系数的方差,A是一个SHVC中的DCT整数变换,R为上面描述的沃尔森哈达玛变换(WHT)系数矩阵。
具体地,以8×8残差块为例,该矩阵的DCT变化表示为:
Figure GDA0003713451460000131
其中,f表示8×8的图像块,H8是一个8×8的DCT整数变换矩阵,
Figure GDA0003713451460000132
是H8的转置矩阵,
Figure GDA0003713451460000133
在DCT变换之后,对得到的DCT系数进行量化,量化过程表示为:
Figure GDA0003713451460000134
Fc(i,j)表示计算得到的DCT矩阵Fc的第i行,第j列,即位置(i,j)的DCT系数,对该系数进行量化,即可得到该位置量化后的值,表示为Fq(i,j),如果量化后的值小于1,则认为该位置被量化为0。继续按照z字形扫描的顺序,如图3所示,依次对各个位置进行DCT变换和量化,并记录量化后为零的位置的个数,用来和部分零块的阈值进行比较。经实验得出,当阈值确定为42时,可以得到较好的实验结果。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (4)

1.一种基于可能性大小的全零块预测方法,其特征在于,包括以下步骤:
S1.获取相邻编码单元的编码模式,并计算当前编码单元采用ILR模式的可能性;
S2.计算当前编码单元的SSD值,将根号SSD值与全零块阈值进行比较,若根号SSD值小于全零块阈值,则当前编码单元为全零块并进入步骤S6,否则进入步骤S3;
判断当前编码单元是否为全零块的过程包括:
根据当前编码单元的N×N残差矩阵Rr得到当前编码单元的SSD值:
SSD=∑|Rr(i,j)×Rr(i,j)|;
计算N×N全零块阈值D,表示为
Figure FDA0003713451450000011
Figure FDA0003713451450000012
则当前编码单元为全零块;
其中,f是一个舍入偏移参数,q是量化步长;
利用修正参数对全零块阈值D进行修正,具体包括:
获取相邻编码单元的编码模式,并计算当前编码单元采用ILR模式的可能性;
基于当前编码单元采用ILR模式的可能性,利用最小二乘法计算获得修正参数,该参数表示为:
α=20.83f(cm)3-25.89f(cm)2+16.93f(cm)-0.4268
修正后的全零块判断条件表示为:
Figure FDA0003713451450000013
其中,f(cm)表示当前编码单元的模式可能性;
计算当前编码单元的模式可能性f(cm)的过程包括:
S11.获取当前编码单元的相邻编码单元所采用的编码模式;
S12.统计编码单元采用帧内模式或ILR模式的概率,以及当前编码单元采用帧内模式或ILR模式时,其相邻编码单元采用帧内模式或ILR模式的概率;
S13.根据S11得知的当前编码单元的相邻编码单元采用的编码模式,在S12中获取采用该编码模式的概率,采用贝叶斯公式计算当前编码单元采用帧内模式或ILR模式的可能性;
步骤S13通过一个相邻编码单元,采用贝叶斯公式计算当前编码单元采用帧内模式或ILR模式的可能性,其可能性表示为:
Figure FDA0003713451450000021
其中,cm是当前编码单元的模式向量,nm是当前编码单元的相邻编码单元的模式向量,p(cm)表示当前编码单元采用cm模式的可能性,p(nm|cm)表示当前编码单元采用cm模式时,其相邻编码单元采用nm模式的可能性;
S3.判断当前编码单元生成的残差块是否服从高斯分布,若不是,则进入步骤S5,若是,则进入步骤S4;
S4.判断当前编码单元是否是部分零块,若不是,则进入步骤S5,若是,则进入步骤S6;
S5.对当前编码单元得到的残差块进行变换量化,变换量化后得到系数块,再对系数块进行反量化反变换后进入步骤S7;
S6.对当前编码单元中判断其是否为全零块和部分零块的标识变量赋值,赋值后进入步骤S7;
S7.判断当前宏块中所有编码单元产生的残差块是否处理完毕,若不是,则返回步骤S1,若是,则结束操作。
2.根据权利要求1所述的一种基于可能性大小的全零块预测方法,其特征在于,若每个相邻编码单元采用帧内模式或ILR模式的可能性相互独立,通过多个相邻编码单元计算当前编码单元采用帧内模式或ILR模式的可能性,其可能性表示为:
Figure FDA0003713451450000031
其中,K表示相邻编码单元的个数,p(nmi|cm)表示当前编码单元采用cm模式时,第i个相邻编码单元采用nm模式的可能性,p(nmi)表示第i个相邻编码单元采用nm模式的可能性。
3.根据权利要求2所述的一种基于可能性大小的全零块预测方法,其特征在于,为了减小通过多个相邻编码单元计算当前编码单元采用帧内模式或ILR模式的可能性时的误差,对计算得到的可能性进行修正,修正后的可能性表示为:
Figure FDA0003713451450000032
其中,f(cm)表示修正后的通过多个相邻编码单元计算当前编码单元采用帧内模式或ILR模式的可能性,fm(cm)表示修正前通过多个相邻编码单元计算当前编码单元采用帧内模式或ILR模式的可能性,fm(mILR)是当前编码单元采用ILR模式的可能性,fm(mintra)是当前编码单元采用帧内模式的可能性。
4.根据权利要求1所述的一种基于可能性大小的全零块预测方法,其特征在于,判断当前编码单元是否是部分零块的过程包括:
设置阈值M并获取当前编码单元生成的N×N残差块;
从残差块第一个位置开始进行DCT变化和量化,判断残差块当前位置量化后的值是否小于1,若是,则当前位置被量化为0;
当前位置判断完成后,按照z字形扫描顺序判断下一个位置,记录整个N×N块残差块中被量化为0的位置个数;
判断被量化为0的位置个数是否大于M,若是,则当前编码单元是部分零块。
CN202111491107.7A 2021-12-08 2021-12-08 一种基于可能性大小的全零块预测方法 Active CN114143537B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111491107.7A CN114143537B (zh) 2021-12-08 2021-12-08 一种基于可能性大小的全零块预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111491107.7A CN114143537B (zh) 2021-12-08 2021-12-08 一种基于可能性大小的全零块预测方法

Publications (2)

Publication Number Publication Date
CN114143537A CN114143537A (zh) 2022-03-04
CN114143537B true CN114143537B (zh) 2022-08-05

Family

ID=80385503

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111491107.7A Active CN114143537B (zh) 2021-12-08 2021-12-08 一种基于可能性大小的全零块预测方法

Country Status (1)

Country Link
CN (1) CN114143537B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114143536B (zh) * 2021-12-07 2022-09-02 重庆邮电大学 一种shvc空间可伸缩帧的视频编码方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090238271A1 (en) * 2006-09-20 2009-09-24 Dae-Yeon Kim Apparatus and method for encoding and decoding using alternative converter accoding to the correlation of residual signal
CN103796033A (zh) * 2014-01-24 2014-05-14 同济大学 一种高效视频编码零系数提前检测方法
CN104202599A (zh) * 2014-09-23 2014-12-10 浙江工商大学 一种应用于hevc帧间编码的全零块检测方法
CN105306956A (zh) * 2015-11-13 2016-02-03 浙江工商大学 一种提高hevc编码器离散余弦变换处理速度的方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090238271A1 (en) * 2006-09-20 2009-09-24 Dae-Yeon Kim Apparatus and method for encoding and decoding using alternative converter accoding to the correlation of residual signal
CN103796033A (zh) * 2014-01-24 2014-05-14 同济大学 一种高效视频编码零系数提前检测方法
CN104202599A (zh) * 2014-09-23 2014-12-10 浙江工商大学 一种应用于hevc帧间编码的全零块检测方法
CN105306956A (zh) * 2015-11-13 2016-02-03 浙江工商大学 一种提高hevc编码器离散余弦变换处理速度的方法

Also Published As

Publication number Publication date
CN114143537A (zh) 2022-03-04

Similar Documents

Publication Publication Date Title
CN1130921C (zh) 对视频信息预测编码的方法和装置
CN107046645B9 (zh) 图像编解码方法及装置
CN100463527C (zh) 一种多视点视频图像视差估计的方法
US20220217337A1 (en) Method, codec device for intra frame and inter frame joint prediction
CN107087200B (zh) 针对高效率视频编码标准的跳过编码模式提前判决方法
CN108989802B (zh) 一种利用帧间关系的hevc视频流的质量估计方法及系统
CN107690070A (zh) 基于无反馈码率控制的分布式视频压缩感知系统及方法
KR100922510B1 (ko) 영상의 부호화 및 복호화 방법, 장치 및 그 애플리케이션
CN101056408B (zh) 用于确定视频编码中跳跃模式的阈值的方法和装置
US5764921A (en) Method, device and microprocessor for selectively compressing video frames of a motion compensated prediction-based video codec
CN114143537B (zh) 一种基于可能性大小的全零块预测方法
CN101313581A (zh) 视频图像编码方法及设备
CN110677644B (zh) 一种视频编码、解码方法及视频编码帧内预测器
CN111447452A (zh) 数据编码方法及系统
CN115118976A (zh) 一种图像编码方法、可读介质及其电子设备
CN109688411B (zh) 一种视频编码率失真代价估计方法和装置
EP1723799A1 (en) Method, coding device and software product for motion estimation in scalable video editing
CN1457196A (zh) 基于时空域相关性运动矢量预测的视频编码方法
CN107820084B (zh) 一种视频感知编码方法及装置
CN114143536B (zh) 一种shvc空间可伸缩帧的视频编码方法
CN109547788B (zh) 图像压缩方法、设备及图像传输系统
CN109302605B (zh) 基于多核处理器的图像编码方法及设备
CN110035285B (zh) 基于运动矢量敏感度的深度预测方法
CN109547781B (zh) 基于图像预测的压缩方法及设备
CN109618155B (zh) 压缩编码方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20240129

Address after: Room 801, 85 Kefeng Road, Huangpu District, Guangzhou City, Guangdong Province

Patentee after: Guangzhou Dayu Chuangfu Technology Co.,Ltd.

Country or region after: China

Address before: 400065 Chongwen Road, Nanshan Street, Nanan District, Chongqing

Patentee before: CHONGQING University OF POSTS AND TELECOMMUNICATIONS

Country or region before: China