CN109417626A - 基于自适应变换的视频压缩的最后系数编码 - Google Patents

基于自适应变换的视频压缩的最后系数编码 Download PDF

Info

Publication number
CN109417626A
CN109417626A CN201780041911.0A CN201780041911A CN109417626A CN 109417626 A CN109417626 A CN 109417626A CN 201780041911 A CN201780041911 A CN 201780041911A CN 109417626 A CN109417626 A CN 109417626A
Authority
CN
China
Prior art keywords
transformation
coefficient
coordinate
knowledge
size
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201780041911.0A
Other languages
English (en)
Other versions
CN109417626B (zh
Inventor
S.拉瑟尔
S.普里
P.勒卡莱特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
InterDigital VC Holdings Inc
Original Assignee
InterDigital VC Holdings Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by InterDigital VC Holdings Inc filed Critical InterDigital VC Holdings Inc
Priority to CN202211230247.3A priority Critical patent/CN115604482A/zh
Publication of CN109417626A publication Critical patent/CN109417626A/zh
Application granted granted Critical
Publication of CN109417626B publication Critical patent/CN109417626B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/20Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/192Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

通过基于用于从视频像素块生成系数的块的部分变换的大小的知识来编码最后编码系数的位置的y坐标来执行对最后编码系数位置的编码。这使得能够更高效地执行对最后编码的系数参数的上下文自适应编码。

Description

基于自适应变换的视频压缩的最后系数编码
技术领域
本原理一般涉及视频压缩和解压缩系统,更具体地涉及基于块的变换。
背景技术
变换T将n个像素的块变换为n个变换系数。通过将逆变换T-1应用于变换系数以获得回像素值,该处理是可逆的。在部分变换P的情况下,n个像素被变换为少于n个变换系数,m,其中m<n。等效地,可以假设丢失的m-n个系数被设置为零。将近似“逆”变换P’应用于变换系数,以获得初始像素值的近似值。P’是近似值而不是精确的数学逆,这是因为部分变换是不可逆的。典型地,系数的部分变换块表示像素块的低频信息。
在一些视频编码标准中,将变换系数放入与扫描顺序相关联的二维(2D)块中;典型地,从高频到低频。在系数量化之后,第一,相对于高频到低频扫描顺序,非零量化系数被称为最后编码系数,如图1所示。
在与系数相关联的2D块拓扑中,对于大小为n=N×N的块,最后编码的系数具有两个坐标(x,y),如图2所示。
根据定义,0≤x,y≤N-1。将这两个坐标编码到比特流作为信息,以在解码器侧确定非零编码系数。至少,这些坐标指示坐标(x,y)的系数不为零,并且相对于低到高扫描顺序,在该系数之后的系数都是零。
可以添加指示变换系数的显著性的附加信息,以用信号通知剩余系数(图1中的问号标记的)是否为零。
传统上,在过去几十年中开发的许多视频和图像编解码器中,固定变换,诸如,离散余弦变换或离散正弦变换,例如被应用于每个块的像素以获得变换系数。然后,通过量化器Q量化这些系数,以获得由熵编码器(诸如例如VLC,算术编码器或上下文自适应二进制算术编码(CABAC))编码的量化系数。
期望尽可能高效地编码最后编码的系数位置。
作为固定变换的替代,可以使用内容自适应部分变换。这使得更好的能量压缩,从而降低比特率。然而,必须将自适应变换发送到解码器,这反过来增加比特率。如果没有注意发送这样的变换,尽管有更好的压缩,但全局比特率增加,并且自适应变换没有任何好处。
HEVC/H.265标准通过使用两个坐标(x,y)引入最后编码系数位置的编码。使用截取的一元码二进制化每个坐标,然后使用具有基于上下文的信道适配的CABAC编码HEVC术语中的每个比特或“bin”。在HEVC中,两个坐标x和y被独立编码和解码。
发明内容
通过本原理解决现有技术的这些和其它缺陷和缺点,本原理针对使用部分变换的大小的知识来编码通过使用部分变换获得的最后编码系数的方法和装置。
根据本原理的一个方面,提供一种编码一组变换系数的方法,包括以下步骤:变换图像值的块以获得变换系数;熵编码最后编码系数的位置,其中,最后编码系数的位置由两个坐标提供,使得y坐标的熵编码取决于用以获得系数的部分变换的大小的知识。
根据本原理的另一方面,提供编码一组变换系数的装置,包括:对图像值的块操作以获得变换系数的变换电路;以及熵编码器,其中,变换系数的最后编码系数的位置由两个坐标提供,使得y坐标的熵编码取决于用于获得系数的部分变换的大小的知识。
根据本原理的另一方面,提供解码一组变换系数的方法。该方法包括熵解码变换系数以生成最后编码系数的位置,其中最后编码系数的位置由两个坐标(x,y)提供,其特征在于,y坐标的所述熵解码取决于用于获得系数的部分变换的大小的知识,以及逆变换变换系数以获得图像值的块的步骤。
根据本原理的另一方面,提供了解码一组变换系数的装置。该装置包括熵解码器,根据变换系数对表示最后编码系数的位置的代码进行操作,其中最后编码系数的位置由两个坐标(x,y)提供,其特征在于,y坐标的熵编码取决于用于获得系数的部分变换的大小的知识。该装置还包括逆变换电路,对变换系数进行操作以获得图像值的块。
根据本原理的另一方面,提供一种非暂时性计算机可读存储介质,具有存储于其上的指令,用于解码一组变换系数,使得最后编码系数的位置由两个坐标(x,y)提供,其特征在于,y坐标的熵编码取决于用于获得系数的部分变换的大小的知识。
根据本原理的另一方面,提供一种非暂时性计算机可读存储介质,具有存储于其上的比特流,用于解码一组变换系数,使得最后编码系数的位置由两个坐标(x,y)提供,其特征在于,y坐标的熵编码取决于用于获得系数的部分变换的大小的知识。
从以下结合附图阅读的示例性实施例的详细描述,本原理的这些和其他方面,特征和优点将变得明显。
附图说明
图1示出变换单元的扫描顺序。
图2示出最后编码系数的坐标的示例。
图3示出具有12个系数的4×4变换单元中的编码的示例。
图4示出坐标值的后缀和前缀确定。
图5示出即时学习方案。
图6示出BD率增益对各种场景的变换矢量的数量。
图7示出具有部分变换的8×8块的编码。
图8示出上下文值的结构。
图9示出上下文值的演变。
图10示出取决于相邻信道的上下文选择的示例。
图11示出使用本原理编码一组变换系数的方法的一个实施例。
图12示出使用本原理编码一组变换系数的装置的一个实施例。
图13示出使用本原理解码一组变换系数的方法的一个实施例。
图14示出使用本原理解码一组变换系数的装置的一个实施例。
具体实施方式
通过以下实施例解决的技术问题是降低已经应用编码2D部分变换的像素的变换块中的最后编码系数的位置的成本。
这些实施例是对视频编码标准中常用的熵编码方案的改进。一种这样的视频编码标准是HEVC/H.265标准,但实施例不限于该标准。
本原理的主要构思是,如果对像素值的块使用部分变换,则已知一些变换系数一定为零,因此对最后编码系数的位置和表示最后编码系数的位置的坐标(x,y)施加一些约束。在描述的实施例中,在使用部分变换来将像素块变换为变换系数的情况下,关注在于使用这样的约束来高效地编码两个坐标(x,y)。
本构思使用的事实是,在m<n的情况下并非所有坐标对(x,y)都是可接受的,因此(x,y)的编码更高效。这可以使得改进压缩性能。
具体地,如果使用部分变换,则隐含地考虑到并非所有坐标对(x,y)都是可接受的事实,使得(x,y)的编码更高效。在具有部分变换的该具体实施例中,使用部分变换已经对修改的HEVC标准进行测试,并且已经示出(x,y)的改进编码导致约-0.5%的压缩增益。
在此呈现的构思提出了保持HEVC算法的主要部分来编码坐标对(x,y),但是增加特征,也就是,一旦得知x就降低编码y的可能范围。
例如,如图3所示,考虑具有部分变换P的4×4块,导致m=12个变换系数。结果,得知系数0到11可以是非零的,但系数12到15一定是零。
最后编码系数的坐标x在0(对于位置0,1,3,6)到3(仅对于位置9)的范围内。一旦得知x,则y的范围实际上取决于x。在上面的示例中,具有:
x=0或x=1导致y在[0,3]范围中
x=2导致y在[0,2]范围中
x=3导致y=0;在该情况下,甚至不需要编码y。
很容易理解这个编码的处理在解码x时是可解码的,然后推导出y的范围,假设m已知并在某处编码,然后解码y。
在HEVC中,坐标x或y被分成前缀和后缀,如图4所示。
例如,如果坐标值是14,则前缀是7,后缀以2比特编码。后缀是从坐标值中减去第一个值后的余数,14-12=2。如果坐标值为3,则前缀为3,但没有后缀。
使用截取的一元码二进制化前缀。基于得知提供前缀值的上边界的块大小来执行截取。使用CABAC和专用上下文来编码二进制化前缀的每个比特。
例如,在4×4块中,可能的前缀是分别被二进制化为1,01,001和000(截取的)的0,1,2或3。在另一示例中,在8×8块中,可能的前缀从0到5并且二进制化为1,01,001,0001,00001和00000(截取的)。
使用固定长度码来二进制化后缀,并且在旁路模式中使用CABAC而不使用上下文来编码固定长度后缀。例如,如果坐标值在16x16块中为14,则前缀为7(二进制化为0000000),后缀为2(二进制化为10并以2比特编码)。
使用仅用于前缀的上下文,如HEVC中那样,保留到前缀和后缀的二进制化处理。本原理的主要特征是y的上下文可以取决于x的值而在范围内减小。
通常,变换T将n个像素的块变换为m=n个变换系数。通过将逆变换T-1应用于变换系数以获得回像素值,该处理是可逆的。在部分变换P的情况下,n个像素被转换为较少的m<n个变换系数。等效地,可以假设缺少的m-n个系数被设置为零。“逆”变换P’(当然不是数学逆,因为部分变换不可逆)应用于变换系数,以获得初始像素值的近似值。典型地,部分变换系数表示像素块的低频信息。
如果使用部分变换,则已知一些的m-n个变换系数一定为零,因此对最后编码系数的位置和坐标(x,y)施加一些约束。在该情况下,通过隐含地使用这些约束,表明在使用部分变换将TU像素变换为变换系数的情况下,该实施例自动处理两个坐标(x,y)的高效编码。
代替诸如DCT或DST的系统变换,可以使用一组自适应的正交变换,而不是使用不同的分类和变换优化方案在大训练组上离线学习。将这组变换馈送到编解码器,并且在率失真优化(RDO)循环中选择组中的最佳变换。更为自适应的方法是学习用于序列的特定帧内帧的一组正交变换。这在本说明书的其余部分中被称为基于即时(on-the-fly)块的变换学习方案。该方案如图5所示。
图5的框图示出典型即时方案,其中算法被分成两部分,即视频/图像编解码器内的残差块的分类和新的变换组的生成。第一步将残差块分类为K个不同的类(S1...SK)。在第二步中,使用用于特定类的重构误差的最小化获得每个类的新变换。典型地,奇异值分解(SVD)和(Karhunen-Loève变换)KLT用于生成正交变换组。重复这两个步骤直到达到解的收敛或停止标准为止。如框图中看到,系统的输入是连同一些初始不可分离正交变换组(T1...TK)的帧内帧或图像。系统输出一组学习的变换(T’1,...T’K)以及需要被编码到要发送到解码器的比特流中的语法信息。典型地,与编码帧要求的比特相比,编码这些变换基矢量要求的开销比特非常大。
由于SVD的能量压缩特性,观察到通过推导学习变换的不完整表示可以显著降低开销成本,其中只有前‘m’个矢量被传送到解码器而剩余的(n-m)个变换矢量使用类似于Gram-Schmidt方法的完整算法生成或被强制为零,由此产生部分变换。
为了说明丢弃变换的最后几个矢量对Bjontegaard失真率(BD率)的影响,在4K序列‘PeopleOnStreet’和‘Traffic’上学习四个大小64x64的不可分离的优化变换。对这些序列执行编码测试,其中保留前‘m’个矢量,然后使用完整算法完成其余的基矢量。图6示出性能增益相对于编码基矢量的数量的变化。垂直轴是相对于锚的增益百分比(HEVC测试软件HM15.0)并且没有考虑变换成本。
在图2中观察到,通过仅保留变换矢量的前一半,即m=32,在BD率方面存在可忽略的性能下降。对于m=16的情况,即当仅编码前16个基矢量时,与通过编码所有‘n’个基矢量获得的总比特率相比,性能下降1%,但是变换矢量的开销成本减少到总开销的四分之一。对于m=8,在BD率性能方面存在相当大的性能损失,但也进一步降低开销。一般地,这表明在性能损失和开销成本之间存在折衷。
因为当仅编码前'm'个变换矢量时BD率方面的性能下降取决于视频内容,所以内容自适应方法有必要来估计‘m’的最佳值。直观地,在低比特率下,大多数系数被量化为零,而在高比特率下,即使在高频率下系数的能量也是显著的。因此,‘m’的值取决于内容以及量化参数QP。
平均的残差信号能量更集中在前几个系数中,其中DC系数具有平均最大能量,并且随着我们朝向更高频率系数而减小。因此,大多数高频系数被量化为零。可以应用基于简单阈值的方法以计算“m”的最佳值,其要求作为开销与帧一起被编码。
设E是DCT系数的能量之和。阈值t由参数p与E相乘来定义以获得,
t=p·E
‘m’的值可以简单地根据平均能量大于该阈值的系数的数量来计算。‘p’的值可以实验地找到。表1示出对于选择的‘p’值,在编码的矢量的总数量的百分比方面,高于该阈值的矢量的数量‘m’的变化。从表1中观察到,在高QP下,与低QP下要求的相比,所要求的矢量的平均数量要少得多。此外,矢量的数量‘m’也取决于内容变化。
表1:要编码的矢量的数量与不同序列的阈值
当使用部分变换应用本原理时,y的范围取决于x。
再次考虑图3的示例,使用m=12的部分变换,使得最后的16-12=4个总是为零。应该如何编码与系数位置12相关联的坐标(2,2)最高效?一种可能性是首先编码x=2。其二进制化是001,如在HEVC中。然后,得知y的可能范围是0到2,因此可以使用直到2的截取的一元码,而不是像HEVC中那样直到3的截取的一元码。这导致用于y的二进制化00,而不是001。并且,在二进制化处理中获得一个比特,从而导致更好的压缩性能。
在图3的示例中使用该实施例的二进制化的一些附加示例:
(3,0)二进制化为(000,无)而不是(000,0)
如在HEVC中,(0,0)二进制化为(0,0)
(3,3)是不可能的坐标。
具有部分变换的实施例容易地扩展到使用后缀的坐标y,如图7中的8x8TU中的示例,使用m=57的部分变换。前57个变换系数可以是非零,但最后64-57=7个系数一定为零。让我们假设最后编码系数位置是55。这给出坐标(x,y)=(5,6)。y的前缀为5,其后缀为0。在HEVC中,后缀应编码为1比特,但在我们的情况下,我们得知后缀不能为1,这是因为系数58(恰好低于系数55)在这种情况下已知一定是零,所以不编码后缀并获得一比特编码。
在HEVC/H.265标准中,在算术编码器中已经提出用于编码二进制数据的新工具,即上下文自适应二进制算术编码(或CABAC)。取值0或1的二进制符号s按照概率p为1和1-p为0而被编码。该概率从上下文推导出并在每个符号编码之后进行适配。
上下文值是8比特值,见图8。前面的比特表示最可能符号(或MPS),并且接下来的7比特表示从其推导概率p的概率p’(或状态)。
取决于编码符号是否等于MPS,按照图9中描述的处理来更新上下文值。
通过两个表进行演进(在编码符号是MPS的情况下transIdxMPS,在编码符号不是MPS的情况下transIdxLPS,即,是最小可能符号(LPS))。这些表在表2中被提供用于其名称为pStateIdx的入口p’。
表2:用于上下文状态演变的表
表9-41-状态转换表
pStateIdx 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
transIdxLps 0 0 1 2 2 4 4 5 6 7 8 9 9 11 11 12
transIdxNIps 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
pstateIx 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31
transIdxLps 13 13 15 15 16 16 18 18 19 19 21 21 22 22 23 24
transIdxMps i7 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32
pStateIdx 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47
transIdxLps 24 25 26 26 27 27 28 29 29 30 30 30 31 32 32 33
transIdxMps 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48
pStateIdx 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63
transIdxLps 33 33 34 34 35 35 35 36 36 36 37 37 37 38 38 63
transIdxMps 49 50 51 52 53 54 55 56 57 58 59 60 61 62 62 63
符号s作为MPS的概率PMPS在8比特上从0到127线性量化。其根据上下文值从以下推导出来:
pMPS=(p’+64)/127=(pStateldx+64)/127
并且取决于MPS的值,从PMPS明显推导出符号s的概率p为1。
如果MPS=1p=pMPS,
如果MPS=0p=1-pMPS.
上下文自适应编码是强大的工具,其允许编码动态地跟随符号所属的信道的统计。此外,每个信道都应该有其自己的上下文,以避免混合统计并损失处理的好处。这使得广泛使用HEVC/H.265(其使用数百个上下文)中的很多上下文,以为很多信道建模。例如,在使用上下文的所有信道中,存在
·运动矢量残差,
·TU编码标志,
·最后显著系数位置,
·编码组编码标志,
·变换系数显著标志,
·变换系数幅度(大于1且大于2)标志,
·SAO数据,
·其他数据
所有这些上下文/信道也很大程度上取决于颜色信道,即信道是亮度还是色度,变换单元大小,变换系数的位置,相邻符号值和其他因素。
作为示例,取决于当前CG下方和右侧的CG编码标志是否为1来选择编码组(CG)编码标志,如图10所示。
总而言之,上下文选择取决于很多事情,因此取决于大量的上下文。当然,解码器必须更新上下文值以与在编码器侧执行的相对应,以确保与编码器的同步和对流的解析。
在此描述的实施例提出了通过考虑用于从图像块值获得系数的部分变换的大小来减小潜在y坐标候选的范围。
实现描述的原理需要的相关联的语法应该是对部分变换的大小m的值的编码。可以在帧或条带级别编码该值,使得改进的二进制化和截取的一元码也可在解码器处确定。
关于解码处理,在此描述的原理必须相应地影响解码器以使其能够解码最后编码系数位置。
在使用部分变换的这样的实施例中,y后缀的改进的二进制化和截取的一元码也受到影响。
除了本原理的上述特征之外,描述的实施例提供了对m的编码或从其可以确定系数的子集的信息被呈现在比特流中。另外,最后编码系数由两个坐标(x,y)提供,并且子集和x的值用于确定y的范围。此外,基于确定的范围,使用截取的编码用于y前缀和后缀。
提出的构思在其呈现在视频流的语法中并且暗示要应用的解码方法的意义上是规范性的。因此,本构思可以在视频标准(诸如HEVC的后继者)中实现。
用于编码一组变换系数的方法1100的一个实施例在图11中示出。该方法在开始块1101处开始,并且控制前进到块1110,用于变换图像值的块以产生变换系数值。控制从块1110前进到块1120,以使用变换的大小的知识来熵编码最后编码系数以编码y坐标。
图12中示出用于编码一组变换系数的装置1200的一个实施例。该装置包括变换电路1210,在其输入端口上接收图像值的块并在其输出端口上产生变换系数。变换电路1210的该输出端口与熵编码器1220的输入在信号上连接。熵编码器1220使用用于编码y坐标的变换的大小的知识来编码最后编码系数位置的y坐标,从而产生最后编码系数值。
图13中示出用于解码一组变换系数的方法1300的实施例。该方法在开始块1301处开始,并且控制前进到块1310,用于使用用于解码y坐标的变换的大小的知识来熵解码最后编码系数。控制从块1310前进到块1320,用于逆变换系数以产生图像值。
图14中示出用于解码一组变换系数的装置1400的实施例。该装置包括熵解码器1410,接收包括最后编码系数的代码的变换系数,并使用变换的大小的知识解码y坐标来解码最后编码系数的y坐标。熵解码器1410的输出与逆变换电路1420的输入在信号上连接。逆变换电路1420在其输入端口上接收变换系数并逆变换它们以在其输出端口上产生图像值的块。
前述实施例可以在机顶盒(STB),调制解调器,网关或执行视频编码或解码的其他设备中实现。
可以通过使用专用硬件以及能够与适当软件相关联地执行软件的硬件来提供图中所示的各种元件的功能。当由处理器提供时,功能可以由单个专用处理器,单个共享处理器或多个单独的处理器提供,其中一些处理器可以被共享。此外,术语“处理器”或“控制器”的明确使用不应被解释为专指能够执行软件的硬件,并且可以隐含地包括但不限于数字信号处理器(“DSP”)硬件,用于存储软件的只读存储器(“ROM”),随机存取存储器(“RAM”)和非易失性存储器。
还可以包括其他硬件,传统的和/或定制的。类似地,图中所示的任何开关仅是概念性的。它们的功能可以通过程序逻辑的操作,通过专用逻辑,通过程序控制和专用逻辑的交互,或甚至手动地执行,具体技术可由实现者从上下文中更具体地理解来选择。
本说明书例示本原理。因此,要理解,本领域技术人员将能够设计出各种布置,这些布置虽然未在在此中明确描述或示出,但体现本原理并且包括在其精神和范围内。
在此记载的所有示例和条件语言旨在用于教学目的以帮助读者理解(多个)本发明人贡献的概念以促进本领域,并且应被解释为不限于这样的具体记载的示例和条件。
此外,在此记载本原理的原理,方面和实施例的所有陈述以及其特定示例旨在包含其结构和功能等效物二者。另外,这样的等效物旨在包括当前已知的等效物以及将来开发的等效物,即,执行相同功能而不管结构如何的开发的任何元件。
因此,例如,本领域技术人员将理解,在此呈现的框图表示体现本原理的例示性电路的概念图。类似地,要理解,任何流程图表,流程图,状态转换图,伪代码等表示可以基本上在计算机可读介质中表示并且由计算机或处理器执行的各种过程,无论这样的计算机或处理器是否被明确示出。
在其权利要求中,表达为用于执行规定功能的部件的任何元件旨在包含执行该功能的任何方式,包括例如a)执行该功能的电路元件的组合或b)任何形式的软件,因此包括与用于执行该软件以执行该功能的适当电路结合的固件,微代码等。由这样的权利要求定义的本原理在于这样的事实:由各种记载的部件提供的功能以权利要求所要求的方式组合并被带在一起。因此认为可以提供那些功能的任何部件等效于在此示出的那些。
说明书中对本原理的“一个实施例”或“实施例”及其其他变型的引用意味着本原理的至少一个实施例包括结合该实施例描述的具体特征,结构,特性等。因此,在出现在整个说明书中各个地方的短语“在一个实施例中”或“在实施例中”以及任何其他变型的出现不一定都指代相同的实施例。

Claims (15)

1.一种用于编码变换系数的块的方法,包括:
使用部分变换来变换图像值的块以获得变换系数,以便得知变换系数的子集是零;
熵编码两个坐标,所述两个坐标用于定义通过扫描变换系数确定的最后的非零变换系数在块中的位置,
其中,所述两个坐标的一个坐标(y)的熵编码取决于所述部分变换的大小的知识。
2.如权利要求1所述的方法,其中,在比特流中编码所述部分变换的大小的知识。
3.如前述任一项权利要求所述的方法,还包括:
将两个坐标中的每一个分解成前缀和后缀;并且,
从所述部分变换的大小的知识来推断y坐标的前缀的值。
4.根据前述权利要求中任一项所述的方法,其中,可以使用离线学习的一组自适应的部分变换来变换图像值的块。
5.一种用于编码一组变换系数的装置,包括:
变换电路,使用部分变换来操作图像值的块以获得变换系数;
熵编码器,根据通过扫描变换系数确定的变换系数,生成表示最后编码系数的位置的两个坐标,
其中,最后编码系数的位置由两个坐标(x,y)提供,其特征在于,y坐标的所述熵编码取决于部分变换的大小的知识。
6.如权利要求5所述的装置,其中,在比特流中编码部分变换的大小的知识。
7.如权利要求5或6所述的装置,其中,所述熵编码器将两个坐标中的每一个分解为前缀和后缀;并且,从x坐标推断y坐标的前缀的值。
8.一种用于解码一组变换系数的方法,包括:
对代码进行熵解码以生成最后编码系数的位置,
其中,最后编码系数的位置由两个坐标(x,y)提供,其特征在于,y坐标的所述熵解码取决于部分变换的大小的知识;
使用部分变换对变换系数进行逆变换,以获得图像值的块。
9.如权利要求8所述的方法,其中,从比特流中解码部分变换的大小的知识。
10.如权利要求8或9所述的方法,还包括:
将两个坐标中的每一个分解为前缀和后缀;并且,
从部分变换的大小的知识来推断y坐标的前缀的值。
11.一种用于解码一组变换系数的装置,包括:
熵解码器,根据变换系数对表示最后编码系数的位置的代码进行操作,
其中,最后编码系数的位置由两个坐标(x,y)提供,其特征在于,y坐标的所述熵解码取决于部分变换的大小的知识;
逆变换电路,使用部分变换来操作变换系数,以获得图像值的块。
12.如权利要求11所述的装置,其中,从比特流中解码部分变换的大小的知识。
13.如权利要求11或12所述的装置,其中,所述熵解码器将两个坐标中的每一个分解为前缀和后缀;并且,从部分变换的大小的知识来推断y坐标的前缀的值。
14.一种非暂时性计算机可读存储介质,具有存储于其上的指令,用于根据权利要求8至10中任一项所述的方法解码一组变换系数或者用于根据权利要求1至4中任一项编码变换系数的块。
15.一种非暂时性计算机可读存储介质,其上存储有根据权利要求8至10中任一项所述的方法的比特流。
CN201780041911.0A 2016-07-15 2017-07-12 基于自适应变换的视频压缩的最后系数编码 Active CN109417626B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211230247.3A CN115604482A (zh) 2016-07-15 2017-07-12 基于自适应变换的视频压缩的最后系数编码

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP16305919.9 2016-07-15
EP16305919.9A EP3270595A1 (en) 2016-07-15 2016-07-15 Method and apparatus for last coefficient coding for adaptive transform based video compression
PCT/EP2017/067616 WO2018011303A1 (en) 2016-07-15 2017-07-12 Last coefficient coding for adaptive transform based video compression

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202211230247.3A Division CN115604482A (zh) 2016-07-15 2017-07-12 基于自适应变换的视频压缩的最后系数编码

Publications (2)

Publication Number Publication Date
CN109417626A true CN109417626A (zh) 2019-03-01
CN109417626B CN109417626B (zh) 2022-10-21

Family

ID=56511500

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201780041911.0A Active CN109417626B (zh) 2016-07-15 2017-07-12 基于自适应变换的视频压缩的最后系数编码
CN202211230247.3A Pending CN115604482A (zh) 2016-07-15 2017-07-12 基于自适应变换的视频压缩的最后系数编码

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN202211230247.3A Pending CN115604482A (zh) 2016-07-15 2017-07-12 基于自适应变换的视频压缩的最后系数编码

Country Status (6)

Country Link
US (2) US11496752B2 (zh)
EP (2) EP3270595A1 (zh)
JP (1) JP7489776B2 (zh)
KR (3) KR20230152782A (zh)
CN (2) CN109417626B (zh)
WO (1) WO2018011303A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021036979A1 (en) * 2019-08-24 2021-03-04 Beijing Bytedance Network Technology Co., Ltd. Residual coefficients coding

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111436231B (zh) 2018-11-12 2022-03-25 Lg电子株式会社 基于高频调零对变换系数进行编码的方法及其设备
JP7494850B2 (ja) * 2019-06-19 2024-06-04 ソニーグループ株式会社 画像処理装置および方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012139192A2 (en) * 2011-04-15 2012-10-18 Research In Motion Limited Methods and devices for coding and decoding the position of the last significant coefficient
WO2013070610A1 (en) * 2011-11-08 2013-05-16 Qualcomm Incorporated Context optimization for last significant coefficient position coding
US20130208806A1 (en) * 2010-10-14 2013-08-15 Thomson Licensing Method and apparatus for improved entropy encoding and decoding
US20140003529A1 (en) * 2012-06-29 2014-01-02 Qualcomm Incorporated Coding of significance flags
CN104469378A (zh) * 2013-09-19 2015-03-25 黑莓有限公司 用于对系数组中的最后一个非零变换系数的位置数据进行编码
US20150264403A1 (en) * 2014-03-17 2015-09-17 Qualcomm Incorporated Systems and methods for low complexity forward transforms using zeroed-out coefficients

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9008171B2 (en) 2008-01-08 2015-04-14 Qualcomm Incorporated Two pass quantization for CABAC coders
US9509989B2 (en) 2011-08-04 2016-11-29 Hfi Innovation Inc. Method and apparatus for reordered binarization of syntax elements in CABAC
US9350996B2 (en) 2011-12-20 2016-05-24 Google Technology Holdings LLC Method and apparatus for last coefficient indexing for high efficiency video coding
CN108769691B (zh) * 2011-12-28 2022-05-31 夏普株式会社 图像解码装置、图像解码方法以及图像编码装置
EP4236318A3 (en) * 2012-01-20 2023-11-08 Google Technology Holdings LLC Devices and methods for context reduction in last significant coefficient position coding
WO2013180023A1 (ja) * 2012-06-01 2013-12-05 シャープ株式会社 算術復号装置、画像復号装置、算術符号化装置、および画像符号化装置
US9734601B2 (en) * 2014-04-04 2017-08-15 The Board Of Trustees Of The University Of Illinois Highly accelerated imaging and image reconstruction using adaptive sparsifying transforms
US10277905B2 (en) * 2015-09-14 2019-04-30 Google Llc Transform selection for non-baseband signal coding
EP3166313A1 (en) 2015-11-09 2017-05-10 Thomson Licensing Encoding and decoding method and corresponding devices
US9942548B2 (en) * 2016-02-16 2018-04-10 Google Llc Entropy coding transform partitioning information
EP3270594A1 (en) 2016-07-15 2018-01-17 Thomson Licensing Method and apparatus for advanced cabac context adaptation for last coefficient coding

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130208806A1 (en) * 2010-10-14 2013-08-15 Thomson Licensing Method and apparatus for improved entropy encoding and decoding
WO2012139192A2 (en) * 2011-04-15 2012-10-18 Research In Motion Limited Methods and devices for coding and decoding the position of the last significant coefficient
WO2013070610A1 (en) * 2011-11-08 2013-05-16 Qualcomm Incorporated Context optimization for last significant coefficient position coding
US20140003529A1 (en) * 2012-06-29 2014-01-02 Qualcomm Incorporated Coding of significance flags
CN104469378A (zh) * 2013-09-19 2015-03-25 黑莓有限公司 用于对系数组中的最后一个非零变换系数的位置数据进行编码
US20150264403A1 (en) * 2014-03-17 2015-09-17 Qualcomm Incorporated Systems and methods for low complexity forward transforms using zeroed-out coefficients

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
OSMAN G. SEZER等: "SPARSE ORTHONORMAL TRANSFORMS FOR IMAGE COMPRESSION", 《15TH IEEE INTERNATIONAL CONFERENCE ON IMAGE PROCESSING,ICIP 2008》 *
YOON MI HONG等: "Low-complexity 16x16 and 32x32 transforms and partial frequency transform", 《JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC)》 *
徐飞等: "HEVC熵编码算法优化", 《计算机与现代化》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021036979A1 (en) * 2019-08-24 2021-03-04 Beijing Bytedance Network Technology Co., Ltd. Residual coefficients coding

Also Published As

Publication number Publication date
KR20220058973A (ko) 2022-05-10
JP2019520773A (ja) 2019-07-18
JP7489776B2 (ja) 2024-05-24
CN109417626B (zh) 2022-10-21
EP3270595A1 (en) 2018-01-17
US20230039301A1 (en) 2023-02-09
KR20190035681A (ko) 2019-04-03
US20190297335A1 (en) 2019-09-26
KR20230152782A (ko) 2023-11-03
US11496752B2 (en) 2022-11-08
WO2018011303A1 (en) 2018-01-18
CN115604482A (zh) 2023-01-13
EP3485640A1 (en) 2019-05-22

Similar Documents

Publication Publication Date Title
KR101356733B1 (ko) 컨텍스트 기반 적응적 이진 산술 부호화, 복호화 방법 및장치
US9462279B2 (en) Image encoding/decoding method and device
US9414063B2 (en) Method and apparatus for entropy encoding/decoding a transform coefficient
CN107347155B (zh) 用于编码和解码图像的方法、编码和解码设备
CN105556971A (zh) 针对帧内块复制预测中的块翻动和跳跃模式的编码器侧判定
JP6873930B2 (ja) デジタル画像のコーディング方法、デコーディング方法、装置、および関連するコンピュータプログラム
KR20110046016A (ko) 레지듀얼 블록의 부호화 방법 및 장치, 복호화 방법 및 장치
CN115514978A (zh) 用于在视频压缩中的熵代码化的概率的混合
MX2012011650A (es) Metodo y aparato para codificar y decodificar imagenes y metodo y aparato para decodificar imagenes usando orden de barrido de coeficiente adaptativo.
CN109417627A (zh) 用于最后系数编码的高级cabac上下文自适应的方法和装置
JP2017507519A (ja) データ符号化及び復号化
US10652541B2 (en) Method and device for encoding video data
US20230039301A1 (en) Last coefficient coding for adaptive transform based video compression
CN110870312A (zh) 用于视频压缩中的帧内编码的方法和设备
US10735733B2 (en) Method and device for encoding video data
CN109417622A (zh) 使用简单本地预测器的改进的有效性标志译码的方法和装置
JP2019537344A (ja) 画像パラメータをコーディング及びデコーディングする方法、画像パラメータをコーディング及びデコーディングする装置、並びに、これらに対応するコンピュータプログラム
CN112806017B (zh) 用于编码变换系数的方法和设备
KR20200025171A (ko) 다중 변환 선택을 사용하는 비디오 신호 처리 방법 및 장치
KR20200023135A (ko) 다중 변환 선택을 사용하는 비디오 신호 처리 방법 및 장치
Malu H264/AVC Video Stream Parser For Baseline Profile
Ismeel Adaptive inter frame compression using image segmented technique
WO2016148620A1 (en) Encoding and decoding an displacement vector

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant