CN117597926A - 图片的块中的最后有效系数的编码 - Google Patents

图片的块中的最后有效系数的编码 Download PDF

Info

Publication number
CN117597926A
CN117597926A CN202280042136.1A CN202280042136A CN117597926A CN 117597926 A CN117597926 A CN 117597926A CN 202280042136 A CN202280042136 A CN 202280042136A CN 117597926 A CN117597926 A CN 117597926A
Authority
CN
China
Prior art keywords
block
zeroing
last
coefficient
significant coefficient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280042136.1A
Other languages
English (en)
Inventor
K·纳赛尔
F·莱莱昂内克
T·波里尔
F·加尔平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
InterDigital CE Patent Holdings SAS
Original Assignee
InterDigital CE Patent Holdings SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by InterDigital CE Patent Holdings SAS filed Critical InterDigital CE Patent Holdings SAS
Publication of CN117597926A publication Critical patent/CN117597926A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

一种方法,该方法包括:确定(701)对变换系数块应用了归零过程;以及,相对于取决于所应用的归零过程的块中的位置对扫描次序中的块的最后有效系数的位置进行解码(702)。

Description

图片的块中的最后有效系数的编码
1.技术领域
本发明实施方案中的至少一个实施方案总体上涉及一种用于对图片的块中的最后有效系数进行编码和解码的方法和设备。
2.背景技术
为了实现高压缩效率,视频编码方案通常采用预测和变换来利用视频内容中的空间和时间冗余。在编码期间,将视频内容的图片划分为样本块(即像素),然后将这些块分区为一个或多个子块,在下文称为原始子块。然后对每个子块应用帧内或帧间预测以利用帧内或帧间图像相关性。无论使用何种预测方法(帧内或帧间),都针对每个原始子块确定预测值子块。然后,对表示原始子块与预测值子块之间的差的子块(通常表示为预测误差子块、预测残差子块或简单地表示为残差子块)进行变换、量化和熵编码,以生成编码视频流。为了重构视频,通过对应于变换、量化和熵编码的逆过程来解码压缩数据。
对变换系数子块进行编码时的一个关键方面是发信号通知子块的最后有效系数的位置。子块的最后有效系数是变换和量化之后在该子块中的扫描次序中的最后非零系数。可以应用若干策略以利用有限速率和失真成本来发信号通知最后有效系数的位置。例如,一种策略包括发信号通知最后有效系数相对于子块左上角的位置,而另一种策略包括发信号通知最后有效系数相对于子块右下角的位置。这些策略的主要问题是:它们主要基于在变换和量化之后的已知信号特性,但是忽略了一些编码模式根据这些系数在子块中的位置对一些系数施加归零。如果系数在给定位置,则将在变换和量化后是非零的系数设置为零。
希望提出允许克服上述问题的解决方案。具体地,期望提出一种解决方案,其允许考虑在块的变换和量化之后可将任意归零应用于发信号通知块的最后有效系数。
3.发明内容
在第一方面,本实施方案中的一者或多者提供一种方法,该方法包括:确定对变换系数块应用了归零过程;以及,相对于取决于所应用的归零过程的块中的位置来将扫描次序中的块的最后有效系数的位置进行解码。
在实施方案中,根据应用于块的变换过程的类型来确定对块的归零过程的实际应用。
在实施方案中,根据应用于块的变换过程的类型来确定归零过程的类型。
在实施方案中,取决于所应用的归零过程的块中的位置是块中左上系数的位置或者块中右下系数的位置或者块中具有等于取决于归零过程的最大允许值的坐标值的位置。
在第二方面,本实施方案中的一者或多者提供一种方法,该方法包括:确定对变换系数块应用了归零过程;以及,相对于取决于所应用的归零过程的块中的位置发信号通知扫描次序中的块的最后有效系数的位置。
在实施方案中,根据应用于块的变换过程的类型来确定对块的归零过程的实际应用。
在实施方案中,根据应用于块的变换过程的类型来确定归零过程的类型。
在实施方案中,取决于所应用的归零过程的块中的位置是块中左上系数的位置或者块中右下系数的位置或者块中具有等于取决于归零过程的最大允许值的坐标值的位置。
在第三方面,本实施方案中的一者或多者提供一种设备,该设备包括电子电路,该电子电路适于:确定对变换系数块应用了归零过程;以及,相对于取决于所应用的归零过程的块中的位置来将扫描次序中的块的最后有效系数的位置进行解码。
在实施方案中,根据应用于块的变换过程的类型来确定对块的归零过程的实际应用。
在实施方案中,根据应用于块的变换过程的类型来确定归零过程的类型。
在实施方案中,取决于所应用的归零过程的块中的位置是块中左上系数的位置或者块中右下系数的位置或者块中具有等于取决于归零过程的最大允许值的坐标值的位置。
在第四方面,本实施方案中的一者或多者提供一种设备,该设备包括电子电路,该电子电路适于:确定对变换系数块应用了归零过程;以及,相对于取决于所应用的归零过程的块中的位置发信号通知扫描次序中的块的最后有效系数的位置。
在实施方案中,根据应用于块的变换过程的类型来确定对块的归零过程的实际应用。
在实施方案中,根据应用于块的变换过程的类型来确定归零过程的类型。
在实施方案中,取决于所应用的归零过程的块中的位置是块中左上系数的位置或者块中右下系数的位置或者块中具有等于取决于归零过程的最大允许值的坐标值的位置。
在第五方面,本实施方案中的一者或多者提供一种信号,该信号由第二方面的方法或第四方面的设备生成。
在第六方面,本实施方案中的一者或多者提供一种计算机程序,该计算机程序包括用于实现第一方面或第二方面的方法的程序代码指令。
在第七方面,本实施方案中的一者或多者提供一种非暂态信息存储介质,该非暂态信息存储介质存储用于实现第一方面或第二方面的方法的程序代码指令。
4.附图说明
图1A表示块中非零系数的重新划分;
图1B描绘了其中执行归零的变换块的第一示例;
图1C描绘了其中执行归零的变换块的第二示例;
图2示意性地示出了原始视频的像素图片所经历的分区的示例;
图3示意性地描绘了用于对视频流进行编码的方法;
图4示意性地描绘了用于对编码视频流进行解码的方法;
图5A示意性地示出了其中实现实施方案的视频流系统的示例;
图5B示意性地示出了能够实现编码模块或解码模块的处理模块的硬件架构的示例,其中实现了各个方面和实施方案;
图5C示出了在其中实现各个方面和实施方案的第一系统的示例的框图;
图5D示出了在其中实现各个方面和实施方案的第二系统的示例的框图;
图6示意性地示出了在编码过程期间实施方案的应用;
图7示意性地表示在解码过程期间实施方案的应用;并且,
图8示出了在LFNST中应用的归零过程。
5.具体实施方式
在类似于VVC(被称为联合视频专家组(JVET)的ITU-T和ISO/IEC专家的联合合作团队正在开发的多功能视频编码(VVC))的视频格式的上下文中描述了实施方案的以下示例。然而,这些实施方案不限于对应于VVC的视频编码/解码方法。这些实施方案特别适于各种视频格式,包括例如HEVC(ISO/IEC 23008-2-MPEG-H第2部分,高效视频编码/ITU-TH.265))、AVC(ISO/CEI 14496-10)、EVC(基本视频编码/MPEG-5)、AV1和VP9。
图2、图3和图4介绍了视频格式的示例。
图2示出了原始视频序列20的像素图片21所经历的分区的示例。在此认为像素由三个分量组成:一个亮度分量和两个色度分量。然而,其他类型的像素可能包括更少或更多分量(诸如仅亮度分量或额外的深度分量或透明度分量)。
将图片划分为多个编码实体。首先,如图2中的参考标号23所表示,将图片划分为称为编码树单元(CTU)的块的网格。CTU由N×N个亮度样本块以及两个对应的色度样本块组成。N通常是二的幂,例如最大值为“128”。其次,将图片划分为一个或多个CTU组。例如,可将该图片划分为一个或多个图块行和图块列,图块是覆盖图片的矩形区域的CTU序列。在一些情况下,可将图块划分为一个或多个砖块,砖块中的每一者由图块内的至少一个CTU行组成。在图块和砖块的概念之上,存在另一编码实体,称为切片,其可包含图片的至少一个图块或图块的至少一个砖块。
在图2的示例中,如参考标号22所表示,将图片21划分为光栅扫描切片模式的三个切片S1、S2和S3,每个切片包括多个图块(未示出),每个图块仅包括一个砖块。
如图1中的参考标号24所表示,CTU可被分区为被称为编码单元(CU)的一个或多个子块的分层树的形式。CTU是分层树的根(即,父节点),并且可被分区为多个CU(即,子节点)。如果每个CU未被进一步分区为较小CU,则每个CU成为分层树的叶;或者如果每个CU被进一步分区为较小CU(即,子节点),则每个CU成为较小CU的父节点。
在图1的示例中,首先,使用四叉树类型分区将CTU 14分区为“4”个正方形CU。左上角的CU是分层树的叶,因为其未进一步分区,即其并非任何其他CU的父节点。再次使用四叉树类型分区将右上角的CU进一步分区为“4”个较小正方形CU。使用二叉树类型分区将右下角的CU竖直地分区为“2”个矩形CU。使用三叉树类型分区将左下角的CU竖直地分区为“3”个矩形CU。
在图片编码期间,分区是自适应的,每个CTU均被分区以便优化CTU准则的压缩效率。
HEVC中出现了预测单元(PU)和变换单元(TU)的概念。实际上,在HEVC中,用于预测的编码实体(即PU)和用于变换的编码实体(即TU)可以是CU的子划分。例如,如图1中所表示,大小2N×2N的CU可以被划分为大小N×2N或大小2N×N的PU 2411。除此之外,所述CU可以被划分为大小N×N的“4”个TU 2412或大小的“16”个TU。
可以注意到,在VVC中,除某些特殊情况外,TU和PU的边界在CU的边界上对准。因此,CU一般包括一个TU和一个PU。
在本申请中,术语“块”或“图片块”可用于指CTU、CU、PU和TU中的任一者。除此之外,术语“块”或“图片块”可用于指H.264/AVC或其他视频编码标准中所指定的宏块、分区和子块,并且更一般地指众多大小的样本的阵列。
在本申请中,术语“重构”和“解码”可互换使用,术语“像素”和“样本”可互换使用,术语“图像”、“图片”、“子图片”、“切片”和“帧”可互换使用。通常,但不必然,术语“重建”在编码器侧使用,而“解码”在解码器侧使用。
图3示意性地描绘了由编码模块执行的用于对视频流进行编码的方法。设想了用于编码的此方法的变型,但为了清楚起见,下文描述了图3的用于编码的方法,而未描述所有预期变型。
在编码之前,原始视频序列的当前原始图片可经过预处理。例如,在步骤301中,对当前原始图片应用颜色变换(例如,从RGB 4:4:4到YCbCr4:2:0的转换),或者对当前原始图片分量应用重新映射,以便获得对压缩更具弹性的信号分布(例如,使用颜色分量中的一个颜色分量的直方图均衡化)。通过预处理获得的图片在下文中被称为预处理图片。
预处理图片的编码在步骤302期间以预处理图片的分区开始,如关于图2所描述的。因此,预处理图片被分区为CTU、CU、PU、TU等。对于每个块,编码模块确定在帧内预测与帧间预测之间的编码模式。
帧内预测包括在步骤303期间根据帧内预测方法从预测块中预测当前块的像素,该预测块从位于待编码的当前块的因果关系附近的重构块的像素中导出。帧内预测的结果是指示使用附近块的哪些像素的预测方向,以及通过计算当前块与预测块之间的差而得到的残差块。
帧间预测包括从当前图片(此图片被称为参考图片)之前或之后的图片的像素块(被称为参考块)中预测当前块的像素。在根据帧间预测方法对当前块进行编码期间,由运动估计步骤304根据相似度准则确定参考图片的最接近当前块的块。在步骤304期间,确定指示参考图片中的参考块的位置的运动矢量。所述运动矢量在运动补偿步骤305期间使用,在该运动补偿步骤期间以当前块与参考块之间的差的形式计算残差块。在第一视频压缩标准中,上述单向帧间预测模式是唯一可用的帧间模式。随着视频压缩标准的演进,帧间模式族已显著增长并且现在包括许多不同的帧间模式。
在选择步骤306期间,由编码模块在所测试的预测模式(帧内预测模式、帧间预测模式)当中根据速率/失真优化准则(即RDO准则)来选择优化压缩性能的预测模式。
当选择预测模式时,在步骤307期间变换残差块。在一些具体实施中,可将多种类型的变换应用于经变换的残差块。实际上,除了DCT-II之外,多变换选择(MTS)方案用于帧间预测块和帧内预测块两者。它使用来自DCT-VIII/DST-VII的多个选定变换。表TAB1中表示了不同变换的基函数。
表TAB1
已经提出了与被称为低频不可分离变换(LFNST)的变换有关的另一方案。在正向主变换(即步骤307的通常变换)和量化(对应于步骤309)之间应用LFNST。在LFNST中,根据块大小应用4×4不可分离变换或8×8不可分离变换。例如,4×4 LFNST应用于小块,而8×8LFNST应用于较大块。
LFNST和MTS两者都对变换系数施加归零(即,清零),即,一些系数的值根据它们在块中的位置而被施加归零。
具体来说,对于MTS,当变换长度为“32”时,保持扫描次序中的前“16”个系数,且将后“16”个系数设置为零。因此,典型地,当应用MTS时,当应用DST-VII或DCT-VIII时,而不是当应用DCT-II时,对变换系数应用归零过程。图1B示出了在其上应用了MTS的归零过程的块(深灰色)的示例。
对于LFNST,如果变换块大小为4×4(分别为8×8),则扫描次序中仅前“8”个系数不为零(相应地前“16”个系数不为零)。图1C示出了在其上应用LFNST的归零过程的32×32变换块(深灰色)的示例。
然后在步骤309期间对经变换的块进行量化。
需注意,编码模块可跳过变换,并对未变换的残差信号直接应用量化。当根据帧内预测模式对当前块进行编码时,在步骤310期间,由熵编码器对预测方向以及经变换和量化的残差块进行编码。当根据帧间预测对当前块进行编码时,在适当时根据从与位于待编码块附近的重构块相对应的运动矢量的集合中选择的预测矢量来预测块的运动矢量。接下来,在步骤310期间,由熵编码器以运动残差和用于识别预测矢量的索引的形式对运动信息进行编码。在步骤310期间,由熵编码器对经变换和量化的残差块进行编码。
如已经提到的,当对经变换和量化的残差块进行编码时的一个关键方面是发信号通知最后有效系数。在一些具体实施中,通过发信号通知该系数的块中相对于块的左上角的水平和垂直坐标来执行发信号通知最后有效系数。更具体地,每个坐标以前缀(last_sig_coeff_x_prefix,last_sig_coeff_y_prefix)和后缀(last_sig_coeff_x_suffix,last_sig_coeff_y_suffix)的形式进行编码,如表TAB2中表示的被称为residual_coding的残差块解码过程所表示的:
表TAB2
其中log2TbWidth(相应地log2TbHeight)表示块的宽度(相应地高度),cIdx是颜色分量,并且x0和y0表示块的位置。
最后有效系数的位置(LastSignificantCoeffX,LastSignificantCoeffY)然后通过以下过程(以下称为基本导出过程)根据前缀和后缀计算:
·如果last_sig_coeff_x_suffix不存在,则以下适用:
LastSignificantCoeffX=last_sig_coeff_x_prefix
·否则(last_sig_coeff_x_suffix存在),则以下适用:
LastSignificantCoeffX=(1<<((last_sig_coeff_x_prefix>>1)-1))*
(2+(last_sig_coeff_x_prefix&1))+
last_sig_coeff_x_suffix
·如果last_sig_coeff_y_suffix不存在,则以下适用:
LastSignificantCoeffY=last_sig_coeff_y_prefix
·否则(last_sig_coeff_y_suffix存在),则以下适用:
LastSignificantCoeffY=(1<<((last_sig_coeff_y_prefix>>1)-1))*
(2+(last_sig_coeff_y_prefix&1))+
last_sig_coeff_y_suffix
通常,最后有效系数的位置是相对于块的左上角计算的。实际上,已经根据统计观察到最后有效系数更接近块的左上角。因此,根据左上角计算最后有效系数通常允许减小分配给语法元素last_sig_coeffx_suffix、last_sig_coeff_y_suffix、last_sig_coeffx_prefix和last_sig_coeff_y_prefix的编码的比特率。然而,也已经观察到,该假设对于具有高比特深度、高比特率和/或高帧速率的内容(在下文中称为操作范围扩展内容)不再成立。实际上,已经观察到,对于高比特率编码,最后有效系数更接近于块的右下角而不是左上角。这是因为对于高比特率,量化变得更精细并且更多非零变换系数保留在高频区域中(朝向编码块的右下方)。这在图1A中示出。图1A在左侧表示以低比特率编码的块,并且在右侧表示以高比特率编码的块。以浅灰色表示的非零系数在低比特率编码中更接近左上角,而在高比特率编码中它们更接近右下角(特别是最后有效系数)。因此,为了提高编码效率,有利的是相对于其到右下角的距离对最后有效系数的位置进行编码,而不是相对于其到左上角的距离对其进行编码。
除此之外,可注意到,发信号通知最后有效系数不考虑应用于变换系数的归零(即,清零)过程,即使该归零过程必定对块中最后有效系数的位置具有很大影响。例如,当MTS被激活时,高比特率编码中的非零系数将更接近16×16边界(如图1B中的浅灰色矩形所表示的),而不是更接近右下角。实际上,由于归零过程,不能从16×16正方形中找到非零系数。在LFNST的情况下,由于归零过程,最后有效系数的位置(在图1C中的浅灰色正方形中)变得远离右下角。如当MTS和LFNST被激活时可以看出,左上角和右下角似乎都不一定是用于对最后有效系数的位置进行编码的最佳起点。
在以下实施方案中,提出相对于取决于应用于经变换和量化的残差块的系数的最终归零(即,清零)过程来发信号通知最后有效系数的位置。
需注意,编码模块可绕过变换和量化,即,对残差应用熵编码,而不应用变换或量化过程。熵编码的结果插入到编码视频流311中。
诸如SEI(补充增强信息)消息的元数据可以被附加到编码视频流311。例如在诸如AVC、HEVC或VVC的标准中定义的SEI消息是与视频流相关联并且包括提供与视频流相关的信息的元数据的数据容器。
在量化步骤309之后,重构当前块,使得对应于该块的像素可用于将来预测。该重构阶段也称为预测环路。因此,在步骤312期间将逆量化应用于经变换和量化的残差块,并且在步骤313期间应用逆变换。根据用于在步骤314期间获得的块的预测模式,重构块的预测块。如果根据帧间预测模式对当前块进行编码,则编码模块在适当时在步骤316期间应用使用当前块的运动矢量的运动补偿,以便识别当前块的参考块。如果根据帧内预测模式对当前块进行编码,则在步骤315期间,使用对应于当前块的预测方向来重构当前块的预测块。将预测块和重构的残差块相加,以便获得重构的当前块。
在重构后,在步骤317期间,将旨在减少编码伪像的环路内滤波应用于重构块。该滤波称为环路内滤波,因为该滤波发生在预测环路中,以在解码器处获得与编码器相同的参考图片,从而避免编码过程与解码过程之间的漂移。环路内滤波工具包括解块滤波、样本自适应偏移(SAO)和自适应环路滤波器(ALF)。
当重构块时,在步骤318期间将块插入到存储在一般称为的解码图片缓冲器(DPB)的存储器319中的重构图片中。然后,存储的重构图片可用作待编码的其他图片的参考图片。
图4示意性地描绘了由解码模块执行的用于对根据关于图3描述的方法编码的编码视频流311进行解码的方法。设想了该用于解码的方法的变型,但是为了清楚起见,以下描述了图4的用于解码的方法,而未描述所有预期变型。
解码是逐块进行的。对于当前块,该解码在步骤410期间以当前块的熵解码开始。熵解码允许获得至少块的预测模式。除此之外,在适当时,它允许获得块的最后有效系数的坐标。
如果已根据帧间预测模式对块进行了编码,则熵解码允许在适当时获得预测矢量索引、运动残差和残差块。在步骤408期间,使用预测矢量索引和运动残差来重构当前块的运动矢量。
如果已根据帧内预测模式对块进行了编码,则熵解码允许获得预测方向和残差块。由解码模块实现的步骤412、413、414、415、416和417分别在所有方面都与由编码模块实现的步骤412、413、414、415、416和417相同。如果编码器将MTS应用于当前块,则在步骤413中应用与编码器所选择的变换相对应的逆变换。类似地,如果在编码器侧对当前块应用LFNST,则在逆量化和逆主变换之间(在步骤412和413之间)应用逆LFNST变换。
在步骤418中,将解码块保存在解码图片中并将解码图片存储在DPB 419中。当解码模块对给定图片进行解码时,存储在DPB 419中的图片与由编码模块在所述给定图像的编码期间存储在DPB 319中的图片相同。也可由解码模块输出解码图片,以例如进行显示。
后处理步骤421可包括逆颜色变换(例如,从YCbCr 4∶2∶0到RGB 4∶4∶4的转换)、执行在步骤301的预处理中执行的重新映射过程的逆过程的逆映射、用于基于例如在SEI消息中提供的滤波器参数来改善重构图片的后滤波。
图5A描述了其中可实现以下实施方案的上下文的示例。
在图4A中,可以是相机、存储设备、计算机、服务器或者能够递送视频流的任何设备的装置51使用通信信道52将视频流传输到系统53。视频流由装置51编码和传输,或者由装置51接收和/或存储,并且随后进行传输。通信信道52是有线(例如互联网或以太网)或无线(例如WiFi、3G、4G或5G)网络链路。
例如可以是机顶盒的系统53接收并解码视频流以生成解码图片序列。
然后,使用可以是有线或无线网络的通信信道54将所获得的解码图片序列传输到显示系统55。显示系统55然后显示所述图片。
在实施方案中,系统53被包括在显示系统55中。在这种情况下,系统53和显示器55被包括在电视机、计算机、平板电脑、智能电话、头戴式显示器等中。
图5B示意性地示出根据不同方面和实施方案修改的能够实现编码模块或解码模块的处理模块500的硬件架构的示例,该编码模块或解码模块能够分别实现图3的用于编码的方法和图4的用于解码的方法。当装置51负责对视频流进行编码时,编码模块例如被包括在该装置中。解码模块例如被包括在系统53中。作为非限制性示例,处理模块500包括由通信总线5005连接的以下项:涵盖一个或多个微处理器的处理器或CPU(中央处理单元)5000、通用计算机、专用计算机以及基于多核心架构的处理器;随机存取存储器(RAM)5001;只读存储器(ROM)5002;存储单元5003,该存储单元可以包括非易失性存储器和/或易失性存储器,包括但不限于电可擦除可编程只读存储器(EEPROM)、只读存储器(ROM)、可编程只读存储器(PROM)、随机存取存储器(RAM)、动态随机存取存储器(DRAM)、静态随机存取存储器(SRAM)、闪存、磁盘驱动器和/或光盘驱动器,或者存储介质读取器,诸如SD(安全数字)卡读取器和/或硬盘驱动器(HDD)和/或可访问网络的存储设备;至少一个通信接口5004,该至少一个通信接口用于与其他模块、设备或装备交换数据。通信接口5004可以包括但不限于被配置为通过通信信道发射和接收数据的收发器。通信接口5004可以包括但不限于调制解调器或网卡。
如果处理模块500实现解码模块,则通信接口5004使得例如处理模块500能够接收编码视频流并提供解码图片序列。如果处理模块500实现编码模块,则通信接口5004使得例如处理模块500能够接收要编码的原始图片数据序列并提供编码视频流。
处理器5000能够执行从ROM 5002、外部存储器(未示出)、存储介质或通信网络加载到RAM 5001中的指令。当处理模块500上电时,处理器5000能够从RAM 5001读取指令,并且执行该指令。这些指令形成计算机程序,该计算机程序使得例如由处理器5000实现关于图4描述的解码方法或关于图3描述的编码方法以及关于图6或图7描述的方法,这些方法包括以下在本文档中描述的各个方面和实施方案。
图3、图4、图6和图7的方法的全部或一些算法和步骤可通过由诸如DSP(数字信号处理器)或微控制器的可编程机器执行一组指令而以软件形式实现,或者可通过诸如FPGA(现场可编程门阵列)或ASIC(专用集成电路)的机器或专用部件而以硬件形式实现。
可以看出,微处理器、通用计算机、专用计算机、基于或不基于多核心架构的处理器、DSP、微控制器、FPGA和ASIC是适于至少部分地实现图3、图4、图6和图7的方法的电子电路。
图5D示出了其中实现各个方面和实施方案的系统53的示例的框图。系统53可以体现为包括下文描述的各种部件的设备,并且被配置为执行本文档中描述的方面和实施方案中的一者或多者。此类设备的示例包括但不限于各种电子设备,诸如个人计算机、膝上型计算机、智能电话、平板电脑、数字多媒体机顶盒、数字电视接收器、个人视频录制系统、连接的家用电器和头戴式显示器。系统53的元件可单独地或组合地体现在单个集成电路(IC)、多个IC和/或分立的部件中。例如,在至少一个实施方案中,系统53包括实现解码模块的一个处理模块500。在各种实施方案中,系统53经由例如通信总线或通过专用输入端口和/或输出端口通信地耦接到一个或多个其他系统或其他电子设备。在各种实施方案中,系统53被配置为实现本文档中描述的方面中的一个或多个方面。
处理模块500的输入可以通过如框531中所指示的各种输入模块来提供。此类输入模块包括但不限于:(i)射频(RF)模块,其接收例如由广播器空中发射的RF信号;(ii)分量(COMP)输入模块(或一组COMP输入模块);(iii)通用串行总线(USB)输入模块;和/或(iv)高清晰度多媒体接口(HDMI)输入模块。图5D中未示出的其他示例包括复合视频。
在各种实施方案中,框531的输入模块具有如本领域所已知的相关联的相应输入处理元件。例如,RF模块可与适于以下的元件相关联:(i)选择所需的频率(也称为选择信号,或将信号频带限制到一个频带),(ii)下变频选择的信号,(iii)再次频带限制到更窄频带以选择(例如)在某些实施方案中可称为信道的信号频带,(iv)解调下变频和频带限制的信号,(v)执行纠错,以及(vi)解复用以选择所需的数据包流。各种实施方案的RF模块包括用于执行这些功能的一个或多个元件,例如频率选择器、信号选择器、频带限制器、信道选择器、滤波器、下变频器、解调器、纠错器和解复用器。RF部分可包括执行这些功能中的各种功能的调谐器,这些功能包括例如下变频接收信号至更低频率(例如,中频或近基带频率)或至基带。在一个机顶盒实施方案中,RF模块及其相关联的输入处理元件接收通过有线(例如,电缆)介质发射的RF信号,并且通过滤波、下变频和再次滤波至所需的频带来执行频率选择。各种实施方案重新布置上述(和其他)元件的顺序,移除这些元件中的一些元件,和/或添加执行类似或不同功能的其他元件。添加元件可包括在现有元件之间插入元件,例如,插入放大器和模数变换器。在各种实施方案中,RF模块包括天线。
另外地,USB和/或HDMI模块可包括用于跨USB和/或HDMI连接将系统53连接到其他电子设备的相应接口处理器。应当理解,输入处理(例如,Reed-Solomon纠错)的各个方面可根据需要例如在单独的输入处理IC内或者在处理模块500内实现。类似地,USB或HDMI接口处理的方面可根据需要在单独的接口IC内或在处理模块500内实现。经解调、纠错和解复用的流被提供给处理模块500。
系统53的各种元件可设置在集成壳体内。在集成壳体内,各种元件可使用合适的连接布置(例如,本领域已知的内部总线,包括IC间(I2C)总线、布线和印刷电路板)互连并且在这些元件之间传输数据。例如,在系统53中,处理模块500通过总线5005与所述系统53的其他元件互连。
处理模块500的通信接口5004允许系统53在通信信道52上通信。如上文已提及,通信信道52可例如在有线介质和/或无线介质内实现。
在各种实施方案中,使用诸如Wi-Fi网络(例如IEEE 802.11(IEEE是指电气和电子工程师协会))之类的无线网络来将数据流式传输或以其他方式提供给系统53。这些实施方案的Wi-Fi信号是通过适于Wi-Fi通信的通信信道52和通信接口5004来接收。这些实施方案的通信信道52通常连接到接入点或路由器,该接入点或路由器提供对外部网络(包括互联网)的访问,以允许流式传输应用程序和其他越过运营商的通信。其他实施方案使用输入框531的RF连接向系统53提供流式传输数据。如上所述,各种实施方案以非流传输方式提供数据。另外地,各种实施方案使用除了Wi-Fi以外的无线网络,例如蜂窝网络或蓝牙网络。
系统53可向各种输出设备(包括显示系统55、扬声器56和其他外围设备57)提供输出信号。各种实施方案的显示系统55包括例如触摸屏显示器、有机发光二极管(OLED)显示器、曲面显示器和/或可折叠显示器中的一者或多者。显示器55可用于电视机、平板计算机、膝上型计算机、蜂窝电话(移动电话)、头戴式显示器或其他设备。显示系统55还可与其他部件集成(例如,如在智能电话中),或可为独立的(例如,膝上型计算机的外部监视器)。在实施方案的各种示例中,其他外围设备57包括独立数字视频光盘(或数字多功能光盘)(DVR,可表示这两个术语)、碟片播放器、立体声系统和/或照明系统中的一者或多者。各种实施方案使用一个或多个外围设备57,该一个或多个外围设备基于系统53的输出来提供功能。例如,碟片播放器执行播放系统53的输出的功能。
在各种实施方案中,控制信号使用诸如AV.Link、消费电子产品控制(CEC)或其他通信协议的信令在系统53与显示系统55、扬声器56或其他外围设备57之间进行传送,该其他通信协议使得能够在有或没有用户干预的情况下进行设备到设备控制。可通过相应的接口532、533和534经由专用连接将输出设备通信地耦接到系统53。另选地,输出设备可使用通信信道52经由通信接口5004连接到系统53,或者使用图5A中该通信信道54对应的专用通信信道经由通信接口5004连接到该系统。显示系统55和扬声器56可与电子设备(诸如例如电视机)中的系统53的其他部件一起集成在单个单元中。在各种实施方案中,显示器接口532包括显示驱动器,诸如例如定时控制器(T Con)芯片。
显示系统55和扬声器56可另选地与其他部件中的一个或多个部件分离。在显示系统55和扬声器56为外部部件的各种实施方案中,可以经由专用输出连接(包括例如HDMI端口、USB端口或COMP输出)来提供输出信号。
图5C示出了其中实现各个方面和实施方案的系统51的示例的框图。系统51与系统53非常类似。系统51可体现为包括下文描述的各种部件的设备,并且被配置为执行本文档中描述的方面和实施方案中的一者或多者。此类设备的示例包括但不限于各种电子设备,诸如个人计算机、膝上型计算机、智能电话、平板电脑、相机和服务器。系统51的元件可单独地或组合地体现在单个集成电路(IC)、多个IC和/或分立的部件中。例如,在至少一个实施方案中,系统51包括实现编码模块的一个处理模块500。在各种实施方案中,系统51经由例如通信总线或通过专用输入端口和/或输出端口通信地耦接到一个或多个其他系统或其他电子设备。在各种实施方案中,系统51被配置为实现本文档中描述的方面中的一个或多个方面。
对处理模块500的输入可通过如关于图5D已经描述的框531中所示的各种输入模块来提供。
系统51的各种元件可设置在集成壳体内。在集成壳体内,各种元件可使用合适的连接布置(例如,本领域已知的内部总线,包括IC间(I2C)总线、布线和印刷电路板)互连并且在这些元件之间传输数据。例如,在系统51中,处理模块500通过总线5005与所述系统51的其他元件互连。
处理模块500的通信接口5004允许系统500在通信信道52上通信。
在各种实施方案中,使用诸如Wi-Fi网络(例如IEEE 802.11(IEEE是指电气和电子工程师协会))之类的无线网络来将数据流式传输或以其他方式提供给系统51。这些实施方案的Wi-Fi信号是通过适于Wi-Fi通信的通信信道52和通信接口5004来接收。这些实施方案的通信信道52通常连接到接入点或路由器,该接入点或路由器提供对外部网络(包括互联网)的访问,以允许流式传输应用程序和其他越过运营商的通信。其他实施方案使用输入框531的RF连接向系统51提供流式传输数据。
如上所述,各种实施方案以非流传输方式提供数据。另外地,各种实施方案使用除了Wi-Fi以外的无线网络,例如蜂窝网络或蓝牙网络。
提供给系统51的数据可以不同的格式来提供。在各种实施方案中,这些数据被编码并符合已知的视频压缩格式,诸如AV1、VP9、VVC、HEVC、AVC等。在各种实施方案中,这些数据是由连接到系统51或包括在系统51中的图片和/或音频获取模块提供的原始数据。在这种情况下,处理模块负责这些数据的编码。
系统51可向能够存储和/或解码输出信号的各种输出设备(例如,系统53)提供输出信号。
各种具体实施参与解码。如本申请中所用,“解码”可涵盖例如对所接收的编码视频流执行的过程的全部或部分,以便产生适于显示的最终输出。在各种实施方案中,此类过程包括通常由解码器执行的一个或多个过程,例如熵解码、逆量化、逆变换和预测。在各种实施方案中,此类过程还包括或另选地包括由本申请描述的各种具体实施的解码器执行的过程,例如用于解码来自编码视频流的块的最后有效系数。
短语“解码过程”旨在具体地指代操作的子集还是广义地指代更广泛的解码过程基于具体描述的上下文将是清楚的,并且被认为会被本领域的技术人员很好地理解。
各种具体实施参与编码。以与上面关于“解码”的讨论类似的方式,如在本申请中使用的“编码”可涵盖例如对输入视频序列执行以便产生编码视频流的全部或部分过程。在各种实施方案中,此类过程包括通常由编码器执行的一个或多个过程,例如,分区、预测、变换、量化和熵编码。在各种实施方案中,此类过程还包括或另选地包括由本申请中描述的各种具体实施的编码器执行的过程,例如用于发信号通知编码视频流中的块的最后有效系数。
短语“编码过程”是具体地指代操作的子集还是广义地指代更广泛的编码过程基于具体描述的上下文将是清楚的,并且据信将被本领域的技术人员很好地理解。
需注意,本文所使用的语法元素名称是描述性术语。因此,它们不排除使用其他语法元素名称。
当附图呈现为流程图时,应当理解,其还提供了对应装置的框图。类似地,当附图呈现为框图时,应当理解,其还提供了对应的方法/过程的流程图。
各种实施方案是指速率失真优化。具体地,在编码过程期间,通常考虑速率和失真之间的平衡或折衷。速率失真优化通常表述为最小化速率失真函数,该速率失真函数是速率和失真的加权和。存在不同的方法解决速率失真优化问题。例如,这些方法可基于对所有编码选项(包括所有考虑的模式或编码参数值)的广泛测试,并且完整评估其编码成本以及重构信号在编码和解码之后的相关失真。更快的方法还可用于降低编码复杂性,特别是对基于预测或预测残差信号而不是重构的残差信号的近似失真的计算。也可使用这两种方法的混合,诸如通过针对可能的编码选项中的仅一些编码选项使用近似失真,而针对其他编码选项使用完全失真。其他方法仅评估可能的编码选项的子集。更一般地,许多方法采用各种技术中任一种来执行优化,但是优化不一定是对编码成本和相关失真两者的完整评估。
本文所述的具体实施和方面可在例如方法或过程、装置、软件程序、数据流或信号中实现。即使仅在单个形式的具体实施的上下文中讨论(例如,仅作为方法讨论),讨论的特征的具体实施也可以其他形式(例如,装置或程序)实现。装置可在例如适当的硬件、软件和固件中实现。方法可在例如一般是指处理设备的处理器中实施,该处理设备包括例如计算机、微处理器、集成电路或可编程逻辑设备。处理器还包括通信设备,诸如例如计算机、手机、便携式/个人数字助理(“PDA”)以及便于最终用户之间信息通信的其他设备。
提及“一个实施方案”或“实施方案”或“一个具体实施”或“具体实施”以及它们的其他变型,意味着结合实施方案描述的特定的特征、结构、特性等包括在至少一个实施方案中。因此,短语“在一个实施方案中”或“在实施方案中”或“在一个具体实施中”或“在具体实施中”的出现以及出现在本申请通篇的各个地方的任何其他变型不一定都是指相同的实施方案。
另外地,本申请可涉及“确定”各种信息。确定信息可包括例如估计信息、计算信息、预测信息、从存储器检索信息或例如从另一设备、模块或从用户获得信息中的一者或多者。
此外,本申请可涉及“访问”各种信息。访问信息可包括例如接收信息、检索信息(例如,从存储器)、存储信息、移动信息、复制信息、计算信息、确定信息、预测信息或估计信息中的一者或多者。
另外地,本申请可涉及“接收”各种信息。与“访问”一样,接收旨在为广义的术语。接收信息可包括例如访问信息或检索信息(例如,从存储器)中的一者或多者。此外,在诸如例如存储信息、处理信息、传输信息、移动信息、复制信息、擦除信息、计算信息、确定信息、预测信息或估计信息的操作期间,“接收”通常以一种方式或另一种方式参与。
应当理解,例如,在“A/B”、“A和/或B”以及“A和B中的至少一者”、“A和B中的一者或多者”的情况下,使用以下“/”、“和/或”以及“至少一种”、“一者或多者”中的任一种旨在涵盖仅选择第一列出的选项(A),或仅选择第二列出的选项(B),或选择两个选项(A和B)。作为进一步的示例,在“A、B和/或C”和“A、B和C中的至少一者”、“A、B和C中的一者或多者”的情况下,此类短语旨在涵盖仅选择第一列出的选项(A),或仅选择第二列出的选项(B),或仅选择第三列出的选项(C),或仅选择第一列出的选项和第二列出的选项(A和B),或仅选择第一列出的选项和第三列出的选项(A和C),或仅选择第二列出的选项和第三列出的选项(B和C),或选择所有三个选项(A和B和C)。如对于本领域和相关领域的普通技术人员显而易见的是,这可扩展到所列出的尽可能多的项目。
而且,如本文所用,词语“发信号通知”是指(除了别的以外)向对应解码器指示某物。例如,在某些实施方案中,编码器发信号通知一些编码工具的使用。这样,在实施方案中,在编码器侧和解码器侧两者均可使用相同的参数。因此,例如,编码器可将特定参数传输(显式发信号通知)到解码器,使得解码器可使用相同的特定参数。相反,如果解码器已具有特定参数以及其他参数,则可在不传输(隐式发信号通知)的情况下使用发信号通知,以简单允许解码器知道和选择特定参数。通过避免传输任何实际功能,在各种实施方案中实现了比特节省。应当理解,发信号通知可以各种方式实现。例如,在各种实施方案中,使用一个或多个语法元素、标志等将信息发信号通知至对应解码器。虽然前面涉及词语“signal(发信号通知)”的动词形式,但是词语“signal(信号)”在本文也可用作名词。
对于本领域的普通技术人员将显而易见的是,具体实施可产生格式化为携带例如可存储或可传输的信息的各种信号。信息可包括例如用于执行方法的指令或由所述具体实施中的一个具体实施产生的数据。例如,可格式化信号以携带所述实施方案的编码视频流和SEI消息。可格式化此类信号例如为电磁波(例如,使用频谱的射频部分)或基带信号。格式化可包括例如对编码视频流进行编码以及使用编码视频流调制载波。信号携带的信息可以是例如模拟或数字信息。众所周知,信号可通过各种不同的有线或无线链路传输。信号可存储在处理器可读介质上。
在下文中,各种实施方案提出通过更好地考虑对块的变换系数应用归零过程(即,清零过程)来改进块的最后有效系数的编码。
图7示意性地表示在解码过程期间实施方案的应用。
图7的方法例如由系统53实现,并且更精确地由系统53的处理模块500实现。
在实施方案中,系统53从输入模块531接收编码视频流,并且应用例如关于图4描述的方法来对该编码视频流进行解码。图7的方法在当前块的解码期间应用,并且更精确地在当前块的逆量化和逆变换之前当前块的最后有效系数的解码期间应用。在图4中,最后有效系数的解码例如作为熵解码步骤410的子步骤发生。
在步骤701中,系统53的处理模块500确定是否对变换系数的当前块应用归零过程(即,清零过程)。例如,系统53的处理模块500确定当前块是否使用MTS或LFNST中的至少一者来编码。
如果未将归零过程应用于变换系数块,则系统53的处理模块500在步骤702中相对于预定位置对扫描次序中的最后有效系数的位置进行解码。例如,如果以低比特率对序列进行编码,则预定位置是块的左上角。如果以高比特率对序列进行编码,则预定位置是块的右下角。相对于块中的预定位置发信号通知最后有效系数的位置意味着最后有效系数位置的每个坐标是相对于预定位置的相应坐标计算的。例如,如果预定位置的坐标是(x2,y2)并且最后有效系数的位置的坐标是(x1,y1),则系统53的处理模块500在x1≥x2的情况下获得等于(x1-x2)的最后有效系数的第一坐标X(如果x1<x2,则为(x2-x1)),并且在y1≥y2的情况下获得等于(y1-y2)的最后有效系数的第二坐标Y(如果y1<y2,则为(y2-y1))。
如果将归零过程应用于当前变换系数块,则系统53的处理模块500相对于取决于所应用的归零过程703的块中的位置来对扫描次序中的最后有效系数的位置进行解码。
在使用MTS的一些具体实施中,相对于归零过程发信号通知最后有效系数不是直接的。实际上,在这些具体实施中,发信号通知应用于块的变换类型(在DCT-II、DST-VII和DCT-VIII中)的MTS索引(mts_index)的解码取决于最后有效系数。这在描述编码单元(即,块)的语法的表TAB3和描述残差块解码过程的表TAB4中示出,这两个表表示对应于这些具体实施的规范:
表TAB3
表TAB4
从表TAB3和表TAB4中可以看出,MTS索引(mts_idx)仅在满足两个条件时被发信号通知:
·除了DC值(由条件(MtsDcOnly==0)指定)之外还有至少一个系数;
·在前16×16个系数(由条件MtsZeroOutSigCoeffFlag==1指定)之外没有系数。
因此,利用这些具体实施,在知道最后有效系数的位置之前,不能知道是否使用MTS来对块进行编码。因此,应用于对块的最后有效系数的位置进行编码的过程不能根据对该块应用MTS的知识来确定。
在图7的方法的第一实施方案中,提出放宽这两个条件以使得发信号通知最后有效系数取决于MTS归零过程。该实施方案是在以下文献中提出的语法的修改版本:FrankBossen等人,“VVC操作范围扩展(草案3)(VVC operation range extensions(Draft 3))”,JVET-V2005.ITU-TSG 16WP 3和ISO/IEC JTC 1/SC 29联合视频专家组(JVET)第22次会议,通过电话会议于2021年4月20日至28日进行。
在该第一实施方案的第一方面中,将标志sh_reverse_last_sig_coeff_flag添加于切片标头中以指示如以下文献中所描述的经修改的最后有效系数发信号通知的使用:Fan Wang等人,“AHG8:关于高比特深度和高位比特扩展的最后有效系数位置的编码(AHG8:on coding of last significant coefficient position for high bit depth andhigh bit rate extensions)”,JVET-V0121.ITU-TSG 16 WP 3和ISO/IECJTC 1/SC 29联合视频专家组(JVET)第22次会议,通过电话会议于2021年4月20日至28日进行。切片标头的该修改反映在表TAB5中。
表TAB5
然后,在该第一实施方案的第二方面中,从如表TAB6中所描述的残差块解码过程中去除关于MTS发信号通知的条件。关于表TAB4的语法的改变以粗体表示:
/>
表TAB6
在该第一实施方案的第三方面中,修改了应用于导出最后有效系数的坐标LastSignificantCoefX和LastSignificantCoefY的过程。在第一实施方案中,最后有效系数的位置(LastSignificantCoeffX,LastSignificantCoeffY)通过以下过程(以下称为MTS符合归零的导出过程)根据前缀和后缀计算,相对于基本导出过程的差异以粗体表示:
·如果last_sig_coeff_x_suffix不存在,则以下适用:
LastSignificantCoeffX=last_sig_coeff_x_prefix;
·否则(last_sig_coeff_x_suffix存在),则以下适用:
LastSignificantCoeffX=(1<<((last_sig_coeff_x_prefix>>1)-1))*
(2+(lasx_sig_coeff_x_prefix&1))+
last_sig_coeff_x_suffix;
·如果sh_reverse_last_sig_coeff_flag等于“1”,则以下适用:
LastSignificantCoeffX=(1<<(mts_idx!=0?4:log2ZoTbWidth))-1-
LastSignificantCoefiX;
·如果last_sig_coeff_y_suffix不存在,则以下适用:
LastSignificantCoeffY=last_sig_coeff_y_prefix;
·否则(last_sig_coeff_y_suffix存在),则以下适用:
LastSignificantCoeffY=(1<<((last_sig_coeff_y_prefix>>1)-1))
*
(2+(last_sig_coeff_y_prefix&1))+
last_sig_coeff_y_suffix;
·如果sh_reverse_last_sig_coeff_flag等于“1”,则以下适用:
LastSignificantCoeffY=(1<<(mts_idx!=0?4:log2ZoTbHeight))-1-LastSignificantCoeffY.
如可以看到的,当mts_idx不同于零(指示在水平(相应地垂直)方向上应用DST-VII或DCT-VIII(并且因此,应用MTS归零过程))时,相对于块中的位置利用等于“4”的水平(相应地垂直)坐标的来计算最后有效系数(LastSignificantCoeffX(相应地LastSignificantCoeffY))的水平(相应地垂直)坐标。可以注意到,在MTS符合归零的导出过程中,测试“mts_idx!=0”对应于步骤701,并且当mts_idx>0时,等式“LastSignificantCoeffX/Y=(1<<(mts_idx!=0?4:log2ZoTbWidth/Height))-1-LastSignificantCoeffX/Y”对应于步骤703,当mts_idx=0时,等式“LastSignificantCoeffX/Y=(1<<(mts_idx!=0?4:log2ZoTbWidth/Height))-1-LastSignificantCoefffX/Y”对应于步骤702。
图7的方法的第二实施方案解决了使用LFNST对块进行编码的情况。LFNST根据块尺寸执行归零过程。如果变换块尺寸是4×4或8×8,则仅保留前“8”个系数。否则,对于其他块尺寸,保留前16(4×4)个系数。其他变换系数被设置为零。图8示出了在LFNST中应用的归零过程。在顶部,灰色正方形指示在4×4块和8×8块(这里仅表示8×8块)中保留的变换系数的位置,其他系数通过归零过程被设置为零。在底部,灰色正方形指示具有不同于4×4和8×8的尺寸的块(这里表示8×4矩形块)中的所保持系数的位置,其他系数通过归零过程被设置为零。
类似于MTS情况,在一些具体实施中,发信号通知LFNST也取决于最后有效系数,如表TAB7和表TAB8中所表示的:
表TAB7
表TAB8
可以看出,仅当满足以下两个条件时才发信号通知LFNST索引(lfnst_idx)(LFNST索引lfnst_idx指定是否使用所选变换集合中的两个低频不可分变换核以及使用所选变换集合中的两个低频不可分变换核中的哪一个。lfnst_idx等于“0”指定低频不可分变换不用于当前块):
·除了DC值(由表TAB7中的条件(LfnstDcOnly==0)指定)之外还有至少一个系数;
·没有超出指定LFNST归零过程的系数(由表TAB7中的条件LfnstZeroOutSigCoeffFlag==1指定)。
为了解决该问题,在第二实施方案的第一方面中,将标志sh_reverse_last_sig_coeff_fiag添加到切片标头以指示经修改的最后有效系数发信号通知的使用(如表TAB9中所表示):
表TAB9
在第二实施方案的第二方面中,从如表TAB10中所表示的残差解码过程中去除关于LFNST发信号通知的条件(相对于表TAB8的差异以粗体表示)。
表TAB10
在第二实施方案的第三方面中,修改了应用于导出最后有效系数的坐标LastSignificantCoefX和LastSignificantCoefY的过程。在第二实施方案中,最后有效系数的位置(LastSignificantCoeffX,LastSignificantCoeffY)通过以下过程(以下称为LFNST符合归零的导出过程)根据前缀和后缀计算,相对于基本导出过程的差异以粗体表示:
·如果last_sig_coeff_x_suffix不存在,则以下适用:
LastSignificantCoeffX=last_sig_coeff_x_prefix;
·否则(last_sig_coeff_x_suffix存在),则以下适用:
LastSignificantCoeffX=(1<<((last_sig_coeff_x_prefix>>1)-1))*
(2+(last_sig_coeff_x_prefix&1))+
last_sig_coeff_x_suffix;
·如果sh_reverse_last_sig_coeff_flag等于“1”且ApplyLfnstFlag等于
“1”,则以下适用:
nonZeroSize=((nTbW==4&&nTbH==4)||(nTbW==8&&nTbH==8))?8:16;
LastSignificantCoeffX=(nonZeroSize==8?3:4)-1-
LastSignificantCoeffX;
·如果last_sig_coeff_y_suffix不存在,则以下适用:
LastSignificantCoeffY=last_sig_coeff_y_prefix;
·否则(last_sig_coeff_y_suffix存在),则以下适用:
LastSignificantCoeffY=(1<<((last_sig_coeff_y_prefix>>1)-1))*
(2+(last_sig_coeff_y_prefix&1))+
last_sig_coeff_y_suffix;
·如果sh_reverse_last_sig_coeff_flag等于1且ApplyLfnstFlag等于“1”,则以下适用:
LastSignificantCoeffY=4-1-LastSignificantCoeffY.
可以注意到,用于水平坐标LastSignificantCoeffX和垂直坐标LastSignificantCoeffY的发信号通知过程是不同的。这是因为当块尺寸是4×4或8×8时的最大水平位置是“3”(图8的顶部),否则,对于其他块尺寸该最大水平位置是“4”(图8的底部)。其侧面上的垂直位置的最大值总是“4”。
可以看出,当应用LFNST的归零过程时,关于块中的位置计算最后有效系数的水平(相应地垂直)坐标LastSignificantCoeffX(相应地LastSignificantCoeffY),其中在块4×4和8×8的情况下水平坐标等于“3”,否则水平坐标等于“4”(相应地垂直坐标等于“4”)。
可以注意到,在LFNST符合归零的导出过程中,测试“ApplyLfnstFlag等于“1””对应于步骤701,并且等式“nonZeroSize=((nTbW==4&&nTbH==4)||(nTbW==8&&nTbH==8))?8:16;LastSignificantCoeffX=(nonZeroSize==8?3:4)-1-LastSignificantCoeffX”对应于水平坐标的步骤703,相应地等式“LastSignificantCoeffY=4-1-LastSignificantCoeffY”对应于垂直坐标的步骤703。当未满足条件“sh_reverse_last_sig_coeff_flag等于“1”且ApplyLfnstFlag等于“1””时,应用步骤702。
在图7的方法的第三实施方案中,提议在LFNST被激活或MTS被激活且变换大小大于“16”的情况下停用关于右下角的发信号通知最后有效系数位置。通过这样做,确保了不存在导致相对于右下角的移位的归零过程。
在第三实施方案的第一方面中,将标志sh_reverse_last_sig_coeff_flag添加到切片标头以指示经修改的最后有效系数发信号通知的使用(如表TAB11中所表示):
/>
表TAB11
从表TAB11可以看出,仅当LFNST未被SPS(序列参数集,即序列报头)级别标志sps_lfnst_enabled_flag激活时,才允许修改的最后有效系数发信号通知。
在第三实施方案的第二方面中,修改了应用于导出最后有效系数的坐标LastSignificantCoefX和LastSignificantCoefY的过程。在第三实施方案中,最后有效系数的位置(LastSignificantCoeffX,LastSignificantCoeffY)通过以下过程(以下称为LFNST&MTS符合归零的导出过程)根据前缀和后缀计算,相对于基本导出过程的差异以粗体表示:
·如果last_sig_coeff_x_suffix不存在,则以下适用:
LastSignificantCoeffX=last_sig_coeff_x_prefix;
·否则(last_sig_coeff_x_suffix存在),则以下适用:
LastSignificantCoeffX=(1<<((last_sig_coeff_x_prefix>>1)-1))*
(2+(last_sig_coeff_x_prefix&1))+
last_sig_coeff_x_suffix;
·如果sh_reverse_last_sig_coeff_flag等于“1”且log2ZoTbWidth小于或等于“4”,则以下适用:
LastSignificantCoeffX=(1<<(log2ZoTbWidth))-1-
LastSignificantCoeffX
·如果last_sig_coeff_y_suffix不存在,则以下适用:
LastSignificantCoeffY=last_sig_coeff_y_prefix;
·否则(last_sig_coeff_y_suffix存在),则以下适用:
LastSignificantCoeffY=(1<<((last_sig_coeff_y_prefix>>1)-1))*
(2+(last_sig_coeff_y_prefix&1))+last_sig_coeff_y_suffix;
·如果sh_reverse_llast_sig_coeff_flag等于“1”且log2ZoTbHeight小于或等于“4”,则以下适用:
LastSignificantCoeffY=(1<<log2ZoTbHeight)-1-LastSignificantCoeffY
可以注意到,在LFNST&MTS符合归零的导出过程中,测试“log2ZoTbWidth小于或等于“4”和“log2ZoTbHeight小于或等于“4””对应于步骤701,并且等式“LastSignificantCoeffX=(1<<(log2ZoTbWidth))-1-LastSignificantCoeffX”和“LastSignificantCoeffY=(1<<(log2ZoTbHeight))-1-LastSignificantCoeffY”对应于步骤703,当满足条件sh_reverse_last_sig_coeff_flag等于“1”并且log2ZoTbWidth小于或等于“4”并且“sh_reverse_llast_sig_coeff_flag等于“1”并且log2ZoTbHeight小于或等于“4””时应用步骤702。
图6示意性地示出了在编码过程期间实施方案的应用。
图6的方法例如由装置51实现,并且更精确地由装置51的处理模块500实现。
在实施方案中,装置51从输入模块531接收RAW视频序列,并且应用例如关于图3所描述的方法对该RAW视频序列的图片进行编码。图6的方法在当前块的编码期间应用,并且更精确地在变换系数块中的当前块的变换和量化之后发信号通知当前块的最后有效系数期间应用。在图3中,发信号通知最后有效系数例如作为熵编码步骤310的预备子步骤发生。
在步骤601中,装置51的处理模块500确定是否对变换系数的块应用归零过程(即,清零过程)。例如,装置51的处理模块500确定当前块是否使用MTS或LFNST中的至少一者来编码。实际上,这些变换过程中的至少一个变换过程的应用是归零过程的应用的指示。
如果未将归零过程应用于变换系数块,则装置51的处理模块500在步骤603中相对于预定位置发信号通知扫描次序中最后有效系数的位置。例如,如果以低比特率对序列进行编码,则预定位置是块的左上角。如果以高比特率对序列进行编码,则预定位置是块的右下角。
如果将归零过程应用于变换系数块,则装置51的处理模块500根据步骤602中的所应用的归零过程而相对于块中的位置发信号通知扫描次序中的最后有效系数的位置。
在图6的方法的第一实施方案中,装置51的处理模块500应用用于发信号通知符合关于图7的方法的第一实施方案描述的语法、语义和过程的最后有效系数的过程。
在图6的方法的第五实施方案中,装置51的处理模块500应用用于发信号通知符合关于图7的方法的第二实施方案描述的语法、语义和过程的最后有效系数的过程。
在图6的方法的第六实施方案中,装置51的处理模块500应用用于发信号通知符合关于图7的方法的第三实施方案描述的语法、语义和过程的最后有效系数的过程。
以上描述了多个实施方案。这些实施方案的特征可以单独提供或以任何组合形式提供。此外,实施方案可包括以下特征、设备或方面中的一者或多者,单独地或以任何组合,跨各种权利要求类别和类型:
·包括所描述的语法元素中的一个或多个语法元素或其变型的比特流或信号。
·对包括所描述的语法元素中的一个或多个语法元素或其变型的比特流或信号进行创建和/或传输和/或接收和/或解码。
·执行所描述的实施方案中的至少一个实施方案的电视机、机顶盒、移动电话、平板电脑或其他电子设备。
·执行所描述的实施方案中的至少一个实施方案并(例如,使用监视器、屏幕或其他类型的显示器)显示所得图片的电视机、机顶盒、移动电话、平板电脑或其他电子设备。
·调谐(例如,使用调谐器)信道以接收包括编码视频流的信号并
执行所描述的实施方案中的至少一个实施方案的电视机、机顶盒、移动电话、平板电脑或其他电子设备。
·通过空中(例如,使用天线)接收包括编码视频流的信号并执行
所描述的实施方案中的至少一个实施方案的电视机、机顶盒、移动电话、平板电脑或其他电子设备。
·通过空中传输(例如,使用天线)包括编码视频流的信号并且执
行所述的实施方案中的至少一个实施方案的服务器、相机、移动电话、平板电脑或其他电子设备。
·调谐(例如,使用调谐器)信道以传输包括编码视频流的信号并
执行所描述的实施方案中的至少一个实施方案的服务器、相机、移动电话、平板电脑或其他电子设备。

Claims (19)

1.一种方法,所述方法包括:
确定(701)对变换系数块应用了归零过程;以及,
相对于取决于所述所应用的归零过程的所述块中的位置对扫描次序中的所述块的最后有效系数的位置进行解码(702)。
2.根据权利要求1所述的方法,其中根据应用于所述块的变换过程的类型来确定对所述块的所述归零过程的实际应用。
3.根据权利要求1或2所述的方法,其中根据应用于所述块的变换过程的类型来确定归零过程的类型。
4.根据任一前述权利要求所述的方法,其中取决于所述所应用的归零过程的所述块中的所述位置是所述块中左上系数的位置或者所述块中右下系数的位置或者所述块中具有等于取决于所述归零过程的最大允许值的坐标值的位置。
5.一种方法,所述方法包括:
确定(601)对变换系数块应用了归零过程;以及,
相对于取决于所述所应用的归零过程的所述块中的位置发信号通知(602)扫描次序中的所述块的最后有效系数的位置。
6.根据权利要求5所述的方法,其中根据应用于所述块的变换过程的类型来确定对所述块的所述归零过程的实际应用。
7.根据权利要求5或6所述的方法,其中根据应用于所述块的变换过程的类型来确定归零过程的类型。
8.根据权利要求5至7中任一前述权利要求所述的方法,其中取决于所述所应用的归零过程的所述块中的所述位置是所述块中左上系数的位置或者所述块中右下系数的位置或者所述块中具有等于取决于所述归零过程的最大允许值的坐标值的位置。
9.一种设备,所述设备包括电子电路,所述电子电路适于:
确定(701)对变换系数块应用了归零过程;以及,
相对于取决于所述所应用的归零过程的所述块中的位置对扫描次序中的所述块的最后有效系数的位置进行解码(702)。
10.根据权利要求9所述的设备,其中根据应用于所述块的变换过程的类型来确定对所述块的所述归零过程的实际应用。
11.根据权利要求9或10所述的设备,其中根据应用于所述块的变换过程的类型来确定归零过程的类型。
12.根据权利要求9至11中任一前述权利要求所述的设备,其中取决于所述所应用的归零过程的所述块中的所述位置是所述块中左上系数的位置或者所述块中右下系数的位置或者所述块中具有等于取决于所述归零过程的最大允许值的坐标值的位置。
13.一种设备,所述设备包括电子电路,所述电子电路适于:
确定(601)对变换系数块应用了归零过程;以及,
相对于取决于所述所应用的归零过程的所述块中的位置发信号通知(602)扫描次序中的所述块的最后有效系数的位置。
14.根据权利要求13所述的设备,其中根据应用于所述块的变换过程的类型来确定对所述块的所述归零过程的实际应用。
15.根据权利要求13或14所述的设备,其中根据应用于所述块的变换过程的类型来确定归零过程的类型。
16.根据权利要求13至15中任一前述权利要求所述的设备,其中取决于所述所应用的归零过程的所述块中的所述位置是所述块中左上系数的位置或者所述块中右下系数的位置或者所述块中具有等于取决于所述归零过程的最大允许值的坐标值的位置。
17.一种信号,所述信号由根据权利要求5至8中任一前述权利要求所述的方法或由根据权利要求13至16中任一前述权利要求所述的设备生成。
18.一种计算机程序,所述计算机程序包括用于实现根据权利要求1至8中任一前述权利要求所述的方法的程序代码指令。
19.一种非暂态信息存储介质,所述非暂态信息存储介质存储用于实现根据权利要求1至8中任一前述权利要求所述的方法的程序代码指令。
CN202280042136.1A 2021-06-14 2022-05-23 图片的块中的最后有效系数的编码 Pending CN117597926A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP21305809 2021-06-14
EP21305809.2 2021-06-14
PCT/EP2022/063895 WO2022263111A1 (en) 2021-06-14 2022-05-23 Coding of last significant coefficient in a block of a picture

Publications (1)

Publication Number Publication Date
CN117597926A true CN117597926A (zh) 2024-02-23

Family

ID=76708170

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280042136.1A Pending CN117597926A (zh) 2021-06-14 2022-05-23 图片的块中的最后有效系数的编码

Country Status (3)

Country Link
EP (1) EP4356608A1 (zh)
CN (1) CN117597926A (zh)
WO (1) WO2022263111A1 (zh)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11128866B2 (en) * 2018-10-18 2021-09-21 Qualcomm Incorporated Scans and last coefficient position coding for zero-out transforms
US11695960B2 (en) * 2019-06-14 2023-07-04 Qualcomm Incorporated Transform and last significant coefficient position signaling for low-frequency non-separable transform in video coding

Also Published As

Publication number Publication date
EP4356608A1 (en) 2024-04-24
WO2022263111A1 (en) 2022-12-22

Similar Documents

Publication Publication Date Title
CN112970264A (zh) 基于相邻样本相关参数模型的译码模式的简化
WO2020096755A1 (en) Quantization for video encoding or decoding based on the surface of a block
CN112369025A (zh) 基于上下文的二进制算术编码和解码
US20230051873A1 (en) Method and apparatus for video encoding and decoding based on adaptive coefficient group
EP3987785A1 (en) Lossless mode for versatile video coding
US20230164360A1 (en) Method and device for image encoding and decoding
CN115769587A (zh) 精细控制图像编码和解码过程的方法和设备
TW202106031A (zh) 使用高階語法元素用信號發送解碼資料之方法及裝置
CN115039409A (zh) 用于视频编码和解码的残差处理
CN117597926A (zh) 图片的块中的最后有效系数的编码
US20230262268A1 (en) Chroma format dependent quantization matrices for video encoding and decoding
US20220360781A1 (en) Video encoding and decoding using block area based quantization matrices
US20220224902A1 (en) Quantization matrices selection for separate color plane mode
CN117561717A (zh) 高精度4×4 dst7和dct8变换矩阵
EP3595309A1 (en) Method and apparatus for video encoding and decoding based on adaptive coefficient group
CN117413520A (zh) 大面积的空间光照补偿
CN117616752A (zh) 用于图片重采样的高级语法
CN117015969A (zh) 用于发信号通知表示解码过程的能量消耗的信息的元数据
CN116438795A (zh) 使用元数据的压缩视频的环路内滤波和后滤波的空间分辨率适配
CN118140481A (zh) 利用isp模式对基于模版的帧内模式推导(timd)进行扩展
CN117501692A (zh) 用于视频编码和解码的模板匹配预测
EP4038876A1 (en) Derivation of quantization matrices for joint cb-cr coding
CN117880531A (zh) 用于具有交叉分量缩放的亮度映射的方法和设备
CN118077198A (zh) 用于对视频进行编码/解码的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination