CN114365492B - 残差系数编解码 - Google Patents

残差系数编解码 Download PDF

Info

Publication number
CN114365492B
CN114365492B CN202080059763.7A CN202080059763A CN114365492B CN 114365492 B CN114365492 B CN 114365492B CN 202080059763 A CN202080059763 A CN 202080059763A CN 114365492 B CN114365492 B CN 114365492B
Authority
CN
China
Prior art keywords
current block
bitstream
scan order
transform coefficients
scan
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202080059763.7A
Other languages
English (en)
Other versions
CN114365492A (zh
Inventor
刘鸿彬
张莉
张凯
傅天亮
许继征
王悦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing ByteDance Network Technology Co Ltd
ByteDance Inc
Original Assignee
Beijing ByteDance Network Technology Co Ltd
ByteDance Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing ByteDance Network Technology Co Ltd, ByteDance Inc filed Critical Beijing ByteDance Network Technology Co Ltd
Publication of CN114365492A publication Critical patent/CN114365492A/zh
Application granted granted Critical
Publication of CN114365492B publication Critical patent/CN114365492B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/129Scanning of coding units, e.g. zig-zag scan of transform coefficients or flexible macroblock ordering [FMO]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

公开了一种视频处理方法、设备和系统。在一个示例方面,视频处理方法包括:在视频的当前块和视频的编解码表示之间执行转换。当前块具有宽度W和高度H,并且包括允许的扫描区域,该扫描区域包括根据扫描顺序在编解码表示中编解码的非零变换系数。根据规则,允许的扫描区域被限制为当前块的部分,该规则规定允许的扫描区域的右下角位置不同于当前块的右下角位置。

Description

残差系数编解码
相关申请的交叉引用
本申请是2020年8月24日提交的国际专利申请NO.PCT/CN2020/110780的中国国家阶段申请,本申请及时要求2019年8月24日提交的国际专利申请No.PCT/CN2019/102412的优先权和权益。出于法律的所有目的,通过引用将上述申请的全部公开并入,作为本申请公开的一部分。
技术领域
本专利文件涉及视频编码技术、解码技术、设备和系统。
背景技术
尽管在视频压缩方面取得了进步,但数字视频仍然是互联网和其他数字通信网络中使用带宽最多的部分。随着能够接收和显示视频的连接用户设备的数目增加,预计数字视频使用的带宽需求将继续增长。
发明内容
本文件公开了与在视频编码和解码中使用仿射运动补偿有关的方法、系统和设备。
在一个代表性方面,公开了一种视频处理方法。所述方法包括:在视频的当前块和所述视频的编解码表示之间执行转换。所述当前块具有宽度W和高度H,并且所述当前块包括允许的扫描区域,所述允许的扫描区域包括根据扫描顺序在所述编解码表示中编码的非零变换系数。根据规则,所述允许的扫描区域被限制为所述当前块的部分,所述规则规定所述允许的扫描区域的右下角位置不同于所述当前块的右下角位置。
在另一代表性方面,公开了一种视频处理方法。所述方法包括:在视频的当前块和所述视频的编解码表示之间执行转换。基于所述当前块的部分中按扫描顺序的非零变换系数将所述当前块编解码在所述编解码表示中。包括所述非零变换系数的所述当前块的部分具有非矩形形状。
在另一代表性方面,公开了一种视频处理方法。所述方法包括:在视频的当前块和所述视频的编解码表示之间执行转换。基于所述当前块的部分中按扫描顺序的非零变换系数将所述当前块编解码在所述编解码表示中。所述编解码表示符合格式规则,所述格式规则定义所述编解码表示中表示所述扫描顺序的扫描顺序索引指示所述当前块的所述部分。
在另一代表性方面,公开了一种视频处理方法。所述方法包括:在视频的当前块和所述视频的编解码表示之间执行转换。基于所述当前块的部分中按扫描顺序的非零变换系数将所述当前块编解码在所述编解码表示中。所述编解码表示符合格式规则;所述格式规则定义所述编解码表示中表示所述当前块中的特定位置的语法元素指示所述当前块的所述部分。所述当前块的所述部分还由与所述当前块中的所述特定位置相关联的特性来指示。
在另一代表性方面,公开了一种视频处理方法。所述方法包括:在视频的当前块和所述视频的编解码表示之间执行转换。在所述编解码表示中信令通知所述当前块的编解码组是否包括非零变换系数的指示。所述编解码组表示根据扫描顺序在所述转换期间要扫描的连续变换系数。
在又一代表性方面,公开了一种视频处理方法。所述方法包括:在当前视频块和当前视频块的编解码表示之间执行转换,其中,在转换期间,将根据扫描顺序扫描包括位于当前视频块的非重叠子块中的变换系数的一个或多个区域。
在又一代表性方面,公开了另一种视频处理方法。所述方法包括:在当前视频块和当前视频块的编解码表示之间执行转换,其中,在转换期间,将根据扫描顺序扫描包括位于当前视频块的非重叠子块中的变换系数的一个或多个区域;并且在编解码表示中提供根据扫描顺序扫描的子块中的子块是否对应于零值变换系数的指示。
在又一代表性方面,公开了另一种视频处理方法。所述方法包括:在当前视频块和当前视频块的编解码表示之间执行转换,其中,在转换期间,将根据扫描顺序扫描包括位于当前视频块的非重叠子块中的变换系数的一个或多个区域;以及将要扫描的区域限制在允许的值范围内。
在又一代表性方面,公开了一种视频处理方法。所述方法包括:在当前视频块和当前视频块的编解码表示之间执行转换,其中,在转换期间,将根据由扫描顺序索引表示的扫描顺序来扫描包括位于当前视频块的非重叠子块中的变换系数的一个或多个区域;将要扫描的区域限制为允许的值范围;其中,一个或多个要扫描的区域由位置参数和其他参数定义;并且通过编码方法对扫描顺序索引和允许的值范围进行联合编码。
在又一代表性方面,公开了一种视频处理方法。所述方法包括:在当前视频块和当前视频块的编解码表示之间执行转换,其中,在转换期间,将根据由扫描顺序索引表示的扫描顺序来扫描包括位于当前视频块的非重叠子块中的变换系数的一个或多个区域;将要扫描的区域限制为允许的值范围;其中,一个或多个要扫描的区域由位置参数和其他参数定义;并且通过编码方法对扫描顺序索引和允许的值范围进行联合编码。
在又一代表性方面,本文所描述的各种技术可以实施为存储在非暂时性计算机可读介质上的计算机程序产品。计算机程序产品包括用于执行本文所述方法的程序代码。
在又一代表性方面,视频解码器装置可以实现如本文所述的方法。
在随附的附件、附图和下面的描述中阐述一个或多个实现的细节。从说明书和附图以及权利要求书中可以看出其他特征。
附图说明
图1示出了编码器块的示例。
图2示出了4x4块的右上对角线扫描顺序的示例。
图3示出8x8块的右上对角线扫描顺序的示例。
图4示出了用于选择概率模型的示例模板。
图5示出了零系数的示例区域和最后的非零位置。
图6示出了右下位置扫描区域组(BRScanPosX,BRScanPosY)的示例。
图7示出了由信令通知的扫描顺序索引和斜率指定的零系数区域的定义的示例。
图8是示出可用于实现本公开技术的各个部分的计算机系统或其他控制设备的架构的示例的框图。
图9示出了可用于实现本公开技术的各个部分的移动设备的示例实施例的框图。
图10是其中可以实现所公开的技术的示例性视频处理系统的框图。
图11是视频处理的示例方法的流程图。
图12是根据本技术的用于视频处理的方法的流程图表示。
图13是根据本技术的用于视频处理的另一方法的另一流程图表示。
图14是根据本技术的用于视频处理的另一方法的另一流程图表示。
图15是根据本技术的用于视频处理的另一方法的另一流程图表示。
图16是根据本技术的用于视频处理的又一方法的另一流程图表示。
具体实施方式
本文提供了几种可被实施到数字视频编码器和解码器中的技术。在本文中使用章节标题是为了清楚地理解,并且不将在每个章节中公开的技术和实施例的范围仅限于该章节。
1.综述
所公开的技术涉及视频编解码技术。具体地说,它与视频编解码中的残差编解码有关。它可以应用于现有的视频编解码标准,如AVS、AVS2、HEVC,或者待定的标准(如多功能视频编码、AVS3)。它也适用于未来的视频编解码标准或视频编解码器。
2.介绍
视频编解码标准主要是通过众所周知的ITU-T和ISO/IEC标准的发展而发展起来的。ITU-T制定了H.261和H.263,ISO/IEC制定了MPEG-1和MPEG-4视频,两个组织联合制定了H.262/MPEG-2视频和H.264/MPEG-4高级视频编解码(AVC)和H.265/HEVC[1]标准。自H.262以来,视频编解码标准基于混合视频编解码结构,其中使用时域预测加变换编解码。为了探索HEVC之外的未来视频编解码技术,VCEG和MPEG于2015年联合成立了联合视频探索团队(JVET)。此后,JVET采用了许多新方法,并将其应用于参考软件JEM中。2018年4月,VCEG(Q6/16)和ISO/IEC JTC1 SC29/WG11(MPEG)联合视频专家组(JVET)成立,致力于VVC标准,目标是与HEVC相比比特率降低50%。
2.1典型视频编解码器的编解码流程
图1示出了VVC的编码器框图的示例,其包含三个环路滤波块:去方块滤波器(DF)、样点自适应偏移(SAO)和ALF。与使用预定义滤波器的DF不同,SAO和ALF利用当前图片的原始样点,分别通过添加偏移量和应用有限脉冲响应(FIR)滤波器来减少原始样点和重构样点之间的均方误差,其中编解码的边信息信令通知该偏移量和滤波器系数。ALF位于每个图片的最后一个处理阶段,并且可以被视为一种试图捕捉和修复先前阶段产生的伪影的工具。
2.2 VVC中的残差编解码
2.2.1变换应用块的系数编解码
在HEVC中,使用非重叠系数组(CG或子块)对编解码块的变换系数进行编码,并且每个CG包含编解码块的4x4块的系数。根据预先定义的扫描顺序对编解码块中的CG和CG中的变换系数进行编码。
根据预先定义的扫描顺序对编解码块中的CG和CG中的变换系数进行编码。CG和CG内的系数都遵循右上角扫描顺序。图2和图3分别示出了4x4块和8x8扫描顺序的示例。
注意,解码顺序是反向扫描顺序(即在图3中从CG3到CG0解码),当解码一个块时,首先解码最后非零系数的坐标(用(LastPosX,LastPosY)表示。
具有至少一个非零变换系数的CG的变换系数水平的编码可以被分成多个扫描通路。在VVC3中,对于每个CG,按编码顺序将常规编码的二进制位和旁路编解码的二进制位分开;首先传输子块的所有常规编码的二进制位,然后再传输旁路编解码的二进制位。子块的变换系数水平在扫描位置上按以下五通进行编码:
-第1通:按编码顺序处理显著性(sig_flag)、大于1标志(gt1_flag)、奇偶性(par_level_flag)和大于2标志(gt2_flag)的编码。如果sig_flag等于1,则首先对gt1_flag进行编码(它指定绝对水平是否大于1)。如果gt1_flag等于1,则另外对par_flag进行编码(它指定绝对水平减去2的奇偶性)。
-第2通:处理gt2_flag等于1或gt1_flag等于1的所有扫描位置的其余绝对水平(余数)的编码。用Golomb-Rice码对非二进制语法元素进行二值化,并且在算术编解码引擎的旁路模式下对生成的二进制位进行编码。
-第3通:在算术编解码引擎的旁路模式下使用Golomb-Rice码对在第一通时没有sig_flag的系数的绝对水平(absLevel)(由于达到了常规编码二进制位的限制)进行完全编码。
-第4通:对sig_coeff_flag等于1的所有扫描位置的符号(sign_flag)进行编码。
对于4x4子块,确保不超过32个常规编码的二进制位(sig_flag、par_flag、gt1_flag和gt2_flag)被编码或解码。对于2x2色度子块,常规编码的二进制位的数目限制为8个。
用于编码非二进制语法元素余数(在第3通中)的Rice参数(ricePar)的推导与HEVC类似。在每个子块的开始处,ricePar设置为0。在对语法元素余数进行编码后,根据预先定义的等式修改Rice参数。为了编码非二进制语法元素absLevel(在第4通中),确定局部模板中sumAbs的绝对值之和。变量ricePar和posZero是基于相关量化和sumAbs通过查表来确定的。中间变量codeValue推导如下:
-如果absLevel[k]等于0,则codeValue设置为posZero;
-否则,如果absLevel[k]小于或等于posZero,则codeValue设置为等于absLevel[k]–1;
-否则(absLevel[k]大于posZero),codeValue设置为等于absLevel[k]。
使用Golomb-Rice码和Rice参数ricePar对codeValue的值进行编码。
2.2.2系数编解码的上下文建模
与变换系数水平的绝对值相关的句法元素的概率模型的选择取决于局部邻域中绝对水平或部分重构绝对水平的值。使用的模板如图4所示。
所选择的概率模型取决于局部邻域中的绝对水平(或部分重构的绝对水平)和局部邻域中大于0的绝对水平数(由sig_coeff_flags等于1的数目给出)之和。上下文建模和二值化取决于局部邻域的以下度量:
-numSig:局部邻域中非零水平的数目;
-sumAbs1:局部邻域中第一通后部分重构的绝对水平(absLevel1)之和;
-sumAbs:局部邻域中重构的绝对水平之和;;
-对角线位置(d):变换块内当前扫描位置的水平和垂直坐标之和。
基于numSig、sumAbs1和d的值,选择用于编码sig_flag,par_flag,gt1_flag,和gt2_flag的概率模型。基于sumAbs和numSig的值选择用于将abs_remainder二进制化的Rice参数。
2.3AVS3(音频和视频编解码标准3)中的残差编解码
2.3.1截断一元二值化
与VVC/HEVC不同,扫描区域的右下角(BRScanPosX,BRScanPosY)被信令通知。水平位置大于BRScanPosX的所有系数为零系数,并且垂直位置大于BRScanPosY的所有系数为零系数,如图5所示。此外,坐标(BRScanPosX,BRScanPosY)处的系数不必是零系数,它不同于用(LastPosX,LastPosY)表示的最后非零系数的坐标。然而,x坐标等于BRScanPosX的系数和y坐标等于BRScanPosY的系数中应至少有一个不等于0。这种方法被称为基于扫描区域的系数编解码(SRCC)。
对于可能包含非零系数的区域,以反向之字形形顺序扫描系数。扫描从右下角位置开始。从扫描区域的右下角位置开始,按反向扫描顺序将每个16个连续系数视为一个编解码组(CG)。最后CG(具有DC系数)可包含少于16个系数。
此外,CG内的系数编解码如下。
-第1通:按编码顺序处理显著性编码(sig_flag)。
-第2通:按编码顺序处理大于1标志(coeff_abs_level_greater1_flag)和大于2标志(coeff_abs_level_greater2_flag)的编码。如果sig_flag等于1,则首先对coeff_abs_level_greater1_flag进行编码(它指定绝对水平是否大于1)。如果coeff_abs_level_greater1_flag等于1,则另外对coeff_abs_level_greater2_flag进行编码(它指定绝对水平是否大于2)。
-第2通:处理coeff_abs_level_greater2_flag等于1的所有扫描位置的其余绝对水平(coeff_abs_level_remaining)的编码。
-第3通:sig_flag等于1的系数的符号(coeff_sign)编码。
更具体地,扫描区域的右下角位置(BRScanPosX,BRScanPosY)编码如下。
-第1通:处理组索引的编码(指示BRScanPosX/BRScanPosY的范围)。group_idx表示BRScanPosX/BRScanPosY的组索引,并且组如图6所示。
使用截断二进制方法对用group_idx表示的BRScanPosX的组索引进行二进制化,其中最大值设置为(块宽度-1)的group_idx。
使用截断二进制方法对用group_idx表示的BRScanPosY的组索引进行二进制化,其中最大值设置为(块高度-1)的group_idx。
首先,首先对多个“1”进行编码,并将要编码的“1”的数目设置为等于group_idx。然后,如果BRScanPosX的组索引小于CUWidth减1的组索引,或者如果BRScanPosY的组索引小于CUHeight减1的组索引,则编码一个“0”以指示组索引编码结束。
-第2通:处理组内偏移量的编码。组中BRScanPosX/BRScanPosY的偏移被编码以指示组内BRScanPosX/BRScanPosY的索引。
例如,如果BRScanPosX等于34,则首先编码等于10的group_idx。然后,对与同一组中的第一个条目(即32)相比的偏移量进行编码。
2.3.2语法表
SRCC的语法表以斜体显示,如下所示:
3.问题
1.在AVS3中可能无法有效地定义CU/TU/PU的最后非零系数。
2.虽然在CG中系数被分组,但是没有标志来信令通知以指示CG是否可以具有非零系数。因此,对于每个位置,都必须信令通知显著性标志来指示它是否为非零。这可能是低效的。
4.示例实施例
以下实施例应被视为解释一般概念的示例。不应狭隘地解释这些实施例。此外,这些实施例可以以任何方式组合。
1.应当被编解码的系数所在的扫描区域可以不是矩形形状。
a、在一个示例中,扫描区域可以是楔形的。
b、可替代地,另外,除扫描区域之外其余块具有零系数,其不必被编解码。
2.要被编解码的系数的扫描区域可以由信令通知的扫描顺序索引来定义。
a、扫描顺序可以是之字形扫描顺序。
b、扫描顺序可以是反向之字形扫描顺序。
c、扫描顺序可以是光栅扫描顺序。
d、扫描顺序可以是反向光栅扫描顺序。
e、在一个示例中,扫描顺序索引可以映射到坐标(scanX,scanY),并且信令通知该坐标。
f、在一个示例中,具有扫描顺序索引大于信令通知的扫描顺序索引的系数可以被强制为零系数。
i、可替代地,具有扫描顺序索引大于信令通知的扫描顺序索引的某些系数可以是非零系数。
g、在一个示例中,可以对具有不大于信令通知的扫描顺序索引的所有系数进行编解码。
i、可替代地,可以对具有不大于信令通知的扫描顺序索引的部分系数进行编解码,并且具有不大于信令通知的扫描顺序索引的其他系数可以不被编解码。
1)在一个示例中,扫描顺序索引比信令通知的扫描顺序索引小的某些系数可以被强制为零系数。
h、零系数的区域可进一步取决于CU/PU/TU/块的维度(例如,宽度或/和高度)。
i、可以使用一个或多个上下文模型、通过算术编解码来对扫描顺序索引进行编解码。
i.可替代地,可以通过旁路编解码对扫描顺序索引进行编解码。
3.要被编解码的系数的扫描区域可以由特定的位置和其他参数来定义。a、特定位置可以用坐标(x,y)表示或编解码。
i.该位置可以用扫描顺序索引表示或编解码。
b、在一个示例中,其他参数可以包括斜率X。
i.例如,可以画出通过特定位置的斜率为X的线,图7中示出了一个示例。
1)例如,线的一侧(不包括线上的)上的所有系数可以强制为零。
2)例如,线的一侧(包括线上的)上的所有系数可以强制为零。
3)例如,线下方的所有系数可以强制为零。
ii.例如,线上的某些系数可以强制为零。
iii.例如,对于线上的系数,如果它们以扫描顺序(例如,对角线顺序、之字形顺序或反向之字形顺序、反向对角线顺序等)在位置之前,则它们可能为零。
c、在一个示例中,可以允许一组斜率,并且可以在SPS/PPS/条带标头/片组标头等中被信令通知。
i、在一个示例中,可以在图片级、条带级、片级、片组级、CTU级、CU级、PU级或TU级来确定和通知使用哪个斜率。
d、在一个示例中,可以预定义使用的斜率。
i、例如,斜率可以是45°和/或135°。
e、在一个示例中,所使用的所述斜率可取决于CU/PU/TU/块维度(例如,宽度或/和高度)。
i、例如,斜率可取决于宽高比。例如,斜率=arctan(宽度/高度)或斜率=arctan(高度/宽度)或斜率=arctan-1(宽度/高度)或斜率=arctan-1(高度/宽度)
f、在一个示例中,所使用的斜率可以取决于预测模式(例如,帧内预测模式、帧间预测模式、仿射模式)。
g、在一个示例中,区域可以被定义为非线性线。
i.非线性线可以通过特定的位置。
ii.例如,线的一侧(不包括线上的)上的所有系数可以强制为零。
iii.例如,线一侧(包括线上的)上的所有系数可以强制为零。
iv.例如,可以对线一侧(不包括线上的)上的所有系数进行编解码(例如,图7中的白色区域)。
1)可替代地,可以对线一侧(包括线上的)上的所有系数进行编解码(例如,图7中的白色区域)。
2)可替代地,可以对线一侧(包括或不包括线上的)上的部分系数进行编解码(例如,图7中的部分白色区域)。
v、例如,线可以由分段线性线组成。
4.可以信令通知扫描顺序中表示连续系数的CG(编解码组)是否具有非零系数的指示。
a、扫描顺序可以是之字形扫描顺序。
b、扫描顺序可以是反向之字形扫描顺序。
c、扫描顺序可以是光栅扫描顺序。
d、扫描顺序可以是反向光栅扫描顺序。
e、扫描顺序可以颠倒。
f、在一个示例中,CG可以定义为按扫描顺序的N(N是正整数)个连续的系数(或位置)。
g、在一个示例中,CG可以定义为按不同于系数扫描顺序的顺序的N个数连续的系数(或位置)。
h、在一个示例中,CG可以包含按扫描顺序的或按不同于系数扫描顺序的顺序的N个数连续的系数(或位置)。
i、在一个示例中,第一CG(按扫描顺序)可以从特定位置开始。例如,特定位置可以是最后一个非零位置。
j、在一个示例中,与其他CG相比,最后CG或第一CG(按扫描顺序)可包含不同数目的系数。
i、在一个示例中,最后CG(按扫描顺序)可包含小于N个系数(或位置),而每个其他CG包含N个。
ii.可替代地,第一CG可包含小于N个系数,并且在第一CG之后以扫描顺序留下K×N(K是非负整数)个系数。
k、在一个示例中,可以将CU/PU/TU/块或非零区域划分成尺寸为sW×sH的子块(例如,4×4、4×8、8×4等),并且可以将CG定义为子块内的特定位置。
i.例如,可以将CG定义为子块的每隔一行。
ii.例如,可以将CG定义为子块的每隔一列。
iii.例如,可以将CG定义为子块。
iv.例如,可以按照棋盘图案将子块划分为两部分,每个部分都是CG。
i、在一个示例中,如果非零区域的宽度/高度不是sW/sH的整数倍,则一些CG的宽度/高度可能小于sW/sH。
i.例如,在非零区域的左边界处的CG的宽度可以小于sW。
ii.例如,在非零区域的右边界处的CG的宽度可以小于sW。
iii.例如,非零区域上边界处的高度可能小于sH。
iv.例如,非零区域下边界处的高度可能小于sH。
m、在一个示例中,如果非零区域的宽度/高度不是sW/sH的整数倍,则可以使用非零区域的放大区域并将其划分成CG。
i、例如,放大区域可以是宽度/高度为sW/sH整数倍的区域。
ii.例如,放大区域的宽度与原始非零区域的宽度之差应小于sW。
iii.例如放大区域的高度与原非零区域的高度之差应小于sH。
n、在一个示例中,N=8,16。
o、在一个示例中,当CG被指示只有零系数时,对于其内的任何位置不发送系数。
p、在一个示例中,这里定义的CG可仅用于信令通知其内是否存在非零系数。
i、可替代地,此外,用于编码系数的CG可以不改变。
q、在一个示例中,可以使用一个或多个上下文模型、通过算术编解码来对指示进行编解码。
i、在一个示例中,上下文模型可以基于先前编解码的CG的指示来确定。
5.允许的块内扫描区域的右下角位置可以被限制为不等于块的右下角位置。假设块的宽度和高度分别为W和H。
a、扫描区域右下角位置的x坐标(例如BRScanPosX)的允许范围可以设置为[a1,b1],其中a1和b1是整数并且b1小于(W-1)。
b、扫描区域右下角位置的y坐标(例如BRScanPosY)的允许范围可以设置为[a2,b2],其中a2和b2是整数并且b2小于(H-1)。
c、扫描区域右下角位置的x坐标(例如BRScanPosX)的允许范围可以设置为[a,b],其中a和b是整数并且b小于(W-1);并且扫描区域右下角位置的y坐标(例如BRScanPosY)的允许范围可以设置为[c,d],其中c和d是整数并且b小于(H-1)。
i.在一个示例中,a和c被设置为0。
ii.在一个示例中,c和d设为M-1(例如M=32)。
iii.在一个示例中,在块维度的条件下(例如当W或H大于M时),可以调用上述项目。
d、在一个示例中,在块维度的条件下(例如当W或H大于M时),可以调用上述项目。
e、在一个示例中,比特流一致性要求BRScanPosX和/或BRScanPosY应小于M。例如,M=32。
f、扫描区域的右下角位置(BRScanPosX,BRScanPosY)的信令可能取决于BRScanPosX和/或BRScanPosY的允许范围。
i.在一个示例中,BRScanPosX的组索引可以用截断的一元方法进行二值化,最大值(max)设置为(min(M,块宽度)-1)的组索引(例如,M=32)。
ii.在一个示例中,BRScanPosY的组索引可以用截断的一元方法进行二值化,最大值设置为(min(M,块高度)-1)的组索引(例如,M=32)。
iii.在一个示例中,组索引的范围从[0,11]减小到[0,9]。
iv.可替代地,BRScanPosX和/或BRScanPosY可以使用截断二进制方法进行二进制化,最大值设置为BRScanPosX和/或BRScanPosY的允许范围。
6.块内允许的扫描区域的右下角位置的x坐标和y坐标,或对应于信令通知的扫描索引(在项目1-3中)的x坐标和y坐标可以被联合编码。
a、在一个示例中,BRScanPosX和BRScanPosY可以被映射到一个值,然后被一次编解码。
b、可替代地,可以应用预测编解码。
i.在一个示例中,BRScanPosX可以首先被编解码,BRScanPosY可以基于BRScanPosX的值进一步被编解码。
ii.在一个示例中,BRScanPosY可以首先被编解码,BRScanPosY可以基于BRScanPosY的值进一步被编解码。
c、在一个示例中,BRScanPosX和BRScanPosY的编解码顺序可以自适应地改变。
i.在一个示例中,两个中哪个首先被编解码可取决于块维度/编解码信息。
5.附加实施例
这是在AVS3规范的基础上。新添加的部分以粗体斜体下划线字体显示,并且删除的部分显示在[[]]之间。
7.2.7变换块
用scan_region_x和scan_region_y来描述非零系数的扫描区域。扫描区域是矩形,左上角为(0,0),右下角为(scan_region_x,scan_region_y)。 他们的解析过程可以在8.3中找到。
8.3.4.15scan_region_x的反向二值化
[[将Width表示为当前块的宽度。如果在多个“1”之前解析了一个“0”,并且“1”的数目小于组group_idx[width-1],则将pos_x设置为等于“1”的数目;否则,将pos_x设置为等于group_idx[width-1]。group_idx的定义见附录J。]]
这是scan_region_x的第一部分。
如果pos_x小于或等于3,则将synElVal设置为等于pos_x。
如果pos_x大于3,则将synElVal设置为等于min_in_group[pos_x]。随后的二进制位构成scan_region_x的第二部分,并且第二部分的反向二值化描述如下:
8.3.4.16 scan_region_y的反向二值化
[[将Height表示为当前块的高度。如果在多个“1”之前解析了一个“0”,并且“1”的数目小于组group_idx[height-1],则将pos_y设置为等于“1”的数目;否则,将pos_y设置为等于group_idx[height-1]。group_idx的定义见附录J。]]
这是scan_region_y的第一部分。
如果pos_y小于或等于3,则将synElVal设置为等于pos_y。
如果pos_y大于3,则将synElVal设置为等于min_in_group[pos_y]。随后的二进制位构成scan_region_y的第二部分,并且第二部分的反向二值化描述如下:
附录J
A.1prefix_ctx
prefix_ctx[8]={0,0,0,3,6,10,15,21}
A.2min_in_group
min_in_group[[[14]]]={0,1,2,3,4,6,8,12,16,24[[,32,48,64,96]]}
A.3group_idx
group_idx[[[64]]]={0,1,2,3,4,4,5,5,6,6,6,6,7,7,7,7,8,8,8,8,8,8,8,8,9,9,9,9,9,9,9,9[[,10,10,10,10,10,10,10,10,10,10,10,10,10,10,10,10,11,11,11,11,11,11,11,11,11,11,11,11,11,11,11,11]]}
图8是示出可用于实现本公开技术的各个部分的计算机系统或其他控制设备800的架构的示例的框图。在图8中,计算机系统800包括经由互连825连接的一个或多个处理器805和存储器810。互连825可以表示由适当的网桥、适配器或控制器连接的任何一个或多个单独的物理总线、点对点连接或两者。因此,互连825可以包括例如系统总线、外围组件互连(PCI)总线、超传输或工业标准结构(ISA)总线、小型计算机系统接口(SCSI)总线、通用串行总线(USB)、IIC(I2C)总线或电气和电子工程师协会(IEEE)标准674总线(有时被称为“火线”)。
处理器805可以包括中央处理单元(CPU),以控制例如主机的整体操作。在某些实施例中,处理器805通过执行存储在存储器810中的软件或固件来实现这一点。处理器805可以是,或者可以包括一个或多个可编程通用或专用微处理器、数字信号处理器(DSP)、可编程控制器、专用集成电路(ASIC)、可编程逻辑器件(PLD)等,或者这些器件的组合。
存储器810可以是或包括计算机系统的主存储器。存储器810表示随机存取存储器(RAM)、只读存储器(ROM)、闪存等的任何适当形式,或这些设备的组合。在使用中,存储器810除其他外可以包含一组机器指令,当由处理器805执行时,这些指令使处理器805执行操作以实现本公开技术的实施例。
还通过互连825连接到处理器805的还有(可选的)网络适配器815。网络适配器815为计算机系统800提供与诸如存储客户端和/或其他存储服务器之类的远程设备通信的能力,并且可以是例如以太网适配器或光纤通道适配器。
图9示出了可用于实现本公开技术的各个部分的移动设备900的示例实施例的框图。移动设备900可以是笔记本电脑、智能手机、平板电脑、摄像机或能够处理视频的其他类型的设备。移动设备900包括处理器或控制器901以处理数据,以及与处理器901通信以存储和/或缓冲数据的存储器902。例如,处理器901可以包括中央处理单元(CPU)或微控制器单元(MCU)。在一些实现中,处理器901可以包括现场可编程门阵列(FPGA)。在一些实现中,移动设备900包括用于智能手机设备的各种视觉和/或通信数据处理功能的图形处理单元(GPU)、视频处理单元(VPU)和/或无线通信单元或与其进行通信。例如,存储器902可以包括并存储处理器可执行代码,当由处理器901执行时,使移动设备900执行各种操作,例如,接收信息、命令和/或数据,处理信息和数据,以及向另一设备(例如执行器或外部显示器)发送或提供经处理的信息/数据。为了支持移动设备900的各种功能,存储器902可以存储信息和数据,例如指令、软件、值、图像以及由处理器901处理或引用的其他数据。例如,可以使用各种类型的随机存取存储器(RAM)设备、只读存储器(ROM)设备、闪存设备和其他合适的存储介质来实现存储器902的存储功能。在一些实现中,移动设备900包括输入/输出(I/O)单元903,以将处理器901和/或存储器902接口到其他模块、单元或设备。例如,I/O单元903可以与处理器901和存储器902接口,以利用与典型数据通信标准兼容的各种类型的无线接口,例如,在云中的一个或多个计算机与用户设备之间。在一些实现中,移动设备900可以通过I/O单元903使用有线连接与其他设备接口。移动设备900还可以与其他外部接口(例如数据存储器和/或视觉或音频显示设备904)接口,以检索和传输可由处理器处理、存储在存储器中或显示在显示设备904或外部设备的输出单元上的数据和信息。例如,显示设备904可以显示根据所公开的技术基于MVP修改的视频帧。
图10是示出其中可以实现本文公开的各种技术的示例性视频处理系统1000的框图。各种实现可以包括系统1000的部分或全部组件。系统1000可以包括用于接收视频内容的输入1002。视频内容可以原始或未压缩格式(例如,8位或10位多分量像素值)接收,或者可以压缩或编码格式接收。输入1002可以表示网络接口、外围总线接口或存储接口。网络接口的示例包括有线接口(例如以太网、无源光网络(PON))和无线接口(例如Wi-Fi或蜂窝接口)。
系统1000可以包括编解码组件1004,其可以实现在本文档中描述的各种编码或编码方法。编解码组件1004可以降低从输入1002到编解码组件1004的输出的视频的平均比特率,以产生视频的编解码表示。因此,编码技术有时被称为视频压缩或视频转码技术。编解码组件1004的输出可以被存储,或者通过由组件1006表示的连接的通信发送。组件1008可以使用在输入1002处接收到的视频的存储或通信比特流(或编解码)表示来生成发送到显示接口1010的像素值或可显示视频。从比特流表示生成用户可见视频的过程有时称为视频解压缩。此外,虽然某些视频处理操作被称为“编解码”操作或工具,但是应当理解的是,在编码器处使用编码工具或操作,并且将由解码器执行与编码结果相反的相应解码工具或操作。
外围总线接口或显示接口的示例可以包括通用串行总线(USB)或高清多媒体接口(HDMI)或显示端口等。存储接口的示例包括SATA(串行高级技术附件)、PCI、IDE接口等。本文档中描述的技术可以体现在各种电子设备中,例如移动电话、笔记本电脑、智能手机或能够执行数字数据处理和/或视频显示的其他设备。
图11是视频处理的示例方法的流程图。该方法包括:在当前视频块和当前视频块的编解码表示之间执行(1102)转换,其中,在转换期间,将根据扫描顺序扫描包括位于当前视频块的非重叠子块中的变换系数的一个或多个区域。
现在以基于条款的格式呈现一些实施例。
1.一种视频处理方法,包括:
在当前视频块和当前视频块的编解码表示之间执行转换,其中,在转换期间,将根据扫描顺序扫描包括位于当前视频块的非重叠子块中的变换系数的一个或多个区域。
2.根据条款1的方法,其中一个或多个区域是任意形状的。
3.根据条款2条的方法,其中一个或多个区域的形状类似楔形。
4.根据条款1的方法,其中变换系数为非零值。
5.根据条款1条的方法,其中不包括一个或多个区域的区域用零系数编解码。
6.根据条款1的方法,其中顺序由信令顺序索引定义。
7.根据条款6的方法,其中信令顺序索引指定扫描顺序是以下之一:之字形扫描、反向之字形扫描、光栅扫描或反向光栅扫描。
8.根据条款6的方法,其中信令顺序索引表示为二维坐标(scanX,scanY)。
9.根据条款6-8中一项或多项的方法,其中信令顺序索引隐式或显式地包括在比特流表示中。
10.根据条款6-9中一项或多项的方法,其中,部分地基于变换系数是否大于或小于信令顺序索引变换系数,至少一个子集被选择性地编解码或不编解码。
11.根据条款10的方法,其中未编解码的变换系数为零值。
12.根据条款11的方法,其中,基于当前视频块的维度定位零值变换系数所在的区域。
13.根据条款11的方法,其中,基于当前视频块的子块的维度定位零值变换系数所在的区域。
14.根据条款6-13中一项或多项的方法,其中使用编解码方法表示扫描顺序索引。
15.根据条款14的方法,其中编解码方法是以下之一:具有一个或多个上下文模型的算术编解码方法、或旁路编解码方法。
16.根据条款1的方法,其中一个或多个要扫描的区域由位置参数和其他参数定义。
17.根据条款15的方法,其中位置参数是由二维坐标(x,y)表示的点的位置和/或扫描顺序索引。
18.根据条款16的方法,其中其他参数中的参数对应于通过该点的直线的斜率。
19.根据条款17的方法,其中在空间上位于直线上方、下方或直线上的区域中的变换系数的至少一个子集被赋予零值。
20.根据条款17的方法,其中在空间上位于扫描顺序的点之前的区域中的变换系数的至少一个子集被赋予零值。
21.根据条款19的方法,其中扫描顺序是以下之一:对角线顺序、之字形顺序、反向之字形顺序或反向对角线顺序。
22.根据条款17的方法,其中斜率集合包含在其他参数中。
23.根据条款17-21中一项或多项的方法,其中斜率隐式或显式地包括在比特流表示中。
24.根据条款22的方法,其中斜率包括在图片级、条带级、片级、片组级、CTU级、CU级、PU级或TU级中。
25.根据条款17-23中一项或多项的方法,其中斜率部分基于当前视频块的维度。
26.根据条款17-23中一项或多项的方法,其中斜率部分基于当前视频块的编解码模式。
27.根据条款16的方法,其中一个或多个区域由通过该点的非线性曲线表示。
28.根据条款26的方法,其中在空间上位于非线性曲线上方、下方或之上的区域中的变换系数的至少一个子集被赋予零值。
29.一种视频处理方法,包括:
在当前视频块和当前视频块的编解码表示之间执行转换,其中,在转换期间,将根据扫描顺序扫描包括位于当前视频块的非重叠子块中的变换系数的一个或多个区域;以及
在编解码表示中提供根据扫描顺序扫描的子块中的子块是否对应于零值变换系数的指示。
30.根据条款29的方法,其中指示被定义为扫描顺序中的连续位置。
31.根据条款29的方法,其中指示被定义为与扫描顺序不同的连续位置。
32.根据条款29的方法,其中指示被定义为具有最后非零系数的编解码组的位置。
33.根据条款29的方法,其中扫描顺序是以下之一:之字形扫描、反向之字形扫描、光栅扫描或反向光栅扫描。
34.根据条款32的方法,其中,与另一编解码组相比,该编解码组可以对应于不同数目的变换系数。
35.根据条款29-34中任一项的方法,其中编解码组包括子块的至少一部分。
36.根据条款35的方法,其中子块的维度不同于编解码组的维度。
37.一种视频处理方法,包括:
在当前视频块和当前视频块的编解码表示之间执行转换,其中,在转换期间,将根据扫描顺序扫描包括位于当前视频块的非重叠子块中的变换系数的一个或多个区域;以及
将要扫描的区域限制为允许的值范围。
38.根据条款37的方法,其中允许的值范围使得要扫描的区域的右下角位置不等于当前视频块的右下角位置。
39.根据条款38的方法,其中,允许的值范围以要扫描的区域右下角位置的x坐标来指定,并且表示为[a1,b1],其中a1和b1是整数并且b1小于(W-1),其中W是当前视频块的宽度。
40.根据条款38的方法,其中,允许的值范围以要扫描的区域右下角位置的y坐标来指定,并且表示为[a2,b2],其中a2和b2是整数并且b2小于(H-1),其中H是当前视频块的高度。
41.根据条款38的方法,其中,允许的数值范围以要扫描的区域右下角位置的x坐标和y坐标表示,其中x坐标表示为[a,b],其中a和b为整数并且b小于(W-1),其中y坐标表示为[c,d],其中c和d是整数并且d小于(H-1),其中W,H是当前视频块的宽度和高度。
42.根据条款37-41中一项或多项的方法,其中被扫描的区域被显式或隐式地包括在编解码表示中。
43.一种视频处理方法,包括:
在当前视频块和当前视频块的编解码表示之间执行转换,其中,在转换期间,将根据由扫描顺序索引表示的扫描顺序来扫描包括位于当前视频块的非重叠子块中的变换系数的一个或多个区域;
将要扫描的区域限制在允许的值范围内;其中要扫描的一个或多个区域由位置参数和其他参数定义;以及
用编解码方法对扫描顺序索引和允许值范围进行联合编解码。
44.根据条款43的方法,其中编解码方法包括预测编解码方法。
45.根据条款43的方法,其中允许的值范围使得要扫描的区域的右下角位置不等于当前视频块的右下角位置。
46.根据条款43的方法,其中,允许的值范围以要扫描的区域右下角位置的x坐标来指定,并且表示为[a1,b1],其中a1和b1是整数并且b1小于(W-1),其中W是当前视频块的宽度。
47.根据条款43的方法,其中,允许的值范围以要扫描的区域右下角位置的y坐标来指定,并且表示为[a2,b2],其中a2和b2是整数并且b2小于(H-1),其中H是当前视频块的高度。
48.根据条款43的方法,其中,允许的值范围以要扫描区域右下角位置的x坐标和y坐标表示,其中x坐标表示为[a,b],其中a和b为整数并且b小于(W-1),其中y坐标表示为[c,d],其中c和d是整数并且d小于(H-1),其中W,H是当前视频块的宽度和高度。
49.根据条款43-48中任一项的方法,其中联合编解码包括确定包含在允许值范围内的值的顺序。
50.根据条款49的方法,其中值的顺序至少部分地基于当前视频块的维度。
51.根据条款49的方法,其中确定值的顺序包括确定值的映射。
52.一种视频解码装置,包括处理器,处理器被配置为实现条款1至51中一项或多项的方法。
53.一种视频编码装置,包括处理器,处理器被配置为实现条款1至51中一项或多项的方法。
54.一种存储有计算机代码的计算机程序产品,当由处理器执行时,该代码使处理器实现条款1至51中任一项的方法。
55.本文中描述的方法、装置或系统。
图12是根据本技术的用于视频处理的方法1200的流程图表示。方法1200包括:在操作1210处,在视频的当前块和视频的编解码表示之间执行转换。当前块具有宽度W和高度H,并且当前块包括允许的扫描区域,允许的扫描区域包括根据扫描顺序在编解码表示中编解码的非零变换系数。根据规则,允许的扫描区域被限制为当前块的部分,规则规定允许的扫描区域的右下角位置不同于当前块的右下角位置。
在一些实施例中,允许的扫描区域的右下角位置的x坐标在[a,b]范围内,其中a和b是整数,并且其中b小于(W-1)。在一些实施例中,允许的扫描区域的右下角位置的y坐标在[c,d]范围内,其中c和d是整数,并且其中d小于(H-1)。在一些实施例中,a=c=0。在一些实施例中,c=d=M-1,M为正整数。在一些实施例中,a、b、c和d小于M,M为正整数。
在一些实施例中,规则是否适用于当前块基于当前块的维度。在一些实施例中,在W大于M或H大于M的情况下,规则适用于当前块,M为正整数。在一些实施例中,在编解码表示中信令通知允许的扫描区域的右下角位置基于允许位置的范围。在一些实施例中,在编解码表示中将允许的扫描区域的右下角位置的x坐标的范围信令通知为组索引,其中组索引使用截断的一元方法进行二值化,其中根据min(M,W)-1设置最大值,M为正整数。在一些实施例中,允许的扫描区域的右下角位置的y坐标范围被表示为组索引,其中组索引使用截断的一元方法进行二值化,其中基于min(M,H)-1设置最大值,M为正整数。在一些实施例中,组索引在[0,9]范围内。在一些实施例中,M=32。
图13是根据本技术的用于视频处理的方法1300的流程图表示。方法1300包括:在操作1310处,在视频的当前块和视频的编解码表示之间执行转换。基于当前块的部分中按扫描顺序的非零变换系数将当前块编解码在编解码表示中,并且包括非零变换系数的当前块的部分具有非矩形形状。
在一些实施例中,部分具有楔形形状。在一些实施例中,当前块的其余部分包括零变换系数。在一些实施例中,不在编解码表示中信令通知零变换系数。
图14是根据本技术的用于视频处理的方法1400的流程图表示。方法1400包括:在操作1410处,在视频的当前块和视频的编解码表示之间执行转换。基于当前块的部分中按扫描顺序的非零变换系数将当前块编解码在编解码表示中。编解码表示符合格式规则;格式规则定义编解码表示中表示扫描顺序的扫描顺序索引指示当前块的部分。
在一些实施例中,扫描顺序包括以下至少一种:之字形扫描顺序、反向之字形扫描顺序、光栅扫描顺序或反向光栅扫描顺序。在一些实施例中,扫描顺序索引表示为二维坐标(scanX,scanY)。
在一些实施例中,在位置对应于大于扫描顺序索引的索引的情况下,当前块中的位置处的变换系数被视为零变换系数。在一些实施例中,在位置对应于小于扫描顺序索引的索引的情况下,当前块中的位置处的变换系数被视为零变换系数。在一些实施例中,在位置对应于大于扫描顺序索引的索引的情况下,当前块中的位置处的变换系数被视为非零变换系数。
在一些实施例中,在编解码表示中信令通知与等于或小于扫描顺序索引的索引相对应的位置中的所有变换系数。在一些实施例中,在编解码表示中信令通知与等于或小于扫描顺序索引的索引相对应的位置中的所有变换系数的子集。
在一些实施例中,包括零变换系数的当前块的其余部分基于视频单元的维度。在一些实施例中,视频单元包括编解码单元、图片单元、变换单元或块。在一些实施例中,使用具有一个或多个上下文模型的算术编解码方法对扫描顺序进行编码。在一些实施例中,使用旁路编解码方法对扫描顺序进行编码。
图15是根据本技术的用于视频处理的方法1500的流程图表示。方法1500包括:在操作1510处,在视频的当前块和视频的编解码表示之间执行转换。基于当前块的部分中按扫描顺序的非零变换系数将当前块编解码在编解码表示中。编解码表示符合格式规则;格式规则定义编解码表示中表示当前块中的特定位置的语法元素指示当前块的部分。当前块的部分还由与当前块中的特定位置相关联的特性来指示。
在一些实施例中,特定位置用坐标(x,y)表示。在一些实施例中,坐标(x,y)对应于指示扫描顺序的扫描顺序索引,扫描顺序包括以下至少一种:对角线扫描顺序、之字形扫描顺序、反向之字形扫描顺序、或反向对角线扫描顺序。
在一些实施例中,与特定位置相关联的特性包括穿过特定位置的直线的斜率。在一些实施例中,在编解码表示中信令通知斜率。在一些实施例中,在图片级、条带级、片级、片组级、编解码树单元级、编解码单元级、图片单元级或变换单元级信令通知斜率。在一些实施例中,斜率是预定义的。在一些实施例中,斜率为45°或135°。在一些实施例中,斜率基于视频单元的维度。在一些实施例中,视频单元包括编解码单元、图片单元、变换单元或块。在一些实施例中,斜率基于视频单元的宽度和高度之间的比率。在一些实施例中,斜率等于arctan(宽度/高度)、arctan(高度/宽度)、arctan-1(宽度/高度)或arctan-1(高度/宽度)。在一些实施例中,斜率基于适用于当前块的预测模式,预测模式包括以下至少一种:帧内预测模式、帧间预测模式或仿射模式。
在一些实施例中,与特定位置相关联的特性包括穿过特定位置的非线性线。在一些实施例中,非线性线包括分段线性部分。在一些实施例中,在线的第一侧的位置中的所有变换系数都被视为零变换系数。在一些实施例中,位置不与线重叠。在一些实施例中,第一侧包括线下方的一侧。在一些实施例中,在线上的位置处的至少一个系数被视为零变换系数。在一些实施例中,在位置位于扫描顺序中的位置之前的情况下,在线上的位置处的系数被视为零变换系数。
在一些实施例中,在编解码表示中信令通知线的第一侧的位置中的所有变换系数。在一些实施例中,位置不与线重叠。在一些实施例中,在编解码表示中信令通知位于线上的位置处的至少一个系数。
在一些实施例中,在编解码表示中联合信令通知当前块的部分的右下角位置的x坐标和y坐标。在一些实施例中,在编解码表示中将x坐标和y坐标信令通知为单个值。在一些实施例中,按顺序在编解码表示中联合信令通知x坐标和y坐标。在一些实施例中,基于x坐标的值信令通知y坐标在一些实施例中,基于y坐标的值信令通知x坐标。在一些实施例中,顺序是自适应可变的。在一些实施例中,顺序基于当前块的特性变化,特性包括当前块的维度。
图16是根据本技术的用于视频处理的方法1600的流程图表示。方法1600包括:在操作1610处,在视频的当前块和视频的编解码表示之间执行转换。在编解码表示中信令通知当前块的编解码组是否包括非零变换系数的指示。编解码组表示根据扫描顺序在转换期间要扫描的连续变换系数。
在一些实施例中,扫描顺序包括以下至少一种:对角线扫描顺序、之字形扫描顺序、反向之字形扫描顺序、或反向对角线扫描顺序。在一些实施例中,编解码组是根据扫描顺序、基于N个连续变换系数确定的,N是正整数。在一些实施例中,编解码组是根据不同于扫描顺序的顺序、基于N个连续变换系数确定的,N是正整数。在一些实施例中,当前块包括多个编解码组,并且其中,根据扫描顺序的第一编解码组从包括非零变换系数的最后位置开始。在一些实施例中,当前块包括多个编解码组,并且其中,根据扫描顺序的至少第一编解码组或最后编解码组与其余编解码组相比具有不同数目的变换系数。在一些实施例中,最后编解码组包括小于N个变换系数,并且其余编解码组中的每个包括N个变换系数,N是整数。在一些实施例中,第一编解码组包括小于N个变换系数,并且其中,其余编解码组包括K×N个变换系数,K和N为非负整数。
在一些实施例中,当前块包括多个子块,每个子块具有sH行和sW列,并且其中,编解码组位于多个子块的子块内。在一些实施例中,编解码组包括子块的sH行的每隔一行。在一些实施例中,编解码组包括子块的sW列的每隔一列。在一些实施例中,编解码组包括子块的整体。在一些实施例中,子块基于棋盘图案被划分成两部分,并且其中,编解码组包括两部分的第一部分。在一些实施例中,当前块的部分包括根据扫描顺序在转换期间要扫描的非零变换系数,并且其中,由于部分的维度不是子块的维度的整数倍,多个编解码组中的至少一个具有与子块的维度不同的维度。在一些实施例中,位于当前块的部分的左边界或右边界处的编解码组具有小于子块的宽度的宽度。在一些实施例中,位于当前块的部分的上边界或下边界处的编解码组具有小于子块的高度的高度。
在一些实施例中,当前块的部分包括根据扫描顺序在转换期间要扫描的非零变换系数。在部分的维度不是子块的维度的整数倍的情况下,基于部分的放大区域被划分成多个编解码组。在一些实施例中,放大区域具有是子块的维度的整数倍的维度。在一些实施例中,放大区域的宽度与部分的宽度之间的差小于子块的宽度。在一些实施例中,放大区域的高度与部分的高度之间的差小于子块的高度。在一些实施例中,N为8或16。
在一些实施例中,在编解码组仅包括零变换系数的情况下,零变换系数不包括在编解码组中的位置的编解码表示中。在一些实施例中,编解码组仅用于非零变换系数的指示。在一些实施例中,编解码组保持不变。在一些实施例中,使用具有一个或多个上下文模型的算术编解码方法对指示进行编码。在一些实施例中,基于编解码组的先前指示确定上下文模型。
在一些实施例中,转换从编解码表示生成视频。在一些实施例中,转换从视频生成编解码表示。
所公开技术的一些实施例包括作出启用视频处理工具或模式的决策或决定。在一个示例中,当视频处理工具或模式被启用时,编码器将在视频块的处理中使用或实施该工具或模式,但不一定基于该工具或模式的使用来修改所得的比特流。也就是说,当基于决策或决定启用视频处理工具或模式时,从视频块到视频的比特流表示的转换将使用该视频处理工具或模式。在另一示例中,当视频处理工具或模式被启用时,解码器将在知道已经基于视频处理工具或模式修改了比特流的情况下处理比特流。也就是说,将使用基于决策或决定而启用的视频处理工具或模式来执行从视频的比特流表示到视频块的转换。
所公开技术的一些实施例包括作出禁用视频处理工具或模式的决策或决定。在一个示例中,当视频处理工具或模式被禁用时,编码器在将视频块转换为视频的比特流表示中将不使用该工具或模式。在另一示例中,当视频处理工具或模式被禁用时,解码器将在知道并未使用曾基于决策或决定启用的视频处理工具或模式对比特流做出修改的情况下处理比特流。
本文档中描述公开的实施例、模块和功能操作可以在数字电子电路、或计算机软件、固件或硬件中实现,包括本文档中所公开的结构及其结构等效体,或其中一个或多个的组合。本说明中描述的主题的实现可以实现为一个或多个计算机程序产品,即一个或多个编码在有形的且非易失的计算机可读介质上的计算机程序指令的模块,以供数据处理装置执行或控制数据处理装置的操作。计算机可读介质可以是机器可读存储设备、机器可读存储基板、存储设备、影响机器可读传播信号的物质组成或其中一个或其中多个的组合。术语“数据处理单元”或“数据处理装置”包括用于处理数据的所有装置、设备和机器,包括例如可编程处理器、计算机或多处理器或计算机组。除硬件外,该装置还可以包括为计算机程序创建执行环境的代码,例如,构成处理器固件的代码、协议栈、数据库管理系统、操作系统或其中一个或多个的组合。传播的信号是人为生成的信号,例如,机器生成的电、光或电磁信号,其被生成以编码信息以传输到合适的接收器设备。
计算机程序(也称为程序、软件、软件应用、脚本或代码)可以用任何形式的编程语言(包括编译语言或解释语言)编写,并且可以以任何形式部署,包括作为独立程序或作为模块、组件、子程序或其他适合在计算环境中使用的单元。计算机程序不一定与文件系统中的文件对应。程序可以存储在保存其他程序或数据的文件的部分中(例如,存储在标记语言文档中的一个或多个脚本)、专用于该程序的单个文件中、或多个协调文件(例如,存储一个或多个模块、子程序或部分代码的文件)中。计算机程序可以部署在一台或多台计算机上来执行,这些计算机位于一个站点上或分布在多个站点上,并通过通信网络互连。
本说明书中描述的处理和逻辑流可以通过一个或多个可编程处理器执行,该处理器执行一个或多个计算机程序,通过在输入数据上操作并生成输出来执行功能。处理和逻辑流也可以通过特殊用途的逻辑电路来执行,并且装置也可以实现为特殊用途的逻辑电路,例如,FPGA(现场可编程门阵列)或ASIC(专用集成电路)。
例如,适于执行计算机程序的处理器包括通用和专用微处理器,以及任何类型数字计算机的任何一个或多个。通常,处理器将从只读存储器或随机存取存储器或两者接收指令和数据。计算机的基本元件是执行指令的处理器和存储指令和数据的一个或多个存储设备。通常,计算机还将包括一个或多个用于存储数据的大容量存储设备,例如,磁盘、磁光盘或光盘,或通过操作耦合到一个或多个大容量存储设备来从其接收数据或将数据传输到一个或多个大容量存储设备,或两者兼有。然而,计算机不一定具有这样的设备。适用于存储计算机程序指令和数据的计算机可读介质包括所有形式的非易失性存储器、介质和存储器设备,包括例如半导体存储器设备,例如EPROM、EEPROM和闪存设备;磁盘,例如,内部硬盘或可移动硬盘;磁光盘;以及CD ROM和DVD ROM盘。处理器和存储器可以由专用逻辑电路来补充,或合并到专用逻辑电路中。
虽然本专利文件包含许多细节,但不应将其解释为对任何发明或权利要求范围的限制,而应解释为对特定发明的特定实施例的特征的描述。本专利文件在单独实施例的上下文描述的某些特征也可以在单个实施例中组合实施。相反,在单个实施例的上下文中描述的各种功能也可以在多个实施例中单独实施,或在任何合适的子组合中实施。此外,尽管上述特征可以描述为在某些组合中起作用,甚至最初要求是这样,但在某些情况下,可以从组合中移除权利要求组合中的一个或多个特征,并且权利要求的组合可以指向子组合或子组合的变体。
同样,尽管附图中以特定顺序描述了操作,但这不应理解为要获得想要的结果必须按照所示的特定顺序或顺序执行此类操作,或执行所有说明的操作。此外,本专利文件所述实施例中各种系统组件的分离不应理解为在所有实施例中都需要这样的分离。
仅描述了一些实现和示例,其他实现、增强和变体可以基于本专利文件中描述和说明的内容做出。

Claims (108)

1.一种处理视频数据的方法,包括:
在视频的当前块和所述视频的比特流之间执行转换,其中所述当前块具有宽度W和高度H;
其中,所述当前块包括允许的扫描区域,所述允许的扫描区域包括根据扫描顺序在所述比特流中编解码的非零变换系数;
其中,当W大于M或H大于M时,根据规则将所述允许的扫描区域限制为所述当前块的部分,以及
其中,所述规则规定当W大于M时,所述允许的扫描区域的右下角位置的x坐标在[a,b]的范围内,其中a小于M,b=M-1,当H大于M时,所述允许的扫描区域的右下角位置的y坐标在[c,d]范围内,其中c小于M,d=M-1,M为正整数。
2.根据权利要求1所述的方法,其中,指示所述允许的扫描区域的右下角位置的x坐标和y坐标的一个或多个语法元素被包括在所述比特流中。
3.根据权利要求2所述的方法,其中,指示所述x坐标的第一语法元素用截断的一元方法进行二值化,其中最大值设置为(min(M,W)-1)的组索引。
4.根据权利要求2所述的方法,其中,指示所述y坐标的第二语法元素用截断的一元方法进行二值化,其中最大值设置为(min(M,H)-1)的组索引。
5.根据权利要求3所述的方法,其中,所述组索引在[0,9]的范围内。
6.根据权利要求2所述的方法,其中,比特流一致性要求是一个或多个语法元素的值应小于M。
7.根据权利要求1所述的方法,其中a=c=0。
8.根据权利要求1所述的方法,其中M=32。
9.根据权利要求1所述的方法,其中,所述当前块的其余部分包括零变换系数并且所述零变换系数不包括在所述比特流中。
10.根据权利要求1所述的方法,其中,所述允许的扫描区域内的所有系数都被编解码在所述比特流中。
11.根据权利要求1所述的方法,其中,所述扫描顺序是之字形扫描顺序或反向之字形扫描顺序。
12.根据权利要求1所述的方法,其中,所述转换包括将所述当前块编码到所述比特流中。
13.根据权利要求1所述的方法,其中,所述转换包括从所述比特流解码所述当前块。
14.一种用于处理视频数据的装置,包括处理器和其上带有指令的非暂时性存储器,其中所述指令在由所述处理器执行时使所述处理器:
在视频的当前块和所述视频的比特流之间执行转换,其中所述当前块具有宽度W和高度H;
其中,所述当前块包括允许的扫描区域,所述允许的扫描区域包括根据扫描顺序在所述比特流中编解码的非零变换系数;
其中,当W大于M或H大于M时,根据规则将所述允许的扫描区域限制为所述当前块的部分,以及
其中,所述规则规定当W大于M时,所述允许的扫描区域的右下角位置的x坐标在[a,b]的范围内,其中a小于M,b=M-1,当H大于M时,所述允许的扫描区域的右下角位置的y坐标在[c,d]范围内,其中c小于M,d=M-1,M为正整数。
15.根据权利要求14所述的装置,其中,指示所述允许的扫描区域的右下角位置的x坐标和y坐标的一个或多个语法元素被包括在所述比特流中;
其中,指示所述x坐标的第一语法元素用截断的一元方法进行二值化,其中最大值设置为(min(M,W)-1)的组索引;
其中,指示所述y坐标的第二语法元素用截断的一元方法进行二值化,其中最大值设置为(min(M,H)-1)的组索引;
其中,所述组索引在[0,9]的范围内;以及
其中,比特流一致性要求是一个或多个语法元素的值应小于M。
16.根据权利要求14所述的装置,其中a=c=0,M=32。
17.一种存储指令的非暂时性计算机可读存储介质,所述指令使处理器:
在视频的当前块和所述视频的比特流之间执行转换,其中所述当前块具有宽度W和高度H;
其中,所述当前块包括允许的扫描区域,所述允许的扫描区域包括根据扫描顺序在所述比特流中编解码的非零变换系数;
其中,当W大于M或H大于M时,根据规则将所述允许的扫描区域限制为所述当前块的部分,以及
其中,所述规则规定当W大于M时,所述允许的扫描区域的右下角位置的x坐标在[a,b]的范围内,其中a小于M,b=M-1,当H大于M时,所述允许的扫描区域的右下角位置的y坐标在[c,d]范围内,其中c小于M,d=M-1,M为正整数。
18.根据权利要求17所述的非暂时性计算机可读存储介质,其中,指示所述允许的扫描区域的右下角位置的x坐标和y坐标的一个或多个语法元素被包括在所述比特流中;
其中,指示所述x坐标的第一语法元素用截断的一元方法进行二值化,其中最大值设置为(min(M,W)-1)的组索引;
其中,指示所述y坐标的第二语法元素用截断的一元方法进行二值化,其中最大值设置为(min(M,H)-1)的组索引;
其中,所述组索引在[0,9]的范围内;以及
其中,比特流一致性要求是一个或多个语法元素的值应小于M。
19.一种存储由视频处理装置执行的方法生成的视频的比特流的非暂时性计算机可读记录介质,其中所述方法包括:
基于所述视频的当前块生成比特流,其中所述当前块具有宽度W和高度H;
其中,所述当前块包括允许的扫描区域,所述允许的扫描区域包括根据扫描顺序在所述比特流中编解码的非零变换系数;
其中,当W大于M或H大于M时,根据规则将所述允许的扫描区域限制为所述当前块的部分,以及
其中,所述规则规定当W大于M时,所述允许的扫描区域的右下角位置的x坐标在[a,b]的范围内,其中a小于M,b=M-1,当H大于M时,所述允许的扫描区域的右下角位置的y坐标在[c,d]范围内,其中c小于M,d=M-1,M为正整数。
20.根据权利要求19所述的非暂时性计算机可读记录介质,其中,指示所述允许的扫描区域的右下角位置的x坐标和y坐标的一个或多个语法元素被包括在所述比特流中;
其中,指示所述x坐标的第一语法元素用截断的一元方法进行二值化,其中最大值设置为(min(M,W)-1)的组索引;
其中,指示所述y坐标的第二语法元素用截断的一元方法进行二值化,其中最大值设置为(min(M,H)-1)的组索引;
其中,所述组索引在[0,9]的范围内;以及
其中,比特流一致性要求是一个或多个语法元素的值应小于M。
21.一种用于存储视频的比特流的方法,包括:
基于所述视频的当前块生成比特流,其中所述当前块具有宽度W和高度H;以及
将所述比特流存储到非暂时性计算机可读记录介质中,
其中,所述当前块包括允许的扫描区域,所述允许的扫描区域包括根据扫描顺序在所述比特流中编解码的非零变换系数;
其中,当W大于M或H大于M时,根据规则将所述允许的扫描区域限制为所述当前块的部分,以及
其中,所述规则规定当W大于M时,所述允许的扫描区域的右下角位置的x坐标在[a,b]的范围内,其中a小于M,b=M-1,当H大于M时,所述允许的扫描区域的右下角位置的y坐标在[c,d]范围内,其中c小于M,d=M-1,M为正整数。
22.一种视频处理方法,包括:
在视频的当前块和所述视频的比特流之间执行转换,
其中,所述当前块具有宽度W和高度H;
其中,所述当前块包括允许的扫描区域,所述允许的扫描区域包括根据扫描顺序在所述比特流中编解码的非零变换系数;
其中,根据规则,所述允许的扫描区域被限制为所述当前块的部分,并且
其中,所述规则规定所述允许的扫描区域的右下角位置不同于所述当前块的右下角位置;
其中,所述允许的扫描区域的所述右下角位置的x坐标在[a,b]范围内,其中a和b是整数,并且其中b小于(W-1),所述允许的扫描区域的所述右下角位置的y坐标在[c,d]范围内,其中c和d是整数,并且其中d小于(H-1)。
23.根据权利要求22所述的方法,其中a=c=0。
24.根据权利要求22所述的方法,其中c=d=M-1,M为正整数。
25.根据权利要求22所述的方法,其中a、b、c和d小于M,M为正整数。
26.根据权利要求22所述的方法,其中,所述规则是否适用于所述当前块基于所述当前块的维度。
27.根据权利要求26所述的方法,其中,在W大于M或H大于M的情况下,所述规则适用于所述当前块,M为正整数。
28.根据权利要求22所述的方法,其中,在所述比特流中信令通知所述允许的扫描区域的所述右下角位置基于允许位置的范围。
29.根据权利要求28所述的方法,其中,在所述比特流中将所述允许的扫描区域的所述右下角位置的x坐标的范围信令通知为组索引,其中所述组索引使用截断的一元方法进行二值化,其中根据min(M,W)-1设置最大值,M为正整数。
30.根据权利要求28所述的方法,其中,所述允许的扫描区域的所述右下角位置的y坐标范围被表示为组索引,其中所述组索引使用截断的一元方法进行二值化,其中基于min(M,H)-1设置最大值,M为正整数。
31.根据权利要求29或30所述的方法,其中所述组索引在[0,9]范围内。
32.根据权利要求22至30中任一项所述的方法,其中M=32。
33.根据权利要求22所述的方法,其中,基于所述当前块的部分中按扫描顺序的非零变换系数将所述当前块编解码在所述比特流中;
其中,包括所述非零变换系数的所述当前块的部分具有非矩形形状。
34.根据权利要求33所述的方法,其中所述部分具有楔形形状。
35.根据权利要求33所述的方法,其中所述当前块的其余部分包括零变换系数。
36.根据权利要求35所述的方法,其中不在所述比特流中信令通知所述零变换系数。
37.根据权利要求22所述的方法,其中,基于所述当前块的部分中按扫描顺序的非零变换系数将所述当前块编解码在所述比特流中;
其中所述比特流符合格式规则;
其中所述格式规则定义所述比特流中表示所述扫描顺序的扫描顺序索引指示所述当前块的所述部分。
38.根据权利要求37所述的方法,其中所述扫描顺序包括以下至少一种:之字形扫描顺序、反向之字形扫描顺序、光栅扫描顺序或反向光栅扫描顺序。
39.根据权利要求37所述的方法,其中所述扫描顺序索引表示为二维坐标(scanX,scanY)。
40.根据权利要求37所述的方法,其中,在所述位置对应于大于所述扫描顺序索引的索引的情况下,所述当前块中的位置处的变换系数被视为零变换系数。
41.根据权利要求37所述的方法,其中,在所述位置对应于小于所述扫描顺序索引的索引的情况下,所述当前块中的位置处的变换系数被视为零变换系数。
42.根据权利要求37所述的方法,其中,在所述位置对应于大于所述扫描顺序索引的索引的情况下,所述当前块中的位置处的变换系数被视为非零变换系数。
43.根据权利要求37所述的方法,其中,在所述比特流中信令通知与等于或小于所述扫描顺序索引的索引相对应的位置中的所有变换系数。
44.根据权利要求37所述的方法,其中,在所述比特流中信令通知与等于或小于所述扫描顺序索引的索引相对应的位置中的所有变换系数的子集。
45.根据权利要求37所述的方法,其中包括零变换系数的所述当前块的其余部分基于视频单元的维度。
46.根据权利要求45所述的方法,其中所述视频单元包括编解码单元、图片单元、变换单元或块。
47.根据权利要求46所述的方法,其中使用具有一个或多个上下文模型的算术编解码方法对所述扫描顺序进行编解码。
48.根据权利要求37至47中任一项所述的方法,其中使用旁路编解码方法对所述扫描顺序进行编解码。
49.根据权利要求22所述的方法,其中,基于所述当前块的部分中按扫描顺序的非零变换系数将所述当前块编解码在所述比特流中;
其中,所述比特流符合格式规则;
其中,所述格式规则定义所述比特流中表示所述当前块中的特定位置的语法元素指示所述当前块的所述部分;并且
其中,所述当前块的所述部分还由与所述当前块中的所述特定位置相关联的特性来指示。
50.根据权利要求49所述的方法,其中所述特定位置用坐标(x,y)表示。
51.根据权利要求50所述的方法,其中所述坐标(x,y)对应于指示所述扫描顺序的扫描顺序索引,所述扫描顺序包括以下至少一种:对角线扫描顺序、之字形扫描顺序、反向之字形扫描顺序、或反向对角线扫描顺序。
52.根据权利要求49所述的方法,其中与所述特定位置相关联的特性包括穿过所述特定位置的直线的斜率。
53.根据权利要求52所述的方法,其中,在所述比特流中信令通知所述斜率。
54.根据权利要求53所述的方法,其中,在图片级、条带级、片级、片组级、编解码树单元级、编解码单元级、图片单元级或变换单元级信令通知所述斜率。
55.根据权利要求52所述的方法,其中,所述斜率是预定义的。
56.根据权利要求55所述的方法,其中所述斜率为45°或135°。
57.根据权利要求52所述的方法,其中,所述斜率基于视频单元的维度。
58.根据权利要求57所述的方法,其中所述视频单元包括编解码单元、图片单元、变换单元或块。
59.根据权利要求57所述的方法,其中,所述斜率基于所述视频单元的宽度和高度之间的比率。
60.根据权利要求59所述的方法,其中,所述斜率等于arctan(宽度/高度)、arctan(高度/宽度)、arctan-1(宽度/高度)或arctan-1(高度/宽度)。
61.根据权利要求52所述的方法,其中,所述斜率基于适用于所述当前块的预测模式,所述预测模式包括以下至少一种:帧内预测模式、帧间预测模式或仿射模式。
62.根据权利要求49所述的方法,其中与所述特定位置相关联的特性包括穿过所述特定位置的非线性线。
63.根据权利要求62所述的方法,其中,所述非线性线包括分段线性部分。
64.根据权利要求52所述的方法,其中,在所述线的第一侧的位置中的所有变换系数都被视为零变换系数。
65.根据权利要求64所述的方法,其中所述位置不与所述线重叠。
66.根据权利要求64所述的方法,其中所述第一侧包括所述线下方的一侧。
67.根据权利要求64所述的方法,其中,在所述线上的位置处的至少一个系数被视为零变换系数。
68.根据权利要求64所述的方法,其中,在所述位置位于所述扫描顺序中的位置之前的情况下,在所述线上的位置处的系数被视为零变换系数。
69.根据权利要求52所述的方法,其中,在所述比特流中信令通知所述线的第一侧的位置中的所有变换系数。
70.根据权利要求69所述的方法,其中所述位置不与所述线重叠。
71.根据权利要求69所述的方法,其中,在所述比特流中信令通知位于所述线上的位置处的至少一个系数。
72.根据权利要求49所述的方法,其中,在所述比特流中联合信令通知所述当前块的所述部分的右下角位置的x坐标和y坐标。
73.根据权利要求72所述的方法,其中,在所述比特流中将所述x坐标和所述y坐标信令通知为单个值。
74.根据权利要求72所述的方法,其中,按顺序在所述比特流中联合信令通知所述x坐标和所述y坐标。
75.根据权利要求74所述的方法,其中,基于所述x坐标的值信令通知所述y坐标。
76.根据权利要求74所述的方法,其中,基于所述y坐标的值信令通知所述x坐标。
77.根据权利要求74所述的方法,其中所述顺序是自适应可变的。
78.根据权利要求77所述的方法,其中,所述顺序基于所述当前块的特性变化,所述特性包括所述当前块的维度。
79.根据权利要求22所述的方法,其中,在所述比特流中信令通知所述当前块的编解码组是否包括非零变换系数的指示,并且其中,所述编解码组表示根据扫描顺序在所述转换期间要扫描的连续变换系数。
80.根据权利要求79所述的方法,其中所述扫描顺序包括以下至少一种:对角线扫描顺序、之字形扫描顺序、反向之字形扫描顺序、或反向对角线扫描顺序。
81.根据权利要求79所述的方法,其中,所述编解码组是根据所述扫描顺序、基于N个连续变换系数确定的,N是正整数。
82.根据权利要求79所述的方法,其中,所述编解码组是根据不同于所述扫描顺序的顺序、基于N个连续变换系数确定的,N是正整数。
83.根据权利要求79所述的方法,其中,所述当前块包括多个编解码组,并且其中,根据所述扫描顺序的第一编解码组从包括非零变换系数的最后位置开始。
84.根据权利要求79所述的方法,其中,所述当前块包括多个编解码组,并且其中,根据所述扫描顺序的至少第一编解码组或最后编解码组与其余编解码组相比具有不同数目的变换系数。
85.根据权利要求84所述的方法,其中,所述最后编解码组包括小于N个变换系数,并且所述其余编解码组中的每个包括N个变换系数,N是整数。
86.根据权利要求84的方法,其中,所述第一编解码组包括小于N个变换系数,并且其中,所述其余编解码组包括K×N个变换系数,K和N为非负整数。
87.根据权利要求79所述的方法,其中,所述当前块包括多个子块,每个子块具有sH行和sW列,并且其中,所述编解码组位于所述多个子块的子块内。
88.根据权利要求87所述的方法,其中,所述编解码组包括所述子块的所述sH行的每隔一行。
89.根据权利要求87所述的方法,其中,所述编解码组包括所述子块的所述sW列的每隔一列。
90.根据权利要求87所述的方法,其中,所述编解码组包括所述子块的整体。
91.根据权利要求87所述的方法,其中,所述子块基于棋盘图案被划分成两部分,并且其中,所述编解码组包括所述两部分的第一部分。
92.根据权利要求87所述的方法,其中,所述当前块的部分包括根据所述扫描顺序在所述转换期间要扫描的所述非零变换系数,并且其中,由于所述部分的维度不是所述子块的维度的整数倍,所述多个编解码组中的至少一个具有与所述子块的维度不同的维度。
93.根据权利要求92所述的方法,其中,位于所述当前块的所述部分的左边界或右边界处的编解码组具有小于所述子块的宽度的宽度。
94.根据权利要求92所述的方法,其中,位于所述当前块的所述部分的上边界或下边界处的编解码组具有小于所述子块的高度的高度。
95.根据权利要求87所述的方法,其中,所述当前块的部分包括根据所述扫描顺序在所述转换期间要扫描的所述非零变换系数,并且其中,在所述部分的维度不是所述子块的维度的整数倍的情况下,基于所述部分的放大区域被划分成多个编解码组。
96.根据权利要求95所述的方法,其中,所述放大区域具有是所述子块的维度的整数倍的维度。
97.根据权利要求95所述的方法,其中,所述放大区域的宽度与所述部分的宽度之间的差小于所述子块的宽度。
98.根据权利要求95所述的方法,其中,所述放大区域的高度与所述部分的高度之间的差小于所述子块的高度。
99.根据权利要求79所述的方法,其中N为8或16。
100.根据权利要求79所述的方法,其中,在所述编解码组仅包括零变换系数的情况下,所述零变换系数不包括在所述编解码组中的位置的所述比特流中。
101.根据权利要求89所述的方法,其中,所述编解码组仅用于所述非零变换系数的所述指示。
102.根据权利要求101所述的方法,其中所述编解码组保持不变。
103.根据权利要求79所述的方法,其中,使用具有一个或多个上下文模型的算术编解码方法对所述指示进行编码。
104.根据权利要求103所述的方法,其中,基于编解码组的先前指示确定上下文模型。
105.根据权利要求22所述的方法,其中,所述转换从所述比特流生成所述视频。
106.根据权利要求22所述的方法,其中,所述转换从所述视频生成所述比特流。
107.一种视频处理装置,其包括处理器,所述处理器被配置为实现权利要求22至106中任一项或多项所述的方法。
108.一种计算机可读介质,其上存储代码,当执行所述代码时,所述代码使处理器实现权利要求22至106中任一项或多项所述的方法。
CN202080059763.7A 2019-08-24 2020-08-24 残差系数编解码 Active CN114365492B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CNPCT/CN2019/102412 2019-08-24
CN2019102412 2019-08-24
PCT/CN2020/110780 WO2021036979A1 (en) 2019-08-24 2020-08-24 Residual coefficients coding

Publications (2)

Publication Number Publication Date
CN114365492A CN114365492A (zh) 2022-04-15
CN114365492B true CN114365492B (zh) 2023-12-15

Family

ID=74683720

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080059763.7A Active CN114365492B (zh) 2019-08-24 2020-08-24 残差系数编解码

Country Status (3)

Country Link
US (1) US20220182630A1 (zh)
CN (1) CN114365492B (zh)
WO (1) WO2021036979A1 (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104041040A (zh) * 2011-06-30 2014-09-10 华为技术有限公司 用于无损视频编码的预测残差编码
WO2018190594A1 (ko) * 2017-04-13 2018-10-18 엘지전자(주) 비디오 신호를 엔트로피 인코딩, 디코딩하는 방법 및 장치
EP3509301A1 (en) * 2016-08-31 2019-07-10 KT Corporation Method and device for processing video signal

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050206741A1 (en) * 2004-03-19 2005-09-22 Raber Gregory W Law enforcement vehicle surveillance system
US8861599B2 (en) * 2011-03-08 2014-10-14 Sony Corporation Context reduction for last transform position coding
US9491469B2 (en) * 2011-06-28 2016-11-08 Qualcomm Incorporated Coding of last significant transform coefficient
KR101965388B1 (ko) * 2011-11-04 2019-04-04 주식회사 골드피크이노베이션즈 양자화 계수 부/복호화 방법 및 이러한 방법을 사용하는 장치
WO2016206590A1 (en) * 2015-06-23 2016-12-29 Mediatek Singapore Pte. Ltd. Method and apparatus for transform coefficient coding of non-square blocks
EP3270595A1 (en) * 2016-07-15 2018-01-17 Thomson Licensing Method and apparatus for last coefficient coding for adaptive transform based video compression
US11477492B2 (en) * 2017-08-04 2022-10-18 Google Inc. Adaptation for entropy coding of blocks of image data

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104041040A (zh) * 2011-06-30 2014-09-10 华为技术有限公司 用于无损视频编码的预测残差编码
EP3509301A1 (en) * 2016-08-31 2019-07-10 KT Corporation Method and device for processing video signal
WO2018190594A1 (ko) * 2017-04-13 2018-10-18 엘지전자(주) 비디오 신호를 엔트로피 인코딩, 디코딩하는 방법 및 장치

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
CE7-related: coefficient scanning and last position coding for TUs of greater than 32 width or height (JVET-M0257);Muhammed Coban;Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11 13th Meeting: Marrakech, MA, 9–18 Jan. 2019;全文 *

Also Published As

Publication number Publication date
WO2021036979A1 (en) 2021-03-04
US20220182630A1 (en) 2022-06-09
CN114365492A (zh) 2022-04-15

Similar Documents

Publication Publication Date Title
CN113812162B (zh) 视频中的简化二次变换的上下文建模
JP7277616B2 (ja) ビデオ・データを処理する方法、装置及び記憶媒体
CN114208190A (zh) 视频编解码中缩减二次变换的矩阵的选择
WO2020259631A1 (en) Signaling coding of transform-skipped blocks
KR20180040515A (ko) 부호화 장치, 복호화 장치, 그 부호화 및 복호화 방법
CN117499661A (zh) 高精度图像和视频编解码的系数缩放
JP7323712B2 (ja) 画像およびビデオコーディングのための高精度変換および量子化
CN113966611B (zh) 视频编解码中的重要系数信令
CN114365492B (zh) 残差系数编解码
JP2024516358A (ja) 係数符号化・復号化方法、符号器、復号器及びコンピュータ記憶媒体

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant