CN111031316B

CN111031316B - 视频解码的方法和装置、计算机设备及存储介质

Info

Publication number: CN111031316B
Application number: CN201910932846.1A
Authority: CN
Inventors: 赵欣; 李翔; 刘杉
Original assignee: Tencent America LLC
Current assignee: Tencent America LLC
Priority date: 2018-10-09
Filing date: 2019-09-29
Publication date: 2023-03-24
Anticipated expiration: 2039-09-29
Also published as: CN111031316A; US10893286B2; US20200112734A1

Abstract

本申请实施例提供了视频解码的方法和装置、计算机设备及存储介质，该方法包括：确定一个块的至少一个参数是否小于或等于阈值；当确定所述块的至少一个参数小于或等于阈值时，发信号通知水平变换和垂直变换中的一个；当确定所述块的至少一个参数大于阈值时，将所述块分割成多个子块；在亮度分量上应用第一信令方案，在色度分量上应用第二信令方案，其中，该第一信令方案的最大块尺寸不同于所述第二信令方案的最大块尺寸；在该所述多个子块上分别执行多个变换中的一个；以及利用已执行所述变换的所述子块来解码视频流。

Description

视频解码的方法和装置、计算机设备及存储介质

通过引用并入本文

本申请要求于2018年10月9日提交的、申请号为62/743,536的美国临时申请、于2018年10月23日提交的、申请号为62/749,494的美国临时申请、于2018年12月27日提交的、申请号为62/785,679的美国临时申请、以及于2019年8月8日提交的、申请号为16/535,276的美国申请的优先权，其全部内容通过引用并入本申请中。

技术领域

本申请涉及视频编解码技术，特别涉及视频解码的方法和装置、计算机设备及存储介质。

背景技术

视频编码专家组ITU-T VCEG(Q6/16)与动态图像专家组ISO/IEC MPEG(JTC 1/SC29/WG 11)在2013年(版本1)、2014年(版本2)、2015年(版本3)和2016年(版本4)发布了H.265/HEVC(高效视频编码)标准。2015年，这两个标准化组织共同组建了联合视频探索组(JVET)，以探索开发超越HEVC的下一个视频编码标准的潜力。2017年10月，他们发布了联合呼吁，要求提出视频压缩能力超越HEVC的提案(CfP)。截至2018年2月15日，分别提交了22个关于标准动态范围(SDR)的CfP回复、12个关于高动态范围(HDR)的CfP回复和12个关于360视频类别的CfP回复。2018年4月，所有接收到的CfP回复都在122MPEG/第10次JVET会议上进行了评估。这次会议的结果是，JVET正式启动了超越HEVC的下一代视频编码的标准化进程。新标准被命名为通用视频编码(VVC)，JVET被更名为联合视频专家组。VVC测试模型(VTM)的一个版本是VTM3。

在HEVC中，利用表示为编码树的四叉树结构将编码树单元(CTU)分割成多个编码单元(CU)，以适应各种局部特性。使用帧间图片(时间)预测还是帧内图片(空间)预测来编码图片区域是在CU级别决定的。根据预测单元(PU)分割类型，每个CU可以进一步分割成一个、两个或四个PU。在一个PU内，应用相同的预测处理，并基于PU将相关信息发送给解码器。通过应用基于PU分割类型的预测处理而获得残差块之后，可以根据与CU的编码树类似的另一种四叉树结构将CU划分为多个变换单元(TU)。HEVC结构的关键特征之一是它具有多个分区概念，包括CU、PU和TU。在HEVC中，CU或变换单元(TU)只能是正方形，而PU可以为用于帧间预测块的正方形或矩形。在HEVC的后期阶段，提出了允许矩形PU用于帧内预测与变换。这些建议未被HEVC采用，但是却被扩展用于联合探索测试模型软件(JEM)。在图片边界处，HEVC采用隐式四叉树分割，使得块保持四叉树分割，直到尺寸符合图片边界。

在HEVC中，小块的帧间预测受到限制以减少运动补偿的存储器访问，这使得4×8块和8×4块不支持双向预测，而4×4块不支持帧间预测。在JEM的四叉树加二叉树(QTBT)中，这些限制被删除。

发明内容

本申请的实施例提供了视频解码的方法和装置、计算机设备及存储介质，旨在解决现有技术中没有针对较大尺寸的有效的DST-7/DCT-8方法，使得硬件实现成本较高的问题，以及解决JEVT中变换跳过模式仅应用于亮度分量不能应用于色度分量的问题。

根据本申请的实施例，提供了一种视频解码的方法，包括：

确定一个块的至少一个参数是否小于或等于阈值；

当确定所述块的至少一个参数小于或等于所述阈值时，发信号通知水平变换和垂直变换中的一个；

当确定所述块的至少一个参数大于所述阈值时，将所述块分割成多个子块；

在亮度分量上应用第一信令方案，在色度分量上应用第二信令方案，其中，所述第一信令方案的最大块尺寸不同于所述第二信令方案的最大块尺寸；

在所述多个子块上分别执行多个变换中的一个；以及

利用已执行所述变换的所述子块来解码视频流。

根据本申请的实施例，还提供了一种视频解码的装置，包括：

确定模块，用于确定一个块的至少一个参数是否小于或等于阈值；

通知模块，用于当确定所述块的至少一个参数小于或等于所述阈值时，发信号通知水平变换和垂直变换中的一个；

分割模块，用于当确定所述块的至少一个参数大于所述阈值时，将所述块分割成多个子块；

应用模块，用于在亮度分量上应用第一信令方案，在色度分量上应用第二信令方案，其中，所述第一信令方案的最大块尺寸不同于所述第二信令方案的最大块尺寸；

变换模块，用于在所述多个子块上分别执行多个变换中的一个；以及

解码模块，用于已执行所述变换的所述子块来解码视频流。

根据本申请的实施例，还提供了一种计算机设备，所述设备包括一个或多个处理器和一个或多个存储器，所述一个或多个存储器中存储有至少一条指令，所述至少一条指令由所述一个或多个处理器加载并执行以实现如上所述的视频解码的方法。

根据本申请的实施例，还提供了一种非易失性计算机可读存储介质，其存储指令，当所述指令由用于视频解码的计算机执行时，使得所述计算机执行用于视频解码的方法。

通过本申请的实施例，提出了针对较大尺寸的有效的DST-7/DCT-8方法，降低了硬件实现成本，而且变换跳过模式既可应用于亮度分量又可应用于色度分量。

附图说明

根据以下详细描述和附图，所公开的主题的其他特征、性质和各种优点将进一步明确，其中：

图1是根据本申请实施例的通信系统的简化框图。

图2是根据本申请实施例的视频编码器和解码器在流式传输环境中的放置方式示意图。

图3是根据本申请实施例的视频解码器的功能框图。

图4是根据本申请实施例的视频编码器的功能框图。

图5是根据本申请实施例的在HEVC和JEM中使用的帧内预测模式的示意图。

图6是根据本申请实施例的用于帧内方向模式的N个参考层的示意图。

图7是根据本申请实施例的一个4×4块内的(0，0)和(1，0)位置的权重的示意图。

图8是根据本申请实施例的局部照明补偿(LIC)的示意图。

图9A是根据本申请实施例的利用QTBT进行块分区的示意图。

图9B是根据本申请实施例的与图9A的块分区对应的树表示的示意图。

图10是根据本申请实施例的不同YUV格式的示意图。

图11是根据本申请实施例的视频解码的方法的流程图。

图12是根据本申请另一实施例的视频解码的方法的流程图。

图13是根据本申请实施例的MTS信令方案的流程图。

图14根据本申请实施例的计算机系统的示意图。

具体实施方式

在相关技术中，除了已经在HEVC中使用的DCT-II(离散余弦变换(DCT))和4×4DST-VII(离散正弦变换(DST))之外，多变换选择(MTS，或称为自适应多变换(AMT)，或称为增强多变换(EMT))方案被用于帧间和帧内编码块的残差编码。它使用从DCT/DST族中选定的、除HEVC中的当前变换之外的多个变换。新引入的变换矩阵是DST-VII、DCT-VIII、DST-I和DCT-V。下面的表1示出了选定的DST/DCT的基函数。

表1：用于N点输入的DCT-II/V/VIII和DST-I/VII的变换基函数

为了保持变换矩阵的正交性，使用10位表示而不是HEVC中的8位表示，可以比HEVC中的变换矩阵更精确地量化该变换矩阵。为了将变换系数的中间值保持在16位的范围内，在水平变换和垂直变换之后，与当前HEVC变换中使用的右移相比，所有系数再右移2位。

AMT应用于宽度和高度都小于或等于64的CU，并且可通过CU级别标志来控制是否应用AMT。当CU级别标志等于0时，在CU中应用DCT-II以对残差进行编码。对于启用AMT的CU内的亮度编码块，发信号通知两个附加标志以识别要使用的水平和垂直变换。与在HEVC中一样，可以在JEM中使用变换跳过模式对块的残差进行编码。为了避免语法编码的冗余，当CU级别AMT标志不等于零时，不发信号通知变换跳过标志。

对于帧内残差编码，由于不同的帧内预测模式具有不同的残差统计，因此可使用依赖于模式的变换候选选择过程。如表2所示定义了三个变换子集，并且如表3所示，基于帧内预测模式选择变换子集。

表2：三个预定义变换候选集

通过子集的概念，首先基于表2并使用CU的帧内预测模式来识别变换子集，其中CU级别AMT标志等于1。然后，对于水平变换和垂直变换中的每一个，根据表3并基于明确地用标志发出信号通知，从识别出的变换子集中选择两个变换候选中的一个。

表3：为每个帧内预测模式选择的水平(H)和垂直(V)变换集

然而，对于帧间预测残差，只有一个由DST-VII和DCT-VIII构成的变换集用于所有帧间模式以及水平和垂直变换。

在VVC中，只采用一个包括DST-VII和DCT-VIII的变换集，并且MTS应用于最多32点。

DCT-II核显示出对称/反对称特性，如下所示：

-特征#1：具有索引0、2、4……的偶数行与系数号N/2之前的对称点对称。

-特征#2：具有索引1、3、5、7……的奇数行与系数号N/2之前的对称点反对称。

此外，N点DCT-2核(由TN表示)是2N点DCT-2(由T2N表示)的一部分：

-特征#3：TNx,y＝T2Nx,2y，其中x、y＝0、1、……、N-1

基于上述对称/反对称特性(特征#1和特征#2)以及N点DCT-2和2N点DCT-2之间的关系(特征#3)，支持所谓的“部分蝶形”实施方式以减少运算计数(乘法、加法/减法、移位)的数量，并且使用部分蝶形可获得相同的矩阵乘法结果。

根据本文所描述的实施例，如果每个变换基是对称的或反对称的，并且N点变换是2N点变换的一部分，则将其称为“递归变换”。递归变换的示例有DCT-2、哈达玛变换(Hadamard transform)、DCT-1、DST-1、DST-2。对一个递归变换的变换基重新排序将导致另一个递归变换。

VVC草案版本2中MTS的相关语法和语义描述如下：

7.3.4.8变换单元语法

7.3.4.9.残差编码语法

/>

变换系数级别由阵列TransCoeffLevel[x0][y0][cIdx][xC][yC]表示。阵列索引x0和y0指定所考虑的变换块的左上亮度样本相对于图片的左上亮度样本的位置(x0，y0)。阵列索引cIdx指定颜色分量的指示符；对于Y，指示符等于0，对于编码块(Cb)，指示符等于1，对于Cr，指示符等于2。阵列索引xC和yC指定当前变换块内的变换系数位置(xC，yC)。当7.3.4.8节中未指定TransCoeffLevel[x0][y0][cIdx][xC][yC]的值时，推断该值等于0。

等于1的tu_cbf_luma[x0][y0]指定亮度变换块包含一个或多个不等于0的变换系数级别。阵列索引x0和y0指定所考虑的变换块的左上亮度样本相对于图片的左上亮度样本的位置(x0，y0)。

当tu_cbf_luma[x0][y0]不存在时，推断其值等于0。

等于1的tu_cbf_cb[x0][y0]指定Cb变换块包含一个或多个不等于0的变换系数级别。阵列索引x0和y0指定所考虑的变换块的左上位置(x0，y0)。阵列索引trafoDepth指定编码块的当前细分级别为块，以进行变换编码。对于与编码块对应的块，trafoDepth等于0。

当tu_cbf_cb[x0][y0]不存在时，推断其值等于0。

等于1的tu_cbf_cr[x0][y0]指定Cr变换块包含一个或多个不等于0的变换系数级别。阵列索引x0和y0指定所考虑的变换块的左上位置(x0，y0)。阵列索引trafoDepth指定编码块的当前细分级别为块，以进行变换编码。对于与编码块对应的块，trafoDepth等于0。

当tu_cbf_cr[x0][y0]不存在时，推断其值等于0。

等于1的cu_mts_flag[x0][y0]指定将多变换选择应用于相关联的亮度变换块的残差样本。等于0的cu_mts_flag[x0][y0]指定多变换选择不用于相关联的亮度变换块的残差样本。阵列索引x0和y0指定所考虑的变换块的左上亮度样本相对于图片的左上亮度样本的位置(x0，y0)。

当cu_mts_flag[x0][y0]不存在时，推断其值等于0。

阵列AbsLevel[xC][yC]表示当前变换块的变换系数级别的绝对值的阵列，阵列AbsLevelPass1[xC][yC]表示当前变换块的变换系数级别的部分重建绝对值的阵列。阵列索引xC和yC指定当前变换块内的变换系数位置(xC，yC)。当7.3.4.8节中未指定AbsLevel[xC][yC]的值时，推断该值等于0。当7.3.4.8节中未指定AbsLevelPass1[xC][yC]的值时，推断该值等于0。

指定最小变换系数值和最大变换系数值的变量CoeffMin和变量CoeffMax导出如下：

CoeffMin＝-(1<<15)

CoeffMax＝(1<<15)-1

阵列QStateTransTable[][]指定如下：

QStateTransTable[][]＝{{0,2},{2,0},{1,3},{3,1}}

transform_skip_flag[x0][y0][cIdx]指定是否将变换应用于相关联的变换块。阵列索引x0和y0指定所考虑的变换块的左上亮度样本相对于图片的左上亮度样本的位置(x0，y0)。阵列索引cIdx指定颜色分量的指示符；对于亮度，指示符等于0，对于Cb，指示符等于1，对于Cr，指示符等于2。等于1的transform_skip_flag[x0][y0][cIdx]指定没有变换应用于当前变换块。等于0的transform_skip_flag[x0][y0][cIdx]指定是否将变换应用于当前变换块取决于其它语法元素。当transform_skip_flag[x0][y0][cIdx]不存在时，推断其值等于0。

last_sig_coeff_x_prefix指定变换块内的按扫描顺序排列的最后一个有效系数的列位置的前缀。last_sig_coeff_x_prefix的值应该在0到(log2TbWidth<<1)-1的范围内(包括0和(log2TbWidth<<1)-1)。

last_sig_coeff_y_prefix指定变换块内的按扫描顺序排列的最后一个有效系数的行位置的前缀。last_sig_coeff_y_prefix的值应该在0到(log2TbHeight<<1)-1的范围内(包括0和(log2TbHeight<<1)-1)。

last_sig_coeff_x_suffix指定变换块内的按扫描顺序排列的最后一个有效系数的列位置的后缀。last_sig_coeff_x_suffix的值应该在0到(1<<((last_sig_coeff_x_prefix>>1)-1))-1的范围内(包括0和(1<<((last_sig_coeff_x_prefix>>1)-1))-1)。

变换块内按扫描顺序排列的最后一个有效系数的列位置LastSignificantCoeffX导出如下：

-如果last_sig_coeff_x_suffix不存在，则以下命令适用：

LastSignificantCoeffX＝last_sig_coeff_x_prefix

-否则(last_sig_coeff_x_suffix存在)，则以下命令适用：

LastSignificantCoeffX＝(1<<((last_sig_coeff_x_prefix>>1)-1))*(2+(last_sig_coeff_x_prefix&1))+last_sig_coeff_x_suffix。

coeff_sign_flag[n]按如下指定扫描位置n的变换系数级别的符号：

如果coeff_sign_flag[n]等于0，则相应的变换系数级别具有正值。

否则(coeff_sign_flag[n]等于1)，则相应的变换系数级别具有负值。

当coeff_sign_flag[n]不存在时，推断其值等于0。

mts_idx[x0][y0]指定沿当前变换块的水平和垂直方向将哪些变换核应用于亮度残差样本。阵列索引x0和y0指定所考虑的变换块的左上亮度样本相对于图片的左上亮度样本的位置(x0，y0)。

当mts_idx[x0][y0]不存在时，推断其值等于-1。

在VVC中，应用变换跳过(TS)模式以对帧内和帧间预测残差进行编码。对于具有小于或等于16个样本的编码块(亮度和色度)，发信号通知标志以指示是否将TS模式应用于当前块。当应用TS模式时，每个模块的详细修改如下所示。

预测：无变化。

变换：跳过。相反，对于变换跳过TU，使用简单的缩放处理。为了使变换跳过系数具有与其它变换系数相似的量值，执行按比例缩小处理，并且缩放因子与相同尺寸的其它变换(相对于具有范数1的标准浮点变换)相关联的缩放相同。

去量化和缩放：无变化。

熵编码：发信号通知标志以指示是否绕过变换。

解块、SAO和ALF：无变化。

SPS中的标志，用于指示是否启用变换跳过。

VVC草案版本2中TS模式的相关规范文本描述如下：

7.3.4.9残差编码语法

阵列AbsLeve1[xC][yC]表示当前变换块的变换系数级别的绝对值的阵列，阵列AbsLevelPass1[xC][yC]表示当前变换块的变换系数级别的部分重建绝对值的阵列。阵列索引xC和yC指定当前变换块内的变换系数位置(xC，yC)。当7.3.4.8节中未指定AbsLevel[xC][yC]的值时，推断该值等于0。当7.3.4.8节中未指定AbsLevelPass1[xC][yC]的值时，推断该值等于0。

-CoeffMin＝-(1<<15)

-CoeffMax＝(1<<15)-1

阵列QStateTransTable[][]被指定如下：

-QStateTransTable[][]＝{{0,2},{2,0},{1,3},{3,1}}

last_sig_coeff_x_prefix指定变换块内按扫描顺序排列的最后一个有效系数的列位置的前缀。last_sig_coeff_x_prefix的值应该在0到(log2TbWidth<<1)-1的范围内(包括0和(log2TbWidth<<1)-1)。

对于缩放和变换过程，此过程的输入是：

-指定当前亮度变换块左上样本相对于当前图片的左上亮度样本的亮度位置(xTbY，yTbY)，

-指定当前块的颜色分量的变量cIdx，

-指定变换块宽度的变量nTbW，

-指定变换块高度的变量nTbH。

该过程的输出是残差样本resSamples[x][y]的(nTbW)×(nTbH)阵列，其中x＝0…nTbW-1,y＝0…nTbH-1。变量bitDepth、变量bdShift和变量tsShift导出如下：

bitDepth＝(cIdx＝＝0)？BitDepthY:BitDepthC

bdShift＝Max(22-bitDepth,0)

tsShift＝5+((Log2(nTbW)+Log2(nTbH))/2)

残差样本resSamples的(nTbW)×(nTbH)阵列导出如下：

1.使用变换块位置(xTbY，yTbY)、变换宽度nTbW和变换高度nTbH、颜色分量变量cIdx和当前颜色分量bitDepth的比特深度作为输入来调用8.3.3节中指定的变换系数的缩放过程，并且输出是缩放变换系数d的(nTbW)x(nTbH)阵列。

2.残差样本r的(nTbW)×(nTbH)阵列导出如下：

-如果transform_skip_flag[xTbY][yTbY][cIdx]等于1，则残差样本阵列值r[x][y]导出如下，其中x＝0…nTbW-1，y＝0…nTbH-1：

r[x][y]＝d[x][y]<<tsShift

-否则(transform_skip_flag[xTbY][yTbY][cIdx]等于0)，使用变换块位置(xTbY，yTbY)、变换宽度nTbW和变换高度nTbH、颜色分量变量cIdx和缩放变换系数d的(nTbW)×(nTbH)阵列作为输入来调用8.3.4.1节中指定的缩放变换系数的变换过程，并且输出是残差样本r的(nTbW)×(nTbH)阵列。

3.残差样本resSamples[x][y]导出如下，其中x＝0…nTbW-1，y＝0…nTbH-1：

resSamples[x][y]＝(r[x][y]+(1<<(bdShift-1)))>>bdShift

此外，在HEVC中，主变换是4点、8点、16点和32点DCT-2，并且变换核矩阵用8位整数来表示，即8位变换核。较小的DCT-2的变换核矩阵是较大的DCT-2的一部分，如下所示：

4×4变换

{64,64,64,64}

{83,36,-36,-83}

{64,-64,-64,64}

{36,-83,83,-36}

8×8变换

{64,64,64,64,64,64,64,64}

{89,75,50,18,-18,-50,-75,-89}

{83,36,-36,-83,-83,-36,36,83}

{75,-18,-89,-50,50,89,18,-75}

{64,-64,-64,64,64,-64,-64,64}

{50,-89,18,75,-75,-18,89,-50}

{36,-83,83,-36,-36,83,-83,36}

{18,-50,75,-89,89,-75,50,-18}

16×16变换

32×32变换

DCT-2核显示出对称/反对称特性，因此支持所谓的“部分蝶形”实施方式以减少运算计数(乘法、加法/减法、移位)的数量，并且使用部分蝶形可获得相同的矩阵乘法结果。

在当前的VVC中，除了与HEVC相同的4点、8点、16点和32点DCT-2变换之外，还包括附加的2点和64点DCT-2。

在VVC中定义的64点DCT-2核示出为如下的64×64矩阵，

/>

/>

/>

其中

{aa,ab,ac,ad,ae,af,ag,ah,ai,aj,ak,al,am,an,ao,ap,aq,ar,as,at,au,av,aw,ax,ay,az,ba,bb,bc,bd，be，bf，bg，bh，bi，bj，bk，bl，bm，bn，bo，bp，bq，br，bs，bt，bu，bv，bw，bx，by，bz，ca，cb，cc，cd，ce，cf，cg，ch，ci，cj，ck}＝

{64，83，36，89，75，50，18，90，87，80，70，57，43，25，9，90，90，88，85，82，78，73，67，61，54，46，38，31，22，13，4，91，90，90，90，88，87，86，84，83，81，79，77，73，71，69，65，62，59，56，52，48，44，41，37，33，28，24，20，15，11，7，2}

除了已经在HEVC中使用的DCT-2和4×4DST-7之外，自适应多变换(AMT，或称为增强多变换(EMT)，或称为多变换选择(MTS))方案已经在VVC中用于帧间和帧内编码块的残差编码。它使用从DCT/DST族中选定的、除HEVC中的当前变换之外的多个变换。新引入的变换矩阵是DST-7、DCT-8。表1示出了选定的DST/DCT的基函数，例如DCT-2、DCT-8和DST-7。应当理解，罗马数字和阿拉伯数字在本文中是可互换的。

VVC中的所有主变换矩阵与8位标识一起使用。AMT应用于宽度和高度都小于或等于32的CU，并且是否应用AMT由名为mts_flag的标志控制。当mrs_flag等于0时，仅采用DCT-2对残差进行编码。当mts_flag等于1时，根据表2，使用2个bin进一步发信号通知索引mts_idx以识别要使用的水平和垂直变换，其中值1表示使用DST-7，值2表示使用DCT-8。

表2：trTypeHor和trTypeVer的规范取决于mts_idx[x][y][cldx]

mts_idx[xTbY][yTbY][cIdx]	trTypeHor	trTypeVer
			-1	0	0
0	1	1
			1	2	1
2	1	2
			3	2	2

DST-7的变换核是由基矢量构成的矩阵，也可以表示如下：

4点DST-7：

{a，b，c，d}

{c，c，0，-c}

{d，-a，-c，b}

{b，-d，c，-a}

其中，{a，b，c，d}＝{29，55，74，84}

8点DST-7：

{a，b，c，d，e，f，g，h，}

{c，f，h，e，b，-a，-d，-g，}

{e，g，b，-c，-h，-d，a，f，}

{g，c，-d，-f，a，h，b，-e，}

{h，-a，-g，b，f，-c，-e，d，}

{f，-e，-a，g，-d，-b，h，-c，}

{d,-h,e,-a,-c,g,-f,b,}

{b,-d,f,-h,g,-e,c,-a,}

其中，{a,b,c,d,e,f,g,h}＝{17,32,46,60,71,78,85,86}

16点DST-7：

{a,b,c,d,e,f,g,h,i,j,k,l,m,n,o,p,}

{c,f,i,l,o,o,l,i,f,c,0,-c,-f,-i,-l,-o,}

{e,j,o,m,h,c,-b,-g,-l,-p,-k,-f,-a,d,i,n,}

{g,n,l,e,-b,-i,-p,-j,-c,d,k,o,h,a,-f,-m,}

{i,o,f,-c,-l,-l,-c,f,o,i,0,-i,-o,-f,c,l,}

{k,k,0,-k,-k,0,k,k,0,-k,-k,0,k,k,0,-k,}

{m,g,-f,-n,-a,l,h,-e,-o,-b,k,i,-d,-p,-c,j,}

{o,c,-l,-f,i,i,-f,-l,c,o,0,-o,-c,l,f,-i,}

{p,-a,-o,b,n,-c,-m,d,l,-e,-k,f,j,-g,-i,h,}

{n,-e,-i,j,d,-o,a,m,-f,-h,k,c,-p,b,l,-g,}

{l,-i,-c,o,-f,-f,o,-c,-i,l,0,-l,i,c,-o,f,}

{j,-m,c,g,-p,f,d,-n,i,a,-k,l,-b,-h,o,-e,}

{h,-p,i,-a,-g,o,-j,b,f,-n,k,-c,-e,m,-l,d,}

{f,-l,o,-i,c,c,-i,o,-l,f,0,-f,l,-o,i,-c,}

{d,-h,l,-p,m,-i,e,-a,-c,g,-k,o,-n,j,-f,b,}

{b,-d,f,-h,j,-l,n,-p,o,-m,k,-i,g,-e,c,-a,}

其中，{a,b,c,d,e,f,g,h,i,j,k,l,m,n,o,p}＝{9,17,25,33,41,49,56,62,66,72,77,81,83,87,89,90}

32点DST-7：

{a,b,c,d,e,f,g,h,i,j,k,l,m,n,o,p,q,r,s,t,u,v,w,x,y,z,A,B,C,D,E,F,}

{c,f,i,l,o,r,u,x,A,D,F,C,z,w,t,q,n,k,h,e,b,-a,-d,-g,-j,-m,-p,-s,-v,-y,-B,-E,}

{e,j,o,t,y,D,D,y,t,o,j,e,0,-e,-j,-o,-t,-y,-D,-D,-y,-t,-o,-j,-e,0,e,j,o,t,y,D,}

{g,n,u,B,D,w,p,i,b,-e,-l,-s,-z,-F,-y,-r,-k,-d,c,j,q,x,E,A,t,m,f,-a,-h,-o,-v,-C,}

{i,r,A,C,t,k,b,-g,-p,-y,-E,-v,-m,-d,e,n,w,F,x,o,f,-c,-l,-u,-D,-z,-q,-h,a,j,s,B,}

{k,v,F,u,j,-a,-l,-w,-E,-t,-i,b,m,x,D,s,h,-c,-n,-y,-C,-r,-g,d,o,z,B,q,f,-e,-p,-A,}

{m,z,z,m,0,-m,-z,-z,-m,0,m,z,z,m,0,-m,-z,-z,-m,0,m,z,z,m,0,-m,-z,-z,-m,0,m,z,}

{o,D,t,e,-j,-y,-y,-j,e,t,D,o,0,-o,-D,-t,-e,j,y,y,j,-e,-t,-D,-o,0,o,D,t,e,-j,-y,}

{q,E,n,-c,-t,-B,-k,f,w,y,h,-i,-z,-v,-e,l,C,s,b,-o,-F,-p,a,r,D,m,-d,-u,-A,-j,g,x,}

{s,A,h,-k,-D,-p,c,v,x,e,-n,-F,-m,f,y,u,b,-q,-C,-j,i,B,r,-a,-t,-z,-g,l,E,o,-d,-w,}

{u,w,b,-s,-y,-d,q,A,f,-o,-C,-h,m,E,j,-k,-F,-l,i,D,n,-g,-B,-p,e,z,r,-c,-x,-t,a,v,}

{w,s,-d,-A,-o,h,E,k,-l,-D,-g,p,z,c,-t,-v,a,x,r,-e,-B,-n,i,F,j,-m,-C,-f,q,y,b,-u,}

{y,o,-j,-D,-e,t,t,-e,-D,-j,o,y,0,-y,-o,j,D,e,-t,-t,e,D,j,-o,-y,0,y,o,-j,-D,-e,t,}

{A,k,-p,-v,e,F,f,-u,-q,j,B,a,-z,-l,o,w,-d,-E,-g,t,r,-i,-C,-b,y,m,-n,-x,c,D,h,-s,}

{C,g,-v,-n,o,u,-h,-B,a,D,f,-w,-m,p,t,-i,-A,b,E,e,-x,-l,q,s,-j,-z,c,F,d,-y,-k,r,}

{E,c,-B,-f,y,i,-v,-l,s,o,-p,-r,m,u,-j,-x,g,A,-d,-D,a,F,b,-C,-e,z,h,-w,-k,t,n,-q,}

{F,-a,-E,b,D,-c,-C,d,B,-e,-A,f,z,-g,-y,h,x,-i,-w,j,v,-k,-u,l,t,-m,-s,n,r,-o,-q,p,}

{D,-e,-y,j,t,-o,-o,t,j,-y,-e,D,0,-D,e,y,-j,-t,o,o,-t,-j,y,e,-D,0,D,-e,-y,j,t,-o,}

{B,-i,-s,r,j,-A,-a,C,-h,-t,q,k,-z,-b,D,-g,-u,p,l,-y,-c,E,-f,-v,o,m,-x,-d,F,-e,-w,n,}

{z,-m,-m,z,0,-z,m,m,-z,0,z,-m,-m,z,0,-z,m,m,-z,0,z,-m,-m,z,0,-z,m,m,-z,0,z,-m,}

{x,-q,-g,E,-j,-n,A,-c,-u,t,d,-B,m,k,-D,f,r,-w,-a,y,-p,-h,F,-i,-o,z,-b,-v,s,e,-C,l,}

{v,-u,-a,w,-t,-b,x,-s,-c,y,-r,-d,z,-q,-e,A,-p,-f,B,-o,-g,C,-n,-h,D,-m,-i,E,-l,-j,F,-k,}

{t,-y,e,o,-D,j,j,-D,o,e,-y,t,0,-t,y,-e,-o,D,-j,-j,D,-o,-e,y,-t,0,t,-y,e,o,-D,j,}

{r,-C,k,g,-y,v,-d,-n,F,-o,-c,u,-z,h,j,-B,s,-a,-q,D,-l,-f,x,-w,e,m,-E,p,b,-t,A,-i,}

{p,-F,q,-a,-o,E,-r,b,n,-D,s,-c,-m,C,-t,d,l,-B,u,-e,-k,A,-v,f,j,-z,w,-g,-i,y,-x,h,}

{n,-B,w,-i,-e,s,-F,r,-d,-j,x,-A,m,a,-o,C,-v,h,f,-t,E,-q,c,k,-y,z,-l,-b,p,-D,u,-g,}

{l,-x,C,-q,e,g,-s,E,-v,j,b,-n,z,-A,o,-c,-i,u,-F,t,-h,-d,p,-B,y,-m,a,k,-w,D,-r,f,}

{j,-t,D,-y,o,-e,-e,o,-y,D,-t,j,0,-j,t,-D,y,-o,e,e,-o,y,-D,t,-j,0,j,-t,D,-y,o,-e,}

{h,-p,x,-F,y,-q,i,-a,-g,o,-w,E,-z,r,-j,b,f,-n,v,-D,A,-s,k,-c,-e,m,-u,C,-B,t,-l,d,}

{f,-l,r,-x,D,-C,w,-q,k,-e,-a,g,-m,s,-y,E,-B,v,-p,j,-d,-b,h,-n,t,-z,F,-A,u,-o,i,-c,}

{d,-h,l,-p,t,-x,B,-F,C,-y,u,-q,m,-i,e,-a,-c,g,-k,o,-s,w,-A,E,-D,z,-v,r,-n,j,-f,b,}

{b,-d,f,-h,j,-l,n,-p,r,-t,v,-x,z,-B,D,-F,E,-C,A,-y,w,-u,s,-q,o,-m,k,-i,g,-e,c,-a,}

其中，{a,b,c,d,e,f,g,h,i,j,k,l,m,n,o,p,q,r,s,t,u,v,w,x,y,z,A,B,C,D,E,F}＝{4,9,13,17,21,26,30,34,38,42,45,50,53,56,60,63,66,68,72,74,77,78,80,82,84,85,86,88,88,89,90,90}

4点DCT-8：

{a,b,c,d,}

{b,0,-b,-b,}

{c,-b,-d,a,}

{d,-b,a,-c,}

其中，{a,b,c,d}＝{84,74,55,29}

8点DCT-8：

{a,b,c,d,e,f,g,h,}

{b,e,h,-g,-d,-a,-c,-f,}

{c,h,-e,-a,-f,g,b,d,}

{d,-g,-a,-h,c,e,-f,-b,}

{e,-d,-f,c,g,-b,-h,a,}

{f,-a,g,e,-b,h,d,-c,}

{g,-c,b,-f,-h,d,-a,e,}

{h,-f,d,-b,a,-c,e,-g,}

其中，{a,b,c,d,e,f,g,h}＝{86,85,78,71,60,46,32,17}

16点DCT-8：

{a,b,c,d,e,f,g,h,i,j,k,l,m,n,o,p,}

{b,e,h,k,n,0,-n,-k,-h,-e,-b,-b,-e,-h,-k,-n,}

{c,h,m,-p,-k,-f,-a,-e,-j,-o,n,i,d,b,g,l,}

{d,k,-p,-i,-b,-f,-m,n,g,a,h,o,-l,-e,-c,-j,}

{e,n,-k,-b,-h,0,h,b,k,-n,-e,-e,-n,k,b,h,}

{f,0,-f,-f,0,f,f,0,-f,-f,0,f,f,0,-f,-f,}

{g,-n,-a,-m,h,f,-o,-b,-l,i,e,-p,-c,-k,j,d,}

{h,-k,-e,n,b,0,-b,-n,e,k,-h,-h,k,e,-n,-b,}

{i,-h,-j,g,k,-f,-l,e,m,-d,-n,c,o,-b,-p,a,}

{j,-e,-o,a,-n,-f,i,k,-d,-p,b,-m,-g,h,l,-c,}

{k,-b,n,h,-e,0,e,-h,-n,b,-k,-k,b,-n,-h,e,}

{l,-b,i,o,-e,f,-p,-h,c,-m,-k,a,-j,-n,d,-g,}

{m,-e,d,-l,-n,f,-c,k,o,-g,b,-j,-p,h,-a,i,}

{n,-h,b,-e,k,0,-k,e,-b,h,-n,-n,h,-b,e,-k,}

{o,-k,g,-c,b,-f,j,-n,-p,l,-h,d,-a,e,-i,m,}

{p,-n,l,-j,h,-f,d,-b,a,-c,e,-g,i,-k,m,-o,}

其中，{a,b,c,d,e,f,g,h,i,j,k,l,m,n,o,p}＝{90,89,87,83,81,77,72,66,62,56,49,41,33,25,17,9}

32点DCT-8：

{a,b,c,d,e,f,g,h,i,j,k,l,m,n,o,p,q,r,s,t,u,v,w,x,y,z,A,B,C,D,E,F,}

{b,e,h,k,n,q,t,w,z,C,F,-E,-B,-y,-v,-s,-p,-m,-j,-g,-d,-a,-c,-f,-i,-l,-o,-r,-u,-x,-A,-D,}

{c,h,m,r,w,B,0,-B,-w,-r,-m,-h,-c,-c,-h,-m,-r,-w,-B,0,B,w,r,m,h,c,c,h,m,r,w,B,}

{d,k,r,y,F,-A,-t,-m,-f,-b,-i,-p,-w,-D,C,v,o,h,a,g,n,u,B,-E,-x,-q,-j,-c,-e,-l,-s,-z,}

{e,n,w,F,-y,-p,-g,-c,-l,-u,-D,A,r,i,a,j,s,B,-C,-t,-k,-b,-h,-q,-z,E,v,m,d,f,o,x,}

{f,q,B,-A,-p,-e,-g,-r,-C,z,o,d,h,s,D,-y,-n,-c,-i,-t,-E,x,m,b,j,u,F,-w,-l,-a,-k,-v,}

{g,t,0,-t,-g,-g,-t,0,t,g,g,t,0,-t,-g,-g,-t,0,t,g,g,t,0,-t,-g,-g,-t,0,t,g,g,t,}

{h,w,-B,-m,-c,-r,0,r,c,m,B,-w,-h,-h,-w,B,m,c,r,0,-r,-c,-m,-B,w,h,h,w,-B,-m,-c,-r,}

{i,z,-w,-f,-l,-C,t,c,o,F,-q,-a,-r,E,n,d,u,-B,-k,-g,-x,y,h,j,A,-v,-e,-m,-D,s,b,p,}

{j,C,-r,-b,-u,z,g,m,F,-o,-e,-x,w,d,p,-E,-l,-h,-A,t,a,s,-B,-i,-k,-D,q,c,v,-y,-f,-n,}

{k,F,-m,-i,-D,o,g,B,-q,-e,-z,s,c,x,-u,-a,-v,w,b,t,-y,-d,-r,A,f,p,-C,-h,-n,E,j,l,}

{l,-E,-h,-p,A,d,t,-w,-a,-x,s,e,B,-o,-i,-F,k,m,-D,-g,-q,z,c,u,-v,-b,-y,r,f,C,-n,-j,}

{m,-B,-c,-w,r,h,0,-h,-r,w,c,B,-m,-m,B,c,w,-r,-h,0,h,r,-w,-c,-B,m,m,-B,-c,-w,r,h,}

{n,-y,-c,-D,i,s,-t,-h,E,d,x,-o,-m,z,b,C,-j,-r,u,g,-F,-e,-w,p,l,-A,-a,-B,k,q,-v,-f,}

{o,-v,-h,C,a,D,-g,-w,n,p,-u,-i,B,b,E,-f,-x,m,q,-t,-j,A,c,F,-e,-y,l,r,-s,-k,z,d,}

{p,-s,-m,v,j,-y,-g,B,d,-E,-a,-F,c,C,-f,-z,i,w,-l,-t,o,q,-r,-n,u,k,-x,-h,A,e,-D,-b,}

{q,-p,-r,o,s,-n,-t,m,u,-l,-v,k,w,-j,-x,i,y,-h,-z,g,A,-f,-B,e,C,-d,-D,c,E,-b,-F,a,}

{r,-m,-w,h,B,-c,0,c,-B,-h,w,m,-r,-r,m,w,-h,-B,c,0,-c,B,h,-w,-m,r,r,-m,-w,h,B,-c,}

{s,-j,-B,a,-C,-i,t,r,-k,-A,b,-D,-h,u,q,-l,-z,c,-E,-g,v,p,-m,-y,d,-F,-f,w,o,-n,-x,e,}

{t,-g,0,g,-t,-t,g,0,-g,t,t,-g,0,g,-t,-t,g,0,-g,t,t,-g,0,g,-t,-t,g,0,-g,t,t,-g,}

{u,-d,B,n,-k,-E,g,-r,-x,a,-y,-q,h,-F,-j,o,A,-c,v,t,-e,C,m,-l,-D,f,-s,-w,b,-z,-p,i,}

{v,-a,w,u,-b,x,t,-c,y,s,-d,z,r,-e,A,q,-f,B,p,-g,C,o,-h,D,n,-i,E,m,-j,F,l,-k,}

{w,-c,r,B,-h,m,0,-m,h,-B,-r,c,-w,-w,c,-r,-B,h,-m,0,m,-h,B,r,-c,w,w,-c,r,B,-h,m,}

{x,-f,m,-E,-q,b,-t,-B,j,-i,A,u,-c,p,F,-n,e,-w,-y,g,-l,D,r,-a,s,C,-k,h,-z,-v,d,-o,}

{y,-i,h,-x,-z,j,-g,w,A,-k,f,-v,-B,l,-e,u,C,-m,d,-t,-D,n,-c,s,E,-o,b,-r,-F,p,-a,q,}

{z,-l,c,-q,E,u,-g,h,-v,-D,p,-b,m,-A,-y,k,-d,r,-F,-t,f,-i,w,C,-o,a,-n,B,x,-j,e,-s,}

{A,-o,c,-j,v,F,-t,h,-e,q,-C,-y,m,-a,l,-x,-D,r,-f,g,-s,E,w,-k,b,-n,z,B,-p,d,-i,u,}

{B,-r,h,-c,m,-w,0,w,-m,c,-h,r,-B,-B,r,-h,c,-m,w,0,-w,m,-c,h,-r,B,B,-r,h,-c,m,-w,}

{C,-u,m,-e,d,-l,t,-B,-D,v,-n,f,-c,k,-s,A,E,-w,o,-g,b,-j,r,-z,-F,x,-p,h,-a,i,-q,y,}

{D,-x,r,-l,f,-a,g,-m,s,-y,E,C,-w,q,-k,e,-b,h,-n,t,-z,F,B,-v,p,-j,d,-c,i,-o,u,-A,}

{E,-A,w,-s,o,-k,g,-c,b,-f,j,-n,r,-v,z,-D,-F,B,-x,t,-p,l,-h,d,-a,e,-i,m,-q,u,-y,C,}

{F,-D,B,-z,x,-v,t,-r,p,-n,l,-j,h,-f,d,-b,a,-c,e,-g,i,-k,m,-o,q,-s,u,-w,y,-A,C,-E,}

其中，{a,b,c,d,e,f,g,h,i,j,k,l,m,n,o,p,q,r,s,t,u,v,w,x,y,z,A,B,C,D,E,F}＝{90,90,89,88,88,86,85,84,82,80,78,77,74,72,68,66,63,60,56,53,50,45,42,38,34,30,26,21,17,13,9,4}

在VVC中，对于色度分量，不使用MTS而仅使用DCT-2。此外，对于色度分量，变换尺寸包括2-pt、4-pt、8-pt、16-pt和32-pt。

在VVC中，当编码块的高度和宽度均小于或等于64时，变换尺寸始终与编码块尺寸相同。当编码块的高度或宽度大于64时，在进行变换或帧内预测时，编码块进一步被分割成多个子块，其中每个子块的宽度和高度都小于或等于64，并且对每个子块执行一次变换。

例如，在申请号为62/731,773的美国临时申请(其全部内容通过引用并入本文)和提议JVET-L0289“CE6相关：变换跳过模式与MTS的统一”中，使用恒等变换方案来协调变换跳过与MTS。

N点恒等变换(IDT)是使用N×N变换核的线性变换过程，其沿对角线位置仅具有非零系数，对角线位置指的是具有相等的水平和垂直坐标值的位置。

在JVET-L0289中，建议用4点IDT代替4点DCT-8，并将TS模式的语法合并到MTS中。4点IDT利用以下变换核以与当前的10比特变换实现一致。然而，8位变换核也可直接实现，其简单地将512替换为128。

{512 0 0 0}

{0 512 0 0}

{0 0 512 0}

{0 0 0 512}

应当注意，上述4点IDT可以仅通过4次移位操作来实现。利用所建议的方法，量化被统一到MTS的量化。所建议的IDT仅适用于亮度分量。

多假设帧内-帧间预测(或即帧内-帧间预测模式)将一个帧内预测和一个合并索引预测进行组合，即帧内-帧间预测模式。在合并CU中，发信号通知一个标志用于合并模式，以在标志为真时从帧内候选列表中选择帧内模式。对于亮度分量，帧内候选列表从包括DC、平面、水平和垂直模式的4种帧内预测模式导出，并且帧内候选列表的大小可以是3或4，这取决于块形状。当CU宽度大于CU高度的两倍时，从帧内模式列表中移除水平模式，并且当CU高度大于CU宽度的两倍时，从帧内模式列表中移除垂直模式。使用加权平均来对由帧内模式索引选择的一个帧内预测模式和由合并索引选择的一个合并索引预测进行组合。对于色度分量，总是在没有额外信令的情况下应用DM。

用于组合预测的权重描述如下。当选择DC模式或平面模式、或者编码块(CB)的宽度或高度小于4时，应用相等的权重。对于CB宽度和高度都大于或等于4的CB，当选择水平/垂直模式时，首先将一个CB垂直/水平地分割成四个面积相等的区域。每个权重集表示为(w_intrai，w_interi)并将应用于相应的区域，其中i为1到4，并且(w_intra1，w_inter1)＝(6，2)、(w_intra2，w_inter2)＝(5，3)、(w_intra3，w_inter3)＝(3，5)、以及(w_intra4，w_inter4)＝(2，6)。(w_intra1，w_inter1)用于最接近参考样本的区域，(w_intra4，w_inter4)用于距离参考样本最远的区域。然后，通过将两个加权预测相加并右移3比特，可以计算组合的预测。此外，如果后续相邻CB是帧内编码的，则可以保存用于预测器的帧内假设的帧内预测模式，以用于后续相邻CB的帧内模式编码。

然而，在VVC中，MTS最多可应用于32×32块，其最多可使用32点DST-7/DCT-8。由于在硬件实现成本方面没有针对较大尺寸的有效的DST-7/DCT-8方法，因此全矩阵乘法仍然用于8点、16点和32点DST-7/DCT-8，这对于硬件实现也需要高成本，最坏的情况可能是在一个64×64变换单元内应用四个32×32DST-7/DCT-8变换。变换跳过模式可以应用于亮度和色度。此外，在JVET-L0289中，IDT仅应用于亮度分量，因此在色度分量上跳过变换的功能丢掉了，MTS仅应用于亮度分量，其还可以扩展用于色度分量，并且与IDT一起工作，从而以协调的方式对亮度和色度分量启用变换跳过。

因此，需要提出解决这些问题的技术方案。

下面讨论的所提出的特征可以单独使用或以任何顺序进行组合。此外，实施例可以由处理电路(例如，一个或多个处理器或者一个或多个集成电路)实现。在一个示例中，一个或多个处理器执行存储在非易失性计算机可读存储介质中的程序。在本申请中，最可能模式(MPM)可以指主MPM、二次MPM、或者主MPM和二次MPM两者。

图1是根据本申请公开的实施例的通信系统(100)的简化框图。该通信系统(100)可包括通过网络(105)互相连接的至少两个终端(102、103)。对于数据的单向传输，第一终端(103)可在本地位置对视频数据进行编码以通过网络(105)传输到另一终端(102)。第二终端(102)可从网络(105)接收另一终端的已编码视频数据，对已编码视频数据进行解码并显示恢复的视频数据。单向数据传输在媒体服务等应用中是较常见的。

图1示出了支持已编码视频的双向传输的第二对终端(101、104)，所述双向传输可例如在视频会议期间发生。对于双向数据传输，终端(101)和终端(104)中的每个终端可对在本地位置采集的视频数据进行编码以通过网络(105)传输到另一终端。终端(101)和终端(104)中的每个终端还可接收由另一终端传输的已编码视频数据，且可对所述已编码视频数据进行解码并在本地显示设备上显示恢复的视频数据。

在图1中，终端(101、102、103、104)可以为服务器、个人计算机和智能手机，但本申请公开的原理可不限于此。本申请公开的实施例适用于膝上型计算机、平板电脑、媒体播放器和/或专用视频会议设备。网络(105)表示在终端(101、102、103、104)之间传送已编码视频数据的任何数目的网络，包括例如有线和/或无线通信网络。通信网络(105)可在电路交换和/或分组交换信道中交换数据。该网络可包括电信网络、局域网、广域网和/或互联网。出于本论述的目的，除非在下文中有所解释，否则网络(105)的架构和拓扑对于本申请公开的操作来说可能是无关紧要的。

作为实施例，图2示出了视频编码器和解码器在流式传输环境中的放置方式。本申请所公开主题可同等地适用于其它支持视频的应用，包括例如视频会议、数字TV、在包括CD、DVD、存储棒等的数字介质上存储压缩视频等等。

流式传输系统(200)可包括采集子系统(203)，所述采集子系统可包括例如数码相机等视频源(201)，所述视频源可创建未压缩的视频样本流(213)。相较于已编码的视频比特流，视频样本流(213)被描绘为粗线以强调高数据量的视频样本流，视频样本流(213)可由耦合到相机(201)的编码器(202)处理。编码器(202)可包括硬件、软件或软硬件组合以实现或实施如下文更详细地描述的所公开主题的各方面。相较于视频样本流，已编码的视频比特流(204)被描绘为细线以强调较低数据量的已编码的视频比特流，其可存储在流式传输服务器(205)上以供将来使用。一个或多个流式传输客户端(212、207)可访问流式传输服务器(205)以获取已编码的视频比特流(204)的副本(208、206)。客户端(212)可包括视频解码器(211)。视频解码器(211)对已编码的视频比特流(204)的传入副本(208)进行解码，且产生可在显示器(209)或另一呈现装置(未描绘)上呈现的输出视频样本流(210)。在一些流式传输系统中，视频比特流(204、206和208)可根据某些视频编码/压缩标准进行编码。这些标准的示例在上面指出并在本文中进一步描述。

图3是根据本申请公开的实施例的视频解码器(300)的功能框图。

如图3所示，接收器(302)可接收将由视频解码器(300)解码的一个或多个已编码视频序列；在同一实施例或另一实施例中，一次接收一个已编码视频序列，其中每个已编码视频序列的解码独立于其它已编码视频序列。可从信道(301)接收已编码视频序列，所述信道可以是通向存储已编码的视频数据的存储装置的硬件/软件链路。接收器(302)可接收已编码的视频数据以及其它数据，例如，可转发到它们各自的使用实体(未标示)的已编码音频数据和/或辅助数据流。接收器(302)可将已编码视频序列与其它数据分开。为了防止网络抖动，缓冲存储器(303)可耦接在接收器(302)与熵解码器/解析器(304)(此后称为“解析器”)之间。当接收器(302)从具有足够带宽和可控性的存储/转发装置或从等时同步网络接收数据时，也可能不需要配置缓冲存储器(303)，或可以将所述缓冲存储器做得较小。当然，为了在互联网等业务分组网络上使用，也可能需要缓冲存储器(303)，所述缓冲存储器可相对较大且可具有自适应性大小。

视频解码器(300)可包括解析器(304)以根据熵编码视频序列重建符号(313)。这些符号的类别包括用于管理视频解码器(300)的操作的信息，以及用以控制诸如显示器312的显示装置的潜在信息，所述显示装置不是解码器的组成部分，但可耦接到解码器。用于显示装置的控制信息可以是辅助增强信息(Supplementary Enhancement Information，SEI消息)或视频可用性信息(Video Usability Information，VUI)的参数集片段(未标示)。解析器(304)可对接收到的已编码视频序列进行解析/熵解码。已编码视频序列的编码可根据视频编码技术或标准进行，且可遵循本领域技术人员所公知的原理，包括可变长度编码、霍夫曼编码(Huffman coding)、具有或不具有上下文灵敏度的算术编码等等。解析器(304)可基于对应于群组的至少一个参数，从已编码视频序列提取用于视频解码器中的像素的子群中的至少一个子群的子群参数集。子群可包括图片群组(Group of Pictures，GOP)、图片、图块、条带、宏块、编码单元(Coding Unit，CU)、块、变换单元(Transform Unit，TU)、预测单元(Prediction Unit，PU)等等。熵解码器/解析器(304)还可从已编码视频序列提取信息，例如变换系数、量化器参数值、运动矢量等等。

解析器(304)可对从缓冲存储器(303)接收的视频序列执行熵解码/解析操作，从而创建符号(313)。解析器(304)可以接收已编码数据，并且选择性地解码特定符号(313)。此外，解析器(304)可以确定是否要将特定符号(313)提供给运动补偿预测单元(306)、缩放器/逆变换单元(305)、帧内预测单元(307)或环路滤波器单元(311)。

取决于已编码视频图片或一部分已编码视频图片(例如：帧间图片和帧内图片、帧间块和帧内块)的类型以及其它因素，符号(313)的重建可涉及多个不同单元。涉及哪些单元以及涉及方式可由解析器(304)从已编码视频序列解析的子群控制信息控制。为了简洁起见，未描述解析器(304)与下文的多个单元之间的此类子群控制信息流。

除已经提及的功能块以外，视频解码器(300)可在概念上细分成如下文所描述的数个功能单元。在商业约束下运行的实际实施例中，这些单元中的许多单元彼此紧密交互并且可以彼此集成。然而，出于描述所公开主题的目的，概念上细分成下文的功能单元是适当的。

第一单元可以是缩放器/逆变换单元(305)。缩放器/逆变换单元(305)可从解析器(304)接收作为符号(313)的量化变换系数以及控制信息，包括使用哪种变换方式、块大小、量化因子、量化缩放矩阵等。缩放器/逆变换单元(305)可输出包括样本值的块，所述样本值可输入到聚合器(310)中。

[1]在一些情况下，缩放器/逆变换单元(305)的输出样本可属于帧内编码块；即：不使用来自先前重建的图片的预测性信息，但可使用来自当前图片的先前重建部分的预测性信息的块。此类预测性信息可由帧内图片预测单元(307)提供。在一些情况下，帧内图片预测单元(307)采用从(部分重建的)当前图片(309)提取的已重建信息生成大小和形状与正在重建的块相同的周围块。在一些情况下，聚合器(310)基于每个样本，将帧内预测单元(307)生成的预测信息添加到由缩放器/逆变换单元(305)提供的输出样本信息中。

在其它情况下，缩放器/逆变换单元(305)的输出样本可属于帧间编码和潜在运动补偿块。在此情况下，运动补偿预测单元(306)可访问参考图片存储器(308)以提取用于预测的样本。在根据符号(313)对提取的样本进行运动补偿之后，这些样本可由聚合器(310)添加到缩放器/逆变换单元(305)的输出(在这种情况下被称作残差样本或残差信号)，从而生成输出样本信息。运动补偿预测单元(306)从参考图片存储器(308)内的地址获取预测样本可受到运动矢量控制，且所述运动矢量以所述符号(313)的形式而供运动补偿预测单元(306)使用，所述符号(313)例如是包括X、Y和参考图片分量。运动补偿还可包括在使用子样本精确运动矢量时，从参考图片存储器(308)提取的样本值的内插、运动矢量预测机制等等。

聚合器(310)的输出样本可在环路滤波器单元(311)中被各种环路滤波技术采用。视频压缩技术可包括环路内滤波器技术，所述环路内滤波器技术受控于包括在已编码视频比特流中的参数，且所述参数作为来自解析器(304)的符号(313)可用于环路滤波器单元(311)。然而，在其他实施例中，视频压缩技术还可响应于在解码已编码图片或已编码视频序列的先前(按解码次序)部分期间获得的元信息，以及响应于先前重建且经过环路滤波的样本值。

环路滤波器单元(311)的输出可以是样本流，所述样本流可输出到显示装置(312)以及存储在参考图片存储器(308)，以用于后续的帧间图片预测。

一旦完全重建，某些已编码图片就可用作参考图片以用于将来预测。一旦已编码图片被完全重建，且已编码图片(通过例如解析器(304))被识别为参考图片，则当前图片(309)可变为参考图片存储器(308)中的一部分，且可在开始重建后续已编码图片之前重新分配新的当前图片存储器。

视频解码器(300)可根据例如ITU-T H.265标准中记录的预定视频压缩技术执行解码操作。在已编码视频序列遵循在视频压缩技术文献或标准、特别是配置文件中所规定的视频压缩技术或标准的语法的意义上，已编码视频序列可符合所使用的视频压缩技术或标准指定的语法。对于合规性，还要求已编码视频序列的复杂度处于视频压缩技术或标准的层级所限定的范围内。在一些情况下，层级限制最大图片大小、最大帧率、最大重建取样率(以例如每秒兆(mega)个样本为单位进行测量)、最大参考图片大小等等。在一些情况下，由层级设定的限制可通过假想参考解码器(Hypothetical Reference Decoder，HRD)规范和在已编码视频序列中用信号表示的HRD缓冲器管理的元数据来进一步限定。

在实施例中，接收器(302)可连同已编码视频一起接收附加(冗余)数据。所述附加数据可以是已编码视频序列的一部分。所述附加数据可由视频解码器(300)用以对数据进行适当解码和/或较准确地重建原始视频数据。附加数据可呈例如时间、空间或信噪比(signal noise ratio，SNR)增强层、冗余条带、冗余图片、前向纠错码等形式。

图4是根据本申请公开的实施例的视频编码器(400)的功能框图。

视频编码器(400)可从视频源(401)(并非该解码器的一部分)接收视频样本，所述视频源可采集将由视频编码器(400)编码的视频图像。

视频源(401)可提供将由视频编码器(300)编码的呈数字视频样本流形式的源视频序列，所述数字视频样本流可具有任何合适位深度(例如：8位、10位、12位……)、任何色彩空间(例如，(二进制树(BT))BT.601Y CrCB、RGB……)和任何合适取样结构(例如Y CrCb4:2:0、Y CrCb 4:4:4)。在媒体服务系统中，视频源(401)可以是存储先前已准备的视频的存储装置。在视频会议系统中，视频源(401)可以包括采集本地图像信息作为视频序列的相机。可将视频数据提供为多个单独的图片，当按顺序观看时，这些图片被赋予运动。图片自身可构建为空间像素阵列，其中取决于所用的取样结构、色彩空间等，每个像素可包括一个或多个样本。所属领域的技术人员可以很容易理解像素与样本之间的关系。下文侧重于描述样本。

根据实施例，视频编码器(400)可实时或在由应用所要求的任何其它时间约束下，将源视频序列的图片编码且压缩成已编码视频序列410。施行适当的编码速度是控制器(450)的一个功能。控制器(450)控制如下文所描述的其它功能单元且在功能上耦接到这些单元。为了简洁起见，图中未标示耦接。由控制器(402)设置的参数可包括速率控制相关参数(例如，图片跳过、量化器、率失真优化技术的λ值等)、图片大小、图片群组(group ofpictures，GOP)布局，最大运动矢量搜索范围等。本领域技术人员可容易地识别控制器(402)的其它功能，因为这些功能涉及针对某一系统设计优化的视频编码器(400)。

一些视频编码器在本领域技术人员容易识别出的“编码环路”中进行操作。作为简单的描述，编码环路可包括编码器(402)(下文称为“源编码器”)的编码部分，其负责基于待编码的输入图片和参考图片创建符号，和嵌入于视频编码器(400)中的(本地)解码器(406)。“本地”解码器(406)以类似于(远程)解码器创建样本数据的方式重建符号以创建样本数据(因为在本申请所考虑的视频压缩技术中，符号与已编码视频码流之间的任何压缩是无损的)。将重建的样本流输入到参考图片存储器(405)。由于符号流的解码产生与解码器位置(本地或远程)无关的位精确结果，因此参考图片存储器中的内容在本地编码器与远程编码器之间也是按比特位精确对应的。换句话说，编码器的预测部分“看到”的参考图片样本与解码器将在解码期间使用预测时所“看到”的样本值完全相同。这种参考图片同步性基本原理(以及在例如因信道误差而无法维持同步性的情况下产生的漂移)是本领域技术人员公知的。

“本地”解码器(406)的操作可与例如已在上文结合图3详细描述视频解码器(300)的“远程”解码器相同。然而，另外简要参考图4，当符号可用且熵编码器(408)和解析器(304)能够无损地将符号编码/解码为已编码视频序列时，视频解码器(300)的熵解码部分(包括信道(301)、接收器(302)、缓冲存储器(303)和解析器(304))可能无法完全在本地解码器(406)中实施。

此时可以观察到，除存在于解码器中的解析/熵解码之外的任何解码器技术，也必定以基本上相同的功能形式存在于对应的编码器中。对编码器技术的描述可以被简写，因为它们与综合描述的解码器技术互逆。仅在某些区域中需要更详细的描述，并且在下文提供。

作为操作的一部分，源编码器(403)可执行运动补偿预测编码。参考来自视频序列中被指定为“参考帧”的一个或多个先前已编码帧，所述运动补偿预测编码对输入帧进行预测性编码。以此方式，编码引擎(407)对输入帧的像素块与参考帧的像素块之间的差异进行编码，所述参考帧可被选作所述输入帧的预测参考。

本地视频解码器(406)可基于源编码器(403)创建的符号，对可指定为参考帧的帧的已编码视频数据进行解码。编码引擎(407)的操作可为有损过程。当已编码视频数据可在视频解码器(图4中未示)处被解码时，重建的视频序列通常可以是带有一些误差的源视频序列的副本。本地视频解码器(406)复制解码过程，所述解码过程可由视频解码器对参考帧执行，且可使重建的参考帧存储在参考图片存储器(405)中。以此方式，视频编码器(400)可在本地存储重建的参考帧的副本，所述副本与将由远端视频解码器获得的重建参考帧具有共同内容(不存在传输误差)。

预测器(404)可针对编码引擎(407)执行预测搜索。即，对于将要编码的新帧，预测器(404)可在参考图片存储器(405)中搜索可作为所述新图片的适当预测参考的样本数据(作为候选参考像素块)或某些元数据，例如参考图片运动矢量、块形状等。预测器(404)可基于样本块逐像素块操作，以找到合适的预测参考。在一些情况下，根据预测器(404)获得的搜索结果，可确定输入图片可具有从参考图片存储器(405)中存储的多个参考图片取得的预测参考。

控制器(402)可管理源编码器(403)的编码操作，包括例如设置用于对视频数据进行编码的参数和子群参数。

可在熵编码器(408)中对所有上述功能单元的输出进行熵编码。熵编码器(408)可根据例如霍夫曼编码、可变长度编码、算术编码等本领域技术人员公知的技术对各种功能单元生成的符号进行无损压缩，从而将所述符号转换成已编码视频序列。

传输器(409)可缓冲由熵编码器(408)创建的已编码视频序列，从而为通过通信信道(411)进行传输做准备，所述通信信道可以是通向将存储已编码的视频数据的存储装置的硬件/软件链路。传输器(409)可将来自源编码器(403)的已编码视频数据与要传输的其它数据合并，所述其它数据例如是已编码音频数据和/或辅助数据流(未示出来源)。

控制器(402)可管理视频编码器(400)的操作。在编码期间，控制器(402)可以为每个已编码图片分配某一已编码图片类型，但这可能影响可应用于相应的图片的编码技术。例如，通常可将图片分配为以下任一种图片类型。

帧内图片(I图片)，其可以是不将序列中的任何其它帧用作预测源就可被编码和解码的图片。一些视频编解码器容许不同类型的帧内图片，包括例如独立解码器刷新(Independent Decoder Refresh，“IDR”)图片。所属领域的技术人员了解I图片的变体及其相应的应用和特征。

预测性图片(P图片)，其可以是可使用帧内预测或帧间预测进行编码和解码的图片，所述帧内预测或帧间预测使用至多一个运动矢量和参考索引来预测每个块的样本值。

双向预测性图片(B图片)，其可以是可使用帧内预测或帧间预测进行编码和解码的图片，所述帧内预测或帧间预测使用至多两个运动矢量和参考索引来预测每个块的样本值。类似地，多个预测性图片可使用多于两个参考图片和相关联元数据以用于重建单个块。

源图片通常可在空间上细分成多个样本块(例如，4×4、8×8、4×8或16×16个样本的块)，且逐块进行编码。这些块可参考其它(已编码)块进行预测编码，根据应用于块的相应图片的编码分配来确定所述其它块。举例来说，I图片的块可进行非预测编码，或所述块可参考同一图片的已经编码的块来进行预测编码(空间预测或帧内预测)。P图片的像素块可参考一个先前编码的参考图片通过空间预测或通过时域预测进行预测编码。B图片的块可参考一个或两个先前编码的参考图片通过空间预测或通过时域预测进行预测编码。

视频编码器(400)可根据例如ITU-T H.265建议书的预定视频编码技术或标准执行编码操作。在操作中，视频编码器(400)可执行各种压缩操作，包括利用输入视频序列中的时间和空间冗余的预测编码操作。因此，已编码视频数据可符合所用视频编码技术或标准指定的语法。

在实施例中，传输器(409)可传输附加数据和已编码的视频。此类数据可以是已编码视频序列的一部分。附加数据可包括时间/空间/SNR增强层、冗余图片和条带等其它形式的冗余数据、SEI消息、VUI参数集片段等。

图5示出了在HEVC和JEM中使用的帧内预测模式。为了捕获自然视频中呈现的任意边缘方向，方向帧内模式的数目从HEVC中使用的33扩展到65。HEVC顶部的JEM中的附加方向模式以虚线箭头表示，平面模式和DC模式保持不变。这些较密集的方向帧内预测模式适用于所有块尺寸以及亮度和色度帧内预测。如图5所示，由虚线箭头标识的、与奇数帧内预测模式索引相关联的方向帧内预测模式被称为奇数帧内预测模式。由实线箭头标识的、与偶数帧内预测模式索引相关联的方向帧内预测模式被称为偶数帧内预测模式。在本文中，如图5中的实线或虚线箭头所示的方向帧内预测模式也称为角度模式。

在JEM中，总共67个帧内预测模式用于亮度帧内预测。为了对帧内模式进行编码，基于相邻块的帧内模式构建大小为6的MPM列表。如果帧内模式不是来自该MPM列表，则发信号通知一个标志以指示帧内模式是否属于选定模式。在JEM-3.0中，有16种选定模式，且每四个角度模式被均匀地选择。在JVET-D0114和JVET-G0060中，导出16个二次MPM以代替均匀选择的模式。

图6示出了用于帧内方向模式的N个参考层。存在块单元611、段A 601、段B 602、段C 603、段D 604、段E 605、段F 606、第一参考层610、第二参考层609、第三参考层608和第四参考层607。

在HEVC和JEM以及诸如H.264/AVC的一些其它标准中，用于预测当前块的参考样本被限制为最近的参考线(行或列)。在多参考线帧内预测的方法中，对于帧内方向模式，候选参考线(行或列)的数量从一个(即最近的)增加到N个，其中N是大于或等于1的整数。图6以4×4预测单元(PU)为例示出了多参考线帧内方向预测方法的概念。帧内方向模式可以任意选择N个参考层中的一个来生成预测值。换言之，预测值p(x，y)是根据参考样本S1、S2、……和SN中的一个生成的。发信号通知一个标志以指示为帧内方向模式选择哪个参考层。如果N设为1，则帧内方向预测方法与JEM2.0中的传统方法相同。在图6中，参考线610、609、608和607由六个段(即段601、段602、段603、段604、段605和段606)以及左上参考样本构成。在本文中，参考层也称为参考线。当前块单元内的左上像素的坐标是(0，0)，第一参考线中的左上像素是(-1，-1)。

在JEM中，对于亮度分量，在生成过程之前，对用于生成帧内预测样本的相邻样本进行滤波。滤波由给定的帧内预测模式和变换块尺寸控制。如果帧内预测模式是DC模式或者变换块尺寸等于4×4，则不对相邻样本进行滤波。如果给定的帧内预测模式与垂直模式(或水平模式)之间的距离大于预定阈值，则启用滤波过程。对于相邻样本的滤波，使用[1，2，1]滤波器和双线性滤波器。

位置相关帧内预测组合(PDPC)方法是一种帧内预测方法，其调用未滤波的边界参考样本与具有已滤波的边界参考样本的HEVC型帧内预测的组合。位于(x，y)处的每个预测样本pred[x][y]计算如下：

prea[x][y]＝(wL*R_-1，y+wT*R_x，-1+wTL*R_-1，-1+(64-wL-wT-wTL)*pred[x][y]+32)＞＞6 (等式2-1)

其中R_x，-1、R_-1，y分别表示位于当前样本(x，y)的顶部和左侧的未滤波参考样本，并且R_-1，-1表示位于当前块的左上角的未滤波参考样本。权重计算如下，

wT＝32＞＞((y＜＜1)＞＞shift) (等式2-2)

wL＝32＞＞((x＜＜1)＞＞shift) (等式2-3)

wTL＝-(wL＞＞4)-(wT＞＞4) (等式2-4)

shift＝(log2(width)+log2(height)+2)＞＞2 (等式2-5)。

图7示出了示意图700，其中示出了一个4×4块内的(0，0)和(1，0)位置的权重(wL，wT，wTL)。

图8示出了局部照明补偿(LIC)示意图800，其基于用于照明变化的线性模型，使用缩放因子a和偏移b，并且针对每个帧间模式编码的编码单元(CU)自适应地被启用或禁用。

当LIC应用于CU时，利用当前CU的相邻样本及其相应的参考样本、并采用最小二乘误差法来导出参数a和b。更具体地，如图8所示，使用CU的子采样(2：1子采样)的相邻样本和参考图片中的相应样本(由当前CU或子CU的运动信息识别)。导出集成电路(IC)参数，并分别应用于每个预测方向。

当采用合并模式对CU进行编码时，以类似于合并模式中的运动信息复制的方式从相邻块复制LIC标志；否则，为CU发信号通知LIC标志以指示是否应用LIC。

图9A示出了利用QTBT进行块分区的示例900，图9B示出了相应的树表示901。实线表示四叉树分割，虚线表示二叉树分割。在二叉树的每个分割(即，非叶)节点中，发信号通知一个标志以指示使用哪种分割类型(即，水平或垂直)，其中0表示水平分割，1表示垂直分割。对于四叉树分割，不需要指示分割类型，因为四叉树分割总是水平和垂直地分割块以产生具有相等尺寸的4个子块。

QTBT结构消除了多个分区类型的概念，即它消除了CU、PU和TU概念的分离，并且支持更灵活的CU分区形状。在QTBT块结构中，CU可以具有正方形或矩形形状。首先用四叉树结构对编码树单元(CTU)进行分区。进一步采用二叉树结构对四叉树叶节点进行分区。在二叉树分割中有对称水平分割和对称垂直分割两种分割类型。二叉树叶节点被称为编码单元(CU)，并且该分割用于预测和变换处理而无需任何进一步的分区。这意味着CU、PU和TU在QTBT编码块结构中具有相同的块尺寸。在VVC中，CU有时由不同颜色分量的编码块(CB)组成，例如，在4：2：0色度格式的P条带和B条带的情况下，一个CU包含一个亮度CB和两个色度CB，有时由单个分量的CB组成，例如，在I条带的情况下，一个CU仅包含一个亮度CB或两个色度CB。

为QTBT分区方案定义了以下参数：

-CTU尺寸：四叉树的根节点尺寸，与HEVC中的概念相同，

-MinQTSize：允许的最小四叉树叶节点尺寸，

-MaxBTSize：允许的最大二叉树根节点尺寸，

-MaxBTDepth：允许的最大二叉树深度，以及

-MinBTSize：允许的最小二叉树叶节点尺寸。

在QTBT分区结构的一个示例中，CTU尺寸设置为具有两个相应的64×64色度样本块的128×128亮度样本。MinQTSize，其中QT是四叉树，设置为16×16，MaxBTSize设置为64×64，MinBTSize(对于宽度和高度)设置为4×4，MaxBTDepth设置为4。四叉树分区首先应用于CTU以生成四叉树叶节点。四叉树叶节点可以具有从16×16(即MinQTSize)到128×128(即CTU尺寸)的尺寸。如果四叉树叶节点是128×128，则由于其尺寸超过MaxBTSize(即64×64)，因此不会采用二叉树进一步分割。否则，四叉树叶节点可以采用二叉树进一步分割。因此，四叉树叶节点也是二叉树的根节点，它的二叉树深度为0。当二叉树深度达到MaxBTDepth(即4)时，不考虑进一步的分割。当二叉树节点的宽度等于MinBTSize(即4)时，不考虑进一步的水平分割。类似地，当二叉树节点的高度等于MinBTSize时，不考虑进一步的垂直分割。通过预测和变换过程进一步处理二叉树的叶节点，而无需任何进一步的分区。在JEM中，最大CTU尺寸是256×256亮度样本。

此外，QTBT方案支持亮度和色度具有单独的QTBT结构的能力。当前，对于P条带和B条带，一个CTU中的亮度和色度编码树块(CTB)共享相同的QTBT结构。然而，对于I条带，亮度CTB通过QTBT结构划分为CU，色度CTB通过另一个QTBT结构划分为色度CU。这意味着I条带中的CU由亮度分量的编码块或两个色度分量的编码块组成，而P条带或B条带中的CU由所有三个颜色分量的编码块组成。

图10示出了不同YUV格式的示例1000，描述了典型的YUV格式。对于4：4：4格式，亮度和色度样本沿水平和垂直方向对齐，并且总是位于相同的坐标。对于4：2：2格式，亮度和色度样本沿垂直方向对齐，但是色度样本的数量沿水平方向减半。对于4：2：2格式，色度样本的数量沿水平和垂直方向减半，此外，色度样本位于亮度样本栅格的分数位置中。

图11示出了根据示例性实施例的流程图1100。在步骤S1，确定参数N是否小于或等于阈值T，其中参数N为诸如块宽度或块高度的参数。如果参数N为块宽度，则阈值T为块宽度的界限值，如果参数N为块高度，则阈值T为块高度的界限值。阈值T的示例值包括小于或等于16、32或64的任何整数值。

如果在步骤S1确定N小于或等于阈值T，则在步骤S2确定从多个候选变换类型中选择的用信号通知的变换类型中的至少一个是否不是指定类型。例如，指定类型可以是具有对称/反对称特性的类型，或者可以是递归变换。

根据示例性实施例，不具有对称/反对称特性或者可能不是递归变换的变换类型可以是DCT-4、DCT-5、DCT-6、DCT-7、DCT-8、DST-4、DST-5、DST-6、DST-7、DST-8中的任何一个，具有对称/反对称特性或者可能是递归变换的变换类型可以是DCT-1、DCT-2、DCT-3、DST-1、DST-2、DST-3中的任何一个。

在步骤S3，已经在步骤S2确定从多个候选变换类型中选择的用信号通知的变换类型中的至少一个不是指定类型，发信号通知变换选择，例如水平或垂直变换选择。根据示例性实施例，在水平变换选择之前发信号通知垂直变换选择。如果确定从多个候选变换类型中选择的用信号通知的变换类型中的至少一个是指定类型，例如是不具有对称/反对称特性的类型，或者不是递归变换，不发信号通知变换选择。

如果在步骤S1确定N不小于或等于阈值T，那么在步骤S4，省略发信号通知变换索引，例如不发信号通知水平变换选择和垂直变换选择中的至少一个。根据其它示例性实施例，阈值T可以是包括256、512、1024、2048和4096中的任何一个的块区域尺寸。

在步骤S5，因为已经确定块尺寸(指的是块宽度、块高度、块区域尺寸、块宽度高度比、max(块宽度，块高度)、min(块宽度，块高度)中的任一个)大于阈值T，仍然可以使用MTS，但是，例如当应用MTS时(例如，发信号通知哪个mts_flag作为默认值来指示MTS被启用)，该块被隐式地分割成多个较小的子块。

在实施例中，如果块尺寸指的是块宽度和/或高度，则阈值T的示例值包括但不限于：4、8、16、32、64和128。

在实施例中，如果块尺寸指的是块区域尺寸，则阈值T的示例值包括但不限于：64、128、256、512、1024、4096、8192和16384。

在步骤S5，子块尺寸可以被限制为小于或等于MTS中使用的最大允许变换尺寸。根据示例性实施例，如果MTS中使用的变换类型的最大允许变换尺寸是N点，则将该块分割成多个min(W，N)×min(H，N)子块。N的示例值包括但不限于：4、8、16、32、64、128。例如，如果N的阈值是16，则对于64×32块，该块被分割成八个16×16子块，对于8×32块，该块被分割成两个8×16子块。

根据示例性实施例，在从步骤S5到步骤S3将块分割成多个子块之后，针对每个子块发信号通知单独变换索引，例如mts_idx，以指定变换选择。或者，可以针对每个子块发信号通知并共享单独变换索引中的单个变换索引。

此外，在从步骤S5到步骤S3将块分割成多个子块之后，根据子块在当前块内的相对位置，可对每个子块应用不同的变换类型，其中子块是从当前块中分割出来的。根据示例性实施例，如果子块位于块的左半部分内，则DCT-8或DCT-4用作水平变换；如果子块位于块的右半部分内，则DST-7或DST-4用作水平变换；如果子块位于块的上半部分内，则DCT-8或DCT-4用作垂直变换；和/或如果子块位于块的下半部分内，则DST-7或DST-4用作垂直变换。

根据示例性实施例，在从步骤S5到步骤S3将块分割成多个子块之后，仍然发信号通知每个子块的变换选择，但是应用于每个子块的变换集可以取决于子块在当前块内的相对位置，因为概率可能因这些位置的不同而不同。

例如，位于当前块的左半部分和右半部分中的子块的可用水平变换类型与不同的变换索引值相关联；对于位于当前块的左半部分中的子块，用于选择水平变换的变换类型包括{mts_hor_flag＝0:DST-7,mts_hor_flag＝1:DCT-8}，而对于位于当前块右半部分中的子块，用于选择水平变换的变换类型包括{mts_hor_flag＝0:DCT-8,mts_hor_flag＝1:DST-7}。

在另一实例中，位于当前块的上半部分和下半部分中的子块的可用垂直变换类型与不同的变换索引值相关联。例如，对于位于当前块的上半部分中的子块，用于选择垂直变换的变换类型包括{mts_ver_flag＝0:DST-7,mts_ver_flag＝1:DCT-8}，而对于位于当前块的下半部分的子块，用于选择垂直变换的变换类型包括{mts_ver_flag＝0:DCT-8,mts_ver_flag＝1:DST-7}。

此外，根据实施例，从步骤S5到步骤S3，仍然发信号通知每个子块的变换选择，但是用于发信号通知水平变换(mts_hor_flag)和垂直变换(mts_ver_flag)的上下文可取决于子块在当前块内的相对位置。

另外，利用上述实施例，对于小的变换尺寸，可使用DST-4代替DST-7，并且可使用DCT-4代替DCT-8。小的变换尺寸可以包括但不限于4点和8点，或者包括4点、8点和16点。

图12还示出了根据示例性实施例的流程图1200，其中针对步骤S5描述了附加特征。

在步骤S6，确定子块的宽度是否小于给定阈值T2，如果是，则在步骤S7，可以应用恒等变换(IDT)作为水平变换。

另外，在步骤S8，确定子块的高度是否小于给定阈值T3，如果是，则可以应用恒等变换作为垂直变换。

根据关于图2的实施例，N点IDT是使用N×N变换核的线性变换过程，该N×N变换核沿对角线位置仅具有非零系数，该对角线位置是指具有相等的水平和垂直坐标值的位置。IDT变换核的示例是N×N矩阵，其在对角线位置仅具有非零元素，并且非零元素具有相等的值512。阈值T2和T3的示例值包括但不限于4、8、16和32中的任何一个。另外，当可以使用IDT时，它可以与另一个变换类型(例如，DST-4、DST-7、DCT-4、DCT-8)联合使用，并且使用水平变换选择标志(mts_hor_flag)和/或垂直变换选择标志(mts_ver_flag)来发信号通知选择。另外，当可以使用IDT时，可以不发信号通知变换选择，并且仅可使用IDT。

图13示出了MTS信令方案S10的流程图1300，其中应用于亮度分量的方案也可应用于色度分量。然而，对于该流程图1300，支持MTS的最大块尺寸在亮度分量和色度分量之间可以不同。

在步骤S11，在亮度分量上应用MTS信令方案，并且在步骤S12确定是否对在块或子块中共置的、且具有某些限制的分量重新使用亮度分量MTS信令方案。

在步骤S12，如果确定重新使用亮度分量MTS信令方案，则可以确定当亮度和色度共享块分区树时，使用下表来选择色度水平和垂直变换类型：

根据步骤S12的示例性实施例，如果确定重新使用亮度分量MTS信令方案，那么可以确定当亮度和色度共享块分区树时，使用下表来选择色度水平和垂直变换类型：

根据步骤S12的示例性实施例，如果确定重新使用亮度分量MTS信令方案并且对于YUV 4：4：4色度格式，则当亮度和色度共享块分区树时，应用于共置的亮度分量的相同水平和垂直变换类型可重新应用于色度分量。

根据步骤S12的示例性实施例，如果确定重新使用亮度分量MTS信令方案并且对于YUV 4：2：2色度格式，则当亮度和色度共享块分区树时，应用于共置的亮度分量的相同垂直变换类型可重新应用于色度分量，然而，可使用表1和表2中的任何一个的方法来决定水平变换类型选择。

根据步骤S12的示例性实施例，如果确定重新使用亮度分量MTS信令方案并且对于YUV 4：2：0色度格式，则当亮度和色度共享块分区树时，可使用表1和表2中的任何一个的方法来决定水平和垂直变换类型选择。

根据步骤S12的示例性实施例，如果确定重新使用亮度分量MTS信令方案，则对于不同的YUV格式，水平和/或垂直变换类型选择可以是不同的。

根据步骤S12的示例性实施例，如果确定重新使用亮度分量MTS信令方案，则仅在可使用DM模式或帧间预测模式、或帧内-帧间预测模式来预测色度时才应用变换选择。

在步骤S13，如果步骤S12为“否”或不管步骤S12，则确定色度分量的某个值C是否小于或等于阈值T4。示例色度分量可以是色度块的高度、宽度、块尺寸中的任何一个。示例阈值T4可以是包括但不限于2、4、8、16的任何值。另外，如下所述，垂直和水平变换选择可以具有不同的阈值T4值。

根据步骤S14的示例性实施例，水平和垂直变换类型选择和信令可应用于高度和宽度都小于或等于给定阈值的色度块。

根据步骤S14的示例性实施例，对于小的块尺寸，可始终应用默认变换类型(例如DST-7或DST-4)作为色度上的水平和垂直变换，并且可不使用变换选择(MTS)。可替代地或根据步骤S14的其它实施例，对于小的块尺寸，有两种变换方案是可用的，并且可以发信号通知选择，使得第一变换方案可将恒等变换应用为水平和垂直变换，且第二变换方案可将DST-7或DST-4应用为色度分量上的水平和垂直变换。小的块尺寸可以被定义为高度和宽度都小于或等于给定阈值(例如，4或8)的块。

根据步骤S14的示例性实施例，水平变换选择和信令可应用于宽度小于或等于给定阈值T4的色度块，此外或根据其它实施例，垂直变换选择和信令可应用于高度小于或等于给定阈值T4或其它阈值的色度块。

根据步骤S14的示例性实施例，水平变换选择和信令可应用于宽度小于或等于第一给定阈值且高度小于或等于第二给定阈值的色度块，此外或根据其它实施例，垂直变换选择和信令可应用于高度小于或等于第一给定阈值且宽度小于或等于第二给定阈值的色度块。第一阈值的示例包括但不限于：2、4、8、16。第二阈值的示例包括但不限于：2、4、8、16、32、64。

根据步骤S14的示例性实施例，对于不同的YUV格式，水平和/或垂直变换类型选择和信令可以是不同的。

在步骤S15，如果步骤S12和步骤S13为“否”或不管步骤S12和步骤S13中的一个或多个，则可以确定是否存在帧内-帧间预测模式。如果存在，则在步骤S16，可始终应用默认变换(例如，DST-7或DST-4)，并且可以不使用或不发信号通知变换选择。

根据步骤S16的示例，对于帧内-帧间预测模式，当块宽度(或高度)小于或等于给定阈值(即Thr1)时，DST-4可始终用作水平(或垂直)变换，且示例阈值包括但不限于4、8、16、32、128。

根据步骤S16的示例，对于帧内-帧间预测模式，当块宽度(或高度)小于或等于给定阈值(即Thr2)时，DST-7可始终用作水平(或垂直)变换，示例阈值包括但不限于4、8、16、32、128。

步骤S16的上述示例性实施例可联合使用，但阈值Thr1和阈值Thr2可以不同。例如，Thr1可以小于Thr2。在一个示例中，对于帧内-帧间预测模式，当块宽度(或高度)小于或等于给定阈值(即Thr1)时，DST-4可始终用作水平(或垂直)变换，且示例阈值包括但不限于4、8、16。在一个示例中，对于帧内-帧间预测模式，当块宽度(或高度)小于或等于Thr2但大于Thr1时，DST-7可始终用作水平(或垂直)变换，且示例阈值包括但不限于4、8、16、32、64、128。

根据步骤S16的示例性实施例，可在高级语法元素中指示是否使用默认变换类型或是否发信号通知变换类型，该高级语法元素包括但不限于视频参数集(VPS)、序列参数集(SPS)、图片参数集(PPS)、条带、图块、图块组或CTU头，并且该高级语法元素可以是指示是否可以使用帧间MTS的标志。

在步骤S17，如果步骤S12、步骤S13和步骤S15为“否”或不管步骤S12、步骤S13和步骤S15中的一个或多个，则2点IDT可用于编码预测残差。根据步骤S17的示例性实施例，2点IDT变换核的对角线元素是1、2、4、8、16、32、64、128、256、512、181、或91或90，和/或2点IDT变换核对于不同的块尺寸可以是不同的。根据步骤S17的示例性实施例，取决于log2(宽度)+log2(高度)是偶数整数还是奇数整数，2点IDT变换核可以是不同的，其中log2()是基数为2的对数运算，并且宽度和高度分别指示块宽度和块高度。

本申请实施例还提供了一种视频解码的装置，包括：

解码模块，用于已执行所述变换的所述子块来解码视频流。

本实施例中所述模块的具体功能及实现可参照上述实施例中的视频解码方法的具体流程。

本申请实施例还提供了一种计算机设备，所述设备包括一个或多个处理器和一个或多个存储器，所述一个或多个存储器中存储有至少一条指令，所述至少一条指令由所述一个或多个处理器加载并执行以实现如上实施例所述的视频解码的方法。

本申请实施例还提供了一种非易失性计算机可读存储介质，其存储指令，当用于视频解码的计算机执行所述指令时，使得所述计算机执行如上实施例所述的视频解码的方法。

因此，根据本文所描述的示例性实施例，通过这些技术方案可以有利地改进上述技术问题。

上述技术可以使用计算机可读指令实现为计算机软件，并且物理地存储在一个或多个计算机可读介质中或者通过专门配置的一个或多个硬件处理器执行。例如，图14示出了一种计算机系统1400，其适于实现所公开的主题的某些实施例。

所述计算机软件可通过任何合适的机器代码或计算机语言进行编码，通过汇编、编译、链接等机制创建包括指令的代码，所述指令可由一个或多个计算机中央处理单元(CPU)，图形处理单元(GPU)等直接执行或通过译码、微代码等方式执行。

所述指令可以在各种类型的计算机或其组件上执行，包括例如个人计算机、平板电脑、服务器、智能手机、游戏设备、物联网设备等。

图14所示的用于计算机系统(1400)的组件本质上是示例性的，并不用于对实现本申请实施例的计算机软件的使用范围或功能进行任何限制。也不应将组件的配置解释为与计算机系统(1400)的示例性实施例中所示的任一组件或其组合具有任何依赖性或要求。

计算机系统(1400)可以包括某些人机界面输入设备。这种人机界面输入设备可以通过触觉输入(如：键盘输入、滑动、数据手套移动)、音频输入(如：声音、掌声)、视觉输入(如：手势)、嗅觉输入(未示出)，对一个或多个人类用户的输入做出响应。所述人机界面设备还可用于捕获某些媒体，气与人类有意识的输入不必直接相关，如音频(例如：语音、音乐、环境声音)、图像(例如：扫描图像、从静止影像相机获得的摄影图像)、视频(例如二维视频、包括立体视频的三维视频)。

人机界面输入设备可包括以下中的一个或多个(仅绘出其中一个)：键盘(1402)、鼠标(1404)、触控板(1403)、触摸屏(1410)、操纵杆(1405)、麦克风(1406)、扫描仪(1408)、照相机(1407)。

计算机系统(1400)还可以包括某些人机界面输出设备。这种人机界面输出设备可以通过例如触觉输出、声音、光和嗅觉/味觉来刺激一个或多个人类用户的感觉。这样的人机界面输出设备可包括触觉输出设备(例如通过触摸屏(1410)或操纵杆(1405)的触觉反馈，但也可以有不用作输入设备的触觉反馈设备)、音频输出设备(例如，扬声器(1409)、耳机(未示出))、视觉输出设备(例如，包括阴极射线管屏幕、液晶屏幕、等离子屏幕、有机发光二极管屏的屏幕(1410)，其中每一个都具有或没有触摸屏输入功能、每一个都具有或没有触觉反馈功能——其中一些可通过诸如立体画面输出的手段输出二维视觉输出或三维以上的输出；虚拟现实眼镜(未示出)、全息显示器和放烟箱(未示出))以及打印机(未示出)。

计算机系统(1400)还可以包括人可访问的存储设备及其相关介质，如包括具有CD/DVD的高密度只读/可重写式光盘(CD/DVD ROM/RW)(1412)或类似介质(1411)的光学介质、拇指驱动器(1413)、可移动硬盘驱动器或固体状态驱动器(1414)，诸如磁带和软盘(未示出)的传统磁介质，诸如安全软件保护器(未示出)等的基于ROM/ASIC/PLD的专用设备，等等。

本领域技术人员还应当理解，结合所公开的主题使用的术语“计算机可读介质”不包括传输介质、载波或其它瞬时信号。

计算机系统(1400)还可以包括通往一个或多个通信网络1415的接口。例如，网络1415可以是无线的、有线的、光学的。网络1415还可为局域网、广域网、城域网、车载网络和工业网络、实时网络、延迟容忍网络等等。网络1415还包括以太网、无线局域网、蜂窝网络(GSM、3G、4G、5G、LTE等)等局域网、电视有线或无线广域数字网络(包括有线电视、卫星电视、和地面广播电视)、车载和工业网络(包括CANBus)等等。某些网络通常需要外部网络接口适配器1427，用于连接到某些通用数据端口或外围总线(1425)(例如，计算机系统(1400)的USB端口)；其它系统通常通过连接到如下所述的系统总线集成到计算机系统(1400)的核心(例如，以太网接口集成到PC计算机系统或蜂窝网络接口集成到智能电话计算机系统)。通过使用这些网络中的任何一个，计算机系统(1400)可以与其它实体进行通信。所述通信可以是单向的，仅用于接收(例如，无线电视)，单向的仅用于发送(例如CAN总线到某些CAN总线设备)，或双向的，例如通过局域或广域数字网络到其它计算机系统。上述的每个网络1415和网络接口1427可使用某些协议和协议栈。

上述的人机界面设备、人可访问的存储设备以及网络接口1427可以连接到计算机系统(1400)的核心(1416)。

核心(1416)可包括一个或多个中央处理单元(CPU)(1421)、图形处理单元(GPU)(1422)、以现场可编程门阵列(FPGA)(1424)形式的专用可编程处理单元、用于特定任务的硬件加速器(1426)等。这些设备以及只读存储器(ROM)(1419)、随机存取存储器(1418)、内部大容量存储器(例如内部非用户可存取硬盘驱动器、固态硬盘等)(1420)等可通过系统总线(1428)进行连接。在某些计算机系统中，可以以一个或多个物理插头的形式访问系统总线(1428)，以便可通过额外的中央处理单元、图形处理单元等进行扩展。外围装置可直接附接到核心的系统总线(1428)，或通过外围总线(1401)进行连接。外围总线的体系结构包括外部控制器接口PCI、通用串行总线USB等。

CPU(1421)、GPU(1422)、FPGA(1424)和加速器(1426)可以执行某些指令，这些指令组合起来可以构成上述计算机代码。该计算机代码可以存储在ROM(1419)或RAM(1418)中。过渡数据也可以存储在RAM(1418)中，而永久数据可以存储在例如内部大容量存储器(1420)中。通过使用高速缓冲存储器可实现对任何存储器设备的快速存储和检索，高速缓冲存储器可与一个或多个CPU(1421)、GPU(1422)、大容量存储器(1420)、ROM(1419)、RAM(1418)等紧密关联。

所述计算机可读介质上可具有计算机代码，用于执行各种计算机实现的操作。介质和计算机代码可以是为本申请的目的而特别设计和构造的，也可以是计算机软件领域的技术人员所熟知和可用的介质和代码。

作为实施例而非限制，具有体系结构(1400)的计算机系统，特别是核心(1416)，可以作为处理器(包括CPU、GPU、FPGA、加速器等)提供执行包含在一个或多个有形的计算机可读介质中的软件的功能。这种计算机可读介质可以是与上述的用户可访问的大容量存储器相关联的介质，以及具有非易失性的核心(1416)的特定存储器，例如核心内部大容量存储器(1420)或ROM(1419)。实现本申请的各种实施例的软件可以存储在这种设备中并且由核心(1416)执行。根据特定需要，计算机可读介质可包括一个或一个以上存储设备或芯片。该软件可以使得核心(1416)特别是其中的处理器(包括CPU、GPU、FPGA等)执行本文所述的特定过程或特定过程的特定部分，包括定义存储在RAM(1418)中的数据结构以及根据软件定义的过程来修改这种数据结构。另外或作为替代，计算机系统可以提供逻辑硬连线或以其它方式包含在电路(例如，加速器(1426))中的功能，该电路可以代替软件或与软件一起运行以执行本文所述的特定过程或特定过程的特定部分。在适当的情况下，对软件的引用可以包括逻辑，反之亦然。在适当的情况下，对计算机可读介质的引用可包括存储执行软件的电路(如集成电路(IC))，包含执行逻辑的电路，或两者兼备。本申请包括任何合适的硬件和软件组合。

虽然本申请已对多个示例性实施例进行了描述，但实施例的各种变更、排列和各种等同替换均属于本申请的范围内。因此应理解，本领域技术人员能够设计多种系统和方法，所述系统和方法虽然未在本文中明确示出或描述，但其体现了本申请的原则，因此属于本申请的精神和范围之内。

Claims

1.一种视频解码的方法，其特征在于，包括：

确定一个块的至少一个参数是否小于或等于阈值；

在所述多个子块上分别执行多个变换中的一个；以及

利用已执行所述变换的所述子块来解码视频流；

所述方法进一步包括：

响应于确定从多个候选变换类型中选择的至少一个用信号通知的变换类型不存在对称/反对称特性，发信号通知所述水平变换和所述垂直变换中的至少一个；

其中，所述至少一个用信号通知的变换类型是离散余弦变换(DCT)-4、DCT-5、DCT-6、DCT-7、DCT-8、离散正弦变换(DST)-4、DST-5、DST-6、DST-7和DST-8中的至少一个。

2.根据权利要求1所述的方法，其特征在于，进一步响应于确定从多个候选变换类型中选择的至少一个用信号通知的变换类型不是递归变换，发信号通知所述水平变换和所述垂直变换中的至少一个。

3.根据权利要求1所述的方法，其特征在于，发信号通知所述水平变换和所述垂直变换中的一个包括：在发信号通知水平变换之前发信号通知垂直变换。

4.根据权利要求1所述的方法，其特征在于，所述参数是所述块的宽度和高度中的至少一个，其中所述块的宽度和高度具有小于或等于16的整数。

5.根据权利要求1所述的方法，其特征在于，将所述块分割成所述多个子块包括：根据所述多个子块与所述块的相对位置，确定所述多个子块的不同变换类型。

6.根据权利要求1所述的方法，其特征在于，进一步包括：

响应于将所述块分割成所述多个子块，分别用信号通知每个子块的各个变换索引中的一个，

其中，每个所述变换索引指定一个变换选择。

7.根据权利要求1所述的方法，其特征在于，进一步包括：

响应于将所述块分割成所述多个子块，发信号通知分别由多个所述子块共享的变换索引。

8.根据权利要求1所述的方法，其特征在于，

所述第二信令方案的所述最大块尺寸是2、4、8和16中的一个。

9.根据权利要求1所述的方法，其特征在于，进一步包括：

在亮度分量上使用一个变换选择；以及

当确定所述亮度分量与共置的色度分量共享块分区树时，在所述色度分量上重新使用亮度分量的所述变换选择。

10.一种视频解码的装置，其特征在于，包括：

解码模块，用于已执行所述变换的所述子块来解码视频流；

所述通知模块进一步用于，响应于确定从多个候选变换类型中选择的至少一个用信号通知的变换类型不存在对称/反对称特性，发信号通知所述水平变换和所述垂直变换中的至少一个；或者

所述通知模块进一步用于，响应于确定从多个候选变换类型中选择的至少一个用信号通知的变换类型不是递归变换，发信号通知所述水平变换和所述垂直变换中的至少一个；

11.一种计算机设备，其特征在于，所述设备包括一个或多个处理器和一个或多个存储器，所述一个或多个存储器中存储有至少一条指令，所述至少一条指令由所述一个或多个处理器加载并执行以实现如权利要求1-9任一项所述的视频解码的方法。

12.一种非易失性计算机可读存储介质，其特征在于，其存储指令，当用于视频解码的计算机执行所述指令时，使得所述计算机执行如权利要求1-9任一项所述的视频解码的方法。