CN117561717A

CN117561717A - 高精度4×4 dst7和dct8变换矩阵

Info

Publication number: CN117561717A
Application number: CN202280030173.0A
Authority: CN
Inventors: K·纳赛尔; F·莱莱昂内克; P·德拉格朗日; P·博尔德斯
Original assignee: InterDigital CE Patent Holdings SAS
Current assignee: InterDigital CE Patent Holdings SAS
Priority date: 2021-04-08
Filing date: 2022-03-29
Publication date: 2024-02-13
Also published as: WO2022214363A1; EP4320868A1

Abstract

一种用于重构图片块的方法，该方法包括：使用表示逆变换的整系数第一矩阵对变换系数块进行该逆变换，其中该整系数第一矩阵是表示反转获得该逆变换的变换的整系数第二矩阵的逆矩阵，该整系数第二矩阵从整系数第三矩阵推导而来，该第三矩阵的该整系数的绝对值在四个不同值的集合中取值，该推导包括修改该集合的一个值，使得该集合的两个值的和等于该集合的第三值。

Description

高精度4×4 DST7和DCT8变换矩阵

1.技术领域

本实施方案中的至少一者整体涉及使用高精度4×4 DST7变换矩阵和/或高精度4×4DCT8变换矩阵对图片进行编码或解码的方法和设备。

2.背景技术

为了实现高压缩效率，视频编码方案通常采用预测和变换来利用视频内容中的空间和时间冗余。在编码过程中，将视频内容的图片划分为样本块(即像素)，然后将这些样本块划分为一个或多个子块，子块在下文称为原始子块。然后对每个子块应用帧内或帧间预测以利用帧内或帧间图像相关性。无论使用何种预测方法(帧内或帧间)，都针对每个原始子块确定预测值子块。然后，对表示原始子块与预测值子块之间的差的子块(通常表示为预测误差子块、预测残差子块或简单地表示为残差块)进行变换、量化和熵编码，以生成编码视频流。为了重构视频，通过对应于变换、量化和熵编码的逆过程来解码压缩数据。

从最初的视频压缩方法，诸如MPEG-1(ISO/CEI-11172)或MPEG-2(ISO/CEI 13818-2)到最新的视频压缩方法，诸如VVC(H.266、ISO/IEC 23090-3、MPEG-I第3部分(多功能视频编码))，压缩性能有了很大提高，但代价是复杂度增加。为了保持合理的复杂度，许多编码工具在设计时都降低了复杂度。例如，现在以整数矩阵运算形式实现的变换就是这种情况。例如，在VVC中，利用变换矩阵的整系数的属性，设计了一种快速实现变换和逆变换的方法。然而，这些属性适用于给定的(中等)精度。

期望调查这些属性是否仍然适用于更高精度，并且如果不适用，则提出解决方案，以便在更高精度的情况下保持变换的快速实现。

3.发明内容

在第一方面，本实施方案中的一者或多者提供一种重构图片块的方法，该方法包括：使用表示逆变换的整系数第一矩阵对变换系数块进行逆变换，其中该整系数第一矩阵是表示反转获得该逆变换的变换的整系数第二矩阵的逆矩阵，该整系数第二矩阵从整系数第三矩阵推导而来，该第三矩阵的整系数的绝对值在四个不同值的集合中取值，该推导包括修改该集合的一个值，使得该集合的两个值的和等于该集合的第三值。

在一个实施方案中，变换是DST7，第三矩阵是以下形式的4×4矩阵：

其中a、b、c和d是四个值，并且修改包括将a减小一个单位，或者将b减小一个单位，或者将d增大一个单位。

在一个实施方案中，变换是DCT8，第三矩阵是以下形式的4×4矩阵：

在第二方面，本实施方案中的一者或多者提供一种用于对图片块进行编码的方法，该方法包括：使用表示变换的整系数第一矩阵对残差样本块进行该变换，该整系数第一矩阵从整系数第二矩阵推导而来，该第二矩阵的整系数的绝对值在四个不同值的集合中取值，该推导包括修改该集合的一个值，使得该集合的两个值的和等于所述该的第三值。

在一个实施方案中，变换是DST7，第二矩阵是以下形式的4×4矩阵：

在一个实施方案中，变换是DCT8，第二矩阵是以下形式的4×4矩阵：

在第三方面，本实施方案中的一者或多者提供一种用于重构图片块的设备，该设备包括电子电路，该电子电路适于：使用表示逆变换的整系数第一矩阵对变换系数块进行该逆变换，其中该整系数第一矩阵是表示反转获得该逆变换的变换的整系数第二矩阵的逆矩阵，该整系数第二矩阵从整系数第三矩阵推导而来，该第三矩阵的整系数的绝对值在四个不同值的集合中取值，该推导包括修改该集合的一个值，使得该集合的两个值的和等于该集合的第三值。

在第四方面，本实施方案中的一者或多者提供一种用于对图片块进行编码的设备，该设备包括电子电路，该电子电路适于：使用表示变换的整系数第一矩阵对残差样本块进行该变换，该整系数第一矩阵从整系数第二矩阵推导而来，该第二矩阵的整系数的绝对值在四个不同值的集合中取值，该推导包括修改该集合的一个值，使得该集合的两个值的和等于该集合的第三值。

在第五方面，本实施方案中的一者或多者提供一种信号，该信号通过第二方面的方法或第四方面的设备生成。

在第六方面，本实施方案中的一者或多者提供一种计算机程序，该计算机程序包括用于实现第一方面或第二方面的方法的程序代码指令。

在第七方面，本实施方案中的一者或多者提供一种非暂态信息存储介质，该非暂态信息存储介质存储用于实现第一方面或第二方面的方法的程序代码指令。

4.附图说明

图1描述了在其中可以实现实施方案的上下文的示例；

图2示意性地示出了原始视频的像素图片所经历的分区的示例；

图3示意性地描绘了用于对视频流进行编码的方法；

图4示意性地描绘了用于对编码视频流进行解码的方法；

图5A示意性地示出了能够实现编码模块或解码模块的处理模块的硬件架构的示例，在该编码模块或解码模块中实现了各个方面和实施方案；

图5B示出了在其中实现各个方面和实施方案的第一系统的示例的框图；并且，

图5C示出了在其中实现各个方面和实施方案的第二系统的示例的框图。

5.具体实施方式

图1描述了在其中可以实现实施方案的上下文的示例。

在图1中，系统10使用通信信道11向系统12传输视频流。

系统10包括例如符合关于下面图3描述的编码方法的编码模块100。

系统12包括例如解码模块120。解码模块120符合关于下面图4描述的解码方法。解码模块120对视频流进行解码，并将解码后的视频流转发到显示设备。

通信信道11是有线(例如互联网或以太网)或无线(例如WiFi、3G、4G或5G)网络链路。

在类似于VVC的视频格式的上下文中描述实施方案的以下示例。然而，这些实施方案不限于对应于VVC的视频编码/解码方法。这些实施方案适用于任何视频格式。这类格式包括例如标准EVC(基本视频编码/MPEG-5)、AV1和VP9。

图2、图3和图4介绍了视频格式的示例。

图2示出了原始视频20的像素图片21所经历的分区的示例。在此认为像素由三个分量组成：一个亮度分量和两个色度分量。然而，其它类型的像素可能包括更少或更多分量(例如，仅亮度分量或额外的深度分量)。

将图片划分为多个编码实体。首先，如图2中的参考标号23所表示，将图片划分为称为编码树单元(CTU)的块的网格。CTU由N×N个亮度样本块和两个对应的色度样本块组成。N通常是二的幂，例如最大值为“128”。其次，将图片划分为一个或多个CTU组。例如，可将该图片划分为一个或多个图块行和图块列，图块是覆盖图片的矩形区域的CTU序列。在一些情况下，可将图块划分为一个或多个砖块，每个砖块由图块内的至少一个CTU行组成。在图块和砖块的概念之上，存在另一编码实体，称为切片，其可包含图片的至少一个图块或图块的至少一个砖块。

在图2的示例中，如参考标号22所表示，将图片21划分为光栅扫描切片模式的三个切片S1、S2和S3，每个切片包括多个图块(未示出)，每个图块仅包括一个砖块。

如图2中的参考标号24所表示，CTU可以被分区成由一个或多个子块组成的分层树形式，子块被称为编码单元(CU)。CTU是分层树的根(即，父节点)，并且可分区为多个CU(即，子节点)。如果每个CU未进一步分区为较小CU，则每个CU成为分层树的叶；或者如果每个CU进一步分区为较小CU(即，子节点)，则每个CU成为较小CU的父节点。

在图2的示例中，首先，使用四叉树类型分区将CTU 24分区为“4”个正方形CU。左上角的CU是分层树的叶，因为其未进一步分区，即其并非任何其他CU的父节点。再次使用四叉树类型分区将右上角的CU进一步分区为“4”个较小正方形CU。使用二叉树类型分区将右下角的CU竖直地分区为“2”个矩形CU。使用三叉树类型分区将左下角的CU竖直地分区为“3”个矩形CU。

在图片编码期间，分区是自适应的，每个CTU均被分区以便优化CTU准则的压缩效率。

HEVC中出现了预测单元(PU)和变换单元(TU)的概念。实际上，在HEVC中，用于预测的编码实体(即PU)和用于变换的编码实体(即TU)可以是CU的子划分。例如，如图2中所表示，大小2N×2N的CU可以被划分为大小N×2N或大小2N×N的PU 2411。另外，所述CU可以被划分为大小N×N的“4”个TU 2412或大小的“16”个TU。

可以注意到，在VVC中，除某些特殊情况外，TU和PU的边界在CU的边界上对准。因此，CU一般包括一个TU和一个PU。

在本申请中，术语“块”或“图片块”可用于指CTU、CU、PU和TU中的任一者。另外，术语“块”或“图片块”可用于指H.264/AVC或其他视频编码标准中所指定的宏块、分区和子块，并且更一般地指众多大小的样本的阵列。

在本申请中，术语“重构”与“解码”可以互换使用，术语“像素”与“样本”可互换使用，术语“图像”、“图片”、“子图片”、“切片”和“帧”可以互换使用。通常，但不必然，术语“重建”在编码器侧使用，而“解码”在解码器侧使用。

图3示意性地描绘了由编码模块执行的用于对视频流进行编码的方法。设想了用于编码的此方法的变型，但为了清楚起见，下文描述了图3的用于编码的方法，而未描述所有预期变型。

在编码之前，原始视频序列的当前原始图像可经过预处理。例如，在步骤301中，对当前原始图片应用颜色变换(例如，从RGB 4:4:4到YCbCr 4:2:0的转换)，或者对当前原始图片分量应用重新映射，以便获得对压缩更具弹性的信号分布(例如，使用颜色分量中的一个颜色分量的直方图均衡化)。

预处理图片的编码在步骤302期间以预处理图片的分区开始，如关于图2所描述的。因此，预处理图片分区为CTU、CU、PU、TU等。对于每个块，编码模块确定在帧内预测与帧间预测之间的编码模式。

帧内预测包括在步骤303期间根据帧内预测方法从预测块中预测当前块的像素，该预测块从位于待编码的当前块的因果关系附近的重构块的像素中导出。帧内预测的结果是指示使用附近块的哪些像素的预测方向，以及通过计算当前块与预测块之间的差而得到的残差块。

帧间预测包括从当前图片(此图片被称为参考图片)之前或之后的图片的像素块(被称为参考块)中预测当前块的像素。在根据帧间预测方法对当前块进行编码期间，由运动估计步骤304根据相似度准则确定参考图片的最接近当前块的块。在步骤304期间，确定指示参考图片中的参考块的位置的运动矢量。通过运动估计确定的运动矢量在运动补偿步骤305期间使用，在该运动补偿步骤期间以当前块与参考块之间的差的形式计算残差块。在第一视频压缩标准中，上述单向帧间预测模式是唯一可用的帧间模式。

在选择步骤306期间，由编码模块在所测试的预测模式(帧内预测模式、帧间预测模式)当中根据速率/失真优化准则(即RDO准则)来选择优化压缩性能的预测模式。

当选择预测模式时，在步骤307期间变换残差块。变换是视频编码中的基本过程。传统上，DCT2用作默认变换，因为它能很好地匹配残差信号的属性。为了提高编码效率，可以使用附加的变换。在一些视频编码方法中，对4×4帧内编码块使用4×4DST7变换。最近，在称为多变换选择(MTS)的编码工具中，对于从4×4到32×32的块大小，DST7和DCT8用作附加变换。

在数学上，大小为4×4的DST7变换矩阵由以下基函数定义：

其中i和j分别是从“0”到“3”的整数垂直索引和整数水平索引，并且N＝4。

通过水平翻转DST7变换矩阵以及符号反转奇数序行，可以从DST7直接得到DCT8。

如上所述，变换矩阵用整数值表示。在一些实施方案中，整数值是通过将用基函数得到的变换矩阵系数移位“6”个位，并按变换长度的平方根缩放所述值得到的。即，DST7的4×4变换矩阵的整数表示为：

其中int()取值的整数部分(舍入运算)，并且Shift为设计位深度(等于VVC中的“6”)。

通过该公式，可以得到以下DST7 4×4矩阵和DCT8 4×4矩阵：

可以注意到，4×4DST7变换矩阵和4×4DCT8变换矩阵的系数的绝对值在四个不同值“a＝29、b＝55、c＝74和d＝84”的集合中取值。因此，我们可以把矩阵写成以下形式：

可以注意到，对DCT7矩阵进行水平翻转，可以得到以下矩阵：

然后，对奇数行进行符号反转，可以得到以下矩阵：

其正好对应于DCT8矩阵。

有趣的是，这些变换矩阵存在一些数学属性，这些属性可以实现快速计算。即：a+b＝d。

这可以用来减少乘法运算次数。对于要被变换成输出信号Out[i]的输入信号In[i]，其中i的范围为“0”到“3”，DST7变换的第一系数计算如下：

Out[0]＝a*In[0]+b*In[1]+c*In[2]+d*In[3]；

其包括“4”次乘法运算。

将d替换为a+b可简化这一过程：

Out[0]＝a*In[0]+b*In[1]+c*In[2]+(a+b)*In[3]；

Out[0]＝a*(In[0]+In[3])+b*(In[1]+In[3])+c*In[2]；

其包括“3”次乘法运算。

第二属性是DST7矩阵的第二行包含单个非零值，即c。即，第二系数可计算为：

c*In[0]+c*In[1]+0*In[2]-c*In[3]；

其可简化为：

c*(In[0]+In[1]+In[3])；

其仅需一次乘法运算。

最后，根据矩阵系数的属性进行上述简化后，DST7和DCT8的变换仅需“8”次乘法运算，而不是“16”次乘法运算。

在步骤309中，对变换后的残差块进行量化。

需注意，编码模块可跳过变换，并对未变换的残差信号直接应用量化。当根据帧内预测模式对当前块进行编码时，在步骤310期间，由熵编码器对预测方向以及经变换和量化的残差块进行编码。当根据帧间预测对当前块进行编码时，在适当时根据从与位于待编码块附近的重构块相对应的运动矢量的集合中选择的预测矢量来预测块的运动矢量。接下来，在步骤310期间，由熵编码器以运动残差和用于识别预测矢量的索引的形式对运动信息进行编码。在步骤310期间，由熵编码器对所变换和量化的残差块进行编码。需注意，编码模块可绕过变换和量化，即，对残差应用熵编码，而不应用变换或量化过程。熵编码的结果插入到编码视频流311中。

在量化步骤309之后，重构当前块，使得对应于该块的像素可用于将来预测。该重构阶段也称为预测环路。因此，在步骤312期间将逆量化应用于经变换和量化的残差块，并且在步骤313期间应用逆变换。在4×4DST7变换和4×4DCT8变换的情况下，逆变换等于变换的转置：

DST7^-1＝DST7^T

DCT8^-1＝SCT8^T

其中M^T是矩阵M的转置。

根据用于在步骤314期间获得的块的预测模式，重构块的预测块。如果根据帧间预测模式对当前块进行编码，则编码模块在适当时在步骤316期间应用使用当前块的运动矢量的运动补偿，以便识别当前块的参考块。如果根据帧内预测模式对当前块进行编码，则在步骤315期间，使用对应于当前块的预测方向来重构当前块的参考块。将参考块和重构的残差块相加，以便获得重构的当前块。

在重构后，在步骤317期间，将旨在减少编码伪像的环路内滤波应用于重构块。该滤波称为环路内滤波，因为该滤波发生在预测环路中，以在解码器处获得与编码器相同的参考图像，从而避免编码过程与解码过程之间的漂移。环路内滤波工具包括例如解块滤波、样本自适应偏移(SAO)和自适应环路滤波器(ALF)。

当重构块时，在步骤318期间将块插入到存储在一般所称的解码图片缓冲器(DPB)对应的重构图像的存储器319中的重构图片中。然后，这样存储的重构图像可用作待编码的其他图像的参考图像。

诸如SEI(补充增强信息)消息的元数据可以被附加到编码视频流311。例如在诸如AVC、HEVC或VVC的标准中定义的SEI(补充增强信息)消息是与视频流相关联并且包括提供与视频流相关的信息的元数据的数据容器。

图4示意性地描绘了由解码模块执行的用于对根据关于图3描述的方法编码的编码视频流311进行解码的方法。设想了该用于解码的方法的变型，但是为了清楚起见，以下描述了图4的用于解码的方法，而未描述所有预期变型。

解码是逐块进行的。对于当前块，该解码在步骤410期间以当前块的熵解码开始。熵解码允许获得块的预测模式。

如果已根据帧间预测模式对块进行了编码，则熵解码允许在适当时获得预测矢量索引、运动残差和残差块。在步骤408期间，使用预测矢量索引和运动残差来重构当前块的运动矢量。

如果已根据帧内预测模式对块进行了编码，则熵解码允许获得预测方向和残差块。由解码模块执行的步骤412、413、414、415、416和417分别在各方面都与由编码模块执行的步骤312、313、314、315、316和317相同。在步骤418中，将解码块保存在解码图片中并将解码图片存储在DPB 419中。当解码模块对给定图片进行解码时，存储在DPB 419中的图片与由编码模块在所述给定图像的编码期间存储在DPB 319中的图片相同。也可由解码模块输出解码的图片，以例如进行显示。

在步骤421中，解码图像可以进一步经过后处理。后处理可以包括逆颜色变换(例如，从YCbCr 4:2:0到RGB 4:4:4的转换)、执行在步骤301的预处理中执行的重新映射过程的逆的逆映射、用于基于例如在SEI消息中提供的滤波器参数来改善重构的图片的后滤波和/或例如用于将输出图像调整到显示约束的重采样。

图5A示意性地示出了根据下述的不同方面和实施方案进行了修改的处理模块500的硬件架构的示例，该处理模块能够实现编码模块100或解码模块120，该编码模块和解码模块能够分别实现图3的编码方法和图4的解码方法。作为非限制性示例，处理模块500包括由通信总线5005连接的以下项：涵盖一个或多个微处理器的处理器或CPU(中央处理单元)5000、通用计算机、专用计算机以及基于多核心架构的处理器；随机存取存储器(RAM)5001；只读存储器(ROM)5002；存储单元5003，该存储单元可以包括非易失性存储器和/或易失性存储器，包括但不限于电可擦除可编程只读存储器(EEPROM)、只读存储器(ROM)、可编程只读存储器(PROM)、随机存取存储器(RAM)、动态随机存取存储器(DRAM)、静态随机存取存储器(SRAM)、闪存、磁盘驱动器和/或光盘驱动器，或者存储介质读取器，诸如SD(安全数字)卡读取器和/或硬盘驱动器(HDD)和/或可访问网络的存储设备；至少一个通信接口5004，该至少一个通信接口用于与其他模块、设备或装备交换数据。通信接口5004可以包括但不限于被配置成通过通信信道发射和接收数据的收发器。通信接口5004可以包括但不限于调制解调器或网卡。

如果处理模块500实现解码模块120，则通信接口5004可使例如处理模块500接收编码视频流并提供解码图片序列。

如果处理模块500实现编码模块100，则通信接口5004可使例如处理模块500接收要编码的原始图片数据序列并提供编码视频流。

处理器5000能够执行从ROM 5002、外部存储器(未示出)、存储介质或通信网络加载到RAM 5001中的指令。当处理模块500上电时，处理器5000能够从RAM 5001读取指令，并且执行该指令。这些指令形成计算机程序，该计算机程序使得例如由处理器5000实现关于图4描述的解码方法或关于图3描述的编码方法，该解码方法和编码方法包括以下在本文档中描述的各个方面和实施方案。

所述编码或解码方法的全部或部分算法和步骤可通过由诸如DSP(数字信号处理器)或微控制器的可编程机器执行一组指令而以软件形式实现，或者可通过诸如FPGA(现场可编程门阵列)或ASIC(专用集成电路)的机器或专用部件而以硬件形式实现。

图5C示出了其中实现各个方面和实施方案的系统12的示例的框图。系统12可以体现为包括下文描述的各种部件的设备，并且被配置成执行本文档中描述的方面和实施方案中的一者或多者。此类设备的示例包括但不限于各种电子设备，诸如个人计算机、膝上型计算机、智能电话、平板电脑、数字多媒体机顶盒、数字电视接收器、个人视频录制系统、连接的家用电器、游戏机和头戴式显示器。系统12的元件可以单独或组合在单个集成电路(IC)、多个IC和/或分立的部件中。例如，在至少一个实施方案中，系统12包括实现解码模块120的处理模块500。在各种实施方案中，系统12经由例如通信总线或通过专用输入端口和/或输出端口通信地耦接到一个或多个其他系统或其他电子设备。在各种实施方案中，系统12被配置为实现本文档中描述的方面中的一个或多个方面。

处理模块500的输入可以通过如框531中所指示的各种输入模块来提供。此类输入模块包括但不限于：(i)射频(RF)模块，其接收例如由广播器空中发射的RF信号；(ii)分量(COMP)输入模块(或一组COMP输入模块)；(iii)通用串行总线(USB)输入模块；和/或(iv)高清晰度多媒体接口(HDMI)输入模块。图5C中未示出的其他示例包括复合视频。

在各种实施方案中，框531的输入模块具有如本领域所已知的相关联的相应输入处理元件。例如，RF模块可与适用于以下的元件相关联：(i)选择所需的频率(也称为选择信号，或将信号频带限制到一个频带)，(ii)下变频选择的信号，(iii)再次频带限制到更窄频带以选择(例如)在某些实施方案中可称为信道的信号频带，(iv)解调下变频和频带限制的信号，(v)执行纠错，以及(vi)解复用以选择所需的数据包流。各种实施方案的RF模块包括用于执行这些功能的一个或多个元件，例如频率选择器、信号选择器、频带限制器、信道选择器、滤波器、下变频器、解调器、纠错器和解复用器。RF部分可包括执行这些功能中的各种功能的调谐器，这些功能包括例如下变频接收信号至更低频率(例如，中频或近基带频率)或至基带。在一个实施方案中，RF模块及其相关联的输入处理元件接收通过有线(例如，电缆)介质发射的RF信号，并且通过滤波、下变频和再次滤波至所需的频带来执行频率选择。各种实施方案重新布置上述(和其他)元件的顺序，移除这些元件中的一些元件，和/或添加执行类似或不同功能的其他元件。添加元件可包括在现有元件之间插入元件，例如，插入放大器和模数变换器。在各种实施方案中，RF模块包括天线。

另外，USB和/或HDMI模块可以包括用于跨USB和/或HDMI连接将系统12连接到其他电子设备的相应接口处理器。应理解，输入处理(例如Reed-Solomon纠错)的各个方面可以根据需要例如在单独的输入处理IC内或者在处理模块500内实现。类似地，USB或HDMI接口处理的各方面可以根据需要在单独的接口IC内或在处理模块500内实现。经解调、纠错和解复用的流被提供给处理模块500。

系统12的各种元件可以设置在集成壳体内。在集成壳体内，各种元件可使用合适的连接布置(例如，本领域已知的内部总线，包括IC间(I2C)总线、布线和印刷电路板)互连并且在这些元件之间传输数据。例如，在系统12中，处理模块500通过总线5005与所述系统12的其他元件互连。

处理模块500的通信接口5004允许系统12在通信信道11上通信。如上文已提及，通信信道11可以例如在有线介质和/或无线介质内实现。

在各种实施方案中，使用诸如Wi-Fi网络，例如IEEE 802.11(IEEE是指电气和电子工程师协会)之类的无线网络来将数据流式发射或以其他方式提供给系统12。这些实施方案的Wi-Fi信号是通过适于Wi-Fi通信的通信信道11和通信接口5004来接收。这些实施方案的通信信道11通常连接到接入点或路由器，该接入点或路由器提供对外部网络(包括互联网)的访问，以用于允许流式传输应用和其他越过运营商的通信。其他实施方案使用输入框531的RF连接向系统12提供流式传输数据。如上所述，各种实施方案以非流式的方式提供数据。另外地，各种实施方案使用除了Wi-Fi以外的无线网络，例如蜂窝网络或蓝牙网络。

系统12可以向各种输出设备(包括显示系统55、扬声器56和其他外围设备57)提供输出信号。各种实施方案的显示系统55包括例如触摸屏显示器、有机发光二极管(OLED)显示器、曲面显示器和/或可折叠显示器中的一者或多者。显示器55可用于电视机、平板计算机、膝上型计算机、蜂窝电话(移动电话)、头戴式显示器或其他设备。显示系统55还可与其他部件集成(例如，如在智能电话中)，或可为独立的(例如，膝上型计算机的外部监视器)。在实施方案的各种示例中，其他外围设备57包括独立数字视频光盘(或数字多功能光盘)(DVR，可表示这两个术语)、碟片播放器、立体声系统和/或照明系统中的一者或多者。各种实施方案使用一个或多个外围设备57，该一个或多个外围设备基于系统12的输出来提供功能。例如，碟片播放器执行播放系统12的输出的功能。

在各种实施方案中，控制信号使用诸如AV.Link、消费电子产品控制(CEC)或其他通信协议的信令在系统12与显示系统55、扬声器56或其他外围设备57之间进行传送，该其他通信协议使得能够在有或没有用户干预的情况下进行设备到设备控制。可通过相应的接口532、533和534经由专用连接将输出设备通信地耦接到系统12。另选地，输出设备可以使用通信信道11经由通信接口5004连接到系统12，或者使用专用通信信道经由通信接口5004连接到该系统。显示系统55和扬声器56可以与电子设备(诸如电视机)中的系统12的其他部件一起集成在单个单元中。在各种实施方案中，显示器接口532包括显示驱动器，诸如例如定时控制器(T Con)芯片。

显示系统55和扬声器56可以另选地与其他部件中的一个或多个部件分离。在显示系统55和扬声器56为外部部件的各种实施方案中，可以经由专用输出连接(包括例如HDMI端口、USB端口或COMP输出)来提供输出信号。

图5B示出了其中实现各个方面和实施方案的系统10的示例的框图。系统10与系统12非常类似。系统10可以体现为包括下文描述的各种部件的设备，并且被配置成执行本文档中描述的方面和实施方案中的一者或多者。此类设备的示例包括但不限于各种电子设备，诸如个人计算机、膝上型计算机、智能电话、平板电脑、相机和服务器。系统10的元件可以单独或组合在单个集成电路(IC)、多个IC和/或分立的部件中。例如，在至少一个实施方案中，系统10包括实现编码模块100的一个处理模块500。在各种实施方案中，系统10经由例如通信总线或通过专用输入端口和/或输出端口通信地耦接到一个或多个其他系统或其他电子设备。在各种实施方案中，系统10被配置为实现本文档中描述的方面中的一个或多个方面。

对处理模块500的输入可通过如关于图5C已经描述的框531中所示的各种输入模块来提供。

系统10的各种元件可以设置在集成壳体内。在集成壳体内，各种元件可使用合适的连接布置(例如，本领域已知的内部总线，包括IC间(I2C)总线、布线和印刷电路板)互连并且在这些元件之间传输数据。例如，在系统10中，处理模块500通过总线5005与所述系统10的其他元件互连。

处理模块500的通信接口5004允许系统500在通信信道11上通信。

在图1的实施方案中，系统10仅包括编码模块100。在这种情况下，所生成的图片数据例如由连接到系统100的相机生成。在各种实施方案中，使用诸如Wi-Fi网络，例如IEEE802.11(IEEE是指电气和电子工程师协会)之类的无线网络将这些图片数据流式发射或以其他方式提供给系统10。这些实施方案的Wi-Fi信号是通过适于Wi-Fi通信的通信信道11和通信接口5004来接收。这些实施方案的通信信道11通常连接到接入点或路由器，该接入点或路由器提供对外部网络(包括互联网)的访问，以用于允许流式传输应用和其他越过运营商的通信。其他实施方案使用输入框531的RF连接向装置10提供流式传输数据。

如上所述，各种实施方案以非流式的方式提供数据。另外地，各种实施方案使用除了Wi-Fi以外的无线网络，例如蜂窝网络或蓝牙网络。

在一个实施方案中，相机(或任何图片生成模块)被集成在系统10中。

各种具体实施参与解码。如本申请中所用，“解码”可涵盖例如对所接收的编码视频流执行的过程的全部或部分，以便产生适于显示的最终输出。在各种实施方案中，此类过程包括通常由解码器执行的一个或多个过程，例如熵解码、逆量化、逆变换和预测。在各种实施方案中，此类过程还包括或另选地包括由本申请所述的各种具体实施的解码器执行的过程，例如对变换后的残差系数块进行逆变换。

短语“解码过程”旨在具体地指代操作的子集还是广义地指代更广泛的解码过程基于具体描述的上下文将是清楚的，并且被认为会被本领域的技术人员很好地理解。

各种具体实施参与编码。以与上面关于“解码”的讨论类似的方式，如在本申请中使用的“编码”可涵盖例如对输入视频序列执行以便产生编码视频流的全部或部分过程。在各种实施方案中，此类过程包括通常由编码器执行的一个或多个过程，例如，分区、预测、变换、量化和熵编码。在各种实施方案中，此类过程还包括或另选地包括由本申请所述的各种具体实施的编码器执行的过程，例如，使用快速实现转换残差块。

短语“编码过程”是具体地指代操作的子集还是广义地指代更广泛的编码过程基于具体描述的上下文将是清楚的，并且据信将被本领域的技术人员很好地理解。

需注意，本文所使用的语法元素名称是描述性术语。因此，它们不排除使用其他语法元素名称。

当附图呈现为流程图时，应当理解，其还提供了对应装置的框图。类似地，当附图呈现为框图时，应当理解，其还提供了对应的方法/过程的流程图。

本文所述的具体实施和方面可在例如方法或过程、装置、软件程序、数据流或信号中实现。即使仅在单个形式的具体实施的上下文中讨论(例如，仅作为方法讨论)，讨论的特征的具体实施也可以其他形式(例如，装置或程序)实现。装置可在例如适当的硬件、软件和固件中实现。方法可在例如一般是指处理设备的处理器中实施，该处理设备包括例如计算机、微处理器、集成电路或可编程逻辑设备。处理器还包括通信设备，诸如计算机、移动电话、便携式/个人数字助理(“PDA”)、智能电话、平板电脑和其他便于终端用户之间交流信息的设备。

提及“一个实施方案”或“实施方案”或“一个具体实施”或“具体实施”以及它们的其他变型，意味着结合实施方案描述的特定的特征、结构、特性等包括在至少一个实施方案中。因此，短语“在一个实施方案中”或“在实施方案中”或“在一个具体实施中”或“在具体实施中”的出现以及出现在本申请通篇的各个地方的任何其他变型不一定都是指相同的实施方案。

另外，本申请可涉及“确定”各种信息。确定信息可包括例如估计信息、计算信息、预测信息、从存储器检索信息或例如从另一设备、模块或从用户获得信息中的一者或多者。

此外，本申请可涉及“访问”各种信息。访问信息可包括例如接收信息、检索信息(例如，从存储器)、存储信息、移动信息、复制信息、计算信息、确定信息、预测信息或估计信息中的一者或多者。

另外，本申请可涉及“接收”各种信息。与“访问”一样，接收旨在为广义的术语。接收信息可包括例如访问信息或检索信息(例如，从存储器)中的一者或多者。此外，在诸如例如存储信息、处理信息、传输信息、移动信息、复制信息、擦除信息、计算信息、确定信息、预测信息或估计信息的操作期间，“接收”通常以一种方式或另一种方式参与。

应当理解，例如，在“A/B”、“A和/或B”以及“A和B中的至少一者”、“A和B中的一者或多者”的情况下，使用以下“/”、“和/或”以及“至少一种”、“一者或多者”中的任一种旨在涵盖仅选择第一列出的选项(A)，或仅选择第二列出的选项(B)，或选择两个选项(A和B)。作为进一步的示例，在“A、B和/或C”和“A、B和C中的至少一者”、“A、B和C中的一者或多者”的情况下，此类短语旨在涵盖仅选择第一列出的选项(A)，或仅选择第二列出的选项(B)，或仅选择第三列出的选项(C)，或仅选择第一列出的选项和第二列出的选项(A和B)，或仅选择第一列出的选项和第三列出的选项(A和C)，或仅选择第二列出的选项和第三列出的选项(B和C)，或选择所有三个选项(A和B和C)。如对于本领域和相关领域的普通技术人员显而易见的是，这可扩展到所列出的尽可能多的项目。

而且，如本文所用，词语“发信号通知”是指(除了别的以外)向对应解码器指示某物。例如，在某些实施方案中，编码器发信号通知一些编码工具的使用。这样，在一个实施方案中，在编码器侧和解码器侧两者均可使用相同的参数。因此，例如，编码器可将特定参数发射(显式信令)到解码器，使得解码器可使用相同的特定参数。相反，如果解码器已具有特定参数以及其他，则可在不发射(隐式信令)的情况下使用信令，以简单允许解码器知道和选择特定参数。通过避免传输任何实际功能，在各种实施方案中实现了比特节省。应当理解，信令可以各种方式实现。例如，在各种实施方案中，使用一个或多个语法元素、标志等将信息发信号通知至对应解码器。虽然前面涉及词语“signal(发信号通知)”的动词形式，但是词语“signal(信号)”在本文也可用作名词。

对于本领域的普通技术人员将显而易见的是，具体实施可产生格式化为携带例如可存储或可传输的信息的各种信号。信息可包括例如用于执行方法的指令或由所述具体实施中的一个具体实施产生的数据。例如，可格式化信号以携带所述实施方案的编码视频流。可格式化此类信号例如为电磁波(例如，使用频谱的射频部分)或基带信号。格式化可包括例如对编码视频流进行编码以及使用编码视频流调制载波。信号携带的信息可以是例如模拟或数字信息。众所周知，信号可通过各种不同的有线或无线链路传输。信号可存储在处理器可读介质上。

提案JVET-R0351(http://phenix.it-sudparis.eu/jvet/)提出了一种新的变换方法。与以上关于步骤307所述的方法相比，在不同的修改中，变换部分的修改是将Shift的值从“6”改为“14”，以提高变换的精度。这改变了DST7和DCT8的变换矩阵。具体地，矩阵变为：

其中a＝7425，b＝14081，c＝18893并且d＝21505。

可以看出，将d与a和b关联的属性(即a+b＝d)不再保持。该结果可妨碍4×4DST7变换和4×4DCT8变换的快速实现。因此，需要找到一种解决方案，允许以更高的精度快速实现4×4DST7变换和4×4DCT8变换。

在第一实施方案中，针对编码器侧和解码器侧，对变换矩阵做了修改，以便在高位深度/高比特率编码中使用更高的精度。为保留“16”位带符号的整数表示(2字节)，最大可能移位值为“14”。即，DST7的4×4变换矩阵的整数表示为：

其中N＝4。

此公式得出的矩阵系数值如下：

a＝7472，b＝14042，c＝18919和d＝21513。

显然，“a+b＝d”的属性不成立，因此不能使用快速算法。

为了检索符合快速算法的矩阵，在第一实施方案中，修改a、b或d的值。

在第一实施方案的第一变型中，a值减小一个单位：

a＝a-1＝7471；

DST7矩阵变为：

并且DCT8矩阵变为：

在第一实施方案的第二变型中，b值减小一个单位：

b＝b-1＝14041；

DST7矩阵变为：

并且DCT8矩阵变为：

在第一实施方案的第三变型中，d值增大一个单位：

d＝d+1＝21513；

DST7矩阵变为：

并且DCT8矩阵变为：

/>

可以看出，在第一实施方案中，在步骤307中应用于残差样本块的DST7变换采用整系数第一矩阵的形式，该第一矩阵从以下第二矩阵推导而来：

第二矩阵的整系数的绝对值在四个不同值a＝7472、b＝14042、c＝18919和d＝21513的集合中取值。第一矩阵的推导包括修改集合的一个值(即，a、b或d)，以确保该集合的两个值的和等于该集合的第三值(即，a+b＝d)。

这同样适用于DCT8变换，第二矩阵是：

在第一实施方案的每个变型中，将逆变换矩阵计算为对应变换矩阵的转置。

在这种情况下，在步骤313和步骤413中对变换系数块进行的逆DCT7变换使用的是整系数第一矩阵。第一矩阵是整系数第二矩阵的逆矩阵(即，转置)，整系数第二矩阵表示反转获得该逆变换的变换。整系数第二矩阵从整系数第三矩阵推导而来，在这种情况下整系数第三矩阵是：

第三矩阵的整系数的绝对值在四个不同值a＝7472、b＝14042、c＝18919和d＝21513的集合中取值。该推导包括修改该集合的一个值(a、b或d)，以确保该集合的两个值的和等于该集合的第三个值(即a+b＝d)。

这同样适用于逆DCT8变换，第三矩阵是：

在第二实施方案中，只有编码器侧的变换矩阵以更高的精度进行改进，解码器侧的变换矩阵(实际上是逆变换矩阵)与步骤307和步骤313中所述的变换矩阵(逆变换矩阵)相比没有变化。不使用等式(等式1)直接计算DST7矩阵，使用在步骤313中指定的逆矩阵的逆，以便正向变换和反向变换之间具有最高的正交性。由此得出以下四个矩阵系数值：

a＝7425、b＝14081、c＝18893和d＝21505；

“a+b＝d”的属性也不成立，因此不能使用快速算法。

为了检索符合快速算法的矩阵，在第二实施方案中，修改a、b或d的值。

在第二实施方案的第一变型中，a值减小一个单位：

a＝a-1＝7424；

DST7矩阵变为：

并且DCT8矩阵变为：

在第二实施方案的第二变型中，b值减小一个单位：

b＝b-1＝14080；

DST7矩阵变为：

并且DCT8矩阵变为：

在第二实施方案的第三变型中，d值增大一个单位：

d＝d+1＝21506；

DST7矩阵变为：

并且DCT8矩阵变为：

可以看出，在第二实施方案中，在步骤307中应用于残差样本块的DST7变换采用整系数第一矩阵的形式，该第一矩阵从以下第二矩阵推导而来：

/>

第二矩阵的整系数的绝对值在四个不同值a＝7425、b＝14081、c＝18893、d＝21505的集合中取值。第一矩阵的推导包括修改集合的一个值(即，a、b或d)，以确保该集合的两个值的和等于该集合的第三值(即，a+b＝d)。

这同样适用于DCT8变换，第二矩阵是：

以上描述了多个实施方案。这些实施方案的特征可以单独提供或以任何组合形式提供。此外，实施方案可包括以下特征、设备或方面中的一个或多个，单独地或以任何组合，跨各种权利要求类别和类型：

·使用所述变换或其变体生成的比特流或信号。

·根据所述变换或其变化，创建和/或传输和/或接收和/或解码比特流或信号。

·执行所描述的实施方案中的至少一个实施方案的电视机、机顶盒、移动电话、平板电脑或其他电子设备。

·执行所描述的实施方案中的至少一个实施方案并(例如，使用监视器、屏幕或其他类型的显示器)显示所得图像的电视机、机顶盒、移动电话、平板电脑或其他电子设备。

·调谐(例如，使用调谐器)信道以接收包括编码视频流的信号并执行所描述的实施方案中的至少一个实施方案的电视机、机顶盒、移动电话、平板电脑或其他电子设备。

·通过空中(例如，使用天线)接收包括编码视频流的信号并执行所描述的实施方案中的至少一个实施方案的电视机、机顶盒、移动电话、平板电脑或其他电子设备。

Claims

1.一种方法，所述方法包括：

使用表示逆变换的整系数第一矩阵对变换系数块进行所述逆变换，其中所述整系数第一矩阵基于表示反转获得所述逆变换的变换的整系数第二矩阵的逆矩阵，所述整系数第二矩阵从整系数第三矩阵推导而来，所述第三矩阵的所述整系数的绝对值在至少三个值的集合中取值，所述推导包括修改所述集合的一个值，使得所述集合的两个值的和等于所述集合的第三值。

2.根据权利要求1所述的方法，其中所述变换是DST7，并且所述第三矩阵是以下形式的4×4矩阵：

其中a、b、c和d是至少三个值的所述集合的四个值，并且所述修改包括将a减小一个单位，或者将b减小一个单位，或者将d增大一个单位。

3.根据权利要求1所述的方法，其中所述变换是DCT8，并且所述第三矩阵是以下形式的4×4矩阵：

4.一种方法，所述方法包括：

使用表示变换的整系数第一矩阵对残差样本块进行所述变换，所述整系数第一矩阵从整系数第二矩阵推导而来，所述第二矩阵的所述整系数的绝对值在至少三个值的集合中取值，所述推导包括修改所述集合的一个值，使得所述集合的两个值的和等于所述集合的第三值。

5.根据权利要求4所述的方法，其中所述变换是DST7，并且所述第二矩阵是以下形式的4×4矩阵：

6.根据权利要求4所述的方法，其中所述变换是DCT8，并且所述第二矩阵是以下形式的4×4矩阵：

7.一种用于重构图片块的设备，所述设备包括电子电路，所述电子电路适于：

使用表示逆变换的整系数第一矩阵对变换系数块进行所述逆变换，其中所述整系数第一矩阵是表示反转获得所述逆变换的变换的整系数第二矩阵的逆矩阵，所述整系数第二矩阵从整系数第三矩阵推导而来，所述第三矩阵的所述整系数的绝对值在至少三个值的集合中取值，所述推导包括修改所述集合的一个值，使得所述集合的两个值的和等于所述集合的第三值。

8.根据权利要求7所述的设备，其中所述变换是DST7，并且所述第三矩阵是以下形式的4×4矩阵：

9.根据权利要求7所述的方法，其中所述变换是DCT8，并且所述第三矩阵是以下形式的4×4矩阵：

10.一种用于对图片块进行编码的设备，所述设备包括电子电路，所述电子电路适于：

11.根据权利要求10所述的设备，其中所述变换是DST7，并且所述第二矩阵是以下形式的4×4矩阵：

其中a、b、c和d是至少三个值的所述集合的三个值，并且所述修改包括将a减小一个单位，或者将b减小一个单位，或者将d增大一个单位。

12.根据权利要求10所述的方法，其中所述变换是DCT8，并且所述第二矩阵是以下形式的4×4矩阵：

13.一种信号，所述信号由根据权利要求4至6中任一前述权利要求所述的方法或由根据权利要求10至12中任一前述权利要求所述的设备生成。

14.一种计算机程序，所述计算机程序包括用于实现根据权利要求1至6中任一前述权利要求所述的方法的程序代码指令。

15.一种非暂态信息存储介质，所述非暂态信息存储介质存储用于实现根据权利要求1至6中任一前述权利要求所述的方法的程序代码指令。