WO2022174701A1

WO2022174701A1 - 视频编解码方法、装置、计算机可读介质及电子设备

Info

Publication number: WO2022174701A1
Application number: PCT/CN2022/071732
Authority: WO
Inventors: 王力强
Original assignee: 腾讯科技（深圳）有限公司
Priority date: 2021-02-21
Filing date: 2022-01-13
Publication date: 2022-08-25
Also published as: CN114979655A; US20230104359A1

Abstract

本申请的实施例提供了一种视频编解码方法、装置、计算机可读介质及电子设备。该视频解码方法包括：获取视频图像帧的编码块；若所述编码块需要进行子块变换，则根据所述编码块的尺寸和所允许的子块最大尺寸比确定所述编码块能够采用的划分模式；基于所述编码块能够采用的划分模式，确定对所述编码块进行子块变换处理时所采用的目标划分模式；基于所述目标划分模式对所述编码块进行划分处理，并对划分得到的多个子块进行解码处理。本申请实施例的技术方案可以在使用SBT技术时避免产生过窄的子块，保证了硬件的性能，提高了编解码效率。

Description

视频编解码方法、装置、计算机可读介质及电子设备

本申请要求于2021年2月21日提交中国专利局、申请号为202110194810.5、名称为“视频编解码方法、装置、计算机可读介质及电子设备”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及计算机及通信技术领域，具体而言，涉及一种视频编解码方法、装置、计算机可读介质及电子设备。

背景技术

在AVS3(Audio Video coding Standard，音视频编码标准)标准中，提到了子块变换(Sub-Block Transform，简称SBT)技术，具体是将编码块按照一定的方式划分为多个子块来进行编码，但是按照目前的AVS3标准对编码块进行划分可能存在过窄的子块(过窄的子块即为宽度与高度之间相差过大的子块)，进而会降低硬件性能，影响编解码效率。

发明内容

本申请的实施例提供了一种视频编解码方法、装置、计算机可读介质及电子设备，进而至少在一定程度上可以在使用SBT技术时避免产生过窄的子块，保证了硬件的性能，提高了编解码效率。

本申请的其他特性和优点将通过下面的详细描述变得显然，或部分地通过本申请的实践而习得。

根据本申请实施例的一个方面，提供了一种视频解码方法，包括：获取视频图像帧的编码块；若所述编码块需要进行子块变换，则根据所述编码块的尺寸和所允许的子块最大尺寸比确定所述编码块能够采用的划分模式；基于所述编码块能够采用的划分模式，确定对所述编码块进行子块变换处理时所采用的目标划分模式；基于所述目标划分模式对所述编码块进行划分处理，并对划分得到的多个子块进行解码处理。

根据本申请实施例的一个方面，提供了一种视频编码方法，包括：获取视频图像帧的残差系数块；根据所述残差系数块的尺寸和所允许的子块最大尺寸比确定所述残差系数块能够采用的划分模式；从所述能够采用的划分模式中选择针对所述残差系数块的目标划分模式；将所述目标划分模式的信息编码至码流中。

根据本申请实施例的一个方面，提供了一种视频解码装置，包括：获取单元，配置为获取视频图像帧的编码块；第一处理单元，配置为若所述编码块需要进行子块变换，则根据所述编码块的尺寸和所允许的子块最大尺寸比确定所述编码块能够采用的划分模式；第二处理单元，配置为基于所述编码块能够采用的划分模式，确定对所述编码块进行子块变换处理时所采用的目标划分模式；第三处理单元，配置为基于所述目标划分模式对所述编码块进行划分处理，并对划分得到的多个子块进行解码处理。

根据本申请实施例的一个方面，提供了一种视频编码装置，包括：获取单元，配置为获取视频图像帧的残差系数块；第四处理单元，配置为根据所述残差系数块的尺寸和所允许的子块最大尺寸比确定所述残差系数块能够采用的划分模式；选择单元，配置为从所述能够采用的划分模式中选择针对所述残差系数块的目标划分模式；编码单元，配置为将所述目标划分模式的信息编码至码流中。

根据本申请实施例的一个方面，提供了一种计算机可读介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现如上述实施例中所述的视频解码方法。

根据本申请实施例的一个方面，提供了一种电子设备，包括：一个或多个处理器；存储装置，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行时，使得所述一个或多个处理器实现如上述实施例中所述的视频解码方法。

根据本申请实施例的一个方面，提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述各种实施例中提供的视频解码方法。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本申请。

附图简要说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本申请的实施例，并与说明书一起用于解释本申请的原理。显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。在附图中：

图1示出了可以应用本申请实施例的技术方案的示例性系统架构的示意图；

图2示出视频编码装置和视频解码装置在流式传输系统中的放置方式示意图；

图3示出了一个视频编码器的基本流程图；

图4示出了SBT划分导出的解析图；

图5示出了SBT的划分模式示意图；

图6示出了子块变换技术中的变换组合示意图；

图7示出了根据本申请的一个实施例的视频解码方法的流程图；

图8示出了根据本申请的一个实施例的视频解码装置的框图；

图9示出了适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。

具体实施方式

现在将参考附图更全面地描述示例实施方式。然而，示例实施方式能够以多种形式实施，且不应被理解为限于在此阐述的范例；相反，提供这些实施方式使得本申请将更加全面和完整，并将示例实施方式的构思全面地传达给本领域的技术人员。

此外，所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中，提供许多具体细节从而给出对本申请的实施例的充分理解。然而，本领域技术人员将意识到，可以实践本申请的技术方案而没有特定细节中的一个或更多，或者可以采用其它的方法、组元、装置、步骤等。在其它情况下，不详细示出或描述公知方法、装置、实现或者操作以避免模糊本申请的各方面。

图1示出了可以应用本申请实施例的技术方案的示例性系统架构的示意图。

如图1所示，系统架构100包括多个终端装置，所述终端装置可通过例如网络150彼此通信。举例来说，系统架构100可以包括通过网络150互连的第一终端装置110和第二终端装置120。在图1的实施例中，第一终端装置110和第二终端装置120执行单向数据传输。

举例来说，第一终端装置110可对视频数据(例如由第一终端装置110采集的视频图片流)进行编码以通过网络150传输到第二终端装置120，已编码的视频数据以一个或多个已编码视频码流形式传输，第二终端装置120可从网络150接收已编码视频数据，对已编码视频数据进行解码以恢复视频数据，并根据恢复的视频数据显示视频图片。

在本申请的一个实施例中，系统架构100可以包括执行已编码视频数据的双向传输的第三终端装置130和第四终端装置140，所述双向传输比如可以发生在视频会议期间。对于双向数据传输，第三终端装置130和第四终端装置140中的每个终端装置可对视频数据(例如由终端装置采集的视频图片流)进行编码，以通过网络150传输到第三终端装置130和第四终端装置140中的另一终端装置。第三终端装置130和第四终端装置140中的每个终端装置还可接收由第三终端装置130和第四终端装置140中的另一终端装置传输的已编码视频数据，且可对已编码视频数据进行解码以恢复视频数据，并可根据恢复的视频数据在可访问的显示装置上显示视频图片。

在图1的实施例中，第一终端装置110、第二终端装置120、第三终端装置130和第四终端装置140可为服务器、个人计算机和智能电话，但本申请公开的原理可不限于此。本申请公开的实施例适用于膝上型计算机、平板电脑、媒体播放器和/或专用视频会议设备。网络150表示在第一终端装置110、第二终端装置120、第三终端装置130和第四终端装置140之间传送已编码视频数据的任何数目的网络，包括例如有线和/或无线通信网络。通信网络150可在电路交换和/或分组交换信道中交换数据。该网络可包括电信网络、局域网、广域网和/或互联网。出于本申请的目的，除非在下文中有所解释，否则网络150的架构和拓扑对于本申请公开的操作来说可能是无关紧要的。

在本申请的一个实施例中，图2示出了视频编码装置和视频解码装置在流式传输环境中的放置方式。本申请所公开主题可同等地适用于其它支持视频的应用，包括例如视频会议、数字TV(television，电视机)、在包括CD、DVD、存储棒等的数字介质上存储压缩视频等等。

流式传输系统可包括采集子系统213，采集子系统213可包括数码相机等视频源201，视频源创建未压缩的视频图片流202。在实施例中，视频图片流202包括由数码相机拍摄的样本。相较于已编码的视频数据204(或已编码的视频码流204)，视频图片流202被描绘为粗线以强调高数据量的视频图片流，视频图片流202可由电子装置220处理，电子装置220包括耦接到视频源201的视频编码装置203。视频编码装置203可包括硬件、软件或软硬件组合以实现或实施如下文更详细地描述的所公开主题的各方面。相较于视频图片流202，已编码的视频数据204(或已编码的视频码流204)被描绘为细线以强调较低数据量的已编码的视频数据204(或已编码的视频码流204)，其可存储在流式传输服务器205上以供将来使用。一个或多个流式传输客户端子系统，例如图2中的客户端子系统206和客户端子系统208，可访问流式传输服务器205以检索已编码的视频数据204的副本207和副本209。客户端子系统206可包括例如电子装置230中的视频解码装置210。视频解码装置210对已编码的视频数据的传入副本207进行解码，且产生可在显示器212(例如显示屏)或另一呈现装置上呈现的输出视频图片流211。在一些流式传输系统中，可根据某些视频编码/压缩标准对已编码的视频数据204、视频数据207和视频数据209(例如视频码流)进行编码。该些标准的实施例包括ITU-T H.265。在实施例中，正在开发的视频编码标准非正式地称为下一代视频编码(Versatile Video Coding，VVC)，本申请可用于VVC标准的上下文中。

应注意，电子装置220和电子装置230可包括图中未示出的其它组件。举例来说，电子装置220可包括视频解码装置，且电子装置230还可包括视频编码装置。

在本申请的一个实施例中，以国际视频编码标准HEVC(High Efficiency Video Coding，高效率视频编码)、VVC(Versatile Video Coding，多功能视频编码)，以及中国国家视频编码标准AVS为例，当输入一个视频帧图像之后，会根据一个块大小，将视频帧图像划分成若干个不重叠的处理单元，每个处理单元将进行类似的压缩操作。这个处理单元被称作CTU(Coding Tree Unit，编码树单元)，或者称之为LCU(Largest Coding Unit，最大编码单元)。CTU再往下可以继续进行更加精细的划分，得到一个或多个基本的编码单元CU，CU是一个编码环节中最基本的元素。以下介绍对CU进行编码时的一些概念：

预测编码(Predictive Coding)：预测编码包括了帧内预测和帧间预测等方式，原始视频信号经过选定的已重建视频信号的预测后，得到残差视频信号。编码端需要为当前CU决定选择哪一种预测编码模式，并告知解码端。其中，帧内预测是指预测的信号来自于同一图像内已经编码重建过的区域；帧间预测是指预测的信号来自已经编码过的、不同于当前图像的其它图像(称之为参考图像)。

变换及量化(Transform&Quantization)：残差视频信号经过DFT(Discrete Fourier Transform，离散傅里叶变换)、DCT等变换操作后，将信号转换到变换域中，称之为变换系数。变换系数进一步进行有损的量化操作，丢失掉一定的信息，使得量化后的信号有利于压缩表达。在一些视频编码标准中，可能有多于一种变换方式可以选择，因此编码端也需要为当前CU选择其中的一种变换方式，并告知解码端。量化的精细程度通常由量化参数(Quantization Parameter，简称QP)来决定，QP取值较大，表示更大取值范围的系数将被量化为同一个输出，因此通常会带来更大的失真及较低的码率；相反，QP取值较小，表示较小取值范围的系数将被量化为同一个输出，因此通常会带来较小的失真，同时对应较高的码率。

熵编码(Entropy Coding)或统计编码：量化后的变换域信号将根据各个值出现的频率进行统计压缩编码，最后输出二值化(0或者1)的压缩码流。同时，编码产生其他信息，例如选择的编码模式、运动矢量数据等，也需要进行熵编码以降低码率。统计编码是一种无损的编码方式，可以有效的降低表达同样信号所需要的码率，常见的统计编码方式有变长编码(Variable Length Coding，简称VLC)或者基于上下文的二值化算术编码(Content Adaptive Binary Arithmetic Coding，简称CABAC)。

环路滤波(Loop Filtering)：经过变换及量化的信号会通过反量化、反变换及预测补偿的操作获得重建图像。重建图像与原始图像相比由于存在量化的影响，部分信息与原始图像有所不同，即重建图像会产生失真(Distortion)。因此，可以对重建图像进行滤波操作，例如去块效应滤波(Deblocking filter，简称DB)、SAO(Sample Adaptive Offset，样本自适应补偿)或者ALF(Adaptive Loop Filter，自适应环路滤波)等滤波器，可以有效降低量化所产生的失真程度。由于这些经过滤波后的重建图像将作为后续编码图像的参考来对将来的图像信号进行预测，因此上述的滤波操作也被称为环路滤波，即在编码环路内的滤波操作。

在本申请的一个实施例中，图3示出了一个视频编码器的基本流程图，在该流程中以帧内预测为例进行说明。其中，原始图像信号s _k[x,y]与预测图像信号

做差值运算，得到残差信号u _k[x,y]，残差信号u _k[x,y]经过变换及量化处理之后得到量化系数，量化系数一方面通过熵编码得到编码后的比特流，另一方面通过反量化及反变换处理得到重构残差信号u' _k[x,y]，预测图像信号

与重构残差信号u' _k[x,y]叠加生成图像信号

图像信号

一方面输入至帧内模式决策模块和帧内预测模块进行帧内预测处理，另一方面通过环路滤波输出重建图像信号s' _k[x,y]，重建图像信号s' _k[x,y]可以作为下一帧的参考图像进行运动估计及运动补偿预测。然后基于运动补偿预测的结果s' _r[x+m _x,y+m _y]和帧内预测结果

得到下一帧的预测图像信号

并继续重复上述过程，直至编码完成。

基于上述的编码过程，在解码端针对每一个CU，在获取到压缩码流(即比特流)之后，进行熵解码获得各种模式信息及量化系数。然后量化系数经过反量化及反变换处理得到残差信号。另一方面，根据已知的编码模式信息，可获得该CU对应的预测信号，然后将残差信号与预测信号相加之后即可得到重建信号，重建信号再经过环路滤波等操作，产生最终的输出信号。

在上述的编解码过程中，对残差信号的变换处理使得残差信号的能量集中在较少的低频系数，也就是多数系数值较小。然后经过后续的量化模块后，较小系数值将变为零值，极大降低了编码残差信号的代价。但是，由于残差分布的多样性，单一的DCT变换无法适应所有的残差特性，因此，DST7和DCT8这样的变换核被引入到变换处理过程中，并且对残差信号进行的水平变换和竖直变换可以采用不同的变换核。以AMT(Adaptive multiple core transform，自适应多核变换)技术为例，对于一个残差信号进行变换处理可能选择的变换组合如下所示：(DCT2，DCT2)、(DCT8，DCT8)、(DCT8，DST7)、(DST7，DCT8)和(DST7，DST7)。

同时，AVS3中也提到了子块变换(Sub-Block Transform，简称SBT)技术。图4示出了SBT划分导出的解析图。其中，SBT存在8种子块划分结果，并且只对子块中的灰色部分(非0残差子块)进行变换编码，而对于白色部分(0残差子块)则强行清零。具体而言，如下述表1所示为AVS3标准中关于SBT的相关说明：

表1

参见表1所示，当SBT的使能标志位SbtEnableFlag使能，且满足编码块的宽度(width)和高度(height)等条件之后将解析sbt_cu_flag并赋值给SbtCuFlag(值为0或1)。若SbtCuFlag为1，则执行条件赋值SbtVerHalf＝width>＝8、SbtVerQuad＝width>＝16、SbtHorHalf＝height>＝8和SbtHorQuad＝height>＝16。其中，SbtVerHalf表示竖直二分模式标识，SbtVerQuad表示竖直四分模式标识，SbtHorHalf表示水平二分模式标识，SbtHorQuad表示水平四分模式标识。

即在目前的AVS3标准中，可执行SBT的编码块尺寸应满足如下条件：(width<＝64)&&(height<＝64)&&(width>4||height>4)。并且在此基础上，不同划分模式的编码块尺寸有进一步的限制，如下所示：

对于水平四分模式：SbtHorQuad＝height>＝16？1:0，此处SbtHorQuad值为1表示允许进行水平四分模式，SbtHorQuad值为0表示禁止进行水平四分模式。

对于水平二分模式：SbtHorHalf＝height>＝8？1:0，此处SbtHorHalf值为1表示允许进行水平二分模式，SbtHorHalf值为0表示禁止进行水平二分模式。

对于竖直四分模式：SbtVerQuad＝width>＝16？1:0，此处SbtVerQuad值为1表示允许进行竖直四分模式，SbtVerQuad值为0表示禁止进行竖直四分模式。

对于竖直二分模式：SbtVerHalf＝width>＝8？1:0，此处SbtVerHalf值为1表示允许进行竖直二分模式，SbtVerHalf值为0表示禁止进行竖直二分模式。

继续参照表1所示，如果SbtVerHalf或SbtHorHalf值为1，且SbtVerQuad或SbtHorQuad值为1，那么将解析sbt_quad_flag(值为0或1)。如果SbtQuadFlag、SbtVerQuad和SbtHorQuad的值都为1，或者！SbtQuadFlag、SbtVerHalf和SbtHorHalf的值都为1，那么将解析sbt_dir_flag(值为0或1)。

在表1的基础上，结合图4所示，如果quad的值为1、dir的值为0、pos的值为0，则采用竖直四分模式，并且只对左侧子块(灰色部分)进行变换编码，而对于其它子块 (白色部分)则强行清零；如果quad的值为1、dir的值为0、pos的值为1，则采用竖直四分模式，并且只对右侧子块(灰色部分)进行变换编码，而对于其它子块(白色部分)则强行清零；如果quad的值为1、dir的值为1、pos的值为0，则采用水平四分模式，并且只对上方子块(灰色部分)进行变换编码，而对于其它子块(白色部分)则强行清零；如果quad的值为1、dir的值为1、pos的值为1，则采用水平四分模式，并且只对下方子块(灰色部分)进行变换编码，而对于其它子块(白色部分)则强行清零；如果quad的值为0、dir的值为0、pos的值为0，则采用竖直二分模式，并且只对左侧子块(灰色部分)进行变换编码，而对于其它子块(白色部分)则强行清零；如果quad的值为0、dir的值为0、pos的值为1，则采用竖直二分模式，并且只对右侧子块(灰色部分)进行变换编码，而对于其它子块(白色部分)则强行清零；如果quad的值为0、dir的值为1、pos的值为0，则采用水平二分模式，并且只对上方子块(灰色部分)进行变换编码，而对于其它子块(白色部分)则强行清零；如果quad的值为0、dir的值为1、pos的值为1，则采用水平二分模式，并且只对下方子块(灰色部分)进行变换编码，而对于其它子块(白色部分)则强行清零。

其中，图4中的quad可视为子块的尺寸控制语法，dir和pos均可视为控制子块位置的语法，换句话说，quad决定子块的尺寸(面积)，而dir和pos可决定子块的位置。同时，图4中的quad、dir和pos分别与AVS3文本中的sbt_quad_flag、sbt_dir_flag和sbt_pos_flag对应。sbt_quad_flag、sbt_dir_flag可从码流中直接解析获得(参照表1所示)，sbt_pos_flag则通过对系数统计隐含导出。sbt_quad_flag、sbt_dir_flag和sbt_pos_flag联合决定具体的SBT划分模式。

基于图4可知，SBT的8种划分模式可按照划分方式和划分方向如图5进行分类。其中，水平模式和竖直模式分别在水平方向和竖直方向上对当前编码块进行划分，四分模式和二分模式分别表示沿着对应划分方向划分出1/4和1/2的子块进行编码。

在SBT的8种划分模式中，针对灰色子块不再进一步划分，直接进行系数编码。

关于子块的变换组合选择，当非0残差子块的宽或高为64时，该非0残差子块的水平和竖直变换均为DCT-2；其它情况下，水平和竖直变换的选择如图6所示。在图6中，会对子块中的灰色部分按照所标识的变换模式进行水平变换和竖直变换编码，而对于白色部分则强行清零，图6中的w1可以是w(宽度)的1/2，或者可以是w的1/4；h1可以是h(高度)的1/2，或者可以是h的1/4。

此外，也可以通过配置编码器在灰色部分的残差编码的过程中跳过变换，直接进行量化和系数编码。

虽然AVS3标准中目前的SBT方案对编码块的尺寸进行了一定的限制，但是对编码块进行划分之后，可能仍然会产生过窄的子块。比如对于64×8(宽×高)的编码块，进行水平二分会产生64×4的变换块，其在水平方向过窄；对于64×16(宽×高)的编码块，进行水平四分会产生64×4的变换块，其在水平方向过窄。由于过窄的变换块会降低硬件性能，影响编解码效率。因此本申请实施例的技术方案提出了进一步对采用SBT技术的编码块进行限制的方案，避免了划分得到过窄的子块，有效保证了硬件的性能，提高了编解码效率。详细说明如下：

图7示出了根据本申请的一个实施例的视频解码方法的流程图，该视频解码方法可以由具有计算处理功能的设备来执行，比如可以由终端设备或服务器来执行。参照图7所示，该视频解码方法至少包括步骤S710至步骤S740，详细介绍如下：

在步骤S710中，获取视频图像帧的编码块。

在本申请的一个实施例中，视频图像帧序列包括了一系列图像，每张图像可以被进一步划分为条带(Slice)，条带又可以划分为一系列的LCU(或CTU)，LCU包含有若干CU。视频图像帧在编码时是以块为单位进行编码处理，在一些新的视频编码标准中，比如在H.264标准中有宏块(macroblock，MB)，宏块可进一步划分成多个可用于预测编码的预测块(prediction)。在HEVC标准中，采用编码单元CU、预测单元(prediction unit，PU)和变换单元(transform unit，TU)等基本概念，从功能上划分了多种块单元，并采用全新的基于树的结构进行描述。比如CU可以按照四叉树划分为更小的CU，而更小的CU还可以继续划分，从而形成一种四叉树结构。本申请实施例中的编码块可以是CU，或者是比CU更小的块，如对CU进行划分得到的更小的块。

在步骤S720中，若编码块需要进行子块变换，则根据编码块的尺寸和所允许的子块最大尺寸比确定编码块能够采用的划分模式。

在本申请的一个实施例中，可以根据编码块中包含的显式索引和/或隐含导出索引来确定编码块是否需要采用子块变换技术。

在本申请的一个实施例中，子块最大尺寸比可以包括最大宽高比和最大高宽比，且最大宽高比的值与最大高宽比的值相等。在这种情况下，可以从视频图像帧的序列头中解码出子块最大尺寸比的值。

在本申请的一个实施例中，子块最大尺寸比可以包括最大宽高比和最大高宽比，且最大宽高比的值与最大高宽比的值不相等。在这种情况下，可以从视频图像帧的序列头中分别解码出最大宽高比的值与最大高宽比的值。

在本申请的一个实施例中，子块最大尺寸比的值可以复用标准中所允许的编码块最大尺寸比的值，即子块最大尺寸比的值可以与允许的编码块最大尺寸比的值相同。

在本申请的一个实施例中，根据编码块的尺寸和所允许的子块最大尺寸比确定编码块能够采用的划分模式的过程具体包括：若编码块的宽度大于或等于8，且编码块的2倍高度小于或等于宽度与子块最大尺寸比的乘积，则允许编码块采用竖直二分模式，否则禁止编码块采用竖直二分模式。在该实施例中，该子块最大尺寸比为最大高宽比。

在本申请的一个实施例中，根据编码块的尺寸和所允许的子块最大尺寸比确定编码块能够采用的划分模式的过程具体包括：若编码块的宽度大于或等于16，且编码块的4倍高度小于或等于宽度与子块最大尺寸比的乘积，则允许编码块采用竖直四分模式，否则禁止编码块采用竖直四分模式。在该实施例中，该子块最大尺寸比为最大高宽比。

在本申请的一个实施例中，根据编码块的尺寸和所允许的子块最大尺寸比确定编码块能够采用的划分模式的过程具体包括：若编码块的高度大于或等于8，且编码块的2倍宽度小于或等于高度与子块最大尺寸比的乘积，则允许编码块采用水平二分模式，否则禁止编码块采用水平二分模式。在该实施例中，该子块最大尺寸比为最大宽高比。

在本申请的一个实施例中，根据编码块的尺寸和所允许的子块最大尺寸比确定编码块能够采用的划分模式的过程具体包括：若编码块的高度大于或等于16，且编码块的4倍宽度小于或等于高度与子块最大尺寸比的乘积，则允许编码块采用水平四分模式，否则禁止编码块采用水平四分模式。在该实施例中，该子块最大尺寸比为最大宽高比。

继续参照图7所示，在步骤S730中，基于编码块能够采用的划分模式，确定对编码块进行子块变换处理时所采用的目标划分模式。

在本申请的一个实施例中，具体确定编码块在进行子块变换处理时所采用的目标划分模式可以参照前述实施例的技术方案(如表1和图4所示的方案)，不再赘述。

在步骤S740中，基于目标划分模式对编码块进行划分处理，并对划分得到的多个子块进行解码处理。

在本申请的一个实施例中，在对划分得到的多个子块进行解码处理的过程中，子块既可以执行变换跳过操作，也可以执行反变换操作。该过程是编码端的逆过程，如果编码端对子块执行了变换跳过操作，那么解码端对子块也执行变换跳过操作；如果编码端对子块执行了变换操作，那么解码端对子块也执行反变换操作。

综上，本申请实施例的技术方案在SBT现有的编码块尺寸限制的基础上，进一步增加了如下的一些限制：

对于水平四分模式：SbtHorQuad＝(width×4<＝height×MaxPartRatio)？SbtHorQuad:0，此处SbtHorQuad值为1表示允许进行水平四分模式，SbtHorQuad值为0表示禁止进行水平四分模式。

对于水平二分模式：SbtHorHalf＝(width×2<＝height×MaxPartRatio)？SbtHorHalf:0，此处SbtHorHalf值为1表示允许进行水平二分模式，SbtHorHalf值为0表示禁止进行水平二分模式。

对于竖直四分模式：SbtVerQuad＝(height×4<＝width×MaxPartRatio)？SbtVerQuad:0，此处SbtVerQuad值为1表示允许进行竖直四分模式，SbtVerQuad值为0表示禁止进行竖直四分模式。

对于竖直二分模式：SbtVerHalf＝(height×2<＝width×MaxPartRatio)？SbtVerHalf:0，此处SbtVerHalf值为1表示允许进行竖直二分模式，SbtVerHalf值为0表示禁止进行竖直二分模式。

其中，MaxPartRatio表示所允许的子块最大尺寸比，该子块最大尺寸比包含最大宽高比和最大高宽比(均为非零整数)，通常情况下，最大宽高比和最大高宽比相等。如果最大宽高比和最大高宽比不相等，那么对于水平四分模式和水平二分模式而言，该最大尺寸比可以采用最大宽高比；对于竖直四分模式和竖直二分模式而言，该最大尺寸比可以采用最大高宽比。

在本申请的一个实施例中，如果最大宽高比和最大高宽比相等，那么在SBT打开时，可以在序列头中进行编码，并且也可以复用现有AVS3标准中所允许的编码块最大宽高比，即子块最大尺寸比的值可以与允许的编码块最大尺寸比的值相同。如果最大宽高比和最大高宽比不相等，那么在SBT打开时，可以在序列头中分别进行编码。

基于本申请实施例中增加的限制条件，可以对SBT的相关说明修改为如表2所示：

表2

基于表2中所示的相关限制条件，在本申请的一个实施例中，如果MaxPartRatio＝8，那么对于8×64的编码块，禁止竖直二分划分出4×64的子块；对于16×64的编码块，禁止竖直四分划分出4×64的子块；对于64×8的编码块，禁止水平二分划分出64×4的子块；对于64×16的编码块，禁止水平四分划分出64×4的子块。可见，本申请实施例的技术方案能够通过允许的子块最大尺寸比和编码块的尺寸来对编码块的划分模式进行限制，避免了划分得到过窄的子块，有效保证了硬件的性能，提高了编解码效率。

在实施例中，对于编码端，需要执行视频编码的方法。该视频编码方法可以由编码器端具有计算处理功能的设备来执行，比如可以由终端设备或服务器来执行。该视频编码方法可以包括：在获取到视频图像帧的残差系数块之后，可以根据残差系数块的尺寸和所允许的子块最大尺寸比确定残差系数块能够采用的划分模式，然后从能够采用的划分模式中选择针对残差系数块的目标划分模式，进而将目标划分模式的信息编码至码流中。

在实施例中，编码端可以基于RDO(Rate Distortion Optimization，率失真优化)从残差系数块能够采用的划分模式中选择一个最优的划分模式作为目标划分模式。

以下介绍本申请的装置实施例，可以用于执行本申请上述实施例中的视频解码方法。对于本申请装置实施例中未披露的细节，请参照本申请上述的视频解码方法的实施例。

图8示出了根据本申请的一个实施例的视频解码装置的框图，该视频解码装置可以设置在具有计算处理功能的设备内，比如可以设置在终端设备或服务器内。

参照图8所示，根据本申请的一个实施例的视频解码装置800，包括：获取单元802、第一处理单元804、第二处理单元806和第三处理单元808。

其中，获取单元802配置为获取视频图像帧的编码块；第一处理单元804配置为若所述编码块需要进行子块变换，则根据所述编码块的尺寸和所允许的子块最大尺寸比确定所述编码块能够采用的划分模式；第二处理单元806配置为基于所述编码块能够采用的划分模式，确定对所述编码块进行子块变换处理时所采用的目标划分模式；第三处理单元808配置为基于所述目标划分模式对所述编码块进行划分处理，并对划分得到的多个子块进行解码处理。

在本申请的一些实施例中，基于前述方案，第一处理单元804配置为：若所述编码块的宽度大于或等于8，且所述编码块的2倍高度小于或等于所述宽度与所述子块最大尺寸比的乘积，则允许所述编码块采用竖直二分模式，否则禁止所述编码块采用所述竖直二分模式。

在本申请的一些实施例中，基于前述方案，第一处理单元804配置为：若所述编码块的宽度大于或等于16，且所述编码块的4倍高度小于或等于所述宽度与所述子块最大尺寸比的乘积，则允许所述编码块采用竖直四分模式，否则禁止所述编码块采用所述竖直四分模式。

在本申请的一些实施例中，基于前述方案，所述子块最大尺寸比为最大高宽比。

在本申请的一些实施例中，基于前述方案，第一处理单元804配置为：若所述编码块的高度大于或等于8，且所述编码块的2倍宽度小于或等于所述高度与所述子块最大尺寸比的乘积，则允许所述编码块采用水平二分模式，否则禁止所述编码块采用所述水平二分模式。

在本申请的一些实施例中，基于前述方案，第一处理单元804配置为：若所述编码块的高度大于或等于16，且所述编码块的4倍宽度小于或等于所述高度与所述子块最大尺寸比的乘积，则允许所述编码块采用水平四分模式，否则禁止所述编码块采用所述水平四分模式。

在本申请的一些实施例中，基于前述方案，所述子块最大尺寸比为子块的最大宽高比。

在本申请的一些实施例中，基于前述方案，所述子块最大尺寸比包括最大宽高比和最大高宽比，所述最大宽高比的值与所述最大高宽比的值相等；所述视频解码装置800还包括：第一解码单元，配置为从所述视频图像帧的序列头中解码出所述子块最大尺寸比的值。

在本申请的一些实施例中，基于前述方案，所述子块最大尺寸比包括最大宽高比和最大高宽比，所述最大宽高比的值与所述最大高宽比的值不相等；所述视频解码装置800还包括：第二解码单元，配置为从所述视频图像帧的序列头中分别解码出所述最大宽高比的值与所述最大高宽比的值。

在本申请的一些实施例中，基于前述方案，所述子块最大尺寸比的值与所允许的编码块最大尺寸比的值相同。

在本申请的一些实施例中，基于前述方案，所述第三处理单元808配置为：在对划分得到的多个子块进行解码处理的过程中，执行变换跳过操作或者执行反变换操作。

本申请的实施例还提供了一种视频编码装置，该视频编码装置可以设置在编码器端具有计算处理功能的设备内，比如可以设置在终端设备或服务器内。该视频编码装置可以包括：获取单元，配置为获取视频图像帧的残差系数块；第四处理单元，配置为根据所述残差系数块的尺寸和所允许的子块最大尺寸比确定所述残差系数块能够采用的划分模式；选择单元，配置为从所述能够采用的划分模式中选择针对所述残差系数块的目标划分模式；编码单元，配置为将所述目标划分模式的信息编码至码流中。

在本申请的一些实施例所提供的技术方案中，通过在编码块需要进行子块变换时，根据编码块的尺寸和允许的子块最大尺寸比来确定编码块能够采用的划分模式，使得能够通过允许的子块最大尺寸比和编码块的尺寸来对编码块的划分模式进行限制，避免了划分得到过窄的子块，有效保证了硬件的性能，提高了编解码效率。

需要说明的是，图9示出的电子设备的计算机系统900仅是一个示例，不应对本申请实施例的功能和使用范围带来任何限制。

如图9所示，计算机系统900包括中央处理单元(Central Processing Unit，CPU)901，其可以根据存储在只读存储器(Read-Only Memory，ROM)902中的程序或者从存储部分908加载到随机访问存储器(Random Access Memory，RAM)903中的程序而执行各种适当的动作和处理，例如执行上述实施例中所述的方法。在RAM 903中，还存储有系统操作所需的各种程序和数据。CPU 901、ROM 902以及RAM 903通过总线904彼此相连。输入/输出(Input/Output，I/O)接口905也连接至总线904。

以下部件连接至I/O接口905：包括键盘、鼠标等的输入部分906；包括诸如阴极射线管(Cathode Ray Tube，CRT)、液晶显示器(Liquid Crystal Display，LCD)等以及扬声器等的输出部分907；包括硬盘等的存储部分908；以及包括诸如LAN(Local Area Network，局域网)卡、调制解调器等的网络接口卡的通信部分909。通信部分909经由诸如因特网的网络执行通信处理。驱动器910也根据需要连接至I/O接口905。可拆卸介质911，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器910上，以便于从其上读出的计算机程序根据需要被安装入存储部分908。

根据本申请的实施例，上文参考流程图描述的过程可以被实现为计算机软件程序。例如，本申请的实施例包括一种计算机程序产品，其包括承载在计算机可读介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的计算机程序。在这样的实施例中，该计算机程序可以通过通信部分909从网络上被下载和安装，和/或从可拆卸介质911被安装。在该计算机程序被中央处理单元(CPU)901执行时，执行本申请的系统中限定的各种功能。

需要说明的是，本申请实施例所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(Erasable Programmable Read Only Memory，EPROM)、闪存、光纤、便携式紧凑磁盘只读存储器(Compact Disc Read-Only Memory，CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中，计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的计算机程序。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的计算机程序可以用任何适当的介质传输，包括但不限于：无线、有线等等，或者上述的任意合适的组合。

作为另一方面，本申请还提供了一种计算机可读介质，该计算机可读介质可以是上述实施例中描述的电子设备中所包含的；也可以是单独存在，而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序，当上述一个或者多个程序被一个该电子设备执行时，使得该电子设备实现上述实施例中所述的方法。

本领域技术人员在考虑说明书及实践这里公开的实施方式后，将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。

应当理解的是，本申请并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求来限制。

Claims

一种视频解码方法，包括：

获取视频图像帧的编码块；

若所述编码块需要进行子块变换，则根据所述编码块的尺寸和所允许的子块最大尺寸比确定所述编码块能够采用的划分模式；

基于所述编码块能够采用的划分模式，确定对所述编码块进行子块变换处理时所采用的目标划分模式；

基于所述目标划分模式对所述编码块进行划分处理，并对划分得到的多个子块进行解码处理。
根据权利要求1所述的视频解码方法，其中，根据所述编码块的尺寸和所允许的子块最大尺寸比确定所述编码块能够采用的划分模式，包括：

若所述编码块的宽度大于或等于8，且所述编码块的2倍高度小于或等于所述宽度与所述子块最大尺寸比的乘积，则允许所述编码块采用竖直二分模式，否则禁止所述编码块采用所述竖直二分模式。
根据权利要求1所述的视频解码方法，其中，根据所述编码块的尺寸和所允许的子块最大尺寸比确定所述编码块能够采用的划分模式，包括：

若所述编码块的宽度大于或等于16，且所述编码块的4倍高度小于或等于所述宽度与所述子块最大尺寸比的乘积，则允许所述编码块采用竖直四分模式，否则禁止所述编码块采用所述竖直四分模式。
根据权利要求2或3所述的视频解码方法，其中，所述子块最大尺寸比为子块的最大高宽比。
根据权利要求1所述的视频解码方法，其中，根据所述编码块的尺寸和所允许的子块最大尺寸比确定所述编码块能够采用的划分模式，包括：

若所述编码块的高度大于或等于8，且所述编码块的2倍宽度小于或等于所述高度与所述子块最大尺寸比的乘积，则允许所述编码块采用水平二分模式，否则禁止所述编码块采用所述水平二分模式。
根据权利要求1所述的视频解码方法，其中，根据所述编码块的尺寸和所允许的子块最大尺寸比确定所述编码块能够采用的划分模式，包括：

若所述编码块的高度大于或等于16，且所述编码块的4倍宽度小于或等于所述高度与所述子块最大尺寸比的乘积，则允许所述编码块采用水平四分模式，否则禁止所述编码块采用所述水平四分模式。
根据权利要求5或6所述的视频解码方法，其中，所述子块最大尺寸比为子块的最大宽高比。
根据权利要求1所述的视频解码方法，其中，所述子块最大尺寸比包括最大宽高比和最大高宽比，所述最大宽高比的值与所述最大高宽比的值相等；

所述视频解码方法还包括：从所述视频图像帧的序列头中解码出所述子块最大尺寸比的值。
根据权利要求1所述的视频解码方法，其中，所述子块最大尺寸比包括最大宽高比和最大高宽比，所述最大宽高比的值与所述最大高宽比的值不相等；

所述视频解码方法还包括：从所述视频图像帧的序列头中分别解码出所述最大宽高比的值与所述最大高宽比的值。
根据权利要求1所述的视频解码方法，其中，所述子块最大尺寸比的值与所允许的编码块最大尺寸比的值相同。
根据权利要求1所述的视频解码方法，其中，在对划分得到的多个子块进行解码处理的过程中，执行变换跳过操作或者执行反变换操作。
一种视频编码方法，包括：

获取视频图像帧的残差系数块；

根据所述残差系数块的尺寸和所允许的子块最大尺寸比确定所述残差系数块能够采用的划分模式；

从所述能够采用的划分模式中选择针对所述残差系数块的目标划分模式；

将所述目标划分模式的信息编码至码流中。
一种视频解码装置，包括：

获取单元，配置为获取视频图像帧的编码块；

第一处理单元，配置为若所述编码块需要进行子块变换，则根据所述编码块的尺寸和所允许的子块最大尺寸比确定所述编码块能够采用的划分模式；

第二处理单元，配置为基于所述编码块能够采用的划分模式，确定对所述编码块进行子块变换处理时所采用的目标划分模式；

第三处理单元，配置为基于所述目标划分模式对所述编码块进行划分处理，并对划分得到的多个子块进行解码处理。
一种视频编码装置，包括：

获取单元，配置为获取视频图像帧的残差系数块；

第四处理单元，配置为根据所述残差系数块的尺寸和所允许的子块最大尺寸比确定所述残差系数块能够采用的划分模式；

选择单元，配置为从所述能够采用的划分模式中选择针对所述残差系数块的目标划分模式；

编码单元，配置为将所述目标划分模式的信息编码至码流中。
一种电子设备，包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行时，使得所述一个或多个处理器实现如权利要求1至12中任一项所述的方法。
一种计算机可读介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1至12中任一项所述的方法。