CN113615180A

CN113615180A - L形划分树

Info

Publication number: CN113615180A
Application number: CN202180002570.2A
Authority: CN
Inventors: 赵欣; 赵亮; 刘彬
Original assignee: Tencent America LLC
Current assignee: Tencent America LLC
Priority date: 2020-01-08
Filing date: 2021-01-07
Publication date: 2021-11-05
Also published as: EP4088458A4; US20210211660A1; US11240501B2; US20220116601A1; EP4088458A1; WO2021142118A1; KR20210140821A; US12010306B2; JP7423126B2; JP2022530922A

Abstract

一种用于对视频数据进行编码/解码的方法，该方法包括：获取视频数据；解析所获得的视频数据以获取划分参数；基于划分参数来获取划分编码块；以及基于划分编码块对所获得的视频数据进行解码。划分编码块可以被划分成矩形分区和至少一个非矩形分区。

Description

L形划分树

相关申请的交叉引用

本申请要求于2020年1月8日提交的美国临时专利申请第62/958,417号以及于2020年11月3日提交的美国专利申请第17/087,918号的优先权，上述申请的全部内容并且入本文中。

技术领域

本公开总体上涉及数据处理领域，更具体地涉及关于L形划分树方法的视频编码和/或解码。

背景技术

AOMedia Video 1(AV1)是开放的视频编码格式，设计用于通过互联网进行视频传输。它是由开放媒体联盟(AOMedia)作为VP9的后继者开发的，AOMedia是2015年成立的联盟，包括半导体公司、视频点播提供商、视频内容生产商、软件开发公司和网络浏览器供应商。AV1项目的许多组件来自联盟成员的先前研究工作。个体贡献者早在几年前就开始了实验性技术平台：Xiph/Mozilla的Daala已于2010年发布代码，Google的实验性VP9演进项目VP10于2014年9月12日发布，Cisco的Thor于2015年8月11日发布。基于VP9的代码库，AV1结合了其他技术，其中一些技术是以这些实验格式开发的。AV1参考编解码器的第一个版本0.1.0于2016年4月7日发布。该联盟于2018年3月28日宣布发布AV1比特流规范，以及基于软件的参考编码器和解码器。2018年6月25日，发布了经过验证的规范1.0.0版。2019年1月8日，发布了带有规范勘误表1的经过验证的1.0.0版。AV1比特流规范包括参考视频编解码器。AOMedia Video 2(AV2)目前正在开发中。

ITU-T VCEG(Q6/16)和ISO/IEC MPEG(JTC 1/SC 29/WG 11)在2013(版本1)、2014(版本2)、2015(版本3)和2016(版本4)中公布了H.265/HEVC(High Efficiency VideoCoding，高效视频编码)标准。2015年，这两个标准组织联合组建了JVET(联合视频探索小组)，以探索开发超越HEVC的下一视频编码标准的潜力。2017年10月，他们发布了关于具有超越HEVC能力的视频压缩的联合提案(CfP)。截止2018年2月15日，分别提交了关于标准动态范围(High Dynamic Range，SDR)的总共22个CfP响应、关于高动态范围(HDR)的12个CfP响应以及关于360个视频类别的12个CfP响应。2018年4月，在122MPEG/第10次JVET会议中评估了所有接收到的CfP响应。这次会议的结果是，JVET正式地发起了超越HEVC的下一代视频编码的标准化处理。新标准被命名为多功能视频编码(Versatile Video Coding，VVC)，并且JVET被重新命名为联合视频专家组。

发明内容

实施方式涉及用于对视频数据进行编码和/或解码的方法、系统和计算机可读介质。

根据一个方面，提供了用于对视频数据进行编码和/或解码的方法。该方法可以包括：获取视频数据；解析所获得的视频数据以获取划分参数；基于划分参数来获取划分编码块；以及基于划分编码块对所获得的视频数据进行解码。划分编码块可以被划分成矩形分区和至少一个非矩形分区。

根据一个方面，提供了用于对视频数据进行编码和/或解码的设备。该设备可以包括：至少一个存储器，其配置成存储程序代码；以及至少一个处理器，其被配置成读取程序代码并且按照程序代码的指令进行操作，程序代码包括：第一获取代码，其被配置成使至少一个处理器获取视频数据；解析代码，其被配置成使至少一个处理器解析所获得的视频数据以获取划分参数；第二获取代码，其被配置成使至少一个处理器基于划分参数来获取划分编码块；以及解码代码，其被配置成使至少一个处理器基于划分编码块对所获得的视频数据进行解码。划分编码块可以被划分成矩形分区和至少一个非矩形分区。

根据一个方面，提供了一种非暂态计算机可读介质，用于对视频数据进行编码和/或解码。该非暂态计算机可读介质可以存储指令，所述指令包括一个或更多个指令，所述一个获更多个指令当由用于视频解码的装置的一个或更多个处理器执行时，使一个或更多个处理器：获取视频数据；解析所获得的视频数据以获取划分参数；基于划分参数来获取划分编码块；以及基于划分编码块对所获得的视频数据进行解码。划分编码块可以被划分成矩形分区和至少一个非矩形分区。

附图说明

根据对要结合附图阅读的说明性实施方式的下列详细描述，这些和其他对象、特征和优点将变得明显。附图的各种特征未按比例绘制，这是为了清楚地图示，以促进本领域技术人员结合具体实施方式的理解。在图中：

图1示出了根据至少一个实施方式的联网计算机环境；

图2示出了根据至少一个实施方式的VP9和AV1中的划分树的示例。

图3A至图3B示出了根据至少一个实施方式的四叉树二叉树结构的示例。

图4A至图4B示出了根据至少一个实施方式的三叉树划分的示例。

图5示出了根据至少一个实施方式的L形分区的示例。

图6A至图6D示出了根据至少一个实施方式的涉及L形分区的划分的示例。

图7A至图7D示出了根据至少一个实施方式的涉及L形分区的划分的示例。

图8A至图8D示出了根据至少一个实施方式的涉及L形分区的划分的示例。

图9A至图9D示出了根据至少一个实施方式的涉及L形分区的划分的示例。

图10A至图10D示出了根据至少一个实施方式的涉及L形分区的划分的示例。

图11A至图11D示出了根据至少一个实施方式的涉及L形分区的划分的示例。

图12是示出根据至少一个实施方式的由用于对视频数据进行编码的程序实施的步骤的操作流程图；

图13是根据至少一个实施方式的图1中描绘的计算机和服务器的内部组件和外部组件的框图；

图14是根据至少一个实施方式的包括图1中描绘的计算机系统的说明性云计算环境的框图；以及

图15是根据至少一个实施方式的图14的说明性云计算环境的功能层的框图。

具体实施方式

本文公开了所要求保护的结构和方法的详细实施方式；然而，可以理解，所公开的实施方式仅仅是对可以以各种形式实施的所要求保护的结构和方法的说明。然而，这些结构和方法可以以许多不同的形式来实施，并且不应被解释为限于本文中阐述的示例性实施方式。相反，提供这些示例性实施方式使得本公开内容将是透彻和完整的并且将向本领域技术人员充分地传达范围。在说明书中，可能省略公知特征和技术的细节，以避免不必要地模糊所呈现的实施方式。

实施方式总体上涉及数据处理领域，并且更具体地涉及视频编码和解码。以下描述的示例性实施方式提供了使用扩展量化器对视频数据进行编码和/或解码以有效压缩视频数据的系统、方法和计算机程序等。因此，一些实施方式具有通过在AV2中提供扩展量化器来改进计算领域的能力。

如前所述，AOMedia Video 1(AV1)是开放的视频编码格式，其设计用于通过互联网进行视频传输。AV1是由开放媒体联盟(AOMedia)作为VP9的后继者开发的，该联盟成立于2015年，包括半导体公司、视频点播提供商、视频内容生产商、软件开发公司和网络浏览器供应商。目前，AV1量化步长的分辨率有限。虽然步长范围增加了，但Q_index的有效范围是一样的。对于10位和12位内部位深度，量化步长分辨率的这种限制更为明显，其中(使用q_idx获得的)对应的8位步长分别按4和16缩放。这会影响编解码器可以实现的比特率的粒度。因此，通过扩展量化索引的范围来增加量化步长分辨率可能是有利的。

本文参考根据各种实施方式的方法、装置(系统)和计算机可读介质的流程图和/或框图来描述各方面。应当理解，可以通过计算机可读程序指令实现流程图和/或框图中的每个块以及流程图和/或框图中的块的组合。

现在参照图1，联网计算机环境的功能框图示出了根据示例性实施方式(例如本文中描述的实施方式)的用于对视频数据进行编码和/或解码的视频编码系统100(在下文中称为“系统”)。应当理解，图1仅提供了一种实现方式的说明，而不暗示对可以实现不同实施方式的环境的任何限制。可以基于设计和实现需求对所描述的环境进行许多修改。

系统100可以包括计算机102和服务器计算机114。计算机102可以经由通信网络110(在下文中，为“网络”)与服务器计算机114通信。计算机102可以包括处理器104和软件程序108，该软件程序存储在数据存储装置106上并且使得能够与用户交互以及与服务器计算机114通信。如以下将参照图13所讨论的，计算机102可以分别包括内部组件8000A和外部组件9000A，并且服务器计算机114可以分别包括内部组件8000B和外部组件9000B。计算机102可以是例如移动装置、电话、个人数字助理、上网本、膝上型计算机、平板计算机、台式计算机或能够运行程序、访问网络和访问数据库的任何类型的计算装置。

如以下关于图14和图15所讨论的，服务器计算机114还可以在例如软件即服务(Software as a Service，SaaS)、平台即服务(Platform as a Service，PaaS)或基础设施即服务(Infrastructure as a Service，IaaS)的云计算服务模型中操作。服务器计算机114还可以位于例如私有云、社区云、公共云或混合云的云计算布置模型中。

可以用于对视频数据进行编码的服务器计算机114能够运行可以与数据库112交互的视频编码程序116(在下文中，为“程序”)。下面关于图4更详细地说明视频编码程序方法。在一个实施方式中，计算机102可以作为包括用户界面的输入装置运行，而程序116可以主要在服务器计算机114上运行。在替选实施方式中，程序116可以主要在一个或更多个计算机102上运行，而服务器计算机114可以用于处理和存储由程序116使用的数据。应当注意，程序116可以是独立的程序，或者可以集成到更大的视频编码程序中。

然而，应当注意，在一些实例中，程序116的处理可以在计算机102和服务器计算机114之间以任何比率共享。在另一实施方式中，程序116可以在一个以上计算机、服务器计算机或计算机和服务器计算机的某种组合上运行，例如，多个计算机102通过网络110与单个服务器计算机114进行通信。在另一实施方式中，例如，程序116可以在多个服务器计算机114上运行，所述多个服务器计算机通过网络110与多个客户端计算机进行通信。替选地，程序可以在网络服务器上运行，该网络服务器通过网络与服务器以及多个客户端计算机进行通信。

网络110可以包括有线连接、无线连接、光纤连接或其某种组合。通常，网络110可以是支持计算机102与服务器计算机114之间的通信的连接和协议的任何组合。网络110可以包括各种类型的网络，例如局域网(Local Area Network，LAN)、诸如因特网的广域网(Wide Area Network，WAN)、诸如公共交换电话网(Public Switched Telephone Network，PSTN)的电信网络、无线网络、公共交换网络、卫星网络、蜂窝网络(例如，第五代(FifthGeneration，5G)网络、长期演进(Long-Term Evolution，LTE)网络、第三代(ThirdGeneration，3G)网络、码分多址(Code Division Multiple Access，CDMA)网络等)、公共陆地移动网络(Public Land Mobile Network，PLMN)、城域网(Metropolitan Area Network，MAN)、专用网络、自组织网络、内联网、基于光纤的网络等，和/或这些或其他类型的网络的组合。

图1所示的装置和网络的数目和布置被提供作为示例。实际上，除了图1所示的装置和/或网络以外，可以存在附加的装置和/或网络、更少的装置和/或网络、不同的装置和/或网络、或不同布置的装置和/或网络。此外，图1所示的两个或更多个装置可以在单个装置内实现，或者图1所示的单个装置可以实现为多个分布式装置。附加地或替选地，系统100的一组装置(例如，一个或更多个装置)可以执行被描述为由系统100的另一组装置执行的一个或更多个功能。

图2示出了VP9和AV1中的块划分的示例。VP9使用从64x64级别到4x4级别的4路划分树，其中对8x8以下的块有一些附加限制，如图2上半部分所示。注意，指定为R的分区涉及递归，其中以较低的尺度重复相同的划分树直到达到最低的4x4级别。

如同一附图所示的，AV1不仅将划分树扩展成10路结构，而且还将最大尺寸(VP9/AV1术语中称为超级块)增大至从128x128开始。注意，这包括VP9中不存在的4:1/1:4矩形划分。没有一个矩形划分可以进一步细分。此外，AV1为使用低于8x8级别的划分增加了更大的灵活性，因为现在对某些情况可以进行2x2色度帧间预测。

在HEVC中，通过使用表示为编码树的四叉树结构将编码树单元(Coding TreeUnit，CTU)划分成编码单元(Coding Unit，CU)以适应各种局部特征。在CU级别处确定是否使用图片间(时间)或图片内(空间)预测对图片区域进行编码。可以根据PU分割类型将每个CU进一步分割成一个、两个或四个预测单元(Prediction Unit，PU)。在一个PU内，应用相同的预测处理，并且将相关信息以PU为基础传输到解码器。在通过应用基于PU分割类型的预测处理获得残差块之后，可以根据另一个四叉树结构(类似于用于CU的编码树)将CU划分成变换单元(Transform Unit，TU)。HEVC结构的关键特征是它具有包括CU、PU和TU的多个划分概念。在HEVC中，对于帧间预测块，CU或TU只能是正方形，而PU可以是正方形或矩形。在HEVC中，还可以将一个编码块进一步分割成四个正方形子块，并且对每个子块即TU执行变换。可以进一步将每个TU递归地分割(使用四叉树分割)成被称为残差四叉树(Residual Quad-Tree，RQT)的更小的TU。

在图片边界处，HEVC采用隐式四叉树分割，使得块将保持四叉树分割直到大小适合图片边界。

在HEVC中，通过使用表示为编码树的四叉树结构将CTU分割成CU以适应各种局部特征。在CU级别处做出是否使用图片间(时间)或图片内(空间)预测对图片区域进行编码的决定。可以根据PU分割类型将每个CU进一步分割成一个、两个或四个PU。在一个PU内，应用相同的预测处理，并且将相关信息以PU为基础传输到解码器。在通过应用基于PU分割类型的预测处理获得残差块之后，可以根据另一个四叉树(Quad-Tree，QT)结构(类似于用于CU的编码树)将CU划分成变换单元(TU)。HEVC结构的关键特征之一是它具有包括CU、PU和TU的多个划分概念。

四叉树二叉树(QuadTree Binary Tree，QTBT)结构去除了多个划分类型的概念，即去除了CU、PU和TU概念的划分，并且支持CU划分形状的更大灵活性。在QTBT块结构中，CU可以具有正方形或矩形形状。如图3A至图3B所示，编码树单元(CTU)首先按四叉树结构划分。进一步按二叉树(Binary Tree，BT)结构划分四叉树叶节点。在二叉树分割中，存在对称水平分割和对称垂直分割两种分割类型。二叉树叶节点被称为编码单元(CU)，并且该分割部分用于预测和变换处理，无需进一步划分。这意味着CU、PU和TU在QTBT编码块结构中具有相同的块大小。在JEM中，有时CU由不同颜色分量的编码块(Coding Block，CB)构成，例如在4:2:0色度格式的P和B切片的情况下，一个CU包含一个亮度CB和两个色度CB，有时CU由单个分量的CB构成，例如，在I切片的情况下，一个CU仅包含一个亮度CB或者仅包含两个色度CB。

针对QTBT划分方案，可以定义以下参数：

CTUsize：四叉树的根节点大小，与HEVC中的概念相同

MinQTSize：允许的最小四叉树叶节点大小

MaxBTSize：允许的最大二叉树根节点大小

MaxBTDepth：允许的最大二叉树深度

MinBTSize：允许的最小二叉树叶节点大小

在QTBT划分结构的一个示例中，CTU大小被设置为128×128亮度样本，具有两个对应的64×64色度样本块，MinQTSize被设置为16×16，MaxBTSize被设置为64×64，MinBTSize(宽度和高度二者)被设置为4×4，MaxBTDepth被设置为4。四叉树划分首先被应用于CTU以生成四叉树叶节点。四叉树叶节点的大小可以从16×16(即MinQTSize)到128×128(即CTU大小)。如果叶四叉树节点为128×128，则由于大小超过MaxBTSize(即64×64)，因此不会按二叉树进一步分割。否则，叶四叉树节点可以进一步按二叉树划分。因此，四叉树叶节点也是二叉树的根节点并且其具有为0的二叉树深度。当二叉树深度达到MaxBTDepth(即4)时，不再考虑进一步分割。当二叉树节点的宽度等于MinBTSize(即4)时，不再考虑进一步的水平分割。类似地，当二叉树节点的高度等于MinBTSize时，不再考虑进一步的垂直分割。二叉树的叶节点通过预测和变换处理被进一步处理，而无需任何进一步的划分。在JEM中，最大CTU大小为256×256亮度样本。

图3A示出了通过使用QTBT进行块划分的示例，图3B示出了对应的树表示。实线指示四叉树分割，虚线指示二叉树分割。在二叉树的每个分割(即非叶)节点中，用信号通知指示使用哪种分割类型(即水平或垂直)的一个标记，其中0指示水平分割，1指示垂直分割。对于四叉树分割，不需要指示分割类型，因为四叉树分割总是将块既水平又垂直地进行分割，以产生大小相等的4个子块。

此外，QTBT方案支持亮度和色度具有单独的QTBT结构的灵活性。目前，对于P和B切片，一个CTU中的亮度和色度CTB共享相同的QTBT结构。然而，对于I切片，亮度CTB按QTBT结构划分成CU，色度CTB按另一个QTBT结构划分成色度CU。这意味着I切片中的CU由亮度分量的编码块或者两个色度分量的编码块构成，而P或B切片中的CU由所有三个颜色分量的编码块构成。

在HEVC中，限制小块的帧间预测以减少运动补偿的内存访问，使得4×8和8×4块不支持双预测，4×4块不支持帧间预测。在JEM-7.0中实现的QTBT中，这些限制被删除。

在VVC中，包括多类型树(Multi-Type-Tree，MTT)结构，MTT结构在QTBT之上进一步增加了水平和垂直中心侧三叉树，如图4A至图4B所示。例如，图4A示出了垂直中心侧三叉树划分的示例，图4B示出了水平中心侧三叉树划分的示例。

三叉树划分的好处可以包括：作为四叉树和二叉树划分的补充，三叉树划分能够捕获位于块中心的对象，而四叉树和二叉树划分总是沿着块中心进行分割。此外，建议的三叉树划分的宽度和高度始终为2的幂，因此不需要额外的变换。

两级树的设计主要是为了降低复杂度。理论上，遍历一棵树的复杂度是T^D，其中T表示分割类型的数目，D是树的深度。

相关技术的编解码器中的块划分可以限制图像数据被划分成一个或更多个矩形块，并且每个矩形块内的样本作为一个编码单元或者例如一个编码块被一起编码。与现有块划分模式不重叠的新的块划分方法可能会带来附加的编码增益。实施方式可以涉及提出支持非矩形块划分模式的新的块划分。

实施方式可以单独使用或者以任何顺序组合使用。图5示出了根据至少一个实施方式的L形(或L型)分区的示例。在实施方式中，旋转的L形分区也可以被认为是L形分区。从图5中可以看出，L形分区可以包括例如所指示的宽度、高度、较短的宽度和较短的高度。

在实施方式中，L型编码块划分方法可以将一个编码块划分成一个矩形分区以及一个或更多个L型分区。

图6A至图6D示出了根据实施方式的使用L形划分来划分的编码块600A至600D的示例。在图6A至图6D中可以看出，编码块600A至600D中的每一个被划分成一个方形分区(例如分区610、620、630和640)以及一个L形分区(例如分区611、621、631和641)。

在例如图6A至图6D中所示的实施方式的实施方式中，块600A至600D可以均被划分成两个分区，其中一个分区是四分之一尺寸(宽度和高度分别是块的宽度和高度的一半尺寸)矩形块，例如分区610、620、630和640，另一个分区是覆盖块面积的3/4的L形分区，例如分区611、621、631和641。

图7A至图7D示出了根据实施方式的使用L形划分来划分的编码块700A至700D的示例。在图7A至图7D中可以看出，编码块700A至700D中的每一个被划分成一个矩形分区(例如分区710、720、730和740)以及一个L形分区(例如分区711、721、731和741)。

在实施方式中，例如如图所示的实施方式中，块700A至700D可以被划分成两个分区，其中一个是具有与块不同的纵横比的矩形块(例如分区710、720、730和740)，另一个是L形分区(例如分区711、721、731和741)。

图8A至图8D示出了根据实施方式的使用L形划分来划分的编码块800A至800D的示例。在图8A至图8D中可以看出，编码块800A至800D中的每一个被划分成一个正方形分区(例如分区810、820、830和840)以及一个L形分区(例如分区811、821、831和841)。

在实施方式中，例如图8A至图8D所示的实施方式中，块800A至800D可以被划分成两个分区，其中一个是具有与块相同的块纵横比(例如，1:4、1:8、1:16)的矩形块(例如分区810、820、830和840)，另一个是覆盖块的剩余区域的L形分区，例如分区811、821、831和841。在图8A至图8D中，分区810、820、830和840中的每一个的宽度和高度可以是块800A至800D中的每一个的宽度和高度的四分之一，即，块纵横比可以是1:4。

在实施方式中，块可以被划分成两个以上的分区。例如，块可以被划分成具有与块相同的块纵横比的矩形块以及多个L形分区。

图9A至图9D示出了根据实施方式的使用L形划分来划分的编码块900A至900D的示例。在图9A至图9D中可以看出，编码块900A至900D中的每一个被划分成一个正方形分区(例如分区910、920、930和940)以及两个L形分区，例如分区911，912、921、922、931、932、941和942。

在例如图9A至图9D所示实施方式的实施方式中，块900A至900D可以被划分成三个分区，其中一个是具有与块相同的块纵横比的矩形块(例如分区910、920、930和940)，另外两个是L形分区(例如分区911、912、921、922、931、932、941和942)。

图10A至图10D示出了根据实施方式的使用L形划分来划分的编码块1000A至1000D的示例。在图10A至图10D中可以看出，编码块1000A至1000D中的每一个被划分成一个正方形分区(例如分区1010、1020、1030和1040)以及三个L形分区(例如分区1011、1021、1022、1023、1031、1032、1033、1041、1042和1043)。

在例如图10A至图10D所示实施方式的实施方式中，块1000A至1000D可以被划分成四个分区，其中一个是具有与块A相同的块纵横比的矩形块(例如分区1010、1020、1030、1040)，其他三个都是L形分区(例如分区1011、1021、1022、1023、1031、1032、1033、1041、1042、1043)。

在实施方式中，诸如分区1011、1021、1022、1023、1031、1032、1033、1041、1042和1043的每个L形分区的较短宽度可以具有相同的值，例如整个块宽度的1/4。

在另一个示例中，每个L形分区(例如分区1011、1021、1022、1023、1031、1032、1033、1041、1042和1043)的较短高度可以具有相同的值，例如整个块高度的1/4。

在实施方式中，使用以上提出的L形划分得到的矩形分区(例如分区610、620、630、640、710、720、730、740、810、820、830、840、910、920、930、940、1010、1020、1030和1040)可以进一步划分。例如，AV1(二叉树分割、四叉树分割、T型)和VVC(二叉树分割、三叉树分割和四叉树分割)中定义的常规编码树分割方法可以进一步应用于矩形分区。

在实施方式中，以上讨论的每个L形分区(例如分区611、621、631、641、711、721、731、741、811、821、831、841、911、912、922、931、932、941、942、1011、1021、1022、1023、1031、1032、1033、1041、1042和1043)可以被进一步划分。

图11A至图11B示出了根据实施方式的这种进一步划分的示例。

例如，如图11A至图11B所示，L形分区1100A和1100B均可以进一步被划分成两个矩形分区，例如分区1110、1111、1120和1121。

作为另一个示例，如图11C所示，L形分区1100C可以进一步被划分成三个矩形分区，例如分区1130、1131和1132。

作为另一个示例，如图11D所示，L形分区1100D可以进一步被划分成L形分区，例如分区1140和1141。

在实施方式中，L形分区可以与零残差相关联。

在实施方式中，L形分区的较短宽度和较短高度必须是块尺寸的2的幂倍(例如1/8、1/4、1/2)。

在一个实施方式中，L形分区的宽度、高度、较短宽度和较短高度必须都是块尺寸的倍数(例如1/8、1/4、1/2)。

现在参照图12，图12描述了示出用于对视频数据进行编码和/或解码的方法90000的步骤的操作流程图。在一些实现方式中，图4的一个或更多个处理块可以由计算机102(图1)和服务器计算机114(图1)执行。在一些实现方式中，图4的一个或更多个处理块可以由与计算机102和服务器计算机114分离或者包括计算机102和服务器计算机114的另一装置或一组装置执行。

在1210处，方法1200包括：获取视频数据。

在1220处，方法1200包括：解析所获得的视频数据以获取划分参数。

在1230处，方法1200包括：基于划分参数来获取划分编码块。在实施方式中，划分编码块被划分成矩形分区和至少一个非矩形分区。

在1240处，方法1200包括：基于所述划分编码块对视频数据进行解码。

在一个或更多个实施方式中，至少一个非矩形分区可以包括至少一个L形分区。

在一个或更多个实施方式中，L形分区的第一边的长度可以等于划分编码块的高度，L形分区的第二边的长度可以等于划分编码块的宽度，L形分区的第三边的长度可以等于划分编码块的高度的一半，L形分区的第四边的长度可以等于划分编码块的宽度的一半，L形分区的第五边的长度可以等于划分编码块的高度的一半，L形分区的第六边的长度可以等于划分编码块的宽度的一半。

在一个或更多个实施方式中，至少一个L形分区可以包括两个L形分区。

在一个或更多个实施方式中，至少一个L形分区可以包括三个L形分区。

在一个或更多个实施方式中，矩形分区可以是正方形分区。

在一个或更多个实施方式中，正方形分区的宽度可以等于划分编码块的宽度的一半，正方形划分的高度可以等于划分编码块的高度的一半。

在一个或更多个实施方式中，至少一个非矩形分区的纵横比可以等于划分编码块的纵横比。

在一个或更多个实施方式中，可以基于二叉树划分、三叉树划分、四叉树划分或T型划分中的至少一个对矩形分区进行进一步划分。

在一个或更多个实施方式中，至少一个非矩形分区可以进一步被划分成多个矩形分区。

可以理解，图12仅提供了一种实现方式的说明，而不暗示对如何实现不同实施方式的任何限制。可以基于设计和实现需求对所描述的环境进行许多修改。

图13是根据说明性实施方式的图1中描绘的计算机的内部组件和外部组件的框图1300。应当理解，图13仅提供了一种实现方式的说明，而不暗示对可以实现不同实施方式的环境的任何限制。可以基于设计和实现需求对所描述的环境进行许多修改。

计算机102(图1)和服务器计算机114(图1)可以包括图4中所示的内部组件8000A、8000B和外部组件9000A、9000B的相应集合。内部组件8000的每个集合包括一个或更多个总线826上的一个或更多个处理器801、一个或更多个计算机可读RAM 802和一个或更多个计算机可读ROM 804，一个或更多个操作系统828以及一个或更多个计算机可读有形存储装置803。

处理器801以硬件、固件或硬件和软件的组合来实现。处理器801是中央处理单元(Central Processing Unit，CPU)、图形处理单元(Graphics Processing Unit，GPU)、加速处理单元(Accelerated Processing Unit，APU)、微处理器、微控制器、数字信号处理器(Digital Signal Processor，DSP)、现场可编程门阵列(Field Programmable GateArray，FPGA)、专用集成电路(Application-Specific Integrated Circuit，ASIC)或其他类型的处理部件。在一些实现方式中，处理器801包括能够被编程以执行功能的一个或更多个处理器。总线826包括允许内部组件8000A、8000B之间的通信的组件。

一个或更多个操作系统828、软件程序108(图1)和服务器计算机114(图1)上的视频编码程序116(图1)存储在一个或更多个相应的计算机可读有形存储装置803上，以由一个或更多个相应的处理器801经由一个或更多个相应的RAM 802(其通常包括缓冲存储器)来执行。在图13所示的实施方式中，每个计算机可读有形存储装置803是内部硬盘驱动器的磁盘存储装置。替选地，每个计算机可读有形存储装置803中是半导体存储装置，例如ROM804、EPROM、闪存、光盘、磁光盘、固态盘、致密盘(Compact Disc，CD)、数字多功能盘(Digital Versatile Disc，DVD)、软盘、盒式磁带、磁带和/或可以存储计算机程序和数字信息的其他类型的非暂态计算机可读有形存储装置。

每组内部组件8000A、8000B还包括R/W驱动或接口808，以从一个或更多个便携式计算机可读有形存储装置936读取和向一个或更多个便携式计算机可读有形存储装置写入，所述便携式计算机可读有形存储装置例如是CD-ROM、DVD、记忆棒、磁带、磁盘、光盘或半导体存储装置。诸如软件程序108(图1)和视频编码程序116(图1)的软件程序可以被存储在一个或更多个相应的便携式计算机可读有形存储装置936上，经由相应的R/W驱动或接口808读取，并且加载到相应的硬盘驱动器803中。

每组内部组件8000A、8000B还包括例如TCP/IP适配卡的网络适配器或接口836；无线Wi-Fi接口卡；或者3G、4G或5G无线接口卡或其他有线或无线通信链路。软件程序108(图1)和服务器计算机114(图1)上的视频编码程序116(图1)可以经由网络(例如，因特网、局域网或其他、广域网)和相应的网络适配器或接口836从外部计算机下载到计算机102(图1)和服务器计算机114。软件程序108和服务器计算机114上的视频编码程序116从网络适配器或接口836被加载到相应的硬盘驱动器803中。网络可以包括铜线、光纤、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。

外部组件9000A、9000B的每个组可以包括计算机显示监视器902、键盘903和计算机鼠标934。外部组件9000A、9000B还可以包括触摸屏、虚拟键盘、触摸板、定点装置和其他人机接口装置。内部组件8000A、8000B的每个组还包括与计算机显示监视器902、键盘903和计算机鼠标934接口的装置驱动器806。装置驱动器806、R/W驱动或接口808以及网络适配器或接口836包括硬件和(存储在存储装置803和/或ROM 804中的)软件。

事先应理解，尽管本公开内容包括关于云计算的详细描述，但是本文中记载的教导的实现方式不限于云计算环境。相反，一些实施方式能够结合现在已知的或以后开发的任何其他类型的计算环境被实现。

云计算是一种服务交付模型，用于实现对可配置计算资源(例如，网络、网络带宽、服务器、处理、存储器、存储、应用、虚拟机和服务)的共享池的便捷、按需网络访问，所述可配置计算资源可以以最小的管理工作或与服务提供商的交互来快速供应和释放。该云模型可以包括至少五个特征、至少三个服务模型和至少四个布置模型。

特征如下：

按需自助服务：云消费者可以单方面地自动地根据需要提供计算能力，例如服务器时间和网络存储，而不需要与服务提供商进行人工交互。

广泛的网络接入：可通过网络获得能力，并且通过标准机制来访问，这些标准机制促进异构的瘦客户端平台或胖客户端平台(例如，移动电话、膝上型计算机和PDA)的使用。

资源池化：提供商的计算资源被池化，以使用多租户模型来服务多个消费者，其中不同的物理资源和虚拟资源根据需求被动态地分配和重新分配。存在位置无关的感觉，因为消费者通常不控制或不知道所提供的资源的确切位置，但是可能能够在更高的抽象层次(例如,国家、州或数据中心)指定位置。

快速弹性：可以快速且弹性地提供能力(在某些情况下是自动地)，以快速扩展，并且快速释放以快速收缩。对于消费者，可用于提供的能力通常看起来不受限制，并且可以在任何时间以任何数量购买。

测量服务：云系统通过在适合于服务类型(例如，存储、处理、带宽和活动用户账户)的某种抽象水平上利用计量能力来自动控制和优化资源使用。可以监视、控制和报告资源使用，从而为所利用的服务的提供商和消费者两者提供透明度。

服务模型如下：

软件即服务(SaaS)：提供给消费者的能力是使用在云基础设施上运行的提供商的应用。可通过诸如web浏览器(例如，基于web的电子邮件)的瘦客户端界面从各种客户机装置访问应用。消费者不管理或控制包括网络、服务器、操作系统、存储、或甚至各个应用程序功能的底层云基础设施，可能的例外是有限的用户专用应用配置设置。

平台即服务(PaaS)：提供给消费者的能力是将使用由提供商支持的编程语言和工具创建的消费者创建或获得的应用布置到云基础设施上。消费者不管理或控制包括网络、服务器、操作系统或存储的底层云基础设施，但可以控制所布置的应用和可能的应用托管环境配置。

基础设施即服务(IaaS)：提供给消费者的能力是提供处理、存储、网络以及消费者能够布置和运行任意软件的其他基本计算资源，所述任意软件可以包括操作系统和应用。消费者不管理或控制底层云基础设施，但可以控制操作系统、存储、布置的应用，并且可能对选择网络组件(例如，主机防火墙)具有有限控制。

布置模型如下：

私有云：云基础设施专为组织运营。它可以由组织或第三方管理，并且可以存在于场所内或场所外。

社区云：云基础设施由若干组织共享，并且支持有共享关注(例如，任务、安全要求、策略和合规性考虑)的特定社区。它可以由组织或第三方管理，并且可以存在于场所内或场所外。

公共云：云基础设施可供一般公众或大型行业团体使用，并且由销售云服务的组织所有。

混合云：云基础设施是两个或更多个云(私有、社区或公共)的组合，这些云仍然是唯一的实体，但是通过用于实现数据和应用的可移植性的标准化或专有技术(例如，用于云之间的负载平衡的云爆发)绑定在一起。

云计算环境是面向服务的，其焦点在于无状态、低耦合、模块性和语义互操作性。云计算的核心是包括由相互连接的节点组成的网络的基础设施。

参照图14，描绘了说明性云计算环境1400，该云计算环境1400可以适合于实现所公开主题的某些实施方式。如图所示，云计算环境1400包括：一个或更多个云计算节点10，由云消费者使用的本地计算装置可以通过所述一个或更多个云计算节点通信，所述本地计算装置例如是个人数字助理(Personal Digital Assistant，PDA)或蜂窝电话54A、台式计算机54B、膝上型计算机54C和/或汽车计算机系统54N。云计算节点10可以彼此通信。它们可以被物理地或虚拟地分组(未示出)到一个或更多个网络中，所述一个或更多个网络例如是如上文描述的私有云、社区云、公共云或混合云，或其组合。这允许云计算环境1500作为服务提供基础设施、平台和/或软件，云消费者不需要为该服务维护本地计算装置上的资源。应当理解，图14中所示的计算装置54A至54N的类型仅旨在说明，并且云计算节点10和云计算环境1400可以通过任何类型的网络和/或网络可寻址连接(例如，使用web浏览器)与任何类型的计算机化装置通信。

参照图15，示出了由云计算环境1400(图14)提供的一组功能抽象层1500。应当预先理解，图15中所示的组件、层和功能仅旨在说明，并且实施方式不限于此。如所描绘的，提供了以下层和相应的功能：

硬件和软件层60包括硬件组件和软件组件。硬件组件的示例包括：主机61；基于RISC(Reduced Instruction Set Computer，精简指令集计算机)架构的服务器62；服务器63；刀片式服务器64；存储装置65；以及网络和网络组件66。在一些实施方式中，软件组件包括网络应用服务器软件67和数据库软件68。

虚拟化层70提供抽象层，从该抽象层可以提供虚拟实体的以下示例：虚拟服务器71；虚拟存储72；包括虚拟专用网的虚拟网络73；虚拟应用和操作系统74；以及虚拟客户端75。

在一个示例中，管理层80可以提供以下描述的功能。资源供应81提供用于在云计算环境内执行任务的计算资源和其他资源的动态采购。计量和定价82提供了在云计算环境中利用资源时的成本跟踪，以及对这些资源的消耗的帐单或发票。在一个示例中，这些资源可以包括应用软件许可证。安全性为云消费者和任务提供身份验证，以及为数据和其他资源提供保护。用户门户83为消费者和系统管理员提供对云计算环境的访问。服务级别管理84提供云计算资源分配和管理，使得满足所需的服务级别。服务级别协议(Service LevelAgreement，SLA)规划和实现85为根据SLA预期未来需求的云计算资源提供预先安排和采购，。

工作负载层90提供了可以利用云计算环境的功能的示例。可以从该层提供的工作负载和功能的示例包括：地图和导航91；软件开发和生命周期管理92；虚拟课堂教学交付93；数据分析处理94；交易处理95；以及视频编码/解码96。视频编码/解码96可以使用从标称角度导出的增量角度对视频数据进行编码/解码。

一些实施方式可以涉及任何可能的技术细节集成水平的系统、方法和/或计算机可读介质。计算机可读介质可以包括计算机可读非暂态存储介质(或更多个介质)，所述计算机可读非暂态存储介质上具有用于使处理器执行操作的计算机可读程序指令。

计算机可读存储介质可以是有形装置，该有形装置可以保留和存储供指令执行装置使用的指令。计算机可读存储介质可以是例如但不限于电子存储装置、磁存储装置、光存储装置、电磁存储装置、半导体存储装置或前述的任何合适的组合。计算机可读存储介质的更特定示例的非穷举列表包括以下：便携式计算机磁盘、硬盘、随机存取存储器(randomaccess memory，RAM)、只读存储器(read-only memory，ROM)、可擦可编程只读存储器(erasable programmable read-only memory，EPROM或闪速存储器)、静态随机存取存储器(static random access memory，SRAM)、便携式致密盘只读存储器(compact disc read-only memory，CD-ROM)、数字通用盘(digital versatile disk，DVD)、记忆棒、软盘、诸如穿孔卡或其上记录有指令的凹槽中的凸起结构的机械编码装置、以及前述的任何合适的组合。如本文所使用的计算机可读存储介质不应被解释为本身是暂态信号，例如无线电波或其他自由传播的电磁波、通过波导传播的电磁波或其他传输介质(例如，穿过光纤电缆的光脉冲)或通过导线传输的电信号。

本文中描述的计算机可读程序指令可以从计算机可读存储介质下载到相应的计算/处理装置，或者经由网络(例如，因特网、局域网、广域网和/或无线网络)下载到外部计算机或外部存储装置。网络可以包括铜传输电缆、光传输纤维、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理装置中的网络适配器卡或网络接口从网络接收计算机可读程序指令，并且转发计算机可读程序指令以存储在相应的计算/处理装置内的计算机可读存储介质中。

用于执行操作的计算机可读程序代码/指令可以是汇编指令、指令集架构(instruction-set-architecture，ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、集成电路的配置数据，或者以一种或更多种编程语言的任意组合编写的源代码或目标代码，所述一种或更多种编程语言包括诸如Smalltalk、C++等的面向对象的编程语言和诸如“C”编程语言或类似编程语言的过程编程语言。计算机可读程序指令可以完全在用户的计算机上、部分在用户的计算机上、作为独立的软件包、部分在用户的计算机上且部分在远程计算机上或者完全在远程计算机或服务器上执行。在后者的情况下，远程计算机可以通过包括局域网(LAN)或广域网(WAN)的任意类型的网络连接至用户计算机，或者可以与外部计算机连接(例如，使用因特网服务提供商通过因特网)。在一些实施方式中，包括例如可编程逻辑电路系统、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA)的电子电路系统可以通过利用计算机可读程序指令的状态信息来执行计算机可读程序指令以使电子电路系统个性化，以便执行各方面或操作。

可以将这些计算机可读程序指令提供给通用计算机的处理器、专用计算机的处理器或其他可编程数据处理装置的处理器以产生机构，使得经由计算机的处理器或其他可编程数据处理装置的处理器执行的指令创建用于实现流程图和/或框图中的一个或更多个块中所指定的功能/动作的装置。这些计算机程序指令还可以被存储在计算机可读介质中，该计算机可读介质可以以特定的方式引导计算机、可编程数据处理装置或其他装置起作用，以使得其上存储有指令的在计算机可读介质包括制品，该制品包括实现流程图和/或框图中的一个或更多个块中所指定的功能/动作方面的指令。

计算机可读程序指令还可以被加载到计算机、其他可编程数据处理装置或其他装置上，以使得要在计算机、其他可编程数据处理装置或其他装置上执行的一系列操作步骤能够产生计算机实现的处理，使得在计算机、其他可编程数据处理装置或其他装置上执行的指令实现流程图和/或框图的一个或更多个块中指定的功能/动作。

图中的流程图和框图示出了根据各种实施方式的系统、方法和计算机可读介质的可能实现的架构、功能和操作。在这方面，流程图或框图中的每个块可以表示模块、段或部分指令，所述模块、段或部分指令包括用于实现特定逻辑功能的一个或更多个可执行指令。方法、计算机系统和计算机可读介质可以包括与图中所示的那些块相比附加的块、更少的块、不同的块或不同布置的块。在一些替选实施方式中，框中注明的功能可以不按图中注明的顺序发生。例如，连续示出的两个块实际上可以同时或者基本上同时执行，或者这两个块有时可以根据所涉及的功能而按照相反的顺序执行。还应当注意，可以通过执行特定功能或动作或实现专用硬件和计算机指令的组合的基于硬件的专用系统来实现框图和/或流程图图示中的每个块以及框图和/或流程图图示中的块的组合。

将明显的是，可以以不同形式的硬件、固件、或硬件和软件的组合来实现本文所描述的系统和/或方法。用于实现这些系统和/或方法的实际专用控制硬件或软件代码不限制实现方式。因此，本文中在不参考特定软件代码的情况下描述了系统和/或方法的操作和行为——应当理解的是，可以基于本文中的描述将软件和硬件设计成实现系统和/或方法。

除非明确说明，否则在本文中使用的元件、动作或指令都不应被解释为是关键或必要的元件、动作或指令。此外，如本文所使用的，冠词“一(a)”和“一个(an)”旨在包括一个或更多个项，并且可以与“一个或更多个(one or more)”互换使用。此外，如本文所使用的，术语“组(set)”旨在包括一个或更多个项(例如，相关项、不相关项、相关项和不相关项的组合等)，并且可以与“一个或更多个”互换使用。在意指仅一项的情况下，使用术语“一个”或类似语言。而且，如本文中使用的，术语“有(has)”、“具有(have)”、“含有(having)”等意在为开放式术语。另外，除非另有明确说明，否则短语“基于”意在表示“至少部分地基于”。

已经出于说明的目的呈现了对各个方面和实施方式的描述，但是不旨在是穷举的或限于所公开的实施方式。尽管在权利要求书中记载了和/或在说明书中公开了特征的组合，但是这些组合并且不旨在限制可能的实现方式的公开内容。实际上，可以以权利要求书中未具体记载以及/或者说明书中未公开的方式组合这些特征中的许多特征。尽管以下列出的每个从属权利要求可以直接取决于仅一个权利要求，但是可能的实现方式的公开内容包括与权利要求组中的每个其他权利要求组合的每个从属权利要求。在不脱离所描述的实施方式的范围的情况下，许多修改和变化对于本领域普通技术人员而言将是明显的。选择本文所使用的术语以最好地解释实施方式的原理、实际应用或对市场中发现的技术的技术改进，或使得本领域其他普通技术人员能够理解本文所公开的实施方式。

Claims

1.一种使用至少一个处理器进行视频解码的方法，所述方法包括：

获取视频数据；

解析所获得的视频数据以获取划分参数；

基于所述划分参数来获取划分编码块；以及

基于所述划分编码块对所获得的视频数据进行解码，

其中，所述划分编码块被划分成矩形分区和至少一个非矩形分区。

2.根据权利要求1所述的方法，其中，所述至少一个非矩形分区包括至少一个L形分区。

3.根据权利要求2所述的方法，其中，所述L形分区的第一边的长度等于所述划分编码块的高度，

其中，所述L形分区的第二边的长度等于所述划分编码块的宽度，

其中，所述L形分区的第三边的长度等于所述划分编码块的高度的一半，

其中，所述L形分区的第四边的长度等于所述划分编码块的宽度的一半，

其中，所述L形分区的第五边的长度等于所述划分编码块的高度的一半，

其中，所述L形分区的第六边的长度等于所述划分编码块的宽度的一半。

4.根据权利要求2所述的方法，其中，所述至少一个L形分区包括两个L形分区。

5.根据权利要求2所述的方法，其中，所述至少一个L形分区包括三个L形分区。

6.根据权利要求2所述的方法，其中，所述矩形分区是正方形分区。

7.根据权利要求6所述的方法，其中，所述正方形分区的宽度等于所述划分编码块的宽度的一半，并且

其中，所述正方形分区的高度等于所述划分编码块高度的一半。

8.根据权利要求1所述的方法，其中，所述至少一个非矩形分区的纵横比等于所述划分编码块的纵横比。

9.根据权利要求1所述的方法，其中，基于二叉树划分、三叉树划分、四叉树划分或T型划分中的至少一个来进一步划分所述矩形分区。

10.根据权利要求1所述的方法，其中，所述至少一个非矩形分区被进一步划分成多个矩形分区。

11.一种用于视频解码的设备，所述设备包括：

至少一个存储器，其被配置成存储程序代码；以及

至少一个处理器，其被配置成读取所述程序代码并且按照所述程序代码的指令进行操作，所述程序代码包括：

第一获取代码，其被配置成使所述至少一个处理器获取视频数据；

解析代码，其被配置成使所述至少一个处理器解析所获得的视频数据以获取划分参数；

第二获取代码，其被配置成使所述至少一个处理器基于所述划分参数来获取划分编码块；以及

解码代码，其被配置成使所述至少一个处理器基于所述划分编码块对所获得的视频数据进行解码，

12.根据权利要求11所述的装置，其中，所述至少一个非矩形分区包括至少一个L形分区。

13.根据权利要求12所述的装置，其中，所述L形分区的第一边的长度等于所述划分编码块的高度，

14.根据权利要求12所述的装置，其中，所述至少一个L形分区包括两个L形分区。

15.根据权利要求12所述的装置，其中，所述矩形分区是正方形分区。

16.根据权利要求15所述的装置，其中，所述正方形分区的宽度等于所述划分编码块的宽度的一半，并且

其中，所述正方形分区的高度等于所述划分编码块的高度的一半。

17.根据权利要求11所述的装置，其中，所述至少一个非矩形分区的纵横比等于所述划分编码块的纵横比。

18.根据权利要求11所述的装置，其中，基于二叉树划分、三叉树划分、四叉树划分或T型划分中的至少一个来进一步划分所述矩形分区。

19.根据权利要求11所述的装置，其中，所述至少一个非矩形分区被进一步划分成多个矩形分区。

20.一种非暂态计算机可读介质，所述非暂态计算机可读介质存储指令，所述指令包括：一个或更多个指令，所述一个或更多个指令当由用于视频解码的装置的一个或更多个处理器执行时使所述一个或更多个处理器：

获取视频数据；

解析所获得的视频数据以获取划分参数；

基于所述划分参数来获取划分编码块；以及

基于所述划分编码块对所获得的视频数据进行解码，