CN103931182B

CN103931182B - 帧内预测视频译码中的非正方形变换

Info

Publication number: CN103931182B
Application number: CN201280052928.3A
Authority: CN
Inventors: 郭立威; 翔林·王; 马尔塔·卡切维奇
Original assignee: Qualcomm Inc
Current assignee: Qualcomm Inc
Priority date: 2011-10-27
Filing date: 2012-10-25
Publication date: 2017-05-24
Anticipated expiration: 2032-10-25
Also published as: KR101617109B1; US20130107950A1; CN103931182A; JP5886440B2; KR20140085548A; EP2772054A1; WO2013063245A1; JP2014534734A; IN2014CN02638A; US9247254B2

Abstract

本发明描述用于在允许经帧内译码块中的非正方形变换分区的视频编码过程中确定变换分区的技术。根据本发明的一个实例，一种视频译码方法包括：将译码单元分区成多个预测单元；以及为所述预测单元中的每一者确定变换分区，其中至少一个变换分区为非正方形分区。

Description

帧内预测视频译码中的非正方形变换

相关申请案

本申请案主张2011年10月27日申请的第61/552,327号美国临时申请案的权益，所述申请案的整个内容特此以引用的方式并入本文中。

技术领域

本发明涉及视频译码，且更明确地说，涉及用于在译码视频数据时执行帧内预测的技术。

背景技术

数字视频能力可并入到较宽范围的装置中，包含数字电视、数字直播系统、无线广播系统、个人数字助理(PDA)、膝上型或桌上型计算机、数字相机、数字记录装置、数字媒体播放器、视频游戏装置、视频游戏控制台、蜂窝式或卫星无线电电话、视频电话会议装置等。数字视频装置实施视频压缩技术，例如由MPEG-2、MPEG-4、ITU-T H.263、ITU-T H.264/MPEG-4，第10部分，高级视频译码(AVC)界定的标准，或目前正在开发的高效视频译码(HEVC)标准或此些标准的扩展中所描述的那些技术，以更高效地发射、接收和存储数字视频信息。

视频压缩技术包含空间预测和/或时间预测以减少或去除视频序列中固有的冗余。对于基于块的视频译码，可将一视频帧或切片分割成若干块。可进一步分割每一块。相对于经帧内译码(I)帧或切片中的相邻块中的参考样本，使用空间预测来编码同一帧或切片中的块。经帧间译码(P或B)帧或片中的块可相对于同一帧或片中的相邻块中的参考样本使用空间预测，或相对于其它参考帧中的参考样本使用时间预测。空间或时间预测得出待译码的块的预测块。残余数据表示待译码的原始块与预测块之间的像素差。

根据指向形成所述预测块的参考样本块的运动向量以及指示经译码块与预测块之间的差的残余数据来编码经帧间译码的块。根据帧内译码模式和残余数据来编码经帧内译码的块。为了进一步压缩，可将残余数据从像素域变换到变换域，从而得出接着可量化的残余变换系数。可以特定次序扫描经量化变换系数(初始布置成二维阵列)，以产生变换系数的一维向量用于熵译码。

发明内容

一股来说，本发明描述用于译码视频数据的技术。本发明描述用于在允许非正方形变换分区的视频编码过程中选择变换分区的技术。

根据本发明的一个实例，一种视频编码方法包含：将译码单元分区成多个预测单元，其中使用帧内预测来编码所述译码单元；以及为所述预测单元中的每一者确定变换分区，其中至少一个变换分区为非正方形分区。在一个实例中，所述多个预测单元中的每一者具有相同变换分区。在另一实例中，单独地确定多个预测单元中的每一者的变换分区。在一个实例中，用信号通知语法元素以指示分区的类型(例如，正方形还是非正方形形)，以及在非正方形分区的情况下，分区的方向(例如，垂直还是水平)。

根据本发明的另一实例，一种视频解码方法包含：将译码单元分区成多个预测单元，其中使用帧内预测来编码所述译码单元；以及为所述预测单元中的每一者确定变换分区，其中至少一个变换分区为非正方形分区。在一个实例中，所述多个预测单元中的每一者具有相同变换分区。在另一实例中，单独地确定多个预测单元中的每一者的变换分区。在一个实例中，在经编码视频位流中接收语法元素以指示分区的类型(例如，正方形还是非正方形形)，以及在非正方形分区的情况下，分区的方向(例如，垂直还是水平)。

本发明还描述经配置以执行所揭示的方法的设备、装置和计算机可读存储媒体。

在附图及下文描述中陈述一个或一个以上实例的细节。将从描述和图式且从所附权利要求书明白其它特征、目标和优点。

附图说明

图1是说明实例视频编码和解码系统的框图。

图2是说明实例帧内预测模式方向的概念图。

图3是用于帧内预测的实例预测单元的概念图。

图4是实例四叉树块结构的概念图。

图5是经帧内预测块的实例正方形变换单元分区的概念图。

图6是经帧内预测块的实例非正方形变换分区的概念图。

图7是NxN预测单元的实例非正方形变换分区的概念图。

图8是NxN预测单元的另一实例非正方形变换分区的概念图。

图9是变换分区的进一步分割的实例的概念图。

图10是变换分区的进一步分割的另一实例的概念图。

图11是变换分区的进一步分割的另一实例的概念图。

图12是说明实例视频编码器的框图。

图13是说明实例视频解码器的框图。

图14是说明根据本发明的技术的实例视频编码方法的流程图。

图15是说明根据本发明的技术的实例视频解码方法的流程图。

具体实施方式

一股来说，本发明描述用于译码视频数据的技术。在一些实例中，本发明描述用于在允许非正方形变换分区的视频译码过程中选择变换分区的技术。本发明的技术允许在帧内预测视频译码中选择和使用非正方形变换分区的较灵活的方法，因此提供额外的机会来改进译码压缩和/或视频质量。

图1是说明根据本发明实例的可经配置以利用帧内预测译码技术的实例视频编码和解码系统10的框图。如图1中所示，系统10包含源装置12，其经由通信信道16将经编码的视频发射到目的地装置14。经编码视频数据还可存储在存储媒体34或文件服务器36上，且可由目的地装置14在需要时存取。当存储到存储媒体或文件服务器时，视频编码器20可将经译码视频数据提供给另一装置，例如用于将经译码视频数据存储到存储媒体的网络接口、压缩光盘(CD)、蓝光或数字视频光盘(DVD)烧录器或冲压设施装置，或其它装置。同样地，与视频解码器30分开的装置，例如网络接口、CD或DVD读取器等，可从存储媒体检索经译码视频数据，并将检索到的数据提供给视频解码器30。

源装置12和目的地装置14可包括各种各样的装置中的任一者，包含桌上型计算机、笔记本型(即，膝上型)计算机、平板计算机、机顶盒、电话手持机(例如所谓的智能电话)、电视机、相机、显示装置、数字媒体播放器、视频游戏控制台等。在许多情况下，此些装置可为无线通信而配备。因此，通信信道16可包括适合传输经编码视频数据的无线信道、有线信道或无线与有线信道的组合。类似地，目的地装置14可经由任何标准数据连接(包含因特网连接)接入文件服务器36。这可包含无线信道(例如，Wi-Fi连接)、有线连接(例如，DSL、电缆调制解调器等)，或两者的组合，其适合存取存储在文件服务器上的经编码视频数据。

根据本发明的实例，帧内预测译码技术可应用于支持多种多媒体应用(例如空中电视广播、有线电视发射、卫星电视发射、流式视频发射(例如经由因特网))中的任一者的视频译码，编码数字视频以供存储在数据存储媒体上、解码存储在数据存储媒体上的数字视频，或其它应用。在一些实例中，源装置10可经配置以支持单向或双向视频发射以支持例如视频流式传输、视频重放、视频广播和/或视频电话等应用。

在图1的实例中，源装置12包含视频源18、视频编码器20、调制器/解调器22以及发射器24。在源装置12中，视频源18可包含例如视频捕获装置等来源，例如视频相机、含有先前所捕获视频的视频存档、用以接收来自视频内容提供者的视频的视频馈送接口，和/或用于产生计算机图形数据作为源视频的计算机图形系统，或此些来源的组合。作为一个实例，如果视频源18为视频相机，那么源装置12及目的地装置14可形成所谓的相机电话或视频电话。然而，本发明中所描述的技术可适用于一股视频译码，且可应用于无线和/或有线应用，或其中将经编码视频数据存储在本地磁盘上的应用。

所捕获、预捕获或计算机产生的视频可由视频编码器20编码。经编码的视频信息可由调制解调器22根据通信标准(例如无线通信协议)来调制，且经由发射器24发射到目的地装置14。调制解调器22可包含经设计以用于信号调制的各种混频器、滤波器、放大器或其它组件。发射器24可包含经设计以用于发射数据的电路，包含放大器、滤波器及一个或一个以上天线。

由视频编码器20编码的所捕获、预捕获或计算机产生的视频还可存储到存储媒体34或文件服务器36上以供以后消耗。存储媒体34可包含蓝光光盘、DVD、CD-ROM、快闪存储器，或任何其它用于存储经编码视频的合适数字存储媒体。存储在存储媒体34上的经编码视频可接着由目的地装置14存取，以用于解码和重放。

文件服务器36可为能够存储经编码视频且将所述经编码视频发射到目的地装置14的任何类型的服务器。实例文件服务器包含网络服务器(例如，用于网站)、FTP服务器、网络附接存储(NAS)装置、本地磁盘驱动器，或能够存储经编码视频数据并将其发射到目的地装置的任何其它类型的装置。经编码视频数据从文件服务器36的发射可为流式发射、下载发射或两者的组合。目的地装置14可经由任何标准数据连接(包含因特网连接)接入文件服务器36。这可包含无线信道(例如，Wi-Fi连接)、有线连接(例如，DSL、电缆调制解调器、以太网、USB等)，或两者的组合，其适合存取存储在文件服务器上的经编码视频数据。

在图1的实例中，目的地装置14包含接收器26、调制解调器28、视频解码器30以及显示装置32。目的地装置14的接收器26经由信道16接收信息，且调制解调器28解调所述信息以为视频解码器30产生经解调位流。经由信道16传送的信息可包含由视频编码器20产生的多种语法信息，以供视频解码器30在解码视频数据时使用。此语法还可与存储在存储媒体34或文件服务器36上的经编码视频数据包含在一起。视频编码器20和视频解码器30中的每一者可形成能够编码或解码视频数据的相应编码器-解码器(CODEC)的部分。

显示装置32可与目的地装置14集成或可在目的地装置14外部。在一些实例中，目的地装置14可包含集成显示装置，且还可经配置以与外部显示装置交互。在其它实例中，目的地装置14可为显示装置。一股来说，显示装置32向用户显示经解码的视频数据，且可包括多种显示装置中的任一者，例如液晶显示器(LCD)、等离子体显示器、有机发光二极管(OLED)显示器或另一类型的显示装置。

在图1的实例中，通信信道16可包含任何无线或有线通信媒体，例如，射频(RF)频谱或一个或一个以上物理传输线、或无线和有线媒体的任一组合。通信信道16可形成例如局域网、广域网或例如因特网等全局网络的基于包的网络的部分。通信信道16一股表示用于将视频数据从源装置12发射到目的地装置14的任何合适的通信媒体或不同通信媒体的集合，包括有线或无线媒体的任何合适组合。通信信道16可包含可用于促进从源装置12到目的地装置14的通信的路由器、交换器、基站或任何其它设备。

视频编码器20和视频解码器30可根据视频压缩标准来操作，例如目前正由ITU-T视频译码专家组(VCEG)和ISO/IEC运动图片专家组(MPEG)的视频译码联合协作团队(JCT-VC)开发的高效视频译码(HEVC)标准。HEVC的最新工作草案(WD)且在下文称为HEVC WD8自2012年9月24日起从http：//phenix.int-evry.fr/jct/doc_end_user/documents/10_Stockholm/wg11/JCTVC-J1003-v8.zip可获得。视频编码器20和视频解码器30可符合HEVC测试模型(HM)。或者，视频编码器20和视频解码器30可根据其它专有或行业标准来操作，例如ITU-T H.264标准，或者称为MPEG-4，部分10，高级视频译码(AVC)，或此些标准的扩展。然而，本发明的技术不限于任何特定译码标准。其它实例包含MPEG-2和ITU-T H.263。

尽管图1中未展示，但在一些方面中，视频编码器20和视频解码器30可各自与音频编码器和解码器集成，且可包含适当的多路复用器-多路分用器(MUX-DEMUX)单元或其它硬件及软件，以处置对共同数据流或单独数据流中的音频与视频两者的编码。在一些实例中，如果适用，MUX-DEMUX单元可符合ITU H.223多路复用器协议或例如用户数据报协议(UDP)等其它协议。

视频编码器20和视频解码器30各自可实施为多种合适编码器电路中的任一者，例如一个或一个以上微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、软件、硬件、固件或其任何组合。当所述技术部分以软件来实施时，装置可将用于所述软件的指令存储在合适的非暂时计算机可读媒体中，且使用一个或一个以上处理器来在硬件中执行所述指令以实施本发明的技术。视频编码器20和视频解码器30中的每一者可包含在一个或一个以上编码器或解码器中，其中的任一者可集成为相应装置中的组合式视频编码器/解码器(CODEC)的部分。

视频编码器20可实施本发明的用于视频编码过程中的帧内预测译码的技术中的任一者或全部。同样地，视频解码器30可实施用于视频译码过程中的帧内预测译码的这些技术中的任一者或全部。如本发明中所描述，视频译码器可指代视频编码器或视频解码器。类似地，视频译码单元可指代视频编码器或视频解码器。同样地，视频译码可指代视频编码或视频解码。

根据本发明的技术，视频编码器20可经配置以：将译码单元分区成多个预测单元，其中使用帧内预测来编码所述译码单元；且确定所述预测单元中的每一者的变换分区，其中所述预测单元的变换分区中的至少一者为非正方形分区。

同样地，根据本发明的技术，视频解码器30可经配置以：将译码单元分区成多个预测单元，其中使用帧内预测来编码所述译码单元；且确定所述预测单元中的每一者的变换分区，其中所述预测单元的变换分区中的至少一者为非正方形分区。视频解码器30可进一步经配置以：接收指示变换类型的第一语法元素，其中在第一语法元素指示非正方形变换类型的情况下，所述变换类型是选自正方形变换分区和非正方形变换分区中的至少一者；接收指示具有非正方形变换类型的每一变换分区的变换方向的第二语法元素，其中所述变换方向是选自水平定向方向和垂直定向方向中的至少一者；将译码单元分区成多个预测单元，其中使用帧内预测来编码所述译码单元；且根据接收到的第一和第二语法元素来确定所述预测单元中的每一者的变换分区。

数字视频装置(例如图1的视频编码和解码系统10)实施视频压缩技术以较高效地编码和解码数字视频信息。视频压缩可应用空间(帧内)预测和/或时间(帧间)预测技术以减少或去除视频序列中固有的冗余。

典型的视频编码器将原始视频序列的每一帧分区成称为“块”或“译码单元”的连续矩形区。在“帧内模式”(I模式，或通常帧内预测)下或在“帧间模式”(P模式、B模式，或通常帧间预测)下编码这些块。

对于P模式和B模式，编码器首先搜索与由F_ref表示的“参考帧”中正编码的块类似的一个或一个以上块。搜索通常受限于不多于从待编码块的某一空间移位。当已识别到最佳匹配或“预测”时，其以二维(2D)运动向量(Δx、Δy)的形式表达，其中Δx为水平位移，且Δy为垂直位移。远动向量与参考帧一起用以构造所预测块 F_pred，如下：

F_pred(x，y)＝F_ref(x+Δx，y+Δy)

像素在帧内的位置由(x，y)表示。对于在I模式下编码的块，使用来自同一帧内的先前经编码相邻块的空间预测来形成所预测块。

对于I模式和P或B模式两者，预测误差(即，正编码的块中的像素值与所预测块中的像素值之间的差)表示为某一离散变换(例如离散余弦变换(DCT))的一组经加权基础函数。可基于不同大小的块(例如4×4、8×8或16×16和以上)执行变换。在一些情形中(例如，在帧间译码中)，变换块的形状不总是正方形的。还可使用例如具有16x4、32×8等变换块大小的矩形形状变换块。

随后量化权重(即，变换系数)。量化引入信息损失，且由此，经量化系数具有比原始变换系数低的精度。

经量化变换系数和运动向量是“语法元素”的实例。这些语法元素加上一些控制信息形成视频序列的经译码表示。还可对语法元素进行熵译码，从而进一步减少其表示所需的位数目。熵译码是旨在通过利用其分布的特性(一些符号比其它服务出现得频繁)来最小化表示所发射或所存储符号(在我们的情况下为语法元素)所需的位数目的无损操作。

在解码器中，通过首先以与编码器中相同的方式构造其预测，且通过将预测误差添加到所述预测来获得当前帧中的块。通过使用经量化系数对变换基函数进行加权来找出预测误差。所重构的帧与原始帧之间的差称为重构误差。

可通过调整量化变换系数时所使用的量化参数(QP)的值来控制压缩比，即用来表示原始序列和经压缩序列的位数目的比率。压缩比可取决于所使用的熵译码的方法。

对于根据新兴HEVC标准的视频译码，可将视频帧分区成若干译码单元。译码单元(CU)通常指代充当对其应用各种译码工具以进行视频压缩的基础单元的图像区。CU通常具有亮度分量，有时表示为Y，以及两个色度分量，有时表示为U和V。取决于视频取样格式，在样本数目方面，U和V分量的大小可与Y分量的大小相同或不同。CU通常是正方形的，且可被视为类似于所谓的宏块，例如根据其它视频译码标准，例如ITU-TH.264。出于说明的目的，本申请案中将描述根据开发HEVC标准的当前所提出方面中的一些的译码。然而，本发明中所描述的技术可对其它视频译码过程有用，例如根据H.264或其它标准所定义的过程或专有视频译码过程。

HEVC标准化努力是基于视频译码装置的模型，称为HEVC测试模型(HM)。HM假定视频译码装置优于根据例如ITU-T H.264/AVC的装置的若干能力。举例来说，H.264提供九种帧内预测编码模式，而HM提供多达三十五种帧内预测编码模式。

HEVC中的三十五种帧内预测模式包含一种DC模式、一种平面模式以及33种不同定向预测模式。对于定向预测模式，沿所述模式所指示的某一方向基于相邻块经重构像素执行预测。图2中展示与不同预测模式相关联的方向。

根据HM，CU可包含一个或一个以上预测单元(PU)和/或一个或一个以上变换单元(TU)。位流中的语法数据可界定最大译码单元(LCU)，其为依据像素数据的最大CU。一股来说，CU具有与H.264标准的宏块类似的目的，只是CU不具有大小差别。因此，CU可分割为若干子CU。一股来说，本发明中对CU的参考可指代图片的最大译码单元或LCU的子CU。可将LCU分割为若干子CU，且每一子CU可进一步分割为若干子CU。用于位流的语法数据可界定LCU可分割的最大次数，称为CU深度。因此，位流还可界定最小译码单元(SCU)。本发明还是用术语“块”、“分区”或“部分”来指代CU、PU或TU中的任一者。一股来说，“部分”可指代视频帧的任一子集。

LCU可与四分树数据结构相关联。一股来说，四分树数据结构每CU包含一个节点，其中根节点对应于LCU。如果CU分割为四个子CU，那么对应于CU的节点包含四个叶节点，其各自对应于子CU中的一者。四分树数据结构的每一节点可提供用于对应CU的语法数据。举例来说，四分数中的节点可包含分割旗标，指示对应于所述节点的CU是否被分割为子CU。CU的语法元素可递归地界定，且可取决于CU是否分割为子CU。如果不进一步分割CU，那么将其称为叶CU。在本发明中，叶CU的4个子CU也将称为叶CU，但不存在原始叶CU的明确分割。举例来说，如果不进一步分割16x16大小的CU，那么四个8x8子CU也将称为叶CU，但所述16x16CU从未分割。

叶CU可包含一个或一个以上预测单元(PU)。一股来说，PU表示对应CU的全部或一部分，且可包含用于检索PU的参考样本的数据。举例来说，当PU经帧间模式编码时，PU可包含描述PU的运动向量的数据。界定运动向量的数据可描述(例如)运动向量的水平分量、运动向量的垂直分量、运动向量的分辨率(例如，四分之一像素精度或八分之一像素精度)、运动向量指向的参考帧，和/或运动向量的参考列表(例如，列表0或列表1)。界定PU的叶CU的数据还可描述(例如)将CU分为一个或一个以上PU。划分模式可依据CU是未经译码、经帧内模式编码还是经帧间预测模式编码而不同。对于帧内译码，可将PU视为与下文所述的叶变换单元相同。

新兴的HEVC标准允许根据可针对不同CU而不同的变换单元(TU)的变换。TU通常基于为经分区LCU界定的给定CU内的PU的大小而定大小，但可能不总是这种情况。TU通常具有与PU相同或比PU小的大小。在一些实例中，可使用称为“残余四叉树”(RQT)的四叉树结构将对应于CU的残余样本再分成较小单元。RQT的叶节点可称为变换单元(TU)。与TU相关联的像素差值可经变换以产生变换系数，其可量化。

一股来说，PU指代与预测过程有关的数据。举例来说，当PU经帧内模式编码时，PU可包含描述PU的帧内预测模式的数据。作为另一实例，当PU经帧间模式编码时，PU可包含描述PU的运动向量的数据。

一股来说，TU用于变换和量化过程。具有一个或一个以上PU的给定CU还可包含一个或一个以上变换单元(TU)。在预测之后，视频编码器20可从译码节点根据PU所识别的视频块计算残余值。接着更新译码节点，以参考残余值而不是原始视频块。残余值包括可使用所述变换以及TU中所指定的其它变换信息变换为变换系数、量化，且扫描以产生经串行化变换系数以用于熵译码的像素差值。可再次更新译码节点以参考这些经串行化变换系数。本发明通常使用术语“视频块”来指代CU的译码节点。在一些特定情况下，本发明还可使用术语“视频块”来指代树块，即LCU或CU，其包含译码节点以及PU和TU。

视频序列通常包含一系列视频帧或图片。图片群组(GOP)通常包括一系列一个或一个以上所述视频图片。GOP可在GOP的标头、所述图片中的一者或一者以上的标头或其它地方中包含语法数据，其描述包含于GOP中的图片的数目。图片的每一片可包含片语法数据，其描述相应片的编码模式。视频编码器20通常对个别视频片内的视频块进行操作以便对视频数据进行编码。视频块可对应于CU内的译码节点。视频块可具有固定或不同大小，且其大小可根据所指定译码标准而不同。

如图3中所示，对于大小为2Nx2N的经帧内预测CU，HEVC的一个提议中指定两种PU分区类型：2Nx2N PU分区19和NxN PU分区21。在HEVC的一个提议中，仅在最小CU等级下允许NxN。然而，本发明的技术可应用于任何大小的NxN PU分区。2Nx2NPU分区得出与CU相同大小的PU。对于NxN PU分区，CU具有4个NxN PU，其中的每一者为相关CU的大小的四分之一。四个PU中的每一者可具有其自己的帧内预测模式方向。

HEVC允许四叉树变换单元分区结构。如图4中所示，例如，外块23为CU或LCU23。在HEVC的一个提议中，LCU可与64x64一样大，但本发明的技术适用于任何大小的CU或LCU。外块23的内块表示根据四叉树结构的变换块(例如，TU)分解的结果。当然，此结果只是许多可能分解之一。分解指示应用于译码单元的某一区域的变换的大小。实际上，分解指示CU内的TU的大小。

在图4的实例中，存在三个等级的变换块分解。对于等级1分解，将整个块分割成四个四分之一大小的变换块，25A、25B、25C和25D。接着，在等级2分解处，将等级1四分之一大小的变换块25D进一步分割成四个1/16大小的变换块27A、27B、27C和27D。接着，在等级3分解处，进一步将变换块27D分割成四个更小(1/64大小)的变换块。等级0处的变换块意味着将整个CU一起变换，而无进一步分割。在此情况下，TU具有CU的相同大小。实际上，基于速率失真优化来确定是否进一步分割TU。

对于2Nx2N PU，根据HEVC的一个提议，仅允许正方形形状的TU。另外，对于经帧内预测的块，TU总是与PU对准。就是说，经帧内预测的块中的TU具有与所述块中的PU相同的大小和形状。图5中展示正方形TU的实例。将块29分区成四个四分之一大小的PU/TU。在块31中，将右上四分之一大小的PU/TU进一步分区成具有原始块大小的1/16的大小的四个较小的PU/TU。基于HEVC的提议，单独预测、变换和重构块29和31中的每一者。变换块(即，TU)大小与预测块(即，PU)大小相同。

最近，已提出非正方形变换的使用以结合2Nx2N PU/TU(即，四叉树分解的等级0)使用。图6中展示非正方形变换的一些实例。框33展示垂直定向的变换分区，而框35展示水平定向的变换分区。块33的分区有时称为hNx2N分区。在此上下文中，h指代“一半”。由此，hNx2N分区的宽度(即，hN)为所述分区的高度(即，2N)的长度的1/4。同样地，块35的分区有时称为2NxhN分区。由此，2NxhN分区的高度(即，hN)为所述分区的宽度(即，2N)的长度的1/4。在每一情况下，TU分区具有矩形形状。可结合称为短距帧内预测(SDIP)的技术使用非正方形变换。SDIP利用非正方形PU分区(类似于图6中所示的TU分区)来应用帧内预测技术。

如本发明中所提出，非正方形变换的使用扩展到四叉树结构的其它等级，包含等级1。因此，视频编码器(例如，视频编码器20)可从等级1NxN变换分区(即，正方形变换)和非正方形等级1SDIP变换分区中选择。并且，非正方形变换分区可包含hNx2N(例如，图6的块33)和2NxhN(例如，图6的块35)分区。贯穿本发明，术语变换分区和变换单元可互换使用。明确地说，术语变换分区可应用于所得变换单元，以及将译码单元或预测单元划分成变换单元。另外，术语块或子块可用来指代译码单元、预测单元、变换分区或变换单元中的任一者。明确地说，当进一步细分变换分区时，术语子块可用来指代所得变换单元。

用以用信号通知变换分区的选择的语法如下：

NS_Flag：此旗标指示是否选择NxN变换分区。举例来说，如果NS_Flag＝0，那么其意味着选择NxN变换；如果NS_Flag＝1，那么其意味着选择非正方形(例如，hNx2N或2NxhN)变换。

NS_direction_Flag：此旗标指示已选择了哪一非正方形变换。举例来说，如果NS_direction_Flag＝0，那么其意味着选择垂直定向的变换(hNx2N)；如果NS_direction_Flag＝1，那么其意味着选择水平定向的变换(2NxhN)。

如上文所述，可在2Nx2N CU的四叉树结构的等级1处应用非正方形变换分区。本发明进一步描述用于将非正方形变换分区应用于NxN PU/TU分区且/或用于将非正方形变换分区的使用扩展到四叉树结构的其它等级的方法和技术。

在本发明的一个实例中，在CU等级处用信号通知NS_Flag和NS_direction_flag。这意味着对于NxN PU分区，CU中的所有四个PU共享NS_Flag和NS_direction_flag的相同值。由此，PU中的每一者的TU相同。图7中展示实例。将CU37划分成四个NxN PU。在CU等级处，NS_Flag＝1且NS_direction_Flag＝1。在此情况下，CU37的所有四个NxN PU具有相同的非正方形变换(即，水平定向的2NxhN变换分区)。还将CU39划分成四个NxN PU。在CU等级处，对于CU39，NS_Flag＝1且NS_direction_Flag＝0。在此情况下，CU39的所有四个NxN PU具有相同的非正方形变换(即，垂直定向的hNx2N变换分区)。

在图7的实例中，CU内的PU的大小和形状可与TU的大小和形状不同。在其它实例中，PU还可具有非正方形形状，例如用于SDIP的非正方形PU分区。

在本发明的另一实例中，为每个NxN PU分区单独用信号通知NS_Flag和NS_direction_flag。这意味着每一PU与其自己的NS_Flag和NS_direction_flag相关联。由此，每一PU可具有不同的变换分区。图8中展示实例。将CU41划分成四个NxN PU(左上为PU0、右上为PU1、左下为PU2、右下为PU3)。在此实例中，对于PU0，NS_Flag＝1，且NS_direction_flag＝0。由此，使用垂直定向的hNx2N非正方形变换分区。对于PU1，NS_Flag＝0。由此，使用正方形变换分区。对于PU2，NS_Flag＝1，且NS_direction_flag＝1。由此，使用水平定向的2NxhN非正方形变换分区。同样地，对于PU3，NS_Flag＝1，且NS_direction_flag＝1。因此，使用水平定向的2NxhN非正方形变换分区。

在本发明的另一实例中，继将非正方形变换应用于四叉树结构的等级1，如图7和图8中所示，在四叉树分解的其它等级(例如，等级2、等级3等)处应用非正方形变换。作为一个实例，考虑具有四个NxN PU的CU的情况。如图9中所示，可首先将第一NxNPU(例如，图8中的PU0，NS_Flag＝1，NS_direction_flag＝0)分割成四个大小为(1/4N)xN的四个垂直定向的非正方形变换子块43A、43B、43C和43D。对于每一子块，可用信号通知额外旗标，以指示是否将进一步分割所述子块。举例来说，如果此旗标为1，那么进一步分割(1/4N)xN块。

在一个特定实例中，如图9中所示，可进一步将垂直定向的子块43A分割成四个(1/16N)xN变换分区。在其它实例中，可将子块43A分割成四个(1/4N)x(1/4N)变换分区，或分割成四个(1/8N)x(1/2N)变换分区。图10展示进一步分割成四个(1/4N)x(1/4N)变换分区的垂直定向TU分区的实例。图11展示进一步分割成四个(1/8N)x(1/2N)变换分区的垂直定向TU分区的实例。

为了指示进一步分割，在分区(例如，PU0)等级处用信号通知额外位。作为一个实例，可使用NS_flag_PUX和NS_direction_flag_PUX。如果NS_flag_PUX＝0，那么这指示分割成四个(1/8N)x(1/2N)变换分区。如果NS_flag_PUX＝1，那么进一步用信号通知NS_direction_flag_PUX。NS_direction_flag_PUX＝0指示分割成四个(1/16N)xN变换分区。NS_direction_flag_PUX＝1指示分割成四个(1/4N)x(1/4N)变换分区。

在以上实例中，存在三个可能的变换分区用于进一步分割，且由此，可使用开销位(即，需要两个旗标)。为了避免使用多个旗标，本发明提出其中在进一步分割过去的等级1分解的情况下允许一个变换分区类型的实例技术。举例来说，限制hNx2N变换分区的进一步分割以仅产生四个(1/8N)x2N变换分区。作为另一实例，限制2NxhN变换分区的进一步分割以仅产生四个2Nx(1/8N)变换分区。作为另一实例，限制NxN变换分区的进一步分割以仅产生四个1/4Nx1/4N变换分区。应理解，可使用分区与分割的其它组合。

在经帧内预测块的非正方形变换的一个实例实施方案中，是否应用非正方形变换取决于CU的大小。考虑其中对于具有大小2Nx2N的CU来说，最小所允许/可用非正方形变换大小为hx2N和2NxhN的实例。视频编码器(例如，视频编码器20)可经配置以用信号通知NS_Flag和NS_direction_Flag，以指定非正方形变换分区的选择。在一些情况下，这可浪费位。举例来说，假设视频编码器正在译码四叉树结构(其中变换块的大小为NxN)的等级1处的块。由此，无hx2N或2NxhN变换分区可适合所述等级处的块大小。然而，由于实例实施方案中的决策是基于CU大小，且CU大小2Nx2N大于(1/2N)x2N和2Nx(1/2N)，因此编码器可仍用信号通知NS_Flag和NS_direction_Flag，因此浪费位。

为了补救此潜在缺点，本发明进一步提出用信号通知NS_Flag和NS_direction_Flag的决策是基于变换块大小。举例来说，另变换块大小为MxM，且最小非正方形变换大小为AxB和BxA。如果M＜max(A，B)，那么无法将非正方形变换分区应用于此变换块，且因此编码器不用信号通知NS_Flag和NS_direction_Flag。否则，用信号通知这些语法元素。

图12是说明可使用如本发明中所描述的用于帧内预测译码的技术的视频编码器20的实例的框图。出于说明的目的，将在HEVC译码的上下文中描述视频编码器20，但不将本发明限制于可需要变换系数的扫描的其它译码标准或方法。视频编码器20可执行视频帧内的PU的帧内和帧间译码。帧内译码依靠空间预测来减少或去除给定视频帧内的视频数据中的空间冗余。帧间译码依靠时间预测来减少或去除视频序列的当前帧与先前译码帧之间的时间冗余。帧内模式(I模式)可涉及若干基于空间的视频压缩模式中的任一者。例如单向预测(P模式)或双向预测(B模式)等帧间模式可指代若干基于时间的视频压缩模式中的任一者。

如图12中所示，视频编码器20接收待编码视频帧内的当前视频块。在图12的实例中，视频编码器20包含运动补偿单元44、运动估计单元42、帧内预测单元46、参考帧缓冲器64、求和器50、变换单元52、量化单元54以及熵编码单元56。对于视频块重构，视频编码器20还包含逆量化单元58、逆变换单元60以及求和器62。还可包含去块滤波器(图12中未展示)以对块边界进行滤波，以从经重构的视频去除成块性假影。在需要时，去块滤波器将通常对求和器62的输出进行滤波。

在编码过程期间，视频编码器20接收待译码的视频帧或切片。可将帧或切片分为多个视频块(例如，最大译码单元(LCU))。运动估计单元42和运动补偿单元44相对于一个或一个以上参考帧中的一个或一个以上块执行对所接收的视频块的帧间预测译码以提供时间压缩。帧内预测单元46可相对于与待译码的块在同一帧或切片中的一个或一个以上相邻块执行所接收视频块的帧内预测译码，以提供空间压缩。

模式选择单元40可例如基于每一模式的速率失真分析来选择译码模式中的一者(帧内或帧间)，且将所得经帧内预测或帧间预测的块(例如，预测单元(PU))提供给求和器50以产生残余块数据，且提供给求和器62以重构经编码块以用于参考帧中。求和器62将所预测的块与来自用于所述块的逆变换单元60的经逆量化、逆变换数据进行组合，以重构经编码块，如下文更详细地描述。可将一些视频帧指定为I帧，其中I帧中的所有块均以帧内预测模式编码。在一些情况下，帧内预测单元46可执行对P或B帧中的块的帧内预测编码，例如当运动估计单元42所执行的运动搜索未得出所述块的充足预测时。

运动估计单元42与运动补偿单元44可高度集成，但出于概念上的目的而分开予以说明。运动估计(或运动搜索)是产生估计视频块的运动的运动向量的过程。举例来说，运动向量可指示当前帧中的预测单元相对于参考帧的参考样本的移位。运动估计单元42通过将预测单元与存储在参考帧缓冲器64中的参考帧的参考样本进行比较来计算经帧间译码的帧的预测单元的运动向量。参考样本可为发现与CU的包含正译码的PU的部分在像素差方面密切匹配的块，其可由绝对差和(SAD)、平方差和(SSD)或其它差度量确定。参考样本可出现在参考帧或参考片内的任何地方，且不一定在参考帧或片的块(例如，译码单元)边界处。在一些实例中，参考样本可出现在分数像素位置处。

运动估计单元42将所计算的运动向量发送到熵编码单元56和运动补偿单元44。由运动向量识别的参考帧的部分可称为参考样本。运动补偿单元44可例如通过检索由PU的运动向量识别的参考样本来计算当前CU的预测单元的预测值。

作为运动估计单元42和运动补偿单元44所执行的帧间预测的替代方案，帧内预测单元46可对接收到的块执行帧内预测。在假定块的从左到右、从上到下编码次序的情况下，帧内预测单元46可相对于相邻的先前经译码块(例如在当前块上方、上方且右侧、上方且左侧或左侧的块)预测接收到的块。帧内预测模块46可配置有多种不同帧内预测模式。举例来说，帧内预测单元46可基于正编码的CU的大小配置有某一数目的定向预测模式，例如三十五种定向预测模式。

帧内预测单元46可通过例如为各种帧内预测模式计算误差值且选择得出最低误差值的模式来选择帧内预测模式。定向预测模式可包含用于组合空间上相邻像素的值且将组合值应用于PU中的一个或一个以上像素位置的功能。一旦已计算PU中的所有像素位置的值，帧内预测单元46可基于PU与待编码的所接收块之间的像素差来计算所述预测模式的误差值。帧内预测单元46可继续测试帧内预测模式，直到发现得出可接受误差值的帧内预测模式为止。帧内预测单元46可接着将PU发送到求和器50。

视频编码器20通过将运动补偿单元44或帧内预测单元46所计算的预测数据从正译码的原始视频块减去来形成残余块。求和器50表示执行此减法运算的组件。残余块可对应于像素差值的二维矩阵，其中残余块中的值的数目与对应于所述残余块的PU中的像素的数目。残余块中的值可对应于PU中与待译码的原始块中位于同一位置的像素的值之间的差，即误差。所述差可为取决于被译码块的类型的色度和亮度差。

变换单元52可从残余块形成一个或一个以上变换单元(TU)。变换单元52从多个变换之中选择变换。可基于一个或一个以上译码特性(例如，块大小、译码模式等)来选择变换。变换单元52接着将选定变换应用于TU，从而产生包括变换系数的二维阵列的视频块。变换单元52可根据上文所述的本发明的技术来为经帧内译码的块选择变换分区。变换单元52或视频编码器20的另一单元可在经编码视频位流中用信号通知选定变换分区类型和/或方向。

变换单元52可将所得变换系数发送到量化单元54。量化单元54可接着量化变换系数。熵编码单元56可接着根据扫描模式执行矩阵中的经量化变换系数的扫描。本发明将熵编码单元56描述为执行所述扫描。然而，应理解，在其它实例中，其它处理单元(例如量化单元54)可执行所述扫描。

一旦将变换系数扫描到一维阵列中，熵编码单元56就可对所述系数应用熵译码，例如CAVLC、CABAC、PIPE、基于语法的上下文自适应二进制算术译码(SBAC)或另一熵译码方法。

为了执行CAVLC，熵编码单元56可为待发射的符号选择可变长度代码。可构造VLC中的码字，使得相对较短的代码对应于概率较大的符号，而较长的代码对应于概率较小的符号。以此方式，与例如对待发射的每一符号使用等长码字相比，VLC的使用可实现位节省。

为了执行CABAC，熵编码单元56可选择上下文模型来应用于某一上下文以编码待发射的符号。所述上下文可与例如相邻值是非零还是零有关。熵编码单元56还可对语法元素(例如代表选定变换的信号)进行熵编码。根据本发明的技术，熵编码单元56可基于(例如)帧内预测模式的帧内预测方向、对应于语法元素的系数的扫描位置、块类型和/或变换类型以及用于上下文模型选择的其它因素选择用以编码这些语法元素的上下文模型。

在熵译码单元56进行的熵译码之后，可将所得经编码视频发射到另一装置(例如视频解码器30)或加以存档以用于稍后发射或检索。在一些情况下，熵编码单元56或视频编码器20的另一单元可经配置以执行除熵译码之外的其它译码功能。举例来说，熵编码单元56可经配置以确定CU和PU的经译码块模式(CBP)值。并且，在一些情况下，熵编码单元56可执行系数的游程长度译码。

逆量化单元58和逆变换单元60分别应用逆量化和逆变换，以在像素域中重构残余块，例如以供稍后用作参考块。运动补偿单元44可通过将残余块加到参考帧缓冲器64的帧中的一者的预测性块来计算参考块。运动补偿单元44还可将一个或一个以上内插滤波器应用于经重构的残余块，以计算子整数像素值以供运动估计中使用。求和器62将经重构的残余块加到由运动补偿单元44所产生的经运动补偿预测块，以产生经重构视频块以供存储在参考帧缓冲器64中。经重构视频块可由运动估计单元42和运动补偿单元44用作参考块以对后续视频帧中的块进行帧间译码。

图13是说明对经编码视频序列进行解码的视频解码器30的实例的框图。在图13的实例中，视频解码器30包含熵解码单元70、运动补偿单元72、帧内预测模块74、逆量化单元76、逆变换单元78、参考帧缓冲器82以及求和器80。视频解码器30在一些实例中可执行一股与相对于视频编码器20(见图12)所描述的编码遍次互逆的解码遍次。

熵解码单元70对经编码位流执行熵解码过程，以检索变换系数的一维阵列。所使用的熵解码过程取决于视频编码器20所使用的熵译码(例如，CABAC、CAVLC等)。可在经编码位流中用信号通知编码器所使用的熵译码过程，或其可为预定义过程。

在一些实例中，熵解码单元70(或逆量化单元76)可使用反映视频编码器20的熵编码单元56(或量化单元54)所使用的扫描模式的扫描来扫描接收到的值。尽管可在逆量化单元76中执行系数的扫描，但将出于说明的目的，将扫描描述为由熵解码单元70执行。另外，尽管为了便于说明展示为单独的功能单元，但视频解码器30的熵解码单元70、逆量化单元76以及其它单元的结构和功能性可彼此高度集成。

逆量化单元76将提供于位流中且由熵解码单元70解码的经量化变换系数逆量化(即，去量化)。逆量化过程可包含(例如)类似于为HEVC所提出或由H.264解码标准界定的过程的常规过程。逆量化过程还包含针对CU使用由视频编码器20计算的量化参数QP来确定量化程度以及同样地应应用逆量化的程度。在将系数从一维阵列转换为二维阵列之前或之后，逆量化单元76可对变换系数进行逆量化。

逆变换单元78将逆变换应用于经逆量化的变换系数。在一些实例中，逆变换单元78可基于来自视频编码器20的信令或通过从例如块大小、译码模式等一个或一个以上译码特性推断变换来确定逆变换。在一些实例中，逆变换单元78可根据本发明的上述技术，基于在经编码视频位流中接收的用信号通知的变换分区类型来确定要应用于当前块的变换。明确地说，可针对经帧内预测的块接收指示正方形或非正方形分区类型的使用的语法元素，以及指示非正方形分区的分区方向的语法元素。在一些实例中，逆变换单元78可应用级联逆变换，其中逆变换单元78将两个或两个以上逆变换应用于正解码的当前块的变换系数。

帧内预测单元74可基于用信号通知的帧内预测模式以及来自当前帧的先前经解码块的数据为当前帧的当前块产生预测数据。

基于检索到的运动预测方向、参考帧索引以及所计算的当前运动向量，运动补偿单元产生当前部分的经运动补偿的块。这些经运动补偿的块本质上重新创建用以产生残余数据的预测性块。

运动补偿单元72可产生经运动补偿的块，从而可能执行基于内插滤波器的内插。待用于具有子像素精度的运动估计的内插滤波器的识别符可包含于语法元素中。运动补偿单元72可使用如由视频编码器20在视频块的编码期间所使用的内插滤波器来计算参考块的子整数像素的经内插值。运动补偿单元72可根据所接收的语法元素来确定视频编码器20所使用的内插滤波器，且使用内插滤波器来产生预测块。

另外，在HEVC实例中，运动补偿单元72和帧内预测单元74可使用语法信息(例如由四叉树提供)中的一些来确定用以编码经编码视频序列的帧的LCU的大小。运动补偿单元72和帧内预测单元74还可使用语法信息来确定描述如何分割经编码视频序列的帧的每一CU(且同样地，如何分割子CU)的分割信息。语法信息还可包含指示如何编码每一分割的模式(例如，帧内或帧间预测，且用于帧内预测编码模式的帧内预测)、每一经帧间编码PU的一个或一个以上参考帧(和/或含有参考帧的识别符的参考列表)，以及用以解码经编码视频序列的其它信息。

求和器80对残余块与由运动补偿单元72或帧内预测单元74产生的对应预测块进行组合以形成经解码块。如果需要的话，还可应用去块滤波器来对经解码块进行滤波，以便去除成块性假影。接着将经解码的视频块存储在参考帧缓冲器82中，参考帧缓冲器82提供用于后续运动补偿的参考块，且还产生用于在显示装置(例如，图1的显示装置32)上呈现的经解码视频。

图14是说明根据本发明的技术的实例视频编码方法的流程图。图14的方法可由视频编码器20的一个或一个以上组件、单元或模块执行。

视频编码器20可经配置以执行根据本发明的技术的视频编码方法。在一个实例中，视频编码器20可经配置以：将译码单元分区成多个预测单元，其中使用帧内预测来编码译码单元(120)；且为预测单元确定变换分区，其中所述变换分区中的至少一者为非正方形分区(122)。以此方式，在四叉树结构的高于等级0的等级(例如，等级1)处应用非正方形变换。举例来说，预测单元可在四叉树结构的等级1处。

在本发明的其它实例中，可在四叉树结构的较高等级处执行分区(120)和确定(122)步骤。举例来说，视频编码器20可进一步经配置以根据所确定的变换分区将多个预测单元中的一者或一者以上分区成子块，且为所述子块中的每一者确定进一步分区类型。在一个实例中，所述子块处于四叉树分解等级2或以上。在一个实例中，基于用以将多个预测单元分区成子块的所确定变换分区来确定进一步分区类型。在另一实例中，视频编码器20可进一步经配置以将进一步分区类型限制于一个变换类型和一个变换方向。在另一实例中，视频编码器20可经配置以基于子块的分区大小来确定用于子块的进一步分区类型。

视频编码器20可进一步经配置以用信号通知指示变换类型的第一语法元素，其中所述变换类型选自正方形变换分区和非正方形变换分区中的至少一者(124)。在本发明的一个实例中，视频编码器20可经配置以为译码单元确定变换分区，使得多个预测单元中的每一者具有相同变换分区。在此情况下，在译码单元等级处用信号通知第一语法元素。在本发明的另一实例中，视频编码器20可经配置以分别为多个预测单元中的每一者确定变换分区。在此情况下，在预测单元等级处用信号通知第一语法元素。

视频编码器20可进一步经配置以在第一语法元素指示非正方形变换类型的情况下，用信号通知指示具有非正方形变换类型的每一变换分区的变换方向的第二语法元素，其中所述变换方向是选自水平定向方向和垂直定向方向中的至少一者(126)。视频编码器20可进一步经配置以将变换应用于变换分区中的每一者以编码残余预测数据(128)。

图15是说明根据本发明的技术的实例视频解码方法的流程图。图15的方法可由视频解码器30的一个或一个以上组件、单元或模块执行。视频解码器30对非正方形分区的使用可响应于视频编码器(例如，视频编码器20)所执行的位流信令，或可基于与视频编码器所使用的规则匹配的预定义规则。

视频解码器30可经配置以执行根据本发明的技术的视频解码方法。在一个实例中，视频解码器30可经配置以：接收指示变换类型的第一语法元素，其中所述变换类型是选自正方形变换分区和非正方形变换分区中的至少一者(220)；且在第一语法元素指示非正方形变换类型的情况下，接收指示具有非正方形变换类型的每一变换分区的变换方向的第二语法元素，其中所述变换方向是选自水平定向方向和垂直定向方向中的至少一者(222)。应注意，如果视频解码器30经配置以隐含地或通过预定义规则而不是通过明确信令来确定非正方形分区的使用，那么接收步骤是任选的。

不管是隐含地(例如，通过规则)还是明确地(例如，通过接收到的第一和第二语法元素)，视频编码器30可进一步经配置以：将译码单元分区成多个预测单元，其中使用帧内预测来编码译码单元(224)；且为预测单元确定变换分区，其中所述变换分区中的至少一者为非正方形分区(226)。

在本发明的一个实例中，在译码单元等级处接收第一和第二语法元素。由此，视频编码器30可经配置以为译码单元确定变换分区，使得多个预测单元中的每一者具有相同变换分区。在本发明的另一实例中，在预测单元等级处接收第一和第二语法元素。由此，视频解码器30可经配置以单独地为多个预测单元中的每一者确定变换分区。以此方式，在四叉树结构的高于等级0的等级(例如，等级1)处应用非正方形变换。举例来说，预测单元可在四叉树结构的等级1处。

在本发明的其它实例中，可在四叉树结构的较高等级处执行分区(224)和确定(226)步骤。举例来说，视频解码器30可进一步经配置以根据所确定的变换分区将多个预测单元中的一者或一者以上分区成子块，且为所述子块中的每一者确定进一步分区类型。在一个实例中，所述子块处于四叉树分解等级2或以上。在一个实例中，基于用以将多个预测单元分区成子块的所确定变换分区来确定进一步分区类型。在另一实例中，视频解码器30可进一步经配置以将进一步分区类型限制于一个变换类型和一个变换方向。在另一实例中，视频解码器30可经配置以基于子块的分区大小来确定用于子块的进一步分区类型。

视频解码器30可进一步经配置以将逆变换应用于变换分区中的每一者以解码残余预测数据(228)。视频解码器30可进一步经配置以使用帧内预测来解码残余预测数据以产生经解码的视频数据(230)。

在一个或一个以上实例中，所描述的功能可以硬件、软件、固件或其任何组合来实施。如果以软件来实施，那么功能可作为一个或一个以上指令或代码存储在计算机可读媒体上或经由计算机可读媒体传输，且由基于硬件的处理单元执行。计算机可读媒体可包含计算机可读存储媒体，其对应于例如数据存储媒体等有形媒体，或包含例如根据通信协议促进计算机程序从一处到另一处的传送的任何媒体的通信媒体。以此方式，计算机可读媒体通常可对应于(1)非暂时性的有形计算机可读存储媒体，或(2)例如信号或载波的通信媒体。数据存储媒体可为可由一个或一个以上计算机或一个或一个以上处理器存取以检索指令、代码和/或数据结构以供实施本发明中所描述的技术的任何可用媒体。计算机程序产品可包含计算机可读媒体。

作为实例(而非限制)，所述计算机可读媒体可包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁性存储装置，快闪存储器，或可用于存储呈指令或数据结构的形式的所要程序码且可由计算机存取的任何其它媒体。并且，任何连接均可恰当地称为计算机可读媒体。举例来说，如果使用同轴电缆、光纤缆线、双绞线、数字订户线(DSL)或例如红外线、无线电及微波等无线技术从网站、服务器或其它远程源传输指令，那么同轴电缆、光纤缆线、双绞线、DSL或例如红外线、无线电及微波等无线技术包含于媒体的定义中。然而，应理解，计算机可读存储媒体和数据存储媒体不包含连接、载波、信号或其它瞬态媒体，而是针对非瞬态有形存储媒体。如本文中所使用，磁盘及光盘包含压缩光盘(CD)、激光光盘、光学光盘、数字多功能光盘(DVD)、软磁盘及蓝光光盘，其中磁盘通常以磁性方式再现数据，而光盘使用激光以光学方式再现数据。上文的组合也应包含在计算机可读媒体的范围内。

指令可由一个或一个以上处理器执行，例如一个或一个以上数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA)，或其它等效集成或离散逻辑电路。因此，如本文中所使用的术语“处理器”可指上述结构或适合于实施本文中所描述的技术的任一其它结构中的任一者。另外，在一些方面中，本文所述的功能性可提供于经配置以用于编码和解码的专用硬件和/或软件模块内，或并入在组合式编解码器中。并且，可将所述技术完全实施于一个或一个以上电路或逻辑元件中。

本发明的技术可在各种各样的装置或设备中实施，包含无线手持机、集成电路(IC)或一组IC(例如，芯片组)。本发明中描述各种组件、模块或单元，以强调经配置以执行所揭示技术的装置的功能方面，但不一定要求由不同硬件单元来实现。相反，如上文所述，各种单元可组合在编解码器硬件单元中，或由互操作硬件单元的集合提供，包含如上文所述的一个或一个以上处理器，结合合适的软件和/或固件。

已描述了各种实例。这些和其它实例在所附权利要求书的范围内。

Claims

1.一种视频编码方法，其包括：

将译码单元分区成四个NxN预测单元，其中使用帧内预测来编码所述译码单元；

为每个相应的预测单元确定相应的变换分区，其中所确定变换分区中的至少一者为非正方形矩形分区，且其中所述变换分区由形状和方向界定；

根据相应的所确定变换分区将所述相应的预测单元中的每一个分区成若干变换块；

用信号通知用于所述相应的预测单元中的每一个的第一语法元素，所述第一语法元素指示所述相应的预测单元的相应的变换分区的所述形状；

在所述第一语法元素指示非正方形的形状的情况下，用信号通知用于具有所述非正方形的形状的所述变换分区的所述相应的预测单元的第二语法元素，所述第二语法元素指示所述非正方形的形状的所述方向；

为所述变换块中的每一个确定进一步分区类型；以及

在变换块等级处用信号通知用于每个相应的变换块的第三语法元素，所述第三语法元素指示所述变换块中的特定的一个基于所确定的进一步分区类型而被进一步分割。

2.根据权利要求1所述的视频编码方法，其中所述预测单元处于四叉树结构的等级1。

3.根据权利要求1所述的视频编码方法，其中所述变换块处于四叉树分解等级2或以上。

4.根据权利要求1所述的视频编码方法，其中确定所述进一步分区类型包括基于用以将所述相应的预测单元分区成若干变换块的所确定的相应的变换分区来确定所述进一步分区类型。

5.根据权利要求1所述的视频编码方法，其中确定所述进一步分区类型包括使用一个变换类型和一个变换方向来确定所述进一步分区类型。

6.根据权利要求1所述的视频编码方法，其中确定所述进一步分区类型包括基于所述变换块的分区大小来确定所述进一步分区类型。

7.根据权利要求1所述的视频编码方法，其进一步包括：

将变换应用于所述变换块中的每一者以编码残余预测数据。

8.一种视频解码方法，其包括：

接收用于所述预测单元中的每一个的第一语法元素，所述第一语法元素指示每个相应的预测单元的相应的变换分区的形状；

在所述第一语法元素指示非正方形的形状的情况下，接收用于具有所述非正方形的形状的所述变换分区的所述相应的预测单元的第二语法元素，所述第二语法元素指示所述非正方形的形状的方向；

根据用于每个相应的预测单元的所述第一语法元素和所述第二语法元素，将所述相应的预测单元中的每一个分区成变换块；

在变换块等级处接收用于每个变换块的第三语法元素，所述第三语法元素指示所述变换块中的特定的一个是否被进一步分割；以及

基于所述第三语法元素将所述变换块进一步分区。

9.根据权利要求8所述的视频解码方法，其中所述预测单元处于四叉树结构的等级1。

10.根据权利要求8所述的视频解码方法，其中所述变换块位于四叉树分解等级2或以上。

11.根据权利要求8所述的视频解码方法，其中将所述变换块进一步分区包括基于所述第三语法元素使用一个变换类型和一个变换方向将所述变换块进一步分区。

12.根据权利要求8所述的视频解码方法，其中将所述变换块进一步分区包括基于所述第三语法元素和所述变换块的分区大小将所述变换块进一步分区。

13.根据权利要求8所述的视频解码方法，其进一步包括：

将逆变换应用于所述变换块中的每一者以解码残余预测数据。

14.根据权利要求13所述的视频解码方法，其进一步包括：

使用帧内预测来解码所述残余预测数据以产生经解码视频数据。

15.一种视频编码设备，其包括：

存储器，其经配置以存储视频数据；以及

视频编码器，其经配置以：

将所述视频数据的译码单元分区成四个NxN预测单元，其中使用帧内预测来编码所述译码单元；

为所述变换块中的每一个确定进一步分区类型；以及

16.根据权利要求15所述的视频编码设备，其中所述预测单元处于四叉树结构的等级1。

17.根据权利要求15所述的视频编码设备，其中所述变换块处于四叉树分解等级2或以上。

18.根据权利要求15所述的视频编码设备，其中所述视频编码器进一步经配置以：基于用以将所述相应的预测单元分区成若干变换块的所确定的相应的变换分区来确定所述进一步分区类型。

19.根据权利要求15所述的视频编码设备，其中所述视频编码器进一步经配置以：

使用一个变换类型和一个变换方向来确定所述进一步分区类型。

20.根据权利要求15所述的视频编码设备，其中所述视频编码器进一步经配置以：基于所述变换块的分区大小来确定所述进一步分区类型。

21.根据权利要求15所述的视频编码设备，其中所述视频编码器进一步经配置以：

将变换应用于所述变换块中的每一者以编码残余预测数据。

22.一种视频解码设备，其包括：

存储器，其经配置以存储视频数据；以及

视频解码器，其经配置以：

将所述视频数据的译码单元分区成四个NxN预测单元，其中使用帧内预测来编码所述译码单元；以及

根据用于每个相应的预测单元的所述第一语法元素和所述第二语法元素，将所述相应的预测单元中的每一个分区成变换子块；

基于所述第三语法元素将所述变换块进一步分区。

23.根据权利要求22所述的视频解码设备，其中所述预测单元处于四叉树结构的等级1。

24.根据权利要求22所述的视频解码设备，其中所述变换块处于四叉树分解等级2或以上。

25.根据权利要求22所述的视频解码设备，其中所述视频解码器进一步经配置以：

基于所述第三语法元素使用一个变换类型和一个变换方向将所述变换块进一步分区。

26.根据权利要求22所述的视频解码设备，其中所述视频解码器进一步经配置以：

基于所述第三语法元素和所述变换块的分区大小将所述变换块分区。

27.根据权利要求22所述的视频解码设备，其中所述视频解码器进一步经配置以：

将逆变换应用于所述变换分区中的每一者以解码残余预测数据。

28.根据权利要求27所述的视频解码设备，其中所述视频解码器进一步经配置以：

29.一种视频编码设备，其包括：

用于将译码单元分区成四个NxN预测单元的装置，其中使用帧内预测来编码所述译码单元；以及

用于为每个相应的预测单元确定相应的变换分区的装置，其中所确定变换分区中的至少一者为非正方形矩形分区，且其中所述变换分区由形状和方向界定；

用于根据相应的所确定变换分区将所述相应的预测单元中的每一个分区成若干变换块的装置；

用于用信号通知用于所述相应的预测单元中的每一个的第一语法元素的装置，所述第一语法元素指示所述相应的预测单元的相应的变换分区的所述形状；

用于在所述第一语法元素指示非正方形的形状的情况下，用信号通知用于具有所述非正方形的形状的所述变换分区的所述相应的预测单元的第二语法元素的装置，所述第二语法元素指示所述非正方形的形状的所述方向；

用于为所述变换块中的每一个确定进一步分区类型的装置；以及

用于在变换块等级处用信号通知用于每个相应的变换块的第三语法元素的装置，所述第三语法元素指示所述变换块中的特定的一个基于所确定的进一步分区类型而被进一步分割。

30.一种视频解码设备，其包括：

用于将译码单元分区成四个NxN预测单元的装置，其中使用帧内预测来编码所述译码单元；

用于接收用于所述预测单元中的每一个的第一语法元素的装置，所述第一语法元素指示每个相应的预测单元的相应的变换分区的形状；

用于在所述第一语法元素指示非正方形的形状的情况下，接收用于具有所述非正方形的形状的所述变换分区的所述相应的预测单元的第二语法元素的装置，所述第二语法元素指示所述非正方形的形状的方向；

用于根据用于每个相应的预测单元的所述第一语法元素和所述第二语法元素，将所述相应的预测单元中的每一个分区成变换块的装置；

用于在变换块等级处接收用于每个变换块的第三语法元素的装置，所述第三语法元素指示所述变换块中的特定的一个是否被进一步分割；以及

用于基于所述第三语法元素将所述变换块进一步分区的装置。