CN107113433B

CN107113433B - 基于动态模式决策分支化的低复杂性译码

Info

Publication number: CN107113433B
Application number: CN201580058149.8A
Authority: CN
Inventors: 钟仁肃; 李圣远; 谢成郑; 王翔林
Original assignee: Qualcomm Inc
Current assignee: Qualcomm Inc
Priority date: 2014-11-07
Filing date: 2015-10-21
Publication date: 2020-02-18
Anticipated expiration: 2035-10-21
Also published as: EP3216218A1; CN107113433A; WO2016073203A1; US20160134877A1; JP2017538379A; US9654782B2

Abstract

本发明提供用于低复杂性视频译码的技术。举例来说，一种视频译码器可经配置以计算译码单元CU块与参考帧中的第一对应块之间的第一绝对差总和SAD值，且基于所述第一SAD值为CU大小的分支化定义分支化条件，所述分支化条件包含背景条件和/或齐次条件。所述视频译码器可经配置以在所述CU块的所述第一SAD值小于第一阈值背景值的情况下检测所述背景条件，且在所述CU块的子块的第二SAD值介于基于所述第一SAD值的上齐次阈值与下齐次阈值之间的情况下检测所述齐次条件。所述CU大小的所述分支化可基于检测所述背景或齐次条件。

Description

基于动态模式决策分支化的低复杂性译码

技术领域

本发明大体上涉及视频译码，和更明确地说，涉及使用针对最大译码单元(LCU)的动态模式决策(DMD)分支化的低复杂性编码的技术。

背景技术

数字视频能力可并入到多种多样的装置中，包含数字电视、数字直播系统、无线广播系统、个人数字助理(PDA)、膝上型或桌上型计算机、平板计算机、电子书阅读器、数码相机、数字记录装置、数字媒体播放器、视频游戏装置、视频游戏控制台、蜂窝式或卫星无线电电话(所谓的“智能电话”)、视频电话会议装置、视频串流装置等。数字视频装置实施视频压缩技术，例如，在由MPEG-2、MPEG-4、ITU-T H.263、ITU-T H.264/MPEG-4第10部分高级视频译码(AVC)定义的标准、目前正在开发的高效率视频译码(HEVC)标准及此类标准的扩展中所描述的视频压缩技术。视频装置可通过实施此类视频压缩技术来更高效地发射、接收、编码、解码和/或存储数字视频信息。

视频译码标准(例如HEVC/H.265、H.264、H.263)在视频编码器处利用基于块的处理，其中将预测块(即，来自帧间或帧内预测路径)从原始像素减去，且其中使用正向变换(例如离散余弦变换(DCT))将残差变换成系数、量化、并熵译码(例如经由CAVLC或CABAC)。在视频解码器处，对所述系数进行熵解码、去量化、逆变换，且接着加回到预测块，从而形成经重构像素。

在HEVC中，视频编码器包含用于模式决策和运动估计的高复杂性模块，部分地归因于视频编码器检查所有不同译码单元(CU)大小(即，64×64、32×32、16×16和8×8)来识别每一编码树单元(CTU)的最佳译码模式和CU/预测单元(PU)/变换单元(TU)结构，这实质上增加了HEVC编码器的复杂性。在此上下文中，仍需要降低编码/解码过程的复杂性的技术。

发明内容

本发明的系统、方法和装置各自具有若干创新方面，其中没有单个方面单独负责本文所揭示的合乎需要的属性。本发明的一个方面提供一种用于基于减少所检查以识别最佳译码模式以及每一编码树单元(CTU)的CU/预测单元(PU)/变换单元(TU)结构的译码单元(CU)大小的数目的低复杂性视频译码的装置和方法。所述设备可包括存储器单元，其经配置以存储视频数据。所述设备可进一步包括操作地耦合到所述存储器单元的视频译码单元。所述视频处理单元可经配置以计算CU块与参考帧中的第一对应块之间的第一绝对差总和(SAD)值。所述视频处理单元可经配置以至少部分地基于所述第一SAD值来定义用于CU大小的分支化的分支化条件，所述分支化条件包括背景条件和齐次条件。

如果CU块的第一SAD值小于第一阈值背景值，那么所述视频处理单元可经配置以检测所述背景条件。如果CU块的子块的第二SAD值介于至少部分地基于所述第一SAD值的上齐次阈值与下齐次阈值之间，那么所述视频处理单元可经配置以检测齐次条件。所述视频处理单元可经配置以基于所述背景条件或所述齐次条件的检测来确定CU大小的分支化。

举例来说，所述视频处理单元可经配置以基于以下各项来为CU大小的分支化定义分支化条件：为CU大小的分支化定义分支化条件包括；将第二分支的分支化条件定义为包括以下各项的满足：(i)子块的第二SAD值小于第二阈值背景值；或(ii)子块的第二SAD值介于至少部分地基于第一SAD值的上齐次阈值与下齐次阈值之间；以及将第三分支的分支化条件定义为包括所述第一和第二分支的分支化条件的不满足。

在相关方面中，视频处理单元可经配置以基于根据CU大小的分支化检查CU大小的子集，来对最大译码单元(LCU)执行动态模式决策(DMD)分支化。视频处理单元可经配置以至少部分地基于用于LCU的DMD分支化来(i)为编码树单元(CTU)选择译码模式，或(ii)执行运动估计。

在进一步相关方面中，还提供执行所述设备的功能的方法。

附图说明

图1A是说明可利用本发明中描述的低复杂性视频译码技术的实例视频编码和解码系统的框图。

图1B是说明可执行本发明中描述的低复杂性视频译码技术的另一实例视频编码和解码系统的框图。

图2是说明可实施本发明中描述的低复杂性视频译码技术的实例视频编码器的框图。

图3是说明可实施本发明中描述的低复杂性视频译码技术的实例视频解码器的框图。

图4是说明实例HEVC视频编码器及其组件的框图。

图5A描绘LCU的DMD分支化的基于三分支的方法的说明性实例。

图5B描绘分支化的实例条件，例如图5A或类似者中的分支化。

图6描绘LCU的DMD分支化的基于二分支的方法的说明性实例。

图7是示出根据本发明的一或多个方面的用于低复杂性视频译码的示范性技术的流程图。

图8到12示出根据本发明的一或多个方面的图7的方法的进一步方面。

具体实施方式

下文结合附图陈述的详细描述既定作为对本发明的示范性实施例的描述，且并不希望表示可实践本发明的仅有实施例。贯穿此描述所使用的术语“示范性”表示“充当实例、例子或说明”，且未必应解释为比其它示范性实施例优选或有利。具体实施方式出于提供对本发明的示范性实施例的透彻理解而包含特定细节。在一些情况下，以框图形式示出一些装置。

虽然出于解释的简单的目的，将方法示出并描述为一连串动作，但应理解并了解，所述方法不受动作的次序限制，因为根据一或多个方面，一些动作可以不同次序发生和/或与来自本文中所示出并描述的其它动作同时发生。举例来说，所属领域的技术人员将理解并且了解，所述方法可替代地表示为(例如在一个状态图中的)一系列相关状态或事件。此外，根据一或多个方面，并不需要所有所说明的动作来实施方法。

本发明描述用于基于对最大译码单元(LCU)的动态模式决策(DMD)分支化的低复杂性视频译码的技术。可使用DMD分支化来减少所检查以识别最佳译码模式以及每一编码树单元(CTU)的CU/预测单元(PU)/变换单元(TU)结构的译码单元(CU)大小的数目。

图1A是说明可利用本发明中描述的低复杂性视频译码技术的实例视频编码和解码系统10的框图。如图1A中所示，系统10包含源装置12，其产生稍后将由目的地装置14解码的经编码视频数据。在图1A的实例中，源模块12和目的地模块14在单独的装置上，具体来说，源模块12是源装置的一部分，且目的地模块14是目的地装置的一部分。然而，注意，源模块12与目的地模块14可在同一装置上或为同一装置的部分，如在图1B的实例中所示。

再次参考图1A，源模块12和目的地模块14可包括各种裝置中的任一者或包含于各种裝置的任一者中，包含桌上型计算机、笔记本型(即，膝上型)计算机、平板计算机、机顶盒、电话手持机(例如所谓的“智能”电话)、所谓的“智能”垫、电视机、相机、显示装置、数字媒体播放器、视频游戏控制台、视频串流装置、汽车/交通工具、可穿戴护具等。在一些情况下，源模块12和目的地模块14可经装备以用于无线通信。

目的地模块14可经由链路16接收待解码的经编码视频数据。链路16可包括能够将经编码视频数据从源模块12移动到目的地模块14的任何类型媒体或装置。在图1A的实例中，链路16可包括使得源模块12能够实时将经编码视频数据直接发射到目的地模块14的通信媒体。经编码视频数据可根据例如无线通信协议等通信标准加以调制，且发射到目的地模块14。通信媒体可包括任何无线或有线通信媒体，例如射频(RF)频谱或一或多个物理传输线。通信媒体可形成基于分组的网络(例如，局域网、广域网或全球网络，例如因特网)的部分。通信媒体可包含路由器、交换器、基站或任何其它可用于促进从源模块12到目的地模块14的通信的设备。

或者，经编码数据可从输出接口22输出到任选的存储装置31。类似地，可通过输入接口从存储装置31存取经编码数据。存储装置31可包含多种分布式或本地存取数据存储媒体中的任一者，例如硬盘驱动器、快闪存储器、易失性或非易失性存储器，或用于存储经编码视频数据的任何其它合适的数字存储媒体。在另一实例中，存储装置31可对应于文件服务器或可保持由源模块12产生的经编码视频的另一中间存储装置。目的地模块14可经由流式传输或下载从存储装置31存取所存储的视频数据。文件服务器可为能够存储经编码视频数据并将经编码视频数据发射到目的地模块14的任何类型的服务器。实例文件服务器包含网络服务器(例如，用于网站)、FTP服务器、网络附接式存储(NAS)装置或本地磁盘驱动器。目的地模块14可通过任何标准数据连接(包含因特网连接)来存取经编码的视频数据。这可包含无线信道(例如，Wi-Fi连接)、有线连接(例如，DSL、电缆调制解调器等)，或适合于存取存储在文件服务器上的经编码视频数据的两者的组合。经编码视频数据从存储装置31的发射可为流式发射、下载发射或两者的组合。

本发明的技术未必限于无线应用或设定。所述技术可应用于视频译码以支持多种多媒体应用中的任一者，例如空中电视广播、有线电视发射、卫星电视发射、串流视频发射(例如，经由因特网)、对数字视频编码以存储于数据存储媒体上、对存储于数据存储媒体上的数字视频解码，或其它应用。在一些实例中，系统10可经配置以支持单向或双向视频传输，以支持例如视频流式传输、视频重放、视频广播和/或视频电话等应用。

在图1A的实例中，源模块12包括视频源18、视频编码器20和输出接口22。在一些情况下，输出接口22可包含调制器/解调器(调制解调器)和/或发射器。在源模块12中，视频源18可包含来源，例如视频捕获装置(例如摄像机)、含有先前捕获的视频的视频存档、用于从视频内容提供者接收视频的视频馈入接口和/或用于产生计算机图形数据作为源视频的计算机图形系统，或此类来源的组合。作为一个实例，如果视频源18是摄像机，那么源模块12和目的地模块14可形成所谓的相机电话或视频电话，如图1B的实例中所说明。然而，本发明中所描述的技术一般来说可适用于视频译码，且可应用于无线和/或有线应用。

视频编码器20可编码所捕获、预捕获或计算机产生的视频。经编码视频数据可经由源模块12的输出接口22直接发射到目的地模块14。经编码视频数据还可(或替代地)存储到存储装置31上用于稍后由目的地模块14或其它装置存取以用于解码和/或重放。

目的地模块14包含输入接口28、视频解码器30和显示装置32。在一些情况下，输入接口28可包含接收器和/或调制解调器。目的地模块14的输入接口28可经由链路16接收经编码视频数据。经由链路16传送或在存储装置31上提供的经编码视频数据可包含由视频编码器20产生的多种语法元素以供由例如视频解码器30的视频解码器用于解码视频数据。此类语法元素可与在通信媒体上发射、存储于存储媒体上或存储文件服务器的经编码视频数据包含在一起。

显示装置32可与目的地模块14集成或在目的地模块14外部。在一些实例中，目的地模块14可包括集成显示装置，并且还经配置以与外部显示装置介接。在其它实例中，目的地模块14可为显示装置。一般来说，显示器装置32向用户显示经解码视频数据，且可包括多种显示器装置中的任一者，例如液晶显示器(LCD)、等离子显示器、有机发光二极管(OLED)显示器或另一类型的显示器装置。

在相关方面中，图1B示出实例视频编码和解码系统10′，其中源模块12和目的地模块14在装置或用户装置11上或为其部分。装置11可为电话手持机，例如“智能”电话或类似者。装置11可包含与源模块12和目的地模块14操作性通信的任选的控制器/处理器模块13。图1B的系统10′可进一步包含视频编码器20与输出接口22之间的视频处理单元21。在一些实施方案中，视频处理单元21是单独的单元，如图1B中所说明；然而，在其它实施方案中，视频处理单元21可实施为视频编码器20和/或处理器/控制器模块13的一部分。图1B的系统10′及其组件另外类似于图1A的系统10及其组件。

如下文更详细地描述，本发明的各方面通常涉及基于针对LCU的DMD分支化的低复杂性视频译码。本发明的技术可由视频编码器20和(任选地)视频解码器30的组件执行。

在一个实例中，视频编码器20和视频解码器30可根据包含HEVC或类似物的视频压缩标准操作。在另一实例中，视频编码器20和视频解码器30可根据其它专有或行业标准(例如ITU-TH.264标准，或者被称作MPEG-4，第10部分，高级视频译码(AVC)，或此类标准的扩展)来操作。视频压缩标准的其它实例包含MPEG-2和ITU-T H.263。然而，本发明的技术不限于任何特定译码标准或技术。

尽管图1A-B中未图示，但在一些方面中，视频编码器20和视频解码器30可各自与音频编码器和解码器集成，且可包含适当的MUX-DEMUX单元或其它硬件和软件以处置共同数据流或单独数据流中的音频和视频两者的编码。在一些实例中，如果适用的话，那么MUX-DEMUX单元可符合ITU H.223多路复用器协议，或例如用户数据报协议(UDP)等其它协议。

视频编码器20和视频解码器30各自可实施为多种合适的编码器电路中的任一者，例如一或多个微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、软件、硬件、固件或其任何组合。当所述技术在软件中部分地实施时，装置可将用于软件的指令存储于合适的非暂时性计算机可读媒体中并使用一或多个处理器执行硬件中的指令以执行本发明的技术。视频编码器20和视频解码器30中的每一者可包含于一或多个编码器或解码器中，其中的任一者可集成为相应装置中的组合编码器/解码器(编解码器)的一部分。

JCT-VC正在努力开发HEVC标准。HEVC标准化努力是基于被称作HEVC测试模型(HM)的视频译码装置的演化的模型。HM根据例如ITU-T H.264/AVC假设视频译码装置相对于现有装置的若干额外功能。举例来说，尽管H.264提供了九个帧内预测编码模式，但HM可提供多达三十三个帧内预测编码模式。

一般来说HM的工作模型描述视频帧或图片可分成一序列CTU，还被称作LCU，其包含亮度和色度样本两者。树块具有与H.264标准的宏块类似的目的。切片包含按译码次序的若干连续树块。视频帧或图片可被分割成一或多个切片。每一树块可根据四叉树分裂成若干CU。举例来说，作为四叉树的根节点的树块可分裂成四个子节点，且每一子节点又可为父代节点，且可分裂成另外四个子节点。最后未经分裂的子节点(作为四叉树的叶节点)包括译码节点(即，经译码视频块)。与经译码位流相关联的语法数据可界定树块可分裂的最大次数，且还可界定译码节点的最小大小。

CU包括译码节点和与译码节点相关联的PU和TU。CU的大小对应于译码节点的大小，且形状为正方形。CU的大小范围可从8×8个像素到具有64×64个像素或更多像素的最大值的树块的大小。每一CU可含有一或多个PU和一或多个TU。举例来说，与CU相关联的语法数据可描述CU分割成一或多个PU。分割模式可在CU被跳过还是经直接模式编码、帧内预测模式编码或帧间预测模式编码之间不同。PU可分割成非正方形形状。举例来说，与CU相关联的语法数据还可描述CU根据四叉树分割成一或多个TU。TU可为正方形或非正方形形状。

HEVC标准允许根据TU的变换，TU可针对不同CU而有所不同。TU的大小通常是基于针对经分割LCU定义的给定CU内的PU的大小而确定，但是情况可能并不总是如此。TU通常与PU大小相同或小于PU。在一些实例中，可使用被称为“残差四分树”(RQT)的四分树结构将对应于CU的残差样本细分成较小单元。RQT的叶节点可被称为变换单元(TU)。可变换与TU相关联的像素差值以产生变换系数，所述变换系数可经量化。

一般来说，PU包含与预测程序有关的数据。举例来说，当PU经帧内模式编码时，PU可包含描述PU的帧内预测模式的数据。作为另一实例，当PU经帧间模式编码时，PU可包含定义PU的运动向量的数据。定义PU的运动向量的数据可描述(例如)运动向量的水平分量、运动向量的垂直分量、运动向量的分辨率(例如，四分之一像素精度或八分之一像素精度)、运动向量所指向的参考图片，和/或运动向量的参考图片列表(例如，列表0、列表1或列表C)。

一般来说，TU用于变换和量化过程。具有一或多个PU的给定CU还可包含一或多个变换单元(TU)。在预测之后，视频编码器20可计算对应于PU的残差值。残差值包括像素差值，所述像素差值可变换成变换系数、经量化且使用TU进行扫描以产生串行化变换系数以用于熵译码。本发明通常使用术语“视频块”来指代CU的译码节点。在一些具体情况下，本发明还可使用术语“视频块”来指代树块(即，LCU)或包含译码节点以及PU和TU的CU。

视频序列通常包含一系列视频帧或图片。图片群组(GOP)一般包括一系列一或多个视频图片。GOP可在GOP的标头、一或多个图片的标头或其它地方包含语法数据，其描述GOP中所包含的图片的数目。图片的每一切片可包含描述用于相应切片的编码模式的切片语法数据。视频编码器20通常对个别视频切片内的视频块进行操作以便对视频数据进行编码。视频块可对应于CU内的译码节点。视频块可具有固定或变化的大小，并且根据指定译码标准可在大小上有所不同。

作为实例，HM支持各种PU大小的预测。假设特定CU的大小为2N×2N，那么HM支持2N×2N或N×N的PU大小的帧内预测，以及2N×2N、2N×N、N×2N或N×N的对称PU大小的帧间预测。HM还支持用于2N×nU、2N×nD、nL×2N和nR×2N的PU大小中的帧间预测的不对称分割。在不对称分割中，不分割CU的一个方向，但是将另一方向分割成25％和75％。CU的对应于25％分割区的部分由“n”后面接着“上方”、“下方”、“左侧”或“右侧”的指示来指示。因此，举例来说，“2NxnU”是指水平地分割的2Nx2N CU，其中顶部为2Nx0.5N PU，且底部为2Nx1.5NPU。

在本发明中，“N×N”与“N乘N”可互换使用来指在垂直和水平维度方面的视频块的像素尺寸，例如，16×16个像素或16乘16个像素。一般来说，16x16块将在垂直方向上具有16个像素(y＝16)，且在水平方向上具有16个像素(x＝16)。同样，NxN块总体上在垂直方向上具有N个像素，并且在水平方向上具有N个像素，其中N表示非负整数值。块中的像素可布置成行和列。此外，块未必需要在水平方向上与在竖直方向上具有相同数目个像素。举例来说，块可包括NxM个像素，其中M未必等于N。

在使用CU的PU进行帧内预测性或帧间预测性译码之后，视频编码器20可计算用于CU的TU的残差数据。PU可包括空间域(还被称作像素域)中的像素数据，且TU可包括在将变换(例如，离散余弦变换(DCT)、整数变换、小波变换或概念上类似的变换)应用于残差视频数据之后的变换域中的系数。所述残差数据可对应于未经编码图片的像素与对应于PU的预测值之间的像素差。视频编码器20可形成包含用于CU的残差数据的TU，并且接着变换TU以产生用于CU的变换系数。

任何用于产生变换系数的变换之后，视频编码器20可执行变换系数的量化。量化大体上指代对变换系数进行量化以可能减少用以表示所述系数的数据的量从而提供进一步压缩的过程。量化过程可减小与系数中的一些或全部相关联的位深度。举例来说，n位值可在量化期间被下舍入到m位值，其中n大于m。

在一些实例中，视频编码器20可利用预定义扫描次序来扫描经量化的变换系数，以产生可被熵编码的串行化向量。在其它实例中，视频编码器20可执行自适应扫描。在扫描经量化变换系数以形成一维向量之后，视频编码器20可例如根据上下文自适应可变长度译码(CAVLC)、上下文自适应二进制算术译码(CABAC)、基于语法的上下文自适应二进制算术译码(SBAC)、概率区间分割熵(PIPE)译码或另一熵编码方法对所述一维向量进行熵编码。视频编码器还20也可对与经编码视频数据相关联的语法元素进行熵编码以供视频解码器30在解码视频数据时使用。

为了执行CABAC，视频编码器20可向待发射的符号指派上下文模型内的上下文。上下文可涉及(例如)符号的相邻值是否为非零。为了执行CAVLC，视频编码器20可选择用于待发射的符号的可变长度码。VLC中的码字可经构造以使得相对较短码对应于更有可能的符号，而较长码对应于不太可能的符号。以此方式，使用VLC可例如实现优于针对待发射的每一符号使用等长度码字的位节省。概率确定可基于指派给符号的上下文。

一般来说，在一些情况下，将偏移值添加到LCU或其它译码单元中的像素可改进译码。举例来说，可将偏移值应用于经重构视频块的像素以便补偿照明改变、量化错误，或更一般来说，为了使经解码视频数据更接近地类似原始视频数据。样本自适应偏移(SAO)技术允许不同偏移值应用于不同像素(或像素块)，取决于像素(或块)的像素值。

图2是说明可实施本发明中描述的低复杂性视频译码技术的实例视频编码器20的框图。视频编码器20可执行视频切片内的视频块的帧内和帧间译码。帧内译码依靠空间预测来减少或去除给定视频帧或图片内的视频中的空间冗余。帧间译码依靠时间预测来减少或去除视频序列的邻近帧或图片内的视频中的时间冗余。帧内模式(I模式)可指若干基于空间的压缩模式中的任一者。例如单向预测(P模式)或双向预测(B模式)的帧间模式可指代若干基于时间的压缩模式中的任一者。

在图2的实例中，视频编码器20包含分割单元35、预测处理单元41、参考图片存储器64、求和器50、变换处理单元52、量化单元54，和熵编码单元56。预测处理单元41包含运动估计单元42、运动补偿单元44和帧内预测处理单元46。为进行视频块重构，视频编码器20还包含逆量化单元58、逆变换处理单元60和求和器62。还可包含去块滤波器72以对块边界进行滤波以将成块性假影从经重构视频中去除。如图2中所示，视频编码器20还包含额外环路滤波器，包含样本自适应偏移(SAO)滤波器74。尽管在图2中将去块滤波器72和SAO滤波器74示出为环路内滤波器，但在一些配置中，去块滤波器72和SAO滤波器74可实施为后环路滤波器。另外，在一些实施方案中，可省略去块滤波器72。

如图2中所示，视频编码器20接收视频数据，且分割单元35将所述数据分割成若干视频块。此分割还可包含分割成切片、平铺块或其它较大单元，以及例如根据LCU和CU的四叉树结构的视频块分割。视频编码器20一般说明编码待编码的视频切片内的视频块的组件。所述切片可分成多个视频块(并且可能分成被称作平铺块的视频块集合)。预测处理单元41可针对当前视频块基于误差结果(例如，译码速率和失真水平)而选择多个可能的译码模式中的一者，其可包含分区大小，例如多个帧内译码模式中的一者或多个帧间译码模式中的一者。预测处理单元41可将所得经帧内或帧间译码块提供到求和器50以产生残差块数据，并提供到求和器62以重构经编码块以用作参考图片。

预测处理单元41内的帧内预测处理单元46可相对于与待译码当前块在相同帧或切片中的一或多个相邻块执行当前视频块的帧内预测性译码，以提供空间压缩。预测处理单元41内的运动估计单元42和运动补偿单元44相对于一或多个参考图片中的一或多个预测性块执行当前视频块的帧间预测性译码以提供时间压缩。

运动估计单元42可经配置以根据用于视频序列的预定模式来确定用于视频切片的帧间预测模式。预定模式可将序列中的视频切片指定为经预测切片(P切片)、双向经预测切片(B切片)或一般化P/B切片(GPB切片)。运动估计单元42和运动补偿单元44可高度集成，但出于概念的目的分别加以说明。由运动估计单元42执行的运动估计是产生运动向量的过程，所述过程估计视频块的运动。举例来说，运动向量可指示当前视频帧或图片内的视频块的PU相对于参考图片内的预测性块的移位。

预测性块是被发现在像素差方面与待译码视频块的PU密切匹配的块，所述像素差可通过绝对差总和(SAD)、平方差总和(SSD)或其它差异度量来确定。在一些实例中，视频编码器20可计算存储在参考图片存储器64中的参考图片的子整数像素位置的值。举例来说，视频编码器20可内插参考图片的四分之一像素位置、八分之一像素位置或其它分数像素位置的值。因此，运动估计单元42可相对于全像素位置和分数像素位置执行运动搜索，并且输出具有分数像素精确度的运动向量。

运动估计单元42通过比较PU的位置与参考图片的预测性块的位置来计算用于经帧间译码切片中的视频块的PU的运动向量。参考图片可选自第一参考图片列表(列表0)或第二参考图片列表(列表1)，其中的每一者识别存储在参考帧存储器64中的一或多个参考图片。运动估计单元42向熵编码单元56和运动补偿单元44发送计算出的运动向量。

通过运动补偿单元44执行的运动补偿可涉及基于通过运动估计(可能执行对子像素精度的内插)确定的运动向量获取或产生预测性块。在接收到当前视频块的PU的运动向量后，运动补偿单元44可即刻在参考图片列表中的一者中定位所述运动向量指向的预测性块。视频编码器20通过从正被译码的当前视频块的像素值减去预测性块的像素值来形成残差视频块，从而形成像素差值。像素差值形成用于所述块的残差数据，且可包含亮度和色度差分量两者。求和器50表示执行此减法运算的一或多个组件。运动补偿单元44还可产生与视频块和视频切片相关联的语法元素，以供视频解码器30在对视频切片的视频块进行解码时使用。

作为如上文所描述由运动估计单元42和运动补偿单元44执行的帧间预测的替代方案，帧内预测处理单元46可对当前块执行帧内预测。明确地说，帧内预测处理单元46可确定用以编码当前块的帧内预测模式。在一些实例中，帧内预测处理单元46可例如在单独的编码遍次期间使用各种帧内预测模式对当前块进行编码，且预测处理单元41可从测试模式选择适当帧内预测或帧间预测模式来使用。举例来说，帧内预测处理单元46可使用速率失真分析计算各种经测试帧内预测模式的速率失真值，并在所述经测试模式当中选择具有最佳速率失真特性的帧内预测模式。速率失真分析通常确定经编码块与经编码以产生所述经编码块的原始的未经编码块之间的失真(或误差)的量，以及用于产生经编码块的位速率(也就是说，位的数目)。帧内预测处理单元46可根据用于各种经编码块的失真和速率来计算比率，以确定哪个帧内预测模式对于所述块展现最佳速率失真值。

在选择用于块的帧内预测模式之后，预测处理单元41可将指示块的选定帧内预测模式的信息提供到熵编码单元56。熵编码单元56可根据本发明的技术来编码指示所述选定帧内预测模式的信息。视频编码器20在所发射的位流中可包含配置数据，其可包含多个帧内预测模式索引表和多个经修改的帧内预测模式索引表(也称为码字映射表)，对用于各种块的上下文进行编码的定义，以及对最可能帧内预测模式、帧内预测模式索引表和经修改的帧内预测模式索引表的指示以用于所述上下文中的每一者。

在预测处理单元41经由帧间预测或帧内预测产生当前视频块的预测性块之后，视频编码器20通过从当前视频块减去预测性块来形成残差视频块。所述残差块中的残差视频数据可包含在一或多个TU中，并应用于变换处理单元52。变换处理单元52使用例如离散余弦变换(DCT)或概念上类似的变换的变换来将残差视频数据变换成残差变换系数。变换处理单元52可将残差视频数据从像素域转换到变换域，例如频域。

变换处理单元52可将所得变换系数发送到量化单元54。量化单元54量化变换系数以进一步减小位速率。量化过程可减小与系数中的一些或全部相关联的位深度。可通过调整量化参数来修改量化的程度。在一些实例中，量化单元54可接着执行对包含经量化的变换系数的矩阵的扫描。替代地，熵编码单元56可执行扫描。

在量化之后，熵编码单元56对经量化的变换系数进行熵编码。举例来说，熵编码单元56可执行上下文自适应可变长度译码(CAVLC)、上下文自适应二进制算术译码(CABAC)、基于语法的上下文自适应二进制算术译码(SBAC)、概率区间分割熵(PIPE)译码或另一熵译码方法或技术。在由熵编码单元56熵编码之后，经编码位流可发射到视频解码器30，或经存档以供稍后发射或由视频解码器30检索。熵编码单元56还可对正译码的当前视频切片的运动向量和其它语法元素进行熵编码。

逆量化单元58和逆变换处理单元60分别应用逆量化和逆变换来重构像素域中的残差块，以供后面用作参考图片的参考块。运动补偿单元44可通过将残差块添加到参考图片列表中的一者内的参考图片中的一者的预测性块中来计算参考块。运动补偿单元44还可将一或多个内插滤波器应用于所重构的残差块以计算子整数像素值用于运动估计。求和器62将经重构的残差块添加到由运动补偿单元44产生的运动补偿预测块以产生参考块用于存储在参考图片存储器64中。

在存储于存储器64中之前，经重构残差块可由一或多个滤波器滤波。如果需要，也可以应用去块滤波器72以对经重构残差块进行滤波以便去除成块假影。还可使用其它环路滤波器(在译码环路中或在译码环路之后)来使像素转变平滑或者以其它方式改进视频质量。此环路滤波器的一个实例是SAO滤波器74。参考块可供运动估计单元42和运动补偿单元44用作参考块，以对后续视频帧或图片中的块进行帧间预测。

SAO滤波器74可以改进视频译码质量的方式确定用于SAO滤波的偏移值。改进视频译码质量可例如涉及确定使经重构图像更接近地匹配原始图像的偏移值。视频编码器20可例如使用具有不同偏移值的多个遍次对视频数据进行译码，且选择如基于例如速率失真计算所确定提供合意的译码质量的偏移值以用于包含在经编码位流中。

在一些配置中，SAO滤波器74可经配置以应用一或多种类型的偏移，例如上述边缘偏移。SAO滤波器74还可经常不应用偏移，其可自身被视为第三类型的偏移。SAO滤波器74所应用的偏移的类型可明确地或隐含地向视频解码器发信号通知。当应用边缘偏移时，像素可基于边缘信息而分类。

图2的视频编码器20表示视频编码器的实例，其经配置以：确定第一边缘索引，其中所述第一边缘索引包括用于第一周围像素的亮度分量的边缘索引；确定第二边缘索引，其中所述第二边缘索引包括用于第二周围像素的亮度分量的边缘索引；基于所述第一边缘索引和所述第二边缘索引确定第三边缘索引，其中所述第三边缘索引包括用于当前像素的色度分量的边缘索引；基于所述第三边缘索引选择偏移；以及将所述偏移应用于所述当前像素的所述色度分量。

图3是说明可实施本发明中描述的低复杂性视频译码技术的实例视频解码器30的框图。在图3的实例中，视频解码器30包含熵解码单元80、预测处理单元81、逆量化单元86、逆变换单元88、求和器90和参考图片存储器92。预测处理单元81包含用于帧间预测解码的运动补偿单元82，和用于帧内预测解码的帧内预测处理单元84。在一些实例中，视频解码器30可执行大体上与关于来自图2的视频编码器20描述的编码遍次互逆的解码遍次。

在解码过程期间，视频解码器30从视频编码器20接收表示经编码视频切片的视频块和相关联语法元素的经编码视频位流。视频解码器30的熵解码单元80可对位流进行熵解码以产生经量化系数、运动向量和其它语法元素。熵解码单元80将运动向量和其它语法元素转发到预测处理单元81。视频解码器30可接收视频切片层级和/或视频块层级处的语法元素。

当视频切片被译码为经帧内译码(I)切片时，预测处理单元81的帧内预测处理单元84可基于发信号通知的帧内预测模式以及来自当前帧或图片的先前经解码块的数据产生用于当前视频切片的视频块的预测数据。当将视帧帧译码为经帧间译码(例如，B、P或GPB)切片时，预测处理单元81的运动补偿单元82基于从熵解码单元80接收的运动向量和其它语法元素而产生当前视频切片的视频块的预测性块。可从参考图片列表中的一者内的参考图片中的一者产生预测性块。视频解码器30可基于存储在参考图片存储器92中的参考图片，使用默认构造技术来构造参考帧列表，列表0和列表1。

运动补偿单元82通过剖析运动向量和其它语法元素确定用于当前视频切片的视频块的预测信息，并且使用所述预测信息产生用于正解码的当前视频块的预测性块。举例来说，运动补偿单元82使用所接收语法元素中的一些来确定用于对视频切片的视频块进行译码的预测模式(例如，帧内预测或帧间预测)、帧间预测切片类型(例如，B切片、P切片或GPB切片)、切片的参考图片列表中的一或多者的建构信息、切片的每一经帧间编码的视频块的运动向量、切片的每一经帧间译码的视频块的帧间预测状态，以及用以对当前视频切片中的视频块进行解码的其它信息。

运动补偿单元82还可基于内插滤波器执行内插。运动补偿单元82可使用如视频编码器20在视频块的编码期间使用的内插滤波器来计算参考块的子整数像素的经内插值。在此情况下，运动补偿单元82可根据接收到的语法元素而确定由视频编码器20使用的内插滤波器，并使用所述内插滤波器来产生预测性块。

逆量化单元86将提供于位流中且由熵解码单元80解码的经量化的变换系数逆量化(即，去量化)。逆量化过程可包含使用由视频编码器20针对视频切片中的每一视频块计算的量化参数来确定应应用的量化程度，并且同样地确定应应用的逆量化程度。逆变换处理单元88将逆变换(例如，逆DCT、逆整数变换或概念上类似的逆变换过程)应用于变换系数，以便产生像素域中的残差块。

在预测处理单元81基于运动向量和其它语法元素产生当前视频块的预测性块之后，视频解码器30通过将来自逆变换处理单元88的残差块与运动补偿单元82所产生的对应预测性块求和来形成经解码视频块。求和器90表示可执行此求和运算的一或多个组件。由求和器90形成的经解码视频块接着可由去块滤波器93、SAO滤波器94等滤波。接着将给定帧或图片中的经解码视频块存储在参考图片存储器92中，参考图片存储器92存储用于后续运动补偿的参考图片。参考图片存储器92还存储经解码视频以用于以后在显示装置(例如图1A-B的显示装置32)上呈现。在相关方面中，SAO滤波器94可经配置以应用与上文所论述的SAO滤波器74相同的滤波(例如，边缘偏移和带偏移)中的一或多者。

图3的视频解码器30表示视频解码器的实例，其经配置以：确定第一边缘索引，其中所述第一边缘索引包括用于第一周围像素的亮度分量的边缘索引；确定第二边缘索引，其中所述第二边缘索引包括用于第二周围像素的亮度分量的边缘索引；基于所述第一边缘索引和所述第二边缘索引确定第三边缘索引，其中所述第三边缘索引包括用于当前像素的色度分量的边缘索引；基于所述第三边缘索引选择偏移；以及将所述偏移应用于所述当前像素的所述色度分量。

图4提供视频编码器的另一表示，例如HEVC视频编码器及其组件。应注意，图4的视频编码器400在大多数方面类似于图2的视频编码器20。视频编码器400可尤其包含通用译码器控制器402；变换、按比例缩放和量化模块404；按比例缩放和逆变换模块406，以及求和器408和410，其彼此操作通信。

视频编码器400可进一步包含图片内估计模块412，以及图片内预测模块414、运动补偿模块416和运动估计模块418，其彼此操作通信，以及视频编码器400的上文所列组件。视频编码器400可进一步包含模式决策(帧内/帧间选择)模块420，其与图片内预测模块414和运动补偿模块416操作通信。

视频编码器400可进一步包含滤波器控制分析模块422、去块和SAO滤波器424、经解码图片缓冲器426以及标头格式化和CABAC模块428，其彼此操作通信，以及视频编码器400的上文所列组件。

输入视频信号401可分裂成若干CTU。可将通用控制数据、经量化变换系数和帧内预测数据、滤波器控制数据和/或运动数据提供到标头格式化和CABAC模块428，其提供经译码位流。

如在图2和4的编码器中可看出，对于使用基于块的处理的视频编解码器，可将预测块(例如来自帧间或帧内预测路径)从原始像素减去以产生残差。所述残差可使用正向变换(例如DCT)来变换成系数，经量化，且使用各种熵译码引擎(例如CAVLC或CABAC)来熵译码。在解码器(例如图3中的视频解码器30)中，可对系数进行熵解码、去量化、逆变换，且接着加回到预测块，从而形成经重构像素。

再次参考图4中的实例HEVC视频编码器400，存在高复杂性模块/单元，例如模式决策模块420和运动估计模块418。对于HEVC编码器400的模式决策，通常检查所有不同CU大小(即，64×64、32×32、16×16和8×8)，以确定最佳译码模式和每一CTU的CU/PU/TU结构，其占HEVC编码器的复杂性的较大(如果不是最大)部分。

为了用针对基于块的视频译码的现有方法来克服所述复杂性，本发明在下文描述改进。提供一种用于低复杂性模式决策和运动估计的视频编码技术。举例来说，可使用视频块信息的预处理来降低模式决策的复杂性。在本发明中，下文描述的技术和方法可单独地或以任何组合方式使用。

根据本发明的一或多个方面，提供一种用于低复杂性视频译码的技术。所述技术可由系统/装置执行，例如图1A-B和2的视频编码器20、图4的视频编码器400等。类似地，所述技术可由图1A-B和3等的视频解码器30执行、采用或以其它方式考虑。

举例来说，低复杂性视频编码技术可由图2中的视频编码器20的分割单元35、预测处理单元41和/或任选的预处理单元36，和/或其组件执行。在相关方面中，虽然将预处理单元36与分割单元35和预测处理单元41分别示出，但应注意，预处理单元36可包含/包括在分割单元35和/或预测处理单元41内。在进一步相关方面中，任选的预处理单元36所执行的操作中的一或多者可由分割单元35和/或预测处理单元41执行。在再进一步相关方面中，任选的预处理单元36及其功能可由分割单元35和/或预测处理单元41包含。

在另一实例中，低复杂性视频编码技术可由图4中的视频编码器400的通用译码器控制器402；变换、按比例缩放和量化模块404，或其组件执行。

用于低复杂性模式决策的预处理信息：在一个实施方案中，用以模式决策的复杂性的所述预处理信息可包含每一2N×2N块(例如N可为4、8、16或32)的零运动绝对差总和(SAD)(SAD_{zero_2N})或简单的基于运动估计的SAD(SAD_{sme_2N})。

此处，零运动SAD(即，SAD_{zero_2N})是指当前CU块与参考帧中的对应块之间的SAD，而简单的基于运动估计的SAD(即，SAD_{sme_2N})可例如通过基于子取样的搜索来获得。在以下揭示内容中，SAD_{zero_2N}和SAD_{sme_2N}两者将被称作SAD_2N。

基于预处理信息的简化：对于模式决策和运动估计的典型方法，检查所有的CU大小(即，从64×64到8×8CU)。对于本发明，可通过计算和利用预处理信息(例如SAD_2N)来仅检查CU大小的子集，来实现更高效模式决策和运动估计。

提供一种技术，其中视频编码器仅检查CU大小的子集(例如64×64、32×32、16×16、8×8、64x64+32x32、32x32+16x16或16x16+8x8)，而不是所有的CU大小，以实现针对一个LCU的动态模式决策(DMD)分支化。换句话说，所提供的技术是针对基于以单个LCU(1-LCU)为基础的动态分支化的CU大小检查。

所述决策分支化是基于预处理信息，其可例如通过针对每一2N×2N块(即，N可为4、8、16或32)计算当前CU块与参考帧中的对应块之间的SAD_2N值来产生。

SAD值可用于基于分支化条件来识别CU大小的分支化：背景条件(其中将当前CU检测为图片的背景)和/或齐次条件(其中，将当前CU检测为齐次的)。

背景条件可为：SAD_2N<Th_2N，其中Th_2N是所定义的阈值，固定或自适应的。

齐次条件可为：C_d*SAD_2N/4<SAD_N<C_u*SAD_2N/4，其中C_d小于1，且C_u大于1，且C_d和C_u是量化参数(QP)相关阈值。

在相关方面中，所述技术可涉及结合SAD信息，使用不同形状之间的运动向量(MV)关联。举例来说，如果4个N×N块的MV类似于2N×2N块，那么2N×2N块可被认为是齐次的，这可导致对2N×2N CU形状优于N×N CU的偏好。

下文提供用以实现低复杂性编码的DMD分支化的示范性实施方案。

参看图5A，提供用以对LCU 500进行DMD分支化510的基于三分支的方法的说明性实例，其中LCU 500的大小为32×32。

在所说明的实例中，所述三个分支可包含：用于32×32CU大小绝对经变换差总和(SATD)的第一分支520；用于32×32和16×16CU大小SATD的第二分支522；以及用于16×16和8×8CU大小SATD的第三分支524。

在未说明的另一实例中，所述三个分支可包含：用于32×32CU大小SATD的第一分支520；用于16×16CU大小SATD的第二分支522；以及用于8×8CU大小SATD的第三分支524。应注意，所述分支可基于其它CU大小和/或其组合。

继续参考图5A中所说明的实例，可为第一分支(即，32×32分支)定义第一条件。所述第一条件可包含以下：(a)SAD₃₂<Th₃₂；或(b)C_d*SAD₃₂/4<SAD₁₆(k)<C_u*SAD₃₂/4，其中k＝0、1、2、3。

换句话说，如果32×32CU大小的SAD值小于所述32×32CU大小的阈值背景值，或如果所述32×32块的子块(例如具有16×16的CU大小)的SAD值介于至少部分地基于所述32×32CU大小的SAD值的上齐次阈值与下齐次阈值之间，那么可满足所述第一条件。在相关方面中，上齐次阈值是C_u*SAD₃₂/4，其中C_u大于1，而下齐次阈值为C_d*SAD₃₂/4，其中C_d小于1。在进一步相关方面中，四个k值可对应于32×32LCU 500的四个16×16子块。

可为第二分支(即，CU32+CU16分支)定义第二条件。第二条件可包含以下：(a)不满足第一条件；以及(b)SAD₁₆(k)<Th₁₆||C_d1*SAD₃₂/4<SAD₁₆(k)<C_u1*SAD₃₂/4，其中k＝0、1、2、3，其中C_d1小于C_d，且C_u1大于C_u。

换句话说，如果不满足第一条件，且如果16×16CU大小的SAD值小于16×16CU大小的阈值背景值，或如果16×16CU大小的SAD值介于至少部分地基于32×32CU大小的SAD值的上齐次阈值与下齐次阈值之间，那么可满足第二条件。在相关方面中，上齐次阈值为C_u*SAD₃₂/4，且下齐次阈值为C_d*SAD₃₂/4。

另外，以下条件可用作第二分支(即，CU32+CU16分支)的第二条件的一部分：C_d2*SAD₁₆/4<SAD₈(m)<C_u2*SAD₁₆/4，其中m＝0、…、15。

换句话说，如果8×8CU大小的SAD值介于至少部分地基于16×16CU大小的SAD值的上齐次阈值与下齐次阈值之间，那么满足此任选的额外条件。在相关方面中，上齐次阈值为C_u2*SAD₁₆/4，且下齐次阈值为C_d2*SAD₁₆/4。在进一步相关方面中，十六个m值可对应于32×32LCU 500的十六个8×8子块。

否则(即，如果不满足所述第一和第二条件)，可使用第三分支(即，CU16+CU8分支)来识别最佳译码模式以及每一CTU的CU/PU/TU结构。

图5B涉及用以DMD的一个基于LCU的方法，且示出具有用于分支化(例如图5A中所示的分支化或类似者)的实例条件的过程550的流程图。

举例来说，可实施SATD速率失真优化(RDO)，以确定是否满足背景(BG)条件(例如步骤560处的Cond_BG)：(a)SAD_16x16(i)<Th₁₆，针对所有ⅰ；或(b)SAD_32x32<Th₃₂。

应注意，步骤560处的Cond_BG对应于32×32分支的条件(步骤562)。如果不满足步骤560处的Cond_BG，那么过程550移动到步骤570，其中过程550涉及确定是否满足第一齐次条件(例如Cond_32vs16_Hom1)。举例来说，Cond_32vs16_Hom1可包含：(a)总和(SAD_16x16(i))<0.6*SAD_32x32；或(b)A*SAD_32x32/4<SAD_16x16(i)<B*SAD_32x32/4，针对所有ⅰ，且SAD_32x32<C*Th₃₂，其中A、B和C是QP相关常数。

C的范围可例如从1.0到3.0(qp 21到qp 37)。B的范围可例如从1.3到3.0(qp 21到qp 37)。A的范围可例如从0.7到0.3(qp 21到qp 37)。应注意，A、B和C的这些值仅为示范性的，且取决于特定应用或上下文，可实施其它值。

如果满足步骤570处的Cond_32vs16_Hom1，那么过程550可继续到步骤572，其中过程550涉及确定是否满足第二齐次条件(例如Cond_Hom2)。举例来说，Cond_Hom2可包含：满足“A*SAD_32x32/4<SAD_16x16(i)<B*SAD_32x32/4”的ⅰ的值的数目大于2。

如果满足步骤572处的Cond_Hom2，那么过程550可继续到步骤574处的32×32分支。如果不满足步骤572处的Cond_Hom2，那么过程可在步骤582处继续到16×16分支。

如果不满足步骤570处的Cond_32vs16_Hom1，那么过程550可继续到步骤580，其中过程550涉及确定是否满足分支决策条件(例如Cond_16vs8)。举例来说，Cond_16vs8可包含：总和(SAD_16x16(i))<SAD_32x32。

如果满足步骤580处的Cond_16vs8，那么过程550可在步骤582处继续到16×16分支。否则，过程550可在步骤590处继续到8×8分支。

参看图6，提供用以对LCU 600进行DMD分支化610的基于两分支的方法的说明性实例，其中LCU 600的大小为32×32。

在所说明的实例中，所述两个分支可包含：用于32×32和16×16CU大小SATD的第一分支622；以及用于16×16和8×8CU大小SATD的第二分支624。再次应注意，所述分支可基于其它CU大小和/或其组合。

继续参考图6中所说明的实例，可为第一分支(即，CU32+CU16分支)定义第一条件。所述第一条件可包含以下：(a)SAD₃₂<Th₃₂；或(b)C_d*SAD₃₂/4<SAD₁₆(k)<C_u*SAD₃₂/4，其中k＝0、1、2、3。

换句话说，如果32×32CU大小的SAD值小于所述32×32CU大小的阈值背景值，或如果所述32×32块的子块(例如具有16×16的CU大小)的SAD值介于至少部分地基于所述32×32CU大小的SAD值的上齐次阈值与下齐次阈值之间，那么可满足所述第一条件。在相关方面中，上齐次阈值是C_u*SAD₃₂/4，其中C_u大于1，而下齐次阈值为C_d*SAD₃₂/4，其中C_d小于1。在进一步相关方面中，四个k值可对应于32×32LCU 600的四个16×16子块。

否则(即，如果不满足第一条件)，可使用第二分支(即，CU16+CU8分支)来识别最佳译码模式以及每一CTU的CU/PU/TU结构。

应注意，阈值背景值(例如用于32×32CU大小的Th₃₂)可为固定或自适应的。对于固定的阈值背景值，可实施预定义QP相关阈值或类似者。

对于自适应阈值背景值，可实施变换处理组件(例如图2的变换处理单元52或类似者)，其经配置以确定并利用视频块的距离度量值，并将所述距离度量值与阈值背景值进行比较。距离度量值可提供对视频块内的视频信息从先前帧变为当前帧的程度的指示。如果视频信息根本未改变或改变极少，那么距离度量值可为零或接近零。举例来说，距离度量值可为或基于SAD值，其可指示像素信息从一个帧到下一帧的改变。在另一实例中，可通过对块的个别较小CU(例如其8×8CU)的SAD值进行求和来确定大CU的SAD值。在又另一实例中，距离度量值可为平方误差的总和，其可进一步指示像素信息从一个帧到下一帧的改变。距离度量值还可基于像素信息从一个帧到下一帧的改变的任何其它指示。举例来说，变换处理单元52可经进一步配置以通过比较当前块与先前块的距离度量值来自适应地调整阈值背景值。

还要注意，可结合上文所描述的背景确定条件来实现进一步复杂性降低，例如通过：跳过分数像素搜索；仅使用参考帧0；和/或跳过帧内模式，如下文进一步详细描述。

参考图2的实例视频编码器20，如果变换处理单元52确定视频块是背景，那么视频编码器20可降低其针对所述块的模式决策和运动估计的复杂性。举例来说，运动估计单元42可经配置以针对背景块使用多个不同方式简化运动估计。举例来说，运动估计单元42可针对背景块搜索更小数目的参考帧。为了搜索减少数目的参考帧，运动估计单元42可实施以下方法中的一或多者：(1)仅搜索参考帧0；(2)搜索先前帧的帧的预定义较小范围(例如，较小半径)；(3)使用仅预测符搜索；(4)有条件地跳过搜索半像素和/或四分之一像素；或(5)用于搜索较少数目的参考帧的任何其它技术。

在相关方面中，当运动估计单元42使用仅预测符搜索来降低针对背景块的运动估计的复杂性时，运动估计单元42可在搜索到第一预测符(例如空间和/或时间预测符)之后停止搜索细化。另一方面，对于前景块，运动估计单元42可搜索相邻块运动向量，分析其预测符结果以寻找最佳匹配，接着进一步以此方式细化其搜索，直到获得良好结果为止。

在进一步相关方面中，当运动估计单元42有条件地跳过搜索半像素和/或四分之一像素以降低背景块的运动估计的复杂度时，运动估计单元42可从背景块的当前帧中的相邻块产生运动向量预测符。那些预测符接着可用于来自先前帧的处于相同位置的块中。接着可应用每一预测符来寻找最适当的测试块，且将处于相同位置的块与当前帧进行比较以确定哪一者最接近。另一方面，对于前景块，运动估计单元42可首先将其中心点置于整数像素位置的中心，接着搜索多个(例如，九个)线性内插半像素位置，且接着进一步利用对应数目个经线性内插的四分之一像素位置来细化其搜索。

作为降低背景块的编码复杂性的另一实例，如果变换处理单元52确定视频块是背景，那么预测处理单元41和/或模式选择单元(未说明)可经配置以便以若干不同方式来简化模式决策。举例来说，预测处理单元41可跳过正进行的帧内模式决策。在相关方面中，预测处理单元41可针对背景块内的较小块更快地识别CU大小和跳过模式决策。举例来说，如果确定32×32块为背景，那么预测处理单元41可指令视频编码器20跳过针对32×32块内小于32×32的任何块的模式决策。在相关方面中，为了简化模式决策，预测处理单元41可测试较小数目的合并候选者。合并候选者可指代搜索先前帧的各种块以确定相邻块的运动向量的模式决策过程。对于前景视频块，此搜索和确定可例如出现五次或更多次。对于背景视频块，本文所述的技术可促进一个或两个搜索和确定。

根据本发明的一或多个方面，图7是说明用于视频译码的实例方法700的流程图。图7-12中说明的步骤中的一或多者可例如由图2的预处理单元36、预测处理单元41和/或分割单元35，或其组件执行。在相关方面中，图7-12中所说明的步骤中的一或多者可例如由图3的预测处理单元81或其组件执行。

参看图7，方法700可涉及在710处，计算CU块与参考帧中的第一对应块之间的第一SAD值。方法700可涉及在720处，至少部分地基于第一SAD值来为CU大小的分支化定义分支化条件，所述分支化条件包括背景条件和齐次条件。方法700可涉及在730处，响应于CU块的第一SAD值小于第一阈值背景值，来检测所述背景条件。方法700可涉及在740处，响应于CU块的子块的第二SAD值介于至少部分地基于第一SAD值的上齐次阈值与下齐次阈值之间来检测齐次条件。方法700可涉及在750处，基于背景条件或齐次条件的检测来确定CU大小的分支化。

图8-12示出执行方法700不需要的任选的方法700的进一步操作或方面。如果方法700包含图8-12的至少一个框，那么方法700可在所述至少一个框之后终止，而不一定必须包含可说明的任何后续下游框。

参看图8，框720可例如涉及：将第一分支的分支化条件定义为包括背景条件或齐次条件的满足(框760)；将第二分支的分支化条件定义为包括以下各项的满足：(i)子块的第二SAD值小于第二阈值背景值；或(ii)子块的第二SAD值介于至少部分地基于第一SAD值的上齐次阈值与下齐次阈值之间(框762)；以及将第三分支的分支化条件定义为包括所述第一和第二分支的所述分支化条件的不满足(框764)。

参看图9，框720可例如涉及：将第一分支的分支化条件定义为包括背景条件或齐次条件的满足(框770)；将第二分支的分支化条件定义为包括以下各项的满足：(i)子块的第二SAD值小于第二阈值背景值；或(ii)所述子块的子子块的第三SAD值介于至少部分地基于第二SAD值的上齐次阈值与下齐次阈值之间(框772)；以及将第三分支的分支化条件定义为包括所述第一和第二分支的分支化条件的不满足(框774)。

参看图10，框720可例如涉及：将第一分支的分支化条件定义为包括背景条件或齐次条件的满足(框780)；以及将第二分支的分支化条件定义为包括第一分支的分支化条件的不满足(框782)。

继续参看图10，方法700可进一步涉及基于根据CU大小的分支化检查到CU大小的子集来对LCU执行DMD分支化(框790)。举例来说，框790可涉及(i)为CTU选择译码模式，或(ii)至少部分地基于用于所述LCU的DMD分支化来执行运动估计(框792)。

参看图11，在相关方面中，方法700可涉及基于根据用于所述LCU的DMD分支化执行视频数据的基于块的处理来编码视频数据(框800)。所述基于块的处理可涉及：基于用于LCU的DMD分支化来确定预测块(802)；基于将预测块从所述视频数据的原始像素减去来计算残差(804)；将所计算的残差正向变换为系数(806)；以及量化并熵编码所述系数(808)。

参看图12，在进一步相关方面中，方法700可涉及基于根据用于所述LCU的DMD分支化执行视频数据的基于块的处理来解码视频数据(框810)。所述基于块的处理可涉及：对接收到的系数进行熵解码和去量化(812)；基于逆变换所述经熵解码、去量化的系数来计算残差(814)；基于用于LCU的DMD分支化来确定预测块(816)；以及基于将所计算的残差添加到预测块来形成经重构的像素(818)。

在一或多个实例中，所描述的功能可用硬件、软件、固件或其任何组合实施。如果用软件实施，那么所述功能可作为一或多个指令或代码在计算机可读媒体上存储或传输，且由基于硬件的处理单元执行。计算机可读媒体可包含计算机可读存储媒体，其对应于例如数据存储媒体等有形媒体，或包含促进计算机程序例如根据通信协议从一处到另一处的传送的任何媒体的通信媒体。以此方式，计算机可读媒体通常可对应于(1)非暂时性的有形计算机可读存储媒体，或(2)例如信号或载波等通信媒体。数据存储媒体可为可由一或多个计算机或一或多个处理器存取以检索用于实施本发明中描述的技术的指令、代码和/或数据结构的任何可用媒体。计算机程序产品可包含计算机可读媒体。

作为实例而非限制，此类计算机可读存储媒体可包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁性存储装置、快闪存储器或可用来存储呈指令或数据结构的形式的所要程序代码并且可由计算机存取的任何其它媒体。并且，任何连接被恰当地称作计算机可读媒体。举例来说，如果使用同轴缆线、光纤缆线、双绞线、数字订户线(DSL)或例如红外线、无线电和微波等无线技术从网站、服务器或其它远程源传输指令，那么同轴缆线、光纤缆线、双绞线、DSL或例如红外线、无线电和微波等无线技术包含在媒体的定义中。然而，应理解，所述计算机可读存储媒体和数据存储媒体并不包括连接、载波、信号或其它暂时媒体，而是实际上针对于非暂时性有形存储媒体。如本文中所使用，磁盘和光盘包含压缩光盘(CD)、激光光盘、光学光盘、数字多功能光盘(DVD)、软性磁盘和蓝光光盘，其中磁盘通常以磁性方式再现数据，而光盘利用激光以光学方式再现数据。以上各项的组合也应包含在计算机可读媒体的范围内。

指令可由一或多个处理器来执行，所述一或多个处理器例如一或多个DSP、通用微处理器、ASIC、FPGA或其它等效集成或离散逻辑电路。因此，如本文中所使用的术语“处理器”可指前述结构或适合于实施本文中所描述的技术的任一其它结构中的任一者。另外，在一些方面中，本文中所描述的功能性可在经配置以用于编码和解码的专用硬件和/或软件模块内提供，或者并入在组合式编解码器中。而且，所述技术可完全实施于一或多个电路或逻辑元件中。

本发明的技术可在各种装置或设备中实施，包含无线手持机、集成电路(IC)或一组IC(例如，芯片组)。本发明中描述各种组件、模块或单元是为了强调经配置以执行所公开的技术的装置的功能方面，但未必需要由不同硬件单元实现。实际上，如上文所描述，各种单元可结合合适的软件和/或固件组合在编码解码器硬件单元中，或者通过互操作硬件单元的集合来提供，所述硬件单元包含如上文所描述的一或多个处理器。已描述了各种实例。这些和其它实例在所附权利要求书的范围内。

Claims

1.一种用于视频译码的方法，其包括：

计算译码单元CU块与参考帧中的第一对应块之间的第一绝对差总和SAD值；

计算所述CU块的子块与参考帧中的第二对应块之间的第二SAD值；

计算所述子块的子子块与参考帧中的第三对应块之间的第三SAD值；

至少部分地基于所述第一SAD值来为CU大小的分支化定义分支化条件，其中所述分支化条件中的第一分支化条件包括背景条件和齐次条件两者；

响应于所述CU块的所述第一SAD值小于第一阈值背景值来检测所述背景条件；

响应于所述CU块的所述子块的所述第二SAD值介于上齐次阈值与下齐次阈值之间而检测所述齐次条件，所述上齐次阈值和下齐次阈值是至少部分地基于所述CU块的所述第一SAD值；以及

基于所述背景条件或所述齐次条件的所述检测来确定所述CU大小的所述分支化，其中如果满足所述背景条件或所述齐次条件，那么满足所述第一分支化条件。

2.根据权利要求1所述的方法，其中：

所述上齐次阈值等于C_u*(第一SAD值)/4，其中C_u大于1；

所述下齐次阈值等于C_d*(第一SAD值)/4，其中C_d小于1；以及

其中C_d和C_u是量化参数(QP)相关阈值。

3.根据权利要求1所述的方法，其中为CU大小的所述分支化定义所述分支化条件进一步包括：

将第二分支的所述分支化条件定义为包括以下各项的满足：(i)所述子块的所述第二SAD值小于第二阈值背景值；或(ii)所述子块的所述第二SAD值介于至少部分地基于所述第一SAD值的上齐次阈值与下齐次阈值之间；以及

将第三分支的所述分支化条件定义为包括所述第一和第二分支的所述分支化条件的不满足。

4.根据权利要求1所述的方法，其中为CU大小的所述分支化定义所述分支化条件进一步包括：

将第二分支的所述分支化条件定义为包括以下各项的满足：(i)所述子块的所述第二SAD值小于第二阈值背景值；或(ii)所述子块的所述子子块的所述第三SAD值介于至少部分地基于所述第二SAD值的上齐次阈值与下齐次阈值之间；以及

5.根据权利要求1所述的方法，其中为CU大小的所述分支化定义所述分支化条件进一步包括：

将第二分支的所述分支化条件定义为包括所述第一分支的所述分支化条件的不满足。

6.根据权利要求1所述的方法，其进一步包括：基于根据所述CU大小的所述分支化检查所述CU大小的子集，对最大译码单元LCU执行动态模式决策DMD分支化。

7.根据权利要求6所述的方法，其进一步包括至少部分地基于所述LCU的所述DMD分支化，(i)为编码树单元CTU选择译码模式，或(ii)执行运动估计。

8.根据权利要求6所述的方法，其进一步包括基于根据所述LCU的所述DMD分支化执行视频数据的基于块的处理来编码所述视频数据，所述基于块的处理包括：

基于所述LCU的所述DMD分支化来确定预测块；

基于将所述预测块从所述视频数据的原始像素减去来计算残差；

将所述所计算的残差正向变换成系数；以及

量化并熵编码所述系数。

9.根据权利要求6所述的方法，其进一步包括基于根据所述LCU的所述DMD分支化执行视频数据的基于块的处理来解码所述视频数据，所述基于块的处理包括：

熵解码并去量化接收到的系数；

基于逆变换所述经熵解码、去量化的系数来计算残差；

基于所述LCU的所述DMD分支化来确定预测块；以及

基于将所述所计算的残差添加到所述预测块来形成经重构像素。

10.根据权利要求1所述的方法，所述方法能够在无线通信装置上执行，其中所述方法进一步包括：

在存储器中存储视频数据；

通过处理器执行指令来处理存储在所述存储器中的所述视频数据；以及

通过发射器使用基于由所述分支化条件确定的CU大小的译码模式来发射经编码的视频数据。

11.根据权利要求10所述的方法，其中所述无线通信装置为蜂窝式电话，且所述经编码的视频数据由所述发射器发射，且根据蜂窝式通信标准来调制。

12.一种用于视频译码的设备，其包括：

存储器单元，其经配置以存储视频数据；以及

视频编码器，其与所述存储器单元通信，所述视频编码器经配置以：

13.根据权利要求12所述的设备，其中：

所述上齐次阈值等于C_u*(第一SAD值)/4，其中C_u大于1；

所述下齐次阈值等于C_d*(第一SAD值)/4，其中C_d小于1；以及

其中C_d和C_u是量化参数(QP)相关阈值。

14.根据权利要求12所述的设备，其中所述视频编码器经配置以基于以下各项来进一步为CU大小的所述分支化定义所述分支化条件：

15.根据权利要求12所述的设备，其中所述视频编码器经配置以基于以下各项来进一步为CU大小的所述分支化定义所述分支化条件：

16.根据权利要求12所述的设备，其中所述视频编码器经配置以基于以下各项来进一步为CU大小的所述分支化定义所述分支化条件：

17.根据权利要求12所述的设备，其中所述视频编码器进一步经配置以基于根据所述CU大小的所述分支化检查所述CU大小的子集，来对最大译码单元LCU执行动态模式决策DMD分支化。

18.根据权利要求17所述的设备，其中所述视频编码器进一步经配置以至少部分地基于所述LCU的所述DMD分支化，(i)为编码树单元CTU选择译码模式，或(ii)执行运动估计。

19.根据权利要求12所述的设备，其中所述设备为无线通信装置，其进一步包括：

发射器，其经配置以使用基于由所述分支化条件确定的CU大小的译码模式来发射经编码的视频数据。

20.根据权利要求19所述的设备，其中所述无线通信装置为蜂窝式电话，且所述经编码视频数据由所述发射器发射，且根据蜂窝式通信标准来调制。

21.一种用于视频译码的设备，其包括：

用于计算译码单元CU块与参考帧中的第一对应块之间的第一绝对差总和SAD值、用于计算所述CU块的子块与参考帧中的第二对应块之间的第二SAD值以及用于计算所述子块的子子块与参考帧中的第三对应块之间的第三SAD值的装置；

用于至少部分地基于所述第一SAD值来为CU大小的分支化定义分支化条件的装置，其中所述分支化条件中的第一分支化条件包括背景条件和齐次条件两者；

用于响应于所述CU块的所述第一SAD值小于第一阈值背景值来检测所述背景条件的装置；

用于响应于所述CU块的所述子块的所述第二SAD值介于上齐次阈值与下齐次阈值之间来检测所述齐次条件的装置，所述上齐次阈值和下齐次阈值至少部分地基于所述CU块的所述第一SAD值；以及

用于基于所述背景条件或所述齐次条件的所述检测来确定所述CU大小的所述分支化的装置，其中如果满足所述背景条件或所述齐次条件，那么满足所述第一分支化条件。

22.根据权利要求21所述的设备，其中：

所述上齐次阈值等于C_u*(第一SAD值)/4，其中C_u大于1；

所述下齐次阈值等于C_d*(第一SAD值)/4，其中C_d小于1；以及

其中C_d和C_u是量化参数(QP)相关阈值。

23.根据权利要求21所述的设备，其中所述用于为CU大小的分支化定义分支化条件的装置进一步包括：

用于将第二分支的所述分支化条件定义为包括以下各项的满足的装置：(i)所述子块的所述第二SAD值小于第二阈值背景值；或(ii)所述子块的所述第二SAD值介于至少部分地基于所述第一SAD值的上齐次阈值与下齐次阈值之间；以及

用于将第三分支的所述分支化条件定义为包括所述第一和第二分支的所述分支化条件的不满足的装置。

24.根据权利要求21所述的设备，其中所述用于为CU大小的分支化定义分支化条件的装置进一步包括：

用于将第二分支的所述分支化条件定义为包括以下各项的满足的装置：(i)所述子块的所述第二SAD值小于第二阈值背景值；或(ii)所述子块的所述子子块的所述第三SAD值介于至少部分地基于所述第二SAD值的上齐次阈值与下齐次阈值之间；以及

25.根据权利要求21所述的设备，其中所述用于为CU大小的分支化定义分支化条件的装置进一步包括：

用于将第二分支的所述分支化条件定义为包括所述第一分支的所述分支化条件的不满足的装置。

26.根据权利要求21所述的设备，其进一步包括用于基于根据所述CU大小的所述分支化检查所述CU大小的子集来对最大译码单元LCU执行动态模式决策DMD分支化的装置。

27.根据权利要求26所述的设备，其进一步包括以下各项中的至少一者：(i)用于至少部分地基于所述LCU的所述DMD分支化来为编码树单元CTU选择译码模式的装置；或(ii)用于至少部分地基于所述LCU的所述DMD分支化来执行运动估计的装置。

28.一种非暂时性计算机可读媒体，其包括当被执行时致使设备执行包括以下操作的过程的代码：

响应于所述CU块的所述子块的所述第二SAD值介于上齐次阈值与下齐次阈值之间而检测所述齐次条件，所述上齐次阈值和下齐次阈值至少部分地基于所述CU块的所述第一SAD值；以及

29.根据权利要求28所述的非暂时性计算机可读媒体，其中：

所述上齐次阈值等于C_u*(第一SAD值)/4，其中C_u大于1；

所述下齐次阈值等于C_d*(第一SAD值)/4，其中C_d小于1；以及

其中C_d和C_u是量化参数(QP)相关阈值。

30.根据权利要求28所述的非暂时性计算机可读媒体，其进一步包括在被执行时致使所述设备基于以下各项来进一步为CU大小的所述分支化定义所述分支化条件的代码：