CN110100436A

CN110100436A - 使用导出色度模式译码视频数据

Info

Publication number: CN110100436A
Application number: CN201880005363.0A
Authority: CN
Inventors: 张莉; 钱威俊; 赵欣; 马尔塔·卡切维奇
Original assignee: Qualcomm Inc
Current assignee: Qualcomm Inc
Priority date: 2017-01-13
Filing date: 2018-01-12
Publication date: 2019-08-06
Anticipated expiration: 2038-01-12
Also published as: US20180205946A1; US11025903B2; CN110100436B; WO2018132710A1

Abstract

本发明揭示一种用于对视频数据进行解码的实例装置，所述装置包含存储器，其用于存储视频数据；以及一或多个处理器，其实施在电路中且经配置以构造用于所述视频数据的当前色度块的帧内预测候选列表，所述帧内预测候选列表指示用于所述当前色度块的候选帧内预测模式，其中所述帧内预测候选列表指示允许的亮度(luminance/luma)候选帧内预测模式的子集，确定用于所述当前色度块的所述帧内预测候选列表中的所述候选帧内预测模式中的每一者的成本(例如，绝对变换差和SATD)值，及使用由所述帧内预测候选列表根据所述成本值所指示的所述候选帧内预测模式中的一者(例如，具有最低成本值的候选帧内预测模式)生成用于所述当前色度块的预测块。

Description

使用导出色度模式译码视频数据

本申请案主张2017年1月13日提交申请的美国临时申请案第62/446,270号的权益，所述美国临时申请案特此通过全文引用的方式并入本文中。

技术领域

本发明涉及视频编码及视频解码。

背景技术

数字视频能力可并入到广泛范围的装置中，包含数字电视、数字直播系统、无线广播系统、个人数字助理(PDA)、膝上型或桌上型计算机、平板计算机、电子书阅读器、数字摄像机、数字记录装置、数字媒体播放器、视频游戏装置、视频游戏控制台、蜂窝式或卫星无线电电话、所谓“智能电话”、视频电话会议装置、视频流式处理装置及其类似者。数字视频装置实施视频译码技术，例如由MPEG-2、MPEG-4、ITU-T H.263、ITU-T H.264/MPEG-4第10部分、高级视频译码(AVC)、高效率视频译码(HEVC)标准、ITU-T H.265/高效率视频译码(HEVC)及此些标准的扩展定义的标准中所描述的那些技术。视频装置可通过实施此些视频译码技术而更高效地发射、接收、编码、解码及/或存储数字视频信息。

视频译码技术包含空间(图片内)预测及/或时间(图片间)预测以减少或移除视频序列中固有的冗余。对于基于块的视频译码，视频图块(例如，视频图片或视频图片的部分)可被分割为视频块，其也可被称作为译码树单元(CTU)、译码单元(CU)及/或译码节点。图片的帧内译码(I)图块中的视频块是使用关于同一图片中的相邻块中的参考样本的空间预测来编码。图片的帧间译码(P或B)图块中的视频块可使用关于同一图片中的相邻块中的参考样本的空间预测或关于其它参考图片中的参考样本的时间预测。图片可被称为帧，且参考图片可被称为参考帧。

发明内容

通常，本发明描述与用于图像及/或视频译码的帧内预测有关的技术，且更特定来说，描述视频数据的色度(chrominance/chroma)块的帧内预测。根据本发明的技术，解码器可在无需使用显式信令的情况下导出色度译码模式。这些技术可在高级视频编解码器(例如HEVC的扩展或下一代视频译码标准)的上下文中使用。

在一个实例中，一种解码视频数据的方法包含：构造用于视频数据的当前色度块的帧内预测候选列表，所述帧内预测候选列表指示用于所述当前色度块的候选帧内预测模式，其中所述帧内预测候选列表指示允许的亮度(luminance/luma)候选帧内预测模式；确定由用于当前色度块的帧内预测候选列表所指示的所述候选帧内预测模式中的每一者的例如绝对变换差和(SATD)值的成本值；及使用由所述帧内预测候选列表根据所述成本值所指示的所述候选帧内预测模式中的一者，例如，具有最低成本值的所述候选帧内预测模式，来生成用于所述当前色度块的预测块。

在另一实例中，一种用于对视频数据进行解码的装置包含存储器，其用于存储视频数据；以及一或多个处理器，其实施在电路中且经配置以构造用于所述视频数据的当前色度块的帧内预测候选列表，所述帧内预测候选列表指示用于所述当前色度块的候选帧内预测模式，其中所述帧内预测候选列表指示允许的亮度(luminance/luma)候选帧内预测模式的子集，确定由用于所述当前色度块的所述帧内预测候选列表所指示的所述候选帧内预测模式中的每一者的成本值，及使用由所述帧内预测候选列表根据所述成本值所指示的所述候选帧内预测模式中的一者生成用于所述当前色度块的预测块。

在另一实例中，一种用于对视频数据进行解码的装置包含用于构造用于视频数据的当前色度块的帧内预测候选列表的装置，所述帧内预测候选列表指示用于当前色度块的候选帧内预测模式，其中帧内预测候选列表指示允许亮度(luminance/luma)候选帧内预测模式的子集；用于确定由用于当前色度块的帧内预测候选列表所指示的候选帧内预测模式中的每一者的成本值的装置；以及用于使用由所述帧内预测候选列表根据所述成本值所指示的所述候选帧内预测模式中的一者生成当前色度块的预测块的装置。

在另一实例中，一种计算机可读存储媒体经编码有指令，所述指令在被执行时致使可编程处理器构造用于视频数据的当前色度块的帧内预测候选列表，所述帧内预测候选列表指示用于当前色度块的候选帧内预测模式；确定由用于所述当前色度块的所述帧内预测候选列表指示的所述候选帧内预测模式中的每一者的成本值；及使用由所述帧内预测候选列表根据所述成本值所指示的所述候选帧内预测模式中的一者生成用于当前色度块的预测块。

在下文随附图式及描述中阐明一或多个实例的细节。根据所述描述、图式以及权利要求书将明了其它特征、目的及优点。

附图说明

图1为说明可执行本发明的技术的实例性视频编码及解码系统的框图。

图2A及2B为说明实例性四叉树二叉树(QTBT)结构及对应译码树单元(CTU)的概念图。

图3A及3B为说明用于亮度及色度块的实例QTBT结构的概念图。

图4为说明16×16块的帧内预测的实例的概念图。

图5为说明HEVC的各种预测模式的概念图。

图6为说明使用平面模式生成预测块的概念图。

图7为说明使用角度帧内预测模式预测块的实例的概念图。

图8为说明用于视频译码的线性模型预测模式的实例性参考样本集的概念图。

图9为说明根据解码器侧导出模式(DDM)技术的对亮度块进行下采样的实例过程的概念图。

图10为说明可执行本发明的技术的实例性视频编码器的框图。

图11为说明可执行本发明的技术的实例性视频解码器的框图。

图12为说明根据本发明的技术对视频数据块进行编码的实例方法的流程图。

图13为说明根据本发明的技术对视频数据块进行解码的实例方法的流程图。

具体实施方式

通常，本发明的技术涉及图像及/或视频数据的译码(编码或解码)。本发明主要描述视频译码的上下文中的技术，但应理解，这些技术也可应用于图像译码。因此，在描述视频译码技术的情况下，应理解，通常可以替代图像译码技术。视频数据包含一系列图片，其通常包含彩色图片。原始彩色图片可由红绿蓝(RGB)颜色空间中的像素表示。视频编码器或前端单元可将原始彩色图片处理(例如，转换)成亮度(luminance/luma)及色度(chrominance/chroma)颜色空间，例如，一组亮度信息及两组色度信息，一组用于蓝色色调色度且另一者用于红色色调色度。此亮度及色度颜色空间也可被称作为YUV或YCbCr。然后，视频编码器可对亮度及色度进行编码。

此外，视频及图像译码技术通常包含将图片划分为块并通过预测块及对数据进行译码来对每一块进行译码，所述数据表示块与其预测之间的差(即，残差)。视频译码器可使用帧内预测(使用来自仅相同图片的信息)或帧间预测(使用来自其它先前译码图片的信息)来预测块。

本发明的技术一般包含用于确定将应用于预测视频数据的色度块的帧内预测模式的技术。本发明并非对信令通知帧内预测模式的数据进行译码，而是描述用于隐式地(即，无需(通过源装置)显式信令通知模式或(通过目标装置)接收模式的经信令通知数据)确定(或导出)用于视频数据的色度块的帧内预测模式的技术。通过以此方式导出译码模式，本发明的技术可减少在包含经译码视频数据的位流中发信的数据量，而不会过度增加视频译码过程的复杂性。以此方式，技术可改进视频译码领域，因为可减少位率而不会过度增加执行这些技术所需的处理量。此外，本发明的技术降低先前提出的用于解码器导出的色度帧内预测模式的技术的处理要求，从而进一步改进视频译码的领域。

特定来说，韩宇(Yu Han)、安吉城(Jicheng An)、郑建华(Jianhua Zheng)的“解码器侧直接模式预测”(JVET-E0027)描述用于JVET探索模型(JEM)的解码器侧导出直接模式(DDM)技术。如下面更详细论述，JVET-E0027的DDM技术包含迭代搜索过程及用于对亮度块进行下采样以计算绝对变换差和(SATD)值的过程。本发明认识到编码器及解码器侧的迭代搜索可能为DDM技术的软件及硬件实施方案两者引入太多复杂性。另外，本发明认识到即使使用六抽头滤波器对用于SATD计算的亮度块进行下采样，对于较大的译码块，使用下采样块的复杂性仍可能太多，例如，其中译码块大小等于64×64。本发明的技术降低这些复杂性，从而改进视频译码领域。

视频译码标准包含ITU-TH.261、ISO/IECMPEG-1可视化、ITU-TH.262或ISO/IECMPEG-2可视化、ITU-TH.263、ISO/IECMPEG-4可视化及ITU-TH.264(还称作ISO/IECMPEG-4AVC)，包含其可缩放视频编码(SVC)及多视图视频编码(MVC)扩展。另外，ITU-T视频译码专家组(VCEG)及ISO/IEC动画专家组(MPEG)之视频译码联合协作团队(JCT-VC)也已制定新的视频译码标准，即高效率视频译码(HEVC)。HEVC规范可从phenix.int-evry.fr/jct/doc_end_user/documents/14_Vienna/wg11/JCTVC-N1003-v1.zip获得。可以从phenix.int-evry.fr/jct/doc_end_user/current_document.php？id＝10481获得HEVC的规范及其扩展，包含格式范围(RExt)、可伸缩性(SHVC)及多视图(MV-HEVC)扩展及屏幕内容扩展。

ITU-T VCEG(Q6/16)及ISO/IEC MPEG(JTC 1/SC 29/WG 11)正在研究未来视频译码技术标准化的潜在需求，其压缩能力远远超过当前HEVC标准(包含关于屏幕内容译码及高动态范围译码的当前扩展及近期扩展)。这些小组正在被称作为联合视频探索小组(JVET)的联合合作计划中一起致力于此勘探活动以评估由此领域中的其专家提出的压缩技术设计。JVET参考软件，即联合探索模型4(JEM 4)，可从jvet.hhi.fraunhofer.de/svn/svn_HMJEMSoftware/tags/HM-16.6-JEM-4.0/获得。陈J.(J.Chen)、E.阿尔希那(E.Alshina)、G.J.沙利文(G.J.Sullivan)、J.-R.欧姆(J.-R.Ohm)、J.博伊斯(J.Boyce)的“联合探索测试模型4的算法描述(Algorithm description of Joint Exploration TestModel 4)”(JVET-D1001，成都，2016年10月)提供关于JEM4的算法描述。

图1为说明可执行本发明的技术的实例性视频编码及解码系统100的框图。本发明的技术一般涉及译码(编码及/或解码)视频数据。通常，视频数据包含用于处理视频的任何数据。因此，视频数据可包括原始未译码视频、经编码视频、经解码(例如，重建)视频及视频元数据，例如信令数据。

在此实例中，如图1中所展示，系统100包含源装置102，所述源装置提供欲由目的地装置116进行解码并显示的经编码视频数据。特定来说，源装置102经由计算机可读媒体110将视频数据提供到目的地装置116。源装置102及目的地装置116可包括广泛范围的装置中的任一者，包含桌上型计算机、笔记本(即，膝上型)计算机、平板计算机、机顶盒、电话手机(例如，智能电话)、电视机、摄像机、显示装置、数字媒体播放器、视频游戏主机、视频流式传输装置，或其类似者。在一些状况下，源装置102及目的地装置116可配备用于无线通信，且因此可被称作为无线通信装置。

在图1的实例中，源装置102包含视频源104、存储器106、视频编码器200及输出接口108。目的地装置116包含输入接口122、视频解码器300、存储器120及显示装置118。根据本发明，源装置102的视频编码器200及目的地装置116的视频解码器300可经配置以应用用于导出色度帧内预测模式的技术。因此，源装置102表示视频编码装置的实例，而目的地装置116表示视频解码装置的实例。在其它实例中，源装置及目的地装置可包含其它组件或布置。举例来说，源装置102可从外部视频源(例如，外部摄像机)接收视频数据。同样地，目的地装置116可与外部显示装置介接，而非包含集成式显示装置。

如图1中所展示的系统100仅为一个实例。通常，任何数字视频编码及/或解码装置可执行用于导出色度帧内预测模式的技术。源装置102及目的地装置116仅为其中源装置102生成经译码视频数据以供发射到目的地装置116的此些译码装置的实例。本发明将“译码”装置称作为执行数据的译码(编码及/或解码)的装置。因此，视频编码器200及视频解码器300分别表示译码装置(特定来说，视频编码器及视频解码器)的实例。在一些实例中，装置102、116可以基本对称的方式操作，使得装置102、116中的每一者包含视频编码及解码组件。因此，系统100可支持视频装置102、116之间的单向或双向视频传输，例如，用于视频流式处理、视频播放、视频广播或视频电话。

通常，视频源104表示视频数据源(即，原始未经译码视频数据)，且向视频编码器200提供视频数据的连续系列图片(也被称作为“帧”)，视频编码器200对关于图片的数据进行编码。源装置102的视频源104可包含视频捕获装置，例如视频摄像机、含有先前所捕获视频的视频存档，及/或用以从视频内容提供者接收视频的视频馈送接口。作为又一替代方案，视频源104可生成基于计算机图形数据作为源视频，或直播视频、经存档视频及计算机-生成视频的组合。在每一状况下，视频编码器200对所捕获的，预捕获的或计算机生成的视频数据进行编码。视频编码器200可将图片从所接收的次序(有时被称作为“显示次序”)重新布置成用于译码的译码次序。视频编码器200可生成包含经编码视频数据的位流。然后，源装置102可经由输出接口108将经编码视频数据输出到计算机可读媒体110上以用于由例如目的地装置116的输入接口122接收及/或检索。

源装置102的存储器106及目的地装置116的存储器120表示通用存储器。在一些实例中，存储器106、120可存储原始视频数据，例如来自视频源104的原始视频及来自视频解码器300的原始经解码视频数据。另外或替代地，存储器106、120可存储分别可由例如视频编码器200及视频解码器300执行的软件指令。尽管在此实例中经展示与视频编码器200及视频解码器300分开，但应理解，视频编码器200及视频解码器300还可包含用于功能类似或等同目的的内部存储器。此外，存储器106、120可存储经编码视频数据，例如，从视频编码器200输出并输入到视频解码器300。在一些实例中，存储器106、120的部分可经分配为一或多个视频缓冲器，例如，以存储原始的，经解码及/或经编码视频数据。

计算机可读媒体110可表示能够将经编码视频数据从源装置102传输到目的地装置116的任何类型的媒体或装置。在一个实例中，计算机可读媒体110表示通信媒体，以使得源装置102能够实时地(例如，经由射频网络或基于计算机的网络)将经编码视频数据直接发射到目的地装置116。输出接口108可调制包含经编码视频数据的传输信号，且输入接口122可根据例如无线通信协议的通信标准来调制所接收的传输信号。通信媒体可包括任何无线或有线通信媒体，例如，射频(RF)频谱或一或多个物理发射线。通信媒体可形成基于数据包的网络的部分，例如局域网、广域网或例如因特网的全球网。通信媒体可包含路由器、交换机、基站或可用于促进从源装置102到目的地装置116的通信的任何其它设备。

在一些实例中，源装置102可将经编码数据从输出接口108输出到存储装置116。类似地，目的地装置116可经由输入接口122从存储装置116存取经编码数据。存储装置116可包含各种分布式或本地存取数据存储媒体中的任何者，例如硬盘驱动器、蓝光光盘、DVD、CD-ROM、快闪存储器、易失性或非易失性存储器或任何其它适于存储经编码视频数据的数字存储媒体。

在一些实例中，源装置102可将经编码视频数据输出到文件服务器114或可存储由源装置102生成的经编码视频的另一中间存储装置。目的地装置116可经由流式处理或下载从文件服务器114存取存储的视频数据。文件服务器114可为能够存储经编码视频数据并将所述经编码视频数据发射到目标装置116的任何类型的服务器装置。文件服务器114可表示web服务器(例如，用于网站)、文件传输协议(FTP)服务器、内容递送网络装置或网络附接存储(NAS)装置。目的地装置116可通过任何标准数据连接(包含因特网连接)从文件服务器114存取经编码视频数据。此可包含无线信道(例如，Wi-Fi连接)、有线连接(例如，DSL、电缆调制解调器等等)，或适于存取存储于文件服务器114上的经编码视频数据的两者的组合。文件服务器114及输入接口122可经配置以根据流式传输协议、下载传输协议或其组合来操作。

输出接口108及输入接口122可表示无线发射器/接收器、调制解调器、有线网络组件(例如，以太网卡)，根据各种IEEE 802.11标准中的任何者操作的无线通信组件，或其它物理组件。在输出接口108及输入接口122包括无线组件的实例中，输出接口108及输入接口122可经配置以根据蜂窝通信标准(例如4G、4G-LTE(长期演进)高级LTE、5G等传送数据，例如经编码视频数据。在输出接口108包括无线发射器的一些实例中，输出接口108及输入接口122可经配置以根据例如IEEE 802.11规范、IEEE 802.15规范(例如，ZigBee^TM)、Bluetooth^TM标准等的其它无线标准来传送例如经编码视频数据的数据。在一些实例中，源装置102及/或目的地装置116可包含相应的单片系统(SoC)装置。例如，源装置102可包含SoC装置以执行归因于视频编码器200及/或输出接口108的功能，且目的地装置116可包含SoC装置以执行归因于视频解码器300及/或输入接口122的功能。

本发明的所述技术可应用于支持各种多媒体应用中的任何者的视频译码，例如无线电视广播、有线电视发射、卫星电视发射、因特网流式视频发射，例如经由HTTP的动态自适应流式处理(DASH)、经编码到数据存储媒体上的数字视频、对存储于数据存储媒体上的数字视频的解码或其它应用。

目的地装置116的输入接口122从计算机可读媒体110(例如，存储装置112、文件服务器114等)接收经编码视频位流。经编码视频位流计算机可读媒体110可包含由视频编码器200定义的信令信息，其也由视频解码器300使用，例如具有描述视频块或其它译码单元的特性及/或处理的值的语法元素(例如，图块、图片、图片组、序列等)。显示装置118将经解码视频数据的经解码图片显示给用户。显示装置118可表示各种显示装置中的任一者，例如，阴极射线管(CRT)、液晶显示器(LCD)、等离子显示器、有机发光二极管(OLED)显示器或另一类型的显示装置。

尽管图1中未展示，但在一些实例中，视频编码器200及视频解码器300可各自与音频编码器及/或音频解码器集成，且可包含适当的MUX-DEMUX单元，或其它硬件及/或元件，以处置在共用数据流中包含音频及视频两者的多路复用流。如果适用，MUX-DEMUX单元可符合ITU H.223多路复用器协议，或其它协议，例如用户数据报协议(UDP)。

视频编码器200及视频解码器300各自可实施为各种适合编码器及/或解码器电路中的任一者，例如一或多个微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、场可编程门阵列(FPGA)、离散逻辑、软件、硬件、固件或其任一组合。当技术部分地以软件实施时，装置可将用于软件的指令存储在适合非暂时性计算机可读媒体中且在硬件中使用一或多个处理器来执行指令以执行本发明的技术。视频编码器200及视频解码器300中的每一者可包含在一或多个编码器或解码器中，其中的任一者可集成为相应装置中的组合式编码器/解码器(CODEC)的部分。包含视频编码器200及/或视频解码器300的装置可包括集成电路、微处理器及/或无线通信装置，例如蜂窝电话。

视频编码器200及视频解码器300可根据视频译码标准(例如，ITU-T H.265，也被称作为高效视频译码(HEVC)或其扩展，例如多视图及/或可缩放视频译码扩展)来操作。替代地，视频编码器200及视频解码器300可根据其它专有或行业标准(例如联合探索测试模型(JEM))操作。然而，本发明的技术不限于任何特定的译码标准。

通常，视频编码器200及视频解码器300可执行图片的基于块的译码。术语“块”通常是指包含待处理(例如，在编码及/或解码过程中经编码，经解码或以其它方式使用)的数据的结构。例如，块可包含亮度及/或色度数据的样本的二维矩阵。通常，视频编码器200及视频解码器300可对以YUV(例如，Y、Cb、Cr)格式表示的视频数据进行译码。也就是说，视频编码器200及视频解码器300可译码亮度及色度分量而非对用于图片的样本的红色、绿色及蓝色(RGB)数据进行译码，其中色度分量可包含红色调色度分量及蓝色调色度分量两者。在一些实例中，视频编码器200在编码之前将所接收RGB格式化数据转换为YUV表示，且视频解码器300将YUV表示转换为RGB格式。替代地，预处理单元及后处理单元(未展示)可执行这些转换。

本发明通常可是指对图片进行译码(例如，编码及解码)以包含对图片的编码或解码数据的处理。类似地，本发明可是指对图片的块的译码以包含对块的编码或解码数据的处理，例如，预测及/或残差译码。经编码视频位流通常包含表示译码决策(例如，译码模式)及将图片分割成块的语法元素的一系列值。因此，关于对图片或块进行译码的引用通常应理解为对用于形成图片或块的语法元素的值进行译码。

HEVC定义各种块，包含译码单元(CU)、预测单元(PU)及变换单元(TU)。根据HEVC，视频译码器(例如视频编码器200)根据四叉树结构将译码树单元(CTU)分割为CU。也就是说，视频译码器将CTU及CU分割成四个相等的非重叠方块，且四叉树的每一节点具有零个或四个子节点。没有子节点的节点可被称作为“叶节点”，且此类叶节点的CU可包含一或多个PU及/或一或多个TU。视频译码器可进一步分割PU及TU。例如，在HEVC中，残差四叉树(RQT)表示TU的分割。在HEVC中，PU表示帧间预测数据，而TU表示残差数据。帧内预测的CU包含帧内预测信息，例如帧内模式指示。

作为另一实例，视频编码器200及视频解码器300可经配置以根据JEM操作。根据JEM，视频译码器(例如视频编码器200)将图片分割为多个译码树单元(CTU)。视频编码器200可根据树结构(例如，四叉树二叉树(QTBT)结构)对CTU进行分割。JEM的QTBT结构消除多个分割类型的概念，例如HEVC的CU、PU及TU之间的分离。JEM的QTBT结构包括两个级别：根据四叉树分割所分割的第一级别及根据二叉树分割所分割的第二级别。QTBT结构的根节点对应于CTU。二叉树的叶节点对应于译码单元(CU)。

在一些实例中，视频编码器200及视频解码器300可使用单个QTBT结构来表示亮度及色度分量中的每一者，而在其它实例中，视频编码器200及视频解码器300可使用两个或多于两个QTBT结构，例如用于亮度分量的一个QTBT结构及用于两个色度分量的另一QTBT结构(或用于相应色度分量的两个QTBT结构)。

视频编码器200及视频解码器300可经配置以使用按照HEVC的四叉树分割，根据JEM的QTBT分割或其它分割结构。出于解释的目的，关于QTBT分割呈现本发明的技术的描述。然而，应理解，本发明的技术还可应用于经配置以使用四叉树分割或其它类型的分割的视频译码器。

本发明可互换地使用“N×N”及“N乘N”来指代块(例如CU或其它视频块)在垂直及水平维度方面的样本尺寸，例如，16×16个样本或16乘16个样本。通常，16×16CU在垂直方向上具有16个样本(y＝16)且在水平方向上具有16个样本(x＝16)。同样地，N×N个CU通常在垂直方向上具有N个样本且在水平方向上具有N个样本，其中N表示非负整数值。CU中的样本可按行及列布置。此外，CU不必在水平方向上具有与在垂直方向上相同数目的样本。例如，CU可包括N×M个样本，其中M不一定等于N。

视频编码器200对表示预测及/或残差信息的关于CU的视频数据以及其它信息进行编码。预测信息指示如何预测CU以便形成用于CU的预测块。残差信息通常表示编码之前的CU的样本与预测块之间的逐样本差异。

为了预测CU，视频编码器200一般可通过帧间预测或帧内预测形成用于CU的预测块。帧间预测通常是指从先前译码的图片的数据预测CU，而帧内预测通常是指从相同图片的先前译码数据预测CU。为了执行帧间预测，视频编码器200可使用一或多个运动向量来生成预测块。视频编码器200一般可执行运动搜索以例如就CU与参考块之间的差异识别与CU紧密匹配的参考块。视频编码器200可使用绝对差和(SAD)、平方差和(SSD)、平均绝对差(MAD)、均方差(MSD)或其它此类差异计算来计算差异度量以确定参考块是否与当前CU紧密匹配。在一些实例中，视频编码器200可使用单向预测或双向预测来预测当前CU。

在一些实例中，JEM还包含仿射运动补偿模式，其可被认为是帧间预测模式。在仿射运动补偿模式中，视频编码器200可确定表示非平移运动(例如放大或缩小、旋转、透视运动或其它不规则运动类型)的两个或多于两个运动向量。

为了执行帧内预测，视频编码器200可选择帧内预测模式以生成预测块。JEM提供六十七种帧内预测模式，包含各种角度模式，以及平面模式及DC模式。通常，视频编码器200选择帧内预测模式，所述帧内预测模式描述相邻于当前块(例如，CU的块)的样本，从所述样本预测所述当前块的样本。假设视频编码器200以光栅扫描顺序(从左到右，从上到下)对CTU及CU进行译码，此些样本通常可在与当前块相同的图片中的当前块的上面、左上方或左侧。

视频编码器200对表示当前块的预测模式的数据进行编码。举例来说，对于帧间预测模式，视频编码器200可对表示使用各种可用帧间预测模式中的哪一者的数据以及关于对应模式的运动信息进行编码。例如，对于单向或双向帧间预测，视频编码器200可使用高级运动向量预测(AMVP)或合并模式来对运动向量进行编码。视频编码器200可使用类似模式来对用于仿射运动补偿模式的运动向量进行编码。

在预测(例如块的帧内预测或帧间预测)之后，视频编码器200可计算块的残差数据。残差数据，例如残差块，表示块与使用对应预测模式形成的块的预测块之间的逐样本差异。视频编码器200可将一或多个变换应用于残差块，以在变换域而非样本域中产生经变换数据。举例来说，视频编码器200可将离散余弦变换(DCT)、整数变换、小波变换或概念上类似的变换应用于残差视频数据。另外，视频编码器200可在第一变换之后应用二次变换，例如模式相关的不可分二次变换(MDNSST)、信号相关变换、卡-洛(Karhunen-Loeve)变换(KLT)等。视频编码器200在应用一或多个变换之后产生变换系数。

如上文所述，在任何变换以产生变换系数之后，视频编码器200可执行变换系数的量化。量化通常是指其中将变换系数量化以可能减少用于表示系数的数据的量，从而提供进一步压缩的过程。通过执行量化过程，视频编码器200可减小与一些或所有系数相关联的位深度。举例来说，视频编码器200可在量化期间将n位值舍入到m位值，其中n大于m。在一些实例中，为了执行量化，视频编码器200可执行待量化的值的按位右移。

在量化之后，视频编码器200可扫描变换系数，从包含经量化变换系数的二维矩阵产生一维向量。扫描可被设计为在矢量的前面放置较高能量(且因此较低频率)的系数，且在矢量的后面放置较低能量(且因此较高频率)的变换系数。在一些实例中，视频编码器200可利用预定义扫描次序来扫描经量化变换系数以产生经序列化向量，且接着对向量的经量化变换系数进行熵编码。在其它实例中，视频编码器200可执行自适应扫描。在扫描经量化变换系数以形成一维向量之后，视频编码器200可例如根据上下文自适应二进制算术译码(CABAC)对一维向量进行熵编码。视频编码器200还可对描述与经编码视频数据相关联的元数据的语法元素的值进行熵编码以供视频解码器300在对视频数据进行解码中使用。

为了执行CABAC，视频编码器200可将上下文模型内的上下文指派到待发射的符号。上下文可涉及例如符号的相邻值是否为零值。概率确定可基于指派到符号的上下文。

视频编码器200可进一步生成语法数据(例如，基于块的语法数据，基于图片的语法数据及基于序列的语法数据)到视频解码器300(例如，在图片标头，块标头，图块标头，或例如序列参数集(SPS)、图片参数集(PPS)或视频参数集(VPS)的其它语法数据中。视频解码器300可同样对此类语法数据进行解码以确定如何对对应视频数据进行解码。

以此方式，视频编码器200可产生包含经编码视频数据的位流，例如，描述将图片分割成块(例如，CU)的语法元素以及关于块的预测及/或残差信息。最终，视频解码器300可接收位流并对经编码视频数据进行解码。

通常，视频解码器300执行与由视频编码器200执行的过程相反的过程以对位流的经编码视频数据进行解码。举例来说，视频解码器300可使用CABAC以与视频编码器200的CABAC编码过程基本相似但相反的方式对位流的语法元素的值进行解码。语法元素可将图片的分割信息定义为CTU，且根据对应分割结构(例如QTBT结构)对每一CTU进行分割以定义CTU的CU。语法元素可进一步定义关于视频数据的块(例如，CU)的预测及残差信息。

残差信息可由例如经量化变换系数表示。视频解码器300可对块的经量化变换系数进行逆量化及逆变换以再现块的残差块。视频解码器300使用经信令通知的预测模式(帧内或帧间预测)及相关预测信息(例如，用于帧间预测的运动信息)来形成块的预测块。然后，视频解码器300可组合预测块及残差块(在逐样本的基础上)以再现原始块。视频解码器300可执行额外处理，例如执行解块过程以减少沿块的边界的视觉伪影。

根据本发明的技术，视频编码器200及视频解码器300可导出用于色度块的帧内预测模式，而无需对表示用于色度块的帧内预测模式的数据进行显式译码。例如，如上文所论述，JVET-E0027描述六抽头下采样滤波器及用于导出用于色度块的帧内预测模式的迭代搜索过程。然而，根据本发明的技术，视频编码器200及视频解码器300可使用针对块(对应亮度或色度相邻块)的不同下采样比率来进行解码器侧帧内预测模式推导。在一个实例中，比率可取决于译码块的大小。也就是说，视频编码器200及视频解码器300可根据译码块的大小选择比率。在另一实例中，视频编码器200及视频解码器300可对各种块应用不同的滤波方法。

另外或替代地，视频编码器200及视频解码器300可执行比JVET-E0027中所描述的迭代搜索技术更简单的技术。特定来说，视频编码器200及视频解码器300可以一或多个直接模式及/或来自空间相邻亮度/色度块的一或多个模式检查成本(例如，绝对变换距离和(SATD))。这些模式可经表示为第一候选集。在一个实例中，如果某些模式未包含在第一候选集中，例如DC、平面、水平及/或垂直模式，那么视频编码器200及视频解码器300可进一步检查这些模式。替代地，视频编码器200及视频解码器300可进一步检查第二候选集，其中第二候选集可包含接近于第一候选集中的一或多个角度模式的角度模式(其中“接近”可指例如在一个角度单位内，例如，如在下文所论述的图5中所展示)。

在另一实例中，视频编码器200及视频解码器300可仅检查相依于经解码信息的单个候选集，包含但不限于以下中的任一者或全部：亮度帧内预测模式、块大小、变换类型及/或变换系数。例如，如果使用DC或平面模式对亮度块进行译码，且经译码系数的数目很小(例如，没有非零系数，或仅有少数非零系数)，那么可仅考虑DC或平面模式作为DDM的候选模式。

在一些实例中，当应用解码器侧导出的直接模式时，色度模式的指示可以如下。在一个实例中，视频编码器200及视频解码器300可对一位旗标进行译码，所述一位旗标指示DDM是CCLM还是导出方向模式。在一个实例中，视频编码器200及视频解码器300可对一位旗标进行译码以指示DDM是CCLM还是导出方向模式或来自亮度块的直接模式。在一个实例中，视频编码器200及视频解码器300可构造用于色度帧内预测模式列表的候选列表以仅包含两个模式：一个为CCLM而另一个为导出方向模式。

在一些实例中，视频编码器200及视频解码器300可使用识别相邻色度块的模板来用于计算失真成本而非使用亮度块来计算失真成本。模板可为预定义的，或视频编码器200可例如在视频参数集(VPS)、序列参数集(SPS)、图片参数集(PPS)、图块标头、块标头等中构造模板及表示模板的信号数据。

在一些实例中，视频编码器200及视频解码器300可以子块为单位导出色度导出模式。也就是说，视频编码器200及视频解码器300可将亮度块划分为多个子块。对于每一子块，视频译码器(视频编码器200或视频解码器300)可导出子块DDM。然后，视频译码器可将此子块DDM应用于共同定位的色度子块以执行帧内预测。在一个实例中，当导出每一子块的DDM时，视频译码器仅使用重建的亮度参考样本(位于当前块的上/左邻域处)来对每一候选帧内模式执行帧内预测。

本发明通常可能是指“信令通知”某些信息，例如语法元素。术语“信令通知”通常可能是指值语法元素及/或用于对经编码视频数据进行解码的其它数据的通信。也就是说，视频编码器200可信令通知位流中的语法元素的值。通常，信令通知是指在位流中生成值。如上文所述，源装置102可基本上实时地或不实时地将位流传输到目的地装置116，例如当将语法元素存储到存储装置112以供稍后由目的地装置116检索时可能发生。

图2A及2B为说明实例性四叉树二叉树(QTBT)结构130及对应译码树单元(CTU)132的概念图。安J.(J.An)、陈Y.-W.(Y.-W.Chen)、张K.(K.Zhang)、黄H.(H.Huang)、黄Y.-W.(Y.-W.Huang)及雷S.(S.Lei.)的“用于下一代视频译码的块分割结构(Blockpartitioning structure for next generation video coding)”(国际电信联盟，COM16-C966、2015年9月),提出用于超过HEVC的进一步视频译码标准的QTBT结构，类似于图2A及2B的结构。

在图2A的实例中，实线表示四叉树分裂，且虚线指示二叉树分裂。存在两个二叉树分裂类型：对称水平分裂及对称垂直分裂。在二叉树的每一分裂(即，非叶)节点中，用信令通知一个旗标以指示使用哪种分裂类型(即，水平或垂直)，其中在此实例中0指示水平分裂且1指示垂直分裂。对于四叉树分裂，不需要指示分裂类型，因为四叉树节点将块水平且垂直地分割成具有相同大小的4个子块。因此，视频编码器200可对用于QTBT结构130的区域树级(即，实线)的语法元素(例如，分裂信息)及QTBT结构130的预测树级(即，虚线)的语法元素(例如，分裂信息)进行编码，且视频解码器300可对其进行解码。视频编码器200可对由QTBT结构130的终端叶节点表示的CU的视频数据(例如预测及变换数据)进行编码，且视频解码器300可对其进行解码。

一般来说，图2B的CTU 132可与定义对应于第一及第二级别处的QTBT结构130的节点的区块的大小的参数相关联。这些参数可包含CTU大小(表示样本中CTU 132的大小)、最小四叉树大小(MinQTSize，表示允许的最小四叉树叶节点大小)、最大二叉树大小(MaxBTSize，表示允许的最大二叉树根节点大小)、最大二叉树深度(MaxBTDepth，表示允许的最大二叉树深度)，以及最小二叉树大小(MinBTSize，表示允许的最小二叉树叶节点大小)。

对应于CTU(或译码树块(CTB))的QTBT结构的根节点可在QTBT结构的第一级具有四个子节点，每一子节点可根据四叉树分割来分割。也就是说，第一级的节点为叶节点(没有任何子节点)或具有四个子节点。QTBT结构130的实例表示例如包含父节点及具有用于分支的实线的子节点的节点。如果第一级的节点不大于允许的最大二叉树根节点大小(MaxBTSize)，那么可通过相应的二叉树将其进一步分割。可迭代一个节点的二叉树分裂，直到由分割得到的节点达到允许的最小二叉树叶节点大小(MinBTSize)或允许的最大二叉树深度(MaxBTDepth)。QTBT结构130的实例将此些节点表示为具有用于分支的虚线。二叉树叶节点被称作为译码单元(CU)，其用于预测(例如，图片内或图片间预测)及变换，而无需任何进一步的分割。如上面所论述，CU也可称作为“视频块”或“块”。

在QTBT分割结构的一个实例中，CTU大小设置为128×128(亮度样本及两个对应的64×64色度样本)，MinQTSize设置为16×16，MaxBTSize设置为64×64，MinBTSize(宽度及高度两者)设置为4，MaxBTDepth设置为4。四叉树分割首先应用于CTU以生成四叉树叶节点。四叉树叶节点可具有从16×16(即，MinQTSize)到128×128(即，CTU大小)的大小。如果四叉树叶节点为128×128，那么其不会被二叉树进一步分裂，因为大小超过MaxBTSize(即，在此实例中为64×64)。否则，叶子四叉树节点将被二叉树进一步分割。因此，四叉树叶节点也为二叉树的根节点，且具有为0的二叉树深度。当二叉树深度达到MaxBTDepth(在此实例中为4)时，不允许进一步分裂。当二叉树节点具有等于MinBTSize(在此实例例中为4)的宽度时，其意味着不准许进一步的水平分裂。类似地，具有等于MinBTSize的高度的二叉树节点意味着不准许对所述二叉树节点进一步进行垂直分裂。如上文所述，二叉树的叶节点被称作为CU，且根据预测及变换进一步处理，而无需进一步分割。

此外，QTBT块结构支持亮度及色度可能具有单独的QTBT结构的特征。目前在JEM中，对于P及B图块，一个CTU中的亮度及色度CTU共享相同的QTBT结构。对于I图块，亮度CTU通过QTBT结构分割为CU，且色度CTU通过另一QTBT结构分割为色度CU。这意指在JEM中，I图块中的CU包含亮度分量的译码块或两个色度分量的译码块，且P及B图块中的CU包含所有三个颜色分量的译码块。

在JEM中，每PU允许六个色度模式。DM模式指示色度PU使用与对应亮度PU相同的预测模式。对于I图块，亮度及色度的QTBT结构可能不同。当在I图块中使用DM模式时，继承覆盖左上位置的PU的亮度预测模式。

图3A及3B为说明用于亮度及色度块的实例QTBT结构的概念图。特定来说，图3A描绘实例亮度QTBT结构134A，而图3B描绘实例色度QTBT结构134B。描绘图3B中的色度CTU 138的左分区(填充有灰色)及其对应的在图3A中具有更精细分区的亮度块136(填充有灰色)。在每一分区中标记的L(i)指示亮度帧内预测模式索引等于i。在此状况下，当左分区用DM模式译码时，其从对应的左上亮度块中挑选LM模式，即，将使用等于1的帧内预测模式索引来对色度块的左分区进行译码/解码。

下面的表1规定用于信令通知JEM的色度模式的模式布置。为了消除信令通知中可能的冗余，当导出时出现是指始终存在的模式中的一者时，角度(当总共存在67个帧内模式时为66)模式(称作为“替代模式”)用于替换再现模式，如表1所示。

表1-色度帧内预测模式及相关联名称的规范

图4为说明16×16块140的帧内预测的实例的概念图。视频译码器(例如视频编码器200或视频解码器300)通常使用其表示重建图像样本的空间相邻样本142对例如块140的块执行帧内预测。为了执行帧内预测，视频译码器可使用相邻样本142的上相邻及/或左相邻样本来预测块140的样本。举例来说，视频译码器可使用相邻样本142以在特定方向上(例如沿着预测方向144)形成预测样本。

作为一个实例，HEVC包含35个帧内预测模式，包含33种方向(或角度)模式及两个非定向模式：直流及平面模式。图5为说明HEVC的各种预测模式的概念图。表2规定HEVC的各种帧内预测模式。

表2—帧内预测模式及相关联名称的规范

帧内预测模式	相关联名称
		0	INTRA_PLANAR
1	INTRA_DC
		2..34	INTRA_ANGULAR2..INTRA_ANGULAR34

图6为说明使用平面模式生成预测块的概念图。平面模式通常是用于译码视频数据的最频繁使用的帧内预测模式。为了对N×N块150执行平面预测，对于位于(x,y)的每一样本p_xy(即，样本152)，视频译码器使用双线性滤波器使用四个特定的相邻重建样本154A、154B、154C及154D(参考样本154)来计算预测值。四个参考样本154包含右上重建样本TR154A，左下重建样本BL 154B，位于由T表示的当前样本的相同列(r_x,-1)的重建样本154C以及由L表示的当前样品的同一行(r_-1,y)的样品154D。平面模式可用公式表示为：

p_xy＝(N-x-1)·L+(N-y-1)·T+x·TR+y·BL (1)

对于DC模式，视频译码器用相邻重建样本的平均值填充预测块。通常，平面及DC模式都用于建模平滑变化且恒定的图像区域。

图7为说明使用角度帧内预测模式预测块160的实例的概念图。对于角度帧内预测模式(在HEVC中其包含33个不同预测方向)，帧内预测过程描述如下。对于每一给定角度帧内预测，可相应地识别帧内预测方向(或角度)。例如，根据图5，帧内模式18对应于纯水平预测方向，且帧内模式26对应于纯垂直预测方向。

给定特定帧内预测方向，对于预测块的每一样本，视频译码器将样本的坐标(x，y)沿着预测方向投影到相邻重建样本的行/列。例如，如图7中所展示，使用参考样本164、166预测样本162。假设(x，y)被投影到两个相邻重建样本L 164与R 166之间的分数位置α。然后视频译码器使用双抽头双线性插值滤波器计算(x，y)的预测值，在HEVC中如下用公式表示：

p_xy＝(1-α)·L+α·R (2)

为避免浮点运算，在HEVC中，上述计算实际上使用整数运算近似为：

p_xy＝((32-a)·L+a·R+16)>>5 (3)

其中a为等于32*α的整数。

通常，色度信号中的译码结构遵循共同定位的亮度信号的译码结构。利用此行为，HEVC引入机制来指示当色度块(或HEVC中的预测单元(PU))利用与对应亮度块(或PU)相同的预测模式时的状况。下面的表3规定用于在常规HEVC中信令通知色度模式的模式布置。在针对HEVC的PU指示导出模式的状况下，通过使用对应亮度PU模式来执行预测。为了消除当导出模式指的是总是存在的模式中的一者时出现的信令中可能的冗余，在HEVC中，使用角度(34)模式(命名为替代模式)替换再现模式，如在表3中所展示。

表3—色度帧内预测模式及相关联名称的规范

在根据HEVC的色度模式译码中，将一位(1-b)语法元素(0)指派到最常出现的导出模式，而将三位(3-b)语法元素(100、101、110、111)指派到其余四种模式。仅使用一个上下文模型对第一二进制元素(或位)进行译码，且对剩余两个二进制元素(如果需要)进行旁路译码。

JEM已将HEVC的33个角度模式扩展到65个角度模式，以及DC及平面模式。JEM还包含使用最可能模式(MPM)候选列表中的六种MPM来信令通知帧内预测模式的技术，如EE5中所论述：增强的跨组件线性模型帧内预测，张K.(K.Zhang)、陈J.(J.Chen)、张L.(L.Zhang)、M.卡兹维茨(Karczewicz)的“EE5：增强的跨组件线性模型帧内预测”，JVET-E0077。根据JEM，视频译码器首先对用于块的一个旗标(MPM旗标)进行译码以指示用于块的帧内预测模式是否来自MPM候选列表。如果帧内预测模式来自MPM候选列表，那么视频译码器然后将索引译码到MPM候选列表中，所述MPM候选列表识别用于预测MPM候选列表中的块的帧内预测模式。如果帧内预测模式并非来自MPM候选列表，那么视频译码器将索引译码到剩余帧内预测模式中，所述剩余帧内预测模式识别用于从剩余帧内预测模式预测块的帧内预测模式。

JEM还包括用于执行自适应多核变换的技术。除了已经在HEVC中采用的DCT-II及4×4 DST-VII之外，在JEM中使用自适应多变换(AMT)方案来对帧间译码块及帧内译码块两者进行残差译码。根据AMT方案，视频译码器使用来自DCT及DST系列的多个选定变换，而非HEVC的变换。新引入的变换矩阵为DST-VII、DCT-VIII、DST-I及DCT-V。

对于帧内残差译码，由于不同帧内预测模式的不同残差统计，JEM描述模式相关变换候选选择过程。JEM定义三个变换子集，如表4中所展示，且视频译码器基于帧内预测模式选择变换子集，如表5中所规定。

表4—三个预定义的变换候选集

表5-针对每一帧内预测模式的选定水平(H)及垂直(V)变换集

利用子集概念，视频译码器使用译码单元(CU)的帧内预测模式识别变换子集，其中CU级AMT旗标等于1。之后，对于水平及垂直变换中的每一者，视频译码器基于用滞后显式信令通知的数据来选择所识别的变换子集中的两个变换候选中的一者。然而，对于帧间预测残差，仅包括DST-VII及DCT-VIII的一个变换集用于所有帧间模式以及水平变换及垂直变换两者。

图8为说明用于视频译码的线性模型预测模式的实例性参考样本集的概念图。JEM描述用于视频译码的线性模型(LM)预测模式。尽管在YCbCr颜色空间中交叉补码冗余度显着降低，但仍然存在三种颜色分量之间的相关性。已研究各种方法以通过进一步降低相关性来改进视频译码性能。

在4:2:0色度视频译码中，在HEVC标准的开发期间已充分研究称为线性模型(LM)预测模式的方法。利用LM预测模式，通过使用如下的线性模型，基于相同块的下采样重建亮度样本来预测色度样本：

pred_C(i,j)＝α·rec_L(i,j)+β (4)

其中pred_C(i,j)表示块中色度样本的预测，且rec_L(i,j)表示同一块的下采样重建亮度样本。参数α及β是从当前区块周围的因果重建样本导出，且在图8中描绘关于选定参考样本的一个实例。用N×N表示色度块大小，然后i及j两者都在[0,N)范围内。

通过最小化当前块周围的相邻重建亮度及色度样本之间的回归误差来导出方程(4)中的参数α及β。

且如下求解参数α及β

β＝(∑y_i-α·∑x_i)/I (7)

其中x_i为下采样的重建亮度参考样本，y_i表示重建色度参考样本，且I为参考样本的量。对于目标N×N色度块，当左及上因果样本两者都可用时，涉及的总样本数目I等于2N；当只有左或上的因果样本可用时，所涉及的总样本数目I等于N。

总之，当应用LM预测模式时，将按顺序调用以下步骤：

a)对邻近的亮度样本进行下采样

b)导出线性参数(即，α及β)

c)对当前亮度块进行下采样并从下采样亮度块及线性参数导出预测

为了进一步改进译码效率，视频译码器可使用(1,2,1)及(1,1)的下采样滤波器来在对应亮度块内导出相邻样本x_i及下采样亮度样本rec_L(i,j)。

在JEM中，LM预测模式扩展到两个色度分量之间的预测，即，从Cb分量预测Cr分量。代替使用重建的样本信号，将交叉分量预测应用于残差域。这是通过将加权重建的Cb残差添加到原始Cr帧内预测以形成最终Cr预测来实施：

标度因子α在LM模式中导出。唯一差异为相对于误差函数中的默认α值添加回归成本，以使得导出标度因子偏向默认值(-0.5)。

在JEM中，LM预测模式被添加为一个额外色度帧内预测模式。在编码器侧，为了选择色度帧内预测模式，再一次添加对色度分量的RD成本检查。从亮度到色度的预测称为跨分量线性模式(CCLM)。

JEM描述用于色度预测模式的熵译码的以下内容。在色度模式译码中，1-b语法元素(0)被指派到最常发生的导出模式，两个二进制元素(10)被指派到LM模式，以及4-b语法元素(1100、1101、1110、1111)被指派到其余四个模式。视频译码器用一个上下文模型对前两个二进制元素进行译码，并使用旁路译码对剩余两个二进制元素(如果需要)进行译码。根据JEM，下面表6指示针对每一色度模式的二进制元素串。

表6-针对每一色度模式的二进制元素串

在2017年1月12日举行的第5届JVET会议中通过与色度译码有关的两个提议。第一个提议与改进的CCLM模式有关，且第二个提议与多个导出模式有关。

关于改进的CCLM模式，采用多线性模型(MMLM)模式。根据此模式，视频译码器将块的样本分组为多个集合。视频译码器计算阈值(Threshold)值作为相邻重建亮度样本的平均值。在Rec'_L[x,y]<＝Threshold的情况下的相邻样本经分类为第1组，而在Rec'_L[x,y]>Threshold的情况下的相邻样本经分类为第2组，且两个CCLM模型用于2组样品。这些技术在JVET-E0077中描述。

关于多个导出模式，模式包含跨分量线性模型模式，从共同定位的亮度译码块导出的多个帧内预测模式，以及来自空间邻域的模式。来自空间邻域的模式包含来自合并模式的左、上、左下、右上及左上空间相邻块的五个色度预测模式；平面及直流模式；添加导出模式，通过将-1或+1加到已包含在列表中的角度模式来获得那些帧内模式；默认模式按以下顺序添加：垂直(模式18)、水平(模式50)、模式2、模式34、模式66、模式10、模式26；且然后如果列表中不包含四种默认模式(平面、水平、垂直及DC模式)中的任何一者，那么缺少的默认模式用于替换最后一或多个候选模式。这些技术描述在张L.(L.Zhang)、钱W.-J.(W.-J.Chien)、陈J.(J.Chen)、赵X.(X.Zhao)、M.卡兹维茨(Karczewicz)的“用于色度帧内译码的多个直接模式”JVET-E0062。

韩宇(Yu Han)、安吉城(Jicheng An)、郑建华(Jianhua Zheng)的“解码器侧直接模式预测”(JVET-E0027)描述用于JEM的解码器侧导出直接模式(DDM)技术。下面描述所提出的DDM技术的流程。最初，对于当前色度块，视频译码器使用2D 3×2({1 2 1}{1 2 1})滤波器对共同定位重建亮度块进行下采样。JVET-E0027提出对V.谢列金(V.Seregin)、赵X.(X.Zhao)、A.赛德(A.Side)、M.卡兹维茨(Karczewicz)的“基于邻域的帧内最可能模式列表推导”(JVET-C0055，日内瓦，2016年5月)中所描述的帧内预测技术的修改。

图9为说明根据DDM技术的对亮度块进行下采样的实例过程的概念图。为了产生对应于色度位置170的亮度值，视频译码器将({1 2 1}{1 2 1})滤波器应用于亮度位置172A、172B、172C、172D、172E及172F处的亮度样本，将这些值一起相加，然后除以八。因此，视频译码器将亮度样本172B及172E的值乘以2，并将这些值与亮度样本172A、172C、172D及172F的值相加，然后将此总和除以八以在色度位置170处产生经下采样亮度值。通过以此方式对重建的亮度块进行下采样，视频译码器降低搜索复杂性。

然后，对于要作为DDM测试的帧内模式中的每一者，视频译码器计算预测块与下采样亮度块的重建之间的绝对变换差(SATD)和。视频译码器选择产生最小SATD的帧内模式为最佳模式，即DDM。

然后，视频译码器通过将DDM模式添加到帧内色度预测模式列表中来修改帧内色度预测模式列表，所述帧内色度预测模式列表包括一个跨分量线性模型(CCLM)模式，一个所提出的DDM模式、一个从供定位亮度块导出的DM模式以及三个默认模式(平面、垂直及水平；如果这些中的一者为与DM模式相同，那么由DC模式替换)。用于语法元素帧内色度预测模式的二值化在表7中规定。四个上下文模型用于对帧内色度预测模式进行译码。

表7-用于帧内色度预测模式的二值化

帧内色度预测模式	二进制元素串
		CCLM	0
DDM	10
		DM	110
0	1110
		1	11110
2	11111

考虑到复杂性与性能之间的折衷，迭代搜索算法用于DDM预测，如JVET-E0027中所提出的。首先，根据JVET-E0027，初始模式候选列表由平面、DC及65个角度内部方向中的每第4个模式组成。然后，针对所有候选帧内模式计算SATD，且选择最小化SATD的模式作为用于下一搜索的起始帧内模式。如果所选帧内模式为平面或DC，那么将其设置为DDM模式，且搜索过程结束。否则，JVET-E0027建议搜索起始帧内模式的两个相邻模式(具有间隔2)。最佳模式用作下一搜索的起始帧内模式。在最后的搜索中，检查起始帧内模式的两个最近的相邻模式(具有间隔1)。最后，将DDM模式设置为最小化SATD的帧内模式。

图10为说明可执行本发明的技术的实例性视频编码器200的框图。图10是出于解释的目的而提供且不应认为是对本发明中广泛实例及描述的技术的限制。出于解释的目的，本发明在例如HEVC视频译码标准及正在开发的H.266视频译码标准的视频译码标准的上下文中描述视频编码器200。然而，本发明的技术不限于这些视频译码标准，且一般地适用于视频编码及解码。

在图10的实例中，视频编码器200包含视频数据存储器230模式选择单元202、残差生成单元204、变换处理单元206、量化单元208、逆量化单元210、逆变换处理单元212、重建单元214、滤波器单元216、经解码图片缓冲器(DPB)116及熵编码单元220。

视频数据存储器230可存储要由视频编码器200的组件编码的视频数据。视频编码器200可从例如视频源104(图1)接收存储在视频数据存储器230中的视频数据。DPB 218可充当参考图片存储器，其存储参考视频数据以供视频编码器200预测后续视频数据。视频数据存储器230及DPB 218可由各种存储器装置中的任一者形成，例如动态随机存取存储器(DRAM)，包含同步DRAM(SDRAM)、磁阻RAM(MRAM)、电阻RAM(RRAM)或其它类型的存储装置。视频数据存储器230及DPB 218可由相同的存储器装置或单独存储器装置提供。在各种实例中，视频数据存储器230可与视频编码器200的其它组件在芯片上，如所说明，或相对于那些组件在芯片外。

在本发明中，对视频数据存储器230的提及不应解释为限于视频编码器200内部的存储器，除非明确地如此描述，或视频编码器200外部的存储器，除非明确地如此描述。相反，对视频数据存储器230的提及应被理解为存储视频编码器200接收的用于编码的视频数据的参考存储器(例如，用于待编码的当前块的视频数据)。图1的存储器106也可提供来自视频编码器200的各种的那样的输出的暂时存储、

图10的各种单元经说明以辅助理解由视频编码器200执行的操作。这些单元可实施为为固定功能电路，可编程电路或其组合。固定功能电路是指提供特定功能性的电路，且预设在可执行的操作上。可编程电路是指可编程以执行各种任务且在可执行的操作中提供灵活的功能的电路。例如，可编程电路可执行软件或固件，其致使可编程电路以由软件或固件的指令定义的方式操作。固定功能电路可执行软件指令(例如，接收参数或输出参数)，但固定功能电路执行的操作类型通常为不可变的。在一些实例中，单元中的一或多者可为不同的电路块(固定功能或可编程)，且在一些实例中，一或多个单元可为集成电路。

视频编码器200可包含由可编程电路形成的算术逻辑单元(ALU)、基本功能单元(EFU)、数字电路、模拟电路及/或可编程核心。在其中使用可由可编程电路执行的软件执行的视频编码器200的操作的实例中，存储器106(图1)可存储视频编码器200接收并执行的软件的目的码，或视频编码器200内的另一存储器(未展示)可存储此些指令。

视频数据存储器230经配置以存储所接收视频数据。视频编码器200可从视频数据存储器230检索视频数据的图片且将视频数据提供到残差生成单元204及模式选择单元202。视频数据存储器230中的视频数据可为待编码的原始视频数据。

模式选择单元202包含运动估计单元222、运动补偿单元224及帧内预测单元226。模式选择单元202可包含额外功能单元以根据其它预测模式执行视频预测。作为实例，模式选择单元202可包含调色板单元、块内复制单元(其可为运动估计单元222及/或运动补偿单元224的部分)、仿射单元、线性模型(LM)单元，等等。

模式选择单元202通常协调多个编码通道以测试编码参数的组合以及此等组合的所得速率-失真值。编码参数可包含将CTU分割为CU，用于CU的预测模式，用于CU的残差数据的变换类型，用于CU的残差数据的量化参数，等等。模式选择单元202可最终选择具有比其它测试组合更好的速率-失真值的编码参数的组合。

视频编码器200可将从视频数据存储器230检索的图片分割成一系列CTU，并将一或多个CTU封装在图块内。模式选择单元210可根据树结构(例如上述所描述的QTBT结构或HEVC的四叉树结构)来分割图片的CTU。如上文所描述，视频编码器200可根据树结构由对CTU进行分割形成一或多个CU。此CU通常也可被称作为“视频块”或“块”。

通常，模式选择单元202还控制其组件(例如，运动估计单元222、运动补偿单元224及帧内预测单元226)以生成用于当前块(例如，当前CU，或在HEVC中，PU及TU的重叠部分)的预测块。对于当前块的帧间预测，运动估计单元222可执行运动搜索以识别一或多个参考图片(例如，存储于DPB 218中的一或多个先前译码图片)中的一或多个紧密匹配的参考块。特定来说，运动估计单元222可例如根据绝对差和(SAD)，平方差和(SSD)，平均绝对差(MAD)、均方差(MSD)等等计算表示潜在参考块与当前块的相似程度的值。运动估计单元222通常可使用当前块与所考虑的参考块之间的逐样本差异来执行这些计算。运动估计单元222可识别具有由这些计算得到的最低值的参考块，指示与当前块最紧密匹配的参考块。

运动估计单元222可形成一或多个运动向量(MV)，其界定参考图片中的参考块相对于当前图片中的当前块的位置的位置。然后，运动估计单元222可将运动向量提供到运动补偿单元224。举例来说，对于单向帧间预测，运动估计单元222可提供单个运动向量，而对于双向帧间预测，运动估计单元222可提供两个运动向量。然后，运动补偿单元224可使用运动向量来生成预测块。举例来说，运动补偿单元224可使用运动向量来检索参考块的数据。作为另一实例，如果运动向量具有分数采样精度，那么运动补偿单元224可根据一或多个内插滤波器对预测块的值进行内插。此外，对于双向帧间预测，运动补偿单元224可检索由相应运动向量识别的两个参考块的数据，并组合所检索的数据，例如，通过逐样本平均或加权平均。

作为另一实例，对于帧内预测或帧内预测译码，帧内预测单元226可从邻近当前块的样本生成预测块。例如，对于角度模式，帧内预测单元226通常可在数学上组合相邻样本的值，并在当前块上的定义方向上填充这些计算值以产生预测块。作为另一实例，对于DC模式，帧内预测单元226可计算相邻于当前块的样本的平均值，并生成预测块以包含预测块的每一样本的此所得平均值。

当模式选择单元202确定对色度块执行帧内预测时，模式选择单元202可避免实际信令通知用于色度块的帧内预测模式的指示。相反，可假设视频解码器(例如视频解码器300)将使用位流的其它信息来导出帧内预测模式。此外，模式选择单元202可使用相同的信息选择帧内预测模式，以便确保解码器将选择相同的帧内预测模式。

根据本发明的技术，为了导出用于色度块的帧内预测模式，模式选择单元202(或其帧内预测单元226)可构造用于色度块的帧内预测候选列表。帧内预测候选列表可包含用于色度块的候选帧内预测模式。然后，模式选择单元202可针对用于色度块的帧内预测候选列表中的候选帧内预测模式中的每一者计算绝对变换差和(SATD)值。然后，模式选择单元202可将提供具有最低SATD值的帧内预测模式的指示到帧内预测单元226以致使帧内预测单元226生成用于色度块的预测块。

模式选择单元202将预测块提供到残差生成单元204。残差生成单元204从视频数据存储器230接收当前块的原始未编码版本，并模式选择单元202接收预测块。残差生成单元204计算当前块与预测块之间的逐样本差异。所得到逐个样本差异定义当前块的残差块。在一些实例中，残差生成单元204还可确定残差块中的样本值之间的差异以使用残差差分脉冲码调制(RDPCM)生成残差块。在一些实例中，可使用执行二进制减法的一或多个减法器电路来形成残差生成单元204。

在模式选择单元202将CU分割为PU的实例中，每一PU可与亮度预测单元及对应色度预测单元相关联。视频编码器200及视频解码器300可支持具有各种大小的PU。如上文所指示，CU的大小可是指CU的亮度译码块的大小，且PU的大小可是指PU的亮度预测单元的大小。假设特定CU的大小为2N×2N，视频编码器200可支持用于帧内预测的2N×2N或N×N的PU大小，以及用于帧间预测的2N×2N、2N×N、N×2N、N×N或类似的对称PU大小。视频编码器20及视频解码器30还可支持用于帧间预测的2N×nU、2N×nD、nL×2N及nR×2N的PU大小的不对称分割。

在模式选择单元不进一步将CU分割为PU的实例中，每一CU可与亮度译码块及对应色度译码块相关联。如上文所述，CU的大小可是指CU的亮度译码块的大小。视频编码器200及视频解码器120可支持2N×2N，2N×N或N×2N的CU大小。

对于例如块内复制模式译码、仿射模式译码及线性模型(LM)模式译码的其它视频译码技术，作为少数实例，模式选择单元202经由与译码技术相关联的相应单元生成正被编码的当前块的预测块。在一些实例中，例如调色板模式译码，模式选择单元202可不生成预测块，而是生成指示基于所选调色板重建块的方式的语法元素。在此些模式中，模式选择单元202可将这些语法元素提供到要编码的熵编码单元220。

如上文所描述，残差生成单元204接收关于当前块及对应预测块的视频数据。然后，残差生成单元204生成当前块的残差块。为了生成残差块，残差生成单元204计算预测块与当前块之间的逐样本差异。

因此，变换处理单元206将一或多个变换应用于残差块以生成变换系数块(本文中被称作为“变换系数块”)。变换处理单元206可将各种变换应用于残差块以形成变换系数块。举例来说，变换处理单元206可将离散余弦变换(DCT)、方向变换、卡-洛(Karhunen-Loeve)变换(KLT)或概念上类似的变换应用于残差块。在一些实例中，变换处理单元206可对残差块执行多个变换，例如，主变换及次变换，例如旋转变换。在一些实例中，变换处理单元206不将变换应用于残差块。

量化单元216可量化变换系数块中的变换系数，以产生量化的变换系数块。量化单元216可根据与当前块相关联的量化参数(QP)值来量化变换系数块的变换系数。视频编码器200(例如，经由模式选择单元202)可通过调整与CU相关联的QP值来调整应用于与当前块相关联的系数块的量化程度。量化可能引入信息丢失，且因此，量化的变换系数可能具有比由变换处理单元206所产生的原始变换系数更低的精度。

逆量化单元210及逆变换处理单元212可分别将逆量化及逆变换应用于量化的变换系数块，以从变换系数块重建残差块。重建单元214可基于重建的残差块及由模式选择单元202生成的预测块来产生对应于当前块的重建块(尽管可能具有一定程度的失真)。举例来说，重建单元214可将经重建残差块的样本添加到来自由模式选择单元202生成的预测块的对应样本以产生经重建块。

滤波器单元216可对经重建块执行一或多个滤波操作。举例来说，滤波器单元216可执行解块操作以减少沿着CU的边缘的块效应伪影。如由虚线所说明，在一些实例中可跳过滤波器单元216的操作。

视频编码器200将重建块存储在DPB 218中。例如，在不需要滤波器单元224的操作的实例中，重建单元214可将重建的块存储到DPB 218。在需要滤波器单元224的操作的实例中，滤波器单元216可将经滤波的重建块存储到DPB 218。运动估计单元222及运动补偿单元224可从DPB 218检索由重建(且可能经过滤波)块形成的参考图片，以帧间预测随后编码的图片的块。另外，帧内预测单元226可使用当前图片的DPB 218中的重建块来帧内预测当前图片中的其它块。

通常，熵编码单元220可对从视频编码器200的其它功能组件接收的语法元素进行熵编码。举例来说，熵编码单元220可对来自量化单元208的经量化变换系数块进行熵编码。作为另一实例，熵编码单元220可对来自模式选择单元202的预测语法元素(例如，用于帧间预测的运动信息或用于帧内预测的帧内模式信息)进行熵编码。熵编码单元220可对作为视频数据的另一实例的语法元素执行一或多个熵编码操作，以生成熵编码数据。举例来说，熵编码单元220可对数据执行上下文自适应可变长度译码(CAVLC)操作、CABAC操作、变量到变量(V2V)长度译码操作、基于语法的上下文自适应二进制算术译码(SBAC)操作、概率区间分割熵(PIPE)译码操作，指数哥伦布编码操作，或另一类型的熵编码操作。在一些实例中，熵编码单元220可在旁路模式下操作，其中语法元素未经熵编码。

视频编码器200可输出包含重建图块或图片的块所需要的经熵编码语法元素的位流。特定来说，熵编码单元220可输出位流

关于块描述上文所描述操作。此描述应被理解为用于亮度译码块及/或色度译码块的操作。如上文所描述，在一些实例中，亮度译码块及色度译码块为CU的亮度及色度分量。在一些实例中，亮度译码块及色度译码块为PU的亮度及色度分量。

在一些实例中，不需要针对色度译码块重复关于亮度译码块执行的操作。作为一个实例，不需要重复用以识别亮度译码块的运动向量(MV)及参考图片的操作来识别用于色度块的MV及参考图片。而是，可缩放用于亮度译码块的MV以确定用于色度块的MV，且参考图片可为相同的。作为另一实例，帧内预测过程对于亮度译码块及色度译码块可为相同的。

以此方式，视频编码器200表示经配置以对视频数据进行编码的装置的实例，所述装置包含存储器，其经配置以存储视频数据；以及一或多个处理单元，其实施在电路中且经配置以构造用于所述视频数据的当前色度块的帧内预测候选列表，所述帧内预测候选列表指示用于所述当前色度块的候选帧内预测模式，其中所述帧内预测候选列表指示允许的亮度(luminance/luma)候选帧内预测模式的子集，确定由用于所述当前色度块的所述帧内预测候选列表所指示的所述候选帧内预测模式中的每一者的成本值，及使用由所述帧内预测候选列表根据所述成本值所指示的所述候选帧内预测模式中的一者生成用于所述当前色度块的预测块。

图11为说明可执行本发明的技术的实例性视频解码器300的框图。图11是出于解释的目的而提供且不限制本发明中广泛例示及描述的技术。出于解释的目的，本发明描述根据JEM及HEVC的技术来描述视频解码器300。然而，本发明的技术可由经配置成其它视频译码标准的视频译码装置来执行。

在图11的实例中，视频解码器300包含经译码图片缓冲器(CPB)存储器320、熵译码单元302、预测处理单元304、逆量化单元306、逆变换处理单元308、重建单元310、滤波器单元312及经解码图片缓冲(DPB)314。预测处理单元304包含运动补偿单元316及帧内预测单元318。预测处理单元304可包含用以根据其它预测模式执行预测的加法单元。作为实例，预测处理单元304可包含调色板单元、块内复制单元(其可形成运动补偿单元318的部分)、仿射单元、线性模型(LM)单元，等等。在其它实例中，内容解码器300可包含更多、更少或不同的功能组件。

CPB存储器320可存储视频数据，例如经编码视频位流，以由视频解码器300的组件解码。例如，可从计算机可读媒体110(图1)获得存储在CPB存储器320中的视频数据。CPB存储器320可包含CPB，其存储来自经编码视频位流的经编码视频数据(例如，语法元素)。此外，CPB存储器320可存储除了译码图片的语法元素之外的视频数据，例如表示来自视频解码器300的各种单元的输出的临时数据。DPB 314通常存储经解码图片，当对经编码视频位流的后续数据或图片进行解码时，视频解码器300可输出所述经解码图片及/或将其用作参考视频数据。CPB存储器320及DPB 314可由各种存储器装置中的任一者形成，例如，动态随机存取存储器(DRAM)，包含同步DRAM(SDRAM)、磁阻式RAM(MRAM)、电阻式RAM(RRAM)或其它类型的存储器装置。CPB存储器320及DPB 314可由相同存储器装置或单独的存储器设备提供。在各种实例中，CPB存储器320可与视频编码器300的其它组件在芯片上，或相对于那些组件在芯片外。

另外或替代地，在一些实例中，视频解码器300可从存储器120(图1)检索经译码视频数据。也就是说，存储器120可如上文所述将数据存储在CPB存储器320内。同样，当视频解码器300的一些或全部功能以软件实施以由视频解码器300的处理电路执行时，存储器120可存储欲由视频解码器300执行的指令。

图11中所展示的各种单元经说明以辅助理解由视频编码器300执行的操作。这些单元可实施为为固定功能电路，可编程电路或其组合。类似于图10，固定功能电路是指提供特定功能性的电路，且预设在可执行的操作上。可编程电路是指可编程以执行各种任务且在可执行的操作中提供灵活的功能的电路。例如，可编程电路可执行软件或固件，其致使可编程电路以由软件或固件的指令定义的方式操作。固定功能电路可执行软件指令(例如，接收参数或输出参数)，但固定功能电路执行的操作类型通常为不可变的。在一些实例中，单元中的一或多者可为不同的电路块(固定功能或可编程)，且在一些实例中，一或多个单元可为集成电路。

视频解码器300可包含ALU、EFU、数字电路、模拟电路及/或由可编程电路形成的可编程核心。在视频解码器300的操作由在可编程电路上执行的软件执行的实例中，片上或片外存储器可存储视频解码器300接收及执行的软件的指令(例如，目标代码)。

熵解码单元302可从CPB接收经编码视频数据且对视频数据进行熵解码以再现语法元素。预测处理单元304、逆量化单元306、逆变换处理单元308、重建单元310及滤波器单元312可基于从位流提取的语法元素生成经解码视频数据。

通常，视频解码器300逐块地重建图片。视频解码器300可单独地对每一块执行重建操作(其中当前正被重建(即，经解码)的块可被称作为“当前块”)。

熵解码单元302可对定义经量化变换系数块的经量化变换系数的语法元素以及变换信息(例如，量化参数(QP)及/或变换模式指示)进行熵解码。逆量化单元306可使用与量化的变换系数块相关联的QP来确定量化程度，且同样地确定要应用的逆量化单元306的逆量化的程度。逆量化单元306可例如执行按位左移操作以逆量化经量化变换系数。因此，逆量化单元306可形成包含变换系数的变换系数块。

在逆量化单元306形成变换系数块之后，逆变换处理单元308可将一或多个逆变换应用于变换系数块以生成与当前块相关联的残差块。举例来说，逆变换处理单元308可将逆DCT、逆整数变换、逆卡-洛(Karhunen-Loeve)变换(KLT)、逆旋转变换、逆向变换或另一逆变换应用于系数块。

此外，预测处理单元304根据由熵解码单元302进行熵解码的预测信息语法元素来生成预测块。举例来说，如果预测信息语法元素指示当前块为帧间预测的，那么运动补偿单元316可生成预测块。在此状况下，预测信息语法元素可指示DPB 314中的参考图片以及运动矢量，从所述参考图片检索参考块，所述运动矢量相对于当前块在当前图片中的位置识别参考块在参考图片中的位置。运动补偿单元316可通常以基本上类似于关于运动补偿单元224(图10)所描述的方式的方式执行帧间预测过程。

作为另一实例，如果预测信息语法元素指示当前块为帧内预测的，那么帧内预测单元318可根据由预测信息语法元素指示的帧内预测模式生成预测块。此外，帧内预测单元318可通常以基本上类似于关于运动补偿单元226(图10)所描述的方式的方式执行帧间预测过程。帧内预测单元318可从DPB 314检索相邻于当前块的样本的数据。

当预测处理单元304确定色度块为帧内预测时，熵解码单元302可不对用于色度块的帧内预测模式的指示进行解码。相反，预测处理单元304可使用位流的其它信息来导出帧内预测模式。

根据本发明的技术，为了导出用于色度块的帧内预测模式，预测处理单元304(或其帧内预测单元318)可构造用于色度块的帧内预测候选列表。帧内预测候选列表可包含用于色度块的候选帧内预测模式。然后，预测处理单元304可针对用于色度块的帧内预测候选列表中的候选帧内预测模式中的每一者计算绝对变换差和(SATD)值。然后，预测处理单元304可将提供具有最低SATD值的帧内预测模式的指示到帧内预测单元318以致使帧内预测单元318生成用于色度块的预测块。

重建单元310可使用预测块及残差块来重建当前块。举例来说，重建单元310可将残差块的样本添加到预测块的对应样本以重建当前块。

滤波器单元312可对经重建块执行一或多个滤波操作。举例来说，滤波器单元312可执行解块操作以减少沿着重建块的边缘的块效应伪影。如虚线所说明，滤波器单元312的操作不一定在所有实例中执行。

视频解码器300可将重建块存储在DPB 314中。如上文所论述，DPB 314可将例如用于帧内预测的当前图片的样本及用于后续运动补偿的先前经解码图片的参考信息提供到预测处理单元304。此外，视频解码器300可从DPB输出经解码图片以用于随后呈现在例如图1的显示装置118的显示装置上。

以此方式，视频解码器300表示视频解码装置的实例，所述视频解码装置包含存储器，其经配置以存储视频数据；以及一或多个处理单元，其实施在电路中且经配置以构造用于所述视频数据的当前色度块的帧内预测候选列表，所述帧内预测候选列表指示用于所述当前色度块的候选帧内预测模式，其中所述帧内预测候选列表指示允许的亮度(luminance/luma)候选帧内预测模式的子集，确定由用于所述当前色度块的所述帧内预测候选列表所指示的所述候选帧内预测模式中的每一者的成本值，及使用由所述帧内预测候选列表根据所述成本值所指示的所述候选帧内预测模式中的一者生成用于所述当前色度块的预测块。

图12为说明用于对当前块进行编码的实例方法的流程图。当前块可包括当前CU。尽管关于视频编码器200(图1及10)进行描述，但应理解其它装置可经配置以执行类似于图12的方法的方法。

在此实例中，视频编码器200最初构建用于当前色度块的帧内预测候选列表(344)。帧内预测候选列表指示(例如，包含)用于色度块的候选帧内预测模式。在一些实例中，视频编码器200可将一或多个默认帧内预测模式添加到帧内预测候选列表，其中默认帧内预测模式可包含DC模式、平面模式、水平模式及垂直模式。在一些实例中，为构造帧内预测候选列表，视频编码器200可将第一组一或多个角度帧内预测模式添加到对应于相邻于当前色度块的一或多个块或与当前色度块共同定位的明度块的角度帧内预测模式的帧内预测候选列表，且然后将第二组一或多个角度帧内预测模式添加到帧内预测候选列表，第二组一或多个角度帧内预测模式中的每一者具有接近于第一组的帧内预测模式中的至少一者的角度的角度(其中接近可为例如在一个角度单位内，如图5中所展示)。在一些实例中，视频编码器200可将至少一个直接帧内预测模式添加到帧内预测候选列表，且将相邻于当前色度块的块的帧内预测模式添加到帧内预测候选列表。

然后，视频编码器200可计算成本值，例如，候选列表中的帧内预测模式候选者的绝对变换差和(SATD值)(346)。举例来说，视频编码器200可对与当前色度块共同定位的重建亮度块进行下采样。在一些实例中，视频编码器200可例如根据亮度块或色度块的大小从多个不同的可用下采样比率中选择亮度块的下采样比率。在一些实例中，视频编码器200可相对于由模板指示的一或多个相邻色度块而非由下采样亮度块的生成的参考块计算SATD值。然后，对于帧内预测候选列表中的每一候选帧内预测模式，视频编码器200可使用对应于下采样的重建亮度块的候选帧内预测模式来生成预测块，且计算所生成预测块与下采样重建亮度块或所生成参考块之间的候选帧内预测模式的SATD值。

然后，视频编码器200可选择具有最低SATD值的帧内预测候选者作为当前色度块的帧内预测模式(348)。然后，视频编码器200预测当前色度块(350)。举例来说，视频编码器200可使用所选帧内预测模式形成当前块的预测块。然后，视频编码器200可计算当前块的残差块(352)。为了计算残差块，视频编码器200可计算原始未编码块与当前块的预测块之间的差异。然后，视频编码器200可对残差块的系数进行变换及量化(354)。接下来，视频编码器200可对残差块的经量化变换系数进行扫描(356)。在扫描期间或在扫描之后，视频编码器200可对系数进行熵编码(358)。举例来说，视频编码器200可使用CAVLC或CABAC对系数进行编码。然后，视频编码器200可输出块的熵译码数据(360)。

以此方式，图12的方法表示对视频数据的色度块进行编码的方法的实例，其包含构造视频数据的当前色度块的帧内预测候选列表，所述帧内预测候选列表指示用于所述当前色度块的候选帧内预测模式，其中所述帧内预测候选列表指示允许的亮度(luminance/luma)候选帧内预测模式的子集；确定由用于所述当前色度块的所述帧内预测候选列表所指示的所述候选帧内预测模式中的每一者的成本(例如，绝对变换差和(SATD))值；及使用由所述帧内预测候选列表根据所述成本值所指示的所述候选帧内预测模式中的一者生成用于所述当前色度块的预测块。视频编码器200还可使用所生成的预测块来解码并重建当前色度块以用于后续预测同一图片中的其它块，且因此，此方法还可描述为解码由视频编码器200执行的视频数据的方法。

图13为说明用于对当前视频数据块进行解码的实例方法的流程图。当前块可包括当前CU。尽管关于视频解码器300(图1及11)进行描述，但应理解其它装置可经配置以执行类似于图13的方法的方法。

在此实例中，视频解码器300最初构建用于当前色度块的帧内预测候选列表(364)。帧内预测候选列表指示(例如，包含)用于色度块的候选帧内预测模式。在一些实例中，视频解码器300可将一或多个默认帧内预测模式添加到帧内预测候选列表，其中默认帧内预测模式可包含DC模式、平面模式、水平模式及垂直模式。在一些实例中，为构造帧内预测候选列表，视频解码器300可将第一组一或多个角度帧内预测模式添加到对应于相邻于当前色度块的一或多个块或与当前色度块共同定位的明度块的角度帧内预测模式的帧内预测候选列表，且然后将第二组一或多个角度帧内预测模式添加到帧内预测候选列表，第二组一或多个角度帧内预测模式中的每一者具有接近于第一组的帧内预测模式中的至少一者的角度的角度(其中接近可为例如在一个角度单位内，如图5中所展示)。在一些实例中，视频解码器300可将至少一个直接帧内预测模式添加到帧内预测候选列表，且将相邻于当前色度块的块的帧内预测模式添加到帧内预测候选列表。

然后，视频解码器300可计算成本值，例如，候选列表中的帧内预测模式候选者的绝对变换差和(SATD值)(366)。举例来说，视频解码器300可对与当前色度块共同定位的重建亮度块进行下采样。在一些实例中，视频解码器300可例如根据亮度块或色度块的大小从多个不同的可用下采样比率中选择亮度块的下采样比率。在一些实例中，视频解码器300可相对于由模板指示的一或多个相邻色度块而非由下采样亮度块的生成的参考块计算SATD值。然后，对于帧内预测候选列表中的每一候选帧内预测模式，视频解码器300可使用对应于下采样的重建亮度块的候选帧内预测模式来生成预测块，且计算所生成预测块与下采样重建亮度块或所生成参考块之间的候选帧内预测模式的SATD值。

然后，视频解码器300可选择具有最低SATD值的帧内预测候选者作为当前色度块的帧内预测模式(368)。视频解码器300可接收关于当前块的经熵译码数据，例如经熵译码预测信息及关于对应于当前块的残差块的系数的经熵译码数据(370)。视频解码器300可对经熵译码数据进行熵解码以确定关于当前块的预测信息且再现残差块的系数(372)。视频解码器300可例如使用由关于当前块的预测信息指示的帧内或帧间预测模式来预测当前块(374)，以计算用于当前块的预测块。然后，视频解码器300可对所再现的系数进行逆扫描(376)，以形成经量化的变换系数的块。然后，视频解码器300可对系数进行逆量化及逆变换以产生残差块(378)。视频解码器300可最终通过组合预测块及残差块来对当前块进行解码(380)。

以此方式，图13的方法表示对视频数据的色度块进行解码的方法的实例，其包含构造视频数据的当前色度块的帧内预测候选列表，所述帧内预测候选列表指示用于所述当前色度块的候选帧内预测模式，其中所述帧内预测候选列表指示允许的亮度(luminance/luma)候选帧内预测模式的子集；确定由用于所述当前色度块的所述帧内预测候选列表所指示的所述候选帧内预测模式中的每一者的成本(例如，绝对变换差和(SATD))值；及使用由所述帧内预测候选列表根据所述成本值所指示的所述候选帧内预测模式中的一者生成用于所述当前色度块的预测块。

应认识到，取决于实例，本文中所描述的诸技术中的任一者的特定动作或事件可以不同顺序执行，可经添加、合并或完全省去(例如，并非所有所描述动作或事件为实践技术所必需的)。此外，在某些实例中，可(例如)经由多线程处理、中断处理或多处理器同时地而非依序地执行动作或事件。

在一或多个实例中，所描述的功能可以硬件、软件、固件或其任一组合来实施。如果以软件予以实施，那么所述功能可作为一或多个指令或代码而存储于计算机可读媒体上或经由计算机可读媒体进行发射且由基于硬件处理单元执行。计算机可读媒体可包含计算机可读存储媒体，其对应于例如数据存储媒体的有形媒体，或包含促进(例如)根据通信协议将计算机程序自一个位置传送到另一位置的任一媒体的通信媒体。以此方式，计算机可读媒体通常可对应于(1)非暂时性的有形计算机可读存储媒体或(2)例如信号或载波的通信媒体。数据存储媒体可为可由一或多个计算机或一或多个处理器存取以检索用于实施本发明中所描述的技术的指令、代码及/或数据结构的任何可用媒体。计算机程序产品可包含计算机可读媒体。

通过实例的方式且非限制性，此些计算机可读存储媒体可包括RAM、ROM、EEPROM、CD-ROM或其它光学磁盘存储装置、磁盘存储装置或其它磁性存储装置、快闪存储器或可用于以指令或数据结构的形式存储所要程序代码且可由计算机存取的其它媒体。此外，可将任何连接适当地称为计算机可读媒体。举例来说，如果使用同轴电缆、光纤电缆、双绞线、数字订户线(DSL)或例如红外线、无线电及微波等无线技术从网站、服务器或其它远程源发射指令，那么所述同轴电缆、光纤电缆、双绞线、DSL或例如红外线、无线电及微波等无线技术皆包含于媒体的定义中。然而，应理解计算机可读存储媒体及数据存储媒体不包含连接、载波、信号或其它暂时性媒体，但替代地是针对非暂时性、有形存储媒体。如本文中所使用，磁盘及光盘包含光盘(CD)、激光光盘、光学光盘、数字多功能光盘(DVD)、软盘及蓝光光盘，其中磁盘通常以磁性方式再现数据，而光盘通过激光以光学方式再现数据。上述各项的组合也应包含在计算机可读媒体的范围内。

指令可由一或多个处理器执行，例如一或多个数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、场可编程门阵列(FPGA)或其它等效集成或离散逻辑电路。因此，如本文中所使用的术语“处理器”可指前述结构或适于实施本文中所描述的技术的任何其它结构中的任一者。另外，在一些方面中，本文中所描述的功能性可提供在经配置以用于编码及解码或并入于组合式编解码器中的专用硬件及/或软件模块内。此外，技术可以一或多个电路或逻辑元件来完全实施。

本发明的技术可以广泛各种装置或装备(包含无线手机、集成电路(IC)或IC组(例如，芯片组))实施。各种组件、模块或单元在本发明中经描述以强调经配置以执行所揭示技术的装置的功能方面，而未必需要由不同硬件单元实现。确切来说，如上文所描述，各种单元可以编解码硬件单元组合或通过交互操作硬件单元(包含如上文所描述的一或多个处理器)的集合结合适合软件及/或固件提供。

已描述各种实例。这些及其它实例在以下权利要求书的范围内。

Claims

1.一种对视频数据进行解码的方法，所述方法包括：

构造用于视频数据的当前色度块的帧内预测候选列表，所述帧内预测候选列表指示用于所述当前色度块的候选帧内预测模式，其中所述帧内预测候选列表指示允许的亮度(luminance/luma)候选帧内预测模式的子集；

确定用于由所述当前色度块的所述帧内预测候选列表指示的所述候选帧内预测模式中的每一者的成本值；及

使用由所述帧内预测候选列表根据所述成本值指示的所述候选帧内预测模式中的一者来生成用于所述当前色度块的预测块。

2.根据权利要求1所述的方法，其中所述成本值包括绝对变换差和SATD值。

3.根据权利要求1所述的方法，其中生成所述预测块包括：使用由具有所述最低成本值的所述帧内预测候选列表指示的所述候选帧内预测模式中的一者来生成所述预测块。

4.根据权利要求1所述的方法，其中计算所述成本值包括：针对所述当前色度块计算用于所述帧内预测候选列表的所述成本值一次，而无需修改所述帧内预测候选列表。

5.根据权利要求1所述的方法，其中构造所述帧内预测候选列表包括：将一或多个默认帧内预测模式添加到所述帧内预测候选列表，所述默认帧内预测模式包括DC模式、平面模式、水平模式及垂直模式。

6.根据权利要求1所述的方法，其中构造所述帧内预测候选列表包括：

将第一组一或多个角度帧内预测模式添加到对应于相邻于所述当前色度块的一或多个块或与所述当前色度块共同定位的明度块的角度帧内预测模式的所述帧内预测候选列表；及

将第二组一或多个角度帧内预测模式添加到所述帧内预测候选列表，所述第二组一或多个角度帧内预测模式中的每一者具有接近于所述第一组的所述帧内预测模式中的至少一者的角度的角度。

7.根据权利要求6所述的方法，其中添加所述第二组一或多个角度帧内预测模式包括：将角度帧内预测模式添加到所述帧内预测候选列表，所述帧内预测候选列表具有在所述第一组的所述帧内预测模式中的至少一者的角度的一个角度单位内的角度。

8.根据权利要求1所述的方法，其中构造所述帧内预测候选列表包括：根据与所述当前色度块共同定位的明度块的帧内预测模式、所述当前色度块的大小、用于变换所述当前色度块的样本的变换类型或用于所述当前色度块的经解码变换系数中的一或多者来确定候选帧内预测模式以添加到所述帧内预测候选列表。

9.根据权利要求1所述的方法，其中构造所述帧内预测候选列表包括：

将至少一个直接帧内预测模式添加到所述帧内预测候选列表；及

将相邻于所述当前色度块的块的帧内预测模式添加到所述帧内预测候选列表。

10.根据权利要求9所述的方法，其中所述相邻块包括左相邻块、上相邻块、左上相邻块、右上相邻块，或左下相邻块中的一者。

11.根据权利要求1所述的方法，其中计算所述成本值包括：

对与所述当前色度块共同定位的重建亮度块进行下采样；及

对于所述帧内预测候选列表中的每一候选帧内预测模式：

使用对应于所述下采样的重建亮度块的所述候选帧内预测模式生成预测块；及

计算所述所生成的预测块与所述下采样的重建亮度块之间的所述候选帧内预测模式的所述成本值。

12.根据权利要求11所述的方法，其中下采样包括：从多个不同的可用下采样比率选择用于所述亮度块的下采样比率。

13.根据权利要求1所述的方法，其中计算所述成本值包括：

从由模板指示的一或多个相邻色度块生成参考块；及

对于所述帧内预测候选列表中的每一候选帧内预测模式：

使用所述候选帧内预测模式生成所述参考块的预测块；及

计算所述所生成的预测块与所述参考块之间的所述候选帧内预测模式的所述成本值。

14.根据权利要求1所述的方法，其进一步包括：对语法元素进行解码，所述语法元素具有指示将使用跨分量线性模式CCLM还是解码器侧导出直接模式DDM来预测所述当前色度块的值。

15.根据权利要求14所述的方法，其中所述语法元素的所述值进一步指示是否使用来自共同定位的亮度块的直接模式来预测所述当前色度块。

16.根据权利要求1所述的方法，其中构造所述帧内预测候选列表由将跨分量线性模式CCLM及导出方向模式添加到所述帧内预测候选列表组成。

17.根据权利要求1所述的方法，其中生成用于所述当前色度块的所述预测块包括：使用具有所述最低成本值的所述帧内预测候选列表来生成用于所述当前色度块的第一子块的第一预测块，所述方法进一步包括：使用不同的帧内预测模式来生成用于所述当前色度块的第二子块的第二预测块。

18.一种用于对视频数据进行解码的视频解码装置，所述视频解码装置包括：

存储器，其用于存储视频数据；及

一或多个处理器，其实施在电路中且经配置以：

构造用于所述视频数据的当前色度块的帧内预测候选列表，所述帧内预测候选列表指示用于所述当前色度块的候选帧内预测模式，其中所述帧内预测候选列表指示允许的亮度(luminance/luma)候选帧内预测模式的子集；

19.根据权利要求18所述的视频解码装置，其中所述一或多个处理器经配置以针对所述当前色度块计算用于所述帧内预测候选列表的所述成本值一次，而无需修改所述帧内预测候选列表。

20.根据权利要求18所述的视频解码装置，其中为了构造所述帧内预测候选列表，所述一或多个处理器经配置以将一或多个默认帧内预测模式添加到所述帧内预测候选列表，所述默认帧内预测模式包括DC模式、平面模式、水平模式及垂直模式。

21.根据权利要求18所述的视频解码装置，其中为了构造所述帧内预测候选列表，所述一或多个处理器经配置以：

22.根据权利要求18所述的视频解码装置，其中为了构造所述帧内预测候选列表，所述一或多个处理器经配置以根据与所述当前色度块共同定位的明度块的帧内预测模式、所述当前色度块的大小、用于变换所述当前色度块的样本的变换类型或用于所述当前色度块的经解码变换系数中的一或多者来确定候选帧内预测模式以添加到所述帧内预测候选列表。

23.根据权利要求18所述的视频解码装置，其中为了构造所述帧内预测候选列表，所述一或多个处理器经配置以：

24.根据权利要求18所述的视频解码装置，其中为了计算所述成本值，所述一或多个处理器经配置以：

对与所述当前色度块共同定位的重建亮度块进行下采样；及

对于所述帧内预测候选列表中的每一候选帧内预测模式：

25.根据权利要求18所述的视频解码装置，其中为了计算所述成本值，所述一或多个处理器经配置以：

从由模板指示的一或多个相邻色度块生成参考块；及

对于所述帧内预测候选列表中的每一候选帧内预测模式：

使用所述候选帧内预测模式生成所述参考块的预测块；及

26.根据权利要求18所述的视频解码装置，其中所述一或多个处理器经配置以使用具有所述最低成本值的所述帧内预测候选列表来生成用于所述当前色度块的第一子块的第一预测块，及使用不同的帧内预测模式来生成用于所述当前色度块的第二子块的第二预测块。

27.根据权利要求18所述的视频解码装置，其进一步包括显示器，所述显示器经配置以显示所述视频数据的图片。

28.根据权利要求18所述的视频解码装置，其中媒体装置包括摄像机、计算机、移动装置、广播接收器装置或机顶盒中的一或多者。

29.一种用于对视频数据进行解码的装置，所述装置包括：

用于构造用于视频数据的当前色度块的帧内预测候选列表的装置，所述帧内预测候选列表指示用于所述当前色度块的候选帧内预测模式，其中所述帧内预测候选列表指示允许的亮度(luminance/luma)候选帧内预测模式的子集；

用于确定用于由所述当前色度块的所述帧内预测候选列表指示的所述候选帧内预测模式中的每一者的成本值的装置；及

用于使用由所述帧内预测候选列表根据所述成本值指示的所述候选帧内预测模式中的一者来生成用于所述当前色度块的预测块的装置。

30.一种上面储存有指令的计算机可读存储媒体，所述指令在被执行时致使处理器：

确定用于所述当前色度块的所述帧内预测候选列表中的所述候选帧内预测模式中的每一者的绝对变换差和SATD值；及