CN117546465A

CN117546465A - 视频译码中的合并候选重新排序

Info

Publication number: CN117546465A
Application number: CN202280044517.3A
Authority: CN
Inventors: 黄晗; V·谢廖金; M·卡切夫维茨
Original assignee: Qualcomm Inc
Current assignee: Qualcomm Inc
Priority date: 2021-06-29
Filing date: 2022-06-01
Publication date: 2024-02-09
Also published as: US20220417500A1; KR20240026144A; EP4364408A1; BR112023026802A2; TW202306386A

Abstract

视频译码器被配置为：构造合并候选的合并候选列表，其中，合并候选列表具有N1个候选，N1为正整数值；对合并候选列表中的合并候选进行重新排序以创建经重新排序的合并候选列表；减少经重新排序的合并候选列表以创建输出合并候选列表，其中，输出合并候选列表具有N2个候选，其中，N2小于N1；以及使用输出合并候选列表来对视频数据的块进行译码。

Description

视频译码中的合并候选重新排序

本申请要求享有于2022年5月31日提交的美国专利申请No.17/804,687以及于2021年6月29日递交的美国临时申请No.63/216,432的优先权，上述申请中的每份申请的全部内容通过引用的方式并入本文中。于2022年5月31日提交的美国专利申请No.17/804,687要求享有于2021年6月29日递交的美国临时申请No.63/216,432的权益。

技术领域

本公开内容涉及视频编码和视频解码。

背景技术

数字视频能力可以被合并到各种各样的设备中，包括数字电视机、数字直播系统、无线广播系统、个人数字助理(PDA)、膝上型计算机或台式计算机、平板计算机、电子书阅读器、数字相机、数字记录设备、数字媒体播放器、视频游戏设备、视频游戏控制台、蜂窝或卫星无线电电话(所谓的“智能电话”)、视频电话会议设备、视频流设备等。数字视频设备实现视频译码技术，比如在通过MPEG-2、MPEG-4、ITU-T H.263、ITU-T H.264/MPEG-4(第10部分，高级视频译码(AVC))、ITU-T H.265/高效率视频译码(HEVC)、ITU-T H.266/通用视频译码(VVC)所定义的标准和此类标准的扩展以及专有视频编解码器/格式(比如由开放媒体联盟开发的AOMedia Video 1(AV1))中描述的那些技术。通过实现这样的视频译码技术，视频设备可以更加高效地发送、接收、编码、解码和/或存储数字视频信息。

视频译码技术包括空间(图片内(intra-picture))预测和/或时间(图片间(inter-picture))预测以减少或去除在视频序列中固有的冗余。对于基于块的视频译码，视频切片(例如，视频图片或视频图片的一部分)可以被划分为视频块，视频块还可以被称为译码树单元(CTU)、译码单元(CU)和/或译码节点。图片的经帧内译码(I)的切片中的视频块是使用相对于同一图片中的相邻块中的参考样本的空间预测来编码的。图片的经帧间译码(P或B)的切片中的视频块可以使用相对于同一图片中的相邻块中的参考样本的空间预测或者相对于其它参考图片中的参考样本的时间预测。图片可以被称为帧，并且参考图片可以被称为参考帧。

发明内容

通常，本公开内容描述用于视频编解码器中的帧间预测的技术。更具体地，本公开内容描述用于合并候选列表重新排序的技术。视频译码器可以被配置为构造具有第一数量(N1)的候选的合并候选列表，并且然后根据一些预定的重新排序标准来对列表中的候选进行重新排序。重新排序标准可以是基于帧间预测的成本值和/或模式(例如，双预测)的。然后，视频译码器可以对经重新排序的合并候选列表进行截取，以具有小于第一数量的候选的第二数量(N2)的候选(例如，N2<N1)。以这种方式，更有可能使用的候选位于合并候选项列表的开始处，并且因此更有可能利用较低的索引来用信号通知。因此，本公开内容的技术可以改善译码效率和/或减少失真。

在一个示例中，一种方法包括：构造合并候选的合并候选列表，其中，合并候选列表具有N1个候选，N1为正整数值；对合并候选列表中的合并候选进行重新排序以创建经重新排序的合并候选列表；减少经重新排序的合并候选列表以创建输出合并候选列表，其中，输出合并候选列表具有N2个候选，其中，N2小于N1；以及使用输出合并候选列表来对视频数据的块进行译码。

在另一示例中，一种设备包括存储器和一个或多个处理器，一个或多个处理器被配置为：构造合并候选的合并候选列表，其中，合并候选列表具有N1个候选，N1为正整数值；对合并候选列表中的合并候选进行重新排序以创建经重新排序的合并候选列表；减少经重新排序的合并候选列表以创建输出合并候选列表，其中，输出合并候选列表具有N2个候选，其中，N2小于N1；以及使用输出合并候选列表来对视频数据的块进行译码。

在另一示例中，一种设备包括：用于构造合并候选的合并候选列表的单元，其中，合并候选列表具有N1个候选，N1为正整数值；用于对合并候选列表中的合并候选进行重新排序以创建经重新排序的合并候选列表的单元；用于减少经重新排序的合并候选列表以创建输出合并候选列表的单元，其中，输出合并候选列表具有N2个候选，其中，N2小于N1；以及用于使用输出合并候选列表来对视频数据的块进行译码的单元。

在另一示例中，一种计算机可读存储介质被编码有指令，指令在被执行时使得可编程处理器进行以下操作：构造合并候选的合并候选列表，其中，合并候选列表具有N1个候选，N1为正整数值；对合并候选列表中的合并候选进行重新排序以创建经重新排序的合并候选列表；减少经重新排序的合并候选列表以创建输出合并候选列表，其中，输出合并候选列表具有N2个候选，其中，N2小于N1；以及使用输出合并候选列表来对视频数据的块进行译码。

在附图和以下描述中阐述一个或多个示例的细节。根据说明书、附图和权利要求，其它特征、目的和优势将是显而易见的。

附图说明

图1是示出可以执行本公开内容的技术的示例视频编码和解码系统的方块图。

图2是示出示例空间合并候选的概念图。

图3是示出用于时间合并候选的运动矢量缩放的概念图。

图4是示出用于时间合并候选的候选位置的概念图。

图5是示出双边匹配的示例的概念图。

图6是示出在双向光流中使用的扩展译码单元区域的概念图。

图7是示出在初始运动矢量周围的搜索区域上的模板匹配性能的概念图。

图8是示出参考列表0和参考列表1中的模板和模板的参考样本的概念图。

图9是使用子块的运动信息来示出用于具有子块运动的块的模板和模板的参考样本的概念图。

图10是示出可以执行本公开内容的技术的示例视频编码器的方块图。

图11是示出可以执行本公开内容的技术的示例视频解码器的方块图。

图12是示出根据本公开内容的技术的用于对当前块进行编码的示例方法的流程图。

图13是示出根据本公开内容的技术的用于对当前块进行解码的示例方法的流程图。

图14是示出根据本公开内容的技术的用于对当前块进行编码的另一示例方法的流程图。

图15是示出根据本公开内容的技术的用于对当前块进行解码的另一示例方法的流程图。

具体实施方式

视频译码(例如，视频编码和/或视频解码)通常涉及根据同一图片中的视频数据的已经译码的块(例如，帧内预测)或不同图片中的视频数据的已经译码的块(例如，帧间预测)，来预测视频数据的块。在一些情况下，视频编码器还通过将预测块与原始块进行比较来计算残差数据。因此，残差数据表示预测块与原始块之间的差。为了减少用信号通知残差数据所需的比特数量，视频编码器对残差数据进行变换和量化，并且在经编码的比特流中用信号通知经变换和量化的残差数据。通过变换和量化过程实现的压缩可能是有损的，意味着变换和量化过程可能在经解码的视频数据中引入失真。

视频解码器对残差数据进行解码并且将其加到预测块，以产生经重构的视频块，经重构的视频块与仅预测块相比与原始视频块匹配得更加紧密。由于通过对残差数据的变换和量化引入的损失，第一经重构的块可能具有失真或伪影。一种常见类型的伪影或失真被称为块效应，其中用于对视频数据进行译码的块的边界是可见的。

为了进一步改善经解码的视频的质量，视频解码器可以对经重构的视频块执行一个或多个滤波操作。这些滤波操作的示例包括解块滤波、样本自适应偏移(SAO)滤波和自适应环路滤波(ALF)。用于这些滤波操作的参数可以由视频编码器确定并且在经编码的视频比特流中显式地用信号通知，或者可以由视频解码器隐式地确定而不需要在经编码的视频比特流中显式地用信号通知参数。

本公开内容的技术涉及视频编解码器中的帧间预测，并且更具体地，涉及合并候选列表重新排序。视频译码器可以被配置为构造具有第一数量(N1)的候选的合并候选列表，并且然后根据一些预定的重新排序标准来对列表中的候选进行重新排序。重新排序标准可以是基于帧间预测的成本值和/或模式(例如，双预测)的。然后，视频译码器可以对经重新排序的合并候选列表进行截取，以具有小于第一数量的候选的第二数量(N2)的候选(例如，N2<N1)。以这种方式，更有可能使用的候选位于合并候选项列表的开始处，并且因此更有可能利用较低的索引来用信号通知。因此，本公开内容的技术可以改善译码效率和/或减少失真。

图1是示出可以执行本公开内容的技术的示例视频编码和解码系统100的方块图。本公开内容的技术通常涉及对视频数据进行译码(编码和/或解码)。通常，视频数据包括用于处理视频的任何数据。因此，视频数据可以包括原始的未经编码的视频、经编码的视频、经解码(例如，经重构)的视频、以及视频元数据(比如信令数据)。

如图1中所示，在该示例中，系统100包括源设备102，源设备102提供要由目的地设备116进行解码和显示的经编码的视频数据。特别是，源设备102经由计算机可读介质110向目的地设备116提供视频数据。源设备102和目的地设备116可以包括各种各样的设备中的任何设备，包括台式计算机、笔记本计算机(即，膝上型计算机)、移动设备、平板计算机、机顶盒、比如智能电话之类的电话手机、电视机、相机、显示设备、数字媒体播放器、视频游戏控制台、视频流式传输设备、广播接收机设备等。在一些情况下，源设备102和目的地设备116可以被配备用于无线通信，并且因此可以被称为无线通信设备。

在图1的示例中，源设备102包括视频源104、存储器106、视频编码器200以及输出接口108。目的地设备116包括输入接口122、视频解码器300、存储器120以及显示设备118。根据本公开内容，源设备102的视频编码器200和目的地设备116的视频解码器300可以被配置为应用用于合并候选重新排序的技术。因此，源设备102表示视频编码设备的示例，而目的地设备116表示视频解码设备的示例。在其它示例中，源设备和目的地设备可以包括其它组件或布置。例如，源设备102可以从比如外部相机之类的外部视频源接收视频数据。同样，目的地设备116可以与外部显示设备对接，而不是包括集成显示设备。

如图1所示的系统100仅是一个示例。通常，任何数字视频编码和/或解码设备可以执行用于合并候选重新排序的技术。源设备102和目的地设备116仅是这样的译码设备的示例，其中，源设备102生成经译码的视频数据以用于传输给目的地设备116。本公开内容将“译码”设备称为执行对数据的译码(例如，编码和/或解码)的设备。因此，视频编码器200和视频解码器300表示译码设备的示例，特别是，分别表示视频编码器和视频解码器。在一些示例中，源设备102和目的地设备116可以以基本上对称的方式进行操作，使得源设备102和目的地设备116中的每者都包括视频编码和解码组件。因此，系统100可以支持在源设备102和目的地设备116之间的单向或双向视频传输，例如，以用于视频流式传输、视频回放、视频广播或视频电话。

通常，视频源104表示视频数据(即，原始的未经编码的视频数据)的源，并且将视频数据的顺序的一系列图片(还被称为“帧”)提供给视频编码器200，视频编码器200对用于图片的数据进行编码。源设备102的视频源104可以包括视频捕获设备，比如摄像机、包含先前捕获的原始视频的视频存档单元、和/或用于从视频内容提供者接收视频的视频馈送接口。作为另外的替代方式，视频源104可以生成基于计算机图形的数据作为源视频，或者生成实时视频、存档视频和计算机生成的视频的组合。在每种情况下，视频编码器200可以对捕获的、预捕获的或计算机生成的视频数据进行编码。视频编码器200可以将图片从所接收的次序(有时被称为“显示次序”)重新排列为用于译码的译码次序。视频编码器200可以生成包括经编码的视频数据的比特流。然后，源设备102可以经由输出接口108将经编码的视频数据输出到计算机可读介质110上，以由例如目的地设备116的输入接口122接收和/或取回。

源设备102的存储器106和目的地设备116的存储器120表示通用存储器。在一些示例中，存储器106、120可以存储原始视频数据，例如，来自视频源104的原始视频以及来自视频解码器300的原始的经解码的视频数据。另外或替代地，存储器106、120可以存储可由例如视频编码器200和视频解码器300分别执行的软件指令。尽管存储器106和存储器120在该示例中是与视频编码器200和视频解码器300分开示出的，但是应当理解的是，视频编码器200和视频解码器300还可以包括用于在功能上类似或等效目的的内部存储器。此外，存储器106、120可以存储例如从视频编码器200输出并且输入到视频解码器300的经编码的视频数据。在一些示例中，存储器106、120的各部分可以被分配为一个或多个视频缓冲器，例如，以存储原始的、经解码、和/或经编码的视频数据。

计算机可读介质110可以表示能够将经编码的视频数据从源设备102输送到目的地设备116的任何类型的介质或设备。在一个示例中，计算机可读介质110表示通信介质，其使得源设备102能够例如经由射频网络或基于计算机的网络实时地向目的地设备116直接发送经编码的视频数据。根据比如无线通信协议之类的通信标准，输出接口108可以对包括经编码的视频数据的传输信号进行解调，并且输入接口122可以对所接收的传输信号进行解调。通信介质可以包括任何无线或有线通信介质，比如射频(RF)频谱或一条或多条物理传输线。通信介质可以形成基于分组的网络(比如局域网、广域网、或比如互联网之类的全球网络)的一部分。通信介质可以包括路由器、交换机、基站、或对于促进从源设备102到目的地设备116的通信而言可以有用的任何其它设备。

在一些示例中，源设备102可以将经编码的数据从输出接口108输出到存储设备112。类似地，目的地设备116可以经由输入接口122从存储设备112访问经编码的数据。存储设备112可以包括各种分布式或本地访问的数据存储介质中的任何数据存储介质，比如硬盘驱动器、蓝光光盘、DVD、CD-ROM、闪存、易失性或非易失性存储器、或用于存储经编码的视频数据的任何其它适当的数字存储介质。

在一些示例中，源设备102可以将经编码的视频数据输出到文件服务器114或者可以存储由源设备102生成的经编码的视频数据的另一中间存储设备。目的地设备116可以经由流式传输或下载来从文件服务器114访问被存储的视频数据。

文件服务器114可以是能够存储经编码的视频数据并且将该经编码的视频数据发送给目的地设备116的任何类型的服务器设备。文件服务器114可以表示网页服务器(例如，用于网站)、被配置为提供文件传输协议服务(比如文件传输协议(FTP)或基于单向传输的文件递送(FLUTE)协议)的服务器、内容递送网络(CDN)设备、超文本传输协议(HTTP)服务器、多媒体广播多播服务(MBMS)或增强型MBMS(eMBMS)服务器、和/或网络附加存储(NAS)设备。文件服务器114可以另外或替代地实现一种或多种HTTP流式传输协议，比如基于HTTP的动态自适应流式传输(DASH)、HTTP实时流式传输(HLS)、实时流式传输协议(RTSP)、HTTP动态流式传输等。

目的地设备116可以通过任何标准数据连接(包括互联网连接)从文件服务器114访问经编码的视频数据。这可以包括适于访问被存储在文件服务器114上的经编码的视频数据的无线信道(例如，Wi-Fi连接)、有线连接(例如，数字用户线(DSL)、电缆调制解调器等)、或两者的组合。输入接口122可以被配置为根据上文讨论的用于从文件服务器114取回或接收媒体数据的各种协议或者用于取回媒体数据的其它此类协议中的任何一种或多种协议进行操作。

输出接口108和输入接口122可以表示无线发射机/接收机、调制解调器、有线联网组件(例如，以太网卡)、根据各种IEEE 802.11标准中的任何标准进行操作的无线通信组件、或其它物理组件。在输出接口108和输入接口122包括无线组件的示例中，输出接口108和输入接口122可以被配置为根据蜂窝通信标准(比如4G、4G-LTE(长期演进)、改进的LTE、5G等)来传输数据(比如经编码的视频数据)。在输出接口108包括无线发射机的一些示例中，输出接口108和输入接口122可以被配置为根据其它无线标准(比如IEEE 802.11规范、IEEE 802.15规范(例如，ZigBee^TM)、Bluetooth^TM标准等)来传输数据(比如经编码的视频数据)。在一些示例中，源设备102和/或目的地设备116可以包括相应的片上系统(SoC)设备。例如，源设备102可以包括用于执行归属于视频编码器200和/或输出接口108的功能的SoC器件，并且目的地设备116可以包括用于执行归属于视频解码器300和/或输入接口122的功能的SoC器件。

本公开内容的技术可以应用于视频译码，以支持各种多媒体应用中的任何应用，比如空中电视广播、有线电视传输、卫星电视传输、互联网流式视频传输(比如基于HTTP的动态自适应流式传输(DASH))、被编码到数据存储介质上的数字视频、对被存储在数据存储介质上的数字视频的解码、或其它应用。

目的地设备116的输入接口122从计算机可读介质110(例如，通信介质、存储设备112、文件服务器114等)接收经编码的视频比特流。经编码的视频比特流可以包括由视频编码器200定义的、还被视频解码器300使用的信令信息，比如具有描述视频块或其它译码单元(例如，切片、图片、图片组、序列等)的特性和/或处理的值的语法元素。显示设备118将经解码的视频数据的经解码的图片显示给用户。显示设备118可以表示各种显示设备中的任何显示设备，比如液晶显示器(LCD)、等离子显示器、有机发光二极管(OLED)显示器、或另一类型的显示设备。

尽管在图1中未示出，但是在一些示例中，视频编码器200和视频解码器300可以各自与音频编码器和/或音频解码器整合，并且可以包括适当的MUX-DEMUX单元或其它硬件和/或软件，以处理在公共数据流中包括音频和视频两者的经复用的流。

视频编码器200和视频解码器300各自可以被实现为各种适当的编码器和/或解码器电路中的任何一种，比如一个或多个微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、分立逻辑、软件、硬件、固件、或其任何组合。当所述技术部分地用软件实现时，设备可以将用于软件的指令存储在适当的非暂时性计算机可读介质中，并且使用一个或多个处理器来执行在硬件中的指令以执行本公开内容的技术。视频编码器200和视频解码器300中的每者可以被包括在一个或多个编码器或解码器中，编码器或解码器中的任一者可以被整合为相应设备中的组合的编码器/解码器(CODEC)的一部分。包括视频编码器200和/或视频解码器300的设备可以包括集成电路、微处理器、和/或无线通信设备(比如蜂窝电话)。

视频编码器200和视频解码器300可以根据视频译码标准(比如ITU-T H.265(还被称为高效率视频译码(HEVC)标准)或对其的扩展(比如多视图和/或可伸缩视频译码扩展))进行操作。或者，视频编码器200和视频解码器300可以根据其它专有或行业标准(比如ITU-T H.266标准，还被称为通用视频译码(VVC))进行操作。在其它示例中，视频编码器200和视频解码器300可以根据专有视频编解码器/格式(比如AOMedia Video 1(AV1)、AV1的扩展和/或AV1的后续版本(例如，AV2))进行操作。在其它示例中，视频编码器200和视频解码器300可以根据其它专有格式或行业标准进行操作。然而，本公开内容的技术不限于任何特定的译码标准或格式。通常，视频编码器200和视频解码器300可以被配置为结合使用运动矢量预测候选列表(包括合并候选列表)的任何视频译码技术来执行本公开内容的技术。

通常，视频编码器200和视频解码器300可以执行对图片的基于块的译码。术语“块”通常指代包括要被处理的(例如，要被编码、被解码或以其它方式在编码和/或解码过程中使用)数据的结构。例如，块可以包括亮度和/或色度数据的样本的二维矩阵。通常，视频编码器200和视频解码器300可以对以YUV(例如，Y、Cb、Cr)格式表示的视频数据进行译码。也就是说，并不是对用于图片的样本的红色、绿色和蓝色(RGB)数据进行译码，视频编码器200和视频解码器300可以对亮度和色度分量进行译码，其中，色度分量可以包括红色色相和蓝色色相色度分量两者。在一些示例中，视频编码器200在进行编码之前将所接收的RGB格式的数据转换为YUV表示，并且视频解码器300将YUV表示转换为RGB格式。或者，预处理和后处理单元(未示出)可以执行这些转换。

本公开内容通常可以涉及对图片的译码(例如，编码和解码)以包括对图片的数据进行编码或解码的过程。类似地，本公开内容可以涉及对图片的块的译码以包括对用于块的数据进行编码或解码(例如，预测和/或残差译码)的过程。经编码的视频比特流通常包括用于表示译码决策(例如，译码模式)以及图片到块的划分的语法元素的一系列值。因此，关于对图片或块进行译码的引用通常应当被理解为对用于形成图片或块的语法元素的值进行译码。

HEVC定义各种块，包括译码单元(CU)、预测单元(PU)和变换单元(TU)。根据HEVC，视频译码器(比如视频编码器200)根据四叉树结构来将译码树单元(CTU)划分为CU。也就是说，视频译码器将CTU和CU划分为四个相等的、不重叠的正方形，并且四叉树的每个节点具有零个或四个子节点。没有子节点的节点可以被称为“叶节点”，并且这种叶节点的CU可以包括一个或多个PU和/或一个或多个TU。视频译码器可以进一步划分PU和TU。例如，在HEVC中，残差四叉树(RQT)表示对TU的分区。在HEVC中，PU表示帧间预测数据，而TU表示残差数据。经帧内预测的CU包括帧内预测信息，比如帧内模式指示。

作为另一示例，视频编码器200和视频解码器300可以被配置为根据VVC进行操作。根据VVC，视频译码器(比如视频编码器200)将图片划分为多个译码树单元(CTU)。视频编码器200可以根据树结构(比如四叉树-二叉树(QTBT)结构或多类型树(MTT)结构)划分CTU。QTBT结构去除了多种划分类型的概念，比如在HEVC的CU、PU和TU之间的分隔。QTBT结构包括两个级别：根据四叉树划分进行划分的第一级别、以及根据二叉树划分进行划分的第二级别。QTBT结构的根节点对应于CTU。二叉树的叶节点对应于译码单元(CU)。

在MTT划分结构中，可以使用四叉树(QT)划分、二叉树(BT)划分以及一种或多种类型的三叉树(TT)(还被称为三元树(TT))划分来对块进行划分。三叉树或三元树划分是块被分为三个子块的划分。在一些示例中，三叉树或三元树划分将块划分为三个子块，而不划分通过中心的原始块。MTT中的划分类型(例如，QT、BT和TT)可以是对称的或不对称的。

当根据AV1编解码器进行操作时，视频编码器200和视频解码器300可以被配置为对在块中的视频数据进行译码。在AV1中，可以处理的最大译码块被称为超级块。在AV1中，超级块可以是128x128亮度样本或64x64亮度样本。然而，在后续视频译码格式(例如，AV2)中，超级块可以由不同(例如，更大)的亮度样本大小来定义。在一些示例中，超级块是块四叉树的顶层。视频编码器200可以进一步将超级块划分为较小的译码块。视频编码器200可以使用正方形或非正方形划分来将超级块和其它译码块划分为较小的块。非正方形块可以包括N/2xN、NxN/2、N/4xN和NxN/4块。视频编码器200和视频解码器300可以对每个译码块执行单独的预测和变换过程。

AV1还定义视频数据的瓦片(tile)。瓦片是超级块的矩形阵列，其可以独立于其它瓦片进行译码。也就是说，视频编码器200和视频解码器300可以分别对瓦片内的译码块进行编码和解码，而不使用来自其它瓦片的视频数据。然而，视频编码器200和视频解码器300可以跨越瓦片边界执行滤波。瓦片的大小可以是均匀的或不均匀的。对于编码器和解码器实现方式，基于瓦片的译码可以实现并行处理和/或多线程。

在一些示例中，视频编码器200和视频解码器300可以使用单个QTBT或MTT结构来表示亮度分量和色度分量中的每者，而在其它示例中，视频编码器200和视频解码器300可以使用两个或更多个QTBT或MTT结构，比如用于亮度分量的一个QTBT/MTT结构以及用于两个色度分量的另一QTBT/MTT结构(或者用于相应色度分量的两个QTBT/MTT结构)。

视频编码器200和视频解码器300可以被配置为使用四叉树划分、QTBT划分、MTT划分、超级块划分或其它划分结构。

在一些示例中，CTU包括亮度样本的译码树块(CTB)、具有三个样本阵列的图片的色度样本的两个对应的CTB、或者单色图片或使用三个单独的色彩平面来译码的图片的样本的CTB、以及用于对样本进行译码的语法结构。CTB可以是针对N的某个值的NxN样本块，使得分量到CTB的拆分是一种划分。分量是来自以4:2:0、4:2:2或4:4:4的色彩格式组成图片的三个阵列(亮度和两个色度)中的一个阵列的阵列或单个样本，或者是以单色格式组成图片的阵列或阵列的单个样本。在一些示例中，译码块是针对M和N的某些值的M×N样本块，使得CTB到译码块的拆分是一种划分。

可以以各种方式在图片中对块(例如，CTU或CU)进行分组。作为一个示例，砖块可以指代图片中的特定瓦片内的CTU行的矩形区域。瓦片可以是图片中的特定瓦片列和特定瓦片行内的CTU的矩形区域。瓦片列指代CTU的矩形区域，其具有等于图片的高度的高度以及由语法元素(例如，比如在图片参数集中)指定的宽度。瓦片行指代CTU的矩形区域，其具有由语法元素(例如，比如在图片参数集中)指定的高度以及等于图片的宽度的宽度。

在一些示例中，可以将瓦片划分为多个砖块，每个砖块可以包括瓦片内的一个或多个CTU行。没有被划分为多个砖块的瓦片还可以被称为砖块。然而，作为瓦片的真实子集的砖块不可以被称为瓦片。图片中的砖块也可以以切片来排列。切片可以是图片的整数个砖块，其可以唯一地被包含在单个网络抽象层(NAL)单元中。在一些示例中，切片包括多个完整的瓦片或者仅包括一个瓦片的完整砖块的连续序列。

本公开内容可以互换地使用“NxN”和“N乘N”来指代块(比如CU或其它视频块)在垂直和水平维度方面的样本大小，例如，16x16个样本或16乘16个样本。通常，16x16 CU将在垂直方向上具有16个样本(y＝16)，并且在水平方向上具有16个样本(x＝16)。同样地，NxN CU通常在垂直方向上具有N个样本，并且在水平方向上具有N个样本，其中N表示非负整数值。CU中的样本可以按行和列来排列。此外，CU不一定需要在水平方向上具有与在垂直方向上相同的数量的样本。例如，CU可以包括NxM个样本，其中M不一定等于N。

视频编码器200对用于CU的表示预测和/或残差信息以及其它信息的视频数据进行编码。预测信息指示将如何预测CU以便形成用于CU的预测块。残差信息通常表示在编码之前的CU的样本与预测块之间的逐样本差。

为了预测CU，视频编码器200通常可以通过帧间预测或帧内预测来形成用于CU的预测块。帧间预测通常指代根据先前译码的图片的数据来预测CU，而帧内预测通常指代根据同一图片的先前译码的数据来预测CU。为了执行帧间预测，视频编码器200可以使用一个或多个运动矢量来生成预测块。视频编码器200通常可以执行运动搜索，以识别例如在CU与参考块之间的差异方面与CU紧密匹配的参考块。视频编码器200可以使用绝对差之和(SAD)、平方差之和(SSD)、平均绝对差(MAD)、均方差(MSD)、或其它这样的差计算来计算差度量，以确定参考块是否与当前CU紧密匹配。在一些示例中，视频编码器200可以使用单向预测或双向预测来预测当前CU。

VVC的一些示例还提供仿射运动补偿模式，其可以被认为是帧间预测模式。在仿射运动补偿模式下，视频编码器200可以确定表示非平移运动(比如放大或缩小、旋转、透视运动或其它不规则的运动类型)的两个或更多个运动矢量。

为了执行帧内预测，视频编码器200可以选择帧内预测模式来生成预测块。VVC的一些示例提供六十七种帧内预测模式，包括各种方向性模式、以及平面模式和DC模式。通常，视频编码器200选择帧内预测模式，帧内预测模式描述要根据其来预测当前块(例如，CU的块)的样本的、当前块的相邻样本。假设视频编码器200以光栅扫描次序(从左到右、从上到下)对CTU和CU进行译码，则这样的样本通常可以是在与当前块相同的图片中在当前块的上方、左上方或左侧。

视频编码器200对表示用于当前块的预测模式的数据进行编码。例如，对于帧间预测模式，视频编码器200可以对表示使用各种可用帧间预测模式中的哪种模式以及用于对应模式的运动信息的数据进行编码。对于单向或双向帧间预测，例如，视频编码器200可以使用高级运动矢量预测(AMVP)或合并模式来对运动矢量进行编码。视频编码器200可以使用类似的模式来对用于仿射运动补偿模式的运动矢量进行编码。

AV1包括用于对视频数据的译码块进行编码和解码的两种通用技术。两种通用技术是帧内预测(例如，帧内预测或空间预测)和帧间预测(例如，帧间预测或时间预测)。在AV1的上下文中，当使用帧内预测模式来预测视频数据的当前帧的块时，视频编码器200和视频解码器300不使用来自视频数据的其它帧的视频数据。对于大多数帧内预测模式，视频编码器200基于在当前块中的样本值与根据同一帧中的参考样本而生成的预测值之间的差，对当前帧的块进行编码。视频编码器200基于帧内预测模式来确定根据参考样本而生成的预测值。

在预测(比如对块的帧内预测或帧间预测)之后，视频编码器200可以计算用于块的残差数据。残差数据(比如残差块)表示在块与使用对应的预测模式来形成的用于块的预测块之间的逐样本差。视频编码器200可以将一个或多个变换应用于残差块，以在变换域中而非在样本域中产生经变换的数据。例如，视频编码器200可以将离散余弦变换(DCT)、整数变换、小波变换或概念上类似的变换应用于残差视频数据。另外，视频编码器200可以在第一变换之后应用二次变换，比如模式相关的不可分离二次变换(MDNSST)、信号相关变换、Karhunen-Loeve变换(KLT)等。视频编码器200在应用一个或多个变换之后产生变换系数。

如上文所指出的，在任何变换以产生变换系数之后，视频编码器200可以执行对变换系数的量化。量化通常指代如下的过程：其中对变换系数进行量化以可能地减少用于表示变换系数的数据量，从而提供进一步的压缩。通过执行量化过程，视频编码器200可以减小与一些或所有变换系数相关联的比特深度。例如，视频编码器200可以在量化期间将n比特的值向下舍入为m比特的值，其中n大于m。在一些示例中，为了执行量化，视频编码器200可以对要被量化的值执行按位右移。

在量化之后，视频编码器200可以扫描变换系数，从包括经量化的变换系数的二维矩阵产生一维矢量。可以将扫描设计为将较高能量(并且因此较低频率)的变换系数放在矢量的前面，并且将较低能量(并且因此较高频率)的变换系数放在矢量的后面。在一些示例中，视频编码器200可以利用预定义的扫描次序来扫描经量化的变换系数以产生串行化的矢量，并且然后对矢量的经量化的变换系数进行熵编码。在其它示例中，视频编码器200可以执行自适应扫描。在扫描经量化的变换系数以形成一维矢量之后，视频编码器200可以例如根据上下文自适应二进制算术译码(CABAC)，对一维矢量进行熵编码。视频编码器200还可以对用于描述与经编码的视频数据相关联的元数据的语法元素的值进行熵编码，以供视频解码器300在对视频数据进行解码时使用。

为了执行CABAC，视频编码器200可以将上下文模型内的上下文分配给要发送的符号。上下文可以涉及例如符号的相邻值是否为零值。概率确定可以是基于被分配给符号的上下文的。

视频编码器200还可以例如在图片报头、块报头、切片报头或其它语法数据(比如序列参数集(SPS)、图片参数集(PPS)或视频参数集(VPS)中，针对视频解码器300生成语法数据，比如基于块的语法数据、基于图片的语法数据和基于序列的语法数据。同样地，视频解码器300可以对这样的语法数据进行解码以确定如何解码对应的视频数据。

以这种方式，视频编码器200可以生成比特流，比特流包括经编码的视频数据，例如，描述图片到块(例如，CU)的划分以及用于块的预测和/或残差信息的语法元素。最终，视频解码器300可以接收比特流并且对经编码的视频数据进行解码。

通常，视频解码器300执行与由视频编码器200执行的过程相反的过程，以对比特流的经编码的视频数据进行解码。例如，视频解码器300可以使用CABAC以与视频编码器200的CABAC编码过程基本上类似的但是相反的方式，对用于比特流的语法元素的值进行解码。语法元素可以定义用于将图片划分为CTU、以及根据对应的划分结构(比如QTBT结构)对每个CTU进行划分以定义CTU的CU的划分信息。语法元素还可以定义用于视频数据的块(例如，CU)的预测和残差信息。

残差信息可以由例如经量化的变换系数来表示。视频解码器300可以对块的经量化的变换系数进行逆量化和逆变换以重现用于块的残差块。视频解码器300使用用信号通知的预测模式(帧内预测或帧间预测)和相关的预测信息(例如，用于帧间预测的运动信息)来形成用于块的预测块。视频解码器300然后可以对预测块和残差块(在逐个样本的基础上)进行组合以重现原始块。视频解码器300可以执行额外处理，比如执行去块过程以减少沿着块的边界的视觉伪影。

本公开内容通常可能涉及“用信号通知”某些信息(比如语法元素)。术语“用信号通知”通常可以指代对用于语法元素的值和/或用于对经编码的视频数据进行解码的其它数据的传送。也就是说，视频编码器200可以在比特流中用信号通知用于语法元素的值。通常，用信号通知指代在比特流中生成值。如上文所指出的，源设备102可以基本上实时地或不是实时地(比如可能在将语法元素存储到存储设备112以供目的地设备116稍后取回时发生)将比特流传输到目的地设备116。

根据本公开内容的技术，如下文更详细地描述的，视频编码器200和/或视频解码器300可以被配置为：构造合并候选的合并候选列表，其中，合并候选列表具有N1个候选，N1为正整数值；对合并候选列表中的合并候选进行重新排序以创建经重新排序的合并候选列表；减少经重新排序的合并候选列表以创建输出合并候选列表，其中，输出合并候选列表具有N2个候选，其中，N2小于N1；以及使用输出合并候选列表来对视频数据的块进行译码。

通用视频译码(VVC)标准中的帧间预测

对于VVC中的每个帧间预测的CU，运动参数(包括运动矢量、参考图片索引和参考图片列表使用索引以及用于VVC的译码特征的任何额外信息)用于帧间预测样本生成。可以以显式方式用信号通知运动参数，或者以隐式方式在视频解码器300处推导运动参数。当利用跳过模式对CU进行译码时，CU与一个PU相关联并且不具有显著的残差系数、经译码的运动矢量增量或参考图片索引。指定了合并模式，其中用于当前CU的运动参数是从相邻CU(包括空间和时间候选)以及在VVC中引入的额外调度来获得的。合并模式可以应用于任何帧间预测的CU，而不仅适用于跳过模式。合并模式的替代是运动参数的显式传输，其中运动矢量、用于每个参考图片列表的对应参考图片索引和参考图片列表使用标志以及任何其它所需的信息都是针对每个CU显式地用信号通知的。

除了HEVC中的帧间译码特征外，VVC还包括多个新的和细化的帧间预测译码工具，如下所列：

-扩展合并预测

-具有运动矢量差的合并模式(MMVD)

-对称MVD(SMVD)信令

-仿射运动补偿预测

-基于子块的时间运动矢量预测(SbTMVP)

-自适应运动矢量分辨率(AMVR)

-运动场存储：1/16亮度样本MV存储和8x8运动场压缩

-具有CU级权重的双预测(BCW)

-双向光流(BDOF)

-解码器侧运动矢量细化(DMVR)

-几何划分模式(GPM)

-组合的帧间和帧内预测(CIIP)

-扩展合并预测

在VVC常规合并模式下，通过按顺序包括以下五种类型的候选来构建合并候选列表：

1)来自空间邻域CU的空间运动矢量预测器(MVP)

2)来自共置的CU的时间MVP

3)来自先进先出(FIFO)表的基于历史的MVP

4)成对平均MVP

5)零MV。

在序列参数集(SPS)报头中用信号通知合并候选列表的大小，并且合并候选列表的最大允许大小为6。对于以合并模式进行译码的每个CU，最佳合并候选的索引是使用截取的一元二值化(TU)进行编码的。

下文描述合并候选的类别的推导过程。正如在HEVC中所做的那样，VVC还支持针对某个大小的区域内的所有CU并行推导合并候选列表。

空间候选推导

VVC中的空间合并候选的推导与HEVC中的推导类似，除了前两个合并候选的位置被交换之外。在位于图2中描绘的相对于当前CU 400的位置的候选中，选择最多四个合并候选。推导的顺序为B₀、A₀、B₁、A₁和B₂。仅当位置B₀、A₀、B₁、A₁处的CU中的一个(或一个以上)CU不可用(例如，因为这样的CU位于另一切片或瓦片中)或这样的CU被帧内译码时，才考虑位置B₂。在将位置A₁处的候选添加到合并候选列表之后，剩余候选的添加受到冗余校验，冗余校验确保从列表中排除具有相同运动信息的候选，以便改善译码效率。

时间候选推导

在该步骤中，仅一个候选被添加到合并候选列表中。特别是，在该时间合并候选的推导中，缩放的运动矢量是基于属于共置参考图片的共置CU来推导的。要用于推导共置CU的参考图片列表是在切片报头中显式地用信号通知的。如图3中的虚线所示，获得用于时间合并候选的缩放的运动矢量412。用于当前CU 400(Curr CU)的缩放的运动矢量412是使用图片顺序计数(POC)距离tb和td来从共置CU 416(Col CU)的运动矢量410进行缩放的。运动矢量414是在当前CU 400与共置CU 416之间的运动矢量。POC距离tb被定义为在当前图片的参考图片404(Curr_ref)与当前图片406(Curr_pic)之间的POC差。POC差td被定义为在共置图片的参考图片402(Col_ref)与共置图片408(Col_pic)之间的POC差。时间合并候选的参考图片索引被设置为等于零。

如图4中描绘的，在候选C₀与C₁之间选择用于当前CU 400(例如，其可以是亮度(Y)块)的时间候选的位置。如果位置C₀处的CU不可用、被帧内译码或在CTU的当前行之外，则使用位置C₁。否则，在时间合并候选的推导中使用位置C₀。

基于历史的合并候选推导

可以在空间MVP候选和TMVP候选之后将基于历史的MVP(HMVP)合并候选添加到合并候选列表中。在一个示例中，先前译码的块的运动信息被存储在表(例如，HMVP表)中，并且被用作用于当前CU的运动矢量预测器(MVP)。在编码/解码过程期间维护具有多个HMVP候选的表。当遇到新的CTU行时，表被重置(例如，被清空)。每当存在非子块帧内译码的CU时，将相关联的运动信息作为新的HMVP候选被添加到表的最后一个条目。

HMVP表大小S被设置为6，这指示最多可以向表中添加6个基于历史的MVP(HMVP)候选。当向表中插入新的运动候选时，可以利用受约束的先进先出(FIFO)规则，其中首先应用冗余校验来确定表中是否存在相同的HMVP。如果找到，则将从表中移除相同的HMVP，并且之后的所有HMVP候选向前移动。

可以在合并候选列表构建过程中使用HMVP候选。在一个示例中，表中最新的若干HMVP候选被按顺序检查，并且在TMVP候选之后被插入到候选列表中。在空间候选或时间合并候选的HMVP候选上应用冗余校验。

为了减少冗余校验操作的数量，可以引入以下简化：

1、用于合并列表生成的使用的候选的数量被设置为(N<＝4)？M:(8-N)，其中N指示合并列表中的现有候选的数量，并且M指示表中的可用HMVP候选的数量。

2、一旦可用合并候选的总数达到最大允许的合并候选减1，则终止来自HMVP表的合并候选列表构建过程。

成对平均合并候选推导

通过对现有合并候选列表中的预定义的候选对进行平均，生成成对平均候选。在一个示例中，预定义的对被定义为{(0，1)，(0，2)，(1，2)，(0，3)，(1，3)，(2，3)}，其中数字表示合并候选列表的合并索引。针对每个参考列表单独地计算平均运动矢量。如果两个运动矢量在一个列表中可用，则这两个运动矢量被平均，即使它们指向不同的参考图片；如果仅一个运动矢量可用，则直接使用该运动矢量；如果没有运动矢量可用，则保持该列表无效。

当在添加成对平均合并候选之后合并列表未满时，在合并候选列表的末尾插入零MVP，直到达到最大合并候选数量为止。

具有CU级权重的双预测(BCW)

在HEVC中，双预测信号是通过对从两个不同的参考图片获得的两个预测信号进行平均和/或使用两个不同的运动矢量来生成的。在VVC中，将双预测模式扩展到简单平均之外，以允许对两个预测信号进行加权平均。示例如下：

P_bi-pred＝((8-w)*P₀+w*P₁+4)＞＞3，P_bi-pred是双预测信号，w是权重，P₀是来自第一参考图片列表(列表0)中的参考图片的预测信号，并且P₁是来自部分参考图片列表(列表1)中的参考图片的预测信号。运算符>>是按位右移。

在加权平均双预测中允许五个权重，w∈{-2,3,4,5,10}。对于每个双预测CU，权重w是以以下两种方式中的一种方式确定的：1)对于非合并CU，权重索引是在运动矢量差之后用信号通知的；2)对于合并CU，权重索引是基于合并候选索引根据相邻块进行推断的。在一个示例中，BCW仅应用于具有256个或更多亮度样本的CU(即，CU宽度乘以CU高度大于或等于256)。对于低延迟图片，使用所有5个权重。对于非低延迟图片，仅使用3个权重(w∈{3,4,5})。

–在编码器处，应用快速搜索算法来找到权重索引，而不会显著地增加编码器复杂性。这些算法总结如下。可以在VVC测试模型(VTM)软件和以下文档中找到另外的细节：Yu-Chi Su等人，“CE4-related:Generalized bi-prediction improvements combined fromJVET-L0197 and JVET-L0296(关于CE4：从JVET-L0197和JVET-L0296组合的广义双预测改善)”，ITU-T SG 16WP 3和ISO/IEC JTC 1/SC 29/WG 11的联合视频专家组(JVET)，第12次会议：中国澳门，2018年10月3日至12日(“JVET-L0646”)。当与AMVR结合时，如果当前图片是低延迟图片，则仅针对1像素和4像素运动矢量精度，有条件地检查不相等的权重。

–当与仿射模式组合时，当且仅当仿射模式被选为当前最佳模式时，将针对不相等的权重执行仿射运动估计(ME)。

–当双预测中的两个参考图片相同时，仅有条件地检查不相等的权重。

–当满足某些条件时，不搜索不相等的权重，这取决于在当前图片与其参考图片之间的POC距离、译码QP和时间级别。

BCW权重索引是使用其后跟有旁路译码的二进制符号(bin)的一个上下文译码的二进制符号来进行译码的。第一上下文译码的二进制符号指示是否使用相等的权重；并且如果使用不相等的权重，则使用旁路译码来用信号通知额外的二进制符号以指示使用了哪些不相等的权重。

加权预测(WP)是由H.264/AVC和HEVC标准支持的用于在衰落情况下对视频内容高效地进行译码的译码工具。还向VVC标准中添加对WP的支持。WP允许针对参考图片列表L0和L1中的每个列表中的每个参考图片用信号通知加权参数(例如，权重和偏移)。然后，在运动补偿期间，应用对应的参考图片的权重和偏移。

WP和BCW被设计用于不同类型的视频内容。为了避免WP与BCW之间的交互(这将使VVC解码器设计复杂化)，如果CU使用WP，则不用信号通知BCW权重索引，并且w被推断为4(例如，应用相等权重)。对于合并CU，权重索引是基于合并候选索引根据相邻块进行推断的。这可以应用于正常合并模式和继承的仿射合并模式两者。对于构造的仿射合并模式，仿射运动信息是基于最多3个块的运动信息来构造的。使用构造的仿射合并模式的CU的BCW索引被简单地设置为等于第一控制点MV的BCW索引。

在VVC中，CIIP和BCW不能联合地应用于CU。当利用CIIP模式对CU进行译码时，当前CU的BCW索引被设置为2，例如，相等权重。

VVC中的解码器侧运动矢量细化

在VVC中，应用基于双边匹配(BM)的解码器侧运动矢量细化(DMVR)，以提高双预测合并候选的MV的精度。BM方法包括计算在参考图片列表L0和列表L1中的两个候选块之间的绝对差之和(SAD)。如图5中所示，基于初始MV周围的每个MV候选来计算块500与块502之间的SAD。具有最低SAD的MV候选变为细化MV并且用于生成双预测信号。初始MV的SAD减去SAD值的1/4，以作为正则化项。从两个参考图片到当前图片的时间距离(例如，图片顺序计数(POC)差)应当相同，因此，MVD0正好是MVD1的相反符号。

细化搜索范围是来自初始MV的两个整数亮度样本。搜索包括整数样本偏移搜索阶段和分数样本细化阶段。将二十五(25)点全搜索应用于整数样本偏移搜索。首先计算初始MV对的SAD。如果初始MV对的SAD小于门限，则终止DMVR的整数样本阶段。否则，将按光栅扫描顺序来计算和检查剩余24个点的SAD。选择具有最小SAD的点作为整数样本偏移搜索阶段的输出。

整数样本搜索之后跟有分数样本细化。为了降低计算复杂度，通过使用参数误差曲面方程，而不是利用SAD比较的额外搜索，来推导分数样本细化。分数样本细化是基于整数样本搜索阶段的输出有条件地调用的。当整数样本搜索阶段在第一迭代或第二迭代搜索中在中心具有最小SAD的情况下终止时，进一步应用分数样本细化。

在基于参数误差曲面的亚像素偏移估计中，使用中心位置成本和距中心的四个相邻位置处的成本来拟合以下形式的2-D抛物线误差曲面方程：

E(x,y)＝A(x-x_min)²+B(y-y_min)²+C, (1)

其中(x_min,y_min)对应于具有最少成本的分数位置，并且C对应于最小成本值。通过使用五个搜索点的成本值来求解以上方程，(x_min,y_min)被计算为：

x_min＝(E(-1,0)-E(1,0))/(2(E(-1,0)+E(1,0)-2E(0,0))) (2)

y_min＝(E(0,-1)-E(0,1))/(2((E(0,-1)+E(0,1)-2E(0,0))) (3)

x_min和y_min的值被自动地约束在-8和8之间，因为所有成本值均为正，并且最小值为E(0,0)。这对应于VVC中具有1/16像素MV精度的半像素偏移。计算出的分数(x_min,y_min)被加到整数距离细化MV，以获得亚像素精度的细化增量MV。

在VVC中，MV的分辨率为1/16亮度样本。分数位置处的样本是使用8抽头插值滤波器进行插值的。在DMVR中，搜索点围绕具有整数样本偏移的初始分数像素MV。因此，针对DMVR搜索过程，对这些分数位置的样本进行插值。为了降低计算复杂度，针对DMVR中的搜索过程，使用双线性插值滤波器来生成分数样本。另一重要影响是，通过使用具有2样本搜索范围的双线性滤波器，与正常运动补偿过程相比，DVMR不访问更多的参考样本。在利用DMVR搜索过程获得细化的MV后，应用常规8抽头插值滤波器来生成最终预测。为了不访问比正常运动补偿过程更多的参考样本，将从那些可用样本中填充对于基于原始MV的插值过程是不需要的但是对于基于细化MV的插值过程是需要的样本。

当CU的宽度和/或高度大于16个亮度样本时，CU将进一步被拆分为用于MDVR过程的宽度和/或高度等于16个亮度样本的子块。

在VVC中，DMVR可以应用于利用以下模式和特征进行译码的CU：

-具有双预测MV的CU级合并模式

-相对于当前图片，一个参考图片在过去，并且另一参考图片在未来

-从两个参考图片到当前图片的距离(例如，POC差)相同

-两个参考图片都是短期参考图片

-CU具有64个以上的亮度样本

-CU高度和CU宽度两者都大于或等于8个亮度样本

-BCW权重索引指示相等权重

-未针对当前块启用WP

-CIIP模式不用于当前块

双向光流

双向光流(BDOF)用于在4×4子块级别细化CU中的亮度样本的双向预测信号。顾名思义，BDOF模式是基于光流概念的，光流概念假设对象的运动是平滑的。对于每个4×4子块，通过最小化在L0与L1预测样本之间的差来计算运动细化(v_x,v_y)。然后，使用运动细化来调整4x4子块中的双预测样本值。在示例BDOF过程中应用以下步骤。

首先，通过直接计算两个相邻样本之间的差来计算两个预测信号的水平和垂直梯度例如：

其中，I^(k)(i,j)是列表k中的预测信号的坐标(i,j)处的样本值，k＝0,1，并且当shift1被设置为等于6时，shift1是基于亮度比特深度bitDepth来计算的。

然后，梯度S₁、S₂、S₃、S₅和S₆的自相关和互相关计算如下：

S₁＝∑_(i,j)∈Ω│ψ_x(i,j)│,S₃＝∑_(i,j)∈Ωθ(i,j)·(-sign(ψ_x(i,j)))

S₂＝∑_(i,j)∈Ωψ_x(i,j)·sign(ψ_y(i,j))

(1-6-2)

S₅＝∑_(i,j)∈Ω│ψ_y(i,j)│S₆＝∑_(i,j)∈Ωθ(i,j)·(-sign(ψ_y(i,j))),

其中，

/>

θ(i,j)＝(I⁽⁰⁾(i,j)＞＞shift2)-(I⁽¹⁾(i,j)>>shift2),

其中，Ω是4×4子块周围的6×6窗口，shift2的值被设置为等于4，并且shift3的值设置为等于1。

然后，使用以下公式，使用互相关和自相关项来推导运动细化(v_x,v_y)：

其中，th′_BIO＝1<<4.是向下取整函数。

基于运动细化和梯度，针对4×4子块中的每个样本计算以下调整：

最后，通过调整双预测样本来计算CU的BDOF样本，如下所示：

pred_BDOF(x,y)＝(I⁽⁰⁾(x,y)+I⁽¹⁾(x,y)+b(x,y)+o_offset)＞＞shift5, (1-6-6)

其中，shift5被设置为等于Max(3,15-BitDepth)，并且变量o_offset被设置为等于(1<<(shift5-1))。

这些值被选择为使得确保BDOF过程中的乘法器不超过15比特，并且BDOF过程中的中间参数的最大比特宽度保持在32比特内。

为了推导梯度值，需要生成当前CU边界之外的列表k(k＝0,1)中的一些预测样本I^(k)(i,j)。如图6中描绘的，BDOF在CU 600的边界周围使用一个扩展的行/列。为了控制生成边界外预测样本的计算复杂度，扩展区域(白色位置)中的预测样本是通过在不进行插值的情况下直接在附近的整数位置处获取参考样本(对坐标使用floor()操作)来生成的，并且使用常规8抽头运动补偿插值滤波器在CU(灰度位置)内生成预测样本。仅在梯度计算中使用这些扩展的样本值。对于BDOF过程中的剩余步骤，如果需要CU边界之外的任何样本值和梯度值，则它们是从其最近的邻域填充(例如，重复)的。

BDOF用于在4×4子块级别细化CU的双预测信号。如果满足以下所有条件，则将BDOF应用于CU：

-CU是使用“真”双预测模式进行译码的，即，两个参考图片中的一个参考图片在显示顺序中位于当前图片之前，并且另一参考图片在显示顺序中位于当前图片之后

-CU不是使用仿射模式或SbTMVP合并模式进行译码的

-CU具有64个以上的亮度样本

-CU高度和CU宽度两者都大于或等于8个亮度样本

-BCW权重索引表示相等权重

-针对当前CU未启用WP

-CIIP模式不用于当前CU

模板匹配

模板匹配(TM)是一种解码器侧MV推导方法，其用于通过找到在当前图片中的模板(例如，当前CU的上方和/或左侧相邻块)与参考图片中的块(例如，与模板大小相同的块)之间的最接近匹配来细化当前CU的运动信息。如图7中所示，在参考帧708中的[–8，+8]像素搜索范围706内，将在当前帧704的当前CU 702的初始运动矢量700周围搜索更好的MV。在基于初始匹配误差选择AMVP候选的情况下，其MVP是通过模板匹配来细化的。在通过用信号通知的合并索引来指示合并候选的情况下，其与L0和L1相对应的合并的MV是通过模板匹配来独立地细化的，并且然后较低精度的运动矢量以较好的运动矢量作为先验来进一步再次细化。

·成本函数：当运动矢量指向分数样本位置时，使用运动补偿插值。为了降低复杂度，针对两种模板匹配使用双线性插值而不是常规的8抽头DCT-IF插值，以在参考图片上生成模板。按如下来计算模板匹配的匹配成本C：

C＝SAD+w*(|MVx-MV^sx|+|MVy-MV^sy|)，

其中，w是权重因子，其可以被设置为整数，比如0、1、2、3或4，并且MV和MV^s分别指示当前测试的MV和初始MV(例如，AMVP模式下的MVP候选或合并模式下的合并运动)。SAD用作模板匹配的匹配成本。

当使用TM时，运动是通过使用亮度样本来细化的。所推导的运动将用于亮度和色度两者以进行运动补偿帧间预测。在确定MV之后，针对亮度分量使用8抽头插值滤波器并且针对色度分量使用4抽头插值滤波器来执行最终运动补偿。

·搜索方法：MV细化是具有模板匹配成本的标准和层次结构的基于模式的MV搜索。针对MV细化支持两种搜索模式–菱形搜索和交叉搜索。层次结构指定了用于细化MV的迭代过程，以粗略MVD精度(例如，四分之一像素)开始并且以精细精度(例如，1/8像素)结束。利用菱形模式以四分之一亮度样本MVD精度直接搜索MV，然后利用交叉模式以四分之一亮度样本MVD精度搜索MV，并且然后利用交叉模式以八分之一亮度样本MVD细化搜索MV。MV细化的搜索范围被设置为初始MV周围的(-8，+8)个亮度样本。当当前块具有双预测时，独立地对两个MV进行细化，并且然后将其中的最佳MV(在匹配成本方面)设置为先验，以利用BCW权重值来进一步细化其它MV。

在一些示例中，将在以下文档中提出的模板匹配应用于AMVP模式和合并模式：Y.Chen等人，“Description of SDR,HDR and 360°video coding technology proposalby Qualcomm and Technicolor–low and high complexity versions(对由Qualcomm和Technicolor提出的SDR、HDR和360度视频译码技术提议的描述-低复杂度版本和高复杂度版本)”，ITU-T SG 16WP 3和ISO/IEC JTC 1/SC 29/WG 11的联合视频专家组(JVET)，第10次会议：美国圣地亚哥，2018年4月10日至20日(“JVET-J0021”)；以及Yao-Jen Chang等人，“Compression efficiency methods beyond VVC(VVC之外的压缩效率方法)”，ITU-T SG16WP 3和ISO/IEC JTC 1/SC 29/WG 11的联合视频专家组(JVET)，第21次会议，通过电话会议，2021 1月6日至15日(“JVET-U0100”)。

按以下候选的顺序来构建常规合并候选列表：

·来自空间邻居CU的空间MVP：从上方邻居CU(A)、左侧邻居CU(L)、右上方邻居CU(AR)、左下方邻居CU(LB)和左上方邻居CU(LA)的顺序中选择前四(4)个可用候选。

·来自共置CU的时间MVP：仅添加一个候选。

·基于历史的MVP：先前译码的块的运动信息被存储在表中并且被用作用于当前CU的MVP。

·成对平均MVP：成对平均候选是通过对现有常规合并候选列表中的预定义的候选对进行平均来生成的

·零MV。

当TM应用于合并模式时，通过基于模板匹配来细化常规合并候选的MVP，构建单独的TM合并候选列表。

合并候选重新排序

在一些方法中，可以基于一些标准来对合并候选进行重新排序。例如：

1)可以基于候选是否是双预测候选来对合并候选进行重新排序。在该示例中，可以将双预测候选插入到单预测候选之前。

2)可以基于候选的模板匹配成本来对合并候选进行重新排序。

3)可以基于候选是否是双预测候选以及双预测候选的双边匹配成本，对合并候选进行重新排序。

使用模板匹配的合并候选重新排序

在以下文档中提出使用模板匹配的合并候选重新排序方法：Na Zhang等人，“AHG12:Adaptive Reordering of Merge Candidates with Template Matching(AHG12：利用模板匹配对合并候选的自适应重新排序)”，ITU-T SG 16WP 3和ISO/IEC JTC 1/SC29/WG 11的联合视频专家组(JVET)，第22次会议，通过电话会议，2021 4月20日至28日(“JVET-V0099”)。JVET-V0099的重新排序方法适用于常规合并模式、模板匹配(TM)合并模式和仿射合并模式(不包括SbTMVP候选)。对于TM合并模式，在细化过程之前对合并候选进行重新排序。

在构建合并候选列表之后，将合并候选划分为若干子组。在一个示例中，子组大小被设置为5。每个子组中的合并候选是根据基于模板匹配的成本值按升序进行重新排序的。为了简化起见，不对最后子组(第一子组除外)中的合并候选进行重新排序。

通过在当前块的模板的样本与其对应的参考样本之间的绝对差之和(SAD)来测量模板匹配成本。模板包括与当前块相邻的经重构的样本集合。模板的参考样本是通过当前块的相同运动信息进行定位的。

当合并候选利用双向预测时，合并候选的模板的参考样本还通过双预测来生成，如图8中所示。如图8中所示，用于参考列表0的模板的参考图片800中的参考样本(RT0)是通过参考列表0中的合并候选相对于当前图片804中的当前块800的模板(T)的运动矢量来识别的。参考图片800是参考列表0中的参考图片。同样，用于参考列表1的模板的参考图片806中的参考样本(RT1)是通过参考列表1中的合并候选相对于当前图片804中的当前块800的模板(T)的运动矢量来识别的。参考图片806是参考列表1中的参考图片。

图9是使用子块的运动信息示出用于具有子块运动的块的模板和模板的参考样本的概念图。对于子块大小等于Wsub*Hsub的基于子块的合并候选，以上模板包括若干大小为Wsub×1的子模板，并且左侧模板包括若干大小为1×Hsub的子模板。如图9中所示，当前块910的第一行中的子块(子块A、B、C和D)和第一列中的子块(A、E、F和G)的运动信息用于推导上方参考模板900和左侧参考模板902中每个子模板的参考样本。

本公开内容描述以下用于改善合并候选重新排序的技术。下文描述的技术可以应用于任何重新排序标准，例如，模板匹配成本、双边匹配成本、使用双预测或其它重新排序标准。本公开内容的技术可以用于现有视频译码标准的扩展、未来视频译码标准或使用运动矢量候选列表(包括合并候选列表)的其它视频译码格式(包括AV1及AV1的后续视频译码格式)。

如上文所描述的，在一些示例中，合并候选重新排序方法使用模板匹配。输入列表中的候选数量与输出列表中的候选数量相同。也就是说，一些示例合并候选重新排序技术包括对所有可能的候选进行重新排序，并且然后使用合并候选列表中的所有的经重新排序的候选。在存储器带宽受限的一些应用中，基于模板匹配的候选重新排序方法可能不是期望的，因为它要求访问多个参考图片中的各个位置。

在一个示例中，本公开内容描述可以利用重新排序来改善合并候选列表构造的技术。本文中所描述的技术可以与用于对合并候选列表中的运动候选进行排序的任何重新排序标准(包括模板匹配成本、双边匹配成本、双预测的使用或其它重新排序标准)一起使用。

在本公开内容的一个示例中，视频编码器200和视频解码器300可以被配置为执行以下过程。首先，视频编码器200和视频解码器300可以被配置为构造具有N1个合并候选的合并候选列表。N1是正整数值。N1合并候选可以包括空间合并候选、时间合并候选、基于历史的合并候选和/或成对平均合并候选的任何组合。本公开内容的合并候选列表构造技术还可以与双预测、BCW、解码器侧运动矢量细化、BDOF和模板匹配一起使用，如上文所描述的。

在视频编码器200和视频解码器300构造具有N1个候选的合并候选列表之后，视频编码器200和视频解码器300可以对合并候选列表进行重新排序。在一个示例中，视频编码器200和视频解码器300可以一起对整个列表(例如，所有N1个候选)进行重新排序。即，视频编码器200和视频解码器300可以将重新排序标准应用于列表中的所有N1个候选。如上文所描述的，重新排序标准可以包括模板匹配成本、双边匹配成本、双预测的使用或其它重新排序标准。

在其他示例中，视频编码器200和视频解码器300对列表中的合并候选的多个子组中的每个子组进行重新排序。例如，可以在运动候选的子组中应用重新排序，例如，如在JVET-V0099中描述的。视频编码器200和视频解码器300可以将合并候选列表划分为多个子组，包括预定大小的子组(例如，5个候选)。视频编码器200和视频解码器300可以根据基于模板匹配或另一标准的成本值，按升序对每个子组中的合并候选进行重新排序。

在另一示例中，视频编码200和视频解码器300可以将具有N1个候选的合并候选列表划分为多个子组。视频编码器200和视频解码器300可以仅在每个子组内应用重新排序。对于每个子组，合并候选应当满足以下所有条件：

–如果参考列表0中存在有效MV0，则MV0应当指向参考列表0中的相同的指定参考图片，并且MV0应当指向参考图片内的指定边界块。

–如果参考列表1中存在有效的MV1，则MV1应当指向参考列表1中的相同的指定参考图片，

并且MV0应当指向参考图片内的指定边界块。

以这种方式，通过视频解码器300处的重新排序过程，仅访问某个边界块内的参考像素。

无论重新排序处理如何(例如，整个列表还是子组)，视频编码器200和视频解码器300都可以减少经重新排序的合并候选列表，使得候选数量是整数N2，其中对于输出合并候选列表，N2小于N1。视频编码器200和视频解码器300丢弃最后的N1-N2个候选，在对块进行译码时不使用丢弃的候选。然后，视频编码器200和视频解码器300可以使用具有N2个候选的输出合并候选列表分别对块进行编码和解码。在列表缩减的一个示例中，视频编码器200和视频解码器300可以被配置为将经重新排序的列表中的前N2个候选用于最终合并候选列表。也就是说，当使用基于成本的重新排序标准时，具有最小成本的前N2个候选。

本公开内容的组合重新排序和合并候选列表缩减技术允许考虑大量可能的候选(例如，N1个候选)，同时最终仅要求视频编码器200测试并且用信号通知在最终合并候选列表中的较小数量(例如，N2个候选)的索引。另外，更有可能使用的候选位于合并候选项列表的开始处，并且因此更有可能利用较低的索引来用信号通知。因此，本公开内容的技术可以改善译码效率和/或减少失真。

因此，在本公开内容的一个示例中，视频编码器200和/或视频解码器300可以被配置为：构造合并候选的合并候选列表，其中，合并候选列表具有N1个候选，N1为正整数值；对合并候选列表中的合并候选进行重新排序以创建经重新排序的合并候选列表；减少经重新排序的合并候选列表以创建输出合并候选列表，其中，输出合并候选列表具有N2个候选，其中，N2小于N1；以及使用输出合并候选列表来对视频数据的块进行译码。

如上文所描述的，初始合并候选列表包括与用于对块进行译码的最终候选列表(在重新排序之后)相比更大数量的候选列表。

在一个示例中，可以在高级语法中用信号通知值N1和N2两者。在一个示例中，N1和N2的值是单独地用信号通知的。在另一示例中，N1或N2的值中的一个值是单独地用信号通知的，并且另一值是作为这两个值之间的差来用信号通知的。例如，N1的值可以作为N2+k来用信号通知，其中，k大于0并且k被译码在比特流中。

在另一示例中，N2的值是在高级语法中用信号通知的，并且N1＝N2+k，并且k是固定的正整数值。对于不同的合并模式，可以以不同方式来设置值k。

在一个示例中，本公开内容的技术可以应用于JVET_V0099中描述的方法(例如，在标题为“使用模板匹配的合并候选重新排序”的部分中描述的技术)之上。在模板匹配合并模式下，初始合并候选列表的最大候选数量被设置为N1。在基于模板匹配成本进行重新排序之后，输出合并候选列表的最大候选数量被设置为N2，并且N2<N1。合并索引的信令是基于最大候选数量N2的。例如，截取的一元码用于对合并索引进行译码，其中最大值为N2–1。

图10是示出可以执行本公开内容的技术的示例视频编码器200的方块图。图10是出于解释的目的而提供的，并且不应当被认为是对如在本公开内容中广泛地举例说明和描述的技术的限制。出于解释的目的，本公开内容根据VVC(正在开发的ITU-T H.266)和HEVC(ITU-T H.265)的技术来描述视频编码器200。然而，本公开内容的技术可以由被配置为其它视频译码标准和视频译码格式(比如AV1和AV1视频译码格式的后续版本)的视频编码设备来执行。

在图10的示例中，视频编码器200包括视频数据存储器230、模式选择单元202、残差生成单元204、变换处理单元206、量化单元208、逆量化单元210、逆变换处理单元212、重构单元214、滤波器单元216、解码图片缓冲器(DPB)218和熵编码单元220。视频数据存储器230、模式选择单元202、残差生成单元204、变换处理单元206、量化单元208、逆量化单元210、逆变换处理单元212、重构单元214、滤波器单元216、DPB 218和熵编码单元220中的任何或全部单元可以在一个或多个处理器中或者在处理电路中实现。例如，视频编码器200的单元可以被实现为一个或多个电路或逻辑元件，作为硬件电路的一部分，或者作为处理器、ASIC或FPGA的一部分。此外，视频编码器200可以包括额外或替代的处理器或处理电路以执行这些和其它功能。

视频数据存储器230可以存储要由视频编码器200的组件来编码的视频数据。视频编码器200可以从例如视频源104(图1)接收被存储在视频数据存储器230中的视频数据。DPB 218可以充当参考图片存储器，其存储参考视频数据以由视频编码器200对后续视频数据进行预测时使用。视频数据存储器230和DPB 218可以由各种存储器设备中的任何存储器设备形成，比如动态随机存取存储器(DRAM)(包括同步DRAM(SDRAM))、磁阻RAM(MRAM)、电阻性RAM(RRAM)、或其它类型的存储器设备。视频数据存储器230和DPB 218可以由相同的存储器设备或单独的存储器设备来提供。在各个示例中，视频数据存储器230可以与视频编码器200的其它组件在芯片上(如所示)，或者相对于那些组件在芯片外。

在本公开内容中，对视频数据存储器230的引用不应当被解释为限于在视频编码器200内部的存储器(除非明确描述为如此)，或者在视频编码器200外部的存储器(除非明确描述为如此)。确切地说，对视频数据存储器230的引用应当被理解为存储视频编码器200接收以用于编码的视频数据(例如，用于要被编码的当前块的视频数据)的参考存储器。图1的存储器106还可以提供对来自视频编码器200的各个单元的输出的临时存储。

示出了图10的各个单元以帮助理解由视频编码器200执行的操作。这些单元可以被实现为固定功能电路、可编程电路、或其组合。固定功能电路指代提供特定功能并且关于可以执行的操作被预先设置的电路。可编程电路指代可以被编程以执行各种任务并且在可以执行的操作上提供灵活功能的电路。例如，可编程电路可以执行软件或固件，软件或固件使得可编程电路以由软件或固件的指令所定义的方式进行操作。固定功能电路可以执行软件指令(例如，以接收参数或输出参数)，但是固定功能电路执行的操作的类型通常是不可变的。在一些示例中，这些单元中的一个或多个单元可以是不同的电路块(固定功能或可编程)，并且在一些示例中，这些单元中的一个或多个单元可以是集成电路。

视频编码器200可以包括由可编程电路形成的算术逻辑单元(ALU)、基本功能单元(EFU)、数字电路、模拟电路和/或可编程内核。在视频编码器200的操作是使用由可编程电路执行的软件来执行的示例中，存储器106(图1)可以存储视频编码器200接收并且执行的软件的指令(例如，目标代码)，或者视频编码器200内的另一存储器(未示出)可以存储这样的指令。

视频数据存储器230被配置为存储所接收的视频数据。视频编码器200可以从视频数据存储器230取回视频数据的图片，并且将视频数据提供给残差生成单元204和模式选择单元202。视频数据存储器230中的视频数据可以是要被编码的原始视频数据。

模式选择单元202包括运动估计单元222、运动补偿单元224和帧内预测单元226。模式选择单元202可以包括额外功能单元，以根据其它预测模式来执行视频预测。作为示例，模式选择单元202可以包括调色板单元、块内复制单元(其可以是运动估计单元222和/或运动补偿单元224的一部分)、仿射单元、线性模型(LM)单元等。

模式选择单元202通常协调多个编码通路，以测试编码参数的组合以及针对这样的组合所得到的率失真值。编码参数可以包括CTU到CU的划分、用于CU的预测模式、用于CU的残差数据的变换类型、用于CU的残差数据的量化参数等。模式选择单元202最终可以选择具有与其它测试的组合相比更好的率失真值的编码参数组合。

视频编码器200可以将从视频数据存储器230取回的图片划分为一系列CTU，并且将一个或多个CTU封装在切片内。模式选择单元202可以根据树结构(比如上文描述的MTT结构、QTBT结构、超级块结构或四叉树结构)来划分图片的CTU。如上文所描述的，视频编码器200可以通过根据树结构来划分CTU，从而形成一个或多个CU。这样的CU通常还可以被称为“视频块”或“块”。

通常，模式选择单元202还控制其组件(例如，运动估计单元222、运动补偿单元224和帧内预测单元226)以生成用于当前块(例如，当前CU，或者在HEVC中为PU和TU的重叠部分)的预测块。为了对当前块进行帧间预测，运动估计单元222可以执行运动搜索以识别在一个或多个参考图片(例如，被存储在DPB 218中的一个或多个先前译码的图片)中的一个或多个紧密匹配的参考块。特别是，运动估计单元222可以例如根据绝对差之和(SAD)、平方差之和(SSD)、平均绝对差(MAD)、均方差(MSD)等，来计算表示潜在参考块将与当前块的类似程度的值。运动估计单元222通常可以使用在当前块与所考虑的参考块之间的逐样本差来执行这些计算。运动估计单元222可以识别从这些计算所得到的具有最低值的参考块，指示与当前块最紧密匹配的参考块。

运动估计单元222可以形成一个或多个运动矢量(MV)，一个或多个MV定义相对于当前块在当前图片中的位置而言参考块在参考图片中的位置。然后，运动估计单元222可以将运动矢量提供给运动补偿单元224。例如，对于单向帧间预测，运动估计单元222可以提供单个运动矢量，而对于双向帧间预测，运动估计单元222可以提供两个运动矢量。然后，运动补偿单元224可以使用运动矢量来生成预测块。例如，运动补偿单元224可以使用运动矢量来取回参考块的数据。作为另一示例，如果运动矢量具有分数样本精度，则运动补偿单元224可以根据一个或多个插值滤波器来对用于预测块的值进行插值。此外，对于双向帧间预测，运动补偿单元224可以取回用于由相应的运动矢量标识的两个参考块的数据，并且例如通过逐样本平均或加权平均来将所取回的数据进行组合。

当根据AV1视频译码格式进行操作时，运动估计单元222和运动补偿单元224可以被配置为使用平移运动补偿、仿射运动补偿、重叠块运动补偿(OBMC)和/或复合帧间帧内预测来对视频数据的译码块(例如，亮度译码块和色度译码块两者)进行编码。

作为另一示例，对于帧内预测或帧内预测译码，帧内预测单元226可以根据与当前块相邻的样本来生成预测块。例如，对于方向性模式，帧内预测单元226通常可以在数学上将相邻样本的值进行组合，并且跨越当前块在所定义的方向上填充这些计算出的值以产生预测块。作为另一示例，对于DC模式，帧内预测单元226可以计算当前块的相邻样本的平均，并且生成预测块以包括针对预测块的每个样本的该得到的平均。

当根据AV1视频译码格式进行操作时，帧内预测单元226可以被配置为使用定向帧内预测、非定向帧内预测、递归滤波器帧内预测、根据亮度预测色度(CFL)的预测、块内复制(IBC)和/或调色板模式来对视频数据的译码块(例如，亮度译码块和色度译码块两者)进行编码。模式选择单元202可以包括用于根据其它预测模式来执行视频预测的额外的功能单元。

模式选择单元202将预测块提供给残差生成单元204。残差生成单元204从视频数据存储器230接收当前块的原始的未经编码的版本，并且从模式选择单元202接收预测块。残差生成单元204计算在当前块与预测块之间的逐样本差。所得到的逐样本差定义用于当前块的残差块。在一些示例中，残差生成单元204还可以确定在残差块中的样本值之间的差，以使用残差差分脉冲译码调制(RDPCM)来生成残差块。在一些示例中，可以使用执行二进制减法的一个或多个减法器电路来形成残差生成单元204。

在模式选择单元202将CU划分为PU的示例中，每个PU可以与亮度预测单元和对应的色度预测单元相关联。视频编码器200和视频解码器300可以支持具有各种大小的PU。如上文所指示的，CU的大小可以指代CU的亮度译码块的大小，而PU的大小可以指代PU的亮度预测单元的大小。假设特定CU的大小为2Nx2N，则视频编码器200可以支持用于帧内预测的2Nx2N或NxN的PU大小、以及用于帧间预测的2Nx2N、2NxN、Nx2N、NxN或类似的对称的PU大小。视频编码器200和视频解码器300还可以支持针对用于帧间预测的2NxnU、2NxnD、nLx2N和nRx2N的PU大小的非对称划分。

在模式选择单元202不将CU进一步划分为PU的示例中，每个CU可以与亮度译码块和对应的色度译码块相关联。如上文，CU的大小可以指代CU的亮度译码块的大小。视频编码器200和视频解码器300可以支持2Nx2N、2NxN或Nx2N的CU大小。

对于其它视频译码技术(举一些示例，比如块内复制模式译码、仿射模式译码和线性模型(LM)模式译码)，模式选择单元202经由与译码技术相关联的相应单元来生成用于正被编码的当前块的预测块。在一些示例中(比如调色板模式译码)，模式选择单元202可以不生成预测块，而是替代地生成指示以其基于所选择的调色板来重构块的方式的语法元素。在这样的模式下，模式选择单元202可以将这些语法元素提供给熵编码单元220以进行编码。

如上文所描述的，残差生成单元204接收用于当前块和对应的预测块的视频数据。然后，残差生成单元204生成用于当前块的残差块。为了生成残差块，残差生成单元204计算在预测块与当前块之间的逐样本差。

变换处理单元206将一种或多种变换应用于残差块，以生成变换系数的块(本文中被称为“变换系数块”)。变换处理单元206可以将各种变换应用于残差块，以形成变换系数块。例如，变换处理单元206可以将离散余弦变换(DCT)、方向变换、Karhunen-Loeve变换(KLT)、或概念上类似的变换应用于残差块。在一些示例中，变换处理单元206可以对残差块执行多种变换，例如，初级变换和二次变换(比如旋转变换)。在一些示例中，变换处理单元206不对残差块应用变换。

当根据AV1进行操作时，变换处理单元206可以将一个或多个变换应用于残差块以生成变换系数的块(本文中被称为“变换系数块”)。变换处理单元206可以将各种变换应用于残差块以形成变换系数块。例如，变换处理单元206可以应用水平/垂直变换组合，其可以包括离散余弦变换(DCT)、非对称离散正弦变换(ADST)、翻转ADST(例如，逆序ADST)和恒等变换(IDTX)。当使用恒等变换时，在垂直或水平方向中的一个方向上跳过变换。在一些示例中，可以跳过变换处理。

量化单元208可以对变换系数块中的变换系数进行量化，以产生经量化的变换系数块。量化单元208可以根据与当前块相关联的量化参数(QP)值来对变换系数块的变换系数进行量化。视频编码器200(例如，经由模式选择单元202)可以通过调整与CU相关联的QP值，来调整应用于与当前块相关联的变换系数块的量化程度。量化可能引入信息损失，并且因此，经量化的变换系数可能具有与由变换处理单元206所产生的原始变换系数相比较低的精度。

逆量化单元210和逆变换处理单元212可以将逆量化和逆变换分别应用于经量化的变换系数块，以根据变换系数块重构残差块。重构单元214可以基于经重构的残差块和由模式选择单元202生成的预测块来产生与当前块相对应的重构块(尽管潜在地具有某种程度的失真)。例如，重构单元214可以将经重构的残差块的样本加到来自由模式选择单元202所生成的预测块的对应样本，以产生经重构的块。

滤波器单元216可以对经重构的块执行一个或多个滤波器操作。例如，滤波器单元216可以执行去块操作以减少沿着CU的边缘的块效应伪影。在一些示例中，可以跳过滤波器单元216的操作。

当根据AV1进行操作时，滤波单元216可以对经重构的块执行一个或多个滤波器操作。例如，滤波器单元216可以执行解块操作以减少沿CU边缘的块状伪影。在其它示例中，滤波器单元216可以应用约束定向增强滤波器(CDEF)(其可以在解块之后应用)，并且可以包括基于估计的边缘方向来应用不可分离、非线性、低通方向滤波器。滤波器单元216还可以包括在CDEF之后应用的环路恢复滤波器，并且可以包括可分离的对称归一化维纳滤波器或双自导滤波器。

视频编码器200将经重构的块存储在DPB 218中。例如，在不执行滤波器单元216的操作的示例中，重构单元214可以将经重构的块存储到DPB 218。在执行滤波器单元216的操作的示例中，滤波器单元216可以将经滤波的重构块存储到DPB 218。运动估计单元222和运动补偿单元224可以从DPB 218取回由经重构的(并且潜在地经滤波的)块形成的参考图片，以对后续编码的图片的块进行帧间预测。另外，帧内预测单元226可以使用在DPB 218中的当前图片的经重构的块来对当前图片中的其它块进行帧内预测。

通常，熵编码单元220可以对从视频编码器200的其它功能组件接收的语法元素进行熵编码。例如，熵编码单元220可以对来自量化单元208的经量化的变换系数块进行熵编码。作为另一示例，熵编码单元220可以对来自模式选择单元202的预测语法元素(例如，用于帧间预测的运动信息或用于帧内预测的帧内模式信息)进行熵编码。熵编码单元220可以对作为视频数据的另一示例的语法元素执行一个或多个熵编码操作，以生成经熵编码的数据。例如，熵编码单元220可以对数据执行上下文自适应变长译码(CAVLC)操作、CABAC操作、可变到可变(V2V)长度译码操作、基于语法的上下文自适应二进制算术译码(SBAC)操作、概率区间划分熵(PIPE)译码操作、指数哥伦布编码操作、或另一类型的熵编码操作。在一些示例中，熵编码单元220可以在旁路模式下操作，其中语法元素未被熵编码。

视频编码器200可以输出比特流，其包括用于重构切片或图片的块所需要的经熵编码的语法元素。特别是，熵编码单元220可以输出比特流。

根据AV1，熵编码单元220可以被配置为符号到符号自适应多符号算术译码器。AV1中的语法元素包括N个元素的字母表，并且上下文(例如，概率模型)包括N个概率的集合。熵编码单元220可以将概率存储为n比特(例如，15比特)累积分布函数(CDF)。熵编码单元22可以利用基于字母表大小的更新因子来执行递归缩放，以更新上下文。

上述操作是相对于块来描述的。这样的描述应当被理解为是用于亮度译码块和/或色度译码块的操作。如上文所描述的，在一些示例中，亮度译码块和色度译码块是CU的亮度分量和色度分量。在一些示例中，亮度译码块和色度译码块是PU的亮度分量和色度分量。

在一些示例中，不需要针对色度译码块来重复关于亮度编码块执行的操作。作为一个示例，不需要为了识别针对色度块的运动矢量(MV)和参考图片来重复用于识别针对亮度译码块的MV和参考图片的操作。确切地说，可以对针对亮度译码块的MV进行缩放以确定针对色度块的MV，并且参考图片可以是相同的。作为另一示例，帧内预测过程对于亮度译码块和色度译码块可以是相同的。

视频编码器200表示被配置为对视频数据进行编码的设备的示例，该设备包括：存储器，其被配置为存储视频数据；以及一个或多个处理单元，其在电路中实现并且被配置为：构造合并候选的合并候选列表，其中，合并候选列表具有N1个候选，N1为正整数值；对合并候选列表中的合并候选进行重新排序以创建经重新排序的合并候选列表；减少经重新排序的合并候选列表以创建输出合并候选列表，其中，输出合并候选列表具有N2个候选，其中，N2小于N1；以及使用输出合并候选列表来对视频数据的块进行编码。

图11是示出可以执行本公开内容的技术的示例视频解码器300的方块图。图11是出于解释的目的而提供的，并且不是对如在本公开内容中广泛地举例说明和描述的技术的限制。出于解释的目的，本公开内容根据VVC(正在开发的ITU-T H.266)和HEVC(ITU-TH.265)的技术来描述视频解码器300。然而，本公开内容的技术可以由被配置为其它视频译码标准的视频译码设备来执行。

在图11的示例中，视频解码器300包括译码图片缓冲器(CPB)存储器320、熵解码单元302、预测处理单元304、逆量化单元306、逆变换处理单元308、重构单元310、滤波器单元312和解码图片缓冲器(DPB)134。CPB存储器320、熵解码单元302、预测处理单元304、逆量化单元306、逆变换处理单元308、重构单元310、滤波器单元312和DPB 134中的任何或全部单元可以在一个或多个处理器中或者在处理电路中实现。例如，视频解码器300的单元可以被实现为一个或多个电路或逻辑元件，作为硬件电路的一部分，或者作为处理器、ASIC或FPGA的一部分。此外，视频解码器300可以包括额外或替代的处理器或处理电路以执行这些和其它功能。

预测处理单元304包括运动补偿单元316和帧内预测单元318。预测处理单元304可以包括用于根据其它预测模式来执行预测的额外单元。作为示例，预测处理单元304可以包括调色板单元、块内复制单元(其可以形成运动补偿单元316的一部分)、仿射单元、线性模型(LM)单元等。在其它示例中，视频解码器300可以包括更多、更少或不同的功能组件。

当根据AV1进行操作时，补偿单元316可以被配置为使用平移运动补偿、仿射运动补偿、OBMC和/或复合帧间帧内预测来对视频数据的译码块(例如，亮度译码块和色度译码块两者)进行解码，如上文所描述的。帧内预测单元318可以被配置为使用定向帧内预测、非定向帧内预测、递归滤波器帧内预测、CFL预测、块内复制(IBC)和/或调色板模式来对视频数据的译码块(例如，亮度译码块和色度译码块两者)进行解码，如上文所描述的。

CPB存储器320可以存储要由视频解码器300的组件进行解码的视频数据，比如经编码的视频比特流。例如，可以从计算机可读介质110(图1)获得被存储在CPB存储器320中的视频数据。CPB存储器320可以包括存储来自经编码的视频比特流的经编码的视频数据(例如，语法元素)的CPB。此外，CPB存储器320可以存储除了经译码的图片的语法元素之外的视频数据，比如表示来自视频解码器300的各个单元的输出的临时数据。DPB 314通常存储经解码的图片，视频解码器300可以输出经解码的图片，和/或在对经编码的视频比特流的后续数据或图片进行解码时使用经解码的图片作为参考视频数据。CPB存储器320和DPB314可以由各种存储器设备中的任何存储器设备形成，比如DRAM，包括SDRAM、MRAM、RRAM或其它类型的存储器设备。CPB存储器320和DPB 314可以由相同的存储器设备或单独的存储器设备来提供。在各个示例中，CPB存储器320可以与视频解码器300的其它组件在芯片上，或者相对于那些组件在芯片外。

另外或替代地，在一些示例中，视频解码器300可以从存储器120(图1)取回经译码的视频数据。也就是说，存储器120可以如上文所讨论地利用CPB存储器320来存储数据。同样，当视频解码器300的一些或全部功能是用要由视频解码器300的处理电路执行的软件来实现的时，存储器120可以存储要由视频解码器300执行的指令。

示出图11中示出的各个单元以帮助理解由视频解码器300执行的操作。这些单元可以被实现为固定功能电路、可编程电路、或其组合。类似于图10，固定功能电路指代提供特定功能并且关于可以执行的操作被预先设置的电路。可编程电路指代可以被编程以执行各种任务并且在可以执行的操作上提供灵活功能的电路。例如，可编程电路可以执行软件或固件，软件或固件使得可编程电路以由软件或固件的指令所定义的方式进行操作。固定功能电路可以执行软件指令(例如，以接收参数或输出参数)，但是固定功能电路执行的操作的类型通常是不可变的。在一些示例中，这些单元中的一个或多个单元可以是不同的电路块(固定功能或可编程)，并且在一些示例中，这些单元中的一个或多个单元可以是集成电路。

视频解码器300可以包括由可编程电路形成的ALU、EFU、数字电路、模拟电路和/或可编程内核。在由在可编程电路上执行的软件执行视频解码器300的操作的示例中，片上或片外存储器可以存储视频解码器300接收并且执行的软件的指令(例如，目标代码)。

熵解码单元302可以从CPB接收经编码的视频数据，并且对视频数据进行熵解码以重现语法元素。预测处理单元304、逆量化单元306、逆变换处理单元308、重构单元310和滤波器单元312可以基于从比特流中提取的语法元素来生成经解码的视频数据。

通常，视频解码器300逐块地重构图片。视频解码器300可以单独地对每个块执行重构操作(其中，当前正在被重构(即，被解码)的块可以被称为“当前块”)。

熵解码单元302可以对定义经量化的变换系数块的经量化的变换系数的语法元素以及变换信息(比如量化参数(QP)和/或变换模式指示)进行熵解码。逆量化单元306可以使用与经量化的变换系数块相关联的QP来确定量化程度，并且同样地，确定供逆量化单元306应用的逆量化程度。逆量化单元306可以例如执行按位左移操作以对经量化的变换系数进行逆量化。逆量化单元306从而可以形成包括变换系数的变换系数块。

在逆量化单元306形成变换系数块之后，逆变换处理单元308可以将一种或多种逆变换应用于变换系数块，以生成与当前块相关联的残差块。例如，逆变换处理单元308可以对变换系数块应用逆DCT、逆整数变换、逆Karhunen-Loeve变换(KLT)、逆旋转变换、逆方向变换或另一逆变换。

此外，预测处理单元304根据由熵解码单元302进行熵解码的预测信息语法元素来生成预测块。例如，如果预测信息语法元素指示当前块是经帧间预测的，则运动补偿单元316可以生成预测块。在这种情况下，预测信息语法元素可以指示在DPB 314中的要从其取回参考块的参考图片、以及标识相对于当前块在当前图片中的位置而言参考块在参考图片中的位置的运动矢量。运动补偿单元316通常可以以与关于运动补偿单元224(图10)所描述的方式基本类似的方式来执行帧间预测过程。

作为另一示例，如果预测信息语法元素指示当前块是经帧内预测的，则帧内预测单元318可以根据由预测信息语法元素指示的帧内预测模式来生成预测块。再次，帧内预测单元318通常可以以与关于帧内预测单元226(图10)所描述的方式基本上类似的方式来执行帧内预测过程。帧内预测单元318可以从DPB 314取回当前块的相邻样本的数据。

重构单元310可以使用预测块和残差块来重构当前块。例如，重构单元310可以将残差块的样本加到预测块的对应样本以重构当前块。

滤波器单元312可以对经重构的块执行一个或多个滤波器操作。例如，滤波器单元312可以执行去块操作以减少沿着经重构的块的边缘的块效应伪影。不一定在所有示例中都执行滤波器单元312的操作。

视频解码器300可以将经重构的块存储在DPB 314中。例如，在不执行滤波器单元312的操作的示例中，重构单元310可以将经重构的块存储到DPB 314中。在执行滤波器单元312的操作的示例中，滤波器单元312可以将经滤波的重构块存储到DPB 314。如上文所讨论的，DPB 314可以将参考信息(比如用于帧内预测的当前图片以及用于后续运动补偿的先前解码的图片的样本)提供给预测处理单元304。此外，视频解码器300可以从DPB 314输出经解码的图片(例如，经解码的视频)，以用于在显示设备(比如图1的显示设备118)上的后续呈现。

以这种方式，视频解码器300表示视频解码设备的示例，该视频解码设备包括：存储器，其被配置为存储视频数据；以及一个或多个处理单元，其在电路中实现并且被配置为：构造合并候选的合并候选列表，其中，合并候选列表具有N1个候选，N1为正整数值；对合并候选列表中的合并候选进行重新排序以创建经重新排序的合并候选列表；减少经重新排序的合并候选列表以创建输出合并候选列表，其中，输出合并候选列表具有N2个候选，其中，N2小于N1；以及使用输出合并候选列表来对视频数据的块进行解码。

图12是示出根据本公开内容的技术的用于对当前块进行编码的示例方法的流程图。当前块可以包括当前CU。尽管是相对于视频编码器200(图1和10)来描述的，但是应当理解的是，其它设备可以被配置为执行与图12的方法类似的方法。

在该示例中，视频编码器200首先预测当前块(350)。例如，视频编码器200可以形成用于当前块的预测块。然后，视频编码器200可以计算用于当前块的残差块(352)。为了计算残差块，视频编码器200可以计算在原始的未经编码的块与用于当前块的预测块之间的差。然后，视频编码器200可以对残差块进行变换并且对残差块的变换系数进行量化(354)。接下来，视频编码器200可以扫描残差块的经量化的变换系数(356)。在扫描期间或在扫描之后，视频编码器200可以对变换系数进行熵编码(358)。例如，视频编码器200可以使用CAVLC或CABAC来对变换系数进行编码。然后，视频编码器200可以输出块的经熵编码的数据(360)。

图13是示出根据本公开内容的技术的用于对视频数据的当前块进行解码的示例方法的流程图。当前块可以包括当前CU。尽管是相对于视频解码器300(图1和11)来描述的，但是应当理解的是，其它设备可以被配置为执行与图13的方法类似的方法。

视频解码器300可以接收用于当前块的经熵编码的数据，比如经熵编码的预测信息和用于与当前块相对应的残差块的变换系数的经熵编码的数据(370)。视频解码器300可以对经熵编码的数据进行熵解码以确定用于当前块的预测信息并且重现残差块的变换系数(372)。视频解码器300可以例如使用如由用于当前块的预测信息所指示的帧内或帧间预测模式来预测当前块(374)，以计算用于当前块的预测块。然后，视频解码器300可以对所重现的变换系数进行逆扫描(376)，以创建经量化的变换系数的块。然后，视频解码器300可以对变换系数进行逆量化并且将逆变换应用于变换系数以产生残差块(378)。最终，视频解码器300可以通过将预测块和残差块进行组合来对当前块进行解码(380)。

图14是示出根据本公开内容的技术的用于对当前块进行编码的另一示例方法的流程图。图14的技术可以由视频编码器200的一个或多个结构组件(包括运动估计单元222和/或运动补偿单元224)来执行。

在本公开内容的一个示例中，视频编码器200可以被配置为构造合并候选的合并候选列表，其中，合并候选列表具有N1个候选，N1为正整数值(1400)。视频编码器200还可以被配置为对合并候选列表中的合并候选进行重新排序以创建经重新排序的合并候选列表(1402)，并且减少经重新排序的合并候选列表以创建输出合并候选列表，其中，输出合并候选列表具有N2个候选，其中，N2小于N1(1404)。然后，视频编码器200可以使用输出合并候选列表来对视频数据的块进行编码(1406)。

在一个示例中，为了对合并候选列表中的合并候选进行重新排序以创建经重新排序的合并候选列表，视频编码器200可以被配置为使用模板匹配成本来对合并候选列表中的合并候选进行重新排序。

在另一示例中，为了对合并候选列表中的合并候选进行重新排序以创建经重新排序的合并候选列表，视频编码器200可以被配置为使用双边匹配成本来对合并候选列表中的合并候选进行重新排序。

在另一示例中，为了对合并候选列表中的合并候选进行重新排序以创建经重新排序的合并候选列表，视频编码器200可以被配置为使用双预测成本来对合并候选列表中的合并候选进行重新排序。

在另一示例中，视频编码器200可以被配置为基于N2的值来对关于输出合并候选列表的合并索引进行编码。

在另一示例中，为了减少经重新排序的合并候选列表，视频编码器200被配置为丢弃经重新排序的合并候选列表中的最后N1-N2个候选。

在另一示例中，视频编码器200可以被配置为对指示N1的第一值的语法元素进行编码，并且对指示N2的第二值的语法元素进行编码。在另一示例中，视频编码器200可以被配置为对指示N2的第一值的语法元素进行编码，并且对指示k的第二值的语法元素进行编码，其中，k大于0，并且其中，N1等于N2+k。在另一示例中，视频编码器200可以被配置为对指示N2的第一值的语法元素进行编码，并且将用于N1的第二值确定为N2+k，其中，k是大于0的固定整数值。在另一示例中，视频编码器200可以被配置为基于合并模式来确定用于k的第三值。

图15是示出根据本公开内容的技术的用于对当前块进行解码的另一示例方法的流程图。图15的技术可以由视频解码器300的一个或多个结构组件(包括运动补偿单元316)来执行。

在本公开内容的一个示例中，视频解码器300可以被配置为构造合并候选的合并候选列表，其中，合并候选列表具有N1个候选，N1为正整数值(1500)。视频解码器300还可以被配置为对合并候选列表中的合并候选进行重新排序以创建经重新排序的合并候选列表(1502)，并且减少经重新排序的合并候选列表以创建输出合并候选列表，其中，输出合并候选列表具有N2个候选，其中，N2小于N1(1504)。然后，视频解码器300可以使用输出合并候选列表来对视频数据的块进行解码(1506)。

在一个示例中，为了对合并候选列表中的合并候选进行重新排序以创建经重新排序的合并候选列表，视频解码器300可以被配置为使用模板匹配成本来对合并候选列表中的合并候选进行重新排序。

在另一示例中，为了对合并候选列表中的合并候选进行重新排序以创建经重新排序的合并候选列表，视频解码器300可以被配置为使用双边匹配成本来对合并候选列表中的合并候选进行重新排序。

在另一示例中，为了对合并候选列表中的合并候选进行重新排序以创建经重新排序的合并候选列表，视频解码器300可以被配置为使用双预测成本来对合并候选列表中的合并候选进行重新排序。

在另一示例中，视频解码器300可以被配置为基于N2的值来对关于输出合并候选列表的合并索引进行解码。

在另一示例中，为了减少经重新排序的合并候选列表，视频解码器300被配置为丢弃经重新排序的合并候选列表中的最后N1-N2个候选。

在另一示例中，视频解码器300可以被配置为对指示N1的第一值的语法元素进行解码，并且对指示N2的第二值的语法元素进行解码。在另一示例中，视频解码器300可以被配置为对指示N2的第一值的语法元素进行解码，并且对指示k的第二值的语法元素进行解码，其中，k大于0，并且其中，N1等于N2+k。在另一示例中，视频解码器300可以被配置为对指示N2的第一值的语法元素进行解码，并且将用于N1的第二值确定为N2+k，其中，k是大于0的固定整数值。在另一示例中，视频解码器300可以被配置为基于合并模式来确定用于k的第三值。

下文描述本公开内容的其它说明性方面。

方面1A-一种对视频数据进行译码的方法，方法包括：构造合并候选的合并候选列表，其中，合并候选列表具有N1个候选；对合并候选列表中的合并候选进行重新排序以创建经重新排序的合并候选列表；修剪经重新排序的合并候选列表以创建输出合并候选列表，其中，输出合并候选列表具有N2个候选，其中，N2小于N1；以及使用输出合并候选列表来对视频数据的块进行译码。

方面2A-根据方面1A所述的方法，其中，对合并候选列表中的合并候选进行重新排序以创建经重新排序的合并候选列表包括：使用模板匹配成本来对合并候选列表中的合并候选进行重新排序。

方面3A-根据方面1A所述的方法，其中，对合并候选列表中的合并候选进行重新排序以创建经重新排序的合并候选列表包括：使用双边匹配成本来对合并候选列表中的合并候选进行重新排序。

方面4A-根据方面1A所述的方法，其中，对合并候选列表中的合并候选进行重新排序以创建经重新排序的合并候选列表包括：使用双预测成本来对合并候选列表中的合并候选进行重新排序。

方面5A-根据方面1A所述的方法，还包括：基于N2的值来对关于输出合并候选列表的合并索引进行译码。

方面6A-根据方面1A所述的方法，其中，修剪经重新排序的合并候选列表包括：丢弃经重新排序的合并候选列表中的最后N1-N2个候选。

方面7A-根据方面1A所述的方法，还包括：对指示N1的第一值的语法元素进行译码；以及对指示N2的第二值的语法元素进行译码。

方面8A-根据方面1A所述的方法，还包括：对指示N2的第一值的语法元素进行译码；以及对指示k的第二值的语法元素进行译码，其中，k大于0，并且其中，N1等于N2+k。

方面9A-根据方面1A所述的方法，还包括：对指示N2的第一值的语法元素进行译码；以及将用于N1的第二值确定为N2+k，其中，k是大于0的固定整数值。

方面10A-根据方面9A所述的方法，还包括：基于合并模式来确定用于k的第三值。

方面11A-根据方面1A所述的方法，其中，对合并候选列表中的合并候选进行重新排序以创建经重新排序的合并候选列表包括：使用模板匹配成本来对合并候选列表中的合并候选进行重新排序。

方面12A-根据方面1A-11A中任何方面所述的方法，其中，译码包括解码。

方面13A-根据方面1A-11A中任何方面所述的方法，其中，译码包括编码。

方面14A-一种用于对视频数据进行译码的设备，设备包括用于执行根据方面1A-13A中任何方面的方法的一个或多个单元。

方面15A-根据方面14A所述的设备，其中，一个或多个单元包括在电路中实现的一个或多个处理器。

方面16A-根据方面14A和15A中任何方面所述的设备，还包括用于存储视频数据的存储器。

方面17A-根据方面14A-16A中任何方面所述的设备，还包括被配置为显示经解码的视频数据的显示器。

方面18A-根据方面14A-17A中任何方面所述的设备，其中，设备包括相机、计算机、移动设备、广播接收机设备或机顶盒中的一项或多项。

方面19A-根据方面14A-18A中任何方面所述的设备，其中，设备包括视频解码器。

方面20A-根据方面14A-18A中任何方面所述的设备，其中，设备包括视频编码器。

方面21A-一种具有存储在其上的指令的计算机可读存储介质，指令在被执行时使得一个或多个处理器执行根据方面1A-13A中任何方面所述的方法。

方面22A-一种对视频数据进行译码的方法，方法包括：构造合并候选的合并候选列表，其中，合并候选列表具有N1个候选；对合并候选列表中的合并候选进行重新排序以创建经重新排序的合并候选列表；修剪经重新排序的合并候选列表以创建输出合并候选列表，其中，输出合并候选列表具有N2个候选，其中，N2小于N1；以及使用输出合并候选列表来对视频数据的块进行译码。

方面23A-根据方面22A所述的方法，其中，对合并候选列表中的合并候选进行重新排序以创建经重新排序的合并候选列表包括：使用模板匹配成本来对合并候选列表中的合并候选进行重新排序。

方面24A-根据方面22A所述的方法，其中，对合并候选列表中的合并候选进行重新排序以创建经重新排序的合并候选列表包括：使用双边匹配成本来对合并候选列表中的合并候选进行重新排序。

方面25A-根据方面22A所述的方法，其中，对合并候选列表中的合并候选进行重新排序以创建经重新排序的合并候选列表包括：使用双预测成本来对合并候选列表中的合并候选进行重新排序。

方面26A-根据方面22A-25A中任何方面所述的方法，还包括：基于N2的值来对关于输出合并候选列表的合并索引进行译码。

方面27A-根据方面22A-26A中任何方面所述的方法，其中，修剪经重新排序的合并候选列表包括：丢弃经重新排序的合并候选列表中的最后N1-N2个候选。

方面28A-根据方面22A-27A中任何方面所述的方法，还包括：对指示N1的第一值的语法元素进行译码；以及对指示N2的第二值的语法元素进行译码。

方面29A-根据方面22A-27A中任何方面所述的方法，还包括：对指示N2的第一值的语法元素进行译码；以及对指示k的第二值的语法元素进行译码，其中，k大于0，并且其中，N1等于N2+k。

方面30A-根据方面22A-27A中任何方面所述的方法，还包括：对指示N2的第一值的语法元素进行译码；以及将用于N1的第二值确定为N2+k，其中，k是大于0的固定整数值。

方面31A-根据方面30A所述的方法，还包括：基于合并模式来确定用于k的第三值。

方面32A-根据方面22A-31A中任何方面所述的方法，其中，对合并候选列表中的合并候选进行重新排序以创建经重新排序的合并候选列表包括：使用模板匹配成本来对合并候选列表中的合并候选进行重新排序。

方面33A-根据方面22A-32A中任何方面所述的方法，其中，译码包括解码。

方面34A-根据方面22A-32A中任何方面所述的方法，其中，译码包括编码。

方面35A-一种被配置为对视频数据进行译码的装置，装置包括：存储器；以及在电路中实现并且与存储器相通信的一个或多个处理器，一个或多个处理器被配置为执行根据方面22A-32A的任何方法。

方面1B-一种对视频数据进行译码的方法，方法包括：构造合并候选的合并候选列表，其中，合并候选列表具有N1个候选，N1为正整数值；对合并候选列表中的合并候选进行重新排序以创建经重新排序的合并候选列表；减少经重新排序的合并候选列表以创建输出合并候选列表，其中，输出合并候选列表具有N2个候选，其中，N2小于N1；以及使用输出合并候选列表来对视频数据的块进行译码。

方面2B-根据方面1B所述的方法，其中，对合并候选列表中的合并候选进行重新排序以创建经重新排序的合并候选列表包括：使用模板匹配成本来对合并候选列表中的合并候选进行重新排序。

方面3B-根据方面1B所述的方法，其中，对合并候选列表中的合并候选进行重新排序以创建经重新排序的合并候选列表包括：使用双边匹配成本来对合并候选列表中的合并候选进行重新排序。

方面4B-根据方面1B所述的方法，其中，对合并候选列表中的合并候选进行重新排序以创建经重新排序的合并候选列表包括：使用双预测成本来对合并候选列表中的合并候选进行重新排序。

方面5B-根据方面1B所述的方法，还包括：基于N2的值来对关于输出合并候选列表的合并索引进行译码。

方面6B-根据方面1B所述的方法，其中，减少经重新排序的合并候选列表包括：丢弃经重新排序的合并候选列表中的最后N1-N2个候选。

方面7B-根据方面1B所述的方法，还包括：对指示N1的第一值的语法元素进行译码；以及对指示N2的第二值的语法元素进行译码。

方面8B-根据方面1B所述的方法，还包括：对指示N2的第一值的语法元素进行译码；以及对指示k的第二值的语法元素进行译码，其中，k大于0，并且其中，N1等于N2+k。

方面9B-根据方面1B所述的方法，还包括：对指示N2的第一值的语法元素进行译码；以及将用于N1的第二值确定为N2+k，其中，k是大于0的固定整数值。

方面10B-根据方面9B所述的方法，还包括：基于合并模式来确定用于k的第三值。

方面11B-根据方面1B所述的方法，其中，译码包括编码。

方面12B-根据方面1B所述的方法，其中，译码包括解码。

方面13B-一种被配置为对视频数据进行译码的装置，装置包括：存储器，其被配置为存储视频数据；以及与存储器相通信的一个或多个处理器，一个或多个处理器被配置为：构造合并候选的合并候选列表，其中，合并候选列表具有N1个候选，N1为正整数值；对合并候选列表中的合并候选进行重新排序以创建经重新排序的合并候选列表；减少经重新排序的合并候选列表以创建输出合并候选列表，其中，输出合并候选列表具有N2个候选，其中，N2小于N1；以及使用输出合并候选列表来对视频数据的块进行译码。

方面14B-根据方面13B所述的装置，其中，为了对合并候选列表中的合并候选进行重新排序以创建经重新排序的合并候选列表，一个或多个处理器还被配置为：使用模板匹配成本来对合并候选列表中的合并候选进行重新排序。

方面15B-根据方面13B所述的装置，其中，为了对合并候选列表中的合并候选进行重新排序以创建经重新排序的合并候选列表，一个或多个处理器还被配置为：使用双边匹配成本来对合并候选列表中的合并候选进行重新排序。

方面16B-根据方面13B所述的装置，其中，为了对合并候选列表中的合并候选进行重新排序以创建经重新排序的合并候选列表，一个或多个处理器还被配置为：使用双预测成本来对合并候选列表中的合并候选进行重新排序。

方面17B-根据方面13B所述的装置，其中，一个或多个处理器还被配置为：基于N2的值来对关于输出合并候选列表的合并索引进行译码。

方面18B-根据方面13B所述的装置，其中，为了减少经重新排序的合并候选列表，一个或多个处理器还被配置为：丢弃经重新排序的合并候选列表中的最后N1-N2个候选。

方面19B-根据方面13B所述的装置，其中，一个或多个处理器还被配置为：对指示N1的第一值的语法元素进行译码；以及对指示N2的第二值的语法元素进行译码。

方面20B-根据方面13B所述的装置，其中，一个或多个处理器还被配置为：对指示N2的第一值的语法元素进行译码；以及对指示k的第二值的语法元素进行译码，其中，k大于0，并且其中，N1等于N2+k。

方面21B-根据方面13B所述的装置，其中，一个或多个处理器还被配置为：对指示N2的第一值的语法元素进行译码；以及将用于N1的第二值确定为N2+k，其中，k是大于0的固定整数值。

方面22B-根据方面21B所述的装置，其中，一个或多个处理器还被配置为：基于合并模式来确定用于k的第三值。

方面23B-根据方面14B所述的装置，其中，装置被配置为对视频数据进行编码。

方面24B-根据方面14B所述的装置，其中，装置被配置为对视频数据进行解码。

方面25B-一种被配置为对视频数据进行译码的装置，装置包括：用于构造合并候选的合并候选列表的单元，其中，合并候选列表具有N1个候选，N1为正整数值；用于对合并候选列表中的合并候选进行重新排序以创建经重新排序的合并候选列表的单元；用于减少经重新排序的合并候选列表以创建输出合并候选列表的单元，其中，输出合并候选列表具有N2个候选，其中，N2小于N1；以及用于使用输出合并候选列表来对视频数据的块进行译码的单元。

方面26B-一种存储指令的非暂时性计算机可读存储介质，指令在被执行时使得被配置为对视频数据进行译码的设备的一个或多个处理器进行以下操作：构造合并候选的合并候选列表，其中，合并候选列表具有N1个候选，N1为正整数值；对合并候选列表中的合并候选进行重新排序以创建经重新排序的合并候选列表；减少经重新排序的合并候选列表以创建输出合并候选列表，其中，输出合并候选列表具有N2个候选，其中，N2小于N1；以及使用输出合并候选列表来对视频数据的块进行译码。

方面1C-一种对视频数据进行译码的方法，方法包括：构造合并候选的合并候选列表，其中，合并候选列表具有N1个候选，N1为正整数值；对合并候选列表中的合并候选进行重新排序以创建经重新排序的合并候选列表；减少经重新排序的合并候选列表以创建输出合并候选列表，其中，输出合并候选列表具有N2个候选，其中，N2小于N1；以及使用输出合并候选列表来对视频数据的块进行译码。

方面2C-根据方面1C所述的方法，其中，对合并候选列表中的合并候选进行重新排序以创建经重新排序的合并候选列表包括：使用模板匹配成本来对合并候选列表中的合并候选进行重新排序。

方面3C-根据方面1C所述的方法，其中，对合并候选列表中的合并候选进行重新排序以创建经重新排序的合并候选列表包括：使用双边匹配成本来对合并候选列表中的合并候选进行重新排序。

方面4C-根据方面1C所述的方法，其中，对合并候选列表中的合并候选进行重新排序以创建经重新排序的合并候选列表包括：使用双预测成本来对合并候选列表中的合并候选进行重新排序。

方面5C-根据方面1C-4C中任何方面所述的方法，还包括：基于N2的值来对关于输出合并候选列表的合并索引进行译码。

方面6C-根据方面1C-5C中任何方面所述的方法，其中，减少经重新排序的合并候选列表包括：丢弃经重新排序的合并候选列表中的最后N1-N2个候选。

方面7C-根据方面1C-6C中任何方面所述的方法，还包括：对指示N1的第一值的语法元素进行译码；以及对指示N2的第二值的语法元素进行译码。

方面8C-根据方面1C-6C中任何方面所述的方法，还包括：对指示N2的第一值的语法元素进行译码；以及对指示k的第二值的语法元素进行译码，其中，k大于0，并且其中，N1等于N2+k。

方面9C-根据方面1C-6C中任何方面所述的方法，还包括：对指示N2的第一值的语法元素进行译码；以及将用于N1的第二值确定为N2+k，其中，k是大于0的固定整数值。

方面10C-根据方面9C所述的方法，还包括：基于合并模式来确定用于k的第三值。

方面11C-根据方面1C-10C中任何方面所述的方法，其中，译码包括编码。

方面12C-根据方面1C-10C中任何方面所述的方法，其中，译码包括解码。

方面13C-一种被配置为对视频数据进行译码的装置，装置包括：存储器，其被配置为存储视频数据；以及与存储器相通信的一个或多个处理器，一个或多个处理器被配置为：构造合并候选的合并候选列表，其中，合并候选列表具有N1个候选，N1为正整数值；对合并候选列表中的合并候选进行重新排序以创建经重新排序的合并候选列表；减少经重新排序的合并候选列表以创建输出合并候选列表，其中，输出合并候选列表具有N2个候选，其中，N2小于N1；以及使用输出合并候选列表来对视频数据的块进行译码。

方面14C-根据方面13C所述的装置，其中，为了对合并候选列表中的合并候选进行重新排序以创建经重新排序的合并候选列表，一个或多个处理器还被配置为：使用模板匹配成本来对合并候选列表中的合并候选进行重新排序。

方面15C-根据方面13C所述的装置，其中，为了对合并候选列表中的合并候选进行重新排序以创建经重新排序的合并候选列表，一个或多个处理器还被配置为：使用双边匹配成本来对合并候选列表中的合并候选进行重新排序。

方面16C-根据方面13C所述的装置，其中，为了对合并候选列表中的合并候选进行重新排序以创建经重新排序的合并候选列表，一个或多个处理器还被配置为：使用双预测成本来对合并候选列表中的合并候选进行重新排序。

方面17C-根据方面13C-16C中任何方面所述的装置，其中，一个或多个处理器还被配置为：基于N2的值来对关于输出合并候选列表的合并索引进行译码。

方面18C-根据方面13C-17C中任何方面所述的装置，其中，为了减少经重新排序的合并候选列表，一个或多个处理器还被配置为：丢弃经重新排序的合并候选列表中的最后N1-N2个候选。

方面19C-根据方面13C-18C中任何方面所述的装置，其中，一个或多个处理器还被配置为：对指示N1的第一值的语法元素进行译码；以及对指示N2的第二值的语法元素进行译码。

方面20C-根据方面13C-18C中任何方面所述的装置，其中，一个或多个处理器还被配置为：对指示N2的第一值的语法元素进行译码；以及对指示k的第二值的语法元素进行译码，其中，k大于0，并且其中，N1等于N2+k。

方面21C-根据方面13C-18C中任何方面所述的装置，其中，一个或多个处理器还被配置为：对指示N2的第一值的语法元素进行译码；以及将用于N1的第二值确定为N2+k，其中，k是大于0的固定整数值。

方面22C-根据方面22C所述的装置，其中，一个或多个处理器还被配置为：基于合并模式来确定用于k的第三值。

方面23C-根据方面13C-22C中任何方面所述的装置，其中，装置被配置为对视频数据进行编码。

方面24C-根据方面13C-22C中任何方面所述的装置，其中，装置被配置为对视频数据进行解码。

要认识到的是，根据示例，本文中所描述的任何技术的某些动作或事件可以以不同的顺序执行，可以被添加、合并或完全省略(例如，并非所有描述的动作或事件是对于所述技术的实施都是必要的)。此外，在某些示例中，动作或事件可以例如通过多线程处理、中断处理或多个处理器并发地而不是顺序地执行。

在一个或多个示例中，所描述的功能可以用硬件、软件、固件或其任何组合来实现。如果用软件来实现，则所述功能可以作为一个或多个指令或代码存储在计算机可读介质上或者通过计算机可读介质进行传输并且由基于硬件的处理单元执行。计算机可读介质可以包括计算机可读存储介质(其对应于有形介质，比如数据存储介质)或者通信介质，通信介质包括例如根据通信协议来促进计算机程序从一个地方传送到另一地方的任何介质。以这种方式，计算机可读介质通常可以对应于(1)非暂时性的有形计算机可读存储介质、或者(2)比如信号或载波之类的通信介质。数据存储介质可以是可以由一个或多个计算机或者一个或多个处理器访问以取得用于实现在本公开内容中描述的技术的指令、代码和/或数据结构的任何可用介质。计算机程序产品可以包括计算机可读介质。

通过示例而非限制的方式，这样的计算机可读存储介质可以包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储、磁盘存储或其它磁存储设备、闪存、或者能够用于以指令或数据结构形式存储期望的程序代码并且能够由计算机访问的任何其它介质。此外，任何连接被适当地称为计算机可读介质。例如，如果使用同轴电缆、光纤光缆、双绞线、数字用户线(DSL)或者无线技术(例如，红外线、无线电和微波)从网站、服务器或其它远程源传输指令，则同轴电缆、光纤光缆、双绞线、DSL或者无线技术(例如，红外线、无线电和微波)被包括在介质的定义中。然而，应当理解的是，计算机可读存储介质和数据存储介质不包括连接、载波、信号或其它临时性介质，而是替代地针对非临时性的有形存储介质。如本文中所使用的，磁盘和光盘包括压缩光盘(CD)、激光光盘、光盘、数字多功能光盘(DVD)、软盘和蓝光光盘，其中，磁盘通常磁性地复制数据，而光盘利用激光来光学地复制数据。上述各项的组合也应当被包括在计算机可读介质的范围内。

指令可以由一个或多个处理器来执行，比如一个或多个DSP、通用微处理器、ASIC、FPGA、或其它等效的集成或分立逻辑电路。因此，如本文所使用的术语“处理器”和“处理电路”可以指代前述结构中的任何一者或者适于实现本文中所描述的技术的任何其它结构。另外，在一些方面中，本文中所描述的功能可以在被配置用于编码和解码的专用硬件和/或软件模块内提供，或者被并入经组合的编解码器中。此外，所述技术可以完全在一个或多个电路或逻辑元件中实现。

本公开内容的技术可以在多种多样的设备或装置中实现，包括无线手机、集成电路(IC)或一组IC(例如，芯片组)。在本公开内容中描述各种组件、模块或单元以强调被配置为执行所公开的技术的设备的功能方面，但是不一定需要通过不同的硬件单元来实现。确切而言，如上文所描述的，各种单元可以被组合在编解码器硬件单元中，或者由可互操作的硬件单元的集合(包括如上文所描述的一个或多个处理器)结合适当的软件和/或固件来提供。

已经描述了各个示例。这些示例和其它示例在所附的权利要求的范围内。

Claims

1.一种对视频数据进行译码的方法，所述方法包括：

构造合并候选的合并候选列表，其中，所述合并候选列表具有N1个候选，N1为正整数值；

对所述合并候选列表中的所述合并候选进行重新排序以创建经重新排序的合并候选列表；

减少所述经重新排序的合并候选列表以创建输出合并候选列表，其中，所述输出合并候选列表具有N2个候选，其中，N2小于N1；以及

使用所述输出合并候选列表来对视频数据的块进行译码。

2.根据权利要求1所述的方法，其中，对所述合并候选列表中的所述合并候选进行重新排序以创建所述经重新排序的合并候选列表包括：

使用模板匹配成本来对所述合并候选列表中的所述合并候选进行重新排序。

3.根据权利要求1所述的方法，其中，对所述合并候选列表中的所述合并候选进行重新排序以创建所述经重新排序的合并候选列表包括：

使用双边匹配成本来对所述合并候选列表中的所述合并候选进行重新排序。

4.根据权利要求1所述的方法，其中，对所述合并候选列表中的所述合并候选进行重新排序以创建所述经重新排序的合并候选列表包括：

使用双预测成本来对所述合并候选列表中的所述合并候选进行重新排序。

5.根据权利要求1所述的方法，还包括：

基于N2的值来对关于所述输出合并候选列表的合并索引进行译码。

6.根据权利要求1所述的方法，其中，减少所述经重新排序的合并候选列表包括：

丢弃所述经重新排序的合并候选列表中的最后N1-N2个候选。

7.根据权利要求1所述的方法，还包括：

对指示N1的第一值的语法元素进行译码；以及

对指示N2的第二值的语法元素进行译码。

8.根据权利要求1所述的方法，还包括：

对指示N2的第一值的语法元素进行译码；以及

对指示k的第二值的语法元素进行译码，其中，k大于0，并且其中，N1等于N2+k。

9.根据权利要求1所述的方法，还包括：

对指示N2的第一值的语法元素进行译码；以及

将用于N1的第二值确定为N2+k，其中，k是大于0的固定整数值。

10.根据权利要求9所述的方法，还包括：

基于合并模式来确定用于k的第三值。

11.根据权利要求1所述的方法，其中，译码包括编码。

12.根据权利要求1所述的方法，其中，译码包括解码。

13.一种被配置为对视频数据进行译码的装置，所述装置包括：

存储器，其被配置为存储视频数据；以及

与所述存储器相通信的一个或多个处理器，所述一个或多个处理器被配置为：

使用所述输出合并候选列表来对视频数据的块进行译码。

14.根据权利要求13所述的装置，其中，为了对所述合并候选列表中的所述合并候选进行重新排序以创建所述经重新排序的合并候选列表，所述一个或多个处理器还被配置为：

15.根据权利要求13所述的装置，其中，为了对所述合并候选列表中的所述合并候选进行重新排序以创建所述经重新排序的合并候选列表，所述一个或多个处理器还被配置为：

16.根据权利要求13所述的装置，其中，为了对所述合并候选列表中的所述合并候选进行重新排序以创建所述经重新排序的合并候选列表，所述一个或多个处理器还被配置为：

17.根据权利要求13所述的装置，其中，所述一个或多个处理器还被配置为：

18.根据权利要求13所述的装置，其中，为了减少所述经重新排序的合并候选列表，所述一个或多个处理器还被配置为：

丢弃所述经重新排序的合并候选列表中的最后N1-N2个候选。

19.根据权利要求13所述的装置，其中，所述一个或多个处理器还被配置为：

对指示N1的第一值的语法元素进行译码；以及

对指示N2的第二值的语法元素进行译码。

20.根据权利要求13所述的装置，其中，所述一个或多个处理器还被配置为：

对指示N2的第一值的语法元素进行译码；以及

21.根据权利要求13所述的装置，其中，所述一个或多个处理器还被配置为：

对指示N2的第一值的语法元素进行译码；以及

22.根据权利要求21所述的装置，其中，所述一个或多个处理器还被配置为：

基于合并模式来确定用于k的第三值。

23.根据权利要求13所述的装置，其中，所述装置被配置为对视频数据进行编码。

24.根据权利要求13所述的装置，其中，所述装置被配置为对视频数据进行解码。

25.一种被配置为对视频数据进行译码的装置，所述装置包括：

用于构造合并候选的合并候选列表的单元，其中，所述合并候选列表具有N1个候选，N1为正整数值；

用于对所述合并候选列表中的所述合并候选进行重新排序以创建经重新排序的合并候选列表的单元；

用于减少所述经重新排序的合并候选列表以创建输出合并候选列表的单元，其中，所述输出合并候选列表具有N2个候选，其中，N2小于N1；以及

用于使用所述输出合并候选列表来对视频数据的块进行译码的单元。