CN103329525B

CN103329525B - 用于视频译码的组合参考图片列表建构

Info

Publication number: CN103329525B
Application number: CN201180065489.5A
Authority: CN
Inventors: 陈盈; 穆哈默德·扎伊·科班; 钱威俊; 马尔塔·卡切维奇; 陈培松
Original assignee: Qualcomm Inc
Current assignee: Qualcomm Inc
Priority date: 2011-01-22
Filing date: 2011-12-09
Publication date: 2016-08-24
Anticipated expiration: 2031-12-09
Also published as: CN103329525A; TW201242371A; JP5778298B2; WO2012099656A1; EP2666292B1; EP2666292A1; US20120189053A1; US9008176B2; JP2014509115A

Abstract

本发明涉及用于基于列表0和列表1建构用于在任何方向上对视频块进行单向预测的组合参考图片列表(列表C)的技术。所述技术包括译码经界定以指示列表C的建构信息的一个或一个以上语法元素，且基于所述语法元素从列表0和列表1执行对列表C的参考图片列表建构。所述一个或一个以上语法元素可指示列表C用于单向预测，且还可指示列表C中所识别的参考图片的数目和列表C中的每一条目的参考图片的参考索引。B切片的每一经译码视频块可具有用以指示所述视频块是从列表0和列表1被双向预测(Bi)还是从列表C被单向预测(Pred_LC)的相关联的语法元素，即，inter_pred_idc。

Description

用于视频译码的组合参考图片列表建构

本申请案主张以下临时申请案的权益：2011年1月22日申请的第61/435,271号美国临时申请案、2011年1月22日申请的第61/435,281号美国临时申请案、2011年3月8日申请的第61/450,545号美国临时申请案和2011年5月26日申请的第61/490,557号美国临时申请案，所述申请案中每一者的相应全部内容在此以引用的方式并入本文中。

技术领域

本发明涉及视频译码，且更特定来说，涉及视帧间译码技术。

背景技术

数字视频能力可并入到广泛范围的装置中，所述装置包括数字电视、数字直播系统、无线广播系统、个人数字助理(PDA)、膝上型计算机或桌上型计算机、数码相机、数字记录装置、数字媒体播放器、视频游戏装置、视频游戏控制台、蜂窝式电话或卫星无线电电话、视频电话会议装置等。数字视频装置实施例如以下各者的视频压缩技术以较有效地发射和接收数字视频信息：描述于由MPEG-2、MPEG-4、ITU-T H.263、ITU-TH.264/MPEG-4第10部分(高级视频译码(AVC))界定的标准或新兴高效率视频译码(HEVC)标准和这些标准的扩展中的视频压缩技术。

视频压缩技术执行空间(图片内)预测和/或时间(图片间)预测以减小或移除视频序列中所固有的冗余。对于基于块的视频译码，可将视频切片分割成视频块，视频块还可被称作树块、译码单元(CU)和/或译码节点。可使用关于同一图片中的相邻块的空间预测来编码图片的经帧内译码(I)切片中的视频块。可使用关于其它参考图片中的参考块的时间预测来编码图片的经帧间译码(P或B)切片中的视频块。图片可被称作帧，且参考图片可被称作参考帧。这些术语在本发明中可互换地使用。视频译码装置将参考图片的列表存储于存储器中以供在帧间译码期间使用。显示时间在当前经译码帧之前的参考图片的列表被称作列表0，而显示时间在当前经译码帧之后的参考图片的列表被称作列表1。

发明内容

一般来说，本发明涉及用于基于列表0和列表1建构用于在任何方向(正向或反向)上对视频块进行单向帧间预测(单向预测)的组合参考图片列表(列表C)的技术。所述技术包括在图片或切片层级(例如，切片的切片标头)中译码经界定以指示列表C的建构信息的一个或一个以上语法元素，且基于所述语法元素执行从列表0和列表1对列表C的参考图片列表建构。B切片的每一经译码视频块可具有用以指示所述视频块是从列表0和列表1被双向预测(Bi)还是从列表C被单向预测(Pred_LC)的相关联的语法元素(即，inter_pred_idc)。所述技术减小译码B切片中的视频块的帧间预测状态的成本，这是因为B切片中的视频块的仅两个帧间预测状态是可能的：Bi和Pred_LC，其消耗一个位。

在一个实例中，本发明针对一种译码视频数据的方法，其包含：从存储经解码参考图片的存储器建构第一参考图片列表和第二参考图片列表；建构包括来自所述第一参考图片列表和所述第二参考图片列表中的至少一者的一个或一个以上参考图片的组合参考图片列表；译码指示所述组合参考图片列表的建构信息的一个或一个以上语法元素；以及相对于所述组合参考图片列表中的一个或一个以上参考图片使用单向预测来译码一个或一个以上视频块。举例来说，所述语法元素可指示所述组合参考图片列表用于单向预测、指示所述组合参考图片列表中所识别的所述参考图片的数目，且指示所述组合参考图片列表中的每一条目。

在另一实例中，本发明针对一种视频译码装置，其包含：存储器，所述存储器存储经解码参考图片；以及处理器，所述处理器经配置以：从所述存储器建构第一参考图片列表和第二参考图片列表；建构包括来自所述第一参考图片列表和所述第二参考图片列表中的至少一者的一个或一个以上参考图片的组合参考图片列表；译码指示所述组合参考图片列表的建构信息的一个或一个以上语法元素；以及相对于所述组合参考图片列表中的一个或一个以上参考图片使用单向预测来译码一个或一个以上视频块。

在另一实例中，本发明针对一种视频译码装置，其包含：用于从存储经解码参考图片的存储器建构第一参考图片列表和第二参考图片列表的装置；用于建构包括来自所述第一参考图片列表和所述第二参考图片列表中的至少一者的一个或一个以上参考图片的组合参考图片列表的装置；用于译码指示所述组合参考图片列表的建构信息的一个或一个以上语法元素的装置；以及用于相对于所述组合参考图片列表中的一个或一个以上参考图片使用单向预测来译码一个或一个以上视频块的装置。

在另一实例中，本发明针对一种包含用于译码视频数据的指令的计算机可读存储媒体，所述指令在于处理器中执行后即刻致使所述处理器：从存储经解码参考图片的存储器建构第一参考图片列表和第二参考图片列表；建构包括来自所述第一参考图片列表和所述第二参考图片列表中的至少一者的一个或一个以上参考图片的一组合参考图片列表；译码指示所述组合参考图片列表的建构信息的一个或一个以上语法元素；以及相对于所述组合参考图片列表中的一个或一个以上参考图片使用单向预测来译码一个或一个以上视频块。

在附图和以下描述中阐述一个或一个以上实例的细节。其它特征、目的和优点将从所述描述和图式以及从权利要求书显而易见。

附图说明

图1为说明实例视频编码和解码系统的方框图，所述实例视频编码和解码系统可利用用于建构组合参考图片列表(列表C)且使用列表C有效地译码单向预测视频块的技术。

图2为说明一实例视频编码器的方框图，所述实例视频编码器可实施用于编码指示列表C的建构信息的语法元素且使用列表C来编码单向预测视频块的技术。

图3为说明一实例视频解码器的方框图，所述实例视频解码器可实施用于使用语法元素建构列表C且使用列表C解码单向预测视频块的技术。

图4为说明建构列表C且使用列表C译码单向预测视频块的实例操作的流程图。

图5为说明编码指示列表C的建构信息的语法元素且使用列表C编码单向预测视频块的实例操作的流程图。

图6为说明使用语法元素建构列表C且使用列表C解码单向预测视频块的实例操作的流程图。

图7为说明使用语法元素建构列表C的第一实例操作的流程图。

图8为说明使用语法元素建构列表C的第二实例操作的流程图。

具体实施方式

本发明涉及用于基于列表0和列表1建构用于在任何方向(正向或反向)上对视频块进行单向帧间预测(单向预测)的组合参考图片列表(列表C)的技术。所述技术包括在图片或切片层级(例如，切片的切片标头)中译码经界定以指示列表C的建构信息的一个或一个以上语法元素，且基于所述语法元素执行从列表0和列表1对列表C的参考图片列表建构。B切片的每一经译码视频块随后可具有用以指示所述视频块是从列表0和列表1被双向预测(Bi)还是从列表C被单向预测(Pred_LC)的相关联的语法元素(即，inter_pred_idc)。当来自列表0和列表1的参考图片组合到列表C中以用于单向预测时，B切片中的视频块的仅两个帧间预测状态是可能的：Bi和Pred_LC，其消耗一个位。因此，所述技术导致减小译码B切片中的视频块的帧间预测状态的成本。

常规上，可使用单向预测通过指向列表0中的过去参考图片的单一运动向量来编码P切片中的视频块。可使用(a)单向预测通过指向列表0中的过去参考图片的单一运动向量、(b)单向预测通过指向列表1中的未来参考图片的单一运动向量或(c)双向预测通过分别指向列表0中的过去参考图片和列表1中的未来参考图片的两个运动向量来编码B切片中的视频块。P和B切片分类后来已扩展成包括广义P/B(GPB)切片(其中视频块经编码为B切片)，只是列表0和列表1可包括相同时间方向或不同时间方向上的参考图片。在GPB切片的一个特定实例中，列表0与列表1可为相同的。

在经译码视频切片的切片标头中编码经界定以指示参考图片列表的建构信息的语法元素，且将所述语法元素用信号发送到解码装置。在接收到经译码视频切片和其相关联的语法元素后，解码器即刻基于所述语法元素执行列表0和列表1的参考图片列表建构。对于B切片，每一经译码视频块可具有用以指示所述视频块是在正向方向上从列表0被双向预测(Bi)、单向预测(Pred_L0)还是在反向方向上从列表1被单向预测(Pred_L1)的相关联的语法元素(即，inter_pred_idc)。因此，B切片的inter_pred_idc语法元素消耗两个位来指示如下三种状态中的一者：Bi、Pred_L0或Pred_L1。

在GPB切片的情况下，当列表0与列表1相同时，所述GPB切片中的视频块的仅两个帧间预测状态是可能的：Bi和Pred_L0。在此情况下，使用inter_pred_idc语法元素用信号表示全部三种状态是低效的。替代地，可基于B切片是需要三种状态中的一者的指示的正常B切片(其消耗两个位)还是需要仅两种状态(Bi和Pred_L0)的指示的GPB切片(其仅消耗一个位)来修改inter_pred_idc语法元素。针对B切片中的每一视频块用信号表示仅一个位可提供信令效率的显著增益。

本发明的技术将效率增益扩展到所有B切片(包括GPB切片)，而不管参考图片列表是否相同。所述技术包括建构包括来自列表0和列表1中的至少一者的一个或一个以上参考图片的组合参考图片列表(列表C)。接着使用列表C以用于B切片中的视频块的单向预测。以此方式，仅有必要针对所有B切片中的每一视频块用信号表示两种状态Bi和Pred_LC，其消耗一个位。

当在视频解码器处建构列表C时可能出现某些问题。举例来说，视频编码器可能并未从列表0与列表1两者选择每一和每个参考图片而使其包括于列表C中。当视频解码器不知晓包括于列表C中的参考图片的数目时，视频解码器可能不能够建构列表C，且不能够解析与经译码B切片中的每一视频块相关联的帧间预测状态语法元素。另外，在视频解码器处自动建构列表C可能需要复杂的解码过程。根据所述技术，与B切片相关联的一个或一个以上语法元素可指示列表C是用于单向预测，且还指示列表C中所识别的参考图片的数目和列表C中的每一条目的参考图片的参考索引。

图1为说明一实例视频编码和解码系统10的方框图，所述实例视频编码和解码系统10可利用用于建构组合参考图片列表且使用所述组合参考图片列表有效地译码单向预测视频块的技术。一般来说，参考图片列表可替代地称作参考帧列表。如图1中所展示，系统10包括源装置12，源装置12产生稍后待由目的地装置14解码的经编码视频数据。源装置12和目的地装置14可包含广泛范围的装置中的任一者，包括桌上型计算机、笔记本(即，膝上型)计算机、平板型计算机、机顶盒、电话手持机(例如，所谓的“智能”电话)、所谓的“智能”板、电视、相机、显示装置、数字媒体播放器、视频游戏控制台等。在一些情况下，源装置12和目的地装置14可经装备以进行无线通信。

目的地装置14可经由链路16接收待解码的经编码视频数据。链路16可包含能够将经编码视频数据从源装置12移动到目的地装置14的任何类型的媒体或装置。在一个实例中，链路16可包含用以使源装置12能够将经编码视频数据直接实时发射到目的地装置14的通信媒体。可根据通信标准(例如，无线通信协议)调制经编码视频数据，且将经编码视频数据发射到目的地装置14。所述通信媒体可包含任何无线或有线通信媒体，例如，射频(RF)频谱或一个或一个以上物理传输线。通信媒体可形成基于包的网络(例如，局域网、广域网或例如因特网等全域网)的部分。通信媒体可包括路由器、交换器、基站，或可用以促进从源装置12到目的地装置14的通信的任何其它设备。

在另一实例中，链路16可对应于可存储由源装置12产生的经编码视频数据且目的地装置14可在需要时经由磁盘存取或卡存取而存取的存储媒体。存储媒体可包括多种在本地存取的数据存储媒体中的任一者，例如，蓝光光盘、DVD、CD-ROM、快闪存储器或用于存储经编码视频数据的任何其它合适数字存储媒体。在另一实例中，链路16可对应于文件服务器或可保持由源装置12产生的经编码视频且目的地装置14可在需要时经由流式传输或下载而存取的另一中间存储装置。文件服务器可为能够存储经编码视频数据且将所述经编码视频数据发射到目的地装置14的任何类型的服务器。实例文件服务器包括web服务器(例如，针对网站)、FTP服务器、网络附加存储(NAS)装置，或本地磁盘驱动器。目的地装置14可经由任何标准数据连接(包括因特网连接)而存取经编码视频数据。此数据连接可包括适合于存取存储于文件服务器上的经编码视频数据的无线通道(例如，Wi-Fi连接)、有线连接(例如，DSL、缆线调制解调器，等等)，或两者的组合。经编码视频数据从文件服务器的传输可为流式传输、下载传输，或两者的组合。

本发明的用于建构组合参考图片列表且使用组合参考图片列表有效地译码单向预测视频块的技术不必限于无线应用或环境。所述技术可应用于支持多种多媒体应用(例如，(例如)经由因特网的空中电视广播、有线电视传输、卫星电视发射、流式视频传输)中的任一者的视频译码、供存储于数据存储媒体上的数字视频的编码、存储于数据存储媒体上的数字视频的解码，或其它应用。在一些实例中，系统10可经配置以支持单向或双向视频传输以支持例如视频流式传输、视频回放、视频广播和/或视频电话等应用。

在图1的实例中，源装置12包括视频源18、视频编码器20和输出接口22。在一些情况下，输出接口22可包括调制器/解调器(调制解调器)和/或发射器。在源装置12中，视频源18可包括例如视频俘获装置(例如，摄像机、含有先前俘获的视频的视频存档、用以从视频内容提供者接收视频的视频馈送接口)的源，和/或用于产生计算机图形数据以作为源视频的计算机图形系统的源，或此些源的组合。作为一个实例，如果视频源18为摄像机，则源装置12与目的地装置14可形成所谓的相机电话或视频电话。然而，本发明中所描述的技术可一般适用于视频编码，且可适用于无线和/或有线应用。

可通过视频编码器12编码经俘获、经预俘获或计算机产生的视频。可经由源装置20的输出接口22将经编码视频数据直接发射到目的地装置14。还可将经编码视频数据存储到存储媒体或文件服务器上以供目的地装置14稍后存取以用于解码和/或回放。

目的地装置14包括输入接口28、视频解码器30和显示装置32。在一些情况下，输入接口28可包括接收器和/或调制解调器。目的地装置14的输入接口28经由链路16接收经编码视频数据。经由链路16而传送的或提供于数据存储媒体上的经编码视频数据可包括由视频编码器20产生的供视频解码器(例如，视频解码器30)用于解码视频数据中的多种语法元素。此些语法元素可与在通信媒体上发射、存储于存储媒体上或存储于文件服务器上的经编码视频数据包括在一起。

显示装置32可与目的地装置14一起集成或在目的地装置14外部。在一些实例中，目的地装置14可包括集成式显示装置，且还经配置以与外部显示装置介接。在其它实例中，目的地装置14可为显示装置。一般来说，显示装置32向用户显示经解码视频数据，且可包含多种显示装置中的任一者，例如，液晶显示器(LCD)、等离子体显示器、有机发光二极管(OLED)显示器或另一类型的显示装置。

视频编码器20和视频解码器30可根据视频压缩标准(例如，目前在开发中的高效率视频编码(HEVC)标准)而操作，且可符合HEVC测试模型(HM)。或者，视频编码器20和视频解码器30可根据其它专属或工业标准(例如ITU-T H.264标准(或者被称作MPEG-4，第10部分)，高级视频编码(AVC))或此些标准的扩展而操作。然而，本发明的技术不限于任何特定译码标准。视频压缩标准的其它实例包括MPEG-2和ITU-TH.263。

尽管未在图1中展示，但在一些方面中，视频编码器20和视频解码器30可各自与音频编码器和解码器一起集成，且可包括适当的MUX-DEMUX单元或其它硬件和软件，以处置共同数据流或单独数据流中的音频与视频两者的编码。如果适用，则在一些实例中，MUX-DEMUX单元可符合ITU H.223多路复用器协议或例如用户数据报协议(UDP)等其它协议。

视频编码器20和视频解码器30各自可实施为多种合适的编码器电路(例如，一个或一个以上微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、软件、硬件、固件或其任何组合)中的任一者。当所述技术部分地在软件中实施时，一装置可将用于软件的指令存储于合适的非暂时性计算机可读媒体中，且在硬件中使用一个或一个以上处理器来执行所述指令以执行本发明的技术。视频编码器20和视频解码器30中的每一者可包括于一个或一个以上编码器或解码器中，其任一者可集成为相应装置中的组合式编码器/解码器(编解码器(CODEC))的部分。

根据本发明，源装置12的视频编码器20可经配置以执行用于编码指示用于在任何方向(正向或反向)上对B切片的视频块进行单向预测的组合参考图片列表(列表C)的建构信息的语法元素的技术。视频编码器20可从第一参考图片列表(列表0)和第二参考图片列表(列表1)中的至少一者选择待包括于列表C中的一个或一个以上参考图片。视频编码器20可接着(例如)在B切片的切片标头中编码经界定以指示列表C是用于单向预测的一个或一个以上语法元素。视频编码器20可进一步编码经界定以在经编码视频数据中将列表C的内容应由视频解码器30从列表0和列表1建构的方式明确地用信号表示的语法元素，所述语法元素包括列表C中所识别的参考图片的数目和针对列表C中的每一条目的来自列表0或列表1的参考图片的参考索引。

根据所述技术，可使用单向预测通过指向列表C中的参考图片的单一运动向量，或使用双向预测通过分别指向列表0和列表1中的两个参考图片的两个运动向量，来编码B切片中的视频块。所述技术可适用于所有B切片(包括GPB切片)，以使得列表0和列表1可包括在相同时间方向或不同时间方向上的参考图片。在一个特定实例中，列表0与列表1可为相同的。因此，包括来自列表0和列表1中的至少一者的参考图片的列表C可包括在相对于当前图片的正向时间方向和反向时间方向两者上的参考图片。

视频编码器20还编码与B切片的每一经译码视频块相关联的用以以指示所述视频块是从列表0和列表1被双向预测(Bi)还是从列表C被单向预测(Pred_LC)的帧间预测状态语法元素(即，inter_pred_idc)。当来自列表0和列表1的参考图片被组合到列表C中以用于单向预测时，B切片中的视频块的仅两个帧间预测状态是可能的：Bi和Pred_LC。因此，所述技术导致减小译码B切片(包括GPB切片)中的视频块的帧间预测状态(而不管列表0与列表1是否相同)的成本。

根据本发明，目的地装置14的视频解码器30可经配置以执行用于建构包括来自第一参考图片列表(列表0)和第二参考图片列表(列表1)中的至少一者的一个或一个以上参考图片的组合参考图片列表(列表C)的用于解码在任何方向(正向或反向)上经单向预测的视频块的技术。视频解码器30可接收表示B切片中的经编码视频块和相关联的语法元素的经编码位流。所述技术通常包括建构列表0和列表1，在B切片的切片标头中解码经界定以指示列表C的建构信息的语法元素中的一者或一者以上，且基于所述语法元素执行列表C的参考图片列表建构。

更特定来说，根据所述技术，视频解码器30在B切片的切片标头中解码经界定以指示列表C是否用于单向预测的语法元素中的一者或一者以上。当列表C用于单向预测时，视频解码器30可进一步解码经界定以明确地用信号表示列表C的内容应由视频解码器30从列表0和列表1建构的方式的一个或一个以上语法元素，所述一个或一个以上语法元素包括列表C中所识别的参考图片的数目和针对列表C中的每一条目的来自列表0或列表1的参考图片的参考索引。视频解码器30可接着使用所述语法元素来建构包括来自列表0和列表1中的至少一者的参考图片的列表C。

视频解码器30还可解码与B切片的每一经解码视频块相关联的用以确定所述视频块是从列表0和列表1被双向预测(Bi)还是从列表C被单向预测(Pred_LC)的帧间预测状态语法元素(即，inter_pred_idc)。当帧间预测状态为Bi时，视频解码器30可使用双向预测通过分别指向列表0和列表1中的参考图片的两个运动向量来解码视频块。当帧间预测状态为Pred_LC时，视频解码器30可使用单向预测通过指向列表C中的参考图片的单一运动向量来解码视频块。如上文所描述，B切片可为正常B切片或GPB切片。在任一种情况下，根据所述技术，帧间预测状态语法元素仅具有两种状态(即，来自列表C的单向预测或来自列表0和列表1的双向预测)，且因此仅消耗一个位。

所述技术包括明确地用信号表示包括于列表C中的参考图片的数目，这是因为列表C可能未必包括来自列表0与列表1两者的每一和每个参考图片。如果视频解码器30不知晓包括于列表C中的参考图片的数目，则视频解码器30可能不能够建构列表C，且不能够解析与经译码B切片中的每一视频块相关联的帧间预测状态语法元素。另外，在视频解码器30处自动建构列表C(即，无明确的信令)可能需要复杂的解码过程。

JCT-VC致力于HEVC标准的开发。HEVC标准化努力是基于视频译码装置的演进模型(称作HEVC测试模型(HM))。HM根据(例如)ITU-T H.264/AVC假设视频译码装置相对于现有装置的若干额外能力。举例来说，H.264提供九个帧内预测编码模式，而HM可提供多达三十三个帧内预测编码模式。

一般来说，HM的工作模型描述视频帧或图片可被划分成包括明度样本和色度样本两者的树块或最大编码单元(LCU)的序列。树块具有与H.264标准的宏块类似的目的。切片包括按译码次序的多个连续树块。可将视频帧或图片分割成一个或一个以上切片。每一树块可根据四叉树(quadtree)而分裂成若干译码单元(CU)。举例来说，树块(作为四叉树的根节点)可分裂成四个子节点，且每一子节点可又为父节点，且分裂成另外四个子节点。最后未分裂的子节点(作为四叉树的叶节点)包含译码节点，即，经译码视频块。与经译码位流相关联的语法数据可界定树块可分裂的最大次数，且还可界定译码节点的最小大小。

CU包括译码节点和与所述译码节点相关联的若干预测单元(PU)和变换单元(TU)。CU的大小对应于译码节点的大小，且形状必须为正方形。CU的大小可在从8×8像素直到具有最大64×64像素或更大的树块的大小的范围内。每一CU可含有一个或一个以上PU和一个或一个以上TU。与CU相关联的语法数据可描述(例如)将CU分割为一个或一个以上PU。分割模式可在CU是跳过还是经直接模式编码、经帧内预测模式编码还是经帧间预测模式编码之间而不同。PU的形状可被分割成非正方形。与CU相关联的语法数据还可描述(例如)根据四叉树将CU分割为一个或一个以上TU。TU的形状必须为正方形。

一般来说，PU包括与预测过程有关的数据。举例来说，当PU经帧内模式编码时，PU可包括描述所述PU的帧内预测模式的数据。作为另一实例，当PU经帧间模式编码时，PU可包括界定所述PU的运动向量的数据。界定PU的运动向量的数据可描述(例如)运动向量的水平分量、运动向量的垂直分量、运动向量的分辨率(例如，四分之一像素精度或八分之一像素精度)、运动向量所指向的参考图片，和/或运动向量的参考图片列表(例如，列表0、列表1或列表C)。

一般来说，TU用于变换过程和量化过程。具有一个或一个以上PU的CU还可包括一个或一个以上变换单元(TU)。在预测之后，视频编码器20可计算对应于PU的残余值。残余值包含可变换成变换系数的像素差值，使用TU对所述变换系数进行量化和扫描以产生串行化变换系数以用于熵译码。本发明通常使用术语“视频块”来指代CU的译码节点。在一些特定情况下，本发明还可使用术语“视频块”来指代包括译码节点和若干PU和TU的树块(即，LCU或CU)。

视频序列通常包括一系列视频帧或图片。图片群组(GOP)通常包含一系列视频图片中的一者或一者以上。GOP可包括GOP的标头、图片中的一者或一者以上的标头或别处的语法数据，所述语法数据描述包括于GOP中的图片的数目。图片的每一切片可包括描述所述相应切片的编码模式的切片语法数据。视频编码器20通常对个别视频切片内的视频块进行操作，以便编码视频数据。视频块可对应于CU内的译码节点。视频块可具有固定或变化的大小，且可根据指定译码标准而在大小方面不同。

作为一实例，HM支持以各种PU大小的预测。假定特定CU的大小为2N×2N，则HM支持以2N×2N或N×N的PU大小的帧内预测，和以2N×2N、2N×N、N×2N或N×N的对称PU大小的帧间预测。HM还支持以2N×nU、2N×nD、nL×2N和nR×2N的PU大小的帧间预测的不对称分割。在不对称分割中，CU的一个方向未被分割，而另一方向被分割成25％和75％。CU的对应于25％分割的部分是由“n”以及后面的“上”、“下”、“左”或“右”的指示来指示。因此，举例来说，“2N×nU”指代水平上以顶部的2N×0.5NPU和底部的2N×1.5N PU分割的2N×2N CU。

在本发明中，“N×N”与“N乘N”可互换地使用以指代视频块在垂直尺寸与水平尺寸方面的像素尺寸，例如，16×16像素或16乘16像素。一般来说，16×16块将在垂直方向上具有16个像素(y＝16)，且在水平方向上具有16个像素(x＝16)。同样地，N×N块通常在垂直方向上具有N个像素，且在水平方向上具有N个像素，其中N表示非负整数值。可以行和列布置块中的像素。此外，块不必需要在水平方向上具有与垂直方向上相同数目的像素。举例来说，块可包含N×M个像素，其中M不必等于N。

在使用CU的PU进行帧内预测性或帧间预测性译码之后，视频编码器20可计算CU的TU的残余数据。PU可包含空间域(还称作像素域)中的像素数据，且TU可包含在将例如离散余弦变换(DCT)、整数变换、小波变换或概念上类似的变换的变换应用于残余视频数据之后的变换域中的系数。所述残余数据可对应于未经编码的图片的像素与对应于PU的预测值之间的像素差。视频编码器20可形成包括CU的残余数据的TU，且接着变换所述TU以产生CU的变换系数。

在用以产生变换系数的任何变换之后，视频编码器20可执行变换系数的量化。量化通常指代其中将变换系数量化以可能地减少用以表示所述系数的数据的量从而提供进一步压缩的过程。量化过程可减小与所述系数中的一些或全部相关联的位深度。举例来说，n位值在量化期间可下舍入到m位值，其中n大于m。

在一些实例中，视频编码器20可利用预界定扫描次序来扫描经量化变换系数以产生可经熵编码的串行化向量。在其它实例中，视频编码器20可执行自适应扫描。在扫描经量化变换系数以形成一维向量之后，视频编码器20可(例如)根据上下文自适应可变长度译码(CAVLC)、上下文自适应二进制算术译码(CABAC)、基于语法的上下文自适应二进制算术译码(SBAC)或另一熵编码方法来熵编码所述一维向量。视频编码器20还可熵编码与经编码视频数据相关联的语法元素以供视频解码器30用于解码视频数据中。

为了执行CABAC，视频编码器20可将上下文模型内的上下文指派给待发射的符号。所述上下文可能涉及(例如)符号的相邻值是否为非零。为了执行CAVLC，视频编码器20可针对待发射的符号选择可变长度码。可将VLC中的码字建构成使得相对较短的代码对应于更有可能的符号，而较长的代码对应于较不可能的符号。以此方式，与(例如)针对待发射的每一符号使用相等长度的码字相比，使用VLC可实现位节省。概率确定可基于指派给符号的上下文。

图2为说明一实例视频编码器20的方框图，实例视频编码器20可实施用于编码指示组合参考图片列表(列表C 70)的建构信息的语法元素且使用列表C 70来编码单向预测视频块的技术。视频编码器20可执行视频切片内的视频块的帧内译码和帧间译码。帧内译码依赖于空间预测以减小或移除给定视频帧或图片内的视频的空间冗余。帧间译码依赖于时间预测以减小或移除视频序列的邻近帧或图片内的视频的时间冗余。帧内模式(I模式)可指代若干基于空间的压缩模式中的任一者。帧间模式(例如，单向预测(P模式)或双向预测(B模式))可指代若干基于时间的压缩模式中的任一者。

在图2的实例中，视频编码器20包括模式选择单元40、预测单元41、参考图片存储器64、求和器50、变换单元52、量化单元54，和熵编码单元56。预测单元41包括运动估计单元42、运动补偿单元44，和帧内预测单元46。对于视频块重构而言，视频编码器20还包括反量化单元58、反变换单元60，和求和器62。还可包括解块滤波器(图2中未展示)以对块边界进行滤波以从经重构的视频移除成块性假影。需要时，所述解块滤波器将通常对求和器62的输出进行滤波。

如图2中所展示，视频编码器20接收待编码的视频切片内的当前视频块。可将所述切片划分成多个视频块。模式选择单元40可基于误差结果针对当前视频块选择译码模式(帧内或帧间)中的一者，且预测单元41可将所得的经帧内或帧间译码块提供到求和器50以产生残余块数据，且提供到求和器62以重构经编码块以供用作参考图片。

预测单元41内的帧内预测单元46可执行当前视频块相对于与待译码的当前块相同的帧或切片中的一个或一个以上相邻块的帧内预测性译码，从而提供空间压缩。预测单元41内的运动估计单元42和运动补偿单元44执行当前视频块相对于一个或一个以上参考图片中的一个或一个以上预测性块的帧间预测性译码，以提供时间压缩。

运动估计单元42可经配置以根据视频序列的预定模式确定视频切片的帧间预测模式。预定模式可将序列中的视频切片指定为P切片、B切片或GPB切片。可高度集成运动估计单元42与运动补偿单元44，但出于概念的目的而单独说明。由运动估计单元42执行的运动估计为产生运动向量的过程，运动向量估计视频块的运动。运动向量(例如)可指示当前视频帧或图片内的视频块的PU相对于参考图片内的预测性块的移位。

预测性块为发现与待译码的块在像素差方面紧密匹配的块，可通过绝对差总和(SAD)、平方差总和(SSD)或其它不同度量来确定像素差。在一些实例中，视频编码器20可计算存储于参考图片存储器64中的参考图片的子整数像素位置的值。举例来说，视频编码器20可计算参考图片的四分之一像素位置、八分之一像素位置或其它分率像素位置的值。因此，运动估计单元42可执行相对于完整像素位置和分数像素位置的运动搜索，且以分数像素精度输出运动向量。

运动估计单元42通过比较PU的位置与参考图片的预测性块的位置而计算经帧间译码切片中的视频块的PU的运动向量。参考图片可选自第一参考图片列表(列表0)66或第二参考图片列表(列表1)68，或根据本发明的技术可选自组合参考图片列表(列表C)70。可基于存储于参考图片存储器64中的经解码参考图片而建构列表0 66和列表1 68。列表C 70可经建构以包括在列表0 66和列表1 68中的至少一者中所识别的参考图片。一般来说，参考图片列表可替代地被称作参考帧列表。

作为一实例，当帧间译码切片包含P切片时，运动估计单元42可通过指向包括过去参考图片的识别符的列表0 66中的参考图片的单一运动向量而单向预测P切片的视频块。根据本发明的技术，当帧间译码切片包含B切片时，运动估计单元42可通过指向列表0 66和列表1 68中的参考图片的两个运动向量而双向预测B切片的视频块，或通过指向列表C 70中的参考图片的单一运动向量而单向预测B切片的视频块。

对于正常B切片，列表0 66可包括过去参考图片的识别符，且列表1 68可包括未来参考图片的识别符(即，按显示次序)，所述识别符可通过与每一图片相关联的图片次序计数(POC)值来指示。当B切片包含GPB切片时，列表0 66与列表1 68两者可包括相同时间方向上的参考图片。在GPB切片的一个特定实例中，列表0与列表1可为相同的。在所述情况下，列表0 66与列表1 68两者具有相同数目个图片(表示为N)，且列表0 66中具有参考索引i(i＜N)的任何图片与列表1 68中具有参考索引i的图片相同。因此，包括来自列表0 66和列表1 68中的至少一者的参考图片的列表C 70可包括在相对于当前图片的正向时间方向和反向时间方向两者上的参考图片。

运动估计单元42将所计算出的运动向量发送到熵编码单元56和运动补偿单元44。由运动补偿单元44执行的运动补偿可涉及基于通过运动估计所确定的运动向量获取或产生预测性块。在接收到当前视频块的PU的运动向量后，运动补偿单元44可即刻将运动向量所指向的预测性块定位于列表0 66、列表1 68或列表C 70中的一者中。视频编码器20通过从正经译码的当前视频块的像素值减去预测性块的像素值从而形成像素差值，而形成残余视频块。像素差值形成块的残余数据，且可包括明度差分量与色度差分量两者。求和器50表示执行此减法运算的(多个)组件。

运动补偿单元44还可产生与视频块和视频切片相关联的语法元素以供视频解码器30用于解码视频切片的视频块中。举例来说，运动补偿单元44可在视频切片层级处产生经界定以指示列表0 66、列表1 68和列表C 70的建构信息的语法元素。视频解码器30可使用这些语法元素首先建构列表0和列表1，且接着建构组合参考图片列表以包括来自列表0和列表1的一个或一个以上参考图片。视频解码器30可接着相对于参考图片列表中的一个或一个以上参考图片解码原始视频块。

另外，运动补偿单元44可产生与视频切片的每一经译码视频块相关联的用以指示所述视频块是从列表0 66和列表1 68被双向预测(Bi)还是从列表C 70被单向预测(Pred_LC)的帧间预测状态语法元素(即，inter_pred_idc)。当来自列表0 66和列表1 68的参考图片被组合到列表C 70中以用于单向预测时，B切片中的视频块的仅两个帧间预测状态是可能的：Bi和Pred_LC，其消耗一个位。因此，所述技术导致减小译码B切片(包括GPB切片)中的视频块的帧间预测状态(而不管列表0与列表1是否相同)的成本。

然而，当在视频解码器30处建构组合参考图片列表以解码B切片中的视频块时，可出现某些问题。举例来说，视频解码器30可能尚未从列表0 66与列表1 68两者选择每一和每个参考图片以包括于列表C 70中。当视频解码器30不知晓包括于列表C 70中的参考图片的数目时，视频解码器30可能不能够建构组合参考图片列表，且不能够解析与经译码B切片中的每一视频块相关联的帧间预测状态语法元素。另外，在视频解码器30处自动建构组合参考图片列表可能需要复杂的解码过程。根据本发明中所描述的实例技术，当列表C 70用于B切片的单向预测时，视频编码器20编码用以在经编码视频数据中明确地用信号表示列表C 70的内容应由视频解码器30从列表0 66和列表168建构的方式的一个或一个以上语法元素。特定来说，所述语法元素可指示列表C 70中的参考图片的数目和针对列表C 70的每一条目的来自列表0 66或列表1 68的参考图片的索引。

在一个实例中，视频编码器20可选择列表0 66与列表1 68两者中待包括于列表C70中的所有参考图片。在此情况下，列表C 70中的参考图片的数目可等于列表0 66与列表1 68中的参考图片的数目的总和。然而，在其它情况下，视频编码器20可经配置而以灵活方式建构列表C 70以使得列表C 70中的参考图片的数目可能小于列表0 66与列表1 68中的参考图片的总数目，且不为视频解码器30所知。

在一些情况下，在列表0 66与列表1 68中的一个或一个以上参考图片之间可存在部分重叠。具体来说，列表0 66与列表1 68可含有在每一列表中不同的一些参考图片和在每一列表中相同的一些参考图片，以使得所述参考图片中的一些参考图片可出现于列表0 66与列表1 68两者中。在一些实施方案中，视频编码器20可经设计以避免列表C中的参考图片的重复。举例来说，当列表C 70经建构以消除冗余参考图片时，列表C70中的参考图片的数目可小于列表0 66与列表1 68中的参考图片的数目的总和。在其它实例中，视频编码器20可经配置以选择少于列表0 66与列表1 68中的所有参考图片以包括于列表C 70中。因此，在将列表0 66与列表1 68的图片添加到列表C 70时，列表C 70中的参考图片的数目可归因于添加在一个列表中但不在另一列表中的参考图片和/或任选消除在两个列表中的冗余参考图片而为不确定的。

为了准许视频解码器30建构组合参考图片列表，根据本发明的实例，视频编码器20可经配置以在B切片的切片标头中明确地用信号表示列表C 70中的参考图片的数目和列表C 70中的每一条目。视频编码器20可(例如)在于B切片的切片标头中用信号表示列表0 66和列表1 68的参考图片列表修改语法表之后用信号表示列表C 70的建构信息。或者，视频编码器20可在于切片标头中用信号表示参考图片列表修改语法表之前用信号表示列表C 70的建构信息。包括组合参考图片列表语法表(即，ref_pic_list_combination)和参考图片列表修改或重新排序语法表(即，ref_pic_list_modification)以及其它切片标头语法元素的一实例切片标头提供于下表1中，且关于图3更详细地描述。

另外，视频编码器20可明确地用信号表示供视频解码器30在建构组合参考图片列表中使用的其它语法元素。举例来说，组合参考图片列表语法表指示列表C 70是否用于B切片中的视频块的单向预测。当列表C 70用于单向预测时，视频编码器20用信号表示用以指示列表C 70是从列表0 66和列表1 68建构还是仅仅被设定成等于参考图片列表中的一者的一位旗标(即，ref_pic_list_combination_flag)。举例来说，在列表0 66与列表1 68是相同(即，B切片为GPB切片)的情况下，视频编码器20可将列表C 70设定成等于列表0 66或列表1 68。在此情况下，视频编码器20并不编码到视频解码器30的用以明确地用信号表示列表C 70的内容应从列表0 66和列表1 68建构的方式的额外语法元素。而是，可基于包括于列表0 66或列表1 68中的任一者中的参考图片的数目来指示列表C 70中的参考图片的数目。

当列表C 70是从列表0 66和列表1 68建构时，组合参考图片列表语法表包括明确地用信号表示列表C 70中的参考图片的数目的语法元素，即，num_com_ref_list_active_minus1。作为一替代方案，视频编码器20可经配置以用信号表示列表0 66与列表1 68中的重叠参考图片的数目，即，在列表0 66与列表1 68中相同的图片的数目。组合参考图片列表语法表(例如)可包括明确地用信号表示重叠参考图片的数目的语法元素，即，num_overlapped_pics。在其它实例中，可在切片标头中明确地用信号表示此语法元素。在此替代情况下，视频解码器30可基于列表0 66中的参考图片的所指示数目(即，num_ref_idx_10_active_minus1)、列表1中的参考图片的所指示数目(即，num_ref_idx_11_active_minus1)和重叠参考图片的所指示数目而确定列表C 70中的参考图片的数目。具体来说，视频解码器30可将列表C 70中的参考图片的数目计算为：num_ref_idx_10_active_minus1+num_ref_idx_11_active_minus1+2-num_overlapped_pics。

当列表C 70是从列表0 66和列表1 68建构时，由编码器20准备以供解码器30使用的组合参考图片列表语法表还包括明确地用信号表示列表C 70中的每一条目的语法元素，所述语法元素包括当前参考图片列表(列表0 66或列表1 68)和当前列表中的参考图片的参考索引。更特定来说，视频编码器20可用信号表示指示列表C 70中的条目中的参考图片的当前参考图片列表的一位旗标，即，pic_from_list_0_flag(i)(其中i识别列表C 70中的条目)。视频编码器20还可用信号表示指示当前参考图片列表中的参考图片的索引的语法元素，即，ref_idx_list_curr(i)(其中i识别列表C 70中的条目)。

在一些情况下，可使用至少两种方法来减少用信号表示列表C 70的位消耗，所述至少两种方法在不同实施中可单独使用或一起使用。首先，视频编码器20可经配置以用信号表示用以指示列表C 70是被明确地用信号表示还是等于列表0 66与列表1 68中的一者的二位旗标(即，com_list_equal_idc)。举例来说，当列表066与列表168中的一者为另一列表的子集时，视频编码器20将列表C 70设定成等于另一列表。在此情况下，列表C 70包括列表0 66与列表1 68中的较大列表的所有参考图片，所述较大列表固有地包括来自形成所述子集的较小列表的所有图片。如果列表C 70等于列表0 66或列表1 68，则视频编码器20不需要编码用以明确地用信号表示列表C 70的内容应由视频解码器30从列表0 66和列表1 68建构的方式的任何额外语法元素。而是，可基于包括于列表0 66或列表1 68中的任一者中的参考图片的数目来指示列表C 70中的参考图片的数目。

第二，视频编码器20可经配置以差动地用信号表示列表C 70中的每一条目的参考图片的索引。在此情况下，作为编码列表C 70中的参考图片的实际索引值的替代，视频编码器20编码参考图片的用以指示当前参考图片列表中的参考图片的索引与同一参考图片列表中的被添加到列表C 70中的前一条目的前一参考图片的索引之间的差异(例如，偏移)的索引增量(即，delta_ref_idx_list_curr_minus1)。包括于列表C 70中的来自列表0 66和列表1 68中的给定一者的参考图片的索引值通常呈递增次序且增加小的增值。

在此情况下，视频解码器30可基于所指示的索引增量(即，delta_ref_idx_list_curr_minus1)和来自当前参考图片列表的先前参考图片的先前所指示的索引(即，PreRefIdxLx(其中x指示当前参考图片列表))来确定当前参考图片列表中的参考图片的索引。具体来说，视频解码器30可将列表C 70中的当前参考图片的索引(即，CurrRef_Idx_Lx)计算为：delta_ref_idx_list_curr_minus1+1+PreRefIdxLx。组合参考图片列表语法表(即，ref_pic_list_combination)的实例提供于下表2和表3中，关于图3对其更详细地描述。

在运动补偿单元44产生当前视频块的预测性块之后，视频编码器20通过从所述当前视频块减去所述预测性块而形成残余视频块。残余块中的残余视频数据可包括于一个或一个以上TU中且应用于变换单元52。变换单元52使用例如离散余弦变换(DCT)或概念上类似的变换的变换将残余视频数据变换成残余变换系数。变换单元52可将残余视频数据从像素域转换到变换域(例如，频域)。

变换单元52可将所得变换系数发送到量化单元54。量化单元54量化所述变换系数以进一步减小位率。量化过程可减小与所述系数中的一些或全部相关联的位深度。可通过调整量化参数而修改量化程度。在一些实例中，量化单元54可接着执行对包括经量化变换系数的矩阵的扫描。或者，熵编码单元56可执行所述扫描。

在量化之后，熵编码单元56熵编码经量化变换系数。举例来说，熵编码单元56可执行上下文自适应可变长度译码(CAVLC)、上下文自适应二进制算术译码(CABAC)或另一熵编码技术。在通过熵编码单元56进行的熵编码之后，可将经编码位流发射到视频解码器30，或将其存档以供稍后发射或由视频解码器30俘获。

熵编码单元56还可熵编码正经译码的当前视频切片的运动向量和其它语法元素。举例来说，熵编码单元56可在视频切片层级处熵编码经界定以指示列表0 66、列表1 68和列表C 70的建构信息的语法元素。根据所述技术，熵编码单元56可熵编码明确地用信号表示列表C 70的内容应由视频解码器30从列表0 66和列表1 68建构的方式的语法元素。另外，熵编码单元56可熵编码与视频切片的每一经译码视频块相关联的用以指示所述视频块是从列表0 66和列表1 68被双向预测(Bi)还是从列表C 70被单向预测(Pred_LC)的帧间预测状态语法元素(即，inter_pred_idc)。视频解码器30可使用这些语法元素以建构参考图片列表且重构通过视频编码器20编码的原始视频块。

反量化单元58和反变换单元60分别应用反量化和反变换，以在像素域中重构残余块以供稍后用作参考图片的参考块。运动补偿单元44可通过将残余块添加到列表0 66或列表1 68内的参考图片中的一者的预测性块来计算参考块。运动补偿单元44还可将一个或一个以上内插滤波器应用于经重构的残余块以计算子整数像素值以供用于运动估计中。求和器62将经重构的残余块添加到由运动补偿单元44产生的运动补偿预测块，以产生参考块以供存储于参考图片存储器64中。参考块可由运动估计单元42和运动补偿单元44用作参考块以对后续视频帧或图片中的块进行帧间预测。

图3为说明一实例视频解码器30的方框图，实例视频解码器30可实施用于使用语法元素建构组合参考图片列表(列表C 98)且使用列表C 98解码单向预测视频块的技术。在图3的实例中，视频解码器30包括熵解码单元80、预测单元81、反量化单元86、反变换单元88、求和器90，和参考图片存储器92。预测单元81包括运动补偿单元82和帧内预测单元84。在一些实例中，视频解码器30可执行通常与关于来自图2的视频编码器20所描述的编码回合互逆的解码回合。

在解码过程期间，视频解码器30从视频编码器20接收表示经编码视频切片的视频块和关联的语法元素的经编码视频位流。视频解码器30的熵解码单元80熵解码所述位流以产生经量化系数、运动向量和其它语法元素。熵解码单元80将运动向量和其它语法元素转发到预测单元81。视频解码器30可在视频切片层级和/或视频块层级处接收语法元素。

当视频切片经译码为帧内译码(I)切片时，预测单元81的帧内预测单元84可基于用信号表示的帧内预测模式和来自当前帧或图片的先前经解码的块的数据而产生当前视频切片的视频块的预测数据。当视帧架经译码为帧间译码(即，B、P或GPB)切片时，预测单元81的运动补偿单元82基于从熵解码单元80接收的运动向量和其它语法元素而产生当前视频切片的视频块的预测性块。

运动补偿单元82通过解析运动向量和其它语法元素而确定当前视频切片的视频块的预测信息，且使用所述预测信息以产生正经解码的当前视频块的预测性块。举例来说，运动补偿单元82使用一些所接收的语法元素以确定用以译码视频切片的视频块的预测模式(例如，帧内预测或帧间预测)、帧间预测切片类型(例如，B切片、P切片或GPB切片)、切片的参考图片列表中的一者或一者以上的建构信息、切片的每一经帧间编码视频块的运动向量、切片的每一经帧间编码视频块的帧间预测状态，和用以解码当前视频切片中的视频块的其它信息。

运动补偿单元82还可基于内插滤波器执行内插。运动补偿单元82可使用如由视频编码器20在视频块的编码期间使用的内插滤波器，以计算参考块的子整数像素的内插值。运动补偿单元82可从所接收的语法元素确定由视频编码器20使用的内插滤波器，且使用所述内插滤波器来产生预测性块。

预测性块可从第一参考图片列表(列表0)94、第二参考图片列表(列表1)96，或根据本发明的技术从组合参考图片列表(列表C)98而产生。作为一实例，当经帧间译码切片包含P切片时，运动补偿单元82基于指向包括过去参考图片的识别符的列表094中的参考图片的单一运动向量而产生P切片的单向预测视频块的预测性块。根据本发明的技术，当经帧间译码切片包含B切片时，运动补偿单元82可基于指向列表094和列表1 96中的参考图片的两个运动向量而产生B切片的双向预测视频块的预测性块，或基于指向列表C 70中的参考图片的单一运动向量而产生B切片的单向预测视频块的预测性块。

视频解码器30可基于存储于参考图片存储器92中的参考图片使用默认建构技术来建构列表0 94和列表1 96。为了建构列表0 94和列表1 96，视频解码器30对列表0 94和列表1 96中的每一者执行参考图片列表初始化和参考图片列表修改(即，重新排序)。举例来说，为了建构列表0 94，视频解码器30可通过根据预定次序将参考图片从参考图片存储器92添加到列表0 94而执行参考图片列表初始化。举例来说，视频解码器30可基于参考图片的帧编号的次序(即，解码次序)或基于参考图片的图片次序计数(POC)编号的次序(即，显示次序)而初始化列表0 94。视频解码器30可接着基于明确地用信号表示的次序而执行参考图片列表修改以重新排序包括于列表0 94中的参考图片。在初始化之后，视频解码器30可截断列表0 94而使其不超过包括于列表0 94中的作用中参考图片的数目。在一些情况下，视频解码器30还可基于明确地用信号表示的权重和偏移值而将预测权重和偏移施加到列表0 94中的参考图片。

根据本发明的技术，视频解码器30可使用语法元素建构列表C 98而使其包括来自列表0 94和列表1 96中的至少一者的参考图片。对于正常B切片，列表0 94可包括过去参考图片的识别符，且列表1 96可包括未来参考图片的识别符。当B切片包含GPB切片时，列表0 94与列表1 96两者可包括相同时间方向上的参考图片。在GPB切片的一个特定实例中，列表0 94与列表1 96可为相同的。在所述情况下，列表0 94与列表1 96两者具有相同数目个图片(表示为N)，且列表0 94中具有参考索引i(i＜N)的任何图片与列表1 96中具有参考索引i的图片相同。因此，包括来自列表0 94和列表1 96中的至少一者的参考图片的列表C 98可包括在相对于当前图片的正向时间方向和反向时间方向两者上的参考图片。

然而，当在视频解码器30处建构组合参考图片列表以解码B切片中的视频块时，可能出现某些问题。举例来说，列表C 98可能未必包括来自列表0 94和列表1 96两者的每一参考图片。当视频解码器30不知晓包括于列表C 98中的参考图片的数目时，视频解码器30可能不能够建构列表C 98，且不能够解析与经译码B切片中的每一视频块相关联的帧间预测状态语法元素。另外，在视频解码器30处自动建构组合参考图片列表可能需要复杂的解码过程。根据所述技术，当列表C 98用于B切片的单向预测时，视频解码器30接收明确地用信号表示列表C 98的内容应由视频解码器30从列表0 94和列表1 96建构的方式的一个或一个以上语法元素。特定来说，所述语法元素可指示列表C 98中的参考图片的数目和列表C 98的每一条目的参考图片的索引。

为了建构列表C 98，视频解码器30可(例如)在B切片的切片标头中针对列表0 94和列表1 96的参考图片列表修改或重新排序语法表之后接收列表C 98的建构信息。或者，视频解码器30可在切片标头中的参考图片列表修改(重新排序)语法表的信令之前接收列表C 98的建构信息。包括组合参考图片列表语法表(即，ref_pic_list_combination)和参考图片列表修改或重新排序语法表(即，ref_pic_list_modification)以及其它切片标头语法元素的一实例切片标头提供于下表1中。

表1

表1中的C列和下文的表2和表3指示界定包括有语法元素的当前视频切片的数据分割的每一语法元素的类别。表1中的描述符行指示使得语法元素能够在视频解码器30处被适当解析的用于语法元素的译码类型。举例来说，描述符“ue(v)”指示指数哥伦布译码(exponential-Golomb coding)。

另外，视频解码器30可接收用以建构列表C 98的其它语法元素。下表2呈现组合参考图片列表语法表(即，ref_pic_list_combination())的第一实例。

表2

所述组合参考图片列表语法表首先指示列表C 98是否用于B切片中的视频块的单向预测。当列表C 98用于B切片的单向预测时，视频解码器30接收明确地用信号表示列表C 98的内容应由视频解码器30从列表0 94和列表1 96建构的方式的一个或一个以上语法元素。如表2中所展示，如果当前切片类型为B切片，则位旗标(即，ref_pic_list_combination_flag)指示列表C 98待用于B切片中的视频块的单向预测。ref_pic_list_combination_flag的值指示列表C 98将从列表0 94和列表1 96建构还是仅仅被设定成等于参考图片列表中的一者。更特定来说，ref_pic_list_combination_flag的值等于1指示视频解码器30将从列表0 94和列表1 96建构列表C 98。

ref_pic_list_combination_flag的值等于0指示列表0 94与列表1 96相同(即，B切片为GPB切片)，且视频解码器30可将列表C 98设定成等于列表0 94或列表1 96。在列表C 96不是从列表0 94和列表1 96建构的情况下，视频解码器不接收明确地用信号表示列表C 98的内容应由视频解码器30从列表0 94和列表1 96建构的方式的额外语法元素。而是，可基于包括于列表0 94或列表1 96中的任一者中的参考图片的数目来确定列表C 98中的参考图片的数目。

在任一情况下，当ref_pic_list_combination_flag具有等于0或1的值时，视频解码器30建构列表C 98以解码B切片中的单向预测视频块。如上文所描述，通过使用列表C 98，可修改与B切片中的每一视频块相关联的inter_pred_idc语法元素以将信令从三种状态(Bi、Pred_L0、Pred_L1)(其消耗两个位)减少到两种状态(Bi、Pred_LC)(其消耗一个位)，如当参考图片列表相同时GPB切片的情况。因此，所述技术可提供B切片中的关于列表C 98被单向预测的视频块的效率的显著增益。或者，ref_pic_list_combination_flag的值等于0可仅仅指示组合列表不用于当前切片。

如果ref_pic_list_combination_flag具有等于1的值，则作为仅仅将列表C 98设定成等于列表0 94或列表1 96的替代，视频解码器30以由视频编码器20指定的方式从列表0 94和列表1 96选择参考图片以产生列表C 98。具体来说，进一步参看上文的表2，如果ref_pic_list_combination_flag具有等于1的值(即，列表C 98是从列表0 94和列表1 96建构)，则视频解码器30接收列表C 98中的明确地用信号表示的图片数目(即，num_com_ref_list_active_minus1)。num_com_ref_list_active_minus1语法元素指定列表C98中的参考图片的数目，其等于选自列表0 94和列表1 96的用于列表C 98的参考图片的总数目。此数目可能等于或可能不等于列表0 94和列表1 96中的参考图片的总数目，此取决于视频编码器20的配置。

作为一替代方案，作为接收列表C 98中的参考图片的数目的替代，视频解码器30可接收列表0 94和列表1 96中的明确地用信号表示的重叠参考图片的数目，即，num_overlapped_pics。在此情况下，视频解码器30可基于列表0 94中的参考图片的所指示数目(即，num_ref_idx_10_active_minus1)、列表1 96中的参考图片的所指示数目(即，num_ref_idx_11_active_minus1)和重叠参考图片的所指示数目而确定列表C 70中的参考图片的数目。具体来说，视频解码器30可将列表C 98中的参考图片的数目计算为：num_ref_idx_10_active_minus1+num_ref_idx_11_active_minus1+2-num_overlapped_pics。

如上文表2中所指示，视频解码器30接着进入一循环(从i＝0到i＝num_com_ref_list_active_minus1)以建构具有等于num_com_ref_list_active_minus1的图片数目的列表C 98。在通过表2中的额外语法元素界定的建构循环开始时将列表C 98设定为空的。在所述循环中，语法元素明确地用信号表示列表C 98中的每一条目(包括当前参考图片列表(列表0 94或列表1 96))和当前列表中的参考图片的参考索引。

更特定来说，一位旗标(即，pic_from_list_0_flag(i)(其中i识别列表C 98中的条目))指示参考图片的待添加到列表C 98中的条目的当前参考图片列表。当pic_from_list_0_flag的值等于1时，待添加到列表C 98中的条目的当前参考图片来自列表0 94，且由CurrRefPicList语法元素所指示的当前参考图片列表为列表0 94。当pic_from_list_0_flag的值等于0时，待添加到列表C 98中的条目的当前参考图片来自列表1 96，且由CurrRefPicList所指示的当前参考图片列表为列表1 96。pic_from_list_0_flag的状态可根据通过i的值编制索引的阵列而改变，以使得建构循环将来自列表0 94或列表1 96图片的索引(例如)交替地或以其它模式选择性地添加到如由视频编码器20指定的列表C 98中。

进一步参看上文的表2，语法元素(即，ref_idx_list_curr(i)(其中i识别列表C 70中的条目))指示待添加到列表C 98中的条目的CurrRefPicList(即，列表0 94或列表1 96(此取决于pic_from_list_0_flag的值))中的当前参考图片的参考索引。因为i的值从0依序递增到num_com_ref_list_active_minus1，所以视频解码器30在列表C 98末尾处附加当前参考图片的所指示的参考索引。每一参考图片列表(列表0 94或列表1 96)中的参考索引可取决于视频编码器20的配置而依序或非依序地递增。

在循环的每一反复下，视频解码器30将当前参考图片列表(列表0 94或列表1 96)中的另一参考图片的所指示的参考索引添加到列表C 98的末尾。在完成等于num_com_ref_list_active_minus1的多个反复后，视频解码器30即刻具有经建构的列表C98。视频解码器30可接着使用列表C 98以用于解码B切片中的单向预测视频块。视频解码器30还可适应将B译码限于两种状态(Bi和Pred_LC)的经修改的帧间预测状态语法元素，其中Pred_LC表示关于列表C 98的单向预测。

表3呈现包括替代位减少方法的组合参考图片列表语法表(即，ref_pic_list_combination())的第二实例。可使用至少两种方法来减少用信号表示列表C70的位消耗，所述至少两种方法在不同实施方案中可单独使用或一起使用。

表3

在表3的实例中(与在表2中一样)，如果当前切片类型为B切片，则位旗标(即，ref_pic_list_combination_flag)指示列表C 98将用于B切片中的视频块的单向预测。ref_pic_list_combination_flag的值等于0指示列表0 94与列表1 96相同(即，B切片为GPB切片)，且视频解码器30可将列表C 98设定成等于列表0 94或列表1 96。ref_pic_list_combination_flag的值等于1指示视频解码器30将从列表0 94和列表1 96建构列表C 98。

作为第一位减少方法，当列表C 98将从列表0 94和列表1 96建构时，视频解码器30还可接收指示列表C 98是被明确地用信号表示、等于列表0 94还是等于列表1 96的二位旗标(即，com_list_equal_idc)。如果com_list_equal_idc旗标具有等于0的值，则列表C 98由视频编码器20明确地用信号表示。如果com_list_equal_idc旗标具有等于1的值，则列表C 98与列表0 94相同。如果com_list_equal_idc旗标具有等于2的值，则列表C 98与列表1 96相同。举例来说，当列表0 94与列表1 96中的一者为另一列表的子集时，视频解码器30通过将列表C 98设定成等于另一列表来建构列表C 98。在此情况下，列表C 98包括列表0 94与列表1 96中的较大列表的所有参考图片，所述较大列表固有地包括来自形成所述子集的较小列表的所有图片。

如果列表C 98被明确地用信号表示，则视频解码器30以上文关于表2所描述的方式进入建构循环以建构列表C 98。如果列表C 98等于列表0 94或列表1 96，则视频解码器30不接收明确地用信号表示列表C 98的内容应由视频解码器30从列表0 94和列表1 96建构的方式的任何额外语法元素。而是，可基于包括于列表0 94或列表1 96中任一者中的参考图片的数目来确定列表C 98中的参考图片的数目。

作为第二位减少方法，视频解码器30可接收针对列表C 70中的每一条目的参考图片的经差动地用信号表示的索引。在此情况下，作为接收列表C 98的参考图片的明确地用信号表示的索引值的替代，视频解码器30接收参考图片的用以指示当前参考图片列表中的当前参考图片的索引与同一参考图片列表中的被添加到列表C 98中的前一条目的前一参考图片的索引之间的差异(例如，偏移)的索引增量(即，delta_ref_idx_list_curr_minus1)。因此，对于由pic_from_list_0_flag和i的每一值所指示的每一参考图片列表，视频解码器30接收delta_ref_idx_list_curr_minus1语法元素以附加在列表C 98末尾处，所述语法元素指示识别特定参考图片以从当前参考图片列表(列表0 94或列表1 96)拉出的经差动译码的索引。

在此情况下，视频解码器30可基于所指示的索引增量(即，delta_ref_idx_list_curr_minus1)和来自当前参考图片列表的先前参考图片的先前所指示的索引(即，PreRefIdxLx(其中x指示当前参考图片列表CurrRefPicList，如列表0 94或列表1 96))来确定当前参考图片列表中的参考图片的索引。举例来说，当pic_from_list_0_flag具有等于1的值时，x等于0以指示列表0 94，且当pic_from_list_0_flag具有等于0的值时，x等于1以指示列表196。视频解码器30可将列表C 70中的参考图片的索引(即，CurRef_Idx_Lx)计算为：delta_ref_idx_list_curr_minus1+1+PreRefIdxLx。在循环的开始时将PreRefIdxL0和PreRefIdxL1设定成-1。

作为一实例，如果来自当前参考图片列表的先前索引等于2且来自当前参考图片列表的当前索引等于三，则增量索引可具有值1。在此情况下，替代技术可通过编码为1的增量索引值而非为3的显式索引值而减少用信号表示当前参考图片的索引值的位消耗。此位减少通常适用于所有用信号表示的索引值，这是因为包括于列表C 98中的来自列表0 94和列表1 96中的给定一者的参考图片的索引值通常呈递增次序且增加小的增值。

反量化单元86将位流中所提供且由熵解码单元80解码的经量化变换系数反量化(即，解量化)。反量化过程可包括使用由视频编码器20计算的视频切片中的每一视频块的量化参数，以确定量化程度和(同样)应当应用的反量化的程度。反变换单元88将反变换(例如，反DCT、反整数变换或概念上类似的反变换过程)应用于变换系数，以便在像素域中产生残余块。

在运动补偿单元82基于运动向量和其它语法元素产生当前视频块的预测性块之后，视频解码器30通过对来自反变换单元88的残余块与由运动补偿单元82产生的对应预测性块求和而形成经解码视频块。求和器90表示执行此加法运算的(多个)组件。需要时，还可应用解块滤波器来对经解码块进行滤波，以便移除成块性假影。接着将给定帧或图片中的经解码视频块存储于参考图片存储器92中，参考图片存储器92存储用于后续运动补偿的参考图片。参考图片存储器92还存储经解码视频以用于稍后在显示装置(例如，图1的显示装置32)上呈现。

图4为说明建构组合参考图片列表(列表C)且使用列表C译码单向预测视频块的实例操作的流程图。参考图2的视频编码器20和图3的视频解码器30来描述所说明的操作。

视频编码器20接收待编码的当前视频切片的视频块。在当前视频切片被指定为B切片时，视频编码器20基于存储于参考图片存储器64中的经解码参考图片而建构列表0 66和列表1 68(100)。视频编码器20可根据正常参考图片列表建构程序而建构列表0 66和列表1 68。视频编码器20接着建构包括来自列表0 66和/或列表1 68的一个或一个以上参考图片的列表C 70(101)。举例来说，视频编码器20从列表0 66和列表1 68中的至少一者选择待包括于列表C 70中的一个或一个以上参考图片。在其它实例中，视频编码器20可通过将列表C 70设定成等于列表0 66和列表1 68中的一者来建构列表C 70。

另外，视频编码器20编码到视频解码器30的用以指示列表C 70的建构信息的一个或一个以上语法元素(102)。举例来说，视频编码器20可编码用以指示列表C 70用于单向预测且用以指示列表C 70中所识别的参考图片的数目和列表C 70中的每一条目的参考图片索引的语法元素。视频编码器20可接着相对于列表C 70中的一个或一个以上参考图片使用单向预测来编码B切片的一个或一个以上视频块(103)。

视频解码器30从视频编码器20接收表示当前视频切片的视频块和与所述视频切片相关联的语法元素的经编码位流。在当前视频切片被指定为B切片时，视频解码器30使用语法元素基于存储于参考图片存储器92中的经解码参考图片而建构列表0 94和列表1 96(100)。视频解码器30可根据包括初始化和修改的正常参考图片列表建构程序而建构列表0 94和列表1 96。

视频解码器30接着建构包括来自列表0 94和/或列表1 96的一个或一个以上参考图片的列表C 98(101)。视频解码器30通过解码指示列表C 98的建构信息的语法元素而建构列表C 98(102)。举例来说，视频解码器30可解码指示列表C 98用于单向预测且指示列表C 98中所识别的参考图片的数目和列表C 98中的每一条目的参考图片索引的语法元素。作为一实例，视频解码器30可根据语法元素将来自列表0 94和列表96中的至少一者的一个或一个以上参考图片添加到列表C 98。在其它实例中，视频解码器30可通过将列表C 98设定成等于列表0 94与列表1 96中的一者来建构列表C 98。视频解码器30可接着相对于列表C 98中的一个或一个以上参考图片使用单向预测来解码B切片的一个或一个以上视频块(103)。

图5为说明编码指示用于建构组合参考图片列表(列表C 70)的建构信息的一个或一个以上语法元素且相对于仅列表C 70中的参考图片使用单向预测来编码视频块的实例操作的流程图。参考图2的视频编码器20来描述所说明的操作，且所说明的操作可对应于上文在表2和表3中所呈现的组合参考图片列表语法表。

视频编码器20接收待编码的当前视频切片的视频块。在当前视频切片被指定为B切片时，视频编码器20基于存储于参考图片存储器64中的经解码参考图片而建构列表0 66和列表1 68(106)。视频编码器20可根据正常参考图片列表建构程序来建构列表0 66和列表1 68。

视频编码器20还可建构包括来自列表0 66和/或列表1 68的一个或一个以上参考图片的组合参考图片列表(列表C 70)以用于B切片的单向预测(108)。在一个实例中，视频编码器20可选择列表0 66与列表1 68两者中的所有参考图片以包括于列表C 70中。在此情况下，列表C 70中的参考图片的数目可等于列表0 66与列表1 68中的参考图片的数目的总和。在其它情况下，由列表0 66和列表1 68指示的参考图片中的一者或一者以上可能重叠。列表C 70可经建构成消除冗余参考图片，以使得列表C 70中的参考图片的数目可小于列表0 66与列表1 68中的参考图片的数目的总和。在其它实例中，视频编码器20可选择少于列表0 66与列表1 68中的所有参考图片以包括于列表C 70中。

在一些情况下，视频编码器20可能不从列表0 66和列表1 68建构列表C 70，而是替代地，将把列表C 70设定成等于列表0 66与列表1 68中的一者。在列表0 66与列表1 68相同(即，B切片为GPB切片)的情况下，视频编码器20将列表0 66用作组合参考图片列表。视频编码器20接着编码指示列表C 70等于列表0 66的语法元素。在其它实例中，列表C 70可被指示为等于列表1 68。在此情况下，所述技术可通过编码用以指示列表C 70是从列表0 66和列表1 68建构还是仅仅被设定成等于参考图片列表中的一者的一位旗标(即，ref_pic_list_combination_flag)而减小译码组合参考图片列表的建构信息的成本。如果列表C 70不是从列表0 66和列表1 68建构，则视频编码器20不编码用以明确地用信号表示列表C 70的内容应由视频解码器30从列表0 66和列表1 68建构的方式的任何额外语法元素。

当列表0 66与列表1 68不同时，视频编码器20可确定列表0 66与列表1 68中的一者是否为另一列表的子集。举例来说，列表0 66中所识别的参考图片可包含列表1 68中所识别的参考图片的子集。当列表0 66与列表1 68中的一者为另一列表的子集时，视频编码器20将列表C 70设定成等于另一列表。视频编码器20接着编码指示列表C 70等于另一列表的语法元素。举例来说，当列表0 66中所识别的参考图片为列表1 68中所识别的参考图片的子集时，列表C 70可被设定成等于列表1 68。在此情况下，所述技术通过编码用以指示列表C 70是被明确地用信号表示还是等于列表0 66与列表1 68中的一者的二位旗标(即，com_list_equal_idc)来减小译码列表C 70的建构信息的成本。如果列表C 70等于列表0 66或列表1 68，则视频编码器20不编码用以明确地用信号表示列表C 70的内容应由视频解码器30从列表0 66和列表1 68建构的方式的额外语法元素。

视频编码器20接着用信号表示指示列表C 70用于B切片的单向预测的语法元素(110)。另外，视频编码器20编码用以明确地用信号表示列表C 70的内容应由视频解码器30从列表0 66和列表1 68建构的方式的一个或一个以上语法元素。特定来说，视频编码器20用信号表示指示列表C 70中所识别的参考图片的数目的语法元素(112)。作为一替代方案，视频编码器20可用信号表示列表0 66和列表1 68中的重叠参考图片的数目，即，在列表0 66与列表1 68中相同的图片的数目。可接着基于列表0 66中的参考图片的所指示数目、列表1中的参考图片的所指示数目和重叠参考图片的所指示数目而确定列表C 70中的参考图片的数目。

视频编码器20还用信号表示指示列表C 70中的每一条目的参考图片是来自列表066还是列表1 68的语法元素(113)。视频编码器20进一步用信号表示指示列表C 70中的每一条目的参考图片索引的语法元素(114)。明确地用信号表示列表C 70中和列表C 70中的每一条目的参考帧的数目使得视频解码器30能够在无需复杂的解码过程的情况下建构组合参考图片列表。

视频编码器20可接着相对于列表C 70中的参考图片使用单向预测来编码B切片的一个或一个以上视频块(115)。根据所述技术，视频编码器20可使用列表C 70编码单向预测视频块，而不管组合参考列表如何形成。B切片的每一经译码视频块可接着具有用以指示所述视频块是从列表0 66和列表1 68被双向预测(Bi)还是从列表C 70被单向预测(Pred_LC)的相关联的帧间预测状态语法元素(即，inter_pred_idc)。因此，所述技术导致减小译码B切片(包括GPB切片)中的视频块的帧间预测状态(而不管列表0与列表1是否相同)的成本。明确地用信号表示列表C 70中的参考帧的数目还使得视频解码器30能够解析与经译码B切片中的每一视频块相关联的帧间预测状态语法元素。视频编码器20可接着编码将由视频解码器30解码的表示当前视频切片的视频块和与所述视频切片相关联的语法元素的位流(116)。

图6为说明使用语法元素建构列表C且使用列表C解码单向预测视频块的实例操作的流程图。参考图3的视频解码器30来描述所说明的操作，且所说明的操作可对应于上文在表2和表3中所呈现的组合参考图片列表语法表。

视频解码器30从视频编码器20接收表示当前视频切片的视频块和与所述视频切片相关联的语法元素的经编码位流(120)。在当前视频切片被指定为B切片时，视频解码器30使用语法元素基于存储于参考图片存储器92中的经解码参考图片而建构列表0 94和列表1 96(122)。视频解码器30可根据包括初始化和修改的正常参考图片列表建构程序而建构列表0 94和列表1 96。视频解码器30接着从所接收的语法元素确定组合参考图片列表(列表C 98)是否用于B切片的单向预测(123)。

为了建构列表C 98，视频解码器30首先从自视频编码器20接收的语法元素确定列表C 98中的多个参考图片(132)。在一个实例中，列表C 98可包括列表0 94与列表1 96两者中的所有参考图片。在此情况下，列表C 98中的参考图片的数目可等于列表0 94与列表1 96中的参考图片的数目的总和。

在其它情况下，由列表0 94和列表1 96所指示的参考图片中的一者或一者以上可能重叠。列表C 98可经建构成消除冗余参考图片，以使得列表C 98中的参考图片的数目可小于列表0 94与列表1 96中的参考图片的总和。在其它实例中，列表C 98可包括少于列表0 94与列表1 96中的所有参考图片，这取决于由视频编码器20执行的选择。

视频解码器30接着使用明确地用信号表示列表C 98的内容应从列表0 94和列表196建构的方式的语法元素而建构包括来自列表0 94和/或列表1 96的一个或一个以上参考图片的列表C 98(134)。举例来说，视频解码器30可基于指示列表C 98中的每一条目与列表0 94中的参考图片有关还是与列表1 96中的参考图片有关，且指示列表C 98中的每一条目的当前参考图片列表中的参考图片的索引的语法元素来建构列表C 98。下文关于图7和图8更详细地描述用于建构列表C 98的实例操作。明确地用信号表示列表C98中和列表C 98中的每一条目的参考帧的数目使得视频解码器30能够在无需复杂的解码过程的情况下建构列表C 98。

在一些情况下，视频解码器30可能不从列表0 94和列表1 96建构列表C 98，而是替代地，将把列表C 98设定成等于列表0 94与列表1 96中的一者。在列表0 94与列表1 96相同(即，B切片为GPB切片)的情况下，视频解码器30将列表C 98设定成等于列表0 94。在其它实例中，列表C 98可被设定成等于列表1 96。视频解码器30可基于从视频编码器20接收的指示列表C 98是从列表0 94和列表1 96建构还是仅仅被设定成等于参考图片列表中的一者的一位旗标(即，ref_pic_list_combination_flag)而确定列表094与列表1 96相同。如果列表C 98不是从列表0 94和列表1 96建构，则视频解码器30知晓列表0 94与列表1 96相同，且列表C 98可被设定成等于列表0 94与列表1 96中的一者。在此情况下，视频解码器30不接收明确地用信号表示列表C 98的内容应由视频解码器30从列表0 94和列表1 96建构的方式的额外语法元素。

当列表0 94与列表1 96不同时，视频解码器30确定列表0 94与列表1 96中的一者是否为另一列表的子集。举例来说，列表0 94中所识别的参考图片可包含列表1 96中所识别的参考图片的子集。当列表0 94与列表1 96中的一者为另一列表的子集时，视频解码器30将列表C 98设定成等于另一列表。举例来说，当列表0 94中所识别的参考图片为列表1 96中所识别的参考图片的子集时，列表C 98可被设定成等于列表1 96。

视频解码器30可基于从视频编码器20接收的指示列表C 98是被明确地用信号表示还是等于列表0 94与列表1 96中的一者的二位旗标(即，com_list_equal_idc)而确定列表0 94与列表1 96中的一者为另一列表的子集。如果列表C 98等于列表0 94或列表196，则视频解码器30将列表C 98设定成等于列表0 94或列表1 96。视频解码器30不接收明确地用信号表示列表C 98的内容应从列表0 94和列表1 96建构的方式的额外语法元素。

在建构列表C 98之后，视频解码器30可接着相对于列表C 98中的参考图片使用单向预测来解码B切片的一个或一个以上视频块(136)。根据所述技术，视频解码器30可使用列表C解码单向预测视频块，而不管列表C如何形成。B切片的每一经译码视频块可接着具有用以指示所述视频块是从列表0 94和列表1 96被双向预测(Bi)还是从列表C98被单向预测(Pred_LC)的相关联的帧间预测状态语法元素(即，inter_pred_idc)。明确地用信号表示列表C 98中的参考帧的数目还使得视频解码器30能够解析与经译码B切片中的每一视频块相关联的帧间预测状态语法元素。

图7为说明使用明确地指示如何建构列表C 98(来自图6的步骤134)的语法元素来建构列表C 98的第一实例操作的流程图。参考图3的视频解码器30来描述所说明的操作，且所说明的操作可对应于上文在表2中所呈现的实例组合参考图片列表语法表。

视频解码器30从语法元素确定列表C 98中所识别的多个参考图片以便知晓多少条目包括于列表C 98中。视频解码器30接着通过将列表0 94或列表1 96中的参考图片的参考索引添加到列表C 98中的每一条目来建构列表C 98。更特定来说，视频解码器30可首先从语法元素确定待添加到列表C 98的给定条目中的当前参考图片的当前列表(列表0 94或列表1 96)(140)。举例来说，视频解码器30可基于指示用于条目的当前参考图片是来自列表0 94还是列表1 96的一位旗标(即，pic_from_list_0_flag(i)(其中i识别列表C 98中的条目))来确定当前列表。

视频解码器30接着从语法元素确定当前参考图片列表(列表0 94或列表1 96)中的当前参考图片的索引(142)。举例来说，视频解码器30可基于指示待添加到列表C 98的当前参考图片列表中的当前参考图片的参考索引的语法元素(即，ref_idx_list_curr(i)(其中i识别列表C 98中的条目))来确定当前参考图片的索引。视频解码器30接着将当前参考图片的索引添加到列表C 98中的条目(144)。

如果列表C 98中的条目为列表C 98中的最后一个条目(146的“是”分支)，则视频解码器30完成建构列表C 98且可使用列表C 98来解码B切片的单向预测视频块。如果列表C 98中的条目不是列表C 98中的最后一个条目(146的“否”分支)，则视频解码器30继续通过将列表0 94或列表1 96中的参考图片的参考索引添加到列表C 98中的每一条目来建构列表C 98(140、142、144)。

图8为说明使用明确地指示如何建构列表C 98(来自图6的步骤134)的语法元素来建构列表C 98的第二实例操作的流程图。参考图3的视频解码器30来描述所说明的操作，且所说明的操作可对应于上文在表3中所呈现的实例组合参考图片列表语法表。

视频解码器30从语法元素确定列表C 98中所识别的多个参考图片以便知晓多少条目包括于列表C 98中。视频解码器30接着通过将列表0 94或列表1 96中的参考图片的参考索引添加到列表C 98中的每一条目来建构列表C 98。更特定来说，视频解码器30可首先从语法元素确定待添加到列表C 98的给定条目中的当前参考图片的当前列表(列表0 94或列表1 96)(150)。举例来说，视频解码器30可基于指示用于条目的当前参考图片是来自列表0 94还是列表1 96的一位旗标(即，pic_from_list_0_flag(i)(其中i识别列表C 98中的条目))来确定当前列表。

视频解码器30接着从语法元素确定当前参考图片列表(列表0 94或列表1 96)中的当前参考图片的索引增量(152)。索引增量界定当前参考图片列表中的当前参考图片的索引与当前参考图片列表中的被添加到列表C 98中的前一条目的前一参考图片的索引之间的差异。视频解码器30可接着基于索引增量和来自当前参考图片列表的先前参考图片的索引来计算当前参考图片列表中的当前参考图片的索引(154)。视频解码器30接着将当前参考图片的索引添加到列表C 98中的条目(156)。

以此方式，所述技术减小明确地用信号表示列表C 98中所识别的每一参考图片的参考索引的成本。替代地，视频编码器20可仅用信号表示待从列表0 94和列表1 96中的每一者添加到列表C 98中的索引值之间的差异。包括于列表C 98中的来自列表0 94和列表1 96中的给定一者的参考图片的索引值通常呈递增次序且增加小的增值。

如果列表C 98中的条目为列表C 98中的最后一个条目(158的“是”分支)，则视频解码器30完成建构列表C 98且可使用列表C 98来解码B切片的单向预测视频块。如果列表C 98中的条目不是列表C 98中的最后一个条目(158的“否”分支)，则视频解码器30继续通过将列表0 94或列表1 96中的参考图片的参考索引添加到列表C 98中的每一条目来建构列表C 98(150、152、154、156)。

在一个或一个以上实例中，所描述的功能可在硬件、软件、固件或其任何组合中实施。如果在软件中实施，则功能可作为一个或一个以上指令或代码而存储于计算机可读媒体上或经由计算机可读媒体进行传输，且由基于硬件的处理单元执行。计算机可读媒体可包括对应于有形媒体(例如，数据存储媒体)的计算机可读存储媒体或通信媒体，通信媒体包括促进(例如)根据通信协议将计算机程序从一处传送到另一处的任何媒体。以此方式，计算机可读媒体通常可对应于(1)为非暂时的有形计算机可读存储媒体或(2)例如信号或载波的通信媒体。数据存储媒体可为可由一个或一个以上计算机或一个或一个以上处理器存取以俘获指令、程序代码和/或数据结构以用于实施本发明中所描述的技术的任何可用媒体。计算机程序产品可包括计算机可读媒体。

举例来说而非限制，这些计算机可读存储媒体可包含RAM、ROM、EEPROM、CD-ROM或其它光盘存储器、磁盘存储器或其它磁性存储装置、快闪存储器，或可用以存储呈指令或数据结构的形式的所要程序代码且可由计算机存取的任何其它媒体。而且，可适当地将任何连接称为计算机可读媒体。举例来说，如果使用同轴电缆、光纤缆线、双绞线、数字订户线(DSL)或例如红外线、无线电和微波的无线技术从网站、服务器或其它远程源发射指令，则同轴电缆、光纤缆线、双绞线、DSL或例如红外线、无线电和微波的无线技术包括于媒体的定义中。然而，应理解，计算机可读存储媒体和数据存储媒体不包括连接、载波、信号或其它瞬时媒体，而是替代地针对非瞬时有形存储媒体。如本文中所使用，磁盘和光盘包括压缩光盘(CD)、激光光盘、光学光盘、数字多功能光盘(DVD)、软盘和蓝光光盘，其中磁盘通常以磁性方式再现数据，而光盘通过激光以光学方式再现数据。上述各者的组合也应包括于计算机可读媒体的范围内。

指令可由例如以下各者的一个或一个以上处理器执行：一个或一个以上数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA)或其它等效集成或离散逻辑电路。因此，如本文中所使用的术语“处理器”可指代前述结构或适于实施本文中所描述的技术的任何其它结构中的任一者。另外，在一些方面中，可将本文所描述的功能性提供于经配置以用于编码和解码的专用硬件和/或软件模块内，或并入组合式编解码器中。而且，所述技术可充分实施于一个或一个以上电路或逻辑元件中。

可在包括无线手持机、集成电路(IC)或一组IC(例如，芯片组)的广泛多种装置或设备中实施本发明的技术。各种组件、模块或单元描述于本发明中以强调经配置以执行所揭示的技术的装置的功能方面，但不一定需要通过不同硬件单元实现。而是，如上文所描述，各种单元可组合于编解码器硬件单元中或由交互操作的硬件单元的集合(包括如上文所描述的一个或一个以上处理器)结合合适的软件和/或固件来提供。

已描述各种实例。这些和其它实例在所附权利要求书的范围内。

Claims

1.一种译码视频数据的方法，其包含：

从存储经解码参考图片的存储器建构第一参考图片列表和第二参考图片列表；

建构包括来自所述第一参考图片列表和所述第二参考图片列表中的至少一者的一个或一个以上参考图片的组合参考图片列表；

译码指示所述组合参考图片列表的建构信息的一个或一个以上语法元素，其中所述语法元素明确地用信号表示所述组合参考图片列表，包括指示所述组合参考图片列表中所识别的参考图片的数目、指示所述组合参考图片列表中的每一条目，以及指示对于所述组合参考图片列表中的每一条目，参考图片是来自所述第一参考图片列表还是所述第二参考图片列表；以及

相对于所述组合参考图片列表中的一个或一个以上参考图片使用单向预测来译码一个或一个以上视频块。

2.根据权利要求1所述的方法，其中所述语法元素指示所述组合参考图片列表用于单向预测。

3.根据权利要求1所述的方法，其中所述译码视频数据的方法包含解码视频数据的方法，所述方法进一步包含：

用解码器接收表示所述视频块和所述语法元素的经编码位流；

解码所述一个或一个以上语法元素；

使用所述语法元素建构所述组合参考图片列表；以及

使用所述组合参考图片列表解码所述一个或一个以上单向预测视频块。

4.根据权利要求1所述的方法，其中所述译码视频数据的方法包含编码视频数据的方法，所述方法进一步包含：

编码所述一个或一个以上语法元素；

仅使用所述组合参考图片列表编码所述一个或一个以上单向预测视频块；以及

编码表示所述视频块和所述语法元素的位流。

5.根据权利要求1所述的方法，其进一步包含，对于每一视频块，译码指示所述视频块是相对于所述第一参考图片列表中的一个参考图片和所述第二参考图片列表中的一个参考图片使用双向预测被译码还是相对于所述组合参考图片列表中的一个或一个以上参考图片使用单向预测被译码的一个或一个以上语法元素。

6.根据权利要求1所述的方法，其中所述语法元素指示基于所述第一和第二参考图片列表中的相同参考图片的数目而在所述组合参考图片列表中识别的参考图片的数目。

7.根据权利要求1所述的方法，其中所述一个或一个以上语法元素指示对于所述组合参考图片列表中的每一条目，所述第一或第二参考图片列表中的一者中的待添加到所述组合参考图片列表中的当前条目的当前参考图片的索引。

8.根据权利要求1所述的方法，其中所述一个或一个以上语法元素指示对于所述组合参考图片列表中的每一条目，界定所述第一或第二参考图片列表中的一者中的待添加到所述组合参考图片列表中的当前条目的当前参考图片的索引与所述第一或第二参考图片列表中的相同一者中的被添加到所述组合参考图片列表中的先前条目的先前参考图片的索引之间的差异的索引增量。

9.根据权利要求1所述的方法，其中，当所述第一和第二参考图片列表相同时，所述一个或一个以上语法元素指示所述组合参考图片列表被设定成等于所述第一和第二参考图片列表中的一者以用于单向预测。

10.根据权利要求9所述的方法，其中所述一个或一个以上语法元素指示基于在所述第一和第二参考图片列表中的所述一者中识别的参考图片的数目而在所述组合参考图片列表中识别的参考图片的数目。

11.根据权利要求1所述的方法，其中，当所述第一和第二参考图片列表中的一者识别出在另一参考图片列表中所识别的所述参考图片的子集时，所述一个或一个以上语法元素指示所述组合参考图片列表被设定成等于所述另一参考图片列表以用于单向预测。

12.根据权利要求11所述的方法，其中所述一个或一个以上语法元素指示基于在所述另一参考图片列表中识别的参考图片的数目而在所述组合参考图片列表中识别的参考图片的数目。

13.一种视频译码装置，其包含：

存储器，其存储经解码参考图片；以及

处理器，其经配置以：从所述存储器建构第一参考图片列表和第二参考图片列表；建构包括来自所述第一参考图片列表和所述第二参考图片列表中的至少一者的一个或一个以上参考图片的组合参考图片列表；译码指示所述组合参考图片列表的建构信息的一个或一个以上语法元素，其中所述语法元素明确地用信号表示所述组合参考图片列表，包括指示所述组合参考图片列表中所识别的参考图片的数目、指示所述组合参考图片列表中的每一条目，以及指示对于所述组合参考图片列表中的每一条目，参考图片是来自所述第一参考图片列表还是所述第二参考图片列表；以及相对于所述组合参考图片列表中的一个或一个以上参考图片使用单向预测来译码一个或一个以上视频块。

14.根据权利要求13所述的视频译码装置，其中所述语法元素指示所述组合参考图片列表用于单向预测。

15.根据权利要求13所述的视频译码装置，其中所述视频译码装置包含视频解码装置，其中所述处理器：

接收表示所述视频块和所述语法元素的经编码位流；

解码所述一个或一个以上语法元素；

使用所述语法元素建构所述组合参考图片列表；以及

16.根据权利要求13所述的视频译码装置，其中所述视频译码装置包含视频编码装置，其中所述处理器：

编码所述一个或一个以上语法元素；

编码表示所述视频块和所述语法元素的位流。

17.根据权利要求13所述的视频译码装置，其中，对于每一视频块，所述处理器译码指示所述视频块是相对于所述第一参考图片列表中的一个参考图片和所述第二参考图片列表中的一个参考图片使用双向预测被译码还是相对于所述组合参考图片列表中的一个或一个以上参考图片使用单向预测被译码的一个或一个以上语法元素。

18.根据权利要求13所述的视频译码装置，其中所述语法元素指示基于所述第一和第二参考图片列表中的相同参考图片的数目而在所述组合参考图片列表中识别的参考图片的数目。

19.根据权利要求13所述的视频译码装置，其中所述一个或一个以上语法元素指示对于所述组合参考图片列表中的每一条目，所述第一或第二参考图片列表中的一者中的待添加到所述组合参考图片列表中的当前条目的当前参考图片的索引。

20.根据权利要求13所述的视频译码装置，其中所述一个或一个以上语法元素指示对于所述组合参考图片列表中的每一条目，界定所述第一或第二参考图片列表中的一者中的待添加到所述组合参考图片列表中的当前条目的当前参考图片的索引与所述第一或第二参考图片列表中的相同一者中的被添加到所述组合参考图片列表中的先前条目的先前参考图片的索引之间的差异的索引增量。

21.根据权利要求13所述的视频译码装置，其中，当所述第一和第二参考图片列表相同时，所述一个或一个以上语法元素指示所述组合参考图片列表被设定成等于所述第一和第二参考图片列表中的一者以用于单向预测。

22.根据权利要求21所述的视频译码装置，其中所述一个或一个以上语法元素指示基于在所述第一和第二参考图片列表中的所述一者中识别的参考图片的数目而在所述组合参考图片列表中识别的参考图片的数目。

23.根据权利要求13所述的视频译码装置，其中，当所述第一和第二参考图片列表中的一者识别出在另一参考图片列表中所识别的所述参考图片的子集时，所述一个或一个以上语法元素指示所述组合参考图片列表被设定成等于所述另一参考图片列表以用于单向预测。

24.根据权利要求23所述的视频译码装置，其中所述一个或一个以上语法元素指示基于在所述另一参考图片列表中识别的参考图片的数目而在所述组合参考图片列表中识别的参考图片的数目。

25.一种视频译码装置，其包含：

用于从存储经解码参考图片的存储器建构第一参考图片列表和第二参考图片列表的装置；

用于建构包括来自所述第一参考图片列表和所述第二参考图片列表中的至少一者的一个或一个以上参考图片的组合参考图片列表的装置；

用于译码指示所述组合参考图片列表的建构信息的一个或一个以上语法元素的装置，其中所述语法元素明确地用信号表示所述组合参考图片列表，包括指示所述组合参考图片列表中所识别的参考图片的数目、指示所述组合参考图片列表中的每一条目，以及指示对于所述组合参考图片列表中的每一条目，参考图片是来自所述第一参考图片列表还是所述第二参考图片列表；以及

用于相对于所述组合参考图片列表中的一个或一个以上参考图片使用单向预测来译码一个或一个以上视频块的装置。

26.根据权利要求25所述的视频译码装置，其中所述语法元素指示所述组合参考图片列表用于单向预测。

27.根据权利要求25所述的视频译码装置，其中所述视频译码装置包含视频解码装置，所述视频译码装置进一步包含：

用于用解码器接收表示所述视频块和所述语法元素的经编码位流的装置；

用于解码所述一个或一个以上语法元素的装置；

用于使用所述语法元素建构所述组合参考图片列表的装置；以及

用于使用所述组合参考图片列表解码所述一个或一个以上单向预测视频块的装置。

28.根据权利要求25所述的视频译码装置，其中所述视频译码装置包含视频编码装置，所述视频译码装置进一步包含：

用于编码所述一个或一个以上语法元素的装置；

用于仅使用所述组合参考图片列表编码所述一个或一个以上单向预测视频块的装置；以及

用于编码表示所述视频块和所述语法元素的位流的装置。

29.根据权利要求25所述的视频译码装置，其进一步包含用于对于每一视频块译码指示所述视频块是相对于所述第一参考图片列表中的一个参考图片和所述第二参考图片列表中的一个参考图片使用双向预测被译码还是相对于所述组合参考图片列表中的一个或一个以上参考图片使用单向预测被译码的一个或一个以上语法元素的装置。

30.根据权利要求25所述的视频译码装置，其中所述一个或一个以上语法元素指示对于所述组合参考图片列表中的每一条目，所述第一或第二参考图片列表中的一者中的待添加到所述组合参考图片列表中的当前条目的当前参考图片的索引。