CN102474600A

CN102474600A - 用于视频编码中单向预测和双向预测的不同权重

Info

Publication number: CN102474600A
Application number: CN2009801603268A
Authority: CN
Inventors: 马尔塔·卡切维奇; 拉胡尔·P·潘查尔
Original assignee: Qualcomm Inc
Current assignee: Qualcomm Inc
Priority date: 2009-07-09
Filing date: 2009-07-10
Publication date: 2012-05-23
Anticipated expiration: 2029-07-10
Also published as: KR20120031515A; TW201103337A; TWI408966B; CN102474600B; KR101355332B1; JP5497169B2; BR112012000252A2; WO2011005267A1; US8995526B2; JP2012533212A; US20110007803A1; EP2452495B1; EP2452495A1

Abstract

在本发明的一方面中，描述用于解耦单向预测权重与双向预测权重的技术，尤其对于B-单元内的视频块的显式加权预测。根据本发明，在位流中传达的显式权重可由解码器应用于显式双向预测，但可将不同权重(其可为缺省权重或独立定义的显式单向权重)用于显式单向预测。相对于将相同显式权重用于B-单元内的显式双向预测和显式单向预测的技术，所描述的技术可改进视频质量。

Description

用于视频编码中单向预测和双向预测的不同权重

技术领域

本发明涉及视频编码，且更明确地说，涉及为B-视频块使用双向加权预测且为P-视频块使用单向加权预测的关于B-单元的视频编码技术。

背景技术

数字多媒体能力可并入到宽范围的装置中，包含数字电视、数字直播系统、无线通信装置、无线广播系统、个人数字助理(PDA)、膝上型或桌上型计算机、数字相机、数字记录装置、视频游戏装置、视频游戏控制台、蜂窝式或卫星无线电电话、数字媒体播放器及其类似者。数字多媒体装置可实施视频编码技术(例如MPEG-2、ITU-H.263、MPEG-4，或ITU-H.264/MPEG-4第10部分、高级视频编码(AVC))，以更有效地发射和接收或存储和检索数字视频数据。视频编码技术可经由空间预测和时间预测来执行视频压缩，以减少或去除视频序列中固有的冗余。

在视频编码过程中，压缩通常包含空间预测、运动估计和运动补偿。帧内编码依赖于空间预测和变换编码(例如离散余弦变换(DCT)编码)，以减少或去除给定视频帧内视频块之间的空间冗余。帧间编码依赖于时间预测和变换编码，以减少或去除视频序列的连续视频帧的视频块之间的时间冗余。经帧内编码的帧(“I-帧”)通常用作随机存取点以及其它帧的帧间编码的参考。然而，I-帧通常展现比其它帧少的压缩。术语I-单元可指代I-帧、I-片段(I-slice)或I-帧的其它可独立解码的部分。

对于帧间编码来说，视频编码器执行运动估计以追踪两个或两个以上相邻帧或其它经编码单元(例如帧的片段)之间的匹配视频块的移动。经帧间编码的帧可包括：预测帧(“P-帧”)，其可包含从先前帧预测的块；和双向预测帧(“B-帧”)，其可包含从视频序列的先前帧和随后帧预测的块。在早期的编码技术将预测限制于特定方向的意义上，术语P-帧和B-帧是稍有历史性的。较新的编码格式和标准可不限制P-帧和B-帧的预测方向。因此，术语“双向”现指代基于两个或两个以上的参考数据列表进行的预测，不管此类参考数据与所编码的数据的时间关系。

与较新视频标准(例如ITU H.264)一致，举例来说，双向预测可基于两个不同列表，所述两个不同列表未必需要具有在时间上位于当前视频块之前和之后的数据。换句话说，可从两个数据列表来预测B-视频块，所述两个数据列表可对应于来自两个先前帧、两个随后帧或一个先前帧和一个随后帧的数据。相反，单向预测指代基于一个列表(即，一个数据结构)来预测P-视频块，所述列表可对应于一个预测帧(例如，一个先前帧或一个随后帧)。B-帧和P-帧可更通常称为P-单元和B-单元。P-单元和B-单元也可体现为较小的经编码单元，例如帧的片段或帧的部分。B-单元可包含B-视频块、P-视频块或I-视频块。P-单元可包含P-视频块或I-视频块。I-单元可仅包含I-视频块。

对于P-视频块和B-视频块来说，运动估计产生运动向量，其指示所述视频块相对于预测参考帧或其它经编码单元中的相应预测视频块的移位。运动补偿使用所述运动向量来从所述预测参考帧或其它经编码单元来产生预测视频块。在运动补偿之后，通过从待编码的原始视频块减去预测视频块来形成残余视频块。视频编码器通常应用变换、量化和熵编码过程来进一步减少与残余块的通信相关联的位速率。I-单元和P-单元通常用于定义用于P-单元和B-单元的帧间编码的参考块。

发明内容

本发明描述可适用于双向预测和单向预测的视频编码和解码技术。在双向预测过程中，基于两个不同预测参考数据列表来对视频块进行预测性编码和解码，而在单向预测过程中，基于一个预测参考数据列表来对视频块进行预测性编码和解码。显式加权预测通常指代依赖于在编码器处定义并在位流中传达的显式权重的单向预测或双向预测。将所述权重应用于预测参考数据的像素值，以定义在视频数据的编码和解码中所使用的加权参考数据。

本发明中所描述的技术提供单向预测权重与双向预测权重的解耦，尤其对于B-单元内的视频块的显式加权预测。根据本发明，在位流中传达的显式权重可由解码器应用于显式双向预测，但可将不同权重(其可为缺省权重或独立定义的显式单向权重)用于显式单向预测。所描述的技术可相对于将相同显式权重用于B-单元内的显式双向预测和显式单向预测的技术而改进视频质量。

在一个实例中，本发明描述一种在视频解码器中对视频数据解码的方法。所述方法包括：在所述视频解码器处接收经编码单元，其中所述经编码单元包含指示在所述经编码单元中的一个或一个以上视频块的显式加权预测期间将应用的显式权重的语法元素；经由所述视频解码器将所述显式权重应用于所述经编码单元中的一个或一个以上双向视频块的双向显式加权预测；以及经由所述视频解码器将一个或一个以上不同权重应用于所述经编码单元中的一个或一个以上单向视频块的单向显式加权预测。

在另一实例中，本发明描述一种在视频编码器中对视频数据编码的方法。所述方法包括：在所述视频编码器处对经编码单元编码，其中所述经编码单元包含指示在所述经编码单元中的一个或一个以上视频块的显式加权预测期间将应用的显式权重的语法元素；经由所述视频编码器基于所述显式权重对所述经编码单元中的一个或一个以上双向视频块编码；以及经由所述视频编码器基于一个或一个以上不同权重对所述经编码单元中的一个或一个以上单向视频块编码。

在另一实例中，本发明描述一种视频解码设备，其包括：熵单元，其接收经编码单元且对所述经编码单元的一个或一个以上语法元素解码，其中所述语法元素指示在所述经编码单元中的一个或一个以上视频块的显式加权预测期间将应用的显式权重；以及预测单元，其将所述显式权重应用于所述经编码单元中的一个或一个以上双向视频块的双向显式加权预测，以及将一个或一个以上不同权重应用于所述经编码单元中的一个或一个以上单向视频块的单向显式加权预测。

在另一实例中，本发明描述一种对视频数据编码的视频编码设备。所述设备包括：存储器，其存储所述视频数据和用以对所述视频数据进行预测性编码的两个或两个以上数据列表；以及预测单元，其对经编码单元编码，其中所述经编码单元包含指示在所述经编码单元中的一个或一个以上视频块的显式加权预测期间将应用的显式权重的语法元素，基于所述显式权重对所述经编码单元中的一个或一个以上双向视频块编码，以及基于一个或一个以上不同权重对所述经编码单元中的一个或一个以上单向视频块编码。

在另一实例中，本发明描述一种对视频数据解码的装置，所述装置包括：用于接收经编码单元的装置，其中所述经编码单元包含指示所述经编码单元中的一个或一个以上视频块的显式加权预测期间将应用的显式权重的语法元素；用于将所述显式权重应用于所述经编码单元中的一个或一个以上双向视频块的双向显式加权预测的装置；以及用于将一个或一个以上不同权重应用于所述经编码单元中的一个或一个以上单向视频块的单向显式加权预测的装置。

在另一实例中，本发明描述一种对视频数据编码的装置，所述装置包括：用于对经编码单元编码的装置，其中所述经编码单元包含指示在所述经编码单元中的一个或一个以上视频块的显式加权预测期间将应用的显式权重的语法元素；用于基于所述显式权重对所述经编码单元中的一个或一个以上双向视频块编码的装置；以及用于基于一个或一个以上不同权重对所述经编码单元中的一个或一个以上单向视频块编码的装置。

可以硬件、软件、固件或其任何组合来实施本发明中所描述的技术。如果以软件来实施，那么可在一个或一个以上处理器(例如微处理器、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或数字信号处理器(DSP))中执行软件。执行所述技术的软件最初可存储于计算机可读存储媒体中且加载所述处理器中并在所述处理器中执行。

因此，本发明亦描述一种计算机可读存储媒体，其包括在执行时使处理器对视频数据解码的指令。在接收到包含指示在所述经编码单元中的一个或一个以上视频块的显式加权预测期间将应用的显式权重的语法元素的经编码单元后，所述指令即刻使所述处理器将所述显式权重应用于所述经编码单元中的一个或一个以上双向视频块的双向显式加权预测，以及将一个或一个以上不同权重应用于所述经编码单元中的一个或一个以上单向视频块的单向显式加权预测。

另外，本发明描述一种计算机可读存储媒体，其包括在执行时使处理器对视频数据编码的指令，其中所述指令使所述处理器对经编码单元编码，所述经编码单元包含指示在所述经编码单元中的一个或一个以上视频块的显式加权预测期间将应用的显式权重的语法元素；基于所述显式权重对所述经编码单元中的一个或一个以上双向视频块编码；以及基于一个或一个以上不同权重对所述经编码单元中的一个或一个以上单向视频块编码。

本发明的一个或一个以上方面的细节陈述于附图和下文的描述中。本发明中所描述的技术的其它特征、目标和优点将从具体实施方式和图式且从权利要求书而变得显而易见。

附图说明

图1是说明可实施本发明的技术的一个例示性视频编码和解码系统的框图。

图2是说明与本发明一致的可执行加权预测技术的视频编码器的实例的框图。

图3是更详细地说明运动补偿单元的实例的框图。

图4是说明与本发明一致的可执行加权预测技术的视频解码器的实例的框图。

图5和图6是说明与本发明一致的可由视频解码器执行的例示性过程的流程图。

图7是说明与本发明一致的可由视频编码器执行的例示性过程的流程图。

具体实施方式

本发明描述可应用于双向经编码单元(例如，B-单元)的视频编码和解码技术，双向经编码单元例如B-帧、B-片段或至少包含基于两个不同预测参考数据列表来预测的一些视频块的其它独立编码的单元。B-单元可包含许多不同类型的视频块，包含基于两个不同预测参考数据列表编码和解码的B-视频块、基于预测参考数据列表编码和解码的P-视频块，和基于所述相同经编码单元内的帧内数据编码的I-视频块。

已开发并应用于例如ITU H.264的编码标准中的一种编码技术称作加权预测。加权预测指代一个或一个以上权重(有时称作权重因子)经指派给预测数据的预测。在此情况下，可根据权重因子对预测参考数据加权以便定义加权预测参考数据。加权预测通常应用于B-单元，且尤其B-单元内的B-视频块，但还可应用于P-单元或其它经编码单元。在B-单元内的B-视频块的情况下，可将权重指派给所述两个不同预测数据列表以便对预测参考数据加权(所述预测参考数据接着用以对B-视频块编码)，使得可形成改进的预测参考数据。常规地，在将加权预测用于B-单元时，将指派到不同数据列表的相同权重应用于所述B-单元内的B-视频块的双向预测和所述B-单元内的P-视频块的单向预测。

在此情形中，还存在不同类型的加权预测，其可称作显式加权预测、隐式加权预测和缺省加权预测。显式加权预测和隐式加权预测可对应于ITU H.264中定义的不同加权预测模式。缺省加权预测可为显式加权预测的特定情况，其中权重因子由缺省设置来定义。

显式加权预测指代权重因子作为编码过程的一部分而加以动态地定义且编码到位流中的加权预测。隐式加权预测指代在加权预测中基于与数据相关联的一些隐式因子来定义与两个或两个以上不同列表相关联的权重因子的加权预测。举例来说，可通过所述两个不同列表中的数据相对于经预测性编码的数据的时间位置来定义隐式权重因子。如果列表0中的数据比列表1中的数据在时间上更接近于经预测性编码的数据，那么在隐式加权预测中列表0中的数据可经指派较大的隐式权重因子。可相对于所述不同参考数据(例如，参考像素数据)列表中的原始数据应用所述权重因子以便以加权方式调整预测参考数据，从而促使参考数据比在无权重的情况下所另外达成的参考数据更类似于经编码数据。

如所提及，缺省加权预测指代在加权预测中由某缺省设置来预定义与两个或两个以上不同列表相关联的权重因子的加权预测。在一些情况下，缺省加权预测可将相等权重指派到所述列表中的每一者。缺省权重可在位流中传达(如同显式权重)，或在一些情况下，可从位流排除且在编码器和解码器处得知。与缺省权重(其对于不同情节通常为静态的)不同，显式权重可基于对加权预测数据的分析来定义，以便促进可促进改进压缩的较高质量的预测数据。在一些情况下，缺省加权预测或显式加权预测用在编码器处以定义将针对经编码单元而传达的权重。在此情况下，解码器可将这两个情节处理为相同编码模式(例如，显式加权预测模式的不同版本)。针对所述经编码单元在位流中发射的权重对于缺省加权预测来说是基于缺省设置来定义的，且对于显式加权预测来说是基于对预测数据的分析来定义的。

根据本发明，在位流中传达的显式权重可由解码器应用于显式双向预测，但可将不同权重(其可为缺省权重或独立定义的显式单向权重)用于显式单向预测。以此方式，B-单元内的B-视频块的双向预测和所述B-单元内的P-视频块的单向预测可应用不同权重因子。常规地，在定义和用信号发射用于B-单元的加权预测时，将指派到不同数据列表的相同权重应用于所述B-单元内的B-视频块的双向预测和所述B-单元内的P-视频块的单向预测。本发明的技术认可可通过消除这些常规约束来改进编码效率和编码质量。

图1是说明可实施本发明的技术的一个例示性视频编码和解码系统10的框图。如图1所示，系统10包含经由通信信道15将经编码视频发射到目的装置16的源装置12。源装置12和目的装置16可包括宽范围的装置中的任一者。在一些情况下，源装置12和目的装置16包括无线通信装置，例如无线手机、所谓的蜂窝式或卫星无线电电话，或可在通信信道15上传达视频信息的任何装置，其可能或可能不为无线的。然而，本发明的技术(其涉及用于B-单元内的视频块的显式加权预测的单向预测权重与双向预测权重的解耦)未必限于无线应用或设置。

在图1的实例中，源装置12可包含视频源20、视频编码器22、调制器/解调器(调制解调器)23和发射器24。目的装置16可包含接收器26、调制解调器27、视频解码器28和显示装置30。根据本发明，源装置12的视频编码器22可经配置以基于显式权重对经编码单元中的一个或一个以上双向视频块编码，以及基于一个或一个以上不同权重对经编码单元中的一个或一个以上单向视频块编码。同样，视频解码器28可将显式权重应用于经编码单元中的一个或一个以上双向视频块的双向显式加权预测，以及可经由所述视频解码器将一个或一个以上不同权重应用于经编码单元中的一个或一个以上单向视频块的单向显式加权预测。

图1所说明的系统10仅为例示性的。本发明的技术可由支持单向和双向运动补偿预测的任何编码装置执行。源装置12和目的装置16仅为此类编码装置的实例，其中源装置12产生经编码视频数据以供发射到目的装置16。在一些情况下，装置12、16可以实质上对称的方式来操作，使得装置12、16中的每一者包含视频编码和解码组件。因此，系统10可支持视频装置12、16之间的单向或双向视频发射，例如，用于视频流、视频重放、视频广播或视频电话。

源装置12的视频源20可包含视频捕获装置，例如视频相机、含有先前捕获的视频的视频档案或来自视频内容提供者的视频馈送。作为另一替代方案，视频源20可产生基于计算机图形的数据作为源视频或实况视频、存档视频和计算机产生的视频的组合。在一些情况下，如果视频源20为视频相机，那么源装置12和目的装置16可形成所谓的相机电话或视频电话。在每一情况下，可通过视频编码器22来对所捕获、预先捕获或计算机产生的视频编码。可接着根据通信标准(例如，码分多址(CDMA))或另一通信标准通过调制解调器23来调制所述经编码视频信息，并经由发射器24将所述经编码视频信息发射到目的装置16。调制解调器23可包含各种混频器、滤波器、放大器或经设计以用于信号调制的其它组件。发射器24可包含经设计以用于发射数据的电路，包含放大器、滤波器和一个或一个以上天线。

目的装置16的接收器26在信道15上接收信息，且调制解调器27对所述信息解调制。此外，视频编码过程可实施本文所描述的技术中的一者或多者，以使双向预测权重与单向预测权重解耦。与本发明一致，在信道15上传达的信息可包含用以定义权重因子的由视频编码器22定义的信息，且此信息可由视频解码器28使用。显示装置30向用户显示经解码的视频数据，且可包括各种显示装置中的任一者，例如阴极射线管、液晶显示器(LCD)、等离子显示器、有机发光二极管(OLED)显示器，或另一类型的显示装置。

在图1的实例中，通信信道15可包括任何无线或有线通信媒介，例如射频(RF)频谱或一个或一个以上物理传输线，或无线和有线媒介的任何组合。因此，调制解调器23和发射器24可支持许多可能无线协议、有线协议或有线和无线协议。通信信道15可形成基于包的网络(例如，局域网(LAN)、广域网(WAN)或例如因特网的全球网络)的部分，其包括一个或一个以上网络的互连。通信信道15通常表示用于将视频数据从源装置12发射到目的装置16的任何合适通信媒介或不同通信媒介的集合。通信信道15可包含路由器、交换器、基站或可用于促进从源装置12到目的装置16的通信的任何其它设备。

视频编码器22和视频解码器28可根据视频压缩标准(例如ITU-T H.264标准，替代地描述为MPEG-4第10部分、高级视频编码(AVC))来操作。然而，本发明的技术不限于任何特定编码标准。此外，在一些方面，本发明的技术可不依照ITU-T H.264标准，因为ITU-T H.264标准可定义将用于单向预测和双向预测的相同权重因子。举例来说，在ITU-T H.264中，可为两个不同预测数据列表定义两个显式权重。在此情况下，如果使用双向预测，那么应用两个权重。如果使用单向预测，那么仅应用所述权重中的一者(即，对应于用于彼单向预测的列表的权重)。本发明的技术可包括传达四个不同权重(即，用于双向预测的两个权重和用于单向预测的两个权重)。然而，在一些情况下，单向权重可为未经传达而是仅在解码器处得知和应用的缺省权重。在一些情况下，单向权重(尤其此类权重为缺省权重时)可在位流中传达。在其它情况下，单向权重可在解码器处得知和应用而未在位流中传达。

尽管图1中未展示，但在一些方面中，视频编码器22和视频解码器28可各自与音频编码器和解码器集成，且可包含适当MUX-DEMUX单元或其它硬件和软件，以处置对共同数据流或独立数据流中的音频和视频两者的编码。如果适用，MUX-DEMUX单元可遵照ITU H.223多任务器协议，或例如用户数据报协议(UDP)的其它协议。

ITU-T H.264/MPEG-4(AVC)标准由ITU-T视频编码专家组(VCEG)连同ISO/IEC运动图像专家组(MPEG)制定，作为被称为联合视频组(JVT)的集体合伙的产品。在一些方面中，本发明所描述的技术可应用于大体上遵照H.264标准的装置。H.264标准描述于ITU-T研究组的注明日期为2005年3月的ITU-T推荐H.264、一般视听服务的高级视频编码(Advanced Video Coding for generic audiovisual services)中，其在本文中可称作H.264标准或H.264规范或H.264/AVC标准或规范。联合视频组(JVT)继续致力于扩展H.264/MPEG-4AVC。

在ITU-T的各种网络论坛中进行推进H.264/MPEG-4AVC标准的工作，例如“KeyTechnologies Area(KTA)”网络论坛。KTA网络论坛部分地寻求展现比H.264/AVC标准所展现的编码效率高的编码效率的编码技术。本发明所描述的技术可提供相对于H.264/AVC标准的编码改进，但如本申请案的归档处所定义的，所述技术可不依照H.264/AVC标准。

视频编码器22和视频解码器28各自可实施为一个或一个以上微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、软件、硬件、固件或其任何组合。视频编码器22和视频解码器28中的每一者可包含于一个或一个以上编码器或解码器中，其任一者可集成为在相应的移动装置、用户装置、广播装置、服务器或其类似者中的组合编码器/解码器(CODEC)的部分。

视频序列通常包含一连串视频帧。视频编码器22和视频解码器28可对个别视频帧内的视频块操作，以便对视频数据编码和解码。视频块可具有固定或变化的大小，且可根据特定编码标准而在大小方面不同。每一视频帧可包含一连串片段或其它可独立解码的单元。每一片段可包含一连串宏块，宏块可经布置成子块。作为实例，ITU-T H.264标准支持各种块大小(例如，用于亮度(luma)分量的16乘16、8乘8或4乘4，以及用于色度(chroma)分量的8乘8)的帧内预测，以及各种块大小(例如，用于亮度分量的16乘16、16乘8、8乘16、8乘8、8乘4、4乘8和4乘4，以及用于色度分量的相应经缩放的大小)的帧间预测。举例来说，在例如离散余弦变换(DCT)编码或概念类似的变换过程的变换过程之后，视频块可包括像素数据的块或变换系数的块。

较小视频块可提供较佳分辨率，且可用于包含高细节层次的视频帧的定位。大体上，可将宏块和各种子块看作视频块。另外，可将片段看作一连串视频块，例如宏块和/或子块。每一片段可为视频帧的可独立解码单元。或者，帧自身可为可解码单元，或帧的其它部分可被定义为可解码单元。术语“经编码单元”指代视频帧的任何可独立解码单元，例如整个帧、帧的片段、图像群组(GOP)或根据所使用的编码技术定义的另一可独立解码单元。

在基于帧间的预测编码(其包含使用不同权重因子的单向加权预测和双向加权预测)之后，且在任何变换(例如在H.264/AVC中所使用的4x4或8x8整数变换或离散余弦变换或DCT)之后，可执行量化。量化通常指代将残余变换系数量化以减少用于表示所述系数的位的数目的过程。所述量化过程可减少与所述系数中的一些或所有相关联的位深度。举例来说，在量化期间，可将16位值下舍入到15位值。在量化之后，可(例如)根据内容自适应可变长度编码(CAVLC)、内容自适应二进制算术编码(CABAC)或另一熵编码方法来执行熵编码。

本发明的技术特别适用于B-单元的视频块的加权预测。在此情况下，对用于对视频块编码的预测数据加权以调整预测数据的像素值以定义加权预测数据。根据本发明，并非为不同预测数据列表(例如，列表0和列表1)指派一组权重，视频编码器22可为所述不同列表指派两组不同权重，一组权重用于双向预测，且另一组权重用以定义单向预测中所使用的用于不同列表的权重。

如上文所提及，双向预测为基于两个不同数据列表的所谓“B-视频块”的预测。可从来自两个先前帧的两个数据列表、来自随后帧的两个数据列表或来自先前帧的一个数据列表和来自随后帧的一个数据列表来预测B-视频块。相反，单向预测指代基于一个列表来预测P-视频块，所述列表可对应于一个预测帧(例如，一个先前帧或一个随后帧)。B-帧和P-帧可更通常称为P-单元和B-单元。P-单元和B-单元也可体现为较小的经编码单元，例如帧的片段或帧的部分。B-单元可包含B-视频块、P-视频块或I-视频块。P-单元可包含P-视频块或I-视频块。I-单元可仅包含I-视频块。

加权双向预测指代允许权重因子经指派到两个不同列表的双向预测。每一列表可包括与预测帧或其它经编码单元相关联的一组数据(例如，像素值)。在加权双向预测中，在产生加权预测数据过程中，一个列表可被给予更多权重。举例来说，如果所述列表中的一者具有较类似于经编码的视频块的数据，那么在定义基于所述两个列表的加权预测数据的过程中，所述列表可被给予比另一列表更多的权重。

在加权单向预测中，可将给定列表的给定权重因子应用于预测数据。可将不同权重应用于所述不同列表，但在此情况下，给定单向预测将仅使用对应于用于所述单向预测的数据列表的一个权重。根据本发明，针对单向预测为所述两个数据列表定义的权重将不同于针对双向预测定义的权重。如本发明申请时所陈述，所述技术可不依照ITUH.264。

对于不同类型的加权双向预测来说，根据ITU-T H.264，视频编码器22和视频解码器28可通常支持三种不同类型的预测模式。显式加权预测指代权重因子是作为编码过程的部分而加以动态地定义且编码到位流中的加权预测。在此方面，显式加权预测不同于隐式加权预测，例如，显式加权预测导致经编码成位流的部分的权重因子。

隐式加权预测指代在加权预测中基于与数据相关联的一些隐式因子来定义与两个或两个以上不同列表相关联的权重因子的加权预测。举例来说，可通过所述两个不同列表中的数据相对于经预测性编码的数据的相对时间位置来定义隐式权重因子。在隐式加权预测中，权重因子不包含在位流中。而是，视频解码器28可经编程以导出隐式权重因子。

缺省加权预测指代在加权预测中由某缺省设置来预定义与两个或两个以上不同列表相关联的权重因子的加权预测。在一些情况下，缺省加权预测可将相等权重指派到所述列表中的每一者。在缺省加权预测中，权重因子可随位流发送，或可在编码器和解码器处预定义且不在位流中发送。当缺省权重因子在位流中发送时，可将缺省预测模式看作显式预测模式的特殊情况(上文所解释)。因此，也可将缺省预测描述为显式预测模式的缺省权重的应用。在此情况下，可说成仅存在两个不同加权预测模式(例如，显式和隐式)，但显式模式可支持缺省权重或显式定义的权重。

图2是说明可执行与本发明一致的技术的视频编码器50的实例的框图。视频编码器50可对应于源装置12的视频编码器22或不同装置的视频编码器。视频编码器50可对视频帧内的块执行帧内和帧间编码，尽管为易于说明而未在图2中展示帧内编码组件。帧内编码依赖于空间预测以减少或去除给定视频帧内视频的空间冗余。帧间编码依赖于时间预测以减少或去除视频序列的相邻帧内视频的时间冗余。帧内模式(I-模式)可指代基于空间的压缩模式，且例如预测(P-模式)或双向(B-模式)的帧间模式可指代基于时间的压缩模式。

如图2中所示，视频编码器50接收视频帧或片段内的待编码的当前视频块。在图2的实例中，视频编码器50包含预测单元31，预测单元31包括运动估计单元32和运动补偿单元35。视频编码器50还包含存储器34、加法器48、变换单元38、量化单元40和熵编码单元46。对于视频块重新建构来说，视频编码器50还包含反向量化单元42、反向变换单元44和加法器51。视频编码器50还可包含解块滤波器(未图示)，以对块边界滤波以从重新建构的视频中去除块效应。如果需要，所述解块滤波器将通常对加法器51的输出滤波。

在编码过程期间，视频编码器50接收待编码的视频块，且运动估计单元32和运动补偿单元35执行帧间预测编码。运动估计单元32和运动补偿单元35可高度集成，但为概念目的而对其进行独立说明。通常将运动估计看作产生运动向量的过程，所述运动向量估计视频块的运动。举例来说，运动向量可指示预测帧(或另一经编码单元)内的预测块相对于当前帧(或另一经编码单元)内正编码的当前块的移位。通常将运动补偿看作基于由运动估计确定的运动向量来取回或产生预测块的过程。此外，运动估计单元32和运动补偿单元35可在功能性上集成。为达成演示性目的，将本发明所描述的技术描述为由预测单元31执行。

运动估计单元32通过将待编码的视频块与一个或一个以上预测经编码单元(例如，依据时间或时间上的先前和/或未来帧)的视频块进行比较来选择用于所述待编码的视频块的适当运动向量。作为实例，运动估计单元32可以许多方法来选择用于B-帧的运动向量。在一种方法中，运动估计单元32可从第一组帧(称作列表0)选择先前或未来帧，且仅使用来自列表0的此先前或未来帧来确定运动向量，其为一类单向运动估计。或者，运动估计单元32可从第二组帧(称作列表1)选择先前或未来帧，且仅使用来自列表1的此先前或未来帧来确定运动向量，其为另一类单向运动估计。在又一方法中，运动估计单元32可选择来自列表0的第一帧和来自列表1的第二帧，且选择来自列表0的第一帧和列表1的第二帧的一个或一个以上运动向量。此第三种形式的预测可被称作双预测运动估计。

本发明的技术可经实施以解耦针对单向运动补偿指派到列表0和列表1的权重因子与针对双向运动补偿指派到列表0和列表1的权重因子。针对任一给定列表的选定运动向量可针对最类似于经编码的视频块的预测视频块，例如，如例如所述预测块的像素值相对于经编码的块的像素值的绝对差和(SAD)或平方差和(SSD)的度量所定义。在基于所述运动向量来产生预测数据时，运动补偿单元35可应用适当权重因子。即，应用权重因子(其对于单向预测和双向预测来说为不同的)以对预测数据加权以便定义加权预测数据，其用于对当前视频块的编码或解码中。

根据ITU-T H.264/AVC标准，可使用不同运动补偿双向预测算法或模式来预测B-帧或其部分，例如视频块、宏块或B-帧的任何其它离散和/或连续部分。第一运动补偿双预测算法或模式(其通常称作缺省加权预测)可涉及将缺省权重应用到列表0的所述第一帧和列表1的所述第二帧的每一经识别视频块。对于缺省加权预测来说，所述缺省权重可根据所述标准来编程且通常经选择为相等的。接着将所述第一帧与第二帧的加权块相加并除以预测B-帧所使用的总帧数目(例如，在此例子中为二)。通常，通过将所述第一帧与第二帧的加权块的相加值加1且接着将所述结果向右移一个位来完成此除法。加1是舍入调整，在一些实施例中，可免除加1的舍入调整。

在一些情况下，可避免在右移一个位之前加1(舍入调整)，因此消除上偏倚舍入(upward biased rounding)。运动补偿单元35可产生具有舍入的加权块和不具有舍入的加权块两者，且可选择达成最佳编码效率的块。

更大体来说，双向加权预测可由下式给出：

pred(i，j)＝(pred0(i，j)*w0+pred1(i，j)*w1+2^r)＞＞(r+1)

其中pred(i，j)为与加权预测块相关联的数据，pred0(i，j)为来自列表0的数据，pred1(i，j)为来自列表1的数据，w0和w1为权重因子，2^r为舍入项，且＞＞为右移(r+1)个位的运算。在一些情况下，可由运动补偿单元35产生并考虑pred(i，j)之两个不同版本。第一版本与上述方程式一致，且第二版本与无舍入(即，将项“2^r”从所述方程式去除)的上述方程式一致。在一些情况下，消除此舍入可达成更好加权预测数据，此可改进编码效率。运动补偿单元35可产生一个或一个以上语法元素，以定义是否将舍入用于给定视频块或一组视频块。所述双向预测模式和指示是否使用舍入的所述一个或一个以上语法元素均可从运动补偿单元35输出到熵编码单元46，以包含在经编码位流中。

B图像使用两个先前经编码参考图像列表，列表0和列表1。这两个列表可各自含有时间次序上为过去和/或未来的经编码图像。可以下列几种方法中的一者来预测B图像中的块：来自列表0参考图像的运动补偿预测、来自列表1参考图像的运动补偿预测，或来自列表0与列表1参考图像的组合的运动补偿预测。为获得列表0与列表1参考图像的组合，分别从列表0和列表1参考图像获得两个运动补偿参考区域，且所述两个参考区域可以加权方式组合。可接着使用其组合来预测当前块。

在本发明中，术语“B图像”将用以大体上指代任何类型的B单元，其可为B帧、B片段，或可能包含至少一些B视频块的其它视频单元。如所提及，B图像可允许3种类型的加权预测，缺省、隐式和显式。此外，有时将缺省预测看作显式权重因子由缺省设置定义的特定类型的显式预测。为简单起见，在下文的论述中仅展示单向预测中的前向预测，尽管也可将反向预测用作另一类型的单向预测。

可由以下方程序分别针对单向预测和双向预测来定义缺省加权预测。

单向预测：pred(i，j)＝pred0(i，j)

双向预测：pred(i，j)＝(pred0(i，j)+pred1(i，j)+1)＞＞1

其中pred0(i，j)及pred1(i，j)是来自列表0和列表1的预测数据。

可由以下方程序分别针对单向预测和双向预测来定义隐式加权预测。

单向预测：pred(i，j)＝pred0(i，j)

双向预测：pred(i，j)＝(pred0(i，j)*w0+pred1(i，j)*w1+32)＞＞6

在此情况下，每一预测由权重因子w0或w1缩放，其中w0和w1是基于列表0与列表1参考图像的相对时间位置来计算的。

可由以下方程序分别针对单向预测和双向预测来定义显式加权预测。

单向预测：pred(i，j)＝(pred0(i，j)*w0+2^r-1)＞＞r+o1

双向预测：

pred(i，j)＝(pred0(i，j)*w0+pred1(i，j)*w1+2^r)＞＞(r+1)+((o1+o2+1)＞＞1)

在此情况下，权重因子由编码器确定并在片段标头中发射，且o1和o2分别为列表0和列表1参考图像的图像偏差值。

常规地，在双向预测中总是使用舍入调整。根据上述方程式，在缺省加权预测中在右移一个位之前使用1的舍入调整，且在隐式加权预测中在右移六个位之前使用32的舍入调整。大体上，在右移r个位之前通常使用2^r-1的舍入调整，其中r表示正整数。

此类频繁和偏倚舍入运算可降低预测的精确度。此外，在显式加权预测的双向预测中，实际上存在2次舍入，一次用于参考图像且另一次用于偏差值。因此，在此情况下，可累积舍入误差。根据本发明的一方面，替代进行2次独立舍入，视频编码器可在右移之前将偏差值加至加权预测，如下：

pred(i，j)＝(pred0(i，j)*w0+pred1(i，j)*w1+((o1+o2)＜＜r)+2^r)＞＞(r+1)，

其中pred(i，j)是与舍入相关联的加权预测数据，pred0(i，j)是来自列表0的数据，pred1(i，j)是来自列表1的数据，w0和w1是权重因子，o1和o2是偏差值，且r和2^r是与右移(r+1)个位的运算“＞＞“结合提供舍入的舍入项。此可提供更好的预测准确性。在此情况下，还可定义新的语法元素以允许将两个不同偏差值(o1和o2)组合成一个偏差值。此外，在此情况下，舍入值可包括上述舍入调整(例如，在右移(r+1)个位的运算之前的2^r)以及与所述偏差值相关联的另一舍入值(“r”)。上述方程式还可稍经修改以为偏差值提供较高精确度。如果需要偏差值的较高精确度，那么可使偏差值乘以因子(例如乘以2)且接着舍入为整数。还可改变左移以指出此为偏差值添加了精确度。

显式加权预测的另一问题在于单向预测与双向预测可共享相同权重和偏差值。为具有更多灵活性用于更好预测，根据本发明，可解耦单向预测与双向预测。在此情况下，单向预测和双向预测可针对给定类型的预测(缺省、隐式或显式)来定义不同权重和偏差值。可针对显式预测来定义新的语法元素以允许进行更好的预测。编码器可将所述语法元素包含在经编码位流中，以用信号发射所述编码器所使用的权重因子和所述编码器所使用的可能不同舍入模式，使得解码器可使用相同权重因子和舍入模式。

适应性地选择舍入调整是有益的。进行此的一种方法是基于两组或两组以上不同的预测数据来产生所述两组或两组以上不同的预测数据(且可能对视频块编码几次)。一组所述预测数据可具有非零舍入，且另一组预测数据可消除舍入。在其它实例中，可考虑上舍入(upward rounding)、下舍入(downward rounding)和无舍入。运动补偿单元35可产生这些不同类型的预测数据，且可进行速率-失真(RD)分析以针对给定视频块选择最佳的预测数据。

速率-失真(RD)分析在视频编码中相当普遍，且通常涉及计算指示编码成本的成本度量。所述成本度量可平衡编码所需的位数目(速率)和与编码相关联的质量级别(失真)。典型速率-失真成本计算可大体上对应于以下格式：

J(λ)＝λR+D，

其中J(λ)为成本，R为位速率，D为失真，且λ为拉格朗日乘数。

视频编码器50识别最合意的预测数据的一种方法是使用运动估计单元32来首先找到运动向量，且接着实施运动补偿单元35和加法器48以计算在具有和不具有舍入调整的情况下的预测误差。运动补偿单元35可接着选择产生最小预测误差的预测数据。可通过使用预测数据与经编码的当前数据之间的绝对差和来计算预测误差。

根据本发明，针对显式加权预测定义的权重(和任选偏差值)对于单向预测和双向预测来说可为不同的。显式权重可计算为：

显式权重＝缺省权重*(DC_Current_frame/DC_Reference_frame)

在此情况下，术语“DC_Current_frame”是当前帧(或其它经编码单元)的所有像素的和，且术语“DC_Reference_frame”是参考帧(或其它经编码单元)的所有像素的和，参考帧可来自列表0或列表1。

列表0和列表1中的每一参考帧可具有指派给其的显式权重。此外，每一参考帧具有用于单向预测的一个权重，且双向预测中所涉及的每一对参考图像具有用于两个参考帧的一对权重。常规显式加权预测的问题在于单向预测与双向预测共享相同权重。

作为实例，如果：

F＝当前帧

F0＝列表0中的参考帧

F1＝列表1中的参考帧

w0＝用于F0的显式权重

W1＝用于F1的显式权重

wd＝缺省权重

那么：

w 0 = wd * (\frac{\underset{i}{Σ} \underset{j}{Σ} F (i, j)}{\underset{i}{Σ} \underset{j}{Σ} F 0 (i, j)})

w 1 = wd * (\frac{\underset{i}{Σ} \underset{j}{Σ} F (i, j)}{\underset{i}{Σ} \underset{j}{Σ} F 1 (i, j)}) .

来自列表0的单向预测可由下式给出：

pred(i，j)＝(pred0(i，j)*w0+2^r-1)＞＞r

来自列表1的单向预测可由下式给出：

pred(i，j)＝(pred1(i，j)*w1+2^r-1)＞＞r

双向预测可由下式给出：

pred(i，j)＝(pred0(i，j)*w0+pred1(i，j)*w1+2^r-1)＞＞r

为了具有更多灵活性用于更好预测，可解耦用于单向预测与双向预测的权重。

因此，根据本发明，来自列表0的单向预测可由下式给出：

pred(i，j)＝(pred0(i，j)*w0+2^r-1)＞＞r。

来自列表1的单向预测可由下式给出：

pred(i，j)＝(pred1(i，j)*w1+2^r-1)＞＞r，以及

双向预测可由下式给出：

pred(i，j)＝(pred0(i，j)*w2+pred1(i，j)*w3+2^r-1)＞＞r

在此情况下，w2不同于w0，且w3不同于w1。

对于单向预测来说，预测单元31可使用原始缺省权重并对原始预测权重编码。对于双向预测来说，预测单元31可使用通过最小化当前帧(或其它经编码单元)与使用来自列表0和列表1的参考帧所形成的虚拟帧(或其它参考单元)之间的误差而计算出的显式权重并对所述显式权重编码。

作为实例，如果：

F＝当前帧

F0＝列表0中的参考帧

F1＝列表1中的参考帧

w＝显式权重

Fv＝虚拟帧＝wF0+(1-w)F1

e＝当前帧与所述虚拟帧之间的误差。

那么，

e＝F-Fv

＝F-(wF0+(1-w)F1)

＝F-wF0+wF1-F1

＝(F-F1)-w(F0-F1)

所述误差可最小化如下：

0 = \frac{&PartialD; (e^{2})}{&PartialD; w}

w = \frac{\underset{i}{Σ} \underset{j}{Σ} ((F (i, j) - F 1 (i, j)) (F 0 (i, j) - F 1 (i, j)))}{\underset{i}{Σ} \underset{j}{Σ} ({(F 0 (i, j) - F 1 (i, j))}^{2})}

因此，在此情况下，双向预测可由下式给出：

pred(i，j)＝(pred0(i，j)*w+pred1(i，j)*(1-w)+2^r-1)＞＞r

此外，在此情况下，来自列表0的单向预测可由下式给出：

pred(i，j)＝(pred0(i，j)*wd+2^r-1)＞＞r

同样，在此情况下，来自列表1的单向预测可由下式给出：

pred(i，j)＝(pred1(i，j)*wd+2^r-1)＞＞r

如果将B-单元定义为应用加权预测，那么可将这些不同权重编码到经编码单元的语法元素中且稍后随所述经编码单元发射(例如，在片段标头中)。因此，解码器(未展示在图2中)可接收这些权重，并仅在给定块需要双向预测时才使用所述权重。否则，解码器可将缺省权重用于单向预测。所述缺省权重可包含在所述语法元素中，或可从所述语法元素排除且在解码器处预定义为在所述语法中不存在显式权重时所应用的缺省权重。

在一些情况下，为了找到最佳加权预测，视频编码器50可使用所有可能的权重值来执行编码，且基于速率-失真成本来选择最佳权重。然而，为了减少复杂性，视频编码器50可通过使用上述技术来执行对权重的第一估计，且接着考虑接近所估计权重的其它权重。换句话说，并非通过考虑每一组可能权重来对最佳预测执行竭尽式搜索，视频编码器50可使用上述技术来估计所述权重，且可接着考虑在一范围内大于和/或小于所估计权重的其它权重。

作为实例，所述权重可具有在0与127之间的任何值。识别最佳权重的一种方法为进行竭尽式搜索，所述竭尽式搜索考虑每一权重值且基于最低速率-失真成本来选择最佳权重。然而，识别最佳权重的更快方法可为使用上文所概述的方法来进行对权重的第一猜测，且接着考虑接近于所估计权重(例如，误差在一因子内)的其它权重。举例来说，如果上述方法产生权重67，那么也可考虑所估计值67周围加或减10的值(即，57与77之间的值)。在此情况下，可在较小范围57至77内执行竭尽式搜索以选择最佳权重。由于不在整个范围0至127内执行竭尽式搜索，所以所述技术相对于完全竭尽式搜索为简化的。

为进一步减少编码器复杂性，在显式加权预测期间，如果所计算权重与缺省权重相同，那么预测单元31可跳过显式加权预测步骤。在任何情况下，用于双向预测和单向预测的不同权重可改进B图像的质量且达成编码效率的增益。

在一些情况下，为了找到最佳加权预测，视频编码器50可执行多遍编码且基于速率-失真成本来选择最佳模式。进行此的一种方法为竭尽式搜索，其中运动补偿单元35产生每一可能加权预测数据并选择最佳加权预测数据。然而，为减少复杂性，运动补偿单元35可实施本发明的额外技术，例如，首先在缺省加权预测与隐式加权预测之间进行选择，且接着将所述选择与显式加权预测进行比较。运动补偿单元35可计算与显式加权预测相关联的权重和偏差值，且还可使用显式加权预测框架来将偏差值加到以不同方式与缺省加权预测或隐式加权预测(选择任一者)相关联的数据。因此，可由运动补偿单元35计算出两组或两组以上偏差值。第一组偏差值可通过使用缺省加权预测或隐式加权预测中所使用的已知权重来计算，且第二组偏差值可(例如)通过最小化运动补偿预测误差作为显式加权预测的正常计算的部分来与权重联合地计算。

为进一步减少复杂性，在显式加权预测期间，如果偏差值为零，那么运动补偿单元35可跳过使用缺省权重或隐式权重的显式加权预测。同样，如果偏差值为零且所计算权重无改变，那么运动补偿单元35可跳过使用所计算权重和偏差值的典型显式加权预测。

如本文所描述，一旦运动补偿单元35识别了所要预测数据，视频编码器50便通过从经编码的原始视频块减去所述预测数据来形成残余视频块。加法器48表示执行此减法运算的组件。变换单元38将变换(例如离散余弦变换(DCT)或概念类似的变换)应用于所述残余块，产生包括残余变换块系数的视频块。举例来说，变换单元38可执行概念上类似于DCT的其它变换，例如由H.264标准定义的那些变换。还可使用小波变换、整数变换、子频带变换或其它类型的变换。在任何情况下，变换单元38将所述变换应用到所述残余块，产生残余变换系数的块。所述变换可将残余信息从像素域转换到频域。

量化单元40量化所述残余变换系数以进一步减少位速率。所述量化过程可减少与所述系数中的一些或所有相关联的位深度。举例来说，在量化期间，可将9位值下舍入为8位值。另外，量化单元40还可针对使用偏差值的情况来量化不同偏差值。

在量化之后，熵编码单元46对量化变换系数进行熵编码。举例来说，熵编码单元46可执行内容自适应可变长度编码(CAVLC)、内容自适应二进制算术编码(CABAC)或另一熵编码方法。在通过熵编码单元46进行熵编码之后，可将经编码的视频发射到另一装置或存档以供稍后发射或检索。经编码位流可包含熵编码残余块、用于此类块的运动向量，以及用于传达用于单向预测和双向预测的不同权重的例如本文所描述的语法元素的其它语法。

反向量化单元42和反向变换单元44分别应用反向量化和反向变换，从而以上述方式在像素域中重新建构残余块(例如)以供稍后用作参考块。加法器51将所述重新建构残余块加到由运动补偿单元35产生的经运动补偿的预测块，以产生重新建构视频块以供存储在存储器34中。所述重新建构视频块可由运动估计单元32和运动补偿单元35用作用以对随后视频帧中的块进行帧间编码的参考块。

图3是更详细地说明图2的运动补偿单元35的实例的框图。如图3的实例所示，运动补偿单元35耦合到存储器34，存储器34将第一组和第二组经编码单元或参考帧存储为列表0 52A和列表1 52B。另外，存储器34可存储经编码的当前视频数据53。存储器34可包括共享存储器结构，或可能若干个不同存储器、存储单元、缓冲器，或促进对本文所论述的任何数据的存储的其它类型的存储器。

根据双向预测，列表0 52A和列表1 52B是与两个不同预测单元相关联的数据，例如，来自两个不同帧或片段或宏块的数据。此外，双向预测未必限于任何预测方向，且因此列表0 52A和列表1 52B可存储来自两个先前帧或片段、两个随后帧或片段，或一个先前帧或片段和一个随后帧或片段的数据。此外，在一些情况下，列表0 52A和/或列表1 52B可各自包含与多个帧、片段或宏块相关联的数据。列表0 52A和/或列表1 52B仅为两组不同的可能预测数据，且每一列表可包含相对于经编码的当前视频块在任何方向上的一个帧或片段，或若干帧、片段或宏块。

如图3所示，运动补偿单元35包含缺省加权预测单元54、隐式加权预测单元56和显式加权预测单元58。如本文所描述，单元54、56和58分别执行缺省加权预测、隐式加权预测和显式加权预测。速率-失真(R-D)分析单元64可在这些可能性中选择加权预测数据，且可实施本发明的技术以促进所述选择过程。

运动补偿单元35还包含舍入单元55，其使单元54、56和58中的一或多者产生各别加权预测数据的舍入和未舍入版本。此外，通过消除舍入，在一些情形中，可改进加权预测数据。

另外，运动补偿单元35包含偏差值计算单元62，其计算偏差值。根据ITU-TH.264/MPEG-4AVC编码格式，仅在显式加权预测中允许偏差值。因此，为在缺省加权预测或隐式加权预测的情形中考虑偏差值，可将由缺省加权预测单元54或隐式加权预测单元56确定的权重连同由偏差值计算单元62确定的偏差值转发到显式加权预测单元58。以此方式，显式加权预测单元58可通过将偏差值加到缺省加权预测数据或隐式加权预测数据以供R-D分析单元64考虑来利用ITU-T H.264/MPEG-4AVC编码格式。在此情况下，显式加权预测单元58不仅产生正常显式加权预测数据，而且产生使用由缺省加权预测单元54或隐式加权预测单元56确定的权重结合由偏差值计算单元62确定的偏差值的预测数据。

偏差值计算单元可将偏差值当作经编码的块的视频块值的平均值与预测块的视频块值的平均值之间的差来计算。可针对亮度视频块来计算偏差值，且在一些情况下，可针对亮度视频块和针对色度视频块来计算偏差值。

R-D分析单元64可分析不同加权预测数据，且可选择产生质量方面或速率和失真方面最佳的结果的加权预测数据。R-D分析单元64输出选定加权预测数据，可经由加法器48(图2)从经编码的视频块减去所述选定加权预测数据。可使用语法元素来向解码器告知产生所述加权预测数据所应使用的方式或方法。所述语法元素(例如)可指示是否使用舍入，且可指示应使用缺省加权预测、隐式加权预测还是显式加权预测。如果应使用显式加权预测，那么所述语法元素可进一步识别权重因子和偏差值，所述权重因子和偏差值此外可为与显式加权预测相关联的权重因子和偏差值，或可为加上来自偏差值计算单元62的偏差值的实际上由缺省加权预测单元54或隐式加权预测单元56定义的权重因子。

显式加权预测单元58连同R-D分析单元64可执行本发明的技术，以针对显式单向预测和显式双向预测定义不同权重。由缺省加权预测单元54定义的缺省权重可用于显式单向预测，而由显式加权预测单元58定义的显式权重可用于显式双向预测。

图4是说明例示性视频解码器70的框图，视频解码器70可执行与上述编码技术互逆的解码技术。视频解码器70可包含熵解码单元72、预测单元75、反向量化单元76、反向变换单元78、存储器74和加法器79。预测单元75可包含运动补偿(MC)单元88以及空间预测组件，为了简单性且易于说明，未展示所述空间预测组件。

视频解码器70接收经编码单元，其中所述经编码单元包含指示在所述经编码单元中的一个或一个以上视频块的显式加权预测期间所将应用的显式权重的语法元素。熵解码单元72可对所接收位流解码并从所述位流分析出显式权重。预测单元75的运动补偿单元86将所述显式权重应用于所述经编码单元中的一个或一个以上双向视频块的双向显式加权预测。另外，预测单元75的运动补偿单元86将一个或一个以上不同权重应用于所述经编码单元中的一个或一个以上单向视频块的单向显式加权预测。

所述显式权重可包括双向显式权重，且所述一个或一个以上不同权重可包括单向显式权重，其可或可不在所述经编码单元中接收到。如上文所提，所述一个或一个以上不同权重包括一个或一个以上缺省权重。所述缺省权重可在MC单元86处预定义且不包含在经编码单元的语法元素中，或替代地，所述缺省权重可包含在经编码单元的语法元素中。预测单元75还可支持根据隐式加权预测进行的解码。举例来说，解码单元70可接收不包含显式权重的另一经编码单元。在单元72进行熵解码之后，预测单元75的MC单元86可产生一个或一个以上隐式权重，并将所述一个或一个以上隐式权重应用于所述另一经编码单元中的一个或一个以上视频块的隐式加权预测。

通常，熵解码单元72接收经编码位流且对所述位流进行熵解码，以产生根据本发明所使用的量化系数、运动信息和其它语法元素。将运动信息(例如，运动向量)和其它语法元素转发到预测单元75以用于产生预测数据。预测单元75执行与本发明一致的单向预测和双向预测，根据所接收语法元素将不同权重应用于单向预测和双向预测。所述语法元素可识别待使用的加权预测类型、在不同情节中应用的权重、将应用的偏差值(如果使用显式加权预测)，以及在解码过程中是否应使用舍入调整的指示。

将所述量化系数从熵解码单元72发送到反向量化单元76，其执行反向量化。反向变换单元78接着将解量化系数反向变换回到像素域以产生残余块。加法器79将由预测单元75产生的预测数据(例如，预测块)与来自反向变换单元78的残余块组合以产生重新建构视频块，其可存储在存储器74中和/或从视频解码器70输出作为经解码视频输出。

图5是说明与本发明一致的由视频解码器执行的例示性过程的流程图。将从图4的视频解码器70的观点来描述图5。如图5所示，熵解码单元72接收包含显式权重的经编码单元(101)。熵解码单元72可对所述经编码单元(例如，帧或片段)进行熵解码，并从位流分析出所述显式权重。预测单元75的运动补偿单元86将所述显式权重应用于所述经编码单元中的一个或一个以上双向视频块的双向显式加权预测(102)。另外，预测单元75的运动补偿单元86经由视频解码器将一个或一个以上不同权重应用于所述经编码单元中的一个或一个以上单向视频块的单向显式加权预测(103)。视频解码器70可将经解码视频块输出到显示器(图5中未展示)，所述显示器显示经解码的视频块(104)。

图6是说明与本发明一致的由视频解码器执行的例示性过程的另一流程图。还将从图4的视频解码器70的观点来描述图6。如图6所示，熵解码单元72接收包含显式权重的经编码单元(111)。熵解码单元72可对所述编码单元进行熵解码，并从位流分析出显式权重。预测单元75的运动补偿单元86将所述显式权重应用于所述经编码单元中的一个或一个以上双向视频块的双向显式加权预测(112)。另外，预测单元75的运动补偿单元86将一个或一个以上缺省权重应用于所述经编码单元中的一个或一个以上单向视频块的单向显式加权预测(113)。所述缺省权重还可包含在所述经编码单元的语法元素中，在此情况下，熵解码单元72可分析所述语法元素并将所述缺省权重转发到预测单元75。或者，可从语法排除所述缺省权重且将其重新编程到MC单元86中以应用于显式单向预测。视频解码器70可将经解码视频块输出到显示器(图5中未展示)，所述显示器显示所述经解码视频块(114)。

图7是说明与本发明一致的由视频编码器执行的用于对经编码单元(例如B-帧或B-片段)编码的例示性过程的流程图。将从图2的视频编码器50的观点来描述图7。如图7所示，预测单元31的运动补偿单元35基于显式权重对经编码单元的双向视频块编码(121)。举例来说，运动补偿单元35可对所述经编码单元的B-视频块执行速率-失真分析，以选择最小化与对所述B-视频块编码相关联的速率-失真成本度量的双向权重。

预测单元31的运动补偿单元35还基于不同权重来对所述经编码单元的单向视频块编码(122)。举例来说，运动补偿单元35可基于缺省权重来对所述经编码单元的P-视频块执行编码。在此情况下，应用于B-视频块的显式权重未用于P-视频块。而是，通过将不同权重应用于预测数据(例如缺省权重)来对P-视频块编码。可将在对B-视频块编码中所使用的显式权重(和可能在对P-视频块编码中所使用的其它权重)从预测单元31转发到熵编码单元46。从加法器48输出的经编码视频块(例如，用于P-视频块和B-视频块的残余块)在发送到熵编码单元46之前可由单元38变换且由单元40量化。

熵编码单元46将所述权重编码到所述经编码单元的语法元素中(123)。详细来说，熵编码单元46可对所述视频块的经量化和经变换系数进行熵编码，且可对所述经编码单元的语法元素内的在此编码中所使用的权重编码。在此情况下，将应用于B-视频块的显式权重编码到所述经编码单元中以由视频解码器应用。应用于P-视频块的其它权重可包含(例如，编码)到位流中或可能从位流排除。举例来说，应用于P-视频块的缺省权重可随应用于P-视频块的显式权重一起包含(例如，缺省权重可编码为显式单向权重)，或替代地，应用于P-视频块的缺省权重可从所述经编码单元排除且在解码器处得知，使得此类权重无需在位流中发送。

在此编码后，可将所述经编码单元从熵编码单元46发送到发射器(例如，图1的发射器24)。发射器24可接着使用无线通信技术或另一数据通信方法将所述经编码视频数据发射到另一装置(124)。

可在广泛各种装置或设备中实施本发明的技术，包含无线手机和集成电路(IC)或一组IC(即，芯片组)。提供已经描述的任何组件、模块或单元以强调功能方面且未必要求通过不同硬件单元来实现。还可以硬件、软件、固件或其任何组合来实施本文所描述的技术。描述为模块、单元或组件的任何特征可共同实施于集成式逻辑装置中，或独立地实施为离散但能共同操作的逻辑装置。在一些情况下，可将各种特征实施为集成式电路装置，例如集成电路芯片或芯片组。

如果以软件来实施，那么所述技术可至少部分通过计算机可读媒体来实现，所述计算机可读媒体包括在处理器中执行时执行上述方法中的一或多者的指令。所述计算机可读媒体可包括计算机可读存储媒体且可形成计算机程序产品的部分，所述计算机程序产品可包含封装材料。所述计算机可读存储媒体可包括随机存取存储器(RAM)(例如同步动态随机存取存储器(SDRAM))、只读存储器(ROM)、非易失性随机存取存储器(NVRAM)、电可擦除可编程只读存储器(EEPROM)、FLASH存储器、磁性或光学数据存储媒体及其类似者。另外或其它，所述技术可至少部分通过载运或传达呈指令或数据结构形式的代码且可由计算机存取、读取和/或执行的计算机可读通信媒介来实现。

代码或指令可由一个或一个以上处理器来执行，例如一个或一个以上数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA)，或其它等效集成式或离散逻辑电路。因此，术语“处理器”在本文中使用时可指代前述结构或适于实施本文所述的技术的任何其它结构中的任一者。另外，在一些方面中，本文所描述的功能性可提供在经配置以用于编码和解码的专用软件模块或硬件模块内，或并入在组合视频编码解码器中。同样，所述技术可完全实施在一个或一个以上电路或逻辑组件中。

本发明还预期包含实施本发明中所描述的技术中的一或多者的电路的各种集成电路装置中的任一者。此电路可提供在单一集成电路芯片中或所谓芯片组中的多个能共同操作的集成电路芯片中。此类集成电路装置可用于各种应用中，其中的一些可包含用于无线通信装置(例如移动电话手机)中。

已描述本发明的各种实施例。这些实施例和其它实施例是在以上权利要求书的范围内。

Claims

1.一种在视频解码器中对视频数据解码的方法，所述方法包括：

在所述视频解码器处接收经编码单元，其中所述经编码单元包含指示在所述经编码单元中的一个或一个以上视频块的显式加权预测期间所将应用的显式权重的语法元素；

经由所述视频解码器将所述显式权重应用于所述经编码单元中的一个或一个以上双向视频块的双向显式加权预测；以及

经由所述视频解码器将一个或一个以上不同权重应用于所述经编码单元中的一个或一个以上单向视频块的单向显式加权预测。

2.根据权利要求1所述的方法，其中所述显式权重包括双向显式权重，且所述一个或一个以上不同权重包括单向显式权重，所述方法进一步包括：

接收所述经编码单元中的所述单向显式权重。

3.根据权利要求1所述的方法，其中所述一个或一个以上不同权重包括一个或一个以上缺省权重。

4.根据权利要求3所述的方法，其中所述缺省权重是在所述视频解码器处定义且不包含在所述经编码单元的所述语法元素中。

5.根据权利要求3所述的方法，其中所述缺省权重包含在所述经编码单元的所述语法元素中。

6.根据权利要求1所述的方法，其进一步包括：

接收不包含显式权重的另一经编码单元；以及

产生一个或一个以上隐式权重并将所述一个或一个以上隐式权重应用于所述另一经编码单元中的一个或一个以上视频块的隐式加权预测。

7.一种在视频编码器中对视频数据编码的方法，所述方法包括：

在所述视频编码器处对经编码单元编码，其中所述经编码单元包含指示在所述经编码单元中的一个或一个以上视频块的显式加权预测期间将应用的显式权重的语法元素；

经由所述视频编码器基于所述显式权重对所述经编码单元中的一个或一个以上双向视频块编码；以及

经由所述视频编码器基于一个或一个以上不同权重对所述经编码单元中的一个或一个以上单向视频块编码。

8.根据权利要求7所述的方法，其中所述显式权重包括双向显式权重，其中所述不同权重包括单向显式权重，且其中所述语法元素包含所述单向显式权重。

9.根据权利要求7所述的方法，其中所述显式权重包括双向显式权重，其中所述不同权重包括缺省权重，且其中所述语法元素包含所述缺省权重。

10.根据权利要求7所述的方法，其中所述显式权重包括双向显式权重，其中所述不同权重包括缺省权重，且其中所述语法元素不包含所述缺省权重。

11.一种视频解码设备，其包括：

熵单元，其接收经编码单元且对所述经编码单元的一个或一个以上语法元素进行熵解码，其中所述语法元素指示在所述经编码单元中的一个或一个以上视频块的显式加权预测期间将应用的显式权重；以及

预测单元，其将所述显式权重应用于所述经编码单元中的一个或一个以上双向视频块的双向显式加权预测，以及将一个或一个以上不同权重应用于所述经编码单元中的一个或一个以上单向视频块的单向显式加权预测。

12.根据权利要求11所述的视频解码设备，其中所述显式权重包括双向显式权重且所述一个或一个以上不同权重包括单向显式权重，其中所述语法元素包含所述单向显式权重。

13.根据权利要求11所述的视频解码设备，其中所述一个或一个以上不同权重包括一个或一个以上缺省权重。

14.根据权利要求13所述的视频解码设备，其中所述缺省权重是在所述视频解码设备处定义且不包含在所述经编码单元的所述语法元素中。

15.根据权利要求13所述的视频解码设备，其中所述缺省权重包含在所述经编码单元的所述语法元素中。

16.根据权利要求11所述的视频解码设备，其中：

所述熵单元接收并解码不包含显式权重的另一经编码单元；以及

所述预测单元产生一个或一个以上隐式权重并将所述一个或一个以上隐式权重应用于所述另一经编码单元中的一个或一个以上视频块的隐式加权预测。

17.根据权利要求11所述的视频解码设备，其中所述视频解码设备包括集成电路。

18.根据权利要求11所述的视频解码设备，其中所述视频解码设备包括微处理器。

19.根据权利要求11所述的视频解码设备，其中所述视频解码设备包括包含视频解码器的无线通信装置。

20.一种对视频数据编码的视频编码设备，所述设备包括：

存储器，其存储所述视频数据和用以对所述视频数据进行预测性编码的两个或两个以上数据列表；以及

预测单元，其：

对经编码单元编码，其中所述经编码单元包含指示在所述经编码单元中的一个或一个以上视频块的显式加权预测期间将应用的显式权重的语法元素；

基于所述显式权重对所述经编码单元中的一个或一个以上双向视频块编码；以及

基于一个或一个以上不同权重对所述经编码单元中的一个或一个以上单向视频块编码。

21.根据权利要求20所述的视频编码设备，其中所述显式权重包括双向显式权重，其中所述不同权重包括单向显式权重，且其中所述语法元素包含所述单向显式权重。

22.根据权利要求20所述的视频编码设备，其中所述显式权重包括双向显式权重，其中所述不同权重包括缺省权重，且其中所述语法元素包含所述缺省权重。

23.根据权利要求20所述的视频编码设备，其中所述显式权重包括双向显式权重，其中所述不同权重包括缺省权重，且其中所述语法元素不包含所述缺省权重。

24.根据权利要求20所述的视频编码设备，其中所述视频编码设备包括集成电路。

25.根据权利要求20所述的视频编码设备，其中所述视频编码设备包括微处理器。

26.根据权利要求20所述的视频编码设备，其中所述视频编码设备包括包含视频编码器的无线通信装置。

27.一种对视频数据解码的装置，所述装置包括：

用于接收经编码单元的装置，其中所述经编码单元包含指示在所述经编码单元中的一个或一个以上视频块的显式加权预测期间将应用的显式权重的语法元素；

用于将所述显式权重应用于所述经编码单元中的一个或一个以上双向视频块的双向显式加权预测的装置；以及

用于将一个或一个以上不同权重应用于所述经编码单元中的一个或一个以上单向视频块的单向显式加权预测的装置。

28.根据权利要求27所述的装置，其中所述显式权重包括双向显式权重，且所述一个或一个以上不同权重包括单向显式权重，所述装置进一步包括：

用于接收所述经编码单元中的所述单向显式权重的装置。

29.根据权利要求27所述的装置，其中所述一个或一个以上不同权重包括一个或一个以上缺省权重。

30.根据权利要求29所述的装置，其中所述缺省权重是在所述装置处定义且不包含在所述经编码单元的所述语法元素中。

31.根据权利要求29所述的装置，其中所述缺省权重包含在所述经编码单元的所述语法元素中。

32.根据权利要求27所述的装置，其进一步包括：

用于接收不包含显式权重的另一经编码单元的装置；以及

用于产生一个或一个以上隐式权重的装置；以及

用于将所述一个或一个以上隐式权重应用于所述另一经编码单元中的一个或一个以上视频块的隐式加权预测的装置。

33.一种对视频数据编码的装置，所述装置包括：

用于对经编码单元编码的装置，其中所述经编码单元包含指示在所述经编码单元中的一个或一个以上视频块的显式加权预测期间将应用的显式权重的语法元素；

用于基于所述显式权重对所述经编码单元中的一个或一个以上双向视频块编码的装置；以及

用于基于一个或一个以上不同权重对所述经编码单元中的一个或一个以上单向视频块编码的装置。

34.根据权利要求33所述的装置，其中所述显式权重包括双向显式权重，其中所述不同权重包括单向显式权重，且其中所述语法元素包含所述单向显式权重。

35.根据权利要求33所述的装置，其中所述显式权重包括双向显式权重，其中所述不同权重包括缺省权重，且其中所述语法元素包含所述缺省权重。

36.根据权利要求33所述的装置，其中所述显式权重包括双向显式权重，其中所述不同权重包括缺省权重，且其中所述语法元素不包含所述缺省权重。

37.一种计算机可读存储媒体，其包括在执行时使处理器对视频数据解码的指令，其中：

在接收包含指示在经编码单元中的一个或一个以上视频块的显式加权预测期间将应用的显式权重的语法元素的所述经编码单元后，所述指令即刻使所述处理器进行以下动作：

将所述显式权重应用于所述经编码单元中的一个或一个以上双向视频块的双向显式加权预测；以及

将一个或一个以上不同权重应用于所述经编码单元中的一个或一个以上单向视频块的单向显式加权预测。

38.根据权利要求37所述的计算机可读存储媒体，其中所述显式权重包括双向显式权重，且所述一个或一个以上不同权重包括在所述经编码单元中接收到的单向显式权重。

39.根据权利要求37所述的计算机可读存储媒体，其中所述一个或一个以上不同权重包括一个或一个以上缺省权重。

40.根据权利要求39所述的计算机可读存储媒体，其中所述缺省权重是预定义的且不包含在所述经编码单元的所述语法元素中。

41.根据权利要求39所述的计算机可读存储媒体，其中所述缺省权重包含在所述经编码单元的所述语法元素中。

42.根据权利要求37所述的计算机可读存储媒体，其进一步包括使所述处理器进行以下动作的指令：

在接收到不包含显式权重的另一经编码单元后，

即刻产生一个或一个以上隐式权重并将所述一个或一个以上隐式权重应用于所述另一经编码单元中的一个或一个以上视频块的隐式加权预测。

43.一种计算机可读存储媒体，其包括在执行时使处理器对视频数据编码的指令，其中所述指令使所述处理器进行以下动作：

对经编码单元编码，所述经编码单元包含指示在所述经编码单元中的一个或一个以上视频块的显式加权预测期间将应用的显式权重的语法元素；

44.根据权利要求43所述的计算机可读存储媒体，其中所述显式权重包括双向显式权重，其中所述不同权重包括单向显式权重，且其中所述语法元素包含所述单向显式权重。

45.根据权利要求43所述的计算机可读存储媒体，其中所述显式权重包括双向显式权重，其中所述不同权重包括缺省权重，且其中所述语法元素包含所述缺省权重。

46.根据权利要求43所述的计算机可读存储媒体，其中所述显式权重包括双向显式权重，其中所述不同权重包括缺省权重，且其中所述语法元素不包含所述缺省权重。