CN104601990A

CN104601990A - 视频编码中的非零舍入与预测模式选择技术

Info

Publication number: CN104601990A
Application number: CN201510023371.6A
Authority: CN
Inventors: 马尔塔·卡切维奇; 陈培松; 叶琰
Original assignee: Qualcomm Inc
Current assignee: Qualcomm Inc
Priority date: 2009-07-09
Filing date: 2010-07-08
Publication date: 2015-05-06
Anticipated expiration: 2030-07-08
Also published as: JP5678057B2; HK1210344A1; US9609357B2; CN102474621B; CN104601990B; EP3442226A1; JP2015053701A; JP5784689B2; EP3322184A1; JP2014090436A; JP5931995B2; TW201106704A; EP2452502A1; WO2011006004A1; JP2012533225A; US20110007802A1; US20160037181A1; CN102474621A; US9161057B2; TWI413419B

Abstract

本申请涉及视频编码中的非零舍入与预测模式选择技术。在本发明的一方面中，可特意消除对双向预测性数据的舍入调整以提供缺乏任何舍入偏置的预测性数据。在这种情况下，可在速率-失真分析中考虑经舍入的预测性数据与未经舍入的预测性数据两者以识别用于预测给定视频块的最佳数据。在本发明的另一方面中，描述用于在缺省加权预测、隐式加权预测及显式加权预测当中进行选择的技术。在这一背景下，还描述用于将偏移加至预测数据的技术，例如，使用显式加权预测的格式以允许实现原本由隐式或缺省加权预测确定的对预测性数据的偏移。

Description

视频编码中的非零舍入与预测模式选择技术

本案是一件分案申请。本案的母案是国际申请号为PCT/US2010/041423、申请日为2010年7月8日、PCT申请进入中国国家阶段后申请号为201080029582.6、发明名称为“视频编码中的非零舍入与预测模式选择技术”的发明专利申请案。

以下同在申请中且共同转让的申请案以引用的方式明确地并入本文中：MartaKarczewicz、Peisong Chen及YanYe的与本申请案同日申请且代理人档案号码082069U2的「视频编码中的非零舍入与预测模式选择技术(Non-Zero Rounding And PredictionMode Selection Techniques In Video Encoding)」。

技术领域

本发明涉及视频编码，且更具体来说，涉及使用双向预测的视频编码技术。

背景技术

数字多媒体能力可并入于广泛范围的装置中，包括数字电视、数字直播系统、无线通信装置、无线广播系统、个人数字助理(PDA)、膝上型或桌上型计算机、数字式照相机、数字记录装置、视频游戏装置、视频游戏主机、蜂窝式或卫星无线电电话、数字媒体播放器及其类似者。数字多媒体装置可实施例如MPEG-2、ITU-H.263、MPEG-4或ITU-H.264/MPEG-4第10部分(高级视频编码(AVC))的视频编码技术以更有效地发射及接收或存储及检索数字视频数据。视频编码技术可经由空间及时间预测执行视频压缩以减少或移除视频序列中固有的冗余。

在视频编码中，压缩常常包括空间预测、运动估计及运动补偿。帧内编码依赖于空间预测及变换编码(例如，离散余弦变换(DCT))，以减少或移除给定视频帧内的视频块之间的空间冗余。帧间编码依赖于时间预测及变换编码以减少或移除视频序列的连续视频帧的视频块之间的时间冗余。帧内编码的帧(「I帧」)常常用作随机存取点以及其他帧的帧间编码的参考。然而，I帧通常展现比其他帧少的压缩。术语「I单元」可指代I帧、I片或I帧的其他可独立解码部分。

对于帧间编码，视频编码器执行运动估计，以追踪两个或两个以上邻近帧或其他被编码的单元(例如，帧的片)之间的匹配视频块的移动。被帧间编码的帧可包括：预测性帧(「P帧」)，其可包括根据先前帧预测的块；以及双向预测性帧(「B帧」)，其可包括根据视频序列的先前帧及后续帧预测的块。在早期编码技术将预测限制在特定方向上的意义上，术语「P帧」及「B帧」为稍微有历史性的。较新的编码格式及标准可能不限制P帧或B帧的预测方向。因此，术语「双向」现指代基于两个或两个以上参考数据的列表(而不管这种参考数据相对于被编码的数据的时间关系)的预测。

举例来说，与例如ITU H.264的较新视频标准一致的双向预测可基于两个不同列表，所述两个不同列表未必需要具有在时间上位于当前视频块之前及之后的数据。换句话说，可根据两个数据列表预测B视频块，所述两个数据列表可对应于来自两个先前帧、两个后续帧或一先前帧及一后续帧的数据。相对照地，基于可对应于一个预测性帧(例如，一个先前帧或一个后续帧)的一个列表(即，一个数据结构)预测P视频块。B帧及P帧可更通常地称作P单元及B单元。也可在较小的编码单元(例如，帧的片或帧的部分)中实现P单元及B单元。B单元可包括B视频块、P视频块或I视频块。P单元可包括P视频块或I视频块。I单元可仅包括I视频块。

对于P视频块及B视频块来说，运动估计产生运动矢量，所述运动矢量指示视频块相对于预测性参考帧或其他编码单元中的对应预测视频块的位移。运动补偿使用运动矢量以根据预测性参考帧或其他编码单元产生预测视频块。在运动补偿之后，通过自将要被编码的原始视频块减去预测视频块而形成残余视频块。视频编码器通常应用变换、量子化及熵编码过程以进一步减小与残余块的通信相关联的位速率。I单元及P单元通常用以定义用于P单元及B单元的帧间编码的参考块。

发明内容

本发明描述可适用于双向预测的视频编码及解码技术。在双向预测中，可基于预测性参考数据的两个不同列表来预测性地编码及解码视频块。在本发明的一个方面中，可特意消除对双向预测性数据的舍入调整以提供缺乏任何舍入偏置的预测性数据。在这种情况下，可在速率-失真分析中考虑经舍入的预测性数据与未经舍入的预测性数据两者以识别用于预测一给定视频块的最佳数据。可编码一个或一个以上语法元素以指示所述选择，且解码器可解释所述一个或一个以上语法元素以便确定是否应使用舍入。

在本发明的另一方面中，描述用于在缺省加权预测、隐式加权预测及显式加权预测当中进行选择的技术。在这一背景下，也描述用于将偏移加至预测数据的技术，例如，使用显式加权预测的格式以允许实现原本由隐式或缺省加权预测定义的对预测性数据的偏移。

在一个实例中，本发明描述一种编码视频数据的方法。所述方法包含：产生取决于两个或两个以上数据列表且包括舍入调整的第一加权预测数据，产生取决于所述两个或两个以上数据列表且不包括所述舍入调整的第二加权预测数据，基于预测数据的多个候选者的速率-失真分析来选择用于编码所述视频数据的预测数据，其中预测数据的所述多个候选者包括所述第一加权预测数据及所述第二加权预测数据，及使用所述选定预测数据编码所述视频数据。

在另一实例中，本发明描述一种包含以下各项的方法：接收编码的视频数据，接收指示舍入调整是否被用以编码所述编码的视频数据的一个或一个以上语法元素，产生取决于两个或两个以上数据列表的加权预测数据，其中在所述一个或一个以上语法元素指示所述舍入调整未用以编码所述编码的视频数据的情况下所述加权预测数据不包括所述舍入调整，及使用所述加权预测数据解码所述视频数据。

在另一实例中，本发明描述一种编码视频数据的视频编码器设备。所述设备包含：存储器，所述存储器存储所述视频数据及用以预测性地编码所述视频数据的两个或两个以上数据列表；以及运动补偿单元。所述运动补偿单元产生取决于所述两个或两个以上数据列表且包括舍入调整的第一加权预测数据，产生取决于所述两个或两个以上数据列表且不包括所述舍入调整的第二加权预测数据，且基于预测数据的多个候选者的速率-失真分析来选择用于编码所述视频数据的预测数据，其中预测数据的所述多个候选者包括所述第一加权预测数据及所述第二加权预测数据。所述视频编码器设备使用所述选定预测数据编码所述视频数据。

在另一实例中，本发明描述一种视频解码器设备，其包含：熵单元，所述熵单元接收编码的视频数据，且将指示舍入调整是否被用以编码所述编码的视频数据的一个或一个以上语法元素解码；及预测单元，其产生取决于两个或两个以上数据列表的加权预测数据，其中在所述一个或一个以上语法元素指示所述舍入调整未用以编码所述编码的视频数据的情况下所述加权预测数据不包括所述舍入调整，其中所述视频解码器使用所述加权预测数据解码所述视频数据。

在另一实例中，本发明描述一种编码视频数据的装置，所述装置包含：用于产生取决于两个或两个以上数据列表且包括舍入调整的第一加权预测数据的装置，用于产生取决于所述两个或两个以上数据列表且不包括所述舍入调整的第二加权预测数据的装置，用于基于预测数据的多个候选者的速率-失真分析来选择用于编码所述视频数据的预测数据的装置，其中预测数据的所述多个候选者包括所述第一加权预测数据及所述第二加权预测数据，及用于使用所述选定预测数据编码所述视频数据的装置。

在另一实例中，本发明描述一种装置，其包含：用于接收编码的视频数据的装置，用于接收指示舍入调整是否被用以编码所述编码的视频数据的一个或一个以上语法元素的装置，用于产生取决于两个或两个以上数据列表的加权预测数据的装置，其中在所述一个或一个以上语法元素指示所述舍入调整未用以编码所述编码的视频数据时所述加权预测数据不包括所述舍入调整，及用于使用所述加权预测数据解码所述视频数据的装置。

可以硬件、软件、固件或其任何组合来实施本发明中所描述的技术。如果以软件实施，则软件可在一个或一个以上处理器中执行，例如，微处理器、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或数字信号处理器(DSP)。执行所述技术的软件可最初存储于计算机可读媒体中且加载于处理器中并在处理器中执行。

因此，本发明也预期一种包含指令的计算机可读存储媒体，所述指令在执行时使处理器：产生取决于两个或两个以上数据列表且包括舍入调整的第一加权预测数据，产生取决于所述两个或两个以上数据列表且不包括所述舍入调整的第二加权预测数据，基于预测数据的多个候选者的速率-失真分析来选择用于编码所述视频数据的预测数据，其中预测数据的所述多个候选者包括所述第一加权预测数据及所述第二加权预测数据，且使用所述选定预测数据编码所述视频数据。

在另一实例中，本发明描述一种包含指令的计算机可读存储媒体，所述指令在执行时使处理器在接收到被编码的视频数据，且接收到指示舍入调整是否被用以编码所述编码的视频数据的一个或一个以上语法元素时：产生取决于两个或两个以上数据列表的加权预测数据，其中在所述一个或一个以上语法元素指示所述舍入调整未用以编码所述编码的视频数据的情况下所述加权预测数据不包括所述舍入调整；以及使用所述加权预测数据解码所述视频数据。

在随附图式及下文的描述中阐述本发明的一个或一个以上方面的细节。本发明中所描述的技术的其他特点、目标及优点将根据描述及诸图以及根据权利要求书显而易见。

附图说明

图1为说明可实施本发明的技术的一个例示性视频编码及解码系统的框图。

图2为说明可执行与本发明一致的偏移技术的视频编码器的实例的框图。

图3为更详细说明运动补偿单元的实例的框图。

图4为可执行与本发明一致的偏移技术的视频解码器的实例。

图5为说明由与本发明一致的视频编码器执行的例示性过程的流程图。

图6为说明由与本发明一致的视频解码器执行的例示性过程的流程图。

图7为说明由与本发明一致的视频编码器执行的另一例示性过程的流程图。

具体实施方式

本发明描述可适用于双向预测的视频编码及解码技术。在双向预测中，基于预测性参考数据的两个不同列表而预测性地编码及解码视频块。在本发明的一方面中，可特意消除对双向预测性数据的舍入调整以提供缺乏任何舍入偏置的预测性数据。在这种情况下，可在速率-失真分析中考虑经舍入的预测性数据及未经舍入的预测性数据两者以识别用于预测给定视频块的最佳数据。可编码一个或一个以上语法元素以指示所述选择，且解码器可解释所述一个或一个以上语法元素以便确定是否应将舍入用于解码过程中。

在本发明的另一方面中，描述用于在缺省加权预测、隐式加权预测及显式加权预测当中进行选择的编码技术。在这一背景下，也描述用于将偏移加至预测数据的技术，例如，使用显式加权预测的格式以允许实现原本由隐式或缺省加权预测确定的对预测性数据的偏移。

加权预测指代可将权重分派给两个或两个以上不同的预测性数据集合的双向预测。缺省加权预测指代通过某缺省设置预定义与两个或两个以上不同列表相关联的权重因数的加权预测。在一些情况下，缺省加权预测可向所述列表中的每一者分派相等权重。隐式加权预测指代基于与数据相关联的一些隐式因素而定义与两个或两个以上不同列表相关联的权重因数的加权预测。举例来说，可通过两个不同列表中的数据相对于正被预测性编码的数据的时间位置来定义隐式权重因数。如果与列表1中的数据相比，列表0中的数据在时间上更接近于正被预测性编码的数据，则在隐式加权预测中可向列表0中的数据分派较大隐式权重因数。

显式加权预测指代权重因数作为编码过程的部分被动态地定义且编码至位流中的加权预测。在这一方面，显式加权预测不同于缺省加权预测及隐式加权预测，例如，显式加权预测导致被编码为位流的部分的权重因数，而缺省及隐式加权预测定义被预定义或由解码器确定的权重因数(在位流中不存在权重因数)。

根据本发明的一个方面，相对于常规加权预测，可通过消除对加权预测数据的舍入调整来修改加权预测。在这种情况下，编码器可分析且考虑经舍入的加权预测数据及未经舍入的加权预测数据两者，且可基于速率-失真分析使用经舍入或未经舍入的加权预测数据。可定义一个或一个以上语法元素且将一个或一个以上语法元素编码至位流中以便识别是使用了经舍入的加权预测数据还是使用了未经舍入的加权预测数据。解码器可解释所述一个或一个以上语法元素以便确定在解码中应使用经舍入的加权预测数据还是应使用未经舍入的加权预测数据。

根据本发明的另一方面，描述用于在缺省加权预测、隐式加权预测及显式加权预测当中进行选择的编码技术。编码器可被编程以在缺省加权预测与隐式加权预测之间进行选择，而非相对于彼此地考虑这些可能性中的每一者。接着，可将所述选择与显式加权预测比较。可执行显式加权预测以计算显式权重因数，但也可将计算的显式加权预测与具有对应于由缺省加权预测或隐式加权预测定义的权重因数的权重因数的显式加权预测比较。

相对于缺省加权预测及隐式加权预测，显式加权预测可在以下方面具有优点：显式加权预测允许将偏移加至预测性数据。所述偏移可偏置或调整预测性数据，且可在解决闪光、变暗的天空、场景改变或视频帧之间的其他类型的照明改变方面为极有用的。举例来说，偏移可提供对视频块的所有值的共同调整，(例如)将所述值向上或向下偏置。根据本发明，可在显式加权预测的背景下考虑由缺省加权预测或隐式加权预测定义的权重因数，从而在维持与缺省或隐式加权预测相关联的权重因数的同时促进偏移的增加。按这种方式，可改善预测性数据，这在一些情况下可有助于改善数据压缩。

图1为说明可实施本发明的技术的一种例示性视频编码及解码系统10的框图。如图1中所展示，系统10包括源装置12，其经由通信信道15将被编码的视频发射至目的装置16。源装置12及目的装置16可包含广泛范围的装置中的任一者。在一些情况下，源装置12及目的装置16包含无线通信装置，例如无线手机、所谓的蜂窝式或卫星无线电电话，或可经由通信信道15传达视频信息的任何装置，通信信道15可能为无线的或可能并非无线的。然而，本发明的技术(所述技术关于非零舍入及预测模式选择技术)未必限于无线应用或设置。

在图1的实例中，源装置12可包括视频源20、视频编码器22、调制器/解调器(调制解调器)23及发射器24。目的装置16可包括接收器26、调制解调器27、视频解码器28，及显示装置30。根据本发明，源装置12的视频编码器22可被配置以应用非零舍入及预测模式选择技术作为视频编码过程的部分。视频解码器28可接收指示所述选择且指示是否使用了非零舍入的一个或一个以上语法元素。因此，视频解码器28可执行在所接收的位流中用信号传输的适当加权预测。

图1的所说明系统10仅为例示性的。可通过支持双向运动补偿预测的任何编码装置来执行本发明的非零舍入及预测模式选择技术。源装置12及目的装置16仅为所述编码装置的实例，其中源装置12产生用于发射至目的装置16的被编码的视频数据。在一些情况下，装置12、16可以实质上对称的方式操作，以使得装置12、16中的每一者包括视频编码及解码组件。因此，系统10可支持视频装置12、16之间的单向或双向视频发射，(例如)用于视频流、视频重放、视频广播或视频电话。

源装置12的视频源20可包括视频俘获装置，例如摄像机、含有先前所俘获的视频的视频档案，或来自视频内容提供商的视频馈送。作为另一替代例，视频源20可产生基于计算机图形的数据作为源视频，或现场视频、归档视频及计算机产生的视频的组合。在一些情况下，如果视频源20为摄像机，则源装置12与目的装置16可形成所谓的相机电话或视频电话。在每一情况下，可通过视频编码器22来编码经俘获、经预先俘获或计算机产生的视频。接着可通过调制解调器23根据通信标准(例如，分码多址访问(CDMA)或另一通信标准)调制被编码的视频信息，且经由发射器24将其发射至目的装置16。调制解调器23可包括各种混频器、滤波器、放大器或设计用于信号调制的其他组件。发射器24可包括设计用于发射数据的电路，包括放大器、滤波器及一个或一个以上天线。

目的装置16的接收器26经由信道15接收信息，且调制解调器27解调制所述信息。再一次，视频编码过程可实施本文中所描述的技术中的一个或一个以上者以提供与本发明一致的非零舍入及预测模式选择。经由信道15传达的信息可包括由视频编码器22定义的信息(其可由与本发明一致的视频解码器28使用)。显示装置30向用户显示解码的视频数据，且可包含多种显示装置中的任一者，例如，阴极射线管、液晶显示器(LCD)、等离子体显示器、有机发光二极管(OLED)显示器或另一类型的显示装置。

在图1的实例中，通信信道15可包含任何无线或有线通信媒体，例如，射频(RF)频谱或一个或一个以上物理传输线，或无线媒体与有线媒体的任何组合。因此，调制解调器23及发射器24可支持许多可能的无线协议、有线协议，或有线协议与无线协议。通信信道15可形成例如局域网(LAN)、广域网(WAN)或全球网络(例如，互联网，包含一个或一个以上网络的互连)的基于包的网络的部分。通信信道15通常表示用于将视频数据自源装置12发射至目的装置16的任何合适通信媒体或不同通信媒体的集合。通信信道15可包括路由器、交换机、基站，或可用以促进自源装置12至目的装置16的通信的任何其他装备。

视频编码器22及视频解码器28可根据视频压缩标准(例如，ITU-T H.264标准，或者被描述为MPEG-4，第10部分，高级视频编码(AVC))进行操作。然而，本发明的技术不限于任何特定编码标准。虽然在图1中未展示，但在一些方面中，视频编码器22及视频解码器28可各自与音频编码器及解码器集成，且可包括适当MUX-DEMUX(多路复用-多路分解)单元或其他硬件及软件，以处置一共同数据流或单独的若干数据流中的音频与视频的编码。如果适用，则MUX-DEMUX单元可遵守ITU H.223多路复用器协议或例如用户数据报协议(UDP)的其他协议。

ITU-T H.264/MPEG-4(AVC)标准是作为被称为联合视频小组(JVT)的集体合作的产物由ITU-T视频编码专家组(VCEG)连同ISO/IEC动画专家组(MPEG)制定的。在一些方面中，可将本发明中所描述的技术应用于通常遵守H.264标准的装置。H.264标准描述于由ITU-T研究组于2005年3月发布的ITU-T推荐H.264「Advanced VideoCoding for generic audiovisual services(用于一般视听服务的高级视频编码)」中，所述ITU-T推荐H.264在本文中可被称作H.264标准或H.264规范或H.264/AVC标准或规范。联合视频小组(JVT)继续致力于对H.264/MPEG-4 AVC的扩展。

在ITU-T的各种论坛(例如，关键技术领域(KTA)论坛)中正进行推进H.264/MPEG-4AVC标准的工作。KTA论坛在某种程度上寻求展现比H.264/AVC标准所展现的编码效率高的编码效率的编码技术。本发明中所描述的技术可提供相对于H.264/AVC标准的编码改善。近期，KTA论坛接收到详述可被视为与本文中所描述的技术有关或相关的技术的文件，其由Yan Ye、Peisong Chen及Marta Karczewicz提交，编号为VCEG-AI33、题为「High Precision Interpolation and Prediction(高精度内插和预测)」且在2008年7月16日至18日在德国柏林召开的第35次会议上提出，所述文件的全部内容特此以引用的方式并入本文。

视频编码器22及视频解码器28各自可实施为一个或一个以上微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、软件、硬件、固件，或其任何组合。视频编码器22及视频解码器28中的每一者可包括于一个或一个以上编码器或解码器中，其中任一者可集成为相应移动装置、用户装置、广播装置、服务器或其类似者中的组合的编解码器(CODEC)的部分。

视频序列通常包括一系列视频帧。视频编码器22及视频解码器28可对个别视频帧内的视频块进行操作以便编码及解码视频数据。视频块可具有固定或变化的大小，且可根据规定的编码标准而在大小上不同。每一视频帧可包括一系列片或其他可独立解码单元。每一片可包括一系列宏块，所述宏块可布置成子块。作为一实例，ITU-T H.264标准支持：以各种块大小的框内预测，例如，针对亮度分量的16乘16、8乘8或4乘4，及针对色度分量的8×8；以及以各种块大小的帧间预测，例如，针对亮度分量的16乘16、16乘8、8乘16、8乘8、8乘4、4乘8及4乘4，及针对色度分量的对应缩放的大小。视频块可包含像素数据的块，或(例如)在变换过程(例如，离散余弦变换或概念上类似的变换过程)之后的变换系数的块。

较小视频块可提供较好的分辨率，且可用于视频帧的包括高细节等级的位置。通常，宏块及各种子块可被视为视频块。另外，片可被视为一系列视频块，例如，宏块和/或子块。每一片可为视频帧的可独立解码的单元。或者，帧自身可为可解码单元，或帧的其他部分可被定义为可解码单元。术语「编码单元」指代视频帧的任何可独立解码的单元，例如，整个帧、帧的片、图片群(GOP)，或根据所使用的编码技术而定义的另一可独立解码单元。

在基于帧间的预测性编码(其包括内插及用以有效地选择用来预测编码单元的预测算法或模式的本发明的技术)之后及在任何变换(例如，用于H.264/AVC中的4×4或8×8整数变换或离散余弦变换或DCT)之后，可执行量子化。量子化通常指代将系数量子化以可能地减少用以表示所述系数的数据量的过程。量子化过程可减小与所述系数中的一些或全部相关联的位深度。举例来说，在量子化期间16位值可下舍入至15位值。在量子化之后，可(例如)根据内容自适应可变长度编码(CAVLC)、上下文自适应二进制算术编码(CABAC)或另一熵编码方法来执行熵编码。

本发明的技术特别适用于加权双向预测。如上文所提及，双向预测为基于两个不同数据列表的对所谓的「B视频块」的预测。可根据来自两个先前帧的两个数据列表、来自后续帧的两个数据列表或来自先前帧的一个数据列表及来自后续帧的一个数据列表来预测B视频块。相对照地，基于可对应于一个预测性帧(例如，一个先前帧或一个后续帧)的一个列表来预测P视频块。B帧及P帧可更通常被称作P单元及B单元。也可以较小编码单元(例如，帧的片或帧的部分)实现P单元及B单元。B单元可包括B视频块、P视频块或I视频块。P单元可包括P视频块或I视频块。I单元可仅包括I视频块。

加权双向预测指代允许将权重因数分派给两个不同列表的双向预测。每一列表可包含与预测性帧或其他编码的单元相关联的数据集合。在加权双向预测中，在产生预测性数据的过程中可对一个列表施以较大权重。举例来说，如果所述列表中的一者具有更类似于正被编码的视频块的数据，则那个列表可比另一列表获得更大权重。

对于根据ITU-T H.264的不同类型的加权双向预测来说，视频编码器22及视频解码器28可通常支持三种不同类型的预测模式。被称作「缺省加权预测」的第一预测模式指代通过某缺省设置来预定义与两个或两个以上不同列表相关联的权重因数的加权预测。在一些情况下，缺省加权预测可向所述列表中的每一者分派相等权重。

被称作「隐式加权预测」的第二预测模式指代基于与数据相关联的一些隐式因素来定义与两个或两个以上不同列表相关联的权重因数的加权预测。举例来说，可通过两个不同列表中的数据相对于正被预测性编码的数据的相对时间位置来定义隐式权重因数。在缺省加权预测及隐式加权预测两者中，权重因数不包括于位流中。相反，视频解码器28可被编程以知晓权重因数(对于缺省)或可被编程以知晓如何导出权重因数(对于隐式)。

被称作「显式加权预测」的第三预测模式指代作为编码过程的部分动态地定义权重因数且将权重因数编码至位流中的加权预测。显式加权预测在此方面(例如，显式加权预测产生被编码为位流的部分的权重因数)不同于缺省加权预测及隐式加权预测。

根据本发明的一方面，可通过消除对加权预测数据的舍入调整来相对于常规加权预测修改加权预测。在这种情况下，编码器22可分析且考虑经舍入的加权预测数据及未经舍入的加权预测数据两者，且可基于速率-失真分析使用经舍入或未经舍入的加权预测数据。可定义一个或一个以上语法元素且将其编码至位流中以便识别是使用了经舍入的加权预测数据还是未经舍入的加权预测数据。解码器28可解码且解释所述语法元素，且基于所述语法元素，解码器28可在解码过程中使用经舍入或未经舍入的加权预测数据。舍入调整的移除适用于缺省加权预测、隐式加权预测及显式加权预测。

根据本发明的另一方面，视频编码器22可在缺省加权预测、隐式加权预测及显式加权预测当中进行选择。在此方面中，编码器22可被编程以在缺省加权预测与隐式加权预测之间进行选择，而非相对于彼此地考虑这些可能性中的每一者。接着，可将所述选择与显式加权预测比较。具体来说，编码器22可执行显式加权预测以计算显式权重因数，但编码器22也可将计算的显式加权预测与具有对应于由缺省加权预测或隐式加权预测定义的权重因数的权重因数的显式加权预测比较。

相对于缺省加权预测及隐式加权预测，显式加权预测可在以下方面具有优点：显式加权预测允许编码偏移。所述偏移可调整预测性数据且可在解决闪光、变暗的天空、场景改变或视频帧之间的其他类型的照明改变方面为极有用的。根据本发明，可由视频编码器22在显式加权预测的背景下考虑由缺省加权预测或隐式加权预测定义的权重因数，从而在维持与缺省或隐式加权预测相关联的权重因数的同时促进偏移的增加。按这种方式，在一些情况下，可改善预测性数据，此可有助于改善数据压缩。

在视频编码的背景下，视频编码器22可通过首先将被编码的亮度视频块的亮度像素值平均化来计算DC偏移。视频编码器22可接着将用以编码所述视频块的预测性视频块的亮度像素值平均化。这些计算的值中的每一者可包含DC值。视频编码器22可通过自彼此减去DC值(例如，通过自用以编码正被编码的当前块的预测性块的平均亮度值减去当前块的平均亮度值)来计算DC偏移。也可(在需要时)针对色度分量定义DC偏移。也可在给定编码单元(例如，帧或片)上累积DC偏移，且编码单元的DC偏移被定义为给定编码单元的所有块的偏移的平均值。

图2为说明可执行与本发明一致的技术的视频编码器50的一实例的框图。视频编码器50可对应于源装置12的视频编码器22，或不同装置的视频编码器。视频编码器50可执行视频帧内的块的帧内编码及帧间编码，但为了便于说明在图2中未展示帧内编码组件。帧内编码依赖于空间预测以减少或移除给定视频帧内的视频的空间冗余。帧间编码依赖于时间预测以减少或移除视频序列的邻近帧内的视频的时间冗余。帧内模式(I模式)可指代基于空间的压缩模式，且例如预测(P模式)或双向(B模式)的帧间模式可指代基于时间的压缩模式。

如图2中所展示，视频编码器50接收将要被编码的视频帧或片内的当前视频块。在图2的实例中，视频编码器50包括运动估计单元32、运动补偿单元35、存储器34、加法器48、变换单元38、量子化单元40及熵编码单元46。对于视频块重建来说，视频编码器50也包括反量子化单元42、逆变换单元44及加法器51。视频编码器50也可包括用以对块边界进行滤波以自经重建的视频移除方块效应伪影的解块滤波器(未图示)。如果需要，则解块滤波器通常将对加法器51的输出进行滤波。

在编码过程期间，视频编码器50接收将要被编码的视频块，且运动估计单元32及运动补偿单元35执行帧间预测性编码。运动估计单元32及运动补偿单元35可高度集成，但出于概念上的目的而将其单独说明。运动估计通常被视为产生运动矢量的过程，所述运动矢量估计视频块的运动。举例来说，运动矢量可指示预测性帧(或其他编码单元)内的预测性块相对于当前帧(或其他编码单元)内的正被编码的当前块的位移。运动补偿通常被视为基于由运动估计确定的运动矢量而提取或产生预测性块的过程。再一次，运动估计单元32及运动补偿单元35可在功能上集成。出于示范的目的，本发明中所描述的技术被描述为由运动补偿单元35执行。

运动估计单元32通过比较将要被编码的视频块与一个或一个以上预测性编码单元(例如，依据时间或在时间上的先前和/或将来帧)的视频块来选择用于所述被编码的视频块的适当运动矢量。作为一实例，运动估计单元32可以许多方式来选择用于B帧的运动矢量。在一方式中，运动估计单元32可自第一帧集合(称作列表0)选择先前或将来帧，且仅使用来自列表0的这一先前或将来帧确定运动矢量。或者，运动估计单元32可自第二帧集合(称作列表1)选择先前或将来帧，且仅使用来自列表1的这一先前或将来帧确定一运动矢量。在又另一方式中，运动估计单元32可自列表0选择第一帧且自列表1选择第二帧，且根据列表0的第一帧及列表1的第二帧选择一个或一个以上运动矢量。此第三形式的预测可被称作双向预测性运动估计。可实施本发明的技术，以便有效地选择运动补偿双向预测模式。针对任何给定列表的选定运动矢量可指向最类似于正被编码的视频块的预测性视频块，例如，如由例如预测性块的像素值相对于正被编码的块的像素值的绝对差总和(SAD)或平方差总和(SSD)的度量所定义。

根据ITU-T H.264/AVC标准，可使用三种运动补偿双向预测性算法或模式来预测B帧或其部分，例如，B帧的视频块、宏块或任何其他离散和/或相连部分。通常被称作缺省加权预测的第一运动补偿双向预测性算法或模式可涉及将缺省权重应用于列表0的第一帧及列表1的第二帧的每一经识别的视频块。可根据标准将缺省权重编程，且常常将缺省加权预测的缺省权重选择为相等的。接着将第一帧的加权块与第二帧的加权块加在一起且除以用以预测B帧的帧的总数目(例如，在此实例中为二)。常常，通过将1加至第一帧的加权块与第二帧的加权块的相加量(addition)且接着将结果右移一位来实现此除法。1的相加为舍入调整。

根据本发明的一方面，可避免在右移一之前加1(舍入调整)，因此消除向上偏置的舍入。运动补偿单元35可产生具有舍入的加权块与不具有舍入的加权块两者，且可选择达成最佳编码效率的块。

更通常地，可由以下方程给出加权预测：

pred(i，j)＝(pred0(i，j)*w0+pred1(i，j)*w1+2^r)＞＞(r+1)

其中pred(i，j)为与加权预测块相关联的数据，pred0(i，j)为来自列表0的数据，pred1(i，j)为来自列表1的数据，w0及w1为权重因数，2^r为舍入项，且＞＞为移位(r+1)个位的右移位运算。与本发明一致，可产生两个不同版本的pred(i，j)且可由运动补偿单元35考虑所述两个不同版本的pred(i，j)。第一版本与以上的方程一致，且第二版本与不具有舍入的以上方程(即，自所述方程移除项「2^r」)一致。在一些情况下，消除此舍入可达成较好的加权预测性数据，此可改善编码效率。运动补偿单元35可产生用以定义针对给定视频块或视频块集合是否使用了舍入的一个或一个以上语法元素。可将双向预测模式及指示是否使用了舍入的一个或一个以上语法元素两者自运动补偿单元35输出至熵编码单元46以包括于被编码的位流中。

B图片使用先前被编码的参考图片的两个列表，列表0及列表1。这两个列表可各自含有在时间次序上的过去和/或将来被编码的图片。可以以下若干方式中的一者预测B图片中的块：根据列表0参考图片的运动补偿预测、根据列表1参考图片的运动补偿预测，或根据列表0参考图片与列表1参考图片两者的组合的运动补偿预测。为了得到列表0参考图片与列表1参考图片两者的组合，分别自列表0与列表1参考图片获得两个运动补偿参考区域。其组合将用以预测当前块。

在本发明中，术语「B图片」将用以通常指代任何类型的B单元，其可为B帧、B片，或可能地包括至少一些B视频块的其他视频单元。如所提及，B图片可允许3种类型的加权预测。为简单起见，下文仅展示单向预测中之前向预测，但也可使用后向预测。

可由以下分别关于单向预测及双向预测的方程定义缺省加权预测。

单向预测：pred(i，j)＝pred0(i，j)

双向预测：pred(i，j)＝(pred0(i，j)+pred1(i，j)+1)＞＞1

其中pred0(i，j)及pred1(i，j)为来自列表0及列表1的预测数据。

可由以下分别关于单向预测及双向预测的方程定义隐式加权预测。

单向预测：pred(i，j)＝pred0(i，j)

双向预测：pred(i，j)＝(pred0(i，j)*w0+pred1(i，j)*w1+32)＞＞6

在这种情况下，根据权重因数w0或w1缩放每一预测，其中基于列表0参考图片与列表1参考图片的相对时间位置计算w0及w1。

可由以下分别关于单向预测及双向预测的方程定义显式加权预测。

单向预测：pred(i，j)＝(pred0(i，j)*w0+2r-¹)＞＞r+o1

双向预测：pred(i，j)＝(pred0(i，j)*w0+pred1(i，j)*w1+2^r)＞＞(r+1)+((o1+o2+1)＞＞1)

在这种情况下，由编码器确定权重因数，且在片标头中发射权重因数，且o1及o2分别为列表0参考图片的图片偏移及列表1参考图片的图片偏移。

常规地，总是在双向预测中使用舍入调整。根据以上的方程，在缺省加权预测中在右移一之前使用1的舍入调整，且在隐式加权预测中在右移六之前使用32的舍入调整。大体来说，通常在右移r之前使用2^r-1的舍入调整，其中r表示正整数。

这种频繁且偏置的舍入运算可减少预测的精度。此外，在显式加权预测的双向预测中，实际上存在2次舍入，一次针对参考图片且另一次针对偏移。因此，在这种情况下，舍入误差可累积。根据本发明的一方面，视频编码器可在右移位之前将偏移加至加权预测(而非进行2次单独舍入)，如下：

pred(i，j)＝(pred0(i，j)*w0+pred1(i，j)*w1+((o1+o2)＜＜r)+2^r)＞＞(r+1)，

其中pred(i，j)为与舍入相关联的加权预测数据，pred0(i，j)为来自列表0的数据，pred1(i，j)为来自列表1的数据，w0及w1为权重因数，o1及o2为偏移，且r及2^r为与移位(r+1)个位的右移位运算「＞＞」相结合提供舍入的舍入项。这可提供较好的预测准确度。在这种情况下，也可定义新语法元素以允许两个不同偏移(o1及o2)组合至一个偏移中。此外，在这种情况下，舍入值可包含上文所描述的舍入调整(例如，在移位(r+1)个位的右移位运算之前的2^r)以及与偏移相关联的另一舍入值(「r」)。也可稍微修改以上方程以提供偏移的较高精度。如果需要偏移的较高精度，则可将偏移乘以因数(例如，乘以2)且接着将其舍入为整数。也可改变左移位以考虑到这一增加的偏移精度。

显式加权预测的另一问题为单向预测及双向预测可能共享相同权重及偏移。为了具有用于较好预测的更多灵活性，可根据本发明将单向预测及双向预测去耦。在这种情况下，单向预测及双向预测可定义用于给定类型的预测(缺省、隐式或显式)的不同权重及偏移。可定义用于显式预测的新语法元素以允许较好的预测。编码器可将语法元素包括于被编码的位流中以用信号传输由所述编码器使用的不同舍入模式，以使得解码器可使用相同舍入模式。

自适应地选择舍入调整为有益的。这样做的一种方式为基于两个或两个以上不同的预测性数据集合而产生两个或两个以上不同的预测性数据集合(且可能地将视频块编码若干次)。一个预测性数据集合可具有非零舍入且另一者可消除舍入。在又其他实例中，可考虑上舍入、下舍入及无舍入。运动补偿单元35可产生这些不同类型的预测性数据，且可进行速率-失真(RD)分析以选择针对给定视频块的最佳预测性数据。

速率-失真(RD)分析在视频编码中相当常见，且通常涉及指示编码成本的成本度量的计算。成本度量可使编码所需的位的数目(速率)和与编码相关联的质量等级(失真)平衡。典型速率-失真成本计算可通常对应于以下格式：

J(λ)＝λR+D，

其中J(λ)为成本，R为位速率，D为失真，且λ为拉格朗日乘数。

视频编码器50识别最需要的预测数据的一种方式为使用运动估计单元32来首先找出运动矢量，且接着实施运动补偿单元35及加法器48以计算在具有舍入调整及不具有舍入调整的情况下的预测误差。运动补偿单元35可接着选择产生最小预测误差的预测数据。可通过使用预测数据与正被编码的当前数据之间的绝对差总和来计算预测误差。

在显式加权预测中，视频编码器50的运动补偿单元35可实施三种不同模式。在所有三种显式加权预测模式中，每一参考图片可具有用于单向预测的一个偏移，且每一对参考图片具有用于双向预测的一个偏移，例如：

pred(i，j)＝(pred0(i，j)*w0+pred1(i，j)*w1+(o＜＜r)+2^r)＞＞(r+1)，

其中pred(i，j)为第一加权预测数据，pred0(i，j)为来自列表0的数据，pred1(i，j)为来自列表1的数据，w0及w1为权重因数，o为可适用于来自列表0的pred0(i，j)及来自列表1的pred1(i，j)的共同偏移，且r及2^r为与移位(r+1)个位的右移位运算「＞＞」相结合提供舍入的舍入项。第一模式可使用由缺省加权预测定义的权重。第二模式可使用由隐式加权预测定义的权重。第三模式允许每一参考图片具有用于单向预测的一个权重，且允许在双向预测中所涉及的每一对参考图片具有用于两个参考图片的一对权重。可自适应地确定针对第三模式所定义的权重，且在一些情况下，显式加权预测构架可与由缺省或隐式加权预测定义的权重一起使用以便允许实现在这些背景下的偏移。此外，在此第三模式中所定义的权重及偏移针对单向预测及双向预测可能为不同的。也可稍微修改以上方程以提供偏移的较高精度。如果需要偏移的较高精度，则可将偏移乘以因数(例如，乘以2)且接着将其舍入为整数。也可改变左移位以考虑到这一增加的偏移精度(例如，在这种情况下，左移位可改变至r-1)。

为了使视频编码器50将用于给定视频块或视频块集合的特定模式用信号传输至解码器，视频编码器50可实施2个一位语法元素：derived_weight_flag及poc_weight_flag。在这种情况下，derived_weight_flag可用以在上文所提及之前两个显式加权预测模式与第三模式之间进行选择，且poc_weight_flag可用以在第一显式加权预测模式与第二显式加权预测模式之间进行选择。

为了找出最佳加权预测，视频编码器50可执行多遍次(multi-pass)编码且基于速率-失真成本选择最佳模式。这样做的一种方式为穷举式搜寻，其中运动补偿单元35产生每个可能的加权预测数据且选择最佳的加权预测数据。然而，为了减小复杂性，运动补偿单元35可实施本发明的额外技术(例如)以首先在缺省加权预测与隐式加权预测之间进行选择，且接着将所述选择与显式加权预测比较。运动补偿单元35可计算与显式加权预测相关联的权重及偏移，且也可使用显式加权预测构架以将偏移加至另外与缺省加权预测或隐式加权预测(无论哪一者被选择)相关联的数据。因此，可能存在由运动补偿单元35计算的两个偏移集合。可通过使用用于缺省加权预测或隐式加权预测中的已知权重来计算第一偏移集合，且可(例如)通过使运动补偿预测误差减到最小连同权重(作为显式加权预测的正常计算的部分)来计算第二偏移集合。

为了进一步减小复杂性，在显式加权预测期间，如果偏移为0，则运动补偿单元35可跳过使用缺省权重或隐式权重的显式加权预测。再一次，如果偏移为0且计算的权重没有改变，则运动补偿单元35可跳过使用计算的权重及偏移的典型显式加权预测。

一旦希望的预测数据由运动补偿单元35识别(如本文中所描述)，则视频编码器50通过自正被编码的原始视频块减去所述预测数据而形成残余视频块。加法器48表示执行此减法运算的一个或一个以上组件。变换单元38将变换(例如，离散余弦变换(DCT)或概念上类似的变换)应用于残余块，从而产生包含残余变换块系数的视频块。举例来说，变换单元38可执行概念上类似于DCT的其他变换(例如，由H.264标准定义的彼等变换)。也可使用小波变换、整数变换、次频带变换或其他类型的变换。在任何情况下，变换单元38将变换应用于残余块，从而产生残余变换系数的块。所述变换可将残余信息自像素域转换至频域。

量子化单元40量子化残余变换系数以进一步减小位速率。量子化过程可减小与所述系数中的一些或全部相关联的位深度。举例来说，在量子化期间9位值可下舍入至8位值。另外，对于使用偏移的情况，量子化单元40也可量子化不同偏移。

在量子化之后，熵编码单元46对经量子化的变换系数进行熵编码。举例来说，熵编码单元46可执行内容自适应可变长度编码(CAVLC)、上下文自适应二进制算术编码(CABAC)或另一熵编码方法。在由熵编码单元46进行的熵编码之后，可将被编码的视频发射至另一装置或封存以供稍后发射或检索。被编码的位流可包括经熵编码的残余块、用于这些块的运动矢量，及其他语法(例如，本文中所描述的语法)。

反量子化单元42及逆变换单元44分别应用反量子化及逆变换以在像素域中重建残余块，(例如)以供稍后按上文所描述的方式用作参考块。加法器51将经重建的残余块加至由运动补偿单元35产生的运动补偿预测块，以产生重建的视频块以供存储于存储器34中。重建的视频块可由运动估计单元32及运动补偿单元35用作参考块，以帧间编码后续视频帧中的块。

图3为更详细说明图2的运动补偿单元35的实例的框图。如图3的实例中所展示，运动补偿单元35耦合至存储器34，存储器34将第一编码单元或参考帧的集合及第二编码单元或参考帧的集合存储为列表0 52A及列表1 52B。另外，存储器34可存储被编码的当前视频数据53。存储器34可包含共享存储器结构，或可能包含若干不同存储器、存储单元、缓冲器，或促进本文中所论述的任何数据的存储的其他类型的存储器。列表0 52A及列表1 52B为根据双向预测的与两个不同预测性单元相关联的数据，例如，来自两个不同帧或片或宏块的数据。再一次，双向预测未必限于任何预测方向，且因此，列表0 52A及列表1 52B可存储来自两个先前帧或片、两个后续帧或片，或一个先前帧或片及一个后续帧或片的数据。此外，在一些情况下，列表0 52A和/或列表1 52B可各自包括与多个帧、片或宏块相关联的数据。列表0 52A和/或列表1 52B仅为可能预测性数据的两个不同的集合，且每一列表可包括在相对于正被编码的当前视频块的任何方向上的一个帧或片，或若干帧、片或宏块。

如图3中所展示，运动补偿单元35包括一缺省加权预测单元54、一隐式加权预测单元56，及一显式加权预测单元58。单元54、56及58分别执行如本文中所描述的缺省加权预测、隐式加权预测及显式加权预测。速率-失真(R-D)分析单元64可在这些可能性当中选择加权预测数据，且可实施本发明的技术以促进选择过程。

运动补偿单元35也包括舍入单元55，所述舍入单元55使单元54、56及58中的一个或一个以上者产生相应加权预测数据的经舍入版本及未经舍入版本。再一次，通过消除舍入，可在一些背景下改善加权预测数据。

另外，运动补偿单元35包括计算偏移的偏移计算单元62。根据ITU-T H.264/MPEG-4AVC编码格式，仅在显式加权预测中允许偏移。因此，为了在缺省加权预测或隐式加权预测的背景下考虑偏移，可将由缺省加权预测单元54或隐式加权预测单元56确定的权重连同由偏移计算单元62确定的偏移一起转发至显式加权预测单元58。按这种方式，通过将偏移加至缺省加权预测数据或隐式加权预测数据以供由R-D分析单元64考虑，显式加权预测单元58可采用ITU-T H.264/MPEG-4 AVC编码格式。在这种情况下，显式加权预测单元58不仅产生普通显式加权预测数据，而且产生使用由缺省加权预测单元54或隐式加权预测单元56确定的权重结合由偏移计算单元62确定的偏移的预测数据。

偏移计算单元可将偏移计算为正被编码的块的视频块值的平均值与预测块的视频块值的平均值之间的差。可计算关于亮度视频块的偏移，且在一些情况下，可计算关于亮度视频块及关于色度视频块的偏移。

R-D分析单元64可分析不同加权的预测性数据，且可选择在质量方面或在速率及失真方面产生最佳结果的加权预测性数据。R-D分析单元64输出选定加权预测性数据，可经由加法器48(图2)自正被编码的视频块减去所述加权预测性数据。可使用语法元素向解码器通知应用以产生加权预测性数据的方式或方法。举例来说，语法元素可指示是否使用了舍入，且可指示是否应使用缺省、隐式或显式加权预测。如果应使用显式加权预测，则语法元素可进一步识别权重因数及偏移，其又可为与显式加权预测相关联的权重因数及偏移，或可为实际上由缺省加权预测单元54或隐式加权预测单元56定义的权重因数加上来自偏移计算单元62的偏移。

图4为说明一例示性视频解码器70的框图，所述例示性视频解码器70可执行与上文所描述的编码技术相反的解码技术。视频解码器70可包括熵解码单元72、预测单元75、反量子化单元76、逆变换单元78、存储器74及加法器79。预测单元75可包括运动补偿(MC)单元88，以及空间预测组件，为简单及便于说明起见未展示所述空间预测组件。

视频解码器70可接收编码的视频数据，及指示舍入调整是否被用以编码被编码的视频数据的一个或一个以上语法元素。预测单元75的MC单元86可产生取决于两个或两个以上数据列表的加权预测数据，如本文中所描述。根据本发明，在一个或一个以上语法元素指示未使用舍入调整来编码被编码的视频数据的情况下，加权预测数据不包括舍入调整。视频解码器70可使用加权预测数据(例如)通过调用加法器79将所述加权预测数据(例如，预测块)加至残余数据(例如，残余块)而解码视频数据。

通常，熵解码单元72接收被编码的位流且将所述位流熵解码以产生量子化系数、运动信息及其他语法。将运动信息(例如，运动矢量)及其他语法转发至预测单元75以用于产生预测性数据。预测单元75执行与本发明一致的双向预测，从而(在一些情况下)避免舍入调整，且根据所接收的语法元素可能实施缺省、隐式或显式加权预测。语法元素可识别将使用的加权预测的类型、识别在使用显式加权预测的情况下的系数及偏移，及识别在解码中是否应使用舍入调整。

将量子化系数自熵解码单元72发送至反量子化单元76，所述反量子化单元76执行反量子化。逆变换单元78接着将所述被解量子化的系数逆变换回至像素域以产生残余块。加法器79将由预测单元75产生的预测数据(例如，预测块)与来自逆变换单元78的残余块组合以产生经重建的视频块，其可存储于存储器74中和/或自视频解码器70输出作为解码的视频输出。

图5为说明由与本发明一致的视频编码器执行的例示性过程的流程图。将自图2的视频编码器50的观点来描述图5。如图5中所展示，运动补偿单元35产生包括舍入的第一加权预测数据(101)，且产生不包括舍入的第二加权预测数据(102)。运动补偿单元35接着基于速率-失真分析自第一加权预测数据及第二加权预测数据选择预测数据(103)。具体来说，运动补偿单元35可确定第一及第二加权预测数据的成本度量(其量化与第一及第二加权预测数据相关联的编码速率与编码质量且使编码速率与编码质量平衡)，且可选择具有最低成本的预测数据。视频编码器50可接着基于选定预测数据编码视频数据(104)。举例来说，视频编码器50可调用加法器48自正被编码的视频数据减去选定预测数据，且接着调用用于变换的变换单元38、用于量子化的量子化单元40，及用于将经量子化及经变换的残余系数熵编码的熵编码单元46。在这种情况下，运动补偿单元35可产生用以指示舍入是否被用于预测数据的一个或一个以上语法元素，且可将这些语法元素转发至熵编码单元46以包括于被编码的位流中。

图6为说明由与本发明一致的视频解码器执行的例示性过程的流程图。将自图4的视频解码器70的观点来描述图6。如图6中所展示，视频解码器接收编码的视频数据(111)，且接收指示舍入调整是否被用以编码视频数据的一个或一个以上语法元素(112)。具体来说，熵解码单元72可接收包括视频数据及一个或一个以上语法元素的被编码位流。在熵解码之后，熵解码单元72可将视频数据输出为经量子化的变换系数，其由单元76反量子化且由单元78逆变换。熵解码单元72可将语法元素输出至预测单元，其包括指示舍入调整是否被用以编码视频数据、运动矢量及可能其他语法的一个或一个以上语法元素。

预测单元75调用运动补偿单元86以用于基于块的预测性解码。在进行这一步骤时，运动补偿单元86基于语法产生加权预测数据(113)。因此，如果一个或一个以上语法元素指示使用了舍入调整，则运动补偿单元86产生包括所述舍入调整的加权预测数据。然而，如果所述一个或一个以上语法元素指示未使用舍入调整，则运动补偿单元86产生缺乏舍入调整的加权预测数据。视频解码器70可接着使用加权预测数据解码视频数据(114)。具体来说，视频解码器70可调用加法器79而将加权预测数据(例如，预测块)与残余视频数据(例如，残余块)组合以便产生视频数据的重建(例如，经重建的视频块)。

图7为说明由与本发明一致的视频编码器执行的另一例示性过程的流程图。将自图3的运动补偿单元35(其可形成图2的视频编码器50的部分)的观点来描述图7。如图7中所展示，缺省加权预测单元54执行具有舍入的缺省加权预测(201)，及执行不具有舍入的缺省加权预测(202)。可调用舍入单元55以定义所述舍入或所述舍入的缺乏。隐式加权预测单元56接着执行具有舍入的隐式加权预测(203)，且执行不具有舍入的隐式加权预测(204)。再一次，可调用舍入单元55以定义所述舍入或所述舍入的缺乏。

如上文所说明，缺省加权预测指代由某缺省设置预定义与两个或两个以上不同列表相关联的权重因数的加权预测。在一些情况下，缺省加权预测可向所述列表中的每一者分派相等权重。隐式加权预测指代基于与数据相关联的一些隐式因素来定义与两个或两个以上不同列表相关联的权重因数的加权预测。举例来说，可通过两个不同列表中的数据相对于正被预测性编码的数据的相对时间位置来定义隐式权重因数。

R-D分析单元64选择缺省加权预测或隐式加权预测(205)。具体来说，R-D分析单元64可基于与不同版本的预测数据相关联的质量及编码速率而选择缺省加权预测或隐式加权预测。举例来说，R-D分析单元64可考虑不同版本的预测数据相对于被编码的视频块的相似性，且可选择最接近的版本。

如果R-D分析单元64选择缺省加权预测(「缺省」205)，则可调用显式加权预测单元58来计算显式加权预测数据且将所述数据与使用缺省权重的显式加权预测数据比较。如所提及，这允许实现在缺省权重的背景下的偏移。因此，显式加权预测可用作用以将不同偏移提供至原本将由缺省或隐式加权预测定义的数据的机制。如上文所概述，显式加权预测指代作为编码过程的部分动态地定义权重因数且将其编码至位流中的加权预测。在这一方面，显式加权预测不同于缺省加权预测及隐式加权预测，例如，显式加权预测导致被编码为位流的部分的权重因数，而缺省及隐式加权预测定义被预定义或由解码器确定的权重因数(在位流中不存在权重因数)。

具体来说，显式加权预测单元58可使用由ITU-T H.264定义的常规显式加权预测计算显式权重及显式偏移(206)。举例来说，为了计算显式权重，显式加权预测单元58可应用最小均方(LMS)算法以便求解关于权重与偏移的上文所列出的显式加权预测方程。另外，显式加权预测单元58可计算与缺省权重相关联的偏移(207)。可由显式加权预测单元58调用偏移计算单元62以便计算所述偏移。具体来说，偏移计算单元62可将给定偏移计算为正被编码的视频数据的像素值与给定版本的加权预测数据的像素值之间的平均差。

显式加权预测单元58可接着产生两个不同版本的预测数据。具体来说，显式加权预测单元58可使用缺省权重及对应偏移执行显式加权预测(208)，且也可使用计算的权重及对应显式偏移执行显式加权预测(209)。可接着将这两个不同版本的显式加权预测数据(根据普通显式加权预测计算的一个版本，及使用缺省权重加上偏移所计算的另一版本)及具有或不具有舍入的缺省加权预测发送至R-D分析单元64。R-D分析单元64可基于R-D分析选择预测模式(210)。具体来说，R-D分析单元64可在这两个不同版本的显式加权预测数据(根据普通显式加权预测计算的一个版本，及使用缺省权重加上偏移所计算的另一版本)之间进行选择。R-D分析单元64可考虑不同版本的预测数据相对于正被编码的视频块的相似性，且可选择最接近的版本。

在相对于缺省加权预测数据选择隐式加权预测数据时，关于所述隐式加权预测数据发生类似过程。即，如果R-D分析单元64选择隐式加权预测(「隐式」205)，则可调用显式加权预测单元58来计算显式加权预测数据且将所述数据与使用隐式权重的显式加权预测数据比较。这允许实现在隐式权重的背景下的偏移。具体来说，显式加权预测单元58可使用由ITU-T H.264定义的常规显式加权预测来计算显式权重及显式偏移(211)。另外，显式加权预测单元58可计算与隐式权重相关联的偏移(212)。可由显式加权预测单元58调用偏移计算单元62以便计算如本文中所描述的偏移。

显式加权预测单元58可接着产生两个不同版本的预测数据。在这种情况下，显式加权预测单元58可使用隐式权重及对应偏移执行显式加权预测(213)，且也可使用计算的权重及对应显式偏移来执行显式加权预测(214)。可接着将这两个不同版本的显式加权预测数据(根据普通显式加权预测计算的一个版本，及使用隐式权重加上偏移所计算的另一版本)及具有或不具有舍入的隐式加权预测发送至R-D分析单元64。R-D分析单元64可基于R-D分析而选择预测模式。具体来说，R-D分析单元64可在这两个不同版本的显式加权预测数据(根据普通显式加权预测计算的一个版本，及使用隐式权重加上偏移所计算的另一版本)之间进行选择。R-D分析单元64可考虑不同版本的预测数据相对于正被编码的视频块的相似性，且可选择最接近的版本。

可在包括无线手机及集成电路(IC)或IC集合(即，芯片集)的广泛多种装置或设备中实施本发明的技术。提供已描述的任何组件、模块或单元以强调功能性方面且未必要求通过不同硬件单元来实现。也可以硬件、软件、固件或其任何组合来实施本文中所描述的技术。描述为模块、单元或组件的任何特征可一起实施于集成逻辑装置中，或单独实施为离散的但可共同操作的逻辑装置。在一些情况下，各种特点可实施为例如集成电路芯片或芯片集的集成电路装置。

如果以软件实施，则所述技术可至少部分地通过包含指令的计算机可读媒体来实现，所述指令在于处理器中执行时，执行上文中所描述的方法中的一个或一个以上者。所述计算机可读媒体可包含计算机可读存储媒体，且可形成计算机程序产品的部分，计算机程序产品可包括包装材料。计算机可读存储媒体可包含随机存取存储器(RAM)(例如，同步动态随机存取存储器(SDRAM))、只读存储器(ROM)、非易失性随机存取存储器(NVRAM)、电可擦除可编程只读存储器(EEPROM)、快闪存储器、磁性或光学数据存储媒体等等。额外或替代性地，可至少部分地通过携载或传达呈指令或数据结构的形式的代码且可由计算机存取、读取和/或执行的计算机可读通信媒体来实现所述技术。

代码或指令可由一个或一个以上处理器执行，所述一个或一个以上处理器例如，一个或一个以上数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA)或其他等效的集成或离散逻辑电路。因此，如本文中所使用的术语「处理器」可指代前述结构或适于实施本文中所描述的技术的任何其他结构中的任一者。另外，在一些方面中，可将本文所描述的功能性提供于被配置用于编码及解码的专用软件模块或硬件模块内，或并入于组合的视频编解码器中。所述技术也可完全实施于一个或一个以上电路或逻辑元件中。

本发明也预期包括用以实施本发明中所描述的技术中的一个或一个以上技术的电路的多种集成电路装置中的任一者。此电路可提供于单一集成电路芯片中或所谓的芯片集中的多个可共同操作的集成电路芯片中。这种集成电路装置可用于多种应用中，其中一些应用可包括用于无线通信装置(例如，移动电话手机)中。

已描述本发明的各种实施例。这些及其他实施例在以下权利要求书的范围内。

Claims

1.一种用于预测取决于两个以上或两个以上预测数据列表的视频数据的方法，所述方法包含：

产生取决于所述两个或两个以上预测数据列表且包括至少两个偏移及舍入调整的加权预测数据，其中根据以下方程近似产生所述加权预测数据：

其中pred(i，j)为所述加权预测数据，pred0(i，j)及pred1(i，j)为来自所述两个或两个以上预测数据列表的数据，w0及w1为权重因数，o1及o2所述至少两个偏移，且r及2^r为与移位(r+1)个位的右移位运算|＞＞」相结合提供所述舍入的舍入调整；及

使用所述加权预测数据重建所述视频数据。

2.根据权利要求1所述的方法，其中所述两个或两个以上列表包括列表0和列表1，且其中所述加权预测数据取决于来自所述列表0的第一数据、来自所述列表1的第二数据、两个不同加权因数、两个不同偏移以及至少两个不同舍入项。

3.根据权利要求1所述的方法，其中o1是适用于来自列表0的所述pred0(i，j)的第一偏移，且o2是适用于来自所述列表1的所述pred1(i，j)的第二偏移。

4.根据权利要求1所述的方法，其中针对亮度块及色度块施加不同偏移。

5.根据权利要求1所述的方法，其中将所述至少两个偏移组合为单个偏移o，其中o为适用于来自列表0的所述pred0(i，j)及来自列表1的所述pred1(i，j)的共同偏移。

6.根据权利要求1所述的方法，其进一步包含编码指示经重建视频数据的视频位流。

7.根据权利要求1所述的方法，其进一步包含使用经重建的视频数据来解码所述视频数据。

8.一种用于预测取决于两个以上或两个以上预测数据列表的视频数据的设备，所述设备包含：

存储器，其经配置以存储所述视频数据及用以预测性地编码所述视频数据的两个或两个以上数据列表；以及

处理器，其经配置以：

产生取决于所述两个或两个以上数据列表且包括至少两个偏移及舍入调整的舍入调整的加权预测数据；

其中所述处理器根据以下方程近似产生所述加权预测数据：

其中pred(i，j)为所述加权预测数据，pred0(i，j)及pred1(i，j)为来自所述两个或两个以上数据列表的数据，w0及w1为权重因数，o1及o2所述至少两个偏移，且r及2^r为与移位(r+1)个位的右移位运算|＞＞」相结合提供所述舍入的舍入调整；及

使用所述加权预测数据重建所述视频数据。

9.根据权利要求8所述的设备，其中所述两个或两个以上列表包括列表0和列表1，且其中所述加权预测数据取决于来自所述列表0的第一数据、来自所述列表1的第二数据、两个不同加权因数以及两个不同偏移。

10.根据权利要求8所述的设备，其中o1是适用于来自列表0的所述pred0(i，j)的第一偏移，且o2是适用于来自所述列表1的所述pred1(i，j)的第二偏移。

11.根据权利要求8所述的设备，其中施加不同偏移以预测亮度块及色度块。

12.根据权利要求8所述的设备，其中将所述至少两个偏移组合为单个偏移o，其中o为适用于来自列表0的所述pred0(i，j)及来自列表1的所述pred1(i，j)的共同偏移。

13.根据权利要求8所述的设备，其中所述处理器经配置以编码指示经重建视频数据的视频位流。

14.根据权利要求8所述的设备，其中所述处理器进一步经配置以使用经重建的视频数据来解码所述视频数据。

15.根据权利要求8所述的设备，其中所述设备包括以下各项中的一个或多个：

集成电路；

微处理器；

视频编码器；

视频解码器；或

无线通信装置。