CN102172027B - 有效率的预测模式选择 - Google Patents

有效率的预测模式选择 Download PDF

Info

Publication number
CN102172027B
CN102172027B CN200980139697.8A CN200980139697A CN102172027B CN 102172027 B CN102172027 B CN 102172027B CN 200980139697 A CN200980139697 A CN 200980139697A CN 102172027 B CN102172027 B CN 102172027B
Authority
CN
China
Prior art keywords
version
video data
predictability
data unit
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN200980139697.8A
Other languages
English (en)
Other versions
CN102172027A (zh
Inventor
拉胡尔·潘查尔
马尔塔·卡切维奇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of CN102172027A publication Critical patent/CN102172027A/zh
Application granted granted Critical
Publication of CN102172027B publication Critical patent/CN102172027B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/109Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/19Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding using optimisation based on Lagrange multipliers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/573Motion compensation with multiple frame prediction using two or more reference frames in a given prediction direction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/577Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/142Detection of scene cut or scene change
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/523Motion estimation or motion compensation with sub-pixel accuracy
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

总地来说,本发明描述用于有效率地选择用以根据参考视频数据预测预测性视频数据的预测模式的技术。确切地说,一种设备可包括存储器,所述存储器至少存储第一参考经译码单元及第二参考经译码单元,所述第一参考经译码单元及第二参考经译码单元各自分别包括第一参考视频数据单元及第二参考视频数据单元。所述设备可进一步包含运动补偿单元,所述运动补偿单元执行默认加权预测以根据所述第一参考视频数据单元及第二参考视频数据单元预测预测性视频数据单元的第一版本,且计算所述预测性视频数据单元的所述第一版本的偏移值。所述运动补偿单元可接着基于所述经计算偏移值而执行隐式加权预测或显式加权预测以预测所述预测性视频数据单元的第二版本,且将所述预测性视频数据单元编码为所述第一版本或第二版本。

Description

有效率的预测模式选择
本申请案主张2008年10月6日申请的第61/103,100号美国临时申请案的权益,所述申请案的全部内容以引用的方式并入本文中。
技术领域
本发明涉及数字视频,且更确切地说,涉及用于译码数字视频数据的技术。
背景技术
已开发出许多视频编码及解码技术以用于编码及解码数字视频数据。举例来说,动画专家组(Moving Picture Experts Group,MPEG)已开发出包括MPEG-1、MPEG-2及MPEG-4的若干技术。其它实例包括国际电信联盟(International Telecommunication Union,ITU)-T H.263标准,以及ITU-T H.264标准及其对等者ISO/IEC MPEG-4第10部分(即,高级视频译码(Advanced Video Coding,AVC))。这些视频标准通过以压缩方式来编码数据以减少数据的量而支持视频数据的有效率发射及存储。
视频压缩可涉及空间及/或时间预测以减少在视频序列中固有的冗余。帧内译码(intra-coding)使用空间预测以减少同一视频帧内的视频块的空间冗余。帧间译码(inter-coding)使用时间预测以减少逐次视频帧中的视频块之间的时间冗余。对于帧间译码,视频编码器执行运动估计以产生指示视频块相对于一个或一个以上参考帧中的对应预测视频块的位移的运动向量。
源装置可使用上述视频编码技术中的一者来编码数字视频数据。源装置将经编码视频数据存档及/或经由发射信道而将经编码视频数据发射到目的装置。发射信道可利用有线及/或无线通信媒体。目的装置接收经编码视频数据且解码所接收视频数据以恢复原始数字视频数据以供播放。许多装置包括编码器及解码器两者,编码器及解码器可组合成所谓的编解码器。
发明内容
总地来说,本发明描述用于有效率地选择用以根据至少两个参考经译码单元预测视频数据的第三经译码单元(其可被称为预测性经译码单元)的预测模式的技术。参考经译码单元指代先前已经译码且提供用以预测预测性经译码单元的基础的经译码单元。值得注意的是,这些参考经译码单元可在时间上驻留于预测性经译码单元之前或之后。通常,视频编码器实施所述技术以通过减少为选择预测模式所需要的预测性译码遍(codingpass)的数目来改进译码效率。由于所述技术可减少为选择适当预测模式所必要的译码遍(其通常可被称为计算操作)的数目,所以所述技术也可促进有效率的功率消耗。换句话说,视频编码器可从多种预测模式中智能地预选择一预测模式而不必实施所述预测模式中的每一者,且接着对每一预测的结果执行比较分析以选择多种预测模式中的一最适当预测模式。
更确切地说,视频编码器可实施本发明的技术以有效率地选择用以预测被称为B帧的特定类型的预测性经译码单元的视频数据单元的运动补偿双向预测模式。作为一个实例,在ITU-T H.264标准及其对等者ISO/IEC MPEG-4第10部分(即,高级视频译码(AVC)标准)内,定义三种运动补偿双向预测模式以用于预测B帧的视频数据单元。这些双向预测模式中的每一者根据至少两个参考视频数据单元预测B帧的视频数据单元,其中参考视频数据单元中的每一者包括于在视频数据中在时间上出现于B帧之前或之后的单独或不同参考经译码单元(例如,I帧或P帧)内。
第一模式被称为默认加权预测模式,其将默认或已知权重施加于参考块中的每一者以(例如)平均化参考视频单元的像素值且借此预测B帧的预测性视频数据单元。第二模式被称为显式加权预测模式,其中权重是通过视频编码器进行显式地定义且用以修整预测性视频数据单元的预测。第三模式被称为隐式加权预测模式,其中权重是通过视频编码器经由分别分析参考经译码单元或参考经译码单元的参考视频数据单元进行隐式地确定以预测预测性经译码单元。
视频编码器可根据本发明的技术而仅有效率地执行这三种预测模式中的两者以仅产生第三经译码单元的两种版本,而非执行这些预测模式中的所有三者以产生三种版本。结果,视频编码器可仅需要分析两种版本而非三种版本以确定两种版本中的哪一者更适当地表示视频数据的对应部分。在此方面,视频编码器可减少计算操作(例如,预测译码遍)的数目,同时还促进有效率的功率消耗。
在一个方面中,提供一种编码视频数据的方法,所述方法包含:接收视频数据的第一参考经译码单元及第二参考经译码单元,其中第一经译码单元及第二经译码单元中的每一者各自包含相应第一参考视频数据单元及第二参考视频数据单元;执行默认加权预测以根据第一参考视频数据单元及第二参考视频数据单元预测视频数据的预测性经译码单元的预测性视频数据单元的第一版本,其中两个参考经译码单元中的每一者在时间上出现于预测性经译码单元之前或之后;及计算预测性视频数据单元的第一版本的偏移值。所述方法进一步包含:基于经计算偏移值而选择隐式加权预测模式或显式加权预测模式;执行选定模式以根据第一参考视频数据单元及第二参考视频数据单元预测预测性视频数据单元的第二版本;及将预测性视频数据单元编码为第一版本或第二版本。
在另一方面中,提供一种编码视频数据的设备,所述设备包含视频编码器,视频编码器包括:存储器,其存储第一参考经译码单元及第二参考经译码单元,其中第一参考经译码单元包括第一参考视频数据单元且第二参考经译码单元包括第二参考视频数据单元;及运动补偿单元。运动补偿单元进行以下动作:执行默认加权预测以根据第一参考视频数据单元及第二参考视频数据单元预测视频数据的预测性经译码单元的预测性视频数据单元的第一版本,其中两个参考经译码单元中的每一者在时间上出现于预测性经译码单元之前或之后;计算预测性视频数据单元的第一版本的偏移值;基于经计算偏移值而选择隐式加权预测模式或显式加权预测模式;执行选定模式以根据第一参考视频数据单元及第二参考视频数据单元预测预测性视频数据单元的第二版本;及将预测性视频数据单元编码为第一版本或第二版本。
在另一方面中,提供一种编码视频数据的装置,所述装置包含用于编码视频数据的装置。用于编码视频数据的装置包括:用于存储视频数据的第一参考经译码单元及第二参考经译码单元的装置,其中第一参考经译码单元包括第一参考视频数据单元且第二参考经译码单元包括第二参考视频数据单元;及用于执行默认加权预测以根据第一参考视频数据单元及第二参考视频数据单元预测视频数据的预测性经译码单元的预测性视频数据单元的第一版本的装置,其中两个参考经译码单元中的每一者在时间上出现于预测性经译码单元之前或之后。用于编码视频数据的装置包括:用于计算预测性视频数据单元的第一版本的偏移值的装置;用于基于经计算偏移值而执行隐式加权预测或显式加权预测而非此两者以根据第一参考视频数据单元及第二参考视频数据单元预测预测性视频数据单元的第二版本的装置;及用于将预测性视频数据单元编码为第一版本或第二版本的装置。
在另一方面中,提供一种计算机可读媒体,其包含用于使可编程处理器进行以下动作的指令:接收视频数据的第一参考经译码单元及第二参考经译码单元,其中第一经译码单元及第二经译码单元中的每一者各自包含相应第一参考视频数据单元及第二参考视频数据单元;执行默认加权预测以根据第一参考视频数据单元及第二参考视频数据单元预测视频数据的预测性经译码单元的预测性视频数据单元的第一版本,其中两个参考经译码单元中的每一者在时间上出现于预测性经译码单元之前或之后;计算预测性视频数据单元的第一版本的偏移值;基于经计算偏移值而选择隐式加权预测模式或显式加权预测模式;执行选定模式以根据第一参考视频数据单元及第二参考视频数据单元预测预测性视频数据单元的第二版本;及将预测性视频数据单元编码为第一版本或第二版本。
在下文的随附图式及描述中阐述本发明的一个或一个以上实施例的细节。本发明的其它特征、目标及优点将通过所述描述及图式以及通过权利要求书变得显而易见。
附图说明
图1为说明可实施本发明的技术的示范性视频编码及解码系统的框图。
图2为说明可执行符合本发明的偏移技术的视频编码器的实例的框图。
图3为更详细地说明图2所示的运动补偿单元的实例的框图。
图4为说明视频编码器在执行本发明中所描述的技术时的实例操作的流程图。
图5为更详细地说明视频编码器在执行本发明中所描述的技术时的实例操作的流程图。
图6为说明经译码单元的实例时间次序序列的图解。
具体实施方式
大体来说,本发明描述用于有效率地选择用以根据至少两个参考经译码单元预测视频数据的第三经译码单元(其可被称为预测性经译码单元)的预测模式的技术。参考经译码单元指代先前已经译码且提供用以预测第三经译码单元的基础的经译码单元。值得注意的是,这些参考经译码单元可在时间上驻留于第三经译码单元之前或之后。通常,视频编码器实施所述技术以通过减少选择预测模式所需要的预测性译码遍的数目来改进译码效率。由于所述技术可减少选择最佳或更适当预测模式所必要的译码遍(其通常可被称为计算操作)的数目,所以所述技术还可促进有效率的功率消耗。换句话说,视频编码器可从多种预测模式中智能地预选择一预测模式而不必实施所述预测模式中的每一者,且接着对每一预测的结果执行比较分析以选择最适当的预测模式。
更确切地说,视频编码器可实施本发明的技术以有效率地选择用以预测被称为B帧的特定类型的预测性经译码单元的视频数据单元的运动补偿双向预测模式。作为一个实例,在ITU-T H.264标准及其对等者ISO/IEC MPEG-4第10部分(即,高级视频译码(AVC)标准)内,定义三种运动补偿双向预测模式以用于预测B帧的视频数据单元。这些双向预测模式中的每一者根据至少两个参考视频数据单元预测B帧的视频数据单元,其中参考视频数据单元中的每一者包括于在时间上出现于B帧之前或之后的单独或不同参考经译码单元(例如,I帧或P帧)内。
第一模式被称为默认加权预测模式,其将默认或已知权重施加于参考块中的每一者以(例如)平均化参考视频单元的像素值且借此预测B帧的预测性视频数据单元。第二模式被称为显式加权预测模式,其中权重是通过视频编码器进行显式地定义。第三模式被称为隐式加权预测模式,其中权重是通过视频编码器经由分别分析参考经译码单元或参考经译码单元的参考视频数据单元进行隐式地确定以预测预测性经译码单元。关于显式加权预测模式,视频编码器显式地编码权重,因此,名称为“显式”加权预测。关于隐式加权预测模式,视频编码器并不显式地编码权重,相反,解码器利用与由视频编码器所使用的权重确定算法相同的权重确定算法来确定权重。换句话说,视频编码器隐式地编码权重,且要求解码器执行额外操作以确定相同权重,而非显式地编码权重且借此使解码器减轻必须执行这些额外操作。
视频编码器可根据本发明的技术而仅有效率地执行这三种预测模式中的两者以仅产生第三经译码单元的两种版本,而非执行这些预测模式中的所有三者以产生三种版本。结果,视频编码器可仅需要分析两种版本而非三种版本以确定两种版本中的哪一者更适当地表示视频数据的对应部分。在此方面,视频编码器可减少计算操作(例如,预测译码遍)的数目,同时还促进有效率的功率消耗。
图1为说明可实施本发明的技术的一个示范性视频编码及解码系统10的框图。如图1所示,系统10包括经由通信信道15而将经编码视频发射到目的装置16的源装置12。源装置12及目的装置16可包含各种各样的装置中的任一者。在一些状况下,源装置12及目的装置16包含无线通信装置,例如,无线手持机(所谓的蜂窝式或卫星无线电电话),或可经由通信信道15而传达视频信息的任何无线装置(在所述状况下,通信信道15是无线的)。然而,涉及预测经译码单元的预测算法或模式的有效率选择的本发明的技术未必限于无线应用或设定。
在图1的实例中,源装置12可包括视频源20、视频编码器22、调制器/解调器(调制解调器)23及发射器24。目的装置16可包括接收器26、调制解调器27、视频解码器28及显示装置30。根据本发明,源装置12的视频编码器22可经配置以应用本发明的有效率选择技术中的一者或一者以上以作为视频编码过程的一部分。
图1的所说明系统10仅是示范性的。本发明的有效率选择技术可通过支持运动补偿预测的任何编码装置执行。源装置12及目的装置16仅为这些译码装置的实例,其中源装置12产生用于发射到目的装置16的经译码视频数据。装置12、16可用大体上对称方式而操作,使得装置12、16中的每一者包括视频编码及解码组件。因此,系统10可支持视频装置12、16之间的单向或双向视频发射(例如)以用于视频流式传输、视频播放、视频广播或视频电话。
源装置12的视频源20可包括例如摄像机的视频捕捉装置(video capture device)、含有先前捕捉的视频的视频档案(video archive),或来自视频内容提供者的视频馈送(video feed)。作为另一替代例,视频源20可产生作为源视频的基于计算机图形的数据,或实况转播视频、经存档视频与计算机产生的视频的组合。在一些状况下,如果视频源20为摄像机,则源装置12及目的装置16可形成所谓的相机电话或视频电话。在每一状况下,经捕捉视频、经预捕捉视频或计算机产生的视频均可通过视频编码器22编码。经编码视频信息可接着通过调制解调器23根据通信标准(例如,码分多址(CDMA)或另一通信标准)进行调制,且经由发射器24而发射到目的装置16。调制解调器23可包括各种混频器、滤波器、放大器或经设计以用于信号调制的其它组件。发射器24可包括经设计以用于发射数据的电路,包括放大器、滤波器及一个或一个以上天线。
目的装置16的接收器26经由信道15而接收信息,且调制解调器27解调所述信息。同样,视频编码过程可实施本文中所描述的技术中的一者或一者以上以在运动补偿期间有效率地预测经译码单元。经由信道15而传达的信息可包括由视频编码器22定义的信息,其也由视频解码器28使用。显示装置30向用户显示经解码视频数据,且可包含各种显示装置中的任一者,例如,阴极射线管、液晶显示器(LCD)、等离子显示器、有机发光二极管(OLED)显示器或另一类型的显示装置。
在图1的实例中,通信信道15可包含任何无线或有线通信媒体,例如,射频(RF)频谱或一个或一个以上物理传输线,或无线媒体与有线媒体的任何组合。通信信道15可形成例如局域网(LAN)、广域网(WAN)或全球网(例如,包含一个或一个以上网络的互连的因特网)的基于包的网络的一部分。通信信道15大体上表示用于将视频数据从源装置12发射到目的装置16的任何合适通信媒体或不同通信媒体的集合。通信信道15可包括可用于促进从源装置12到目的装置16的通信的路由器、交换器、基站或任何其它设备。
视频编码器22及视频解码器28可根据视频压缩标准(例如,ITU-T H.264标准,或者被描述为MPEG-4第10部分(高级视频译码(AVC))而操作。然而,本发明的技术不限于任何特定译码标准。尽管图1中未展示,但在一些方面中,视频编码器22及视频解码器28可各自与音频编码器及解码器集成,且可包括适当MUX-DEMUX单元或其它硬件及软件,以处置共同数据流或单独数据流中的音频及视频两者的编码。如果适用,MUX-DEMUX单元可遵照ITU H.223多路复用器协议,或例如用户数据报协议(userdatagram protocol,UDP)的其它协议。
ITU-T H.264/MPEG-4(AVC)标准是由ITU-T视频译码专家组(Video Coding ExpertsGroup,VCEG)连同ISO/IEC动画专家组(MPEG)制定以作为被称为联合视频小组(JointVideo Team,JVT)的集体伙伴关系的产品。在一些方面中,本发明中所描述的技术可应用于大体上遵照H.264标准的装置。H.264标准是由ITU-T研究组描述于ITU-T推荐标准H.264(用于通用视听服务的高级视频译码(Advanced Video Coding for genericaudiovisual services))中且日期为2005年3月,其在本文中可被称为H.264标准或H.264规范或H.264/AVC标准或规范。联合视频小组(JVT)继续致力于对H.264/MPEG-4AVC的扩展。
最近,在ITU-T的各种网络论坛(例如,关键技术领域(Key Technologies Area,KTA)网络论坛)中已开始致力于推进H.264/MPEG-4AVC标准。KTA网络论坛在某种程度上探求展现比通过H.264/AVC标准所展现的译码效率高的译码效率的译码技术。本发明中所描述的技术可提供比在H.264/AVC标准中所提供的预测模式选择更有效率的预测模式选择。最近,KTA网络论坛接收到在各种方面中详述这些技术的文档,所述文档是由拉赫尔·潘切尔(Rahul Panchal)及马莎·卡兹威兹(Marta Karczewicz)提交,编号为VCEG-AJ25,名为“简化JMKTA 2.0软件的实验结果(Experimental Results on SimplifiedJMKTA 2.0 Software)”(其是于2008年10月8日到10日期间在加利福尼亚州圣地亚哥市举行的第36次会议上提出),其全文以引用的方式并入本文中。
视频编码器22及视频解码器28可各自实施为一个或一个以上微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、软件、硬件、固件或其任何组合。视频编码器22及视频解码器28中的每一者可包括于一个或一个以上编码器或解码器中,其中的任一者可集成为相应移动装置、用户装置、广播装置、服务器等中的组合式编码器/解码器(CODEC)的一部分。
一视频序列通常包括一系列视频帧。视频编码器22对各个视频帧内的视频块进行操作,以便编码视频数据。视频块可具有固定或变化的大小,且可根据规定译码标准而在大小上不同。每一视频帧包括一系列片断(slice)。每一片断可包括一系列宏块,其可排列为子块。作为一实例,ITU-T H.264标准支持例如用于亮度分量的16×16、8×8或4×4及用于色度分量的8×8的各种块大小的帧内预测,以及例如用于亮度分量的16×16、16×8、8×16、8×8、8×4、4×8及4×4及用于色度分量的对应经按比例缩放的各种块大小的帧间预测。视频块可包含像素数据的块,或变换系数的块,例如,在例如离散余弦变换或概念上类似的变换过程的变换过程之后。
较小视频块可提供较好分辨率,且可用于包括高等级的细节的视频帧的位置。一般来说,可将宏块及各种子块视为视频块。另外,可将一片断视为一系列视频块,例如,宏块及/或子块。每一片断可为视频帧的可独立解码单元。或者,帧自身可为可解码单元,或可将帧的其它部分定义为可解码单元。术语“经译码单元”指代视频帧的任何可独立解码单元,例如,整个帧、帧的片断、图片组(GOP),或根据所使用的译码技术而定义的另一可独立解码单元。
在基于帧间的预测性译码(其包括内插及用以有效率地选择用以预测经译码单元的预测算法或模式的本发明的技术)之后,且在任何变换(例如,H.264/AVC中所使用的4×4或8×8整数变换或离散余弦变换或DCT)之后,可执行量化。量化通常指代系数经量化以可能减少用以表示所述系数的数据的量的过程。量化过程可减少与系数中的一些或全部相关联的位深度。举例来说,可在量化期间将16位值下舍入成15位值。在量化之后,可(例如)根据内容自适应可变长度译码(content adaptive variable length coding,CAVLC)、上下文自适应二进制算术译码(context adaptive binary arithmetic coding,CABAC)或另一熵译码方法来执行熵译码。
根据本发明的技术,视频编码器22可选择视频数据的至少两个不同参考经译码单元。这两个经译码单元可包含第一帧及不同于第一帧的第二帧。或者,视频编码器22可选择第一参考帧的第一参考视频数据单元(例如,宏块或任何其它大小的视频数据单元)及第二参考帧的第二参考视频数据单元。出于说明的目的,在下文关于视频块及帧来描述本发明的技术。然而,所述技术可大体上应用于整个经译码单元或应用于其若干部分(例如,经译码单元的视频数据单元)。
在一些方面中,视频编码器22可存储第一参考帧集合(其可被统称为列表零(0))及第二参考帧集合(其可被统称为列表一(1)),其中所述集合中的每一者包括不同于另一集合的参考帧的参考帧。视频编码器22可从列表0中选择一个或一个以上参考帧及从列表1中选择一个或一个以上参考帧。在此方面,视频编码器22可接收视频数据的至少两个不同参考帧。
在选择参考帧之后,视频编码器22可执行默认加权预测以根据至少两个参考视频块预测视频数据的预测性帧的预测性视频块的第一版本,所述至少两个参考视频块各自选自至少两个不同参考帧中的不同一者。值得注意的是,两个参考帧在时间上远离预测性帧。同样,至少两个参考视频块在时间上远离预测性视频块。换句话说,第一参考帧集合中的参考帧(及选自这些参考帧的参考视频块)可包含按时间依序地或在时间上出现于预测性帧之前或之后或出现于预测性帧之前及之后的参考帧。同样,第二参考帧集合中的参考帧(及选自这些参考帧的参考视频块)可包含按时间依序地或在时间上出现于预测性帧之前或之后或出现于预测性帧之前及之后的帧。
视频编码器22可因此从列表0中选择在时间上出现于预测性帧之前或之后的第一参考帧及从列表1中选择在时间上出现于预测性帧之前或之后的第二参考帧。根据这两个选定单元所预测的预测性帧通常被称为双向帧或双向图片(简称为B帧或B图片),因为:预测性帧是从两个时间方向(例如,出现于预测性帧之前及之后的两个参考单元)予以预测。虽然由于此原因而被称为“B帧”,但在各种方面中,B帧也可根据出现于B帧以前的两个参考帧予以预测,或者,根据出现于B帧之后的两个参考帧予以预测。
通常,B帧是以此方式基于逐个块予以预测,且视频编码器22可从第一参考帧中选择第一参考视频块及从第二参考帧中选择第二视频块。为了选择这些块,视频编码器22可将第一块及第二块识别为最好地匹配预测性视频块或展现类似于预测性视频块的像素值的像素值的块。视频编码器22可接着执行默认加权预测以分别根据第一参考帧的第一参考视频块及第二参考帧的第二参考视频块预测预测性帧的预测性视频块的第一版本。
为了执行默认加权预测,视频编码器22可使第一参考视频块乘以第一权重以确定第一加权视频块,且使第二参考视频块乘以第二权重以确定第二加权视频块。视频编码器22可紧接着使第一加权视频块与第二加权视频块相加以产生总加权视频块。视频编码器22可根据默认加权预测算法通过使总加权视频块除以经选择以用于预测预测性视频块的第一版本的参考视频块的数目(其在此例子中为二,例如,第一参考视频块及第二参考视频块)来预测预测性视频块的第一版本。通常,第一权重与第二权重彼此相等,例如,第一权重等于0.5或50%且第二权重等于0.5或50%。对于两个以上权重,所述权重可仅彼此大致相等,例如,第一权重等于33.33%,第二权重等于33.33%,且第三权重等于33.34%。由于权重通常不变化,所以此形式的加权预测可被称为直接、默认或相等加权的预测。
在使用默认加权预测算法来计算、确定或以其它方式预测预测性视频块的第一版本之后,视频编码器22可计算预测性视频块的偏移值。此偏移值可包含DC偏移或任何其它偏移值。在上述偏移中,“DC”指代在电学意义上从给定直流的偏移,但后来已适于供在电学上下文以外的各种各样的上下文使用。
在视频编码的上下文中,可通过视频编码器22首先平均化参考视频块中的一者的像素值的亮度分量来计算DC偏移。视频编码器22可紧接着平均化预测性视频块的像素值的亮度分量。这些经计算值中的每一者可包含DC值。视频编码器22可接着通过使DC值彼此相减来计算DC偏移。在此方面,DC值可分别包含参考视频块及预测性视频块中的一者的平均亮度。此平均值类似于在电学上下文中的DC电压。这两个平均DC值之间的差可因此包含从标准DC值的偏移,非常像在电学上下文中的DC偏移表示从标准或平均DC值的偏移,因此,名称为“DC偏移”。
在任何情况下,视频编码器22均可接着执行隐式加权预测或显式加权预测以预测预测性帧的预测性视频块的第二版本。为了确定将执行隐式加权预测或显式加权预测中的哪一者,视频编码器22可将经计算DC偏移与阈值比较,且基于此比较而执行隐式加权预测或显式加权预测。举例来说,视频编码器22可将经计算DC偏移与阈值(其通常为零(0))比较。视频编码器22可替代地首先确定经计算DC偏移的绝对值,且将DC偏移的此绝对值与阈值(其同样通常可设定为零(0))比较。基于比较,视频编码器22可接着执行隐式加权预测或显式加权预测以预测预测性帧的预测性视频块的第二版本。
“隐式”加权预测或“显式”加权预测指代在预测预测性帧时所使用的两个或两个以上权重(例如)在经译码单元内编码或未在经译码单元内编码的预测形式。对于隐式加权预测,权重未经编码且因此在预测性视频块中可为隐式的。视频解码器26可接着在确定预测性视频块是使用隐式加权预测予以预测后,即刻经由分析第一参考视频块及第二参考视频块或在一些例子中分析第一参考帧及第二参考帧而导出权重。在显式加权预测中,视频编码器22可在预测性视频块内或在一些例子中在预测性帧内显式地译码在预测预测性视频帧时所使用的权重。显式加权预测可在选择权重时向视频编码器22提供更多宽容度(latitude),且结果,可使视频编码器22能够修整预测性帧(例如,B帧)的预测以适合视频数据的特定上下文或形式。
作为基于权重而执行隐式加权预测或显式加权预测的实例,当经计算DC偏移值的绝对值超过阈值时,视频编码器22可执行显式加权预测以预测预测性视频块的第二版本。然而,当经计算DC偏移值的绝对值不超过阈值(即,小于或等于阈值)时,视频编码器22可执行隐式加权预测以预测预测性视频块的第二版本。以此方式,视频编码器22可基于经计算偏移值而执行隐式加权预测或显式加权预测而非此两者以预测预测性视频块的第二版本。
在预测预测性视频块的第二版本后,视频编码器22即刻将预测性视频块编码为第一版本或第二版本。在一些例子中,视频编码器22可执行预测性视频块的第一版本及第二版本的成本分析(例如,速率-失真(rate-distortion,R-D)成本分析),以便选择第一版本及第二版本中更适当地编码视频数据的对应部分的版本。同样,视频编码器22通过执行默认加权预测来编码视频块的第一版本,且通过执行显式加权预测或隐式加权预测而非此两者来编码预测性视频块的第二版本。
视频编码器22可选择第一版本及第二版本中与最低成本相关联的版本。在任何情况下,视频编码器22均在经译码位流内将预测性视频块编码为第一版本或第二版本。源装置12的发射器24可将经译码位流发射到目的装置16的接收器26。在目的装置16中,视频解码器28接收经译码位流且解码经译码位流以重构视频序列。
以此方式,视频编码器22可实施本发明中所描述的技术以更有效率地在多种预测算法或模式之间进行选择,而不实际地通过执行预测算法中的每一者来产生预测性视频块的版本。如上文所描述,视频编码器22可首先执行默认加权预测,且紧接着执行隐式加权预测或显式加权预测而非此两者。因此,视频编码器22仅执行三种形式或类型的预测中的两者(默认加权预测,及显式加权预测或隐式加权预测而非此两者),而非执行所有三者。在此方面,视频编码器22可更有效率地在三种或三种以上预测模式之间进行选择,而不必执行三种或三种以上预测模式中的每一者。
同样如上文所描述,视频编码器22可基于针对B帧的预测性视频块的第一版本所计算的偏移而在执行隐式加权预测或显式加权预测之间进行选择以预测B帧的预测性视频块的第二版本。虽然在本发明中关于偏移进行描述,但通常视频编码器22可存取或可确定的任何特性均可由视频编码器22使用,以作为用于在执行隐式加权预测或显式加权预测之间进行选择的基础。
图2为说明可执行符合本发明的偏移技术的视频编码器50的实例的框图。视频编码器50可对应于装置20的视频编码器22或不同装置的视频编码器。视频编码器50可执行视频帧内的块的帧内译码及帧间译码,但为了说明的简易性起见而在图2中未展示帧内译码组件。帧内译码依赖空间预测以减少或移除给定视频帧内的视频中的空间冗余。帧间译码依赖时间预测以减少或移除视频序列的相邻帧内的视频中的时间冗余。帧内模式(I模式)可指代基于空间的压缩模式,且例如预测(P模式)或双向(B模式)的帧间模式可指代基于时间的压缩模式。本发明的技术应用于帧间译码期间,且因此,为了说明的简单性及简易性起见而在图2中未说明例如空间预测单元的帧内译码单元。
如图2所示,视频编码器50接收视频帧内的待编码的当前视频块。在图2的实例中,视频编码器50包括运动估计单元32、运动补偿单元35、参考帧存储装置34、加法器48、变换单元38、量化单元40及熵译码单元46。为了视频块重构,视频编码器50还包括逆量化单元42、逆变换单元44及加法器51。视频编码器50还可包括解块滤波器(deblocking filter)(未图示)以对块边界进行滤波以从经重构视频中移除块效应假影(blockiness artifact)。必要时,解块滤波器通常将对加法器51的输出进行滤波。
在编码过程期间,视频编码器50接收待译码的视频块,且运动估计单元32及运动补偿单元35执行帧间预测性译码。运动估计单元32与运动补偿单元35可高度集成,但出于概念上的目的而分开予以说明。通常认为运动估计是产生估计视频块的运动的运动向量的过程。举例来说,运动向量可指示预测性帧(或其它经译码单元)内的预测性块相对于在当前帧(或其它经译码单元)内经译码的当前块的位移。通常认为运动补偿是基于通过运动估计所确定的运动向量而提取或产生预测性块的过程。同样,运动估计单元32与运动补偿单元35可在功能上集成。出于示范的目的,本发明中所描述的技术经描述为由运动补偿单元35执行。
运动估计单元32通过将待译码的视频块与一个或一个以上预测性经译码单元(例如,依据时间或在时间上的先前及/或未来帧)的视频块比较来选择待译码的视频块的适当运动向量。作为一实例,运动估计单元32可用许多方式来选择B帧的运动向量。在一种方式中,运动估计单元32可从第一帧集合(被称为列表0)中选择先前或未来帧,且仅使用来自列表0的此先前或未来帧来确定运动向量。或者,运动估计单元32可从第二帧集合(被称为列表1)中选择先前或未来帧,且仅使用来自列表1的此先前或未来帧来确定运动向量。在又一方式中,运动估计单元32可从列表0中选择第一帧及从列表1中选择第二帧,且从列表0的第一帧及列表1的第二帧中选择一个或一个以上运动向量。如上文所提及,此预测形式可被称为双向预测性运动估计(bi-predictive motionestimation)。可实施本发明的技术,以便有效率地选择运动补偿双向预测模式。
根据H.264/AVC标准,可使用三种运动补偿双向预测性算法或模式来预测B帧或其若干部分,例如,B帧的视频块、宏块或任何其它离散及/或相连部分。第一运动补偿双向预测性算法或模式(其通常被称为默认加权预测)可涉及将大致相等权重施加于列表0的第一帧及列表1的第二帧的每一经识别视频块。接着将第一帧的加权块与第二帧的加权块加在一起且除以用以预测B帧的帧的总数目(例如,在此例子中为二)。通常,此除法是通过将1加到第一帧的加权块与第二帧的加权块的相加量(addition)且接着将结果向右移位一个位而实现。
第二运动补偿双向预测性算法或模式(其通常被称为显式加权预测)可涉及确定第一帧及第二帧的每一经识别视频块的权重,且接着执行类似于上文关于默认加权预测算法所描述的乘法及加法的用以产生加权块的权重的乘法及加法。然而,关于显式加权预测,可在将第一加权块与第二加权块的总和向右移位一个或其它数目以前加上额外的一个或一个以上舍入值或偏移,以确保除以用以预测第三经译码单元或B帧的帧的总数目的适当除法。
第三运动补偿双向预测性算法或模式(其通常被称为隐式加权预测)可涉及根据设定算法而确定每一经识别块的权重,所述算法可(例如)分析第一块及第二块中的每一者以确定第一权重及第二权重。一旦经确定,此算法便可施加或以其它方式使第一块及第二块乘以相应确定的第一权重及第二权重以产生第一加权块及第二加权块。在确定加权块之后,所述算法可紧接着将所述加权块加在一起,且在将总和移位一值以前又加上舍入值或偏移,此确保除以用以预测B帧的帧的总数目的除法。
运动补偿单元35可实施这些运动补偿双向预测性算法中的每一者以产生代表B帧的双向预测性块的预测性数据。举例来说,运动补偿单元32可根据以下方程式(1)来实施默认加权预测:
pred(i,j)=(pred0(i,j)+pred1(i,j)+1)>>1        (1)。
pred(i,j)指代代表在预测性帧(例如,B帧)的第i行及第j列中的视频块的预测性数据。pred0(i,j)指代代表在第一参考帧的第i行及第j列中的视频块的数据,其中第一参考帧是选自列表0。pred1(i,j)指代代表在第二参考帧的第i行及第j列中的视频块的数据,其中第一参考帧是选自列表1。由于权重相等或大致相等,所以在方程式(1)中加上一且向右移位(>>)一个位会有效地使pred0(i,j)+pred1(i,j)的总和除以二,例如,用以预测B帧的预测性视频块的帧或视频块的总数目。
运动补偿单元35可根据以下方程式(2)来实施第二运动补偿双向预测性算法或显式加权预测:
pred(i,j)=(pred0(i,j)*w0+pred1(i,j)*w1+2r)>>(r+1)+((o1+o2+1)>>1)    (2)。
同样,pred(i,j)、pred0(i,j)及pred1(i,j)中的每一者指代上文关于方程式(1)所描述的相同参考视频块。由于权重经确定且可能不大致相等,所以方程式(2)包括用乘法施加于相应pred0(i,j)及pred1(i,j)的权重w0及w1。“r”变量可表示经选择以确保权重w0及w1产生整数的整数。变量o1及o2各自表示舍入偏移,其中方程式(2)经由使舍入偏移加上一且接着向右移位一(1)而提供舍入偏移o1及o2的平均值。还可在加上舍入偏移的平均值以前移位块的加权总和,以确保除以用以预测B帧的预测性视频块的参考视频帧的总数目的适当除法。
运动补偿单元35可根据以下方程式(3)来实施第三运动补偿双向预测性算法或隐式加权预测:
pred(i,j)=(pred0(i,j)*w0+pred1(i,j)*w1+32)>>6    (3)。
同样,pred(i,j)、pred0(i,j)及pred1(i,j)中的每一者指代上文关于方程式(1)及(2)所描述的相同参考视频块。由于权重经确定且可能不大致相等,所以方程式(3)包括用乘法施加于相应pred0(i,j)及pred1(i,j)的权重w0及w1。值“32”可包含用以确保权重w0及w1为整数的静态舍入偏移,且向右移位(>>)六(6)可表示在给定为32的舍入偏移的情况下有效地使总加权块的总和除以用以预测B帧的预测性视频块的帧的总数目的除法。
根据本发明的技术,运动估计单元32可选择用以确定B帧的运动向量的至少两个帧。确切地说,如上文所描述,参考帧存储装置34可包含存储器以存储被称为列表0的视频数据的第一参考帧集合及被称为列表1的视频数据的第二参考帧集合。列表1及列表0中的参考帧可各自包含I帧或P帧。运动估计单元32可存取参考帧存储装置34且从列表0中选择一个或一个以上参考帧及从列表1中选择一个或一个以上参考帧。以此方式,在一个方面中,运动估计单元32可选择视频数据的至少两个经译码单元(例如,帧)。
运动估计单元32可接着确定预测性B帧的第一块的运动向量。运动估计单元32可识别至少两个参考帧中的第一者中对应于B帧的预测性块的第一对应块,及至少两个参考帧中的第二者中对应于B帧的预测性块的第二对应块。通常,第一帧及第二帧分别在时间上远离第三B帧。通常,第一参考帧驻留于在B帧以前或之前的视频序列中,而第二参考帧驻留于在B帧之后的视频序列中。然而,在一些例子中,第一参考帧及第二参考帧两者均可驻留或出现于在B帧之前或之后的不同时间。在任何情况下,运动估计单元32均可接着基于来自第一参考帧的第一参考块及来自第二参考帧的第二参考块而计算运动向量,第一参考块及第二参考块两者均是相对于预测性B帧的第三预测性块确定。
一旦运动估计单元32已选择待译码的视频块的运动向量,运动补偿单元35便产生与这些运动向量相关联的预测性视频块。运动补偿单元35可根据如上述方程式(1)所表示的默认加权预测性算法而产生B帧的预测性视频块的第一版本。为了进行此操作,运动补偿单元35可从参考帧存储装置34中检索方程式(1)所规定的各种参考块,且实施方程式(1)以产生代表B帧的预测性视频块的预测性数据。紧接着,运动补偿单元35可计算B帧的预测性视频块的第一版本的上述DC偏移值或另一偏移值。
在一个实例中,运动补偿单元35可计算分别与用以预测预测性视频块的第一参考帧及第二参考帧的参考视频块的每一整数及次整数像素位置相关联的第一度量(例如,均值)集合。运动补偿单元35还可计算分别与预测性视频块的每一整数及次整数像素位置相关联的第二度量(例如,均值或亮度值及/或色度值的总和之间的差)集合。运动补偿单元35接着基于第一度量集合及第二度量集合而计算偏移值。运动补偿单元35可(例如)将第一DC偏移计算为针对第一参考视频块及预测性视频块所计算的均值之间的差。运动补偿单元35可紧接着将第二DC偏移计算为针对第二参考视频块及预测性视频块所计算的均值之间的差。运动补偿单元35可接着计算这些第一DC偏移及第二DC偏移的平均值以产生平均DC偏移。偏移值可包含可反映对应视频块的像素值的向上或向下偏离的绝对值或带正负号的值,其同样可能对于指示在视频编码中所遇到的场景改变或闪光非常有用。
换句话说,第一度量集合可包含对应于在给定经译码单元的视频块的每一整数及次整数像素位置处像素值的均值的均值集合。第二度量集合可包含对应于在用以预测在所述经译码单元中正被译码的当前块的预测性块的每一整数及次整数像素位置处像素值的均值的均值集合。多个偏移值可包含第一均值集合与第二均值集合之间的差。每一宏块位置可由单个像素(例如,相应宏块的左上角中的相应像素)定义。然而,每一宏块可定义促成第一均值集合中的特定均值的十六个像素值。当然,也可针对其它大小的视频块计算这些偏移值。
通常,任何给定位置的偏移均可被计算为当前帧(或其它经译码单元)中具有对应于所述像素位置或次像素位置的运动向量精确度的所有像素的均值与对应于所述像素位置或次像素位置的预测性数据的经内插值的均值之间的差。因此,对于预测性数据的每一相应整数、经内插位置或经外推位置,可将每一相应偏移视为经译码单元的像素相对于预测性数据的平均差。
运动补偿单元35可关于亮度块、色度块或此两者来计算偏移值。可针对与每一类型的视频块(例如,亮度块及色度块)相关联的每一整数及次整数像素位置而定义不同偏移。此外,可将不同偏移指派给每一特定大小的每一块、每一块的分区或次分区。
在计算偏移值之后,运动补偿单元35可将各个偏移值中的每一者或平均偏移值与阈值比较。阈值可由视频编码器50的用户计划性地设定或由视频编码器50的硬件设计者静态地设定。在一些例子中,运动补偿单元35可基于第一经译码单元、第二经译码单元及第三经译码单元中的一者或一者以上的各种块的某种分析而自动地(例如,无需任何用户监督或输入)设定阈值。在此方面,运动补偿单元35可在执行比较时自动地调适或修整阈值。然而,通常,设计者或用户将阈值计划性地设定为零(0)。基于此比较,运动补偿单元35可分别根据(例如)方程式(2)或(3)中的任一者而执行显式加权预测或隐式加权预测,以预测B帧的第三块的第二版本。
举例来说,当经计算偏移值或在一些例子中经计算偏移值的绝对值超过阈值时,运动补偿单元35可根据方程式(2)而执行显式加权预测以预测预测性块的第二版本。运动补偿单元35可将默认权重(例如,在默认加权预测期间所使用的权重)用于权重w0及w1以预测B帧的第三或预测性块。此外,在执行显式加权预测时,运动补偿单元35可在一些方面中使用经计算偏移。
当经计算偏移值或在一些例子中经计算偏移值的绝对值不超过(即,小于或等于)阈值时,运动补偿单元35可根据方程式(3)而执行隐式加权预测以预测B帧的预测性视频块的第二版本。如上文关于默认加权预测所描述,运动补偿单元35可从参考帧存储装置34中检索由方程式(2)或(3)所规定的各种参考块。或者,运动补偿单元35可在首先检索各种参考视频块以根据默认加权预测算法(例如,如上文的方程式(1)所表示)而计算预测性视频块的第一版本之后本地高速缓存或以其它方式维持或存储这些参考视频块。
不管B帧的预测性视频块的第二版本是根据显式加权预测还是根据隐式加权预测予以预测,运动补偿单元35均将通过执行默认加权预测所预测的预测性视频块的第一版本与通过执行显式加权预测或隐式加权预测所预测的预测性视频块的第二版本彼此比较,且选择更适当地表示视频的对应部分的版本。为了执行此比较,运动补偿单元35可对第一版本及第二版本执行速率-失真(R-D)分析。如上文所描述,R-D分析可涉及计算版本中的每一者的成本且选择第一版本及第二版本中计算出较低成本所针对的版本。此R-D分析通常平衡速率与失真,或更清楚地说,平衡在编码预测性视频块的第一版本及第二版本时所使用的数据的量相对于某一量化质量等级(例如,失真等级或失真量)。
作为一实例,运动补偿单元35可根据提供拉格朗日(Langrangian)成本函数的以下方程式(4)而使R-D分析基于针对第一版本及第二版本中的每一者所计算的成本:
Fc=d+(λo*R)        (4)。
Fc包含代表成本函数的变量。字母“d”包含代表通过分别将第一版本及第二版本与视频的对应部分比较所计算的第一失真值或第二失真值的变量。运动补偿单元35通常将第一失真及第二失真计算或测量为均方差,以便使峰值信噪比(PSNR)最大化。兰姆达(Lamda)或“λo”包含代表拉格朗日乘数的变量,其为表示针对特定质量等级的位成本与质量之间的关系的值。字母“R”包含代表编码视频的位速率的变量。
运动补偿单元35可因此计算预测性视频块的相应第一版本及第二版本的第一失真值及第二失真值,且存储定义拉格朗日乘数及位速率两者的值的数据。对于第一版本及第二版本中的每一者,运动补偿单元35可根据方程式(4)而确定成本且将这些第一成本及第二成本彼此比较。运动补偿单元35接着基于第一成本与第二成本的比较而选择第一版本及第二版本中的一者。在一些方面中,运动补偿单元35选择第一版本及第二版本中确定出较低成本所针对的版本。
如果运动补偿单元35选择通过显式加权预测算法所预测的第二版本,则运动补偿单元35可将DC偏移值施加于原始预测性视频块以产生偏移预测性视频块,且基于偏移预测性视频块而编码经译码单元的视频块。通过根据预测性块的像素位置(整数位置或多个可能次整数像素位置中的一者)而以基于位置的方式将偏移加到预测性块的像素值,预测性块可更类似于经译码的块,此可改进译码效率。此外,由于偏移值是针对不同像素位置而不同地定义,所以这些偏移值可提供实现与不同类型的内插相关联的数据的译码当中的分段的能力。然而,如果运动补偿单元35选择第一版本或通过隐式加权预测所预测的第二版本,则运动补偿单元35可在不加上经计算偏移值的情况下编码块。以此方式,运动补偿单元35可产生代表B帧的第三或预测性视频块的预测性数据。
视频编码器50接着通过从经译码的原始视频块减去预测数据来形成残余视频块。加法器48表示执行此减法运算的组件。变换单元38将例如离散余弦变换(DCT)或概念上类似的变换的变换应用于残余块,从而产生包含残余变换块系数的视频块。举例来说,变换单元38可执行其它变换,例如,通过H.264标准所定义的变换,其概念上类似于DCT。也可使用子波变换、整数变换、子带变换或其它类型的变换。在任何状况下,变换单元38均将变换应用于残余块,从而产生残余变换系数的块。变换可将残余信息从像素域转换为频域。
量化单元40将残余变换系数量化以进一步减小位速率。量化过程可减小与系数中的一些或全部相关联的位深度。举例来说,可在量化期间将16位值下舍入成15位值。另外,量化单元40还可在第二版本是通过显式加权预测予以预测的状况下使不同偏移量化,以将所要数目的位分配给不同偏移的相应整数部分及分数部分。确切地说,量化单元可针对偏移值中的每一者将第一数目的位指派给给定偏移值的整数部分,且将第二数目的位指派给给定偏移值的分数部分,其中位的第一数目及第二数目是基于整数部分的量值确定。熵译码单元46可与编码第二数目的位不同地编码第一数目的位。
在量化之后,熵译码单元46对经量化变换系数进行熵译码。举例来说,熵译码单元46可执行内容自适应可变长度译码(CAVLC)、上下文自适应二进制算术译码(CABAC)或另一熵译码方法。在熵译码单元46进行的熵译码之后,可将经编码视频发射到另一装置或加以存档以用于稍后发射或检索。经译码位流可包括经熵译码的残余块、这些块的运动向量,及包括识别在经译码单元内的不同整数及次整数像素位置处的多个不同偏移的偏移值的其它语法。
逆量化单元42及逆变换单元44分别应用逆量化及逆变换,以在像素域中重构残余块,例如,用于以上文所描述的方式而稍后用作参考块。求和器51将经重构残余块加到运动补偿单元35所产生的运动补偿预测块,以产生经重构视频块以用于存储于参考帧存储装置34中。经重构视频块可由运动估计单元32及运动补偿单元35使用以作为用以对后续视频帧中的块进行帧间编码的参考块。
以此方式,视频编码器50可实施本发明的技术以有效率地在三种运动补偿双向预测性算法之间进行选择。所述选择是有效的,以致运动补偿单元35仅执行三种运动补偿双向预测性算法中的两者而非执行所有三者,且接着选择三种所得版本中更适当地表示视频数据的版本。所述技术因此不仅通过消除所述算法中的至少一者的执行来促进更有效率的选择,而且还消除额外R-D分析成本函数计算,因为仅第一版本及第二版本为此分析的主题。在此方面,可由视频编码器50实施所述技术以更有效率地在三种运动补偿双向预测性算法之间进行选择。
图3为更详细地说明图2的运动补偿单元35的实例的框图。如图3的实例中所展示,运动补偿单元35耦合到参考帧存储装置34,参考帧存储装置34将上述第一经译码单元或参考帧集合及第二经译码单元或参考帧集合存储为列表0 52A及列表1 52B。运动补偿单元35可首先从参考帧存储装置34中检索至少两个参考帧。通常,运动补偿单元35从列表0 52A中检索至少一个帧及从列表1 52A中检索至少一个帧。列表0 52A及列表152B中的这些帧可在本发明中分别被称为第一参考帧及第二参考帧。通常,运动补偿单元35检索运动估计单元32所指示的第一参考帧及第二参考帧。
如图3中进一步展示,运动补偿单元35包括默认预测模块54、偏移计算模块56、比较器58、显式预测模块60、隐式预测模块62及速率-失真(R-D)分析模块64(“R-D分析模块64”)。默认预测模块54可表示实施上文关于方程式(1)所描述的默认加权预测算法的硬件及/或软件模块。偏移计算模块56可表示以上文所描述的方式来计算例如DC偏移值的偏移值的硬件及/或软件模块。
比较器58可表示将偏移值与阈值(其在图3中展示为阈值66)比较的硬件及/或软件模块。显式预测模块60可表示实施上文关于方程式(2)所描述的显式加权预测算法的硬件及/或软件模块。隐式预测模块62可表示实施上文关于方程式(3)所描述的隐式加权预测算法的硬件及/或软件模块。R-D分析模块64可表示实施上文所描述的R-D分析的硬件及/或软件模块。R-D分析模块64可实施例如方程式(4)所表示的成本函数的成本函数68,且使用成本函数68来计算成本70A及70B(“成本70”)。R-D分析可使所述分析基于这些成本70。
虽然在图3中展示为包含各种模块54到64,但这些模块54到64是出于示范的目的而提供。可将模块54到64中的一者或一者以上实施为运动补偿单元35内的集成模块。或者,运动补偿单元35可通常包含在处理器上执行的软件或计算机程序。在此状况下,各种模块可因此表示较大软件程序的软件模块或组件。软件程序可包含可由处理器执行且使处理器执行本发明中所描述的技术的多个指令。
在任何情况下,在检索或以其它方式接收第一参考帧及第二参考帧之后,运动补偿单元35均可调用或以其它方式使默认预测模块54根据上述方程式(1)而产生代表B帧(或更一般化地,预测性帧)的预测性视频块的第一版本的预测性数据。默认预测模块54可将此第一版本输出到偏移计算模块56,偏移计算模块56可用上文所描述的方式来计算偏移值。即,偏移计算模块56可基于第一版本与第一参考帧及第二参考帧内的原始视频数据或对应块之间的比较而计算偏移值。在一些例子中,偏移计算模块56可确定偏移值的绝对值且输出呈此绝对值形式的这些偏移值。偏移计算模块56可将这些偏移值转发到比较器58,比较器58可将偏移值与阈值66比较。阈值66可经计划性地设定、自动地设定或静态地设定。通常,将阈值66设定为值零(0)。
基于比较,比较器58可将激活代码发出到显式预测模块60及隐式预测模块62两者。激活代码可激活显式预测模块60及隐式预测模块62中的一者或另一者而非此两者。如上述实例中所描述,当偏移值中的一者或一者以上超过阈值66时,比较器58可产生及发射激活显式预测模块60而非隐式预测模块62的激活代码。当偏移值中的一者或一者以上不超过阈值66时,比较器58可产生及发射激活隐式预测模块62而非显式预测模块60的激活代码。
基于激活代码,显式预测模块60或隐式预测模块62产生预测性帧的预测性视频块的第二版本。显式预测模块60或隐式预测模块62中经激活的模块可将此第二版本发射到R-D分析模块64。虽然关于激活代码进行描述,但显式预测模块60或隐式预测模块62的激活可用任何数目种方式发生。在一些实施例中,显式预测模块60及隐式预测模块62两者均可产生预测性视频块的不同版本。在这些实施例中,多路复用器或其它选择逻辑可基于激活代码而从这些不同版本中选择第二版本,且将选定版本或第二版本发射到R-D分析模块64。
不管如何获得或确定第二版本,R-D分析模块64均可在某一点处还接收同一预测性视频块的第一版本。R-D分析模块64可用上文所描述的方式来确定第一版本及第二版本的第一失真值72A及第二失真值72B(“失真72A”及“失真72B”)。R-D分析模块64还可存储或以其它方式维持兰姆达值74(“兰姆达74”)及位速率值76(“速率76”)。R-D分析模块64可提供失真值72A、72B(“失真值72”)中的适当失真值、兰姆达值74及位速率值76以作为对成本函数68的输入,成本函数68输出与第一版本相关联的成本值70A。R-D分析模块64可同样提供失真值72中的适当失真值、兰姆达值74及位速率值76以作为对成本函数68的输入,成本函数68输出与第二版本相关联的成本值70B。
R-D分析模块76可接着将成本70彼此比较以确定成本70中哪一者低于另一者。R-D分析模块76可接着输出计算出成本70中的较低成本所针对的预测性视频块的第一版本或第二版本。R-D分析模块76可输出第一版本及第二版本中此较低成本的版本以作为代表预测性视频块的预测性数据。在一些例子中,如上文所描述,R-D分析模块64输出显式预测模块60所预测的第二版本及偏移计算模块56所计算的偏移值以作为预测性数据。
由于仅必须对第三经译码单元的两种版本而非三种版本执行R-D分析,所以运动补偿单元35可更有效率地编码预测性视频块。此效率可指代计算效率,其还可转化为更有效率的功率消耗。
尽管上文关于预测性视频块进行描述,但所述技术可应用于帧的任何其它部分(例如,片断)以及整个帧。如上文关于方程式(1)到(3)所提及,proj、proj0及proj1变量指代相应参考帧的特定块。所述技术可应用于选自所述帧的作为所述帧的所有块的代表的特定块,且视所选择的版本而定,运动补偿单元35可应用与关于选定参考块所确定的预测性算法相同的预测性算法以编码整个预测性帧。或者,预测性帧的每一个别块可经受本发明中所描述的技术以针对给定预测性帧中的每一预测性块有效率地选择一预测模式。在其它方面中,所述技术可用上文所描述的两种方式中的任一者而在片断等级下应用。因此,不应将本发明中为了执行上文所描述的预测算法中的特定预测算法而参考预测性视频块视为限制性的。相反,对预测性视频块的参考可大体上包括前述实例中的任一者以及未在本发明中明确地描述但通过本发明容易被理解或外推的实例。
图4为说明视频编码器在执行本发明中所描述的技术时的实例操作的流程图。虽然关于图2的特定视频编码器50且更确切地说为视频编码器50的特定组件(例如,图3的运动补偿单元35)进行描述,但所述技术可通过上文关于图1所提及的任何装置以硬件及/或软件进行实施。首先,运动补偿单元35且更确切地说为默认预测模块54(例如)根据上述方程式(1)而执行默认加权预测,以从相应第一参考帧及第二参考帧的第一参考视频块及第二参考视频块产生B帧的预测性视频块的第一版本(78)。如上文所描述,运动补偿单元35可从参考帧存储装置34中检索完整的第一参考帧及第二参考帧或仅检索第一参考视频块及第二参考视频块。默认预测模块54可接着将第一版本传递到偏移计算模块56,偏移计算模块56可计算一个或一个以上偏移值(例如,呈绝对值形式的平均DC偏移值)(80)。偏移计算模块56可接着将这一个或一个以上DC偏移值转发到比较器58。
比较器58可将这一个或一个以上DC偏移值与阈值66比较(82)。基于比较,比较器58可发出激活信号以激活显式预测模块60或隐式预测模块62中的任一者而非此两者。在图4所示的实例操作中,比较器58可在确定DC偏移值超过阈值66(“是”82)后即刻通过激活信号来激活显式预测模块60。然而,在确定DC偏移不超过阈值66(“否”82)后,比较器58即刻可通过激活信号来激活隐式预测模块62。
在DC偏移值超过阈值66且比较器58发出激活信号以激活显式预测模块60的例子中,显式预测模块60(例如)根据上述方程式(2)而执行显式加权预测,以如上文所描述根据第一参考视频块及第二参考视频块产生预测视频块的第二版本(84)。在DC偏移值不超过阈值66且比较器58发出激活信号以激活隐式预测模块62的例子中,隐式预测模块62(例如)根据上述方程式(3)而执行隐式加权预测,以如上文所描述根据第一参考视频块及第二参考视频块产生预测视频块的第二版本(86)。不管显式预测模块60或隐式预测模块62中哪一者产生第二版本,模块60、62中相应经激活的模块均将第二版本传递到R-D分析模块64。
R-D分析模块64还如上文所描述接收预测性视频块的第一版本且选择第一版本及第二版本中的更适当版本(88)。即,R-D分析模块64可(例如)根据上述方程式(4)而执行上文所描述的R-D分析,以分别产生第一版本及第二版本中的每一者的成本70A及70B,且选择第一版本及第二版本中与成本70A、70B中的最低成本相关联的版本。对于给定位速率,此选定版本“更适当地”表示预测视频数据所对应的原始视频数据。运动补偿单元35可接着输出此选定版本,视频编码器22可继续将其编码为预测性B帧的预测性视频块。
在一个方面中,当经计算DC偏移值的绝对值超过阈值时,运动补偿单元35可根据上述方程式(4)而执行R-D分析,以在通过默认加权预测所产生的预测性视频块的第一版本与通过使用默认权重的显式加权预测所产生的同一预测性视频块的第二版本之间进行选择。换句话说,运动补偿单元35可在显式地编码默认权重或不显式地编码默认权重之间进行选择。如上文所提出,此选择的发生是因为:当执行显式加权预测时,运动补偿单元35还可编码经计算DC偏移值。
然而,当经计算DC偏移的绝对值不超过阈值时,运动补偿单元35可根据上述方程式(4)而执行R-D分析,以在通过默认加权预测所产生的预测性视频块的第一版本与通过使用隐式确定权重的隐式加权预测所产生的同一预测性视频块的第二版本之间进行选择。在此方面,运动补偿单元35可确定DC偏移不是编码所必要的,且因此在第一版本与第二版本之间进行选择。由于将此经计算DC偏移与阈值比较,所以换句话说,运动补偿单元35可在执行隐式加权预测与显式加权预测之间进行选择、执行隐式加权预测及显式加权预测中的选定加权预测而不执行隐式加权预测及显式加权预测中的未选定加权预测以产生第二版本,且将预测性视频块编码为第一版本或第二版本。
图5为更详细地说明视频编码器在执行本发明中所描述的技术时的实例操作的流程图。同样,虽然关于图2的特定视频编码器50且更确切地说为视频编码器50的特定组件(例如,图3的运动补偿单元35)进行描述,但所述技术可通过上文关于图1所提及的任何装置以硬件及/或软件进行实施。
首先,如上文所描述,运动补偿单元35从参考帧存储装置34接收两个参考视频数据单元(例如,参考视频块)(100)。或者,运动补偿单元35可接收各自包括两个参考视频数据单元中的一者的两个参考经译码单元(例如,参考帧)。默认预测模块54可用上文(例如)关于方程式(1)所描述的方式使用参考视频块来执行默认加权预测,以根据两个(例如,第一及第二)参考视频块产生预测性视频数据单元(例如,预测性视频块)的第一版本(102、104)。在产生第一版本之后,默认预测模块54可将第一版本输出到偏移计算模块56。
偏移计算模块56可同样用上文所描述的方式来计算预测性视频块的第一版本的偏移值(例如,上文所描述的DC偏移值)(106)。偏移计算模块56可接着将偏移值输出到比较器58,比较器58继续将偏移值与阈值66比较(108)。如果根据经计算偏移值所导出的一个或一个以上、平均值、可能全部或任何其它度量超过阈值66(“是”110),则比较器58可产生及输出激活显式预测模块60而非隐式预测模块62的激活代码。如果根据经计算偏移值所导出的一个或一个以上、平均值、均值、可能全部或任何度量不超过阈值66(“否”110),则比较器58可产生及输出激活隐式预测模块62而非显式预测模块60的激活代码。
如果激活显式预测模块60,则显式预测模块60用上文关于(例如)方程式(2)所描述的方式使用两个参考视频块来执行显式加权预测,以根据两个参考视频块预测或产生预测性视频数据单元(例如,预测性视频块)的第二版本(112、116)。然而,如果激活隐式预测模块62,则隐式预测模块52用上文关于(例如)方程式(3)所描述的方式使用参考视频块来执行隐式加权预测,以根据参考视频块预测或产生预测性视频块的第二版本(114、116)。不管哪一模块产生预测性视频块的第二版本,显式预测模块60或隐式预测模块62均将第二版本输出到R-D分析模块64。
R-D分析模块64还可接收预测性视频块的第一版本且可用上文关于(例如)方程式(4)所描述的方式来执行R-D分析以确定第一成本及第二成本72(118)。R-D分析模块64可接着选择成本72中的较低成本(120)。R-D分析模块64可在选择成本72中的较低成本时选择与成本72中的较低成本相关联的第一版本或第二版本中的任一者,且将与成本72中的较低成本相关联的此版本编码为第三经译码单元(122)。
图6为说明经译码单元124A到124E的实例时间排序序列的图解。即,经译码单元124A按时间出现于经译码单元124B之前,经译码单元124B按时间出现于经译码单元124C之前,经译码单元124C按时间出现于经译码单元124D之前,经译码单元124D按时间又出现于经译码单元124E之前。虽然经译码单元124A到124E(“经译码单元124”)按时间出现于彼此之前,但经译码单元124中的一者或一者以上可在经译码单元124中的另一者之前经编码。举例来说,经译码单元124A及124E各自表示与经译码单元124中的每隔一个经译码单元独立地经译码的I帧(因此,I帧中的“I”),而经译码单元124B及124D各自表示根据经译码单元124中的至少一个其它经译码单元预测性地经编码的P帧(因此,P帧中的“P”)。因此,即使I帧124E出现于P帧124D之后,I帧124E也可按时间在P帧124D之前经译码,因为I帧124E的编码可能不取决于另一帧(其可能经编码或可能仍未经编码)。
在任何情况下,经译码单元124C均可表示根据上文所描述的三种运动补偿双向预测算法中的一者所编码的B帧(因此,B帧中的“B”)。如图3所示,B帧124C的视频数据单元126可根据按时间的先前帧的一部分或视频数据单元(例如,P帧124B的视频数据单元128)及按时间的后续或未来帧的一部分或视频数据单元(例如,P帧124D的视频数据单元130)两者予以预测。虽然描述为根据按时间的第一先前帧124B及按时间的第二后续帧124D予以双向地预测,但视频数据单元104可根据两个后续经译码单元124或两个先前经译码单元124予以双向地预测。视频数据单元126、128及130可各自表示对应视频块,例如,宏块或任何大小的任何其它视频块。对应视频块可包含一对视频块,其彼此类似之处在于:每一块定义(作为一个实例)均值在设定或自适应容差内的像素数据。此外,虽然展示为根据两个直接相邻帧124B及124D予以双向地预测,但视频数据单元126可根据不与B帧124C相邻的帧(例如,经译码单元124A及经译码单元124E)予以双向地预测。在此方面,所述技术不应限于本发明中所提供的实例。
运动估计单元32可定位对应于视频数据单元126的这些部分或视频数据单元128及130,且为了说明性目的起见,确定运动向量132A及132B(“运动向量132”)。运动补偿单元35可通过存取参考帧存储装置34且检索P帧124B及124D(“P帧124”)来接收这些视频数据单元128及130或直接从运动估计单元32接收这些视频数据单元128及130。值得注意的是,P帧124中的一者可包含来自被称为列表052A的帧集合的帧,而P帧124中的另一者可包含来自被称为列表152B的帧集合的帧。
运动补偿单元35可接着实施本发明中所描述的技术,以有效率地选择通过使用部分128及130来仅执行可能三种运动补偿双向预测算法中的两者所产生的视频数据单元126的两种版本中的一者。在此实例中,所述技术是应用于预测经译码单元或B帧124C的一部分或视频数据单元(例如,宏块或任何其它大小的视频块)。无论是应用于一部分(例如,视频数据单元126)还是应用于整个经译码单元(例如,经译码单元124C),所述技术均可有效率地在两种版本而非三种版本之间进行选择。
可用硬件、软件、固件或其任何组合来实施本文中所描述的技术。被描述为模块、单元或组件的任何特征可共同地实施于集成逻辑装置中或分开实施为离散但可交互操作的逻辑装置。在一些状况下,各种特征可实施为集成电路装置,例如,集成电路芯片或芯片组。如果是用软件实施,则可至少部分地通过包含在经执行时使处理器执行上述方法中的一者或一者以上的指令的计算机可读媒体来实现所述技术。
计算机可读媒体可形成可包括封装材料的计算机程序产品的一部分。计算机可读媒体可包含计算机数据存储媒体,例如,随机存取存储器(RAM)、同步动态随机存取存储器(SDRAM)、只读存储器(ROM)、非易失性随机存取存储器(NVRAM)、电可擦除可编程只读存储器(EEPROM)、快闪存储器、磁性或光学数据存储媒体等。另外或或者,可至少部分通过计算机可读通信媒体来实现所述技术,计算机可读通信媒体载运或传达呈指令或数据结构的形式的代码且可通过计算机存取、读取及/或执行。
代码或指令可通过一个或一个以上处理器执行,例如,一个或一个以上DSP、通用微处理器、ASIC、现场可编程逻辑阵列(FPGA)或其它等效集成或离散逻辑电路。因此,如本文中所使用的术语“处理器”可指代上述结构或适于实施本文中所描述的技术的任何其它结构中的任一者。另外,在一些方面中,本文中所描述的功能性可提供于专用软件模块或硬件模块内。本发明还预期包括用以实施本发明中所描述的技术中的一者或一者以上的电路的各种集成电路装置中的任一者。此电路可提供于单个集成电路芯片中或提供于所谓的芯片组中的多个可交互操作的集成电路芯片中。这些集成电路装置可用于各种应用中,所述应用中的一些可包括在无线通信装置(例如,移动电话手持机)中的使用。
已描述本发明的各种实施例。这些及其它实施例是在所附权利要求书的范围内。

Claims (30)

1.一种编码视频数据的方法,所述方法包含:
接收所述视频数据的第一参考经译码单元及第二参考经译码单元,其中所述第一参考经译码单元及第二参考经译码单元中的每一者各自包含相应第一参考视频数据单元及第二参考视频数据单元;
执行默认加权预测以根据所述第一参考视频数据单元及第二参考视频数据单元预测所述视频数据的预测性经译码单元的预测性视频数据单元的第一版本,其中所述两个参考经译码单元中的每一者在时间上出现于所述预测性经译码单元之前或之后;
基于第一参考经译码单元和第二参考经译码单元中的至少一者以及所述预测性视频数据单元,来计算所述预测性视频数据单元的所述第一版本的偏移值;
基于所述经计算偏移值而选择隐式加权预测模式或显式加权预测模式;
执行所述选定模式以根据所述第一参考视频数据单元及第二参考视频数据单元预测所述预测性视频数据单元的第二版本;以及
将所述预测性视频数据单元编码为所述第一版本或所述第二版本。
2.根据权利要求1所述的方法,其进一步包含:
计算所述偏移值的绝对值;以及
将所述偏移值的所述绝对值与阈值比较,
其中选择隐式加权预测模式或显式加权预测模式包含基于所述比较而选择所述隐式加权预测模式或显式加权预测模式以根据所述参考视频数据单元预测所述预测性视频数据单元的所述第二版本。
3.根据权利要求2所述的方法,其中执行所述选定模式包含:
当所述偏移值的所述绝对值超过所述阈值时,执行显式加权预测以根据所述参考视频数据单元预测所述预测性视频数据单元的所述第二版本;以及
当所述偏移值的所述绝对值不超过所述阈值时,执行隐式加权预测以根据所述参考视频数据单元预测所述预测性视频数据单元的所述第二版本。
4.根据权利要求1所述的方法,其进一步包含确定是所述预测性视频数据单元的所述第一版本还是所述预测性视频数据单元的所述第二版本更适当地编码所述视频数据,
其中将所述预测性视频数据单元编码为所述第一版本或所述第二版本包含基于所述确定而将所述预测性视频数据单元编码为所述第一版本或所述第二版本。
5.根据权利要求4所述的方法,其中确定是所述预测性视频数据单元的所述第一版本还是所述预测性视频数据单元的所述第二版本更适当地编码所述视频数据包含:
将所述预测性视频数据单元的所述第一版本及第二版本中的每一者与所述视频数据的对应部分比较以确定第一失真值及第二失真值,其中所述第一失真值及第二失真值各自分别指示通过所述第一版本及第二版本所引入的失真量;
基于所述第一失真值及第二失真值而计算所述预测性视频数据单元的所述第一版本及第二版本的第一成本及第二成本;
比较所述第一成本与第二成本以确定所述成本中哪一者较低;以及
基于所述比较而选择所述第一版本或所述第二版本。
6.根据权利要求5所述的方法,其中计算所述第一成本及第二成本包含根据以下成本函数计算所述第一成本及第二成本中的每一者:
Fc=d+(λ°*R),
其中Fc包含代表所述成本函数的变量,d包含代表所述第一失真值或所述第二失真值的变量,λ°包含代表拉格朗日函数的变量,且R包含代表编码所述视频数据的位速率的变量。
7.根据权利要求1所述的方法,
其中所述第一参考经译码单元按时间出现于所述预测性经译码单元之前,
其中所述第二参考经译码单元按时间出现于所述预测性经译码单元之后,
其中所述预测性经译码单元包含双向预测帧B帧,且
其中所述第一参考经译码单元及第二参考经译码单元各自包含独立译码帧I帧、预测帧P帧或另一B帧中的一者。
8.根据权利要求1所述的方法,
其中接收所述第一参考经译码单元及第二参考经译码单元包含接收包括第一参考视频块的第一参考帧及包括第二参考视频块的第二参考帧,
其中执行所述默认加权预测包含执行所述默认加权预测以根据所述第一参考视频块及第二参考视频块预测预测性帧的预测性视频块的第一版本,其中所述第一参考帧及第二参考帧按时间出现于所述预测性视频帧之前或之后,
其中计算所述偏移值包含计算所述预测性帧的所述预测性视频块的所述第一版本的所述偏移值,
其中基于所述经计算偏移值而选择所述隐式加权预测模式或显式加权预测模式包含基于所述经计算偏移值而选择所述隐式加权预测模式或显式加权预测模式,
其中执行所述选定模式包含执行所述选定模式以根据所述第一参考视频块及第二参考视频块预测所述预测性帧的所述预测性视频块的第二版本,且
其中编码所述预测性视频数据单元包含将所述预测性帧的所述预测性视频块编码为所述第一版本或所述第二版本。
9.根据权利要求1所述的方法,其中编码所述预测性视频数据单元包含:当所述预测性视频数据单元的所述第二版本包含使用所述显式加权预测所预测的所述第二版本时,将所述预测性视频数据单元编码为所述预测性视频数据单元的所述第二版本及除了所述第二版本以外的所述偏移值。
10.根据权利要求1所述的方法,其中通过视频编码器或视频编解码器CODEC执行所述方法。
11.一种编码视频数据的设备,所述设备包含视频编码器,所述视频编码器包括:
存储器,其存储第一参考经译码单元及第二参考经译码单元,其中所述第一参考经译码单元包括第一参考视频数据单元且所述第二参考经译码单元包括第二参考视频数据单元;以及
运动补偿单元,其执行默认加权预测以:根据所述第一参考视频数据单元及第二参考视频数据单元预测所述视频数据的预测性经译码单元的预测性视频数据单元的第一版本,其中所述两个参考经译码单元中的每一者在时间上出现于所述预测性经译码单元之前或之后;基于第一参考经译码单元和第二参考经译码单元中的至少一者以及所述预测性视频数据单元,来计算所述预测性视频数据单元的所述第一版本的偏移值;基于所述经计算偏移值而选择隐式加权预测模式或显式加权预测模式;执行所述选定模式以根据所述第一参考视频数据单元及第二参考视频数据单元预测所述预测性视频数据单元的第二版本;及将所述预测性视频数据单元编码为所述第一版本或所述第二版本。
12.根据权利要求11所述的设备,其中所述运动补偿单元包含:
偏移计算模块,其计算所述偏移值的绝对值;以及
比较器,其将所述偏移值的所述绝对值与阈值比较,
其中所述运动补偿单元基于所述比较而选择所述隐式加权预测模式或显式加权预测模式。
13.根据权利要求12所述的设备,其中所述运动补偿单元包含:
显式预测模块,其在所述偏移值的所述绝对值超过所述阈值时执行显式加权预测以根据所述参考视频数据单元预测所述预测性视频数据单元的所述第二版本;以及
隐式预测模块,其在所述偏移值的所述绝对值不超过所述阈值时执行隐式加权预测以根据所述参考视频数据单元预测所述预测性视频数据单元的所述第二版本。
14.根据权利要求11所述的设备,其中所述运动补偿单元包括分析模块,所述分析模块确定是所述预测性视频数据单元的所述第一版本还是所述预测性视频数据单元的所述第二版本更适当地编码所述视频数据,
其中所述运动补偿单元基于所述确定而将所述预测性视频数据单元编码为所述第一版本或所述第二版本。
15.根据权利要求14所述的设备,其中所述分析模块包含速率-失真R-D分析模块,所述R-D分析模块进行以下动作:将所述预测性视频数据单元的所述第一版本及第二版本中的每一者与所述视频数据的对应部分比较以确定第一失真值及第二失真值,其中所述第一失真值及第二失真值各自分别指示通过所述第一版本及第二版本所引入的失真量;基于所述第一失真值及第二失真值而计算所述预测性视频数据单元的所述第一版本及第二版本的第一成本及第二成本;比较所述第一成本与第二成本以确定所述成本中哪一者较低;及基于所述比较而选择所述第一版本或所述第二版本。
16.根据权利要求15所述的设备,其中所述R-D分析模块根据以下成本函数计算所述第一成本及第二成本中的每一者:
Fc=d+(λ°*R),
其中Fc包含代表所述成本函数的变量,d包含代表所述第一失真值或所述第二失真值的变量,λ°包含代表拉格朗日函数的变量,且R包含代表编码所述视频数据的位速率的变量。
17.根据权利要求11所述的设备,
其中第一参考经译码单元按时间出现于所述预测性经译码单元之前,
其中第二参考经译码单元按时间出现于所述预测性经译码单元之后,
其中所述预测性经译码单元包含双向预测帧B帧,且
其中所述第一参考经译码单元及第二参考经译码单元各自包含独立译码帧I帧、预测帧P帧或另一B帧中的一者。
18.根据权利要求11所述的设备,
其中所述第一参考经译码单元及第二参考经译码单元分别包含第一参考帧及第二参考帧,
其中所述第一参考视频数据单元及第二参考视频数据单元分别包含来自所述第一参考帧的第一参考视频块及来自所述第二参考帧的第二参考视频块,
其中所述运动补偿单元包括:
默认预测模块,其执行所述默认加权预测以根据所述第一参考视频块及第二参考视频块预测预测性帧的预测性视频块的第一版本,其中所述第一参考帧及第二参考帧按时间出现于所述预测性视频帧之前或之后;
偏移计算模块,其计算所述预测性帧的所述预测性视频块的所述第一版本的所述偏移值;
隐式预测模块,其实施所述隐式加权预测;以及
显式预测模块,其实施所述显式加权预测,其中基于所述经计算偏移值,所述隐式预测模块或显式预测模块执行所述隐式加权预测或显式加权预测以根据所述第一参考视频块及第二参考视频块预测所述预测性帧的所述预测性视频块的第二版本,且
其中所述运动补偿单元将所述预测性帧的所述预测性视频块编码为所述第一版本或所述第二版本。
19.根据权利要求11所述的设备,其中所述运动补偿单元进一步在所述预测性视频数据单元的所述第二版本包含使用所述显式加权预测所预测的所述第二版本时将所述预测性视频数据单元编码为所述预测性视频数据单元的所述第二版本及除了所述第二版本以外的所述偏移值。
20.根据权利要求11所述的设备,其中设备包含视频编码器硬件或视频编解码器CODEC硬件。
21.一种编码视频数据的装置,所述装置包含:
用于编码视频数据的装置,其中所述用于编码视频数据的装置包括:
用于存储所述视频数据的第一参考经译码单元及第二参考经译码单元的装置,其中所述第一参考经译码单元包括第一参考视频数据单元且所述第二参考经译码单元包括第二参考视频数据单元;
用于执行默认加权预测以根据所述第一参考视频数据单元及第二参考视频数据单元预测所述视频数据的预测性经译码单元的预测性视频数据单元的第一版本的装置,其中所述两个参考经译码单元中的每一者在时间上出现于所述预测性经译码单元之前或之后;
用于基于第一参考经译码单元和第二参考经译码单元中的至少一者以及所述预测性视频数据单元,来计算所述预测性视频数据单元的所述第一版本的偏移值的装置;
用于基于所述经计算偏移值而执行隐式加权预测或显式加权预测而非此两者以根据所述第一参考视频数据单元及第二参考视频数据单元预测所述预测性视频数据单元的第二版本的装置;以及
用于将所述预测性视频数据单元编码为所述第一版本或所述第二版本的装置。
22.根据权利要求21所述的装置,其中所述用于计算的装置进一步包含:
用于计算所述偏移值的绝对值的装置;以及
用于将所述偏移值的所述绝对值与阈值比较的装置,
其中所述用于执行所述隐式加权预测或显式加权预测的装置基于所述比较而执行所述隐式加权预测或显式加权预测以根据所述参考视频数据单元预测所述预测性视频数据单元的所述第二版本。
23.根据权利要求22所述的装置,其中所述用于执行所述隐式加权预测或显式加权预测的装置包含:
用于在所述偏移值的所述绝对值超过所述阈值时执行所述显式加权预测以根据所述参考视频数据单元预测所述预测性视频数据单元的所述第二版本的装置;以及
用于在所述偏移值的所述绝对值不超过所述阈值时执行所述隐式加权预测以根据所述参考视频数据单元预测所述预测性视频数据单元的所述第二版本的装置。
24.根据权利要求21所述的装置,其进一步包含:
用于确定是所述预测性视频数据单元的所述第一版本还是所述预测性视频数据单元的所述第二版本更适当地编码所述视频数据的装置,
其中所述用于将所述预测性视频数据单元编码为所述第一版本或所述第二版本的装置基于所述确定而将所述预测性视频数据单元编码为所述第一版本或所述第二版本。
25.根据权利要求24所述的装置,其中所述用于确定是所述预测性视频数据单元的所述第一版本还是所述预测性视频数据单元的所述第二版本更适当地编码所述视频数据的装置包含:
用于将所述预测性视频数据单元的所述第一版本及第二版本中的每一者与所述视频数据的对应部分比较以确定第一失真值及第二失真值的装置,其中所述第一失真值及第二失真值各自分别指示通过所述第一版本及第二版本所引入的失真量;
用于基于所述第一失真值及第二失真值而计算所述预测性视频数据单元的所述第一版本及第二版本的第一成本及第二成本的装置;
用于比较所述第一成本与第二成本以确定所述成本中哪一者较低的装置;以及
用于基于所述比较而选择所述第一版本或所述第二版本的装置。
26.根据权利要求25所述的装置,其中所述用于计算所述第一成本及所述第二成
本的装置根据以下成本函数计算所述第一成本及第二成本中的每一者:
Fc=d+(λ°*R),
其中Fc包含代表所述成本函数的变量,d包含代表所述第一失真值或所述第二失真值的变量,λ°包含代表拉格朗日函数的变量,且R包含代表编码所述视频数据的位速率的变量。
27.根据权利要求21所述的装置,
其中所述第一参考经译码单元按时间出现于所述预测性经译码单元之前,
其中所述第二参考经译码单元按时间出现于所述预测性经译码单元之后,
其中所述预测性经译码单元包含双向预测帧B帧,且
其中所述第一参考经译码单元及第二参考经译码单元各自包含独立译码帧I帧、预测帧P帧或另一B帧中的一者。
28.根据权利要求21所述的装置,
其中所述用于存储所述第一参考经译码单元及第二不同参考经译码单元的装置存储包括第一参考视频块的第一参考帧及包括第二参考视频块的第二参考帧,
其中所述用于执行所述默认加权预测的装置执行所述默认加权预测以根据所述第一参考视频块及第二参考视频块预测预测性帧的预测性视频块的第一版本,其中所述第一参考帧及第二参考帧按时间出现于所述预测性视频帧之前或之后,
其中所述用于计算所述偏移值的装置计算所述预测性帧的所述预测性视频块的所述第一版本的所述偏移值,
其中所述用于基于所述经计算偏移值而执行所述隐式加权预测或显式加权预测的装置基于所述经计算偏移值而执行所述隐式加权预测或显式加权预测以根据所述第一参考视频块及第二参考视频块预测所述预测性帧的所述预测性视频块的第二版本,且
其中所述用于编码所述预测性视频数据单元的装置将所述预测性帧的所述预测性视频块编码为所述第一版本或所述第二版本。
29.根据权利要求21所述的装置,其中所述用于编码所述预测性视频数据单元的装置在所述预测性视频数据单元的所述第二版本包含使用所述显式加权预测所预测的所述第二版本时将所述预测性视频数据单元编码为所述预测性视频数据单元的所述第二版本及除了所述第二版本以外的所述偏移值。
30.根据权利要求21所述的装置,其中所述装置是通过视频编码器硬件或视频编
解码器CODEC硬件执行。
CN200980139697.8A 2008-10-06 2009-10-06 有效率的预测模式选择 Active CN102172027B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US10310008P 2008-10-06 2008-10-06
US61/103,100 2008-10-06
US12/424,472 2009-04-15
US12/424,472 US8831087B2 (en) 2008-10-06 2009-04-15 Efficient prediction mode selection
PCT/US2009/059698 WO2010042518A1 (en) 2008-10-06 2009-10-06 Efficient prediction mode selection

Publications (2)

Publication Number Publication Date
CN102172027A CN102172027A (zh) 2011-08-31
CN102172027B true CN102172027B (zh) 2014-03-12

Family

ID=42075794

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200980139697.8A Active CN102172027B (zh) 2008-10-06 2009-10-06 有效率的预测模式选择

Country Status (9)

Country Link
US (1) US8831087B2 (zh)
EP (1) EP2345255B1 (zh)
JP (1) JP5175397B2 (zh)
KR (1) KR101221247B1 (zh)
CN (1) CN102172027B (zh)
ES (1) ES2663691T3 (zh)
HU (1) HUE036438T2 (zh)
TW (1) TWI399098B (zh)
WO (1) WO2010042518A1 (zh)

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007525072A (ja) * 2003-06-25 2007-08-30 トムソン ライセンシング 置換されたフレーム差を使用する重み付き予測推定の方法と装置
US8385404B2 (en) 2008-09-11 2013-02-26 Google Inc. System and method for video encoding using constructed reference frame
US8711930B2 (en) * 2009-07-09 2014-04-29 Qualcomm Incorporated Non-zero rounding and prediction mode selection techniques in video encoding
US8995526B2 (en) * 2009-07-09 2015-03-31 Qualcomm Incorporated Different weights for uni-directional prediction and bi-directional prediction in video coding
US9161057B2 (en) 2009-07-09 2015-10-13 Qualcomm Incorporated Non-zero rounding and prediction mode selection techniques in video encoding
KR101064883B1 (ko) * 2009-10-06 2011-09-16 한국과학기술원 왜곡 측정 방법
JPWO2011078002A1 (ja) * 2009-12-22 2013-05-02 ソニー株式会社 画像処理装置および方法、並びにプログラム
US9521424B1 (en) * 2010-10-29 2016-12-13 Qualcomm Technologies, Inc. Method, apparatus, and manufacture for local weighted prediction coefficients estimation for video encoding
US8428375B2 (en) * 2010-11-17 2013-04-23 Via Technologies, Inc. System and method for data compression and decompression in a graphics processing system
US10045046B2 (en) 2010-12-10 2018-08-07 Qualcomm Incorporated Adaptive support for interpolating values of sub-pixels for video coding
US20120163460A1 (en) * 2010-12-23 2012-06-28 Qualcomm Incorporated Sub-pixel interpolation for video coding
KR20130099242A (ko) * 2011-01-07 2013-09-05 노키아 코포레이션 비디오 코딩의 움직임 예측
EP2663078A4 (en) * 2011-01-07 2015-02-11 Samsung Electronics Co Ltd VIDEO PRESENTATION METHOD FOR CARRYING OUT BILATERAL PREDICTIONS AND UNILATERAL PREDICTIONS AND DEVICE THEREFOR, VIDEO CODING METHOD AND DEVICE THEREFOR AND VIDEO DECODING METHOD AND DEVICE THEREFOR
US8548057B2 (en) * 2011-01-25 2013-10-01 Microsoft Corporation Video coding redundancy reduction
KR20120095611A (ko) * 2011-02-21 2012-08-29 삼성전자주식회사 다시점 비디오 부호화/복호화 방법 및 장치
US9154799B2 (en) 2011-04-07 2015-10-06 Google Inc. Encoding and decoding motion via image segmentation
US8638854B1 (en) 2011-04-07 2014-01-28 Google Inc. Apparatus and method for creating an alternate reference frame for video compression using maximal differences
JP5768491B2 (ja) * 2011-05-17 2015-08-26 ソニー株式会社 画像処理装置および方法、プログラム、並びに記録媒体
MX2014000159A (es) 2011-07-02 2014-02-19 Samsung Electronics Co Ltd Metodo y aparato para la codificacion de video, y metodo y aparato para la decodificacion de video acompañada por inter prediccion utilizando imagen co-localizada.
US9451287B2 (en) 2011-11-08 2016-09-20 Qualcomm Incorporated Context reduction for context adaptive binary arithmetic coding
EP3672238B1 (en) 2011-11-08 2023-06-07 Kabushiki Kaisha Toshiba Image decoding method and image encoding method
US9253481B2 (en) * 2012-01-13 2016-02-02 Qualcomm Incorporated Determining contexts for coding transform coefficient data in video coding
JP6012014B2 (ja) * 2012-03-30 2016-10-25 サン パテント トラスト 画像符号化方法および画像復号方法
EP2842337B1 (en) 2012-04-23 2019-03-13 Google LLC Managing multi-reference picture buffers for video data coding
US9609341B1 (en) 2012-04-23 2017-03-28 Google Inc. Video data encoding and decoding using reference picture lists
US9014266B1 (en) 2012-06-05 2015-04-21 Google Inc. Decimated sliding windows for multi-reference prediction in video coding
US9749645B2 (en) 2012-06-22 2017-08-29 Microsoft Technology Licensing, Llc Coded-block-flag coding and derivation
US9756331B1 (en) 2013-06-17 2017-09-05 Google Inc. Advance coded reference prediction
WO2017086738A1 (ko) 2015-11-19 2017-05-26 한국전자통신연구원 영상 부호화/복호화 방법 및 장치
KR20170058838A (ko) 2015-11-19 2017-05-29 한국전자통신연구원 화면간 예측 향상을 위한 부호화/복호화 방법 및 장치
CN107920254B (zh) * 2016-10-11 2019-08-30 北京金山云网络技术有限公司 一种针对b帧的运动估计方法、装置及视频编码器
US20180332298A1 (en) * 2017-05-10 2018-11-15 Futurewei Technologies, Inc. Bidirectional Prediction In Video Compression
US11394989B2 (en) * 2018-12-10 2022-07-19 Tencent America LLC Method and apparatus for video coding

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1833261A1 (en) 2002-01-18 2007-09-12 Kabushiki Kaisha Toshiba Video encoding method and apparatus and video decoding method and apparatus
EP1980112B1 (en) 2006-02-02 2012-10-24 Thomson Licensing Method and apparatus for adaptive weight selection for motion compensated prediction
JP4867497B2 (ja) * 2006-06-21 2012-02-01 ソニー株式会社 情報処理装置および方法、復号装置および方法、プログラム、並びに情報処理システム
CN101529920B (zh) 2006-10-18 2013-10-02 汤姆森特许公司 在没有明确的信号通知的情况下的局部照度和色彩补偿

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Adaptive Weighted Prediction in Video Coding;Yanfei Shen等;《2004 IEEE International Conference on Multimedia and Expo (ICME)》;20041231;第428页第1栏第3-6行、图2 *
Yanfei Shen等.Adaptive Weighted Prediction in Video Coding.《2004 IEEE International Conference on Multimedia and Expo (ICME)》.2004,第428页第1栏第3-6行、图2.

Also Published As

Publication number Publication date
EP2345255B1 (en) 2018-01-24
HUE036438T2 (hu) 2018-07-30
JP2012505601A (ja) 2012-03-01
CN102172027A (zh) 2011-08-31
US20100086027A1 (en) 2010-04-08
TWI399098B (zh) 2013-06-11
TW201031220A (en) 2010-08-16
KR20110063864A (ko) 2011-06-14
ES2663691T3 (es) 2018-04-16
WO2010042518A1 (en) 2010-04-15
JP5175397B2 (ja) 2013-04-03
KR101221247B1 (ko) 2013-01-11
EP2345255A1 (en) 2011-07-20
US8831087B2 (en) 2014-09-09

Similar Documents

Publication Publication Date Title
CN102172027B (zh) 有效率的预测模式选择
CN102474621B (zh) 视频编码中的非零舍入与预测模式选择技术
CN102474623B (zh) 在视频编码中的非零舍入及预测模式选择方法
CN101946515B (zh) Cabac译码器的二回合量化
CN102474600B (zh) 解码视频数据的方法、装置和设备
CN101911702B (zh) 针对支持cabac的视频编码过程而量化视频块的系数的方法和装置
EP2684356B1 (en) MOTION VECTOR PREDICTORS (MVPs) FOR BI-PREDICTIVE INTER MODE IN VIDEO CODING
CN103179395B (zh) 用于上下文自适应可变长度译码(cavlc)的速率-失真量化
RU2547239C2 (ru) Зависящее от режима сканирование коэффициентов блока видеоданных
CN102783150B (zh) 视频译码中的块类型信令
CN105659603B (zh) 编码及解码视频数据的方法、装置及计算机可读存储媒体
CN102113329A (zh) 在视频译码中基于压缩域中相似性量度的智能型跳帧
JP2010525658A (ja) イントラ予測のための適応参照画像データ生成
KR20120042910A (ko) 비디오 코딩을 위한 템플릿 매칭
CN103004196A (zh) 在经压缩位流中包含切换式内插滤波器系数
KR20120039675A (ko) 이미지 시퀀스를 나타내는 코딩된 데이터의 스트림을 디코딩하는 방법 및 이미지 시퀀스를 코딩하는 방법
WO2015057570A1 (en) Multi-threaded video encoder
KR101693284B1 (ko) 전역움직임을 기반하여 결정된 부호화구조를 이용한 영상 부호화/복호화 방법 및 장치
Lonetti et al. Temporal video transcoding for multimedia services
Park Design and Analysis of Low Complexity Video Coding for Realtime Communications
KR20150139354A (ko) 비디오 부호화/복호화를 위한 인터 예측 방법 및 장치

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant