CN103039074A - Gpb帧中的双向运动向量的联合译码 - Google Patents

Gpb帧中的双向运动向量的联合译码 Download PDF

Info

Publication number
CN103039074A
CN103039074A CN2011800366008A CN201180036600A CN103039074A CN 103039074 A CN103039074 A CN 103039074A CN 2011800366008 A CN2011800366008 A CN 2011800366008A CN 201180036600 A CN201180036600 A CN 201180036600A CN 103039074 A CN103039074 A CN 103039074A
Authority
CN
China
Prior art keywords
motion vector
reference picture
motion
video
picture list
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2011800366008A
Other languages
English (en)
Other versions
CN103039074B (zh
Inventor
钱威俊
马尔塔·卡切维奇
陈培松
王翔林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of CN103039074A publication Critical patent/CN103039074A/zh
Application granted granted Critical
Publication of CN103039074B publication Critical patent/CN103039074B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/109Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/114Adapting the group of pictures [GOP] structure, e.g. number of B-frames between two anchor frames
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/115Selection of the code volume for a coding unit prior to coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/162User input
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/177Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a group of pictures [GOP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/573Motion compensation with multiple frame prediction using two or more reference frames in a given prediction direction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/577Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明涉及用于减少视频译码中译码预测信息的成本的技术。使用从相同的两个单独参考图片列表中的参考图片所计算的高达两个运动向量来编码广义P/B GPB帧中的视频块。因此,可使用双向预测模式通过来自第一参考图片列表中的参考图片的第一运动向量及来自第二参考图片列表中的相同或实质上类似的参考图片的第二运动向量来编码GPB帧的视频块。所述技术包括联合地译码GPB帧的视频块的第一运动向量及第二运动向量。所述技术包括相对于从相邻块的运动向量所产生的第一运动预测子译码所述第一运动向量,及相对于所述第一运动向量译码所述第二运动向量。

Description

GPB帧中的双向运动向量的联合译码
技术领域
本发明涉及视频译码,且更确切地说,涉及视频帧间译码技术。
背景技术
数字视频能力可并入到广泛范围的装置中,所述装置包括数字电视、数字直播系统、无线广播系统、个人数字助理(PDA)、膝上型或桌上型计算机、数字相机、数字记录装置、数字媒体播放器、视频游戏装置、视频游戏控制台、蜂窝式或卫星无线电电话、视频电传会议装置及其类似者。数字视频装置实施例如描述于以下各者中的技术的视频压缩技术以较有效地传输及接收数字视频信息:由MPEG-2、MPEG-4、ITU-T H.263、ITU-TH.264/MPEG-4第10部分(高级视频译码(AVC))定义的标准或新兴高效率视频译码(HEVC)标准及这些标准的扩展。
视频压缩技术执行空间预测及/或时间预测以减小或移除视频序列中所固有的冗余。对于基于块的视频译码来说,可将视频帧或片段划分成若干视频块或若干译码单元(CU)。使用相对于相邻块的空间预测来编码帧内译码(I)的帧或片段中的视频块。帧间译码(P或B)帧或片段中的视频块可使用相对于同一帧或片段中的相邻块的空间预测或相对于其它参考图片的时间预测。使用双向预测以从两个不同参考图片列表(传统上,过去图片的一个列表及未来图片的一个列表)计算两个运动向量来编码经双向预测(B)的帧中的视频块。使用单向预测以从单一参考图片列表(传统上,过去图片的一列表)计算单一运动向量来编码经单向预测(P)的帧中的视频块。
发明内容
总地来说,本发明涉及用于减少视频译码中译码预测信息的成本的技术。可使用单向预测模式通过来自第一参考图片列表及第二参考图片列表中的一者中的参考图片的运动向量,或使用双向预测模式通过来自所述第一参考图片列表中的参考图片的第一运动向量及来自所述第二参考图片列表中的参考图片的第二运动向量来译码帧间译码的视频帧的视频块。在新兴HEVC标准中,引入可为双向预测(B)的帧概念的特殊状况的广义P/B(GPB)帧。使用从相同的两个单独参考图片列表中的参考图片所计算的高达两个运动向量来编码GPB帧中的视频块。因此,可使用所述双向预测模式通过来自相同参考图片或实质上类似的参考图片的两个运动向量来编码GPB帧的一个或一个以上视频块。参考图片列表可替代地称作参考帧列表。
本发明的技术包括联合地译码GPB帧的视频块的第一运动向量及第二运动向量。可将指示经译码视频块的运动向量信息的一个或一个以上语法元素用信号发送到视频解码器。所述技术包括相对于从相邻块的运动向量所产生的第一运动预测子译码第一运动向量,及相对于所述第一运动向量译码第二运动向量。以此方式,可将第二运动向量译码为第一运动向量与第二运动向量之间的差。因此,所述技术可通过减少或消除常规地用以表示第二运动向量的语法元素而减少用以用信号发送运动向量信息的位。
在一个实例中,本发明是针对一种译码视频数据的方法,所述方法包含:存储第一参考图片列表及第二参考图片列表,其中所述第一参考图片列表与所述第二参考图片列表相同;使用双向预测通过来自所述第一参考图片列表中的参考图片的第一运动向量及来自所述第二参考图片列表中的参考图片的第二运动向量来译码指定为广义P/B(GPB)帧的视频帧的视频块;及联合地译码所述视频块的所述第一运动向量及所述第二运动向量。
在另一实例中,本发明是针对一种视频译码装置,所述视频译码装置包含:存储器,所述存储器存储第一参考图片列表及第二参考图片列表,其中所述第一参考图片列表与所述第二参考图片列表相同;及处理器,所述处理器使用双向预测模式通过来自所述第一参考图片列表中的参考图片的第一运动向量及来自所述第二参考图片列表中的参考图片的第二运动向量来译码指定为广义P/B(GPB)帧的视频帧的视频块,且联合地译码所述视频块的所述第一运动向量及所述第二运动向量。
在另一实例中,本发明是针对一种视频译码装置,所述视频译码装置包含:用于存储第一参考图片列表及第二参考图片列表的装置,其中所述第一参考图片列表与所述第二参考图片列表相同;用于使用双向预测模式通过来自所述第一参考图片列表中的参考图片的第一运动向量及来自所述第二参考图片列表中的参考图片的第二运动向量来译码指定为广义P/B(GPB)帧的视频帧的视频块的装置;及用于联合地译码所述视频块的所述第一运动向量及所述第二运动向量的装置。
在另一实例中,本发明是针对一种包含用于译码视频数据的指令的计算机可读存储媒体,所述指令在于处理器中执行时使所述处理器:存储第一参考图片列表及第二参考图片列表,其中所述第一参考图片列表与所述第二参考图片列表相同;使用双向预测通过来自所述第一参考图片列表的第一运动向量及来自所述第二参考图片列表的第二运动向量来译码指定为广义P/B(GPB)帧的视频帧的视频块;及联合地译码所述视频块的所述第一运动向量及所述第二运动向量。
附图说明
图1为说明实例视频编码及解码系统的框图,所述视频编码及解码系统可利用用于有效地译码视频帧的视频块的预测信息的技术。
图2为说明包括GPB帧的实例视频序列的概念图。
图3为说明实例视频编码器的框图,所述视频编码器可实施用于有效地译码视频帧的视频块的预测信息的技术。
图4为说明实例视频解码器的框图,所述视频解码器可实施用于有效地译码视频帧的视频块的预测信息的技术。
图5为说明编码指示使用单向预测模式来译码GPB帧的视频块的单一位语法元素的实例操作的流程图。
图6为说明解码指示使用单向预测模式来译码GPB帧的视频块的单一位语法元素的实例操作的流程图。
图7为说明使用小于两个位来编码指示使用相对于参考图片列表中的参考图片的单向预测模式来译码视频块的一个或一个以上语法元素的实例操作的流程图。
图8为说明使用小于两个位来编码指示使用相对于参考图片列表中的参考图片的单向预测模式来译码视频块的一个或一个以上语法元素的另一实例操作的流程图。
图9为说明联合地译码使用双向预测模式而编码的GPB帧的视频块的第一运动向量及第二运动向量的实例操作的流程图。
具体实施方式
本发明涉及用于减少视频译码中译码预测信息的成本的技术。可使用单向预测模式通过相对于第一参考图片列表及第二参考图片列表中的一者中的参考图片的单一运动向量,或使用双向预测模式通过相对于第一参考图片列表中的参考图片的第一运动向量及相对于第二参考图片列表中的参考图片的第二运动向量来译码帧间译码帧的视频块。在某些实例中,本发明具体来说涉及启用广义P/B(GPB)帧以使得第一参考图片列表与第二参考图片列表相同的状况。一般来说,参考图片列表可替代地称作参考帧列表。
本发明的技术包括减少用以用信号发送指示视频块的运动预测方向的一个或一个以上语法元素的位。当参考图片列表中的一者比另一参考图片列表优选时,默认将所述优选参考图片列表用于单向预测模式可能更有效。当启用GPB帧时,情况尤其如此。在所述状况下,所述两个相同参考图片列表中的任一者可用于单向预测模式。本发明的技术包括使用小于两个位来译码指示使用相对于参考图片列表中的参考图片的单向预测模式及双向预测模式中的一者来译码视频块的一个或一个以上语法元素。
本发明的技术还包括减少用以用信号发送使用双向预测模式而编码的视频块的运动向量信息的位。可使用双向预测模式通过来自相同参考图片或实质上类似的参考图片的两个运动向量来编码GPB帧的一个或一个以上块。本发明的技术可包括联合地译码GPB帧的视频块的第一运动向量与第二运动向量。
图1为说明实例视频编码及解码系统10的框图,所述视频编码及解码系统10可利用用于有效地译码视频帧的视频块的预测信息的技术。如图1中所展示,系统10包括源装置12,所述源装置12经由通信信道16将经编码的视频传输到目的地装置14。源装置12及目的地装置14可包含广泛范围的装置中的任一者。在一些状况下,源装置12及目的地装置14可包含可经由通信信道16传达视频信息的无线通信装置,在此种状况下,通信信道16为无线信道。
然而,本发明的技术(所述技术涉及有效地译码视频块的预测信息)不必限于无线应用或设定。举例来说,这些技术可适用于空中电视广播、有线电视传输、卫星电视传输、因特网视频传输、编码于存储媒体上的经编码的数字视频,或其它情形。因此,通信信道16可包含适于传输经编码的视频数据的无线或有线媒体的任何组合,且装置12、14可包含多种有线或无线媒体装置中的任一者,例如,移动电话、智能电话、数字媒体播放器、机顶盒、电视、显示器、桌上型计算机、便携型计算机、平板计算机、游戏控制台、便携型游戏装置,或其类似者。
在图1的实例中,源装置12包括视频源18、视频编码器20、调制器/解调器(调制解调器)22及发射器24。目的地装置14包括接收器26、调制解调器28、视频解码器30及显示装置32。在其它实例中,源装置及目的地装置可包括其它组件或布置。举例来说,源装置12可从例如外部相机、视频存储档案、计算机图形源或其类似者的外部视频源18接收视频数据。同样,目的地装置14可与外部显示装置介接,而非包括集成式显示装置。
图1所说明的系统10仅为一个实例。可通过任何数字视频编码及/或解码装置来执行用于有效地译码视频块的预测信息的技术。也可通过视频编码器/解码器(通常称作“编解码器(CODEC)”)来执行所述技术。此外,也可通过视频预处理器执行本发明的技术。源装置12及目的地装置14仅为这些译码装置的实例,其中源装置12产生用于传输到目的地装置14的经译码的视频数据。在一些实例中,装置12、14可以实质上对称的方式操作,使得装置12、14中的每一者包括视频编码及解码组件。因此,系统10可支持视频装置12、14之间的单向或双向视频传输,以(例如)用于视频串流传输、视频回放、视频广播或视频电话。
源装置12的视频源18可包括视频俘获装置,例如,摄像机、含有先前俘获的视频的视频档案,及/或来自视频内容提供者的视频馈送。作为另一替代例,视频源18可产生基于计算机图形的数据作为源视频,或实况视频、经存档的视频与计算机产生的视频的组合。在一些状况下,如果视频源18为摄像机,则源装置12与目的地装置14可形成所谓的相机电话或视频电话。然而,如上文所提及,本发明中所描述的技术可一般性地适用于视频译码,且可应用于无线及/或有线应用。在每一状况下,可通过视频编码器20编码经俘获、预先俘获或计算机产生的视频。可接着通过调制解调器22根据一通信标准调制经编码的视频信息,且经由发射器24将所述经编码的视频信息传输到目的地装置14。调制解调器22可包括各种混频器、滤波器、放大器或经设计用于信号调制的其它组件。发射器24可包括经设计用于传输数据的电路,包括放大器、滤波器及一个或一个以上天线。
根据本发明,源装置12的视频编码器20可经配置以应用用于减少译码视频块的预测信息的成本的技术。举例来说,在单向预测模式的状况下,视频编码器20可使用小于两个位来编码指示使用相对于参考图片列表中的参考图片的单向预测模式及双向预测模式中的一者来编码视频块的一个或一个以上语法元素。参考图片列表可为两个不同参考图片列表中的一个优选参考图片列表,或在启用GPB帧时为两个相同参考图片列表中的任一者。参考图片列表可替代地称作参考帧列表。作为另一实例,在双向预测模式的状况下,视频编码器20可通过来自两个相同参考图片列表的两个运动向量来编码GPB帧的一个或一个以上视频块,且联合地译码所述视频块中的每一者的所述两个运动向量。所述两个运动向量可来自相同参考图片或实质上类似的参考图片。
目的地装置14的接收器26经由信道16接收信息,且调制解调器28解调所述信息。经由信道16所传达的信息可包括由视频编码器20所定义的语法信息(其也由视频解码器30使用),所述语法信息包括描述经译码的视频(例如,视频片段、视频帧及视频序列或图片群组(GOP))的预测单元(PU)、译码单元(CU)或其它单元的特性及/或处理的语法元素。显示装置32向用户显示经解码的视频数据,且可包含多种显示装置中的任一者,例如,阴极射线管(CRT)、液晶显示器(LCD)、等离子显示器、有机发光二极管(OLED)显示器或另一类型的显示装置。
根据本发明,目的地装置14的视频解码器30可经配置以应用用于减少译码视频块的预测信息的成本的技术。举例来说,在单向预测模式的状况下,视频解码器30可使用小于两个位来解码指示使用相对于参考图片列表中的参考图片的单向预测模式及双向预测模式中的一者来译码视频块的一个或一个以上语法元素。参考图片列表可为两个不同参考图片列表中的一个优选参考图片列表,或在启用GPB帧时为两个相同参考图片列表中的任一者。作为另一实例,在双向预测模式的状况下,视频解码器30可联合地解码GPB帧的一个或一个以上视频块中的每一者的两个运动向量,且通过来自两个相同参考图片列表的两个运动向量来解码所述视频块中的每一者。所述两个运动向量可来自相同参考图片或实质上类似的参考图片。
在图1的实例中,通信信道16可包含任何无线或有线通信媒体,例如,射频(RF)频谱或一个或一个以上物理传输线,或无线媒体与有线媒体的任何组合。通信信道16可形成基于包的网络(例如,局域网络、广域网络或例如因特网的全球网络)的部分。通信信道16一般表示用于将视频数据从源装置12传输到目的地装置14的任何合适通信媒体或不同通信媒体的集合,包括有线或无线媒体的任何合适组合。通信信道16可包括路由器、交换器、基站,或可用于促进从源装置12到目的地装置14的通信的任何其它设备。
视频编码器20及视频解码器30可根据例如新兴高效率视频译码(HEVC)标准或ITU-T H.264标准(替代地称作MPEG-4第10部分,高级视频译码(AVC))的视频压缩标准进行操作。然而,本发明的技术不限于任何特定译码标准。其它实例包括MPEG-2及ITU-T H.263。尽管未在图1中展示,但在一些方面中,视频编码器20及视频解码器30可各自与音频编码器及解码器集成,且可包括适当MUX-DEMUX单元或其它硬件及软件,以处置共同数据串流或单独数据串流中的音频与视频两者的编码。如果适用,则MUX-DEMUX单元可符合ITU H.223多路复用器协议或例如用户数据报协议(UDP)的其它协议。
HEVC标准化努力是基于视频译码装置的模型(称作HEVC测试模型(HM))。HM根据(例如)ITU-T H.264/AVC假设视频译码装置相对于现有装置的若干额外能力。举例来说,H.264提供九个帧内预测编码模式,而HM提供多达三十三个帧内预测编码模式。
HM将视频数据的块称作译码单元(CU)。位串流内的语法数据可定义最大译码单元(LCU),最大译码单元为在像素数目方面的最大译码单元。一般来说,CU具有与H.264标准的宏块的目的类似的目的,只是CU不具有大小差别。因此,CU可分裂成若干子CU。一般来说,本发明中对CU的参考可涉及图片的最大译码单元或LCU的子CU。LCU可分裂成若干子CU,且每一子CU可进一步分裂成若干子CU。位串流的语法数据可定义LCU可分裂的最大次数(其称作CU深度)。因此,位串流也可定义最小译码单元(SCU)。
不进一步分裂的CU可包括一个或一个以上预测单元(PU)。一般来说,PU表示对应CU的全部或一部分,且包括用于检索所述PU的参考样本的数据。举例来说,当PU是经帧内模式编码时,所述PU可包括描述所述PU的帧内预测模式的数据。作为另一实例,当PU是经帧间模式编码时,PU可包括描述所述PU的运动向量的数据。定义运动向量的数据可描述(例如)运动向量的水平分量、运动向量的垂直分量、运动向量的分辨率(例如,四分之一像素精度或八分之一像素精度)、运动向量所指向的参考图片,及/或运动向量的参考图片列表(例如,列表0或列表1)。关于定义PU的CU的数据还可描述(例如)将所述CU划分成一个或一个以上PU。划分模式可在CU是经跳过或直接模式编码、经帧内预测模式编码或是经帧间预测模式编码之间而不同。
具有一个或一个以上PU的CU还可包括一个或一个以上变换单元(TU)。在使用PU的预测之后,视频编码器可计算CU的对应于PU的部分的残余值。残余值对应于可变换成经量化且经扫描以产生串行化变换系数以用于熵译码的变换系数的像素差值。TU不必限于PU的大小。因此,TU可能大于或小于同一CU的对应PU。在一些实例中,TU的最大大小可为对应CU的大小。本发明使用术语“视频块”来指代CU、PU或TU中的任一者。
视频编码器20及视频解码器30各自可实施为多种合适编码器电路(例如,一个或一个以上微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、软件、硬件、固件,或其任何组合)中的任一者。视频编码器20及视频解码器30中的每一者可包括于一个或一个以上编码器或解码器中,其中任一者可集成为相应相机、计算机、移动装置、用户装置、广播装置、机顶盒、服务器或其类似者中的组合的编码器/解码器(编解码器)的部分。
视频序列通常包括一系列视频帧。图片群组(GOP)一般包含一系列一个或一个以上视频帧。GOP可包括GOP的标头、GOP的一个或一个以上帧的标头中或别处的语法数据,所述语法数据描述包括于GOP中的多个帧。每一帧可包括描述所述相应帧的编码模式的帧语法数据。视频编码器20通常对个别视频帧内的视频块进行操作,以便编码视频数据。视频块可对应于译码单元(CU)或所述CU的划分单元(PU)。视频块可具有固定或变化的大小,且可根据指定译码标准而在大小上不同。每一视频帧可包括多个片段。每一片段可包括多个CU,CU可包括一个或一个以上PU。
作为一实例,HEVC测试模型(HM)支持各种CU大小的预测。LCU的大小可由语法信息定义。假定特定CU的大小为2N×2N,则HM支持2N×2N或N×N的大小的帧内预测,及2N×2N、2N×N、N×2N或N×N的对称大小的帧间预测。HM还支持帧间预测的2N×nU、2N×nD、nL×2N及nR×2N的不对称分裂。在不对称分裂中,CU的一个方向未分裂,而另一方向分裂成25%及75%。CU的对应于25%分裂的部分是由“n”随后是“上”、“下”、“左”或“右”的指示来指示。因此,举例来说,“2N×nU”指代水平上以顶部的2N×0.5N PU及底部的2N×1.5N PU分裂的2N×2N CU。
在本发明中,“N×N”与“N乘N”可互换使用以指代视频块(例如,CU、PU或TU)在垂直尺寸与水平尺寸方面的像素尺寸(例如,16×16像素或16乘16像素)。一般来说,16×16块将在垂直方向上具有16个像素(y=16),且在水平方向上具有16个像素(x=16)。同样,N×N块一般在垂直方向上具有N个像素,且在水平方向上具有N个像素,其中N表示非负整数值。可将块中的像素布置成行及列。此外,块不必需要在水平方向上具有与垂直方向相同数目个像素。举例来说,块可包含N×M个像素,其中M不必等于N。
在帧内预测性或帧间预测性译码以产生CU的PU之后,视频编码器20可计算残余数据以产生所述CU的一个或一个以上变换单元(TU)。CU的PU可包含空间域(也称作像素域)中的像素数据,而CU的TU可包含(例如)在将例如离散余弦变换(DCT)、整数变换、小波变换或概念上类似的变换的变换应用于残余视频数据之后的变换域中的系数。所述残余数据可对应于CU的PU的未经编码的图片的像素与预测值之间的像素差。视频编码器20可形成包括CU的残余数据的一个或一个以上TU。视频编码器20可接着变换所述TU。
在任何变换以产生变换系数之后,可执行变换系数的量化。量化一般指代将变换系数量化以可能地减小用以表示所述系数的数据的量的过程。量化过程可减小与所述系数中的一些或全部相关联的位深度。举例来说,n位值在量化期间可舍去到m位值,其中n大于m。
在一些实例中,视频编码器20可利用预定义扫描次序来扫描经量化的变换系数以产生可经熵编码的串行化向量。在其它实例中,视频编码器20可执行自适应性扫描。在扫描经量化的变换系数以形成一维向量之后,视频编码器20可(例如)根据上下文自适应性可变长度译码(CAVLC)、上下文自适应性二进制算术译码(CABAC)、基于语法的上下文自适应性二进制算术译码(SBAC)或另一熵编码方法而对所述一维向量进行熵编码。
为执行CABAC,视频编码器20可选择一上下文模型应用于某一上下文以编码待传输的符号。所述上下文可能是关于(例如)相邻符号是否为非零。视频编码器20可接着通过参考基于上下文指派给所述符号的概率而指派一值以表示所述符号。在一些状况下,值可能为分率位,即,小于一位。为执行CAVLC,视频编码器20可针对待传输的符号选择一可变长度码。可将VLC中的码字建构成使得相对较短码对应于更有可能的符号,而较长码对应于较不可能的符号。以此方式,相较于(例如)针对待传输的每一符号使用相等长度的码字,使用VLC可实现位节省。概率确定可基于符号的上下文而进行。
视频编码器20也可对在编码视频块时所产生的运动预测方向及运动向量信息的语法元素进行熵编码。根据本发明的技术,视频编码器20可减少译码视频块的预测信息的成本。举例来说,在单向预测模式的状况下,视频编码器20可使用小于两个位来编码指示使用相对于参考图片列表中的参考图片的单向预测模式及双向预测模式中的一者来编码视频块的一个或一个以上语法元素。参考图片列表可为两个不同参考图片列表中的一个优选参考图片列表,或在启用GPB帧时为两个相同参考图片列表中的任一者。作为另一实例,在双向预测模式的状况下,视频编码器20可通过来自两个相同参考图片列表的两个运动向量来编码GPB帧的一个或一个以上视频块,且联合地编码所述视频块中的每一者的所述两个运动向量。所述两个运动向量可来自相同参考图片或实质上类似的参考图片。
视频解码器30可用与视频编码器20的操作方式基本上对称的方式来操作。举例来说,视频解码器30可接收表示经编码的CU的经熵编码的数据,其包括经编码的PU及TU数据。此所接收的数据可包括在编码视频块时所产生的运动预测方向及运动向量信息的语法元素。视频解码器30还可减少译码视频块的预测信息的成本。举例来说,在单向预测模式的状况下,视频解码器30可使用小于两个位来解码指示使用相对于参考图片列表中的参考图片的单向预测模式及双向预测模式中的一者来编码视频块的一个或一个以上语法元素。参考图片列表可为两个不同参考图片列表中的一个优选参考图片列表,或在启用GPB帧时为两个相同参考图片列表中的任一者。作为另一实例,在双向预测模式的状况下,视频解码器30可联合地解码GPB帧的一个或一个以上视频块中的每一者的两个运动向量,且通过从两个相同参考图片列表所计算的两个运动向量来解码所述视频块中的每一者。可从相同参考图片或类似参考图片计算所述两个运动向量。
视频编码器20及视频解码器30各自可在适用时实施为多种合适编码器或解码器电路(例如,一个或一个以上微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑电路、软件、硬件、固件,或其任何组合)中的任一者。视频编码器20及视频解码器30中的每一者可包括于一个或一个以上编码器或解码器中,其中任一者可集成为组合的视频编码器/解码器(编解码器)的部分。包括视频编码器20及/或视频解码器30的装置可包含集成电路、微处理器及/或无线通信装置(例如,蜂窝式电话)。
图2为说明实例视频序列33的概念图,所述实例视频序列33包括广义P/B(GPB)帧36A到36B及38A到38B。在一些状况下,视频序列33可称作图片群组(GOP)。如所说明的视频序列33按显示次序包括帧35A、36A、38A、35B、36B、38B及35C,及最后帧39。帧34为按显式次序在序列33之前所出现的序列的最后帧。图2大体上表示视频序列的示范性预测结构,且仅希望说明用于编码不同帧间模式帧类型的帧参考。实际视频序列可含有具有不同帧类型且呈不同显示次序的更多或更少视频帧。
对于基于块的视频译码来说,可将包括于序列33中的视频帧中的每一者划分成若干视频块或若干译码单元(CU)。视频帧的每一CU可包括一个或一个以上预测单元(PU)。使用相对于同一帧内译码(I)的帧中的相邻块的空间预测来编码所述帧中的视频块或PU。帧间译码(P或B或GPB)的帧中的视频块或PU可使用相对于同一帧中的相邻块的空间预测或相对于其它参考图片的时间预测。
可使用双向预测以从两个不同参考图片列表(传统上,一个过去帧及一个未来帧)计算两个运动向量来编码B帧中的视频块。在一些状况下,可使用来自两个不同参考图片列表中的一者的单向预测来编码B帧中的视频块。可使用单向预测以从单一参考图片列表(传统上,一过去帧)计算单一运动向量来编码P帧中的视频块。根据新兴HEVC标准,可使用单向预测以从两个相同参考图片列表中的一者计算单一运动向量或使用双向预测以从所述两个相同参考图片列表计算两个运动向量来编码GPB帧中的视频块。所述两个相同参考图片列表可含有过去参考图片。
在一些状况下,当给定视频片段、视频帧或视频序列完全启用GPB帧时,GPB帧可替换标准P帧。在此状况下,可将所有标准P帧视为GPB帧,以使得视频编码器可确定将帧间模式帧编码为B帧或GPB帧。在其它状况下,当部分启用GPB帧时,可使用全部三种帧间预测模式。在此状况下,视频编码器可确定将帧间模式帧编码为B帧、P帧或是GPB帧。
在图2的实例中,将最后帧39指定用于帧内模式译码作为I帧。在其它实例中,可参考前一序列的最后帧34通过帧间模式译码将最后帧39编码(例如)为P帧。将视频帧35A到35C(统称“视频帧35”)指定用于使用参考一过去帧及一未来帧的双向预测而译码为B帧。在所说明的实例中,参考最后帧34及帧36A将帧35A编码为B帧,如由从帧34及帧36A到视频帧35A的箭头所指示。帧35B及35C经类似编码。
可将视频帧36A到36B(统称“视频帧36”)指定用于使用参考一过去帧的单向预测而译码为标准P帧或GPB帧。在所说明的实例中,参考最后帧34将帧36A编码为P帧或GPB帧,如由从帧34到视频帧36A的箭头所指示。帧36B经类似编码。
可将视频帧38A到38B(统称“视频帧38”)指定用于使用参考同一过去帧的双向预测而译码为GPB帧。在其它实例中,可使用参考包括于同一参考图片列表中的实质上类似的过去帧的双向预测来编码GPB帧。在所说明的实例中,通过对帧36A的两次参考将帧38A编码为GPB帧,如由从帧36A到视频帧38A的两个箭头所指示。帧38B经类似编码。
图3为说明视频编码器20的一实例的框图,所述视频编码器20可实施用于有效地译码视频帧的视频块的预测信息的技术。视频编码器20可执行视频帧内的块(包括CU或CU的PU)的帧内及帧间译码。帧内译码依赖于空间预测以减少或移除给定视频帧内的视频的空间冗余。帧间译码依赖于时间预测以减少或移除视频序列的邻近帧内的视频的时间冗余。帧内模式(I模式)可指代若干基于空间的压缩模式中的任一者。例如单向预测(P模式)、双向预测(B模式)或广义P/B预测(GPB模式)的帧间模式可指代若干基于时间的压缩模式中的任一者。
如图3中所展示,视频编码器20接收待编码的视频帧内的当前视频块。在图3的实例中,视频编码器20包括模式选择单元40、预测单元41、参考图片存储器64、求和器50、变换单元52、量化单元54,及熵编码单元56。预测单元41包括运动估计单元42、运动补偿单元44,及帧内预测单元46。对于视频块重建构来说,视频编码器20还包括反量化单元58、反变换单元60,及求和器62。还可包括解块滤波器(图3中未展示)以对块边界进行滤波以从经重建构的视频移除方块效应假影。必要时,所述解块滤波器将通常对求和器62的输出进行滤波。
在编码过程期间,视频编码器20接收待译码的视频帧或片段。可将帧或片段划分成多个CU或视频块。模式选择单元40可基于误差结果针对当前视频块选择译码模式(帧内或帧间)中的一者,且预测单元41可将所得帧内或帧间译码的块提供到求和器50以产生残余块数据,且将所得帧内或帧间译码的块提供到求和器62以重建构经编码的块供用作参考图片。
预测单元41内的帧内预测单元46可执行当前视频块相对于处于与待译码的当前块相同的帧或片段中的一个或一个以上相邻块的帧内预测性译码,以提供空间压缩。预测单元41内的运动估计单元42及运动补偿单元44执行当前视频块相对于一个或一个以上参考图片中的一个或一个以上预测性块的帧间预测性译码,以提供时间压缩。可从包括存储于参考图片存储器64中的参考图片的识别符的第一参考图片列表(列表0)66及/或第二参考图片列表(列表1)68选择一个或一个以上参考图片。
运动估计单元42可经配置以根据视频序列的预定型样而确定视频帧的帧间预测模式。预定型样可将序列中的视频帧指定为P帧及/或B帧。在一些状况下,可启用GPB帧以使得可将一个或一个以上视频帧指定为GPB帧。在其它状况下,当启用GPB帧时,运动估计单元42可确定是否将最初指定的P帧编码为GPB帧。后一状况可视GPB帧是经完全启用还是经部分启用而定。
可高度集成运动估计单元42与运动补偿单元44,但出于概念的目的而对其单独加以说明。由运动估计单元42所执行的运动估计为产生运动向量的过程,运动向量估计视频块的运动。运动向量(例如)可指示当前视频帧内的PU或视频块相对于参考图片内的预测性块的移位。预测性块为在像素差方面被发现与包括PU的CU的待译码部分紧密匹配的块,可通过绝对差和(SAD)、平方差和(SSD)或其它差异量度来确定像素差。在一些实例中,视频编码器20可计算存储于参考图片存储器64中的参考图片的次整数(sub-integer)像素位置的值。举例来说,视频编码器20可计算参考图片的四分之一像素位置、八分之一像素位置或其它分率像素位置的值。因此,运动估计单元42可执行相对于完整像素位置及分率像素位置的运动搜索,且以分率像素精度输出运动向量。
运动估计单元42通过比较帧间译码帧的PU与列表066或列表168中所识别的参考图片的块而计算帧间译码帧的所述PU或视频块的运动向量。举例来说,当帧间译码帧包含P帧时,运动估计单元42可使用所述P帧中的视频块的单向预测,且从列表066及列表168的包括过去帧的识别符的一个列表(传统上为列表066)计算单一运动向量。
举例来说,当帧间译码帧包含B帧时,列表066及列表168将包括不同参考图片(传统上,过去图片及未来图片)的识别符。运动估计单元42可针对所述B帧的视频块使用双向预测,且从列表066及列表168计算两个运动向量。在一些状况下,运动估计单元42可针对B帧的视频块使用单向预测,且从参考图片列表66、68中的一者计算单一运动向量。
根据新兴HEVC标准,当帧间译码帧包含GPB帧时,列表066及列表168包括相同参考图片的识别符。更具体来说,包括于列表066及列表168中的每一者中的图片的数目是相同的,且由列表066中的每一索引条目所指示的图片与由列表168中的相同索引条目所指示的图片相同。包括于列表066及列表168中的参考图片可包含过去图片。在此状况下,运动估计单元42可针对GPB帧的视频块使用双向预测,且从列表066及列表168计算两个运动向量。运动估计单元42还可针对所述GPB帧的视频块使用单向预测,且从列表066及列表168中的一者计算单一运动向量。
当所述参考图片列表中的一者比另一参考图片列表优选时,默认将所述优选参考图片列表用于单向预测可能更有效。在与基于所述参考图片列表的一者相比,最常基于所述参考图片列表中的另一者执行针对B帧的单向预测时,可能会出现这种状况。举例来说,与P帧类似,可通常基于来自列表066的过去参考图片来执行针对B帧的单向预测。在所述实例中,运动补偿单元44可确定列表066为优选参考图片列表。在GPB帧经启用以使得列表066与列表168相同时,运动补偿单元44可将列表066与列表168中的任一者互换地用于单向预测,而非在所述两个相同参考图片列表之间进行选择。
运动估计单元42将所计算出的运动向量发送到熵编码单元56及运动补偿单元44。由运动补偿单元44所执行的运动补偿可涉及基于由运动估计所确定的运动向量取得或产生预测性块。视频编码器20通过从正经译码的当前视频块减去预测性块而形成残余视频块。求和器50表示执行此减法运算的组件。
运动补偿单元44可通过检索由当前CU的PU的运动向量所识别的预测性块而计算所述PU的预测信息。预测信息可包括(例如)运动预测方向、包括运动预测子(motionpredictor)的运动向量信息,及参考图片列表信息。运动补偿单元44也可产生经定义以表示针对当前视频块或PU所计算的预测信息的语法元素。视频编码器20可接着编码指示预测信息的语法元素,且将所述语法元素用信号发送到视频解码器30。
根据本发明的技术,视频编码器20可减少译码视频块的预测信息的成本。举例来说,在单向预测模式的状况下,视频编码器20可使用小于两个位来编码指示使用相对于参考图片列表中的参考图片的单向预测模式及双向预测模式中的一者来译码视频块的一个或一个以上语法元素。参考图片列表可为两个不同参考图片列表中的一个优选参考图片列表,或在GPB帧经启用时为两个相同参考图片列表中的任一者。作为另一实例,在双向预测模式的状况下,视频编码器20可通过来自两个相同参考图片列表的两个运动向量来编码GPB帧的一个或一个以上视频块,且联合地编码所述视频块中的每一者的所述两个运动向量。所述两个运动向量可来自相同参考图片或实质上类似的参考图片。
首先将描述在单向预测的状况下用于减少译码视频块的预测信息的成本的技术。运动补偿单元44可产生针对当前视频块的运动预测方向的语法元素。针对B帧中的视频块的运动预测方向的常规语法元素inter_pred_idc包括用以指示使用单向预测或是双向预测来编码所述块的第一位,及用以指示用于单向预测的参考图片列表的第二位。在相同参考图片列表的状况下,常规语法元素的第二位可为冗余的,这是因为所述参考图片列表中的任一者可互换地用于单向预测模式。
根据本发明的技术,运动补偿单元44可通过消除用于单向预测模式的参考图片列表的指示而产生针对运动预测方向的单一位语法元素。视频编码器20接着在视频块或PU级编码用于当前视频帧的每一视频块的运动预测方向连同运动向量信息的单一位语法,且将其用信号发送到视频解码器30。
在当前视频帧被指定为GPB帧时,视频编码器20存储含有存储于参考图片存储器64中的相同参考图片的识别符的列表066及列表168。由于列表066及列表168包括相同参考图片,所以运动补偿单元44可将所述两个相同参考图片列表中的任一者互换地用于单向预测模式。视频编码器20使用相对于参考图片列表中的一者中的参考图片的单向预测模式来编码GPB帧的一个或一个以上视频块。
运动补偿单元44可产生单一位语法以表示使用单向预测模式编码的GPB帧的视频块的运动预测方向。视频编码器20还可将GPB帧旗标用信号发送到视频解码器30以指示当前视频帧编码为GPB帧。GPB帧旗标可用以向视频解码器30明确告知序列内的给定视频帧编码为GPB帧以使得通过单一位语法编码视频块的运动预测方向。明确发信号可使视频解码器30能够剖析所述单一位语法以确定运动预测方向。在一些状况下,视频编码器20可能不明确地用信号发送GPB帧旗标,而是隐含地用信号表示在参考图片列表相同时将给定帧编码为GPB帧。下文中更详细描述GPB帧旗标。
在一个实例中,可针对GPB帧定义单独语法,所述单独语法包含单一位语法元素(例如,bi_pred_flag),所述单一位语法元素经定义以指示是使用单向预测模式还是双向预测模式来编码GPB帧的视频块。引入单一位语法元素可避免与上文所描述的常规语法元素(即,inter_pred_idc)混淆。运动补偿单元44可产生单一位语法元素以表示GPB帧的视频块中的每一者的运动预测方向。视频编码器20接着编码用于GPB帧的视频块中的一者或一者以上的单一位语法元素,以指示使用单向预测模式及双向预测模式中的一者来编码视频块。无必要明确用信号表示使用参考图片列表66、68中的哪一者来编码GPB帧的视频块,这是因为所述相同参考图片列表中的任一者可用于单向预测。
在另一实例中,可针对GPB帧定义常规语法元素(即,inter_pred_idc)的单一位模式,其中语法元素的仅第一位用以指示是使用单向预测模式还是双向预测模式来编码所述GPB帧的视频块。运动补偿单元44可产生常规语法元素的仅第一位以表示GPB帧的视频块中的每一者的运动预测方向。视频编码器20接着仅编码GPB帧的视频块中的一者或一者以上的语法元素的第一位以指示使用单向预测来编码视频块。运动补偿单元44可消除针对GPB帧的视频块的语法元素的第二位,这是因为所述参考图片列表中的任一者可用于单向预测。
下文所呈现的表1提供在针对运动预测方向(其中仅编码第一位以指示GPB帧的视频块的单向预测)的常规语法元素(即,inter_pred_idc)的单一位模式下的初始结果。表1以低延迟高效率配置呈现针对HM的第0.7版内的若干视频测试序列的归因于表示GPB帧的视频块的运动预测方向的减少位的语法的位深度减小率百分比。归因于减少位的语法元素的平均位深度减小率为0.88%。
表1
低延迟高效率配置 位深度率
WQVGA30_RaceHorses -1.03
WQVGA50_BasketballPass -0.98
WQVGA50_BlowingBubbles -0.87
WQVGA60_BQSquare -0.92
WQVGA AVE -0.95
WVGA30_RaceHorses -0.60
WVGA50_BasketballDrill -0.58
WVGA50_PartyScene -0.65
WVGA60_BQMall -1.40
WVGAAVE -0.81
720p60_Vidyo1 -1.55
720p60_Vidyo3 -1.30
720p60_Vidyo4 -1.22
720p AVE -1.36
1080p24_ParkScene -0.77
1080p24_Kimono -0.51
1080p50_BasketballDrive -0.52
1080p50_Cactus -0.75
1080p60_BQTerrace -0.47
1080p AVE -0.60
平均值 -0.88
表1.归因于表示GPB帧的视频块的运动预测方向的减少位的语法的位深度减小率[%]
在一些状况下,视频编码器20可指派减少的位值来表示指示使用来自参考图片列表的单向预测模式编码的任何类型的帧间译码帧的视频块的运动预测方向的语法元素。如上文所描述,在将视频帧指定为B帧时,参考图片列表可为最常用于单向预测的两个不同参考图片列表中的一个优选参考图片列表。在将视频帧指定为GPB帧时,参考图片列表可为两个相同参考图片列表中的任一者。
举例来说,运动补偿单元44可调适应用于指示运动预测方向的语法元素的二进制以通过单一位二进制来表示相对于优选参考图片列表中的参考图片的单向预测模式。熵编码单元56可将每一语法元素二进制化为一位或二进制位的序列。常规地,对于指示运动预测方向的语法元素,为0的二进制表示双向预测模式,为10的二进制表示相对于列表0中的参考图片的单向预测模式,且为11的二进制表示相对于列表1中的参考图片的单向预测模式。
然而,运动补偿单元44可将语法元素与不同二进制自适应性地链接起来,以使得为0的单一位二进制链接到指示相对于优选参考图片列表中的参考图片的单向预测模式的语法元素。运动补偿单元44可基于出现指示运动预测方向的语法元素的每一状态的频率而调适二进制。当与其它预测模式相比,更常使用相对于优选参考图片列表中的参考图片的单向预测模式时,将为0的单一位二进制链接到相对于优选参考图片列表中的参考图片的单向预测模式可能更有效。举例来说,运动补偿单元44可调适二进制以使得为0的单一位二进制表示相对于优选参考图片列表中的参考图片的单向预测模式,为10的二进制表示相对于非优选参考图片列表中的参考图片的单向预测模式,且为11的二进制表示双向预测模式。
运动补偿单元44可产生语法元素以表示当前帧的视频块中的每一者的运动预测方向。视频编码器20接着将单一位二进制指派给视频块中的一者或一者以上的语法元素以指示使用相对于优选参考图片列表中的参考图片的单向预测模式来编码视频块。视频编码器20可在视频块或PU级、CU级、视频片段级、视频帧级或视频序列级中的一者将指示运动预测方向的语法元素的自适应性二进制用信号发送到视频解码器30。此发信号可使视频解码器30能够类似地调适其用于指示运动预测方向的语法元素的二进制。在一些状况下,视频解码器30可基于出现指示运动预测方向的语法元素的每一状态的频率而将语法元素独立自适应性地二进制化。
作为另一实例,运动补偿单元44可参考将语法元素指示优选参考图片列表的概率偏向于高于语法元素指示非优选参考图片列表的概率的配置数据。举例来说,配置数据可将用于运动预测方向的常规语法元素(即,inter_pred_idc)的第二位的概率初始化偏向于优选参考图片列表。熵编码单元56基于根据同一帧中的相邻视频块的语法值所确定的上下文而估计当前视频块的语法元素的每一位为1或0的概率。对于每一上下文,状态机追踪过去值,且将当前状态提供为当前视频块的语法元素的概率的最佳估计。举例来说,如果状态值范围在0到128,则状态值0可意味着位为0的概率为0.9999,且状态值128可意味着位为0的概率为0.0001。熵编码单元56可使用基于概率确定而指派的值来编码语法元素。较高概率导致用以表示语法元素的较短值。在一些状况下,值可能为分率位,即,小于一位。
当对于单向预测,参考图片列表中的一者比另一参考图片列表优选时,配置数据可增加语法元素在单向预测模式的状况下指示优选参考图片列表的概率。举例来说,运动补偿单元44可基于配置数据将常规语法元素的第二位的状态值设定成0以使得位为0(即,指示优选参考图片列表)的概率为0.9999。
运动补偿单元44可产生指示当前帧的视频块中的每一者的运动预测方向的语法元素。视频编码器20可将单一位值指派给视频块中的一者或一者以上的语法元素的第一位以指示使用单向预测来编码视频块。视频编码器20可接着将分率位值(即,小于一位)指派给视频块中的一者或一者以上的语法元素的第二位,以指示优选参考图片列表是用于单向预测模式。语法元素的第二位指示优选参考图片列表的较高概率使视频编码器20能够将分率位值指派给所述第二位。
除了上文所描述的运动预测方向的经修改的语法之外,本发明的技术还可包括将旗标用信号发送到视频解码器30以明确指示何时使用GPB帧及/或何时使用减少位的语法用于运动预测方向。举例来说,如果GPB帧启用于或允许用于当前视频帧,则视频编码器20可将GPB启用旗标用信号发送到视频解码器30以指示启用GPB帧。视频编码器20可在视频帧级或视频序列级在语法中用信号发送GPB启用旗标。GPB启用旗标可经定义以指示GPB帧经停用、完全启用或部分启用。当停用GPB帧时,通过每一PU的一个运动向量将最初指定的P帧编码为常规P帧。当完全启用GPB帧时,可通过每一PU的一个或两个运动向量将最初指定的P帧视为GPB帧。当部分启用GPB帧时,可将P帧、B帧及GPB帧概念视为相异概念。
虽然启用GPB帧,但可能不对所述GPB帧定义新的片段类型,使得可将GPB帧编码为B片段及/或P片段。在此状况下,视频编码器20可能需要将区分标准B及/或P帧与GPB帧的额外明确或隐含指示发送到视频解码器30。所述额外指示还可用以向视频解码器30通知何时使用减少位的语法来表示运动预测方向。
举例来说,可在常规B帧的状况下通过不同参考图片列表或在GPB帧的状况下通过相同参考图片列表将所有GPB帧译码为B片段。在完全启用GPB帧以使得可在存在或不存在相同参考图片列表的情况下将所有帧间预测性帧编码为B片段时,编码GPB帧的此模式可为优选的。
在一些状况下,视频编码器20可将GPB帧旗标(例如,gpb_pred_flag或slice_gpb_flag)明确用信号发送到视频解码器30,以指示何时将视频帧编码为GPB帧以便区分常规B帧与GPB帧。视频编码器20可在视频片段级、视频帧级或视频序列级中的一者在语法中用信号发送GPB帧旗标。然而,在一些状况下,视频编码器20可能不明确用信号发送GPB帧编码。在所述状况下,视频编码器20可隐含地向视频解码器30告知在参考图片列表相同时将给定帧编码为GPB帧。
编码为B片段的GPB帧的片段标头语法可定义运动预测方向的减少位的语法元素。在一个实例中,减少位的语法元素可为针对B帧的运动预测方向的常规语法元素(即,inter_pred_idc)的模式,其中仅使用所述语法元素的第一位。在另一实例中,减少位的语法元素可为新定义的单一位语法元素(例如,bi_pred_flag),在下文中对其加以更详细描述。
下文在表2中呈现来自视频块或PU级的语法的摘录,其中进行了修改以定义用于译码为B片段的GPB帧的运动预测方向的减少位的语法元素的一个实例。
表2
prediction_unit(x0,y0,currPredUnitSize){ C 描述符
...
if(slice_type==B&&!isGPBSliceFlag)
inter_pred_idc[i] 2 ue(v)|ae(v)
if(slice_type==B&&isGPBSliceFlag)
inter_pred_idc[i] 1 u(1)|ae(v)
...
针对位于起源像素或子像素坐标(x0,y0)处的视频帧内且具有由currPredUnitSize所给出的特定大小的给定PU定义predition_unit语法。表2中的C列指示定义语法元素包括于当前视频块的哪一数据分区中的每一语法元素的类别。表2中的描述符列指示使得语法元素能够在视频解码器30处得以适当剖析的用于语法元素的译码类型。举例来说,描述符“ue(v)”指示指数葛洛姆译码(exponential-Golomb coding)。如表2中的语法摘录中所展示,如果包括当前视频块或PU的视频帧被视为B片段但并不被视为GPB帧,则运动补偿单元44产生常规两位语法元素inter_pred_idc[i],以用信号表示针对常规B帧的视频块的分区i的运动预测方向。然而,如果视频帧被视为B片段且被视为GPB帧,则运动补偿单元44仅产生常规语法元素inter_pred_idc[i]的第一位,以用信号表示针对GPB帧的视频块的分区i的运动预测方向。当视频编码器20在较高级明确用信号发送GPB帧旗标以指示将视频帧编码为GPB帧时或当参考图片列表被确定为相同列表时,用于预测单元语法表中的GPB旗标变量isGPBSliceFlag可被确定为真。
在另一实例中,在GPB帧的状况下可用双向预测为选项将所有GPB帧译码为P片段。编码GPB帧的此模式在部分启用GPB帧时可为优选的,以使得可在存在或不存在双向预测的情况下将帧间预测性帧编码为B片段或P片段。在一些状况下,视频编码器20可将GPB帧旗标(例如,gpb_pred_flag或slice_gpb_flag)明确用信号发送到视频解码器(例如,视频解码器30),以指示何时将视频帧编码为GPB帧以便区分常规P帧与GPB帧。视频编码器20可在视频片段级、视频帧级或视频序列级中的一者在语法中用信号发送GPB帧旗标。
译码为P片段的GPB帧的片段标头语法可定义运动预测方向的减少位的语法元素。在一个实例中,减少位的语法元素可为新定义的单一位语法元素(例如,bi_pred_flag)。单一位语法元素可经定义以指示是使用单向预测还是双向预测来编码视频块。单一位语法元素可具有不同名称以避免与针对B帧的运动预测方向的常规双位语法元素混淆。举例来说,单一位语法元素可命名为“bi_pred_flag”而非“inter_pred_idc”。在另一实例中,减少位的语法元素可为针对B帧的运动预测方向的常规语法元素(即,inter_pred_idc)的模式,其中仅使用所述语法元素的第一位。
下文在表3中呈现来自视频块或PU级的语法的摘录,其中进行了修改以定义用于译码为P片段的GPB帧的运动预测方向的减少位的语法元素的一个实例。
表3
prediction_unit(x0,y0,currPredUnitSize){ C 描述符
...
if(slice_type==B)
inter_pred_idc[i] 2 ue(v)|ae(v)
if(slice_type==P&&slice_gpb_flag)
bi_pred_flag[i] 1 u(1)|ae(v)
...
针对位于起源像素或子像素坐标(x0,y0)处的视频帧内且具有由currPredUnitSize所给出的特定大小的给定PU定义predition_unit语法。表3中的C列指示定义语法元素包括于当前视频块的哪一数据分区中的每一语法元素的类别。表3中的描述符列指示使得语法元素能够在视频解码器30处得以适当剖析的用于语法元素的译码类型。举例来说,描述符“ue(v)”指示指数葛洛姆译码。如表3中的语法摘录中所展示,如果包括当前视频块或PU的视频帧被视为B片段,则运动补偿单元44产生常规两位语法元素inter_pred_idc[i],以用信号表示针对常规B帧的视频块的分区i的运动预测方向。然而,如果视频帧被视为P片段且被视为GPB帧,则运动补偿单元44产生单一位语法元素bi_pred_flag[i],以用信号表示针对GPB帧的视频块的分区i的运动预测方向。当视频编码器20在较高级明确用信号发送GPB帧旗标以指示将视频帧编码为GPB帧时,用于语法中的GPB旗标slice_gpb_flag可被确定为真。
在一些状况下,当启用GPB帧时,可定义GPB帧的新片段类型。在此状况下,无需额外明确或隐含发信号来指示将当前视频帧编码为GPB帧。译码为GPB片段的GPB帧的片段标头语法可定义运动预测方向的减少位的语法元素。在一个实例中,减少位的语法元素可为新定义的单一位语法元素,例如,上文所描述的bi_pred_flag。在另一实例中,减少位的语法元素可为针对B帧的运动预测方向的常规语法元素(即,inter_pred_idc)的模式,其中仅使用所述语法元素的第一位。
下文在表4中呈现来自视频块或PU级的语法的摘录,其中进行了修改以定义针对译码为GPB片段的GPB帧的运动预测方向的减少位的语法元素的一个实例。
表4
prediction_unit(x0,y0,currPredUnitSize){ C 描述符
...
if(slice_type==B)
inter_pred_idc[i] 2 ue(v)|ae(v)
if(slice_type==GPB)
bi_pred_flag[i] 1 u(1)|ae(v)
...
针对位于起源像素或子像素坐标(x0,y0)处的视频帧内且具有由currPredUnitSize所给出的特定大小的给定PU定义predition_unit语法。表4中的C列指示定义语法元素包括于当前视频块的哪一数据分区中的每一语法元素的类别。表4中的描述符列指示使得语法元素能够在视频解码器30处得以适当剖析的用于语法元素的译码类型。举例来说,描述符“ue(v)”指示指数葛洛姆译码。如所述语法摘录中所展示,如果包括当前视频块或PU的视频帧被视为B片段,则运动补偿单元44产生常规两位语法元素inter_pred_idc[i],以用信号表示针对常规B帧的视频块的分区i的运动预测方向。然而,如果视频帧被视为GPB片段,则运动补偿单元44产生单一位语法元素bi_pred_flag[i],以用信号表示针对GPB帧的视频块的分区i的运动预测方向。
现在将描述在双向预测的状况下用于减少译码视频块的预测信息的成本的技术。如上文所描述,运动估计单元42可使用双向预测以计算针对GPB帧的当前视频块的来自列表066的第一运动向量及来自列表168的第二运动向量。运动补偿单元44可接着产生经定义以指示当前视频块的运动向量的语法元素。运动向量的常规语法元素包括经定义以指示运动向量与运动预测子之间的差的第一语法元素(即,mvd),及经定义以指示供产生运动预测子的参考图片的参考图片列表中的索引的第二语法元素(即,ref_idx)。
在当前视频帧被指定为GPB帧时,视频编码器20存储含有相同参考图片的识别符的列表066及列表168。由于列表066及列表168包括相同参考图片,所以运动估计单元42可从相同参考图片或实质上类似的参考图片计算第一运动向量及第二运动向量。因此,GPB帧的视频块的第一运动向量与第二运动向量为高度相关的。独立地产生所述高度相关的运动向量中的每一者的语法元素可为冗余的,且联合地编码所述两个运动向量可能更有效。
根据本发明的技术,运动补偿单元44可通过减少或消除常规地用以表示第二运动向量的语法元素而减少用以用信号表示运动向量的位。视频编码器20接着联合地编码第一运动向量及第二运动向量。举例来说,视频编码器20可以常规方式相对于运动预测子编码第一运动向量,且接着相对于第一运动向量编码第二运动向量。视频编码器20在视频块或PU级将GPB帧的每一视频块的经联合编码的运动向量连同其它预测语法一起用信号发送到视频解码器30。
运动补偿单元44从运动估计单元42接收GPB帧的当前视频块的第一运动向量及第二运动向量。运动补偿单元44接着从相邻视频块的运动向量产生第一运动向量的第一运动预测子。举例来说,当前视频块的第一运动向量可指向来自列表066的参考图片中的预测性块。因此,可从GPB帧中的相邻视频块的指向来自列表066的同一参考图片中的另一块的运动向量产生第一运动预测子。
运动补偿单元44产生表示相对于第一运动预测子的第一运动向量的语法元素。举例来说,运动补偿单元44产生经定义以指示第一运动向量与第一运动预测子之间的差的第一语法元素(即,mvd),及经定义以指示供产生第一运动预测子的参考图片的列表066中的索引的第二语法元素(即,ref_idx)。以此方式,视频编码器20可用常规方式通过运动补偿单元44所产生的语法元素相对于第一运动预测子编码第一运动向量。
运动补偿单元44可不从相邻视频块产生第二运动向量的第二运动预测子,而是替代地将第一运动向量用作第二运动预测子。视频编码器20接着相对于第一运动向量编码视频块的第二运动向量。以此方式,可将第二运动向量编码为第一运动向量与第二运动向量之间的差。在一些实例中,运动补偿单元44可能并不产生用于第二运动向量的任何语法元素。在其它实例中,运动补偿单元44可仅产生经定义以指示第二运动向量与第一运动向量之间的差的第一语法元素。
在一些状况下,视频编码器20可仅在第一运动向量与第二运动向量指向相同参考图片或实质上类似的参考图片时才联合地编码所述运动向量。当第一运动向量与第二运动向量不指向同一参考图片时,可根据在将第一运动向量用作第二运动预测子之前在第一运动向量与第二运动向量之间的时间距离而按比例调整第一运动向量。
在一些实例中,可从相邻块的多个运动向量产生当前块的运动向量的运动预测子。在此状况下,运动补偿单元44可从相邻视频块的多个候选运动向量产生当前视频块的第一运动向量的第一运动预测子。运动补偿单元44还可从包括第一运动向量的多个候选运动向量产生当前视频块的第二运动向量的第二运动预测子。在此状况下,仍可相对于第一运动向量编码第二运动向量,但并不排他性地基于第一运动向量来编码第二运动向量。
通常从相邻视频块的从相同参考图片列表中的相同帧所计算的运动向量产生来自给定参考图片列表的运动向量的运动预测子。然而,当当前帧为GPB帧以使得第一参考图片列表与第二参考图片列表含有相同参考图片的识别符时,可从与相邻视频块的运动向量不同的列表产生运动预测子。举例来说,如果相邻视频块的运动向量指向列表066中的参考图片,运动补偿单元44可从列表066或列表168中的参考图片产生当前视频块的运动向量的第一运动预测子。
在一些状况下,相邻视频块的用以产生第一运动预测子的运动向量可能不可作为当前视频块的第一运动向量用于相同参考图片列表(例如,列表066)中。根据本发明的技术,当相邻视频块的运动向量不可用于列表066中时,运动补偿单元44可从列表168计算第一运动预测子。在最初从列表168计算相邻视频块的运动向量且接着不将相邻视频块的运动向量存储于列表066中时,可发生此情况。作为一额外解决方案,运动估计单元42可存储从两个参考图片列表中的每一参考图片列表所计算的运动向量。举例来说,当运动估计单元42从列表066计算GPB帧中的相邻视频块的运动向量时,运动估计单元42可将所述运动向量存储于列表066及列表168两者中。以此方式,运动补偿单元44可始终从来自任一参考图片列表66、68的相邻视频块的运动向量产生运动预测子。
在运动补偿单元44基于运动向量产生当前视频块的预测性块且产生表示当前视频块的预测信息的语法元素之后,视频编码器20通过从当前视频块减去预测性块而形成残余视频块。变换单元52可从残余块形成一个或一个以上变换单元(TU)。变换单元52将变换(例如,离散余弦变换(DCT)或概念上类似的变换)应用于TU,从而产生包含残余变换系数的视频块。所述变换可将残余块从像素域转换到变换域(例如,频域)。
变换单元52可将所得变换系数发送到量化单元54。量化单元54量化所述变换系数以进一步减小位率。所述量化过程可减小与所述系数中的一些或全部相关联的位深度。可通过调整量化参数而修改量化程度。在一些实例中,量化单元54可接着执行对包括经量化的变换系数的矩阵的扫描。或者,熵编码单元56可执行所述扫描。
在量化之后,熵编码单元56对经量化的变换系数进行熵编码。举例来说,熵编码单元56可执行上下文自适应性可变长度译码(CAVLC)、上下文自适应性二进制算术译码(CABAC)或另一熵编码技术。在通过熵编码单元56进行的熵编码之后,可将经编码的位串流传输到视频解码器(例如,视频解码器30)或将其存档以供稍后传输或检索。
熵编码单元56还可正被译码的当前视频块的运动向量及其它预测语法元素进行熵编码。举例来说,熵编码单元56可建构包括由运动补偿单元44所产生的供在经编码的位串流中传输的适当语法元素的标头信息。在PU或视频块级,语法元素可包括运动向量及运动预测方向。在较高级,语法元素可包括指示是否GPB帧启用于给定视频帧的GPB启用旗标,及指示是否给定视频帧编码为GPB帧的GPB经编码的旗标。视频解码器可使用这些语法元素以检索预测性块,且重建构由视频编码器20所编码的原始视频块。
为对语法元素进行熵编码,熵编码单元56可基于上下文模型将所述语法元素二进制化为一个或一个以上二进制位。在此实例中,熵编码单元56可应用由运动补偿单元44所调适的二进制以将单一位二进制链接到指示相对于优选参考图片中的参考图片的单向预测模式的语法元素。此外,熵编码单元56可基于偏向于优选参考列表的位的概率初始化而将语法元素的位编码为分率位值。
反量化单元58及反变换单元60分别应用反量化及反变换,以在像素域中重建构残余块供稍后用作参考图片的参考块。运动补偿单元44可通过将残余块添加到列表066或列表168内的参考图片中的一者的预测性块来计算参考块。运动补偿单元44还可将一个或一个以上内插滤波器应用于经重建构的残余块以计算次整数像素值以供用于运动估计中。求和器62将经重建构的残余块添加到由运动补偿单元44所产生的运动补偿预测块,以产生参考块以供存储于参考图片存储器64中。参考块可由运动估计单元42及运动补偿单元44用作参考块以对后续视频帧中的块进行帧间预测。
图4为说明视频解码器30的一实例的框图,所述视频解码器30可实施用于有效地译码视频帧的视频块的预测信息的技术。在图4的实例中,视频解码器30包括熵解码单元80、预测单元81、反量化单元86、反变换单元88、求和器90,及参考图片存储器92。预测单元81包括运动补偿单元82及帧内预测单元84。在一些实例中,视频解码器30可执行一般与关于视频编码器20(图3)所描述的编码遍次(pass)互逆的解码遍次。
在解码过程期间,视频解码器30从视频编码器(例如,视频编码器20)接收包括经编码的视频帧及表示译码信息的语法元素的经编码的视频位串流。视频解码器30的熵解码单元80对所述位串流进行熵解码以产生经量化的系数、运动向量及其它预测语法。熵解码单元80将运动向量及其它预测语法转发到预测单元81。视频解码器30可在视频块或PU级、视频片段级、视频帧级及/或视频序列级接收语法元素。
预测单元81的帧内预测单元84可基于用信号发送的帧内预测模式及来自当前帧的先前经解码的块的数据而产生当前视频帧的视频块的预测数据。预测单元81的运动补偿单元82基于从熵解码单元80所接收的运动向量及预测语法产生预测性块。可从包括存储于参考图片存储器92中的参考图片的识别符的第一参考图片列表(列表0)94及/或第二参考图片列表(列表1)96中的一者或一者以上产生预测性块。
运动补偿单元82也可基于内插滤波器执行内插。运动补偿单元82可使用如由视频编码器20在视频块的编码期间使用的内插滤波器,以计算参考块的次整数像素的内插值。运动补偿单元82可根据所接收的语法元素确定由视频编码器20所使用的内插滤波器,且使用所述内插滤波器来产生预测性块。
运动补偿单元82通过剖析运动向量及预测语法而确定当前视频块的预测信息,且使用所述预测信息以产生正经解码的当前视频块的预测性块。运动补偿单元82使用所接收的语法元素中的一些,以确定用以编码当前帧的CU的大小、描述帧的每一CU被分裂的方式的分裂信息、指示每一分裂区被编码的方式的模式(例如,帧内或帧间预测)、帧间预测片段类型(例如,B片段、P片段或GPB片段)、帧的一个或一个以上参考图片列表、帧的每一帧间编码的PU或CU的运动向量、帧的每一帧间编码的PU或CU的运动预测方向,及用以解码当前视频帧的其它信息。
运动补偿单元82可剖析视频帧级或视频序列级的语法,以确定是否GPB帧启用于或允许用于当前视频帧。举例来说,运动补偿单元82可基于在视频帧级或视频序列级的语法中所接收的GPB启用旗标而确定启用GPB帧。GPB启用旗标(关于图3加以更详细描述)可经定义以指示GPB帧经停用、完全启用或部分启用。运动补偿单元82还可剖析视频片段级或视频帧级的语法,以确定当前视频帧的参考图片列表信息。视频解码器30接着存储含有参考图片的识别符的如由语法所指示的列表094及列表196。在当前视频帧为GPB帧时,列表094及列表196含有相同参考图片的识别符。更具体来说,包括于列表094及列表196中的每一者中的图片的数目是相同的,且由列表094中的每一索引条目所指示的图片与由列表196中的相同索引条目所指示的图片相同。
根据本发明的技术,视频解码器30可减少译码视频块的预测信息的成本。举例来说,在单向预测模式的状况下,视频解码器30可使用小于两个位来解码指示使用相对于参考图片列表中的参考图片的单向预测模式及双向预测模式中的一者来译码视频块的一个或一个以上语法元素。参考图片列表可为两个不同参考图片列表中的一个优选参考图片列表,或在启用GPB帧时为两个相同参考图片列表中的任一者。作为另一实例,在双向预测模式的状况下,视频解码器30可联合地解码相对于GPB帧的一个或一个以上视频块中的每一者的两个运动向量,且通过从两个相同参考图片列表所计算的两个运动向量来解码所述视频块中的每一者。可从相同参考图片或类似参考图片计算所述两个运动向量。
首先将描述在单向预测的状况下用于减少译码视频块的预测信息的成本的技术。运动补偿单元82可剖析用于当前视频块的运动预测方向的一个或一个以上语法元素。针对B帧中的视频块的运动预测方向的常规语法元素inter_pred_idc包括用以指示是使用单向预测模式还是双向预测模式来编码所述块的第一位,及用以指示参考图片列表用于单向预测的第二位。在相同参考图片列表的状况下,常规语法元素的第二位可为冗余的,这是因为所述参考图片列表中的任一者可互换地用于单向预测模式。
根据本发明的技术,运动补偿单元82可剖析指示运动预测方向的语法元素的指示使用关于参考图片列表中的参考图片的单向预测来编码当前视频块的减少位的译码。当当前帧被确定为GPB帧以使得列表094与列表196相同时,运动补偿单元82可将所述两个相同参考图片列表互换地用于单向预测模式。
运动补偿单元82可确定是否基于关于图3所描述的明确用信号发送的GPB帧旗标而将当前视频帧编码为GPB帧。运动补偿单元82可在视频片段级、视频帧级或视频序列级接收GPB帧旗标。GPB帧旗标可用以向视频解码器30明确告知当前视频帧编码为GPB帧,以使得通过单一位语法来编码视频块的运动预测方向。明确发信号可使得视频解码器30能够正确剖析单一位语法元素以确定运动预测方向,而不管在视频序列解码期间何时开始。基于GPB帧旗标,视频解码器30可始终明了何时帧为GPB帧,且预期剖析运动预测方向的单一位语法。
在其它状况下,运动补偿单元82可比较列表094与列表196,且确定当列表094与列表196含有相同参考图片时当前帧为GPB帧。然而,所述两个参考图片列表将仅在视频序列的开始时在于解码期间添加或更新任何参考图片之前向视频解码器30呈现为相同的。因此,在视频解码器30开始在视频序列的开始处进行解码时,隐含发信号可仅使得能够对单一位语法元素进行正确剖析。否则,视频解码器30将不知晓帧被编码为GPB帧,且将不预期剖析运动预测方向的单一位语法。
在将GPB帧编码为B片段或P片段时,GPB帧编码的显式或隐含通知可为有必要的。在其它状况下,运动补偿单元82可基于针对GPB帧所定义的新片段类型而确定当前帧为GPB帧,此使得GPB帧编码的任何额外明确或隐含通知为不必要的。
在一个实例中,可针对GPB帧定义单独语法,所述单独语法包含单一位语法元素(例如,bi_pred_flag),所述单一位语法元素经定义以指示是使用单向预测还是双向预测来编码GPB帧的视频块。引入单一位语法元素可避免与上文所描述的常规语法元素(即,inter_pred_idc)混淆。运动补偿单元82可剖析指示使用单向预测来译码GPB帧的当前视频块的单一位语法元素。由于相同参考图片列表94、96中的任一者可用于单向预测模式,所以运动补偿单元82将所述参考图片列表中的任一者用于单向预测。
在另一实例中,可针对GPB帧定义常规语法元素(即,inter_pred_idc)的单一位模式,其中语法元素的仅第一位用以指示是使用单向预测模式还是双向预测模式来编码GPB帧的视频块。运动补偿单元82可剖析语法元素以寻找语法元素的指示使用单向预测来编码视频块的仅第一位。运动补偿单元82将参考图片列表中的任一者用于单向预测。
在一些状况下,运动补偿单元82可解码指派给指示使用相对于参考图片列表中的参考图片的单向预测编码的任何类型的帧间译码帧的视频块的运动预测方向的语法元素的减少位的值。在将视频帧指定为B帧时,参考图片列表可为参考图片列表中最常用于单向预测的一个优选参考图片列表。在将视频帧指定为GPB帧时,参考图片列表可为两个相同参考图片列表中的任一者。
作为一实例,运动补偿单元82可从视频编码器20接收语法中的指示运动预测方向的语法元素的自适应性二进制。运动补偿单元82可在视频块或PU级、CU级、视频片段级、视频帧级或视频序列级中的一者接收自适应性二进制。
根据所接收的自适应性二进制,运动补偿单元82可将指示运动预测方向的语法元素的每一状态与不同二进制自适应性地链接,以使得将单一位二进制链接到相对于优选参考图片列表中的参考图片的单向预测模式。举例来说,运动补偿单元82可调适二进制以使得为0的单一位二进制表示相对于优选参考图片列表中的参考图片的单向预测模式,为10的二进制表示相对于非优选参考图片列表中的参考图片的单向预测模式,且为11的二进制表示双向预测模式。在一些状况下,运动补偿单元82可基于出现指示运动预测方向的语法元素的每一状态的频率而将用于运动预测方向的语法元素独立自适应性地二进制化。基于自适应性二进制,运动补偿单元82可解码经定义以指示使用相对于优选参考列表中的参考图片的单向预测模式来编码当前视频块的语法元素的单一位二进制。
作为另一实例,运动补偿单元82可接收经指派以表示当前视频块的运动预测方向的常规语法元素(即,inter_pred_idc)的值。运动补偿单元82可解码指派给语法元素的经定义以指示使用单向预测模式来编码当前视频块的第一位的单一位值。运动补偿单元82可接着解码指派给语法元素的经定义以指示优选参考图片列表用于单向预测模式的第二位的分率位值。用以表示第二位的分率位值可基于根据配置数据将第二位偏向于优选参考图片列表的概率初始化。较高概率导致用以表示语法元素的较短长度值。第二位指示优选参考图片列表的高概率使得第二位能够由分率位值(即,小于一位)表示。
现在将描述在双向预测的状况下用于减少译码视频块的预测信息的成本的技术。视频解码器30根据从视频编码器20所接收的语法解码当前视频帧的运动向量。运动向量的常规语法元素包括经定义以指示运动向量与运动预测子之间的差的第一语法元素(即,mvd),及经定义以指示供产生运动预测子的参考图片的参考图片列表中的索引的第二语法元素(即,ref_idx)。在当前视频帧被指定为GPB帧以使得列表094及列表196含有相同参考图片的识别符时,第一运动向量及第二运动向量指向相同参考图片或实质上类似的参考图片。因此,GPB帧的视频块的第一运动向量与第二运动向量为高度相关的,且可经联合编码。
根据本发明的技术的一实例,视频解码器30基于语法元素联合地解码GPB帧的当前视频块的第一运动向量及第二运动向量。以此方式,运动补偿单元82可通过减少或消除常规地用以个别解码运动向量的语法元素而减少用以用信号发送运动向量的位。
可用常规方式基于指示第一运动向量与第一运动预测子之间的差的第一语法元素(即,mvd),及指示供产生第一运动预测子的参考图片的列表094中的索引的第二语法元素(即,ref_idx)而解码第一运动向量。运动补偿单元82从由第二语法元素所识别的视频帧中的相邻视频块的运动向量产生当前视频块的第一运动向量的第一运动预测子。以此方式,视频解码器30可基于第一语法元素相对于第一运动预测子解码视频块的第一运动向量。
可接着相对于第一运动向量解码第二运动向量。运动补偿单元82可不从相邻视频块产生第二运动向量的第二运动预测子,而是替代地将第一运动向量用作第二运动预测子。以此方式,视频解码器30可基于第一运动向量与第二运动向量之间的差而解码第二运动向量。在一些实例中,运动补偿单元82可能并不接收针对第二运动向量的任何语法元素。在其它实例中,运动补偿单元82可仅接收经定义以指示第二运动向量与第一运动向量之间的差的第一语法元素。
在一些实例中,可从相邻块的多个运动向量产生当前块的运动向量的运动预测子。在此状况下,运动补偿单元82可从相邻视频块的多个候选运动向量产生当前视频块的第一运动向量的第一运动预测子。运动补偿单元82还可从包括第一运动向量的多个候选运动向量产生当前视频块的第二运动向量的第二运动预测子。在此状况下,仍可相对于第一运动向量解码第二运动向量,但并不排他性地基于第一运动向量来解码第二运动向量。
在当前帧为GPB帧以使得第一参考图片列表与第二参考图片列表含有相同参考图片的识别符时,可从与相邻视频块的运动向量不同的列表产生运动预测子。举例来说,如果相邻视频块的运动向量指向列表094中的参考图片,运动补偿单元82可从列表094或列表196中的参考图片产生当前视频块的运动向量的第一运动预测子。由于列表094及列表196包括呈相同次序的相同参考图片,所以由运动向量的第二语法元素所识别的供产生运动预测子的参考图片的索引指代参考图片列表94、96两者中的相同参考图片。
在一些状况下,相邻视频块的用以产生第一运动预测子的运动向量可能不可作为当前视频块的第一运动向量用于相同参考图片列表(例如,列表094)中。根据本发明的技术,当相邻视频块的运动向量不可用于列表094中时,运动补偿单元82可从列表196计算第一运动预测子。在最初从列表196解码相邻视频块的运动向量且接着不将相邻视频块的运动向量存储于列表094中时,可发生此情况。作为额外解决方案,运动补偿单元82可存储从两个参考图片列表中的每一参考图片列表所解码的运动向量。举例来说,当运动补偿单元解码来自GPB帧中的相邻视频块的列表094的运动向量时,运动补偿单元82可将所述运动向量存储于列表094及列表196两者中。以此方式,运动补偿单元82可始终从来自任一参考图片列表94、96的相邻视频块的运动向量产生运动预测子。
反量化单元86将位串流中所提供且由熵解码单元80解码的经量化的变换系数反量化(即,解量化)。反量化过程可包括使用由视频编码器20所计算的每一CU或视频块的量化参数QPY,以确定量化程度及(同样)应应用的反量化的程度。反变换单元88将反变换(例如,反DCT、反整数变换或概念上类似的反变换过程)应用于变换系数,以便在像素域中产生残余块。
在运动补偿单元82基于运动向量及预测语法元素产生当前视频块的预测性块之后,视频解码器30通过对来自反变换单元88的残余块与由运动补偿单元82所产生的对应预测性块求和而形成经解码的视频块。求和器90表示执行此求和运算的组件。必要时,还可应用解块滤波器来对经解码的块进行滤波,以便移除方块效应假影。接着将经解码的视频块存储于参考图片存储器92中,参考图片存储器92提供参考图片的参考块以用于后续运动补偿。参考图片存储器92还产生经解码的视频以用于在显示装置(例如,图1的显示装置32)上呈现。
图5为说明编码指示使用单向预测模式来译码GPB帧的视频块的单一位语法元素的实例操作的流程图。参考来自图3的视频编码器20来描述所说明的操作。
视频编码器20接收待编码的视频帧的CU或视频块。如果GPB帧启用于或允许用于当前视频帧,则视频编码器20将GPB启用旗标用信号发送到解码器(例如,视频解码器30),以指示启用GPB帧(98)。视频编码器20可在视频帧级或视频序列级的语法中用信号发送GPB启用旗标。GPB启用旗标可经定义以指示GPB帧经停用、完全启用或部分启用。当完全启用GPB帧时,可将最初指定的P帧视为具有针对每一块的一个或两个运动向量的GPB帧。当部分启用GPB帧时,可将P帧、B帧及GPB帧概念视为相异概念。
视频编码器20接着确定将当前视频帧编码为GPB帧(100)。在一些状况下,视频编码器20的运动估计单元42可经配置以根据视频序列的预定型样而确定视频帧的帧间预测模式。预定型样可将序列中的一个或一个以上视频帧指定为GPB帧。在其它状况下,运动估计单元42可确定是否将最初指定的P帧编码为GPB帧。后一状况可视GPB帧是经完全启用还是经部分启用而定。
任选地,视频编码器20可将GPB帧旗标用信号发送到视频解码器30以指示当前视频帧编码为GPB帧(102)。视频编码器20可在视频片段级、视频帧级或视频序列级中的一者的语法中用信号发送GPB帧旗标。GPB帧旗标可用以向视频解码器30明确告知序列内的给定帧编码为GPB帧以使得通过减少位的语法来编码运动预测方向。然而,在一些状况下,视频编码器20可能不明确用信号发送GPB帧编码。在所述状况下,视频编码器20可隐含地向视频解码器30用信号表示在参考图片列表相同时将给定帧编码为GPB帧。在将GPB帧编码为B帧或P帧时,GPB帧编码的显式或隐含通知可为有必要的。在其它状况下,可定义GPB帧的新帧或片段类型,此使得GPB帧编码的任何额外明确或隐含通知为不必要的。
在确定当前视频帧编码为GPB帧时,视频编码器20将GPB帧的含有相同参考图片的识别符的第一参考图片列表(列表0)66及第二参考图片列表(列表1)68存储于存储器中(104)。由于列表066及列表168包括相同参考图片,所以视频编码器20的运动补偿单元44可将所述两个相同参考图片列表中的任一者互换地用于单向预测。
视频编码器20使用相对于参考图片列表中的任一者中的参考图片的单向预测来编码GPB帧的一个或一个以上视频块(106)。根据本发明的技术,运动补偿单元44接着产生表示使用单向预测编码的视频块中的每一者的运动预测方向的单一位语法。在一些状况下,可针对GPB帧定义单独语法,所述单独语法包含单一位语法元素,所述单一位语法元素经定义以指示是使用单向预测还是双向预测来编码视频块(108)。引入单一位语法元素可避免与常规语法元素混淆,常规语法元素包括经定义以指示是使用单向预测还是双向预测来编码块的第一位,及经定义以指示哪一参考图片列表用于单向预测的第二位。
当针对GPB帧定义单独语法元素(108的“是”分支)时,运动补偿单元44产生单一位语法元素。视频编码器20编码针对视频块中的每一者的单一位语法元素以指示使用单向预测来编码视频块(110)。无必要明确用信号发送参考图片列表中的哪一者用以编码GPB帧的视频块,这是因为所述相同参考图片列表中的任一者可用于单向预测。
当尚未针对GPB帧定义单独语法元素(108的“否”分支)时,运动补偿单元44可仅产生常规语法元素的第一位。视频编码器20仅编码针对视频块中的每一者的语法元素的第一位以指示使用单向预测来编码视频块(112)。运动补偿单元44可消除针对GPB帧的视频块的语法元素的第二位,这是因为所述参考图片列表中的任一者可用于单向预测(114)。在任一状况下,视频编码器20在块或PU级将关于GPB帧的每一视频块的运动预测方向连同运动向量信息的单一位语法用信号发送到视频解码器。
图6为说明解码指示使用单向预测模式来译码GPB帧的视频块的单一位语法元素的实例操作的流程图。参考来自图4的视频解码器30来描述所说明的操作。
视频解码器30从对应视频编码器(例如,视频编码器20)接收包括表示译码信息的经编码的视频帧及语法元素的位串流(116)。视频解码器30可在视频块或PU级、视频片段级、视频帧级及/或视频序列级接收语法元素。视频解码器30的熵解码单元80对所述位串流进行熵解码以产生经量化的系数、运动向量及其它预测语法。熵解码单元80将运动向量及其它预测语法转发到预测单元81的运动补偿单元82。运动补偿单元82接着确定GPB帧经启用或允许用于当前视频帧(117)。运动补偿单元82可通过在视频帧级或视频序列级的语法基于所接收的GPB启用旗标而确定GPB帧经启用。GPB启用旗标可经定义以指示GPB帧经停用、完全启用或部分启用。
视频解码器30将含有相同参考图片的识别符的如在视频帧级的语法中所指示的第一参考图片列表(列表0)94及第二参考图片列表(列表1)96存储于存储器中(118)。运动补偿单元82接着确定当前视频帧编码为GPB帧(120)。在一些状况下,运动补偿单元82可基于在视频片段级、视频帧级或视频序列级的语法中所接收的明确用信号发送的GPB帧旗标而确定给定帧为GPB帧。在其它状况下,运动补偿单元82可在第一参考图片列表94及第二参考图片列表96含有相同参考图片时确定给定帧为GPB帧。在将GPB帧编码为B帧或P帧时,GPB帧编码的显式或隐含通知可为有必要的。在另外状况下,运动补偿单元82可基于针对GPB帧所定义的新帧或片段类型而确定给定帧为GPB帧,此使得GPB帧编码的任何额外明确或隐含通知为不必要的。
在确定当前帧为GPB帧时,运动补偿单元82变得明了,使用单向预测编码的BGP帧中的每一视频块的运动预测方向可由单一位语法表示。由于列表094及列表196包括相同参考图片,所以运动补偿单元82可将所述两个相同参考图片列表中的任一者互换地用于单向预测。
在一些状况下,可针对GPB帧定义单独语法,所述单独语法包含单一位语法元素,所述单一位语法元素经定义以指示是使用单向预测还是双向预测来编码视频块(124)。引入单一位语法元素可避免与常规语法元素混淆,常规语法元素包括用以指示是使用单向预测还是双向预测来编码块的第一位,及用以指示哪一参考图片列表是用于单向预测的第二位。
当针对GPB帧定义单独语法元素(124的“是”分支)时,运动补偿单元82剖析指示使用单向预测来编码视频块的单一位语法元素(126)。由于相同参考图片列表中的任一者可用于单向预测模式,所以运动补偿单元82将所述参考图片列表中的一者用于单向预测。当尚未针对GPB帧定义单独语法元素(122的“否”分支)时,运动补偿单元82剖析语法元素以寻找语法元素的指示使用单向预测来编码视频块的仅第一位(128)。运动补偿单元82将参考图片列表中的任一者用于单向预测模式。在任一状况下,视频解码器30接着使用来自优选参考图片列表的单向预测来解码GPB帧的一个或一个以上视频块(130)。
图7为说明使用小于两个位来编码指示使用来自参考图片列表的单向预测模式来译码视频块的一个或一个以上语法元素的一实例操作的流程图。参考来自图3的视频编码器20来描述所说明的操作。
视频编码器20接收待编码的视频帧的CU或视频块。视频编码器20接着确定当前视频帧的编码模式(132)。在一些状况下,视频编码器20的运动估计单元42可经配置以根据视频序列的预定型样而确定视频帧的帧间预测模式。所述预定型样可将序列中的视频帧指定为P帧及/或B帧。在一些状况下,可启用GPB帧以使得一个或一个以上视频帧可经指定为GPB帧,或运动估计单元42可确定将最初指定的P帧编码为GPB帧。
在确定当前视频帧编码为GPB帧(134的“是”分支)时,视频编码器20将GPB帧的含有相同参考图片的识别符的第一参考图片列表(列表0)66及第二参考图片列表(列表1)68存储于存储器中(136)。由于列表066及列表168包括相同参考图片,所以视频编码器20的运动补偿单元44可将所述两个相同参考图片列表中的任一者作为优选参考图片列表用于单向预测模式。
在确定当前视频帧编码为P帧或B帧(138的“否”分支)时,视频编码器20将所述帧的含有不同参考图片的识别符的第一参考图片列表(列表0)66及第二参考图片列表(列表1)68存储于存储器中(138)。常规地,列表066含有过去参考图片的识别符,且列表168含有未来参考图片的识别符。在一些状况下,运动补偿单元44可确定两个参考图片列表中的哪一者包含用于单向预测的优选参考图片列表(139)。在与基于所述参考图片列表的一者相比,最常基于所述参考图片列表中的另一者执行针对B帧的单向预测时可能会发生这种状况。举例来说,与P帧类似,可通常基于来自列表066的过去参考图片来执行针对B帧的单向预测。在所述实例中,运动补偿单元44可确定出列表066为优选参考图片列表。
视频编码器20使用相对于优选参考图片列表中的参考图片的单向预测模式来编码当前视频帧的一个或一个以上视频块(140)。根据本发明的技术,运动补偿单元44接着产生指示视频块中的每一者的运动预测方向的一个或一个以上语法元素。视频编码器20指派一值以表示运动预测方向的语法元素。视频编码器20接着在块或PU级将指派给针对当前视频帧的每一视频块的运动预测方向连同运动向量信息的语法元素的值用信号发送到视频解码器。
在一些状况下,熵编码单元56可将每一语法元素二进制化为一位或二进制位的序列。运动预测方向的常规语法元素包括用以指示是使用单向预测还是双向预测来编码块的第一位,及用以指示哪一参考图片列表是用于单向预测的第二位。常规地,为0的二进制表示双向预测,为10的二进制表示从列表0的单向预测,且为11的二进制表示从列表1的单向预测。
在所说明的实例中,运动补偿单元44可将单一位二进制自适应性地链接到指示相对于优选参考图片列表的单向预测模式的语法元素(142)。运动补偿单元44可基于出现指示运动预测方向的语法元素的每一状态的频率而调适二进制。当与其它预测模式相比,更常使用来自优选参考图片列表的单向预测时,将为0的单一位二进制与来自优选参考图片列表中的参考图片的单向预测模式链接可能更有效。举例来说,在列表0为优选参考图片列表的状况下,运动补偿单元44可调适二进制以使得为0的单一位二进制表示相对于列表0中的参考图片的单向预测模式,为10的二进制表示相对于列表1中的参考图片的单向预测模式,且为11的二进制表示双向预测模式。
视频编码器20可接着将指示运动预测方向的语法元素的自适应性二进制用信号发送到对应视频解码器(例如,视频解码器30)(144)。运动补偿单元44可在视频块或PU级、CU级、视频片段级、视频帧级或视频序列级中的一者调适且用信号发送二进制。
图8为说明使用小于两个位来编码指示使用相对于参考图片列表中的参考图片的单向预测模式来译码视频块的一个或一个以上语法元素的另一实例操作的流程图。参考来自图3的视频编码器20来描述所说明的操作。
视频编码器20接收待编码的视频帧的CU或视频块。视频编码器20接着确定当前视频帧的编码模式(150)。在一些状况下,视频编码器20的运动估计单元42可经配置以根据视频序列的预定型样而确定视频帧的帧间预测模式。所述预定型样可将序列中的视频帧指定为P帧及/或B帧。在一些状况下,可启用GPB帧以使得一个或一个以上视频帧可经指定为GPB帧,或运动估计单元42可确定将最初指定的P帧编码为GPB帧。
在确定当前视频帧将编码为GPB帧(152的“是”分支)时,视频编码器20将GPB帧的含有相同参考图片的识别符的第一参考图片列表(列表0)66及第二参考图片列表(列表1)68存储于存储器中(154)。由于列表066及列表168包括相同参考图片,所以视频编码器20的运动补偿单元44可将所述两个相同参考图片列表中的任一者作为优选参考图片列表用于单向预测模式。
在确定当前视频帧将编码为P帧或B帧(152的“否”分支)时,视频编码器20将所述帧的含有不同参考图片的识别符的第一参考图片列表(列表0)66及第二参考图片列表(列表1)68存储于存储器中(156)。常规地,列表066含有过去参考图片的识别符,且列表168含有未来参考图片的识别符。在一些状况下,运动补偿单元44可确定两个参考图片列表中的哪一者包含用于单向预测的优选参考图片列表(157)。在与基于所述参考图片列表的一者相比,最常基于所述参考图片列表中的另一者执行针对B帧的单向预测时可能出现这种状况。举例来说,与P帧类似,可通常基于来自列表066的过去参考图片来执行针对B帧的单向预测。在所述实例中,运动补偿单元44可确定出列表066为优选参考图片列表。
视频编码器20使用相对于优选参考图片列表中的参考图片的单向预测模式来编码当前视频帧的一个或一个以上视频块(158)。根据本发明的技术,运动补偿单元44接着产生指示视频块中的每一者的运动预测方向的一个或一个以上语法元素。视频编码器20指派一值以表示运动预测方向的语法元素。视频编码器20接着在块或PU级将指派给针对当前视频帧的每一视频块的运动预测方向连同运动向量信息的语法元素的值用信号发送到视频解码器。
运动预测方向的常规语法元素包括用以指示是使用单向预测还是双向预测来编码块的第一位,及用以指示哪一参考图片列表是用于单向预测的第二位。对于每一位,熵编码单元56基于上下文而估计位为1或0的概率。较高概率导致用以编码语法元素的较短长度值。在一些状况下,值可包含分率位,即,小于一位。
在所说明的实例中,运动补偿单元44可参考将语法元素的概率偏向于优选参考图片列表的配置数据(160)。当对于单向预测参考,图片列表中的一者比另一参考图片列表优选时,增加语法元素在单向预测模式的状况下指示优选参考图片列表的概率可能更有效。举例来说,运动补偿单元44可根据配置数据将语法元素的第二位的状态值设定成0以使得位为0(即,指示列表0)的概率为0.9999。
视频编码器20将单一位值指派给关于视频块中的每一者的运动预测方向的语法元素的第一位以指示使用单向预测模式来编码视频块(162)。视频编码器20接着将分率位值指派给关于视频块中的每一者的运动预测方向的语法元素的第二位以指示优选参考图片列表用于单向预测模式(164)。
图9为说明联合地译码使用双向预测编码的GPB帧的视频块的第一运动向量及第二运动向量的一实例操作的流程图。参考来自图3的视频编码器20及来自图4的视频解码器30两者来描述所说明的操作。
首先,将参考来自图3的视频编码器20来描述联合编码运动向量的操作。视频编码器20接收待编码的视频帧的CU或视频块。视频编码器20接着确定当前视频帧为GPB帧(170)。在一些状况下,视频编码器20的运动估计单元42可经配置以根据视频序列的预定型样而确定视频帧的帧间预测模式。所述预定型样可将序列中的一个或一个以上视频帧指定为GPB帧。在其它状况下,运动估计单元42可确定是否将最初指定的P帧编码为GPB帧。后一状况可视GPB帧是经完全启用还是经部分启用而定。
在确定当前视频帧编码为GPB帧时,视频编码器20将GPB帧的含有相同参考图片的识别符的第一参考图片列表(列表0)66及第二参考图片列表(列表1)68存储于存储器中(172)。在双向预测的状况下,视频编码器20的运动估计单元42计算针对GPB帧的一个或一个以上视频块中的每一者的来自列表066的第一运动向量及来自列表168的第二运动向量。视频编码器20接着使用双向预测通过来自列表066的第一运动向量及来自列表168的第二运动向量来编码GPB帧的一个或一个以上视频块(174)。
根据本发明的教示,运动补偿单元44可减少用以用信号发送使用双向预测编码的视频块中的每一者的运动向量信息的位。由于列表066及列表168包括相同参考图片,所以从相同参考图片或实质上类似的参考图片计算第一运动向量及第二运动向量。因此,GPB帧的视频块的第一运动向量与第二运动向量为高度相关的,且联合地编码所述两个运动向量更为有效。
运动补偿单元44从来自列表066的相邻视频块的运动向量产生当前视频块的第一运动向量的第一运动预测子(176)。视频编码器20相对于第一运动预测子编码视频块的第一运动向量(178)。可用常规方式将第一运动向量编码为经定义以指示第一运动向量与第一运动预测子之间的差的第一语法元素及经定义以指示供产生第一运动预测子的参考图片的列表066中的索引的第二语法元素。
视频编码器20接着相对于第一运动向量编码视频块的第二运动向量(180)。运动补偿单元44可减少或消除常规地用以表示第二运动向量的语法元素。以此方式,可将第二运动向量编码为第一运动向量与第二运动向量之间的差。视频编码器20在块或PU级将GPB帧的每一视频块的经联合译码的运动向量连同其它预测语法一起用信号发送到视频解码器。
第二,将描述联合解码运动向量的操作。视频解码器30从对应视频编码器(例如,视频编码器20)接收包括表示译码信息的经编码的视频帧及语法元素的位串流。视频解码器30可在视频块或PU级、视频片段级、视频帧级及/或视频序列级接收语法元素。视频解码器30的熵解码单元80对所述位串流进行熵解码以产生经量化的系数、运动向量及其它预测语法。熵解码单元80将运动向量及其它预测语法转发到预测单元81的运动补偿单元82。
运动补偿单元82接着确定当前视频帧为GPB帧(170)。在一些状况下,运动补偿单元82可基于在视频片段级、视频帧级或视频序列级的语法中所接收的明确用信号发送的GPB帧旗标而确定给定帧为GPB帧。在其它状况下,运动补偿单元82可在视频帧级的语法中所接收的第一参考图片列表及第二参考图片列表含有相同参考图片时确定给定帧为GPB帧。在额外状况中,运动补偿单元82可基于针对GPB帧所定义的新帧或片段类型而确定给定帧为GPB帧。
视频解码器30将含有相同参考图片的识别符的如在视频帧级的语法中所指示的第一参考图片列表(列表0)94及第二参考图片列表(列表1)96存储于存储器中(172)。在双向预测的状况下,视频解码器30使用双向预测通过来自列表094的第一运动向量及来自列表196的第二运动向量解码GPB帧的一个或一个以上视频块(174)。
根据本发明的技术,视频解码器30基于在视频块或PU级所接收的语法元素而联合地解码用以解码GPB帧的视频块的第一运动向量及第二运动向量。可用常规方式基于指示第一运动向量与第一运动预测子之间的差的第一语法元素及指示供产生第一运动预测子的参考图片的列表094中的索引的第二语法元素而解码第一运动向量。运动补偿单元82从由第二语法元素所识别的相邻视频块的运动向量产生当前视频块的第一运动向量的第一运动预测子(176)。视频解码器30基于第一语法元素相对于第一运动预测子解码视频块的第一运动向量(178)。
视频解码器30接着相对于第一运动向量解码视频块的第二运动向量(180)。运动补偿单元82可减少或消除常规地用以解码第二运动向量的语法元素。以此方式,可基于第一运动向量与第二运动向量之间的差来解码第二运动向量。
在一个或一个以上实例中,所描述的功能可在硬件、软件、固件或其任何组合中实施。如果在软件中实施,则功能可作为一个或一个以上指令或代码而存储于计算机可读媒体上或经由计算机可读媒体而传输,且通过基于硬件的处理单元执行。计算机可读媒体可包括对应于有形媒体(例如,数据存储媒体)的计算机可读存储媒体或通信媒体,通信媒体包括促进(例如)根据通信协议将计算机程序从一处传送到另一处的任何媒体。以此方式,计算机可读媒体一般可对应于(1)为非瞬时的有形计算机可读存储媒体或(2)例如信号或载波的通信媒体。数据存储媒体可为可由一个或一个以上计算机或一个或一个以上处理器存取以检索指令、代码及/或数据结构以用于实施本发明中所描述的技术的任何可用媒体。计算机程序产品可包括计算机可读媒体。
作为实例而非限制,这些计算机可读存储媒体可包含RAM、ROM、EEPROM、CD-ROM或其它光盘存储设备、磁盘存储设备或其它磁性存储装置、闪存,或可用以存储呈指令或数据结构的形式的所要程序代码且可由计算机存取的任何其它媒体。又,将任何连接适当地称为计算机可读媒体。举例来说,如果使用同轴电缆、光纤缆线、双绞线、数字用户线(DSL)或例如红外线、无线电及微波的无线技术而从网站、服务器或其它远程源传输指令,则将同轴电缆、光纤缆线、双绞线、DSL或例如红外线、无线电及微波的无线技术包括于媒体的定义中。然而,应理解,计算机可读存储媒体及数据存储媒体不包括连接、载波、信号或其它暂时性媒体,而是替代地针对非暂时性有形存储媒体。如本文中所使用,磁盘及光盘包括压缩光盘(CD)、激光光盘、光学光盘、数字多功能光盘(DVD)、软性磁盘及蓝光光盘,其中磁盘通常以磁性方式再现数据,而光盘通过激光以光学方式再现数据。上述各者的组合也应包括于计算机可读媒体的范畴内。
指令可由例如以下各者的一个或一个以上处理器执行:一个或一个以上数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA)或其它等效集成或离散逻辑电路。因此,如本文中所使用的术语“处理器”可指代前述结构或适于实施本文中所描述的技术的任何其它结构中的任一者。另外,在一些方面中,可将本文所描述的功能性提供于经配置以用于编码及解码的专用硬件及/或软件模块内,或并入组合的编解码器中。又,所述技术可完全实施于一个或一个以上电路或逻辑元件中。
可在包括无线手持机、集成电路(IC)或一组IC(例如,芯片组)的多种装置或设备中实施本发明的技术。本发明中描述了各种组件、模块或单元以强调经配置以执行所揭示的技术的装置的功能方面,但不必需要通过不同硬件单元实现所述组件、模块或单元。更确切来说,如上文所描述,各种单元可组合于编解码器硬件单元中或由交互操作的硬件单元的集合(包括如上文所描述的一个或一个以上处理器)结合合适的软件及/或固件来提供。

Claims (40)

1.一种译码视频数据的方法,其包含:
存储第一参考图片列表及第二参考图片列表,其中所述第一参考图片列表与所述第二参考图片列表相同;
使用双向预测通过来自所述第一参考图片列表中的参考图片的第一运动向量及来自所述第二参考图片列表中的参考图片的第二运动向量来译码指定为广义P/BGPB帧的视频帧的视频块;及
联合地译码所述视频块的所述第一运动向量及所述第二运动向量。
2.根据权利要求1所述的方法,其中联合地译码所述第一运动向量及所述第二运动向量包含在所述第一运动向量及所述第二运动向量指向同一参考图片时联合地译码所述第一运动向量及所述第二运动向量。
3.根据权利要求1所述的方法,其中联合地译码所述第一运动向量及所述第二运动向量包含在所述第一运动向量及所述第二运动向量指向实质上类似的参考图片时联合地译码所述第一运动向量及所述第二运动向量。
4.根据权利要求1所述的方法,其中联合地译码所述第一运动向量及所述第二运动向量包含:
相对于从相邻视频块的运动向量所产生的第一运动预测子译码所述第一运动向量;及
相对于所述第一运动向量译码所述第二运动向量。
5.根据权利要求4所述的方法,其进一步包含:
从相邻视频块的一个或一个以上候选运动向量产生所述第一运动向量的所述第一运动预测子;及
从包括所述第一运动向量的一个或一个以上候选运动向量产生所述第二运动向量的第二运动预测子。
6.根据权利要求4所述的方法,其进一步包含,在所述第一运动向量及所述第二运动向量指向不同参考图片时,根据在将所述第一运动向量用作所述第二运动向量的第二运动预测子之前在所述第一运动向量与所述第二运动向量之间的时间距离而按比例调整所述第一运动向量。
7.根据权利要求4所述的方法,
其中译码所述第一运动向量包含译码经定义以指示所述第一运动向量与所述第一运动预测子之间的差的第一语法元素,及译码经定义以指示供产生所述第一运动预测子的所述参考图片的所述第一参考图片列表及所述第二参考图片列表中的一者中的索引的第二语法元素;且
其中译码所述第二运动向量包含译码所述第二运动向量与所述第一运动向量之间的差。
8.根据权利要求4所述的方法,其中所述相邻视频块的所述运动向量指向所述第一参考图片列表中的参考图片,所述方法进一步包含从所述第一参考图片列表或所述第二参考图片列表中的所述参考图片产生所述第一运动预测子。
9.根据权利要求8所述的方法,其进一步包含在所述相邻视频块的所述运动向量不可从所述第一参考图片列表获得时从所述第二参考图片列表中的所述参考图片产生所述第一运动预测子。
10.根据权利要求8所述的方法,其进一步包含:
使用单向预测模式通过来自所述第一参考图片列表中的所述参考图片的所述运动向量来译码所述相邻视频块;及
存储所述第一参考图片列表及所述第二参考图片列表两者中的所述运动向量的数据。
11.一种视频译码装置,其包含:
存储器,所述存储器存储第一参考图片列表及第二参考图片列表,其中所述第一参考图片列表与所述第二参考图片列表相同;及
处理器,所述处理器使用双向预测模式通过来自所述第一参考图片列表中的参考图片的第一运动向量及来自所述第二参考图片列表中的参考图片的第二运动向量来译码指定为广义P/B GPB帧的视频帧的视频块,且联合地译码所述视频块的所述第一运动向量及所述第二运动向量。
12.根据权利要求11所述的视频译码装置,其中所述处理器在所述第一运动向量及所述第二运动向量指向同一参考图片时联合地译码所述第一运动向量及所述第二运动向量。
13.根据权利要求11所述的视频译码装置,其中所述处理器在所述第一运动向量及所述第二运动向量指向实质上类似的参考图片时联合地译码所述第一运动向量及所述第二运动向量。
14.根据权利要求11所述的视频译码装置,其中所述处理器:
相对于从相邻视频块的运动向量所产生的第一运动预测子译码所述第一运动向量;及
相对于所述第一运动向量译码所述第二运动向量。
15.根据权利要求14所述的视频译码装置,其中所述处理器:
从相邻视频块的一个或一个以上候选运动向量产生所述第一运动向量的所述第一运动预测子;及
从包括所述第一运动向量的一个或一个以上候选运动向量产生所述第二运动向量的第二运动预测子。
16.根据权利要求14所述的视频译码装置,其中在所述第一运动向量及所述第二运动向量指向不同参考图片时,所述处理器根据在将所述第一运动向量用作所述第二运动向量的第二运动预测子之前在所述第一运动向量与所述第二运动向量之间的时间距离而按比例调整所述第一运动向量。
17.根据权利要求14所述的视频译码装置,其中所述处理器:
将所述第一运动向量译码为经定义以指示所述第一运动向量与所述第一运动预测子之间的差的第一语法元素,及经定义以指示供产生所述第一运动预测子的所述参考图片的所述第一参考图片列表及所述第二参考图片列表中的一者中的索引的第二语法元素;及
将所述第二运动向量译码为所述第二运动向量与所述第一运动向量之间的差。
18.根据权利要求14所述的视频译码装置,其中所述相邻视频块的所述运动向量指向所述第一参考图片列表中的参考图片,且其中所述处理器从所述第一参考图片列表或所述第二参考图片列表中的所述参考图片产生所述第一运动预测子。
19.根据权利要求18所述的视频译码装置,其中所述处理器在所述相邻视频块的所述运动向量不可从所述第一参考图片列表获得时从所述第二参考图片列表中的所述参考图片产生所述第一运动预测子。
20.根据权利要求18所述的视频译码装置,其中所述处理器:
使用单向预测模式通过来自所述第一参考图片列表中的所述参考图片的所述运动向量来译码所述相邻视频块;及
存储所述第一参考图片列表及所述第二参考图片列表两者中的所述运动向量的数据。
21.一种视频译码装置,其包含:
用于存储第一参考图片列表及第二参考图片列表的装置,其中所述第一参考图片列表与所述第二参考图片列表相同;
用于使用双向预测模式通过来自所述第一参考图片列表中的参考图片的第一运动向量及来自所述第二参考图片列表中的参考图片的第二运动向量来译码指定为广义P/B GPB帧的视频帧的视频块的装置;及
用于联合地译码所述视频块的所述第一运动向量及所述第二运动向量的装置。
22.根据权利要求21所述的视频译码装置,其中用于联合地译码所述第一运动向量及所述第二运动向量的所述装置包含用于在所述第一运动向量及所述第二运动向量指向同一参考图片时联合地译码所述第一运动向量及所述第二运动向量的装置。
23.根据权利要求21所述的视频译码装置,其中用于联合地译码所述第一运动向量及所述第二运动向量的所述装置包含用于在所述第一运动向量及所述第二运动向量指向实质上类似的参考图片时联合地译码所述第一运动向量及所述第二运动向量的装置。
24.根据权利要求21所述的视频译码装置,其进一步包含:
用于相对于从相邻视频块的运动向量所产生的第一运动预测子译码所述第一运动向量的装置;及
用于相对于所述第一运动向量译码所述第二运动向量的装置。
25.根据权利要求24所述的视频译码装置,其进一步包含:
用于从相邻视频块的一个或一个以上候选运动向量产生所述第一运动向量的所述第一运动预测子的装置;及
用于从包括所述第一运动向量的一个或一个以上候选运动向量产生所述第二运动向量的第二运动预测子的装置。
26.根据权利要求24所述的视频译码装置,其进一步包含在所述第一运动向量及所述第二运动向量指向不同参考图片时用于根据在将所述第一运动向量用作所述第二运动向量的第二运动预测子之前在所述第一运动向量与所述第二运动向量之间的时间距离而按比例调整所述第一运动向量的装置。
27.根据权利要求24所述的视频译码装置,其进一步包含:
用于将所述第一运动向量译码为经定义以指示所述第一运动向量与所述第一运动预测子之间的差的第一语法元素,及经定义以指示供产生所述第一运动预测子的所述参考图片的所述第一参考图片列表及所述第二参考图片列表中的一者中的索引的第二语法元素的装置;及
用于将所述第二运动向量译码为所述第二运动向量与所述第一运动向量之间的差的装置。
28.根据权利要求24所述的视频译码装置,其中所述相邻视频块的所述运动向量指向所述第一参考图片列表中的参考图片,所述视频译码装置进一步包含用于从所述第一参考图片列表或所述第二参考图片列表中的所述参考图片产生所述第一运动预测子的装置。
29.根据权利要求28所述的视频译码装置,其进一步包含用于在所述相邻视频块的所述运动向量不可从所述第一参考图片列表获得时从所述第二参考图片列表中的所述参考图片产生所述第一运动预测子的装置。
30.根据权利要求28所述的视频译码装置,其进一步包含:
用于使用单向预测模式通过来自所述第一参考图片列表中的所述参考图片的所述运动向量来译码所述相邻视频块的装置;及
用于存储所述第一参考图片列表及所述第二参考图片列表两者中的所述运动向量的数据的装置。
31.一种包含用于译码视频数据的指令的计算机可读存储媒体,所述指令在于处理器中执行时使所述处理器:
存储第一参考图片列表及第二参考图片列表,其中所述第一参考图片列表与所述第二参考图片列表相同;
使用双向预测通过来自所述第一参考图片列表的第一运动向量及来自所述第二参考图片列表的第二运动向量来译码指定为广义P/B GPB帧的视频帧的视频块;及
联合地译码所述视频块的所述第一运动向量及所述第二运动向量。
32.根据权利要求31所述的计算机可读存储媒体,其中所述指令使所述处理器在所述第一运动向量及所述第二运动向量指向同一参考图片时联合地译码所述第一运动向量及所述第二运动向量。
33.根据权利要求31所述的计算机可读存储媒体,其中所述指令使所述处理器在所述第一运动向量及所述第二运动向量指向实质上类似的参考图片时联合地译码所述第一运动向量及所述第二运动向量。
34.根据权利要求31所述的计算机可读存储媒体,其中所述指令使所述处理器:
相对于从相邻视频块的运动向量所产生的第一运动预测子译码所述第一运动向量;及相对于所述第一运动向量译码所述第二运动向量。
35.根据权利要求34所述的计算机可读存储媒体,其进一步包含使所述处理器进行以下操作的指令:
从相邻视频块的一个或一个以上候选运动向量产生所述第一运动向量的所述第一运动预测子;及
从包括所述第一运动向量的一个或一个以上候选运动向量产生所述第二运动向量的第二运动预测子。
36.根据权利要求34所述的计算机可读存储媒体,其进一步包含在所述第一运动向量及所述第二运动向量指向不同参考图片时使所述处理器根据在将所述第一运动向量用作所述第二运动向量的第二运动预测子之前在所述第一运动向量与所述第二运动向量之间的时间距离而按比例调整所述第一运动向量的指令。
37.根据权利要求34所述的计算机可读存储媒体,其中所述指令使所述处理器:
将所述第一运动向量译码为经定义以指示所述第一运动向量与所述第一运动预测子之间的差的第一语法元素,及经定义以指示供产生所述第一运动预测子的所述参考图片的所述第一参考图片列表及所述第二参考图片列表中的一者中的索引的第二语法元素;及
将所述第二运动向量译码为所述第二运动向量与所述第一运动向量之间的差。
38.根据权利要求34所述的计算机可读存储媒体,其中所述相邻视频块的所述运动向量指向所述第一参考图片列表中的参考图片,所述计算机可读存储媒体进一步包含使所述处理器从所述第一参考图片列表或所述第二参考图片列表中的任一者中的所述参考图片产生所述第一运动预测子的指令。
39.根据权利要求38所述的计算机可读存储媒体,其进一步包含使所述处理器在所述相邻视频块的所述运动向量不可从所述第一参考图片列表获得时从所述第二参考图片列表中的所述参考图片产生所述第一运动预测子的指令。
40.根据权利要求38所述的计算机可读存储媒体,其进一步包含使所述处理器进行以下操作的指令:
使用单向预测通过来自所述第一参考图片列表中的所述参考图片的所述运动向量来译码所述相邻视频块;及
存储所述第一参考图片列表及所述第二参考图片列表两者中的所述运动向量的数据。
CN201180036600.8A 2010-07-28 2011-07-20 Gpb帧中的双向运动向量的联合译码 Expired - Fee Related CN103039074B (zh)

Applications Claiming Priority (15)

Application Number Priority Date Filing Date Title
US36852910P 2010-07-28 2010-07-28
US61/368,529 2010-07-28
US37658310P 2010-08-24 2010-08-24
US61/376,583 2010-08-24
US37930310P 2010-09-01 2010-09-01
US61/379,303 2010-09-01
US40738910P 2010-10-27 2010-10-27
US61/407,389 2010-10-27
US41466810P 2010-11-17 2010-11-17
US61/414,668 2010-11-17
US201161500029P 2011-06-22 2011-06-22
US61/500,029 2011-06-22
US13/179,427 2011-07-08
US13/179,427 US9357229B2 (en) 2010-07-28 2011-07-08 Coding motion vectors in video coding
PCT/US2011/044730 WO2012015649A2 (en) 2010-07-28 2011-07-20 Coding motion vectors in video coding

Publications (2)

Publication Number Publication Date
CN103039074A true CN103039074A (zh) 2013-04-10
CN103039074B CN103039074B (zh) 2015-12-16

Family

ID=45526691

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201180036841.2A Expired - Fee Related CN103026709B (zh) 2010-07-28 2011-07-20 用于视频译码的帧间预测模式和参考图片列表索引的译码
CN201180036600.8A Expired - Fee Related CN103039074B (zh) 2010-07-28 2011-07-20 Gpb帧中的双向运动向量的联合译码

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201180036841.2A Expired - Fee Related CN103026709B (zh) 2010-07-28 2011-07-20 用于视频译码的帧间预测模式和参考图片列表索引的译码

Country Status (12)

Country Link
US (2) US9357229B2 (zh)
EP (3) EP2599313B1 (zh)
JP (2) JP5551317B2 (zh)
KR (2) KR101460921B1 (zh)
CN (2) CN103026709B (zh)
AU (1) AU2011283039A1 (zh)
BR (1) BR112013002055A2 (zh)
CA (1) CA2805883A1 (zh)
RU (1) RU2013108810A (zh)
SG (1) SG187137A1 (zh)
TW (2) TW201215162A (zh)
WO (2) WO2012015649A2 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104994391A (zh) * 2015-06-26 2015-10-21 福州瑞芯微电子有限公司 一种高效的VP9熵解码prob数据获取方法及设备
CN106303544A (zh) * 2015-05-26 2017-01-04 华为技术有限公司 一种视频编解码方法、编码器和解码器
CN107079161A (zh) * 2014-09-01 2017-08-18 寰发股份有限公司 用于屏幕内容以及视频编码的帧内图片块复制的方法
CN109792526A (zh) * 2016-09-30 2019-05-21 高通股份有限公司 帧率上转换译码模式的改进
WO2019184556A1 (zh) * 2018-03-29 2019-10-03 华为技术有限公司 一种双向帧间预测方法及装置

Families Citing this family (53)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9591320B2 (en) 2010-07-15 2017-03-07 Texas Instruments Incorporated Context and bypass encoding video
US9049455B2 (en) 2010-12-28 2015-06-02 Panasonic Intellectual Property Corporation Of America Image coding method of coding a current picture with prediction using one or both of a first reference picture list including a first current reference picture for a current block and a second reference picture list including a second current reference picture for the current block
BR112013017490A2 (pt) * 2011-01-07 2017-10-24 Samsung Electronics Co Ltd método de previsão de vídeo, aparelho de previsão de vídeo, e mídia de gravação legível por computador
US10027957B2 (en) 2011-01-12 2018-07-17 Sun Patent Trust Methods and apparatuses for encoding and decoding video using multiple reference pictures
US8548057B2 (en) * 2011-01-25 2013-10-01 Microsoft Corporation Video coding redundancy reduction
WO2012108181A1 (en) 2011-02-08 2012-08-16 Panasonic Corporation Methods and apparatuses for encoding and decoding video using multiple reference pictures
US20130322535A1 (en) * 2011-02-21 2013-12-05 Electronics And Telecommunications Research Institute Method for encoding and decoding images using plurality of reference images and device using method
EP3937497B1 (en) * 2011-03-21 2023-02-22 LG Electronics, Inc. Motion vector predictor selection
WO2012144876A2 (ko) 2011-04-21 2012-10-26 한양대학교 산학협력단 인루프 필터링을 적용한 예측 방법을 이용한 영상 부호화/복호화 방법 및 장치
KR20120140592A (ko) 2011-06-21 2012-12-31 한국전자통신연구원 움직임 보상의 계산 복잡도 감소 및 부호화 효율을 증가시키는 방법 및 장치
WO2012177052A2 (ko) 2011-06-21 2012-12-27 한국전자통신연구원 인터 예측 방법 및 그 장치
CN103797794B (zh) * 2011-09-16 2017-11-03 寰发股份有限公司 用于编码的方法和装置
CN108650508B (zh) * 2011-09-29 2022-07-29 夏普株式会社 图像解码装置、图像解码方法、图像编码装置及图像编码方法
BR112014007494B1 (pt) 2011-09-29 2022-05-31 Sharp Kabushiki Kaisha Dispositivo de decodificação de imagem, método de decodificação de imagem, e dispositivo de codificação de imagem
CN103828373B (zh) * 2011-10-05 2018-02-16 太阳专利托管公司 图像解码方法以及图像解码装置
US9277230B2 (en) 2011-11-23 2016-03-01 Qualcomm Incorporated Display mode-based video encoding in wireless display devices
US9008177B2 (en) * 2011-12-12 2015-04-14 Qualcomm Incorporated Selective mirroring of media output
US9094684B2 (en) * 2011-12-19 2015-07-28 Google Technology Holdings LLC Method for dual pass rate control video encoding
US20130188709A1 (en) * 2012-01-25 2013-07-25 Sachin G. Deshpande Video decoder for tiles with absolute signaling
US20130272398A1 (en) * 2012-01-25 2013-10-17 Sharp Laboratories Of America, Inc. Long term picture signaling
US9426463B2 (en) 2012-02-08 2016-08-23 Qualcomm Incorporated Restriction of prediction units in B slices to uni-directional inter prediction
US9451277B2 (en) * 2012-02-08 2016-09-20 Qualcomm Incorporated Restriction of prediction units in B slices to uni-directional inter prediction
CN103327313B (zh) * 2012-03-21 2016-11-16 朱洪波 视频编码中的高阶预测模式
US20150103911A1 (en) * 2012-04-15 2015-04-16 Samsung Electronics Co., Ltd. Method and apparatus for determining reference images for inter-prediction
US9516308B2 (en) 2012-04-27 2016-12-06 Qualcomm Incorporated Parameter set updates in video coding
US9736476B2 (en) 2012-04-27 2017-08-15 Qualcomm Incorporated Full random access from clean random access pictures in video coding
US9762903B2 (en) 2012-06-01 2017-09-12 Qualcomm Incorporated External pictures in video coding
US9749645B2 (en) 2012-06-22 2017-08-29 Microsoft Technology Licensing, Llc Coded-block-flag coding and derivation
WO2014003423A1 (ko) 2012-06-29 2014-01-03 한국전자통신연구원 영상 부호화/복호화 방법 및 장치
AU2013321313B2 (en) 2012-09-28 2016-10-27 Sony Corporation Image processing device and method
US9648318B2 (en) * 2012-09-30 2017-05-09 Qualcomm Incorporated Performing residual prediction in video coding
US9491460B2 (en) * 2013-03-29 2016-11-08 Qualcomm Incorporated Bandwidth reduction for video coding prediction
US20140358565A1 (en) 2013-05-29 2014-12-04 Qualcomm Incorporated Compression of decomposed representations of a sound field
US10356426B2 (en) * 2013-06-27 2019-07-16 Google Llc Advanced motion estimation
JP6337380B2 (ja) * 2013-07-31 2018-06-06 サン パテント トラスト 画像符号化方法および画像符号化装置
US9502045B2 (en) * 2014-01-30 2016-11-22 Qualcomm Incorporated Coding independent frames of ambient higher-order ambisonic coefficients
WO2015124110A1 (en) 2014-02-21 2015-08-27 Mediatek Singapore Pte. Ltd. Method of video coding using prediction based on intra picture block copy
CN106105190B (zh) * 2014-03-13 2018-11-13 高通股份有限公司 用于3d-hevc的简化高级残余预测
US10770087B2 (en) 2014-05-16 2020-09-08 Qualcomm Incorporated Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals
US9930341B2 (en) * 2014-06-20 2018-03-27 Qualcomm Incorporated Block vector coding for intra block copying
US10187655B2 (en) * 2015-09-30 2019-01-22 Apple Inc. Memory-to-memory low resolution motion estimation systems and methods
WO2017096303A2 (en) 2015-12-04 2017-06-08 Portola Pharmaceuticals, Inc. Cerdulatinib for treating hematological cancers
US11736712B2 (en) * 2016-05-28 2023-08-22 Industry Academy Cooperation Foundation Of Sejong University Method and apparatus for encoding or decoding video signal
CN114222141A (zh) * 2016-05-28 2022-03-22 世宗大学校产学协力团 视频信号的解码方法及视频信号的解码装置
KR102345458B1 (ko) * 2016-05-28 2021-12-31 세종대학교산학협력단 예측 모션 벡터 리스트를 구성하는 방법 및 이의 장치
WO2019001741A1 (en) * 2017-06-30 2019-01-03 Huawei Technologies Co., Ltd. MOTION VECTOR REFINEMENT FOR MULTI-REFERENCE PREDICTION
TW202014412A (zh) 2018-05-04 2020-04-16 美商普托拉製藥有限公司 賽度替尼(cerdulatinib)之固體型式
CN112640466A (zh) * 2018-09-07 2021-04-09 松下电器(美国)知识产权公司 用于视频编码的系统和方法
KR102573250B1 (ko) * 2018-09-12 2023-08-30 후아웨이 테크놀러지 컴퍼니 리미티드 델타 화상 순서 카운트에 대한 사인값 및 절대값 시그널링
CN111435989B (zh) * 2019-01-15 2023-11-17 华为技术有限公司 视频编码、解码方法、装置及计算机存储介质
KR20220051402A (ko) * 2019-09-06 2022-04-26 후아웨이 테크놀러지 컴퍼니 리미티드 가중 예측을 위한 하이-레벨 시그널링의 방법 및 장치
CN112040234B (zh) * 2020-11-04 2021-01-29 北京金山云网络技术有限公司 视频编码、解码方法和装置、电子设备及存储介质
US11722658B2 (en) * 2021-06-25 2023-08-08 Tencent America LLC Method and apparatus for video coding

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1377067A1 (en) * 2002-06-17 2004-01-02 Kabushiki Kaisha Toshiba Motion vector coding
WO2004030369A1 (en) * 2002-09-27 2004-04-08 Videosoft, Inc. Real-time video coding/decoding
US20050117646A1 (en) * 2003-11-28 2005-06-02 Anthony Joch Low-complexity motion vector prediction for video codec with two lists of reference pictures
CN101778286A (zh) * 2003-09-07 2010-07-14 微软公司 隔行扫描视频的编码与解码

Family Cites Families (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2208950A1 (en) 1996-07-03 1998-01-03 Xuemin Chen Rate control for stereoscopic digital video encoding
WO1998042134A1 (en) 1997-03-17 1998-09-24 Mitsubishi Denki Kabushiki Kaisha Image encoder, image decoder, image encoding method, image decoding method and image encoding/decoding system
KR100693669B1 (ko) 2003-03-03 2007-03-09 엘지전자 주식회사 피일드 매크로 블록의 레퍼런스 픽쳐 결정 방법
US7489342B2 (en) 2004-12-17 2009-02-10 Mitsubishi Electric Research Laboratories, Inc. Method and system for managing reference pictures in multiview videos
JP2005005844A (ja) 2003-06-10 2005-01-06 Hitachi Ltd 計算装置及び符号化処理プログラム
US20050013498A1 (en) 2003-07-18 2005-01-20 Microsoft Corporation Coding of motion vector information
CN1843037B (zh) 2003-08-26 2010-09-22 汤姆森特许公司 用于编码混合内部-相互编码块的方法和装置
US7627039B2 (en) 2003-09-05 2009-12-01 Realnetworks, Inc. Parallel video decoding
US7620106B2 (en) * 2003-09-07 2009-11-17 Microsoft Corporation Joint coding and decoding of a reference field selection and differential motion vector information
US7961786B2 (en) * 2003-09-07 2011-06-14 Microsoft Corporation Signaling field type information
US7599435B2 (en) 2004-01-30 2009-10-06 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Video frame encoding and decoding
JPWO2005076629A1 (ja) 2004-02-09 2007-10-18 三洋電機株式会社 画像符号化装置及び撮像装置
EP1592255A1 (en) 2004-04-30 2005-11-02 Matsushita Electric Industrial Co., Ltd. Motion vector estimation with improved motion vector selection
US7852916B2 (en) 2004-06-27 2010-12-14 Apple Inc. Efficient use of storage in encoding and decoding video data streams
US20060083298A1 (en) 2004-10-14 2006-04-20 Nokia Corporation Reference picture management in video coding
US7733959B2 (en) 2005-06-08 2010-06-08 Institute For Information Industry Video conversion methods for frame rate reduction
US20070064809A1 (en) 2005-09-14 2007-03-22 Tsuyoshi Watanabe Coding method for coding moving images
US8879857B2 (en) 2005-09-27 2014-11-04 Qualcomm Incorporated Redundant data encoding methods and device
EP1806930A1 (en) 2006-01-10 2007-07-11 Thomson Licensing Method and apparatus for constructing reference picture lists for scalable video
BRPI0706803A2 (pt) 2006-02-02 2011-04-05 Thomson Licensing método e aparelho para estimativa de animação usando bi-predição de referências combinadas
CN101461242B (zh) 2006-03-30 2011-08-03 Lg电子株式会社 用于解码/编码视频信号的方法和装置
JPWO2008012918A1 (ja) 2006-07-28 2009-12-17 株式会社東芝 画像符号化と復号の方法及び装置
WO2008023967A1 (en) 2006-08-25 2008-02-28 Lg Electronics Inc A method and apparatus for decoding/encoding a video signal
ES2702704T3 (es) 2006-10-16 2019-03-05 Nokia Technologies Oy Sistema y procedimiento para implementar una administración eficiente de memoria intermedia decodificada en codificación de video de vistas múltiples
US9031129B2 (en) 2007-06-15 2015-05-12 Microsoft Technology Licensing, Llc Joint spatio-temporal prediction for video coding
BRPI0818444A2 (pt) 2007-10-12 2016-10-11 Qualcomm Inc codificação adaptativa de informação de cabeçalho de bloco de vídeo
JP5474838B2 (ja) 2008-03-10 2014-04-16 トムソン ライセンシング 改善された効率及び主観的な品質をサポートする予測フレームの選択方法及び装置
PT104083A (pt) 2008-06-02 2009-12-02 Inst Politecnico De Leiria Método para transcodificar imagens de vídeo h.264/avc em mpeg-2
US8634456B2 (en) 2008-10-03 2014-01-21 Qualcomm Incorporated Video coding with large macroblocks
US8259801B2 (en) 2008-10-12 2012-09-04 Mediatek Inc. Methods for coding digital media data with prediction information and prediction error information being respectively carried by different bit stream sections
US8687685B2 (en) 2009-04-14 2014-04-01 Qualcomm Incorporated Efficient transcoding of B-frames to P-frames
US20100296579A1 (en) 2009-05-22 2010-11-25 Qualcomm Incorporated Adaptive picture type decision for video coding
CA2784517A1 (en) * 2009-12-17 2011-06-23 Telefonaktiebolaget L M Ericsson (Publ) Method and arrangement for video coding
CN104811737B (zh) 2010-05-04 2018-06-15 Lg电子株式会社 处理视频信号的方法和设备
US9066102B2 (en) 2010-11-17 2015-06-23 Qualcomm Incorporated Reference picture list construction for generalized P/B frames in video coding
ES2930367T3 (es) 2011-01-07 2022-12-09 Lg Electronics Inc Método para codificar información de vídeo, método para decodificar información de vídeo y aparato de decodificación para decodificar información de vídeo

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1377067A1 (en) * 2002-06-17 2004-01-02 Kabushiki Kaisha Toshiba Motion vector coding
WO2004030369A1 (en) * 2002-09-27 2004-04-08 Videosoft, Inc. Real-time video coding/decoding
CN101778286A (zh) * 2003-09-07 2010-07-14 微软公司 隔行扫描视频的编码与解码
US20050117646A1 (en) * 2003-11-28 2005-06-02 Anthony Joch Low-complexity motion vector prediction for video codec with two lists of reference pictures

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107079161A (zh) * 2014-09-01 2017-08-18 寰发股份有限公司 用于屏幕内容以及视频编码的帧内图片块复制的方法
US10554997B2 (en) 2015-05-26 2020-02-04 Huawei Technologies Co., Ltd. Video coding/decoding method, encoder, and decoder
CN106303544A (zh) * 2015-05-26 2017-01-04 华为技术有限公司 一种视频编解码方法、编码器和解码器
CN106303544B (zh) * 2015-05-26 2019-06-11 华为技术有限公司 一种视频编解码方法、编码器和解码器
CN104994391B (zh) * 2015-06-26 2017-11-10 福州瑞芯微电子股份有限公司 一种高效的VP9熵解码prob数据获取方法及设备
CN104994391A (zh) * 2015-06-26 2015-10-21 福州瑞芯微电子有限公司 一种高效的VP9熵解码prob数据获取方法及设备
CN109792526A (zh) * 2016-09-30 2019-05-21 高通股份有限公司 帧率上转换译码模式的改进
WO2019184556A1 (zh) * 2018-03-29 2019-10-03 华为技术有限公司 一种双向帧间预测方法及装置
CN112040244A (zh) * 2018-03-29 2020-12-04 华为技术有限公司 一种双向帧间预测方法及装置
CN112040244B (zh) * 2018-03-29 2021-06-29 华为技术有限公司 一种双向帧间预测方法及装置
US11350122B2 (en) 2018-03-29 2022-05-31 Huawei Technologies Co., Ltd. Bidirectional inter prediction method and apparatus
US11838535B2 (en) 2018-03-29 2023-12-05 Huawei Technologies Co., Ltd. Bidirectional inter prediction method and apparatus
US11924458B2 (en) 2018-03-29 2024-03-05 Huawei Technologies Co., Ltd. Bidirectional inter prediction method and apparatus

Also Published As

Publication number Publication date
JP2013535913A (ja) 2013-09-12
CN103039074B (zh) 2015-12-16
TW201223286A (en) 2012-06-01
US20120027089A1 (en) 2012-02-02
WO2012015650A3 (en) 2012-03-22
EP2599313A2 (en) 2013-06-05
WO2012015650A2 (en) 2012-02-02
EP2599313B1 (en) 2016-04-20
CA2805883A1 (en) 2012-02-02
WO2012015649A2 (en) 2012-02-02
JP2013532925A (ja) 2013-08-19
KR20130069758A (ko) 2013-06-26
KR101460921B1 (ko) 2014-11-14
AU2011283039A1 (en) 2013-02-21
KR101383436B1 (ko) 2014-04-11
WO2012015649A3 (en) 2012-03-22
EP2599312A2 (en) 2013-06-05
EP3038364A1 (en) 2016-06-29
BR112013002055A2 (pt) 2019-09-24
KR20130036772A (ko) 2013-04-12
CN103026709B (zh) 2016-03-23
US9357229B2 (en) 2016-05-31
SG187137A1 (en) 2013-02-28
JP5951606B2 (ja) 2016-07-13
WO2012015650A8 (en) 2013-02-28
RU2013108810A (ru) 2014-09-20
US9398308B2 (en) 2016-07-19
CN103026709A (zh) 2013-04-03
TW201215162A (en) 2012-04-01
US20120027088A1 (en) 2012-02-02
JP5551317B2 (ja) 2014-07-16

Similar Documents

Publication Publication Date Title
CN103026709B (zh) 用于视频译码的帧间预测模式和参考图片列表索引的译码
CN109274974B (zh) 图像预测的方法及装置
CN102783149B (zh) 用于视频译码的适应性运动分辨率
CN103299621B (zh) 用于视频译码中的一般化p/b帧的参考图片列表构造
CN103339936B (zh) 用于视频译码的单一参考图片列表建构
CN103299620B (zh) 在视频译码中使用最可能扫描次序对用于视频块的扫描次序信息进行有效译码
CN103535033A (zh) 用于样本自适应偏移的偏移类型及系数信令方法
CN103238322A (zh) 在视频译码中单独地译码视频块的最后有效系数的位置
CN103181169A (zh) 使用联合上下文模型对系数进行熵译码
CN103339935A (zh) 运动向量预测
CN103999469A (zh) 执行相依于变换的解块滤波
CN103141100A (zh) 用于视频译码的帧内平滑滤波器
CN103202016A (zh) 用于视频译码的自适应运动向量分辨率信令
CN103238323A (zh) 在视频译码中基于视频块的扫描次序对块内的最后有效系数的位置进行译码
CN103843347A (zh) 用于视频译码的运动向量预测值候选剪裁移除
CN103959775A (zh) 帧内模式视频译码
CN103891293A (zh) 用于色度分量的自适应环路滤波
CN103797801A (zh) 视频译码中的非正方形变换单元和预测单元
CN103155555A (zh) 视频译码中的译码预测模式
CN103329523A (zh) 使用经映射变换和扫描模式的视频译码
CN103339939A (zh) 具有自适应分接头大小的低复杂性内插滤波
CN103931182A (zh) 帧内预测视频译码中的非正方形变换
CN103339938A (zh) 执行视频译码的运动向量预测
CN103703781A (zh) 使用自适应运动向量分辨率的视频译码
CN103597832A (zh) 用于使用相邻模式的视频译码的增强的帧内预测模式信令

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20151216

Termination date: 20190720

CF01 Termination of patent right due to non-payment of annual fee