CN104272742B - 加权预测参数译码 - Google Patents

加权预测参数译码 Download PDF

Info

Publication number
CN104272742B
CN104272742B CN201380023733.0A CN201380023733A CN104272742B CN 104272742 B CN104272742 B CN 104272742B CN 201380023733 A CN201380023733 A CN 201380023733A CN 104272742 B CN104272742 B CN 104272742B
Authority
CN
China
Prior art keywords
list
prediction parameters
weighted prediction
reference picture
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201380023733.0A
Other languages
English (en)
Other versions
CN104272742A (zh
Inventor
穆罕默德·蔡德·科班
马尔塔·卡切维奇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of CN104272742A publication Critical patent/CN104272742A/zh
Application granted granted Critical
Publication of CN104272742B publication Critical patent/CN104272742B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/109Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/40Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/577Motion compensation with bidirectional frame interpolation, i.e. using B-pictures

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明技术大体涉及加权预测参数的译码。视频译码器可基于另一参考图片列表的经译码的加权预测参数确定参考图片列表的所述加权预测参数。所述参考图片列表的实例包含出于译码目的构建的参考图片列表,包含组合参考图片列表。

Description

加权预测参数译码
本申请案请求2012年4月3日提交的美国临时申请案61/619,856的权利,所述美国临时申请案的全部内容以引用的方式并入本文中。
技术领域
本发明涉及视频译码,且更特别地涉及用于加权预测参数译码的技术。
背景技术
数字视频能力可合并到各种各样的装置中,包含数字电视、数字直播系统、无线广播系统、个人数字助理(PDA)、膝上型计算机或桌上型计算机、平板计算机、电子书阅读器、数字相机、数字记录装置、数字媒体播放器、视频游戏装置、视频游戏控制台、蜂窝电话或卫星无线电话、所谓的“智能电话”、视频电话会议装置、视频串流装置等。数字视频装置实施视频压缩技术,例如由MPEG-2、MPEG-4、ITU-T H.263、ITU-T H.264/MPEG-4第10部分高级视频译码(AVC)所界定的标准、目标正在开发中的高效视频译码(HEVC)标准以及这些标准的扩展中描述的那些技术。视频装置可通过实施这些视频压缩技术来更有效地发射、接收、编码、解码及/或存储数字视频信息。
视频压缩技术执行空间(图片内)预测及/或时间(图片间)预测以减少或移除视频序列中固有的冗余。对于基于块的视频译码,可将视频片段(即,视频帧或视频帧的部分)分割成视频块,所述视频块也可被称作树块、译码单元(CU)及/或译码节点。图片的经帧内译码(I)片段中的视频块使用关于同一图片中的相邻块中的参考样本的空间预测来进行编码。图片的经帧间译码(P或B)片段中的视频块可使用关于同一图片中的相邻块中的参考样本的空间预测或关于其它参考图片中的参考样本的时间预测。图片可被称作帧,且参考图片可被称作参考帧。
空间或时间预测产生用于待译码的块的预测块。残余数据表示待译码的原始块与预测块之间的像素差。经帧间译码块是根据以下两项来进行编码:指向形成预测块的参考样本的块的运动向量,以及指示经译码块与预测块之间的差的残余数据。经帧内译码块是根据帧内译码模式以及残余数据来进行编码。为了进一步压缩,可将残余数据从像素域变换到变换域,从而产生残余变换系数,所述残余变换系数接着可被量化。可扫描经量化变换系数(最初排列成二维阵列)以便产生变换系数的一维向量,且可应用熵译码以实现更多压缩。
发明内容
一般来说,本发明是关于用于对加权预测参数进行译码的技术。加权预测参数可指示适用于参考图片的像素值的定标因素,所述像素值可用于对当前图片的块进行帧间预测。视频译码器识别一或两个参考图片列表中的参考图片。在一些实例中,如果两个参考图片列表实质上等效,那么视频译码器可对所述两个参考图片列表中的一个参考图片列表的加权预测参数进行译码,并基于经译码的加权预测参数确定另一参考图片列表的加权预测参数。
在一些实施例中,视频译码器可根据所述两个参考图片列表构建组合参考图片列表。在这些实例中,视频译码器可对组合参考图片列表的加权预测参数进行译码,并根据组合参考图片列表的经译码的加权预测参数确定所述两个参考图片列表的加权预测参数。
在一个实例中,本发明描述一种用于对视频数据进行译码的方法。所述方法包括:对第一列表的加权预测参数进行译码,其中第一列表包含用于对当前图片内的一或多个块进行帧间预测的参考图片;基于第一列表的加权预测参数确定第二列表的加权预测参数,其中第二列表包含用于对当前图片内的一或多个块进行帧间预测的参考图片;及至少基于经译码的加权预测参数以及经确定的加权预测参数中的一或多者对当前图片中的块进行帧间预测。
在一个实例中,本发明描述一种用于对视频数据进行译码的装置。所述装置包括视频译码器,所述视频译码器经配置以进行以下操作:对第一列表的加权预测参数进行译码,其中第一列表包含用于对当前图片内的一或多个块进行帧间预测的参考图片;基于第一列表的加权预测参数确定第二列表的加权预测参数,其中第二列表包含用于对当前图片内的一或多个块进行帧间预测的参考图片;及至少基于经译码的加权预测参数以及经确定的加权预测参数中的一或多者对当前图片内的块进行帧间预测。
在一个实例中,本发明描述一种在其上存储有指令的计算机可读存储媒体,所述指令在执行时使用于视频译码的装置的一或多个处理器进行以下操作:对第一列表的加权预测参数进行译码,其中第一列表包含用于对当前图片内的一或多个块进行帧间预测的参考图片;基于第一列表的加权预测参数确定第二列表的加权预测参数,其中第二列表包含用于对当前图片内的一或多个块进行帧间预测的参考图片;及至少基于经译码的加权预测参数和经确定的加权预测参数中的一或多者对当前图片内的块进行帧间预测。
在一个实例中,本发明描述一种用于对视频数据进行译码的装置,所述装置包括:用于对第一列表的加权预测参数进行译码的装置,其中第一列表包含用于对当前图片内的一或多个块进行帧间预测的参考图片;用于基于第一列表的加权预测参数确定第二列表的加权预测参数的装置,其中第二列表包含用于对当前图片内的一或多个块进行帧间预测的参考图片;及用于至少基于经译码的加权预测参数和经确定的加权预测参数中的一或多者对当前图片内的块进行帧间预测的装置。
在一个实例中,本发明描述一种用于对视频数据进行译码的方法,所述方法包括:构建第一参考图片列表;构建第二参考图片列表;对至少第一语法元素进行译码,所述第一语法元素指示第一参考图片列表是否与第二参考图片列表相同;在第一语法元素指示第一参考图片列表与第二参考图片列表相同时,对在第一参考图片列表中识别的参考图片的加权预测参数进行译码,且不对在第二参考图片列表中识别的参考图片的加权预测参数进行译码;及在第一语法元素指示第一参考图片列表与第二参考图片列表相同时,根据在第一参考图片列表中识别的至少一个参考图片并基于所述参考图片的加权预测参数预测视频块。
在一个实例中,本发明描述一种用于对视频数据进行译码的方法,所述方法包括:对至少第一语法元素进行译码,所述第一语法元素指示第一参考图片列表和第二参考图片列表的前N个元素是否相同;在所述前N个元素相同时,对指示第一参考图片列表的大小和第二参考图片列表的大小的信息进行译码;在第一参考图片列表的大小大于第二参考图片列表的大小时:构建第一参考图片列表;及从第一参考图片列表派生出第二参考图片列表;及在第二参考图片列表的大小大于第一参考图片列表的大小时:构建第二参考图片列表;及从第二参考图片列表派生出第一参考图片列表。
一或多个实例的细节陈述于附图及以下描述中。其它特征、目标及优势将从描述及附图和从权利要求书中显而易见。
附图说明
图1是说明根据本发明中描述的一或多个实例的实例视频编码及解码系统的框图。
图2A和2B是说明实质上等效的参考图片列表的实例的概念图。
图3是说明可实施本发明中描述的技术的视频编码器的实例的框图。
图4是说明可实施本发明中描述的技术的视频解码器的实例的框图。
图5是说明根据本发明中描述的一或多个实例的视频编码器的示范性操作的流程图。
图6是说明根据本发明中描述的一或多个实例的视频解码器的示范性操作的流程图。
具体实施方式
视频译码器(例如,视频编码器或视频解码器)可对图片内的一或多个块进行帧内预测(例如,帧内预测编码或帧内预测解码)或对图片内的一或多个块进行帧间预测。为了对图片内的块进行帧间预测(例如,帧间预测编码块或帧间预测解码块),视频译码器构建一或两个参考图片列表(RefPicList0和RefPicList1)。RefPicList0和RefPicList1中的每一者指示可潜在用于对当前图片内的块进行帧间预测的参考图片。举例来说,如果块是单预测的(例如,用一个参考图片预测),那么视频译码器可确定所述块的运动向量并确定所述运动向量所引用的参考图片。RefPicList0或RefPicList1可识别单向运动向量所引用的参考图片。如果块是双预测的(例如,用两个参考图片预测),那么视频译码器可确定所述块的两个运动向量(即,针对每一个参考图片的运动向量)。视频译码器还可确定RefPicList0中第一运动向量所引用的参考图片和RefPicList1中第二运动向量所引用的参考图片。对于单预测或双预测实例,视频译码器可基于在一或多个参考图片中由一或多个运动向量所引用的一或多个块来帧间预测当前图片的块。
另外,在一些实例中,视频译码器可确定每一参考图片列表中的每一参考图片的加权预测参数。加权预测参数可界定一定标因素,参考图片内的像素值将通过所述定标因素定标以用于帧间预测当前图片中的块。本发明中描述的技术提供确定每一参考图片列表中的参考图片的加权预测参数的有效方式。
举例来说,当两个参考图片列表实质上等效时,视频编码器可不需要在经译码的位流中信号传递两个列表的加权预测参数。相反,视频编码器可在经译码的位流中信号传递实质上等效的列表中的一者的加权预测参数,且视频解码器可从经译码的位流中接收一个列表的加权预测参数并基于经信号传递的加权预测参数确定另一列表的加权预测参数。
作为一个实例,假设RefPicList0和RefPicList1实质上等效。在此实例中,视频编码器可在经译码的位流中信号传递RefPicList0的加权预测参数,且视频解码器可基于RefPicList0的加权预测参数确定RefPicList1的加权预测参数。通过这种方式,因为不需要信号传递两个列表的加权预测参数,所以可减少需要信号传递的资料的量,且其可足以信号传递所述列表中的仅一者的加权预测参数。
在RefPicList0和RefPicList1被视为实质上等效时,可具有至少两种情况。在一种情况下,在RefPicList0和RefPicList1相同时,RefPicList0和RefPicList1被视为实质上等效。由于RefPicList0和RefPicList1是相同的,RefPicList0和RefPicList1以完全相同的顺序识别完全相同的参考图片。换句话说,RefPicList0和RefPicList1是彼此的副本。
在另一种情况下,在一个列表的整体或子集与另一个列表的子集相同时,RefPicList0和RefPicList1被视为实质上等效。举例来说,假设RefPicList0包含M个条目(即,识别M个数目的参考图片)且RefPicList1包含N个条目(即,识别N个数目的参考图片)。还假设M大于N。在此实例中,如果RefPicList0中的前N个条目(即,RefPicList0的子集)与RefPicList1中的N个条目(即,RefPicList1的条目)在内容和顺序上相同时,那么为了确定加权预测参数,RefPicList0和RefPicList1被视为实质上等效。
在一些实例中,在视频编码器确定RefPicList0和RefPicList1实质上等效时,视频编码器可在经译码的位流中信号传递指示RefPicList0和RefPicList1实质上等效的旗标。在RefPicList0和RefPicList1实质上等效时,视频编码器还可在经译码的位流中信号传递仅一个参考图片列表的加权预测参数。在其中RefPicList0和RefPicList1实质上等效是因为一个参考图片列表的整体或子集与另一参考图片列表的子集相同的实例中,视频编码器可在经译码的位流中信号传递两个参考图片列表中的较长列表(即,其子集与另一参考图片列表的整体或子集相同的参考图片列表)的加权预测参数。
视频解码器可从经译码的位流中接收指示RefPicList0和RefPicList1实质上等效的旗标,且可预期仅接收所述列表中的一者的加权预测参数。在RefPicList0和RefPicList1实质上等效时,视频解码器可针对RefPicList0和RefPicList1两者中的参考图片将接收到的加权预测参数设置为相等的。举例来说,视频解码器可能已经确定RefPicList0和RefPicList1的大小。如果视频解码器确定RefPicList0和RefPicList1的大小相同且RefPicList0和RefPicList1实质上等效,那么视频解码器可将接收到的加权预测参数设置为等于RefPicList0和RefPicList1两者的加权预测参数。
然而,如果视频解码器确定RefPicList0和RefPicList1的大小不相同且RefPicList0和RefPicList1实质上等效,那么视频解码器可预期接收两个列表中的较长列表的加权预测参数。例如,与先前实例一致,如果RefPicList0比RefPicList1长,那么视频解码器可预期从经译码的位流中接收RefPicList0的加权预测参数。接着,视频解码器可将RefPicList0的前N个条目的加权预测参数设置为等于RefPicList1的相应N个条目(即,将RefPicList0的子集设置为等于RefPicList1的整体是因为RefPicList1的大小为N)。
一般来说,在RefPicList0和RefPicList1实质上等效且RefPicList0和RefPicList1具有不同大小时,RefPicList0将比RefPicList1长的概率大于RefPicList1比RefPicList0长的概率。因此,在一些实例中,只有在RefPicList0和RefPicList1的大小相同时,或在RefPicList0的大小比RefPicList1的大小长时,而非在RefPicList1的大小比RefPicList0的大小长时,视频编码器可在经译码的位流中仅信号传递一个列表的加权预测参数。通过这种方式,视频解码器可不需要确定视频解码器从经译码的位流中接收哪个列表的加权预测参数,因为在RefPicList0和RefPicList1实质上等效时,加权预测参数将总是适合RefPicList0。
在一些实例中,技术可开发组合参考图片列表(被称作RefPicListC)用于有效信号传递加权预测参数的用途。在一些实例中,视频编码器和视频解码器可各自构建各自的参考图片列表0和列表1。另外,视频编码器和视频解码器可构建组合参考图片列表(即,RefPicListC)。其为经构建RefPicList0和RefPicList1中的参考图片的某一组合。在一些实例中,视频编码器和视频解码器可利用RefPicListC来识别用于帧间预测当前图片中的块的一或多个参考图片。
根据本发明中描述的技术,视频编码器可在经译码的位流中信号传递指示是否将构建RefPicListC的旗标,且视频解码器可或可不回应于旗标的值而构建RefPicListC。在其中将构建RefPicListC的实例中,视频编码器可在经译码的位流中信号传递RefPicListC中的参考图片而不是RefPicList0和RefPicList1中的图片的加权预测参数。在这些实例中,视频解码器可利用RefPicListC中的参考图片的加权预测参数来确定RefPicList0和RefPicList1中的参考图片的加权预测参数。
举例来说,视频解码器可能已利用某种技术以根据RefPicList0和RefPicList1构建RefPicListC。因此,视频解码器可能已确定在RefPicListC中识别的参考图片与在RefPicList0和RefPicList1中识别的参考图片之间的映射。换句话说,因为视频解码器根据RefPicList0和RefPicList1构建了RefPicListC,所以视频解码器可能够确定RefPicListC中的特定参考图片是否来自RefPicList0或RefPicList1。通过这种方式,在实现RefPicListC的构建时,视频编码器可在经译码的位流中信号传递RefPicListC中的图片的加权预测参数而不是信号传递RefPicList0和RefPicList1中的图片的加权预测参数。
在一些实例中,视频编码器和视频解码器可利用以上实例的任一组合(例如,在RefPicList0和RefPicList1实质上等效的情况下或在实现RefPicListC的构建的情况下)。例如,视频编码器可信号传递指示RefPicList0和RefPicList1是否实质上等效的旗标并信号传递指示是否实现RefPicListC的构建的旗标。在此实例中,视频编码器可信号传递RefPicListC的加权预测参数,且如果RefPicList0和RefPicList1实质上等效并相同,那么视频解码器可将RefPicListC的加权预测参数设置为等于RefPicList0和RefPicList1的加权预测参数。如果RefPicList0和RefPicList1实质上等效但因为大小不同而不相同(即,一者的子集与另一者的整体或子集相同),那么RefPicListC可等于RefPicList0或RefPicList1中的较长者,通常是RefPicList0。
作为另一实例,视频编码器可仅信号传递指示RefPicList0和RefPicList1是否实质上等效的旗标,但不信号传递指示是否将构建或将不构建RefPicListC的旗标。作为又另一实例,视频编码器可仅信号传递指示是否将构建或将不构建RefPicListC的旗标,且不信号传递指示RefPicList0和列表是否实质上等效的旗标。
在任何情况下,视频译码器(例如,编码器或解码器)可经配置以译码(例如,编码或解码)第一列表的加权预测参数。视频译码器可根据第一列表的加权预测参数的经译码信号传递来确定第二列表的加权预测参数。第一列表可为组合参考图片列表(RefPicListC)、第一参考图片列表(RefPicList0)或第二参考图片列表(RefPicList1)中的一者。
图1是说明根据本发明中描述的一或多个实例的实例视频编码及解码系统的框图。举例来说,系统10包含源装置12和目的地装置14。源装置12和目的地装置14经配置以实施视频资料的译码,其中源装置12和目的地装置14各自译码图片。
系统10可根据不同视频译码标准、专有标准或任何其它视频译码方式(包含多视图译码技术)来操作。以下内容描述视频译码标准的一些实例且不应被视为限制。视频译码标准包含ITU-T H.261、ISO/IEC MPEG-1视觉、ITU-T H.262或ISO/IEC MPEG-2视觉、ITU-TH.263、ISO/IEC MPEG-4视觉以及ITU-T H.264(也被称作ISO/IEC MPEG-4AVC),ITU-TH.264包含其可分级视频译码(SVC)扩展以及多视图视频译码(MVC)扩展。
另外,存在新视频译码标准,即高效视频译码(HEVC),其正由ITU-T视频译码专家组(VCEG)和ISO/IEC运动图片专家组(MPEG)的视频译码联合组(JCT-VC)开发。被称作HEVCWD9的HEVC的近期工作草案截止于2013年3月12日,可从http://phenix.int-evry.fr/jct/doc_end_user/documents/11_Shanghai/wg11/JCTVC-K1003-v10.zip获得。在下文被称作HEVC WD6的HEVC的较早版本的工作草案可在2012年4月3日从http://phenix.int-evry.fr/jct/doc_end_user/documents/8_San%20Jose/wg11/JCTVC-H1003-v21.zip获得。仅出于说明的目的,本文中所描述的技术用根据H.264标准和HEVC标准的实例描述。
如图1中所展示,系统10包含源装置12,所述源装置产生在稍后时间将由目的地装置14解码的经编码视频数据。源装置12和目的地装置14包括各种各样的装置中的任一者,包含无线手机(例如所谓的“智能”电话)、所谓的“智能”板或其它经装备以进行无线通信的这种无线装置。源装置12和目的地装置14的额外实例包含但不限于:数字电视、数字直播系统中的装置、无线直播系统中的装置、个人数字助理(PDA)、膝上型计算机、桌上型计算机、平板计算机、电子书阅读器、数字相机、数字记录装置、数字媒体播放器、视频游戏装置、视频游戏控制台、蜂窝无线电话、卫星无线电话、视频电话会议装置和视频串流装置等。
目的地装置14可经由链路16接收待解码的经编码视频数据。链路16包括能够将经编码视频数据从源装置12移动到目的地装置14的任何类型的媒体或装置。在一个实例中,链路16包括使得源装置12能够实时地将经编码视频数据直接发射到目的地装置14的通信媒体。经编码视频数据可根据通信标准(例如无线通信协议)进行调制,且发射到目的地装置14。所述通信媒体可包括任何无线或有线通信媒体,例如射频(RF)频谱或一或多个物理传输线。所述通信媒体可形成基于数据包的网络(例如局域网、广域网或例如因特网的全球网络)的部分。所述通信媒体可包含路由器、交换机、基站或可用于促进从源装置12到目的地装置14的通信的任何其它设备。
在一些实例中,经编码数据从输出接口22输出到存储装置34。类似地,通过输入接口28从存储装置34访问经编码数据。存储装置34的实例包含多种分布式或本地访问的数据存储媒体中的任一者,例如硬盘驱动器、蓝光光盘、DVD、CD-ROM、快闪存储器、易失性或非易失性存储器或用于存储经编码视频数据的任何其它合适数字存储媒体。在另一实例中,存储装置34对应于保存由源装置12产生的经编码视频的文件服务器或另一中间存储装置。在这些实例中,目的地装置14经由流式传输或下载从存储装置34访问所存储的视频数据。文件服务器为能够存储经编码视频数据且将所述经编码视频数据发射到目的地装置14的任何类型的服务器。实例文件服务器包含web服务器(例如,用于网站)、FTP服务器、网络附加存储(NAS)装置或本地磁盘驱动器。目的地装置14通过任何标准数据连接(包含因特网连接)访问经编码视频数据。这可包含适合于访问存储于文件服务器上的经编码视频数据的无线信道(例如,Wi-Fi连接)、有线连接(例如,DSL、缆线调制解调器等)或两者的组合。经编码视频数据从存储装置34的传输可以是流式传输、下载传输或两者的组合。
本发明的技术不一定限于无线应用或设置。所述技术可应用于支持多种多媒体应用中的任一者的视频译码,所述多媒体应用例如空中电视广播、有线电视传输、卫星电视传输、流式视频传输(例如,通过因特网)、存储在数据存储媒体上的数字视频的编码、存储于数据存储媒体上的数字视频的解码、或其它应用。在一些实例中,系统10可经配置以支持单向或双向视频传输,从而支持多种应用,例如视频流式传输、视频播放、视频广播及/或视频电话。
在图1的实例中,源装置12包含视频源18、视频编码器20以及输出接口22。在一些情况下,输出接口22包含调制器/解调器(调制解调器)及/或发射器。在源装置12中,视频源18包含一或多个源(例如,视频捕获装置(例如摄像机)、含有先前捕获的视频的视频档案、用以接收来自视频内容提供商的视频的视频馈送接口,及/或用于产生计算机图形资料作为源视频的计算机图形系统)、所述源的组合或任何其它源。作为一个实例,如果视频源18为摄像机,那么源装置12和目的地装置14可形成所谓的相机电话或视频电话。然而,本发明中描述的技术一般来说可应用于视频译码,且可应用于无线及/或有线应用。
视频编码器20对经撷取视频、预先撷取视频或计算机产生的视频进行编码。源装置12的输出接口22经配置以将经编码视频数据发射到目的地装置14。经编码视频数据还可(或替代地)存储到存储装置34以供目的地装置14或其它装置随后访问,以进行解码及/或回放。
目的地装置14包含输入接口28、视频解码器30及显示装置32。在一些情况下,输入接口28包含接收器及/或调制解调器。目的地装置14的输入接口28通过链路16或从存储装置34接收经编码视频数据。通过链路16传达或提供在存储装置34上的经编码视频数据包含由视频编码器20产生的各种语法元素以供视频解码器(例如,视频解码器30)在解码视频数据过程中使用。可包含此类语法元素与在通信媒体上发射、在存储媒体上存储或由文件服务器存储的经编码视频数据。
显示装置32可与目的地装置14整合或在目的地装置14外。在一些实例中,目的地装置14包含经整合显示装置并且还经配置以与外部显示装置接口连接。在其它实例中,目的地装置14为显示装置。通常,显示装置32向用户显示经解码视频数据,并且包括各种显示装置中的任一种,所述显示装置例如液晶显示器(LCD)、等离子显示器、有机发光二极管(OLED)显示器或另一类型的显示装置。
视频编码器20及视频解码器30可根据各种视频译码标准(例如,上文所列的实例)来操作。然而,本发明中描述的技术不应视为如此受限。视频压缩标准的其它实例包含MPEG-2及ITU-T H.263。专有性编码技术(例如,被称为On2VP6/VP7/VP8的所述技术)还可以实施本文所描述的技术中的一或多种技术。
然而,本发明的技术不限于任何特定译码标准。此外,即使本发明中描述的技术不一定符合特定标准,本发明中描述的技术可相对于各种标准进一步帮助译码效率。另外,本发明中描述的技术可为未来标准的一部分。为了便于理解,相对于发展中HEVC标准描述所述技术,但所述技术不限于HEVC标准并且可能扩展至不由特定标准定义的其它视频译码标准或视频译码技术。
尽管图1中未展示,但在一些方面中,视频编码器20和视频解码器30可分别与音频编码器和解码器整合,且包含适当的MUX-DEMUX单元或其它硬件和软件,以处置共用数据流或单独数据流中的音频和视频两者的编码。如果适用,在一些实例中,MUX-DEMUX单元符合ITU H.223复用器协议或其它协议(例如,用户数据报协议(UDP))。
视频编码器20和视频解码器30各自可经实施为例如一个或一个以上微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、软件、硬件、固件或其任何组合的多种合适编码器电路中的任一者。当技术部分地在软件中实施时,装置可将用于软件的指令存储在合适非暂时计算机可读媒体中并且使用一或多个处理器执行硬件中的指令,以执行本发明的技术。视频编码器20和视频解码器30其中一个可包含在一或多个编码器或解码器中,其任一个可整合作为各自的装置中的经组合编码器/解码器(CODEC)的部分。根据本发明中描述的技术,视频编码器20经配置以对视频数据进行编码,并且视频解码器30经配置以解码视频数据。
视频序列通常包含一系列视频图片。图片组(GOP)通常包括一系列一或多个视频图片。GOP可包含GOP的组头中、GOP的一或多个图片的组头中或别处的语法数据,所述语法数据描述包含在GOP中的许多图片。每一图片可包含描述各自的图片的编码模式的图片语法数据。视频编码器20通常对个别视频图片内的视频块操作,以对视频数据进行编码。视频块可对应于宏块、宏块的分割及可能对应于分割的子块,如H.264标准或最大译码单元(LCU)、译码单元(CU)、预测单元(PU)或变换单元(TU)中所定义,如HEVC标准中所定义。所述视频块可具有固定的或变化的大小,且可根据指定的译码标准而大小不同。每一视频图片可包含多个片段。每一片段可包含多个块。
作为一实例,ITU-T H.264标准支持各种块大小(例如,针对亮度分量的16乘16、8乘8或4乘4,和针对色度分量的8×8)的帧内预测,以及各种块大小(例如,针对亮度分量的16×16、16×8、8×16、8×8、8×4、4×8和4×4,和针对色度分量的对应缩放的大小)的帧间预测。在本发明中,“NxN”和“N乘N”可互换地使用以指示关于垂直和水平尺寸的块的像素尺寸(例如,16x16个像素或16乘16个像素)。通常,16x16块将在垂直方向上具有16个像素(y=16)及在水平方向上具有16个像素(x=16)。同样,NxN块通常在垂直方向上具有N个像素及在水平方向上具有N个像素,其中N表示非负整数值。一块中的像素可布置成若干行和若干列。此外,块在水平方向上的像素数目不一定与垂直方向上的像素数目相同。举例来说,块可包括NXM个像素,其中M不一定等于N。
当对所述块进行帧内预测译码(例如,经帧内预测)时,所述块可包含描述所述块的帧内预测模式的数据。作为另一实例,当对所述块进行帧间预测编码(例如,经帧间预测)时,所述块可包含定义所述块的运动向量的信息。定义所述块的运动向量的数据描述例如运动向量的水平分量、运动向量的垂直分量、运动向量的分解(例如,四分之一像素精度或八分之一像素精度)。另外,当进行帧间预测时,所述块可包含运动向量所指向的例如参考图片的参考索引信息,及/或运动向量的参考图片列表(例如,RefPicList0或RefPicList1)。
JCT-VC正致力于HEVC标准的发展。HEVC标准化工作基于视频译码装置的被称为HEVC测试模型(HM)的演化模型。HM根据(例如ITU-T H.264/AVC)推测视频译码装置相对于现有装置的几种额外能力。举例来说,然而,H.264提供九种帧内预测编码模式,HM可提供多达三十三个方向/角度帧内预测编码模式加DC及平面模式。
HM的工作模式描述视频图片可被分为树块或最大译码单元(LCU)序列,包含亮度样本和色度样本两种。树块具有与H.264标准的宏块类似的用途。片段包含译码次序中的许多连续树块。视频图片可分割为一或多个片段。每一树块根据四叉树可分裂为译码单元(CU)。举例来说,作为四叉树的根节点的树块可分裂为四个子节点,且每一子节点进而可为母节点并且分裂为另外四个子节点。作为四叉树的叶节点的最终未分裂的子节点包括译码节点(即,经译码视频块)。与经译码位流相关联的语法数据可定义树块可被分裂的最大次数,并且还可定义译码节点的最小大小。在一些实例中,树块被称为LCU。
CU包含译码节点及与译码节点相关联的预测单元(PU)及变换单元(TU)。CU的大小对应于译码节点的大小并且CU的形状可为方形。在一些实例中,CU的大小范围为8x8个像素到具有最大为64x64个像素或更大的树块的大小。在一些实例中,每一CU含有一或多个PU及一或多个TU。与CU相关联的语法数据描述例如将CU分割为一或多个PU。在CU是以跳过或直接模式编码、帧内预测模式编码或帧间预测模式编码之间,分割模式不同。在一些实例中,PU可经分割为形状为非方形。与CU相关联的语法数据例如也描述根据四叉树将CU分割为一或多个TU。TU的形状可为方形或非方形。
HEVC标准允许根据TU的变换,TU对于不同CU来说可不同。TU通常基于经定义用于经分割的LCU的给定CU内的PU大小而设定大小,然而情况并非总是如此。TU通常与PU大小相同或小于PU。在一些实例中,使用被称为“残余四叉树”(RQT)的四叉树结构将对应于CU的残余样本再分为较小单元。RQT的叶节点可被称为变换单元(TU)。在一些实例中,与TU相关联的像素差值经变换以产生经量化的变换系数。
通常,PU包含与预测过程有关的数据。举例来说,当PU经帧内预测译码时,PU包含描述PU的帧内预测模式的数据。作为另一实例,当PU经帧间预测译码时,PU包含定义PU的运动向量的数据。定义PU的运动向量的数据描述例如运动向量的水平分量、运动向量的垂直分量、运动向量的分辨率(例如,四分之一像素精度或八分之一像素精度)、运动向量所指向的参考图片及/或运动向量的参考图片列表(例如,RefPicList0或RefPicList1)。
通常,TU用于变换及量化过程。具有一或多个PU的给定CU还可包含一或多个变换单元(TU)。在进行预测之后,视频编码器20可计算对应于PU的残余值。残余值包括可使用TU经变换为变换系数、经量化及扫描以产生用于熵译码的串行化变换系数的像素差值。本发明通常使用术语“视频块”来指代CU的译码节点。在一些具体情况下,本发明还可使用术语“视频块”来指代树块,即LCU或CU,所述树块包含译码节点及PU和TU。
作为实例,HM支持各种PU大小的预测。假设特定CU的大小为2Nx2N,HM支持PU大小为2Nx2N或NxN的帧内预测及对称PU大小为2Nx2N、2NxN、Nx2N或NxN的帧间预测。HM还支持PU大小为2NxnU、2NxnD、nLx2N及nRx2N的帧间预测的不对称分割。在不对称分割中,不对CU的一个方向进行分割,而另一方向被分割为25%和75%。对应于25%分割的CU部分由“n”之后跟着“Up(上)”、“Down(下)”、“Left(左)”或“Right(右)”的指示来指示。因此,举例来说,“2NxnU”指代被水平地分割成2Nx 0.5N PU在上且2Nx 1.5N PU在下的2Nx 2N CU。
在H.264标准或HEVC标准中,在进行帧内预测或帧间预测译码之后,视频编码器20可以HEVC或针对H.264中的宏块计算CU的TU的残余数据。PU包括空间域(也被称为像素域)中的像素数据,并且在对残余视频数据应用变换(例如,离散余弦变换(DCT))、整数变换、小波变换或概念上类似的变换之后,TU包括变换域中的系数。残余数据可对应于未经编码图片的像素与对应于HEVC中PU的预测值或H.264中宏块的预测值之间的像素差。
在一些实例中,在进行任何变换以产生变换系数之后,视频编码器20执行变换系数的量化。量化通常是指将变换系数量化以可能地减少用于表示系数的数据量从而提供进一步压缩的过程。量化过程减少与系数中的一些或全部相关联的位深度。举例来说,在量化期间,可将n位值向下舍入到m位值,其中n大于m。
在一些实例中,视频编码器20利用预定义的扫描次序来扫描经量化变换系数,以产生可经熵编码的经串行化向量。在其它实例中,视频编码器20执行自适应扫描。在扫描经量化变换系数以形成一维向量之后,视频编码器20对所述一维向量进行熵编码,例如根据上下文自适应可变长度译码(CAVLC)、上下文自适应二进制算术译码(CABAC)、基于语法的上下文自适应二进制算术译码(SBAC)、概率区间分割熵(PIPE)译码或另一熵编码方法。视频编码器20也对与经编码视频数据相关联的语法元素进行熵编码以供视频解码器30在解码视频数据过程中使用。
为了执行CABAC,视频编码器20可将上下文模型内的上下文指派给待发射的符号。上下文可(例如)与所述符号的相邻值是否为非零有关。为了执行CAVLC,视频编码器20可为待发射的符号选择可变长度码。VLC中的码字可经构建,使得相对较短的码对应于概率较大的符号,而较长的码对应于概率较小的符号。以此方式,VLC的使用可相较于(例如)为待发射的每一符号使用等长码字实现位节省。概率确定可基于指派给符号的上下文。
如上文所述,为了执行帧间预测译码(例如,由视频编码器20进行的帧间预测译码或由视频解码器30进行的帧间预测解码),视频编码器20和视频解码器30可配置为构建一或两个参考图片列表(即,RefPicList0和RefPicList1)。举例来说,在解码当前图片内的块之前,视频解码器30可构建RefPicList0和RefPicList1,其中RefPicList0和RefPicList1识别参考图片,视频解码器30可潜在地使用所述参考图片以对当前图片内的块(例如,对当前图片内的块进行帧间预测解码)进行帧间预测。存在多种视频解码器30可构建RefPicList0和RefPicList1的方式,并且本发明中描述的技术不限于用于构建RefPicList0和RefPicList1的任一具体技术。
视频编码器20也可配置以构建RefPicList0和RefPicList1。举例来说,视频编码器20侧上的RefPicList0和RefPicList1可识别图片,视频编码器20可潜在地使用所述图片来对图片的块进行帧间预测编码,并且视频解码器30侧上的RefPicList0和RefPicList1可识别图片,视频解码器30可潜在地使用所述图片来对图片的块进行帧间预测解码。视频编码器20所构建的RefPicList0和RefPicList1实质上可类似于视频解码器30所构建的各个RefPicList0和RefPicList1。
如上文所描述,RefPicList0和RefPicList1识别参考图片。在一些实例中,RefPicList0和RefPicList1可用其图片序列号(POC)值来识别参考图片。POC值为图片的唯一识别符并且指示输出或显示图片的次序。举例来说,具有较小POC值的图片先于具有较大POC值的图片输出或显示。POC值不应与译码次序混淆。举例来说,有可能具有较小POC值的图片晚于具有较大POC值的图片进行编码或解码。
在一些实例中,存在与RefPicList0和RefPicList1中识别的每一图片相关联的加权预测参数。加权预测参数指示比例因子,视频解码器30利用所述比例因子来调整参考图片内像素的像素值,所述像素用于对当前图片内的块进行帧间预测(例如,对当前图片内的块进行帧间预测解码)。举例来说,如果RefPicList0中第一图片的加权预测参数为‘x’并且视频解码器30使用RefPicList0中第一图片来对当前图片中的块进行帧间预测,那么视频解码器30可用如运动向量所指示的RefPicList0中第一图片中的块的像素值乘以值x,所述块用于帧间预测。视频解码器30可将所得值用于对当前图片的块进行帧间预测。加权预测参数也可定义在调整像素值之后添加或减去的偏移。
视频编码器20可配置以在经译码位流中用信号传递视频解码器30所构建的参考图片列表的加权预测参数。下表1说明语法元素的一个实例,视频编码器20将所述语法元素用信号传递至视频解码器30以用信号传递加权预测参数。表1实质上类似于HEVC WD6的部分7.3.3.8中的表。HEVC WD9的部分7.3.8.4包含最新加权预测参数语法,所述语法类似于下表,其中由于HEVC标准从HEVC WD6至HEVC WD9的变化产生差异。
表1-预测权重表语法
在HEVC WD6中,ref_pic_list_combination_flag定义如下。
等于1的ref_pic_list_combination_flag指示将参考图片RefPicList0和参考图片RefPicList1组合为用于正在单向预测的预测单元的额外参考图片列表组合。等于0的所述旗标指示参考图片RefPicList0和参考图片RefPicList1相同,因此参考图片RefPicList0用作参考图片列表组合。参考图片列表组合经设定为在表1中定义的环路开始时为空。
上文描述参考图片列表组合(有时被称为经组合参考图片列表或RefPicListC)的概念。视频解码器30可从RefPicList0及RefPicList1派生出RefPicListC。使用RefPicListC,视频编码器20不需要指定经单向预测的块是从RefPicList0中的图片还是从RefPicList1中的图片预测,因为视频解码器30使用RefPicListC来对所述经单向预测的块进行帧间预测。
在ref_pic_list_combination_flag的以上描述中,当ref_pic_list_combination_flag等于0时,RefPicList0和RefPicList1相同。“相同”意味着RefPicList0和RefPicList1以完全相同的次序识别完全相同的参考图片。举例来说,当RefPicList0和RefPicList1相同时,RefPicList0和RefPicList1为彼此的副本。
当RefPicList0和RefPicList1相同时,可能不需要视频编码器20来在经译码位流中用信号传递RefPicList0和RefPicList1两者的参数(例如,加权预测参数)。确切地说,视频编码器20用信号传递RefPicList0或RefPicList1中的一个的参数可能已足够,并且视频解码器30可确定经信号传递的参数可用于RefPicList0和RefPicList1两者。在一些情况下,当RefPicList0和RefPicList1相同时,视频编码器20可在经译码位流中用信号传递RefPicList0的参数,并且视频解码器30可从经译码位流接收所述参数。
当ref_pic_list_combination等于1时,RefPicList0和RefPicList1可相同或可不同。如果ref_pic_list_combination等于1,那么视频编码器20可在经译码位流中用信号传递经组合参考图片列表(RefPicListC)的多个条目,并且视频解码器30可从经译码位流接收所述多个条目。定义RefPicListC中的所述多个条目的语法元素可被称为num_ref_idx_lc_active_minus1。
如果ref_pic_list_combination等于1,那么视频编码器20也可在经译码位流中进行信号传递,并且视频解码器30可从经译码位流接收指示构建经组合参考图片列表的方式的语法元素。所述语法元素被称为ref_pic_list_modification_flag_lc。在一些实例中,ref_pic_list_modification_flag_lc的默认值为0。
下表2说明语法元素的一个实例,视频编码器20将所述语法元素用信号传递至视频解码器30以用于参考图片RefPicList组合语法。表2实质上类似于HEVC WD6的部分7.3.3.3中的表。
表2-参考图片列表组合语法
以上实例描述RefPicList0、RefPicList1和RefPicListC的概念。然而,在HEVCWD9中,删除经组合参考图片列表(RefPicListC)的概念。虽然RefPicListC已从HEVCWD9删除,但本发明中描述的技术适用于HEVC标准。举例来说,本发明中描述的技术不一定受限于使用经组合参考图片列表的语法元素的实例。确切来说,本发明中描述的技术可利用其它语法元素或利用新语法元素。因此,仅出于说明目的来提供所述技术关于经组合参考图片列表的描述,并且所述描述不应视为限制性的。此外,虽然经组合参考图片列表从HEVC WD9删除,但未来标准利用经组合参考图片列表概念是很有可能的。
如上文所述,等于0的语法元素ref_pic_list_combination_flag意味着RefPicList0和RefPicList1相同。再次,ref_pic_list_combination_flag是语法元素的一个实例,并且很可能视频编码器20按经译码位流用信号传递不与经组合参考图片列表有关的另一语法元素,并且视频解码器30从经译码位流接收所述另一语法元素,所述另一语法元素指示RefPicList0和RefPicList1是否相同(或实质上等效,如更详细描述)。
然而,如表1中所指示,即使在RefPicList0和RefPicList1相同时,视频编码器20也可用信号传递RefPicList0和RefPicList1两者的加权预测参数。这导致了加权预测参数的不必要信号传递,消耗了带宽并且增加了视频解码器30的处理时间。举例来说,当RefPicList0和RefPicList1相同时,可能不需要视频编码器20用信号传递两个列表中的参考图片的加权预测参数。相反,在视频编码器20在经译码位流中用信号传递参考图片列表中的一个列表的加权预测参数并且另一个参考图片列表获得加权预测参数的情况下可实现带宽和计算效率。
例如,如果RefPicList0和RefPicList1相同,那么视频编码器20可在经译码位流中用信号传递RefPicList0中的参考图片的加权预测参数。视频解码器30可从经译码位流接收RefPicList0中的参考图片的加权预测参数。在这种情况下,视频解码器30可不从经译码位流接收RefPicList1中的参考图片的加权预测参数。确切来说,视频解码器30可基于RefPicList0的所接收的加权预测参数确定RefPicList1的参考图片的加权预测参数。举例来说,视频解码器30可将RefPicList0中的参考图片的加权预测参数复制为RefPicList1中的参考图片的加权预测参数。用这种方式,RefPicList1从RefPicList0获得加权预测参数。
虽然以上实例描述当RefPicList0和RefPicList1相同时,视频编码器20在经译码位流中用信号传递RefPicList0的加权预测参数,但本发明中描述的技术不受此限制。在一些实例中,当RefPicList0和RefPicList1相同时,视频编码器20可在经译码位流中用信号传递RefPicList1中的参考图片的加权预测参数。视频解码器30可基于RefPicList1的加权预测参数确定RefPicList0中的参考图片的加权预测参数(例如,复制加权预测参数)。在这个实例中,RefPicList0从RefPicList1获得加权预测参数。
此外,在以上实例中,当RefPicList0和RefPicList1“相同”时,视频编码器20用信号传递并且视频解码器30接收两个参考图片列表中的一个列表的加权预测参数,而并非两个列表的加权预测参数。然而,不一定需要RefPicList0和RefPicList1相同。在一些实例中,参考图片列表中的一个列表可为另一参考图片列表的子集。举例来说,RefPicList0可识别M个参考图片,并且RefPicList1可识别N个参考图片。换句话说,RefPicList0的大小不同于RefPicList1的大小。在这个实例中,假设M大于N。在一些情况下,RefPicList0的前N个条目可与RefPicList1的N个条目相同(即,RefPicList0的子集与RefPicList1在内容和次序上相同)。
在这种情况下,当第一参考图片列表的子集与第二参考图片列表的整体或子集相同时,视频编码器20可在经译码位流中用信号传递语法元素,所述语法元素指示第一参考图片列表的子集与第二参考图片列表的整体或子集相同,并且视频编码器20可用信号传递较长参考图片列表(例如,第一参考图片列表)的加权预测参数。视频解码器30可基于较长参考图片列表的加权预测参数确定较短参考图片列表(例如,第二参考图片列表)的加权预测参数。如果存在任何残留参考图片,那么视频编码器20可用信号传递所述残留参考图片的加权预测参数。为了便于说明,用实例来描述所述技术,其中参考图片列表中的一个列表的子集与另一参考图片列表的整体相同。
例如,在构建RefPicList0和RefPicList1时,视频解码器30可能已确定RefPicList0和RefPicList1中的条目数目(例如,RefPicList0中M个及RefPicList1中N个)。在这个实例中,视频解码器30可从经译码位流接收指示RefPicList0的子集等效于RefPicList1的整体的语法元素,并且也可从经译码位流接收RefPicList0的M个加权预测参数(且不从经译码位流接收RefPicList1的N个加权预测参数)。在这个实例中,视频解码器30可复制视频解码器30所接收的RefPicList0的总计M个加权预测参数中的前N个加权预测参数,并且将其设定成RefPicList1的N个条目的加权预测参数。
在以上实例中,RefPicList0的前N个加权预测参数与RefPicList1的N个加权预测参数相同。然而,在一些实例中,RefPicList0的不同子集(例如,中间N个加权预测参数)可能与RefPicList1的N个加权预测参数相同。在这些实例中,视频编码器20可用信号传递并且视频解码器30可接收识别相同的子集的语法元素。
还应理解,仅出于说明目的提供包含与RefPicList1的整体相同的子集的RefPicList0,并且所述RefPicList0不应被为限制性的。在一些情况下,RefPicList1的子集可与RefPicList0的整体相同,并且视频编码器20可用信号传递且视频解码器30可接收RefPicList1的加权预测参数,视频解码器30可根据RefPicList1的加权预测参数确定RefPicList0的加权预测参数。
在上文所描述的实例中,当第一参考图片列表与第二参考图片列表相同时,或当第一参考图片列表的子集与第二参考图片列表的整体相同时,视频编码器20可用信号传递第一参考图片列表加权预测参数,而不用信号传递第二参考图片列表的加权预测参数。如本发明中所使用,术语“实质上等效”指代两个参考图片列表相同的实例,或参考图片列表中的一个列表的子集与另一参考图片列表的整体或另一参考图片的子集相同的实例。换句话说,如果第一参考图片列表实质上等效于第二参考图片列表,那么第一参考图片列表与第二参考图片列表相同,或第一参考图片的子集与第二参考图片列表的整体或子集相同。在一些实例中,可在两个列表实质上等效时利用旁路译码。另外,在一个参考图片列表的子集与另一参考图片列表的子集相同的实例中,视频编码器20可用信号传递且视频解码器30可接收两个参考图片列表中任何剩余参考图片的加权预测参数。
一般来说,在RefPicList0和RefPicList1实质上等效且具有不同大小时,RefPicList0将比RefPicList1长的概率大于RefPicList1比RefPicList0长的概率。换句话说,在RefPicList0和RefPicList1实质上等效且具有不同大小时,RefPicList0中的条目数目大于RefPicList1中的条目数目的概率大于RefPicList1中的条目数目大于RefPicList0中的条目数目的概率。
因此,在一些实例中,只有在RefPicList0和RefPicList1的大小相同时,或在RefPicList0的大小比RefPicList1的大小长时,而非在RefPicList1的大小比RefPicList0的大小长时,视频编码器20可仅信号传递一个列表的加权预测参数。通过这种方式,视频解码器30可不需要确定视频解码器30接收哪个参考图片列表的加权预测参数,因为在RefPicList0和RefPicList1实质上等效时,加权预测参数将总是适合RefPicList0。
图2A和2B是说明实质上等效的参考图片列表的实例的概念图。图2A说明视频解码器30所构建的第一参考图片列表(RefPicList0)和第二参考图片列表(RefPicList1)。举例来说,RefPicList0和RefPicList1的索引列指示到RefPicList0和RefPicList1中的索引,并且POC值列指示RefPicList0和RefPicList1中识别的参考图片的POC值。
为了构建RefPicList0和RefPicList1,视频编码器20在经译码位流中用信号传递并且视频解码器30从经译码位流接收语法元素:num_ref_idx_l0_active_minus1和num_ref_idx_l1_active_minus1。num_ref_idx_l0_active_minus1语法元素指示RefPicList0中的条目数目,且num_ref_idx_l1_active_minus1语法元素指示RefPicList1中的条目数目。举例来说,num_ref_idx_l0_active_minus1加1等于RefPicList0中的条目数目,且num_ref_idx_l1_active_minus1加1等于RefPicList1中的条目数目。在图2A的实例中,num_ref_idx_l0_active_minus1等于3,且num_ref_idx_l1_active_minus1等于3。
如图2A中所说明,RefPicList0和RefPicList1相同(此为RefPicList0和RefPicList1实质上等效的一个实例)。举例来说,RefPicList0和RefPicList1识别相同参考图片(例如,通过其POC值)且次序相同。在这个实例中,视频编码器20可在经译码位流中用信号传递且视频解码器30可从经译码位流接收RefPicList0或RefPicList1中的一个的加权预测参数,而不接收另一个的加权预测参数(例如,接收两个参考图片列表中仅一个的加权预测参数)。视频解码器30可基于经信号传递的加权预测参数确定另一参考图片列表的加权预测参数,且在一些实例中,仅基于经信号传递的加权预测参数来确定。
图2B说明RefPicList0和RefPicList1的另一实例。然而,在这个实例中,num_ref_idx_l0_active_minus1等于4,因为RefPicList0中条目总数为5,且num_ref_idx_l1_active_minus1等于1,因为RefPicList1中条目总数为2。另外,RefPicList0的子集与RefPicList1的整体或子集相同(此为RefPicList0和RefPicList1实质上等效的另一实例)。举例来说,RefPicList0的5个条目中前2个(即,子集)与RefPicList1的两个条目(即,整体)相同。
在这个实例中,视频编码器20可用信号传递RefPicList0的加权预测参数,而不用信号传递RefPicList1的加权预测参数。视频解码器30可接收RefPicList0的加权预测参数,且基于RefPicList0的所接收加权预测参数确定RefPicList1的加权预测参数,并且在一些实例中,仅基于RefPicList0的所接收加权预测参数来确定。
例如,在这个实例中,视频解码器30可能已确定RefPicList0和RefPicList1的大小(例如,基于num_ref_idx_l0_active_minus1和num_ref_idx_l1_active_minus1的值)。视频解码器30可从经译码位流接收5个加权预测参数。视频解码器30可确定5个加权预测参数是针对RefPicList0的,因为RefPicList0的条目数目(即,大小)为5。因为视频解码器30不接收更多加权预测参数,所以视频解码器30可确定RefPicList1的加权预测参数是根据RefPicList0的加权预测参数来确定的。举例来说,视频解码器30可将RefPicList0的前两个加权预测参数复制为RefPicList1的加权预测参数。
在上文所描述的实例中,当两个参考图片列表实质上等效时,视频编码器20编码并用信号传递两个参考图片列表中的一个列表的加权预测参数而不编码及用信号传递另一个参考图片列表的加权预测参数。视频解码器30在两个参考图片列表实质上等效时接收并解码两个参考图片列表中的一个列表的加权预测参数,且不接收并解码两个参考图片列表中的另一个列表的加权预测参数。确切来说,根据视频解码器30接收加权预测参数的参考图片的加权预测参数,且在一些实例中,仅根据所述加权预测参数,视频解码器30确定视频解码器30不接收加权预测参数的参考图片列表的加权预测参数。
然而,本发明中描述的技术不受此限制。在一些实例中,所述技术可利用经组合参考图片列表(RefPicListC)来编码及用信号传递或接收及解码RefPicList0和RefPicList1的加权预测参数。如上文所描述,视频编码器20和视频解码器30各自构建RefPicList0和RefPicList1。术语P片段指代单向预测的片段,并且根据RefPicList0中的参考图片来预测。术语B片段指代根据RefPicList0或RefPicList1中的参考图片单向预测或根据来自RefPicList0和RefPicList1的参考图片双预测的片段。在一些情况下,对于经单向预测的B片段来说,视频编码器20可能需要指定所述片段是否正在根据RefPicList0或RefPicList1经预测。
在一些情况下,为了避免指示是RefPicList0还是RefPicList1用于经单向预测的片段的信号传递,视频编码器20和视频解码器30根据RefPicList0和RefPicList1构建经组合参考图片列表(RefPicListC)。通常,RefPicListC用于经单向预测B片段,但也可用于P片段。在这些情况下,视频编码器20用信号传递索引至RefPicListC中,且视频解码器30根据至RefPicListC中的索引识别待用于对单向预测片段的参考图片进行帧间预测。以这种方式,视频编码器20可能不需要用信号传递且视频解码器30可能不需要接收指示是根据RefPicList0还是RefPicList1预测经单向预测片段的语法元素。
视频编码器20和视频解码器30构建RefPicListC存在许多种方式。作为一个实例,视频编码器20和视频解码器30可实施用于根据经构建的RefPicList0和RefPicList1构建RefPicListC的默认构建方案。换句话说,视频编码器20和视频解码器30可各自针对包含待帧间预测的块的图片来构建RefPicList0和RefPicList1。随后,在视频编码器20不用信号传递及视频解码器30不接收指示构建RefPicListC的方式的语法元素的情况下,视频编码器20和视频解码器30可各自构建RefPicListC。作为另一实例,视频解码器30可构建RefPicListC,并且随后可接收指示修改RefPicListC的方式的语法元素。作为又一实例,视频解码器30可接收指示视频解码器30构建RefPicListC的方式的语法元素。
在这些实例中,当视频编码器20和视频解码器30构建RefPicListC时,在一些实例中,视频编码器20可在RefPicList0和RefPicList1实质上等效时用信号传递RefPicListC的加权预测参数。在这些实例中,视频编码器20可能不用信号传递RefPicList0和RefPicList1的加权预测参数。视频解码器30随后可在不接收RefPicList0或RefPicList1的加权预测参数的情况下根据RefPicListC的加权预测参数确定RefPicList0和RefPicList1的加权预测参数。
举例来说,如果RefPicList0和RefPicList1相同,那么RefPicListC将与RefPicList0和RefPicList1相同。在这种情况下,视频编码器20可用信号传递RefPicListC的加权预测参数,而不用信号传递RefPicList0和RefPicList1的加权预测参数,且视频解码器30可基于RefPicListC的加权预测参数确定RefPicList0和RefPicList1的加权预测参数。
作为另一实例,如果RefPicList0的子集与RefPicList1的整体或子集相同(反之亦然),那么RefPicListC可与两个参考图片列表的较长列表相同。在这种情况下,视频编码器20可用信号传递RefPicListC的加权预测参数,而不用信号传递RefPicList0和RefPicList1的加权预测参数,且视频解码器30可基于RefPicListC的加权预测参数确定RefPicList0和RefPicList1的加权预测参数。举例来说,视频解码器30可能已基于num_ref_idx_l0_active_minus1和num_ref_idx_l1_active_minus1确定RefPicList0和RefPicList1的大小,且因此可能已确定RefPicList0或RefPicList1中哪一个更长。
以这种方式,视频解码器30可能能够基于RefPicListC、RefPicList0和RefPicList1的大小确定RefPicListC的加权预测参数是否与RefPicList0或RefPicList1的所述加权预测参数相同。随后,视频解码器30可确定另一参考图片列表(即,RefPicList0和RefPicList1中的较短者)的加权预测参数。
如上文所描述,在一些实例中,视频编码器20可用信号传递指示经构建RefPicListC待修改的方式或构建RefPicListC的方式的语法元素。在这些实例中,视频编码器20可用信号传递指示RefPicListC中包含哪些参考图片的语法元素。另外,视频编码器20可用信号传递具有语法元素的RefPicListC的大小(例如,num_ref_idx_lc_active_minus1)。
在这些实例中,视频编码器20可能不用信号传递RefPicListC的加权预测参数。更确切地,视频解码器30可根据视频编码器20用信号传递的RefPicList0及RefPicList1的加权预测参数确定RefPicListC的加权预测参数。换句话说,即使RefPicList0及RefPicList1实质上不等效,视频编码器20可能不需要用信号传递RefPicListC的加权预测参数,并且视频解码器30可替代地根据RefPicList0及RefPicList1的经信号传递的加权预测参数确定RefPicListC的加权预测参数。
在以上实例中,假设当两个参考图片列表实质上等效时,加权预测参数相同,这允许一个参考图片列表继承另一参考图片列表的加权预测参数。然而,情况并不总是如此。很可能即使当两个参考图片列表实质上等效时,每一列表中参考图片的加权预测参数不相同。在此类情况下,即使两个参考图片列表实质上等效,视频编码器20可进行信号传递,并且视频解码器30可接收两个参考图片列表的加权预测参数。然而,出于说明的目的,本发明中描述的技术用实例来描述,其中实质上等效的参考图片列表的加权预测参数相同。
因此,在本发明中描述的实例技术中,视频译码器(其为用于视频编码器20或视频解码器30的通用术语)可对当前图片的第一列表的加权预测参数进行译码(其为用于编码或解码的通用术语)。视频译码器可基于第一列表的经译码加权预测参数而确定当前图片的第二列表的加权预测参数。在某一实例中,视频译码器可仅基于第一列表的经译码加权预测参数而确定第二列表的加权预测参数。随后,视频译码器可基于经译码加权预测参数及经确定加权预测参数中的至少一或多者来帧间预测当前图片内的块(例如,帧间预测编码或帧间预测解码块)。
在这些实例中,第一列表可为第一参考图片列表(RefPicList0)、第二参考图片列表(RefPicList1)或经组合参考图片列表(RefPicListC),并且第二列表不同于第一列表。在任一情况下,第一列表及第二列表包含用于对当前图片内的一或多个块进行帧间预测的参考图片。在视频译码器基于第一列表的加权预测参数确定第二列表的加权预测参数的实例中,视频译码器可仅基于第一列表的加权预测参数并且在不对第二列表的加权预测参数进行译码的情况下确定第二列表的加权预测参数。
在一些实例中,当第一列表及第二列表实质上等效时,视频译码器可基于第一列表的加权预测参数确定第二列表的加权预测参数。举例来说,假设第一列表为RefPicList0,第二列表为RefPicListC,并且第三列表为RefPicList1。在这个实例中,当RefPicList0及RefPicList1实质上等效时,视频译码器可基于RefPicList0的加权预测参数确定RefPicListC的加权预测参数。
作为另一实例,假设第一列表为RefPicList0且第二列表为RefPicList1。在这个实例中,第三列表等于第二列表(即,第三列表也为RefPicList1)。在这个实例中,如果第一列表和第三列表(即,RefPicList0和RefPicList1)实质上等效,那么视频译码器可基于第一列表(即,RefPicList0)的加权预测参数来确定第二列表(即,RefPicList1)的加权预测参数。
下文用对应语法元素描述用于根据一个列表确定另一列表的加权预测参数的各个方面。如上文及在HEVC WD6中所定义,一些方面利用ref_pic_list_combination_flag的定义,例如RefPicList0和RefPicList1相同的方面。一些方面修改ref_pic_list_combination_flag的定义,例如RefPicList0或RefPicList1的子集与其它列表(例如,RefPicList0中的N个条目与RefPicList1中的N个条目相同,其中RefPicList1中的N个条目可为RefPicList1的整体)的整体或子集相同的方面。再次,ref_pic_list_combination_flag为可用于指示参考图片列表是否实质上等效的语法元素的一个实例。然而,所述技术不限于使用ref_pic_list_combination_flag。此外,本发明所描述的技术可扩展至不考虑或不使用经组合参考图片列表的情况。
在第一方面,ref_pic_list_combination_flag的定义与上文关于表1所定义的相同。在所述第一方面,如果假设在两个列表“相同”时,列表中的一个(例如,RefPicList1)的加权预测参数从另一列表(例如,RefPicList0)获得,那么表3提供语法元素的实例。然而,如果ref_pic_list_combination_flag的值并不指示两个列表的加权预测参数是否相同,那么即使RefPicList0和RefPicList1实质上等效,视频编码器20也用信号传递RefPicList0和RefPicList1两者的加权预测参数。
如下文表3中所指示,表1中的“if(slice_type==B)”的伪码用“if(slice_type==B&&ref_pic_list_combination_flag!=0)”替代。换句话说,伪码指示仅在RefPicList0和RefPicList1不相同时,在视频编码器20用信号传递RefPicList1的加权预测参数时的情况才如此。
表3-预测权重表语法
在表3中,对于在不进行列表组合运算(例如,ref_pic_list_modification_flag_lc==0)情况下的P片段和B片段,视频编码器20用信号传递RefPicList0的加权预测参数。ref_pic_list_modification_flag_lc语法元素指示是否需要对经组合参考图片列表进行任何修改,及0指示不需要对经组合参考图片列表进行修改。
在这个实例中,如果RefPicList0和RefPicList1不相同,那么视频编码器20针对B片段并且在ref_pic_list_modification_flag_lc等于0时用信号传递RefPicList1的加权预测参数。否则,视频编码器20不用信号传递RefPicList1的加权预测参数,因为RefPicList0和RefPicList1的加权预测参数相同。
如果存在经组合参考图片列表修改(即,ref_pic_list_modification_flag_lc==1),那么视频编码器20用信号传递RefPicListC的加权预测参数。视频解码器30可根据RefPicListC的经信号传递的加权预测参数确定RefPicList0和RefPicList1的加权预测参数。举例来说,为了构建RefPicListC,视频解码器30可能已从RefPicList0和RefPicList1选择参考图片。以这种方式,视频解码器30可能已确定RefPicList0、RefPicList1与RefPicListC之间的映射(即,可能已确定哪些来自RefPicList0和RefPicList1的图片被包含在RefPicListC中及哪些图片被包含在RefPicListC的哪个索引中)。
因此,通过接收RefPicListC的加权预测参数,以及通过预告确定RefPicListC、RefPicList0与RefPicList1之间的映射,视频解码器30可确定RefPicList0和RefPicList1的加权预测参数。举例来说,假设视频解码器30包含RefPicList0的第一参考图片作为RefPicListC的第一参考图片,并且包含RefPicList1的第一参考图片作为RefPicListC的第二参考图片。在这个实例中,视频解码器30可接收RefPicListC的前两个参考图片的加权预测参数。视频解码器30可将RefPicListC的第一加权预测参数设定为RefPicList0的第一图片的加权预测参数,并且可将RefPicListC的第二加权预测参数设定为RefPicList1的第二图片的加权预测参数。
在第二方面,ref_pic_list_combination_flag的定义可能不同于上文及HEVCWD6中所定义的。举例来说,在第二方面,等于1的ref_pic_list_combination_flag可指示RefPicList0和RefPicList1经组合为用于正在经单向预测的预测单元的额外参考图片列表组合(例如,RefPicListC)。等于0的ref_pic_list_combination_flag可指示较短列表(RefPicList0或RefPicList1)的前N=min(num_ref_idx_l0_active_minus1+1,num_ref_idx_l1_active_minus1+1)等于较长列表的前(例如,上面)N个元素(即,一个列表的子集与另一列表的整体或子集相同)。在这个实例中,将较长列表用作RefPicListC,且将RefPicListC设定为在下表4中定义的环路开始时为空。换句话说,如果较短列表的前N个元素(例如,条目)等效于较长列表的前N个元素,那么视频编码器20可用信号传递仅N个元素的加权预测参数。在一些实例中,如果各自存在额外参考图片,那么视频编码器20可用信号传递剩余图片的加权预测参数。
表4-预测权重表语法
在第二方面,如果P片段和B片段不相同(且ref_pic_list_combination_flag!=0)且不存在列表组合运算(即,ref_pic_list_modification_flag_lc==0),那么视频编码器20可用信号传递RefPicList0及RefPicList1的加权预测参数。如果存在列表修改(即,ref_pic_list_modification_flag!=0)或RefPicList0和RefPicList1实质上等效(即,ref_pic_list_combination_flag==0),那么视频编码器20可用信号传递RefPicListC的加权预测参数。视频解码器30可根据RefPicListC的经信号传递的加权预测参数确定RefPicList0和RefPicList1的加权预测参数。
对于RefPicList0和RefPicList1实质上等效(即,ref_pic_list_combination_flag==0)时的情况,视频解码器30可基于每一者的大小(即,基于num_ref_idx_l0_active_minus1、num_ref_idx_l1_active_minus1)确定视频解码器30接收哪个参考图片列表的加权预测参数。视频解码器30可通过将经信号传递的列表的加权预测参数复制到未经信号传递的列表及在前N个元素之后截断来确定视频解码器30未接收其加权预测参数的列表的加权预测参数(例如,如由未经信号传递的列表的大小所确定)。
对于RefPicListC待修改的情况,视频解码器30可基于上文用表2描述的参考图片列表组合语法的语法元素确定来自RefPicList0的RefPicListC中的来源。另外,如果RefPicList0和RefPicList1两者的加权预测参数即使在两个列表实质上等效时也将用信号传递,那么视频编码器20可用信号传递且视频解码器30可接收两个列表的加权预测参数。
应理解,语法元素“ref_pic_list_combination_flag”可用以上实例中的任一语法元素名称代替以指示是否两个列表实质上等效。如果语法元素的0值指示列表实质上等效,那么以上语法元素可相同。否则,检查这一语法元素的值的逻辑应逆转(即,==0将用!=0代替,且反之亦然)。
类似地,语法元素“ref_pic_list_modification_flag_lc”可用以上实例中的任一语法元素名称代替,所述名称指示是否视频解码器30将通过从视频编码器20显式信号传递来构建RefPicListC。如果这个语法元素的值为0,那么视频解码器30可使用非显式经信号传递的技术(例如,默认或隐式技术)构建RefPicListC。如果语法元素的0值指示RefPicListC经非显式构建,那么以上语法可相同。否则,用于检查这个语法元素的值的逻辑应逆转(即,==0将由!=0代替,且反之亦然)。
在第三方面,假设默认RefPicListC形成不考虑列表构建中的加权预测参数。另外,视频编码器20总是用信号传递RefPicListC中的B片段的加权预测参数,而不是分别用信号传递RefPicList0和RefPicList1的加权预测参数。P片段使用单一列表,所以所述第三方面的P片段的技术与上文相同。P片段可经处理为RefPicListC的特例,其中所有参考图片来自一个列表(即,RefPicList0)。在所述第三方面,经组合列表信号传递适用于默认经组合列表过程或经修改组合列表,其中视频编码器20显式信号传递经组合列表条目。
在所述第三方面,ref_pic_list_combination_flag可不影响加权预测参数的信号传递,因为如果RefPicList0和RefPicList1两者实质上等效,那么RefPicListC将等效于RefPicList0或RefPicList1中的一者。num_ref_idx_lc_active_minus1的值等于视频编码器20在片段组头(如果存在)中用信号所传递的。对于RefPicListC的默认或隐式构建,不用信号传递num_ref_idx_lc_active_minus1的值,并且假设所述值等于根据用于构建RefPicListC的隐式或默认技术产生的RefPicListC的大小减1。在HEVC WD6中B片段的用于参考图片列表组合的部分8.3.4.3映射过程中提供用于构建RefPicListC的一个实例默认技术。然而,技术不限于用于构建RefPicListC的这类默认技术。
表5-预测权重表语法
或者,在第三方面,如果P片段经处理作为具有num_ref_idx_l0_active_minus1加1个条目的经组合列表的特例,那么B片段和P片段的语法可经组合。对于P片段,num_ref_idx_lc_active_minus1的值将等于num_ref_idx_l0_active_minus1,对于B片段的默认RefPicListC,其值将等于产生自部分8.3.4.3(上文所述)及一个实例中描述的过程的列表的大小。对于RefPicListC的参考图片使用ref_pic_list_modification_flag_lc经显式信号传递时的情况,其值将等于num_ref_idx_lc_active_minus1语法。表6提供第三方面的替代的语法元素。
表6-预测权重表语法
在第四方面,ref_pic_list_combination_fiag的定义与上文关于表1和HEVC WD6描述的相同。第三方面可类似于第一方面,且表7提供第四方面的语法元素。然而,在第四方面,视频编码器20可不用信号传递经修改的组合列表加权预测参数。在这个实例中,视频解码器30可根据RefPicList0和RefPicList1的加权预测参数确定RefPicListC的加权预测参数。
表7-预测权重表语法
图3是说明可实施本发明中描述的技术的视频编码器的实例的框图。举例来说,图3说明视频编码器20,所述视频编码器20可执行视频片段内的视频块的帧内及帧间译码(例如,如帧内预测编码的帧内预测或如帧间预测编码的帧间预测)。帧内译码依赖于空间预测以减少或移除给定视频帧或图片内的视频的空间冗余。帧间译码依赖于时间预测以减少或移除视频序列的相邻帧或图片内的视频的时间冗余。帧内模式(I模式)可指几个基于空间的压缩模式中的任一个。例如单向预测(P模式)或双预测(B模式)的帧间模式可指几个基于时间的压缩模式中的任一个。
在图3的实例中,视频编码器20包含分割单元40、预测处理单元42、参考图片存在器64、求和器50、变换处理单元52、量化处理单元54和熵编码单元56。预测处理单元42包含运动估计单元44、运动补偿单元46和帧内预测单元48。对于视频块重构建,视频编码器20还包含逆量化处理单元58、逆变换处理单元60和求和器62。还可包含解块滤波器(图3中未展示)以将块边界滤波,以从经重建的视频移除成块性假影。在需要时,解块滤波器通常对求和器62的输出进行滤波。除解块滤波器之后,还可使用额外环路滤波器(环路中或环路后)。参考图片存储器64为解码图片缓冲器(DPB)的一个实例。
如图3中展示,视频编码器20接收视频数据,且分割单元40将数据分割为视频块。这种分割还可包含分割成片段、图块或其它较大单元,以及视频块分割(例如,根据LCU和CU的四叉树结构)。视频编码器20通常说明编码视频片段内待编码的视频块的组件。片段可经分成多个视频块(及可能分成被称为图块的视频块组)。预测处理单元42可基于错误结果(例如,译码率及失真程度)针对当前视频块选择多个可能译码模式中的一个,例如多个帧内译码模式中的一个或多个帧间译码模式中的一个。预测处理单元42可提供所得帧内或帧间译码块至求和器50以产生残余块数据,及至求和器62以重建经编码块以用作参考图片。
预测处理单元42内的帧内预测单元48可执行当前视频块相对于与待译码的当前块相同的帧或片段中的一或多个相邻块的帧内预测译码,以提供空间压缩。预测处理单元42内的运动估计单元44和运动补偿单元46执行当前视频块相对于一或多个参考图片中的一或多个预测块的帧间预测译码,以提供时间压缩。
运动估计单元44可经配置以根据视频序列的预定模式确定视频片段的帧间预测模式。预定模式可指定序列中的视频片段为P片段或B片段。运动估计单元44与运动补偿单元46可高度集成,但出于概念上的目的而分开予以说明。由运动估计单元44执行的运动估计为产生估计视频块的运动的运动向量的过程。举例来说,运动向量可指示当前视频帧或图片内的视频块相对于参考图片内的预测块的PU的位移。
预测块为发现在像素差方面密切匹配待译码的视频块的PU的块,所述像素差可通过绝对差和(SAD)、方差和(SSD)或其它差度量来确定。在一些实例中,视频编码器20可计算存储在参考图片存储器64中的参考图片的子整数像素位置的值。举例来说,视频编码器20可插入参考图片的四分之一像素位置、八分之一像素位置或其它分数的像素位置的值。因此,运动估计单元44可执行相对于全像素位置及分数像素位置的运动搜索及输出具有分数像素精度的运动向量。
运动估计单元44通过比较PU的位置与参考图片的预测块的位置来计算帧间译码片段中的视频块的PU的运动向量。参考图片可选自第一参考图片列表(RefPicList0)或第二参考图片列表(RefPicList1),所述列表中的每一列表识别存储在参考图片存储器64中的一或多个参考图片。运动估计单元44将经计算运动向量发送到熵编码单元56和运动补偿单元46。
由运动补偿单元46执行的运动补偿可涉及基于由运动估计确定的运动向量来提取或产生预测块,可能执行至子像素精度的插入。在接收当前视频块的PU的运动向量之后,运动补偿单元46可将预测块定位在一个参考图片列表中,运动向量指向所述预测块。视频编码器20通过正在经译码的当前视频块的像素值减去预测块的像素值来形成残余视频块,从而形成像素差值。像素差值形成块的残余数据,并且可包含亮度和色度差分量两者。求和器50表示执行此减法运算的组件。运动补偿单元46还可产生与视频块和视频片段相关联的语法元素以供视频解码器30在解码视频片段的视频块过程中使用。
如上文所描述,作为由运动估计单元44和运动补偿单元46所执行的帧间预测的替代,帧内预测单元48可对当前块进行帧内预测。特别是,帧内预测单元48可确定帧内预测模式以用于对当前块进行编码。在一些实例中,帧内预测单元48可使用各种帧内预测模式(例如)在单独编码循环期间对当前块进行编码,且帧内预测单元48(或在一些实例中模式选择单元)可从经测试模式中选择使用适当帧内预测模式。举例来说,帧内预测单元48可使用用于各种经测试帧内预测模式的速率失真分析来计算速率失真值,且在经测试模式中选择具有最佳速率失真特征的帧内预测模式。速率失真分析通常确定经编码块与经编码以产生经编码块的原始未经编码块之间的失真(或误差)量,以及用于产生经编码块的比特率(即,比特数)。帧内预测单元48针对各种经编码块可根据失真及速率计算比率,以确定哪个帧内预测模式展示块的最佳速率失真值。
在任何情况下,在针对块选择帧内预测模式后,帧内预测单元48可提供指示块的选定帧内预测模式的信息至熵编码单元56。熵编码单元56可对指示选定帧内预测模式的信息进行编码。在可包含多个帧内预测模式索引表和多个经修改帧内预测模式索引表(也被称为码字映射表)的经发射位流配置数据中,视频编码器20可包含对各个块的上下文进行编码的定义和最可能帧内预测模式、帧内预测模式索引表和经修改帧内预测模式索引表的指示以用于每一上下文。
在预测处理单元42通过帧间预测或帧内预测产生当前视频块的预测块后,视频编码器20通过当前视频块减去预测块形成残余视频块。残余块中的残余视频数据可包含在一或多个TU中并且应用于变换处理单元52。变换处理单元52使用变换(例如,离散余弦变换(DCT)或概念上类似的变换)使残余视频数据变换为残余变换系数。变换处理单元52可将残余视频数据从像素域转换为变换域,例如频域。
变换处理单元52可将所得变换系数发送到量化处理单元54。量化处理单元54对变换系数进行量化以进一步减小比特率。量化过程可减少与系数中的一些或全部相关联的位深度。量化程度可通过调整量化参数来修改。在一些实例中,量化处理单元54随后可执行包含经量化变换系数的矩阵的扫描。替代地,熵编码单元56可执行所述扫描。
在量化之后,熵编码单元56对经量化变换系数进行熵编码。举例来说,熵编码单元56可执行上下文自适应可变长度译码(CAVLC)、上下文自适应二进制算术译码(CABAC)、基于语法的上下文自适应二进制算术译码(SBAC)、概率区间分割熵(PIPE)译码或另一熵编码方法或技术。在由熵编码单元56进行的熵编码之后,经编码位流可经发射至视频解码器30或经存档以用于由视频解码器30进行的后续发射或检索。熵编码单元56还可对正在进行译码的当前视频片段的运动向量及其它语法元素进行熵编码。
逆量化处理单元58及逆变换处理单元60分别应用逆量化和逆变换以重建像素域中的残余块以用作参考图片的参考块。运动补偿单元46可通过添加残余块至一个参考图片列表内的一个参考图片的预测块来计算参考块。运动补偿单元46还可应用一或多个插入滤波器至经重建残余块,以计算子整数像素值以在运动估计中使用。求和器62添加经重建残余块至由运动补偿单元46产生的经运动补偿的预测块以产生参考块以存储在参考图片存储器64中。参考块可由运动估计单元44和运动补偿单元46用作参考块以对后续视频帧或图片中的块进行帧间预测。
以这种方式,视频编码器20为经配置以实施本发明中描述的一或多个实例技术的视频编码器的实例。举例来说,预测处理单元42可经配置以实施用于根据一个列表确定另一列表的加权预测参数的实例技术。在一些实例中,除预测处理单元42的单元可实施上文所描述的实例。在一些实例中,预测处理单元42结合视频编码器20的一或多个其它单元可实施上文所描述的实例。在一些实例中,视频编码器20的处理器或单元(图3中未展示)可单独或结合视频编码器20的其它单元实施上文所描述的实例。
图4是说明可实施本发明中描述的技术的视频解码器的实例的框图。举例来说,视频解码器30可执行帧间预测解码或帧内预测解码。图4说明视频解码器30。在图4的实例中,视频解码器30包含熵解码单元70、预测处理单元71、逆量化处理单元76、逆变换处理单元78、求和器80和参考图片存储器82。预测处理单元71包含运动补偿单元72和帧内预测单元74。在一些实例中,视频解码器30可执行通常与关于图3的视频编码器20描述的编码循环相反的解码循环。参考图片存储器82为经解码图片缓冲器(DPB)的一个实例。
在解码过程期间,视频解码器30从视频编码器20接收表示经编码视频片段的视频块的经编码视频位流以及相关联语法元素。视频解码器30的熵解码单元70对位流进行熵解码以产生经量化系数、运动向量及其它语法元素。熵解码单元70将运动向量及其它语法元素转递到预测处理单元71。视频解码器30可接收视频片段电平及/或视频块电平下的语法元素。
当视频片段经译码为经帧内译码(I)片段,预测处理单元71的帧内预测单元74可基于经信号传递帧内预测模式及来自当前帧或图片的先前经解码的块的数据产生当前视频片段的视频块的预测数据。当视频帧经译码为经帧间译码(即,B或P)片段时,预测处理单元71的运动补偿单元72基于从熵解码单元70接收的运动向量和其它语法元素产生当前视频片段的视频块的预测块。预测块可产生自一个参考图片列表内的一个参考图片。视频解码器30可基于存储在参考图片存储器82中的参考图片使用默认构建技术构建参考图片列表(RefPicList0和RefPicList1)。
运动补偿单元72通过语法分析运动向量及其它语法元素来确定当前视频片段的视频块的预测信息,且使用预测信息来产生正在经解码的当前视频块的预测块。举例来说,运动补偿单元72使用一些经接收的语法元素来确定用于对视频片段的视频块进行译码的预测模式(例如,帧内或帧间预测)、帧间预测片段类型(例如,B片段或P片段)、片段的一或多个参考图片列表的构建信息、片段的每一经帧间编码的视频块的运动向量、片段的每一经帧间译码的视频块的帧间预测状态及其它信息,以解码当前视频片段中的视频块。
运动补偿单元72还可基于插入滤波器执行插入。运动补偿单元72可在视频块的编码期间使用视频编码器20使用的插入滤波器,以计算参考块的子整数像素的插入值。在这种情况下,运动补偿单元72可根据所接收的语法元素确定视频编码器20使用的插入滤波器并且使用插入滤波器来产生预测块。
逆量化处理单元76对在位流中提供并由熵解码单元70进行解码的经量化变换系数进行逆量化(即,去量化(de-quantize))。逆量化过程可包含使用视频片段中每一视频块的由视频编码器20计算的量化参数,以确定量化程度及同样应应用的逆量化程度。逆变换处理单元78将逆变换(例如,逆DCT、逆整数变换或概念上类似的逆变换过程)应用于变换系数,以便在像素域中产生残余块。
在运动补偿单元72基于运动向量及其它语法元素产生当前视频块的预测块之后,视频解码器30通过对来自逆变换处理单元78的残余块与由运动补偿单元72产生的对应预测块进行求和来形成经解码视频块。求和器80表示执行此求和运算的组件。如果需要的话,还可应用去块滤波器以对经解码块进行滤波,以便移除成块假象。其他环路滤波器(在译码环路中或译码环路后)还可用于使像素过程平滑,或以其他方式改进视频质量。给定图片中的经解码视频块随后被存储在参考图片存储器82中,所述参考图片存储器82存储用于后续运动补偿的参考图片。参考图片存储器82还存储经解码视频以用于稍后在显示装置(例如,图1的显示装置32)上呈现。
以这种方式,视频解码器30为经配置以实施本发明中描述的一或多个实例技术的视频解码器的实例。举例来说,预测处理单元71可经配置以实施用于根据一个列表确定另一列表的加权预测参数的实例技术。在一些实例中,除预测处理单元71以外的单元可实施上文所描述的实例。在一些实例中,预测处理单元71结合视频解码器30的一或多个其它单元可实施上文所描述的实例。在一些实例中,视频解码器30的处理器或单元(图4中未展示)可单独或结合视频解码器30的其它单元实施上文所描述的实例。
图5是说明根据本发明中描述的一或多个实例的视频编码器的实例操作的流程图。用于视频编码器的图5中说明的技术可适用于视频编码器20或其它类型的视频编码器。
视频编码器可确定第一列表的加权预测参数(90)。视频编码器可仅基于第一列表的加权预测参数来确定第二列表的加权预测参数(92)。视频编码器可基于第一和第二列表的加权预测参数来对一块进行帧间预测编码(94)。视频编码器可对仅第一列表的加权预测参数进行编码(96)。视频编码器可用信号传递仅第一列表的经编码加权预测参数(98)。
图6是说明根据本发明中描述的一或多个实例的视频解码器的实例操作的流程图。用于视频解码器的图6中说明的技术可适用于视频解码器30或其它类型的视频解码器。
视频解码器可从经译码位流接收仅第一列表的加权预测参数(100)。视频解码器可对仅第一列表的加权预测参数进行解码(102)。视频解码器可基于第一列表的加权预测参数来确定第二列表的加权预测参数(104)。视频解码器可至少基于经解码加权预测参数和经确定加权预测参数中的一或多个而对当前图片中的一块进行帧间预测解码(106)。
在图5或图6中说明的实例中,第一列表包含用于对当前图片内的一或多个块进行帧间预测的参考图片,且第二列表包含用于对当前图片内的一或多个块进行帧间预测的参考图片。第一列表和第二列表的实例包含RefPicListC、RefPicList0和RefPicList1,其中第一列表和第二列表不同。
在一些实例中,视频译码器(例如,视频编码器或视频解码器)可仅基于第一列表的加权预测参数确定第二列表的加权预测参数。在一些实例中,视频译码器可在不对第二列表的加权预测参数进行译码的情况下确定第二列表的加权预测参数。
视频译码器还可对语法元素进行译码,所述语法元素指示是否第一列表和第二列表实质上等效(即,相同,或当第一列表比第二列表长时,且第一列表的前N个条目与第二条目的前N个条目相同)。在一些实例中,当第一列表及第二列表实质上等效时,视频译码器可基于第一列表确定第二列表的加权预测参数。
在一或多个实例中,所描述的功能可在硬件、软件、固件或其任何组合中实施。如果在软件中实施,所述功能可作为一或多个指令或代码存储在计算机可读媒体上或通过所述媒体发射,并且由基于硬件的处理单元执行。计算机可读媒体可包含计算机可读存储媒体(其对应于有形媒体,例如数据存储媒体)或通信媒体,所述通信媒体包含促进(例如,根据通信协议)计算机程序从一处到另一处的转移的任何媒体。以这种方式,计算机可读媒体通常可对应于(1)非暂时的有形计算机可读存储媒体或(2)通信媒体,例如信号或载波。数据存储媒体可为任何可用媒体,所述媒体可由一或多个计算机或一或多个处理器访问以撷取指令、代码及/或数据结构以用于本发明中描述的技术的实施。计算机程序产品可包含计算机可读媒体。
例如而不限制,这种计算机可读存储媒体可包括RAM、ROM、EEPROM、CD-ROM或其它光碟存储器、磁碟存储器或其它磁性存储装置、闪存存储器或可用于以指令或数据结构存储所要程序代码并且可由计算机访问的任何其它媒体。另外,任何连接被恰当地称为计算机可读媒体。举例来说,如果使用同轴电缆、光纤电缆、双绞线、数字订户线(DSL)或例如红外线、无线电及微波的无线技术从网站、服务器或其它远程源发射指令,那么同轴电缆、光纤电缆、双绞线、DSL或例如红外线、无线电及微波的无线技术包含于媒体的定义中。然而,应理解,计算机可读存储媒体和数据存储媒体不包含连接、载波、信号或其它瞬态媒体,而替代地,其针对非瞬态有形存储媒体。如本文中所使用,磁盘及光盘包含紧密光盘(CD)、激光光盘、光学光盘、数字多功能光盘(DVD)、软磁盘及蓝光光盘,其中磁盘通常磁性地复制数据,而光盘使用激光光学地复制数据。上文的组合也应包含在计算机可读媒体的范围内。
可由例如一个或一个以上数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA)或其它等效集成或离散逻辑电路等一个或一个以上处理器来执行所述指令。因此,如本文中所使用的术语“处理器”可指上述结构或适合于实施本文中所描述的技术的任一其它结构中的任一者。另外,在一些方面,本文中所描述的功能性可提供在经配置以用于编码及解码的专用硬件及/或软件模块内可并入经组合编解码器中。并且,可将所述技术完全实施于一个或多个电路或逻辑元件中。
本发明的技术可在多种装置或设备中实施,包含无线电话、集成电路(IC)或IC组(例如,芯片组)。各种组件、模块或单元在本发明中经描述以强调经配置以执行所公开的技术的装置的功能方面,但不一定需要不是硬件单元实现。确切来说,如上文所描述,各种单元可组合为编解码硬件单元或由许多互操作硬件单元组合合适软件和/或固件提供,所述硬件单元包含一或多个上文所描述的处理器。
已描述了各种实例。这些及其它实例属于所附权利要求书的范围内。

Claims (25)

1.一种用于译码视频数据的方法,所述方法包括:
构建第一列表和第二列表,其中所述第一列表和所述第二列表各自包含用于帧间预测当前图片内的所述视频数据的一个或多个块的参考图片;
译码所述第一列表的加权预测参数,其中所述加权预测参数界定定标因素,所述第一列表中的各个参考图片内的像素值将通过所述定标因素定标以用于帧间预测所述当前图片中的块;
译码一语法元素,所述语法元素指示所述第一列表比所述第二列表长且所述第一列表的前N个条目与所述第二列表的前N个条目相同;
基于所述第一列表的所述加权预测参数,且基于所述语法元素指示所述第一列表比所述第二列表长且所述第一列表的所述前N个条目与所述第二列表的所述前N个条目相同,来确定所述第二列表的加权预测参数,其中所述第二列表包含用于帧间预测所述当前图片内的一或多个块的参考图片;及
至少基于所述第一列表的经译码的加权预测参数和所述第二列表的确定的加权预测参数中的一或多者帧间预测所述当前图片中的所述块。
2.根据权利要求1所述的方法,其中确定所述第二列表的所述加权预测参数包括基于所述第一列表的所述前N个条目的所述加权预测参数且不基于其它加权预测参数,来确定所述第二列表的所述前N个条目的所述加权预测参数。
3.根据权利要求1所述的方法,其中确定所述第二列表的所述加权预测参数包括在不译码所述第二列表的所述前N个条目的所述加权预测参数的情况下确定所述第二列表的所述前N个条目的所述加权预测参数。
4.根据权利要求1所述的方法,其中所述第一列表包括组合参考图片列表(RefPicListC)、第一参考图片列表(RefPicList0)或第二参考图片列表(RefPicList1)中的一者,且所述第二列表与所述第一列表不同。
5.根据权利要求1所述的方法,
其中译码加权预测参数包括解码所述第一列表的所述加权预测参数;
其中译码所述语法元素包括解码所述语法元素,所述语法元素指示所述第一列表比所述第二列表长且所述第一列表的所述前N个条目与所述第二列表的所述前N个条目相同;及
其中帧间预测包括至少基于所述第一列表的经解码的加权预测参数和所述第二列表的所述确定的加权预测参数中的一或多者帧间预测解码所述当前图片中的所述块。
6.根据权利要求1所述的方法,
其中译码加权预测参数编码所述第一列表的所述加权预测参数;
其中译码所述语法元素包括编码所述语法元素,所述语法元素指示所述第一列表比所述第二列表长且所述第一列表的所述前N个条目与所述第二列表的所述前N个条目相同;及
其中帧间预测包括至少基于所述第一列表的经编码的加权预测参数和所述第二列表的所述确定的加权预测参数中的一或多者帧间预测编码所述当前图片中的所述块。
7.根据权利要求1所述的方法,所述方法可在包括视频译码装置的无线通信装置上执行,所述无线通信装置包括:
存储器,其被布置于所述视频译码装置中以存储所述视频数据;
处理器,其经配置以从所述存储器撷取所述视频数据以构建所述第一列表和所述第二列表,其中所述处理器进一步经配置以译码所述第一列表的所述加权预测参数,译码所述语法元素,确定所述第二列表的所述加权预测参数,并帧间预测所述当前图片内的所述块;及
发射器和接收器当中的至少一者,其经配置以进行发射所述视频数据或接收所述视频数据当中的一者。
8.根据权利要求7所述的方法,其中所述无线通信装置是蜂窝电话,且所述视频数据由所述发射器和接收器当中的所述至少一者分别发射或接收,且根据蜂窝通信标准进行调制。
9.一种用于译码视频数据的装置,所述装置包括:
存储器,其用于存储所述视频数据;
视频译码器,所述视频译码器经配置以:
构建第一列表和第二列表,其中所述第一列表和所述第二列表各自包含用于帧间预测当前图片内的所述视频数据的一个或多个块的参考图片;
译码所述第一列表的加权预测参数,其中所述加权预测参数界定定标因素,所述第一列表中的各个参考图片内的像素值将通过所述定标因素定标以用于帧间预测所述当前图片中的块;
译码一语法元素,所述语法元素指示所述第一列表比所述第二列表长且所述第一列表的前N个条目与所述第二列表的前N个条目相同;
基于所述第一列表的所述加权预测参数,且基于所述语法元素指示所述第一列表比所述第二列表长且所述第一列表的所述前N个条目与所述第二列表的所述前N个条目相同,来确定所述第二列表的加权预测参数,其中所述第二列表包含用于帧间预测所述当前图片内的一或多个块的参考图片;及
至少基于所述第一列表的经译码的加权预测参数和所述第二列表的确定的加权预测参数中的一或多者帧间预测所述当前图片中的所述块。
10.根据权利要求9所述的装置,其中,为确定所述第二列表的所述加权预测参数,所述视频译码器经配置以基于所述第一列表的所述前N个条目的所述加权预测参数且不基于其它加权预测参数,来确定所述第二列表的所述前N个条目的所述加权预测参数。
11.根据权利要求9所述的装置,其中,为确定所述第二列表的所述加权预测参数,所述视频译码器经配置以在不译码所述第二列表的所述前N个条目的所述加权预测参数的情况下确定所述第二列表的所述前N个条目的所述加权预测参数。
12.根据权利要求9所述的装置,其中所述第一列表包括组合参考图片列表(RefPicListC)、第一参考图片列表(RefPicList0)或第二参考图片列表(RefPicList1)中的一者,且所述第二列表与所述第一列表不同。
13.根据权利要求9所述的装置,其中视频译码器包括视频解码器,且其中所述视频解码器经配置以:
解码所述第一列表的所述加权预测参数;
解码所述语法元素,所述语法元素指示所述第一列表比所述第二列表长且所述第一列表的所述前N个条目与所述第二列表的所述前N个条目相同;
基于所述第一列表的所述加权预测参数确定所述第二列表的所述加权预测参数;及
至少基于所述第一列表的经解码的加权预测参数和所述第二列表的所述确定的加权预测参数中的所述一或多者帧间预测解码所述当前图片中的所述块。
14.根据权利要求9所述的装置,其中视频译码器包括视频编码器,且其中所述视频编码器经配置以:
编码所述第一列表的所述加权预测参数;
编码所述语法元素,所述语法元素指示所述第一列表比所述第二列表长且所述第一列表的所述前N个条目与所述第二列表的所述前N个条目相同;
基于所述第一列表的所述加权预测参数确定所述第二列表的所述加权预测参数;及
至少基于所述第一列表的经编码的加权预测参数和所述第二列表的所述确定的加权预测参数中的所述一或多者帧间预测编码所述当前图片中的所述块。
15.根据权利要求9所述的装置,其中所述装置包括以下中的一者:
集成电路;
微处理器;或
包含所述视频译码器的无线装置。
16.根据权利要求9所述的装置,其中所述装置是无线通信装置,其进一步包括:
发射器和接收器当中的至少一者,其经配置以进行发射所述视频数据或接收所述视频数据当中的一者。
17.根据权利要求16所述的装置,其中所述无线通信装置是蜂窝电话,且所述视频数据由所述发射器和接收器当中的所述至少一者分别发射或接收,且根据蜂窝通信标准进行调制。
18.一种在其上存储有指令的非暂时性计算机可读存储媒体,所述指令在执行时使用于视频译码的装置的一或多个处理器进行以下操作:
构建第一列表和第二列表,其中所述第一列表和所述第二列表各自包含用于帧间预测当前图片内的一个或多个块的参考图片;
译码所述第一列表的加权预测参数,其中所述加权预测参数界定定标因素,所述第一列表中的各个参考图片内的像素值将通过所述定标因素定标以用于帧间预测所述当前图片中的块;
译码一语法元素,所述语法元素指示所述第一列表比所述第二列表长且所述第一列表的前N个条目与所述第二列表的前N个条目相同;
基于所述第一列表的所述加权预测参数,且基于所述语法元素指示所述第一列表比所述第二列表长且所述第一列表的所述前N个条目与所述第二列表的所述前N个条目相同,来确定所述第二列表的加权预测参数,其中所述第二列表包含用于帧间预测所述当前图片内的一或多个块的参考图片;及
至少基于所述第一列表的经译码的加权预测参数和所述第二列表的确定的加权预测参数中的一或多者帧间预测所述当前图片中的所述块。
19.根据权利要求18所述的非暂时性计算机可读存储媒体,其中使所述一或多个处理器确定所述第二列表的所述加权预测参数的所述指令包括使所述一或多个处理器基于所述第一列表的所述前N个条目的所述加权预测参数且不基于其它加权预测参数,来确定所述第二列表的所述前N个条目的所述加权预测参数的指令。
20.根据权利要求18所述的非暂时性计算机可读存储媒体,其中使所述一或多个处理器确定所述第二列表的所述加权预测参数的所述指令包括使所述一或多个处理器在不译码所述第二列表的所述前N个条目的所述加权预测参数的情况下确定所述第二列表的所述前N个条目的所述加权预测参数的指令。
21.一种用于译码视频数据的装置,所述装置包括:
用于构建第一列表和第二列表的装置,其中所述第一列表和所述第二列表各自包含用于帧间预测当前图片内的一个或多个块的参考图片;
用于译码所述第一列表的加权预测参数的装置,其中所述加权预测参数界定定标因素,所述第一列表中的各个参考图片内的像素值将通过所述定标因素定标以用于帧间预测所述当前图片中的块;
用于译码一语法元素的装置,所述语法元素指示所述第一列表比所述第二列表长且所述第一列表的前N个条目与所述第二列表的前N个条目相同;
用于基于所述第一列表的所述加权预测参数,且基于所述语法元素指示所述第一列表比所述第二列表长且所述第一列表的所述前N个条目与所述第二列表的所述前N个条目相同,来确定所述第二列表的加权预测参数的装置,其中所述第二列表包含用于帧间预测所述当前图片内的一或多个块的参考图片;及
用于至少基于所述第一列表的经译码的加权预测参数和所述第二列表的确定的加权预测参数中的一或多者帧间预测所述当前图片中的所述块的装置。
22.根据权利要求21所述的装置,其中用于确定所述第二列表的所述加权预测参数的所述装置包括用于基于所述第一列表的所述前N个条目的所述加权预测参数且不基于其它加权预测参数,来确定所述第二列表的所述前N个条目的所述加权预测参数的装置。
23.根据权利要求21所述的装置,其中用于确定所述第二列表的所述加权预测参数的所述装置包括用于在不译码所述第二列表的所述前N个条目的所述加权预测参数的情况下确定所述第二列表的所述前N个条目的所述加权预测参数的装置。
24.一种用于译码视频数据的方法,所述方法包括:
译码至少第一语法元素,所述第一语法元素指示第一参考图片列表和第二参考图片列表的前N个元素相同;
基于所述前N个元素相同,译码指示所述第一参考图片列表的大小和所述第二参考图片列表的大小的所述视频数据的信息;
基于所述第一参考图片列表的所述大小大于所述第二参考图片列表的所述大小:
构建所述第一参考图片列表;及
从所述第一参考图片列表导出所述第二参考图片列表;及
基于所述第二参考图片列表的所述大小大于所述第一参考图片列表的所述大小:
构建所述第二参考图片列表;及
从所述第二参考图片列表导出所述第一参考图片列表。
25.根据权利要求24所述的方法,其进一步包括:
基于所述前N个元素相同且所述第一参考图片列表的所述大小大于所述第二参考图片列表的所述大小:
译码在所述第一参考图片列表中识别的参考图片的加权预测参数,其中在所述第一参考图片列表中识别的所述参考图片的所述加权预测参数界定定标因素,所述第一参考图片列表中的各个参考图片内的像素值将通过所述定标因素定标;
不译码在所述第二参考图片列表中识别的参考图片的加权预测参数;及
从在所述第一参考图片列表中识别的前N个参考图片的所述加权预测参数导出在所述第二参考图片列表中识别的所述参考图片的所述加权预测参数;及
基于所述前N个元素相同且在所述第二参考图片列表的所述大小大于所述第一参考图片列表的所述大小:
译码在所述第二参考图片列表中识别的参考图片的加权预测参数,其中在所述第二参考图片列表中识别的所述参考图片的所述加权预测参数界定定标因素,所述第二参考图片列表中的各个参考图片内的像素值将通过所述定标因素定标;
不译码在所述第一参考图片列表中识别的参考图片的加权预测参数;及
从在所述第二参考图片列表中识别的所述前N个参考图片的所述加权预测参数导出在所述第一参考图片列表中识别的所述参考图片的所述加权预测参数。
CN201380023733.0A 2012-04-03 2013-03-15 加权预测参数译码 Active CN104272742B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201261619856P 2012-04-03 2012-04-03
US61/619,856 2012-04-03
US13/830,484 2013-03-14
US13/830,484 US9143781B2 (en) 2012-04-03 2013-03-14 Weighted prediction parameter coding
PCT/US2013/032383 WO2013151765A1 (en) 2012-04-03 2013-03-15 Weighted prediction parameter coding

Publications (2)

Publication Number Publication Date
CN104272742A CN104272742A (zh) 2015-01-07
CN104272742B true CN104272742B (zh) 2017-10-31

Family

ID=49235008

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201380023733.0A Active CN104272742B (zh) 2012-04-03 2013-03-15 加权预测参数译码

Country Status (5)

Country Link
US (1) US9143781B2 (zh)
EP (1) EP2834977B1 (zh)
KR (1) KR101663397B1 (zh)
CN (1) CN104272742B (zh)
WO (1) WO2013151765A1 (zh)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2955938T3 (es) * 2010-12-22 2023-12-11 Lg Electronics Inc Intrapredicción en codificación de vídeo
CN108650508B (zh) 2011-09-29 2022-07-29 夏普株式会社 图像解码装置、图像解码方法、图像编码装置及图像编码方法
BR112014007494B1 (pt) 2011-09-29 2022-05-31 Sharp Kabushiki Kaisha Dispositivo de decodificação de imagem, método de decodificação de imagem, e dispositivo de codificação de imagem
US20150103898A1 (en) * 2012-04-09 2015-04-16 Vid Scale, Inc. Weighted prediction parameter signaling for video coding
US9654775B2 (en) * 2014-01-09 2017-05-16 Vixs Systems, Inc. Video encoder with weighted prediction and methods for use therewith
GB2524726B (en) * 2014-03-25 2018-05-23 Canon Kk Image data encapsulation with tile support
KR102539009B1 (ko) * 2015-06-08 2023-05-31 브이아이디 스케일, 인크. 스크린 콘텐츠 코딩을 위한 인트라 블록 카피 모드
US10091506B2 (en) * 2015-06-11 2018-10-02 Sony Corporation Data-charge phase data compression architecture
CN109479149B (zh) 2016-07-05 2022-04-15 株式会社Kt 视频信号处理方法和设备
WO2018037919A1 (ja) * 2016-08-26 2018-03-01 シャープ株式会社 画像復号装置、画像符号化装置、画像復号方法、および画像符号化方法
WO2018056763A1 (ko) * 2016-09-23 2018-03-29 엘지전자(주) 템플릿 기반 가중치를 이용하여 예측을 수행하는 방법 및 장치
US11006109B2 (en) 2017-06-19 2021-05-11 Lg Electronics Inc. Intra prediction mode based image processing method, and apparatus therefor
EP3422722A1 (en) 2017-06-30 2019-01-02 Thomson Licensing Method for encoding a matrix of image views obtained from data acquired by a plenoptic camera
US11490108B2 (en) 2017-08-29 2022-11-01 Kt Corporation Method of decoding/encoding a video signal with sub-block based motion vector derivation
AU2019338463B2 (en) * 2018-09-12 2023-10-26 Huawei Technologies Co., Ltd. Candidate signaling for reference picture list structures
KR20220051402A (ko) * 2019-09-06 2022-04-26 후아웨이 테크놀러지 컴퍼니 리미티드 가중 예측을 위한 하이-레벨 시그널링의 방법 및 장치
CN114586346A (zh) * 2019-12-30 2022-06-03 华为技术有限公司 使用非矩形融合模式协调加权预测的方法和装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1478190A1 (en) * 2002-04-26 2004-11-17 NTT DoCoMo, Inc. Image encoding device, image decoding device, image encoding method, image decoding method, image encoding program, and image decoding program
CN101356822A (zh) * 2006-01-10 2009-01-28 汤姆逊许可公司 用于构造可伸缩视频的参考图像列表的方法和设备
CN101379829A (zh) * 2006-02-02 2009-03-04 汤姆逊许可公司 用于运动补偿预测的自适应加权选择的方法和设备
CN101379835A (zh) * 2006-02-02 2009-03-04 汤姆逊许可公司 使用组合参考双向预测进行运动估计的方法和设备

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BRPI0613659B1 (pt) 2005-07-21 2019-06-04 Thomson Licensing Método e aparelho para o prognóstico ponderado para uma codificação de vídeo redimensionável
KR101120648B1 (ko) 2006-10-16 2012-03-23 노키아 코포레이션 멀티뷰 비디오 코딩에서 효율적인 디코딩된 버퍼 관리를 구현하기 위한 시스템 및 방법
US8270483B1 (en) 2008-01-18 2012-09-18 Maxim Integrated Products, Inc. Method and apparatus for applying accurate parameter estimation and efficient fade detection in weighted prediction for video compression
WO2011019384A1 (en) 2009-08-11 2011-02-17 Thomson Licensing Methods and apparatus for generalized weighted prediction
RU2556396C2 (ru) 2010-09-03 2015-07-10 Долби Лабораторис Лайсэнзин Корпорейшн Способ и система для компенсации освещенности и перехода при кодировании и обработке видеосигнала
US9066102B2 (en) 2010-11-17 2015-06-23 Qualcomm Incorporated Reference picture list construction for generalized P/B frames in video coding
CN105611298B (zh) * 2010-12-13 2019-06-18 韩国电子通信研究院 利用解码设备执行的帧间预测方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1478190A1 (en) * 2002-04-26 2004-11-17 NTT DoCoMo, Inc. Image encoding device, image decoding device, image encoding method, image decoding method, image encoding program, and image decoding program
CN101356822A (zh) * 2006-01-10 2009-01-28 汤姆逊许可公司 用于构造可伸缩视频的参考图像列表的方法和设备
CN101379829A (zh) * 2006-02-02 2009-03-04 汤姆逊许可公司 用于运动补偿预测的自适应加权选择的方法和设备
CN101379835A (zh) * 2006-02-02 2009-03-04 汤姆逊许可公司 使用组合参考双向预测进行运动估计的方法和设备

Also Published As

Publication number Publication date
WO2013151765A1 (en) 2013-10-10
CN104272742A (zh) 2015-01-07
US9143781B2 (en) 2015-09-22
EP2834977B1 (en) 2020-03-11
US20130259130A1 (en) 2013-10-03
EP2834977A1 (en) 2015-02-11
KR20150003249A (ko) 2015-01-08
KR101663397B1 (ko) 2016-10-06

Similar Documents

Publication Publication Date Title
CN104272742B (zh) 加权预测参数译码
CN103339936B (zh) 用于视频译码的单一参考图片列表建构
CN103190147B (zh) 用于视频译码的语法元素的联合译码方法及设备
CN106576171B (zh) 一种对视频数据进行编码、解码的方法以及装置
CN103202016B (zh) 用于视频译码的自适应运动向量分辨率信令
CN103828374B (zh) 参考图片信令和经解码图片缓冲器管理
CN103404144B (zh) 视频译码中的经量化脉码调制
CN103931182B (zh) 帧内预测视频译码中的非正方形变换
CN103797801B (zh) 视频译码中的非正方形变换单元和预测单元
CN104205829B (zh) 合并信令及环路滤波器开/关信令
CN103703781B (zh) 使用自适应运动向量分辨率的视频译码
CN103891293B (zh) 用于色度分量的自适应环路滤波的方法及设备
CN103329525B (zh) 用于视频译码的组合参考图片列表建构
CN104221378B (zh) 在视频译码中用于量化矩阵的均匀粒度
CN104429082B (zh) 用于视频译码的长期参考图片的信令
CN110100436A (zh) 使用导出色度模式译码视频数据
CN104429072B (zh) 自适应差域空间和时间参考重构及平滑
CN104604224B (zh) 可缩放视频译码中的变换基底调整
CN107211125A (zh) 预测单元的灵活分割
CN103975597A (zh) 纹理及深度视图分量当中的内部视图运动预测
CN108353167A (zh) 译码视频数据的正负号信息
CN103975595B (zh) 用于视频译码的分段参数集
CN104221380A (zh) 用于并行运动估计的共同空间候选块
CN106664425A (zh) 视频译码中的跨分量预测
CN103141100A (zh) 用于视频译码的帧内平滑滤波器

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant