CN104365106A - 发信用于视频译码的长期参考图片的数据 - Google Patents

发信用于视频译码的长期参考图片的数据 Download PDF

Info

Publication number
CN104365106A
CN104365106A CN201380029757.7A CN201380029757A CN104365106A CN 104365106 A CN104365106 A CN 104365106A CN 201380029757 A CN201380029757 A CN 201380029757A CN 104365106 A CN104365106 A CN 104365106A
Authority
CN
China
Prior art keywords
picture
reference picture
value
decoding
long
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201380029757.7A
Other languages
English (en)
Other versions
CN104365106B (zh
Inventor
阿达许·克里许纳·瑞玛苏布雷蒙尼安
王益魁
陈颖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of CN104365106A publication Critical patent/CN104365106A/zh
Application granted granted Critical
Publication of CN104365106B publication Critical patent/CN104365106B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/33Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/563Motion estimation with padding, i.e. with filling of non-object values in an arbitrarily shaped picture block or region for estimation purposes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/58Motion compensation with long-term prediction, i.e. the reference frame for a current frame not being the temporally closest one

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)

Abstract

本发明提供一种视频译码器,其译码视频数据的切片的切片标头。所述切片标头包含包括用于长期参考图片的识别信息的语法元素,其中所述识别信息是明确地在所述切片标头中经发信或从对应于所述切片的序列参数集导出。当所述语法元素指示用于所述长期参考图片的所述识别信息是明确地经发信时,为了译码所述切片标头,所述视频译码器经进一步配置以译码所述切片标头中用于所述长期参考图片的所述识别信息的值。

Description

发信用于视频译码的长期参考图片的数据
本申请案主张2012年6月7日申请的第61/656,877号美国临时专利申请案的权利,所述申请案的全部内容借此以引用的方式并入本文中。
技术领域
本发明涉及视频译码。
背景技术
数字视频能力可并入到广泛范围的装置中,包含数字电视、数字直播系统、无线广播系统、个人数字助理(PDA)、膝上型或桌上型计算机、平板计算机、电子图书阅读器、数码相机、数字记录装置、数字媒体播放器、视频游戏装置、视频游戏控制台、蜂窝式或卫星无线电电话、所谓的“智能电话”、视频电话会议装置、视频流装置及其类似者。数字视频装置实施视频译码技术,例如通过MPEG-2、MPEG-4、ITU-T H.263、ITU-TH.264/MPEG-4第10部分高级视频译码(AVC)、目前正在开发的高效率视频译码(HEVC)标准及此类标准的扩展(例如,可缩放视频译码(SVC)及多视图视频译码(MVC)扩展)定义的标准中描述的技术。视频装置可通过实施此类视频译码技术而更有效率地发射、接收、编码、解码及/或存储数字视频信息。
被称作“HEVC工作草案6”或“WD6”的即将到来的HEVC标准的新近草案描述于布洛斯(Bross)等人的文档JCTVC-H1003“高效率视频译码(HEVC)文本规格草案6(High efficiency video coding(HEVC)text specification draft 6)”(ITU-T SG16WP3及ISO/IEC JTC1/SC29/WG11的视频译码联合合作小组(JCT-VC),第8次会议:美国加利福尼亚州圣何塞,2012年2月)中,所述文档从2012年6月7日起可从http://phenix.int-evry.fr/jct/doc_end_user/documents/8_SanJose/wg11/JCTVC-H1003-v22.zip下载。被称作“HEVC工作草案7”或“WD7”的即将到来的HEVC标准的另一草案描述于布洛斯(Bross)等人的文档JCTVC-I1003“高效率视频译码(HEVC)文本规格草案7(High efficiency video coding(HEVC)text specification draft 7)”(ITU-T SG16WP3及ISO/IEC JTC1/SC29/WG11的视频译码联合合作小组(JCT-VC),第9次会议:瑞士日内瓦,2012年4月27日到2012年5月7日)中,所述文档从2012年6月7日起可从http://phenix.it-sudparis.eu/jct/doc_end_user/documents/9_Geneva/wg11/JCTVC-I1003-v3.zip下载。
视频译码技术包含空间(图片内)预测及/或时间(图片间)预测以减少或去除视频序列中固有的冗余。对于基于块的视频译码,可将视频切片(即,视频帧或视频帧的一部分)分割成视频块,视频块还可被称作树块、译码树单元、译码单元(CU)及/或译码节点。图片的经帧内译码(I)切片中的视频块是使用相对于同一图片中的相邻块中的参考样本的空间预测来编码。图片的经帧间译码(P或B)切片中的视频块可使用相对于同一图片中的相邻块中的参考样本的空间预测,或相对于其它参考图片中的参考样本的时间预测。图片可被称作帧,且参考图片可被称作参考帧。
空间或时间预测导致译码块的预测性块。残余数据表示待译码原始块与预测性块之间的像素差。经帧间译码块是根据指向形成预测性块的参考样本块的运动向量及指示经译码块与预测性块之间的差的残余数据来编码。经帧内译码块是根据帧内译码模式及残余数据来编码。为了进一步压缩,可以将残余数据从像素域变换到变换域,从而产生残余变换系数,接着可以将残余变换系数量化。可扫描最初布置为二维阵列的经量化变换系数,以便产生变换系数的一维向量,且可应用熵译码以实现更多压缩。
发明内容
一般来说,本发明描述涉及导出参考图片集(RPS)及待包含在RPS中的长期参考图片(LTRP)的发信的技术,所述RPS例如序列参数集(SPS)、图片参数集(PPS)或切片标头。这些技术可包含确保LTRP的图片次序计数(POC)值的最低有效位(LSB)的值为非递减的或非递增的。另外或替代地,这些技术可包含在SPS中或在切片标头中发信用于LTRP的POC值的数据,及提供指示用于POC值的数据是在SPS中发信还是在切片标头中发信的信息。
在一个实例中,一种译码视频数据的方法包含:译码视频数据的切片的切片标头,其中所述切片标头包含指示用于长期参考图片的识别信息是明确地在所述切片标头中经发信还是从对应于所述切片的序列参数集导出的语法元素,及在所述语法元素指示用于所述长期参考图片的所述识别信息是明确地经发信时,译码所述切片标头进一步包括译码所述切片标头中用于所述长期参考图片的所述识别信息的值。
在另一实例中,一种用于译码视频数据的装置包含:用于译码视频数据的切片的切片标头的装置,其中所述切片标头包含指示用于长期参考图片的识别信息是明确地在所述切片标头中经发信还是从对应于所述切片的序列参数集导出的语法元素,及用于在所述语法元素指示用于所述长期参考图片的所述识别信息是明确地经发信时,译码所述切片标头中用于所述长期参考图片的所述识别信息的值的装置。
在另一实例中,一种用于译码视频数据的装置,所述装置包括视频译码器,所述视频译码器可经配置以:译码视频数据的切片的切片标头,其中所述切片标头包含指示用于长期参考图片的识别信息是明确地在所述切片标头中经发信还是从对应于所述切片的序列参数集导出的语法元素,且在所述语法元素指示用于所述长期参考图片的所述识别信息是明确地经发信时,为了译码所述切片标头,所述装置经进一步配置以译码所述切片标头中用于所述长期参考图片的所述识别信息的值。
在另一实例中,一种非暂时性计算机可读存储媒体具有存储于其上的指令,所述指令在被执行时致使装置的处理器译码视频,其中所述指令致使所述处理器进行以下操作:译码视频数据的切片的切片标头,其中所述切片标头包含指示用于长期参考图片的识别信息是明确地在所述切片标头中经发信还是从对应于所述切片的序列参数集导出的语法元素,且在所述语法元素指示用于所述长期参考图片的所述识别信息是明确地经发信时,为了译码所述切片标头,所述装置经进一步配置以译码所述切片标头中用于所述长期参考图片的所述识别信息的值。
随附图式及以下描述中阐述一或多个实例的细节。其它特征、目标及优点将从所述描述及图式以及权利要求书而显而易见。
附图说明
图1为说明可利用用于在序列参数集(SPS)或切片标头中发信用于长期参考图片(LTRP)的数据的技术的实例视频编码及解码系统的框图。
图2为说明可实施用于在SPS或切片标头中发信用于LTRP的数据的技术的视频编码器的实例的框图。
图3为说明可实施用于在SPS或切片标头中发信用于LTRP的数据的技术的视频解码器的实例的框图。
图4为说明根据本发明中描述的一或多个实例的用于译码用于参考图片的数据的过程的流程图。
图5为说明根据本发明中描述的一或多个实例的用于在SPS或切片标头中发信用于LTRP的数据的过程的流程图。
具体实施方式
视频序列一般表示为图片序列。通常,使用基于块的译码技术译码个别图片中的每一者。也就是说,将每一图片划分成块,且个别地译码所述块中的每一者。译码视频数据块一般涉及形成块的预测值及译码残余值,也就是说,原始块与预测值之间的差。具体来说,原始视频数据块包含像素值矩阵,且预测值包含经预测像素值矩阵。残余值对应于原始块的像素值与经预测像素值之间的逐像素差。
用于视频数据块的预测技术一般分类为帧内预测及帧间预测。帧内预测或空间预测一般涉及从相邻的先前经译码块的像素值预测块。帧间预测或时间预测一般涉及从先前经译码图片的像素值预测块。
先前经译码图片可表示比正被译码的图片更早或更迟显示的图片。换句话说,图片的显示次序未必与图片的解码次序相同,且因此,比被译码的当前图片更早或更迟显示的图片可用作用于当前图片的译码块的参考。
举例来说,视频译码器(其为可指视频编码器及视频解码器中的一者或两者的术语)包含经解码图片缓冲器(DPB)。DPB存储参考图片,所述参考图片为可用于帧间预测图片的图片。换句话说,视频译码器可基于存储在DPB中的一或多个参考图片预测图片。一般来说,描述提供用于进行以下操作的各种方法的技术:导出参考图片集(RPS)及待包含在经译码图片的RPS中以用于在执行视频译码的帧间预测方面时使用的长期参考图片(LTRP)的发信。
视频解码器的任务还可以是构造指示哪些参考图片用于帧间预测目的的参考图片列表。这些参考图片列表中的两者分别被称作列表0及列表1。视频解码器首先采用默认构造技术来构造列表0及列表1(例如,用于构造列表0及列表1的预先配置构造方案)。任选地,在构造初始列表0及列表1之后,当存在语法元素时,解码器可解码语法元素,所述语法元素指导视频解码器修改初始列表0及列表1。
视频编码器可在DPB中发信指示参考图片的识别符的语法元素,且视频编码器还可在列表0、列表1或列表0与列表1两者内发信包含索引的语法元素,所述语法元素指示哪个或哪些参考图片用来解码当前图片的经译码块。视频解码器又使用所接收识别符来识别用于列表0、列表1或列表0与列表1两者中所列出的一或多个参考图片的索引值或值。根据所述一或多个参考图片的索引值以及识别符,视频译码器从DPB中检索所述一或多个参考图片,且解码当前图片的经译码块。
在与当前图片的切片标头相关联的图片参数集(PPS)或序列参数集(SPS)中,视频编码器可发信RPS。当前图片的RPS包含用于可用以预测当前图片的参考图片及可用以预测按解码次序在当前图片之后的图片的图片的识别信息。仅RPS中的参考图片可包含在列表0或列表1中。
在经译码视频位流中,视频译码器(即,视频编码器或视频解码器)可利用两种类型的值来提及图片:图片次序计数(POC)值,其一般对应于图片的输出次序;及帧号(frame_num)值,其一般对应于图片的解码次序。一般来说,术语“帧”与“图片”可以互换使用。因此,帧号值对应于图片的解码次序。
用于参考图片的识别信息可包含一或多个图片次序计数(POC)值。POC值指示输出或显示经译码视频序列内的图片的次序(即,图片的显示次序)。举例来说,在同一个经译码视频序列中,具有较低POC值的图片是比具有较高POC值的图片更早显示。
在视频译码中,通常将用于图片或图片的切片的数据囊封在网络抽象层(NAL)单元中。NAL单元可包含:视频译码层(VCL)数据,例如用于图片或切片的经译码数据,还被称作VCL NAL单元;或非VCL数据,例如参数集及补充增强信息(SEI)消息,还被称作非VCL NAL单元。NAL单元还包含描述包含在相应NAL单元中的数据的类型的标头数据。举例来说,NAL单元可包含指示NAL单元是否包含用于参考图片的数据的nal_ref_flag。以此方式,可将参考图片定义为具有等于“1”的nal_ref_flag的图片。参考图片可含有在按解码次序来说的后续图片的解码过程中可用于进行帧间预测的样本(也就是说,像素值)。
在HEVC中,可能存在一种以上类型的参考图片。作为一个实例,HEVC定义长期参考图片,所述长期参考图片可被定义为经标记为“用于供长期参考”的参考图片。另外,HEVC还可包含短期参考图片,但本发明的技术涉及发信长期参考图片。短期参考图片不在本发明的范围内。
HEVC描述用于发信及使用长期参考图片(LTRP)的技术。LTRP的常规发信的实例描述于HEVC WD6中。WD6还描述涉及LTRP发信的采用技术,包含LTRP的最低有效位(LSB)的发信的改变、涉及LTRP的语法元素的语义及参考图片集的导出。对HEVC工作草案的新近采用还包含描述序列参数集(SPS)中的LTRP的发信的技术。涉及SPS中的LTRP的发信的采用描述于如采用到HEVC WD7中的JCTVC-I0340r2中,描述于罗摩萨波拉莫尼亚(Ramasubramonian)等人的“SPS中的长期参考图片的发信(Signalingof Long term Reference Pictures in the SPS)”文档JCTVC-I0340r2(ITU-T SG16 WP3及ISO/IEC JTC1/SC29/WG11的JCT-VC,第9次会议,瑞士日内瓦,2012年4月27日到2012年5月7日)中,所述文档可从http://phenix.int-evry.fr/jct/doc_end_user/documents/9_Geneva/wg11/JCTVC-I0340-v3.zip得到。下文概述在SPS中发信LTRP的细节。
在描述于JCTVC-I0340r2中的技术中,SPS可包含指示是否针对经译码视频序列发信LTRP(即,视频译码器是否使用LTRP来进行帧间预测)的旗标语法元素。如果针对经译码视频序列发信LTRP,那么用于经译码视频序列的作用中SPS或切片标头的语法元素可使用LTRP的POC的LSB的数目来提及LTRP。仅使用POC的LSB来提及LTRP可改进译码效率及降低经译码视频位流的复杂性。视频译码器在第一语法元素中发信用以参考SPS中的每一LTRP的LTRP LSB的数目,后面接续发信LTRP的POC值的LSB的列表。
在经译码视频序列中,切片标头可继承或参考SPS的一或多个LTRP。在切片标头中,视频译码器发信列表语法元素,所述列表语法元素包含待从SPS继承而来的LTRP的POC值的LSB值。除从SPS继承而来的LTRP之外,切片标头还可明确地发信并非从SPS继承而来的额外LTRP的LSB。切片标头包含包含明确地在切片标头中经发信的LTRP的POC值的LSB值的列表的语法元素。
在一些情况下,两个LTRP可具有相同的POC LSB序列,从而产生关于特定POCLSB语法元素提及哪个LTRP的模糊性。为了澄清语法元素提及哪个LTRP,如果经解码图片缓冲器(DPB)中的一个以上参考图片具有相同LSB,那么切片标头或SPS可发信LTRP的最高有效位(MSB)中的一些MSB。使用旗标语法元素来指示LTRP的MSB是否经发信,且如果存在发信的话,LTRP的MSB信息的发信紧跟在此旗标之后。最后,视频译码器可译码旗标以指示经发信的LTRP是否可供当前图片用作参考图片。下文描述SPS及切片标头中的相关语法元素的语法及语义。对于包含在语法表中但未提供语义的那些语法元素,语义与HEVC WD6中的语义相同。
JCTVC-I0340r2提供下文关于表1描述的SPS语法及语义:
表1
下文描述由JCTVC-I0340r2修改的SPS的语法元素的语义:
num_long_term_ref_pics_sps指定在序列参数集中指定的长期参考图片的数目。num_long_term_ref_pics_sps的值在0到32(包含0及32)的范围内。
lt_ref-pic_poc_lsb_sps[i]指定序列参数集中所指定的第i个长期参考图片的图片次序计数的最低有效位。用以表示lt_ref_pic_poc_lsb_sps[i]的位的数目等于log2_max_pic_order_cnt_lsb_minus4+4。
JCTVC-I0340r2还修改切片标头语法及语义,如下文关于表2所描述:
表2
下文描述由JCTVC-I0340r2修改的切片标头的语法元素的语义:
num_long_term_pics指定待包含在当前图片的长期参考图片集中且直接在切片标头中发信的长期参考图片的数目。num_long_term_pics的值在0到sps_max_dec_pic_buffering[sps_max_temporal_layers_minus1]-NumNegativePics[StRpsIdx]-NumPositivePics[StRpsIdx]-num_long_term_sps(包含0及sps_max_dec_pic_buffering[sps_max_temporal_layers_minus1]-NumNegativePics[StRpsIdx]-NumPositivePics[StRpsIdx]-num_long_term_sps)的范围内。当num_long_term_pics不存在时,视频译码器推断num_long_term_pics的值等于0。
num_long_term_sps指定在作用中序列参数集中指定且待包含在当前图片的长期参考图片集中的长期参考图片的数目。如果num_long_term_sps不存在,那么视频译码器推断值等于0。num_long_term_sps的值在0到Min(num_long_term_ref_pics_sps,max_dec_pic_buffering[max_temporal_layers_minus1]-NumNegativePics[StRpsIdx]-NumPositivePics[StRpsIdx]-num_long_term_pics)(包含0及num_long_term_ref_pics_sps,max_dec_pic_buffering[max_temporal_layers_minus1]-NumNegativePics[StRpsIdx]-NumPositivePics[StRpsIdx]-num_long_term_pics)的范围内。
long_term_idx_sps[i]指定从所提及的序列参数集继承到当前图片的长期参考图片集的第i个长期参考图片到作用中序列参数集中指定的长期参考图片的列表的索引。long_term_idx_sps[i]的值在0到num_long_term_ref_pics_sps-1(包含0及num_long_term_ref_pics_sps-1)的范围内。
poc_lsb_lt[i]指定包含在当前图片的长期参考图片集中的第i个长期参考图片的图片次序计数值的最低有效位的值。poc_lsb_lt[i]语法元素的长度为log2_max_pic_order_cnt_lsb_minus4+4位。对于在num_long_term_sps到num_long_term_pics+num_long_term_sps-1(包含num_long_term_sps及num_long_term_pics+num_long_term_sps-1)的范围内的j及k的任何值,如果j小于k,那么poc_lsb_lt[j]将小于poc_lsb_lt[k]。
如下导出变量PocLsbLt[i]。
也就是说,对于零到num_long_term_sps的索引,使用在切片标头中发信的到lt_ref_pic_poc_lsb_sps的索引获得PocLsbLt[i]的值。对于大于num_long_term_sps的PocLsbLt的索引,PocLsbLt[i]的值为明确地在切片标头中经发信的LTRP的POC LSB。
delta_poc_msb_present_flag[i]等于1指定存在delta_poc_msb_cycle_lt[i]语法元素。delta_poc_msb_present_flag[i]等于0指定不存在delta_poc_msb_cycle_lt[i],且因此,无MSB是针对切片标头发信,这是因为在DPB中仅存在具有等于PocLsbLt[i]的LSB的一个参考图片。当经解码图片缓冲器中存在一个以上参考图片时,delta_poc_msb_present_flag[i]等于1,其中图片次序计数值的最低有效位等于PocLsbLt[i]。
delta_poc_msb_cycle_lt[i]用以确定包含在当前图片的长期参考图片集中的第i个长期参考图片的图片次序计数值的最高有效位的值。视频译码器使用delta_poc_msb_cycle_lt[i]的值来确定第i个LTRP的MSB。
如在以下伪码中所描述般导出变量DeltaPocMSBCycleLt[i]:
对于符合JCTVC-I0340r2的技术,DeltaPocMSBCycleLt[i]*MaxPicOrderCntLsb+pic_order_cnt_lsb-PocLsbLt[i]的值在1到224-1(包含1及224-1)的范围内。
used_by_curr_pic_lt_flag[i]等于0指定包含在当前图片的长期参考图片集中的第i个长期参考图片不用于供当前图片参考。因此,基于used_by_curr_pic_lt_flag[i]的值,从SPS继承而来或明确地在切片标头中经发信的参考图片的子集可用于供当前图片参考。
JCTVC-I0340r2还修改用于参考图片集的解码过程。根据JCTVC-I0340r2,在解码切片标头之后但在解码任何译码单元之前及在用于切片的参考图像列表构造的解码过程之前(如HEVC WD6的子条款8.3.3中所指定),每一图片调用一次此过程。所述过程可导致将一或多个参考图片标记为“不用于参考”。JCTVC-I0340r2包含对于HEVCWD6的以下修改:
与用于发信LTRP的现有设计相关联的潜在问题中的一者涉及旗标delta_poc_msb_present_flag[i]的语义。在如上文所描述的最新语义中,当经解码图片缓冲器中存在一个以上参考图片时,delta_poc_msb_present_flag[i]等于1,其中图片次序计数值的最低有效位等于PocLsbLt[i]。delta_poc_msb_present_flag[i]的值因此取决于经解码图片缓冲器(DPB)中的参考图片。即使DPB中存在经标记为“不用于参考”的参考图片,delta_poc_msb_present_flag[i]的值也将取决于那些图片。此情形可能并非合乎需要的,这是因为DPB中存在经标记为“不用于参考”的图片且所述图片仅等待输出且不再用于参考。此类图片是否存在于DPB中一般取决于解码器输出时间表。
在给定位流的情况下,系统及应用程序可基于可用以存储经解码图片的可用存储器应用不同的输出时间表。因此,对此类图片计数不仅可能会不必要地增加需要delta_poc_msb_present_flag[i]的值为1的机会,从而需要更多位来发信LTRP,而且可能引入位流符合性及互操作性问题。作为一实例,当解码器实际上使用比所需的最少存储器多的DPB存储器时,相符位流可呈现为不符合解码器(这是因为更多图片仅等待输出,且不再用于参考),可存在于DPB中(与确切地使用最少的所需DPB存储器的解码器相比较)且因此,解码器甚至可能不能够正确地解码位流。
关于上文所描述的语义的另一潜在问题涉及long_term_idx_sps[i]的发信。如上文所描述的语义并不限制发信从SPS继承而来的LTRP的次序。对排序限制的此缺乏还可为效率低下的,这是因为视频译码器可利用比发信信息(例如,LTRP的MSB及LSB)所必要的位多的位。作为一实例,假设MaxPicOrderCntLsb等于256,且在SPS-0及10中发信两个LSB。假设对于具有POC 2560的图片,视频译码器将发信分别具有POC 0、10及256的三个LTRP。对于具有POC 0及256的图片,符合上文所描述的LTRP发信技术的视频编码器将必须发信用于两个LTRP的MSB循环。然而,本发明的技术可改进此类发信的效率。明确地说,通过下文的表3来表明某些低效率。也就是说,表3提供从相对应的SPS继承而来的LTRP的效率低下发信的实例。在此实例中,“i”描述特定长期参考图片,LTRP POC描述相对应的长期参考图片的POC值,PocLsbLt描述从SPS继承而来的长期参考图片的POC值的最低有效位(LSB),delta_poc_msb_present_flag指示delta_poc_msb_cycle_lt是否经发信,且delta_poc_msb_cycle_lt用以确定长期参考图片的POC值的最高有效位(MSB)的值(在经发信时)。
表3
i 0 1 2
LTRPPOC 0 10 256
PocLsbLt 0 10 0
delta_poc_msb_present_flag 1 0 1
delta_poc_msb_cycle_lt 10 - 9
本发明描述用于发信用于长期参考图片的识别信息的技术,在一些情况下,所述技术可提供优于上文所描述的发信技术的优点。在一些实例中,本发明的技术可减少用以发信包含LTRP的MSB的语法元素的位的数目。一种发信图片的更好的方式可能为:定义LTRP的图片译码次序,即,在poc_lsb_lt[i]中译码LTRP的次序,使得LTRP的LSB为非递减的(或,在实质上类似的性能影响下,为非递增的),如表4中所描述。在一些实例中,按非递减或非递增次序译码LTRP的LSB可导致视频译码器发信较少MSB位。通过按非递增或非递减LSB次序将LTRP排序,视频译码器将按poc_lsb_lt语法元素的图片译码次序连续地发信具有相等LSB的任何LTRP。
如果两个LTRP具有相等LSB值,那么视频译码器可译码表示两个LTRP中的至少一者的MSB的数据(例如,delta_poc_msb_cycle_lt语法元素)。视频译码器可将表示MSB的数据编码为第二LTRP的MSB值与第一LTRP的MSB的差。为了从delta_poc_msb_cycle_lt[i]的经发信值确定LTRP的MSB值,视频译码器可将DeltaPocMSBCycleLt[i]变量计算为delta_poc_msb_cycle_lt[i]及delta_poc_msb_cycle_lt[i-1]的总和。在其中按图片译码次序不存在先前LTRP的情况下,视频译码器可在delta_poc_msb_cycle_lt语法元素的值中发信LTRP的MSB与当前图片的MSB的差。
作为一实例,使用表3中所说明的用于LTRP MSB发信的先前技术,视频译码器可将具有POC值0的LTRP作为按图片计数次序(i=0)的第一LTRP发信,且将delta_poc_msb_cycle_lt的值作为用于POC 0的10发信。视频译码器可将具有POC值256的LTRP作为按图片计数次序(即,i=2)的第三LTRP发信,且将delta_poc_msb_cycle_lt值作为用于LTRP的9发信。
尽管关于表3描述的视频译码技术将10作为用于POC 0的delta_poc_msb_cycle_lt的值发信,但符合本发明的技术的视频译码器可发信可用以将LTRP的MSB再生为偏移的数据,所述偏移可为当前LTRP的POC的MSB循环值与先前LTRP的POC的MSB之间的差。如表4中所说明,视频译码器可将图片计数次序限制于从SPS继承而来的每一LTRP的LSB的非递减次序。此排序的结果是具有POC 256、POC 0的LTRP(所述两者具有等于0的LSB)分别被排序为第一及第二,且具有POC 10的LTRP被排序为图片计数次序的第三。视频译码器将具有POC 256的LTRP的MSB循环值按9发信(这是因为所述LTRP为按图片计数次序的第一LTRP),且将第二LTRP的MSB循环值按当前LTRP MSB(10)与先前LTRP MSB(9)之间的差(即,10-9=1)发信,因此视频译码器将1作为用于delta_poc_msb_cycle_lt[i]的值发信。在此实例中,与发信值10相比较,发信值1可能需要较少位,从而导致用于delta_poc_msb_cycle_lt语法元素的发信的译码效率的改进。因此,关于表4描述的本发明的技术可减少发信从经译码视频序列的相对应的的SPS继承而来的LTRP的POC值的MSB所需的位的数目。
表4
i 0 1 2
LTRPPOC 256 0 10
PocLsbLt 0 0 10
delta_poc_msb_present_flag 1 1 0
delta_poc_msb_cycle_lt 9 1 -
如上文所论述,为了克服与发信LTRP的MSB相关联的上文提到的问题,本发明描述用于进行以下操作的各种技术:待包括在经译码图片的SPS中的长期参考图片(LTRP)的发信,及在经译码图片序列的切片标头中对LTRP编索引,方法是明确地通过在切片标头中发信LTRP的POC值的LSB,或另外通过在切片标头中发信到SPS中的LTRP的LSB的列表中的条目的索引,所述索引确定LTRP的POC的LSB。本发明还描述对delta_poc_msb_present_flag[i]的语义的修改,可应用所述修改以确保旗标的值仅取决于经标记为“用于参考”的图片。下文更详细描述这些及其它技术。
图1为说明可利用用于在SPS或切片标头中发信用于LTRP的数据的技术的实例视频编码及解码系统10的框图。如图1中所示,系统10包含源装置12,其提供在稍后时间将由目的地装置14解码的经编码视频数据。明确地说,源装置12经由计算机可读媒体16将视频数据提供到目的地装置14。源装置12及目的地装置14可包括广泛范围的装置中的任一者,包含桌上型计算机、笔记型(即,膝上型)计算机、平板计算机、机顶盒、电话手持机(例如,所谓的“智能”电话)、所谓的“智能”平板计算机、电视机、摄像机、显示装置、数字媒体播放器、视频游戏控制台、视频流装置或其类似者。在一些情况下,源装置12及目的地装置14可能经装备以用于无线通信。
目的地装置14可经由计算机可读媒体16接收待解码的经编码视频数据。计算机可读媒体16可包括能够将经编码视频数据从源装置12移动到目的地装置14的任何类型的媒体或装置。在一个实例中,计算机可读媒体16可包括使得源装置12能够实时地将经编码视频数据直接发射到目的地装置14的通信媒体。经编码视频数据可以根据通信标准(例如,无线通信协议)来调制,并且被发射到目的地装置14。通信媒体可包括任何无线或有线通信媒体,例如射频(RF)频谱或一或多个物理传输线。通信媒体可形成分组网络(例如,局域网。广域网或全球网络,例如因特网)的部分。通信媒体可包含路由器、交换器、基站或可以用于促进从源装置12到目的地装置14的通信的任何其它装备。
在一些实例中,经编码数据可以从输出接口22输出到存储装置。类似地,可以通过输入接口从存储装置存取经编码数据。存储装置可包含多种分布式或本地存取式数据存储媒体中的任一者,例如硬盘驱动器、蓝光光盘、DVD、CD-ROM、快闪存储器、易失性或非易失性存储器或用于存储经编码视频数据的任何其它合适的数字存储媒体。在另一实例中,存储装置可以对应于文件服务器或可存储由源装置12产生的经编码视频的另一中间存储装置。目的地装置14可经由流式传输或下载从存储装置存取所存储的视频数据。文件服务器可以是能够存储经编码视频数据并且将所述经编码视频数据发射到目的地装置14的任何类型的服务器。实例文件服务器包含万维网服务器(例如,用于网站)、FTP服务器、网络附接存储(NAS)装置或本地磁盘驱动器。目的地装置14可以通过任何标准数据连接(包含因特网连接)来存取经编码视频数据。此连接可包含适合于存取存储在文件服务器上的经编码视频数据的无线信道(例如,Wi-Fi连接)、有线连接(例如,DSL、电缆调制解调器等)或两者的组合。经编码视频数据从存储装置的传输可能是流式传输、下载传输或其组合。
本发明的技术未必限于无线应用或设置。所述技术可以应用于支持多种多媒体应用中的任一者的视频译码,例如空中协议电视广播、有线电视发射、卫星电视发射、因特网流式视频发射(例如,动态自适应HTTP流式传输(DASH))、经编码到数据存储媒体上的数字视频,存储在数据存储媒体上的数字视频的解码,或其它应用。在一些实例中,系统10可经配置以支持单向或双向视频发射,以支持例如视频流式发射、视频重放、视频广播及/或视频电话等应用。
在图1的实例中,源装置12包含视频源18、视频编码器20及输出接口22。目的地装置14包含输入接口28、视频解码器30及显示装置32。根据本发明,源装置12的视频编码器20可经配置以应用用于在SPS中发信用于LTRP的数据的技术。在其它实例中,源装置及目的地装置可包含其它组件或布置。举例来说,源装置12可以从外部视频源18(例如,外部摄像机)接收视频数据。同样,目的地装置14可以与外部显示装置介接,而不是包含集成显示装置。
图1的所说明的系统10仅为一个实例。可以由任何数字视频编码及/或解码装置来执行用于在SPS中发信用于LTRP的数据的技术。尽管本发明的技术一般通过视频编码装置来执行,但是所述技术还可通过视频编码器/解码器(通常被称作“编码解码器”)来执行。此外,本发明的技术还可通过视频预处理器来执行。源装置12及目的地装置14仅为源装置12在其中产生经译码视频数据以供发射到目的地装置14的此类译码装置的实例。在一些实例中,装置12、14可以实质上对称的方式操作,使得装置12、14中的每一者包含视频编码及解码组件。因此,系统10可支持视频装置12、14之间的单向或双向视频发射以例如用于视频流式发射、视频重放、视频广播或视频电话。
源装置12的视频源18可包含视频俘获装置,例如视频摄像机、含有先前所俘获视频的视频存档及/或用于从视频内容提供者接收视频的视频馈送接口。作为另一替代方案,视频源18可产生基于计算机图形的数据作为源视频,或实况视频、所存档视频与计算机产生的视频的组合。在一些情况下,如果视频源18是视频摄像机,那么源装置12及目的地装置14可形成所谓的摄像机电话或视频电话。然而,如上文所提及,本发明中所描述的技术一般可适用于视频译码,且可应用于无线及/或有线应用。在每一情况下,可由视频编码器20编码所俘获、预先俘获或计算机产生的视频。经编码视频信息可接着通过输出接口22输出到计算机可读媒体16上。
计算机可读媒体16可包含瞬时媒体,例如无线广播或有线网络发射,或存储媒体(也就是说,非暂时性存储媒体),例如硬盘、快闪驱动器、压缩光盘、数字影音光盘、蓝光光盘或其它计算机可读媒体。在一些实例中,网络服务器(未图示)可以从源装置12接收经编码视频数据,并且例如经由网络发射将经编码视频数据提供到目的地装置14。类似地,媒体生产设施(例如,光盘冲压设施)的计算装置可以从源装置12接收经编码视频数据并且生成含有经编码视频数据的光盘。因此,在各种实例中,计算机可读媒体16可以理解为包含各种形式的一或多个计算机可读媒体。
目的地装置14的输入接口28从计算机可读媒体16接收信息。计算机可读媒体16的信息可包含由视频编码器20定义的语法信息,所述语法信息还供视频解码器30使用,所述语法信息包含描述块及其它经译码单元(例如,GOP)的特性及/或处理的语法元素。显示装置32将经解码视频数据显示给用户,且可包括多种显示装置中的任一者,例如阴极射线管(CRT)、液晶显示器(LCD)、等离子显示器、有机发光二极管(OLED)显示器或另一类型的显示装置。
视频编码器20及视频解码器30可以根据视频译码标准(例如,目前正在开发的高效率视频译码(HEVC)标准)操作,并且可以符合HEVC测试模型(HM)。替代地,视频编码器20及视频解码器30可以根据其它专有或业界标准来操作,所述标准例如ITU-T H.264标准,替代地被称作MPEG-4第10部分高级视频译码(AVC),或此类标准的扩展。然而,本发明的技术不限于任何特定译码标准。视频译码标准的其它实例包含MPEG-2及ITU-T H.263。尽管图1中未展示,但在一些方面中,视频编码器20及视频解码器30可各自与音频编码器及解码器集成,且可包含适当多路复用器-多路分用器单元或其它硬件及软件以处置对共同数据流或单独数据流中的音频及视频两者的编码。如果适用的话,多路复用器-多路分用器单元可符合ITU H.223多路复用器协议,或例如用户数据报协议(UDP)等其它协议。
ITU-T H.264/MPEG-4(AVC)标准是作为被称为联合视频小组(JVT)的集体联盟的产品而由ITU-T视频译码专家组(VCEG)连同ISO/IEC移动图片专家组(MPEG)制定。在一些方面中,本发明中描述的技术可应用到一般符合H.264标准的装置。H.264标准描述于ITU-T研究组的日期为2005年3月的“ITU-T推荐H.264,用于通用视听服务的高级视频译码”(ITU-T Recommendation H.264,Advanced Video Coding for genericaudiovisual services)中,所述标准在本文中可被称作H.264标准或H.264规范或H.264/AVC标准或规范。联合视频小组(JVT)持续致力于扩展H.264/MPEG-4 AVC。
视频编码器20及视频解码器30各自可实施为多种合适的编码器电路中的任一者,例如一或多个微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、软件、硬件、固件或其任何组合。当部分地用软件实施所述技术时,装置可将用于所述软件的指令存储在合适的非暂时性计算机可读媒体中且使用一或多个处理器用硬件执行所述指令以执行本发明的技术。视频编码器20及视频解码器30中的每一者可以包含在一或多个编码器或解码器中,所述编码器或解码器中的任一者可以集成为相应装置中的组合编码器/解码器(编码解码器)的部分。
JCT-VC正在致力于开发HEVC标准。所述HEVC标准化努力是基于被称作HEVC测试模型(HM)的视频译码装置的演进模型。HM假设视频译码装置根据(例如)ITU-TH.264/AVC相对于现有装置的若干额外能力。举例来说,虽然H.264提供了九种帧内预测编码模式,但是HM可提供多达三十三种帧内预测编码模式。
一般来说,HM的工作模型描述视频帧或图片可以划分成包含明度及色度样本两者的一序列树块或最大译码单元(LCU)(还被称作“译码树单元”)。位流内的语法数据可以定义最大译码单元(LCU,依据像素数目来说,其为最大译码单元)的大小。切片包含按译码次序的数个连续树块。视频帧或图片可以分割成一或多个切片。每一树块可以根据四叉树分裂成译码单元(CU)。一般来说,四叉树数据结构包含每个CU一个节点,其中根节点对应于树块。如果CU分裂成4个子CU,那么对应于CU的节点包含四个叶节点,其中页节点中的每一者对应于所述子CU中的一者。
因此,视频编码器20可编码形成图片的切片的一系列LCU。此外,视频编码器20可利用本发明的技术来编码用于切片的切片标头。切片标头可包含可在解码切片期间使用的数据。举例来说,切片标头可包含指示可在解码切片中所包含的视频数据期间使用的参考图片的数据。根据本发明的技术,视频编码器20可编码切片标头的指示以下情形的数据:表示用于特定长期参考图片的识别信息的数据是否明确地在切片标头中经译码,或此类识别信息是否是从对应于包含其中出现切片的图片的图片序列的序列参数集(SPS)继承而来。
同样,视频解码器30可利用本发明的技术来解码切片标头,所述解码可包含解码指示以下情形的数据:用于特定长期参考图片的识别信息是否明确地在切片标头中经译码,或识别信息是否是从对应于切片的SPS继承而来。如果切片标头指示识别信息是明确地经译码,那么视频解码器30可从切片标头解码用于长期参考图片的识别信息。然而,如果切片标头指示识别信息是从SPS继承而来,那么视频解码器30可从SPS中检索用于SPS的识别信息。下文更详细解释用于译码切片标头的技术。
四叉树数据结构的每一节点可以提供相对应的CU的语法数据。举例来说,四叉树中的节点可包含分裂旗标,从而指示对应于所述节点的CU是否分裂成子CU。CU的语法元素可以递归地来定义,且可以取决于CU是否分裂成子CU。如果CU未经进一步分裂,那么将其称作叶CU。在本发明中,叶CU的四个子CU也将被称作叶CU,即使不存在原始叶CU的明确分裂时也是如此。举例来说,如果16×16大小的CU未经进一步分裂,那么尽管16×16CU从未经分裂,四个8×8子CU也将被称作叶CU。
CU具有类似于H.264标准的宏块的目的,但是CU并不具有大小区别。举例来说,树块可以分裂成四个子节点(还被称作子CU),并且每一子节点又可以是父节点并且可以分裂成另外四个子节点。最后的未经分裂子节点(被称作四叉树的叶节点)包括译码节点,还被称作叶CU。与经译码位流相关联的语法数据可以定义树块可以分裂的最大次数,被称作最大CU深度,并且还可定义译码节点的最小大小。因此,位流还可定义最小译码单元(SCU)。本发明使用术语“块”来指HEVC的上下文中的CU、PU或TU中的任一者,或者其它标准的上下文中的类似数据结构(例如,其在H.264/AVC中的宏块及子块)。
CU包含译码节点及与所述译码节点相关联的预测单元(PU)及变换单元(TU)。CU的大小对应于译码节点的大小并且形状必须是正方形。CU的大小可以在从8×8像素直到具有最大64×64像素或更大的树块的大小的范围内。每一CU可以含有一或多个PU及一或多个TU。举例来说,与CU相关联的语法数据可描述将CU分割成一或多个PU。分割模式可在CU被跳过或经直接模式编码、经帧内预测模式编码或经帧间预测模式编码之间有所不同。PU可以分割成非正方形形状。举例来说,与CU相关联的语法数据还可描述根据四叉树将CU分割成一或多个TU。ATU可以是正方形或非正方形(例如,矩形)形状。
HEVC标准允许根据TU变换,TU可以针对不同CU而有所不同。TU的大小通常是基于针对经分割LCU定义的给定CU内的PU的大小而设置,但是情况可能并不总是如此。TU通常与PU大小相同或小于PU。在一些实例中,对应于CU的残余样本可以使用被称为“残余四叉树”(RQT)的四叉树结构细分成较小单元。RQT的叶节点可被称作变换单元(TU)。可以变换与TU相关联的像素差值以产生变换系数,可以将所述变换系数量化。
叶CU可包含一或多个预测单元(PU)。一般来说,PU表示对应于相对应的CU的全部或一部分的空间区域,并且可包含用于检索PU的参考样本的数据。此外,PU包含与预测有关的数据。举例来说,当PU经帧内模式编码时,用于PU的数据可以包含在残余四叉树(RQT)中,残余四叉树可包含描述用于对应于PU的TU的帧内预测模式的数据。作为另一实例,当PU经帧间模式编码时,PU可包含定义PU的一或多个运动向量的数据。举例来说,定义PU的运动向量的数据可以描述运动向量的水平分量、运动向量的垂直分量、运动向量的分辨率(例如,四分之一像素精度或八分之一像素精度)、运动向量指向的参考图片及/或运动向量的参考图片列表(例如,列表0、列表1或列表C)。
具有一或多个PU的叶CU还可包含一或多个变换单元(TU)。变换单元可以使用RQT(还被称作TU四叉树结构)来指定,如上文所论述。举例来说,分裂旗标可以指示叶CU是否分裂成四个变换单元。接着,每一变换单元可以进一步分裂成其它的子TU。当TU未经进一步分裂时,其可被称作叶TU。一般来说,对于帧内译码,属于叶CU的所有叶TU共享相同的帧内预测模式。也就是说,一般应用相同的帧内预测模式来计算叶CU的所有TU的预测值。对于帧内译码,视频编码器可以使用帧内预测模式针对每一叶TU计算残余值,作为CU的对应于TU的部分与原始块之间的差。TU未必限于PU的大小。因此,TU可大于或小于PU。对于帧内译码,PU可以与相同CU的相对应的叶TU并置。在一些实例中,叶TU的最大大小可以对应于相对应的叶CU的大小。
此外,叶CU的TU还可与相应四叉树数据结构(被称作残余四叉树(RQT))相关联。也就是说,叶CU可包含指示叶CU如何分割成TU的四叉树。TU四叉树的根节点一般对应于叶CU,而CU四叉树的根节点一般对应于树块(或LCU)。未分裂的RQT的TU被称作叶TU。一般来说,除非以其它方式提到,否则本发明分别使用术语CU及TU来指叶CU及叶TU。
视频序列通常包含一系列视频帧或图片。图片群组(GOP)一般包括一系列的一或多个视频图片。GOP可包含在GOP的标头、图片中的一或多者的标头或其它地方中的语法数据,所述语法数据描述GOP中所包含的图片的数目。图片的每一切片可包含切片语法数据,其描述用于相应切片的编码模式。视频编码器20通常对个别视频切片内的视频块操作以便编码视频数据。视频块可以对应于CU内的译码节点。视频块可以具有固定或变化的大小,并且可以根据指定译码标准而有不同大小。
作为一实例,HM支持各种PU大小的预测。假设特定CU的大小是2N×2N,那么HM支持2N×2N或N×N的PU大小的帧内预测,及2N×2N、2N×N、N×2N或N×N的对称PU大小的帧间预测。HM还支持用于2N×nU、2N×nD、nL×2N及nR×2N的PU大小的帧间预测的不对称分割。在不对称分割中,不分割CU的一个方向,但是将另一方向分割成25%及75%。CU的对应于25%分区的部分通过“n”、后面接续“上方”、“下方”、“左侧”或“右侧”指示来指示。因此,例如,“2N×nU”是指经水平地分割的2N×2N CU,其中顶部为2N×0.5N PU,而底部为2N×1.5N PU。
在本发明中,“N×N”及“N乘N”可以互换使用以指在垂直尺寸及水平尺寸方面的视频块的像素尺寸,例如,16×16像素或16乘16像素。一般来说,16×16块将在垂直方向上具有16个像素(y=16),并且在水平方向上具有16个像素(x=16)。同样,N×N块一般在垂直方向上具有N个像素,并且在水平方向上具有N个像素,其中N表示非负整数值。块中的像素可按行及列布置。此外,块未必需要在水平方向与垂直方向上具有相同数目个像素。举例来说,块可包括N×M个像素,其中M未必等于N。
如上文所提到,视频编码器20及视频解码器30可经配置以帧间预测或帧内预测CU的PU。一般来说,帧间译码涉及相对于一或多个参考图片的预测。参考图片可为按时间次序的先前图片、未来图片,或来自两个或两个以上先前经编码图片的预测的组合。视频编码器20或视频编码器20可将参考图片存储在经解码图片缓冲器(DPB)中。视频编码器20可发信NAL单元值,所述NAL单元值通过将图片标记为短期参考图片或长期参考图片而指示将所述图片用作参考图片。视频编码器20及视频解码器30将长期及短期参考图片存储在参考图片列表中。与短期参考图片相比较,视频编码器20或视频编码器20可在较长时间内将长期参考图片存储在DPB中,且因此与短期参考图片相比较,长期参考图片可用作用于更多图片的参考图片。
视频编码器20或视频解码器30可按数种方式将参考图片从DPB中去除。当不再需要参考图片时,视频编码器20或视频解码器30可将参考图片标记为不再需要用于参考,且最终可将不再需要用于参考的图片从DPB中去除,例如,通过输出参考图片以供显示,或在参考图片已经输出供显示的情况下,通过丢弃参考图片。如果DPB充满,那么视频编码器20或视频解码器30可去除最旧的短期参考图片。
除将参考图片存储在DPB中之外,视频编码器20或视频解码器30还将参考图片存储在两个参考图片列表(被称作列表0及列表1)中的一者中。存储在列表0及列表1中的用以预测特定图片的参考图片可被称作参考图片集(RPS)。存储在列表0及列表1中的图片可来自多种不同源,例如SPS及PPS。如上文所描述,切片标头还可明确地发信待包含在RPS中的图片。其被定义为与图片相关联的一组参考图片,其由按解码次序在相关联的图片之前的所有参考图片组成,所述参考图片可用于进行相关联的图片或按解码次序在相关联的图片之后的任何图片中的块的帧间预测,例如,直到下一瞬时解码刷新(IDR)图片或断链存取(BLA)图片为止。换句话说,参考图片集中的参考图片可能需要以下特性:(1)其按解码次序均在当前图片之前,及(2)其可用于帧间预测当前图片及/或帧间预测按解码次序在当前图片之后的任何图片,且在一些实例中,直到下一IDR图片或BLA图片为止。
视频编码器20或视频解码器30可导出RPS,且在此类导出之后,可构造参考图片列表,例如列表0及列表1。当预测p-切片时,视频编码器20或视频解码器30可利用来自列表0的参考图片,且当预测双向预测切片时,视频编码器20或视频解码器30可利用来自列表0或列表1的参考图片。仅RPS中的参考图片可为用以构造参考图片列表的候选参考图片。
为了构造参考图片集,视频译码器可构造多个参考图片子集。WD 9描述视频解码器构造的五个参考图片子集。参考图片子集的组合可一起形成参考图片集。举例来说,视频编码器20可明确地在经译码位流中发信允许视频解码器确定用于包含在参考图片集中的参考图片的识别符的值。举例来说,参考图片的识别符可为图片次序计数。每一图片与一个POC值相关联。图片的POC值指示相对应的图片相对于按解码次序的先前IDR图片的输出次序或显示次序,并且,在一些其它替代方案中,指示按输出次序的相关联的图片相对于同一经译码视频序列中的其它图片的输出次序位置的位置。举例来说,在经译码视频序列内,具有较小POC值的图片比具有较大POC值的图片更早输出或显示。
如上文所描述,将参考图片存储在DPB中,且可在SPS、PPS或切片标头中发信参考图片。PPS可从SPS继承参考图片的子集,且可发信额外的参考图片,所述额外的参考图片可用以发信视频编码器20或视频解码器30可在当前图片的帧间预测期间使用的图片。视频译码器可确定用于参考图片的识别符,例如POC值或其它识别符,且从这些识别符构造所述多个参考图片子集。
可存在视频解码器30可借以确定用于属于参考图片集的图片的识别符的各种方式。一般来说,视频编码器20可发信可供视频解码器30确定用于图片(包含属于参考图片集的图片)的识别符的值。图片的识别符可为用于图片中的每一者的POC。如上文所描述,POC值可指示图片的显示或输出次序,其中具有较小POC值的图片比具有较大POC值的图片更早显示。给定图片的POC值可相对于先前IDR图片来说。举例来说,用于IDR图片的PicOrderCnt(即,POC值)可为0,用于按显示或输出次序在IDR图片之后的图片的POC值可为1,用于按显示或输出次序在具有POC值1的图片之后的POC值可为2,等等。
从这些参考图片子集,视频解码器可导出参考图片集,如下文更详细描述。在一些实例中,参考图片子集中的每一者包含不同的参考图片,这是因为参考图片子集中不存在参考图片的重叠。以此方式,参考图片中的每一者可在参考图片子集中的仅一者中,且不在任何其它参考图片子集中。
在确定参考图片集或其子集中的参考图片的识别符(例如,POC值)之后,视频解码器可构造参考图片子集。如下文更详细描述,视频解码器可构造五个参考图片子集,但视频解码器可能有可能构造更多或更少的参考图片子集。
这五个参考图片子集命名为:RefPicSetStCurrBefore、RefPicSetStCurrAfter、RefPicSetStFoll、RefPicSetLtCurr及RefPicSetLtFoll。
RefPicSetStCurrBefore、RefPicSetStCurrAfter及RefPicSetStFoll参考图片子集可识别短期参考图片。在一些实例中,这些参考图片子集可基于以下情形来识别短期参考图片:短期参考图片是按显示次序比被译码的当前图片早,还是按显示次序比被译码的当前图片迟,以及短期参考图片是可潜在地用于帧间预测当前图片及按解码次序在当前图片之后的图片,还是可潜在地仅用于帧间预测按解码次序在当前图片之后的图片。
举例来说,RefPicSetStCurrBefore参考图片子集可包含且可仅包含满足以下情形的所有短期参考图片的识别信息(例如,POC值):具有比当前图片早的输出或显示次序,且可潜在地用于在帧间预测当前图片中供参考,且可潜在地用于在帧间预测按解码次序在当前图片之后的一或多个图片中供参考。RefPicSetStCurrAfter参考图片子集可包含且可仅包含满足以下情形的所有短期参考图片的识别信息:具有比当前图片迟的输出或显示次序,且可潜在地用于在帧间预测当前图片中供参考,且可潜在地用于在帧间预测按解码次序在当前图片之后的一或多个图片中供参考。
RefPicSetStFoll参考图片子集可包含且可仅包含满足以下情形的所有短期参考图片的识别信息:具有比当前图片早的输出或显示次序,且可潜在地用于在帧间预测按解码次序在当前图片之后的一或多个图片中供参考,且无法用于在帧间预测当前图片中供参考。
RefPicSetLtCurr及RefPicSetLtFoll参考图片子集可识别长期参考图片。在一些实例中,这些参考图片子集可基于长期参考图片是按按显示次序比被译码的当前图片早还是按显示次序比被译码的当前图片迟来识别长期参考图片。
举例来说,RefPicSetLtCurr参考图片子集可包含且可仅包含满足以下情形的所有长期参考图片的识别信息:可潜在地用于在帧间预测当前图片中供参考,且可潜在地用于在帧间预测按解码次序在当前图片之后的一或多个图片中供参考。RefPicSetLtFoll参考图片子集可包含且可仅包含满足以下情形的所有长期参考图片的识别信息:可潜在地用于在帧间预测按解码次序在当前图片之后的一或多个图片中供参考,且无法用于在帧间预测当前图片中供参考。
在一些实例中,RefPicSetStCurrBefore、RefPicSetStCurrAfter及RefPicSetLtCurr子集可包含满足以下情形的所有参考图片:可用于帧间预测当前图片中的块,且可用于帧间预测按解码次序在当前图片之后的图片中的一或多者。RefPicSetStFoll及RefPicSetLtFoll子集可包含满足以下情形的所有参考图片:不用于帧间预测当前图片中的块,但可用于帧间预测按解码次序在当前图片之后的图片中的一或多者。
为了构造RefPicSetLtCurr及RefPicSetLtAfter参考图片子集,视频解码器根据以下伪码通过DPB反复,且将存储在DPB中的LTRP添加到RefPicSetLtCurr及RefPicSetLtAfter参考图片子集:
在建置RefPicSetLtCurr及RefPicSetLtFoll参考图片列表之后,视频解码器30将所参考的图片中的图片中的每一者标记为“用于长期参考”。
为了构造RefPicSetStCurrBefore、RefPicSetStCurrAfter及RefPicSetLtCurr参考图片集,视频解码器30可执行以下伪码,所述伪码通过DPB反复,且将来自DPB的具有POC值的图片添加到相对应的参考图片集:
视频解码器30将未包含在五个参考图片子集中的一者中的任何参考图片标记为“不用于参考”。
如果待解码的当前图片为IDR图片,那么视频解码器30可将RefPicSetStCurrBefore、RefPicSetStCurrAfter、RefPicSetStFoll、RefPicSetLtCurr及RefPicSetLtFoll参考图片子集设置为空。这种情形可能是因为:IDR图片可能并非经帧间预测且无按解码次序在IDR图片之后的图片可在解码中使用在IDR图片之前的任何图片供参考。否则的话(例如,当当前图片并非IDR图片时),视频解码器30可通过实施以下伪码构造短期参考图片子集及长期参考图片子集。
一旦视频解码器30从多个参考图片子集导出参考图片集,视频解码器便可从参考图片集构造参考图片列表(例如,列表0及列表1)。举例来说,参考图片列表的构造可包含初始化步骤及可能的修改步骤。
在一些实例中,视频解码器可经配置以实施默认参考列表构造技术,其中视频解码器利用参考图片子集来构造初始参考图片列表。接着,如果不需要参考图片列表修改,那么最后的参考图片列表可与初始参考图片列表相同,而不需要对参考图片列表的任何额外重新排序。
在帧间预测经单向预测的PU期间,视频编码器20或视频解码器30使用参考图片列表0的参考图片预测当前块的当前及明度色度值。在帧间预测经双向预测的PU期间,视频编码器20或视频解码器30使用参考图片列表0与参考图片列表1两者的参考图片预测当前明度及色度块的值。
视频解码器30可通过将参考图片(例如,LTRP及STRP)编索引到参考图片的两个列表(被称作RefPicList0及RefPicList1)中的一者中来对参考图片寻址。RefPicList0及RefPicList1包含来自五个参考图片子集RefPicSetStCurrBefore、RefPicSetStCurrAfter、RefPicSetStFoll、RefPicSetLtCurr及RefPicSetLtFoll的参考图片。当解码经单向预测的PU时,视频解码器30可利用存储在RefPicList0中的图片中的一者预测当前明度及色度块的值。当解码经双向预测的PU时,视频解码器30可利用RefPicList0的图片及RefPicList1的图片预测当前切片的CU。在解码P或B切片的开始,视频解码器30可根据以下伪码构造临时参考图片列表RefPicList0:
其中RefPicListTemp0为临时变量,其包含RefPicSetStCurrBefore的内容,后面接续RefPicSetStCurrAfter的内容且后面接续RefPicSetLtCurr的内容。
在一些情况下,位流可发信:应将RefPicList0中的图片重新排序。视频解码器30可基于ref_pic_list_modification_flag_l0将RefPicListTemp0重新排序。在构造RefPicListTemp0之后,视频解码器30根据以下伪码构造RefPicList0:
当当前PU经双向预测时,视频解码器30根据以下伪码在类似于用以构造RefPicListTemp0的过程的过程中构造RefPicList1的临时版本(被称作RefPicListTemp1):
视频解码器30可根据以下伪码基于ref_pic_list_modification_flag_l1将RefPicListTemp1重新排序:
如上文所描述,HEVC位流包含译码单元(CU),所述译码单元(CU)由预测单元(PU)及变换单元(TU)组成。对于经帧间预测的PU,每一预测单元可包含运动预测信息,例如,PU的特定帧间预测模式、一或多个运动向量差值(MVD)及待于预测CU的像素值时使用的参考图片。可存在针对每一PU发信的一个或两个参考图片,如果CU经单向预测,那么存在一个参考图片,且如果CU经双向预测,那么存在两个参考图片。
切片的经帧间预测的PU可包含语法元素ref_idx_l0及ref_idx_l1。ref_idx_l0及ref_idx_l1中的每一者的值分别为到参考图片列表RefPicList0及RefPicList1的索引。ref_idx_l0及ref_idx_l1发信供视频解码器结合运动向量差值使用以确定一组预测样本的参考图片,所述组预测样本供视频解码器30用于预测当前块的色度及明度值。
在其中PU经单向或经双向预测的实例中,视频解码器30使用PU的MVD值重新构造一或多个色度运动向量及明度运动向量。视频解码器30可通过确定用于CU的运动向量预测值及组合运动向量预测值与MVD以形成CU的运动向量来重新构造明度及色度运动向量。视频解码器30可从另一个先前经译码CU(例如,相邻的先前经译码CU)确定运动向量预测值。在一些情况下,可使用所谓的合并更多或高级运动向量预测(AMVP)译码PU,其中视频解码器30仅基于先前经译码CU的一或多个运动向量确定用于当前PU的运动向量预测值。在此情况下,当前PU并不包含任何经发信的MVD值。
一旦视频解码器30重新构造了用于当前PU的色度及明度运动向量,视频解码器30便基于通过PU中的参考图片的索引发信的一或多个参考图片确定明度预测样本阵列、色度预测样本阵列及色度残余样本阵列。为了计算用于当前明度块的明度预测样本(例如,预测值),视频解码器30计算明度运动向量的整数部分及分数部分。视频解码器30将当前明度块的左上角的x坐标及y坐标与明度运动向量相加以确定用于所指示参考图片的明度样本的相对应的整数或分数偏移。基于偏移,视频编码器20可基于参考图片的明度样本的全部像素值内插分数子位置的值以确定用于当前明度块的明度预测样本。作为一实例,明度运动向量差在与运动向量预测值组合时可参考明度预测样本的特定四分之一像素位置。视频解码器30可基于一或多个内插滤波器内插四分之一像素值。内插滤波器可利用来自明度参考样本的对全部像素组的支持产生四分之一像素值。视频解码器30可利用所产生的四分之一像素明度值作为当前明度块的预测值。
视频解码器30可执行类似过程以确定用于当前色度块的预测样本。视频解码器30重新构造可能不同于明度运动向量的至少一个色度运动向量,且利用所述色度运动向量来确定到参考图片的色度样本的偏移。并且,尽管明度运动向量可具有高达四分之一像素精度,但色度运动向量可具有高达八分之一像素精度。基于到参考图片的色度样本的偏移,视频解码器30可内插预测性子像素色度值作为当前色度块的色度值的预测值。
在其中当前PU经双向预测的情况下,视频解码器30确定两个明度预测样本阵列(两个明度运动向量中的每一者一个明度预测样本阵列),及两个色度预测样本阵列(两个色度运动向量中的每一者一个色度预测样本阵列)。视频解码器30组合两个明度预测样本与两个色度预测样本阵列以形成单个预测样本阵列。用以预测每一明度及色度样本阵列的技术取决于两个预测旗标语法元素predFlagL0及preFlagL1,所述预测旗标语法元素指示视频解码器30执行两个加权样本预测过程中的哪一者。指配给两个色度及明度预测样本阵列中的每一者的特定权重是通过加权预测语法表来定义,所述加权预测语法表可在切片片段标头中发信。
在使用CU的PU进行帧内预测性译码或帧间预测性译码之后,视频编码器20或视频解码器30可计算用于CU的TU的残余数据。PU可包括描述在空间域(还被称作像素域)中产生预测性像素数据的方法或模式的语法数据,并且TU可包括在对残余视频数据应用变换(例如,离散余弦变换(DCT)、整数变换、小波变换或概念上类似的变换)之后在变换域中的系数。残余数据可以对应于未经编码图片的像素与对应于PU的预测值之间的像素差。视频编码器20或视频解码器30可形成包含用于CU的残余数据的TU,且接着变换TU以产生用于CU的变换系数。
在进行任何变换以产生变换系数之后,视频编码器20或视频解码器30可执行变换系数的量化。量化一般是指将变换系数量化以可能减少用于表示系数的数据量从而提供进一步压缩的过程。量化过程可减少与系数中的一些系数或全部相关联的位深度。举例来说,可在量化期间将n位值向下舍入到m位值,其中n大于m。
在量化之后,视频编码器可以扫描变换系数,从而从包含经量化的变换系数的二维矩阵产生一维向量。扫描可以经设计以将较高能量(并且因此较低频率)的系数放置在阵列正面,并且将较低能量(并且因此较高频率)的系数放置在阵列的背面。在一些实例中,视频编码器20或视频解码器30可利用预定义的扫描次序来扫描经量化的变换系数以产生可经熵编码的串行化向量。在其它实例中,视频编码器20或视频解码器30可执行自适应扫描。在扫描经量化的变换系数以形成一维向量之后,视频编码器20或视频解码器30可以例如根据上下文自适应可变长度译码(CAVLC)、上下文自适应二进制算术译码(CABAC)、基于语法的上下文自适应二进制算术译码(SBAC)、概率区间分割熵(PIPE)译码或另一熵编码方法来熵编码一维向量。视频编码器20还可熵编码与经编码视频数据相关联的语法元素以供视频解码器30在解码视频数据时使用。
为了执行CABAC,视频编码器20可以向待发射的符号指配上下文模型内的上下文。举例来说,所述上下文可以涉及符号的相邻值是否为非零。为了执行CAVLC,视频编码器20可以选择用于待发射的符号的可变长度码。VLC中的码字可经构造而使得相对较短的代码对应于更有可能的符号,而较长的代码对应于不太可能的符号。以此方式,使用VLC可以实现(例如)优于对待发射的每一符号使用等长码字的位节省。概率确定可基于指配给符号的上下文。
视频编码器20可进一步例如在帧标头、块标头、切片标头或GOP标头中将例如基于块的语法数据、基于帧的语法数据及基于GOP的语法数据等语法数据发送到视频解码器30。GOP语法数据可描述相应GOP中的帧的数目,且帧语法数据可指示用以编码相对应的帧的编码/预测模式。
本发明的技术涉及用于改进经译码视频位流中的参考图片的发信的技术。一般来说,为了在发信对参考图片的POC值的参考时节省位,WD6指示:仅发信POC值的某数目个最低有效位(LSB)来指代长期参考图片,而短期参考图片是通过完整POC值来识别。
本发明提供涉及长期参考图片的发信的技术,视频编码器20及视频解码器30可实施所述技术。明确地说,本发明描述用于(例如)在切片标头中发信用于长期参考图片的识别信息的技术。明确地说,本发明的技术涉及用于改进在经译码视频序列的切片标头中发信长期参考图片的最高有效位(MSB)及最低有效位的技术。本发明的技术还涉及用于在切片标头中发信未包含在用于当前译码图片的作用中序列参数集或图片参数集中所包含的所述组参考图片中的额外参考图片的技术。
本发明的技术的第一方面涉及长期参考图片的发信,且更确切地说,涉及在经译码视频序列的切片标头中的长期参考位的最高有效位的发信。一般来说,本发明的技术可将切片标头语法实施为上文关于表2所描述的语法。根据表2,切片标头包含long_term_idx_sps[i]及poc_lsb_lt语法元素。对于特定索引值i,long_term_idx_sps[i]的值指定到来自作用中序列参数集的候选长期参考图片的列表的索引,且poc_lsb_lt[i]的值指定用于第i个长期参考图片的最低有效位。
以此方式,long_term_idx_sps及poc_lsb_lt语法元素识别从序列参数集继承而来的且视频解码器30用以预测当前切片的CU的长期参考图片的子集。本发明的技术在long_term_idx_sps[i]语法元素中限制从SPS继承而来的LTRP POC LSB值的次序。根据本发明的技术限制long_term_idx_sps[i]的LTRP POC LSB值的次序可降低经译码视频位流的复杂性。因此,可如下相对于上文关于表2所描述的语义来修改表2的切片标头语法元素的语义。
对于特定索引i,long_term_idx_sps[i]的值指定从所提及的序列参数集继承到当前图片的长期参考图片集的第i个长期参考图片到作用中序列参数集中指定的长期参考图片的列表的索引。long_term_idx_sps[i]的值可在0到num_long_term_ref_pics_sps-1(包含0及num_long_term_ref-pics_sps-1)的范围内。
本发明的技术进一步修改poc_lsb_lt的值的排序,使得对于在0到num_long_term_sps-1(包含0及num_long_term_sps-1)的范围内的j及k的任何值,如果j小于k,那么lt_ref_pic_poc_lsb_sps[long_term_idx_sps[j]]不小于lt_ref_pic_poc_lsb_sps[long_term_idx_sps[k]]。在此实例中,对于所有j<k,long_term_idx_sps[j]的LSB POC值不小于long_term_idx_sps[k]的LSB POC值。
切片标头还可包含delta_poc_msb_present_flag[i]语法元素。delta_poc_msb_present_flag[i]指定是否针对第i个LTRP(即,通过long_term_idx_sps[i]或poc_lsb_lt[i]指示的LTRP)发信指定数目个MSB。如果delta_poc_msb_present_flag[i]的第i个索引等于1,那么存在delta_poc_msb_cycle_lt[i]值。如果delta_poc_msb_present_flag[i]的值等于0,那么针对经发信的第i个LTRP,不存在delta_poc_msb_cycle_lt[i]。本发明的技术修改delta_poc_msb_present_flag[i]的发信,使得当经解码图片缓冲器中存在一个以上图片时,仅发信等于1的delta_poc_msb_present_flag[i],且经标记为“用于参考”的参考图片且具有等于PocLsbLt[i]的图片次序计数值的最低有效位。先前技术可发信等于1的delta_poc_msb_present_flag[i],及delta_poc_msb_lt[i]值,甚至在图片未经标记为“用于参考”时(即,当图片不再需要用于参考时)也如此。通过将delta_poc_msb_present_flag[i]的发信限于经标记为“用于参考”的图片,本发明的技术可减少发信参考图片的MSB的频率,所述情形可减少经译码视频位流的复杂性。
切片标头还可包含delta_poc_msb_cycle_lt[i]语法元素。视频解码器30可利用delta_poc_msb_cycle_lt[i]值来确定包含在当前图片的长期参考图片集中的第i个长期参考图片的图片次序计数值的最高有效位的值。为了确定第i个LTRP的MSB值,视频译码器可确定变量DeltaPocMSBCycleLt[i]的值。所述值指示第i个LTRP的MSB。
视频译码器可根据以下伪码导出变量DeltaPocMSBCycleLt[i]:
DeltaPocMSBCycleLt[i]×MaxPicOrderCntLsb+pic_order_cnt_lsb-PocLsbLt[i]的值可在1到224-1(包含1及224-1)的范围内。
在一些情况下,视频解码器30通过将先前LTRP的DeltaPocMSBCycleLt[i-1]的值、DeltaPocMSB值加到当前LTRP的delta_poc_msb_cycle_lt[i]值来确定DeltaPocMSBCycleLt[i]。
与用于确定DeltaPocMSBCycleLt[i]的先前技术相比较,如果i等于作用中SPS中指定的LTRP的数目且LTRP待包含在用于当前图片的所述组LTRP中,那么将DeltaPocMSBCycleLt[i]定义为delta_poc_msb_cycle_lt[i]。
在根据本发明的技术的替代实例中(所述实例可与上文所论述的实例组合),切片标头语法可实质上与表2中的语法相同。然而,切片标头还可包含语法元素“lt_pic_from_sps_flag[i]”,如下文所描述。从SPS继承而来的POC LSB值及直接在切片标头中发信的POC LSB值的次序可共同地通过对阵列PocLsbLt[i]的值的约束来限制。对delta_poc_msb_present_flag[i]的限制可与上文所描述的实例中的限制相同。表5提供根据此实例的用于切片标头的语法的实例:
表5
如上文所提到,表5提供额外语法元素“lt_pic_from_sps_flag[i]”。视频解码器30可使用lt_pic_from_sps_flag[i]来确定在切片标头中经发信的第i个LTRP是从SPS导出还是明确地在切片标头中经发信。当旗标为1时,LTRP可从SPS继承而来且对应于经发信的索引。当旗标为0时,可明确地发信长期参考图片的LSB。当不存在lt_pic_from_sps_flag[i]时,视频译码器可推断lt_pic_from_sps_flag[i]等于0。
以此方式,lt_pic_from_sps_flag[i]表示可在切片标头中译码的语法元素的实例,所述语法元素指示用于长期参考图片的识别信息是明确地在切片标头中经发信还是从包含其中出现切片的图片序列的序列参数集(即,对应于切片的序列参数集)导出。
在此实例中,long_term_idx_sps[i]可指定当前图片的长期参考图片集的第i个长期参考图片到作用中序列参数集中指定的长期参考图片的列表的索引。long_term_idx_sps[i]的值可在0到num_long_term_ref_pics_sps-1(包含0及num_long_term_ref_pics_sps-1)的范围内。
在此实例中,poc_lsb_lt[i]可指定包含在当前图片的长期参考图片集中的第i个长期参考图片的图片次序计数值的最低有效位的值。poc_lsb_lt[I]语法元素的长度可为log2_max_pic_order_cnt_lsb_minus4+4位。变量PocLsbLt[i]可指定第i个LTRP的LSB。
可如下在以下伪码中般导出变量PocLsbLt[i]:
对于在0到num_long_term_pics+num_long_term_sps-1(包含0及num_long_term_pics+num_long_term_sps-1)的范围内的j及k的任何值,如果j小于k,那么PocLsbLt[j]受限制从而不小于PocLsbLt[k]。因此,如果LTRP是从SPS继承而来,那么PocLsbLt[i]被定义为从SPS继承而来的参考图片的LSB,且如果LTRP并非从SPS继承而来,那么PocLsbLt[i]被定义为明确地在切片标头中经发信的LSB。另外,LSB受限制从而呈非递增次序。
对delta_poc_msb_present_flag[i]及delta_poc_msb_cycle_lt[i]的语义的改变可与上述实例中所描述的语义相同,且变量DeltaPocMSBCycleLt[i]的导出可与上文关于表2的方法相同。
替代地,num_long_term_pics可指定包含从SPS继承而来的LTRP及明确地在切片标头中经发信的LTRP的经发信的LTRP的总数目,且视频译码器不需要发信num_long_term_sps。
视频编码器20及视频解码器30可经配置以根据上文所描述的语法及语义的各种实例译码切片标头及/或序列参数集的数据。以此方式,视频编码器20及视频解码器30可(例如)通过针对某些长期参考图片发信较少的最高有效位而实现位节省。
因此,视频编码器20及视频解码器30表示一种视频译码器的实例,所述视频译码器经配置以:译码视频数据的切片的切片标头,其中所述切片标头包含指示用于长期参考图片的识别信息是明确地在所述切片标头中经发信还是从对应于所述切片的序列参数集导出的语法元素,且,在所述语法元素指示用于所述长期参考图片的所述识别信息是明确地经发信时,译码所述切片标头中用于所述长期参考图片的LSB的值。
视频编码器20及视频解码器30各自可以实施为可适用的多种合适的编码器或解码器电路中的任一者,例如一或多个微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑电路、软件、硬件、固件或其任何组合。视频编码器20及视频解码器30中的每一者可以包含在一或多个编码器或解码器中,所述编码器或解码器中的任一者可以集成为组合视频编码器/解码器(编码解码器)的部分。包含视频编码器20及/或视频解码器30的装置可包括集成电路、微处理器及/或无线通信装置,例如蜂窝式电话。
图2为说明可实施用于在SPS或切片标头中发信用于LTRP的数据的技术的视频编码器20的实例的框图。视频编码器20可以执行视频切片内的视频块的帧内译码及帧间译码。帧内译码依赖于空间预测来减少或去除给定视频帧或图片内的视频中的空间冗余。帧间译码依赖于时间预测来减少或去除视频序列的邻接帧或图片内的视频中的时间冗余。帧内模式(I模式)可以指若干基于空间的译码模式中的任一者。例如单向预测(P模式)或双向预测(B模式)等帧间模式可以指若干基于时间的译码模式中的任一者。
如图2中所示,视频编码器20接收待编码的视频帧内的当前视频块。在图2的实例中,视频编码器20包含模式选择单元40、参考图片存储器64、求和器50、变换处理单元52、量化单元54及熵编码单元56。模式选择单元40又包含运动补偿单元44、运动估计单元42、帧内预测单元46及分割单元48。为了视频块重新构造,视频编码器20还包含反量化单元58、反变换单元60,及求和器62。还可包含解块滤波器(图2中未展示)以便对块边界进行滤波,以将方块效应假影从经重新构造的视频中去除。必要时,解块滤波器通常将对求和器62的输出进行滤波。除解块滤波器之外,还可使用额外滤波器(环路内或环路后)。为简洁起见未展示此类滤波器,但是必要时,这些滤波器可以对求和器50的输出进行滤波(作为环路内滤波器)。
在编码过程期间,视频编码器20接收待译码的视频帧或切片。所述帧或切片可以划分成多个视频块。运动估计单元42及运动补偿单元44可相对于一或多个参考帧中的一或多个块执行所接收视频块的帧间预测性译码以提供时间预测。帧内预测单元46可替代地相对于与待译码块相同的帧或切片中的一或多个相邻块执行所接收视频块的帧内预测性译码以提供空间预测。视频编码器20可以执行多个译码遍次,例如,以针对每一视频数据块选择一种适当的译码模式。
此外,分割单元48可以基于先前译码遍次中的先前分割方案的评估将视频数据块分割成子块。举例来说,分割单元48最初可以将帧或切片分割成LCU,并且基于速率失真分析(例如,速率失真优化)将LCU中的每一者分割成子CU。模式选择单元40可以进一步产生指示LCU分割成子CU的四叉树数据结构。四叉树的叶节点CU可包含一或多个PU及一或多个TU。
模式选择单元40可以(例如)基于误差结果选择译码模式中的一者(帧内或帧间),并且将所得的经帧内译码或经帧间译码块提供到求和器50以便产生残余块数据,并且提供到求和器62以便重新构造经编码块以用作参考帧。模式选择单元40还将语法元素(例如,运动向量、帧内模式指示符、分割信息及其它此类语法信息)提供到熵编码单元56。
运动估计单元42及运动补偿单元44可以高度集成,但出于概念目的分别加以说明。由运动估计单元42执行的运动估计是产生运动向量的过程,所述过程估计视频块的运动。举例来说,运动向量可以指示当前视频帧或图片内的视频块的PU相对于参考帧(或其它经译码单元)内的预测性块相对于当前帧(或其它经译码单元)内正被译码的当前块的位移。预测性块是被发现在像素差方面与待译码块紧密匹配的块,像素差可通过绝对差总和(SAD)、平方差总和(SSD)或其它差异度量来确定。在一些实例中,视频编码器20可以计算存储在参考图片存储器64中的参考图片的子整数像素位置的值。举例来说,视频编码器20可以内插参考图片的四分之一像素位置、八分之一像素位置或其它分数像素位置的值。因此,运动估计单元42可以相对于完整像素位置及分数像素位置执行运动搜索并且输出具有分数像素精度的运动向量。
运动估计单元42通过比较PU的位置与参考图片的预测性块的位置来计算用于经帧间译码切片中的视频块的PU的运动向量。参考图片可以选自第一参考图片列表(列表0)或第二参考图片列表(列表1),所述参考图片列表中的每一者识别存储在参考图片存储器64中的一或多个参考图片。运动估计单元42将所计算的运动向量发送到熵编码单元56及运动补偿单元44。
由运动补偿单元44执行的运动补偿可以涉及基于由运动估计单元42确定的运动向量提取或产生预测性块。此外,在一些实例中,运动估计单元42与运动补偿单元44可以在功能上集成。在接收到当前视频块的PU的运动向量后,运动补偿单元44便可以在参考图片列表中的一者中定位所述运动向量指向的预测性块。求和器50通过从经译码的当前视频块的像素值减去预测性块的像素值从而形成像素差值来形成残余视频块,如下文所论述。一般来说,运动估计单元42相对于明度分量执行运动估计,并且运动补偿单元44对于色度分量及明度分量两者使用基于明度分量计算的运动向量。模式选择单元40还可产生与视频块及视频切片相关联的供视频解码器30在解码视频切片的视频块时使用的语法元素。
作为如上文所描述由运动估计单元42及运动补偿单元44执行的帧间预测的替代方案,帧内预测单元46可以对当前块进行帧内预测。明确地说,帧内预测单元46可以确定用来编码当前块的帧内预测模式。在一些实例中,帧内预测单元46可以(例如)在单独的编码编次期间使用各种帧内预测模式来编码当前块,并且帧内预测单元46(或在一些实例中为模式选择单元40)可以从所述测试模式中选择适当帧内预测模式来使用。
举例来说,帧内预测单元46可以使用速率失真分析计算针对各种经测试帧内预测模式的速率失真值,并且从所述经测试模式当中选择具有最佳速率失真特性的帧内预测模式。速率失真分析一般确定经编码块与经编码以产生所述经编码块的原始的未经编码块之间的失真(或误差)的量,以及用于产生经编码块的位速率(也就是说,位数目)。帧内预测单元46可以根据用于各种经编码块的失真及速率计算比率,以确定哪种帧内预测模式对于所述块展现最佳速率失真值。
在针对块选择帧内预测模式之后,帧内预测单元46可将指示用于所述块的选定帧内预测模式的信息提供到熵编码单元56。熵编码单元56可以编码指示选定帧内预测模式的信息。视频编码器20可在所发射的位流中包含配置数据,所述配置数据可包含多个帧内预测模式索引表及多个修改的帧内预测模式索引表(还被称作码字映射表),编码用于各种块的上下文的定义,及用于所述上下文中的每一者的最可能的帧内预测模式、帧内预测模式索引表及修改的帧内预测模式索引表的指示。
视频编码器20通过从经译码的原始视频块减去来自模式选择单元40的预测数据形成残余视频块。求和器50表示执行此减法运算的一或多个组件。变换处理单元52将例如离散余弦变换(DCT)或概念上类似的变换等变换应用于残余块,从而产生包括残余变换系数值的视频块。变换处理单元52可以执行概念上类似于DCT的其它变换。还可使用小波变换、整数变换、子频带变换或其它类型的变换。在任何情况下,变换处理单元52向残余块应用变换,从而产生残余变换系数块。所述变换可将残余信息从像素值域转换到变换域,例如频域。变换处理单元52可将所得变换系数发送到量化单元54。量化单元54将变换系数量化以进一步减小位速率。量化过程可减少与系数中的一些系数或全部相关联的位深度。可通过调整量化参数来修改量化程度。在一些实例中,量化单元54可以接着执行对包含经量化的变换系数的矩阵的扫描。替代地,熵编码单元56可以执行所述扫描。
在量化之后,熵编码单元56熵译码经量化的变换系数。举例来说,熵编码单元56可以执行上下文自适应可变长度译码(CAVLC)、上下文自适应二进制算术译码(CABAC)、基于语法的上下文自适应二进制算术译码(SBAC)、概率区间分割熵(PIPE)译码或另一熵译码技术。在基于上下文的熵译码的情况下,上下文可以基于相邻块。在熵编码单元56的熵译码之后,可以将经编码位流发射到另一装置(例如,视频解码器30),或者将所述视频存档以用于稍后发射或检索。
反量化单元58及反变换单元60分别应用反量化及反变换以在像素域中重新构造残余块,例如以供稍后用作参考块。运动补偿单元44可以通过将残余块加到参考帧存储器64中的帧中的一者的预测性块来计算参考块。运动补偿单元44还可将一或多个内插滤波器应用于经重新构造的残余块以计算子整数像素值以用于运动估计。求和器62将经重新构造的残余块加到由运动补偿单元44产生的经运动补偿的预测性块以产生经重新构造的视频块以用于存储在参考图片存储器64中。经重新构造的视频块可供运动估计单元42及运动补偿单元44用作参考块以帧间译码后续视频帧中的块。
运动估计单元42可确定视频编码器20可用来预测经帧间预测的一或多个PU的像素值的一或多个参考图片。运动估计单元42可将每一参考图片作为LTRP或短期参考图片发信。运动估计单元42可将所述参考图片存储在经解码图片缓冲器(DPB)中,直到所述图片经标记为不用于参考为止。
视频编码器20的模式选择单元40可编码包含用于一或多个参考图片的识别信息的各种语法元素。在编码经帧间预测的图片期间,模式选择单元40可在序列参数集中编码用于当前图片的一或多个LTRP的识别信息。模式选择单元40还可在当前图片的切片标头或当前图片的图片参数集中编码用于预测当前图片的一或多个短期参考图片的识别信息。在一些实例中,所述语法元素可指示切片标头是否从作用中序列参数集继承了长期参考图片,或长期参考图片是否明确地在切片标头中经发信。
以此方式,图2中的视频编码器20的模式选择单元40表示一种视频编码器的实例,所述视频编码器经配置以:译码视频数据的切片的切片标头,其中所述切片标头包含指示用于长期参考图片的识别信息是明确地在所述切片标头中经发信还是从对应于所述切片的序列参数集导出的语法元素,且,在所述语法元素指示用于所述长期参考图片的所述识别信息是明确地经发信时,译码所述切片标头中用于所述长期参考图片的所述识别信息的值。
在一些实例中,视频编码器20可通过在作用中SPS或切片标头中仅发信长期参考图片的POC值的LSB中的一些LSB而发信长期参考图片的识别信息。然而,在一些情况下,两个LTRP可具有相同的POC LSB,因此视频编码器20可能另外发信LTRP的POC值的MSB中的一些MSB。
在本发明的技术的另一实例中,视频编码器20可在当前切片标头的语法元素内发信用以预测当前切片的像素值的LTRP的列表。视频编码器20可按译码次序译码用于多个图片的数据。所述数据可指示所述多个图片中的每一者可用于用作LTRP。视频编码器20可译码当前图片的切片标头中的语法元素,所述语法元素包含用于所述多个图片的相应图片次序计数(POC)值的最低有效位(LSB)的值,使得用于LSB的值按图片译码次序为非递减的或非递增的。
基于在SPS、PPS及切片标头中发信的参考图片,视频编码器20构造参考图片列表,例如RefPicSetStCurrBefore、RefPicSetStCurrAfter、RefPicSetStFoll、RefPicSetLtCurr及RefPicSetLtFoll参考图片列表。视频编码器20可基于参考图片的POC值构造参考图片列表。基于所述五个参考图片列表,视频编码器20还可构造RefPicList0及RefPicList1参考图片列表。视频编码器20可使用RefPicList0及RefPicList1中所包含的参考图片来预测经双向预测的块的像素值,及使用RefPicList0的参考图片来预测经单向预测的块的像素值。
图3为说明可实施用于在SPS或切片标头中发信用于LTRP的数据的技术的视频解码器30的实例的框图。在图3的实例中,视频解码器30包含熵解码单元70、运动补偿单元72、帧内预测单元74、反量化单元76、反变换单元78、参考图片存储器82及求和器80。在一些实例中,视频解码器30可执行一般来说与关于视频编码器20(图2)描述的编码遍次互逆的解码遍次。运动补偿单元72可基于从熵解码单元70接收的运动向量产生预测数据,而帧内预测单元74可基于从熵解码单元70接收的帧内预测模式指示符产生预测数据。
在解码过程期间,视频解码器30从视频编码器20接收表示经编码视频切片的视频块及相关联语法元素的经编码视频位流。视频解码器30的熵解码单元70熵解码位流以产生经量化的系数、运动向量或帧内预测模式指示符及其它语法元素。熵解码单元70将运动向量及其它语法元素转发到运动补偿单元72。视频解码器30可以接收视频切片等级及/或视频块等级的语法元素。
当视频切片经译码为经帧内译码(I)切片时,帧内预测单元74可以基于经发信的帧内预测模式及来自当前帧或图片的先前经解码块的数据产生用于当前视频切片的视频块的预测数据。当视频帧经译码为经帧间译码(例如,B、P或GPB)切片时,运动补偿单元72基于从熵解码单元70接收的运动向量及其它语法元素产生用于当前视频切片的视频块的预测性块。可以从参考图片列表中的一者内的参考图片中的一者产生预测性块。视频解码器30可以基于存储在参考图片存储器82中的参考图片使用默认构造技术构造参考帧列表--列表0及列表1。
运动补偿单元72通过剖析运动向量及其它语法元素确定用于当前视频切片的视频块的预测信息,并且使用所述预测信息产生用于经解码的当前视频块的预测性块。举例来说,运动补偿单元72使用所接收语法元素中的一些语法元素确定用于译码视频切片的视频块的预测模式(例如,帧内预测或帧间预测)、帧间预测切片类型(例如,B切片、P切片或GPB切片)、切片的参考图片列表中的一或多者的构造信息、切片的每一经帧间编码的视频块的运动向量、切片的每一经帧间译码的视频块的帧间预测状态,及用以解码当前视频切片中的视频块的其它信息。
运动补偿单元72还可基于内插滤波器执行内插。运动补偿单元72可使用由视频编码器20在编码视频块期间使用的内插滤波器来计算参考块的子整数像素的内插值。在此情况下,运动补偿单元72可根据所接收语法元素确定由视频编码器20使用的内插滤波器且使用所述内插滤波器来产生预测性块。
反量化单元76将提供于位流中且由熵解码单元70解码的经量化的变换系数反量化,即,解量化。反量化过程可包含使用由视频解码器30针对视频切片中的每一视频块计算以确定应应用的量化程度及同样的反量化程度的量化参数QPY
反变换单元78对变换系数应用反变换,例如反DCT、反整数变换或概念上类似的反变换过程,以便产生像素域中的残余块。
在运动补偿单元72基于运动向量及其它语法元素产生了当前视频块的预测性块之后,视频解码器30通过将来自反变换单元78的残余块与由运动补偿单元72产生的相对应的预测性块加总来形成经解码视频块。求和器80表示执行此加总运算的一或多个组件。必要时,还可应用解块滤波器以对经解码块进行滤波以便去除方块效应假影。其它环路滤波器(在译码环路中或在译码环路之后)也可用于使像素转变平滑或者以其它方式改善视频质量。接着将给定帧或图片中的经解码视频块存储在参考图片存储器82中,参考图片存储器82存储用于后续运动补偿的参考图片。参考图片存储器82还存储经解码视频以用于稍后在显示装置(例如,图1的显示装置32)上呈现。
如上文所描述,在帧间预测期间,运动补偿单元72可确定视频解码器30可用来形成用于经解码的当前块的预测性视频块的一或多个参考图片。运动补偿单元72可基于经译码视频位流的指示参考图片是标记用于长期参考还是短期参考的语法元素确定参考图片为长期参考图片还是短期参考图片。运动补偿单元72可将所述参考图片存储在经解码图片缓冲器(DPB)中,直到所述图片经标记为不用于参考为止。
视频解码器30的运动补偿单元72可解码各种语法元素,包含用以形成用于当前解码块的预测性块的一或多个参考图片的识别信息。在解码经帧间预测的PU期间,运动补偿单元72可解码在作用中序列参数集中发信的用于当前图片的一或多个LTRP的识别信息。运动补偿单元72还可解码当前图片的切片标头或当前图片的图片参数集中用于预测当前图片的一或多个短期参考图片的识别信息。在一些实例中,所述语法元素可指示切片标头是否从作用中序列参数集继承了长期参考图片,或长期参考图片的识别信息是否明确地在切片标头中经发信。
以此方式,图3中的视频解码器30的运动补偿单元72表示一种视频解码器的实例,所述视频解码器经配置以:译码视频数据的切片的切片标头,其中所述切片标头包含指示用于长期参考图片的识别信息是明确地在所述切片标头中经发信还是从对应于所述切片的序列参数集导出的语法元素,且,在所述语法元素指示用于所述长期参考图片的所述识别信息是明确地经发信时,译码所述切片标头中用于所述长期参考图片的所述识别信息的值。
在一些实例中,视频解码器30可基于在作用中SPS或切片标头中发信的长期参考图片的POC值的LSB中的仅一些LSB而解码长期参考图片的识别信息。然而,在一些情况下,两个LTRP可具有相同的POC LSB,因此视频编码器20可另外解码LTRP的POC值的MSB中的一些MSB以消除具有相同POC LSB的LTRP的歧义。
在本发明的技术的另一实例中,视频解码器30可译码当前切片标头的语法元素内用以预测当前切片的像素值的LTRP的列表。视频解码器30可按译码次序译码用于多个图片的数据。所述数据可指示所述多个图片中的每一者可用于用作LTRP。视频解码器30可译码当前图片的切片标头中的语法元素,所述语法元素包含用于所述多个图片的相应图片次序计数(POC)值的最低有效位(LSB)的值,使得用于LSB的值按图片译码次序为非递减的或非递增的。
基于在SPS、PPS及切片标头中发信的参考图片,视频解码器30构造参考图片子集,例如RefPicSetStCurrBefore、RefPicSetStCurrAfter、RefPicSetStFoll、RefPicSetLtCurr及RefPicSetLtFoll参考图片子集。视频解码器30可基于参考图片的POC值构造参考图片列表。基于所述五个参考图片列表,视频解码器30还可构造RefPicList0及RefPicList1参考图片列表。视频解码器30可使用RefPicList0及RefPicList1中所包含的参考图片来预测经双向预测的块的像素值,及使用RefPicList0的参考图片来预测经单向预测的块的像素值。
图4为说明根据本发明中描述的一或多个实例的用于译码用于参考图片的数据的过程的流程图。仅出于说明的目的,图4的方法可由对应于视频编码器20或视频解码器30的视频译码器来执行。在图4的方法中,视频译码器可译码作用中序列参数集(SPS)中用于长期参考图片的识别信息(100)。在一些实例中,识别信息可包含用于LTRP的POC值的LSB。
视频译码器还可译码一或多个语法元素,包含用于当前经译码的图片的SPS及切片标头中的一或多个短期参考图片的识别信息(102)。
除译码SPS中用于LTRP的识别信息之外,视频译码器还可译码当前译码图片的当前切片标头中用于LTRP的识别信息(104)。切片标头可包含包括用于当前切片的LTRP的列表的语法元素。在一些实例中,列表中的至少一些LTRP是从作用中SPS继承而来,且列表中的一些LTRP是在当前切片标头中经译码。下文关于图5更详细地描述译码继承的SPS的过程。
在译码LTRP及STRP之后,视频译码器可构造参考图片子集。在一些实例中,参考图片子集例如RefPicSetStCurrBefore、RefPicSetStCurrAfter、RefPicSetStFoll、RefPicSetLtCurr及RefPicSetLtFoll参考图片子集(106)。基于所述参考图片子集,视频译码器构造参考图片列表RefPicList0及RefPicList1(108)。视频译码器可使用默认构造技术来构造参考图片列表。视频译码器还可基于指定参考图片的不同次序的语法元素修改RefPicList0及RefPicList1中的参考图片的次序。
在构造参考图片列表之后,视频译码器可基于参考图片列表中的参考图片形成用于当前译码图片的预测性块(110)。在编码期间,视频译码器可使用长期参考图片预测切片的视频数据的一部分且基于所述预测译码视频数据的部分(112)。
图5为说明根据本发明中描述的一或多个实例的用于译码SPS或切片标头中用于LTRP的数据的过程的流程图。仅出于说明的目的,图5的方法可由对应于视频编码器20或视频解码器30的视频译码器来执行。在图5的方法中,视频译码器可译码用于视频数据的切片的切片标头(120)。在一些实例中,切片标头可为用于当前译码图片的切片标头。
切片标头包含指示用于LTRP的识别信息是明确地在切片标头中经发信还是从对应于切片的序列参数集导出的语法元素。如果所述语法元素指示用于LTRP的识别信息是明确地经发信,那么视频译码器可译码切片标头中用于长期参考图片的识别信息的值(122)。如果所述语法元素并不指示用于LTRP的识别信息是明确地经发信,那么当所述语法元素指示用于长期参考图片的识别信息未经明确地发信时,视频译码器可从序列参数集导出用于LTRP的识别信息(124)。
在一些实例中,经配置以执行图5的过程的视频译码装置可经进一步配置以将对应于第一图片的第一经解码图片存储在经解码图片缓冲器中。当经解码图片缓冲器含有经标记为“用于参考”且图片次序计数(POC)的最低有效位(LSB)的值与第一图片相同的一个以上参考图片时,为了译码识别信息,所述装置经进一步配置以在第二图片的切片的切片标头中将第一语法元素译码为等于1。当经解码图片缓冲器并不含有经标记为“用于参考”且POC LSB值与第一图片相同的一个以上图片时,为了译码识别信息,所述装置可经配置以在切片标头中将第一语法元素译码为等于零。当第一语法元素等于1时,为了译码识别信息,所述装置经进一步配置以译码指示第一图片的POC值的最高有效位(MSB)的第二语法元素,且使用第一图片作为长期参考图片译码第二图片。
在一些实例中,经配置以执行图5的过程的视频译码器可经进一步配置以按图片译码次序译码用于多个图片的数据。所述数据可指示所述多个图片各自可用于用作长期参考图片。视频译码器还可译码所述多个图片的图片次序计数(POC)值的最低有效位(LSB)的值,使得用于LSB的值按图片译码次序为非递减或非递增的。
在另一实例中,为了译码用于LSB的值,视频译码器可经配置以译码用于LSB的值,例如,针对在0到长期参考图片的数目减1的范围内的j及k的任何值(其中j及k为整数),参考图片列表中位置j处的所述多个图片中的第一图片的POC值的LSB大于或等于或小于等于参考图片列表中位置k处的所述多个图片中的第二图片的POC值的LSB。视频译码器可进一步经配置以译码包含指示LTRP的数目的信息的SPS。
在又一实例中,用于所述多个图片的数据可进一步指示所述多个图片是否用于参考,且对于经指示为用于参考的所述多个图片中的每一者,所述数据可进一步包含用于确定是否译码用于所述图片中的每一者的POC值的最高有效位(MSB)的值的数据。
在另一实例中,视频译码器可确定DeltaPocMSBCycleLt变量值,其中当所述多个图片中的一者具有等于序列参数集中指定的长期参考图片的数目的译码次序值时,所述多个图片中的所述图片的DeltaPocMSBCycleLt的值等于用于所述多个图片中的所述图片的语法元素delta_poc_msb_cycle_lt的值。
应认识到,取决于实例,本文中所描述的技术中的任一者的某些动作或事件可用不同顺序来执行,可添加、合并或全部省略(例如,实践所述技术未必需要所有所描述动作或事件)。此外,在某些实例中,可例如通过多线程处理、中断处理或多个处理器同时而非依序执行动作或事件。
在一或多个实例中,所描述功能可以硬件、软件、固件或其任何组合来实施。如果以软件来实施,那么所述功能可以作为一或多个指令或代码存储在计算机可读媒体上或经由计算机可读媒体予以传输,并且由基于硬件的处理单元执行。计算机可读媒体可包含计算机可读存储媒体,其对应于有形媒体,例如数据存储媒体,或包含促进将计算机程序从一处传送到另一处的任何媒体(例如,根据通信协议)的通信媒体。以此方式,计算机可读媒体一般可以对应于(1)有形计算机可读存储媒体,其为非暂时性的,或(2)通信媒体,例如信号或载波。数据存储媒体可以是可由一或多个计算机或一或多个处理器存取以检索用于实施本发明中描述的技术的指令、代码及/或数据结构的任何可用的媒体。计算机程序产品可包含计算机可读媒体。
以实例说明而非限制,此类计算机可读存储媒体可包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁性存储装置、快闪存储器,或可用以存储呈指令或数据结构形式的所要程序代码且可由计算机存取的任何其它媒体。而且,可恰当地将任何连接称作计算机可读媒体。举例来说,如果使用同轴电缆、光缆、双绞线、数字订户线(DSL)或例如红外线、无线电及微波等无线技术从网站、服务器或其它远程源传输指令,那么同轴电缆、光缆、双绞线、DSL或例如红外线、无线电及微波等无线技术包含在媒体的定义中。然而,应理解,计算机可读存储媒体及数据存储媒体并不包含连接、载波、信号或其它暂时性媒体,而是实际上针对非暂时性的有形存储媒体。如本文所使用,磁盘及光盘包含压缩光盘(CD)、激光光盘、光学光盘、数字影音光盘(DVD)、软性磁盘及蓝光光盘,其中磁盘通常以磁性方式再现数据,而光盘用激光以光学方式再现数据。上述各者的组合也应包含在计算机可读媒体的范围内。
指令可以由一或多个处理器执行,所述一或多个处理器例如一或多个数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA)、或其它等效的集成或离散逻辑电路。因此,如本文中所使用的术语“处理器”可指上述结构或适合于实施本文中所描述的技术的任何其它结构中的任一者。另外,在一些方面中,本文所描述的功能性可以提供于经配置用于编码及解码的专用硬件及/或软件模块内,或者并入于组合编码解码器中。并且,可将所述技术完全实施于一或多个电路或逻辑元件中。
本发明的技术可以在广泛多种装置或设备中实施,包含无线手持机、集成电路(IC)或一组IC(例如,芯片组)。本发明中描述各种组件、模块或单元是为了强调经配置以执行所揭示技术的装置的功能方面,但未必需要通过不同硬件单元来实现。实际上,如上文所描述,各种单元可以结合合适的软件及/或固件组合在编码解码器硬件单元中,或者通过互操作硬件单元的集合来提供,所述硬件单元包含如上文所描述的一或多个处理器。
已描述各种实例。这些及其它实例在所附权利要求书的范围内。

Claims (61)

1.一种解码视频数据的方法,所述方法包括:
解码视频数据的切片的切片标头,其中所述切片标头包含包括用于长期参考图片的识别信息的语法元素,其中所述识别信息是明确地在所述切片标头中经发信或从对应于所述切片的序列参数集导出;以及
当所述语法元素指示用于所述长期参考图片的所述识别信息是明确地经发信时,其中解码所述切片标头进一步包括解码所述切片标头中用于所述长期参考图片的所述识别信息的值。
2.根据权利要求1所述的方法,其中所述长期参考图片包括第一图片,所述方法进一步包括:
将对应于所述第一图片的第一经解码图片存储在经解码图片缓冲器中;
当所述经解码图片缓冲器含有经标记为“用于参考”且图片次序计数POC的最低有效位LSB的值与所述第一图片相同的一个以上参考图片时,其中解码所述识别信息进一步包括:解码第二图片的切片的所述切片标头中等于1的第一语法元素;
当所述经解码图片缓冲器并不含有经标记为“用于参考”且POC LSB值与所述第一图片相同的一个以上图片时,其中解码所述识别信息进一步包括:解码所述切片标头中等于零的所述第一语法元素;以及
当所述第一语法元素等于1时,解码所述识别信息进一步包括:解码指示所述第一图片的POC值的最高有效位MSB的第二语法元素;以及
使用所述第一图片作为长期参考图片解码所述第二图片。
3.根据权利要求1所述的方法,其进一步包括:
当所述语法元素指示用于所述长期参考图片的所述识别信息未明确地经发信时,从所述序列参数集导出用于所述长期参考图片的所述识别信息。
4.根据权利要求1所述的方法,其中所述切片为当前图片的切片,所述方法进一步包括:
按图片译码次序解码用于多个图片的数据,其中所述数据指示所述多个图片中的每一者可用于用作长期参考图片;以及
解码所述当前图片的所述切片标头中的语法元素,其中所述语法元素包含用于所述多个图片的相应图片次序计数POC值的最低有效位LSB的值,使得用于所述LSB的所述值按所述图片译码次序为非递减的或非递增的。
5.根据权利要求4所述的方法,其中解码用于所述LSB的所述值包括解码所述LSB的所述值以使得对于j及k的任何值,其中j及k为在零到从所述序列参数集导出的长期参考图片的数目减1的范围内的整数,所述切片标头中经发信的参考图片列表中位置j处的所述多个图片中的第一图片的所述POC值的所述LSB大于或等于所述参考图片列表中位置k处的所述多个图片中的第二图片的所述POC值的所述LSB。
6.根据权利要求5所述的方法,其进一步包括解码包含指示长期参考图片的所述数目的信息的所述序列参数集。
7.根据权利要求4所述的方法,其中解码用于所述LSB的所述值包括解码所述LSB的所述值以使得对于j及k的任何值,其中j及k为在零到从所述序列参数集导出的长期参考图片的数目减1的范围内的整数,所述切片标头中经发信的参考图片列表中位置j处的所述多个图片中的第一图片的所述POC值的所述LSB小于或等于所述参考图片列表中位置k处的所述多个图片中的第二图片的所述POC值的所述LSB。
8.根据权利要求7所述的方法,其进一步包括解码包含指示长期参考图片的所述数目的信息的所述序列参数集。
9.根据权利要求4所述的方法,其中所述数据进一步指示所述多个图片的所述POC值的最高有效位MSB的值。
10.根据权利要求4所述的方法,其中当所述多个图片中的一者具有等于从所述序列参数集继承而来的长期参考图片的数目的译码次序值时,用于所述多个图片中的所述图片的DeltaPocMSBCycleLt的值等于用于所述多个图片中的所述一者的语法元素delta_poc_msb_cycle_lt的值。
11.根据权利要求10所述的方法,其中所述长期参考图片包括第一图片,其中解码进一步包括使用所述第一图片作为长期参考图片解码第二图片。
12.根据权利要求1所述的方法,其进一步包括使用所述长期参考图片预测所述切片的所述视频数据的一部分及基于所述预测解码所述视频数据的所述部分。
13.一种编码视频数据的方法,所述方法包括:
编码视频数据的切片的切片标头,其中所述切片标头包含包括用于长期参考图片的识别信息的语法元素,其中所述识别信息是明确地在所述切片标头中经发信或从对应于所述切片的序列参数集导出;以及
当所述语法元素指示用于所述长期参考图片的所述识别信息是明确地经发信时,其中编码所述切片标头进一步包括编码所述切片标头中用于所述长期参考图片的所述识别信息的值。
14.根据权利要求13所述的方法,其中所述长期参考图片包括第一图片,所述方法进一步包括:
将对应于所述第一图片的第一经解码图片存储在经解码图片缓冲器中;
当所述经解码图片缓冲器含有经标记为“用于参考”且图片次序计数POC的最低有效位LSB的值与所述第一图片相同的一个以上参考图片时,其中编码所述识别信息进一步包括:在第二图片的切片的所述切片标头中将第一语法元素编码为等于1;
当所述经解码图片缓冲器并不含有经标记为“用于参考”且POC LSB值与所述第一图片相同的一个以上图片时,其中编码所述识别信息进一步包括:在所述切片标头中将所述第一语法元素编码为等于零;以及
当所述第一语法元素等于1时,编码所述识别信息进一步包括:编码指示所述第一图片的POC值的最高有效位MSB的第二语法元素;以及
使用所述第一图片作为长期参考图片编码所述第二图片。
15.根据权利要求13所述的方法,其进一步包括:
当所述语法元素指示用于所述长期参考图片的所述识别信息未明确地经发信时,从所述序列参数集导出用于所述长期参考图片的所述识别信息。
16.根据权利要求13所述的方法,其中所述切片为当前图片的切片,所述方法进一步包括:
按图片译码次序编码用于多个图片的数据,其中所述数据指示所述多个图片中的每一者可用于用作长期参考图片;以及
编码所述当前图片的所述切片标头中的语法元素,其中所述语法元素包含用于所述多个图片的相应图片次序计数POC值的最低有效位LSB的值,使得用于所述LSB的所述值按所述图片译码次序为非递减的或非递增的。
17.根据权利要求16所述的方法,其中编码用于所述LSB的所述值包括编码所述LSB的所述值以使得对于j及k的任何值,其中j及k为在零到从所述序列参数集导出的长期参考图片的数目减1的范围内的整数,所述切片标头中经发信的参考图片列表中位置j处的所述多个图片中的第一图片的所述POC值的所述LSB大于或等于所述参考图片列表中位置k处的所述多个图片中的第二图片的所述POC值的所述LSB。
18.根据权利要求17所述的方法,其进一步包括编码包含指示长期参考图片的所述数目的信息的所述序列参数集。
19.根据权利要求16所述的方法,其中编码用于所述LSB的所述值包括编码所述LSB的所述值以使得对于j及k的任何值,其中j及k为在零到从所述序列参数集导出的长期参考图片的数目减1的范围内的整数,所述切片标头中经发信的参考图片列表中位置j处的所述多个图片中的第一图片的所述POC值的所述LSB小于或等于所述参考图片列表中位置k处的所述多个图片中的第二图片的所述POC值的所述LSB。
20.根据权利要求19所述的方法,其进一步包括编码包含指示长期参考图片的所述数目的信息的所述序列参数集。
21.根据权利要求16所述的方法,其中所述数据进一步指示所述多个图片的所述POC值的最高有效位MSB的值。
22.根据权利要求16所述的方法,其中当所述多个图片中的一者具有等于从所述序列参数集继承而来的长期参考图片的数目的译码次序值时,用于所述多个图片中的所述图片的DeltaPocMSBCycleLt的值等于用于所述多个图片中的所述一者的语法元素delta_poc_msb_cycle_lt的值。
23.根据权利要求13所述的方法,其中所述长期参考图片包括第一图片,其中编码进一步包括使用所述第一图片作为长期参考图片编码第二图片。
24.根据权利要求13所述的方法,其进一步包括使用所述长期参考图片预测所述切片的所述视频数据的一部分及基于所述预测编码所述视频数据的所述部分。
25.一种用于译码视频的装置,所述装置包括:
用于译码视频数据的切片的切片标头的装置,其中所述切片标头包含包括用于长期参考图片的识别信息的语法元素,其中所述识别信息是明确地在所述切片标头中经发信或从对应于所述切片的序列参数集导出;以及
用于在所述语法元素指示用于所述长期参考图片的所述识别信息是明确地经发信时进行操作的装置,其中译码所述切片标头进一步包括译码所述切片标头中用于所述长期参考图片的所述识别信息的值。
26.根据权利要求25所述的装置,其进一步包括:
用于在所述语法元素指示用于所述长期参考图片的所述识别信息未明确地经发信时,从所述序列参数集导出用于所述长期参考图片的所述识别信息的装置。
27.根据权利要求25所述的装置,所述装置进一步包括:
用于按图片译码次序译码用于多个图片的数据的装置,其中所述数据指示所述多个图片中的每一者可用于用作长期参考图片;以及
用于译码所述当前图片的所述切片标头中的语法元素的装置,其中所述语法元素包含用于所述多个图片的相应图片次序计数POC值的最低有效位LSB的值,使得用于所述LSB的所述值按所述图片译码次序为非递减的或非递增的。
28.根据权利要求25所述的装置,其中用于译码用于所述LSB的所述值的所述装置包括用于译码用于所述LSB的所述值以使得满足以下情形的装置:对于j及k的任何值,其中j及k为在零到从所述序列参数集导出的长期参考图片的数目减1的范围内的整数,所述切片标头中经发信的参考图片列表中位置j处的所述多个图片中的第一图片的所述POC值的所述LSB大于或等于所述参考图片列表中位置k处的所述多个图片中的第二图片的所述POC值的所述LSB。
29.根据权利要求28所述的装置,其进一步包括用于译码包含指示长期参考图片的所述数目的信息的序列参数集的装置。
30.根据权利要求27所述的装置,其中用于译码用于所述LSB的所述值的所述装置包括用于译码用于所述LSB的所述值以使得满足以下情形的装置:对于j及k的任何值,其中j及k为在零到从所述序列参数集导出的长期参考图片的数目减1的范围内的整数,所述切片标头中经发信的参考图片列表中位置j处的所述多个图片中的第一图片的所述POC值的所述LSB小于或等于所述参考图片列表中位置k处的所述多个图片中的第二图片的所述POC值的所述LSB。
31.根据权利要求30所述的装置,其进一步包括用于译码包含指示长期参考图片的所述数目的信息的序列参数集的装置。
32.根据权利要求31所述的装置,其中所述数据进一步指示所述多个图片的所述POC值的最高有效位MSB的值。
33.根据权利要求27所述的装置,其中当所述多个图片中的一者具有等于从所述序列参数集继承而来的长期参考图片的数目的译码次序值时,用于所述多个图片中的所述图片的DeltaPocMSBCycleLt的值等于用于所述多个图片中的所述一者的语法元素delta_poc_msb_cycle_lt的值。
34.根据权利要求25所述的装置,其中所述长期参考图片包括第一图片,其中译码包括用于使用所述第一图片作为长期参考图片解码第二图片的装置。
35.根据权利要求25所述的装置,其中所述长期参考图片包括第一图片,其中用于译码的所述装置包括用于使用所述第一图片作为长期参考图片编码第二图片的装置。
36.根据权利要求25所述的装置,其进一步包括用于使用所述长期参考图片预测所述切片的所述视频数据的一部分的装置及用于基于所述预测译码所述视频数据的所述部分的装置。
37.一种用于译码视频数据的装置,所述装置包括经配置以进行以下操作的视频译码器:
译码视频数据的切片的切片标头,其中所述切片标头包含包括用于长期参考图片的识别信息的语法元素,其中所述识别信息是明确地在所述切片标头中经发信或从对应于所述切片的序列参数集导出;以及
当所述语法元素指示用于所述长期参考图片的所述识别信息是明确地经发信时,为了译码所述切片标头,所述装置经进一步配置以译码所述切片标头中用于所述长期参考图片的所述识别信息的值。
38.根据权利要求37所述的装置,其中所述长期参考图片包括第一图片,其中所述装置经进一步配置以进行以下操作:
将对应于所述第一图片的第一经解码图片存储在经解码图片缓冲器中;
当所述经解码图片缓冲器含有经标记为“用于参考”且图片次序计数POC的最低有效位LSB的值与所述第一图片相同的一个以上参考图片时,为了译码所述识别信息,所述装置经进一步配置以:在第二图片的切片的所述切片标头中将第一语法元素译码为等于1;
当所述经解码图片缓冲器并不含有经标记为“用于参考”且POC LSB值与所述第一图片相同的一个以上图片时,为了译码所述识别信息,所述装置经进一步配置以:在所述切片标头中将所述第一语法元素译码为等于零;以及
当所述第一语法元素等于1时,为了译码所述识别信息,所述装置经进一步配置以:译码指示所述第一图片的POC值的最高有效位MSB的第二语法元素;以及
使用所述第一图片作为长期参考图片译码所述第二图片。
39.根据权利要求37所述的装置,其中所述装置经进一步配置以:
当所述语法元素指示用于所述长期参考图片的所述识别信息未明确地经发信时,从所述序列参数集导出用于所述长期参考图片的所述识别信息。
40.根据权利要求37所述的装置,其中所述装置经进一步配置以:
按图片译码次序译码用于多个图片的数据,其中所述数据指示所述多个图片各自可用于用作长期参考图片;以及
译码所述多个图片的图片次序计数POC值的最低有效位LSB的值,使得用于所述LSB的所述值按所述图片译码次序为非递减的或非递增的。
41.根据权利要求40所述的装置,其中为了译码用于所述LSB的所述值,所述装置经配置以译码用于所述LSB的所述值以使得对于j及k的任何值,其中j及k为在零到从所述序列参数集导出的长期参考图片的数目减1的范围内的整数,所述切片标头中经发信的参考图片列表中位置j处的所述多个图片中的第一图片的所述POC值的所述LSB大于或等于所述参考图片列表中位置k处的所述多个图片中的第二图片的所述POC值的所述LSB。
42.根据权利要求41所述的装置,其中所述装置经进一步配置以译码包含指示长期参考图片的所述数目的信息的序列参数集。
43.根据权利要求40所述的装置,其中为了译码用于所述LSB的所述值,所述装置经配置以译码用于所述LSB的所述值以使得对于j及k的任何值,其中j及k为在零到从所述序列参数集导出的长期参考图片的数目减1的范围内的整数,所述切片标头中经发信的参考图片列表中位置j处的所述多个图片中的第一图片的所述POC值的所述LSB小于或等于所述切片标头中经发信的所述参考图片列表中位置k处的所述多个图片中的第二图片的所述POC值的所述LSB。
44.根据权利要求43所述的装置,其进一步包括译码包含指示长期参考图片的所述数目的信息的序列参数集。
45.根据权利要求40所述的装置,其中所述数据进一步指示所述多个图片的所述POC值的最高有效位MSB的值。
46.根据权利要求40所述的装置,其中当所述多个图片中的一者具有等于从所述序列参数集继承而来的长期参考图片的数目的译码次序值时,用于所述多个图片中的所述图片的DeltaPocMSBCycleLt的值等于用于所述多个图片中的所述一者的语法元素delta_poc_msb_cycle_lt的值。
47.根据权利要求38所述的装置,其中所述长期参考图片包括第一图片,其中为了译码,所述装置经配置以使用所述第一图片作为长期参考图片解码第二图片。
48.根据权利要求38所述的装置,其中所述长期参考图片包括第一图片,其中为了译码,所述装置经配置以使用所述第一图片作为长期参考图片编码第二图片。
49.根据权利要求38所述的装置,其中所述装置包括以下各者中的至少一者:
集成电路;
微处理器;以及
无线通信装置。
50.根据权利要求38所述的装置,其中所述装置经进一步配置以使用所述长期参考图片预测所述切片的所述视频数据的一部分及基于所述预测译码所述视频数据的所述部分。
51.一种非暂时性计算机可读存储媒体,其具有存储于其上的指令,所述指令在被执行时致使处理器进行以下操作:
译码视频数据的切片的切片标头,其中所述切片标头包含指示用于长期参考图片的识别信息是明确地在所述切片标头中经发信还是从对应于所述切片的序列参数集导出的语法元素;以及
当所述语法元素指示用于所述长期参考图片的所述识别信息是明确地经发信时,为了译码所述切片标头,所述指令致使所述处理器译码所述切片标头中用于所述长期参考图片的所述识别信息的值。
52.根据权利要求51所述的计算机可读媒体,其进一步包括致使所述处理器进行以下操作的指令:
当所述语法元素指示用于所述长期参考图片的所述识别信息未明确地经发信时,从所述序列参数集导出用于所述长期参考图片的所述识别信息。
53.根据权利要求51所述的计算机可读存储器,其进一步包括致使所述处理器进行以下操作的指令:
按图片译码次序译码用于多个图片的数据,其中所述数据指示所述多个图片各自可用于用作长期参考图片;以及
译码所述多个图片的图片次序计数POC值的最低有效位LSB的值,使得用于所述LSB的所述值按所述图片译码次序为非递减的或非递增的。
54.根据权利要求53所述的计算机可读媒体,其中致使所述处理器译码用于所述LSB的所述值的所述指令包括致使所述处理器进行以下操作的指令:译码用于所述LSB的所述值以使得对于j及k的任何值,其中j及k为在零到从所述序列参数集导出的长期参考图片的数目减1的范围内的整数,所述切片标头中经发信的参考图片列表中位置j处的所述多个图片中的第一图片的所述POC值的所述LSB大于或等于所述参考图片列表中位置k处的所述多个图片中的第二图片的所述POC值的所述LSB。
55.根据权利要求54所述的计算机可读媒体,其进一步包括致使所述处理器进行以下操作的指令:译码包含指示长期参考图片的所述数目的信息的序列参数集。
56.根据权利要求53所述的计算机可读媒体,其中致使所述处理器译码用于所述LSB的所述值的所述指令包括致使所述处理器进行以下操作的指令:译码用于所述LSB的所述值以使得对于j及k的任何值,其中j及k为在零到从所述序列参数集导出的长期参考图片的数目减1的范围内的整数,所述切片标头中经发信的参考图片列表中位置j处的所述多个图片中的第一图片的所述POC值的所述LSB小于或等于所述参考图片列表中位置k处的所述多个图片中的第二图片的所述POC值的所述LSB。
57.根据权利要求56所述的计算机可读媒体,其进一步包括在被执行时致使所述处理器进行以下操作的指令:译码包含指示长期参考图片的所述数目的信息的序列参数集。
58.根据权利要求53所述的计算机可读媒体,其中所述数据进一步包含所述多个图片的所述POC值的最高有效位MSB的值。
59.根据权利要求53所述的计算机可读媒体,其中当所述多个图片中的一者具有等于从所述序列参数集继承而来的长期参考图片的数目的译码次序值时,用于所述多个图片中的所述图片的DeltaPocMSBCycleLt的值等于用于所述多个图片中的所述一者的语法元素delta_poc_msb_cycle_lt的值。
60.根据权利要求51所述的计算机可读媒体,其中所述长期参考图片包括第一图片,其中致使所述处理器译码的所述指令包括致使所述处理器进行以下操作的指令:使用所述第一图片作为长期参考图片解码第二图片。
61.根据权利要求51所述的计算机可读媒体,其中所述长期参考图片包括第一图片,其中致使所述处理器译码的所述指令包括致使所述处理器进行以下操作的指令:使用所述第一图片作为长期参考图片编码第二图片。
CN201380029757.7A 2012-06-07 2013-05-14 发信用于视频译码的长期参考图片的数据 Active CN104365106B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201261656877P 2012-06-07 2012-06-07
US61/656,877 2012-06-07
US13/828,354 US9319679B2 (en) 2012-06-07 2013-03-14 Signaling data for long term reference pictures for video coding
US13/828,354 2013-03-14
PCT/US2013/040938 WO2013184305A1 (en) 2012-06-07 2013-05-14 Signaling data for long term reference pictures for video coding

Publications (2)

Publication Number Publication Date
CN104365106A true CN104365106A (zh) 2015-02-18
CN104365106B CN104365106B (zh) 2018-04-17

Family

ID=48614115

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201380029757.7A Active CN104365106B (zh) 2012-06-07 2013-05-14 发信用于视频译码的长期参考图片的数据

Country Status (17)

Country Link
US (1) US9319679B2 (zh)
EP (1) EP2859725A1 (zh)
JP (1) JP6162228B2 (zh)
KR (1) KR101676938B1 (zh)
CN (1) CN104365106B (zh)
AU (1) AU2013272130B2 (zh)
BR (1) BR112014030605B1 (zh)
CA (1) CA2873419C (zh)
HK (1) HK1203116A1 (zh)
IL (1) IL235632A (zh)
MX (1) MX353754B (zh)
MY (1) MY168265A (zh)
PH (1) PH12014502598A1 (zh)
RU (1) RU2635248C2 (zh)
SG (1) SG11201407369SA (zh)
WO (1) WO2013184305A1 (zh)
ZA (1) ZA201500075B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112740705A (zh) * 2018-09-21 2021-04-30 夏普株式会社 用于在视频编码中发送信号通知参考图片的系统和方法
CN112970265A (zh) * 2018-07-01 2021-06-15 夏普株式会社 用于发送信号通知编码视频中包括的图片的图片次序计数值的系统和方法
CN115209153A (zh) * 2019-09-24 2022-10-18 华为技术有限公司 编码器、解码器及对应方法

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103843349B (zh) 2011-08-25 2017-03-01 太阳专利托管公司 用于使用周期性缓冲器描述对视频进行编码和解码的方法和装置
CA2826418C (en) * 2011-09-07 2018-06-12 Panasonic Corporation Image coding method, image decoding method, image coding apparatus, image decoding apparatus, and image coding and decoding apparatus
MX2013009352A (es) 2011-09-19 2014-03-31 Panasonic Corp Metodo de codificacion de imagenes, metodo de decodificacion de imagenes, aparato de codificacion de imagenes, aparato de decodificacion de imagenes y aparato de codificacion y decodificacion de imagenes.
ES2827213T3 (es) 2011-10-19 2021-05-20 Sun Patent Trust Procedimiento de codificación de imágenes y dispositivo de codificación de imágenes
US20130188709A1 (en) * 2012-01-25 2013-07-25 Sachin G. Deshpande Video decoder for tiles with absolute signaling
US10051264B2 (en) 2012-04-20 2018-08-14 Qualcomm Incorporated Marking reference pictures in video sequences having broken link pictures
US9479776B2 (en) * 2012-07-02 2016-10-25 Qualcomm Incorporated Signaling of long-term reference pictures for video coding
US9584825B2 (en) * 2012-09-27 2017-02-28 Qualcomm Incorporated Long-term reference picture signaling in video coding
KR102212631B1 (ko) * 2013-05-24 2021-02-05 주식회사 케이티 멀티 레이어 구조에 있어서 움직임 정보의 유도 방법 및 이를 이용하는 장치
KR20180067598A (ko) * 2015-11-11 2018-06-20 삼성전자주식회사 영상을 부호화/복호화 하는 방법 및 그 장치
JP7278366B2 (ja) 2018-08-17 2023-05-19 ホアウェイ・テクノロジーズ・カンパニー・リミテッド ビデオコーディングにおける参照ピクチャ管理
KR20210122818A (ko) * 2019-02-28 2021-10-12 삼성전자주식회사 영상의 부호화 및 복호화 장치, 및 이에 의한 영상의 부호화 및 복호화 방법
WO2024080916A1 (en) * 2022-10-13 2024-04-18 Telefonaktiebolaget Lm Ericsson (Publ) Inter-predicted reference picture lists
WO2024080917A1 (en) * 2022-10-13 2024-04-18 Telefonaktiebolaget Lm Ericsson (Publ) Quantization parameter (qp) coding for video compression

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1455598A (zh) * 2002-05-03 2003-11-12 Lg电子株式会社 运动图像编码方法
CN101065780A (zh) * 2004-10-14 2007-10-31 诺基亚公司 视频编码中的参考图像管理
WO2008023967A1 (en) * 2006-08-25 2008-02-28 Lg Electronics Inc A method and apparatus for decoding/encoding a video signal
CN101449585A (zh) * 2006-03-30 2009-06-03 Lg电子株式会社 用于解码/编码视频信号的方法和装置
WO2010086500A1 (en) * 2009-01-28 2010-08-05 Nokia Corporation Method and apparatus for video coding and decoding
US20110249729A1 (en) * 2010-04-07 2011-10-13 Apple Inc. Error resilient hierarchical long term reference frames

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MY134659A (en) * 2002-11-06 2007-12-31 Nokia Corp Picture buffering for prediction references and display
FR2874292B1 (fr) * 2004-08-10 2007-01-26 Thales Sa Procede de mise en forme de trames d'une sequence video
RU2443074C2 (ru) * 2006-07-06 2012-02-20 Томсон Лайсенсинг Способ и устройство для отделения номера кадра и/или счетчика очередности изображения (рос) для мультивидового видеокодирования и видеодекодирования
EP2090110A2 (en) * 2006-10-13 2009-08-19 Thomson Licensing Reference picture list management syntax for multiple view video coding
KR101351935B1 (ko) * 2006-10-13 2014-01-17 톰슨 라이센싱 멀티뷰 비디오 코딩을 수반하는 참조 화상 관리를 위한 방법
EP2087741B1 (en) * 2006-10-16 2014-06-04 Nokia Corporation System and method for implementing efficient decoded buffer management in multi-view video coding
US20100266042A1 (en) * 2007-03-02 2010-10-21 Han Suh Koo Method and an apparatus for decoding/encoding a video signal
JP5574345B2 (ja) 2009-03-26 2014-08-20 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化方法、エラー検出方法、復号方法、符号化装置、エラー検出装置及び復号装置
US20110194613A1 (en) 2010-02-11 2011-08-11 Qualcomm Incorporated Video coding with large macroblocks
US9008176B2 (en) 2011-01-22 2015-04-14 Qualcomm Incorporated Combined reference picture list construction for video coding
CA2826418C (en) * 2011-09-07 2018-06-12 Panasonic Corporation Image coding method, image decoding method, image coding apparatus, image decoding apparatus, and image coding and decoding apparatus
TWI622288B (zh) * 2011-10-28 2018-04-21 三星電子股份有限公司 視訊解碼方法
US10003817B2 (en) * 2011-11-07 2018-06-19 Microsoft Technology Licensing, Llc Signaling of state information for a decoded picture buffer and reference picture lists

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1455598A (zh) * 2002-05-03 2003-11-12 Lg电子株式会社 运动图像编码方法
CN101065780A (zh) * 2004-10-14 2007-10-31 诺基亚公司 视频编码中的参考图像管理
CN101449585A (zh) * 2006-03-30 2009-06-03 Lg电子株式会社 用于解码/编码视频信号的方法和装置
WO2008023967A1 (en) * 2006-08-25 2008-02-28 Lg Electronics Inc A method and apparatus for decoding/encoding a video signal
WO2010086500A1 (en) * 2009-01-28 2010-08-05 Nokia Corporation Method and apparatus for video coding and decoding
US20110249729A1 (en) * 2010-04-07 2011-10-13 Apple Inc. Error resilient hierarchical long term reference frames

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
RAMASUBRAMONIAN A K ET AL: ""AHG15:Signaling of long-term Reference Pictures in SPS"", 《MOTION PICTURE EXPERT GROUP OR ISO/IEC JTC1/SC29/WG11,JCTVC-I0340R2》 *
SACHIN DESHPANDE ET AL: ""AHG21:Comments on Signaling or Reference Pictures"", 《JOINT COLLABORATIVE TEAM ON VIDEO CODING OF ISO/IEC JTC1/SC29/WG11 AND ITU-T SG.16, JCTVC-I0531》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112970265A (zh) * 2018-07-01 2021-06-15 夏普株式会社 用于发送信号通知编码视频中包括的图片的图片次序计数值的系统和方法
CN112740705A (zh) * 2018-09-21 2021-04-30 夏普株式会社 用于在视频编码中发送信号通知参考图片的系统和方法
CN115209153A (zh) * 2019-09-24 2022-10-18 华为技术有限公司 编码器、解码器及对应方法
CN115209153B (zh) * 2019-09-24 2023-06-06 华为技术有限公司 编码器、解码器及对应方法
US11968357B2 (en) 2019-09-24 2024-04-23 Huawei Technologies Co., Ltd. Apparatuses and methods for encoding and decoding based on syntax element values

Also Published As

Publication number Publication date
BR112014030605B1 (pt) 2023-04-11
JP6162228B2 (ja) 2017-07-12
CN104365106B (zh) 2018-04-17
IL235632A0 (en) 2015-01-29
HK1203116A1 (zh) 2015-10-16
RU2014153876A (ru) 2016-08-10
JP2015523012A (ja) 2015-08-06
MY168265A (en) 2018-10-16
US9319679B2 (en) 2016-04-19
US20130329787A1 (en) 2013-12-12
EP2859725A1 (en) 2015-04-15
KR20150024867A (ko) 2015-03-09
AU2013272130A1 (en) 2014-12-11
RU2635248C2 (ru) 2017-11-09
PH12014502598B1 (en) 2015-01-26
WO2013184305A1 (en) 2013-12-12
PH12014502598A1 (en) 2015-01-26
AU2013272130B2 (en) 2017-04-20
KR101676938B1 (ko) 2016-11-16
ZA201500075B (en) 2017-01-25
SG11201407369SA (en) 2015-02-27
IL235632A (en) 2017-01-31
BR112014030605A8 (pt) 2021-06-15
BR112014030605A2 (pt) 2017-06-27
CA2873419A1 (en) 2013-12-12
MX2014014919A (es) 2016-07-28
CA2873419C (en) 2018-02-06
MX353754B (es) 2018-01-26

Similar Documents

Publication Publication Date Title
CN104365106A (zh) 发信用于视频译码的长期参考图片的数据
CN105637866B (zh) 自适应色彩分量间残差预测
CN103947207B (zh) 用于图片分割方案的统一设计
CN104471942A (zh) 重新使用参数集用于视频译码
CN104704833A (zh) 多视图或3维视频译码中的高级视图间残差预测
CN104823449A (zh) 在视频译码中用信号表示关注区和逐渐解码刷新
CN104509115A (zh) 用于高效视频译码(hevc)和扩展的视频参数集
CN104221374A (zh) 在视频译码中分群经旁路译码语法元素
CN103828375A (zh) 通过参考图像集的子集进行的视频译码
CN104704843A (zh) 视频性质的指示
CN105103560A (zh) 用于仅高级语法可缩放视频译码的层间参考图片限制
CN104737537A (zh) 用于可缩放视频译码的加权预测模式
CN105284113A (zh) 分量间滤波
CN104904222A (zh) 对视频译码中的视频时序的图片次序计数与时序信息关系的信令
CN105580374B (zh) 一种对多层视频数据进行编解码的方法、视频解码设备及存储媒体
CN104221380A (zh) 用于并行运动估计的共同空间候选块
CN104025602A (zh) 三维视频译码中用信号通知视图合成预测支持
CN103597832A (zh) 用于使用相邻模式的视频译码的增强的帧内预测模式信令
CN104221381A (zh) 用于视频译码的波前并行处理
CN104584557A (zh) 构造用于多视图或3dv视频译码的参考图片列表
CN105409219A (zh) 高效率视频译码扩展中的目标输出层的选择
CN104396257A (zh) 在视频译码中长期参考图片的随机存取和发信
CN104205829A (zh) 合并信令及环路滤波器开/关信令
CN104756499A (zh) 用于视频译码的参考图片状态
CN105144716A (zh) 层间图片信令及相关过程

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1203116

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1203116

Country of ref document: HK