CN103416074A - 视频编解码器中的缓冲器管理 - Google Patents

视频编解码器中的缓冲器管理 Download PDF

Info

Publication number
CN103416074A
CN103416074A CN2012800119768A CN201280011976A CN103416074A CN 103416074 A CN103416074 A CN 103416074A CN 2012800119768 A CN2012800119768 A CN 2012800119768A CN 201280011976 A CN201280011976 A CN 201280011976A CN 103416074 A CN103416074 A CN 103416074A
Authority
CN
China
Prior art keywords
picture
order value
display order
decoding
odr
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012800119768A
Other languages
English (en)
Other versions
CN103416074B (zh
Inventor
陈盈
马尔塔·卡切维奇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of CN103416074A publication Critical patent/CN103416074A/zh
Application granted granted Critical
Publication of CN103416074B publication Critical patent/CN103416074B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44016Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving splicing one content stream with another content stream, e.g. for substituting a video clip
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/423Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation characterised by memory arrangements
    • H04N19/426Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation characterised by memory arrangements using memory downsizing methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/573Motion compensation with multiple frame prediction using two or more reference frames in a given prediction direction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8455Structuring of content, e.g. decomposing content into time segments involving pointers to the content, e.g. pointers to the I-frames of the video stream

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

在一个实例中,一种视频解码器经配置以:根据与视频数据的开放性解码刷新ODR图片相关联的数据来确定用于所述视频数据的先前图片的识别符;确定所述先前图片当前是否存储于参考图片存储器中;以及当所述先前图片未存储于所述参考图片存储器中时,仅解码所述视频数据的具有大于所述ODR图片的显示次序值的显示次序值的图片的数据。在另一实例中,一种视频编码器经配置以:编码开放性解码刷新ODR图片;确定具有小于所述ODR图片的显示次序值的显示次序值且具有等于零的时间识别符值的先前经译码图片;以及用信号发送表示所述所确定的先前经译码图片的识别符的用于所述ODR图片的语法数据。

Description

视频编解码器中的缓冲器管理
本申请案主张2011年3月8日申请的第61/450,572号美国临时申请案的权益,所述申请案特此以全文引用的方式并入本文中。
技术领域
本发明涉及视频译码。
背景技术
数字视频能力可被并入到广泛范围的装置中,所述装置包括数字电视、数字直播系统、无线广播系统、个人数字助理(PDA)、膝上型或桌上型计算机、平板计算机、电子书阅读器、数码相机、数字记录装置、数字媒体播放器、视频游戏装置、视频游戏控制台、蜂窝式或卫星无线电电话、所谓的“智能电话”、视频电话会议装置、视频串流装置和其类似者。数字视频装置实施视频译码技术,例如在由MPEG-2、MPEG-4、ITU-TH.263、ITU-T H.264/MPEG-4部分10高级视频译码(AVC)所定义的标准、目前正在开发的高效视频译码(HEVC)标准和这些标准的扩展中所描述的视频译码技术。视频装置可通过实施这些视频译码技术来更有效地发射、接收、编码、解码和/或存储数字视频信息。
视频译码技术包括空间(图片内)预测和/或时间(图片间)预测以减少或移除视频序列中固有的冗余。对于基于块的视频译码而言,可将视频切片(例如,视频图片一视频图片的一部分)分割为视频块,所述视频块还可称作树块、译码单元(CU)和/或译码节点。图片的经帧内译码(I)片中的视频块是使用相对于同一图片中的相邻块中的参考样本的空间预测而编码。图片的经帧间译码(P或B)切片中的视频块可使用相对于同一图片中的相邻块中的参考样本的空间预测或相对于其它参考图片中的参考样本的时间预测。可将图片称作图片,且可将参考图片称作参考图片。
空间预测或时间预测产生待译码的块的预测性块。残余数据表示待译码的原始块与预测性块之间的像素差。经帧间译码块根据指向形成预测性块的参考样本块的运动向量和指示经译码块与预测性块之间的差的残余数据而编码。经帧内译码块根据帧内译码模式和残余数据而编码。为了进一步压缩,可将残余数据从像素域变换到变换域,从而产生接着可被量化的残余变换系数。可扫描最初以二维矩阵布置的经量化变换系数以便产生变换系数的一维向量,且可应用熵译码以实现更多压缩。
发明内容
一般而言,本发明描述一种用于在图片被用于随机存取时对参考图片存储器(例如解码图片缓冲器(DPB))的改进的管理的技术。具体来说,本发明的技术是针对确定开放性解码刷新(ODR)图片是否已被用作随机存取点(RAP)和以译码次序来选择性地解码后续图片。这些技术可通过从DPB抛弃不再需要用于参考的图片来改进DPB性能和存储管理。根据本发明的技术,当视频解码器确定待解码的当前图片为ODR图片时,视频解码器可确定所述ODR图片是否被用于随机存取。视频解码器可(例如)确定在视频解码中所使用的DPB是否包括具有小于ODR图片的显示次序的特定显示次序值的参考图片。可将所述显示次序值作为用于ODR图片的语法元素来用信号发送。当对应于用信号发送的显示次序值的参考图片不在DPB中时,视频解码器可确定将ODR图片用于随机存取。ODR图片可在概念上与HEVC中的干净随机存取(CRA)图片相同。
因此,当ODR图片用于随机存取时,视频解码器可将当前包括于DPB中的图片标记为不用于后续图片的进一步解码的参考。以此方式,视频解码器可从DPB移除不用的图片,进而潜在地改进DPB的存储管理。本发明的技术还可使得视频解码器能够仅解码具有大于被用于随机存取的ODR的显示次序的显示次序的后续图片。以此方式,通过仅解码具有大于ODR的显示次序的显示次序的后续图片,视频解码器可跳过具有小于ODR图片的显示次序值的显示次序值的图片的数据的输出。本发明的技术可因此通过制止解码将不被显示或不被用作用于进一步解码的参考图片的图片来改进视频解码器的性能,此可在移动装置或其它电池供电型译码装置中改进处理效率和/或减少电池耗竭。
在一个实例中,一种方法包括确定视频数据的开放性解码刷新(ODR)图片正被用作随机存取点。举例来说,所述方法可包括根据与视频数据的开放性解码刷新(ODR)图片相关联的数据来确定用于所述视频数据的先前图片的识别符。所述方法还可包括确定所述先前图片当前是否存储于参考图片存储器中。所述方法可进一步包括:当先前帧未存储于参考帧存储器中时,仅解码具有大于ODR图片的显示次序值的显示次序值的视频数据的图片的数据。所述方法还可包括跳过具有小于ODR图片的显示次序值的显示次序值和大于ODR图片的解码次序值的解码次序值的图片的数据的输出。
在另一实例中,一种用于解码视频数据的设备包括视频解码器,所述视频解码器经配置以确定视频数据的开放性解码刷新(ODR)图片正被用作随机存取点。举例来说,所述视频解码器可经配置以:根据与视频数据的开放性解码刷新(ODR)图片相关联的数据来确定用于所述视频数据的先前图片的识别符;确定所述先前图片当前是否存储于参考图片存储器中;以及在所述先前图片未存储于参考图片存储器中时仅解码视频数据的具有大于ODR图片的显示次序值的显示次序值的图片的数据。所述视频解码器还可经配置以跳过具有小于ODR图片的显示次序值的显示次序值和大于ODR图片的解码次序值的解码次序值的图片的数据的输出。
在另一实例中,一种计算机程序产品包括计算机可读存储媒体,所述计算机可读存储媒体具有存储于其上的指令,所述指令在执行时致使用于解码视频数据的装置的处理器确定视频数据的开放性解码刷新(ODR)图片正被用作随机存取点。举例来说,计算机可读存储媒体可包括在执行时致使所述装置的处理器执行以下步骤的指令:根据与视频数据的开放性解码刷新(ODR)图片相关联的数据来确定用于所述视频数据的先前图片的识别符;确定所述先前图片当前是否存储于参考图片存储器中;以及在所述先前图片未存储于参考图片存储器中时仅解码视频数据的具有大于ODR图片的显示次序值的显示次序值的图片的数据。计算机可读存储媒体还可包括在执行时致使所述装置的处理器执行以下步骤的指令:跳过具有小于ODR图片的显示次序值的显示次序值和大于ODR图片的解码次序值的解码次序值的图片的数据的输出。
在另一实例中,一种用于解码视频数据的设备包括用于确定视频数据的开放性解码刷新(ODR)图片正被用作随机存取点的装置。举例来说,所述设备可包括:用于根据与视频数据的开放性解码刷新(ODR)图片相关联的数据来确定用于所述视频数据的先前图片的识别符的装置;用于确定所述先前图片当前是否存储于参考图片存储器中的装置;以及用于在所述先前图片未存储于参考图片存储器中时仅解码视频数据的具有大于ODR图片的显示次序值的显示次序值的图片的数据的装置。所述设备可进一步包括:用于跳过具有小于ODR图片的显示次序值的显示次序值和大于ODR图片的解码次序值的解码次序值的图片的数据的输出的装置。
在另一实例中,一种编码视频数据的方法包括:编码开放性解码刷新(ODR)图片;确定具有小于ODR图片的显示次序值的显示次序值且具有等于零的时间识别符值的先前经译码图片;以及用信号发送表示所确定的先前经译码图片的识别符的用于ODR图片的语法数据,以致使视频解码器基于所确定的先前经译码图片的识别符来确定ODR图片是否正被用于随机存取。
在另一实例中,一种用于编码视频数据的设备经配置以:编码开放性解码刷新(ODR)图片;确定具有小于ODR图片的显示次序值的显示次序值且具有等于零的时间识别符值的先前经译码图片;以及用信号发送表示所确定的先前经译码图片的识别符的用于ODR图片的语法数据,以致使视频解码器基于所确定的先前经译码图片的识别符来确定ODR图片是否正被用于随机存取。
在另一实例中,一种计算机程序产品包括计算机可读存储媒体,所述计算机可读存储媒体具有存储于其上的指令,所述指令在执行时致使用于解码视频数据的装置的处理器执行以下步骤:编码开放性解码刷新(ODR)图片;确定具有小于ODR图片的显示次序值的显示次序值且具有等于零的时间识别符值的先前经译码图片;以及用信号发送表示所确定的先前经译码图片的识别符的用于ODR图片的语法数据,以致使视频解码器基于所确定的先前经译码图片的识别符来确定ODR图片是否正被用于随机存取。
在另一实例中,一种用于编码视频数据的设备包括:用于编码开放性解码刷新(ODR)图片的装置;用于确定具有小于ODR图片的显示次序值的显示次序值且具有等于零的时间识别符值的先前经译码图片的装置;以及用于用信号发送表示所确定的先前经译码图片的识别符的用于ODR图片的语法数据以致使视频解码器基于所确定的先前经译码图片的识别符来确定ODR图片是否正被用于随机存取的装置。
一个或一个以上实例的细节陈述于附图和以下描述中。其它特征、目标和优势将从所述描述和所述图式以及从权利要求书显而易见。
附图说明
图1为根据本发明的技术的方框图,其说明一实例视频编码和解码系统,所述实例视频编码和解码系统可利用用于参考图片存储器的改进的管理的技术。
图2为根据本发明的技术的方框图,其说明一视频编码器的实例,所述视频编码器可在用信号发送用于随机存取的图片时实施用于参考图片存储器的改进的管理的技术。
图3为根据本发明的技术的方框图,其说明一视频解码器的实例,所述视频解码器可在用信号发送用于随机存取的图片时实施用于参考图片存储器的改进的管理的技术。
图4为根据本发明的技术的概念图,其说明视频片段的一个实例,所述视频片段包括封闭性图片群组(GOP)。
图5为根据本发明的技术的概念图,其说明一开放性GOP的一个实例,所述开放性GOP包括开放性解码刷新(ODR)存取点。
图6为根据本发明的技术的ODR图片和在所述ODR图片中所识别的先前经编码图片的概念图。
图7为根据本发明的技术的流程图,其说明可由视频解码器实施的操作。
图8A和8B说明根据本发明的技术的实例操作,其可由视频解码器来执行。
图9说明可由视频编码器执行以在ODR图片的语法数据中用信号发送先前图片以使得能够实现本发明的随机存取技术的操作。
具体实施方式
一般而言,本发明描述用于在随机存取图片被用于随机存取时对参考图片存储器(例如解码图片缓冲器(DPB))的改进的管理的技术。在一些实例中,本发明的技术是针对确定开放性解码刷新(ODR)图片是否已被用于随机存取,以及选择性地解码后续图片以改进DPB性能和存储管理。此外,当ODR图片被用于随机存取时,这些技术允许解码器确定是否可恰当地解码位流中的后续图片。随机存取图片的一个实例是即时解码刷新(IDR)图片。IDR图片是封闭性图片群组(GOP)中的可独立解码的I图片。封闭性GOP是视频表示的图片的分组,其不包括取决于在解码或呈现次序中先于所述GOP的图片而被正确解码的任何图片。开放性GOP是此类图片群组,其中在输出次序中在初始帧内图片前面的图片可能是不可正确解码的。举例来说,开放性GOP可包括至少部分地取决于在所述开放性GOP前面的至少一个图片的内容的一个或一个以上图片。
ODR图片可对应于开放性GOP中所包括的随机存取点。在一些实例中,ODR图片可为I图片,其中在解码次序与输出次序两者中在ODR图片后面的所有经译码图片不使用根据在解码次序或输出次序中在ODR图片前面的任何图片的帧间预测;且在解码次序中在ODR图片前面的任何图片在输出次序中还在ODR图片前面。尽管ODR图片可被用于随机存取,但当解码从ODR图片开始时,开放性GOP中的在译码次序中在ODR图片后面的一些图片可能不可被正确解码。在一些实例中,可将开放性GOP的I图片用作随机存取点(RAP)以用于开始回放视频表示。
当视频编码器使用更复杂的预测结构(例如,分层式B图片译码结构)时,更多图片可被译码为ODR图片,进而将潜在复杂性引入到随机存取操作中。举例来说,当用户从图片到另一图片地寻找时,常规视频解码器经配置以预期位流中的视频数据将被循序地解码。因此,当位流未被循序地解码时(如在从被用于随机存取的ODR开始进行解码时可发生),视频解码器可能尝试以解码次序来解码所有图片。常规地,如果将ODR图片用作随机存取点,则存在在解码次序中在ODR图片后面的前导图片,所述前导图片可能未被正确地解码。可不需要那些前导图片用于解码。然而,如果和平常一样来解码位流,则可能需要解码前导图片。在不知道解码状态的情况下,不可能知道是否要解码那些图片。当开始从ODR图片进行解码时,常规地,参考图片存储器中的图片可不被标记为不用于参考(例如,因为未调用与前导图片相关联的一些显式或隐式参考图片标记程序)。此可导致低效的存储器管理。然而,本发明的技术提供可由视频解码器用以指示不能被正确解码的图片的信息,以及用于更有效地管理DPB(例如,从DPB抛弃原本会被存储但不被用于参考的参考图片)和/或跳过一些图片的数据的输出的信息。
因此,在本发明的一些实例技术中,解码器可执行自动状态检查以确定解码开放性GOP的其它图片所需的图片是否存在于DPB中。举例来说,视频解码器可最初接收网络抽象层(NAL)单元,所述NAL单元包括待解码的被用于随机存取的ODR图片。当事实上NAL单元为在顺序次序中待解码的下一NAL单元时,NAL单元中所包括的开放性GOP的图片所关于的参考图片应存在于视频解码器的DPB中。另一方面,当NAL单元中所包括的开放性GOP的图片所关于的参考图片不存在于DPB中时(例如,当用户寻找到视频数据的无序时间位置时),视频解码器可经配置以确定NAL单元中的开放性GOP的ODR图片正被用于随机存取。根据本发明的技术,NAL单元可包括识别来自先前GOP(即,位流中在当前GOP前面的GOP)的图片的信息。如果用信号发送的图片存在于DPB中,则视频解码器可确定ODR图片未被用作随机存取点。
根据本发明的技术,如果参考图片不存在于DPB中,则视频解码器确定ODR图片被用作随机存取点且激活ODR随机存取状态。因此,当激活随机存取状态时,视频解码器可将DPB中所包括的当前图片标记为不用于后续图片的解码期间的参考。以此方式,视频解码器可从DPB移除不使用的图片,进而改进DPB的存储管理。本发明的技术还可使得视频解码器能够仅解码在解码次序中在ODR图片后面的具有大于被用于随机存取的ODR的显示次序值的显示次序值的图片。因此,在一些实例中,本发明的技术使得视频解码器能够跳过具有小于ODR图片的显示次序值的显示次序值和大于ODR图片的解码次序值的解码次序值的图片的输出。以此方式,本发明的技术可通过制止尝试解码和输出不能被正确地解码的图片来改进视频编解码器的性能。
图1为方框图,其说明一实例视频编码和解码系统10,当用信号发送用于随机存取的图片时,视频编码和解码系统10可利用用于参考图片存储器(例如解码图片缓冲器(DPB))的改进的管理的技术。如图1中所示,系统10包括源装置12,源装置12提供将在稍后的时间由目的地装置14解码的经编码视频数据。具体来说,源装置12经由计算机可读媒体16而将视频数据提供到目的地装置14。源装置12和目的地装置14可包含广泛范围的装置中的任一者,包括桌上型计算机、笔记本(即,膝上型)计算机、平板计算机、机顶盒、电话手持机(例如所谓的“智能”电话)、所谓的“智能”板(pad)、电视机、相机、显示装置、数字媒体播放器、视频游戏控制台、视频串流装置或其类似者。在一些状况下,源装置12和目的地装置14可经配备以用于无线通信。
目的地装置14可经由计算机可读媒体16来接收待解码的经编码视频数据。计算机可读媒体16可包含能够将经编码视频数据从源装置12移到目的地装置14的任何类型的媒体或装置。在一个实例中,计算机可读媒体16可包含通信媒体以使得源装置12能够实时地将经编码视频数据直接发射到目的地装置14。经编码视频数据可根据通信标准(例如无线通信协议)而被调制且被发射到目的地装置14。通信媒体可包含任何无线或有线通信媒体,例如射频(RF)频谱或一或多条物理传输线。通信媒体可形成基于包的网络(例如局域网、广域网或例如因特网的全球网络)的一部分。通信媒体可包括路由器、交换器、基站或可用于促进从源装置12到目的地装置14的通信的任何其它设备。
在一些实例中,经编码数据可从输出接口22输出到存储装置。类似地,可通过输入接口从存储装置存取经编码数据。存储装置可包括多种分布或本地存取的数据存储媒体中的任一者,例如硬盘驱动器、蓝光光盘、DVD、CD-ROM、快闪存储器、易失性或非易失性存储器或用于存储经编码视频数据的任何其它合适的数字存储媒体。在进一步的实例中,存储装置可对应于文件服务器或可存储由源装置12产生的经编码视频的另一中间存储装置。目的地装置14可经由串流或下载而从存储装置存取所存储的视频数据。文件服务器可为能够存储经编码视频数据和将所述经编码视频数据发射到目的地装置14的任何类型的服务器。实例文件服务器包括网络服务器(例如,对于网站)、FTP服务器、网络附接存储(NAS)装置或本地磁盘驱动器。目的地装置14可经由任何标准数据连接(包括因特网连接)来存取经编码视频数据。此可包括无线信道(例如,Wi-Fi连接)、有线连接(例如,DSL、线缆调制解调器,等)或适合用于存取存储于文件服务器上的经编码视频数据的以上两者的组合。经编码视频数据从存储装置的传输可为串流传输、下载传输或其组合。
本发明的技术不一定受限于无线应用或环境。可将所述技术应用于视频译码而支持多种多媒体应用中的任一者,例如空中电视广播、有线电视传输、卫星电视发射传输、因特网串流视频传输(例如经由HTTP的动态自适应串流(DASH))、被编码到数据存储媒体上的数字视频、存储于数据存储媒体上的数字视频的解码或其它应用。在一些实例中,系统10可经配置以支持单向或双向视频传输从而支持例如视频串流、视频回放、视频广播和/或视频电话等应用。
在图1的实例中,源装置12包括视频源18、视频编码器20和输出接口22。目的地装置14包括输入接口28、视频解码器30和显示装置32。根据本发明,源装置12的视频编码器20可经配置以在将ODR图片用于随机存取时应用用于解码图片缓冲器(DPB)的改进的管理的技术。在其它实例中,源装置和目的地装置可包括其它组件或布置。举例来说,源装置12可从外部视频源18(例如外部相机)接收视频数据。同样地,目的地装置14可与外部显示装置介接,而非包括集成式显示装置。
图1的所说明的系统10仅仅为一个实例。可通过任何数字视频编码和/或解码装置来执行用于在将图片用于随机存取时对解码图片缓冲器(DPB)的改进的管理的技术。尽管通常通过视频编码装置来执行本发明的技术,但还可通过视频编码器/解码器(通常称作“编解码器”)来执行所述技术。此外,还可通过视频预处理器来执行本发明的技术。源装置12和目的地装置14仅仅为这些译码装置的实例,在所述译码装置中,源装置12产生供发射到目的地装置14的经译码视频数据。在一些实例中,装置12、14可以实质上对称的方式进行操作,使得装置12、14中的每一者包括视频编码和解码组件。因此,系统10可支持视频装置12、14之间的单向或双向视频发射,例如,用于视频串流、视频回放、视频广播或视频电话。
源装置12的视频源18可包括视频俘获装置,例如摄影机、含有先前俘获的视频的视频存档和/或用以从视频内容提供者接收视频的视频馈送接口。作为进一步的替代例,视频源18可产生基于计算机图形的数据作为源视频、或实况视频、经存档视频和计算机产生的视频的组合。在一些状况下,如果视频源18为摄影机,则源装置12和目的地装置14可形成所谓的相机手机或视频电话。然而,如上文所提及,一般而言,本发明中所描述的技术可适用于视频译码,且可应用于无线和/或有线应用。在每一状况下,可通过视频编码器20来编码所俘获的视频、预先俘获的视频或计算机产生的视频。可接着通过输出接口22将经编码视频信息输出到计算机可读媒体16上。
计算机可读媒体16可包括瞬时媒体(例如无线广播或有线网络传输)或存储媒体(即,非暂时存储媒体)(例如硬盘、快闪驱动器、压缩光盘、数字视频光盘、蓝光光盘或其它计算机可读媒体)。在一些实例中,网络服务器(未图示)可从源装置12接收经编码视频数据且(例如)经由网络传输而将经编码视频数据提供到目的地装置14。类似地,媒体生产设施(例如光盘冲压设施)的计算装置可从源装置12接收经编码视频数据且产生含有经编码视频数据的光盘。因此,在各种实例中,可将计算机可读媒体16理解为包括各种形式的一个或一个以上计算机可读媒体。
目的地装置14的输入接口28从计算机可读媒体16接收信息。计算机可读媒体16的信息可包括由视频编码器20定义的语法信息,其还由视频解码器30使用,所述语法信息包括描述块和其它经译码单元(例如,GOP)的特性和/或处理的语法元素。显示装置32向用户显示经解码视频数据,且可包含多种显示装置中的任一者,例如阴极射线管(CRT)、液晶显示器(LCD)、等离子体显示器、有机发光二极管(OLED)显示器或另一类型的显示装置。
视频编码器20和视频解码器30可根据视频译码标准(例如目前正在开发的高效视频译码(HEVC)标准)进行操作,且可遵照HEVC测试模型(HM)。替代地,视频编码器20和视频解码器30可根据其它专属或产业标准(例如ITU-T H.264标准,替代地称作MPEG-4部分10高级视频译码(AVC))或这些标准的扩展进行操作。然而,本发明的技术并不限于任何特定译码标准。视频译码标准的其它实例包括MPEG-2和ITU-T H.263。虽然未展示于图1中,但在一些方面中,视频编码器20和视频解码器30可各自与音频编码器和解码器集成,且可包括适当MUX-DEMUX单元或其它硬件和软件以处置共同数据流或单独数据流中的音频与视频两者的编码。如果适用,则MUX-DEMUX单元可遵照ITU H.223多路复用器协议或例如用户数据报协议(UDP)等其它协议。
ITU-T H.264/MPEG-4(AVC)标准由ITU-T视频译码专家群组(VCEG)连同ISO/IEC移动图片专家群组(MPEG)一起被制定为称为联合视频小组(JVT)的集体伙伴的产物。在一些方面中,可将本发明中所描述的技术应用于一般遵照H.264标准的装置。H.264标准由ITU-T研究群组且在2005年3月描述于ITU-T推荐H.264(用于通用视听服务的高级视频译码)中,其在本文中可被称作H.264标准或H.264规范或H.264/AVC标准或规范。联合视频小组(JVT)继续致力于对H.264/MPEG-4AVC的扩展。
视频编码器20和视频解码器30可各自实施为多种合适编码器电路中的任一者,例如一个或一个以上微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、软件、硬件、固件或其任何组合。当以软件来部分地实施所述技术时,装置可将软件的指令存储于合适、非暂时计算机可读媒体中且使用一个或一个以上处理器在硬件中执行所述指令以执行本发明的技术。视频编码器20和视频解码器30中的每一者可包括于一个或一个以上编码器或解码器中,所述一个或一个以上编码器或解码器中的任一者可被集成为相应装置中的组合式编码器/解码器(编解码器)的一部分。
JCT-VC致力于HEVC标准的开发。HEVC标准化工作是基于视频译码装置的演进模型,其被称作HEVC测试模型(HM)。HM根据(例如)ITU-T H.264/AVC来假设视频译码装置相对于现有装置的若干额外能力。举例来说,HM可提供多达33种帧内预测编码模式,而H.264仅提供9种帧内预测编码模式。
一般而言,HM的工作模型描述:一视频帧或图片可被划分为包括明度样本与色度样本两者的树块或最大译码单元(LCU)的序列。位流内的语法数据可定义LCU的大小,LCU就像素的数目而言为最大译码单元。一切片包括在译码次序中的许多连续树块。可将一视频帧或图片分割为一个或一个以上切片。每一树块可根据四叉树而分裂为译码单元(CU)。一般而言,四叉树数据结构每CU包括一个节点,其中根节点对应于树块。如果将一CU分裂为四个子CU,则对应于CU的节点包括四个叶节点,所述叶节点中的每一者对应于所述子CU中的一者。
四叉树数据结构的每一节点可提供用于对应的CU的语法数据。举例来说,四叉树中的节点可包括分裂旗标,其指示对应于所述节点的CU是否被分裂为子CU。用于CU的语法元素可以递归的方式来定义,且可取决于CU是否被分裂为子CU。如果CU未被进一步分裂,则可将其称作叶CU。在本发明中,即使不存在原始叶CU的明确分裂,叶CU的四个子CU仍将还被称作叶CU。举例来说,如果处于16×16大小的CU未被进一步分裂,则四个8×8子CU将还被称作叶CU,尽管16×16CU从未被分裂。
除CU不具有大小差别外,CU具有与H.264标准的宏块类似的用途。举例来说,可将一树块分裂为四个子节点(还称作子CU),且每一子节点又可为上代节点且可被分裂为另外四个子节点。最后未分裂的子节点(称作四叉树的叶节点)包含译码节点(还称作叶CU)。与经译码位流相关联的语法数据可定义树块可被分裂的最大次数(称作最大CU深度),且还可定义译码节点的最小大小。因此,位流还可定义最小译码单元(SCU)。本发明使用术语“块”来指代HEVC的背景下的CU、PU或TU中的任一者或其它标准的背景下的类似数据结构(例如,H.264/AVC中的宏块和其子块)。
一CU包括译码节点和与所述译码节点相关联的预测单元(PU)和变换单元(TU)。CU的大小对应于所述译码节点的大小且形状必须为正方形。CU的大小可在8×8个像素直到具有最大64×64个像素或更大的树块大小的范围内。每一CU可含有一个或一个以上PU和一个或一个以上TU。与CU相关联的语法数据可描述(例如)CU被分裂为一个或一个以上PU。分裂模式可在CU是否被跳过或经直接模式编码、经帧内预测模式编码或经帧间预测模式编码之间有所不同。PU的形状可经分割为非正方形。与CU相关联的语法数据还可描述(例如)根据四叉树而将CU分割为一个或一个以上TU。TU的形状可为正方形或非正方形(例如,矩形)。
HEVC标准允许根据TU进行变换,所述变换对于不同CU而言可为不同的。通常基于在针对经分割LCU所定义的给定CU内的PU的大小来设定TU的大小,但可能不是总是此状况。TU通常为与PU相同的大小或小于PU。在一些实例中,可使用被称为“残余四叉树”(RQT)的四叉树结构而将对应于CU的残余样本细分为更小的单元。可将RQT的叶节点称作变换单元(TU)。与TU相关联的像素差值可经变换以产生可被量化的变换系数。
叶CU可包括一个或一个以上预测单元(PU)。一般而言,PU表示对应于对应CU的全部或一部分的空间区域,且可包括用于检索PU的参考样本的数据。此外,PU包括与预测有关的数据。举例来说,当PU经帧内模式编码时,PU的数据可包括于残余四叉树(RQT)中,所述RQT可包括描述用于对应于所述PU的TU的帧内预测模式的数据。作为另一实例,当PU经帧间模式编码时,PU可包括定义PU的一个或一个以上运动向量的数据。定义PU的运动向量的数据可描述(例如)运动向量的水平分量、运动向量的垂直分量、运动向量的分辨率(例如,四分之一像素精度或八分之一像素精度)、运动向量所指向的参考图片和/或运动向量的参考图片列表(例如,列表0、列表1或列表C)。
具有一个或一个以上PU的叶CU还可包括一个或一个以上变换单元(TU)。如上文所论述,可使用RQT(还称作TU四叉树结构)来规定所述变换单元。举例来说,分裂旗标可指示叶CU是否被分裂为四个变换单元。接着,可将每一变换单元进一步分裂为进一步的子TU。当TU未被进一步分裂时,可将其称作叶TU。一般来说,对于帧内译码而言,属于叶CU的所有叶TU共享相同的帧内预测模式。即,一般应用相同的帧内预测模式来计算叶CU的所有TU的预测值。对于帧内译码而言,视频编码器可使用帧内预测模式而将每一叶TU的残余值计算为CU的对应于TU的部分与原始块之间的差。TU不一定受限于PU的大小。因此,TU可大于或小于PU。对于帧内译码而言,PU可与同一CU的对应的叶TU并置。在一些实例中,叶TU的最大大小可对应于对应叶CU的大小。
此外,叶CU的TU还可与相应四叉树数据结构(称作残余四叉树(RQT))相关联。即,叶CU可包括指示所述叶CU如何被分割为TU的四叉树。TU四叉树的根节点一般对应于叶CU,而CU四叉树的根节点一般对应于树块(或LCU)。将RQT的未被分裂的TU称作叶TU。一般而言,除非另有指示,否则本发明分别使用术语CU和TU来指代叶CU和叶TU。
视频序列通常包括一系列视频帧或图片。图片群组(GOP)一般包含一系列的一个或一个以上视频图片。GOP可包括在GOP的标头、图片中的一者或一者以上的标头或别处的语法数据,所述语法数据描述GOP中所包括的许多图片。图片的每一切片可包括描述用于所述相应切片的编码模式的切片语法数据。视频编码器20通常对个别视频切片内的视频块进行操作以便编码视频数据。视频块可对应于CU内的译码节点。视频块可具有固定或变化的大小,且大小可根据规定的译码标准而不同。
作为一实例,HM支持按各种PU大小的预测。假定特定CU的大小为2N×2N,HM支持按2N×2N或N×N的PU大小的帧内预测,以及按2N×2N、2N×N、N×2N或N×N的对称PU大小的帧间预测。HM还支持用于按2N×nU、2N×nD、nL×2N和nR×2N的PU大小的帧间预测的不对称分割。在不对称分割中,CU的一个方向未被分割,而另一方向被分割为25%和75%。CU的对应于25%分区的部分由“n”继之以“向上”、“向下”、“左边”或“右边”的指示来指示。因此,例如,“2N×nU”指代被水平地分割成在顶部具有2N×0.5N PU且在底部具有2N×1.5N PU的2N×2N CU。
在本发明中,可互换地使用“N×N”和“N乘N”来指代就垂直尺寸和水平尺寸而言的视频块的像素尺寸(例如,16×16像素或16乘16像素)。一般而言,16×16块在垂直方向上将具有16个像素(y=16)且在水平方向上将具有16个像素(x=16)。同样地,N×N块一般在垂直方向上具有N个像素且在水平方向上具有N个像素,其中N表示非负整数值。可按行和列来布置块中的像素。此外,块不一定需要在水平方向上与在垂直方向上具有相同数目个像素。举例来说,块可包含N×M像素,其中M不一定等于N。
在使用CU的PU进行帧内预测译码或帧间预测译码之后,视频编码器20可计算用于CU的TU的残余数据。PU可包含描述在空间域(还被称作像素域)中产生预测性像素数据的方法或模式的语法数据,且在将变换(例如,离散余弦变换(DCT)、整数变换、小波变换或概念上类似的变换)应用于残余视频数据之后,TU可包含变换域中的系数。残余数据可对应于未经编码图片的像素与对应于PU的预测值之间的像素差。视频编码器20可形成包括用于CU的残余数据的TU,且接着变换所述TU以产生用于CU的变换系数。
在进行任何变换以产生变换系数之后,视频编码器20可执行变换系数的量化。量化一般指代其中变换系数经量化成有可能减少用以表示系数的数据的量从而提供进一步压缩的过程。所述量化过程可减小与所述系数中的一些或全部相关联的位深度。举例来说,可在量化期间将n位值下舍入到m位值,其中n大于m。
在量化之后,视频编码器可扫描变换系数,从而从包括经量化变换系数的二维矩阵产生一维向量。所述扫描可经设计以将更高能量(且因此更低频率)系数放置于阵列的前面且将更低能量(且因此更高频率)系数放置于阵列的后面。在一些实例中,视频编码器20可利用预定义扫描次序来扫描经量化变换系数以产生可被熵编码的串行化向量。在其它实例中,视频编码器20可执行自适应扫描。在扫描经量化变换系数以形成一维向量之后,视频编码器20可(例如)根据上下文自适应可变长度译码(CAVLC)、上下文自适应二进制算术译码(CABAC)、基于语法的上下文自适应二进制算术译码(SBAC)、概率区间分割熵(PIPE)译码或另一熵编码方法来编码一维向量熵。视频编码器20还可熵编码与经编码视频数据相关联的语法元素以供视频解码器30在解码视频数据中使用。
为了执行CABAC,视频编码器20可将上下文模型内的上下文指派给待发射的符号。所述上下文可与(例如)所述符号的相邻值是否为非零有关。为了执行CAVLC,视频编码器20可选择用于待发射的符号的可变长度码。VLC中的码字可经建构以使得相对较短的码对应于更有可能的符号,而较长的码对应于较不可能的符号。以此方式,VLC的使用可比(例如)针对待发射的每一符号使用相等长度码字而实现位节约。概率确定可基于被指派给符号的上下文。
视频编码器20可进一步(例如)在图片标头、块标头、切片标头或GOP标头中将语法数据(例如基于块的语法数据、基于图片的语法数据和基于GOP的语法数据)发送到视频解码器30。GOP语法数据可描述相应GOP中的许多图片,且图片语法数据可指示用以编码对应的图片的编码/预测模式。
根据用以改进参考图片存储器的管理的本发明的技术,在一些实例中,视频编码器20最初从视频源18接收视频数据。视频编码器20可将所述视频数据分割为图片,可随后由视频编码器20来编码所述图片。在一些实例中,视频编码器20可将图片分组在一起以作为图片群组(GOP)。可将GOP描述为视频序列中的连续(以呈现次序)图片的分组。
GOP中所包括的图片的显示次序可不同于图片的解码次序。举例来说,GOP可包括I、B或P图片的任何组合。经帧内译码的图片(I图片)为可独立解码的那些图片,其意味着:为了解码I图片,解码器无需依赖于其它图片的内容。P图片可相对于在一方向上的一个或一个以上图片而被帧间译码。B图片可相对于在两个方向上的一个或一个以上图片而被帧间译码。可将仅包括可不依赖于在GOP外部的图片的内容而正确解码的图片的GOP视为封闭性GOP。相反,开放性GOP包括正确解码取决于在GOP外部的其它图片的图片。本文中进一步描述的图4和5说明封闭性GOP 102和开放性GOP 152的进一步细节。
为了将视频数据编码为B或P图片,视频编码器20可将参考图片存储于参考图片存储器中,B或P图片取决于所述参考图片以进行恰当编码。存储于参考图片存储器中的参考图片可包括在解码次序中在当前经编码图片前面的经编码图片。在一些实例中,视频编码器20搜索参考图片存储器中的参考图片以识别当前正被编码的图片可参考的一个或一个以上合适的参考图片。图2和3中将参考图片存储器的实例分别展示为参考图片存储器64和82。类似于视频编码器20,视频解码器30还可包括参考图片存储器。视频解码器30可使用存储于视频解码器30的参考图片存储器中的参考图片来解码B和P图片。以此方式,由视频编码器20和视频解码器30使用的参考图片存储器可用以编码和解码GOP的图片。
源装置12可进一步包括囊封单元(未图示),其可将供发射的经压缩视频数据格式化为所谓的“网络抽象层单元”或NAL单元。每一NAL单元可包括识别存储到所述NAL单元的数据的类型的标头。存在通常存储到NAL单元的两种类型的数据。被存储到NAL单元的第一类型的数据为视频译码层(VCL)数据,其包括经压缩视频数据(例如视频数据的经译码切片)。被存储到NAL单元的第二类型的数据称为非VCL数据,其包括额外信息(例如定义大量NAL单元共同的标头数据的参数集)和补充性增强信息(SEI)。囊封单元可经由输出接口22而将所形成的NAL单元发送到目的地装置14。
输入接口28可接收NAL单元,其可将所述NAL单元传递到解囊封单元(未图示)。在一些实例中,解囊封单元以接收NAL单元的次序解囊封来自NAL单元的经编码视频。在解囊封之后,视频解码器30可从解囊封单元接收经解囊封的视频数据。视频解码器30接着解码视频数据以供在显示装置32处显示。举例来说,当视频解码器30以连续显示次序来解码供显示的图片时,视频数据中所包括的图片被解码且经解码图片接着被存储于视频解码器30的参考图片存储器中。可接着将经解码图片用作用于随后解码的图片的参考图片。由于参考图片存储器可具有有限的存储空间,所以当不再需要解码图片时,视频解码器30可将图片标记为不用于参考。因此,当不再需要时,视频解码器30可从参考图片存储器移除不使用的参考图片。以此方式,视频序列的图片由视频解码器30和显示装置32解码和显示。
一般而言,视频解码器经配置以解码在即时解码刷新(IDR)图片之后的整个位流。然而,视频解码器30可经配置以开始解码以开放性解码刷新(ODR)图片开始的视频数据序列。此可响应于随机存取(例如,用户寻找到视频序列的特定时间位置)而发生。随机存取的图片可一般对应于位流内并不紧接在解码次序中的前一经解码图片后面的图片。
为了说明随机存取的实例,用户可请求查看由显示装置32显示的视频。于目的地装置14上执行的应用程序(例如网络浏览器或媒体播放器)可使得用户能够控制视频的显示。可基于由视频解码器30解码的图片来显示视频。在当前实例中,用户可提供用以随机地存取视频的不同位置的输入,使得由应用程序接收所述输入。所述应用程序可识别与所选位置相关联的图片且请求(例如)在网络串流期间来自源装置12或来自可由输入接口28存取的存储媒体的图片。
响应于接收到用以在当前实例的视频中选择新时间位置的图片的识别符,应用程序可识别对应于视频的所选位置的RAP图片。在一些实例中,RAP图片可为最接近于视频的所请求位置的ODR或IDR图片,其在解码次序中在所请求位置的图片前面。可由视频解码器30用以提供随机存取的独立可解码图片的实例包括即时解码刷新(IDR)和开放性解码刷新(ODR)RAP图片。如先前所描述,IDR图片为封闭性GOP的可独立解码的I图片,而ODR图片为开放性GOP的I图片。
应用程序可请求以RAP图片开始的经编码视频数据。在一些实例中,所述请求包括RAP图片的识别符。响应于接收到所述请求,源装置12可使用RAP图片的识别符来开始将始于RAP图片的经编码视频数据的流发送到目的地装置14。视频解码器30可随后开始解码所述经编码视频串流以供显示装置32进行显示。
在以IDR RAP图片开始的实例中,视频解码器30可确定RAP图片的类型为IDRRAP图片。如先前所描述,由于IDR RAP图片被包括于封闭性GOP中,所以封闭性GOP中所包括的其它图片不取决于在GOP外部的参考图片被正确解码。视频解码器30可因此响应于确定RAP图片为IDR RAP图片而将当前存储于参考图片存储器中的所有参考图片标记为不使用。因此,视频解码器30可从参考图片存储器移除不使用的参考图片。以此方式,视频解码器30释放参考图片存储器中的空间以存储封闭性GOP的经解码IDR图片和封闭性GOP中所包括的其它随后解码的图片。
根据本发明的技术,可将随机存取扩展到开放性解码刷新(ODR)图片。换句话说,当视频解码器30执行随机存取时,还可将ODR图片用于随机存取。ODR图片为开放性GOP的I图片,其可被用于随机存取以用于开始回放视频表示。
当使用相对复杂的预测结构时(例如,分层式B图片译码结构),视频编码器20可将更多图片译码为ODR图片,进而在常规客户端装置执行随机存取时引入复杂性。举例来说,当用户提供用以寻找到特定时间位置的输入时,常规视频解码器未准备好停止顺序解码且从所选随机存取点进行解码,所述所选随机存取点经配置以预期位流中的视频数据将被循序地解码。因此,当位流未被循序地解码时(如在开始从ODR RAP解码时可能发生),视频解码器可尝试以解码次序来解码所有图片。然而,本发明的技术提供可由视频解码器用以确定不能被正确地解码的图片的信息以及用于更有效地管理DPB(例如,从DPB抛弃原本会被存储但不用于参考的参考图片)的信息。
本发明的技术可通过执行自动状态检查以确定ODR图片是否已被选择用于随机存取来改进对视频解码器30的参考图片存储器的存储器控制。在一些实例技术中,视频编码器20可在ODR图片的切片的切片标头中用信号发送先前图片的识别符,视频解码器30可使用所述识别符以确定ODR图片是否已被选择用于随机存取。如果视频解码器30确定在切片标头中用信号发送的先前图片目前存储于参考图片存储器中,则视频解码器30可确定ODR图片未被用于随机存取,且正常地解码位流。另一方面,如果在切片标头中用信号发送的先前图片目前未存储于参考图片存储器中,则视频解码器30可确定ODR图片正被用于随机存取。响应于确定ODR图片正被用于随机存取,视频解码器30可将参考图片存储器中的图片标记为不使用,且在一些实例中制止解码不是执行对在显示次序中在ODR RAP后面的图片的进一步解码所需的图片(例如,无法被恰当地解码的图片)。
最初,视频编码器20可编码视频序列中的ODR图片。在编码过程期间,视频编码器20可确定具有小于ODR图片的显示次序的显示次序且用以指示ODR图片是否正被用于随机存取的特定先前经编码图片(或“先前图片”)。在一些实例中,包括经编码ODR图片的开放性GOP中的一个或一个以上图片(本文中“前导图片”)可取决于所确定的先前图片以进行恰当解码。前导图片可具有小于ODR图片的显示次序但具有大于ODR图片的解码次序。视频解码器20可通过完全地或部分地基于确定开放性GOP的一个或一个以上前导图片是否取决于先前图片来确定先前图片。在一些实例中,视频编码器20可将在解码次序和显示次序中在ODR图片前面且具有等于0的时间水平的为最接近图片的图片确定为特定的先前经编码图片。
当视频编码器20确定特定先前图片时,视频编码器20可在ODR图片的切片(或ODR图片的每一切片)的切片标头中用信号发送所述先前图片的识别符。在一些实例中,所述识别符可为指示先前图片的显示次序的图片次序计数(POC)值。先前图片的POC值可存储于ODR图片的切片标头或图片参数集中。在一个实例中,切片标头可包括由名称“pre_pic_POC”识别的语法元素。所述pre_pic_POC值可规定由视频编码器20确定的特定先前图片的POC值。根据本发明的各方面,下表1指示ODR图片的包括pre_pic_POC值的实例切片标头。如可在表1中看到,当NAL单元类型指示切片为ODR NAL单元或NAL单元标头中的旗标指示片为ODR NAL单元时,视频编码器20将OdrPicFlag语法元素设定为真。
slice_header(){ C 描述符
   first_lctb_in_slice 2 ue(v)
   slice_type 2 ue(v)
   pic_parameter_set_id 2 ue(v)
   picture_num 2 u(v)
   if(IdrPicFlag)
     idr_pic_id 2 ue(v)
   if(OdrPicFlag)
     pre_pic_POC 2 ue(v)
}
表1
尽管使用先前图片的POC值来说明先前图片的识别符的一个实例,但其它值也为合适的。举例来说,视频编码器20可在ODR图片的切片的切片标头中用信号发送等于先前图片的POC值与ODR图片的POC值之间的差的值。在另一实例中,可由视频编码器20将先前图片的解码次序值(例如,语法元素“picture_num”)存储于切片的标头中。在又其它实例中,视频编码器20可在切片的标头中用信号发送等于先前图片的解码次序值与ODR图片的解码次序值之间的差的值。以此方式,视频编码器20可用信号发送用于ODR图片的特定先前图片的识别符,以基于所述特定先前图片当前是否在解码图片缓冲器中来指示ODR图片是否正被用于随机存取。
在当前实例中,在于切片标头中用信号发送先前图片的POC值之后,囊封单元可进一步将ODR图片囊封于NAL单元中(和/或囊封用信号发送特定先前图片的识别符的图片参数集)。输出接口22可随后将NAL单元连同包括经编码视频数据的其它NAL单元一起发送到目的地装置14。输入接口28可接收NAL单元并将所述NAL单元发送到视频解码器30。在一些实例中,解囊封单元可在解码经编码视频数据之前解囊封来自NAL单元的经编码视频数据。
在一个实例中,用户可在目的地装置14处提供用以选择当前播放的视频的不同时间位置或选择新请求的视频的初始开始点(其不同于视频的最开始)的输入。ODR图片可为最接近于随机选择的位置的图片且可因此由视频解码器30用于随机存取。应理解,如果没有用于ODR图片的用信号发送的值,则视频解码器30将不能够确定ODR图片正被用于随机存取。然而,通过包括用于ODR图片的特定先前图片的用信号发送的值,本发明的技术允许视频解码器30确定ODR图片是否正被用于随机存取。在当前实例中,由于用户已选择当前播放的视频的不同时间位置,所以视频解码器30可接收以ODRRAP图片开始的经编码视频数据。视频解码器30可随后开始解码经编码视频流以供显示装置32显示。
根据本发明的技术,视频解码器30可在特定图片处开始解码位流。视频解码器30可确定当前图片是否为ODR图片。举例来说,视频解码器30可确定在图片中的切片的切片标头中的语法元素是否指示所述图片为ODR图片。作为一个实例,可在图片中的切片的切片标头中将如表1中所示的OdrPicFlag变量设定为真值以指示所述图片为ODR图片。
此外,视频解码器30可确定ODR图片的特定先前图片的用信号发送的识别符的值(例如,在ODR图片的切片的切片标头中或在对应于ODR图片的PPS中用信号发送)。举例来说,视频解码器30可识别ODR图片中的切片的切片标头中的语法元素,所述语法元素识别特定先前图片。如上文所描述,ODR图片可包括pre_pic_POC语法元素,其指示特定先前图片的显示次序值。视频解码器30可接着通过比较pre_pic_POC语法元素的值与存储于参考图片存储器中的图片的显示次序值(例如,POC值)以识别匹配来确定特定先前图片是否存储于视频解码器30的参考图片存储器中。
如果先前图片存储于参考图片存储器中,则视频解码器30以常规方式解码位流的图片。因此,视频解码器30可维持指示视频解码器30正解码图片以提供图片的正常、顺序显示的状态。在一个实例中,当视频解码器30确定先前图片目前存储于参考图片存储器中时,可将维持指示随机存取状态的值的具有名称“random_access”的变量设定为假。因此,视频解码器30可继续解码后续图片以供正常、顺序显示。
另一方面,视频解码器30可确定参考图片存储器不包括由与ODR图片相关联的识别符(例如,pre_pic_POC语法元素)识别的特定先前图片。在此些实例中,用户可能已选择视频的不同时间位置。因此,视频解码器30可基于由用信号发送的值识别的特定先前图片未存储于参考图片存储器中的确定来确定ODR图片正被用于随机存取。视频解码器30可因此将random_access变量设定为真,因为视频解码器30已确定ODR图片正被用于随机存取。
在当前实例中,响应于确定ODR图片正被用于随机存取,视频解码器30可在解码ODR图片之后将参考图片存储器中的图片标记为不用于参考(除ODR图片自身以外)。在解码ODR图片之后,random_access状态可保持不改变、为真值。视频解码器30可随后从参考图片存储器删除具有不使用状态的图片。
当视频解码器30执行随机存取时(例如,random_access被设定为真),视频解码器30可忽视在视频图片中的切片(例如,当前开放性GOP的切片)的切片标头中所规定的某些存储器管理操作。举例来说,视频解码器30可确定在图片的切片中用信号发送的语法信息,所述语法信息指示待执行的至少一个存储器管理过程。当执行随机存取时(例如,随机存取状态被激活),视频解码器30可忽视存储器管理过程。为了说明,当不在随机存取模式中时,视频解码器30可经配置以应用存储器管理技术从而响应于在某些切片标头中所规定的数据而将参考图片存储器中的经解码图片标记为不用于参考。这些技术可包括滑动窗技术或显式标记技术。然而,当处于随机存取模式中时(如通过本发明的技术所确定),视频解码器30可实际上未解码这些图片,且因此,这些图片可不存在于参考图片存储器的解码图片缓冲器中。因此,根据本发明的技术,当视频解码器30确定其正执行随机存取时,视频解码器30可忽视在切片标头中所规定的此些存储器管理操作,因为将被标记为不使用的参考图片可不存在于参考图片存储器中。以此方式,视频解码器30可制止尝试对不存在于参考图片存储器中的参考图片执行管理操作。
视频解码器30还可响应于确定ODR图片正被用于随机存取而仅解码视频数据的具有大于ODR图片的显示次序值的显示次序值的图片的数据。举例来说,当ODR图片正被用于随机存取时(例如,random_access被设定为真),视频解码器30可进一步产生用以存储ODR RAP图片的POC值的变量。在一个实例中,可将所述变量命名为“CurrODRPOC”。在确定ODR图片正被用于随机存取后,视频解码器30可即刻将CurrODRPOC设定为ODR图片的POC值。在一些实例中,视频解码器30可基于ODR图片正被用作随机存取点的确定而跳过具有小于ODR图片的显示次序值的显示次序值和大于ODR图片的解码次序值的解码次序值的图片的数据的输出。
当视频解码器30从源装置12接收后续NAL单元时,视频解码器30可解析每一NAL单元中所包括的切片的切片标头。对于每一NAL单元而言,视频解码器30可确定切片的POC值是否包括于所述NAL单元中。举例来说,在一个实例中,视频解码器30可比较NAL单元中所包括的切片的POC值与存储于CurrODRPOC中的POC值。如果切片的POC值小于ODR RAP图片的POC值,则视频解码器30可跳过NAL单元中的经编码视频数据的解码。以此方式,视频解码器30可制止解码不是从所选ODR RAP图片解码所需的NAL单元的视频数据。视频解码器30还可因此跳过NAL单元的此解码视频数据的输出。因此,当视频解码器30确定ODR RAP图片已被选择用于随机存取时,本发明的技术可减少对视频数据的不必要解码。尽管先前技术解析切片标头的POC值,但本发明的技术可类似地解析(例如)图片参数集的语法元素,所述图片参数集可包括图片的POC值。
在一些实例中,视频解码器30可确定NAL单元中的切片的POC值大于ODR RAP图片的POC值。在这些实例中,视频解码器30可解码所述切片。响应于确定NAL单元中的切片的POC值大于ODR RAP图片的POC值,视频解码器30还可改变随机存取状态以指示用于图片的正常、顺序显示而非随机存取的图片的解码。举例来说,视频解码器30可通过将random_access设定为假而去活随机存取状态。以此方式,视频解码器30可改变随机存取状态以指示用于图片的正常、顺序显示而非随机存取的图片的解码。
在一些实例中,与视频解码器30和/或视频编码器20分离的一个或一个以上组件可执行本发明的技术以检测随机存取。举例来说,基于超文本传送协议(HTTP)的串流系统或本地回放应用程序可包括与视频解码器30分离的组件。在一个实例中,与视频解码器30分离的预处理器组件可接收用于从视频数据的特定时间实例开始回放的请求的数据。所述预处理器组件可基于时戳来识别时间实例。如果预处理器组件确定最接近于新时间位置的RAP图片为ODR图片,则预处理器组件可确定ODR图片的显示次序对应于视频数据的所选时间实例。时戳可为指示时间的值,在所述时间处显示视频序列中的ODR图片。响应于确定ODR图片被用于随机存取,预处理器组件可选择指示ODR图片的时戳的信息且将所述信息发送到视频解码器30。视频解码器30可因此使用本发明的技术使用所述信息来执行随机存取。
视频编码器20和视频解码器30可各自在适用时实施为多种合适编码器或解码器电路中的任一者,例如一个或一个以上微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑电路、软件、硬件、固件或其任何组合。视频编码器20和视频解码器30中的每一者可包括于一个或一个以上编码器或解码器中,所述一个或一个以上编码器或解码器中的任一者可集成为组合式视频编码器/解码器(编解码器)的部分。包括视频编码器20和/或视频解码器30的装置可包含集成电路、微处理器和/或无线通信装置(例如蜂窝式电话)。
图2为说明视频编码器20的实例的方框图,当用信号发送用于随机存取的图片时,所述视频编码器20可实施用于参考图片存储器(例如解码图片缓冲器(DPB))的改进的管理的技术。视频编码器20可执行视频切片内的视频块的帧内译码和帧间译码。帧内译码依赖于空间预测以减少或移除给定视频图帧或图片内的视频中的空间冗余。帧间译码依赖于时间预测以减少或移除视频序列的相邻帧或图片内的视频中的时间冗余。帧内模式(I模式)可指代若干基于空间的预测模式中的任一者。帧间模式(例如单向预测(P模式)或双向预测(B模式))可指代若干基于时间的预测模式中的任一者。
如图2中所示,视频编码器20接收待编码的视频图片内的当前视频块。在图2的实例中,视频编码器20包括模式选择单元40、参考图片存储器64、编码控制单元66、求和器50、变换处理单元52、量化单元54和熵译码单元56。在一些实例中,可在本发明中将参考图片存储器64称作图片缓冲器或解码图片缓冲器。模式选择单元40又包括运动补偿单元44、运动估计单元42、帧内预测单元46和分割单元48。为进行视频块重构,视频编码器20还包括逆量化单元58、逆变换单元60和求和器62。还可包括解块滤波器(图2中未展示)以对块边界滤波,从而从经重构的视频移除块效应假影。如果想要,则解块滤波器将通常对求和器62的输出滤波。除解块滤波器之外,还可使用额外滤波器(循环内或循环后)。出于简明起见而未展示此些滤波器,但如果想要,则此些滤波器可对求和器50的输出滤波(作为循环内滤波器)。
在编码过程期间,视频编码器20接收待译码的视频图片或切片。可将所述图片或切片划分为多个视频块。运动估计单元42和运动补偿单元44执行所接收的视频块相对于一个或一个以上参考图片中的一个或一个以上块的帧间预测性译码以提供时间预测。帧内预测单元46可替代地执行对所接收的视频块相对于在与待译码的块相同的图片或切片中的一个或一个以上相邻块的帧内预测性译码以提供空间预测。视频编码器20可执行多个译码回合,(例如)以选择用于视频数据的每一块的适当译码模式。
此外,分割单元48可基于对先前译码回合中的先前分割方案的评估而将视频数据的块分割为子块。举例来说,分割单元48可最初将图片或切片分割为LCU,且基于速率-失真分析(例如,速率-失真优化)而将所述LCU中的每一者分割为子CU。模式选择单元40可进一步产生指示将LCU分割为子CU的四叉树数据结构。四叉树的叶节点CU可包括一个或一个以上PU和一个或一个以上TU。
模式选择单元40可(例如)基于误差结果来选择译码模式(帧内或帧间)中的一者,且将所得经帧内译码块或经帧间译码块提供到求和器50以产生残余块数据,且提供到求和器62以重构用作参考图片的经编码块。模式选择单元40还将语法元素(例如运动向量、帧内模式指示符、分割信息和其它此语法信息)提供到熵译码单元56。
运动估计单元42和运动补偿单元44可高度集成,但为概念目的而独立地说明。由运动估计单元42执行的运动估计是产生估计视频块的运动的运动向量的过程。运动向量(例如)可指示当前视频帧或图片内的视频块的PU相对于参考图片(或其它译码单元)内的预测性块(相对于当前图片(或其它译码单元)内的正被译码的当前块)的移位。预测性块为被发现就像素差而言紧密地匹配待译码的块的块,所述像素差可通过绝对差和(SAD)、平方差和(SSD)或其它差度量来确定。在一些实例中,视频编码器20可计算存储于参考图片存储器64中的参考图片的子整数像素位置的值。举例来说,视频编码器20可内插四分之一像素位置、八分之一像素位置或参考图片的其它分数像素位置的值。因此,运动估计单元42可相对于完整像素位置和分数像素位置而执行运动搜索且输出具有分数像素精度的运动向量。
运动估计单元42通过比较经帧间译码切片中的视频块的PU的位置与参考图片的预测性块的位置来计算所述PU的运动向量。可从第一参考图片列表(列表0)或第二参考图片列表(列表1)来选择参考图片,所述参考图片列表中的每一者识别存储于参考图片存储器64中的一个或一个以上参考图片。运动估计单元42将所计算的运动向量发送到熵编码单元56和运动补偿单元44。
由运动补偿单元44执行的运动补偿可涉及基于由运动估计单元42确定的运动向量来获取或产生预测性块。再次,在一些实例中,运动估计单元42和运动补偿单元44可在功能上进行集成。在接收到当前视频块的PU的运动向量后,运动补偿单元44可即刻定位在所述参考图片列表中的一者中所述运动向量所指向的预测性块。求和器50通过从正被译码的当前视频块的像素值减去预测性块的像素值来形成残余视频块,从而形成像素差值,如下文所论述。一般而言,运动估计单元42相对于明度分量而执行运动估计,且运动补偿单元44将基于所述明度分量所计算的运动向量用于色度分量与明度分量两者。模式选择单元40还可产生与视频块和视频切片相关联的语法元素以供视频解码器30在解码视频切片的视频块时使用。
如上文所描述,作为由运动估计单元42和运动补偿单元44执行的帧间预测的替代例,帧内预测单元46可对当前块进行帧内预测。具体来说,帧内预测单元46可确定待用以编码当前块的帧内预测模式。在一些实例中,帧内预测单元46可(例如)在单独的编码回合期间使用各种帧内预测模式来编码当前块,且帧内预测单元46(或在一些实例中,模式选择单元40)可从所测试的模式选择待使用的适当帧内预测模式。
举例来说,帧内预测单元46可使用对于各种所测试的帧内预测模式的速率-失真分析来计算速率-失真值,且在所测试的模式当中选择具有最佳速率-失真特性的帧内预测模式。速率-失真分析一般确定经编码块与原始、未经编码块(其曾被编码以产生经编码块)之间的失真(或误差)量,以及用以产生经编码块的位率(即,位的数目)。帧内预测单元46可根据各种经编码块的失真和速率来计算比率以确定哪一帧内预测模式展现所述块的最佳速率-失真值。
在选择用于块的帧内预测模式之后,帧内预测单元46可将指示用于块的所选帧内预测模式的信息提供到熵译码单元56。熵译码单元56可编码指示所选的帧内预测模式的信息。视频编码器20可在所发射的位流中包括以下各者:配置数据,其可包括多个帧内预测模式索引表和多个经修改帧内预测模式索引表(还称作码字映射表);各种块的编码上下文的定义;以及待用于所述上下文中的每一者的最有可能帧内预测模式、帧内预测模式索引表和经修改帧内预测模式索引表的指示。
视频编码器20通过从正被译码的原始视频块减去来自模式选择单元40的预测数据而形成残余视频块。求和器50表示执行此减法运算的一个或一个以上组件。变换处理单元52将变换(例如离散余弦变换(DCT)或概念上类似的变换)应用于残余块,从而产生包含残余变换系数值的视频块。变换处理单元52可执行概念上类似于DCT的其它变换。还可使用小波变换、整数变换、子频带变换或其它类型的变换。在任何状况下,变换处理单元52将变换应用于残余块,从而产生残余变换系数块。所述变换可将残余信息从像素值域转换到变换域(例如频域)。变换处理单元52可将所得变换系数发送到量化单元54。量化单元54量化所述变换系数以进一步减小位率。所述量化过程可减小与所述系数中的一些或全部相关联的位深度。可通过调整量化参数来修改量化程度。在一些实例中,量化单元54可接着执行对包括经量化变换系数的矩阵的扫描。替代地,熵编码单元56可执行扫描。
在量化之后,熵译码单元56对经量化变换系数进行熵译码。举例来说,熵译码单元56可执行上下文自适应可变长度译码(CAVLC)、上下文自适应二进制算术译码(CABAC)、基于语法的上下文自适应二进制算术译码(SBAC)、概率区间分割熵(PIPE)译码或另一熵译码技术。在基于上下文的熵译码的状况下,上下文可基于相邻块。在由熵译码单元56进行熵译码之后,可将经编码位流发射到另一装置(例如,视频解码器30)或进行存档以供稍后发射或检索。
逆量化单元58和逆变换单元60分别应用逆量化和逆变换以在像素域中重构残余块,(例如)以供稍后用作参考块。运动补偿单元44可通过将残余块加到参考图片存储器64的图片中的一者的预测性块来计算参考块。运动补偿单元44还可将一个或一个以上内插滤波器应用于经重构的残余块以计算用于在运动估计时使用的子整数像素值。求和器62将经重构的残余块加到由运动补偿单元44产生的经运动补偿的预测块以产生供存储于参考图片存储器64中的经重构的视频块。所述经重构的视频块可由运动估计单元42和运动补偿单元44用作参考块以对后续视频图片中的块进行帧间译码。
视频编码器20可将经编码视频数据发送到囊封单元。所述囊封单元可以NAL单元的形式来格式化供发射的经编码视频数据。每一NAL单元可包括识别存储到所述NAL单元的数据的类型的标头。存在通常存储到NAL单元的两种类型的数据。囊封单元可将NAL单元发送到输出接口,所述输出接口可将所述NAL单元发送到目的地装置。
现在关于本发明的技术来进一步描述视频编码器20。最初,视频编码器20可编码视频序列中的ODR图片。当视频编码器20编码ODR图片时,编码控制单元66可确定具有小于ODR图片的显示次序的显示次序的先前经编码图片。在一些实例中,编码控制单元66可搜索参考图片存储器64以识别先前经编码图片。编码控制单元66可通过确定开放性GOP的一个或一个以上图片是否取决于先前图片来确定先前图片。举例来说,包括经编码ODR图片的开放性GOP(例如,前导图片)的一个或一个以上图片可取决于先前图片以进行恰当解码。在一些实例中,编码控制单元66可确定先前经译码图片的识别符,所述先前经译码图片具有等于零的时间层且为在解码次序和显示次序中在当前ODR图片前面的最近的先前解码的图片。
当编码控制单元66确定先前图片的识别符时,编码控制单元66可在ODR图片中的切片的切片标头中用信号发送表示先前图片的识别符的值。在一些实例中,所述识别符可为指示先前图片的显示次序的图片次序计数(POC)值。编码控制单元66可将先前图片的POC值存储于ODR图片的切片的切片标头中。在一个实例中,切片标头可包括由名称“pre_pic_POC”识别的语法元素。所述pre_pic_POC值可规定由编码控制单元66确定的先前图片的POC值。
在编码控制单元66已将先前图片的POC值存储于ODR图片中的切片的切片标头中之后,囊封单元可进一步将ODR图片囊封于NAL单元中。囊封单元可将NAL单元发送到输出接口,所述输出接口随后将所述NAL单元连同包括经编码视频数据的其它NAL单元一起发送到目的地装置。包括视频解码器(例如视频解码器30)的目的地装置可接收NAL单元且执行对一个或一个以上NAL单元的解码,如图3中进一步描述。
在一些实例中,编码控制单元66可通过比较存储于参考图片存储器64中的参考图片的时间水平值以识别具有最低时间水平值的一个或一个以上参考图片来确定在ODR图片中用信号发送的先前图片。时间水平值可指示一个或一个以上图片之间的解码相依性。在一个实例中,最低时间水平值可为时间水平值0。其它时间值可包括数字或子母数字值。一旦编码控制单元66已识别具有最低时间水平的一个或一个以上参考图片,编码控制单元66便可通过识别具有小于ODR图片的显示次序的显示次序的参考图片而将参考图片中的一者确定为先前图片。在其中编码控制单元66确定一个以上参考图片具有最低时间值的实例中,编码控制单元66可确定在显示次序中最接近于ODR图片且具有小于ODR图片的显示次序的参考图片。
在一些实例中,编码控制单元66可通过比较ODR图片的解码次序与存储于参考图片存储器64中的参考图片的解码次序以识别具有最接近于ODR图片的解码次序的解码次序的参考图片来确定在ODR图片中用信号发送的先前图片。举例来说,编码控制单元66可搜索存储于参考图片存储器64中的参考图片以将具有最接近于ODR图片的解码次序的解码次序的参考图片确定为先前图片。编码控制单元可仅搜索具有小于ODR图片的显示次序的参考图片。在一些实例中,每一图片具有一解码次序值,编码控制单元66可使用所述解码次序值来确定每一相应图片的解码次序。一旦编码控制单元66已识别在解码次序中最接近于ODR图片且具有小于ODR图片的显示次序的图片,编码控制单元66便可将所述图片确定为先前图片。
在一些实例中,编码控制单元66可通过比较ODR图片的显示次序与存储于参考图片存储器64中的参考图片的显示次序以识别具有最接近于ODR图片的显示次序的显示次序的参考图片来确定在ODR图片中用信号发送的先前图片。举例来说,编码控制单元66可搜索存储于参考图片存储器64中的参考图片以将具有最接近于ODR图片的解码次序的显示次序的参考图片确定为先前图片。编码控制单元66可仅搜索具有小于ODR图片的显示次序的参考图片。一旦编码控制单元66已识别在显示次序中最接近于ODR图片且具有小于ODR图片的显示次序的图片,编码控制单元66便可将所述图片确定为先前图片。
如先前所描述,编码控制单元66可基于时间水平、解码次序或显示次序来确定待在ODR图片中用信号发送的先前图片。在一些实例中,编码控制单元66可完全地或部分地基于时间水平、解码次序或显示次序的任何组合确定先前图片而确定先前图片。在一些实例中,编码控制单元66还可结合时间水平、解码次序或显示次序中的任一者而使用额外技术以确定先前图片。
如图2中所示,视频编码器20是视频编码器的一个实例,其经配置以:编码开放性解码刷新(ODR)图片;确定具有小于ODR图片的显示次序值的显示次序值且具有等于零的时间识别符值的先前经译码图片;以及用信号发送表示所确定的先前经译码图片的识别符的用于ODR图片的语法数据以致使视频解码器基于所确定的先前经译码图片的识别符来确定ODR图片是否正被用于随机存取。
图3为说明视频解码器30的一实例的方框图,当图片被用于随机存取时,视频解码器30可实施用于解码图片缓冲器(DPB)的改进的管理的技术。在图3的实例中,视频解码器30包括熵解码单元70、运动补偿单元72、帧内预测单元74、逆量化单元76、逆变换单元78、参考图片存储器82和求和器80。在一些实例中,可在本发明中将参考图片存储器82称作图片缓冲器或解码图片缓冲器。在一些实例中,视频解码器30可执行解码回合,所述解码回合一般与关于视频编码器20(图2)所描述的编码回合互逆。运动补偿单元72可基于从熵解码单元70接收的运动向量而产生预测数据,而帧内预测单元74可基于从熵解码单元70接收的帧内预测模式指示符而产生预测数据。
在解码过程期间,视频解码器30从视频编码器20接收经编码视频位流,所述经编码视频位流表示经编码视频切片的视频块和相关联的语法元素。视频解码器30的熵解码单元70对所述位流进行熵解码以产生量化系数、运动向量或帧内预测模式指示符和其它语法元素。熵解码单元70将运动向量和其它语法元素转发到运动补偿单元72。视频解码器30可接收视频切片层级和/或视频块层级处的语法元素。
当视频切片被译码为经帧内译码(I)切片时,帧内预测单元74可基于用信号发送的帧内预测模式和来自当前帧或图片的先前经解码块的数据而产生当前视频切片的视频块的预测数据。当视频图片被译码为经帧间译码(即,B、P或GPB)切片时,运动补偿单元72基于从熵解码单元70接收的运动向量和其它语法元素而产生当前视频切片的视频块的预测性块。所述预测性块可根据参考图片列表中的一者内的参考图片中的一者而产生。视频解码器30可基于存储于参考图片存储器92中的参考图片而使用默认建构技术来建构参考图片列表(列表0和列表1)。运动补偿单元72通过解析运动向量和其它语法元素来确定当前视频切片的视频块的预测信息,且使用所述预测信息来产生正被解码的当前视频块的预测性块。举例来说,运动补偿单元72使用所接收的语法元素中的一些语法元素来确定用以译码视频切片的视频块的预测模式(例如,帧内或帧间预测)、帧间预测切片类型(例如,B切片、P切片或GPB切片)、切片的参考图片列表中的一者或一者以上的建构信息、切片的每一经帧间编码视频块的运动向量、切片的每一经经帧间译码视频块的帧间预测状态,和用以解码当前视频切片中的视频块的其它信息。
运动补偿单元72还可基于内插滤波器来执行内插。运动补偿单元72可使用如由视频编码器20在视频块的编码期间所使用的内插滤波器来计算参考块的子整数像素的内插值。在此状况下,运动补偿单元72可根据所接收的语法元素来确定由视频编码器20使用的内插滤波器且使用所述内插滤波器来产生预测性块。
逆量化单元76逆量化(即,解量化)提供于位流中且由熵解码单元80解码的经量化变换系数。逆量化过程可包括使用由视频解码器30针对视频切片中的每一视频块计算的量化参数QPY以确定量化程度以及同样地应加以应用的逆量化的程度。
逆变换单元78将逆变换(例如,逆DCT、逆整数变换或概念上类似的逆变换过程)应用于变换系数,以便在像素域中产生残余块。
在运动补偿单元82基于运动向量和其它语法元素而产生用于当前视频块的预测性块之后,视频解码器30通过对来自逆变换单元78的残余块和由运动补偿单元82产生的对应的预测性块求和而形成经解码视频块。求和器90表示执行此求和运算的一个或一个以上组件。如果需要,则还可应用解块滤波器以对经解码块滤波以便移除块效应假影。还可使用其它循环滤波器(在译码循环内或在译码循环之后)以使像素转变平滑,或以其它方式改进视频质量。给定帧或图片中的经解码视频块接着被存储于参考图片存储器92中,参考图片存储器92存储用于随后的运动补偿的参考图片。参考图片存储器82还存储供稍后呈现于显示装置(例如图1的显示装置32)上的经解码视频。
如上文所描述,可将由视频编码器30解码的图片的视频数据存储于参考图片存储器82中。解码控制单元84可执行存储器管理控制操作以将参考图片的视频数据存储于参考图片存储器82中以及移除存储于参考图片存储器82中的参考图片的视频数据。在一些实例中,当图片被用于随机存取时,解码控制单元84可实施本发明的技术以改进视频解码器中的参考图片存储器的管理。
为了说明随机存取的实例,用户可请求查看由显示装置显示的视频。应用程序(例如网络浏览器或媒体播放器)可使得用户能够控制视频的显示。可基于由视频解码器30解码的图片来显示所述视频。在当前实例中,用户可提供用以随机地存取视频的不同位置的输入,使得由应用程序接收所述输入。所述应用程序可识别与所选位置相关联的图片且(例如)在网络串流期间向源装置或向可由输入接口存取的存储媒体请求图片。所述应用程序可请求以RAP图片开始的经编码视频数据。视频解码器30可从所述应用程序接收RAP图片。
视频解码器30可使用ODR或IDR图片来提供对经译码视频位流的各个位置的随机存取。视频解码器30可使用以提供随机存取的可独立解码图片的实例包括即时解码刷新(IDR)和开放性解码刷新(ODR)RAP图片。如先前所描述,IDR图片是封闭性GOP的可独立解码I图片,而ODR图片是开放性GOP的I图片。
根据本发明的技术,解码控制单元84可最初在经编码视频流中接收ODR RAP图片以进行解码。解码控制单元84可确定所述ODR RAP图片是否为ODR图片。举例来说,解码控制单元84可确定图片中的切片的切片标头中的语法元素是否指示所述图片为ODR图片。作为一个实例,可将存储于ODR图片中的切片的切片标头中的OdrPicFlag变量设定为切片标头中的真值以指示所述图片为ODR图片。当解码控制单元84确定ODR RAP图片为ODR图片时,解码控制单元84可解码所述图片。
在解码ODR RAP图片后,解码控制单元84可即刻确定存储于ODR图片中的切片的标头中的先前图片的识别符。举例来说,解码控制单元84可识别ODR图片中的切片的切片标头中的语法元素,所述语法元素识别先前图片。如先前在图1中所描述,ODR图片可包括pre_pic_POC语法元素,其指示先前图片的显示次序值。解码控制单元84可接着通过比较pre_pic_POC语法元素的值与存储于解码控制单元84的参考图片存储器中的图片的显示次序值以识别匹配来确定先前图片是否存储于所述参考图片存储器中。
在当前实例中,解码控制单元82可确定参考图片存储器82不包括由存储于ODR图片中的识别符识别的先前图片。因此,解码控制单元84可确定ODR图片正被用作ODR RAP。解码控制单元84可因此将随机存取状态变量设定为真,因为解码控制单元84已确定ODR图片正被用于随机存取。
响应于确定ODR图片正被用于随机存取,解码控制单元84可在解码ODR图片之后将参考图片存储器82中的图片标记为不用于参考。在一些实例中,解码控制单元84可将所有图片标记为不使用。在解码ODR图片之后,解码控制单元84可使随机存取状态保持不变。解码控制单元84可随后从参考图片存储器82删除已被标记为具有不使用状态的图片。
以此方式,图3的视频解码器30表示视频解码器的实例,其经配置以:根据与视频数据的开放性解码刷新(ODR)图片相关联的数据来确定视频数据的先前图片的识别符;确定先前图片当前是否存储于参考图片存储器中;以及当先前图片未存储于参考图片存储器中时,仅解码视频数据的具有大于ODR图片的显示次序值的显示次序值的图片的数据。
当随机存取状态指示解码控制单元84正执行随机存取时,解码控制单元84可解码具有大于ODR图片的显示次序值的显示次序的图片的视频数据。举例来说,当视频解码器30将ODR图片用作ODR RAP(例如,用于随机存取)时,解码控制单元84可进一步产生用以存储ODR RAP图片的POC值的变量。在一个实例中,可将所述变量命名为“CurrODRPOC”。在确定ODR图片正被用作ODR RAP后,解码控制单元84可即刻将CurrODRPOC设定为ODR图片的POC值。
解码控制单元84可解析在随后从源装置12接收的每一NAL单元中所包括的切片的切片标头。对于每一NAL单元,解码控制单元84可确定切片的POC值是否包括于NAL单元中。举例来说,在一个实例中,解码控制单元84可比较NAL单元中所包括的切片的POC值与存储于CurrODRPOC中的POC值。如果切片的POC值小于ODR RAP图片的POC值,则解码控制单元84可跳过对所述片的经编码视频数据的解码。以此方式,这些NAL单元未被进一步解码。因此,视频解码器30可制止解码不是从所选ODRRAP图片进行解码所需的NAL单元的视频数据。在一些实例中,响应于确定ODR图片正被用作随机存取点,视频解码器30可跳过具有小于ODR图片的显示次序值的显示次序值和大于ODR图片的解码次序值的解码次序值的图片的数据的输出。因此,当解码控制单元84确定ODR RAP图片已被选择用于随机存取时,本发明的技术可减少视频数据的不必要解码和输出。
在一个实例中,解码控制单元84可确定切片的POC值大于ODR RAP图片的POC值。在此些实例中,随后解码切片的经编码视频。响应于确定NAL单元中的切片的POC值大于ODR RAP图片的POC值,解码控制单元84还可改变随机存取状态以指示供图片的正常、顺序显示而非随机存取的图片的解码。举例来说,解码控制单元84可设定随机存取状态变量以指示供图片的正常、顺序显示的图片的解码。
图4为概念图,其说明包括封闭性图片群组(GOP)102的视频片段100的一个实例。可将GOP描述为视频序列的顺序(以呈现次序)图片的分组。视频片段可包括类似于GOP102的任何数目个GOP。
图4的实例描绘视频片段100的一部分。所述视频片段包括多个图片104A-104K。片段100可包含一个或一个以上图片群组(GOP),例如GOP 102。可将所述一个或一个以上GOP 102描述为视频表示的图片的分组。
图4中所说明的GOP 102为封闭性GOP的实例。即,可解码图片104B-104I中的每一者而不参考在GOP 102外部的图片(例如,图片104A、104J和104K)。如图2中所示,图片104A在(以呈现次序)GOP 102的图片104B-104I前面。图片104J-104K在GOP102的图片104B-104I后面(以呈现次序)。图片104A和104J-104K可为片段100的另一GOP的一部分。
图片104A-104K的呈现次序可不同于所述图片的解码次序。举例来说,GOP可包括I、B或P图片的任何组合。经帧内译码图片(I图片)为可独立解码的那些图片,其意味着:为了解码I图片,解码器无需依赖于其它图片的内容。在图4的实例中,图片104A和104I为I图片的实例。P图片可相对于在一个方向上的一个或一个以上图片而被帧间译码。在图4的实例中,图片104B、104C和104E为P图片的实例。B图片可相对于在两个方向上的一个或一个以上图片而被帧间译码。在图4的实例中,图片104D、104F、104G和104H为B图片的实例。
如上文所论述,根据图4的实例,图片104A-104K的解码次序可不同于所述图片的呈现次序。举例来说,当解码图片104B-104I时,图片104I(I图片)可首先被解码。如由箭头108所指示,图片104E依赖于图片104I的内容以被正确解码。因而,可在解码图片104I之后解码图片104E。
如由箭头106所指示,图片104C可依赖于图片104E的内容以被正确解码。如由箭头110所指示,图片104G可依赖于图片104E与图片104I两者的内容以被正确解码。因而,在一些实例中,可在图片104I和104E的解码之后发生图片104C和104G的解码。图片104B、104D、104F和104H各自分别依赖于图片104C、104E、104G和104I中的一者或一者以上的内容,且因此可在已解码图片104C、104E、104G和104I之后被解码。
如上文所描述,可将即时解码刷新(IDR)存取点描述为封闭性GOP(例如,图4中的GOP 102)的存取点。可将仅包括不依赖于在GOP外部的图片的内容而可正确解码的图片的GOP视为封闭性GOP 102。
图4描绘IDR存取点的两个实例。如图2实例中所示,图片104A不依赖于任何其它图片的内容以可正确解码,即,图片104A不包括指示对另一图片的依赖性的任何箭头。可将图片104A本身视为GOP,因为不存在在图片104A前面的图片。同样,可将图片104A视为IDR存取点,因为图片104A为GOP的存取点,其不依赖于在GOP(仅由图片104A组成)外部的任何图片的内容以被正确解码。
还可将图片104I视为封闭性GOP 102的IDR存取点。如图4中所示,例如,图片104I为可独立解码而不依赖于GOP 102的任何其它图片(例如,图片104B-104H)的内容的I图片。尽管如上文所描述图片104B-104H中的每一者依赖于GOP 102内的其它图片的内容以被正确解码,但图片104B-104H皆不依赖于在GOP 102外部的任何图片的内容。因而,可将GOP 102视为包括IDR存取点(即图片104I)的封闭性GOP。
根据本发明的技术,如图1和3中所示的视频解码器30可最初解码图片以供正常、顺序显示。视频解码器30可因此设定随机存取状态以指示图片被解码以供正确、顺序显示。在稍后的时间,视频解码器30可接收用以随机地存取视频片段100的图片104F的指示。因此,视频解码器30可识别可用以恰当地解码和显示图片104F的最接近的可独立解码图片。
在当前实例中,图片104F取决于IDR图片104I以被恰当地解码,IDR图片104I还是在解码次序中最接近于图片104F的可独立解码图片。视频解码器30可因此确定IDR图片104I可被用于随机存取。因此,视频解码器30可将针对IDR图片104I和在解码次序中在IDR图片104I后面的随后可解码图片的请求发送到视频编码器20。响应于接收到IDR图片104I,视频解码器30可确定IDR图片104I是IDR还是ODR图片。由于图片104I为IDR图片,所以视频解码器30使随机存取状态保持不变。由于随机存取状态指示图片经解码以供正常、顺序显示,所以视频解码器30解码IDR图片104I和图片104E、104G和104F。视频解码器30可接着将经解码图片104F发送到显示装置以供显示。
图5为概念图,其说明视频片段150的至少一部分的一个实例,所述视频片段150包括包含开放性解码刷新(ODR)存取点的开放性GOP 152。类似于图4的实例,图片154A为I图片和IDR存取点。还类似于图4的实例,图片154I为对应于随机存取点的I图片。然而,图5实例与图4实例的不同之处在于GOP 152的在显示次序中在I图片154I前面的图片依赖于图片154A的内容以便可正确解码。举例来说,如由方向箭头所指示,图片154B、154C和154E中的每一者直接依赖于图片154A的内容。图片154D和154F-154H各自间接地依赖于图片154A的内容,因为各自至少部分地依赖于图片154B、154C和154E中的一者或一者以上的内容以被正确解码。然而,如还在图5中所描绘,可正确地解码在显示次序中在I图片154I后面的图片154J和154K而不依赖于在I图片154I前面的任何图片。因此,I图片154I可为用于随机存取的ODR。
根据本发明的技术,如图1和3中所示的视频解码器30可最初解码图片以供正常、顺序显示。视频解码器30可因此设定随机存取状态以指示图片经解码以供正常、顺序显示。在稍后的时间,视频解码器30可接收用以随机地存取视频片段150的图片154C的指示。举例来说,包括视频解码器30的客户端装置可接收用以在图片154F处开始显示视频的指示。因此,视频解码器30可识别可用以恰当地解码和显示图片154F的最接近的可独立解码图片。
在当前实例中,图片154F取决于ODR图片154I以被恰当解码,ODR图片154I还是在解码次序中最接近于图片154F的可独立解码图片。视频解码器30可因此确定ODR图片154I可被用于随机存取。因此,视频解码器30可将针对ODR图片154I和在解码次序中在ODR图片154I后面的随后可解码图片的请求发送到视频编码器20。响应于接收到ODR图片154I,视频解码器30可确定ODR图片154I是IDR还是ODR图片。
在当前实例中,响应于确定ODR图片正被用作用于随机存取的ODR RAP,视频解码器30可将随机存取状态变量设定为真,且在解码ODR图片之后将参考图片存储器中的图片标记为不用于参考。视频解码器30可随后从参考图片存储器删除具有不使用状态的图片。
当在将随机存取变量设定为真的同时接收后续图片时,视频解码器30可仅解码视频数据的具有大于ODR图片的显示次序值的显示次序值的图片的数据。举例来说,当ODR图片154I正被用于随机存取时,视频解码器30可进一步产生用以存储ODR RAP图片的POC值的变量(例如如图1中所描述的CurrODRPOC)。在确定ODR图片154I正被用作ODR RAP后,视频解码器30可即刻将CurrODRPOC设定为ODR图片的POC值。当视频解码器30从源装置12接收后续NAL单元时,视频解码器30可解析每一NAL单元中所包括的切片的切片标头。
对于每一NAL单元而言,视频解码器30可确定切片的POC值是否包括于所述NAL单元中。举例来说,在一个实例中,视频解码器30可比较NAL单元中所包括的切片的POC值与存储于CurrODRPOC中的POC值。如果切片的POC值小于ODR RAP图片的POC值,则视频解码器30可跳过对NAL单元中的经编码视频数据的解码。以此方式,视频解码器30可制止解码不是从所选ODR RAP图片进行解码所需的NAL单元的视频数据。响应于确定ODR图片正被用于随机存取,视频解码器30还可跳过具有小于ODR图片的显示次序值的显示次序值和大于ODR图片的解码次序值的解码次序值的图片的数据的输出。在当前实例中,视频解码器30可因此解码ODR图片154I和图片154E、154G和154F。视频解码器30可接着将经解码图片154F发送到显示装置以供显示。
图6为根据本发明的技术的ODR图片和在所述ODR图片中所识别的先前经编码图片的概念图。图6包括开放性GOP 170和封闭性GOP 172。如图6中所示,封闭性GOP170包括图片174,其可为I图片。开放性GOP 172包括图片176。B图片176A-176C和ODR图片176D包括于图片176中,其可为可独立解码图片(例如,I图片)。最初,视频编码器20(例如,如图1和2中所示)可编码视频序列中的ODR图片176D。当视频编码器20编码ODR图片176D时,视频编码器20可确定具有小于ODR图片176D的显示次序的显示次序的先前经编码图片174。在一些实例中,视频编码器20可搜索参考图片存储器以识别先前经编码图片174。视频编码器20可通过确定开放性GOP 172的一个或一个以上图片是否取决于先前图片174来确定先前图片174。举例来说,包括经编码ODR图片176D的开放性GOP 172的图片176A-176C(例如,前导图片)可取决于先前图片174以进行恰当解码。在一些实例中,视频编码器20可将在解码次序和显示次序中在ODR图片前面且具有等于0的时间水平的为最接近图片的图片174确定为先前经编码图片。不同于先前图片174,图片176A-176C可具有大于零的时间水平且因此视频编码器20可不将这些图片中的任一者选择作为先前图片。
当视频编码器20确定先前图片174时,视频编码器20可在ODR图片176D中的切片的标头中用信号发送先前图片174的识别符。标头可为切片标头或图片参数集。在一些实例中,识别符可为指示先前图片174的显示次序的图片次序计数(POC)值。视频编码器20可将先前图片174的POC值存储于ODR图片176D中的切片的切片标头中。在一个实例中,切片标头可包括由名称“pre_pic_POC”识别的语法元素。所述pre_pic_POC值可规定由视频编码器20确定的先前图片的POC值。
在视频编码器20已将先前图片174的POC值存储于ODR图片176D中的切片的切片标头中之后,囊封单元可进一步将ODR图片176D囊封于NAL单元中。输出接口可从囊封单元接收NAL单元且可随后将所述NAL单元连同包括经编码视频数据的其它NAL单元一起发送到目的地装置以进行解码。
图7为根据本发明的技术的流程图,其说明可由视频解码器(例如,如图1和3中所示)实施的操作。将关于如图1和3中所示的视频解码器30来描述图7的实例操作。如图7中所示,视频解码器30可最初开始播放视频序列(190)。举例来说,用户可提供用以在视频序列的开始处开始回放视频数据的输入。
在稍后的时间点,用户可导航到视频序列的无序时间位置(192)。在一个实例中,所述无序时间位置可为视频序列中的不是显示次序中的下一图片的不同图片。在此些实例中,视频解码器30可因此随机地存取视频序列中的另一图片。视频解码器30可应用本发明的技术以确定是否已发生随机存取(194)。
视频解码器30可基于如本发明中所描述的随机存取来执行参考图片存储器管理技术(196)。在图8A和8B中进一步描述经执行以确定是否已发生随机存取以及执行参考图片存储器管理技术的操作。在图8A和8B的技术中,视频解码器30可将参考图片存储器中的图片标记为不使用且进一步仅解码在视频序列的随机存取图片处开始回放所必需的图片。在确定了是否已发生随机存取且随后应用本发明的技术后,视频解码器30可即刻开始回放视频序列的不同图片(198)。以此方式,视频解码器30可执行随机存取以存取视频序列的不同图片。现在在图8A和8B中进一步描述用以执行随机存取的技术。
图8A和8B为根据本发明的技术的流程图,其说明可由视频解码器执行的操作的实例。将关于如图1和3中所示的视频解码器30来描述图7的实例操作。如图8A中所示,视频解码器30可最初接收用以解码在解码次序中不在最近解码的图片后面的图片的指示(例如,用户输入)。因此,视频解码器30可确定由所述指示识别的经编码图片(210)。视频解码器30可确定所述经编码图片是否为ODR图片(212)。如果视频解码器30确定所述经编码图片为ODR图片,则视频解码器30可解码ODR图片(214)。
在解码了ODR图片后,视频解码器30可即刻确定视频解码器30的参考图片存储器(例如,解码图片缓冲器)是否包括由ODR图片识别的先前经编码图片(216)。如果参考图片存储器包括先前经编码图片,则视频解码器30将一种或一种以上常规参考图片存储器技术应用于参考图片存储器且继续选择后续经编码图片以进行解码(210)。
如果参考图片存储器不包括由ODR图片识别的先前经编码图片,则视频解码器30可设定随机存取状态变量以指示视频解码器30正执行随机存取(218)。视频解码器30可接着将参考图片存储器中所包括的图片标记为不用于参考(220)。以此方式,视频解码器30可在稍后从参考图片存储器移除被标记为不使用的图片。在将图片标记为不用于参考之后,视频解码器30可将经解码ODR图片存储于参考图片存储器中(222)。视频解码器30接着确定下一经编码图片以进行解码(210)。
图8B说明当将由视频解码器解码的经编码图片不是ODR图片时可由视频解码器执行的操作。当被确定由视频解码器30解码的经编码图片不是ODR图片时,视频解码器30确定随机存取状态变量是否指示视频解码器30正执行随机存取(230)。如果随机存取状态变量指示视频解码器30不是正在执行随机存取,则视频解码器30解码所述图片(232)。视频解码器30可输出具有大于ODR图片的显示次序值的显示次序值的图片的数据。视频解码器30可接着确定视频序列中的下一经编码图片以进行解码(238)。
如图8B中所示,当视频解码器30确定随机存取状态变量指示视频解码器30正执行随机存取时,视频解码器30可确定被确定用于解码的图片的显示次序是否小于ODR图片的显示次序(232)。以此方式,视频解码器30可确定视频数据的开放性解码刷新(ODR)图片正被用作随机存取点。如果经选择用于解码的图片的显示次序小于ODR图片的显示次序,则视频解码器30可使解码状态变量保持不变以指示视频正执行随机存取。因此,视频解码器30制止进一步解码所选图片。视频解码器30可因此制止输出具有小于ODR图片的显示次序值的显示次序值和大于ODR图片的解码次序值的解码次序值的图片的数据。视频解码器30可接着确定下一经编码图片以进行解码(238)。
在一些实例中,视频解码器30可确定经选择用于解码的图片的显示次序大于ODR图片的显示次序(232)。以此方式,视频解码器30可确定视频数据的开放性解码刷新(ODR)图片正被用作随机存取点。因此,视频解码器30可设定随机存取状态变量以指示视频解码器30不再执行随机存取(即,视频解码器30正执行视频图片的正常解码)(234)。在设定随机存取状态变量以指示视频解码器30正执行视频图片的正常解码之后,视频解码器30可解码所选图片(236)。视频解码器30可接着确定下一经编码图片以进行解码(238)。
以此方式,图8A和图8B的方法表示一种方法的实例,所述方法包括:确定视频数据的开放性解码刷新(ODR)图片正被用作随机存取点;以及基于所述确定,跳过具有小于ODR图片的显示次序值的显示次序值和大于ODR图片的解码次序值的解码次序值的图片的数据的输出。
图9说明可由视频编码器执行以在ODR图片的语法数据中用信号发送先前图片以实现本发明的随机存取技术的操作。如图9中所示,视频编码器(例如图1和2中的视频编码器20)可编码ODR图片(250)。视频编码器20可确定先前由视频编码器20编码的图片(252)。在确定所述图片后,视频编码器20可即刻确定先前经译码图片是否具有小于ODR图片的显示次序的显示次序(254)。视频编码器20可进一步确定先前经编码图片的时间水平值是否为零。当先前经译码图片具有小于ODR图片的显示次序的显示次序和为零的时间水平时,视频编码器20可用信号发送识别先前经译码图片的用于ODR图片的语法数据(256)。通过在ODR图片的语法数据中用信号发送先前经译码图片,当执行如本发明中所描述的随机存取技术时,视频解码器可随后使用语法数据。在一些实例中,视频编码器20可确定所确定的图片的显示次序不小于ODR图片的显示次序。在此些实例中,视频编码器20可确定另一先前经译码图片,且随后确定显示次序是否小于ODR图片以及是否具有等于零的时间水平。
应认识到,取决于实例,本文中所描述的技术中的任一者的某些动作或事件可以不同序列执行、可增添、合并或完全省略(例如,对于实践所述技术而言不是所有所描述的动作或实践都是必要的)。此外,在某些实例中,动作或事件可(例如)经由多线程处理、中断处理或多个处理器同时地而非循序地执行。
在一个或一个以上实例中,所描述的功能可以硬件、软件、固件或其任何组合来实施。如果以软件来实施,则所述功能可作为一个或一个以上指令或代码而存储于计算机可读媒体上或经由计算机可读媒体进行传输,且由基于硬件的处理单元执行。计算机可读媒体可包括计算机可读存储媒体(其对应于例如数据存储媒体等有形媒体)或通信媒体,通信媒体包括(例如)根据通信协议促进计算机程序从一处转移到另一处的任何媒体。以此方式,计算机可读媒体一般可对应于:(1)非暂时性的有形计算机可读存储媒体;或(2)例如信号或载波的通信媒体。数据存储媒体可为可由一个或一个以上计算机或一个或一个以上处理器存取以检索指令、代码和/或数据结构以用于实施本发明中所描述的技术的任何可用媒体。计算机程序产品可包括计算机可读媒体。
举例来说而非限制,此些计算机可读存储媒体可包含RAM、ROM、EEPROM、CD-ROM或其它光盘存储器、磁盘存储器或其它磁性存储装置、快闪存储器或可用以存储呈指令或数据结构的形式的所要程序代码且可由计算机存取的任何其它媒体。而且,恰当地将任何连接称为计算机可读媒体。举例来说,如果使用同轴电缆、光纤缆线、双绞线、数字订户线(DSL)或无线技术(例如红外线、无线电和微波)而从网站、服务器或其它远程源传输指令,则同轴电缆、光纤缆线、双绞线、DSL或无线技术(例如红外线、无线电和微波)包括于媒体的定义中。然而,应理解,计算机可读存储媒体和数据存储媒体不包括连接、载波、信号或其它暂时性媒体,而是改为针对非暂时性有形存储媒体。如本文中所使用,磁盘和光盘包括压缩光盘(CD)、激光光盘、光盘、数字多功能光盘(DVD)、软盘和蓝光光盘,其中磁盘通常以磁性方式再现数据,而光盘用激光以光学方式再现数据。以上各者的组合也应包括于计算机可读媒体的范围内。
可通过例如一个或一个以上数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA)或其它等效集成或离散逻辑电路等一个或一个以上处理器来执行指令。因此,本文中所使用的术语“处理器”可指代上述结构或适于实施本文中所描述的技术的任何其它结构中的任一者。另外,在一些方面中,可将本文中所描述的功能性提供于经配置以用于编码和解码的专用硬件和/或软件模块内,或并入于组合式编解码器中。而且,所述技术可完全实施于一个或一个以上电路或逻辑元件中。
本发明的技术可实施于广泛多种装置或设备中,所述装置或设备包括无线手持机、集成电路(IC)或一组IC(例如,芯片组)。各种组件、模块或单元描述于本发明中以强调经配置以执行所揭示技术的装置的功能方面,但其不一定需要通过不同硬件单元来实现。相反,如上文所描述,可将各种单元组合于编解码器硬件单元中,或通过互操作的硬件单元(包括如上文所描述的一个或一个以上处理器)的集合而结合合适软件和/或固件来提供所述单元。
已描述各种实例。这些和其它实例在所附权利要求书的范围内。

Claims (60)

1.一种方法,其包含:
确定视频数据的开放性解码刷新ODR图片正被用作随机存取点;以及
基于所述确定,跳过具有小于所述ODR图片的显示次序值的显示次序值和大于所述ODR图片的解码次序值的解码次序值的图片的数据的输出。
2.根据权利要求1所述的方法,其进一步包含:
根据与视频数据的所述开放性解码刷新ODR图片相关联的数据来确定所述视频数据的先前图片的识别符;
确定所述先前图片当前是否存储于参考图片存储器中;以及
仅解码所述视频数据的具有大于所述ODR图片的所述显示次序值的显示次序值的图片的数据。
3.根据权利要求2所述的方法,其进一步包含:响应于确定所述先前帧未存储于所述参考帧存储器中,激活随机存取状态并将所述ODR帧存储于所述参考帧存储器中。
4.根据权利要求3所述的方法,其进一步包含:
响应于接收到所述视频数据的当前图片,确定所述随机存取状态是否被激活;以及
当所述随机存取状态未被激活时,解码所述视频数据的所述当前图片。
5.根据权利要求3所述的方法,其中当所述随机存取状态被激活时,所述方法进一步包含:
确定与所述当前图片相关联的第一显示次序值是否小于与所述ODR图片相关联的第二显示次序值;
当所述第一显示次序值小于所述第二显示次序值时,跳过对所述当前图片的解码;以及
当所述第一显示次序值大于所述第二显示次序值时,去活所述随机存取状态并解码所述当前图片。
6.根据权利要求3所述的方法,其进一步包含:
当所述随机存取状态被激活时,将存储于解码图片缓冲器中的每一图片设定为不用于参考。
7.根据权利要求6所述的方法,其进一步包含从所述解码图片缓冲器删除被设定为不用于参考的每一图片。
8.根据权利要求3所述的方法,其进一步包含:
接收在图片的切片中用信号发送的语法信息,其中所述语法信息指示待执行的至少一个存储器管理过程;以及
当所述随机存取状态被激活时,忽视所述存储器管理过程。
9.根据权利要求2所述的方法,其进一步包含:
接收用于从所述视频数据的特定时间实例开始回放的请求的数据;
确定所述ODR图片的所述显示次序值对应于所述时间实例;以及
基于所述确定而确定用于解码的所述ODR图片。
10.根据权利要求2所述的方法,其进一步包含解析所述视频数据的具有小于所述ODR图片的所述显示次序值的显示次序值且具有大于所述ODR图片的解码次序值的解码次序值的图片。
11.根据权利要求1所述的方法,其进一步包含:
输出具有大于所述ODR图片的显示次序值的显示次序值的图片的数据。
12.一种用于解码视频数据的设备,所述设备包含视频解码器,所述视频解码器经配置以:
确定视频数据的开放性解码刷新ODR图片正被用作随机存取点;以及
基于所述确定,跳过具有小于所述ODR图片的显示次序值的显示次序值和大于所述ODR图片的解码次序值的解码次序值的图片的数据的输出。
13.根据权利要求12所述的设备,其中所述视频解码器进一步经配置以:
根据与视频数据的所述开放性解码刷新ODR图片相关联的数据来确定所述视频数据的先前图片的识别符;
确定所述先前图片当前是否存储于参考图片存储器中;以及
当所述先前图片未存储于所述参考图片存储器中时,仅解码所述视频数据的具有大于所述ODR图片的所述显示次序值的显示次序值的图片的数据。
14.根据权利要求13所述的设备,其中所述视频解码器进一步经配置以:
响应于确定所述先前图片未存储于所述参考图片存储器中,激活随机存取状态并将所述ODR图片存储于所述参考图片存储器中。
15.根据权利要求14所述的设备,其中所述视频解码器进一步经配置以:
响应于接收到所述视频数据的当前图片,确定所述随机存取状态是否被激活;以及
当所述随机存取状态未被激活时,解码所述视频数据的所述当前图片。
16.根据权利要求15所述的设备,其中当所述随机存取状态被激活时,所述视频解码器进一步经配置以:
确定与所述当前图片相关联的第一显示次序值是否小于与所述ODR图片相关联的第二显示次序值;
当所述第一显示次序值小于所述第二显示次序值时,跳过对所述当前图片的解码;以及
当所述第一显示次序值大于所述第二显示次序值时,去活所述随机存取状态并解码所述当前图片。
17.根据权利要求14所述的设备,其中所述视频解码器进一步经配置以:
当所述随机存取状态被激活时,将存储于解码图片缓冲器中的每一图片设定为不用于参考。
18.根据权利要求17所述的设备,其中所述视频解码器进一步经配置以:
从所述解码图片缓冲器删除被设定为不用于参考的每一图片。
19.根据权利要求14所述的设备,其中所述视频解码器进一步经配置以:
接收在图片的切片中用信号发送的语法信息,其中所述语法信息指示待执行的至少一个存储器管理过程;以及
当所述随机存取状态被激活时,忽视所述存储器管理过程。
20.根据权利要求13所述的设备,其中所述视频解码器进一步经配置以:
接收用于从所述视频数据的特定时间实例开始回放的请求的数据;
确定所述ODR图片的所述显示次序值对应于所述时间实例;以及
基于所述确定而确定用于解码的所述ODR图片。
21.根据权利要求13所述的设备,其中所述视频解码器进一步经配置以:
解析所述视频数据的具有小于所述ODR图片的所述显示次序值的显示次序值且具有大于所述ODR图片的解码次序值的解码次序值的图片。
22.根据权利要求12所述的设备,其中所述视频解码器经配置以输出具有大于所述ODR图片的显示次序值的显示次序值的图片的数据。
23.一种计算机程序产品,其包含计算机可读存储媒体,所述计算机可读存储媒体具有存储于其上的指令,所述指令在执行时致使用于解码视频数据的装置的处理器进行以下操作:
确定视频数据的开放性解码刷新ODR图片正被用作随机存取点;以及
基于所述确定,跳过具有小于所述ODR图片的显示次序值的显示次序值和大于所述ODR图片的解码次序值的解码次序值的图片的数据的输出。
24.根据权利要求23所述的计算机程序产品,其进一步包含致使所述处理器进行以下操作的指令:
根据与视频数据的所述开放性解码刷新ODR图片相关联的数据来确定所述视频数据的先前图片的识别符;
确定所述先前图片当前是否存储于参考图片存储器中;以及
当所述先前图片未存储于所述参考图片存储器中时,仅解码所述视频数据的具有大于所述ODR图片的所述显示次序值的显示次序值的图片的数据。
25.根据权利要求24所述的计算机程序产品,其进一步包含致使所述处理器进行以下操作的指令:
响应于确定所述先前图片未存储于所述参考图片存储器中,激活随机存取状态并将所述ODR图片存储于所述参考图片存储器中。
26.根据权利要求25所述的计算机程序产品,其进一步包含致使所述处理器进行以下操作的指令:
响应于接收到所述视频数据的当前图片,确定所述随机存取状态是否被激活;以及
当所述随机存取状态未被激活时,解码所述视频数据的所述当前图片。
27.根据权利要求26所述的计算机程序产品,其进一步包含致使所述处理器在所述随机存取状态被激活时进行以下操作的指令:
确定与所述当前图片相关联的第一显示次序值是否小于与所述ODR图片相关联的第二显示次序值;
当所述第一显示次序值小于所述第二显示次序值时,跳过对所述当前图片的解码;以及
当所述第一显示次序值大于所述第二显示次序值时,去活所述随机存取状态并解码所述当前图片。
28.根据权利要求25所述的计算机程序产品,其进一步包含致使所述处理器进行以下操作的指令:
当所述随机存取状态被激活时,将存储于解码图片缓冲器中的每一图片设定为不用于参考。
29.根据权利要求28所述的计算机程序产品,其进一步包含致使所述处理器进行以下操作的指令:
从所述解码图片缓冲器删除被设定为不用于参考的每一图片。
30.根据权利要求25所述的计算机程序产品,其进一步包含致使所述处理器进行以下操作的指令:
接收在图片的切片中用信号发送的语法信息,其中所述语法信息指示待执行的至少一个存储器管理过程;以及
当所述随机存取状态被激活时,忽视所述存储器管理过程。
31.根据权利要求24所述的计算机程序产品,其进一步包含致使所述处理器进行以下操作的指令:
接收用于从所述视频数据的特定时间实例开始回放的请求的数据;
确定所述ODR图片的所述显示次序值对应于所述时间实例;以及
基于所述确定而确定用于解码的所述ODR图片。
32.根据权利要求24所述的计算机程序产品,其进一步包含致使所述处理器进行以下操作的指令:
解析所述视频数据的具有小于所述ODR图片的所述显示次序值的显示次序值且具有大于所述ODR图片的解码次序值的解码次序值的图片。
33.根据权利要求23所述的计算机程序产品,其进一步包含致使所述处理器进行以下操作的指令:
输出具有大于所述ODR图片的显示次序值的显示次序值的图片的数据。
34.一种用于解码视频数据的设备,所述设备包含:
用于确定视频数据的开放性解码刷新ODR图片正被用作随机存取点的装置;以及
用于基于所述确定而跳过具有小于所述ODR图片的显示次序值的显示次序值和大于所述ODR图片的解码次序值的解码次序值的图片的数据的输出的装置。
35.根据权利要求34所述的用于解码视频数据的设备,其进一步包含:
用于根据与视频数据的所述开放性解码刷新ODR图片相关联的数据来确定所述视频数据的先前图片的识别符的装置;
用于确定所述先前图片当前是否存储于参考图片存储器中的装置;以及
用于在所述先前图片未存储于所述参考图片存储器中时仅解码所述视频数据的具有大于所述ODR图片的所述显示次序值的显示次序值的图片的数据的装置。
36.根据权利要求35所述的用于解码视频数据的设备,其进一步包含:
用于响应于确定所述先前图片未存储于所述参考图片存储器中而激活随机存取状态并将所述ODR图片存储于所述参考图片存储器中的装置。
37.根据权利要求36所述的用于解码视频数据的设备,其进一步包含:
用于响应于接收到所述视频数据的当前图片而确定所述随机存取状态是否被激活的装置;以及
用于在所述随机存取状态未被激活时解码所述视频数据的所述当前图片的装置。
38.根据权利要求37所述的用于解码视频数据的设备,其进一步包含:
用于确定与所述当前图片相关联的第一显示次序值是否小于与所述ODR图片相关联的第二显示次序值的装置;
用于在所述第一显示次序值小于所述第二显示次序值时跳过对所述当前图片的解码的装置;以及
在所述第一显示次序值大于所述第二显示次序值时去活所述随机存取状态并解码所述当前图片。
39.根据权利要求36所述的用于解码视频数据的设备,其进一步包含:
用于在所述随机存取状态被激活时将存储于解码图片缓冲器中的每一图片设定为不用于参考的装置。
40.根据权利要求39所述的用于解码视频数据的设备,其进一步包含:
用于从所述解码图片缓冲器删除被设定为不用于参考的每一图片的装置。
41.根据权利要求36所述的用于解码视频数据的设备,其进一步包含:
用于接收在图片的切片中用信号发送的语法信息的装置,其中所述语法信息指示待执行的至少一个存储器管理过程;以及
用于在所述随机存取状态被激活时忽视所述存储器管理过程的装置。
42.根据权利要求35所述的用于解码视频数据的设备,其进一步包含:
用于接收用于从所述视频数据的特定时间实例开始回放的请求的数据的装置;
用于确定所述ODR图片的所述显示次序值对应于所述时间实例的装置;以及
用于基于所述确定而确定用于解码的所述ODR图片的装置。
43.根据权利要求35所述的用于解码视频数据的设备,其进一步包含:
用于解析所述视频数据的具有小于所述ODR图片的所述显示次序值的显示次序值且具有大于所述ODR图片的解码次序值的解码次序值的图片的装置。
44.根据权利要求34所述的用于解码视频数据的设备,其进一步包含:
用于输出具有大于所述ODR图片的显示次序值的显示次序值的图片的数据的装置。
45.一种编码视频数据的方法,所述方法包含:
编码开放性解码刷新ODR图片;
确定具有小于所述ODR图片的显示次序值的显示次序值且具有等于零的时间识别符值的先前经译码图片;以及
用信号发送表示所述所确定的先前经译码图片的识别符的用于所述ODR图片的语法数据以致使视频解码器基于所述所确定的先前经译码图片的所述识别符来确定所述ODR图片是否正被用于随机存取。
46.根据权利要求45所述的方法,其中基于先前图片的显示次序来确定所述先前图片进一步包含:
比较与先前经编码图片相关联的时间水平值以识别所述先前经编码图片的与等于零的时间水平值相关联的图片,其中所述时间水平值指示所述先前经编码图片之间的解码相依性;以及
响应于识别所述先前经编码图片的与等于零的所述时间水平值相关联的所述图片,将所述图片确定为具有小于所述ODR图片的所述显示次序值的所述显示次序值且具有等于零的所述时间识别符值的所述先前图片。
47.根据权利要求45所述的方法,其中基于所述先前图片的所述显示次序来确定所述先前图片进一步包含:
比较所述ODR图片的解码次序值与先前经编码图片的解码次序值以识别所述先前经编码图片的具有最接近于所述ODR图片的所述解码次序值的解码次序值的图片;以及
响应于识别所述先前经编码图片的具有最接近于与所述ODR图片相关联的所述解码次序值的所述解码次序值的所述图片,将所述图片确定为具有小于所述ODR图片的所述显示次序值的所述显示次序值且具有等于零的所述时间识别符值的所述先前图片。
48.根据权利要求45所述的方法,其中基于所述先前图片的所述显示次序来确定所述先前图片进一步包含:
比较所述ODR图片的所述显示次序值与先前经编码图片的显示次序值以识别所述先前经编码图片的具有最接近于所述ODR图片的所述显示次序值的显示次序值的图片;以及
响应于识别所述先前经编码图片的具有最接近于与所述ODR图片相关联的所述显示次序值的所述显示次序值的所述图片,将所述图片确定为具有小于所述ODR图片的所述显示次序值的所述显示次序值且具有等于零的所述时间识别符值的所述先前图片。
49.一种用于编码视频数据的设备,所述设备包含视频编码器,所述视频编码器经配置以:
编码开放性解码刷新ODR图片;
确定具有小于所述ODR图片的显示次序值的显示次序值且具有等于零的时间识别符值的先前经译码图片;以及
用信号发送表示所述所确定的先前经译码图片的识别符的用于所述ODR图片的语法数据以致使视频解码器基于所述所确定的先前经译码图片的所述识别符来确定所述ODR图片是否正被用于随机存取。
50.根据权利要求49所述的设备,其中所述视频编码器进一步经配置以:
比较与先前经编码图片相关联的时间水平值以识别所述先前经编码图片的与等于零的时间水平值相关联的图片,其中所述时间水平值指示所述先前经编码图片之间的解码相依性;以及
响应于识别所述先前经编码图片的与等于零的所述时间水平值相关联的所述图片,将所述图片确定为具有小于所述ODR图片的所述显示次序值的所述显示次序值且具有等于零的所述时间识别符值的所述先前图片。
51.根据权利要求49所述的设备,其中所述视频编码器进一步经配置以:
比较所述ODR图片的解码次序值与先前经编码图片的解码次序值以识别所述先前经编码图片的具有最接近于所述ODR图片的所述解码次序值的解码次序值的图片;以及
响应于识别所述先前经编码图片的具有最接近于与所述ODR图片相关联的所述解码次序值的所述解码次序值的所述图片,将所述图片确定为具有小于所述ODR图片的所述显示次序值的所述显示次序值且具有等于零的所述时间识别符值的所述先前图片。
52.根据权利要求49所述的设备,其中所述视频编码器进一步经配置以:
比较所述ODR图片的所述显示次序值与先前经编码图片的显示次序值以识别所述先前经编码图片的具有最接近于所述ODR图片的所述显示次序值的显示次序值的图片;以及
响应于识别所述先前经编码图片的具有最接近于与所述ODR图片相关联的所述显示次序值的所述显示次序值的所述图片,将所述图片确定为具有小于所述ODR图片的所述显示次序值的所述显示次序值且具有等于零的所述时间识别符值的所述先前图片。
53.一种计算机程序产品,其包含计算机可读存储媒体,所述计算机可读存储媒体具有存储于其上的指令,所述指令在执行时致使用于解码视频数据的装置的处理器进行以下操作:
编码开放性解码刷新ODR图片;
确定具有小于所述ODR图片的显示次序值的显示次序值且具有等于零的时间识别符值的先前经译码图片;以及
用信号发送表示所述所确定的先前经译码图片的识别符的用于所述ODR图片的语法数据以致使视频解码器基于所述所确定的先前经译码图片的所述识别符来确定所述ODR图片是否正被用于随机存取。
54.根据权利要求53所述的计算机程序产品,其进一步包含致使所述处理器进行以下操作的指令:
比较与先前经编码图片相关联的时间水平值以识别所述先前经编码图片的与等于零的时间水平值相关联的图片,其中所述时间水平值指示所述先前经编码图片之间的解码相依性;以及
响应于识别所述先前经编码图片的与等于零的所述时间水平值相关联的所述图片,将所述图片确定为具有小于所述ODR图片的所述显示次序值的所述显示次序值且具有等于零的所述时间识别符值的所述先前图片。
55.根据权利要求53所述的计算机程序产品,其进一步包含致使所述处理器进行以下操作的指令:
比较所述ODR图片的解码次序值与先前经编码图片的解码次序值以识别所述先前经编码图片的具有最接近于所述ODR图片的所述解码次序值的解码次序值的图片;以及
响应于识别所述先前经编码图片的具有最接近于与所述ODR图片相关联的所述解码次序值的所述解码次序值的所述图片,将所述图片确定为具有小于所述ODR图片的所述显示次序值的所述显示次序值且具有等于零的所述时间识别符值的所述先前图片。
56.根据权利要求53所述的计算机程序产品,其进一步包含致使所述处理器进行以下操作的指令:
比较所述ODR图片的所述显示次序值与先前经编码图片的显示次序值以识别所述先前经编码图片的具有最接近于所述ODR图片的所述显示次序值的显示次序值的图片;以及
响应于识别所述先前经编码图片的具有最接近于与所述ODR图片相关联的所述显示次序值的所述显示次序值的所述图片,将所述图片确定为具有小于所述ODR图片的所述显示次序值的所述显示次序值且具有等于零的所述时间识别符值的所述先前图片。
57.一种用于编码视频数据的设备,所述设备包含:
用于编码开放性解码刷新ODR图片的装置;
用于确定具有小于所述ODR图片的显示次序值的显示次序值且具有等于零的时间识别符值的先前经译码图片的装置;以及
用于用信号发送表示所述所确定的先前经译码图片的识别符的用于所述ODR图片的语法数据以致使视频解码器基于所述所确定的先前经译码图片的所述识别符来确定所述ODR图片是否正被用于随机存取的装置。
58.根据权利要求57所述的用于解码视频数据的设备,其进一步包含:
用于比较与先前经编码图片相关联的时间水平值以识别所述先前经编码图片的与等于零的时间水平值相关联的图片的装置,其中所述时间水平值指示所述先前经编码图片之间的解码相依性;以及
用于响应于识别所述先前经编码图片的与等于零的所述时间水平值相关联的所述图片而将所述图片确定为具有小于所述ODR图片的所述显示次序值的所述显示次序值且具有等于零的所述时间识别符值的所述先前图片的装置。
59.根据权利要求58所述的用于解码视频数据的设备,其进一步包含:
用于比较所述ODR图片的解码次序值与先前经编码图片的解码次序值以识别所述先前经编码图片的具有最接近于所述ODR图片的所述解码次序值的解码次序值的图片的装置;以及
用于响应于识别所述先前经编码图片的具有最接近于与所述ODR图片相关联的所述解码次序值的所述解码次序值的所述图片而将所述图片确定为具有小于所述ODR图片的所述显示次序值的所述显示次序值且具有等于零的所述时间识别符值的所述先前图片的装置。
60.根据权利要求57所述的用于解码视频数据的设备,其进一步包含:
用于比较所述ODR图片的所述显示次序值与先前经编码图片的显示次序值以识别所述先前经编码图片的具有最接近于所述ODR图片的所述显示次序值的显示次序值的图片的装置;以及
用于响应于识别所述先前经编码图片的具有最接近于与所述ODR图片相关联的所述显示次序值的所述显示次序值的所述图片而将所述图片确定为具有小于所述ODR图片的所述显示次序值的所述显示次序值且具有等于零的所述时间识别符值的所述先前图片的装置。
CN201280011976.8A 2011-03-08 2012-03-06 视频编解码器中的缓冲器管理 Expired - Fee Related CN103416074B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201161450572P 2011-03-08 2011-03-08
US61/450,572 2011-03-08
US13/412,377 US9516379B2 (en) 2011-03-08 2012-03-05 Buffer management in video codecs
US13/412,377 2012-03-05
PCT/US2012/027884 WO2012122169A1 (en) 2011-03-08 2012-03-06 Buffer management in video codecs

Publications (2)

Publication Number Publication Date
CN103416074A true CN103416074A (zh) 2013-11-27
CN103416074B CN103416074B (zh) 2016-11-30

Family

ID=

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105850122A (zh) * 2014-01-03 2016-08-10 高通股份有限公司 在多层译码中用于对参考图片集(rps)进行译码的方法
CN105900426A (zh) * 2014-01-03 2016-08-24 高通股份有限公司 对视频译码中的未输出先前图片标志的经改进推断
CN106105224A (zh) * 2014-03-18 2016-11-09 高通股份有限公司 用于多层位流的序列结尾nal单元信息的导出
CN110708556A (zh) * 2018-07-09 2020-01-17 腾讯美国有限责任公司 视频解码的方法和装置、计算机设备及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004008735A2 (en) * 2002-07-16 2004-01-22 Nokia Corporation A method for random access and gradual picture refresh in video coding
US20090074078A1 (en) * 2005-04-13 2009-03-19 Tomoyuki Yamamoto Moving image reproduction device

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004008735A2 (en) * 2002-07-16 2004-01-22 Nokia Corporation A method for random access and gradual picture refresh in video coding
US20040066854A1 (en) * 2002-07-16 2004-04-08 Hannuksela Miska M. Method for random access and gradual picture refresh in video coding
US20090074078A1 (en) * 2005-04-13 2009-03-19 Tomoyuki Yamamoto Moving image reproduction device

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
YING CHEN ET AL: ""Comments on Clean Decoding Refresh Pictures"", 《JCTVC-E400》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105850122A (zh) * 2014-01-03 2016-08-10 高通股份有限公司 在多层译码中用于对参考图片集(rps)进行译码的方法
CN105900426A (zh) * 2014-01-03 2016-08-24 高通股份有限公司 对视频译码中的未输出先前图片标志的经改进推断
CN105900426B (zh) * 2014-01-03 2019-03-01 高通股份有限公司 用于对视频信息进行译码的设备、方法和计算机可读媒体
CN106105224A (zh) * 2014-03-18 2016-11-09 高通股份有限公司 用于多层位流的序列结尾nal单元信息的导出
CN106105224B (zh) * 2014-03-18 2019-04-12 高通股份有限公司 一种用于译码视频信息的设备、方法及计算机可读媒体
CN110708556A (zh) * 2018-07-09 2020-01-17 腾讯美国有限责任公司 视频解码的方法和装置、计算机设备及存储介质
CN110708556B (zh) * 2018-07-09 2022-03-25 腾讯美国有限责任公司 视频解码的方法和装置、计算机设备及存储介质

Also Published As

Publication number Publication date
WO2012122169A1 (en) 2012-09-13
JP5859581B2 (ja) 2016-02-10
EP2684377A1 (en) 2014-01-15
JP2014511652A (ja) 2014-05-15
US20120230401A1 (en) 2012-09-13
EP2684377B1 (en) 2018-05-16
TW201244489A (en) 2012-11-01
US9516379B2 (en) 2016-12-06
KR101623630B1 (ko) 2016-05-31
KR20130129463A (ko) 2013-11-28

Similar Documents

Publication Publication Date Title
CN103026709B (zh) 用于视频译码的帧间预测模式和参考图片列表索引的译码
CN103299621B (zh) 用于视频译码中的一般化p/b帧的参考图片列表构造
CN103339936B (zh) 用于视频译码的单一参考图片列表建构
CN103430542B (zh) 用于随机存取后译码依附图片的视频译码技术
CN103563378A (zh) 存储器高效的上下文建模
CN103329525A (zh) 用于视频译码的组合参考图片列表建构
CN104704843A (zh) 视频性质的指示
CN104012096A (zh) 执行视频译码的运动向量预测
CN104205830A (zh) 用于在视频译码中的参考索引译码的旁路二进制位
CN103460698A (zh) 组合参考图片列表建构和映射
CN103339938A (zh) 执行视频译码的运动向量预测
CN104221374A (zh) 在视频译码中分群经旁路译码语法元素
CN104969555A (zh) 在视频译码中具有时间可扩缩性支持的渐进式改进
CN104823449A (zh) 在视频译码中用信号表示关注区和逐渐解码刷新
CN103931182A (zh) 帧内预测视频译码中的非正方形变换
CN103597832A (zh) 用于使用相邻模式的视频译码的增强的帧内预测模式信令
CN104221380A (zh) 用于并行运动估计的共同空间候选块
CN103797801A (zh) 视频译码中的非正方形变换单元和预测单元
CN104040900A (zh) 用于上下文自适应二进制算术译码的上下文数目缩减
CN103339935A (zh) 运动向量预测
CN104247420A (zh) 转换系数译码
CN105052156A (zh) Irap存取单元与位流切换及拼接
CN103891279A (zh) 用于帧内预测译码的最大概率变换
CN103947207A (zh) 用于图片分割方案的统一设计
CN104272742A (zh) 加权预测参数译码

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20161130

Termination date: 20190306