CN116847076A - 使用编码图片缓存器的视频编码 - Google Patents

使用编码图片缓存器的视频编码 Download PDF

Info

Publication number
CN116847076A
CN116847076A CN202310619963.9A CN202310619963A CN116847076A CN 116847076 A CN116847076 A CN 116847076A CN 202310619963 A CN202310619963 A CN 202310619963A CN 116847076 A CN116847076 A CN 116847076A
Authority
CN
China
Prior art keywords
cpb
dpb
picture
time
bit rate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310619963.9A
Other languages
English (en)
Other versions
CN116847076B (zh
Inventor
亚戈·桑切斯德拉富恩特
本杰明·布鲁斯
罗伯特·斯库宾
科内留斯·黑尔格
托马斯·斯切尔
托马斯·威甘德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Publication of CN116847076A publication Critical patent/CN116847076A/zh
Application granted granted Critical
Publication of CN116847076B publication Critical patent/CN116847076B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/423Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation characterised by memory arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/115Selection of the code volume for a coding unit prior to coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/109Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/129Scanning of coding units, e.g. zig-zag scan of transform coefficients or flexible macroblock ordering [FMO]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/573Motion compensation with multiple frame prediction using two or more reference frames in a given prediction direction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Processing (AREA)

Abstract

公开了使用编码图片缓存器的视频编码,其中使用以所选择的比特率在显式地用信号发送的CPB(或HRD)参数之间进行插值来实现CPB参数传输容量与CPB参数化有效性之间的良好折衷,并且具体地,可以以有效方式进行。

Description

使用编码图片缓存器的视频编码
技术领域
本申请涉及视频编码和编码图片缓存器在视频编码中的使用。
背景技术
假设参考解码器及其用于检查比特流和解码器一致性的用途是每个视频编码标准(例如,VVC)的基本组成部分。
为了进行这种一致性检查,规定了HRD缓存器模型,其包括假设流调度器(HSS)、编码图片缓存器(CPB)、解码过程(其被认为是瞬时的)、解码图片缓存器(DBP)和输出裁剪过程,如图17所示。
该模型定义了比特流被馈送到编码图片缓存器的定时和比特率、其解码单元(在低延迟操作模式下为接入单元或VCL NAL单元)从CPB中移除并立即被解码的时间、以及图片从DPB中输出的输出时间。
只有通过这样做,才有可能定义解码器所需的CPB大小,以避免缓存器上溢(发送给解码器的数据多于可以保留在CPB中的数据)或下溢(较少的数据以低于所需的比特率发送给解码器),并且来自AU的必要数据未在正确的解码时间出现在解码器处。
最新的视频编码标准规定了不同的参数来描述比特流和HRD要求以及缓存器模型。
例如,在HEVC中,hrd_parameters是针对子层来定义的,并且描述了Bitrate(i)和CPBsize(i)的一个或多个元组,这些元组指示如果HSS以Bitrate(i)的比特率馈送大小为CPBsize(i)的CPB,将不会发生上溢或下溢。换言之,当遵守这些比特率和CPB大小元组时,可以保证连续的解码。
结合hrd parameter语法元素,附加定时信息存在于比特流中,该附加定时信息规定每个图片自CPB的移除时间,即,该信息指示属于每个图片的VCL NAL单元向解码发送的时间。
相关信息存在于具有语法元素或变量InitialCPBRemovalDelay(i)、InitialCPBRemovalDelayOffset(i)和AuCPBRemovalDelay的缓存周期SEI消息中以及存在于具有AuCPBRemovalDelay的图片定时SEI消息中。
然而,取决于应用和传输信道,将会需要有关针对许多比特率的HRD参数的信息,以便能够根据比特率进行微调。然而,这将需要大量HRD参数的消耗比特的传输用于bitrate(i)的密集选择。针对以合理的开销发送HRD信息的大量比特率来说,如果手边有允许正确的HRD参数化的概念,即不导致CPB下溢或上溢的概念,这将是有利的。
发明内容
因此,本发明的目的是提供一种使用编码图片缓存操作的视频编解码器,该编码图片缓存操作在用于HRD信号化的比特消耗的一方面与针对许多比特率场景确定HRD参数的有效方式之间产生更好的折衷。
实施例可以具有用于视频解码的装置,所述装置具有编码图片缓存器和解码图片缓存器(DPB),被配置为接收数据流,该数据流具有按照编码顺序编码到其中的视频的图片作为接入单元序列,使用所选择的比特率将所述接入单元序列顺序地馈送到CPB中,其中暂停对尚未达到根据时间帧移除光栅的虚拟可用时间的接入单元的馈送,直至达到所述虚拟可用时间,所述时间帧移除光栅针对按照所述编码顺序的第一接入单元提前所选择的时间移除延迟,而针对按照所述编码顺序的后续接入单元提前所选择的时间移除延迟与所选择的时间偏移之和;使用时间光栅[RemovalTime]逐AU地从CPB中移除AU,从数据流中提取与第一操作点相关的第一CPB参数和与第二操作点相关的第二CPB参数,所述第一CPB参数和第二CPB参数中的每个CPB参数指示CPB大小、预定时间偏移、预定时间移除延迟和预定比特率,其中,所述第一CPB参数至少在预定比特率方面不同于所述第二CPB参数,通过以所选择的比特率在由所述第一CPB参数指示的预定时间偏移与由所述第二CPB参数指示的预定时间偏移之间进行插值来确定所选择的时间偏移,以及通过以所选择的比特率在由所述第一CPB参数指示的预定时间移除延迟与由所述第二CPB参数指示的预定时间移除延迟之间进行插值来确定所选择的时间移除延迟,使用根据存储在DPB中的被参考的参考图片的图片间预测对从CPB移除的当前AU进行解码,以获得解码图片,以及将所述解码图片插入到DPB中,向存储在DPB中的每个参考图片指派作为短期参考图片、长期参考图片、以及不用于参考的图片之一的分类,从当前AU中读取DPB模式信息,如果所述DPB模式信息指示第一模式,则根据FIFO策略,从DPB中移除被分类为短期图片的一个或多个参考图片,如果DPB模式信息指示第二模式,则读取所述当前AU中的具有至少一个命令的存储器管理控制信息,并执行所述至少一个命令以改变指派给存储在DPB中的参考图片中的至少一个的分类,以及使用DPB中的参考图片的分类,以管理从DPB中的参考图片移除。
另一实施例可以具有用于将视频编码为数据流的装置,其中,应通过将数据流馈送到包括编码图片缓存器(CPB)的解码器来解码数据流,所述装置被配置为:将按照编码顺序进行编码的视频的图片编码到数据流作为接入单元AU序列,确定与第一操作点相关的第一CPB参数和与第二操作点相关的第二CPB参数,所述第一CPB参数和所述第二CPB参数中的每个CPB参数指示CPB大小、预定时间偏移、预定时间移除延迟和预定比特率,其中,所述第一CPB参数至少在预定比特率方面不同于所述第二CPB参数,以及执行所述确定,使得以多个所选择的比特率中的每个所选择的比特率在所述第一CPB参数的预定时间偏移与所述第二CPB参数的预定时间偏移之间进行插值产生插值后的时间偏移和插值后的时间移除延迟,从而通过以下方式经由CPB将数据流馈送到解码器:使用相应的所选择的比特率将所述AU序列顺序地馈送到CPB中,其中暂停对尚未达到根据时间帧移除光栅的虚拟可用时间的接入单元的馈送,直到达到所述虚拟可用时间,所述虚拟可用时间针对按照所述编码顺序的第一接入单元提前插值后的时间移除延迟,而针对按照所述编码顺序的后续接入单元提前插值后的时间移除延迟与插值后的时间偏移之和;使用时间光栅逐AU地从CPB中移除AU,不导致任何下溢和任何上溢,以及将CPB参数编码到数据流中,其中,所述装置被配置为:在对所述AU进行编码时,使用根据存储在DPB中的被参考的参考图片的图片间预测,将当前图片编码到当前AU中,以及将DPB中的当前图片的解码版本插入到DPB中,向存储在DPB中的每个参考图片指派作为短期参考图片、长期参考图片、以及不用于参考的图片之一的分类,将DPB模式信息写入当前AU,如果DPB模式信息指示第一模式,则根据FIFO策略从DPB中移除被分类为短期图片的一个或多个参考图片,如果DPB模式信息指示第二模式,则将具有至少一个命令的存储器管理控制信息写入当前AU,所述命令指示改变指派给存储在DPB中的参考图片中的至少一个的分类,其中,DPB中的参考图片的分类用于管理从DPB中的参考图片移除。
根据另一实施例,一种通过使用编码图片缓存器和解码图片缓存器(DPB)进行视频解码的方法可以具有以下步骤:接收数据流,该数据流具有按照编码顺序编码到其中的视频的图片作为接入单元序列,使用所选择的比特率将所述接入单元序列顺序地馈送到CPB中,其中暂停对尚未达到根据时间帧移除光栅的虚拟可用时间的接入单元的馈送,直至达到所述虚拟可用时间,所述时间帧移除光栅针对按照所述编码顺序的第一接入单元提前所选择的时间移除延迟,而针对按照所述编码顺序的后续接入单元提前所选择的时间移除延迟与所选择的时间偏移之和;使用时间光栅[RemovalTime]逐AU地从CPB中移除AU,从数据流中提取与第一操作点相关的第一CPB参数和与第二操作点相关的第二CPB参数,所述第一CPB参数和第二CPB参数中的每个CPB参数指示CPB大小、预定时间偏移、预定时间移除延迟和预定比特率,其中,所述第一CPB参数至少在预定比特率方面不同于所述第二CPB参数,通过以所选择的比特率在由所述第一CPB参数指示的预定时间偏移与由所述第二CPB参数指示的预定时间偏移之间进行插值来确定所选择的时间偏移,以及通过以所选择的比特率在由所述第一CPB参数指示的预定时间移除延迟与由所述第二CPB参数指示的预定时间移除延迟之间进行插值来确定所选择的时间移除延迟,使用根据存储在DPB中的被参考的参考图片的图片间预测对从CPB移除的当前AU进行解码,以获得解码图片,以及将所述解码图片插入到DPB中,向存储在DPB中的每个参考图片指派作为短期参考图片、长期参考图片、以及不用于参考的图片之一的分类,从当前AU中读取DPB模式信息,如果所述DPB模式信息指示第一模式,则根据FIFO策略,从DPB中移除被分类为短期图片的一个或多个参考图片,如果DPB模式信息指示第二模式,则读取所述当前AU中的具有至少一个命令的存储器管理控制信息,并执行所述至少一个命令以改变指派给存储在DPB中的参考图片中的至少一个的分类,以及使用DPB中的参考图片的分类,以管理从DPB中的参考图片移除。
另一实施例可以具有视频被编码到其中并且具有第一CPB参数和第二CPB参数的数据流,使得上述发明方法不导致CPB上溢和下溢。
本发明的基本思想是,可以使用以所选择的比特率显式地用信号发送的CPB(或HRD)参数之间的插值来实现CPB参数传输容量与CPB参数化有效性之间的良好折衷,并且可以具体地以有效方式进行,即,以导致安全和正确的CPB操作而没有下溢和上溢的方式和以下方式,根据该方式,例如由显式地用信号发送的CPB参数指示的CPB大小不必被提供有安全偏移来考虑插值相关的意外情况,即使显式地用信号发送的CPB参数除了指示针对显式地用信号发送的操作点的CPB大小和比特率之外还指示针对这些操作点的预定时间偏移和预定时间移除延迟。具体地,根据该思想,在解码侧,针对所选择的比特率的时间偏移和时间移除延迟二者可以根据用信号发送的CPB参数通过以所选择的比特率在该偏移与延迟的对应值之间进行插值来确定。然后,这种插值后的/所选择的时间偏移可以用于使用所选择的比特率(即,通过暂停对尚未达到根据时间帧移除光栅的虚拟可用时间的接入单元的馈送,直到达到所述虚拟可用时间,所述虚拟可用时间针对按照编码顺序的第一接入单元提前所选择的/插值后的时间移除延迟,而针对按照编码顺序的后续接入单元提前所选择的/插值后的时间移除延迟与所选择的时间偏移之和),将视频数据流的接入单元序列顺序地馈送到编码图片缓存器中。使用时间光栅,然后可以从编码图片缓存器中移除接入单元。尽管在解码侧仅必须执行插值来确定所选择的时间偏移和所选择的时间移除延迟,但编码器根据操作点的CPB参数,以考虑插值的方式(即,以使得针对时间偏移和时间移除延迟的相应的所选择的/插值后的值不导致下溢或上溢的方式),对显式用信号发送的与显式准备的视频数据流的操作点相关的CPB参数进行设置。
附图说明
下面参考附图描述本申请的实施例,在附图中:
图1示出了根据其可以实现本申请的实施例的编码器的可能实现的框图;
图2示出了根据其可以实现本申请的实施例的解码器的可能实现的框图,并且该解码器适合于图1的编码器;
图3示出了根据本申请的实施例的用于解码的装置的框图;
图4示出了CPB参数编码和其间插值的示意图;
图5在左侧示出了CPB馈送器的填充状态图,并且在右侧示出了CPB填充状态图,其中,上半部分示出了后续的、非第一接入单元不使用时间偏移的示例,以及下半部分示出了后续的、非第一接入单元使用时间偏移的示例;
图6至图14示出了针对CPB参数比特率、其间所选择的比特率和时间偏移设置的不同示例的CPB缓存器填充状态;
图15示出了图3的用于管理DPB的装置的操作模式的示例的示意图;
图16示出了根据本申请的实施例的用于编码的装置的框图;以及
图17示出了已知HRD缓存器模型的框图。
具体实施方式
在继续描述本说明书的介绍部分并说明在针对HRD操作的操作点方面提供高度灵活性的愿望所涉及的问题之前,提供了视频编解码器的初步示例,随后描述的实施例可以在其中建立。然而,应注意,视频编解码器的这些示例不应被视为限制本申请后续说明的实施例。
图1示出了被配置为将视频l2编码为比特流14的编码器10。编码器10使用图片编码顺序将视频12的图片16编码为比特流14,该图片编码顺序可以不同于在呈现视频12时顺序地呈现或输出图片16的呈现时间顺序18。图1还示出了编码器10的可能实施方式,但再次注意,关于图1阐述的细节不限制下面更详细描述的本申请的实施例。尽管随后应用,但编码器10的编码可以不包括帧内预测、可以不包括帧间预测、可以不按块进行操作、可以不使用变换残差编码、可以有损或无损或以其组合操作。
图1的编码器10通过使用预测执行编码。以逐块方式,编码器10预测当前图片,或更准确地说,预测该图片的当前编码部分,并通过在减法器22处从当前图片26的原始版本减去预测信号24来形成预测残差20。然后,残差编码器28将预测残差20编码到比特流14中,其中,残差编码可以是有损的,并且例如可以包括使残差信号20变换到变换域并对从变换得到的变换系数进行熵编码。为了基于视频12的已编码部分的可重构版本来获得预测信号24,残差解码器30反转残差编码并通过反变换从变换系数中产生残差信号32,该残差信号32与残差信号20相差由残差编码器28引入的损失。为了重构当前图片,或更准确地说,重构当前图片的当前编码块,通过加法器34将残差信号32与预测信号24相加以产生重构信号36。可选地,环路滤波器38使重构信号38经受某种环路滤波,并且滤波后的信号40被输入到环路缓存器42中。因此,环路缓存器42分别缓存已编码图片的重构版本和当前图片的重构部分。基于这些重构版本44,以及可选地,基于当前图片的已编码部分的未滤波重构版本36,预测级46确定预测信号24。
编码器10使用率失真优化来执行许多编码决策。例如,预测器46选择若干编码模式之一,该若干编码模式包括例如一种或多种帧间预测模式和一种或多种帧内预测模式、以及可选地,它们以编码块的粒度的组合。以这些编码块的粒度,或备选地,以这些编码块被进一步细分成的预测块的粒度,预测器46确定适合于所选择的预测模式的预测参数,例如针对帧间预测块的一个或多个运动矢量、或针对帧内预测块的帧内预测模式。残差编码器28以残差块的粒度执行残差编码,该残差块可选地可以与编码块或预测块中的任何一个重合,或可以是这些块中的任何一个块的进一步细分或可以来自当前图片到残差块的另一独立细分。甚至前述细分也是由编码器10确定的。这些编码决策(即,细分信息、预测模式、预测参数和残差数据)由编码器10使用例如熵编码编码到比特流14中。
每个图片16由编码器10编码到比特流14的连续部分48(被称为接入单元)中。因此,比特流14中的接入单元48的序列具有顺序地(即,按照前述图片编码顺序)编码到其中的图片16。
图2示出了适合于图1的编码器10的解码器100。解码器100通过从每个接入单元48解码视频12’的相应图片16’,从比特流14中解码图1的视频12的重构版本12’。为此,解码器100在内部被解释为如图1的编码器10的预测环路的重构部分。也就是说,解码器100包括从比特流14重构残差信号32的残差解码器130。预测信号124在加法器134处与该残差信号132相加以产生重构信号136。可选的环路滤波器138对重构信号136进行滤波以产生滤波后的重构信号140,然后该滤波后的重构信号140被缓存在环路缓存器142中。缓存且滤波后的重构信号144由解码器100从该缓存器中输出,即,缓存且重构的信号包含重构图片16’,并且按照呈现时间顺序从缓存器142输出这些图片16’。此外,预测器或预测单元146基于信号144、以及可选地,重构信号136来执行预测,以产生预测信号124。解码器例如使用熵解码从比特流14获得用于解码并由编码器10使用率/失真优化确定的所有必要信息,例如细分信息、预测模式决策、预测参数和残差数据。如上所述,残差数据可以包括变换系数。
编码器10可以以使得平均而言视频12以特定比特率在比特流14中被编码(即,使得平均而言图片16使用特定比特数被编码到比特流14中)的方式执行其编码任务。然而,由于不同的图片内容复杂度、改变的场景内容和不同编码的图片(例如I帧、P帧和B帧),针对每个图片16在比特流14中花费的比特数可以变化。即,每个接入单元48的大小或比特的数量可以变化。为了保证在解码器100处无中断地播放视频12’,编码器10为比特流14提供CPB参数。倘若以某种预定义方式经由解码图片缓存器200向解码器100进行馈送,则这些CPB参数保证解码器100进行这种无中断或无问题的解码。也就是说,CPB参数是指图3所示的装置,其中,馈送器202经由编码图片缓存器200向解码器100馈送,馈送器202接收比特流14并且经由编码图片缓存器200向解码器100馈送比特流14,使得解码器100继而及时接入比特流14的接入单元48,从而可以按照呈现时间顺序无中断地输出视频12’的图片16’。
针对若干个所谓的操作点OPi,CPB参数由编码器10写入比特流14。每个操作点OPi是指馈送器202将比特流14(即,接入单元48的序列)馈送到编码图片缓存器200中的不同bitrate(i)。也就是说,针对每个操作点OPi,CPB参数300指示它们应用的比特率。此外,CPB参数300指示编码图片缓存器200的编码图片缓存器大小,当以相应比特率向解码器100馈送时,该编码图片缓存器大小足以包含最完整的状态。此外,由CPB参数300i指示的信息指示时间延迟,以该时间延迟,相对于比特流14的第一比特被输入到编码图片缓存器200中的时间点,分别地,第一接入单元从编码图片缓存器200中移除并传递给解码器100。术语“第一”可以指图片编码顺序和某一缓存周期,即图片的子序列。此外,CPB参数300i指示时间偏移,以该时间偏移,允许跟随前述第一接入单元的后续接入单元的馈送在它们的由常规时间光栅确定、被延迟前述时间延迟的常规馈送之前被馈送到解码图片缓存器200中。图4中未示出,但可选地,CPB参数300i指示另一信息,例如揭示或指示或允许从中导出以下内容的信息:逐接入单元地从编码图片缓存器200中移除的刚刚提到的比特流14所在的时间光栅,以由解码器100进行解码,如刚刚所提到,该时间光栅被延迟该时间延迟。因此,时间光栅与视频12的帧速率相关,以便允许解码器100以足以以该帧速率输出这些图片16’的速率恢复图片16’。时间光栅的可选指示可以是所有操作点来说是公共的,并且针对所有操作点在比特流中公共地指示。此外,代替用信号发送关于时间光栅的任何信息,该信息可以是固定的并且编码器和解码器预先已知。
图4示出了针对两个操作点OPi的CPB参数300i,即,两个操作点OPi-1和OPi是指两个不同的比特率和CPB大小。针对这些比特率bitrate(i-1)与bitrate(i)之间的比特率,比特流14中不存在这种CPB参数的其他实例。如上面已经指示的,本申请的实施例将通过以下可能性来填补这一间隙:通过插值导出针对bitrate(i-1)与bitrate(i)之间的某个所选择的比特率的CPB参数的这种缺失实例。
注意,由于前述时间光栅与帧速率相关的事实,编码器10可以公共地针对所有CPB参数或CPB参数的所有实例(或甚至换言之,公共地针对所有操作点)仅指示该时间光栅或关于其的信息一次。此外,甚至可以没有关于时间光栅的信息在数据流中传送,那么时间光栅在编码器与解码器之间是预先已知的,例如,由于在编码器与解码器之间预知关于视频12和12’分别的预定帧速率,以及某一图片组(GOP)结构和图片编码顺序(一方面)与呈现时间顺序18(另一方面)的关系。
现在继续对本说明书的介绍部分的描述。如上所述,CPB参数可以通过SEI消息来传送。InitialCPBRemovalDelay对应于图4的时间延迟,并且InitialCPBRemovalDelayOffset对应于图4的时间偏移。AuCPBRemovalDelay指示时间光栅,即从DPB中移除连续AU之间的时间距离。如所说明的,图4的CPB参数可以在缓存周期SEI消息中传送,该缓存周期SEI消息指示针对所谓的缓存周期(即,与包括该缓存周期的第一接入单元和后续接入单元的某一接入单元序列相对应的视频的图片序列)经由编码图片缓存器200向解码器100馈送的正确调度。
如本说明书的介绍部分所说明的那样,已知CPB参数要在比特流中传输,但这些CPB参数指某些特定的比特率。
针对最基本的操作,仅使用InitialCPBRemovalDelay(i)和AuCPBRemovalDelay。
在那种情况下,被解码的第一接入单元是具有其相应缓存周期SEI消息的随机接入点,并且时间0被定义为随机接入点的第一比特进入CPB的时间。然后,在时间InitialCPBRemovalDelay(i),从CPB中移除与该随机接入点相对应的图片。针对另一非RAP图片,CPB的移除发生在InitialCPBRevovalDelay(i)+AuCPBRemovalDelay(传统编解码器可以定义一些附加参数以将所指示的延迟转换为时间增量,即ClockTick,但这里为了简化忽略了这一点)。
当下一个RAP到来时,像以前一样针对非RAP图片计算移除时间,即InitialCPBRevovalDelay(i)+AuCPBRemovalDelay,并且该新值用作到另一RAP的其他增量的锚,即anchorTime=InitialCPBRemovalDelay(i)+AuCPBRemovalDelay,然后图片的移除变为anchorTime+AuCPBRemovalDelay,并且anchorTime在下一个RAP处使用缓存SEI消息进行更新,anchorTime=anchorTime+AuCPBRemovalDelay等。
换言之,初始化解码器的第一接入单元(具有缓存周期SEI的AU)的RemovalTime计算如下:
RemovalTime[0]=InitialCPBRemovalDelay(i)
注意,InitialCPBRemovalDelay可以从比特流中导出为initial_cpb_removal_delay[i]÷90000。
AU(不是初始化解码器的第一接入单元,而是另一缓存周期的第一AU(即,具有缓存周期SEI消息的AU,该AU不是初始化解码器的第一AU))的RemovalTime被计算为:
RemovalTime[n]=RemovalTime[nb]+AuCPBRemovalDelay
其中,nb是指前一缓存周期的第一AU(也具有缓存周期SEI消息的当前AU之前的AU)的索引,并且AuCPBRemovalDelay可以从比特流中导出为tc*cpb_removal_delay(n),并且tc是clockTicks(给出cpb_removal_delay语法以将给定值转换为时间的单位)。
AU(既不是初始化解码器的第一接入单元,也不是另一缓存周期的第一AU(即,具有缓存周期SEI消息的AU,该AU不是初始化解码器的第一AU))的RemovalTime被计算为:
RemovalTime[n]=RemovalTime[nb]+AuCPBRemovalDelay
其中,nb是指当前缓存周期的第一AU(具有缓存周期SEI消息的当前AU之前的AU)的索引,并且AuCPBRemovalDelay可以从比特流中导出为tc*cpb_removal_delay(n),并且tc是clockTicks(给出cpb_removal_delay语法以将给定值转换为时间的单位)。
所描述模型的缺点是所定义的InitialCPBRemovalDelay隐式地设置了关于可用/可使用的CPB大小的限制。因此,为了使用CPB缓存器,将需要用于移除第一接入单元的大时间延迟(InitialCPBRemovalDelay)。事实上,假设解码器处的编码图片在它们被编码之后立即被发送,每个图片到达解码器的时间将不早于以下时间:initArrivalEarliestTime[n]=RemovalTime[n]-InitCpbRemovalDelay(i)即,它的移除时间减去InitialCPBRemovalDelay,其是解码器自从在CPB中接收到该AU的相应第一比特以来等待移除第一AU的时间。
或者,在当前图片之前的图片太大以至于它的最后比特到达(AuFinalArrivalTime[n-1])晚于
RemovalTime[n]-InitCpbRemovalDelay(i)的情况下,初始到达时间(当前图片的第一比特被馈送到CPB中的时间)等于:
initArrivalTime[n]=Max(AuFinalArrivalTime[n-1],
initArrivalEarliestTime[n])
这意味着,例如,如果后续具有新缓存周期SEI消息的AU不能早于其移除时间的InitialCPBRemovalDelay(i)进入CPB,则不可能实现大于CPBA的CPBB,因为在InitialCPBRemovalDelay(i)期间以Bitrate(i)向CPB馈送仅实现CPBA的CPB充满度。
为了解决这个问题,思想是假设发送器(或图17中的HSS或图4中的馈送器202)以给定时间偏移InitialCPBRemovalDelayOffset(i)延迟具有缓存SEI消息的第一RAP的调度,如图5所示。
也就是说,图5的上部在左侧示出了以图17的HSS或图3的馈送器202的虚拟缓存器充满度向编码图片缓存器200馈送,假设该“发送器”瞬时地获得前述移除光栅处的接入单元,其中,发送器使用可从图中的斜率导出的特定比特率顺序地将接入单元序列发送到编码图片缓存器中。右侧示出了接收器侧,并且更准确地说,示出了CPB充满度,其揭示了将AU到CPB中的馈送以及接入单元从编码图片缓存器中的移除。移除是瞬时发生的,以特定比特率进行馈送。同样,比特率可从右侧图中的斜率导出。该图中的后沿指示接入单元序列逐接入单元地从CPB中移除并输入解码器的实例。然而,它们出现在时间光栅处,该时间光栅被延迟了在第一接入单元Tail的第一比特的到达与指示其移除的第一下降沿之间的开始处的时间延迟。
图5的下半部分示出了具有时间偏移的效果:可用或可使用的CPB大小不受由用于移除第一接入单元的时间延迟确定的量的限制。相反,时间偏移使得能够在提前了时间移除延迟的时间光栅之前的时间实例处,即在时间偏移的时间提前时间的最大值处,在第一接入单元之后馈送后续接入单元。这里,在图5的示例中,相应地,对于馈送来说,可以在第四接入单元之后立即恢复馈送第五接入单元,而不必等待或停止馈送直到达到根据仅提前了该时间延迟的时间光栅的针对该第五接入单元的时间。
通过这样,调度改变如下:
initArrivalEarliestTime[n]=RemovalTime[n]-InitCpbRemovalDelay(i)-InitialCPBRemovalDelayOffset(i)
这意味着大于CPBA的CPBB的CPB大小可以对应于通过以针对InitCpbRemovalDelay(i)+InitialCPBRemovalDelayOffset(i)的Bitrate(i)向CPB馈送而实现的大小。
总结之前描述的工作原理,在如何计算initArrivalEarliestTime的方面,存在两种类型的帧。针对缓存周期(即,缓存周期被定义为从具有缓存周期SEI消息的AU直到携带缓存周期SEI消息的下一个AU的周期)中的第一图片(或接入单元),initArrivalEarliestTime被计算为其RemovalTime减去InitCpbRemovalDelay。针对缓存周期内的不是第一AU的任何其他AU(即,不携带缓存周期SEI消息的AU),InitArrivalEarliestTime被计算为其RemovalTime减去InitCpbRemovalDelay减去InitialCPBRemovalDelayOffset。
编码器通常发送具有单个值或几个值(被称为调度选项)、具有与HRD操作相关的参数的比特流。例如,解码器操作其CPB所使用的不同速率值,即可以向CPB馈送的速率。
然而,可能存在期望使用不同速率的场景。例如,当信道以突发方式向解码器发送数据时,以高比特率发送数据(只要任何数据可用),而在没有视频数据要发送时使用信道发送其他数据。
为了解决这个问题,需要通过某种拟合来计算HRD或CPB参数,该拟合可以是逐段线性拟合/回归。
例如,假设存在两个参数集对应于两个速率R0和R1,其中R0<R1,如图4中300i-1处所示。并且假设选择Rsel使得其位于R0和R1内并且对应于与90%R0和10%R1之和相等的值。可以通过使用相同的公式(即,在该示例的情况下,新的CPB大小等于90%CPB0和10%CPB1之和的线性拟合)来类似地计算针对这种速率的值(如CPB大小)。
然而,当涉及到确定每个图片最早到达时间的偏移(即,InitialCPBRemovalDelayOffset)时,无法进行相同的计算。对于这一点,存在以下不同的原因:
1)缓存器充满度(针对其CPB大小是最终限制)受所使用的馈送速率和InitialCPBRemovalDelayOffset共同的影响,因此InitialCPBRemovalDelayOffset值的线性拟合不起作用。
2)实际初始到达时间不是最早可能到达时间,而是前一接入单元的最终到达时间与最早可能到达时间之间的最大值,即,initArrivalTime[n]=Max(AuFinalArrivalTime[n-1],initArrivalEarliestTime[n])
因此,在每个接入单元处,由于InitialCPBRemovalDelayOffset而被馈送到缓存器中的附加数据与Max(initArrivalTime[n]-AuFinalArrivalTime[n-1],0)成比例。
当计算离散参数中未用信号通知的操作点的拟合不遵循逐段线性拟合而是更复杂的拟合(例如,三次或多项式拟合)时,该问题的计算可能变得更加复杂。
因此,根据本申请的实施例,当使用操作点(包括由一个操作点指示的时间偏移与由另一操作点指示的时间偏移之间的插值版本)之间的插值来管理编码图片缓存器200的馈送和清空时,接收侧可以依赖于无问题的操作模式(即,没有下溢和上溢的操作模式)。编码器注意所得到的插值不会导致缓存器问题。
也就是说,根据实施例,图3的装置操作如下。该装置将接收作为接入单元序列48的比特流14。馈送器202将使用位于一个操作点OPi-1的bitrate(i-1)与另一操作点OPi的bitrate(i)之间某处的所选择的比特率302将接入单元序列顺序地馈送到编码缓存器200中,针对该操作点OPi-1和另一操作点OPi的CPB参数300i-1和300i被图1的编码器10写入比特流14。然而,馈送器200以所选择的比特率不连续地向编码图片缓存器200馈送,而是可以暂停或停止对某些接入单元的馈送。具体地,馈送器202停止或暂停对尚未达到如由时间移除光栅所定义的虚拟可用时间(在前面描述中被称为InitArrivalEarliestTime)的任何接入单元的馈送,直到达到该虚拟可用时间为止,该时间帧移除光栅针对按照图片编码顺序的第一接入单元提前插值后的时间移除延迟,而针对按照图片编码顺序的后续接入单元提前插值后的时间移除延迟与插值后的时间偏移之和。同样,由于计算这些时间的差异,与第一接入单元相比,不是第一接入单元的接入单元可以在编码图片缓存器200中停留更长时间。例如,如果针对某一接入单元,时间移除光栅指示移除时间tremoval,但tremoval减去插值后的时间移除延迟(在接入单元是第一接入单元的情况下)或tremoval减去插值后的时间移除延迟与(加上)插值后的时间偏移之和(在接入单元是后续接入单元但不是第一接入单元的情况下)尚未到达,则延迟将该接入单元馈送到编码图片缓存器200中,直到达到该时间。在上面的描述中,前面描述中的InitArrivalEarliestTime,暂停或停止是通过上面讨论的max函数来体现的,InitialCPBRemovalDelayOffset用于指示时间偏移,并且时间光栅由数组RemovalTime来定义。newInitialCPBRemovalDelayOffset在下文中用于表示插值后的时间偏移。如上所述,时间光栅可以以第一接入单元的移除与后续接入单元中的每一个的移除之间的时间差(例如,针对每个后续AU的差)的形式从数据流14中导出,测量该AU的移除与(当前缓存周期的)第一AU的移除之间的时间。
然而,图3的装置使用时间光栅从编码图片缓存器200逐接入单元地移除接入单元。由于馈送已经被提前了时间移除延迟的事实,第一接入单元的移除实际上发生在该时间移除延迟处。解码器100接收所移除的接入单元,对它们进行解码,并输出解码/重构图片。
为了获得插值后的值,图3的装置执行以下操作。它从比特流14中提取与第一操作点OPi-1相关的第一CPB参数300i-l和与第二操作点OPi相关的第二CPB参数300i,其中,第一CPB参数和第二CPB参数中的每个CPB参数指示CPB大小、预定时间偏移、预定时间移除延迟和预定比特率,其中,CPB参数300i-1和300i用于不同的预定比特率。然后,该装置通过以所选择的比特率302在由第一CPB参数300i-1指示的预定时间偏移与由第二CPB参数300i指示的预定时间偏移之间进行插值来确定插值后的时间偏移,以及该装置通过以所选择的比特率302在由第一CPB参数300i-1指示的预定时间移除延迟与由第二CPB参数300i指示的预定时间移除延迟之间进行插值来确定插值后的时间移除延迟。稍后描述具体实施例,其例如指示插值可以是线性插值。也就是说,图3的装置可以在由CPB参数300i-1与300i指示的预定时间偏移之间线性地插值,并且在由这些相邻CPB参数指示的预定时间移除偏移之间线性地插值。然而,可以备选地使用不同种类的插值。甚至可以是编码器决定一个或多个插值参数来参数化插值并在数据流中发送一个或多个插值参数,图3的装置从数据流14中导出该信息并相应地执行插值。时间偏移和时间移除延迟的插值方式可以相同。此外,附加地,图3的装置还可以以所选择的比特率302在由第一CPB参数300i-1指示的CPB大小与由第二CPB参数300i指示的CPB大小之间进行插值以获得插值后的CPB大小,并且图3的装置可以依赖于以下事实:针对CPB 200的该插值后的CPB大小足以适应在使用针对时间移除延迟和时间偏移的插值后的值来馈送并清空编码图片缓存器200时出现的任何充满状态。如前所述,编码器确保该承诺成立。例如,针对比特率bitrate(i-1)与bitrate(i)之间的某一离散中间比特率集(例如,以这些比特率之间的间隔的十分之一或另一分数为单位),编码器可以将该承诺限制在解码侧。然后,编码器可以测试是否发生任何上溢或下溢情况,如果是,则相应地调整任何值。例如,如果发生上溢,则编码器可以增大分别由操作点OPi和OPi-1指示的CPB大小之一。备选地,编码器可以再次恢复比特流的整个编码以及CPB参数的确定和插值后的值的无冲突检查。
换言之,根据实施例,编码器可以确保所指示的离散InitialCPBRemovalDelayOffset值中两个值的加权线性组合可以被计算并用作newInitialCPBRemovalDelayOffset以用于计算最早到达时间,使得当从相应指示的离散值拟合CPB和比特率曲线时计算的HRD限制(针对CPB大小和比特率)导致有效的解码器操作。如前面所讨论的,CPB大小和比特率曲线的曲线拟合可以是:
·线性的
·三次的
·多项式的
也就是说,编码器和解码器可以使用除了操作点的OPi值之间(并且具体地,在它们针对时间偏移的值InitCpbRemovalDelayOffseti之间)的逐段线性插值之外的插值。
根据实施例,编码器可以指示要用于插值的权重(下面的α0和α1),即,newInitialCPBRemovalDelayOffset=α0*InitCpbRemovalDelayOffset01*InitCpbRemovalDelayOffset1
作为另一备选方案,不是像前一等式那样用信号发送α0和α1,而是提供两个其他权重(β0和β1),这两个其他权重与所选择的速率(Rsel)一起允许计算实际使用的(α0和α1)。
α0等于β0/Rsel,并且α1等于β1/Rsel
作为另一备选方案,所提供的权重(β0和β1)可以等于针对离散操作点的比特率,并且所计算的α0和α1分别通过所选择的速率Rsel与所提供的作为HRD参数R0和R1的比特率之间的归一化距离进行缩放。也就是说,该插值可以是newInitialCPBRemovalDelayOffset=
(Rse1-R0)/(R1-R0)*(R0/Rsel)*InitCpbRemovalDelayOffset0+(1-(Rsel-R0)/(R1-R0))*(R1/Rsel)*InitCpbRemovalDelayOffset1
其中,R0和R1是操作点OP0和OP1的比特率,针对所述操作点OP0和OP1的CPB参数3000和3001分别指示为时间偏移InitCpbRemovalDelayOffset0和InitCpbRemovalDelayOffset1,并且所选择的速率是Rsel。也就是说,在这里,该插值是通过使用(Rsel-R0)/(R1-R0)*(R0/Rsel)对InitCpbRemovalDelayOffset0进行加权并且使用(1-(Rsel-R0)/(R1-R0))*(R1/Rsel)对InitCpbRemovalDelayOffset1进行加权来执行的,即,使用两个比率的乘积。
编码器再次确保所提供的比特流和指示不仅应用于给定的离散操作点,而且应用于可以在其间计算的值。为了做到这一点,编码器可以对给定的离散值之间的不同的值进行采样,并确保针对这种值不存在缓存器下溢或上溢。
比特流的一个实施例是以比特率R0和R1的形式传送所描述的权重,以便计算中间初始移除偏移。接收由如上所述的编码器产生的比特流的比特流处理设备(例如或包括客户端侧的视频解码器)将必须依赖于编码器以满足上述时间限制的方式产生比特流的事实。该设备可以对比特流进行检查以确保它实际上是合法的比特流,并且这种检查可以是常规解码过程的一部分。该检查可以包括:对传送CPB和定时信息(例如,初始移除偏移)的相应比特流语法进行解析,通过它们各自的等式导出直接关联的变量和其他变量,以及监测所述变量的值以遵守如比特流的其他语法(例如,级别指示符)中所指示的时间上的级别限制。此外,由编码器和解码器组成的系统可以包括检查所述比特流特性的步骤。
图6和图7示出了针对R0和R1分别等于13.5和16Mbps的两个操作点的CPB缓存器填充水平。CPB大小CPB0和CPB1分别是1400和1000兆字节。并且上述偏移,即InitCpbRemovalDelayOffset0和InitCpbRemovalDelayOffset1分别是30和0毫秒。
下图示出了针对Rsel的值等于14.75Mbps(即,恰好在13.5和16Mbps之间)和newInitialCPBRemovalDelayOffset的不同值的CPB充满度。在图8中,后者等于InitCpbRemovalDelayOffset0(30ms),导致上溢,而在图9中,后者等于InitCpbRemovalDelayOffset1(0ms),导致下溢。当仅使用给定操作点InitCpbRemovalDelayOffset0和InitCpbRemovalDelayOffset1(15ms)的线性拟合时,结果是图10的情况。使用上面讨论的计算值(16.3ms),结果是图11的情况。图12示出了使用InitCpbRemovalDelayOffset0与InitCpbRemovalDelayOffset1之间的任意值(20ms),也导致上溢。可以看出,等于InitCpbRemovalDelayOffset0和InitCpbRemovalDelayOffset1的偏移的任意数量可能导致问题,即缓存器下溢或上溢。在上述示例中,线性拟合导致有效的操作值以及上面讨论的所提供的显式加权预配置。然而,在其他情况下,线性拟合可能导致上溢(如果编码器不在意的话)。例如,图13中描绘了针对R0和R1等于14.5和18Mbps以及CPB0和CPB1分别是1250和1300兆字节并且InitCpbRemovalDelayOffset0和InitCpbRemovalDelayOffset1分别等于15和40的情况的线性拟合。这里,导致上溢。在图14中,示出了使用具有双因子权重的插值的插值。
图3的解码器100从每个进入的AU中重构相应的图片16’,其中,可能的但可选的可以单独地或组合地应用的实现细节已经在上面关于图2进行了描述。下面更详细地描述了用于实现解码器和编码器的一些选项。
第一选项涉及对解码图片16’的处理以及它们对解码图片缓存器的缓存。图2的环路缓存器142可以包括这种DPB。在图3中,DPB可以是解码器100的一部分。
根据实施例,图3的装置在两种类型(即,短期和长期)的参考图片之间进行区分。编码器在解码期间的每个时间点模拟解码器100的DPB填充状态时做同样的事情。参考图片可以在不再被需要用于预测参考时被标记为“不用于参考”。这三种状态(短期、长期和不用于参考)之间的转换由解码参考图片标记过程来控制。存在两种备选的解码参考图片标记机制,隐式滑动窗口过程和显式存储器管理控制操作(MMCO)过程。针对每个当前解码图片或每个当前解码AU,在数据流14中用信号发送关于哪个过程将用于DPB管理。当参考帧的数量等于给定的最大数量(SPS中的max-num-ref-frames)时,滑动窗口过程将短期参考图片标记为“不用于参考”。短期参考图片以先进先出的方式存储,使得最近解码的短期图片保留在DPB中。显式MMCO过程经由多个MMCO命令来控制。如果为当前AU或当前解码图片选择了该模式,则比特流针对该AU或在该AU中包含这些命令中的一个或多个。MMCO命令可以是以下中的任何一个:1)将一个或多个短期或长期参考图片标记为“不用于参考”,2)将所有图片标记为“不用于参考”,或3)将当前参考图片或现有的短期参考图片标记为长期,并将长期图片索引指派给该长期图片。参考图片标记操作和从DPB中的图片的任何输出(为了呈现)和移除可以在图片已经被解码之后执行。
也就是说,返回到图3,根据实施例,解码器100可以对从CPB 200移除并因此从CPB200接收的当前AU 402进行解码400以获得解码图片16’。解码器100可以使用基于由前述环路缓存器142包括的、在前述DPB 406中存储的被参考的参考图片404的图片间预测。解码图片16’可以被插入408到DPB 406中。可以针对每个当前解码图片16’执行插入408,即,每个解码图片可以在其解码400之后被放置在DPB 406中。插入408可以瞬时(即,在忽略解码时间时的AU 402的CPB移除时间,或CPB移除时间加上所需的解码时间)发生。然而,插入408还可以附加地取决于特定事实进行,如410处所指示的,例如每个新解码图片都被插入到DPB406中,除非它要在其CPB移除时间被输出412,即,除非它是立即输出图片,即,要立即输出以呈现的图片,并且它是非参考图片,这种情况可以通过相应的语法元素在相应的AU 402中指示。该装置可以向存储在DPB 406中的每个参考图片414指派作为短期参考图片、长期参考图片、以及不用于参考的图片之一的分类。该装置进一步从当前AU 402中读取DPB模式信息416,并且如果模式信息416指示固有模式或第一模式,则固有DPB管理过程418被激活并根据FIFO策略,从DPB 406中移除424被分类为短期图片的一个或多个参考图片414。如果模式信息416指示显式模式或第二模式,则显式DPB管理过程420被激活,并执行包含在由当前AU 402包括的存储器管理控制信息中的一个或多个命令以改变指派给DPB 406中存储的参考图片414中的至少一个的分类,并使用DPB 406中的参考图片414的分类来管理从DPB406中的参考图片移除424。无论针对当前图片16’选择了过程418还是420,DPB 406中的其图片输出时间已达到的任何图片414都被输出422以进行呈现。从DPB 406中移除424不再被输出且被分类为不用于参考的图片414。
下面讨论图15的参考图片标记机制的一些可能细节。1)第一方面涉及帧号中的间隙和不存在的图片。尽管上面未说明,DPB 406中的每个参考图片414可以与帧号相关联,该帧号可以由图3的装置从AU 402中的帧号语法元素导出,该帧号语法元素指示按照解码顺序的AU排序。通常,针对每个参考图片414,该帧号增加1,但可以通过将相应的高级别(例如,序列级别)标志(其可以被称为parameter-gaps-in-frame-num-allowed-flag)设置为1来允许帧号中的间隙,例如,以便允许编码器或MANE(媒体感知网络元件)可以传送在其中针对参考图片的帧号相对于按照解码顺序的前一参考图片增加多于1的比特流。为了支持时间可缩放性,这可能是有利的。图3的接收具有帧号中间隙的AU序列的装置可以被配置为创建不存在的图片来填充间隙。不存在的图片在间隙中被指派有帧号值,并在解码参考图片标记期间被视为参考图片,但将不用于输出(因此不显示)。不存在的图片确保DPB的关于驻留在其中的图片的帧号的状态针对接收了图片的解码器与未接收图片的解码器是相同的。
另一可能的方面涉及在使用滑动窗口时参考图片的丢失。当参考图片丢失时,图3的装置可以尝试隐藏该图片,并且如果在检测到丢失时反馈信道是可用的,则可能向编码器报告丢失。如果不允许帧号中的间隙,则帧号值的不连续性指示参考图片的意外丢失。如果允许帧号中的间隙,则帧号值的不连续性可能是由于时间层或子序列的故意移除或意外图片丢失引起的,并且解码器(例如,图3的装置)应仅在不存在的图片在帧间预测过程中被引用时才推断图片丢失。隐藏图片的图片顺序计数可能是未知的,这可能导致解码器(例如,图3的装置)在对B图片进行解码时使用不正确的参考图片而没有检测到任何错误。
另一可能的方面涉及利用MMCO的参考图片的丢失。当丢失包含将短期参考图片标记为“不用于参考”的MMCO命令的参考图片时,则DPB中的参考图片状态变得不正确,因此,针对丢失图片之后的若干图片的参考图片列表可能变得不正确。如果包含与长期参考图片相关的MMCO命令的图片丢失,则存在DPB中的长期参考图片的数量与在接收到图片时将会是长期参考图片的数量不同的风险,从而导致针对所有后续图片的“不正确”的滑动窗口过程。也就是说,编码器和解码器(即,图3的装置)将包含不同数量的短期参考图片,导致滑动窗口过程的不同步行为。使情况更糟的是,解码器将不一定知道滑动窗口过程不同步。
以下的图示出了上述可能的MMCO命令。这些命令中一个或多个或全部可以应用以产生不同的实施例:
现在描述针对解码器和编码器的实现的另一选项,可以可选地与之前描述的关于DPB管理的选项组合,并且涉及将某个语法元素(例如,变换系数形式的残差数据)熵解码到比特流中14。有损量化变换系数的无损熵编码是高效视频编解码器的关键部分。一种这样的方法被称为上下文自适应可变长度编码(CAVLC),其中,编码器在各种语法元素的不同可变长度代码(VLC)表之间切换,其取决于以上下文自适应方式的同一片中的先前发送的语法元素的值。编码器和解码器可以使用CAVLC。由于通过将相应码字(该码字是已经从上下文自适应选择的代码表中针对该语法元素选择的)写入比特流中来将每个语法元素编码到比特流14中的事实,比特流中的每个CAVLC编码比特可以关联到单个语法元素。因此,当使用CAVLC时,关于以扫描顺序出现在比特流14中的变换系数级别的相关信息可以作为语法元素以可直接接入的形式获得。编码器和解码器可以使用CAVLC来用信号发送比特流14中的变换系数。可以使用以下语法元素,即具有以下语义的语法元素:
-指示变换块中的非零变换系数级别的总数的一个语法元素(由CoeffToken指示)
-指示结尾为1的变换系数级别的数量的一个或多个语法元素,即,以扫描顺序扫描语法元素直到最后一个非零语法元素(都是1)的结束时出现的一系列语法元素以及它们的符号
-针对除了结尾为1的变换系数之外的每个非零变换系数的一个或多个语法元素,其指示变换系数级别值
-指示零值变换系数级别的总数的一个语法元素
-指示按照扫描顺序在遇到非零值变换系数级别之前从当前扫描位置向前具有零值的连续变换系数级别的数量的语法元素。
备选地或附加地,编码器可以在CABAC的使用(因此上下文自适应二进制算术编码)与CAVLC的使用之间进行选择并在比特流14中用信号发送该选择,解码器读取该信号并使用所指示的解码残差数据的方式。
现在描述用于解码器和编码器的实现的另一选项,可以可选地与之前描述的关于DPB管理的选项和关于CAVLC的选项中的任一选项进行组合,并且涉及四分之一像素插值滤波器。为了允许以比常规全像素样本网格更精细的粒度进行帧间预测,使用样本插值过程来导出子像素样本位置处的样本值,该子像素样本位置的范围可以从半像素位置到四分之一像素位置。编码器和解码器可以使用一种执行四分之一像素插值的方法,并且该方法如下。首先,使用6抽头FIR滤波器在半像素位置生成样本值,然后通过插值对所生成的半像素位置样本值进行平均,以生成亮度分量的四分之一像素位置处的样本值。
为了完整起见,图16示出了适合图3的装置的编码器,即将视频12编码为比特流14的编码器,该编码器可能但不一定根据图1,并且以使得要由图3的装置进行的插值产生无下溢和上溢的操作的方式为比特流14提供CPB参数300。
因此,以下实施例或方面可从以上描述导出,并且以下实施例或方面继而可通过以上任何细节和事实单独地或组合地进一步扩展。
根据第一方面,用于视频解码的装置可以包括编码图片缓存器200,并且被配置为接收数据流14,该数据流14具有按照编码顺序编码到其中的视频12的图片16作为接入单元48的序列,使用所选择的比特率302将接入单元48的序列顺序地馈送到CPB中,其中暂停对尚未达到根据时间帧移除光栅的虚拟可用时间的接入单元的馈送,直至达到所述虚拟可用时间,所述时间帧移除光栅针对按照所述编码顺序的第一接入单元提前所选择的时间移除延迟,而针对按照所述编码顺序的后续接入单元提前所选择的时间移除延迟与所选择的时间偏移之和;使用时间光栅[RemovalTime]逐AU地从CPB中移除AU,从数据流中提取与第一操作点相关的第一CPB参数300i-1和与第二操作点相关的第二CPB参数300i,第一CPB参数和第二CPB参数中的每个CPB参数指示CPB大小、预定时间偏移、预定时间移除延迟和预定比特率,其中,第一CPB参数300i-1至少在预定比特率方面不同于第二CPB参数300i,通过以所选择的比特率在由第一CPB参数300i-1指示的预定时间偏移与由第二CPB参数300i指示的预定时间偏移之间进行插值来确定所选择的时间偏移、以及通过以所选择的比特率在由第一CPB参数300i-1指示的预定时间移除延迟与由第二CPB参数300i指示的预定时间移除延迟之间进行插值来确定所选择的时间移除延迟。
根据第二方面,当返回参考第一方面时,该装置可以被配置为:从数据流导出一个或多个插值参数并使用所述一个或多个插值参数对插值进行参数化。
根据第三方面,当返回参考第一方面或第二方面时,该装置可以被配置为:使用由第一权重加权的由所述第一CPB参数指示的预定时间偏移与由第二权重加权的由所述第二CPB参数指示的预定时间偏移的加权和来执行所述插值。
根据第四方面,当返回参考第三方面时,该装置可以被配置为:基于所选择的比特率、由所述第一CPB参数指示的预定比特率和由所述第二CPB参数指示的预定比特率来确定所述第一权重和所述第二权重。
根据第五方面,当返回参考第三方面时,该装置可以被配置为:通过将所选择的比特率与由所述第一CPB参数指示的预定比特率之间的差除以由所述第一CPB参数指示的预定比特率与由所述第二CPB参数指示的预定比特率之间的差来计算线性插值权重;以及使用所述线性插值权重来确定第一权重和第二权重。
根据第六方面,当返回参考第五方面时,该装置可以被配置为:确定第一权重,使得所述第一权重是所述线性插值权重或其中的一个因子是所述线性插值权重的乘积;以及确定第二权重,使得所述第二权重是所述线性插值权重与1之间的差或其中的一个因子是所述线性插值权重与1之间的差的乘积。
根据第七方面,当返回参考第五方面时,该装置可以被配置为:确定第一权重,使得第一权重是如下乘积:所述乘积的第一因子是所述线性插值权重,并且所述乘积的第二因子是由所述第一CPB参数指示的预定比特率除以所选择的比特率;以及确定第二权重,使得所述第二权重是如下乘积:所述乘积的一个因子是所述线性插值权重与1之间的差,并且所述乘积的第二因子是由所述第二CPB参数指示的预定比特率除以所选择的比特率。
根据第八方面,当返回参考第一方面至第七方面中的任一方面时,该装置还可以包括解码图片缓存器(DPB)并且被配置为:使用根据存储在DPB中的被参考的参考图片404的图片间预测对从CPB 200移除的当前AU402进行解码,以获得解码图片16’,并将解码图片插入408到DPB中,向存储在DPB中的每个参考图片414指派作为短期参考图片、长期参考图片、以及不用于参考的图片之一的分类,从当前AU中读取DPB模式信息416,如果所述DPB模式信息指示第一模式,则根据FIFO策略从DPB中移除424被分类为短期图片的一个或多个参考图片,如果所述DPB模式信息指示第二模式,则读取当前AU中的包括至少一个命令的存储器管理控制信息,并执行所述至少一个命令以改变指派给存储在DPB中的参考图片中的至少一个的分类,以及使用DPB中的参考图片的分类,一管理从DPB中的参考图片移除424。
根据第九方面,当返回参考第八方面时,该装置可以被配置为:从当前AU中读取关于解码图片是否不用于图片间预测的指示;如果所述解码图片未被指示为不用于图片间预测或不直接被输出,则执行将所述解码图片插入到所述DPB中,以及如果所述解码图片被指示为不用于图片间预测且直接被输出,则直接输出所述解码图片,而不在所述DPB中缓存所述解码图片。
根据第十方面,当返回参考第八方面或第九方面时,该装置可以被配置为:将帧索引指派给DPB中的被分类为长期图片的每个参考图片,以及如果指派给DPB中的被分类为长期图片的预定参考图片的帧索引在当前AU中被参考,则使用所述预定参考图片作为DPB中的被参考的参考图片。
根据第十一方面,当返回参考第十方面时,该装置可以被配置为执行以下中的一项或多项:如果当前AU中的至少一个命令是第一命令,则将DPB中的被分类为短期参考图片的参考图片重新分类为不用于参考的图片;如果当前AU中的至少一个命令是第二命令,则将所述DPB中的被分类为长期参考图片的参考图片重新分类为不用于参考的图片;如果当前AU中的至少一个命令是第三命令,则将DPB中的被分类为短期图片的参考图片重新分类为长期参考图片,并将帧索引指派给所述重新分类的参考图片;如果当前AU中的至少一个命令是第四命令,则根据第四命令来设置帧索引上限,并将DPB中的被分类为长期图片且已经向其指派了超过所述帧索引上限的帧索引的所有参考图片重新分类为不用于参考的图片;如果当前AU中的至少一个命令是第五命令,则将当前图片分类为长期图片,并将帧索引指派给当前图片。
根据第十二方面,当返回参考第八方面至第十一方面中的任一方面时,该装置可以被配置为:从DPB中移除被分类为不用于参考的图片且不再被输出的任何参考图片。
根据第十三方面,当返回参考第一方面至第十二方面中的任一方面时,该装置可以被配置为:从数据流中读取熵编码模式指示符,以及如果所述熵编码模式指示符指示上下文自适应可变长度编码模式,则使用所述上下文自适应可变长度编码模式从当前AU中解码出预测残差数据,以及如果熵编码模式指示符指示上下文自适应二进制算术编码模式,则使用所述上下文自适应二进制算术编码模式从当前AU中解码出预测残差数据。
根据第十四方面,当返回参考第一方面至第十三方面中的任一方面时,该装置可以被配置为:基于当前AU中的运动矢量并使用6抽头FIR滤波器以导出半像素值并对相邻半像素值进行平均,来导出被参考的参考图片中的四分之一像素值。
根据第十五方面,当返回参考第一方面至第十四方面中的任一方面时,该装置可以被配置为:通过第一接入单元的移除与后续接入单元中的每一个的移除之间的时间差,从数据流中导出关于时间光栅的信息。
根据第十六方面,当返回参考第一方面至第十五方面中的任一方面时,该装置可以被配置为:以所选择的比特率302在由第一CPB参数300i-1指示的CPB大小与由第二CPB参数300i指示的CPB大小之间进行插值,以获得插值后的CPB大小,从而确定编码图片缓存器200的最小CPB大小。
根据第十七方面,当返回参考第一方面至第十六方面中的任一方面时,在该装置中,所选择的比特率可以在由第一CPB参数300i-1指示的预定比特率与由第二CPB参数300i指示的预定比特率之间。
根据第十八方面,当返回参考第一方面至第十七方面中的任一方面时,该装置可以被配置为:以缓存周期为单位进行操作,按照编码顺序的第一接入单元是当前缓存周期的第一接入单元。
根据第十九方面,一种用于将视频编码为数据流的装置,其中,所述数据流应通过将所述数据流馈送到包括编码图片缓存器(CPB)的解码器来解码,该装置可以被配置为:将按照编码顺序进行编码的视频的图片编码到数据流中作为接入单元(AU)序列,确定与第一操作点相关的第一CPB参数和与第二操作点相关的第二CPB参数,所述第一CPB参数和所述第二CPB参数中的每个CPB参数指示CPB大小、预定时间偏移、预定时间移除延迟和预定比特率,其中,所述第一CPB参数至少在预定比特率方面不同于所述第二CPB参数,以及执行所述确定,使得以多个所选择的比特率中的每个所选择的比特率在所述第一CPB参数的预定时间偏移与所述第二CPB参数的预定时间偏移之间进行插值产生插值后的时间偏移和插值后的时间移除延迟,从而通过以下方式经由CPB将数据流馈送到解码器:使用相应的所选择的比特率将所述AU序列顺序地馈送到CPB中,其中暂停对尚未达到根据时间帧移除光栅的虚拟可用时间的接入单元的馈送,直到达到所述虚拟可用时间,所述虚拟可用时间针对按照所述编码顺序的第一接入单元提前插值后的时间移除延迟,而针对按照所述编码顺序的后续接入单元提前插值后的时间移除延迟与插值后的时间偏移之和;使用时间光栅逐AU地从CPB中移除AU,不导致任何下溢和任何上溢,以及将所述CPB参数编码到所述数据流中。
根据第二十方面,当返回参考第十九方面时,在该装置中,可以使用插值参数对插值进行参数化,以及该装置可以被配置为将所述插值参数编码到所述数据流中。
根据第二十一方面,当返回参考第十九或第二十方面时,在该装置中,使用由第一权重加权的由所述第一CPB参数指示的预定时间偏移与由第二权重加权的由所述第二CPB参数指示的预定时间偏移的加权和来执行所述插值。
根据第二十二方面,当返回参考第二十一方面时,在该装置中,基于所选择的比特率、由所述第一CPB参数指示的预定比特率、以及由所述第二CPB参数指示的预定比特率来确定所述第一权重和所述第二权重。
根据第二十三方面,当返回参考第二十一方面时,在该装置中,通过将所选择的比特率与由所述第一CPB参数指示的预定比特率之间的差除以由所述第一CPB参数指示的预定比特率与由所述第二CPB参数指示的预定比特率之间的差所确定的线性插值权重可以用于确定所述第一权重和所述第二权重。
根据第二十四方面,当返回参考第二十三方面时,在该装置中,可以确定第一权重,使得所述第一权重是线性插值权重或其中的一个因子是线性插值权重的乘积;以及可以确定第二权重,使得所述第二权重是所述线性插值权重与1之间的差或其中的一个因子是所述线性插值权重与1之间的差的乘积。
根据第二十五方面,当返回参考第二十三方面时,在该装置中,确定第一权重,使得第一权重是如下乘积:所述乘积的第一因子是所述线性插值权重,并且所述乘积的第二因子是由所述第一CPB参数指示的预定比特率除以所选择的比特率;以及可以确定第二权重,使得所述第二权重是如下乘积:所述乘积的一个因子是所述线性插值权重与1之间的差,并且所述乘积的第二因子是由所述第二CPB参数指示的预定比特率除以所选择的比特率。
根据第二十六方面,当返回参考第十九方面至第二十五方面中的任一方面时,该装置可以被配置为:在对所述AU进行编码时,使用根据存储在DPB中的被参考的参考图片的图片间预测,将当前图片编码到当前AU中,以及将DPB中的当前图片的解码版本插入到DPB中,向存储在DPB中的每个参考图片指派作为短期参考图片、长期参考图片、以及不用于参考的图片之一的分类,将DPB模式信息写入当前AU,如果DPB模式信息指示第一模式,则根据FIFO策略从DPB中移除被分类为短期图片的一个或多个参考图片,如果DPB模式信息指示第二模式,则将包括至少一个命令的存储器管理控制信息写入当前AU,所述命令指示改变指派给存储在DPB中的参考图片中的至少一个的分类,其中,DPB中的参考图片的分类用于管理从DPB中的参考图片移除。
根据第二十七方面,当返回参考第二十六方面时,该装置可以被配置为:将所述解码图片是否不用于图片间预测的指示写入当前AU;其中,如果所述解码图片未被指示为不用于图片间预测或不直接被输出,则所述解码图片将被插入到所述DPB中,以及如果所述解码图片被指示为不用于图片间预测且直接被输出,则所述解码图片将被直接输出,而不在所述DPB中缓存所述解码图片。
根据第二十八方面,当返回参考第二十六或第二十七方面时,在该装置中,帧索引将被指派给DPB中的被分类为长期图片的每个参考图片,以及如果指派给DPB中的被分类为长期图片的预定参考图片的帧索引在当前AU中被参考,则使用所述预定参考图片作为DPB中的被参考的参考图片。
根据第二十九方面,当返回参考第二十八方面时,在该装置中,执行以下中的一项或多项:如果当前AU中的至少一个命令是第一命令,则DPB中的被分类为短期参考图片的参考图片将被重新分类为不用于参考的图片;如果当前AU中的至少一个命令是第二命令,则DPB中的被分类为长期参考图片的参考图片将被重新分类为不用于参考的图片;如果当前AU中的至少一个命令是第三命令,则DPB中的被分类为短期图片的参考图片将被重新分类为长期参考图片,并且帧索引将被指派给重新分类的参考图片;如果当前AU中的至少一个命令是第四命令,则帧索引上限将根据第四命令来设置,并且DPB中的被分类为长期图片且已经向其指派了超过所述帧索引上限的帧索引的所有参考图片将被重新分类为不用于参考的图片;如果当前AU中的至少一个命令是第五命令,则当前图片将被分类为长期图片,并将帧索引指派给当前图片。
根据第三十方面,当返回参考第二十六方面至第二十九方面中的任一方面时,在该装置中,被分类为不用于参考的图片且不再被输出任何参考图片将从DPB中移除。
根据第三十一方面,当返回参考第十九方面至第三十方面中的任一方面时,该装置可以被配置为:将熵编码模式指示符写入数据流,以及如果所述熵编码模式指示符指示上下文自适应可变长度编码模式,则使用所述上下文自适应可变长度编码模式将预测残差数据编码到当前AU中,以及如果熵编码模式指示符指示上下文自适应二进制算术编码模式,则使用所述上下文自适应二进制算术编码模式将预测残差数据编码到当前AU中。
根据第三十二方面,当返回参考第十九方面至第三十一方面中的任一方面时,该装置可以被配置为:基于当前AU中的运动矢量并使用6抽头FIR滤波器以导出半像素值并对相邻半像素值进行平均,来导出被参考的参考图片中的四分之一像素值。
根据第三十三方面,当返回参考第十九方面至第三十二方面中的任一方面时,该装置可以被配置为:通过第一接入单元的移除与后续接入单元中的每一个的移除之间的时间差,为数据流提供关于时间光栅的信息。
根据第三十四方面,当返回参考第十九方面至第三十三方面中的任一方面时,在该装置中,将以所选择的比特率302在由第一CPB参数300i-1指示的CPB大小与由第二CPB参数300i指示的CPB大小之间执行插值,以获得插值后的CPB大小,从而确定编码图片缓存器200的最小CPB大小。
根据第三十五方面,当返回参考第十九方面至第三十四方面中的任一方面时,在该装置中,所选择的比特率可以在由第一CPB参数300i-1指示的预定时间偏移与由第二CPB参数300i指示的预定时间偏移之间。
根据第三十六方面,当返回参考第十九方面至第三十五方面中的任一方面时,该装置可以被配置为:以缓存周期为单位进行操作,按照编码顺序的第一接入单元是当前缓存周期的第一接入单元。
根据第三十七方面,当返回参考第十九方面至第三十六方面中的任一方面时,该装置可以被配置为:通过确定第一CPB参数和第二CPB参数的初步版本来执行确定;以多个所选择的比特率执行插值,以获得针对多个所选择的比特率中的每一个的插值后的时间偏移和插值后的时间移除延迟;以及针对多个所选择的比特率中的每一个,检查使用针对各个所选择的比特率获得的插值后的时间偏移和插值后的时间移除延迟经由CPB向解码器馈送数据流是否导致下溢和上溢,并且如果是,则以不同方式恢复编码,修改第一CPB参数和第二CPB参数的初步版本,或使用不同方式恢复插值,并且如果不是,则确定第一CPB参数和第二CPB参数等于初步版本。
根据第三十八方面,一种利用编码图片缓存器200进行视频解码的方法可以具有以下步骤:接收数据流14,该数据流14具有按照编码顺序编码到其中的视频12的图片16作为接入单元48的序列,使用所选择的比特率302将所述接入单元48的序列顺序地馈送到CPB中,其中暂停对尚未达到根据时间帧移除光栅的虚拟可用时间的接入单元的馈送,直至达到所述虚拟可用时间,所述时间帧移除光栅针对按照所述编码顺序的第一接入单元提前所选择的时间移除延迟,而针对按照所述编码顺序的后续接入单元提前所选择的时间移除延迟与所选择的时间偏移之和;使用时间光栅[RemovalTime]逐AU地从CPB中移除AU,从数据流中提取与第一操作点相关的第一CPB参数300i-1和与第二操作点相关的第二CPB参数300i,第一CPB参数和第二CPB参数中的每个CPB参数指示CPB大小、预定时间偏移、预定时间移除延迟和预定比特率,其中,第一CPB参数300i-1至少在预定比特率方面不同于第二CPB参数300i,通过以所选择的比特率在由第一CPB参数300i-1指示的预定时间偏移与由第二CPB参数300i指示的预定时间偏移之间进行插值来确定所选择的时间偏移、以及通过以所选择的比特率在由第一CPB参数300i-1指示的预定时间移除延迟与由第二CPB参数300i指示的预定时间移除延迟之间进行插值来确定所选择的时间移除延迟。
第三十九方面可以具有视频可以被编码到其中并且可以包括第一CPB参数和第二CPB参数的数据流,使得根据第三十八方面所述的方法不导致CPB上溢和下溢。
根据第四十方面,用于将视频编码为数据流的方法(其中,所述数据流应通过将所述数据流馈送到包括编码图片缓存器(CPB)的解码器来解码)可以具有以下步骤:将按照编码顺序进行编码的视频的图片编码到数据流中作为接入单元(AU)序列,定与第一操作点相关的第一CPB参数和与第二操作点相关的第二CPB参数,所述第一CPB参数和所述第二CPB参数中的每个CPB参数指示CPB大小、预定时间偏移、预定时间移除延迟和预定比特率,其中,所述第一CPB参数至少在预定比特率方面不同于所述第二CPB参数,以及执行所述确定,使得以多个所选择的比特率中的每个所选择的比特率在所述第一CPB参数的预定时间偏移与所述第二CPB参数的预定时间偏移之间进行插值产生插值后的时间偏移和插值后的时间移除延迟,从而通过以下方式经由CPB将数据流馈送到解码器:使用相应的所选择的比特率将所述AU序列顺序地馈送到CPB中,其中暂停对尚未达到根据时间帧移除光栅的虚拟可用时间的接入单元的馈送,直到达到所述虚拟可用时间,所述虚拟可用时间针对按照所述编码顺序的第一接入单元提前插值后的时间移除延迟,而针对按照所述编码顺序的后续接入单元提前插值后的时间移除延迟与插值后的时间偏移之和;使用时间光栅逐AU地从CPB中移除AU,不导致任何下溢和任何上溢,以及将CPB参数编码到数据流中。
第四十一方面可以具有通过根据第四十方面所述的方法生成的数据流。
应理解,在本说明书中,线上的信号有时由线的附图标记来命名,或有时由归属于线的附图标记本身来表示。因此,该标记方式使得具有某一信号的线指示信号本身。线可以是硬连线实现中的物理线路。然而,在计算机化实现中,物理线路不存在,但该线所表示的信号从一个计算模块发送给另一计算模块。
尽管已在框图的上下文(其中,块表示实际的或逻辑的硬件组件)中描述了本发明,但本发明也可以通过计算机实现的方法来实现。在后者的情况下,块表示相应方法步骤,其中这些步骤代表由对应逻辑或实体硬件块执行的功能。
尽管已经在装置的上下文中描述了一些方面,但将清楚的是,这些方面还表示对应方法的描述,其中,块或装置对应于方法步骤或方法步骤的特征。类似地,在方法步骤的上下文中描述的方面也表示对对应块或对应装置的项或特征的描述。可以由(或使用)硬件设备(诸如,微处理器、可编程计算机或电子电路)来执行一些或全部方法步骤。在一些实施例中,可以由这种装置来执行最重要方法步骤中的某一个或多个方法步骤。
本发明的经传输或编码的信号可以存储在数字存储介质上或可以在诸如无线传输介质或有线传输介质(比如互联网)的传输介质上传输。
取决于某些实现要求,可以在硬件中或在软件中实现本发明的实施例。可以通过使用其上存储有电子可读控制信号的数字存储介质(例如,软盘、DVD、Blu-Ray、CD、ROM、PROM和EPROM、EEPROM或闪存)来执行所述实现方案,所述控制信号与可编程计算机系统协作(或能够与之协作),从而执行相应方法。因此,数字存储介质可以是计算机可读的。
根据本发明的一些实施例包括具有电子可读控制信号的数据载体,其能够与可编程计算机系统协作以便执行本文所述的方法之一。
通常,本发明的实施例可以实现为具有程序代码的计算机程序产品,程序代码可操作以在计算机程序产品在计算机上运行时执行方法之一。程序代码可以例如存储在机器可读载体上。
其他实施例包括存储在机器可读载体上的计算机程序,该计算机程序用于执行本文所述的方法之一。
换言之,本发明方法的实施例因此是具有程序代码的计算机程序,该程序代码用于在计算机程序在计算机上运行时执行本文所述的方法之一。
因此,本发明方法的另一实施例是数据载体(或诸如数字存储介质或计算机可读介质的非暂时性存储介质),包含记录于其上的用于执行本文所述方法之一的计算机程序。数据载体、数字存储介质或记录介质通常是有形的和/或非暂时性的。
因此,本发明方法的另一实施例是表示用于执行本文所述方法之一的计算机程序的数据流或信号序列。数据流或信号序列可以例如被配置为经由数据通信连接(例如,经由互联网)传送。
另一实施例包括处理装置,例如,计算机或可编程逻辑器件,所述处理装置被配置为或适于执行本文所述的方法之一。
另一实施例包括其上安装有计算机程序的计算机,该计算机程序用于执行本文所述的方法之一。
根据本发明的另一实施例包括被配置为向接收器(例如,以电子方式或以光学方式)传送计算机程序的装置或系统,该计算机程序用于执行本文所述的方法之一。接收器可以是例如计算机、移动设备、存储设备等。装置或系统可以例如包括用于向接收器传输计算机程序的文件服务器。
在一些实施例中,可编程逻辑器件(例如,现场可编程门阵列)可以用于执行本文所述的方法的一些或全部功能。在一些实施例中,现场可编程门阵列可以与微处理器协作以执行本文所述的方法之一。通常,这些方法可以由任何硬件设备来执行。
上述实施例对于本发明的原理仅是说明性的。应当理解的是,本文所述的布置和细节的修改和变形对于本领域其他技术人员将是显而易见的。因此,旨在仅由所附专利权利要求的范围来限制而不是由借助对本文的实施例的描述和解释所给出的具体细节来限制。
参考文献
[1]Sjoberg,Rickard等,″Overview of HEVC high-level syntax andreference picture management.″IEEE transactions on Circuits and Systems forVideo Technology 22.12(2012):1858-1870。

Claims (4)

1.一种用于视频解码的装置,所述装置包括编码图片缓存器CPB和解码图片缓存器DPB,被配置为:
接收数据流,所述数据流具有按照编码顺序编码到其中的视频的图片作为接入单元AU序列,
使用所选择的比特率将所述接入单元序列顺序地馈送到CPB中,其中暂停对尚未达到根据时间帧移除光栅的虚拟可用时间的接入单元的馈送,直至达到所述虚拟可用时间,所述时间帧移除光栅针对按照所述编码顺序的第一接入单元提前所选择的时间移除延迟,而针对按照所述编码顺序的后续接入单元提前所选择的时间移除延迟与所选择的时间偏移之和;
使用所述时间光栅逐AU地从所述CPB中移除AU,
从所述数据流中提取与第一操作点相关的第一CPB参数和与第二操作点相关的第二CPB参数,所述第一CPB参数和所述第二CPB参数中的每个CPB参数指示CPB大小、预定时间偏移、预定时间移除延迟和预定比特率,其中,所述第一CPB参数至少在所述预定比特率方面不同于所述第二CPB参数,
通过以所选择的比特率在由所述第一CPB参数指示的预定时间偏移与由所述第二CPB参数指示的预定时间偏移之间进行插值来确定所选择的时间偏移,以及通过以所选择的比特率在由所述第一CPB参数指示的预定时间移除延迟与由所述第二CPB参数指示的预定时间移除延迟之间进行插值来确定所选择的时间移除延迟,
使用根据存储在所述DPB中的被参考的参考图片的图片间预测,对从所述CPB移除的当前AU进行解码,以获得解码图片,以及
将所述解码图片插入到所述DPB中,
向存储在所述DPB中的每个参考图片指派作为短期参考图片、长期参考图片、以及不用于参考的图片之一的分类,
从所述当前AU中读取DPB模式信息,
如果所述DPB模式信息指示第一模式,则根据先进先出FIFO策略,从所述DPB中移除被分类为短期图片的一个或多个参考图片,
如果所述DPB模式信息指示第二模式,则
读取所述当前AU中的包括至少一个命令的存储器管理控制信息,并执行所述至少一个命令以改变指派给存储在所述DPB中的参考图片中的至少一个的分类,以及使用所述DPB中的所述参考图片的分类,以管理从所述DPB中的参考图片移除,
其中,所选择的比特率在由所述第一CPB参数指示的预定时间偏移与由所述第二CPB参数指示的预定时间偏移之间。
2.一种用于视频解码的装置,所述装置包括编码图片缓存器CPB和解码图片缓存器DPB,被配置为:
接收数据流,所述数据流具有按照编码顺序编码到其中的视频的图片作为接入单元AU序列,
使用所选择的比特率将所述接入单元序列顺序地馈送到CPB中,其中暂停对尚未达到根据时间帧移除光栅的虚拟可用时间的接入单元的馈送,直至达到所述虚拟可用时间,所述时间帧移除光栅针对按照所述编码顺序的第一接入单元提前所选择的时间移除延迟,而针对按照所述编码顺序的后续接入单元提前所选择的时间移除延迟与所选择的时间偏移之和;
使用所述时间光栅逐AU地从所述CPB中移除AU,
从所述数据流中提取与第一操作点相关的第一CPB参数和与第二操作点相关的第二CPB参数,所述第一CPB参数和所述第二CPB参数中的每个CPB参数指示CPB大小、预定时间偏移、预定时间移除延迟和预定比特率,其中,所述第一CPB参数至少在所述预定比特率方面不同于所述第二CPB参数,
通过以所选择的比特率在由所述第一CPB参数指示的预定时间偏移与由所述第二CPB参数指示的预定时间偏移之间进行插值来确定所选择的时间偏移,以及通过以所选择的比特率在由所述第一CPB参数指示的预定时间移除延迟与由所述第二CPB参数指示的预定时间移除延迟之间进行插值来确定所选择的时间移除延迟,
使用根据存储在所述DPB中的被参考的参考图片的图片间预测,对从所述CPB移除的当前AU进行解码,以获得解码图片,以及
将所述解码图片插入到所述DPB中,
向存储在所述DPB中的每个参考图片指派作为短期参考图片、长期参考图片、以及不用于参考的图片之一的分类,
从所述当前AU中读取DPB模式信息,
如果所述DPB模式信息指示第一模式,则根据先进先出FIFO策略,从所述DPB中移除被分类为短期图片的一个或多个参考图片,
如果所述DPB模式信息指示第二模式,则
读取所述当前AU中的包括至少一个命令的存储器管理控制信息,并执行所述至少一个命令以改变指派给存储在所述DPB中的参考图片中的至少一个的分类,以及使用所述DPB中的所述参考图片的分类,以管理从所述DPB中的参考图片移除,以及
所述装置被配置为:从所述数据流中导出一个或多个插值参数,以及使用所述一个或多个插值参数,对所述插值进行参数化。
3.一种用于视频解码的装置,所述装置包括编码图片缓存器CPB和解码图片缓存器DPB,被配置为:
接收数据流,所述数据流具有按照编码顺序编码到其中的视频的图片作为接入单元AU序列,
使用所选择的比特率将所述接入单元序列顺序地馈送到CPB中,其中暂停对尚未达到根据时间帧移除光栅的虚拟可用时间的接入单元的馈送,直至达到所述虚拟可用时间,所述时间帧移除光栅针对按照所述编码顺序的第一接入单元提前所选择的时间移除延迟,而针对按照所述编码顺序的后续接入单元提前所选择的时间移除延迟与所选择的时间偏移之和;
使用所述时间光栅逐AU地从所述CPB中移除AU,
从所述数据流中提取与第一操作点相关的第一CPB参数和与第二操作点相关的第二CPB参数,所述第一CPB参数和所述第二CPB参数中的每个CPB参数指示CPB大小、预定时间偏移、预定时间移除延迟和预定比特率,其中,所述第一CPB参数至少在所述预定比特率方面不同于所述第二CPB参数,
通过以所选择的比特率在由所述第一CPB参数指示的预定时间偏移与由所述第二CPB参数指示的预定时间偏移之间进行插值来确定所选择的时间偏移,以及通过以所选择的比特率在由所述第一CPB参数指示的预定时间移除延迟与由所述第二CPB参数指示的预定时间移除延迟之间进行插值来确定所选择的时间移除延迟,
使用根据存储在所述DPB中的被参考的参考图片的图片间预测,对从所述CPB移除的当前AU进行解码,以获得解码图片,以及
将所述解码图片插入到所述DPB中,
向存储在所述DPB中的每个参考图片指派作为短期参考图片、长期参考图片、以及不用于参考的图片之一的分类,
从所述当前AU中读取DPB模式信息,
如果所述DPB模式信息指示第一模式,则根据先进先出FIFO策略,从所述DPB中移除被分类为短期图片的一个或多个参考图片,
如果所述DPB模式信息指示第二模式,则
读取所述当前AU中的包括至少一个命令的存储器管理控制信息,并执行所述至少一个命令以改变指派给存储在所述DPB中的参考图片中的至少一个的分类,以及使用所述DPB中的所述参考图片的分类,以管理从所述DPB中的参考图片移除,以及
所述装置被配置为:基于所述当前AU中的运动矢量并使用6抽头FIR滤波器以导出半像素值并对相邻半像素值进行平均,来导出被参考的参考图片中的四分之一像素值。
4.一种用于将视频编码为数据流的装置,其中,所述数据流应通过将所述数据流馈送到包括编码图片缓存器CPB的解码器来解码,所述装置被配置为:
按照编码顺序将视频的图片编码到数据流中,作为接入单元AU序列,
确定与第一操作点相关的第一CPB参数和与第二操作点相关的第二CPB参数,所述第一CPB参数和所述第二CPB参数中的每个CPB参数指示CPB大小、预定时间偏移、预定时间移除延迟和预定比特率,其中,所述第一CPB参数至少在所述预定比特率方面不同于所述第二CPB参数,以及执行所述确定,使得以多个所选择的比特率中的每个所选择的比特率在所述第一CPB参数的预定时间偏移与所述第二CPB参数的预定时间偏移之间进行插值产生插值后的时间偏移和插值后的时间移除延迟,从而通过以下方式经由所述CPB将所述数据流馈送到所述解码器:
使用相应的所选择的比特率将所述AU序列顺序地馈送到所述CPB中,其中暂停对尚未达到根据时间帧移除光栅的虚拟可用时间的接入单元的馈送,直至达到所述虚拟可用时间,所述时间帧移除光栅针对按照所述编码顺序的第一接入单元提前插值后的时间移除延迟,而针对按照所述编码顺序的后续接入单元提前插值后的时间移除延迟与插值后的时间偏移之和;
使用所述时间光栅逐AU地从所述CPB中移除AU,
不导致任何下溢和任何上溢,以及
将所述CPB参数编码到所述数据流中,
其中,所述装置被配置为:在对所述AU进行编码时,
使用根据存储在解码图片缓存器DPB中的被参考的参考图片的图片间预测,将当前图片编码到当前AU中,以及
将所述DPB中的当前图片的解码版本插入到所述DPB中,
向存储在所述DPB中的每个参考图片指派作为短期参考图片、长期参考图片、以及不用于参考的图片之一的分类,
将DPB模式信息写入所述当前AU,
如果所述DPB模式信息指示第一模式,则根据FIFO策略,从所述DPB中移除被分类为短期图片的一个或多个参考图片,
如果所述DPB模式信息指示第二模式,则将包括至少一个命令的存储器管理控制信息写入所述当前AU,所述命令指示改变指派给存储在所述DPB中的参考图片中的至少一个的分类,其中,所述DPB中的参考图片的分类用于管理从所述DPB中的参考图片移除,
其中,使用插值参数对所述插值进行参数化,以及所述装置被配置为将所述插值参数编码到所述数据流中。
CN202310619963.9A 2022-10-13 2023-05-29 使用编码图片缓存器的视频编码 Active CN116847076B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US17/965,591 US11695965B1 (en) 2022-10-13 2022-10-13 Video coding using a coded picture buffer
US17/965,591 2022-10-13

Publications (2)

Publication Number Publication Date
CN116847076A true CN116847076A (zh) 2023-10-03
CN116847076B CN116847076B (zh) 2024-04-05

Family

ID=85775864

Family Applications (10)

Application Number Title Priority Date Filing Date
CN202310251957.2A Active CN116634163B (zh) 2022-10-13 2023-03-15 使用编码图片缓存器的视频编码
CN202310620045.8A Active CN116847078B (zh) 2022-10-13 2023-05-29 使用编码图片缓存器的视频编码
CN202310616124.1A Active CN116847072B (zh) 2022-10-13 2023-05-29 使用编码图片缓存器的视频编码
CN202310616118.6A Active CN116847071B (zh) 2022-10-13 2023-05-29 使用编码图片缓存器的视频解码装置
CN202310620227.5A Active CN116847079B (zh) 2022-10-13 2023-05-29 一种用于视频解码的装置
CN202310619947.XA Active CN116847075B (zh) 2022-10-13 2023-05-29 视频编解码装置和传送数据流的方法
CN202310620036.9A Active CN116847077B (zh) 2022-10-13 2023-05-29 用于视频编码和视频解码的装置
CN202310616495.XA Active CN116847073B (zh) 2022-10-13 2023-05-29 使用编解码图片缓存器的视频编解码方法
CN202310619695.0A Active CN116847074B (zh) 2022-10-13 2023-05-29 使用编码图片缓存器的视频编码
CN202310619963.9A Active CN116847076B (zh) 2022-10-13 2023-05-29 使用编码图片缓存器的视频编码

Family Applications Before (9)

Application Number Title Priority Date Filing Date
CN202310251957.2A Active CN116634163B (zh) 2022-10-13 2023-03-15 使用编码图片缓存器的视频编码
CN202310620045.8A Active CN116847078B (zh) 2022-10-13 2023-05-29 使用编码图片缓存器的视频编码
CN202310616124.1A Active CN116847072B (zh) 2022-10-13 2023-05-29 使用编码图片缓存器的视频编码
CN202310616118.6A Active CN116847071B (zh) 2022-10-13 2023-05-29 使用编码图片缓存器的视频解码装置
CN202310620227.5A Active CN116847079B (zh) 2022-10-13 2023-05-29 一种用于视频解码的装置
CN202310619947.XA Active CN116847075B (zh) 2022-10-13 2023-05-29 视频编解码装置和传送数据流的方法
CN202310620036.9A Active CN116847077B (zh) 2022-10-13 2023-05-29 用于视频编码和视频解码的装置
CN202310616495.XA Active CN116847073B (zh) 2022-10-13 2023-05-29 使用编解码图片缓存器的视频编解码方法
CN202310619695.0A Active CN116847074B (zh) 2022-10-13 2023-05-29 使用编码图片缓存器的视频编码

Country Status (13)

Country Link
US (10) US11695965B1 (zh)
JP (10) JP7361975B1 (zh)
KR (1) KR20240051792A (zh)
CN (10) CN116634163B (zh)
AR (1) AR128174A1 (zh)
AU (11) AU2023200478C1 (zh)
BR (1) BR102023010473A2 (zh)
CA (10) CA3193126A1 (zh)
CL (1) CL2023001546A1 (zh)
MA (1) MA60463A1 (zh)
MX (10) MX2023003130A (zh)
TW (1) TW202416716A (zh)
WO (1) WO2024079282A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4085622A1 (en) * 2019-12-31 2022-11-09 Koninklijke KPN N.V. Partial output of a decoded picture buffer in video coding
US11695965B1 (en) 2022-10-13 2023-07-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Video coding using a coded picture buffer

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140086331A1 (en) * 2012-09-24 2014-03-27 Qualcomm Incorporated Hypothetical reference decoder parameters in video coding
CN113785584A (zh) * 2019-03-01 2021-12-10 弗劳恩霍夫应用研究促进协会 假想参考解码器
WO2022144244A1 (en) * 2020-12-28 2022-07-07 Koninklijke Kpn N.V. Partial output of a decoded picture buffer in video coding
CN114788290A (zh) * 2019-12-05 2022-07-22 夏普株式会社 用于在视频编码中发送信号通知画面定时和解码单元信息的系统和方法

Family Cites Families (52)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5623311A (en) * 1994-10-28 1997-04-22 Matsushita Electric Corporation Of America MPEG video decoder having a high bandwidth memory
US6646578B1 (en) 2002-11-22 2003-11-11 Ub Video Inc. Context adaptive variable length decoding system and method
EP1465186A1 (en) * 2003-04-02 2004-10-06 Deutsche Thomson-Brandt Gmbh Method for buffering data streams read from an optical storage medium
US7599435B2 (en) 2004-01-30 2009-10-06 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Video frame encoding and decoding
EP1605354A1 (en) * 2004-06-10 2005-12-14 Deutsche Thomson-Brandt Gmbh Method and apparatus for improved synchronization of a processing unit for multimedia streams in a multithreaded environment
US20060104356A1 (en) 2004-11-15 2006-05-18 Microsoft Corporation Timing for decoder buffer examination
US20060143678A1 (en) 2004-12-10 2006-06-29 Microsoft Corporation System and process for controlling the coding bit rate of streaming media data employing a linear quadratic control technique and leaky bucket model
US7884742B2 (en) 2006-06-08 2011-02-08 Nvidia Corporation System and method for efficient compression of digital data
US7545293B2 (en) 2006-11-14 2009-06-09 Qualcomm Incorporated Memory efficient coding of variable length codes
US9648325B2 (en) 2007-06-30 2017-05-09 Microsoft Technology Licensing, Llc Video decoding implementations for a graphics processing unit
KR20090004658A (ko) * 2007-07-02 2009-01-12 엘지전자 주식회사 디지털 방송 시스템 및 데이터 처리 방법
EP2182732A1 (en) 2008-10-28 2010-05-05 Panasonic Corporation Switching between scans in image coding
JPWO2012128241A1 (ja) 2011-03-18 2014-07-24 ソニー株式会社 画像処理装置、画像処理方法、及び、プログラム
US9491491B2 (en) 2011-06-03 2016-11-08 Qualcomm Incorporated Run-mode based coefficient coding for video coding
WO2013001796A1 (en) 2011-06-30 2013-01-03 Panasonic Corporation Methods and apparatuses for encoding video using adaptive memory management scheme for reference pictures
US9338456B2 (en) 2011-07-11 2016-05-10 Qualcomm Incorporated Coding syntax elements using VLC codewords
US9264717B2 (en) 2011-10-31 2016-02-16 Qualcomm Incorporated Random access with advanced decoded picture buffer (DPB) management in video coding
KR20130058584A (ko) * 2011-11-25 2013-06-04 삼성전자주식회사 복호화기의 버퍼 관리를 위한 영상 부호화 방법 및 장치, 그 영상 복호화 방법 및 장치
US9565431B2 (en) 2012-04-04 2017-02-07 Qualcomm Incorporated Low-delay video buffering in video coding
EP2868103B1 (en) 2012-06-29 2016-12-07 GE Video Compression, LLC Video data stream concept
US9374583B2 (en) 2012-09-20 2016-06-21 Qualcomm Incorporated Video coding with improved random access point picture behaviors
US9479774B2 (en) 2012-09-24 2016-10-25 Qualcomm Incorporated Buffering period and recovery point supplemental enhancement information messages
US8989508B2 (en) 2012-09-28 2015-03-24 Sharp Kabushiki Kaisha Electronic device for signaling a sub-picture buffer parameter
US9374585B2 (en) * 2012-12-19 2016-06-21 Qualcomm Incorporated Low-delay buffering model in video coding
US9402076B2 (en) 2013-01-07 2016-07-26 Qualcomm Incorporated Video buffering operations for random access in video coding
WO2014110651A1 (en) 2013-01-16 2014-07-24 Blackberry Limited Transform coefficient coding for context-adaptive binary entropy coding of video
EP2946552B1 (en) 2013-01-16 2018-03-21 BlackBerry Limited Context determination for entropy coding of run-length encoded transform coefficients
US10003815B2 (en) * 2013-06-03 2018-06-19 Qualcomm Incorporated Hypothetical reference decoder model and conformance for cross-layer random access skipped pictures
US10284862B2 (en) * 2013-07-14 2019-05-07 Sharp Kabushiki Kaisha Signaling indications and constraints
CN106416250B (zh) * 2013-12-02 2020-12-04 诺基亚技术有限公司 视频编码和解码
AU2017254859A1 (en) * 2017-10-31 2019-05-16 Canon Kabushiki Kaisha Method, system and apparatus for stabilising frames of a captured video sequence
CN115967801A (zh) 2018-01-25 2023-04-14 弗劳恩霍夫应用研究促进协会 有效子图片提取
US11477486B2 (en) * 2019-01-02 2022-10-18 Qualcomm Incorporated Escape coding for coefficient levels
GB2619430B (en) 2019-03-20 2024-02-21 V Nova Int Ltd Low complexity enhancement video coding
US20220217406A1 (en) 2019-05-16 2022-07-07 Nokia Technologies Oy An apparatus, a method and a computer program for handling random access pictures in video coding
CN113892271A (zh) * 2019-05-30 2022-01-04 夏普株式会社 用于在视频编码中发送信号通知假想参考解码器参数的系统和方法
US20220312042A1 (en) 2019-08-21 2022-09-29 Sharp Kabushiki Kaisha Systems and methods for signaling buffering period information in video coding
US20220295104A1 (en) 2019-09-20 2022-09-15 Nokia Technologies Oy An apparatus, a method and a computer program for video coding and decoding
CN117528101A (zh) 2019-09-24 2024-02-06 华为技术有限公司 序列级hrd参数
KR20220063260A (ko) * 2019-09-24 2022-05-17 후아웨이 테크놀러지 컴퍼니 리미티드 시간적 스케일러빌러티를 위한 픽처 타이밍 및 디코딩 단위 정보
WO2021123166A1 (en) 2019-12-20 2021-06-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Video data stream, video encoder, apparatus and methods for a hypothetical reference decoder and for output layer sets
EP4085622A1 (en) * 2019-12-31 2022-11-09 Koninklijke KPN N.V. Partial output of a decoded picture buffer in video coding
WO2021193671A1 (ja) * 2020-03-25 2021-09-30 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化装置、復号装置、符号化方法、および復号方法
US11451789B2 (en) 2020-05-20 2022-09-20 Sharp Kabushiki Kaisha Systems and methods for signaling buffering period information in video coding
KR20230015382A (ko) 2020-05-22 2023-01-31 바이트댄스 아이엔씨 비디오 비트스트림 처리에서 픽처 유형들에 대한 제약들
WO2021257529A1 (en) * 2020-06-17 2021-12-23 Bytedance Inc. Decoded picture buffer management and subpictures in video coding
JPWO2021261536A1 (zh) * 2020-06-25 2021-12-30
EP4205399A4 (en) * 2020-09-25 2024-03-06 Beijing Bytedance Network Technology Co., Ltd. MINING OF SECONDARY BIT STREAMS
CA3197884A1 (en) 2020-12-23 2022-06-30 Qualcomm Incorporated Multiple hypothesis prediction for video coding
EP4268462A1 (en) * 2020-12-28 2023-11-01 Koninklijke KPN N.V. Prioritized decoding and output of parts of a picture in video coding
US11856233B2 (en) * 2021-02-18 2023-12-26 Sharp Kabushiki Kaisha Systems and methods for signaling buffer output information in video coding
US11695965B1 (en) * 2022-10-13 2023-07-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Video coding using a coded picture buffer

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140086331A1 (en) * 2012-09-24 2014-03-27 Qualcomm Incorporated Hypothetical reference decoder parameters in video coding
CN113785584A (zh) * 2019-03-01 2021-12-10 弗劳恩霍夫应用研究促进协会 假想参考解码器
US20210392353A1 (en) * 2019-03-01 2021-12-16 Fraunhoter-Gesellschan zur Férderung der angewandten Forschung e.V. Hypothetical reference decoder
CN114788290A (zh) * 2019-12-05 2022-07-22 夏普株式会社 用于在视频编码中发送信号通知画面定时和解码单元信息的系统和方法
WO2022144244A1 (en) * 2020-12-28 2022-07-07 Koninklijke Kpn N.V. Partial output of a decoded picture buffer in video coding

Also Published As

Publication number Publication date
AU2023204186B1 (en) 2023-12-14
US11849076B1 (en) 2023-12-19
CA3201168A1 (en) 2024-04-13
US20240129550A1 (en) 2024-04-18
CA3193126A1 (en) 2023-12-06
JP7361972B1 (ja) 2023-10-16
CN116847076B (zh) 2024-04-05
CA3201190A1 (en) 2024-04-13
MX2023006216A (es) 2024-01-29
CN116847071B (zh) 2024-04-02
US20240129551A1 (en) 2024-04-18
KR20240051792A (ko) 2024-04-22
AU2023204177B1 (en) 2023-12-14
CN116847075A (zh) 2023-10-03
JP7361974B1 (ja) 2023-10-16
MX2023006222A (es) 2024-01-29
JP2024058563A (ja) 2024-04-25
US11902593B1 (en) 2024-02-13
JP7361975B1 (ja) 2023-10-16
US11695965B1 (en) 2023-07-04
BR102023010473A2 (pt) 2023-10-03
US11962812B1 (en) 2024-04-16
AU2023204179B1 (en) 2023-12-14
MX2023003130A (es) 2024-01-29
JP2024058565A (ja) 2024-04-25
CN116847073B (zh) 2024-05-28
CN116847075B (zh) 2024-06-21
JP2024058564A (ja) 2024-04-25
US11849077B1 (en) 2023-12-19
JP2024058557A (ja) 2024-04-25
MX2023006220A (es) 2024-01-29
AU2023200478B1 (en) 2023-04-06
CL2023001546A1 (es) 2023-11-03
JP2024058561A (ja) 2024-04-25
CN116847071A (zh) 2023-10-03
US11962813B1 (en) 2024-04-16
JP2024058566A (ja) 2024-04-25
JP7361978B1 (ja) 2023-10-16
AU2023204184B1 (en) 2023-12-14
JP7508651B2 (ja) 2024-07-01
US12022131B2 (en) 2024-06-25
US11871041B1 (en) 2024-01-09
CA3201175A1 (en) 2024-04-13
MA60463A1 (fr) 2024-05-31
CN116847077A (zh) 2023-10-03
AU2023204180B1 (en) 2023-12-21
CA3201170A1 (en) 2024-04-13
CN116847074B (zh) 2024-04-02
TW202416716A (zh) 2024-04-16
JP2024058560A (ja) 2024-04-25
CN116847077B (zh) 2024-06-25
MX2023006214A (es) 2024-01-29
AU2024201748A1 (en) 2024-04-04
CA3201188A1 (en) 2024-04-13
MX2023006219A (es) 2024-01-29
JP7361977B1 (ja) 2023-10-16
MX2023006217A (es) 2024-01-29
CN116847073A (zh) 2023-10-03
JP2024058559A (ja) 2024-04-25
MX2023006215A (es) 2024-01-29
MX2023006218A (es) 2024-01-29
US20240129552A1 (en) 2024-04-18
JP2024058558A (ja) 2024-04-25
AU2023204182B1 (en) 2023-12-21
CN116634163A (zh) 2023-08-22
CN116847079A (zh) 2023-10-03
CN116847078B (zh) 2024-06-14
JP2024058562A (ja) 2024-04-25
CN116847079B (zh) 2024-04-05
CN116847072A (zh) 2023-10-03
AR128174A1 (es) 2024-04-10
US20240129549A1 (en) 2024-04-18
MX2023006221A (es) 2024-01-29
CN116847074A (zh) 2023-10-03
CA3201184A1 (en) 2024-04-13
CA3201792A1 (en) 2024-04-13
CN116847078A (zh) 2023-10-03
AU2023204178B1 (en) 2023-12-14
AU2023204185B1 (en) 2023-12-14
CA3201182A1 (en) 2024-04-13
JP7361973B1 (ja) 2023-10-16
AU2023200478C1 (en) 2023-10-05
JP7423844B1 (ja) 2024-01-29
JP7451805B1 (ja) 2024-03-18
AU2023204181B1 (en) 2023-12-21
CN116634163B (zh) 2024-04-02
US20240129548A1 (en) 2024-04-18
US11997320B2 (en) 2024-05-28
CN116847072B (zh) 2024-04-02
JP7361976B1 (ja) 2023-10-16
CA3201186A1 (en) 2024-04-13
WO2024079282A1 (en) 2024-04-18

Similar Documents

Publication Publication Date Title
CN116634163B (zh) 使用编码图片缓存器的视频编码

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant