CN105765977B - 用于多层视频的编解码方法、译码装置 - Google Patents

用于多层视频的编解码方法、译码装置 Download PDF

Info

Publication number
CN105765977B
CN105765977B CN201480063898.5A CN201480063898A CN105765977B CN 105765977 B CN105765977 B CN 105765977B CN 201480063898 A CN201480063898 A CN 201480063898A CN 105765977 B CN105765977 B CN 105765977B
Authority
CN
China
Prior art keywords
picture
poc
value
data
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201480063898.5A
Other languages
English (en)
Other versions
CN105765977A (zh
Inventor
弗努·亨利
王益魁
阿达许·克里许纳·瑞玛苏布雷蒙尼安
陈颖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of CN105765977A publication Critical patent/CN105765977A/zh
Application granted granted Critical
Publication of CN105765977B publication Critical patent/CN105765977B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/65Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using error resilience
    • H04N19/68Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using error resilience involving the insertion of resynchronisation markers into the bitstream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

在一实例中,一种对视频数据进行解码的方法包含对指示多层视频数据的第一层的第一图片的图片次序计数POC值的POC复位的数据进行解码,其中所述第一图片包含在存取单元中。所述实例方法还包含基于指示所述第一图片的所述POC值的所述POC复位的所述数据且在对所述第一图片进行解码之前,递减存储到经解码图片缓冲器DPB的按译码次序在所述第一图片之前的包含所述多层视频数据的第二层的至少一个图片的全部图片的POC值。

Description

用于多层视频的编解码方法、译码装置
本申请案主张2013年11月25日申请的第61/908,671号美国临时申请案和2013年11月26日申请的第61/909,347号美国临时申请案的权益,以上美国临时申请案以全文引用的方式并入本文中。
技术领域
本发明涉及视频译码。
背景技术
数字视频能力可以并入到多种多样的装置中,包含数字电视、数字直播系统、无线广播系统、个人数字助理(PDA)、膝上型或桌上型计算机、平板计算机、电子图书阅读器、数码相机、数字记录装置、数字媒体播放器、视频游戏装置、视频游戏控制台、蜂窝式或卫星无线电电话(所谓的“智能电话”)、视频电话会议装置、视频流式传输装置及其类似者。数字视频装置实施视频译码技术,例如由MPEG-2、MPEG-4、ITU-T H.263、 ITU-T H.264/MPEG-4第10部分高级视频译码(AVC)定义的标准、目前正在开发的高效率视频译码(HEVC)标准及此类标准的扩展中所描述的视频译码技术。视频装置可通过实施此些视频译码技术而更有效地发射、接收、编码、解码和/或存储数字视频信息。
视频译码技术包含空间(图片内)预测和/或时间(图片间)预测以减少或移除视频序列中固有的冗余。对于基于块的视频译码,视频切片(即,视频帧或视频帧的一部分)可分割成视频块,视频块还可被称作树块、译码单元(CU)和/或译码节点。使用关于同一图片中的相邻块中的参考样本的空间预测编码图片的经帧内译码(I)切片中的视频块。图片的经帧间编码(P或B)切片中的视频块可使用相对于同一图片中的相邻块中的参考样本的空间预测或相对于其它参考图片中的参考样本的时间预测。图片可被称作帧,且参考图片可被称作参考帧。
空间或时间预测导致待译码块的预测性块。残余数据表示待译码原始块与预测性块之间的像素差。经帧间译码块是根据指向形成预测块的参考样本块的运动向量和指示经译码块与预测块之间的差的残余数据编码的。根据帧内译码模式和残余数据来编码经帧内译码块。为了进一步压缩,可将残余数据从像素域变换到变换域,从而产生残余变换系数,可接着量化所述残余变换系数。可扫描一开始按二维阵列排列的经量化变换系数,以便产生变换系数的一维向量,且可应用熵译码以实现更多压缩。
发明内容
一般来说,本发明描述用于改善对与参考图片相关的视频数据进行译码的容错性的技术。确切地说,本发明描述可改善此类容错性的图片次序计数(POC)值设计。当译码单层视频数据或多层视频数据时,可使用这些技术。一般来说,这些技术包含递减POC 值以改善图片输出过程中的容错性。举例来说,视频解码器可经配置以在对其中执行 POC复位的存取单元的初始图片进行解码之前递减存储到经解码图片缓冲器(DPB)的 (全部层的)全部图片的POC值。以此方式,POC值可保持在DPB中对准,进而允许以恰当次序输出存取单元的图片。
在一个实例中,一种对视频数据进行解码的方法包含:对指示多层视频数据的第一层的第一图片的图片次序计数(POC)值的POC复位的数据进行解码,其中所述第一图片包含在存取单元中;以及基于指示所述第一图片的所述POC值的所述POC复位的所述数据且在对所述第一图片进行解码之前,递减存储到经解码图片缓冲器(DPB)的按译码次序在所述第一图片之前的包含所述多层视频数据的第二层的至少一个图片的全部图片的POC值。
在另一实例中,一种对视频数据进行编码的方法包含:对指示多层视频数据的第一层的第一图片的图片次序计数(POC)值的POC复位的数据进行编码,其中所述第一图片包含在存取单元中;以及基于指示所述第一图片的所述POC值的所述POC复位的所述数据且在对所述第一图片进行解码之前,递减存储到经解码图片缓冲器(DPB)的按译码次序在所述第一图片之前的包含所述多层视频数据的第二层的至少一个图片的全部图片的POC值。
在另一实例中,一种用于对视频数据进行译码的装置包含:存储器,其包括经配置以存储多层视频数据的经解码图片缓冲器(DPB)。所述装置还包含视频译码器,其经配置以:对指示所述多层视频数据的第一层的第一图片的图片次序计数(POC)值的POC复位的数据进行译码,其中所述第一图片包含在存取单元中;以及基于指示所述第一图片的所述POC值的所述POC复位的所述数据且在对所述第一图片进行解码之前,递减存储到所述DPB的按译码次序在所述第一图片之前的包含所述多层视频数据的第二层的至少一个图片的全部图片的POC值。
在另一实例中,一种用于对视频数据进行译码的装置包含:用于对指示多层视频数据的第一层的第一图片的图片次序计数(POC)值的POC复位的数据进行译码的装置,其中所述第一图片包含在存取单元中;以及用于基于指示所述第一图片的所述POC值的所述POC复位的所述数据且在对所述第一图片进行解码之前递减存储到DPB的按译码次序在所述第一图片之前的包含所述多层视频数据的第二层的至少一个图片的全部图片的POC值的装置。
在另一实例中,一种非暂时性计算机可读存储媒体具有存储于其上的指令,所述指令当执行时致使用于对视频数据进行译码的装置的处理器进行以下操作:对指示所述多层视频数据的第一层的第一图片的图片次序计数(POC)值的POC复位的数据进行译码,其中所述第一图片包含在存取单元中;以及基于指示所述第一图片的所述POC值的所述POC复位的所述数据且在对所述第一图片进行解码之前,递减存储到DPB的按译码次序在所述第一图片之前的包含所述多层视频数据的第二层的至少一个图片的全部图片的POC值。
附图及以下描述中陈述一或多个实例的细节。其它特征、目标和优点将从所述描述和图式以及权利要求书而显而易见。
附图说明
图1是说明根据本发明的技术的可利用用于译码POC值信息的技术的实例视频编码和解码系统的框图。
图2是说明根据本发明的技术的可实施用于译码POC值信息的技术的视频编码器的实例的框图。
图3是说明根据本发明的技术的可实施用于译码POC值信息的技术的视频解码器的实例的框图。
图4是说明根据本发明的技术的用于对包含复位POC值的数据进行编码的实例方法的流程图。
图5是说明根据本发明的技术的用于对包含复位POC值的数据进行解码的实例方法的流程图。
具体实施方式
一般来说,本发明描述用于视频译码的图片次序计数(POC)值设计,其可有益于多层视频译码。本发明描述对多层视频译码中的POC值的信令和导出的各种设计改进。然而,虽然所述技术一般是相对于多层视频译码而描述,但本发明的技术也可以应用于单层视频译码。
POC值可指示图片的显示次序且可一般用以识别图片。举例来说,具有0的POC 值的图片(即,具有等于0的POC值的图片)是在具有1的POC值的图片之前显示。在当前图片的块是相对于参考图片经帧间预测时,可使用参考图片的POC值识别参考图片。更明确地说,将包含于参考图片列表中的POC值参考图片可在参数集中用信号表示,例如在序列参数集(SPS)、图片参数集合(PPS)和/或对应于所述块的切片标头中。以此方式,视频编码器可通过用信号表示对应于参考图片列表中的参考图片的位置的指向参考图片列表中的索引来识别参考图片,且视频解码器可通过构建参考图片列表(基于 POC值)并使用参考索引来识别参考图片列表中的参考图片的位置,来识别参考图片。
POC值可包括最低有效位(LSB)和最高有效位(MSB)。并非在译码期间无限增加图片的POC值,图片的POC值可周期性地复位为等于零。通常对于瞬时解码器刷新(IDR) 图片复位POC值。另外,视频译码器可递减在与POC复位相关联的当前图片之前已经处理且存储到经解码图片缓冲器(DPB)的图片的POC值。已经递减的参考图片的POC 值可具有负值,以便维持此些图片的适当输出次序。
在多层视频译码(例如,多视图视频译码、可缩放视频译码或类似物)中,DPB可分割成“子DPB”,其中视频数据的每一层指派给DPB的单独管理的子DPB。视图分量可包括在特定时间(在显示次序或输出次序方面)用于特定层或视图的经编码图片。大体上,存取单元是包含用于共同时间实例的全部视图分量(例如,全部网络抽象层(NAL)单元) 的数据单元。因此,用于特定时间实例的存取单元可包含来自相应子DPB的相应视图分量。存取单元的视图分量通常既定一起输出(即,大体上同时输出),其中输出图片一般涉及从DPB传送图片(例如,将图片从DPB存储到外部存储器、将图片从DPB发送到显示器、从DPB移除图片,或类似操作)。
视频译码器可使用输出和提升过程来从DPB输出被标记为“需要用于输出”和“不用于参考”的图片。在一些情况下,对于每一图片可调用图片输出过程两次,包含(1) 在图片的解码之前但在剖析图片的第一切片的切片标头之后,以及(2)当从经译码图片缓冲器移除图片的最后解码单元时。当调用提升过程时,过程输出属于选定存取单元的全部图片。
现有的POC设计(例如,如下文提到)可能未经优化。举例来说,在一些情况下,递减POC值可为层特定过程。因此,当在层的图片的解码期间复位所述层的POC值或POC 最高有效位(MSB)时,用于层的子DPB中的较早图片(例如,在当前正译码的图片之前已经处理且存储到子DPB的图片)的POC值可能不与其它子DPB中的较早图片的POC 值跨层对准,如下文的实例中所描述。例如当存取单元的每一图片具有同一POC值时跨层对准发生,使得存取单元的图片同时或几乎同时输出。在现有POC设计中,较高层(例如,具有相对较大层识别符的层)中的图片的POC值可不更新,直到对基础层的图片进行解码之后。以此方式更新POC或POC MSB对于通过提升过程输出的图片可能产生问题,所述图片需要含有DPB中的经解码图片的每一存取单元的POC值的跨层对准。
在出于说明目的的实例中,假定多层序列具有三个层(例如,层A、B和C)。另外,假定特定存取单元包含对于其执行POC复位的图片。在此实例中,视频解码器可复位存取单元的层A图片的POC值(例如,在接收到位流中执行POC复位的指示后)。视频解码器还可递减先前存储到用于层A的子DPB的层A的图片以维持适当输出次序。然而,在解码层A的第一图片同时且在解码存取单元的层B图片之前,存储到用于层B 和C的相应子DPB的用于层B和C的图片的POC值变为与存储到层A的子DPB的图片的POC值未对准(不跨层对准)。即,因为存取单元的层B图片和层C图片尚未经复位,所以层B和C中的每一者的相应子层的POC值也尚未经递减。此未对准可致使图片以不当次序从DPB输出,因为存取单元的图片应在输出之前跨层对准。
本发明中所描述的POC值设计包含各个方面,其中的任一者或全部可单独或以任何组合实施。本发明的技术可克服上文所论述的问题。在一个实例中,视频译码器(例如,视频编码器和视频解码器)可经配置以在对其中执行POC复位的存取单元的初始图片进行解码之前递减存储到DPB的(全部层的)全部图片的POC值。举例来说,视频译码器可在需要POC复位的每一存取单元的开始处将POC递减过程应用于DPB中按译码顺序较早的图片(即,对于全部子DPB按解码次序在当前图片之前的全部图片)一次。换句话说,视频译码器可在需要POC复位的每一存取单元的开始处单次应用POC递减过程,以使得基于POC递减过程的单个调用而递减全部子DPB内按译码次序在当前图片之前的全部图片的POC值。可在针对存取单元接收的第一图片的解码之前但在所述图片的第一切片的切片标头信息的剖析和解码之后调用POC递减过程。以此方式,存储到DPB 的图片(即,用于全部子DPB)的POC值可在对存取单元的图片进行译码时保持对准,进而允许以恰当次序输出DPB的图片。
本发明的其它技术包含用于用信号表示POC值的技术。举例来说,某些POC设计的潜在问题是相对于额外POC最低有效位(LSB)信息的信令。在一些情况下,如下文更详细地描述,当基础层中的POC锚图片是IDR图片时不用信号表示POC锚图片的POC LSB。在此类情况下不用信号表示POC LSB可产生问题,因为基础层中的IDR图片不含用于导出用以递减DPB中的较早图片(例如,按译码顺序在当前正译码图片之前的图片)的POC值的值的信息。
根据本发明的方面,可更新用于用信号表示POC锚图片的POC LSB的条件。举例来说,根据本发明的方面,视频编码器可用信号表示(且视频解码器可解码)指示具有等于2的poc_reset_idc语法元素的基础层IDR图片的额外POC LSB的数据(如下文更详细描述)。
图1是说明根据本发明的技术的可利用用于管理POC值的技术的实例视频编码和解码系统10的框图。如图1中所展示,系统10包含源装置12,其提供待在稍后时间由目的地装置14解码的经编码视频数据。具体地说,源装置12经由计算机可读媒体16 将视频数据提供到目的地装置14。源装置12及目的地装置14可包括广泛范围的装置中的任一者,包含桌上型计算机、笔记型(即,膝上型)计算机、平板计算机、机顶盒、例如所谓的“智能”电话的电话手持机、所谓的“智能”板、电视、相机、显示装置、数字媒体播放器、视频游戏控制台、视频流式传输装置或类似者。在一些情况下,可装备源装置12和目的地装置14以用于无线通信。
目的地装置14可经由计算机可读媒体16接收待解码的经编码视频数据。计算机可读媒体16可包括能够将经编码的视频数据从源装置12移动到目的地装置14的任一类型的媒体或装置。在一个实例中,计算机可读媒体16可包括通信媒体以使源装置12能够实时地将经编码的视频数据直接传输到目的地装置14。可根据通信标准(例如,无线通信协议)调制经编码的视频数据,并将其发射到目的地装置14。通信媒体可包括任何无线或有线通信媒体,例如射频(RF)频谱或一或多个物理传输线。通信媒体可形成分组网络(例如,局域网、广域网或全球网络,例如因特网)的部分。通信媒体可包含路由器、交换器、基站或任何其它可用于促进从源装置12到目的地装置14的通信的设备。
在一些实例中,经编码数据可以从输出接口22输出到存储装置。类似地,经编码数据可由输入接口从存储装置存取。存储装置可包含多种分布式或本地存取的数据存储媒体中的任一者,例如硬盘驱动器、蓝光光盘、DVD、CD-ROM、快闪存储器、易失性或非易失性存储器或任何其它用于存储经编码的视频数据的合适的数字存储媒体。在另一实例中,存储装置可对应于可保持由源装置12产生的经编码视频的文件服务器或另一中间存储装置。目的地装置14可从存储装置经由流式传输或下载来存取所存储的视频数据。文件服务器可为能够存储经编码视频数据且将经编码视频数据发射到目的地装置14的任何类型的服务器。实例文件服务器包含网络服务器(例如,用于网站)、FTP服务器、网络附接存储(NAS)装置及本地磁盘驱动器。目的地装置14可以通过任何标准数据连接(包含因特网连接)来存取经编码视频数据。这可包含无线信道(例如,Wi-Fi连接)、有线连接(例如,DSL、电缆调制解调器等),或适合于存取存储在文件服务器上的经编码视频数据的两者的组合。经编码视频数据从存储装置的发射可能是流式传输发射、下载发射或其组合。
本发明的技术未必限于无线应用或设定。所述技术可以应用于视频译码以支持多种多媒体应用中的任一者,例如空中协议电视广播、有线电视发射、卫星电视发射、因特网流式视频发射(例如,经由HTTP的动态自适应流式传输(DASH))、经编码到数据存储媒体上的数字视频、存储在数据存储媒体上的数字视频的解码或其它应用。在一些实例中,系统10可经配置以支持单向或双向视频传输,以支持例如视频流式传输、视频重放、视频广播和/或视频电话等应用。
在图1的实例中,源装置12包含视频源18、视频编码器20及输出接口22。目的地装置14包含输入接口28、视频解码器30及显示装置32。根据本发明,源装置12的视频编码器20可经配置以应用根据本发明的技术的用于译码POC值信息的技术。在其它实例中,源装置和目的地装置可包括其它组件或布置。举例来说,源装置12可从外部视频源18(例如外部相机)接收视频数据。同样,目的地装置14可与外部显示装置介接,而非包含集成式显示装置。
图1的所说明的系统10仅是一个实例。根据本发明的技术的用于管理POC值的技术可由任何数字视频编码和/或解码装置执行。尽管本发明的技术一般通过视频编码装置来执行,但是所述技术还可通过视频编码器/解码器(通常被称作“编解码器”)来执行。此外,本发明的技术还可由视频预处理器执行。源装置12及目的地装置14仅为源装置 12产生经译码视讯数据用于发射至目的地装置14的所述译码装置的实例。在一些实例中,装置12、14可以实质上对称的方式操作,使得装置12、14中的每一者包含视讯编码及解码组件。因此,系统10可支持视频装置12、14之间的单向或双向视频传播以例如用于视频流式传输、视频回放、视频广播或视频电话。
源装置12的视频源18可以包含视频俘获装置,例如摄像机、含有先前所俘获视频的视频存档和/或用于从视频内容提供者接收视频的视频馈送接口。作为另一替代方案,视频源18可产生基于计算机图形的数据作为源视频,或直播视频、存档视频与计算机产生的视频的组合。在一些情况下,如果视频源18为摄像机,那么源装置12和目的地装置14可形成所谓的相机电话或视频电话。然而,如上文所提及,本发明中所描述的技术可大体上适用于视频译码,且可应用于无线和/或有线应用。在每一情况下,俘获、预先俘获或计算机产生的视频可由视频编码器20编码。经编码视频信息可接着由输出接口22输出到计算机可读媒体16上。
计算机可读媒体16可包含瞬时媒体,例如无线广播或有线网络发射,或存储媒体(也就是说,非暂时性存储媒体),例如硬盘、快闪驱动器、压缩光盘、数字视频光盘、蓝光光盘或其它计算机可读媒体。在一些实例中,网络服务器(未图示)可从源装置12接收经编码视频数据,且例如经由网络发射将经编码视频数据提供到目的地装置14。类似地,媒体生产设施(例如,光盘冲压设施)的计算装置可从源装置12接收经编码的视频数据且生产含有经编码的视频数据的光盘。因此,在各种实例中,计算机可读媒体16可以理解为包含各种形式的一或多个计算机可读媒体。
目的地装置14的输入接口28从计算机可读媒体16接收信息。计算机可读媒体16的信息可包含由视频编码器20定义的语法信息,所述语法信息也被视频解码器30使用,其包含描述块和其它经译码单元(例如GOP)的特性和/或处理的语法元素。显示装置32 将经解码视频数据显示给用户,且可包括多种显示装置中的任一者,例如阴极射线管 (CRT)、液晶显示器(LCD)、等离子显示器、有机发光二极管(OLED)显示器或另一类型的显示装置。
视频编码器20和视频解码器30各自可实施为多种合适的编码器电路中的任一者,例如一或多个微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、软件、硬件、固件或其任何组合。当部分以软件实施所述技术时,装置可将用于所述软件的指令存储于合适的非暂时性计算机可读媒体中并使用一或多个处理器以硬件执行所述指令以执行本发明的技术。视频编码器20和视频解码器30 中的每一者可包含在一或多个编码器或解码器中,所述编码器或解码器中的任一者可集成为相应装置中的组合编码器/解码器(CODEC)的部分。包含视频编码器20和/或视频解码器30的装置可包括集成电路、微处理器和/或无线通信装置(例如,蜂窝式电话)。
尽管图1中未图示,但在一些方面中,视频编码器20和视频解码器30可各自与音频编码器及解码器集成,且可包含适当多路复用器-多路分用器单元或其它硬件和软件以处置共同数据流或单独数据流中的音频和视频两者的编码。如果适用,则多路复用器- 多路分用器单元可符合ITU H.223多路复用器协议,或例如用户数据报协议(UDP)等其它协议。
本发明可能总体上参考视频编码器20向另一装置(例如视频解码器30)“用信号表示”某些信息。但是,应理解,视频编码器20可以通过使某些语法元素与视频数据的各种经编码部分相关联来用信号表示信息。也就是说,视频编码器20可以通过将某些语法元素存储到视频数据的各种经编码部分的标头来“用信号表示”数据。在一些情况下,可在由视频解码器30接收并解码之前编码并存储此些语法元素。因而,术语“用信号表示”可能总体上指代用于解码经压缩的视频数据的语法或其它数据的通信,不论所述通信是实时或准实时发生还是在一段时间中发生,例如可能在编码时将语法元素存储到媒体上的时候发生,接着可以在存储到这个媒体上之后的任何时间由解码装置检索。
视频编码器20和视频解码器30可根据视频译码标准操作。实例视频译码标准包含ITU-T H.261、ISO/IEC MPEG-1Visual、ITU-T H.262或ISO/IEC MPEG-2Visual、ITU-TH.263、ISO/IEC MPEG-4Visual及ITU-T H.264(也被称为ISO/IEC MPEG-4AVC),包含其可缩放视频译码(SVC)及多视图视频译码(MVC)扩展。近来,新的视频译码标准(即高效率视频译码(HEVC))的设计已由ITU-T视频译码专家组(VCEG)和ISO/IEC动画专家组 (MPEG)的视频译码联合合作小组(JCT-VC)定案。最新的HEVC草案说明书(且下文中被称作HEVC WD)可从http://phenix.int-evry.fr/jct/doc_end_user/documents/15_Geneva/ wg11/JCTVC-O1003-v1.zip获得。HEVC的多视图扩展(即MV-HEVC)也正由JCT-3V开发。下文中被称作MV-HEVC WD6的最新MV-HEVC工作草案(WD)可从 http://phenix.it-sudparis.eu/jct2/doc_end_user/documents/6_Geneva/wg11/JCT3V-F1004-v3.zip 获得。被称为SHVC的对HEVC的可缩放扩展也正由JCT-VC开发。HEVC的一个最近工作草案(WD)(下文中被称作SHVC WD4)可从http://phenix.int-evry.fr/jct/ doc_end_user/documents/15_Geneva/wg11/JCTVC-O1008-v1.zip获得。但是,本发明的技术不限于任何特定译码标准。视频译码标准的其它实例包含MPEG-2及ITU-T H.263。
HEVC标准化努力是基于被称作HEVC测试模型(HM)的视频译码装置的模型。HM 假定视频译码装置根据例如ITU-T H.264/AVC相对于现有装置的几项额外能力。举例来说,虽然H.264提供了九个帧内预测编码模式,但HM可提供多达三十三个帧内预测编码模式。
一般来说,HM的工作模型描述视频帧或图片可以分成包含明度及色度样本两者的一连串树块或最大译码单元(LCU)。位流内的语法数据可以界定最大译码单元(LCU,其是就像素数目来说的最大译码单元)的大小。切片包含按译码次序的若干连续树块。视频帧或图片可以被分割成一或多个切片。每一树块可以根据四叉树分裂成译码单元(CU)。一般来说,四叉树数据结构包含每个CU一个节点,其中一个根节点对应于所述树块。如果一个CU分裂成四个子CU,那么对应于CU的节点包含四个叶节点,其中的每一者对应于所述子CU中的一者。
四叉树数据结构的每一节点可提供用于对应CU的语法数据。举例来说,四叉树中的节点可包含分裂旗标,其表明对应于所述节点的所述CU是否分裂成子CU。用于CU 的语法元素可以递归地来定义,且可以取决于CU是否分裂成数个子CU。如果CU不进一步分裂,那么将其称为叶CU。在本发明中,叶CU的四个子CU也将被称作叶CU,即使不存在原始叶CU的明确分裂时也是如此。举例来说,如果16x16大小的CU不进一步分裂,那么这四个8x8子CU将也被称作叶CU,虽然16x16CU从未分裂。
CU具有与H.264标准的宏块类似的目的,除了CU不具有大小区别。举例来说,树块可分裂成四个子节点(也称为子CU),且每一子节点又可为父节点且可分裂成另外四个子节点。最终的未经分裂子节点(被称作四叉树的叶节点)包括译码节点,还被称作叶 CU。与经译码位流相关联的语法数据可定义树块可分裂的最大次数,被称作最大CU深度,且还可定义译码节点的最小大小。因此,位流还可界定最小译码单元(SCU)。本发明使用术语“块”来指HEVC的上下文中的CU、PU或TU中的任一者,或者其它标准的上下文中的类似数据结构(例如,其在H.264/AVC中的宏块及子块)。
CU包含译码节点和与所述译码节点相关联的预测单元(PU)和变换单元(TU)。CU的大小对应于译码节点的大小并且形状必须是正方形。CU的大小可介于8x8个像素至多达具有最大64x64个像素或更大的树块大小的范围内。每一CU可以含有一或多个PU 和一或多个TU。举例来说,与CU相关联的语法数据可描述CU分割成一或多个PU。分割模式可在CU被跳过或经直接模式编码、经帧内预测模式编码或经帧间预测模式编码之间有所不同。PU可以分割成非正方形形状。举例来说,与CU相关联的语法数据还可描述CU根据四叉树到一或多个TU的分割。TU可为正方形或非正方形(例如,矩形) 形状。
HEVC标准允许根据TU变换,TU可针对不同CU而有所不同。TU的大小通常是基于针对经分割LCU定义的给定CU内的PU的大小而确定,但是情况可能并不总是如此。TU通常与PU大小相同或小于PU。在一些实例中,对应于CU的残余样本可以使用被称为“残余四叉树”(RQT)的四叉树结构细分成较小单元。RQT的叶节点可被称为变换单元(TU)。可以变换与TU相关联的像素差值以产生变换系数,所述变换系数可经量化。
叶CU可包含一或多个预测单元(PU)。一般来说,PU表示对应于相对应的CU的全部或一部分的空间区域,并且可包含用于检索PU的参考样本的数据。此外,PU包含与预测有关的数据。举例来说,当PU经帧内模式编码时,用于PU的数据可以包含在残余四叉树(RQT)中,残余四叉树可以包含描述用于对应于PU的TU的帧内预测模式的数据。作为另一实例,当PU经帧间模式编码时,PU可以包含定义PU的一或多个运动向量的数据。举例来说,定义PU的运动向量的数据可以描述运动向量的水平分量、运动向量的垂直分量、运动向量的分辨率(例如,四分之一像素精度或八分之一像素精度)、运动向量指向的参考图片及/或运动向量的参考图片列表(例如,列表0、列表1或列表 C)。
经帧间预测PU(更明确地说PU对应于的CU的经帧间预测部分)的运动信息可包含参考图片列表识别符和对应于参考图片在参考图片列表中的位置的参考索引。视频编码器20(例如)可构建参考图片列表(包含对原先构建的参考图片列表作出的任何修改),且在参考图片列表中的参考图片当中执行运动搜索,以识别接近匹配的块(例如基于绝对差总和(SAD)度量,或相似度量),还被称作参考块。为了用信号表示参考块的位置,视频编码器20可编码所述PU的参考图片列表识别符和参考索引。此外,视频编码器20可例如通过在切片标头中和/或在例如PPS或SPS等参数集中用信号表示代表用于参考图片的POC值的数据,来表示将包含在参考图片列表中的参考图片的数据进行编码。
具有一或多个PU的叶CU还可包含一或多个变换单元(TU)。变换单元可使用 RQT(也称为TU四叉树结构)来指定,如上文所论述。举例来说,分裂旗标可以指示叶 CU是否分裂成四个变换单元。接着,每一变换单元可进一步分裂成更多个子TU。当 TU未进一步分裂时,其可被称作叶TU。总体上,对于帧内译码,所有属于一叶CU的叶TU共享相同的帧内预测模式。也就是说,一般应用相同的帧内预测模式来计算叶CU 的所有TU的预测值。对于帧内译码,视频编码器可使用帧内预测模式将每一叶TU的残余值计算为CU的对应于TU的部分与原始块之间的差。TU不一定限于PU的大小。因此,TU可大于或小于PU。对于帧内译码,PU可以与相同CU的对应叶TU并置。在一些实例中,叶TU的最大大小可以对应于对应的叶CU的大小。
此外,叶CU的TU还可与相应的四叉树数据结构(被称作残余四叉树(RQT))相关联。即,叶CU可包含指示叶CU如何分割成TU的四叉树。TU四叉树的根节点一般对应于叶CU,而CU四叉树的根节点一般对应于树块(或LCU)。未经分裂的RQT的TU被称作叶TU。一般来说,除非以其它方式提及,否则本发明分别使用术语CU及TU来指叶 CU及叶TU。
视频序列通常包含一系列视频帧或图片。图片群组(GOP)一般包括一系列一或多个视频图片。GOP可包含GOP的标头、图片中的一或多者的标头或其它地方中的语法数据,其描述GOP中包含的图片的数目。图片的每一切片可包含描述用于相应的切片的编码模式的切片语法数据。视频编码器20通常对个别视频切片内的视频块进行操作以便对视频数据进行编码。视频块可与CU内的译码节点相对应。视频块可具有固定或变化的大小,并且根据指定译码标准可在大小上有所不同。
作为实例,HM支持各种PU大小的预测。假设特定CU的大小为2N×2N,那么HM 支持2N×2N或N×N的PU大小的帧内预测,及2N×2N、2N×N、N×2N或N×N的对称 PU大小的帧间预测。HM还支持用于在2N×nU、2N×nD、nL×2N及nR×2N的PU大小下的帧间预测的不对称分割。在不对称分割中,不分割CU的一个方向,但是将另一方向分割成25%和75%。CU的对应于25%分割区的部分由“n”后面接着“上方”、“下方”、“左侧”或“右侧”的指示来指示。因此,例如,“2NxnU”是指经水平分割的2Nx2N CU,其中顶部为2Nx0.5N PU,而底部为2Nx1.5N PU。
在本发明中,“NxN”与“N乘N”可互换地使用以指就垂直维度和水平维度来说的视频块的像素尺寸,例如,16x16像素或16乘16像素。大体来说,16x16块将在垂直方向上具有16个像素(y=16),且在水平方向上具有16个像素(x=16)。同样,NxN块总体上在垂直方向上具有N个像素,并且在水平方向上具有N个像素,其中N表示非负整数值。块中的像素可布置成行和列。此外,块未必需要在水平方向上与在竖直方向上具有相同数目个像素。举例来说,块可包括NxM个像素,其中M未必等于N。
在使用CU的PU进行帧内预测性或帧间预测性译码之后,视频编码器20可以计算用于CU的TU的残余数据。PU可包括描述在空间域(也被称作像素域)中产生预测性像素数据的方法或模式的语法数据,并且TU可包括在对残余视频数据应用了变换(例如,离散余弦变换(DCT)、整数变换、小波变换或概念上类似的变换)的变换域中的系数。残余数据可对应于未经编码图片的像素与对应于PU的预测值之间的像素差。视频编码器 20可以形成包含用于CU的残余数据的TU,并且接着变换TU以产生用于CU的变换系数。
在产生变换系数的任何变换之后,视频编码器20可执行变换系数的量化。量化大体上指代对变换系数进行量化以可能减少用以表示系数的数据的量从而提供进一步压缩的过程。量化过程可以减少与系数中的一些或全部相关联的位深度。例如,n位值可在量化期间被下舍入到m位值,其中n大于m。
在量化之后,视频编码器可扫描变换系数,从包含经量化变换系数的二维矩阵产生一维向量。扫描可以经设计以将较高能量(并且因此较低频率)的系数放置在阵列的前面,并且将较低能量(并且因此较高频率)的系数放置在阵列的背面。在一些实例中,视频编码器20可利用预定义扫描次序来扫描经量化的变换系数以产生可被熵编码的串行化向量。在其它实例中,视频编码器20可以执行自适应扫描。在扫描经量化的变换系数以形成一维向量之后,视频编码器20可以例如根据上下文自适应可变长度译码(CAVLC)、上下文自适应二进制算术译码(CABAC)、基于语法的上下文自适应二进制算术译码 (SBAC)、概率区间分割熵(PIPE)译码或另一熵编码方法编码一维向量。视频编码器还20 也可熵编码与经编码视频数据相关联的语法元素以供视频解码器30在解码视频数据时使用。
为了执行CABAC,视频编码器20可向待发射的符号指派上下文模型内的上下文。上下文可涉及(例如)符号的相邻值是否为非零。为了执行CAVLC,视频编码器20可选择用于待发射的符号的可变长度码。VLC中的码字可经构造使得相对较短码对应于更有可能符号,而较长码对应于不太可能符号。以此方式,使用VLC可例如实现优于针对待发射的每一符号使用等长度码字的位节省。概率确定可基于指派到符号的上下文。
视频编码器20可进一步例如在帧标头、块标头、切片标头或GOP标头中将例如基于块的语法数据、基于帧的语法数据的基于GOP的语法数据的语法数据发送到视频解码器30。GOP语法数据可描述相应GOP中的数个帧,及帧语法数据可指示用以对对应帧进行编码的编码/预测模式。
经译码视频片段可经组织为NAL单元,其提供“网络友好的”视频表示从而解决例如视频电话、存储、广播或流式传输等应用。NAL单元可分类为视频译码层(VCL)NAL 单元和非VCL NAL单元。VCL单元可含有来自核心压缩引擎的输出且可包含块、宏块和/或切片层级数据。其它NAL单元可以为非VCL的NAL单元。在一些实例中,一个时间例子中的经译码图片(通常呈现为初级经译码图片)可包含在存取单元中,所述存取单元可包含一或多个NAL单元。
如上所述,视频编码器20和视频解码器30可一般经配置以根据视频译码标准或对视频译码标准的扩展(例如MV-HEVC或SHVC)操作。因此,出于实例的目的,下文相对于MV-HEVC描述本发明的技术,但应理解这些技术可应用于其它视频译码标准或扩展,例如SHVC。
在HEVC中,存在可通过NAL单元类型识别的许多不同图片类型。一个图片类型是随机存取图片类型,其可一般包含IDR图片、清洁随机存取(CRA)图片、时间层存取 (TLA)图片、断链存取(BLA)图片、STSA(逐步时间子层存取)图片、前导图片(即,下文所述的RASL和RADL图片)或若干其它不同图片类型。
视频编码器20和视频解码器30可为视频序列的每一图片指派用于所述图片的识别的POC值。视频编码器20可例如通过在切片标头中和/或在例如PPS或SPS等参数集中用信号表示代表用于参考图片的POC值的数据,来编码(且视频解码器30可解码)表示将包含在参考图片列表中的参考图片的数据。特定经译码图片的由语法元素 PicOrderCntVal表示的POC值表示所述图片相对于同一经译码视频序列中的其它图片在图片输出过程中的相对次序。
POC值包含最低有效位(LSB)和最高有效位(MSB)。通过将MSB与LSB串接或相加可以获得POC。可在切片标头中用信号表示LSB,且视频解码器30可基于当前图片的NAL单元类型以及按解码次序的先前图片的MSB和LSB计算MSB,所述先前图片不是NAL单元类型随机存取跳过前导(RASL)或随机存取可解码前导(RADL)或不是子层非参考图片且具有等于0的temporal_id值。具有等于0的TemporalId和等于当前图片的 nuh_layer_id的nuh_layer_id且不是RASL图片、RADL图片或子层非参考图片的此些图片称为POC锚图片。
在当前图片是具有等于1的NoRaslOutputFlag的帧内随机存取点(IRAP)图片或作为位流的第一图片的CRA图片时,POC MSB的值推断(即,由译码器确定)为等于0。在多层位流(例如,具有一个以上层的SHVC或MV-HEVC位流)中,可存在其中一或多个图片是IRAP图片且一或多个图片是非IRAP图片的存取单元。此些AU可被称为未经对准IRAP AU。当对含有未经对准IRAP AU的位流进行解码时,可能基于用信号表示的POC LSB值针对图片导出的POC将违反存取单元中的全部图片(例如,每一层的图片) 应具有PicOrderCntVal的相同值的位流要求。
因此,在一些情况下,可针对特定存取单元复位POC值以便维持存取单元中的图片的POC对准。在MV-HEVC WD5中,可使用旗标poc_reset_flag来使图片的POC复位,使得即使在位流中存在未经对准IRAP AU时,也将调整当前图片以及DPB中的图片的PicOrderCntVal的值,使得AU中的所有图片的POC相同。
陈等人在2014年4月4日申请的“可包含非对准IRAP图片的多层位流的跨层POC 对准(CROSS-LAYER POC ALIGNMENT FOR MULTI-LAYER BITSTREAMS THAT MAY INCLUDE NON-ALIGNED IRAP PICTURES)”第14/245,115号美国专利申请案描述实现 POC复位的另一方法,其使用两个旗标:poc_msb_reset_flag和poc_lsb_reset_flag。前者旗标使PicOrderCntVal的MSB复位,且后者旗标使PicOrderCntVal的LSB复位。这两个旗标都在切片标头中用信号表示。
2013年10月14日申请的第61/890,868号美国临时申请案提出含有当包含POC MSB或POC复位指示的图片丢失时用于恢复正确POC值的信息的SEI消息。
汉努克塞拉等人的“MV-HEVC/SHVC HLS:关于POC值导出(MV-HEVC/SHVC HLS:onPOC value derivation)”(ITU-T SG 16WP 3和ISO/IEC JTC 1/SC 29/WG 11的视频译码联合合作小组(JCT-VC)第15次会议:瑞士日内瓦,2013年10月23日-11月1 日,JCTVC-O0275v3(在http://phenix.int-evry.fr/jct/doc_end_user/documents/15_Geneva/ wg11/JCTVC-O0275-v3.zip可用))以及斯桥伯格等人的“HLS:错误稳健的POC对准(HLS: Errorrobust POC alignment)”(ITU-T SG 16WP 3和ISO/IEC JTC 1/SC 29/WG 11的视频译码联合合作小组(JCT-VC)第15次会议:瑞士日内瓦,2013年10月23日-11月1日, JCTVC-O0176-v3(在http://phenix.int-evry.fr/jct/doc_end_user/documents/15_Geneva/wg11/JCTVC-O0176-v3.zip可用))提出了在多层视频译码中用于用信号表示和导出POC值的其它方法。
2014年11月17日申请的第14/543,470号美国申请案提出用两位POC复位指示符代替所述两个旗标(即,poc_msb_reset_flag和poc_lsb_reset_flag),且引入POC复位周期的概念,其中每一POC复位周期由POC复位周期识别符识别,所述识别符对于两个连续POC复位周期来说需要为不同的。通过此些概念,改善了POC复位机制的错误回弹性,使得解码器有可能在其中执行POC复位的存取单元中的一或多个图片的损失的情况下保持POC的跨层对准。
一般来说,可例如在MV-HEVC的子条款F.3中如下界定POC复位周期:
F.3.1图片次序计数(POC)复位周期:层内按解码次序的全部具有大于0的 poc_reset_idc和相同poc_reset_period_id值的图片的序列。
或者,以上定义中的短语“在层内”可省略,例如如下:
F.3.2图片次序计数(POC)复位周期:按解码次序的全部具有大于0的poc_reset_idc 和相同的poc_reset_period_id值的图片的序列。
因此,POC复位周期是层特定的。在一个实例中,MV-HEVC(或另一适用标准或标准扩展)可要求POC复位周期中的图片在层内按解码次序连续。然而,允许这些图片与同一层中具有等于0的poc_reset_idc的图片交错可增加灵活性,且允许使用相同开销来实现对群集包丢失的较好容错性。
视频编码器20可将切片指派到相应POC复位周期。每一POC复位周期可包含一或多个切片。因此,当POC值针对POC复位周期而复位(包含使在译码次序中在POC复位周期之前的参考图片的POC值复位)时,视频编码器20可基于复位的POC值来用信号表示将包含于参考图片列表中的参考图片的POC值。
视频编码器20和视频解码器30可使用POC值执行存储到DPB的图片的图片输出和提升。图片输出和提升过程是从DPB输出被标记为“需要用于输出”和“不用于参考”的图片的过程。在采用拉玛苏布拉莫尼安等人的“MV-HEVC/SHVC HLS:基于子DPB的DPB操作(MV-HEVC/SHVC HLS:Sub-DPB based DPB operations)”(ITU-T SG 16 WP 3和ISO/IEC JTC 1/SC 29/WG 11的视频译码联合合作小组(JCT-VC)第15次会议:瑞士日内瓦,2013年10月23日-11月1日,JCTVC-O0217(可在http://phenix.int-evry.fr/jct/ doc_end_user/documents/15_Geneva/wg11/JCTVC-O0217-v1.zip处获得))之后,用于HEVC 扩展的输出和提升DPB的图片的概念已经更新为并入以下内容:
●为所谓的子DPB的每一层指定单独DPB容量
●不存在跨层的子DPB容量的共享
●每一层具有其自身的参数(最大图片、最大等待时间、最大重排序)
●用于每一“输出层集合”的相异参数
●改变对输出层集合而不是“层集合”特定的操作点的定义
在改变之后,图片输出和提升过程如下工作:为了解码器一致性,对于每一图片调用图片输出过程两次,包含(1)在图片的解码之前但在剖析所述图片的第一切片的切片标头之后,以及(2)当从经译码图片缓冲器移除图片的最后解码单元时。当调用提升过程时,过程输出属于选定存取单元的全部图片。
在对MV-HEVC WD6包含JCTVC-O0217中的添加以及拉玛苏布拉莫尼安等人的“MV-HEVC/SHVC HLS:关于基于NoOutputOfPriorPicsFlag从DPB清空经解码图片 (MV-HEVC/SHVC HLS:On flushing of decoded pictures from DPB based onNoOutputOfPriorPicsFlag)”(ITU-T SG 16WP 3和ISO/IEC JTC 1/SC 29/WG 11的视频译码联合合作小组(JCT-VC)第15次会议:瑞士日内瓦,2013年10月23日-11月1日, O0266(可在http://phenix.int-evry.fr/jct/doc_end_user/documents/15_Geneva/wg11/JCTVC-O0266-v1.zip处获得))之后,包含图片输出和提升的用于DPB的输出次序的实例操作如下:
C.5.2输出次序DPB的操作
C.5.2.1综述
经解码图片缓冲器由子DPB组成,且每一子DPB含有用于存储仅一个层的经解码图片的图片存储缓冲器。子DPB的图片存储缓冲器中的每一者含有标记为“用于参考”或保存为用于未来输出的经解码图片。
下文指定用于图片从DPB的输出和移除的过程、用于图片解码、标记、额外提升和存储的过程以及“提升”过程。按位流中的层的nuh_layer_id值的递增次序从基础层开始,这些过程独立地应用于每一层。当这些过程应用于特定层时,仅所述特定层的子 DPB受影响,但“提升”过程除外,所述过程可裁剪和输出图片,将图片标记为“不需要用于输出”且清空用于任何层的图片存储缓冲器。
假设图片n和当前图片为针对nuh_layer_id的特定值的存取单元n的经译码图片或经解码图片,其中n是非负整数。
当这些过程应用于具有等于currLayerId的nuh_layer_id的层时,如下导出变量MaxNumReorderPics、MaxLatencyIncreasePlus1、MaxLatencyPictures和MaxDecPicBufferingMinus1:
-如果通过应用条款2-10、附录F和附录G或H中指定的解码过程对符合附录G 或H中指定的简档中的一或多者的CVS进行解码,那么以下适用:
-MaxNumReorderPics设定成等于有效VPS的 max_vps_num_reorder_pics[TargetOptLayerSetIdx][HighestTid]。
-MaxLatencyIncreasePlus1设定成等于有效VPS的语法元素 max_vps_latency_increase_plus1[TargetOptLayerSetIdx][HighestTid]的值。
-MaxLatencyPictures设定成等于有效VPS的 VpsMaxLatencyPictures[TargetOptLayerSetIdx][HighestTid]。
-MaxDecPicBufferingMinus1设定成等于有效VPS的语法元素 max_vps_dec_pic_buffering_minus1[TargetOptLayerSetIdx][currLayerId][HighestTid ]的值。
-否则(通过应用条款2-10中指定的解码过程对符合附录A中指定的简档中的一或多者的CVS进行解码),那么以下适用:
-MaxNumReorderPics设定成等于用于基础层的有效SPS的 sps_max_num_reorder_pics[HighestTid]。
-MaxLatencyIncreasePlus1设定成等于用于基础层的有效SPS的 sps_max_latency_increase_plus1[HighestTid]。
-MaxLatencyPictures设定成等于用于基础层的有效SPS的SpsMaxLatencyPictures[HighestTid]。
-MaxDecPicBufferingMinus1设定成等于用于基础层的有效SPS的 sps_max_dec_pic_buffering_minus1[HighestTid]。
C.5.2.2图片从DPB的输出和移除
在当前图片不是当前层中的图片0(即,当前图片不具有0的POC值)时,来自DPB 的当前层中在当前图片(即图片n)的解码之前但在剖析当前图片的第一切片的切片标头之后的图片的输出和移除在当前图片的第一解码单元从CPB移除时瞬时发生且如下进行:
-调用如子条款8.3.2中指定的用于RPS的解码过程。
-如果当前图片是具有等于1的NoRaslOutputFlag的IRAP图片,或当前存取单元中的基础层图片是具有等于1的NoRaslOutputFlag和等于1的NoClrasOutputFlag的IRAP 图片,那么应用以下有序步骤:
1.如下针对受测试的解码器导出变量NoOutputOfPriorPicsFlag:
-如果当前图片是具有等于1的NoRaslOutputFlag的CRA图片,那么将NoOutputOfPriorPicsFlag设定成等于1(无论no_output_of_prior_pics_flag的值如何)。
-否则,如果当前图片是具有等于1的NoRaslOutputFlag的IRAP图片,且当解码当前层中的先前图片时,针对当前层从作用中SPS导出的 pic_width_in_luma_samples、pic_height_in_luma_samples或sps_max_dec_pic_ buffering_minus1[HighestTid]的值不同于分别从对于当前层曾在作用中的SPS 导出的pic_width_in_luma_samples、pic_height_in_luma_samples或 sps_max_dec_pic_buffering_minus1[HighestTid]的值,那么NoOutputOfPriorPicsFlag可(但不应)由测试中的解码器设定为1,无论 no_output_of_prior_pics_flag的值如何。
注意-虽然将NoOutputOfPriorPicsFlag设定为等于 no_output_of_prior_pics_flag在这些条件下是优选的,但在此情况下允许受测试的解码器将NoOutputOfPriorPicsFlag设定为1。
-否则,如果当前图片是具有等于1的NoRaslOutputFlag的IRAP图像,那么设定NoOutputOfPriorPicsFlag等于no_output_of_prior_pics_flag。
-否则(当前图片并非具有等于1的NoRaslOutputFlag的IRAP图片,当前存取单元中的基础层图片为具有等于1的NoRaslOutputFlag的IRAP图片,且 NoClrasOutputFlag等于1),设定NoOutputOfPriorPicsFlag等于1。
2.如下针对HRD应用针对受测试的解码器导出的NoOutputOfPriorPicsFlag的值:
-如果NoOutputOfPriorPicsFlag等于1,那么清空子DPB中的全部图片存储缓冲器而无需输出它们含有的图片,且将子DPB充满度设定成等于0。
-否则(NoOutputOfPriorPicsFlag等于0),清空含有经标记为“不需要用于输出”及“不用于参考”的图片的所有图片存储缓冲器(无输出),且通过重复调用在子条款C.5.2.4中指定的“提升”过程来清空子DPB中的所有非空图片存储
缓冲器,且设定子DPB充满度等于0。
-否则,清空含有当前层中的图片且被标记为“不需要用于输出”和“不用于参考”的全部图片存储缓冲器(无图片输出)。对于清空的每一图片存储缓冲器,将子DPB充满度递减一。当以下条件中的一或多者为真时,重复调用在子条款C.5.2.4中指定的“提升”过程,同时针对经清空的每一额外图片存储缓冲器,将子DPB充满度进一步递减一,直到以下条件中无一者为真:
-含有DPB中(即子DPB中的任一者)标记为“需要用于输出”的至少一个经解码图片的存取单元的数目大于MaxNumReorderPics。
-MaxLatencyIncreasePlus1不等于0且存在含有在DPB中经标记为“需要用于输出”的至少一个经解码图片的至少一个存取单元,所述经解码图片的相关联变量PicLatencyCount大于或等于MaxLatencyPictures。
-当前层的子DPB中的当前层中的图片的数目大于或等于MaxDecPicBufferingMinus1+1。
C.5.2.3图片解码、标记、额外提升和存储
在此子条款中指定的过程在从CPB移除图片n的最后解码单元时瞬时地发生。
如下更新PicOutputFlag:
-如果当前存取单元不含有在目标输出层处的图片且alt_output_layer_flag等于1,那么以下有序步骤适用:
-列表nonOutputLayerPictures是存取单元的具有等于1的PicOutputFlag且具有包含在TargetDecLayerIdList中的nuh_layer_id值且不在目标输出层上的图片的列表。
-从列表nonOutputLayerPictures移除列表nonOutputLayerPictures当中具有最高nuh_layer_id值的图片。
-将包含在列表nonOutputLayerPictures中的每一图片的PicOutputFlag设定为等于0。
-否则,将不包含在目标输出层中的图片的PicOutputFlag设定为等于0。
在当前图片具有等于1的PicOutputFlag时,对于子DPB中的当前层中经标记为“需要用于输出”且按输出次序在当前图片后的每一图片,将相关联变量PicLatencyCount 设定为等于PicLatencyCount+1。
将当前图片视为在解码图片的最后解码单元之后经解码。将当前经解码图片存储于子DPB中的空图片存储缓冲器中,且以下内容适用:
-如果当前经解码图片具有等于1的PicOutputFlag,那么将其标记为“需要用于输出”且将其相关联变量PicLatencyCount设定为等于0。
-否则(当前经解码图片具有等于0的PicOutputFlag),将其标记为“不需要用于输出”。
将当前经解码图片标记为“用于短期参考”。
当以下条件中的一或多者为真时,重复调用在子条款C.5.2.4中指定的“提升”过程,直到以下条件中无一者为真:
-含有DPB中(即子DPB中的任一者)标记为“需要用于输出”的至少一个经解码图片的数目大于MaxNumReorderPics。
-MaxLatencyIncreasePlus1不等于0且存在含有在DPB中经标记为“需要用于输出”的至少一个经解码图片的至少一个存取单元,所述经解码图片的相关联变量PicLatencyCount大于或等于MaxLatencyPictures。
C.5.2.4“提升”过程
“提升”过程由以下有序步骤组成:
1.将首先用于输出的一或多个图片选择为在DPB中经标记为“需要用于输出”的所有图片中具有PicOrderCntVal的最小值的图片。
2.这些图片中的每一者使用在用于图片的作用中SPS中指定的一致性裁剪窗按nuh_layer_id升序裁剪,输出经裁剪图片,且将所述图片标记为“不需要用于输出”。
3.将含有经标记为“不用于参考”且是经裁减和输出的图片中的一者的图片的每一图片存储缓冲器清空。
根据本发明的技术,视频编码器20和视频解码器30可分别经配置以在对其中执行POC复位的存取单元的初始图片进行解码之前递减存储到DPB的全部图片(例如,全部层的图片)的POC值。举例来说,视频编码器20和视频解码器30可将POC递减应用于在正译码图片先前已经处理且存储到DPB的图片(例如,按译码顺序在当前正译码图片之前的图片,其可一般被称作比当前图片“更早的图片”)。根据本发明的方面,视频编码器20和视频解码器30可在需要POC复位的每一存取单元的开始处将POC递减应用于DPB(即,对于全部子DPB)中的此些较早图片一次。可在对存取单元的初始图片进行译码(例如,编码或解码)之前但在对初始图片的第一切片的切片标头信息进行译码之后 (即,随后)调用POC递减过程。以此方式,存储到视频编码器20和视频解码器30的 DPB的图片的POC值可当对存取单元的图片进行译码时保持对准,从而允许按恰当次序输出DPB的图片且因此确保可正确地显示图片。举例来说,通过维持存储到DPB的图片的跨层对准(例如,使得每一相应存取单元的图片具有相同POC值),视频解码器30 可在输出另一存取单元的图片之前从一个存取单元输出全部图片。这可允许大体上同时显示存取单元的图片以提供适当观看体验。
在另一实例中,根据本发明的方面,可更改POC递减的定时。举例来说,视频解码器30可在对存取单元中的每一图片进行解码之前但在所述图片的第一切片的切片标头信息的剖析和解码之后针对在每一子DPB中正经解码的图片之前已经处理(例如,经解码)且存储到DPB的图片调用POC递减过程。视频解码器30还可在对存在于存取单元中的图片进行解码之后执行具有针对所述存取单元不存在或未接收的图片的层的子 DPB中的较早图片的额外POC递减过程。
在再一实例中,根据本发明的方面,视频解码器30可在存取单元中的每一图片的解码之前但在相应图片的第一切片的切片标头信息的剖析和解码之后针对每一子DPB 中的较早图片调用POC递减过程。在执行子DPB中的较早图片的POC递减过程之前,如果针对一或多个较低层子DPB尚未执行同一过程,那么针对那些子DPB执行过程。
在再一实例中,根据本发明的方面,视频解码器30可在需要POC复位的每一存取单元的解码结束时执行DPB中(即,对于全部子DPB)的较早图片的POC递减过程应用一次。即,视频解码器30可对执行POC复位的存取单元的全部图片进行解码,接着递减DPB的全部图片的POC值。
根据本发明的方面,视频编码器20和视频解码器可分别根据由例如MV-HEVC等适用的视频译码标准建立的限制(例如,如由译码器确定且认为适用于给定位流的位流约束)来配置。举例来说,根据本发明的方面,用于递减DPB中(例如,全部子DPB)的较早图片的导出值对于其中执行POC或POC MSB复位的存取单元中的全部图片应为相同的。
如上所述,可基于切片片段标头中用信号表示的POC复位周期识别符而指定层特定的POC复位周期。就是说,视频编码器20和视频解码器30可分别译码表示切片片段标头中的POC复位周期识别符的数据。属于包含至少一个IRAP图片的存取单元的每一非IRAP图片可为含有非IRAP图片的层中的POC复位周期的开始。就是说,视频编码器20可将含有至少一个IRAP图片的存取单元的非IRAP图片的POC复位类型设定为指示所述非IRAP图片是新POC复位周期的开始。在此存取单元中,每一图片将为含有所述图片的层中的POC复位周期的开始。POC复位(仅POC MSB或POC MSB和POC LSB两者)以及DPB中的同一层图片的POC值的更新可仅对每一POC复位周期内的第一图片适用。
视频编码器20可在视频解码器30可用来导出包含具有切片片段标头的切片的层中的图片的POC值的切片片段标头中用信号表示POC LSB值。在切片片段标头中用信号表示的POC LSB值可用于导出差量POC值,其用于更新DPB中的同一层图片的POC 值,且还用于导出当前图片的POC值的POC MSB。在当前图片具有用信号表示的此POC LSB值时,且当位流中存在与所述当前图片相关联的POC锚图片时,所述POC锚图片具有POC复位或POC MSB复位的指示。为当前图片用信号表示的此POC LSB值等于 POC锚图片的POC LSB值,POC锚图片也是POC复位周期的作为当前图片的第一图片。根据本发明的方面,视频编码器20用信号表示指示具有等于2的poc_reset_idc语法元素的基础层IDR图片的额外POC LSB的数据。
如上所述,视频编码器20和视频解码器30可分别根据由适用的视频译码标准建立的限制来配置。举例来说,根据本发明的方面,同一存取单元中的全部图片将具有 poc_reset_idc的相同值。另外,作为另一实例,一个POC复位周期将不包含具有等于1 或2的poc_reset_idc的一个以上存取单元。另外,作为另一实例,具有等于1或2的 poc_reset_idc的存取单元将为POC复位周期中的第一存取单元。
根据本发明的方面,POC复位周期可适用于多层视频数据的全部层。举例来说,POC复位周期可经界定以使得跨越多层数据的层应用POC复位周期。如下文更详细地描述, POC复位周期可包含全部具有大于0的poc_reset_idc的按解码次序的存取单元序列。指示上文所论述的POC值复位的数据可与POC复位周期相关联。
以下揭示内容和表包含根据本发明的技术的实例语法。所述语法可相对于例如由上文提到的文献JCTVC-O0217和JCTVC-O0266修改的MV-HEVC的语法而修改。在下文的实例描述、语法表和语义中,使用斜体字表示对MV-HEVC的添加(如由文献 JCTVC-O0217和JCTVC-O0266修改)且使用“移除”接着是加括号的文字来表示删除(例如,[移除:“移除的文字”])。一般来说,关于“要求”的陈述应理解为形成标准或标准扩展的文本的一部分,而不是出于本发明的技术的目的的要求。在一些情况下,此些“要求”可包含可经确定为适用的位流约束且接着例如由视频译码器基于所述确定而附加)。
可将数学函数的以下定义添加到MV-HEVC,例如添加到MV-HEVC的子条款5.8:
以下定义可添加到子条款F.3:
F.3.1图片次序计数(POC)复位周期:全部具有大于0的poc_reset_idc和 poc_reset_period_id的相同值的按解码次序的存取单元的序列,所述存取单元可以或可不与具有等于0的poc_reset_idc的存取单元交错。
在一个替代方案中,POC复位周期中的图片需要在层内按解码次序为连续的。然而,允许这些图片与同一层中具有等于0的poc_reset_idc的图片交错是更灵活的,且允许使用相同开销实现群集丢包的更好的容错性。
下表是根据本发明的技术的PPS的语法的实例:
在以上实例中,等于0的pps_extension_flag指定PPS RBSP语法结构中不存在pps_extension_data_flag语法元素。当slice_segment_header_extension_present_flag等于0 时,在符合本说明书的此版本的位流中pps_extension_flag将等于0,pps_extension_flag 的1的值保留用于ITU-T|ISO/IEC的未来使用,且解码器将忽略PPS NAL单元中跟随 pps_extension_flag的值1的全部数据。
另外,等于0的poc_reset_info_present_flag指定语法元素poc_reset_idc不存在于参考PPS的切片的切片片段标头中。另外,等于1的poc_reset_info_present_flag指定语法元素poc_reset_idc存在于参考PPS的切片的切片片段标头中。
另外,等于0的pps_extension2_flag指定无pps_extension_data_flag语法元素存在于 PPS RBSP语法结构中。pps_extension2_flag在符合本说明书的此版本的位流中应等于0。 pps_extension2_flag的值1保留以供ITU-T|ISO/IEC未来使用。解码器将忽略PPSNAL 单元中跟随pps_extension2_flag的值1的所有数据。
下表是根据本发明的技术的切片标头的语法的实例。
替代地,可使用不同数目的位用信号表示poc_reset_period_id语法元素,例如经译码为u(14)。
当存在时,切片片段标头语法元素slice_pic_parameter_set_id、pic_output_flag、 no_output_of_prior_pics_flag、slice_pic_order_cnt_lsb、short_term_ref_pic_set_sps_flag、 short_term_ref_pic_set_idx、num_long_term_sps、num_long_term_pics、 slice_temporal_mvp_enabled_flag、discardable_flag、cross_layer_bla_flag、inter_layer_pred_enabled_flag、num_inter_layer_ref_pics_minus1、poc_reset_idc、poc_reset_pic_id、full_poc_reset_flag和poc_lsb_val的值在经译码图片的所有切片片段标头中将相同。当存在时,对于i的每一可能值,切片片段标头语法元素lt_idx_sps[i]、poc_lsb_lt[i]、used_by_curr_pic_lt_flag[i]、delta_poc_msb_present_flag[i]、delta_poc_msb_cycle_lt[i]和inter_layer_pred_layer_idc[i]的值在经译码图片的所有切片片段标头中将相同。
语法元素slice_segment_header_extension_length可指定切片片段标头扩展数据的以字节计的长度,不包含用于用信号表示slice_segment_header_extension_length自身的位。如果poc_reset_info_present_flag等于0,那么语法元素 slice_segment_header_extension_length的值将在0到256(包含性)的范围内。否则,语法元素slice_segment_header_extension_length的值当poc_reset_idc等于1时或当 poc_reset_idc等于2且nuh_layer_id大于0时将在1到256(包含)的范围内,且当 poc_reset_idc等于2且nuh_layer_id等于0时将在1+ Ceil((log2_max_pic_order_cnt_lsb_minus4+4)/8)到256(包含性)的范围内,且当 poc_reset_idc等于3时将在1+Ceil((log2_max_pic_order_cnt_lsb_minus4+5)/8)到 256(包含性)的范围内。
等于0的语法元素poc_reset_idc指定当前图片的图片次序计数值的最高有效位和最低有效位都不复位。等于1的语法元素poc_reset_idc指定当前图片的图片次序计数值的仅最高有效位可复位。等于2的语法元素poc_reset_idc指定当前图片的图片次序计数值的最高有效位和最低有效位都可复位。等于3的语法元素poc_reset_idc指定可复位当前图片的图片次序计数值的仅最高有效位或最高有效位和最低有效位两者,且用信号表示额外图片次序计数信息。当不存在时,语法元素poc_reset_poc的值推断(即,由译码器确定而无需显式信令)为等于0。
这是以下约束适用的位流一致性的要求:
-对于RASL图片、RADL图片、子层非参考图片或具有大于0的TemporalId的图片,poc_reset_idc的值将不等于1或2。
-存取单元中的全部图片的poc_reset_idc的值应相同。
[移除:-当存取单元中的图片的poc_reset_idc的值等于1时,存取单元中的所有图片的poc_reset_idc的值将等于1。]
[移除:-当存取单元中的图片的poc_reset_idc的值等于2时,存取单元中的所有图片的poc_reset_idc的值将等于2。]
-当存取单元中的一个图片是具有nal_unit_type的特定值的IRAP图片,且相同存取单元中存在具有nal_unit_type的不同值的至少一个其它图片,对于存取单元中得所有图片,poc_reset_idc的值将等于1或2。
-当存取单元中具有等于0的nuh_layer_id的图片是IDR图片且同一存取单元中存在至少一个非IDR图片时,对于存取单元中的所有图片,poc_reset_idc的值将等于2。
-当存取单元中具有等于0的nuh_layer_id的图片不是IDR图片时,对于存取单元中的任一图片,poc_reset_idc的值将不等于2。
存取单元的poc_reset_idc的值参考存取单元中的图片的poc_reset_idc的值。
语法元素poc_reset_period_id识别POC复位周期。同一层中将不存在具有语法元素 poc_reset_period_id的相同值和等于1或2的语法元素poc_reset_idc的按解码次序连续的两个图片。
注意-层中的多个图片具有相同的poc_reset_pic_id值且具有等于1或2的 poc_reset_idc不受禁止,除非此类图片出现在按解码次序的两个连续存取单元中。为了最小化由于图片损耗、位流提取、搜寻或拼接操作而在位流中出现此类两个图片的可能性,编码器应针对每一POC复位周期将poc_reset_pic_id的值设定为随机值(经受上文指定的约束)。
这是以下约束适用的位流一致性的要求:
-一个POC复位周期将不包含具有等于1或2的poc_reset_idc的一个以上存取单元。
-具有等于1或2的poc_reset_idc的存取单元将为POC复位周期中的第一存取单元。
[移除:-当具有等于1和3的poc_reset_idc的图片存在于同一POC复位周期中时,具有等于3的poc_reset_idc的全部图片将按解码次序跟随具有等于1的poc_reset_idc的图片。]
[移除:-当具有等于2和3的poc_reset_idc的图片存在于同一POC复位周期中时,具有等于3的poc_reset_idc的全部图片将按解码次序跟随具有等于2的poc_reset_idc的图片。]
等于1的语法元素full_poc_reset_flag指定当同一层中按解码次序的先前图片并不属于同一POC复位周期时,当前图片的图片次序计数值的最高有效位和最低有效位两者复位。等于0的语法元素full_poc_reset_flag指定当同一层中按解码次序的先前图片不属于同一POC重设周期时,复位当前图片的图片次序计数值的仅最高有效位。
语法元素poc_lsb_val指定可用以导出当前图片的图片次序计数的值。poc_lsb_val 语法元素的长度是log2_max_pic_order_cnt_lsb_minus4+4个位。
位流一致性的要求是:当poc_reset_idc等于3时,且位流中存在位于与当前图片相同的层中、具有等于1或2的poc_reset_idc且属于同一POC复位周期的按解码次序的先前图片picA时,picA将为按解码次序在与当前图片相同的层中;不是RASL图片、 RADL图片或子层非参考图片;且具有等于0的TemporalId的先前图片相同的图片,且当前图片的poc_lsb_val的值将等于picA的slice_pic_order_cnt_lsb的值。
变量numRsvBits和BytesInSliceSegmtHdrExt是如下导出的:
语法元素slice_segment_header_extension_reserved_bits可具有任何值。slice_segment_header_extension_reserved_bits语法元素的长度等于numRsvBits个位。例如视频解码器30等解码器将忽略slice_segment_header_extension_reserved_bits的值。其值并不影响解码器对本说明书的此版本中指定的简档的一致性。
视频解码器30可执行以下解码过程用于开始具有大于0的nuh_layer_id的经译码图片的解码。在以下过程中参考的每一“图片”是完整经译码图片。对于当前图片CurrPic,解码过程如下操作:
-如本文中所描述解码NAL单元。
-子条款F.8.3中的过程使用切片片段层中及以上的语法元素指定以下解码过程:
-在子条款F.8.3.1中导出与图片次序计数相关的变量和函数。此仅需要针对图片的第一切片片段调用。PicOrderCntVal应在存取单元内保持不变是位流一致性的要求。DeltaPocVal应在存取单元内保持不变也是位流一致性的要求。
-调用子条款F.8.3.2中的对于RPS的解码过程,其中仅可将具有等于CurrPic 的nuh_layer_id的nuh_layer_id的参考图片标记为“不用于参考”或“用于长期参考”,且不标记具有不同nuh_layer_id值的任何图片。此仅需要针对图片的第一切片片段调用。
-当FirstPicInLayerDecodedFlag[nuh_layer_id]等于0时,调用在子条款F.8.1.3 中指定的用于产生不可用参考图片的解码过程,其需要仅针对图片的第一切片片段来调用。
-当FirstPicInLayerDecodedFlag[nuh_layer_id]不等于0且当前图片为具有等于1的NoRaslOutputFlag的IRAP图片时,调用在子条款F.8.1.3中指定的用于产生不可用参考图片的解码过程,其需要仅针对图片的第一切片片段来调用。
在第一实例中,根据本发明的方面,视频解码器30可执行以下用于POC值的解码过程。所述第一实例可对应于上述用于递减POC值的第一实例技术。即,以下实例可用以在对其中执行POC复位的存取单元的初始图片进行解码之前递减存储到DPB的(全部层的)全部图片的POC值。可在对存取单元的初始图片进行解码之前但在对初始图片的第一切片的切片标头信息进行译码之后调用POC递减过程。所述第一实例过程可如下执行:
此过程的输出为PicOrderCntVal,当前图片的图片次序计数。
使用图片次序计数识别图片,以用于在合并模式及运动向量预测中导出运动参数,且用于解码器一致性检查(参看子条款C.5)。
每一经译码图片与一图片次序计数变量(标示为PicOrderCntVal)相关联。
如果FirstPicInLayerDecodedFlag[nuh_layer_id]等于1,poc_reset_idc大于0,且含有当前图片的存取单元是POC复位周期中按解码次序的第一存取单元,那么以下适用:
-如下导出变量pocMsbDelta、pocLsbDelta和DeltaPocVal:
-如下导出当前图片的PicOrderCntVal:
-如下导出PrevPicOrderCnt[nuh_layer_id]的值:
-如果当前图片不是RASL图片、RADL图片或子层非参考图片,且当前图片具有等于0的TemporalId,那么将PrevPicOrderCnt[nuh_layer_id]设定成等于 PicOrderCntVal。
-否则,当poc_reset_idc等于3时,设定PrevPicOrderCnt[nuh_layer_id]等于full_poc_reset_flag?0:poc_lsb_val。
否则,以下适用:
-将DeltaPocVal的值设定成等于0。
-如下导出当前图片的PicOrderCntVal:
-如下导出PrevPicOrderCnt[nuh_layer_id]的值:
-如果当前图片不是RASL图片、RADL图片或子层非参考图片,且当前图片具有等于0的TemporalId,那么将PrevPicOrderCnt[nuh_layer_id]设定成等于 PicOrderCntVal。
-否则,当FirstPicInLayerDecodedFlag[nuh_layer_id]等于0且poc_reset_idc等于3时,设定PrevPicOrderCnt[nuh_layer_id]等于full_poc_reset_flag?0:poc_lsb_val。
如果当前图片是存取单元中的第一图片(即存取单元中的全部图片当中具有nuh_layer_id的最低值的图片)且DeltaPocVal大于0,那么将全部子DPB中的全部图片的PicOrderCntVal值递减DeltaPocVal的值。
PicOrderCntVal的值将在-231到231-1(包含性)的范围内。在一个CVS中,同一层中任何两个经译码图片的PicOrderCntVal值不应相同。
如下指定函数PicOrderCnt(picX):
PicOrderCnt(picX)=图片picX的PicOrderCntVal(F-25)
如下指定函数DiffPicOrderCnt(picA,picB):
DiffPicOrderCnt(picA,picB)=PicOrderCnt(picA)-PicOrderCnt(picB)(F-26)
位流将不含有产生用于解码过程中的不在-215到215-1(包含性)的范围内的DiffPicOrderCnt(picA,picB)的值的数据。
注意-假设X是当前图片且Y及Z是相同序列中的两个其它图片,当DiffPicOrderCnt(X,Y)及DiffPicOrderCnt(X,Z)为正或两者都为负时,Y及Z被视为在从 X的相同输出次序方向上。
在第二实例中,根据本发明的方面,视频解码器30可执行以下用于POC值的解码过程。所述第二实例可对应于上述用于递减POC值的第二实例技术。即,以下实例可用以在对存取单元中的每一图片进行解码之前但在所述图片的第一切片的切片标头信息的剖析和解码之后针对每一子DPB中的较早图片调用POC递减过程。视频解码器30 还可在对存在于存取单元中的图片进行解码之后执行具有针对所述存取单元不存在或未接收的图片的层的子DPB中的较早图片的额外POC递减过程。所述第二实例过程可如下执行:
此过程的输出为PicOrderCntVal,当前图片的图片次序计数。
使用图片次序计数识别图片,以用于在合并模式及运动向量预测中导出运动参数,且用于解码器一致性检查(参看子条款C.5)。
每一经译码图片与一图片次序计数变量(标示为PicOrderCntVal)相关联。
如果当前图片是存取单元中的第一图片,那么以下适用:
-将PocResetFlag的值设定成0。
-将变量DeltaPocVal设定成0。
-对于从0到63(包含性)的ⅰ的所有值,将变量UpdateSubDpbFlag[i]设定成等于0。
如果FirstPicInLayerDecodedFlag[nuh_layer_id]等于1,poc_reset_idc大于0,且含有当前图片的存取单元是POC复位周期中按解码次序的第一存取单元,那么以下适用:
如果FirstPicInLayerDecodedFlag[nuh_layer_id]等于1,poc_reset_idc大于0,且含有当前图片的存取单元是POC复位周期中按解码次序的第一存取单元,那么以下适用:
-如下导出变量pocMsbDelta、pocLsbDelta和DeltaPocVal:
-将在DPB中且属于与当前图片相同的层的每一图片的PicOrderCntVal递减DeltaPocVal。
-PocResetFlag=1
-UpdateSubDpbFlag[nuh_layer_id]=1
-如下导出当前图片的PicOrderCntVal:
-如下导出PrevPicOrderCnt[nuh_layer_id]的值:
-如果当前图片不是RASL图片、RADL图片或子层非参考图片,且当前图片具有等于0的TemporalId,那么将PrevPicOrderCnt[nuh_layer_id]设定成等于 PicOrderCntVal。
-否则,当poc_reset_idc等于3时,设定PrevPicOrderCnt[nuh_layer_id]等于full_poc_reset_flag?0:poc_lsb_val。
否则,以下适用:
-将DeltaPocVal的值设定成等于0
-如下导出当前图片的PicOrderCntVal:
-如下导出PrevPicOrderCnt[nuh_layer_id]的值:
-如果当前图片不是RASL图片、RADL图片或子层非参考图片,且当前图片具有等于0的TemporalId,那么将PrevPicOrderCnt[nuh_layer_id]设定成等于 PicOrderCntVal。
-否则,当FirstPicInLayerDecodedFlag[nuh_layer_id]等于0且poc_reset_idc等于3时,设定PrevPicOrderCnt[nuh_layer_id]等于full_poc_reset_flag?0:poc_lsb_val。
如果当前图片是存取单元中的最后图片且变量PocResetFlag的值等于1,那么以下适用:
-对于从0到63(包含性)的i的全部值,如果UpdateSubDpbFlag[i]等于0,那么将DPB中具有等于i的nuh_layer_id的全部图片的PicOrderCntVal递减变量DeltaPocVal 的值
PicOrderCntVal的值将在-231到231-1(包含性)的范围内。在一个CVS中,同一层中任何两个经译码图片的PicOrderCntVal值不应相同。
如下指定函数PicOrderCnt(picX):
PicOrderCnt(picX)=图片picX的PicOrderCntVal(F-25)
如下指定函数DiffPicOrderCnt(picA,picB):
DiffPicOrderCnt(picA,picB)=PicOrderCnt(picA)-PicOrderCnt(picB)(F-26)
位流将不含有产生用于解码过程中的不在-215到215-1的范围(包含性)内的DiffPicOrderCnt(picA,picB)的值的数据。
注意-假设X是当前图片且Y及Z是相同序列中的两个其它图片,当DiffPicOrderCnt(X,Y)及DiffPicOrderCnt(X,Z)为正或两者都为负时,Y及Z被视为在从 X的相同输出次序方向上。
在第三实例中,根据本发明的方面,视频解码器30可执行以下用于POC值的解码过程。所述第三实例可对应于上述用于递减POC值的第三实例技术。即,以下实例可用以在对存取单元中的每一图片进行解码之前但在相应图片的第一切片的切片标头信息的剖析和解码之后针对每一子DPB中的较早图片调用POC递减过程。在执行子DPB 中的较早图片的POC递减过程之前,如果针对一或多个较低层子DPB尚未执行同一过程,那么针对那些子DPB执行过程。所述第三实例过程可如下执行:
此过程的输出为PicOrderCntVal,当前图片的图片次序计数。
使用图片次序计数识别图片,以用于在合并模式及运动向量预测中导出运动参数,且用于解码器一致性检查(参看子条款C.5)。
每一经译码图片与一图片次序计数变量(标示为PicOrderCntVal)相关联。
如果当前图片是存取单元中的第一图片,那么以下适用:
-将PocResetFlag的值设定成0。
-将变量DeltaPocVal设定成0。
-对于从0到63(包含性)的ⅰ的所有值,将变量UpdateSubDpbFlag[i]设定成等于0。
如果FirstPicInLayerDecodedFlag[nuh_layer_id]等于1,poc_reset_idc大于0,且含有当前图片的存取单元是POC复位周期中按解码次序的第一存取单元,那么以下适用:
-如下导出变量pocMsbDelta、pocLsbDelta和DeltaPocVal:
-PocResetFlag=1
-UpdateSubDpbFlag[nuh_layer_id]=1
-对于从0到nuh_layer_id-1(包含性)的i的全部值,如果UpdateSubDpbFlag[i]等于0,那么将在DPB中且属于与当前图片同一层的每一图片的PicOrderCntVal递减DeltaPocVal。
-将在DPB中且属于与当前图片相同的层的每一图片的PicOrderCntVal递减DeltaPocVal。
-如下导出当前图片的PicOrderCntVal:
-如下导出PrevPicOrderCnt[nuh_layer_id]的值:
-如果当前图像不是RASL图片、RADL图片或子层非参考图片,且当前图片具有等于0的TemporalId,那么将PrevPicOrderCnt[nuh_layer_id]设定成等于 PicOrderCntVal。
-否则,当poc_reset_idc等于3时,设定PrevPicOrderCnt[nuh_layer_id]等于full_poc_reset_flag?0:poc_lsb_val。
否则,以下适用:
-将DeltaPocVal的值设定成等于0
-如下导出当前图片的PicOrderCntVal:
-如下导出PrevPicOrderCnt[nuh_layer_id]的值:
-如果当前图像不是RASL图片、RADL图片或子层非参考图片,且当前图片具有等于0的TemporalId,那么将PrevPicOrderCnt[nuh_layer_id]设定成等于 PicOrderCntVal。
-否则,当FirstPicInLayerDecodedFlag[nuh_layer_id]等于0且poc_reset_idc等于3时,设定PrevPicOrderCnt[nuh_layer_id]等于full_poc_reset_flag?0:poc_lsb_val。
PicOrderCntVal的值将在-231到231-1(包含性)的范围内。在一个CVS中,同一层中任何两个经译码图片的PicOrderCntVal值不应相同。
如下指定函数PicOrderCnt(picX):
PicOrderCnt(picX)=图片picX的PicOrderCntVal(F-25)
如下指定函数DiffPicOrderCnt(picA,picB):
DiffPicOrderCnt(picA,picB)=PicOrderCnt(picA)-PicOrderCnt(picB)(F-26)
位流将不含有产生用于解码过程中的不在-215到215-1的范围(包含性)内的DiffPicOrderCnt(picA,picB)的值的数据。
注意-假设X是当前图片且Y及Z是相同序列中的两个其它图片,当DiffPicOrderCnt(X,Y)及DiffPicOrderCnt(X,Z)为正或两者都为负时,Y及Z被视为在从 X的相同输出次序方向上。
在第四实例中,根据本发明的方面,视频解码器30可执行以下用于POC值的解码过程。所述第四实例可对应于上述用于递减POC值的第四实例技术。即,以下实例可用以在需要POC复位的每一存取单元的解码结束时执行DPB中(即,对于全部子DPB) 的较早图片的POC递减过程应用一次。即,视频解码器30可对执行POC复位的存取单元的全部图片进行解码,接着递减DPB的全部图片的POC值。所述第四实例过程可如下执行:
此过程的输出为PicOrderCntVal,当前图片的图片次序计数。
使用图片次序计数识别图片,以用于在合并模式及运动向量预测中导出运动参数,且用于解码器一致性检查(参看子条款C.5)。
每一经译码图片与一图片次序计数变量(标示为PicOrderCntVal)相关联。
如果FirstPicInLayerDecodedFlag[nuh_layer_id]等于1,poc_reset_idc大于0,且含有当前图片的存取单元是POC复位周期中按解码次序的第一存取单元,那么以下适用:
-如下导出变量pocMsbDelta、pocLsbDelta和DeltaPocVal:
-如下导出当前图片的PicOrderCntVal:
-如下导出PrevPicOrderCnt[nuh_layer_id]的值:
-如果当前图像不是RASL图片、RADL图片或子层非参考图片,且当前图片具有等于0的TemporalId,那么将PrevPicOrderCnt[nuh_layer_id]设定成等于 PicOrderCntVal。
-否则,当poc_reset_idc等于3时,设定PrevPicOrderCnt[nuh_layer_id]等于full_poc_reset_flag?0:poc_lsb_val。
否则,以下适用:
-将DeltaPocVal的值设定成等于0
-如下导出当前图片的PicOrderCntVal:
-如下导出PrevPicOrderCnt[nuh_layer_id]的值:
-如果当前图像不是RASL图片、RADL图片或子层非参考图片,且当前图片具有等于0的TemporalId,那么将PrevPicOrderCnt[nuh_layer_id]设定成等于 PicOrderCntVal。
-否则,当FirstPicInLayerDecodedFlag[nuh_layer_id]等于0且poc_reset_idc等于3时,设定PrevPicOrderCnt[nuh_layer_id]等于full_poc_reset_flag?0:poc_lsb_val。
如果当前图片是存取单元中的最后图片且变量DeltaPocVal的值大于0,那么将全部子DPB中的全部图片的PicOrderCntVal递减变量DeltaPocVal的值
PicOrderCntVal的值将在-231到231-1(包含性)的范围内。在一个CVS中,同一层中任何两个经译码图片的PicOrderCntVal值不应相同。
如下指定函数PicOrderCnt(picX):
PicOrderCnt(picX)=图片picX的PicOrderCntVal(F-25)
如下指定函数DiffPicOrderCnt(picA,picB):
DiffPicOrderCnt(picA,picB)=PicOrderCnt(picA)-PicOrderCnt(picB)F-26
位流将不含有产生用于解码过程中的不在-215到215-1(包含性)的范围内的DiffPicOrderCnt(picA,picB)的值的数据。
注意-假设X是当前图片且Y及Z是相同序列中的两个其它图片,当DiffPicOrderCnt(X,Y)及DiffPicOrderCnt(X,Z)为正或两者都为负时,Y及Z被视为在从 X的相同输出次序方向上。
以此方式,视频编码器20和视频解码器30表示视频译码器的实例,所述视频译码器经配置以:对指示多层视频数据的第一层的第一图片的图片次序计数(POC)值的POC 复位的数据进行译码,其中第一图片包含在存取单元中;以及基于指示第一图片的POC 值的POC复位的数据且在对第一图片进行解码之前,递减存储到DPB的按译码次序在第一图片之前的包含多层视频数据的第二层的至少一个图片的全部图片的POC值。
图2是说明根据本发明的技术的可实施用于管理POC值的技术的视频编码器20的实例的框图。确切地说,视频编码器20可经配置以根据本发明的技术管理多层位流的图片的POC值。如上所述,视频编码器20可适于执行多视图和/或可缩放视频译码。举例来说,视频编码器20可经配置以对符合一或多个视频译码标准扩展(例如SHVC、 MV-HEVC或3D-HEVC)的位流进行编码。然而,虽然参考特定译码标准,但应理解,所述技术并非是任何一个译码标准所特有的,且可以未来和/或尚未开发的标准来实施。
视频编码器20可执行视频切片内的视频块的帧内和帧间译码。帧内译码依赖于空间预测来减少或移除给定视频帧或图片内的视频中的空间冗余。帧间译码依赖于时间预测来减少或移除视频序列的邻近帧或图片内的视频中的时间冗余。帧内模式(I模式)可指代若干基于空间的译码模式中的任一者。例如单向预测(P模式)或双向预测(B模式)等帧间模式可指代若干基于时间的译码模式中的任一者。
如图2中所示,视频编码器20接收待编码视频帧内的当前视频块。在图2的实例中,视频编码器20包含视频数据存储器38、模式选择单元40、参考图片存储器64、求和器50、变换处理单元52、量化单元54及熵编码单元56。模式选择单元40又包含运动补偿单元44、运动估计单元42、帧内预测单元46及分割单元48。为了视频块重构,视频编码器20还包含逆量化单元58、逆变换单元60和求和器62。还可包含解块滤波器(图2中未图示)以便对块边界进行滤波,以从经重构视频移除成块性假象。在需要时,解块滤波器将通常滤波求和器62的输出。除了解块滤波器外,还可使用额外滤波器(环路中或环路后)。为简洁起见未图示此些滤波器,但是必要时,此些滤波器可以对求和器 50的输出进行滤波(作为环路内滤波器)。
在编码过程期间,视频编码器20接收待译码的视频帧或切片。所述帧或切片可以划分成多个视频块。视频数据存储器38可存储待由视频编码器20的组件编码的视频数据。可例如从视频源18获得存储在视频数据存储器38中的视频数据。参考图片存储器 64可被称为存储参考视频数据供用于视频编码器20例如在帧内或帧间译码模式中编码视频数据的DPB。视频数据存储器38及参考图片存储器64可由多种存储器装置中的任一者形成,例如包含同步动态随机存取存储器(DRAM)(SDRAM)的DRAM、磁阻式RAM (MRAM)、电阻式RAM(RRAM)或其它类型的存储器装置。视频数据存储器38和参考图片存储器64可由同一存储器装置或单独的存储器装置提供。在各种实例中,视频数据存储器38可与视频编码器20的其它组件一起在芯片上,或相对于那些组件在芯片外。
运动估计单元42和运动补偿单元44可相对于一或多个参考帧中的一或多个块执行所接收视频块的帧间预测性译码以提供时间预测。帧内预测单元46可替代地相对于与待译码块相同的帧或切片中的一或多个相邻块执行对所接收的视频块的帧内预测性译码以提供空间预测。视频编码器20可以执行多个译码遍次,例如,以为每一视频数据块选择适当的译码模式。
此外,分割单元48可以基于前述译码遍次中的前述划分方案的评估将视频数据块分割成子块。举例来说,分割单元48最初可以将帧或切片分割成LCU,并且基于速率失真分析(例如,速率失真优化)将LCU中的每一者分割成子CU。模式选择单元40可以进一步产生指示将LCU分割成子CU的四叉树数据结构。四叉树的叶节点CU可以包含一或多个PU和一或多个TU。
模式选择单元40可以(例如)基于误差结果选择译码模式中的一者(帧内或帧间),并且将所得的经帧内译码或经帧间译码块提供到求和器50以便产生残余块数据,并且提供到求和器62以便重构经编码块以用作参考帧。模式选择单元40还将语法元素(例如,运动向量、帧内模式指示符、分割信息和其它此类语法信息)提供给熵编码单元56。
运动估计单元42和运动补偿单元44可高度集成,但出于概念的目的分别加以说明。由运动估计单元42执行的运动估计为产生运动向量的过程,所述过程估计视频块的运动。举例来说,运动向量可指示当前视频帧或图片内的视频块的PU相对于参考图片(或其它经译码单元)内的预测性块相对于当前图片(或其它经译码单元)内正被译码的当前块的位移。预测性块是被发现在像素差方面与待编码块紧密匹配的块,像素差可通过绝对差总和(SAD)、平方差总和(SSD)或其它差度量来确定。
运动估计单元42通过比较PU的位置与参考图片的预测性块的位置来计算用于经帧间译码切片中的视频块的PU的运动向量。参考图片可以选自第一参考图片列表(列表0)或第二参考图片列表(列表1),其中的每一个识别存储在参考图片存储器64中的一或多个参考图片。运动估计单元42向熵编码单元56和运动补偿单元44发送计算出的运动向量。
由运动补偿单元44执行的运动补偿可涉及基于由运动估计单元42确定的运动向量来获取或产生预测性块。再次,在一些实例中,运动估计单元42与运动补偿单元44可在功能上集成。在接收到当前视频块的PU的运动向量后,运动补偿单元44可即刻在参考图片列表中的一者中定位所述运动向量指向的预测块。求和器50通过从正被编码的当前视频块的像素值减去预测性块的像素值从而形成像素差值来形成残余视频块,如下文所论述。一般来说,运动估计单元42相对于明度分量执行运动估计,并且运动补偿单元44对于色度分量及明度分量两者使用基于明度分量计算的运动向量。模式选择单元40还可产生与视频块及视频切片相关联的语法元素以供视频解码器30在解码视频切片的视频块时使用。
运动估计单元42搜索存储在参考图片存储器64的DPB中的参考图片。模式选择单元40可确定哪些参考图片将用以编码图片、图片的切片和/或图片序列。视频编码器 20可编码用以编码所述图片、切片或序列的参考图片的图片次序计数(POC)值。视频编码器20可在切片标头和/或例如PPS和/或SPS等参数集中对指示将包含在参考图片列表中的参考图片的POC值进行编码。
以此方式,视频解码器(例如视频解码器30)可通过包含切片标头和/或参数集中所指示的参考图片来再生参考图片列表。此外,在使用运动估计单元42所产生的运动向量来编码块之后,视频编码器20可编码所述块的运动信息,其中所述运动信息可包含表示所述运动向量的数据、参考图片列表的识别符,以及识别所述参考图片列表中的参考图片的参考索引。
在一些实例中,视频编码器20可计算存储于参考图片存储器64中的参考图片的子整数像素位置的值。举例来说,视频编码器20可内插参考图片的四分之一像素位置、八分之一像素位置或其它分数像素位置的值。因此,运动估计单元42可相对于全像素位置和分数像素位置执行运动搜索并且输出具有分数像素精度的运动向量。
视频编码器20还可形成POC复位周期且对用于图片的切片的POC复位周期识别符的值进行编码以将切片指派到相应POC复位周期。视频编码器20可在每一视频数据层内将切片个别地指派给POC复位周期。此外,视频编码器20可确定切片的POC复位类型,且编码所述切片的POC复位类型的指示的值(例如两位值)。
如相对于图1所论述,视频编码器20可根据适用视频译码标准所建立的限制来配置。举例来说,视频编码器20可确保每一POC复位周期中的第一图片具有指示POC 值将完全或部分复位的POC复位类型。此外,在一些实例中,视频编码器20可编码指示POC LSB值的额外信息,其可指示POC复位周期的POC锚图片的POC LSB值。
视频编码器20还可递减参考图片存储器64的DPB中的参考图片的POC值。根据本发明的方面,视频编码器20可经配置以在对其中执行POC复位的存取单元的初始图片进行编码之前递减存储到参考图片存储器64的(全部层的)全部图片的POC值。在一些实例中,视频编码器20可当对其中正执行POC复位的存取单元进行编码时将POC 递减过程应用于参考图片存储器64的全部子DPB(其中视频数据的每一层与相应子DPB 相关联)中的较早图片仅一次。
通过递减存储到参考图片存储器64的参考图片,视频编码器20可当对切片标头和/或参数集中的POC值进行编码时使用递减的POC值来指示将包含在参考图片列表中的参考图片。视频编码器20使DPB中得图片的POC值递减的量可为POC锚图片递减的相同量。POC锚图片的POC复位可仅限于使POC MSB复位或使POC锚图片的全POC 值复位。
作为如上文所描述由运动估计单元42及运动补偿单元44执行的帧间预测的替代方案,帧内预测单元46可对当前块进行帧内预测。具体来说,帧内预测单元46可以确定用于对当前块进行编码的帧内预测模式。在一些实例中,帧内预测单元46可以(例如) 在单独的编码编次期间使用各种帧内预测模式来编码当前块,并且帧内预测单元46(或在一些实例中为模式选择单元40)可以从测试模式中选择适当帧内预测模式来使用。
举例来说,帧内预测单元46可使用速率-失真分析计算针对各种测试的帧内预测模式的速率-失真值,且从所述测试的模式当中选择具有最好速率失真特性的帧内预测模式。速率失真分析一般确定经编码块与经编码以产生所述经编码块的原始的未经编码块之间的失真(或误差)的量,以及用于产生经编码块的位速率(也就是说,位数目)。帧内预测单元46可根据用于各种经编码块的失真和速率计算比率,以确定哪种帧内预测模式对于所述块展现最佳速率-失真值。
在选择用于块的帧内预测模式后,帧内预测单元46可将指示用于块的选定帧内预测模式的信息提供到熵编码单元56。熵编码单元56可编码指示选定帧内预测模式的信息。视频编码器20在所发射的位流中可包含配置数据,其可包含多个帧内预测模式索引表和多个经修改的帧内预测模式索引表(也称为码字映射表),对用于各种块的上下文进行编码的定义,以及对最可能帧内预测模式、帧内预测模式索引表和经修改的帧内预测模式索引表的指示以用于所述上下文中的每一者。
视频编码器20通过从正译码原始视频块减去来自模式选择单元40的预测数据而形成残余视频块。求和器50表示执行此减法运算的一或多个组件。变换处理单元52将例如离散余弦变换(DCT)或概念上类似的变换等变换应用于残余块,从而产生包括残余变换系数值的视频块。变换处理单元52可以执行概念上类似于DCT的其它变换。也可使用小波变换、整数变换、子带变换或其它类型的变换。在任何状况下,变换处理单元52 向残余块应用所述变换,从而产生残余变换系数的块。所述变换可将残余信息从像素值域转换到变换域(例如,频域)。
变换处理单元52可将所得变换系数发送到量化单元54。量化单元54对变换系数进行量化以进一步降低位速率。量化过程可以减少与系数中的一些或全部相关联的位深度。可以通过调整量化参数来修改量化程度。在一些实例中,量化单元54可以接着执行对包含经量化的变换系数的矩阵的扫描。替代地,熵编码单元56可执行扫描。
在量化之后,熵编码单元56对经量化的变换系数进行熵译码。举例来说,熵编码单元56可执行上下文自适应可变长度译码(CAVLC)、上下文自适应二进制算术译码 (CABAC)、基于语法的上下文自适应二进制算术译码(SBAC)、概率区间分割熵(PIPE) 译码或另一熵译码技术。在基于上下文的熵译码的情况下,上下文可以基于相邻块。在熵编码单元56的熵译码之后,可以将经编码位流发射到另一装置(例如,视频解码器30),或者将所述视频存档以用于稍后发射或检索。
逆量化单元58和逆变换单元60分别应用逆量化和逆变换以在像素域中重构残余块,例如以供稍后用作参考块。运动补偿单元44可通过将残余块添加到参考图片存储器64的一个帧的预测性块来计算参考块。运动补偿单元44还可将一或多个内插滤波器应用于经重构的残余块来计算用于在运动估计中使用的次整数像素值。求和器62将经重构的残余块添加到由运动补偿单元44产生的经运动补偿的预测块,以产生经重构的视频块以用于存储于参考图片存储器64中。经重构的视频块可由运动估计单元42及运动补偿单元44用作参考块以对后续视频帧中的块进行帧间译码。
以此方式,图2的视频编码器20表示视频编码器的实例,所述视频编码器经配置以对指示多层视频数据的第一层的第一图片的图片次序计数(POC)值的POC复位的数据进行编码,其中所述第一图片包含在存取单元中。视频编码器20还经配置以基于指示第一图片的POC值的POC复位的数据且在对第一图片进行解码之前,递减存储到经解码图片缓冲器(DPB)的按译码次序在所述第一图片之前的包含多层视频数据的第二层的至少一个图片的全部图片的POC值。
图3是说明根据本发明的技术的可实施用于管理POC值的技术的视频解码器30的实例的框图。如上所述,视频解码器30可适于执行多视图和/或可缩放视频译码。举例来说,视频解码器30可经配置以对符合一或多个视频译码标准扩展(例如SHVC、 MV-HEVC或3D-HEVC)的位流进行解码。然而,虽然参考特定特定译码标准,但应理解,所述技术不特定针对任何一个译码标准,且可以未来和/或尚未开发的标准来实施。
在图3的实例中,视频解码器30包含视频数据存储器68、熵解码单元70、运动补偿单元72、帧内预测单元74、逆量化单元76、逆变换单元78、参考图片存储器82及求和器80。在一些实例中,视频解码器30可执行一般与相对于视频编码器20(图2)所描述的编码遍次互逆的解码遍次。运动补偿单元72可基于从熵解码单元70接收的运动向量产生预测数据,而帧内预测单元74可基于从熵解码单元70接收的帧内预测模式指示符产生预测数据。
视频数据存储器68可存储待由视频解码器30的组件解码的视频数据,例如经编码视频位流。可例如从计算机可读媒体(例如,从例如相机等本地视频源)经由视频数据的有线或无线网络通信或者通过存取物理数据存储媒体而获得存储在视频数据存储器68 中的视频数据。视频数据存储器68可形成存储来自经编码视频位流的经编码视频数据的经译码图片缓冲器(CPB)。参考图片存储器82可被称为存储参考视频数据供用于视频解码器30例如在帧内或帧间译码模式中解码视频数据的DPB。视频数据存储器68和参考图片存储器82可由多种存储器装置中的任一者形成,例如包含同步DRAM(SDRAM) 的动态随机存取存储器(DRAM)、磁阻式RAM(MRAM)、电阻式RAM(RRAM)或其它类型的存储器装置。视频数据存储器68和参考图片存储器82可由同一存储器装置或单独的存储器装置提供。在各种实例中,视频数据存储器68可与视频解码器30的其它组件一起在芯片上,或相对于那些组件在芯片外。
在解码过程期间,视频解码器30从视频编码器20接收表示经编码视频切片的视频块和相关联的语法元素的经编码视频位流。视频解码器30的熵解码单元70熵解码位流以产生经量化系数、运动向量或帧内预测模式指示符和其它语法元素。熵解码单元70 将运动向量及其它语法元素转发到运动补偿单元72。视频解码器30可在视频切片层级及/或视频块层级接收语法元素。
当视频切片经译码为经帧内译码(I)切片时,帧内预测单元74可以基于用信号表示的帧内预测模式及来自当前帧或图片的先前经解码块的数据产生用于当前视频切片的视频块的预测数据。当视频帧经译码为经帧间译码(例如,B、P或GPB)切片时,运动补偿单元72基于从熵解码单元70接收的运动向量及其它语法元素产生用于当前视频切片的视频块的预测性块。可以从参考图片列表中的一者内的参考图片中的一者产生预测性块。视频解码器30可以基于存储在参考图片存储器82的DPB中的参考图片使用默认构造技术构造参考帧列表--列表0和列表1。
更确切地说,视频解码器30可对指示对应于PPS的图片的切片是否包含图片次序计数(POC)复位信息的PPS进行解码。假定所述切片包含POC复位信息,视频解码器 30可解码包含POC复位信息的所述图片的切片的切片片段标头。POC复位信息可包含 POC复位周期识别符和POC复位类型。
POC复位周期识别符可指示所述切片所对应于的POC复位周期。POC复位类型可指示包含所述切片的图片的POC值完全复位还是仅POC值的MSB复位。此外,POC 复位类型可指示将不执行POC复位,或用信号表示额外信息。如果POC复位类型指示用信号表示额外信息,那么视频解码器30可解码额外信息,其可指示POC LSB值以及 POC值是完全复位还是仅MSB复位。
根据本发明的方面,在对指示存取单元的初始图片的视频数据的切片的POC复位的信息进行解码之后但在对存取单元的视频数据进行解码之前,视频解码器30可递减存储到参考图片存储器82的图片的POC值。根据本发明的方面,在一些实例中,视频解码器30可经配置以在对其中执行POC复位的存取单元的初始图片的视频数据进行解码之前递减存储到参考图片存储器82的(全部层的)全部图片的POC值。视频解码器30 可当对其中正执行POC复位的存取单元进行解码时将POC递减过程应用于参考图片存储器82的全部子DPB(其中视频数据的每一层与相应子DPB相关联)中的较早图片仅一次。
在执行POC复位之后,视频解码器30可解码将包含于参考图片列表中的参考图片的POC值。视频解码器30可解码切片片段标头中和/或来自参数集(例如PPS或SPS)的这些POC值。视频解码器30接着可构造包含经解码POC值所识别的参考图片的参考图片列表。
在构建切片的参考图片列表之后,视频解码器30可解码所述切片的块。运动补偿单元72通过剖析运动向量和其它语法元素确定用于当前视频切片的视频块的预测信息,且使用所述预测信息产生用于正经解码的当前视频块的预测块。举例来说,运动补偿单元72使用所述所接收的语法元素中的一些来确定用以译码视频切片的视频块的预测模式(例如帧内或帧间预测)、帧间预测切片类型(例如B切片、P切片或GPB切片)、所述切片的每一经帧间编码视频块的运动向量、所述切片的每一经帧间译码视频块德帧间预测状态,以及用以解码当前视频切片中的视频块的其它信息。经帧间预测的块的运动信息可包含参考图片列表识别符和参考索引,以识别所述参考图片列表中将用于预测所述块的参考图片。
运动补偿单元72还可以基于内插滤波器执行内插。运动补偿单元72可以使用如视频编码器20在视频块的编码期间使用的内插滤波器来计算参考块的子整数像素的内插值。在此情况下,运动补偿单元72可根据接收的语法元素而确定由视频编码器20使用的内插滤波器并使用所述内插滤波器来产生预测性块。
逆量化单元76对在位流中提供且由熵解码单元70解码的经量化块系数进行逆量化,即解量化。逆量化过程可包含使用视频解码器30为视频切片中的每一视频块计算以确定应应用的量化程度以及同样地逆量化程度的量化参数QPY
逆变换单元78将逆变换(例如,逆DCT、逆整数变换或概念上类似的逆变换过程)应用于变换系数以便产生像素域中的残余块。
在运动补偿单元72基于运动向量及其它语法元素产生当前视频块的预测性块后,视频解码器30通过对来自逆变换单元78的残余块与由运动补偿单元72产生的对应预测性块求和而形成经解码的视频块。求和器80表示执行此求和运算的一或多个组件。视需要,还可应用解块滤波器以对经解码块进行滤波,以便移除成块假象。还可使用其它环路滤波器(在译码环路中或在译码环路之后)来使像素转变变平滑或者以其它方式改善视频质量。接着将给定帧或图片中的经解码视频块存储在参考图片存储器82中,所述参考图片存储器存储用于后续运动补偿的参考图片。参考图片存储器82还存储经解码视频以用于稍后呈现在显示装置(例如,图1的显示装置32)上。
以此方式,图3的视频解码器30表示视频解码器的实例,所述视频解码器经配置以对指示多层视频数据的第一层的第一图片的POC值的图片次序计数(POC)复位的数据进行解码,其中所述第一图片包含在存取单元中。视频解码器30还经配置以基于指示第一图片的POC值的POC复位的数据且在对第一图片进行解码之前,递减存储到经解码图片缓冲器(DPB)的按译码次序在所述第一图片之前的包含多层视频数据的第二层的至少一个图片的全部图片的POC值。
图4是说明根据本发明的技术的用于对指示切片的POC复位周期的数据进行编码的实例方法的流程图。另外,图4的方法包含编码当前块。当前块可包括当前CU或当前CU的一部分。尽管相对于视频编码器20(图1和2)来描述,但应理解,其它装置可经配置以执行类似于图4的方法的方法。
在此实例中,视频编码器20可将当前切片指派给POC复位周期(148)。举例来说,如果当前切片形成锚图片的一部分,那么视频编码器20可用信号表示当前切片形成具有不同于先前POC复位周期识别符的POC复位周期识别符的新POC复位周期的开始。替代地,如果当前切片并不形成锚图片的一部分,那么视频编码器20可用信号表示形成现有POC复位周期的一部分的当前切片。
视频编码器20随后递减当前在DPB中的全部图片的参考图片的POC值(150)。即,根据本发明的方面,视频编码器20可递减DPB的全部子DPB中的图片的POC值。视频编码器20可在将当前切片指派给POC复位周期(例如,编码切片标头)之后但在对第一切片的视频数据进行编码之前递减POC值。视频编码器20可将DPB中的图片的POC 值递减相同的递减值。
视频编码器20接着形成包含所述参考图片中的至少一些的参考图片列表(152)。视频编码器20进一步用信号表示包含于参考图片列表中的参考图片的POC值(154)。举例来说,视频编码器20可在参数集(例如SPS或PPS)中和/或切片的切片标头中编码参考图片的POC值(或POC值的部分,例如POC LSB值)。一些参考图片(例如长期参考图片) 可在参数集中用信号表示,而其它参考图片(例如短期参考图片)可在切片标头中用信号表示。
应理解,形成参考图片列表和用信号表示哪些图片包含于参考图片列表中的步骤可经由若干不同编码遍次执行多次,以便确定为例如当前切片块得出最佳速率失真特性的参考图片集合。就是说,视频编码器20可基于当前切片中的所有块的特性且不仅基于单个块的个别特性,来选择包含于参考图片列表中的参考图片集合。
视频编码器20接着可预测当前切片的当前块(156)。举例来说,视频编码器20可计算用于当前块的一或多个预测单元(PU)。更明确地说,运动估计单元42可例如基于SAD、SSD、MAD、MSD或其它错误计算度量来执行运动搜索以在参考图片列表的参考图片中寻找当前块,以识别用作参考块得匹配块。运动估计单元42可基于所述运动搜索产生当前块的运动向量。视频编码器20接着可对所述块的运动信息进行编码(158),其可包含运动向量的运动向量差值、参考图片列表识别符和参考索引,其一起识别所述参考块。
视频编码器20接着可计算当前块的残余块,例如以产生变换单元(TU)(160)。为了计算残余块,视频编码器20可计算原始的未经译码的块与当前块的经预测块之间的差。视频编码器20可随后变换且量化残余块的系数(162)。接下来,视频编码器20可扫描残余块的经量化变换系数(164)。在扫描期间,或在扫描后,视频编码器20可对所述系数进行熵编码(166)。举例来说,视频编码器20可使用CAVLC或CABAC对系数进行编码。视频编码器20可随后输出块的经熵译码数据(168)。
以此方式,图4的方法表示一种方法的实例,所述方法包含由视频编码器对指示多层视频数据的第一层的第一图片的图片次序计数(POC)值的POC复位的数据进行编码,其中所述第一图片包含在存取单元中。图4的实例方法还包含基于指示第一图片的POC 值的POC复位的数据且在对第一图片进行解码之前,递减存储到经解码图片缓冲器 (DPB)的按译码次序在所述第一图片之前的包含多层视频数据的第二层的至少一个图片的全部图片的POC值。
图5是说明根据本发明的技术的用于对指示切片的POC复位周期的数据进行解码的实例方法的流程图。另外,图4的方法包含编码当前块。当前块可包括当前CU或当前CU的一部分。尽管关于视频解码器30(图1和3)进行描述,但应理解,其它装置可经配置以执行与图5的方法类似的方法。
初始地,视频解码器30对指示POC复位的数据进行解码(200)。在一些实例中,如本文中所描述,指示POC复位的数据可为包含在当前切片的切片片段标头中的POC复位识别符。在此些实例中,视频解码器30可进一步对POC复位类型指示符进行解码。图5的方法是基于POC复位周期识别符指示当前切片是新POC复位周期的一部分的假定。视频解码器30可进一步确定当前图片是特定存取单元中的第一图片(例如,特定存取单元的全部图片当中具有最低层识别符的图片)。
视频解码器30还可递减存储到DPB的全部图片的POC值(202)。举例来说,根据本发明的方面,视频解码器30可递减DPB的全部子DPB中的图片的POC值。在一些实例中,视频解码器30可在对当前切片的切片标头进行解码(例如,如在步骤200中执行)之后但在对第一切片的视频数据进行解码之前递减POC值,如下所述。视频解码器 30可将DPB中的图片的POC值递减相同的递减值。
视频解码器30接着例如从切片片段标头和/或参数集(例如PPS或SPS)解码将包含于参考图片列表中的参考图片的POC值(204)。视频解码器30接着形成参考图片列表(206)。
接下来,视频解码器30对当前块的运动信息进行解码(208)。所述运动信息可包含(例如)参考图片列表识别符和指向参考图片列表中的参考索引。视频解码器30接着例如使用帧间预测模式计算当前块的经预测块来预测当前块(200)。更明确地说,视频解码器 30使用参考图片列表识别符来识别将使用哪一参考图片列表,且使用参考索引来识别参考图片列表中的参考索引。视频解码器30接着解码当前块的运动向量,且识别所识别参考图片中的参考块。
视频解码器30还可接收当前块的经熵译码数据,例如对应于当前块的残余块的系数的经熵译码数据(212)。视频解码器30可对经熵译码数据进行熵解码以再生残余块的系数(214)。视频解码器30可接着逆扫描经再生系数(216)以产生经量化变换系数块。就是说,使用逆扫描,视频解码器30将一维向量转换为二维矩阵。视频解码器30接着可逆量化且逆变换所述系数以产生残余块(218)。视频解码器30可最终通过组合经预测块与残余块来对当前块进行解码(220)。
以此方式,图5的方法表示一种方法的实例,所述方法包含对指示多层视频数据的第一层的第一图片的图片次序计数(POC)值的POC复位的数据进行解码,其中所述第一图片包含在存取单元中。图5的实例方法还包含基于指示第一图片的POC值的POC复位的数据且在对第一图片进行解码之前,递减存储到经解码图片缓冲器(DPB)的按译码次序在所述第一图片之前的包含多层视频数据的第二层的至少一个图片的全部图片的 POC值。
应认识到,取决于实例,本文中所描述的技术中的任一者的某些动作或事件可用不同顺序执行、可添加、合并或全部省略(例如,实践所述技术并不需要所有的所描述动作或事件)。此外,在某些实例中,可例如通过多线程处理、中断处理或多个处理器同时而非依序执行动作或事件。
在一或多个实例中,所描述的功能可以在硬件、软件、固件或其任何组合中实施。如果以软件实施,那么所述功能可以作为一或多个指令或代码在计算机可读媒体上存储或传输,并且由基于硬件的处理单元来执行。计算机可读媒体可包含计算机可读存储媒体,其对应于有形媒体,例如数据存储媒体,或包括任何促进将计算机程序从一处传送到另一处的媒体(例如,根据通信协议)的通信媒体。以此方式,计算机可读媒体大体上可对应于(1)有形计算机可读存储媒体,其为非暂时性的,或(2)通信媒体,例如信号或载波。数据存储媒体可为可由一或多个计算机或者一或多个处理器存取以检索用于实施本发明中描述的技术的指令、代码及/或数据结构的任何可用媒体。计算机程序产品可以包含计算机可读媒体。
借助于实例而非限制,此类计算机可读存储媒体可包括RAM、ROM、EEPROM、 CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁性存储装置、快闪存储器或可以用来存储指令或数据结构的形式的所要程序代码并且可以由计算机存取的任何其它媒体。并且,可恰当地将任何连接称作计算机可读媒体。举例来说,如果使用同轴缆线、光纤缆线、双绞线、数字订户线(DSL)或例如红外线、无线电和微波等无线技术从网站、服务器或其它远程源传输指令,那么同轴缆线、光纤缆线、双绞线、DSL或例如红外线、无线电和微波等无线技术包含在媒体的定义中。然而,应理解,所述计算机可读存储媒体和数据存储媒体并不包含连接、载波、信号或其它暂时性媒体,而是实际上针对非暂时性的有形存储媒体。如本文中所使用,磁盘和光盘包含压缩光盘(CD)、激光光盘、光学光盘、数字多功能光盘(DVD)、软性磁盘和蓝光光盘,其中磁盘通常以磁性方式再现数据,而光盘利用激光以光学方式再现数据。以上各项的组合也应包含在计算机可读媒体的范围内。
指令可以由一或多个处理器执行,所述一或多个处理器例如一或多个数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、或其它等效的集成或离散逻辑电路。因此,如本文中所使用的术语“处理器”可指代上述结构或适合于实施本文中所描述的技术的任何其它结构中的任一者。另外,在一些方面中,本文中所描述的功能性可以在经配置用于编码和解码的专用硬件和/或软件模块内提供,或者并入在组合编解码器中。并且,可将所述技术完全实施于一或多个电路或逻辑元件中。
本发明的技术可在广泛多种装置或设备中实施,所述装置或设备包含无线手持机、集成电路(IC)或一组IC(例如,芯片组)。本发明中描述各种组件、模块或单元是为了强调经配置以执行所揭示的技术的装置的功能方面,但未必需要通过不同硬件单元实现。实际上,如上文所描述,各种单元可以结合合适的软件及/或固件组合在编解码器硬件单元中,或者通过互操作硬件单元的集合来提供,所述硬件单元包含如上文所描述的一或多个处理器。
描述了各种实例。这些和其它实例属于所附权利要求书的范围内。

Claims (41)

1.一种对视频数据进行解码的方法,所述方法包括:
对指示多层视频数据的第一层的第一图片的图片次序计数POC值的POC复位的数据进行解码,其中所述第一图片包含在存取单元中;以及
基于指示所述第一图片的所述POC值的所述POC复位的所述数据且在对所述第一图片进行解码之前,递减存储到经解码图片缓冲器DPB的按译码次序在所述第一图片之前的包含所述多层视频数据的第二层的至少一个图片的全部图片的POC值。
2.根据权利要求1所述的方法,其中递减存储到所述DPB的在时间上在所述第一图片之前的全部图片的所述POC值包括在所述存取单元的解码期间递减所述POC值仅一次。
3.根据权利要求1所述的方法,其中递减所述POC值包括在对所述第一图片的视频数据的初始切片的切片标头进行解码之后递减所述POC值。
4.根据权利要求1所述的方法,其中对指示所述POC复位的所述数据进行解码包括对表示视频数据的所述第一图片的切片的POC复位索引的数据进行解码。
5.根据权利要求1所述的方法,其中指示所述POC复位的所述数据包括指示POC复位周期的数据,且其中所述存取单元是所述POC复位周期的按解码次序的第一存取单元。
6.根据权利要求1所述的方法,其中所述第一图片是与存在于所述存取单元中的最低层识别符相关联的图片,且其中递减所述POC值包括使用共同POC递减值递减所述POC值。
7.根据权利要求6所述的方法,其进一步包括对指示用于递减所述POC值的POC递减值的变量DeltaPocVal语法元素进行解码。
8.根据权利要求1所述的方法,其中所述存取单元包含所述第一图片和至少一个额外图片,其中指示所述POC复位的所述数据包括POC复位索引,所述方法进一步包括对包含所述存取单元的所述至少一个第二图片的所述存取单元的全部其它图片的所述同一POC复位索引进行解码。
9.根据权利要求1所述的方法,其中递减所述POC值包括以下各项中的一者:递减所述POC值的全部位,递减所述POC值的最高有效位,或递减所述POC值的最低有效位。
10.根据权利要求1所述的方法,其中指示所述POC复位值的所述数据与适用于所述多层视频数据的全部层的POC复位周期相关联。
11.一种对视频数据进行编码的方法,所述方法包括:
对指示多层视频数据的第一层的第一图片的图片次序计数POC值的POC复位的数据进行编码,其中所述第一图片包含在存取单元中;以及
基于指示所述第一图片的所述POC值的所述POC复位的所述数据且在由视频解码器对所述第一图片进行解码之前,递减存储到经解码图片缓冲器DPB的按译码次序在所述第一图片之前的包含所述多层视频数据的第二层的至少一个图片的全部图片的POC值。
12.根据权利要求11所述的方法,其中递减存储到所述DPB的在时间上在所述第一图片之前的全部图片的所述POC值包括在所述存取单元的编码期间递减所述POC值仅一次。
13.根据权利要求11所述的方法,其中递减所述POC值包括在对所述第一图片的视频数据的初始切片的切片标头进行编码之后递减所述POC值。
14.根据权利要求11所述的方法,其中对指示所述POC复位的所述数据进行编码包括对表示视频数据的所述第一图片的切片的POC复位索引的数据进行编码。
15.根据权利要求11所述的方法,其中指示所述POC复位的所述数据包括指示POC复位周期的数据,且其中所述存取单元是所述POC复位周期的按解码次序的第一存取单元。
16.根据权利要求11所述的方法,其中所述第一图片是与存在于所述存取单元中的最低层识别符相关联的图片,且其中递减所述POC值包括使用同一POC递减值递减所述POC值。
17.根据权利要求16所述的方法,其进一步包括对指示用于递减所述POC值的所述POC递减值的变量DeltaPocVal语法元素进行编码。
18.根据权利要求11所述的方法,其中所述存取单元包含所述第一图片和至少一个第二图片,其中指示所述POC复位的所述数据包括POC复位索引,且所述方法进一步包括对包含所述存取单元的所述至少一个第二图片的所述存取单元的全部其它图片的所述同一POC复位索引进行编码。
19.根据权利要求11所述的方法,其中递减所述POC值包括以下各项中的一者:递减所述POC值的全部位,递减所述POC值的最高有效位,或递减所述POC值的最低有效位。
20.根据权利要求11所述的方法,其中指示所述POC复位值的所述数据与适用于所述多层视频数据的全部层的POC复位周期相关联。
21.一种用于对视频数据进行译码的装置,所述装置包括:
存储器,其包括经配置以存储多层视频数据的经解码图片缓冲器DPB;以及
视频译码器,其经配置以:
对指示所述多层视频数据的第一层的第一图片的图片次序计数POC值的POC复位的数据进行译码,其中所述第一图片包含在存取单元中;以及
基于指示所述第一图片的所述POC值的所述POC复位的所述数据且在对所述第一图片进行解码之前,递减存储到所述DPB的按译码次序在所述第一图片之前的包含所述多层视频数据的第二层的至少一个图片的全部图片的POC值。
22.根据权利要求21所述的装置,其中为了递减存储到所述DPB的在时间上在所述第一图片之前的全部图片的所述POC值,所述视频译码器经配置以在所述存取单元的译码期间递减所述POC值仅一次。
23.根据权利要求21所述的装置,其中为了递减所述POC值,所述视频译码器经配置以在对所述第一图片的视频数据的初始切片的切片标头进行编码之后递减所述POC值。
24.根据权利要求21所述的装置,其中为了对指示所述POC复位的所述数据进行译码,所述视频译码器经配置以对表示视频数据的所述第一图片的切片的POC复位索引的数据进行译码。
25.根据权利要求21所述的装置,其中指示所述POC复位的所述数据包括指示POC复位周期的数据,且其中所述存取单元是所述POC复位周期的按解码次序的第一存取单元。
26.根据权利要求21所述的装置,其中所述第一图片是与存在于所述存取单元中的最低层识别符相关联的图片,且其中为了递减所述POC值,所述视频译码器经配置以使用同一POC递减值递减所述POC值。
27.根据权利要求26所述的装置,其中所述视频译码器进一步经配置以对指示用于递减所述POC值的所述POC递减值的变量DeltaPocVal语法元素进行译码。
28.根据权利要求21所述的装置,其中所述存取单元包含所述第一图片和至少一个第二图片,其中指示所述POC复位的所述数据包括POC复位索引,且其中所述视频译码器进一步经配置以对包含所述存取单元的所述至少一个第二图片的所述存取单元的全部其它图片的所述同一POC复位索引进行译码。
29.根据权利要求21所述的装置,其中递减所述POC值包括以下各项中的一者:递减所述POC值的全部位,递减所述POC值的最高有效位,或递减所述POC值的最低有效位。
30.根据权利要求21所述的装置,其中指示所述POC复位值的所述数据与适用于所述多层视频数据的全部层的POC复位周期相关联。
31.根据权利要求21所述的装置,其中所述装置包括以下各者中的至少一者:
集成电路;
微处理器;或
无线通信装置。
32.一种用于对视频数据进行译码的装置,所述装置包括:
用于对指示多层视频数据的第一层的第一图片的图片次序计数POC值的POC复位的数据进行译码的装置,其中所述第一图片包含在存取单元中;以及
用于基于指示所述第一图片的所述POC值的所述POC复位的所述数据且在对所述第一图片进行解码之前递减存储到DPB的按译码次序在所述第一图片之前的包含所述多层视频数据的第二层的至少一个图片的全部图片的POC值的装置。
33.根据权利要求32所述的装置,其中所述用于递减存储到所述DPB的在时间上在所述第一图片之前的全部图片的所述POC值的装置包括用于在所述存取单元的译码期间递减所述POC值仅一次的装置。
34.根据权利要求32所述的装置,其中所述用于递减所述POC值的装置包括在对所述第一图片的视频数据的初始切片的切片标头进行编码之后递减所述POC值。
35.根据权利要求32所述的装置,其中所述用于对指示所述POC复位的所述数据进行译码的装置包括用于对表示视频数据的所述第一图片的切片的POC复位索引的数据进行译码的装置。
36.根据权利要求32所述的装置,其中指示所述POC复位的所述数据包括指示POC复位周期的数据,且其中所述存取单元是所述POC复位周期的按解码次序的第一存取单元。
37.一种非暂时性计算机可读存储媒体,具有存储于其上的指令,所述指令当执行时致使用于对视频数据进行译码的装置的处理器进行以下操作:
对指示所述多层视频数据的第一层的第一图片的图片次序计数POC值的POC复位的数据进行译码,其中所述第一图片包含在存取单元中;以及
基于指示所述第一图片的所述POC值的所述POC复位的所述数据且在对所述第一图片进行解码之前,递减存储到DPB的按译码次序在所述第一图片之前的包含所述多层视频数据的第二层的至少一个图片的全部图片的POC值。
38.根据权利要求37所述的非暂时性计算机可读存储媒体,其中为了递减存储到所述DPB的在时间上在所述第一图片之前的全部图片的所述POC值,所述指令致使所述处理器在所述存取单元的译码期间递减所述POC值仅一次。
39.根据权利要求37所述的非暂时性计算机可读存储媒体,其中为了递减所述POC值,所述指令致使所述处理器在对所述第一图片的视频数据的初始切片的切片标头进行编码之后递减所述POC值。
40.根据权利要求37所述的非暂时性计算机可读存储媒体,其中为了对指示所述POC复位的所述数据进行译码,所述指令致使所述处理器对表示视频数据的所述第一图片的切片的POC复位索引的数据进行译码。
41.根据权利要求37所述的非暂时性计算机可读存储媒体,其中指示所述POC复位的所述数据包括指示POC复位周期的数据,且其中所述存取单元是所述POC复位周期的按解码次序的第一存取单元。
CN201480063898.5A 2013-11-25 2014-11-25 用于多层视频的编解码方法、译码装置 Active CN105765977B (zh)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201361908671P 2013-11-25 2013-11-25
US61/908,671 2013-11-25
US201361909347P 2013-11-26 2013-11-26
US61/909,347 2013-11-26
US14/552,129 US9674544B2 (en) 2013-11-25 2014-11-24 POC value design for multi-layer video coding
US14/552,129 2014-11-24
PCT/US2014/067363 WO2015077764A1 (en) 2013-11-25 2014-11-25 Poc value design for multi-layer video coding

Publications (2)

Publication Number Publication Date
CN105765977A CN105765977A (zh) 2016-07-13
CN105765977B true CN105765977B (zh) 2019-04-26

Family

ID=52101613

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201480063898.5A Active CN105765977B (zh) 2013-11-25 2014-11-25 用于多层视频的编解码方法、译码装置

Country Status (8)

Country Link
US (1) US9674544B2 (zh)
EP (1) EP3075157B1 (zh)
JP (1) JP6479798B2 (zh)
KR (1) KR101962523B1 (zh)
CN (1) CN105765977B (zh)
BR (1) BR112016011818B1 (zh)
MX (1) MX353211B (zh)
WO (1) WO2015077764A1 (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MX348561B (es) * 2013-07-12 2017-06-20 Sony Corp Aparato y método para la codificación de imágenes.
US9654774B2 (en) 2013-12-12 2017-05-16 Qualcomm Incorporated POC value design for multi-layer video coding
CN113206826B (zh) * 2018-09-28 2022-10-04 华为技术有限公司 传输媒体数据的方法、客户端和服务器
CN112118454B (zh) * 2019-06-20 2023-02-24 腾讯美国有限责任公司 视频解码方法、设备和计算机可读存储介质
US11356698B2 (en) * 2019-12-30 2022-06-07 Tencent America LLC Method for parameter set reference constraints in coded video stream

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013048311A1 (en) * 2011-09-27 2013-04-04 Telefonaktiebolaget L M Ericsson (Publ) Decoders and methods thereof for managing pictures in video decoding process

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
PL2008460T3 (pl) * 2006-03-30 2017-10-31 Lg Electronics Inc Sposób i urządzenie do dekodowania/kodowania sygnału wideo
US20140254681A1 (en) 2013-03-08 2014-09-11 Nokia Corporation Apparatus, a method and a computer program for video coding and decoding
US9532052B2 (en) 2013-04-08 2016-12-27 Qualcomm Incorporated Cross-layer POC alignment for multi-layer bitstreams that may include non-aligned IRAP pictures
EP3056008A4 (en) * 2013-10-10 2017-03-22 Sharp Kabushiki Kaisha Alignment of picture order count
EP3058747B1 (en) 2013-10-15 2019-11-20 Nokia Technologies Oy Scalable video encoding and decoding using syntax element
US9628820B2 (en) 2013-11-19 2017-04-18 Qualcomm Incorporated POC value design for multi-layer video coding
US9654774B2 (en) 2013-12-12 2017-05-16 Qualcomm Incorporated POC value design for multi-layer video coding

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013048311A1 (en) * 2011-09-27 2013-04-04 Telefonaktiebolaget L M Ericsson (Publ) Decoders and methods thereof for managing pictures in video decoding process

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
MV-HEVC/SHVC HLS: On picture order count;Adarsh K. Ramasubramonian et al;《Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11 15th Meeting: Geneva, Joint Collaborative Team on 3D Video Coding Extensions of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11 6th Meeting: Geneva》;20131121;摘要,章节1、2、3.1.2-3.1.4,附图3

Also Published As

Publication number Publication date
EP3075157B1 (en) 2020-01-22
CN105765977A (zh) 2016-07-13
KR20160085879A (ko) 2016-07-18
US20150146787A1 (en) 2015-05-28
KR101962523B1 (ko) 2019-03-26
MX2016006703A (es) 2016-09-09
WO2015077764A1 (en) 2015-05-28
BR112016011818A2 (pt) 2017-08-08
JP6479798B2 (ja) 2019-03-06
BR112016011818B1 (pt) 2023-05-16
US9674544B2 (en) 2017-06-06
MX353211B (es) 2018-01-08
JP2017500789A (ja) 2017-01-05
EP3075157A1 (en) 2016-10-05

Similar Documents

Publication Publication Date Title
CN105794211B (zh) 一种编解码视频数据的方法、装置及可读存储媒体
US10404990B2 (en) Temporal motion vector prediction (TMVP) indication in multi-layer codecs
CN106464922B (zh) 处理视频数据的方法和设备及计算机可读介质
CN105637882B (zh) 用于视频信息的可缩放译码的装置和方法
CN105052152B (zh) 用于视频译码及压缩的设备、方法及非暂时性计算机可读媒体
CN106464917B (zh) 用信号表示用于位流分区的hrd参数
CN105122812B (zh) 用于三维(3d)视频译码的高级合并模式
CN104823449B (zh) 在视频译码中用信号表示关注区和逐渐解码刷新
CN104904222B (zh) 对视频译码中的视频时序的图片次序计数与时序信息关系的信令
CN105191315B (zh) 一种用于对视频信息进行译码的方法和设备
CN104365106B (zh) 发信用于视频译码的长期参考图片的数据
CN105830447B (zh) 用于视频信息的可缩放译码的装置及方法
CN104221381B (zh) 用于视频译码的波前并行处理的方法、装置及计算机可读存储媒体
CN105122814B (zh) 可包含未对准irap图片的多层位流的跨层poc对准
CN104584557B (zh) 对视频数据进行编码、解码的方法、装置以及计算机可读介质
CN110313182A (zh) 译码用于运动受约束图块集的识别符
CN104885459B (zh) 用于多层译码的多分辨率经解码图片缓冲器管理
CN104956676B (zh) 层间语法预测控制
CN105580374B (zh) 一种对多层视频数据进行编解码的方法、视频解码设备及存储媒体
CN105379272B (zh) 在vps中用信号通知位速率信息及图片速率信息
CN104685890B (zh) 用于处理和编码多层视频数据的方法、装置和设备
CN104471942A (zh) 重新使用参数集用于视频译码
CN105765977B (zh) 用于多层视频的编解码方法、译码装置
CN107079170A (zh) 用于多层视频译码的poc值设计
CN108141586A (zh) 经更新的视频区域的信令

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant