CN104641637A - 具有改善随机存取点图片行为的视频译码 - Google Patents

具有改善随机存取点图片行为的视频译码 Download PDF

Info

Publication number
CN104641637A
CN104641637A CN201380048461.XA CN201380048461A CN104641637A CN 104641637 A CN104641637 A CN 104641637A CN 201380048461 A CN201380048461 A CN 201380048461A CN 104641637 A CN104641637 A CN 104641637A
Authority
CN
China
Prior art keywords
picture
bla
cra
cpb
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201380048461.XA
Other languages
English (en)
Other versions
CN104641637B (zh
Inventor
王益魁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of CN104641637A publication Critical patent/CN104641637A/zh
Application granted granted Critical
Publication of CN104641637B publication Critical patent/CN104641637B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • H04N19/197Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters including determination of the initial value of an encoding parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters

Abstract

本发明描述用于选择经译码图片缓冲器CPB参数的技术,所述经译码图片缓冲器CPB参数用以定义视频译码装置的用于视频位流中的清洁随机存取CRA图片及断链存取BLA图片的CPB。视频译码装置接收包含一或多个CRA图片或BLA图片的位流,且还接收消息,所述消息指示是否针对所述CRA图片或BLA图片中的至少一者使用CPB参数的替代性集合。所述消息可接收自外部装置,例如,包含于流式处理服务器或网络实体中的处理装置。所述视频译码装置基于所述接收到的消息设定经定义以指示用于所述图片中的给定一者的CPB参数的所述集合的变量,且基于针对所述图片中的所述给定一者的所述变量选择用于所述图片的CPB参数的所述集合。

Description

具有改善随机存取点图片行为的视频译码
本申请案主张2012年9月20日申请的第61/703,695号美国临时申请案的权利,所述申请案的全部内容以引用的方式并入本文中。
技术领域
本发明通常涉及处理视频数据,且更具体来说涉及用于视频数据中的随机存取图片。
背景技术
数字视频能力可并入至广泛范围的装置中,所述装置包含数字电视、数字直播系统、无线广播系统、个人数字助理(PDA)、膝上型或台式计算机、平板型计算机、电子书阅读器、数字摄像机、数字记录装置、数字媒体播放器、视频游戏装置、视频游戏主机、蜂窝式或卫星无线电电话、所谓的“智能型手机”、视频电传会议装置、视频流装置,及其类似者。数字视频装置实施视频译码技术,例如在由MPEG-2、MPEG-4、ITU-TH.263、ITU-T H.264/MPEG-4第10部分“高级视频译码(AVC)”所定义之标准、目前正在发展之高效视频译码(HEVC)标准及此些标准的扩展中所描述的视频译码技术。视频装置可通过实施此些视频译码技术来更有效地发射、接收、编码、解码及/或存储数字视频信息。
视频译码技术包含空间(图片内)预测及/或时间(图片间)预测以减少或移除视频序列中固有的冗余。对于基于块的视频译码,可将视频切片(例如,视频帧或视频帧的一部分)分割成视频块(其也可被称作树型块)、译码单元(CU)及/或译码节点。使用相对于同一图片中的相邻块中的参考样本的空间预测来编码图片的帧内译码(I)切片中的视频块。图片的帧间译码(P或B)切片中的视频块可使用相对于同一图片中的相邻块中的参考样本的空间预测或相对于其它参考图片中的参考样本的时间预测。图片可被称作帧,且参考图片可被称作参考帧。
空间预测或时间预测导致待译码块的预测性块。残余数据表示待译码的原始块与预测性块之间的像素差。根据指向形成预测性块的参考样本的块的运动向量及指示经译码块与预测性块之间的差异的残余数据来编码帧间译码块。根据帧内译码模式及残余数据来编码帧内译码块。为了进行进一步压缩,可将残余数据自像素域变换至变换域,从而引起残余变换系数,可接着量化残余变换系数。可扫描最初布置成二维数组的经量化的变换系数以便产生变换系数的一维向量,且可应用熵译码以实现甚至更多压缩。
发明内容
一般来说,本发明描述在视频译码中提供对包含清洁随机存取(CRA)图片及断链存取(BLA)图片的随机存取点(RAP)图片的改善的支持的技术。在一些状况下,RAP图片可替代性地被称作帧内随机存取点(IRAP)图片。详细地说,本发明描述用于选择经译码图片缓冲器(CPB)参数的技术,所述经译码图片缓冲器(CPB)参数用以定义视频译码装置的针对视频位流中的CRA图片或BLA图片的CPB。CPB参数的默认集合或是替代性集合可用以定义CPB。如果在应选择替代性集合时使用了默认集合,则CPB可溢出。
在一个实例中,本发明是针对一种处理视频数据的方法,所述方法包括接收表示多个图片的位流,所述多个图片包含CRA图片或BLA图片中的一或多者;及接收消息,所述消息指示是否针对所述CRA图片或所述BLA图片中的至少一者使用CPB参数的替代性集合。所述方法进一步包括基于所述接收到的消息设定经定义以指示用于所述CRA图片或所述BLA图片中的所述一者的CPB参数的所述集合的变量;及基于针对所述图片的所述变量选择用于所述CRA图片或所述BLA图片中的所述一者的CPB参数的所述集合。
在另一实例中,本发明是针对一种用于处理视频数据的视频译码装置,所述装置包括经配置以存储视频数据的CPB;及一或多个处理器,所述一或多个处理器经配置以接收表示多个图片的位流,所述多个图片包含CRA图片或BLA图片中的一或多者;接收消息,所述消息指示是否针对所述CRA图片或所述BLA图片中的至少一者使用CPB参数的替代性集合;基于所述接收到的消息设定经定义以指示用于所述CRA图片或所述BLA图片中的所述一者的CPB参数的所述集合的变量;及基于针对所述图片的所述变量选择用于所述CRA图片或所述BLA图片中的所述一者的CPB参数的所述集合。
在其它实例中,本发明是针对一种用于处理视频数据的视频译码装置,所述装置包括用于接收表示多个图片的位流的装置,所述多个图片包含CRA图片或BLA图片中的一或多者;用于接收消息的装置,所述消息指示是否针对所述CRA图片或所述BLA图片中的至少一者使用CPB参数的替代性集合;用于基于所述接收到的消息设定经定义以指示用于所述CRA图片或所述BLA图片中的所述一者的CPB参数的所述集合的变量的装置;及用于基于针对所述图片的所述变量选择用于所述CRA图片或所述BLA图片中的所述一者的CPB参数的所述集合的装置。
在额外实例中,本发明是针对一种包括用于处理视频数据的指令的计算机可读媒体,所述指令在执行时使得一或多个处理器接收表示多个图片的位流,所述多个图片包含CRA图片或BLA图片中的一或多者;接收消息,所述消息指示是否针对所述CRA图片或所述BLA图片中的至少一者使用CPB参数的替代性集合;基于所述接收到的消息设定经定义以指示用于所述CRA图片或所述BLA图片中的所述一者的CPB参数的所述集合的变量;及基于针对所述图片的所述变量选择用于所述CRA图片或所述BLA图片中的所述一者的CPB参数的所述集合。
一或多个实例的细节阐述于以下随附图式及描述内容中。其它特征、目标及优点将自所述描述内容及所述图式以及自权利要求书显而易见。
附图说明
图1是说明可利用本发明中所描述的技术的实例视频编码及解码系统的框图。
图2是说明可实施本发明中所描述的技术的实例视频编码器的框图。
图3是说明可实施本发明中所描述的技术的实例视频解码器的框图。
图4是说明经配置以根据假想参考解码器(HRD)操作的实例目的地装置的框图。
图5是说明基于变量选择经译码图片缓冲器(CPB)参数的集合的实例操作的流程图,所述变量指示用于位流中的特定随机存取点(RAP)图片的CPB参数的集合。
图6是说明基于变量设定特定RAP图片的网络层抽象(NAL)单元类型的实例操作的流程图,所述变量指示用于所述图片的CPB参数的集合。
图7是说明基于针对图片的NAL单元类型及变量选择用于特定RAP图片的CPB参数的集合的实例操作的流程图,所述变量指示用于所述图片的CPB参数的集合。
图8是说明基于变量选择CPB参数的集合的实例操作的流程图,所述变量经定义以指示针对位流中的特定RAP图片的网络层抽象(NAL)单元类型。
图9是说明形成网络的部分的装置的实例集合的框图。
具体实施方式
本发明描述在视频译码中提供对包含清洁随机存取(CRA)图片及断链存取(BLA)图片的随机存取点(RAP)图片的改善的支持的技术。在一些状况下,RAP图片可替代性地被称作帧内随机存取点(IRAP)图片。详细地说,本发明描述用于选择经译码图片缓冲器(CPB)参数的技术,所述经译码图片缓冲器(CPB)参数用以定义视频译码装置的用于视频位流中的CRA图片及BLA图片的CPB。假想参考解码器(HRD)依赖于包含缓冲周期信息及图片时序信息的HRD参数。缓冲周期信息定义CPB参数,即初始CPB移除延迟及初始CPB移除延迟偏移。CPB参数的默认集合或是替代性集合可用以基于用以初始化HRD的图片的类型来定义CPB。如果在应选择替代性集合时使用默认集合,则视频译码装置中符合HRD的CPB可溢出。
根据所述技术,视频译码装置接收表示多个图片的位流,所述多个图片包含一或多个CRA图片或BLA图片;且还接收消息,所述消息指示是否针对CRA图片或BLA图片中的每一者使用CPB参数的替代性集合。所述消息可接收自外部装置,例如,包含于流式处理服务器中的处理装置、中间网络元件或另一网络实体。
视频译码装置基于接收到的消息设定变量,所述变量经定义以指示用于CRA图片或BLA图片中的给定一者的CPB参数的集合。视频译码装置接着基于针对CRA图片或BLA图片中的所述给定一者的变量来选择用于图片的CPB参数的集合。将CPB参数的所选择集合应用于包含于视频编码器或视频解码器中的CPB以确保CPB在视频译码期间将不溢出。在一些状况下,视频译码装置可设定针对CRA图片或BLA图片中的给定一者的网络抽象层(NAL)单元类型。视频译码装置可将针对图片的NAL单元类型设定为所发信的,或视频译码装置可基于针对图片的变量来设定NAL单元类型。视频译码装置可基于针对图片的NAL单元类型及变量来选择用于给定图片的CPB参数的集合。
图1是说明可利用本发明中所描述的技术的实例视频编码及解码系统10的框图。如图1中所展示,系统10包含源装置12,所述源装置12提供待由目的地装置14在稍后时间解码的经编码视频数据。详细地说,源装置12经由计算机可读媒体16将视频数据提供至目的地装置14。源装置12及目的地装置14可包括广泛范围的装置中的任一者,所述装置包含台式计算机、笔记本(即,膝上型)计算机、平板计算机、机顶盒、例如所谓“智能型”手机的电话手机、所谓“智能型”板、电视、摄像机、显示装置、数字媒体播放器、数字游戏主机、视频流装置,或其类似者。在一些状况下,源装置12及目的地装置14可经配备以进行无线通信。
目的地装置14可接收待经由计算机可读媒体16解码的经编码视频数据。计算机可读媒体16可包括能够将经编码视频数据自源装置12移动至目的地装置14的任何类型的媒体或装置。在一个实例中,计算机可读媒体16可包括通信媒体以使得源装置12能够将经编码视频数据实时地直接发射至目的地装置14。可根据通信标准(例如,无线通信协议)调制经编码视频数据,且将经编码视频数据发射至目的地装置14。通信媒体可包括任何无线或有线通信媒体,例如,射频(RF)频谱或一或多个实体传输线。通信媒体可形成基于数据包之网络(例如,局域网、广域网或例如因特网的全球网络)的部分。通信媒体可包含路由器、交换机、基站,或可用以促进自源装置12至目的地装置14的通信的任何其它设备。
在一些实例中,可将经编码数据自输出接口22输出至存储装置。类似地,可通过输入接口自存储装置存取经编码数据。存储装置可包含多种分布式或本地存取式数据存储媒体中的任一者,例如,硬盘驱动器、蓝光光盘、DVD、CD-ROM、闪存、易失性或非易失性存储器,或用于存储经编码视频数据的任何其它合适的数字存储媒体。在其它实例中,存储装置可对应于文件服务器或可存储由源装置12产生的经编码视频的另一中间存储装置。目的地装置14可经由流式处理或下载自存储装置存取所存储的视频数据。文件服务器可为能够存储经编码视频数据且将所述经编码视频数据发射至目的地装置14的任何类型的服务器。实例文件服务器包含网页服务器(例如,用于网站)、FTP服务器、网络连接存储(NAS)装置或本地磁盘驱动器。目的地装置14可经由任何标准数据连接(包含因特网连接)而存取经编码的视频数据。此数据连接可包含适合于存取存储于文件服务器上的经编码视频数据的无线信道(例如,Wi-Fi连接)、有线连接(例如,DSL、电缆调制解调器等),或两者的结合。经编码视频数据自存储装置之发射可为流式发射、下载发射,或其组合。
本发明的技术未必限于无线应用或设定。所述技术可应用于支持多种多媒体应用中的任一者的视频译码,所述应用例如:空中电视广播、有线电视发射、卫星电视发射、例如HTTP动态自适应性流式处理(DASH)之因特网流式视频发射、经编码至数据存储媒体上的数字视频、存储于数据存储媒体上的数字视频的解码,或其它应用。在一些实例中,系统10可经配置以支持单向或双向视频发射以支持例如视频流式处理、视频播放、视频广播及/或视频电话的应用。
在图1的实例中,源装置12包含视频源18、视频编码器20及输出接口22。目的地装置14包含输入接口28、视频解码器30及显示装置32。在其它实例中,源装置及目的地装置可包含其它组件或布置。举例来说,源装置12可自外部视频源18(例如,外部摄像机)接收视频数据。同样地,目的地装置14可与外部显示装置接口连接,而非包含集成式显示装置。
图1的所说明的系统10仅为一个实例。本发明的技术可由任何数字视频编码及/或解码装置来执行。尽管通常所述技术由视频编码装置来执行,但所述技术也可由通常称作“编解码器”的视频编码器/解码器来执行。此外,也可通过视频预处理器来执行本发明的技术。源装置12及目的地装置14仅为此些译码装置的实例,在所述译码装置中,源装置12产生用于发射至目的地装置14之经译码视频数据。在一些实例中,装置12、14可以实质上对称的方式进行操作,使得装置12、14中的每一者包含视频编码及解码组件。因此,系统10可支持视频装置12、14之间的单向或双向视频发射,例如,用于视频流式处理、视频播放、视频广播或视频电话。
源装置12的视频源18可包含例如视频摄像机的视频俘获装置、含有先前俘获的视频的视频存档,及/或用以自视频内容提供商接收视频的视频馈入接口。作为另一替代例,视频源18可产生基于计算机图形的数据作为源视频,或产生实况视频、经存档视频及计算机产生的视频的组合。在一些情况下,如果视频源18为视频摄像机,则源装置12及目的地装置14可形成所谓的摄像机电话或视频电话。然而,如上文所提及,本发明中所描述的技术可通常适用于视频译码,且可应用于无线及/或有线应用。在每一状况下,经俘获、预先俘获或计算机产生的视频可由视频编码器20来编码。经编码视频信息可接着由输出接口22输出于计算机可读媒体16上。
计算机可读媒体16可包含暂时性媒体,例如,无线广播或有线网络发射;或存储媒体(即,非暂时性存储媒体),例如,硬盘、闪存驱动器、光盘、数字视频光盘、蓝光光盘或其它计算机可读媒体。在一些实例中,网络服务器(图中未展示)可自源装置12接收经编码视频数据,且(例如)经由网络发射将所述经编码的视频数据提供至目的地装置14。类似地,媒体生产设施(例如,光盘压印设施)的计算装置可自源装置12接收经编码视频数据且产生含有所述经编码视频数据的光盘。因此,在各种实例中,可将计算机可读媒体16理解成包含各种形式的一或多个计算机可读媒体。
目的地装置14的输入接口28自计算机可读媒体16接收信息。计算机可读媒体16的信息可包含由视频编码器20定义的也由视频解码器30使用的语法信息,所述语法信息包含描述块及其它经译码单元(例如,GOP)的特性及/或处理的语法元素。显示装置32向用户显示经解码视频数据,且可包括多种显示装置中的任一者,例如,阴极射线管(CRT)、液晶显示器(LCD)、等离子显示器、有机发光二极管(OLED)显示器或另一类型的显示装置。
视频编码器20及视频解码器30可根据例如目前在开发中的高效视频译码(HEVC)标准的视频译码标准而操作,且可符合HEVC测试模型(HM)。或者,视频编码器20及视频解码器30可根据例如或者被称作MPEG-4第10部分(高级视频译码(AVC))之ITU-TH.264标准的其它专属或工业标准或此些标准的扩展而操作。然而,本发明的技术不限于任何特定译码标准。视频译码标准的其它实例包含MPEG-2及ITU-T H.263。虽然未展示于图1中,但在一些方面中,视频编码器20及视频解码器30可各自与音频编码器及解码器集成,且可包含适当MUX-DEMUX单元或其它硬件及软件以处置共同数据流或独立数据流中的音频及视频两者的编码。如果适用,则MUX-DEMUX单元可符合ITUH.223多路复用器协议或例如用户数据报协议(UDP)的其它协议。
ITU-T H.264/MPEG-4(AVC)标准是由ITU-T视频译码专业团体(VCEG)连同ISO/IEC动画专业团体(MPEG)一起作为被称为联合视频团队(JVT)的集体伙伴关系的产物而制订的。在一些方面中,本发明中所描述的技术可应用于大体符合H.264标准的装置。H.264标准描述于由ITU-T研究团体在2005年3月发布之ITU-T推荐H.264(用于一般视听服务的高级视频译码)中,其在本文中可被称作H.264标准或H.264规范或H.264/AVC标准或规范。联合视频团队(JVT)继续致力于对H.264/MPEG-4AVC的扩展。
视频编码器20及视频解码器30可各自实施为多种合适编码器电路中的任一者,例如一或多个微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、软件、硬件、固件或其任何组合。当所述技术部分地以软件实施时,装置可将用于软件的指令存储于合适的非暂时性计算机可读媒体中,且在硬件中使用一或多个处理器来执行所述指令以执行本发明的技术。视频编码器20及视频解码器30中的每一者可包含于一或多个编码器或解码器中,其中任一者可集成为相应装置中的经组合编码器/解码器(编解码器(CODEC))的部分。
JCT-VC正致力于HEVC标准的开发。HEVC标准化努力是基于视频译码装置的被称作HEVC测试模型(HM)的演进模型。HM假设了视频译码装置相对于根据(例如)ITU-TH.264/AVC的现有装置的若干额外能力。举例来说,H.264提供九个帧内预测编码模式,而HM可提供多达三十三个帧内预测编码模式。
一般来说,HM的工作模型描述视频帧或图片可被划分成包含明度样本及色度样本两者的树型块或最大译码单元(LCU)的序列。位流内的语法数据可定义LCU的大小,LCU就像素的数目来说为最大译码单元。切片包含按译码次序的数个连续树型块。可将视频帧或图片分割成一或多个切片。可根据四叉树而将每一树型块分裂成若干译码单元(CU)。一般来说,四叉树数据结构对于每CU包含一个节点,其中根节点对应于树型块。如果将CU分裂成四个子CU,则对应于所述CU的节点包含四个叶节点,所述四个叶节点中的每一者对应于所述子CU中的一者。
所述四叉树数据结构中的每一节点可提供针对对应CU的语法数据。举例来说,四叉树中的节点可包含分裂旗标,从而指示是否将对应于所述节点的CU分裂成子CU。可递归地定义用于CU的语法元素,且用于CU的语法元素可视CU是否被分裂成子CU而定。如果CU未经进一步分裂,则其被称作叶CU。在本发明中,即使不存在原始叶CU的明显分裂,叶CU的四个子CU也会被称作叶CU。举例来说,如果16×16大小的CU未经进一步分裂,则四个8×8子CU也会被称作叶CU,尽管所述16×16CU从未经分裂。
除了CU不具有大小区别之外,CU具有类似于H.264标准之宏块的用途。举例来说,树型块可分裂成四个子节点(亦被称作子CU),且每一子节点又可为父节点并分裂成另外四个子节点。被称作四叉树的叶节点的最终的未分裂子节点包括一译码节点,所述译码节点亦被称作叶CU。与经译码位流相关联的语法数据可定义可分裂树型块的最大次数(其被称作最大CU深度),且还可定义所述译码节点的最小大小。因此,位流也可定义最小译码单元(SCU)。本发明使用术语“块”指代在HEVC的背景中的CU、PU或TU中的任一者,或在其它标准的背景中的类似数据结构(例如,在H.264/AVC中的宏块及其子块)。
CU包含译码节点及与所述译码节点相关联的预测单元(PU)及变换单元(TU)。CU的大小对应于译码节点的大小,且形状必须为正方形。CU的大小可在8×8像素直至具有最大64×64像素或大于64×64像素的树型块的大小的范围内。每一CU可含有一或多个PU及一或多个TU。与CU相关联的语法数据可描述(例如)CU至一或多个PU的分割。分割模式可视CU是经跳过或直接模式编码、经帧内预测模式编码或是经帧间预测模式编码而不同。PU可分割成非正方形的形状。与CU相关联的语法数据也可描述(例如)根据四叉树将CU分割成一或多个TU。TU的形状可为正方形或非正方形(例如,矩形)。
HEVC标准允许根据TU的变换,TU对于不同CU可不同。通常基于针对经分割LCU所定义的给定CU内的PU的大小而设定TU的大小,但可能并非总是如此状况。TU通常具有与PU相同的大小,或小于PU。在一些实例中,可使用称为“残余四叉树”(RQT)的四叉树结构而将对应于CU的残余样本再分为更小的单元。RQT的叶节点可被称作变换单元(TU)。可变换与TU相关联的像素差值以产生变换系数,其可经量化。
叶CU可包含一或多个预测单元(PU)。一般来说,PU表示对应于对应CU的全部或一部分的空间区域,且可包含用于检索PU的参考样本的数据。此外,PU包含与预测有关的数据。举例来说,当PU经帧内模式编码时,用于PU的数据可包含于残余四叉树(RQT)中,残余四叉树可包含描述对应于PU的TU的帧内预测模式的数据。作为另一实例,当PU经帧间模式编码时,PU可包含定义所述PU的一或多个运动向量的数据。定义PU的运动向量的数据可描述(例如)运动向量的水平分量、运动向量的垂直分量、运动向量的分辨率(例如,四分之一像素精度或八分之一像素精度)、运动向量所指向的参考图片,及/或运动向量的参考图片列表(例如,列表0、列表1或列表C)。
具有一或多个PU的叶CU也可包含一或多个变换单元(TU)。可使用RQT(亦被称作TU四叉树结构)指定变换单元,如上文所论述。举例来说,分裂旗标可指示叶CU是否分裂成四个变换单元。接着,每一变换单元可进一步分裂成其它子TU。当TU不进一步分裂时,其可被称作叶TU。一般来说,对于帧内译码,属于叶CU的所有叶TU共享相同帧内预测模式。即,通常应用相同帧内预测模式来计算叶CU的所有TU的预测值。对于帧内译码,视频编码器可将使用帧内预测模式的每一叶TU的残余值计算为在CU的对应于所述TU的部分与原始块之间的差。TU未必限于PU的大小。因此,TU可能大于或小于PU。对于帧内译码,PU可与同一CU的一对应叶TU共同定位。在一些实例中,叶TU的最大大小可对应于对应叶CU的大小。
此外,叶CU的TU也可与被称作残余四叉树(RQT)的相应四叉树数据结构相关联。即,叶CU可包含指示如何将叶CU分割成TU的四叉树。TU四叉树的根节点通常对应于叶CU,而CU四叉树的根节点通常对应于树型块(或LCU)。RQT的不分裂的TU被称作叶TU。一般来说,除非另有指示,否则本发明分别使用术语CU及TU来指代叶CU及叶TU。
视频序列通常包含一系列视频帧或图片。图片群组(GOP)通常包括视频图片中的一系列的一或多者。GOP可在GOP的标头、图片中的一或多者的标头中或在别处包含描述包含于GOP中的图片数目的语法数据。图片的每一切片可包含描述所述相应切片的编码模式的切片语法数据。视频编码器20通常对个别视频切片内的视频块进行操作,以便编码视频数据。视频块可对应于CU内的译码节点。视频块可具有固定或变化的大小,且可根据指定译码标准而在大小方面不同。
作为实例,HM支持以各种PU大小进行预测。假定特定CU的大小为2N×2N,则HM支持以2N×2N或N×N的PU大小进行帧内预测,及以2N×2N、2N×N、N×2N或N×N的对称PU大小进行帧间预测。HM也支持用于以2N×nU、2N×nD、nL×2N及nR×2N的PU大小进行帧间预测的不对称分割。在不对称分割中,CU的一个方向未分割,而另一方向分割成25%及75%。CU的对应于25%分割区的部分由“n”接着是“上”、“下”、“左”或“右”的指示来指示。因此,例如,“2N×nU”指代在水平方向上分割为顶部2N×0.5NPU及底部2N×1.5N PU的2N×2N CU。
在本发明中,“N×N”与“N乘N”可被互换地使用以指代视频块在垂直尺寸与水平尺寸方面的像素尺寸,例如,16×16像素或16乘16像素。一般来说,16×16块在垂直方向上将具有16个像素(y=16)且在水平方向上将具有16个像素(x=16)。同样地,N×N块通常在垂直方向上具有N个像素,且在水平方向上具有N个像素,其中N表示非负整数值。可按行及列来布置块中的像素。此外,块未必需要在水平方向上与在垂直方向上具有相同数目个像素。举例来说,块可包括N×M个像素,其中M未必等于N。
在使用CU的PU的帧内预测性或帧间预测性译码之后,视频编码器20可计算CU的TU的残余数据。PU可包括描述在空间域(也称作像素域)中产生预测性像素数据的方法或模式的语法数据,且TU可包括在将例如离散余弦变换(DCT)、整数变换、小波变换或概念上类似的变换的变换应用于残余视频数据之后变换域中的系数。残余数据可对应于未经编码的图片的像素与对应于PU的预测值之间的像素差。视频编码器20可形成包含CU的残余数据的TU,且接着变换所述TU以产生CU的变换系数。
在进行任何变换以产生变换系数之后,视频编码器20可执行变换系数的量化。量化通常指代如下过程:将变换系数量化以可能地减少用以表示所述系数的数据的量,从而提供进一步压缩。所述量化过程可减少与所述系数中的一些或所有系数相关联的位深度。举例来说,可在量化期间将n位值下舍入至m位值,其中n大于m。
在量化之后,视频编码器可扫描变换系数,从而自包含经量化的变换系数的二维矩阵产生一维向量。扫描可经设计成将较高能量(且因此较低频率)系数置于数组前部,且将较低能量(且因此较高频率)系数置于数组后部。在一些实例中,视频编码器20可利用预定义扫描次序来扫描经量化的变换系数,以产生可经熵编码的串行化向量。在其它实例中,视频编码器20可执行自适应性扫描。在扫描经量化的变换系数以形成一维向量之后,视频编码器20可(例如)根据上下文自适应性可变长度译码(CAVLC)、上下文自适应性二进制算术译码(CABAC)、基于语法的上下文自适应性二进制算术译码(SBAC)、机率区间分割熵(PIPE)译码或另一熵编码方法而熵编码所述一维向量。视频编码器20也可熵编码与经编码的视频数据相关联的语法元素以供视频解码器30用于解码视频数据。
为了执行CABAC,视频编码器20可将上下文模型内的上下文指派给待发射的符号。所述上下文可涉及(例如)符号的相邻值是否为非零的。为了执行CAVLC,视频编码器20可针对待发射的符号选择可变长度码。VLC中的码字可经构造,使得相对较短码对应于更有可能的符号,而较长码对应于较不可能的符号。以此方式,使用VLC可实现位节省(与(例如)针对待发射的每一符号使用等长度码字相比较)。机率判定可基于指派给符号的上下文。
视频编码器20可进一步例如在帧标头、块标头、切片标头或GOP标头中发送语法数据(例如,基于块的语法数据、基于帧的语法数据,及基于GOP的语法数据)至视频解码器30。GOP语法数据可描述相应GOP中的帧的数目,且帧语法数据可指示用以编码对应帧的编码/预测模式。
视频编码器20及视频解码器30可各自实施为多种合适编码器或解码器电路中的任一者(在适用时),例如,一或多个微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑电路、软件、硬件、固件或其任何组合。视频编码器20及视频解码器30中的每一者可包含于一或多个编码器或解码器中,其中的任一者可集成为组合式视频编码器/解码器(CODEC)的部分。包含视频编码器20及/或视频解码器30的装置可包括集成电路、微处理器及/或无线通信装置(例如,蜂窝式电话)。
视频译码标准可包含视频缓冲模型的规范。在AVC及HEVC中,缓冲模型被称作假想参考解码器(HRD),其包含在视频编码器20及/或视频解码器30中所包含的经译码图片缓冲器(CPB)及经解码图片缓冲器(DPB)两者的缓冲模型,且CPB及DPB行为被数学地指定。HRD直接对不同时序、缓冲器大小及位速率强加约束,且间接对位流特性及统计资料强加约束。HRD参数的完整集合包含五个基本参数:初始CPB移除延迟、CPB大小、位速率、初始DPB输出延迟及DPB大小。在AVC及HEVC中,位流一致性及解码器一致性被指定作为HRD规范的部分。尽管HRD被命名为一种类型的解码器,但在编码器侧通常需要HRD以保证位流一致性(即,编码器产生的位流与解码器的要求的一致性),而在解码器侧处通常不需要HRD。
在AVC及HEVC HRD模型中,解码或CPB移除是基于存取单元的,且假设图片解码是瞬时的。在实际应用中,如果一致的解码器严格地遵循(例如)在图片时序补充增强信息(SEI)消息中发信的解码时间而开始解码存取单元,则输出特定经解码的图片的最早可能时间等于所述特定图片的解码时间加上解码所述特定图片所需的时间。不同于AVC及HEVC HRD模型,在真实世界中解码图片所需要的时间不等于零。如本发明中所使用的术语“瞬时”及“瞬时地”可指代可在一或多个译码模型或任何一或多个译码模型的理想化方面中被假定为瞬时的任何持续时间,应理解此可不同于在实体或文字意义上的“瞬时”。举例来说,为了本发明的目的,如果功能或过程在执行所述功能或过程的假想或理想化的最早可能时间的实际容限处或内发生,则功能或过程可被视作名义上“瞬时的”。在一些实例中,如本文中所使用的语法及变量名称可根据其在HEVC模型内的含义来加以理解。
提供了实例假想参考解码器(HRD)操作、经译码图片缓冲器的实例操作、位流到达的实例时序、解码单元移除的实例时序、解码单元的实例解码、经解码图片缓冲器的实例操作、图片自经解码图片缓冲器的实例移除、实例图片输出及实例当前解码图片标记及存储的以下描述,以说明视频编码器20及/或视频解码器30的实例,所述视频编码器20及/或视频解码器30可经配置以除其它功能外尤其将视频数据的一或多个解码单元存储于图片缓冲器中,获得一或多个解码单元的相应缓冲器移除时间,根据解码单元中的每一者的所获得的缓冲器移除时间自图片缓冲器移除解码单元,及译码对应于经移除的解码单元的视频数据。在其它实例中,操作可被不同地定义或执行。以此方式,视频编码器20及/或视频解码器30可经配置以根据下文所描述的HRD操作的各种实例来操作。
可在缓冲周期补充增强信息(SEI)消息中的任一者处初始化HRD。在初始化之前,CPB可为空的。在初始化之后,HRD不可由后续缓冲周期SEI消息再次初始化。与初始化CPB的缓冲周期SEI消息相关联的存取单元可被称作存取单元0。经解码的图片缓冲器可含有图片存储缓冲器。图片存储缓冲器中的每一者可含有被标记为“用于参考”或被保持以供将来输出的经解码图片。在初始化之前,DPB可为空的。
HRD(例如,视频编码器20及/或视频解码器30)可如下操作。假想流调度器(HSS)可递送与根据指定的到达时间表而流入CPB的解码单元相关联的数据。在一个实例中,可在CPB移除时间通过瞬时解码过程瞬时地移除并解码与每一解码单元相关联的数据。每一经解码图片可置放于DPB中。可在DPB输出时间或经解码图片对于帧间预测参考变得不再需要的时间中的较迟时间自DPB移除经解码图片。
HRD依赖于HRD参数,包含初始CPB移除延迟及初始CPB移除延迟偏移的CPB参数。在一些状况下,可基于用以初始化HRD的图片的类型来判定HRD参数。在随机存取的状况下,可通过例如清洁随机存取(CRA)图片或断链存取(BLA)图片的随机存取点(RAP)图片来初始化HRD。在一些状况下,RAP图片可替代性地被称作帧内随机存取点(IRAP)图片。举例来说,当通过在位流中不具有亦被称作标记为舍弃(TFD)图片或随机存取跳过前置(RASL)图片的相关联的非可解码前置图片的BLA图片初始化HRD时,可使用CPB参数的替代性集合。否则,将CPB参数的默认集合用于HRD。如果在应已选择替代性集合时使用了CPB参数的默认集合,则CPB可溢出。
在一些实例中,给定CRA图片或BLA图片可具有在原始位流中的相关联的TFD图片,且TFD图片可由外部装置自原始位流移除。外部装置可包括包含于流式处理服务器、中间网络元件或另一网络实体中的处理装置。然而,外部装置可能不能改变给定CRA图片或BLA图片的所发信的类型以反映相关联的TFD图片的移除。在此状况下,可能基于CRA图片或BLA图片的在原始位流中所发信的类型而选择CPB参数的默认集合。此情形可导致CPB溢出,这是因为TFD图片已被外部装置移除,使得图片不再具有相关联的TFD图片,且应该将CPB参数的替代性集合用于HRD。
本发明描述用于选择用以定义视频编码器20及/或视频解码器30的用于视频位流中的CRA图片或BLA图片的CPB的CPB参数的技术。根据所述技术,视频解码器30接收表示多个图片的位流,所述多个图片包含一或多个CRA图片或BLA图片;且还接收消息,所述消息指示是否针对CRA图片或BLA图片中的至少一者使用CPB参数的替代性集合。所述消息可接收自外部装置,例如,包含于流式处理服务器、中间网络元件或另一网络实体中的处理装置。
视频解码器30基于接收到的消息而设定经定义以指示用于CRA图片或BLA图片中的给定一者的CPB参数的集合的变量。视频解码器30接着基于针对CRA图片或BLA图片中的所述给定一者的变量来选择用于图片的CPB参数的集合。在一些状况下,视频解码器30可设定针对CRA图片或BLA图片中的给定一者的网络抽象层(NAL)单元类型,且可基于针对给定图片的NAL单元类型及变量来选择用于图片的CPB参数的集合。
将CPB参数的所选择集合应用于包含于视频解码器30中的CPB以确保CPB在视频解码期间将不溢出。视频编码器20可经配置以执行类似操作且将CPB参数的所选择集合应用于包含于视频编码器20中的CPB,以确保包含于视频编码器20中的CPB在视频编码期间将不溢出,且包含于视频解码器30中的CPB在接收到由视频编码器20产生的经编码位流时将不溢出。
图2是说明可实施本发明中所描述的技术的视频编码器20的实例的框图。视频编码器20可执行视频切片内的视频块的帧内译码及帧间译码。帧内译码依赖于空间预测以减少或移除给定视频帧或图片内的视频的空间冗余。帧间译码依赖于时间预测以减少或移除视频序列的邻近帧或图片内的视频的时间冗余。帧内模式(I模式)可指代若干基于空间的译码模式中的任一者。帧间模式(例如,单向预测(P模式)或双向预测(B模式))可指代若干基于时间的译码模式中的任一者。
如图2中所示,视频编码器20接收待编码的视频帧内的当前视频块。在图2的实例中,视频编码器20包含模式选择单元40、求和器50、变换处理单元52、量化单元54、熵编码单元56、经解码图片缓冲器(DPB)64及经译码图片缓冲器(CPB)66。模式选择单元40又包含运动补偿单元44、运动估计单元42、帧内预测处理单元46及分割单元48。为了视频块重构,视频编码器20亦包含反量化单元58、反变换处理单元60及求和器62。也可包含解块滤波器(图2中未展示)以滤波块边界从而自经重构的视频移除块效应伪影。如果需要,则解块滤波器通常将对求和器62的输出进行滤波。除解块滤波器外,也可使用额外滤波器(回路内或回路后)。为了简洁起见未展示此些滤波器,但如果需要,此些滤波器可对求和器50的输出进行滤波(作为回路内滤波器)。
在编码过程期间,视频编码器20接收待译码的视频帧或切片。可将帧或切片划分成多个视频块。运动估计单元42及运动补偿单元44相对于一或多个参考帧中的一或多个块来执行经接收视频块的帧间预测性译码,以提供时间预测。帧内预测处理单元46可替代性地相对于与待译码的块在相同的帧或切片中的一或多个相邻块执行对接收到的视频块的帧内预测性译码以提供空间预测。视频编码器20可执行多个译码遍次(例如)以选择用于视频数据的每一块的适当译码模式。
此外,分割单元48可基于在先前译码遍次中对先前分割方案的评估而将视频数据的块分割成子块。举例来说,分割单元48可最初将一帧或切片分割成LCU,且基于速率-失真分析(例如,速率-失真优化)来将所述LCU中的每一者分割成子CU。模式选择单元40可进一步产生指示LCU至子CU的分割的四叉树数据结构。四叉树的叶节点CU可包含一或多个PU及一或多个TU。
模式选择单元40可(例如,基于错误结果)选择译码模式(帧内或帧间)中的一者,且将所得的经帧内或帧间译码的块提供至求和器50以产生残余块数据,且提供至求和器62以重构经编码的块以用作参考帧。模式选择单元40亦将语法元素(例如运动向量、帧内模式指示符、分割信息及其它此些语法信息)提供至熵编码单元56。
运动估计单元42及运动补偿单元44可高度集成,但为概念性目的而被分别说明。由运动估计单元42执行的运动估计为产生运动向量的过程,运动向量估计视频块的运动。举例来说,运动向量可指示在当前视频帧或图片内的视频块的PU相对于在参考帧(或其它经译码单元)内的预测性块(其相对于所述当前帧(或其它经译码单元)内的正被译码的当前块)的位移。预测性块为被发现在像素差方面紧密地匹配于待译码块的块,所述像素差可通过绝对差总和(SAD)、平方差总和(SSD)或其它差量度予以判定。在一些实例中,视频编码器20可计算存储于DPB 64中的参考图片的次整数像素位置的值。举例来说,视频编码器20可内插参考图片的四分之一像素位置、八分之一像素位置或其它分率像素位置的值。因此,运动估计单元42可执行相对于全像素位置及分率像素位置的运动搜寻,且以分率像素精度输出运动向量。
运动估计单元42通过比较帧间译码切片中的视频块的PU的位置与参考图片的预测性块的位置而计算所述PU的运动向量。参考图片可为选自第一参考图片列表(列表0)或第二参考图片列表(列表1),前述列表中的每一者识别存储于DPB 64中的一或多个参考图片。运动估计单元42将所计算的运动向量发送至熵编码单元56及运动补偿单元44。
由运动补偿单元44执行的运动补偿可涉及到基于由运动估计单元42判定的运动向量来提取或产生预测性块。再一次,在一些实例中,运动估计单元42及运动补偿单元44可在功能上进行集成。在接收到当前视频块的PU的运动向量时,运动补偿单元44可在参考图片列表中的一者中找到运动向量所指向的预测性块。求和器50通过自正被译码的当前视频块的像素值减去预测性块的像素值,从而形成像素差值来形成残余视频块,如下文所论述。一般来说,运动估计单元42执行关于明度分量的运动估计,且运动补偿单元44将基于所述明度分量所计算的运动向量用于色度分量与明度分量两者。模式选择单元40也可产生与视频块及视频切片相关联的语法元素以供视频解码器30在解码视频切片的视频块时使用。
如上文所描述,作为由运动估计单元42及运动补偿单元44执行的帧间预测的替代例,帧内预测处理单元46可对当前块进行帧内预测。详细地说,帧内预测处理单元46可判定帧内预测模式以用以编码当前块。在一些实例中,帧内预测处理单元46可(例如)在单独编码遍次期间使用各种帧内预测模式编码当前块,且帧内预测处理单元46(或在一些实例中,模式选择单元40)可自经测试模式中选择将使用的适当帧内预测模式。
举例来说,帧内预测处理单元46可使用针对各种经测试的帧内预测模式的速率-失真分析而计算速率-失真值,且在经测试模式当中选择具有最佳速率-失真特性的帧内预测模式。速率-失真分析通常判定经编码块与经编码以产生所述经编码块的原始未经编码块之间的失真(或错误)的量以及用以产生经编码块的位速率(即,位计数)。帧内预测处理单元46可根据各个经编码块的失真及速率计算比率,以判定哪一帧内预测模式对于所述块展现最佳速率-失真值。
在选择块的帧内预测模式之后,帧内预测处理单元46可将指示块的所选择帧内预测模式的信息提供至熵编码单元56。熵编码单元56可编码指示所选择帧内预测模式的信息。视频编码器20可在经发射的位流中包含配置数据,其可包含多个帧内预测模式索引表及多个经修改的帧内预测模式索引表(亦被称作码字映射表)、各种块的编码上下文的定义及将用于所述上下文中的每一者的最有可能的帧内预测模式、帧内预测模式索引表及经修改的帧内预测模式索引表的指示。
视频编码器20通过自正被译码的原始视频块减去来自模式选择单元40的预测数据而形成残余视频块。求和器50表示执行此减法运算的一或多个组件。变换处理单元52将例如离散余弦变换(DCT)或概念上类似的变换的变换应用于残余块,从而产生包括残余变换系数值的视频块。变换处理单元52可执行概念上类似于DCT的其它变换。也可使用小波变换、整数变换、子频带变换或其它类型的变换。在任何状况下,变换处理单元52将变换应用于残余块,从而产生残余变换系数的块。所述变换可将残余信息自像素值域转换至变换域(例如频域)。变换处理单元52可将所得的变换系数发送至量化单元54。量化单元54量化所述变换系数以进一步减少位速率。所述量化过程可减少与所述系数中的一些或所有系数相关联的位深度。可通过调整量化参数而修改量化程度。在一些实例中,量化单元54可接着执行对包含经量化的变换系数的矩阵的扫描。或者,熵编码单元56可执行所述扫描。
在量化之后,熵编码单元56熵译码经量化的变换系数。举例来说,熵编码单元56可执行上下文自适应性可变长度译码(CAVLC)、上下文自适应性二进制算术译码(CABAC)、基于语法的上下文自适应性二进制算术译码(SBAC)、机率区间分割熵(PIPE)译码或另一熵译码技术。在基于上下文的熵译码的状况下,上下文可基于相邻块。在由熵编码单元56进行的熵译码之后,可或多或少临时地在CPB 66中缓冲或存储经编码的位流,将经编码的位流发射至另一装置(例如,视频解码器30)或存档以供稍后发射或检索。
反量化单元58及反变换处理单元60分别应用反量化及反变换以在像素域中重构残余块(例如)以供稍后用作参考块。运动补偿单元44可通过将残余块加至DPB 64的帧中的一者的预测性块来计算参考块。运动补偿单元44也可将一或多个内插滤波器应用于经重构的残余块以计算次整数像素值以供用于运动估计中。求和器62将经重构的残余块加至由运动补偿单元44产生的经运动补偿预测块,以产生经重构的视频块以供存储于DPB 64中。经重构的视频块可由运动估计单元42及运动补偿单元44用作参考块以对后续视频帧中的块进行帧间译码。
DPB 64可为数据存储装置或可包含于数据存储装置中,例如能够存储数据的任何永久或易失性存储器,例如同步动态随机存取存储器(SDRAM)、嵌入式动态随机存取存储器(eDRAM)或静态随机存取存储器(SRAM)。DPB 64可根据本发明中所描述的实例经译码图片缓冲器及/或经解码图片缓冲器行为的任何组合来操作。举例来说,视频编码器20可经配置以根据假想参考解码器(HRD)操作。在此状况下,包含于视频编码器20中的DPB 64可根据HRD的缓冲模型由包含CPB参数及DPB参数的HRD参数来定义。
类似地,CPB 66可为数据存储装置或可包含于数据存储装置中,例如能够存储数据的任何永久或易失性存储器,例如同步动态随机存取存储器(SDRAM)、嵌入式动态随机存取存储器(eDRAM)或静态随机存取存储器(SRAM)。尽管被展示为形成视频编码器20的部分,但在一些实例中,CPB 66可形成在视频编码器20外部的装置、单元或模块的部分。举例来说,CPB 66可形成在视频编码器20外部的流调度器单元(例如,递送调度器或假想流调度器(HSS))的部分。在视频编码器20经配置以根据HRD操作的状况下,包含于视频编码器20中的CPB 66可根据HRD的缓冲模型由包含初始CPB移除延迟及偏移的CPB参数的HRD参数来定义。
根据本发明的技术,视频编码器20可将CPB参数的默认集合或是替代性集合应用于CPB 66,以确保CPB 66在视频数据的编码期间不溢出,且包含于视频解码器30中的CPB在接收到由视频编码器20产生的经编码位流时不溢出。如果在应选择替代性集合时使用了默认集合,则包含于视频编码器20中的CPB 66或包含于视频解码器30中的CPB可溢出。适当CPB参数的选择主要是当将例如清洁随机存取(CRA)图片或断链存取(BLA)图片的随机存取点(RAP)图片用以初始化HRD时的关注事项。因此,所述技术可在视频译码中提供对RAP图片的改善的支持。
视频编码器20可经配置以接收表示多个图片的位流,所述多个图片包含一或多个CRA图片或BLA图片;且还接收消息,所述消息指示是否针对CRA图片或BLA图片中的至少一者使用CPB参数的替代性集合。在一些状况下,可在视频编码器20的解码部分(即,反量化单元58及反变换处理单元60)处直接自视频编码器20的编码部分(例如,熵编码单元56或CPB 66)接收到位流。可自外部装置,例如,包含于流式处理服务器、中间网络元件或另一网络实体中的处理装置接收所述消息。
视频编码器20基于接收到的消息设定变量,所述变量经定义以指示用于CRA图片或BLA图片中的给定一者的CPB参数的集合。视频编码器20接着基于针对图片的变量来选择用于CRA图片或BLA图片中的所述给定一者的CPB参数的集合。视频编码器20将CPB参数的所选择集合应用于包含于视频编码器20中的CPB 66,以确保CPB 66在视频编码期间将不溢出,且确保包含于视频解码器30中的CPB在接收到由视频编码器20产生的经编码位流时将不溢出。在一些状况下,视频编码器20可设定针对CRA图片或BLA图片中的给定一者的网络抽象层(NAL)单元类型,且可基于针对图片的NAL单元类型及变量来选择用于给定图片的CPB参数的集合。关于图3的视频解码器30更详细地描述用于RAP图片的CPB参数选择过程。
图3是说明可实施本发明中所描述的技术的视频解码器30的实例的框图。在图3的实例中,视频解码器30包含:熵解码单元70、包含运动补偿单元72及帧内预测处理单元74的预测处理单元71、反量化单元76、反变换处理单元78、求和器80、经译码图片缓冲器(CPB)68及经解码图片缓冲器(DPB)82。在一些实例中,视频解码器30可执行与关于来自图2的视频编码器20所描述的编码遍次大体互逆的解码遍次。
在解码过程期间,视频解码器30自视频编码器20接收经编码的视频位流,所述视频位流表示经编码视频切片的视频块及相关联的语法元素。视频解码器30可自网络实体29接收经编码的视频位流。网络实体29可例如是流式处理服务器、媒体感知网络元件(media-aware network element)(MANE)、视频编辑器/接合器、中间网络元件,或经配置以实施上文所描述的技术中的一或多者的其它此类装置。网络实体29可包含经配置以执行本发明的技术的外部装置。如上文所描述,本发明中所描述的技术中的一些技术可在网络实体29将经编码视频位流发射至视频解码器30之前由网络实体29来实施。在一些视频解码系统中,网络实体29及视频解码器30可为分离装置的部分,而在其它个例中,关于网络实体29描述的功能性可由包括视频解码器30的同一装置来执行。
在熵解码单元70进行熵解码之前,可或多或少临时地在CPB 68中缓冲或存储位流。视频解码器30的熵解码单元70接着熵解码位流以产生经量化的系数、运动向量或帧内预测模式指示符及其它语法元素。熵解码单元70将运动向量及其它语法元素转发至运动补偿单元72。视频解码器30可接收视频切片级别及/或视频块级别的语法元素。
当视频切片经译码为帧内译码(I)切片时,帧内预测处理单元74可基于经发信的帧内预测模式及来自当前帧或图片的先前经解码块的数据而产生当前视频切片的视频块的预测数据。当视频帧被译码为帧间译码(即,B或P)切片时,运动补偿单元72基于接收自熵解码单元70的运动向量及其它语法元素而产生当前视频切片的视频块的预测性块。可根据参考图片列表中的一者内的参考图片中的一者产生预测性块。视频解码器30可基于存储于DPB 82中的参考图片使用默认构造技术构造参考帧列表(列表0及列表1)。
运动补偿单元72通过解析运动向量及其它语法元素而判定当前视频切片的视频块的预测信息,且使用所述预测信息以产生正被解码的当前视频块的预测性块。举例来说,运动补偿单元72使用接收到的语法元素中的一些来判定用以译码视频切片的视频块的预测模式(例如,帧内或帧间预测)、帧间预测切片类型(例如,B切片或P切片)、切片的参考图片列表中的一或多者的构造信息、切片的每一帧间编码视频块的运动向量、切片的每一帧间译码视频块的帧间预测状态及其它信息以解码当前视频切片中的视频块。
运动补偿单元72也可基于内插滤波器执行内插。运动补偿单元72可使用如由视频编码器20在视频块的编码期间使用的内插滤波器来计算参考块的次整数像素的内插值。在此状况下,运动补偿单元72可自接收的语法元素判定由视频编码器20使用的内插滤波器且使用所述内插滤波器来产生预测性块。
反量化单元76反量化(即,解量化)提供于位流中且由熵解码单元70解码的经量化变换系数。反量化过程可包含使用由视频解码器30计算的用于视频切片中的每一视频块的量化参数QPY来判定应应用的量化程度及同样地反量化程度。反变换处理单元78将例如反DCT、反整数变换或概念上类似的反变换过程的反变换应用于变换系数,以便产生像素域中的残余块。
在运动补偿单元72基于运动向量及其它语法元素产生当前视频块的预测性块之后,视频解码器30通过将来自反变换单元78的残余块与由运动补偿单元72产生的对应预测性块求和而形成经解码的视频块。求和器90表示执行此求和运算的一或多个组件。如果需要,也可应用解块滤波器以对经解码块滤波以便移除块效应伪影。其它回路滤波器(译码回路中或译码回路后)也可用以使像素转变平滑,或以其它方式改善视频质量。接着将给定帧或图片中的经解码视频块存储于DPB 82中,DPB 82存储用于后续运动补偿的参考图片。DPB 82亦存储经解码的视频供稍后再现于例如图1的显示装置32的显示装置上。
DPB 82可为数据存储装置或可包含于数据存储装置中,例如能够存储数据的任何永久或易失性存储器,例如同步动态随机存取存储器(SDRAM)、嵌入式动态随机存取存储器(eDRAM)或静态随机存取存储器(SRAM)。DPB 82可根据本发明中所描述的实例经译码图片缓冲器及/或经解码图片缓冲器行为的任何组合来操作。举例来说,视频解码器30可经配置以根据假想参考解码器(HRD)操作。在此状况下,视频解码器30可解码用以根据HRD的缓冲模型定义DPB 82的HRD参数(包含CPB参数及DPB参数)。
类似地,CPB 68可为数据存储装置或可包含于数据存储装置中,例如能够存储数据的任何永久或易失性存储器,例如同步动态随机存取存储器(SDRAM)、嵌入式动态随机存取存储器(eDRAM)或静态随机存取存储器(SRAM)。尽管被展示为形成视频解码器30的部分,但在一些实例中,CPB 68可形成在视频解码器30外部的装置、单元或模块的部分。举例来说,CPB 68可形成在视频解码器30外部的流调度器单元(例如,递送调度器或假想流调度器(HSS))的部分。在视频解码器30经配置以根据HRD操作的状况下,视频解码器30可解码用以根据HRD的缓冲模型定义CPB 68的包含初始CPB移除延迟及偏移的CPB参数的HRD参数。
根据本发明的技术,视频解码器30可将CPB参数的默认集合或是替代性集合应用于CPB 68,以确保CPB 68在视频数据的解码期间不溢出。如果在应选择替代性集合时使用了默认集合,则包含于经配置以根据HRD操作的视频解码器中的CPB 68可溢出。适当CPB参数的选择主要是当将例如清洁随机存取(CRA)图片或断链存取(BLA)图片的随机存取点(RAP)图片用以初始化HRD时的关注事项。因此,所述技术可在视频译码中提供对RAP图片的改善的支持。
视频解码器30接收表示多个图片的位流,所述多个图片包含一或多个CRA图片或BLA图片;且还接收消息,所述消息指示是否针对CRA图片或BLA图片中的至少一者使用CPB参数的替代性集合。所述消息可接收自网络实体29或另一外部装置,例如,包含于流式处理服务器或中间网络元件中的处理装置。
视频解码器30基于接收到的消息设定变量,所述变量经定义以指示用于CRA图片或BLA图片中的给定一者的CPB参数的集合。视频译码装置接着基于针对图片的变量来选择用于CRA图片或BLA图片中的所述给定一者的CPB参数的集合。视频解码器30将CPB参数的所选择集合应用于CPB 68以确保CPB 68在视频解码期间将不溢出。在一些状况下,视频解码器30可设定针对CRA图片或BLA图片中的给定一者的网络抽象层(NAL)单元类型。视频解码器30可将图片的NAL单元类型设定为所发信的,或可基于针对图片的变量来设定NAL单元类型。视频解码器30可接着基于针对图片的NAL单元类型及变量来选择用于给定图片的CPB参数的集合。
一般来说,本发明描述提供对RAP图片的改善的支持的技术,所述技术包含选择针对RAP图片的HRD参数及将CRA图片作为BLA图片进行处置的改善的方法。如上文所描述,视频译码标准包含ITU-T H.261、ISO/IEC MPEG-1Visua1、ITU-T H.262或ISO/IEC MPEG-2Visual、ITU-T H.263、ISO/IEC MPEG-4Visual及ITU-T H.264(也称作ISO/IEC MPEG-4AVC)(包含其可缩放视频译码(SVC)及多视图视频译码(MVC)扩展)。此外,存在由ITU-T视频译码专业团体(VCEG)及ISO/IEC动画专业团体(MPEG)的关于视频译码的联合合作团队(JCT-VC)开发的新视频译码标准(即,高效视频译码(HEVC))。HEVC的新近工作草案(WD)(下文称作HEVC WD8)描述于2012年7月11日至20日瑞典斯德哥尔摩,ITU-T SG16WP3与ISO/IEC JTC1/SC29/WG11的关于视频译码的联合合作团队(JCT-VC)第10次会议的文献JCTVC-J1003_d7,Bross等人的“高效率视频译码(HEVC)文本规范草案8(High Efficiency Video Coding(HEVC)Text Specification Draft8)”中,自2012年9月20日起可在http://phenix.int-evry.fr/jct/doc_end_user/documents/10_Stockholm/wg11/JCTVC-J1003-v8.zip处获得所述工作草案。
随机存取指代自并非位流中的第一经译码图片的经译码图片开始对视频位流的解码。在例如广播及流式处理的许多视频应用中需要对位流的随机存取,(例如)供使用者在任何时间调谐至节目,在不同频道之间切换,跳至视频的指定部分,或切换至不同位流以进行位速率、帧速率、空间分辨率及其类似者的流调适。此特征是通过以规则间隔将随机存取图片或随机存取点插入至视频位流中许多次来启用。
位流接合指代两个或两个以上位流或其部分的串连。举例来说,第一位流可附加有第二位流,其中可能具有对位流中的一或两者的一些修改以产生经接合位流。第二位流中的第一经译码图片亦被称作接合点。因此,在经接合位流中的接合点之后的图片发源于第二位流,而在经接合位流中的接合点之前的图片发源于第一位流。
位流的接合由位流接合器来执行。位流接合器常常为轻量级的,且相较于编码器智能程度低得多。举例来说,位流接合器可能未配备有熵解码及编码能力。位流切换可用于自适应性流式处理环境中。在切换至的位流中的某图片处的位流切换操作实际上是位流接合操作,其中接合点是位流切换点(即,来自切换至的位流的第一图片)。
如AVC或HEVC中指定的瞬时解码再新(IDR)图片可用于随机存取。然而,由于在解码次序上在IDR图片之后的图片无法使用IDR图片之前经解码的图片作为参考,因此依赖于IDR图片来进行随机存取的位流可具有显著较低的译码效率。为了改善译码效率,在HEVC中引入了清洁随机存取(CRA)图片的概念,以允许在解码次序上在CRA图片之后但在输出次序上在CRA图片之前的图片使用在CRA图片之前解码的图片作为参考图片。
在解码次序上在CRA图片之后但在输出次序上在CRA图片之前的图片被称作与CRA图片相关联的前置图片或CRA图片的前置图片。如果解码自在当前CRA图片之前的IDR或CRA图片开始,则CRA图片的前置图片是可正确解码的。当发生自当前CRA图片的随机存取时,CRA图片的前置图片可为非可解码的。因此,前置图片通常在随机存取解码期间被舍弃。为了防止自可能不可用(视解码开始于何处)的参考图片的错误传播,在解码次序及输出次序上皆在CRA图片之后的所有图片不应使用在解码次序或是输出次序上在CRA图片之前的任何图片(包含前置图片)作为参考图片。
在引入CRA图片之后,在HEVC中进一步引入了断链存取(BLA)图片的概念,且其是基于CRA图片的概念。BLA图片通常发源于在CRA图片的位置处接合的位流,且在经接合的位流中,接合点CRA图片被改变至BLA图片。IDR图片、CRA图片及BLA图片被统称作随机存取点(RAP)图片或帧内随机存取点(IRAP)图片。
BLA图片与CRA图片之间的主要差异的论述如下。对于CRA图片,如果解码开始于在解码次序上在CRA图片之前的RAP图片,则相关联的前置图片是可正确解码的;且当发生自CRA图片的随机存取时(即,当解码开始于CRA图片时,或换句话说当CRA图片是位流中的第一图片时),相关联的前置图片可为非可正确解码的。对于BLA图片,相关联的前置图片可在所有状况下皆是非可解码的,即使在解码开始于在解码次序上在BLA图片之前的RAP图片时亦如此。
对于特定CRA或BLA图片,即使在CRA或BLA图片是位流中的第一图片时,相关联的前置图片中的一些也是可正确解码的。此些前置图片被称作可解码前置图片(DLP),且其它前置图片被称作非可解码前置图片(NLP)。在一些状况下,DLP可替代性地被称作随机存取可解码前置(RADL)图片。在HEVC WD8中,NLP被称作标记为舍弃(TFD)图片。在其它状况下,NLP可替代性地被称作随机存取跳过前置(RASL)图片。为了本发明的目的,可互换地使用术语“非可解码前置图片”、“TFD图片”及“RASL图片”。
在HEVC WD8中,在附录C中指定了假想参考解码器(HRD)。HRD依赖于HRD参数(其可在位流中提供于包含于视频参数集(VPS)及/或序列参数集(SPS)中的hrd_parameters()语法结构中)、缓冲周期补充增强信息(SEI)消息,及图片时序SEI消息。缓冲周期SEI消息主要包含CPB参数,即初始经译码图片缓冲器(CPB)移除延迟及初始CPB移除延迟偏移。可提供CPB参数的两个集合,其被称为由语法元素initial_cpb_removal_delay[]及initial_cpb_removal_delay_offset[]发信的默认集合;及由语法元素initial_alt_cpb_removal_delay[]及initial_alt_cpb_removal_delay_offset[]发信的替代性集合。
当sub_pic_cpb_params_present_flag等于0且rap_cpb_params_present_flag等于1时,以下情形适用。当用在位流中并不具有相关联的TFD图片的BLA图片初始化HRD时,视频解码器30使用CPB参数的替代性集合以定义CPB 68。并不具有相关联的非可解码前置图片的BLA图片具有nal_unit_type,所述nal_unit_type指示具有可解码前置图片的BLA图片(例如,BLA_W_DLP)或指示无前置图片的BLA图片(例如,BLA_N_LP)。如果替代地使用默认集合,则CPB可溢出。当通过具有相关联的TFD图片的CRA图片或BLA图片初始化HRD时,视频解码器30使用CPB参数的默认集合来定义CPB 68。具有相关联的TFD图片的BLA图片具有指示具有非可解码前置图片的BLA图片的nal_unit_type(例如,BLA_W_TFD)。此情形反映于HEVC WD8的子条款C.2.1中的以下文本中:
变量InitCpbRemovalDelay[SchedSelIdx]及InitCpbRemovalDelayOffset[SchedSelIdx]被设定如下。
-如果以下条件中的任一者为真,则InitCpbRemovalDelay[SchedSelIdx]及InitCpbRemovalDelayOffset[SchedSelIdx]分别被设定为相关联的缓冲周期SEI消息的对应initial_alt_cpb_removal_delay[SchedSelIdx]及initial_alt_cpb_removal_delay_offset[SchedSelIdx]的值:
-存取单元0是经译码图片具有等于BLA_W_DLP或BLA_N_LP的nal_unit_type的BLA存取单元,且相关联的缓冲周期SEI消息的rap_cpb_params_present_flag的值等于1;
-SubPicCpbFlag等于1。
-否则,InitCpbRemovalDelay[SchedSelIdx]及InitCpbRemovalDelayOffset[SchedSelIdx]分别被设定为相关联的缓冲周期SEI消息的对应initial_cpb_removal_delay[SchedSelIdx]及initial_cpb_removal_delay_offset[SchedSelIdx]的值。
如自上文可看出,对于给定图片选择使用CPB参数的哪一集合可基于图片的nal_unit_type的值。
HEVC WD8亦包含在子条款8.1中的针对将CRA图片作为BLA图片进行处置的以下文本。
在当前图片是CRA图片时,以下情形适用。
-如果此规范中未指定的一些外部装置可用于将变量HandleCraAsBlaFlag设定为一值,则将HandleCraAsBlaFlag设定为由外部装置提供的值。
-否则,将HandleCraAsBlaFlag的值设定为0。
当HandleCraAsBlaFlag等于1时,在每一经译码切片NAL单元的解析及解码过程期间以下情形适用:
-将nal_unit_type的值设定为BLA_W_TFD。
-将no_output_of_prior_pics_flag的值设定为1。
在HEVC WD8中,CRA图片在其经译码切片的NAL单元标头中具有等于CRA_NUT的nal_unit_type,且其可具有相关联的TFD图片及DLP图片。
以下问题是与用于选择用于CRA图片、BLA图片及作为BLA图片处置的CRA图片的CPB参数的现有方法相关联。第一问题是与选择用于CRA图片及BLA图片的CPB参数相关联。CRA图片可具有相关联的TFD图片。当CRA图片在原始位流中具有相关联的TFD图片,但相关联的TFD图片被流式处理服务器或中间网络元件舍弃时,为了启用对CPB参数的适当集合(即,替代性集合)的选择,网络实体29或另一外部装置必须在将CRA图片发送至视频解码器30之前将CRA图片改变至BLA图片。然而,网络实体29可能不能进行此操作。在此些情形下,对初始CPB移除延迟及偏移的适当集合的选择无法成功,此情形可导致CPB 68的溢出;或是不能执行TFD图片的舍弃,此情形导致带宽的浪费或较低视频质量。
第二问题是与将CRA图片作为BLA图片进行处置相关联。CRA图片可具有相关联的TFD图片。当CRA图片具有在原始位流中的相关联的TFD图片,但相关联的TFD图片被网络实体29或另一外部装置(例如,包含于流式处理服务器或中间网络元件中的处理装置)舍弃时,外部装置指示将CRA图片作为BLA图片进行处置。如HEVC WD8中所指定,视频解码器30接着设定nal_unit_type的值以指示具有非可解码前置图片的BLA图片(例如,BLA_W_TFD),此情形导致使用CPB参数的默认集合,且因此CPB 68可溢出。
本发明的技术提供能够消除或避免上文所描述的问题的改善的RAP图片行为。根据所述技术,脱离视频译码规范的范围,定义变量,且变量的值可由网络实体29或另一外部装置(例如,包含于流式处理服务器、中间网络元件或另一网络实体中的处理装置)来设定。在一个实例中,变量可指定是否使用CPB参数的替代性集合,且当将CRA图片作为BLA图片进行处置时使用何NAL单元类型。在另一实例中,变量可指定待用于特定图片的NAL单元类型值,自所述NAL单元类型值可导出使用CPB参数的默认集合或是替代性集合。
在以下章节中,更详细地描述上述技术。下划线可指示相对于HEVC WD8的添加,且可指示相对于HEVC WD8的删除。
在一个实例中,视频解码器30接收表示多个图片的位流,多个图片包含一或多个CRA图片或BLA图片。视频解码器30也自网络实体29接收消息,所述消息指示是否针对CRA图片或BLA图片中的至少一者使用CPB参数的替代性集合。视频解码器30基于接收到的消息设定变量,所述变量经定义以指示用于CRA图片或BLA图片中的给定一者的CPB参数的集合。视频解码器30接着基于针对图片的变量来选择用于CRA图片或BLA图片中的所述给定一者的CPB参数的集合。
根据此实例,可针对每一BLA或CRA图片而定义变量UseAltCpbParamsFlag。此变量的值由网络实体29或某其它外部装置设定为0或l。如果此外部装置不可用,则视频解码器30可将变量的值设定为0。
在此状况下,上文引用的HEVC WD8的子条款8.1中的文本可由以下内容替换:
在当前图片是具有等于BLA_W_TFD的nal_unit_type的BLA图片或是CRA图片时, 以下情形适用。
-如果此规范中未指定的某外部装置可用于将变量UseAltCpbParamsFlag设定为一 值,则将UseAltCpbParamsFlag设定为由外部装置提供的值。
-否则,将UseAltCpbParamsFlag的值设定为0。
在当前图片是CRA图片时,以下情形适用。
-如果此规范中未指定的某外部装置可用于将变量HandleCraAsBlaFlag设定为一值,则将HandleCraAsBlaFlag设定为由外部装置提供的值。
-否则,将HandleCraAsBlaFlag的值设定为0。
在当前图片是CRA图片且HandleCraAsBlaFlag等于1时,在针对每一经译码切片NAL单元的解析及解码过程期间,以下情形适用,且将CRA图片视作BLA图片并将 CRA存取单元视作BLA存取单元:
-如果UseAltCpbParamsFlag等于0,则将nal_unit_type的值设定为BLA_W_TFD。否则,将nal_unit_type的值设定为BLA_W_DLP。
-将no_output_of_prior_pics_flag的值设定为1。
此外,上文引用的HEVC WD8的子条款C.2.1中的文本可由以下内容替换:
变量InitCpbRemovalDelay[SchedSelIdx]及InitCpbRemovalDelayOffset[SchedSelIdx]被设定如下。
-如果以下条件中的一者为真,则InitCpbRemovalDelay[SchedSelIdx]及InitCpbRemovalDelayOffset[SchedSelIdx]分别被设定为相关联的缓冲周期SEI消息的对应initial_alt_cpb_removal_delay[SchedSelIdx]及initial_alt_cpb_removal_delay_offset[SchedSelIdx]的值:
-存取单元0是经译码图片具有等于BLA_W_DLP或BLA_N_LP的nal_unit_type的BLA存取单元,且相关联的缓冲周期SEI消息的rap_cpb_params_present_flag的值等于1;
-存取单元0是经译码图片具有等于BLA_W_TFD的nal_unit_type的BLA存取单 元或是CRA存取单元,UseAltCpbParamsFlag等于1,且相关联的缓冲周期SEI消息的 rap_cpb_params_present_flag的值等于1;
-SubPicCpbFlag等于1。
-否则,InitCpbRemovalDelay[SchedSelIdx]及InitCpbRemovalDelayOffset[SchedSelIdx]分别被设定为相关联的缓冲周期SEI消息的对应initial_cpb_removal_delay[SchedSelIdx]及initial_cpb_removal_delay_offset[SchedSelIdx]的值。
网络实体29或经配置以设定UseAltCpbParamsFlag的值的另一外部装置可如下起作用。网络实体29可将消息发送至视频解码器30或发送至含有视频解码器30的接收器。消息可指示,特定BLA或CRA图片具有相关联的TFD图片但相关联的TFD图片被舍弃,且因此应使用CPB参数的替代性集合。在接收到此消息时,视频解码器30可将针对特定BLA或CRA图片的UseAltCpbParamsFlag的值设定为1。如果特定BLA或CRA不具有TFD图片,或其具有未被舍弃的TFD图片,则不需要发送消息,或发送消息以指导视频解码器30将针对特定BLA或CRA图片的UseAltCpbParamsFlag的值设定为0。
在一些状况下,视频解码器30可设定针对CRA图片或BLA图中的给定一者的网络抽象层(NAL)单元类型,且可基于针对图片的NAL单元类型及变量来选择用于给定图片的CPB参数的集合。作为另一实例,并非使用指示一般CRA图片的仅一个NAL单元类型(例如,CRA_NUT),本发明的技术允许使用三个不同NAL单元类型,所述不同NAL单元类型分别指示具有非可解码前置图片的CRA图片(例如,CRA_W_TFD),指示具有可解码前置图片的CRA图片(例如,CRA_W_DLP),且指示无前置图片的CRA图片(例如,CRA_N_LP)。在此状况下,如下文所展示改变了HEVC WD8中的表7-l及表下方的注释。
表7-1-NAL单元类型码及NAL单元类型类
注释3-具有等于CRA_W_TFD的nal_unit_type的CRA图片可具有在位流中存在的相关联的TFD图片或相关联的DLP图片或两者。具有等于CRA_W_DLP的nal_unit_type的CRA图片并不具有存在于位流中的相关联的TFD图片,但可具有在位流中的相关联的DLP图片。具有等于CRA_N_LP的nal_unit_type的CRA图片并不具有存在于位流中的相关联的前置图片。
注释4-具有等于BLA_W_TFD的nal_unit_type的BLA图片可具有在位流中存在的相关联的TFD图片或相关联的DLP图片或两者。具有等于BLA_W_DLP的nal_unit_type的BLA图片并不具有存在于位流中的相关联的TFD图片,但可具有在位流中的相关联的DLP图片。具有等于BLA_N_LP的nal_unit_type的BLA图片并不具有存在于位流中的相关联的前置图片。
注释5-具有等于IDR_N_LP的nal_unit_type的IDR图片并不具有存在于位流中的相关联的前置图片。具有等于IDR_W_DLP的nal_unit_type的IDR图片并不具有存在于位流中的相关联的TFD图片,但可具有在位流中的相关联的DLP图片。
此外,类似于上述第一实例,针对每一BLA或CRA图片而定义变量UseAltCpbParamsFlag。此变量的值由网络实体29或另一外部装置设定为0或l。如果此外部装置不可用,则视频解码器30可将变量的值设定为0。
在此状况下,上文引用的HEVC WD8的子条款8.1中的文本可由以下内容替换:
在当前图片是具有等于BLA_W_TFD的nal_unit_type的BLA图片或是具有等于 CRA_W_TFD的nal_unit_type的CRA图片时,以下情形适用。
-如果此规范中未指定的某外部装置可用于将变量UseAltCpbParamsFlag设定为一 值,则将UseAltCpbParamsFlag设定为由外部装置提供的值。
-否则,将UseAltCpbParamsFlag的值设定为0。
在当前图片是CRA图片时,以下情形适用。
-如果此规范中未指定的某外部装置可用于将变量HandleCraAsBlaFlag设定为一值,则将HandleCraAsBlaFlag设定为由外部装置提供的值。
-否则,将HandleCraAsBlaFlag的值设定为0。
在当前图片是CRA图片且HandleCraAsBlaFlag等于1时,在针对每一经解码切片NAL单元的解析及解码过程期间,以下情形适用,且将CRA图片视作BLA图片并将 CRA存取单元视作BLA存取单元:
-如果nal_unit_type的值等于CRA_W_TFD,则将nal_unit_type的值设定为BLA_W_TFD。否则,如果nal_unit_type的值等于CRA_W_DLP,则将nal_unit_type的值设定为BLA_W_DLP。否则,将nal_unit_type的值设定为BLA_N_LP。
-将no_output_of_prior_pics_flag的值设定为1。
此外,上文引用的HEVC WD8的子条款C.2.1中的文本可由以下内容替换:
变量InitCpbRemovalDelay[SchedSelIdx]及InitCpbRemovalDelayOffset[SchedSelIdx]被设定如下。
-如果以下条件中的一者为真,则InitCpbRemovalDelay[SchedSelIdx]及InitCpbRemovalDelayOffset[SchedSelIdx]分别被设定为相关联的缓冲周期SEI消息的对应initial_alt_cpb_removal_delay[SchedSelIdx]及initial_alt_cpb_removal_delay_offset[SchedSelIdx]的值:
-存取单元0是经译码图片具有等于BLA_W_DLP或BLA_N_LP的nal_unit_type的BLA存取单元,且相关联的缓冲周期SEI消息的rap_cpb_params_present_flag的值等于1;
-存取单元0是经译码图片具有等于CRA_W_DLP或CRA_N_LP的nal_unit_type 的CRA存取单元,且相关联的缓冲周期SEI消息的rap_cpb_params_present_flag的值等 于1;
-存取单元0是经译码图片具有等于BLA_W_TFD的nal_unit_type的BLA存取单 元或是经译码图片具有等于CRA_W_TFD的nal_unit_type的CRA存取单元, UseAltCpbParamsFlag等于1,且相关联的缓冲周期SEI消息的 rap_cpb_pararms_present_flag的值等于1;
-SubPicCpbFlag等于1。
-否则,InitCpbRemovalDelay[SchedSelIdx]及InitCpbRemovalDelayOffset[SchedSelIdx]分别被设定为相关联的缓冲周期SEI消息的对应initial_cpb_removal_delay[SchedSelIdx]及initial_cpb_removal_delay_offset[SchedSelIdx]的值。
网络实体29或经配置以设定UseAltCpbParamsFlag的值的另一外部装置可如下起作用。网络实体29可将消息发送至视频解码器30或含有视频解码器30的接收器。消息可指示,特定BLA或CRA图片具有相关联的TFD图片但相关联的TFD图片被舍弃,且因此应使用CPB参数的替代性集合。在接收到此消息时,视频解码器30可将针对特定BLA或CRA图片的UseAltCpbParamsFlag的值设定为1。如果特定BLA或CRA不具有TFD图片,或其具有TFD图片但未被舍弃,则不需要发送消息,或发送消息以指导视频解码器30将针对特定BLA或CRA图片的UseAltCpbParamsFlag的值设定为0。
在另一实例中,视频解码器30接收表示多个图片的位流,所述多个图片包含一或多个CRA图片或BLA图片;且还自网络实体29接收消息,所述消息指示针对CRA图片或BLA图片中的至少一者的NAL单元类型。视频解码器30基于接收到的消息设定变量,所述变量经定义以指示针对CRA图片或BLA图片中的给定一者的NAL单元类型。视频解码器30接着设定针对CRA图片或BLA图片中的给定一者的NAL单元类型,且基于NAL单元类型选择用于给定图片的CPB参数的集合。
根据此实例,可针对每一CRA或BLA图片而定义变量UseThisNalUnitType。此变量的值由网络实体29或某其它外部装置来设定。如果此外部装置不可用,则视频解码器30可将变量的值设定为CRA或BLA图片的nal_unit_type。在一些实例中,此变量的可能值是CRA_NUT、BLA_W_TFD、BLA_W_DLP及BLA_N_LP。在其它实例中,此变量的可能值可包含经配置以指示一般CRA图片、具有非可解码前置图片的BLA图片、具有可解码前置图片的BLA图片,及无前置图片的BLA图片的其它nal_unit_type。
在此状况下,上文引用的HEVC WD8的子条款8.1中的文本可由以下内容替换:
在当前图片是BLA或CRA图片时,以下情形适用。
-如果此规范中未指定的某外部装置可用于将变量UseThisNalUnitType设定为一值,则将UseThisNalUnitType设定为由外部装置提供的值。对于具有等于BLA_N_LP的nal_unit_type的BLA图片,外部装置可仅将UseThisNalUnitType设定为BLA_N_LP;对于具有等于BLA_W_DLP的nal_unit_type的BLA图片,外部装置可仅将UseThisNalUnitType设定为BLA_W_DLP或是BLA_N_LP;对于具有等于BLA_W_TFD的nal_unit_type的BLA图片,外部装置可仅将UseThisNalUnitType设定为BLA_W_TFD、BLA_W_DLP及BLA_N_LP中的一者;对于BLA图片,外部装置应从不设定UseThisNalUnitType来指示CRA图片或任何其它图片类型;对于CRA图片,外部装置可将UseThisNalUnitType设定为CRA_NUT、BLA_W_TFD、BLA_W_DLP及BLA_N_LP中的一者而非任何其它值。
-否则,将UseThisNalUnitType的值设定为当前图片的nal_unit_type。
在当前图片是CRA或BLA图片时,在针对每一经译码切片NAL单元的解析及解码过程期间,以下情形适用:
-将nal_unit_type的值设定为UseThisNalUnitType,且根据等于UseThisNalUnitType的nal_unit_type的值将当前图片或存取单元视作CRA或BLA图片或存取单元。
-如果当前图片在以上步骤之前是CRA图片且已变为BLA图片,则将no_output_of_prior_pics_flag的值设定为1。
上文引用的HEVC WD8的子条款C.2.1中的文本并不需要被改变。
作为另一实例,并非使用指示一般CRA图片的仅一个NAL单元类型(例如,CRA_NUT),本发明的技术允许使用三个不同NAL单元类型,所述不同NAL单元类型分别指示具有非可解码前置图片的CRA图片(例如,CRA_W_TFD),指示具有可解码前置图片的CRA图片(例如,CRA_W_DLP),且指示无前置图片的CRA图片(例如,CRA_N_LP)。在此状况下,如上文所描述地改变HEVC WD8中的表7-1及表下方的注释。
此外,类似于上述第二实例,针对每一CRA或BLA图片而定义变量UseThisNalUnitType。此变量的值由网络实体29或另一外部装置来设定。如果此外部装置不可用,则视频解码器30可将变量的值设定为CRA或BLA图片的nal_unit_type。在一些实例中,此变量的可能值是CRA_W_TFD、CRA_W_DLP、CRA_N_LP、BLA_W_TFD、BLA_W_DLP及BLA_N_LP。在其它实例中,此变量的可能值可包含其它nal_unit_type,所述nal_unit_type经配置以指示具有非可解码前置图片的CRA图片、具有可解码前置图片的CRA图片、无前置图片的CRA图片、具有非可解码前置图片的BLA图片、具有可解码前置图片的BLA图片,及无前置图片的BLA图片。
在此状况下,上文引用的HEVC WD8的子条款8.1中的文本可由以下内容替换:
在当前图片是BLA或CRA图片时,以下情形适用。
-如果此规范中未指定的某外部装置可用于将变量UseThisNalUnitType设定为一值,则将UseThisNalUnitType设定为由外部装置提供的值。
对于具有等于BLA_N_LP的nal_unit_type的BLA图片,外部装置可仅将UseThisNalUnitType设定为BLA_N_LP;对于具有等于BLA_W_DLP的nal_unit_type的BLA图片,外部装置可仅将UseThisNalUnitType设定为BLA_W_DLP或是BLA_N_LP;对于具有等于BLA_W_TFD的nal_unit_type的BLA图片,外部装置可仅将UseThisNalUnitType设定为BLA_W_TFD、BLA_W_DLP及BLA_N_LP中的一者;对于BLA图片,外部装置应从不设定UseThisNalUnitType来指示CRA图片或任何其它图片类型。
对于具有等于CRA_N_LP的nal_unit_type的CRA图片,外部装置可仅将UseThisNalUnitType设定为CRA_N_LP或BLA_N_LP;对于具有等于CRA_W_DLP的nal_unit_type的CRA图片,外部装置可仅将UseThisNalUnitType设定为CRA_W_DLP、CRA_N_LP、BLA_W_DLP或BLA_N_LP;对于具有等于CRA_W_TFD的nal_unit_type的CRA图片,外部装置可仅将UseThisNalUnitType设定为CRA_W_TFD、CRA_W_DLP、CRA_N_LP、BLA_W_TFD、BLA_W_DLP或BLA_N_LP。
-否则,将UseThisNalUnitType的值设定为当前图片的nal_unit_type。
在当前图片是CRA或BLA图片时,在针对每一经译码切片NAL单元的解析及解码过程期间,以下情形适用:
-将nal_unit_type的值设定为UseThisNalUnitType,且根据等于UseThisNalUnitType的nal_unit_type的值将当前图片或存取单元视作CRA或BLA图片或存取单元。
-如果当前图片在以上步骤之前是CRA图片且已变为BLA图片,则将no_output_of_prior_pics_flag的值设定为1。
此外,上文引用的HEVC WD8的子条款C.2.1中的文本可由以下内容替换:
变量InitCpbRemovalDelay[SchedSelIdx]及InitCpbRemovalDelayOffset[SchedSelIdx]被设定如下。
-如果以下条件中的一者为真,则InitCpbRemovalDelay[SchedSelIdx]及InitCpbRemovalDelayOffset[SchedSelIdx]分别被设定为相关联的缓冲周期SEI消息的对应initial_alt_cpb_removal_delay[SchedSelIdx]及initial_alt_cpb_removal_delay_offset[SchedSelIdx]的值:
-存取单元0是经译码图片具有等于BLA_W_DLP或BLA_N_LP的nal_unit_type的BLA存取单元,且相关联的缓冲周期SEI消息的rap_cpb_params_present_flag的值等于1;
-存取单元0是经译码图片具有等于CRA_W_DLP或CRA_N_LP的nal_unit_type 的CRA存取单元,且相关联的缓冲周期SEI消息的rap_cpb_params_present_flag的值等 于1;
-SubPicCpbFlag等于1。
-否则,InitCpbRemovalDelay[SchedSelIdx]及InitCpbRemovalDelayOffset[SchedSelIdx]分别被设定为相关联的缓冲周期SEI消息的对应initial_cpb_removal_delay[SchedSelIdx]及initial_cpb_removal_delay_offset[SchedSelIdx]的值。
图4是说明经配置以根据假想参考解码器(HRD)操作的实例目的地装置100的框图。在此实例中,目的地装置100包含输入接口102、流调度器104、经译码图片缓冲器(CPB)106、视频解码器108、经解码图片缓冲器(DPB)110、再现单元112,及输出接口114。目的地装置100可实质上对应于来自图1的目的地装置14。输入接口102可包括能够接收视频数据的经译码位流的任何输入接口,且可实质上对应于来自图1的输入接口28。举例来说,输入接口102可包括接收器、调制解调器、例如有线或无线接口的网络接口、存储器或存储器接口、用于自盘片读取数据的驱动器(例如,光驱接口或磁性媒体接口)或其它接口组件。
输入接口102可接收包含视频数据的经译码位流且将位流提供至流调度器104。流调度器104自位流提取视频数据单元(例如,存取单元及/或解码单元),且将所提取的单元存储至CPB 106。以此方式,流调度器104表示假想流调度器(HSS)的实例实施。CPB106可实质上符合来自图3的CPB 68,只不过如图4中所展示,CPB 106与视频解码器108分离。在不同实例中,CPB 106可与视频解码器108分离,或经集成作为视频解码器108的部分。
视频解码器108包含DPB 110。视频解码器108可实质上符合来自图1及图3的视频解码器30。DPB 110可实质上符合来自图3的DPB 82。因此,视频解码器108可解码CPB 106的解码单元。此外,视频解码器108可自DPB 110输出经解码的图片。视频解码器108可将输出图片传递至再现单元112。再现单元112可裁切图片,且接着将经裁切的图片传递至输出接口114。输出接口114又可将经裁切的图片提供至可实质上符合来自图1的显示装置32的显示装置。
显示装置可形成目的地装置100的部分,且可通信地耦合至目的地装置100。举例来说,显示装置可包括与目的地装置100集成的屏幕、触摸屏、投影仪或其它显示单元,或可包括例如电视、监视器、投影仪、触摸屏或通信地耦合至目的地装置100的其它装置的分离显示器。通信耦合可包括例如通过同轴电缆、复合视频电缆、色差视频电缆、高清晰度多媒体接口(HDMI)电缆、射频广播,或其它有线或无线耦合进行的有线或无线耦合。
图5是说明基于变量选择经译码图片缓冲器(CPB)参数的集合的实例操作的流程图,所述变量指示用于位流中的特定随机存取点(RAP)图片的CPB参数的集合。关于来自图3的包含CPB 68的视频解码器30来描述所说明的操作。在其它实例中,类似操作可由包含CPB 66的来自图2的视频编码器20、包含CPB 106及视频解码器108的来自图4的目的地装置100或包含具有经配置以根据HRD操作而操作的CPB的视频编码器或视频解码器的其它装置来执行。
视频解码器30接收包含一或多个CRA图片或BLA图片的位流(120)。连同位流,视频解码器30还接收消息,所述消息指示是否针对CRA或BLA图片中的特定一者使用CPB参数的替代性集合(122)。更具体来说,视频解码器30可自例如网络实体29的外部装置接收消息,所述网络实体29能够舍弃与特定图片相关联的TFD图片,且还能够向视频解码器30通知TFD图片已被舍弃。
举例来说,当特定图片在自视频编码器20输出的原始位流中具有TFD图片,且TFD图片已被外部装置舍弃时,由视频解码器30接收到的消息指示针对特定图片使用CPB参数的替代性集合。作为另一实例,当特定图片在自视频编码器20输出的原始位流中不具有TFD图片或特定图片具有在原始位流中的TFD图片且TFD图片尚未被外部装置舍弃时,由视频解码器30接收到的消息并不指示针对特定图片使用CPB参数的替代性集合。在此状况下,可基于图片的NAL单元类型而将CPB参数的默认集合或是替代性集合用于CRA图片或BLA图片中的一者。
视频解码器30基于接收到的消息设定变量(例如,UseAltCpbParamsFlag),所述变量经定义以指示用于特定图片的CPB参数的集合(124)。举例来说,当接收到的消息指示用于特定图片的CPB参数的替代性集合时,视频解码器30可将UseAltCpbParamsFlag设定为等于1。相反,当接收到的消息并未明确指示用于特定图片的CPB参数的替代性集合时,视频解码器30可将UseAltCpbParamsFlag设定为等于0。在一些状况下,视频解码器30可不接收针对CRA图片或BLA图片中的至少一者的消息。视频解码器30可接着将UseAltCpbParamsFlag设定为等于0。
视频解码器30接着设定针对特定图片的NAL单元类型(126)。在一些状况下,视频解码器30可将针对特定图片的NAL单元类型设定为如在位流中所发信的。在其它状况下,视频解码器30可至少部分基于针对图片的变量来设定针对特定图片的NAL单元类型。在下文关于图6更详细地描述NAL单元类型选择操作。视频解码器30基于针对特定图片的NAL单元类型及变量来选择用于特定图片的CPB参数的默认集合或替代性集合(128)。详细地说,视频解码器30在变量并未指示CPB参数的替代性集合时针对一或多个NAL单元类型选择CPB参数的默认集合;且在变量指示CPB参数的替代性集合时且针对一或多个不同NAL单元类型针对一或多个NAL单元类型选择CPB参数的替代性集合。在下文关于图7更详细地描述CPB参数集选择操作。
图6是说明基于变量设定针对特定RAP图片的网络层抽象(NAL)单元类型的实例操作的流程图,所述变量指示用于图片的CPB参数的集合。关于来自图3的包含CPB 68的视频解码器30来描述所说明的操作。在其它实例中,类似操作可由包含CPB 66的来自图2的视频编码器20、包含CPB 106及视频解码器108的来自图4的目的地装置100或包含具有经配置以根据HRD操作而操作的CPB的视频编码器或视频解码器的其它装置来执行。
视频解码器30接收包含一或多个CRA图片或BLA图片的位流(150)。视频解码器30接收消息,所述消息指示是否针对CRA图片或BLA图片中的特定一者使用CPB参数的替代性集合(152)。视频解码器30基于接收到的消息设定变量,所述变量经定义以指示用于特定图片的CPB参数的集合(154)。
当特定图片是BLA图片(156的否分支)时,视频解码器30将针对特定BLA图片的NAL单元类型设定为如在位流中所发信的(158)。当特定图片是CRA图片(156的是分支)时且当CRA图片并未作为BLA图片进行处置(160的否分支)时,视频解码器30亦将针对特定CRA图片的NAL单元类型设定为如在位流中发信的(158)。
常规地,当将CRA图片作为BLA图片处置时,设定针对CRA图片的NAL单元类型以指示具有非可解码前置图片的BLA图片(例如,BLA_W_TFD),此情形导致针对图片选择CPB参数的默认集合。在一些状况下,图片可能不具有相关联的TFD图片,且使用CPB参数的默认集合可导致CPB的溢出。根据本发明的技术,当特定图片是CRA图片(156的是分支)且CRA图片被作为BLA图片进行处置(160的是分支)时,视频解码器30基于针对特定CRA图片的变量来设定针对特定图片的NAL单元类型。
举例来说,当变量并未明确指示CPB参数的替代性集合(162的否分支)时,视频解码器30设定针对特定图片的NAL单元类型以指示具有非可解码前置图片的BLA图片(例如,BLA_W_TFD),此情形指示特定图片具有相关联的TFD图片(164)。在此状况下,将针对特定图片适当地选择CPB参数的默认集合。当变量指示CPB参数的替代性集合(162的是分支)时,视频解码器30设定针对特定图片的NAL单元类型以指示具有可解码前置图片的BLA图片(例如,BLA_W_DLP),此情形指示特定图片不具有相关联的TFD图片(166)。在此状况下,将针对特定图片适当地选择CPB参数的替代性集合。以此方式,所述技术确保视频解码器的CPB将不会归因于使用不适当CPB参数而溢出。
图7是说明基于针对图片的NAL单元类型及变量选择用于特定RAP图片的CPB参数的集合的实例操作的流程图,所述变量指示用于图片的CPB参数的集合。关于来自图3的包含CPB 68的视频解码器30来描述所说明的操作。在其它实例中,类似操作可由包含CPB 66的来自图2的视频编码器20、包含CPB 106及视频解码器108的来自图4的目的地装置100或包含具有经配置以根据HRD操作而操作的CPB的视频编码器或视频解码器的其它装置来执行。
视频解码器30接收包含一或多个CRA图片或BLA图片的位流(170)。视频解码器30接收消息,所述消息指示是否针对CRA图片或BLA图片中的特定一者使用CPB参数的替代性集合(172)。视频解码器30基于接收到的消息设定变量,所述变量经定义以指示用于特定图片的CPB参数的集合(174)。视频解码器30接着设定针对特定图片的NAL单元类型(176)。如上文关于图6所描述,视频解码器30可将特定图片的NAL单元类型设定为如在位流中发信的,或可基于针对图片的变量来设定针对特定图片的NAL单元类型。
当特定图片是具有指示具有可解码前置图片的BLA图片(例如,BLA_W_DLP)或指示无前置图片的BLA图片(例如,BLA_N_LP)的NAL单元类型的BLA图片时(所述情形指示特定图片不具有相关联的TFD图片)(178的是分支),视频解码器30基于NAL单元类型来选择用于特定图片的CPB参数的替代性集合(180)。常规地,CPB参数的默认集合是用于具有相关联的TFD图片的任何CRA图片或BLA图片(例如,BLA_W_TFD)。然而,在一些状况下,原始位流中的与特定图片相关联的TFD图片可在位流到达视频解码器之前被舍弃。视频解码器接着即使在图片不再具有相关联的TFD图片时亦基于NAL单元类型使用默认CPB参数,此情形可导致CPB的溢出。
根据本发明的技术,当特定图片是具有指示具有非可解码前置图片的BLA图片的NAL单元类型(例如,BLA_W_TFD)的CRA图片或BLA图片(此情形指示特定图片具有相关联的TFD图片)(182的是分支)时,视频解码器30基于针对特定图片的变量来选择用于特定图片的CPB参数的集合。举例来说,当变量并未明确指示CPB参数的替代性集合(184的否分支)时,视频解码器30基于变量选择用于特定图片的CPB参数的默认集合(186)。当变量指示CPB参数的替代性集合(184的是分支)时,视频解码器30基于变量选择用于特定图片的CPB参数的替代性集合(188)。以此方式,所述技术确保视频解码器的CPB不会归因于使用不适当CPB参数而溢出。
图8是说明基于变量选择CPB参数的集合的实例操作的流程图,所述变量经定义以指示针对位流中的特定RAP图片的网络层抽象(NAL)单元类型。关于来自图3的包含CPB 68的视频解码器30来描述所说明的操作。在其它实例中,类似操作可由包含CPB66的来自图2的视频编码器20、包含CPB 106及视频解码器108的来自图4的目的地装置100或包含具有经配置以根据HRD操作而操作的CPB的视频编码器或视频解码器的其它装置来执行。
视频解码器30接收包含一或多个CRA图片或BLA图片的位流(190)。连同位流,视频解码器30还接收消息,所述消息指示针对CRA或BLA图片中的特定一者的NAL单元类型(192)。更具体来说,视频解码器30可自例如网络实体29的外部装置接收消息,所述网络实体29能够舍弃与特定图片相关联的TFD图片,且还能够向视频解码器30通知TFD图片已被舍弃。
举例来说,当特定图片具有在自视频编码器20输出的原始位流中的TFD图片,且TFD图片已由外部装置舍弃时,由视频解码器30接收到的消息可指示针对特定图片的NAL单元类型,所述NAL单元类型指示具有可解码前置图片的BLA图片(例如,BLA_W_DLP),或指示无前置图片的BLA图片(例如,BLA_N_LP)。作为另一实例,当特定图片具有在原始位流中的TFD图片且TFD图片尚未被外部装置舍弃时,由视频解码器30接收到的消息可指示针对CRA图片或BLA图片中的一者的NAL单元类型,所述NAL单元类型指示具有非可解码前置图片的BLA图片(例如,BLA_W_TFD)。
视频解码器30基于接收到的消息设定变量(例如,UseThisNalUnitType),所述变量经定义以指示针对特定图片的NAL单元类型(194)。举例来说,视频解码器30可将UseThisNalUnitType设定为等于由针对特定图片的所接收到的消息指示的NAL单元类型。在一些状况下,视频解码器30可不接收针对CRA图片或BLA图片中的至少一者的消息。视频解码器30可接着将UseThisNalUnitType设定为等于在位流中针对特定图片所发信的NAL单元类型。视频解码器30基于变量设定针对特定图片的NAL单元类型(196)。视频解码器30接着基于针对特定图片的NAL单元类型来选择用于特定图片的CPB参数的默认集合或替代性集合(198)。
图9是说明形成网络200的部分的装置的实例集合的框图。在此实例中,网络200包含路由装置204A、204B(路由装置204)及转码装置206。路由装置204及转码装置206意欲表示可形成网络200的部分的少量装置。例如交换机、集线器、网关、防火墙、网桥及其它此类装置的其它网络装置也可包含于网络200内。此外,可沿着服务器装置202与客户端装置208之间的网络路径而提供额外网络装置。在一些实例中,服务器装置202可对应于图1的源装置12,而客户端装置208可对应于图1的目的地装置14。
一般来说,路由装置204实施一或多个路由协议以经由网络200交换网络数据。在一些实例中,路由装置204可经配置以执行代理或高速缓存操作。因此,在一些实例中,路由装置204可被称作代理装置。一般来说,路由装置204执行路由协议以发现经由网络200的路由。通过执行此类路由协议,路由装置204B可发现自其自身经由路由装置204A至服务器装置202的网络路由。
本发明的技术可由例如路由装置204及转码装置206的网络装置来实施,但也可由客户端装置208来实施。以此方式,路由装置204、转码装置206及客户端装置208表示经配置以执行本发明的技术(包含在本发明的权利要求书部分中叙述的技术)的装置的实例。此外,图1的装置及展示于图2中的编码器以及展示于图3中的解码器也是可经配置以执行本发明的技术(包含在本发明的权利要求书部分中叙述的技术)的例示性装置。
应认识到,取决于实例,本文中所描述的技术中的任一者的某些动作或事件可以不同序列执行、可被添加、合并或完全省略(例如,对于实践所述技术来说并非所有所描述的动作或事件是必要的)。此外,在某些实例中,可(例如)经由多线程处理、中断处理或多个处理器同时而非顺序地执行动作或事件。
在一或多个实例中,所描述功能可以硬件、软件、固件或其任何组合予以实施。如果以软件予以实施,则所述功能可作为一或多个指令或代码而存储于计算机可读媒体上或经由计算机可读媒体进行发射,且由基于硬件的处理单元执行。计算机可读媒体可包含计算机可读存储媒体(其对应于例如数据存储媒体的有形媒体)或通信媒体,通信媒体包含(例如)根据通信协议促进计算机程序自一处传送至另一处的任何媒体。以此方式,计算机可读媒体通常可对应于(1)非暂时性的有形计算机可读存储媒体,或(2)例如信号或载波的通信媒体。数据存储媒体可为可由一或多个计算机或一或多个处理器存取以检索指令、代码及/或数据结构以用于实施本发明中所描述的技术的任何可用媒体。计算机程序产品可包含计算机可读媒体。
通过实例而非限制,此些计算机可读存储媒体可包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁性存储装置、闪存,或可用以存储呈指令或数据结构的形式的所要程序代码且可由计算机存取的任何其它媒体。又,任何连接可适当地称为计算机可读媒体。举例来说,如果使用同轴电缆、光缆、双绞线、数字用户线(DSL)或无线技术(例如,红外线、无线电及微波)而自网站、服务器或其它远程源发射指令,则同轴电缆、光缆、双绞线、DSL或无线技术(例如,红外线、无线电及微波)包含于媒体的定义中。然而,应理解,计算机可读存储媒体及数据存储媒体不包含连接、载波、信号或其它暂时性媒体,而是针对非暂时性有形存储媒体。如本文中所使用,磁盘及光盘包含光盘(CD)、激光光盘、光学光盘、数字多功能光盘(DVD)、软磁盘及蓝光光盘,其中磁盘通常以磁性方式再生数据,而光盘通过激光以光学方式再生数据。以上各物的组合也应包含于计算机可读媒体的范围内。
可由例如一或多个数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA)或其它等效集成或离散逻辑电路的一或多个处理器来执行指令。因而,本文中所使用的术语“处理器”可指代上述结构或适合于实施本文中所描述的技术的任何其它结构中的任一者。此外,在一些方面中,可将本文中所描述的功能性提供于经配置以用于编码及解码的专用硬件及/或软件模块内,或并入于组合式编解码器中。又,所述技术可完全以一或多个电路或逻辑组件来实施。
本发明的技术可以多种装置或设备予以实施,所述装置或设备包含无线手机、集成电路(IC)或IC集合(例如,芯片集)。在本发明中描述各种组件、模块或单元以强调经配置以执行所揭示技术的装置的功能方面,但未必要求通过不同硬件单元来实现。确切来说,如上文所描述,可将各种单元组合于编解码器硬件单元中,或通过互操作性硬件单元(包含如上文所描述的一或多个处理器)的集合结合合适软件及/或固件来提供所述单元。
已描述各种实例。此些及其它实例属于以下权利要求书的范围内。

Claims (46)

1.一种处理视频数据的方法,所述方法包括:
接收表示多个图片的位流,所述多个图片包含清洁随机存取CRA图片或断链存取BLA图片中的一或多者;
接收消息,所述消息指示是否针对所述CRA图片或所述BLA图片中的至少一者使用经译码图片缓冲器CPB参数的替代性集合;
基于所述接收到的消息设定经定义以指示用于所述CRA图片或所述BLA图片中的所述一者的CPB参数的所述集合的变量;以及
基于针对所述CRA图片或所述BLA图片中的所述一者的所述变量选择用于所述图片的CPB参数的所述集合。
2.根据权利要求1所述的方法,其进一步包括使用所述CRA图片或所述BLA图片中的所述一者及相关联的假想参考解码器HRD参数来初始化HRD,其中所述HRD参数包含用于所述图片的CPB参数的所述所选择集合。
3.根据权利要求1所述的方法,其中所述CRA图片或所述BLA图片中的所述一者包括具有网络抽象层NAL单元类型的CRA图片或BLA图片中的一者,所述网络抽象层NAL单元类型指示具有非可解码前置图片的BLA图片,且针对所述图片的所述变量并不指示CPB参数的所述替代性集合,且其中选择CPB参数的所述集合包括选择用于所述图片的CPB参数的默认集合。
4.根据权利要求1所述的方法,其中所述CRA图片或所述BLA图片中的所述一者包括具有网络抽象层NAL单元类型的CRA图片或BLA图片中的一者,所述网络抽象层NAL单元类型指示具有非可解码前置图片的BLA图片,且针对所述图片的所述变量指示CPB参数的所述替代性集合,且其中选择CPB参数的所述集合包括选择用于所述图片的CPB参数的所述替代性集合。
5.根据权利要求1所述的方法,其进一步包括针对所述CRA图片或所述BLA图片中的所述一者设定网络抽象层NAL单元类型,其中选择CPB参数的所述集合包括基于针对所述CRA图片或所述BLA图片中的所述一者的所述NAL单元类型及所述变量来选择用于所述图片的CPB参数的所述集合。
6.根据权利要求5所述的方法,其中所述CRA图片或所述BLA图片中的所述一者包括作为BLA图片处置的CRA图片,且其中设定所述NAL单元类型包括基于针对作为所述BLA图片处置的所述CRA图片的所述变量来设定针对所述图片的所述NAL单元类型。
7.根据权利要求6所述的方法,其中设定针对作为所述BLA图片处置的所述CRA图片的所述NAL单元类型包括:
基于针对所述图片的指示CPB参数的所述替代性集合的所述变量,设定针对所述图片的所述NAL单元类型以指示具有可解码前置图片的BLA图片;以及
基于针对所述图片的不指示CPB参数的所述替代性集合的所述变量,设定针对所述图片的所述NAL单元类型以指示具有非可解码前置图片的BLA图片。
8.根据权利要求5所述的方法,其中所述CRA图片或所述BLA图片中的所述一者包括CRA图片,且其中设定所述NAL单元类型包括设定针对所述CRA图片的所述NAL单元类型以指示如所发信的一股CRA图片。
9.根据权利要求5所述的方法,其中所述CRA图片或所述BLA图片中的所述一者包括CRA图片,且其中设定所述NAL单元类型包括设定针对所述CRA图片的所述NAL单元类型以指示如所发信的具有非可解码前置图片的CRA图片、具有可解码前置图片的CRA图片或无前置图片的CRA图片中的一者。
10.根据权利要求1所述的方法,其中接收所述消息包括自外部装置接收所述消息,所述消息指示是否针对所述CRA图片或所述BLA图片中的所述一者使用CPB参数的所述替代性集合。
11.根据权利要求10所述的方法,其中所述CRA图片或所述BLA图片中的所述一者具有在原始位流中的非可解码前置图片,且所述非可解码前置图片已被所述外部装置舍弃,且其中所述接收到的消息指示针对所述CRA图片或所述BLA图片中的所述一者使用CPB参数的所述替代性集合。
12.根据权利要求10所述的方法,其中所述CRA图片或所述BLA图片中的所述一者并不具有在原始位流中的非可解码前置图片,或具有在所述原始位流中的非可解码前置图片且所述非可解码前置图片尚未被所述外部装置舍弃,且其中所述接收到的消息并不指示针对所述CRA图片或所述BLA图片中的所述一者使用CPB参数的所述替代性集合。
13.根据权利要求1所述的方法,其进一步包括:
不接收消息,所述消息指示是否针对所述CRA图片或所述BLA图片中的另一者使用CPB参数的所述替代性集合;
设定所述变量以不指示用于所述CRA图片或所述BLA图片中的所述另一者的CPB参数的所述替代性集合;以及
基于针对所述CRA图片或所述BLA图片中的所述另一者的所述变量选择用于所述图片的CPB参数的所述集合。
14.根据权利要求1所述的方法,其中所述CPB参数包含初始CPB移除延迟及初始CPB移除延迟偏移。
15.根据权利要求1所述的方法,其进一步包括将用于所述CRA图片或所述BLA图片中的所述一者的CPB参数的所述所选择集合应用于包含于视频解码装置中的CPB,以确保所述CPB在解码所述视频数据期间不溢出。
16.根据权利要求1所述的方法,其进一步包括将用于所述CRA图片或所述BLA图片中的所述一者的CPB参数的所述所选择集合应用于包含于视频编码装置中的第一CPB,以确保包含于所述视频编码装置中的所述第一CPB在编码所述视频数据期间将不溢出,且确保包含于视频解码装置中的第二CPB在接收到由所述视频编码装置产生的经编码位流时不溢出。
17.一种用于处理视频数据的视频译码装置,所述装置包括:
经译码图片缓冲器CPB,其经配置以存储视频数据;以及
一或多个处理器,其经配置以:接收表示多个图片的位流,所述多个图片包含清洁随机存取CRA图片或断链存取BLA图片中的一或多者;接收消息,所述消息指示是否针对所述CRA图片或所述BLA图片中的至少一者使用CPB参数的替代性集合;基于所述接收到的消息设定经定义以指示用于所述CRA图片或所述BLA图片中的所述一者的CPB参数的所述集合的变量;以及基于针对所述CRA图片或所述BLA图片中的所述一者的所述变量选择用于所述图片的CPB参数的所述集合。
18.根据权利要求17所述的视频译码装置,其中所述处理器经配置以使用所述CRA图片或所述BLA图片中的所述一者及相关联的假想参考解码器HRD参数来初始化HRD,其中所述HRD参数包含用于所述图片的CPB参数的所述所选择集合。
19.根据权利要求17所述的视频译码装置,其中所述CRA图片或所述BLA图片中的所述一者包括具有网络抽象层NAL单元类型的CRA图片或BLA图片中的一者,所述网络抽象层NAL单元类型指示具有非可解码前置图片的BLA图片,且针对所述图片的所述变量并不指示CPB参数的所述替代性集合,且其中所述处理器经配置以选择用于所述图片的CPB参数的默认集合。
20.根据权利要求17所述的视频译码装置,其中所述CRA图片或所述BLA图片中的所述一者包括具有网络抽象层NAL单元类型的CRA图片或BLA图片中的一者,所述网络抽象层NAL单元类型指示具有非可解码前置图片的BLA图片,且针对所述图片的所述变量指示CPB参数的所述替代性集合,且其中所述处理器经配置以选择用于所述图片的CPB参数的所述替代性集合。
21.根据权利要求17所述的视频译码装置,其中所述处理器经配置以设定针对所述CRA图片或所述BLA图片中的所述一者的网络抽象层NAL单元类型,且基于针对所述CRA图片或所述BLA图片中的所述一者的所述NAL单元类型及所述变量来选择用于所述图片的CPB参数的所述集合。
22.根据权利要求21所述的视频译码装置,其中所述CRA图片或所述BLA图片中的所述一者包括作为BLA图片处置的CRA图片,且其中所述处理器经配置以基于针对作为所述BLA图片处置的所述CRA图片的所述变量来设定针对所述图片的所述NAL单元类型。
23.根据权利要求22所述的视频译码装置,其中:
基于针对所述图片的指示CPB参数的所述替代性集合的所述变量,所述处理器经配置以设定针对作为所述BLA图片处置的所述CRA图片的所述NAL单元类型以指示具有可解码前置图片的BLA图片;以及
基于针对所述图片的不指示CPB参数的所述替代性集合的所述变量,所述参数经配置以设定针对作为所述BLA图片处置的所述CRA图片的所述NAL单元类型以指示具有非可解码前置图片的BLA图片。
24.根据权利要求21所述的视频译码装置,其中所述CRA图片或所述BLA图片中的所述一者包括CRA图片,且其中所述处理器经配置以设定针对所述CRA图片的所述NAL单元类型以指示如所发信的一股CRA图片。
25.根据权利要求21所述的视频译码装置,其中所述CRA图片或所述BLA图片中的所述一者包括CRA图片,且其中所述处理器经配置以设定针对所述CRA图片的所述NAL单元类型以指示如所发信的具有非可解码前置图片的CRA图片、具有可解码前置图片的CRA图片或无前置图片的CRA图片中的一者。
26.根据权利要求17所述的视频译码装置,其中所述处理器经配置以自外部装置接收所述消息,所述消息指示是否针对所述CRA图片或所述BLA图片中的所述一者使用CPB参数的所述替代性集合。
27.根据权利要求26所述的视频译码装置,其中所述CRA图片或所述BLA图片中的所述一者具有在原始位流中的非可解码前置图片,且所述非可解码前置图片已被所述外部装置舍弃,且其中所述接收到的消息指示针对所述CRA图片或所述BLA图片中的所述一者使用CPB参数的所述替代性集合。
28.根据权利要求26所述的视频译码装置,其中所述CRA图片或所述BLA图片中的所述一者并不具有在原始位流中的非可解码前置图片,或具有在所述原始位流中的非可解码前置图片且所述非可解码前置图片尚未被所述外部装置舍弃,且其中所述接收到的消息并不指示针对所述CRA图片或所述BLA图片中的所述一者使用CPB参数的所述替代性集合。
29.根据权利要求17所述的视频译码装置,其中所述处理器经配置以:
不接收消息,所述消息指示是否针对所述CRA图片或所述BLA图片中的另一者使用CPB参数的所述替代性集合;
设定所述变量以不指示用于所述CRA图片或所述BLA图片中的所述另一者的CPB参数的所述替代性集合;以及
基于针对所述CRA图片或所述BLA图片中的所述另一者的所述变量选择用于所述图片的CPB参数的所述集合。
30.根据权利要求17所述的视频译码装置,其中所述CPB参数包含初始CPB移除延迟及初始CPB移除延迟偏移。
31.根据权利要求17所述的视频译码装置,其中所述处理器经配置以将用于所述CRA图片或所述BLA图片中的所述一者的CPB参数的所述所选择集合应用于包含于视频解码装置中的CPB,以确保所述CPB在解码所述视频数据期间不溢出。
32.根据权利要求17所述的视频译码装置,其中所述处理器经配置以将用于所述CRA图片或所述BLA图片中的所述一者的CPB参数的所述所选择集合应用于包含于视频编码装置中的第一CPB,以确保包含于所述视频编码装置中的所述第一CPB在编码所述视频数据期间将不溢出,且确保包含于视频解码装置中的第二CPB在接收到由所述视频编码装置产生的经编码位流时不溢出。
33.一种用于处理视频数据的视频译码装置,所述装置包括:
用于接收表示多个图片的位流的装置,所述多个图片包含清洁随机存取CRA图片或断链存取BLA图片中的一或多者;
用于接收消息的装置,所述消息指示是否针对所述CRA图片或所述BLA图片中的至少一者使用经译码图片缓冲器CPB参数的替代性集合;
用于基于所述接收到的消息设定经定义以指示用于所述CRA图片或所述BLA图片中的所述一者的CPB参数的所述集合的变量的装置;以及
用于基于针对所述CRA图片或所述BLA图片中的所述一者的所述变量选择用于所述图片的CPB参数的所述集合的装置。
34.根据权利要求33所述的视频译码装置,其进一步包括用于使用所述CRA图片或所述BLA图片中的所述一者及相关联的假想参考解码器HRD参数来初始化HRD的装置,其中所述HRD参数包含用于所述图片的CPB参数的所述所选择集合。
35.根据权利要求33所述的视频译码装置,其中所述CRA图片或所述BLA图片中的所述一者包括具有网络抽象层NAL单元类型的CRA图片或BLA图片中的一者,所述网络抽象层NAL单元类型指示具有非可解码前置图片的BLA图片,且针对所述图片的所述变量并不指示CPB参数的所述替代性集合,所述视频译码装置进一步包括用于针对所述图片选择CPB参数的默认集合的装置。
36.根据权利要求33所述的视频译码装置,其中所述CRA图片或所述BLA图片中的所述一者包括具有网络抽象层NAL单元类型的CRA图片或BLA图片中的一者,所述网络抽象层NAL单元类型指示具有非可解码前置图片的BLA图片,且针对所述图片的所述变量指示CPB参数的所述替代性集合,所述视频译码装置进一步包括用于针对所述图片选择CPB参数的所述替代性集合的装置。
37.根据权利要求33所述的视频译码装置,其进一步包括用于设定针对所述CRA图片或所述BLA图片中的所述一者的网络抽象层NAL单元类型的装置,及用于基于针对所述CRA图片或所述BLA图片中的所述一者的所述NAL单元类型及所述变量来选择用于所述图片的CPB参数的所述集合的装置。
38.根据权利要求37所述的视频译码装置,其中所述CRA图片或所述BLA图片中的所述一者包括作为BLA图片处置的CRA图片,所述视频译码装置进一步包括用于基于针对作为所述BLA图片处置的所述CRA图片的所述变量来设定针对所述图片的所述NAL单元类型的装置。
39.根据权利要求33所述的视频译码装置,其进一步包括用于自外部装置接收所述消息的装置,所述消息指示是否针对所述CRA图片或所述BLA图片中的所述一者使用CPB参数的所述替代性集合。
40.根据权利要求33所述的视频译码装置,其进一步包括用于将用于所述CRA图片或所述BLA图片中的所述一者的CPB参数的所述所选择集合应用于包含于视频解码装置中的CPB以确保所述CPB在解码所述视频数据期间不溢出的装置。
41.根据权利要求33所述的视频译码装置,其进一步包括用于将用于所述CRA图片或所述BLA图片中的所述一者的CPB参数的所述所选择集合应用于包含于视频编码装置中的第一CPB以确保包含于所述视频编码装置中的所述第一CPB在编码所述视频数据期间将不溢出且确保包含于视频解码装置中的第二CPB在接收到由所述视频编码装置产生的经编码位流时不溢出的装置。
42.一种包括用于处理视频数据的指令的计算机可读媒体,所述指令在执行时使得一或多个处理器:
接收表示多个图片的位流,所述多个图片包含清洁随机存取CRA图片或断链存取BLA图片中的一或多者;
接收消息,所述消息指示是否针对所述CRA图片或所述BLA图片中的至少一者使用经解码图片缓冲器CPB参数的替代性集合;
基于所述接收到的消息设定经定义以指示用于所述CRA图片或所述BLA图片中的所述一者的CPB参数的所述集合的变量;以及
基于针对所述CRA图片或所述BLA图片中的所述一者的所述变量选择用于所述图片的CPB参数的所述集合。
43.根据权利要求42所述的计算机可读媒体,其中所述CRA图片或所述BLA图片中的所述一者包括具有网络抽象层NAL单元类型的CRA图片或BLA图片中的一者,所述网络抽象层NAL单元类型指示具有非可解码前置图片的BLA图片,且针对所述图片的所述变量并不指示CPB参数的所述替代性集合,且其中所述指令使得所述处理器选择用于所述图片的CPB参数的默认集合。
44.根据权利要求42所述的计算机可读媒体,其中所述CRA图片或所述BLA图片中的所述一者包括具有网络抽象层NAL单元类型的CRA图片或BLA图片中的一者,所述网络抽象层NAL单元类型指示具有非可解码前置图片的BLA图片,且针对所述图片的所述变量指示CPB参数的所述替代性集合,且其中所述指令使得所述处理器针对所述图片选择CPB参数的所述替代性集合。
45.根据权利要求42所述的计算机可读媒体,其中所述指令使得所述处理器设定针对所述CRA图片或所述BLA图片中的所述一者的网络抽象层NAL单元类型,且基于针对所述CRA图片或所述BLA图片中的所述一者的所述NAL单元类型及所述变量来选择用于所述图片的CPB参数的所述集合。
46.根据权利要求45所述的计算机可读媒体,其中所述CRA图片或所述BLA图片中的所述一者包括作为BLA图片处置的CRA图片,且其中所述指令使得所述处理器基于针对作为所述BLA图片处置的所述CRA图片的所述变量来设定针对所述图片的所述NAL单元类型。
CN201380048461.XA 2012-09-20 2013-08-27 具有改善随机存取点图片行为的视频译码 Active CN104641637B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201261703695P 2012-09-20 2012-09-20
US61/703,695 2012-09-20
US13/952,340 2013-07-26
US13/952,340 US9374583B2 (en) 2012-09-20 2013-07-26 Video coding with improved random access point picture behaviors
PCT/US2013/056904 WO2014046850A1 (en) 2012-09-20 2013-08-27 Video coding with improved random access point picture behaviors

Publications (2)

Publication Number Publication Date
CN104641637A true CN104641637A (zh) 2015-05-20
CN104641637B CN104641637B (zh) 2019-04-02

Family

ID=50274437

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201380048461.XA Active CN104641637B (zh) 2012-09-20 2013-08-27 具有改善随机存取点图片行为的视频译码

Country Status (24)

Country Link
US (1) US9374583B2 (zh)
EP (1) EP2898677B1 (zh)
JP (1) JP6271558B2 (zh)
KR (1) KR101721344B1 (zh)
CN (1) CN104641637B (zh)
AR (1) AR093236A1 (zh)
AU (1) AU2013318467B2 (zh)
BR (1) BR112015006059B1 (zh)
CA (1) CA2883439C (zh)
DK (1) DK2898677T3 (zh)
ES (1) ES2684546T3 (zh)
HK (1) HK1205841A1 (zh)
HU (1) HUE039076T2 (zh)
IL (1) IL237365B (zh)
MY (1) MY181728A (zh)
PH (1) PH12015500517A1 (zh)
PT (1) PT2898677T (zh)
RU (1) RU2624100C2 (zh)
SG (1) SG11201501407TA (zh)
SI (1) SI2898677T1 (zh)
TW (1) TWI559774B (zh)
UA (1) UA117462C2 (zh)
WO (1) WO2014046850A1 (zh)
ZA (1) ZA201502302B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113785584A (zh) * 2019-03-01 2021-12-10 弗劳恩霍夫应用研究促进协会 假想参考解码器

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150003536A1 (en) * 2012-02-08 2015-01-01 Thomson Licensing Method and apparatus for using an ultra-low delay mode of a hypothetical reference decoder
US9351016B2 (en) 2012-04-13 2016-05-24 Sharp Kabushiki Kaisha Devices for identifying a leading picture
US20140003520A1 (en) * 2012-07-02 2014-01-02 Cisco Technology, Inc. Differentiating Decodable and Non-Decodable Pictures After RAP Pictures
US9374585B2 (en) * 2012-12-19 2016-06-21 Qualcomm Incorporated Low-delay buffering model in video coding
US10264272B2 (en) * 2013-10-15 2019-04-16 Qualcomm Incorporated Device and method for scalable coding of video information
US10547834B2 (en) * 2014-01-08 2020-01-28 Qualcomm Incorporated Support of non-HEVC base layer in HEVC multi-layer extensions
US20150264404A1 (en) * 2014-03-17 2015-09-17 Nokia Technologies Oy Method and apparatus for video coding and decoding
US10715833B2 (en) * 2014-05-28 2020-07-14 Apple Inc. Adaptive syntax grouping and compression in video data using a default value and an exception value
US10116576B2 (en) * 2015-10-19 2018-10-30 Samsung Electronics Co., Ltd. Methods and apparatus for random access of HEVC bitstream for MMT
BR112021012679A2 (pt) * 2018-12-27 2021-09-08 Huawei Technologies Co., Ltd. Codificador de vídeo, decodificador de vídeo e métodos correspondentes
EP3939290B1 (en) * 2019-04-03 2023-10-04 Huawei Technologies Co., Ltd. Interlaced video coding with leading pictures
US11695965B1 (en) * 2022-10-13 2023-07-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Video coding using a coded picture buffer

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120230402A1 (en) * 2011-03-08 2012-09-13 Sony Corporation Context reduction for last transform position coding

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MY134659A (en) * 2002-11-06 2007-12-31 Nokia Corp Picture buffering for prediction references and display
US8599925B2 (en) * 2005-08-12 2013-12-03 Microsoft Corporation Efficient coding and decoding of transform blocks
US8358665B2 (en) 2008-08-15 2013-01-22 Qualcomm Incorporated Method and apparatus for controlling the presentation of multimedia data from a multiplex signal between devices in a local area network
US20100098156A1 (en) 2008-10-16 2010-04-22 Qualcomm Incorporated Weighted prediction based on vectorized entropy coding
JP5072893B2 (ja) * 2009-03-25 2012-11-14 株式会社東芝 画像符号化方法および画像復号化方法
US8665964B2 (en) 2009-06-30 2014-03-04 Qualcomm Incorporated Video coding based on first order prediction and pre-defined second order prediction mode
US8537200B2 (en) 2009-10-23 2013-09-17 Qualcomm Incorporated Depth map generation techniques for conversion of 2D video data to 3D video data
US9516379B2 (en) 2011-03-08 2016-12-06 Qualcomm Incorporated Buffer management in video codecs
US9706227B2 (en) 2011-03-10 2017-07-11 Qualcomm Incorporated Video coding techniques for coding dependent pictures after random access
US9026671B2 (en) 2011-04-05 2015-05-05 Qualcomm Incorporated IP broadcast streaming services distribution using file delivery methods
JP5993453B2 (ja) 2011-07-15 2016-09-14 テレフオンアクチーボラゲット エルエム エリクソン(パブル) クリーンランダムアクセス画像に最下レイヤ識別情報を割り当てるための符号器およびその方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120230402A1 (en) * 2011-03-08 2012-09-13 Sony Corporation Context reduction for last transform position coding

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
BENJAMIN BROSS 等: "《Proposed Editorial Improvements for High efficiency video coding (HEVC) Text Specification Draft 8》", 《JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG16 WP3 AND ISO/IEC JTC1/SC29/WG11 11TH MEETING: SHANGHAI, CN, 10–19 OCTOBER 2012,JCTVC-K0030_V1》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113785584A (zh) * 2019-03-01 2021-12-10 弗劳恩霍夫应用研究促进协会 假想参考解码器

Also Published As

Publication number Publication date
SG11201501407TA (en) 2015-04-29
HUE039076T2 (hu) 2018-12-28
EP2898677A1 (en) 2015-07-29
TWI559774B (zh) 2016-11-21
HK1205841A1 (zh) 2015-12-24
PH12015500517B1 (en) 2015-04-27
KR20150060776A (ko) 2015-06-03
PH12015500517A1 (en) 2015-04-27
CN104641637B (zh) 2019-04-02
PT2898677T (pt) 2018-10-08
SI2898677T1 (en) 2018-08-31
MY181728A (en) 2021-01-05
AR093236A1 (es) 2015-05-27
DK2898677T3 (en) 2018-08-27
JP6271558B2 (ja) 2018-01-31
IL237365A0 (en) 2015-04-30
KR101721344B1 (ko) 2017-03-29
WO2014046850A1 (en) 2014-03-27
IL237365B (en) 2018-05-31
ZA201502302B (en) 2021-09-29
AU2013318467A1 (en) 2015-03-19
US9374583B2 (en) 2016-06-21
JP2015533048A (ja) 2015-11-16
CA2883439A1 (en) 2014-03-27
RU2624100C2 (ru) 2017-06-30
BR112015006059A2 (pt) 2017-07-04
UA117462C2 (uk) 2018-08-10
AU2013318467B2 (en) 2017-04-20
EP2898677B1 (en) 2018-05-30
BR112015006059B1 (pt) 2023-04-11
CA2883439C (en) 2017-08-01
RU2015114441A (ru) 2016-11-10
US20140079140A1 (en) 2014-03-20
ES2684546T3 (es) 2018-10-03
TW201424392A (zh) 2014-06-16

Similar Documents

Publication Publication Date Title
CN104641637A (zh) 具有改善随机存取点图片行为的视频译码
KR101825262B1 (ko) B 슬라이스에서의 예측 유닛의 단방향성 인터 예측으로의 제한
CN104396257B (zh) 在视频译码中长期参考图片的随机存取和发信
JP5890031B2 (ja) ビデオコーディング用の断片化されたパラメータセット
CN104471942A (zh) 重新使用参数集用于视频译码
CN104823449A (zh) 在视频译码中用信号表示关注区和逐渐解码刷新
CN104412600A (zh) 译码用于视频译码的sei nal单元
CN104396265A (zh) 在视频译码中从清晰随机存取图片的全面随机存取
CN105474645A (zh) 当执行帧内块复制时确定区
CN104704843A (zh) 视频性质的指示
CN104380747A (zh) 视频译码中的参数集更新
CN105409219A (zh) 高效率视频译码扩展中的目标输出层的选择
JP2016539544A (ja) マルチレイヤビデオコーデックのためのマルチモード抽出のサポート
CN103947210A (zh) 视频译码中借助高级经解码图片缓冲器(dpb)管理的随机存取
CN104429081A (zh) 基于干净随机存取(cra)图片的流式传输适应
CN105103560A (zh) 用于仅高级语法可缩放视频译码的层间参考图片限制
CN104685887A (zh) 于视频译码中发信用于操作点的层识别符
CN104488267A (zh) 平铺块及波前并行处理
CN104641639A (zh) 用于视频译码的参数集的指示及激活
CN104509115A (zh) 用于高效视频译码(hevc)和扩展的视频参数集
CN105191310A (zh) 用于视频译码的并行处理
CN104221387A (zh) 在视频译码中的低延迟视频缓冲
CN104904222A (zh) 对视频译码中的视频时序的图片次序计数与时序信息关系的信令
CN104429082A (zh) 用于视频译码的长期参考图片的信令
CN104854870A (zh) 在视频译码中的低延迟缓冲模型

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1205841

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant