CN103299627A - 视频译码中的帧分裂 - Google Patents

视频译码中的帧分裂 Download PDF

Info

Publication number
CN103299627A
CN103299627A CN2012800045853A CN201280004585A CN103299627A CN 103299627 A CN103299627 A CN 103299627A CN 2012800045853 A CN2012800045853 A CN 2012800045853A CN 201280004585 A CN201280004585 A CN 201280004585A CN 103299627 A CN103299627 A CN 103299627A
Authority
CN
China
Prior art keywords
lcu
section
decoded portion
decoding
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012800045853A
Other languages
English (en)
Other versions
CN103299627B (zh
Inventor
陈盈
陈培松
马尔塔·卡切维奇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of CN103299627A publication Critical patent/CN103299627A/zh
Application granted granted Critical
Publication of CN103299627B publication Critical patent/CN103299627B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Abstract

在一个实例中,本发明描述一种解码包括多个块大小的译码单元的视频数据帧的方法,所述多个块大小的译码单元包含一个或一个以上最大译码单元LCU,所述一个或一个以上LCU包含以阶层方式布置的多个相对较小译码单元。在此实例中,所述方法包含确定在形成所述帧的可独立解码部分时已借以分裂所述以阶层方式布置的多个较小译码单元的粒度。所述方法还包含使用所述所确定粒度识别已分裂为第一区段及第二区段的LCU。所述方法还包含解码包含所述LCU的所述第一区段而无所述LCU的所述第二区段的所述帧的可独立解码部分。

Description

视频译码中的帧分裂
本申请案主张2011年1月5日申请的第61/430,104号美国临时申请案、2011年1月21日申请的第61/435,098号美国临时申请案、2011年3月18日申请的第61/454,166号美国临时申请案及2011年6月2日申请的第61/492,751号美国临时申请案的权利,所有所述临时申请案的全部内容以引用的方式并入本文中。
技术领域
本发明涉及视频译码技术,且更特定来说涉及视频译码技术的帧分裂方面。
背景技术
数字视频能力可并入广泛范围的装置中,所述装置包含数字电视、数字直播系统、无线广播系统、个人数字助理(PDA)、膝上型或桌上型计算机、数字相机、数字记录装置、数字媒体播放器、视频游戏装置、视频游戏控制台、蜂窝式或卫星无线电电话、视频电话会议装置及其类似者。数字视频装置实施视频压缩技术(例如,在MPEG-2、MPEG-4、ITU-T H.263、ITU-T H.264/MPEG-4第10部分高级视频译码(AVC)所定义的那些标准及此些标准的扩展中所描述的技术),以更有效率地发射及接收数字视频信息。正在开发例如通过“联合合作小组-视频译码”(JCT-VC)(其为MPEG与ITU-T之间的合作)开发的高效视频译码(HEVC)标准等新视频译码标准。新兴HEVC标准有时被称为H.265,但未正式地作出此指定。
发明内容
本发明描述用于将视频数据帧分裂为帧的可独立解码部分(有时称为切片)的技术。与新兴HEVC标准一致,视频数据块可被称为译码单元(CU)。CU可根据阶层式四叉树结构而分裂为子CU。举例来说,在位流内的语法数据可定义最大译码单元(LCU),就像素的数目来说,LCU为视频数据帧的最大译码单元。一LCU可分裂为多个子CU,且每一子CU可进一步分裂为多个子CU。用于位流的语法数据可定义可分裂LCU的次数,所述次数被称为最大CU深度。
大体来说,描述用于将视频数据帧分裂为帧的可独立解码部分的技术,所述可独立解码部分在新兴HEVC标准中被称为“切片”。并非将这些切片的内容限制于一个或一个以上完整译码单元(CU),例如帧的一个或一个以上完整最大译码单元(LCU),本发明中所描述的技术可提供切片可借以包含LCU的一部分的方式。在使得能够将LCU划分为两个区段的情况下,所述技术可减少在分裂任何给定帧时所需要的切片的数目。减少切片的数目可减少呈存储用以解码经压缩视频数据的语法元素的切片标头数据形式的开销数据,从而改善压缩效率,这是因为开销数据的量相对于经压缩视频数据的量减少。以此方式,所述技术可促进经编码视频数据的更有效存储及发射。
在一实例中,本发明的方面涉及一种解码包括多个块大小的译码单元的视频数据帧的方法,所述多个块大小的译码单元包含一个或一个以上最大译码单元(LCU),所述一个或一个以上LCU包含以阶层方式布置的多个相对较小译码单元。所述方法包含:确定在形成所述帧的可独立解码部分时已借以分裂所述以阶层方式布置的多个较小译码单元的粒度;使用所述所确定粒度识别已分裂为第一区段及第二区段的LCU;及解码包含所述LCU的所述第一区段而无所述LCU的所述第二区段的所述帧的可独立解码部分。
在另一实例中,本发明的方面涉及一种用于解码包括多个块大小的译码单元的视频数据帧的设备,所述多个块大小的译码单元包含一个或一个以上最大译码单元(LCU),所述一个或一个以上LCU包含以阶层方式布置的多个相对较小译码单元。所述设备包含经配置以执行以下操作的一个或一个以上处理器:确定在形成所述帧的可独立解码部分时已借以分裂所述以阶层方式布置的多个较小译码单元的粒度;使用所述所确定粒度识别已分裂为第一区段及第二区段的LCU;及解码包含所述LCU的所述第一区段而无所述LCU的所述第二区段的所述帧的可独立解码部分。
在另一实例中,本发明的方面涉及一种用于解码包括多个块大小的译码单元的视频数据帧的设备,所述多个块大小的译码单元包含一个或一个以上最大译码单元(LCU),所述一个或一个以上LCU包含以阶层方式布置的多个相对较小译码单元。所述设备包含:用于确定在形成所述帧的可独立解码部分时已借以分裂所述以阶层方式布置的多个较小译码单元的粒度的装置;用于使用所述所确定粒度识别已分裂为第一区段及第二区段的LCU的装置;及用于解码包含所述LCU的所述第一区段而无所述LCU的所述第二区段的所述帧的可独立解码部分的装置。
在另一实例中,本发明的方面涉及一种存储指令的计算机可读存储媒体,所述指令在由一个或一个以上处理器执行时使所述一个或一个以上处理器执行用于解码包括多个块大小的解码单元的视频数据帧的方法,所述多个块大小的译码单元包含一个或一个以上最大译码单元(LCU),所述一个或一个以上LCU包含以阶层方式布置的多个相对较小译码单元。所述方法包含:确定在形成所述帧的可独立解码部分时已借以分裂所述以阶层方式布置的多个较小译码单元的粒度;使用所述所确定粒度识别已分裂为第一区段及第二区段的LCU;及解码包含所述LCU的所述第一区段而无所述LCU的所述第二区段的所述帧的可独立解码部分。
在另一实例中,本发明的方面涉及一种编码包括多个块大小的译码单元的视频数据帧的方法,所述多个块大小的译码单元包含一个或一个以上最大译码单元(LCU),所述一个或一个以上LCU包含以阶层方式布置的多个相对较小译码单元。所述方法包含:确定在形成所述帧的可独立解码部分时将借以分裂所述以阶层方式布置的多个较小译码单元的粒度;使用所述所确定粒度分裂LCU以产生所述LCU的第一区段及所述LCU的第二区段;产生所述帧的可独立解码部分以包含所述LCU的所述第一区段而不包含所述LCU的所述第二区段;及产生位流以包含所述帧的所述可独立解码部分及所述所确定粒度的指示。
在另一实例中,本发明的方面涉及一种用于编码包括多个块大小的译码单元的视频数据帧的设备,所述多个块大小的译码单元包含一个或一个以上最大译码单元(LCU),所述一个或一个以上LCU包含以阶层方式布置的多个相对较小译码单元。所述设备包含经配置以执行以下操作的一个或一个以上处理器:确定在形成所述帧的可独立解码部分时将借以分裂所述以阶层方式布置的多个较小译码单元的粒度;使用所述所确定粒度分裂LCU以产生所述LCU的第一区段及所述LCU的第二区段;产生所述帧的可独立解码部分以包含所述LCU的所述第一区段而不包含所述LCU的所述第二区段;及产生位流以包含所述帧的所述可独立解码部分及所述所确定粒度的指示。
在另一实例中,本发明的方面涉及一种用于编码包括多个块大小的译码单元的视频数据帧的设备,所述多个块大小的译码单元包含一个或一个以上最大译码单元(LCU),所述一个或一个以上LCU包含以阶层方式布置的多个相对较小译码单元。所述设备包含:用于确定在形成所述帧的可独立解码部分时将借以分裂所述以阶层方式布置的多个较小译码单元的粒度的装置;用于使用所述所确定粒度分裂LCU以产生所述LCU的第一区段及所述LCU的第二区段的装置;用于产生所述帧的可独立解码部分以包含所述LCU的所述第一区段而不包含所述LCU的所述第二区段的装置;及用于产生位流以包含所述帧的所述可独立解码部分及所述所确定粒度的指示的装置。
在另一实例中,本发明的方面涉及一种存储指令的计算机可读存储媒体,所述指令在由一个或一个以上处理器执行时使所述一个或一个以上处理器执行用于编码包括多个块大小的译码单元的视频数据帧的方法,所述多个块大小的译码单元包含一个或一个以上最大译码单元(LCU),所述一个或一个以上LCU包含以阶层方式布置的多个相对较小译码单元。所述方法包含:确定在形成所述帧的可独立解码部分时将借以分裂所述以阶层方式布置的多个较小译码单元的粒度;使用所述所确定粒度分裂LCU以产生所述LCU的第一区段及所述LCU的第二区段;产生所述帧的可独立解码部分以包含所述LCU的所述第一区段而不包含所述LCU的所述第二区段;及产生位流以包含所述帧的所述可独立解码部分及所述所确定粒度的指示。
本发明的一个或一个以上方面的细节阐述于附图及下文的描述中。本发明中所描述的技术的其它特征、目标及优点将从描述及图式且从权利要求书中显而易见。
附图说明
图1是说明可实施本发明的技术中的一者或一者以上的视频编码及解码系统的框图。
图2是说明与本发明的技术一致的经译码单元(CU)的四叉树分割的概念图。
图3A是说明与本发明的技术一致而将CU的四叉树分裂为切片的概念图。
图3B是说明与本发明的技术一致而将CU分裂为切片的概念图。
图4是说明可实施本发明的技术的视频编码器的框图。
图5是说明可实施本发明的技术的视频解码器的框图。
图6是说明与本发明中所描述的技术一致的编码视频数据的方法的流程图。
图7是说明与本发明中所描述的技术一致的解码视频数据的方法的流程图。
具体实施方式
本发明的技术大体来说包含将视频数据帧分裂为可独立解码部分,其中在可独立解码部分之间的边界可定位于译码单元(CU)(例如,HEVC标准中指定的最大CU(LCU))内。举例来说,本发明的方面可涉及确定借以分裂视频数据帧的粒度,使用所确定粒度分裂帧,及使用CU深度识别粒度。本发明的技术还可包含产生及/或解码与将帧分裂为可独立解码部分相关联的多种参数。举例来说,本发明的方面可涉及使用CU深度识别用以分裂视频数据帧的粒度,识别用于每一可独立解码部分的阶层式四叉树结构的单独部分,及识别用于每一可独立解码部分的量化参数的改变(即,差量)(即,差量QP)。
图1是说明可经配置以利用本发明中所描述的技术的实例视频编码及解码系统10的框图,所述技术用于将视频数据帧分裂为可独立解码部分。根据本发明的方面,视频数据帧的可独立解码部分可大体上被称为与各种视频译码标准(包含所提议的所谓的高效视频译码(HEVC)标准)一致的视频数据的“切片”。切片可描述为可独立解码的,这是因为对于信息,帧的切片不依赖于同一帧的其它切片,且因此可独立于任何其它切片而经解码,因此得名“可独立解码部分”。通过确保切片为可独立解码的,一个切片中的错误或遗漏数据不传播到帧内的任何其它切片中。将错误隔离到帧内的单一切片还可对试图补偿此些错误有辅助。
如图1的实例中所展示,系统10包含产生供目的地装置14解码的经编码视频的源装置12。源装置12可经由通信信道16将经编码视频发射到目的地装置14或可将经编码视频存储于存储媒体34或文件服务器36上,以使得经编码视频可由目的地装置14视需要存取。源装置12及目的地装置14可包括广泛范围的装置中的任一者,所述装置包含桌上型计算机、笔记型(即,膝上型)计算机、平板计算机、机顶盒、例如所谓的智能型电话的电话手持机、电视、相机、显示装置、数字媒体播放器、视频游戏控制台或其类似者。
在许多状况下,此些装置可经装备以用于无线通信。因此,通信信道16可包括无线信道、有线信道或适用于发射经编码视频数据的无线及有线信道的组合。举例来说,通信信道16可包括任何无线或有线通信媒体,例如射频(RF)频谱或一个或一个以上物理发射线或无线及有线媒体的任何组合。通信信道16可形成基于包的网络(例如,局域网、广域网或例如因特网的全球网络)的一部分。通信信道16大体上表示用于将视频数据从源装置12发射到目的地装置14的任何合适的通信媒体或不同通信媒体的集合,包含有线或无线媒体的任何合适组合。通信信道16可包含路由器、交换器、基站或可用于促进从源装置12到目的地装置14的通信的任何其它设备。
根据本发明的实例,用于将视频数据帧分裂为切片的本发明中所描述的技术可应用于视频译码以支持多种多媒体应用中的任一者,例如空中电视广播、有线电视发射、卫星电视发射、(例如)经由因特网的串流视频发射、数字视频的编码以供存储于数据存储媒体上、存储于数据存储媒体上的数字视频的解码,或其它应用。在一些实例中,系统10可经配置以支持单向或双向视频发射以支持例如视频串流发射、视频回放、视频广播及/或视频电话等应用。
如图1的实例中进一步所展示,源装置12包含视频源18、视频编码器20、调制器/解调器22及发射器24。在源装置12中,视频源18可包含例如视频俘获装置的源。作为实例,视频俘获装置可包含以下各者中的一者或一者以上:摄像机、含有先前俘获的视频的视频存档、从视频内容提供者接收视频的视频馈送接口,及/或用于产生计算机图形数据作为源视频的计算机图形系统。作为一个实例,如果视频源18为摄像机,则源装置12及目的地装置14可形成所谓的相机电话或视频电话。然而,本发明的技术不必限于无线应用或设定,且可应用于包含视频编码及/或解码能力的非无线装置。源装置12及目的地装置16仅为可支持本文中所描述的技术的译码装置的实例。
所俘获、预俘获或计算机产生的视频可由视频编码器20编码。经编码视频信息可由调制解调器22根据通信标准(例如,无线通信协议)调制,且经由发射器24发射到目的地装置14。调制解调器22可包含各种混频器、滤波器、放大器或经设计以用于信号调制的其它组件。发射器24可包含经设计以用于发射数据的电路,包含放大器、滤波器及一个或一个以上天线。
由视频编码器20编码的所俘获、预俘获或计算机产生的视频还可存储到存储媒体34或文件服务器36上以供稍后消耗。存储媒体34可包含蓝光(Blu-ray)光盘、DVD、CD-ROM、快闪存储器或用于存储经编码视频的任何其它合适的数字存储媒体。存储于存储媒体34上的经编码视频可接着由目的地装置14存取以用于解码及回放。
文件服务器36可为能够存储经编码视频且将所述经编码视频发射到目的地装置14的任何类型的服务器。实例文件服务器包含web服务器(例如,用于网站)、FTP服务器、网络附接存储(NAS)装置、本地磁盘驱动器或能够存储经编码视频数据且将其发射到目的地装置的任何其它类型的装置。文件服务器36可由目的地装置14经由任何标准数据连接(包含因特网连接)存取。此标准数据连接可包含无线信道(例如,Wi-Fi连接)、有线连接(例如,DSL、电缆调制解调器等)或适用于存取存储于文件服务器上的经编码视频数据的无线信道及有线连接的组合。来自文件服务器36的经编码视频数据的发射可为串流发射、下载发射或两者的组合。
本发明可大体上涉及将特定信息“用信号发出”到另一装置(例如,视频解码器30)的视频编码器20。然而,应理解,视频编码器20可通过使特定语法元素与视频数据的各种经编码部分相关联来用信号发出信息。即,视频编码器20可通过将特定语法元素存储到视频数据的各种经编码部分的标头来“用信号发出”数据。在一些状况下,此些语法元素可在由视频解码器30接收及解码之前经编码及存储(例如,存储到存储媒体34或文件服务器36)。因此,术语“用信号发出”可大体上指代解码经压缩视频数据所必需的语法或其它数据的通信,无论此通信是实时地或近实时地发生还是经过一时间跨度而发生,例如可能在编码时将语法元素存储到媒体时发生,所述语法元素接着可在经存储到此媒体之后的任何时间由解码装置检索。
在图1的实例中,目的地装置14包含接收器26、调制解调器28、视频解码器30及显示装置32。目的地装置14的接收器26经由信道16接收信息,且调制解调器28解调所述信息以产生用于视频解码器30的经解调位流。经由信道16传达的信息可包含由视频编码器20产生的多种语法信息以供视频解码器30用于解码视频数据。此种语法还可与存储于存储媒体34或文件服务器36上的经编码视频数据一起包含。视频编码器20及视频解码器30中的每一者可形成能够编码或解码视频数据的相应编码器-解码器(CODEC)的部分。
显示装置32可与目的地装置14集成或在目的地装置14外部。在一些实例中,目的地装置14可包含集成式显示装置且还经配置以与外部显示装置介接。在其它实例中,目的地装置14可为显示装置。大体来说,显示装置32向用户显示经解码视频数据,且可包括多种显示装置中的任一者,例如液晶显示器(LCD)、等离子显示器、有机发光二极管(OLED)显示器或另一类型的显示装置。
视频编码器20及视频解码器30可根据视频压缩标准(例如,目前处于开发中的高效视频译码(HEVC)标准)而操作,且可遵照HEVC测试模型(HM)。或者,视频编码器20及视频解码器30可根据其它专属或工业标准(例如,ITU-T H.264标准,替代地称为MPEG-4第10部分高级视频译码(AVC))或此些标准的扩展而操作。然而,本发明的技术不限于任何特定译码标准。其它实例包含MPEG-2及ITU-T H.263。
HEVC标准将视频数据块称为译码单元(CU)。大体来说,CU具有与根据H.264译码的宏块类似的目的,但CU不具有大小差别。因此,CU可分裂为子CU。大体来说,本发明中对CU的参考可指代图片的最大译码单元(LCU)或LCU的子CU。举例来说,在位流内的语法数据可定义LCU,就像素数目来说,LCU是最大译码单元。LCU可分裂为若干子CU,且每一子CU可分裂为若干子CU。用于位流的语法数据可定义可分裂LCU的最大次数,此最大次数被称为最大CU深度。因此,位流还可定义最小译码单元(SCU)。
LCU可与阶层式四叉树数据结构相关联。大体来说,四叉树数据结构每CU包含一个节点,其中根节点对应于LCU。如果将CU分裂为四个子CU,则对应于所述CU的节点包含四个叶节点,所述叶节点中的每一者对应于所述子CU中的一者。四叉树数据结构的每一节点可提供用于对应CU的语法数据。举例来说,在四叉树中的节点可包含指示对应于所述节点的CU是否分裂为子CU的分裂旗标。用于CU的语法元素可递归地定义,且可取决于CU是否分裂为子CU。
未经分裂的CU可包含一个或一个以上预测单元(PU)。大体来说,PU表示对应CU的全部或一部分,且包含用于检索用于PU的参考样本的数据。举例来说,当PU经帧内模式编码时,PU可包含描述用于PU的帧内预测模式的数据。作为另一实例,当PU经帧间模式编码时,PU可包含定义用于PU的运动向量的数据。定义运动向量的数据可描述(例如)运动向量的水平分量、运动向量的垂直分量、运动向量的分辨率(例如,四分之一像素精度或八分之一像素精度)、运动向量指向的参考帧,及/或用于运动向量的参考列表(例如,列表0或列表1)。定义PU的用于CU的数据还可描述(例如)将CU分割为一个或一个以上PU。分割模式可视是否CU未经译码、经帧内预测模式编码还是经帧间预测模式编码而不同。
具有一个或一个以上PU的CU还可包含一个或一个以上变换单元(TU)。在使用PU预测之后,视频编码器可计算对应于PU的CU的部分的残余值。可变换、量化及扫描残余值。TU不必限于PU的大小。因此,TU可大于或小于同一CU的对应PU。在一些实例中,TU的最大大小可为对应CU的大小。本发明还使用术语“块”来指代CU、PU或TU中的任一者。
尽管本发明的方面可指代如在所提议的HEVC标准中所指定的“最大译码单元(LCU)”,但应理解,术语“最大译码单元”的范围不限于所提议的HEVC标准。举例来说,当译码单元与经编码视频数据的其它译码单元有关时,术语最大译码单元大体上可指代译码单元的相对大小。换句话说,最大译码单元可指代在具有一个或一个以上不同大小的译码单元的视频数据帧中的相对最大译码单元(例如,相比于帧中的其它译码单元)。在另一实例中,术语最大译码单元可指代如在所提议的HEVC标准中指定的最大译码单元,其可具有相关联的语法元素(例如,描述阶层式四叉树结构的语法元素及其类似者)。
大体来说,经编码视频数据可包含预测数据及残余数据。视频编码器20可在帧内预测模式或帧间预测模式期间产生预测数据。帧内预测大体上涉及相对于图片中的相邻的先前经译码块中的参考样本预测同一图片的块中的像素值。帧间预测大体上涉及相对于先前经译码图片的数据预测图片的块中的像素值。
在帧内预测或帧间预测之后,视频编码器20可计算所述块的残余像素值。残余值大体上对应于块的预测像素值数据与块的真实像素值数据之间的差。举例来说,残余值可包含指示经译码像素与预测像素之间的差的像素差值。在一些实例中,经译码像素可与待译码的像素的块相关联,且预测像素可与用以预测经译码块的像素的一个或一个以上块相关联。
为了进一步压缩块的残余值,残余值可变换为变换系数的集合,所述变换系数将尽可能多的数据(还称为“能量”)压缩为尽可能少的系数。变换技术可包括离散余弦变换(DCT)过程或概念上类似的过程、整数变换、小波变换或其它类型的变换。变换将像素的残余值从空间域转换为变换域。变换系数对应于通常具有与原始块相同的大小的二维系数矩阵。换句话说,仅存在与原始块中的像素一样多的变换系数。然而,归因于变换,变换系数中的许多可具有等于零的值。
视频编码器20可接着量化变换系数以进一步压缩视频数据。量化大体上涉及将相对大范围内的值映射到相对小范围中的值,因此减少表示经量化变换系数所需要的数据的量。更具体来说,可根据量化参数(QP)而应用量化,量化参数(QP)可以LCU层级定义。因此,同一层级的量化可适用于与LCU内的CU的不同PU相关联的TU中的所有变换系数。然而,并非用信号发出QP自身,QP的改变(即,差量)可通过LCU用信号发出。差量QP定义LCU的量化参数相对于某个参考QP(例如,先前传达的LCU的QP)的改变。
在量化之后,视频编码器20可扫描变换系数,从而从包含经量化变换系数的二维矩阵产生一维向量。视频编码器20可接着熵编码所得阵列以甚至进一步压缩数据。大体来说,熵译码包括共同地压缩经量化变换系数的序列及/或其它语法信息的一个或一个以上过程。举例来说,例如差量QP、预测向量、译码模式、滤波器、偏移或其它信息等语法元素还可包含于经熵译码的位流中。接着(例如)经由内容自适应可变长度译码(CAVLC)、上下文自适应二进制算术译码(CABAC)或另一熵译码过程来熵译码经扫描的系数连同任何语法信息。
再次,本发明的技术包含将视频数据帧分裂为可独立解码切片。在一些例子中,视频编码器20可形成具有特定大小的切片。一个此实例可为在准备经由以太网络或任何其它类型的网络发射切片时,所述任何其它类型的网络的第二层(L2)架构利用以太网协议(其中后面接着数字的层在此上下文中指代开放系统互连(OSI)模型的对应层)。在此实例中,视频编码器20可形成切片,所述切片仅稍小于可为1500个字节的最大发射单元(MTU)。
通常,视频编码器依据LCU来分裂切片。即,视频编码器可经配置以将切片粒度限制为LCU的大小,以使得切片含有一个或一个以上全LCU。然而,将切片粒度限制为LCU可在试图形成某一大小的切片时呈现挑战。举例来说,以此方式配置的视频编码器可能不能在具有相对大LCU的帧中产生具有特定大小的切片(例如,包含预定数据量的切片)。即,相对大LCU可导致切片显著低于所要大小。本发明大体来说将“粒度”称为在产生切片时视频数据块(例如,LCU)可分解(例如,划分)为较小部分的程度。此粒度还可大体上被称为“切片粒度”。即,粒度(或切片粒度)可指代可划分为不同切片的LCU内的子CU的相对大小。如下文更详细地描述,可根据借以发生切片分裂的阶层式CU深度来识别粒度。
为了说明,考虑上文提供的1500字节的目标最大切片大小的实例。在此说明中,经配置以具有全LCU切片粒度的视频编码器可产生500字节的第一LCU、400字节的第二LCU及900字节的第三LCU。视频编码器可将第一及第二LCU存储到切片以获得900字节的总切片大小,其中第三LCU的添加可超过1500字节的最大切片大小达约300字节(900字节+900字节-1500字节=300字节)。因此,切片的最终LCU可能不会将切片填充到此目标最大容量,且切片的剩余容量可能不足够大以容纳另一全LCU。因此,切片仅可存储第一及第二LCU,其中产生另一切片以存储第三LCU及具有小于1500字节的目标大小减去第三LCU的900字节的大小或900字节的潜在任何额外LCU。因为需要两个切片而非三个,所以第二切片引入呈切片标头的形式的额外开销,从而引起带宽及存储低效率。
根据本发明中所描述的技术,视频编码器20可以小于LCU的粒度将视频数据帧分裂为切片。即,根据本发明的方面,视频编码器20可使用可定位于LCU内的边界来将视频数据帧分裂为切片。在一实例中,视频编码器20可将具有包含一个或一个以上LCU的多个块大小的CU的视频数据帧分裂为可独立解码切片,所述一个或一个以上LCU包含以阶层方式布置的多个相对较小译码单元。在此实例中,视频编码器20可确定在形成帧的可独立解码部分时将借以分裂所述以阶层方式布置的多个较小译码单元的粒度。视频编码器20还可使用所确定粒度分裂LCU以产生LCU的第一区段及LCU的第二区段。视频编码器20还可产生帧的可独立解码部分以包含LCU的第一区段而不包含LCU的第二区段。视频编码器20还可产生位流以包含帧的可独立解码部分及所确定粒度的指示。
视频编码器20可在确定借以将帧分裂为可独立解码切片的粒度时考虑多种参数。举例来说,如上文所指出,视频编码器20可基于所要切片大小来确定借以分裂帧的粒度。在其它实例中,如关于图4更详细地描述,视频编码器20可考虑误差结果对用信号发出视频数据所需要的位的数目(例如,有时称为速率-失真)且使粒度的确定基于这些误差结果对(或相比于)用信号发出视频数据所需要的位的数目。
在一实例中,视频编码器20可确定视频数据帧将以小于LCU的粒度分裂为切片。作为出于说明的目的而提供的仅一个实例,与视频数据帧相关联的LCU的大小可为64像素×64像素。在此实例中,视频编码器20可确定将使用32像素×32像素的CU粒度将帧分裂为切片。即,视频编码器20可使用大小为32像素×32像素或更大的CU之间的边界将帧划分为切片。可实施此粒度(例如)以便实现特定切片大小。在一些实例中,可使用CU深度表示所述粒度。即,对于将以32像素×32像素的粒度分裂为切片的大小为64像素×64像素的LCU,粒度可由CU深度1表示。
接下来,视频编码器20可通过以所确定粒度分裂LCU以产生LCU的第一区段及LCU的第二区段来将帧分裂为切片。在上文提供的实例中,视频编码器20可将预期切片的最终LCU分裂为第一及第二区段。即,LCU的第一区段可包含与LCU相关联的视频数据的一个或一个以上32像素×32像素块,而LCU的第二区段可包含与LCU相关联的剩余32像素×32像素块。尽管在以上实例中指定为包含相同大小的像素块,但每一区段可包含不同数目个像素块。举例来说,第一区段可包含8像素×8像素块,而第二区段可包含剩余三个8像素×8像素块。另外,尽管在以上实例中描述为正方形像素块,但每一区段可包括矩形像素块或任何其它类型的像素块。
以此方式,视频编码器20可产生包含LCU的第一区段而不包含LCU的第二区段的帧的可独立解码部分(例如,切片)。举例来说,视频编码器20可产生含有一个或一个以上全LCU以及上文所识别的经分裂LCU的第一区段的切片。视频编码器20可因此实施本发明中所描述的技术以按小于LCU的粒度产生切片,此情形可在试图形成特定大小的切片(例如,预定数据量)时提供灵活性。在一些实例中,视频编码器20可将所确定粒度应用于图片群组(例如,一个以上帧)。
视频编码器20还可产生位流以包含帧的可独立解码部分及所确定粒度的指示。即,视频编码器20可用信号发出可借以将一个或一个以上图片分裂为切片的粒度,其后接着为所述一个或一个以上图片。在一些实例中,视频编码器20可通过识别可借以将帧分裂为切片的CU深度来指示粒度。在此些实例中,视频编码器20可包含基于粒度的一个或一个以上语法元素,所述粒度可作为CU深度而在位流中用信号发出。另外,视频编码器20可指示切片开始的地址(例如,“切片地址”)。切片地址可指示切片在帧内开始的相对位置。切片地址可以切片粒度层级提供。在一些实例中,切片地址可提供于切片标头中。
根据本发明的方面,视频解码器30可解码视频帧的可独立解码部分。举例来说,视频解码器30可接收含有视频帧的一个或一个以上可独立解码部分的位流且解码所述位流。更具体来说,视频解码器30可解码视频数据的可独立解码切片,其中切片是以小于帧的LCU的粒度形成。即,例如,视频解码器30可经配置以接收以小于LCU的粒度形成的切片且使用包含于位流中的数据来重构切片。在一实例中,如下文更详细地描述,视频解码器30可基于包含于位流中的一个或一个以上语法元素(例如,识别借以分裂切片的CU深度的语法元素、一个或一个以上分裂旗标及其类似者)来确定粒度。
切片粒度可应用于一个图片或可应用于数个图片(例如,图片群组)。举例来说,可在参数集(例如,图片参数集(PPS))中用信号发出切片粒度。PPS大体上含有可应用于一序列的图片(例如,视频数据的一个或一个以上帧)内的一个或一个以上图片的参数。通常,可在解码切片之前(例如,在解码切片标头及切片数据之前)将PPS发送到解码器30。切片标头中的语法数据可参考某一PPS,其可“激活”用于所述切片的所述PPS。即,视频解码器30可在解码切片标头时即刻应用在PPS中用信号发出的参数。根据一些实例,一旦PPS已经激活以用于特定切片,PPS便可保持作用中直到激活不同图片参数集(例如,通过在另一切片标头中参考)为止。
如上文所指出,根据本发明的方面,可在例如PPS等参数集中用信号发出切片粒度。因此,切片可通过参考特定PPS而被指派特定粒度。即,视频解码器30可解码与切片相关联的标头信息,所述标头信息可参考用于切片的特定PPS。视频解码器30可接着在解码切片时将PPS中所识别的切片粒度应用于所述切片。另外,根据本发明的方面,视频解码器30可解码指示切片开始的地址(例如,“切片地址”)的信息。切片地址可以切片粒度层级而提供于切片标头中。尽管未展示于图1中,但在一些方面中,视频编码器20及视频解码器30可各自与音频编码器及解码器集成,且可包含适当MUX-DEMUX单元或其它硬件及软件以处置共同数据流或单独数据流中的音频及视频两者的编码。在一些实例中,如果适用,则MUX-DEMUX单元可遵照ITU H.223多路复用器协议或例如用户数据报协议(UDP)等其它协议。
视频编码器20及视频解码器30各自可实施为多种合适编码器电路中的任一者,例如一个或一个以上微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、软件、硬件、固件或其任何组合。当所述技术以软件部分地实施时,装置可将用于软件的指令存储于合适的非暂时性计算机可读媒体中且使用一个或一个以上处理器来执行硬件中的指令以执行本发明的技术。视频编码器20及视频解码器30中的每一者可包含于一个或一个以上编码器或解码器中,其中的任一者可集成为相应装置中的组合式编码器/解码器(CODEC)的部分。
图2是说明与本发明的技术及新兴HEVC标准一致的经译码单元(CU)的阶层式四叉树分割的概念图。在图2中所展示的实例中,LCU(CU0)的大小是128像素×128像素。即,在未划分的CU深度0处,CU0的大小是128像素×128像素(例如,N=64)。视频编码器20可确定是否将CU0分裂为各自包括子CU的四个象限或是否编码CU0而无分裂。可(例如)基于与CU0相关联的视频数据的复杂性作出此决策,其中较复杂视频数据增加分裂的概率。
分裂CU0的决策可由分裂旗标表示。大体来说,分裂旗标可作为语法元素包含于位流中。即,如果CU0未分裂,则分裂旗标可设定为0。相反,如果CU0分裂为包括子CU的象限,则分裂旗标可设定为1。如关于图3A及3B更详细地描述,例如视频编码器20(图1)等视频编码器可表示使用分裂旗标来指示LCU及LCU的子CU的分裂的四叉树数据结构。
CU深度可用以指示LCU(例如,CU0)已分裂的次数。举例来说,在分裂CU0之后(例如,分裂旗标=1),所得子CU具有深度1。如果LCU大小已知,则CU的CU深度还可提供所述CU的大小的指示。在图2中所展示的实例中,CU0的大小是128像素×128像素。因此,在深度1处的每一CU(图2的实例中展示为CU1)的大小是64像素×64像素。
以此方式,CU可递归地被划分为子CU直到达到最大阶层深度为止。CU不能被划分超出最大阶层深度。在图2中所展示的实例中,CU0可划分为子CU直到已达到最大阶层深度4为止。在CU深度4(例如,CU4)处,CU的大小为8像素×8像素。
尽管CU0在图2的实例中被展示为大小为128像素×128像素且具有最大阶层深度4,但出于说明的目的而提供其作为仅一个实例。其它实例可包含较大或较小且具有相同或替代最大阶层深度的LCU。
图3A及3B是说明与本发明的技术一致的实例四叉树50及对应最大译码单元80的概念图。四叉树50包含以阶层方式布置的节点。每一节点可为无子代的叶节点或可具有四个子代节点,因此得名“四叉树”。在图3A的实例中,四叉树50包含根节点52。根节点52具有四个子代节点,包含叶节点54A及54B(叶节点54)与节点56A及56B(节点56)。因为节点56并非叶节点,所以节点56各自包含四个子代节点。即,在图3A中所展示的实例中,节点56A具有四个子代叶节点58A到58D,而节点56B具有三个叶节点60A到60C(叶节点60)及节点62。另外,节点62具有四个叶节点64A到64D(叶节点64)。
四叉树50可包含描述对应最大译码单元(LCU)(例如,此实例中的LCU80)的特性的数据。举例来说,四叉树50通过其结构可描述LCU80到子CU的分裂。假定LCU80具有2N×2N的大小。在此实例中,LCU80具有四个子CU,其中两个子CU82A及82B(子CU82)具有大小N×N。LCU80的剩余两个子CU进一步分裂为较小子CU。即,在图3B中所展示的实例中,LCU80的子CU中的一者分裂为具有大小N/2×N/2的子CU84A到84D,而LCU80的另一子CU分裂为具有大小N/2×N/2的子CU86A到86C(子CU86)及识别为具有大小N/4×N/4的子CU88A到88D(子CU88)的进一步划分的子CU。
在图3A及3B中所展示的实例中,四叉树50的结构对应于LCU80的分裂。即,根节点52对应于LCU80且叶节点54对应于子CU82。此外,叶节点58(其是节点56A的子代节点,其通常意味着节点56A包含参考叶节点58的指针)对应于子CU84,叶节点60(例如,属于节点56B)对应于子CU86,且叶节点64(属于节点62)对应于子CU88。
在图3A及3B中所展示的实例中,LCU80(其对应于根节点52)分裂为第一区段90及第二区段92。根据本发明的方面,视频编码器(例如,视频编码器20)可将LCU80分裂为第一区段90及第二区段92,且与LCU80所属的帧的第一可独立解码部分一起包含第一区段90,且可与LCU80所属的帧的第二可独立解码部分一起包含第二区段92。即,视频编码器20可将含有LCU80的视频数据帧分裂为切片(例如,如由“切片分裂”箭头94所指示),以使得第一切片(例如,如由箭头96所指示)包含第一区段90且第二切片(例如,如由箭头98所指示)包含第二区段92。举例来说,第一切片96除了LCU80的第一区段90外还可包含一个或一个以上完整LCU,第一区段90可作为切片的相对末尾而定位。同样地,第二切片98可以LCU80的第二区段92开始且包含一个或一个以上额外其它LCU。
为了以关于图3A及3B所展示及描述的方式将含有LCU80的视频数据帧分裂为可独立解码切片,根据本发明的技术,借以产生切片的粒度必须小于LCU80的大小。在一实例中,出于解释的目的,假定LCU80的大小为64像素×64像素(例如,N=32)。在此实例中,切片粒度是16像素×16像素。举例来说,由切片边界分开的最小CU的大小是16像素×16像素大小。
可借以将帧的LCU(例如,LCU80)分裂为切片的粒度可根据借以发生分裂的CU深度值来识别。在图3A的实例中,切片分裂94以CU深度2发生。举例来说,可与第一切片96一起包含的第一区段90与可与第二切片98一起包含的第二区段92之间的边界定位于叶节点58B与58C之间,叶节点58B及58C位于CU深度2处。
图3B中所展示的实例进一步在概念上说明借以划分LCU80的粒度。举例来说,本发明大体上可将“粒度”称为在产生切片时将LCU划分到的程度。如图3B中所展示,LCU80的子CU84是最小CU,第一区段90与第二区段92之间的边界穿过所述最小CU而定位。即,第一区段90借以与第二区段92分开的边界定位于子CU84A/84B与子CU84C/84D之间。因此,在此实例中,切片96的最终CU是子CU84B,而切片98的初始CU是子CU84C。
使用小于LCU80的CU粒度产生切片可在试图形成特定大小的切片(例如,预定数据量)时提供灵活性。此外,如上文所指出,根据本发明的技术将帧分裂为切片可减少指定经压缩视频数据所需要的切片的数目。减少指定经压缩数据所需要的切片的数目可减少开销数据(例如,与切片标头相关联的开销),借此改善压缩效率,这是因为开销数据的量相对于经压缩视频数据的量减少。
根据本发明的方面,当将含有LCU80的帧分裂为可独立解码切片96及98时,用于LCU80的阶层式四叉树信息可分开且以每一可独立解码切片呈现。举例来说,如上文所指出,用于四叉树50的节点的数据可描述对应于节点的CU是否经分裂。如果CU经分裂,则四个额外节点可存在于四叉树50中。在一些实例中,四叉树的节点可类似于以下伪码实施:
Figure BDA00003455600100151
split_flag值可为表示对应于当前节点的CU是否经分裂的一位值。如果CU未分裂,则split_flag值可为‘0’,而如果CU经分裂,则split_flag值可为‘1’。关于四叉树50的实例,分裂旗标值的阵列可为10011000001000000。
四叉树信息(例如,与LCU80相关联的四叉树50)通常提供于含有LCU80的切片的开始处。然而,如果LCU80经划分为不同切片,且含有四叉树信息的切片遗失或恶化,则视频解码器可能不能适当地解码第二切片98(例如,无四叉树信息的切片)中含有的LCU80的部分。即,视频解码器可能不能识别LCU80的剩余者分裂为子CU的方式。
本发明的方面包含分开用于经分裂为不同切片的LCU(例如,LCU80)的阶层式四叉树信息,且以每一切片呈现四叉树信息的经分开部分。举例来说,视频编码器20可通常在LCU80的开始处提供呈分裂旗标形式的四叉树信息。然而,如果LCU80的四叉树信息是以此方式提供,则第一区段90可包含所有分裂旗标而第二区段92不包含任何分裂旗标。如果第一切片96(其含有第一区段90)遗失或恶化,则第二切片98(其含有第二区段92)可能不能经适当地解码。
根据本发明的方面,当将LCU80分裂为不同切片时,视频编码器20还可分开相关联的四叉树信息,以使得与第一切片96一起提供适用于第一区段90的四叉树信息且与第二切片96一起提供适用于第二区段92的四叉树信息。即,当将LCU80分裂为第一区段90及第二区段92时,视频编码器20可将相关联于第一区段90的分裂旗标与相关联于第二区段92的分裂旗标分开。视频编码器20可接着与第一切片96一起提供用于第一区段90的分裂旗标且与第二切片98一起提供用于第二区段92的分裂旗标。以此方式,如果第一切片96恶化或遗失,则视频解码器仍可能够适当地解码与第二切片98一起包含的LCU80的剩余部分。
在一些实例中,为了适当地解码含有用于LCU的四叉树信息的仅一部分的LCU的区段,视频解码器30可重构与LCU的其它区段相关联的四叉树信息。举例来说,在接收到第二区段92后,视频解码器30可即刻重构四叉树50的遗漏部分。为了进行此操作,视频解码器30可识别所接收切片的第一CU的索引值。索引值可识别子CU属于的象限,借此提供子CU在LCU内的相对位置的指示。即,在图3B中所展示的实例中,子CU84A可具有索引值0,子CU84B可具有索引值1,子CU84C可具有索引值2,且子CU84D可具有索引值3。此些索引值可作为语法元素而提供于切片标头中。
因此,在接收到第二区段92后,视频解码器30可即刻识别子CU84C的索引值。视频解码器30可接着使用所述索引值识别出子CU84C属于左下象限,且子CU84C的父代节点必须包含分裂旗标。即,因为子CU84C是具有索引值的子CU,所以父代CU有必要包含分裂旗标。
另外,视频解码器30可推断四叉树50的所有节点与第二区段92一起包含。在一实例中,视频解码器30可使用四叉树50的所接收部分及使用深度优先四叉树遍历算法来推断此信息。根据深度优先遍历算法,视频解码器30扩展四叉树50的所接收部分的第一节点直到经扩展节点无叶节点为止。视频解码器30遍历经扩展节点直到返回到尚未经扩展的最近节点为止。视频解码器30以此方式继续直到四叉树50的所接收部分的所有节点已经扩展为止。
当将LCU80分裂为不同切片时,视频编码器20还可提供其它信息以辅助视频解码器30解码视频数据。举例来说,本发明的方面包含使用包含于位流中的一个或一个以上语法元素来识别切片的相对末尾。在一实例中,视频编码器(例如,视频编码器20)可产生切片旗标的一位末尾且与帧的每一CU一起提供切片旗标的所述末尾以指示特定CU是否为切片的最终CU(例如,在分裂之前的最终CU)。在此实例中,视频编码器20可在CU定位于切片的相对末尾处时将切片旗标的末尾设定为值‘0’,且在CU定位于切片的相对末尾处时将切片旗标的末尾设定为值‘1’。在图3B中所展示的实例中,子CU84B将包含切片旗标末尾‘1’,而剩余CU将包含切片旗标末尾‘0’。
在一些实例中,视频编码器20可仅针对等于或大于用以将帧分裂为切片的粒度的CU提供切片指示的末尾(例如,切片旗标的末尾)。在图3B中所展示的实例中,视频编码器20可仅与等于或大于16像素×16像素粒度的CU(即,CU82A、82B、84A到84D及86A到86C)一起提供切片旗标的末尾。以此方式,视频编码器20可实现优于与帧的每一CU一起提供切片旗标末尾的方法的位节省。
在将LCU(例如,LCU80)分裂为不同切片的实例中,还可以针对每一切片提供单独量化数据。举例来说,如上文所指出,可根据可以LCU层级定义的量化参数(QP)(例如,其可通过差量QP识别)来应用量化。然而,根据本发明的方面,视频编码器20可针对已分裂为不同切片的LCU的每一部分指示差量QP值。在图3B中所展示的实例中,视频编码器20可针对第一区段90及第二区段92提供单独差量QP,第一区段90及第二区段92可分别与第一切片96及第二切片98一起包含。
尽管出于解释的目的而关于视频编码器20及视频解码器30描述图3A及3B的特定方面,但应理解,例如其它处理器、处理单元、包含编码器/解码器(CODEC)的基于硬件的译码单元及其类似者等其它视频译码单元也可经配置以执行关于图3A及3B描述的实例及技术。
图4是说明可实施本发明中描述的用于将视频数据帧分裂为可独立解码部分的技术中的任何或全部的视频编码器20的实例的框图。大体来说,视频编码器20可执行视频帧内的CU的帧内译码及帧间译码。帧内译码依赖于空间预测以减少或移除给定视频帧内的视频中的空间冗余。帧间译码依赖于时间预测以减少或移除视频序列的当前帧与先前经译码帧之间的时间冗余。帧内模式(I模式)可指代若干基于空间的压缩模式中的任一者,且例如单向预测(P模式)或双向预测(B模式)等帧间模式可指代若干基于时间的压缩模式中的任一者。
如图4中所展示,视频编码器20接收待编码的视频帧内的当前视频块。在图4的实例中,视频编码器20包含运动补偿单元144、运动估计单元142、帧内预测单元146、参考帧存储装置164、求和器150、变换单元152、量化单元154及熵译码单元156。图4中所说明的变换单元152是执行实际变换而不与CU的TU混淆的单元。对于视频块重构,视频编码器20还包含逆量化单元158、逆变换单元160及求和器162。解块滤波器(图4中未展示)还可经包含以对块边界滤波以从经重构视频移除成块效应假影。必要时,解块滤波器将通常对求和器162的输出滤波。
在编码过程期间,视频编码器20接收待译码的视频帧或切片。可将所述帧或切片划分为多个视频块,例如,最大译码单元(LCU)。运动估计单元142及运动补偿单元144相对于一个或一个以上参考帧中的一个或一个以上块来执行所接收视频块的帧间预测译码以提供时间压缩。帧内预测单元146可相对于与待译码的块在同一帧或切片中的一个或一个以上相邻块来执行所接收视频块的帧内预测译码以提供空间压缩。
模式选择单元140可(例如)基于误差结果与在每一译码模式下用信号发出视频数据所需要的位的数目(例如,有时称为速率失真)来选择译码模式(帧内或帧间)中的一者,且将所得经帧内或帧间译码块提供到求和器150以产生残余块数据且提供到求和器162以重构经编码块以供参考帧中使用。一些视频帧可经指定为I帧,其中I帧中的所有块以帧内预测模式编码。在一些状况下,帧内预测单元146可(例如)在由运动估计单元142执行的运动搜索不导致块的足够预测时执行P帧或B帧中的块的帧内预测编码。
根据一些实例,除了选择译码模式中的一者外,视频编码器20可执行其它功能,例如确定借以分裂视频数据帧的粒度,其可小于LCU。举例来说,视频编码器20可计算用于各种切片配置的速率失真(例如,试图最大化压缩而不超过预定失真)且选择产生最佳结果的粒度。视频编码器20可在选择粒度时考虑目标切片大小。举例来说,如上文所指出,在一些例子中,可需要形成特定大小的切片。一个此实例可准备经由网络发射切片。视频编码器20可确定借以将视频数据帧分裂为切片以试图紧密匹配目标大小的粒度。
在视频编码器20确定借以分裂视频数据帧的粒度的实例中,视频编码器20可指示此粒度。即,视频编码器20(例如,模式选择单元140、熵译码单元156或视频编码器20的另一单元)可提供粒度的指示以辅助视频解码器解码视频数据。举例来说,视频编码器20可根据可借以发生分裂的CU深度来识别粒度。
出于解释的目的,假定视频数据帧具有大小为128像素×128像素的一个或一个以上LCU。在此实例中,视频编码器20可确定帧可以32像素×32像素的粒度分裂为切片(例如)以便实现目标切片大小。视频编码器20可根据可借以发生切片分裂的阶层深度来指示此粒度。即,根据图3A及3B中所展示的阶层式四叉树布置,32像素×32像素子CU具有CU深度2。因此,在此实例中,视频编码器20可通过指示切片分裂可以CU深度2发生来用信号发出切片粒度。
在一实例中,视频编码器20可在图片参数集(PPS)中提供可借以将视频数据帧分裂为切片的粒度的指示。举例来说,通过背景,视频编码器20可格式化经压缩视频数据以用于经由网络发射到所谓的“网络抽象层单元”或NAL单元。每一NAL单元可包含识别存储到NAL单元的数据的类型的标头。存在通常存储到NAL单元的两种类型的数据。存储到NAL单元的第一类型的数据是视频译码层(VCL)数据,其包含经压缩视频数据。存储到NAL单元的第二类型的数据称为非VCL数据,其包含额外信息,例如定义大量NAL单元与补充增强信息(SEI)所共有的标头数据的参数集。举例来说,参数集可含有序列层级标头信息(例如,呈序列参数集(SPS))及很少改变的图片层级标头信息(例如,呈图片参数集(PPS))。参数集中含有的很少改变的信息不需要针对每一序列或图片重复,借此改善译码效率。另外,参数集的使用使得标头信息能够带外发射,借此避免需要冗余发射来实现错误恢复。
在一个实例中,可借以将视频数据帧分裂为切片的粒度的指示可根据以下表1指示:
表1-pic_parameter_set_rbsp()
pic_parameter_set_rbsp(){ C 描述符
pic_parameter_set_id 1 ue(v)
seq_parameter_set_id 1 ue(v)
entropy_coding_mode_flag 1 u(1)
num_ref_idx_l0_default_active_minus1 1 ue(v)
num_ref_idx_l1default_active_minus1 1 ue(v)
pic_init_qp_minus26/*相对于26*/ 1 se(v)
slice_granu_CU_depth 1 ue(v)
constrained_intra_pred_flag 1 u(1)
for(i=0;i<15;i++){
numAllowedFilters[i] 1 ue(v)
for(j=0;j<numAllowedFilters;j++){
filtIdx[i][j] 1 ue(v)
}
}
rbsp_trailing_bits() 1
}
在表1中所展示的实例中,slice_granu_CU_depth可指定用以将视频数据帧分裂为切片的粒度。举例来说,slice_granu_CU_depth可通过识别相比于LCU(例如,LCU=深度0)可借以发生切片分裂的阶层深度来指定CU深度作为用以将帧分裂为切片的粒度。根据本发明的方面,切片可含有一系列LCU(例如,包含在相关联的阶层式四叉树结构中的所有CU)及不完整LCU。不完整LCU可含有具有小到max_coding_unit_width>>slice_granu_CU_depth×max_coding_unit_height>>slice_granu_CU_depth但不更小的大小的一个或一个以上完整CU。举例来说,切片不能含有具有小于max_coding_unit_width>>slice_granu_CU_depth×max_coding_unit_height>>slice_granu_CU_depth的大小且不属于完全含有于切片中的LCU的CU。即,切片边界可不发生于等于或小于max_coding_unit_width>>slice_granu_CU_depth×max_coding_unit_height>>slice_granu_CU_depth的CU大小的CU内。
在视频编码器20确定小于用于将视频数据帧分裂为切片的LCU的粒度的实例中,视频编码器20可分开用于经分裂为不同切片的LCU的阶层式四叉树信息且与每一切片一起呈现四叉树信息的分开部分。举例来说,如上文关于图3A及3B所描述,视频编码器20可分开与经分裂为切片的LCU的每一区段相关联的分裂旗标。视频编码器20可接着与第一切片一起提供与分裂LCU的第一区段相关联的分裂旗标且与第二切片一起提供与分裂LCU的另一区段相关联的分裂旗标。以此方式,如果第一切片恶化或遗失,则视频解码器仍可能够适当地解码与第二切片一起包含的LCU的剩余部分。
或者或另外,视频编码器20可使用一个或一个以上语法元素识别切片的相对末尾。举例来说,视频编码器20可产生切片旗标的一位末尾且与帧的每一CU一起提供切片旗标的末尾以指示特定CU是否为切片的最终CU(例如,在分裂之前的最终CU)。举例来说,视频编码器20可在CU定位于切片的相对末尾时将切片旗标的末尾设定为值‘0’且在CU定位于切片的相对末尾时将切片旗标的末尾设定为值‘1’。
在一些实例中,视频编码器20可仅提供用于等于或大于用以将帧分裂为切片的粒度的CU的切片指示的末尾(例如,切片旗标的末尾)。举例来说,出于解释的目的,假定视频编码器20确定借以将视频数据帧分裂为切片的粒度是32像素×32像素,其中LCU大小为64像素×64像素。在此实例中,模式选择单元140可仅与大小为32像素×32像素或更大的CU一起提供切片旗标的末尾。
在一实例中,视频编码器20可根据以下所展示的表2来产生切片旗标的末尾:
表2-coding_tree(x0,y0,log2CUSize)
Figure BDA00003455600100201
Figure BDA00003455600100211
尽管本发明的特定方面大体来说关于视频编码器20而描述,但应理解,此些方面可通过视频编码器20的一个或一个以上单元(例如,模式选择单元140或视频编码器20的一个或一个以上其它单元)执行。
运动估计单元142及运动补偿单元144可高度集成,但出于概念目的而分别说明。运动估计为产生运动向量的过程,所述运动向量估计用于帧间译码的视频块的运动。举例来说,运动向量可指示当前帧中的预测单元相对于参考帧的参考样本的位移。参考样本是被发现为在像素差方面紧密匹配包含经译码的PU的CU的部分的块,所述像素差可通过绝对差总和(SAD)、平方差总和(SSD)或其它差量度来确定。由运动补偿单元144执行的运动补偿可涉及基于通过运动估计所确定的运动向量而获取或产生预测单元的值。再次,在一些实例中,运动估计单元142及运动补偿单元144可为功能上集成的。
运动估计单元142通过比较经帧间译码帧的一预测单元与存储于参考帧存储装置164中的参考帧的参考样本来计算用于所述预测单元的运动向量。在一些实例中,视频编码器20可计算用于存储于参考帧存储装置164中的参考帧的子整数像素位置的值。举例来说,视频编码器20可计算参考帧的四分之一像素位置、八分之一像素位置或其它分数像素位置的值。因此,运动估计单元142可执形相对于全像素位置及分数像素位置的运动搜索且输出具有分数像素精度的运动向量。运动估计单元142将经计算运动向量发送到熵译码单元156及运动补偿单元144。通过运动向量识别的参考帧的部分可称为参考样本。运动补偿单元144可(例如)通过检索由用于PU的运动向量识别的参考样本来计算用于当前CU的预测单元的预测值。
帧内预测单元146可执行用于译码所接收块的帧内预测以作为由运动估计单元142及运动补偿单元144执行的帧间预测的替代方案。帧内预测单元146可相对于相邻的先前经译码块(例如,当前块的上方、右上方、左上方或左方的块)来编码所接收块,假定用于块的从左到右、从顶部到底部的编码次序。帧内预测单元146可经配置以具有多种不同帧内预测模式。举例来说,帧内预测单元146可基于经编码的CU的大小而经配置以具有某一数目个预测模式(例如,35个预测模式)。
帧内预测单元146可通过(例如)计算用于各种帧内预测模式的速率失真(例如,试图最大化压缩而不超过预定失真)及选择产生最佳结果的模式来从可用帧内预测模式中选择帧内预测模式。帧内预测模式可包含用于组合空间相邻像素的值及将经组合值应用于用以预测PU的预测块中的一个或一个以上像素位置的功能。一旦已计算用于预测块中的所有像素位置的值,帧内预测单元146即可基于PU与预测块之间的像素差来计算用于预测模式的误差值。帧内预测单元146可继续测试帧内预测模式直到发现产生可接受的误差值对用信号发出视频数据所需要的位的帧内预测模式为止。帧内预测单元146可接着将PU发送到求和器150。
视频编码器20通过从经译码的原始视频块减去由运动补偿单元144或帧内预测单元146计算的预测数据来形成残余块。求和器150表示执行此减法运算的组件或若干组件。残余块可对应于值的二维矩阵,其中残余块中的值的数目与对应于残余块的PU中的像素的数目相同。残余块中的值可对应于预测块与待译码的原始块中的位于同一地点的像素之间的差。
变换单元152将变换(例如,离散余弦变换(DCT)、整数变换或概念上类似的变换)应用于残余块,从而产生包括残余变换系数值的视频块。变换单元152可执行其它变换,例如由H.264标准所定义的变换,所述变换在概念上类似于DCT。还可使用小波变换、整数变换、子带变换或其它类型的变换。在任何状况下,变换单元152将变换应用于残余块,从而产生残余变换系数块。变换单元152可将残余信息从像素值域转换到例如频域的变换域。
量化单元154量化残余变换系数以进一步减少位速率。所述量化过程可减少与所述系数中的一些或全部相关联的位深度。可通过调整量化参数(QP)来修改量化的程度。在一些实例中,QP可以LCU层级定义。因此,同一层级的量化可适用于与LCU内的CU的不同PU相关联的TU中的所有变换系数。然而,并非用信号发出QP自身,QP中的改变(即,差量)可通过LCU用信号发出。差量QP定义LCU的量化参数相对于某个参考QP(例如,先前传达的LCU的QP)的改变。
根据本发明的方面,在LCU经划分为两个切片的实例中,量化单元154可定义用于经划分LCU的每一部分的单独QP(或差量QP)。出于解释的目的,假定LCU经分裂为两个切片,以使得LCU的第一区段与第一切片一起包含且LCU的第二区段与第二切片一起包含。在此实例中,量化单元154可定义用于LCU的第一区段的第一差量QP及用于LCU的第二区段的独立于第一差量QP的第二差量QP。在一些实例中,与第一切片一起提供的差量QP可不同于与第二切片一起提供的差量QP。
在一实例中,量化单元154可根据以下所展示的表3提供差量QP值的指示:
表3-coding_unit(x0,y0,currCodingUnitSize)
Figure BDA00003455600100231
Figure BDA00003455600100241
在表2的实例中,cu_QP_delta可改变CU层中的QPY的值。即,可为已分裂为不同切片的LCU的两个不同区段定义单独cu_QP_delta值。根据一些实例,cu_QP_delta的经解码值可在-26到+25的范围中。如果cu_QP_delta值未针对CU而提供,则视频解码器可推断cu_QP_delta值等于零。
在一些实例中,QPY值可根据以下等式(1)导出,其中QPY,PREV是当前切片的解码次序上的先前CU的亮度量化参数(QPY)。
QPY=(QPY,PREv+cu_qp_delta+52)%52    (1)
另外,对于切片的第一CU,QPY,PREV值最初可设定为等于SliceQPY,SliceQPY可为用于切片的所有块的初始QPY直到量化参数经修改为止。此外,firstCUFlag可在每一切片的开始处设定为‘真’。
根据本发明的一些方面,量化单元154可确定可经指派QPY值的最小CU大小。举例来说,量化单元154可仅设定用于等于或大于MinQPCodingUnitSize的CU的QP值。在一些实例中,当MinQPCodingUnitSize等于MaxCodingUnitSize(例如,最大支持CU(LCU)的大小)时,量化单元154可仅用信号发出用于LCU及切片中的第一CU的QP值。在另一实例中,替代于仅用信号发出用于切片的第一CU及/或LCU的差量QP值,量化单元154可用信号发出差量QP可经设定的最小QP CU大小,最小QP CU大小对于特定序列(例如,帧的序列)可为固定的。举例来说,量化单元154可(例如)在参数集(例如,图片参数集(PPS)或序列参数集(SPS))中用信号发出最小QP CU大小。
在另一实例中,量化单元154可识别可根据CU深度而经指派QP值的最小CU大小。即,量化单元154可仅设定用于定位得等于或高于(例如,在四叉树结构上相对较高)MinQPCUDepth的CU的QP值。在此实例中,MinQPCodingUnitSize可基于MinQPCUDepth及MaxCodingUnitSize导出。最小QP深度可(例如)在例如PPS或SPS等参数集中用信号发出。
在量化之后,熵译码单元156对量化变换系数进行熵译码。举例来说,熵译码单元156可执行内容自适应可变长度译码(CAVLC)、上下文自适应二进制算术译码(CABAC)或另一熵译码技术。在熵译码单元156进行熵译码之后,可将经编码的视频发射到另一装置或存档以供稍后发射或检索。在上下文自适应二进制算术译码(CABAC)的状况下,上下文可基于相邻译码单元。
在一些状况下,熵译码单元156或视频编码器20的另一单元可经配置以除了执行熵译码外还执行其它译码功能。举例来说,熵译码单元156可经配置以确定用于译码单元及分区的CBP值。又,在一些状况下,熵译码单元156可执行对译码单元或其分区中的系数的游程长度译码。特定来说,熵译码单元156可应用Z形扫描或其它扫描模式来扫描译码单元或分区中的变换系数,且编码若干零的游程以用于进一步压缩。熵译码单元156还可以适当语法元素来建构标头信息,以用于在经编码视频位流中发射。
根据本发明的方面,在熵译码单元156建构用于切片的标头信息的实例中,熵译码单元156可确定渗透切片参数的集合。渗透切片参数可(例如)包含为两个或两个以上切片所共有的语法元素。如上文所指出,语法元素可辅助解码器解码切片。在一些实例中,渗透切片参数在本文中可称为“帧参数集”(FPS)。根据本发明的方面,FPS可被应用于多个切片。FPS可参考图片参数集(PPS)且切片标头可参考FPS。
大体来说,FPS可含有典型切片标头的信息的大多数。然而,FPS不需要针对每一切片加以重复。根据一些实例,熵译码单元156可产生参考FPS的标头信息。标头信息可包含(例如)识别FPS的帧参数集识别符(ID)。在一些例子中,熵译码单元156可定义多个FPS,其中多个FPS中的每一者与不同帧参数集识别符相关联。熵译码单元156可接着产生识别所述多个FPS中的相关一者的切片标头信息。
在一些例子中,如果经识别FPS不同于与同一帧的先前经解码切片相关联的FPS,则熵译码单元156可仅识别所述FPS。在此些例子中,熵译码单元156可定义识别FPS识别符是否经设定的每一切片标头中的旗标。如果此旗标未经设定(例如,旗标具有值‘0’),则来自帧的先前经解码切片的FPS识别符可再使用于当前切片。以此方式使用FPS识别符旗标可进一步减少由切片标头消耗的位的量,尤其在大量FPS经定义时。
在一实例中,熵译码单元156可根据如下所展示的表4产生FPS:
表4-fra_parameter_set_header()
fra_parameter_set_header(){ C 描述符
slice_type 2 ue(v)
pic_parameter_set_id 2 ue(v)
fra_parameter_set_id 2 ue(v)
frame_num 2 u(v)
if(IdrPicFlag)
idr_pic_id 2 ue(v)
pic_order_cnt_lsb 2 u(v)
if(slice_type==P II slice_type==B){
num_ref_idx_active_override_flag 2 u(1)
if(num_ref_idx_active_override_flag){
num_ref_idx_l0_active_minus1 2 ue(v)
if(slice_type==B)
num_ref_idx_l1_active_minus1 2 ue(v)
}
}
ref_pic_list_modification()
if(nal_ref_idc!=0)
dec_ref_pic_marking() 2
if(entropy_coding_mode_fag){
pipe_multi_codeword_flag 2 u(1)
if(!pipe_multi_codeword_flag)
pipe_max_delay_shift_6 2 ue(v)
else
balanced_cpus 2 u(8)
if(slice_type!=I)
cabac_init_idc 2 ue(v)
}
slice_qp_delta 2 se(v)
alf_param()
if(slice_type==P II slice_type==B){
mc_interpolation_idc 2 ue(v)
mv_competition_flag 2 u(1)
if(mv_competition_flag){
mv_competition_temporal_flag 2 u(1)
}
}
if(slice_type==B&&mv_competition_flag)
collocated_from_l0_flag 2 u(1)
sifo_param()
edge_based_prediction_flag 2 u(1)
if(edge_prediction_ipd_flag==1)
threshold_edge 2 u(8)
}
与包含于以上表4的实例中的语法元素相关联的语意与新兴HEVC标准相同,然而,语意适用于参考此FPS标头的所有切片。即,举例来说,fra_parameter_set_id指示帧参数集标头的识别符。因此,共享同一标头信息的一个或一个以上切片可参考FPS识别符。如果标头具有相同的fra_parameter_set_id、frame_num及图片次序计数(POC),则两个FPS标头是相同的。
根据一些实例,FPS标头可含有于图片参数集(PPS)原始字节序列有效负载(RBSP)中。在一实例中,FPS标头可根据以下所展示的表5含有于PPS中:
表5-pic_parameter_set_rbsp()
pic_parameter_set_rbsp(){ C 描述符
pic_parameter_set_id 1 ue(v)
...
num_fps_headers 1 ue(v)
for(i=0;i<num_fps_headers;i++)
fra_parameter_set_header()
rbsp_trailing_bits() 1
}
根据一些实例,FPS标头可含有于帧的一个或一个以上切片中。在一实例中,FPS标头可根据以下所展示的表6含有于帧的一个或一个以上切片中:
表6-slice_header()
slice_header(){ C 描述符
first_lctb_in_slice 2 ue(v)
fps_present_flag 2 u(1)
if(fps_present_flag)
fra_parameter_set_header()
else
fra_parameter_set_id 2 ue(v)
end_picture_flag 2 u(1)
...
在表6的实例中,fps_present_flag可指示用于当前切片的切片标头是否含有FPS标头。另外,fra_parameter_set_id可指定当前切片参考的FPS标头的识别符。另外,根据表6中所展示的实例,end_picture_flag指示当前切片是否为当前图片的最后切片。
尽管本发明的特定方面(例如,例如产生标头语法及/或参数集)已关于熵译码单元156描述,但应理解,此描述仅出于解释的目的而提供。即,在其它实例中,多种其它译码模块可用以产生标头数据及/或参数集。举例来说,标头数据及/或参数集可由固定长度译码模块(例如,uuencoding(UUE)或其它译码方法)产生。
仍参看图4,逆量化单元58及逆变换单元60分别应用逆量化及逆变换以在像素域中重构残余块(例如)以供稍后用作参考块。运动补偿单元44可通过将残余块加到参考帧存储装置64的帧中的一者的预测块来计算参考块。运动补偿单元44还可将一个或一个以上内插滤波器应用于经重构残余块,以计算子整数像素值以用于运动估计中。求和器162将经重构残余块加到由运动补偿单元44产生的经运动补偿预测块,以产生经重构视频块以用于存储于参考帧存储装置64中。运动估计单元42及运动补偿单元44可将经重构视频块用作参考块,以帧间译码后续视频帧中的块。
本发明的技术还涉及定义用于控制序列可使用的最精细切片粒度的简档及/或一个或一个以上层级。举例来说,如同大多数视频译码标准一样,H.264/AVC定义用于无误位流的语法、语意及解码过程,所述无误位流中的任一者符合某一简档或层级。H.264/AVC不指定编码器,但编码器的任务是保证所产生位流对于解码器是标准顺应式的。在视频译码标准的上下文中,“简档”对应于算法、特征或工具及施加到算法、特征或工具的约束的子集。举例来说,如通过H.264标准所定义,“简档”为由H.264标准指定的整个位流语法的子集。“层级”对应于例如(例如)解码器存储器及计算等解码器资源消耗的限制,所述限制与图片的分辨率、位速率及宏块(MB)处理速率有关。简档可以profile_idc(简档指示符)值用信号发出,而层级可以level_idc(层级指示符)值用信号发出。
举例来说,H.264标准认识到,在通过给定简档的语法强加的界限内,取决于通过位流中的语法元素采取的值(例如,经解码图片的指定大小),仍有可能需要编码器及解码器的性能的大变化。H.264标准进一步认识到,在许多应用中,实施能够处理在特定简档内的语法的所有假设使用的解码器既不实际也不经济。因此,H.264标准将“层级”定义为强加于位流中的语法元素的值上的指定约束集合。这些约束可为对值的简单限制。或者,这些约束可采取对值的算术组合(例如,图片宽度×图片高度×每秒解码的图片的数目)的约束的形式。H.264标准进一步指定,个别实施方案可支持针对每一受支持简档的不同层级。
符合简档的解码器(例如,视频解码器30)通常支持简档中所定义的所有特征。举例来说,作为译码特征,B图片译码在H.264/AVC的基线简档中未受到支持,但在H.264/AVC的其它简档中受到支持。符合层级的解码器应能够解码不需要超出层级中所定义的限制的资源的任何位流。简档及层级的定义可有助于解译能力。举例来说,在视频发射期间,可针对整个发射会话而协商及同意一对简档及层级定义。更具体来说,在H.264/AVC中,层级可定义(例如)对需要处理的宏块的数目、经解码图片缓冲器(DPB)大小、经译码图片缓冲器(CPB)大小、垂直运动向量范围、每两个连续MB的运动向量的最大数目及B块是否可具有小于8×8像素的子宏块分区的限制。以此方式,解码器可确定解码器是否能够适当地解码位流。
本发明的方面涉及定义用于控制切片粒度可经修改的程度的简档。即,视频编码器20可利用简档来停用以小于某一CU深度的粒度将视频数据帧分裂为切片的能力。在一些实例中,简档可不支持到低于LCU深度的CU深度的切片粒度。在此些实例中,经译码视频序列中的切片可为LCU对准的(例如,每一切片含有一个或一个以上完全形成的LCU)。
另外,如上文所指出,切片粒度可(例如)在序列参数集中以序列层级用信号发出。在此些实例中,针对图片而用信号发出(例如,在图片参数集中用信号发出)的切片粒度大体上等于或大于序列参数集中所指示的切片粒度。举例来说,如果切片粒度是8×8,则三个图片参数集可在位流中输送,其中图片参数集中的每一者具有不同切片粒度(例如,8×8、16×16及32×32)。在此实例中,特定序列中的切片可参考图片参数集中的任一者,且因此粒度可为8×8、16×16或32×32(例如,但非4×4或更小)。
本发明的方面还涉及定义一个或一个以上层级。举例来说,一个或一个以上层级可指示符合所述层级的解码器实施方案支持某一切片粒度层级。即,特定层级可具有对应于32×32的CU大小的切片粒度,而较高层级可具有对应于16×16的CU大小的切片粒度,且另一较高层级可允许相对较小切片粒度(例如,8×8像素的粒度)。
如表7中所展示,不同层级的解码器可对切片粒度可达到CU大小的哪一程度具有不同约束。
表7-简档及层级
Figure BDA00003455600100291
Figure BDA00003455600100301
在图4的实例中,本发明的特定方面(例如,与以小于LCU的粒度将视频数据帧分裂为切片有关的方面)已关于视频编码器20的特定单元而描述。然而,应理解,图4的实例中所提供的功能单元是出于解释的目的而提供。即,视频编码器20的特定单元可出于解释的目的单独展示及描述,但可高度集成(例如)于集成电路或其它处理单元内。因此,归于视频编码器20的一个单元的功能可由视频编码器20的一个或一个以上其它单元执行。
以此方式,视频编码器20是可编码包括多个块大小的译码单元的视频数据帧的视频编码器的实例,所述译码单元包含一个或一个以上最大译码单元(LCU),所述最大译码单元(LCU)包含以阶层方式布置的多个相对较小译码单元。根据一实例,视频编码器20可确定在形成帧的可独立解码部分时将借以分裂以阶层方式布置的多个较小译码单元的粒度。视频编码器20可使用所确定粒度分裂LCU以产生LCU的第一区段及LCU的第二区段,且产生包含LCU的第一区段而不包含LCU的第二区段的帧的可独立解码部分。视频编码器20还可产生包含帧的可独立解码部分及所确定粒度的指示的位流。
图5是说明可实施本发明中描述的用于解码已分裂为可独立解码部分的视频数据帧的技术中的任何或全部的视频解码器30的实例的框图。即,举例来说,视频解码器30可经配置以解码关于视频编码器20所描述的任何语法、参数集、标头数据或其它数据,所述语法、参数集、标头数据或其它数据与解码已分裂为可独立解码部分的视频数据帧相关联。
在图5的实例中,视频解码器30包含熵解码单元170、运动补偿单元172、帧内预测单元174、逆量化单元176、逆变换单元178、参考帧存储装置182及求和器180。应理解,如上文关于图4所指出,关于视频解码器30所描述的单元可为高度集成的,但出于解释的目的而单独描述。
在视频解码器30处所接收的视频序列可包括经编码图像帧集合、帧切片集合、共同译码图片群组(GOP)或包含经编码LCU及语法信息的视频信息的广泛多种单元,所述语法信息提供关于解码此些LCU的方式的指令。在一些实例中,视频解码器30可执行解码遍次(pass),所述解码遍次大体上与关于视频编码器20(图4)所描述的编码遍次互逆。举例来说,熵解码单元170可执行由图4的熵编码单元156执行的编码的互逆解码功能。特定来说,熵解码单元170可执行CAVLC或CABAC解码,或由视频编码器20使用的任何其它类型的熵解码。
另外,根据本发明的方面,熵解码单元170或视频解码器30的另一模块(例如,剖析模块)可使用语法信息(例如,如通过所接收四叉树提供)以确定用以编码经编码视频序列的帧的LCU的大小、描述经编码视频序列的帧的每一CU分裂的方式(及同样地,子CU分裂的方式)的分裂信息、指示每一分裂经编码的方式的模式(例如,帧内或帧间预测,且对于帧内预测为帧内预测编码模式)、用于每一经帧间编码PU的一个或一个以上参考帧(及/或含有用于参考帧的识别符的参考列表)及用以解码经编码视频序列的其它信息。
根据本发明的技术,在视频数据帧已按小于LCU的粒度分裂为切片的实例中,视频解码器30可经配置以识别此粒度。即,举例来说,视频解码器30可根据所接收或用信号发出的粒度值确定已借以分裂视频数据帧的粒度。在一些实例中,如上文关于视频编码器20所描述,可根据切片分裂可发生的CU深度来识别粒度。CU深度值可包含于例如图片参数集(PPS)等参数集的所接收语法中。举例来说,可借以将视频数据帧分裂为切片的粒度的指示可根据如上文所描述的表1来指示。
另外,视频解码器30可确定切片开始的地址(例如,“切片地址”)。切片地址可指示切片在帧内开始的相对位置。切片地址可以切片粒度层级提供。在一些实例中,切片地址可提供于切片标头中。在特定实例中,slice_address语法元素可指定切片开始的切片粒度分辨率的地址。在此实例中,slice_address可通过位流中的(Ceil(Log2(NumLCUsInPicture))+SliceGranularity)位表示,其中NumLCUsInPicture是图片(或帧)中的LCU的数目。可变LCUAddress可经设定为(slice_address>>SliceGranularity)且可表示呈光栅扫描次序的切片地址的LCU部分。可变GranularityAddress可经设定为(slice_address-(LCUAddress<<SliceGranularity))且可表示以z扫描次序表达的切片地址的子LCU部分。可变SliceAddress可接着经设定为(LCUAddress<<(log2_diff_max_min_coding_block_size<<1))+(GranularityAddress<<((log2_diff_max_min_coding_block_size<<1)-SliceGranularity)且切片解码可以可能在切片开始坐标处的最大译码单元开始。
另外,为了识别切片分裂已发生的位置,视频解码器30可经配置以接收识别切片的相对末尾的一个或一个以上语法元素。举例来说,视频解码器30可经配置以接收与帧的每一CU一起包含的切片旗标的一位末尾,所述一位末尾指示正经解码的CU是否为切片的最终CU(例如,在分裂之前的最终CU)。在一些实例中,视频解码器30可仅接收用于等于或大于用以将帧分裂为切片的粒度的CU的切片指示的末尾(例如,切片旗标的末尾)。
另外,视频解码器30可经配置以接收用于已分裂为不同切片的LCU的单独阶层式四叉树信息。举例来说,视频解码器30可接收与已在切片之间分裂的LCU的不同区段相关联的分开的分裂旗标。
在一些实例中,为了适当地解码含有用于LCU的四叉树信息的仅一部分的LCU的当前区段,视频解码器30可重构与LCU的先前区段相关联的四叉树信息。举例来说,如上文关于图3A及3B所描述,视频解码器30可识别所接收切片的第一子CU的索引值。视频解码器30可接着使用索引值来识别所接收子CU属于的象限。另外,视频解码器30可(例如,使用如上文描述的深度优先四叉树遍历算法及所接收分裂旗标)推断LCU的所接收区段的四叉树的所有节点。
如上文关于视频编码器20(图4)指出,本发明的方面还涉及定义用于控制可借以将视频数据帧分裂为切片的粒度的一个或一个以上简档及/或层级。因此,在一些实例中,视频解码器30可经配置以利用关于图4所描述的此些简档及/或层级。此外,视频解码器30可经配置以接收及利用由视频编码器20定义的任何帧参数集(FPS)。
尽管本发明的特定方面大体来说已关于视频解码器30来描述,但应理解,此些方面可由视频解码器30的一个或一个以上单元(例如,熵解码单元170、剖析模块或视频解码器30的一个或一个以上其它单元)执行。
运动补偿单元172可基于从熵解码单元170接收的运动向量产生预测数据。举例来说,运动补偿单元172产生经运动补偿的块,其可能基于内插滤波器执行内插。具有子像素精度的待用于运动估计的内插滤波器的识别符可包含于语法元素中。运动补偿单元172可在视频块的编码期间使用如由视频编码器20使用的内插滤波器,以计算参考块的子整数像素的内插值。运动补偿单元172可根据所接收语法信息来确定由视频编码器20使用的内插滤波器,且使用所述内插滤波器来产生预测块。
帧内预测单元174可基于用信号发出的帧内预测模式及来自当前帧的先前解码块的数据而产生用于当前帧的当前块的预测数据。
在一些实例中,逆量化单元176可使用由视频编码器20使用的扫描镜像来扫描所接收值。以此方式,视频解码器30可从所接收的系数的一维阵列产生经量化变换系数的二维矩阵。逆量化单元176逆量化(即,解量化)在位流中提供且由熵解码单元170解码的经量化变换系数。
逆量化过程可包含(例如)如由H.264解码标准或由HEVC所定义的常规过程。逆量化过程还可包含使用由视频编码器20针对CU计算及用信号发出的量化参数(QP)或差量QP,以确定量化的程度,且同样确定应被应用的逆量化的程度。
根据本发明的方面,在LCU经划分为两个切片的实例中,逆量化单元176可接收用于经划分LCU的每一部分的单独QP(或差量QP)。出于解释的目的,假定LCU已经分裂为两个切片,以使得LCU的第一区段已与第一切片一起包含且LCU的第二区段已与第二切片一起包含。在此实例中,逆量化单元176可接收用于LCU的第一区段的第一差量QP及用于LCU的第二区段的独立于第一差量QP的第二差量QP。在一些实例中,与第一切片一起提供的差量QP可不同于与第二切片一起提供的差量QP。
逆变换单元178应用逆变换,例如,逆DCT、逆整数变换、逆旋转变换或逆方向变换。求和器180组合残余块与由运动补偿单元72或帧内预测单元74所产生的对应预测块以形成经解码块。如果需要,还可应用解块滤波器来对经解码块进行滤波以便移除成块效应假影。接着将经解码视频块存储于参考帧存储装置82中,参考帧存储装置82提供参考块以用于后续运动补偿,且还产生经解码视频以用于呈现于显示装置(例如,图1的显示装置32)上。
在图5的实例中,本发明的特定方面(例如,与接收及解码视频数据帧有关的方面,所述帧已以小于LCU的粒度经分裂为切片)已关于视频解码器30的特定单元而描述。然而,应理解,图5的实例中所提供的功能单元是出于解释的目的而提供。即,视频解码器30的特定单元可出于解释的目的单独展示及描述,但可高度集成(例如)于集成电路或其它处理单元内。因此,归于视频解码器30的一个单元的功能可由视频解码器的一个或一个以上其它单元执行。
因此,图5提供可解码包括多个块大小的译码单元的视频数据帧的视频解码器30的实例,所述译码单元包含一个或一个以上最大译码单元(LCU),所述最大译码单元(LCU)包含以阶层方式布置的多个相对较小译码单元。即,视频解码器30可确定在形成帧的可独立解码部分时已借以分裂以阶层方式布置的多个较小译码单元的粒度,且使用所确定粒度识别已分裂为第一区段及第二区段的LCU。视频解码器30还可解码包含LCU的第一区段而无LCU的第二区段的帧的可独立解码部分。
图6是说明与本发明一致的编码技术的流程图。尽管出于解释的目的而大体上描述为由视频编码器20(图4)的组件执行,但应理解,例如视频解码器、处理器、处理单元、基于硬件的译码单元(例如,编码器/解码器(CODEC))及其类似者的其它视频编码单元也可经配置以执行图6的方法。
在图6中所展示的实例方法220中,视频编码器20最初确定借以将帧划分为切片的粒度(204),根据本发明的技术,所述粒度可小于LCU。如上文所描述,当确定借以将视频数据帧分裂为切片的粒度时,视频编码器20可考虑(例如)各种切片配置的速率失真且选择实现在可接受位速率范围内的位速率同时还提供在可接受失真范围内的失真的粒度。可接受位速率范围及可接受失真范围可通过简档定义,例如在视频译码标准(例如,所提议的HEVC标准)中所指定的简档。或者或另外,视频编码器20可在选择粒度时考虑目标切片大小。大体来说,增加粒度可允许关于切片的大小的较大控制,但也可增加编码或解码切片时利用的译码单元资源。
如果视频编码器20确定用于将视频数据帧分裂为切片的粒度小于LCU,则视频编码器20可在产生切片的过程中使用所确定粒度来将LCU分裂为第一区段及第二区段(206)。即,视频编码器20可识别与LCU一起包含的切片边界。在此实例中,视频编码器20可将LCU分裂为第一区段及与第一区段分开的第二区段。
当将LCU分裂为两个区段时,视频编码器20还可将与LCU相关联的四叉树分开为两个对应区段,且将四叉树的相应区段与LCU的两个区段一起包含(208)。举例来说,如上文所描述,视频编码器20可将相关联于LCU的第一区段的分裂旗标与相关联于LCU的第二区段的分裂旗标分开。当编码含有LCU的区段的切片时,视频编码器20可仅将与LCU的第一区段相关联的分裂旗标与含有LCU的第一区段的切片一起包含,且将与LCU的区段相关联的分裂旗标与含有LCU的第二区段的切片一起包含。
另外,当在切片形成期间将LCU分裂为两个区段时,视频编码器20可针对LCU的每一区段产生单独量化参数(QP)或差量QP值。举例来说,视频编码器20可针对LCU的第一区段产生第一QP或差量QP值,且针对LCU的第二区段产生第二QP或差量QP值。在一些实例中,用于第一区段的QP或差量QP值可不同于用于第二区段的QP或差量QP值。
视频编码器20可接着产生含有LCU的帧的可独立解码部分(例如,切片),其包含LCU的第一区段而无LCU的第二区段(212)。举例来说,视频编码器20可产生含有视频数据帧的一个或一个以上全LCU以及帧的经划分LCU的第一区段的切片。在此实例中,视频编码器20可包含与经划分LCU的第一区段相关联的分裂旗标及差量QP值。
视频编码器20还可提供用以将视频数据帧分裂为切片的粒度的指示(214)。举例来说,视频编码器20可使用可借以发生切片分裂的CU深度值来提供粒度的指示。在其它实例中,视频编码器20可以不同方式指示粒度。举例来说,视频编码器20可通过以其它方式识别切片分裂可发生的子CU的大小来指示粒度。或者或另外,如上文所描述,视频编码器20可将多种其它信息(例如,切片旗标的末尾、帧参数集(即S)及其类似者)与切片一起包含。
视频编码器20可接着产生含有与切片相关联的视频数据以及用于解码切片的语法信息的位流(216)。根据本发明的方面,所产生位流可实时地发射到解码器(例如,在视频会议中)或存储于计算机可读媒体上以供解码器未来使用(例如,以串流发射、下载、磁盘存取、卡存取、DVD、蓝光及其类似者方式)。
还应理解,关于图6所展示及描述的步骤仅作为一个实例而提供。即,图6的方法的步骤不必按图6中所展示的次序执行,且可执行更少、额外或替代步骤。举例来说,根据另一实例,视频编码器20可在产生切片之前产生语法元素(例如,例如粒度的指示)(214)。
图7是说明与本发明一致的解码技术的流程图。尽管出于解释的目的而大体上描述为由视频解码器30(图5)的组件执行,但应理解,例如视频解码器、处理器、处理单元、基于硬件的译码单元(例如,编码器/解码器(CODEC))及其类似者的其它视频编码单元也可经配置以执行图7的方法。
在图7中所展示的实例方法220中,视频解码器30接收视频数据帧的可独立解码部分,其在本文中称为切片(222)。在接收到切片后,视频解码器30即刻确定借以形成切片的粒度(224),所述粒度可小于LCU。举例来说,如上文所描述,视频编码器可产生将LCU分裂为两个区段的切片,以使得LCU的第一区段与所接收切片一起包含,而LCU的第二区段与另一切片一起包含。为了确定借以将帧分裂为切片的粒度,视频解码器30可接收粒度的指示。即,视频解码器30可接收识别可借以发生切片分裂的CU深度的CU深度值。
在视频数据帧已按小于LCU的粒度分裂为切片的实例中,视频解码器30可接着识别已分裂为多个区段的所接收切片的LCU(226)。视频解码器30还可确定用于LCU的所接收区段的四叉树(228)。即,视频解码器30可识别与LCU的所接收区段相关联的分裂旗标。另外,如上文所描述,视频解码器30可重构与已分裂的整个LCU相关联的四叉树以便适当地解码所接收区段。视频解码器30还可确定用于LCU的所接收区段的QP或差量QP值(230)。
使用视频数据及相关联的语法信息,视频解码器30可接着解码含有LCU的所接收区段的切片(232)。如上文关于图6所描述,视频解码器30可接收及利用用于解码切片的多种信息,所述信息包含(例如)切片旗标的末尾、帧参数集(FPS)及其类似者。
还应理解,关于图7所展示及描述的步骤仅作为一个实例而提供。即,图7的方法的步骤不必按图7中所展示的次序执行,且可执行更少、额外或替代步骤。
在一个或一个以上实例中,所描述功能可以硬件、软件、固件或其任何组合实施。如果以软件实施,则所述功能可作为一个或一个以上指令或代码而存储于计算机可读媒体上或经由计算机可读媒体进行发射,且由基于硬件的处理单元执行。计算机可读媒体可包含计算机可读存储媒体(其对应于例如数据存储媒体等有形媒体)或通信媒体,通信媒体包含(例如)根据通信协议促进计算机程序从一处传送到另一处的任何媒体。
以此方式,计算机可读媒体通常可对应于(1)非暂时性的有形计算机可读存储媒体,或(2)例如信号或载波的通信媒体。数据存储媒体可为可由一个或一个以上计算机或一个或一个以上处理器存取以检索指令、代码及/或数据结构以用于实施本发明中所描述的技术的任何可用媒体。计算机程序产品可包含计算机可读媒体。
通过实例而非限制,此些计算机可读存储媒体可包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁性存储装置、快闪存储器,或可用以存储呈指令或数据结构的形式的所要程序代码且可由计算机存取的任何其它媒体。又,将任何连接适当地称为计算机可读媒体。举例来说,如果使用同轴电缆、光纤电缆、双绞线、数字订户线(DSL)或无线技术(例如,红外线、无线电及微波)而从网站、服务器或其它远程源发射指令,则同轴电缆、光纤电缆、双绞线、DSL或无线技术(例如,红外线、无线电及微波)包含于媒体的定义中。
然而,应理解,计算机可读存储媒体及数据存储媒体不包含连接、载波、信号或其它暂时性媒体,而是针对非暂时性有形存储媒体。如本文中所使用,磁盘及光盘包含压缩光盘(CD)、激光光盘、光学光盘、数字多功能光盘(DVD)、软性磁盘及蓝光光盘,其中磁盘通常以磁性方式再生数据,而光盘通过激光以光学方式再生数据。以上各物的组合也应包含于计算机可读媒体的范围内。
可由例如一个或一个以上数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA)或其它等效集成或离散逻辑电路的一个或一个以上处理器来执行指令。因此,如本文中所使用的术语“处理器”可指代上述结构或适于实施本文中所描述的技术的任何其它结构中的任一者。另外,在一些方面中,可将本文中所描述的功能性提供于经配置以用于编码及解码的专用硬件及/或软件模块内,或并入于组合式编解码器中。又,所述技术可完全实施于一个或一个以上电路或逻辑元件中。
本发明的技术可以广泛多种装置或设备实施,所述装置或设备包含无线手持机、集成电路(IC)或一组IC(例如,芯片组)。在本发明中描述各种组件、模块或单元以强调经配置以执行所揭示技术的装置的功能方面,但未必需要通过不同硬件单元实现。相反地,如上文所描述,可将各种单元组合于编解码器硬件单元中,或由互操作性硬件单元(包含如上文所描述的一个或一个以上处理器)的集合结合合适软件及/或固件来提供所述单元。
已描述本发明的各种方面。这些及其它方面在所附权利要求书的范围内。

Claims (56)

1.一种解码包括多个块大小的译码单元的视频数据帧的方法,所述多个块大小的译码单元包含一个或一个以上最大译码单元LCU,所述一个或一个以上LCU包含以阶层方式布置的多个相对较小译码单元,所述方法包括:
确定在形成所述帧的可独立解码部分时已借以分裂所述以阶层方式布置的多个较小译码单元的粒度;
使用所述所确定粒度识别已分裂为第一区段及第二区段的LCU;及
解码包含所述LCU的所述第一区段而无所述LCU的所述第二区段的所述帧的可独立解码部分。
2.根据权利要求1所述的方法,其中确定所述粒度包含确定已借以分裂所述以阶层方式布置的多个较小译码单元的CU深度。
3.根据权利要求2所述的方法,其中确定已借以分裂所述以阶层方式布置的多个较小译码单元的CU深度包括解码图片参数集中的CU深度值。
4.根据权利要求1所述的方法,其进一步包括确定所述LCU的所述第一区段的地址。
5.根据权利要求4所述的方法,其中确定所述LCU的所述第一区段的所述地址包括解码切片标头的切片地址。
6.根据权利要求1所述的方法,其中所述帧的所述可独立解码部分包括第一可独立解码部分;且
其中所述方法进一步包括:
解码包含所述LCU的所述第二区段的所述帧的第二可独立解码部分;及
通过所述第一可独立解码部分来解码四叉树结构的第一部分,所述第一部分识别相对较小译码单元的所述阶层式布置;及
通过所述第二可独立解码部分来与所述四叉树分割结构的所述第一部分分开地解码所述四叉树结构的第二部分。
7.根据权利要求6所述的方法,其中解码所述四叉树结构的所述第一部分包括:
解码指示所述第一可独立解码部分内的译码单元划分的一个或一个以上分裂旗标;及
解码指示所述第二可独立解码部分内的译码单元划分的一个或一个以上分裂旗标。
8.根据权利要求1所述的方法,其中所述帧的所述可独立解码部分包括第一可独立解码部分,且
其中所述方法进一步包括:
解码包含所述LCU的所述第二区段的所述帧的第二可独立解码部分;
识别用于所述第一可独立解码部分的量化参数的改变;及
与所述第一可独立解码部分分开而识别用于所述第二可独立解码部分的量化参数的改变。
9.根据权利要求1所述的方法,其进一步包括解码所述可独立解码部分的末尾的指不。
10.一种用于解码包括多个块大小的译码单元的视频数据帧的设备,所述多个块大小的译码单元包含一个或一个以上最大译码单元LCU,所述一个或一个以上LCU包含以阶层方式布置的多个相对较小译码单元,所述设备包括经配置以执行以下操作的一个或一个以上处理器:
确定在形成所述帧的可独立解码部分时已借以分裂所述以阶层方式布置的多个较小译码单元的粒度;
使用所述所确定粒度识别已分裂为第一区段及第二区段的LCU;及
解码包含所述LCU的所述第一区段而无所述LCU的所述第二区段的所述帧的可独立解码部分。
11.根据权利要求10所述的设备,其中确定所述粒度包含确定已借以分裂所述以阶层方式布置的多个较小译码单元的CU深度。
12.根据权利要求11所述的设备,其中确定已借以分裂所述以阶层方式布置的多个较小译码单元的CU深度包括解码图片参数集中的CU深度值。
13.根据权利要求10所述的设备,其中所述一个或一个以上处理器进一步经配置以确定所述LCU的所述第一区段的地址。
14.根据权利要求13所述的设备,其中确定所述LCU的所述第一区段的所述地址包括解码切片标头的切片地址。
15.根据权利要求10所述的设备,其中所述帧的所述可独立解码部分包括第一可独立解码部分;且
其中所述一个或一个以上处理器进一步经配置以执行以下操作:
解码包含所述LCU的所述第二区段的所述帧的第二可独立解码部分;及
通过所述第一可独立解码部分来解码四叉树结构的第一部分,所述第一部分识别相对较小译码单元的所述阶层式布置;及
通过所述第二可独立解码部分来与所述四叉树分割结构的所述第一部分分开地解码所述四叉树结构的第二部分。
16.根据权利要求15所述的设备,其中解码所述四叉树结构的所述第一部分包括:
解码指示所述第一可独立解码部分内的译码单元划分的一个或一个以上分裂旗标;及
解码指示所述第二可独立解码部分内的译码单元划分的一个或一个以上分裂旗标。
17.根据权利要求10所述的设备,其中所述帧的所述可独立解码部分包括第一可独立解码部分,且
其中所述一个或一个以上处理器进一步经配置以执行以下操作:
解码包含所述LCU的所述第二区段的所述帧的第二可独立解码部分;
识别用于所述第一可独立解码部分的量化参数的改变;及
与所述第一可独立解码部分分开而识别用于所述第二可独立解码部分的量化参数的改变。
18.根据权利要求10所述的设备,其中所述一个或一个以上处理器进一步经配置以解码所述可独立解码部分的末尾的指示。
19.根据权利要求10所述的设备,其中所述设备包括移动装置。
20.一种用于解码包括多个块大小的译码单元的视频数据帧的设备,所述多个块大小的译码单元包含一个或一个以上最大译码单元LCU,所述一个或一个以上LCU包含以阶层方式布置的多个相对较小译码单元,所述设备包括:
用于确定在形成所述帧的可独立解码部分时已借以分裂所述以阶层方式布置的多个较小译码单元的粒度的装置;
用于使用所述所确定粒度识别已分裂为第一区段及第二区段的LCU的装置;及
用于解码包含所述LCU的所述第一区段而无所述LCU的所述第二区段的所述帧的可独立解码部分的装置。
21.根据权利要求20所述的设备,其中确定所述粒度包含确定已借以分裂所述以阶层方式布置的多个较小译码单元的CU深度。
22.根据权利要求21所述的设备,其中确定已借以分裂所述以阶层方式布置的多个较小译码单元的CU深度包括解码图片参数集中的CU深度值。
23.根据权利要求20所述的设备,其中所述帧的所述可独立解码部分包括第一可独立解码部分;且所述设备进一步包括:
用于解码包含所述LCU的所述第二区段的所述帧的第二可独立解码部分的装置;及
用于通过所述第一可独立解码部分来解码四叉树结构的第一部分的装置,所述第一部分识别相对较小译码单元的所述阶层式布置;及
用于通过所述第二可独立解码部分来与所述四叉树分割结构的所述第一部分分开地解码所述四叉树结构的第二部分的装置。
24.一种存储指令的计算机可读存储媒体,所述指令在由一个或一个以上处理器执行时使所述一个或一个以上处理器执行用于解码包括多个块大小的译码单元的视频数据帧的方法,所述多个块大小的译码单元包含一个或一个以上最大译码单元LCU,所述一个或一个以上LCU包含以阶层方式布置的多个相对较小译码单元,所述方法包括:
确定在形成所述帧的可独立解码部分时已借以分裂所述以阶层方式布置的多个较小译码单元的粒度;
使用所述所确定粒度识别已分裂为第一区段及第二区段的LCU;及
解码包含所述LCU的所述第一区段而无所述LCU的所述第二区段的所述帧的可独立解码部分。
25.根据权利要求24所述的计算机可读存储媒体,其中确定所述粒度包含确定已借以分裂所述以阶层方式布置的多个较小译码单元的CU深度。
26.根据权利要求25所述的计算机可读存储媒体,其中确定已借以分裂所述以阶层方式布置的多个较小译码单元的CU深度包括解码图片参数集中的CU深度值。
27.根据权利要求24所述的计算机可读存储媒体,其中所述帧的所述可独立解码部分包括第一可独立解码部分;且其中所述方法进一步包括:
解码包含所述LCU的所述第二区段的所述帧的第二可独立解码部分;及
通过所述第一可独立解码部分来解码四叉树结构的第一部分,所述第一部分识别相对较小译码单元的所述阶层式布置;及
通过所述第二可独立解码部分来与所述四叉树分割结构的所述第一部分分开地解码所述四叉树结构的第二部分。
28.一种编码包括多个块大小的译码单元的视频数据帧的方法,所述多个块大小的译码单元包含一个或一个以上最大译码单元LCU,所述一个或一个以上LCU包含以阶层方式布置的多个相对较小译码单元,所述方法包括:
确定在形成所述帧的可独立解码部分时将借以分裂所述以阶层方式布置的多个较小译码单元的粒度;
使用所述所确定粒度分裂LCU以产生所述LCU的第一区段及所述LCU的第二区段;
产生所述帧的可独立解码部分以包含所述LCU的所述第一区段而不包含所述LCU的所述第二区段;及
产生位流以包含所述帧的所述可独立解码部分及所述所确定粒度的指示。
29.根据权利要求28所述的方法,
其中确定所述粒度包含确定将借以分裂所述以阶层方式布置的多个较小译码单元的CU深度;且
其中产生所述位流包含产生所述位流以包含CU深度值。
30.根据权利要求29所述的方法,其中产生所述位流以包含所述所确定粒度的所述指示包括产生所述位流以在图片参数集中包含所述CU深度值。
31.根据权利要求28所述的方法,其中所述帧的所述可独立解码部分包括第一可独立解码部分;且
其中所述方法进一步包括:
产生所述帧的第二可独立解码部分以包含所述LCU的所述第二区段;及
通过所述第一可独立解码部分来指示四叉树结构的第一部分,所述第一部分识别相对较小译码单元的所述阶层式布置;及
通过所述第二可独立解码部分来与所述四叉树分割结构的所述第一部分分开地指示所述四叉树结构的第二部分。
32.根据权利要求31所述的方法,其中指示所述四叉树结构的所述第一部分包括:
产生指示所述第一可独立解码部分内的译码单元划分的一个或一个以上分裂旗标;及
产生指示所述第二可独立解码部分内的译码单元划分的一个或一个以上分裂旗标。
33.根据权利要求28所述的方法,其中所述帧的所述可独立解码部分包括第一可独立解码部分,且
其中所述方法进一步包括:
产生所述帧的第二可独立解码部分以包含所述LCU的所述第二区段;
指示用于所述第一可独立解码部分的量化参数的改变;及
与所述第一可独立解码部分分开而指示用于所述第二可独立解码部分的量化参数的改变。
34.根据权利要求28所述的方法,其中产生位流以包含所述帧的所述可独立解码部分包括产生所述可独立解码部分的末尾的指示。
35.根据权利要求34所述的方法,其中产生所述可独立解码部分的所述末尾的所述指示包括产生识别所述可独立解码部分的所述末尾的一位旗标。
36.根据权利要求35所述的方法,其中所述一位旗标并非是针对具有比借以分裂所述以阶层方式布置的多个较小译码单元的所述粒度小的粒度的译码单元而产生。
37.一种用于编码包括多个块大小的译码单元的视频数据帧的设备,所述多个块大小的译码单元包含一个或一个以上最大译码单元LCU,所述一个或一个以上LCU包含以阶层方式布置的多个相对较小译码单元,所述设备包括经配置以执行以下操作的一个或一个以上处理器:
确定在形成所述帧的可独立解码部分时将借以分裂所述以阶层方式布置的多个较小译码单元的粒度;
使用所述所确定粒度分裂LCU以产生所述LCU的第一区段及所述LCU的第二区段;
产生所述帧的可独立解码部分以包含所述LCU的所述第一区段而不包含所述LCU的所述第二区段;及
产生位流以包含所述帧的所述可独立解码部分及所述所确定粒度的指示。
38.根据权利要求37所述的设备,
其中确定所述粒度包含确定将借以分裂所述以阶层方式布置的多个较小译码单元的CU深度;且
其中产生所述位流包含产生所述位流以包含CU深度值。
39.根据权利要求38所述的设备,其中产生所述位流以包含所述所确定粒度的所述指示包括产生所述位流以在图片参数集中包含所述CU深度值。
40.根据权利要求37所述的设备,其中所述帧的所述可独立解码部分包括第一可独立解码部分;且其中所述一个或一个以上处理器进一步经配置以执行以下操作:
产生所述帧的第二可独立解码部分以包含所述LCU的所述第二区段;及
通过所述第一可独立解码部分来指示四叉树结构的第一部分,所述第一部分识别相对较小译码单元的所述阶层式布置;及
通过所述第二可独立解码部分来与所述四叉树分割结构的所述第一部分分开地指示所述四叉树结构的第二部分。
41.根据权利要求40所述的设备,其中指示所述四叉树结构的所述第一部分包括:
产生指示所述第一可独立解码部分内的译码单元划分的一个或一个以上分裂旗标;及
产生指示所述第二可独立解码部分内的译码单元划分的一个或一个以上分裂旗标。
42.根据权利要求37所述的设备,其中所述帧的所述可独立解码部分包括第一可独立解码部分,且其中所述一个或一个以上处理器进一步经配置以执行以下操作:
产生所述帧的第二可独立解码部分以包含所述LCU的所述第二区段;
指示用于所述第一可独立解码部分的量化参数的改变;及
与所述第一可独立解码部分分开而指示用于所述第二可独立解码部分的量化参数的改变。
43.根据权利要求37所述的设备,其中产生位流以包含所述帧的所述可独立解码部分包括产生所述可独立解码部分的末尾的指示。
44.根据权利要求43所述的设备,其中产生所述可独立解码部分的所述末尾的所述指示包括产生识别所述可独立解码部分的所述末尾的一位旗标。
45.根据权利要求44所述的设备,其中所述一位旗标并非是针对具有比借以分裂所述以阶层方式布置的多个较小译码单元的所述粒度小的粒度的译码单元而产生。
46.根据权利要求37所述的设备,其中所述设备包括移动装置。
47.一种用于编码包括多个块大小的译码单元的视频数据帧的设备,所述多个块大小的译码单元包含一个或一个以上最大译码单元LCU,所述一个或一个以上LCU包含以阶层方式布置的多个相对较小译码单元,所述设备包括:
用于确定在形成所述帧的可独立解码部分时将借以分裂所述以阶层方式布置的多个较小译码单元的粒度的装置;
用于使用所述所确定粒度分裂LCU以产生所述LCU的第一区段及所述LCU的第二区段的装置;
用于产生所述帧的可独立解码部分以包含所述LCU的所述第一区段而不包含所述LCU的所述第二区段的装置;及
用于产生位流以包含所述帧的所述可独立解码部分及所述所确定粒度的指示的装置。
48.根据权利要求47所述的设备,
其中确定所述粒度包含确定将借以分裂所述以阶层方式布置的多个较小译码单元的CU深度;且
其中产生所述位流包含产生所述位流以包含CU深度值。
49.根据权利要求48所述的设备,其中产生所述位流以包含所述所确定粒度的所述指示包括产生所述位流以在图片参数集中包含所述CU深度值。
50.根据权利要求47所述的设备,其中所述帧的所述可独立解码部分包括第一可独立解码部分;且所述设备进一步包括:
用于产生所述帧的第二可独立解码部分以包含所述LCU的所述第二区段的装置;及
用于通过所述第一可独立解码部分来指示四叉树结构的第一部分的装置,所述第一部分识别相对较小译码单元的所述阶层式布置;及
用于通过所述第二可独立解码部分来与所述四叉树分割结构的所述第一部分分开地指示所述四叉树结构的第二部分的装置。
51.根据权利要求50所述的设备,其中指示所述四叉树结构的所述第一部分包括:
产生指示所述第一可独立解码部分内的译码单元划分的一个或一个以上分裂旗标;及
产生指示所述第二可独立解码部分内的译码单元划分的一个或一个以上分裂旗标。
52.一种存储指令的计算机可读存储媒体,所述指令在由一个或一个以上处理器执行时使所述一个或一个以上处理器执行用于编码包括多个块大小的译码单元的视频数据帧的方法,所述多个块大小的译码单元包含一个或一个以上最大译码单元LCU,所述一个或一个以上LCU包含以阶层方式布置的多个相对较小译码单元,所述方法包括:
确定在形成所述帧的可独立解码部分时将借以分裂所述以阶层方式布置的多个较小译码单元的粒度;
使用所述所确定粒度分裂LCU以产生所述LCU的第一区段及所述LCU的第二区段;
产生所述帧的可独立解码部分以包含所述LCU的所述第一区段而不包含所述LCU的所述第二区段;及
产生位流以包含所述帧的所述可独立解码部分及所述所确定粒度的指示。
53.根据权利要求52所述的计算机可读存储媒体,
其中确定所述粒度包含确定将借以分裂所述以阶层方式布置的多个较小译码单元的CU深度;且
其中产生所述位流包含产生所述位流以包含CU深度值。
54.根据权利要求53所述的计算机可读存储媒体,其中产生所述位流以包含所述所确定粒度的所述指示包括产生所述位流以在图片参数集中包含所述CU深度值。
55.根据权利要求52所述的计算机可读存储媒体,其中所述帧的所述可独立解码部分包括第一可独立解码部分;所述方法进一步包括:
产生所述帧的第二可独立解码部分以包含所述LCU的所述第二区段;及
通过所述第一可独立解码部分来指示四叉树结构的第一部分,所述第一部分识别相对较小译码单元的所述阶层式布置;及
通过所述第二可独立解码部分来与所述四叉树分割结构的所述第一部分分开地指示所述四叉树结构的第二部分。
56.根据权利要求55所述的计算机可读存储媒体,其中指示所述四叉树结构的所述第一部分包括:
产生指示所述第一可独立解码部分内的译码单元划分的一个或一个以上分裂旗标;及
产生指示所述第二可独立解码部分内的译码单元划分的一个或一个以上分裂旗标。
CN201280004585.3A 2011-01-05 2012-01-03 视频译码中的帧分裂 Active CN103299627B (zh)

Applications Claiming Priority (11)

Application Number Priority Date Filing Date Title
US201161430104P 2011-01-05 2011-01-05
US61/430,104 2011-01-05
US201161435098P 2011-01-21 2011-01-21
US61/435,098 2011-01-21
US201161454166P 2011-03-18 2011-03-18
US61/454,166 2011-03-18
US201161492751P 2011-06-02 2011-06-02
US61/492,751 2011-06-02
US13/341,368 US20120170648A1 (en) 2011-01-05 2011-12-30 Frame splitting in video coding
US13/341,368 2011-12-30
PCT/US2012/020108 WO2012094342A1 (en) 2011-01-05 2012-01-03 Frame splitting in video coding

Publications (2)

Publication Number Publication Date
CN103299627A true CN103299627A (zh) 2013-09-11
CN103299627B CN103299627B (zh) 2016-08-24

Family

ID=46380763

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201280004585.3A Active CN103299627B (zh) 2011-01-05 2012-01-03 视频译码中的帧分裂

Country Status (9)

Country Link
US (1) US20120170648A1 (zh)
EP (1) EP2661889A1 (zh)
JP (2) JP2014506066A (zh)
KR (1) KR101547743B1 (zh)
CN (1) CN103299627B (zh)
AR (1) AR084787A1 (zh)
BR (1) BR112013017141A2 (zh)
TW (1) TWI523540B (zh)
WO (1) WO2012094342A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108605130A (zh) * 2015-11-27 2018-09-28 联发科技股份有限公司 用于视频和图像编码的熵编解码和上下文建模的方法和装置
CN109151468A (zh) * 2017-06-28 2019-01-04 华为技术有限公司 一种图像数据的编码、解码方法及装置
CN110651480A (zh) * 2017-03-20 2020-01-03 弗劳恩霍夫应用研究促进协会 高级视频数据流提取和多分辨率视频传输
CN110839161A (zh) * 2018-08-19 2020-02-25 北京字节跳动网络技术有限公司 扩展四叉树分割的边界处理

Families Citing this family (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106454374B (zh) 2010-04-13 2019-09-06 Ge视频压缩有限责任公司 解码器、重建数组的方法、编码器、编码方法
BR122020007918B1 (pt) 2010-04-13 2022-11-29 Ge Video Compression, Llc Fusão de região de amostra
KR20230053700A (ko) 2010-04-13 2023-04-21 지이 비디오 컴프레션, 엘엘씨 이미지들의 멀티-트리 서브-디비젼을 이용한 비디오 코딩
KR102205041B1 (ko) 2010-04-13 2021-01-19 지이 비디오 컴프레션, 엘엘씨 평면 간 예측
EP2663078A4 (en) * 2011-01-07 2015-02-11 Samsung Electronics Co Ltd VIDEO PRESENTATION METHOD FOR CARRYING OUT BILATERAL PREDICTIONS AND UNILATERAL PREDICTIONS AND DEVICE THEREFOR, VIDEO CODING METHOD AND DEVICE THEREFOR AND VIDEO DECODING METHOD AND DEVICE THEREFOR
WO2012169952A2 (en) * 2011-06-10 2012-12-13 Telefonaktiebolaget L M Ericsson (Publ) Signaling of end of slices
US20130022108A1 (en) * 2011-06-30 2013-01-24 General Instrument Corporation Quantization parameter derivation from qp predictor
TW201315246A (zh) * 2011-09-27 2013-04-01 Sony Corp 圖像處理裝置及方法
KR20130050406A (ko) * 2011-11-07 2013-05-16 오수미 머지 모드에서의 움직임 정보 생성 방법
KR20130050403A (ko) * 2011-11-07 2013-05-16 오수미 인터 모드에서의 복원 블록 생성 방법
AU2013244560B2 (en) * 2012-04-06 2017-04-06 Sony Corporation Decoder and decoding method, as well as encoder and encoding method
US9813705B2 (en) 2012-04-26 2017-11-07 Qualcomm Incorporated Parameter set coding
CN104885456A (zh) 2012-09-18 2015-09-02 Vid拓展公司 使用图块和图块组的感兴趣区域视频编码
WO2014047943A1 (zh) * 2012-09-29 2014-04-03 华为技术有限公司 视频编码及解码方法、装置及系统
US10038899B2 (en) * 2012-10-04 2018-07-31 Qualcomm Incorporated File format for video data
WO2014081261A1 (ko) * 2012-11-23 2014-05-30 인텔렉추얼 디스커버리 주식회사 움직임 정보 병합을 이용한 비디오 부호화/복호화 방법 및 장치
US10057590B2 (en) 2014-01-13 2018-08-21 Mediatek Inc. Method and apparatus using software engine and hardware engine collaborated with each other to achieve hybrid video encoding
US10142642B2 (en) * 2014-06-04 2018-11-27 Qualcomm Incorporated Block adaptive color-space conversion coding
CN105338281B (zh) * 2014-06-27 2018-07-31 阿里巴巴集团控股有限公司 一种视频显示方法和装置
WO2016022979A1 (en) * 2014-08-07 2016-02-11 Sonic IP. Inc. Systems and methods for protecting elementary bitstreams incorporating independently encoded tiles
WO2016153251A1 (ko) * 2015-03-23 2016-09-29 엘지전자 주식회사 비디오 신호의 처리 방법 및 이를 위한 장치
US10187640B2 (en) * 2015-09-01 2019-01-22 Mediatek Inc. Method of hard-limited packet size for video encoding
US10212444B2 (en) 2016-01-15 2019-02-19 Qualcomm Incorporated Multi-type-tree framework for video coding
US11223852B2 (en) * 2016-03-21 2022-01-11 Qualcomm Incorporated Coding video data using a two-level multi-type-tree framework
CN107315535B (zh) * 2016-04-27 2019-09-20 北京京东尚科信息技术有限公司 信息处理方法和装置
CN117176948A (zh) * 2016-10-04 2023-12-05 有限公司B1影像技术研究所 图像编码/解码方法、记录介质和传输比特流的方法
CN114531593B (zh) * 2016-10-04 2023-03-21 有限公司B1影像技术研究所 图像数据编码/解码方法、介质和发送比特流的方法
US10986152B2 (en) * 2016-12-29 2021-04-20 Arris Enterprises Llc Method for dynamically managing content delivery
US10848788B2 (en) 2017-01-06 2020-11-24 Qualcomm Incorporated Multi-type-tree framework for video coding
WO2019012555A1 (en) 2017-07-10 2019-01-17 Sangra Nagender SYSTEM AND METHOD FOR VIDEO FILE ANALYSIS IN A SHORTCUT TEMPORARY FRAME
WO2019103491A1 (ko) * 2017-11-22 2019-05-31 한국전자통신연구원 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체
EP3742403A4 (en) * 2018-01-19 2021-03-17 Panasonic Intellectual Property Corporation of America METHOD FOR CODING THREE-DIMENSIONAL DATA, METHOD FOR DECODING THREE-DIMENSIONAL DATA, DEVICE FOR CODING THREE-DIMENSIONAL DATA AND DEVICE FOR DECODING THREE-DIMENSIONAL DATA
EP4319158A3 (en) * 2018-05-10 2024-04-03 Samsung Electronics Co., Ltd. Image segmentation method and apparatus for image encoding and decoding
US11412260B2 (en) * 2018-10-29 2022-08-09 Google Llc Geometric transforms for image compression
EP3909243A4 (en) * 2019-01-10 2022-11-09 HFI Innovation Inc. METHODS AND APPARATUS FOR PROCESSING VIDEO DATA FROM OUT-OF-BOUND NODES
US11363306B2 (en) * 2019-04-05 2022-06-14 Comcast Cable Communications, Llc Methods, systems, and apparatuses for processing video by adaptive rate distortion optimization
CN111654947A (zh) * 2020-06-08 2020-09-11 浙江方大智控科技有限公司 基于物联网的太阳能灯控制系统及方法
CN111741555A (zh) * 2020-06-28 2020-10-02 浙江方大智控科技有限公司 适用于太阳能路灯控制系统的通讯器

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1774934A (zh) * 2002-04-29 2006-05-17 诺基亚有限公司 视频编码中的随机访问点
CN1809166A (zh) * 2002-01-05 2006-07-26 三星电子株式会社 图像编码和解码装置及其方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10300048B4 (de) * 2002-01-05 2005-05-12 Samsung Electronics Co., Ltd., Suwon Verfahren und Vorrichtung zur Bildcodierung und -decodierung
US20090300692A1 (en) * 2008-06-02 2009-12-03 Mavlankar Aditya A Systems and methods for video streaming and display
US20120106629A1 (en) * 2009-07-01 2012-05-03 Thomson Licensing Llc Methods and apparatus for signaling intra prediction for large blocks for video encoders and decoders
US8654860B2 (en) * 2010-11-01 2014-02-18 Mediatek Inc. Apparatus and method for high efficiency video coding using flexible slice structure

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1809166A (zh) * 2002-01-05 2006-07-26 三星电子株式会社 图像编码和解码装置及其方法
CN1774934A (zh) * 2002-04-29 2006-05-17 诺基亚有限公司 视频编码中的随机访问点

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ANONYMOUS: "Test Model under Consideration", 《JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC)》, 28 July 2010 (2010-07-28) *
RICKARD SJöBERG: "Fine granularity slices", 《JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC)》, 15 October 2010 (2010-10-15) *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108605130A (zh) * 2015-11-27 2018-09-28 联发科技股份有限公司 用于视频和图像编码的熵编解码和上下文建模的方法和装置
US10863207B2 (en) 2015-11-27 2020-12-08 Mediatek Inc. Method and apparatus of entropy coding and context modelling for video and image coding
CN110651480A (zh) * 2017-03-20 2020-01-03 弗劳恩霍夫应用研究促进协会 高级视频数据流提取和多分辨率视频传输
CN115883824A (zh) * 2017-03-20 2023-03-31 Ge 视频压缩有限责任公司 生成视频数据流的装置以及生成视频数据流的方法
CN109151468A (zh) * 2017-06-28 2019-01-04 华为技术有限公司 一种图像数据的编码、解码方法及装置
US10834430B2 (en) 2017-06-28 2020-11-10 Huawei Technologies Co., Ltd. Picture data encoding method and apparatus and picture data decoding method and apparatus
CN109151468B (zh) * 2017-06-28 2020-12-08 华为技术有限公司 一种图像数据的编码、解码方法及装置
US11277648B2 (en) 2017-06-28 2022-03-15 Huawei Technologies Co., Ltd. Picture data encoding method and apparatus and picture data decoding method and apparatus
US11695968B2 (en) 2017-06-28 2023-07-04 Huawei Technologies Co., Ltd. Picture data encoding method and apparatus and picture data decoding method and apparatus
CN110839161A (zh) * 2018-08-19 2020-02-25 北京字节跳动网络技术有限公司 扩展四叉树分割的边界处理
CN110839161B (zh) * 2018-08-19 2022-12-16 北京字节跳动网络技术有限公司 扩展四叉树分割的边界处理

Also Published As

Publication number Publication date
JP5847970B2 (ja) 2016-01-27
BR112013017141A2 (pt) 2016-09-20
JP2015156648A (ja) 2015-08-27
TW201234857A (en) 2012-08-16
AR084787A1 (es) 2013-06-26
KR101547743B1 (ko) 2015-08-26
CN103299627B (zh) 2016-08-24
JP2014506066A (ja) 2014-03-06
TWI523540B (zh) 2016-02-21
WO2012094342A1 (en) 2012-07-12
KR20130095324A (ko) 2013-08-27
US20120170648A1 (en) 2012-07-05
EP2661889A1 (en) 2013-11-13

Similar Documents

Publication Publication Date Title
CN103299627A (zh) 视频译码中的帧分裂
JP6271646B2 (ja) ビデオコーディングのためのタイルのグループ化
CN103329530B (zh) 视频译码中的子切片
CN103190147B (zh) 用于视频译码的语法元素的联合译码方法及设备
JP5778339B2 (ja) ビデオコーディングにおける内部ビット深度増加
CN104322071B (zh) 用于处理视频数据的方法及设备,以及计算机可读存储媒体
CN104509115A (zh) 用于高效视频译码(hevc)和扩展的视频参数集
CN104205829A (zh) 合并信令及环路滤波器开/关信令
CN103891293A (zh) 用于色度分量的自适应环路滤波
CN104221374A (zh) 在视频译码中分群经旁路译码语法元素
CN103535033A (zh) 用于样本自适应偏移的偏移类型及系数信令方法
CN103202016A (zh) 用于视频译码的自适应运动向量分辨率信令
CN103238322A (zh) 在视频译码中单独地译码视频块的最后有效系数的位置
CN104685888A (zh) 补充增强信息消息译码
CN103947207A (zh) 用于图片分割方案的统一设计
CN103339935A (zh) 运动向量预测
CN103999463A (zh) 对识别长期参考帧的图片次序计数值进行译码
CN103299620A (zh) 在视频译码中使用最可能扫描次序对用于视频块的扫描次序信息进行有效译码
CN103797801A (zh) 视频译码中的非正方形变换单元和预测单元
CN103959779A (zh) 在视频译码中用于自适应环路滤波和样本自适应偏移的基于最大译码单元(lcu)或分区的语法
CN103444178A (zh) 用于视频译码的变换系数的译码
CN104396243A (zh) 用于视频压缩的自适应上取样滤波器
CN103891279A (zh) 用于帧内预测译码的最大概率变换
CN103430542A (zh) 用于随机存取后译码依附图片的视频译码技术
CN104067524A (zh) 具有精简的初始化值集合的上下文自适应熵译码

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant