CN109644275B - 用于视频译码的树型译码 - Google Patents

用于视频译码的树型译码 Download PDF

Info

Publication number
CN109644275B
CN109644275B CN201780052406.6A CN201780052406A CN109644275B CN 109644275 B CN109644275 B CN 109644275B CN 201780052406 A CN201780052406 A CN 201780052406A CN 109644275 B CN109644275 B CN 109644275B
Authority
CN
China
Prior art keywords
block
current block
neighboring
tree
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201780052406.6A
Other languages
English (en)
Other versions
CN109644275A (zh
Inventor
庄孝强
李翔
陈建乐
邹锋
钱威俊
陈义文
M·卡切维奇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of CN109644275A publication Critical patent/CN109644275A/zh
Application granted granted Critical
Publication of CN109644275B publication Critical patent/CN109644275B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明提供一种实例装置,其包含用以存储视频数据的存储器和与所述存储器通信的处理电路。所述处理电路经配置以将所述经存储视频数据的当前块的尺寸的值与所述当前块的邻近块的对应尺寸的值进行比较以获得相对尺寸值。所述处理电路进一步经配置以基于所述相对尺寸值确定所述当前块将根据基于多类型树的分割方案的预测树PT部分进行分割。所述PT部分包括根据二元树结构或中心侧三元树结构中的一个的分割。所述处理电路进一步经配置以基于所述确定根据所述PT部分分割所述当前块,以形成多个子块。

Description

用于视频译码的树型译码
本申请案主张2016年9月7日申请的美国临时申请案第62/384,585号的权益,所述临时申请案的全部内容以引用的方式并入本文中。
技术领域
本发明涉及视频译码。
背景技术
数字视频能力可并入到广泛范围的装置中,包含数字电视、数字直播系统、无线广播系统、个人数字助理(PDA)、膝上型或台式计算机、平板计算机、电子书阅读器、数码相机、数字记录装置、数字媒体播放器、视频游戏装置、视频游戏控制台、蜂窝式或卫星无线电电话(所谓的“智能型电话”)、视频电话会议装置、视频流式传输装置等。数字视频装置实施视频译码技术,例如描述于由各种视频译码标准定义的标准中的视频译码技术。视频译码标准包含ITU-T H.261、ISO/IEC MPEG-1Visual、ITU-T H.262或ISO/IEC MPEG-2Visual、ITU-T H.263、ISO/IEC MPEG-4Visual和ITU-T H.264(也称为ISO/IEC MPEG-4AVC),包含其可调式视频译码(SVC)和多视图视频译码(MVC)扩展。另外,已由ITU-T视频译码专家组(VCEG)和ISO/IEC动画专家组(MPEG)的视频译码联合协作小组(JCT-VC)完成新的视频译码标准(即,高效率视频译码(HEVC))。最新的HEVC草案说明书,在下文被称作“HEVC WD”,可从http://phenix.int-evry.fr/jct/doc_end_user/documents/14_Vienna/wg11/JCTVC-N1003-v1.zip获得。HEVC的说明书和其扩展(格式范围(RExt)、可调性(SHVC)和多视图(MV-HEVC)扩展和屏幕内容扩展)可从http://phenix.int-evry.fr/jct/doc_end_user/current_document.php?id=10481获得。ITU-T VCEG(Q6/16)和ISO/IEC MPEG(JTC 1/SC 29/WG11)现正研究对于将具有显著超过当前HEVC标准(包含其当前扩展和针对屏幕内容译码和高动态范围译码的近期扩展)的压缩能力的压缩能力的未来视频译码技术标准化的潜在需要。所述群组正共同致力于联合协作工作(被称为联合视频探索小组(Joint VideoExploration Team,JVET))中的此探索活动,以评估由所述群组在此领域中的专家建议的压缩技术设计。JVET在2015年10月19日到21日期间第一次会面。参考软件的最新版本(即,联合探索模型7(JEM 7))可从https://jvet.hhi.fraunhofer.de/svn/svn_HMJEMSoftware/tags/HM-16.6-JEM-7.0/下载。JEM-7.0的算法描述进一步描述于J.陈(Chen)、E.阿什纳(Alshina)、G.J.苏利文(Sullivan)、J.-R.欧姆(Ohm)、J.博伊斯(Boyce)(JVET-C1001,日内瓦,2017年7月)的“联合探索测试模型7的算法描述(Algorithmdescription of Joint Exploration Test Model 7)”中。
视频装置可通过实施此类视频译码技术来更有效地传输、接收、编码、解码和/或存储数字视频信息。视频译码技术包含空间(图片内)预测和/或时间(图片间)预测以减少或去除视频序列中所固有的冗余。对于基于块的视频译码,可将视频图块(例如,视频帧或视频帧的一部分)分割成视频块,对于一些技术,视频块也可被称作树型块、译码单元(CU)和/或译码节点。图片的经帧内译码(I)图块中的视频块是使用关于同一图片中的邻近块中的参考样本的空间预测来编码。图片的经帧间译码(P或B)切片中的视频块可使用关于同一图片中的邻近块中的参考样本的空间预测或关于其它参考图片中的参考样本的时间预测。图片可被称作帧,且参考图片可被称作参考帧。
空间或时间预测产生用于待译码的块的预测性块。残余数据表示待译码的原始块与预测性块之间的像素差。根据指向形成预测性块的参考样本的块的运动向量和指示经译码块与预测性块之间的差异的残余数据来编码经帧间译码块。根据帧内译码模式和残余数据来编码帧内译码块。为进行进一步压缩,可将残余数据从像素域变换到变换域,从而产生残余变换系数,随后可量化残余变换系数。可扫描最初布置成二维阵列的经量化变换系数以便产生变换系数的一维向量,且可应用熵译码以达成甚至更多压缩。
发明内容
一般来说,本发明描述与视频数据的译码(例如,编码和/或解码)相关的技术。本发明的一些方面是针对提高关于继HEVC之后研发的块分割结构的译码和传信效率。
在一个实例中,本发明是针对一种译码视频数据的方法。所述方法包含将所述视频数据的当前块的尺寸与当前块的邻近块的对应尺寸进行比较以获得相对尺寸,所述邻近块与当前块相邻定位。所述方法进一步包含基于所述相对尺寸确定所述当前块将根据基于多类型树的分割方案的预测树(PT)部分进行分割,所述基于多类型树的分割方案的PT部分包括根据二元树结构或中心侧三元树结构中的一个的分割。所述方法进一步包含基于所述确定根据所述基于多类型树的分割方案的PT部分分割当前块以形成多个子块。
在另一实例中,本发明是针对一种译码视频数据的装置。所述装置包括经配置以存储视频数据的存储器和与所述存储器通信的处理电路。所述处理电路经配置以将经存储视频数据的当前块的尺寸的值与当前块的邻近块的对应尺寸的值进行比较以获得相对尺寸值,所述邻近块与当前块相邻定位。所述处理电路进一步经配置以基于所述相对尺寸值确定所述当前块将根据基于多类型树的分割方案的预测树(PT)部分进行分割,所述基于多类型树的分割方案的PT部分包括根据二元树结构或中心侧三元树结构中的一个的分割。所述处理电路进一步经配置以基于所述确定根据所述基于多类型树的分割方案的PT部分分割当前块以形成多个子块。
在另一实例中,一种非暂时性计算机可读存储媒体经编码有指令。所述指令在执行时引起视频译码装置的一或多个处理器将视频数据的当前块的尺寸的值与当前块的邻近块的对应尺寸的值进行比较以获得相对尺寸值,所述邻近块与所述当前块相邻定位。所述指令在执行时进一步引起视频译码装置的一或多个处理器基于相对尺寸值确定所述当前块将根据基于多类型树的分割方案的预测树(PT)部分进行分割,所述基于多类型树的分割方案的PT部分包括根据二元树结构或中心侧三元树结构中的一个的分割。所述指令在执行时进一步引起视频译码装置的一或多个处理器基于所述确定根据基于多类型树的分割方案的PT部分分割当前块以形成多个子块。
在另一实例中,一种用于对视频数据进行译码的设备包含用于将视频数据的当前块的尺寸与当前块的邻近块的对应尺寸进行比较以获得相对尺寸的装置,所述邻近块与当前块相邻定位。所述设备进一步包含用于基于所述相对尺寸确定所述当前块将根多类型树的分割方案的预测树(PT)部分进行分割的装置,多类型树的分割方案的PT部分包括根据二元树结构或中心侧三元树结构中的一个的分割。所述设备进一步包含用于基于所述确定根据多类型树的分割方案的PT部分分割当前块以形成多个子块的装置。
在以下随附图式和描述中阐述一或多个实例的细节。其它特征、目标和优点将从所述描述和图式以及权利要求书而显而易见。
附图说明
图1为说明可经配置以执行本发明的技术的实例视频编码和解码系统的框图。
图2为说明可经配置以执行本发明的技术的视频编码器的实例的框图。
图3为说明可经配置以执行本发明的技术的视频解码器的实例的框图。
图4A和4B为说明HEVC中的CTU到CU分割的实例和HEVC CTU到CU分割的对应四分树表示的概念图。
图5为说明用于以帧间预测模式经译码的译码单元(CU)的分割模式的概念图。
图6A和6B为说明QTBT分割结构的方面的概念图。
图7A和7B为说明多类型树型块分割结构的一个实例使用情况的概念图。
图8为说明以二进制格式表达的码字的实例的概念图,视频编码装置可针对经多类型树分割块分割的PT部分中可能的各种分割方案传信所述码字。
图9为说明根据本发明的方面的用于PT拆分旗标的上下文模型化的各种上方邻近位置和左邻近位置的候选位置的概念图。
图10为说明视频编码装置可根据本发明的各种方面执行的实例过程的流程图。
图11为说明视频解码装置可根据本发明的各种方面执行的实例过程的流程图。
具体实施方式
图1为说明可经配置以执行本发明的技术以用于运动向量预测的实例视频编码和解码系统10的框图。如图1中所展示,系统10包含源装置12,其提供待在稍后由目的地装置14解码的经编码视频数据。明确地说,源装置12经由计算机可读媒体16将视频数据提供到目的地装置14。源装置12和目的地装置14可包括广泛范围的装置中的任一个,包含台式计算机、笔记型(即,膝上型)计算机、平板计算机、机顶盒、例如所谓的“智能型”电话的电话手机、所谓的“智能型”板、电视、摄影机、显示装置、数字媒体播放器、视频游戏控制台、视频流式传输装置等。在一些情况下,源装置12和目的地装置14可经装备以用于无线通信。
目的地装置14可经由计算机可读媒体16接收待解码的经编码视频数据。计算机可读媒体16可包括能够将经编码视频数据从源装置12移动到目的地装置14的任一类型的媒体或装置。在一个实例中,计算机可读媒体16可包括通信媒体以使源装置12能够实时地将经编码视频数据直接传输到目的地装置14。可根据通信标准(例如,无线通信协议)调制经编码视频数据,且将经编码视频数据传输到目的地装置14。通信媒体可包括任何无线或有线通信媒体,例如,射频(RF)频谱或一或多个物理传输线。通信媒体可形成基于封包的网络(例如,局域网、广域网或例如因特网的全域网络)的部分。通信媒体可包含路由器、交换器、基站或可用于促进从源装置12到目的地装置14的通信的任何其它装备。
在一些实例中,可从输出接口22将经编码数据输出到存储装置。类似地,经编码数据可由输入接口从存储装置存取。存储装置可包含多种分布式或本地存取的数据存储媒体中的任一个,例如,硬盘机、蓝光光盘、DVD、CD-ROM、闪存、易失性或非易失性存储器或用于存储经编码视频数据的任何其它合适数字存储媒体。在另一实例中,存储装置可对应于文件服务器或可存储由源装置12产生的经编码视频的另一中间存储装置。目的地装置14可经由流式传输或下载从存储装置存取存储的视频数据。文件服务器可为能够存储经编码视频数据并将那个经编码视频数据传输到目的地装置14的任何类型的服务器。实例文件服务器包含网页服务器(例如,用于网站)、FTP服务器、网络附接存储(NAS)装置和本地磁盘机。目的地装置14可经由任何标准数据连接(包含因特网连接)而存取经编码视频数据。此连接可包含适合于存取存储于文件服务器上的经编码视频数据的无线信道(例如,Wi-Fi连接)、有线连接(例如,DSL、缆线调制解调器等)或两者的组合。经编码视频数据从存储装置的传输可为流式传输传输、下载传输或其组合。
本发明的技术不必限于无线应用或设定。所述技术可应用于支持多种多媒体应用中的任一个的视频译码,所述多媒体应用例如空中电视广播、有线电视传输、卫星电视传输、因特网流式传输视频传输(例如,经由HTTP的动态自适应流式传输(DASH))、经编码到数据存储媒体上的数字视频、存储在数据存储媒体上的数字视频的解码或其它应用。在一些实例中,系统10可经配置以支持单向或双向视频传输从而支持例如视频流式传输、视频播放、视频广播和/或视频电话的应用。
在图1的实例中,源装置12包含视频源18、视频编码器20和输出接口22。目的地装置14包含输入接口28、视频解码器30和显示装置32。根据本发明,源装置12的视频编码器20可经配置以将本发明的技术应用于运动向量预测。在其它实例中,源装置和目的地装置可包含其它组件或布置。举例来说,源装置12可从外部视频源18(例如,外部摄影机)接收视频数据。同样地,目的地装置14可与外部显示装置接口连接,而非包含集成显示装置。
图1的所说明的系统10仅为一个实例。关于运动向量预测的本发明的技术可由任何数字视频编码和/或解码装置执行。尽管本发明的技术一般由视频编码装置执行,但所述技术也可由视频编码器/解码器(通常被称作“编解码器”)执行。此外,本发明的技术也可由视频预处理器执行。源装置12和目的地装置14仅为源装置12产生经译码视频数据以用于传输到目的地装置14的这些译码装置的实例。在一些实例中,装置12、14可以大体上对称的方式操作,使得装置12、14中的每一个包含视频编码和解码组件。因此,系统10可支持视频装置12、14之间的单向或双向视频传播以用于(例如)视频流式传输、视频播放、视频广播或视频电话。
源装置12的视频源18可包含视频捕捉装置,例如摄像机、含有先前捕捉的视频的视频存档和/或用以从视频内容提供者接收视频的视频馈送接口。作为另一替代,视频源18可产生基于计算机图形的数据作为源视频,或实况视频、存档视频和计算机产生的视频的组合。在一些情况下,如果视频源18为摄像机,那么源装置12和目的地装置14可形成所谓的摄影机电话或视频电话。然而,如上文所提及,本发明所描述的技术一般可适用于视频译码,且可应用于无线和/或有线应用。在每一情况下,捕捉、预先捕捉或计算机产生的视频可由视频编码器20编码。经编码视频信息随后可由输出接口22输出到计算机可读媒体16上。
计算机可读媒体16可包含暂时媒体,例如无线广播或有线网络传输,或存储媒体(即,非暂时性存储媒体),例如硬盘、闪存盘、压缩光盘、数字视频光盘、蓝光光盘或其它计算机可读媒体。在一些实例中,网络服务器(图中未示)可从源装置12接收经编码视频数据且(例如)经由网络传输将经编码视频数据提供到目的地装置14。类似地,例如光盘冲压设施的媒体生产设施的计算装置可从源装置12接收经编码视频数据且生产含有经编码视频数据的光盘。因此,在各种实例中,计算机可读媒体16可理解为包含各种形式的一或多个计算机可读媒体。
目的地装置14的输入接口28从计算机可读媒体16接收信息。计算机可读媒体16的信息可包含由视频编码器20定义的语法信息,其也由视频解码器30使用,所述信息包含描述块和其它经译码单元(例如,GOP)的特性和/或处理的语法元素。显示装置32向用户显示经解码视频数据,且可包括多种显示装置中的任一个,例如阴极射线管(CRT)、液晶显示器(LCD)、等离子显示器、有机发光二极管(OLED)显示器或另一类型的显示装置。
视频编码器20和视频解码器30可根据视频译码标准(例如高效率视频译码(HEVC)标准、HEVC标准的扩展或后续标准(例如,ITU-TH.266))操作。替代地,视频编码器20和视频解码器30可根据其它专有或行业标准(例如ITU-T H.264标准,替代地被称作MPEG-4,第10部分,先进视频译码(AVC))或这些标准的扩展而操作。然而,本发明的技术不限于任何特定译码标准。视频译码标准的其它实例包含MPEG-2和ITU-T H.263。尽管图1中未展示,但在一些方面中,视频编码器20和视频解码器30可各自与音频编码器和解码器集成,且可包含适当MUX-DEMUX单元或其它硬件和软件,以处置共同数据流或单独数据流中的音频和视频两者的编码。如果适用,那么MUX-DEMUX单元可遵照ITU H.223多路复用器协议或例如用户数据报协议(UDP)的其它协议。
视频编码器20和视频解码器30各自可经实施为多种合适编码器电路中的任一个,例如一或多个微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、逻辑电路、例如固定功能处理电路和/或可编程处理电路的处理电路、硬件、固件、软件或其任何组合。当所述技术部分实施于软件中时,装置可将用于软件的指令存储于合适的非暂时性计算机可读媒体中,且在硬件中使用一或多个处理器执行所述指令,以执行本发明的技术。视频编码器20和视频解码器30中的每一个可包含在一或多个编码器或解码器中,编码器或解码器中的任一个可集成为相应装置中的组合式编码器/解码器(编解码器)的部分。
视频译码标准包含ITU-T H.261、ISO/IEC MPEG-1 Visual、ITU-T H.262或ISO/IEC MPEG-2 Visual、ITU-T H.263、ISO/IEC MPEG-4 Visual和ITU-T H.264(也称为ISO/IEC MPEG-4 AVC),包含其可调式视频译码(SVC)和多视图视频译码(MVC)扩展。MVC的一个联合草案描述于2010年3月的“用于通用视听服务的先进视频译码(Advanced videocoding for generic audiovisual services)”(ITU-T标准H.264)中。
另外,存在新研发的视频译码标准,即ITU-T视频译码专家组(VCEG)和ISO/IEC动画专家组(MPEG)的视频译码联合协作小组(JCT-VC)已研发的高效率视频译码(HEVC)。最新的HEVC草案可从http://phenix.int-evry.fr/jct/doc_end_user/documents/12_Geneva/wg11/JCTVC-L1003-v34.zip获得。HEVC标准也在标准ITU-T H.265和国际标准ISO/IEC23008-2中联合提出,两者皆名为“高效率视频译码(High efficiency video coding)”且两者皆于2014年10月公开。
JCT-VC研发了HEVC标准。HEVC标准化努力是基于视频译码装置的演进型模型(被称作HEVC测试模型(HM))。HM根据(例如)ITU-T H.264/AVC假定视频译码装置相对于现有装置的若干额外能力。举例来说,尽管H.264提供九个帧内预测编码模式,但HEVC HM可提供多达三十三个帧内预测编码模式。
一般来说,HM的工作模型描述视频帧或图片可划分成一系列包含明度样本和色度样本两者的树型块或最大译码单元(LCU)。位流内的语法数据可定义LCU的大小,LCU为在像素数目方面最大的译码单元。图块包含按译码次序的数个连续树型块。视频帧或图片可分割成一或多个图块。每一树型块可根据四分树而拆分成译码单元(CU)。一般来说,四分树数据结构包含每CU一个节点,其中根节点对应于树型块。如果将CU拆分成四个子CU,那么对应于所述CU的节点包含四个叶节点,所述四个叶节点中的每一个对应于所述子CU中的一个。
所述四分树数据结构中的每一节点可提供用于对应CU的语法数据。举例来说,所述四分树中的节点可包含拆分旗标,从而指示是否将对应于所述节点的CU拆分成子CU。可递归地定义用于CU的语法元素,且所述语法元素可取决于是否将所述CU拆分成子CU。如果CU未经进一步拆分,那么其被称作叶CU。在本发明中,尽管不存在原始叶CU的显式拆分,但叶CU的4个子CU也将被称作叶CU。举例来说,如果16×16大小的CU未经进一步拆分,那么尽管所述16×16CU从未经拆分,但4个8×8子CU也将被称作叶CU。
除CU不具有大小区别以外,CU具有与H.264标准的宏块类似的用途。举例来说,可将树型块拆分成四个子节点(也称作子CU),且每一子节点又可为上代节点且可被拆分成另外四个子节点。被称作四分树的叶节点的最终的未拆分子节点包括译码节点,所述译码节点也被称作叶CU。与经译码位流相关联的语法数据可定义可拆分树型块的最大次数(其被称作最大CU深度),且也可定义所述译码节点的最小大小。因此,位流也可定义最小译码单元(SCU)。本发明使用术语“块”指代在HEVC的上下文中的CU、PU或TU中的任一个,或在其它标准的上下文中的类似数据结构(例如,在H.264/AVC中的宏块和其子块)。
CU包含译码节点和与所述译码节点相关联的预测单元(PU)和变换单元(TU)。CU的大小对应于译码节点的大小,且形状必须为正方形。CU的大小可在8×8像素达到具有最大64×64像素或更大像素的树型块的大小的范围内。每一CU可含有一或多个PU和一或多个TU。与CU相关联的语法数据可描述例如将CU分割成一或多个PU。分割模式可在CU经跳过或直接模式编码、帧内预测模式编码或是帧间预测模式编码之间不同。PU可经分割成非正方形形状。与CU相关联的语法数据也可描述例如根据四分树将CU分割成一或多个TU。根据HEVC标准,TU始终为正方形。即,在应用变换时,同时水平和垂直地应用同样尺寸的一维变换。
HEVC标准允许根据TU进行变换,所述变换对于不同CU可为不同的。通常基于在针对经分割LCU所定义的给定CU内的PU的大小来对TU设定大小,但可能情况并非总是如此。TU的大小通常与PU相同或比PU小。在一些实例中,可使用被称为“残余四分树”(RQT)的四分树结构而将对应于CU的残余样本再分为更小单元。可将RQT的叶节点称作变换单元(TU)。与TU相关联的像素差值可经变换以产生可经量化的变换系数。
叶CU可包含一或多个预测单元(PU)。一般来说,PU表示对应于对应CU的所有或一部分的空间区域,且可包含用于检索PU的参考样本的数据。此外,PU包含与预测有关的数据。举例来说,当PU经帧内模式编码时,PU的数据可包含于残余四分树(RQT)中,所述RQT可包含描述用于对应于所述PU的TU的帧内预测模式的数据。作为另一实例,当PU经帧间模式编码时,PU可包含定义PU的一或多个运动向量的数据。定义PU的运动向量的数据可描述(例如)运动向量的水平分量、运动向量的垂直分量、运动向量的分辨率(例如,四分之一像素精度或八分之一像素精度)、运动向量指向的参考图片,和/或运动向量的参考图片列表(例如,列表0或列表1)。
具有一或多个PU的叶CU也可包含一或多个变换单元(TU)。如上文所论述,可使用RQT(也称作TU四分树结构)来指定所述变换单元。举例来说,拆分旗标可指示叶CU是否经拆分成四个变换单元。随后,可将每一变换单元进一步拆分为其它子TU。当TU未经进一步拆分时,可将其称作叶TU。一般来说,对于帧内译码来说,属于叶CU的所有叶TU共享相同的帧内预测模式。即,一般应用相同帧内预测模式来计算叶CU的所有TU的预测值。对于帧内译码,视频编码器可使用帧内预测模式将每一叶TU的残余值计算为CU的对应于所述TU的部分与原始块之间的差。TU不必受限于PU的大小。因此,TU可大于或小于PU。对于帧内译码,PU可与用于同一CU的对应叶TU共置。在一些实例中,叶TU的最大大小可对应于对应叶CU的大小。
此外,叶CU的TU也可与相应四分树数据结构(被称作残余四分树(RQT))相关联。即,叶CU可包含指示所述叶CU如何被分割成TU的四分树。TU四分树的根节点大体对应于叶CU,而CU四分树的根节点大体对应于树型块(或LCU)。将RQT的未经拆分的TU称作叶TU。一般来说,除非另有指示,否则本发明分别使用术语CU和TU来指叶CU和叶TU。
视频序列通常包含一系列视频帧或图片。图片群组(GOP)大体上包括一系列视频图片中的一或多个。GOP可包含GOP的标头、图片中的一或多个的标头或别处中的语法数据,所述语法数据描述包含于GOP中的图片的数目。图片的每一图块可包含描述所述相应图块的编码模式的图块语法数据。视频编码器20通常对个别视频图块内的视频块进行操作,以便编码视频数据。视频块可对应于CU内的译码节点。视频块可具有固定或变化的大小,且可根据指定译码标准而大小不同。
作为实例,HM支持以各种PU大小的预测。假定特定CU的大小为2N×2N,那么HM支持以2N×2N或N×N的PU大小的帧内预测,和以2N×2N、2N×N、N×2N或N×N的对称PU大小的帧间预测。HM也支持以2N×nU、2N×nD、nL×2N和nR×2N的PU大小的帧间预测的不对称分割。在不对称分割中,CU的一个方向未分割,而另一方向分割成25%和75%。CU的对应于25%分割的部分由“n”继之以“上(Up)”、“下(Down)”、“左(Left)”或“右(Right)”的指示来指示。因此,例如,“2N×nU”指水平地以顶部的2N×0.5N PU和底部的2N×1.5N PU分割的2N×2NCU。
在本发明中,“N×N”与“N乘N”可互换地使用以指视频块在垂直尺寸与水平尺寸方面的像素尺寸,例如,16×16像素或16乘16像素。一般来说,16×16块在垂直方向上将具有16个像素(y=16)且在水平方向上将具有16个像素(x=16)。同样地,N×N块通常在垂直方向上具有N个像素且在水平方向上具有N个像素,其中N表示非负整数值。可按行和列来布置块中的像素。此外,块未必需要在水平方向上与在垂直方向上具有相同数目个像素。举例来说,块可包括N×M个像素,其中M未必等于N。
在使用CU的PU的帧内预测性或帧间预测性译码之后,视频编码器20可计算CU的TU的残余数据。PU可包括描述在空间域(也被称作像素域)中产生预测性像素数据的方法或模式的语法数据,且TU可包括在对残余视频数据应用变换(例如离散余弦变换(DCT)、整数变换、小波变换或在概念上类似的变换)之后变换域中的系数。所述残余数据可对应于未经编码的图片的像素与对应于PU的预测值之间的像素差。视频编码器20可形成包含CU的残余数据的TU,且随后变换TU以产生CU的变换系数。
在进行用以产生变换系数的任何变换之后,视频编码器20可对变换系数执行量化。量化一般指量化变换系数以可能地减少用以表示系数的数据量从而提供进一步压缩的过程。量化过程可减小与一些或所有系数相关联的位深度。举例来说,可在量化期间将n位值降值舍位到m位值,其中n大于m。
在量化之后,视频编码器可扫描变换系数,从而从包含经量化变换系数的二维矩阵产生一维向量。扫描可经设计以将较高能量(且因此较低频率)系数置于阵列前部,和将较低能量(且因此较高频率)系数置于阵列后部。在一些实例中,视频编码器20可利用预定义扫描次序来扫描经量化的变换系数以产生可经熵编码的串行化向量。在其它实例中,视频编码器20可执行自适应性扫描。在扫描经量化变换系数以形成一维向量之后,视频编码器20可(例如)根据上下文自适应可变长度译码(CAVLC)、上下文自适应二进制算术译码(CABAC)、基于语法的上下文自适应二进制算术译码(SBAC)、概率区间分割熵(PIPE)译码或另一熵编码方法来对一维向量进行熵编码。视频编码器20也可熵编码与经编码的视频数据相关联的供由视频解码器30用于解码视频数据的语法元素。
为了执行CABAC,视频编码器20可将上下文模型内的上下文指派给待传输的符号。所述上下文可能关于(例如)符号的邻近值是否为非零。为执行CAVLC,视频编码器20可选择用于待传输的符号的可变长度码。可将VLC中的码字构建成使得相对较短码对应于更有可能的符号,而较长码对应于较不可能的符号。以此方式,相对于(例如)针对待传输的每一符号使用相等长度码字,使用VLC可达成位节省。概率确定可基于经指派到符号的上下文而进行。举例来说,视频编码器20和/或视频解码器30可在运动估计和补偿中使用仿射模型。
图2为说明可经配置以执行关于运动向量预测的本发明的技术的视频编码器20的实例的框图。视频编码器20可执行视频图块内的视频块的帧内译码和帧间译码。帧内译码依赖于空间预测以减小或去除给定视频帧或图片内的视频的空间冗余。帧间译码依赖于时间预测以减小或去除视频序列的相邻帧或图片内的视频的时间冗余。帧内模式(I模式)可指代若干基于空间的译码模式中的任一个。帧间模式(例如,单向预测(P模式)或双向预测(B模式))可指代若干基于时间的译码模式中的任一个。
如图2所展示,视频编码器20接收待编码视频帧内的当前视频块。在图2的实例中,视频编码器20包含模式选择单元40、参考图片存储器64、求和器50、变换处理单元52、量化单元54和熵编码单元56。模式选择单元40又包含运动补偿单元44、运动估计单元42、帧内预测单元46和分割单元48。为了视频块重构建,视频编码器20也包含反量化单元58、反变换单元60和求和器62。也可包含解块滤波器(图2中未展示)以对块边界进行滤波,以从经重构建的视频中去除方块效应伪影。如果需要,解块滤波器将通常对求和器62的输出进行滤波。除了解块滤波器外,也可使用额外滤波器(回路中或回路后)。为简洁起见未展示此类滤波器,但如果需要,那么此类滤波器可对求和器50的输出进行滤波(作为回路中滤波器)。
在编码过程期间,视频编码器20接收待译码的视频帧或图块。可将所述帧或图块划分成多个视频块。运动估计单元42和运动补偿单元44执行所接收的视频块相对于一或多个参考帧中的一或多个块的帧间预测性译码以提供时间预测。帧内预测单元46可替代地执行接收的视频块相对于与待译码块相同的帧或图块中的一或多个邻近块的帧内预测性译码以提供空间预测。视频编码器20可执行多个译码遍次,(例如)以选择用于每一视频数据块的适当译码模式。
此外,分割单元48可基于对先前译码遍次中的先前分割方案的评估而将视频数据的块分割成子块。举例来说,分割单元48可初始地将帧或图块分割成LCU,且基于率失真分析(例如,率失真优化)来将所述LCU中的每一个分割成子CU。模式选择单元40可进一步产生指示将LCU分割为子CU的四分树数据结构。四分树的叶节点CU可包含一或多个PU和一或多个TU。
模式选择单元40可(例如)基于误差结果而选择译码模式(帧内或帧间)中的一个,且将所得经帧内译码块或经帧间译码块提供到求和器50以产生残余块数据,和提供到求和器62以重构建经编码块以用作参考帧。模式选择单元40也将语法元素(例如运动向量、帧内模式指示符、分割信息和其它此类语法信息)提供到熵编码单元56。
运动估计单元42和运动补偿单元44可高度集成,但为概念目的而分开说明。由运动估计单元42执行的运动估计为产生运动向量的过程,所述运动向量估计视频块的运动。举例来说,运动向量可指示在当前视频帧或图片内的视频块的PU相对于在参考帧(或其它经译码单元)内的预测性块(其相对于在所述当前帧(或其它经译码单元)内正经译码的当前块)的位移。预测性块为就像素差来说被发现紧密地匹配待译码块的块,所述像素差可通过绝对差总和(SAD)、平方差总和(SSD)或其它差度量确定。在一些实例中,视频编码器20可计算存储于参考图片存储器64中的参考图片的子整数像素位置的值。举例来说,视频编码器20可内插所述参考图片的四分之一像素位置、八分之一像素位置或其它分数像素位置的值。因此,运动估计单元42可执行关于全像素位置和分数像素位置的运动搜索并输出具有分数像素精度的运动向量。
运动估计单元42通过比较PU的位置与参考图片的预测性块的位置而计算经帧间译码图块中的视频块的PU的运动向量。参考图片可选自第一参考图片列表(列表0)或第二参考图片列表(列表1),所述列表中的每一个识别存储于参考图片存储器64中的一或多个参考图片。运动估计单元42将所计算的运动向量发送到熵编码单元56和运动补偿单元44。
由运动补偿单元44执行的运动补偿可涉及基于由运动估计单元42确定的运动向量提取或产生预测性块。再次,在一些实例中,运动估计单元42与运动补偿单元44可在功能上集成。在接收到当前视频块的PU的运动向量之后,运动补偿单元44可在参考图片列表中的一个中定位运动向量所指向的预测性块。求和器50通过从正经译码的当前视频块的像素值减去预测性块的像素值来形成残余视频块,从而形成像素差值,如下文所论述。一般来说,运动估计单元42执行关于明度分量的运动估计,且运动补偿单元44将基于所述明度分量计算的运动向量用于色度分量与明度分量两者。模式选择单元40也可产生与视频块和视频图块相关联的语法元素以供视频解码器30在解码视频图块的视频块时使用。
视频编码器20可经配置以执行上文关于图1所论述的本发明的各种技术中的任一个,且将在下文更详细地描述。举例来说,运动补偿单元44可经配置以根据本发明的技术使用AMVP或合并模式对视频数据块的运动信息进行译码。
假定运动补偿单元44选择执行合并模式,运动补偿单元44可形成包含合并候选集合的候选列表。运动补偿单元44可基于特定的预定次序将候选添加到候选列表。如上文所论述,运动补偿单元44也可添加额外候选且执行对候选列表的修剪。最终,模式选择单元40可确定哪些候选将用于编码当前块的运动信息,并编码表示所选择候选的合并索引。
如上文所描述,作为由运动估计单元42和运动补偿单元44执行的帧间预测的替代,帧内预测单元46可对当前块进行帧内预测。明确地说,帧内预测单元46可确定待用以编码当前块的帧内预测模式。在一些实例中,帧内预测单元46可(例如)在单独编码遍次期间使用各种帧内预测模式来编码当前块,且帧内预测单元46(或在一些实例中为模式选择单元40)可从所测试模式中选择适当帧内预测模式来使用。
举例来说,帧内预测单元46可使用对于各种所测试的帧内预测模式的率失真分析来计算率失真值,且在所测试的模式的中选择具有最佳率失真特性的帧内预测模式。率失真分析大体上确定经编码块与原始未经编码块(其经编码以产生经编码块)之间的失真(或误差)量,以及用以产生经编码块的位率(即,位的数目)。帧内预测单元46可根据各种经编码块的失真和速率来计算比率以确定哪一帧内预测模式展现所述块的最佳率失真值。
在选择用于块的帧内预测模式后,帧内预测单元46可将指示用于块的所选帧内预测的信息提供到熵编码单元56。熵编码单元56可编码指示所选帧内预测模式的信息。视频编码器20可在所传输的位流中包含以下各者:配置数据,其可包含多个帧内预测模式索引表和多个经修改的帧内预测模式索引表(也称作码字映射表);各种块的编码上下文的定义;和对待用于所述上下文中的每一个的最有可能的帧内预测模式、帧内预测模式索引表和经修改的帧内预测模式索引表的指示。
视频编码器20通过从正经译码的原始视频块减去来自模式选择单元40的预测数据而形成残余视频块。求和器50表示执行此减法运算的一或多个组件。变换处理单元52将变换(例如离散余弦变换(DCT)或概念上类似的变换)应用于残余块,从而产生包括残余变换系数值的视频块。变换处理单元52可执行概念上类似于DCT的其它变换。也可使用小波变换、整数变换、子频带变换或其它类型的变换。
在任何情况下,变换处理单元52将变换应用于残余块,从而产生残余变换系数块。变换可将残余信息从像素值域转换为变换域,例如频域。变换处理单元52可将所得变换系数发送到量化单元54。量化单元54量化变换系数以进一步减少位率。量化过程可减小与一些或所有系数相关联的位深度。量化程度可通过调整量化参数来修改。在一些实例中,量化单元54随后可执行对包含经量化的变换系数的矩阵的扫描。替代地,熵编码单元56可执行扫描。
在量化之后,熵编码单元56对经量化的变换系数进行熵译码。举例来说,熵编码单元56可执行上下文自适应性可变长度译码(CAVLC)、上下文自适应性二进制算术译码(CABAC)、基于语法的上下文自适应性二进制算术译码(SBAC)、概率区间分割熵(PIPE)译码或另一熵译码技术。在基于上下文的熵译码的情况下,上下文可基于邻近块。在由熵编码单元56进行熵译码之后,可将经编码位流传输到另一装置(例如,视频解码器30),或加以存档以供稍后传输或检索。
反量化单元58和反变换单元60分别应用反量化和反变换以在像素域中重构建残余块,例如,以供稍后用作参考块。运动补偿单元44可通过将残余块添加到参考图片存储器64的帧中的一个的预测性块来计算参考块。运动补偿单元44也可将一或多个内插滤波器应用到经重构建的残余块以计算用于运动估计中的子整数像素值。求和器62将所述经重构建的残余块添加到由运动补偿单元44产生的经运动补偿预测块以产生经重构建的视频块以用于存储于参考图片存储器64中。所述经重构建的视频块可由运动估计单元42和运动补偿单元44用作参考块以对在后续视频帧中的块进行帧间译码。
图3为说明可经配置以执行本发明的运动向量预测技术的视频解码器30的实例的框图。在图3的实例中,视频解码器30包括熵解码单元70、运动补偿单元72、帧内预测单元74、反量化单元76、反变换单元78、参考图片存储器82和求和器80。在一些实例中,视频解码器30可执行大体上互逆于关于视频编码器20(图2)所描述的编码遍次的解码遍次。运动补偿单元72可基于从熵解码单元70接收的运动向量产生预测数据,而帧内预测单元74可基于从熵解码单元70接收的帧内预测模式指示符产生预测数据。
在解码过程期间,视频解码器30从视频编码器20接收表示经编码视频图块的视频块和相关联语法元素的经编码视频位流。视频解码器30的熵解码单元70对位流进行熵解码以产生经量化系数、运动向量或帧内预测模式指示符和其它语法元素。熵解码单元70将运动向量和其它语法元素转递到运动补偿单元72。视频解码器30可在视频图块层级和/或视频块层级接收语法元素。
当视频图块经译码为帧内译码(I)图块时,帧内预测单元74可基于所传信的帧内预测模式和来自当前帧或图片的先前经解码块的数据而产生当前视频图块的视频块的预测数据。当视频帧经译码为帧间译码(即,B、P或GPB)图块时,运动补偿单元72基于运动向量和从熵解码单元70接收的其它语法元素而产生用于当前视频图块的视频块的预测性块。可由参考图片列表中的一个内的参考图片中的一个产生预测性块。视频解码器30可基于存储于参考图片存储器82中的参考图片使用默认构建技术来构建参考帧列表(列表0和列表1)。
运动补偿单元72通过剖析运动向量和其它语法元素来确定当前视频图块的视频块的预测信息,且使用所述预测信息产生正经解码的当前视频块的预测性块。举例来说,运动补偿单元72使用所接收语法元素中的一些来确定用于译码视频图块的视频块的预测模式(例如,帧内或帧间预测)、帧间预测图块类型(例如,B图块或P图块)、所述图块的参考图片列表中的一或多个的构建信息、所述图块的每一经帧间编码视频块的运动向量、所述图块的每一经帧间译码视频块的帧间预测状态和用以解码当前视频图块中的视频块的其它信息。
运动补偿单元72也可执行基于内插滤波器的内插。运动补偿单元72可使用如由视频编码器20在视频块的编码期间使用的内插滤波器,以计算参考块的子整数像素的内插值。在此情况下,运动补偿单元72可根据接收的语法元素确定由视频编码器20使用的内插滤波器且使用所述内插滤波器来产生预测性块。
视频解码器30可经配置以执行上文关于图1所论述的本发明的各种技术中的任一个,且下文将更详细地论述。举例来说,运动补偿单元72可经配置以确定根据本发明的技术使用AMVP或合并模式来执行运动向量预测。熵解码单元70可解码表示如何译码当前块的运动信息的一或多个语法元素。
假定语法元素指示合并模式被执行,运动补偿单元72可形成包含合并候选集合的候选列表。运动补偿单元72可基于特定的预定次序将候选添加到候选列表。如上文所论述,运动补偿单元72也可添加额外候选且执行对候选列表的修剪。最终,运动补偿单元72可解码表示哪些候选用于译码当前块的运动信息的合并索引。
反量化单元76反量化(即,解量化)提供于位流中且由熵解码单元70解码的经量化的变换系数。反量化过程可包含使用由视频解码器30针对视频图块中的每一视频块计算的量化参数QPY以确定应进行应用的量化程度和(同样地)反量化程度。
反变换单元78将反变换(例如,反DCT、反整数变换或在概念上类似的反变换过程)应用于变换系数,以便在像素域中产生残余块。
在运动补偿单元72基于运动向量和其它语法元素而产生用于当前视频块的预测性块之后,视频解码器30通过将来自反变换单元78的残余块与由运动补偿单元72所产生的对应预测性块求和而形成经解码视频块。求和器80表示执行此求和运算的一或多个组件。如果需要,也可应用解块滤波器来对经解码块进行滤波以便去除块效应伪影。也可使用其它回路滤波器(在译码回路内或在译码回路之后)使像素转变平滑,或以其它方式改善视频质量。随后将给定帧或图片中的经解码的视频块存储于参考图片存储器82中,所述参考图片存储器存储用于后续运动补偿的参考图片。参考图片存储器82也存储经解码的视频以用于稍后在显示装置(例如,图1的显示装置32)上呈现。
在HEVC中,图块中的最大译码单元被称为译码树型单元(CTU)。CTU含有四分树。四分树的节点被称为译码单元(CU)。而且,CTU含有一个明度译码树型块(CTB)和两个色度CTB以及相关联的语法元素。明度CTB的大小根据HEVC主规范可介于16×16到64×64的范围内。然而,应了解在技术上,同样可支持8×8CTB大小。CTU可以四分树方式(例如下文所描述的图4A和图4B中展示的四分树结构)递归地拆分成译码单元(CU)。
图4A和4B为说明HEVC中的CTU到CU分割的实例和HEVC CTU到CU分割的对应四分树表示的概念图。即,图4B的每一分支和子分支的分割深度对应于产生图4A中所说明的CU的四分树分割。对图4A中所说明的子块中的一个加阴影,以说明加阴影子块为8×8CU的实例。对于加阴影的子块,允许不进一步拆分,且因此可不需要拆分相关传信。在图4B中所说明的叶节点(例如,由图4A中的分割产生的CU)对应于8×8CU的情况下,不需要传信。四分树表示的各方面经描述于W.J.韩(Han)等人的“通过译码工具的灵活单元表示和对应的扩展的改善的视频压缩效率(Improved Video Compression Efficiency Through Flexible UnitRepresentation and Corresponding Extension of Coding Tools)”(IEEE视频技术电路和系统会刊;IEEE Transaction on Circuits and Systems for Video Technology,第20卷,第12期,第1709到1720页,2010年12月)中。图4A的CTU到CU分割的传信遵循图4B中所说明的四分树结构,其中所说明的四分树中的每一相应节点消耗一个位以指示是否将进一步拆分所述相应节点。举例来说,视频编码器20可根据上文所描述的传信特征将图4A的CTU到CU分割方案传信到视频解码器30。
CU大小可与CTB的大小相同,但CU大小可小到8×8。每一译码单元(CU)根据一个模式经译码。举例来说,视频编码器20可根据帧内模式或帧间模式编码每一CU,且视频解码器30可根据帧内模式或帧间模式解码每一CU。如果CU经帧间译码(即,视频编码器20在编码CU时应用帧间模式),那么CU可进一步经分割成两(2)个或四(4)个预测单元(PU),或可在不应用进一步分割时变为仅一(1)个PU。当一个CU中存在两个PU时,所述PU可为矩形,每一矩形覆盖CU的大小(面积)的一半,或所述PU可为相应大小(例如,面积)为CU的大小的四分之一(1/4)和四分的三(3/4)的两个矩形。
图5为说明用于帧间预测模式的分割模式的概念图。如图5中所展示,存在用于以帧间预测模式经译码的CU的八(8)个分割模式。图5中所展示的八(8)个分割模式为PART_2N×2N、PART_2N×N、PART_N×2N、PART_N×N、PART_2N×nU、PART_2N×nD、PART_nL×2N和PART_nR×2N。
在特定CU经帧间译码的情况下,对于每一PU存在一个运动信息集合。举例来说,如果视频编码器20对CU进行帧间译码,那么视频编码器20可将一个运动信息集合传信到视频解码器30以用于CU。另外,视频编码器20和/或视频解码器30可用独特的帧间预测模式译码(例如,分别为编码或解码)每一PU以导出相应运动信息集合。在CU经帧内译码的情况下,2N×2N和N×N为仅有的容许PU形状。在这些情况下,在每一PU内,单一帧内预测模式经译码,同时视频编码器20在CU层级处传信色度预测模式。当当前CU大小等于对应序列参数集(SPS)中所定义的最小CU大小时,仅允许N×N帧内PU形状。
已在除HEVC和其它现有标准以外的进展过程中提出并研究各种分割方案。一个实例为下文进一步详细描述的四分树-二元树(QTBT)结构。在VCEG提议COM16-C966(J.安(An)、Y.-W.陈(Chen)、K.张(Zhang)、H.黄(Huang)、Y.-W.黄(Huang)和S.雷(Lei)的“针对下一代视频译码的块分割结构(Block partitioning structure for next generationvideo coding)”(国际电信联盟,COM16-C966,2015年9月))中,针对除HEVC以外的未来视频译码标准提出四分树-二元树(QTBT)。模拟展示所提出QTBT结构比在HEVC中使用的四分树结构更有效。
在COM16-C966中提出的QTBT结构中,首先根据四分树结构分割CTB,其中一个节点的四分树拆分可被叠代直到节点到达最小允许四分树叶节点大小(MinQTSize)为止。根据QTBT结构,如果四分树叶节点大小不大于最大允许二元树根节点大小(MaxBTSize),那么其可根据二元树结构进一步经分割。一个节点的二元树拆分可被叠代直到节点到达最小允许二元树叶节点大小(MinBTSize)或最大允许二元树深度(MaxBTDepth)为止。二元树叶节点即为CU,其在无任何进一步分割的情况下可用于预测(例如图片内或图片间预测)和变换。
根据二元树拆分,存在两个拆分类型,即,对称水平拆分和对称垂直拆分。在QTBT分割结构的一个实例中,CTU大小经设定为128×128(即,128×128明度样本和两个对应的64×64色度样本),MinQTSize经设定为16×16,MaxBTSize经设定为64×64,MinBTSize(对于宽度和高度两者)经设定为4,且MaxBTDepth经设定为4。四分树分割首先应用于CTU以产生四分树叶节点。四分树叶节点可具有16×16(即,MinQTSize)到128×128(即,CTU大小)的大小。如果四分树叶节点为128×128,那么所述四分树叶节点将不根据二元树结构进一步拆分,这是因为四分树叶节点大小超过MaxBTSize(即,64×64)。
否则(例如,如果四分树叶节点大小不超过64×64的MaxBTSize),四分树叶节点可根据二元树结构进一步经分割。因此,四分树叶节点也为二元树的根节点且具有为0的二元树深度。当二元树深度藉助于叠代二元拆分到达MaxBTDepth(即,4),其暗示不进行任何种类的进一步拆分。如果二元树节点具有等于MinBTSize(即,4)的宽度时,其暗示不进行进一步垂直拆分。类似地,如果二元树节点具有等于MinBTSize(4)的高度,其暗示不进行进一步水平拆分。二元树的叶节点即为在无更进一步分割的情况下通过预测和变换进一步处理的CU。
图6A和6B为说明QTBT分割结构的方面的概念图。图6A说明根据QTBT结构的块分割的实例。因而,图6A可经描述为QTBT结构的说明。图6B说明对应于图6A中所展示的基于QTBT的块分割的树状结构。在图6B中,实线指示基于四分树的拆分,且虚线指示基于二元树的拆分。在图6B的二元树部分的每一拆分节点(即,非叶节点)中,视频编码器20可传信一个旗标以指示使用哪一二元拆分类型(即,水平或垂直)。在图6B的实例中,旗标值零(0)指示水平拆分,且旗标值一(1)指示垂直拆分。对于QTBT结构的基于四分树的部分,不需要传信对拆分类型的指示,这是因为基于四分树的部分的拆分节点始终水平地和垂直地经拆分成四(4)个具有相等大小的子块。
已在HEVC之后提出和研究的另一树状结构被称为“多类型树状结构”。在美国临时专利申请案第62/279,233和62/311,248中,提出和描述了多类型树状结构。对于描述于美国临时专利申请案第62/279,233和62/311,248中的所述技术,树节点可使用多个树型(例如二元树、对称中心侧三元树和/或四分树结构)进一步拆分。根据两层级多类型树状结构,首先以CTU的四分树分区构建区域树(RT)。多类型树状结构的RT部分之后为多类型树状结构的预测树(PT)部分的构建。在多类型树状结构的PT部分中,可仅扩展二元树和对称中心侧三元树。
即,在多类型树状结构的PT部分中,视频编码器20和/或视频解码器30可根据二元树结构或中心侧三元树结构中的一个拆分拆分节点。在基于多类型树的拆分的PT部分中,由基于二元树的分割产生的拆分节点可根据中心侧三元树结构进一步拆分。而且,在基于多类型树的拆分的PT部分中,由基于中心侧三元树的分割产生的拆分节点可根据二元树结构进一步拆分。
图7A和7B为说明多类型树型块分割结构的一个实例使用情况的概念图。图7A说明根据多类型树状结构分割的块的实例。因而,图7A可经描述为多类型树分割结构的说明。图7B说明对应于图7A中所展示的基于多树型的块分割的树状结构。
在图7A和7B中的每一个中,实线用于说明根据多树型分割结构的基于RT的方面的分割,而虚线用于说明根据多树型分割结构的基于PT的方面的分割。如图7A和7B中所展示,根据多类型树分割结构,视频编码器20和视频解码器30仅在推断特定分支的基于RT的分割之后开始那个特定分支的基于PT的分割。而且,如图7A和图7B中所说明,视频编码器20和视频解码器30可多次且以任何次序在基于多类型树的拆分方案的基于PT的部分中实施基于二元树的分割和基于中心侧三元树的分割两者。
如图7A中所展示,首先根据四分树结构将块90分割成四个正方形子块。在图7B中藉助于根节点的四分支实线拆分来说明块90的四分树拆分。从左到右,从分割树92(图7B中)的根节点拆分的四个分支中的每一个分别对应于由块90的四分树(即,第一RT部分)拆分产生的左上、右上、左下和右下子块。左上子块根据四分树分割结构再次经拆分,且所得子块中的每一个表示叶节点(即,不进一步拆分)。因为块90的左上子块的拆分是根据四分树分割结构执行的,分割树92的最左分支在多类型树分割方案的RT部分内结束。在图7B中藉助于正用于说明涉及树92的最左分支的所有拆分的实线来展示树92的最左分支的RT限制本质。
块92的右上子块根据中心侧三元树分割结构经拆分,以形成三个矩形子块。更具体地说,就块92的右上子块来说,视频编码器20和视频解码器30根据中心侧三元树分割结构实施垂直拆分。即,视频编码器20和视频解码器30垂直拆分右上子块,以形成三个所得矩形子块。右上子块的基于垂直中心侧三元树的拆分在分割树92中展示为根节点拆分的从左第二分支的三分支拆分。因为块90的右上子块根据中心侧三元树分割结构经拆分,所以右上子块的拆分为分割树92的基于多类型树的方案的PT部分的部分。因而,在图7B中使用虚线说明分割树92的从左第二分支中的基于中心侧三元树的拆分。
视频编码器20和视频解码器30继而实施右上子块的最左矩形子块的基于二元树的拆分,以形成两个矩形子块。更具体地说,视频编码器20和视频解码器30关于块90的右上子块的最左子块实施基于二元树的拆分的水平版本。在分割树92中使用由从左第二分支的拆分产生的最左节点的虚线双向拆分标示基于二元树的拆分。
块90的左下子块根据中心侧三元树分割结构水平地经拆分,且此拆分的所得中间子块根据中心侧三元树分割结构垂直地经进一步拆分。块90的多类型树分割的PT部分的这些方面使用虚线在来源于分割树92的根节点的从左第三分支的下游分割中加以展示。
块90的右下子块根据二元树分割结构水平地经拆分,且此拆分的所得左子块根据中心侧三元树分割结构垂直地经进一步拆分。块90的多类型树分割的PT部分的这些方面使用虚线在来源于分割树92的根节点的最右分支的下游分割中加以展示。
相较于HEVC中的CU结构和相较于QTBT结构,图7A和7B中所说明的多类型树状结构提供优选译码效率,这是因为块分割更灵活。另外,中心侧三元树的引入提供视频信号的更灵活定位。为维护关于根据多类型树状结构分割的块的经PT分割部分的精度,视频编码器20可针对PT部分中的每一拆分节点传信对关于那个特定拆分节点实施的分割类型的指示。
为支持关于经PT分割部分的精度,视频编码器20可传信指示所述树状结构(二元或中心侧三元树)以及分割的定向(水平或垂直)的信息。举例来说,视频编码器20可使用码字指派来指示用于块的经PT分割部分的每一拆分节点的分割的树状结构和其定向。图7B包含视频编码器20可针对多类型树分割结构的PT部分内可能的每一分割类型传信码字的十进位值。如图7B中所展示,十进位值七(7)指示基于垂直中心侧三元树的分割,十进位值五(5)指示基于水平中心侧三元树的分割,十进位值六(6)指示基于垂直二元树的分割,和十进位值四(4)指示基于水平二元树的分割。十进位值零(0)识别块的经PT分割部分中的叶节点。即,视频编码器20可传信表示十进位值零(0)的码字以指示对应子块不经进一步分割。
图8为说明以二元格式表达的码字的实例的概念图,视频编码器20可针对经多类型树分割块分割的PT部分中可能的各种分割方案传信所述码字。图8还说明各种码字的对应分割方案。图8中所说明的二进制值对应于图7B中所说明的十进位值。因而,二元码字“111”指示基于垂直中心侧三元树的分割,二元码字“101”指示基于水平中心侧三元树的分割,二元码字“110”指示基于垂直二元树的分割,和二元码字“100”指示基于水平二元树的分割。二元码字“000”识别块的经PT分割部分中的叶节点。第一(最左)位子表示PT拆分旗标的值(指示是否拆分CU),第二位子表示PT拆分方向(例如,水平或垂直),和第三位子表示PT拆分模式(例如,二元树或中心侧三元树)。
图7B和8说明用于根据现有基于多类型树的分割技术的PT部分分割信息的传信的码字指派的实例。如所展示,根据多类型树分割结构,视频编码器20可针对每一PT节点传信三个位或位子以指示对应PT节点的分割信息。相反,视频解码器30可解码三个位或位子以确定每一PT节点处的块分割。再次,图8中所展示的由各种码字表示的各种块分割方案为未拆分、水平二元树、垂直二元树、水平三元树和垂直三元树。在各种使用案例情境中,视频编码器20和视频解码器30可关于单一块处理相当大数目的码字,例如在多类型树状结构的PT部分提早开始和/或持续最大分割深度的情况下。图7A和7B中说明一个此类实例。多类型树状结构具有两层级(RT及PT)本质,且根部块的树深度指示叶节点的块大小范围。
因此,在许多情境中,多类型树分割结构在受益于精度和分割灵活性的观点的同时可为资源繁重和带宽繁重的译码方案。上文所论述的多树状结构的特征除了藉助于中心侧三元树结构增加三个分区的外也提高传信根据多树状结构的PT部分分割信息所需的位/位子的数目。作为一个实例,对于根据多类型树状结构经译码的常规视频内容,位流位的总量的百分之九到百分之十四(9%到14%)被消耗用于根据图8中所说明的码字指派传信码字。上文所描述的技术所呈现的另一潜在问题在于树型传信的上下文模型化主要使用邻近块与当前块之间的相对深度来确定当前块的进一步拆分的可能性。
本发明是针对解决(例如,通过缓和和在一些情况中潜在地消除)上文所描述的问题以及由现有视频译码技术和继HEVC之后的提议所呈现的其它问题的技术。本发明的技术一般是针对在继续充分利用由多类型树分割结构提供的益处的同时减轻多类型树分割结构的资源和带宽消耗。本发明提供各种技术以改善使用多类型树状结构的效率,且本发明的技术可个别地或以各种组合和/或序列实施。因而,本发明的某些方面经描述为是针对树型的更高效译码。
根据本发明的一些实例,在某些条件下,可关于视频编码器20传信到视频解码器30以用于PT部分分割的信息将用于传信PT分割信息的三位子需求除外。在一些实例中,视频编码器20和视频解码器30可基于可从已译码邻近块获得的信息确定用于块的PT分割信息,由此减小正传信的码字的数目。在其它实例中,视频编码器20可根据本发明的方面传信与图8中所展示的方案不同的码字方案。在下文进一步详细描述根据本发明的技术可实施的译码约束的各种实例。本发明的一些实例技术是针对使用用于优选(例如,增强型)上下文模型化的更可靠上下文。
本发明的一些技术是基于以下辨识:块(“当前”块)相对于当前块的邻近块的大小的大小可用于选择用于当前块的PT树型译码的上下文。举例来说,视频编码器20和/或视频解码器30可实施本文中所描述的所述技术中的一或多个以确定是否将进一步拆分当前块,且可将确定基于当前块与其邻近块中的一或多个的大小之间的比率。通过使用当前块的大小与邻近块的大小之间的比率确定是否将进一步拆分当前块,视频编码器20和视频解码器30可减小基于多类型树的译码的传信间接负担,这是因为不必针对当前块传信PT拆分旗标(图8中所说明的码字的最左位子)。相反,视频编码器20和视频解码器30可执行彼此类似的操作以确定是否基于相较于邻近块的相对大小来分割当前块,由此消除对PT拆分旗标的显式传信的需要。
在一个实例中,基于当前块的宽度大于上方邻近块的宽度的确定,视频编码器20和视频解码器30可确定很可能将进一步拆分当前块。即,如果上方邻近块具有与当前块相比更小的宽度,那么视频编码器20和视频解码器30可推断上方邻近块为拆分的结果,且还将拆分当前块。以此方式,视频编码器20和视频解码器30可充分利用来自先前经译码的上方邻近块的信息以减小关于当前块的分割信息的传信间接负担,同时也产生关于是否将拆分当前块的确定。
类似地,基于当前块的高度大于左邻近块的高度的确定,视频编码器20和视频解码器30可确定很可能将进一步拆分当前块。即,如果左邻近块具有与当前块相比更小的高度,那么视频编码器20和视频解码器30可推断左邻近块为拆分的结果,且还将拆分当前块。以此方式,视频编码器20和视频解码器30可充分利用来自先前经译码的左邻近块的信息以减小关于用于当前块的分割信息的传信间接负担,同时也产生关于是否将拆分当前块的确定。
此外,视频编码器20和视频解码器30可使用上方左邻近块、上方右邻近块或下方左邻近块中的一或多个与当前块大小相比的相对大小来推断是否将进一步拆分当前块。举例来说,如果视频编码器20和视频解码器30确定当前块的面积大于上方左邻近块、上方右邻近块或下方左邻近块中的一个的面积,那么视频编码器20和/或视频解码器30可确定很可能将进一步拆分当前块。在本发明的各部分处,块面积可指代块“大小”,且相对面积信息可被称为“相对大小”或“大小比率”。
相对宽度、相对高度和相对面积的确定在本文中被称为“事件”。在一些实例中,视频编码器20和视频解码器30可使用上文所列事件中的一或多个的总计出现次数来确定PT拆分旗标的上下文,例如对是否将进一步拆分当前块的推断。在一些实例中,视频编码器20和视频解码器30可使用个别事件形成PT拆分旗标的上下文集合。
在一些实例中,视频编码器20和视频解码器30可利用上方邻近块的宽度和左邻近块的高度来产生PT拆分方向的上下文。即,根据这些实例,视频编码器20和视频解码器30可基于上方邻近块的宽度和左邻近块的高度推断图8中所说明的码字的中间位子的值。如果上方邻近块的宽度与当前块的宽度相比更小,且左邻近块的高度大于或等于当前块的高度,那么视频编码器20和视频解码器30可确定很可能将垂直拆分当前块。
类似地,如果左邻近块的高度与当前块的高度相比更小,且上方邻近块的宽度大于或等于当前块的宽度,那么视频编码器20和视频解码器30可确定很可能将水平地拆分当前块。根据本发明的这些方面,视频编码器20和视频解码器30可实施本发明的技术以基于可从先前经译码邻近块获得的信息推断PT拆分方向。以此方式,视频编码器20和视频解码器30可减小PT拆分方向需要以图8中所说明的码字方案的中间位子的形式传信的个例的数目。
根据本发明的一些实例,视频编码器20和视频解码器30可利用上方邻近块的宽度和左邻近块的高度来推断PT拆分模式的上下文。即,如果将完全在PT部分中分割当前块,那么视频编码器20和视频解码器30可利用上方邻近块的宽度和左邻近块的高度在二元树结构与中心侧三元树结构之间进行选择以用于分割当前块。在这些实例中,如果上方邻近块的宽度与当前块的宽度相比更小,且垂直地拆分当前块,那么视频编码器20和视频解码器30可确定将根据中心侧三元树分割结构拆分当前块。
在这些实例中,如果左邻近块的高度与当前块的高度相比更小,且水平地拆分当前块,那么视频编码器20和/或视频解码器30可确定很可能将根据中心侧三元树分割结构拆分当前块。以此方式,视频编码器20和视频解码器30可实施本发明的技术以基于来自先前经译码邻近块的信息推断图8中所说明的码字的最右位子的值。
根据本发明的一些实例,如果视频编码器20和视频解码器30确定当前块的邻近块不可用,那么视频编码器20和视频解码器30可在当前上下文的导出期间使用默认上下文值。举例来说,视频编码器20和视频解码器30可应用关于CABAC译码或熵译码语法元素的默认上下文,所述语法元素指示关于当前块的分割信息。
在一些实例中,如果视频编码器20和视频解码器30确定不同分量(例如Y分量、Cb分量、Cr分量或深度分量)允许不同RT或PT拆分,那么视频编码器20和/或视频解码器30可应用所有前述技术(例如,上文关于利用相对高度/宽度/面积所描述的所有技术),但使用在其它分量中的相关联块。即,代替使用来自上文所论述的近邻块的信息,视频编码器20和视频解码器30可使用关于块的Y分量、Cb分量、Cr分量或深度分量的相对高度/宽度/面积。如本文所使用,‘Y’指示明度分量,Cb指示色度分量,且Cr指示另一色度分量。
本发明的各种技术是基于以下认识:在计算PT树型的上下文时,邻近块的位置可静态地或动态地经定义以适于各种特性的视频信号。举例来说,这些技术使得视频编码器20和视频解码器30能够选择特定邻近块,以便执行上文所描述的基于相对高度/宽度/面积的技术中的一或多个。作为一个实例,如果当前块具有多个上方邻近块,那么视频编码器20和视频解码器30可实施本文中所描述的技术来选择用以执行基于相对宽度的确定的上方邻近块中的一个。类似地,如果当前块具有多个左邻近块,那么视频编码器20和视频解码器30可实施本文中所描述的技术以选择用以执行基于相对高度的确定的左邻近块中的一个。
图9为说明根据本发明的方面的用于PT拆分旗标的上下文模型化的各种上方邻近位置和左邻近位置的候选位置的概念图。由于CU的纵横比的范围变得比通过先前译码标准提供的纵横比更高,故上方邻近块的位置可选自当前块的左上角的紧挨上方、沿当前块的顶部边界的中心4×4块的紧挨上方或当前块的右上角中的最右4×4块的紧挨上方。
图9中的位置T0到T3说明待用于基于相对宽度的确定的上方邻近块的候选位置的实例。类似地,视频编码器20和视频解码器30可实施本发明的技术以从例如当前块的左上角的紧挨左侧、沿当前块的左边界的中心4×4块的紧挨左侧或当前块的左下角中的最下4×4块的紧挨左侧的位置选择左邻近块。图9中的位置L0到L3说明待用于基于相对高度的确定的左邻近块的候选位置的实例。根据本文中所描述的所述技术对上方邻近块和左邻近块的选择可随着块大小的纵横比增大而得到改善准确度。
在一个实例中,在执行当前块的上下文模型化时,视频编码器20和视频解码器30可选择定位于T0与T3之间的位置处的块作为上方邻近块,且可选择定位于L0与L3之间的位置处的块作为左邻近块。在另一实例中,视频编码器20可通过在序列参数集(SPS)图片参数集(PPS)或图块标头(SH)中传信信息来指定上方邻近块和左邻近块的位置。在这些实例中,视频解码器30可使用在SPS、PPS或SH中传信的信息选择上方邻近块和左邻近块的位置。通过使用在SPS/PPH/SH中传信的邻近块位置信息,视频编码器20和视频解码器30可跨序列、图片或图块的所有PT拆分块使用用于邻近块选择的相同信息。以此方式,视频编码器20和视频解码器30可通过减小需要传信以用于基于PT的分割的个别码字的数目来减小传信间接负担。
在一个实例中,视频编码器20可在SPS、PPS或SH中传信选自集合{(TL,TR)、(TL,BL)、(TR,BL)}的一个对或2元组以用于上下文模型化。在一个实例中,视频编码器20和视频解码器30可静态地选择选自集合{(TL,TR)、(TL,BL)、(TR,BL)}的对或2元组。在上文使用的记法中,‘TL’表示左上邻近块,‘TR’表示右上邻近块,‘BL’表示左下邻近块,且‘BR’表示右下邻近块。
在一些实例中,视频编码器20和视频解码器30可基于当前块的形状选择上方邻近块和左邻近块的位置。举例来说,如果当前块的宽度大于高度,那么视频编码器20和视频解码器30可选择图9中所说明的T1或T2作为待用于本发明的基于相对宽度的确定的上方邻近块。否则(例如,如果当前块的宽度小于或等于高度),那么视频编码器20和视频解码器30可选择图9中所说明的T0作为待用于本发明的基于相对宽度的确定的上方邻近块。类似地,如果当前块的高度大于当前块的宽度,那么视频编码器20和视频解码器30可选择图9中所说明的L1或L2作为用于本发明的基于相对高度的确定的左邻近块。否则,视频编码器20和/或视频解码器30可选择L0。
根据一些实例,如果来自图9中所展示的所有位置不相交,那么视频编码器20和视频解码器30可使用所述位置处的邻近块的信息的组合来模型化上下文。举例来说,视频编码器20和视频解码器30可将当前块宽度、高度或大小(例如,面积)与图9中所说明的所有周围邻近块的对应度量进行比较,以预测PT拆分旗标的值、PT拆分方向或PT拆分模式。通过以此方式使用来自多个邻近块的信息的组合,视频编码器20和视频解码器30可更准确地预测PT拆分旗标、PT拆分方向和PT拆分模式,这是因为考虑到了更大量的启发数据。
在另一实例中,视频编码器20可施加不使用进一步传信的约束。举例来说,如果左邻近块和上方邻近块都根据二元树结构垂直地分割,那么视频编码器20和视频解码器30可推断将根据二元树结构垂直地分割当前块。可根据本发明的方面施加其它此类约束,且应了解本发明的所述约束不限于上文所论述的垂直二元分割约束的实例。
根据本发明的一些方面,视频编码器20可对树型传信施加在逐个基础上可能适当的约束(例如,也被描述为‘恰当’约束)。在一些情况下,考虑到可允许的RT和PT深度,视频编码器20可跳过用于传信PT拆分方向或PT拆分模式的位子。关于对这些技术的论述,分别通过mW和mH标示最小块宽度和最小块高度。
在一个实例中视频编码器20和视频解码器30可确定如果当前块的宽度等于mW,那么关于当前块可仅发生水平PT拆分。在这种情况下,视频编码器20可不传信PT拆分方向,这是因为PT拆分方向是由视频解码器30关于当前块而推断。类似地,在一个实例中,如果当前块的高度等于mH,那么基于视频解码器30推断PT拆分方向为水平,视频编码器20可不传信PT拆分方向。
在一个实例中,如果当前块的宽度等于(2×mW),且垂直地拆分当前块,那么视频编码器20可不传信PT拆分模式,这是因为在这种情况下仅准许垂直二元树分割。类似地,如果当前块的高度等于(2×mH),且水平地拆分当前块,那么视频编码器20可不传信PT拆分模式,这是因为在这种情况下仅准许水平二元树分割。
在一些实例中,视频编码器20可在位流中传信关于二元树或三元树或两者的‘停用’指示。举例来说,视频编码器20可在一或多个语法结构中,例如在SPS和/或PPS和/或图块标头中传信‘停用’指示。如果树型经传信为在某一层级处停用,那么视频编码器20可跳过那个层级内PT拆分模式的传信。举例来说,如果视频编码器20在PPS(即,在图片层级处)中传信停用状态,那么视频编码器可跳过整个图片的PT拆分模式的传信。
在又一实例中,如果当前块的不同分量(例如Y分量、Cb分量、Cr分量或深度分量)允许不同RT或PT拆分,那么视频编码器20可根据其它分量中的相关联块的RT和/或PT拆分针对当前分量施加RT或PT拆分约束。举例来说,当译码Cb或Cr分量中的块时,如果垂直地拆分Y分量块,那么视频编码器20可不传信当前分量的水平拆分模式。
根据本发明的一些方面,代替传信图8中所说明的码字,视频编码器20可从可变长度译码(VLC)查找表选择码字。VLC查找表的码字可提供用于一些视频信号的替代灵活性,其中每一分割类型的交叉概率遵循偏斜或高度偏斜的分布。二进制化过程自身可包括邻近块的译码信息,以得到偏斜概率分布。在本发明的一些实例中,视频编码器20和视频解码器30可根据不同近邻块分区针对当前块分割使用不同二进制化方法。
在一个实例中视频编码器20可使用两个位子的固定长度(FL)码来传信拆分特定事件。如上文所论述,多类型树状结构内可能有四个不同类型的PT分割。再次,四个类型的PT分割为水平二元树、垂直二元树、水平中心侧三元树和垂直中心侧三元树。在本发明的两位子FL码的各种实例中,第一位子和第二位子的定义可为可互换的。即,第一位子可表示拆分方向,且第二位子可表示树型,或反之亦然。
替代地,视频编码器20可使用截短一元(TU)码来传信分区。下表1展示根据本发明的方面的视频编码器20可使用的码字指派方案的一个实例。
分割 码字
水平二元树 10
垂直二元树 0
水平中心侧三元树 110
垂直中心侧三元树 111
表1、PT中的每一分割类型的码字指派的实例
应了解,到每一分割类型的码字指派可基于每一分割的概率,且上表1仅充当非限制性实例。视频编码器20可将最短码字指派给最常遇到的情境。在表1的实例中,垂直二元树分割可表示在经PT分割部分中的最常遇到的情境,且因此,视频编码器20可指派‘0’码字以指示垂直二元树分割。在许多使用案例情境中,流式传输中超过80%的经PT分割块以同一方式经拆分。以此方式,视频编码器20可通过指派较短码字给较常经传信的指示来减小基于多类型树的分割的位率需求。
在一个实例中,如果左邻近块和上方邻近块均使用二元树垂直地分割,那么视频编码器20和视频解码器30可确定当前块同样高度可能或可能将垂直地经分割。在这种情况下,视频编码器20和视频解码器30可针对垂直二元分割使用较短码字。换句话说,视频编码器20和视频解码器30可根据此实例取决于邻近块分区而使用不同分割二进制化方法。以此方式,视频编码器20可通过指派较短码字给针对当前块将最可能传信的指示来减小基于多类型树的分割的位率需求。
在一个实例中,视频编码器20可在位流的各种语法结构(例如SPS、PPS或SH)中传信码字选择。在另一实例中,当不同分量(例如Y分量、Cb分量、Cr分量或深度分量)允许不同RT或PT拆分时,针对当前分量从VLC查找表的选择可根据其它分量中的相关联块的RT和/或PT拆分来应用。举例来说,当译码Cb或Cr分量中的块且垂直地拆分Y分量中的相关联块时,视频编码器20可传信用于基于垂直二元树的分割的缩短码字。换句话说,根据此实例,视频编码器20可取决于其它分量中的相关联块分区使用不同分割二进制化方法。
根据本发明的某些技术,视频编码器20和视频解码器30可针对横跨图片边界的所有CTU实施预定义拆分方式。因为跨图片CTU的拆分结构在这些实例中经预定义,视频编码器20可直到分割产生定位于当前图片内的每一CU的所有样本之前才传信树型信息。
在一个实例中,CTU可在视频编码器20不传信任何CU拆分旗标的情况下通过RT拆分递归地拆分,直到递归RT拆分达到所有节点表示整个定位在当前图片内的所得CU的阶段为止。在其它实例中,所述CTU可通过使用一个所选类型的PT拆分在视频编码器20不传信任何CU拆分旗标的情况下递归地拆分,直到递归拆分达到所有节点表示整个定位在当前图片内的所得CU的阶段为止。在一个实例中,视频编码器20和视频解码器30可通过使用包含RT和PT两者的常规树型传信找到最有利表示来递归地拆分CTU。举例来说,对于右半部处于图片外部的CTU,一级RT拆分形成有效分割。又,在一级PT拆分的情况下不在RT中进行拆分以形成另一有效分割。
有效分割经定义为每一相应CU整个定位在当前图片内的分割。在另一实例中,视频编码器20可自适应地拆分CTU,且视频编码器20可传信一个一位旗标或索引或多个旗标以使得视频解码器30能够决定或确定应实施上文所提及的拆分方案中的哪一个。在这个实例中,视频解码器30可使用所接收信息来选择匹配通过视频编码器20实施的自适应性拆分的拆分方案。以此方式,视频编码器20和视频解码器30可减小在CTU横跨图片边界的情况下对码字传信的位率需求。因为递归拆分机制经预定义以将此CTU分割成各自整个处于当前图片内的CU,所以视频编码器20不必反复地传信码字以指示每一节点处的拆分信息,至少直到每一CU包括于单一图片内为止。
再次,视频编码器20和/或视频解码器30可个别地实施上文所描述的技术或以可在逻辑上组合所述技术中的两者或多于两者的任何组合实施所述技术。如上文所描述,本发明的技术适用于将各种树型用于块分割的情境中。举例来说,区域树(RT)分割可包含(但不限于)四分树分割,且预测树(PT)分割可包含(但不限于)二元树分割和/或对称中心侧三元树分割。
如下描述上文所描述的技术的各种实施方案。举例来说,关于上文关于图9所描述的基于邻近块选择的技术,对于预测树(PT)部分中的每一节点,视频编码器20和/或视频解码器30可执行以下译码:
1.对于PT拆分旗标,视频编码器20和视频解码器30可使用宽度、高度和面积像素大小来导出上下文信息。
a)在一个实例实施方案中,视频编码器20和视频解码器30可从位于位置T2处的上方邻近块(图9中所说明)选择块宽度。在此实施方案中,视频编码器20和视频解码器30可从位于位置L2处的左邻近块选择块高度,且可从(TL,TR)对选择块大小(例如,面积)。假设块宽度和高度分别为W和H。上下文索引的值可经计算为:
CTX=(W>WT2)+(H>HL2)+(W*H>STL)+(W*H>STR) (1)
其中STL和STR表示在图9中占据位置TL和TR的块的大小。遵循等式(1),如果满足以下条件,那么可选择额外上下文:
CTX=((W<WT2)&&(H<HL2)&&(W*H<STL)&&(W*H<STR))?5:CTX (2)
在此实施方案中,位置T0、T1、T2和T3经计算为:
Figure BDA0001978422960000281
类似地,位置L0、L1、L2和L3经计算为:
Figure BDA0001978422960000282
其中(X0,Y0)为当前块的左上角的像素坐标。等式(3)和(4)中的单元大小等于分别在X方向和Y方向上的最小块宽度和最小块高度。
b)在一个实例实施方案中,较小上下文集合可定义如下:
Figure BDA0001978422960000283
c)在一个实例实施方案中,视频编码器20和视频解码器30可从T0与T3之间的顶部位置中的任一个选择块宽度,且可从L0与L3之间的位置中的任一个选择块高度。在此实施方案中,视频编码器20和视频解码器30可从以下集合选择一对邻近块大小:
{(TL,TR),(TR,BL),(TL,BL)}
上下文索引的值可使用以上等式(1)和(2)计算,但其中T2、L2、STL和STR位置用所选的各者替换。
替代地,视频编码器20和/或视频解码器30可基于位置集合做出将条件熵最小化的选择,且位置集合的索引可例如经由SPS、PPS或图块标头在位流中进行传信。
2.对于PT拆分方向,视频编码器20和视频解码器30可实施本发明的技术以利用块宽度、高度和其与顶部邻近者和左邻近者的相对值来产生上下文集合。
a)在一个实例实施方案中,上下文模型的集合可定义如下(根据下表2):
条件 CTX
blkSizeX==blkSizeY 0
(blkSizeX>blkSizeY)&&(blkSizeX<=2*blkSizeY) 1
(blkSizeY>blkSizeX)&&(blkSizeY<=2*blkSizeX) 2
blkSizeX>2*blkSizeY 3
blkSizeY>2*blkSizeX 4
表2
b)在一个实例实施方案中,上下文模型的集合可定义如下(另外参看下表3)。假设condL和condT为用于左邻近者和顶部邻近者的两个条件:
condL=(blkSizeX==blkSizeY)&&(leftAvailable&&blkSizeY>leftBlkSizeY)
condT=(blkSizeX==blkSizeY)&&(topAvailable&&blkSizeX>topBlkSizeX)
条件 CTX
(blkSizeX==blkSizeY)&&!condT&&!condL 0
((blkSizeX>blkSizeY)&&(blkSizeX<=2*blkSizeY))||condT 1
((blkSizeY>blkSizeX)&&(blkSizeY<=2*blkSizeX))||condL 2
blkSizeX>2*blkSizeY 3
blkSizeY>2*blkSizeX 4
表3
c)在一个实例实施方案中,具有较低复杂度的上下文模型的集合可定义如下(另外参看下表4):
假设condL和condT为如下两个条件:
condL=(blkSizeX==blkSizeY)&&(leftAvailable&&blkSizeY>leftBlkSizeY)
condT=(blkSizeX==blkSizeY)&&(topAvailable&&blkSizeX>topBlkSizeX)
条件 CTX
(blkSizeX==blkSizeY)&&!condT&&!condL 0
(blkSizeX>blkSizeY)||condT 1
(blkSizeY>blkSizeX)||condL 2
表4
3.对于PT拆分模式,视频编码器20和视频解码器30可实施本发明的某些技术以利用块宽度、高度和顶部块和左块之间的相对关系以产生上下文集合。
a)在一个实例实施方案中,上下文的集合可定义如下(另外参看下表5)。假设condL和condT为用于左邻近块和上方邻近块的两个条件:
condL=(leftAvailable&&blkSizeY>leftBlkSizeY)&&(horizontal_split)
condT=(topAvailable&&blkSizeX>topBlkSizeX)&&(vertical_split)
条件 CTX
!condL&&!condT 0
condL||condT 1
表5
b)在一个实例实施方案中,视频编码器20和/或视频解码器30可将上下文定义为旗标自身的可能性。即,上下文索引的值经设定为0。
c)在一个实施例中,视频编码器20可将此位子的编码设定为无上下文的,且在CABAC引擎中针对所述旗标执行旁路译码。
4.可通过个别地对四分之一大小的树(其出现在RT和三元树中的第一和第三分区处)的层级数目和其它PT树型的层级数目进行计数来导出等效系统。
a)在一个实例实施方案中,视频编码器20和/或视频解码器30可如下定义双向深度系统。假设四分之一大小的树的深度和二分之一大小的树的深度分别为DQ和DH。视频编码器20和/或视频解码器30可将等效深度D计算为:
D=2*DQ+DH (6)
b)视频编码器20和/或视频解码器30可通过取宽度和高度的对数值来对宽度和高度应用类似定义。就等效系统来说,举例来说,上文等式(1)可重新写成:
CTX=(log(W)>log(WT2))+(log(H)>log(HL2))+(D<DTL)+(D<DTR) (7)
其中DTL和DTR分别为占据左上和右上位置的块的等效深度。
图10为说明视频编码器20(或其处理电路)可根据本发明的各种方面执行的实例过程100的流程图。过程100可在视频编码器20的处理电路将当前块的尺寸的值与邻近块的对应尺寸的值进行比较以获得相对尺寸值信息(102)时开始。在一个实例中,视频编码器20的处理电路可将当前块的宽度与定位于当前块上方的上方邻近块的宽度进行比较。在另一实例中,视频编码器20的处理电路可将当前块的高度与定位于当前块左边的左邻近块的高度进行比较。因而,邻近块的对应尺寸以类似于当前块的尺寸的方式表示指示邻近块的外观尺寸信息的测量值或度量。
基于相对尺寸值,视频编码器20的处理电路可确定将根据多类型树分割结构的PT部分分割当前块(104)。在一个实例中,视频编码器20的处理电路可基于当前块的宽度小于上方邻近块的宽度的确定来确定将根据多类型树状结构的PT部分分割当前块。在另一实例中,视频编码器20的处理电路可基于当前块的高度小于左邻近块的高度的确定来确定将根据多类型树结构的Pt部分分割当前块。
转而,视频编码器20的处理电路可根据中心侧三元树结构或二元树结构分割当前块(106)。如上文所论述,PT部分分割遵循二元树结构或中心侧三元树结构。在一些实例中,视频编码器20的处理电路可从邻近块继承用于确定相对尺寸的树型(二元或中心侧三元)。转而,视频编码器20的处理电路可将经编码视频位流传信到视频解码器30(108)。举例来说,视频编码器20的处理电路可使用视频编码器20的网络接口或其它通信硬件来传信位流。
在邻近块为上方邻近块且相对尺寸值是基于宽度比较的实例中,为分割当前块,视频编码器20的处理电路可垂直地分割当前块。在邻近块为左邻近块且相对尺寸值是基于高度比较的实例中,为分割当前块,视频编码器20的处理电路可水平地分割当前块。
在一些实例中,邻近块为当前块的对角邻近块。对角邻近块可包含定位于当前块的上方和左方的左上邻近块、定位于当前块的上方和右方的右上邻近块或定位于当前块的下方和右方的左下邻近块中的任一个。在这些实例中,为对当前块的尺寸的值与对角邻近块的对应尺寸的值进行比较,视频编码器20的处理电路可基于邻近块为对角邻近块来比较当前块的面积与上方邻近块的面积。
在一些实例中,视频解码器30的处理电路可将当前块的宽度与当前块的高度进行比较以确定当前块的形状。在这些实例中,为选择邻近块,视频解码器30的处理电路可基于当前块的所确定形状从多个左邻近块或多个上方邻近块中的一个选择邻近块。
在一些实例中,视频编码器20的处理电路可从以下中的一个选择邻近块:(i)多个上方邻近块,其包含沿当前块的顶部边界定位于最左4×4子块上方的第一上方邻近块、沿当前块的顶部边界定位于中间4×4子块上方的第二上方邻近块和沿当前块的顶部边界定位于最右4×4子块上方的第三上方邻近块,或(ii)多个左邻近块,其包含沿当前块的左边界定位于顶部4×4子块左方的第一左邻近块、沿当前块的左边界定位于中间4×4子块左方的第二左邻近块和沿当前块的左边界定位于底部4×4子块左方的第三左邻近块。在一些实例中,视频编码器20的处理电路可使用视频编码器20的通信硬件在序列参数集(SPS)、图片参数集(PPS)或图块标头(SH)中的一个中传信对视频数据的单元中的一或多个块的所选邻近块的指示,所述指示对应于SPS、PPS或SH中的相应者。
在一些实例中,视频编码器20的处理电路可将多个码字中的相应码字指派到用于分割当前块的多个方向树型组合中的相应方向树型组合。在这些实例中,多个码字包含0码字、10码字、110码字和111码字,且多个方向树型组合包含水平二元树组合、垂直二元树组合、水平中心侧三元树组合和垂直中心侧三元树组合。在这些实例中,为根据基于多类型树的分割方案的PT部分分割当前块,视频编码器20的处理电路可根据包含于多个方向树型组合中的特定方向树型组合来分割当前块。视频编码器20的处理电路可使用视频编码器20的通信硬件在经编码视频位流中传信指派到特定方向树型组合的相应码字,所述当前块是根据所述特定方向树型组合进行分割。
图11为说明视频解码器30的处理电路可根据本发明的各种方面执行的实例过程120的流程图。过程120可在视频解码器30的处理电路将当前块的尺寸的值与邻近块的对应尺寸的值进行比较以获得相对尺寸值信息(122)时开始。在一个实例中,视频解码器30的处理电路可基于邻近块为上方邻近块而将当前块的宽度与定位于当前块上方的上方邻近块的宽度进行比较。在另一实例中,视频解码器30的处理电路可基于邻近块为左邻近块而将当前块的高度与定位于当前块左方的左邻近块的高度进行比较。因而,邻近块的对应尺寸以类似于当前块的尺寸的方式表示指示邻近块的外观尺寸信息的测量值或度量。
基于相对尺寸值,视频解码器30的处理电路可确定将根据多类型树分割结构的PT部分分割当前块(124)。在一个实例中,视频解码器30的处理电路可基于对当前块的宽度小于上方邻近块的宽度的确定来确定将根据多类型树状结构的PT部分分割当前块。在另一实例中,视频解码器30的处理电路可基于对当前块的高度小于左邻近块的高度的确定来确定将根据多类型树状结构的PT部分分割当前块。
转而,视频解码器30的处理电路可根据中心侧三元树结构或二元树结构分割当前块(126)。如上文所论述,PT部分分割遵循二元树结构或中心侧三元树结构。在一些实例中,视频解码器30的处理电路可从邻近块继承用于确定相对尺寸的树型(二元或中心侧三元)。在邻近块为上方邻近块且相对尺寸值是基于宽度比较的实例中,为分割当前块,视频解码器30的处理电路可垂直地分割当前块。在邻近块为左邻近块且相对尺寸值是基于高度比较的实例中,为分割当前块,视频解码器30的处理电路可水平地分割当前块。
在一些实例中,邻近块为当前块的对角邻近块。对角邻近块可包含定位于当前块的上方和左方的左上邻近块、定位于当前块的上方和右方的右上邻近块或定位于当前块的下方和右方的左下邻近块中的任一个。在这些实例中,为对当前块的尺寸的值与对角邻近块的对应尺寸的值进行比较,视频解码器30的处理电路可基于邻近块为对角邻近块来比较当前块的面积与上方邻近块的面积。
在一些实例中,视频解码器30的处理电路可从以下中的一个选择邻近块:(i)多个上方邻近块,其包含沿当前块的顶部边界定位于最左4×4子块上方的第一上方邻近块、沿当前块的顶部边界定位于中间4×4子块上方的第二上方邻近块和沿当前块的顶部边界定位于最右4×4子块上方的第三上方邻近块,或(ii)多个左邻近块,其包含沿当前块的左边界定位于顶部4×4子块左方的第一左邻近块、沿当前块的左边界定位于中间4×4子块左方的第二左邻近块和沿当前块的左边界定位于底部4×4子块左方的第三左邻近块。
在一些实例中,视频解码器30的处理电路可使用视频解码器30的通信硬件(有线或无线接收器)在经编码视频位流中接收序列参数集(SPS)、图片参数集(PPS)或图块标头(SH)中的一个。在这些实例中,视频解码器30的处理电路可从所接收SPS、PPS或SH解码对视频数据的单元中的一或多个块的所选邻近块的指示,所述指示对应于SPS、PPS或SH中的相应者。在一些实例中,视频解码器30的处理电路可将当前块的宽度与当前块的高度进行比较以确定当前块的形状。在这些实例中,为选择邻近块,视频解码器30的处理电路可基于当前块的所确定形状从多个左邻近块或多个上方邻近块中的一个选择邻近块。
在一些实例中,视频解码器30的处理电路可分别将当前块的宽度或当前块的高度中的至少一个与当前块的预定最小宽度或当前块的预定最小高度中的至少一个进行比较,且可基于所述比较确定用于分割当前块的树型或用于分割当前块的分割方向中的至少一个。在一些实例中,所述当前块为当前译码单元(CU)。在一些这些实例中,视频解码器30的处理电路可确定视频数据的译码树型单元(CTU)横跨图片边界,使得CTU的大小延伸超出当前图片的填补区域,且基于所述CTU横跨图片边界,视频解码器30的处理电路可使用多类型树状结构的预定分割方案递归地分割CTU以形成包含当前译码单元(CU的多个)CU,使得当前CU整个定位于当前图片内。
应认识到,取决于实例,本文中所描述的技术中的任一个的某些动作或事件可以不同序列经执行、可经添加、合并或完全省去(例如,并非所有所描述动作或事件为实践所述技术所必要)。此外,在某些实例中,可例如经由多线程处理、中断处理或多个处理器同时而非顺序执移动作或事件。
在一或多个实例中,所描述功能可以硬件、软件、固件或其任何组合来实施。如果在软件中实施,那么所述功能可作为一或多个指令或代码而存储在计算机可读媒体上或经由计算机可读媒体传输,且由基于硬件的处理单元执行。计算机可读媒体可包含计算机可读存储媒体(其对应于例如数据存储媒体的有形媒体)或通信媒体(其包含例如根据通信协议促进计算机程序从一处传送到另一处的任何媒体)。以此方式,计算机可读媒体大体上可对应于(1)非暂时性的有形计算机可读存储媒体,或(2)例如信号或载波的通信媒体。数据存储媒体可为可通过一或多个计算机或一或多个处理器存取以检索指令、代码和/或数据结构以用于实施本发明所描述的技术的任何可用媒体。计算机程序产品可包含计算机可读媒体。
通过实例而非限制,这些计算机可读存储媒体可包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁性存储装置、闪存或可用于存储呈指令或数据结构形式的所要程序代码且可由计算机存取的任何其它媒体。又,将任何连接适当地称为计算机可读媒体。举例来说,如果使用同轴缆线、光缆、双绞线、数字用户线(DSL)或无线技术(例如红外线、无线电和微波)从网站、服务器或其它远程源传输指令,那么同轴缆线、光缆、双绞线、DSL或无线技术(例如红外线、无线电和微波)包含于媒体的定义中。然而,应理解,计算机可读存储媒体和数据存储媒体不包含连接、载波、信号或其它暂时性媒体,而是实际上有关非暂时性有形存储媒体。如本文中所使用,磁盘和光盘包含压缩光盘(CD)、激光光盘、光学光盘、数字影音光盘(DVD)、软碟和蓝光光盘,其中磁盘通常以磁性方式再生数据,而光盘通过激光以光学方式再生数据。以上各者的组合也应包含于计算机可读媒体的范围内。
可由一或多个处理器执行指令,所述一或多个处理器例如一或多个数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、固定功能处理电路、可编程处理电路或其它等效集成或离散逻辑电路。因此,如本文中所使用的术语“处理器”可指代前述结构或适于实施本文中所描述的技术的任何其它结构中的任一个。另外,在一些方面中,可将本文中所描述的功能性提供在经配置以用于编码和解码的专用硬件和/或软件模块内,或并入于组合式编解码器中。又,所述技术可完全实施于一或多个电路或逻辑元件中。
本发明的技术可实施于多种多样的装置或装备(包含无线手持机、集成电路(IC)或IC集合(例如,芯片组))中。在本发明中描述各种组件、模块或单元以强调经配置以执行所揭示技术的装置的功能方面,但未必需要由不同硬件单元来实现。确切来说,如上文所描述,各种单元可组合于编解码器硬件单元中,或由互操作性硬件单元的集合结合合适的软件和/或固件而提供,所述硬件单元包含如上文所描述的一或多个处理器。
已描述各种实例。这些和其它实例在所附权利要求书的范围内。

Claims (26)

1.一种译码视频数据的方法,所述方法包括:
将所述视频数据的当前块的尺寸的值与所述当前块的邻近块的对应尺寸的值进行比较以获得相对尺寸值,所述邻近块与所述当前块相邻定位;
基于所述相对尺寸值确定所述当前块将根据基于多类型树的分割方案的预测树PT部分进行分割,所述基于多类型树的分割方案的所述PT部分包括根据二元树结构或中心侧三元树结构中的一个的分割;以及
基于所述确定,根据所述基于多类型树的分割方案的所述PT部分分割所述当前块以形成多个子块。
2.根据权利要求1所述的方法,
其中所述邻近块包括定位于所述当前块上方的上方邻近块,
其中将所述当前块的所述尺寸的所述值与所述上方邻近块的所述对应尺寸的所述值进行比较包括基于所述邻近块包括定位于所述当前块上方的所述上方邻近块而将所述当前块的宽度与所述上方邻近块的宽度进行比较,且
其中分割所述当前块包括垂直地分割所述当前块。
3.根据权利要求1所述的方法,
其中所述邻近块包括定位于所述当前块左方的左邻近块,
其中将所述当前块的所述尺寸与所述左邻近块的所述对应尺寸进行比较包括基于所述邻近块包括定位于所述当前块左方的所述左邻近块而将所述当前块的高度与所述左邻近块的高度进行比较,且
其中分割所述当前块包括水平地分割所述当前块。
4.根据权利要求1所述的方法,
其中所述邻近块为包括以下中的一个的对角邻近块:
定位于所述当前块的上方和左方的左上邻近块,
定位于所述当前块的上方和右方的右上邻近块,或
定位于所述当前块的下方和右方的左下邻近块,且
其中将所述当前块的所述尺寸的所述值与所述对角邻近块的所述对应尺寸的所述值进行比较包括基于所述邻近块为所述对角邻近块而将所述当前块的面积与所述对角邻近块的面积进行比较。
5.根据权利要求1所述的方法,其进一步包括从以下中的一个选择所述邻近块:
(i)多个上方邻近块,其包含沿所述当前块的顶部边界定位于最左4×4子块上方的第一上方邻近块、沿所述当前块的所述顶部边界定位于中间4×4子块上方的第二上方邻近块和沿所述当前块的所述顶部边界定位于最右4×4子块上方的第三上方邻近块,或
(ii)多个左邻近块,其包含沿所述当前块的左边界定位于顶部4×4子块左方的第一左邻近块、沿所述当前块的所述左边界定位于中间4×4子块左方的第二左邻近块和沿所述当前块的所述左边界定位于底部4×4子块左方的第三左邻近块。
6.根据权利要求5所述的方法,其中译码所述视频数据的所述方法包括解码经编码视频数据的方法,所述方法进一步包括:
解码所述多个子块中的一或多个子块。
7.根据权利要求6所述的方法,所述方法进一步包括:
在经编码视频位流中接收序列参数集SPS、图片参数集PPS或图块标头SH中的至少一个;以及
从所述所接收SPS、PPS或SH解码对所述视频数据的单元中的一或多个块的所述所选邻近块的指示,所述指示对应于所述SPS、PPS或SH中的所述相应者。
8.根据权利要求5所述的方法,其中所述译码方法包括编码所述视频数据的方法,所述方法进一步包括:
编码所述多个子块;以及
在经编码视频位流中传信表示所述经编码多个子块的经编码视频数据。
9.根据权利要求8所述的方法,所述方法进一步包括:
在序列参数集SPS、图片参数集PPS或图块标头SH中的一个中传信对所述视频数据的单元中的一或多个块的所述所选邻近块的指示,所述指示对应于所述SPS、PPS或SH中的所述相应者。
10.根据权利要求5所述的方法,其进一步包括:
将所述当前块的宽度与所述当前块的高度进行比较以确定所述当前块的形状,
其中选择所述邻近块包括基于所述当前块的所述所确定形状从所述多个左邻近块或所述多个上方邻近块中的一个选择所述邻近块。
11.根据权利要求1所述的方法,其中译码所述视频数据的所述方法包括解码经编码视频数据的方法,所述方法进一步包括:
分别将所述当前块的宽度或所述当前块的高度中的至少一个与所述当前块的预定最小宽度或所述当前块的预定最小高度中的至少一个进行比较;以及
基于所述比较确定用于分割所述当前块的树型或用于分割所述当前块的分割方向中的至少一个。
12.根据权利要求1所述的方法,其中所述当前块为当前译码单元CU,其中译码所述视频数据的所述方法包括解码经编码视频数据的方法,所述方法进一步包括:
确定所述视频数据的译码树型单元CTU横跨图片边界,使得所述CTU的大小延伸超出当前图片的填补区域;以及
基于所述CTU横跨所述图片边界,使用所述多类型树状结构的预定分割方案递归地分割所述CTU以形成包含所述当前译码单元CU的多个CU,
其中所述当前译码单元CU整个定位于所述当前图片内。
13.根据权利要求1所述的方法,其中所述译码方法包括编码所述视频数据的方法,所述方法进一步包括:
将多个码字中的相应码字指派到用于分割所述当前块的多个方向树型组合中的相应方向树型组合,
其中所述多个方向树型组合包含水平二元树组合、垂直二元树组合、水平中心侧三元树组合和垂直中心侧三元树组合,且
其中根据所述基于多类型树的分割方案的所述PT部分分割所述当前块包括根据包含于所述多个方向树型组合中的特定方向树型组合分割所述当前块;以及
在经编码视频位流中传信指派到所述特定方向树型组合的所述相应码字,所述当前块根据所述特定方向树型组合进行分割。
14.一种用于译码视频数据的装置,所述装置包括:
经配置以存储所述视频数据的存储器;以及
与所述存储器通信的处理电路,所述处理电路经配置以:
将所述经存储视频数据的当前块的尺寸的值与所述当前块的邻近块的对应尺寸的值进行比较以获得相对尺寸值,所述邻近块与所述当前块相邻定位;
基于所述相对尺寸值确定将根据基于多类型树的分割方案的预测树PT部分分割所述当前块,所述基于多类型树的分割方案的所述PT部分包括根据二元树结构或中心侧三元树结构中的一个的分割;以及
基于所述确定,根据所述基于多类型树的分割方案的所述PT部分分割所述当前块以形成多个子块。
15.根据权利要求14所述的装置,
其中所述邻近块包括定位于所述当前块上方的上方邻近块,
其中为将所述当前块的所述尺寸的所述值与所述上方邻近块的所述对应尺寸的所述值进行比较,所述处理电路经配置以基于所述邻近块包括定位于所述当前块上方的所述上方邻近块而将所述当前块的宽度与所述上方邻近块的宽度进行比较,且
其中为分割所述当前块,所述处理电路经配置以垂直地分割所述当前块。
16.根据权利要求14所述的装置,
其中所述邻近块包括定位于所述当前块左方的左邻近块,
其中为将所述当前块的所述尺寸与所述左邻近块的所述对应尺寸进行比较,所述处理电路经配置以基于所述邻近块包括定位于所述当前块的左方的所述左邻近块而将所述当前块的高度与所述左邻近块的高度进行比较,且
其中为分割所述当前块,所述处理电路经配置以水平地分割所述当前块。
17.根据权利要求14所述的装置,
其中所述邻近块为包括以下中的一个的对角邻近块:
定位于所述当前块的上方和左方的左上邻近块,
定位于所述当前块的上方和右方的右上邻近块,或
定位于所述当前块的下方和右方的左下邻近块,且
其中为将所述当前块的所述尺寸的所述值与所述对角邻近块的所述对应尺寸的所述值进行比较,所述处理电路经配置以基于所述邻近块为所述对角邻近块而将所述当前块的面积与所述对角邻近块的面积进行比较。
18.根据权利要求14所述的装置,其中所述处理电路进一步经配置以从以下中的一个选择所述邻近块:
(i)多个上方邻近块,其包含沿所述当前块的顶部边界定位于最左4×4子块上方的第一上方邻近块、沿所述当前块的所述顶部边界定位于中间4×4子块上方的第二上方邻近块和沿所述当前块的所述顶部边界定位于最右4×4子块上方的第三上方邻近块,或
(ii)多个左邻近块,其包含沿所述当前块的左边界定位于顶部4×4子块左方的第一左邻近块、沿所述当前块的所述左边界定位于中间4×4子块左方的第二左邻近块和沿所述当前块的所述左边界定位于底部4×4子块左方的第三左邻近块。
19.根据权利要求18所述的装置,其中所述装置包括用于解码经编码视频数据的装置,且其中所述处理电路进一步经配置以:
解码所述多个子块中的一或多个子块。
20.根据权利要求19所述的装置,其进一步包括通信硬件,其中所述处理电路进一步经配置以:
经由所述通信硬件在经编码视频位流中接收序列参数集SPS、图片参数集PPS或图块标头SH中的至少一个;以及
从所述所接收SPS、PPS或SH解码对所述视频数据的单元中的一或多个块的所述所选邻近块的指示,所述指示对应于所述SPS、PPS或SH中的所述相应者。
21.根据权利要求18所述的装置,其中所述装置包括用于编码所述视频数据的装置,且其中所述处理电路进一步经配置以:
编码所述多个子块。
22.根据权利要求18所述的装置,其中所述装置进一步包括通信硬件,且其中所述处理电路进一步经配置以:
经由所述通信硬件在经编码视频位流中传信表示所述经编码多个子块的经编码视频数据;
经由所述通信硬件在序列参数集SPS、图片参数集PPS或图块标头SH中的一个中传信对所述视频数据的单元中的一或多个块的所述所选邻近块的指示,所述指示对应于所述SPS、PPS或SH中的所述相应者。
23.根据权利要求18所述的装置,其中所述处理电路经进一步配置以:
将所述当前块的宽度与所述当前块的高度进行比较以确定所述当前块的形状,
其中为选择所述邻近块,所述处理电路经配置以基于所述当前块的所述所确定形状从所述多个左邻近块或所述多个上方邻近块中的一个选择所述邻近块。
24.根据权利要求14所述的装置,其中所述装置包括用于编码所述视频数据的装置,且其中所述处理电路进一步经配置以:
分别将所述当前块的宽度或所述当前块的高度中的至少一个与所述当前块的预定最小宽度或所述当前块的预定最小高度中的至少一个进行比较;以及
基于所述比较确定用于分割所述当前块的树型或用于分割所述当前块的分割方向中的至少一个。
25.根据权利要求14所述的装置,其中所述当前块为当前译码单元CU,其中所述装置包括用于解码经编码视频数据的装置,且其中所述处理电路进一步经配置以:
确定所述视频数据的译码树型单元CTU横跨图片边界,使得所述CTU的大小延伸超出当前图片的填补区域;以及
基于所述CTU横跨所述图片边界,使用所述多类型树状结构的预定分割方案递归地分割所述CTU以形成包含所述当前译码单元CU的多个CU,
其中所述当前译码单元CU整个定位于所述当前图片内。
26.根据权利要求14所述的装置,其中所述装置包括用于编码所述视频数据的装置,其中所述装置进一步包括通信硬件,且其中所述处理电路进一步经配置以:
将多个码字中的相应码字指派到用于分割所述当前块的多个方向树型组合中的相应方向树型组合,
其中所述多个方向树型组合包含水平二元树组合、垂直二元树组合、水平中心侧三元树组合和垂直中心侧三元树组合,且
其中为根据所述基于多类型树的分割方案的所述PT部分分割所述当前块,所述处理电路经配置以根据包含于所述多个方向树型组合中的特定方向树型组合分割所述当前块;以及
经由所述通信硬件在经编码视频位流中传信指派到所述特定方向树型组合的所述相应码字,所述当前块根据所述特定方向树型组合进行分割。
CN201780052406.6A 2016-09-07 2017-09-07 用于视频译码的树型译码 Active CN109644275B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201662384585P 2016-09-07 2016-09-07
US62/384,585 2016-09-07
US15/697,134 US10609423B2 (en) 2016-09-07 2017-09-06 Tree-type coding for video coding
US15/697,134 2017-09-06
PCT/US2017/050464 WO2018049020A1 (en) 2016-09-07 2017-09-07 Tree-type coding for video coding

Publications (2)

Publication Number Publication Date
CN109644275A CN109644275A (zh) 2019-04-16
CN109644275B true CN109644275B (zh) 2022-08-19

Family

ID=61281770

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780052406.6A Active CN109644275B (zh) 2016-09-07 2017-09-07 用于视频译码的树型译码

Country Status (9)

Country Link
US (3) US10609423B2 (zh)
EP (1) EP3510776A1 (zh)
JP (1) JP7218287B2 (zh)
KR (1) KR102515487B1 (zh)
CN (1) CN109644275B (zh)
BR (1) BR112019003749A2 (zh)
SG (1) SG11201900438WA (zh)
TW (1) TWI788302B (zh)
WO (1) WO2018049020A1 (zh)

Families Citing this family (74)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10567808B2 (en) * 2016-05-25 2020-02-18 Arris Enterprises Llc Binary ternary quad tree partitioning for JVET
CN109479131B (zh) * 2016-06-24 2023-09-01 世宗大学校产学协力团 视频信号处理方法及装置
US10609423B2 (en) 2016-09-07 2020-03-31 Qualcomm Incorporated Tree-type coding for video coding
KR102531386B1 (ko) * 2016-10-04 2023-05-12 주식회사 비원영상기술연구소 영상 데이터 부호화/복호화 방법 및 장치
CN117768645A (zh) 2016-10-04 2024-03-26 有限公司B1影像技术研究所 图像编码/解码方法、记录介质和传输比特流的方法
US20190260992A1 (en) * 2016-10-10 2019-08-22 Samsung Electronics Co., Ltd. Method and device for encoding or decoding luma block and chroma block
US10779004B2 (en) * 2016-10-12 2020-09-15 Mediatek Inc. Methods and apparatuses of constrained multi-type-tree block partition for video coding
GB2557430B (en) * 2016-10-12 2020-01-15 Mediatek Inc Methods and apparatuses of constrained multi-type-tree block partition for video coding
US20180109812A1 (en) * 2016-10-14 2018-04-19 Media Tek Inc. Block partitioning using tree structures
KR20180045530A (ko) * 2016-10-26 2018-05-04 디지털인사이트 주식회사 임의의 블록 분할을 사용하는 비디오 코딩 방법 및 장치
CN117097911A (zh) * 2016-11-18 2023-11-21 株式会社Kt 视频解码方法、视频编码方法和压缩视频数据发送设备
WO2018092869A1 (ja) * 2016-11-21 2018-05-24 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化装置、復号装置、符号化方法及び復号方法
JPWO2018092868A1 (ja) 2016-11-21 2019-10-17 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 符号化装置、復号装置、符号化方法及び復号方法
BR112018067678B1 (pt) * 2016-12-05 2024-01-02 Ericsson Telecomunicações S.A Método para tratamento de um fluxo contínuo de dados, codificador, decodificador, e, portadora
AU2017377490B2 (en) * 2016-12-16 2022-04-21 FG Innovation Company Limited Image decoding device and image coding device
US10820017B2 (en) * 2017-03-15 2020-10-27 Mediatek Inc. Method and apparatus of video coding
CN108965894B (zh) * 2017-05-27 2021-12-21 华为技术有限公司 一种视频图像的编解码方法及装置
US10666943B2 (en) * 2017-09-15 2020-05-26 Futurewei Technologies, Inc. Block partition structure in video compression
CN111527751A (zh) * 2017-12-29 2020-08-11 夏普株式会社 用于在用于视频编码的图片的边界处划分视频块的系统和方法
EP3763128A4 (en) * 2018-03-14 2022-04-06 Mediatek Inc. METHOD AND APPARATUS PROVIDING AN OPTIMIZED DIVISION STRUCTURE FOR VIDEO CODING
CN110278443B (zh) * 2018-03-16 2022-02-11 华为技术有限公司 划分标志位的上下文建模方法及装置
WO2019174567A1 (zh) 2018-03-16 2019-09-19 华为技术有限公司 划分标志位的上下文建模方法及装置
CN116866565A (zh) * 2018-03-21 2023-10-10 Lx 半导体科技有限公司 图像编码/解码方法、存储介质以及图像数据的传输方法
US11330260B2 (en) * 2018-03-23 2022-05-10 Sharp Kabushiki Kaisha Systems and methods for adaptively partitioning video blocks for video coding
CN111937404B (zh) * 2018-03-26 2023-12-15 寰发股份有限公司 一种用于视频编码器或解码器的视频编解码方法及装置
EP3777147B1 (en) * 2018-03-29 2023-02-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding a picture using picture boundary handling
US11470359B2 (en) * 2018-03-30 2022-10-11 Sharp Kabushiki Kaisha Systems and methods for partitioning video blocks at a boundary of a picture for video coding
US10375422B1 (en) * 2018-03-30 2019-08-06 Tencent America LLC Method and apparatus for motion field based tree splitting
CN112055964B (zh) 2018-04-30 2022-06-07 寰发股份有限公司 用于视频编解码中的独立编码树的语法交错方法和装置
EP4319158A3 (en) * 2018-05-10 2024-04-03 Samsung Electronics Co., Ltd. Image segmentation method and apparatus for image encoding and decoding
WO2019225991A1 (ko) * 2018-05-23 2019-11-28 주식회사 케이티 비디오 신호 처리 방법 및 장치
WO2019234613A1 (en) * 2018-06-05 2019-12-12 Beijing Bytedance Network Technology Co., Ltd. Partition tree with partition into 3 sub-blocks by horizontal and vertical splits
CN112567749B (zh) * 2018-06-18 2024-03-26 Lg电子株式会社 使用仿射运动预测来处理视频信号的方法和装置
EP3808083A1 (en) 2018-06-18 2021-04-21 InterDigital VC Holdings, Inc. Method and apparatus for video encoding and decoding based on asymmetric binary partitioning of image blocks
WO2019244116A1 (en) * 2018-06-21 2019-12-26 Beijing Bytedance Network Technology Co., Ltd. Border partition in video coding
KR20210020924A (ko) * 2018-06-27 2021-02-24 파나소닉 인텔렉츄얼 프로퍼티 코포레이션 오브 아메리카 삼차원 데이터 부호화 방법, 삼차원 데이터 복호 방법, 삼차원 데이터 부호화 장치, 및 삼차원 데이터 복호 장치
CN112385220B (zh) * 2018-07-14 2022-12-09 寰发股份有限公司 对具有分割约束的视频图像进行编码或解码的方法和装置
TWI820197B (zh) 2018-08-28 2023-11-01 大陸商北京字節跳動網絡技術有限公司 與擴展四叉樹相關的分割的二值化
CN116208767B (zh) * 2018-09-03 2023-11-28 华为技术有限公司 一种对码流进行解码的方法、装置以及存储码流的设备
WO2020057516A1 (en) * 2018-09-18 2020-03-26 Huawei Technologies Co., Ltd. Partitioning with high level constraint
WO2020057530A1 (en) * 2018-09-18 2020-03-26 Huawei Technologies Co., Ltd. Coding method, device, system
GB2577318B (en) * 2018-09-21 2021-03-10 Canon Kk Video coding and decoding
WO2020069632A1 (en) * 2018-10-01 2020-04-09 Huawei Technologies Co., Ltd. A video encoder, a video decoder and corresponding methods
WO2020071368A1 (ja) * 2018-10-04 2020-04-09 株式会社エスペラントシステム データ処理システム、データ処理装置、データ処理方法及びプログラム
WO2020084476A1 (en) 2018-10-22 2020-04-30 Beijing Bytedance Network Technology Co., Ltd. Sub-block based prediction
WO2020084554A1 (en) 2018-10-24 2020-04-30 Beijing Bytedance Network Technology Co., Ltd. Searching based motion candidate derivation for sub-block motion vector prediction
WO2020098643A1 (en) 2018-11-12 2020-05-22 Beijing Bytedance Network Technology Co., Ltd. Simplification of combined inter-intra prediction
JP7337157B2 (ja) * 2018-11-12 2023-09-01 ホアウェイ・テクノロジーズ・カンパニー・リミテッド ビデオエンコーダ、ビデオデコーダおよびピクチャを符号化または復号する方法
CN113170171B (zh) 2018-11-20 2024-04-12 北京字节跳动网络技术有限公司 组合帧间帧内预测模式的预测细化
EP3861742A4 (en) 2018-11-20 2022-04-13 Beijing Bytedance Network Technology Co., Ltd. DIFFERENCE CALCULATION BASED ON SPATIAL POSITION
JP7319365B2 (ja) 2018-11-22 2023-08-01 北京字節跳動網絡技術有限公司 サブブロックに基づくインター予測のための調整方法
US11172214B2 (en) * 2018-12-21 2021-11-09 Qualcomm Incorporated Derivation of processing area for parallel processing in video coding
BR112021013107A2 (pt) * 2019-01-02 2021-09-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codificação e decodificação de uma figuração e fluxo de dados
WO2020177756A1 (en) 2019-03-06 2020-09-10 Beijing Bytedance Network Technology Co., Ltd. Size dependent inter coding
US20220167009A1 (en) * 2019-03-12 2022-05-26 Sharp Kabushiki Kaisha Systems and methods for performing intra prediction coding in video coding
CN113632494B (zh) * 2019-03-22 2023-12-08 华为技术有限公司 用于视频译码的变换单元分割方法
EP3922014A4 (en) 2019-04-02 2022-04-06 Beijing Bytedance Network Technology Co., Ltd. DECODER SIDE MOTION VECTOR BYPASS
CN114026871A (zh) * 2019-06-24 2022-02-08 鸿颖创新有限公司 用于对视频数据编码的装置和方法
WO2021023262A1 (en) * 2019-08-06 2021-02-11 Beijing Bytedance Network Technology Co., Ltd. Using screen content coding tool for video encoding and decoding
JP7481430B2 (ja) 2019-08-13 2024-05-10 北京字節跳動網絡技術有限公司 サブブロックに基づくインター予測における動き精度
CN114342400A (zh) 2019-09-02 2022-04-12 北京字节跳动网络技术有限公司 基于色彩格式的编解码模式确定
KR102649584B1 (ko) 2019-09-21 2024-03-21 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 크로마 인트라 모드에 기초한 크기 제한
CN114762330A (zh) 2019-09-22 2022-07-15 北京字节跳动网络技术有限公司 视频的子图片编码和解码
US11589044B2 (en) * 2019-10-14 2023-02-21 Hfi Innovation Inc. Video encoding and decoding with ternary-tree block partitioning
US11363285B2 (en) * 2020-02-20 2022-06-14 Tencent America LLC Block partitioning at picture boundaries
CN113286152B (zh) 2020-02-20 2023-05-23 腾讯美国有限责任公司 视频解码方法、装置、计算机设备及存储介质
WO2021201384A1 (ko) * 2020-04-03 2021-10-07 엘지전자 주식회사 포인트 클라우드 데이터 처리 장치 및 방법
WO2021215811A1 (ko) * 2020-04-24 2021-10-28 엘지전자 주식회사 포인트 클라우드 데이터 송신 장치, 포인트 클라우드 데이터 송신 방법, 포인트 클라우드 데이터 수신 장치 및 포인트 클라우드 데이터 수신 방법
WO2021246837A1 (ko) * 2020-06-05 2021-12-09 엘지전자 주식회사 포인트 클라우드 데이터 처리 디바이스 및 처리 방법
WO2021256873A1 (ko) * 2020-06-17 2021-12-23 엘지전자 주식회사 포인트 클라우드 데이터 처리 디바이스 및 처리 방법
WO2021256887A1 (ko) * 2020-06-18 2021-12-23 엘지전자 주식회사 포인트 클라우드 데이터 전송 장치, 포인트 클라우드 데이터 전송 방법, 포인트 클라우드 데이터 수신 장치 및 포인트 클라우드 데이터 수신 방법
US20230260163A1 (en) * 2020-07-13 2023-08-17 Lg Electronics Inc. Point cloud data transmission device, point cloud data transmission method, point cloud data reception device, and point cloud data reception method
WO2022025552A1 (ko) * 2020-07-31 2022-02-03 엘지전자 주식회사 포인트 클라우드 데이터 전송 장치, 포인트 클라우드 데이터 전송 방법, 포인트 클라우드 데이터 수신 장치 및 포인트 클라우드 데이터 수신 방법
WO2024015639A1 (en) * 2022-07-15 2024-01-18 Bytedance Inc. Neural network-based image and video compression method with parallel processing

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102355579A (zh) * 2011-02-24 2012-02-15 中兴通讯股份有限公司 一种预测模式的编码或解码方法及装置
CN102595116A (zh) * 2011-01-14 2012-07-18 华为技术有限公司 多图像块划分的编解码方法和装置
CN102984521A (zh) * 2012-12-12 2013-03-20 四川大学 基于时域相关性的高性能视频编码帧间模式判决方法
CN103650503A (zh) * 2011-06-21 2014-03-19 英迪股份有限公司 基于四叉树编码和解码自适应量化参数的方法及装置
WO2014120367A1 (en) * 2013-01-30 2014-08-07 Intel Corporation Content adaptive parametric transforms for coding for next generation video
EP2868087A1 (en) * 2012-06-29 2015-05-06 Canon Kabushiki Kaisha Image encoding apparatus, method of image encoding, and recording medium, image decoding apparatus, method of image decoding, and recording medium

Family Cites Families (52)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102007023785B4 (de) * 2007-05-16 2014-06-18 Seereal Technologies S.A. Analytisches Verfahren zu Berechnung von Videohologrammen in Echtzeit und holographische Wiedergabeeinrichtung
KR101487686B1 (ko) 2009-08-14 2015-01-30 삼성전자주식회사 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치
JP5562346B2 (ja) 2009-10-20 2014-07-30 シャープ株式会社 動画像符号化装置、動画像復号装置、動画像符号化方法および動画像復号方法
KR101452713B1 (ko) * 2009-10-30 2014-10-21 삼성전자주식회사 픽처 경계의 부호화 단위를 부호화, 복호화 하는 방법 및 장치
KR101457396B1 (ko) * 2010-01-14 2014-11-03 삼성전자주식회사 디블로킹 필터링을 이용한 비디오 부호화 방법과 그 장치, 및 디블로킹 필터링을 이용한 비디오 복호화 방법 및 그 장치
KR101675118B1 (ko) * 2010-01-14 2016-11-10 삼성전자 주식회사 스킵 및 분할 순서를 고려한 비디오 부호화 방법과 그 장치, 및 비디오 복호화 방법과 그 장치
KR101447796B1 (ko) * 2010-04-13 2014-10-07 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 평면 간 예측
JP5856143B2 (ja) * 2010-04-13 2016-02-09 ジーイー ビデオ コンプレッション エルエルシー 細分割を使用した2次元情報信号の空間的なサンプリングの符号化
AU2011241283B2 (en) 2010-04-13 2015-02-05 Samsung Electronics Co., Ltd. Video-encoding method and video-encoding apparatus based on encoding units determined in accordance with a tree structure, and video-decoding method and video-decoding apparatus based on encoding units determined in accordance with a tree structure
PT3301648T (pt) * 2010-04-13 2020-04-20 Ge Video Compression Llc Herança em matriz de amostras em subdivisão multitree
DK2559246T3 (en) * 2010-04-13 2016-09-19 Ge Video Compression Llc Fusion of sample areas
ES2691743T3 (es) * 2010-12-06 2018-11-28 Sun Patent Trust Método de codificación de imágenes, método de decodificación de imágenes, dispositivo de codificación de imágenes y dispositivo de decodificación de imágenes
US9807424B2 (en) 2011-01-10 2017-10-31 Qualcomm Incorporated Adaptive selection of region size for identification of samples in a transition zone for overlapped block motion compensation
US9883203B2 (en) 2011-11-18 2018-01-30 Qualcomm Incorporated Adaptive overlapped block motion compensation
US9462275B2 (en) * 2012-01-30 2016-10-04 Qualcomm Incorporated Residual quad tree (RQT) coding for video coding
US9185405B2 (en) * 2012-03-23 2015-11-10 Qualcomm Incorporated Coded block flag inference in video coding
US9467701B2 (en) * 2012-04-05 2016-10-11 Qualcomm Incorporated Coded block flag coding
US9912944B2 (en) * 2012-04-16 2018-03-06 Qualcomm Incorporated Simplified non-square quadtree transforms for video coding
JP2013229674A (ja) 2012-04-24 2013-11-07 Sharp Corp 画像符号化装置、画像復号装置、画像符号化方法、画像復号方法、画像符号化プログラム、及び画像復号プログラム
FR3029333A1 (fr) 2014-11-27 2016-06-03 Orange Procede de codage et decodage d'images, dispositif de codage et decodage et programmes d'ordinateur correspondants
WO2016090568A1 (en) 2014-12-10 2016-06-16 Mediatek Singapore Pte. Ltd. Binary tree block partitioning structure
US10382795B2 (en) * 2014-12-10 2019-08-13 Mediatek Singapore Pte. Ltd. Method of video coding using binary tree block partitioning
US10085027B2 (en) * 2015-03-06 2018-09-25 Qualcomm Incorporated Adaptive mode checking order for video encoding
WO2016148438A2 (ko) * 2015-03-13 2016-09-22 엘지전자 주식회사 비디오 신호의 처리 방법 및 이를 위한 장치
WO2016154963A1 (en) 2015-04-01 2016-10-06 Mediatek Inc. Methods for chroma coding in video codec
US10638129B2 (en) * 2015-04-27 2020-04-28 Lg Electronics Inc. Method for processing video signal and device for same
US10735728B2 (en) * 2015-10-12 2020-08-04 Lg Electronics Inc. Method for processing image and apparatus therefor
US10623767B2 (en) * 2015-10-19 2020-04-14 Lg Electronics Inc. Method for encoding/decoding image and device therefor
WO2017090961A1 (ko) * 2015-11-24 2017-06-01 삼성전자 주식회사 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치
CN108605130B (zh) * 2015-11-27 2021-05-11 联发科技股份有限公司 一种用于对与区块相关的符号进行熵编解码的方法和装置
US10212444B2 (en) 2016-01-15 2019-02-19 Qualcomm Incorporated Multi-type-tree framework for video coding
US11223852B2 (en) 2016-03-21 2022-01-11 Qualcomm Incorporated Coding video data using a two-level multi-type-tree framework
US10142652B2 (en) * 2016-05-05 2018-11-27 Google Llc Entropy coding motion vector residuals obtained using reference motion vectors
US10560718B2 (en) * 2016-05-13 2020-02-11 Qualcomm Incorporated Merge candidates for motion vector prediction for video coding
WO2017204427A1 (ko) * 2016-05-23 2017-11-30 가온미디어 주식회사 영상 처리 방법, 그를 이용한 영상 복호화 및 부호화 방법
US10567808B2 (en) * 2016-05-25 2020-02-18 Arris Enterprises Llc Binary ternary quad tree partitioning for JVET
US10609423B2 (en) * 2016-09-07 2020-03-31 Qualcomm Incorporated Tree-type coding for video coding
KR20230033027A (ko) * 2016-11-01 2023-03-07 삼성전자주식회사 부호화 방법 및 그 장치, 복호화 방법 및 그 장치
US10848788B2 (en) * 2017-01-06 2020-11-24 Qualcomm Incorporated Multi-type-tree framework for video coding
US10820017B2 (en) * 2017-03-15 2020-10-27 Mediatek Inc. Method and apparatus of video coding
EP3383045A1 (en) * 2017-03-27 2018-10-03 Thomson Licensing Multiple splits prioritizing for fast encoding
EP3383044A1 (en) * 2017-03-27 2018-10-03 Thomson Licensing Reducing redundancy between tree types
US11134273B2 (en) * 2019-02-14 2021-09-28 Qualcomm Incorporated Regular coded bin reduction for coefficient coding
US11849131B2 (en) * 2019-03-07 2023-12-19 Qualcomm Incorporated Adaptive subblock size for affine motion compensation
US11202101B2 (en) * 2019-03-13 2021-12-14 Qualcomm Incorporated Grouped coding for palette syntax in video coding
US11277637B2 (en) * 2019-05-09 2022-03-15 Qualcomm Incorporated Reference sampling for matrix intra prediction mode
US11363284B2 (en) * 2019-05-09 2022-06-14 Qualcomm Incorporated Upsampling in affine linear weighted intra prediction
US11233988B2 (en) * 2019-05-17 2022-01-25 Qualcomm Incorporated Reference picture resampling and inter-coding tools for video coding
US11019334B2 (en) * 2019-05-17 2021-05-25 Qualcomm Incorporated Multiple adaptive loop filter sets for video coding
US11317088B2 (en) * 2019-05-17 2022-04-26 Qualcomm Incorporated Gradient-based prediction refinement for video coding
US11611759B2 (en) * 2019-05-24 2023-03-21 Qualcomm Incorporated Merge mode coding for video coding
US11381847B2 (en) * 2019-05-31 2022-07-05 Qualcomm Incorporated Coefficient coding for transform skip mode in video coding

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102595116A (zh) * 2011-01-14 2012-07-18 华为技术有限公司 多图像块划分的编解码方法和装置
CN102355579A (zh) * 2011-02-24 2012-02-15 中兴通讯股份有限公司 一种预测模式的编码或解码方法及装置
CN103650503A (zh) * 2011-06-21 2014-03-19 英迪股份有限公司 基于四叉树编码和解码自适应量化参数的方法及装置
EP2868087A1 (en) * 2012-06-29 2015-05-06 Canon Kabushiki Kaisha Image encoding apparatus, method of image encoding, and recording medium, image decoding apparatus, method of image decoding, and recording medium
CN102984521A (zh) * 2012-12-12 2013-03-20 四川大学 基于时域相关性的高性能视频编码帧间模式判决方法
WO2014120367A1 (en) * 2013-01-30 2014-08-07 Intel Corporation Content adaptive parametric transforms for coding for next generation video

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Fast prediction unit partition mode selection for high-efficiency video coding intercoding using motion homogeneous coding units;Wei Wu,Jiong Liu,Lixin Zhao;《Journal or Electronic Imaging 24(6)》;20151230;第26卷(第4期);全文 *

Also Published As

Publication number Publication date
KR102515487B1 (ko) 2023-03-28
SG11201900438WA (en) 2019-03-28
US10609423B2 (en) 2020-03-31
EP3510776A1 (en) 2019-07-17
CN109644275A (zh) 2019-04-16
WO2018049020A1 (en) 2018-03-15
US11089339B2 (en) 2021-08-10
TW201813386A (zh) 2018-04-01
US20210344970A1 (en) 2021-11-04
BR112019003749A2 (pt) 2019-05-21
US11743508B2 (en) 2023-08-29
US20180070110A1 (en) 2018-03-08
TWI788302B (zh) 2023-01-01
JP2019530316A (ja) 2019-10-17
US20200267418A1 (en) 2020-08-20
KR20190044629A (ko) 2019-04-30
JP7218287B2 (ja) 2023-02-06

Similar Documents

Publication Publication Date Title
CN109644275B (zh) 用于视频译码的树型译码
JP6619028B2 (ja) 改善されたコンテキスト適応バイナリ算術コーティング(cabac)設計を使用したデータのコーディング
US10440399B2 (en) Coding sign information of video data
US10506228B2 (en) Variable number of intra modes for video coding
CN107667533B (zh) 高级算术译码器
US20150071357A1 (en) Partial intra block copying for video coding
CN111213376A (zh) 使用基于编码结构的候选列表构建对视频数据的运动信息进行编码
JP2017523685A (ja) イントラブロックコピーイングのためのブロックベクトルコーディング
JP2013543713A (ja) ビデオ符号化のための適応動きベクトル解像度信号伝達
US20210185325A1 (en) Motion vector obtaining method and apparatus, computer device, and storage medium
JP6466349B2 (ja) スケーラブルビデオコーディングのための空間動きベクトルスケーリング
US11394996B2 (en) Video coding method and apparatus

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40000593

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant