CN114731414A - 发信图像以及视频的块分割 - Google Patents

发信图像以及视频的块分割 Download PDF

Info

Publication number
CN114731414A
CN114731414A CN202080070109.6A CN202080070109A CN114731414A CN 114731414 A CN114731414 A CN 114731414A CN 202080070109 A CN202080070109 A CN 202080070109A CN 114731414 A CN114731414 A CN 114731414A
Authority
CN
China
Prior art keywords
block
size
maximum
splitting
current
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080070109.6A
Other languages
English (en)
Inventor
向时达
赖贞延
陈庆晔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
MediaTek Inc
Original Assignee
MediaTek Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by MediaTek Inc filed Critical MediaTek Inc
Publication of CN114731414A publication Critical patent/CN114731414A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Television Systems (AREA)

Abstract

提供了一种对块分割应用约束的视频系统。该系统从一比特流接收分割控制参数,其指定用于启用三元树拆分的一最大块尺寸被约束为64或更小(1410)。该系统从比特流接收待解码为视频的当前图像的当前块的像素块的数据(1420)。该系统将该当前块递归地拆分成一个或多个分割(1430),其中三元树分割不允许用于该当前块的一部分除非该分割小于或等于该最大块尺寸(1435)。该系统重构该当前块的该一个或多个分割(1440)。

Description

发信图像以及视频的块分割
交叉引用
本发明要求分别于2019年10月14日、2019年10月15日、2019年10月18日、2019年11月4日、2020年1月2日提交的序号为62/914,577、62/915,049、62/916,891、62/930,084、62/956,359的美国临时专利申请的优先权。所述美国临时专利申请在此通过引用将其全文并入。
技术领域
本发明通常涉及视频以及图像的编解码。更具体地,本发明涉及发信已编解码视频或图像中区块(如,编码单元)的分割结构的方法。
背景技术
除非在此另有指示,本节所描述的方法不是下文所列申请专利范围的先前技术以及不通过包括于本节而被承认为先前技术。
在高效视频编解码(HEVC)中,已编解码的图像被分割成由编解码树单元(CTU)表示的非重迭正方形块区域。已编解码的图像可以由一些条带(slice)来表示,每一者包括整数数目的CTU。条带中的单个CTU以光栅扫描次序(raster scanning order)来处理。双向预测(B)条带可以用使用至多两个运动向量以及参考索引来预测每一块的样本值的帧内预测或帧间预测来解码。帧内(I)条带仅使用帧内预测来解码。预测(P)条带用使用至多一个运动向量以及参考索引来预测每一块的样本值的帧内预测或帧间预测来解码。
CTU可以被进一步分割成多个非重迭的编码单元(CU)来适应各种局部运动以及纹理特性。在四叉树(quadtree,QT)拆分结构上建立的编码树被采用来表示从CTU拆分的多个CU分割。关于尺寸M×M像素样本的CTU,其中M是64、32以及16中的一个值。CTU可以包括相同尺寸M×M的单个单元,或者拆分成尺寸M/2×M/2的四个较小单元。与编解树的根(root)节点有关的CTU以及四个M/2×M/2单元是从编解码树的根节点拆分的子四叉树节点。四个四叉树节点的每一个可以成为父节点用于尺寸在每一空间维度上减少一半的另一个拆分成四个子节点。四叉树拆分可以被递归地应用直到达到叶尺寸。编码树的叶节点与CU相关。最小以及最大CU尺寸可以在序列参数集(SPS)中指定。
可以为每一CU指定一个或多个预测单元(PU)。预测单元与相关的CU语法一起作为发信预测子资讯的基础单元。所指定的预测进程被应用于预测PU内的相关像素样本的值。CU可以被拆分成一个、两个或四个PU,取决于与所选择的PU类型。
CU可以进一步使用残差四叉树(RQT)结构来分割用于表示相关预测残差讯号。RQT的叶节点对应于生成的变换单元(TU)。变换单元包括尺寸8×8、16×16或32×32的亮度样本的变换块(TB)或者尺寸4×4亮度样本的四个变换块,以及4:2:0色彩格式中图像的色度样本的两个对应的变换块。整数变换被应用于变换块以及已量化系数值在比特流中被编解码。最小以及最大变换块尺寸在序列参数集中被指定。
在HEVC中,术语编码树块、编码块、预测块以及变换块被定义于分别指示来自相关CTU、CU、PU以及TU的一个色彩分量的2-D样本阵列。因此,CTU在不使用三个单独色彩平面编解码的色彩图像中包含一个亮度CTB、两个色度CTB以及相关的与语法元素。所发信的编码树分割通常被应用于亮度块以及色度块两者,但是当遇到某些最小尺寸约束时可以有例外。
发明内容
后续的概述仅是说明性的并不旨在以任何方式进行限制。即,后续概述被听来介绍本文所描述的新颖以及非显而易见技术的概念、亮度、益处以及优势。选择以及不是所有的实施方式都在细节描述中被进一步描述。因此,后续概述不旨在识别所要求保护主题的基本特征,也不旨在决定所要求保护主题的范围。
本发明提供了对块分割应用约束的视频系统的一些实施例。该系统从一比特流中接收一分割控制参数,该分割控制参数指定用于启用三元树(TT)拆分的一最大块尺寸被约束为64或更小。该系统从待解码为一视频的一当前图像的一当前块的一像素块的一比特流接收数据。该系统将该当前块递归地拆分成一个或多个分割,其中TT拆分不被允许用于该当前块的一分割除非该分割小于或等于该最大块尺寸。该系统重构该当前块的该一个或多个分割。
在一些实施例中,在包括该当前块的一条带的一条带标头中发信该分割控制参数。该分割控制参数在该当前图像的一图像标头中被发信。该分割控制参数可以在包括该当前图像的一视频图像序列的一序列参数集(SPS)中被发信。在一些实施例中,SPS或图像标头设置该分割控制参数的一预设值,其可以由包括该当前块的条带标头来覆写。
在一些实施例中,该分割控制参数通过参考四叉树拆分叶块的一最小尺寸指定该最大块尺寸,例如通过使用(i)可以由三元树拆分进一步分割的一块的该最大块尺寸的底为2的对数与(ii)该四叉树拆分叶块的该最小尺寸的底为2的对数之间的差异指定该分割控制参数。该四叉树拆分叶块的该最小尺寸被约束为64与一编码树块尺寸之间的一较小值。其中用于启用TT拆分的该最大块尺寸被进一步约束为小于一编码树块尺寸
该四叉树拆分叶块的该最小尺寸通过参考一最小编码块尺寸来指定,以及该四叉树拆分叶块的该最小尺寸通过使用(i)该四叉树拆分叶块的该最小尺寸的底为2的对数与(ii)该最小编码块尺寸的底为2的对数之间的差异来指定。
在一些实施例中,该最大块尺寸基于虚拟管线数据单元(VPDU)的尺寸来决定,以及该最大块尺寸基于确保每一VPDU可以由相同的管线阶段完整地处理来定义。
附图说明
附图被包括以提供本发明的进一步理解,以及被包括并构成本发明的一部分。附图示出了本发明的实施方式,以及与描述一起用于解释本发明的原理。能够理解,因为一些部分被示出为与实际尺寸不成比例来清楚说明本发明的概念,本发明不需要按比例绘制。
图1示出了用于表示将CTU分割成多个CU的编码树结构。实线指示CU边界以及虚线指示TU边界。
图2示出了HEVC中定义的将CU拆分成多个PU的8种分割类型。
图3示出了将CU拆分成两个分割的各种拆分类型,包括可以垂直或水准分割CU的不同的对称以及非对称拆分类型。
图4示出了块分割以及其对应的二元树的示例。
图5示出了块分割以及其对应的QTBT的示例。
图6示出了使用五个拆分类型之一将CU拆分成多个较小的CU。
图7示出了当应用基于VPDU的约束时像素块的相容以及非相容的分割结构。
图8概念地示出了用于控制像素块的分割结构的约束参数。
图9示出了发信关于块分割的约束的示例性视频编码器。
图10示出了实施块分割约束的视频编码器的部分。
图11概念地示出了用于发信块分割约束的进程。
图12示出了对块分割应用约束的示例性视频解码器。
图13示出了实施块分割约束的视频解码器的部分。
图14概念地示出了应用块分割约束的进程。
图15概念地示出了实施本发明一些实施例的电子系统。
具体实施方式
在后续细节描述中,以示例的方式给出了许多具体细节以提供本发明的透彻理解。基于本文所描述教导的任何变体、衍生与/或拓展都在本发明的保护范围内。在一些情况下,为了不必要地混淆本发明的教导的方面,本文所公开的一个或多个示例性实施方式的公知的方法、进程、元件与/或电路在相对较高层级而没有详细描述。
I.块分割结构
图1示出了用于表示将CTU分割成多个CU的编码树结构。实线指示CU边界以及虚线指示TU边界。图2示出了HEVC中定义的将CU拆分成多个PU的8种类型的分割。
A.二元树(BT)块分割
在一些实施例中,二元树块分割结构被用于分割块。在二元树拆分结构中,块可以被递归地拆分成两个更小的块或分割。
图3示出了将CU拆分成两个分割的各种拆分类型,包括可以垂直或水准分割CU的不同的对称以及非对称拆分类型。对于一些实施例,最有效以及最简单的拆分类型是对称水准以及垂直拆分,仅这两个拆分类型被用于二元树拆分结构。
对于尺寸M×N的给定块,语法元素bt_split_flag可以被发信来指示是否将块拆分成两个更小的块。如果旗标为真,另一个语法元素bt_split_mode被发信来指示使用了哪一拆分类型(即,水准或垂直)。如果使用了水准拆分,块被拆分成尺寸M×N/2的两个更小块。否则,如果使用了垂直拆分,那么块被拆分成尺寸M/2×N的两个更小块。二元树拆分进程可以被递归地应用直到当前块尺寸(宽度或高度)达到最小块尺寸(宽度或高度),其可以在高层级语法集(如SPS)中定义。因为二元树具有两个拆分类型(即,水准以及垂直),可以指示最小块宽度以及高度。当拆分将大致块高度小于所指示的最小值时,暗示非水准拆分。当拆分将导致宽度小于所指示的最小值时,暗示非垂直拆分。
图4示出了块分割(左)以及其对应二元树(右)的示例。对于二元树的每一拆分(即,非叶)节点,一个旗标被发信来指示使用了哪一拆分类型(水准或垂直),“0”表示水准拆分以及“1”表示垂直拆分。
B.四叉树+二元树(QTBT)块分割
在一些实施例中,四叉树加二叉树(QTBT)结构被采用用于将CU分割成更小的CU。每一CTU可以包含一个CU或者首先使用四叉树拆分结构拆分成多个更小的CU。四叉树拆分可以被递归地应用于CU直到当前CU的尺寸达到最小四叉树叶节点尺寸。如果当前四叉树块不大于最大二元树根节点尺寸,其可以使用二元树拆分结构进一步进行分割。二元树拆分可以被递归地应用直到当前CU尺寸(宽度或高度)达到最小二元树叶节点尺寸(宽度或高度)或当前二元树深度达到最大二元树深度。有两个拆分类型,对称水准拆分以及对称垂直拆分。二元树叶节点与CU相关联。对于二元树的每一拆分(即,非叶)节点,一个旗标被发信来指示使用了哪一拆分类型(水准或垂直)。“0”水准拆分以及“1”指示垂直拆分。最小四叉树叶节点尺寸、最大二元树根节点尺寸、最小二元树叶节点宽度以及高度,以及最大二元树深度可以在高层级语法集合中指示。图5示出了块分割(左)以及其对应的QTBT(右)的示例。实线指示四叉树拆分以及虚线指示二元树拆分。
C.多类型树(MTT)块分割
在多类型树(MTT)结构中,水准以及垂直中心侧三元树(TT)被进一步添加到QTBT结构中用于拆分CU。图6示出了使用五个拆分类型之一的将CU拆分成多个更小的CU。拆分类型(d)以及(e)被称为三叉树或三元树拆分类型以及可以被采用来将块拆分成三个更小的块,所有在一个空间维度具有减小的尺寸而在其他空间维度保持相同的尺寸。当前CU的二元树深度btDepthC在MTT结构中根据如下来定义:
btDepthC=log2((widthR*heightR)/(widthC*heightC))
其中,widthC以及heightC分别表示当前CU的宽度以及高度,以及widthR与heightR分别表示对应的MTT根节点的宽度以及高度,以及函数log2(x)是x的底为2的对数。
在一些实施例中,每一编码树单元(CTU)可以由具有嵌入的多类型树(使用二元以及三元拆分)的四叉树来分割成一个或多个较小尺寸的CU。语法元素split_cu_flag首先被发信来指示当前编码单元是否被进一步拆分成不止一个编码单元。当split_cu_flag等于0时,当前CU是叶节点以及不被进一步拆分。否则,当前CU被进一步分割,以及语法元素split_qt_flag被进一步发来指示当前编码单元是否由四叉树拆分来分割。当split_qta_flag等于1时,当前CU由四叉树拆分被进一步分割成四个CU,具有一半的水准以及垂直尺寸。否者,语法元素mtt_split_cu_vertical_flag以及mtt_split_cu_binary_flag被发信来指示所选择的MTT拆分的方向(垂直或水准)以及类型(二元或三元树)。
II.用于分割的块尺寸的约束
虚拟管线数据单元(VPDU)被定义为图像中的非重迭的M×M-亮度(L)/N×N-色度(C)单元。在硬体解码器中,连续的VPDU由多个管线阶段同时处理以及不同的阶段同时处理不同的VPDU。VPDU的尺寸大致与大部分管线阶段的缓冲器尺寸成比例。在HEVC硬体解码器中,VPDU尺寸通常被设置为匹配最大变换块(TB)尺寸,其被称为最大允许的块尺寸,或MaxTbSizeY。
在一些实施例中,为了减少已编解码视频中的VPDU尺寸,CU分割根据后续来约束:(1)对于包含一个或多个CU的每一VPDU,CU被完整包含于VPDU中。(2)对于包含一个或多个VPDU的每一CU,VPDU被完整包含于CU中。(3)CU的处理顺序不能留下一个VPDU,以后再访问。这确保每一VPDU可以由相同的管线阶段完全处理。
图7示出了当基于VPDU的约束被应用时像素块的相容以及非相容的分割结构。图式示出了可以被进一步分割用于编解码的块700(如,CTU)。块700的尺寸是128×128亮度样本。块700被处理为四个VPDU(701-704)(由虚线拆分),每一VPDU对应于64×64亮度样本区域。
图式示出了各种示例性方案(a)通过(i)用于将块700分割成多个CU。一些分割方案与VPDU相容而其他则不。具体的,因为每一VPDU包含一个或多个CU,CU被完整包含于VPDU中,以及对于包含一个或多个VPDU的每一CU,VPDU被完整地包含于CU中,分割方案(a)、(b)、(c)以及(d)导致CU与VPDU相容。这确保不需要将VPDU作为一个CU的部分进行部分处理,并在以后作为另一个CU的一部分进行重新访问。
分割方案(e),(f),(g),(h),(i),(j),(k),(i)生成与VPDU相容的多个CU,因为每一方案需要待部分处理的至少一个VPDU作为一个CU的部分以及稍后重访作为另一个CU的部分。换言之,存在跨越多个管线阶段的至少一个VPDU。
在一些实施例中,当被允许用于当前块的TT拆分基于VPDU约束来决定时,如,由于管线限制的最大允许的块尺寸。可以基于后续参数决定TT拆分是否被允许:
-三元拆分模式ttSplit
-亮度样本中的编码块宽度cbWidth
-亮度样本中的编码块高度cbHeigth
-所考虑编码块的左上亮度样本相对于图像的左上亮度样本的位置(x0,y0)
-多类型树深度mttDepth
-具有偏移的最大多类型树深度maxMttDepth
-最大三元树尺寸maxTtSize
-变数treeType指定单树(SINGLE_TREE)或双树是否用于分割编码树节点,以及当双树被使用时,亮度(DUAL_TREE_LUMA)或色度分量(DUAL_TREE_CHROMA)当前是否被处理。
-变数modeType指定帧内(MODE_INTRA)、IBC(MODE_IBC)以及帧间编码模式是否可以被使用(MODE_TYPE_ALL),或者是否仅帧内以及IBC编码模式可以被使用(MODE_TYPE_INTRA),或者是否仅帧间编码模式(MODE_TYPE_INTER)可以用于编码树节点内的编码单元。
这些参数用于决定变数“allowTtSplit”。根据以下,变数cbSize基于ttSplit来推导:
Figure BDA0003581961940000081
Figure BDA0003581961940000091
变数allowTtSplit根据后续来推导:(由MaxTbSizeY指示的VPDU尺寸)
-如果一个或多个后续条件为真,allowTtSplit被设置为FALSE:
-cbSize小于或等于2*MinTtSizeY
-cbWidth大于Min(MaxTbSizY,maxTtSize)
-cbHeight大于Min(MaxTbSizY,maxTtSize)
-mttDepth大于或等于maxMttDepth
-x0+cbWidth大于pic_width_in_luma_samples
-y0+cbHeight大于pic_height_in_luma_samples
-treeType等于DUAL_TREE_CHROMA以及(cbWidth/SubWidthC)*(cbHeight/SubHeightC)小于或等于32
-treeType等于DUAL_TREE_CHROMA以及(cbWidth/SubWidthC)等于8以及TTSplit等于SPLIT_TT_VER
-treeType等于DUAL_TREE_CHROMA以及modeType等于MODE_TYPE_INTRA
-cbWidth*cbHeight等于64以及modeType等于MODE_TYPE_INTER
-否则,允许TTSplit被设置为等于TRUE。
在一些实施例中,涉及CU分割结构的高层级语法参数基于管线处理的限制来指定,即,当分割CU时实施VPDU相关的约束(如,最大允许的块尺寸)。在一些实施例中,视频编解码系统可以包括一个或多个语法元素用于推导最大允许的块尺寸的值用于在相关的数据结构中启用TT拆分。
在一些实施例中,用于启用TT拆分的最大允许的块尺寸的值被约束用于比特流一致性需求。因此,为了决定TT拆分对当前CU是否是允许的,视频编解码系统可以仅测试当前CU的宽度或高度是否大于用于启用TT拆分的最大允许的块尺寸,以及不进一步测试用于每一当前CU的VPDU尺寸。例如,当VPDU尺寸等于64时,视频编解码系统可以约束在比特流中发信的用于启用TT拆分的最大允许的块尺寸小于或等于64。
在一些实施例中,参数maxTtSize被约束为小于或等于64,其中变数maxTtSize从指示用于启用TT拆分的最大允许的块尺寸的一个或多个已编码语法元素值来推导。在一些实施例中,变数maxTtSize从已编解码的高层级语法元素log2_diff_max_tt_min_t来推导,根据:
maxTtSize=1<<(log2_diff_max_tt_min_tt+log2MinMaxTT)
在log2_diff_tt_min_tt的最大允许值等于Min(6,CtbLog2SizeY)-log2MinMaxTT的约束下。变数log2MinMaxTT指示最大TT尺寸的允许的最小值的底为2的对数以及CtbLog2SizeY指示所指定的CTB尺寸的底为2的对数。
决定TT拆分是否被允许用于当前CU的进程可以被进一步简化。因此,变数allowTtSplict被推导如下:
-如果一个或多个下列条件为真,allowTtSplit被设置为等于FALSE:
-cbsize小于或等于2*MinTtSizeY
-cbheight大于maxTtSize
-cbheight大于maxTtSize
-mttDepth大于或等于maxMttDepth
-x0+cbWidth大于pic_width_in_luma_samples
-y0+cbHeight大于pic_height_in_luma_samples
-treeType等于DUAL_TREE_CHROMA以及(cbWidth/SubWidthC)*(cbHeight/SubHeightC)小于或等于32
-treeType等于DUAL_TREE_CHROMA以及(cbwidth/subwidthC)等于8以及ttSplit等于SPLIT_TT_VER
-treeType等于DUAL_TREE_CHROMA以及modeType等于MODE_TYPE_INTRA
-cbWidth*cbHeight等于64以及modetype等于MODE_TYPE_INTER
-否则,allowTtSplit被设置为等于TRUE。
为了满足VDPU约束,在一些实施例中,变数minQtSizeY以及minQtSizeC从分别指示最小允许的块尺寸用于亮度以及色度的QT叶节点的一个或多个已编码语法元素值来推导,当帧内双树模式被启用时,变数minQtSizeY以及minQtSizeC的值在帧内条带中被约束为小于或等于64。在一些实施例中,当帧内双树模式被启用时,变数minQtSizeY以及minQtSizeC的值在帧内条带中被约束为小于或等于Min(64,CtbSizeY),其中变数minQtSizeY以及minQtSizeC从分别为亮度以及色度指示亮度样本的最小允许的块尺寸拥有QT叶节点的一个或多个已编解码的语法元素值来推导,以及变数CtbSizeY指示已编解码视频序列中亮度样本中的CTB尺寸。
在一些实施例中,当帧内双树模式被启用时,尺寸大于64的当前CU可以被进一步拆分成多个较小的CU,每一者被包含于由四叉树拆分的VPDU区域内。
在一些实施例中,变数minQtSizeY以及minQtSizeC的值被约束为小于或等于Min(64,CtbSizeY)用于所有条带类型。因此,当尺寸大于64的当前CU部分交叉(或跨越交叉)右边或底部图像边界时,当前CU可以被进一步由四叉树拆分来拆分成多个较小的CU。
III.分割深度的约束
在一些实施例中,与最大MTT深度相关的约束参数被指定。约束参数用于基于具有使用二元拆分与/或三元拆分的嵌入式多类型树的四叉树控制CU分割结构。根据本发明的一方面,当最小QT尺寸大于最小编码块尺寸时,最大MTT深度被约束为大于0。在一些实施例中,当最小QT尺寸大于最小编码块尺寸时,最大MTT深度被约束为大于0。
在一些实施例中,SPS语法元素log2_ctu_size_minus5加5指定每一CTU的亮度编码树块尺寸(的底为2的对数)。根据以下,语法元素log2_ctu_size_minus5可以用于推导ctblog2SizeY以及ctbSizeY:
CtbLog2SizeY=log2_ctu_size_minus5+5
CtbSizeY=1<<CtbLog2SizeY
在一些实施例中,SPS语法元素log2_min_luma_coding_block_size_minus加2指定最小亮度编码块尺寸的底为2的对数。语法元素log2_min_luna_coding_block_size_minus2可以用于推导亮度样本中CB的最小尺寸,标记为MinCbLog2SizeY或MinCbSizeY。在一些实施例中,MinCbSizeY被约束为小于或等于Min(64,CtbSizeY)。MinCbLog2SizeY以及MinCbSizeY可以根据以下来推导:
MinCbLog2SizeY=log2_min_luma_coding__block_size_minus2+2
MinCbSizeY=1<<MinCbLog2SizeY
在一些实施例中,条带标头(SH)语法元素slice_log2_diff_qt_min_cb_luma指定从CTU的QT拆分生成的亮度也块的亮度样本中最小尺寸的底为2对数与当前条带中用于亮度CU的亮度样本的最小编码块尺寸的底为2对数之间的差异。
在一些实施例中,条带标头(slice header,SH)语法元素slice_max_mtt_hierarchy_depth_luma指定从当前条带的四叉树叶的多类型树拆分生成的编码单元的最大层次深度。当slice_max_mtt_hierarchy_depth_luma为非0时,语法元素slice_log2_diff_max_bt_min_qt_luma以及slice_log2_diff_max_tt_min_qt_luma在当前条带标头中被编解码。条带标头语法元素slice_log2_diff_max_bt_min_qt_luma指定可以使用二元拆分来拆分的亮度编码块的最大尺寸(宽度或高度)(或底为2的对数)与从当前条带中CTU的四叉树拆分生成的亮度叶块的最小尺寸(亮度样本中的宽度或高度)(底为2的对数)之间的差异。SH语法元素slice_log2_diff_max_tt_min_qt_luma指定可以使用三元拆分来拆分的亮度编码块的最大尺寸(亮度样本中的宽度或高度)(的底为2的对数)与从当前条带中CTU的四叉树拆分生成的亮度叶块的最小尺寸(亮度样本中的宽度或高度)(的底为2的对数)之间的差异。
变数MinQtLog2SizeY或者MinQtSizeY指示从CTU的QT拆分生成的亮度叶块的亮度样本的最小尺寸。
slice_log2_diff_max_bt_min_qt_luma以及
slice_log2_diff_max_tt_min_qt_luma的值被约束为0到CtbLog2SizeY-MinQtLog2SizeY的范围,包括0以及CtbLog2SizeY-MinQtLog2SizeY。MinQtSizeY被约束为(MinCbSizeY,Min(64,CtbSizeY))的范围,包括MinCbSizeY以及Min(64,CtbSizeY)。
语法元素slice_log2_diff_min_qt_min_cb_luma可以用于根据如下推导MinQtLog2SizeY以及MinQtSizeY:
MinQtLog2SizeY=MinCbLog2SizeY+slice_log2_diff_min_qt_min_cb_luma
MinQtSizeY=1<<MinQtLog2SizeY
因为MinQtSizeY的值被约束在(MinCbSizeY,Min(64,CtbSizeY))的范围内,slice_log2_diff_min_qt_min_cb_luma的范围是0到Min(6,CtbLog2SizeY)-MinCbLog2SizeY,包括0以及Min(6,CtbLog2SizeY)-MinCbLog2SizeY。
变数MaxBtSizeY指示可以使用二元拆分来拆分的亮度编码块的亮度样本中的最大尺寸。变数MaxBtSizeY被推导如下:
MaxBtSizeY=1<<(MinQtLog2SizeY+slice_log2_diff_max_bt_min_qt_luma)
在一些实施例中,最大BT尺寸被约束为大于或等于最小QT尺寸。这样,当当前编码块(作为分割的结果)达到最小QT尺寸时,编码块可以被进一步递归地使用二元拆分来分割直到当前编码块等于最小编码块尺寸。在一些实施例中,最大TT尺寸被约束为大于或等于最小QT尺寸。这样,当当前编码块(作为分割的结果)达到最小QT尺寸时,编码块可以被进一步反覆运算地使用三元拆分来分割直到当前编码块等于最小编码块尺寸。
变数MaxTtSizeY指示可以使用三元拆分来拆分的亮度编码块的亮度样本的最大尺寸。变数MaxTtSizeY可以从语法元素
slice_log2_diff_max_tt_min_qt_luma来推导,如下:
MaxTtSizeY=1<<(MinQtLog2SizeY+slice_log2_diff_max_tt_min_qt_luma)
因为MaxTtSizeY在MinQtSize到Min(64,CtbSizeY)的范围内,slice_log2_diff_max_tt_min_qt_luma在0到Min(6,CtbLog2SizeY)-MinQtLog2SizeY的范围内。
在一些实施例中,条带标头语法元素slice_log2_diff_min_qt_min_cb_chroma、slice_log2_diff_max_bt_min_qt_chroma以及slice_log2_diff_max_tt_min_qt_chroma分别指定色度编码块的最小QT尺寸、最大BT尺寸以及最大TT尺寸(以亮度样本为单位)。在一些实施例中,这三个SH语法元素的预设值由SPS中相关对应的语法元素指定。例如,在一些实施例中,可以有对应的SPS参数sps_log2_diff_min_qt_min_cb_chroma、sps_log2_diff_max_bt_min_qt_chroma以及sps_log2_djff_max_tt_min_qt_chroma在SPS层级分别指定色度编码块的的最小QT尺寸、最大BT尺寸以及最大TT尺寸(以亮度样本为单位)。
在一些实施例中,所推导的最大BT尺寸以及最大TT尺寸可以大于或等于最小QT尺寸。因此,当当前编码块达到最小QT尺寸以及二元或三元拆分被启用时,当前编码块可以使用二元或三元拆分被进一步递归地分割直到当前编码块等于最小编码块尺寸。然而,当slice_max_mtt_hierarchy_depth_luma等于0时,二元拆分以及三元拆分都被禁用。在一些实施例中,如果最小QT尺寸大于最小编码块尺寸,没有编码块可以被拆分成最小编码块,因为这可以对分割沿着图像边界的CU造成问题,其中每一超出边界的CU需要被进一步反覆运算地分割直到整个CU在图像边界内。在一些实施例中,当slice_log2_diff_min_qt_min_cb_luma为非0时,syntaxslice_max_mtt_hierarchy_depth_luma被约束为大于0。
图8概念地示出了用于控制像素块800的分割结构的约束参数。像素块800可以使用QT以及MTT两者分割的CTU。图式一起示出了CTU 800以及示出CTU 800的部分分割结构的树810。
CTU 800的尺寸是128×128。CTU 800被约束为不允许MTT(如,TT)拆分用于尺寸大于64的分割。换言之,MTT拆分不允许用于CTU 800,但MTT拆分被允许用于64×64或更小的CTU 800的QT拆分。为了确保每一VPDU可以由相同的管线阶段完整地处理,MTT的这一最大允许块尺寸可以基于VPDU的尺寸来决定。
通过参考QT叶的最小尺寸(变数minQTSizeY)用于TI的最大允许尺寸(如,变数MaxBtSizeY或MaxTtSizeY)也可以被发信,例如,用于MTT的最大允许尺寸可以表达为MaxTtSizeY的底为2的对数与MinQtSizeY的底为2对数之间的差异,如slice_log2_diff_max_tt_min_qt_luma或者图像标头或SPS中对应讯号。QT叶的最小尺寸可以通过参考CB的最小尺寸(变数MinCbSizeY)来发信。例如,QT叶的最小尺寸可以被变大为MinQtSizeY的底为2对数与MinCbSizeY的底为2的对数之间的差异,如slice_log2_diff_min_qt_min_cb_luma或者图像标头或SPS中对应的讯号。
IV.发信块分割结构
在一些实施例中,关于最大MTT深度的资讯基于最小QT尺寸的底为2的对数与最小编码块尺寸的底为2的对数之间的差异来发信。在一些实施例中,MaxMttDepthY指示从四叉树叶的多类型树拆分生成的编码单元的最大层次深度在(0,2*(CtbLog2SizeY-MinCbLog2SizeY))的范围内,包括0以及2*(CtbLog2SizeY-MinCbLog2SizeY)。变数MaxMttDepthY可以被推导如下:
MaxMttDepthY=slice_max_mtt_hierarchy_depth_luma+((1+slice_log2_diff_min_qt_min_cb_luma)>>1).
在一些实施例中,用于控制CU分割结构的约束参数被指定。在一些实施例中,当当前编码块达到(或具有)最小QT尺寸时,只要至少一个MTT拆分类型(BT以及TT)仍被启用,其被允许被进一步递归地拆分直到最小编码块尺寸。视频编码器可以发信最大BT尺寸或最大TT尺寸为小于最小QT尺寸,当当前MTT深度为非0时,其中至少一个最大BT尺寸以及最大TT尺寸被约束为大于或等于最小QT尺寸。因此,所指定的MTT结构可以禁用MTT拆分类型之一用于大于尺寸约束的编码块,尺寸约束为小于最小QT尺寸。具体地,通过指定对应的尺寸约束等于最小编码块尺寸,视频编码器可以禁用仅一个MTT类型。
在一些实施例中,发信第一MTT类型的最大尺寸的第一语法元素指定该第一MTT类型的亮度样本中最大尺寸(的底为2的对数)与当前条带中亮度CU的亮度样本中最小编解码块尺寸(的底为2的对数)之间的差异。当第一MTT类型的最大尺寸小于最小QT尺寸以及该最小QT尺寸大于最小编码块尺寸时,发信第二MTT类型的最大尺寸的第二语法元素指定该第一MTT类型的亮度样本中最大尺寸(的底为2的对数)与从当前条带的CTU的四叉树拆分生成的亮度叶块的亮度样本中最小尺寸(宽度或高度)(的底为2的对数)之间的差异。否则发信第二MTT类型的最大尺寸的第二语法元素指定第二MTT类型的亮度样本中最大尺寸(的底为2的对数)与当前条带中亮度CU的亮度样本中最小编码块尺寸(的底为2的对数)之间的差异。
表1提供了用于指定块分割结构的条带标头(SH)的示例性语法表。语法允许所指定的最大尺寸小于最小QT尺寸的一个MTT类型。
表1
Figure BDA0003581961940000171
变数MaxBtSizeY以及MaxTtSizeY根据如下来推导:
MaxBtSizeY=1<<(MinCbLog2SizeY+slice_log2_max_bt_luma)
MaxTtSizeY=1<<
(((MaxBtSizeY<MinQtSizeY&&MinQtLog2SizeY>MinCbLog2SizeY)?MinQtLog2SizeY:MinCbLog2SizeY)+slice_log2_max_tt_luma).
在一些其他实施例中,变数MaxBtSizeY以及MaxTtSizeY根据如下来推导:
MaxBtSizeY=1<<(MinCbLog2SizeY+slice_log2_max_bt_luma)
MaxTtSizeY=1<<(((MaxBtSizeY<MinQtSizeY)?
MinQtLog2SizeY:MinCbLog2SizeY)+slice_log2_max_tt_luma).
在一些其他实施例中,发信第一MTT类型的最大尺寸的第一语法元素指定该第一MTT类型的亮度样本的最大尺寸的底为2的对数与当前条带中亮度CU的亮度样本中最小编码块尺寸的底为2的对数之间的差异。发信第二MTT类型的最大尺寸的第二语法元素指定第二MTT类型的亮度样本中最大尺寸的底为2的对数与当前条带中亮度CU的亮度样本中最小编码块尺寸的底为2的对数。变数MaxBtSizeY以及MaxTtSizeY根据如下来推导:
MaxBtSizeY=1<<(MinCbLog2SizeY+sice_log2_max_bt_luma)
MaxTtSizeY=1<<(MinCbLog2SizeY+slice_log2_max_tt_luma)
在一些实施例中,MaxBtSizeY变数MaxBtSizeY以及的至少一个值被约束为大于或等于MinQtSizeY。
值得注意的是,当双树分割模式被启用时(qtbtt_dual_tree_intra_flagequal等于1),所提出的方法以及相关实施例可以被进一步应用来指定其他相关语法元素来在帧内条带的条带标头中发信最大BT尺寸以及最大TT尺寸用于拆分色度编解码块。所提出的方法以及相关实施例可以被进一步应用来指定其他相关语法元素来在SPS中发信默认最大BT尺寸以及默认最大TT尺寸。
在一些实施例中,当当前编码块达到最小QT尺寸时,其被允许被进一步递归地分割直到达到最小编码块尺寸(由如:启用二元或三元拆分用于编码块尺寸小于或等于最小QT尺寸而对二元或三元拆分的最大尺寸没有任何约束)。在一些实施例中,在最大BT尺寸大于或等于最小QT尺寸的约束下,视频编码器可以发信最大TT尺寸小于最小QT尺寸。因此,所指定的MTT结构可以禁用尺寸大于所指定尺寸约束的编码块的三元拆分,即小于最小QT尺寸。具体地,通过指定对应的最大尺寸约束为等于最小编码块尺寸,视频编码器可以有效地禁用三元拆分。
在一些实施例中,发信二元拆分类型的最大尺寸的语法元素指定可以使用二元拆分来拆分的亮度编码块(亮度样本)的最大尺寸(底为2的对数)与亮度叶块(其从当前条带的CTU的四叉树拆分来生成)的最小编码块尺寸(亮度样本的宽度或高度)(底为2的对数)的差异。发信三元类型的最大尺寸的另一个语法元素指定可以使用三元拆分来拆分的亮度编码块的最大尺寸(亮度样本的宽度或高度)(底为2的对数)与当前条带中亮度CU的亮度样本的最小块尺寸(底为2的对数)之间的差异。表2提供了可以支援所指定最大尺寸小于最小QT尺寸的三元拆分类型的条带标头的示例性语法表。
表2
Figure BDA0003581961940000191
Figure BDA0003581961940000201
变数MaxBtSizeY指示允许BT拆分的亮度CB的最大尺寸。变数MaxTtSizeY指示允许TT拆分的亮度CB的最大尺寸。MaxBtSizeY以及MaxTtSizeY在MinQtSize到Min(64,CtbSizeY)的范围内,包括MinQtSize以及Min(64,CtbSizeY)。MaxBtSizeY以及MaxTtSizeY被推导如下:
MaxBtSizeY=1<<(MinQtLog2SizeY+slice_log2_diff_max_bt_min_qt_luma)
MaxTtSizeY=1<<(MinCbLog2SizeY+slice_log2_diff_min_tt_min_cb_luma).
变数MaxBtSizeC指示允许BT拆分的色度CB的最大尺寸。变数MaxTtSizeY指示允许TT拆分的色度CB的最大尺寸。变数MaxBtSizeC以及MaxTtSizeC被推导如下:
MaxBtSizeC=1<<(MinQtLog2SizeC+slice_log2_diff_max_bt_min_qt_chroma)
MaxTtSizeC=1<<(MinCbLog2SizeY+slice_log2_diff_min_tt_min_cb_chroma)
值得注意的是,当双树分割模式被启用时(qtbtt_dual_tree_intra_flag等于1),节II到IV中描述的方法以及相关的实施例可以被进一步应用于其他相关语法元素用于在帧内条带的条带标头中发信推导最大MTT深度的资讯,来拆分色度编码块。所提出的方案可以被进一步应用于在图像标头发信相关约束参数。所提出的方案以及相关实施例也可以被应用于其他相关语法元素用于在SPS发信推导预设最大MTT深度的资讯。例如,有对应于条带标头参数的图像标头参数以及SPS参数,如在序列或图像层级设置预设值用于这些参数的slice_log2_diff_max_tt_min_qt_luma以及slice_log2_diff_min_qt_min_cb_luma。
任何前述提出的方案可以在编码器与/或解码器中实施。例如,任何提出的方法可以在编码器的熵编码(或高层级语法编码)模组,与/或解码器的熵解码(或高层级语法解码)模组中实施。或者,任何前述提出的方法可以被实施为集成到编码器的熵编码(或高层级语法编码)模组与/或解码器的熵解码(或高层级语法解码)模组的电路。任何前述提出的方法也可以在图像编码器与/或解码器中实施,其中所生成的比特流对应于仅使用帧内图像预测的一个已编解码帧。
V.示例性视频编码器
图9示出了发信关于块分割的约束的示例性视频编码器900。如图所示,视频编码器900从视频源905接收输入视频讯号以及将讯号编码进比特流995。视频编码器900具有用于编码来自视频源905的讯号的各种元件或模组,至少包括从变换模组910、量化模组911、逆量化模组914、逆变换模组915、帧内图像估计模组920、帧内预测模组925、运动补偿模组930、运动估计模组935、环路滤波器945、重构图像缓冲器950、MV缓冲器965、MV预测模组975以及熵编码器990中选择的一些元件。运动补偿模组930以及运动估计模组935是帧间预测模组940的一部分。
在一些实施例中,模组910-990是由计算装置或电子装置的一个或多个处理单元(如,处理器)执行的软体指令的模组。在一些实施例中,模组910-990是由电子装置的一个或多个积体电路(IC)实施的硬体电路的模组。虽然模组910-990被示出为分离的模组,一些模组可以被组合成单个模组。
视频源905提供表示未经压缩的每一视频帧的像素数据的原始视频讯号。减法器908计算视频源905的原始视频像素数据与来自运动补偿模组930或帧内预测模组925的已预测像素数据913之间的差异。变换模组910将该差异(或残差像素数据或残差讯号909)变换成变换系数(如,通过执行离散余弦变换,或DCT)。量化模组911将该变换系数量化成已量化数据(或已量化系数)912,其由熵编码器990编码进比特流995。
逆量化模组914解量化已量化的数据(或已量化的系数)912来获得变换系数,以及该逆变换模组915对该变换系数执行逆变换来生成重构的残差919。重构的残差919与已预测像素数据913相加来生成重构的像素数据917。在一些实施例中,重构的像素数据917被暂时地存储在线性缓冲器(未示出)中用于帧内图像预测以及空间MV预测。重构的像素由环路滤波器945进行滤波以及被存储于重构图像缓冲器950中。在一些实施例中,重构图像缓冲器950是视频编码器900的外部存储区。在一些实施例中,重构图像缓冲器950是视频编码器900的内部存储区。
帧内图像估计模组920基于重构的像素数据917执行帧内预测来生成帧内预测数据。帧内预测数据被提供给熵编码器990来被编码进比特流995。帧内预测数据也由帧内预测模组925使用来生成已预测像素数据913。
运动估计模组935通过生成MV来参数存储于重构图像缓冲器950中的先前已解码帧的像素数据来执行帧间预测。这些MV被提供给运动补偿模组930来生成已预测像素数据。
视频编码器900使用MV预测来生成已预测MV而不是在比特流中编码完整实际的MV,以及用于运动补偿的MV与已预测MV之间的差异被编码为残差运动数据以及被存储于比特流995中。
MV预测模组975基于被生成用于编码先前视频帧的参考MV(即用于执行运动补偿的运动补偿MV)来生成已预测MV。MV预测模组975从来自MV缓冲器965的先前视频帧检索参考MV。视频解码器900在MV缓冲器965中存储为当前视频帧生成的MV作为用于生成已预测MV的参考MV。
MV预测模组975使用参考MV来创造已预测MV。该已预测MV可以由空间MV预测或时间MV预测来计算。已预测MV与当前帧的运动补偿MY(MC MY)之间的差异由熵编码器990编码进比特流995。
通过使用如上下文自我调整二进位算术编码(CABAC)或霍夫曼编码的熵编码技术,熵编码器990将各种参数以及数据编码进比特流995。熵编码器990将各种标头元素、旗标与已量化的变换系数912以及残差运动数据集作为语法元素一起编码进比特流995。比特流995反过来被存储于储存装置或通过如网路的通信媒介被传输到解码器。
环路滤波器945对重构的像素数据执行滤波或光滑操作来减少编码解的伪影,尤其是在像素块的边界。在一些实施例中,所执行的滤波操作包括样本适应性偏移(SAO)。实施例中,滤波操作包括适应性环路滤波器(ALF)。
图10示出了实施块分割约束的视频编码器900。特别地,分割引擎1010基于硬体约束(如,VPDU尺寸)以及率/失真资讯1015的集合生成分割约束1020的集合用于熵编码器990。熵编码器990编码或发信分割约束1020的集合到比特流995。分割约束1020可以包括在视频层级(如,序列、图像、条带、块)的不同层级适用的约束以及由熵编码器990在条带标头、图像标头、SPS等中被发信。分割约束1020可以包括最大MTT块尺寸、最小QT叶尺寸等。分割引擎1010也提供分割结构1030到变换模组910以致变换模组可以根据分割结构1030对被编解码的像素的当前块(如,CTU)执行变换操作。
图11概念地示出了用于发信块分割约束的进程1100。在一些实施例中,计算装置的一个或多个处理单元(如,处理器)实施编码器900,通过执行存储于电脑可读媒介中的指令执行进程1100。在一些实施例中,实施解码器900的电子装置执行进程1100。
编码器发信(在块1110)在比特流中分割控制参数,指定用于启用三元树拆分的最大块尺寸被约束为64或更小。
在一些实施例中,在包括当前块的条带的条带标头中发信的分割控制参数。分割控制参数可以在当前图像的图像标头中发信。分割控制参数可以在包括当前图像的视频图像的序列的序列参数集(SPS)中被发信。在一些实施例中,SPS或图像标头设置分割控制参数的预设值,其可以由包括当前块的条带标头覆写。
在一些实施例中,分割控制参数通过参考四叉树拆分叶块的最小尺寸指定最大块尺寸,例如,作为(i)块可以进一步由三元树拆分来分割的最大块尺寸的底为2的对数以及(ii)四叉树拆分叶块的最小尺寸的底为2的对数之间的差异。四叉树拆分叶块的最小尺寸被约束为64与编码树块尺寸之间的较小值。用于启用TT拆分的最大块尺寸被进一步约束为小于编码树块尺寸。
四叉树叶块尺寸的最小尺寸可以通过参考最小编码块尺寸来指定,以及四叉树拆分叶块的最小尺寸由使用(i)四叉树拆分叶块的最小尺寸的底为2对数与(ii)最小编码块尺寸的底为2对数之间的差异来指定。
在一些实施例中,基于虚拟管线数据单元(VPDU)的尺寸决定最大块尺寸,以及基于确保每一VPDU可以由相同的管线阶段完全处理来定义最大块尺寸。
编码器(在块1120)接收待编码进比特流中的视频的当前图像的当前块的原始像素数据。
编码器将当前块递归地拆分(在块1130)成一个或多个分割。除非分割小于或等于最大块尺寸,编码器不允许(在块1135)TT拆分用于当前块的分割,除非该分割小于或等于最大块尺寸。
编码器(在块1140)将当前块的一个或多个分割编码进比特流。
VI.示例性视频编码器
图12示出了应用约束到块分割的示例性视频解码器1200。如图所示,视频解码器1200是接收比特流1295以及将比特流的内容解码成视频帧的像素数据用于显示的图像解码或视频解码电路。视频解码器1200具有用于解码比特流1295的多个元件或模组,包括从逆量化模组1211、逆变换模组1210、帧内预测模组1225、运动补偿模组1230、环路滤波器1245、解码图像缓冲器1250、MV缓冲器1265、MV预测模组1275以及解析器1290选择的一些元件。运动补偿模组1230是帧间预测模组1240的一部分。
在一些实施例中,模组1210-1290是由计算装置的一个或多个处理单元(如,处理器)执行的软体指令的模组。在一些实施例中,模组1210-1290是由电子装置的一个或多个IC实施的硬体电路的模组。虽然模组1210-1290被示出为分离的模组,一些模组可以被组合成单个模组。
解析器1290(或熵解码器)根据由视频编解码或图像编解码标准定义到的语法执行初始解析。所解析的语法元素包括各种标头元素、旗标以及已量化数据(或已量化系数)1212。解析器1290通过使用如上下文适应性算术编解码(CABAC)或霍夫曼编码的熵编码技术解析出各种语法元素。
逆量化模组1211解量化已量化的数据(或已量化系数)1212来获得变换系数,以及逆变换模组1210对变换系数执行逆变换来生成重构的参数讯号1219。重构的残差讯号1219与来自帧内预测模组1225或运动补偿模组1230的已预测像素数据1213相加来生成已解码像素数据1217。已解码像素数据由环路滤波器1245进行滤波并存储于解码图像缓冲器1250中。在一些实施例中,解码图像缓冲器1250是视频解码器1200的外部储存区。在一些实施例中,解码图像缓冲器1250是视频解码器1200的内部储存区。
帧内预测模组1225从比特流1295接收帧内预测数据并根据其,从存储于解码图像缓冲器1250的已解码像素数据1217生成已预测像素数据1213。在一些实施例中,解码像素数据1217也被存储于线性缓冲器(未示出)用于帧内图像预测以及空间MV预测。
在一些实施例中,解码图像缓冲器1250的内容用于显示。显示装置1255检索解码图像缓冲器1250的内容直接用于显示或者检索解码图像缓冲器的内容到显示缓冲器。在一些实施例中,显示装置通过像素传输接收来自解码图像缓冲器1250的像素值。
运动补偿模组1230根据运动补偿MV(MC MY)从存储于解码图像缓冲器1250的解码像素数据1217生成已预测像素数据1213。通过将来自比特流1295的残差运动数据与来自MV预测模组1275的已预测MV相加解码这些运动补偿MV。
MV预测模组1275基于被生成用于解码先前视频帧的参考MV生成已预测MV,如运动补偿MV用于执行运动补偿。MV预测模组1275从MV缓冲器1265检索先前视频帧的参考MV。视频解码器1200将为解码当前视频帧生成的运动补偿MV存储于MV缓冲器1265作为用于生成已预测MV的参考MV。
环路滤波器对已解码像素数据1217执行滤波或光滑操作来减少编解码的伪影,尤其在像素块的边界。在一些实施例中,所执行的滤波操作包括样本适应性偏移(SAO)。在一些实施例中,滤波操作包括适应性环路滤波(ALF)。
图13示出了实施块分割约束的视频解码器1200的部分。特别地,熵解码器1290从比特流1295解析与块分割相关的语法元素以及生成分割约束1320的集合。分割约束可以包括在视频层次(如,序列、图像、条带、块)的不同层级适用的约束以及可以在条带标头、图像标头、SPS等中被发信。分割约束1320可以包括最大MTT块尺寸、最小QT叶尺寸等。根据分割约束1320,解码器可以不允许超出最大块尺寸的某些拆分模式。
所生成的分割约束1320被应用于分割引擎1310,其生成分割结构1330用于逆变换模组1210以致其可以根据分割结构对单个分割(如,CU)执行逆变换操作。
图14概念地示出了应用块分割约束的进程1400。在一些实施例,计算装置的一个或多个处理单元(如,处理器)实施解码器来通过执行存储与电脑可读媒介中的执行来执行进程1400。在一些实施例中,实施解码器1200的电子装置执行进程1400。
解码器(在块1410)从比特流接收分割控制参数,指定用于启用三元树(TT)拆分的最大块尺寸。在一些实施例中,该最大块尺寸被约束为64或更小。
在一些实施例中,在包括当前块的条带的条带标头中发信分割控制参数。该分割控制参数可以在该当前图像的一图像标头中被发信。该分割控制参数可以在包括该当前图像的视频图像的序列的序列参数集(SPS)中被发信。在一些实施例中,SPS或图像标头设置分割控制参数的预设值,其可以由包括当前块的条带标头来覆写。
在一些实施例中,通过参考四叉树拆分叶块的最小尺寸,分割控制参数指定最大块尺寸,例如通过使用(i)块可以由三元树拆分来进一步分割的最大块尺寸的底为2的对数与(ii)四叉树拆分叶块的最小尺寸的底为2的对数之间的差异。四叉树拆分叶块的最小尺寸被约束为64与编码树块尺寸之间的较小值。用于启用TT拆分的最大块尺寸可以进一步被约束为小于编码树块尺寸。
四叉树拆分叶块的最小尺寸可以通过参考最小编码块尺寸来指定,以及四叉树拆分叶块的最小尺寸通过使用(i)四叉树拆分叶块的最小尺寸的底为2的度数与(ii)该最小编码块尺寸的底为2的对数之间的差异来指定。
在一些实施例中,基于虚拟管线数据单元(VPDU)的尺寸决定最大块尺寸,以及基于确保每一VPDU可以由相同的管线阶段完整地处理来定义最大块尺寸。
在一些实施例中,在包括当前块的条带的条带标头中发信分割控制参数。该分割控制参数可以在当前图像的图像标头中被发信。该分割控制参数可以在包括当前图像的视频图像的序列的序列参数集合(SPS)中被发信。在一些实施例中,SPS或图像标头设置用于分割控制参数的预设值,其可以由包括当前块的条带标头来覆写。
解码器(在块1420)从比特流接收待解码为视频的当前图像的当前块的像素块。
解码器(在块1430)将当前块递归地拆分成一个或多个分割。解码器(在块1435)禁用TT拆分用于当前块的分割除非该分割小于或等于最大块尺寸。
解码器(在块1440)重构该当前块的一个或多个分割。
在一些实施例中,编码器可以在比特流中发信(或生成)一个或多个语法元素,以致解码器可以从比特流解析该一个或多个语法元素。
VII.示例性电子系统
许多上述描述的特征以及应用被实施为软体进程,其被指定为记录在电脑可读储存媒介(也称为电脑可读媒介)上的一组指令。当这些指令由一个或多个计算或处理单元(如,一个或多个处理器、处理器核心或其他处理单元)执行时,使得处理单元执行指令中所指示的动作。电脑可读媒介的示例包括但不限于CD-ROM、快速驱动器、随机存取记忆体(RAM)晶片、硬碟驱动器、可擦可程式设计唯读记忆体(EPROM)、电可擦可程式设计唯读记忆体(EEPROM)等。电脑可读媒介不包括无线传输或在有线连接上传输的载波以及电子讯号。
在本说明书中,术语“软体”意为包括驻留于唯读记忆体中的固件或者存储与磁存储中的应用,其可以被读取到记忆体由处理器进行处理。另外,在一些实施例中,多个软体发明可以被实施为较大成的子部分而保留软体发明的独立性。在一些实施例中,多个软体发明也可以被实施为分离的程式。最后,分离程式的任何组合与本文所描述的软体发明一起都在本发明的范围内。在一些实施例中,当被安装来操作一个或多个电子系统时,软体成定义一个或多个特定机器实施方式,其执行以及允许软体程式的操作。
图15概念地示出了可以实施本发明的一些实施例的电子系统1500。电子系统1500可以是电脑(如,台式电脑、个人电脑、平板电脑等)、电话、PDA或者任何合适的电子装置。这种电子装置包括各种类型的电脑可读媒介自己介面用于各种其他类型的电脑可读媒介。电子系统1500包括汇流排1505、处理单元1510、影像处理单元(GPU)1515、系统记忆体1520、网路1525、唯读记忆体1530、永久储存装置1535、输入装置1540以及输出装置1545。
汇流排1505共同表示通信地连接电子系统1500的多个内部装置的所有系统、周边设备以及晶片集汇流排。例如,汇流排1505通信地连接处理单元1510、GPU 1515、唯读记忆体1530、系统记忆体1520以及永久储存装置1535。
从这些各种存储单元,处理单元1510检索待执行的指令以及待处理的数据以执行本发明的进程。处理单元在不同实施例中可以是单个处理器或者多核处理器。一些实施例被传输以及由GPU 1515来执行。GPU 1515可以分担由处理器单元1510提供的各种计算或完成影像处理。
唯读记忆体(ROM)存储由处理单元1510以及电子系统的其他模组使用的静态数据以及指令。另一方面,永久储存装置1535是读写存储装置。该装置是非即使电子系统1500关闭时存储指令以及数据的易失性存储单元。本发明的一些实施例使用大容量储存装置(如磁或光碟以及其对应的硬碟驱动)作为永久储存装置1535。
其他实施例使用可以移除储存装置(如软碟、快速储存装置等以及其对应的硬碟驱动器)作为永久储存装置。像永久储存装置1535,系统记忆体1520是读写存储装置。然而,不像储存装置1535、系统记忆体1520是挥发性读写记忆体,如随机存取记忆体。系统记忆体1520存储处理器在运行时使用的一些指令以及数据。在一些实施例中,根据本发明的进程被存储于系统记忆体1520、永久储存装置1535与/或唯读记忆体1530。例如,各种存储单元包括用于处理根据一些实施例的多媒体的指令。从这些记忆体单元,处理单元1510检索待执行的额指令以及待处理的数据来执行一些实施例的进程。
汇流排1505也连接到输入以及输出装置1540以及1545。输入装置1540使能使用者来通信资讯以及选择命令到电子系统。输入装置1540包括字母键盘以及定位装置(也称为游标控制装置)、摄像机(如,网路摄像机)、麦克风或语音接收声音命令的类似装置。输入装置1545显示由电子系统或其他输出数据生成的图像。输出装置1545包括印表机以及显示装置,如阴极射线管(CRT)或液晶显示幕(LCD)。以及扬声器或者类似的音讯输出装置。一些实施例包括如作为输入以及输出装置两者的触控式萤幕。
最终,如图15所示,汇流排1505也通过网路介面卡(未示出)将电子系统1500耦合到网路1525。以这种方式,电脑可以是电脑网路(如局域网(LAN)、广域网路(WAN)、或内联网或者网路的网路(如网际网路))的一部分。电子系统1500的任何或所有元件可以结合本发明来使用。
一些实施例包括电子元件,如微处理器、以及其可读存储电脑程式指令储存以及记忆体或电脑可读媒介(或者成为电脑可读储存媒介、及其可读媒介或机器可读储存媒介)。这种电脑可读媒介的一些示例包括RAM、ROM、唯读光碟(CD-ROM)、可记录光碟(CD-R)、可再写光碟(CD-RW)、唯读数位通用光碟(如,DVD-ROM、双层DVD-ROM)、各种可记录/可再写DVD(如,DVD-RAM、DVD-RW、DVD+RW等)、快速记忆体(如,SD卡、mini-SD卡、micro-SD卡等)、磁与/或固态硬碟驱动器、唯读以及可记录蓝光光碟、超密度光碟、任何其他光或磁媒介以及软碟。电脑可读媒介可以用存储由至少一个处理单元执行的电脑程式以及包括用于执行各种操作的指令的集合。电脑程式或电脑代码的示例包括机器代码,如由编译器生成的,以及包括由计算器、电子元件或使用注释器的微处理器执行的高层级代码的档。
虽然上述讨论优先指执行软体的微处理器或多核处理器,许多上述讨论的特征以及应用由一个或多个积体电路来执行,如专用积体电路(ASIC)或现场可程式设计闸阵列(FPGA)。在一些实施例中,这种积体电路执行存储于电路自身上的指令。此外,一些实施例执行存储于可程式设计逻辑装置(PLD)、ROM或RAM装置中的软体。
如说明书以及本申请的任何请求项中所使用的,术语“电脑”、“伺服器”、“处理器”以及“记忆体”都指电子或其他技术装置。这些术语不包括人或人群。出于说明的目的,术语显示意味着在电子装置上显示。如说明书以及本申请任何请求项中使用的,术语“电脑可读媒介”、“电脑可读媒体”以及“机器可读媒介”都被限制于以电脑可读形式存储资讯的有形的、物理物件。这些术语排除任何无线讯号、有线下载的讯号以及任何其他短暂讯号。
虽然本发明以及参考各种具体的细节进行描述,本领域具有通常知识者将能意识到本发明可以以其他具体的形式呈现而不背离本发明的精神。此外,一些图式(包括图11以及图14)概念地示出了进程。这些进程的具体的操作可以不以所示以及所描述的次序执行。具体的操作可以不以一个连续的操作来执行,以及不同具体操作可以在不同的实施例中执行。此外,进程可以使用各种子进程实施,或者作为较大巨集进程的一部分。因此,本领域具有通常知识者将能理解,本发明不由前述说明性的细节限制,而是由所附申请专利范围定义。
附注
本文所描述的主题有时示出了包括于不同其他元件或与其连接的不同元件。能够理解,这种描绘的架构仅是示例,以及事实上可以实施实现相同功能的许多其他的架构。概念上来说,实现相同功能的元件的任何安排是有效“关联的”以致实现所期望的功能。因此,本文组合来实现特定功能的任何两个元件可以被视为彼此“关联”以致实现所期望的功能,而不管架构或中间元件。同样地,如此关联的任何两个元件也可以被视为彼此“可操作地连接”或“可操作地耦合”来实现所期望的功能,以及能够如此关联的任何两个元件也可以被视为彼此“可操作地耦合”来实现所期望的功能。可操作地耦合的具体示例包括但不限于物理上可匹配与/或物理上交互的元件与/或无线地可了解与/或无线地交互的元件与/或逻辑地交互与/或逻辑可交互的元件。
此外,关于本文中实质上任何复数与/或单数术语的使用,本领域具有通常知识者的这些人可以根据上下文以及应用适当地将其从复数转换成单数与/或从单数转换成复数。为了清楚起见,这里可以明确阐述各种单数/复数置换。
此外,本领域技术人员表将能理解,通常,本文所使用的术语,尤其是所附申请专利范围中使用的术语(如所附申请专利范围的主体)通常意为“开放式”的术语,如,术语“包括(including)”应当被解释为“包括但不限于”,术语“具有”应当被解释为“至少具有”,术语“包括(includes)”应当被解释为“包括但不限于”等。本领域这些技术人员将能进一步理解,如果特定数目的所引申请专利范围的表述是有意的,这种意图将明确列举在申请专利范围中,以及没有这种表述的情况下这种意图不存在。例如,为了帮助理解,后续所附申请专利范围可以包含介绍性短语“至少一个”以及“一个或多个”的使用来介绍申请专利范围表述。然而,这种短语的使用不应该被解释为暗示由不定冠词“a”或“an”介绍的申请专利范围表述限制包含这种引入的申请专利范围表述的任何特定申请专利范围到仅包含一个这种表示的实施方式,即使当相同的申请专利范围包括介绍性短语“一个或多个”或“至少一个”以及如“a”或“an”的不定冠词,“a”与/或“an”应当被解释为意味着“至少一个”或“一个或多个”,相同的情况也适用于介绍申请专利范围表述的定冠词。此外,即使特定数目的所介绍申请专利范围表述被明确列举,本领域具有通常知识者将意识到,这种表述应当被解释为意味着至少一个所列举的数目,如没有其他修改的“两个表述”的纯表述意味着至少两个表述,或者两个或多个表述。此外,在使用类似于“至少一个A、B以及C等”的惯例的情况下,通常这种构造旨在本领域具有通常知识者将能理解该惯例,如“系统具有至少一个A、B以及C”将包括但不限于系统单独具有A、单独具有B、单独具有C、一起具有A与B、一起具有A与C、一起具有B与C,与/或一起具有A、B以及C等。在使用类似于“至少一个A、B或C”惯例的这些情况下,通常这种构造旨在本领域具有通常知识者将能够理解该惯例,如“系统具有至少一个A、B或C”将包括但不限于系统单独具有A、单独具有B、单独具有C、一起具有A与B、一起具有A与C、一起具有B与C,与/或一起具有A、B以及C等。本领域技术人员将能进一步理解,事实上在描述、申请专利范围或图示中,表示两个或多个可替换术语的任何分隔词与/或短语将被理解成考虑包括术语之一、术语任一个或者术语两者的可能性。例如,短语“A或B”将被理解成包括“A或B”或者“A与B”的可能性。
从上文可以理解,出于说明的目的,本发明的各种实施方式已经在此进行描述,以及在不背离本发明范围以及精神的情况下,可以进行各种修正。因此,本文所描述的各种实施方式不旨在被限制,真正的范围以及精神由后续申请专利范围来指示。

Claims (14)

1.一种解码方法,包括:
从一比特流中接收一分割控制参数,该分割控制参数指定用于启用三元树拆分的一最大块尺寸被约束为64或更小;
从待解码为一视频的一当前图像的一当前块的一像素块的一比特流接收数据;
将该当前块递归地拆分成一个或多个分割,其中三元树拆分不被允许用于该当前块的一分割除非该分割小于或等于该最大块尺寸;以及
重构该当前块的该一个或多个分割。
2.根据权利要求1所述的解码方法,其特征在于,该分割控制参数通过参考四叉树拆分叶块的一最小尺寸指定该最大块尺寸。
3.根据权利要求2所述的解码方法,其特征在于,通过使用(i)可以由三元树拆分进一步分割的一块的该最大块尺寸的底为2的对数与(ii)该四叉树拆分叶块的该最小尺寸的底为2的对数之间的差异指定该分割控制参数。
4.根据权利要求2所述的解码方法,其特征在于,该四叉树拆分叶块的该最小尺寸通过参考一最小编码块尺寸来指定。
5.根据权利要求4所述的解码方法,其特征在于,该四叉树拆分叶块的该最小尺寸通过使用(i)该四叉树拆分叶块的该最小尺寸的底为2的对数与(ii)该最小编码块尺寸的底为2的对数之间的差异来指定。
6.根据权利要求2所述的解码方法,其特征在于,该四叉树拆分叶块的该最小尺寸被约束为64与一编码树块尺寸之间的一较小值。
7.根据权利要求1所述的解码方法,其特征在于,用于启用TT拆分的该最大块尺寸被进一步约束为小于一编码树块尺寸。
8.根据权利要求1所述的解码方法,其特征在于,该最大块尺寸基于一虚拟管线数据单元(VPDU)的尺寸来决定。
9.根据权利要求7所述的解码方法,其特征在于,基于确保每一虚拟管线数据单元可以由一相同的管线阶段完整地处理来定义该最大块尺寸。
10.根据权利要求1所述的解码方法,其特征在于,该分割控制参数在包括该当前块的一条带的一条带标头中被发信。
11.根据权利要求1所述的解码方法,其特征在于,该分割控制参数在该当前图像的一图像标头中被发信。
12.根据权利要求1所述的解码方法,其特征在于,该分割控制参数在包括该当前图像的一视频图像序列的一序列参数集中被发信。
13.一种视频编码方法,包括:
在一比特流中发信一分割控制参数,该分割控制参数指定用于启用三元树(TT)拆分的一最大块尺寸被约束为64或更小;
接收待编码进该比特流中的一视频的一当前图像的一当前块的原始像素数据;
递归地将该当前块拆分成一个或多个分割,其中三元树拆分不被允许用于该当前块的一分割除非该分割小于或等于该最大块尺寸;以及
将该当前块的该一个或多个分割编码进该比特流。
14.一种电子装置,包括,视频解码器电路,用于执行以下操作,包含:
从一比特流中接收一分割控制参数,该分割控制参数指定用于启用三元树(TT)拆分的一最大块尺寸被约束为64或更小;
从待解码为一视频的一当前图像的一当前块的一像素块的一比特流接收数据;
将该当前块递归地拆分成一个或多个分割,其中三元树拆分不被允许用于该当前块的一分割除非该分割小于或等于该最大块尺寸;以及
重构该当前块的该一个或多个分割。
CN202080070109.6A 2019-10-14 2020-10-14 发信图像以及视频的块分割 Pending CN114731414A (zh)

Applications Claiming Priority (13)

Application Number Priority Date Filing Date Title
US201962914577P 2019-10-14 2019-10-14
US62/914,577 2019-10-14
US201962915049P 2019-10-15 2019-10-15
US62/915,049 2019-10-15
US201962916891P 2019-10-18 2019-10-18
US62/916,891 2019-10-18
US201962930084P 2019-11-04 2019-11-04
US62/930,084 2019-11-04
US202062956359P 2020-01-02 2020-01-02
US62/956,359 2020-01-02
US17/068,817 US11589044B2 (en) 2019-10-14 2020-10-12 Video encoding and decoding with ternary-tree block partitioning
US17/068,817 2020-10-12
PCT/CN2020/120799 WO2021073521A1 (en) 2019-10-14 2020-10-14 Signaling block partitioning structure of image and video

Publications (1)

Publication Number Publication Date
CN114731414A true CN114731414A (zh) 2022-07-08

Family

ID=75383964

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080070109.6A Pending CN114731414A (zh) 2019-10-14 2020-10-14 发信图像以及视频的块分割

Country Status (7)

Country Link
US (2) US11589044B2 (zh)
EP (1) EP4042691A4 (zh)
KR (1) KR20220082022A (zh)
CN (1) CN114731414A (zh)
MX (2) MX2022004469A (zh)
TW (1) TWI792074B (zh)
WO (1) WO2021073521A1 (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102283545B1 (ko) * 2016-10-10 2021-07-29 삼성전자주식회사 블록 맵을 이용하여 영상을 부호화 또는 복호화하는 방법 및 장치
WO2020048465A1 (en) * 2018-09-03 2020-03-12 Huawei Technologies Co., Ltd. A video encoder, a video decoder and corresponding methods
WO2021091255A1 (ko) * 2019-11-05 2021-05-14 엘지전자 주식회사 영상/비디오 코딩을 위한 상위 레벨 신택스 시그널링 방법 및 장치
KR20210138114A (ko) * 2019-12-23 2021-11-18 텐센트 아메리카 엘엘씨 비디오 코딩 방법 및 장치
CN113286152B (zh) * 2020-02-20 2023-05-23 腾讯美国有限责任公司 视频解码方法、装置、计算机设备及存储介质
US11363285B2 (en) * 2020-02-20 2022-06-14 Tencent America LLC Block partitioning at picture boundaries
US11206416B2 (en) * 2020-02-21 2021-12-21 Tencent America LLC Method and apparatus for video coding
US20210314567A1 (en) * 2020-04-04 2021-10-07 Qualcomm Incorporated Block partitioning for image and video coding

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170244964A1 (en) 2016-02-23 2017-08-24 Mediatek Inc. Method and Apparatus of Flexible Block Partition for Video Coding
CN108713320B (zh) 2016-03-16 2022-05-17 寰发股份有限公司 视频编码中限制块尺寸的视频数据处理方法与装置
US10609423B2 (en) * 2016-09-07 2020-03-31 Qualcomm Incorporated Tree-type coding for video coding
WO2018049594A1 (en) 2016-09-14 2018-03-22 Mediatek Inc. Methods of encoder decision for quad-tree plus binary tree structure
EP3306929A1 (en) 2016-10-07 2018-04-11 Thomson Licensing Method and apparatus for encoding a video
US20180367818A1 (en) * 2017-06-15 2018-12-20 Futurewei Technologies, Inc. Block Partition Structure in Video Compression
US10735730B2 (en) 2018-03-07 2020-08-04 Tencent America LLC Flexible tree structure
US11516513B2 (en) 2018-03-14 2022-11-29 Mediatek Inc. Method and apparatus of optimized splitting structure for video coding
US20190306506A1 (en) 2018-04-02 2019-10-03 Qualcomm Incorporated Limitation on the coding tree unit/block for next-generation video coding
US10659781B2 (en) 2018-04-02 2020-05-19 Tencent America LLC Concatenated coding units in flexible tree structure
US10743029B2 (en) * 2018-07-30 2020-08-11 Tencent America LLC Constraints on coding unit partition
CN118055249A (zh) * 2018-09-22 2024-05-17 Lg 电子株式会社 使用间预测处理视频信号的方法和装置
US10812819B2 (en) * 2018-10-07 2020-10-20 Tencent America LLC Method and apparatus for video coding
US11509919B2 (en) * 2018-10-17 2022-11-22 Tencent America Reference sample memory size restrictions for intra block copy
JP2021513755A (ja) * 2019-01-15 2021-05-27 エルジー エレクトロニクス インコーポレイティド 変換スキップフラグを利用した映像コーディング方法及び装置
US11445174B2 (en) * 2019-05-06 2022-09-13 Tencent America LLC Method and apparatus for video coding

Also Published As

Publication number Publication date
MX2022004469A (es) 2022-07-21
KR20220082022A (ko) 2022-06-16
US20210112247A1 (en) 2021-04-15
EP4042691A4 (en) 2023-07-19
US20230164318A1 (en) 2023-05-25
TWI792074B (zh) 2023-02-11
US11589044B2 (en) 2023-02-21
US11924426B2 (en) 2024-03-05
WO2021073521A1 (en) 2021-04-22
MX2023005616A (es) 2023-12-15
EP4042691A1 (en) 2022-08-17
TW202130174A (zh) 2021-08-01

Similar Documents

Publication Publication Date Title
US11546587B2 (en) Adaptive loop filter with adaptive parameter set
US10887594B2 (en) Entropy coding of coding units in image and video data
CN112640448B (zh) 编码转换系数的熵编解码方法与装置
US10523966B2 (en) Coding transform blocks
US11924426B2 (en) Signaling block partitioning of image and video
KR20220083834A (ko) 비디오 및 이미지 코딩에서의 상위 레벨 정보의 시그널링
US11297320B2 (en) Signaling quantization related parameters
US11778235B2 (en) Signaling coding of transform-skipped blocks
US11284077B2 (en) Signaling of subpicture structures
US20200322607A1 (en) Coding Transform Coefficients With Throughput Constraints
US11785214B2 (en) Specifying video picture information
WO2023198110A1 (en) Block partitioning image and video data
WO2023236775A1 (en) Adaptive coding image and video data
WO2023197998A1 (en) Extended block partition types for video coding
WO2021047590A1 (en) Signaling of subpicture structures

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination