CN115668941A - 视频编解码中语法元素的信令 - Google Patents

视频编解码中语法元素的信令 Download PDF

Info

Publication number
CN115668941A
CN115668941A CN202180036503.2A CN202180036503A CN115668941A CN 115668941 A CN115668941 A CN 115668941A CN 202180036503 A CN202180036503 A CN 202180036503A CN 115668941 A CN115668941 A CN 115668941A
Authority
CN
China
Prior art keywords
partition
sps
picture
slice
luma
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180036503.2A
Other languages
English (en)
Inventor
陈漪纹
修晓宇
马宗全
朱弘正
陈伟
王祥林
于冰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Dajia Internet Information Technology Co Ltd
Original Assignee
Beijing Dajia Internet Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Dajia Internet Information Technology Co Ltd filed Critical Beijing Dajia Internet Information Technology Co Ltd
Publication of CN115668941A publication Critical patent/CN115668941A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

提供视频编解码方法和装置。该方法包括解码器接收与图片关联的自适应参数集(APS),其中,在APS中通过信号发送用于覆盖分区约束的语法元素;以及该解码器从该APS获得与该语法元素关联的覆盖信息。

Description

视频编解码中语法元素的信令
相关申请的交叉引用
本申请要求于2020年5月18日提交的美国临时申请No.63/026,698发明名称为“视频编解码中语法元素的信令”的优先权,该临时申请的全部内容通过引用完整地并入本文。
技术领域
本申请涉及视频编解码和压缩。更具体地而并不仅限于用于视频编解码中语法元素的信令的方法和装置。
背景技术
可以使用各种视频编解码技术来压缩视频数据。根据一种或多种视频编解码标准执行视频编解码。例如,视频编解码标准包括通用视频编解码(VVC)、联合探索测试模型(JEM)、高效视频编解码(H.265/HEVC)、高级视频编解码(H.264/AVC)、运动图像专家组(MPEG)编解码等。视频编解码通常使用利用视频图像或序列中存在的冗余的预测方法(如帧间预测、帧内预测等)。视频编解码技术的一个重要目标是将视频数据压缩成使用较低比特率的形式,同时避免或最小化视频质量的下降。
发明内容
本申请提供了涉及视频编解码中语法元素的信令的技术的示例。
根据本申请的第一方面,提供一种视频编解码方法。该方法包括解码器接收与图片关联的自适应参数集(APS)。在该APS中通过信号发送用于对分区约束进行覆盖的语法元素。该方法还包括该解码器从该APS获得与该语法元素关联的覆盖信息。
根据本申请的第二方面,提供一种视频编解码方法。该方法包括解码器接收与图片关联的图片头部(PH)。在该PH中通过信号发送第一标志和第二标志,其中,该第一标志被配置为对于与该图片关联的帧内条带启用或禁用对分区约束进行覆盖,以及其中该第二标志被配置为对于与该图片关联的帧间条带启用或禁用对分区约束进行覆盖。该方法还包括该解码器从与该图片关联的PH中获得与该第一标志和第二标志关联的覆盖信息。
根据本申请的第三方面,提供一种视频编解码方法。该方法包括解码器根据在与图片关联的序列参数集(SPS)中通过信号发送的分区约束的值预测该分区约束的值。
根据本申请的第四方面,提供一种视频编解码方法。该方法包括根据在先前编码的图片中使用的分区导出与图片关联的分区约束的值,以及响应于确定该值与在与该图片关联的序列参数集(SPS)中通过信号发送的值相同,禁用对该分区约束进行覆盖。
根据本申请的第五方面,提供一种视频编解码装置。该装置包括一个或多个处理器以及存储器,该存储器用于存储由一个或多个处理器执行的指令。在执行这些指令时,一个或多个处理器用于执行根据本申请的第一、第二、第三和第四方面中任一方面的方法。
根据本申请的第六方面,提供一种用于视频编解码的非暂时性计算机可读介质,其上存储有计算机可执行指令,这些指令在由一个或多个处理器执行时使一个或多个处理器执行根据本申请的第一、第二、第三和第四方面中任一方面的方法。
附图说明
将通过参考附图中所示的具体示例来呈现对本申请的示例的更具体的描述。鉴于这些附图仅描绘了一些示例并且因此不被认为是限制范围,将通过使用附图以附加的特异性和细节来描述和解释这些示例。
图1是示出了根据本申请的一些实施方式的示例性的视频编码器的框图。
图2是示出了根据本申请的一些实施方式的示例性的视频解码器的框图。
图3是示出了根据本申请的一些实施方式的将图片分成多个编码树单元的示例。
图4A至图4D是示出了根据本申请的一些实施方式的多类型树分割模式的框图。
图5是示出了根据本申请的一些实施方式的示例性的视频编解码装置的框图。
图6是示出了根据本申请的一些实施方式的示例性的视频编解码方法的流程图。
图7是示出了根据本申请的一些实施方式的示例性的视频编解码方法的流程图。
图8是示出了根据本申请的一些实施方式的示例性的视频编解码方法的流程图。
图9是示出了根据本申请的一些实施方式的示例性的视频编解码方法的流程图。
具体实施方式
现在将详细参照具体实施方式,在附图中示出了具体实施方式的示例。在以下详细描述中,阐述了大量非限制性具体细节以便帮助理解本文呈现的主题。但是对于本领域普通技术人员将显而易见的是,在不脱离权利要求的范围的情况下,可以使用各种替代方案,并且可以在没有这些具体细节的情况下实践主题。例如,对于本领域普通技术人员将显而易见的是,本文呈现的主题可以在具有数字视频能力的许多类型的电子设备上实现。
在整个说明书中对“一个实施例”、“实施例”、“示例”、“一些实施例”、“一些示例”或类似的语言的参考意味着所描述的特定特征、结构或特性包括在至少一个实施例或示例中。结合一个或一些实施例所描述的特征、结构、元素或特性也适用于其它实施例,除非另有说明。
在整个本发明中,术语“第一”、“第二”、“第三”等都用作仅用于引用相关元素的术语,如设备、部件、组成、步骤等,而并不暗示任何空间或时间顺序,除非另有明确说明。例如,“第一设备”和“第二设备”可以指两个单独形成的设备,也可以指同一个设备的两个部分、部件或工作状态,并且可以任意命名。
术语“模块”、“子模块”、“电路”、“子电路”、“电路系统”、“子电路系统”、“单元”或“子单元”可包括存储可由一个或更多个处理器执行的代码或指令的存储器(共享、专用或组合)。模块可包括具有或不具有存储的代码或指令的一个或更多个电路。模块或电路可包括直接或间接连接的一个或更多个组件。这些组件可以或可不物理地附接到彼此或彼此相邻定位。
如本文所使用的,取决于上下文,术语“如果”或“当……时”可被理解为表示“在……时”或“响应于……”。这些术语如果出现在权利要求中,则可不指示相关限制或特征是有条件的或可选的。例如,一种方法可包括以下步骤:i)当或如果条件X存在,则执行功能或动作X',以及ii)当或如果条件Y存在,则执行功能或动作Y'。该方法可以用执行功能或动作X'的能力和执行功能或动作Y'的能力来实现。因此,函数X'和Y'都可以在不同的时间,在方法的多次执行中被执行。
单元或模块可纯粹通过软件、纯粹通过硬件或通过硬件和软件的组合来实现。在纯软件实施方式中,例如,单元或模块可包括直接或间接链接在一起的功能上相关的代码块或软件组件,以便执行特定功能。
图1是示例性示出了典型的基于块的视频编码器100的框图,该编码器可与使用基于块的处理的多种视频编解码标准结合使用。在编码器100中,视频帧被分割成多个视频块以用于处理。对于每个给定视频块,基于帧间预测方法或帧内预测方法形成预测。在帧间预测中,基于来自先前重构帧的像素通过运动估计和运动补偿来形成一个或多个预测值。在帧内预测中,预测值是基于当前帧中的重构像素形成的。通过模式决策,可以选择最佳预测值来预测当前块。
表示当前视频块与其预测值之间的差异的预测残差被发送到变换电路102。然后从变换电路102发送变换系数到量化电路104以用于熵降。然后将量化系数馈送到熵编码电路106以生成压缩视频比特流。如图1所示,来自帧内预测电路和/或帧间预测电路112的预测相关信息110也通过熵编码电路106馈送并且被保存到压缩视频比特流114中,该预测相关信息如视频块分区信息、运动矢量、参考图片索引和帧内预测模式。
在编码器100中,还需要与解码器相关的电路来重构像素以用于预测。首先,通过反量化116和逆变换电路118重构预测残差。该重构的预测残差与块预测器120组合以生成用于当前视频块的未滤波的重构像素。
帧内预测(也称为“空间预测”)使用来自同一视频图片和/或条带中已编码相邻块(称为参考样本)的样本的像素来预测当前视频块。空间预测减少了视频信号中固有的空间冗余。
帧间预测(也称为“时间预测”)使用来自已编码视频图片的重构像素来预测当前视频块。时间预测减少了视频信号中固有的时间冗余。给定编码单元(CU)或编码块的时间预测信号通常由一个或多个运动矢量(MV)通过信号发送,这些运动矢量指示当前CU与其时间参考之间的运动量和运动方向。进一步地,如果支持多个参考图片,则额外发送一个参考图片索引来标识时间预测信号来自参考图片存储器中的哪个参考图片。
在执行空间和/或时间预测之后,编码器100中的帧内/帧间模式决策电路121例如基于率失真优化方法选择最佳预测模式。然后从当前视频块中减去块预测器120;并且使用变换电路102和量化电路104对得到的预测残差进行去相关。得到的量化残差系数由反量化电路116反量化,并由逆变换电路118逆变换以形成重构残差,然后将其添加回预测块以形成CU的重构的信号。此外,在将重构的CU放入图片缓存器117的参考图片存储器之前,可以在重构的CU上应用环路滤波器115,例如去块滤波器、样本自适应偏移(SAO)和/或自适应环路滤波器(ALF),并且用于编码未来的视频块。为了形成输出视频比特流114,(帧间或帧内)编码模式、预测模式信息、运动信息和量化的残差系数都被发送到熵编码单元106以被进一步压缩和打包以形成比特流。
例如,去块滤波器可用于AVC、HEVC以及当前版本的VVC。在HEVC中,定义了一个称为SAO(样本自适应偏移)的额外的环路滤波器,以进一步提高编解码效率。在当前版本的VVC标准中,正在积极研究另一种称为ALF(自适应环路滤波器)的环路滤波器,它很有可能被纳入最终标准。
这些环路滤波器操作是可选的。执行这些操作有助于提高编码效率和视觉质量。它们也可以作为编码器100呈现的决定被关闭以节省计算复杂性。
应注意,如果编码器100打开这些滤波器选项的话,则帧内预测通常基于未滤波的重构像素,而帧间预测基于滤波的重构像素。
图2是示例性示出了典型的基于块的视频解码器200的框图,该解码器可与多种视频编解码标准结合使用。该解码器200类似于图1的编码器100中的重建相关部分。在解码器200中,输入视频比特流201首先被熵解码202解码,以导出量化系数级别和预测相关信息。然后通过反量化204和逆变换206处理量化的系数级别以获得重构的预测残差。在帧内/帧间模式选择器212中实现的块预测值机制被配置为基于解码的预测信息执行帧内预测208或运动补偿210。通过使用加法器214将来自逆变换206的重构预测残差与块预测值机制生成的预测输出相加来获得未滤波的重构像素的集合。
该重构的块在被存储在用作参考图片存储器的图片缓存器213中之前可以进一步经过环路滤波器209。图片缓存器213中的重构视频可以被发送以驱动显示设备,并且用于预测未来的视频块。在环路滤波器209打开的情况下,对这些重构像素执行滤波操作以导出最终的重构视频输出222。
多功能视频编解码(VVC)
在2018年4月10日至20日在美国圣地亚哥举行的第10次JVET会议上,JVET将VVC的草案和VVC测试模型1(VTM1)定义为其参考软件实施。决定包含一个带有嵌套多类型树的四叉树作为VVC的初始新编码特性。多类型树是一种编码块划分结构,包括二元分割和三元分割。从那时起,通过以下JVET会议开发和更新了参考软件VTM,实现了编码和解码过程。
在VVC中,输入视频的图片被分割成称为CTU的块。使用具有嵌套多类型树结构的四叉树将CTU划分为CU,其中CU定义共享相同预测模式(如帧内或帧间模式)的像素区域。术语“单元”可定义图像的涵盖了所有分量(如亮度和色度分量)的一个区域。术语“块”用于定义覆盖特定分量(如亮度分量)的区域,并且在考虑色度采样格式(例如4:2:0)时,不同分量(如亮度和色度分量)的块在空间位置上可能不同。
将图片划分为CTU
图3示出了根据本申请的一些实施方式的被划分为多个CTU 302的图片300的示例。
在VVC中,图片被划分为CTU序列。CTU概念与HEVC相同。对于具有三个样点阵列的图片,一个CTU由一个N×N的亮度样点块和两个对应的色度样点块组成。
CTU中亮度块的最大允许尺寸表示为128×128(尽管亮度变换块的最大尺寸为64×64)。
使用树结构对CTU进行分割
在HEVC中,使用表示为编码树的四叉树结构将CTU划分为CU,以适应各种局部特征。以叶子CU级别决定使用图片间(时间)预测还是图片内(空间)预测对图片区域进行编码。根据PU划分类型,每个叶子CU可以进一步划分为一个、两个或四个PU。在一个PU内部,应用同一预测过程,并且以PU为基础将相关信息传输到解码器。在通过应用基于PU分割类型的预测过程获得残差块之后,可以根据类似于用于CU的编码树的另一种四叉树结构将叶子CU划分为变换单元(TU)。HEVC结构的关键特征之一是它具有多个分区概念,包括CU、PU和TU。
在VVC中,用使用二元和三元划分分割结构的具有嵌套多类型树的四叉树替代多个分区单元类型的概念,即它去除了CU、PU和TU概念的分离,除非需要具有对于最大变换长度太大的尺寸的CU,并支持CU分区形状的更大灵活性。在编码树结构中,CU可以具有正方形或矩形形状。CTU首先由四叉树结构进行划分。然后可以通过多类型树结构进一步划分四叉树的叶子节点。
图4A至图4D是示出了根据本申请的一些实施方式的多类型树分割模式的示意图。如图4A-4D所示,多类型树结构中有四种分割类型,即垂直二元分割402(SPLIT_BT_VER)、水平二元分割404(SPLIT_BT_HOR)、垂直三元分割406(SPLIT_TT_VER)和水平三元分割408(SPLIT_TT_HOR)。多类型树叶节点称为CU,除非CU对于最大变换长度来说太大,否则这种分割用于预测和变换处理,无需进一步划分。这意味着在大多数情况下,CU、PU和TU在具有嵌套多类型树编码块结构的四叉树中具有相同的块大小。当支持的最大变换长度小于CU的颜色分量的宽度或高度时,会产生例外情况。
VVC中的语法
在VVC中,语法信令的第一层比特流是网络抽象层(NAL),其中比特流被划分为NAL单元集合。一些NAL单元通过信号向解码器发送公共控制参数,如序列参数集(SPS)和图像参数集(PPS)。其它NAL单元包含视频数据。视频编码层(VCL)NAL单元包含编码视频的条带。被编码的图片称为访问单元,并且可以被编码为一个或多个条带。
编码视频序列以瞬时解码器刷新(IDR)图片开始。以下所有视频图片都被编码为条带。一个新的IDR图片表示前一个视频片段结束且新的视频片段开始。每个NAL单元以单字节头开始,随后是原始字节序列有效负载(RBSP)。RBSP包含编码条带。条带是二进制编码的,因此可以用零位填充它们以确保长度是整数字节数。条带由条带头和条带数据组成。条带数据被表示为一系列CU。
在第16次JVET会议中采用了图片头部概念,作为图片的第一个VCL NAL单元被每个图片传输一次。还提出了将条带头中先前的一些语法元素分组到该图片头部。功能上只需要每张图片传输一次的语法元素可以移动到图片头部,而不是在给定图片的条带中多次传输。
在VVC规范中,语法表表示所有允许的比特流的语法的超集。可以在其它子句中直接或间接表示对语法的附加约束。下面的表1和表2是VVC中条带头和PH的语法表。一些语法的语义也在语法表之后说明。
表1
Figure BDA0003950704980000081
Figure BDA0003950704980000091
所选语法元素的语义在下面详细说明。
sps_qtbtt_dual_tree_intra_flag等于1表示对于I条带,使用隐式四叉树分割将每个CTU分割为具有64×64亮度样点的编码单元,并且这些编码单元是对于亮度和色度的两个单独编码树语法结构的根。sps_qtbtt_dual_tree_intra_flag等于0表示单独的编码树语法结构不用于I条带。当sps_qtbtt_dual_tree_intra_flag不存在时,将其推断为等于0。
sps_log2_min_luma_coding_block_size_minus2加2表示最小亮度编码块的尺寸。sps_log2_min_luma_coding_block_size_minus2的取值范围应在0到Min(4,sps_log2_ctu_size_minus5+3)之间,包括端点值。
变量MinCbLog2SizeY、MinCbSizeY、IbcBufWidthY、IbcBufWidthC和Vsize推导如下:
MinCbLog2SizeY=sps_log2_min_luma_coding_block_size_minus2+2 (49)
MinCbSizeY=1<<MinCbLog2SizeY (50)
IbcBufWidthY=256*128/CtbSizeY (51)
IbcBufWidthC=IbcBufWidthY/SubWidthC (52)
VSize=Min(64,CtbSizeY) (53)
MinCbSizeY的值应小于或等于VSize。
分别表示每个色度CTB的数组的宽度和高度的变量CtbWidthC和CtbHeightC推导如下:
–如果sps_chroma_format_idc等于0(单色)或sps_separate_colour_plane_flag等于1,则CtbWidthC和CtbHeightC均等于0。
–否则,将CtbWidthC和CtbHeightC推导如下:
CtbWidthC=CtbSizeY/SubWidthC (54)
CtbHeightC=CtbSizeY/SubHeightC (55)
对于范围从0到4的log2BlockWidth和范围从0到4(包括端值)的log2BlockHeight,使用1<<log2BlockWidth和1<<log2BlockHeight调用第6.5.2节中表示的右上对角线扫描顺序数组初始化过程作为输入,并且将输出分配给DiagScanOrder[log2BlockWidth][log2BlockHeight]。
对于范围从0到6的log2BlockWidth和范围从0到6(包括端值)的log2BlockHeight,使用1<<log2BlockWidth和1<<log2BlockHeight调用第6.5.3节中表示的水平和垂直遍历扫描顺序数组初始化过程作为输入,并且将输出分配给HorTravScanOrder[log2BlockWidth][log2BlockHeight]和VerTravScanOrder[log2BlockWidth][log2BlockHeight]。
sps_partition_constraints_override_enabled_flag等于1表示在引用SPS的PH中存在ph_partition_constraints_override_flag。sps_partition_constraints_override_enabled_flag等于0表示在引用SPS的PH中不存在ph_partition_constraints_override_flag。
sps_log2_diff_min_qt_min_cb_intra_slice_luma表示由CTU的四叉树分割产生的亮度叶子块的亮度样点中的最小尺寸的以2为底的对数与引用SPS的sh_slice_type等于2(I)的条带中的亮度CU的亮度样点的最小编码块尺寸的以2为底的对数之间的默认差。当sps_partition_constraints_override_enabled_flag等于1时,该默认差可以被PH中引用SPS的ph_log2_diff_min_qt_min_cb_luma覆盖。sps_log2_diff_min_qt_min_cb_intra_slice_luma的值应在0到Min(6,CtbLog2SizeY)-MinCbLog2SizeY的范围内,包括端值。由CTU的四叉树分割产生的亮度叶子块的亮度样点的最小尺寸的以2为底的对数推导如下:
MinQtLog2SizeIntraY=
sps_log2_diff_min_qt_min_cb_intra_slice_luma+MinCbLog2SizeY(56)
sps_max_mtt_hierarchy_depth_intra_slice_luma表示编码单元的默认最大层次深度,这些编码单元是由条带中的四叉树叶子的多类型树分割产生的,其中,这些条带是引用SPS的sh_slice_type等于2(I)的条带。当sps_partition_constraints_override_enabled_flag等于1时,该默认的最大层次深度可以被存在于引用SPS的PH中的ph_max_mtt_hierarchy_depth_intra_slice_luma覆盖。sps_max_mtt_hierarchy_depth_intra_slice_luma的值应在0到2*(CtbLog2SizeY-MinCbLog2SizeY)的范围内,包括端值。
sps_log2_diff_max_bt_min_qt_intra_slice_luma表示由二元分割分割的亮度编码块的亮度样点中的最大尺寸(宽度或高度)的以2为底的对数与引用SPS的sh_slice_type等于2(I)的条带中CTU的四叉树分割产生的亮度叶子块的亮度样点中的最小尺寸(宽度或高度)之间的默认差。当sps_partition_constraints_override_enabled_flag等于1时,该默认差可以被引用SPS的PH中的ph_log2_diff_max_bt_min_qt_luma覆盖。sps_log2_diff_max_bt_min_qt_intra_slice_luma的值应在0到(sps_qtbtt_dual_tree_intra_flag?Min(6,CtbLog2SizeY):CtbLog2SizeY)-MinQtLo g2SizeIntraY的范围内,包括端值。当sps_log2_diff_max_bt_min_qt_intra_slice_luma不存在时,sps_log2_diff_max_bt_min_qt_intra_slice_luma的值被推断为等于0。
sps_log2_diff_max_tt_min_qt_intra_slice_luma表示由三元分割分割的亮度编码块的亮度样点中的最大尺寸(宽度或高度)以2为底的对数与引用SPS的sh_slice_type等于2(I)的条带中CTU的四叉树分割产生的亮度叶子块的亮度样点中的最小尺寸(宽度或高度)之间的默认差。当sps_partition_constraints_override_enabled_flag等于1时,该默认差可以被引用SPS的PH中的ph_log2_diff_max_tt_min_qt_luma覆盖。sps_log2_diff_max_tt_min_qt_intra_slice_luma的值应在0到Min(6,CtbLog2SizeY)-MinQtLog2SizeIntraY的范围内,包括端值。当sps_log2_diff_max_tt_min_qt_intra_slice_luma不存在时,sps_log2_diff_max_tt_min_qt_intra_slice_luma的值被推断为等于0。
sps_log2_diff_min_qt_min_cb_inter_slice表示由CTU的四叉树分割产生的亮度叶子块的亮度样点中的最小尺寸的以2为底的对数与引用SPS的sh_slice_type等于0(B)或1(P)的条带中的亮度CU的亮度样点中的最小亮度编码块尺寸的以2为底的对数之间的默认差。当sps_partition_constraints_override_enabled_flag等于1时,该默认差可以被引用SPS的PH中的ph_log2_diff_min_qt_min_cb_luma覆盖。sps_log2_diff_min_qt_min_cb_inter_slice的值应在0到Min(6,CtbLog2SizeY)-MinCbLog2SizeY的范围内,包括端值。由CTU的四叉树分割产生的亮度叶子块的亮度样点中的最小尺寸的以2为底的对数推导如下:
MinQtLog2SizeInterY=
sps_log2_diff_min_qt_min_cb_inter_slice+MinCbLog2SizeY(57)
sps_max_mtt_hierarchy_depth_inter_slice表示由条带中的四叉树叶子的多类型树分割产生的编码单元的默认最大层次深度,这些条带是引用该SPS的sh_slice_type等于0(B)或1(P)的条带。当sps_partition_constraints_override_enabled_flag等于1时,该默认的最大层次深度可以被引用SPS的PH中的ph_max_mtt_hierarchy_depth_inter_slice覆盖。sps_max_mtt_hierarchy_depth_inter_slice的值应在0到2*(CtbLog2SizeY-MinCbLog2SizeY)的范围内,包括端值。
sps_log2_diff_max_bt_min_qt_inter_slice表示由二元分割分割的亮度编码块的亮度样点中的最大尺寸(宽度或高度)以2为底的对数与条带中CTU的四叉树分割产生的亮度叶子块的亮度样点中的最小尺寸(宽度或高度)之间的默认差,其中,这些条带是引用该SPS的sh_slice_type等于0(B)或1(P)的条带。当sps_partition_constraints_override_enabled_flag等于1时,该默认差可以被引用SPS的PH中的ph_log2_diff_max_bt_min_qt_luma覆盖。sps_log2_diff_max_bt_min_qt_inter_slice的值应在0到CtbLog2SizeY-MinQtLog2SizeInterY的范围内,包括端值。当sps_log2_diff_max_bt_min_qt_inter_slice不存在时,sps_log2_diff_max_bt_min_qt_inter_slice的值被推断为等于0。
sps_log2_diff_max_tt_min_qt_inter_slice表示由三元分割分割的亮度编码块的亮度样点中的最大尺寸(宽度或高度)以2为底的对数与引用SPS的sh_slice_type等于0(B)或1(P)的条带中CTU的四叉树分割产生的亮度叶子块的亮度样点中的最小尺寸(宽度或高度)之间的默认差。当sps_partition_constraints_override_enabled_flag等于1时,该默认差可以被引用SPS的PH中的ph_log2_diff_max_tt_min_qt_luma覆盖。sps_log2_diff_max_tt_min_qt_inter_slice的值应在0到Min(6,CtbLog2SizeY)-MinQtLog2SizeInterY的范围内,包括端值。当sps_log2_diff_max_tt_min_qt_inter_slice不存在时,sps_log2_diff_max_tt_min_qt_inter_slice的值被推断为等于0。
sps_log2_diff_min_qt_min_cb_intra_slice_chroma表示由树类型等于DUAL_TREE_CHROMA的色度CTU的四叉树分割得到的色度叶子块的亮度样点中的最小尺寸的以2为底的对数与条带中树类型等于DUAL_TREE_CHROMA的色度CU的亮度样点中的最小编码块尺寸的以2为底的对数的默认差,其中,这些条带是引用SPS的sh_slice_type等于2(I)的条带。当sps_partition_constraints_override_enabled_flag等于1时,该默认差可以被引用该SPS的PH中存在的ph_log2_diff_min_qt_min_cb_chroma覆盖。sps_log2_diff_min_qt_min_cb_intra_slice_chroma的值应在0到Min(6,CtbLog2SizeY)-MinCbLog2SizeY的范围内,包括端值。当sps_log2_diff_min_qt_min_cb_intra_slice_chroma不存在时,sps_log2_diff_min_qt_min_cb_intra_slice_chroma的值被推断为等于0。由树类型等于DUAL_TREE_CHROMA的CTU的四叉树分割产生的色度叶子块的亮度样点中的最小尺寸的以2为底的对数推导如下:
MinQtLog2SizeIntraC=
sps_log2_diff_min_qt_min_cb_intra_slice_chroma+MinCbLog2SizeY(58)
sps_max_mtt_hierarchy_depth_intra_slice_chroma表示由引用SPS的sh_slice_type等于2(I)的条带中树类型等于DUAL_TREE_CHROMA的色度四叉树叶子多类型树分割得到的色度编码单元的默认最大层次深度。当sps_partition_constraints_override_enabled_flag等于1时,该默认的最大层次深度可以被引用SPS的PH中的ph_max_mtt_hierarchy_depth_chroma覆盖。sps_max_mtt_hierarchy_depth_intra_slice_chroma的值应在0到2*(CtbLog2SizeY-MinCbLog2SizeY)的范围内,包括端值。当sps_max_mtt_hierarchy_depth_intra_slice_chroma不存在时,sps_max_mtt_hierarchy_depth_intra_slice_chroma的值被推断为等于0。
sps_log2_diff_max_bt_min_qt_intra_slice_chroma表示由二元分割分割的色度编码块的亮度样点中的最大尺寸(宽度或高度)以2为底的对数与引用SPS的sh_slice_type等于2(I)的条带中树类型等于DUAL_TREE_CHROMA的色度CTU的四叉树分割产生的色度叶子块的亮度样点中的最小尺寸(宽度或高度)之间的默认差。当sps_partition_constraints_override_enabled_flag等于1时,该默认差可以被引用SPS的PH中的ph_log2_diff_max_bt_min_qt_chroma覆盖。sps_log2_diff_max_bt_min_qt_intra_slice_chroma的值应在0到Min(6,CtbLog2SizeY)-MinQtLog2SizeInterY的范围内,包括端值。当sps_log2_diff_max_bt_min_qt_intra_slice_chroma不存在时,sps_log2_diff_max_bt_min_qt_intra_slice_chroma的值被推断为等于0。
sps_log2_diff_max_tt_min_qt_intra_slice_chroma表示由三元分割分割的色度编码块的亮度样点中的最大尺寸(宽度或高度)以2为底的对数与引用SPS的sh_slice_type等于2(I)的条带中树类型等于DUAL_TREE_CHROMA的色度CTU的四叉树分割产生的色度叶子块的亮度样点中的最小尺寸(宽度或高度)之间的默认差。当sps_partition_constraints_override_enabled_flag等于1时,该默认差可以被引用SPS的PH中的ph_log2_diff_max_tt_min_qt_chroma覆盖。sps_log2_diff_max_tt_min_qt_intra_slice_chroma的值应在0到Min(6,CtbLog2SizeY)-MinQtLog2SizeIntraC的范围内,包括端值。当sps_log2_diff_max_tt_min_qt_intra_slice_chroma不存在时,sps_log2_diff_max_tt_min_qt_intra_slice_chroma的值被推断为等于0。
表2
Figure BDA0003950704980000141
Figure BDA0003950704980000151
语法元素的语义详述如下:
ph_partition_constraints_override_flag等于1表示分区约束参数存在于PH中。ph_partition_constraints_override_flag等于0表示分区约束参数不存在于PH中。如果ph_partition_constraints_override_flag不存在,则推断ph_partition_constraints_override_flag的值等于0。
ph_log2_diff_min_qt_min_cb_intra_slice_luma表示由CTU的四叉树分割产生的亮度叶子块的亮度样点中的最小尺寸的以2为底的对数与条带中的亮度CU中亮度样点的最小编码块尺寸的以2为底的对数之间的差异,其中,这些条带为与该PH关联的sh_slice_type等于2(I)的条带。ph_log2_diff_min_qt_min_cb_intra_slice_luma的值应在0到Min(6,CtbLog2SizeY)-MinCbLog2SizeY的范围内,包括端值。当ph_log2_diff_min_qt_min_cb_luma不存在时,ph_log2_diff_min_qt_min_cb_luma的值被推断为等于sps_log2_diff_min_qt_min_cb_intra_slice_luma。
ph_max_mtt_hierarchy_depth_intra_slice_luma表示与该PH关联的sh_slice_type等于2(I)的条带中的四叉树叶的多类型树分割产生的编码单元的最大层次深度。ph_max_mtt_hierarchy_depth_intra_slice_luma的值应在0到2*(CtbLog2SizeY-MinCbLog2SizeY)的范围内,包括端值。当ph_max_mtt_hierarchy_depth_intra_slice_luma不存在时,ph_max_mtt_hierarchy_depth_intra_slice_luma的值被推断为等于sps_max_mtt_hierarchy_depth_intra_slice_luma。
ph_log2_diff_max_bt_min_qt_intra_slice_luma表示由二元分割分割的亮度编码块的亮度样点中的最大尺寸(宽度或高度)的以2为底的对数与由与该PH关联的sh_slice_type等于2(I)的条带中的CTU的四叉树分割产生的亮度叶子块的亮度样点中的最小尺寸(宽度或高度)之间的差。ph_log2_diff_max_bt_min_qt_intra_slice_luma的值应在0到(sps_qtbtt_dual_tree_intra_flag?Min(6,CtbLog2SizeY):CtbLog2SizeY)-MinQtLog2SizeIntraY的范围内,包括端值。当ph_log2_diff_max_bt_min_qt_intra_slice_luma不存在时,ph_log2_diff_max_bt_min_qt_intra_slice_luma的值被推断为等于sps_log2_diff_max_bt_min_qt_intra_slice_luma。
ph_log2_diff_max_tt_min_qt_intra_slice_luma表示由三元分割分割的亮度编码块的亮度样点中的最大尺寸(宽度或高度)的以2为底的对数与由与该PH关联的sh_slice_type等于2(I)的条带中的CTU的四叉树分割产生的亮度叶子块的亮度样点中的最小尺寸(宽度或高度)之间的差。ph_log2_diff_max_tt_min_qt_intra_slice_luma的值应在0到Min(6,CtbLog2SizeY)-MinQtLog2SizeIntraY的范围内,包括端值。当ph_log2_diff_max_tt_min_qt_intra_slice_luma不存在时,ph_log2_diff_max_tt_min_qt_intra_slice_luma的值被推断为等于sps_log2_diff_max_tt_min_qt_intra_slice_luma。
ph_log2_diff_min_qt_min_cb_intra_slice_chroma表示从树类型等于DUAL_TREE_CHROMA的色度CTU的四叉树分割产生的色度叶子块的亮度样点中最小尺寸的以2为底的对数和与该PH关联的sh_slice_type等于2(I)的条带中树类型等于DUAL_TREE_CHROMA的色度CU的亮度样点中的最小编码块尺寸的以2为底的对数之间的差。ph_log2_diff_min_qt_min_cb_intra_slice_chroma的值应在0到Min(6,CtbLog2SizeY)-MinCbLog2SizeY的范围内,包括端值。当ph_log2_diff_min_qt_min_cb_intra_slice_chroma不存在时,ph_log2_diff_min_qt_min_cb_intra_slice_chroma的值被推断为等于sps_log2_diff_min_qt_min_cb_intra_slice_chroma。
ph_max_mtt_hierarchy_depth_intra_slice_chroma表示由与该PH关联的sh_slice_type等于2(I)的条带中的树类型等于DUAL_TREE_CHROMA的色度四叉树叶子的多类型树分割产生的色度编码单元的最大层次深度。ph_max_mtt_hierarchy_depth_intra_slice_chroma的值应在0到2*(CtbLog2SizeY-MinCbLog2SizeY)的范围内,包括端值。当ph_max_mtt_hierarchy_depth_intra_slice_chroma不存在时,ph_max_mtt_hierarchy_depth_intra_slice_chroma的值被推断为等于sps_max_mtt_hierarchy_depth_intra_slice_chroma。
ph_log2_diff_max_bt_min_qt_intra_slice_chroma表示由二元分割分割的色度编码块的亮度样点中的最大尺寸(宽度或高度)的以2为底的对数与由与该PH关联的sh_slice_type等于2(I)的条带中的树类型等于DUAL_TREE_CHROMA的色度CTU的四叉树分割产生的色度叶子块的亮度样点中的最小尺寸(宽度或高度)之间的差。ph_log2_diff_max_bt_min_qt_intra_slice_chroma的值应在0到Min(6,CtbLog2SizeY)-MinQtLog2SizeIntraC的范围内,包括端值。当ph_log2_diff_max_bt_min_qt_intra_slice_chroma不存在时,ph_log2_diff_max_bt_min_qt_intra_slice_chroma的值被推断为等于sps_log2_diff_max_bt_min_qt_intra_slice_chroma。
ph_log2_diff_max_tt_min_qt_intra_slice_chroma表示由三元分割分割的色度编码块的亮度样点中的最大尺寸(宽度或高度)的以2为底的对数与由与该PH关联的sh_slice_type等于2(I)的条带中的树类型等于DUAL_TREE_CHROMA的色度CTU的四叉树分割产生的色度叶子块的亮度样点中的最小尺寸(宽度或高度)之间的差。ph_log2_diff_max_tt_min_qt_intra_slice_chroma的值应在0到Min(6,CtbLog2SizeY)-MinQtLog2SizeIntraC的范围内,包括端值。当ph_log2_diff_max_tt_min_qt_intra_slice_chroma不存在时,ph_log2_diff_max_tt_min_qt_intra_slice_chroma的值被推断为等于sps_log2_diff_max_tt_min_qt_intra_slice_chroma。
ph_log2_diff_min_qt_min_cb_inter_slice表示由CTU的四叉树分割产生的亮度叶子块的亮度样点中的最小尺寸的以2为底的对数和与该PH关联的sh_slice_type等于0(B)或1(P)的条带中的亮度CU的亮度样点中的最小亮度编码块尺寸的以2为底的对数之间的差。ph_log2_diff_min_qt_min_cb_inter_slice的值应在0到Min(6,CtbLog2SizeY)-MinCbLog2SizeY的范围内,包括端值。当ph_log2_diff_min_qt_min_cb_luma不存在时,ph_log2_diff_min_qt_min_cb_luma的值被推断为等于sps_log2_diff_min_qt_min_cb_inter_slice。
ph_max_mtt_hierarchy_depth_inter_slice表示由与该PH关联的sh_slice_type等于0(B)或1(P)的条带中的四叉树叶子的多类型树分割产生的编码单元的最大层次深度。ph_max_mtt_hierarchy_depth_inter_slice的值应在0到2*(CtbLog2SizeY-MinCbLog2SizeY)的范围内,包括端值。当ph_max_mtt_hierarchy_depth_inter_slice不存在时,ph_max_mtt_hierarchy_depth_inter_slice的值被推断为等于sps_max_mtt_hierarchy_depth_inter_slice。
ph_log2_diff_max_bt_min_qt_inter_slice表示由二元分割分割的亮度编码块的亮度样点中的最大尺寸(宽度或高度)的以2为底的对数与由与该PH关联的sh_slice_type等于0(B)或1(P)的条带中的亮度CTU的四叉树分割产生的亮度叶子块的亮度样点中的最小尺寸之间的差。ph_log2_diff_max_bt_min_qt_inter_slice的值应在0到CtbLog2SizeY-MinQtLog2SizeInterY的范围内,包括端值。当ph_log2_diff_max_bt_min_qt_inter_slice不存在时,ph_log2_diff_max_bt_min_qt_inter_slice的值被推断为等于sps_log2_diff_max_bt_min_qt_inter_slice。
ph_log2_diff_max_tt_min_qt_inter_slice表示由三元分割分割的亮度编码块的亮度样点中的最大尺寸(宽度或高度)的以2为底的对数与由与该PH关联的sh_slice_type等于0(B)或1(P)的条带中的CTU的四叉树分割产生的亮度叶子块的亮度样点中的最小尺寸(宽度或高度)之间的差。ph_log2_diff_max_tt_min_qt_inter_slice的值应在0到Min(6,CtbLog2SizeY)-MinQtLog2SizeInterY的范围内,包括端值。当ph_log2_diff_max_tt_min_qt_inter_slice不存在时,ph_log2_diff_max_tt_min_qt_inter_slice的值被推断为等于sps_log2_diff_max_tt_min_qt_inter_slice。
接收到上述与分区约束相关的语法元素后,如下导出变量MinQtLog2SizeY、MinQtLog2SizeC、MinQtSizeY、MinQtSizeC、MaxBtSizeY、MaxBtSizeC、MinBtSizeY、MaxTtSizeY、MaxTtSizeC、MinTtSizeY、MaxMttDepthY和MaxMttDepthC。在一些示例中,正如它们的名字所暗示的那样,变量MinQtLog2SizeY表示由CTU的四叉树分割产生的亮度叶子块的亮度样点中的最小尺寸的以2为底的对数,MinQtSizeY表示由CTU的四叉树分割产生的亮度叶子块的亮度样点中的最小尺寸,等等。
若sh_slice_type等于2(I),则以下适用:
MinQtLog2SizeY=MinCbLog2SizeY+ph_log2_diff_min_qt_min_cb_intra_slice_luma(119)MinQtLog2SizeC=MinCbLog2SizeY+ph_log2_diff_min_qt_min_cb_intra_slice_chroma(120)MaxBtSizeY=1<<(MinQtLog2SizeY+ph_log2_diff_max_bt_min_qt_intra_slice_luma)(121)MaxBtSizeC=1<<(MinQtLog2SizeC+ph_log2_diff_max_bt_min_qt_intra_slice_chroma)(122)MaxTtSizeY=1<<(MinQtLog2SizeY+ph_log2_diff_max_tt_min_qt_intra_slice_luma)(123)MaxTtSizeC=1<<(MinQtLog2SizeC+ph_log2_diff_max_tt_min_qt_intra_slice_chroma)(124)
MaxMttDepthY=ph_max_mtt_hierarchy_depth_intra_slice_luma (125)
MaxMttDepthC=ph_max_mtt_hierarchy_depth_intra_slice_chroma (126)
CuQpDeltaSubdiv=ph_cu_qp_delta_subdiv_intra_slice (127)
CuChromaQpOffsetSubdiv=ph_cu_chroma_qp_offset_subdiv_intra_slice (128)
否则(sh_slice_type等于0(B)或1(P)),以下适用:MinQtLog2SizeY=MinCbLog2SizeY+ph_log2_diff_min_qt_min_cb_inter_slice(129)
MinQtLog2SizeC=MinCbLog2SizeY+ph_log2_diff_min_qt_min_cb_inter_slice(130)
MaxBtSizeY=1<<(MinQtLog2SizeY+ph_log2_diff_max_bt_min_qt_inter_slice)(131)
MaxBtSizeC=1<<(MinQtLog2SizeC+ph_log2_diff_max_bt_min_qt_inter_slice)(132)
MaxTtSizeY=1<<(MinQtLog2SizeY+ph_log2_diff_max_tt_min_qt_inter_slice)(133)
MaxTtSizeC=1<<(MinQtLog2SizeC+ph_log2_diff_max_tt_min_qt_inter_slice)(134)
MaxMttDepthY=ph_max_mtt_hierarchy_depth_inter_slice (135)
MaxMttDepthC=ph_max_mtt_hierarchy_depth_inter_slice (136)
CuQpDeltaSubdiv=ph_cu_qp_delta_subdiv_inter_slice (137)
CuChromaQpOffsetSubdiv=ph_cu_chroma_qp_offset_subdiv_inter_slice(138)
以下适用:
MinQtSizeY=1<<MinQtLog2SizeY (139)
MinQtSizeC=1<<MinQtLog2SizeC (140)
MinBtSizeY=1<<MinCbLog2SizeY (141)
MinTtSizeY=1<<MinCbLog2SizeY (142)
在当前的VVC中,与分区约束相关的语法元素在SPS中被通过信号发送,并且约束可以被该PH中的语法元素覆盖。以帧间条带的分区约束为例,在PH中通过信号发送四个语法元素以覆盖SPS中相应语法元素的通过信号发送的值。这四个语法元素包括ph_log2_diff_min_qt_min_cb_inter_slice、ph_max_mtt_hierarchy_depth_inter_slice、ph_log2_diff_max_bt_min_qt_inter_slice和ph_log2_diff_max_tt_min_qt_inter_slice。
为了覆盖由CTU的四叉树分割产生的亮度叶子块的亮度样点中的最小尺寸,语法元素ph_log2_diff_min_qt_min_cb_inter_slice用于通过信号发送由CTU的四叉树分割产生的亮度叶子块的亮度样点中的最小尺寸的以2为底的对数与亮度CU的亮度样点中的最小亮度编码块尺寸的以2为底的对数之间的差。
为了覆盖由四叉树叶子的多类型树分割产生的编码单元的最大层次深度,语法元素ph_max_mtt_hierarchy_depth_inter_slice用于直接通过信号发送该值。
为了覆盖由二元分割分割的亮度编码块的亮度样点中的最大尺寸(宽度或高度),语法ph_log2_diff_max_bt_min_qt_inter_slice用于通过信号发送由二元分割分割的亮度编码块的亮度样点中的最大尺寸(宽度或高度)的以2为底的对数与由CTU的四叉树分割产生的亮度叶子块的亮度样点中的最小尺寸(宽度或高度)之间的差。
为了覆盖由三元分割分割的亮度编码块的亮度样点中的最大尺寸(宽度或高度),语法元素ph_log2_diff_max_tt_min_qt_inter_slice用于通过信号发送由三元分割分割的亮度编码块的亮度样点中的最大尺寸(宽度或高度)的以2为底的对数与由CU的四叉树亮度分割产生的亮度叶子块的亮度样点中的最小尺寸(宽度或高度)之间的差。
然而,当覆盖被频繁激活但某些语法元素与在SPS中通过信号发送的语法元素相同时,当前语法的信令机制效率不高。
此外,当对一个图片进行编码时,基于在先前编码的图片中使用的分区得出这些分区约束。多张图片使用相同的分区约束是很常见的,但是当多张图片使用相同的分区约束时,使用当前的VVC覆盖机制不能减少图片之间的这种冗余信令。
此外,在当前图片被允许具有帧间和帧内条带时,基于一个控制标志ph_partition_constraints_override_flag来通过信号发送帧间和帧内分区约束的语法元素。然而,在某些情况下,人们可能只希望覆盖帧内条带或帧间条带的分区约束,但当前的覆盖机制不提供这种灵活性。
如上所述,在对一个图片进行编码时,这些分区约束是基于在先前编码的图片中使用的分区得出的。但是在VVC的当前参考软件(VVC测试模型版本8)中,当导出的分区约束与SPS中通过信号发送的值完全相同时,这些导出的值仍然在PH中通过信号发送以覆盖SPS中通过信号发送的值,这显然是多余的。
提出了几种方法来解决问题陈述部分中描述的问题。请注意,所提出的这些方法可以单独应用或组合应用。
注意,使用相应的语法元素将这些分区约束应用于四种不同的CU分割场景,包括:1)帧内条带中的CU分割,2)sps_qtbtt_dual_tree_intra为0时帧内条带中的CU分割,3)sps_qtbtt_dual_tree_intra为1时帧内条带中的亮度CU分割,4)sps_qtbtt_dual_tree_intra为1时帧内条带中的色度CU分割。上述场景2)和3)共享相同的语法元素,因为2)和3)被互斥地启用。在本申请的以下部分中,在提及分区约束时,它指的是上述任何一种场景。
在一些示例中,在APS中而不是在PH中通过信号发送分区约束覆盖。通过在APS中发送覆盖信息,当多个图片共享相同的分区约束时,可以引用相同的APS。创建了另外的一种APS类型,用于通过信号发送分区约束的覆盖,然后可以通过引用它的图片访问分区约束APS。
在一些示例中,用于帧内条带和帧间条带的分区约束覆盖分别由两个不同的标志控制。在一些示例中,使用两个不同的控制标志来控制用于PH或APS中的帧间条带和帧内条带的分区约束的覆盖的启用/禁用。
在一些示例中,分区约束的值可以通过SPS中对应的分区约束的值来预测。并且PH中的值与SPS中的值之间的差通过描述这些差的新语法元素用信号发送。例如,当在PH中覆盖由CTU的四叉树分割产生的亮度叶子块的亮度样点中的最小尺寸时,这个要被覆盖的最小尺寸与从SPS中的语法元素导出的最小尺寸之差通过新的语法元素在PH中用信号发送。与当前的VVC规范类似,该差可以应用于分区约束的值或应用于这些值的log2以用于更有效的表示。
在一些示例中,分区约束的语法元素的值可以通过SPS中对应的语法元素的值来预测。此外,在SPS中通过信号发送的分区约束被定义为用于对引用该SPS的图片进行编码的分区约束的全局最小值或最大值。
在一个示例中,由从SPS中的语法元素sps_log2_diff_min_qt_min_cb_inter_slice导出的CTU的四叉树分割产生的亮度叶子块的亮度样点中的最小尺寸是用于对引用该SPS的图片进行编码的允许最小尺寸。由四叉树分割产生的亮度叶子块的亮度样点中的最小尺寸随后可在图片头部中被覆盖,但在PH中通过信号发送的尺寸必须等于或大于该SPS值。在一个示例中,使用新的语法元素通过信号发送在PH中使用的最小尺寸与在SPS中通过信号发送的最小尺寸之间的差。例如,示例性名称为ph_log2_diff_min_qt_min_sps_qt_inter_slice。通过要在与该PH关联的图片中使用的最小QT分割CU的尺寸的log2减去在SPS中导出的最小QT分割CU的尺寸的log2值来得到该差。
在另一示例中,从SPS中的语法元素sps_max_mtt_hierarchy_depth_inter_slice导出的四叉树叶的多类型树分割产生的编码单元的最大层次深度是用于对引用该SPS的图片进行编码的允许的最大深度。然后可以在图片头部中覆盖由四叉树叶子的多类型树分割产生的编码单元的最大层次深度,但在PH中通过信号发送的深度须等于或小于该SPS值。
在另一个示例中,可以使用从SPS中的语法元素sps_log2_diff_max_bt_min_qt_inter_slice导出的由二元分割分割的亮度编码块的亮度样点中的最大尺寸(宽度或高度)是用于对引用该SPS的图片进行编码的允许最大尺寸。然后可以在图片头部中覆盖由二元分割分割的亮度编码块的亮度样点中的该最大尺寸(宽度或高度),但在PH中通过信号发送的尺寸须等于或小于该SPS值。
在另一个示例中,可以使用从SPS中的语法元素sps_log2_diff_max_tt_min_qt_inter_slice导出的由三元分割分割的亮度编码块的亮度样点中的最大尺寸(宽度或高度)是用于对引用该SPS的图片进行编码的允许最大尺寸。然后可以在图片头部中覆盖由三元分割分割的亮度编码块的亮度样点中的该最大尺寸(宽度或高度),但在PH中通过信号发送的尺寸须等于或小于该SPS值。
如上所述,在对一个图片进行编码时,这些分区约束是基于在先前编码的图片中使用的分区得出的。但是在VVC的当前参考软件(VVC测试模型版本8)中,当导出的分区约束与SPS中通过信号发送的值完全相同时,这些导出的值仍然在PH中通过信号发送以覆盖SPS中通过信号发送的值,这显然是多余的。在一些示例中,在对图片进行编码时所导出的值与在SPS中通过信号发送的值相同时,用于分区约束覆盖的控制标志被设置为零(禁用)以减少冗余比特。
可以使用包括一个或多个电路的装置来实施上述方法,这些电路包括专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑设备(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其它电子元件。该装置可以使用与其它硬件或软件组件相结合的电路来执行上述方法。可以至少部分地使用一个或多个电路来实现上面公开的每个模块、子模块、单元或子单元。
图5是示出了根据本申请的一些实施方式的示例性的视频编解码装置的框图。装置500可以是终端,例如手机、平板电脑、数字广播终端、平板设备或个人数字助理。
如图5所示,装置500可包括以下组件中的一个或多个:处理组件502、存储器504、电源组件506、多媒体组件508、音频组件510、输入/输出(I/O)接口512、传感器组件514和通信组件516。
处理组件502通常控制装置500的整体操作,例如与显示、电话呼叫、数据通信、相机操作和记录操作有关的操作。处理组件502可包括一个或多个处理器520,用于执行指令以完成上述方法的全部或部分步骤。此外,处理组件502可包括一个或多个模块以促进处理组件502和其它组件之间的交互。例如,处理组件502可包括多媒体模块以促进多媒体组件508与处理组件502之间的交互。
存储器504被配置为存储不同类型的数据以支持装置500的操作。此类数据的示例包括用于在装置500上操作的任何应用程序或方法的指令、联系人数据、电话簿数据、消息、图片、视频等。存储器504可以由任何类型的易失性或非易失性存储设备或其组合来实现,并且存储器504可以是静态随机存取存储器(SRAM)、电可擦除可编程只读存储器存储器(EEPROM)、可擦除可编程只读存储器(EPROM)、可编程只读存储器(PROM)、只读存储器(ROM)、磁存储器、闪存、磁盘或光盘。
电源组件506为装置500的不同组件供电。电源组件506可包括电源管理系统、一个或多个电源以及与为装置500产生、管理和分配电力关联的其它组件。
多媒体组件508包括提供装置500与用户之间的输出接口的屏幕。在一些示例中,该屏幕可包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,则屏幕可以实现为接收来自用户的输入信号的触摸屏。触摸面板可包括一个或多个触摸传感器,用于感测触摸面板上的触摸、滑动和手势。触摸传感器不仅可以感测触摸或滑动动作的边界,还可以检测与触摸或滑动操作相关的持续时间和压力。在一些示例中,多媒体组件508可包括前置摄像头和/或后置摄像头。当装置500处于操作模式,例如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部多媒体数据。
音频组件510被配置为输出和/或输入音频信号。例如,音频组件510包括麦克风(MIC)。当装置500处于诸如通话模式、录音模式和语音识别模式等操作模式时,麦克风被配置为接收外部音频信号。接收到的音频信号可以进一步存储在存储器504中或通过通信组件516发送。在一些示例中,音频组件510还包括用于输出音频信号的扬声器。
I/O接口512提供处理组件502与外围接口模块之间的接口。上述外围接口模块可以是键盘、点击轮、按钮等。这些按钮可包括但不限于主页按钮、音量按钮、开始按钮和锁定按钮。
传感器组件514包括一个或多个传感器,用于在不同方面为装置500提供状态评估。例如,传感器组件514可以检测装置500的开/关状态和组件的相对位置。例如,这些组件是装置500的显示器和键盘。传感器组件514还可以检测装置500或装置500的组件的位置变化、用户在设备上的接触的存在或不存、装置500的方向或加速/减速,以及装置500的温度变化。传感器组件514可包括接近传感器,其被配置为在没有任何物理接触的情况下检测附近物体的存在。传感器组件514还可包括光学传感器,例如在成像应用中使用的CMOS或CCD图像传感器。在一些示例中,传感器组件514还可包括加速度传感器、陀螺仪传感器、磁传感器、压力传感器或温度传感器。
通信组件516被配置为促进装置500与其它设备之间的有线或无线通信。装置500可以接入基于诸如WiFi、4G或其组合的通信标准的无线网络。在一个示例中,通信组件516经由广播信道从外部广播管理系统接收广播信号或广播相关信息。在一个示例中,通信组件516还可包括用于促进短距离通信的近场通信(NFC)模块。例如,可以基于射频识别(RFID)技术、红外数据关联(IrDA)技术、超宽带(UWB)技术、蓝牙(BT)技术等技术来实现该NFC模块。
在一个示例中,可由专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑设备(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其它电子元件来实现装置500以执行上述方法。
非暂时性计算机可读存储介质可以是例如硬盘驱动器(HDD)、固态驱动器(SSD)、闪存、混合驱动器或固态混合驱动器(SSHD),只读存储器(ROM)、光盘只读存储器(CD-ROM)、磁带、软盘等。
图6是示出了根据本申请的一些实施方式的示例性的视频编解码方法的流程图。
在步骤602中,处理器520接收与图片关联的APS,其中,在该APS中通过信号发送用于对分区约束进行覆盖的语法元素。
在步骤604中,处理器520从该APS获得与该语法元素关联的覆盖信息。
在一些示例中,处理器520在解码器上实现。
在一些示例中,与这些分区约束关联的一个或多个其它图片引用该APS或对应于该APS。
在一些示例中,该语法元素包括第一标志和第二标志,其中,该第一标志被配置为对于与该图片关联的帧内条带启用或禁用对分区约束进行覆盖,并且该第二标志被配置为对于与该图片关联的帧间条带启用或禁用对分区约束进行覆盖。
在一些示例中,在下列CU分割模式之一中应用这些分区约束:在与该图片关联的帧间条带中的CU分割;响应于确定分割标志等于0的在与该图片关联的帧内条带中的CU分割,其中,该分割标志等于0表示单独的编码树语法结构不用于帧内编码条带;响应于确定该分割标志等于1的在与该图片关联的帧内条带中的亮度CU分割,其中,该分割标志等于1表示对于帧内编码条带,使用隐式四叉树分割将每个编码树单元(CTU)分割为具有64×64亮度样点的多个CU,这些CU是对于亮度和色度的两个单独的编码树语法结构的根;以及响应于确定该分割标志等于1的在与该图片关联的帧内条带中的色度CU分割。
图7是示出了根据本申请的一些实施方式的示例性的视频编解码方法的流程图。
在步骤702中,处理器520接收与图片关联的PH,在该PH中通过信号发送第一标志和第二标志,该第一标志被配置为对于与该图片关联的帧内条带启用或禁用对分区约束进行覆盖,并且该第二标志被配置为对于与该图片关联的帧间条带启用或禁用对分区约束进行覆盖。
在步骤704中,处理器520从与该图片关联的PH中获得与该第一标志和第二标志关联的覆盖信息。
在一些实施例中,在解码器上实现处理器520。
在一些实施例中,在下列编码单元(CU)分割模式之一中应用该分区约束:在与该图片关联的帧间条带中的CU分割;响应于确定分割标志等于0的在与该图片关联的帧内条带中的CU分割,其中,该分割标志等于0表示单独的编码树语法结构不用于帧内编码条带;响应于确定该分割标志等于1的在与该图片关联的帧内条带中的亮度CU分割,其中,该分割标志等于1表示对于该帧内编码条带,使用隐式四叉树分割将每个编码树单元(CTU)分割为具有64×64亮度样点的多个CU,这些CU是对于亮度和色度的两个单独的编码树语法结构的根;以及响应于确定该分割标志等于1的在与该图片关联的帧内条带中的色度CU分割。
图8是示出了根据本申请的一些实施方式的示例性的视频编解码方法的流程图。
在步骤802中,处理器502根据在与图片关联的SPS中通过信号发送的分区约束的值来预测该分区约束的值。
在一些实施例中,在解码器上实现处理器520。
在步骤804中,处理器520根据语法元素来预测该分区约束的值,该语法元素表示与该图片关联的PH中的该分区约束的值与该SPS中的该分区约束的值之间的差。
在步骤806中,处理器520响应于确定从编码树单元的四叉树分割导出的亮度叶子块的亮度样点中的最小尺寸在该PH中被覆盖,通过信号发送该PH中的语法元素以表示覆盖之后的最小尺寸与从该SPS得出的最小尺寸之间的差。
在一些示例中,在该SPS中通过信号发送的该分区约束的值是用于对引用该SPS的一个或多个图片进行编解码的分区约束的最小值或最大值。
在一些示例中,该最小值是从语法元素导出的编码树单元(CTU)的四叉树分割导出的亮度叶子块的亮度样点中的最小尺寸,并且在该PH中通过信号发送该语法元素以表示该PH中的最小尺寸与该SPS中的最小尺寸之间的差,该差是通过与该PH关联的图片中使用的最小四叉树分割编码单元(CU)的尺寸的log2减去在该SPS中得出的最小四叉树分割CU的尺寸的值的log2得出的。
在一些示例中,该最小尺寸在该PH中被覆盖并且该PH中的最小尺寸等于或大于该SPS中的最小尺寸。
在一些示例中,该最大值是从该SPS中的语法元素导出的四叉树叶的多类型树分割导出的编码单元(CU)的最大层次深度,其中该语法元素表示从引用该SPS的双向预测条带或预测条带中的四叉树叶子的多类型树分割得出的CU的默认最大层次深度,其中该最大层次深度在该PH中被覆盖,并且该PH中的最大层次深度等于小于或等于该SPS中的最大层次深度。
在一些示例中,该最大值是使用从该SPS中的语法元素导出的二元分割来分割的亮度编码块的亮度样点中的最大尺寸,其中该语法元素表示该最大尺寸的以2为底的对数与从引用该SPS的双向预测条带或预测条带中的编码树单元(CTU)的四叉树分割导出的亮度叶子块的亮度样点中的最小尺寸之间的默认差,其中该最大尺寸在该PH中被覆盖,并且该PH中的最大尺寸等于或小于该SPS中的最大尺寸。
在一些示例中,该最大值是使用从该SPS中的语法元素导出的三元分割来分割的亮度编码块的亮度样点中的最大尺寸,其中该语法元素表示该最大尺寸的以2为底的对数与从引用该SPS的双向预测条带或预测条带中的编码树单元(CTU)的四叉树分割导出的亮度叶子块的亮度样点中的最小尺寸之间的默认差,其中该最大尺寸在该PH中被覆盖,并且该PH中的最大尺寸等于或小于该SPS中的最大尺寸。
图9是示出了根据本申请的一些实施方式的示例性的视频编解码方法的流程图。
在步骤902中,处理器502根据在先前编码的图片中使用的分区导出与图片关联的分区约束的值;以及
在步骤904中,处理器504响应于确定该值与在与该图片关联的序列参数集(SPS)中通过信号发送的值相同,禁用对该分区约束进行覆盖。
在一些实施例中,在解码器上实现处理器520。
在一些示例中,处理器520通过将控制标志设置为0来禁用对该分区约束进行覆盖,以覆盖该分区约束。
在一些示例中,提供了一种用于视频编码的装置。该装置包括一个或多个处理器520和存储器504,存储器504被配置为存储可由一个或多个处理器执行的指令。在执行这些指令时,处理器520被配置为执行图6所示的方法。例如,处理器520被配置为执行以下动作:接收与图片关联的APS以及由解码器从APS获得与语法元素关联的覆盖信息。用于覆盖分区约束的语法元素在APS中被通过信号发送。
在一些示例中,与这些分区约束关联的一个或多个其它图片引用该APS或对应于该APS。
在一些示例中,该语法元素包括第一标志和第二标志,其中,该第一标志被配置为对于与该图片关联的帧内条带启用或禁用对分区约束进行覆盖,并且该第二标志被配置为对于与该图片关联的帧间条带启用或禁用对分区约束进行覆盖。
在一些示例中,在下列CU分割模式之一中应用这些分区约束:在与该图片关联的帧间条带中的CU分割;响应于确定分割标志等于0的在与该图片关联的帧内条带中的CU分割,其中,该分割标志等于0表示单独的编码树语法结构不用于帧内编码条带;响应于确定该分割标志等于1的在与该图片关联的帧内条带中的亮度CU分割,其中,该分割标志等于1表示对于帧内编码条带,使用隐式四叉树分割将每个编码树单元(CTU)分割为具有64×64亮度样点的多个CU,这些CU是对于亮度和色度的两个单独的编码树语法结构的根;以及响应于确定该分割标志等于1的在与该图片关联的帧内条带中的色度CU分割。
在一些示例中,提供了一种用于视频编码的装置。该装置包括一个或多个处理器520和存储器504,存储器504被配置为存储可由一个或多个处理器执行的指令。在执行这些指令时,处理器520被配置为执行图7所示的方法。例如,处理器520被配置为执行以下动作:接收与图片关联的PH。在该PH中通过信号发送第一标志和第二标志,该第一标志被配置为对于与该图片关联的帧内条带启用或禁用对分区约束进行覆盖,并且该第二标志被配置为对于与该图片关联的帧间条带启用或禁用对分区约束进行覆盖。处理器520被进一步配置为执行以下动作:从与该图片关联的PH中获得与该第一标志和第二标志关联的覆盖信息。
在一些实施例中,在下列编码单元(CU)分割模式之一中应用该分区约束:在与该图片关联的帧间条带中的CU分割;响应于确定分割标志等于0的在与该图片关联的帧内条带中的CU分割,其中,该分割标志等于0表示单独的编码树语法结构不用于帧内编码条带;响应于确定该分割标志等于1的在与该图片关联的帧内条带中的亮度CU分割,其中,该分割标志等于1表示对于该帧内编码条带,使用隐式四叉树分割将每个编码树单元(CTU)分割为具有64×64亮度样点的多个CU,这些CU是对于亮度和色度的两个单独的编码树语法结构的根;以及响应于确定该分割标志等于1的在与该图片关联的帧内条带中的色度CU分割。
在一些示例中,提供了一种用于视频编码的装置。该装置包括一个或多个处理器520和存储器504,存储器504被配置为存储可由一个或多个处理器执行的指令。在执行这些指令时,处理器520被配置为执行图8所示的方法。例如,处理器520被配置为执行以下动作:根据在与图片关联的SPS中通过信号发送的分区约束的值来预测该分区约束的值。
在一些实施例中,处理器520进一步被配置为执行以下动作:根据语法元素来预测该分区约束的值,该语法元素表示与该图片关联的PH中的该分区约束的值与该SPS中的该分区约束的值之间的差。
在一些实施例中,处理器520进一步被配置为执行以下动作:响应于确定从编码树单元的四叉树分割导出的亮度叶子块的亮度样点中的最小尺寸在该PH中被覆盖,通过信号发送该PH中的语法元素以表示覆盖之后的最小尺寸与从该SPS得出的最小尺寸之间的差。
在一些示例中,在该SPS中通过信号发送的该分区约束的值是用于对引用该SPS的一个或多个图片进行编解码的分区约束的最小值或最大值。
在一些示例中,该最小值是从语法元素导出的编码树单元(CTU)的四叉树分割导出的亮度叶子块的亮度样点中的最小尺寸,并且在该PH中通过信号发送该语法元素以表示该PH中的最小尺寸与该SPS中的最小尺寸之间的差,该差是通过与该PH关联的图片中使用的最小四叉树分割编码单元(CU)的尺寸的log2减去在该SPS中得出的最小四叉树分割CU的尺寸的值的log2得出的。
在一些示例中,该最小尺寸在该PH中被覆盖并且该PH中的最小尺寸等于或大于该SPS中的最小尺寸。
在一些示例中,该最大值是从该SPS中的语法元素导出的四叉树叶的多类型树分割导出的编码单元(CU)的最大层次深度,其中该语法元素表示从引用该SPS的双向预测条带或预测条带中的四叉树叶子的多类型树分割得出的CU的默认最大层次深度,其中该最大层次深度在该PH中被覆盖,并且该PH中的最大层次深度等于小于或等于该SPS中的最大层次深度。
在一些示例中,该最大值是使用从该SPS中的语法元素导出的二元分割来分割的亮度编码块的亮度样点中的最大尺寸,其中该语法元素表示该最大尺寸的以2为底的对数与从引用该SPS的双向预测条带或预测条带中的编码树单元(CTU)的四叉树分割导出的亮度叶子块的亮度样点中的最小尺寸之间的默认差,其中该最大尺寸在该PH中被覆盖,并且该PH中的最大尺寸等于或小于该SPS中的最大尺寸。
在一些示例中,该最大值是使用从该SPS中的语法元素导出的三元分割来分割的亮度编码块的亮度样点中的最大尺寸,其中该语法元素表示该最大尺寸的以2为底的对数与从引用该SPS的双向预测条带或预测条带中的编码树单元(CTU)的四叉树分割导出的亮度叶子块的亮度样点中的最小尺寸之间的默认差,其中该最大尺寸在该PH中被覆盖,并且该PH中的最大尺寸等于或小于该SPS中的最大尺寸。
在一些示例中,提供了一种用于视频编码的装置。该装置包括一个或多个处理器520和存储器504,存储器504被配置为存储可由一个或多个处理器执行的指令。在执行这些指令时,处理器520被配置为执行图8所示的方法。例如,处理器520被配置为执行以下动作:根据在先前编码的图片中使用的分区导出与图片关联的分区约束的值;以及响应于确定该值与在与该图片关联的序列参数集(SPS)中通过信号发送的值相同,禁用对该分区约束进行覆盖。
在一些示例中,处理器520被配置为通过将控制标志设置为0来禁用对该分区约束进行覆盖,以覆盖该分区约束。
在一些示例中,提供了一种用于视频编解码的非暂时性计算机可读存储介质。该非暂时性计算机可读存储介质计算机可执行指令,当由一个或多个计算机处理器520执行时,这些指令使得一个或多个计算机处理器520执行图6所示的方法。
在一些示例中,提供了一种用于视频编解码的非暂时性计算机可读存储介质。该非暂时性计算机可读存储介质计算机可执行指令,当由一个或多个计算机处理器520执行时,这些指令使得一个或多个计算机处理器520执行图7所示的方法。
在一些示例中,提供了一种用于视频编解码的非暂时性计算机可读存储介质。该非暂时性计算机可读存储介质计算机可执行指令,当由一个或多个计算机处理器520执行时,这些指令使得一个或多个计算机处理器520执行图8所示的方法。
在一些示例中,提供了一种用于视频编解码的非暂时性计算机可读存储介质。该非暂时性计算机可读存储介质计算机可执行指令,当由一个或多个计算机处理器520执行时,这些指令使得一个或多个计算机处理器520执行图9所示的方法。
本申请的描述是为了说明的目的而呈现的,并不旨在穷举或限制于本申请。受益于前述描述和相关附图中的教导的本领域普通技术人员将清楚许多修改、变化和替代实施方式。
选择和描述示例是为了解释本申请的原理,并使本领域的其它技术人员能够理解本申请以进行各种实施,并最好地利用基本原理和各种实施以及各种适合的修改考虑到特定用途。因此,应当理解,本申请的范围不限于所公开的实施方式的具体示例,并且修改和其它实施方式旨在包括在本申请的范围内。

Claims (19)

1.一种视频编解码方法,包括:
解码器接收与图片关联的自适应参数集APS,其中,在所述APS中通过信号发送用于覆盖分区约束的语法元素;以及
所述解码器从所述APS获得与所述语法元素关联的覆盖信息。
2.根据权利要求1所述的方法,其中,与所述分区约束关联的一个或多个其它图片引用所述APS。
3.根据权利要求1所述的方法,其中,所述语法元素包括第一标志和第二标志;
其中,所述第一标志被配置为对于与所述图片关联的帧内条带启用或禁用对所述分区约束进行覆盖;以及
其中,所述第二标志被配置为对于与所述图片关联的帧间条带启用或禁用对所述分区约束进行覆盖。
4.根据权利要求1所述的方法,其中,在下列编码单元CU分割模式之一中应用所述分区约束:
在与所述图片关联的帧间条带中的CU分割;
响应于确定分割标志等于0的在与所述图片关联的帧内条带中的CU分割,其中,所述分割标志等于0表示单独的编码树语法结构不用于帧内编码条带;
响应于确定所述分割标志等于1的在与所述图片关联的帧内条带中的亮度CU分割,其中,所述分割标志等于1表示对于所述帧内编码条带,使用隐式四叉树分割将每个编码树单元CTU分割为具有64×64亮度样点的多个CU,所述多个CU是对于亮度和色度的两个单独的编码树语法结构的根;以及
响应于确定所述分割标志等于1的在与所述图片关联的帧内条带中的色度CU分割。
5.一种视频编解码方法,包括:
解码器接收与图片关联的图片头部PH,其中,在所述PH中通过信号发送第一标志和第二标志,所述第一标志被配置为对于与所述图片关联的帧内条带启用或禁用对分区约束进行覆盖,以及所述第二标志被配置为对于与所述图片关联的帧间条带启用或禁用对分区约束进行覆盖;以及
所述解码器从与所述图片关联的PH中获得与所述第一标志和所述第二标志关联的覆盖信息。
6.根据权利要求5所述的方法,其中,在下列编码单元CU分割模式之一中应用所述分区约束:
在与所述图片关联的所述帧间条带中的CU分割;
响应于确定分割标志等于0的在与所述图片关联的所述帧内条带中的CU分割,其中,所述分割标志等于0表示单独的编码树语法结构不用于帧内编码条带;
响应于确定所述分割标志等于1的在与所述图片关联的所述帧内条带中的亮度CU分割,其中,所述分割标志等于1表示对于所述帧内编码条带,使用隐式四叉树分割将每个编码树单元CTU分割为具有64×64亮度样点的多个CU,所述多个CU是对于亮度和色度的两个单独的编码树语法结构的根;以及
响应于确定所述分割标志等于1的在与所述图片关联的所述帧内条带中的色度CU分割。
7.一种视频编解码方法,包括:
解码器根据在与图片关联的序列参数集SPS中通过信号发送的分区约束的值来预测所述分区约束的值。
8.根据权利要求7所述的方法,还包括:
根据语法元素来预测所述分区约束的值,所述语法元素表示与所述图片关联的图片头部PH中的所述分区约束的值与所述SPS中的所述分区约束的值之间的差。
9.根据权利要求8所述的方法,还包括:
响应于确定从编码树单元的四叉树分割导出的亮度叶子块的亮度样点中的最小尺寸在所述PH中被覆盖,在所述PH中通过信号发送语法元素以表示覆盖之后的最小尺寸与从所述SPS导出的最小尺寸之间的差。
10.根据权利要求7所述的方法,其中,在所述SPS中通过信号发送的所述分区约束的所述值是针对用于对引用所述SPS的一个或多个图片进行编码的所述分区约束的最小值或最大值。
11.根据权利要求10所述的方法,其中,所述最小值是从编码树单元CTU的四叉树分割导出的亮度叶子块的亮度样点中的最小尺寸,所述编码树单元CTU是从语法元素导出的,并且在所述PH中通过信号发送所述语法元素以表示所述PH中的最小尺寸与所述SPS中的最小尺寸之间的差,所述差是通过与所述PH关联的图片中使用的最小四叉树分割编码单元CU的尺寸的log2减去在所述SPS中导出的最小四叉树分割CU的尺寸的值的log2推导出的。
12.根据权利要求11所述的方法,其中,所述最小尺寸在所述PH中被覆盖并且所述PH中的最小尺寸等于或大于所述SPS中的最小尺寸。
13.根据权利要求10所述的方法,其中,所述最大值是从四叉树叶的多类型树分割导出的编码单元CU的最大层次深度,所述四叉树叶是从所述SPS中的语法元素导出的,其中所述语法元素表示从引用所述SPS的双向预测条带或预测条带中的四叉树叶子的多类型树分割导出的CU的默认最大层次深度,其中所述最大层次深度在所述PH中被覆盖,并且所述PH中的最大层次深度等于小于或等于所述SPS中的最大层次深度。
14.根据权利要求10所述的方法,其中,所述最大值是使用从所述SPS中的语法元素导出的二元分割来分割的亮度编码块的亮度样点中的最大尺寸,其中所述语法元素表示所述最大尺寸的以2为底的对数与从引用所述SPS的双向预测条带或预测条带中的编码树单元CTU的四叉树分割导出的亮度叶子块的亮度样点中的最小尺寸之间的默认差,其中所述最大尺寸在所述PH中被覆盖,并且所述PH中的最大尺寸等于或小于所述SPS中的最大尺寸。
15.根据权利要求10所述的方法,其中,所述最大值是使用从所述SPS中的语法元素导出的三元分割来分割的亮度编码块的亮度样点中的最大尺寸,其中所述语法元素表示所述最大尺寸的以2为底的对数与从引用所述SPS的双向预测条带或预测条带中的编码树单元CTU的四叉树分割导出的亮度叶子块的亮度样点中的最小尺寸之间的默认差,其中所述最大尺寸在所述PH中被覆盖,并且所述PH中的最大尺寸等于或小于所述SPS中的最大尺寸。
16.一种视频编解码方法,包括:
根据在先前编码的图片中使用的分区导出与图片关联的分区约束的值;以及
响应于确定所述值与在与所述图片关联的序列参数集SPS中通过信号发送的值相同,禁用对所述分区约束进行覆盖。
17.根据权利要求16所述的方法,其中,禁用对所述分区约束进行覆盖包括:
将用于所述分区约束覆盖的控制标志设置为0。
18.一种视频编解码装置,包括:
一个或多个处理器;以及
存储器,所述存储器用于存储由所述一个或多个处理器执行的指令,其中,在执行所述指令时,所述一个或多个处理器用于执行权利要求1-17中任一项所述的方法。
19.一种用于视频编解码的非暂时性计算机可读介质,其上存储有指令,所述指令在由一个或多个处理器执行时使所述一个或多个处理器执行权利要求1-17中任一项所述的方法。
CN202180036503.2A 2020-05-18 2021-05-12 视频编解码中语法元素的信令 Pending CN115668941A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202063026698P 2020-05-18 2020-05-18
US63/026,698 2020-05-18
PCT/US2021/032110 WO2021236400A1 (en) 2020-05-18 2021-05-12 Signaling of syntax elements in video coding

Publications (1)

Publication Number Publication Date
CN115668941A true CN115668941A (zh) 2023-01-31

Family

ID=78707500

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180036503.2A Pending CN115668941A (zh) 2020-05-18 2021-05-12 视频编解码中语法元素的信令

Country Status (2)

Country Link
CN (1) CN115668941A (zh)
WO (1) WO2021236400A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023198110A1 (en) * 2022-04-13 2023-10-19 Mediatek Inc. Block partitioning image and video data

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
PT3847818T (pt) * 2018-09-18 2024-03-05 Huawei Tech Co Ltd Codificador de vídeo, um descodificador de vídeo e métodos correspondentes
EP3837836A4 (en) * 2018-09-18 2021-06-23 Huawei Technologies Co., Ltd. DIVISION WITH HIGH-LEVEL CONSTRAINT

Also Published As

Publication number Publication date
WO2021236400A1 (en) 2021-11-25

Similar Documents

Publication Publication Date Title
CN113824959B (zh) 用于视频编码的方法、装置和存储介质
US20220124347A1 (en) Lossless coding modes for video coding
US20230031699A1 (en) Methods and apparatuses for signaling of syntax elements in video coding
KR20240049624A (ko) 삼각형 예측을 위한 비디오 코딩 방법 및 장치
CN115668941A (zh) 视频编解码中语法元素的信令
US20230040224A1 (en) Methods and apparatuses for signaling of syntax elements in video coding
CN115606185A (zh) 用于视频编解码的高级语法
CN115623206A (zh) 利用三角分区的视频编解码方法和装置
CN113924774A (zh) 用于利用三角形预测进行视频编解码的方法和装置
KR102667418B1 (ko) 비디오 코딩에서의 신택스 엘리먼트의 시그널링을 위한 방법 및 장치
JP7422901B2 (ja) ビデオコーディングのための方法、装置、非一時的コンピュータ可読記憶媒体およびプログラム
KR20240074908A (ko) 비디오 코딩에서의 신택스 엘리먼트의 시그널링을 위한 방법 및 장치
KR20240074009A (ko) 비디오 코딩에서의 신택스 엘리먼트의 시그널링을 위한 방법 및 장치
KR20240074008A (ko) 비디오 코딩에서의 신택스 엘리먼트의 시그널링을 위한 방법 및 장치
KR20240074907A (ko) 비디오 코딩에서의 신택스 엘리먼트의 시그널링을 위한 방법 및 장치
CN114402618A (zh) 用于视频编解码中的解码器端运动矢量细化的方法和装置
CN114982230A (zh) 用于使用三角形分区的视频编解码的方法和装置
CN114080808A (zh) 用于视频编解码中的解码器侧运动矢量细化的方法和装置
CN114080807A (zh) 利用三角分区进行视频编解码的方法和装置
CN113994672A (zh) 用于利用三角形预测进行视频编解码的方法和装置
CN114450948A (zh) 用于视频编解码中的量化和反量化设计的方法和设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination