CN115699749A - 视频比特流的每个层表示的值的推导 - Google Patents

视频比特流的每个层表示的值的推导 Download PDF

Info

Publication number
CN115699749A
CN115699749A CN202180041068.2A CN202180041068A CN115699749A CN 115699749 A CN115699749 A CN 115699749A CN 202180041068 A CN202180041068 A CN 202180041068A CN 115699749 A CN115699749 A CN 115699749A
Authority
CN
China
Prior art keywords
value
level
representation
syntax element
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180041068.2A
Other languages
English (en)
Inventor
理卡尔德·肖伯格
马丁·彼得松
米特拉·达姆汉尼安
雅各布·斯特罗姆
张智
杰克·恩霍恩
余若洋
刘度
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Telefonaktiebolaget LM Ericsson AB
Original Assignee
Telefonaktiebolaget LM Ericsson AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Telefonaktiebolaget LM Ericsson AB filed Critical Telefonaktiebolaget LM Ericsson AB
Publication of CN115699749A publication Critical patent/CN115699749A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Ultra Sonic Daignosis Equipment (AREA)
  • Investigating Materials By The Use Of Optical Means Adapted For Particular Applications (AREA)
  • Investigating Or Analyzing Materials By The Use Of Ultrasonic Waves (AREA)

Abstract

提供了一种用于处理比特流的方法。该方法包括确定值N,其中,N标识有序层表示的数量,其中,N大于或等于3,使得N个有序层表示包括最高层表示、第二高层表示和第三高层表示。该方法还包括确定最高层表示的值。该方法包括:在确定最高层表示的值之后并且在确定第三高层表示的值之前,确定第二高层表示的值。该方法包括:在确定第二高层表示的值之后,确定第三高层表示的值。

Description

视频比特流的每个层表示的值的推导
技术领域
公开了与确定视频比特流中的每个层表示的值(例如,级别值)相关的实施例。
背景技术
1.HEVC和VVC
高效率视频编码(HEVC)是由ITU-T和MPEG标准化的基于块的视频编解码,其利用时间预测和空间预测两者。使用来自当前图片内的帧内(I)预测来实现空间预测。根据先前解码的参考图片,使用块级别上的单向帧间(P)预测或双向帧间(B)预测来实现时间预测。在编码器中,原始像素数据与预测像素数据之间的差值(被称为残差)变换到频域、被量化,并然后在与诸如预测模式和运动向量的必要预测参数(也被熵编码)一起被发送之前被熵编码。解码器执行熵解码、逆量化和逆变换以获得残差,并然后将残差添加到帧内预测或帧间预测以重构图片。
MPEG和ITU-T正在联合视频探索团队(JVET)内开发HEVC的继任者。这个正在开发的视频编解码器的名称是多功能视频编码(VVC)。在撰写本文时,VVC草案规范的当前版本是JVET-Q2001-vD。
2.分量
视频(也被称为视频序列)包括一系列图片(也被称为图像),其中,每张图片包括一个或多个分量。每个分量可以描述为样本值的二维矩形阵列。通常,视频序列中的图片包括三个分量:一个是亮度分量Y,其中样本值是亮度值;以及两个色度分量Cb和Cr,其中样本值是色度值。还通常,色度分量的尺寸在每个维度上是亮度分量的一半。例如,HD图片的亮度分量的大小将是1920x2080,而色度分量将均具有960x540的尺寸。分量有时被称为颜色分量。
3.块和单元
块是样本的一个二维阵列。在视频编码中,将每个分量分割成块,并且编码的视频比特流包括一系列编码块。通常,在视频编码中,图像被分割成覆盖图像的特定区域的单元。每个单元包括来自构成该特定区域的所有分量的所有块,并且每个块完全属于一个单元。H.264中的宏块和HEVC中的编码单元(CU)是单元的示例。
块可以备选地被定义为应用了用于解码的变换的二维阵列。这些块被称为“变换块”。备选地,块可以被定义为应用了单个预测模式的二维阵列。这些块可以被称为“预测块”。在本申请中,单词块不与这些定义之一相关联,但本文的描述可以适用于任一定义。
4.残差、变换和量化
残差块包括表示原始源块的样本值与预测块的样本值之间的样本值差异的样本。使用空间变换来处理残差块。在编码器中,根据量化参数(“QP”)对变换系数进行量化,该量化参数控制量化系数的精度。量化系数可以被称为残差系数。高QP值将导致系数的低精度,并因此导致残差块的低保真度。解码器接收残差系数,应用逆量化和逆变换来导出残差块。
5.NAL单元
HEVC和VVC两者都定义了网络抽象层(NAL)。所有数据(即,视频编码层(VCL)或HEVC和VVC中的非VCL数据两者)被封装在NAL单元中。VCL NAL单元包含表示图片样本值的数据。非VCL NAL单元包含附加的相关联数据,例如,参数集和补充增强信息(SEI)消息。HEVC中的NAL单元以指定NAL单元的NAL单元类型的头部开始,该NAL单元类型标识NAL单元中携带的数据的类型、层ID和NAL单元所属的时间ID。NAL单元类型在NAL单元头部中的nal_unit_type码字中发送,并且该类型指示并定义NAL单元应该如何被解析并被解码。NAL单元的其余字节是由NAL单元类型指示的类型的有效载荷。比特流包括一系列级联的NAL单元。
HEVC的NAL单元头部的语法如表1所示。
表1-HEVC NAL单元头部语法
Figure BDA0003985822270000031
当前版本的VVC草案中的NAL单元头部的语法如表2所示。
表2-VVC NAL单元头部语法
Figure BDA0003985822270000032
当前VVC草案的NAL单元类型如表3所示。
解码顺序是NAL单元应该被解码的顺序,该顺序与比特流内的NAL单元的顺序相同。解码顺序可以与输出顺序不同,输出顺序是要由解码器输出例如用于显示的解码图片的顺序。
表3-VVC中的NAL单元类型
Figure BDA0003985822270000033
Figure BDA0003985822270000041
Figure BDA0003985822270000051
6.参数集
HEVC指定了三种类型的参数集,图片参数集(PPS)、序列参数集(SPS)和视频参数集(VPS)。PPS包含对于整张图片公共的数据,SPS包含对于编码视频序列(CVS)公共的数据,以及VPS包含对于多个CVS公共的数据。
当前版本的VVC还指定了一个附加参数集,即适配参数集(APS)。APS可以包含可用于多个切片的信息,并且同一图片的两个切片可以使用不同的APS。APS携带自适应环路滤波器(ALF)工具以及亮度映射和色度缩放(LMCS)工具所需的参数。
7.解码能力信息(DCI)
DCI指定在解码会话期间可能不会改变并且可能有利于解码器了解的信息(例如,允许子层的最大数量)。DCI中的信息对于解码过程的操作不是必需的。在VVC规范的先前草案中,DCI被称为解码参数集(DPS)。
解码能力信息还包括比特流的一般约束的集合,这些约束在编码工具、NAL单元类型等方面为解码器提供了比特流所期望信息。在当前版本的VVC中,一般约束信息也可以在VPS或SPS中用信号发送。
8.配置文件、层级和级别
在VVC中,比特流的配置文件、层级和级别信息在比特流本身中用信号发送。对于多层比特流,该信息在VPS中用信号发送,而对于单层比特流,该信息在SPS中用信号发送。SPS信令的语法如表4和表5所示:
表4
Figure BDA0003985822270000061
表5
Figure BDA0003985822270000062
Figure BDA0003985822270000071
当前版本的VVC中general_level_idc和sublayer_level_idc[i]的语义如下,其中OlsInScope是比特流范围内的输出层集。
general_level_ide指示OlsInScope符合的如附件A中所指定的级别。比特流不应该包含general_level_idc的除了附件A中所指定的值之外的值。general_level_idc的其他值被保留以供ITU-T|ISO/IEC将来使用。注释1-general_level_idc的值越大指示级别越高。在OlsInScope的DCI NAL单元中用信号发送的最大级别可以高于但不能低于在OlsInScope中包含的CLVS的SPS中用信号发送的级别。注释2-当OlsInScope符合多个配置文件时,general_profile_idc应该指示提供优选解码结果或优选比特流标识的配置文件,如编码器(以该规范中未指定的方式)所确定的。注释3-当OlsInScope的CVS符合不同的配置文件时,多个profile_tier_level()语法结构可以被包括在DCI NAL单元中,使得对于OlsInScope的每个CVS,存在能够解码CVS的解码器的至少一个所指示的配置文件、层级和级别的集合。
语法元素sublayer_level_idc[i]的语义是:除了对不存在值的推断的规范之外,与语法元素general_level_idc相同,但适用于TemporalId等于i的子层表示。
当不存在时,sublayer_level_idc[i]的值被推断如下:a)sublayer_level_idc[maxNumSubLayersMinus1]被推断为等于相同profile_tier_level()结构的general_level_idc,以及b)对于i从maxNumSubLayersMinus1-1到0(按照i值的降序),包括maxNumSubLayersMinus1-1和0,sublayer_level_idc[i]被推断为等于sublayer_level_idc[i+1]。
在VVC解码过程中,解码器从编码的视频比特流中导出(maxNumSubLayersMinus1+1个)级别值。当profile_tier_level()存在于SPS中时,级别值的数量是从sps_max_sublayers_minus1语法元素中解码的。每个级别值指定第i层表示的级别值,其中i=0是最低层表示,而i=maxNumSubLayersMinus1是最高层表示。级别值在VVC中被称为sublayer_level_idc[i],其中索引变量i的取值范围为{0、1、......、maxNumSubLayersMinus1},包括0和maxNumSubLayersMinus1。maxNumSubLayersMinus1必须等于或大于0。
发明内容
从语义上看,VVC中sublayer_level_idc[i]的值被推导如下:a)当i等于maxNumSubLayersMinus1时,sublayer_level_idc[i]的值被设置为等于general_level_idc,以及b)当i小于maxNumSubLayersMinus1时,如果sublayer_level_idc[i]在比特流中用信号发送,则sublayer_level_ide[i]的值是从对编码的比特流进行解码中导出的,否则(即,sublayer_level_idc[i]语法元素在比特流中不存在),sublayer_level_idc[i]的值被设置为等于sublayer_level_idc[i+1]的值。
目前存在某些挑战。例如,在当前版本的VVC中,当maxNumSubLayersMinus1的值等于或大于2时,需要解码器扫描数组sublayer_level_idc[i]两次以设置级别值如下:
A)在按照索引i的升序进行(即,i从0开始并在maxNumSubLayersMinus1-1结束)的第一次扫描中,针对i的每个值确定sublayer_level_idc[i]是否在比特流中用信号发送,并且当确定sublayer_level_idc[i]在比特流中用信号发送时,解码对应的语法元素并将sublayer_level_idc[i]设置为解码的语法元素的值;以及
B)在按照索引i的降序进行(即,i从maxNumSubLayersMinus1-1开始并在0结束)的第二次扫描中,针对i的每个值确定sublayer_level_idc[i]是否在比特流中用信号发送,并且当确定sublayer_level_idc[i]未在比特流中用信号发送时,将sublayer_level_idc[i]的值设置为等于sublayer_level_idc[i+1]。
之所以需要两次扫描的原因是:对sublayer_level_idc[i]的解析/解码是按照索引i的升序进行的,而对sublayer_level_idc[i]的推断是按照索引i的降序进行的。
本公开通过提供以下方法来提供解决方案:通过将sublayer_level_idc[i]的解析/解码修改为按照索引i的降序进行,使用单次扫描来设置sublayer_level_idc[i]数组的值,使得当sublayer_level_idc[i]未在比特流中用信号发送时,要使用的推断值已经可用,因为对于0至maxNumSubLayersMinus1-1的范围内的任何i,sublayer_level_idc[i+1]的值已经从比特流中解码或者被设置为推断值。
根据本公开的第一方面,提供了一种用于处理比特流的方法。该方法包括确定值N,其中,N标识有序层表示的数量,其中,N大于或等于3,使得N个有序层表示包括最高层表示、第二高层表示和第三高层表示。该方法还包括确定最高层表示的值。该方法包括:在确定最高层表示的值之后并且在确定第三高层表示的值之前,确定第二高层表示的值。该方法包括:在确定第二高层表示的值之后,确定第三高层表示的值。
根据本公开的第二方面,提供了一种包括指令的计算机程序,该指令当由处理电路执行时使该处理电路执行根据第一方面所述的方法。
根据本公开的第三方面,提供了一种包括根据第二方面的计算机程序的载体,其中,该载体是电信号、光信号、无线电信号和计算机可读存储介质中的一种。
根据本公开的第四方面,提供了一种装置,该装置适于执行根据第一方面所述的方法。
至少一个方面提供了降低解码复杂度的优点。即,本公开中所提出的修改确保比特流中值的顺序与当前的VVC规范草案相比是逆序。通过一次性设置sublayer_level_ide[i]数组的值,解码复杂度显著降低。
附图说明
本文中所包括并形成说明书一部分的附图示出了各种实施例。
图1示出了根据示例实施例的系统。
图2是根据实施例的编码器的示意性框图。
图3是根据实施例的解码器的示意性框图。
图4是示出了根据实施例的过程的流程图。
图5是示出了根据实施例的过程的流程图。
图6是示出了根据实施例的过程的流程图。
图7是示出了根据实施例的过程的流程图。
图8是根据实施例的装置的框图。
具体实施方式
图1示出了根据示例实施例的系统100。系统100包括经由网络110(例如,因特网或其他网络)与解码器104通信的编码器102。
图2是根据实施例的用于对视频序列的视频帧(图片)中的像素值的块(以下被称为“块”)进行编码的编码器102的示意性框图。当前块通过由运动估计器250从同一帧或前一帧中已经提供的块执行运动估计来预测。在帧间预测的情况下,运动估计的结果是与参考块相关联的运动或位移向量。运动向量被运动补偿器250用于输出块的帧间预测。帧内预测器249计算当前块的帧内预测。来自运动估计器/补偿器250和帧内预测器249的输出在选择器251中输入,选择器51为当前块选择帧内预测或帧间预测。来自选择器251的输出被输入到采用加法器241形式的误差计算器,加法器41还接收当前块的像素值。加法器241计算并输出残差,作为该块与其预测之间的像素值之差。该误差在变换器242中(例如,通过离散余弦变换)进行变换,并由量化器243量化,然后在编码器244中(例如,通过熵编码器)进行编码。在帧间编码中,估计的运动矢量也被带到编码器244,以产生当前块的编码表示。当前块的经变换和量化的残差也被提供给逆量化器245和逆变换器246以取回原始残差。该误差由加法器247加到来自运动补偿器250或帧内预测器249的块预测输出,以创建可用于下一块的预测和编码的参考块。该新参考块首先由根据实施例的去块滤波器单元230处理,以便执行去块滤波以应对任何块伪影。然后将处理后的新参考块临时存储在帧缓冲器248中,在该帧缓冲器248中,该处理后的新参考块可用于帧内预测器249和运动估计器/补偿器250。
图3是根据一些实施例的解码器104的对应示意性框图。解码器104包括解码器361(例如,熵解码器),该解码器361用于对块的编码表示进行解码以得到经量化和经变换的残差集合。这些残差在逆量化器362中被去量化,并由逆变换器363逆变换以得到残差集合。这些残差在加法器364中被加到参考块的像素值。根据是执行帧间预测还是帧内预测,由运动估计器/补偿器367或帧内预测器366来确定参考块。因此,选择器368互连到加法器364以及运动估计器/补偿器367和帧内预测器366。来自加法器364的所得解码块输出被输入到根据实施例的去块滤波器单元230,以便对任何块伪影进行去块滤波。滤波后的块从解码器504输出并且进一步优选地临时提供给帧缓冲器365并且可以用作要解码的后续块的参考块。帧缓冲器365由此连接到运动估计器/补偿器367,以使所存储的像素块可用于运动估计器/补偿器367。加法器364的输出优选地也输入到帧内预测器366,以用作未滤波的参考块。
实施例
在下面的描述中,描述了解决一个或多个上述问题的各种实施例。本领域技术人员应当理解,两个或更多个实施例或实施例的一部分可以组合以形成仍被本公开所涵盖的新解决方案。
在下面的实施例中,给定具有N个元素的数组X[i],递增扫描顺序被定义为循环遍历X[i]中的每个元素,X[i]从等于0的i开始并在等于(N-1)的i结束,而递减扫描顺序被定义为遍历X[i]中每个元素,X[i]从等于(N-1)的i开始并在等于0的i结束。
图4是示出了根据实施例的用于从编码的视频比特流中至少导出N个对应层表示的N个值(例如,N个级别值)的过程400的流程图。解码器104可以执行过程400的一些或所有步骤。过程400可以开始于步骤s402。在一个实施例中,N个层表示中的每个层表示是时间子层表示,并且变量i(如下所述)可以表示时间子层ID(TemporalId)。
步骤s402包括导出值N,其中,值N表示编码的视频比特流中存在的层表示的数量,并且其中,值N是从编码的视频比特流中的语法元素SYN1导出的。这里,值N可以是大于2的值。
在步骤s402之后,导出N个值L[i](i=0至N-1),其中,每个值L[i]对应于编码的视频比特流中的第i层表示,并且其中,每个值L[i]指定第i层表示的级别,并且进一步其中,值L[i]是按照从最高层表示(例如,i等于N-1)到最低层表示(例如,i等于0)的递减扫描顺序导出的(参见步骤s404至步骤s412)。
在步骤s404中,L[N-1]的值被设置为等于特定值(被表示为“G”)(步骤s404)。在步骤s404之后,执行步骤s405和s406,其中在步骤s405中,i被设置为等于N-2,并且在步骤s406中,确定i是否大于等于0。如果i大于等于0,则该过程进行到步骤s407,否则该过程结束。步骤s407包括确定第i层表示的语法元素SYN[i]是否存在于编码的视频比特流中。
如果确定对应的语法元素SYN[i]存在于编码的视频比特流中,则执行步骤s408,否则执行步骤s410。步骤s408包括通过解码对应的SYN[i]语法元素来导出L[i]的值,其中,语法元素SYN[i]表示第i层表示的级别值L[i](例如,L[i]被设置为等于SYN[i])。步骤s410包括将L[i]的值设置为等于L[i+1]的值。在该实施例的备选版本中,步骤s410被修改为使得L[i]被设置为等于L[j],其中j>i并且j<N,而不是将L[i]设置为等于L[i+1]]。步骤s412包括递减i。在执行步骤s412之后,该过程返回到步骤s406。
在一个实施例中,特定值(即,在上面被表示为G)是从编码的视频比特流中的语法元素(表示为SYN2)导出的,并且其中,值G是通用级别值。语法元素SYN2可以是名称为general_level_idc的语法元素。该语法元素可以在编码的视频比特流中的SPS和/或VPS中存在。
在一个实施例中,过程400还包括从编码的视频比特流中的(N-1)个语法元素中导出有序值集V[i](i=0到i=(N-1)),其中,每个值V[i]对应于编码的视频比特流中的第i层表示,并且其中,每个值V[i]指示在编码的视频比特流中的是否存在第i层表示的语法元素SYN[i]。在该实施例中,在步骤s407中,确定第i层表示的语法元素SYN[i]是否存在于编码的视频比特流中包括:确定对应值V[i]的值。在一个实施例中,(N-1)个语法元素中的每个语法元素是一比特标志。在比特流中,语法元素的顺序可以是这样的顺序:所有V[i]语法元素先于任何SYN[i]语法元素(即,在任何SYN[i]语法元素之前进来)。SYN[i]语法元素的顺序必须是这样的顺序:当m大于n时,SYN[m]在比特流中先于SYN[n]。换言之,SYN[i]语法元素在比特流中按照i的降序排序。语法元素V[i]在比特流中可以按照i的升序或降序排序。
图5是示出了根据另一实施例的用于从编码的视频比特流中至少导出N个对应层表示(例如,N个对应时间子层表示)的N个级别值(L[i],i=0到i=N-1)的过程500的流程图。解码器104可以执行过程500的一些或所有步骤。过程500可以开始于步骤s502。
步骤s502包括从比特流中解码语法元素S1,并从S1(例如,S1可以是vps_ptl_max_temporal_id[i]或sps_max_sublayers_minus1)导出存在于比特流中的层表示的数量N。
步骤s504包括从比特流中解码语法元素S2,并从解码的S2值导出通用级别值G。
步骤s506包括将L[N-1]设置为G。
如果N等于1,则过程500完成,否则过程500进行到步骤s510,在步骤s510中,变量i被设置为0。在步骤s510之后,执行步骤s512、s514和s516,直到i达到N-1。
在步骤s512中,对于层表示i,语法元素S3是从比特流中解码的并且值V[i]是从解码值导出的,其中V[i]确定语法元素S4是否表示相应层表示的级别值(即,第i层表示是否存在于比特流中)。步骤s514包括将i递增1(即,i=i1)。步骤s516包括确定是否i=N-1。如果i=N-1,则过程500进行到步骤s518,否则过程500返回到步骤s512。如图5所示,在该实施例中,语法元素S3的解码器顺序和V[i]值的推导是按照从最低层表示(例如,i=0)到第二高层表示(例如,i=N-2)的升序进行的。
一旦获得了所有的V[i]值,则每个层表示(例如,层表示=i)的级别值L[i]是一次性从最高层表示(即,i=N-1)到最低层表示(即,i=0)导出的。即,执行步骤s518至s528。
步骤s518包括设置i=N-2。
步骤s520包括确定对应语法元素S3的值是否指定对应语法元素S4存在于比特流中。在一个实施例(如图5所示)中,步骤s520包括确定V[i]是否等于1。在该实施例中,如果V[i]等于1,则对应语法元素S4存在于比特流中并且过程500进行到步骤s522,否则对应语法元素S4不存在于比特流中并且过程500进行到步骤s524。
步骤s522包括解码对应S4语法元素并从S4导出层表示的级别值L[i](例如,将L[i]设置为等于解码的对应S4语法元素)。
步骤s524包括将层表示的级别值L[i]设置为等于最接近的较高层表示的级别值(例如,将L[i]设置为等于L[i+1])。
步骤s526包括设置i=i-1。并且步骤s528包括确定i是否大于或等于0。如果不是,则过程500完成,否则过程500返回到步骤s520。
层表示(例如,i)的数量可以是时间子层表示的数量,并且级别值L[i]可以是时间子层级别值。
在一些实施例中,当解码器104正在解码语法结构profile_tier_level()时,过程500的一个或多个步骤(例如,步骤s510到s528)由解码器104来执行。解码步骤中常数值和语法表的名称可以映射到语法结构中的名称,如下表6:
表6
Figure BDA0003985822270000151
在一个实施例中,profile_tier_level()在表7中被定义如下:
表7
Figure BDA0003985822270000152
Figure BDA0003985822270000161
将表7与表5进行比较,看到一个情况:表7的第16行与表5的第16行不同。具体地,在表7的第16行中,变量i被初始化为(maxNumSubLayersMinus1-1),然后被递减直到达到-1,而在表5的第16行中,变量i被初始化为0,然后被递增直到它达到maxNumSubLayersMinus1。因此,假设sublayer_level_present_flag[i]和sublayer_level_present_flag[i-1]都设置为1(即,比特流包含sublayer_level_idc[i]和sublayer_level_idc[i-1]两者,则语法元素sublayer_level_idc[i]在比特流中先于语法元素sublayer_level_idc[i-1]。
在表7所示的该实施例中,sublayer_level_idc[i]的语义如下:
sublayer_level_idc[i]指示TemporalId等于i的子层表示的级别。当不存在时,sublayer_level_idc[i]的值被推断如下:sublayer_level_idc[maxNumSubLayersMinus1]被推断为等于相同profile_tier_level()结构的general_level_idc,并且对于i从maxNumSubLayersMinus1-1到0(按照i值的降序),包括maxNumSubLayersMinus1-1和0,sublayer_level_idc[i]被推断为等于sublayer_level_idc[i+1]。
在另一实施例中,profile_tier_level()在表8中被定义如下:
表8
Figure BDA0003985822270000162
Figure BDA0003985822270000171
在表8所示的该实施例中,循环索引变量(在上面的语法表中用“i”表示)从0开始并在最高值结束,按照升序。然而,对sublayer_level_present_flag[]值的检查和对sublayer_level_idc[]语法元素的解析是按照递减索引顺序进行的。因此,该实施例等同于上面公开的但以备选方式表达的实施例。
在另一实施例中,示例语法表与当前版本的VVC相同(或未改变)。S1是解码步骤中的一个语法元素。在示例语法表中,S1分别是VPS和SPS中的vps_ptl_max_temoral_id[i]或sps_max_sublayers_minus1。值N等于语法元素S1的解码值加1。
S1是VPS中的vps_ptl_max_temporal_id[i]
Figure BDA0003985822270000172
Figure BDA0003985822270000181
图6是示出了根据另一实施例的用于从编码的视频比特流中至少导出N个对应层表示(例如,N个对应时间子层表示)的N个级别值的过程600的流程图。过程600类似于过程500,但使用单个循环而不是两个循环。过程600可以开始于步骤s602。
步骤s602包括从比特流中解码语法元素S1,并从S1(例如,S1可以是vps_ptl_max_temporal_id[i]或sps_max_sublayers_minus1)导出存在于比特流中的层表示的数量N。
步骤s604包括从比特流中解码语法元素S2,并从解码的S2值导出通用级别值G。
步骤s606包括将L[N-1]设置为G。
如果N等于1,则过程600完成,否则过程600进行到步骤s610。
步骤s610包括将变量i设置为N-2。在步骤s610之后,执行步骤s612至步骤s622,直到i达到-1。
在步骤s612中,对于层表示i,语法元素S3是从比特流中解码的并且值V[i]是从解码值导出的,其中V[i]确定语法元素S4是否表示相应层表示的级别值(即,第i层表示是否存在于比特流中)。
步骤s614包括确定对应语法元素S3的值是否指定对应语法元素S4存在于比特流中。在一个实施例(如图6所示)中,步骤s614包括确定V[i]是否等于1。在该实施例中,如果V[i]等于1,则对应语法元素S4存在于比特流中并且过程600进行到步骤s616,否则对应语法元素S4不存在于比特流中并且过程600进行到步骤s618。
步骤s616包括解码对应S4语法元素并从S4导出层表示的级别值L[i](例如,将L[i]设置为等于解码的对应S4语法元素)。
步骤s618包括将层表示的级别值L[i]设置为等于最接近的较高层表示的级别值(例如,将L[i]设置为等于L[i+1])。
步骤s620包括设置i=i-1。并且步骤s622包括确定i是否等于-1。如果是,则过程600完成,否则过程600返回到步骤s612。
本实施例中profile_tier_level()在表9中被定义如下:
表9
Figure BDA0003985822270000191
Figure BDA0003985822270000201
如表9所指示,表5中所示的两个“For”循环被单个“For”循环代替。
图8是根据一些实施例的用于实现解码器104和/或编码器102的装置800的框图。当装置800实现解码器时,装置800可以被称为“解码装置800”,而当装置800实现编码器时,装置800可以被称为“编码装置800”。如图8所示,装置800可以包括:处理电路(PC)802,该处理电路(PC)802可以包括一个或多个处理器(P)855(例如,通用微处理器和/或一个或多个其他处理器,例如专用集成电路(ASIC)、现场可编程门阵列(FPGA)等),这些处理器可以共置于单个外壳或单个数据中心中,或者可以在地理上分布(即,装置800可以是分布式计算装置);至少一个网络接口848,该网络接口848包括发射器(Tx)845和接收器(Rx)847,用于使装置800能够向连接到网络110(例如,互联网协议(IP)网络)的其他节点发送数据以及从其接收数据,网络接口848(直接地或间接地)连接到该网络110(例如,网络接口848可以无线连接到网络110,在这种情况下,网络接口848连接到天线布置);以及存储单元(又名“数据存储系统”)808,其可以包括一个或多个非易失性存储设备和/或一个或多个易失性存储设备。在PC 802包括可编程处理器的实施例中,可以提供计算机程序产品(CPP)841。CPP841包括计算机可读介质(CRM)842,该计算机可读介质(CRM)842存储包括计算机可读指令(CRI)844在内的计算机程序(CP)843。CRM 842可以是非暂时性计算机可读介质,例如磁介质(例如,硬盘)、光学介质、存储器设备(例如,随机存取存储器、闪存)等。在一些实施例中,计算机程序843的CRI 844被配置为使得当由PC 802执行时,CRI使装置800执行本文所描述的步骤(例如,本文参考流程图描述的步骤)。在其他实施例中,装置800可以被配置为在不需要代码的情况下执行本文所描述的步骤。即,例如,PC 802可以仅由一个或多个ASIC组成。因此,本文描述的实施例的特征可以以硬件和/或软件方式来实现。
尽管本文描述了各种实施例,但应当理解,它们仅以示例而非限制的方式提出。因此,本公开的广度和范围不应受到上述示例性实施例中任何一个的限制。此外,上述要素以其所有可能变型进行的任意组合都涵盖在本公开中,除非另有指示或以其他方式和上下文明确冲突。
附加地,尽管上文描述并附图中示出的处理被示为一系列步骤,但其仅用于说明目的。因此,可以想到可增加一些步骤、可省略一些步骤,可重排步骤顺序,以及可并行执行一些步骤。

Claims (19)

1.一种用于处理比特流的方法(700),所述方法包括:
确定(s702)值N,其中,N标识有序层表示的数量,其中,N大于或等于3,使得N个有序层表示包括最高层表示、第二高层表示和第三高层表示;
确定(s704)所述最高层表示的值;
在确定所述最高层表示的值之后并且在确定所述第三高层表示的值之前,确定(s706)所述第二高层表示的值;以及
在确定所述第二高层表示的值之后,确定(s708)所述第三高层表示的值。
2.根据权利要求1所述的方法,其中,确定所述第二高层表示的值包括:
确定所述比特流是否包含与所述第二高层表示相关联的第一特定语法元素;以及
如果所述比特流包含与所述第二高层表示相关联的所述第一特定语法元素,则从与所述第二高层表示相关联的所述第一特定语法元素中导出值,并且确定所述第二高层表示的所述值是从所述第一特定语法元素中导出的所述值,否则确定所述第二高层表示的所述值是所述最高层表示的所述值。
3.根据权利要求2所述的方法,其中,确定所述第三高层表示的值包括:
确定所述比特流是否包含与所述第三高层表示相关联的第二特定语法元素;以及
如果所述比特流包含与所述第三高层表示相关联的所述第二特定语法元素,则从与所述第三高层表示相关联的所述第二特定语法元素中导出值,并且确定所述第三高层表示的所述值是从所述第二特定语法元素中导出的所述值,否则确定所述第三高层表示的所述值是所述第二高层表示的所述值或所述最高层表示的所述值。
4.根据权利要求3所述的方法,其中,如果所述比特流包含与所述第二高层表示相关联的所述第一特定语法元素和与所述第三高层表示相关联的所述第二特定语法元素二者,则在所述比特流中,与所述第二高层表示相关联的所述第一特定语法元素在与所述第三高层表示相关联的所述第二特定语法元素之前。
5.根据权利要求2、3或4中任一项所述的方法,其中,
所述方法还包括:从所述比特流中解码语法元素,以产生解码值并将变量V2设置为等于所述解码值,并且
确定所述比特流是否包含与所述第二高层表示相关联的第一特定语法元素包括:确定V2是否等于预定值。
6.根据权利要求2至5中任一项所述的方法,其中:
所述方法还包括:从所述比特流中解码语法元素,以产生解码值并将变量V3设置为等于所述解码值;以及
确定所述比特流是否包含与所述第三高层表示相关联的第二特定语法元素包括:确定V3是否等于预定值。
7.根据权利要求5至6中任一项所述的方法,其中,用于设置所述变量V2的语法元素和/或用于设置所述变量V3的语法元素是ptl_sublayer_level_present_flag[i]。
8.根据前述权利要求中任一项所述的方法,其中,确定N包括:基于所述比特流中包括的语法元素来确定N。
9.如前述权利要求中任一项所述的方法,其中,确定N包括:
基于所述比特流中包括的视频参数集VPS中包括的语法元素来确定N,或
基于所述比特流中包括的序列参数集SPS中包括的语法元素来确定N。
10.根据权利要求8至9中任一项所述的方法,其中,确定N是基于以下语法元素:指定配置文件、层级和级别PTL结构的最大时间ID的语法元素,或用于确定最大子层数的语法元素。
11.根据前述权利要求中任一项所述的方法,其中,确定所述最高层表示的值包括:从所述比特流中包括的参数集中包括的语法元素中导出所述最高层表示的所述值。
12.根据权利要求11所述的方法,其中,所述参数集是序列参数集或视频参数集。
13.根据前述权利要求中任一项所述的方法,其中,每个层表示的每个值是级别值。
14.根据前述权利要求中任一项所述的方法,其中,层表示是时间子层表示。
15.根据前述权利要求中任一项所述的方法,还包括:
将与所述最高层表示相关联的第一变量设置(s710)为等于针对所述最高层表示确定的值;
将与所述第二高层表示相关联的第二变量设置(s712)为等于针对所述第二高层表示确定的值;以及
将与所述第三高层表示相关联的第三变量设置(s714)为等于针对所述第三高层表示确定的值。
16.一种包括指令(844)的计算机程序(843),所述指令(844)当由处理电路(802)执行时使所述处理电路(802)执行根据上述权利要求中任一项所述的方法。
17.一种包括根据权利要求16所述的计算机程序的载体,其中,所述载体是电信号、光信号、无线电信号和计算机可读存储介质(842)之一。
18.一种装置(800),所述装置适于执行根据权利要求1至15中任一项所述的方法。
19.一种装置(800),所述装置包括:
处理电路(802);以及
存储器(842),所述存储器(842)包含可由所述处理电路执行的指令(844),由此所述装置可操作以执行根据权利要求1至15中任一项所述的方法。
CN202180041068.2A 2020-06-08 2021-01-27 视频比特流的每个层表示的值的推导 Pending CN115699749A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202063036200P 2020-06-08 2020-06-08
US63/036,200 2020-06-08
PCT/SE2021/050048 WO2021251859A1 (en) 2020-06-08 2021-01-27 Derivation of a value for each layer representation of a video bitstream

Publications (1)

Publication Number Publication Date
CN115699749A true CN115699749A (zh) 2023-02-03

Family

ID=78846319

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180041068.2A Pending CN115699749A (zh) 2020-06-08 2021-01-27 视频比特流的每个层表示的值的推导

Country Status (7)

Country Link
US (1) US20230232011A1 (zh)
EP (1) EP4162685A4 (zh)
JP (1) JP2023529854A (zh)
CN (1) CN115699749A (zh)
CO (1) CO2022016854A2 (zh)
TW (1) TWI774246B (zh)
WO (1) WO2021251859A1 (zh)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015053120A1 (ja) * 2013-10-08 2015-04-16 シャープ株式会社 画像復号装置、画像復号方法、画像符号化装置、及び画像符号化方法
US10326815B2 (en) * 2016-12-20 2019-06-18 LogMeln, Inc. Techniques for scalably sharing video through a streaming server

Also Published As

Publication number Publication date
JP2023529854A (ja) 2023-07-12
TW202147846A (zh) 2021-12-16
US20230232011A1 (en) 2023-07-20
WO2021251859A1 (en) 2021-12-16
EP4162685A1 (en) 2023-04-12
TWI774246B (zh) 2022-08-11
EP4162685A4 (en) 2023-12-13
CO2022016854A2 (es) 2022-12-09

Similar Documents

Publication Publication Date Title
JP7234406B2 (ja) ビデオ処理における非線形適応ループフィルタリング
JP7389251B2 (ja) 輝度の差分を用いるクロスコンポーネント適応ループフィルタ
CN107079150B (zh) 用于视频译码中自适应颜色变换的量化参数推导及偏移
US20220038706A1 (en) Interactions among multiple intra coding methods
JP2018525862A (ja) 高ダイナミックレンジ及び広色域のビデオコード化のための適応一定輝度アプローチ
CN113115047A (zh) 视频编解码方法和设备
DK2834980T3 (en) Sample adaptive filtering with offsets
JPWO2020192644A5 (zh)
JPWO2020192645A5 (zh)
US11546595B2 (en) Sub-block based use of transform skip mode
KR102540022B1 (ko) 인코딩된 비디오 비트스트림에 포함된 데이터의 양을 줄이기 위한 파라미터 세트의 시그널링 파라미터 값 정보
JP2023519612A (ja) 高レベル構文におけるインター予測のための信号通知
CN115349261A (zh) 使用语法元素的视频处理
WO2022206987A1 (en) Adaptive dependent quantization
WO2021170058A1 (en) Transform skip residual coding
WO2021121419A1 (en) Interaction between adaptive color transform and quantization parameters
JP2023523839A (ja) 動き精度構文のためのエントロピーコーディング
CN115699749A (zh) 视频比特流的每个层表示的值的推导
WO2021136470A1 (en) Clustering based palette mode for video coding
WO2021208994A1 (en) Sub-bitstream extraction
WO2024080917A1 (en) Quantization parameter (qp) coding for video compression
JP2023519402A (ja) 変換スキップモードにおける係数コーディング
JP2024038255A (ja) 映像コーディングにおけるスライスタイプ

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination