CN114846457A - 对层级视频的编解码的限制 - Google Patents

对层级视频的编解码的限制 Download PDF

Info

Publication number
CN114846457A
CN114846457A CN202080090430.0A CN202080090430A CN114846457A CN 114846457 A CN114846457 A CN 114846457A CN 202080090430 A CN202080090430 A CN 202080090430A CN 114846457 A CN114846457 A CN 114846457A
Authority
CN
China
Prior art keywords
video
layer
vps
bitstream
equal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080090430.0A
Other languages
English (en)
Inventor
王业奎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ByteDance Inc
Original Assignee
ByteDance Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ByteDance Inc filed Critical ByteDance Inc
Publication of CN114846457A publication Critical patent/CN114846457A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/46Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/187Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/58Motion compensation with long-term prediction, i.e. the reference frame for a current frame not being the temporally closest one

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

一种视频处理方法,包括执行视频与该视频的比特流之间的转换。比特流包括编解码视频序列(CVS),该编解码视频序列包括一个或多个视频层的一个或多个编解码视频图片;比特流符合格式规则,该格式规则规定指示由CVS的一个或多个编解码图片所参考的转换参数的一个或多个序列参数集合(SPS)具有相同的指示参考VPS的参考视频参数集合(VPS)标识符。

Description

对层级视频的编解码的限制
相关申请的交叉参考
根据适用专利法和/或依据巴黎公约的规则,本申请及时要求于2019年12月26日提交的第62/953,854号美国临时申请以及于2019年12月30日提交的第62/955,185号美国临时申请的优先权和权益。出于法律上的所有目的,上述申请的全部公开内容通过参考并入本申请公开的一部分。
技术领域
本专利文档涉及图像编码和解码以及视频编码和解码。
背景技术
数字视频占互联网和其它数字通信网络上的最大带宽使用。随着能够接收和显示视频的连接用户设备的数目增加,预期数字视频使用的带宽需求将继续增长。
发明内容
本文档公开了可以由视频编码器和视频解码器用于执行视频编码或解码的技术。
在一个示例方面中,公开了一种视频处理方法。该方法包括执行包括一个或多个可缩放视频层的视频与该视频的比特流之间的转换。视频包括一个或多个视频图片,视频图片包括一个或多个条带。比特流符合格式规则。格式规则规定,在对应的网络抽象层单元类型在预定范围内,并且对应的视频层标志指示对应于条带的视频层不使用层间预测的情况下,设置指示条带的条带类型的字段的值以指示帧内条带的类型。
在另一个示例方面中,公开了一种视频处理方法。该方法包括执行包括多个视频层的视频与该视频的比特流之间的转换,其中,该比特流包括多个输出层集合(OLS),每个输出层集合包括多个可缩放视频层中的一个或多个,并且该比特流符合格式规则,其中,该格式规则规定,对于具有单个层的OLS,指示OLS的档次、层、级别的档次-层-级别(profile-tier-level,PTL)语法结构被包括在比特流的视频参数集合中,并且OLS的PTL语法结构还被包括在比特流中编解码的序列参数集合中。
在另一个示例方面中,公开了一种视频处理方法。该方法包括执行包括多个视频层的视频与该视频的比特流之间的转换,其中,该比特流包括多个输出层集合(OLS),每个输出层集合包括多个视频层中的一个或多个,并且该比特流符合格式规则,其中,格式规则规定在比特流的视频参数集合中出现的多个档次-层-级别(PTL)语法结构与视频参数集合中的字节对齐语法字段之间的关系;其中,每个PTL语法结构指示多个OLS中的一个或多个的档次、层和级别。
在另一个示例方面中,公开了一种视频处理方法。该方法包括执行包括多个可缩放视频层的视频与该视频的比特流之间的转换,其中,该比特流包括多个输出层集合(OLS),每个输出层集合包括多个可缩放视频层中的一个或多个,并且该比特流符合格式规则,其中,该格式规则规定:在编码期间,在对描述多个OLS中的一个或多个的档次、层和级别的语法结构的索引的值为零的情况下,从比特流的视频参数集合中排除指示该索引的语法元素,或者在解码期间,在比特流中不存在语法元素的情况下,将该值推断为零。
在另一个示例方面中,公开了一种视频处理方法。该方法包括执行包括多个视频层的视频与视频的比特流之间的转换,其中,比特流包括多个输出层集合(OLS),每个输出层集合包括多个视频层中的一个或多个,并且比特流符合格式规则,其中,格式规则规定,对于层i,其中i是整数,比特流包括指示第一变量的第一语法元素集合,该第一变量指示层i是否被包括在多个OLS中的至少一个中。
在另一个示例方面中,公开了一种视频处理方法。该方法包括执行视频与视频的比特流之间的转换,其中,比特流包括一个或多个输出层集合,每个输出层集合包括一个或多个视频层;其中,比特流符合格式规则,其中,格式规则规定,在每个输出层集合包括单个视频层的情况下,比特流的视频参数集合中包括的解码图片缓冲区参数语法结构的数目等于零;或者在每个输出层集合包括单个层不为真的情况下,该数目等于一加语法元素的值。
在另一个示例方面中,公开了一种视频处理方法。所述方法包括执行视频和视频的比特流之间的转换,其中,比特流包括编解码视频序列(CVS),该编解码视频序列包括一个或多个视频层的一个或多个编解码视频图片;并且其中,比特流符合格式规则,该格式规则规定指示由CVS的一个或多个编解码图片参考的转换参数的一个或多个序列参数集合(SPS)具有相同参考视频参数集合(VPS)标识符,该VPS标识符指示参考VPS。
在另一个示例方面中,公开了一种视频处理方法。该方法包括执行视频与视频的比特流之间的转换,其中,该比特流包括一个或多个输出层集合(OLS),每个输出层集合包括一个或多个视频层,其中,该比特流符合格式规则;其中,格式规则规定第一语法元素是否或如何被被包括在比特流的视频参数集合(VPS)中,该第一语法元素指示描述假设参考解码器(hypothetical reference decoder,HRD)的参数的第一语法结构是否用于转换。
在另一个示例方面中,公开了一种视频处理方法。该方法包括执行视频与视频的比特流之间的转换,其中,该比特流包括一个或多个输出层集合(OLS),每个输出层集合包括一个或多个视频层,其中,该比特流符合格式规则;其中,该格式规则规定在比特流的视频参数集合(VPS)中是否包括或如何包括描述通用假设参考解码器(HRD)参数的第一语法结构和描述OLS特定的HRD参数的多个第二语法结构。
在又一个示例方面中,公开了一种视频编码器装置。视频编码器包括配置为实现上述方法的处理器。
在另一个示例方面中,公开了一种视频解码器装置。视频解码器包括配置为实现上述方法的处理器。
在又一个示例方面中,公开了一种其上存储有代码的计算机可读介质。该代码以处理器可执行代码的形式体现了本文描述的方法之一。
在又一个示例方面中,公开了一种将根据上述方法之一生成的比特流写入计算机可读介质的方法。
在另一个示例方面中,公开了一种存储根据上述方法生成的视频的比特流的计算机可读介质。
这些特征和其它特征在本文档中进行了描述。
附图说明
图1是示出根据本公开的一些实施例的视频编解码系统的框图。
图2是用于视频处理的示例硬件平台的框图。
图3是视频处理的示例方法的流程图。
图4是示出示例视频编解码系统的框图。
图5是示出根据本公开的一些实施例的编码器的框图。
图6是示出根据本公开的一些实施例的解码器的框图。
图7A-图7I是各种视频处理方法示例的流程图。
具体实施方式
在本文件中使用章节标题是为了便于理解,并且不限制每个章节中公开的技术和实施例仅应用于该章节。此外,在一些说明书中使用H.266术语只是为了便于理解,而不是为了限制所公开技术的范围。这样,本文所描述的技术也应用于其它视频编解码器协议和设计。
1.总结
本文档与视频编解码技术有关。具体地,它是关于可缩放视频编解码的各种改进,其中,视频比特流可以包含多于一个层。这些思想可以单独或以各种组合应用于支持多层视频编解码的任何视频编解码标准或非标准视频编解码器,例如,正在开发的通用视频编解码(VVC)。
2.缩写
APS 自适应参数集
AU 访问单元
AUD 访问单元分隔符
AVC 高级视频编解码
CLVS 编解码层视频序列
CPB 编解码图片缓冲区
CRA 清洁随机访问
CTU 编解码树单元
CVS 编解码视频序列
DPB 解码图片缓冲区
DPS 解码参数集
EOB 比特流结尾
EOS 序列结尾
GDR 逐步解码刷新
HEVC 高效视频编解码
HRD 假设参考解码器
IDR 即时解码刷新
JEM 联合探索模型
MCTS 运动约束的片组
NAL 网络抽象层
OLS 输出层集合
PH 图片标头
PPS 图片参数集合
PTL 档次、层和级别
PU 图片单元
RBSP 原始字节序列有效载荷
SEI 补充增强信息
SPS 序列参数集合
SVC 可缩放视频编解码
VCL 视频编解码层
VPS 视频参数集合
VTM VVC测试模型
VUI 视频可用性信息
VVC 多功能视频编解码
3.初步讨论
视频编解码标准主要是通过著名的ITU-T和ISO/IEC标准的发展而发展起来的。ITU-T制作了H.261和H.263,ISO/IEC制作了MPEG-1和MPEG-4Visual,并且这两个组织联合制作了H.262/MPEG-2视频标准和H.264/MPEG-4高级视频编解码(AVC)标准以及H.265/HEVC[1]标准。自H.262以来,视频编解码标准基于混合视频编解码结构,其中,使用了时域预测加变换编解码。为了探索HEVC之外的未来视频编解码技术,VCEG和MPEG于2015年联合成立了联合视频探索小组(JVET)。此后,许多新方法被JVET采用,并被应用到名为联合探索模型(JEM)[2]的参考软件中。JVET会议每季度同时举行一次,并且新的编解码标准的目标是比HEVC降低50%的比特率。在2018年4月的JVET会议上,新的视频编解码标准被正式命名为通用视频编解码(VVC),并且当时发布了VVC测试模型(VTM)的第一个版本。随着致力于VVC标准化的不断努力,每次JVET会议都会为VCC标准采用新的编解码技术。然后在每次会议后更新VVC工作草案和测试模型VTM。VVC项目目前的目标是在2020年7月的会议上实现技术完成(FDIS)。
3.1.通用可伸缩视频编解码(SVC)
可伸缩视频编解码(Scalable Video Coding,SVC)是指这样的视频编解码:其中,使用基本层(base layer,BL)(有时称为参考层(reference layer,RL))和一个或多个可伸缩增强层(enhancement layer,EL)。在SVC中,基本层可以携带具有基本质量级别的视频数据。一个或多个增强层可以携带附加的视频数据,以支持例如更高的空域级别、时域级别和/或信噪比(SNR)级别。可以相对于先前编码的层来定义增强层。例如,底层可以充当BL,而顶层可以充当EL。中间层可以充当EL或RL,也可以同时充当两者。例如,中间层(例如,既不是最低层也不是最高层的层)可以是中间层下面的层的EL(例如,基本层或任何中间增强层),并且同时充当中间层上面的一个或多个增强层的RL。类似地,在HEVC标准的多视图或3D扩展中,可以存在多个视图,并且可以利用一个视图的信息来编解码(例如,编码或解码)另一个视图的信息(例如,运动估计、运动向量预测和/或其它冗余)。
在SVC中,由编码器或解码器使用的参数基于可以使用它们的编解码级别(例如,视频级别、序列级别、图片级别、条带级别等)被分组成参数集合。例如,可以由比特流中的不同层的一个或多个编解码视频序列使用的参数可以被包括在视频参数集合(VPS)中,并且由编解码视频序列中的一个或多个图片使用的参数可以被包括在序列参数集合(SPS)中。类似地,由图片中的一个或多个条带使用的参数可以被包括在图片参数集合(PPS)中,并且特定于单个条带的其它参数可以被包括在条带标头中。类似地,可以在各种编解码级别提供特定的层在给定的时间使用哪个参数集合的指示。
3.2.参数集合
AVC、HEVC和VVC指定参数集合。参数集合的类型包括SPS、PPS、APS、VPS和DPS。所有AVC、HEVC和VVC都支持SPS和PPS。VPS是自HEVC以来引入的,并且被包括在HEVC和VVC中。APS和DPS未被包括在AVC或HEVC中,但被包括在最新的VVC草案文本中。
SPS被设计用于携带序列级标头信息,并且PPS被设计用于携带不经常变化的图片级标头信息。使用SPS和PPS,不需要为每个序列或图片重复不经常变化的信息,因此可以避免这些信息的冗余信令。此外,SPS和PPS的使用能够实现重要标头信息的带外传输,因此不仅避免了冗余传输的需要,而且还提高了错误恢复能力。
引入VPS是为了携带多层比特流中所有层通用的序列级标头信息。
引入APS是为了携带这样的图片级别信息或条带级别信息,这些信息需要相当多的位来编解码,可以由多个图片共享,并且在一个序列中可以有相当多的不同变体。
引入DPS是为了携带比特流级别的信息,这些信息指示解码整个比特流所需的最高能力。
3.3.VVC中的VPS语法和语义
VVC支持可伸缩性,也被称为可伸缩视频编解码,其中,可以在一个编解码视频比特流中对多个层进行编码。
在最新的VVC文本中,在VPS中信令通知可伸缩性信息,语法和语义如下。
7.3.2.2视频参数集合语法
Figure BDA0003713486830000071
Figure BDA0003713486830000081
Figure BDA0003713486830000091
7.4.3.2视频参数集合RBSP语义
VPS RBSP在被参考之前应当可用于解码过程,包括在至少一个AU中,其中TemporalId等于0或通过外部方式提供。
CVS中具有vps_video_parameter_set_id的特定的值的所有VPS NAL单元应当具有相同的内容。
vps_video_parameter_set_id为VPS提供标识符,以供其它语法元素参考。vps_video_parameter_set_id的值应当大于0。
vps_max_layers_minus1加1规定参考VPS的每个CVS中的最大允许层数。
vps_max_sublayers_minus1加1规定参考VPS的每个CVS中可能存在的时域子层的最大数目。vps_max_sublayers_minus1的值应当在0到6的范围(包括0和6)内。
vps_all_layers_same_num_sublayers_flag等于1规定对于参考VPS的每个CVS中的所有层,时域子层的数目相同。vps_all_layers_same_num_sublayers_flag等于0规定参考VPS的每个CVS中的层可能具有相同数目的时域子层,也可能不具有相同数目的时域子层。当不存在时,vps_all_layers_same_num_sublayers_flag的值被推断为等于1。
vps_all_independent_layers_flag等于1规定CVS中的所有层都被独立编解码,而不使用层间预测。vps_all_independent_layers_flag等于0规定CVS中的一个或多个层可以使用层间预测。当不存在时,vps_all_independent_layers_flag的值被推断为等于1。当vps_all_independent_layers_flag等于1时,vps_independent_layer_flag[i]的值被推断为等于1。当vps_all_independent_layers_flag等于0时,vps_independent_layer_flag[0]的值被推断为等于1。
vps_layer_id[i]规定第i层的nuh_layer_id值。对于m和n的任何两个非负整数值,当m小于n时,vps_layer_id[m]的值应当小于vps_layer_id[n]。
vps_independent_layer_flag[i]等于1规定具有索引i的层不使用层间预测。vps_independent_layer_flag[i]等于0规定具有索引i的层可以使用层间预测,并且在VPS中存在语法元素vps_direct_ref_layer_flag[i][j](在0到i-1的范围(包括0和i-1)内的j)。当不存在时,vps_independent_layer_flag[i]的值被推断为等于1。
vps_direct_ref_layer_flag[i][j]等于0规定具有索引j的层不是具有索引i的层的直接参考层。vps_direct_ref_layer_flag[i][j]等于1规定具有索引j的层是具有索引i的层的直接参考层。当vps_direct_ref_layer_flag[i][j]不存在时(对于0到vps_max_layers_minus1的范围(包括0和vps_max_layers_minus1)内的i和j),它被推断为等于0。当vps_independent_layer_flag[i]等于0时,在0到i-1的范围(包括0和i-1)内应当存在至少一个j的值,使得vps_direct_ref_layer_flag[i][j]的值等于1。
按照如下方式推导变量NumDirectRefLayers[i]、DirectRefLayerIdx[i][d]、NumRefLayers[i]、RefLayerIdx[i][r]和LayerUsedAsRefLayerFlag[j]:
Figure BDA0003713486830000101
Figure BDA0003713486830000111
按照如下方式推导变量GeneralLayerIdx[i],其规定nuh_layer_id等于vps_layer_id[i]的层的层索引:
for(i=0;i<=vps_max_layers_minus1;
i++)(38)
GeneralLayerIdx[vps_layer_id[i]]=i
each_layer_is_an_ols_flag等于1规定每个输出层集合仅包含一个层,并且比特流中的每个层本身是输出层集合,其中单个包含层是唯一的输出层。each_layer_is_an_ols_flag等于0规定输出层集合可能包含多个层。如果vps_max_layers_minus1等于0,则each_layer_is_an_ols_flag的值被推断为等于1。否则,当vps_all_independent_layers_flag等于0时,each_layer_is_an_ols_flag的值被推断为等于0。
ols_mode_idc等于0规定由VPS规定的OLS的总数等于vps_max_layers_minus1+1,第i个OLS包括层索引从0到i(包括0和i)的层,并且对于每个OLS,仅输出OLS中的最高层。
ols_mode_idc等于1规定由VPS规定的OLS的总数等于vps_max_layers_minus1+1,第i个OLS包括层索引从0到i(包括0和i)的层,并且对于每个OLS,输出OLS中的所有层。
ols_mode_idc等于2规定由VPS规定的OLS的总数被显式地信令通知,并且对于每个OLS,输出层被显式地信令通知,而其它层是OLS的输出层的直接或间接参考层。
ols_mode_idc的值应当在0到2(包括0和2)的范围内。ols_mode_idc的值3被保留以供ITU-T|ISO/IEC未来使用。
当vps_all_independent_layers_flag等于1且each_layer_is_an_ols_flag等于0时,ols_mode_idc的值被推断为等于2。
num_output_layer_sets_minus1加1规定当ols_mode_idc等于2时VPS规定的OLS的总数。
按照如下方式导出变量TotalNumOlss,其规定VPS规定的OLS的总数:
Figure BDA0003713486830000121
ols_output_layer_flag[i][j]等于1规定当ols_mode_idc等于2时,nuh_layer_id等于vps_layer_id[j]的层是第i个OLS的输出层。ols_output_layer_flag[i][j]等于0规定当ols_mode_idc等于2时,nuh_layer_id等于vps_layer_id[j]的层不是第i个OLS的输出层。
按照如下方式导出规定第i个OLS中的输出层数目的变量NumOutputLayersInOls[i],以及规定第i个OLS中的第j个输出层的nuh_layer_id值的变量OutputLayerIdInOls[i][j]:
Figure BDA0003713486830000122
Figure BDA0003713486830000131
对于每个OLS,应当存在的至少一个层作为输出层。换句话说,对于0到TotalNumOlss-1的范围(包括0和TotalNumOlss-1)内的任何i值,NumOutputLayersInOls[i]的值应当大于或等于1。
按照如下方式导出规定第i个OLS中的层数的变量NumLayersInOls[i]、以及规定第i个OLS中的第j个层的nuh_layer_id值的变量LayerIdInOls[i][j]:
Figure BDA0003713486830000132
Figure BDA0003713486830000141
注1-第0个OLS仅包含最低层(即,nuh_layer_id等于vps_layer_id[0]的层),并且对于第0个OLS,仅输出包含的层。
按照如下方式导出规定nuh_layer_id等于LayerIdInOls[i][j]的层的OLS层索引的变量OlsLayerIdx[i][j]:
Figure BDA0003713486830000142
每个OLS中的最低层应当为独立层。换句话说,对于0到TotalNumOlss-1范围(包括0和TotalNumOlss-1)内的每个i,vps_independent_layer_flag[GeneralLayerIdx[LayerIdInOls[i][0]]的值应当等于1。
每个层应当被包括在由VPS规定的至少一个OLS中。换句话说,对于具有nuh_layer_id的特定的值nuhLayerId(等于vps_layer_id[k]中的一个,对于0到vps_max_layers_minus1范围(包括0和vps_max_layers_minus1)内的k)的每个层,应当存在至少一对i和j的值,其中i在0到TotalNumOlss-1的范围(包括0和TotalNumOlss-1)内,并且j在NumLayersInOls[i]-1(包括)的范围内,使得LayerIdInOls[i][j]的值等于nuhLayerId。
vps_num_ptls规定VPS中的profile_tier_level()语法结构的数目。
pt_present_flag[i]等于1规定VPS中的第i个profile_tier_level()语法结构中存在档次、层和一般约束信息。pt_present_flag[i]等于0规定VPS中的第i个profile_tier_level()语法结构中不存在档次、层和一般约束信息。pt_present_flag[0]的值被推断为等于0。当pt_present_flag[i]等于0时,VPS中的第i个profile_tier_level()语法结构的档次、层和一般约束信息被推断为与VPS中的第(i-1)个profile_tier_level()语法结构的档次、层和一般约束信息相同。
ptl_max_temporal_id[i]规定VPS中的第i个profile_tier_level()语法结构中存在级别信息的最高子层表示的TemporalId。ptl_max_temporal_id[i]的值应当在0到vps_max_sublayers_minus1的范围(包括0和vps_max_sublayers_minus1)内。当vps_max_sublayers_minus1等于0时,ptl_max_temporal_id[i]的值被推断为等于0。当vps_max_sublayers_minus1大于0且vps_all_layers_same_num_sublayers_flag等于1时,ptl_max_temporal_id[i]的值被推断为等于vps_max_sublayers_minus1。
vps_ptl_byte_alignment_zero_bit应当等于0。
ols_ptl_idx[i]规定应用于第i个OLS的profile_tier_level()语法结构在VPS中的profile_tier_level()语法结构列表的索引。当存在时,ols_ptl_idx[i]的值应当在0到vps_num_ptls-1的范围(包括0和vps_num_ptls-1)内。
当NumLayersInOls[i]等于1时,应用于第i个OLS的profile_tier_level()语法结构存在于第i个OLS中的层所参考的SPS中。
vps_num_dpb_params规定VPS中的dpb_parameters()语法结构的数目。vps_num_dpb_params的值应当在0到16的范围(包括0和16)内。当不存在时,vps_num_dpb_params的值被推断为等于0。
same_dpb_size_output_or_nonoutput_flag等于1规定VPS中不存在layer_nonoutput_dpb_params_idx[i]语法元素。same_dpb_size_output_or_nonoutput_flag等于0规定VPS中可能存在或可能不存在layer_nonoutput_dpb_params_idx[i]语法元素。
vps_sublayer_dpb_params_present_flag用于控制VPS中dpb_parameters()语法结构中的max_dec_pic_buffering_minus1[]、max_num_reorder_pics[]和max_latency_increase_plus1[]语法元素的存在。当不存在时,vps_sub_dpb_params_info_present_flag被推断为等于0。
dpb_size_only_flag[i]等于1规定VPS中的第i个dpb_参数()语法结构中不存在max_num_reorder_pics[]和max_latency_increase_plus1[]语法元素。dpb_size_only_flag[i]等于1规定VPS中的第i个dpb_parameters()语法结构中可能存在max_num_reorder_pics[]和max_latency_increase_plus1[]语法元素。
dpb_max_temporal_id[i]规定DPB参数可能存在于VPS中的第i个dpb_parameters()语法结构中的最高子层表示的TemporalId。dpb_max_temporal_id[i]的值应当在0到vps_max_sublayers_minus1的范围(包括0和vps_max_sublayers_minus1)内。当vps_max_sublayers_minus1等于0时,dpb_max_temporal_id[i]的值被推断为等于0。当vps_max_sublayers_minus1大于0且vps_all_layers_same_num_sublayers_flag等于1时,dpb_max_temporal_id[i]的值被推断为等于vps_max_sublayers_minus1。
layer_output_dpb_params_idx[i]规定VPS中的dpb_parameters()语法结构列表的索引,该语法结构应用于当作为OLS中的输出层时的第i层。当存在时,layer_output_dpb_params_idx[i]的值应当在0到vps_num_dpb_params-1的范围(包括0和vps_num_dpb_params-1)内。
如果vps_independent_layer_flag[i]等于1,则当第i层是输出层时,应用于第i层的dpb_parameters()语法结构是该层参考的SPS中存在的dpb_parameter()语法结构。
否则(vps_independent_layer_flag[i]等于0),以下内容适用:
-当vps_num_dpb_params等于1时,layer_output_dpb_params_idx[i]的值被推断为等于0。
-比特流一致性的一个要求是,layer_output_dpb_params_idx[i]的值应当使得dpb_size_only_flag[layer_output_dpb_params_idx[i]]等于0。
layer_nonoutput_dpb_params_idx[i]规定VPS中的dpb_parameters()语法结构列表的索引,该语法结构应用于当作为OLS中的非输出层的第i层。当存在时,layer_nonoutput_dpb_params_idx[i]的值应当在0到vps_num_dpb_params-1的范围(包括0和vps_num_dpb_params-1)内。
如果same_dpb_size_output_or_nonoutput_flag等于1,则以下内容适用:
-如果vps_independent_layer_flag[i]等于1,则当第i层为非输出层时,应用于该层的dpb_parameters()语法结构是该层所参考的SPS中存在的dpb_parameters()语法结构。
-否则(vps_independent_layer_flag[i]等于0),layer_nonoutput_dpb_params_idx[i]的值被推断为等于layer_output_dpb_params_idx[i]。
否则(same_dpb_size_output_or_nonoutput_flag等于0),当vps_num_dpb_params等于1时,layer_output_dpb_params_idx[i]的值被推断为等于0。
vps_general_hrd_params_present_flag等于1规定语法结构general_hrd_parameters()和其它HRD参数存在于VPS RBSP语法结构中。vps_general_hrd_params_present_flag等于0规定VPS RBSP语法结构中不存在语法结构general_hrd_parameters()和其它HRD参数。
vps_sublayer_cpb_params_present_flag等于1规定VPS中的第i个ols_hrd_parameters()语法结构包含子层表示的HRD参数,其中TemporalId在0到hrd_max_tid[i]的范围(包括0和hrd_max_tid[i])内。vps_sublayer_cpb_params_present_flag等于0规定VPS中的第i个ols_hrd_parameters()语法结构包含子层表示的HRD参数,其中TemporalId仅等于hrd_max_tid[i]。当vps_max_sublayers_minus1等于0时,vps_sublayer_cpb_params_present_flag的值被推断为等于0。
当vps_sublayer_cpb_params_present_flag等于0时,子层表示的HRD参数(其中TemporalId在0到hrd_max_tid[i]-1的范围(包括0和hrd_max_tid[i]-1)内)被推断为与子层表示的HRD参数(其中TemporalId等于hrd_max_tid[i])相同。这些包括这样的HRD参数:从fixed_pic_rate_general_flag[i]语法元素开始,直到ols_hrd_parameters语法结构中“if(general_vcl_hrd_params_present_flag)”条件下的sublayer_hrd_parameters(i)语法结构。
num_ols_hrd_params_minus1加1规定在general_hrd_parameters()语法结构中存在的ols_hrd_parameters()语法结构的数目。num_ols_hrd_params_minus1的值应当在0到63的范围(包括0和63)内。当TotalNumOlss大于1时,num_ols_hrd_params_minus1的值被推断为等于0。
hrd_max_tid[i]规定最高子层表示的TemporalId,对于该表示,HRD参数被包含在第i个ols_hrd_parameters()语法结构中。hrd_max_tid[i]的值应当在0到vps_max_sublayers_minus1的范围(包括0和vps_max_sublayers_minus1)内。当vps_max_sublayers_minus1等于0时,hrd_max_tid[i]的值被推断为等于0。
ols_hrd_idx[i]规定应用于第i个OLS的ols_hrd_parameters()语法结构的索引。ols_hrd_idx[[i]的值应当在0到num_ols_hrd_params_minus1的范围(包括0和num_ols_hrd_params_minus1)内。当不存在时,ols_hrd_idx[[i]的值被推断为等于0。
vps_extension_flag等于0规定VPS RBSP语法结构中不存在vps_extension_data_flag语法元素。vps_extension_flag等于1规定VPS RBSP语法结构中存在vps_extension_data_flag语法元素。
vps_extension_data_flag可以有任何值。其存在和值不影响解码器与此规范的此版本中规定的档次的一致性。符合此规范的此版本的解码器应当忽略所有vps_extension_data_flag语法元素。
3.4.VVC中的SPS语法和语义
在JVET-P2001-v14中最新的VVC草案文本中,与本文发明最相关的SPS语法和语义如下所示。
7.3.2.3序列参数集RBSP语法
Figure BDA0003713486830000181
7.4.3.3序列参数集RBSP语义
SPS RBSP在被参考、被包括在至少一个AU中(其中TemporalId等于0)或通过外部方式被提供之前,应当可用于解码过程。
CVS中具有sps_seq_parameter_set_id的特定的值的所有SPS NAL单元应当具有相同的内容。
sps_decoding_parameter_set_id大于0时,规定SPS参考的DPS的dps_decoding_parameter_set_id的值。当sps_decoding_parameter_set_id等于0时,SPS不参考DPS,并且在对参考SPS的每个CLVS进行解码时不参考DPS。sps_decoding_parameter_set_id的值在由比特流中的编解码图片参考的所有SPS中应当相同。
sps_video_parameter_set_id大于0时,规定由SPS参考的VPS的vps_video_parameter_set_id的值。
当sps_video_parameter_set_id等于0时,以下内容适用:
-SPS不参考VPS。
-当解码每个参考SPS的CLVS时,不参考VPS。
-vps_max_layers_minus1的值被推断为等于0。
-CVS应当仅包含一个层(即,CVS中的所有VCL NAL单元应当具有相同的nuh_layer_id值)。
-GeneralLayerIdx[nuh_layer_id]的值被推断为等于0。
-vps_independent_layer_flag[GeneralLayerIdx[nuh_layer_id]]的值被推断为等于1。
当vps_independent_layer_flag[GeneralLayerIdx[nuh_layer_id]]等于1时,具有特定nuh_layer_id值nuhLayerId的CLVS所参考的SPS应当具有等于nuhLayerId的nuh_layer_id。
sps_max_sublayers_minus1加1规定每个参考SPS的CLVS中可能存在的时域子层的最大数目。sps_max_sublayers_minus1的值应当在0到vps_max_sublayers_minus1的范围(包括0和vps_max_sublayers_minus1)内。
sps_reserved_zero_4bits在符合此规范的此版本的比特流中应当等于0。sps_reserved_zero_4bits的其它值被保留以供ITU-T|ISO/IEC未来使用。
sps_ptl_dpb_hrd_params_present_flag等于1规定SPS中存在profile_tier_level()语法结构和dpb_parameters()语法结构,并且SPS中也可能存在general_hrd_parameters()语法结构和ols_hrd_parameters()语法结构。sps_ptl_dpb_hrd_params_present_flag等于0规定SPS中不存在这些语法结构。sps_ptl_dpb_hrd_params_present_flag的值应当等于vps_independent_layer_flag[nuh_layer_id]。
如果vps_independent_layer_flag[GeneralLayerIdx[nuh_layer_id]]等于1,则变量MaxDecPicBuffMinus1将被设置为SPS中dpb_parameters()语法结构中的max_dec_pic_buffering_minus1[sps_max_sublayers_minus1]。否则,MaxDecPicBuffMinus1被设置为等于VPS中的第layer_nonoutput_dpb_params_idx[GeneralLayerIdx[nuh_layer_id]]个dpb_parameters()语法结构中的max_dec_pic_buffering_minus1[sps_max_sublayers_minus1]。
3.5.VVC中的条带标头语法和语义
在JVET-P2001-v14中最新的VVC草案文本中,与本发明最相关的条带标头语法和语义如下所示。
7.3.7.1通用条带标头语法
Figure BDA0003713486830000201
7.4.8.1通用条带标头语义
slice_type根据表格9规定条带的编解码类型
表格9-与slice_type相关联的名称
slice_type slice_type的名称
0 B(B条带)
1 P(P条带)
2 I(I条带)
当nal_unit_type是在IDR_W_RADL到CRA_NUT范围(包括IDR_W_RADL和CRA_NUT)内的nal_unit_type的值,并且当前图片是访问单元中的第一张图片,则slice_type应当等于2。
4.所描述的技术解决方案解决的技术问题
VVC中现有的可扩展设计存在以下问题:
1)最新的VVC草案文本包括对slice_type的以下约束:
当nal_unit_type是IDR_W_RADL到CRA_NUT范围(包括IDR_W_RADL和CRA_NUT)内的nal_unit_type值,并且当前图片是AU中的第一张图片时,slice_type应当等于2。
对于一个条带,slice_type的值等于2意味着该条带是在不使用来自参考图片的帧间预测的情况下进行帧内编解码的。
然而,在AU中,不仅位于AU中且作为IRAP图片的第一张图片需要仅包含帧内编解码条带,而且所有独立层中的所有IRAP图片也需要仅包含帧内编解码条带。因此,上述约束确实需要被更新。
2)当语法元素ols_ptl_idx[i]不存在时,仍然需要使用该值。然而,当ols_ptl_idx[i]不存在时,缺乏对其值的推断。
3)当第i层未在任何OLS中用作输出层时,语法元素layer_output_dpb_params_idx[i]的信令通知是不必要的。
4)语法元素vps_num_dpb_params的值可以等于0。然而,当vps_all_independent_layers_flag等于0时,VPS中需要至少有一个dpb_parameters()语法结构。
5)在最新的VVC草案文本中,OLS的PTL信息仅包含一个层,该层是不参考任何其它层的独立编解码层,仅在SPS中被信令通知。然而,出于会话协商的目的,期望为VPS中的比特流中的所有OLS信令通知PTL信息。
6)当VPS中信令通知的PTL语法结构的数目为零时,不必要地信令通知vps_ptl_byte_alignment_zero_bit语法元素。
7)在sps_video_parameter_set_id的语义中,有以下约束:
当sps_video_parameter_set_id等于0时,CVS应当仅包含一个层(即,CVS中的所有VCL NAL单元应当具有相同的nuh_layer_id值)。
然而,此约束不允许在多层比特流中包括不参考VPS的独立层。由于sps_video_parameter_set_id等于0意味着SPS(和层)不参考VPS。
8)当each_layer_is_an_ols_flag等于1时,vps_general_hrd_params_present_flag的值可以等于1。然而,当each_layer_is_an_ols_flag等于1时,仅在SPS中信令通知HRD参数,因此vps_general_hrd_params_present_flag的值不应当等于1。在一些情况下,在VPS中信令通知零个old_hrd_parameters()语法结构时,信令通知general_hrd_parameter()语法结构可能没有意义。
9)在VPS和SPS二者中信令通知仅包含一个层的OLS的HRD参数。然而,对于仅包含一个层的OLS,在VPS中重复HRD参数是没有用的。
5.示例实施例和技术
为了解决上述问题和其它问题,公开了如下总结的方法。这些发明应当被视为解释一般概念的示例,并且不应当被狭隘地解释。此外,这些发明可以被单独应用或以任何方式组合应用。
1)为了解决第一个问题,规定了以下约束:
当nal_unit_type在IDR_W_RADL到CRA_NUT的范围(包括IDR_W_RADL和CRA_NUT)内,并且vps_independent_layer_flag[GeneralLayerIdx[nuh_layer_id]]等于1时,slice_type应当等于2。
2)为了解决第二个问题,对于i的可能值的每个值,当语法元素不存在时,ols_ptl_idx[i]的值被推断为等于0。
3)为了解决第三个问题,规定变量LayerUsedAsOutputLayerFlag[i]以指示在任何OLS中是否将该第i层用作输出层,并且当该变量等于0时,避免了变量layer_output_dpb_params_idx[i]的信令通知。
a.此外,可以另外规定以下约束:对于0到vps_max_layers_minus1的范围(包括0和vps_max_layers_minus1)内的i的每个值,LayerUsedAsRefLayerFlag[i]和LayerUsedAsOutputLayerFlag[i]的值不应当都等于0。换句话说,不应当存在既不是任何其它层的直接参考层,也不是至少一个OLS的输出层的层。
4)为了解决第四个问题,将vps_num_dpb_params更改为vps_num_dpb_params_minus1,并将VpsNumDpbParams规定如下:
如果(!vps_all_independent_layers_flag)
VpsNumDpbParams=vps_num_dpb_params_minus1+1
否则
VpsNumDpbParams=0
并且用VpsNumDpbParams替换语法条件和语义中使用的vps_num_dpb_params。
a.此外,另外规定了以下约束:当不存在时,same_dpb_size_output_or_nonoutput_flag的值被推断为等于1。
5)为了解决第五个问题,出于会话协商的目的,允许在VPS中重复仅包含一个层的OLS的PTL信息。这可以通过将vps_num_ptls更改为vps_num_ptls_minus1来实现。
a.可替代地,保留vps_num_ptls(不使其为vps_num_ptls_minus1),但从ols_ptl_idx[i]的语法条件中移除“NumLayersInOls[i]>1&&”。
a.可替代地,保留vps_num_ptls(不使其为vps_num_ptls_minus1),但将vps_num_ptls条件设置为“如果(!each_layer_is_an_ols_flag)”或“如果(vps_max_layers_minus1>0&&!vps_all_independent_layers_flag)”。
b.可替代地,还允许对仅包含VPS中的一个层的OLS重复DPB参数信息(仅DPB尺寸或所有DPB参数)。
6)为了解决第六个问题,只要在VPS中信令通知的PTL语法结构的数目为零,vps_ptl_byte_alignment_zero_bit语法元素就不会被信令通知。这可以通过将vps_ptl_byte_alignment_zero_bit条件设置为“如果(vps_num_ptls>0)”,或者通过将vps_num_ptls更改为vps_num_ptls_minus1来实现,这有效地不允许VPS中信令通知的PTL语法结构的数目等于零。
7)为了解决第七个问题,移除以下约束:
当sps_video_parameter_set_id等于0时,CVS应当仅包含一个层(即,CVS中的所有VCL NAL单元应当具有相同的nuh_layer_id值)。
并添加以下约束:
sps_video_parameter_set_id的值在由CVS中的编解码图片参考的所有SPS中应当相同,并且sps_video_parameter_set_id大于0。
a.可替代地,保留以下约束:
当sps_video_parameter_set_id等于0时,CVS应当仅包含一个层(即,CVS中的所有VCL NAL单元应当具有相同的nuh_layer_id值)。
并规定以下约束:
sps_video_parameter_set_id的值在由CVS中的编解码图片参考的所有SPS中应当相同。
8)为了解决第八个问题,当vps_general_hrd_params_present_flag等于1时,语法元素vps_general_hrd_params_present_flag不被信令通知,并且当不存在时,vps_general_hrd_params_present_flag的值被推断为等于0。
a.可替代地,当each_layer_is_an_ols_flag等于1时,vps_general_hrd_params_present_flag的值被限制为等于0。
b.此外,由于不需要语法元素num_ols_hrd_params_minus1的语法条件,即“如果(TotalNumOlss>1)”,因此其将被移除。这是因为,当TotalNumOlss等于1时,each_layer_is_an_ols_flag的值将等于1,并且然后vps_general_hrd_params_present_flag的值将等于0,那么VPS中不会信令通知HRD参数。
在一些情况下,当VPS中不存在ols_hrd_parameters()语法结构,在VPS中不信令通知general_hrd_parameters()语法结构。
9)为了解决第九个问题,仅在SPS中而不在VPS中信令通知仅包含一个层的OLS的HRD参数。
6.实施例
以下是上文第5节中总结的方面的一些示例实施例,其可以应用于VVC规范。更改的文本基于JVET-P2001-v14中最新的VVC文本。大多数已添加或修改的相关部分以下划线 黑体进行突出显示,一些已删除的部分以斜体黑体突出显示。还有其它一些改变是编辑性质的,并且因此没有被突出显示。
6.1.第一实施例
6.1.1.VPS语法和语义
7.3.2.2视频参数集语法
Figure BDA0003713486830000241
Figure BDA0003713486830000251
Figure BDA0003713486830000261
7.4.3.2视频参数集RBSP语义
ols_output_layer_flag[i][j]等于1规定当ols_mode_idc等于2时,nuh_layer_id等于vps_layer_id[j]的层是第i个OLS的输出层。ols_output_layer_flag[i][j]等于0规定当ols_mode_idc等于2时,nuh_layer_id等于vps_layer_id[j]的层不是第i个OLS的输出层。
按照如下方式导出规定第i个OLS中的输出层数目的变量NumOutputLayersInOls[i],以及规定第i个OLS中的第j个输出层的nuh_layer_id值的变量OutputLayerIdInOls[i][j]:
Figure BDA0003713486830000262
Figure BDA0003713486830000271
Figure BDA0003713486830000273
对于每个OLS,应当存在作为输出层的至少一个层。换句话说,对于0到TotalNumOlss-1范围(包括0和TotalNumOlss-1)内的任何i值,NumOutputLayersInOls[i]的值应当大于或等于1。
按照如下方式导出规定第i个OLS中的层的数目的变量NumLayersInOls[i],以及规定第i个OLS中的第j个层的nuh_layer_id值的变量LayerIdInOls[i][j]:
Figure BDA0003713486830000272
Figure BDA0003713486830000281
注-第0个OLS仅包含最低层(即,nuh_layer_id等于vps_layer_id[0]的层),并且对于第0个OLS仅输出包含的层。
按照如下方式导出规定nuh_layer_id等于LayerIdInOls[i][j]的层的OLS层索引的变量OlsLayeIdx[i][j]:
Figure BDA0003713486830000282
每个OLS中的最低层应当为独立层。换句话说,对于0到TotalNumOlss-1范围(包括0和TotalNumOlss-1)内的每个i,vps_independent_layer_flag[GeneralLayerIdx[LayerIdInOls[i][0]]的值应当等于1。
每个层应当被包括在由VPS规定的至少一个OLS中。换句话说,对于nuh_layer_id的特定的值nuhLayerId等于vps_layer_id[k](对于在0到vps_max_layers_minus1的范围(包括0和vps_max_layers_minus1)内)之一的每个层,应当存在至少一对i和j的值,其中i在0到TotalNumOlss-1的范围(包括0和TotalNumOlss-1)内,并且j在NumLayersInOls[i]-1的范围(包括NumLayersInOls[i]-1)内,使得LayerIdInOls[i][j]的值等于nuhLayerId。
Figure BDA0003713486830000283
规定VPS中的profile_tier_level()语法结构的数目。
pt_present_flag[i]等于1规定VPS中的第i个profile_tier_level()语法结构中存在档次、层和一般约束信息。pt_present_flag[i]等于0规定VPS中的第i个profile_tier_level()语法结构中不存在档次、层和一般约束信息。pt_present_flag[0]的值被推断为等于1。当pt_present_flag[i]等于0时,VPS中的第i个profile_tier_level()语法结构的档次、层和一般约束信息被推断为与VPS中的第(i-1)个profile_tier_level()语法结构的档次、层和一般约束信息相同。
ptl_max_temporal_id[i]规定最高子层表示的TemporalId,对于该表示VPS中的第i个profile_tier_level()语法结构中存在级别信息。ptl_max_temporal_id[i]的值应当在0到vps_max_sublayers_minus1的范围(包括0和vps_max_sublayers_minus1)内。当vps_max_sublayers_minus1等于0时,ptl_max_temporal_id[i]的值被推断为等于0。当vps_max_sublayers_minus1大于0且vps_all_layers_same_num_sublayers_flag等于1时,ptl_max_temporal_id[i]的值被推断为等于vps_max_sublayers_minus1。
vps_ptl_byte_alignment_zero_bit应当等于0。
ols_ptl_idx[i]规定应用于第i个OLS的profile_tier_level()语法结构在VPS中的profile_tier_level()语法结构列表的索引。当存在时,ols_ptl_idx[i]的值应当在0到
Figure BDA0003713486830000292
的范围(包括0和vps_num_ptls_minus1)内。
Figure BDA0003713486830000293
当NumLayersInOls[i]等于1时,应用于第i个OLS的profile_tier_level()语法结构
Figure BDA0003713486830000294
存在于由第i个OLS中的层参考的SPS中。
Figure BDA0003713486830000295
加1规定VPS中的dpb_parameters()语法结构的数目。当存在时,
Figure BDA0003713486830000296
的值应当在0到15的范围(包括0和15)内。
Figure BDA0003713486830000297
Figure BDA0003713486830000291
same_dpb_size_output_or_nonoutput_flag等于1规定VPS中不存在layer_nonoutput_dpb_params_idx[i]语法元素。same_dpb_size_output_or_nonoutput_flag等于0规定VPS中可能存在或可能不存在layer_nonoutput_dpb_params_idx[i]语法元素。
Figure BDA0003713486830000301
Figure BDA0003713486830000302
vps_sublayer_dpb_params_present_flag用于控制VPS中dpb_parameters()语法结构中max_dec_pic_buffering_minus1[]、max_num_reorder_pics[]和max_latency_increase_plus1[]语法元素的存在。当不存在时,vps_sub_dpb_params_info_present_flag被推断为等于0。
dpb_size_only_flag[i]等于1规定VPS中的第i个dpb_parameters()语法结构中不存在max_num_reorder_pics[]和max_latency_increase_plus1[]语法元素。dpb_size_only_flag[i]等于0规定VPS中的第i个dpb_parameters()语法结构中可能存在max_num_reorder_pics[]和max_latency_increase_plus1[]语法元素。
dpb_max_temporal_id[i]规定最高子层表示的TemporalId,对于该表示DPB参数可能存在于VPS中的第i个dpb_parameters()语法结构中。dpb_max_temporal_id[i]的值应当在0到vps_max_sublayers_minus1的范围(包括0和vps_max_sublayers_minus1)内。当vps_max_sublayers_minus1等于0时,dpb_max_temporal_id[i]的值被推断为等于0。当vps_max_sublayers_minus1大于0且vps_all_layers_same_num_sublayers_flag等于1时,dpb_max_temporal_id[i]的值被推断为等于vps_max_sublayers_minus1。
layer_output_dpb_params_idx[i]规定应用于OLS中作为输出层的第i层的dpb_parameters()语法结构在VPS中的dpb_parameters()语法结构列表的索引。当存在时,layer_output_dpb_params_idx[i]的值应当在0到
Figure BDA0003713486830000303
的范围(包括0和VpsNumDpbParams-1)内。
如果vps_independent_layer_flag[i]等于1,则当第i层是输出层时,应用于第i层的dpb_parameters()语法结构是该层参考的SPS中存在的dpb_parameters()语法结构。
否则(vps_independent_layer_flag[i]等于0),以下内容适用:
-当
Figure BDA0003713486830000304
等于1时,layer_output_dpb_params_idx[i]的值被推断为等于0。
-比特流一致性的一个要求是,layer_output_dpb_params_idx[i]的值应当使得dpb_size_only_flag[layer_output_dpb_params_idx[i]]等于0。
layer_nonoutput_dpb_params_idx[i]规定应用于OLS中作为非输出层的第i层的dpb_parameters()语法结构在VPS中的dpb_parameters()语法结构列表的索引。当存在时,layer_nonoutput_dpb_params_idx[i]的值应当在0到VpsNumDpbParams-1的范围(包括0和VpsNumDpbParams-1)内。
如果same_dpb_size_output_or_nonoutput_flag等于1,则以下内容适用:
-如果vps_independent_layer_flag[i]等于1,则当第i层为非输出层时,应用于该层的dpb_parameters()语法结构是该层所参考的SPS中存在的dpb_parameters()语法结构。
-否则(vps_independent_layer_flag[i]等于0),layer_nonoutput_dpb_params_idx[i]的值被推断为等于layer_output_dpb_params_idx[i]。
否则(same_dpb_size_output_or_nonoutput_flag等于0),当VpsNumDpbParams等于1时,layer_output_dpb_params_idx[i]的值被推断为等于0。
vps_general_hrd_params_present_flag等于1规定语法结构general_hrd_parameters()和其它HRD参数存在于VPS RBSP语法结构中。vps_general_hrd_params_present_flag等于0规定VPS RBSP语法结构中不存在语法结构general_hrd_parameters()和其它HRD参数。
Figure BDA0003713486830000311
Figure BDA0003713486830000312
vps_sublayer_cpb_params_present_flag等于1规定VPS中的第i个ols_hrd_parameters()语法结构包含子层表示的HRD参数,其中TemporalId在0到hrd_max_tid[i]的范围(包括0和hrd_max_tid[i])内。vps_sublayer_cpb_params_present_flag等于0规定VPS中的第i个ols_hrd_parameters()语法结构包含子层表示的HRD参数,其中TemporalId仅等于hrd_max_tid[i]。当vps_max_sublayers_minus1等于0时,vps_sublayer_cpb_params_present_flag的值被推断为等于0。
当vps_sublayer_cpb_params_present_flag等于0时,TemporalId在0到hrd_max_tid[i]-1范围(包括0和hrd_max_tid[i]-1)内子层表示的HRD参数被推断为与TemporalId等于hrd_max_tid[i]的子层表示的HRD参数相同。这些包括这样的HRD参数:从fixed_pic_rate_general_flag[i]语法元素开始,直到立即在ols_hrd_parameters语法结构中的“if(general_vcl_hrd_params_present_flag)”条件下的sublayer_hrd_parameters(i)语法结构。
num_ols_hrd_params_minus1加1规定
Figure BDA0003713486830000321
Figure BDA0003713486830000322
在general_hrd_parameters()语法结构中存在的ols_hrd_parameters()语法结构的数目。num_ols_hrd_params_minus1的值应当在0到63的范围(包括0和63)内。
Figure BDA0003713486830000323
hrd_max_tid[i]规定最高子层表示的TemporalId,对于该表示HRD参数被包含在第i个ols_hrd_parameters()语法结构中。hrd_max_tid[i]的值应当在0到vps_max_sublayers_minus1的范围(包括0和vps_max_sublayers_minus1)内。当vps_max_sublayers_minus1等于0时,hrd_max_tid[i]的值被推断为等于0。当vps_max_sublayers_minus1大于0且vps_all_layers_same_num_sublayers_flag等于1时,hrd_max_tid[i]的值被推断为等于vps_max_sublayers_minus1。
ols_hrd_idx[i]规定
Figure BDA0003713486830000324
应用于第i个OLS的ols_hrd_parameters()语法结构的
Figure BDA0003713486830000325
Figure BDA0003713486830000326
的索引。当存在时,ols_hrd_idx[[i]的值应当在0到num_ols_hrd_params_minus1的范围(包括0和num_ols_hrd_params_minus1)内。当
Figure BDA0003713486830000327
时,ols_hrd_idx[[i]的值被推断为等于0。
vps_extension_flag等于0规定VPS RBSP语法结构中不存在vps_extension_data_flag语法元素。vps_extension_flag等于1规定VPS RBSP语法结构中存在vps_extension_data_flag语法元素。
vps_extension_data_flag可以有任何值。其存在和值不影响解码器与此规范的此版本中规定的档次的一致性。符合此规范的此版本的解码器应当忽略所有vps_extension_data_flag语法元素。
6.1.2.SPS语义
7.4.3.3序列参数集RBSP语义
SPS RBSP在被参考、被包括在至少一个AU(其中TemporalId等于0)中或通过外部方式提供之前,应当可用于解码过程。
CVS中具有sps_seq_parameter_set_id的特定值的所有SPS NAL单元应当具有相同的内容。
sps_decoding_parameter_set_id大于0时,规定SPS参考的DPS的dps_decoding_parameter_set_id的值。当sps_decoding_parameter_set_id等于0时,SPS不参考DPS,并且在对参考SPS的每个CLVS进行解码时没有DPS被参考。sps_decoding_parameter_set_id的值在比特流中编解码图片参考的所有SPS中应当相同。
sps_video_parameter_set_id大于0时,规定SPS参考的VPS的vps_video_parameter_set_id的值。
Figure BDA0003713486830000332
Figure BDA0003713486830000331
当sps_video_parameter_set_id等于0时,以下内容适用:
-SPS不参考VPS。
-当对参考SPS的每个CLVS进行解码时,不参考VPS。
-vps_max_layers_minus1的值被推断为等于0。
Figure BDA0003713486830000333
-GeneralLayerIdx[nuh_layer_id]的值被推断为等于0。
-vps_independent_layer_flag[GeneralLayerIdx[nuh_layer_id]]的值被推断为等于1。
当vps_independent_layer_flag[GeneralLayerIdx[nuh_layer_id]]等于1时,由具有特定的nuh_layer_id值nuhLayerId的CLVS参考的SPS应当具有等于nuhLayerId的nuh_layer_id。
6.1.3.条带标头语义
7.4.8.1通用条带标头语义
...
slice_type根据表格9规定条带的编解码类型。
表格9-与slice_type相关联的名称
slice_type slice_type的名称
0 B(B条带)
1 P(P条带)
2 I(I条带)
当nal_unit_type在IDR_W_RADL到CRA_NUT的范围(包括IDR_W_RADL和CRA_NUT)内,
Figure BDA0003713486830000341
Figure BDA0003713486830000342
slice_type应当等于2。
图1是示出示例视频处理系统1900的框图,其中,可以实现本文公开的各种技术。各种实现可以包括系统1900的部分或全部组件。系统1900可以包括用于接收视频内容的输入1902。视频内容可以以原始或未压缩格式(例如,8位或10位多分量像素值)接收,或者可以以压缩或编码格式接收。输入1902可以表示网络接口、外围总线接口或存储接口。网络接口的示例包括有线接口(例如,以太网、无源光学网络(PON)等),以及无线接口(例如,Wi-Fi或蜂窝接口)。
系统1900可以包括编解码组件1904,其可以实现本文档中描述的各种编码或编码方法。编解码组件1904可以将视频的平均比特率从输入1902降低到编解码组件1904的输出,以产生视频的编解码表示。因此,编解码技术有时被称为视频压缩或视频转码技术。编解码组件1904的输出可以被存储,或者经由由组件1906表示的连接的通信来传输。在输入1902处接收的视频的存储的或传送的比特流(或编解码的)表示可以由组件1908用于生成发送到显示接口1910的像素值或可显示视频。根据比特流生成用户可观看视频的过程有时被称为视频解压缩。此外,尽管某些视频处理操作被称为“编解码”操作或工具,但将理解的是,在编码器处使用编解码工具或操作,并且反转编码结果的对应的解码工具或操作将由解码器执行。
外围总线接口或显示接口的示例可能包括通用串行总线(USB)或高清多媒体接口(HDMI)或Displayport等。存储接口的示例包括SATA(串行高级技术附件)、PCI、IDE接口等。本文档中描述的技术可以体现在各种电子设备中,例如移动电话、膝上型计算机、智能手机或能够执行数字数据处理和/或视频显示的其它设备。
图2是视频处理装置3600的框图。装置3600可以用于实现本文所描述的一种或多种方法。装置3600可以体现在智能手机、平板电脑、计算机、物联网(IoT)接收器等中。装置3600可以包括一个或多个处理器3602、一个或多个存储器3604和视频处理硬件3606。(多个)处理器3602可以被配置为实现本文档中描述的一个或多个方法。一个或多个存储器3604可以用于存储用于实现本文所描述的方法和技术的数据和代码。视频处理硬件3606可以用于在硬件电路中实现本文档中描述的一些技术。在一些实施例中,硬件3606可以部分或全部位于(多个)处理器3602(例如,图形处理器)内。
图4是示出可以利用本公开技术的示例视频编解码系统100的框图。
如图4所示,视频编解码系统100可以包括源设备110和目的地设备120。源设备110生成可以被称为视频编码设备的编码视频数据。目的地设备120可以对源设备110生成的编码视频数据进行解码,源设备110可以被称为视频解码设备。
源设备110可以包括视频源112、视频编码器114和输入/输出(I/O)接口116。
视频源112可以包括诸如视频捕获设备之类的源、从视频内容提供商接收视频数据的接口和/或用于生成视频数据的计算机图形系统,或这些源的组合。视频数据可以包括一个或多个图片。视频编码器114对来自视频源112的视频数据进行编码以生成比特流。比特流可以包括形成视频数据的编解码表示的比特序列。比特流可以包括编解码图片和相关联数据。编解码图片是图片的编解码表示。相关联的数据可以包括序列参数集、图片参数集和其它语法结构。I/O接口116可以包括调制器/解调器(调制解调器)和/或发射器。编码的视频数据可以通过网络130a经由I/O接口116直接发送到目的地设备120。编码的视频数据还可以存储在存储介质/服务器130b上,以供目的地设备120访问。
目的地设备120可以包括I/O接口126、视频解码器124和显示设备122。
I/O接口126可以包括接收器和/或调制解调器。I/O接口126可以从源设备110或存储介质/服务器130b获取编码的视频数据。视频解码器124可以对编码的视频数据进行解码。显示设备122可以向用户显示解码的视频数据。显示设备122可以与目的地设备120集合,或者可以位于目的地设备120的外部,目的地设备120被配置为与外部显示设备接合。
视频编码器114和视频解码器124可以根据视频压缩标准(例如高效视频编解码(HEVC)标准、通用视频编解码(VVM)标准和其它当前和/或进一步的标准)操作。
图5是示出视频编码器200的示例的框图,视频编码器200可以是图4所示的系统100中的视频编码器114。
视频编码器200可以被配置为执行本公开的任何或所有技术。在图5的示例中,视频编码器200包括多个功能组件。本公开中描述的技术可以在视频编码器200的各个组件之间共享。在一些示例中,处理器可以被配置为执行本公开中描述的任何或所有技术。
视频编码器200的功能组件可以包括分割单元201、可以包括模式选择单元203的预测单元202、运动估计单元204、运动补偿单元205和帧内预测单元206、残差生成单元207、变换单元208、量化单元209、反量化单元210、反变换单元211,重建单元212、缓冲区213和熵编码单元214。
在其它示例中,视频编码器200可以包括更多、更少或不同的功能组件。在一个示例中,预测单元202可以包括帧内块复制(IBC)单元。IBC单元可以在IBC模式下执行预测,其中至少一个参考图片是当前视频块所在的图片。
此外,一些组件(例如运动估计单元204和运动补偿单元205)可以是高度集合的,但是出于解释的目的,在图5的示例中分别表示。
分割单元201可以将图片分割成一个或多个视频块。视频编码器200和视频解码器300可以支持各种视频块尺寸。
模式选择单元203可以例如基于错误结果选择编解码模式中的一种(帧内或帧间),并将得到的帧内或帧间编解码块提供给残差生成单元207以生成残差块数据,以及提供给重建单元212以重建编码块以用作参考图片。在一些示例中,模式选择单元203可以选择帧内预测和帧间预测(CIIP)模式的组合,其中预测基于帧间预测信号和帧内预测信号。模式选择单元203还可以在帧间预测的情况下为块选择运动向量的分辨率(例如,子像素精度或整数像素精度)。
为了对当前视频块执行帧间预测,运动估计单元204可以通过将来自缓冲区213的一个或多个参考帧与当前视频块进行比较来生成当前视频块的运动信息。运动补偿单元205可以基于来自缓冲区213的、与当前视频块相关联的图片以外的图片的运动信息和解码样本来确定当前视频块的预测视频块。
例如,运动估计单元204和运动补偿单元205可以对当前视频块执行不同的操作,这取决于当前视频块是在I条带、P条带还是B条带中。
在一些示例中,运动估计单元204可以对当前视频块执行单向预测,并且运动估计单元204可以在列表0或列表1的参考图片中搜索当前视频块的参考视频块。然后,运动估计单元204可以生成参考索引,该索引指示包含参考视频块的列表0或列表1中的参考图片,以及指示当前视频块和参考视频块之间的空域位移的运动向量。运动估计单元204可以输出参考索引、预测方向指示符和运动向量作为当前视频块的运动信息。运动补偿单元205可以基于由当前视频块的运动信息指示的参考视频块来生成当前块的预测视频块。
在其它示例中,运动估计单元204可以对当前视频块执行双向预测,运动估计单元204可以在列表0中的参考图片中搜索当前视频块的参考视频块,还可以在列表1中的参考图片中搜索当前视频块的另一个参考视频块。然后,运动估计单元204可以生成指示包含参考视频块的列表0和列表1中的参考图片的参考索引,以及指示参考视频块和当前视频块之间的空域位移的运动向量。运动估计单元204可以输出当前视频块的参考索引和运动向量作为当前视频块的运动信息。运动补偿单元205可以基于由当前视频块的运动信息指示的参考视频块来生成当前视频块的预测视频块。
在一些示例中,运动估计单元204可以输出用于解码器的解码处理的完整运动信息集合。
在一些示例中,运动估计单元204可能不输出当前视频的完整运动信息集合。相反,运动估计单元204可以参考另一个视频块的运动信息来
通知当前视频块的运动信息。例如,运动估计单元204可以确定当前视频块的运动信息与邻近视频块的运动信息足够相似。
在一个示例中,运动估计单元204可以在与当前视频块相关联的语法结构中,指示向视频解码器300指示当前视频块具有与另一个视频块相同的运动信息的值。
在另一个示例中,运动估计单元204可以在与当前视频块相关联的语法结构中识别另一个视频块和运动向量差(MVD)。运动向量差指示当前视频块的运动向量与所指示视频块的运动向量之间的差。视频解码器300可以使用所指示视频块的运动向量和运动向量差来确定当前视频块的运动向量。
如上所讨论的,视频编码器200可以预测地信令通知运动向量。可以由视频编码器200实现的预测信令技术的两个示例包括高级运动向量预测(AMVP)和merge模式信令。
帧内预测单元206可以对当前视频块执行帧内预测。当帧内预测单元206对当前视频块执行帧内预测时,帧内预测单元206可以基于同一图片中的其它视频块的解码样点生成当前视频块的预测数据。当前视频块的预测数据可以包括预测视频块和各种语法元素。
残差生成单元207可以通过从当前视频块减去(例如,用减号表示)当前视频块的预测视频块来生成当前视频块的残差数据。当前视频块的残余数据可以包括对应于当前视频块中的样点的不同样点分量的残余视频块。
在其它示例中,对于当前视频块,可能没有当前视频块的残差数据,例如在跳过模式下,残差生成单元207可能不执行减法操作。
变换处理单元208可以通过将一个或多个变换应用于与当前视频块相关联的残差视频块,来为当前视频块生成一个或多个变换系数视频块。
在变换处理单元208生成与当前视频块相关联的变换系数视频块之后,量化单元209可以基于与当前视频块相关联的一个或多个量化参数(QP)值,来对与当前视频块相关联的变换系数视频块进行量化。
反量化单元210和反变换单元211可以分别对变换系数视频块应用反量化和反变换,以根据变换系数视频块重建残差视频块。重建单元212可以将重建的残差视频块添加到来自预测单元202生成的一个或多个预测视频块的对应样点中,以产生与当前块相关联的重建视频块,以存储在缓冲区213中。
在重建单元212重建视频块之后,可以执行环路滤波操作以减少视频块中的视频块伪像。
熵编码单元214可以从视频编码器200的其它功能组件接收数据。当熵编码单元214接收到数据时,熵编码单元214可以执行一个或多个熵编码操作以生成熵编码数据,并输出包括熵编码数据的比特流。
图6是示出视频解码器300的示例的框图,视频解码器300可以是图4所示的系统100中的视频解码器114。
视频解码器300可以被配置为执行本公开的任何或所有技术。在图5的示例中,视频解码器300包括多个功能组件。本公开中描述的技术可以在视频解码器300的各个组件之间共享。在一些示例中,处理器可以被配置为执行本公开中描述的任何或所有技术。
在图6的示例中,视频解码器300包括熵解码单元301、运动补偿单元302、帧内预测单元303、反量化单元304、反变换单元305、重建单元306和缓冲区307。在一些示例中,视频解码器300可以执行通常与关于视频编码器200描述的编码遍次(图5)相反的解码遍次。
熵解码单元301可以取回编码比特流。编码比特流可以包括熵编码的视频数据(例如,视频数据的编码块)。熵解码单元301可以对熵编码的视频数据进行解码,并且运动补偿单元302可以根据熵解码的视频数据确定运动信息,该运动信息包括运动向量、运动向量精度、参考图片列表索引以及其它运动信息。例如,运动补偿单元302可以通过执行AMVP和merge模式来确定这种信息。
运动补偿单元302可以产生运动补偿块,可能基于插值滤波器执行插值。语法元素中可以包括用于以子像素精度使用的插值滤波器的标识符。
运动补偿单元302可以使用视频编码器20在视频块编码期间使用的插值滤波器来计算参考块的子整数像素的插值。运动补偿单元302可以根据接收到的语法信息确定视频编码器200使用的插值滤波器,并使用插值滤波器来产生预测块。
运动补偿单元302可以使用一些语法信息来确定用于对编码视频序列的帧和/或条带进行编码的块的尺寸,描述如何对编码视频序列的图片的每个宏块进行分割的分区信息,指示如何对每个分区进行编码的模式,用于每个帧间编码块的一个或多个参考帧(和参考帧列表),以及用于对编码视频序列进行解码的其它信息。
帧内预测单元303可以使用例如在比特流中接收的帧内预测模式来根据空域上邻近的块形成预测块。反量化单元303对比特流中提供并由熵解码单元301解码的量化视频块系数进行反量化(即,去量化)。反变换单元303应用反变换。
重建单元306可以将残差块与由运动补偿单元202或帧内预测单元303生成的对应预测块相加,以形成解码块。如果需要,还可以应用去方块滤波器来对解码块进行滤波,以便移除块性伪像。解码视频块然后被存储在缓冲区307中,缓冲区307为后续运动补偿/帧内预测提供参考块,并且还产生解码视频以在显示设备上呈现。
下面提供一些实施例优选的解决方案的列表。
以下解决方案示出了上一节中讨论的技术的示例实施例(例如,第1项)。
1.一种视频处理方法(例如,图3中的方法600),包括:在包含一个或多个可缩放视频层的视频和视频的编解码表示之间执行转换,其中编解码表示符合格式规则,其中,格式规则指定,当对应的网络抽象层单元类型在预定范围内,并且对应的视频层标志指示对应于片段的视频层不使用层间预测时,指示片段的片段类型的字段的值被设置为指示帧内片段的类型。
2.解决方案1的方法,其中,条带的条带类型被设置为2。
3.解决方案1的方法,其中,预定范围是从IDR_W_RADL到CRA_NUT,两者都包含在内。
4.一种视频处理的方法,包括:执行包括一个或多个可扩展视频层的视频和视频的编解码表示之间的转换,其中,编解码表示符合格式规则,其中,格式规则规定,在对描述一个或多个可扩展视频层的档次和层、级别的语法结构的索引从编解码表示中排除的情况下,对该索引的指示被推断为等于0。
5.解决方案4的方法,其中,指示包括ols_ptl_idx[i]语法元素,其中i是整数。
6.一种视频处理的方法,包括:执行包括一个或多个可扩展视频层的视频和视频的编解码表示之间的转换,其中,编解码表示包含多个输出层集合(OLS),其中,每个OLS是编解码表示中的层的集合,其中层的集合规定为要被输出,其中,编解码表示符合格式规则,其中,格式规则规定,在OLS包括单个层的情况下,编解码表示的视频参数集合被允许具有关于OLS的档次、层和级别的重复信息。
7.解决方案6的方法,其中,格式规则规定信令通知数字字段,该数字字段指示关于多个OLS的档次、层和级别的信息集合的总数,其中总数为至少一个。
8.解决方案1-7中的任一项的方法,其中,执行转换包括对视频进行编码以生成编解码表示。
9.解决方案1-7中的任一项的方法,其中,执行转换包括对编解码表示进行解析和解码以生成视频。
10.一种视频解码装置,包括处理器,其被配置为实现解决方案1至9中的一个或多个中记载的方法。
11.一种视频编码装置,包括处理器,其被配置为实现解决方案1至9中的一个或多个中记载的方法。
12.一种计算机程序产品,其上存储有计算机代码,该代码当由处理器执行时,使得处理器实现解决方案1至9中的任一个中记载的方法。
13.本文档中描述的方法、装置或系统。
关于图7A至图7I,可以在一些实施例中优选地实现以下列出的解决方案。
例如,可以根据上一节中的第1项实现以下解决方案。
1.一种视频处理的方法(例如,图7A中描述的方法710),包括执行(712)包括一个或多个可扩展视频层的视频与视频的比特流之间的转换,其中,视频包括一个或多个包括一个或多个条带的视频图片;其中,比特流符合格式规则,其中,格式规则规定,在对应的网络抽象层单元类型在预定范围内并且对应的视频层标志指示对应于条带的视频层不使用层间预测的情况下,指示条带的条带类型的字段的值被设置为指示帧内条带的类型。
2.解决方案1的方法,其中,条带的条带类型被设置为2。
3.解决方案1的方法,其中,预先确定的范围是从IDR_W_RADL到CRA_NUT,两者都包含在内,其中,IDR_W_RADL指示具有瞬时解码刷新类型的条带,并且其中,CRA_NUT指示具有清洁随机访问类型的条带。
4.解决方案1-3中的任一个的方法,其中,对应的视频层标志对应于vps_independent_layer_flag[GeneralLayerIdx[nuh_layer_id]],其中,nuh_layer_id对应于视频层的标识符,GeneralLayerIdx[]是视频层的索引,并且vps_independent_layer_flag对应于视频层标志。
5.解决方案1-4中的任一个的方法,其中,执行转换包括将视频编码到比特流中。
6.解决方案1-4中的任一个的方法,其中,执行转换包括根据比特流解析和解码视频。
7.一种用于存储视频比特流的方法,包括:根据包括一个或多个可扩展视频层的视频生成比特流;以及将比特流存储在非暂时性计算机可读存储介质中;其中,视频包括一个或多个视频图片,视频图片包括一个或多个条带;其中,比特流符合格式规则,其中,格式规则规定,在对应的网络抽象层单元类型在预定范围内并且对应的视频层标志指示对应于条带的视频层不使用层间预测的情况下,指示条带的条带类型的字段的值被设置为指示I条带的类型。
例如,可以根据上一节中的第5项实现以下解决方案。
1.一种视频处理方法(例如,图7B所示的方法720),包括:执行(722)包括多个视频层的视频和视频的比特流之间的转换,其中,比特流包括多个输出层集合(OLS),每个输出层集合(OLS)包括多个可扩展视频层中的一个或多个,并且比特流符合格式规则,其中,格式规则规定,对于具有单个层的OLS,指示OLS的档次、层和级别的档次-层-级别(PTL)语法结构被包括在比特流的视频参数集合中,并且OLS的PTL语法结构也被包括在比特流中编解码的序列参数集合中。
2.解决方案1的方法,其中,格式规则规定语法元素被包括在指示视频参数集合中编解码的多个PTL语法结构的视频参数集合中。
3.解决方案2的方法,其中,在视频参数集合中编解码的PTL语法结构的数目等于语法元素的值加一。
4.解决方案2的方法,其中,在视频参数集合中编解码的PTL语法结构的数目等于语法元素的值。
5.解决方案4的方法,其中,格式规则规定当确定多个OLS中的一个或多个包含多于一个视频层时,在编码期间在视频参数集合中编解码语法元素,或在解码期间从视频参数集合中解析语法元素。
6.解决方案4的方法,其中,格式规则规定当确定视频层的数目大于0且一个或多个视频层使用层间预测时,在编码期间在视频参数集合中编解码语法元素,或在解码期间从视频参数集合中解析语法元素。
7.解决方案1至6中的任一个的方法,其中,格式规则进一步规定,对于具有单个层的OLS,OLS的解码图片缓冲区尺寸参数被包括在比特流的视频参数集合中,并且OLS的解码图片缓冲区尺寸参数还被包括在比特流中编解码的序列参数集合中。
8.解决方案1至6中的任一个的方法,其中,格式规则进一步规定,对于具有单个层的OLS,OLS的解码图片缓冲区的参数信息被包括在比特流的视频参数集合中,并且OLS的解码图片缓冲区的参数信息也被包括在比特流中编解码的序列参数集合中。
例如,可以根据上一节中的第6项实现以下解决方案。
9.一种视频处理方法(例如,图7C所示的方法730),包括:执行(732)包括多个视频层的视频和视频的比特流之间的转换,其中,比特流包括多个输出层集合(OLS),每个输出层集合(OLS)包括多个视频层中的一个或多个,并且比特流符合格式规则,其中,格式规则规定在比特流的视频参数集合中出现的多个档次-层-级别(PTL)语法结构与视频参数集合中的字节对齐语法字段之间的关系;其中,每个PTL语法结构指示多个OLS中的一个或多个的档次、层和级别。
10.解决方案9的方法,其中,格式规则规定,视频参数集合中包括至少一个PTL语法结构,并且由于包括至少一个PTL语法结构,字节对齐语法字段的一个或多个实例被包括在视频参数集合中。
11.解决方案10的方法,其中,字节对齐语法字段为一位。
12.解决方案11的方法,其中,字节对齐语法字段的一个或多个实例的每个的值具有值0。
例如,可以根据上一节中的第2项实现以下解决方案。
13.一种视频处理方法(例如,图7D所示的方法740),包括:执行(742)包括多个可扩展视频层的视频和视频的比特流之间的转换,其中,比特流包括多个输出层集合(OLS),每个输出层集合(OLS)包括多个可扩展视频层中的一个或多个,并且比特流符合格式规则,其中,格式规则规定:在编码期间,在索引的值为零的情况下,从比特流的视频参数集合中排除指示对描述多个OLS中的一个或多个的档次、层和级别的语法结构的索引的语法元素,或者在解码期间,在比特流中不存在语法元素的情况下,该值被推断为零。
14.解决方案13的方法,其中,索引是指向语法结构的,该语法结构指示至少一个OLS的档次、层和级别。
15.一种用于存储视频的比特流的方法,包括:从包括多个视频层的视频生成比特流,并且将该比特流存储在非暂时性计算机可读存储介质中;其中,比特流包括多个输出层集合(OLS),每个输出层集合包括多个视频层中的一个或多个,并且比特流符合格式规则,其中,格式规则规定,对于具有单个层的OLS,指示OLS的档次、层和级别的档次-层-级别(PTL)语法结构被包括在比特流的视频参数集合中,并且OLS的PTL语法结构也被包括在比特流中编解码的序列参数集合中。
16.解决方案1-14中的任一个的方法,其中,执行转换包括将视频编码为比特流;并且该方法进一步包括将比特流存储在非暂时性计算机可读存储介质中。
例如,可以根据上一节中的第3项实现以下解决方案。
1.一种视频处理方法(例如,图7E所示的方法750),包括:执行(752)包括多个视频层的视频和视频的比特流之间的转换,其中,比特流包括多个输出层集合(OLS),每个输出层集合(OLS)包括多个视频层中的一个或多个,并且比特流符合格式规则,其中,格式规则规定,对于层i,其中i是整数,比特流包括指示第一变量的第一语法元素的集合,该第一变量指示层i是否被包括在多个OLS中的至少一个中。
2.解决方案1的方法,其中,格式规则规定,在层i的第一变量等于零的情况下,意味着层i不被包括在多个OLS中的任一个中,比特流排除指示层i的解码图片缓冲区参数的第二语法元素集合。
3.解决方案1-2中的任一个的方法,其中,格式规则进一步规定比特流包括指示第二变量的第三语法元素集合,该第二变量指示层i是否用作多个视频层中至少一个的参考层,并且其中,格式规则不允许第一变量和第二变量具有零值。
4.解决方案3的方法,其中,格式规则不允许第一变量和第二变量的值都等于0,这指示没有一个层既不是任何其它层的直接参考层,也不是至少一个OLS的输出层。
5.解决方案1-4中的任一个的方法,其中,第一变量是一位标志,表示为LayerUsedAsOutputLayerFlag。
6.解决方案5的方法,其中,第一变量是基于对多个视频层中的每一层反复检查第三变量的值来确定的,该值指示多个OLS中包括的多个层之间的关系。
7.解决方案6的方法,其中,指示包括在多个OLS中的多个层之间的关系的第三变量被允许具有值0、1或2。
8.解决方案1-7中的任一个的方法,其中,执行转换包括将视频编码成比特流;并且该方法进一步包括将比特流存储在非暂时性计算机可读存储介质中。
9.一种用于存储视频比特流的方法,包括:根据包括多个视频层的视频生成比特流,并且将该比特流存储在非暂时性计算机可读存储介质中;其中,比特流包括多个输出层集合(OLS),每个输出层集合包括多个视频层中的一个或多个,并且比特流符合格式规则,其中,格式规则规定,对于层i(其中i是整数),比特流包括指示第一变量的第一语法元素的集合,该第一变量指示层i是否被包括在多个OLS中的至少一个中。
例如,可以根据上一节中的第4项实现以下解决方案。
1.一种视频处理方法(例如,图7F所示的方法760),包括:执行(762)视频和视频的比特流之间的转换,其中,比特流包括一个或多个输出层集合,每个输出层集合包括一个或多个视频层;其中,比特流符合格式规则,其中,格式规则规定,在每个输出层集合包括单个视频层的情况下,比特流的视频参数集合中包括的解码图片缓冲区参数语法结构的数目等于:零;或者在每个输出层集合包括单个层不为真的情况下,比特流的视频参数集合中包括的解码图片缓冲区参数语法结构的数目等于:一加上语法元素的值。
2.解决方案1的方法,其中,语法元素对应于vps_num_dpb_params_minus1语法元素。
3.解决方案1-2中的任一个的方法,其中,格式规则规定,在视频参数集合中不存在另一个语法元素(该语法元素指示相同尺寸是否用于指示视频层的解码图片缓冲区语法结构,这些视频层被包括且不被包括在一个或多个输出层集合中)的情况下,另一个语法元素的值被推断为等于1。
4.解决方案1-3中的任一个的方法,其中,执行转换包括将视频编码为比特流;并且该方法进一步包括将比特流存储在非暂时性计算机可读存储介质中。
5.一种用于存储视频的比特流的方法,包括:根据视频生成比特流;以及将比特流存储在非暂时性计算机可读存储介质中;其中,比特流包括一个或多个输出层集合,每个输出层集合包括一个或多个视频层;其中,比特流符合格式规则,其中,格式规则规定,在每个输出层集合包括单个视频层的情况下,比特流的视频参数集合中包括的解码图片缓冲区参数语法结构的数目等于:零;或者在每个输出层集合包括单个层不为真的情况下,比特流的视频参数集合中包括的解码图片缓冲区参数语法结构的数目等于:一加语法元素的值。
例如,可以根据上一节中的第7项实现以下解决方案。
1.一种视频处理方法(例如,图7G所示的方法770),包括:执行(772)视频和视频的比特流之间的转换,其中,比特流包括编解码视频序列(CVS),该编解码视频序列包括一个或多个视频层的一个或多个编解码视频图片;并且其中,比特流符合格式规则,该格式规则规定指示由CVS的一个或多个编解码图片参考的转换参数的一个或多个序列参数集合(SPS)具有指示参考VPS的相同参考视频参数集合(VPS)标识符。
2.解决方案1的方法,其中,格式规则进一步规定同一参考VPS标识符具有大于0的值。
3.解决方案1-2中的任一个的方法,其中,格式规则进一步规定,响应于且仅当CVS包括单个视频层时,才使用SPS标识符的值零。
4.解决方案1-3中的任一个的方法,其中,执行转换包括将视频编码为比特流;并且该方法进一步包括将比特流存储在非暂时性计算机可读存储介质中。
5.一种用于存储视频的比特流的方法,包括:根据视频生成比特流,并将该比特流存储在非暂时性计算机可读存储介质中;其中,视频包括一个或多个视频图片,视频图片包括一个或多个条带;其中,比特流包括编解码视频序列(CVS),该编解码视频序列包括一个或多个视频层的一个或多个编解码视频图片;并且其中,比特流符合格式规则,该格式规则规定指示由CVS的一个或多个编解码图片参考的转换参数的一个或多个序列参数集合(SPS)具有指示参考VPS的相同参考视频参数集合(VPS)标识符。
例如,可以根据上一节中的第8项实现以下解决方案。
1.一种视频处理方法(例如,图7H所示的方法780),包括:执行(782)视频和视频的比特流之间的转换,其中,比特流包括一个或多个输出层集合(OLS),每个输出层集合(OLS)包括一个或多个视频层,其中,比特流符合格式规则;其中,格式规则规定第一语法元素是否或如何被包括在比特流的视频参数集合(VPS)中,该第一语法元素指示描述假想参考解码器(HRD)的参数的第一语法结构是否用于转换。
2.解决方案1的方法,其中,第一语法结构包括通用HRD参数的集合。
3.解决方案1-2的方法,其中,格式规则规定,由于一个或多个OLS的OLS中包括一个或多个视频层中的每个,当VPS中不存在第一语法元素时,第一语法元素从VPS中忽略且被推断为具有零值,并且其中,一个或多个OLS中的每个都包括单个视频层。
4.解决方案1-2的方法,其中,格式规则规定,由于一个或多个OLS的OLS中包括一个或多个视频层的每个,当第一语法元素出现在VPS中时,第一语法元素在VPS中具有零值,并且其中,一个或多个OLS中的每个包括单个视频层。
5.解决方案1-4中的任一个的方法,其中,格式规则进一步规定VPS中是否包括或如何包括第二语法元素,该第二语法元素指示描述OLS特定的HRD参数的多个语法结构。
6.解决方案5的方法,其中,格式规则进一步规定,当第一语法元素具有值1时,第二语法元素被包括在VPS中,无论一个或多个OLS中的OLS的总数是否大于1。
例如,可以根据上一节中的第9、10项实现以下解决方案。
7.一种视频处理方法(例如,图7I所示的方法790),包括:执行(792)视频和视频的比特流之间的转换,其中,比特流包括一个或多个输出层集合(OLS),每个输出层集合(OLS)包括一个或多个视频层,其中,比特流符合格式规则;其中,格式规则规定在比特流的视频参数集合(VPS)中是否包括或如何包括描述通用假想参考解码器(HRD)参数的第一语法结构和描述OLS特定的HRD参数的多个第二语法结构。
8.解决方案7的方法,其中,格式规则规定在没有第二语法结构被包括在VPS中的情况下,从VPS中省略第一语法结构。
9.解决方案7的方法,其中,对于仅包括一个视频层的OLS,格式规则排除第一语法结构和第二语法结构包括在VPS中,并且其中,格式规则允许将第一语法结构和第二语法结构包括在仅包括一个视频层的OLS中。
10.一种用于存储视频的比特流的方法,包括:根据视频生成比特流;将比特流存储在非暂时性计算机可读存储介质中;其中,比特流包括一个或多个输出层集合(OLS),每个输出层集合(OLS)包括一个或多个视频层,其中,比特流符合格式规则;其中,格式规则规定第一语法元素是否或如何被包括在比特流的视频参数集合(VPS)中,该第一语法元素指示描述假想参考解码器(HRD)的参数的第一语法结构是否用于转换。
上面列出的解决方案可以进一步包括:
在一些实施例中,在上面列出的解决方案中,执行转换包括将视频编码为比特流。
在一些实施例中,在上面列出的解决方案中,执行转换包括根据比特流解析和解码视频。
在一些实施例中,在上面列出的解决方案中,执行转换包括将视频编码为比特流;并且该方法进一步包括将比特流存储在非暂时性计算机可读存储介质中。
在一些实施例中,视频解码装置包括处理器,该处理器被配置为实现上面列出的一个或多个解决方案中记载的方法。
在一些实施例中,视频编码装置包括处理器,该处理器被配置为实现上面列出的一个或多个解决方案中记载的方法。
在一些实施例中,非暂时性计算机可读存储介质可以存储使得处理器实现上面列出的一个或多个解决方案中记载的方法的指令。
在一些实施例中,一种非暂时性计算机可读存储介质,存储视频的比特流,该比特流由上面列出的一种或多种解决方案中记载的方法生成。
在一些实施例中,上面描述的编码方法可以由装置实现,并且该装置可以进一步将通过实现该方法生成的比特流写入计算机可读介质。
本文件中描述的所公开的解决方案和其它解决方案、示例、实施例、模块和功能操作可以在以下各项中实现:数字电子电路,或计算机软件、固件或硬件,包括本文档中公开的结构及其结构等同物,或上述各项的一个或多个的组合。所公开的实施例和其它实施例可以被实现为一个或多个计算机程序产品,即,编码在计算机可读介质上的计算机程序指令的一个或多个模块,用于由数据处理装置执行或控制其操作。计算机可读介质可以是机器可读存储设备、机器可读存储基板、存储器设备、影响机器可读传播信号的物质的组合物,或者一个或多个它们的组合。术语“数据处理装置”包含用于处理数据的所有装置、设备和机器,例如包括可编程处理器、计算机或多个处理器或计算机。除了硬件之外,该装置还可以包括为所讨论的计算机程序创建执行环境的代码,例如,构成处理器固件、协议栈、数据库管理系统、操作系统或其中一个或多个的组合的代码。传播信号是人为生成的信号,例如,机器生成的电气、光学或电磁信号,其被生成以对信息进行编码以传输到合适的接收器装置。
计算机程序(也称为程序、软件、软件应用、脚本或代码)可以用任何形式的编程语言编写,包括编译或解释语言,并且其也可以以任何形式部署,包括作为独立程序或模块、组件、子例程或其它适合在计算环境中使用的单元。计算机程序不一定与文件系统中的文件相对应。程序可以被存储在保存其它程序或数据的文件部分(例如,标记语言文档中存储的一个或多个脚本)、专用于相关程序的单个文件或多个协调文件(例如,存储一个或多个模块、子程序或代码部分的文件)中。计算机程序可以被部署以在一台计算机上执行,或在位于一个站点或分布在多个站点并通过通信网络互连的多台计算机上执行。
本文档中描述的过程和逻辑流可以由一个或多个可编程处理器执行,这些计算机程序执行一个或多个计算机程序以通过对输入数据进行操作并生成输出来执行功能。过程和逻辑流还可以由专用逻辑电路执行,并且装置还可以实现为专用逻辑电路,例如FPGA(现场可编程门阵列)或ASIC(专用集成电路)。
例如,适合执行计算机程序的处理器包括通用和专用微处理器,以及任何类型的数字计算机的任何一个或多个处理器。通常,处理器将从只读存储器或随机存取存储器或两者中接收指令和数据。计算机的基本元件是用于执行指令的处理器和用于存储指令和数据的一个或多个存储器设备。通常,计算机还将包括或被操作地耦合以从一个或多个用于存储数据的大容量存储设备(例如,磁盘、磁光盘或光盘)接收数据或向其传输数据。然而,计算机不需要这样的设备。适于存储计算机程序指令和数据的计算机可读介质包括所有形式的非易失性存储器、介质和存储器设备,包括例如半导体存储器设备,例如EPROM、EEPROM和闪速存储器设备;磁盘,例如内部硬盘或可移动磁盘;磁光盘;以及CD-ROM和DVD-ROM光盘。处理器和存储器可以由专用逻辑电路补充或并入专用逻辑电路中。
尽管本专利文档包含许多细节,但这些细节不应当被解释为对任何主题或要求保护的内容的范围的限制,而应当被解释为对特定的技术的特定的实施例所特有的特征的描述。本专利文档中在单独实施例的上下文中描述的某些特征也可以在单个实施例中组合实现。相反地,在单个实施例的上下文中描述的各种特征也可以在多个实施例中单独地或在任何合适的子组合中实现。此外,尽管上述特征可以被描述为以特定组合起作用,甚至最初被声称为这样,但在一些情况下,可以从所要求保护的组合中删除一个或多个特征,并且所要求保护的组合可以指向子组合或子组合的变体。
类似地,尽管在附图中以特定的顺序描述这些操作,但这不应当被理解为要求按照所示的特定的顺序或序列顺序执行这样的操作,或要求所有示出的操作被执行,以获得理想的结果。此外,本专利文档中描述的实施例中的各种系统组件的分离不应当理解为在所有实施例中都要求这种分离。
仅描述了一些实现和示例,并且其它实现、增强和变体可以基于本专利文档中描述和说明的内容进行。

Claims (12)

1.一种视频处理方法,包括:
执行视频与所述视频的比特流之间的转换,
其中,所述比特流包括编解码视频序列(CVS),所述编解码视频序列包括一个或多个视频层的一个或多个编解码视频图片;并且
其中,所述比特流符合格式规则,所述格式规则规定指示由所述CVS的一个或多个编解码图片所参考的转换参数的一个或多个序列参数集合(SPS)具有相同的参考视频参数集合(VPS)标识符,所述参考视频参数集合(VPS)标识符指示参考的VPS。
2.根据权利要求1所述的方法,其中,所述格式规则进一步规定所述相同的参考VPS标识符具有大于0的值。
3.根据权利要求1或2所述的方法,其中,所述格式规则进一步规定,响应于且仅当所述CVS包括单个视频层时,才使用SPS标识符的零值。
4.根据权利要求1-3中的任一项所述的方法,其中,执行所述转换包括将所述视频编码为所述比特流;以及所述方法进一步包括将所述比特流存储在非暂时性计算机可读存储介质中。
5.一种存储视频的比特流的方法,包括:
从所述视频生成比特流,以及
将所述比特流存储在非暂时性计算机可读存储介质中;
其中,所述视频包括一个或多个视频图片,所述视频图片包括一个或多个条带;
其中,所述比特流包括编解码视频序列(CVS),所述编解码视频序列包括一个或多个视频层的一个或多个编解码视频图片;并且
其中,所述比特流符合格式规则,所述格式规则规定指示由所述CVS的一个或多个编解码图片所参考的转换参数的一个或多个序列参数集合(SPS)具有相同的参考视频参数集合(VPS)标识符,所述参考视频参数集合(VPS)标识符指示参考的VPS。
6.根据权利要求1-5中的任一项所述的方法,其中,执行所述转换包括将所述视频编码以生成所述比特流。
7.根据权利要求1-5中的任一项所述的方法,其中,执行所述转换包括对所述比特流进行解析和解码以生成所述视频。
8.一种视频解码装置,包括处理器,所述处理器被配置为实现根据权利要求1至7中的一项或多项所述的方法。
9.一种视频编码装置,包括处理器,所述处理器被配置为实现根据权利要求1至7中的一项或多项所述的方法。
10.一种存储指令的非暂时性计算机可读存储介质,所述指令使得处理器实现根据权利要求1至7中的任一项所述方法。
11.一种非暂时性计算机可读记录介质,其存储通过权利要求1至7中的任一项所述的方法生成的视频的比特流。
12.本文档中描述的方法、装置或系统。
CN202080090430.0A 2019-12-26 2020-12-24 对层级视频的编解码的限制 Pending CN114846457A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201962953854P 2019-12-26 2019-12-26
US62/953,854 2019-12-26
US201962955185P 2019-12-30 2019-12-30
US62/955,185 2019-12-30
PCT/US2020/067021 WO2021134019A1 (en) 2019-12-26 2020-12-24 Constraints on coding of layered video

Publications (1)

Publication Number Publication Date
CN114846457A true CN114846457A (zh) 2022-08-02

Family

ID=76573157

Family Applications (3)

Application Number Title Priority Date Filing Date
CN202080090439.1A Pending CN114846786A (zh) 2019-12-26 2020-12-24 对视频比特流中的假设参考解码器参数的信令的约束
CN202080090437.2A Pending CN114868158A (zh) 2019-12-26 2020-12-24 层级视频中的解码图片缓冲区参数的信令通知
CN202080090430.0A Pending CN114846457A (zh) 2019-12-26 2020-12-24 对层级视频的编解码的限制

Family Applications Before (2)

Application Number Title Priority Date Filing Date
CN202080090439.1A Pending CN114846786A (zh) 2019-12-26 2020-12-24 对视频比特流中的假设参考解码器参数的信令的约束
CN202080090437.2A Pending CN114868158A (zh) 2019-12-26 2020-12-24 层级视频中的解码图片缓冲区参数的信令通知

Country Status (7)

Country Link
US (3) US11843726B2 (zh)
EP (2) EP4062634A4 (zh)
JP (3) JP7425204B2 (zh)
KR (1) KR20220120566A (zh)
CN (3) CN114846786A (zh)
BR (1) BR112022012708A2 (zh)
WO (3) WO2021134020A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114041289A (zh) * 2020-03-27 2022-02-11 腾讯美国有限责任公司 用于指示多层视频流中的子层数目的方法

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US12022122B2 (en) * 2019-06-19 2024-06-25 Sharp Kabushiki Kaisha Systems and methods for signaling decoded picture buffer information in video coding
KR20220065044A (ko) * 2019-09-24 2022-05-19 후아웨이 테크놀러지 컴퍼니 리미티드 공간 및 snr 확장성을 위한 ols
WO2021134015A1 (en) 2019-12-26 2021-07-01 Bytedance Inc. Profile, tier and layer indication in video coding
EP4062634A4 (en) 2019-12-26 2022-12-28 ByteDance Inc. LIMITATIONS ON SIGNALING HYPOTHETICAL REFERENCE DECODER PARAMETERS IN VIDEO BITSTREAMS
CN114902567A (zh) 2019-12-27 2022-08-12 字节跳动有限公司 视频编解码中的子图像信令
EP4074052A4 (en) 2020-01-09 2023-05-31 ByteDance Inc. PROCESSING OF FILLER DATA UNITS IN VIDEO STREAMS
WO2021201541A1 (ko) * 2020-03-30 2021-10-07 엘지전자 주식회사 Dpb 파라미터의 개수 정보를 시그널링하는 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 컴퓨터 판독 가능한 기록 매체

Family Cites Families (121)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003087785A (ja) 2001-06-29 2003-03-20 Toshiba Corp 動画像符号化データの形式変換方法及び装置
CA2435757C (en) 2001-11-29 2013-03-19 Matsushita Electric Industrial Co., Ltd. Video coding distortion removal method and apparatus using a filter
FI113123B (fi) 2002-06-03 2004-02-27 Nokia Corp Menetelmä ja laite hajautettujen verkkojen muodostamiseksi tilapäisissä verkoissa
US7586924B2 (en) 2004-02-27 2009-09-08 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for coding an information signal into a data stream, converting the data stream and decoding the data stream
CN101622879B (zh) 2007-01-18 2012-05-23 诺基亚公司 以rtp净荷格式传输sei消息
KR101391601B1 (ko) 2007-10-15 2014-05-07 삼성전자주식회사 최적의 임계치를 이용한 지수 골롬 이진화에 의한 영상부호화 방법 및 그 장치, 및 영상 복호화 방법 및 그 장치
WO2010069427A1 (en) 2008-12-19 2010-06-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and encoder for providing a tune- in stream for an encoded video stream and method and decoder for tuning into an encoded video stream
TW201032597A (en) 2009-01-28 2010-09-01 Nokia Corp Method and apparatus for video coding and decoding
US20120050475A1 (en) 2009-05-01 2012-03-01 Dong Tian Reference picture lists for 3dv
EP2687012A1 (en) 2011-06-30 2014-01-22 Telefonaktiebolaget L M Ericsson (PUBL) Absolute or explicit reference picture signaling
US9591318B2 (en) 2011-09-16 2017-03-07 Microsoft Technology Licensing, Llc Multi-layer encoding and decoding
US9451252B2 (en) * 2012-01-14 2016-09-20 Qualcomm Incorporated Coding parameter sets and NAL unit headers for video coding
US9838684B2 (en) 2012-04-11 2017-12-05 Qualcomm Incorporated Wavefront parallel processing for video coding
TWI752680B (zh) 2012-04-13 2022-01-11 美商Ge影像壓縮有限公司 用以自資料串流重構圖像的解碼器及方法、用以將圖像編碼入資料串流的編碼器及方法、與相關電腦程式及機器可存取媒體
US9736476B2 (en) 2012-04-27 2017-08-15 Qualcomm Incorporated Full random access from clean random access pictures in video coding
US9621905B2 (en) 2012-06-29 2017-04-11 Qualcomm Incorporated Tiles and wavefront parallel processing
US9602827B2 (en) 2012-07-02 2017-03-21 Qualcomm Incorporated Video parameter set including an offset syntax element
AU2013285333A1 (en) 2012-07-02 2015-02-05 Nokia Technologies Oy Method and apparatus for video coding
CN110087091B (zh) 2012-08-06 2021-11-12 Vid拓展公司 多层视频编码中用于空间层的采样栅格信息
US9319657B2 (en) 2012-09-19 2016-04-19 Qualcomm Incorporated Selection of pictures for disparity vector derivation
US9161039B2 (en) 2012-09-24 2015-10-13 Qualcomm Incorporated Bitstream properties in video coding
US9351005B2 (en) 2012-09-24 2016-05-24 Qualcomm Incorporated Bitstream conformance test in video coding
PL4033764T3 (pl) 2012-09-26 2023-12-27 Sun Patent Trust Sposób dekodowania obrazów, sposób kodowania obrazów, urządzenie do dekodowania obrazów, urządzenie do kodowania obrazów oraz urządzenie do kodowania/dekodowania obrazów
EP3748969B1 (en) 2012-09-27 2024-01-03 Dolby Laboratories Licensing Corporation Inter-layer reference picture processing for coding standard scalability
US9432664B2 (en) 2012-09-28 2016-08-30 Qualcomm Incorporated Signaling layer identifiers for operation points in video coding
US9706199B2 (en) * 2012-09-28 2017-07-11 Nokia Technologies Oy Apparatus, a method and a computer program for video coding and decoding
US9565452B2 (en) 2012-09-28 2017-02-07 Qualcomm Incorporated Error resilient decoding unit association
US20140092976A1 (en) 2012-09-30 2014-04-03 Sharp Laboratories Of America, Inc. System for signaling idr and bla pictures
US20140098851A1 (en) * 2012-10-04 2014-04-10 Qualcomm Incorporated Indication of video properties
US9319703B2 (en) 2012-10-08 2016-04-19 Qualcomm Incorporated Hypothetical reference decoder parameter syntax structure
AU2013327962A1 (en) 2012-10-09 2015-04-02 Sony Corporation Image-processing device and method
WO2014059051A1 (en) * 2012-10-09 2014-04-17 Rodriguez Arturo A Providing a common set of parameters for sub-layers of coded video
US9374585B2 (en) 2012-12-19 2016-06-21 Qualcomm Incorporated Low-delay buffering model in video coding
US10219006B2 (en) 2013-01-04 2019-02-26 Sony Corporation JCTVC-L0226: VPS and VPS_extension updates
US10419778B2 (en) 2013-01-04 2019-09-17 Sony Corporation JCTVC-L0227: VPS_extension with updates of profile-tier-level syntax structure
US9402076B2 (en) 2013-01-07 2016-07-26 Qualcomm Incorporated Video buffering operations for random access in video coding
WO2014145852A2 (en) 2013-03-15 2014-09-18 Knopp Biosciences Llc Imidazo(4,5-b) pyridin-2-yl amides as kv7 channel activators
US9998735B2 (en) 2013-04-01 2018-06-12 Qualcomm Incorporated Inter-layer reference picture restriction for high level syntax-only scalable video coding
WO2014162750A1 (en) * 2013-04-05 2014-10-09 Sharp Kabushiki Kaisha Random access point pictures
US9270651B2 (en) 2013-04-05 2016-02-23 Futurewei Technologies, Inc. Authentication and initial key exchange in ethernet passive optical network over coaxial network
US9591321B2 (en) 2013-04-07 2017-03-07 Dolby International Ab Signaling change in output layer sets
US9565437B2 (en) 2013-04-08 2017-02-07 Qualcomm Incorporated Parameter set designs for video coding extensions
US9571809B2 (en) 2013-04-12 2017-02-14 Intel Corporation Simplified depth coding with modified intra-coding for 3D video coding
US9497485B2 (en) 2013-04-12 2016-11-15 Intel Corporation Coding unit size dependent simplified depth coding for 3D video coding
US9756335B2 (en) 2013-07-02 2017-09-05 Qualcomm Incorporated Optimizations on inter-layer prediction signalling for multi-layer video coding
US10595031B2 (en) 2013-07-12 2020-03-17 Qualcomm Incorporated Selection of target output layers in high efficiency video coding extensions
WO2015009693A1 (en) * 2013-07-15 2015-01-22 Sony Corporation Layer based hrd buffer management for scalable hevc
US9451254B2 (en) 2013-07-19 2016-09-20 Qualcomm Incorporated Disabling intra prediction filtering
GB2516824A (en) 2013-07-23 2015-02-11 Nokia Corp An apparatus, a method and a computer program for video coding and decoding
US10070125B2 (en) 2013-07-31 2018-09-04 Nokia Technologies Oy Method and apparatus for video coding and decoding
US9648333B2 (en) 2013-10-11 2017-05-09 Vid Scale, Inc. High level syntax for HEVC extensions
US9979971B2 (en) 2013-10-14 2018-05-22 Qualcomm Incorporated Device and method for scalable coding of video information
US20150103878A1 (en) 2013-10-14 2015-04-16 Qualcomm Incorporated Device and method for scalable coding of video information
US10284858B2 (en) 2013-10-15 2019-05-07 Qualcomm Incorporated Support of multi-mode extraction for multi-layer video codecs
WO2015056182A2 (en) 2013-10-15 2015-04-23 Nokia Technologies Oy Video encoding and decoding
EP3078195A4 (en) * 2013-12-02 2017-08-09 Nokia Technologies OY Video encoding and decoding
US9854270B2 (en) 2013-12-19 2017-12-26 Qualcomm Incorporated Device and method for scalable coding of video information
EP3090550A1 (en) 2014-01-02 2016-11-09 VID SCALE, Inc. Sub-bitstream extraction process for hevc extensions
JP6472449B2 (ja) 2014-01-02 2019-02-20 シャープ株式会社 ビデオシーケンスを復号するための方法
CN106105210B (zh) * 2014-01-03 2019-04-26 三星电子株式会社 管理用于对多层视频进行编码和解码的缓冲器的方法和设备
WO2015104451A1 (en) 2014-01-07 2015-07-16 Nokia Technologies Oy Method and apparatus for video coding and decoding
US10057590B2 (en) 2014-01-13 2018-08-21 Mediatek Inc. Method and apparatus using software engine and hardware engine collaborated with each other to achieve hybrid video encoding
JP6465863B2 (ja) 2014-03-14 2019-02-06 シャープ株式会社 画像復号装置、画像復号方法及び記録媒体
CN106170981B (zh) 2014-03-14 2019-02-26 华为技术有限公司 图像解码装置
US9848199B2 (en) 2014-03-17 2017-12-19 Qualcomm Incorporated Device and method for scalable coding of video information
US10136152B2 (en) 2014-03-24 2018-11-20 Qualcomm Incorporated Use of specific HEVC SEI messages for multi-layer video codecs
US10178397B2 (en) 2014-03-24 2019-01-08 Qualcomm Incorporated Generic use of HEVC SEI messages for multi-layer codecs
US9712871B2 (en) 2014-05-01 2017-07-18 Qualcomm Incorporated Determination bitstream decoding capability in video coding
US9769492B2 (en) 2014-06-06 2017-09-19 Qualcomm Incorporated Conformance parameters for bitstream partitions
US9813719B2 (en) 2014-06-18 2017-11-07 Qualcomm Incorporated Signaling HRD parameters for bitstream partitions
JP2017525215A (ja) 2014-06-19 2017-08-31 シャープ株式会社 復号方法
US10356415B2 (en) 2014-06-20 2019-07-16 Qualcomm Incorporated Systems and methods for constraining representation format parameters for a parameter set
US9756355B2 (en) 2014-06-20 2017-09-05 Qualcomm Incorporated Value ranges for syntax elements in video coding
US9930342B2 (en) 2014-06-20 2018-03-27 Qualcomm Incorporated Systems and methods for signaling hypothetical reference decoder parameters in a parameter set
US10264286B2 (en) 2014-06-26 2019-04-16 Qualcomm Incorporated Bitstream conformance constraints in scalable video coding
US10306269B2 (en) 2014-10-10 2019-05-28 Qualcomm Incorporated Operation point for carriage of layered HEVC bitstream
US20160112724A1 (en) 2014-10-15 2016-04-21 Qualcomm Incorporated Hrd descriptor and buffer model of data streams for carriage of hevc extensions
US10148969B2 (en) * 2015-02-11 2018-12-04 Qualcomm Incorporated Of sample entry and operation point signalling in a layered video file format
US10455242B2 (en) 2015-03-04 2019-10-22 Qualcomm Incorporated Signaling output indications in codec-hybrid multi-layer video coding
US10382791B2 (en) 2015-03-06 2019-08-13 Qualcomm Incorporated Data structure for video coding unit
US20160323600A1 (en) 2015-04-30 2016-11-03 Zhan Ma Methods and Apparatus for Use of Adaptive Prediction Resolution in Video Coding
US20160373771A1 (en) 2015-06-18 2016-12-22 Qualcomm Incorporated Design of tracks and operation point signaling in layered hevc file format
KR102164062B1 (ko) 2015-09-08 2020-10-13 미디어텍 인크. 인트라 블록 복사 모드를 위한 디코딩된 픽처 버퍼의 방법 및 시스템
US10200690B2 (en) * 2015-09-22 2019-02-05 Qualcomm Incorporated Video decoder conformance for high dynamic range (HDR) video coding using a core video standard
US20170105014A1 (en) 2015-10-08 2017-04-13 Qualcomm Incorporated Luma-driven chroma scaling for high dynamic range and wide color gamut contents
FI20165256L (fi) 2016-03-24 2017-09-25 Nokia Technologies Oy Laitteisto, menetelmä ja tietokoneohjelma videokoodaukseen ja -dekoodaukseen
US11722677B2 (en) 2016-05-06 2023-08-08 Interdigital Madison Patent Holdings, Sas Method and system for decoder-side intra mode derivation for block-based video coding
EP3466079B1 (en) 2016-05-24 2023-07-12 Nokia Technologies Oy Method and an apparatus and a computer program for encoding media content
US10735720B2 (en) 2016-06-24 2020-08-04 Kt Corporation Method and apparatus for processing video signal
WO2019184834A1 (en) 2018-03-28 2019-10-03 Fg Innovation Ip Company Limited Device and method for coding video data in multiple reference line prediction
EP3759922A1 (en) 2018-04-03 2021-01-06 Huawei Technologies Co. Ltd. Error mitigation in sub-picture bitstream based viewport dependent video coding
US10972755B2 (en) 2018-12-03 2021-04-06 Mediatek Singapore Pte. Ltd. Method and system of NAL unit header structure for signaling new elements
WO2020140243A1 (zh) 2019-01-03 2020-07-09 北京大学 视频图像处理方法与装置
JP7404373B2 (ja) 2019-01-09 2023-12-25 ホアウェイ・テクノロジーズ・カンパニー・リミテッド ビデオエンコーダ、ビデオデコーダ、および対応する方法
KR20220003084A (ko) 2019-05-06 2022-01-07 후아웨이 테크놀러지 컴퍼니 리미티드 점진적 디코딩 리프레시를 위한 가상 참조 디코더
US20220272378A1 (en) 2019-06-23 2022-08-25 Sharp Kabushiki Kaisha Systems and methods for performing an adaptive resolution change in video coding
EP3981162B1 (en) 2019-06-27 2024-09-25 Huawei Technologies Co., Ltd. Hypothetical reference decoder for v-pcc
US12096033B2 (en) 2019-08-21 2024-09-17 Sharp Kabushiki Kaisha Systems and methods for signaling buffering period information in video coding
US11979611B2 (en) 2019-09-06 2024-05-07 Sharp Kabushiki Kaisha Systems and methods for signaling temporal sub-layer information in video coding
CN115209153B (zh) 2019-09-24 2023-06-06 华为技术有限公司 编码器、解码器及对应方法
WO2021061394A1 (en) 2019-09-24 2021-04-01 Futurewei Technologies, Inc. Simulcast layers for multiview in video coding
KR20220065060A (ko) 2019-09-24 2022-05-19 후아웨이 테크놀러지 컴퍼니 리미티드 다계층 비디오 비트스트림에서 사용되지 않는 계층 금지
KR20220063260A (ko) 2019-09-24 2022-05-17 후아웨이 테크놀러지 컴퍼니 리미티드 시간적 스케일러빌러티를 위한 픽처 타이밍 및 디코딩 단위 정보
MX2022003557A (es) 2019-09-24 2022-06-14 Huawei Tech Co Ltd Ols para escalabilidad multivista.
KR20220065867A (ko) 2019-09-24 2022-05-20 후아웨이 테크놀러지 컴퍼니 리미티드 레이어에 대한 hrd 파라미터
AU2020354368A1 (en) 2019-09-24 2022-04-14 Huawei Technologies Co., Ltd. Temporal identifier constraints for SEI messages
KR20220065044A (ko) 2019-09-24 2022-05-19 후아웨이 테크놀러지 컴퍼니 리미티드 공간 및 snr 확장성을 위한 ols
CN117596389A (zh) 2019-09-28 2024-02-23 北京字节跳动网络技术有限公司 视频编解码中的几何分割模式
AU2020321174A1 (en) 2019-10-07 2022-04-28 Huawei Technologies Co., Ltd. DPB size based reference picture entry constraints
WO2021096057A1 (ko) 2019-11-14 2021-05-20 엘지전자 주식회사 비디오 또는 영상 코딩 시스템에서의 엔트리 포인트 관련 정보에 기반한 영상 코딩 방법
JPWO2021117813A1 (zh) 2019-12-13 2021-06-17
US11375182B2 (en) 2019-12-17 2022-06-28 Hfi Innovation Inc. Method and apparatus of constrained layer-wise video coding
US11356705B2 (en) 2019-12-23 2022-06-07 Qualcomm Incorporated Picture header intra random access picture and gradual decoder refresh signaling in video coding
EP4062634A4 (en) 2019-12-26 2022-12-28 ByteDance Inc. LIMITATIONS ON SIGNALING HYPOTHETICAL REFERENCE DECODER PARAMETERS IN VIDEO BITSTREAMS
WO2021134015A1 (en) 2019-12-26 2021-07-01 Bytedance Inc. Profile, tier and layer indication in video coding
CN114902567A (zh) 2019-12-27 2022-08-12 字节跳动有限公司 视频编解码中的子图像信令
WO2021137597A1 (ko) 2019-12-30 2021-07-08 엘지전자 주식회사 Ols에 대한 dpb 파라미터를 사용하는 영상 디코딩 방법 및 그 장치
WO2021137295A1 (en) 2019-12-30 2021-07-08 Sharp Kabushiki Kaisha Systems and methods for signaling subpicture information in video coding
WO2021136533A1 (en) 2019-12-31 2021-07-08 Huawei Technologies Co., Ltd. Encoder, decoder and corresponding methods and apparatus
US20220086497A1 (en) 2020-09-17 2022-03-17 Lemon Inc. Subpicture entity group signaling in coded video
US11671627B2 (en) 2020-09-17 2023-06-06 Lemon Inc. Operating point entity group signaling in coded video

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114041289A (zh) * 2020-03-27 2022-02-11 腾讯美国有限责任公司 用于指示多层视频流中的子层数目的方法
CN114041289B (zh) * 2020-03-27 2024-08-06 腾讯美国有限责任公司 一种视频编解码的方法和设备

Also Published As

Publication number Publication date
WO2021134020A1 (en) 2021-07-01
JP7562815B2 (ja) 2024-10-07
EP4062319A1 (en) 2022-09-28
EP4062634A4 (en) 2022-12-28
EP4062634A1 (en) 2022-09-28
CN114868158A (zh) 2022-08-05
US20240107069A1 (en) 2024-03-28
WO2021134019A1 (en) 2021-07-01
US11743505B2 (en) 2023-08-29
EP4062319A4 (en) 2023-01-11
US20220337815A1 (en) 2022-10-20
JP2023508426A (ja) 2023-03-02
US11843726B2 (en) 2023-12-12
JP2023508428A (ja) 2023-03-02
JP2024023377A (ja) 2024-02-21
JP7425878B2 (ja) 2024-01-31
JP7425204B2 (ja) 2024-01-30
KR20220113396A (ko) 2022-08-12
WO2021134018A1 (en) 2021-07-01
CN114846786A (zh) 2022-08-02
BR112022012708A2 (pt) 2022-09-06
US20220329869A1 (en) 2022-10-13
KR20220120566A (ko) 2022-08-30

Similar Documents

Publication Publication Date Title
JP7562815B2 (ja) レイヤ化されたビデオにおける復号ピクチャバッファパラメータのシグナリング
KR102708658B1 (ko) 비디오 코딩에서의 프로필, 티어 및 계층 표시
EP4104428A1 (en) Random access point access unit in scalable video coding
KR102718071B1 (ko) 계층화된 비디오에서의 디코딩된 픽처 버퍼 파라미터들의 시그널링

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination