CN115428454A - 使用参数集的视频编解码 - Google Patents

使用参数集的视频编解码 Download PDF

Info

Publication number
CN115428454A
CN115428454A CN202180026286.9A CN202180026286A CN115428454A CN 115428454 A CN115428454 A CN 115428454A CN 202180026286 A CN202180026286 A CN 202180026286A CN 115428454 A CN115428454 A CN 115428454A
Authority
CN
China
Prior art keywords
picture
video
format rule
syntax
bitstream
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180026286.9A
Other languages
English (en)
Inventor
王业奎
张莉
张凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ByteDance Inc
Original Assignee
ByteDance Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ByteDance Inc filed Critical ByteDance Inc
Publication of CN115428454A publication Critical patent/CN115428454A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/109Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/188Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a video data packet, e.g. a network abstraction layer [NAL] unit
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/577Motion compensation with bidirectional frame interpolation, i.e. using B-pictures

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

描述了用于视频处理的方法和装置。该处理可以包括视频编码、视频解码或视频转码。一种示例视频处理方法包括根据格式规则来执行包括一个或多个图片的视频和视频的比特流之间的转换,并且格式规则指定,响应于满足一个或多个条件,指示提供档次、层和级别信息的第一语法结构和提供解码图片缓冲区信息的第二语法结构是否存在于序列参数集中的语法元素被设置为等于1,以指示第一语法结构和第二语法结构存在于序列参数集中。

Description

使用参数集的视频编解码
相关申请的交叉引用
根据适用的专利法和/或依据巴黎公约的规则,本申请适时要求于2020年4月6日提交的美国申请No.63/006,054的优先权和权益。出于根据法律的所有目的,前述申请的全部公开通过引用而并入作为本申请的公开的一部分。
技术领域
本专利文档涉及图像和视频编解码和解码。
背景技术
在互联网和其他数字通信网络中,数字视频占用了最大的带宽。随着能够接收和显示视频的连接用户设备数量的增加,预计数字视频使用的带宽需求将继续增长。
发明内容
本文公开了可以由视频编码器和解码器用于使用对编解码表示的解码有用的控制信息来处理视频的编解码表示的技术。
在一个示例方面,公开了一种视频处理方法。该方法包括根据格式规则来执行包括包含一个或多个视频区域的一个或多个层的视频和视频的编解码表示之间的转换,其中格式规则指定一个或多个语法元素在与对应视频区域的被允许的条带类型相对应的一个或多个视频区域级别被包括在编解码表示中。
在另一个示例方面,公开了另一种视频处理方法。该方法包括根据格式规则来执行包括一个或多个层的视频和视频的编解码表示之间的转换,其中该一个或多个层包括包含一个或多个视频条带的一个或多个视频图片,其中格式规则指定根据第二规则在图片标头或条带标头之间至多一次包括与条带级别的编解码模式的启用或使用有关的语法元素。
在另一个示例方面,公开了另一种视频处理方法。该方法包括根据格式规则来执行包括包含一个或多个视频条带的一个或多个视频图片的视频和视频的编解码表示之间的转换,其中格式规则指定视频图片中被允许的条带类型控制参考图片列表是在编解码表示中被信令通知还是从编解码表示生成。
在另一个示例方面,公开了另一种视频处理方法。该方法包括执行包括包含一个或多个子图片的一个或多个视频图片的视频之间的转换,其中编解码表示符合格式规则,其中格式规则指定对视频图片的非编解码子图片的处理。
在另一个示例方面,公开了另一种视频处理方法。该方法包括根据格式规则来执行包括一个或多个图片的视频和视频的比特流之间的转换,其中格式规则指定,响应于满足一个或多个条件,指示提供档次、层和级别信息的第一语法结构和提供解码图片缓冲区信息的第二语法结构是否存在于序列参数集中的语法元素被设置为等于1,以指示第一语法结构和第二语法结构存在于序列参数集中。
在另一个示例方面,公开了另一种视频处理方法。该方法包括根据格式规则来执行包括一个或多个编解码层的视频和视频的比特流之间的转换,并且其中格式规则指定一个或多个参数集和/或通用约束信息语法结构包括指示编解码层视频序列的图片中被允许的条带类型的一个或多个语法元素。
在另一个示例方面,公开了另一种视频处理方法。该方法包括根据格式规则来执行包括一个或多个层的视频和视频的比特流之间的转换,其中该一个或多个层包括包含一个或多个条带的一个或多个图片,并且格式规则指定语法元素被包括在图片标头或条带标头中,以指示是否对视频的对应图片或条带允许双向预测B条带或者该双向预测B条带是否用于视频的对应图片或条带。
在另一个示例方面,公开了另一种视频处理方法。该方法包括根据格式规则来执行包括一个或多个层的视频和视频的比特流之间的转换,其中该一个或多个层包括包含一个或多个条带的一个或多个图片,并且格式规则指定根据第二规则在图片标头或条带标头之间至多一次包括与条带级别的编解码模式的启用或使用有关的一个或多个语法元素。
在另一个示例方面,公开了另一种视频处理方法。该方法包括根据格式规则来执行包括一个或多个图片的视频和视频的比特流之间的转换,其中格式规则指定,基于当前图片的图片顺序计数值来设置指示比特流中按照解码顺序在当前图片之前的解码图片缓冲区中的图片是否在从解码图片缓冲区中移除图片之前被输出的变量的值。
在另一个示例方面,公开了另一种视频处理方法。该方法包括根据格式规则来执行包括一个或多个图片的视频和视频的比特流之间的转换,其中格式规则指定图片类型和层独立性的启用控制i)是否将指示允许帧间条带或B条带或P条带的语法元素包括在图片和/或预测信息中,和/或ii)预测信息的存在的指示。
在另一个示例方面,公开了另一种视频处理方法。该方法包括根据格式规则来执行包括一个或多个图片的视频和视频的比特流之间的转换,其中格式规则指定参考图片列表在编解码层视频序列的转换期间的使用依赖于视频对应于编解码层视频序列的图片中被允许的条带类型。
在另一个示例方面,公开了另一种视频处理方法。该方法包括根据格式规则来执行包括一个或多个视频序列的视频和视频的比特流之间的转换,其中格式规则指定视频序列或比特流中的两个自适应参数集是否或在哪个条件下被允许具有相同的自适应参数集标识符。
在另一个示例方面,公开了另一种视频处理方法。该方法包括根据格式规则来执行视频和视频的比特流之间的转换,其中格式规则指定第一参数集和第二参数集彼此依赖,使得是否或如何将语法元素包括在第二参数集中是基于第一参数集。
在另一个示例方面,公开了另一种视频处理方法。该方法包括根据格式规则来执行包括一个或多个图片的视频和视频的比特流之间的转换,每个图片包括一个或多个子图片,其中格式规则指定对图片的非编解码子图片的处理。
在又一个示例方面,公开了一种视频编码器装置。视频编码器包括被配置为实施上述方法的处理器。
在又一个示例方面,公开了一种视频解码器装置。视频解码器包括被配置为实施上述方法的处理器。
在又一个示例方面,公开了一种存储有代码的计算机可读介质。该代码以处理器可执行代码的形式体现本文描述的方法之一。
这些以及其他特征将在本文档中描述。
附图说明
图1是一种示例视频处理系统的框图;
图2是一种视频处理装置的框图;
图3是一种视频处理的示例方法的流程图;
图4是示出根据本公开的一些实施例的视频编解码系统的框图;
图5是示出根据本公开的一些实施例的编码器的框图;
图6是示出根据本公开的一些实施例的解码器的框图;以及
图7A至图7J是基于所公开的技术的一些实施方式的视频处理的示例方法的流程图。
具体实施方式
在本文中使用章节标题是为了易于理解,而不是将每个章节中公开的技术和实施例的适用性仅限制于该章节。此外,在一些描述中使用H.266术语仅仅是为了易于理解,而不是为了限制所公开技术的范围。因此,本文描述的技术也适用于其他视频编解码器协议和设计。在本文中,某些实施例被示出作为对当前VVC规范的改变,其中新的文本被添加,示出为粗体斜体,并且删除的文本用双括号标记(例如,[[a]]指示删除字符“a”)。
1.引言
本文涉及视频编解码技术。具体地,它关于对允许的条带类型的信令和仅适用于双向预测条带的相关编解码工具的改进、以及对非编解码子图片的支持。这些思想可以单独或以各种组合被应用于支持多层视频编解码的任何视频编解码标准或非标准视频编解码器,例如正在开发的多功能视频编解码(VVC)。
2.缩写
ALF 自适应环路滤波器
APS 自适应参数集
AU 接入单元
AUD 接入单元分隔符
AVC 高级视频编解码
CLVS 编解码层视频序列
CPB 编解码图片缓冲区
CRA 完全随机接入
CTU 编解码树单元
CVS 编解码视频序列
DCI 解码能力信息
DPB 解码图片缓冲区
DU 解码单元
EOB 比特流结尾
EOS 序列结尾
GDR 逐渐解码刷新
HEVC 高效视频编解码
HRD 假设参考解码器
IDR 即时解码刷新
JEM 联合探索模型
LMCS 亮度映射与色度缩放
MCTS 运动约束片集
NAL 网络抽象层
OLS 输出层集
PH 图片标头
PPS 图片参数集
PTL 档次、层和级别
PU 图片单元
RADL 随机接入可解码前置(图片)
RAP 随机接入点
RASL 随机接入跳过前置(图片)
RBSP 原始字节序列有效载荷
RPL 参考图片列表
SAO 样点自适应偏移
SEI 辅助增强信息
SPS 序列参数集
STSA 逐步时域子层接入
SVC 可缩放视频编解码
VCL 视频编解码层
VPS 视频参数集
VTM VVC测试模型
VUI 视频可用性信息
VVC 多功能视频编解码
3.初步讨论
视频编解码标准主要是通过众所周知的ITU-T和ISO/IEC标准发展而来的。ITU-T制定了H.261和H.263,ISO/IEC制定了MPEG-1和MPEG-4视频,并且这两个组织共同制定了H.262/MPEG-2视频标准和H.264/MPEG-4高级视频编解码(Advanced Video Coding,AVC)和H.265/HEVC标准。自H.262开始,视频编解码标准是基于混合视频编解码结构,其中使用了时域预测加变换编解码。为探索HEVC之外的未来视频编解码技术,VCEG和MPEG于2015年共同成立了联合视频探索团队(Joint Video Exploration Team,JVET)。从那时起,JVET采用了许多新的方法,并将其放入名为联合探索模型(Joint Exploration Model,JEM)的参考软件中。JVET会议每季度举行一次,新编解码标准的目标是与HEVC相比降低50%的比特率。新视频编解码标准在2018年4月的JVET会议上被正式命名为多功能视频编解码(VVC),第一版VVC测试模型(VTM)也在当时发布。由于对VVC标准化的持续努力,新的编解码技术在每次JVET会议上都被采用到VVC标准中。VVC的工作草案和测试模型VTM在每次会议后都会被更新。最新的VVC工作草案JVET-Q2001_vE可以从以下地址下载:
http://phenix.it-
sudparis.eu/jvet/doc_end_user/documents/17_Brussels/wg11/JVET-Q2001-
v15.zip
VVC项目现在的目标是在2020年7月的会议上技术上完成(FDIS)。
3.1.参数集
AVC、HEVC和VVC指定了参数集。参数集的类型包括SPS、PPS、APS和VPS。在AVC、HEVC和VVC中的全部中都支持SPS和PPS。VPS从HEVC开始引入,并且被包括在HEVC和VVC中。APS没有被包括在AVC或HEVC中,但是被包括在最新的VVC草案文本中。
SPS被设计为携带序列级别标头信息,并且PPS被设计为携带不频繁改变的图片级别标头信息。利用SPS和PPS,不频繁改变的信息不需要针对每个序列或图片重复,因此可以避免该信息的冗余信令。此外,SPS和PPS的使用实现了重要标头信息的带外传输,因此不仅避免了对冗余传输的需要,还提高了容错性。
引入VPS用于携带对多层比特流中的所有层共同的序列级别标头信息。
引入APS用于携带这样的图片级别或条带级别信息,该信息需要相当多的比特来编解码,可以由多个图片共享,并且在序列中可以有相当多的不同变化。
3.1.1.视频参数集(VPS)
最新的VVC草案文本(JVET-Q2001-vE/v15)中的多个语法元素的语法表和语义被定义如下所示:
7.3.2.2视频参数集RBSP语法
Figure BDA0003872653680000071
3.1.2.序列参数集(SPS)
最新的VVC草案文本(JVET-Q2001-vE/v15)中的多个语法元素的语法表和语义被定义如下所示:
7.3.2.3序列参数集RBSP语法
Figure BDA0003872653680000081
Figure BDA0003872653680000091
3.1.3.通用约束标志
7.3.3.2通用约束信息语法
Figure BDA0003872653680000092
Figure BDA0003872653680000101
no_bdof_constraint_flag等于1指定sps_bdof_enabled_flag应当等于0。no_bdof_constraint_flag等于0不施加这样的约束。
no_dmvr_constraint_flag等于1指定sps_dmvr_enabled_flag应当等于0。no_dmvr_constraint_flag等于0不施加这样的约束。
no_bcw_constraint_flag等于1指定sps_bcw_enabled_flag应当等于0。no_bcw_constraint_flag等于0不施加这样的约束。
no_ciip_constraint_flag等于1指定sps_ciip_enabled_flag应当等于0。no_cipp_constraint_flag等于0不施加这样的约束。
no_gpm_constraint_flag等于1指定sps_gpm_enabled_flag应当等于0。no_gpm_constraint_flag等于0不施加这样的约束。
3.1.4.图片参数集(PPS)
最新的VVC草案文本(JVET-Q2001-vE/v15)中的多个语法元素的语法表和语义被定义如下所示:
7.3.2.4图片参数集RBSP语法
Figure BDA0003872653680000102
Figure BDA0003872653680000111
num_ref_idx_default_active_minus1[i]加1在i等于0时指定num_ref_idx_active_override_flag等于0的P条带或B条带的变量NumRefIdxActive[0]的推断值,并且在i等于1时指定num_ref_idx_active_override_flag等于0的B条带的NumRefIdxActive[1]的推断值。num_ref_idx_default_active_minus1[i]的值应当在0到14的范围(包括0和14)内。
pps_weighted_bipred_flag等于0指定显式加权预测不应用于参考PPS的B条带。pps_weighted_bipred_flag等于1指定显式加权预测被应用于参考PPS的B条带。当sps_weighted_bipred_flag等于0时,pps_weighted_bipred_flag的值应当等于0。
3.1.5.DPB参数语法
最新的VVC草案文本(JVET-Q2001-vE/v15)中的多个语法元素的语法表和语义被定义如下所示:
7.3.4DPB参数语法
Figure BDA0003872653680000112
7.4.5 DPB参数语义
dpb_parameters()语法结构提供一个或多个OLS的DPB大小、最大图片重新排序数量和最大延迟的信息。
当dpb_parameters()语法结构被包括在VPS中时,dpb_parameters()语法结构适用的OLS由VPS指定。当dpb_parameters()语法结构被包括在SPS中时,其适用于仅包括作为参考SPS的层当中的最低层的层的OLS,并且该最低层是独立层。
max_dec_pic_buffering_minus1[i]加1指定,当Htid等于i时以图片存储缓冲区为单位的DPB的最大要求尺寸。max_dec_pic_buffering_minus1[i]的值应当在0到MaxDpbSize-1的范围(包括0和MaxDpbSize-1)内,其中MaxDpbSize如条款A.4.2所指定的。当i大于0时,max_dec_pic_buffering_minus1[i]应当大于或等于max_dec_pic_buffering_minus1[i-1]。当对于在0到maxSubLayersMinus1-1的范围(包括0和maxSubLayersMinus1-1)内的i,不存在max_dec_pic_buffering_minus1[i]时,由于subLayerInfoFlag等于0,因此其被推断为等于max_dec_pic_buffering_minus1[maxSubLayersMinus1]。
max_num_reorder_pics[i]指定当Htid等于i时,OLS按照解码顺序可以在OLS中的任何图片之前并且按照输出顺序可以在该图片之后的图片的最大允许数量。max_num_reorder_pics[i]的值应当在0到max_dec_pic_buffering_minus1[i]的范围(包括0和max_dec_pic_buffering_minus1[i])内。当i大于0时,max_num_reorder_pics[i]应当大于或等于max_num_reorder_pics[i-1]。当对于在0到maxSubLayersMinus1-1的范围(包括0和maxSubLayersMinus1-1)内的i,不存在max_num_reorder_pics[i]时,由于subLayerInfoFlag等于0,因此其被推断为等于max_num_reorder_pics[maxSubLayersMinus1]。
max_latency_increase_plus1[i]不等于0用于计算MaxLatencyPictures[i]的值,其指定当Htid等于i时,OLS中按照输出顺序可以在OLS中的任何图片之前并且按照解码顺序在该图片之后的图片的最大数量。
当max_latency_increase_plus1[i]不等于0时,MaxLatencyPictures[i]的值被指定如下:
MaxLatencyPictures[i]=max_num_reorder_pics[i]+max_latency_increase_plus1[i]-1 (7-110)
当max_latency_increase_plus1[i]等于0时,不表达对应的限制。
max_latency_increase_plus1[i]的值应当在0到232-2的范围(包括0和232-2)内。当对于在0到maxSubLayersMinus1-1的范围(包括0和maxSubLayersMinus1-1)内的i,不存在max_latency_increase_plus1[i]时,由于subLayerInfoFlag等于0,因此其被推断为等于max_latency_increase_plus1[maxSubLayersMinus1]。
3.2.VVC中的图片标头(PH)和条带标头(SH)
与HEVC中类似,VVC中的条带标头传递特定条带的信息。这包括条带地址、条带类型、条带QP、图片顺序计数(POC)最低有效位(LSB)、RPS和RPL信息、加权预测参数、环路滤波参数、片和WPP的条目偏移等。
VVC引入了图片标头(PH),其包含特定图片的标头参数。每个图片必须具有一个或仅一个PH。PH基本上携带如果没有引入PH就在条带标头中的那些参数,但是每个参数对于图片的所有条带具有相同的值。这些包括IRAP/GDR图片指示、帧间/帧内条带允许标志、POCLSB以及可选地POC MSB、关于RPL、去方块、SAO、ALF、QP增量和加权预测的信息、编解码块分割信息、虚拟边界、并置图片信息等。经常出现的情况是,整个图片序列中的每个图片仅包含一个条带。为了在这种情况下允许对于每个图片不具有至少两个NAL单元,允许PH语法结构被包括在PH NAL单元或条带标头中。
在VVC中,在图片标头或条带标头中信令通知用于时域运动矢量预测的关于并置图片的信息。
3.2.1.图片标头(PH)
最新的VVC工作草案()中的多个语法元素的语法表和语义被定义如下所示:
7.3.2.7图片标头结构语法
Figure BDA0003872653680000131
Figure BDA0003872653680000141
3.2.2.条带标头(SH)
最新的VVC工作草案()中的多个语法元素的语法表和语义被定义如下所示:
7.3.7.1通用条带标头语法
Figure BDA0003872653680000142
Figure BDA0003872653680000151
Figure BDA0003872653680000161
slice_type根据表9指定条带的编解码类型。
表9–与slice_type的名称关联
slice_type slice_type的名称
0 B(B条带)
1 P(P条带)
2 I(I条带)
当不存在时,slice_type的值被推断为等于2。
当ph_intra_slice_allowed_flag等于0时,slice_type的值应当等于0或1。当nal_unit_type在IDR_W_RADL到CRA_NUT的范围(包括IDR_W_RADL和CRA_NUT)内,并且vps_independent_layer_flag[GeneralLayerIdx[nuh_layer_id]]等于1时,slice_type应当等于2。
3.3.JVET-R0052中的最新进展
在JVET-R0052方法#2中,提出了添加一个被允许的类型索引(即,ph_allowed_slice_types_idc),并且是否在图片中使用B条带可以从新添加的语法元素推导。
Figure BDA0003872653680000171
此外,另一个新的语法元素ph_multiple_slice_types_in_pic_flag被添加到PH结构,用于指定多于一个条带类型是否可以存在于当前图片中。ph_multiple_slice_types_in_pic_flag等于1指定图片的编解码条带可以具有slice_type的不同值。ph_multiple_slice_types_in_pic_flag等于0指定图片的所有编解码条带具有slice_type的相同值。当ph_multiple_slice_types_in_pic_flag等于0时,进一步信令通知ph_slice_type,以指定图片的所有条带的slice_type的值,并且条带标头中的slice_type不被编解码,并被推断为等于ph_slice_type的值。
7.3.2.7图片标头结构语法
Figure BDA0003872653680000172
Figure BDA0003872653680000181
Figure BDA0003872653680000191
7.3.7.1通用条带标头语法
Figure BDA0003872653680000201
Figure BDA0003872653680000211
Figure BDA0003872653680000221
7.4.3.7图片标头结构语义
Figure BDA0003872653680000222
Figure BDA0003872653680000223
Figure BDA0003872653680000224
[[ph_inter_slice_allowed_flag等于0指定图片的所有编解码条带具有等于2的slice_type。ph_inter_slice_allowed_flag等于1指定图片中可以有或者可以没有具有等于0或1的slice_type的一个或多个编解码条带。[编辑(YK):仔细检查以标志等于0为条件的那些语法元素的推断规则的需要/正确性。]
ph_intra_slice_allowed_flag等于0指定图片的所有编解码条带具有等于0或1的slice_type。ph_intra_slice_allowed_flag等于1指定图片中可以有或者可以没有具有等于2的slice_type的一个或多个编解码条带。当不存在时,ph_intra_slice_allowed_flag的值被推断为等于1。[编辑(YK):仔细检查以标志等于1为条件的那些语法元素的推断规则的需要/正确性。]]]
注2–对于应该进行基于子图片的比特流合并而无需改变PH NAL单元的比特流,预期编码器将[[ph_inter_slice_allowed_flag和ph_intra_slice_allowed_flag]]
Figure BDA0003872653680000231
的值设置为等于1。
7.4.8.1通用条带标头语义
slice_type根据表9指定条带的编解码类型。
表9–与slice_type的名称关联
slice_type slice_type的名称
0 B(B条带)
1 P(P条带)
2 I(I条带)
当不存在时,slice_types的值被[[推断为等于2]]推导如下:
–如果ph_multiple_slice_types_in_pic_flag等于1,则slice_type的值被设置为等于(slice_type_modified>=ph_allowed_slice_types_idc?slice_type_modified+1:slice_type_modified)。
–否则,slice_type的值被设置为等于ph_slice_type的值。
Figure BDA0003872653680000232
[[当ph_intra_slice_allowed_flag等于0时,slice_type的值应当等于0或1。]]当nal_unit_type在IDR_W_RADL到CRA_NUT的范围(包括IDR_W_RADL和CRA_NUT)内并且vps_independent_layer_flag[GeneralLayerIdx[nuh_layer_id]]等于1时,slice_type应当等于2。
7.4.8.2加权预测参数语义
num_l1_weights指定当pps_weighted_bipred_flag和wp_info_in_ph_flag都等于1时针对参考图片列表1中的条目信令通知的权重的数量。num_l1_weights的值应当在0到Min(15,num_ref_entries[1][RplsIdx[1]])的范围(包括0和Min(15,num_ref_entries[1][RplsIdx[1]]))内。
变量NumWeightsL1被推导如下:
Figure BDA0003872653680000242
NumWeightsL1=NumRefIdxActive[1]
可以在PPS中进一步信令通知新的语法元素pps_multiple_slice_types_in_pic_flag。当pps_multiple_slice_types_in_pic_flag等于0时,对于参考PPS的所有PH,ph_multiple_slice_types_in_pic_flag被推断为等于0。
对VVC草案8的相关修改用红色书写并用黄色突出显示,并且被提供如下:
7.3.2.4图片参数集RBSP语法
Figure BDA0003872653680000241
方法1的PH
7.3.2.7图片标头结构语法
Figure BDA0003872653680000251
方法2的PH
Figure BDA0003872653680000252
7.4.3.4图片参数集RBSP语义
Figure BDA0003872653680000253
Figure BDA0003872653680000261
3.4.JVET-R0151中的未编解码子图片和潜在应用
在本文中,示出了可以如何利用启用未编解码子图片的机制来扩展VVC。当子图片没有完全填满图片时,通过提供完全未使用的区域,未编解码子图片可以用于高效编解码。示出了OMAF用例以及4x3立方体贴图的360°视频编解码的示例。此外,未编解码子图片可以用于保留空间,其没有用编解码数据充填,而是用从已经编解码的内容生成的内容充填。这里,示出了360°视频的高级别高效几何填充的示例。
4.通过所公开的技术方案解决的技术问题
JVET中的当前VVC文本和最新进展有以下问题:
1.在最新的VVC草案文本中(在JVET-Q2001-vE/v15中),包括与被允许的条带类型有关的两个PH语法元素,例如,ph_inter_slice_allowed_flag和ph_intra_slice_allowed_flag,如图片标头结构语法所列的。利用这两个标志,仅当ph_intra_slice_allowed_flag为真时,才信令通知与I条带编解码有关的语法元素,并且仅当ph_inter_slice_allowed_flag为真时,才信令通知与帧间条带编解码有关的语法元素。然而,当ph_inter_slice_allowed_flag等于1时,解码器不知道图片是否包含B条带。一些应用(例如,在线游戏、视频会议、视频监控)通常仅使用P条带和I条带。因此,如果有是否允许B条带的指示,这样的应用的解码器将能够选择仅请求/使用不包括B条带的比特流,此外,该指示可以用于避免传送多个不必要的参数。
2.在JVET-R0052中,建议的改变仅被应用于PH和SH。没有更高级别控制它是否只能在图片内具有相同的条带类型和/或在图片中启用哪种允许的条带类型。此外,当不存在仅与双向预测有关的某些语法元素时,没有描述如何推断值。
3.在JVET-R0191的第1项中,提出了将sps_ptl_dpb_hrd_params_present_flag的值应当等于vps_independent_layer_flag[GeneralLayerIdx[nuh_layer_id]]的约束替换为以下内容:
当有仅包含一个层的OLS并且层ID等于SPS的nuh_layer_id时,sps_ptl_dpb_hrd_params_present_flag的值应当等于1。
然而,通过“当有仅包含一个层的OLS时”的条件,该改变引入了VPS依赖性。另一个问题是,对于单层比特流,sps_ptl_dpb_hrd_params_present_flag的值应当等于1,并且这没有被改变的约束记录。
5.示例技术方案和实施例的列表
为了解决以上问题,公开了如下总结的方法。以下项应该被视为解释一般概念的示例,并且不应该以狭隘的方式解释。此外,这些项可以被单独应用或者以任何方式被组合。
可以在参数集(例如,SPS、VPS、PPS、APS、DCI)和/或通用约束信息语法中添加一个或多个语法元素,以指示在图片内是否仅允许X(例如,I或B或P)条带;和/或指示图片中的允许的条带类型集合。
在参数集和通用约束信息语法中
1.在诸如SPS或PPS的视频单元中,添加一个或多个语法元素(例如,sps_allowed_slice_idc)以指定被允许的条带类型是否在CLVS的图片中。
1)在一个示例中,添加第一语法元素(例如,sps_allowed_slice_idc),并且其语义可以被定义为:sps_allowed_slice_idc等于X指定图片仅允许以下被允许的条带类型或它们的任何组合:
i.{全I}、{全P}、{全B}、{I,P}、{I,B}、{P,B}、{I,B,P}
ii.在一个实例中,第一语法元素可以用固定长度(例如,u(1)、u(2)或U(3))、一元编解码、截断一元编解码、EG编解码进行编解码。
iii.此外,可替代地,可以修改在SPS或PPS中信令通知的一个或多个语法元素的信令和/或语义和/或推断,使得它们仅在第一语法元素满足某些条件时被信令通知。
a.在一个示例中,一个或多个语法元素是用于启用需要多于一个预测信号的编解码工具的语法元素,诸如双向预测或混合帧内和帧间编解码、或者从多个预测块利用线性/非线性加权的预测。
b.在一个示例中,一个或多个语法元素可以包括但不限于:
a)sps_weighted_bipred_flag
b)sps_bdof_enabled_flag
c)sps_smvd_enabled_flag
d)sps_dmvr_enabled_flag
e)sps_bcw_enabled_flag
f)sps_ciip_enabled_flag
g)sps_gpm_enabled_flag
c.在一个示例中,仅当第一语法元素指定与视频单元相关联的CLVS可以包含一个或多个B条带时,才可以信令通知一个或多个语法元素。否则,跳过该信令,并且推断语法元素的值。
d.在一个示例中,当sps_b_slice_allowed_flag等于0时,不信令通知语法元素sps_weighted_bipred_flag、sps_bdof_enabled_flag、sps_smvd_enabled_flag、sps_dmvr_enabled_flag、sps_bcw_enabled_flag、sps_ciip_enabled_flag和sps_gpm_enabled_flag,并且推断它们的值。
a)在一个示例中,当不存在时,它们都被推断为0。
iv.此外,可替代地,可以在通用约束信息语法中信令通知第二语法元素,诸如no_b_slice_contraint_flag,以指示第一语法元素是否应当等于0。
a.在一个示例中,no_b_slice_contraint_flag的语义被定义如下所示:
Figure BDA0003872653680000281
等于1指定sps_allowed_slice_idc应当等于X(例如,将被允许的条带类型表示为{I,B,P}或{B,P}、{全B})。no_b_slice_constraint_flag等于0不施加这样的约束。
v.此外,可替代地,如果第一语法元素指定CLVS不包含B条带(例如,仅等于表示{I,P}、{全I}、{全P}的X的sps_allowed_slice_idc),则要求在通用约束信息语法中信令通知的一个或多个语法元素应当等于1。
a.在一个示例中,一个或多个语法元素可以包括但不限于:
a)no_bcw_constraint_flag
b)no_ciip_constraint_flag
c)no_gpm_constraint_flag
d)no_bdof_constraint_flag
e)no_dmvr_constraint_flag
vi.此外,可替代地,可以修改在dpb_parameters()中信令通知的一个或多个语法元素的信令和语义,使得它们仅在第一语法元素满足某些条件时被信令通知。
a.在一个示例中,一个或多个语法元素可以包括但不限于:
a)max_num_reorder_pics
b.在一个示例中,当第一语法元素告知不允许B条带时,max_num_reorder_pics不被信令通知并且被推断为0。
在PH/SH中
2.在PH/SH中,变量X用于指示是否在图片/条带中允许/使用B条带,并且该变量可以从SPS语法元素和/或指定被允许的条带类型的新的PH语法元素(例如,ph_allowed_slice_idc)和/或其他语法元素(例如,在JVET-R0052中使用的BSliceAllowed)推导。
1)在一个示例中,添加新的PH语法元素,并且如何信令通知该语法元素可以依赖于SPS中被允许的条带类型。
2)此外,可替代地,可以根据变量来修改在PH中信令通知的一个或多个语法元素的信令和/或语义和/或推断。
i.在一个示例中,一个或多个语法元素是用于启用需要多于一个预测信号的编解码工具的语法元素,诸如双向预测或混合帧内和帧间编解码、或者从多个预测块利用线性/非线性加权的预测。
ii.在一个示例中,一个或多个语法元素可以包括但不限于:
a)ph_collocated_from_l0_flag
b)mvd_l1_zero_flag
c)ph_disable_bdof_flag
d)ph_disable_dmvr_flag
e)num_l1_weights
iii.在一个示例中,仅当第一语法元素指定图片可以包含一个或多个B条带时,才可以信令通知一个或多个语法元素。否则,跳过该信令,并且推断语法元素的值。
a)此外,可替代地,是否信令通知一个或多个语法元素可以依赖于项目符号1.1和2.1中的第一语法元素,诸如(X为真或1)。
b)仅当(sps_bdof_pic_present_flag
Figure BDA0003872653680000301
)为真时,才可以信令通知ph_disable_bdof_flag。
c)仅当(sps_dmvr_pic_present_flag
Figure BDA0003872653680000302
)为真时,才可以信令通知ph_disable_dmvr_flag。
iv.在一个示例中,当X等于0(或假)时,不信令通知mvd_l1_zero_flag,并且其值被推断为1。
v.在一个示例中,一个或多个语法元素的推断依赖于第一语法元素的值。
a)在一个示例中,对于ph_disable_bdof_flag,适用以下内容:
–如果sps_bdof_enabled_flag等于1
Figure BDA0003872653680000303
Figure BDA0003872653680000304
则ph_disable_bdof_flag的值被推断为等于0。
–否则(sps_bdof_enabled_flag等于
Figure BDA0003872653680000305
Figure BDA0003872653680000311
),ph_disable_bdof_flag的值被推断为等于1。
b)在一个示例中,对于ph_disable_dmvr_flag,适用以下内容:
–如果sps_dmvr_enabled_flag等于
Figure BDA0003872653680000312
Figure BDA0003872653680000313
则ph_disable_dmvr_flag的值被推断为等于0。
–否则(sps_dmvr_enabled_flag等于
Figure BDA0003872653680000314
Figure BDA0003872653680000315
),ph_disable_dmvr_flag的值被推断为等于1。
c)在一个示例中,当ph_temporal_mvp_enabled_flag和rpl_info_in_ph_flag都等于1并且X等于0(或假)时,ph_collocated_from_l0_flag的值被推断为等于1。
d)在一个示例中,当X等于0(或假)时,不信令通知num_l1_weights,并且其值被推断为0,因此,不在图片的PH或SH中信令通知参考图片列表1的加权预测参数。
语法元素的推断
3.对于与编解码工具X有关的语法元素和/或可能存在于A(例如,PH)或B(例如,SH)中但不都存在于两者中的一组语法元素,如果A被包括在B中,则那些语法元素的存在的指示中的至少一个可以不被信令通知,并且可以被推断为0,即,存在于B中。
1)在一个示例中,编解码工具X可以包括以下之一:
i.环路滤波技术,例如去方块滤波器、ALF、SAO
ii.加权预测
iii.QP增量信息
iv.RPL信息
2)在一个示例中,条件“A被包括在B中”可以被定义为“参考PPS的条带标头包含PH语法结构”,或者“当前图片仅由一个条带组成”。
3)在一个示例中,“那些语法元素的存在的指示”可以被定义为以下语法元素中的一个或多个:
i.qp_delta_info_in_ph_flag、rpl_info_in_ph_flag、dbf_info_in_ph_flag、sao_info_in_ph_flag、wp_info_in_ph_flag、alf_info_in_ph_flag
4)在一个示例中,提出了以下改变中的一个或多个。
rpl_info_in_ph_flag等于1指定参考图片列表信息存在于PH语法结构中,并且不存在于不包含PH语法结构的参考PPS的条带标头中。rpl_info_in_ph_flag等于0指定参考图片列表信息不存在于PH语法结构中,并且可以存在于不包含PH语法结构的参考PPS的条带标头中。
Figure BDA0003872653680000321
Figure BDA0003872653680000322
dbf_info_in_ph_flag等于1指定去方块滤波器信息存在于PH语法结构中,并且不存在于不包含PH语法结构的参考PPS的条带标头中。dbf_info_in_ph_flag等于0指定去方块滤波器信息不存在于PH语法结构中,并且可以存在于不包含PH语法结构的参考PPS的条带标头中。当不存在时,dbf_info_in_ph_flag的值被推断为等于0。
Figure BDA0003872653680000323
Figure BDA0003872653680000324
sao_info_in_ph_flag等于1指定SAO滤波器信息存在于PH语法结构中,并且不存在于不包含PH语法结构的参考PPS的条带标头中。sao_info_in_ph_flag等于0指定SAO滤波器信息不存在于PH语法结构中,并且可以存在于不包含PH语法结构的参考PPS的条带标头中。
Figure BDA0003872653680000325
Figure BDA0003872653680000326
alf_info_in_ph_flag等于1指定ALF信息存在于PH语法结构中,并且不存在于参考不包含PH语法结构的PP的条带标头中。alf_info_in_ph_flag等于0指定ALF信息不存在于PH语法结构中,并且可以存在于不包含PH语法结构的参考PPS的条带标头中。
Figure BDA0003872653680000331
Figure BDA0003872653680000332
wp_info_in_ph_flag等于1指定加权预测信息可以存在于PH语法结构中,并且不存在于不包含PH语法结构的参考PPS的条带标头中。wp_info_in_ph_flag等于0指定加权预测信息不存在于PH语法结构中,并且可以存在于不包含PH语法结构的参考PPS的条带标头中。当不存在时,wp_info_in_ph_flag的值被推断为等于0。
Figure BDA0003872653680000333
Figure BDA0003872653680000334
qp_delta_info_in_ph_flag等于1指定QP增量信息存在于PH语法结构中,并且不存在于不包含PH语法结构的参考PPS的条带标头中。qp_delta_info_in_ph_flag等于0指定QP增量信息不存在于PH语法结构中,并且可以存在于不包含PH语法结构的参考PPS的条带标头中。
Figure BDA0003872653680000335
Figure BDA0003872653680000336
4.一致性比特流应当遵循这样的规则,即要求当作为拼接比特流中的CLVS AU的拼接点图片的POC值大于前一个图片的POC值时,针对拼接点图片将NoOutputOfPriorPicsFlag设置为等于1。
5.是否信令通知指示在图片和/或RPL/WP信息中允许帧间条带/B条带/P条带的语法元素,和/或RPL/WP信息的存在的指示可以依赖于图片类型和是否启用层独立性。
1)在一个示例中,不针对IRAP图片信令通知语法元素,并且启用层独立性。
i.在一个示例中,不针对IRAP图片信令通知VVC中的ph_inter_slice_allowed_flag,并且启用层独立性。
ii.在一个示例中,不针对IRAP图片信令通知VVC中的slice_type,并且启用层独立性。
iii.在一个示例中,不针对IRAP图片信令通知JVET-R0052中的ph_slice_type,并且启用层独立性。
2)在一个示例中,不针对IRAP图片信令通知语法元素,并且启用层独立性,即使这样的信息的存在告知它们在PH中。
i.当gdr_or_irap_pic_flag等于1并且gdr_pic_flag等于0时,提出了称为idr_pic_flag的新标志来指定与图片标头相关联的图片是否是IDR图片。并且可以应用以下内容:
a.当sps_idr_rpl_present_flag等于0,启用层独立性,并且idr_pic_flag等于1时,即使当rpl_info_in_ph_flag的值等于1时,RPL信令也不存在于PH中。
b.当sps_idr_rpl_present_flag等于0,启用层独立性,并且idr_pic_flag等于1时,即使当wp_info_in_ph_flag的值等于1时,WP信令也不存在于PH中。
6.提出了当sps_video_parameter_set_id大于0并且有仅包含nuh_layer_id等于SPS的nuh_layer_id的一个层的OLS,或者
sps_video_parameter_set_id等于0时,
sps_ptl_dpb_hrd_params_present_flag的值应当等于1。
参考列表相关
7.参考图片列表的信令通知和/或生成可以依赖于CLVS的图片中被允许的条带类型。
1)例如,如果在CLVS中不允许B条带,则可以不信令通知构建参考列表1的一个或多个语法元素。
2)例如,如果在CLVS中不允许B条带,则可以不进行构建参考列表1的一个或多个过程。
APS相关
8.要求两个APS在序列、CLVS或比特流中不应当具有相同的APS_id。
1)可替代地,要求具有相同APS类型的两个APS(诸如ALF APS或LMCS APS)在序列、CLVS或比特流中不应当具有相同的APS_id。
2)可替代地,允许具有相同APS类型的两个APS(诸如ALF APS或LMCS APS)具有相同的APS_id,但是它们在序列、CLVS或比特流中必须具有相同的内容。
3)可替代地,允许具有相同APS类型的两个APS(诸如ALF APS或LMCS APS)具有相同的APS_id。并且更早信令通知的APS被替换为更晚信令通知的APS。
4)可替代地,允许具有相同APS类型的两个APS(诸如ALF APS或LMCS APS)具有相同的APS_id。并且忽略更晚信令通知的APS。
9.两个不同的参数集(例如,APS和SPS)可以彼此依赖,并且根据第一参数集中的语法元素推导的语法元素或变量可以用于有条件地信令通知第二参数集中的另一语法元素。
1)可替代地,根据第一参数集中的语法元素推导的语法元素或变量可以用于推导第二参数集中的另一语法元素的值。
非编解码子图片相关
10.提出了非编解码子图片的边界必须被视为图片边界。
11.提出了环路滤波(诸如ALF/去方块/SAO)不能跨非编解码子图片的边界。
12.要求如果仅有一个子图,则它不能是非编解码子图片。
13.要求不能提取非编解码子图片。
14.提出了可以在SEI消息中信令通知与(多个)非编解码子图片有关的信息。
15.要求非编解码子图片只能具有一个条带。
16.要求左上方子图片不能是非编解码子图片。
17.要求子图片中的至少一个不是非编解码子图片。
18.是否和/或如何对边信息相关的子图片进行编解码可以依赖于子图片是否是非编解码子图片。
1)在一个示例中,如果它是非编解码子图片,则不需要信令通知边信息。
19.此外,可替代地,对于以上要求,它们可以根据以上情况被修改为有条件地信令通知。
接下来提供一些实施例优选的示例列表。
第一条款集合示出了在前一节中讨论的技术的示例实施例。以下条款示出了在前一节(例如,第1项)中讨论的技术的示例实施例。
1.一种视频处理方法(例如,图3中示出的方法3000),包括根据格式规则来执行包括包含一个或多个视频区域的一个或多个层的视频和视频的编解码表示之间的转换(3002),其中格式规则指定一个或多个语法元素在与对应视频区域的被允许的条带类型相对应的一个或多个视频区域级别被包括在编解码表示中。
2.根据条款1所述的方法,其中,格式规则指定一个或多个语法元素包括第一语法元素,该第一语法元素的值指示在对应视频区域中被允许的条带类型组合。
以下条款示出了在前一节(例如,第2项)中讨论的技术的示例实施例。
3.根据条款1-2中任一项所述的方法,其中,格式规则指定语法元素被包括在图片标头或条带标头中,以指示是否对对应图片或条带允许双向预测(B)条带或者该B条带是否用于对应图片或条带。
4.根据条款3所述的方法,其中,序列参数集中的语法元素控制图片标头或条带标头中包括的语法元素的存在。
以下条款示出了在前一节(例如,第3项)中讨论的技术的示例实施例。
5.一种视频处理方法,包括:根据格式规则来执行包括一个或多个层的视频和视频的编解码表示之间的转换,其中该一个或多个层包括包含一个或多个视频条带的一个或多个视频图片,其中格式规则指定根据第二规则在图片标头或条带标头之间至多一次包括与条带级别的编解码模式的启用或使用有关的语法元素。
6.根据条款5所述的方法,其中,编解码模式包括环路滤波器或加权预测模式,或量化参数增量模式。
以下条款示出了在前一节(例如,第7项)中讨论的技术的示例实施例。
7.一种视频处理方法,包括:根据格式规则来执行包括包含一个或多个视频条带的一个或多个视频图片的视频和视频的编解码表示之间的转换,其中格式规则指定视频图片中被允许的条带类型控制参考图片列表是在编解码表示中被信令通知还是从编解码表示生成。
8.根据条款7所述的方法,其中,格式规则指定,由于被允许的条带类型排除双向条带(B条带),对应于参考图片列表1的语法元素从编解码表示中省略。
9.根据条款7所述的方法,其中,格式规则指定,由于被允许的条带类型排除双向条带(B条带),对视频图片禁用用于生成参考图片列表1的过程。
以下条款示出了在前一节(例如,第10-15项)中讨论的技术的示例实施例。
10.一种视频处理方法,包括:执行包括包含一个或多个子图片的一个或多个视频图片的视频之间的转换,其中编解码表示符合格式规则,其中格式规则指定对视频图片的非编解码子图片的处理。
11.根据条款10所述的方法,其中,格式规则指定,在转换期间,非编解码子图片的边界被处理作为图片边界。
12.根据条款10所述的方法,其中,格式规则指定禁用跨非编解码图片的边界的环路滤波。
13.根据条款10所述的方法,其中,格式规则不允许非编解码子图片仅仅是视频图片的子图片。
14.根据条款10-13中任一项所述的方法,其中,格式规则指定用于非编解码子图片的解码协助的信息被包括在编解码表示的辅助增强信息语法元素中。
15.根据条款10所述的方法,其中,格式规则指定非编解码子图片被允许具有至多一个条带。
16.根据以上条款中任一项所述的方法,其中,视频区域包括视频图片或视频条带。
17.根据条款1至16中任一项所述的方法,其中,该转换包括将视频编码为编解码表示。
18.根据条款1至16中任一项所述的方法,其中,该转换包括对编解码表示进行解码以生成视频的像素值。
19.一种视频解码装置,包括被配置为实施根据条款1至18中的一项或多项所述的方法的处理器。
20.一种视频编码装置,包括被配置为实施根据条款1至18中的一项或多项所述的方法的处理器。
21.一种存储有计算机代码的计算机程序产品,该代码在由处理器执行时使得处理器实施根据条款1至18中任一项所述的方法。
22.一种本文档中描述的方法、装置或系统。
第二条款集合示出了在前一节(例如,第1-19项)中讨论的技术的示例实施例。
1.一种视频处理的方法(例如,如图7A所示的方法700),包括:根据格式规则来执行包括一个或多个图片的视频和视频的比特流之间的转换,其中格式规则指定,响应于满足一个或多个条件,指示提供档次、层和级别信息的第一语法结构和提供解码图片缓冲区信息的第二语法结构是否存在于序列参数集中的语法元素被设置为等于1,以指示第一语法结构和第二语法结构存在于序列参数集中。
2.根据条款1所述的方法,其中,一个或多个条件包括1)序列参数集所参考的视频参数集标识符大于0,并且存在仅包含具有等于特定值的网络抽象层NAL单元标头层标识符的一个层的输出层集,或者2)视频参数集标识符等于0。
3.根据条款1或2所述的方法,其中,语法元素等于1还指定提供通用定时和假设参考解码器参数信息的第三语法结构和提供输出层集定时和假设参考解码器参数信息的第四语法结构被允许存在于序列参数集中。
4.根据条款3所述的方法,其中,第三语法结构对应于general_timing_hrd_parameters()语法结构,并且第四语法结构对应于ols_timing_hrd_parameters()语法结构。
5.根据条款1至4中任一项所述的方法,其中,语法元素对应于sps_ptl_dpb_hrd_params_present_flag,第一语法结构对应于profile_tier_level()语法结构,并且第二语法结构对应于dpb_parameters()语法结构。
6.一种视频处理的方法(例如,如图7B所示的方法710),包括:根据格式规则来执行包括一个或多个编解码层的视频和视频的比特流之间的转换,其中格式规则指定一个或多个参数集和/或通用约束信息语法结构包括指示编解码层视频序列的图片中被允许的条带类型的一个或多个语法元素。
7.根据条款6所述的方法,其中,格式规则指定还包括第一语法元素,第一语法元素的值指示被允许的条带类型或在视频区域中被允许的条带类型组合。
8.根据条款7所述的方法,其中,格式规则指定,仅当第一语法元素满足某些条件时,才信令通知一个或多个语法元素。
9.根据条款7所述的方法,其中,格式规则指定通用约束信息语法结构包括第二语法元素,以指示第一语法元素是否等于0。
10.根据条款7所述的方法,其中,格式规则指定,在第一语法元素指定没有双向预测B条带被包括在编解码层视频序列中的情况下,一个或多个语法元素等于1。
11.一种视频处理的方法(例如,如图7C所示的方法720),包括:根据格式规则来执行包括一个或多个层的视频和视频的比特流之间的转换,其中该一个或多个层包括包含一个或多个条带的一个或多个图片722,其中格式规则指定语法元素被包括在图片标头或条带标头中,以指示是否对视频的对应图片或条带允许双向预测B条带或者该双向预测B条带是否用于视频的对应图片或条带。
12.根据条款11所述的方法,其中,格式规则指定序列参数集中的语法元素控制图片标头或条带标头中包括的语法元素的存在。
13.根据条款11所述的方法,其中,格式规则指定如何信令通知图片标头中的语法元素依赖于序列参数集中被允许的条带类型。
14.根据条款11所述的方法,其中,格式规则指定语法元素控制图片标头中包括的一个或多个语法元素的信令和/或语义和/或推断。
15.一种视频处理的方法(例如,如图7D所示的方法730),包括:根据格式规则来执行包括一个或多个层的视频和视频的比特流之间的转换,其中该一个或多个层包括包含一个或多个条带的一个或多个图片732,其中格式规则指定根据第二规则在图片标头或条带标头之间至多一次包括与条带级别的编解码模式的启用或使用有关的一个或多个语法元素。
16.根据条款15所述的方法,其中,编解码模式包括环路滤波或加权预测模式,或量化参数增量模式,或参考图片列表信息。
17.根据条款15所述的方法,其中,格式规则指定参考图片参数集的条带标头包含图片标头语法结构,比特流一致性的要求是一个或多个语法元素的值等于0。
18.一种视频处理的方法(例如,如图7E所示的方法740),包括:根据格式规则来执行包括一个或多个图片的视频和视频的比特流之间的转换742,其中格式规则指定,基于当前图片的图片顺序计数值来设置指示比特流中按照解码顺序在当前图片之前的解码图片缓冲区中的图片是否在从解码图片缓冲区中移除图片之前被输出的变量的值。
19.根据条款18所述的方法,其中,格式规则指定,在作为比特流中的拼接点图片和编解码层视频序列接入单元的当前图片的图片顺序计数值大于前一个图片的图片顺序计数值的情况下,针对当前图片将变量的值设置为等于1。
20.一种视频处理的方法(例如,如图7F所示的方法750),包括:根据格式规则来执行包括一个或多个图片的视频和视频的比特流之间的转换,其中格式规则指定图片类型和层独立性的启用控制i)是否将指示允许帧间条带或B条带或P条带的语法元素包括在图片和/或预测信息中,和/或ii)预测信息的存在的指示。
21.根据条款20所述的方法,其中,格式规则指定,在i)图片类型是帧内随机接入点图片,并且ii)启用层独立性的情况下,不包括语法元素。
22.根据条款21所述的方法,其中,格式规则指定,在满足i)和ii)的情况下不包括语法元素,而不管图片标头中指示预测信息的存在的另一语法元素如何。
23.根据条款21或22所述的方法,其中,格式规则指定,在图片是帧内随机接入点图片的情况下,还包括指定与图片标头相关联的图片是否是即时解码刷新IDR图片的变量。
24.根据条款21至23中任一项所述的方法,其中,格式规则指定预测信息的存在的指示不存在于图片标头中。
25.一种视频处理的方法(例如,如图7G所示的方法760),包括:根据格式规则来执行包括一个或多个图片的视频和视频的比特流之间的转换762,其中格式规则指定参考图片列表在编解码层视频序列的转换期间的使用依赖于视频对应于编解码层视频序列的图片中被允许的条带类型。
26.根据条款25所述的方法,其中,格式规则指定,由于被允许的条带类型排除双向条带(B条带),对应于参考图片列表1的语法元素从比特流中省略。
27.根据条款25所述的方法,其中,格式规则指定,由于被允许的条带类型排除双向条带(B条带),对视频图片禁用用于生成参考图片列表1的过程。
28.一种视频处理的方法(例如,如图7H所示的方法770),包括:根据格式规则来执行包括一个或多个视频序列的视频和视频的比特流之间的转换772,其中格式规则指定视频序列或比特流中的两个自适应参数集是否或在哪个条件下被允许具有相同的自适应参数集标识符。
29.根据条款28所述的方法,其中,格式规则指定两个自适应参数集不具有相同的自适应参数集标识符。
30.根据条款28所述的方法,其中,在两个自适应参数集具有相同的自适应参数集类型的情况下,两个自适应参数集不具有相同的自适应参数集标识符。
31.根据条款28所述的方法,其中,在1)两个自适应参数集具有相同的自适应参数集类型并且具有相同的内容,或者2)两个自适应参数集具有相同的自适应参数集类型的情况下,两个自适应参数集具有相同的自适应参数集标识符。
32.一种视频处理的方法(例如,如图7I所示的方法780),包括:根据格式规则来执行视频和视频的比特流之间的转换782,其中格式规则指定第一参数集和第二参数集彼此依赖,使得是否或如何将语法元素包括在第二参数集中是基于第一参数集。
33.根据条款32所述的方法,其中,格式规则指定第二参数集中的语法元素是基于根据第一参数集中的另一语法元素推导的语法元素或变量来有条件地包括或推导的。
34.一种视频处理的方法(例如,如图7J所示的方法790),包括:根据格式规则来执行包括一个或多个图片的视频和视频的比特流之间的转换,每个图片包括一个或多个子图片792,其中格式规则指定对图片的非编解码子图片的处理。
35.根据条款34所述的方法,其中,格式规则指定,在转换期间,非编解码子图片的边界被处理作为图片边界。
36.根据条款34所述的方法,其中,格式规则指定禁用跨非编解码子图片的边界的环路滤波。
37.根据条款34所述的方法,其中,格式规则不允许非编解码子图片仅仅是视频图片的子图片。
38.根据条款34所述的方法,其中,格式规则指定,在转换期间不提取非编解码子图片。
39.根据条款34所述的方法,其中,格式规则指定比特流的辅助增强信息语法元素包括用于非编解码子图片的解码协助的信息。
40.根据条款34所述的方法,其中,格式规则指定非编解码子图片被允许具有至多一个条带。
41.根据条款34所述的方法,其中,格式规则指定非编解码子图片不是图片的左上方子图片。
42.根据条款34所述的方法,其中,格式规则指定一个或多个子图片中的至少一个是编解码子图片。
43.根据条款34所述的方法,其中,格式规则指定是否和/或如何对与一个或多个子图片有关的边信息进行编解码依赖于子图片是编解码的还是非编解码的。
44.根据条款1至43中任一项所述的方法,其中,该转换包括将视频编码为比特流。
45.根据条款1至43中任一项所述的方法,其中,该转换包括从比特流解码视频。
46.根据条款1至43所述的方法,其中,该转换包括从视频生成比特流,并且该方法还包括:将比特流存储在非暂时性计算机可读记录介质中。
47.一种视频处理装置,包括被配置为实施根据条款1至46中任一项或多项所述的方法的处理器。
48.一种存储视频的比特流的方法,包括根据条款1至46中任一项所述的方法,并且还包括将比特流存储到非暂时性计算机可读记录介质。
49.一种存储程序代码的计算机可读介质,该程序代码在被执行时使得处理器实施根据条款1至46中任一项或多项所述的方法。
50.一种计算机可读介质,存储根据上述方法中任一项而生成的比特流。
51.一种用于存储比特流表示的视频处理装置,其中该视频处理装置被配置为实施根据条款1至46中任一项或多项所述的方法。
在本文中,术语“视频处理”可以指视频编码、视频解码、视频压缩或视频解压缩。例如,可以在从视频的像素表示到对应的比特流表示的转换期间应用视频压缩算法,反之亦然。例如,当前视频块的比特流表示可以对应于由语法定义的比特流中的并置位置或在不同位置传播的比特。例如,可以根据经过变换和编码的误差残差值、并且也可以使用比特流中的标头和其他字段中的比特对宏块进行编码。此外,在转换期间,解码器可以基于该确定,在知道一些字段可能存在或不存在的情况下解析比特流,如以上技术方案所描述的。类似地,编码器可以确定包括或不包括特定语法字段,并通过包括语法字段或从编解码表示中排除语法字段来相应地生成编解码表示。
本文中描述的所公开的和其他技术方案、示例、实施例、模块和功能操作可以在数字电子电路或计算机软件、固件或硬件中实现,包括本文中公开的结构及其结构等效物,或者其中一个或多个的组合。所公开的实施例和其他实施例可以实现为一个或多个计算机程序产品,即在计算机可读介质上编码以供数据处理装置执行或控制其操作的计算机程序指令的一个或多个模块。计算机可读介质可以是机器可读存储设备、机器可读存储基板、存储设备、影响机器可读传播信号的物质的组合,或者一个或多个它们的组合。术语“数据处理装置”包括用于处理数据的所有装置、设备和机器,包括例如可编程处理器、计算机或多个处理器或计算机。除硬件外,装置还可以包括为计算机程序创建执行环境的代码,例如,构成处理器固件、协议栈、数据库管理系统、操作系统或其中一个或多个的组合的代码。传播的信号是人为生成的信号,例如,机器生成的电、光或电磁信号,其被生成以编码信息以传输到合适的接收器装置。
计算机程序(也称为程序、软件、软件应用、脚本或代码)可以用任何形式的编程语言(包括编译语言或解释语言)编写,并且可以以任何形式部署,包括作为独立程序或作为模块、分量、子程序或其他适合在计算环境中使用的单元。计算机程序不一定与文件系统中的文件对应。程序可以存储在保存其他程序或数据的文件的部分中(例如,存储在标志语言文件中的一个或多个脚本)、专用于该程序的单个文件中、或多个协调文件(例如,存储一个或多个模块、子程序或部分代码的文件)中。计算机程序可以部署在一台或多台计算机上来执行,这些计算机位于一个站点上或分布在多个站点上,并通过通信网络互连。
本文件中描述的处理和逻辑流可以通过一个或多个可编程处理器执行,该处理器执行一个或多个计算机程序,通过在输入数据上操作并生成输出来执行功能。处理和逻辑流也可以通过特殊用途的逻辑电路来执行,并且装置也可以实现为特殊用途的逻辑电路,例如,FPGA(现场可编程门阵列)或ASIC(专用集成电路)。
例如,适于执行计算机程序的处理器包括通用和专用微处理器,以及任何类型数字计算机的任何一个或多个。通常,处理器将从只读存储器或随机存取存储器或两者接收指令和数据。计算机的基本元件是执行指令的处理器和存储指令和数据的一个或多个存储设备。通常,计算机还将包括一个或多个用于存储数据的大容量存储设备,例如,磁盘、磁光盘或光盘,或通过操作耦合到一个或多个大容量存储设备来从其接收数据或将数据传输到一个或多个大容量存储设备,或两者兼有。然而,计算机不一定具有这样的设备。适用于存储计算机程序指令和数据的计算机可读介质包括所有形式的非易失性存储器、介质和存储器设备,包括例如半导体存储器设备,例如EPROM、EEPROM和闪存设备;磁盘,例如,帧内硬盘或可移动硬盘;磁光盘;以及CD ROM和DVD ROM盘。处理器和存储器可以由专用逻辑电路来补充,或并入专用逻辑电路中。
虽然本专利文件包含许多细节,但不应将其解释为对任何主题或权利要求范围的限制,而应解释为对特定技术的特定实施例的特征的描述。本专利文件在单独实施例的上下文描述的某些特征也可以在单个实施例中组合实施。相反,在单个实施例的上下文中描述的各种功能也可以在多个实施例中单独实施,或在任何合适的子组合中实施。此外,尽管上述特征可以描述为在某些组合中起作用,甚至最初要求是这样,但在某些情况下,可以从组合中移除权利要求组合中的一个或多个特征,并且权利要求的组合可以指向子组合或子组合的变体。
类似地,尽管附图中以特定顺序描述了操作,但这不应理解为要获得想要的结果必须按照所示的特定顺序或顺序执行此类操作,或执行所有说明的操作。此外,本专利文档实施例中各种系统组件的分离不应理解为在所有实施例中都需要这样的分离。
仅描述了一些实现和示例,其他实施、增强和变体可以基于本专利文件中描述和说明的内容做出。

Claims (51)

1.一种视频处理的方法,包括:
根据格式规则来执行包括一个或多个图片的视频和所述视频的比特流之间的转换,
其中,所述格式规则指定,响应于满足一个或多个条件,指示提供档次、层和级别信息的第一语法结构和提供解码图片缓冲区信息的第二语法结构是否存在于序列参数集中的语法元素被设置为等于1,以指示所述第一语法结构和所述第二语法结构存在于所述序列参数集中。
2.根据权利要求1所述的方法,其中,所述一个或多个条件包括1)所述序列参数集所参考的视频参数集标识符大于0,并且存在仅包含具有等于特定值的网络抽象层NAL单元标头层标识符的一个层的输出层集,或者2)所述视频参数集标识符等于0。
3.根据权利要求1或2所述的方法,其中,所述语法元素等于1还指定提供通用定时和假设参考解码器参数信息的第三语法结构和提供输出层集定时和假设参考解码器参数信息的第四语法结构被允许存在于所述序列参数集中。
4.根据权利要求3所述的方法,其中,所述第三语法结构对应于general_timing_hrd_parameters()语法结构,并且所述第四语法结构对应于ols_timing_hrd_parameters()语法结构。
5.根据权利要求1至4中任一项所述的方法,其中,所述语法元素对应于sps_ptl_dpb_hrd_params_present_flag,所述第一语法结构对应于profile_tier_level()语法结构,并且所述第二语法结构对应于dpb_parameters()语法结构。
6.一种视频处理的方法,包括:
根据格式规则来执行包括一个或多个编解码层的视频和所述视频的比特流之间的转换,
其中,所述格式规则指定一个或多个参数集和/或通用约束信息语法结构包括指示编解码层视频序列的图片中被允许的条带类型的一个或多个语法元素。
7.根据权利要求6所述的方法,其中,所述格式规则指定还包括第一语法元素,所述第一语法元素的值指示所述被允许的条带类型或在视频区域中被允许的条带类型组合。
8.根据权利要求7所述的方法,其中,所述格式规则指定,仅当所述第一语法元素满足某些条件时,才信令通知所述一个或多个语法元素。
9.根据权利要求7所述的方法,其中,所述格式规则指定通用约束信息语法结构包括第二语法元素,以指示所述第一语法元素是否等于0。
10.根据权利要求7所述的方法,其中,所述格式规则指定,在所述第一语法元素指定没有双向预测B条带被包括在所述编解码层视频序列中的情况下,所述一个或多个语法元素等于1。
11.一种视频处理的方法,包括:
根据格式规则来执行包括一个或多个层的视频和所述视频的比特流之间的转换,其中所述一个或多个层包括包含一个或多个条带的一个或多个图片,
其中,所述格式规则指定语法元素被包括在图片标头或条带标头中,以指示是否对所述视频的对应图片或条带允许双向预测B条带,或者所述双向预测B条带是否用于所述视频的对应图片或条带。
12.根据权利要求11所述的方法,其中,所述格式规则指定序列参数集中的语法元素控制所述图片标头或所述条带标头中包括的所述语法元素的存在。
13.根据权利要求11所述的方法,其中,所述格式规则指定如何信令通知所述图片标头中的所述语法元素依赖于序列参数集中被允许的条带类型。
14.根据权利要求11所述的方法,其中,所述格式规则指定所述语法元素控制所述图片标头中包括的一个或多个语法元素的信令和/或语义和/或推断。
15.一种视频处理的方法,包括:
根据格式规则来执行包括一个或多个层的视频和所述视频的比特流之间的转换,其中所述一个或多个层包括包含一个或多个条带的一个或多个图片,
其中,所述格式规则指定根据第二规则在图片标头或条带标头之间至多一次包括与条带级别的编解码模式的启用或使用有关的一个或多个语法元素。
16.根据权利要求15所述的方法,其中,所述编解码模式包括环路滤波或加权预测模式,或量化参数增量模式,或参考图片列表信息。
17.根据权利要求15所述的方法,其中,所述格式规则指定参考图片参数集的所述条带标头包含图片标头语法结构,比特流一致性的要求是所述一个或多个语法元素的值等于0。
18.一种视频处理的方法,包括:
根据格式规则来执行包括一个或多个图片的视频和所述视频的比特流之间的转换,
其中,所述格式规则指定,基于当前图片的图片顺序计数值来设置指示所述比特流中按照解码顺序在所述当前图片之前的解码图片缓冲区中的图片是否在从所述解码图片缓冲区中移除所述图片之前被输出的变量的值。
19.根据权利要求18所述的方法,其中,所述格式规则指定,在作为所述比特流中的拼接点图片和编解码层视频序列接入单元的所述当前图片的图片顺序计数值大于前一个图片的图片顺序计数值的情况下,针对所述当前图片将所述变量的值设置为等于1。
20.一种视频处理的方法,包括:
根据格式规则来执行包括一个或多个图片的视频和所述视频的比特流之间的转换,
其中,所述格式规则指定图片类型和层独立性的启用控制i)是否将指示允许帧间条带或B条带或P条带的语法元素包括在图片和/或预测信息中,和/或ii)所述预测信息的存在的指示。
21.根据权利要求20所述的方法,其中,所述格式规则指定,在i)所述图片类型是帧内随机接入点图片,并且ii)启用所述层独立性的情况下,不包括所述语法元素。
22.根据权利要求21所述的方法,其中,所述格式规则指定,在满足i)和ii)的情况下不包括所述语法元素,而不管图片标头中指示所述预测信息的存在的另一语法元素如何。
23.根据权利要求21或22所述的方法,其中,所述格式规则指定,在所述图片是所述帧内随机接入点图片的情况下,还包括指定与所述图片标头相关联的所述图片是否是即时解码刷新IDR图片的变量。
24.根据权利要求21至23中任一项所述的方法,其中,所述格式规则指定所述预测信息的存在的指示不存在于所述图片标头中。
25.一种视频处理的方法,包括:
根据格式规则来执行包括一个或多个图片的视频和所述视频的比特流之间的转换,
其中,所述格式规则指定参考图片列表在编解码层视频序列的所述转换期间的使用依赖于所述视频对应于所述编解码层视频序列的图片中被允许的条带类型。
26.根据权利要求25所述的方法,其中,所述格式规则指定,由于所述被允许的条带类型排除双向条带(B条带),对应于参考图片列表1的语法元素从所述比特流中省略。
27.根据权利要求25所述的方法,其中,所述格式规则指定,由于所述被允许的条带类型排除双向条带(B条带),对视频图片禁用用于生成参考图片列表1的过程。
28.一种视频处理的方法,包括:
根据格式规则来执行包括一个或多个视频序列的视频和所述视频的比特流之间的转换,
其中,所述格式规则指定视频序列或所述比特流中的两个自适应参数集是否或在哪个条件下被允许具有相同的自适应参数集标识符。
29.根据权利要求28所述的方法,其中,所述格式规则指定所述两个自适应参数集不具有相同的自适应参数集标识符。
30.根据权利要求28所述的方法,其中,在所述两个自适应参数集具有相同的自适应参数集类型的情况下,所述两个自适应参数集不具有相同的自适应参数集标识符。
31.根据权利要求28所述的方法,其中,在1)所述两个自适应参数集具有相同的自适应参数集类型并且具有相同的内容,或者2)所述两个自适应参数集具有相同的自适应参数集类型的情况下,所述两个自适应参数集具有相同的自适应参数集标识符。
32.一种视频处理的方法,包括:
根据格式规则来执行视频和所述视频的比特流之间的转换,
其中,所述格式规则指定第一参数集和第二参数集彼此依赖,使得是否或如何将语法元素包括在所述第二参数集中是基于所述第一参数集。
33.根据权利要求32所述的方法,其中,所述格式规则指定所述第二参数集中的所述语法元素是基于根据所述第一参数集中的另一语法元素推导的语法元素或变量来有条件地包括或推导的。
34.一种视频处理的方法,包括:
根据格式规则来执行包括一个或多个图片的视频和所述视频的比特流之间的转换,每个图片包括一个或多个子图片,
其中,所述格式规则指定对图片的非编解码子图片的处理。
35.根据权利要求34所述的方法,其中,所述格式规则指定,在所述转换期间,所述非编解码子图片的边界被处理作为图片边界。
36.根据权利要求34所述的方法,其中,所述格式规则指定禁用跨所述非编解码子图片的边界的环路滤波。
37.根据权利要求34所述的方法,其中,所述格式规则不允许所述非编解码子图片仅仅是所述视频图片的子图片。
38.根据权利要求34所述的方法,其中,所述格式规则指定,在所述转换期间不提取所述非编解码子图片。
39.根据权利要求34所述的方法,其中,所述格式规则指定所述比特流的辅助增强信息语法元素包括用于所述非编解码子图片的解码协助的信息。
40.根据权利要求34所述的方法,其中,所述格式规则指定所述非编解码子图片被允许具有至多一个条带。
41.根据权利要求34所述的方法,其中,所述格式规则指定所述非编解码子图片不是所述图片的左上方子图片。
42.根据权利要求34所述的方法,其中,所述格式规则指定所述一个或多个子图片中的至少一个是编解码子图片。
43.根据权利要求34所述的方法,其中,所述格式规则指定是否和/或如何对与所述一个或多个子图片有关的边信息进行编解码依赖于子图片是编解码的还是非编解码的。
44.根据权利要求1至43中任一项所述的方法,其中,所述转换包括将所述视频编码为所述比特流。
45.根据权利要求1至43中任一项所述的方法,其中,所述转换包括从所述比特流解码所述视频。
46.根据权利要求1至43所述的方法,其中,所述转换包括从所述视频生成所述比特流,并且所述方法还包括:将所述比特流存储在非暂时性计算机可读记录介质中。
47.一种视频处理装置,包括被配置为实施根据权利要求1至46中任一项或多项所述的方法的处理器。
48.一种存储视频的比特流的方法,包括根据权利要求1至46中任一项所述的方法,并且还包括将所述比特流存储到非暂时性计算机可读记录介质。
49.一种存储程序代码的计算机可读介质,所述程序代码在被执行时使得处理器实施根据权利要求1至46中任一项或多项所述的方法。
50.一种计算机可读介质,存储根据上述方法中任一项而生成的比特流。
51.一种用于存储比特流表示的视频处理装置,其中所述视频处理装置被配置为实施根据权利要求1至46中任一项或多项所述的方法。
CN202180026286.9A 2020-04-06 2021-04-01 使用参数集的视频编解码 Pending CN115428454A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202063006054P 2020-04-06 2020-04-06
US63/006,054 2020-04-06
PCT/US2021/025351 WO2021206993A1 (en) 2020-04-06 2021-04-01 Video coding using parameter sets

Publications (1)

Publication Number Publication Date
CN115428454A true CN115428454A (zh) 2022-12-02

Family

ID=78023879

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180026286.9A Pending CN115428454A (zh) 2020-04-06 2021-04-01 使用参数集的视频编解码

Country Status (3)

Country Link
US (2) US11812063B2 (zh)
CN (1) CN115428454A (zh)
WO (1) WO2021206993A1 (zh)

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4355156B2 (ja) 2002-04-16 2009-10-28 パナソニック株式会社 画像復号化方法及び画像復号化装置
WO2005071970A1 (en) 2004-01-16 2005-08-04 General Instrument Corporation Method and apparatus for determining timing information from a bit stream
US10003815B2 (en) * 2013-06-03 2018-06-19 Qualcomm Incorporated Hypothetical reference decoder model and conformance for cross-layer random access skipped pictures
JPWO2015053120A1 (ja) * 2013-10-08 2017-03-09 シャープ株式会社 画像復号装置、画像復号方法、画像符号化装置、及び画像符号化方法
JP2017522792A (ja) * 2014-06-18 2017-08-10 シャープ株式会社 スライス・タイプおよびデコーダ適合性
US10171828B2 (en) 2015-02-27 2019-01-01 Arris Enterprises Llc Modification of unification of intra block copy and inter signaling related syntax and semantics
AU2016343499B2 (en) * 2015-10-19 2019-08-29 Hfi Innovation Inc. Method and apparatus for decoded picture buffer management in video coding system using intra block copy
US11140417B2 (en) 2016-11-01 2021-10-05 Nokia Technologies Oy Apparatus, a method and a computer program for video coding and decoding
US11062738B2 (en) 2017-03-23 2021-07-13 Qualcomm Incorporated Signalling of video content including sub-picture bitstreams for video coding
CN113498606A (zh) * 2019-01-02 2021-10-12 诺基亚技术有限公司 用于视频编码和解码的装置、方法和计算机程序
CA3146555A1 (en) 2019-07-08 2021-01-14 Huawei Technologies Co., Ltd. Mixed nal unit picture constraints in video coding

Also Published As

Publication number Publication date
US11812063B2 (en) 2023-11-07
US20230044662A1 (en) 2023-02-09
WO2021206993A1 (en) 2021-10-14
US20240089503A1 (en) 2024-03-14

Similar Documents

Publication Publication Date Title
US11849149B2 (en) Order relationship between subpictures according to value for layer and value of subpicture index
JP2023517085A (ja) 適応ループフィルタリング
US11838555B2 (en) Picture output flag indication in video coding
US20240048689A1 (en) Sublayers information in video coding
US20230007244A1 (en) Constraints on reference picture lists entries
US20240080492A1 (en) Identification Of Inter-Layer Reference Pictures In Coded Video
CN115362479A (zh) 图片中的条带类型
CN115699733A (zh) 在视频编解码中信令通知层间参考图片
CN115699731A (zh) 参考图片重采样
CN115428454A (zh) 使用参数集的视频编解码
US20240127464A1 (en) Coding of instantaneous decoding refresh subpictures
US20240137493A1 (en) Constraints On Reference Picture Lists
WO2021195026A1 (en) Level information in video coding
EP4122195A1 (en) Constraints on reference picture lists
CN115486067A (zh) 视频图片标头中的滤波器参数信令通知

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination