CN115398901A - 瞬时解码刷新子图片的编解码 - Google Patents

瞬时解码刷新子图片的编解码 Download PDF

Info

Publication number
CN115398901A
CN115398901A CN202180028190.6A CN202180028190A CN115398901A CN 115398901 A CN115398901 A CN 115398901A CN 202180028190 A CN202180028190 A CN 202180028190A CN 115398901 A CN115398901 A CN 115398901A
Authority
CN
China
Prior art keywords
picture
video
pictures
slice
flag
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180028190.6A
Other languages
English (en)
Inventor
王业奎
张莉
张凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ByteDance Inc
Original Assignee
ByteDance Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ByteDance Inc filed Critical ByteDance Inc
Publication of CN115398901A publication Critical patent/CN115398901A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/30Determination of transform parameters for the alignment of images, i.e. image registration
    • G06T7/33Determination of transform parameters for the alignment of images, i.e. image registration using feature-based methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • G06T7/73Determining position or orientation of objects or cameras using feature-based methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/188Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a video data packet, e.g. a network abstraction layer [NAL] unit
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/58Motion compensation with long-term prediction, i.e. the reference frame for a current frame not being the temporally closest one
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/86Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving reduction of coding artifacts, e.g. of blockiness
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10072Tomographic images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20021Dividing image into blocks, subimages or windows
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20092Interactive image processing based on input by user
    • G06T2207/20104Interactive definition of region of interest [ROI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30061Lung
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30101Blood vessel; Artery; Vein; Vascular
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30172Centreline of tubular or elongated structure

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

描述了视频处理的方法和装置。该处理可以包括视频编码、视频解码或视频转码。示例视频处理方法包括执行包括一个或多个图片的视频与该视频的比特流之间的转换,一个或多个图片包括一个或多个子图片,并且其中根据顺序规则将一个或多个图片和/或一个或多个子图片包括在比特流中,并且其中顺序规则规定当前瞬时解码器刷新(IDR)图片或当前IDR子图片在比特流中的位置相对于当前IDR图片或当前IDR子图片的当前条带的参考图片列表中的条目所参考的另一图片之间的关系。

Description

瞬时解码刷新子图片的编解码
相关申请的交叉引用
根据适用专利法和/或依据巴黎公约的规定,本申请旨在及时要求于2020年4月12日提交的美国申请No.63/008,799的优先权和权益。出于根据法律的全部目的,上述申请的全部公开内容通过引用并入作为本申请公开内容的一部分。
技术领域
本专利文档涉及图像和视频的编解码及解码。
背景技术
数字视频占互联网和其它数字通信网络上的最大带宽使用。随着能够接收和显示视频的连接用户设备的数目增加,预期数字视频使用的带宽需求将继续增长。
发明内容
本文档公开了可以由视频编码器和解码器用于使用对编解码表示的解码有用的控制信息来处理视频的编解码表示的技术。
在一个示例方面中,公开了一种视频处理方法。该方法包括:根据格式规则执行包括一个或多个层的视频与该视频的编解码表示之间的转换,一个或多个层包括一个或多个视频区域,其中该格式规则规定在对应于对于对应视频区域的允许条带类型的一个或多个视频区域级别将一个或多个语法元素包括在编解码表示中。
在另一个示例方面中,公开了另一种视频处理方法。该方法包括:根据格式规则执行包括一个或多个层的视频与该视频的编解码表示之间的转换,一个或多个层包括包括一个或多个视频条带的一个或多个视频图片,其中该格式规则规定根据第二规则在图片标头或条带标头之间最多包括一次与在条带级别的编解码模式的启用或使用相关的语法元素。
在另一个示例方面中,公开了另一种视频处理方法。该方法包括:根据格式规则执行包括一个或多个视频图片的视频与该视频的编解码表示之间的转换,一个或多个视频图片包括一个或多个视频条带,其中该格式规则规定视频图片中的允许条带类型控制是否在编解码表示中信令通知或可从编解码表示生成参考图片列表。
在另一个示例方面中,公开了另一种视频处理方法。该方法包括:执行包括一个或多个视频图片的视频与该视频的编解码表示之间的转换,该一个或多个视频图片包括一个或多个子图片,其中编解码表示符合格式规则,其中格式规则规定视频图片的非编解码子图片的处理。
在另一个示例方面中,公开了另一种视频处理方法。该方法包括:执行包括一个或多个图片的视频与该视频的比特流之间的转换,一个或多个图片包括一个或多个子图片,其中一个或多个图片和/或一个或多个子图片根据顺序规则被包括在比特流中,其中顺序规则规定比特流中的当前瞬时解码器刷新(IDR)图片或当前IDR子图片的位置相对于由当前IDR图片或当前IDR子图片的当前条带的参考图片列表中的条目所参考的另一图片之间的关系。
在另一个示例方面中,公开了另一种视频处理方法。该方法包括:根据格式规则执行包括一个或多个图片的视频与该视频的比特流之间的转换,一个或多个图片包括一个或多个子图片和/或一个或多个条带,并且其中该格式规则允许包括访问单元的指示,以指示访问单元是对于视频中的每个访问单元的帧内随机访问点(IRAP)访问单元还是逐渐解码刷新(GDR)访问单元。
在另一个示例方面中,公开了另一种视频处理方法。该方法包括:根据格式规则执行包括一个或多个图片的视频与该视频的比特流之间的转换,一个或多个图片包括一个或多个子图片和/或一个或多个条带,并且其中该格式规则规定是否基于图片的图片条件将图片中允许的条带类型选择性地包括在比特流中的指示。
在另一个示例方面中,公开了另一种视频处理方法。该方法包括:执行包括一个或多个图片的视频与该视频的比特流之间的转换,一个或多个图片包括一个或多个子图片和/或一个或多个条带,其中该格式规则规定将至少两个或四个语法元素之一设置为自适应环路滤波器(ALF)自适应参数集的特定值。
在另一个示例方面中,公开了另一种视频处理方法。该方法包括:根据格式规则执行包括一个或多个图片的视频与该视频的比特流之间的转换,并且其中该格式规则规定是否和/或如何信令通知滤波器存在标志和/或滤波器系数的指示取决于具有自适应参数集RBSP(原始字节序列有效载荷)语法中的语法元素和/或自适应环路滤波数据结构的先前编解码信息。
在另一个示例方面中,公开了另一种视频处理方法。该方法包括:根据格式规则执行包括一个或多个图片的视频与该视频的比特流之间的转换,并且其中该格式规则允许对于小于图片的视频区域参考对应于边信息被包括在APS中的编解码工具的多个自适应参数集(APS)。
在另一个示例方面中,公开了另一种视频处理方法。该方法包括:根据格式规则执行包括一个或多个图片的视频与该视频的比特流之间的转换,一个或多个图片包括一个或多个子图片,并且其中该格式规则规定如何推导第一变量的值取决于第二变量,该第一变量指示编解码图片的子图片是否在不包括环路滤波操作的解码过程中被视为图片,该第二变量指示比特流中存在子图片信息。
在另一个示例方面中,公开了另一种视频处理方法。该方法包括:根据格式规则执行包括一个或多个图片的视频与该视频的比特流之间的转换,一个或多个图片包括一个或多个子图片,并且其中该格式规则规定响应于一个或多个条件被满足,指示去方块滤波器对参考图片参数集的图片的适用性的变量具有第一值或第二值,该第一值用于指示去方块滤波器被应用于参考图片参数集的条带,该第二值用于指示对于参考图片参数集的条带禁用去方块滤波器。
在另一个示例方面中,公开了另一种视频处理方法。该方法包括:根据格式规则执行包括一个或多个视频单元的视频与该视频的比特流之间的转换,一个或多个视频单元包括一个或多个条带,其中该格式规则规定用于联合色度残差编解码的量化参数偏移值被包括在大于条带级别的一个或多个视频单元级别中。
在另一个示例方面中,公开了另一种视频处理方法。该方法包括:根据格式规则执行包括一个或多个图片的视频与该视频的比特流之间的转换,并且其中该格式规则规定:(i)用于对指示图片标头级别中的LMCS(具有色度缩放的亮度映射)模式标识的变量进行编解码的一个或多个比特的固定或可变长度,以及(ii)变量的值的范围。
在另一个示例方面中,公开了另一种视频处理方法。该方法包括:根据格式规则执行包括一个或多个图片的视频与该视频的比特流之间的转换,并且其中该格式规则规定:(i)用于对指示图片标头级别中的缩放列表模式标识的变量进行编解码的一个或多个比特的固定或可变长度,以及(ii)变量的值的范围。
在又一个示例方面中,公开了一种视频编码器装置。视频编码器包括被配置为实施上述方法的处理器。
在又一个示例方面中,公开了一种视频解码器装置。视频解码器包括被配置为实施上述方法的处理器。
在又一个示例方面中,公开了一种其上存储有代码的计算机可读介质。该代码以处理器可执行代码的形式体现了本文描述的方法之一。
在整个本文档中描述了这些和其它特征。
附图说明
图1是示例视频处理系统的框图。
图2是视频处理装置的框图。
图3是视频处理的示例方法的流程图。
图4是示出根据本公开的一些实施例的视频编解码系统的框图。
图5是示出根据本公开的一些实施例的编码器的框图。
图6是示出根据本公开的一些实施例的解码器的框图。
图7A至图7K是基于所公开技术的一些实施方式的视频处理的示例方法的流程图。
具体实施方式
在本文档中使用章节标题是为了便于理解并且不将每个章节中公开的技术和实施例的适用性仅限于该章节。此外,在一些描述中使用H.266术语只是为了便于理解而不是为了限制所公开技术的范围。因此,本文描述的技术也适用于其它视频编解码器协议和设计。在本文档中,某些实施例被示出为对当前VVC规范的更改,其中添加了示出粗斜体的新文本,并且已删除的文本用双括号标记(例如,[[a]]表示删除字符“a”)。
1.序言
本文档与视频编解码技术有关。具体地,它是关于对允许条带类型和相关编解码工具的信令通知的改进,这些相关编解码工具仅适用于双预测条带,并支持非编解码子图片。这些思想可以单独或以各种组合应用于支持多层视频编解码的任何视频编解码标准或非标准视频编解码器,例如,正在开发的通用视频编解码(VVC)。
2.缩写
ALF 自适应环路滤波器
APS 自适应参数集
AU 访问单元
AUD 访问单元分隔符
AVC 高级视频编解码
CLVS 编解码层视频序列
CPB 编解码图片缓冲区
CRA 清洁随机访问
CTU 编解码树单元
CVS 编解码视频序列
CVSS 编解码视频序列开始
DCI 解码能力信息
DPB 解码图片缓冲区
DU 解码单元
EOB 比特流结束
EOS 序列结束
GDR 逐步解码刷新
HEVC 高效视频编解码
HRD 假设参考解码器
IDR 瞬时解码刷新
JEM 联合探索模型
LMCS 具有色度缩放的亮度映射
MCTS 运动约束片集合
NAL 网络抽象层
OLS 输出层集合
PH 图片标头
PPS 图片参数集合
PTL 档次、层级和级别
PU 图片单元
RADL 随机访问可解码前导(图片)
RAP 随机访问点
RASL 随机访问跳过前导(图片)
RBSP 原始字节序列有效载荷
RPL 参考图片列表
SAO 样点自适应偏移
SEI 补充增强信息
SPS 序列参数集合
STSA 逐步时域子层访问
SVC 可扩展视频编解码
VCL 视频编解码层
VPS 视频参数集合
VTM VVC测试模型
VUI 视频可用性信息
VVC 多功能视频编解码
3.初步讨论
视频编解码标准主要是通过著名的ITU-T和ISO/IEC标准的发展而发展起来的。ITU-T制作了H.261和H.263,ISO/IEC制作了MPEG-1和MPEG-4Visual,并且这两个组织联合制作了H.262/MPEG-2视频标准和H.264/MPEG-4高级视频编解码(AVC)标准以及H.265/HEVC标准。自H.262以来,视频编解码标准基于混合视频编解码结构,其中,使用了时域预测加变换编解码。为了探索HEVC之外的未来视频编解码技术,VCEG和MPEG于2015年联合成立了联合视频探索小组(JVET)。此后,许多新方法被JVET采用,并被应用到名为联合探索模型(JEM)的参考软件中。JVET会议每季度同时举行一次,并且新的编解码标准的目标是比HEVC降低50%的比特率。在2018年4月的JVET会议上,新的视频编解码标准被正式命名为通用视频编解码(VVC),并且当时发布了VVC测试模型(VTM)的第一个版本。随着致力于VVC标准化的不断努力,每次JVET会议都会为VCC标准采用新的编解码技术。然后在每次会议后更新VVC工作草案和测试模型VTM。最新的VVC工作草案JVET-Q2001_vE可以从以下网址下载:http://phenix.it-sudparis.eu/jvet/doc_end_user/documents/17_Brussels/wg11/JVET-Q2001-v15.zip。VVC项目的目标是在2020年7月的会议上实现技术竣工(FDIS)。
3.1.参数集合
AVC、HEVC和VVC规定参数集合。参数集合的类型包括SPS、PPS、APS和VPS。所有AVC、HEVC和VVC都支持SPS和PPS。VPS是自HEVC以来引入的,并且被包括在HEVC和VVC中。APS未被包括在AVC或HEVC中,但被包括在最新的VVC草案文本中。
SPS被设计用于携带序列级别标头信息,并且PPS被设计用于携带不经常变化的图片级别标头信息。使用SPS和PPS,不需要为每个序列或图片重复不经常变化的信息,因此可以避免此信息的冗余信令通知。此外,SPS和PPS的使用能够实现重要标头信息的带外传输,因此不仅避免了冗余传输的需要,而且还提高了错误恢复能力。
引入VPS是为了携带多层比特流中所有层通用的序列级别标头信息。
引入APS是为了携带这样的图片级别信息或条带级别信息,这些信息需要相当多的比特来编解码,可以由多个图片共享,并且在序列中可以有相当多的不同变体。
3.1.1.视频参数集合(VPS)
按照如下方式定义最新的VVC草案文本(JVET-Q2001-vE/v15)中的多个语法元素的语法表格和语义:
7.3.2.2视频参数集合RBSP语法
Figure BDA0003887573300000071
Figure BDA0003887573300000081
3.1.2.序列参数集合(SPS)
按照如下方式定义最新的VVC草案文本(JVET-Q2001-vE/v15)中的多个语法元素的语法表格和语义:
7.3.2.3序列参数集合RBSP语法
Figure BDA0003887573300000082
Figure BDA0003887573300000091
3.1.3.通用约束标志
7.3.3.2通用约束信息语法
Figure BDA0003887573300000092
Figure BDA0003887573300000101
等于1的
Figure BDA0003887573300000102
规定sps_bdof_enabled_flag应等于0。等于0的no_bdof_constraint_flag不施加此类约束。
等于1的
Figure BDA0003887573300000103
规定sps_dmvr_enabled_flag应等于0。等于0的no_dmvr_contraint_flag不施加此类约束。
等于1的
Figure BDA0003887573300000104
规定sps_bcw_enabled_flag应等于0。等于0的no_bcw_constraint_flag不施加此类约束。
等于1的
Figure BDA0003887573300000105
规定sps_ciip_enabled_flag应等于0。等于0的no_cipp_constraint_flag不施加此类约束。
等于1的
Figure BDA0003887573300000112
规定sps_gpm_enabled_flag应等于0。等于0的no_gpm_constraint_flag不施加此类约束。
3.1.4.图片参数集合(PPS)
按照如下方式定义最新的VVC草案文本(JVET-Q2001-vE/v15)中的多个语法元素的语法表格和语义:
7.3.2.4图片参数集RBSP语法
Figure BDA0003887573300000111
Figure BDA0003887573300000113
[i]加1,当i等于0时,规定具有num_ref_idx_active_override_flag等于0的P或B条带的变量NumRefIdxActive[0]的推断值,并且当i等于1时,规定具有num_ref_idx_active_override_flag等于0的B条带的NumRefIdxActive[1]的推断值。num_ref_idx_default_active_minus1[i]的值应在0到14(包含0和14)的范围内。
等于0的
Figure BDA0003887573300000114
规定显示加权预测不被应用于引用PPS的B条带。等于1的pps_weighted_bipred_flag规定显示加权预测被应用于引用PPS的B条带。当sps_weighted_bipred_flag等于0时,pps_weighted_bipred_flag的值应等于0。
3.1.5.DPB参数语法
按照如下方式定义最新的VVC草案文本(JVET-Q2001-vE/v15)中的多个语法元素的语法表格和语义。
7.3.4 DPB参数语法
Figure BDA0003887573300000121
7.4.5 DPB参数语义
dpb_parameters()语法结构提供了一个或多个OLS的DPB尺寸、最大图片重排序数和最大延迟的信息。
当dpb_parameters()语法结构被包括在VPS中时,dpb_parameters()语法结构应用的OLS由VPS规定。当dpb_parameters()语法结构被包括在SPS中时,它适用于仅包括作为参考SPS的层中的最低层的层的OLS,并且此最低层是独立层。
Figure BDA0003887573300000122
[i]加1规定当Htid等于i时,以图片存储缓存器为单位的DPB的最大所需尺寸。max_dec_pic_buffering_minus1[i]的值应在0到MaxDpbSize-1(含)的范围内,其中MaxDpbSize如条款A.4.2规定的。当i大于0时,max_dec_pic_buffering_minus1[i]应大于或等于max_dec_pic_buffering_minus1[i-1]。当max_dec_pic_buffering_minus1[i]不存在时(针对0到maxSubLayersMinus1-1(含)范围内的i),由于subLayerInfoFlag等于0,因此其被推断为等于max_dec_pic_buffering_minus1[maxSubLayersMinus1]。
Figure BDA0003887573300000123
[i]规定OLS的图片的最大允许数目,当Htid等于i时,这些图片可以在解码顺序中位于OLS中的任何图片之前,并在输出顺序中位于该图片之后。max_num_reorder_pics[i]的值应在0到max_dec_pic_buffering_minus1[i](含)的范围内。当i大于0时,max_num_reorder_pics[i]应大于或等于max_num_reorder_pics[i-1]。当max_num_reorder_pics[i]不存在时(针对0到maxSubLayersMinus1-1(含)的范围内的i),由于subLayerInfoFlag等于0,因此其被推断为等于max_num_reorder_pics[maxSubLayersMinus1]。
不等于0的
Figure BDA0003887573300000131
[i]用于计算MaxLatencyPictures[i]的值,该值规定了OLS中的图片的最大数目,当Htid等于i时,这些图片可以在输出顺序中位于OLS中任何图片之前,并在解码顺序中位于该图片之后。当max_latency_increase_plus1[i]不等于0时,按照如下方式规定MaxLatencyPictures[i]的值:
MaxLatencyPictures[i]=max_num_reorder_pics[i]+max_latency_increase_plus1[i]-1 (7-110)
当max_latency_increase_plus1[i]等于0时,不表示对应的限制。
max_latency_increase_plus1[i]的值应在0到232-2(含)的范围内。当max_latency_increase_plus1[i]不存在时(针对0到maxSubLayersMinus1-1(含)的范围内的i),由于subLayerInfoFlag等于0,因此其被推断为等于max_latency_increase_plus1[maxSubLayersMinus1]。
3.2.VVC中的图片标头(PH)和条带标头(SH)
与HEVC中类似,VVC中的条带标头传送特定条带的信息。这包括条带地址、条带类型、条带QP、图片顺序计数(POC)最低有效位(LSB)、RPS和RPL信息、加权预测参数、环路滤波参数、WPP和片的条目偏移等。
VVC引入了图片标头(PH),其包含特定图片的标头参数。每个图片必须有一个或只有一个PH。PH基本上携带了那些参数,如果没有引入PH,则那些参数将会出现在条带标头中,但对于图片的所有条带,每个参数都具有相同的值。这些包括IRAP/GDR图片指示、条带间/条带内允许标志、POC LSB和可选的POC MSB、关于RPL、去方块、SAO、ALF、QP增量的信息以及加权预测、编解码块分割信息、虚拟边界、共置图片信息等。通常情况下,整个图片序列中的每个图片仅包含一个条带。为了允许在这种情况下每个图片不具有至少两个NAL单元,允许PH语法结构被包括在PH NAL单元或条带标头中。
在VVC中,在图片标头或条带标头中信令通知用于时域运动矢量预测的关于并置图片的信息。
3.2.1.图片标头(PH)
按照如下方式定义最新VVC工作草案中的多个语法元素的语法表格和语义:
7.3.2.7图片标头结构语法
Figure BDA0003887573300000141
3.2.2.条带标头(SH)
按照如下方式定义最新VVC工作草案中的多个语法元素的语法表格和语义:
7.3.7.1通用条带标头语法
Figure BDA0003887573300000151
Figure BDA0003887573300000161
Figure BDA0003887573300000171
slice_type规定根据表格9的条带的编解码类型。
表格9-与slice_type相关联的名称
slice_type slice_type名称
0 B(B条带)
1 P(P条带)
2 I(I条带)
当不存在时,slice_type的值被推断为等于2。
当ph_intra_slice_allowed_flag等于0时,slice_type的值应当等于0或1。当nal_unit_type在IDR_W_RADL到CRA_NUT(含)的范围内并且vps_independent_layer_flag[GeneralLayerIdx[nuh_layer_id]]等于1时,slice_type应当等于2。
3.3.JVET-R0052中的最新进展
在JVET-R0052方法#2中,提议添加一个允许的类型索引(即,ph_allowed_slice_types_idc),并且是否在图片中使用B条带可以从新添加的语法元素中推导。
Figure BDA0003887573300000172
另外,另一个新的语法元素ph_multiple_slice_types_in_pic_flag被添加到PH结构中,以用于规定当前图片中是否存在多个条带类型。等于1的ph_multiple_slice_types_in_pic_flag规定图片的编解码条带可以具有不同的slice_type值。等于0的ph_multiple_slice_types_in_pic_flag规定图片的所有编解码条带具有相同的slice_type值。当ph_multiple_slice_types_in_pic_flag等于0时,ph_slice_type被进一步信令通知以规定图片的所有条带的slice_type的值,并且条带标头中的slice_type未被编解码并且被推断为等于ph_slice_type的值。
7.3.2.7图片标头结构语法
Figure BDA0003887573300000181
Figure BDA0003887573300000191
Figure BDA0003887573300000201
7.3.7.1通用条带标头语法
Figure BDA0003887573300000202
Figure BDA0003887573300000211
Figure BDA0003887573300000221
7.4.3.7图片标头结构语义
Figure BDA0003887573300000222
表格X-由ph_allowed_slice_types_idc规定的slice_type的允许值
Figure BDA0003887573300000223
Figure BDA0003887573300000224
[[等于0的
Figure BDA0003887573300000225
规定图片的所有编解码条带的slice_type都等于2。等于1的ph_inter_slice_allowed_flag规定图片中可能有或没有一个或多个编解码条带的slice_type等于0或1。[Ed.(YK):对于那些由等于0的此标志限制的语法元素,仔细检查推理规则的需要性/正确性。]
等于0的
Figure BDA0003887573300000226
规定图片的所有编解码条带的slice_type都等于0或1。等于1的ph_intra_slice_allowed_flag规定图片中可能有或没有一个或多个编解码条带的slice_type等于2。当不存在时,ph_intra_slice_allowed_flag的值被推断为等于1。[Ed.(YK):对于那些由等于1的此标志限制的语法元素,仔细检查推理规则的需要性/正确性。]]]
注2–对于应该在不需要更改PH NAL单元的情况下进行基于子图片的比特流merging的比特流,编码器需要将[[ph_inter_slice_allowed_flag和ph_intra_slice_allowed_flag]]的值
Figure BDA0003887573300000231
设置为等于1。
7.4.8.1通用条带标头语义
Figure BDA0003887573300000234
规定根据表格9的条带的编解码类型。
表格9-与slice_type相关联的名称
Figure BDA0003887573300000235
当不存在时,按照如下方式推导slice_types的值被[[推导为等于2]]:
Figure BDA0003887573300000232
[[当ph_intra_slice_allowed_flag等于0,slice_type的值应等于0或1。]]当nal_unit_type在IDR_W_RADL到CRA_NUT(含)的范围内,并且vps_independent_layer_flag[GeneralLayerIdx[nuh_layer_id]]等于1时,slice_type应等于2。
7.4.8.2加权预测参数语义
当pps_weighted_bipred_flag和wp_info_in_ph_flag均等于1时,
Figure BDA0003887573300000236
规定针对参考图片列表1中的条目信令通知的权重的数目。num_11_weights的值应在0到Min(15,num_ref_entries[1][RplsIdx[1]])(含)的范围内。
按照如下方式推导变量NumWeightsL1:
Figure BDA0003887573300000233
Figure BDA0003887573300000241
可以在PPS中进一步信令通知新的语法元素
Figure BDA0003887573300000244
当pps_multiple_slice_types_in_pic_flag等于0时,对于引用PPS的所有PH,ph_multiple_slice_types_in_pic_flag被推断为等于0。
VVC草案8的相关修改以红色书写,并以黄色突出显示,并且被提供如下:
7.3.2.4图片参数集RBSP语法
Figure BDA0003887573300000242
方法1的PH
7.3.2.7图片标头结构语法
Figure BDA0003887573300000243
Figure BDA0003887573300000251
方法2的PH
Figure BDA0003887573300000252
7.4.3.4图片参数集RBSP语义
Figure BDA0003887573300000253
3.4.JVET-R0151中未编解码的子图片和潜在应用
在本文档中,展示了如何通过启用未编解码子图片的机制来扩展VVC。当子图片没有完全填满图片时,通过提供完全未使用的区域,可以将未编码的子图片用于高效编解码。示出示例用于OMAF用例以及4x3立方体映射的360°视频编解码。此外,未编码的子图片可以用于保留空间,该空间不是用编解码数据填充的,而是用已经编解码的内容生成的内容填充的。这里,示出了360°视频的高级别、高效几何填充的示例。
3.5.APS
7.3.2.5自适应参数集RBSP语法
Figure BDA0003887573300000261
ALF APS数据的语法表格
7.3.2.19自适应环路滤波数据语法
Figure BDA0003887573300000262
Figure BDA0003887573300000271
显示缩放列表APS数据的语法表格:
7.3.2.21缩放列表数据语法
Figure BDA0003887573300000281
7.3.2.20使用色度缩放数据语法的亮度映射
Figure BDA0003887573300000282
Figure BDA0003887573300000291
在PH或SH中信令通知ALF APS的使用(开启/关闭控制和一个或多个APS索引,如果需要),但不是两者中都信令通知。对于图片/条带,可以信令通知多个ALF APS。对于显式缩放列表和LMCS,在PH中,会信令通知标志来指示显式缩放表,并且为至少一个条带启用LMCS。并且如果LMCS被启用,则会进一步信令通知一个APS索引。
7.3.2.7图片标头结构语法
Figure BDA0003887573300000292
Figure BDA0003887573300000301
4.由公开的技术解决方案解决的技术问题
当前的VVC文本和JVET的最新进展存在以下问题:
1.在最新的VVC草案文本(JVET-Q2001-vE/v15)中,包括了与允许的条带类型相关的两个PH语法元素,即ph_inter_slice_allowed_flag和ph_intra_slice_allowed_flag,如图片标头结构语法中所列表显示的。利用这两个标志,只有当ph_intra_slice_allowed_flag为真时,与I条带编解码相关的语法元素才会被信令通知,而只有当ph_inter_slice_allowed_flag为真时,与帧间条带编解码相关的语法元素才会被信令通知。然而,当ph_inter_slice_allowed_flag等于1时,解码器不知道图片是否包含B条带。一些应用(例如在线游戏、视频会议、视频监控)通常只使用P条带和I条带。因此,如果存在是否允许B条带的指示,则此类应用的解码器将能够选择仅请求/使用不包括B条带的比特流,并且此外,该指示可以用于避免发送多个不必要的参数。
2.在JVET-R0052中,建议的更改仅适用于PH和SH。对于图片内是否只能有相同的条带类型和/或图片中启用何种允许的条带类型,没有更高级别的控制。另外,当只与双预测相关的某些语法元素不存在时,不描述如何推断这些值。
3.在JVET-R0191的第1项中,提议将sps_ptl_dpb_hrd_params_present_flag的值应等于vps_independent_layer_flag[GeneralLayerIdx[nuh_layer_id]]的约束替换为以下内容:
当存在仅包含一个层且层ID等于SPS的nuh_layer_id的OLS时,sps_ptl_dpb_hrd_params_present_flag的值应等于1。
然而,该变化通过条件“当存在仅包含一个层的OLS时”引入了VPS依赖性。另一个问题是,对于单层比特流,sps_ptl_dpb_hrd_params_present_flag的值应等于1,并且这不会被更改的约束捕获。
4.在JVET-R0267中,提出了以下约束:当当前图片是IDR图片并且sps_idr_rpl_present_flag等于1时,应当不存在在输出顺序或解码顺序中位于解码顺序中的任何在前的IRAP图片(如果存在)之前的RefPicList[0]或RefPicList[1]中的条目所参考的图片。
然而,该约束仅适用于单层比特流。
5.在JVET-R0042中,向VVC提出了如下总结的更改:
1)对于每种图片类型,都定义了对应的子图片类型。
2)术语“相关联的GDR子图片”和“相关联的IRAP子图片”也被定义。
3)nal_unit_type等于CRA_NUT的NAL单元的内容被称为“CRA图片或子图片的编解码条带”,而不是“CRA图片的编解码条带”。类似地,对于其它VCL NAL单元类型。
4)要求图片内具有不同NAL单元类型的任意两个相邻子图片应当都具有等于1的subpic_treated_as_pic_flag[]。
5)对于不同类型的子图片和在在先AU和在后AU中具有相同子图片索引的相同层子图片,在子图片域中规定了不同类型图片以及在先AU和在后AU中相同层图片在相对解码顺序、输出顺序和预测关系方面的类似约束。然而,对于IDR子图片的RPL条目缺乏约束。
6.JVET-R0065提议对VVC的以下更改:
1)要求每个GDR AU完整(即,要有CVS中存在的每个层的图片)。这意味着,由GDR图片组成的不完整AU不是GDR AU,类似于当前VVC文本中由IRAP图片组成的未完整AU不是IRAP AU。
2)将名为irap_or_gdr_au_flag的标志添加到AUD中,以规定AU是IRAP还是GDRAU,并在vps_max_layers_minus1大于0时,强制在每个IRAP或GDR AU中存在AUD NAL单元。
然而,如果不要求IRAP或GDR AU完整,但要求AU中的每个图片都是IRAP或GDR图片,则仍需要存在AU是IRAP还是GDR AU的指示,以使得解码器能够在接收到第一个图片的第一个VCL NAL单元后确定AU是IRAP还是GDR AU。在没有这样的指示的情况下,解码器直到接收到AU的最后一张图片(当接收到的最后一张图片位于OLS的最高层时)或直到接收到下一个AU的第一个NAL单元(当接收的最后一张图片不在OLS的最高层时)才能够知道这一点。
7.JVET-R0063提议将PH标志ph_lmcs_enabled_flag替换为2位ph_lmcs_mode_idc,并规定3种模式:禁用(模式0)、用于所有条带(模式1)和启用(模式2)。在模式1中,LMCS用于图片的所有条带,并且SH中不需要LMCS控制标志的信令通知。slice_lmcs_enabled_flag的语义也相应地被修改。另外,还提议修复ph_chroma_residual_scale_flag的语义,以反映对于图片或条带启用/禁用色度残差缩放的意图。然而,JVET-R0063中提议的ph_lmcs_mode_idc也可以是ue(v)编解码的。
8.JVET-R0064提议将PH标志ph_explicit_scaling_list_enabled_flag替换为2位ph_explicit_scaling_list_mode_idc,并规定3种模式:禁用(模式0)、用于所有条带(模式1)和启用(模式2)。在模式1中,显式缩放列表被用于图片的所有条带,并且SH中不需要缩放列表信令通知。然而,JVET-R0064中提议的ph_explicit_scaling_list_mode_idc也可以是ue(v)编解码的。
5.示例解决方案和实施例的列表
为了解决上述问题,公开了如下所总结的方法。以下项目应被认为是解释通用概念的示例,并且不应以狭义的方式解释。此外,这些项目可以被单独应用,也可以以任何方式组合应用。
可以在参数集(例如,SPS、VPS、PPS、APS、DCI)和/或通用约束信息语法中添加一个或多个语法元素,以指示图片内是否仅允许X(例如,I、B或P)条带;和/或指示图片中允许的条带类型集合。
在参数集和通用约束信息语法中
1.在诸如SPS或PPS等视频单元中,添加一个或多个语法元素(例如,sps_allowed_slice_idc),以规定CLVS的图片中允许的条带类型。
1)在一个示例中,添加了第一语法元素(例如,sps_allowed_slice_idc),并且其语义可以被定义为:等于X的sps_allowed_slice_idc规定图片仅
允许以下允许的条带类型或它们的任何组合:
i.{全部I},{全部P},{全部B},{I,P},{I,B},{P,B},{I,B,P}
ii.在一个示例中,第一语法元素可以用固定长度编解码(例如,u(1)、u(2)或u(3))、一元编解码、截断一元编解码、EG编解码。
iii.可替代地,此外,可以修改SPS或PPS中信令通知的一个或多个语法元素的信令通知和/或语义和/或推断,使得仅当第一语法元素满足某些条件时才信令通知它们。
a.在一个示例中,一个或多个语法元素是用于启用需要多于一个预测信号的编解码工具的语法元素,例如双预测或混合帧内编解码和帧间编解码,或具有来自多个预测块的线性/非线性加权的预测。
b.在一个示例中,一个或多个语法元素可以包括但不限于:
a)sps_weighted_bipred_flag
b)sps_bdof_enabled_flag
c)sps_smvd_enabled_flag
d)sps_dmvr_enabled_flag
e)sps_bcw_enabled_flag
f)sps_ciip_enabled_flag
g)sps_gpm_enabled_flag
c.在一个示例中,只有当第一语法元素规定与视频单元相关联的CLVS可以包含一个或多个B条带时,才可以信令通知一个或多个语法元素。否则,将跳过信令通知,并推断语法元素的值。
d.在一个示例中,当sps_b_slice_allowed_flag等于0时,语法元素sps_weighted_bipred_flag、sps_bdof_enabled_flag、sps_smvd_enabled_flag、sps_dmvr_enabled_flag、sps_bcw_enabled_flag、sps_ciip_enabled_flag和sps_gpm_enabled_flag不会被信令通知,而它们的值会被推断。
a)在一个示例中,当不存在时,它们被全部推断为0。
iv.可替代地,此外,可以在通用约束信息语法中信令通知第二语法元素,例如no_b_slice_constraint_flag,以指示第一语法元素是否应当等于0。
a.在一个示例中,no_b_slice_constraint_flag的语义被定义如下:等于1的
Figure BDA0003887573300000331
规定sps_allowed_slice_idc应当等于X(例如,表示允许的条带类型为{I,B,P}或{B,P}、{全部B})。
等于0的no_b_slice_constraint_flag不会施加这种约束。
v.可替代地,此外,要求如果第一语法元素规定CLVS不包含B条带(例如,只有sps_allowed_slice_idc等于X,其表示{I,P}、{全部I}、{全部P}),则通用约束信息语法中信令通知的一个或多个语法元素应当等于1。
a.在一个示例中,一个或多个语法元素可以包括但不限于:
a)
Figure BDA0003887573300000341
b)
Figure BDA0003887573300000342
c)
Figure BDA0003887573300000343
d)
Figure BDA0003887573300000344
e)
Figure BDA0003887573300000345
vi.可替代地,此外,可以修改dpb_parameters()中信令通知的一个或多个语法元素的信令通知和语义,使得仅当第一语法元素满足某些条件时才信令通知它们。
a.在一个示例中,一个或多个语法元素可以包括但不限于:
a)max_num_reorder_pics
b.在一个示例中,当第一语法元素告知没有B条带被允许时,max_num_reorder_pics不被信令通知并被推断为0。
在PH/SH中
2.在PH/SH中,变量X用于指示图片/条带中是否允许/使用B条带,并且该变量可以从SPS语法元素和/或新的PH语法元素(例如ph_allowed_slice_idc)推导,以规定允许的条带类型和/或其它语法元素(例如JVET-R0052中使用的
Figure BDA0003887573300000346
)。
1)在一个示例中,添加了新的PH语法元素,并且如何信令通知此语法元素可以取决于SPS中的允许的条带类型。
2)可替代地,此外,可以根据变量修改PH中信令通知的一个或多个语法元素的信令通知和/或语义和/或推断。
i.在一个示例中,一个或多个语法元素是用于启用需要一个以上预测信号的编解码工具的那些语法元素,例如双预测或混合帧内编解码和帧间编解码,或具有来自多个预测块的线性/非线性加权的预测。
ii.在一个示例中,一个或多个语法元素可以包括但不限于:
a)ph_collocated_from_l0_flag
b)mvd_l1_zero_flag
c)ph_disable_bdof_flag
d)ph_disable_dmvr_flag
e)num_l1_weights
iii.在一个示例中,仅当第一语法元素规定图片可以包含一个或多个B条带时,才可以信令通知一个或多个语法元素。否则,将跳过信令通知,并推断语法元素的值。
a)可替代地,此外,是否信令通知一个或多个语法元素可以取决于项目符号1.1)和2.1)中的第一语法元素,例如(X为真或1)。
b)仅当(sps_bdof_pic_present_flag
Figure BDA0003887573300000351
)为真时,才可以信令通知ph_disable_bdof_flag。
c)仅当(sps_dmvr_pic_present_flag
Figure BDA0003887573300000352
)为真时,才可以信令通知ph_disable_dmvr_flag。
iv.在一个示例中,当X等于0(或假)时,mvd_l1_zero_flag没有被信令通知,并且其值被推断为1。
v.在一个示例中,一个或多个语法元素的推断取决于第一语法元素的值。
a)在一个示例中,对于ph_disable_bdof_flag,以下内容适用:
如果sps_bdof_enabled_flag等于1,
Figure BDA0003887573300000353
则ph_disable_bdof_flag的值被推断为等于0。
否则(sps_bdof_enabled_flag等于
Figure BDA0003887573300000354
),ph_disable_bdof_flag的值被推断为等于1。
b)在一个示例中,对于ph_disable_dmvr_flag,以下内容适用:
如果sps_dmvr_enabled_flag等于
Figure BDA0003887573300000355
则ph_disable_dmvr_flag的值被推断为等于0。
否则(sps_dmvr_enabled_flag等于
Figure BDA0003887573300000356
),ph_disable_dmvr_flag的值被推断为等于1。
c)在一个示例中,当ph_temporal_mvp_enabled_flag和rpl_info_in_ph_flag都等于1且X等于0(或假)时,ph_collocated_from_l0_flags的值被推断为等于1。
d)在一个示例中,当X等于0(或假)时,num_l1_weights不被信令通知,并且其值被推断为0,并且因此,在图片的PH或SH中不信令通知参考图片列表1的加权预测参数。
语法元素的推断
3.对于与编解码工具X和/或语法元素组相关的语法元素,这些语法元素可能存在于A(例如PH)或B(例如SH)中,但不能同时存在于两者中,如果A被包括在B中,那么那些语法元素的存在的至少一个指示可以不被信令通知,并且可以被推断为0,即存在于B中。
1)在一个示例中,编码工具X可以包括以下内容之一:
i.环路滤波技术,例如去方块滤波器、ALF、SAO
ii.加权预测
iii.QP增量信息
iv.RPL信息
2)在一个示例中,条件“A被包括在B中”可以被定义为“参考PPS的条带标头包含PH语法结构”或“当前图片仅由一个条带组成”。
3)在一个示例中,“那些语法元素的存在的指示”可以被定义为以下语法元素中的一个或多个:
i.qp_delta_info_in_ph_flag、rpl_info_in_ph_flag、dbf_info_in_ph_flag、sao_info_in_ph_flag、wp_info_in_ph_flag、alf_info_in_ph_flag
4)在一个示例中,提议了以下一个或多个更改。
等于1的
Figure BDA0003887573300000363
规定参考图片列表信息存在于PH语法结构中,而不存在于参考不包含PH语法结构的PPS的条带标头中。等于0的rpl_info_in_ph_flag规定参考图片列表信息不存在于PH语法结构中,并且可以存在于参考不包含PH语法结构的PPS的条带标头中。
Figure BDA0003887573300000361
Figure BDA0003887573300000362
等于1的
Figure BDA0003887573300000364
规定去方块滤波器信息存在于PH语法结构中,而不存在于参考不包含PH语法结构的PPS的条带标头中。等于0的dbf_info_in_ph_flag规定去方块滤波器信息不存在于PH语法结构中,并且可以存在于参考不包含PH语法结构的PPS的条带标头中。当不存在时,dbf_info_in_ph_flag的值被推断为等于0。
Figure BDA0003887573300000371
Figure BDA0003887573300000372
等于1的
Figure BDA00038875733000003711
规定SAO滤波器信息存在于PH语法结构中,而不存在于参考不包含PH语法结构的PPS的条带标头中。等于0的sao_info_in_ph_flag规定SAO滤波器信息不存在于PH语法结构中,并且可以存在于参考不包含PH语法结构的PPS的条带标头中。
Figure BDA0003887573300000373
Figure BDA0003887573300000374
等于1的
Figure BDA00038875733000003712
规定ALF信息存在于PH语法结构中,而不存在于参考不包含PH语法结构的PPS的条带标头中。等于0的alf_info_in_ph_flag规定ALF信息不存在于PH语法结构中,并且可以存在于参考不包含PH语法结构的PPS的条带标头中。
Figure BDA0003887573300000375
Figure BDA0003887573300000376
等于1的
Figure BDA00038875733000003714
规定加权预测信息可以存在于PH语法结构中,而不存在于参考不包含PH语法结构的PPS的条带标头中。等于0的wp_info_in_ph_flag规定加权预测信息不存在于PH语法结构中,并且可以存在于参考不包含PH语法结构的PPS的条带标头中。当不存在时,wp_info_in_ph_flag的值被推断为等于0。
Figure BDA0003887573300000377
Figure BDA0003887573300000378
等于1的
Figure BDA00038875733000003713
规定QP增量信息存在于PH语法结构中,而不存在于参考不包含PH语法结构的PPS的条带标头中。等于0的qp_delta_info_in_ph_flag规定QP增量信息不存在于PH语法结构中,并且可以存在于参考不包含PH语法结构的PPS的条带标头中。
Figure BDA0003887573300000379
Figure BDA00038875733000003710
4.一致性比特流应遵循以下规则,即当其POC值大于前一图片的POC值时,对于拼接比特流中作为CLVS AU的拼接点图片,要求NoOutputOfPriorPicsFlag的设置等于1。
1)当当前AU是编解码视频序列开始(CVSS)AU,并且当前AU的PicOrderCntVal大于解码顺序中前一张图片的PicOrderCntVal时,无论其他条件如何(例如,无论当前AU中图片的no_output_of_prior_pics_flag的值如何),NoOutputOfPriorPicsFlag的值都被设置为等于1。
5.是否信令通知指示在图片和/或RPL/WP信息中允许帧间条带/B条带/P条带的语法元素,和/或存在RPL/WP信息的指示可以取决于图片类型和层独立性是否被启用。
1)是否信令通知指示在图片和/或RPL/WP信息中允许帧间条带/B条带/P条带的语法元素,和/或RPL/WP信息的存在的指示,可以取决于图片类型以及层是否是独立层和CLVS是否仅包含一个层中的一个。
2)在一个示例中,可以在图片标头(PH)或PPS中信令通知语法元素。
3)在一个示例中,是否信令通知语法元素可以取决于在更高级别的视频单元(例如SPS)中信令通知的一个或多个语法元素。
4)在一个示例中,针对IRAP图片不信令通知语法元素,并且启用了层独立性。
i.可替代地,对于独立层中的IRAP图片或条带,不信令通知语法元素。
ii.在一个示例中,对于IRAP图片不信令通知VVC中的ph_inter_slice_allowed_flag,并且启用了层独立性。
iii.在一个示例中,针对IRAP图片不信令通知VVC中的slice_type,并且启用了层独立性。
iv.在一个示例中,针对IRAP图片不信令通知JVET-R0052中的ph_slice_type,并且启用了层独立性。
v.在一个示例中,VVC中的ph_inter_slice_allowed_flag不会针对独立层(即,vps_independent_layer_flag[GeneralLayerIdx[nuh_layer_id]]等于1的层)中的IRAP图片(即,所有编解码条带NAL单元的nal_unit_type等于IDR_W_RADL、IDR_N_LP或CRA_NUT的图片)被信令通知,并且ph_inter_slice_allowed_flag被推断为等于0。
vi.在一个示例中,VVC中的slice_type不会针对独立层中的IRAP条带(即,nal_unit_type等于IDR_W_RADL、IDR_N_LP或CRA_NUT的编解码条带NAL单元)被信令通知,并且被推断为等于2。
vii.在一个示例中,JVET-R0052中的ph_slice_type不会针对独立层中的IRAP图片被信令通知,并且被推断为等于2。
5)在一个示例中,语法元素不会针对单层CLVS中的IRAP图片或条带被信令通知。
i.在一个示例中,当CLVS仅包含一个层时(即,当sps_video_parameter_set_id等于0时),VVC中的ph_inter_slice_allowed_flag不会针对IRAP图片(即,nal_unit_type都等于IDR_W_RADL、IDR_N_LP或CRA_NUT的所有编解码条带NAL单元的图片)被信令通知,并且被推断为等于0。
ii.在一个示例中,当CLVS仅包含一个层时,VVC中的slice_type不会针对IRAP条带(即,nal_unit_type等于IDR_W_RADL、IDR_N_LP或CRA_NUT的编解码条带NAL单元)被信令通知。
iii.在一个示例中,当CLVS仅包含一个层时,JVET-R0052中的ph_slice_type不会针对IRAP图片被信令通知。
6)在一个示例中,语法元素不会针对IRAP图片被信令通知,并且启用了层独立性,即使这样的信息的存在也表明它们在PH中。
i.在一个示例中,语法元素不会针对独立层中的IRAP图片被信令通知,即使这样的信息的存在表明它们在PH中。
ii.当gdr_or_irap_pic_flag等于1且gdr_pic_flag等于0时,提议名为idr_pic_flag的新标志来规定与图片标头相关联的图片是否为IDR图片。并且可以应用以下内容:
a.当sps_idr_rpl_present_flag等于0时,启用层独立性,且idr_pic_flag等于1,即使当rpl_info_in_ph_flag的值等于1时,PH中也不存在RPL信令通知。
b.当sps_idr_rpl_present_flag等于0时,启用层独立性,并且idr_pic_flag等于1,即使当wp_info_in_ph_flag的值等于1时,PH中也不存在WP信令通知。
c.当sps_idr_rpl_present_flag等于0时,当前层是独立层(即,vps_independent_layer_flag[GeneralLayerIdx[nuh_layer_id]]等于1),并且idr_pic_flag等于1,即使当rpl_info_in_ph_flag的值等于1时,PH中也不存在RPL信令通知。
d.当sps_idr_rpl_present_flag等于0时,当前层是独立层,并且idr_pic_flag等于1,即使当wp_info_in_ph_flag的值等于1时,PH中也不存在WP信令通知。
7)在一个示例中,即使当这样的信息的存在表明它们在PH中,语法元素不会针对单层CLVS中的IRAP图片被信令通知。
i.当gdr_or_irap_pic_flag等于1且gdr_pic_flag等于0时,提议名为idr_pic_flag的新标志来规定与图片标头相关联的图片是否为IDR图片。可以应用以下内容:
a.当sps_idr_rpl_present_flag等于0时,CLVS只包含一个层(即,sps_video_parameter_set_id等于0),并且idr_pic_flag等于1,即使当rpl_info_in_ph_flag的值等于1时,PH中也不存在RPL信令通知。
b.当sps_idr_rpl_present_flag等于0时,CLVS仅包含一个层,并且idr_pic_flag等于1,即使当wp_info_in_ph_flag的值等于1时,PH中也不存在WP信令通知。
6.提议当sps_video_parameter_set_id大于0且存在仅包含nuh_layer_id等于SPS的nuh_leyer_id的一个层的OLS时,或sps_video_parameter_set_id等于0时,sps_ptl_dpb_hrd_params_present_flag的值应等于1。
参考列表相关
7.参考图片列表的信令通知和/或生成可以取决于CLVS的图片中的允许的条带类型。
1)例如,如果CLVS中不允许B条带,则可以不信令通知用于构建参考列表1的一个或多个语法元素。
2)例如,如果CLVS中不允许B条带,则可以不执行用于构建参考列表1的一个或多个过程。
APS相关
8.要求两个APS在序列、CLVS或比特流中不应当具有相同的APS_id。
1)可替代地,要求具有相同APS类型的两个APS(例如ALF APS或LMCS APS)在序列、CLVS或比特流中不应当具有相同的APS_id。
2)可替代地,允许具有相同APS类型的两个APS(例如ALF APS或LMCS APS)具有相同的APS_id,但它们必须在序列、CLVS或比特流中具有相同的内容。
3)可替代地,允许具有相同APS类型的两个APS(例如ALF APS或LMCS APS)具有相同的APS_id。并且之前信令通知的APS被后面信令通知的APS替代。
4)可替代地,允许具有相同APS类型的两个APS(例如ALF APS或LMCS APS)具有相同的APS_id。后者信令通知的APS被忽略。
9.两个不同的参数集(例如APS和SPS)可以相互依赖,并且根据第一参数集中的语法元素推导的语法元素或变量可以用于有条件地信令通知第二参数集中的另一个语法元素。
1)可替代地,并且根据第一参数集中的语法元素推导的语法元素或变量可以用于推导第二参数集中的另一个语法元素的值。
非编解码的子图片相关
10.提议非编解码的子图片的边界必须被视为图片边界。
11.提议环路滤波(例如ALF/去方块/SAO)不能跨越非编解码的子图片的边界。
12.要求如果只有一个子图片,则它不能是非编解码的子图片。
13.要求非编解码的子图片不能被提取。
14.提议在SEI消息中可以信令通知与非编解码的子图片相关的信息。
15.要求非编解码的子图片只可以有一个条带。
16.要求左侧顶部的子图片不能是非编解码的子图片。
17.要求子图片中的至少一个不是非编解码的子图片。
18.是否和/或如何对边信息相关的子图片进行编解码可取决于子图片是否为非编解码的子图片。
1)在一个示例中,如果它是非编解码的子图片,则无需信令通知边信息。
19.可替代地,此外,对于上述要求,可以根据上述实例将它们修改为有条件地信令通知。
IDR图片和IDR子图片相关
20.提议以下约束:
当当前图片(nuh_layer_id等于特定值layerId)是IDR图片且sps_idr_rpl_present_flag等于1时,在输出顺序或解码顺序中,不应存在RefPicList[0]或RefPicList[1]中的条目所参考的图片先于任何前面的IRAP图片,其中在解码顺序上nuh_layer_id等于layerId(当存在时)。
21.提议以下约束:
当当前子图片(nuh_layer_id等于特定值layerId且subpicture索引等于特定值subpicIdx)是IDR子图片且sps_idr_rpl_present_flag等于1时,不应存在由RefPicList[0]或RefPicList[1]中的条目参考的图片,该图片在输出顺序或解码顺序中位于包含在解码顺序中在先的IRAP子图片的任何图片之前,该在先的IRAP子图片具有等于layerId的nuh_layer_id且等于subpicIdx的子图片索引(如果存在)。
IDR或GDR AU相关
22.IRAP AU不被要求完整,GDR AU不被要求完整,并且可以在AUD中、VPS规定的最低层中的图片的PH、或SEI消息中,对于每个IRAP或GDR AU信令通知AU是IRAP或GDR AU。
1)在一个示例中,指示的信令通知是可选的。
2)在一个示例中,提议对VVC进行以下更改(添加或修改的部分用斜体和粗体突出显示,删除的部分用双括号标记(例如,[[a]]表示删除字符“a”):
编解码视频序列开始(CVSS)AU:一种AU,其中[[CVS中的每个层都有PU并且]]每个PU中的编解码图片是CLVSS图片。
帧内随机访问点(IRAP)AU:一种AU,其中[[CVS中的每个层都有PU并且]]每个PU中的编解码图片是IRAP图片。
按照如下方式更改AUD语法和语义:
Figure BDA0003887573300000421
AU分隔符用于指示AU的开始,
Figure BDA0003887573300000422
以及包含AU分隔符NAL单元的AU中编解码图片中存在的条带的类型。没有与AU分隔符相关联的标准解码过程。
Figure BDA0003887573300000431
...
按照如下方式更改AU的顺序及其与CVS的关联性:
比特流由一个或多个CVS组成。
CVS由一个或多个AU组成。在条款7.4.2.4.3中描述了PU的顺序及其与AU的关联性。
CVS的第一个AU是CVSS AU,其中,每个现有PU都是CLVSSPU,它要么是NoOutputBeforeRecoveryFlag等于1的IRAP PU,要么是NoOutputBeforeRecoveryFlag等于1的GDR PU。
[[每个CVSS AU应为CVS中存在的每个层配备PU。]]
关于允许的条带类型
23.是否在图片内信令通知允许的X(例如,X是帧内/帧间/B/P)条带类型的指示可取决于图片内的条带的布局和/或当前图片是否是IRAP且是否启用或禁用层间依赖。
1)在一个示例中,是否信令通知图片内的允许的条带类型的指示(例如,
Figure BDA0003887573300000432
)可取决于PPS是否指示每个图片仅应用条带和/或不使用图片分割和/或矩形条带且每个图片仅使用一个条带和/或者将图片分割为矩形条带。
i.在一个示例中,是否信令通知指示可以取决于
Figure BDA0003887573300000433
Figure BDA0003887573300000434
的条件检查
ii.可替代地,此外,如果未信令通知指示,则指示的推断可进一步取决于PPS是否指示每个图片仅应用条带和/或未使用图片分割和/或矩形条带且每个图片仅使用一个条带。
a.在一个示例中,
Figure BDA0003887573300000435
等于0规定图片的所有编解码条带的slice_type都等于0或1。等于1的ph_intra_slice_allowed_flag规定图片中可以有或者可以没有slice_type等于2的一个或多个编解码条带。当不存在时,ph_intra_slice_allowed_flag的值被推断为等于
Figure BDA0003887573300000441
Figure BDA0003887573300000442
b.可替代地,当不存在时,ph_intra_slice_allowed_flag的值被推断为等于[[1]]
Figure BDA0003887573300000443
Figure BDA0003887573300000444
2)在一个示例中,是否信令通知图片内的允许的条带类型的指示(例如,
Figure BDA0003887573300000445
)可取决于在更高级别的视频单元(例如,SPS)中信令通知的一个或多个语法元素。
i.可替代地,此外,如果不存在允许条带类型的指示,则允许条带类型的指示的推断值取决于更高级别的视频单元中信令通知的那些语法元素。
3)在一个示例中,是否信令通知图片内的允许的条带类型的指示(例如,
Figure BDA0003887573300000446
)可取决于当前图片是否为IRAP图片,并且
图片内的所有条带都禁用帧间层依赖性。
i.可替代地,此外,如果当前图片是IRAP图片,并且对图片内的所有条带都禁用帧间层依赖,则ph_inter_slice_allowed_flag的推断值被设置为0/假。
24.是否信令通知图片内的允许的X(例如,X是帧间/B/P)条带类型的指示和/或指示的推断值可以取决于参考图片的数目(例如,num_ref_entries[0][RplsIdx[0]]和/或num_ref_entries[1][RplsIdx[1])。
1)在一个示例中,如果num_ref_entries[0][RplsIdx[0]]和/或num_ref_entries[1][RplsIdx[1]]都等于0,则不信令通知允许的X(例如,X是帧间/B/P)条带类型的指示,和/或进一步被推断为假。
2)在一个示例中,如果num_ref_entries[0][RplsIdx[0]]和/或num_ref_entries[1][RplsIdx[1]]都等于0,则添加一个约束,即允许的X(例如,X是帧间/B/P)条带类型的信令通知的指示应等于0。
3)在一个示例中,如果num_ref_entries[1][RplsIdx[1]]等于0,则不信令通知允许的X(例如,X为B)条带类型的指示,和/或进一步被推断为假。
4)在一个示例中,如果num_ref_entries[1][RplsIdx[1]]等于0,则添加一个约束,即允许的X(例如,X为B)条带类型的信令通知的指示应等于0。
5)在一个示例中,如果num_ref_entries[1][RplsIdx[1]]等于0,则添加一个约束,即
Figure BDA0003887573300000451
和/或
Figure BDA0003887573300000452
和/或
Figure BDA0003887573300000453
和/或
Figure BDA0003887573300000454
应等于1。
关于ALF APS
25.可以为ALF APS添加一个约束,即四个语法元素(VVC中的alf_luma_filter_signal_flag、alf_chroma_filter_signal_flag、alf_cc_cb_filter_signal_flag、alf_cc_cr_filter_signal_flag)中的至少一个应等于1。
1)可替代地,可以为ALF APS添加一个约束,即两个语法元素(alf_luma_filter_signal_flag、alf_chroma_filter_signal_flag)中的至少一个应等于1。
26.是否/如何信令通知滤波器当前标志和/或滤波器系数的指示可取决于自适应参数集(APS)RBSP语法中的具有alf_data()结构和/或语法元素的先前编解码信息。
1)可替代地,此外,如果不存在指示和/或滤波器系数,则推断值也可取决于具有alf_data()结构的先前编码解信息。
2)在一个示例中,是否信令通知alf_cc_cr_filter_signal_flag可取决于所有三个语法元素(VVC中的alf_luma_filter_signal_flag、alf_chroma_filter_signal_flag、alf_cc_cb_filter_signal_flag)是否都等于0。
i.可替代地,此外,如果三者都等于0,则alf_cc_cr_filter_signal_flag的信令通知被跳过,和/或进一步被推断为真。
3)在一个示例中,是否信令通知alf_chroma_filter_signal_flag可取决于VVC中的alf_luma_filter_signal_flag是否等于0。
i.可替代地,此外,如果alf_luma_filter_signal_flag等于0,则alf_chroma_filter_signal_flag的信令通知被跳过,和/或进一步被推断为真。
关于缩放列表/LMCS APS
27.提议允许在比图片小的图片/条带/片/子图片/砖块/其它视频单元内使用多个X(例如,X是显式缩放列表和/或LMCS和/或其它编解码工具,其边信息用APS信令通知)APS。
1)可替代地,此外,可以在比特流中(例如,在PH/SH中)信令通知要被使用的X APS的数目。
2)可替代地,此外,可以在比特流中(例如,在PH/SH中)信令通知要被使用的X APS的索引。
28.提议使用X(例如,X是显式缩放列表和/或LMCS和/或其它编解码工具,其边信息用APS信令通知)APS可取决于颜色分量。
1)在一个示例中,亮度和色度颜色分量可以选择不同的X APS。
2)在一个示例中,可以在比特流中(例如,在PH/SH中)单独信令通知要被用于亮度和色度分量的X APS的数目。
i.可替代地,此外,是否信令通知色度分量的数目可取决于是否对于亮度分量启用来自APS的预测/继承。
ii.可替代地,此外,是否信令通知色度分量的数目可取决于亮度分量的APS数目是不等于0还是大于0。
3)在一个示例中,可以在比特流中(例如,在PH/SH中)单独信令通知要被用于亮度和色度分量的X APS的索引。
29.如何信令通知要被使用的X(例如,X是ALF/CC-ALF/显式缩放列表和/或LMCS和/或其它编解码工具,其边信息用APS信令通知)APS可取决于子图片。
1)在一个示例中,对于每个子图片,它可以选择其开启/关闭控制和要被使用的对应X APS。
i.可替代地,此外,对于每个子图片,可以信令通知要被使用的开启/关闭控制和/或X APS。
关于子图片
30.提议如何推断
Figure BDA0003887573300000461
(在VVC中)的值可取决于是否存在子图片信息。
1)在一个示例中,按照如下方式修订
Figure BDA0003887573300000462
的语义:等于1的
Figure BDA0003887573300000463
规定CLVS中每个编解码图片的第i个子图片在不包括环路滤波操作的解码过程中被视为图片。等于0的subpic_treated_as_pic_flag[i]规定CLVS中每个编解码图片的第i个子图片在不包括环路滤波操作的解码过程中不被视为图片。当不存在时,subpic_treated_as_pic_flag[i]的值被推断为等于[[sps_independent_subpics_flag]]
Figure BDA0003887573300000471
关于去方块滤波器
31.提议针对以下情况,等于1的
Figure BDA0003887573300000472
规定对条带禁用去方块滤波器的操作,或等于0的
Figure BDA0003887573300000473
规定对参考PPS的条带禁用去方块滤波器的操作。
1)slice_deblocking_filter_disabled_flag和ph_deblocking_filter_disabled_flag不存在;
2)deblocking_filter_override_enabled_flag等于0;
3)deblocking_filter_override_enabled_flag等于1,dbf_info_in_ph_flag等于1,ph_deblocking_filter_disabled_flag等于1;
4)deblocking_filter_override_enabled_flag等于1,dbf_info_in_ph_flag等于0,slice_deblocking_filter_disabled_flag等于1。
32.提议针对以下情况,等于0的
Figure BDA0003887573300000474
规定对参考PPS的条带应用去方块滤波器的操作,或等于0的
Figure BDA0003887573300000475
规定对参考PPS的条带启用去方块滤波器的操作。
1)slice_deblocking_filter_disabled_flag和ph_deblocking_filter_disabled_flag不存在;
2)deblocking_filter_override_enabled_flag等于0;
3)deblocking_filter_override_enabled_flag等于1,dbf_info_in_ph_flag等于1,ph_deblocking_filter_disabled_flag等于0;
4)deblocking_filter_override_enabled_flag等于1,dbf_info_in_ph_flag等于0,slice_deblocking_filter_disabled_flag等于1。
关于JCCR
33.提议针对用于JCCR(联合色度残差编解码)的QP偏移量,可以在视频单元(大于条带)中而不是仅在条带级别(即,VVC中的slice_joint_cbcr_qp_offset)中信令通知。
1)在一个示例中,可以在序列/图片级别(例如在SPS/VPS/DCI/PPS/PH)
中被信令通知。
2)在一个示例中,它可以在多个级别(例如,在图片和条带级别)中被信令通知。
i.可替代地,此外,是否在第二级别中信令通知可取决于是否在第一级别中信令通知。
a.在一个示例中,它只能在多个级别中的一个级别中被信令通知。
b.在一个示例中,可以在比特流中信令通知哪一级别用于信令通知QP偏移量的指示。
ii.可替代地,此外,应用覆盖机制,即它在第一级(更高级别)被信令通知,并且覆盖标志可以被进一步信令通知以指示是否在第二级(更低级别,例如条带级别)信令通知以覆盖第一级中(例如,图片级别中)的信令通知值。
a.在一个示例中,可以在第一级和/或第二级中信令通知覆盖标志。
关于LMCS和缩放列表信令控制
34.提议可以对JVET-R0063中的ph_lmcs_mode_idc进行ue(v)编解码,并且可以将ph_lmcs_mode_idc的值规定为在0到2(含)的范围内。ph_lmcs_mode_idc等于0、1或2的情况的语义与JVET-R0063中的相同。
1)可替代地,JVET-R0063中的ph_lmcs_mode_idc可以是ue(v)编解码的,并且如果已知图片只包含一个条带,则ph_lmcs_mode_idc的值可以被规定为在0至1(含)的范围内,否则,被规定为在0至2(含)的范围内。ph_lmcs_mode_idc等于0、1或2的情况的语义与JVET-R0063中的相同。
2)可替代地,如果已知图片仅包含一个条带,则可以使用u(1)对JVET-R0063中的ph_lmcs_mode_idc进行编解码,即只使用一个比特作为标志,使得值等于0或1;否则,JVET-R0063中的ph_lmcs_mode_idc可以是ue(v)编解码的,并且ph_lmcs_mode_idc的值可以被规定在0到2(含)的范围内。ph_lmcs_mode_idc等于0、1或2的情况的语义与JVET-R0063中的相同。
35.提议可以对JVET-R0064中的ph_explicit_scaling_list_mode_idc进行ue(v)编解码,并且可以将ph_explicit_scaling_list_mode_idc的值规定在0到2(含)的范围内。ph_explicit_scaling_list_mode_idc等于0、1或2的情况的语义与JVET-R0064中的相同。
1)可替代地,JVET-R0064中的ph_explicit_scaling_list_mode_idc可以是ue(v)编解码的,并且如果已知图片仅包含一个条带,则可以将ph_explicit_scaling_list_mode_idc的值规定在0到1(含)的范围内,否则规定为0至2(含)的范围内。ph_explicit_scaling_list_mode_idc等于0、1或2的情况的语义与JVET-R0064中的相同。
2)可替代地,如果已知图片仅包含一个条带,则可以使用u(1)对JVET-R0064中的ph_explicit_scaling_list_mode_idc进行编解码,即只使用一个比特作为标志,使得值等于0或1;否则,JVET-R0064中的ph_explicit_scaling_list_mode_idc可以是ue(v)编解码的,并且ph_explicit_scaling_list_mode_idc的值可以被规定在0到2(含)的范围内。ph_explicit_scaling_list_mode_idc等于0、1或2的情况的语义与JVET-R0064中的相同。
6.实施例
6.1.实施例#1
7.3.2.3序列参数集RBSP语法
Figure BDA0003887573300000491
Figure BDA0003887573300000501
Figure BDA0003887573300000502
等于1的
Figure BDA0003887573300000503
规定可以对参考SPS的B条带应用显式加权预测。等于0的sps_weighted_bipred_flag规定显式加权预测不被应用于参考SPS的B条带。
Figure BDA0003887573300000504
Figure BDA0003887573300000505
等于0的
Figure BDA0003887573300000506
规定禁用双向光学流帧间预测。等于1的sps_bdof_enabled_flag规定启用双向光学流帧间预测。
Figure BDA0003887573300000507
Figure BDA0003887573300000511
等于1的
Figure BDA0003887573300000512
规定可以在运动矢量解码中使用对称运动矢量差。等于0的sps_smvd_enabled_flag规定在运动矢量编解码中不使用对称运动矢量差。
Figure BDA0003887573300000513
Figure BDA0003887573300000514
等于1的
Figure BDA0003887573300000515
规定启用基于解码器运动矢量细化的帧间双预测。等于0的sps_dmvr_enabled_flag规定禁用基于解码器运动矢量细化的帧间双预测。
Figure BDA0003887573300000516
Figure BDA0003887573300000517
Figure BDA0003887573300000518
规定具有CU权重的双预测是否可以用于帧间预测。如果sps_bcw_enabled_flag等于0,则语法应受到约束,使得CLVS中不使用具有CU权重的双预测,并且CLVS的编解码单元语法中不存在bcw_idx。否则(sps_bcw_enabled_flag等于1),CLVS中可以使用具有CU权重的双预测。
Figure BDA0003887573300000519
Figure BDA00038875733000005110
...
7.3.2.7图片标头结构语法
Figure BDA00038875733000005111
Figure BDA0003887573300000521
...
等于0的
Figure BDA0003887573300000522
规定图片的所有编解码条带的slice_type都等于0或1。等于1的ph_intra_slice_allowed_flag规定图片中可以有或可以没有slice_type等于2的一个或多个编解码条带。当不存在时,ph_intra_slice_allowed_flag的值被推断为等于
Figure BDA0003887573300000523
Figure BDA0003887573300000524
可替代地,当不存在时,ph_intra_slice_allowed_flag的值被推断为等于
Figure BDA0003887573300000525
Figure BDA0003887573300000526
Figure BDA0003887573300000527
Figure BDA0003887573300000531
...
等于1的
Figure BDA0003887573300000532
规定用于时域运动矢量预测的共置图片是从参考图片列表0推导的。等于0的ph_collocated_from_l0规定用于时域运动矢量预测的共置图片是由参考图片列表1推导的。
Figure BDA0003887573300000533
Figure BDA0003887573300000534
Figure BDA0003887573300000535
规定用于时域运动矢量预测的共置图片的参考索引。
当ph_collocated_from_l0_flag等于1时,ph_collocated_ref_idx指代参考图片列表0中的条目,并且ph_collocated_ref_idx的值应在0到num_ref_entries[0][RplsIdx[0]]-1(含)的范围内。
当ph_collocated_from_l0_flag等于0时,ph_collocated_ref_idx指代参考图片列表1中的条目,并且ph_collocated_ref_idx的值应在0到num_ref_entries[1][RplsIdx[1]]-1(含)的范围内。
当不存在时,ph_collocated_ref_idx的值被推断为等于0。
...
等于1的
Figure BDA0003887573300000536
指示未解析mvd_coding(x0,y0,1)语法结构,并且对于compIdx=0..1和cpIdx=0..2,MvdL1[x0][y0][compIdx]和MvdCpL1[x0][y0][cpIdx][compIdx]被设置为等于0。等于0的mvd_l1_zero_flag指示解析了mvd_coding(x0,y0,1)语法结构。
Figure BDA0003887573300000537
...
下面提供了一些实施例优选的示例列表。
第一条款集示出了前一节中讨论的技术的示例实施例。以下条款示出了前一节中讨论的技术的示例实施例(例如,项目1)。
1.一种视频处理方法(例如,图3中示出的方法3000),包括根据格式规则执行(3002)包括一个或多个层的视频与视频的编解码表示之间的转换,该一个或多个层包括一个或多个视频区域,其中,格式规则规定在对应于针对对应视频区域的允许条带类型的一个或多个视频区域级别的编解码表示中包括一个或更多个语法元素。
2.根据条款1所述的方法,其中,格式规则规定一个或多个语法元素包括第一语法元素,其值指示对应视频区域中允许的条带类型组合。
以下条款示出了前一节中讨论的技术的示例实施例(例如,项目2)。
3.根据条款1-2中的任一项所述的方法,其中,格式规则规定在图片标头或条带标头中包括语法元素,以指示对于对应图片或条带是否允许或使用双向预测(B)条带。
4.根据条款3所述的方法,其中,序列参数集中的语法元素控制图片标头或条带标头中包括的语法元素的存在。
以下条款示出了前一节中讨论的技术的示例实施例(例如,项目3)。
5.一种视频处理方法,包括:根据格式规则执行包括一个或多个层的视频与视频的编解码表示之间的转换,该一个或多个层包括一个或者多个视频图片,该一个或多个视频图片包括一个或多个视频条带,其中,格式规则规定根据第二规则,在图片标头或条带标头之间最多包括一次与在条带级别启用或使用编解码模式相关的语法元素。
6.根据条款5所述的方法,其中,编解码模式包括环路滤波器、加权预测模式或量化参数增量模式。
以下条款示出了前一节中讨论的技术的示例实施例(例如,项目7)。
7.一种视频处理方法,包括:根据格式规则执行包括一个或多个视频图片的视频与视频的编解码表示之间的转换,该一个或多个视频图片包括一个或多个视频条带,其中,格式规则规定视频图片中的允许条带类型控制是在编解码表示中信令通知参考图片列表还是从编解码表示生成参考图片列表。
8.根据条款7所述的方法,其中,格式规则规定,由于排除双向条带(B-条带)的允许条带类型,与参考图片列表1对应的语法元素从编解码表示中省略。
9.根据条款7所述的方法,其中,格式规则规定,由于排除双向条带(B-条带)的允许条带类型,对视频图片禁用生成参考图片列表1的过程。
以下条款示出了前一节中讨论的技术的示例实施例(例如,项目10-15)。
10.一种视频处理方法,包括:执行包括一个或多个视频图片的视频与视频的编解码表示之间的转换,该一个或多个视频图片包括一个或多个子图片,其中,编解码表示符合格式规则,其中,格式规则规定视频图片的非编解码子图片的处理。
11.根据条款10所述的方法,其中,格式规则规定在转换期间将非编解码子图片的边界作为图片边界处理。
12.根据条款10所述的方法,其中,格式规则规定禁用跨非编解码图片的边界的环路滤波。
13.根据条款10所述的方法,其中,格式规则不允许非编解码子图片仅为视频图片的子图片。
14.根据条款10-13中的任一项所述的方法,其中,格式规则规定用于非编解码子图片的解码辅助的信息被包括在编解码表示的补充增强信息语法元素中。
15.根据条款10所述的方法,其中,格式规则规定允许非编解码子图片最多有一个条带。
以下条款示出了前一节中讨论的技术的示例实施例(例如,项目20-22)。
16.一种视频处理方法,包括:执行包括一个或多个视频图片的视频与视频的编解码表示之间的转换,该一个或多个视频图片包括一个或多个子图片;其中,一个或多个视频图片和/或一个或多个子图片根据顺序规则被插入到编解码表示中,其中,顺序规则规定当前瞬时解码器刷新图片(IDR)或当前IDR子图片在编解码表示中的位置之间的关系。
17.根据条款16所述的方法,其中,顺序规则规定,编解码表示不包括当前IDR图片的参考图片列表中的条目所参考的任何图片,该图片在顺序中位于在先的帧内随机访问点图片之前。
18.根据条款16-17所述的方法,其中,顺序规则规定,编解码表示不包括当前IDR图片的参考图片列表中的条目所参考的任何图片,该图片在顺序中位于在先的帧内随机访问点图片之前并且具有子图片,该子图片具有与当前IDR子图片相同的层id和子图片索引。
以下条款示出了前一节中讨论的技术的示例实施例(例如,项目23-24)。
19.一种视频处理方法,包括:执行包括一个或多个视频图片的视频与视频的编解码表示之间的转换,该一个或多个视频图片包括一个或多个子图片和/或一个或多个条带,其中,编解码表示符合格式规则,其中,格式规则规定基于图片的图片条件在编解码表示中选择性地包括图片中是否允许条带类型的指示。
20.根据条款19所述的方法,其中,图片条件包括图片中的条带布局。
21.根据条款19-20所述的方法,其中,图片条件包括图片是否是帧内随机访问点图片以及对于转换是否允许帧间层依赖性。
22.根据条款19-21中的任一项所述的方法,其中,图片条件包括用于对图片进行编解码的参考图片的数目。
23.根据条款19-22中的任一项所述的方法,其中,条带类型包括帧内编解码条带、帧间编解码条带、B条带或P条带。
以下条款示出了前一节中讨论的技术的示例实施例(例如,项目25)。
24.一种视频处理方法,包括:执行包括一个或多个视频图片的视频与视频的编解码表示之间的转换,该一个或多个视频图片包括一个或多个子图片和/或一个或多个条带,其中,编解码表示符合格式规则,其中,格式规则规定,在编解码表示中的自适应参数集中信令通知自适应环路滤波器的情况下,至少四个语法元素中的一个被设置为1。
25.根据条款24所述的方法,其中,至少四个语法元素包括亮度滤波器信号标志、色度滤波器信号标志、cc和cb滤波器信号标志以及cc和cr信号标志。
以下条款示出了前一节中讨论的技术的示例实施例(例如,项目33)。
26.一种视频处理方法,包括:执行包括一个或多个视频单元的视频与视频的编解码表示之间的转换,该一个或多个视频单元包括一个或多个条带,其中,编解码表示符合格式规则,其中,格式规则规定针对用于编解码表示中视频单元级别的一个或多个条带的联合色度残差编解码规定量化参数偏移值。
27.根据条款26所述的方法,其中,视频单元对应于视频图片、视频序列、序列参数集、视频参数集、图片标头、图片参数集或解码能力信息语法结构。
28.根据上述条款所述的方法,其中,视频区域包括视频图片或视频条带。
29.根据条款1至28中的任一项所述的方法,其中,转换包括将视频编码为编解码表示。
30.根据条款1至28中的任一项所述的方法,其中,转换包括对编解码表示进行解码以生成视频的像素值。
31.一种视频解码装置,包括处理器,该处理器被配置为实施条款1至30中的一项或多项所述的方法。
32.一种视频编码装置,包括处理器,该处理器被配置为实施条款1至30中的一项或多项所述的方法。
33.一种计算机程序产品,其上存储有计算机代码,该代码当由处理器执行时,使得处理器实施条款1至30中的任一项所述的方法。
34.本文档中描述的方法、装置或系统。
第二条款集示出了前一节中讨论的技术的示例实施例(例如,项目20-35)。
1、一种视频处理方法(例如,图7A中所示的方法700),包括:
执行702包括一个或多个图片的视频与视频的比特流之间的转换,一个或多个图片包括一个或多个子图片,并且其中,根据顺序规则将一个或多个图片和/或一个或多个子图片包括在所述比特流中,并且其中,顺序规则规定当前瞬时解码器刷新(IDR)图片或当前IDR子图片在比特流中的位置相对于当前IDR图片或当前IDR子图片的当前条带的参考图片列表的条目所参考的另一图片之间的关系。
2、根据条款1所述的方法,其中,顺序规则规定,响应于条件被满足,比特流不包括当前条带的参考图片列表中的条目所参考的任何图片,图片在输出顺序或解码顺序中位于帧内随机访问点(IRAP)图片之前,IRAP图片在解码顺序中位于当前IDR图片之前。
3、根据条款2所述的方法,其中,条件包括存在标志指示参考图片列表(RPL)语法元素被允许存在于网络抽象层(NAL)单元类型等于IDR_N_LP或IDR_W_RADL的条带的条带标头中。
4、根据条款2所述的方法,其中,条件包括存在标志指示参考图片列表(RPL)语法元素不存在于网络抽象层(NAL)单元类型等于IDR_N_LP或IDR_W_RADL的条带的条带标头中。
5、根据条款2至4中任一项所述的方法,其中,当前IDR图片和IRAP图片具有等于特定值的网络抽象层(NAL)单元标头层标识符。
6、根据条款1所述的方法,其中,顺序规则规定比特流不包括干净随机访问图片的第二条带的第二参考图片列表中的第二条目所参考的任何图片,图片在输出顺序或解码顺序中位于第二帧内随机访问点IRAP图片之前,第二IRAP图片在解码顺序中位于干净随机访问图片之前。
7、根据条款1所述的方法,其中,顺序规则规定,响应于条件被满足,比特流不包括当前条带的参考图片列表中的条目所参考的任何图片,图片在输出顺序或解码顺序中位于包含帧内随机访问点IRAP子图片并且在解码顺序中位于包含当前IDR子图片的图片之前的任何图片之前。
8、根据条款7所述的方法,其中,条件包括存在标志指示参考图片列表RPL语法元素被允许存在于网络抽象层NAL单元类型等于IDR_N_LP或IDR_W_RADL的条带的条带标头中。
9、根据条款7所述的方法,其中,条件包括存在标志指示参考图片列表RPL语法元素不存在于网络抽象层NAL单元类型等于IDR_N_LP或IDR_W_RADL的条带的条带标头中。
10、根据条款7至9中任一项所述的方法,其中,IRAP子图片和当前IDR子图片具有等于特定标识值的网络抽象层NAL单元标头层标识符和等于特定索引值的子图片索引。
11、根据条款1所述的方法,其中,顺序规则规定比特流不包括干净随机访问图片子图片的第三条带的所述参考图片列表中的第三条目所参考的任何图片,图片在输出顺序或解码顺序中位于包含第三帧内随机访问点IRAP子图片并且在解码顺序中位于包含干净随机访问图片子图片的图片之前的任何图片之前。
12、一种视频处理方法(例如,图7B中所示的方法710),包括:
根据格式规则执行712包括一个或多个图片的视频与视频的比特流之间的转换,图片包括一个或多个子图片和/或一个或多个条带,并且
其中,格式规则允许包括访问单元的指示,指示指示所述访问单元是对于视频中的每个访问单元的帧内随机访问点IRAP访问单元还是逐渐解码刷新GDR访问单元。
13、根据条款12所述的方法,其中,IRAP访问单元不需要是完整的并且包括至少一个IRAP图片。
14、根据条款12所述的方法,其中,GDR访问单元不需要是完整的并且包括至少一个GDR图片。
15、根据条款12所述的方法,其中,格式规则规定在访问单元分隔符中包括由视频参数集规定的最低层中的图片的图片标头中的指示。
16、一种视频处理方法(例如,图7C中所示的方法720),包括:
根据格式规则执行722包括一个或多个图片的视频与视频的比特流之间的转换,图片包括一个或多个子图片和/或一个或多个条带,并且
其中,格式规则规定图片中是否允许条带类型的指示基于图片的图片条件选择性地包括在比特流中。
17、根据条款16所述的方法,其中,条带类型包括帧内编解码条带、帧间编解码条带、B条带或P条带。
18、根据条款16或17所述的方法,其中,图片条件包括图片中的条带的布局。
19、根据条款16至18中任一项所述的方法,其中,图片条件包括图片是否是帧内随机访问点IRAP图片以及帧间层依赖性是否允许用于转换。
20、根据条款16至19中任一项所述的方法,其中,图片条件包括:i)图片参数集是否指示每个图片仅应用条带,和/或ii)不使用图片分区,和/或iii)使用矩形条带并且每个图片仅使用一个条带,和/或iv)图片被分割为矩形条带。
21、根据条款16至19中任一项所述的方法,其中,图片条件包括在更高级别视频单元中信令通知一个或多个语法元素。
22、根据条款16或17所述的方法,其中,图片条件包括用于对图片进行编解码的参考图片的数量。
23、根据条款22所述的方法,其中,参考图片的数量基于指示第一参考图片列表语法结构中的条目数量的第一字段和/或指示第二参考图片列表语法结构中的条目数量的第二字段。
24、一种视频处理方法(例如,图7D中所示的方法730),包括:
执行732包括一个或多个图片的视频与视频的比特流之间的转换,图片包括一个或多个子图片和/或一个或多个条带,并且
其中,格式规则规定至少两个或四个语法元素之一被设置为自适应环路滤波器ALF自适应参数集的特定值。
25、根据条款24所述的方法,其中,至少四个语法元素包括规定是否信令通知亮度滤波器集合的亮度滤波器信号标志、规定是否信令通知色度滤波器的色度滤波器信号标志、规定是否信令通知Cb颜色分量的交叉分量滤波器的cc和cb滤波器信号标志,以及规定是否信令通知Cr颜色分量的交叉分量滤波器的cc和cr滤波器信号标志。
26、一种视频处理方法(例如,图7E中所示的方法740),包括:
根据格式规则执行742包括一个或多个图片的视频与视频的比特流之间的转换,并且
其中,格式规则规定是否和/或如何信令通知滤波器存在标志和/或滤波器系数的指示取决于先前编解码的信息,先前编解码的信息具有自适应参数集原始字节序列有效载荷RBSP语法中的语法元素和/或自适应环路滤波数据结构。
27、根据条款26所述的方法,其中,格式规则还规定,在指示不存在的情况下,基于具有自适应环路滤波数据结构的先前编解码的信息来推导指示的值。
28、根据条款26所述的方法,其中,格式规则还规定是否信令通知cc和cr滤波器信号标志,cc和cr滤波器信号标志规定是否信令通知Cr颜色分量的交叉分量滤波器取决于所有三个语法元素是否等于一定值,三个语法元素包括规定是否信令通知亮度滤波器集合的亮度滤波器信号标志、规定是否信令通知色度滤波器的色度滤波器信号标志、以及规定是否信令通知Cb颜色分量的交叉分量滤波器的cc和cb滤波器信号标志。
29、根据条款26所述的方法,其中,格式规则还规定是否信令通知规定是否信令通知色度滤波器的色度滤波器信号标志取决于规定是否信令通知亮度滤波器集合的亮度滤波器信号标志的值。
30、一种视频处理方法(例如,图7F中所示的方法750),包括:
根据格式规则执行752包括一个或多个图片的视频与视频的比特流之间的转换,并且
其中,格式规则允许对于小于图片的视频区域,参考对应于其边信息被包括在APS中的编解码工具的多个自适应参数集APS。
31、根据条款30所述的方法,其中,多个APS包括缩放APS、具有色度缩放的亮度映射LMCS APS、和/或对应于其他编解码工具的APS。
32、根据条款30所述的方法,其中,格式规则规定比特流包括要参考的多个APS的数量。
33、根据条款30所述的方法,其中,格式规则规定比特流包括要参考的多个APS的索引。
34、根据条款30所述的方法,其中,格式规则还规定要用于转换的多个APS取决于视频的颜色分量。
35、根据条款34所述的方法,其中,格式规则还规定对于视频的亮度分量和色度分量使用不同的APS。
36、根据条款34所述的方法,其中,格式规则还规定在比特流中分别信令通知要用于亮度分量和色度分量的多个APS的数量和/或索引。
37、根据条款30所述的方法,其中,格式规则还规定如何信令通知要使用的多个APS取决于图片的子图片。
38、根据条款30所述的方法,其中,格式规则还规定对于每个子图片选择或信令通知要使用的开启/关闭控制和/或多个APS。
39、一种视频处理方法(例如,图7G中所示的方法760),包括:
根据格式规则执行762包括一个或多个图片的视频与视频的比特流之间的转换,图片包括一个或多个子图片,并且
其中,格式规则规定如何推导指示编解码图片的子图片是否在解码过程中被视为不包括环路滤波操作的图片的第一变量的值取决于指示子图片信息存在于比特流中的第二变量。
40、根据条款39所述的方法,其中,格式规则规定,在第一变量不存在的情况下,第一变量的所述值被推导为等于第二变量的值。
41、一种视频处理方法(例如,图7H中所示的方法770),包括:
根据格式规则执行772包括一个或多个图片的视频与视频的比特流之间的转换,图片包括一个或多个子图片,并且
其中,格式规则规定,响应于一个或多个条件被满足,指示去方块滤波器对参考图片参数集的图片的适用性的变量具有第一值或第二值,第一值用于指示去方块滤波器应用于参考图片参数集的条带,第二值用于指示去方块滤波器被禁用于参考图片参数集的条带。
42、根据条款41所述的方法,其中,第一值为1并且第二值为0。
43、根据条款42所述的方法,其中,一个或多个条件包括:1)不存在指示去方块滤波器的禁用的条带级别和图片标头级别中的去方块滤波器禁用标志,2)去方块滤波器覆盖启用标志指示不覆盖参考图片参数集的图片的去方块行为,3)去方块滤波器覆盖启用标志指示参考图片参数集的图片的去方块行为允许被覆盖,去方块滤波器存在标志指示去方块滤波器信息存在于图片标头语法结构中,并且图片标头级别中的去方块滤波器禁用标志指示对于图片禁用去方块滤波器,或者4)去方块滤波器覆盖启用标志指示对于参考图片参数集的图片的去方块行为允许被覆盖,去方块滤波器存在标志指示去方块滤波器信息存在于图片标头语法结构中,并且条带级别中的去方块滤波器禁用标志指示对于图片禁用所述去方块滤波器。
44、根据条款41所述的方法,其中,第一值为0并且第二值为0。
45、根据条款44所述的方法,其中,一个或多个条件包括:1)不存在指示去方块滤波器的禁用的条带级别和图片标头级别中的去方块滤波器禁用标志,2)去方块滤波器覆盖启用标志指示不覆盖参考图片参数集的图片的去方块行为,3)去方块滤波器覆盖启用标志指示参考图片参数集的图片的去方块行为允许被覆盖,去方块滤波器存在标志指示去方块滤波器信息存在于图片标头语法结构中,并且图片标头级别中的去方块滤波器禁用标志指示对于当前图片启用去方块滤波器,或者4)去方块滤波器覆盖启用标志指示对于参考图片参数集的图片的去方块行为允许被覆盖,去方块滤波器存在标志指示去方块滤波器信息不存在于图片标头语法结构中,并且条带级别中的去方块滤波器禁用标志指示对于图片启用去方块滤波器。
46、一种视频处理方法(例如,图7I中所示的方法780),包括:
根据格式规则执行782包括一个或多个视频单元的视频与视频的比特流之间的转换,视频单元包括一个或多个条带,并且
其中,格式规则规定用于联合色度残差编解码的量化参数偏移值包括在大于条带级别的一个或多个视频单元级别中。
47、根据条款46所述的方法,其中,一个或多个视频单元对应于视频图片、视频序列、序列参数集、视频参数集、图片标头、图片参数集或解码能力信息语法结构。
48、根据条款46所述的方法,其中,一个或多个视频单元级包括第一级别和第二级别,并且其中,格式规则还规定是否在第二级别中信令通知量化参数偏移值取决于是否在第一级别中信令通知量化参数偏移值。
49、根据条款46所述的方法,其中,一个或多个视频单元级别包括第一级别和低于第一级别的第二级别,并且其中,格式规则还规定在第一级别中信令通知量化参数偏移值,并且信令通知覆盖标志以指示是否在第二级别中信令通知量化参数偏移值以在第一级别中覆盖信令通知的值。
50、一种视频处理方法(例如,图7J中所示的方法790),包括:
根据格式规则执行792包括一个或多个图片的视频与视频的比特流之间的转换,并且
其中,格式规则规定:(i)用于对指示图片标头级别中的具有色度缩放的亮度映射LMCS模式标识的变量进行编解码的一个或多个比特的固定或可变长度,以及(ii)变量的值的范围。
51、根据条款50所述的方法,其中,格式规则规定使用ue(v)对变量进行编解码,并且变量的值的范围在0到2之间,包括0和2。
52、根据条款50所述的方法,其中,格式规则规定使用ue(v)对变量进行编解码,并且在图片仅包含一个条带的情况下,变量的值的范围在0到1之间,包括0和1,否则范围在0到2之间,包括0和2。
53、根据条款50所述的方法,其中,格式规则规定在图片仅包含一个条带的情况下,使用u(1)对变量进行编解码,使得变量的所述值为0或1,否则使用ue(v)对变量进行编解码,使得变量的值的范围在0到2之间,包括0和2。
54、一种视频处理方法(例如,图7K中所示的方法800),包括:
根据格式规则执行包括一个或多个图片的视频与视频的比特流之间的转换,并且
其中,格式规则规定:(i)用于对指示图片标头级别中的缩放列表模式标识的变量进行编解码的一个或多个比特的固定或可变长度,以及(ii)变量的值的范围。
55、根据条款54所述的方法,其中,格式规则规定使用ue(v)对变量进行编解码,并且变量的值的范围在0到2之间,包括0和2。
56、根据条款54所述的方法,其中,格式规则规定使用ue(v)对变量进行编解码,并且在图片仅包含一个条带的情况下,变量的值的范围在0到1之间,包括0和1,否则范围在0到2之间,包括0和2。
57、根据条款54所述的方法,其中,格式规则规定在图片仅包含一个条带的情况下,使用u(1)对变量进行编解码,使得变量的值为0或1,否则使用ue(v)对变量进行编解码,使得变量的值的范围在0到2之间,包括0和2。
58、根据条款1至57中任一项所述的方法,其中,转换包括将视频编码成比特流。
59、根据条款1至57中任一项所述的方法,其中,转换包括从比特流解码视频。
60、根据条款1至57中任一项所述的方法,其中,转换包括从视频生成比特流,并且方法还包括:将比特流存储在非暂时性计算机可读记录介质中。
61、一种视频处理装置,包括被配置为实施如条款1至60中任一项或多项所述的方法的处理器。
62、一种存储视频的比特流的方法,包括条款1至60中任一项所述的方法,并且还包括将所述比特流存储到非暂时性计算机可读记录介质。
63、一种存储程序代码的计算机可读介质,所述程序代码在被执行时使得处理器实施如条款1至60中任一项或多项所述的方法。
64、一种计算机可读介质,其存储根据上述方法中的任一项生成的比特流。
65、一种存储比特流表示的视频处理装置,其中,所述视频处理装置被配置为实施如条款1至60中任一项或多项所述的方法
在本文档中,术语“视频处理”可以指代视频编码、视频解码、视频压缩或视频解压缩。例如,可以在从视频的像素表示转换为对应的比特流表示期间应用视频压缩算法,反之亦然。例如,当前视频块的比特流表示可以对应于在比特流内共置或分布在不同位置的比特,如语法所定义的。例如,宏块可以根据变换的和编解码的错误残差值进行编码,也可以使用标头中的比特和比特流中的其它字段进行编码。此外,在转换过程中,解码器可以解析比特流,并如上述解决方案中所述的基于确定知道一些字段可能存在或不存在。类似地,编码器可以确定是否包括某些语法字段,并通过包括语法字段或从编解码表示中排除语法字段来相应地生成编解码表示。
本文档中描述的公开和其它解决方案、示例、实施例、模块和功能操作可以在数字电子电路中实施,也可以在计算机软件、固件或硬件中实施,包括本文档中公开的结构及其结构等同物,或者以其中一个或多个的组合形式实施。所公开的和其它实施例可以被实施为一个或多个计算机程序产品,即编码在计算机可读介质上的计算机程序指令的一个或多个模块,用于由数据处理装置执行或控制数据处理装置的操作。计算机可读介质可以是机器可读存储设备、机器可读存储基板、存储器设备、影响机器可读传播信号的物质的组合物,或者它们中的一个或多个的组合。术语“数据处理装置”包含用于处理数据的所有装置、设备和机器,例如包括可编程处理器、计算机或多处理器或计算机。除硬件外,该装置还可以包括为所述计算机程序创建执行环境的代码,例如,构成处理器固件、协议栈、数据库管理系统、操作系统或其中一个或多个的组合的代码。传播信号是人为生成的信号,例如机器生成的电气、光学或电磁信号,其被生成以用于对信息进行编码,以便传输到合适的接收器装置。
计算机程序(也被称为程序、软件、软件应用、脚本或代码)可以用任何形式的编程语言编写,包括编译或解释语言,并且其可以以任何形式部署,包括作为独立程序或作为模块、组件、子例程或适合在计算环境中使用的其它单元。计算机程序不一定与文件系统中的文件相对应。程序可以被存储在保存其它程序或数据的文件部分(例如,标记语言文档中存储的一个或多个脚本)、专用于相关程序的单个文件或多个协调文件(例如,存储一个或多个模块、子程序或代码部分的文件)中。计算机程序可以被部署以在一台计算机上或位于一个站点或分布在多个站点并通过通信网络互连的多台计算机上运行。
本文档中描述的过程和逻辑流可以由一个或多个可编程处理器执行,该一个或多个可编程处理器通过对输入数据进行操作并生成输出来运行一个或多个计算机程序以执行功能。过程和逻辑流还可以由专用逻辑电路执行,并且装置也可以被实施为专用逻辑电路,例如FPGA(现场可编程门阵列)或ASIC(专用集合成电路)。
例如,适用于执行计算机程序的处理器包括通用微处理器和专用微处理器,以及任何类型的数字计算机的任何一个或多个处理器。通常,处理器将从只读存储器或随机存取存储器或两者中接收指令和数据。计算机的基本元件是用于执行指令的处理器以及用于存储指令和数据的一个或多个存储器设备。通常,计算机还将包括或被可操作地耦合以从一个或多个用于存储数据的大容量存储设备(例如,磁盘、磁光盘或光盘)接收数据或向其传输数据。然而,计算机不需要这样的设备。适用于存储计算机程序指令和数据的计算机可读介质包括所有形式的非暂时性存储器、介质和存储器设备,包括例如半导体存储器设备,例如EPROM、EEPROM和闪存设备;磁盘,例如内部硬盘或可移动磁盘;磁光盘;以及CD-ROM和DVD-ROM光盘。处理器和存储器可以由专用逻辑电路补充或并入专用逻辑电路中。
尽管本专利文档包含许多细节,但这些细节不应被解释为对任何主题或权利要求要求保护的内容的范围的限制,而应被解释为对特定技术的特定实施例所特有的特征的描述。本专利文档中在单独实施例的上下文中描述的某些特征也可以在单个实施例中组合实施。相反地,也可以在多个实施例中单独地或以任何合适的子组合实施在单个实施例的上下文中描述的各种特征。此外,尽管特征可以被描述为以特定组合起作用,甚至最初被声称为这样,但在一些情况下,可以从所声称的组合中删除来自所声称的组合的一个或多个特征,并且所声称的组合可以被定向到子组合或子组合的变体。
类似地,尽管在附图中以特定顺序描述操作,但这不应被理解为要求按照所示的特定顺序或序列顺序执行这样的操作,或要求执行所有示出的操作,以达到理想的结果。此外,本专利文档中描述的实施例中的各种系统组件的分离不应被理解为在所有实施例中都需要这种分离。
仅描述了一些实施方式和示例,并且可以基于本专利文档中描述和说明的内容进行其它实施方式、增强和变体。

Claims (65)

1.一种视频处理方法,包括:
执行包括一个或多个图片的视频与所述视频的比特流之间的转换,所述一个或多个图片包括一个或多个子图片,并且
其中,根据顺序规则将所述一个或多个图片和/或所述一个或多个子图片包括在所述比特流中,并且
其中,所述顺序规则规定当前瞬时解码器刷新IDR图片或当前IDR子图片在所述比特流中的位置相对于所述当前IDR图片或所述当前IDR子图片的当前条带的参考图片列表的条目所参考的另一图片之间的关系。
2.根据权利要求1所述的方法,其中,所述顺序规则规定,响应于条件被满足,所述比特流不包括所述当前条带的所述参考图片列表中的所述条目所参考的任何图片,所述图片在输出顺序或解码顺序中位于帧内随机访问点IRAP图片之前,所述IRAP图片在解码顺序中位于所述当前IDR图片之前。
3.根据权利要求2所述的方法,其中,所述条件包括存在标志指示参考图片列表RPL语法元素被允许存在于网络抽象层NAL单元类型等于IDR_N_LP或IDR_W_RADL的条带的条带标头中。
4.根据权利要求2所述的方法,其中,所述条件包括存在标志指示参考图片列表RPL语法元素不存在于网络抽象层NAL单元类型等于IDR_N_LP或IDR_W_RADL的条带的条带标头中。
5.根据权利要求2至4中任一项所述的方法,其中,所述当前IDR图片和所述IRAP图片具有等于特定值的网络抽象层NAL单元标头层标识符。
6.根据权利要求1所述的方法,其中,所述顺序规则规定所述比特流不包括干净随机访问图片的第二条带的第二参考图片列表中的第二条目所参考的任何图片,所述图片在输出顺序或解码顺序中位于第二帧内随机访问点IRAP图片之前,所述第二IRAP图片在解码顺序中位于所述干净随机访问图片之前。
7.根据权利要求1所述的方法,其中,所述顺序规则规定,响应于条件被满足,所述比特流不包括所述当前条带的所述参考图片列表中的所述条目所参考的任何图片,所述图片在输出顺序或解码顺序中位于包含帧内随机访问点IRAP子图片并且在所述解码顺序中位于包含所述当前IDR子图片的图片之前的任何图片之前。
8.根据权利要求7所述的方法,其中,所述条件包括存在标志指示参考图片列表RPL语法元素被允许存在于网络抽象层NAL单元类型等于IDR_N_LP或IDR_W_RADL的条带的条带标头中。
9.根据权利要求7所述的方法,其中,所述条件包括存在标志指示参考图片列表RPL语法元素不存在于网络抽象层NAL单元类型等于IDR_N_LP或IDR_W_RADL的条带的条带标头中。
10.根据权利要求7至9中任一项所述的方法,其中,所述IRAP子图片和所述当前IDR子图片具有等于特定标识值的网络抽象层NAL单元标头层标识符和等于特定索引值的子图片索引。
11.根据权利要求1所述的方法,其中,所述顺序规则规定所述比特流不包括干净随机访问图片子图片的第三条带的所述参考图片列表中的第三条目所参考的任何图片,所述图片在输出顺序或解码顺序中位于包含第三帧内随机访问点IRAP子图片并且在所述解码顺序中位于包含所述干净随机访问图片子图片的图片之前的任何图片之前。
12.一种视频处理方法,包括:
根据格式规则执行包括一个或多个图片的视频与所述视频的比特流之间的转换,所述图片包括一个或多个子图片和/或一个或多个条带,并且
其中,所述格式规则允许包括访问单元的指示,所述指示指示所述访问单元是对于所述视频中的每个访问单元的帧内随机访问点IRAP访问单元还是逐渐解码刷新GDR访问单元。
13.根据权利要求12所述的方法,其中,所述IRAP访问单元不需要是完整的并且包括至少一个IRAP图片。
14.根据权利要求12所述的方法,其中,所述GDR访问单元不需要是完整的并且包括至少一个GDR图片。
15.根据权利要求12所述的方法,其中,所述格式规则规定在访问单元分隔符中包括由视频参数集规定的最低层中的图片的图片标头中的指示。
16.一种视频处理方法,包括:
根据格式规则执行包括一个或多个图片的视频与所述视频的比特流之间的转换,所述图片包括一个或多个子图片和/或一个或多个条带,并且
其中,所述格式规则规定图片中是否允许条带类型的指示基于所述图片的图片条件选择性地包括在所述比特流中。
17.根据权利要求16所述的方法,其中,所述条带类型包括帧内编解码条带、帧间编解码条带、B条带或P条带。
18.根据权利要求16或17所述的方法,其中,所述图片条件包括所述图片中的条带的布局。
19.根据权利要求16至18中任一项所述的方法,其中,所述图片条件包括所述图片是否是帧内随机访问点IRAP图片以及帧间层依赖性是否允许用于所述转换。
20.根据权利要求16至19中任一项所述的方法,其中,所述图片条件包括:i)图片参数集是否指示每个图片仅应用条带,和/或ii)不使用图片分区,和/或iii)使用矩形条带并且每个图片仅使用一个条带,和/或iv)图片被分割为矩形条带。
21.根据权利要求16至19中任一项所述的方法,其中,所述图片条件包括在更高级别视频单元中信令通知一个或多个语法元素。
22.根据权利要求16或17所述的方法,其中,所述图片条件包括用于对所述图片进行编解码的参考图片的数量。
23.根据权利要求22所述的方法,其中,所述参考图片的数量基于指示第一参考图片列表语法结构中的条目数量的第一字段和/或指示第二参考图片列表语法结构中的条目数量的第二字段。
24.一种视频处理方法,包括:
执行包括一个或多个图片的视频与所述视频的比特流之间的转换,所述图片包括一个或多个子图片和/或一个或多个条带,并且
其中,所述格式规则规定至少两个或四个语法元素之一被设置为自适应环路滤波器ALF自适应参数集的特定值。
25.根据权利要求24所述的方法,其中,所述至少四个语法元素包括规定是否信令通知亮度滤波器集合的亮度滤波器信号标志、规定是否信令通知色度滤波器的色度滤波器信号标志、规定是否信令通知Cb颜色分量的交叉分量滤波器的cc和cb滤波器信号标志,以及规定是否信令通知Cr颜色分量的交叉分量滤波器的cc和cr滤波器信号标志。
26.一种视频处理方法,包括:
根据格式规则执行包括一个或多个图片的视频与所述视频的比特流之间的转换,并且
其中,所述格式规则规定是否和/或如何信令通知滤波器存在标志和/或滤波器系数的指示取决于先前编解码的信息,所述先前编解码的信息具有自适应参数集原始字节序列有效载荷RBSP语法中的语法元素和/或自适应环路滤波数据结构。
27.根据权利要求26所述的方法,其中,所述格式规则还规定,在所述指示不存在的情况下,基于具有所述自适应环路滤波数据结构的所述先前编解码的信息来推导所述指示的值。
28.根据权利要求26所述的方法,其中,所述格式规则还规定是否信令通知cc和cr滤波器信号标志,所述cc和cr滤波器信号标志规定是否信令通知Cr颜色分量的交叉分量滤波器取决于所有三个语法元素是否等于一定值,所述三个语法元素包括规定是否信令通知亮度滤波器集合的亮度滤波器信号标志、规定是否信令通知色度滤波器的色度滤波器信号标志、以及规定是否信令通知Cb颜色分量的交叉分量滤波器的cc和cb滤波器信号标志。
29.根据权利要求26所述的方法,其中,所述格式规则还规定是否信令通知规定是否信令通知色度滤波器的色度滤波器信号标志取决于规定是否信令通知亮度滤波器集合的亮度滤波器信号标志的值。
30.一种视频处理方法,包括:
根据格式规则执行包括一个或多个图片的视频与所述视频的比特流之间的转换,并且
其中,所述格式规则允许对于小于图片的视频区域,参考对应于其边信息被包括在所述APS中的编解码工具的多个自适应参数集APS。
31.根据权利要求30所述的方法,其中,所述多个APS包括缩放APS、具有色度缩放的亮度映射LMCS APS、和/或对应于其他编解码工具的APS。
32.根据权利要求30所述的方法,其中,所述格式规则规定所述比特流包括要参考的所述多个APS的数量。
33.根据权利要求30所述的方法,其中,所述格式规则规定所述比特流包括要参考的所述多个APS的索引。
34.根据权利要求30所述的方法,其中,所述格式规则还规定要用于所述转换的所述多个APS取决于所述视频的颜色分量。
35.根据权利要求34所述的方法,其中,所述格式规则还规定对于所述视频的亮度分量和色度分量使用不同的APS。
36.根据权利要求34所述的方法,其中,所述格式规则还规定在所述比特流中分别信令通知要用于亮度分量和色度分量的所述多个APS的数量和/或索引。
37.根据权利要求30所述的方法,其中,所述格式规则还规定如何信令通知要使用的所述多个APS取决于所述图片的子图片。
38.根据权利要求30所述的方法,其中,所述格式规则还规定对于每个子图片选择或信令通知要使用的开启/关闭控制和/或所述多个APS。
39.一种视频处理方法,包括:
根据格式规则执行包括一个或多个图片的视频与所述视频的比特流之间的转换,所述图片包括一个或多个子图片,并且
其中,所述格式规则规定如何推导指示编解码图片的子图片是否在解码过程中被视为不包括环路滤波操作的图片的第一变量的值取决于指示子图片信息存在于所述比特流中的第二变量。
40.根据权利要求39所述的方法,其中,所述格式规则规定,在所述第一变量不存在的情况下,所述第一变量的所述值被推导为等于所述第二变量的值。
41.一种视频处理方法,包括:
根据格式规则执行包括一个或多个图片的视频与所述视频的比特流之间的转换,所述图片包括一个或多个子图片,并且
其中,所述格式规则规定,响应于一个或多个条件被满足,指示去方块滤波器对参考图片参数集的图片的适用性的变量具有第一值或第二值,所述第一值用于指示所述去方块滤波器应用于参考所述图片参数集的条带,所述第二值用于指示所述去方块滤波器被禁用于参考所述图片参数集的条带。
42.根据权利要求41所述的方法,其中,所述第一值为1并且所述第二值为0。
43.根据权利要求42所述的方法,其中,所述一个或多个条件包括:1)不存在指示所述去方块滤波器的禁用的条带级别和图片标头级别中的去方块滤波器禁用标志,2)去方块滤波器覆盖启用标志指示不覆盖参考所述图片参数集的图片的去方块行为,3)所述去方块滤波器覆盖启用标志指示参考所述图片参数集的图片的所述去方块行为允许被覆盖,去方块滤波器存在标志指示去方块滤波器信息存在于图片标头语法结构中,并且图片标头级别中的去方块滤波器禁用标志指示对于图片禁用所述去方块滤波器,或者4)所述去方块滤波器覆盖启用标志指示对于参考所述图片参数集的图片的所述去方块行为允许被覆盖,去方块滤波器存在标志指示去方块滤波器信息存在于图片标头语法结构中,并且条带级别中的去方块滤波器禁用标志指示对于所述图片禁用所述去方块滤波器。
44.根据权利要求41所述的方法,其中,所述第一值为0并且所述第二值为0。
45.根据权利要求44所述的方法,其中,所述一个或多个条件包括:1)不存在指示所述去方块滤波器的禁用的条带级别和图片标头级别中的去方块滤波器禁用标志,2)去方块滤波器覆盖启用标志指示不覆盖参考所述图片参数集的图片的去方块行为,3)所述去方块滤波器覆盖启用标志指示参考所述图片参数集的图片的所述去方块行为允许被覆盖,去方块滤波器存在标志指示所述去方块滤波器信息存在于图片标头语法结构中,并且图片标头级别中的去方块滤波器禁用标志指示对于当前图片启用所述去方块滤波器,或者4)所述去方块滤波器覆盖启用标志指示对于参考所述图片参数集的图片的所述去方块行为允许被覆盖,去方块滤波器存在标志指示去方块滤波器信息不存在于图片标头语法结构中,并且条带级别中的去方块滤波器禁用标志指示对于所述图片启用所述去方块滤波器。
46.一种视频处理方法,包括:
根据格式规则执行包括一个或多个视频单元的视频与所述视频的比特流之间的转换,所述视频单元包括一个或多个条带,并且
其中,所述格式规则规定用于联合色度残差编解码的量化参数偏移值包括在大于条带级别的一个或多个视频单元级别中。
47.根据权利要求46所述的方法,其中,所述一个或多个视频单元对应于视频图片、视频序列、序列参数集、视频参数集、图片标头、图片参数集或解码能力信息语法结构。
48.根据权利要求46所述的方法,其中,所述一个或多个视频单元级包括第一级别和第二级别,并且其中,所述格式规则还规定是否在所述第二级别中信令通知所述量化参数偏移值取决于是否在所述第一级别中信令通知所述量化参数偏移值。
49.根据权利要求46所述的方法,其中,所述一个或多个视频单元级别包括第一级别和低于所述第一级别的第二级别,并且其中,所述格式规则还规定在所述第一级别中信令通知所述量化参数偏移值,并且信令通知覆盖标志以指示是否在所述第二级别中信令通知所述量化参数偏移值以在所述第一级别中覆盖信令通知的值。
50.一种视频处理方法,包括:
根据格式规则执行包括一个或多个图片的视频与所述视频的比特流之间的转换,并且
其中,所述格式规则规定:(i)用于对指示图片标头级别中的具有色度缩放的亮度映射LMCS模式标识的变量进行编解码的一个或多个比特的固定或可变长度,以及(ii)所述变量的值的范围。
51.根据权利要求50所述的方法,其中,所述格式规则规定使用ue(v)对所述变量进行编解码,并且所述变量的所述值的所述范围在0到2之间,包括0和2。
52.根据权利要求50所述的方法,其中,所述格式规则规定使用ue(v)对所述变量进行编解码,并且在图片仅包含一个条带的情况下,所述变量的所述值的所述范围在0到1之间,包括0和1,否则所述范围在0到2之间,包括0和2。
53.根据权利要求50所述的方法,其中,所述格式规则规定在图片仅包含一个条带的情况下,使用u(1)对所述变量进行编解码,使得所述变量的所述值为0或1,否则使用ue(v)对所述变量进行编解码,使得所述变量的所述值的所述范围在0到2之间,包括0和2。
54.一种视频处理方法,包括:
根据格式规则执行包括一个或多个图片的视频与所述视频的比特流之间的转换,并且
其中,所述格式规则规定:(i)用于对指示图片标头级别中的缩放列表模式标识的变量进行编解码的一个或多个比特的固定或可变长度,以及(ii)所述变量的值的范围。
55.根据权利要求54所述的方法,其中,所述格式规则规定使用ue(v)对所述变量进行编解码,并且所述变量的所述值的所述范围在0到2之间,包括0和2。
56.根据权利要求54所述的方法,其中,所述格式规则规定使用ue(v)对所述变量进行编解码,并且在图片仅包含一个条带的情况下,所述变量的所述值的所述范围在0到1之间,包括0和1,否则所述范围在0到2之间,包括0和2。
57.根据权利要求54所述的方法,其中,所述格式规则规定在图片仅包含一个条带的情况下,使用u(1)对所述变量进行编解码,使得所述变量的所述值为0或1,否则使用ue(v)对所述变量进行编解码,使得所述变量的所述值的所述范围在0到2之间,包括0和2。
58.根据权利要求1至57中任一项所述的方法,其中,所述转换包括将所述视频编码成所述比特流。
59.根据权利要求1至57中任一项所述的方法,其中,所述转换包括从所述比特流解码所述视频。
60.根据权利要求1至57中任一项所述的方法,其中,所述转换包括从所述视频生成所述比特流,并且所述方法还包括:将所述比特流存储在非暂时性计算机可读记录介质中。
61.一种视频处理装置,包括被配置为实施如权利要求1至60中任一项或多项所述的方法的处理器。
62.一种存储视频的比特流的方法,包括权利要求1至60中任一项所述的方法,并且还包括将所述比特流存储到非暂时性计算机可读记录介质。
63.一种存储程序代码的计算机可读介质,所述程序代码在被执行时使得处理器实施如权利要求1至60中任一项或多项所述的方法。
64.一种计算机可读介质,其存储根据上述方法中的任一项生成的比特流。
65.一种存储比特流表示的视频处理装置,其中,所述视频处理装置被配置为实施如权利要求1至60中任一项或多项所述的方法。
CN202180028190.6A 2020-04-12 2021-04-09 瞬时解码刷新子图片的编解码 Pending CN115398901A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202063008799P 2020-04-12 2020-04-12
US63/008,799 2020-04-12
PCT/US2021/026534 WO2021211364A1 (en) 2020-04-12 2021-04-09 Coding of instantaneous decoding refresh subpictures

Publications (1)

Publication Number Publication Date
CN115398901A true CN115398901A (zh) 2022-11-25

Family

ID=78085269

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180028190.6A Pending CN115398901A (zh) 2020-04-12 2021-04-09 瞬时解码刷新子图片的编解码

Country Status (6)

Country Link
US (2) US20230063887A1 (zh)
EP (1) EP4118826A4 (zh)
JP (1) JP2023521420A (zh)
KR (1) KR20220163390A (zh)
CN (1) CN115398901A (zh)
WO (1) WO2021211364A1 (zh)

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4355156B2 (ja) * 2002-04-16 2009-10-28 パナソニック株式会社 画像復号化方法及び画像復号化装置
WO2005071970A1 (en) * 2004-01-16 2005-08-04 General Instrument Corporation Method and apparatus for determining timing information from a bit stream
US10171828B2 (en) * 2015-02-27 2019-01-01 Arris Enterprises Llc Modification of unification of intra block copy and inter signaling related syntax and semantics
US11140417B2 (en) * 2016-11-01 2021-10-05 Nokia Technologies Oy Apparatus, a method and a computer program for video coding and decoding
US11062738B2 (en) * 2017-03-23 2021-07-13 Qualcomm Incorporated Signalling of video content including sub-picture bitstreams for video coding
CA3146555A1 (en) * 2019-07-08 2021-01-14 Huawei Technologies Co., Ltd. Mixed nal unit picture constraints in video coding

Also Published As

Publication number Publication date
US20240127464A1 (en) 2024-04-18
KR20220163390A (ko) 2022-12-09
EP4118826A1 (en) 2023-01-18
US20230063887A1 (en) 2023-03-02
WO2021211364A1 (en) 2021-10-21
EP4118826A4 (en) 2023-05-10
JP2023521420A (ja) 2023-05-24

Similar Documents

Publication Publication Date Title
JP7433280B2 (ja) ビデオストリームにおける従属ランダムアクセスポイント指示
JP7420965B2 (ja) 隣接するサブピクチャのコーディング
CN114846457A (zh) 对层级视频的编解码的限制
CN114868399A (zh) 条带类型和视频层的信令通知
CN115299062A (zh) 图片标头中的语法元素的条件信令
CN115299065A (zh) 基于变换跳过的残差编解码
US20240048689A1 (en) Sublayers information in video coding
JP7425224B2 (ja) 高レベル構文におけるインター予測のための信号通知
US20240080492A1 (en) Identification Of Inter-Layer Reference Pictures In Coded Video
CN115336277A (zh) 在视频编解码中使用视频参数集
CN115668924A (zh) 参考图片信息的约束
CN115362479A (zh) 图片中的条带类型
JP2023523409A (ja) 映像コーディング構文要素の条件付き信号通知
CN115398901A (zh) 瞬时解码刷新子图片的编解码
CN115428454A (zh) 使用参数集的视频编解码
US11743506B1 (en) Deblocking signaling in video coding
CN115486067A (zh) 视频图片标头中的滤波器参数信令通知
JP2023522224A (ja) 参照ピクチャリスト上の制約
CN115699724A (zh) 编解码视频中序列结束的指示

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination