CN115176478A - 视频编解码中的参考图片重采样激活 - Google Patents

视频编解码中的参考图片重采样激活 Download PDF

Info

Publication number
CN115176478A
CN115176478A CN202180014141.7A CN202180014141A CN115176478A CN 115176478 A CN115176478 A CN 115176478A CN 202180014141 A CN202180014141 A CN 202180014141A CN 115176478 A CN115176478 A CN 115176478A
Authority
CN
China
Prior art keywords
equal
slice
video
flag
specifies
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180014141.7A
Other languages
English (en)
Inventor
邓智玭
张莉
张凯
王业奎
范逵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Douyin Vision Co Ltd
ByteDance Inc
Original Assignee
Douyin Vision Co Ltd
ByteDance Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Douyin Vision Co Ltd, ByteDance Inc filed Critical Douyin Vision Co Ltd
Publication of CN115176478A publication Critical patent/CN115176478A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/167Position within a video image, e.g. region of interest [ROI]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/547Motion estimation performed in a transform domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/573Motion compensation with multiple frame prediction using two or more reference frames in a given prediction direction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • H04N19/82Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

描述了用于包括视频编码或视频解码的视频处理的方法、装置、系统。一种示例方法包括执行包括视频图片的视频与视频的比特流之间的转换,视频图片包含视频条带。比特流符合格式规则,该格式规则规定,在视频条带的条带类型为类型P且启用了时域运动矢量预测的情况下,禁止使用并置参考图片列表中的参考图片的参考图片重采样(RPR)。参考图片由用于时域运动矢量预测的视频条带的并置图片的参考索引指示。

Description

视频编解码中的参考图片重采样激活
相关申请的交叉引用
根据适用专利法和/或适用于巴黎公约的规则,本申请及时要求于2020年2月14日提交的第PCT/CN2020/075194号国际专利申请的优先权和权益。出于法律上的所有目的,上述申请的全部公开内容通过引用并入本申请公开的一部分。
技术领域
本专利文档涉及图片编码和解码以及视频编码和解码。
背景技术
数字视频占互联网和其它数字通信网络上的最大带宽使用。随着能够接收和显示视频的连接用户装置的数目增加,预期数字视频使用的带宽需求将继续增长。
发明内容
本文档公开了可以由视频编码器和解码器用于视频处理的技术,其中在视频的编解码表示和视频的像素值之间执行转换。
在一个示例方面,公开了一种视频处理方法。该方法包括执行包括具有视频条带的视频图片的视频和视频的比特流之间的转换。比特流符合格式规则,该格式规则规定视频条带的条带类型确定来自视频图片的图片标头的特定信息被视频条带的条带标头继承的方式。
在另一个示例方面中,公开了一种视频处理方法。该方法包括执行包括具有视频条带的视频图片的视频和视频的比特流之间的转换。该比特流符合格式规则,该格式规则规定视频条带的条带类型确定视频条带标头中的第一语法元素的值。第一语法元素规定用于时域运动矢量预测的并置图片的参考索引。
在另一个示例方面中,公开了一种视频处理方法。该方法包括执行包括具有视频条带的视频图片的视频和视频的比特流之间的转换。比特流符合格式规则,该格式规则规定,在视频条带的条带类型为P类型并且启用时域运动矢量预测的情况下,禁用对并置参考图片列表中的参考图片使用参考图片重采样(RPR)。参考图片由用于时域运动矢量预测的视频条带的并置图片的参考索引指示。
在另一个示例方面中,公开了一种视频处理方法。该方法包括执行包括具有视频条带的视频图片的视频和视频的比特流之间的转换。该比特流符合格式规则,该格式规则规定在视频条带标头中的语法元素指示视频条带未与参考图片列表0并置的情况下,视频条带的条带类型排除类型P。
在另一个示例方面中,公开了一种视频处理方法。该方法包括执行包括具有一个或多个子图片的视频图片的视频和视频的比特流之间的转换。比特流符合格式规则,该格式规则规定响应于视频图片中的多个子图片选择性地包括指示是否跨编解码层视频序列中的子图片的边界执行操作的第一语法元素。
在另一个示例方面中,公开了一种视频处理方法。该方法包括执行包括具有一个或多个子图片的视频图片的视频和视频的比特流之间的转换。比特流符合格式规则,该格式规则规定比特流中的视频图片中的多个子图片受比特流中的约束标志约束。
在另一个示例方面中,公开了一种视频处理方法。该方法包括执行包括具有一个或多个子图片的视频图片的视频和视频的比特流之间的转换。比特流符合格式规则,该格式规则规定子图片中的条带数确定信令通知指示条带的宽度的语法元素的方式,其中条带的宽度被规定为片列数。
在另一个示例方面中,公开了一种视频处理方法。该方法包括根据格式规则执行包括具有一个或多个子图片的视频图片的视频和视频的比特流之间的转换,该格式规则规定基于约束标志确定视频图片中的一个或多个子图片中的每一个是否包括单个条带。
在另一个示例方面中,公开了一种视频处理方法。该方法包括执行包括视频图片的视频和视频的比特流之间的转换。视频图片中的至少一个包括一个或多个子图片。比特流符合格式规则,该格式规则规定,为了在转换的子图片子比特流提取过程中确定一个或多个目标子图片的输出子比特流,跨不同视频图片的每个目标子图片使用相同的子图片索引。
在另一个示例方面中,公开了一种视频处理方法。该方法包括通过从包括视频图片的视频的比特流中提取一个或多个目标子图片的子比特流来确定输出子比特流。视频图片中的至少一个包括一个或多个子图片,并且输出子比特流符合规定一个或多个目标子图片被表示为输出子比特流中的单个子图片的格式规则。
在另一个示例方面中,公开了一种视频处理方法。该方法包括执行包括瞬时解码刷新(IDR)图片的视频和视频的比特流之间的转换。该比特流符合格式规则,该格式规则规定与参考图片列表相关联的一个或多个语法元素存在于IDR图片的条带标头中。
在另一个示例方面中,公开了一种视频处理方法。该方法包括执行包括亮度视频块和色度视频块的视频与视频的比特流之间的转换。根据亮度分割树对亮度视频块进行分割,并且根据色度分割树对色度视频块进行分割。比特流包括指示亮度分割树的亮度块划分信息和指示色度分割树的色度块划分信息。比特流符合规定允许色度块划分信息不同于亮度块划分信息的规则。
在另一个示例方面中,公开了一种视频处理方法。该方法包括执行包括具有一个或多个子图片的视频图片的视频和视频的比特流之间的转换。比特流符合格式规则,该格式规则规定一个或多个语法结构基于包括常规约束信息的语法元素的约束标志进行约束。
在另一个示例方面中,公开了一种视频处理方法。该方法包括执行包括具有视频条带的视频图片的视频和视频的比特流之间的转换。比特流符合格式规则,该格式规则规定视频条带的条带类型确定来自视频图片的图片标头的特定信息被视频条带的条带标头继承的方式。
在另一个示例方面中,公开了一种视频处理方法。该方法包括执行视频的视频区域中的视频单元和视频的编解码表示之间的转换,其中编解码表示符合语法规则。该规则规定视频图片级的第一指示符和视频区域级的第二指示符指示在转换期间使用时域运动矢量预测编解码工具。该规则规定在编解码表示中省略第一指示符和/或第二指示符的条件。
在另一个示例方面中,公开了一种视频处理方法。该方法包括执行视频的视频区域中的视频单元和视频的编解码表示之间的转换,其中编解码表示符合语法规则;其中,语法规则规定将视频区域级的标头的信息推断为视频单元级的标头的信息。
在另一个示例方面中,公开了一种视频处理方法。该方法包括执行包括组织为逐层视频序列的多个图片的视频的视频区域中的视频单元与视频的编解码表示之间的转换;其中,编解码表示中的一个或多个字段指示视频单元中的多个子图片。
在另一个示例方面中,公开了一种视频处理方法。该方法包括执行包括组织为逐层视频序列的多个图片的视频的视频区域中的视频单元与视频的编解码表示之间的转换;其中,编解码表示符合格式规则,该格式规则规定指示视频单元中子图片数目的第二字段的值控制第二字段是否对转换指示跨子图片编解码工具的适用性。
在另一个示例方面中,公开了一种视频处理方法。该方法包括执行包括组织为逐层视频序列的多个图片的视频的视频区域中的视频单元与视频的编解码表示之间的转换;其中,编解码表示符合格式规则,该格式规则规定每个视频单元的子图片数目控制编解码表示中的语法元素的值。
在另一个示例方面中,公开了一种视频处理方法。该方法包括执行包括组织为逐层视频序列的多个图片的视频的视频区域中的视频单元与视频的编解码表示之间的转换,其中,编解码表示符合格式规则,该格式规则规定指示视频单元中是否出现单个视频条带的字段值控制视频的矩形条带的编解码特性。
在另一个示例方面中,公开了一种视频处理方法。该方法包括执行包括组织为逐层视频序列的多个图片的视频的视频区域中的视频单元与视频的编解码表示之间的转换;其中,编解码表示符合语法规则,语法规则使得在层宽视频序列的编解码表示中的跨不同图片的提取子图片具有相同的子图片索引。
在另一个示例方面中,公开了一种视频处理方法。该方法包括执行包括组织为逐层视频序列的多个图片的视频的视频区域中的视频单元与视频的编解码表示之间的转换;其中,编解码表示符合语法规则,即为子图片子比特流提取的子比特流符合单个子图片的格式。
在另一个示例方面中,公开了一种视频处理方法。该方法包括执行包括组织为逐层视频序列的多个图片的视频的视频区域中的视频单元与视频的编解码表示之间的转换;其中,编解码表示符合格式规则,该格式规则规定包括一个或多个约束标志,该约束标志控制编解码表示中的语法结构中一个或多个语法元素的出现。
在又一个示例方面中,公开了一种视频编码器装置。视频编码器包括配置为实施上述方法的处理器。
在又一个示例方面中,公开了一种视频解码器装置。视频解码器包括配置为实施上述方法的处理器。
在又一个示例方面中,公开了一种其上存储有代码的计算机可读介质。该代码以处理器可执行代码的形式体现了本文描述的方法之一。
本文档中描述了这些特征和其他特征。
附图说明
图1是示例视频处理系统的框图。
图2是视频处理装置的框图。
图3是视频处理的示例方法的流程图。
图4是示出根据本公开的一些实施例的视频编解码系统的框图。
图5是示出根据本公开的一些实施例的编码器的框图。
图6是示出根据本公开的一些实施例的解码器的框图。
图7是根据本技术的视频处理方法的流程图表示。
图8是根据本技术的另一种视频处理方法的流程图表示。
图9是根据本技术的另一种视频处理方法的流程图表示。
图10是根据本技术的另一种视频处理方法的流程图表示。
图11是根据本技术的另一种视频处理方法的流程图表示。
图12是根据本技术的另一种视频处理方法的流程图表示。
图13是根据本技术的另一种视频处理方法的流程图表示。
图14是根据本技术的另一种视频处理方法的流程图表示。
图15是根据本技术的另一种视频处理方法的流程图表示。
图16是根据本技术的另一种视频处理方法的流程图表示。
图17是根据本技术的另一种视频处理方法的流程图表示。
图18是根据本技术的另一种视频处理方法的流程图表示。
图19是根据本技术的又一种视频处理方法的流程图表示。
具体实施方式
在本文档中使用章节标题是为了便于理解,并且不限制每个章节中公开的技术和实施例仅适用于该章节。此外,在一些说明书中使用H.266术语只是为了便于理解,而不是为了限制所公开技术的范围。这样,本文所描述的技术也适用于其它视频编解码器协议和设计。此外,使用VCC标准的当前版本如何可以通过插入新文本(高亮)或删除当前文本(删除线)来修改的示例对一些技术进行描述。
本文档与视频编解码技术有关。具体地,它是关于视频编解码中的高级别语法(HLS)和相关技术。它可以应用于例如HEVC之类的现有视频编解码标准或要被完成的标准(通用视频编解码)。它还可以适用于未来视频编解码标准或视频编解码器。
视频编解码标准主要是通过著名的ITU-T和ISO/IEC标准的发展而发展起来的。ITU-T制作了H.261和H.263,ISO/IEC制作了MPEG-1和MPEG-4Visual,并且这两个组织联合制作了H.262/MPEG-2视频标准和H.264/MPEG-4高级视频编解码(AVC)标准以及H.265/HEVC标准。自H.262以来,视频编解码标准基于混合视频编解码结构,其中,使用了时域预测加变换编解码。为了探索HEVC之外的未来视频编解码技术,VCEG和MPEG于2015年联合成立了联合视频探索小组(JVET)。此后,许多新方法被JVET采用,并被应用到名为联合探索模型(JEM)的参考软件中。JVET会议每季度同时举行一次,并且新的编解码标准的目标是比HEVC降低50%的比特率。在2018年4月的JVET会议上,新的视频编解码标准被正式命名为通用视频编解码(VVC),并且当时发布了VVC测试模型(VTM)的第一个版本。随着致力于VVC标准化的不断努力,每次JVET会议都会为VCC标准采用新的编解码技术。
示例定义
本文档中使用了以下定义。
访问单元(AU):属于不同层的PU集合,并且包含与同一时间相关联的编解码图片以用于从DPB输出。
自适应环路滤波器(ALF):作为解码过程的一部分应用并且由APS中传送的参数控制的滤波过程。
AC变换系数:两个维度中至少一个维度的频率索引为非零的任何变换系数。
ALF APS:控制ALF过程的APS。
自适应参数集合(APS):包含语法元素的语法结构,该语法元素如由条带标头中发现的零个或多个语法元素确定地适用于零个或多个条带。
(特定的图片的)相关联的IRAP图片:解码顺序中具有与特定的图片相同的nuh_layer_id值的前一个IRAP图片(当存在时)。
相关联的非VCL NAL单元:VCL NAL单元的非VCLNAL单元(当存在时),其中VCL NAL单元是非VCL NAL单元的相关联的VCL NAL单元。
相关联的VCL NAL单元:nal_unit_type等于EOS_NUT、EOB_NUT、SUFFIX_APS_NUT、SUFFIX_SEI_NUT、FD_NUT、RSV_NVCL_27或UNSPEC_30…UNSPEC_31范围内的非VCL NAL单元的解码顺序中的前一个VCL NAL单元;或解码顺序中的下一个VCLNAL单元。
二进制位:二进制位字符串的一位。
二值化:二进制位字符串的集合,用于语法元素的所有可能值。
二值化过程:将语法元素的所有可能值映射到二进制位字符串的集合上的唯一映射过程。
二元划分:将样点的矩形MxN块划分为两个块,其中垂直划分产生第一个(M/2)xN块和第二个(M/2)xN块,并且水平划分产生第一个Mx(N/2)块和第二个Mx(N/2)块。
二进制位字符串:来自语法元素的二进制化的语法元素值的中间二进制表示。
双预测(B)条带:使用帧内预测或使用最多两个运动矢量和参考索引的帧间预测进行解码的条带,以预测每个块的样点值。
比特流:以NAL单比特流或字节流的形式的比特序列,其形成AU序列的标识,AU序列形成一个或多个编解码视频序列(CVS)。
块:样点的MxN(M列x N行)阵列,或变换系数的MxN阵列。
块矢量:用于IBC预测的二维矢量,其提供从当前编解码块的坐标到同一解码图片中的预测块坐标的偏移量。
字节:8位的序列,当作为位值序列写入或读取时,其中最左边和最右边的位分别表示最高有效位和最低有效位。
字节对齐:当位置是比特流中第一个位的位置的8位整数倍时,比特流中的位置是字节对齐的;并且当位或字节或语法元素出现在比特流中的位置是字节对齐的时,则称其为字节对齐的。
字节流:包含起始代码前缀和NAL单元的NAL单元流的封装。
可以:一个术语,用于指允许但不一定需要的行为。
色度:一个形容词,由符号Cb和Cr表示,规定样点阵列或单个样点表示与原色相关的两个色差信号之一。需要注意的是,使用术语色度(chroma)而不是术语色度(chrominance),以避免使用通常与术语色度(chrominance)相关联的线性光传送特性的含义。
清洁随机存取(CRA)PU:其中编解码图片为CRA图片的PU。
清洁随机存取(CRA)图片:每个VCL NAL单元的nal_unit_type等于CRA_NUT的IRAP图片。需要注意的是,CRA图片在其解码过程中不指除了用于帧间预测的自身以外的任何图片,并且可以是解码顺序中的比特流中的第一个图片,或者可以稍后出现在比特流中。CRA图片可能具有相关联的RADL或RASL图片。当CRA图片的NoOutputBeforeRecoveryFlag等于1时,解码器不会输出相关联的RASL图片,因为它们可能不可解码,这是由于它们可能包含对比特流中不存在的图片的引用。
编解码层视频序列(CLVS):具有相同nuh_layer_id值的PU序列按解码顺序由CLVSS PU组成,后跟零个或多个非CLVSS PU的PU,包括所有后续PU,但不包括作为CLVSS PU的任何后续PU。需要注意的是,CLVSS PU可以是IDR PU、CRAPU或GDR PU。对于每个IDR PU、HandleCraAsCvsStartFlag等于1的每个CRA PU、以及作为按照解码顺序的比特流层中的第一个PU或按照解码顺序的EOS NAL单元之后的比特流层中的第一个PU的每个CRA或GDR PU,NoOutputBeforeRecoveryFlag的值等于1。
编解码层视频序列开始(CLVSS)PU:其中编解码图片为CLVSS图片的PU。
编解码层视频序列开始(CLVSS)图片:作为IRAP图片的编解码图片,其中NoOutputBeforeRecoveryFlag等于1,或NoOutputBeforeRecoveryFlag等于1的GDR图片。
编解码图片:图片的编解码表示,包括在AU内具有nuh_layer_id的特定的值的VCLNAL单元,并包含图片的所有CTU。
编解码图片缓冲器(CPB):先进先出的缓冲器,包含假设参考解码器中规定的按照解码顺序的DU。
编解码表示:按照其编解码形式表示的数据元素。
编解码视频序列(CVS):按解码顺序由CVSS AU组成的AU序列,后跟零个或多个非CVSS AU的AU,包括所有后续AU,但不包括作为CVSS AU的任何后续AU。
编解码视频序列开始(CVSS)AU:其中CVS中的每一层都有PU的AU,并且每个PU中的编解码图片是CLVSS图片。
编解码块:一些M值和N值的样点的MxN块,这样将CTB划分为编解码块就是一种分割。
编解码树块(CTB):某个N值的N×N的样点块,这样将分量划分为CTB就是一种分割。
编解码树单元(CTU):亮度样点的CTB、具有三个样点阵列的图片的色度样点的两个对应CTB、或单色图片的样点的CTB、或使用三个单独的颜色平面和用于编解码样点的语法结构进行编解码的图片。
编解码单元(CU):亮度样点的编解码块、具有三个样点阵列的图片的色度样点的两个对应编解码块、或单色图片的样点的编解码块、或使用三个单独的颜色平面和用于编解码样点的语法结构进行编解码的图片。
分量:阵列或构成4:2:0、4:2:2或4:4:4颜色格式图片的三个阵列(亮度和两个色度)中的单个样点,或阵列或构成单色格式图片的阵列中的单个样点。
上下文变量:通过包含最近解码的二进制位的等式,为二进制位的自适应二进制算术解码过程规定的变量。
去方块滤波器:作为解码过程的一部分应用的滤波过程,以便最小化块之间边界处的视觉伪像的出现。
解码图片:通过对编解码图片应用解码过程产生的图片。
解码图片缓冲器(DPB):保存解码图片的缓冲器,用于假设参考解码器规定的引用、输出重新排序或输出延迟。
解码器:解码过程的实施例。
解码顺序:解码过程处理语法元素的顺序。
解码过程:本说明书中规定的读取比特流并从中推导解码图片的过程。
解码单元(DU):如果DecodingUnitHrdFlag等于0,则为AU,否则为AU的子集,由AU中的一个或多个VCL NAL单元和相关联的非VCL NAL单元组成。
仿真防止字节:当比特流的语法元素以确保NAL单元中连续字节对齐的字节序列不能包含起始代码前缀的方式形成某些字节值的模式时,NAL单元中存在的等于0x03的字节。
编码器:编码过程的实施例。
编码过程:本说明书中未规定的产生符合本说明书的比特流的过程。
填充数据NAL单元:nal_unit_type等于FD_NUT的NAL单元。
标志:可以采用两个可能值中的一个:0和1的变量或单个比特语法元素。
频率索引:在解码过程中应用变换之前,与变换系数相关联的一维或二维索引。
渐进解码刷新(GDR)AU:其中每个当前PU中的编解码图片是GDR图片的AU。
渐进解码刷新(GDR)PU:其中编解码图片为GDR图片的PU。
渐进解码刷新(GDR)图片:每个VCL NAL单元的nal_unit_type等于GDR_NUT的图片。
假设参考解码器(HRD):规定编码过程可能产生的一致NAL单元流或一致字节流的可变性约束的假设解码器模型。
假设流调度器(HSS):用于检查比特流或解码器在将比特流输入假设参考解码器的定时和数据流方面的一致性的假设解码器模型。
信息性:用于指本说明书中提供的一个术语,该术语未建立任何与本说明书一致的强制性要求,并且因此不被视为本说明书的组成部分。
瞬时解码刷新(IDR)PU:其中编解码图片为IDR图片的PU。
瞬时解码刷新(IDR)图片:每个VCL NAL单元的nal_unit_type等于IDR_W_RADL或IDR_N_LP的IRAP图片。注意,IDR图片在其解码过程中不参考用于帧间预测的除自身以外的任何图片,并且可以是解码顺序的比特流中的第一个图片,或者可以稍后出现在比特流中。每个IDR图片是按解码顺序的CVS的第一个图片。当每个VCL NAL单元的nal_unit_type等于IDR_W_RADL的IDR图片时,它可能具有相关联的RADL图片。当每个VCL NAL单元的nal_unit_type等于IDR_N_LP的IDR图片时,它没有任何相关联的前导图片。IDR图片没有相关联的RASL图片。
层间参考图片(ILRP):与当前图片位于同一AU中的图片,其中nuh_layer_id小于当前图片的nuh_layer_id,并且被标记为“用于长期参考”。
帧间编解码:对使用帧间预测的编解码块、条带或图片进行的编解码。
帧间预测:以依赖于一个或多个参考图片的数据元素(例如,样点值或运动矢量)的方式导出的预测。
块内复制(IBC)预测:以依赖于同一解码条带而不参考参考图片的数据元素(例如,样点值或块矢量)的方式导出的预测。
帧内编解码:对使用帧内预测的编解码块、条带或图片进行的编解码。
帧内预测:仅从同一解码条带的数据元素(例如,样点值)导出而不参考参考图片的预测。
帧间随机访问点(IRAP)AU:其中CVS中每一层都有PU并且每个PU中的编解码图片是IRAP图片的AU。
帧内随机访问点(IRAP)PU:其中编解码图片为IRAP图片的PU。
帧内随机访问点(IRAP)图片:其中所有VCL NAL单元在IDR_W_RADL到CRA_NUT(含)的范围内具有相同的nal_unit_type值的编解码图片。注意,IRAP图片在其解码过程中不指代用于帧间预测的自身以外的任何图片,并且可以是CRA图片或IDR图片。比特流中按解码顺序的第一张图片必须是IRAP或GDR图片。如果必要的参数集在需要被参考时可用,则可以正确解码IRAP图片和CVS中解码顺序的所有后续非RASL图片,而无需按解码顺序对IRAP图片之前的任何图片执行解码处理。还应当注意的是,IRAP图片的mixed_nalu_types_in_pic_flag的值等于0。当图片的mixed_nalu_types_in_pic_flag等于0,并且图片的任何条带的nal_unit_type在IDR_W_RADL到CRA_NUT(含)的范围内时,图片的所有其他条带都具有相同的nal_unit_type值,并且该图片被称为IRAP图片。
帧内(I)条带:仅使用帧内预测进行解码的条带。
层:全部具有nuh_layer_id的特定值的VCL NAL单元集合以及相关联的非VCL NAL单元。
前置图片:与相关联IRAP图片位于同一层中并且在输出顺序中位于相关联IRAP图片之前的图片。
叶:作为深度为0的树的根节点的树的终止节点。
级别:对本规范的语法元素和变量可能采用的值或缩放前变换系数值的约束的定义集合。需要注意的是,所有简档都定义了相同的级别集合,其中每个级别定义的大多数方面在不同简档中是通用的。在规定的约束范围内,各个实现可以为每个受支持的简档支持不同的级别。
列表0(列表1)运动矢量:与指向参考图片列表0(列表1)的参考索引相关联的运动矢量。
列表0(列表1)预测:使用指向参考图片列表0(列表1)的参考索引对条带内容进行的帧间预测。
LMCS APS:控制LMCS过程的APS。
长期参考图片(LTRP):nuh_layer_id等于当前图片的nuh_layer_id并标记为“用于长期参考”的图片。
亮度:一个形容词,用符号或下标Y或L表示,规定样点阵列或单个样点代表与原色相关的单色信号。注意,使用术语亮度(luma)而不是术语亮度(luminance),以避免使用通常与术语亮度(luminance)相关联的线性光传送特性的含义。有时使用符号L代替符号Y,以避免与用于垂直位置的符号y混淆。
具有色度缩放的亮度映射(LMCS):作为解码过程的一部分应用的过程,该过程将亮度样点映射到特定值,并可以对色度样点的值应用缩放操作。
可能:用于指代允许但不一定需要的行为的术语。注意,在一些旨在强调所描述行为的可选性质的地方,使用短语“可能或不可能”来强调。本文档中使用该术语只是为了强调该要求被编解码标准采用的示例实施例,而不限制所公开技术的范围。
运动矢量:用于帧间预测的二维矢量,其提供从解码图片中的坐标到参考图片中的坐标的偏移量。
多类型树:一种树,其中父节点可以使用二元划分被划分为两个子节点,也可以使用三元划分被划分为三个子节点,每个子节点都可以成为另一个划分为两个或三个子节点的父节点。
必须:用于表示对本规范其他地方规定的要求或要求含义的观察的术语(仅在信息上下文中使用)。本文档中使用该术语只是为了强调该要求被编解码标准采用的示例实施例,而不是限制所公开技术的范围。
网络抽象层(NAL)单元:一种语法结构,包含要遵循的数据类型的指示,以及包含以RBSP形式的必要时散布有仿真预防字节的该数据的字节。
网络抽象层(NAL)单元流:NAL单元序列。
注意:用于前缀信息性备注的术语(仅在信息性上下文中使用)。
操作点(OP):OLS的时域子集,由OLS索引和TemporalId的最高值标识。
输出层:输出的输出层集合的层。
输出层集(OLS):由规定层集组成的层级,其中层集中的一个或多个层被规定为输出层。
输出图层集(OLS)层索引:OLS中的层到OLS中的层列表的索引。
输出顺序:从DPB输出解码图片的顺序(用于将从DPB输出的解码图片)。
输出时间:根据输出定时DPB操作,HRD规定的将从DPB输出解码图片的时间(用于将从DPB输出的解码图片)。
参数:序列参数集(SPS)或图片参数集(PPS)的语法元素,或定义术语量化参数的第二个字。
分割:将集合划分为子集,使得集合的每个元素恰好位于其中一个子集中。
图片:单色格式的亮度样点阵列或4:2:0、4:2:2和4:4:4颜色格式的亮度样点阵列和两个对应的色度样点阵列。注意,图片可以是帧或字段。然而,在一个CVS中,要么所有图片都是帧,要么所有图片都是字段。
图片标头(PH):包含适用于编解码图片的所有条带的语法元素的语法结构。
图片级条带索引:当rect_slice_flag等于1时,按照在PPS中信令通知的顺序,条带到图片中的条带列表的索引。
图片顺序计数(POC):与每个图片相关联的变量,唯一标识CLVS中所有图片中的相关联图片,并且当相关联图片将从DPB输出时,指示相关联图片在输出顺序中相对于将从DPB输出的相同CLVS中其他图片的输出顺序位置的位置。
图片参数集(PPS):一种语法结构,如由每个条带标头中的语法元素确定的,包含适用于零个或多个完整编解码图片的语法元素。
图片单元(PU):根据规定的分类规则相互关联的NAL单元集,在解码顺序上是连续的,并且仅包含一个编解码图片。
预测:预测过程的实施例。
预测过程:使用预测值对当前正在解码的数据元素(例如,样点值或运动矢量)进行估计。
预测(P)条带:使用帧内预测或使用帧间预测(最多一个运动矢量和参考索引)进行解码以预测每个块的样点值的条带。
预测值:在后续数据元素的解码过程中使用的规定值或先前解码的数据元素(例如,样点值或运动矢量)的组合。
简档:本规范的语法的规定子集。
四叉树:一种树,其中父节点可以划分为四个子节点,每个子节点可以成为另一个划分为四个子节点的父节点。
量化参数:解码过程用于缩放变换系数级别的变量。
随机存取:在流起始点以外的点开始比特流解码过程的行为。
随机存取可解码前导(RADL)PU:其中编解码图片为RADL图片的PU。
随机存取可解码前导(RADL)图片:每个VCL NAL单元的nal_unit_type等于RADL_NUT的编解码图片。注意,所有RADL图片都是前导图片。RADL图片不用作相同关联IRAP图片的后续图片的解码过程的参考图片。当field_seq_flag等于0时,所有RADL图片(如果存在)将按解码顺序先于相同关联IRAP图片的所有非前导图片。
随机存取跳过前导(RASL)PU:编解码图片为RASL图片的PU。
随机访问跳过前导(RASL)图片:每个VCL NAL单元的nal_unit_type等于RASL_NUT的编解码图片。注意,所有RASL图片都是相关联CRA图片的前导图片。当相关联CRA图片的NoOutputBeforeRecoveryFlag等于1时,RASL图片不会输出,并且可能无法正确解码,这是由于RASL图片可能包含对比特流中不存在的图片的引用。RASL图片不用作非RASL图片的解码过程的参考图片。当field_seq_flag等于0时,所有RASL图片(如果存在)将按解码顺序先于相同关联CRA图片的所有非前导图片。
光栅扫描:矩形二维图案到一维图案的映射,使得一维图案中的第一个条目是从左至右扫描的二维图案的第一顶行开始的,然后是每个从左至右扫描的图案的第二、第三等行(向下)。
原始字节序列有效载荷(RBSP):一种语法结构,包含封装在NAL单元中的整数个字节,并且其为空或具有包含语法元素的数据位字符串的形式,其后跟RBSP停止位和零个或多个等于0的后续位。
原始字节序列有效载荷(RBSP)停止位:原始字节序列有效载荷(RBSP)中的等于1的位,位于一串数据位之后,可以通过从RBSP末端搜索RBSP停止位(RBSP中的最后一个非零位)来识别RBSP内的末端的位置。
参考索引:参考图片列表的索引。
参考图片:作为短期参考图片、长期参考图片或层间参考图片的图片。注意,参考图片包含可以在后续图片的解码过程中按解码顺序用于帧间预测的样点。
参考图片列表:用于P条带或B条带的帧间预测的参考图片列表。注意,为非IDR图片的每个条带生成两个参考图片列表,参考图片列表0和参考图片列表1。与图片相关联的两个参考图片列表中的所有条目所参考的唯一图片集由所有参考图片组成,这些参考图片可以用于以解码顺序对相关联图片或相关联图片之后的任何图片进行帧间预测。对于P条带的解码处理,仅参考图片列表0用于帧间预测。对于B条带的解码处理,参考图片列表0和参考图片列表1都用于帧间预测。对于I条带的条带数据的解码,没有用于帧间预测的参考图片列表。
参考图片列表0:用于P的帧间预测的参考图片列表或用于B条带的帧间预测的第一参考图片列表。
参考图片列表1:用于B条带的帧间预测的第二参考图片列表。
保留:一个术语,可以用于规定特定语法元素的一些值供ITU-T|ISO/IEC未来使用,并且不应当用于符合本规范本版本的比特流,但可以用于符合ITU T|ISO/IEC对本规范的未来扩展的比特流。
残差:样点或数据元素的预测与其解码值之间的解码差。
缩放:将变换系数级别乘以一个因子得到变换系数的过程。
缩放列表:将每个频率索引与缩放过程的缩放因子相关联的列表。
缩放列表APS:具有用于构建缩放列表的语法元素的APS。
序列参数集(SPS):包含适用于零个或多个完整CLVS的语法元素的语法结构,如由每个图片标头中的语法元素所参考的PPS中找到的语法元素的内容确定的。
应当:用于表示符合本规范的强制性要求的术语。注意,当用于表示对语法元素的值或对通过规定解码过程的操作获得的结果的强制约束时,编码器有责任确保满足约束。当参考解码过程执行的操作使用时,产生与本规范中描述的解码过程输出的相同裁剪解码图片的任何解码过程都符合本规范的解码过程要求。本文档中使用该术语只是为了强调编解码标准采用该要求的示例实施例,而不是限制所公开技术的范围。
短期参考图片(STRP):nuh_layer_id等于当前图片的nuh_layer_id并标记为“用于短期参考”的图片。
应该:一个术语,用于指代在预期的正常情况下鼓励遵循的实施的行为,但不是符合本规范的强制性要求。本文档中使用该术语只是为了强调编解码标准采用该要求的示例实施例,而不是限制所公开技术的范围。
条带:仅包含在单个NAL单元中的图片的片内的整数个完整片或整数个连续完整CTU行。
条带标头:编解码条带的一部分,包含与条带中表示的片内的所有片或CTU行相关的数据元素。
来源:编码前用于描述视频材料或其某些属性的术语。
起始代码前缀:嵌入字节流中作为每个NAL单元的前缀的等于0x000001的三个字节的唯一序列。注意,起始代码前缀的位置可以由解码器用于识别新NAL单元的开始和先前NAL单元的结束。通过包含仿真防止字节,可以防止NAL单元内起始代码前缀的模拟。
逐步时域子层访问(STSA)PU:其中编解码图片为STSA图片的PU。
逐步时域子层访问(STSA)图片:每个VCL NAL单元的nal_unit_type等于STSA_NUT的编解码图片。注意,对于帧间预测参考,STSA图片不使用与STSA图片具有相同TemporalId的图片。对于帧间预测参考,以与STSA图片具有相同的TemporalId的解码顺序的STSA图片之后的图片不使用以与STSA图片具有相同的TemporalId的解码顺序的STSA图片之前的图片。STSA图片使得能够在STSA图片处从紧邻的较低子层向上切换到包含STSA图片的子层。STSA图片的TemporalId必须大于0。
数据位串(SODB):表示原始字节序列有效载荷停止位之前的原始字节序列有效载荷内存在的语法元素的一些位数的序列,其中最左边的位被视为第一位和最高有效位,并且最右边的位被视为最后一位和最低有效位。
子比特流提取过程:一种规定过程,通过该过程,从比特流中删除不属于目标集(由目标OLS索引和目标最高TemporalId确定)的比特流中的NAL单元,其中输出子比特流由属于目标集的比特流中的NAL单元组成。
子层:时域可伸缩比特流的时域可伸缩层,由具有TemporalId变量的特定值的VCLNAL单元和相关联的非VCL NAL单元组成。
子层表示:由特定子层和较低子层的NAL单元组成的比特流子集。
子图片:图片内的一个或多个条带的矩形区域。
子图片级条带索引:当rect_slice_flag等于1时,按照PPS中信令通知的顺序的条带到子图片中的条带列表的索引。
补充增强信息(SEI)消息:具有规定语义的语法结构,其传递解码过程不需要的信息,以确定解码图片中的样点的值。
语法元素:比特流中表示的数据元素。
语法结构:以规定顺序一起出现在比特流中的零个或多个语法元素。
三元划分:将样点的矩形MxN块划分为三个块,其中垂直划分产生第一个(M/4)xN块、第二个(M/2)xN块、第三个(M/4)xN块,并且水平划分产生第一个Mx(N/4)块、第二个Mx(N/2)块、第三个Mx(N/4)块。
层级:对比特流中语法元素的值施加的规定类别的级别约束,其中级别约束嵌套在层级中,并且符合某个层级和级别的解码器将能够对符合该级别的同一层级或更低层或该级别下的任何级别的所有比特流进行解码。
片:图片中的特定片列和特定片行内的CTU的矩形区域。
片列:CTU的矩形区域,其高度等于图片的高度,并且宽度由图片参数集中的语法元素规定。
片行:CTU的矩形区域,其高度由图片参数集中的语法元素规定,并且宽度等于图片的宽度。
片扫描:分割图片的CTU的特定序列顺序,其中CTU在片中的CTU光栅扫描中连续排序,而图片中的片在图片的片的光栅扫描中连续排列。
后续图片:以输出顺序跟随相关联IRAP图片的非IRAP图片,且不是STSA图片。注意,与IRAP图片相关联的后续图片也按照解码顺序跟随IRAP图片。不允许以输出顺序跟随相关联IRAP图片且以解码顺序在相关联IRAP图片之前的图片。
变换:解码过程的一部分,通过该部分将变换系数的块转换为空域值的块。
变换块:解码过程中根据变换产生的矩形MxN样点块。
变换系数:在解码过程中,与变换中的特定一维频率索引或二维频率索引相关联被认为处于频域中的标量。
变换系数级别:一个整数,表示在计算变换系数值的缩放之前,在解码过程中与特定的二维频率索引相关联的值。
变换单元(TU):当对亮度和色度使用单个编解码单元树时,图片的亮度样点的变换块和色度样点的两个对应变换块;或者,当对亮度和色度使用两个单独的编解码单元树时,亮度样点的变换块或色度样点的两个变换块,以及用于变换变换块样点的语法结构。
树:具有唯一根节点的有限节点集的树。
未规定:一个术语,可以用于规定特定语法元素的一些值,以指示这些值在本规范中没有规定的含义,并且在将来不会作为本规范的未来版本的组成部分而具有规定的含义。
视频编解码层(VCL)NAL单元:编解码条带NAL单元和NAL单元子集的统称,这些NAL单元具有在本规范中被分类为VCL NAL单元的nal_unit_type的保留值。
一些示例比特流和图片格式、分区、扫描过程和邻近关系被描述如下。
6.3图片、子图片、条带、片和CTU的分区
6.3.2块、四叉树和多类型树结构
样点以CTB为单位进行处理。每个亮度CTB在宽度和高度上的阵列尺寸都是CtbSizeY(以样点为单位)。每个色度CTB的阵列的宽度和高度分别为CtbWidthC和CtbHeightC(以样点为单位)。
每个CTB被指派一个分割信令,以识别用于帧内预测或帧间预测以及变换编解码的块尺寸。分割是递归四叉树分割。四叉树的根与CTB相关联。四叉树被划分,直到到达叶,这被称为四叉树叶。当分量宽度不是CTB尺寸的整数倍时,则右侧分量边界处的CTB不完整。当分量高度不是CTB尺寸的整数倍时,底部分量边界处的CTB不完整。
编解码块是两个树(预测树和变换树)的根节点。预测树规定预测块的位置和尺寸。变换树规定变换块的位置和尺寸。亮度和色度的划分信息对于预测树是相同的,并且对于变换树可能相同也可能不相同。
块和相关联语法结构被分组为“单元”结构,如下所示:
–一个变换块(单色图片或separate_colour_plane_flag等于1)或三个变换块(4:2:0、4:2:2或4:4:4颜色格式的图片的亮度和色度分量)以及相关联的变换语法结构单元与变换单元相关联。
–一个编解码块(单色图片或separate_colour_plane_flag等于1)或三个编解码块(亮度和色度),相关联的编解码语法结构和相关联的变换单元与编解码单元关联。
–一个CTB(单色图片或separate_colour_plane_flag等于1)或三个CTB(亮度和色度),相关联的编解码树语法结构和相关联的编解码单元与CTU相关联。
7语法和语义
7.3表格形式的语法
7.3.1 NAL单元语法
7.3.1.1通用NAL单元语法
Figure BDA0003793174210000191
7.3.1.2 NAL单元标头语法
Figure BDA0003793174210000192
7.3.2原始字节序列有效载荷、后续位和字节对齐语法
7.3.2.1解码能力信息RBSP语法
Figure BDA0003793174210000201
7.3.2.2视频参数集RBSP语法
Figure BDA0003793174210000202
Figure BDA0003793174210000211
Figure BDA0003793174210000221
7.3.2.3序列参数集RBSP语法
Figure BDA0003793174210000222
Figure BDA0003793174210000231
Figure BDA0003793174210000241
Figure BDA0003793174210000251
Figure BDA0003793174210000261
Figure BDA0003793174210000271
Figure BDA0003793174210000281
7.3.2.4图片参数集RBSP语法
Figure BDA0003793174210000282
Figure BDA0003793174210000291
Figure BDA0003793174210000301
Figure BDA0003793174210000311
7.3.2.5自适应参数集RBSP语法
Figure BDA0003793174210000312
Figure BDA0003793174210000321
7.3.2.6图片标头RBSP语法
Figure BDA0003793174210000322
7.3.2.7图片标头结构语法
Figure BDA0003793174210000323
Figure BDA0003793174210000331
Figure BDA0003793174210000341
Figure BDA0003793174210000351
Figure BDA0003793174210000361
7.3.2.8补充增强信息RBSP语法
Figure BDA0003793174210000362
7.3.2.9 AU分隔符RBSP语法
Figure BDA0003793174210000363
7.3.2.10序列RBSP语法的结尾
end_of_seq_rbsp(){ 描述符
}
7.3.2.11比特流RBSP语法的结尾
end_of_bitstream_rbsp(){ 描述符
}
7.4语义
7.4.1概述
与语法结构以及与这些结构中的语法元素相关联的语义在本节中规定。当使用表格或一组表格规定语法元素的语义时,除非本规范中另有规定,否则表格中未规定的任何值不应当出现在比特流中。
7.4.2 NAL单元语义
7.4.2.1通用NAL单元语义
NumBytesInNalUnit以字节为单位规定NAL单元的尺寸。NAL单元的解码需要此值。NAL单元边界的某种形式的划界有必要实现对NumBytesInNalUnit的推断。字节流格式的一种这样的划界方法。可以在本规范之外规定其他划界方法。
注1–视频编解码层(VCL)被规定为有效地表示视频数据的内容。NAL被规定为格式化该数据并以适合在各种通信信道或存储介质上传递的方式提供标头信息。所有数据都包含在NAL单元中,每个NAL单元包含整数个字节。NAL单元规定一种通用格式,用于面向数据包和比特流系统。面向数据包的传输和字节流的NAL单元的格式是相同的,只是每个NAL单元前面可以在字节流格式中以起始代码前缀和额外填充字节开头。
rbsp_byte[i]是RBSP的第i个字节。RBSP被规定为有序的字节序列,如下所示:
RBSP包含一串数据位(SODB),如下所示:
–如果SODB为空(即长度为零位),则RBSP也为空。
–否则,RBSP包含SODB,如下所示:
1)RBSP的第一个字节包含SODB的第一个(最有效、最左边)八位;RBSP的下一个字节包含SODB的下个八位,以此类推,直到剩下的SODB少于八位为止。
2)rbsp_trailing_bits()语法结构位于SODB之后,如下所示:
i)最后的RBSP字节的第一(最有效、最左边)位包含SODB的其余位(如果有)。
ii)下一位由等于1的单个位组成(即rbsp_stop_one_bit)。
iii)当rbsp_stop_one_bit不是字节对齐字节的最后一位时,会出现一个或多个零值位(即rbsp_alignment_zero_bit的实例)以导致字节对齐。
3)在某些RBSP中,在RBSP结尾处的rbsp_training_bits()之后,可能存在一个或多个等于0x0000的cabac_zero_word 16位语法元素。
语法表中使用“_rbsp”后缀表示具有这些RBSP属性的语法结构。这些结构作为rbsp_byte[i]数据字节的内容在NAL单元中承载。RBSP语法结构与NAL单位的关联如表5所规定。
注2–当RBSP的边界已知时,解码器可以通过串联RBSP字节的位并丢弃rbsp_stop_one_bit(等于1的最后一个(最低有效,最右边)位)以及丢弃等于0的其后的任何跟随(较低有效,更靠右)位来从RBSP提取SODB。解码过程所需的数据被包含在RBSP的SODB部分中。
emulation_prevention_three_byte是等于0x03的字节。当NAL单元中存在emulation_prevention_three_byte时,其应当被解码过程丢弃。
NAL单元的最后一个字节不应等于0x00。
在NAL单元内,以下三字节序列不应当出现在任何字节对齐位置:
–0x000000
–0x000001
–0x000002
在NAL单元内,除以下序列外,以0x000003开头的任何四字节序列不应当出现在任何字节对齐位置:
–0x00000300
–0x00000301
–0x00000302
–0x00000303
7.4.2.2 NAL单元标头语义
forbidden_zero_bit应等于0。
nuh_reserved_zero_bit应等于0。nuh_reserved_zero_bit的值1可能在将来由ITU-T|ISO/IEC规定。解码器应忽略(即从比特流中删除并丢弃)nuh_reserved_zero_bit等于1的NAL单元。
nuh_layer_id规定VCL NAL单元所属层的标识符或非VCL NAL单元所应用层的标识符。nuh_layer_id的值应在0到55(含)的范围内。nuh_layer_id的其他值被保留以供ITU-T|ISO/IEC将来使用。
对于编解码图片的所有VCL NAL单元,nuh_layer_id的值应当相同。编解码图片或PU的nuh_layer_id的值是编解码图片或PU的VCL NAL单元的nuh_layer_id的值。
AUD、PH、EOS和FD NAL单元的nuh_layer_id值受以下约束:
–如果nal_unit_type等于AUD_NUT,nuh_layer_id应等于vps_layer_id[0]。
–否则,当nal_unit_type等于PH_NUT、EOS_NUT或FD_NUT时,nuh_layer_id应等于相关联VCL NAL单元的nuh_layer_id。
注1–DCI、VPS和EOB NAL单元的nuh_layer_id值不受限制。
对于CVSS AU的所有图片,nal_unit_type的值应相同。
nal_unit_type规定NAL单元类型,即表5中规定的NAL单元中包含的RBSP数据结构的类型。
nal_unit_type在UNSPEC_28…UNSPEC_31(含)范围内的NAL单元(未规定语义)不应影响本规范中规定的解码过程。
注2–UNSPEC_28…UNSPEC_31(含)范围内的NAL单元类型可以如通过应用确定来使用。本规范中未规定nal_unit_type的这些值的解码过程。由于不同的应用可能出于不同的目的使用这些NAL单元类型,因此在设计使用这些nal_unit_type值生成NAL单元的编码器时,以及在设计使用这些nal_unit_type值解释NAL单元内容的解码器时,必须特别小心。本规范未定义对这些值的任何管理。这些nal_unit_type值可能仅适用于以下上下文中:使用“冲突”(即,相同nal_unit_type值的NAL单元内容含义的不同定义)不重要、不可能或在控制应用或传输规范中受管理(例如定义或管理),或者通过控制比特流分布的环境。
出于除以下目的外的目的:确定比特流解码器的DU中的数据量应忽略(从比特流中删除并丢弃)使用nal_unit_type保留值的所有NAL单元的内容。
注3–此要求允许将来定义本规范的可兼容扩展。
表5–NAL单元类型代码和NAL单元类型类别
Figure BDA0003793174210000401
Figure BDA0003793174210000411
注4–清洁随机存取(CRA)图片可能具有比特流中存在的相关联的RASL或RADL图片。
注5–具有等于IDR_N_LP的nal_unit_type的瞬时解码刷新(IDR)图片在比特流中没有相关联的前导图片。nal_unit_type等于IDR_W_RADL的IDR图片没有在比特流中存在的相关联的RASL图片,但在比特流中可能有相关联的RADL图片。
对于任何特定图片的VCL NAL单元,以下内容适用:
–如果mixed_nalu_types_in_pic_flag等于0,则对于图片的所有编解码条带NAL单元,nal_unit_type的值应相同。图片或PU被称为具有与图片或PU的编解码条带NAL单元相同的NAL单元类型。
–否则(mixed_nalu_types_in_pic_flag等于1),图片中一个或多个子图片的VCLNAL单元都有一个nal_unit_type的特定值,该值等于STSA_NUT、RADL_NUT、RASL_NUT、IDR_W_RADL、IDR_N_LP或CRA_NUT,而图片中的其他VCL NAL单元都有一个不同的nal_unit_type的特定值,该值等于TRAIL_NUT、RADL_NUT或RASL_NUT。
对于单层比特流,以下约束适用:
–除了按解码顺序的比特流中的第一张图片之外,每个图片都被认为与按解码顺序的前一张IRAP图片相关联。
–当图片是IRAP图片的前导图片时,其应为RADL图片或RASL图片。
–当图片是IRAP图片的后续图片时,其不应是RADL图片或RASL图片。
–与IDR图片相关联的比特流中不应当存在RASL图片。
–与nal_unit_type等于IDR_N_LP的IDR图片相关联的比特流中不应当存在RADL图片。
注6:如果每个参数集在被引用时可用(在比特流中或通过本规范中未规定的外部方式),则可以通过丢弃IRAP PU之前的所有PU在IRAP PU位置执行随机访问(并以解码顺序正确解码IRAP图片和所有后续非RASL图片)。
–解码顺序中位于IRAP图片之前的任何图片应当在输出顺序中位于IRAP图片之前,并且应当在输出顺序中位于与IRAP图片相关联的任何RADL图片之前。
–与CRA图片相关联的任何RASL图片应当在输出顺序中位于与CRA图片相关联的任何RADL图片之前。
–任何与CRA图片相关联的RASL图片应当在输出顺序中紧跟在解码顺序中位于CRA图片之前的任何IRAP图片之后。
–如果field_seq_flag等于0,并且当前图片是与IRAP图片相关联的前导图片,则其应当在解码顺序中位于与同一IRAP图片相关联的所有非前导图片之前。否则,令picA和picB分别是与IRAP图片相关联的解码顺序中的第一个和最后一个前导图片,在解码顺序中picA之前最多应有一个非前导图片,并且在解码顺序中picA和picB之间不应有非前导图片。
num_temporal_id_plus1减1规定NAL单元的时域标识符。
nuh_temporal_id_plus1的值不应等于0。
按照如下方式推导变量TemporalId:
TemporalId=nuh_temporal_id_plus1-1 (36)
当nal_unit_type在IDR_W_RADL到RSV_IRAP_12(含)的范围内时,TemporalId应等于0。
当nal_unit_type等于STSA_NUT且vps_independent_layer_flag[GeneralLayerIdx[nuh_layer_id]]等于1时,TemporalId不应等于0。
对于AU的所有VCL NAL单元,TemporalId的值应相同。编解码图片PU或AU的TemporalId值是编解码图片PU或AU的VCL NAL单元的TemporalId值。子层表示的TemporalId值是子层表示中所有VCL NAL单元的TemporalId的最大值。
非VCL NAL单元的TemporalId值受以下约束:
–如果nal_unit_type等于DCI_NUT、VPS_NUT或SPS_NUT,则TemporalId应等于0,且包含NAL单元的AU的TemporalId应等于0。
-否则,如果nal_unit_type等于PH_NUT,则TemporalId应等于包含NAL单元的PU的TemporalId。
–否则,如果nal_unit_type等于EOS_NUT或EOB_NUT,则TemporalId应等于0。
–否则,如果nal_unit_type等于AUD_NUT、FD_NUT、PREFIX_SEI_NUT或SUFFIX_SEI_NUT,则TemporalId应等于包含NAL单元的AU的TemporalId。
–否则,当nal_unit_type等于PPS_NUT、PREFIX_APS_NUT或SUFFIX_APS_NUT时,TemporalId应大于或等于包含NAL单元的PU的TemporalId。
注7-当NAL单元为非VCL NAL单元时,TemporalId的值等于非VCL NAL单元适用的所有AU的TemporalId值的最小值。当nal_unit_type等于PPS_NUT、PREFIX_APS_NUT或SUFFIX_APS_NUT时,TemporalId可以大于或等于包含AU的TemporalId,这是由于所有PPS和APS都可以被包括在比特流的开头(例如,当它们被传送出带,并且接收器将它们放置在比特流的开头),其中第一个编解码图片的TemporalId等于0。
7.4.2.3在RBSP内封装SODB(信息性)
本条款不形成本规范的组成部分。
出于以下目的,描述了RBSP内SODB的封装形式以及在NAL单元内使用RBSP的封装的emulation_prevention_three_byte:
–防止在NAL单元内模拟启动代码,同时允许在NAL单元内表示任意SODB,
–通过在RBSP中搜索从RBSP结尾开始的rbsp_stop_one_bit,使得能够识别NAL单元内的SODB结尾,
–在某些情况下(使用一个或多个cabac_zero_word语法元素),使得能够NAL单元的尺寸大于SODB的尺寸。
编码器可以通过以下程序从RBSP产生NAL单元:
1.在RBSP数据中搜索以下二进制模式的字节对齐位:
‘00000000 00000000 000000xx’(其中’xx’表示任何两位模式:“00”、“01”、“10”或“11”),
并插入等于0x03的字节,以将位模式替换为模式:
'00000000 00000000 00000011 000000xx',
并且最后,当RBSP数据的最后一个字节等于0x00时(仅当RBSP以cabac_zero_word结尾时才会出现),将等于0x03的最后一个字节附加到数据的结尾。在RBSP数据中搜索具有上面规定的二进制模式的字节对齐位的下一次出现时,将考虑RBSP中字节对齐的三字节序列0x000000的最后一个零字节(其被替换为四字节序列0x00000300)。
2.生成的字节序列然后以NAL单元标头为前缀,其中nal_unit_type指示NAL单元中RBSP数据结构的类型。
上面规定的过程导致整个NAL单元的构造。
此过程可以允许在NAL单元中表示任何SODB,同时确保以下两项:
–NAL单元内未模拟字节对齐的起始代码前缀。
–在NAL单元内,无论字节对齐方式如何,都不会模拟8个零值位后跟起始代码前缀的序列。
7.4.2.4比特流中NAL单元的顺序
7.4.2.4.1概述
条款7.4.2.4的子条款规定了对比特流中NAL单元顺序的限制。
比特流中服从这些约束的NAL单元的任何顺序在本文中被称为NAL单元的解码顺序。
在NAL单元内,条款7.3和D.2条中的语法规定了语法元素的解码顺序。当本规范中规定的NAL单元中包括了ITU-T H.SEI|ISO/IEC 23002-7中规定的VUI参数或任何SEI消息时,ITU-T H.SEI|ISO/IEC 23002-7中规定的VUI参数或SEI消息的语法规定了那些语法元素的解码顺序。解码器应能够按照解码顺序接收NAL单元及其语法元素。
7.4.2.4.2 AU的顺序及其与CVS的关联
比特流由一个或多个CVS组成。
CVS由一个或多个AU组成。条款7.4.2.4.3中描述了PU的顺序及其与AU的关联。
CVS的第一个AU是CVSS AU,其中,每个当前PU是CLVSS PU,其是NoOutputBeforeRecoveryFlag等于1的IRAP PU或NoOutputBeforeRecoveryFlag等于1的GDR PU。
对于CVS中存在的每一层,每个CVSS AU应具有PU。
比特流一致性要求,当存在时,包含EOS NAL单元的AU之后的下一个AU应为CVSSAU。
7.4.2.4.3 PU的顺序及其与AU的关联
AU由一个或多个PU按nuh_layer_id的递增顺序组成。条款7.4.2.4.4中描述了NAL单元和编解码图片的顺序及其与PU的关联。
AU中最多可以有一个AUD NAL单元。当AUD NAL单元存在于AU中时,它应为AU的第一个NAL单元,并且因此,它是AU的第一个PU的第一个NAL单元。
AU中最多可以有一个EOB NAL单元。当EOB NAL单元存在于AU中时,它应为AU的最后一个NAL单元,并且因此,它是AU的最后一个PU的最后一个NAL单元。
当VCL NAL单元是PH NAL单元之后的第一个VCL NAL单元且以下一个或多个条件成立时,VCL NAL单元是AU的第一个VCL NAL单元(并且因此,包含VCL NAL单元的PU是AU的第一个PU):
-VCL NAL单元的nuh_layer_id的值小于解码顺序中前一张图片的nuh_layer_id。
–VCL NAL单元的ph_pic_order_cnt_lsb的值在解码顺序上不同于前一张图片的ph_pic_order_cnt_lsb。
–为VCL NAL单元推导的PicOrderCntVal在解码顺序上不同于前一张图片的PicOrderCntVal。
设FirstVclNalUnitInAu为AU的第一个VCL NAL单元。在firstVclNalUnitInAu之前以及在firstVclNalUnitInAu之前的最后一个VCL NAL单元(如果有)之后的以下任何NAL单元中的第一个规定了新AU的开始:
–AUD NAL单元(如果存在),
–DCI NAL单元(如果存在),
–VPS NAL单元(如果存在),
–SPS NAL单元(如果存在),
–PPS NAL单元(如果存在),
–前缀APS NAL单元(如果存在),
–PH NAL单元(如果存在),
–前缀SEI NAL单元(如果存在),
–nal_unit_type等于RSV_NVCL_26的NAL单元(如果存在),
–nal_unit_type在UNSPEC28..UNSPEC29范围内的NAL单元(如有)。
注:在firstVclNalUnitInAu之前和在firstVclNalUnitInAu之前的最后一个VCLNAL单元之后的第一个NAL单元(如有)只能是上面列出的NAL单元之一。
比特流一致性的一个要求是,当存在时,在属于同一层且包含EOS NAL单元的PU之后的特定层的下一个PU应为CLVSS PU,其是NoOutputBeforeRecoveryFlag等于1的IRAP PU或NoOutputBeforeRecoveryFlag等于1的GDR PU。
7.4.2.4.4 NAL单元和编解码图片的顺序及其与PU的关联
PU由零个或一个PH NAL单元、一个编解码图片(包括一个或多个VCL NAL单元)以及零个或多个其他非VCL NAL单元组成。VCL NAL单元与编解码图片的关联在条款7.4.2.4.5中描述。
当图片由多于一个VCL NAL单元组成时,PU中应存在PH NAL单元。
如果PU中存在PH NAL单元,则图片的第一VCL NAL单元是按照图片的解码顺序跟随PH NAL单元的第一VCL NAL单元。否则(PU中不存在PH NAL单元),图片的第一个VCL NAL单元是图片的唯一VCL NAL单元。
PU内非VCL NAL单元(AUD和EOB NAL单元除外)的顺序应遵守以下约束:
–当PU中存在PH NAL单元时,它应位于PU的第一个VCL NAL单元之前。
–当任何DCI NAL单元、VPS NAL单元、SPS NAL单元、PPS NAL单元、前缀APS NAL单元、前缀SEI NAL单元、nal_unit_type等于RSV_NVCL_26的NAL单元、或nal_unit_type在UNSPEC_28..UNSPEC_29范围内的NAL单元存在于PU中时,它们不应跟随PU的最后一个VCLNAL单元。
–当任何DCI NAL单元、VPS NAL单元、SPS NAL单元或PPS NAL单元存在于PU中时,它们应位于PU的PH NAL单元(如果存在)之前,并应位于PU的第一个VCL NAL单元之前。
–nal_unit_type等于SUFFIX_APS_NUT、SUFFIX_SEI_NUT、FD_NUT或RSV_NVCL_27、或在UNSPEC_30..UNSPEC_31范围内的PU中的NAL单元不应位于PU的第一个VCL NAL单元之前。
–当EOS NAL单元存在于PU中时,它应是除EOB NAL单元(存在时)以外的所有NAL单元中的最后一个NAL单元。
7.4.2.4.5 VCL NAL单元的顺序及其与编解码图片的关联
编解码图片内VCL NAL单元的顺序受以下约束:
–对于编解码图片的任何两个编解码条带NAL单元A和B,设subpicIdxA和subpicIdxB为其子图片级索引值,并且sliceAddrA和sliceddrB为其slice_address值。
–当以下任一条件为真时,编解码条带NAL单元A应位于编解码条带NAL单元B之前:
–subpicIdxA小于subpicIdxB。
–subpicIdxA等于subpicIdxB,并且sliceAddrA小于sliceAddrB。
7.4.3.原始字节序列有效载荷、尾随位和字节对齐语义
7.4.3.1解码能力信息RBSP语义
DCI RBSP可以通过存在于比特流中、包括在比特流的至少第一AU中或通过外部手段提供而对解码器可用。
注1–DCI RBSP中包含的信息对于解码过程的操作不是必需的。
当存在时,比特流中的所有DCI NAL单元应具有相同的内容。
dci_max_sublayers_minus1加1规定可能存在于比特流的每个CVS中的层中的时域子层的最大数目。dci_max_sublayers_minus1的值应在0到6之间,包括0和6。
dci_reserved_zero_bit在符合本规范本版本的比特流中应等于0。dci_reserved_zero_bit的值1被保留以供ITU-T|ISO/IEC将来使用。
dci_num_ptls_minus1加1规定DCI NAL单元中profile_tier_level()语法结构的数目。
比特流一致性的要求是,比特流中的CVS中的每个OLS应符合DCI NAL单元中的至少一个profile_tier_level()语法结构。
注2:DCI NAL单元可以包括PTL信息,可能以多个profile_tier_level()语法结构承载,这些信息共同适用于多个OLS,并且不需要单独包括每个OLS的PTL信息。
等于0的dci_extension_flag规定DCI RBSP语法结构中不存在dci_extension_data_flag语法元素。dci_extension_flag等于1规定DCI RBSP语法结构中存在dci_extension_data_flag语法元素。
dci_extension_data_flag可以有任何值。它的存在和值不会影响解码器与简档的一致性。符合本规范本版本的解码器应忽略所有dci_extension_data_flag语法元素。
7.4.3.2视频参数设置RBSP语义
VPS RBSP在被引用、被包括在至少一个TemporalId等于0的AU中或通过外部方式提供之前应可用于解码过程。
CVS中具有vps_video_parameter_set_id特定值的所有VPS NAL单元应具有相同的内容。
vps_video_parameter_set_id为VPS提供标识符以供其他语法元素引用。vps_video_parameter_set_id的值应大于0。
vps_max_layers_minus1加1规定引用VPS的每个CVS中的最大允许层数。
vps_max_sublayers_minus1加1规定在引用VPS的每个CVS中的层中可能存在的时域子层的最大数目。vps_max_sublayers_minus1的值应在0到6之间(包括0和6)。
vps_all_layers_same_num_sublayers_flag等于1规定每个CVS中引用VPS的所有层的时域子层数目相同。vps_all_layers_same_num_sublayers_flag等于0规定每个CVS中引用VPS的层可能具有或可能不具有相同数目的时域子层。当不存在时,则vps_all_layers_same_num_sublayers_flag的值被推断为等于1。
vps_all_independent_layers_flag等于1规定在不使用层间预测的情况下对CVS中的所有层进行独立编解码。vps_all_independent_layers_flag等于0规定CVS中的一个或多个层可以使用层间预测。当不存在时,vps_all_independent_layers_flag的值被推断为等于1。
vps_layer_id[i]规定第i层的nuh_layer_id值。对于m和n的任意两个非负整数值,当m小于n时,vps_layer_id[m]的值应小于vps_layer_id[n]。
vps_independent_layer_flag[i]等于1规定索引为i的层不使用层间预测。vps_independent_layer_flag[i]等于0规定索引为i的层可以使用层间预测,并且语法元素vps_direct_ref_layer_flag[i][j](j在0到i-1(含)的范围内)存在于VPS中。当不存在时,vps_independent_layer_flag[i]的值被推断为等于1。
vps_direct_ref_layer_flag[i][j]等于0规定索引为j的层不是索引为i的层的直接引用层。vps_direct_ref_layer_flag[i][j]等于1规定索引为j的层是索引为i的层的直接引用层。当vps_direct_ref_layer_flag[i][j](i和j在0到vps_max_layers_minus1(含)的范围内)不存在时,其被推断为等于0。当vps_independent_layer_flag[i]等于0时,在0到i-1(含)的范围内至少应有一个j值,使得vps_direct_ref_layer_flag[i][j]的值等于1。
变量NumDirectRefLayers[i]、DirectRefLayerIdx[i][d]、NumRefLayers[i]、RefLayerIdx[i][r]和LayerUsedAsRefLayerFlag[j]的推导如下:
Figure BDA0003793174210000491
Figure BDA0003793174210000501
按照如下方式推导规定nuh_layer_id等于vps_layer_id[i]的层的层索引的变量GeneralLayerIdx[i]:
for(i=0;i<=vps_max_layers_minus1;i++) (38)
GeneralLayerIdx[vps_layer_id[i]]=i
对于在0到vps_max_layers_minus1(含)范围内的任意两个不同的i和j值,当dependencyFlag[i][j]等于1时,比特流一致性要求适用于第i层的chroma_format_idc和bit_depth_minus8的值应分别等于适用于第j层的chroma_format_idc和bit_depth_minus8的值。
max_tid_ref_present_flag[i]等于1规定语法元素max_tid_il_ref_pics_plus1[i]存在。max_tid_ref_present_flag[i]等于0规定语法元素max_tid_il_ref_pics_plus1[i]不存在。
max_tid_il_ref_pics_plus1[i]等于0规定第i层的非IRAP图片不使用层间预测。max_tid_il_ref_pics_plus1[i]大于0规定,对于解码第i层的图片,没有TemporalId大于max_tid_il_ref_pics_plus1[i]-1的图片用作ILRP。当不存在时,max_tid_il_ref_pics_plus1[i]的值被推断为等于7。
each_layer_is_an_ols_flag等于1规定每个OLS仅包含一个层,并且引用VPS的CVS中的每个层本身是OLS,其中单个包括层是唯一的输出层。each_layer_is_an_ols_flag等于0表示OLS可能包含多个层。如果vps_max_layers_minus1等于0,则each_layer_is_an_ols_flag的值被推断为等于1。否则,当vps_all_independent_layers_flag等于0时,each_layer_is_an_ols_flag的值被推断为等于0。
ols_mode_idc等于0规定VPS规定的OLS总数等于vps_max_layers_minus1+1,第i个OLS包括层索引为0到i(含)的层,并且对于每个OLS,仅输出OLS中的最高层。
ols_mode_idc等于1规定VPS规定的OLS总数等于vps_max_layers_minus1+1,第i个OLS包括层索引为0到i(含)的层,并且对于每个OLS,输出OLS中的所有层。
ols_mode_idc等于2规定VPS规定的OLS总数被显式地信令通知,并且对于每个OLS,输出层被显式地信令通知,并且其他层是OLS的输出层的直接或间接引用层。
ols_mode_idc的值应在0到2(含)的范围内。ols_mode_idc的值3被保留以供ITU-T|ISO/IEC将来使用。
当vps_all_independent_layers_flag等于1且each_layer_is_an_ols_flag等于0时,ols_mode_idc的值被推断为等于2。
num_output_layer_sets_minus1加1规定当ols_mode_idc等于2时VPS规定的OLS的总数。
按照如下方式推导规定VPS规定的OLS总数的变量TotalNumOlss:
if(vps_max_layers_minus1==0)
TotalNumOlss=1
else if(each_layer_is_an_ols_flag||ols_mode_idc==0||ols_mode_idc
==1)
TotalNumOlss=vps_max_layers_minus1+1 (39)
else if(ols_mode_idc==2)
TotalNumOlss=num_output_layer_sets_minus1+1
ols_output_layer_flag[i][j]等于1规定,当ols_mode_idc等于2时,nuh_layer_id等于vps_layer_id[j]的层是第i个OLS的输出层。ols_output_layer_flag[i][j]等于0规定,当ols_mode_idc等于2时,nuh_layer_id等于vps_layer_id[j]的层不是第i个OLS的输出层。
按照如下方式推导规定第i个OLS中的输出层数目的变量NumOutputLayersInOls[i]、规定第i个OLS中第j个层中的子层数目的变量NumSubLayersInLayerInOLS[i][j]、规定第i个OLS中第j个输出层的nuh_layer_id值的变量OutputLayerIdInOLS[i][j]、以及规定第k层是否在至少一个OLS中用作输出层的变量LayerUsedAsOutputLayerFlag[k]:
Figure BDA0003793174210000521
Figure BDA0003793174210000531
对于0到vps_max_layers_minus1(含)范围内的每个i值,LayerUsedAsRefLayerFlag[i]和LayerUsedAsOutputLayerFlag[i]的值不应同时等于0。换句话说,不应存在既不是至少一个OLS的输出层也不是任何其他层的直接引用层的层。
对于每个OLS,至少应有一个作为输出层的层。换句话说,对于0到TotalNumOlss-1(含)范围内的任何i值,NumOutputLayersInOls[i]的值应大于或等于1。
按照如下方式推导规定第i个OLS中的层数的变量NumLayersInOls[i]以及规定第i个OLS中第j个层的nuh_layer_id值的变量LayerIdInOls[i][j]:
Figure BDA0003793174210000532
Figure BDA0003793174210000541
注1–第0个OLS仅包含最低层(即nuh_layer_id等于vps_layer_id[0]的层),并且对于第0个OLS,仅输出包含的层。
按照如下方式推导规定nuh_layer_id等于LayerIdInOls[i][j]的层的OLS层索引的变量OlsLayerIdx[i][j]:
for(i=0;i<TotalNumOlss;i++)
for j=0;j<NumLayersInOls[i];j++) (42)
OlsLayerIdx[i][LayerIdInOls[i][j]]=j
每个OLS中的最低层应为独立层。换句话说,对于0到TotalNumOlss-1(含)范围内的每个i,vps_independent_layer_flag[GeneralLayerIdx[LayerIdInOls[i][0]]的值应等于1。
每个层应被包括在VPS规定的至少一个OLS中。换句话说,对于nuh_layer_id的特定值nuhLayerId等于vps_layer_id[k](对于0到vps_max_layers_minus1(含)范围内的k)中的一个的每个层,应当有至少有一对i和j的值,其中i在0到TotalNumOlss-1(含)的范围内,并且j在NumLayersInOls[i]-1(含)范围内,使得LayerIdInOls[i][j]的值等于nuhLayerId。
vps_num_ptls_minus1加1规定了VPS中profile_tier_level()语法结构的数目。vps_num_ptls_minus1的值应当小于TotalNumOlss。
pt_present_flag[i]等于1规定了VPS中的第i个profile_tier_level()语法结构中存在简档、层级和常规约束信息。pt_present_flag[i]等于0规定VPS中的第i个profile_tier_level()语法结构中不存在简档、层级和常规约束信息。pt_present_flag[0]的值被推断为等于1。当pt_present_flag[i]等于0时,VPS中第i个profile_tier_level()语法结构的简档、层级和常规约束信息被推断为与VPS中的第(i-1)个profile_tier_level()语法结构相同。
ptl_max_temporal_id[i]规定了VPS中第i个profile_tier_level()语法结构中存在级别信息的最高子层表示的TemporalId。ptl_max_temporal_id[i]的值应在0到vps_max_sublayers_minus1(含)的范围内。当vps_max_sublayers_minus1等于0时,ptl_max_temporal_id[i]的值被推断为等于0。当vps_max_sublayers_minus1大于0且vps_all_layers_same_num_sublayers_flag等于1时,ptl_max_temporal_id[i]的值被推断为等于vps_max_sublayers_minus1。
vps_ptl_alignment_zero_bit应等于0。
ols_ptl_idx[i]规定VPS中profile_tier_level()语法结构列表中适用于第i个OLS的profile_tier_level()语法结构的索引。当存在时,ols_ptl_idx[i]的值应在0到vps_num_ptls_minus1(含)的范围内。当vps_num_ptls_minus1等于0时,ols_ptl_idx[i]的值被推断为等于0。
当NumLayersInOls[i]等于1时,适用于第i个OLS的profile_tier_level()语法结构也存在于第i个OLS中的层所引用的SPS中。比特流一致性的一个要求是,当NumLayersInOls[i]等于1时,VPS和SPS中为第i个OLS信令通知的profile_tier_level()语法结构应相同。
vps_num_dpb_params规定VPS中dpb_parameters()语法结构的数目。vps_num_dpb_params的值应在0到16(含)之间。当不存在时,vps_num_dpb_params的值被推断为等于0。
vps_sublayer_dpb_params_present_flag用于控制VPS中dpb_parameters()语法结构中max_dec_pic_buffering_minus1[]、max_num_reorder_pics[]和max_latency_increase_plus1[]语法元素的存在。当不存在时,vps_sub_dpb_params_info_present_flag被推断为等于0。
dpb_max_temporal_id[i]规定最高子层表示的TemporalId,对于该表示,DPB参数可能存在于VPS中的第i个dpb_parameters()语法结构中。dpb_max_temporal_id[i]的值应在0到vps_max_sublayers_minus1(含)的范围内。当vps_max_sublayers_minus1等于0时,dpb_max_temporal_id[i]的值被推断为等于0。当vps_max_sublayers_minus1大于0且vps_all_layers_same_num_sublayers_flag等于1时,dpb_max_temporal_id[i]的值被推断为等于vps_max_sublayers_minus1。
ols_dpb_pic_width[i]规定第i个OLS的每个图片存储缓冲区的宽度,以亮度样点为单位。
ols_dpb_pic_height[i]规定第i个OLS的每个图片存储缓冲区的高度,以亮度样点为单位。
ols_dpb_params_idx[i]规定VPS中dpb_parameters()语法结构列表中,当NumLayersInOls[i]大于1时适用于第i个OLS的dpb_parameters()语法结构的索引。当存在时,ols_dpb_params_idx[i]的值应在0到vps_num_dpb_params-1(含)的范围内。当ols_dpb_params_idx[i]不存在时,ols_dpb_params_idx[i]的值被推断为等于0。
当NumLayersInOls[i]等于1时,适用于第i个OLS的dpb_parameters()语法结构存在于第i个OLS中的层所引用的SPS中。
vps_general_hrd_params_present_flag等于1规定语法结构general_hrd_parameters()和其他HRD参数存在于VPS RBSP语法结构中。等于0的vps_general_hrd_params_present_flag规定语法结构general_hrd_parameters()和其他HRD参数不存在于VPS RBSP语法结构中。当不存在时,vps_general_hrd_params_present_flag的值被推断为等于0。
当NumLayersInOls[i]等于1时,适用于第i个OLS的general_hrd_parameters()语法结构出现在第i个OLS中的层所引用的SPS中。
vps_sublayer_cpb_params_present_flag等于1规定VPS中的第i个ols_hrd_parameters()语法结构包含子层表示的HRD参数,其中TemporalId在0到hrd_max_tid[i](含)之间。vps_sublayer_cpb_params_present_flag等于0规定VPS中的第i个ols_hrd_parameters()语法结构包含子层表示的HRD参数,其中TemporalId仅等于hrd_max_tid[i]。当vps_max_sublayers_minus1等于0时,vps_sublayer_cpb_params_present_flag的值被推断为等于0。
当vps_sublayer_cpb_params_present_flag等于0时,TemporalId在0到hrd_max_tid[i]-1(含)范围内的子层表示的HRD参数被推断为与TemporalId等于hrd_max_tid[i]的子层表示的HRD参数相同。这些包括从fixed_pic_rate_general_flag[i]语法元素开始直到ols_hrd_parameters语法结构中“if(general_vcl_hrd_params_present_flag)”条件下的sublayer_hrd_parameters(i)语法结构的HRD参数。
num_ols_hrd_params_minus1加1规定当vps_general_hrd_params_present_flag等于1时,在general_hrd_parameters()语法结构中存在的ols_hrd_parameters()语法结构的数目。num_ols_hrd_params_minus1的值应在0到TotalNumOlss-1(含)的范围内。
hrd_max_tid[i]规定最高子层表示的TemporalId,对于该表示HRD参数被包含在第i个ols_hrd_parameters()语法结构中。hrd_max_tid[i]的值应在0到vps_max_sublayers_minus1(含)的范围内。当vps_max_sublayers_minus1等于0时,hrd_max_tid[i]的值被推断为等于0。当vps_max_sublayers_minus1大于0且vps_all_layers_same_num_sublayers_flag等于1时,hrd_max_tid[i]的值被推断为等于vps_max_sublayers_minus1。
ols_hrd_idx[i]规定当NumLayersInOls[i]大于1时VPS中ols_hrd_parameters()语法结构列表中适用于第i个OLS的ols_hrd_parameters()语法结构的索引。ols_hrd_idx[[i]的值应在0到num_ols_hrd_params_minus1(含)的范围内。
当NumLayersInOls[i]等于1时,适用于第i个OLS的ols_hrd_parameters()语法结构出现在第i个OLS中的层所引用的SPS中。
如果num_ols_hrd_param_minus1+1的值等于TotalNumOlss,则ols_hrd_idx[i]的值被推断为等于i。否则,当NumLayersInOls[i]大于1且num_ols_hrd_params_minus1等于0时,ols_hrd_idx[i]的值被推断为等于0。
vps_extension_flag等于0规定没有vps_extension_data_flag语法元素存在于VPS RBSP语法结构中。vps_extension_flag等于1规定VPS RBSP语法结构中存在vps_extension_data_flag语法元素。
vps_extension_data_flag可以有任何值。其存在和值不影响解码器与本规范本版本中规定的简档的一致性。符合本规范本版本的解码器应当忽略所有vps_extension_data_flag语法元素。
7.4.3.3序列参数集RBSP语义
SPS RBSP应在被引用、被包括在至少一个AU中(其中TemporalId等于0)或通过外部方式提供之前可用于解码过程。
CVS中具有sps_seq_parameter_set_id特定值的所有SPS NAL单元应具有相同的内容。
sps_seq_parameter_set_id为SPS提供标识符以供其他语法元素参考。
无论nuh_layer_id值是多少,SPS NAL单元都共享sps_seq_parameter_set_id的相同值空间。
设spsLayerId为特定的SPS NAL单元的nuh_layer_id值,并且vclLayerId为特定VCL NAL单元的nuh_layer_id的值。特定的VCL NAL单元不应指代特定的SPS NAL单元,除非spsLayerId小于或等于vclLayerId并且nuh_layer_id等于spsLayerId的层被包括在至少一个OLS中,该OLS包括nuh_layer_id等于vclLayerId的层。
sps_video_parameter_set_id当大于0时,规定SPS引用的VPS的vps_video_parameter_set_id的值。
当sps_video_parameter_set_id等于0时,以下内容适用:
–SPS不指代VPS。
–当对引用SPS的每个CLVS进行解码时,没有VPS被引用。
–vps_max_layers_minus1的值被推断为等于0。
–CVS应当仅包含一个层(即,CVS中的所有VCL NAL单元应具有相同的nuh_layer_id值)。
–GeneralLayerIdx[nuh_layer_id]的值被推断为等于0。
–vps_independent_layer_flag[GeneralLayerIdx[nuh_layer_id]]的值被推断为等于1。
当vps_independent_layer_flag[GeneralLayerIdx[nuh_layer_id]]等于1时,具有特定nuh_layer_id值nuhLayerId的CLVS引用的SPS的nuh_layer_id应等于nuhLayerId。
在CVS中由CLVS引用的所有SPS中,sps_video_parameter_set_id的值应当相同。
sps_max_sublayers_minus1加1规定引用SPS的每个CLVS中可能存在的时域子层的最大数目。sps_max_sublayers_minus1的值应在0到vps_max_sublayers_minus1(含)的范围内。
sps_reserved_zero_4bits在符合本规范本版本的比特流中应等于0。sps_reserved_zero_4bits的其他值被保留以供ITU-T|ISO/IEC将来使用。
sps_ptl_dpb_hrd_params_present_flag等于1规定SPS中存在profile_tier_level()语法结构和dpb_parameters()语法结构,并且SPS中也可能存在general_hrd_parameters()语法结构和ols_hrd_parameters()语法结构。sps_ptl_dpb_hrd_params_present_flag等于0规定SPS中不存在这四个语法结构。sps_ptl_dpb_hrd_params_present_flag的值应等于vps_independent_layer_flag[GeneralLayerIdx[nuh_layer_id]]。
gdr_enabled_flag等于1规定GDR图片可能存在于引用SPS的CLVS中。gdr_enabled_flag等于0规定GDR图片不存在于引用SPS的CLVS中。
chroma_format_idc规定了条款6.2中规定的相对于亮度采样的色度采样。
separate_colour_plane_flag等于1规定4:4:4色度格式的三个颜色分量被分别编解码。separate_colour_plane_flag等于0规定颜色分量不被单独编解码。当separate_colour_plane_flag不存在时,则其被推断为等于0。当separate_colour_plane_flag等于1时,编解码图片由三个单独的分量组成,每个分量由一个颜色平面(Y、Cb或Cr)的编解码样点组成,并使用单色编解码语法。在这种情况下,每个颜色平面都与specific_color_plane_id值相关联。
注1–具有不同color_plane_id值的颜色平面之间的解码过程没有依赖性。例如,具有一个color_plane_id值的单色图片的解码过程不使用来自具有不同color_plane_id值的单色图片的任何数据进行帧间预测。
根据separate_colour_plane_flag的值,按照如下方式分配变量ChromaArrayType的值:
–如果separate_colour_plane_flag等于0,则ChromaArrayType设置为等于chroma_format_idc。
–否则(separate_colour_plane_flag等于1),ChromaArrayType设置为等于0。
res_change_in_clvs_allowed_flag等于1规定图片空域分辨率可能会在引用SPS的CLVS内发生变化。res_change_in_clvs_allowed_flag等于0规定图片空域分辨率在引用SPS的任何CLVS内不会改变。
pic_width_max_in_luma_samples规定引用SPS的每个解码图片的最大宽度,以亮度样点为单位。pic_width_max_in_luma_samples应当不等于0,且应为Max(8,MinCbSizeY)的整数倍。
比特流一致性的一个要求是,对于包含一个或多个引用SPS层的OLS索引i的任何OLS,pic_width_max_in_luma_samples的值应小于或等于ols_dpb_pic_width[i]的值。
pic_height_max_in_luma_samples规定引用SPS的每个解码图片的最大高度,以亮度样点为单位。pic_height_max_in_luma_samples应当不等于0,且应为Max(8,MinCbSizeY)的整数倍。
比特流一致性的一个要求是,对于包含一个或多个引用SPS的层的OLS索引i的任何OLS,pic_height_max_in_luma_samples的值应小于或等于ols_dpb_pic_height[i]的值。
sps_conformance_window_flag等于1指示一致性裁剪窗口偏移参数在SPS中紧跟其后。sps_conformance_window_flag等于0指示SPS中不存在一致性裁剪窗口偏移参数。
sps_conf_win_left_offset、sps_conf_win_right_offset、sps_conf_win_top_offset和sps_conf_win_bottom_offset指定应用于图片的裁剪窗口,其中pic_width_in_luma_samples等于pic_width_max_in_luma_samples且pic_height_in_luma_samples等于pic_height_max_in_luma_samples。当sps_conformance_window_flag等于0时,sps_conf_win_left_offset、sps_conf_win_right_offset、sps_conf_win_top_offset和sps_conf_win_bottom_offset的值被推断为等于0。
一致性裁剪窗口包含亮度样点,其中水平图片坐标从SubWidthC*sps_conf_win_left_offset到pic_width_max_in_luma_samples-(SubWidthC*sps_conf_win_right_offset+1)且垂直图片坐标从SubHeightC*sps_conf_win_top_offset到pic_height_max_in_luma_samples-(SubHeightC*sps_conf_win_bottom_offset+1)(含)。
SubWidthC*(sps_conf_win_left_offset+sps_conf_win_right_offset)的值应小于pic_width_max_in_luma_samples,并且SubHeightC*(sps_conf_win_top_offset+sps_conf_win_bottom_offset)的值应小于pic_height_max_in_luma_samples。
当ChromaArrayType不等于0时,两个色度阵列的对应指定样点是具有图片坐标(x/SubWidthC,y/SubHeightC)的样点,其中(x,y)是指定亮度样点的图片坐标。
注2–一致性裁剪窗口偏移参数仅应用于输出。所有内部解码过程都应用于未裁剪的图片尺寸。
sps_log2_ctu_size_minus5加5规定每个CTU的亮度编解码树块尺寸。sps_log2_ctu_size_minus5的值应在0到2(含)的范围内。sps_log2_ctu_size_minus5的值3被保留以供ITU-T|ISO/IEC将来使用。
变量CtbLog2SizeY和CtbSizeY的推导如下:
CtbLog2SizeY=sps_log2_ctu_size_minus5+5 (43)
CtbSizeY=1<<CtbLog2SizeY (44)
subpic_info_present_flag等于1规定存在CLVS的子图片信息,并且CLVS的每个图片中可能有一个或多个子图片。subpic_info_present_flag等于0规定不存在CLVS的子图片信息,并且CLVS的每个图片中只有一个子图片。
当res_change_in_clvs_allowed_flag等于1时,subpic_info_present_flag的值应等于0。
注3–当比特流是子比特流提取过程的结果,并且仅包含子比特流提取过程的输入比特流的子图片的子集时,可能需要在SPS的RBSP中将subpic_info_present_flag的值设置为等于1。
sps_num_subpics_minus1加1规定CLVS中每个图片中的子图片的数目。sps_num_subpics_minus1的值应在0到Ceil(pic_width_max_in_luma_samples÷CtbSizeY)*Ceil(pic_height_max_in_luma_samples÷CtbSizeY)–1(含)的范围内。当不存在时,则sps_num_subpics_minus1的值被推断为等于0。
sps_independent_subpics_flag等于1规定没有帧内预测、帧间预测和环路滤波操作可以跨CLVS中的任何子图片边界执行。sps_independent_subpics_flag等于0规定可以允许跨CLVS中的子图片边界进行帧间预测或环路滤波操作。当不存在时,sps_independent_subpics_flag的值被推断为等于0。
subpic_ctu_top_left_x[i]规定以CTB尺寸为单位的第i个子图片的左侧顶部CTU的水平位置。语法元素的长度是Ceil(Log2((pic_width_max_in_luma_samples+CtbSizeY-1)>>CtbLog2SizeY))位。当不存在时,subpic_ctu_top_left_x[i]的值被推断为等于0。
subpic_ctu_top_left_y[i]规定以CTB尺寸为单位的第i个子图片的左侧顶部CTU的垂直位置。语法元素的长度是Ceil(Log2((pic_height_max_in_luma_samples+CtbSizeY-1)>>CtbLog2SizeY))位。当不存在时,subpic_ctu_top_left_y[i]的值被推断为等于0。
subpic_width_minus1[i]加1规定第i个子图片的宽度,以CtbSizeY为单位。语法元素的长度是Ceil(Log2((pic_width_max_in_luma_samples+CtbSizeY-1)>>CtbLog2SizeY))位。当不存在时,subpic_width_minus1[i]的值被推断为等于((pic_width_max_in_luma_samples+CtbSizeY-1)>>CtbLog2SizeY)-subpic_ctu_top_left_x[i]-1。
subpic_height_minus1[i]加1规定第i个子图片的高度,以CtbSizeY为单位。语法元素的长度是Ceil(Log2((pic_height_max_in_luma_samples+CtbSizeY-1)>>CtbLog2SizeY))位。当不存在时,subpic_height_minus1[i]的值被推断为等于((pic_height_max_in_luma_samples+CtbSizeY-1)>>CtbLog2SizeY)-subpic_ctu_top_left_y[i]-1。
subpic_treated_as_pic_flag[i]等于1规定CLVS中每个编解码图片的第i个子图片在解码过程中被视为图片,不包括环路滤波操作。subpic_treated_as_pic_flag[i]等于0规定CLVS中每个编解码图片的第i个子图片在解码过程中不被视为图片,不包括环路滤波操作。当不存在时,subpic_treated_as_pic_flag[i]的值被推断为等于sps_independent_subpics_flag。
当subpic_treated_as_pic_flag[i]等于1时,比特流一致性的要求是,在包括包含作为输出层的第i个子图片的层的OLS中,每个输出层及其参考层的以下所有条件均为真:
–输出层及其参考层中的所有图片应具有相同的pic_width_in_luma_samples值和相同的pic_height_in_luma_samples值。
–输出层及其参考层引用的所有SPS应具有相同的sps_num_subpics_minus1值,并且应分别具有相同的subpic_ctu_top_left_x[j]、subpic_ctu_top_left_y[j]、subpic_width_minus1[j]、subpic_height_minus1[j]和loop_filter_across_subpic_enabled_flag[j]值(对于0到sps_num_subpics_minus1(含)的范围内的每个j值)。
–对于0到sps_num_subpics_minus1(含)的范围内的每个j值,输出层及其参考层中每个访问单元中的所有图片应具有相同的SubpicIdVal[j]值。
loop_filter_across_subpic_enabled_flag[i]等于1规定可以跨CLVS中每个编解码图片中的第i个子图片的边界执行环路滤波操作。
loop_filter_across_subpic_enabled_flag[i]等于0固定不跨CLVS中每个编解码图片中的第i个子图片的边界执行环路滤波操作。当不存在时,loop_filter_across_subpic_enabled_pic_flag[i]的值被推断为等于1-sps_independent_subpics_flag。
比特流一致性的一个要求是,子图片的形状应使得每个子图片在被解码时应有由图片边界或先前解码子图片的边界组成的其整个左边界和整个上边界。
sps_subpic_id_len_minus1加1规定用于表示语法元素sps_subpic_id[i]、语法元素pps_subpic_id[i](如果存在)和语法元素slice_subpic_id(如果存在)的位数。sps_subpic_id_len_minus1的值应在0到15(含)之间。1<<(sps_subpic_id_len_minus1+1)的值应大于或等于sps_num_subpics_minus1+1。
subpic_id_mapping_explicitly_signalled_flag等于1规定在SPS或CLVS的编解码图片引用的PPS中显式信令通知子图片ID映射。subpic_id_mapping_explicitly_signalled_flag等于0规定不为CLVS显式信令通知子图片ID映射。当不存在时,subpic_id_mapping_explicitly_signalled_flag的值被推断为等于0。
subpic_id_mapping_in_sps_flag等于1规定当subpic_id_mapping_explicitly_signalled_flag等于1时,在SPS中信令通知子图片ID映射。subpic_id_mapping_in_sps_flag等于0规定当subpic_id_mapping_explicitly_signalled_flag等于1时,在CLVS的编解码图片所引用的PPS中信令通知子图片ID映射。
sps_subpic_id[i]规定第i个子图片的子图片ID。sps_subpic_id[i]语法元素的长度为sps_subpic_id_len_minus1+1位。
bit_depth_minus8规定亮度阵列和色度阵列的样点的位深度BitDepth,以及亮度和色度量化参数范围偏移量的值QpBdOffset,如下所示:
BitDepth=8+bit_depth_minus8 (45)
QpBdOffset=6*bit_depth_minus8 (46)
bit_depth_minus8应在0到8(含)的范围内。
sps_entropy_coding_sync_enabled_flag等于1规定在解码CTU之前调用上下文变量的特定同步过程,该CTU包括引用SPS的每个图片中每个片中的CTB行的第一个CTB,并且在解码CTU之后调用上下文变量的特定存储过程,该CTU包括引用SPS的每个图片中的每个片中的CTB行的第一个CTB。
sps_entropy_coding_sync_enabled_flag等于0规定在解码CTU之前不需要调用上下文变量的特定同步过程,该CTU包括引用SPS的每个图片中的每个片中的CTB行的第一个CTB,并且在解码CTU之后不需要调用上下文变量的特定存储过程,该CTU包括引用SPS的每个图片中的每个片中的CTB行的第一个CTB。
sps_wpp_entry_point_offsets_present_flag等于1规定当sps_entropy_coding_sync_enabled_flag等于1时,CTU行的入口点偏移的信令可能会出现在引用SPS的图片的条带标头中。sps_wpp_entry_point_offsets_present_flag等于0规定在引用SPS的图片的条带标头中不存在CTU行的入口点偏移的信令。当不存在时,sps_wpp_entry_point_offsets_present_flag的值被推断为等于0。
sps_weighted_pred_flag等于1规定加权预测可以被应用于引用SPS的P条带。sps_weighted_pred_flag等于0规定加权预测不被应用于引用SPS的P条带。
sps_weighted_bipred_flag等于1规定显式加权预测可以被应用于引用SPS的B条带。sps_weighted_bipred_flag等于0规定显式加权预测不被应用于引用SPS的B条带。
log2_max_pic_order_cnt_lsb_minus4规定解码过程中用于图片顺序计数的变量MaxPicOrderCntLsb的值,如下所示:
MaxPicOrderCntLsb=2(log2_max_pic_order_cnt_lsb_minus4+4) (47)
log2_max_pic_order_cnt_lsb_minus4的值应在0到12(含)之间。
sps_poc_msb_flag等于1规定ph_poc_msb_present_flag语法元素存在于引用SPS的PH中。sps_poc_msb_flag等于0规定引用SPS的PH中不存在ph_poc_msb_present_flag语法元素。
poc_msb_len_minus1加1规定当出现在引用SPS的PH中时poc_msb_val语法元素的长度(以位为单位)。poc_msb_len_minus1的值应在0到32-log2_max_pic_order_cnt_lsb_minus4-5(含)之间。
num_extra_ph_bits_bytes规定引用SPS的编解码图片的PH语法结构中额外位的字节数。在符合本规范本版本的比特流中,num_extra_ph_bits_bytes的值应等于0。尽管本规范本版本中要求num_extra_ph_bits_bytes的值等于0,但符合本规范本版本的解码器应允许语法中出现num_extra_ph_bits_bytes的值等于1或2。
num_extra_sh_bits_bytes规定引用SPS的编解码图片的条带标头中额外位的字节数。在符合本规范本版本的比特流中,num_extra_sh_bits_bytes的值应等于0。尽管本规范本版本中要求num_extra_sh_bits_bytes的值等于0,但符合本规范本版本的解码器应允许语法中出现num_extra_sh_bits_bytes的值等于1或2。
sps_sublayer_dpb_params_flag用于控制SPS中dpb_parameters()语法结构中的max_dec_pic_buffering_minus1[i]、max_num_reorder_pics[i]和max_latency_increase_plus1[i]语法元素的存在。当不存在时,sps_sub_dpb_params_info_present_flag的值被推断为等于0。
long_term_ref_pics_flag等于0规定没有LTRP用于CLVS中任何编解码图片的帧间预测。long_term_ref_pics_flag等于1规定LTRP可以用于CLVS中的一个或多个编解码图片的帧间预测。
inter_layer_ref_pics_present_flag等于0规定没有ILRP用于CLVS中任何编解码图片的帧间预测。inter_layer_ref_pic_flag等于1规定ILRP可以用于CLVS中一个或多个编解码图片的帧间预测。当sps_video_parameter_set_id等于0时,inter_layer_ref_pics_present_flag的值被推断为等于0。当vps_independent_layer_flag[GeneralLayerIdx[nuh_layer_id]]等于1时,inter_layer_ref_pics_present_flag的值应等于0。
sps_idr_rpl_present_flag等于1规定参考图片列表语法元素存在于IDR图片的条带标头中。sps_idr_rpl_present_flag等于0规定参考图片列表语法元素不存在于IDR图片的条带标头中。
rpl1_same_as_rpl0_flag等于1规定语法元素num_ref_pic_lists_in_sps[1]和语法结构ref_pic_list_struct(1,rplsIdx)不存在,并且以下内容适用:
–num_ref_pic_lists_in_sps[1]的值被推断为等于num_ref_pic_lists_in_sps[0]的值。
–ref_pic_list_struct(1,rplsIdx)中每个语法元素的值被推断为等于rplsIdx的ref_pic_list_struct(0,rplsIdx)中对应语法元素的值,范围从0到num_ref_pic_lists_in_sps[0]-1。
num_ref_pic_lists_in_sps[i]规定包含在SPS中的listIdx等于i的ref_pic_list_struct(listIdx,rplsIdx)语法结构的数目。num_ref_pic_lists_in_sps[i]的值应在0到64(含)之间。
注4–对于listIdx的每个值(等于0或1),由于当前图片的条带标头中可能有直接信令通知的一个ref_pic_list_struct(listIdx,rplsIdx)语法结构,因此解码器应为num_ref_pic_lists_in_sps[i]+1ref_pic_list_struct(listIdx,rplsIdx)语法结构的总数分配内存。
qtbtt_dual_tree_intra_flag等于1规定,对于I条带,每个CTU使用隐式四叉树划分被拆分为具有64×64个亮度样点的编解码单元,并且这些编解码单元是亮度和色度的两个单独编解码树语法结构的根。qtbtt_dual_tree_intra_flag等于0规定单独的编解码树语法结构不用于I条带。当qtbtt_dual_tree_intra_flag不存在时,其被推断为等于0。
log2_min_luma_coding_block_size_minus2加2规定最小亮度编解码块尺寸。log2_min_luma_coding_block_size_minus2的值范围应在0到Min(4,sps_log2_ctu_size_minus5+3)(含)的范围内。
变量MinCbLog2SizeY、MinCbSizeY、IbcBufWidthY、IbcBufWidthC和Vsize的推导如下:
MinCbLog2SizeY=log2_min_luma_coding_block_size_minus2+2 (48)
MinCbSizeY=1<<MinCbLog2SizeY (49)
IbcBufWidthY=256*128/CtbSizeY (50)
IbcBufWidthC=IbcBufWidthY/SubWidthC (51)
VSize=Min(64,CtbSizeY) (52)
MinCbSizeY的值应小于或等于VSize。
按照如下方式推导分别规定每个色度CTB的阵列的宽度和高度的变量CtbWidthC和CtbHeightC:
–如果chroma_format_idc等于0(单色)或separate_colour_plane_flag等于1,则CtbWidthC和CtbHeightC均等于0。
–否则,按照如下方式推导CtbWidthC和CtbHeightC:
CtbWidthC=CtbSizeY/SubWidthC (53)
CtbHeightC=CtbSizeY/SubHeightC (54)
对于范围在0到4(含)之间的log2BlockWidth和范围在0到4(含)之间的log2BlockHeight,使用1<<log2BlockWidth和1<<log2BlockHeight作为输入调用条款6.5.2中规定的右上对角线扫描顺序阵列初始化过程,并将输出分配给DiagScanOrder[log2BlockWidth][log2BlockHeight]。
对于范围在0到6(含)之间的log2BlockWidth和范围在0到6(含)之间的log2BlockHeight,使用1<<log2BlockWidth和1<<log2BlockHeight作为输入调用条款6.5.3中规定的水平和垂直遍历扫描顺序阵列初始化过程,并将输出分配给HorTravScanOrder[log2BlockWidth][log2BlockHeight]和VerTravScanOrder[log2BlockWidth][log2BlockHeight]。
partition_constraints_override_enabled_flag等于1规定在引用SPS的PH中存在partition_constraints_override_flag。partition_constraints_override_enabled_flag等于0规定在引用SPS的PH中不存在partition_constraints_override_flag。
sps_log2_diff_min_qt_min_cb_intra_slice_luma规定由CTU的四叉树划分产生的亮度叶块的亮度样点中最小尺寸的基2对数与条带中亮度CU的亮度样点中最小编解码块尺寸的基2对数之间的默认差值,其中slice_type等于引用SPS的2(I)。当partition_constraints_override_enabled_flag等于1时,默认差值可以由引用SPS的PH中存在的ph_log2_diff_min_qt_min_cb_luma覆盖。sps_log2_diff_min_qt_min_cb_intra_slice_luma的值应在0到CtbLog2SizeY-MinCbLog2SizeY(含)的范围内。按照如下方式推导由CTU的四叉树划分产生的亮度叶块的亮度样点中最小尺寸的基2对数:
MinQtLog2SizeIntraY=sps_log2_diff_min_qt_min_cb_intra_slice_luma+MinCbLog2Size Y(55)
sps_max_mtt_hierarchy_depth_intra_slice_luma规定编解码单元的默认最大层次深度,该编解码单元是由四叉树叶在slice_type等于引用SPS的2(I)的条带中的四叉树划分产生的。当partition_constraints_override_enabled_flag等于1时,默认最大层次深度可以由引用SPS的PH中的ph_max_mtt_hierarchy_depth_intra_slice_luma覆盖。sps_max_mtt_hierarchy_depth_intra_slice_luma的值应在0到2*(CtbLog2SizeY-MinCbLog2SizeY)(含)的范围内。
sps_log2_diff_max_bt_min_qt_intra_slice_luma规定可以使用二元划分的亮度编解码块的亮度样点中的最大尺寸(宽度或高度)的基2对数与亮度叶块的亮度样点中的最小尺寸(宽度或高度)之间的默认差值,亮度叶块是由slice_type等于引用SPS的2(I)的条带中的CTU的四叉树划分产生的。当partition_constraints_override_enabled_flag等于1时,可以通过引用SPS的PH中存在的ph_log2_diff_max_bt_min_qt_luma来覆盖默认差值。sps_log2_diff_max_bt_min_qt_intra_slice_luma的值应在0到CtbLog2SizeY-MinQtLog2SizeIntraY(含)的范围内。当sps_log2_diff_max_bt_min_qt_intra_slice_luma不存在时,sps_log2_diff_max_bt_min_qt_intra_slice_luma的值被推断为等于0。
sps_log2_diff_max_tt_min_qt_intra_slice_luma规定可以使用三元划分的亮度编解码块的亮度样点中的最大尺寸(宽度或高度)的基2对数与亮度叶块的亮度样点中的最小尺寸(宽度或高度)之间的默认差值,亮度叶块是由slice_type等于引用SPS的2(I)的CTU的四叉树划分产生的。当partition_constraints_override_enabled_flag等于1时,可以通过引用SPS的PH中存在的ph_log2_diff_max_tt_min_qt_luma来覆盖默认差值。sps_log2_diff_max_tt_min_qt_intra_slice_luma的值应在0到CtbLog2SizeY-MinQtLog2SizeIntraY(含)的范围内。当sps_log2_diff_max_tt_min_qt_intra_slice_luma不存在时,sps_log2_diff_max_tt_min_qt_intra_slice_luma的值被推断为等于0。
sps_log2_diff_min_qt_min_cb_inter_slice规定由CTU的四叉树划分产生的亮度叶块的亮度样点中最小尺寸的基2对数与条带中的亮度CU的亮度样点中最小亮度编解码块尺寸的基2对数之间的默认差值,其中slice_type等于引用SPS的0(B)或1(P)。当partition_constraints_override_enabled_flag等于1时,默认差值可以由引用SPS的PH中存在的ph_log2_diff_min_qt_min_cb_luma覆盖。sps_log2_diff_min_qt_min_cb_inter_slice的值应在0到CtbLog2SizeY-MinCbLog2SizeY(含)的范围内。由CTU的四叉树划分产生的亮度叶块的亮度样点中最小尺寸的基2对数推导如下:
MinQtLog2SizeInterY=sps_log2_diff_min_qt_min_cb_inter_slice+MinCbLog2SizeY
(56)
sps_max_mtt_hierarchy_depth_inter_slice规定编解码单元的默认最大层次深度,该编解码单元是在slice_type等于引用SPS的0(B)或1(P)的条带中对四叉树叶进行多类型树划分后生成的。当partition_constraints_override_enabled_flag等于1时,默认的最大层次结构深度可以由引用SPS的PH中存在的ph_max_mtt_hierarchy_depth_inter_slice覆盖。sps_max_mtt_hierarchy_depth_inter_slice的值应在0到2*(CtbLog2SizeY-MinCbLog2SizeY)(含)的范围内。
sps_log2_diff_max_bt_min_qt_inter_slice规定可以使用二元划分的亮度编解码块的亮度样点中的最大尺寸(宽度或高度)的基2对数与亮度叶块的亮度样点中的最小尺寸(宽度或高度)之间的默认差值,亮度叶块是由slice_type等于引用0(B)或1(P)的条带中的CTU的四叉树划分产生的。当partition_constraints_override_enabled_flag等于1时,可以通过引用SPS的PH中存在的ph_log2_diff_max_bt_min_qt_luma来覆盖默认差值。sps_log2_diff_max_bt_min_qt_inter_slice的值应在0到CtbLog2SizeY-MinQtLog2SizeInterY(含)的范围内。当sps_log2_diff_max_bt_min_qt_inter_slice不存在时,sps_log2_diff_max_bt_min_qt_inter_slice的值被推断为等于0。
sps_log2_diff_max_tt_min_qt_inter_slice规定可以使用三元划分的亮度编解码块的亮度样点中的最大尺寸(宽度或高度)的基2对数与亮度叶块的亮度样点中的最小尺寸(宽度或高度)之间的默认差值,亮度叶块是在slice_type等于引用SPS的0(B)或1(P)的条带中对CTU进行四叉树划分产生的。当partition_constraints_override_enabled_flag等于1时,可以通过引用SPS的PH中存在的ph_log2_diff_max_tt_min_qt_luma来覆盖默认差值。sps_log2_diff_max_tt_min_qt_inter_slice的值应在0到CtbLog2SizeY-MinQtLog2SizeInterY(含)的范围内。当sps_log2_diff_max_tt_min_qt_inter_slice不存在时,sps_log2_diff_max_tt_min_qt_inter_slice的值被推断为等于0。
sps_log2_diff_min_qt_min_cb_intra_slice_chroma规定从色度CTU的四叉树划分(其中treeType等于DUAL_TREE_CHROMA)产生的色度叶块的亮度样点中最小尺寸的基2对数与slice_type等于引用SPS的2(I)的条带中的treeType等于DUAL_TREE_CHROMA的色度CU的亮度样点中最小编解码块尺寸的基2对数之间的默认差值。当partition_constraints_override_enabled_flag等于1时,可以通过引用SPS的PH中存在的ph_log2_diff_min_qt_min_cb_chroma来覆盖默认差值。sps_log2_diff_min_qt_min_cb_intra_slice_chroma的值应在0到CtbLog2SizeY-MinCbLog2SizeY(含)的范围内。当不存在时,sps_log2_diff_min_qt_min_cb_intra_slice_chroma的值被推断为等于0。由treeType等于DUAL_TREE_CHROMA的CTU的四叉树划分产生的色度叶块的亮度样点中最小尺寸的基2对数推导如下:
MinQtLog2SizeIntraC=sps_log2_diff_min_qt_min_cb_intra_slice_chroma+MinCbLog2SizeY (57)
sps_max_mtt_hierarchy_depth_intra_slice_chroma规定色度编解码单元的默认最大层次深度,该色度编解码单元是由slice_type等于引用SPS的2(I)的条带中的treeType等于DUAL_TREE_CHROMA的色度四叉树叶的多类型树划分产生的。当partition_constraints_override_enabled_flag等于1时,默认的最大层次深度可以由引用SPS的PH中存在的ph_max_mtt_hierarchy_depth_chroma覆盖。sps_max_mtt_hierarchy_depth_intra_slice_chroma的值应在0到2*(CtbLog2SizeY-MinCbLog2SizeY)(含)的范围内。当不存在时,sps_max_mtt_hierarchy_depth_intra_slice_chroma的值被推断为等于0。
sps_log2_diff_max_bt_min_qt_intra_slice_chroma规定可以使用二元划分的色度编解码块的亮度样点中的最大尺寸(宽度或高度)的基2对数与色度叶块的亮度样点中的最小尺寸(宽度或高度)之间的默认差值,色度叶块是由slice_type等于引用SPS的2(I)的条带中treeType等于DUAL_TREE_CHROMA的色度CTU的四叉树划分产生的。当partition_constraints_override_enabled_flag等于1时,可以通过引用SPS的PH中存在的ph_log2_diff_max_bt_min_qt_chroma来覆盖默认差值。sps_log2_diff_max_bt_min_qt_intra_slice_chroma的值应在0到CtbLog2SizeY-MinQtLog2SizeIntraC(含)的范围内。当sps_log2_diff_max_bt_min_qt_intra_slice_chroma不存在时,sps_log2_diff_max_bt_min_qt_intra_slice_chroma的值被推断为等于0。
sps_log2_diff_max_tt_min_qt_intra_slice_chroma规定可以使用三元划分的色度编解码块的亮度样点中的最大尺寸(宽度或高度)的基2对数与slice_type等于引用SPS的2(I)的条带中treeType等于DUAL_TREE_CHROMA的色度CTU的四叉树划分产生的色度叶块的亮度样点中的最小尺寸(宽度或高度)之间的默认差值,当partition_constraints_override_enabled_flag等于1时,可以通过引用SPS的PH中存在的ph_log2_diff_max_tt_min_qt_chroma覆盖默认差值。sps_log2_diff_max_tt_min_qt_intra_slice_chroma的值应当在0到CtbLog2SizeY-MinQtLog2SizeIntraC(含)的范围内。当sps_log2_diff_max_tt_min_qt_intra_slice_chroma不存在时,sps_log2_diff_max_tt_min_qt_intra_slice_chroma的值被推断为等于0。
sps_max_luma_transform_size_64_flag等于1规定亮度样点中的最大变换尺寸等于64。sps_max_luma_transform_size_64_flag等于0规定亮度样点中的最大变换尺寸等于32。
当CtbSizeY小于64时,sps_max_luma_transform_size_64_flag的值应当等于0。
按照如下方式推导变量MinTbLog2SizeY、MaxTbLog2SizeY、MinTbSizeY和MaxTbSizeY:
MinTbLog2SizeY=2 (58)
MaxTbLog2SizeY=sps_max_luma_transform_size_64_flag?6:5 (59)
MinTbSizeY=1<<MinTbLog2SizeY (60)
MaxTbSizeY=1<<MaxTbLog2SizeY (61)
sps_joint_cbcr_enabled_flag等于0规定禁用色度残差的联合编解码。sps_joint_cbcr_enabled_flag等于1规定启用色度残差的联合编解码。当不存在时,sps_joint_cbcr_enabled_flag的值被推断为等于0。
当sps_joint_cbcr_enabled_flag等于1时,same_qp_table_for_chroma等于1规定仅信令通知一个色度QP映射表,并且此表适用于Cb和Cr残差,并且另外还适用于联合Cb-Cr残差。same_qp_table_for_chroma等于0规定,当sps_joint_cbcr_enabled_flag等于1时,在SPS中信令通知色度QP映射表,两个用于Cb和Cr,另一个用于联合Cb-Cr。当比特流中不存在same_qp_table_for_chroma时,same_qp_table_for_chroma的值被推断为等于1。
qp_table_start_minus26[i]加26规定用于描述第i个色度QP映射表的起始亮度和色度QP。qp_table_start_minus26[i]的值应在-26-QpBdOffset到36(含)的范围内。当比特流中不存在qp_table_start_minus26[i]时,qp_table_start_minus26[i]的值被推断为等于0。
num_points_in_qp_table_minus1[i]加1规定用于描述第i个色度QP映射表的点数。num_points_in_qp_table_minus1[i]的值应在0到63+QpBdOffset(含)的范围内。当比特流中不存在num_points_in_qp_table_minus1[0]中时,num_points_in_qp_table_minus1[0]的值被推断为等于0。
delta_qp_in_val_minus1[i][j]规定用于推导第i个色度QP映射表的第j个枢轴点的输入坐标的增量值。当比特流中不存在delta_qp_in_val_minus1[0][j]时,delta_qp_in_val_minus1[0][j]的值被推断为等于0。
delta_qp_diff_val[i][j]规定用于推导第i个色度QP映射表的第j个枢轴点的输出坐标的增量值。
按照如下方式推导第i个色度QP映射表ChromaQpTable[i](对于i=0…numQpTables-1):
Figure BDA0003793174210000721
Figure BDA0003793174210000731
当same_qp_table_for_chroma等于1时,ChromaQpTable[1][k]和ChromaQpTable[2][k]被设置为等于ChromaQpTable[0][k](对于范围为-QpBdOffset到63(含)内的k)。
比特流一致性的要求是qpInVal[i][j]和qpOutVal[i][j]的值应在-QpBdOffset到63(含)的范围内,对于在0到numQpTables-1(含)范围内的i,以及在0到num_points_in_qp_table_minus1[i]+1(含)范围内的j。
sps_sao_enabled_flag等于1规定在去方块滤波过程之后,采样自适应偏移过程被应用于重构图片。sps_sao_enabled_flag等于0规定在去方块滤波过程之后,采样自适应偏移过程不应用于重构图片。
sps_alf_enabled_flag等于0规定禁用跨分量自适应环路滤波器。sps_alf_enabled_flag等于1规定启用自适应环路滤波器。
sps_ccalf_enabled_flag等于0规定禁用跨分量自适应环路滤波器。sps_ccalf_enabled_flag等于1规定可以启用跨分量自适应环路滤波器。
sps_transform_skip_enabled_flag等于1规定transform_skip_flag可能存在于变换单元语法中。sps_transform_skip_enabled_flag等于0规定transform_skip_flag不存在于变换单元语法中。
log2_transform_skip_max_size_minus2规定用于变换跳过的最大块尺寸,并且应在0到3(含)的范围内。
变量MaxTsSize被设置为等于1<<(log2_transform_skip_max_size_minus2+2)。
sps_bdpcm_enabled_flag等于1规定帧内编解码单元的编解码单元语法中可能存在intra_bdpcm_luma_flag和intra_bdpcm_chroma_flag。sps_bdpcm_enabled_flag等于0规定帧内编解码单元的编解码单元语法中不存在intra_bdpcm_luma_flag和intra_bdpcm_chroma_flag。当不存在时,sps_bdpcm_enabled_flag的值被推断为等于0。
sps_ref_wraparound_enabled_flag等于1规定在帧间预测中应用水平环绕运动补偿。sps_ref_wraparound_enabled_flag等于0规定不应用水平环绕运动补偿。当(CtbSizeY/MinCbSizeY+1)的值大于(pic_width_in_luma_samples/MinCbSizeY-1)时,其中pic_width_in_luma_samples是引用SPS的任何PPS中pic_width_in_luma_samples的值,sps_ref_wraparound_enabled_flag的值应等于0。
sps_temporal_mvp_enabled_flag等于1规定可以在CLVS中使用时域运动矢量预测值。sps_temporal_mvp_enabled_flag等于0规定CLVS中不使用时域运动矢量预测值。
sps_sbtmvp_enabled_flag等于1规定基于子块的时域运动矢量预测值可以用于解码图片,其中CLVS中所有条带的slice_type不等于I。sps_sbtmvp_enabled_flag等于0规定CLVS中不使用基于子块的时域运动矢量预测值。当sps_sbtmvp_enabled_flag不存在时,其被推断为等于0。
sps_amvr_enabled_flag等于1规定在运动矢量编解码中使用自适应运动矢量差分辨率。amvr_enabled_flag等于0规定在运动矢量编解码中不使用自适应运动矢量差分辨率。
sps_bdof_enabled_flag等于0规定禁用双向光学流帧间预测。sps_bdof_enabled_flag等于1规定启用双向光学流帧间预测。
sps_bdof_pic_present_flag等于1规定ph_disable_bdof_flag存在于引用SPS的PH中。sps_bdof_pic_present_flag等于0规定在引用SPS的PH中不存在ph_disable_bdof_flag。当sps_bdof_pic_present_flag不存在时,sps_bdof_pic_present_flag的值被推断为等于0。
sps_smvd_enabled_flag等于1规定对称运动矢量差可以用于运动矢量解码。sps_smvd_enabled_flag等于0规定运动矢量编解码中不使用对称运动矢量差。
sps_dmvr_enabled_flag等于1规定启用基于帧间双预测的解码器运动矢量优化。sps_dmvr_enabled_flag等于0规定禁用基于帧间双预测的解码器运动矢量优化。
sps_dmvr_pic_present_flag等于1规定引用SPS的PH中存在ph_disable_dmvr_flag。sps_dmvr_pic_present_flag等于0规定引用SPS的PH中不存在ph_disable_dmvr_flag。当sps_dmvr_pic_present_flag不存在时,sps_dmvr_pic_present_flag的值被推断为等于0。
sps_mmvd_enabled_flag等于1规定启用具有运动矢量差的merge模式。sps_mmvd_enabled_flag等于0指定禁用具有运动矢量差的merge模式。
sps_isp_enabled_flag等于1规定启用具有子分区的帧内预测。sps_isp_enabled_flag等于0规定禁用具有子分区的帧内预测。
sps_mrl_enabled_flag等于1规定启用具有多条参考线的帧内预测。sps_mrl_enabled_flag等于0规定禁用具有多条参考线的帧内预测。
sps_mip_enabled_flag等于1规定启用基于矩阵的帧内预测。sps_mip_enabled_flag等于0规定禁用基于矩阵的帧内预测。
sps_cclm_enabled_flag等于0规定禁用从亮度分量到色度分量的跨分量线性模型帧内预测。sps_cclm_enabled_flag等于1规定启用从亮度分量到色度分量的跨分量线性模型帧内预测。当sps_cclm_enabled_flag不存在时,其被推断为等于0。
sps_chroma_horizontal_collocated_flag等于1规定预测过程以设计用于色度样点位置的方式操作,该位置相对于对应的亮度样点位置不进行水平移动。sps_chroma_horizontal_collocated_flag等于0规定预测过程以针对色度样点位置设计的方式操作,该色度样点位置相对于对应的亮度样点位置以亮度样点为单位向右移动0.5。当sps_chroma_horizontal_collocated_flag不存在时,其被推断为等于1。
sps_chroma_vertical_collocated_flag等于1规定预测过程以针对色度样点位置设计的方式操作,该位置相对于对应的亮度样点位置没有进行垂直移动。sps_chroma_vertical_collocated_flag等于0规定预测过程以针对色度样点位置设计的方式操作,该位置相对于对应的亮度样点位置以亮度样点为单位向下移动0.5。当sps_chroma_vertical_collocated_flag不存在时,其被推断为等于1。
sps_mts_enabled_flag等于1规定序列参数集RBSP语法中存在sps_explicit_mts_intra_enabled_flag,并且序列参数集RBSP语法中存在sps_explicit_mts_inter_enabled_flag。sps_mts_enabled_flag等于0规定sps_explicit_mts_intra_enabled_flag不存在于序列参数集RBSP语法中,并且sps_explicit_mts_inter_enabled_flag不存在于序列参数集RBSP语法中。
sps_explicit_mts_intra_enabled_flag等于1规定mts_idx可能存在于帧内编解码单元语法中。sps_explicit_mts_intra_enabled_flag等于0规定mts_idx在帧内编解码单元语法中不存在。当不存在时,sps_explicit_mts_intra_enabled_flag的值被推断为等于0。
sps_explicit_mts_inter_enabled_flag等于1规定mts_idx可能存在于帧间编解码单元语法中。sps_explicit_mts_inter_enabled_flag等于0规定mts_idx在帧间编解码单元语法中不存在。当不存在时,sps_explicit_mts_inter_enabled_flag的值被推断为等于0。
six_minus_max_num_merge_cand规定从6中减去SPS中支持的最大merging运动矢量预测(MVP)候选数。按照如下方式推导merging MVP候选的最大数目MaxNumMergeCand如下所示:
MaxNumMergeCand=6-six_minus_max_num_merge_cand (63)
MaxNumMergeCand的值应在1到6(含)的范围内。
sps_sbt_enabled_flag等于0规定禁用帧间预测CU的子块变换。sps_sbt_enabled_flag等于1规定启用帧间预测CU的子块变换。
sps_affine_enabled_flag规定基于仿射模型的运动补偿是否可以用于帧间预测。如果sps_affine_enabled_flag等于0,则应限制语法,使得在CLVS中不使用基于仿射模型的运动补偿,并且在CLVS的编解码单元语法中不存在inter_affine_flag和cu_affine_type_flag。否则(sps_affine_enabled_flag等于1),基于仿射模型的运动补偿可以用于CLVS。
five_minus_max_num_subblock_merge_cand规定从5减去SPS中支持的基于子块的merging运动矢量预测候选的最大数目。
sps_affine_type_flag规定基于6参数仿射模型的运动补偿是否可以用于帧间预测。如果sps_affine_type_flag等于0,则应限制语法,使得在CLVS中不使用基于6参数仿射模型的运动补偿,并且CLVS中的编解码单元语法中不存在cu_affine_type_flag。否则(sps_affine_type_flag等于1),可以在CLVS中使用基于6参数仿射模型的运动补偿。当不存在时,sps_affine_type_flag的值被推断为等于0。
sps_affine_amvr_enabled_flag等于1规定在仿射帧间模式的运动矢量编解码中使用自适应运动矢量差分辨率。sps_affine_amvr_enabled_flag等于0规定在仿射帧间模式的运动矢量编解码中不使用自适应运动矢量差分辨率。当不存在时,sps_affine_amvr_enabled_flag的值被推断为等于0。
sps_affine_prof_enabled_flag规定使用光学流的预测优化是否可以用于仿射运动补偿。如果sps_affine_prof_enabled_flag等于0,则仿射运动补偿不应使用光学流进行优化。否则(sps_affine_prof_enabled_flag等于1),仿射运动补偿可以使用光学流进行优化。当不存在时,sps_affine_prof_enabled_flag的值被推断为等于0。
sps_prof_pic_present_flag等于1规定在引用SPS的PH中存在ph_disable_prof_flag。sps_prof_pic_present_flag等于0规定在引用SPS的PH中不存在ph_disable_prof_flag。当sps_prof_pic_present_flag不存在时,sps_prof_pic_present_flag的值被推断为等于0。
sps_palette_enabled_flag等于1规定编解码单元语法中可能存在pred_mode_plt_flag。sps_palette_enabled_flag等于0规定编解码单元语法中不存在pred_mode_plt_flag。当sps_palette_enabled_flag不存在时,其被推断为等于0。
sps_act_enabled_flag等于1规定可以使用自适应颜色变换,并且cu_act_enabled_flag可以出现在编解码单元语法中。sps_act_enabled_flag等于0规定不使用自适应颜色变换,并且编解码单元语法中不存在cu_act_enabled_flag。当sps_act_enabled_flag不存在时,其被推断为等于0。
min_qp_prime_ts_minus4规定变换跳过模式的最小允许量化参数如下所示:
QpPrimeTsMin=4+min_qp_prime_ts_minus4 (64)
min_qp_prime_ts_minus4的值应在0到48(含)的范围内。
sps_bcw_enabled_flag规定是否可以将具有CU权重的双预测用于帧间预测。如果sps_bcw_enabled_flag等于0,则应限制语法,使得在CLVS中不使用CU权重的双预测,并且在CLVS的编解码单元语法中不存在bcw_idx。否则(sps_bcw_enabled_flag等于1),可以在CLVS中使用具有CU权重的双预测。
sps_ibc_enabled_flag等于1规定IBC预测模式可以用于CLVS中图片的解码。sps_ibc_enabled_flag等于0规定在CLVS中不使用IBC预测模式。当sps_ibc_enabled_flag不存在时,其被推断为等于0。
six_minus_max_num_ibc_merge_cand规定从6中减去SPS中支持的IBC merging块矢量预测(BVP)候选的最大数。
按照如下方式推导IBC merging BVP候选的最大数目MaxNumIbcMergeCand:
if(sps_ibc_enabled_flag)
MaxNumIbcMergeCand=6-six_minus_max_num_ibc_merge_cand (65)
else
MaxNumIbcMergeCand=0
sps_ciip_enabled_flag规定ciip_flag可能出现在用于帧间编解码单元的编解码单元语法中。sps_ciip_enabled_flag等于0规定ciip_flag不存在于用于帧间编解码单元的编解码单元语法中。
sps_fpel_mmvd_enabled_flag等于1规定具有运动矢量差的merge模式使用整数样点精度。sps_fpel_mmvd_enabled_flag等于0规定具有运动矢量差的merge模式可以使用分数样点精度。
sps_gpm_enabled_flag规定基于几何分割的运动补偿是否可以用于帧间预测。sps_gpm_enabled_flag等于0规定应约束语法,使得在CLVS中不使用基于几何分割的运动补偿,并且在CLVS的编解码单元语法中不存在merge_gpm_partition_idx、merge_gpm_idx0和merge_gpm_idx1。sps_gpm_enabled_flag等于1规定基于几何分割的运动补偿可以在CLVS中使用。当不存在时,sps_gpm_enabled_flag的值被推断为等于0。
max_num_merge_cand_minus_max_num_gpm_cand规定从MaxNumMergeCand中减去的SPS中支持的几何分割merge模式候选的最大数目。
如果sps_gpm_enabled_flag等于1且MaxNumMergeCand大于或等于3,则按照如下方式推导几何分割merge模式候选的最大数目MaxNumGeoMergeCand:
Figure BDA0003793174210000781
Figure BDA0003793174210000791
MaxNumGeoMergeCand的值应在2到MaxNumMergeCand(含)的范围内。
sps_lmcs_enabled_flag等于1规定在CLVS中使用具有色度缩放的亮度映射。sps_lmcs_enabled_flag等于0规定在CLVS中不使用具有色度缩放的亮度映射。
sps_lfnst_enabled_flag等于1规定lfnst_idx可能存在于帧内编解码单元语法中。sps_lfnst_enabled_flag等于0规定lfnst_idx在帧内编解码单元语法中不存在。
sps_ladf_enabled_flag等于1规定在SPS中存在sps_num_ladf_intervals_minus2、sps_ladf_lowest_interval_qp_offset、sps_ladf_qp_offset[i]和sps_ladf_delta_threshold_minus1[i]。
sps_num_ladf_interval_minus2加1规定SPS中存在的sps_ladf_delta_threshold_minus1[i]和sps_ladf_qp_offset[i]语法元素的数目。sps_num_ladf_intervals_minus2的值应在0到3(含)的范围内。
sps_ladf_lowest_interval_qp_offset规定用于推导条款8.8.3.6.1中规定的变量qP的偏移量。sps_ladf_lowest_interval_qp_offset的值应在-63至63(含)的范围内。
sps_ladf_qp_offset[i]规定用于推导条款8.8.3.6.1中规定的变量qP的偏移阵列。sps_ladf_qp_offset[i]的值应在-63至63(含)的范围内。
sps_ladf_delta_threshold_minus1[i]用于计算SpsLadfIntervalLowerBound[i]的值,该值规定第i个亮度强度级别间隔的下界。sps_ladf_delta_threshold_minus1[i]的值应在0到2BitDepth-3(含)的范围内。
SpsLadfIntervalLowerBound[0]的值被设置为等于0。
对于0到sps_num_ladf_intervals_minus2(含)范围内的每个i值,按照如下方式推导变量SpsLadfIntervalLowerBound[i+1]:
SpsLadfIntervalLowerBound[i+1]=SpsLadfIntervalLowerBound[i] (67)
+sps_ladf_delta_threshold_minus1[i]+1
log2_parallel_merge_level_minus2加2规定变量Log2ParMrgLevel的值,该值用于条款8.5.2.3中规定的空域merging候选的推导过程、条款8.5.5.2中规定的子块merge模式中的运动矢量和参考索引的推导过程、以及用于控制条款8.5.2.1中基于历史的运动矢量预测值列表更新过程的调用。log2_parallel_merge_level_minus2的值应在0到CtbLog2SizeY-2(含)的范围内。按照如下方式推导变量Log2ParMrgLevel:
Log2ParMrgLevel=log2_parallel_merge_level_minus2+2 (68)
sps_scaling_list_enabled_flag等于1规定缩放列表用于变换系数的缩放过程。sps_scaling_list_enabled_flag等于0规定缩放列表不用于变换系数的缩放过程。
sps_dep_quant_enabled_flag等于0规定对引用SPS的图片禁用相关量化。sps_dep_quant_enabled_flag等于1规定可以为引用SPS的图片启用相关量化。
sps_sign_data_hiding_enabled_flag等于0规定对引用SPS的图片禁用符号位隐藏。sps_sign_data_hiding_enabled_flag等于1规定可以为引用SPS的图片启用符号位隐藏。当sps_sign_data_hiding_enabled_flag不存在时,其被推断为等于0。
sps_virtual_boundaries_enabled_flag等于1规定可以在CLVS中的编解码图片中应用禁用跨虚拟边界的环路滤波。sps_virtual_boundaries_enabled_flag等于0规定在CLVS中的编解码图片中不应用禁用跨虚拟边界的环路滤波。环路滤波操作包括去方块滤波器、采样自适应偏移滤波器和自适应环路滤波器操作。
sps_virtual_boundaries_present_flag等于1规定在SPS中信令通知虚拟边界的信息。sps_virtual_boundaries_present_flag等于0规定在SPS中不信令通知虚拟边界的信息。当SPS中有一个或多个虚拟边界信令通知时,在引用SPS的图片中跨虚拟边界禁用环路滤波操作。环路滤波操作包括去方块滤波器、采样自适应偏移滤波器和自适应环路滤波器操作。
比特流一致性的一个要求是,当res_change_in_clvs_allowed_flag的值等于1时,sps_virtual_boundaries_present_flag的值应等于0。
sps_num_ver_virtual_boundaries规定SPS中存在的sps_virtual_boundaries_pos_x[i]语法元素的数目。当sps_num_ver_virtual_boundaries不存在时,其被推断为等于0。
sps_virtual_boundaries_pos_x[i]规定以亮度样点除以8为单位的第i个垂直虚拟边界的位置。sps_virtual_boundaries_pos_x[i]的值应在1到Ceil(pic_width_in_luma_samples÷8)-1(含)的范围内。
sps_num_hor_virtual_boundaries规定SPS中存在的sps_virtual_boundaries_pos_y[i]语法元素的数目。当sps_num_hor_virtual_boundaries不存在时,其被推断为等于0。
当sps_virtual_boundaries_enabled_flag等于1且sps_virtual_boundaries_present_flag等于1时,sps_num_ver_virtual_boundaries和sps_num_hor_virtual_boundaries之和应大于0。
sps_virtual_boundaries_pos_y[i]规定以亮度样点除以8为单位的第i个水平虚拟边界的位置。sps_virtual_boundaries_pos_y[i]的值应在1到Ceil(pic_height_in_luma_samples÷8)-1(含)的范围内。
sps_general_hrd_params_present_flag等于1规定语法结构general_hrd_parameters()存在于SPS RBSP语法结构中。sps_general_hrd_params_present_flag等于0规定SPS RBSP语法结构中不存在语法结构general_hrd_parameters()。
sps_sublayer_cpb_params_present_flag等于1规定SPS RBSP中的语法结构old_hrd_parameters()包括子层表示的HRD参数,其中TemporalId在0到sps_max_sublayers_minus1(含)的范围内。sps_sublayer_cpb_params_present_flag等于0规定SPS RBSP中的语法结构ols_hrd_parameters()包括子层表示的HRD参数,其中TemporalId仅等于sps_max_sublayers_minus1。当sps_max_sublayers_minus1等于0时,sps_sublayer_cpb_params_present_flag的值被推断为等于0。
当sps_sublayer_cpb_params_present_flag等于0时,子层表示的HRD参数(其中TemporalId在0到sps_max_sublayers_minus1-1(含)的范围内)被推断为与子层表示的HRD参数(其中TemporalId等于sps_max_sublayers_minus1)相同。这些包括从fixed_pic_rate_general_flag[i]语法元素开始直到ols_hrd_parameters语法结构中“if(general_vcl_hrd_params_present_flag)”条件下的sublayer_hrd_parameters(i)语法结构的HRD参数。
field_seq_flag等于1指示CLVS传达表示字段的图片。field_seq_flag等于0指示CLVS传达表示帧的图片。当general_frame_only_constraint_flag等于1时,field_seq_flag的值应等于0。
当field_seq_flag等于1时,应当为CLVS中的每个编解码图片呈现帧字段信息SEI消息。
注5–规定的解码过程不会以不同方式处理表示字段或帧的图片。因此,表示字段的图片序列将使用单个字段的图片维度进行编解码。例如,表示1080i字段的图片将通常具有1920x540的裁剪输出维度,而序列图片速率将通常表示源字段的速率(通常在50和60Hz之间),而不是源帧速率(通常在25和30Hz之间)。
vui_parameters_present_flag等于1规定语法结构vui_parameters()存在于SPSRBSP语法结构中。vui_parameters_present_flag等于0规定SPS RBSP语法结构中不存在语法结构vui_parameters()。
sps_extension_flag等于0规定SPS RBSP语法结构中不存在sps_extension_data_flag语法元素。sps_extension_flag等于1规定SPS RBSP语法结构中存在sps_extension_data_flag语法元素。
sps_extension_data_flag可以有任何值。其存在和值不影响解码器与本规范本版本中规定的简档的一致性。符合本规范本版本的解码器应忽略所有sps_extension_data_flag语法元素。
7.4.3.4图片参数集RBSP语义
PPS RBSP在被引用、包括在至少一个AU中(其中TemporalId小于或等于PPS NAL单元的TemporalId)、或通过外部方式提供之前,应当可用于解码过程。
PU内具有pps_pic_parameter_set_id特定值的所有PPS NAL单元应具有相同的内容。
pps_pic_parameter_set_id标识PPS,以供其他语法元素引用。pps_pic_parameter_set_id的值应在0到63(含)的范围内。
无论nuh_layer_id值如何,PPS NAL单元都共享pps_pic_parameter_set_id的相同值空间。
设ppsLayerId为特定PPS NAL单元的nuh_layer_id的值,以及设vclLayerId为特定VCL NAL单元的nuh_layer_id的值。特定VCL NAL单元应当不引用特定PPS NAL单元,除非ppsLayerId小于或等于vclLayerId,且nuh_layer_id等于ppsLayerId的层被包括在至少一个OLS中,该OLS包括nuh_layer_id等于vclLayerId的层。
pps_seq_parameter_set_id规定用于SPS的sps_seq_parameter_set_id的值。pps_seq_parameter_set_id的值应在0到15(含)的范围内。pps_seq_parameter_set_id的值应在由CLVS中编解码图片引用的所有PPS中相同。
mixed_nalu_types_in_pic_flag等于1规定引用PPS的每个图片都有多个VCL NAL单元,VCL NAL单元不具有相同的nal_unit_type值,并且图片不是IRAP图片。mixed_nalu_types_in_pic_flag等于0规定引用PPS的每个图片具有一个或多个VCL NAL单元,并且引用PPS的每个图片的VCL NAL单元具有相同的nal_unit_type值。
当no_mixed_nalu_types_in_pic_constraint_flag等于1时,mixed_nalu_types_in_pic_flag的值应当等于0。
对于图片picA中具有IDR_W_RADL到CRA_NUT(含)范围内的nal_unit_type值nalUnitTypeA的每个条带,该图片picA同样包含具有另一个nal_unit_type值的一个或多个条带(即,图片picA的mixed_nalu_types_in_pic_flag的值等于1),以下内容适用:
–条带应属于子图片subpicA,其对应subpic_treated_as_pic_flag[i]的值等于1。
–条带应当不属于包含VCL NAL单元的picA的子图片,其中nal_unit_type不等于nalUnitTypeA。
–如果nalUnitTypeA等于CRA,则对于在解码顺序和输出顺序中CLVS中当前图片之后的所有后续PU,那些PU中subpicA中条带的RefPicList[0]和RefPicList[1]均不应当在活动条目中包括解码顺序中picA之前的任何图片。
–否则(即nalUnitTypeA等于IDR_W_RADL或IDR_N_LP),对于解码顺序中当前图片之后的CLVS中的所有PU,那些PU中subpicA中条带的RefPicList[0]或RefPicList[1]均不应当在活动条目中包括解码顺序中picA之前的任何图片。
注1–mixed_nalu_types_in_pic_flag等于1指示引用PPS的图片包含具有不同NAL单元类型的条带,例如,源于子图片比特流merging操作的编解码图片,编码器必须确保匹配比特流结构以及原始比特流的参数的进一步对齐。这些对齐的一个示例如下:当sps_idr_rpl_flag的值等于0且mixed_nalu_types_in_pic_flag等于1时,引用PPS的图片不能具有nal_unit_type等于IDR_W_RADL或IDR_N_LP的条带。
pic_width_in_luma_samples规定以亮度样点为单位的引用PPS的每个解码图片的宽度。pic_width_in_luma_samples应当不等于0,应当为Max(8,MinCbSizeY)的整数倍,且应当小于或等于pic_width_max_in_luma_samples。
当res_change_in_clvs_allowed_flag等于0时,pic_width_in_luma_samples的值应等于pic_width_max_in_luma_samples。
pic_height_in_luma_samples规定以亮度样点为单位的引用PPS的每个解码图片的高度。pic_height_in_luma_samples应当不等于0,且应为Max(8,MinCbSizeY)的整数倍,且应小于或等于pic_height_max_in_luma_samples。
当res_change_in_clvs_allowed_flag等于0时,pic_height_in_luma_samples的值应等于pic_height_max_in_luma_samples。
按照如下方式推导变量PicWidthInCtbsY、PicHeightInCtbsY、PicSizeInCtbsY、PicWidthInMinCbsY、PicHeightInMinCbsY、PicSizeInMinCbsY、PicSizeInSamplesY、PicWidthInSamplesC和PicHeightInSamplesC:
PicWidthInCtbsY=Ceil(pic_width_in_luma_samples÷CtbSizeY) (69)
PicHeightInCtbsY=Ceil(pic_height_in_luma_samples÷CtbSizeY) (70)
PicSizeInCtbsY=PicWidthInCtbsY*PicHeightInCtbsY (71)
PicWidthInMinCbsY=pic_width_in_luma_samples/MinCbSizeY (72)
PicHeightInMinCbsY=pic_height_in_luma_samples/MinCbSizeY (73)
PicSizeInMinCbsY=PicWidthInMinCbsY*PicHeightInMinCbsY (74)
PicSizeInSamplesY=pic_width_in_luma_samples*pic_height_in_luma_samples (75)
PicWidthInSamplesC=pic_width_in_luma_samples/SubWidthC (76)
PicHeightInSamplesC=pic_height_in_luma_samples/SubHeightC (77)
pps_conformance_window_flag等于1指示PPS中紧随其后的一致性裁剪窗口偏移参数。pps_conformance_window_flag等于0指示PPS中不存在一致性裁剪窗口偏移参数。
pps_conf_win_left_offset、pps_conf_win_right_offset、pps_conf_win_top_offset和pps_conf_win_bottom_offset规定解码过程中输出的CLVS中图片的样点,以图片坐标中规定的矩形区域为输出。当pps_conformance_window_flag等于0时,pps_conf_win_left_offset、pps_conf_win_right_offset、pps_conf_win_top_offset和pps_conf_win_bottom_offset的值被推断为等于0。
一致性裁剪窗口包含具有从SubWidthC*pps_conf_win_left_offset到pic_width_in_luma_samples-(SubWidthC*pps_conf_win_right_offset+1)的水平图片坐标以及从SubHeightC*pps_conf_win_top_offset到pic_height_in_luma_samples-(SubHeightC*pps_conf_win_bottom_offset+1)(含)的垂直图片坐标的亮度样点。
SubWidthC*(pps_conf_win_left_offset+pps_conf_win_right_offset)的值应小于pic_width_in_luma_samples,且SubweightC*(pps_conf_win_top_offset+pps_conf_win_bottom_offset)的值应小于pic_height_in_luma_samples。
当ChromaArrayType不等于0时,两个色度阵列的对应规定样点是具有图片坐标(x/SubWidthC,y/SubHeightC)的样点,其中(x,y)是规定亮度样点的图片坐标。
注2–一致性裁剪窗口偏移参数仅应用于输出。所有内部解码过程都应用于未裁剪的图片尺寸。
让ppsA和ppsB是引用相同SPS的任意两个PPS。比特流一致性的一个要求是,当ppsA和ppsB分别具有相同的pic_width_in_luma_samples和pic_height_in_luma_samples值时,ppsA和ppsB应分别具有相同的pps_conf_win_left_offset、pps_conf_win_right_offset、pps_conf_win_top_offset和pps_conf_win_bottom_offset值。
当pic_width_in_luma_samples等于pic_width_max_in_luma_samples且pic_height_in_luma_samples等于pic_height_max_in_luma_samples时,比特流一致性的一个要求是pps_conf_win_left_offset、pps_conf_win_right_offset、pps_conf_win_top_offset和pps_conf_win_bottom_offset分别等于sps_conf_win_left_offset、sps_conf_win_right_offset、sps_conf_win_top_offset、,和sps_conf_win_bottom_offset。
scaling_window_explicit_signalling_flag等于1规定PPS中存在缩放窗口偏移参数。scaling_window_explicit_signalling_flag等于0规定PPS中不存在缩放窗口偏移参数。当res_change_in_clvs_allowed_flag等于0时,scaling_window_explicit_signalling_flag的值应等于0。
scaling_win_left_offset、scaling_win_right_offset、scaling_win_top_offset和scaling_win_bottom_offset规定应用于缩放比计算的图片尺寸的偏移量。当不存在时,scaling_win_left_offset、scaling_win_right_offset、scaling_win_top_offset和scaling_win_bottom_offset的值被分别推断为等于SubWidthC*conf_win_left_offset、SubWidthC*conf_win_right_offset、SubHeightC*conf_win_top_offset和SubHeightC*conf_win_bottom_offset。
SubWidthC*(scaling_win_left_offset+scaling_win_right_offset)的值应小于pic_width_in_luma_samples,并且SubHeightC*(scaling_win_top_offset+scaling_win_bottom_offset)的值应小于pic_height_in_luma_samples。
按照如下方式推导变量PicOutputWidthL和PicOutputHeightL:
Figure BDA0003793174210000861
Figure BDA0003793174210000862
让refPicOutputWidthL和refPicOutputHeightL分别为引用此PPS的当前图片的参考图片的PicOutputWidthL和PicOutputHeightL。是满足所有以下条件的比特流一致性要求:
–PicOutputWidthL*2应大于或等于refPicWidthInLumaSamples。
–PicOutputHeightL*2应大于或等于refPicHeightInLumaSamples。
–PicOutputWidthL应小于或等于refPicWidthInLumaSamples*8。
–PicOutputHeightL应小于或等于refPicHeightInLumaSamples*8。
–PicOutputWidthL*pic_width_max_in_luma_samples应大于或等于refPicOutputWidthL*(pic_width_in_luma_samples-Max(8,MinCbSizeY))。
–PicOutputHeightL*pic_height_max_in_luma_samples应大于或等于refPicOutputHeightL*(pic_height_in_luma_samples-Max(8,MinCbSizeY))。
output_flag_present_flag等于1指示pic_output_flag语法元素存在于引用PPS的条带标头中。output_flag_present_flag等于0指示pic_output_flag语法元素不存在于引用PPS的条带标头中。
subpic_id_mapping_in_pps_flag等于1规定在PPS中信令通知子图片ID映射。subpic_id_mapping_in_pps_flag等于0规定PPS中不信令通知子图片ID映射。如果subpic_id_mapping_explicitly_signalled_flag为0或subpic_id_mapping_in_sps_flag等于1,则subpic_id_mapping_in_pps_flag的值应等于0。否则(subpic_id_mapping_explicitly_signalled_flag等于1且subpic_id_mapping_in_sps_flag等于0),subpic_id_mapping_in_pps_flag的值应等于1。
pps_num_subpics_minus1应等于sps_num_subpics_minus1。
pps_subpic_id_len_minus1应等于sps_subpic_id_len_minus1。
pps_subpic_id[i]规定第i个子图片的子图片ID。pps_subpic_id[i]语法元素的长度为pps_subpic_id_len_minus1+1位。
对于0到sps_num_subpics_minus1(含)范围内的每个i值,变量SubpicIdVal[i]的推导如下:
Figure BDA0003793174210000871
比特流一致性的要求为以下两个约束应用:
–对于0到sps_num_subpics_minus1(含)范围内的i和j的任何两个差值,SubpicIdVal[i]应当不等于SubpicIdVal[j]。
–在当前图片不是CLVS的第一张图片时,对于0到sps_num_subpics_minus1(含)范围内的每个i值,如果SubpicIdVal[i]的值不等于同一层中解码顺序中的前一张图片的SubpicIdVal[i]的值,则当前图片中具有子图片索引i的子图片的所有编解码条带NAL单元的nal_unit_type应等于IDR_W_RADL到CRA_NUT(含)范围内的特定值。
no_pic_partition_flag等于1规定没有图片分割被应用于引用PPS的每个图片。no_pic_partition_flag等于0规定引用PPS的每个图片可以被分割为多个片或条带。
比特流一致性的一个要求是,对于CLVS中编解码图片引用的所有PPS,no_pic_partition_flag的值应相同。
比特流一致性的一个要求是当sps_num_subpics_minus1+1的值大于1时,no_pic_partition_flag的值应当不等于1。
pps_log2_ctu_size_minus5加5规定每个CTU的亮度编解码树块尺寸。
pps_log2_ctu_size_minus5应等于sps_log2_ctu_size_minus5。
num_exp_tile_columns_minus1加1规定显式提供的片列宽的数目。num_exp_tile_columns_minus1的值应在0到PicWidthInCtbsY-1(含)的范围内。当no_pic_partition_flag等于1时,num_exp_tile_columns_minus1的值被推断为等于0。
num_exp_tile_rows_minus1加1规定显式提供的片行高度的数目。num_exp_tile_rows_minus1的值应在0到PicHeightInCtbsY-1(含)的范围内。当no_pic_partition_flag等于1时,num_tile_rows_minus1的值被推断为等于0。
tile_column_width_minus1[i]加1规定以CTB为单位的第i个片列的宽度,对于0到num_exp_tile_columns_minus1-1(含)范围内的i。
tile_column_width_minus1[num_exp_tile_columns_minus1]用于推导索引大于或等于num_exp_tile_columns_minus1的片列的宽度,如条款6.5.1所规定的。tile_column_width_minus1[i]的值应在0到PicWidthInCtbsY-1(含)的范围内。当不存在时,tile_column_width_minus1[0]的值被推断为等于PicWidthInCtbsY-1。
tile_row_height_minus1[i]加1规定以CTB为单位的第i个片行的高度,对于0到num_exp_tile_rows_minus1-1(含)范围内的i。tile_row_height_minus1[num_exp_tile_rows_minus1]用于推导索引大于或等于num_exp_tile_rows_minus1的片行的高度,如条款6.5.1所规定的。tile_row_height_minus1[i]的值应在0到PicHeightInCtbsY-1(含)的范围内。当不存在时,tile_row_height_minus1[0]的值被推断为等于PicHeightInCtbsY-1。
rect_slice_flag等于0规定每个条带内的片按照光栅扫描顺序,并且在PPS中不信令通知条带信息。rect_slice_flag等于1规定每个条带内的片覆盖图片的矩形区域,并且在PPS中信令通知条带信息。当不存在时,rect_slice_flag被推断为等于1。当subpic_info_present_flag等于1时,rect_slice_flag的值应等于1。
single_slice_per_subpic_flag等于1规定每个子图片由一个且仅一个矩形条带组成。single_slice_per_subpic_flag等于0规定每个子图片可以由一个或多个矩形条带组成。当single_slice_per_subpic_flag等于1时,num_slices_in_pic_minus1被推断为等于sps_num_subpics_minus1。当不存在时,single_slice_per_subpic_flag的值被推断为等于0。
num_slices_in_pic_minus1加1规定引用PPS的每个图片中的矩形条带数。num_slices_in_pic_minus1的值应在0到MaxSlicesPerPicture-1(含)的范围内,其中MaxSlicesPerPicture。当no_pic_partition_flag等于1时,num_slices_in_pic_minus1的值被推断为等于0。
tile_idx_delta_present_flag等于0规定tile_idx_delta值不存在于PPS中,并且根据条款6.5.1中定义的过程,以光栅顺序规定引用PPS的图片中的所有矩形条带。tile_idx_delta_present_flag等于1规定tile_idx_delta值可能存在于PPS中,并且根据条款6.5.1中定义的过程按照光栅顺序规定引用PPS的图片中的所有矩形条带。当不存在时,tile_idx_delta_present_flag的值被推断为等于0。
slice_width_in_tiles_minus1[i]加1规定以片列为单位的第i个矩形条带的宽度。slice_width_in_tiles_minus1[i]的值应在0到NumTileColumns-1(含)的范围内。
当slice_width_in_tiles_minus1[i]不存在时,以下内容适用:
–如果NumTileColumns等于1,则slice_width_in_tiles_minus1[i]的值被推断为等于0。
–否则,根据条款6.5.1的规定推断slice_width_in_tiles_minus1[i]的值。
slice_height_in_tiles_minus1[i]加1规定以片行为单位的第i个矩形条带的高度。slice_height_in_tiles_minus1[i]的值应在0到NumTileRows-1(含)的范围内。
当slice_height_in_tiles_minus1[i]不存在时,以下内容适用:
–如果NumTileRows等于1,或者tile_idx_delta_present_flag等于0,并且tileIdx%NumTileColumns大于0,则slice_height_in_tiles_minus1[i]的值被推断为等于0。
–否则(NumTileRows不等于1,并且tile_idx_delta_present_flag等于1或tileIdx%NumTileColumns等于0),当tile_idx_delta_present_flag等于1或tileIdx%NumTileColumns等于0时,slice_height_in_tiles_minus1[i]的值被推断为等于slice_height_in_tiles_minus1[i-1]。
num_exp_slices_in_tile[i]规定包含多个矩形条带的当前片中显式提供的条带高度的数目。num_exp_slices_in_tile[i]的值应在0到RowHeight[tileY]-1(含)的范围内,其中tileY是包含第i个条带的片行索引。当不存在时,num_exp_slices_in_tile[i]的值被推断为等于0。当num_exp_slices_in_tile[i]等于0时,变量NumSlicesInTile[i]的值被推断为等于1。
exp_slice_height_in_ctus_minus1[j]加1规定以CTU行为单位的当前片中的第j个矩形条带的高度。exp_slice_height_in_ctus_minus1[j]的值应在0到RowHeight[tileY]-1(含)的范围内,其中tileY是当前片的片行索引。
当num_exp_slices_in_tile[i]大于0时,按照如下方式推导变量NumSlicesInTile[i]和SliceHeightInCtusMinus1[i+k](对于0到NumSlicesInTile[i]-1(含)的范围内的k):
Figure BDA0003793174210000901
tile_idx_delta[i]规定第i个矩形条带中第一个片的片索引与第(i+1)个矩形条带中第一个片的片索引之间的差值。tile_idx_delta[i]的值应在-NumTilesInPic+1到NumTilesInPic–1(含)的范围内。当不存在时,tile_idx_delta[i]的值被推断为等于0。当存在时,tile_idx_delta[i]的值应当不等于0。
loop_filter_across_tiles_enabled_flag等于1规定可以在引用PPS的图片中跨片边界执行环路滤波操作。loop_filter_across_tiles_enabled_flag等于0规定在引用PPS的图片中不会跨片边界执行环路滤波操作。环路滤波操作包括去方块滤波器、采样自适应偏移滤波器和自适应环路滤波器操作。当不存在时,loop_filter_across_tiles_enabled_flag的值被推断为等于1。
loop_filter_across_slices_enabled_flag等于1规定可以在引用PPS的图片中跨条带边界执行环路滤波操作。loop_filter_across_slice_enabled_flag等于0规定在引用PPS的图片中不会跨条带边界执行环路滤波操作。环路滤波操作包括去方块滤波器、采样自适应偏移滤波器和自适应环路滤波器操作。当不存在时,loop_filter_across_slices_enabled_flag的值被推断为等于0。
cabac_init_present_flag等于1规定cabac_init_flag存在于引用PPS的条带标头中。cabac_init_present_flag等于0规定在引用PPS的条带标头中不存在cabac_init_flag。
num_ref_idx_default_active_minus1[i]加1(当i等于0时)规定P或B条带的变量NumRefIdxActive[0]的推断值(其中num_ref_idx_active_override_flag等于0),并且当i等于1时,规定B条带的NumRefIdxActive[1]的推断值(其中num_ref_idx_active_override_flag等于0)。num_ref_idx_default_active_minus1[i]的值应在0到14(含)的范围内。
rpl1_idx_present_flag等于0规定引用PPS的图片的PH语法结构或条带标头中不存在ref_pic_list_sps_flag[1]和ref_pic_list_idx[1]。rpl1_idx_present_flag等于1规定ref_pic_list_sps_flag[1]和ref_pic_list_idx[1]可能存在于引用PPS的图片的PH语法结构或条带标头中。
init_qp_minus26加26规定引用PPS的每个条带的SliceQpY的初始值。当解码ph_qp_delta的非零值时,在图片级别处修改SliceQPY的初始值,或者当解码slice_qp_delta的非零值时,在条带级别处修改SliceQpY的初始值。init_qp_minus26的值应在-(26+QpBdOffset)到+37(含)的范围内。
cu_qp_delta_enabled_flag等于1规定引用PPS的PH中存在ph_cu_qp_delta_subdiv_intra_slice和ph_cu_qp_delta_subdiv_inter_slice语法元素,并且cu_qp_delta_abs可能存在于变换单元语法中。cu_qp_delta_enabled_flag等于0规定ph_cu_qp_delta_subdiv_intra_slice和ph_cu_qp_delta_subdiv_inter_slice语法元素不存在于引用PPS的PH中,并且cu_qp_delta_abs不存在于变换单元语法中。
pps_chroma_tool_offsets_present_flag等于1规定与色度工具偏移相关的语法元素存在于PPS RBSP语法结构中。pps_chroma_tool_offsets_present_falg等于0规定在PPS RBSP语法结构中不存在与色度工具偏移相关的语法元素。当ChromaArrayType等于0时,pps_chroma_tool_offsets_present_flag的值应等于0。
pps_cb_qp_offset和pps_cr_qp_offset规定分别用于推导Qp'Cb和Qp'Cr的亮度量化参数Qp'Y的偏移量。pps_cb_qp_offset和pps_cr_qp_offset的值应在-12至+12(含)的范围内。当ChromaArrayType等于0时,解码过程中不使用pps_cb_qp_offset和pps_cr_qp_offset,并且解码器应忽略其值。当不存在时,pps_cb_qp_offset和pps_cr_qp_offset的值被推断为等于0。
pps_joint_cbcr_qp_offset_present_flag等于1规定pps_joint_cbcr_qp_offset_value和joint_cbcr_qp_offset_list[i]存在于PPS RBSP语法结构中。pps_joint_cbcr_qp_offset_present_flag等于0规定pps_joint_cbcr_qp_offset_value和joint_cbcr_qp_offset_list[i]不存在于PPS RBSP语法结构中。当ChromaArrayType等于0或sps_joint_cbcr_enabled_flag等于0时,pps_joint_cbcr_qp_offset_present_flag的值应等于0。当不存在时,pps_joint_cbcr_qp_offset_present_flag的值被推断为等于0。
pps_joint_cbcr_qp_offset_value规定用于推导Qp'CbCr的亮度量化参数Qp'Y的偏移量。pps_joint_cbcr_qp_offset_value的值应在-12至+12(含)的范围内。当ChromaArrayType等于0或sps_joint_cbcr_enabled_flag等于0时,解码过程中不使用pps_joint_cbcr_qp_offset_value,并且解码器应忽略其值。当pps_joint_cbcr_qp_offset_present_flag等于0时,pps_joint_cbcr_qp_offset_value不存在且被推断为等于0。
pps_slice_chroma_qp_offsets_present_flag等于1规定slice_cb_qp_offset和slice_cr_qp_offset语法元素存在于相关联的条带标头中。pps_slice_chroma_qp_offsets_present_flag等于0规定slice_cb_qp_offset和slice_cr_qp_offset语法元素不存在于相关联的条带标头中。当不存在时,pps_slice_chroma_qp_offsets_present_flag的值被推断为等于0。
pps_cu_chroma_qp_offset_list_enabled_flag等于1规定ph_cu_chroma_qp_offset_subdiv_intra_slice和ph_cu_chroma_qp_offset_subdiv_inter_slice语法元素存在于引用PPS的PH中,并且cu_chroma_qp_offset_flag可能存在于变换单元语法和调色板编解码语法中。pps_cu_chroma_qp_offset_list_enabled_flag等于0规定ph_cu_chroma_qp_offset_subdiv_intra_slice和ph_cu_chroma_qp_offset_subdiv_inter_slice语法元素不存在于引用PPS的PH中,并且cu_chroma_qp_offset_flag不存在于变换单元语法和调色板编解码语法中。当不存在时,pps_cu_chroma_qp_offset_list_enabled_flag的值被推断为等于0。
chroma_qp_offset_list_len_minus1加1规定PPS RBSP语法结构中存在的cb_qp_offset_list[i]、cr_qp_offset_list[i]和joint_cbcr_qp_offset_list[i]语法元素的数目。chroma_qp_offset_list_len_minus1的值应在0到5(含)的范围内。
cb_qp_offset_list[i]、cr_qp_offset_list[i]和joint_cbcr_qp_offset_list[i]规定分别用于Qp'Cb、Qp'Cr和Qp'CbCr的推导的偏移量。cb_qp_offset_list[i]、cr_qp_offset_list[i]和joint_cbcr_qp_offset_list[i]的值应在-12至+12(含)的范围内。当pps_joint_cbcr_qp_offset_present_flag等于0时,joint_cbcr_qp_offset_list[i]不存在并被推断为等于0。
pps_weighted_pred_flag等于0规定加权预测不应用于引用PPS的P条带。pps_weighted_pred_flag等于1规定加权预测被应用于引用PPS的P条带。当sps_weighted_pred_flag等于0时,pps_weighted_pred_flag的值应等于0。
pps_weighted_bipred_flag等于0规定显式加权预测不应用于引用PPS的B条带。pps_weighted_bipred_flag等于1规定显式加权预测被应用于引用PPS的B条带。当sps_weighted_bipred_flag等于0时,pps_weighted_bipred_flag的值应等于0。
deblocking_filter_control_present_flag等于1规定PPS中是否存在去方块滤波器控制语法元素。deblocking_filter_control_present_flag等于0规定PPS中不存在去方块滤波器控制语法元素。
deblocking_filter_override_enabled_flag等于1规定在引用PPS的PH中存在ph_deblocking_filter_override_flag,或在引用PPS的条带标头中存在slice_deblocking_filter_override_flag。deblocking_filter_override_enabled_flag等于0规定在引用PPS的PH中不存在ph_deblocking_filter_override_flag,或在引用PPS的条带标头中不存在slice_deblocking_filter_override_flag。当不存在时,deblocking_filter_override_enabled_flag的值被推断为等于0。
pps_deblocking_filter_disabled_flag等于1规定去方块过滤器的操作不应用于引用PPS的条带,其中slice_deblocking_filter_disabled_flag不存在。
pps_deblocking_filter_disabled_flag等于0规定去方块过滤器的操作不应用于引用PPS的条带,其中slice_deblocking_filter_disabled_flag不存在。当不存在时,pps_deblocking_filter_disabled_flag的值被推断为等于0。
pps_beta_offset_div2和pps_tc_offset_div2规定应用于引用PPS的条带的亮度分量的β和tC(除以2)的默认去方块参数偏移量,除非默认去方块参数偏移量被引用PPS的条带的图片标头或条带标头中存在的去方块参数偏移量覆盖。pps_beta_offset_div2和pps_tc_offset_div2的值均应在-12至12(含)的范围内。当不存在时,pps_beta_offset_div2和pps_tc_offset_div2的值都被推断为等于0。
pps_cb_beta_offset_div2和pps_cb_tc_offset_div2规定应用于引用PPS的条带的Cb分量的β和tC(除以2)的默认去方块参数偏移量,除非默认去方块参数偏移量被引用PPS的条带的图片标头或条带标头中存在的去方块参数偏移量覆盖。pps_cb_beta_offset_div2和pps_cb_tc_offset_div2的值均应在-12至12(含)的范围内。当不存在时,pps_cb_beta_offset_div2和pps_cb_tc_offset_div2的值都被推断为等于0。
pps_cr_beta_offset_div2和pps_cr_tc_offset_div2规定应用于引用PPS的条带的Cr分量的β和tC(除以2)的默认去方块参数偏移量,除非默认去方块参数偏移量被引用PPS的条带的图片标头或条带标头中存在的去方块参数偏移量覆盖。pps_cr_beta_offset_div2和pps_cr_tc_offset_div2的值均应在-12至12(含)的范围内。当不存在时,pps_cr_beta_offset_div2和pps_cr_tc_offset_div2的值都被推断为等于0。
rpl_info_in_ph_flag等于1规定参考图片列表信息存在于PH语法结构中,而不存在于引用不包含PH语法结构的PPS的条带标头中。rpl_info_in_ph_flag等于0规定参考图片列表信息不存在于PH语法结构中,并且可能存在于引用不包含PH语法结构的PPS的条带标头中。
dbf_info_in_ph_flag等于1规定去方块滤波器信息存在于PH语法结构中,而不存在于引用不包含PH语法结构的PPS的条带标头中。dbf_info_in_ph_flag等于0规定去方块滤波器信息不存在于PH语法结构中,并且可能存在于引用不包含PH语法结构的PPS的条带标头中。当不存在时,dbf_info_in_ph_flag的值被推断为等于0。
sao_info_in_ph_flag等于1规定SAO滤波器信息存在于PH语法结构中,而不存在于引用不包含PH语法结构的PPS的条带标头中。sao_info_in_ph_flag等于0规定SAO滤波器信息不存在于PH语法结构中,并且可能存在于引用不包含PH语法结构的PPS的条带标头中。
alf_info_in_ph_flag等于1规定ALF信息存在于PH语法结构中,而不存在于引用不包含PH语法结构的PPS的条带标头中。alf_info_in_ph_flag等于0规定ALF信息不存在于PH语法结构中,并且可能存在于引用不包含PH语法结构的PPS的条带标头中。
wp_info_in_ph_flag等于1规定加权预测信息可能存在于PH语法结构中,而不存在于引用不包含PH语法结构的PPS的条带标头中。wp_info_in_ph_flag等于0规定加权预测信息不存在于PH语法结构中,并且可能存在于引用不包含PH语法结构的PPS的条带标头中。当不存在时,wp_info_in_ph_flag的值被推断为等于0。
qp_delta_info_in_ph_flag等于1规定QP增量信息存在于PH语法结构中,而不存在于引用不包含PH语法结构的PPS的条带标头中。qp_delta_info_in_ph_flag等于0规定QP增量信息不存在于PH语法结构中,并且可能存在于引用不包含PH语法结构的PPS的条带标头中。
pps_ref_wraparound_enabled_flag等于1规定在帧间预测中应用水平环绕运动补偿。pps_ref_wraparound_enabled_flag等于0规定不应用水平环绕运动补偿。当CtbSizeY/MinCbSizeY+1的值大于pic_width_in_luma_samples/MinCbSizeY-1时,pps_ref_wraparound_enabled_flag的值应等于0。当sps_ref_wraparound_enabled_flag等于0时,pps_ref_wraparound_enabled_flag的值应等于0。
pps_ref_wraparound_offset加(CtbSizeY/MinCbSizeY)+2规定用于计算以MinCbSizeY亮度样点为单位的水平环绕位置的偏移量。pps_ref_wraparound_offset的值应在0到(pic_width_in_luma_samples/MinCbSizeY)-(CtbSizeY/MinCbSizeY)-2(含)的范围内。
变量PpsRefWraparoundOffset被设置为等于pps_ref_wraparound_offset+(CtbSizeY/MinCbSizeY)+2。
picture_header_extension_present_flag等于0规定在引用PPS的PH中不存在PH扩展语法元素。picture_header_extension_present_flag等于1规定PH扩展语法元素存在于引用PPS的PH中。picture_header_extension_present_flag在符合本规范版本的比特流中应等于0。
slice_header_extension_present_flag等于0规定引用PPS的编解码图片的条带标头中不存在条带标头扩展语法元素。slice_header_extension_present_flag等于1规定引用PPS的编解码图片的条带标头中存在条带标头扩展语法元素。slice_header_extension_present_flag在符合本规范版本的比特流中应等于0。
pps_extension_flag等于0规定没有pps_extension_data_flag语法元素存在于PPS RBSP语法结构中。pps_extension_flag等于1规定pps_extension_data_flag语法元素存在于PPS RBSP语法结构中。
pps_extension_data_flag可以有任何值。其存在和值不影响解码器与本规范本版本中规定的简档的一致性。符合本规范本版本的解码器应忽略所有pps_extension_data_flag语法元素。
7.4.3.5自适应参数集语义
每个APS RBSP在被引用、被包括在至少一个AU中(其TemporalId小于或等于引用它的编解码条带NAL单元的TemporalId)或通过外部方式提供之前应可用于解码过程。
PU内具有adaptation_parameter_set_id特定值和aps_params_type特定值的所有APS NAL单元,无论它们是前缀还是后缀APS NAL单元,都应具有相同的内容。
adaptation_parameter_set_id为APS提供一个标识符以供其他语法元素引用。
当aps_params_type等于ALF_APS或SCALING_APS时,adaptation_parameter_set_id的值应在0到7(含)的范围内。
当aps_params_type等于LMCS_APS时,adaptation_parameter_set_id的值应在0到3(含)的范围内。
设apsLayerId为特定APS NAL单元的nuh_layer_id的值,以及vclLayerId为特定VCL NAL单元的nuh_layer_id的值。特定VCL NAL单元应当不引用特定的APS NAL单元,除非apsLayerId小于或等于vclLayerId,且nuh_layer_id等于apsLayerId的层被包括在至少一个OLS中,该OLS包括nuh_layer_id等于vclLayerId的层。
aps_params_type规定APS中携带的APS参数类型,如表6所示。
表6–APS参数类型代码和APS参数类型
Figure BDA0003793174210000971
所有具有aps_params_type的特定值的APS NAL单元,无论nuh_layer_id值如何,都为adaptation_parameter_set_id共享相同的值空间。具有aps_params_type的不同值的APS NAL单元为adaptation_parameter_set_id使用单独的值空间。
注1–APS NAL单元(具有adaptation_parameter_set_id的特定值和aps_params_type的特定值)可以在图片之间共享,并且图片内的不同条带可以引用不同的ALF APS。
注2–与特定VCL NAL单元相关联的后缀APS NAL单元(此VCL NAL单元在解码顺序上位于后缀APS NAL单元之前)不供特定的VCL NAL单元使用,而是供解码顺序上位于后缀APS NAL单元之后的VCL NAL单元使用。
aps_extension_flag等于0规定APS RBSP语法结构中不存在aps_extension_data_flag语法元素。aps_extension_flag等于1规定APS RBSP语法结构中存在aps_extension_data_flag语法元素。
aps_extension_data_flag可以有任何值。其存在和值不影响解码器与本规范本版本中规定的简档的一致性。符合本规范本版本的解码器应忽略所有aps_extension_data_flag语法元素。
7.4.3.6图片标头RBSP语义
PH RBSP包含PH语法结构,即picture_header_structure()。
7.4.3.7图片标头结构语义
PH语法结构包含与PH语法结构相关联的编解码图片的所有条带的通用信息。
gdr_or_irap_pic_flag等于1规定当前图片是GDR或IRAP图片。gdr_or_irap_pic_flag等于0规定当前图片可能是也可能不是GDR或IRAP图片。
gdr_pic_flag等于1规定与PH相关联的图片为GDR图片。gdr_pic_flag等于0规定与PH相关联的图片不是GDR图片。当不存在时,gdr_pic_flag的值被推断为等于0。当gdr_enabled_flag等于0时,gdr_pic_flag的值应等于0。
ph_inter_slice_allowed_flag等于0规定图片的所有编解码条带的slice_type等于2。ph_inter_slice_allowed_flag等于1规定图片中可能存在或不存在一个或多个slice_type等于0或1的编解码条带。
ph_intra_slice_allowed_flag等于0规定图片的所有编解码条带的slice_type等于0或1。ph_intra_slice_allowed_flag等于1规定图片中可能有也可能没有一个或多个slice_type等于2的编解码条带。当不存在时,ph_intra_slice_allowed_flag的值被推断为等于1。
注1–对于支持基于子图片的比特流merging而无需更改PH NAL单元的比特流,编码器被期望将ph_inter_slice_allowed_flag和ph_intra_slice_allowed_flag的值设置为等于1。
non_reference_picture_flag等于1规定与PH相关联的图片从不用作参考图片。non_reference_picture_flag等于0规定与PH相关联的图片可能或可能不用作参考图片。
ph_pic_parameter_set_id规定正在使用的PPS的pps_pic_parameter_set_id的值。ph_pic_parameter_set_id的值应在0到63(含)的范围内。
比特流一致性的一个要求是,PH的TemporalId值应大于或等于pps_pic_parameter_set_id等于ph_pic_parameter_set_id的PPS的TemporalId值。
ph_pic_order_cnt_lsb规定当前图片的图片顺序计数模MaxPicOrderCntLsb。ph_pic_order_cnt_lsb语法元素的长度为log2_max_pic_order_cnt_lsb_minus4+4位。ph_pic_order_cnt_lsb的值应在0到MaxPicOrderCntLsb-1(含)的范围内。
在解码不是比特流中的第一个图片的CLVSS图片之后,no_output_of_prior_pics_flag会影响DPB中先前解码的图片的输出。
recovery_poc_cnt按输出顺序规定解码图片的恢复点。如果当前图片是与PH相关联的GDR图片,并且在CLVS中存在解码顺序中跟随当前GDR图片的图片picA,其PicOrderCntVal等于当前GDR图片的PicOrderCntVal加上recovery_poc_cnt的值,则图片picA被称为恢复点图片。否则,输出顺序中PicOrderCntVal大于当前图片的PicOrderCntVal加上recovery_poc_cnt值的第一个图片称为恢复点图片。在解码顺序中,恢复点图片不得位于当前GDR图片之前。recovery_poc_cnt的值应在0到MaxPicOrderCntLsb-1(含)的范围内。
在当前图片是GDR图片时,按照如下方式推导变量RpPicOrderCntVal:
RpPicOrderCntVal=PicOrderCntVal+recovery_poc_cnt (82)
注2–当gdr_enabled_flag等于1且当前图片的PicOrderCntVal大于或等于相关联GDR图片的RpPicOrderCntVal时,当前和后续解码图片按输出顺序与通过从先前IRAP图片(如果存在)开始解码过程产生的对应图片完全匹配,在解码顺序中位于相关GDR图片之前。
ph_extra_bit[i]可以等于1或0。符合本规范本版本的解码器应忽略ph_extra_bit[i]的值。其值不影响解码器与本规范版本中规定的简档的一致性。
ph_poc_msb_present_flag等于1规定语法元素poc_msb_val存在于PH中。ph_poc_msb_present_flag等于0规定语法元素poc_msb_val不存在于PH中。当vps_independent_layer_flag[GeneralLayerIdx[nuh_layer_id]]等于0且当前层的参考层中的当前AU中存在图片时,ph_poc_msb_present_flag的值应等于0。
poc_msb_val规定当前图片的POC MAB值。语法元素poc_msb_val的长度是poc_msb_len_minus1+1位。
ph_alf_enabled_flag等于1规定对与PH相关联的所有条带启用自适应环路过滤器,并可以应用于条带中的Y、Cb或Cr颜色分量。ph_alf_enabled_flag等于0规定可以对与PH相关联的一个、多个或所有条带禁用自适应环路滤波器。当不存在时,ph_alf_enabled_flag被推断为等于0。
ph_num_alf_aps_ids_luma规定与PH相关联的条带所引用的ALF APS的数目。
ph_alf_aps_id_luma[i]规定与PH相关联的条带的亮度分量所引用的第i个ALFAPS的adaptation_parameter_set_id。
aps_params_type等于ALF_APS且adaptation_parameter_set_id等于ph_alf_aps_id_luma[i]的APS NAL单元的alf_luma_filter_signal_flag的值应等于1。
aps_params_type等于ALF_APS且adaptation_parameter_set_id等于ph_alf_aps_id_luma[i]的APS NAL单元的TemporalId应小于或等于与PH相关联的图片的TemporalId。
ph_alf_chroma_idc等于0规定自适应环路滤波器不应用于Cb和Cr颜色分量。ph_alf_chroma_idc等于1指示自适应环路滤波器应用于Cb颜色分量。ph_alf_chroma_idc等于2指示自适应环路滤波器应用于Cr颜色分量。ph_alf_chroma_idc等于3指示自适应环路滤波器应用于Cb和Cr颜色分量。当ph_alf_chroma_idc不存在时,其被推断为等于0。
ph_alf_aps_id_chroma规定与PH相关联的条带的色度分量所引用的ALF APS的adaptation_parameter_set_id。
aps_params_type等于ALF_APS且adaptation_parameter_set_id等于ph_alf_aps_id_chroma的APS NAL单元的alf_chroma_filter_signal_flag值应等于1。
aps_params_type等于ALF_APS且adaptation_parameter_set_id等于ph_alf_aps_id_chroma的APS NAL单元的TemporalId应小于或等于与PH相关联的图片的TemporalId。
ph_cc_alf_cb_enabled_flag等于1规定对与PH相关联的所有条带启用Cb颜色分量的交叉分量滤波器,并可以应用于条带中的Cb颜色分量。ph_cc_alf_cb_enabled_flag等于0规定可以对与PH相关联的一个或多个或所有条带禁用Cb颜色分量的交叉分量过滤器。当不存在时,ph_cc_alf_cb_enabled_flag被推断为等于0。
ph_cc_alf_cb_aps_id规定与PH相关联的条带的Cb颜色分量所引用的ALF APS的adaptation_parameter_set_id。
aps_params_type等于ALF_APS且adaptation_parameter_set_id等于ph_cc_alf_cb_aps_id的APS NAL单元的alf_cc_cb_filter_signal_flag值应等于1。
ph_cc_alf_cr_enabled_flag等于1规定对与PH相关联的所有条带启用Cr颜色分量的交叉分量滤波器,并可以应用于条带中的Cr颜色分量。ph_cc_alf_cr_enabled_flag等于0规定可以对与PH相关联的一个或多个或所有条带禁用Cr颜色分量的交叉分量滤波器。当不存在时,ph_cc_alf_cr_enabled_flag被推断为等于0。
ph_cc_alf_cr_aps_id规定与PH相关联的条带的Cr颜色分量所引用的ALF APS的adaptation_parameter_set_id。
aps_params_type等于ALF_APS且adaptation_parameter_set_id等于ph_cc_alf_cr_aps_id的APS NAL单元的alf_cc_cr_filter_signal_flag的值应等于1。
ph_lmcs_enabled_flag等于1规定对与PH相关联的所有条带启用具有色度缩放的亮度映射。ph_lmcs_enabled_flag等于0规定可以对与PH相关联的一个或多个或所有条带禁用具有色度缩放的亮度映射。当不存在时,ph_lmcs_enabled_flag的值被推断为等于0。
ph_lmcs_aps_id规定与PH相关联的条带所引用的LMCS APS的adaptation_parameter_set_id。aps_params_type等于LMCS_APS且adaptation_parameter_set_id等于ph_lmcs_aps_id的APS NAL单元的TemporalId应小于或等于与PH相关联的图片的TemporalId。
ph_chroma_residual_scale_flag等于1规定对与PH相关联的所有条带启用色度残差缩放。ph_chroma_residual_scale_flag等于0规定可以对与PH相关联的一个或多个或所有条带禁用色度残差缩放。当ph_chroma_residual_scale_flag不存在时,其被推断为等于0。
ph_scaling_list_present_flag等于1规定用于与PH相关联的条带的缩放列表数据是基于参考缩放列表APS中包含的缩放列表数据推导的。ph_scaling_list_present_flag等于0规定用于与PH相关联的条带的缩放列表数据被设置为等于16。当不存在时,ph_scaling_list_present_flag的值被推断为等于0。
ph_scaling_list_aps_id规定缩放列表APS的adaptation_parameter_set_id。aps_params_type等于SCALING_APS且adaptation_parameter_set_id等于ph_scaling_list_aps_id的APS NAL单元的TemporalId应小于或等于与PH相关联的图片的TemporalId。
ph_virtual_boundaries_present_flag等于1规定在PH中信令通知虚拟边界的信息。ph_virtual_boundaries_present_flag等于0规定在PH中不信令通知虚拟边界的信息。当PH中信令通知一个或多个虚拟边界时,跨图片中的虚拟边界禁用环路滤波操作。环路滤波操作包括去方块滤波器、采样自适应偏移滤波器和自适应环路滤波器操作。当不存在时,ph_virtual_boundaries_present_flag的值被推断为等于0。
比特流一致性的一个要求是,当subpic_info_present_flag等于1时,ph_virtual_boundaries_present_flag的值应等于0。
按照如下方式推导变量VirtualBoundariesPresentFlag:
VirtualBoundariesPresentFlag=0
if(sps_virtual_boundaries_enabled_flag)
VirtualBoundariesPresentFlag=sps_virtual_boundaries_present_flag||
ph_virtual_boundaries_present_flag (83)
ph_num_ver_virtual_boundaries规定PH中存在的ph_virtual_boundaries_pos_x[i]语法元素的数目。当ph_num_ver_virtual_boundaries不存在时,其被推断为等于0。
按照如下方式推导变量NumVerVirtualBoundaries:
NumVerVirtualBoundaries=0
if(sps_virtual_boundaries_enabled_flag)
NumVerVirtualBoundaries=sps_virtual_boundaries_present_flag?
sps_num_ver_virtual_boundaries:ph_num_ver_virtual_boundaries (84)
ph_virtual_boundaries_pos_x[i]规定第i个垂直虚拟边界的位置,以亮度样点除以8为单位。ph_virtual_boundaries_pos_x[i]的值应在1到Ceil(pic_width_in_luma_samples÷8)-1(含)的范围内。
按照如下方式推导列表VirtualBoundariesPosX[i](对于从0到NumVirtualBoundaries-1(含)范围内的i),以亮度样点为单位,规定垂直虚拟边界的位置:
for(i=0;i<NumVerVirtualBoundaries;i++)
VirtualBoundariesPosX[i]=(sps_virtual_boundaries_present_flag?
sps_virtual_boundaries_pos_x[i]:ph_virtual_boundaries_pos_x[i])*8 (85)
任何两个垂直虚拟边界之间的距离应大于或等于CtbSizeY亮度样点。
ph_num_hor_virtual_boundaries规定PH中存在的ph_virtual_boundaries_pos_y[i]语法元素的数目。当ph_num_hor_virtual_boundaries不存在时,其被推断为等于0。
按照如下方式推导参数NumHorVirtualBoundaries:
NumHorVirtualBoundaries=0
if(sps_virtual_boundaries_enabled_flag)
NumHorVirtualBoundaries=sps_virtual_boundaries_present_flag?
sps_num_hor_virtual_boundaries:ph_num_hor_virtual_boundaries (86)
当sps_virtual_boundaries_enabled_flag等于1且ph_virtual_boundaries_present_flag等于1时,ph_num_ver_virtual_boundaries和ph_num_hor_virtual_boundaries之和应大于0。
ph_virtual_boundaries_pos_y[i]规定第i个水平虚拟边界的位置,以亮度样点除以8为单位。ph_virtual_boundaries_pos_y[i]的值应在1到Ceil(pic_height_in_luma_samples÷8)-1(含)的范围内。
按照如下方式推导列表VirtualBoundariesPosY[i](对于从0到NumVirtualBoundaries-1(含)范围内的i),以亮度样点为单位,规定水平虚拟边界的位置:
for(i=0;i<NumHorVirtualBoundaries;i++)
VirtualBoundariesPosY[i]=(sps_virtual_boundaries_present_flag?
sps_virtual_boundaries_pos_y[i]:ph_virtual_boundaries_pos_y[i])*8 (87)
任何两个水平虚拟边界之间的距离应大于或等于CtbSizeY亮度样点。
pic_output_flag影响解码图片输出和删除过程。当pic_output_flag不存在时,其被推断为等于1。
partition_constraints_override_flag等于1规定分区约束参数存在于PH中。partition_constraints_override_flag等于0规定分区约束参数不存在于PH中。当不存在时,partition_constraints_override_flag的值被推断为等于0。
ph_log2_diff_min_qt_min_cb_intra_slice_luma规定由CTU的四叉树划分而产生的亮度叶块的亮度样点中最小尺寸的基2对数和与PH相关联的slice_type等于2的条带中的亮度CU的亮度样点中最小编解码块尺寸的基2对数之间的差值。ph_log2_diff_min_qt_min_cb_intra_slice_luma的值应在0到CtbLog2SizeY-MinCbLog2SizeY(含)的范围内。当不存在时,ph_log2_diff_min_qt_min_cb_luma的值被推断为等于sps_log2_diff_min_qt_min_cb_intra_slice_luma。
ph_max_mtt_hierarchy_depth_intra_slice_luma规定由与PH相关联的slice_type等于2(I)的条带中的四叉树叶的多类型树划分而产生的编解码单元的最大层次深度。ph_max_mtt_hierarchy_depth_intra_slice_luma的值应在0到2*(CtbLog2SizeY-MinCbLog2SizeY)(含)的范围内。当不存在时,ph_max_mtt_hierarchy_depth_intra_slice_luma的值被推断为等于sps_max_mtt_hierarchy_depth_intra_slice_luma。
ph_log2_diff_max_bt_min_qt_intra_slice_luma规定可以使用二元划分的亮度编解码块的亮度样点中的最大尺寸(宽度或高度)的基2对数与由与PH相关联的slice_type等于2(I)的条带中的CTU的四叉树划分产生的亮度叶块的亮度样点中的最小尺寸(宽度或高度)之间的差。ph_log2_diff_max_bt_min_qt_intra_slice_luma的值应在0到CtbLog2SizeY-MinQtLog2SizeIntraY(含)的范围内。当不存在时,ph_log2_diff_max_bt_min_qt_intra_slice_luma的值被推断为等于sps_log2_diff_max_bt_min_qt_intra_slice_luma。
ph_log2_diff_max_tt_min_qt_intra_slice_luma规定可以使用三元划分的亮度编解码块的亮度样点中的最大尺寸(宽度或高度)的基2对数和由与PH相关联的slice_type等于2(I)的条带中的CTU的四叉树划分产生的亮度叶块的亮度样点中的最小尺寸(宽度或高度)之间的差。ph_log2_diff_max_tt_min_qt_intra_slice_luma的值应在0到CtbLog2SizeY-MinQtLog2SizeIntraY(含)的范围内。当不存在时,ph_log2_diff_max_tt_min_qt_intra_slice_luma的值被推断为等于sps_log2_diff_max_tt_min_qt_intra_slice_luma。
ph_log2_diff_min_qt_min_cb_intra_slice_chroma规定由treeType等于DUAL_TREE_CHROMA的色度CTU的四叉树划分而产生的色度叶块的亮度样点中最小尺寸的基2对数和与PH值相关联的slice_type等于2(I)的条带中的treeType等于DUAL_TREE_CHROMA的色度CU的亮度样点中最小编解码块尺寸的基2对数之间的差。ph_log2_diff_min_qt_min_cb_intra_slice_chroma的值应在0到CtbLog2SizeY-MinCbLog2SizeY(含)的范围内。当不存在时,ph_log2_diff_min_qt_min_cb_intra_slice_chroma的值被推断为等于sps_log2_diff_min_qt_cb_intra_slice_chroma。
ph_max_mtt_hierarchy_depth_intra_slice_chroma规定与PH相关联的slice_type等于2(I)的条带中的treeType等于DUAL_TREE_CHROMA的色度四叉树叶的多类型树划分产生的色度编解码单元的最大层次深度。ph_max_mtt_hierarchy_depth_intra_slice_chroma的值应在0到2*(CtbLog2SizeY-MinCbLog2SizeY)(含)的范围内。当不存在时,ph_max_mtt_hierarchy_depth_intra_slice_chroma的值被推断为等于sps_max_mtt_hierarchy_depth_intra_slice_chroma。
ph_log2_diff_max_bt_min_qt_intra_slice_chroma规定可以使用二元划分的色度编解码块的亮度样点中的最大尺寸(宽度或高度)的基2对数和与PH相关联的slice_type等于2(I)的条带中treeType等于DUAL_TREE_CHROMA的色度CTU的四叉树划分产生的色度叶块的亮度样点中的最小尺寸(宽度或高度)之间的差。ph_log2_diff_max_bt_min_qt_intra_slice_chroma的值应在0到CtbLog2SizeY-MinQtLog2SizeIntraC(含)的范围内。当不存在时,ph_log2_diff_max_bt_min_qt_intra_slice_chroma的值被推断为等于sps_log2_diff_max_bt_min_qt_intra_slice_chroma。
ph_log2_diff_max_tt_min_qt_intra_slice_chroma规定可以使用三元划分的色度编解码块的亮度样点中的最大尺寸(宽度或高度)的基2对数和由与PH相关联的slice_type等于2(I)的条带中treeType等于DUAL_TREE_CHROMA的色度CTU的四叉树划分产生的色度叶块的亮度样点中的最小尺寸(宽度或高度)之间的差。ph_log2_diff_max_tt_min_qt_intra_slice_chroma的值应在0到CtbLog2SizeY-MinQtLog2SizeIntraC(含)的范围内。当不存在时,ph_log2_diff_max_tt_min_qt_intra_slice_chroma的值被推断为等于sps_log2_diff_max_tt_min_qt_intra_slice_chroma。
ph_cu_qp_delta_subdiv_intra_slice规定表示cu_qp_delta_abs和cu_qp_delta_sign_flag的帧内条带中编解码单元的最大cbSubdiv值。ph_cu_qp_delta_subdiv_intra_slice的值应在0到2*(CtbLog2SizeY-MinQtLog2SizeIntraY+ph_max_mtt_hierarchy_depth_intra_slice_luma)(含)的范围内。
当不存在时,ph_cu_qp_delta_subdiv_intra_slice的值被推断为等于0。
ph_cu_chroma_qp_offset_subdiv_intra_slice规定表示cu_chroma_qp_offset_flag的帧内条带中编解码单元的最大cbSubdiv值。ph_cu_chroma_qp_offset_subdiv_intra_slice的值应在0到2*(CtbLog2SizeY-MinQtLog2SizeIntraY+ph_max_mtt_hierarchy_depth_intra_slice_luma)(含)的范围内。
当不存在时,ph_cu_chroma_qp_offset_subdiv_intra_slice的值被推断为等于0。
ph_log2_diff_min_qt_min_cb_inter_slice规定因CTU的四叉树划分而产生的亮度叶块的亮度样点中最小尺寸的基2对数和与PH相关联的slice_type等于0(B)或1(P)的条带中亮度CU的亮度样点中最小亮度编解码块尺寸的基2对数之间的差。ph_log2_diff_min_qt_min_cb_inter_slice的值应在0到CtbLog2SizeY-MinCbLog2SizeY(含)的范围内。当不存在时,ph_log2_diff_min_qt_min_cb_luma的值被推断为等于sps_log2_diff_min_qt_min_cb_inter_slice。
ph_max_mtt_hierarchy_depth_inter_slice规定由与PH相关联的slice_type等于0(B)或1(P)的条带中的四叉树叶的多类型树划分产生的编解码单元的最大层次深度。ph_max_mtt_hierarchy_depth_inter_slice的值应在0到2*(CtbLog2SizeY-MinCbLog2SizeY)(含)的范围内。当不存在时,ph_max_mtt_hierarchy_depth_inter_slice的值被推断为等于sps_max_mtt_hierarchy_depth_inter_slice。
ph_log2_diff_max_bt_min_qt_inter_slice规定可以使用二元划分的亮度编解码块的亮度样点中的最大尺寸(宽度或高度)的基2对数和与PH相关联的slice_type等于0(B)或1(P)的条带中的CTU的四叉树划分产生的亮度叶块的亮度样点中的最小尺寸(宽度或高度)之间的差。ph_log2_diff_max_bt_min_qt_inter_slice的值应在0到CtbLog2SizeY-MinQtLog2SizeInterY(含)的范围内。当不存在时,ph_log2_diff_max_bt_min_qt_inter_slice的值被推断为等于sps_log2_diff_max_bt_min_qt_inter_slice。
ph_log2_diff_max_tt_min_qt_inter_slice规定可以使用三元划分的亮度编解码块的亮度样点中的最大尺寸(宽度或高度)的基2对数和与PH相关联的slice_type等于0(B)或1(P)的条带中的CTU的四叉树划分产生的亮度叶块的亮度样点中的最小尺寸(宽度或高度)之间的差。ph_log2_diff_max_tt_min_qt_inter_slice的值应在0到CtbLog2SizeY-MinQtLog2SizeInterY(含)的范围内。当不存在时,ph_log2_diff_max_tt_min_qt_inter_slice的值被推断为等于sps_log2_diff_max_tt_min_qt_inter_slice。
ph_cu_qp_delta_subdiv_inter_slice规定在表示cu_qp_delta_abs和cu_qp_delta_sign_flag帧间条带中的编解码单元的最大cbSubdiv值。ph_cu_qp_delta_subdiv_inter_slice的值应在0到2*(CtbLog2SizeY-MinQtLog2SizeInterY+ph_max_mtt_hierarchy_depth_inter_slice)(含)的范围内。
当不存在时,ph_cu_qp_delta_subdiv_inter_slice的值被推断为等于0。
ph_cu_chroma_qp_offset_subdiv_inter_slice规定表示cu_chroma_qp_offset_flag的帧间条带中编解码单元的最大cbSubdiv值。ph_cu_chroma_qp_offset_subdiv_inter_slice的值应在0到2*(CtbLog2SizeY-MinQtLog2SizeInterY+ph_max_mtt_hierarchy_depth_inter_slice)(含)的范围内。
当不存在时,ph_cu_chroma_qp_offset_subdiv_inter_slice的值被推断为等于0。
ph_temporal_mvp_enabled_flag规定时域运动矢量预测值是否可以用于与PH相关联的条带的帧间预测。如果ph_temporal_mvp_enabled_flag等于0,则与PH相关联的条带的语法元素应受到约束,使得在条带的解码中不使用时域运动矢量预测值。否则(ph_temporal_mvp_enabled_flag等于1),时域运动矢量预测值可以用于解码与PH相关联的条带。当不存在时,ph_temporal_mvp_enabled_flag的值被推断为等于0。当DPB中没有参考图片具有与当前图片相同的空域分辨率时,ph_temporal_mvp_enabled_flag的值应等于0。
按照如下方式推导基于子块的merging MVP候选的最大数目MaxNumSubblockMergeCand:
if(sps_affine_enabled_flag)
MaxNumSubblockMergeCand=5-five_minus_max_num_subblock_merge_cand
(88)
else
MaxNumSubblockMergeCand=sps_sbtmvp_enabled_flag&&ph_temporal_mvp_enable_flag
MaxNumSubblockMergeCand的值应在0到5(含)的范围内。
ph_collocated_from_l0_flag等于1规定用于时域运动矢量预测的并置图片从参考图片列表0导出。ph_collocated_from_l0_flag等于0规定用于时域运动矢量预测的并置图片从参考图片列表1导出。
ph_collocated_ref_idx规定用于时域运动矢量预测的并置图片的参考索引。
当ph_collocated_from_l0_flag等于1时,ph_collocated_ref_idx指代参考图片列表0中的条目,并且ph_collocated_ref_idx的值应在0到num_ref_entries[0][PicRplsIdx[0]]-1(含)的范围内。
当ph_collocated_from_l0_flag等于0时,ph_collocated_ref_idx指代参考图片列表1中的条目,并且ph_collocated_ref_idx的值应在0到num_ref_entries[1][PicRplsIdx[1]]-1(含)的范围内。
当不存在时,ph_collocated_ref_idx的值被推断为等于0。
mvd_l1_zero_flag等于1指示未解析mvd_coding(x0,y0,1)语法结构,并且对于compIdx=0..1且cpIdx=0..2,MvdL1[x0][y0][compIdx]和MvdCpL1[x0][y0][cpIdx][compIdx]被设置为等于0。mvd_l1_zero_flag等于0指示mvd_coding(x0,y0,1)语法结构被解析。
ph_fpel_mmvd_enabled_flag等于1规定具有运动矢量差的merge模式在与PH相关联的条带中使用整数样点精度。ph_fpel_mmvd_enabled_flag等于0规定具有运动矢量差的merge模式可以在与PH相关联的条带中使用分数样点精度。当不存在时,ph_fpel_mmvd_enabled_flag的值被推断为0。
ph_disable_bdof_flag等于1规定在与PH相关联的条带中禁用基于双向光流帧间预测的帧间双向预测。ph_disable_bdof_flag等于0规定在与PH相关联的条带中可以启用也可以不启用基于双向光流帧间预测的帧间双向预测。
当ph_disable_bdof_flag不存在时,以下内容适用:
–如果sps_bdof_enabled_flag等于1,则ph_disable_bdof_flag的值被推断为等于0。
–否则(sps_bdof_enabled_flag等于0),ph_disable_bdof_flag的值被推断为等于1。
ph_disable_dmvr_flag等于1规定在与PH相关联的条带中禁用基于解码器运动矢量优化的帧间双向预测。ph_disable_dmvr_flag等于0规定在与PH相关联的条带中可以启用也可以不启用基于解码器运动矢量优化的帧间双向预测。
当ph_disable_dmvr_flag不存在时,以下内容适用:
–如果sps_dmvr_enabled_flag等于1,ph_disable_dmvr_flag的值被推断为等于0。
–否则(sps_dmvr_enabled_flag等于0),ph_disable_dmvr_flag的值被推断为等于1。
ph_disable_prof_flag等于1规定在与PH相关联的条带中禁用具有光流的预测优化。ph_disable_prof_flag等于0规定在与PH相关联的条带中可以启用或不启用具有光流的预测优化。
当ph_disable_prof_flag不存在时,以下内容适用:
–如果sps_affine_prof_enabled_flag等于1,则ph_disable_prof_flag的值被推断为等于0。
–否则(sps_affine_prof_enabled_flag等于0),则ph_disable_prof_flag的值被推断为等于1。
ph_qp_delta规定要用于图片中的编解码块的QpY的初始值,直到被编解码单元层中的CuQpDeltaVal的值修改为止。
当qp_delta_info_in_ph_flag等于1时,按照如下方式推导图片的所有条带的QpY量化参数的初始值SliceQpY
SliceQpY=26+init_qp_minus26+ph_qp_delta (89)
SliceQpY的值应在-QpBdOffset到+63(含)的范围内。
ph_joint_cbcr_sign_flag规定在tu_joint_cbcr_residual_flag[x0][y0]等于1的变换单元中,两个色度分量的并置残差样点是否具有倒符号。当tu_joint_cbcr_residual_flag[x0][y0]对于变换单元等于1时,ph_joint_cbcr_sign_flag等于0规定Cr(或Cb)分量的每个残差样点的符号与并置Cb(或Cr)残差样点的符号相同,并且ph_joint_cbcr_sign_flag等于1规定Cr(或Cb)分量的每个残差样点的符号由并置Cb(或Cr)残差样点的倒符号给出。
ph_sao_luma_enabled_flag等于1规定在与PH相关联的所有条带中为亮度分量启用SAO;ph_sao_luma_enabled_flag等于0规定可以对与PH相关联的一个或多个或所有条带禁用亮度分量的SAO。当ph_sao_luma_enabled_flag不存在时,其被推断为等于0。
ph_sao_chroma_enabled_flag等于1规定为与PH相关联的所有条带中的色度分量启用SAO;ph_sao_chroma_enabled_flag等于0规定可以对与PH相关联的一个或多个或所有条带禁用色度分量的SAO。当ph_sao_chroma_enabled_flag不存在时,其被推断为等于0。
ph_dep_quant_enabled_flag等于0规定为当前图片禁用相关量化。ph_dep_quant_enabled_flag等于1规定为当前图片启用相关量化。当ph_dep_quant_enabled_flag不存在时,其被推断为等于0。
pic_sign_data_hiding_enabled_flag等于0规定对当前图片禁用符号位隐藏。pic_sign_data_hiding_enabled_flag等于1规定为当前图片启用符号位隐藏。当pic_sign_data_hiding_enabled_flag不存在时,其被推断为等于0。
ph_deblocking_filter_override_flag等于1规定PH中存在去方块参数。ph_deblocking_filter_override_flag等于0规定PH中不存在去方块参数。当不存在时,ph_deblocking_filter_override_flag的值被推断为等于0。
ph_deblocking_filter_disabled_flag等于1规定去方块滤波器的操作不被应用于与PH相关联的条带。ph_deblocking_filter_disabled_flag等于0规定去方块滤波器的操作不被应用于与PH相关联的条带。当ph_deblocking_filter_disabled_flag不存在时,其被推断为等于pps_deblocking_filter_disabled_flag。
ph_beta_offset_div2和ph_tc_offset_div2规定应用于与PH相关联的条带的亮度分量的β和tC(除以2)的去方块参数偏移量。ph_beta_offset_div2和ph_tc_offset_div2的值均应在-12至12(含)的范围内。当不存在时,ph_beta_offset_div2和ph_tc_offset_div2的值分别被推断为等于pps_beta_offset_div2和pps_tc_offset_div2。
ph_cb_beta_offset_div2和ph_cb_tc_offset_div2规定应用于与PH相关联的条带的Cb分量的β和tC(除以2)的去方块参数偏移。ph_cb_beta_offset_div2和ph_cb_tc_offset_div2的值均应在-12至12(含)的范围内。当不存在时,ph_cb_beta_offset_div2和ph_cb_tc_offset_div2的值分别被推断为等于pps_cb_beta_offset_div2和pps_cb_tc_offset_div2。
ph_cr_beta_offset_div2和ph_cr_tc_offset_div2规定应用于与PH相关联的条带的Cr分量的β和tC(除以2)的去方块参数偏移量。ph_cr_beta_offset_div2和ph_cr_tc_offset_div2的值均应在-12至12(含)的范围内。当不存在时,ph_cr_beta_offset_div2和ph_cr_tc_offset_div2的值被分别推断为等于pps_cr_beta_offset_div2和pps_cr_tc_offset_div2。
ph_extension_length规定以字节为单位的PH扩展数据的长度,不包括用于信令通知ph_extension_length本身的位。ph_extension_length的值应在0到256(含)的范围内。当不存在时,ph_extension_length的值被推断为等于0。
ph_extension_data_byte可以具有任何值。符合本规范本版本的解码器应忽略ph_extension_data_byte的值。其值不影响解码器与本规范版本中规定的简档的一致性。
7.4.8条带标头语义
7.4.8.1通用条带标头语义
变量CuQpDeltaVal被设置为等于0,其规定包含cu_qp_delta_abs的编解码单元的量化参数与其预测之间的差。规定在确定包含cu_chroma_qp_offset_flag的编解码单元的Qp'Cb、Qp'Cr和Qp'CbCr量化参数的各自值时要使用的值的变量CuQpOffsetCb、CuQpOffsetCr和CuQpOffsetCbCr都被设置为等于0。
picture_header_in_slice_header_flag等于1规定PH语法结构存在于条带标头中。picture_header_in_slice_header_flag等于0规定PH语法结构不存在于条带标头中。
比特流一致性的一个要求是,CLVS中所有编解码条带中的picture_header_in_slice_header_flag的值应相同。
当编解码条带的picture_header_in_slice_header_flag等于1时,比特流一致性的要求是没有nal_unit_type等于PH_NUT的VCL NAL单元应当存在于CLVS中。
当picture_header_in_slice_header_flag等于0时,当前图片中的所有编解码条带的picture_header_in_slice_header_flag应等于0,并且当前PU应具有PH NAL单元。
slice_subpic_id规定包含条带的子图片的子图片ID。如果存在slice_subpic_id,则推导变量CurrSubpicIdx的值以使得SubpicIdVal[CurrSubpicIdx]等于slice_subpic_id。否则(slice_subpic_id不存在),则CurrSubpicIdx被推导为等于0。slice_subpic_id的长度为sps_subpic_id_len_minus1+1位。
slice_address规定条带的条带地址。当不存在时,slice_address的值被推断为等于0。当rect_slice_flag等于1且NumSlicesInSubpic[CurrSubicIdx]等于1时,slice_address的值被推断为等于0。
如果rect_slice_flag等于0,则以下内容适用:
-条带地址是光栅扫描片索引。
-slice_address的长度为Ceil(Log2(NumTilesInPic))位。
-slice_address的值应在0到NumTilesInPic-1(含)的范围内。
否则(rect_slice_flag等于1),以下内容适用:
-条带地址是条带的子图片级条带索引。
-slice_address的长度为Ceil(Log2(NumSlicesInSubpic[CurrSubpicIdx]))位。
-slice_address的值应在0到NumSlicesInSubpic[CurrSubpicIdx]-1(含)的范围内。
比特流一致性的要求是应用以下约束:
-如果rect_slice_flag等于0或subpic_info_present_flag等于0,则slice_address的值应当不等于同一编解码图片的任何其它编解码条带NAL单元的slice_address的值。
-否则,slice_subpic_id和slice_address值对应当不等于同一编解码图片的任何其它编解码条带NAL单元的slice_subpic_id和slice_address值对。
-图片的条带的形状应当使得每个CTU在被解码时应使其整个左边界和整个顶部边界由图片边界或先前解码的CTU边界组成。
sh_extra_bit[i]可以等于1或0。符合本规范本版本的解码器应忽略sh_extra_bit[i]的值。其值不影响解码器与本规范版本中规定的简档的一致性。
num_tiles_in_slice_minus1加1(当存在时)规定条带中的片的数目。num_tiles_in_slice_minus1的值应在0到NumTilesInPic-1(含)的范围内。
按照如下方式推导规定当前条带中CTU的数目的变量NumCtusInCurrSlice以及规定条带内第i个CTB的图片光栅扫描地址的列表CtbAddrInCurrSlice[i](对于0到NumCtusInCurrSlice-1(含)范围内的i):
Figure BDA0003793174210001131
按照如下方式推导变量SubpicLeftBoundaryPos、SubpicTopBoundaryPos、SubpicRightBoundaryPos和SubpicBotBoundaryPos:
Figure BDA0003793174210001141
slice_type规定根据表格9的条带的编解码类型。
表格9—与slice_type的名称关联
slice_type slice_type的名称
0 B(B条带)
1 P(P条带)
2 I(I条带)
当不存在时,slice_type的值被推断为等于2。
当ph_intra_slice_allowed_flag等于0时,slice_type的值应当等于0或1。当nal_unit_type在IDR_W_RADL到CRA_NUT(含)的范围内且vps_independent_layer_flag[GeneralLayerIdx[nuh_layer_id]]等于1时,slice_type应当等于2。
按照如下方式推导变量MinQtLog2SizeY、MinQtLog2SizeC、MinQtSizeY、MinQtSizeC、MaxBtSizeY、MaxBtSizeC、MinBtSizeY、MaxTtSizeY、MaxTtSizeC、MinTtSizeY、MaxMttDepthY和MaxMttDepthC:If slice_type equal to 2(I),
MinQtLog2SizeY=MinCbLog2SizeY+ph_log2_diff_min_qt_min_cb_intra_slice_luma (119)
MinQtLog2SizeC=MinCbLog2SizeY+ph_log2_diff_min_qt_min_cb_intra_slice_chroma (120)
MaxBtSizeY=1<<(MinQtLog2SizeY+ph_log2_diff_max_bt_min_qt_intra_slice_luma) (121)
MaxBtSizeC=1<<(MinQtLog2SizeC+ph_log2_diff_max_bt_min_qt_intra_slice_chroma) (122)
MaxTtSizeY=1<<(MinQtLog2SizeY+ph_log2_diff_max_tt_min_qt_intra_slice_luma) (123)
MaxTtSizeC=1<<(MinQtLog2SizeC+ph_log2_diff_max_tt_min_qt_intra_slice_chroma) (124)
MaxMttDepthY=ph_max_mtt_hierarchy_depth_intra_slice_luma (125)
MaxMttDepthC=ph_max_mtt_hierarchy_depth_intra_slice_chroma (126)
CuQpDeltaSubdiv=ph_cu_qp_delta_subdiv_intra_slice (127)
CuChromaQpOffsetSubdiv=ph_cu_chroma_qp_offset_subdiv_intra_slice (128)
Otherwise(slice_type equal to 0(B)or 1(P)),
MinQtLog2SizeY=MinCbLog2SizeY+ph_log2_diff_min_qt_min_cb_inter_slice (129)
MinQtLog2SizeC=MinCbLog2SizeY+ph_log2_diff_min_qt_min_cb_inter_slice (130)
MaxBtSizeY=1<<
(MinQtLog2SizeY+ph_log2_diff_max_bt_min_qt_inter_slice) (131)
MaxBtSizeC=1<<
(MinQtLog2SizeC+ph_log2_diff_max_bt_min_qt_inter_slice) (132)
MaxTtSizeY=1<<
(MinQtLog2SizeY+ph_log2_diff_max_tt_min_qt_inter_slice) (133)
MaxTtSizeC=1<<
(MinQtLog2SizeC+ph_log2_diff_max_tt_min_qt_inter_slice) (134)
MaxMttDepthY=ph_max_mtt_hierarchy_depth_inter_slice (135)
MaxMttDepthC=ph_max_mtt_hierarchy_depth_inter_slice (136)
CuQpDeltaSubdiv=ph_cu_qp_delta_subdiv_inter_slice (137)
CuChromaQpOffsetSubdiv=ph_cu_chroma_qp_offset_subdiv_inter_slice (138)
MinQtSizeY=1<<MinQtLog2SizeY (139)
MinQtSizeC=1<<MinQtLog2SizeC (140)
MinBtSizeY=1<<MinCbLog2SizeY (141)
MinTtSizeY=1<<MinCbLog2SizeY (142)
slice_alf_enabled_flag等于1规定自适应环路滤波器被启用并可以应用于条带中的Y、Cb或Cr颜色分量。slice_alf_enabled_flag等于0规定对条带中的所有颜色分量禁用自适应环路滤波器。当不存在时,slice_alf_enabled_flag的值被推断为等于ph_alf_enabled_flag。
slice_num_alf_aps_ids_luma规定条带引用的ALF APS的数目。当slice_alf_enabled_flag等于1且slice_num_alf_aps_ids_luma不存在时,slice_num_alf_aps_ids_luma的值被推断为等于ph_num_alf_aps_ids_luma的值。
slice_alf_aps_id_luma[i]规定条带的亮度分量所引用的第i个ALF APS的adaptation_parameter_set_id。aps_params_type等于ALF_APS且adaptation_parameter_set_id等于slice_alf_aps_id_luma[i]的APS NAL单元的TemporalId应小于或等于编解码的条带NAL单元的TemporalId。当slice_alf_enabled_flag等于1且slice_alf_aps_id_luma[i]不存在时,slice_alf_aps_id_luma[i]的值被推断为等于ph_alf_aps_id_luma[i]的值。
aps_params_type等于ALF_APS且adaptation_parameter_set_id等于slice_alf_aps_id_luma[i]的APS NAL单元的alf_luma_filter_signal_flag的值应等于1。
slice_alf_chroma_idc等于0规定自适应环路滤波器不被应用于Cb和Cr颜色分量。slice_alf_chroma_idc等于1指示自适应环路滤波器被应用于Cb颜色分量。slice_alf_chroma_idc等于2指示自适应环路滤波器被应用于Cr颜色分量。slice_alf_chroma_idc等于3指示自适应环路滤波器被应用于Cb和Cr颜色分量。当slice_alf_chroma_idc不存在时,其被推断为等于ph_alf_chroma_idc。
slice_alf_aps_id_chroma规定条带的色度分量所引用的ALF APS的adaptation_parameter_set_id。aps_params_type等于ALF_APS且adaptation_parameter_set_id等于slice_alf_aps_id_chroma的APS NAL单元的TemporalId应小于或等于编解码的条带NAL单元的TemporalId。当slice_alf_enabled_flag等于1且slice_alf_aps_id_chroma不存在时,slice_alf_aps_id_chroma的值被推断为等于ph_alf_aps_id_chroma的值。
aps_params_type等于ALF_APS且adaptation_parameter_set_id等于slice_alf_aps_id_chroma的APS NAL单元的alf_chroma_filter_signal_flag值应等于1。
slice_cc_alf_cb_enabled_flag等于0规定交叉分量滤波器不被应用于Cb颜色分量。slice_cc_alf_cb_enabled_flag等于1指示交叉分量滤波器已启用,并且可以应用于Cb颜色分量。当slice_cc_alf_cb_enabled_flag不存在时,其被推断为等于ph_cc_alf_cb_enabled_flag。
slice_cc_alf_cb_aps_id规定条带的Cb颜色分量所引用的adaptation_parameter_set_id。
aps_params_type等于ALF_APS且adaptation_parameter_set_id等于slice_cc_alf_cb_aps_id的APS NAL单元的TemporalId应小于或等于编解码的条带NAL单元的TemporalId。当slice_cc_alf_cb_enabled_flag等于1且slice_cc_alf_cb_aps_id不存在时,slice_cc_alf_cb_aps_id的值被推断为等于ph_cc_alf_cb_aps_id的值。
aps_params_type等于ALF_APS且adaptation_parameter_set_id等于slice_cc_alf_cb_aps_id的APS NAL单元的alf_cc_cb_filter_signal_flag的值应等于1。
slice_cc_alf_cr_enabled_flag等于0规定交叉分量滤波器不被应用于Cr颜色分量。slice_cc_alf_cb_enabled_flag等于1指示交叉分量自适应环路滤波器已启用,并且可以应用于Cr颜色分量。当slice_cc_alf_cr_enabled_flag不存在时,其被推断为等于ph_cc_alf_cr_enabled_flag。
slice_cc_alf_cr_aps_id规定条带的Cr颜色分量所引用的adaptation_parameter_set_id。aps_params_type等于ALF_APS且adaptation_parameter_set_id等于slice_cc_alf_cr_aps_id的APS NAL单元的TemporalId应小于或等于编解码的条带NAL单元的TemporalId。当slice_cc_alf_cr_enabled_flag等于1且slice_cc_alf_cr_aps_id不存在时,slice_cc_alf_cr_aps_id的值被推断为等于ph_cc_alf_cr_aps_id的值。
aps_params_type等于ALF_APS且adaptation_parameter_set_id等于slice_cc_alf_cr_aps_id的APS NAL单元的alf_cc_cr_filter_signal_flag的值应等于1。
当separate_colour_plane_flag等于1时,colour_plane_id标识与当前条带相关联的颜色平面。colour_plane_id的值应在0到2(含)的范围内。colour_plane_id值0、1和2分别对应于Y、Cb和Cr平面。colour_plane_id的值3被保留以供ITU-T|ISO/IEC将来使用。
注1–一张图片的不同颜色平面的解码过程之间没有相关性。
num_ref_idx_active_override_flag等于1规定存在语法元素num_ref_idx_active_minus1[0]用于P和B条带,并且存在语法元素num_ref_idx_active_minus1[1]用于B条带。num_ref_idx_active_override_flag等于0规定语法元素num_ref_idx_active_minus1[0]和num_ref_idx_active_minus1[1]不存在。当不存在时,num_ref_idx_active_override_flag的值被推断为等于1。
num_ref_idx_active_minus1[i]用于推导等式143规定的变量NumRefIdxActive[i]。num_ref_idx_active_minus1[i]的值应在0到14(含)的范围内。
对于i等于0或1,在当前条带为B条带,num_ref_idx_active_override_flag等于1,且num_ref_idx_active_minus1[i]不存在时,num_ref_idx_active_minus1[i]被推断为等于0。
在当前条带为P条带,num_ref_idx_active_override_flag等于1,且num_ref_idx_active_minus1[0]不存在时,num_ref_idx_active_minus1[0]被推断为等于0。
按照如下方式推导变量NumRefIdxActive[i]:
Figure BDA0003793174210001181
NumRefIdxActive[i]-1的值规定可以用于解码条带的参考图片列表i的最大参考索引。当NumRefIdxActive[i]的值等于0时,没有参考图片列表i的参考索引可以用于解码条带。
在当前条带为P条带时,NumRefIdxActive[0]的值应大于0。
在当前条带为B条带时,NumRefIdxActive[0]和NumRefIdxActive[1]都应大于0。
cabac_init_flag规定用于确定上下文变量初始化过程中使用的初始化表格的方法。当cabac_init_flag不存在时,其被推断为等于0。
slice_collocated_from_l0_flag等于1规定从参考图片列表0推导用于时域运动矢量预测的并置图片。slice_collocated_from_l0_flag等于0规定从参考图片列表1推导用于时域运动矢量预测的并置图片。
当slice_type等于B或P、ph_temporal_mvp_enabled_flag等于1且slice_collocated_from_l0_flag不存在时,以下内容适用:
–如果rpl_info_in_ph_flag等于1,则slice_collocated_from_l0_flag被推断为等于ph_collocated_from_l0_flag。
–否则(rpl_info_in_ph_flag等于0且如果slice_type等于P,则slice_collocated_from_l0_flag的值被推断为等于1。
slice_collocated_ref_idx规定用于时域运动矢量预测的并置图片的参考索引。
当slice_type等于P或slice_type等于B且collocated_from_l0_flag等于1时,slice_collocated_ref_idx指代参考图片列表0中的条目,且slice_collocated_ref_idx的值应在0到NumRefIdxActive[0]-1(含)的范围内。
当slice_type等于B且slice_collocated_from_l0_flag等于0时,slice_collocated_ref_idx指代参考图片列表1中的条目,且slice_collocated_ref_idx的值应在0到NumRefIdxActive[1]-1(含)的范围内。
当slice_collocated_ref_idx不存在时,以下内容适用:
–如果rpl_info_in_ph_flag等于1,则slice_collocated_ref_idx的值被推断为等于ph_collocated_ref_idx。
–否则(rpl_info_in_ph_flag等于0),slice_collocated_ref_idx的值被推断为等于0。
比特流一致性的一个要求是,slice_collocated_ref_idx所引用的图片对于编解码图片的所有条带都应相同。
比特流一致性的一个要求是,由slice_collocated_ref_idx所引用的参考图片的pic_width_in_luma_samples和pic_height_in_luma_samples的值应分别等于当前图片的pic_width_in_luma_samples和pic_height_in_luma_samples的值,并且RprConstraintsActive[slice_collocated_from_l0_flag?0:1][slice_collocated_ref_idx]应等于0。
slice_qp_delta规定用于条带中编解码块的QpY的初始值,直到被编解码单元层中的CuQpDeltaVal值修改为止。
当qp_delta_info_in_ph_flag等于0时,按照如下方式推导条带的QpY量化参数的初始值SliceQpY
SliceQpY=26+init_qp_minus26+slice_qp_delta (144)
SliceQpY的值应在-QpBdOffset到+63(含)的范围内。
当以下任一条件为真时:
–wp_info_in_ph_flag的值等于1,pps_weighted_pred_flag的值等于1,且slice_type的值等于P。
–wp_info_in_ph_flag的值等于1,pps_weighted_bipred_flag的值等于1,且slice_type的值等于B。
以下内容适用:
–NumRefIdxActive[0]的值应小于或等于NumWeightsL0的值。
–对于每个参考图片索引RefPicList[0][i](对于0到NumRefIdxActive[0]-1(含)范围内的i),应用于参考图片索引的亮度权重、Cb权重和Cr权重分别为LumaWeightL0[i]、ChromaWeightL0[0][i]和ChromaWeightL0[1][i]。
当wp_info_in_ph_flag等于1、pps_weighted_bipred_flag等于1且slice_type等于B时,以下内容适用:
–NumRefIdxActive[1]的值应小于或等于NumWeightsL1的值。
–对于每个参考图片索引RefPicList[1][i](对于0到NumRefIdxActive[1]-1(含)范围内的i),应用于参考图片索引的亮度权重、Cb权重和Cr权重分别为LumaWeightL1[i]、ChromaWeightL1[0][i]和ChromaWeightL1[1][i]。
slice_cb_qp_offset规定在确定Qp'Cb量化参数的值时要添加到pps_cb_qp_offset的差值。slice_cb_qp_offset的值应在-12至+12(含)的范围内。当slice_cb_qp_offset不存在时,其被推断为等于0。pps_cb_qp_offset+slice_cb_qp_offset的值应在-12至+12(含)的范围内。
slice_cr_qp_offset规定在确定Qp'Cr量化参数的值时要添加到pps_cr_qp_offset的差值。slice_cr_qp_offset的值应在-12至+12(含)的范围内。当slice_cr_qp_offset不存在时,其被推断为等于0。pps_cr_qp_offset+slice_cr_qp_offset的值应在-12至+12(含)的范围内。
slice_joint_cbcr_qp_offset规定在确定Qp'CbCr的值时,要添加到pps_joint_cbcr_qp_offset_value的差值。slice_joint_cbcr_qp_offset的值应在-12至+12(含)的范围内。当slice_joint_cbcr_qp_offset不存在时,其被推断为等于0。pps_joint_cbcr_qp_offset_value+slice_joint_cbcr_qp_offset的值应在-12至+12(含)的范围内。
cu_chroma_qp_offset_enabled_flag等于1规定cu_chroma_qp_offset_flag可能存在于变换单元和调色板编解码语法中。cu_chroma_qp_offset_enabled_flag等于0规定变换单元或调色板编解码语法中不存在cu_chroma_qp_offset_flag。当不存在时,cu_chroma_qp_offset_enabled_flag的值被推断为等于0。
slice_sao_luma_flag等于1规定为当前条带中的亮度分量启用SAO;slice_sao_luma_flag等于0规定为当前条带中的亮度分量禁用SAO。当slice_sao_luma_flag不存在时,其被推断为等于ph_sao_luma_enabled_flag。
slice_sao_chroma_flag等于1规定为当前条带中的色度分量启用SAO;slice_sao_chroma_flag等于0规定为当前条带中的色度分量禁用SAO。当slice_sao_chroma_flag不存在时,其被推断为等于ph_sao_chroma_enabled_flag。
slice_deblocking_filter_override_flag等于1规定条带标头中存在去方块参数。slice_deblocking_filter_override_flag等于0规定条带标头中不存在去方块参数。当不存在时,slice_deblocking_filter_override_flag的值被推断为等于ph_deblocking_filter_override_flag。
slice_deblocking_filter_disabled_flag等于1规定为当前条带不应用去方块滤波器的操作。slice_deblocking_filter_disabled_flag等于0规定为当前条带应用去方块滤波器的操作。当slice_deblocking_filter_disabled_flag不存在时,其被推断为等于ph_deblocking_filter_disabled_flag。
slice_beta_offset_div2和slice_tc_offset_div2规定应用于当前条带的亮度分量的β和tC(除以2)的去方块参数偏移。slice_beta_offset_div2和slice_tc_offset_div2的值均应在-12至12(含)的范围内。当不存在时,slice_beta_offset_div2和slice_tc_offset_div2的值分别被推断为等于ph_beta_offset_div2和ph_tc_offset_div2。
slice_cb_beta_offset_div2和slice_cb_tc_offset_div2规定应用于当前条带的Cb分量的β和tC(除以2)的去方块参数偏移。slice_cb_beta_offset_div2和slice_cb_tc_offset_div2的值均应在-12至12(含)的范围内。当不存在时,slice_cb_beta_offset_div2和slice_cb_tc_offset_div2的值分别被推断为等于ph_cb_beta_offset_div2和ph_cb_tc_offset_div2。
slice_cb_beta_offset_div2和slice_cb_tc_offset_div2规定应用于当前条带的Cr分量的β和tC(除以2)的去方块参数偏移。slice_cr_beta_offset_div2和slice_cr_tc_offset_div2的值均应在-12至12(含)的范围内。当不存在时,slice_cr_beta_offset_div2和slice_cr_tc_offset_div2的值分别被推断为等于ph_cr_beta_offset_div2和ph_cr_tc_offset_div2。
slice_ts_residual_coding_disabled_flag规定residual_coding()语法结构用于解析当前条带的变换跳过块的残差样点。slice_ts_residual_coding_disabled_flag等于0规定residual_ts_coding()语法结构用于解析当前条带的变换跳过块的残差样点。当slice_ts_residual_coding_disabled_flag不存在时,其被推断为等于0。
slice_lmcs_enabled_flag等于1规定为当前条带启用具有色度缩放的亮度映射。slice_lmcs_enabled_flag等于0规定不为当前条带启用具有色度缩放的亮度映射。当slice_lmcs_enabled_flag不存在时,其被推断为等于0。
slice_scaling_list_present_flag等于1规定用于当前条带的缩放列表数据是基于aps_params_type等于SCALING_APS且adaptation_parameter_set_id等于ph_scaling_list_aps_id的引用缩放列表APS中包含的缩放列表数据推导的。slice_scaling_list_present_flag等于0规定用于当前图片的缩放列表数据是条款7.4.3.21中规定推导的默认缩放列表数据。当不存在时,slice_scaling_list_present_flag的值被推断为等于0。
按照如下方式推导规定当前条带中入口点的数目的变量NumEntryPoints:
Figure BDA0003793174210001231
offset_len_minus1加1规定entry_point_offset_minus1[i]语法元素的长度(以位为单位)。offset_len_minus1的值应在0到31(含)的范围内。
entry_point_offset_minus1[i]加1规定第i个入口点偏移(以字节为单位),并由offset_len_minus1加1位表示。条带标头后面的条带数据由NumEntryPoints+1个子集组成,其中子集索引值范围为从0到NumEntryPoints(含)。条带数据的第一个字节被视为字节0。当存在时,出于子集识别的目的,出现在编解码条带NAL单元的条带数据部分中的仿真防止字节被计数为条带数据的一部分。子集0由编解码条带数据的字节0到entry_point_offset_minus1[0](含)组成,子集k由编解码条带数据的字节firstByte[k]到lastByte[k](含)组成(其中k在1到NumEntryPoints-1(含)的范围内),其中firstByte[k]和lastByte[k]被定义为:
Figure BDA0003793174210001232
lastByte[k]=firstByte[k]+entry_point_offset_minus1[k] (147)
最后一个子集(子集索引等于NumEntryPoints)由编解码条带数据的剩余字节组成。
当sps_entropy_coding_sync_enabled_flag等于0且条带包含一个或多个完整的片时,每个子集应由该条带中位于同一片内的所有CTU的所有编解码位组成,并且子集的数目(即NumEntryPoints+1的值)应等于该条带中的片的数目。
当sps_entropy_coding_sync_enabled_flag等于0且该条带包含来自单个片的CTU行的子集时,NumEntryPoints应为0并且子集的数目应为1。子集应由条带中所有CTU的所有编解码位组成。
当sps_entropy_coding_sync_enabled_flag等于1时,每个子集k(其中k在0到NumEntryPoints范围内(含))应由片内CTU行中的所有CTU的所有编解码位组成,并且子集的数目(即NumEntryPoints+1的值)应等于条带中特定于片的CTU行的总数。
slice_header_extension_length规定以字节为单位的条带标头扩展数据的长度,不包括用于信令通知slice_header_extension_length本身的位。slice_header_extension_length的值应在0到256(含)的范围内。当不存在时,slice_header_extension_length的值被推断为等于0。
slice_header_extension_data_byte[i]可以有任何值。符合本规范本版本的解码器应忽略所有slice_header_extension_data_byte[i]语法元素的值。其值不影响解码器与本规范版本中规定的简档的一致性。
公开的技术解决方案解决的示例技术问题
HLS的当前设计中存在若干潜在问题,其被描述如下。
(1)SPS、图片标头和条带标头中的时域预测标志的控制使得P条带和/或B条带出现问题。
a)时域预测标志的图片标头和条带级别控制可能导致P条带的未初始化的并置图片和/或并置参考索引。
b)Slice_collocated_ref_idx指代参考图片列表1中的条目可以用于P条带。
c)对于P条带,slice_collocated_ref_idx的值指代参考图片列表0中的条目可能超出o到NumRefIdxActive[0]-1的范围。
d)图片级和条带级时域预测标志是关于并置图片是来自L0还是L1,以及引用哪些参考图片,但是没有诸如是否允许时域预测之类的高级控制,这可能不够清楚。
(2)考虑到相关语法元素的交互作用,可能需要修改子图片相关语法元素的语义,以获得更准确的解释。
a)当只有一个子图片时,sps_independent_subpics_flag可能等于0。
b)当子图片中只有一个条带时,仍然需要计算而不是推断slice_width_in_tiles_minus1的值。
c)当图片中只有一个条带和/或一个片时,single_slice_per_subpic_flag可能等于0。
d)当不存在single_slice_per_subpic_flag,例如当no_pic_partition_flag等于1时,则会将single_slice_per_subpic_flag推断为0。比特流一致性的一个要求是当sps_num_subpics_minus1+1的值大于1时,no_pic_partition_flag的值不应等于1。因此一张图片中只有一个子图片。并且由于子图片中只有一个条带,因此在这种情况下,single_slice_per_subpic_flag应等于1。
(3)在子图片子比特流提取过程中,一些语法元素没有被正确设置。
a)未写入从子比特流提取过程中提取的子图片的语法元素,如sps_independent_subpics_flag、subpic_treated_as_pic_flag、loop_filter_across_subpic_enabled_flag和no_pic_partition_flag,这可能是不期望的。
b)子图片子比特流提取过程取决于子图片ID,其可以在不同图片的基础上改变。这将导致从不同图片中提取不同的子图片索引,这可能是不期望的。
c)子图片子比特流提取过程的输出流的sps_num_subpics_minus1和pps_num_subpics_minus1被写入1,这指示应该一次提取两个子图片,这可能不是期望的。
(4)参考图片列表上的语法元素可能会出现在IDR图片中,而无需任何使用。
(5)对于预测树的亮度和色度,划分信息被认为是相同的,这是不正确的。
(6)编解码工具的语法元素不受对应的通用约束标志的限制或约束,并且一些通用约束标志的值不受相关约束的限制,这可能会导致一些冲突。
a)res_change_in_clvs_allowed_flag不受通用约束标志no_res_change_in_clvs_constraint_flag的值约束。
b)scaling_window_explicit_signalling_flag不受no_res_change_in_clvs_constraint_flag的约束。
c)scaling_window_explicit_signalling_flag不受res_change_in_clvs_allowed_flag的约束。
d)sps_num_subpics_minus1的值不受one_subpic_per_pic_constraint_flag的约束。
e)subpic_treated_as_pic_flag不受one_subpic_per_pic_constraint_flag和/或sps_num_subpics_minus1和/或pps_num_subpics_minus1的约束。
f)loop_filter_across_subpic_enabled_flag不受one_subpic_per_pic_constraint_flag和/或sps_num_subpics_minus1和/或pps_num_subpics_minus1的约束。
g)one_subpic_per_pic_constraint_flag不受one_slice_per_pic_constraint_flag的约束。
h)no_bdpcm_constraint_flag不受no_transform_skip_constraint_flag的约束。
i)num_slices_in_pic_minus1不受one_slice_per_pic_constraint_flag的约束。
j)num_tiles_in_slice_minus1不受one_slice_per_pic_constraint_flag的约束。
示例技术和实施例
以下详细发明应被视为解释一般概念的示例。这些发明不应被狭隘地解释。此外,这些发明可以以任何方式组合。在下面的描述中,删除的部分标记在[[]]之间,并且添加的部分被标记为带下划线的粗体斜体
时域预测相关HLS
1.可以利用TMVP的两个级别控制,并且一个是图片级别,另一个是条带/片/子图片/砖级别。
a)在一个示例中,可以在图片级信令通知指示是否存在引用该标志的至少一个帧间编解码条带的第一语法元素来启用TMVP(例如,由ph_temporal_mvp_allowed_flag表示)。
i.在一个示例中,它可以在图片标头或PPS中被信令通知。
ii.在一个示例中,它可以被有条件地信令通知,例如根据在SPS中启用的TMVP和/或当前图片包含在当前图片标头中存在的至少一个帧间编解码条带和/或RPL。
b)在一个示例中,可以在条带级信令通知指示当前条带是否启用TMVP的第二语法元素(例如,由sh_temporal_mvp_allowed_flag表示),这可能取决于第一语法元素。
i.在一个示例中,仅当ph_temporal_mvp_allowed_flag等于1时,才可以信令通知sh_temporal_mvp_allowed_flag。否则,其被推断为0。
ii.在一个示例中,只有当ph_temporal_mvp_allowed_flag等于0时,才可以信令通知sh_temporal_mvp_allowed_flag。否则,其被推断为1。
c)在一个示例中,可以在条带级别信令通知指示当前条带是否启用TMVP的第二语法元素(例如,由sh_temporal_mvp_allowed_flag表示),这可能取决于当前条带标头中存在的RPL和/或SPS中启用的TMVP和/或当前条带是帧间编解码的条带。
d)在一个示例中,信令通知第三个语法元素(例如,tmvp_info_in_ph_flag),以指示TMVP信息是在图片标头还是在条带标头中信令通知。
i.TMVP信息可以包括是否启用TMVP的信息。
ii.TMVP信息可以包括并置的参考图片的信息。
iii.在一个示例中,仅当TMVP在序列级别启用时,tmvp_info_in_ph_flag才被信令通知。(例如,sps_temporal_mvp_enabled_flag等于1)。
e)在一个示例中,第二语法元素在不存在时被推断为等于默认值(例如第一语法元素的值)。例如,当不存在时,sh_temporal_mvp_allowed_flag被推断为等于ph_temporal_mvp_allowed_flag。
2.是否和/或如何从PH到SH继承并置图片信息(例如,并置图片来自列表0;并置图片的参考图片索引)至少取决于条带类型以及参考图片列表信息是否存在于PH语法结构中(例如,rpl_info_in_ph_flag为1)。
a)在一个示例中,当slice_type等于P,rpl_info_in_ph_flag等于1(或/和ph_temporal_mvp_enabled_flag等于1)时,slice_collocated_from_l0_flag被设置为1,而与ph_collocated_from_l0_flag的值无关。
i.可替代地,当slice_type等于P时,无论其他条件如何,slice_collocated_from_l0_flag都可以被推断为等于1。
b)在另一个示例中,当slice_type等于B且slice_collocated_from_l0_flag等于1时,slice_collocated_ref_idx引用参考图片列表0中的条目,并且slice_collocated_ref_idx的值应在0到NumRefIdxActive[0]-1(含)的范围内。
c)在一个示例中,当slice_type等于P时,当启用TMVP时,slice_collocated_from_l0_flag可以被推断为1。
d)在一个示例中,当slice_type等于P且启用了TMVP且slice_collocated_ref_idx在0到NumRefIdxActive[0]-1(含)的范围内时。
e)在一个示例中,当slice_type等于P并且启用了TMVP时,P条带的RprConstraintsActive[0][slice_collocated_ref_idx]可能需要等于0。
f)在一个示例中,可以引入下面的示例修改。
slice_collocated_ref_idx规定用于时域运动矢量预测的并置图片的参考索引。
当slice_type等于P或slice_type等于B且slice_collocated_from_l0_flag等于1时,slice_collocated_ref_idx引用参考图片列表0中的条目,
Figure BDA0003793174210001281
Figure BDA0003793174210001282
,并且slice_collocated_ref_idx的值应在0到NumRefIdxActive[0]-1(含)的范围内。
当slice_type等于B且slice_collocated_from_l0_flag等于0时,slice_collocated_ref_idx指代参考图片列表1中的条目,并且slice_collocated_ref_idx的值应在0到NumRefIdxActive[1]-1(含)的范围内。
当slice_collocated_ref_idx不存在时,以下内容适用:
–如果rpl_info_in_ph_flag等于1,则slice_collocated_ref_idx的值被推断为等于ph_collocated_ref_idx。
–否则(rpl_info_in_ph_flag等于0),slice_collocated_ref_idx的值被推断为等于0。
比特流一致性的一个要求是,slice_collocated_ref_idx所引用的图片对于编解码图片的所有条带都应相同。
比特流一致性的一个要求是,由slice_collocated_ref_idx引用的参考图片的pic_width_in_luma_samples和pic_height_in_luma_samples的值应分别等于当前图片的pic_width_in_luma_samples和pic_height_in_luma_samples的值,并且RprConstraintsActive[slice_collocated_from_l0_flag?0:1][slice_collocated_ref_idx]应等于0。
g)在一个示例中,当ph_collocated_from_l0_flag等于0时,可能要求图片不包含P条带。
i.在一个示例中,可以引入下面的示例修改。
slice_type根据表9规定条带的编解码类型。
表9-slice_type的名称关联
slice_type slice_type的名称
0 B(B条带)
1 P(P条带)
2 I(I条带)
当不存在时,slice_type的值被推断为等于2。
当ph_intra_slice_allowed_flag等于0时,slice_type的值应等于0或1。当nal_unit_type在IDR_W_RADL到CRA_NUT(含)的范围内,并且vps_independent_layer_flag[GeneralLayerIdx[nuh_layer_id]]等于1时,slice_type应等于2。
Figure BDA0003793174210001291
ii.可替代地,是否信令通知条带类型可能取决于并置的图片是否来自列表0。
1.在一个示例中,如果以下所有条件均为真,则可以跳过针对引用当前图片标头的条带的条带类型的信令。
–rpl_info_in_ph_flag等于1
–ph_temporal_mvp_enabled_flag等于1
–ph_intra_slice_allowed_flag等于0
–ph_collocated_from_l0_flag等于0
可替代地,此外,条带类型可以被推断为B条带。
h)在一个示例中,当ph_temporal_mvp_enabled_flag等于1且rpl_info_in_ph_flag等于1时,P条带的slice_collocated_from_l0_flag的值可以始终被推断等于1。可以引入下面的示例修改。
slice_collocated_from_l0_flag等于1规定从参考图片列表0推导用于时域运动矢量预测的并置图片。slice_collocated_from_l0_flag等于0规定从参考图片列表1推导用于时域运动矢量预测的并置图片。
[[当slice_type等于B或P,ph_temporal_mvp_enabled_flag等于1,并且slice_collocated_from_l0_flag不存在时,以下内容适用:
–如果rpl_info_in_ph_flag等于1,slice_collocated_from_l0_flag被推断为等于ph_collocated_from_l0_flag。
–否则(rpl_info_in_ph_flag等于0且slice_type等于P),slice_collocated_from_l0_flag的值被推断为等于1。]]
Figure BDA0003793174210001301
Figure BDA0003793174210001302
Figure BDA0003793174210001303
Figure BDA0003793174210001304
Figure BDA0003793174210001305
i)在一个示例中,当slice_type等于P并且slice_collocated_from_l0_flag等于0时,slice_collocated_ref_idx可以被认为是指参考图片列表1中的非活动条目,并且可能需要参考图片列表1中该非活动条目所引用的参考图片也应由参考图片列表0中的活动条目引用。可以引入下面的示例修改。
slice_collocated_ref_idx规定用于时域运动矢量预测的并置图片的参考索引。
当slice_type等于P或slice_type等于B且
Figure BDA0003793174210001306
collocated_from_l0_flag等于1时,slice_collocated_ref_idx指代参考图片列表0中的条目,并且slice_collocated_ref_idx的值应在0到NumRefIdxActive[0]-1(含)的范围内。
当slice_type等于B且slice_collocated_from_l0_flag等于0时,slice_collocated_ref_idx指代参考图片列表1中的条目,并且slice_collocated_ref_idx的值应在0到NumRefIdxActive[1]-1(含)的范围内。
Figure BDA0003793174210001307
当slice_collocated_ref_idx不存在时,以下内容适用:
–如果rpl_info_in_ph_flag等于1,则slice_collocated_ref_idx的值被推断为等于ph_collocated_ref_idx。
–否则(rpl_info_in_ph_flag等于0),slice_collocated_ref_idx的值被推断为等于0。
比特流一致性的一个要求是,slice_collocated_ref_idx所引用的图片对于编解码图片的所有条带都应相同。
比特流一致性的一个要求是,由slice_collocated_ref_idx引用的参考图片的pic_width_in_luma_samples和pic_height_in_luma_samples的值应分别等于当前图片的pic_width_in_luma_samples和pic_height_in_luma_samples的值,并且RprConstraintsActive[slice_collocated_from_l0_flag?0:1][slice_collocated_ref_idx]应等于0。
j)可替代地,引用相同图片标头的B和P条带可以使用不同的并置图片。
i.在一个示例中,即使在图片标头中信令通知RPL,并置图片的参考图片索引也可以在条带标头中被进一步信令通知。
1.在一个示例中,当当前条带为P条带时,在图片标头中信令通知RPL信号,启用时域运动矢量预测(例如,ph_temporal_mvp_enabled_flag为真),并且ph_collocated_from_l0_flag等于0,可以进一步信令通知并置图片的参考图片索引。
a)可替代地,此外,它还指向参考图片列表0。
ii.在一个示例中,可以信令通知或推导两个并置的参考图片索引,并且其中一个用于B条带,另一个用于引用相同图片标头的P条带。
1.在一个示例中,只有当ph_collocated_from_l0_flag等于0时,才可以信令通知这两个索引。
k)在一个示例中,可以信令通知是否存在引用相同图片标头的B条带和P条带的指示。
i.可替代地,可以在图片标头中信令通知引用相同图片标头的条带的类型的指示。
ii.可替代地,可以信令通知是否仅存在引用相同图片标头的B条带(排除P条带)。
iii.可替代地,可以信令通知是否仅存在引用相同图片标头的P条带(排除B条带)的指示。
iv.可替代地,可以信令通知是否仅存在引用相同图片标头的B条带和I条带的指示。
v.可替代地,可以信令通知是否仅存在引用相同图片标头的P条带和I条带的指示。
vi.可替代地,仅当在图片标头中信令通知RPL时,才可以在图片标头中信令通知引用相同图片标头的条带类型的指示。
vii.可替代地,仅当在图片标头中信令通知引用相同图片标头的条带类型时,才在图片标头中信令通知RPL。
l)可替代地,当slice_type等于P且slice_collocated_from_l0_flag等于0时,可以在使用slice_collocated_ref_idx之前进行修改,例如映射到0到NumRefIdxActive[0]-1(含)范围内的索引。
i.在一个示例中,当slice_type等于P且slice_collocated_from_l0_flag等于0时,slice_collocated_ref_idx引用参考图片列表0中的条目,并且slice_collocated_ref_idx被设置为(slice_collocated_ref_idx>(NumRefIdxActive[0]1)?default_col_ref_idx:slice_collocated_ref_idx),其中变量default_col_ref_idx在0到NumRefIdxActive[0]-1(含)的范围内。
1.在一个示例中,变量default_col_ref_idx被设置为0。
2.在一个例子中,可以信令通知变量。
m)在一致性比特流中,可能不允许与一个图片标头相关联的两个条带,但其中一个是P条带,另一个是B条带。
n)在一致性比特流中,可能不允许与信令通知RPL的一个图片标头相关联的两个条带,但其中一个是P条带,另一个是B条带。
o)在一致性比特流中,可能不允许与使用两个参考图片列表信令通知RPL的一个图片标头相关联的条带,但该条带是P条带。
子图片相关的HLS
3.CLVS中每个图片中的子图片数目(例如,sps_num_subpics_minus1和/或pps_num_subpics_minus1)可以由通用约束标志(例如,one_subpic_per_pic_constraint_flag)进行调节。
a)在一个示例中,当通用约束标志(例如,one_subpic_per_pic_constraint_flag)等于1时,可能要求sps_num_subpics_minus1和/或pps_num_subpics_minus1的值等于0。
b)在一个示例中,可以引入下面的示例修改。
sps_num_subpics_minus1加1规定CLVS中每个图片中的子图片的数目。sps_num_subpics_minus1的值应在0到Ceil(pic_width_max_in_luma_samples÷CtbSizeY)*Ceil(pic_height_max_in_luma_samples÷CtbSizeY)-1(含)的范围内。当不存在时,sps_num_subpics_minus1的值被推断为等于0。
Figure BDA0003793174210001331
Figure BDA0003793174210001332
4.是否信令通知规定“跨CLVS中的任何子图片边界执行的无帧内预测、无帧间预测和无环路滤波操作”的语法元素(例如,sps_independent_subpics_flag)的语法元素可能取决于CLVS中每个图片中的子图片数(例如,sps_num_subpics_minus1)。
a)在一个示例中,当CLVS中的每个图片中只有一个子图片时,语法元素sps_independent_subpics_flag可能不被信令通知并被推断为1。
b)在一个示例中,可以引入下面的示例修改。
sps_independent_subpics_flag等于1规定不能跨CLVS中的任何子图片边界执行帧内预测、帧间预测和环路滤波操作。sps_independent_subpics_flag等于0规定可以允许跨CLVS中的子图片边界的帧间预测或环路滤波操作。当不存在时,sps_independent_subpics_flag的值被推断为等于[[0]]
Figure BDA0003793174210001335
c)在一个示例中,可以引入下面的示例修改。
sps_independent_subpics_flag等于1规定不能跨CLVS中的任何子图片边界执行帧内预测、帧间预测和环路滤波操作。sps_independent_subpics_flag等于0规定可以允许跨CLVS中的子图片边界的帧间预测或环路滤波操作。当不存在时,sps_independent_subpics_flag的值被推断为等于0。
Figure BDA0003793174210001333
Figure BDA0003793174210001334
5.subpic_treated_as_pic_flag的值可能取决于图片中是否只有一个子图片。
a)在一个示例中,如果one_subpic_per_pic_constraint_flag等于1,则subpic_treated_as_pic_flag的值可能需要等于1,或推断为等于1。
b)在一个示例中,如果sps_num_subpics_minus1等于0,则subpic_treated_as_pic_flag的值可能需要等于1,或推断为等于1。
c)在一个示例中,如果pps_num_subpics_minus1等于0,则subpic_treated_as_pic_flag的值可能需要等于1。
6.loop_filter_across_subpic_enabled_flag的值可能取决于图片中是否只有一个子图片。
a)在一个示例中,如果one_subpic_per_pic_constraint_flag等于1,则loop_filter_across_subpic_enabled_flag的值可能需要等于0,或推断为等于0。
b)在一个示例中,如果sps_num_subpics_minus1等于0,则loop_filter_across_subpic_enabled_flag的值可能需要等于0,或推断为等于0。
c)在一个示例中,如果pps_num_subpics_minus1等于0,则loop_filter_across_subpic_enabled_flag的值可能需要等于0。
7.是否规定了以片列为单位的第i个矩形条带的宽度(例如,slice_width_in_tiles_minus1),可能取决于single_slice_per_subpic_flag。
a)在一个示例中,当slice_width_in_tiles_minus1不存在但single_slice_per_subpic_flag等于1时,则可能不会设置slice_width_in_tiles_minus1的值。
b)在一个示例中,可以引入下面的示例修改。
slice_width_in_tiles_minus1[i]加1规定以片列为单位的第i个矩形条带的宽度。slice_width_in_tiles_minus1[i]的值应在0到NumTileColumns-1(含)的范围内。
当slice_width_in_tiles_minus1[i]不存在
Figure BDA0003793174210001341
Figure BDA0003793174210001342
,以下内容适用:
–如果NumTileColumns等于1,则slice_width_in_tiles_minus1[i]的值被推断为等于0。
–否则,根据条款6.5.1的规定推断slice_width_in_tiles_minus1[i]的值。
8.每个子图片是否由一个且仅由一个矩形条带组成(例如,single_slice_per_subpic_flag),可以通过通用约束标志(例如,one_slice_per_pic_constraint_flag)进行调节。
a)在另一个示例中,当语法元素single_slice_per_subpic_flag不存在时,single_slice_per_subpic_flag的值可以被推断为等于1。
b)在另一个示例中,当语法元素single_slice_per_subpic_flag不存在时,可以根据当前图片是否被分割(例如,no_pic_partition_flag)来推断single_slice_per_subpic_flag的值。
c)在一个示例中,可以引入下面的示例修改。
single_slice_per_subpic_flag等于1规定每个子图片由一个且仅一个矩形条带组成。single_slice_per_subpic_flag等于0规定每个子图片可以由一个或多个矩形条带组成。当single_slice_per_subpic_flag等于1时,num_slices_in_pic_minus1被推断为等于sps_num_subpics_minus1。[[当不存在时,single_slice_per_subpic_flag的值被推断为等于0。]]
d)在一个示例中,可以引入下面的示例修改。
single_slice_per_subpic_flag等于1规定每个子图片由一个且仅一个矩形条带组成。single_slice_per_subpic_flag等于0规定每个子图片可以由一个或多个矩形条带组成。当single_slice_per_subpic_flag等于1时,num_slice_in_pic_minus1被推断为等于sps_num_subpics_minus1。当不存在时,single_slice_per_subpic_flag的值被推断为等于0。
Figure BDA0003793174210001351
Figure BDA0003793174210001352
e)在一个示例中,可以引入下面的示例修改。
single_slice_per_subpic_flag等于1规定每个子图片由一个且仅一个矩形条带组成。single_slice_per_subpic_flag等于0规定每个子图片可以由一个或多个矩形条带组成。当single_slice_per_subpic_flag等于1时,num_slices_in_pic_minus1被推断为等于sps_num_subpics_minus1。当不存在时,single_slice_per_subpic_flag的值被推断为等于0。
Figure BDA0003793174210001353
Figure BDA0003793174210001354
f)在一个示例中,可以引入下面的示例修改。
single_slice_per_subpic_flag等于1规定每个子图片由一个且仅一个矩形条带组成。single_slice_per_subpic_flag等于0规定每个子图片可以由一个或多个矩形条带组成。当single_slice_per_subpic_flag等于1时,num_slices_in_pic_minus1被推断为等于sps_num_subpics_minus1。当不存在时,single_slice_per_subpic_flag的值被推断为等于0。
Figure BDA0003793174210001355
Figure BDA0003793174210001361
g)在一个示例中,可以引入下面的示例修改。
single_slice_per_subpic_flag等于1规定每个子图片由一个且仅一个矩形条带组成。single_slice_per_subpic_flag等于0规定每个子图片可以由一个或多个矩形条带组成。当single_slice_per_subpic_flag等于1时,num_slices_in_pic_minus1被推断为等于sps_num_subpics_minus1。当不存在时,single_slice_per_subpic_flag的值被推断为等于[[0]]
Figure BDA0003793174210001362
9.在一个示例中,关于在子图片子比特流提取期间输出子比特流的推导,跨CLVS中的不同图片的提取子图片可能需要具有相同的子图片索引。
a)例如,可能需要提取子图片的目标子图片ID可以引用CLVS中不同图片之间的相同子图片索引。
b)例如,如果subpic_id_mapping_explicitly_signalled_flag等于1,并且当处理子图片子比特流提取时,可能需要在PPS中不信令通知子图片ID映射(例如,subpic_id_mapping_in_pps_flag等于0)。
i.在一个示例中,如果subpic_id_mapping_explicitly_signalled_flag等于1,并且当处理子图片子比特流提取时,可能需要在SPS中信令通知子图片ID映射(例如,subpic_id_mapping_in_sps_flag等于1)。
c)例如,在子图片子比特流提取过程中提取哪个子图片可能取决于子图片索引。
d)例如,在子图片子比特流提取过程中重写和/或移除哪些语法元素可能取决于子图片索引。
e)在一个示例中,可以引入下面的示例修改。
C.7子图片子比特流提取过程
此过程的输入是比特流inBitstream、目标OLS索引targetOlsIdx、目标最高TemporalId值tIdTarget、以及每个层subpicIdxTarget[]的目标子图片[[ID]]
Figure BDA0003793174210001363
值的阵列。
此过程的输出是子比特流outBitstream。
输入比特流的比特流一致性的要求是,满足以下所有条件的任何输出子比特流都应是一致的比特流:
–输出子比特流是本条款中规定的过程的输出,其中比特流targetOlsIdx等于VPS规定的OLS列表的索引,并且subpicIdxTarget[]等于OLS中存在的子图片ID,作为输入。
–输出子比特流包含至少一个VCL NAL单元,其中nuh_layer_id等于LayerIdInOls[targetOlsIdx]中的每个nuh_layer_id值。
–输出子比特流包含至少一个TemporalId等于tIdTarget的VCL NAL单元。
注-一致性比特流包含一个或多个TemporalId等于0的编解码条带NAL单元,但不必包含nuh_layer_id等于0的编解码条带NAL单元。
–输出子比特流包含至少一个VCL NAL单元,其中nuh_layer_id等于LayerIdInOls[targetOlsIdx][i],并且其中slice_subpic_id等于subpicIdxTarget[i]中的值(对于0到NumLayersInOls[targetOlsIdx]-1范围内每个i)。
按照如下方式推导输出子比特流outBitstream:
–附件C.6中规定的子比特流提取过程以inBitstream、targetOlsIdx和tIdTarget作为输入进行调用,并将该过程的输出分配给outBitstream。
–如果本规范中未规定的一些外部手段可用于为子比特流outBitstream提供替换参数集,则用替换参数集替换所有参数集。
–否则,当inBitstream中存在子图片级信息SEI消息时,以下内容适用:
–针对由子图片ID等于subpicIdxTarget[]的所有条目,将所有引用VPS NAL单元中profile_tier_level()语法结构列表中第ols_ptl_idx[targetOlsIdx]个条目中的general_level_idc值重写为等于D.3.8中推导的SubpicSetLevelIdc。
针对由子图片ID等于subpicIdxTarget[]中所有条目的子图片组成的子图片集并且j的范围为0到hrd_cpb_cnt_minus1,将所有引用的VPS NAL单元中的ols_hrd_parameters()语法结构列表中的第ols_hrd_idx[targetOlsIdx]个条目中的第j个CPB的cpb_size_value_minus1[tIdTarget][j]和bit_rate_value_minus1[tIdTarget][j]的值进行重写,以对应于D.3.8中推导的SubpicSetCpbSizeVcl[0]、SubpicSetCpbSizeNal[0]、SubpicSetBitrateVcl[0]和SubpicSetBitrateNal[0]。
对于i在0到NumLayersInOls[targetOlsIdx]-1范围内的第i层,以下内容适用。
–subpicIdx被设置为等于subpicIdxTarget[i]的值。
–对于由subpicture[[ID]]
Figure BDA0003793174210001381
等于subpicIdx的子图片组成的子图片的集合,将所有引用的SPS NAL单元中profile_tier_level()语法结构中general_level_idc的值进行重写,其中等于1的sps_ptl_dpb_hrd_params_present_flag将等于D.3.8中推导的SubpicSetLevelIdc。
–对所有引用的SPS NAL单元中ols_hrd_parameters()语法结构列表第ols_hrd_idx[targetOlsIdx]个条目中第j个CPB的cpb_size_value_minus1[tIdTarget][j]和bit_rate_value_minus1[tIdTarget][j]的值,以对应于SubpicCpbSizeVcl[0][SubpicIdxList[subPicIdx]]、SubpicBitrateVcl[0][SubpicIdxList[subPicIdx]]和SubpicBitrateNal[0][SubpicIdxList[subPicIdx]],如D.3.8中针对subpicture[[ID]]
Figure BDA0003793174210001382
等于subpicIdx的子图片且范围为0到hrd_cpb_cnt_minus1的j所推导。
–将所有引用的SPS NAL单元中的pic_width_max_in_luma_samples和pic_height_max_in_luma_samples的值,以及所有引用的PPS NAL单元中的pic_width_in_luma_samples和pic_height_in_luma_samples的值,使其等于subpic_width_minus1[SubpicIdxList[subPicIdx]]和subpic_height_minus1[SubpicIdxList[subPicIdx]]。
将所有引用的SPS NAL单元中的sps_num_subpics_minus1和所有引用PPS NAL单元中的pps_num_subpics_minus1的值重写为1。
将引用的SPS NAL单元中的语法元素subpic_ctu_top_left_x[SubpicIdxList[subPicIdx]]、subpic_ctu_top_left_y[SubpicIdxList[subPicIdx]]重写为0(如果存在)。
对于SubpicIdxList[j]不等于subPicIdx的每个j,删除所有引用的SPS NAL单元中的语法元素subpic_ctu_top_left_x[j]、subpic_ctu_top_left_y[j]、subpic_width_minus1[j]、subpic_height_minus1[j]、subpic_treated_as_pic_flag[j]、loop_filter_across_subpic_enabled_flag[j]和sps_subpic_id[j]。
将所有引用的PPS中与片和条带结构相关的语法元素进行重写,以删除与子图片ID等于subPicIdx的子图片无关的所有片行、片列和条带。
从outBitstream中删除nuh_layer_id等于第i层的nuh_layer_id且slice_subpic_id不等于subPicIdx的所有VCLNAL单元。
当sli_cbr_constraint_flag等于1时,删除nal_unit_type等于FD_NUT的所有NAL单元以及与subpicIdxTarget[]中子图片的VCL NAL单元不关联的滤波器有效载荷SEI消息,并设置所有引用的VPS NAL单元和SPS NAL单元中的ols_hrd_parameters()语法结构列表中第ols_hrd_idx[targetOlsIdx]个条目中第j个CPB的等于1的cbr_flag[tIdTarget][j],并且j在0到hrd_cpb_cnt_minus1的范围内。否则,(sli_cbr_constraint_flag等于0),删除nal_unit_type等于FD_NUT的所有NAL单元和滤波器有效载荷SEI消息,并将cbr_flag[tIdTarget][j]设置为等于0。
–当outBitstream包含适用于outBitstream的可扩展嵌套SEI消息的SEI NAL单元(其中nesting_ols_flag等于1并且nesting_subpic_flag等于1)时,从可扩展嵌套SEI消息提取适当的非可扩展嵌套SEI消息,其中payloadType等于1(图片计时)或130(解码单元信息),并将提取的SEI消息放入outBitstream中。
10.在一个示例中,关于在子图片子比特流提取期间输出子比特流的推导,所提取的子比特流可以被视为输出比特流中的单个子图片。
a)在一个示例中,对于引用具有提取子图片的输出子比特流的语法结构,语法元素sps_independent_subpics_flag可以重写为等于1。
b)在一个示例中,可能不会从输出子比特流的语法结构中信令通知(例如,可以移除)在所有输出层中引用所提取子图片的语法元素subpic_treated_as_pic_flag和/或loop_filter_across_subpic_enabled_flag。
i.在一个示例中,对于引用具有提取子图片的输出子比特流的语法结构,语法元素subpic_treated_as_pic_flag可以被推断为等于1。
ii.在一个示例中,对于引用具有提取子图片的输出子比特流的语法结构,语法元素loop_filter_across_subpic_enabled_flag可以被推断为等于0。
c)在一个示例中,所有引用的SPS NAL单元中的sps_num_subpics_minus1的值和具有提取子图片的所有引用的PPS NAL单元中的pps_num_subpics_minus1的值可以被重写为等于0。
d)在一个示例中,对于引用具有提取子图片的输出子比特流的语法结构,语法元素no_pic_partition_flag可以被重写。
i.例如,语法元素no_pic_partition_flag是否被重写可能取决于包含所提取子图片的输出比特流中的片/条带的数目。
1.在一个示例中,如果在提取子图片中只有一个片和一个条带,则对于引用具有提取子图片的输出子比特流的语法结构,语法元素no_pic_partition_flag可以被重写为等于1。
2.可替代地,如果提取子图片中的片和/或条带的数目大于1,则对于引用具有提取子图片的输出子比特流的语法结构,语法元素no_pic_partition_flag可以等于0。
e)在一个示例中,可以引入下面的示例修改。
C.7子图片子比特流提取过程
按照如下方式推导输出子比特流outBitstream:
–附件C.6中规定的子比特流提取过程以inBitstream、targetOlsIdx和tIdTarget作为输入进行调用,并将该过程的输出分配给outBitstream。
–如果本规范中未规定的一些外部手段可用于为子比特流outBitstream提供替换参数集,则用替换参数集替换所有参数集。
–否则,当inBitstream中存在子图片级信息SEI消息时,以下内容适用:
–针对由子图片ID等于subpicIdxTarget[]的所有条目,将所有引用VPS NAL单元中profile_tier_level()语法结构列表中第ols_ptl_idx[targetOlsIdx]个条目中的general_level_idc值重写为等于D.3.8中推导的SubpicSetLevelIdc。
针对由子图片ID等于subpicIdxTarget[]中所有条目的子图片组成的子图片集并且j的范围为0到hrd_cpb_cnt_minus1,将所有引用的VPS NAL单元中的ols_hrd_parameters()语法结构列表中的第ols_hrd_idx[targetOlsIdx]个条目中的第j个CPB的cpb_size_value_minus1[tIdTarget][j]和bit_rate_value_minus1[tIdTarget][j]的值进行重写,以对应于D.3.8中推导的SubpicSetCpbSizeVcl[0]、SubpicSetCpbSizeNal[0]、SubpicSetBitrateVcl[0]和SubpicSetBitrateNal[0]。
对于i在0到NumLayersInOls[targetOlsIdx]-1范围内的第i层,以下内容适用。
–subpicId被设置为等于subpicIdTarget[i]的值。
–对于由subpicture ID等于subpicId的子图片组成的子图片的集合,将所有引用的SPS NAL单元中profile_tier_level()语法结构中general_level_idc的值进行重写,其中等于1的sps_ptl_dpb_hrd_params_present_flag将等于D.3.8中推导的SubpicSetLevelIdc。
–对所有引用的SPS NAL单元中ols_hrd_parameters()语法结构列表第ols_hrd_idx[targetOlsIdx]个条目中第j个CPB的cpb_size_value_minus1[tIdTarget][j]和bit_rate_value_minus1[tIdTarget][j]的值,以对应于SubpicCpbSizeVcl[0][SubpicIdxList[subPicIdx]]、SubpicBitrateVcl[0][SubpicIdxList[subPicIdx]]和SubpicBitrateNal[0][SubpicIdxList[subPicIdx]],如D.3.8中针对子图片ID等于subpicId的子图片且范围为0到hrd_cpb_cnt_minus1的j所推导。
–将所有引用的SPS NAL单元中的pic_width_max_in_luma_samples和pic_height_max_in_luma_samples的值,以及所有引用的PPS NAL单元中的pic_width_in_luma_samples和pic_height_in_luma_samples的值,使其等于subpic_width_minus1[SubpicIdxList[subPicIdx]]和subpic_height_minus1[SubpicIdxList[subPicIdx]]。
将所有引用的SPS NAL单元中的sps_num_subpics_minus1和所有引用PPS NAL单元中的pps_num_subpics_minus1的值重写为1。
将引用的SPS NAL单元中的语法元素subpic_ctu_top_left_x[SubpicIdList[subPicIdx]]、subpic_ctu_top_left_y[SubpicIdList[subPicIdx]]重写为0(如果存在)。
Figure BDA0003793174210001411
Figure BDA0003793174210001421
对于SubpicIdList[j]不等于subPicId的每个j,删除所有引用的SPS NAL单元中的语法元素subpic_ctu_top_left_x[j]、subpic_ctu_top_left_y[j]、subpic_width_minus1[j]、subpic_height_minus1[j]、subpic_treated_as_pic_flag[j]、loop_filter_across_subpic_enabled_flag[j]和sps_subpic_id[j]。
对所有引用的PPS中与片和条带结构相关的语法元素进行重写,以删除与子图片ID等于subPicId的子图片无关的所有片行、片列和条带。
从outBitstream中删除nuh_layer_id等于第i层的nuh_layer_id且slice_subpic_id不等于subPicId的所有VCL NAL单元。
当sli_cbr_constraint_flag等于1时,删除nal_unit_type等于FD_NUT的所有NAL单元以及与subpicIdxTarget[]中子图片的VCL NAL单元不关联的滤波器有效载荷SEI消息,并设置所有引用的VPS NAL单元和SPS NAL单元中的ols_hrd_parameters()语法结构列表中第ols_hrd_idx[targetOlsIdx]个条目中第j个CPB的等于1的cbr_flag[tIdTarget][j],并且j在0到hrd_cpb_cnt_minus1的范围内。否则,(sli_cbr_constraint_flag等于0),删除nal_unit_type等于FD_NUT的所有NAL单元和滤波器有效载荷SEI消息,并将cbr_flag[tIdTarget][j]
设置为等于0。
NAL单元相关的HLS
11.参考图片列表语法元素可以存在于IDR图片的条带标头中,即,对于比特流merging的情况,sps_idr_rpl_present_flag可以等于1。
a)在一个示例中,当在比特流merging期间从两个输入比特流merge输出比特流(例如,mixed_nalu_types_in_pic_flag等于1)时,并且输入比特流之一的NAL单元类型可能是IRAP VCL NAL单元类型,例如IDR,可能需要IDR比特流的RPL应当可用(即,对于该IDR输入比特流,sps_idr_rpl_present_flag等于1)。
b)在一个示例中,可以引入下面的示例修改。
sps_idr_rpl_present_flag等于1规定参考图片列表语法元素存在于IDR图片的条带标头中。sps_idr_rpl_present_flag等于0规定参考图片列表语法元素不存在于IDR图片的条带标头中。
Figure BDA0003793174210001431
划分相关
12.对于预测树,亮度和色度的块(即,CTB、TB、PB、CB等)划分信息可能不同。
a)在一个示例中,在色度双树的情况下,用于亮度和色度的块划分结构和/或划分语法元素可能不同。
b)在一个示例中,在局部双树的情况下,用于亮度和色度的块划分结构和/或划分语法元素可能不同。
c)在一个示例中,可以引入下面的示例修改。
编解码块是两棵树(预测树和变换树)的根节点。预测树规定预测块的位置和尺寸。变换树规定变换块的位置和尺寸。对于预测树,亮度和色度的划分信息
Figure BDA0003793174210001432
,并且对于变换树,也可能相同或不相同。
通用约束标志
13.参数集(例如SPS/VPS/PPS)和/或图片标头和/或条带标头中的语法元素可能受到通用约束标志的调节。
a)在一个示例中,编解码工具的启用标志可以由对应的通用约束标志来调节。
i.在一个示例中,当对应的通用约束标志为1时,启用标志应等于0。
ii.在一个示例中,启用标志可以被对应的通用约束标志覆盖。例如,如果通用约束标志为1,则对应的启用标志可以被设置为0。
b)在一个示例中,是否信令通知启用标志可能取决于对应的通用约束标志。
i.在一个示例中,如果对应的通用约束标志为1,则启用标志可能不存在。
ii.在一个示例中,如果启用标志不存在,则其可以被推断为0。
14.图片空域分辨率是否可能在引用SPS的CLVS内发生变化(例如,res_change_in_clvs_allowed_flag),可能会受到通用约束标志(例如no_res_change_in_clvs_constraint_flag)的限制。
a)在一个示例中,当语法no_res_change_in_clvs_constraint_flag等于1时,res_change_in_clvs_allowed_flag可能不存在。
b)在一个示例中,当语法res_change_in_clvs_allowed_flag不存在时,res_change_in_clvs_allowed_flag可以被推断为等于0。
15.缩放窗口偏移参数是否存在于PPS中(例如scaling_window_explicit_signalling_flag)可能取决于图片空域分辨率是否在引用SPS的CLVS内发生变化(例如res_change_in_clvs_allowed_flag)和/或通用约束标志(例如no_res_change_in_clvs_constraint_flag)。
a)在一个示例中,当语法scaling_window_explicit_signalling_flag不存在时,scaling_window_explicit_signalling_flag可以被推断为等于0。
b)在一个示例中,当res_change_in_clvs_allowed_flag等于0时,scaling_window_explicit_signalling_flag可能不存在。
c)在一个示例中,当no_res_change_in_clvs_constraint_flag等于1时,scaling_window_explicit_signalling_flag可能不存在。
16.是否存在one_subpic_per_pic_constraint_flag可能取决于语法one_slice_per_pic_constraint_flag。
a)在一个示例中,当one_slice_per_pic_constraint_flag等于1时,one_subpic_per_pic_constraint_flag可能不存在,并且可以被推断为1。
b)在一个示例中,当one_slice_per_pic_constraint_flag等于0时,可能存在one_subpic_per_pic_constraint_flag。
17.通用约束标志no_bdpcm_constraint_flag可以由通用约束标志no_transform_skip_constraint_flag进行调节。
a)在一个示例中,如果通用约束标志no_transform_skip_constraint_flag等于1,则通用约束标志no_bdpcm_constraint_flag应为1。
b)在一个示例中,是否信令通知通用约束标志no_bdpcm_constraint_flag可能取决于语法no_transform_skip_constraint_flag。
i.在一个示例中,当no_transform_skip_constraint_flag等于1时,通用约束标志no_bdpcm_constraint_flag可能不存在。
ii.在一个示例中,当不存在no_bdpcm_constraint_flag时,语法no_bdpcm_constraint_flag被推断为1。
18.一个是否信令通知通用约束标志可能取决于其他通用约束标志。
a)在一个示例中,可以定义若干约束组标志,并且其他一般约束标志可以由这些约束组标志进行调节。
i.在一个示例中,约束标志可以根据工具类型(包括但不限于预测、变换、量化、帧间、帧内)或简档分组。
ii.在一个示例中,可以从对应的约束组标志推导属于一个组的约束标志。
iii.在一个示例中,是否信令通知属于一个组的约束标志可能取决于对应的约束组标志。例如,当约束组标志为0时,属于该组的约束标志可能不会被信令通知。
通用约束标志的语义
19.在一个示例中,可以引入下面的示例修改。
one_tile_per_pic_constraint_flag等于1规定每个图片应当仅包含一个片,
Figure BDA0003793174210001451
Figure BDA0003793174210001452
one_tile_per_pic_constraint_flag等于0不会施加此类约束。
20.在一个示例中,可以引入下面的示例修改。
one_slice_per_pic_constraint_flag等于1规定每个图片应当仅包含一个条带。
Figure BDA0003793174210001453
one_slice_per_pic_constraint_flag等于0不会施加此类约束。
21.在一个示例中,可以引入下面的示例修改。
one_subpic_per_pic_constraint_flag等于1规定每个图片应当仅包含一个
Figure BDA0003793174210001461
Figure BDA0003793174210001462
one_subpic_per_pic_constraint_flag等于0不会施加此类约束。当one_slice_per_pic_constraint_flag等于1时,one_subpic_per_pic_constraint_flag的值应等于1。
图1是示出示例视频处理系统100的框图,其中可以实施本文公开的各种技术。各种实施可以包括系统100的一些或所有组件。系统100可以包括用于接收视频内容的输入102。视频内容可以以原始或未压缩格式接收,例如8或10位多分量像素值,或者可以以压缩或编码格式接收。输入102可以表示网络接口、外围总线接口或存储接口。网络接口的示例包括有线接口(例如以太网、无源光学网络(PON)等)以及无线接口(例如Wi-Fi或蜂窝接口)。
系统100可以包括编解码组件104,其可以实施本文档中描述的各种编解码或编码方法。编解码组件104可以将视频的平均比特率从输入102降低到编解码组件104的输出,以产生视频的编解码表示。因此,编解码技术有时被称为视频压缩或视频转码技术。编解码组件104的输出可以被存储,也可以通过组件106所表示的连接的通信来传输。在输入102处接收的视频的存储或通信比特流(或编解码)表示可以由组件108用于生成像素值或被发送到显示接口110的可显示视频。从比特流表示生成用户可视视频的过程有时被称为视频解压缩。此外,尽管某些视频处理操作被称为“编解码”操作或工具,但将理解的是,在编码器处使用编解码工具或操作,并且将由解码器执行反转编解码结果的对应解码工具或操作。
外围总线接口或显示接口的示例可以包括通用串行总线(USB)或高清多媒体接口(HDMI)或Displayport等。存储接口的示例包括SATA(串行高级技术附件)、PCI、IDE接口等。本文档中描述的技术可以体现在各种电子设备中,例如移动电话、膝上型计算机、智能手机或能够执行数字数据处理和/或视频显示的其他设备。
图2是视频处理装置3600的框图。装置3600可以用于实施本文所述的一种或多种方法。装置3600可以体现在智能手机、平板电脑、计算机、物联网(IoT)接收器等中。装置3600可以包括一个或多个处理器3602、一个或多个存储器3604和视频处理硬件3606。处理器3602可以被配置为实施本文档中描述的一个或多个方法。一个或多个存储器3604可以用于存储用于实施本文所述方法和技术的数据和代码。视频处理硬件3606可以用于在硬件电路中实施本文档中描述的一些技术。
图4是示出可以利用本公开技术的示例视频编解码系统100的框图。
如图4所示,视频编解码系统100可以包括源设备110和目的地设备120。源设备110生成可以被称为视频编码设备的编码视频数据。目的地设备120可以对源设备110生成的编码视频数据进行解码,源设备110可以被称为视频解码设备。
源设备110可以包括视频源112、视频编码器114和输入/输出(I/O)接口116。
视频源112可以包括诸如视频捕获设备之类的源、从视频内容提供商接收视频数据的接口和/或用于生成视频数据的计算机图形系统,或这些源的组合。视频数据可以包括一个或多个图片。视频编码器114对来自视频源112的视频数据进行编码以生成比特流。比特流可以包括形成视频数据的编解码表示的比特序列。比特流可以包括编解码图片和相关联数据。编解码图片是图片的编解码表示。相关联数据可以包括序列参数集、图片参数集和其他语法结构。I/O接口116可以包括调制器/解调器(调制解调器)和/或发射机。编码的视频数据可以通过网络130a经由I/O接口116直接发送到目的地设备120。编码的视频数据还可以存储在存储介质/服务器130b上,以供目的地设备120访问。
目的地设备120可以包括I/O接口126、视频解码器124和显示设备122。
I/O接口126可以包括接收器和/或调制解调器。I/O接口126可以从源设备110或存储介质/服务器130b获取编码视频数据。视频解码器124可以对编码的视频数据进行解码。显示设备122可以向用户显示解码的视频数据。显示设备122可以与目的地设备120集成,或者可以位于目的地设备120的外部,目的地设备120被配置为与外部显示设备接合。
视频编码器114和视频解码器124可以根据视频压缩标准(例如高效视频编解码(HEVC)标准、通用视频编解码(VVM)标准和其他当前和/或进一步的标准)操作。
图5是示出视频编码器200的示例的框图,视频编码器200可以是图4所示的系统100中的视频编码器114。
视频编码器200可以被配置为执行本公开的任何或所有技术。在图5的示例中,视频编码器200包括多个功能组件。本公开中描述的技术可以在视频编码器200的各个组件之间共享。在一些示例中,处理器可以被配置为执行本公开中描述的任何或所有技术。
视频编码器200的功能组件可以包括分割单元201、预测单元202(预测单元202可以包括模式选择单元203、运动估计单元204、运动补偿单元205和帧内预测单元206)、残差生成单元207、变换单元208、量化单元209、反量化单元210、反变换单元211,重构单元212、缓冲器213和熵编码单元214。
在其他示例中,视频编码器200可以包括更多、更少或不同的功能组件。在一个示例中,预测单元202可以包括块内复制(IBC)单元。IBC单元可以在IBC模式下执行预测,其中至少一个参考图片是当前视频块所在的图片。
此外,一些组件(例如运动估计单元204和运动补偿单元205)可以被高度集成,但出于解释的目的,在图5的示例中单独表示。
分割单元201可以将图片分割成一个或多个视频块。视频编码器200和视频解码器300可以支持各种视频块尺寸。
模式选择单元203可以例如基于错误结果选择编解码模式中的一种,帧内或帧间,并将得到的帧内或帧间编解码块提供给残差生成单元207以生成残差块数据,并提供给重构单元212以重构编解码块以用作参考图片。在一些示例中,模式选择单元203可以选择帧内预测和帧间预测(CIIP)模式的组合,其中预测基于帧间预测信号和帧内预测信号。模式选择单元203还可以在帧间预测的情况下为块选择运动矢量的分辨率(例如,子像素或整数像素精度)。
为了对当前视频块执行帧间预测,运动估计单元204可以通过将来自缓冲器213的一个或多个参考帧与当前视频块进行比较来生成当前视频块的运动信息。运动补偿单元205可以基于运动信息和来自缓冲器213的图片(与当前视频块相关联的图片除外)的解码样点来确定当前视频块的预测视频块。
运动估计单元204和运动补偿单元205可以对当前视频块执行不同的操作,例如,取决于当前视频块是在I条带、P条带还是B条带中。
在一些示例中,运动估计单元204可以对当前视频块执行单向预测,并且运动估计单元204可以搜索列表0或列表1的参考图片以查找当前视频块的参考视频块。然后,运动估计单元204可以生成参考索引,该索引指示包含参考视频块的列表0或列表1中的参考图片,以及指示当前视频块和参考视频块之间的空域位移的运动矢量。运动估计单元204可以输出参考索引、预测方向指示符和运动矢量作为当前视频块的运动信息。运动补偿单元205可以基于由当前视频块的运动信息指示的参考视频块来生成当前块的预测视频块。
在其他示例中,运动估计单元204可以对当前视频块执行双向预测,运动估计单元204可以在列表0中的参考图片中搜索当前视频块的参考视频块,还可以在列表1中的参考图片中搜索当前视频块的另一参考视频块。然后,运动估计单元204可以生成参考索引,该索引指示包含参考视频块的列表0和列表1中的参考图片,以及指示参考视频块和当前视频块之间的空域位移的运动矢量。运动估计单元204可以输出当前视频块的参考索引和运动矢量作为当前视频块的运动信息。运动补偿单元205可以基于由当前视频块的运动信息指示的参考视频块来生成当前视频块的预测视频块。
在一些示例中,运动估计单元204可以输出用于解码器的解码处理的全套运动信息。
在一些示例中,运动估计单元204可能不输出当前视频的全套运动信息。相反,运动估计单元204可以参考另一视频块的运动信息来信令通知当前视频块的运动信息。例如,运动估计单元204可以确定当前视频块的运动信息与邻近视频块的运动信息足够类似。
在一个示例中,运动估计单元204可以在与当前视频块相关联的语法结构中指示一个值,该值向视频解码器300指示当前视频块具有与另一视频块相同的运动信息。
在另一个示例中,运动估计单元204可以在与当前视频块相关联的语法结构中识别另一个视频块和运动矢量差(MVD)。运动矢量差指示当前视频块的运动矢量与所指示视频块的运动矢量之间的差。视频解码器300可以使用所指示视频块的运动矢量和运动矢量差来确定当前视频块的运动矢量。
如上所讨论的,视频编码器200可以预测地信令通知运动矢量。可以由视频编码器200实施的预测信令技术的两个示例包括高级运动矢量预测(AMVP)和merge模式信令。
帧内预测单元206可以对当前视频块执行帧内预测。当帧内预测单元206对当前视频块执行帧内预测时,帧内预测单元206可以基于同一图片中其他视频块的解码样点生成当前视频块的预测数据。当前视频块的预测数据可以包括预测视频块和各种语法元素。
残差生成单元207可以通过从当前视频块减去(例如,用减号指示)当前视频块的预测视频块来生成当前视频块的残差数据。当前视频块的残差数据可以包括对应于当前视频块中的样点的不同样点分量的残差视频块。
在其他示例中,例如在跳过模式下,当前视频块的当前视频块可能没有残差数据,并且残差生成单元207可能不执行减法操作。
变换处理单元208可以通过将一个或多个变换应用于与当前视频块相关联的残差视频块,来为当前视频块生成一个或多个变换系数视频块。
在变换处理单元208生成与当前视频块相关联的变换系数视频块之后,量化单元209可以基于与当前视频块相关联的一个或多个量化参数(QP)值对与当前视频块相关联的变换系数视频块进行量化。
反量化单元210和反变换单元211可以分别对变换系数视频块应用反量化和反变换,以从变换系数视频块重构残差视频块。重构单元212可以将重构的残差视频块添加到来自预测单元202生成的一个或多个预测视频块的对应样点中,以产生与当前块相关联的重构视频块,以存储在缓冲器213中。
在重构单元212重构视频块之后,可以执行环路滤波操作以减少视频块中的视频块伪像。
熵编码单元214可以从视频编码器200的其他功能组件接收数据。当熵编码单元214接收到数据时,熵编码单元214可以执行一个或多个熵编码操作以生成熵编码数据并输出包括熵编码数据的比特流。
图6是示出视频解码器300的示例的框图,该视频解码器300可以是图4所示的系统100中的视频解码器114。
视频解码器300可以被配置为执行本公开的任何或所有技术。在图6的示例中,视频解码器300包括多个功能组件。本公开中描述的技术可以在视频解码器300的各个组件之间共享。在一些示例中,处理器可以被配置为执行本公开中描述的任何或所有技术。
在图6的示例中,视频解码器300包括熵解码单元301、运动补偿单元302、帧内预测单元303、反量化单元304、反变换单元305、以及重构单元306和缓冲器307。在一些示例中,视频解码器300可以执行通常与关于视频编码器200描述的编码过程(图5)相反的解码过程。
熵解码单元301可以取回编码比特流。编码比特流可以包括熵编码视频数据(例如,视频数据的编码块)。熵解码单元301可以对熵编码的视频数据进行解码,并且运动补偿单元302可以从熵解码的视频数据确定运动信息,该运动信息包括运动矢量、运动矢量精度、参考图片列表索引和其他运动信息。例如,运动补偿单元302可以通过执行AMVP和merge模式来确定这种信息。
运动补偿单元302可以产生运动补偿块,可能基于插值滤波器执行插值。语法元素中可以包括用于以子像素精度使用的插值滤波器的标识符。
运动补偿单元302可以使用视频编码器20在视频块编码期间使用的插值滤波器来计算参考块的子整数像素的插值。运动补偿单元302可以根据接收到的语法信息确定视频编码器200使用的插值滤波器,并使用插值滤波器来产生预测块。
运动补偿单元302可以使用一些语法信息来确定用于对编码视频序列的帧和/或条带进行编码的块的尺寸、描述如何对编码视频序列的图片的每个宏块进行分割的分割信息、指示如何对每个分区进行编码的模式、每个帧间编码块的一个或多个参考帧(和参考帧列表)、以及用于对编码视频序列进行解码的其他信息。
帧内预测单元303可以使用例如在比特流中接收的帧内预测模式,以从空域上邻近的块形成预测块。反量化单元303对在比特流中提供并由熵解码单元301解码的量化视频块系数进行反量化(即,去量化)。反变换单元303应用反变换。
重构单元306可以将残差块与运动补偿单元202或帧内预测单元303生成的对应预测块求和,以形成解码块。如果需要,还可以应用去方块滤波器来过滤解码块,以便移除块性伪像。解码后的视频块随后被存储在缓冲器307中,该缓冲器307为后续运动补偿/帧内预测提供参考块,并且还产生解码后的视频以在显示设备上呈现。
下面提供一些实施例优选的解决方案列表。
以下解决方案示出了前一节中讨论的技术的示例实施例(例如,项目1)。
1.一种视频处理方法(例如,图3所示的方法3000),包括:执行(3002)视频的视频区域中的视频单元和视频的编解码表示之间转换,其中,编解码表示符合语法规则。该规则规定视频图片级的第一指示符和视频区域级的第二指示符指示在转换期间使用时域运动矢量预测编解码工具。该规则规定了在编解码表示中省略第一个指示符和/或第二个指示符的条件。
2.根据解决方案1所述的方法,其中,第一个指示符指示视频图片中的任何视频区域是否使用时域运动矢量预测编解码工具。
3.根据解决方案1-2中任一项所述的方法,其中,第二个指示符指示在视频区域级别启用时域运动矢量预测编解码工具。
4.根据解决方案1-3中任一项所述的方法,其中,第二个指示符从编解码表示中省略,并且其中,在解码器处,第二个指示符被推断为具有特定值。
以下解决方案示出了前一节中讨论的技术的示例实施例(例如,项目2)
5.一种视频处理方法,包括:执行视频的视频区域中的视频单元和视频的编解码表示之间的转换,其中,编解码表示符合语法规则;其中,语法规则规定视频区域级别处的标头的信息被推断为视频单元级别处的标头信息。
6.根据解决方案1所述的信息,其中,视频单元是视频条带,并且视频区域是视频图片。
以下解决方案示出了前一节中讨论的技术的示例实施例(例如,项目3)
7.一种视频处理方法,包括:执行包括组织为逐层视频序列的多个图片的视频的视频区域中的视频单元与视频的编解码表示之间的转换;其中,编解码表示中的一个或多个字段指示视频单元中的子图片的数目。
8.根据解决方案7所述的方法,其中,视频单元是视频图片。
9.根据解决方案7所述的方法,其中,一个或多个字段的第一个字段指示视频区域级别处的子图片数目的约束,并且在第一个字段指示启用了约束的情况下,第二个字段被限制为零值。
以下解决方案示出了前一节中讨论的技术的示例实施例(例如,第4项)
10.一种视频处理的方法,包括:执行包括组织为逐层视频序列的多个图片的视频的视频区域中的视频单元与视频的编解码表示之间的转换;其中,编解码表示符合格式规则,该格式规则规定指示视频单元中子图片数目的第二字段的值控制第二字段是否指示跨子图片编解码工具对转换的适用性。
11.根据解决方案10所述的方法,其中,视频单元是视频图片。
12.根据解决方案10-11中任一项所述的方法,其中,视频区域是视频序列。
13.根据解决方案10-12中任一项所述的方法,其中,跨子图片编解码工具包括帧内编解码工具、帧间编解码工具或环路滤波工具。
以下解决方案示出了前一节中讨论的技术的示例实施例(例如,项目5、6)
14.一种视频处理的方法,包括:执行包括组织为逐层视频序列的多个图片的视频的视频区域中的视频单元与视频的编解码表示之间的转换;其中,编解码表示符合格式规则,该格式规则规定每个视频单元的子图片数目控制编解码表示中的语法元素的值。
15.根据解决方案14所述的方法,其中,语法元素的值指示子图片是否被视为视频图片。
16.根据解决方案14所述的方法,其中,语法元素的值指示是否跨子图片启用环路滤波。
以下解决方案示出了前一节中讨论的技术的示例实施例(例如项目7、8)
17.一种视频处理的方法,包括:执行包括组织为逐层视频序列的多个图片的视频的视频区域中的视频单元与视频的编解码表示之间的转换;其中,编解码表示符合格式规则,该格式规则规定指示视频单元中是否出现单个视频条带的字段的值控制视频的矩形条带的编解码特性。
18.根据解决方案17所述的方法,其中,编解码特性包括矩形条带的宽度是否以视频单元中的片列为单位规定。
19.根据解决方案17所述的方法,其中,编解码特性包括子图片中是否包括单个条带。
以下解决方案示出了前一节中讨论的技术的示例实施例(例如,项目9)。
20.一种视频处理的方法,包括:执行包括组织为逐层视频序列的多个图片的视频的视频区域中的视频单元与视频的编解码表示之间的转换;其中,编解码表示符合语法规则,该语法规则在层宽视频序列的编解码表示中跨不同图片的提取子图片具有相同的子图片索引。
21.根据解决方案10所述的方法,其中,格式规则规定在基于子图片索引的编解码表示的解码期间提取子图片。
以下解决方案示出了前一节中讨论的技术的示例实施例(例如,项目10)
22.一种视频处理的方法,包括:执行包括组织为逐层视频序列的多个图片的视频的视频区域中的视频单元与视频的编解码表示之间的转换;其中,编解码表示符合语法规则,即为子图片子比特流提取的子比特流符合单个子图片的格式。
以下解决方案示出了前一节中讨论的技术的示例实施例(例如,项目13)
23.一种视频处理的方法,包括:执行包括组织为逐层视频序列的多个图片的视频的视频区域中的视频单元与视频的编解码表示之间的转换;其中,编解码表示符合格式规则,该格式规则规定包括一个或多个约束标志,这些约束标志控制编解码表示中语法结构中一个或多个语法元素的出现。
24.根据解决方案23所述的方法,其中,语法结构是序列参数集或视频参数集或图片参数集或图片标头或条带标头。
以下解决方案示出了前一节中讨论的技术的示例实施例(例如,项目14)。
25.根据解决方案23-24中任一项所述的方法,其中,一个或多个语法元素指示编解码表示内的图片分辨率变化。
以下解决方案示出了前一节中讨论的技术的示例实施例(例如,项目15)。
26.根据解决方案23-24中任一项所述的方法,其中,一个或多个语法元素指示用于转换的缩放窗口偏移参数。
以下解决方案示出了前一节中讨论的技术的示例实施例(例如,项目16)
27.根据解决方案23-24中任一项所述的方法,其中,一个或多个约束标志包括指示是否启用了每个图片约束一个条带的标志。
以下解决方案示出了前一节中讨论的技术的示例实施例(例如,项目17)。
28.根据解决方案23-24中任一项所述的方法,其中,一个或多个约束标志包括指示转换期间是否跳过变换的标志。
以下解决方案示出了前一节中讨论的技术的示例实施例(例如,项目18)。
29.根据解决方案23-28中任一项所述的方法,其中,来自一个或多个约束标志的第一个约束标志控制编解码表示中第二个约束标志的出现。
30.根据解决方案23-29中任一项所述的方法,其中,语法规则规定一个或多个约束标志包括一组约束标志,这些约束标志根据用于视频转换的编解码工具类型或编解码简档进行分组。
31.根据上述解决方案任一项所述的方法,其中,视频单元对应于视频图片。
32.根据上述解决方案任一项所述的方法,其中,视频区域对应于视频序列。
33.根据解决方案1至32中任一项所述的方法,其中,转换包括将视频编码为编解码表示。
34.根据解决方案1至32中任一项所述的方法,其中,转换包括对编解码表示进行解码以生成视频的像素值。
35.一种视频解码装置,包括处理器,该处理器被配置为实施解决方案1至34中的一项或多项所述的方法。
36.一种视频编码装置,包括处理器,该处理器被配置为实施解决方案1至34中的一项或多项所述的方法。
37.一种其上存储有计算机代码的计算机程序产品,该代码当由处理器执行时,使得处理器实施解决方案1至34中任一项所述的方法。
38.本文档中描述的方法、装置或系统。
图7是根据本技术用于视频处理的方法700的流程图表示。在操作710处,方法700包括执行包括视频条带的视频图片的视频与视频的比特流之间的转换。比特流符合格式规则,该格式规则规定视频条带的条带类型确定视频图片的图片标头的特定信息被视频条带的条带标头继承的方式。
在一些实施例中,格式规则规定基于参考图片列表信息是否存在于图片标头中来进一步确定方式。在一些实施例中,某些信息包括以下至少一项:用于时域运动矢量预测的并置图片是来自参考列表0,还是来自并置图片的参考图片索引。在一些实施例中,格式规则规定该方式进一步基于是否为视频条带启用了时域运动矢量预测。在一些实施例中,视频图片的图片标头中的第一语法元素指示是否对视频图片启用了时域运动矢量预测,并且在视频条带的条带类型为P且第一语法元素等于1的情况下,该方式规定,视频条带的条带标头中指示视频条带与哪个参考图片列表并置的第二语法元素的值被推断为1,而与指示视频图片与哪个参考图片列表并置的视频图片的图片标头中的第三语法元素的值无关。在一些实施例中,在视频条带的条带类型为P的情况下,该方式规定视频条带的条带标头中指示视频条带与哪个参考图片列表并置的第二语法元素的值被推断为1,而与其他条件无关。在一些实施例中,在视频条带的条带类型为P的情况下,该方式规定视频条带的条带标头中指示视频条带与哪个参考图片列表并置的第二语法元素的值被推断为1,以响应于为视频条带启用的时域运动矢量预测。
在一些实施例中,视频图片的图片标头中的第一语法元素指示是否为视频图片启用时域运动矢量预测,并且在视频条带的条带类型为B且第一语法元素等于1的情况下,该方式规定,视频条带的条带标头中指示视频条带与哪个参考图片列表并置的第二语法元素的值被推断为等于视频图片的图片标头中指示视频图片与哪个参考图片列表并置的第四语法元素。在一些实施例中,视频图片标头中的语法元素规定用于时域运动矢量预测的视频图片的并置图片的参考索引,并且格式规则规定语法元素的值小于指示参考图片列表0中活动参考条目的数目的变量。
在一些实施例中,视频条带标头中的语法元素规定用于时域运动矢量预测的视频图片的并置图片的参考索引,并且格式规则规定语法元素指代参考图片列表1中的非活动条目。在一些实施例中,格式规则进一步规定与参考图片列表1中的非活动条目相对应的参考图片也由参考图片列表0中的活动条目引用。在一些实施例中,视频条带标头中的语法元素规定在用于转换之前修改用于时域运动矢量预测的视频图片的并置图片的参考索引。在一些实施例中,语法元素被映射到0到参考图片列表0中的活动参考条目数目减1(含)范围内的索引。在一些实施例中,语法元素引用指代图片列表0中的条目,并且在语法元素的值大于或等于参考图片列表0中的活动参考条目的数目的情况下,语法元素被设置为默认并置参考索引。默认并置参考索引在0到参考图片列表中活动参考条目数目减1(含)的范围内。在一些实施例中,默认并置参考索引被设置为0或在比特流中被信令通知。
在一些实施例中,格式规则规定参考相同视频图片标头的第一类型的第一视频条带和第二类型的第二视频条带使用不同的并置图片进行转换。在一些实施例中,第一类型是B类型的视频条带,并且第二类型是P类型的视频条带。在一些实施例中,在视频图片标头中信令通知参考图片列表,并且在视频条带标头中信令通知并置图片的参考图片索引。在一些实施例中,格式规则规定,在(1)条带类型为P,(2)在视频图片标头中信令通知参考图片列表,(3)启用时域运动矢量预测,以及(4)视频图片标头中的第三语法元素为0指示视频图片未与参考图片列表0并置的情况下,在视频条带标头中信令通知并置图片的参考图片索引。在一些实施例中,参考图片索引引用参考图片列表0中的参考图片。
在一些实施例中,格式规则规定为类型B的第一视频条带信令通知或确定第一并置参考图片索引,并且为类型P的第二视频条带信令通知或确定第二并置参考图片索引。在一些实施例中,仅在视频图片标头中的第三语法元素指示视频图片未与参考图片列表0并置时,才信令通知第一并置参考图片索引和第二并置参考图片索引。
在一些实施例中,格式规则规定在比特流中信令通知第一类型的第一视频条带和第二类型的第二视频条带是否引用相同的视频图片标头。在一些实施例中,在视频图片标头中信令通知参考相同视频图片标头的视频条带的类型。在一些实施例中,格式规则规定,仅当在视频图片标头中信令通知参考图片列表时,才在视频图片标头中信令通知参考相同视频图片标头的视频条带的类型。在一些实施例中,格式规则规定,仅当在视频图片标头中信令通知参考相同视频图片标头的视频条带的类型时,才在视频图片标头中信令通知参考图片列表。在一些实施例中,在比特流中信令通知是否仅存在引用相同视频图片标头的B类型视频条带。在一些实施例中,在比特流中信令通知是否仅存在引用相同视频图片标头的P类型视频条带。在一些实施例中,仅存在B类型的视频条带,并且在比特流中信令通知引用相同视频图片标头的I类型的视频条带。在一些实施例中,仅存在P类型的视频条带,并且在比特流中信令通知引用相同视频图片标头的I类型的视频条带。
图8是根据本技术的用于视频处理的方法800的流程图表示。在操作810处,方法800包括执行包括视频条带的视频图片的视频与视频的比特流之间的转换。该比特流符合格式规则,该格式规则规定视频条带的条带类型确定视频条带标头中第一语法元素的值。第一语法元素规定用于时域运动矢量预测的并置图片的参考索引。
在一些实施例中,在视频条带的条带类型是B并且视频条带标头中指示视频条带的第二语法元素的值与参考图片列表0并置的情况下,第一语法元素指代参考图片列表0中的条目。在一些实施例中,第一语法元素在0到(活动参考图片的索引数目-1)(含)的范围内。
在一些实施例中,在视频条带的条带类型是P并且启用了时域运动矢量预测的情况下,第一语法元素在0到(活动参考图片的索引数目-1)(含)的范围内。
图9是根据本技术的视频处理的方法900的流程图。在操作910处,方法900包括执行包括视频条带的视频图片的视频与视频的比特流之间的转换。比特流符合格式规则,该格式规则规定,在视频条带的条带类型为类型P并且启用了时域运动矢量预测的情况下,禁用对并置参考图片列表中的参考图片使用参考图片重采样(RPR)。参考图片由用于时域运动矢量预测的并置图片的参考索引指示。
在一些实施例中,基于视频条带标头中的语法元素确定并置参考图片列表,该语法元素指示视频条带是否与参考图片列表0并置。在一些实施例中,在视频条带的条带类型是P并且启用了时域运动矢量预测的情况下,语法元素被推断为等于1。在一些实施例中,并置参考图片列表是参考图片列表0。
图10是根据本技术的用于视频处理的方法1000的流程图表示。在操作1010处,方法1000包括执行包括视频条带的视频图片的视频与视频的比特流之间的转换。该比特流符合格式规则,该格式规则规定在视频条带标头中的语法元素指示视频条带未与参考图片列表0并置的情况下,视频条带的条带类型排除类型P。
在一些实施例中,格式规则进一步规定,在(1)参考图片列表的信息在比特流的视频图片标头中,(2)为视频图片启用时域运动矢量预测,(3)视频图片的所有编解码视频条带具有类型B或类型P的条带类型,以及(4)视频图片未与参考图片列表0并置的情况下,在比特流中省略条带类型的信令。在一些实施例中,视频条带的条带类型被推断为类型B。
图11是根据本技术的用于视频处理的方法1100的流程图表示。在操作1110处,方法1100包括执行包括一个或多个子图片的视频图片的视频与视频的比特流之间的转换。比特流符合格式规则,该格式规则规定响应于视频图片中的子图片数目选择性地包括指示是否跨编解码层视频序列中的子图片的边界执行操作的第一语法元素。
在一些实施例中,格式规则规定第一语法元素进一步指示编解码层视频序列中子图片的所有边界被视为图片边界。在一些实施例中,该操作包括帧内预测、帧间预测或环路滤波操作中的至少一个。在一些实施例中,格式规则规定在视频图片中的子图片数目为1的情况下,在比特流中省略语法元素。在一些实施例中,语法元素的值被推断为1,指示没有跨子图片的边界执行环路滤波操作。在一些实施例中,第一语法元素在序列参数集中。在一些实施例中,第一语法元素包括sps_independent_subpics_flag。
在一些实施例中,格式规则进一步规定,编解码层视频序列中的视频图片中的子图片的数目确定指示第二语法元素的方式,该第二语法元素指示视频图片的一个或多个子图片是否被视为用于转换的一个或多个图片,其中在转换中未应用环路滤波操作。在一些实施例中,在图片中的子图片的数目为1的情况下,第二语法元素的值被推断为1,指示视频图片的子图片被视为用于转换的图片。在一些实施例中,在图片中的子图片的数目为1的情况下,第二语法元素的值需要为1,指示视频图片的子图片被视为用于转换的图片。
在一些实施例中,格式规则进一步规定,编解码层视频序列中的视频图片中的子图片的数目确定了指示第三语法元素的方式,该第三语法元素指示是否跨子图片的边界启用了环路滤波操作。在一些实施例中,第三语法元素进一步指示环路滤波操作是否跨子图片的边界可适用。在一些实施例中,在图片中的子图片的数目为1的情况下,第三语法元素的值需要为0,指示跨子图片的边界禁用环路滤波器操作。在一些实施例中,被推断为0的第三语法元素进一步指示环路滤波操作跨子图片的边界不适用。在一些实施例中,在图片中的子图片的数目为1的情况下,第三语法元素的值需要为0,这指示跨子图片的边界禁用环路滤波器操作。在一些实施例中,要求为0的第三语法元素进一步指示环路滤波操作跨子图片的边界不适用。
在一些实施例中,子图片的数目由语法元素sps_num_subpics_nimus1指示。在一些实施例中,子图片的数目由语法元素one_subpic_per_pic_contraint_flag指示。
图12是根据本技术的用于视频处理的方法1200的流程图表示。在操作1210处,方法1200包括执行包括一个或多个子图片的视频图片的视频与视频的比特流之间的转换。比特流符合格式规则,该格式规则规定比特流中视频图片中的子图片数目受比特流中的约束标志约束。
在一些实施例中,约束标志包括one_subpic_per_pic_contraint_flag。在一些实施例中,在约束标志的值为1的情况下,子图片的数目要求为1。
图13是根据本技术的用于视频处理的方法1300的流程图表示。在操作1310处,方法1300包括执行包括一个或多个子图片的视频图片的视频与视频的比特流之间的转换。比特流符合一种格式规则,该规则规定子图片中的条带数决定了信令通知指示条带宽的语法元素的方式,其中条带宽被规定为片列的数目。
在一些实施例中,在比特流中省略了语法元素,并且在子图片中的条带数为1的情况下推断条带的宽度。在一些实施例中,条带的宽度被推断为1个片列。
图14是根据本技术的用于视频处理的方法1400的流程图表示。方法1400包括,在操作1410处,根据规定基于约束标志确定视频图片中的一个或多个子图片中的每一个子图片是否包括单个条带的格式规则,执行包括一个或多个子图片的视频图片的视频与视频的比特流之间的转换。
在一些实施例中,语法元素指示视频图片中的一个或多个子图片中的每一个是否包括单个条带,并且约束标志指示视频图片是否被分割成多个片或条带。在一些实施例中,单个条带仅指示一个矩形条带。在一些实施例中,在约束标志指示视频图片未被分割为多个片或条带的情况下,语法元素被推断为等于1。在一些实施例中,在约束标志指示没有图片分割被应用于视频图片的情况下,语法元素被推断为等于1。在一些实施例中,在约束标志指示没有图片分割被应用于视频图片的情况下,比特流中不存在语法元素,并且语法元素的值被推断为等于1。在一些实施例中,语法元素被推断为等于约束标志。
在一些实施例中,语法元素指示视频图片中的一个或多个子图片中的每一个子图片是否包括单个条带,约束标志指示视频图片是否包括单个条带,并且在约束标志等于1的情况下,语法元素等于1。在一些实施例中,语法元素指示视频图片中的一个或多个子图片中的每一个子图片是否包括单个条带,约束标志指示视频图片是否包括单个条带,并且在约束标志等于1且单个条带为矩形的情况下,语法元素等于1。在一些实施例中,由语法元素和约束标志控制的所有视频图片引用相同的图片参数集。
图15是根据本技术的用于视频处理的方法1500的流程图表示。在操作1510处,方法1500包括执行包括视频图片的视频与视频的比特流之间的转换。视频图片中的至少一个包括一个或多个子图片。比特流符合格式规则,该格式规则规定,为了在转换的子图片子比特流提取过程中确定一个或多个目标子图片的输出子比特流,不同视频图片中的每个目标子图片使用相同的子图片索引。
在一些实施例中,一个或多个目标子图片的目标子图片索引值的列表用作子图片子比特流提取过程的输入,并且目标子图片索引值的列表在不同的视频图片中是相同的。在一些实施例中,跨不同的视频图片的一个或多个子图片标识符用于子图片子比特流提取处理,并且一个或多个子图片标识符对应于目标子图片索引的相同列表。在一些实施例中,基于子图片索引确定用于确定子图片子比特流提取过程中的输出子比特流的一个或多个目标子图片。
在一些实施例中,基于子图片索引确定修改用于确定子图片子比特流提取过程中的输出子比特流的语法元素的方式。在一些实施例中,修改语法元素的方式包括重写和/或移除语法元素。在一些实施例中,在比特流中显式地信令通知指示子图片标识符映射的语法元素的情况下,在图片参数集中省略子图片标识符映射。在一些实施例中,在比特流中显式地信令通知指示子图片标识符映射的语法元素的情况下,在图片参数集中信令通知子图片标识符映射。
图16是根据本技术的用于视频处理的方法1600的流程图表示。在操作1610处,方法1600包括通过从包括视频图片的视频的比特流中提取一个或多个目标子图片的子比特流来确定输出子比特流。视频图片中的至少一个包括一个或多个子图片,并且输出子比特流符合一种格式规则,该格式规则规定一个或多个目标子图片在输出子比特流中被表示为单个子图片。
在一些实施例中,输出子比特流的一个或多个语法元素被重写和/或移除以用于确定。在一些实施例中,响应于将一个或多个目标子图片表示为输出子比特流中的单个子图片,在输出子比特流中省略了引用所有输出层中的一个或多个目标子图片的一个或多个语法元素。在一些实施例中,一个或多个语法元素包括指示子图片是否被视为图片的第一语法元素。在一些实施例中,第一语法元素被推断为等于1,这指示子图片被视为图片。在一些实施例中,一个或多个语法元素包括第二语法元素,这指示是否跨子图片的边界启用环路滤波器操作。在一些实施例中,第二语法元素被推断为等于0,这指示跨子图片的边界禁用环路滤波器操作。
在一些实施例中,序列参数集的所有引用语法结构中的第三语法元素和图片参数集的所有引用语法结构中的第四语法元素被修改为0,第三语法元素和第四语法元素指示视频图片中的子图片数减1。在一些实施例中,指示是否跨子图片的边界执行操作的第五语法元素被修改为等于1。在一些实施例中,在子比特流中引用的语法结构中修改指示视频图片是否被分割的第六语法元素。在一些实施例中,基于子图片中的片或条带的数目有条件地修改第六语法元素。在一些实施例中,在子图片包括单个片或条带的情况下,第六语法元素被修改为等于1,这指示视频图片没有被分割。在一些实施例中,在子图片中的片或条带的数目大于1的情况下,第六语法元素被修改为等于0,这指示视频图片被分割。
图17是根据本技术的用于视频处理的方法1700的流程图表示。在操作1710处,方法1700包括执行包括瞬时解码刷新(IDR)图片的视频与视频的比特流之间的转换。该比特流符合格式规则,该格式规则规定与参考图片列表相关联的一个或多个语法元素存在于IDR图片的条带标头中。
在一些实施例中,语法标志指示一个或多个语法元素存在于IDR图片的条带标头中。在一些实施例中,语法标志被设置为等于1。
在一些实施例中,转换包括通过merging视频的两个输入比特流来确定输出比特流。两个输入比特流之一的网络抽象层(NAL)单元类型是帧内随机接入点(IRAP)视频编解码层(VCL)NAL单元类型,并且IDR图片的参考图片列表可用于转换。
图18是根据本技术的用于视频处理的方法1800的流程图表示。在操作1810处,方法1800包括执行包括亮度视频块和色度视频块的视频与视频的比特流之间的转换。根据亮度分割树对亮度视频块进行分割,并且根据色度分割树对色度视频块进行分割。比特流包括指示亮度分割树的亮度块划分信息和指示色度分割树的色度块划分信息。比特流符合一个规则,该规则规定允许色度块划分信息不同于亮度块划分信息。
在一些实施例中,亮度视频块或色度视频块包括编解码树块、变换块、图片块或编解码块。在一些实施例中,色度分割树包括色度双树,并且色度视频块的至少划分结构或划分语法元素不同于亮度视频块的划分结构或划分语法元素。在一些实施例中,亮度分割树包括局部双树,并且色度视频块的至少划分结构或划分语法元素不同于亮度视频块的划分结构或划分语法元素。
图19是根据本技术的用于视频处理的方法1900的流程图表示。在操作1910处,方法1900包括执行包括一个或多个子图片的视频图片的视频与视频的比特流之间的转换。比特流符合格式规则,该规则规定一个或多个语法结构基于包括一般约束信息的语法元素的约束标志进行约束。
在一些实施例中,约束标志包括one_tile_per_pic_constraint_flag,这指示由视频参数集规定的一个或多个输出层集中的每个视频图片是否包括单个片,并且一个或多个语法结构包括指示图片中的片的数目的第一语法结构NumTilesInPic,该数目在one_tile_per_pic_constraint_flag等于1的情况下被约束为1。在一些实施例中,约束标志包括指示由视频参数集规定的一个或多个输出层集中的每个视频图片是否包括单个条带的one_slice_per_pic_constraint_flag,并且一个或多个语法结构包括指示每个视频图片中的矩形条带数减1的第二语法元素num_slices_in_pic_minus1。在一些实施例中,在one_slice_per_pic_constraint_flag等于1并且指示视频图片中矩形条带的使用的另一个语法元素rect_slice_flag等于1的情况下,第二语法元素num_slices_in_pic_minus1被约束为0。在一些实施例中,在one_slice_per_pic_constraint_flag等于1并且指示视频图片中矩形条带的使用的另一个语法元素rect_slice_flag等于0的情况下,比特流的每个条带标头中的第二语法元素num_slices_in_pic_minus1被约束为等于视频图片中的片数减1。
在一些实施例中,约束标志包括指示视频图片是否包括单个子图片的one_subpic_per_pic_constraint标志,并且其中一个或多个语法元素包括指示视频图片中的子图片数目的第三语法元素sps_num_subpics_minus1,该数目在one_subpic_per_pic_constraint等于1的情况下被约束为0。在一些实施例中,约束标志包括指示由视频参数集规定的一个或多个输出层集合中的所有图片的sps_subpic_info_present_flag等于0,并且其中一个或多个语法结构包括指示视频图片中的子图片数目的第三语法元素sps_num_subpics_minus1,该数目在one_subpic_per_pic_constraint等于0的情况下被约束为0。在一些实施例中,等于0的sps_subpic_info_present_flag指示每个视频图片包括单个子图片和子图片信息不存在。
在一些实施例中,一个或多个语法元素位于条带参数集、视频参数集、图片参数集、图片标头或条带标头中。在一些实施例中,一个或多个语法元素包括指示是否启用编解码工具的语法标志。在一些实施例中,语法标志被约束为0,这指示在约束标志等于1的情况下禁用编解码工具。在一些实施例中,基于约束标志覆盖语法标志。
在一些实施例中,比特流中是否存在语法标志基于约束标志。在一些实施例中,在约束标志等于1的情况下,在比特流中省略语法标志。在一些实施例中,语法标志被推断为0,这指示编解码工具被禁用。
在一些实施例中,约束标志指示在编解码层视频序列(CLVS)中没有分辨率变化,并且其中一个或多个语法元素包括序列参数集中的第一语法元素,这指示CLVS中是否允许分辨率变化。在一些实施例中,在约束标志等于1的情况下,在比特流中省略第一语法元素。在一些实施例中,第一语法元素被推断为0,这指示在CLVS中不允许分辨率变化。
在一些实施例中,一个或多个语法元素进一步包括指示缩放窗口偏移参数的第二语法元素,并且第二语法元素是否存在于比特流中至少基于约束标志或第一语法元素。在一些实施例中,在第一语法元素等于0的情况下,在比特流中省略第二语法元素,这指示在CLVS中不允许分辨率变化。在一些实施例中,在约束标志等于1的情况下,在比特流中省略第二语法元素,这指示CLVS中没有分辨率变化。在一些实施例中,第二语法元素被推断为0。
在一些实施例中,约束标志包括指示视频图片是否包括单个条带的one_slice_per_pic_constraint标志,并且一个或多个语法元素包括指示视频图片是否包括单个子图片的语法标志one_subpic_per_pic_constraint_flag。在一些实施例中,在约束标志等于1的情况下,在比特流中省略语法标志one_subpic_per_pic_constraint_flag,并且其中语法标志被推断为1,这指示视频图片包括单个子图片。在一些实施例中,在约束标志等于0的情况下,在比特流中包括语法标志one_subpic_per_pic_constraint_flag。在一些实施例中,约束标志包括no_transform_skip_constraint_flag,这指示变换跳过是否不允许用于转换,并且一个或多个语法元素包括语法标志no_bdpcm_constraint标志,这指示是否不允许块差分脉冲编码调制(BDPCM)编解码工具。在一些实施例中,在约束标志等于1的情况下(这指示不允许变换跳过),语法标志被约束为1(这指示不允许BDPCM编解码工具)。在一些实施例中,在约束标志等于1的情况下(这指示不允许变换跳过),在比特流中省略语法标志。在一些实施例中,语法标志被推断为1,这指示不允许BDPCM编解码工具。
在一些实施例中,比特流中是否存在约束标志基于语法结构中的至少一个其他约束标志。在一些实施例中,至少一个其他约束标志被定义为约束组标志。在一些实施例中,基于视频的简档的编解码工具类型对多个约束标志进行分组。在一些实施例中,基于对应的约束组标志来确定一个组中的约束标志的值。在一些实施例中,基于对应的约束组标志来确定比特流中是否存在约束标志。在一些实施例中,在比特流中省略约束标志的情况下,约束标志被推断为0。
在一些实施例中,转换包括将视频编码为比特流。在一些实施例中,转换包括从比特流解码视频。
在本文档中,术语“视频处理”可以指代视频编码、视频解码、视频压缩或视频解压缩。例如,视频压缩算法可以在从视频的像素表示转换为对应的比特流表示期间应用,反之亦然。例如,当前视频块的比特流(编解码)表示可以对应于在比特流内的不同位置中并置或散布的比特,如由语法所定义的。例如,宏块可以根据变换和编解码的错误残差值进行编码,也可以使用标头中的比特和比特流中的其他字段进行编码。此外,视频编码器可以根据所描述的格式规则执行编码操作,使得由编码操作产生的编解码表示符合格式。类似地,解码器可以利用格式规则的知识解析编解码表示(例如,根据格式规则是否期望存在或缺失某些字段),并执行解码操作以生成视频像素值。
本文档中描述的公开和其他解决方案、示例、实施例、模块和功能操作可以在以下各项中实施:数字电子电路中,或计算机软件、固件或硬件,包括本文档中公开的结构及其结构等同物,或上述各项的一个或多个的组合。所公开的实施例和其他实施例可以被实施为一个或多个计算机程序产品,即编码在计算机可读介质上的计算机程序指令的一个或多个模块,用于由数据处理装置执行或控制其操作。计算机可读介质可以是机器可读存储设备、机器可读存储基板、存储器设备、影响机器可读传播信号的物质的组合物,或者一个或多个它们的组合。术语“数据处理装置”包含用于处理数据的所有装置、设备和机器,例如包括可编程处理器、计算机或多个处理器或计算机。除了硬件之外,该装置还可以包括为所讨论的计算机程序创建执行环境的代码,例如,构成处理器固件、协议栈、数据库管理系统、操作系统或其中一个或多个的组合的代码。传播信号是人为生成的信号,例如,机器生成的电气、光学或电磁信号,其被生成用于编码信息以传输到合适的接收器装置。
计算机程序(也被称为程序、软件、软件应用、脚本或代码)可以用任何形式的编程语言编写,包括编译或解释语言,并且可以以任何形式部署,包括作为独立程序或模块、组件、子例程或适合在计算环境中使用的其他单元。计算机程序不一定对应于文件系统中的文件。程序可以被存储在保存其他程序或数据的文件部分(例如,标记语言文档中存储的一个或多个脚本)、专用于相关程序的单个文件或多个协调文件(例如,存储一个或多个模块、子程序或代码部分的文件)。计算机程序可以被部署以在一台计算机上执行,或在位于一个站点或分布在多个站点并通过通信网络互连的多台计算机上执行。
本文档中描述的过程和逻辑流可以由一个或多个可编程处理器执行,这些处理器通过对输入数据进行操作并生成输出来执行一个或多个计算机程序以执行功能。处理和逻辑流还可以由专用逻辑电路执行,并且装置也可以实施为专用逻辑电路,例如FPGA(现场可编程门阵列)或ASIC(专用集成电路)。
适用于执行计算机程序的处理器例如包括通用微处理器和专用微处理器,以及任何类型数字计算机的任何一个或多个处理器。通常,处理器将从只读存储器或随机存取存储器或两者中接收指令和数据。计算机的基本元件是用于执行指令的处理器和用于存储指令和数据的一个或多个存储器设备。通常,计算机还将包括用于存储数据的一个或多个大容量存储设备(例如,磁、磁光盘或光盘),或被可操作地耦合以从该设备接收数据或向该设备传输数据,或同时接收和传输数据。然而,计算机不需要有这样的设备。适于存储计算机程序指令和数据的计算机可读介质包括所有形式的非易失性存储器、介质和存储器设备,包括例如半导体存储器设备,例如EPROM、EEPROM和闪速存储器设备;磁盘,例如内部硬盘或可移动磁盘;磁光盘;以及CD-ROM和DVD-ROM光盘。处理器和存储器可以由专用逻辑电路补充或被合并到专用逻辑电路中。
尽管本专利文档包含许多细节,但这些细节不应解释为对任何主题或可能要求保护的内容的范围的限制,而应解释为对可能特定于特定技术的特定实施例的特征的描述。本专利文档中在单独实施例的上下文中描述的某些特征也可以在单个实施例中组合实施。相反,在单个实施例的上下文中描述的各种特征也可以分别在多个实施例中或在任何合适的子组合中实施。此外,尽管特征可以在上面描述为在某些组合中起作用,甚至最初声称为这样,但在某些情况下可以从组合中删除来自所声称的组合的一个或多个特征,并且所声称的组合可以指向子组合或子组合的变体。
类似地,尽管在附图中以特定的顺序描述操作,但这不应被理解为要求以所示的特定的顺序或序列顺序执行这样的操作,或要求执行所有图示操作,以实现预期结果。此外,本专利文件中描述的实施例中各种系统组件的分离不应理解为在所有实施例中都需要这种分离。
仅描述了少数实施和示例,并且可以基于本专利文档中描述和示出的内容进行其他实施、增强和变体。

Claims (17)

1.一种视频处理的方法,包括:
执行包括视频图片的视频和所述视频的比特流之间的转换,其中,所述视频图片包括视频条带;
其中,所述比特流符合格式规则;以及
其中,所述格式规则规定,在所述视频条带的条带类型为类型P且启用了时域运动矢量预测的情况下,禁止对在并置参考图片列表中的参考图片使用参考图片重采样RPR,其中,所述参考图片由用于所述时域运动矢量预测的所述视频条带的并置图片的参考索引指示。
2.根据权利要求1所述的方法,其中,所述并置参考图片列表是基于视频条带标头中的语法元素来确定的,所述语法元素指示所述视频条带是否与参考图片列表0并置。
3.根据权利要求2所述的方法,其中,在所述视频条带的所述条带类型为P且启用了所述时域运动矢量预测的情况下,所述语法元素被推断为等于1。
4.根据权利要求2或3所述的方法,其中,所述并置参考图片列表是参考图片列表0。
5.一种视频处理的方法,包括:
执行包括视频图片的视频与所述视频的比特流之间的转换,其中所述视频图片包含视频条带;
其中,所述比特流符合一种格式规则;并且
其中,所述格式规格规定,在视频条带标头中的语法元素指示所述视频条带不与参考图片列表0并置的情况下,所述视频条带的条带类型不包括类型P。
6.根据权利要求5所述的方法,其中,所述格式规则进一步规定,在以下情况下:(1)参考图片列表的信息在视频图片标头中,(2)对所述视频图片启用所述时域运动矢量预测,(3)所述视频图片的所有编解码视频条带具有类型B或类型P的条带类型,以及(4)所述视频图片不与参考图片列表0并置,在所述比特流中省略所述条带类型的信令通知。
7.根据权利要求5或6所述的方法,其中,所述视频条带的条带类型被推断为类型B。
8.根据权利要求1至7中的任一项所述的方法,其中,所述转换包括将所述视频编码为所述比特流。
9.根据权利要求1至7中的任一项所述的方法,其中,所述转换包括从所述比特流解码所述视频。
10.一种用于存储视频的比特流的方法,包括:
根据包括视频条带的视频图片生成所述视频的比特流,其中,所述比特流符合一种格式规则,所述格式规则规定,在所述视频条带的条带类型为类型P且启用了时域运动矢量预测的情况下,禁止积极使用并置参考图片列表中的参考图片的参考图片重采样RPR,其中,所述参考图片由用于所述时域运动矢量预测的所述视频条带的并置图片的参考索引指示;以及
将所述比特流存储在非暂时性计算机可读记录介质中。
11.一种用于存储视频的比特流的方法,包括:
根据包括视频条带的视频图片生成所述视频的比特流,其中,所述比特流符合一种格式规则,该格式规则规定,在视频条带标头中的语法元素指示视频条带不与参考图片列表0并置的情况下,所述视频条带的条带类型不包括类型P;以及
将所述比特流存储在非暂时性计算机可读记录介质中。
12.一种视频解码装置,包括被配置为实施权利要求1至11中的一项或多项所述的方法的处理器。
13.一种视频编码装置,包括被配置为实施权利要求1至11中的一项或多项所述的方法的处理器。
14.一种计算机程序产品,其上存储有计算机代码,所述代码当由处理器执行时,使得所述处理器实施权利要求1至11中的任一项所述的方法。
15.一种存储视频的比特流的非暂时性计算机可读记录介质,其通过视频处理装置执行的方法生成,其中,所述方法包括:
根据包括视频条带的视频图片生成所述视频的比特流,其中,所述比特流符合一种格式规则,所述格式规则规定,在所述视频条带的条带类型为类型P且启用了时域运动矢量预测的情况下,禁止积极使用并置参考图片列表中的参考图片的参考图片重采样RPR,其中,所述参考图片由用于所述时域运动矢量预测的所述视频条带的并置图片的参考索引指示。
16.一种非暂时性计算机可读记录介质,其存储由视频处理装置执行的方法生成的视频的比特流,其中,所述方法包括:
根据包括视频条带的视频图片生成所述视频的比特流,其中,所述比特流符合一种格式规则,所述格式规则规定,在视频条带标头中的语法元素指示视频条带不与参考图片列表0并置的情况下,所述视频条带的条带类型不包括类型P。
17.一种根据本文档中描述的方法或系统生成的方法、装置、比特流。
CN202180014141.7A 2020-02-14 2021-02-10 视频编解码中的参考图片重采样激活 Pending CN115176478A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN2020075194 2020-02-14
CNPCT/CN2020/075194 2020-02-14
PCT/CN2021/076542 WO2021160168A1 (en) 2020-02-14 2021-02-10 Reference picture resampling activation in video coding

Publications (1)

Publication Number Publication Date
CN115176478A true CN115176478A (zh) 2022-10-11

Family

ID=77292047

Family Applications (8)

Application Number Title Priority Date Filing Date
CN202180014549.4A Pending CN115211112A (zh) 2020-02-14 2021-02-10 视频编解码中的子比特流提取过程
CN202180014201.5A Pending CN115176466A (zh) 2020-02-14 2021-02-10 视频比特流中的子图片信息信令
CN202180014513.6A Pending CN115191114A (zh) 2020-02-14 2021-02-10 视频比特流中的子图片信令
CN202180014407.8A Pending CN115211107A (zh) 2020-02-14 2021-02-10 视频比特流中的子图片索引限制
CN202180014142.1A Pending CN115362673A (zh) 2020-02-14 2021-02-10 视频比特流中的并置图片指示
CN202180014141.7A Pending CN115176478A (zh) 2020-02-14 2021-02-10 视频编解码中的参考图片重采样激活
CN202180014357.3A Pending CN115176467A (zh) 2020-02-14 2021-02-10 视频比特流中的通用约束标志的使用
CN202180013995.3A Pending CN115191119A (zh) 2020-02-14 2021-02-10 视频比特流中的并置参考索引指示

Family Applications Before (5)

Application Number Title Priority Date Filing Date
CN202180014549.4A Pending CN115211112A (zh) 2020-02-14 2021-02-10 视频编解码中的子比特流提取过程
CN202180014201.5A Pending CN115176466A (zh) 2020-02-14 2021-02-10 视频比特流中的子图片信息信令
CN202180014513.6A Pending CN115191114A (zh) 2020-02-14 2021-02-10 视频比特流中的子图片信令
CN202180014407.8A Pending CN115211107A (zh) 2020-02-14 2021-02-10 视频比特流中的子图片索引限制
CN202180014142.1A Pending CN115362673A (zh) 2020-02-14 2021-02-10 视频比特流中的并置图片指示

Family Applications After (2)

Application Number Title Priority Date Filing Date
CN202180014357.3A Pending CN115176467A (zh) 2020-02-14 2021-02-10 视频比特流中的通用约束标志的使用
CN202180013995.3A Pending CN115191119A (zh) 2020-02-14 2021-02-10 视频比特流中的并置参考索引指示

Country Status (8)

Country Link
US (6) US11825079B2 (zh)
EP (5) EP4088463A4 (zh)
JP (4) JP7397211B2 (zh)
KR (4) KR20220131257A (zh)
CN (8) CN115211112A (zh)
BR (1) BR112022016125A2 (zh)
MX (1) MX2022009669A (zh)
WO (8) WO2021160168A1 (zh)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4336832A3 (en) 2018-08-17 2024-05-22 Huawei Technologies Co., Ltd. Reference picture management in video coding
KR20220087513A (ko) * 2019-11-28 2022-06-24 엘지전자 주식회사 영상/비디오 코딩을 위한 슬라이스 및 타일 구성
EP4088463A4 (en) 2020-02-14 2023-05-10 Beijing Bytedance Network Technology Co., Ltd. USING GENERAL STRESS INDICATORS IN VIDEO BITSTREAMS
US11778215B2 (en) * 2020-02-28 2023-10-03 Qualcomm Incorporated Coding output layer set data and conformance window data of high level syntax for video coding
MX2022010889A (es) * 2020-03-05 2022-10-27 Lg Electronics Inc Metodo y dispositivo de codificacion/decodificacion de imagen basado en el tipo de unidad nal combinada, y metodo para trasmitir flujo de bits.
KR20220157455A (ko) * 2020-03-20 2022-11-29 인터디지털 브이씨 홀딩스 프랑스 이미지 인코딩 및 디코딩을 위한 방법 및 디바이스
CN115868165A (zh) 2020-03-21 2023-03-28 抖音视界有限公司 参考图片重采样
CN115699746B (zh) * 2020-03-31 2023-10-20 Lg电子株式会社 图像编码/解码方法和发送比特流的方法
US11451811B2 (en) * 2020-04-05 2022-09-20 Tencent America LLC Method and apparatus for video coding
JP2023521367A (ja) * 2020-04-08 2023-05-24 ノキア テクノロジーズ オサケユイチア 漸次復号リフレッシュのための、クロマスケーリングを用いるルーママッピング
EP4140140A4 (en) * 2020-05-21 2023-07-05 ByteDance Inc. PROGRESSIVE DECODING REFRESH SIGNALING AND REFERENCE PICTURE LISTS
US11503342B2 (en) * 2020-06-10 2022-11-15 Sharp Kabushiki Kaisha Systems and methods for signaling sequence parameter information in video coding
WO2021254379A1 (en) 2020-06-20 2021-12-23 Beijing Bytedance Network Technology Co., Ltd. Inter layer prediction with different coding block size
WO2023132993A1 (en) * 2022-01-10 2023-07-13 Innopeak Technology, Inc. Signaling general constraints information for video coding

Family Cites Families (67)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100908062B1 (ko) 2006-09-07 2009-07-15 엘지전자 주식회사 비디오 신호의 디코딩/인코딩 방법 및 장치
CN101389021B (zh) * 2007-09-14 2010-12-22 华为技术有限公司 视频编解码方法及装置
US8483285B2 (en) 2008-10-03 2013-07-09 Qualcomm Incorporated Video coding using transforms bigger than 4×4 and 8×8
US8737825B2 (en) 2009-09-10 2014-05-27 Apple Inc. Video format for digital video recorder
US8594200B2 (en) * 2009-11-11 2013-11-26 Mediatek Inc. Method of storing motion vector information and video decoding apparatus
MX353107B (es) 2010-04-09 2017-12-19 Mitsubishi Electric Corp Dispositivo codificador de imagen en movimiento y dispositivo decodificador de imagen en movimiento.
US9124898B2 (en) 2010-07-12 2015-09-01 Mediatek Inc. Method and apparatus of temporal motion vector prediction
PL2675167T3 (pl) 2011-02-10 2018-11-30 Sun Patent Trust Sposób kodowania ruchomych obrazów, urządzenie do kodowania ruchomych obrazów, sposób dekodowania ruchomych obrazów, urządzenie do dekodowania ruchomych obrazów oraz urządzenie do kodowania i dekodowania ruchomych obrazów
US9060173B2 (en) * 2011-06-30 2015-06-16 Sharp Kabushiki Kaisha Context initialization based on decoder picture buffer
US10523967B2 (en) * 2011-09-09 2019-12-31 Kt Corporation Method for deriving a temporal predictive motion vector, and apparatus using the method
US9420307B2 (en) 2011-09-23 2016-08-16 Qualcomm Incorporated Coding reference pictures for a reference picture set
KR101606661B1 (ko) * 2011-11-18 2016-03-25 모토로라 모빌리티 엘엘씨 고효율 비디오 코딩(hevc)을 위한 병치된 화상을 시그널링하기 위한 명시적 방법
PL2805511T3 (pl) * 2012-01-20 2019-09-30 Sun Patent Trust Sposoby i urządzenie do kodowania i dekodowania wideo przy użyciu predykcji wektora ruchu w czasie
CN107257490B (zh) * 2012-01-27 2019-12-17 太阳专利托管公司 图像编码方法及图像编码装置
EP2824920A4 (en) 2012-03-06 2016-02-17 Panasonic Ip Corp America VIDEO CODING METHOD, VIDEO CODING METHOD, VIDEO COORDING DEVICE, VIDEO CODING DEVICE AND VIDEO CODING / DECODING DEVICE
EP2837190A1 (en) * 2012-04-11 2015-02-18 Motorola Mobility LLC Signaling of temporal motion vector predictor (mvp) flag for temporal prediction
US9479774B2 (en) * 2012-09-24 2016-10-25 Qualcomm Incorporated Buffering period and recovery point supplemental enhancement information messages
US20140301463A1 (en) 2013-04-05 2014-10-09 Nokia Corporation Method and apparatus for video coding and decoding
EP2987326B1 (en) * 2013-04-17 2020-09-02 Nokia Technologies Oy An apparatus, a method and a computer program for video coding and decoding
US9813723B2 (en) * 2013-05-03 2017-11-07 Qualcomm Incorporated Conditionally invoking a resampling process in SHVC
US9432667B2 (en) 2013-06-11 2016-08-30 Qualcomm Incorporated Processing bitstream constraints relating to inter-layer prediction types in multi-layer video coding
US9648335B2 (en) * 2013-07-12 2017-05-09 Qualcomm Incorporated Bitstream restrictions on picture partitions across layers
US9560358B2 (en) * 2013-07-22 2017-01-31 Qualcomm Incorporated Device and method for scalable coding of video information
US9071814B1 (en) * 2013-08-15 2015-06-30 Google Inc. Scene detection based on video encoding parameters
US20160234523A1 (en) 2013-09-06 2016-08-11 Mitsubishi Electric Corporation Video encoding device, video transcoding device, video encoding method, video transcoding method, and video stream transmission system
KR102290091B1 (ko) * 2013-10-14 2021-08-18 한국전자통신연구원 다계층 기반의 영상 부호화/복호화 방법 및 장치
WO2015101716A1 (en) 2014-01-03 2015-07-09 Nokia Technologies Oy Parameter set coding
CN106105220B (zh) 2014-01-07 2019-07-05 诺基亚技术有限公司 用于视频编码和解码的方法和装置
US10687069B2 (en) 2014-10-08 2020-06-16 Microsoft Technology Licensing, Llc Adjustments to encoding and decoding when switching color spaces
US10171828B2 (en) * 2015-02-27 2019-01-01 Arris Enterprises Llc Modification of unification of intra block copy and inter signaling related syntax and semantics
WO2016209153A1 (en) 2015-06-26 2016-12-29 Telefonaktiebolaget Lm Ericsson (Publ) Encoding and decoding of pictures in a video
US10834419B2 (en) * 2016-04-13 2020-11-10 Qualcomm Incorporated Conformance constraint for collocated reference index in video coding
CN117354516A (zh) * 2016-10-04 2024-01-05 有限公司B1影像技术研究所 图像编码/解码方法、记录介质和传输比特流的方法
US11095907B2 (en) * 2017-03-27 2021-08-17 Nokia Technologies Oy Apparatus, a method and a computer program for video coding and decoding
WO2019009590A1 (ko) 2017-07-03 2019-01-10 김기백 추가 영역을 포함하는 분할 단위를 이용한 영상 복호화 방법 및 장치
SG11202100010SA (en) * 2017-07-03 2021-02-25 Univ Hanyang Ind Univ Coop Found Method and device for decoding image by using partition unit including additional region
US11153607B2 (en) * 2018-01-29 2021-10-19 Mediatek Inc. Length-adaptive deblocking filtering in video coding
WO2019189279A1 (en) * 2018-03-30 2019-10-03 Sharp Kabushiki Kaisha Systems and methods for partitioning video blocks at a boundary of a picture for video coding
AU2019268844B2 (en) * 2018-05-15 2022-09-29 FG Innovation Company Limited Image encoding device, encoded stream extraction device, and image decoding device
US11477474B2 (en) 2018-06-08 2022-10-18 Mediatek Inc. Methods and apparatus for multi-hypothesis mode reference and constraints
CN110662057B (zh) * 2018-06-29 2022-06-21 北京字节跳动网络技术有限公司 视频处理方法、装置、设备以及存储比特流的方法
TWI826486B (zh) * 2018-07-14 2023-12-21 大陸商北京字節跳動網絡技術有限公司 用時間資訊擴展基於查找表的運動向量預測
US10356387B1 (en) * 2018-07-26 2019-07-16 Telefonaktiebolaget Lm Ericsson (Publ) Bookmarking system and method in 360° immersive video based on gaze vector information
US11451807B2 (en) 2018-08-08 2022-09-20 Tencent America LLC Method and apparatus for video coding
US10911751B2 (en) 2018-09-14 2021-02-02 Tencent America LLC Method and apparatus for video coding
JP2022502955A (ja) 2018-09-28 2022-01-11 中▲興▼通▲訊▼股▲ふぇん▼有限公司Zte Corporation ビデオエンコードおよびデコード方法、および装置
CN112956202A (zh) * 2018-11-06 2021-06-11 北京字节跳动网络技术有限公司 利用几何分割的帧间预测的扩展
US11936868B2 (en) 2018-11-08 2024-03-19 Interdigital Vc Holdings, Inc. Quantization for video encoding or decoding based on the surface of a block
WO2020108650A1 (en) * 2018-11-29 2020-06-04 Beijing Bytedance Network Technology Co., Ltd. Flag indication method in intra block copy mode
US10958900B2 (en) 2018-12-06 2021-03-23 Qualcomm Incorporated Derivation of spatial-temporal motion vectors prediction in video coding
US20200186795A1 (en) 2018-12-07 2020-06-11 Beijing Dajia Internet Information Technology Co., Ltd. Video coding using multi-resolution reference picture management
AU2019201649A1 (en) 2019-03-11 2020-10-01 Canon Kabushiki Kaisha Method, apparatus and system for encoding and decoding a tree of blocks of video samples
US11363307B2 (en) 2019-08-08 2022-06-14 Hfi Innovation Inc. Video coding with subpictures
US11284077B2 (en) * 2019-09-10 2022-03-22 Mediatek Inc. Signaling of subpicture structures
US20210076074A1 (en) 2019-09-11 2021-03-11 Qualcomm Incorporated Maximum and minimum block sizes signaling at high level syntax for video coding and transform units
EP4029272A4 (en) 2019-09-11 2023-10-11 SHARP Kabushiki Kaisha SYSTEMS AND METHODS FOR REDUCING RECONSTRUCTION ERROR IN VIDEO CODING BASED ON ACROSS COMPONENT CORRELATION
GB201913403D0 (en) 2019-09-17 2019-10-30 Canon Kk Method and apparatus for encoding and decoding a video stream with subpictures
US11375223B2 (en) * 2019-09-20 2022-06-28 Tencent America LLC Method for signaling output layer set with sub-picture
CN114600462A (zh) 2019-10-25 2022-06-07 夏普株式会社 用于在视频编码中发送信号通知图片信息的系统和方法
MX2022005989A (es) 2019-11-18 2022-09-07 Lg Electronics Inc Dispositivo de codificacion de imagenes y metodo para controlar el filtrado en bucle.
MX2022005993A (es) 2019-11-18 2022-09-07 Lg Electronics Inc Dispositivo y metodo de codificacion de imagenes para controlar el filtrado en bucle.
US20210176475A1 (en) 2019-12-05 2021-06-10 Mediatek Inc. Specifying Layout In Video Pictures
US11490099B2 (en) * 2019-12-23 2022-11-01 Qualcomm Incorporated Reference subpicture scaling ratios for subpictures in video coding
JP7473656B2 (ja) * 2020-01-09 2024-04-23 テレフオンアクチーボラゲット エルエム エリクソン(パブル) ピクチャヘッダ存在
CA3153765A1 (en) * 2020-02-11 2021-08-19 Huawei Technologies Co., Ltd. An encoder, a decoder and corresponding methods for subpicture signalling in sequence parameter set
EP4088463A4 (en) * 2020-02-14 2023-05-10 Beijing Bytedance Network Technology Co., Ltd. USING GENERAL STRESS INDICATORS IN VIDEO BITSTREAMS
US11770549B2 (en) 2020-06-10 2023-09-26 Sony Group Corporation Video data encoding and decoding circuity applying constraint data

Also Published As

Publication number Publication date
JP7397211B2 (ja) 2023-12-12
US11991352B2 (en) 2024-05-21
EP4088453A1 (en) 2022-11-16
JP2023513709A (ja) 2023-04-03
EP4088462A1 (en) 2022-11-16
KR20220131257A (ko) 2022-09-27
EP4307669A3 (en) 2024-06-05
CN115176466A (zh) 2022-10-11
KR20220134561A (ko) 2022-10-05
WO2021160171A1 (en) 2021-08-19
US11825079B2 (en) 2023-11-21
JP2023513343A (ja) 2023-03-30
WO2021160176A1 (en) 2021-08-19
MX2022009669A (es) 2022-09-09
CN115211107A (zh) 2022-10-18
US11785210B2 (en) 2023-10-10
WO2021160172A1 (en) 2021-08-19
US20220394243A1 (en) 2022-12-08
EP4088473A4 (en) 2023-05-10
US11870979B2 (en) 2024-01-09
WO2021160165A1 (en) 2021-08-19
WO2021160168A1 (en) 2021-08-19
EP4088473A1 (en) 2022-11-16
US20220400284A1 (en) 2022-12-15
WO2021160175A1 (en) 2021-08-19
WO2021160167A1 (en) 2021-08-19
US20220400256A1 (en) 2022-12-15
US20220394244A1 (en) 2022-12-08
US20230009491A1 (en) 2023-01-12
US20240107006A1 (en) 2024-03-28
JP2023513707A (ja) 2023-04-03
US20220394304A1 (en) 2022-12-08
CN115191119A (zh) 2022-10-14
EP4088463A4 (en) 2023-05-10
CN115211112A (zh) 2022-10-18
EP4307669A2 (en) 2024-01-17
CN115176467A (zh) 2022-10-11
KR20220138050A (ko) 2022-10-12
WO2021160174A1 (en) 2021-08-19
JP7457142B2 (ja) 2024-03-27
BR112022016125A2 (pt) 2022-10-04
EP4088462A4 (en) 2023-05-24
CN115191114A (zh) 2022-10-14
EP4088453A4 (en) 2023-05-10
CN115362673A (zh) 2022-11-18
JP2023513344A (ja) 2023-03-30
JP7457143B2 (ja) 2024-03-27
EP4088463A1 (en) 2022-11-16
KR20220138051A (ko) 2022-10-12

Similar Documents

Publication Publication Date Title
JP7397211B2 (ja) 映像ビットストリームにおけるサブピクチャ情報の信号通知
CN115398914A (zh) 视频比特流的图片标头和条带标头之间的相互作用
CN115462071A (zh) 自适应环路滤波
CN115885511A (zh) 自适应参数集中的色度语法信令通知
US12010295B2 (en) Collocated picture indication in video bitstreams

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination