CN115136598A - 推断比特流中的视频分量的权重值 - Google Patents

推断比特流中的视频分量的权重值 Download PDF

Info

Publication number
CN115136598A
CN115136598A CN202180015696.3A CN202180015696A CN115136598A CN 115136598 A CN115136598 A CN 115136598A CN 202180015696 A CN202180015696 A CN 202180015696A CN 115136598 A CN115136598 A CN 115136598A
Authority
CN
China
Prior art keywords
slice
flag
equal
video
picture
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180015696.3A
Other languages
English (en)
Inventor
王业奎
张莉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ByteDance Inc
Original Assignee
ByteDance Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ByteDance Inc filed Critical ByteDance Inc
Publication of CN115136598A publication Critical patent/CN115136598A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/188Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a video data packet, e.g. a network abstraction layer [NAL] unit
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/577Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

描述了视频处理的系统、方法和装置,其包括对于视频块的加权预测。一个示例方法包括:执行视频的当前图片的当前条带和视频的比特流之间的转换,其中比特流符合格式规则,并且其中格式规则规定指示预测权重是否包括在当前条带的条带标头中的多个语法元素的值基于当前条带的条带类型和当前图片参考的图片参数集中包括的第一标志的值来推断。

Description

推断比特流中的视频分量的权重值
相关申请的交叉引用
根据适用的《专利法》和/或依据《巴黎公约》的规定,本申请旨在及时要求于2020年2月19日提交的美国临时专利申请No.US 62/978,740的优先权和权益。出于根据法律的全部目的,上述申请的全部公开内容作为本申请公开内容的一部分通过引用并入。
技术领域
本专利文档涉及图像和视频编解码和解码。
背景技术
数字视频占互联网和其他数字通信网络上最大的带宽使用。随着能够接收和显示视频的连接用户设备数量增加,预计对于数字视频使用的带宽需求将继续增长。
发明内容
本文档公开了可以由视频编码器和解码器用于处理视频的比特流以执行视频编码和解码的技术,其包括加权预测。
在一个示例方面,公开了一种视频处理方法。该方法包括:根据规则,执行视频的当前图片的当前条带和视频的比特流之间的转换,其中该规则规定图片参数集(PPS)的第一语法元素的值和PPS的第二语法元素的值控制第三语法元素是否包括在比特流中,并且其中第一语法元素指示是否对参考PPS的比特流中的编解码图片的双向条带(B条带)启用加权预测,第二语法元素指示与加权预测有关的信息是否存在于参考PPS的编解码图片的图片标头或条带标头中,并且第三语法元素指示与当前条带的参考图片列表1相关联的权重的数量。
在另一个示例方面,公开了另一种视频处理方法。该方法包括:执行视频的当前图片的当前条带和视频的比特流之间的转换,其中比特流符合格式规则,并且其中格式规则规定,基于当前条带的条带类型和当前图片参考的图片参数集(PPS)中包括的第一标志的值,推断指示预测权重是否包括在当前条带的条带标头中的多个语法元素的值。
在又一个示例方面,公开了另一种视频处理方法。该方法包括:执行视频的当前图片的当前条带和视频的比特流之间的转换,其中比特流符合格式规则,并且其中格式规则规定存在通用约束信息语法结构,该通用约束信息语法结构包括指示对于图片集合的条带启用对显式加权预测的约束的一个或多个约束标志。
在又一个示例方面,公开了另一种视频处理方法。该方法包括:根据规则,执行视频的当前图片的当前条带和视频的比特流之间的转换,其中该规则规定指示对于图片集合的条带启用对显式加权预测的约束的一个或多个约束标志包括在与当前条带相关联的参数集或标头中。
在又一个示例方面,公开了另一种视频处理方法。该方法包括:执行包括当前图片的视频和视频的比特流之间的转换,其中比特流符合格式规则,并且其中格式规则规定当前图片是否排除双向条带(B条带)的指示包括在与当前图片相关联的图片标头语法结构中。
在又一示例方面,公开了一种视频编码器装置。视频编码器包括配置为实施上述方法的处理器。
在又一示例方面,公开了一种视频解码器装置。视频解码器包括配置为实施上述方法的处理器。
在又一示例方面,公开了一种其上存储有代码的计算机可读介质。该代码以处理器可执行代码的形式体现本文描述的方法之一。
这些以及其他特征将在本文档中描述。
附图说明
图1是示出可以实施本文公开的各种技术的示例视频处理系统的框图。
图2是用于视频处理的示例硬件平台的框图。
图3是示出可以实施本公开的一些实施例的示例视频编解码系统的框图。
图4是示出可以实施本公开的一些实施例的编码器的示例的框图。
图5是示出可以实施本公开的一些实施例的解码器的示例的框图。
图6至图10示出了视频处理的示例方法的流程图。
具体实施方式
在本文档中使用章节标题以易于理解,并且不将每个章节中公开的技术和实施例的应用性仅限制于该章节。此外,在一些描述中使用H.266技术术语仅仅是为了易于理解,而不是为了限制所公开的技术的范围。因此,本文描述的技术也适用于其他视频编解码器协议和设计。
1.引言
本文档涉及视频编解码技术。具体地,关于视频编解码中的PH和SH语法的设计。该构思可以单独或以各种组合应用于支持多层视频编解码的任何视频编解码标准或非标准视频编解码器,例如正在开发的多功能视频编解码(VVC)。
2.缩写
APS 自适应参数集
AU 访问单元
AUD 访问单元分隔符
AVC 高级视频编解码
CLVS 编解码层视频序列
CPB 编解码图片缓冲区
CRA 完全随机访问
CTU 编解码树单元
CVS 编解码视频序列
DPB 解码图片缓冲区
DPS 解码参数集
EOB 比特流结尾
EOS 序列结尾
GDR 逐渐解码刷新
HEVC 高效视频编解码
HRD 假设参考解码器
IDR 即时解码刷新
JEM 联合探索模型
MCTS 运动约束片集
NAL 网络抽象层
OLS 输出层集
PH 图片标头
PPS 图片参数集
PTL 档次、层和级别
PU 图片单元
RBSP 原始字节序列有效负载
SEI 补充增强信息
SH 条带标头
SPS 序列参数集
SVC 可缩放视频编解码
VCL 视频编解码层
VPS 视频参数集
VTM VVC测试模型
VUI 视频可用性信息
VVC 多功能视频编解码
3.初步讨论
视频编解码标准主要通过众所周知的ITU-T和ISO/IEC标准发展而来。ITU-T制定了H.261和H.263,ISO/IEC制定了MPEG-1和MPEG-4视觉,并且这两个组织联合制定了H.262/MPEG-2视频标准、H.264/MPEG-4高级视频编解码(AVC)标准和H.265/HEVC标准。从H.262开始,视频编解码标准基于混合视频编解码结构,其中使用了时域预测加变换编解码。为了探索HEVC之外的未来视频编解码技术,VCEG和MPEG于2015年联合成立了联合视频探索团队(Joint Video Exploration Team,JVET)。此后,JVET采用了许多新的方法,并将其放入名为联合探索模型(JEM)的参考软件中。JVET会议每季度同时召开一次,新编解码标准的目标是相比HEVC降低50%的比特率。新的视频编解码标准在2018年4月的JVET会议上正式命名为多功能视频编解码(VVC),并且当时发布了第一版VVC测试模型(VTM)。由于对VVC标准化的持续努力,新的编解码技术在每次JVET会议上都被采用到VVC标准中。VVC的工作草案和测试模型VTM在每次会议后都会更新。VVC项目现在的目标是在2020年7月的会议上技术上完成(FDIS)。
3.1.PH语法和语义
在最新的VVC草案文本中,PH语法和语义如下:
Figure BDA0003805963060000051
PH RBSP包含PH语法结构,即picture_header_structure()。
Figure BDA0003805963060000052
Figure BDA0003805963060000061
Figure BDA0003805963060000071
Figure BDA0003805963060000081
Figure BDA0003805963060000091
PH语法结构包含对于与PH语法结构相关联的编解码图片的所有条带共同的信息。
gdr_or_irap_pic_flag等于1指定当前图片是GDR或IRAP图片。gdr_or_irap_pic_flag等于0指定当前图片可以是或者可以不是GDR或IRAP图片。
gdr_pic_flag等于1指定与PH相关联的图片是GDR图片。gdr_pic_flag等于0指定与PH相关联的图片不是GDR图片。当不存在时,gdr_pic_flag的值被推断为等于0。当gdr_enabled_flag等于0时,gdr_pic_flag的值应当等于0。
ph_inter_slice_allowed_flag等于0指定图片的所有编解码条带具有等于2的slice_type。ph_inter_slice_allowed_flag等于1指定图片中可以有或者可以没有具有等于0或1的slice_type的一个或多个编解码条带。
ph_intra_slice_allowed_flag等于0指定图片的所有编解码条带具有等于0或1的slice_type。ph_intra_slice_allowed_flag等于1指定图片中可以有或者可以没有具有等于2的slice_type的一个或多个编解码条带。当不存在时,ph_intra_slice_allowed_flag的值被推断为等于1。
注1–对于本应进行基于子图片的比特流合并而不需要改变PH NAL单元的比特流,预计编码器将ph_inter_slice_allowed_flag和ph_intra_slice_allowed_flag的值设置为等于1。
non_reference_picture_flag等于1指定与PH相关联的图片从不用作参考图片。non_reference_picture_flag等于0指定与PH相关联的图片可以用作或者可以不用作参考图片。
ph_pic_parameter_set_id指定正在使用的PPS的pps_pic_parameter_set_id的值。ph_pic_parameter_set_id的值应当在0到63的范围(包括0和63)内。
比特流一致性的要求是PH的TemporalId的值应当大于或等于具有等于ph_pic_parameter_set_id的pps_pic_parameter_set_id的PPS的TemporalId的值。
ph_pic_order_cnt_lsb指定当前图片以MaxPicOrderCntLsb为模的图片顺序计数。ph_pic_order_cnt_lsb语法元素的长度为log2_max_pic_order_cnt_lsb_minus4+4比特。ph_pic_order_cnt_lsb的值应当在0到MaxPicOrderCntLsb-1的范围(包括0和MaxPicOrderCntLsb-1)内。
no_output_of_prior_pics_flag影响在解码不是如附录C所指定的比特流中的第一个图片的CLVSS图片之后的DPB中的先前解码图片的输出。
recovery_poc_cnt按照输出顺序指定解码图片的恢复点。如果当前图片是与PH相关联的GDR图片,并且在具有等于当前GDR图片的PicOrderCntVal加recovery_poc_cnt的值的PicOrderCntVal的CLVS中有按照解码顺序在当前GDR图片之后的图片picA,则图片picA被称为恢复点图片。否则,具有大于当前图片的PicOrderCntVal加recovery_poc_cnt的值的PicOrderCntVal的按照输出顺序的第一个图片被称为恢复点图片。按照解码顺序,恢复点图片不应当在当前GDR图片之前。recovery_poc_cnt的值应当在0到MaxPicOrderCntLsb-1的范围(包括0和MaxPicOrderCntLsb-1)内。
当当前图片是GDR图片时,变量RpPicOrderCntVal被推导如下:
RpPicOrderCntVal=PicOrderCntVal+recovery_poc_cnt (82)
注2–当gdr_enabled_flag等于1并且当前图片的PicOrderCntVal大于或等于相关联的GDR图片的RpPicOrderCntVal时,按照输出顺序的当前解码图片和后续解码图片与通过从按照解码顺序在相关联的GDR图片之前的先前IRAP图片(当存在时)开始解码过程而产生的对应图片完全匹配。
ph_extra_bit[i]可以等于1或0。符合本规范的该版本的解码器应当忽略ph_extra_bit[i]的值。它的值不影响解码器符合规范的该版本中指定的简表。
ph_poc_msb_present_flag等于1指定语法元素poc_msb_val存在于ph中。ph_poc_msb_present_flag等于0指定语法元素poc_msb_val不存在于ph中。当vps_independent_layer_flag[GeneralLayerIdx[nuh_layer_id]]等于0并且在当前层的参考层中的当前AU中有图片时,ph_poc_msb_present_flag的值应当等于0。
poc_msb_val指定当前图片的POC MSB值。语法元素poc_msb_val的长度为poc_msb_len_minus1+1比特。
ph_alf_enabled_flag等于1指定对与PH相关联的所有条带启用自适应环路滤波器,并且可以被应用于条带中的Y、Cb或Cr色彩分量。ph_alf_enabled_flag等于0指定可以对与PH相关联的一个、多个或所有条带禁用自适应环路滤波器。当不存在时,ph_alf_enabled_flag被推断为等于0。
ph_num_alf_aps_ids_luma指定与PH相关联的条带参考的ALF APS的数量。
ph_alf_aps_id_luma[i]指定与PH相关联的条带的亮度分量参考的第i个ALF APS的adaptation_parameter_set_id。
具有等于ALF_APS的aps_params_type和等于ph_alf_aps_id_luma[i]的adaptation_parameter_set_id的APS NAL单元的alf_luma_filter_signal_flag的值应当等于1。
具有等于ALF_APS的aps_params_type和等于ph_alf_aps_id_luma[i]的adaptation_parameter_set_id的APS NAL单元的TemporalId应当小于或等于与PH相关联的图片的TemporalId。
ph_alf_chroma_idc等于0指定自适应环路滤波器不应用于Cb和Cr色彩分量。ph_alf_chroma_idc等于1指定自适应环路滤波器被应用于Cb色彩分量。ph_alf_chroma_idc等于2指定自适应环路滤波器被应用于Cr色彩分量。ph_alf_chroma_idc等于3指定自适应环路滤波器被应用于Cb和Cr色彩分量。当ph_alf_chroma_idc不存在时,其被推断为等于0。
ph_alf_aps_id_chroma指定与PH相关联的条带的色度分量参考的ALF APS的adaptation_parameter_set_id。
具有等于ALF_APS的aps_params_type和等于ph_alf_aps_id_chroma的adaptation_parameter_set_id的APS NAL单元的alf_chroma_filter_signal_flag的值应当等于1。
具有等于ALF_APS的aps_params_type和等于ph_alf_aps_id_chroma的adaptation_parameter_set_id的APS NAL单元的TemporalId应该小于或等于与PH相关联的图片的TemporalId。
ph_cc_alf_cb_enabled_flag等于1指定对与PH相关联的所有条带启用Cb色彩分量的跨分量滤波器,并且可以被应用于条带中的Cb色彩分量。ph_cc_alf_cb_enabled_flag等于0指定可以对与PH相关联的一个、多个或所有条带禁用Cb色彩分量的跨分量滤波器。当不存在时,ph_cc_alf_cb_enabled_flag被推断为等于0。
ph_cc_alf_cb_aps_id指定与PH相关联的条带的Cb色彩分量参考的ALF APS的adaptation_parameter_set_id。
具有等于ALF_APS的aps_params_type和等于ph_cc_alf_cb_aps_id的adaptation_parameter_set_id的APS NAL单元的alf_cc_cb_filter_signal_flag的值应当等于1。
具有等于ALF_APS的aps_params_type和等于ph_cc_alf_cb_aps_id的adaptation_parameter_set_id的APS NAL单元的TemporalId应当小于或等于与PH相关联的图片的TemporalId。
ph_cc_alf_cr_enabled_flag等于1指定对与PH相关联的所有条带启用Cr色彩分量的跨分量滤波器,并且可以被应用于条带中的Cr色彩分量。ph_cc_alf_cr_enabled_flag等于0指定可以对与PH相关联的一个、多个或所有条带禁用Cr色彩分量的跨分量滤波器。当不存在时,ph_cc_alf_cr_enabled_flag被推断为等于0。
ph_cc_alf_cr_aps_id指定与PH相关联的条带的Cr色彩分量参考的ALF APS的adaptation_parameter_set_id。
具有等于ALF_APS的aps_params_type和等于ph_cc_alf_cr_aps_id的adaptation_parameter_set_id的APS NAL单元的alf_cc_cr_filter_signal_flag的值应当等于1。
具有等于ALF_APS的aps_params_type和等于ph_cc_alf_cr_aps_id的adaptation_parameter_set_id的APS NAL单元的TemporalId应当小于或等于与PH相关联的图片的TemporalId。
ph_lmcs_enabled_flag等于1指定对与PH相关联的所有条带启用亮度映射与色度缩放。ph_lmcs_enabled_flag等于0指定对与PH相关联的一个、多个或所有条带禁用亮度映射与色度缩放。当不存在时,ph_lmcs_enabled_flag的值被推断为等于0。
ph_lmcs_aps_id指定与PH相关联的条带参考的LMCS APS的adaptation_parameter_set_id。具有等于LMCS_APS的aps_params_type和等于ph_lmcs_aps_id的adaptation_parameter_set_id的APS NAL单元的TemporalId应当小于或等于与PH相关联的图片的TemporalId。
ph_chroma_residual_scale_flag等于1指定对与PH相关联的所有条带启用色度残差缩放。ph_chroma_residual_scale_flag等于0指定可以对与PH相关联的一个、多个或所有条带禁用色度残差缩放。当ph_chroma_residual_scale_flag不存在时,其被推断为等于0。
ph_scaling_list_present_flag等于1指定用于与PH相关联的条带的缩放列表数据基于参考的缩放列表APS中包含的缩放列表数据来推导。ph_scaling_list_present_flag等于0指定用于与PH相关联的条带的缩放列表数据被设置为等于16。当不存在时,ph_scaling_list_present_flag的值被推断为等于0。
ph_scaling_list_aps_id指定缩放列表APS的adaptation_parameter_set_id。具有等于SCALING_APS的aps_params_type和等于ph_scaling_list_aps_id的adaptation_parameter_set_id的APS NAL单元的TemporalId应当小于或等于与PH相关联的图片的TemporalId。
ph_virtual_boundaries_present_flag等于1指定在PH中信令通知虚拟边界的信息。ph_virtual_boundaries_present_flag等于0指定在PH中不信令通知虚拟边界的信息。当在PH中信令通知一个或多个虚拟边界时,跨图片中的虚拟边界禁用环路滤波操作。环路滤波操作包括去方块滤波器、样点自适应偏移滤波器和自适应环路滤波器操作。当不存在时,ph_virtual_boundaries_present_flag的值被推断为等于0。
比特流一致性的要求是,当subpic_info_present_flag等于1时,ph_virtual_boundaries_present_flag的值应当等于0。
变量VirtualBoundariesPresentFlag被推导如下:
Figure BDA0003805963060000141
ph_num_ver_virtual_boundaries指定PH中存在的ph_virtual_boundaries_pos_x[i]语法元素的数量。当ph_num_ver_virtual_boundaries不存在时,其被推断为等于0。
变量NumVerVirtualBoundaries被推导如下:
Figure BDA0003805963060000142
ph_virtual_boundaries_pos_x[i]指定第i个垂直虚拟边界的位置,以亮度样点除以8为单元。ph_virtual_boundaries_pos_x[i]的值应当在1到Ceil(pic_width_in_luma_samples÷8)-1的范围(包括1和Ceil(pic_width_in_luma_samples÷8)-1)内。
指定垂直虚拟边界的位置的列表VirtualBoundariesPosX[i](i的范围为0到NumVerVirtualBoundaries-1(包括0和NumVerVirtualBoundaries-1)),以亮度样点为单元,被推导如下:
Figure BDA0003805963060000143
Figure BDA0003805963060000151
任何两个垂直虚拟边界之间的距离应当大于或等于CtbSizeY个亮度样点。
ph_num_hor_virtual_boundaries指定PH中存在的ph_virtual_boundaries_pos_y[i]语法元素的数量。当ph_num_hor_virtual_boundaries不存在时,其被推断为等于0。
参数NumHorVirtualBoundaries被推导如下:
Figure BDA0003805963060000152
当sps_virtual_boundaries_enabled_flag等于1并且ph_virtual_boundaries_present_flag等于1时,ph_num_ver_virtual_boundaries和ph_num_hor_virtual_boundaries之和应当大于0。
ph_virtual_boundaries_pos_y[i]指定第i个水平虚拟边界的位置,以亮度样点除以8为单元。ph_virtual_boundaries_pos_y[i]的值应当在1到Ceil(pic_height_in_luma_samples÷8)-1的范围(包括1和Ceil(pic_height_in_luma_samples÷8)-1)内。
指定水平虚拟边界的位置的列表VirtualBoundariesPosY[i](i的范围为0到NumHorVirtualBoundaries-1(包括0和NumHorVirtualBoundaries-1)),以亮度样点为单元,被推导如下:
Figure BDA0003805963060000153
任何两个水平虚拟边界之间的距离应当大于或等于CtbSizeY个亮度样点。
pic_output_flag影响解码图片输出和移除过程,如附录C所指定的。当pic_output_flag不存在时,其被推断为等于1。
partition_constraints_override_flag等于1指定分割约束参数存在于PH中。partition_constraints_override_flag等于0指定分割约束参数不存在于PH中。当不存在时,partition_constraints_override_flag的值被推断为等于0。
ph_log2_diff_min_qt_min_cb_intra_slice_luma指定从CTU的四叉树划分产生的亮度叶块的亮度样点中的最小尺寸的以2为底的对数和与PH相关联的slice_type等于2(I)的条带中的亮度CU的亮度样点中的最小编解码块尺寸的以2为底的对数之间的差。ph_log2_diff_min_qt_min_cb_intra_slice_luma的值应当在0到CtbLog2SizeY-MinCbLog2SizeY的范围(包括0和CtbLog2SizeY-MinCbLog2SizeY)内。当不存在时,ph_log2_diff_min_qt_min_cb_luma的值被推断为等于sps_log2_diff_min_qt_min_cb_intra_slice_luma。
ph_max_mtt_hierarchy_depth_intra_slice_luma指定从与PH相关联的slice_type等于2(I)的条带中的四叉树叶的多类型树划分产生的编解码单元的最大层次深度。ph_max_mtt_hierarchy_depth_intra_slice_luma的值应当在0到2*(CtbLog2SizeY-MinCbLog2SizeY)的范围(包括0和2*(CtbLog2SizeY-MinCbLog2SizeY))内。当不存在时,ph_max_mtt_hierarchy_depth_intra_slice_luma的值被推断为等于sps_max_mtt_hierarchy_depth_intra_slice_luma。
ph_log2_diff_max_bt_min_qt_intra_slice_luma指定可以使用二进制划分来划分的亮度编解码块的亮度样点中的最大尺寸(宽度或高度)的以2为底的对数和从与PH相关联的slice_type等于2(I)的条带中的CTU的四叉树划分产生的亮度叶块的亮度样点中的最小尺寸(宽度或高度)之间的差。ph_log2_diff_max_bt_min_qt_intra_slice_luma的值应当在0到CtbLog2SizeY-MinQtLog2SizeIntraY的范围(包括0和CtbLog2SizeY-MinQtLog2SizeIntraY)内。当不存在时,ph_log2_diff_max_bt_min_qt_intra_slice_luma的值被推断为等于sps_log2_diff_max_bt_min_qt_intra_slice_luma。
ph_log2_diff_max_tt_min_qt_intra_slice_luma指定可以使用三进制划分来划分的亮度编解码块的亮度样点中的最大尺寸(宽度或高度)的以2为底的对数和从与PH相关联的slice_type等于2(I)的条带中的CTU的四叉树划分产生的亮度叶块的亮度样点中的最小尺寸(宽度或高度)之间的差。ph_log2_diff_max_tt_min_qt_intra_slice_luma的值应当在0到CtbLog2SizeY-MinQtLog2SizeIntraY的范围(包括0和CtbLog2SizeY-MinQtLog2SizeIntraY)内。当不存在时,ph_log2_diff_max_tt_min_qt_intra_slice_luma的值被推断为等于sps_log2_diff_max_tt_min_qt_intra_slice_luma。
ph_log2_diff_min_qt_min_cb_intra_slice_chroma指定从treeType等于DUAL_TREE_CHROMA的色度CTU的四叉树划分产生的色度叶块的亮度样点中的最小尺寸的以2为底的对数和与PH相关联的slice_type等于2(I)的条带中的treeType等于DUAL_TREE_CHROMA的色度CU的亮度样点中的最小编解码块尺寸的以2为底的对数之间的差。ph_log2_diff_min_qt_min_cb_intra_slice_chroma的值应当在0到CtbLog2SizeY-MinCbLog2SizeY的范围(包括0和CtbLog2SizeY-MinCbLog2SizeY)内。当不存在时,ph_log2_diff_min_qt_min_cb_intra_slice_chroma的值被推断为等于sps_log2_diff_min_qt_min_cb_intra_slice_chroma。
ph_max_mtt_hierarchy_depth_intra_slice_chroma指定从与PH相关联的slice_type等于2(I)的条带中的treeType等于DUAL_TREE_CHROMA的色度四叉树叶的多类型树划分产生的色度编解码单元的最大层次深度。ph_max_mtt_hierarchy_depth_intra_slice_chroma的值应当在0到2*(CtbLog2SizeY-MinCbLog2SizeY)的范围(包括0和2*(CtbLog2SizeY-MinCbLog2SizeY))内。当不存在时,ph_max_mtt_hierarchy_depth_intra_slice_chroma的值被推断为等于sps_max_mtt_hierarchy_depth_intra_slice_chroma。
ph_log2_diff_max_bt_min_qt_intra_slice_chroma指定可以使用二进制划分来划分的色度编解码块的亮度样点中的最大尺寸(宽度或高度)的以2为底的对数和从与PH相关联的slice_type等于2(I)的条带中的treeType等于DUAL_TREE_CHROMA的色度CTU的四叉树划分产生的色度叶块的亮度样点中的最小尺寸(宽度或高度)之间的差。ph_log2_diff_max_bt_min_qt_intra_slice_chroma的值应当在0到CtbLog2SizeY-MinQtLog2SizeIntraC的范围(包括0和CtbLog2SizeY-MinQtLog2SizeIntraC)内。当不存在时,ph_log2_diff_max_bt_min_qt_intra_slice_chroma的值被推断为等于sps_log2_diff_max_bt_min_qt_intra_slice_chroma。
ph_log2_diff_max_tt_min_qt_intra_slice_chroma指定可以使用三进制划分来划分的色度编解码块的亮度样点中的最大尺寸(宽度或高度)的以2为底的对数和从与PH相关联的slice_type等于2(I)的条带中的treeType等于DUAL_TREE_CHROMA的色度CTU的四叉树划分产生的色度叶块的亮度样点中的最小尺寸(宽度或高度)之间的差。ph_log2_diff_max_tt_min_qt_intra_slice_chroma的值应当在0到CtbLog2SizeY-MinQtLog2SizeIntraC的范围(包括0和CtbLog2SizeY-MinQtLog2SizeIntraC)内。当不存在时,ph_log2_diff_max_tt_min_qt_intra_slice_chroma的值被推断为等于sps_log2_diff_max_tt_min_qt_intra_slice_chroma。
ph_cu_qp_delta_subdiv_intra_slice指定传送cu_qp_delta_abs和cu_qp_delta_sign_flag的帧内条带中的编解码单元的最大cbSubdiv值。ph_cu_qp_delta_subdiv_intra_slice的值应当在0到2*(CtbLog2SizeY-MinQtLog2SizeIntraY+ph_max_mtt_hierarchy_depth_intra_slice_luma)的范围(包括0和2*(CtbLog2SizeY-MinQtLog2SizeIntraY+ph_max_mtt_hierarchy_depth_intra_slice_luma))内。
当不存在时,ph_cu_qp_delta_subdiv_intra_slice的值被推断为等于0。
ph_cu_chroma_qp_offset_subdiv_intra_slice指定传送cu_chroma_qp_offset_flag的帧内条带中的编解码单元的最大cbSubdiv值。ph_cu_chroma_qp_offset_subdiv_intra_slice的值应当在0到2*(CtbLog2SizeY-MinQtLog2SizeIntraY+ph_max_mtt_hierarchy_depth_intra_slice_luma)的范围(包括0和2*(CtbLog2SizeY-MinQtLog2SizeIntraY+ph_max_mtt_hierarchy_depth_intra_slice_luma))内。
当不存在时,ph_cu_chroma_qp_offset_subdiv_intra_slice的值被推断为等于0。
ph_log2_diff_min_qt_min_cb_inter_slice指定从CTU的四叉树划分产生的亮度叶块的亮度样点中的最小尺寸的以2为底的对数和与PH相关联的slice_type等于0(B)或1(P)的条带中的亮度CU的亮度样点中的最小亮度编解码块尺寸的以2为底的对数之间的差。ph_log2_diff_min_qt_min_cb_inter_slice的值应当在0到CtbLog2SizeY-MinCbLog2SizeY的范围(包括0和CtbLog2SizeY-MinCbLog2SizeY)内。当不存在时,ph_log2_diff_min_qt_min_cb_luma的值被推断为等于sps_log2_diff_min_qt_min_cb_inter_slice。
ph_max_mtt_hierarchy_depth_inter_slice指定从与PH相关联的slice_type等于0(B)或1(P)的条带中的四叉树叶的多类型树划分产生的编解码单元的最大层次深度。ph_max_mtt_hierarchy_depth_inter_slice的值应当在0到2*(CtbLog2SizeY-MinCbLog2SizeY)的范围(包括0和2*(CtbLog2SizeY-MinCbLog2SizeY))内。当不存在时,ph_max_mtt_hierarchy_depth_inter_slice的值被推断为等于sps_max_mtt_hierarchy_depth_inter_slice。
ph_log2_diff_max_bt_min_qt_inter_slice指定可以使用二进制划分来划分的亮度编解码块的亮度样点中的最大尺寸(宽度或高度)的以2为底的对数和从与PH相关联的slice_type等于0(B)或1(P)的条带中的CTU的四叉树划分产生的亮度叶块的亮度样点中的最小尺寸(宽度或高度)之间的差。ph_log2_diff_max_bt_min_qt_inter_slice的值应当在0到CtbLog2SizeY-MinQtLog2SizeInterY的范围(包括0和CtbLog2SizeY-MinQtLog2SizeInterY)内。当不存在时,ph_log2_diff_max_bt_min_qt_inter_slice的值被推断为等于sps_log2_diff_max_bt_min_qt_inter_slice。
ph_log2_diff_max_tt_min_qt_inter_slice指定可以使用三进制划分来划分的亮度编解码块的亮度样点中的最大尺寸(宽度或高度)的以2为底的对数和从与PH相关联的slice_type等于0(B)或1(P)的条带中的CTU的四叉树划分产生的亮度叶块的亮度样点中的最小尺寸(宽度或高度)之间的差。ph_log2_diff_max_tt_min_qt_inter_slice的值应当在0到CtbLog2SizeY-MinQtLog2SizeInterY的范围(包括0和CtbLog2SizeY-MinQtLog2SizeInterY)内。当不存在时,ph_log2_diff_max_tt_min_qt_inter_slice的值被推断为等于sps_log2_diff_max_tt_min_qt_inter_slice。
ph_cu_qp_delta_subdiv_inter_slice指定传送cu_qp_delta_abs和cu_qp_delta_sign_flag的帧间条带中的编解码单元的最大cbSubdiv值。ph_cu_qp_delta_subdiv_inter_slice的值应当在0到2*(CtbLog2SizeY-MinQtLog2SizeInterY+ph_max_mtt_hierarchy_depth_int er_slice)的范围(包括0和2*(CtbLog2SizeY-MinQtLog2SizeInterY+ph_max_mtt_hierarchy_depth_int er_slice))内。
当不存在时,ph_cu_qp_delta_subdiv_inter_slice的值被推断为等于0。
ph_cu_chroma_qp_offset_subdiv_inter_slice指定传送cu_chroma_qp_offset_flag的帧间条带中的编解码单元的最大cbSubdiv值。ph_cu_chroma_qp_offset_subdiv_inter_slice的值应当在0到2*(CtbLog2SizeY-MinQtLog2SizeInterY+ph_max_mtt_hierarchy_depth_int er_slice)的范围(包括0和2*(CtbLog2SizeY-MinQtLog2SizeInterY+ph_max_mtt_hierarchy_depth_int er_slice))内。
当不存在时,ph_cu_chroma_qp_offset_subdiv_inter_slice的值被推断为等于0。
ph_temporal_mvp_enabled_flag指定时域运动矢量预测值是否可以用于与PH相关联的条带的帧间预测。如果ph_temporal_mvp_enabled_flag等于0,则与PH相关联的条带的语法元素应当被约束,使得没有时域运动矢量预测值用于条带的解码中。否则(ph_temporal_mvp_enabled_flag等于1),时域运动矢量预测值可以用于与PH相关联的条带的解码中。当不存在时,ph_temporal_mvp_enabled_flag的值被推断为等于0。当DPB中没有参考图片具有与当前图片相同的空域分辨率时,ph_temporal_mvp_enabled_flag的值应当等于0。
基于子块的合并MVP候选的最大数量MaxNumSubblockMergeCand被推导如下:
Figure BDA0003805963060000201
Figure BDA0003805963060000211
MaxNumSubblockMergeCand的值应当在0到5的范围(包括0和5)内。
ph_collocated_from_l0_flag等于1指定用于时域运动矢量预测的共位图片是从参考图片列表0推导的。ph_collocated_from_l0_flag等于0指定用于时域运动矢量预测的共位图片是从参考图片列表1推导的。
ph_collocated_ref_idx指定用于时域运动矢量预测的共位图片的参考索引。
当ph_collocated_from_l0_flag等于1时,ph_collocated_ref_idx参考参考图片列表0中的条目,并且ph_collocated_ref_idx的值应当在0到num_ref_entries[0][RplsIdx[0]]-1的范围(包括0和num_ref_entries[0][RplsIdx[0]]-1)内。
当ph_collocated_from_l0_flag等于0时,ph_collocated_ref_idx参考参考图片列表1中的条目,并且ph_collocated_ref_idx的值应当在0到num_ref_entries[1][RplsIdx[1]]-1的范围(包括0和num_ref_entries[1][RplsIdx[1]]-1)内。
当不存在时,ph_collocated_ref_idx的值被推断为等于0。
mvd_l1_zero_flag等于1指示不解析mvd_coding(x0,y0,1)语法结构,并且对于compIdx=0..1和cpIdx=0..2,MvdL1[x0][y0][compIdx]和MvdCpL1[x0][y0][cpIdx][compIdx]被设置为等于0。mvd_l1_zero_flag等于0指示mvd_coding(x0,y0,1)语法结构被解析。
ph_fpel_mmvd_enabled_flag等于1指定具有运动矢量差的Merge模式在与PH相关联的条带中使用整数样点精度。ph_fpel_mmvd_enabled_flag等于0指定具有运动矢量差的Merge模式可以在与PH相关联的条带中使用分数样点精度。当不存在时,则ph_fpel_mmvd_enabled_flag的值被推断为0。
ph_disable_bdof_flag等于1指定在与PH相关联的条带中禁用基于双向光流帧间预测的帧间双向预测。ph_disable_bdof_flag等于0指定在与PH相关联的条带中可以启用或者可以不启用基于双向光流帧间预测的帧间双向预测。
当ph_disable_bdof_flag不存在时,以下适用:
–如果sps_bdof_enabled_flag等于1,则ph_disable_bdof_flag的值被推断为等于0。
–否则(sps_bdof_enabled_flag等于0),ph_disable_bdof_flag的值被推断为等于1。
ph_disable_dmvr_flag等于1指定在与PH相关联的条带中禁用基于解码器运动矢量细化的帧间双向预测。ph_disable_dmvr_flag等于0指定在与PH相关联的条带中可以启用或者可以不启用基于解码器运动矢量细化的帧间双向预测。
当ph_disable_dmvr_flag不存在时,以下适用:
–如果sps_dmvr_enabled_flag等于1,则ph_disable_dmvr_flag的值被推断为等于0。
–否则(sps_dmvr_enabled_flag等于0),ph_disable_dmvr_flag的值被推断为等于1。
ph_disable_prof_flag等于1指定在与PH相关联的条带中禁用利用光流的预测细化。ph_disable_prof_flag等于0指定在与PH相关联的条带中可以启用或者可以不启用利用光流的预测细化。
当ph_disable_prof_flag不存在时,以下适用:
–如果sps_affine_prof_enabled_flag等于1,则ph_disable_prof_flag的值被推断为等于0。
–否则(sps_affine_prof_enabled_flag等于0),ph_disable_prof_flag的值被推断为等于1。
ph_qp_delta指定要用于图片中的编解码块直到被编解码单元层中的CuQpDeltaVal的值修改的QpY的初始值。
当qp_delta_info_in_ph_flag等于1时,图片的所有条带的QpY量化参数的初始值SliceQpY被推导如下:
SliceQpY=26+init_qp_minus26+ph_qp_delta (89)
SliceQpY的值应当在-QpBdOffset到+63的范围(包括-QpBdOffset和+63)内。
ph_joint_cbcr_sign_flag指定在tu_joint_cbcr_residual_flag[x0][y0]等于1的变换单元中,两个色度分量的共位残差样点是否具有反转符号。当变换单元的tu_joint_cbcr_residual_flag[x0][y0]等于1时,ph_joint_cbcr_sign_flag等于0指定Cr(或Cb)分量的每个残差样点的符号与共位Cb(或Cr)残差样点的符号相同,并且ph_joint_cbcr_sign_flag等于1指定Cr(或Cb)分量的每个残差样点的符号由共位Cb(或Cr)残差样点的反转符号给出。
ph_sao_luma_enabled_flag等于1指定对与PH相关联的所有条带中的亮度分量启用SAO;ph_sao_luma_enabled_flag等于0指定可以对与PH相关联的一个、多个或所有条带禁用亮度分量的SAO。当ph_sao_luma_enabled_flag不存在时,其被推断为等于0。
ph_sao_chroma_enabled_flag等于1指定对与PH相关联的所有条带中的色度分量启用SAO;ph_sao_chroma_enabled_flag等于0指定可以对与PH相关联的一个、多个或所有条带禁用色度分量的SAO。当ph_sao_chroma_enabled_flag不存在时,其被推断为等于0。
ph_dep_quant_enabled_flag等于0指定对当前图片禁用依赖量化。ph_dep_quant_enabled_flag等于1指定对当前图片启用依赖量化。当ph_dep_quant_enabled_flag不存在时,其被推断为等于0。
pic_sign_data_hiding_enabled_flag等于0指定对当前图片禁用符号比特隐藏。pic_sign_data_hiding_enabled_flag等于1指定对当前图片启用符号比特隐藏。当pic_sign_data_hiding_enabled_flag不存在时,其被推断为等于0。
ph_deblocking_filter_override_flag等于1指定去方块参数存在于PH中。ph_deblocking_filter_override_flag等于0指定去方块参数不存在于PH中。当不存在时,ph_deblocking_filter_override_flag的值被推断为等于0。
ph_deblocking_filter_disabled_flag等于1指定去方块滤波器的操作不应用于与PH相关联的条带。ph_deblocking_filter_disabled_flag等于0指定去方块滤波器的操作被应用于与PH相关联的条带。当ph_deblocking_filter_disabled_flag不存在时,其被推断为等于pps_deblocking_filter_disabled_flag。
ph_beta_offset_div2和ph_tc_offset_div2指定被应用于与PH相关联的条带的亮度分量的β和tC的去方块参数偏移(除以2)。ph_beta_offset_div2和ph_tc_offset_div2的值应当在-12到12的范围(包括-12和12)内。当不存在时,ph_beta_offset_div2和ph_tc_offset_div2的值被推断为分别等于pps_beta_offset_div2和pps_tc_offset_div2。
ph_cb_beta_offset_div2和ph_cb_tc_offset_div2指定被应用于与PH相关联的条带的Cb分量的β和tC的去方块参数偏移(除以2)。ph_cb_beta_offset_div2和ph_cb_tc_offset_div2的值应当在-12至12的范围(包括-12和12)内。当不存在时,ph_cb_beta_offset_div2和ph_cb_tc_offset_div2的值被推断为分别等于pps_cb_beta_offset_div2和pps_cb_tc_offset_div2。
ph_cr_beta_offset_div2和ph_cr_tc_offset_div2指定被应用于与PH相关联的条带的Cr分量的β和tC的去方块参数偏移(除以2)。ph_cr_beta_offset_div2和ph_cr_tc_offset_div2的值都应当在-12至12的范围(包括-12和12)内。当不存在时,ph_cr_beta_offset_div2和ph_cr_tc_offset_div2的值被推断为分别等于pps_cr_beta_offset_div2和pps_cr_tc_offset_div2。
ph_extension_length以字节为单位指定PH扩展数据的长度,不包括用于自身信令通知ph_extension_length的比特。ph_extension_length的值应当在0到256的范围(包括0和256)内。当不存在时,ph_extension_length的值被推断为等于0。
ph_extension_data_byte可以具有任何值。符合本规范的该版本的解码器应当忽略ph_extension_data_byte的值。它的值不影响解码器符合规范的该版本中指定的简表。
3.2.SH语法和语义
在最新的VVC草案文本中,SH语法和语义如下:
Figure BDA0003805963060000241
Figure BDA0003805963060000251
Figure BDA0003805963060000261
Figure BDA0003805963060000271
指定包含cu_qp_delta_abs的编解码单元的亮度量化参数与其预测之间的差的变量CuQpDeltaVal被设置为等于0。指定要在确定包含cu_chroma_qp_offset_flag的编解码单元的Qp′Cb、Qp′Cr和Qp′CbCr量化参数的相应值时使用的值的变量CuQpOffsetCb、CuQpOffsetCr和CuQpOffsetCbCr都被设置为等于0。
picture_header_in_slice_header_flag等于1指定PH语法结构存在于条带头中。picture_header_in_slice_header_flag等于0指定PH语法结构不存在于条带头中。
比特流一致性的要求是picture_header_in_slice_header_flag的值在CLVS中的所有编解码条带中应当相同。
当编解码条带的picture_header_in_slice_header_flag等于1时,比特流一致性的要求是在CLVS中不应当存在nal_unit_type等于PH_NUT的VCL NAL单元。
当picture_header_in_slice_header_flag等于0时,当前图片中的所有编解码条带应当具有等于0的picture_header_in_slice_header_flag,并且当前PU应当具有PH NAL单元。
slice_subpic_id指定包含条带的子图片的子图片ID。如果slice_subpic_id存在,则变量CurrSubpicIdx的值被推导为使得SubpicIdVal[CurrSubpicIdx]等于slice_subpic_id。否则(slice_subpic_id不存在),CurrSubpicIdx被推导为等于0。slice_subpic_id的长度为sps_subpic_id_len_minus1+1比特。
slice_address指定条带的条带地址。当不存在时,slice_address的值被推断为等于0。当rect_slice_flag等于1并且NumSlicesInSubpic[CurrSubpicIdx]等于1时,slice_address的值被推断为等于0。
如果rect_slice_flag等于0,则以下适用:
-条带地址是光栅扫描片索引。
-slice_address的长度为Ceil(Log2(NumTilesInPic))比特。
-slice_address的值应当在0到NumTilesInPic-1的范围(包括0和NumTilesInPic-1)内。
否则(rect_slice_flag等于1),以下适用:
-条带地址是条带的子图片级别条带索引。
-slice_address的长度为Ceil(Log2(NumSlicesInSubpic[CurrSubpicIdx]))比特。
-slice_address的值应当在0到NumSlicesInSubpic[CurrSubpicIdx]-1的范围(包括0和NumSlicesInSubpic[CurrSubpicIdx]-1)内。
比特流一致性的要求是以下约束适用:
-如果rect_slice_flag等于0或者subpic_info_present_flag等于0,则slice_address的值不应当等于相同编解码图片的任何其它编解码条带NAL单元的slice_address的值。
-否则,一对slice_subpic_id和slice_address值不应当等于相同编解码图片的任何其它编解码条带NAL单元的一对slice_subpic_id和slice_address值。
-图片的条带的形状应当使得每个CTU在解码时应当具有由图片边界组成或者由(多个)先前解码的CTU的边界组成的其整个左边界和整个上边界。
sh_extra_bit[i]可以等于1或0。符合本规范的该版本的解码器应当忽略sh_extra_bit[i]的值。它的值不影响解码器符合规范的该版本中指定的简表。
num_tiles_in_slice_minus1加1(在存在时)指定条带中的片的数量。num_tiles_in_slice_minus1的值应当在0到NumTilesInPic-1的范围(包括0和NumTilesInPic-1)内。
指定当前条带中的CTU的数量的变量NumCtusInCurrSlice和指定条带内的第i个CTB的图片光栅扫描地址的列表CtbAddrInCurrSlice[i](i的范围为从0到NumCtusInCurrSlice-1(包括0和NumCtusInCurrSlice-1))被推导如下:
Figure BDA0003805963060000291
Figure BDA0003805963060000301
变量SubpicLeftBoundaryPos、SubpicTopBoundaryPos、SubpicRightBoundaryPos和SubpicBotBoundaryPos被推导如下:
Figure BDA0003805963060000302
slice_type根据表9指定条带的编解码类型。
表9–与slice_type的名称关联
slice_type slice_type的名称
0 B(B条带)
1 P(P条带)
2 I(I条带)
当不存在时,slice_type的值被推断为等于2。
当ph_intra_slice_allowed_flag等于0时,slice_type的值应当等于0或1。当nal_unit_type在IDR_W_RADL到CRA_NUT的范围(包括IDR_W_RADL和CRA_NUT)内,并且vps_independent_layer_flag[GeneralLayerIdx[nuh_layer_id]]等于1时,slice_type应当等于2。
变量MinQtLog2SizeY、MinQtLog2SizeC、MinQtSizeY、MinQtSizeC、MaxBtSizeY、MaxBtSizeC、MinBtSizeY、MaxTtSizeY、MaxTtSizeC、MinTtSizeY、MaxMttDepthY和MaxMttDepthC被推导如下:
-如果slice_type等于2(I),则以下适用:
MinQtLog2SizeY=MinCbLog2SizeY+ph_log2_diff_min_qt_min_cb_intra_slice_luma (119)
MinQtLog2SizeC=MinCbLog2SizeY+ph_log2_diff_min_qt_min_cb_intra_slice_chroma
(120)
MaxBtSizeY=1<<(MinQtLog2SizeY+ph_log2_diff_max_bt_min_qt_intra_slice_luma)
(121)
MaxBtSizeC=1<<(MinQtLog2SizeC+ph_log2_diff_max_bt_min_qt_intra_slice_chroma)
(122)
MaxTtSizeY=1<<(MinQtLog2SizeY+ph_log2_diff_max_tt_min_qt_intra_slice_luma)
(123)
MaxTtSizeC=1<<(MinQtLog2SizeC+ph_log2_diff_max_tt_min_qt_intra_slice_chroma)
(124)
MaxMttDepthY=ph_max_mtt_hierarchy_depth_intra_slice_luma (125)
MaxMttDepthC=ph_max_mtt_hierarchy_depth_intra_slice_chroma (126)
CuQpDeltaSubdiv=ph_cu_qp_delta_subdiv_intra_slice (127)
CuChromaQpOffsetSubdiv=ph_cu_chroma_qp_offset_subdiv_intra_slice
(128)
-否则(slice_type等于0(B)或1(P)),以下适用:
MinQtLog2SizeY=MinCbLog2SizeY+ph_log2_diff_min_qt_min_cb_inter_slice(129)
MinQtLog2SizeC=MinCbLog2SizeY+ph_log2_diff_min_qt_min_cb_inter_slice(130)
MaxBtSizeY=1<<(MinQtLog2SizeY+ph_log2_diff_max_bt_min_qt_inter_slice) (131)
MaxBtSizeC=1<<(MinQtLog2SizeC+ph_log2_diff_max_bt_min_qt_inter_slice) (132)
MaxTtSizeY=1<<(MinQtLog2SizeY+ph_log2_diff_max_tt_min_qt_inter_slice) (133)
MaxTtSizeC=1<<(MinQtLog2SizeC+ph_log2_diff_max_tt_min_qt_inter_slice) (134)
MaxMttDepthY=ph_max_mtt_hierarchy_depth_inter_slice (135)
MaxMttDepthC=ph_max_mtt_hierarchy_depth_inter_slice (136)
CuQpDeltaSubdiv=ph_cu_qp_delta_subdiv_inter_slice (137)
CuChromaQpOffsetSubdiv=ph_cu_chroma_qp_offset_subdiv_inter_slice(138)
-以下适用:
MinQtSizeY=1<<MinQtLog2SizeY (139)
MinQtSizeC=1<<MinQtLog2SizeC (140)
MinBtSizeY=1<<MinCbLog2SizeY (141)
MinTtSizeY=1<<MinCbLog2SizeY (142)
slice_alf_enabled_flag等于1指定自适应环路滤波器被启用,并且可以被应用于条带中的Y、Cb或Cr色彩分量。slice_alf_enabled_flag等于0指定对条带中的所有色彩分量禁用自适应环路滤波器。当不存在时,slice_alf_enabled_flag的值被推断为等于ph_alf_enabled_flag。
slice_num_alf_aps_ids_luma指定条带参考的ALF APS的数量。当slice_alf_enabled_flag等于1并且slice_num_alf_aps_ids_luma不存在时,slice_num_alf_aps_ids_luma的值被推断为等于ph_num_alf_aps_ids_luma的值。
slice_alf_aps_id_luma[i]指定条带的亮度分量参考的第i个ALF APS的adaptation_parameter_set_id。具有等于ALF_APS的aps_params_type和等于slice_alf_aps_id_luma[i]的adaptation_parameter_set_id的APS NAL单元的TemporalId应当小于或等于编解码条带NAL单元的TemporalId。当slice_alf_enabled_flag等于1并且slice_alf_aps_id_luma[i]不存在时,slice_alf_aps_id_luma[i]的值被推断为等于ph_alf_aps_id_luma[i]的值。
具有等于ALF_APS的aps_params_type和等于slice_alf_aps_id_luma[i]的adaptation_parameter_set_id的APS NAL单元的alf_luma_filter_signal_flag的值应当等于1。
slice_alf_chroma_idc等于0指定自适应环路滤波器不应用于Cb和Cr色彩分量。slice_alf_chroma_idc等于1指示自适应环路滤波器被应用于Cb色彩分量。slice_alf_chroma_idc等于2指示自适应环路滤波器被应用于Cr色彩分量。slice_alf_chroma_idc等于3指示自适应环路滤波器被应用于Cb和Cr色彩分量。当slice_alf_chroma_idc不存在时,其被推断为等于ph_alf_chroma_idc。
slice_alf_aps_id_chroma指定条带的色度分量参考的ALF APS的adaptation_parameter_set_id。具有等于ALF_APS的aps_params_type和等于slice_alf_aps_id_chroma的adaptation_parameter_set_id的APS NAL单元的TemporalId应当小于或等于编解码条带NAL单元的TemporalId。当slice_alf_enabled_flag等于1并且slice_alf_aps_id_chroma不存在时,slice_alf_aps_id_chroma的值被推断为等于ph_alf_aps_id_chroma的值。
具有等于ALF_APS的aps_params_type和等于slice_alf_aps_id_chroma的adaptation_parameter_set_id的APS NAL单元的alf_chroma_filter_signal_flag的值应当等于1。
slice_cc_alf_cb_enabled_flag等于0指定跨分量滤波器不应用于Cb色彩分量。slice_cc_alf_cb_enabled_flag等于1指示跨分量滤波器被启用,并且可以被应用于Cb色彩分量。当slice_cc_alf_cb_enabled_flag不存在时,其被推断为等于ph_cc_alf_cb_enabled_flag。
slice_cc_alf_cb_aps_id指定条带的Cb色彩分量参考的adaptation_parameter_set_id。
具有等于ALF_APS的aps_params_type和等于slice_cc_alf_cb_aps_id的adaptation_parameter_set_id的APS NAL单元的TemporalId应该小于或等于编解码条带NAL单元的TemporalId。当slice_cc_alf_cb_enabled_flag等于1并且slice_cc_alf_cb_aps_id不存在时,slice_cc_alf_cb_aps_id的值被推断为等于ph_cc_alf_cb_aps_id的值。
具有等于ALF_APS的aps_params_type和等于slice_cc_alf_cb_aps_id的adaptation_parameter_set_id的APS NAL单元的alf_cc_cb_filter_signal_flag的值应当等于1。
slice_cc_alf_cr_enabled_flag等于0指定跨分量滤波器不应用于Cr色彩分量。slice_cc_alf_cb_enabled_flag等于1指示跨分量自适应环路滤波器被启用,并且可以被应用于Cr色彩分量。当slice_cc_alf_cr_enabled_flag不存在时,其被推断为等于ph_cc_alf_cr_enabled_flag。
slice_cc_alf_cr_aps_id指定条带的Cr色彩分量参考的adaptation_parameter_set_id。具有等于ALF_APS的aps_params_type和等于slice_cc_alf_cr_aps_id的adaptation_parameter_set_id的APS NAL单元的TemporalId应该小于或等于编解码条带NAL单元的TemporalId。当slice_cc_alf_cr_enabled_flag等于1并且slice_cc_alf_cr_aps_id不存在时,slice_cc_alf_cr_aps_id的值被推断为等于ph_cc_alf_cr_aps_id的值。
具有等于ALF_APS的aps_params_type和等于slice_cc_alf_cr_aps_id的adaptation_parameter_set_id的APS NAL单元的alf_cc_cr_filter_signal_flag的值应当等于1。
当separate_colour_plane_flag等于1时,colour_plane_id标识与当前条带相关联的色彩平面。colour_plane_id的值应当在0到2的范围(包括0和2)内。colour_plane_id值0、1和2分别对应于Y、Cb和Cr平面。colour_plane_id的值3被保留以供ITU-T|ISO/IEC将来使用。
注1–图片的不同色彩平面的解码过程之间没有依赖性。
num_ref_idx_active_override_flag等于1指定语法元素num_ref_idx_active_minus1[0]对于P条带和B条带存在,并且语法元素num_ref_idx_active_minus1[1]对于B条带存在。num_ref_idx_active_override_flag等于0指定不存在语法元素num_ref_idx_active_minus1[0]和num_ref_idx_active_minus1[1]。当不存在时,num_ref_idx_active_override_flag的值被推断为等于1。
num_ref_idx_active_minus1[i]用于推导变量NumRefIdxActive[i],如公式143所指定的。num_ref_idx_active_minus1[i]的值应当在0到14的范围(包括0和14)内。
对于i等于0或1,当当前条带是B条带,num_ref_idx_active_override_flag等于1,并且num_ref_idx_active_minus1[i]不存在时,num_ref_idx_active_minus1[i]被推断为等于0。
当当前条带是P条带,num_ref_idx_active_override_flag等于1,并且num_ref_idx_active_minus1[0]不存在时,num_ref_idx_active_minus1[0]被推断为等于0。
变量NumRefIdxActive[i]被推导如下:
Figure BDA0003805963060000351
NumRefIdxActive[i]-1的值指定可以用于解码条带的参考图片列表i的最大参考索引。当NumRefIdxActive[i]的值等于0时,没有参考图片列表i的参考索引可以用于解码条带。
当当前条带是P条带时,NumRefIdxActive[0]的值应当大于0。
当当前条带是B条带时,NumRefIdxActive[0]和NumRefIdxActive[1]都应当大于0。
cabac_init_flag指定用于确定在上下文变量的初始化过程中使用的初始化表的方法。当cabac_init_flag不存在时,其被推断为等于0。
slice_collocated_from_l0_flag等于1指定用于时域运动矢量预测的共位图片是从参考图片列表0推导的。slice_collocated_from_l0_flag等于0指定用于时域运动矢量预测的共位图片是从参考图片列表1推导的。
当slice_type等于B或P,ph_temporal_mvp_enabled_flag等于1,并且slice_collocated_from_l0_flag不存在时,以下适用:
-如果rpl_info_in_ph_flag等于1,则slice_collocated_from_l0_flag被推断为等于ph_collocated_from_l0_flag。
-否则(rpl_info_in_ph_flag等于0,并且slice_type等于P),slice_collocated_from_l0_flag的值被推断为等于1。
slice_collocated_ref_idx指定用于时域运动矢量预测的共位图片的参考索引。
当slice_type等于P时或者当slice_type等于B并且slice_collocated_from_l0_flag等于1时,slice_collocated_ref_idx参考参考图片列表0中的条目,并且slice_collocated_ref_idx的值应当在0到NumRefIdxActive[0]-1的范围(包括0和NumRefIdxActive[0]-1)内。
当slice_type等于B并且slice_collocated_from_l0_flag等于0时,slice_collocated_ref_idx参考参考图片列表1中的条目,并且slice_collocated_ref_idx的值应当在0到NumRefIdxActive[1]-1的范围(包括0和NumRefIdxActive[1]-1)内。
当slice_collocated_ref_idx不存在时,以下适用:
-如果rpl_info_in_ph_flag等于1,则slice_collocated_ref_idx的值被推断为等于ph_collocated_ref_idx。
-否则(rpl_info_in_ph_flag等于0),slice_collocated_ref_idx的值被推断为等于0。
比特流一致性的要求是由slice_collocated_ref_idx参考的图片对于编解码图片的所有条带应当是相同的。
比特流一致性的要求是,由slice_collocated_ref_idx参考的参考图片的pic_width_in_luma_samples和pic_height_in_luma_samples的值应当分别等于当前图片的pic_width_in_luma_samples和pic_height_in_luma_samples的值,并且RprConstraintsActive[slice_collocated_from_l0_flag?0:1][slice_collocated_ref_idx]应当等于0。
slice_qp_delta指定要用于条带中的编解码块直到被编解码单元层中的CuQpDeltaVal的值修改的QpY的初始值。
当qp_delta_info_in_ph_flag等于0时,条带的QpY量化参数的初始值SliceQpY被推导如下:
SliceQpY=26+init_qp_minus26+slice_qp_delta (144)
SliceQpY的值应当在-QpBdOffset到+63的范围(包括-QpBdOffset和+63)内。
当以下条件中的任一个为真时:
-wp_info_in_ph_flag的值等于1,pps_weighted_pred_flag等于1,并且slice_type等于P。
-wp_info_in_ph_flag的值等于1,pps_weighted_bipred_flag等于1,并且slice_type等于B。
以下适用:
-NumRefIdxActive[0]的值应当小于或等于NumWeightsL0的值。
-对于每个参考图片索引RefPicList[0][i](i在0到NumRefIdxActive[0]-1的范围(包括0和NumRefIdxActive[0]-1)内),应用于参考图片索引的亮度权重、Cb权重和Cr权重分别为LumaWeightL0[i]、ChromaWeightL0[0][i]和ChromaWeightL0[1][i]。
当wp_info_in_ph_flag等于1,pps_weighted_bipred_flag等于1,并且slice_type等于B时,以下适用:
-NumRefIdxActive[1]的值应当小于或等于NumWeightsL1的值。
-对于每个参考图片索引RefPicList[1][i](i在0到NumRefIdxActive[1]-1的范围(包括0和NumRefIdxActive[1]-1)内),应用于参考图片索引的亮度权重、Cb权重和Cr权重分别为LumaWeightL1[i]、ChromaWeightL1[0][i]和ChromaWeightL1[1][i]。
slice_cb_qp_offset指定在确定Qp′Cb量化参数值时要添加到pps_cb_qp_offset的值的差。slice_cb_qp_offset的值应当在-12到+12的范围(包括-12和+12)内。当slice_cb_qp_offset不存在时,其被推断为等于0。pps_cb_qp_offset+slice_cb_qp_offset的值应当在-12至+12的范围(包括-12和+12)内。
slice_cr_qp_offset指定在确定Qp′Cr量化参数值时要添加到pps_cr_qp_offset的值的差。slice_cr_qp_offset的值应当在-12至+12的范围(包括-12和+12)内。当slice_cr_qp_offset不存在时,其被推断为等于0。pps_cr_qp_offset+slice_cr_qp_offset的值应当在-12至+12的范围(包括-12和+12)内。
slice_joint_cbcr_qp_offset指定在确定Qp′CbCr的值时要添加到pps_joint_cbcr_qp_offset_value的值的差。slice_joint_cbcr_qp_offset的值应当在-12到+12的范围(包括-12和+12)内。当slice_joint_cbcr_qp_offset不存在时,其被推断为等于0。pps_joint_cbcr_qp_offset_value+slice_joint_cbcr_qp_offset的值应当在-12到+12的范围(包括-12和+12)内。
cu_chroma_qp_offset_enabled_flag等于1指定cu_chroma_qp_offset_flag可以存在于变换单元和调色板编解码语法中。cu_chroma_qp_offset_enabled_flag等于0指定cu_chroma_qp_offset_flag不存在于变换单元或调色板编解码语法中。当不存在时,cu_chroma_qp_offset_enabled_flag的值被推断为等于0。
slice_sao_luma_flag等于1指定对当前条带中的亮度分量启用SAO;slice_sao_luma_flag等于0指定对当前条带中的亮度分量禁用SAO。当slice_sao_luma_flag不存在时,其被推断为等于ph_sao_luma_enabled_flag。
slice_sao_chroma_flag等于1指定对当前条带中的色度分量启用SAO;slice_sao_chroma_flag等于0指定对当前条带中的色度分量禁用SAO。当slice_sao_chroma_flag不存在时,其被推断为等于ph_sao_chroma_enabled_flag。
slice_deblocking_filter_override_flag等于1指定去方块参数存在于条带头中。slice_deblocking_filter_override_flag等于0指定去方块参数不存在于条带头中。当不存在时,slice_deblocking_filter_override_flag的值被推断为等于ph_deblocking_filter_override_flag。
slice_deblocking_filter_disabled_flag等于1指定去方块滤波器的操作不应用于当前条带。slice_deblocking_filter_disabled_flag等于0指定去方块滤波器的操作被应用于当前条带。当slice_deblocking_filter_disabled_flag不存在时,其被推断为等于ph_deblocking_filter_disabled_flag。
slice_beta_offset_div2和slice_tc_offset_div2指定被应用于当前条带的亮度分量的β和tC的去方块参数偏移(除以2)。slice_beta_offset_div2和slice_tc_offset_div2的值都应当在-12到12的范围(包括-12和12)内。当不存在时,slice_beta_offset_div2和slice_tc_offset_div2的值被推断为分别等于ph_beta_offset_div2和ph_tc_offset_div2。
slice_cb_beta_offset_div2和slice_cb_tc_offset_div2指定被应用于当前条带的Cb分量的β和tC的去方块参数偏移(除以2)。slice_cb_beta_offset_div2和slice_cb_tc_offset_div2的值都应当在-12到12的范围(包括-12和12)内。当不存在时,slice_cb_beta_offset_div2和slice_cb_tc_offset_div2的值被推断为分别等于ph_cb_beta_offset_div2和ph_cb_tc_offset_div2。
slice_cb_beta_offset_div2和slice_cb_tc_offset_div2指定被应用于当前条带的Cr分量的β和tC的去方块参数偏移(除以2)。slice_cr_beta_offset_div2和slice_cr_tc_offset_div2的值都应当在-12到12的范围(包括-12和12)内。当不存在时,slice_cr_beta_offset_div2和slice_cr_tc_offset_div2的值被推断为分别等于ph_cr_beta_offset_div2和ph_cr_tc_offset_div2。
slice_ts_residual_coding_disabled_flag等于1指定residual_coding()语法结构用于解析当前条带的变换跳过块的残差样点。slice_ts_residual_coding_disabled_flag等于0指定residual_ts_coding()语法结构用于解析当前条带的变换跳过块的残差样点。当slice_ts_residual_coding_disabled_flag不存在时,其被推断为等于0。
slice_lmcs_enabled_flag等于1指定对当前条带启用亮度映射与色度缩放。slice_lmcs_enabled_flag等于0指定不对当前条带启用亮度映射与色度缩放。当slice_lmcs_enabled_flag不存在时,其被推断为等于0。
slice_scaling_list_present_flag等于1指定用于当前条带的缩放列表数据是基于aps_params_type等于SCALING_APS并且adaptation_parameter_set_id等于ph_scaling_list_aps_id的参考缩放列表APS中包含的缩放列表数据推导的。slice_scaling_list_present_flag等于0指定用于当前图片的缩放列表数据是如条款7.4.3.21所指定而推导的默认缩放列表数据。当不存在时,slice_scaling_list_present_flag的值被推断为等于0。
指定当前条带中的条目点的数量的变量NumEntryPoints被推导如下:
Figure BDA0003805963060000391
Figure BDA0003805963060000401
offset_len_minus1加1指定entry_point_offset_minus1[i]语法元素的长度,以比特为单位。offset_len_minus1的值应当在0到31的范围(包括0和31)内。
entry_point_offset_minus1[i]加1以字节为单位指定第i个条目点偏移,并且由offset_len_minus1加1比特表示。条带头之后的条带数据由NumEntryPoints+1个子集组成,其中子集索引值的范围为0到NumEntryPoints(包括0和NumEntryPoints)。条带数据的第一字节被视为字节0。当存在时,出现在编解码条带NAL单元的条带数据部分中的防止竞争字节被计数作为条带数据的一部分,用于子集识别的目的。子集0由编解码条带数据的字节0到entry_point_offset_minus1[0](包括0和entry_point_offset_minus1[0])组成,子集k(k在1到NumEntryPoints-1的范围(包括1和NumEntryPoints-1)内)由编解码条带数据的字节firstByte[k]到lastByte[k](包括firstByte[k]和lastByte[k])组成,其中firstByte[k]和lastByte[k]被定义为:
Figure BDA0003805963060000402
lastByte[k]=firstByte[k]+entry_point_offset_minus1[k] (147)
最后一个子集(子集索引等于NumEntryPoints)由编解码条带数据的剩余字节组成。
当sps_entropy_coding_sync_enabled_flag等于0并且条带包含一个或多个完整片时,每个子集应当由条带中相同片内的所有CTU的所有编解码比特组成,并且子集的数量(即,NumEntryPoints+1的值)应当等于条带中的片的数量。
当sps_entropy_coding_sync_enabled_flag等于0并且条带包含来自单个片的CTU行的子集时,NumEntryPoints应当为0,并且子集的数量应当为1。子集应当由条带中的所有CTU的所有编解码比特组成。
当sps_entropy_coding_sync_enabled_flag等于1时,每个子集k(k在0到NumEntryPoints的范围(包括0和NumEntryPoints)内)应当由片内的CTU行中的所有CTU的所有编解码比特组成,并且子集的数量(即,NumEntryPoints+1的值)应当等于条带中的片特定CTU行的总数。
slice_header_extension_length以字节为单位指定条带头扩展数据的长度,不包括用于自身信令通知slice_header_extension_length的比特。slice_header_extension_length的值应当在0到256的范围(包括0和256)内。当不存在时,slice_header_extension_length的值被推断为等于0。
slice_header_extension_data_byte[i]可以具有任何值。符合本规范的该版本的解码器应当忽略所有slice_header_extension_data_byte[i]语法元素的值。它的值不影响解码器符合规范的该版本中指定的简表。
3.3.加权预测语法和语义
在最新的VVC草案文本中,加权预测语法和语义如下:
Figure BDA0003805963060000411
Figure BDA0003805963060000421
luma_log2_weight_denom是所有亮度加权因子的分母的以2为底的对数。luma_log2_weight_denom的值应当在0到7的范围(包括0和7)内。
delta_chroma_log2_weight_denom是所有色度加权因子的分母的以2为底的对数的差。当delta_chroma_log2_weight_denom不存在时,其被推断为等于0。
变量ChromaLog2WeightDenom被推导为等于luma_log2_weight_denom+delta_chroma_log2_weight_denom,并且该值应当在0到7的范围(包括0和7)内。
num_l0_weights指定当wp_info_in_ph_flag等于1时,为参考图片列表0中的条目信令通知的权重的数量。num_l0_weights的值应当在0到num_ref_entries[0][RplsIdx[0]]的范围(包括0和num_ref_entries[0][RplsIdx[0]])内。
如果wp_info_in_ph_flag等于1,则变量NumWeightsL0被设置为等于num_l0_weights。否则(wp_info_in_ph_flag等于0),NumWeightsL0被设置为等于NumRefIdxActive[0]。
luma_weight_l0_flag[i]等于1指定存在使用RefPicList[0][i]的列表0预测的亮度分量的加权因子。luma_weight_l0_flag[i]等于0指定不存在这些加权因子。
chroma_weight_l0_flag[i]等于1指定存在使用RefPicList[0][i]的列表0预测的色度预测值的加权因子。chroma_weight_l0_flag[i]等于0指定不存在这些加权因子。当chroma_weight_l0_flag[i]不存在时,其被推断为等于0。
delta_luma_weight_l0[i]是应用于使用RefPicList[0][i]的列表0预测的亮度预测值的加权因子的差。
LumaWeightL0[i]被推导为等于(1<<luma_log2_weight_denom)+delta_luma_weight_l0[i]。当luma_weight_l0_flag[i]等于1时,delta_luma_weight_l0[i]的值应当在-128到127的范围(包括-128和127)内。当luma_weight_l0_flag[i]等于0时,LumaWeightL0[i]被推断为等于2luma_log2_weight_denom
luma_offset_l0[i]是应用于使用RefPicList[0][i]的列表0预测的亮度预测值的添加偏移。luma_offset_l0[i]的值应当在-128到127的范围(包括-128和127)内。当luma_weight_l0_flag[i]等于0时,luma_offset_l0[i]被推断为等于0。
delta_chroma_weight_l0[i][j]是应用于使用RefPicList[0][i]的列表0预测的色度预测值的加权因子的差,其中j对于Cb等于0,并且j对于Cr等于1。
变量ChromaWeightL0[i][j]被推导为等于(1<<ChromaLog2WeightDenom)+delta_chroma_weight_l0[i][j]。当chroma_weight_l0_flag[i]等于1时,delta_chroma_weight_l0[i][j]的值应当在-128到127的范围(包括-128和127)内。当chroma_weight_l0_flag[i]等于0时,ChromaWeightL0[i][j]被推断为等于2ChromaLog2WeightDenom
delta_chroma_offset_l0[i][j]是应用于使用RefPicList[0][i]的列表0预测的色度预测值的添加偏移的差,其中j对于Cb等于0,并且j对于Cr等于1。
变量ChromaOffsetL0[i][j]被推导如下:
ChromaOffsetL0[i][j]=Clip3(-128,127,(128+delta_chroma_offset_l0[i][j]- (148)
((128*ChromaWeightL0[i][j])>>ChromaLog2WeightDenom)))
delta_chroma_offset_l0[i][j]的值应当在-4*128to 4*127的范围(包括-4*128和4*127)内。当chroma_weight_l0_flag[i]等于0时,ChromaOffsetL0[i][j]被推断为等于0。
num_l1_weights指定当wp_info_in_ph_flag等于1时,为参考图片列表1中的条目信令通知的权重的数量。num_l1_weights的值应当在0到num_ref_entries[1][RplsIdx[1]]的范围(包括0和num_ref_entries[1][RplsIdx[1]])内。
如果wp_info_in_ph_flag等于1,则变量NumWeightsL1被设置为等于num_l1_weights。否则(wp_info_in_ph_flag等于0),NumWeightsL1被设置为等于NumRefIdxActive[1]。
luma_weight_l1_flag[i]、chroma_weight_l1_flag[i]、delta_luma_weight_l1[i]、luma_offset_l1[i]、delta_chroma_weight_l1[i][j]和delta_chroma_offset_l1[i][j]具有分别与luma_weight_l0_flag[i]、chroma_weight_l0_flag[i]、delta_luma_weight_l0[i]、luma_offset_l0[i]、delta_chroma_weight_l0[i][j]和delta_chroma_offset_l0[i][j]相同的语义,其中l0、L0、列表0和List0分别被l1、L1、列表1和List1替换。
变量sumWeightL0Flags被推导为等于luma_weight_l0_flag[i]+2*chroma_weight_l0_flag[i]之和,其中i=0..NumRefIdxActive[0]-1。
当slice_type等于B时,变量sumWeightL1Flags被推导为等于luma_weight_l1_flag[i]+2*chroma_weight_l1_flag[i]之和,其中i=0..NumRefIdxActive[1]-1。
比特流一致性的要求是,当slice_type等于P时,sumWeightL0Flags应当小于或等于24,以及当slice_type等于B时,sumWeightL0Flags和sumWeightL1Flags之和应当小于或等于24。
4.通过所公开的技术解决方案解决的技术问题的示例
PPS、PH和SH语法的现有设计具有以下问题:
1)在最新的VVC草案文本中的pred_weight_table()语法中,当wp_info_in_ph_flag等于1时,甚至当pps_weighted_pred_flag等于1但pps_weighted_bipred_flag等于0时,语法元素num_l1_weights被信令通知。因此,在相同条件下,语法元素uma_weight_l1_flag[i]的列表也被信令通知,并且语法元素luma_weight_l1_flag[i]、chroma_weight_l1_flag[i]、delta_luma_weight_l1[i]、luma_offset_l1[i]、delta_chroma_weight_l1[i][j]和delta_chroma_offset_l1[i][j]的列表也可以被信令通知。然而,当pps_weighted_bipred_flag等于0时,加权预测不应用于B条带,因此所有这些信令通知的语法元素都是无用的。
2)当wp_info_in_ph_flag等于1时(在这种情况下,pps_weighted_pred_flag和pps_weighted_bipred_flag中的至少一个等于1),pred_weight_table()语法结构存在于参考PPS的图片的PH语法结构中。在这种情况下,当pps_weighted_pred_flag等于0时(在这种情况下,pps_weighted_bipred_flag等于1),尽管在PH语法结构中信令通知了luma_weight_l0_flag[i]语法元素的列表,但是对于P条带,不应用加权预测,因此P条带的luma_weight_l0_flag[i]语法元素的列表的值应该被推断为等于0。类似地,当pps_weighted_bipred_flag等于0时(在这种情况下,pps_weighted_pred_flag等于1),由于加权预测不应用于B条带,因此B条带的luma_weight_l0_flag[i]语法元素的列表和luma_weight_l1_flag[i]语法元素的列表应该被推断为等于0。
3)当wp_info_in_ph_flag等于1时(在这种情况下,pps_weighted_pred_flag和pps_weighted_bipred_flag中的至少一个等于1),pred_weight_table()语法结构存在于参考PPS的图片的PH语法结构中。在这种情况下,如果图片不具有B条带,同时pps_weighted_bipred_flag等于1,则参考图片列表1的pred_weight_table()语法结构中的所有语法元素都将是无用的。
5.技术和实施例的示例
为了解决以上问题,公开了如下总结的方法。本发明应该被认为是解释一般概念的示例,而不应该以狭隘的方式解释。此外,这些发明可以被单独应用或者以任何方式组合。在以下技术和实施例中,已经被添加或修改的最相关部分以
Figure BDA0003805963060000461
示出,并且最相关的移除部分用粗体双括号括起来进行突出显示,例如,
Figure BDA0003805963060000462
指示“a”已经被移除。
1.关于加权预测相关语法元素的信令通知:
1)为了解决第一个问题,是否信令通知参考图片列表1中的条目的权重的数量和/或参考图片列表1中的条目的亮度/色度权重可以取决于对B条带的显式加权预测的启用。
a.在一个示例中,在pred_weight_table()语法中,以下语法:
Figure BDA0003805963060000463
被改变如下:
Figure BDA0003805963060000464
并且以下语义:
num_l1_weights指定当wp_info_in_ph_flag等于1时,为参考图片列表1中的条目信令通知的权重的数量。num_l1_weights的值应当在0到num_ref_entries[1][RplsIdx[1]]的范围(包括0和num_ref_entries[1][RplsIdx[1]])内。
如果wp_info_in_ph_flag等于1,则变量NumWeightsL1被设置为等于num_l1_weights。否则(wp_info_in_ph_flag等于0),NumWeightsL1被设置为等于NumRefIdxActive[1]。
被改变如下:
num_l1_weights指定
Figure BDA0003805963060000465
Figure BDA0003805963060000466
为参考图片列表1中的条目信令通知的权重的数量。num_l1_weights的值应当在0到num_ref_entries[1][RplsIdx[1]]的范围(包括0和num_ref_entries[1][RplsIdx[1]])内。
Figure BDA0003805963060000471
2)为了解决第二个问题,在条带头语义中,添加对luma_weight_l0_flag[i]、chroma_weight_l0_flag[i]、luma_weight_l1_flag[i]和chroma_weight_l1_flag[i]的以下推断:
a.当pps_weighted_pred_flag等于0并且slice_type等于P时,对于在0到NumRefIdxActive[0]-1的范围(包括0和NumRefIdxActive[0]-1)内的i的每个值,luma_weight_l0_flag[i]的值被推断为等于0,并且chroma_weight_l0_flag[i]的值被推断为等于0。
b.当pps_weighted_bipred_flag等于0并且slice_type等于B时,对于在0到NumRefIdxActive[0]-1的范围(包括0和NumRefIdxActive[0]-1)内的i的每个值,luma_weight_l0_flag[i]的值被推断为等于0,并且chroma_weight_l0_flag[i]的值被推断为等于0。
c.此外,可替代地,当pps_weighted_bipred_flag等于0并且slice_type等于B时,对于在0到NumRefIdxActive[1]-1的范围(包括0和NumRefIdxActive[1]-1)内的i的每个值,luma_weight_l1_flag[i]的值被推断为等于0,并且chroma_weight_10_flag[i]的值被推断为等于0。
3)为了解决第三个问题,可以应用以下替代方法:
a.以上项目符号第2.1项适用,并且对于不具有B条带的图片,编码器强制其参考具有等于0的pps_weighted_bipred_flag的PPS。后一部分可以通过添加以下约束来实现:不包含B条带的图片应当仅参考具有等于0的pps_weighted_bipred_flag的PPS。
b.对于不具有B条带的图片,编码器强制其参考具有等于0的wp_info_in_ph_flag的PPS。这可以通过添加以下约束来实现:不包含B条带的图片应当仅参考具有等于0的wp_info_in_ph_flag的PPS。
c.对于不具有B条带的图片,编码器强制pred_weight_table()语法结构中的语法元素num_l1_weights的值等于0。这可以通过添加以下约束作为num_l1_weights的语义的一部分来实现:当wp_info_in_ph_flag等于1并且当前图片不包含B条带时,num_l1_weights的值应当等于0。
4)可以使用一个标志在SPS中信令通知显式加权预测被启用的指示。
a.此外,可替代地,该一标志SPS指示可以用于以SPS中的对于P条带和B条带的显式加权预测的指示(即,sps_weighted_pred_flag和sps_weighted_bipred_flag)的信令通知为条件。
b.可替代地,一个或多个约束标志可以被添加到通用约束信息语法,以指示对显式加权预测的约束。
i.在一个示例中,一个约束标志(例如,命名为no_explicit_weighted_prediction_constraint_flag)被添加,并且当约束标志指示不应用对于P条带和B条带(或者仅对于P条带或仅对于B条带)的显式加权预测时,(多个)对应的SPS标志应当等于0。
5)可以使用一个标志在PPS中信令通知显式加权预测被启用的指示。
a.此外,可替代地,该一标志PPS指示可以用于以PPS中的对于P条带和B条带的显式加权预测的指示(即,pps_weighted_pred_flag和pps_weighted_bipred_flag)的信令通知为条件。
b.可替代地,一个或多个约束标志可以被添加到通用约束信息语法,以指示对显式加权预测的约束。
i.在一个示例中,一个约束标志(例如,命名为no_explicit_weighted_prediction_constraint_flag)被添加,并且当约束标志指示不应用对于P条带和B条带(或者仅对于P条带或仅对于B条带)的显式加权预测时,(多个)对应的PPS标志应当等于0。
6)应用于P条带或B条带的显式加权预测的指示可以在图片标头或条带标头中被信令通知,而不是在SPS和PPS中被信令通知。
a.在一个示例中,是否在图片标头或条带标头中信令通知这样的指示可以遵循RPL存在的位置,即,可以取决于RPL信息是否存在于PH语法结构或SH语法结构中(例如,根据rpl_info_in_ph_flag的值)。
b.此外,可替代地,是否信令通知这样的指示可以取决于条带类型。
c.此外,可替代地,是否信令通知这样的指示可以取决于当前图片是否可以包括帧间条带或P条带或B条带。
2.关于图片是否不包含B条带的指示以及使用该指示来跳过一些语法元素的信令通知:
1)当前图片是否不包含B条带的指示可以被添加到PH语法结构。
a.在一个示例中,该指示是标志,例如,命名为ph_b_slices_allowed_flag,ph_b_slices_allowed_flag等于1指定图片可以包含一个或多个B条带,并且ph_b_slices_allowed_flag等于0指定图片不包含B条带。
i.此外,可替代地,仅当ph_inter_slice_allowed_flag等于1时,ph_b_slices_allowed_flag才可以在PH语法结构中被信令通知。
ii.此外,可替代地,当ph_inter_slice_allowed_flag等于0时,ph_b_slices_allowed_flag的值可以被推断为等于0。
b.在一个示例中,当ph_b_slices_allowed_flag等于0时,ref_pic_lists()语法和ref_pic_list_struct()语法中的参考图片列表1的语法元素可以被跳过。
c.在一个示例中,当ph_b_slices_allowed_flag等于0时,PH语法结构中的语法元素mvd_l1_zero_flag可以被跳过。
i.此外,可替代地,当ph_b_slices_allowed_flag等于0时,mvd_l1_zero_flag的值可以被推断为等于1。
d.在一个示例中,当ph_b_slices_allowed_flag等于0时,参考图片列表1的pred_weight_table()语法中的语法元素num_l1_weights以及其他参数可以被跳过。
i.此外,可替代地,当ph_b_slices_allowed_flag等于0时,num_l1_weights的值可以被推断为等于0。
e.在一个示例中,当ph_b_slices_allowed_flag等于0时,SH语法中的语法元素num_ref_idx_active_minus1[1]可以被跳过。
i.此外,可替代地,当ph_b_slices_allowed_flag等于0时,NumRefIdxActive[1]的值可以被推断为等于0。
f.在一个示例中,当ph_b_slices_allowed_flag等于0时,SH语法中的语法元素slice_collocated_from_l0_flag可以被跳过。
i.此外,可替代地,当ph_b_slices_allowed_flag等于0时,slice_collocated_from_l0_flag的值可以被推断为等于1。
6.实施例
Figure BDA0003805963060000501
6.1.第一实施例
这是上面第5节中总结的第1.1、1.1.a、1.2.a和1.2.b项的实施例。
7.3.7.2加权预测参数语法
Figure BDA0003805963060000502
Figure BDA0003805963060000511
7.4.8.2加权预测参数语义
luma_log2_weight_denom是所有亮度加权因子的分母的以2为底的对数。luma_log2_weight_denom的值应当在0到7的范围(包括0和7)内。
delta_chroma_log2_weight_denom是所有色度加权因子的分母的以2为底的对数的差。当delta_chroma_log2_weight_denom不存在时,其被推断为等于0。
变量ChromaLog2WeightDenom被推导为等于luma_log2_weight_denom+delta_chroma_log2_weight_denom,并且该值应当在0到7的范围(包括0和7)内。
num_l0_weights指定当wp_info_in_ph_flag等于1时,为参考图片列表0中的条目信令通知的权重的数量。num_l0_weights的值应当在0到num_ref_entries[0][RplsIdx[0]]的范围(包括0和num_ref_entries[0][RplsIdx[0]])内。
如果wp_info_in_ph_flag等于1,则变量NumWeightsL0被设置为等于num_l0_weights。否则(wp_info_in_ph_flag等于0),NumWeightsL0被设置为等于NumRefIdxActive[0]。
luma_weight_l0_flag[i]等于1指定存在使用RefPicList[0][i]的列表0预测的亮度分量的加权因子。luma_weight_l0_flag[i]等于0指定不存在这些加权因子。
chroma_weight_l0_flag[i]等于1指定存在使用RefPicList[0][i]的列表0预测的色度预测值的加权因子。chroma_weight_l0_flag[i]等于0指定不存在这些加权因子。当chroma_weight_l0_flag[i]不存在时,其被推断为等于0。
delta_luma_weight_l0[i]是应用于使用RefPicList[0][i]的列表0预测的亮度预测值的加权因子的差值。
...
num_l1_weights指定当
Figure BDA0003805963060000521
wp_info_in_ph_flag
Figure BDA0003805963060000522
等于1时,对于参考图片列表1中的条目信令通知的权重的数量。num_l1_weights的值应当在0到num_ref_entries[1][RplsIdx[1]]的范围(包括0和num_ref_entries[1][RplsIdx[1]])内。
[[如果wp_info_in_ph_flag等于1,则变量NumWeightsL1被设置为等于num_l1_weights。否则(wp_info_in_ph_flag等于0),NumWeightsL1被设置为等于NumRefIdxActive[1]。]]
Figure BDA0003805963060000523
Figure BDA0003805963060000531
...
7.4.8.1通用条带标头语义
...
slice_qp_delta指定要用于条带中的编解码块直到被编解码单元层中的CuQpDeltaVal的值修改的QpY的初始值。
当qp_delta_info_in_ph_flag等于0时,条带的QpY量化参数的初始值SliceQpY被推导如下:
SliceQpY=26+init_qp_minus26+slice_qp_delta (144)
SliceQpY的值应当在-QpBdOffset到+63的范围(包括-QpBdOffset和+63)内。
当以下条件中的任一个为真时:
-wp_info_in_ph_flag的值等于1,pps_weighted_pred_flag等于1,并且slice_type等于P。
-wp_info_in_ph_flag的值等于1,pps_weighted_bipred_flag等于1,并且slice_type等于B。
以下适用:
-NumRefIdxActive[0]的值应当小于或等于NumWeightsL0的值。
-对于每个参考图片索引RefPicList[0][i](i在0到NumRefIdxActive[0]-1的范围(包括0和NumRefIdxActive[0]-1)内),应用于参考图片索引的亮度权重、Cb权重和Cr权重分别为LumaWeightL0[i]、ChromaWeightL0[0][i]和ChromaWeightL0[1][i]。
当wp_info_in_ph_flag等于1,pps_weighted_bipred_flag等于1,并且slice_type等于B时,以下适用:
-NumRefIdxActive[1]的值应当小于或等于NumWeightsL1的值。
-对于每个参考图片索引RefPicList[1][i](i在0到NumRefIdxActive[1]-1的范围(包括0和NumRefIdxActive[1]-1)
内),应用于参考图片索引的亮度权重、Cb权重和Cr权重分别为LumaWeightL1[i]、ChromaWeightL1[0][i]和ChromaWeightL1[1][i]。
Figure BDA0003805963060000541
...[保留标准文档中的剩余文本]
图1是示出可以在其中实施本文公开的各种技术的示例视频处理系统1000的框图。各种实施方式可以包括系统1000的一些或所有组件。系统1000可以包括用于接收视频内容的输入1002。视频内容可以以例如8或10比特多分量像素值的原始或未压缩格式而接收,或者可以是压缩或编码格式。输入1002可以表示网络接口、外围总线接口或存储接口。网络接口的示例包括诸如以太网、无源光网络(PON)等的有线接口和诸如Wi-Fi或蜂窝接口的无线接口。
系统1000可以包括可以实施本文档中描述的各种编解码或编码方法的编解码组件1004。编解码组件1004可以将来自输入1002的视频的平均比特率减小到编解码组件1004的输出,以产生视频的编解码表示。编解码技术因此有时被称为视频压缩或视频转码技术。编解码组件1004的输出可以被存储,或者经由如由组件1006表示的通信连接而发送。在输入1002处接收的视频的存储或通信传送的比特流(或编解码)表示可以由组件1008用于生成像素值或传送到显示接口1010的可显示视频。从比特流表示生成用户可视视频的过程有时被称为视频解压缩。此外,虽然某些视频处理操作被称为“编解码”操作或工具,但是将理解,编解码工具或操作在编码器处被使用,并且反转编解码结果的对应的解码工具或操作将由解码器执行。
外围总线接口或显示接口的示例可以包括通用串行总线(USB)、或高清晰度多媒体接口(HDMI)、或显示端口(Displayport)等。存储接口的示例包括SATA(串行高级技术附件)、PCI、IDE接口等。本文档中描述的技术可以体现在各种电子设备中,诸如移动电话、膝上型电脑、智能电话、或能够执行数字数据处理和/或视频显示的其他设备。
图2是视频处理装置2000的框图。装置2000可以用于实施本文描述的一种或多种方法。装置2000可以体现在智能手机、平板电脑、计算机、物联网(IoT)接收器等中。装置2000可以包括一个或多个处理器2002、一个或多个存储器2004和视频处理硬件2006。(多个)处理器2002可以被配置为实施本文档中(例如,图6-图10中)描述的一种或多种方法。存储器(多个存储器)2004可以用于存储用于实施本文描述的方法和技术的数据和代码。视频处理硬件2006可以用于在硬件电路系统中实施本文档中描述的一些技术。在一些实施例中,硬件2006可以部分或全部在处理器2002(例如,图形处理器)中。
图3是示出可以利用本公开的技术的示例视频编解码系统100的框图。如图3所示,视频编解码系统100可以包括源设备110和目标设备120。源设备110生成编码视频数据,其中该源设备110可以被称为视频编码设备。目标设备120可以解码由源设备110生成的编码视频数据,其中该目标设备120可以被称为视频解码设备。源设备110可以包括视频源112、视频编码器114和输入/输出(I/O)接口116。
视频源112可以包括源,诸如视频捕捉设备、从视频内容提供器接收视频数据的接口、和/或用于生成视频数据的计算机图形系统、或这些源的组合。视频数据可以包括一个或多个图片。视频编码器114对来自视频源112的视频数据进行编码,以生成比特流。比特流可以包括形成视频数据的编解码表示的比特序列。比特流可以包括编解码图片和相关数据。编解码图片是图片的编解码表示。相关数据可以包括序列参数集、图片参数集和其他语法结构。I/O接口116可以包括调制器/解调器(调制解调器)和/或发射器。编码视频数据可以通过网络130a经由I/O接口116直接发送到目标设备120。编码视频数据也可以存储在存储介质/服务器130b上,以供目标设备120访问。
目标设备120可以包括I/O接口126、视频解码器124和显示设备122。
I/O接口126可以包括接收器和/或调制解调器。I/O接口126可以从源设备110或存储介质/服务器130b获取编码视频数据。视频解码器124可以对编码视频数据进行解码。显示设备122可以向用户显示解码视频数据。显示设备122可以与目标设备120集成,或者可以在被配置为与外部显示设备接口的目标设备120的外部。
视频编码器114和视频解码器124可以根据视频压缩标准进行操作,例如高效视频编解码(HEVC)标准、通用视频编解码(VVM)标准和其他当前和/或另外的标准。
图4是示出视频编码器200的示例的框图,该视频编码器200可以是图3所示的系统100中的视频编码器114。
视频编码器200可以被配置为执行本公开的任何或所有技术。在图4的示例中,视频编码器200包括多个功能组件。本公开中描述的技术可以在视频编码器200的各种组件之间共享。在一些示例中,处理器可以被配置为执行本公开中描述的任何或所有技术。
视频编码器200的功能组件可以包括分割单元201、预测单元202(其可以包括模式选择单元203、运动估计单元204、运动补偿单元205和帧内预测单元206)、残差生成单元207、变换单元208、量化单元209、逆量化单元210、逆变换单元211、重构单元212、缓冲区213和熵编码单元214。
在其他示例中,视频编码器200可以包括更多、更少或不同的功能组件。在示例中,预测单元202可以包括帧内块复制(IBC)单元。IBC单元可以执行IBC模式下的预测,其中至少一个参考图片是当前视频块所在的图片。
此外,诸如运动估计单元204和运动补偿单元205的一些组件可以高度集成,但是为了解释的目的,在图4的示例中分开表示。
分割单元201可以将图片分割为一个或多个视频块。视频编码器200和视频解码器300可以支持各种视频块尺寸。
模式选择单元203可以基于误差结果选择编解码模式(例如,帧内或帧间)之一,并且将作为结果的帧内编解码块或帧间编解码块提供给残差生成单元207以生成残差块数据,以及提供给重构单元212以重构编码块以用作参考图片。在一些示例中,模式选择单元203可以选择帧内和帧间预测模式的组合(CIIP),其中预测基于帧间预测信号和帧内预测信号。在帧间预测的情况下,模式选择单元203还可以选择块的运动矢量的分辨率(例如,子像素或整数像素精度)。
为了对当前视频块执行帧间预测,运动估计单元204可以通过将来自缓冲区213的一个或多个参考帧与当前视频块进行比较,来生成当前视频块的运动信息。运动补偿单元205可以基于运动信息和来自缓冲区213的除了与当前视频块相关联的图片之外的图片的解码样点,来确定当前视频块的预测视频块。
运动估计单元204和运动补偿单元205可以对当前视频块执行不同的操作,例如,取决于当前视频块是在I条带、P条带还是B条带中。
在一些示例中,运动估计单元204可以对当前视频块执行单向预测,并且运动估计单元204可以为当前视频块的参考视频块搜索列表0或列表1的参考图片。运动估计单元204然后可以生成指示列表0或列表1中的参考图片的参考索引,该参考索引包含参考视频块和指示当前视频块和参考视频块之间的空域位移的运动矢量。运动估计单元204可以输出参考索引、预测方向指示符和运动矢量作为当前视频块的运动信息。运动补偿单元205可以基于由当前视频块的运动信息指示的参考视频块来生成当前块的预测视频块。
在其他示例中,运动估计单元204可以对当前视频块执行双向预测,运动估计单元204可以在列表0中的参考图片中搜索当前视频块的参考视频块,并且还可以在列表1中搜索当前视频块的另一个参考视频块。运动估计单元204然后可以生成参考索引,该参考索引指示包含参考视频块的列表0和列表1中的参考图片以及指示参考视频块和当前视频块之间的空域位移的运动矢量。运动估计单元204可以输出当前视频块的参考索引和运动矢量作为当前视频块的运动信息。运动补偿单元205可以基于由当前视频块的运动信息指示的参考视频块来生成当前视频块的预测视频块。
在一些示例中,运动估计单元204可以输出完整的运动信息集,以用于解码器的解码处理。
在一些示例中,运动估计单元204可以不输出当前视频的完整的运动信息集。而是运动估计单元204可以参考另一个视频块的运动信息信令通知当前视频块的运动信息。例如,运动估计单元204可以确定当前视频块的运动信息与邻近视频块的运动信息足够相似。
在一个示例中,运动估计单元204可以在与当前视频块相关联的语法结构中指示值,该值向视频解码器300指示当前视频块具有与另一个视频块相同的运动信息。
在另一个示例中,运动估计单元204可以在与当前视频块相关联的语法结构中标识另一视频块和运动矢量差(MVD)。运动矢量差指示当前视频块的运动矢量和所指示的视频块的运动矢量之间的差值。视频解码器300可以使用所指示的视频块的运动矢量和运动矢量差来确定当前视频块的运动矢量。
如上所讨论的,视频编码器200可以预测性地信令通知运动矢量。可以由视频编码器200实施的预测信令通知技术的两个示例包括高级运动矢量预测(AMVP)和Merge模式信令通知。
帧内预测单元206可以对当前视频块执行帧内预测。当帧内预测单元206对当前视频块执行帧内预测时,帧内预测单元206可以基于同一图片中的其他视频块的解码样点来生成当前视频块的预测数据。当前视频块的预测数据可以包括预测视频块和各种语法元素。
残差生成单元207可以通过从当前视频块中减去(例如,由减号指示)当前视频块的(多个)预测视频块来生成当前视频块的残差数据。当前视频块的残差数据可以包括与当前视频块中样点的不同样点分量相对应的残差视频块。
在其他示例中,例如在跳过模式下,对于当前视频块可能没有残差数据,并且残差生成单元207可能不执行减去操作。
变换处理单元208可以通过将一个或多个变换应用于与当前视频块相关联的残差视频块来为当前视频块生成一个或多个变换系数视频块。
在变换处理单元208生成与当前视频块相关联的变换系数视频块之后,量化单元209可以基于与当前视频块相关联的一个或多个量化参数(QP)值来量化与当前视频块相关联的变换系数视频块。
逆量化单元210和逆变换单元211可以分别对变换系数视频块应用逆量化和逆变换,以从变换系数视频块重构残差视频块。重构单元212可以将重构后的残差视频块添加到来自预测单元202生成的一个或多个预测视频块的对应样点,以产生与当前块相关联的重构视频块,用于存储在缓冲区213中。
在重构单元212重构视频块之后,可以执行环路滤波操作,以减少视频块中的视频块效应。
熵编码单元214可以从视频编码器200的其他功能组件接收数据。当熵编码单元214接收到数据时,熵编码单元214可以执行一个或多个熵编码操作,以生成熵编码数据,并输出包括该熵编码数据的比特流。
图5是示出视频解码器300的示例的框图,该视频解码器300可以是图3所示的系统100中的视频解码器114。
视频解码器300可以被配置为执行本公开的任何或所有技术。在图5的示例中,视频解码器300包括多个功能组件。本公开中描述的技术可以在视频解码器300的各种组件之间共享。在一些示例中,处理器可以被配置为执行本公开中描述的任何或所有技术。
在图5的示例中,视频解码器300包括熵解码单元301、运动补偿单元302、帧内预测单元303、逆量化单元304、逆变换单元305、重构单元306和缓冲区307。在一些示例中,视频解码器300可以执行通常与针对视频编码器200(图4)描述的编码过程相反的解码过程。
熵解码单元301可以检索编解码比特流。编解码比特流可以包括熵编解码的视频数据(例如,视频数据的编码块)。熵解码单元301可以解码熵编解码的视频数据,并且根据熵解码的视频数据,运动补偿单元302可以确定包括运动矢量、运动矢量精度、参考图片列表索引和其他运动信息的运动信息。运动补偿单元302可以例如通过执行AMVP和Merge模式来确定这样的信息。
运动补偿单元302可以产生运动补偿块,可以基于插值滤波器执行插值。要以子像素精度使用的插值滤波器的标识符可以包括在语法元素中。
运动补偿单元302可以使用如视频编码器200在视频块的编码期间使用的插值滤波器来计算参考块的子整数像素的插值。运动补偿单元302可以根据所接收的语法信息确定视频编码器200使用的插值滤波器,并使用该插值滤波器来产生预测块。
运动补偿单元302可以使用一些语法信息来确定用于对编码视频序列的(多个)帧和/或(多个)条带进行编码的块的尺寸、描述编码视频序列的图片的每个宏块如何被分割的分割信息、指示每个分割如何被编码的模式、每个帧间编码块的一个或多个参考帧(和参考帧列表)以及用于对编码视频序列进行解码的其他信息。
帧内预测单元303可以使用例如在比特流中接收的帧内预测模式来从空域上相邻的块形成预测块。逆量化单元303对在比特流中提供并由熵解码单元301解码的量化后的视频块系数进行逆量化,即,解量化。逆变换单元303应用逆变换。
重构单元306可以将残差块与由运动补偿单元202或帧内预测单元303生成的对应预测块相加,以形成解码块。如果需要,还可以应用去方块滤波器来滤波解码块,以便移除块效应。解码的视频块然后被存储在缓冲区307中,为随后的运动补偿/帧内预测提供参考块,并且还产生解码的视频以在显示设备上呈现。
图6至图10示出了可以在例如图1至图5中示出的实施例中实施上述技术解决方案的示例方法。
图6示出了视频处理的示例方法600的流程图。方法600包括,在操作610,根据规则,执行视频的当前图片的当前条带和视频的比特流之间的转换,该规则规定图片参数集(PPS)的第一语法元素的值和PPS的第二语法元素的值控制第三语法元素是否包括在比特流中,第一语法元素指示是否对参考PPS的比特流中的编解码图片的双向条带(B条带)启用加权预测,第二语法元素指示与加权预测有关的信息是否存在于参考PPS的编解码图片的图片标头或条带标头中,并且第三语法元素指示与当前条带的参考图片列表1相关联的权重的数量。
图7示出了视频处理的示例方法700的流程图。方法700包括,在操作710,执行视频的当前图片的当前条带和视频的比特流之间的转换,该比特流符合格式规则,其中该格式规则规定指示预测权重是否包括在当前条带的条带标头中的多个语法元素的值基于当前条带的条带类型和当前图片参考的PPS中包括的第一标志的值来推断。
图8示出了视频处理的示例方法800的流程图。方法800包括,在操作810,执行视频的当前图片的当前条带和视频的比特流之间的转换,该比特流符合格式规则,其中该格式规则规定存在通用约束信息语法结构,该通用约束信息语法结构包括指示对于图片集合的条带启用对显式加权预测的约束的一个或多个约束标志。
图9示出了视频处理的示例方法900的流程图。方法900包括,在操作910,根据规则,执行视频的当前图片的当前条带和视频的比特流之间的转换,该规则规定指示对于图片集合的条带启用对显式加权预测的约束的一个或多个约束标志包括在与当前条带相关联的参数集或标头中。
图10示出了视频处理的示例方法1000的流程图。方法1000包括,在操作1010,执行包括当前图片的视频和视频的比特流之间的转换,该比特流符合格式规则,其中该格式规则规定当前图片是否不包括双向条带(B条带)的指示包括在与当前图片相关联的图片标头语法结构中。
接下来提供一些实施例优选的解决方案列表。
A1.一种视频处理方法,包括:根据规则,执行视频的当前图片的当前条带和视频的比特流之间的转换,其中该规则规定图片参数集(PPS)的第一语法元素的值和PPS的第二语法元素的值控制第三语法元素是否包括在比特流中,并且其中第一语法元素指示是否对参考PPS的比特流中的编解码图片的双向条带(B条带)启用加权预测,第二语法元素指示与加权预测有关的信息是否存在于参考PPS的编解码图片的图片标头或条带标头中,并且第三语法元素指示与当前条带的参考图片列表1相关联的权重的数量。
A2.根据解决方案A1所述的方法,其中,第一语法元素为pps_weighted_bipred_flag,第二语法元素为wp_info_in_ph_flag,并且第三语法元素为num_l1_weights。
A3.根据解决方案A1或A2所述的方法,其中,第一语法元素等于0指示对于参考PPS的编解码图片的B条带禁用加权预测。
A4.根据解决方案A1或A2所述的方法,其中,第一语法元素等于1指示对于参考PPS的编解码图片的B条带启用加权预测。
A5.根据解决方案A1或A2所述的方法,其中,当序列参数集(SPS)中包括的第四语法元素等于0时,第一语法元素等于0。
A6.根据解决方案A5所述的方法,其中,第四语法元素为sps_weighted_bipred_flag。
A7.根据解决方案A1或A2所述的方法,其中,第一语法元素等于0指示与参考图片列表1相关联的权重的数量不包括在当前条带的条带标头中。
A8.根据解决方案A1或A2所述的方法,其中,第一语法元素等于1并且第二语法元素等于1指示与参考图片列表1相关联的权重的数量包括在当前条带的条带标头中。
A9.根据解决方案A1至A8中任一项所述的方法,其中,该转换包括从比特流解码视频。
A10.根据解决方案A1至A8中任一项所述的方法,其中,该转换包括将视频编码为比特流。
A11.一种将表示视频的比特流存储到计算机可读记录介质的方法,包括:根据解决方案A1至A8中的任一项或多项中描述的方法从视频生成比特流;以及将比特流存储在计算机可读记录介质中。
A12.一种视频处理装置,包括被配置为实施根据解决方案A1至A11中任一项或多项所述的方法的处理器。
A13.一种其上存储有指令的计算机可读介质,该指令在被执行时使得处理器实施根据解决方案A1至A11中的一项或多项所述的方法。
A14.一种存储比特流的计算机可读介质,其中该比特流根据解决方案A1至A11中的任一项或多项来生成。
A15.一种存储比特流的视频处理装置,其中该视频处理装置被配置为实施根据解决方案A1至A11中任一项或多项所述的方法。
接下来提供一些实施例优选的另一解决方案列表。
B1.一种视频处理方法,包括:执行视频的当前图片的当前条带和视频的比特流之间的转换,其中比特流符合格式规则,并且其中格式规则规定指示预测权重是否包括在当前条带的条带标头中的多个语法元素的值基于当前条带的条带类型和当前图片参考的图片参数集(PPS)中包括的第一标志的值来推断。
B2.根据解决方案B1所述的方法,其中,多个语法元素包括指示与当前条带的参考图片列表0相关联的亮度权重的数量的第一语法元素、指示与当前条带的参考图片列表0相关联的色度权重的数量的第二语法元素、指示与当前条带的参考图片列表1相关联的亮度权重的数量的第三语法元素、以及指示与当前条带的参考图片列表1相关联的色度权重的数量的第四语法元素。
B3.根据解决方案B2所述的方法,其中,第一语法元素为luma_weight_l0_flag[i],第二语法元素为chroma_weight_l0_flag[i],第三语法元素为luma_weight_l1_flag[i],并且第四语法元素为chroma_weight_l1_flag[i],并且其中i是非负整数。
B4.根据解决方案B2或B3所述的方法,其中,第一标志指示是否对于参考PPS的图片启用加权预测,并且其中由于第一标志等于0并且条带类型为单向预测条带(P条带),因此第一语法元素和第二语法元素被推断为0。
B5.根据解决方案B4所述的方法,其中,第一标志为pps_weighted_pred_flag。
B6.根据解决方案B2或B3所述的方法,其中,第一标志指示是否对于参考PPS的图片启用加权双向预测,并且其中由于第一标志等于0并且条带类型为双向条带(B条带),因此第一语法元素和第二语法元素被推断为0。
B7.根据解决方案B2或B3所述的方法,其中,第一标志指示是否对于参考PPS的图片启用加权双向预测,并且其中由于第一标志等于0并且条带类型为双向条带(B条带),因此第三语法元素和第二语法元素被推断为0。
B8.根据解决方案B6或B7所述的方法,其中,第一标志为pps_weighted_bipred_flag。
B9.根据解决方案B6至B8中任一项所述的方法,其中,由于当前图片不包括B条带,因此当前图片参考第一标志等于0的PPS。
B10.根据解决方案B6至B8中任一项所述的方法,其中,由于当前图片不包括B条带,因此当前图片参考第二标志等于0的PPS。
B11.根据解决方案B6至B8中任一项所述的方法,其中,由于第二标志等于0并且当前图片不包括B条带,因此指示与当前条带的参考图片列表1相关联的权重的数量的语法元素的值为0。
B12.根据解决方案B10或B11所述的方法,其中,第二标志指示与加权预测有关的信息是否存在于参考PPS的图片的图片标头或条带标头中。
B13.根据解决方案B10至B12中任一项所述的方法,其中,第二标志为wp_info_in_ph_flag。
B14.根据解决方案B1至B13中任一项所述的方法,其中,该转换包括从比特流解码视频。
B15.根据解决方案B1至B13中任一项所述的方法,其中,该转换包括将视频编码为比特流。
B16.一种将表示视频的比特流存储到计算机可读记录介质的方法,包括:根据解决方案B1至B13中的任一项或多项中描述的方法从视频生成比特流;以及将比特流存储在计算机可读记录介质中。
B17.一种视频处理装置,包括被配置为实施根据解决方案B1至B16中任一项或多项所述的方法的处理器。
B18.一种其上存储有指令的计算机可读介质,该指令在被执行时使得处理器实施根据解决方案B1至B16中的一项或多项所述的方法。
B19.一种存储比特流的计算机可读介质,其中该比特流根据解决方案B1至B16中的任一项或多项来生成。
B20.一种存储比特流的视频处理装置,其中该视频处理装置被配置为实施根据解决方案B1至B16中任一项或多项所述的方法。
接下来提供一些实施例优选的又一解决方案列表。
C1.一种视频处理方法,包括:执行视频的当前图片的当前条带和视频的比特流之间的转换,其中比特流符合格式规则,并且其中格式规则规定存在通用约束信息语法结构,该通用约束信息语法结构包括指示对于图片集合的条带启用对显式加权预测的约束的一个或多个约束标志。
C2.根据解决方案C1所述的方法,其中,一个或多个约束标志包括在比特流中。
C3.根据解决方案C1所述的方法,其中,一个或多个约束标志包括在与当前条带相关联的参数集中。
C4.根据解决方案C1所述的方法,其中,一个或多个约束标志包括在解码器能力信息网络抽象层(NAL)单元中。
C5.根据解决方案C1所述的方法,其中,一个或多个约束标志包括指示显式加权预测是否被应用于图片集合的单向预测条带(P条带)和双向预测条带(B条带)中的一个或两个的第一约束标志,并且其中第一约束标志的值符合与当前条带相关联的序列参数集(SPS)中包括的第二标志的值。
C6.根据解决方案C5所述的方法,其中,第一约束标志为gci_no_explicit_weighted_prediction_constraint_flag。
C7.根据解决方案C5所述的方法,其中,由于第二标志等于1,因此第一约束标志等于0。
C8.根据解决方案C7所述的方法,其中,第二标志为sps_weighted_pred_flag或sps_weighted_bipred_flag。
C9.一种视频处理方法,包括:根据规则,执行视频的当前图片的当前条带和视频的比特流之间的转换,其中该规则规定指示对于图片集合的条带启用对显式加权预测的约束的一个或多个约束标志包括在与当前条带相关联的参数集或标头中。
C10.根据解决方案C9所述的方法,其中,一个或多个约束标志由指示对于单向预测条带(P条带)或双向预测条带(B条带)的显式加权预测的指示是否包括在与当前条带相关联的序列参数集(SPS)中的第一标志组成。
C11.根据解决方案C10所述的方法,其中,第一标志为sps_weighted_pred_flag或sps_weighted_bipred_flag。
C12.根据解决方案C9所述的方法,其中,一个或多个约束标志由指示对于单向预测条带(P条带)或双向预测条带(B条带)的显式加权预测的指示是否包括在与当前条带相关联的图片参数集(PPS)中的第一标志组成。
C13.根据解决方案C12所述的方法,其中,第一标志为pps_weighted_pred_flag或pps_weighted_bipred_flag。
C14.根据解决方案C9所述的方法,其中,一个或多个约束标志包括指示显式加权预测是否被应用于单向预测条带(P条带)和双向预测条带(B条带)中的一个或两个的第一约束标志,并且其中第一约束标志的值符合与当前条带相关联的图片参数集(PPS)中包括的第二约束标志的值。
C15.根据解决方案C9所述的方法,其中,一个或多个约束标志由指示对于单向预测条带(P条带)或双向预测条带(B条带)的显式加权预测的指示是否包括在与当前条带相关联的图片标头或条带标头中的第一标志组成。
C16.根据解决方案C15所述的方法,其中,由于与参考图片列表有关的信息分别包括在图片标头语法结构或条带标头语法结构中,因此该指示包括在图片标头或条带标头中。
C17.根据解决方案C15所述的方法,其中,包括该指示基于与当前视频块相关联的条带的条带类型。
C18.根据解决方案C15所述的方法,其中,包括该指示基于包括帧间条带、P条带或B条带的当前图片。
C19.一种视频处理方法,包括:执行包括当前图片的视频和视频的比特流之间的转换,其中比特流符合格式规则,并且其中格式规则规定当前图片是否不包括双向条带(B条带)的指示包括在与当前图片相关联的图片标头语法结构中。
C20.根据解决方案C19所述的方法,其中,该指示等于1规定当前图片包括一个或多个B条带。
C21.根据解决方案C19所述的方法,其中,该指示等于0规定当前图片不包括B条带。
C22.根据解决方案C20或C21所述的方法,其中,该指示为ph_b_slices_allowed_flag。
C23.根据解决方案C19所述的方法,其中,该指示等于0规定与参考图片列表1有关的语法结构中的语法元素从比特流中排除。
C24.根据解决方案C23所述的方法,其中,该指示为ph_b_slices_allowed_flag,并且其中语法结构为ref_pic_lists()或ref_pic_list_struct()。
C25.根据解决方案C19所述的方法,其中,该指示等于0规定与解析对于运动矢量差值编解码工具的语法结构有关的语法元素从图片标头语法结构中排除。
C26.根据解决方案C19所述的方法,其中,该指示等于0规定与解析对于运动矢量差值编解码工具的语法结构有关的语法元素的值被推断为等于1。
C27.根据解决方案C25或C26所述的方法,其中,该指示为ph_b_slices_allowed_flag,并且其中语法元素为mvd_l1_zero_flag。
C28.根据解决方案C19所述的方法,其中,该指示等于0规定与当前图片中的当前视频块的加权预测有关的语法元素从比特流中排除。
C29.根据解决方案C28所述的方法,其中,该指示为ph_b_slices_allowed_flag,并且其中语法元素为num_l1_weights。
C30.根据解决方案C19所述的方法,其中,该指示等于0规定与和当前图片相关联的参考图片列表的最大参考索引有关的语法元素从条带标头语法结构中排除。
C31.根据解决方案C30所述的方法,其中,该指示为ph_b_slices_allowed_flag,并且其中语法元素为num_ref_idx_active_minus1。
C32.根据解决方案C19所述的方法,其中,该指示等于0规定与用于从与当前图片相关联的参考图片列表0推导的当前图片中的当前视频块的时域运动矢量预测的共位条带有关的语法元素从条带标头语法结构中排除。
C33.根据解决方案C32所述的方法,其中,该指示为ph_b_slices_allowed_flag,并且其中语法元素为slice_collocated_from_l0_flag。
C34.根据解决方案C1至C33中任一项所述的方法,其中,该转换包括从比特流解码视频。
C35.根据解决方案C1至C33中任一项所述的方法,其中,该转换包括将视频编码为比特流。
C36.一种将表示视频的比特流存储到计算机可读记录介质的方法,包括:根据解决方案C1到C33中的任一项或多项中描述的方法从视频生成比特流;以及将比特流存储在计算机可读记录介质中。
C37.一种视频处理装置,包括被配置为实施根据解决方案C1至C36中任一项或多项所述的方法的处理器。
C38.一种其上存储有指令的计算机可读介质,该指令在被执行时使得处理器实施根据解决方案C1至C36中的一项或多项所述的方法。
C39.一种存储比特流的计算机可读介质,其中该比特流根据解决方案C1至C36中的任一项或多项来生成。
C40.一种存储比特流的视频处理装置,其中该视频处理装置被配置为实施根据解决方案C1至C36中任一项或多项所述的方法。
接下来提供一些实施例优选的又一解决方案列表。
P1.一种视频处理方法,包括:执行视频的视频区域和视频的编解码表示之间的转换,其中编解码表示符合格式规则,其中格式规则规定指示对于视频区域启用加权预测的第一字段的值控制指示与和视频区域的转换相关联的参考图片列表相关联的权重的数量的第二字段。
P2.根据解决方案P1所述的方法,其中,在第一字段指示加权预测被禁用的情况下,格式规则规定第二字段从编解码表示中排除。
P3.根据解决方案P1或P2所述的方法,其中,指示与参考图片列表相关联的权重的数量的第二字段指示亮度权重。
P4.根据解决方案P1至P3中任一项所述的方法,其中,指示与参考图片列表相关联的权重的数量的第二字段指示色度权重。
P5.根据解决方案P1至P4中任一项所述的方法,其中,参考图片列表对应于参考图片列表1。
P6.根据解决方案P1至P5中任一项所述的方法,其中,视频区域对应于双向条带(B条带)。
P7.根据解决方案P1至P5中任一项所述的方法,其中,视频区域对应于单向预测条带(P条带)。
P8.一种视频处理方法,包括:执行包括一个或多个视频图片的视频和视频的编解码表示之间的转换,其中编解码表示符合格式规则,其中格式规则规定视频图片的图片标头中的语法元素指示视频图片是否包括作为双向预测条带或双向预测(B条带)的条带。
P9.根据解决方案P8所述的方法,其中,语法元素是单比特标志。
P10.根据解决方案P8或P9所述的方法,其中,在第一字段指示视频图片包括0个B条带的情况下,格式规则还排除与第二参考图片列表(参考图片列表1)有关的语法元素。
P11.根据解决方案P10所述的方法,其中,与第二参考图片列表有关的语法元素来自图片标头。
P12.根据解决方案P10所述的方法,其中,语法元素包括与对于使用第二参考图片列表的权重参数有关的语法元素。
P13.根据上述权利要求中任一项所述的方法,其中,视频区域包括视频编解码单元。
P14.根据上述权利要求中任一项所述的方法,其中,视频区域包括视频图片。
P15.根据解决方案P1至P14中任一项所述的方法,其中,该转换包括将视频编码为编解码表示。
P16.根据解决方案P1至P14中任一项所述的方法,其中,该转换包括对编解码表示进行解码以生成视频的像素值。
P17.一种视频解码装置,包括被配置为实施根据解决方案P1至P16中的一项或多项所述的方法的处理器。
P18.一种视频编码装置,包括被配置为实施根据解决方案P1至P16中的一项或多项所述的方法的处理器。
P19.一种其上存储有计算机代码的计算机程序产品,该代码在由处理器执行时使得处理器实施根据解决方案P1至P16中任一项所述的方法。
P20.一种本文档中描述的方法、装置或系统。
在本文档中,术语“视频处理”可以指视频编码、视频解码、视频压缩或视频解压缩。例如,在从视频的像素表示到对应的比特流表示的转换期间,可以应用视频压缩算法,反之亦然。如语法所定义的,当前视频块的比特流表示(或简称为比特流)可以例如对应于共位或者散布在比特流内的不同地方的比特。例如,可以按照变换和编解码的误差残差值并且还使用比特流中的标头和其他字段中的比特对宏块进行编码。
本文档中描述的所公开的以及其他解决方案、示例、实施例、模块和功能操作可以在数字电子电路中、或者在计算机软件、固件或硬件(包括本文档中公开的结构及其结构等同物)中、或者在它们中的一个或多个的组合中被实施。所公开的以及其他实施例可以被实施为一个或多个计算机程序产品,即在计算机可读介质上编码的计算机程序指令的一个或多个模块,该计算机程序指令用于由数据处理装置运行或控制数据处理装置的操作。计算机可读介质可以是机器可读存储设备、机器可读存储基板、存储器设备、影响机器可读传播信号的物质的组合、或它们中的一个或多个的组合。术语“数据处理装置”包含用于处理数据的所有装置、设备和机器,包括例如可编程处理器、计算机、或多个处理器或计算机。除了硬件之外,装置还可以包括为所讨论的计算机程序创建运行环境的代码,例如,构成处理器固件、协议栈、数据库管理系统、操作系统、或它们中的一个或多个的组合的代码。传播信号是被生成以对信息进行编码以用于发送到合适的接收器装置的人工生成的信号,例如机器生成的电信号、光学信号或电磁信号。
计算机程序(也已知为程序、软件、软件应用、脚本或代码)可以以任何形式的编程语言(包括编译或解释语言)编写,并且其可以以任何形式部署,包括作为独立程序或作为适合在计算环境中使用的模块、组件、子例程或其他单元。计算机程序不一定对应于文件系统中的文件。程序可以存储在保存其他程序或数据(例如,存储在标记语言文档中的一个或多个脚本)的文件的一部分中,存储在专用于所讨论的程序的单个文件中,或存储在多个协调文件中(例如,存储一个或多个模块、子程序或代码部分的文件)。计算机程序可以被部署以在一个计算机上或在位于一个站点上或跨多个站点分布并通过通信网络互连的多个计算机上运行。
本文档书中描述的过程和逻辑流程可以由运行一个或多个计算机程序的一个或多个可编程处理器执行,以通过对输入数据进行操作并生成输出来执行功能。过程和逻辑流程也可以由专用逻辑电路执行,并且装置也可以被实施为专用逻辑电路,例如,FPGA(现场可编程门阵列)或ASIC(专用集成电路)。
适合于运行计算机程序的处理器包括例如通用和专用微处理器、以及任何类型的数字计算机的任何一个或多个处理器。通常,处理器将从只读存储器或随机存取存储器或两者接收指令和数据。计算机的基本元件是用于执行指令的处理器和用于存储指令和数据的一个或多个存储器设备。通常,计算机还将包括用于存储数据的一个或多个大容量存储设备(例如,磁盘、磁光盘或光盘),或可操作地耦合以从该一个或多个大容量存储设备接收数据或向该一个或多个大容量存储设备传递数据、或者从其接收数据并向其传递数据。然而,计算机不需要这样的设备。适用于存储计算机程序指令和数据的计算机可读介质包括所有形式的非易失性存储器、介质和存储器设备,包括例如半导体存储器设备,例如EPROM、EEPROM和闪存设备;磁盘,例如内部硬盘或可换式盘;磁光盘;以及CD ROM和DVD-ROM盘。处理器和存储器可以由专用逻辑电路补充或并入专用逻辑电路中。
虽然本专利文档包含许多细节,但这些细节不应被解释为对任何主题或可能要求保护的范围的限制,而是作为指定于特定技术的特定实施例的特征的描述。在本专利文档中在单独的实施例的上下文中描述的某些特征也可以在单个实施例中组合实施。相反,在单个实施例的上下文中描述的各种特征也可以分别在多个实施例中或以任何合适的子组合实施。此外,尽管特征可以在上面描述为以某些组合起作用并且甚至最初如此要求保护,但是在一些情况下可以从组合排除来自所要求保护的组合的一个或多个特征,并且所要求保护的组合可以针对子组合或子组合的变化。
类似地,虽然在附图中以特定顺序描绘了操作,但是这不应该被理解为需要以所示的特定顺序或以先后顺序执行这样的操作或者执行所有示出的操作以实现期望的结果。此外,在本专利文档中描述的实施例中的各种系统组件的分离不应被理解为在所有实施例中都需要这样的分离。
仅描述了一些实施方式和示例,并且可以基于本专利文档中描述和示出的内容来进行其他实施方式、增强和变化。

Claims (20)

1.一种视频处理方法,包括:
执行视频的当前图片的当前条带和所述视频的比特流之间的转换,
其中,所述比特流符合格式规则,并且
其中,所述格式规则规定指示预测权重是否包括在所述当前条带的条带标头中的多个语法元素的值基于所述当前条带的条带类型和所述当前图片参考的图片参数集PPS中包括的第一标志的值来推断。
2.根据权利要求1所述的方法,其中,所述多个语法元素包括指示与所述当前条带的参考图片列表0相关联的亮度权重的数量的第一语法元素、指示与所述当前条带的参考图片列表0相关联的色度权重的数量的第二语法元素、指示与所述当前条带的参考图片列表1相关联的亮度权重的数量的第三语法元素、以及指示与所述当前条带的参考图片列表1相关联的色度权重的数量的第四语法元素。
3.根据权利要求2所述的方法,其中,所述第一语法元素为luma_weight_l0_flag[i],所述第二语法元素为chroma_weight_l0_flag[i],所述第三语法元素为luma_weight_l1_flag[i],并且所述第四语法元素为chroma_weight_l0_flag[i],并且其中i是非负整数。
4.根据权利要求2或3所述的方法,其中,所述第一标志指示是否对于参考所述PPS的图片启用加权预测,并且其中由于所述第一标志等于0并且所述条带类型为单向预测P条带,所述第一语法元素和所述第二语法元素推断为0。
5.根据权利要求4所述的方法,其中,所述第一标志为pps_weighted_pred_flag。
6.根据权利要求2或3所述的方法,其中,所述第一标志指示是否对于参考所述PPS的图片启用加权双向预测,并且其中由于所述第一标志等于0并且所述条带类型为双向B条带,所述第一语法元素和所述第二语法元素推断为0。
7.根据权利要求2或3所述的方法,其中,所述第一标志指示是否对于参考所述PPS的图片启用加权双向预测,并且其中由于所述第一标志等于0并且所述条带类型为双向B条带,所述第三语法元素和所述第二语法元素推断为0。
8.根据权利要求6或7所述的方法,其中,所述第一标志为pps_weighted_bipred_flag。
9.根据权利要求6至8中任一项所述的方法,其中,由于所述当前图片排除B条带,所述当前图片参考所述第一标志等于0的所述PPS。
10.根据权利要求6至8中任一项所述的方法,其中,由于所述当前图片排除B条带,所述当前图片参考第二标志等于0的所述PPS。
11.根据权利要求6至8中任一项所述的方法,其中,由于第二标志等于0并且所述当前图片排除B条带,指示与所述当前条带的参考图片列表1相关联的权重的数量的语法元素的值为0。
12.根据权利要求10或11所述的方法,其中,所述第二标志指示与加权预测相关的信息是否存在于参考所述PPS的图片的图片标头或条带标头中。
13.根据权利要求10至12中任一项所述的方法,其中,所述第二标志为wp_info_in_ph_flag。
14.根据权利要求1至13中任一项所述的方法,其中,所述转换包括从所述比特流解码所述视频。
15.根据权利要求1至13中任一项所述的方法,其中,所述转换包括将所述视频编码成所述比特流。
16.一种将表示视频的比特流存储到计算机可读记录介质的方法,包括:
根据权利要求1至13中的任一项或多项中描述的方法从所述视频生成所述比特流;以及
将所述比特流存储在所述计算机可读记录介质中。
17.一种视频处理装置,包括:
处理器,配置为实施根据权利要求1至16中任一项或多项所述的方法。
18.一种其上存储有指令的计算机可读介质,其中,所述指令被执行时使得处理器实施根据权利要求1至16中的一项或多项所述的方法。
19.一种存储比特流的计算机可读介质,其中所述比特流根据权利要求1至16中的任一项或多项生成。
20.一种存储比特流的视频处理装置,其中所述视频处理装置配置为实施根据权利要求1至16中任一项或多项所述的方法。
CN202180015696.3A 2020-02-19 2021-01-26 推断比特流中的视频分量的权重值 Pending CN115136598A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202062978740P 2020-02-19 2020-02-19
US62/978,740 2020-02-19
PCT/US2021/015011 WO2021167757A1 (en) 2020-02-19 2021-01-26 Inferencing weight values for video components in a bitstream

Publications (1)

Publication Number Publication Date
CN115136598A true CN115136598A (zh) 2022-09-30

Family

ID=77392034

Family Applications (3)

Application Number Title Priority Date Filing Date
CN202180015883.1A Pending CN115152207A (zh) 2020-02-19 2021-01-26 比特流的通用约束信息中的预测权重的信令通知
CN202180015818.9A Pending CN115136606A (zh) 2020-02-19 2021-01-26 参考图片列表的权重的信令通知
CN202180015696.3A Pending CN115136598A (zh) 2020-02-19 2021-01-26 推断比特流中的视频分量的权重值

Family Applications Before (2)

Application Number Title Priority Date Filing Date
CN202180015883.1A Pending CN115152207A (zh) 2020-02-19 2021-01-26 比特流的通用约束信息中的预测权重的信令通知
CN202180015818.9A Pending CN115136606A (zh) 2020-02-19 2021-01-26 参考图片列表的权重的信令通知

Country Status (9)

Country Link
US (4) US12041257B2 (zh)
EP (3) EP4091322A4 (zh)
JP (4) JP7410316B2 (zh)
KR (3) KR20220138053A (zh)
CN (3) CN115152207A (zh)
AR (3) AR121198A1 (zh)
BR (1) BR112022016529A2 (zh)
MX (1) MX2022009920A (zh)
WO (3) WO2021167757A1 (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MX2022007348A (es) * 2019-12-20 2022-09-23 Lg Electronics Inc Metodo y dispositivo de codificacion de imagenes/video con base en prediccion ponderada.
KR20220097511A (ko) * 2019-12-20 2022-07-07 엘지전자 주식회사 예측 가중 테이블 기반 영상/비디오 코딩 방법 및 장치
CN115152218A (zh) * 2020-02-28 2022-10-04 华为技术有限公司 简化条带头语法元素指示的编码器、解码器及对应方法
JP7475908B2 (ja) 2020-03-17 2024-04-30 シャープ株式会社 予測画像生成装置、動画像復号装置及び動画像符号化装置
WO2023171912A1 (ko) * 2022-03-07 2023-09-14 현대자동차주식회사 비디오 프레임 경계에서의 예측블록 생성
WO2023219288A1 (ko) * 2022-05-12 2023-11-16 현대자동차주식회사 양방향 예측을 이용하는 크로마 성분의 인터 예측을 위한 방법

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2435757C (en) * 2001-11-29 2013-03-19 Matsushita Electric Industrial Co., Ltd. Video coding distortion removal method and apparatus using a filter
PL2008460T3 (pl) * 2006-03-30 2017-10-31 Lg Electronics Inc Sposób i urządzenie do dekodowania/kodowania sygnału wideo
US9736476B2 (en) * 2012-04-27 2017-08-15 Qualcomm Incorporated Full random access from clean random access pictures in video coding
US9838685B2 (en) * 2012-06-15 2017-12-05 Google Technology Holdings LLC Method and apparatus for efficient slice header processing
EP2869560A4 (en) * 2012-06-29 2016-09-07 Sony Corp DEVICE AND METHOD OF ENCODING
US9313500B2 (en) * 2012-09-30 2016-04-12 Microsoft Technology Licensing, Llc Conditional signalling of reference picture list modification information
US20140198846A1 (en) 2013-01-16 2014-07-17 Qualcomm Incorporated Device and method for scalable coding of video information
US9497473B2 (en) * 2013-10-03 2016-11-15 Qualcomm Incorporated High precision explicit weighted prediction for video coding
CN106664424A (zh) * 2014-01-03 2017-05-10 诺基亚技术有限公司 参数集编码
US9918105B2 (en) * 2014-10-07 2018-03-13 Qualcomm Incorporated Intra BC and inter unification
WO2016138513A1 (en) * 2015-02-27 2016-09-01 Arris Enterprises, Inc. Modification of unification of intra block copy and inter signaling related syntax and semantics
US10834419B2 (en) * 2016-04-13 2020-11-10 Qualcomm Incorporated Conformance constraint for collocated reference index in video coding
US20180332298A1 (en) * 2017-05-10 2018-11-15 Futurewei Technologies, Inc. Bidirectional Prediction In Video Compression
CN117692636A (zh) * 2018-10-27 2024-03-12 华为技术有限公司 图像预测方法及装置
KR102679376B1 (ko) 2019-08-22 2024-06-27 엘지전자 주식회사 가중 예측을 수행하는 영상 부호화/복호화 방법, 장치 및 비트스트림을 전송하는 방법
JP7423758B2 (ja) 2019-09-06 2024-01-29 ホアウェイ・テクノロジーズ・カンパニー・リミテッド 重み付き予測のための高レベルシグナリングの方法および装置
EP4029261A4 (en) 2019-10-07 2022-11-23 Huawei Technologies Co., Ltd. METHOD AND APPARATUS FOR ADAPTIVE WEIGHTING PREDICTION PARAMETER PRECISION ADJUSTMENT FOR HARMONIZING NON-RECTANGULAR FUSION MODE AND WEIGHTED PREDICTION
US11758193B2 (en) 2019-11-04 2023-09-12 Hfi Innovation Inc. Signaling high-level information in video and image coding
JP7448349B2 (ja) 2019-12-17 2024-03-12 シャープ株式会社 動画像復号装置
KR20220097512A (ko) 2019-12-20 2022-07-07 엘지전자 주식회사 영상/비디오 인코딩/디코딩 방법 및 이를 이용하는 장치
WO2021125701A1 (ko) 2019-12-20 2021-06-24 엘지전자 주식회사 인터 예측 기반 영상/비디오 코딩 방법 및 장치
KR20220097511A (ko) 2019-12-20 2022-07-07 엘지전자 주식회사 예측 가중 테이블 기반 영상/비디오 코딩 방법 및 장치
CN115988219B (zh) 2020-01-12 2024-01-16 华为技术有限公司 使用非矩形融合模式协调加权预测的方法和装置
CA3167876A1 (en) 2020-01-13 2021-07-22 Lg Electronics Inc. Method and device for weighted prediction for image/video coding
AU2021201606A1 (en) 2020-01-14 2022-08-11 Huawei Technologies Co., Ltd. Method and apparatus of signaling the number of candidates for merge mode
US11405649B2 (en) 2020-02-18 2022-08-02 Mediatek Inc. Specifying slice chunks of a slice within a tile
US20210392337A1 (en) 2020-06-10 2021-12-16 Kt Corporation Method and apparatus for encoding/decoding a video signal based on weighted prediction, and a recording medium storing a bitstream

Also Published As

Publication number Publication date
KR20220143023A (ko) 2022-10-24
JP7410315B2 (ja) 2024-01-09
EP4091327A4 (en) 2023-05-03
AR121198A1 (es) 2022-04-27
JP2023514774A (ja) 2023-04-10
US20220400278A1 (en) 2022-12-15
WO2021167758A1 (en) 2021-08-26
JP7410317B2 (ja) 2024-01-09
US20240107047A1 (en) 2024-03-28
EP4091322A4 (en) 2023-04-26
WO2021167755A1 (en) 2021-08-26
JP2023514772A (ja) 2023-04-10
US11863781B2 (en) 2024-01-02
EP4091322A1 (en) 2022-11-23
CN115136606A (zh) 2022-09-30
BR112022016529A2 (pt) 2022-10-11
US20220400279A1 (en) 2022-12-15
US12041257B2 (en) 2024-07-16
US20220400290A1 (en) 2022-12-15
MX2022009920A (es) 2022-09-09
JP2024026463A (ja) 2024-02-28
WO2021167757A1 (en) 2021-08-26
AR121196A1 (es) 2022-04-27
KR20220143030A (ko) 2022-10-24
CN115152207A (zh) 2022-10-04
EP4091327A1 (en) 2022-11-23
AR121197A1 (es) 2022-04-27
KR20220138053A (ko) 2022-10-12
EP4091328A1 (en) 2022-11-23
EP4091328A4 (en) 2023-05-03
JP7410316B2 (ja) 2024-01-09
JP2023514773A (ja) 2023-04-10

Similar Documents

Publication Publication Date Title
US12041257B2 (en) Signalling of weights of a reference picture list
WO2021180163A1 (en) Adaptation parameter set signaling based on color format
WO2021169969A1 (en) Conditional signaling of syntax elements in a picture header
WO2021197447A1 (en) Controlling quantization parameter delta signaling
CN115804091A (zh) 访问单元分隔符,以及视频编解码中的通用约束信息
CN115699742A (zh) 子图片相关的语法元素的信令通知和推断
JP7540871B2 (ja) 一般制約フラグのシグナリング
EP4128775A1 (en) Conditional signaling of video coding syntax elements
CN115428457A (zh) 基于颜色格式的自适应参数集的约束
CN115486067A (zh) 视频图片标头中的滤波器参数信令通知

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination