CN116671101A - 编解码视频中量化信息的信令通知 - Google Patents

编解码视频中量化信息的信令通知 Download PDF

Info

Publication number
CN116671101A
CN116671101A CN202180044716.XA CN202180044716A CN116671101A CN 116671101 A CN116671101 A CN 116671101A CN 202180044716 A CN202180044716 A CN 202180044716A CN 116671101 A CN116671101 A CN 116671101A
Authority
CN
China
Prior art keywords
video
value
picture
equal
syntax element
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180044716.XA
Other languages
English (en)
Inventor
邓智玭
王业奎
张莉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Douyin Vision Co Ltd
ByteDance Inc
Original Assignee
Douyin Vision Co Ltd
ByteDance Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Douyin Vision Co Ltd, ByteDance Inc filed Critical Douyin Vision Co Ltd
Publication of CN116671101A publication Critical patent/CN116671101A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

描述了视频编码方法和装置以及视频解码方法和装置的示例。视频处理的示例方法包括根据规则执行视频的当前图片和视频的比特流之间的转换。规则规定响应于当前图片是恢复图片顺序计数POC计数为0的逐渐解码刷新GDR图片,当前图片是恢复点图片。恢复POC计数规定输出顺序中的解码图片的恢复点。

Description

编解码视频中量化信息的信令通知
相关申请的交叉引用
根据巴黎公约适用的专利法和/或规则,提出本申请是为了及时要求2020年6月22日提交的PCT专利申请No.PCT/CN2020/097390的优先权和权益。出于法律规定的所有目的,上述申请的全部公开内容通过引用并入作为本申请的公开内容的部分。
技术领域
该专利文档涉及图像和视频编码和解码。
背景技术
数字视频占互联网和其他数字通信网络上最大的带宽使用。随着能够接收和显示视频的连接用户设备数量的增加,预计数字视频使用的带宽需求将继续增长。
发明内容
本文档公开了视频编码器和解码器可以用来执行视频编码或解码的技术。
在一个示例方面,公开了一种处理视频数据的方法。该方法包括根据规则执行视频的当前图片和视频的比特流之间的转换。规则规定响应于当前图片是恢复图片顺序计数(POC)计数为0的逐渐解码刷新(GDR)图片,当前图片是恢复点图片。恢复POC计数规定输出顺序中的解码图片的恢复点。
在另一个示例方面,公开了一种处理视频数据的方法。该方法包括根据规则执行视频和视频的比特流之间的转换。规则规定通用约束信息(GCI)语法结构的语法元素指示与即时解码刷新(IDR)图片和混合网络抽象层(NAL)单元类型的使用相关联的参考图片列表。
在另一个示例方面,公开了一种处理视频数据的方法。该方法包括执行包括当前视频块的视频和视频的比特流之间的转换。根据规则,规定与当前视频块的转换相关联的量化参数(QP)表中的点数的第一语法元素的属性取决于一个或多个其它语法元素。
在另一个示例方面,公开了一种处理视频数据的方法。该方法包括执行视频和视频的比特流之间的转换。比特流符合规则,该规则规定输入量化参数(QP)值和输出QP值在-QpBdOffset到K的范围内。QpBdOffset规定亮度和色度量化参数范围偏移的值,并且K与最大允许QP值相关联。
在另一个示例方面,公开了一种视频处理方法。该方法包括执行视频和视频的编解码表示之间的转换,其中编解码表示符合格式规则,其中格式规则规定指示参考图片重采样对对应视频段的适用性的语法字段的使用。
在另一个示例方面,公开了另一种视频处理方法。该方法包括执行视频和该视频的编解码表示之间的转换,其中该编解码表示符合格式规则,其中该格式规则规定基于对应于访问单元分隔符的第二语法元素的值来约束图片标头或条带标头中的第一语法元素的值。
在另一个示例方面,公开了另一种视频处理方法。该方法包括执行视频和视频的编解码表示之间的转换,其中编解码表示符合格式规则,其中格式规则规定是否以及如何包括通用约束信息字段中的一个或多个语法元素。
在又一个示例方面,公开了一种视频编码器装置。视频编解码器包括配置成实现上述方法的处理器。
在又一个示例方面,公开了一种视频解码器装置。视频解码器包括配置成实现上述方法的处理器。
在又一个示例方面,公开了一种其上存储有代码的计算机可读介质。该代码以处理器可执行代码的形式体现这里描述的方法之一。
这些和其他特征在本文档中进行了描述。
附图说明
图1是示出了根据本公开的一些实施例的视频编解码系统的框图。
图2是用于视频处理的示例硬件平台的框图。
图3是视频处理的示例方法的流程图。
图4是示出了示例视频编解码系统的框图。
图5是示出了根据本公开的一些实施例的编码器的框图。
图6是示出了根据本公开的一些实施例的解码器的框图。
图7是根据本技术的一个或多个实施例的处理视频数据的方法的流程图表示。
图8是根据本技术的一个或多个实施例的处理视频数据的另一方法的流程图表示。
图9是根据本技术的一个或多个实施例的处理视频数据的另一方法的流程图表示。
图10是根据本技术的一个或多个实施例的处理视频数据的又一方法的流程图表示。
具体实施方式
本文档中使用章节标题是为了易于理解并且不将各章节中公开的技术和实施例的适用性仅限制于该章节。此外,在一些描述中使用H.266术语仅仅是为了易于理解,而不是为了限制所公开技术的范围。因此,本文描述的技术也适用于其他视频编解码器协议和设计。
1.概述
本公开涉及视频编解码技术。具体来说,它是关于参考图片重采样(RPR)标志变量的推导,访问限制分隔符(AUD)和语法元素之间的关系,以及视频编解码中的其他NAL单元中的视频编解码中的通用约束信息(GCI)的信令通知。该思想可以单独或以各种组合应用于支持多层视频编解码的任何视频编解码标准或非标准视频编解码器,例如正在开发的多功能视频编解码(VVC)。
2.缩写
APS 自适应参数集
AU 访问单元
AUD 访问单元分隔符
AVC 高级视频编解码
CLVS 编解码层视频序列
CPB 编解码图片缓冲器
CRA 清洁随机访问
CTU 编解码树单元
CVS 编解码视频序列
DPB 解码图片缓冲器
DPS 解码参数集
EOB 比特流结束
EOS 序列结束
GCI 通用约束信息
GDR 逐渐解码刷新
HEVC 高效视频编解码
HRD 假设参考解码器
IDR 即时解码刷新
IRAP 帧内随机访问点
JEM 联合探索模型
MCTS 运动约束的片集
NAL 网络抽象层
OLS 输出层集
PH 图片标头
POC 图片顺序计数
PPS 图片参数集
PTL 档次、层次、级别
PU 图片单元
RRP 参考图片重采样
RBSP 原始字节序列有效负载
SE 语法元素
SEI 补充增强信息
SH 条带标头
SPS 序列参数集
SVC 可缩放视频编解码
VCL 视频编解码层
VPS 视频参数集
VTM VVC测试模型
VUI 视频可用性信息
VVC 多功能视频编解码3.视频编解码介绍
视频编解码标准主要是通过众所周知的ITU-T和ISO/IEC标准的发展而得以演进。ITU-T制作了H.261和H.263标准,ISO/IEC制作了MPEG-1和MPEG-4Visual标准,并且两个组织联合制作了H.262/MPEG-2视频标准和H.264/MPEG-4高级视频编解码(AVC)标准和H.265/HEVC标准。从H.262开始,视频编解码标准基于混合视频编解码结构,其中利用时域预测加变换编解码。为了探索HEVC之外的未来视频编解码技术,由VCEG和MPEG于2015年联合成立联合视频探索团队(JVET)。从那时起,JVET采用了许多新方法并将其纳入名为联合探索模型(JEM)的参考软件。JVET会议每季度同时举行一次,新编解码标准的目标是与HEVC相比降低50%比特率。新的视频编解码标准在2018年4月的JVET会议上被正式命名为多功能视频编码(VVC),并且第一版VVC测试模型(VTM)也在当时发布。随着VVC标准化的不断努力,新的编解码技术在每次JVET会议上都被采用到VVC标准中。VVC的工作草案和测试模型VTM在每次会议后都会更新。VVC项目现在的目标是在2020年7月的会议上技术完成(FDIS)。
3.1.序列内的图片分辨率变化
在AVC和HEVC中,图片的空域分辨率不能改变,除非使用新SPS的新序列以IRAP图片开始。VVC允许在不编码IRAP图片的位置改变序列内的图片分辨率,IRAP图片总是被帧内编解码。此特征有时称为参考图片重采样(RPR),因为当参考图片具有与正在解码的当前图片不同的分辨率时,该特征需要对用于帧间预测的参考图片进行重采样。
缩放比率被限制为大于或等于1/2(从参考图片到当前图片的2倍下采样),并且小于或等于8(8倍上采样)。规定了具有不同频率截止的三组重采样滤波器来处理参考图片和当前图片之间的各种缩放比率。三组重采样滤波器分别应用于范围从1/2到1/1.75、从1/1.75到1/1.25和从1/1.25到8的缩放比率。每组重采样滤波器具有用于亮度的16个相位和用于色度的32个相位,这与运动补偿插值滤波器的情况相同。实际上正常的MC插值过程是重采样过程的一种特殊情况,其中缩放比率范围从1/1.25到8。水平和垂直缩放比率是基于图片宽度和高度以及为参考图片和当前图片规定的左、右、顶部和底部缩放偏移而推导的。
与HEVC不同的支持此功能的VVC设计的其他方面包括:i)在PPS中而不是在SPS中信令通知图片分辨率和对应的一致性窗口,而在SPS中信令通知最大图片分辨率。ii)对于单层比特流,每个图片存储(DPB中用于存储一个解码图片的槽)占用存储具有最大图片分辨率的解码图片所需的缓冲器尺寸。3.2.通用和VVC中的可缩放视频编解码(SVC)
可缩放视频编解码(SVC,有时也称为视频编解码中的可缩放性)是指使用基础层(BL)(有时称为参考层(RL))和一个或多个可缩放增强层(EL)的视频编解码。在SVC中,基础层可以携带具有基础质量级别的视频数据。一个或多个增强层可以携带额外的视频数据以支持例如更高的空域、时域和/或信噪比(SNR)级别。可以相对于先前编码的层来定义增强层。例如,底层可以用作BL,而顶层可以用作EL。中间层可以用作EL或RL,或两者兼而有之。例如,中间层(例如,既不是最低层也不是最高层的层)可以是中间层下方的层(例如基础层或任何居间的增强层)的EL,并且同时用作中间层上方的一个或多个增强层的RL。类似地,在HEVC标准的Multiview或3D扩展中,可能存在多个视图,并且一个视图的信息可以用于编解码(例如,编码或解码)另一个视图的信息(例如,运动估计、运动矢量预测和/或其他冗余)。
在SVC中,编码器或解码器使用的参数基于它们可以在其中使用的编解码级别(例如,视频级别、序列级别、图片级别、条带级别等)被分组成参数集。例如,可以由比特流中不同层的一个或多个编解码视频序列使用的参数可以包括在视频参数集(VPS)中,并且可以由编解码视频序列中的一个或多个图片使用的参数包含在序列参数集(SPS)中。类似地,由图片中的一个或多个条带使用的参数可以包括在图片参数集(PPS)中,并且特定于单个条带的其他参数可以包括在条带标头中。类似地,可以在各种编解码级别提供特定层在给定时间使用哪个(哪些)参数集的指示。
由于VVC中对参考图片重采样(RPR)的支持,可以在不需要任何额外的信令通知处理级别编解码工具的情况下设计对包含多层的比特流的支持,例如,在VVC中具有SD和HD分辨率的两个层,因为空域可缩放性支持所需的上采样可仅使用RPR上采样滤波器。然而,为了支持可缩放性,需要高级别的语法变化(与不支持可缩放性相比)。VVC版本1中规定了可缩放性支持。与任何早期视频编解码标准中的可缩放性支持不同,包括AVC和HEVC的扩展,VVC可缩放性的设计已尽可能地对单层解码器设计友好。多层比特流的解码能力是以好像比特流中只有单层的方式来规定的。例如,以独立于要解码的比特流中的层的数量的方式规定诸如DPB尺寸的解码能力。基本上,为单层比特流设计的解码器不需要太多改变就能够解码多层比特流。与AVC和HEVC的多层扩展的设计相比,HLS方面在牺牲一些灵活性的情况下得到了显著简化。例如,IRAPAU需要包含CVS中存在的每个层的图片。
3.3.参数集
AVC、HEVC和VVC规定参数集。参数集的类型包括SPS、PPS、APS和VPS。所有AVC、HEVC和VVC都支持SPS和PPS。VPS是从HEVC开始引入的,并且包含在HEVC和VVC两者中。APS未包含在AVC或HEVC中,但包含在最新的VVC草案文本中。
SPS被设计为携带序列级别标头信息,并且PPS被设计为携带不经常变化的图片级别标头信息。使用SPS和PPS,不需要为每个序列或图片重复不经常变化的信息,因此可以避免该信息的冗余信令通知。此外,使用SPS和PPS实现了重要标头信息的带外传输,从而不仅避免了冗余传输的需要,而且还提高了错误恢复能力。
引入VPS是为了携带多层比特流中所有层共同的序列级别标头信息。
引入APS是为了携带这样的图片级别或条带级别信息,这些信息需要相当多的位进行编解码,可以由多个图片共享,并且在序列中可以有很多不同的变化。
3.4.RPR相关语法元素的语义和变量标志
RPR相关语法元素的语义和变量flag的推导在最新的VVC草案文本中如下:
7.4.3.3序列参数集RBSP语义
...
sps_ref_pic_resampling_enabled_flag等于1规定启用参考图片重采样,并且参考SPS的当前图片可能具有参考参考图片列表的活动条目中的参考图片的条带,该参考图片列表具有与当前图片不同的以下7个参数中的一个或多个:1)pps_pic_width_in_luma_samples,2)pps_pic_height_in_luma_samples,3)pps_scaling_win_left_offset,4)pps_scaling_win_right_offset,5)pps_scaling_win_top_offset,6)pps_scaling_win_bottom_offset,7)sps_minus_num1。sps_ref_pic_resampling_enabled_flag等于0规定参考图片重采样被禁用,并且没有参考SPS的当前图片可能具有参考参考图片列表的活动条目中的参考图片的条带,该参考图片列表具有与当前图片不同的上述7个参数中的一个或多个。
注3–当sps_ref_pic_resampling_enabled_flag等于1时,对于当前图片,具有与当前图片不同的上述7个参数中的一个或多个的参考图片可以属于与包含当前图片的层相同的层或不同的层。
sps_res_change_in_clvs_allowed_flag等于1规定图片空域分辨率可以在参考SPS的CLVS内改变。sps_res_change_in_clvs_allowed_flag等于0规定图片空域分辨率在参考SPS的任何CLVS内不改变。如果不存在,则推断sps_res_change_in_clvs_allowed_flag的值等于0。
...
8.3.2参考图片列表构建的解码过程
...
fRefWidth设置为等于参考图片的RefPicList[i][j]的CurrPicScalWinWidthL
fRefHeight设置为等于参考图片的RefPicList[i][j]的CurrPicScalWinHeightL
refPicWidth、refPicHeight、refScalingWinLeftOffset、refScalingWinRightOffset、refScalingWinTopOffset和refScalingWinBottomOffset分别设置为等于参考图片RefPicList[i][j]的ps_pic_width_in_luma_samples、pps_pic_height_in_luma_samples、pps_scaling_win_left_offset、pps_scaling_win_right_offset、pps_scaling_win_top_offset和pps_scaling_win_bottom_offset
fRefNumSubpics被设置为等于参考图片RefPicList[i][j]的sps_num_subpics_minus1
RefPicScale[i][j][0]=((fRefWidth<<14)+(CurrPicScalWinWidthL>>1))/CurrPicScalWinWidthL
RefPicScale[i][j][1]=((fRefHeight<<14)+(CurrPicScalWinHeightL>>1))/CurrPicScalWinHeightL
RprConstraintsActiveFlag[i][j]=(pps_pic_width_in_luma_samples!=refPicWidth||
pps_pic_height_in_luma_samples!=refPicHeight||
pps_scaling_win_left_offset!=refScalingWinLeftOffset||
pps_scaling_win_right_offset!=refScalingWinRightOffset||
pps_scaling_win_top_offset!=refScalingWinTopOffset||
pps_scaling_win_bottom_offset!=refScalingWinBottomOffset||
sps_num_subpics_minus1!=fRefNumSubpics)
...
3.5.访问单元分隔符(AUD)
最新的VVC草案文本中AUD的语法和语义如下:
AU分隔符用于指示AU的开始,AU是IRAP还是GDRAU,以及包含AU分隔符NAL单元的AU中的编解码图片中存在的条带的类型。当比特流仅包含一层时,没有与AU分隔符相关联的规范解码过程。
aud_irap_or_gdr_au_flag等于1规定包含AU分隔符的AU是IRAP或GDRAU。aud_irap_or_gdr_au_flag等于0规定包含AU分隔符的AU不是IRAP或GDRAU。
aud_pic_type指示包含AU分隔符NAL单元的AU中编解码图片的所有条带的sh_slice_type值是表7中针对aud_pic_type的给定值列出的集合的成员。在符合本规范的该版本的比特流中,aud_pic_type的值应等于0、1或2。aud_pic_type的其他值保留以供ITU-T|ISO/IEC将来使用。符合本规范的该版本的解码器应忽略pic_type的保留值。
表7–aud_pic_type的解释
aud_pic_type 可能存在于AU中的slice_type值
0 I
1 P,I
2 B,P,I
3.6.GCI(通用约束信息)
在最新的VVC草案文本中,通用档次、层次、级别语法和语义如下:
7.3.3档次、层次和级别语法
7.3.3.1通用档次、层次和级别语法
7.3.3.2通用约束信息语法
3.7.GCI字段的条件信令通知
在一些实施例中,GCI语法结构已经改变。GCI扩展长度指示符(gci_num_reserved_bytes)在GCI语法结构中从最后一个移动到第一个(gci_num_constraint_bytes)以启用GCI字段的跳过信令通知。gci_num_reserved_bytes的值应等于0或9。
添加或修改的部分用粗体斜体下划线标出,并且删除的部分用下面的[[]]指示。
3.8.亮度-色度QP映射表
7.3.2.3序列参数集RBSP语法
sps_qp_table_start_minus26[i]加26规定用于描述第i个色度QP映射表的起始亮度和色度QP。sps_qp_table_start_minus26[i]的值应在-26–QpBdOffset到36的范围(包括-26-QpBdOffset和36)内。如果不存在,则推断sps_qp_table_start_minus26[i]的值等于0。sps_num_points_in_qp_table_minus1[i]加1规定用于描述第i个色度QP映射表的点数。sps_num_points_in_qp_table_minus1[i]的值应在0到63+QpBdOffset的范围(包括端值)内。如果不存在,则推断sps_num_points_in_qp_table_minus1[0]的值等于0。
sps_delta_qp_in_val_minus1[i][j]规定用于推导第i个色度QP映射表的第j个枢轴点的输入坐标的增量值。如果不存在,则推断sps_delta_qp_in_val_minus1[0][j]的值等于0。sps_delta_qp_diff_val[i][j]规定用于推导第i个色度QP映射表的第j个枢轴点的输出坐标的增量值。
i=0..numQpTables-1的第i个色度QP映射表ChromaQpTable[i]推导如下:
/>
当sps_same_qp_table_for_chroma_flag等于1时,ChromaQpTable[1][k]和ChromaQpTable[2][k]被设置为等于ChromaQpTable[0][k],k在-QpBdOffset到63的范围(包括端值)内。
比特流一致性的要求是qpInVal[i][j]和qpOutVal[i][j]的值应在-QpBdOffset到63的范围(包括端值)内,i在0到numQpTables-1的范围(包括端值)内,并且j在0到sps_num_points_in_qp_table_minus1[i]+1的范围(包括端值)内。
4.公开的技术方案解决的技术问题
现有的RPR、AU分隔符和GCI的设计存在以下问题:
(1)sps_num_subpics_minus1涉及sps_ref_pic_resampling_enabled_flag的语义和标志变量RprConstraintsActiveFlag[i][j]的推导过于严格而不是必要的。当参考图片具有不同数量的子图片,而当前图片中的所有子图片的sps_subpic_treated_as_pic_flag[]都等于0时,当RprConstraintsActiveFlag[i][j]对于当前图片等于1时,将禁止使用所有被禁用的工具。
(2)当前,在AU分隔符(也称为AUD)语法结构中,两个语法元素(例如,aud_irap_or_gdr_au_flag和aud_pic_type)被信令通知AU以指示它是否是IRAP/GDRAU和AU的图片类型。AUDSE不用于解码过程的任何其他部分。然而,在PH中,有一个SE(例如,ph_gdr_or_irap_pic_flag)表达与aud_irap_or_gdr_au_flag类似的意图。可以断言,当AUD存在时,PHSE的值可以受AUDSE的值约束。此外,在SH中,有一个SE,sh_slice_type,也可以通过aud_pic_type的值来约束。
(3)最新的VVC草案文本和一些实施例中的GCI信令通知的设计在GCI字段和扩展字节之间具有字节对齐。因此,在潜在的未来扩展中,当需要添加新的GCI字段时,在当前的对齐比特之后,它们将被添加,然后,将需要添加另一个字节对齐。
(4)在一些实施例中GCI信令通知的设计使用8比特语法元素来规定GCI字段的字节数、字节对齐比特和扩展字节。然而,对于VVC版本1,语法元素的值需要等于0或9,即0或特定的大于零的整数值(取决于VVC版本1中所有GCI字段所需的比特数)。在潜在的未来扩展中,在添加某些新的GCI字段后,如果新的GCI字段需要9到16个比特,则该8比特语法元素的值将需要等于0或另一个大于9的特定值(例如11)。这意味着,在任何版本的VVC中,8比特语法元素的值将等于0或特定的大于零的整数值。因此,不需要信令通知8比特值,只信令通知1比特标志就足够了,并根据标志的值推导出值。
(5)在PH中是否信令通知了帧间关联的语法元素与是否在PH中信令通知了非空RPL0之间的关系没有很好地建立起来。例如,当在PH中发送参考图片列表(RPL)并且list0为空时,可以约束ph_inter_slice_allowed_flag的值等于0。反之亦然。
(6)在具有零恢复POC距离的GDR图片的情况下,GDR图片本身是恢复点图片。并且这应该在规范中被考虑/表达。
(7)考虑到混合NAL单元类型和比特流提取和merge,可以信令通知单个GCI标志来约束sps_idr_rpl_present_flag和pps_mixed_nalu_types_in_pic_flag两者。
5.实施例的列表
为了解决上述问题和一些其他未提及的问题,公开了如下总结的方法。发明应被视为解释通用概念的示例,而不应以狭义的方式进行解释。此外,这些发明可以单独应用或以任何方式组合应用。
1)为解决第一个问题,将RprConstraintsActiveFlag[i][j]的推导改为不涉及sps_num_subpics_minus1,并添加注释以阐明,当当前图片和参考图片RefPicList[i][j]的sps_num_subpics_minus1的值不同时,并且对于至少一个k值在0到sps_num_subpics_minus1的范围(包括端值)内的当前图片sps_subpic_treated_as_pic_flag[k]等于1,当RprConstraintsActiveFlag[i][j]等于1时,不能使用的所有工具(例如,PROF)需要由编码器关闭,否则比特流将是非一致性比特流,因为sps_subpic_treated_as_pic_flag[k]等于1的提取子图片将无法正确解码。
a.此外,在一个示例中,sps_ref_pic_resampling_enabled_flag的语义被更改为不涉及sps_num_subpics_minus1。
b.上述陈述仅适用于允许层间预测的情况。
2)为了解决第一个问题,RprConstraintsActiveFlag的推导进一步取决于子图片是否被视为图片。
a.在一个示例中,RprConstraintsActiveFlag[i][j]的推导被改变,使得它可以取决于当前图片的sps_subpic_treated_as_pic_flag[k]的值中的至少一个,k的范围从0到sps_num_subpics_minus1(包括端值)。
b.在一个示例中,RprConstraintsActiveFlag[i][j]的推导被改变,使得它可以取决于当前图片的sps_subpic_treated_as_pic_flag[k]中的至少一个是否等于1,k的范围从0到sps_num_subpics_minus1(包括端值)。
c.此外,或者,当当前图片与其参考图片之间的子图片数量不同并且当前图片没有被视为图片的子图片(例如,sps_subpic_treated_as_pic_flag的值为假),则RPR仍然可以被启用
i.此外,或者,RprConstraintsActiveFlag[i][j]可以根据其他条件(例如,缩放窗口尺寸/偏移)来设置。
d.此外,或者,当当前图片与其参考图片之间的子图片数量不同并且当前图片具有至少一个被视为图片的子图片时(例如,sps_subpic_treated_as_pic_flag为真),那么RPR总是被启用,而不管其他语法元素(例如,缩放窗口)的值。
i.此外,或者,对于上述情况,RprConstraintsActiveFlag[i][j]被设置为真。
e.此外,或者,当RprConstraintsActiveFlag[i][j]为真时,可以相应地禁用多个工具(例如,PROF/BDOF/DMVR)。
i.当RprConstraintsActiveFlag[i][j]在提取后可能等于真时,可以相应地禁用多个工具(例如,PROF/BDOF/DMVR)。
f.或者,一致性比特流应满足对于当前图片中的被视为图片的子图片并且当前图片与其参考图片之间的子图片数量不同,取决于RprConstraintsActiveFlag[i][j]的检查的编解码工具(例如PROF/BDOF/DMVR)可能被禁用。
g.或者,是否调用编解码工具(例如,PROF/BDOF/DMVR)的解码过程可以取决于当前图片中的当前子图片是否被视为图片以及当前图片与其参考图片之间的子图片的数量。
i.在一个示例中,如果当前图片中的当前子图片被视为图片并且当前图片与其参考图片之间的子图片的数量不同,那么无论SPS启用标志如何,这些编解码工具都被禁用。
3)为了解决第一个问题,RprConstraintsActiveFlag[i][j]的推导被更改为使得它可能取决于当前图片和参考图片是否属于同一层和/或是否允许层间预测。
4)为了解决第二个问题,关于AUDSE对PH/SHSE的值进行约束,公开了以下一种或多种方法:
a.在一个示例中,当存在时,基于AUD语法元素的值约束SPS/PPS/APS/PH/SH语法元素的值。
b.在一个示例中,当存在时,基于它是否是GDR/IRAPAU(例如,AUD语法元素aud_irap_or_gdr_au_flag的值)来约束规定它是否是GDR/IRAP图片的语法元素的值(例如,PH语法元素ph_gdr_or_irap_pic_flag)。
c.例如,当AUD语法元素规定包含AU分隔符的AU不是IRAP或GDRAU(例如,aud_irap_or_gdr_au_flag等于0)时,关联的PH语法元素ph_gdr_or_irap_pic_flag的值应不等于规定图片是IRAP或GDR图片的某个值(如1),例如,可以添加如下约束:
i.当aud_irap_or_gdr_au_flag存在且等于0(不是IRAP或GDR)时,ph_gdr_or_irap_pic_flag的值不应等于1(IRAP或GDR)。
ii.或者,当aud_irap_or_gdr_au_flag等于0(不是IRAP或GDR)时,ph_gdr_or_irap_pic_flag的值不应等于1(IRAP或GDR)。
iii.或者,当aud_irap_or_gdr_au_flag存在且等于0(不是IRAP或GDR)时,ph_gdr_or_irap_pic_flag的值应等于0(可能是也可能不是IRAP或GDR)。
iv.或者,当aud_irap_or_gdr_au_flag等于0(不是IRAP或GDR)时,ph_gdr_or_irap_pic_flag的值应等于0(可能是也可能不是IRAP或GDR)。
d.在一个示例中,当存在时,基于AUD语法元素(例如,aud_pic_type)的值来约束规定条带类型的语法元素(例如,SH语法元素sh_slice_type)的值。
i.例如,当AUD语法元素规定可能出现在AU中的sh_slice_type值是帧内(I)条带(例如,aud_pic_type等于0)时,关联的SH语法元素sh_slice_type的值不应等于规定预测(P)/双向预测(B)条带的某个值(比如0/1),例如,可以添加如下约束:
1.当aud_pic_type存在且等于0(I条带)时,sh_slice_type的值应等于2(I条带)。
2.或者,当aud_pic_type等于0(I条带)时,sh_slice_type的值应等于2(I条带)。
3.或者,当aud_pic_type存在且等于0(I条带)时,sh_slice_type的值不应等于0(B条带)或1(P条带)。
4.或者,当aud_pic_type等于0(I条带)时,sh_slice_type的值不应等于0(B条带)或1(P条带)。
e.例如,当AUD语法元素规定可能出现在AU中的sh_slice_type值是P或I条带(例如,aud_pic_type等于1)时,关联的SH语法元素sh_slice_type的值不应不等于规定B条带的某个值(比如0),例如可以添加如下约束:
i.当aud_pic_type存在且等于1(可能存在P、I条带)时,sh_slice_type的值应等于1(P条带)或2(I条带)。
ii.或者,当aud_pic_type等于1(可能存在P、I条带)时,sh_slice_type的值应等于1(P条带)或2(I条带)。
iii.或者,当aud_pic_type存在且等于1(P、I条带可能存在)时,sh_slice_type的值不应等于0(B条带)。
iv.或者,当aud_pic_type等于1(可能存在P、I条带)时,sh_slice_type的值不应等于0(B条带)。
f.在一个示例中,AUD语法结构和PH/SH语法结构中的相关语法元素的指示符值可以对齐。
i.例如,aud_pic_type等于0指示可能存在于AU中的sh_slice_type值是B或P或I条带。
ii.例如,aud_pic_type等于1指示可能存在于AU中的sh_slice_type值是P或I条带。
iii.例如,aud_pic_type等于2指示可能存在于AU中的sh_slice_type值是I条带。
iv.或者,sh_slice_type等于0指示该条带的编解码类型是I条带。
v.或者,sh_slice_type等于1指示该条带的编解码类型是P条带。
vi.或者,sh_slice_type等于2指示该条带的编解码类型是B条带。g.在一个示例中,AUD语法结构和PH/SH语法结构中的相关语法元素的名称可以对齐。
i.例如,aud_irap_or_gdr_au_flag可以重命名为aud_gdr_or_irap_au_flag。
ii.或者,ph_gdr_or_irap_pic_flag可以重命名为ph_irap_or_gdr_pic_flag。
h.在一个示例中,规定图片是IRAP还是GDR图片(例如,ph_gdr_or_irap_pic_flag等于0或1,和/或ph_gdr_pic_flag等于0或1,和/或名为ph_irap_pic_flag的PHSE等于0或1)的语法元素的值可以基于比特流是否是单层比特流以及图片属于IRAP还是GDRAU来约束。
i.例如,当bitsteram是单层比特流时(例如,当VPS语法元素vps_max_layers_minus1等于0和/或SPS语法元素sps_video_parameter_set_id等于0时),并且AUD语法元素规定包含AU分隔符的AU不是IRAP或GDRAU(例如,aud_irap_or_gdr_au_flag等于0),可以添加以下约束:
1.关联的PH语法元素ph_gdr_or_irap_pic_flag的值不应等于规定图片是IRAP或GDR图片的特定值(例如1)。
2.关联的PH语法元素ph_gdr_pic_flag的值不应等于规定图片是GDR图片的特定值(例如1)。
3.假设有命名为ph_irap_pic_flag的PHSE,并且ph_irap_pic_flag等于规定该图片肯定是IRAP图片的某个值(比如1),那么在上述条件下,关联的PH语法元素ph_gdr_irap_flag的值不应等于1.
ii.例如,当比特流是单层比特流时(例如,当VPS语法元素vps_max_layers_minus1等于0和/或SPS语法元素sps_video_parameter_set_id等于0时),并且AUD语法元素规定包含AU分隔符的AU是IRAP或GDRAU(例如,aud_irap_or_gdr_au_flag等于1),可以添加以下约束:
1.假设有名为ph_irap_pic_flag的PHSE,并且ph_irap_pic_flag等于规定该图片肯定是IRAP图片的某个值(比如1),那么在上述条件下,ph_gdr_pic_flag或ph_irap_flag应等于1。
iii.例如,当vps_max_layers_minus1(或sps_video_parameter_set_id)等于0(单层),并且aud_irap_or_gdr_au_flag存在且等于0(不是IRAP或GDRAU)时,进行以下约束:
1.ph_gdr_or_irap_pic_flag的值不应等于1(IRAP或GDR图片)。
a.或者,ph_gdr_or_irap_pic_flag的值应等于0(图片可能是也可能不是IRAP图片,并且肯定不是GDR图片)。
2.此外,可选地,ph_gdr_pic_flag的值不应等于1(GDR图片)。
a.或者,ph_gdr_pic_flag的值应等于0(该图片肯定不是GDR图片)。
3.或者,可选地,ph_irap_pic_flag(命名,如果有的话)的值应不等于1(肯定是IRAP图片)。
a.或者,ph_irap_pic_flag(命名,如果有的话)的值应等于0(图片肯定不是IRAP图片)。
5)为了解决第三个问题,是否信令通知GCI语法结构中的GCI语法元素可能取决于信令通知/推导的约束/保留字节数(例如,JVET-S0092-v1中的gci_num_constraint_bytes)是否不等于0或大于0。
a.在一个示例中,JVET-S0092-v1中的GCI语法被更改为:(1)条件“if(gci_num_constraint_bytes>8)”更改为“if(gci_num_constraint_bytes>0)”;(2)字节对齐,即语法元素gci_alignment_zero_bit及其条件“while(!byte_aligned())”一起被移除;以及(3)保留字节的信令通知(即,gci_reserved_byte[i])被改变为服务比特(即,gci_reserved_bit[i])的信令通知,在某种程度上使得在条件“if(gci_num_constraint_bytes>0)”下的比特的总数等于gci_num_constraint_bytes*8。
b.此外,或者,约束/保留字节的数量(例如,JVET-S0092中的gci_num_constraint_bytes)可以限制为给定值,这可能取决于标准信息的GCI语法元素/档次/片/版本。
i.或者,另外,另一个非零值被设置为Ceil(Log2(numGciBits)),其中变量numGciBits被推导为等于在条件“if(gci_num_constraint_bytes>0)”下所有语法元素的比特数,不包括gci_reserved_bit[i]语法元素。
6)为了解决第四个问题,可以使用标志来指示GCI语法元素/或GCI语法结构的存在,并且当存在GCI语法元素时,可以进一步信令通知零个或一个或多个保留比特。
a.在一个示例中,JVET-S0092-v1中的GCI语法被更改为(1)8比特gci_num_constraint_bytes被替换为一比特标志,例如gci_present_flag;(2)条件“if(gci_num_constraint_bytes>8)”改为“if(gci_present_flag)”;(3)字节对齐,即语法元素gci_alignment_zero_bit及其条件“while(!byte_aligned())”一起被移除;以及(4)保留字节的信令通知(即,gci_reserved_byte[i])被改变为保留比特(即,gci_reserved_bit[i])的信令通知,在某种程度上使得在条件“if(gci_present_flag)"下的比特的总数等于gciNumConstraintBytes*8,其中gciNumConstraintBytes是根据gci_present_flag的值而推导的。
b.此外,或者,约束/保留字节的数量(例如,JVET-S0092中的gci_num_constraint_bytes)(例如,信令通知的或推导的)可以取决于标准信息的GCI语法元素/档次/片/版本。
i.或者,另外,另一个非零值被设置为Ceil(Log2(numGciBits)),其中变量numGciBits被推导为等于在条件“if(gci_present_flag>0)”下所有语法元素的比特数,不包括gci_reserved_bit[i]语法元素。
c.此外,或者,当标志指示不存在GCI语法元素时,可以进一步信令通知7比特保留比特。
i.在一示例中,7比特保留比特是7个零比特。
d.此外,或者,在PTL语法结构中,将GCI语法结构移至general_sub_profile_idc之后或ptl_sublayer_level_present_flag[i]之后,或while循环(用于字节对齐)之前。
i.此外,或者,当标志指示存在GCI语法元素时,GCI语法结构(例如,general_constraint_info())被进一步信令通知。
ii.此外,或者,当标志指示GCI语法元素不存在时,不信令通知GCI语法结构(例如,general_constraint_info())并且GCI语法元素的值被设置为默认值。
自适应颜色变换(ACT)相关
7)可以基于预测模式信息跳过ACT使用(例如,ACT开/关控制标志)的信令通知。
a.在一个示例中,是否信令通知ACT开/关标志的指示可以取决于当前块的预测模式是否是非帧内(例如,不是MODE_INTRA)和/或非帧间(例如,不是MODE_INTER)和/或非IBC(例如,不是MODE_IBC)。
b.在一个示例中,当所有帧内(例如,MODE_INTRA)和帧间(例如,MODE_INTER)和IBC(例如,MODE_IBC)模式未应用于视频单元时,可以跳出ACT使用的信令通知(例如,ACT开/关控制标志)。
i.此外,或者,当不存在/未信令通知时,ACT的使用被推断为假。
c.在一个示例中,当ACT用于块时,X模式不得用于该块。
i.例如,X可能是调色板(palette)。
ii.例如,X可能是不同于MODE_INTRA、MODE_INTER和MODE_IBC的模式。
iii.此外,或者,在上述条件下,X模式的使用被推断为假。
其他
8)为解决第五个问题,公开了以下一种或多种方法:
a.在一个示例中,要求当在图片中允许帧间条带时(例如,ph_inter_slice_allowed_flag等于真),并且在PH而不是SH中信令通知RPL,则参考图片列表0(例如,RefPicList[0])不应为空,即至少包含一个条目。
i.例如,可以规定比特流约束,当pps_rpl_info_in_ph_flag等于1且ph_inter_slice_allowed_flag等于1时,num_ref_entries[0][RplsIdx[0]]的值应大于0。
ii.此外,是否信令通知和/或如何信令通知和/或列表0中参考条目数量的推断(例如,num_ref_entries[0][RplsIdx[0]])可能取决于图片中是否允许帧间条带。
1.在一个示例中,当在图片中允许帧间条带(例如,ph_inter_slice_allowed_flag等于真),并且在PH中信令通知RPL(例如,pps_rpl_info_in_ph_flag等于真)时,参考图片列表0中的条目数量减1可能改为被信令通知。
2.在一个示例中,当在图片中不允许帧间条带时(例如,ph_inter_slice_allowed_flag等于假),并且RPL在PH中信令通知(例如,pps_rpl_info_in_ph_flag等于真)时,参考图片列表X(例如X为0或1)中的条目数量不再被信令通知。
b.在一个示例中,要求当RPL在PH而不是SH中信令通知,并且参考图片列表0(例如,RefPicList[0])为空,即包含0个条目时,则应仅允许I条带在图片中。
i.例如,可以规定比特流约束,当pps_rpl_info_in_ph_flag等于1,并且num_ref_entries[0][RplsIdx[0]]的值等于0时,则ph_inter_slice_allowed_flag的值应等于0。
ii.是否信令通知和/或如何信令通知帧间允许标志(例如,ph_inter_slice_allowed_flag)和/或帧内允许标志(例如,ph_intra_slice_allowed_flag)的指示可取决于参考图片列表0中的条目数量。
1.在一个示例中,当pps_rpl_info_in_ph_flag等于1并且num_ref_entries[0][RplsIdx[0]]的值等于0时,可以不再信令通知是否允许帧间条带的指示(例如,ph_inter_slice_allowed_flag)。
a.此外,或者,该指示被推断为假。
b.可以不再信令通知是否允许帧内条带的另一指示(例如,ph_intra_slice_allowed_flag)。
c.在一个示例中,如何信令通知和/或是否信令通知条带类型和/或条带类型的推断可以取决于参考图片列表0和/或1的条目数量。
i.在一个示例中,当参考图片列表0(例如,RefPicList[0])为空,即包含0个条目时,条带类型的指示不再被信令通知。
1.此外,或者,当在PH而不是SH中信令通知RPL,并且参考图片列表0(例如,RefPicList[0])为空,即包含0个条目时,不再信令通知条带类型的指示。
2.此外,或者,对于上述情况,条带类型被推断为I条带。
ii.在一个示例中,当参考图片列表0(例如,RefPicList[0])为空,即包含0个条目时,条带类型应等于I条带。
iii.在一个示例中,当参考图片列表1(例如,RefPicList[1])为空,即包含0个条目时,条带类型不应等于B条带。
iv.在一个示例中,当参考图片列表1(例如,RefPicList[1])为空,即包含0个条目时,条带类型应等于I或P条带。
d.在一个示例中,要求如果RPL在PH中信令通知,则它用于图片中的所有条带,因此如果整个图片仅包含I条带,则列表0只能为空。否则,如果列表0不为空,则此图片中必须至少有一个B或P条带。9)为解决第六个问题,公开了以下一种或多种方法:
a.在一个示例中,只有当恢复POC计数大于0时,恢复点图片在解码顺序中才应在相关联的GDR图片之后。
b.在一个示例中,当恢复POC计数等于0时,恢复点图片是GDR图片本身。
c.在一个示例中,恢复图片在解码顺序中可以或不可以在恢复点图片之前。
d.在一个示例中,当恢复POC计数等于0时,恢复点图片就是GDR图片本身,并且它可能有也可能没有恢复图片。
e.在一个示例中,JVET-R2001-vA中的ph_recovery_poc_cnt的语义可以改变如下。已添加或修改的大部分相关部分都以粗体斜体下划线显示,并且一些删除的部分使用[[]]表示。
ph_recovery_poc_cnt规定在输出顺序中的解码图片的恢复点。
当当前图片为GDR图片时,变量recoveryPointPocVal推导如下:
recoveryPointPocVal=PicOrderCntVal+ph_recovery_poc_cnt
当前图片是GDR图片,并且在PicOrderCntVal等于recoveryPointPocVal的CLVS中,在解码顺序上在当前GDR图片之后存在图片picA,则图片picA被称为恢复点图片。否则,CLVS中PicOrderCntVal大于recoveryPointPocVal的输出顺序中的第一个图片被称为恢复点图片。恢复点图片在解码顺序中不应在当前GDR图片之前。与当前GDR图片相关联且PicOrderCntVal小于recoveryPo-intPocVal的图片称为GDR图片的恢复图片。ph_recovery_poc_cnt的值应在0到MaxPicOrderCntLsb-1的范围(包括端值)内。
10)为解决第七个问题,公开了以下一种或多种方法:
a.在一个示例中,可以信令通知第一GCI语法元素(例如,命名为no_idr_rpl_mixed_nalu_constraint_flag)以限制与IDR图片一起发送的RPL和混合NAL单元类型的使用两者。
i.例如,当no_idr_rpl_mixed_nalu_constraint_flag等于1时,将不会为IDR图片信令通知RPL,并且每个图片的VCLNAL单元应具有相同的nal_unit_type值。而no_idr_rpl_mixed_nalu_constraint_flag等于0时不施加这种约束。
ii.例如,当no_idr_rpl_mixed_nalu_constraint_flag等于1时,参考图片列表语法元素不应存在于IDR图片的条带标头中(例如,sps_idr_rpl_present_flag应等于0)并且pps_mixed_nalu_types_in_pic_flag应等于0。而no_idr_rpl_mixed_nalu_constraint_flag等于0时则不施加这样的约束。
iii.例如,当第一个GCI语法元素不存在时(例如,GCI语法元素存在的指示告诉GCI语法元素不存在),第一个GCI语法元素的值可以被推断为X(例如,X是0或1)。
11)建议规定QP表中点数的语法元素的信令通知和/或范围和/或推断取决于其他语法元素。
a.建议将num_points_in_qp_table_minus1[i]的最大值设置为(K-用于描述第i个色度QP映射表的起始亮度和/或色度QP)。
i.在一个示例中,K取决于视频的最大允许QP值。
1.在一个示例中,K被设置为(最大允许QP值-1),例如VVC中的62。
ii.在一个示例中,最大值设置为(62-(qp_table_start_minus26[i]+26),其中sps_qp_table_start_minus26[i]加26规定用于描述第i个色度QP映射表的起始亮度和色度QP。
b.或者,要求QP表中的点数(例如,第i个QP表的num_points_in_qp_table_minus1[i])和用于描述第i个色度QP映射表的起始亮度和/或色度QP(例如,sps_qp_table_start_minus26[i]加26)的总和应小于最大允许QP值(例如,63)。
12)比特流一致性的要求是qpInVal[i][j]的值应在-QpBdOffset至62的范围(包括端值)内,i在0至numQpTables1的范围(包括端值)内,并且j在0至sps_num_points_in_qp_table_minus1[i]+K(例如,K=0或1)的范围(包括端值)内。
13)比特流一致性的要求是qpOutVal[i][j]的值应在-QpBdOffset到62的范围(包括端值)内,i在0至numQpTables1的范围(包括端值)内,并且j在0至sps_num_points_in_qp_table_minus1[i]+K(例如,K=0或1)的范围(包括端值)内。
6.实施例
以下是本章节上文总结的一些发明方面的一些示例实施例,其可适用于VVC规范。已添加或修改的大部分相关部分用粗体斜体下划线标出,并且一些删除的部分用[[]]标出。
6.1.实施例1
本实施例用于项目1及其子项。
7.4.3.3序列参数集RBSP语义
...
sps_ref_pic_resampling_enabled_flag等于1规定启用参考图片重采样,并且参考SPS的当前图片可能具有参考参考图片列表的活动条目中的参考图片的条带,该参考图片列表具有与当前图片不同的以下[[7]个参数中的一个或多个:1)pps_pic_width_in_luma_samples,2)pps_pic_height_in_luma_samples,3)pps_scaling_win_left_offset,4)pps_scaling_win_right_offset,5)pps_scaling_win_top_offset,/>6)pps_scaling_win_bottom_offset[[,7)sps_minus_num1]]。sps_ref_pic_resampling_enabled_flag等于0规定参考图片重采样被禁用,并且没有参考SPS的当前图片可能具有参考参考图片列表的活动条目中的参考图片的条带,该参考图片列表具有与当前图片不同的上述/>[[7]个参数中的一个或多个。/>
注3–当sps_ref_pic_resampling_enabled_flag等于1时,对于当前图片,具有与当前图片不同的上述[[7]个参数中的一个或多个的参考图片可以属于与包含当前图片的层相同的层或不同的层。
sps_res_change_in_clvs_allowed_flag等于1规定图片空域分辨率可以在参考SPS的CLVS内改变。sps_res_change_in_clvs_allowed_flag等于0规定图片空域分辨率在参考SPS的任何CLVS内不改变。如果不存在,则推断sps_res_change_in_clvs_allowed_flag的值等于0。
...
8.3.2参考图片列表构建的解码过程
...
fRefWidth设置为等于参考图片的RefPicList[i][j]的CurrPicScalWinWidthL
fRefHeight设置为等于参考图片的RefPicList[i][j]的CurrPicScalWinHeightL
refPicWidth、refPicHeight、refScalingWinLeftOffset、refScalingWinRightOffset、refScalingWinTopOffset和refScalingWinBottomOffset分别设置为等于参考图片RefPicList[i][j]的ps_pic_width_in_luma_samples、pps_pic_height_in_luma_samples、pps_scaling_win_left_offset、pps_scaling_win_right_offset、pps_scaling_win_top_offset和pps_scaling_win_bottom_offset
[[fRefNumSubpics被设置为等于参考图片RefPicList[i][j]的sps_num_subpics_minus1]]
RefPicScale[i][j][0]=((fRefWidth<<14)+(CurrPicScalWinWidthL>>1))/CurrPicScalWinWidthL
RefPicScale[i][j][1]=((fRefHeight<<14)+(CurrPicScalWinHeightL>>1))/CurrPicScalWinHeightL
RprConstraintsActiveFlag[i][j]=(pps_pic_width_in_luma_samples!=refPicWidth||
pps_pic_height_in_luma_samples!=refPicHeight||
pps_scaling_win_left_offset!=refScalingWinLeftOffset||
pps_scaling_win_right_offset!=refScalingWinRightOffset||
pps_scaling_win_top_offset!=refScalingWinTopOffset||
pps_scaling_win_bottom_offset!=refScalingWinBottomOffset[[||
sps_num_subpics_minus1!=fRefNumSubpics]])
...
6.2.实施例2
本实施例用于项目2。
8.3.2参考图片列表构建的解码过程
...
fRefWidth设置为等于参考图片的RefPicList[i][j]的CurrPicScalWinWidthL
fRefHeight设置为等于参考图片的RefPicList[i][j]的CurrPicScalWinHeightL
refPicWidth、refPicHeight、refScalingWinLeftOffset、refScalingWinRightOffset、refScalingWinTopOffset和refScalingWinBottomOffset分别设置为等于参考图片RefPicList[i][j]的ps_pic_width_in_luma_samples、pps_pic_height_in_luma_samples、pps_scaling_win_left_offset、pps_scaling_win_right_offset、pps_scaling_win_top_offset和pps_scaling_win_bottom_offset
fRefNumSubpics被设置为等于参考图片RefPicList[i][j]的sps_num_subpics_minus1
RefPicScale[i][j][0]=((fRefWidth<<14)+(CurrPicScalWinWidthL>>1))/CurrPicScalWinWidthL
RefPicScale[i][j][1]=((fRefHeight<<14)+(CurrPicScalWinHeightL>>1))/CurrPicScalWinHeightL
RprConstraintsActiveFlag[i][j]=(pps_pic_width_in_luma_samples!=refPicWidth||
pps_pic_height_in_luma_samples!=refPicHeight||
pps_scaling_win_left_offset!=refScalingWinLeftOffset||
pps_scaling_win_right_offset!=refScalingWinRightOffset||
pps_scaling_win_top_offset!=refScalingWinTopOffset||
pps_scaling_win_bottom_offset!=refScalingWinBottomOffset||
sps_num_subpics_minus1!=fRefNumSubpics/>
...
6.3.实施例3
本实施例用于项目3。
8.3.2参考图片列表构建的解码过程
...
fRefWidth设置为等于参考图片的RefPicList[i][j]的CurrPicScalWinWidthL
fRefHeight设置为等于参考图片的RefPicList[i][j]的CurrPicScalWinHeightL
refPicWidth、refPicHeight、refScalingWinLeftOffset、refScalingWinRightOffset、refScalingWinTopOffset和refScalingWinBottomOffset分别设置为等于参考图片RefPicList[i][j]的ps_pic_width_in_luma_samples、pps_pic_height_in_luma_samples、pps_scaling_win_left_offset、pps_scaling_win_right_offset、pps_scaling_win_top_offset和pps_scaling_win_bottom_offset
fRefNumSubpics被设置为等于参考图片RefPicList[i][j]的sps_num_subpics_minus1
RefPicScale[i][j][0]=((fRefWidth<<14)+(CurrPicScalWinWidthL>>1))/CurrPicScalWinWidthL
RefPicScale[i][j][1]=((fRefHeight<<14)+(CurrPicScalWinHeightL>>1))/CurrPicScalWinHeightL
RprConstraintsActiveFlag[i][j]=(pps_pic_width_in_luma_samples!=refPicWidth||
pps_pic_height_in_luma_samples!=refPicHeight||
pps_scaling_win_left_offset!=refScalingWinLeftOffset||
pps_scaling_win_right_offset!=refScalingWinRightOffset||
pps_scaling_win_top_offset!=refScalingWinTopOffset||
pps_scaling_win_bottom_offset!=refScalingWinBottomOffset||
sps_num_subpics_minus1!=fRefNumSubpics/>
...
6.4.实施例4
本实施例用于项目5。PTL语法被修改如下:
GCI语法修改如下:
gci_num_constraint_bytes规定general_constraint_info()语法结构中所有语法元素的字节数,不包括该语法元素本身。
变量numGciBits被推导为等于条件“if(gci_num_constraint_bytes>0)”下所有语法元素的比特数,不包括gci_reserved_bit[i]语法元素。
gci_reserved_bit[i]语法元素的数量应小于或等于7。
或者,gci_num_constraint_bytes的值应等于0或Ceil(Log2(numGciBits))。
gci_reserved_bit[i]可以有任何值。如果存在,解码器应忽略gci_reserved_bit[i]的值。
6.5.实施例5
本实施例用于项目6。PTL语法修改如下:
GCI语法修改如下:
gci_present_flag等于1规定GCI字段存在。gci_present_flag等于0规定GCI字段不存在。
变量numGciBits被推导为等于条件“if(gci_present_flag)”下所有语法元素的比特数,不包括gci_reserved_bit[i]语法元素。
当gci_present_flag等于1时,变量gciNumConstraintBytes被设置为等于Ceil(Log2(numGciBits))。
注:gci_reserved_bit[i]语法元素的数量小于或等于7。
6.6.实施例6
PTL语法修改如下:
/>
GCI语法修改如下:
gci_present_flag等于1规定存在general_constraint_info()。gci_present_flag等于0规定general_constraint_info()不存在。
变量numGciBits被推导为等于除gci_reserved_bit[i]语法元素之外的所有语法元素的比特数。
变量gciNumConstraintBytes设置为等于Ceil(Log2(numGciBits))。
注:gci_reserved_bit[i]语法元素的数量小于或等于7。
图1是可实现本文中所公开的各种技术的示例视频处理系统1900的框图。各种实现方式可以包括系统1900中的一些或全部组件。系统1900可以包括用于接收视频内容的输入1902。视频内容可以以原始或未压缩的格式(例如8或10比特多分量像素值)接收,或者可以以压缩或编码的格式接收。输入1902可以代表网络接口、外围总线接口或存储接口。网络接口的示例包括有线接口(诸如以太网、无源光网络(PON)等)和无线接口(诸如Wi-Fi或蜂窝接口)。
系统1900可以包括可以实现本文档中描述的各种编解码或编码方法的编解码组件1904。编解码组件1904可以减少从输入1902到编解码组件1904的输出的视频的平均比特率,以产生视频的编解码表示。因此,编解码技术有时称为视频压缩或视频转码技术。编解码组件1904的输出可以被存储或经由所连接的通信来发送,如组件1906所表示的。在输入1902处接收的视频的存储或通信的比特流(或编解码)表示可以由组件1908使用,以生成被发送到显示接口1910的像素值或可显示视频。从比特流表示中生成用户可见的视频的过程有时称为视频解压缩。此外,尽管某些视频处理操作被称为“编解码”操作或工具,但是应当理解,在编码器处使用编解码工具或操作,并且将由解码器进行反演编解码的结果的对应解码工具或操作。
外围总线接口或显示接口的示例可以包括通用串行总线(USB)或高清晰度多媒体接口(HDMI)或Displayport等。存储接口的示例包括SATA(串行高级技术附件)、PCI、IDE接口等。本文档中描述的技术可以实施在各种电子设备中,诸如移动电话、膝上型计算机、智能电话或其它能够进行数字数据处理和/或视频显示的设备。
图2是视频处理装置3600的框图。装置3600可以用于实现本文中所述的方法中的一个或多个。装置3600可以实施在智能电话、平板电脑、计算机、物联网(IoT)接收器等中。装置3600可以包括一个或多个处理器3602、一个或多个存储器3604和视频处理硬件3606。(多个)处理器3602可以配置为实现本文档中所述的一个或多个方法。(多个)存储器3604可以用于存储数据和代码,该代码用于实现本文所描述的方法和技术。视频处理硬件3606可以用于在硬件电路中实现本文档中所描述的一些技术。
图4是示出可利用本公开的技术的示例视频编解码系统100的框图。
如图4所示,视频编解码系统100可以包括源设备110和目的地设备120。源设备110生成编码的视频数据,其可以被称为视频编码设备。目的地设备120可以解码由源设备110生成的编码的视频数据,该目的地设备120可以被称为视频解码设备。
源设备110可以包括视频源112、视频编码器114和输入/输出(I/O)接口116。
视频源112可以包括诸如视频捕获设备的源、从视频内容提供者接收视频数据的接口、和/或生成视频数据的计算机图形系统,或这些源的组合。视频数据可以包括一个或多个图片。视频编码器114对来自视频源112的视频数据进行编码以生成比特流。比特流可以包括形成视频数据的编解码表示的比特序列。比特流可以包括编解码图片和相关联的数据。编解码图片是图片的编解码表示。相关联的数据可以包括序列参数集、图片参数集和其他语法元素。I/O接口116包括调制器/解调器(调制解调器)和/或发送器。可以将编码的视频数据经由I/O接口116通过网络130a直接发送到目的地设备120。还可以将编码的视频数据存储到存储介质/服务器130b上,用于由目的地设备120存取。
目的地设备120可以包括I/O接口126、视频解码器124和显示设备122。
I/O接口126可以包括接收器和/或调制解调器。I/O接口126可以从源设备110或存储介质/服务器130b获取编码的视频数据。视频解码器124可以对编码的视频数据进行解码。显示设备122可以向用户显示解码的视频数据。显示设备122可以与目的设备120集成在一起,或者可以在目的设备120的外部,该目的设备被配置为与外部显示设备接口。
视频编码器114和视频解码器124可以根据视频压缩标准(诸如,高效视频编解码(HEVC)标准、多功能视频编解码(VVC)标准和其他当前和/或其他标准)进行操作。
图5是示出视频编码器200的示例的框图,该视频编码器200可以是图4中示出的系统100中的视频编码器114。
视频编码器200可以被配置为执行本公开的任何或全部技术。在图5的示例中,视频编码器200包括多个功能组件。本公开所描述的技术可以在视频编码器200的各种组件之间共享。在一些示例中,处理器可以配置为进行本公开中描述的任何或全部技术。
视频编码器200的功能组件可以包括分割单元201、预测单元202(其可以包括模式选择单元203、运动估计单元204、运动补偿单元205和帧内预测单元206)、残差生成单元207、变换单元208、量化单元209、逆量化单元210、逆变换单元211、重建单元212、缓冲器213和熵编码单元214。
在其他示例中,视频编码器200可以包括更多、更少或不同的功能组件。在一个示例中,预测单元202可以包括帧内块复制(IBC)单元。IBC单元可以以IBC模式进行预测,其中至少一个参考图片是当前视频块所位于的图片。
此外,诸如运动估计单元204和运动补偿单元205的一些组件可以被高度集成,但是出于解释的目的在图5的示例中分开表示。
分割单元201可以将图片分割成一个或多个视频块。视频编码器200和视频解码器300可以支持各种视频块尺寸。
模式选择单元203可以例如基于误差结果选择帧内或帧间的编解码模式中的一个,并且将得到的帧内或帧间编解码块提供到残差生成单元207来生成残差块数据而且提供到重建单元212来重建编码块以用作参考图片。在一些示例中,模式选择单元203可以选择帧内和帧间预测的组合(CIIP)模式,其中预测是基于帧间预测信号和帧内预测信号。模式选择单元203还可以为帧间预测情况下的块选择运动矢量的分辨率(例如子像素或整像素精度)。
为了对当前视频块进行帧间预测,运动估计单元204可以通过将来自缓冲器213的一个或多个参考帧与当前视频块进行比较,生成当前视频块的运动信息。运动补偿单元205可以基于来自缓冲器213的图片(而不是与当前视频块相关联的图片)的运动信息和解码样点来为当前视频块确定预测的视频块。
运动估计单元204和运动补偿单元205可以为当前视频块进行不同操作,例如执行不同操作取决于当前视频块是在I条带、P条带还是B条带中。
在一些示例中,运动估计单元204可以进行当前视频块的单向预测,并且运动估计单元204可以在列表0或列表1的参考图片中搜索当前视频块的参考视频块。运动估计单元204然后可以生成指示列表0或列表1的参考图片中含有参考视频块的参考索引以及指示在当前视频块与参考视频块之间的空域位移的运动矢量。运动估计单元204可以输出参考索引、预测方向指示符、和运动矢量作为当前视频块的运动信息。运动补偿单元205可以基于由当前视频块的运动信息指示的参考视频块来生成当前块的预测视频块。
在其他示例中,运动估计单元204可以进行当前视频块的双向预测,运动估计单元204可以在列表0的参考图片中搜索当前视频块的参考视频块并且还可以在列表1的参考图片中搜索当前视频块的另一个参考视频块。运动估计单元204然后可以生成指示列表0或列表1的参考图片中含有参考视频块的参考索引以及指示在参考视频块与当前视频块之间的空域位移的运动矢量。运动估计单元204可以输出参考索引和当前视频块的运动矢量作为当前视频块的运动信息。运动补偿单元205可以基于由当前视频块的运动信息指示的参考视频块来生成当前视频块的预测视频块。
在一些示例中,运动估计单元204可以输出运动信息的全部集合,用于解码器的解码处理。
在一些示例中,运动估计单元204可以不输出当前视频的运动信息的全部集合。而是,运动估计单元204可以参考另一个视频块的运动信息来信令通知当前视频块的运动信息。例如,运动估计单元204可以确定当前视频块的运动信息与相邻视频块的运动信息足够相似。
在一个示例中,运动估计单元204可以在与当前视频块相关联的语法结构中指示:向视频解码器300指示当前视频块具有与另一个视频块相同的运动信息的值。
在另一个示例中,运动估计单元204可以在与当前视频块相关联的语法结构中标识另一个视频块和运动矢量差(MVD)。运动矢量差指示当前视频块的运动矢量与指示视频块的运动矢量之间的差。视频解码器300可以使用指示视频块的运动矢量和运动矢量差来确定当前视频块的运动矢量。
如上所讨论的,视频编码器200可以预测性地信令通知运动矢量。可以由视频编码器200实现的预测性的信令通知技术的两个示例包括高级运动矢量预测(AMVP)和merge模式信令通知。
帧内预测单元206可以对当前视频块进行帧内预测。当帧内预测单元206对当前视频块进行帧内预测时,帧内预测单元206可以基于相同图片中其他视频块的解码样点来生成当前视频块的预测数据。当前视频块的预测数据可以包括预测视频块和各种语法元素。
残差生成单元207可以通过从当前视频块中减去(例如,由减号表示)当前视频块的(多个)预测视频块来生成当前视频块的残差数据。当前视频块的残差数据可以包括对应于当前视频块中样点的不同样点分量的残差视频块。
在其他示例中,例如在跳过模式下,对于当前视频块可能不存在当前视频块的残差数据,并且残差生成单元207可以不进行减去操作。
变换处理单元208可以通过将一个或多个变换应用于与当前视频块相关联的残差视频块来生成当前视频块的一个或多个变换系数视频块。
在变换处理单元208生成与当前视频块相关联的变换系数视频块之后,量化单元209可以基于与当前视频块相关联的一个或多个量化参数(QP)值来量化与当前视频块相关联的变换系数视频块。
逆量化单元210和逆变换单元211可以将逆量化和逆变换分别应用于变换系数视频块,来从变换系数视频块重建残差视频块。重建单元212可以将重建的残差视频块添加到来自由预测单元202生成的一个或多个预测视频块的对应样点,以产生与当前块相关联的重建视频块用于存储在缓冲器213中。
在重建单元212重建视频块之后,可以进行环路滤波操作以降低视频块中视频块化伪影。
熵编码单元214可以从视频编码器200的其他功能组件接收数据。当熵编码单元214接收数据时,熵编码单元214可以进行一个或多个熵编码操作以生成熵编码数据并且输出包括熵编码数据的比特流。
图6是示出视频解码器300的示例的框图,该视频解码器300可以是图4中示出的系统100中的视频解码器114。
视频解码器300可以被配置为进行本公开的任何或全部技术。在图5的示例中,视频解码器300包括多个功能组件。本公开所描述的技术可以在视频解码器300的各种组件之间共享。在一些示例中,处理器可以配置为进行本公开中描述的任何或全部技术。
在图6的示例中,视频解码器300包括熵解码单元301、运动补偿单元302、帧内预测单元303、逆量化单元304、逆变换单元305以及重建单元306和缓冲器307。在一些示例中,视频解码器300可以进行与关于视频编码器200(图5)所描述的编码过程互逆的解码过程。
熵解码单元301可以检索编码比特流。编码比特流可以包括熵编解码视频数据(例如,视频数据的编码块)。熵解码单元301可以对熵编解码视频进行解码,并且根据熵解码视频数据,运动补偿单元302可以确定包括运动矢量、运动矢量精度、参考图片列表索引和其他运动信息的运动信息。运动补偿单元302例如可以通过进行AMVP和merge模式确定此类信息。
运动补偿单元302可以产生运动补偿块,可能地基于插值滤波器进行插值。要以子像素精度使用的插值滤波器的标识符可以包括在语法元素中。
运动补偿单元302可以使用由视频编码器200在编码视频块的期间所使用的插值滤波器,来计算出参考块的子整数个像素的插值的值。运动补偿单元302可以根据接收的语法信息确定由视频编码器200所使用的插值滤波器并且使用插值滤波器来产生预测块。
运动补偿单元302可以使用一些语法信息来确定:用于对编码视频序列的(多个)帧和/或(多个)条带进行编码的块的尺寸,描述编码视频序列的图片的每个宏块如何被分割的分割信息,指示如何编码每个分割的模式,每个帧间编码块的一个或多个参考帧(和参考帧列表),以及对编码视频序列进行解码的其他信息。
帧内预测单元303可以使用例如在比特流中接收的帧内预测模式来从空域相邻块形成预测块。逆量化单元303逆量化(即,去量化)在比特流中提供的且由熵解码单元301解码的量化的视频块系数。逆变换单元303应用逆变换。
重建单元306可以用由运动补偿单元202或帧内预测单元303生成的对应预测块求和残差块,以形成解码块。如所期望的,去块滤波器还可以应用于滤波解码块以便移除块效应伪影。解码视频块然后存储在缓冲器307中,该缓冲器307提供用于随后的运动补偿/帧内预测的参考块,并且还产生用于在显示设备上呈现的解码视频。
接下来提供了一些实施例优选的解决方案的列表。
以下解决方案显示了上一章节中讨论的技术的示例实施例(例如,项目1-3)。
1.一种视频处理方法(例如,图3中的方法600),包括执行视频和视频的编解码表示之间的转换(602),其中编解码表示符合格式规则,其中格式规则规定指示参考图片重采样对对应视频段的适用性的语法字段的使用。
以下解决方案显示了上一章节中讨论的技术的示例实施例(例如,项目1)。
2.根据解决方案1所述的方法,其中,规则规定不依赖包括在对应于视频段的序列参数集中的子图片的值来推导语法字段的值。
以下解决方案显示了上一章节中讨论的技术的示例实施例(例如,项目2)。
3、根据解决方案1-2中任一项所述的方法,其中,规则规定语法字段的值是基于子图片是否被视为用于转换的图片来推导的。
以下解决方案显示了上一章节中讨论的技术的示例实施例(例如,项目3)。
4.根据解决方案1-3中任一项所述的方法,其中,规则规定语法字段的值是基于当前图片和当前图片的参考图片是否属于同一层和/或是否允许层间预测来推导的。
以下解决方案显示了上一章节中讨论的技术的示例实施例(例如,项目4)。
5.一种视频处理方法,包括:执行视频和视频的编解码表示之间的转换,其中编解码表示符合格式规则,其中格式规则规定基于对应于访问单元分隔符的第二语法元素的值来约束图片标头或条带标头中的第一语法元素的值。
以下解决方案显示了上一章节中讨论的技术的示例实施例(例如,项目5-6)。
6.一种视频处理方法,包括:执行视频和视频的编解码表示之间的转换,其中编解码表示符合格式规则,其中格式规则规定是否以及如何包括通用约束信息字段中的一个或多个语法元素。
7.根据解决方案6所述的方法,其中规则规定一个或多个语法元素是否被包括在编解码表示中是基于编解码表示中的第二字段的字节数。
8.根据解决方案6-7中任一项所述的方法,其中规则规定当一个或多个语法元素被包括在通用约束信息语法元素中时存在保留比特的数量。
9.根据解决方案1-8中任一项所述的方法,其中执行转换包括对视频进行编码以生成编解码表示。
10.根据解决方案1-8中任一项所述的方法,其中执行转换包括解析和解码编解码表示以生成视频。
11.一种视频解码装置,包括被配置为实现解决方案1至10中的一个或多个所述的方法的处理器。
12.一种视频编码装置,包括被配置为实现解决方案1至10中的一个或多个所述的方法的处理器。
13.一种其上存储有计算机代码的计算机程序产品,该代码在由处理器执行时使处理器实现解决方案1至10中的任一项所述的方法。
14.本文档中描述的方法、装置或系统。
图7是根据本技术的一个或多个实施例的用于处理视频数据的方法700的流程图表示。方法700包括,在操作710,根据规则执行视频的当前图片和视频的比特流之间的转换。规则规定响应于当前图片是恢复图片顺序计数(POC)计数为0的逐渐解码刷新(GDR)图片,当前图片是恢复点图片。恢复POC计数规定输出顺序中的解码图片的恢复点。
在一些实施例中,规则进一步规定,响应于当前图片是恢复POC计数大于0的GDR图片,在解码顺序中在当前GDR图片之后并且恢复POC计数为0的另一图片是恢复点图片。在一些实施例中,恢复点图片在解码顺序中不在当前GDR图片之前。在一些实施例中,与具有大于0的恢复POC计数的当前GDR图片相关联的图片被称为当前GDR图片的恢复图片。
图8是根据本技术的一个或多个实施例的用于处理视频数据的方法800的流程图表示。方法800包括,在操作810,根据规则执行视频和视频的比特流之间的转换。规则规定通用约束信息(GCI)语法结构的语法元素指示与即时解码刷新(IDR)图片和混合网络抽象层(NAL)单元类型的使用相关联的参考图片列表。
在一些实施例中,语法元素等于1规定没有参考图片列表被指示用于IDR图片和视频编解码层VCL的限制,IDR图片的NAL单元具有相同的值。在一些实施例中,语法元素等于0规定不施加限制。在一些实施例中,语法元素等于1规定参考图片列表的语法元素不存在于IDR图片的条带标头中的限制,并且规定混合NAL单元类型的使用的语法标志被禁用。在一些实施例中,语法元素等于0规定不施加限制。
在一些实施例中,响应于语法元素不存在于GCI语法结构中,语法元素的值被推断为X,X为0或1。
图9是根据本技术的一个或多个实施例的用于处理视频数据的方法900的流程图表示。方法900包括,在操作910,执行包括当前视频块的视频和视频的比特流之间的转换。根据规则,规定与当前视频块的转换相关联的量化参数(QP)表中的点数的第一语法元素的属性取决于一个或多个其它语法元素。
在一些实施例中,属性包括第一语法元素的值,且规则规定第一语法元素的值基于第二语法元素的值,第二语法元素规定用于描述QP表的起始亮度和色度QP。在一些实施例中,QP表是多个QP表中的第i个QP表。在一些实施例中,第一语法元素的值等于(K-第二语法元素的值),K是正整数。在一些实施例中,第二语法被表示为sps_qp_table_start_minus26[i],其值加26规定用于描述第i个QP表的起始亮度和色度QP。在一些实施例中,第一语法元素的值等于(36–sps_qp_table_start_minus26[i])。在一些实施例中,K等于(最大允许QP值-1)。
在一些实施例中,属性包括是否明确指示了第一语法元素。在一些实施例中,属性包括第一语法元素的推断值。在一些实施例中,属性包括允许第一语法元素采用的值的范围。在一些实施例中,规则规定第一语法的值与起始亮度和色度QP的和小于最大允许QP值。
图10是根据本技术的一个或多个实施例的用于处理视频数据的方法1000的流程图表示。方法1000包括,在操作1010,执行视频和视频的比特流之间的转换。比特流符合规则,规则规定输入量化参数(QP)值和输出QP值在-QpBdOffset到K的范围内。QpBdOffset规定亮度和色度量化参数范围偏移的值,并且K与最大允许QP值相关联。
在一些实施例中,K等于(最大允许QP值-1)。在一些实施例中,最大允许QP值等于63。
在一些实施例中,转换包括将视频编码成比特流。在一些实施例中,转换包括从比特流中解码视频。
本文档中所述的公开和其他方案、示例、实施例、模块和功能操作可以被实现在数字电子电路中或者在计算机软件、固件或硬件中,含有本文档中所公开的结构以及其结构的等同物,或者它们中的一个或多个的组合。所公开的和其他实施例可以被实现为计算机可读介质上所编码的一个或多个计算机程序产品,即一个或多个计算机程序指令模块,用于由数据处理装置执行或者控制数据处理装置的操作。该计算机可读介质可以是机器可读存储设备、机器可读存储基板、存储器设备、影响机器可读可传播信号的复合物,或其一个或多个的组合。术语“数据处理装置”涵盖用于处理数据的所有装置、设备和机器,包括例如可编程处理器、计算机或多个处理器或计算机。除了硬件之外,该装置还可以包括为所讨论的计算机程序创建执行环境的代码,例如,构成处理器固件、协议栈、数据库管理系统、操作系统、或者它们中的一个或多个的组合的代码。传播信号是人工生成的信号,例如,机器生成的电、光或电磁信号,其被生成来编码信息以传输到合适的接收器装置。
计算机程序(也称为程序、软件、软件应用、脚本或代码)可以用任何形式的编程语言编写,包括编译或解释语言,并且可以以任何形式来部署计算机程序,包括独立程序或适合在计算环境中使用的模块、组件、子例程或其它单元。计算机程序不必须对应于文件系统中的文件。程序可以存储在保存其他程序或数据的文件的部分中(例如,在标记语言文档中存储的一个或多个脚本)、在专用于所讨论的程序的单个文件中、或在多个协同文件中(例如存储一个或多个模块、子程序或代码部分的文件)。计算机程序可以部署为在一个计算机上或者在多个计算机上执行,该多个计算机位于一个站点处或者分布跨多个站点并由通信网络互连。
可以由执行一个或多个计算机程序的一个或多个可编程处理器来进行在本文档中所描述的过程和逻辑流,以通过在输入数据上操作并且生成输出来进行功能。也可以由专用逻辑电路(例如,现场可编程门阵列(FPGA)或专用集成电路(ASIC))进行过程和逻辑流,并且装置可以实现为专用逻辑电路(例如FPGA或ASIC)。
适合于计算机程序的执行的处理器包括例如通用和专用微处理器两者,以及任何类型的数字计算机的任何一个或多个处理器。通常,处理器将从只读存储器或随机存取存储器或者该两者接收指令和数据。计算机的基本元件是用于进行指令的处理器和用于存储指令和数据的一个或多个存储器设备。通常,计算机还将包括用于存储数据的一个或多个海量存储设备(例如磁、磁光盘或光盘),或者可操作地耦合以从海量存储设备(例如磁、磁光盘或光盘)接收数据或者将数据传输到海量存储设备(例如磁、磁光盘或光盘),或者以上两者。但是,计算机不必具有此类设备。适用于存储计算机程序指令和数据的计算机可读介质含有所有形式的非易失性存储器、介质和存储器设备,含有例如半导体存储器设备(例如EPROM、EEPROM和闪速存储器设备);磁盘(例如内部硬盘或可移动磁盘);磁光盘;和CDROM和DVD-ROM磁盘。处理器和存储器可以由专用逻辑电路补充,或者合并在专用逻辑电路中。
虽然本专利文档含有许多细节,但这些细节不应被解释为对任何主题或可要求保护的范围的限制,而是作为规定于特定技术的特定实施例的特征的描述。在本专利文档中,在单独的实施例的上下文中描述的某些特征也可以在单个实施例中组合实现。相反地,在单个实施例的上下文中所描述的各种特征还可以分别在多个实施例中来实现或者以各种合适的子组合来实现。此外,尽管特征可以如上文描述为以某些组合起作用并且甚至最初同样地要求,但是在某些情况下来自所要求保护的组合的一个或多个特征可以从组合中去除,并且所要求保护的组合可以针对子组合或子组合的变化。
类似地,尽管在附图中以特定顺序描绘了操作,但这不应当理解为要求按所示的特定次序或顺序次序进行此类操作或者进行所有示出的操作,以实现期望的结果。此外,在本专利文档中描述的实施例中的各种系统组件的分开不应被理解为在所有实施例中都要求这种分开。
仅描述了几个实现方式和示例,并且可以基于本专利文档中描述和示出的内容来作出其它实现方式、增强和变型。

Claims (23)

1.一种处理视频数据的方法,包括:
执行包括当前视频块的视频和所述视频的比特流之间的转换,
其中根据规则,规定与所述当前视频块的转换相关联的量化参数QP表中的点数的第一语法元素的属性取决于一个或多个其它语法元素。
2.根据权利要求1所述的方法,其中所述属性包括所述第一语法元素的值,且其中所述规则规定所述第一语法元素的值是基于第二语法元素的值,所述第二语法元素规定用于描述所述QP表的起始亮度和色度QP。
3.根据权利要求2所述的方法,其中,所述QP表是多个QP表中的第i个QP表。
4.根据权利要求2所述的方法,其中所述第一语法元素的值等于(K-所述第二语法元素的值),K是正整数。
5.根据权利要求3或4所述的方法,其中所述第二语法元素被表示为sps_qp_table_start_minus26[i],sps_qp_table_start_minus26[i]的值加26规定用于描述所述第i个QP表的所述起始亮度和色度QP。
6.根据权利要求5所述的方法,其中所述第一语法元素的值等于(36–sps_qp_table_start_minus26[i])。
7.根据权利要求3至6中任一项所述的方法,其中K等于(最大允许QP值-1)。
8.根据权利要求1所述的方法,其中,所述属性包括是否明确指示了所述第一语法元素。
9.根据权利要求1所述的方法,其中所述属性包括所述第一语法元素的推断值。
10.根据权利要求1所述的方法,其中,所述属性包括允许所述第一语法元素采用的值的范围。
11.根据权利要求10所述的方法,其中所述规则规定所述第一语法元素的值与起始亮度和色度QP的和小于最大允许QP值。
12.一种处理视频数据的方法,包括:
执行视频和所述视频的比特流之间的转换,
其中所述比特流符合规则,所述规则规定输入量化参数QP值和输出QP值在-QpBdOffset到K的范围内,其中QpBdOffset规定亮度和色度量化参数范围偏移的值,并且K与最大允许QP值相关联。
13.根据权利要求12所述的方法,其中K等于(最大允许QP值-1)。
14.根据权利要求7、11或13所述的方法,其中所述最大允许QP值等于63。
15.根据权利要求1至10中任一项所述的方法,其中,所述转换包括将所述视频编码成所述比特流。
16.根据权利要求1至10中任一项所述的方法,其中,所述转换包括从所述比特流中解码所述视频。
17.一种用于存储视频的比特流的方法,包括:
从所述视频中的当前视频块生成所述视频的比特流,以及
存储所生成的比特流,
其中根据规则,规定与所述当前视频块的转换相关联的量化参数QP表中的点数的第一语法元素的属性取决于一个或多个其它语法元素。
18.一种用于存储视频的比特流的方法,包括:
从所述视频生成所述视频的比特流,以及
存储所生成的比特流,
其中所述比特流符合规则,所述规则规定输入量化参数QP值和输出QP值在-QpBdOffset到K的范围内,其中QpBdOffset规定亮度和色度量化参数范围偏移的值,并且K与最大允许QP值相关联。
19.一种视频解码装置,包括被配置为实现权利要求1至18中的一项或多项所述的方法的处理器。
20.一种视频编码装置,包括被配置为实现权利要求1至18中的一项或多项所述的方法的处理器。
21.一种其上存储有计算机代码的计算机程序产品,所述计算机代码在由处理器执行时使所述处理器实现权利要求1至18中任一项所述的方法。
22.一种存储由视频处理装置执行的方法生成的视频的比特流的非暂时性计算机可读记录介质,其中所述方法包括:
从所述视频中的当前视频块生成所述视频的比特流,以及
存储所生成的比特流,
其中根据规则,规定与所述当前视频块的转换相关联的量化参数QP表中的点数的第一语法元素的属性取决于一个或多个其它语法元素。
23.一种存储由视频处理装置执行的方法生成的视频的比特流的非暂时性计算机可读记录介质,其中所述方法包括:
从所述视频生成所述视频的比特流,以及
存储所生成的比特流,
其中所述比特流符合规则,所述规则规定输入量化参数QP值和输出QP值在-QpBdOffset到K的范围内,其中QpBdOffset规定亮度和色度量化参数范围偏移的值,并且K与最大允许QP值相关联。
CN202180044716.XA 2020-06-22 2021-06-22 编解码视频中量化信息的信令通知 Pending CN116671101A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CNPCT/CN2020/097390 2020-06-22
CN2020097390 2020-06-22
PCT/CN2021/101390 WO2021259223A1 (en) 2020-06-22 2021-06-22 Signaling of quantization information in coded video

Publications (1)

Publication Number Publication Date
CN116671101A true CN116671101A (zh) 2023-08-29

Family

ID=79281974

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202180044716.XA Pending CN116671101A (zh) 2020-06-22 2021-06-22 编解码视频中量化信息的信令通知
CN202180044801.6A Pending CN115804091A (zh) 2020-06-22 2021-06-22 访问单元分隔符,以及视频编解码中的通用约束信息

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN202180044801.6A Pending CN115804091A (zh) 2020-06-22 2021-06-22 访问单元分隔符,以及视频编解码中的通用约束信息

Country Status (7)

Country Link
US (1) US11924475B2 (zh)
EP (2) EP4325850A3 (zh)
JP (1) JP2023529972A (zh)
KR (1) KR20230025787A (zh)
CN (2) CN116671101A (zh)
BR (1) BR112022025443A2 (zh)
WO (2) WO2021259222A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11895310B2 (en) * 2021-07-02 2024-02-06 Sharp Kabushiki Kaisha Systems and methods for signaling operation range profile information in video coding
WO2024100242A1 (en) * 2022-11-11 2024-05-16 Telefonaktiebolaget Lm Ericsson (Publ) Changing quantization parameter values based on resolution change

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8675738B2 (en) 2008-08-06 2014-03-18 Mediatek Inc. Video decoding method without using additional buffers for storing scaled frames and system thereof
HUE049811T2 (hu) * 2012-04-15 2020-10-28 Samsung Electronics Co Ltd Videodekódoló berendezés, amely paraméter aktualizálást használ entrópiakódolt transzformáció együttható debinarizálására és kódolási eljárás, amely ugyanazt használja binarizálásra
US10880565B2 (en) * 2014-03-24 2020-12-29 Qualcomm Incorporated Use of specific HEVC SEI messages for multi-layer video codecs
US9807419B2 (en) * 2014-06-25 2017-10-31 Qualcomm Incorporated Recovery point SEI message in multi-layer video codecs
US10390020B2 (en) 2015-06-08 2019-08-20 Industrial Technology Research Institute Video encoding methods and systems using adaptive color transform
US11909974B2 (en) * 2018-03-30 2024-02-20 Interdigital Vc Holdings, Inc. Chroma quantization parameter adjustment in video encoding and decoding
TWI752341B (zh) * 2018-08-04 2022-01-11 大陸商北京字節跳動網絡技術有限公司 不同解碼器側運動矢量推導模式之間的交互
US10972755B2 (en) * 2018-12-03 2021-04-06 Mediatek Singapore Pte. Ltd. Method and system of NAL unit header structure for signaling new elements
SG11202106524PA (en) 2018-12-20 2021-07-29 Ericsson Telefon Ab L M Normative indication of recovery point
WO2020185879A1 (en) 2019-03-11 2020-09-17 Dolby Laboratories Licensing Corporation Video coding using reference picture resampling supporting region of interest
WO2021061019A1 (en) * 2019-09-23 2021-04-01 Huawei Technologies Co., Ltd. Method and apparatus for chrominance quantization parameters signalling
US11611778B2 (en) * 2020-05-20 2023-03-21 Sharp Kabushiki Kaisha Systems and methods for signaling general constraint information in video coding

Also Published As

Publication number Publication date
WO2021259222A1 (en) 2021-12-30
EP4173287A4 (en) 2023-11-22
EP4325850A3 (en) 2024-04-17
KR20230025787A (ko) 2023-02-23
JP2023529972A (ja) 2023-07-12
EP4173287A1 (en) 2023-05-03
US20230128218A1 (en) 2023-04-27
EP4325850A2 (en) 2024-02-21
CN115804091A (zh) 2023-03-14
BR112022025443A2 (pt) 2023-04-25
WO2021259223A1 (en) 2021-12-30
US11924475B2 (en) 2024-03-05

Similar Documents

Publication Publication Date Title
US11831894B2 (en) Constraints on signaling of video layers in coded bitstreams
CN114846786A (zh) 对视频比特流中的假设参考解码器参数的信令的约束
KR20220155277A (ko) 스케일러블 비디오 코딩의 랜덤 액세스 포인트 액세스 유닛
CN115136598A (zh) 推断比特流中的视频分量的权重值
US11924475B2 (en) Signaling of quantization information in coded video
KR20220155293A (ko) 비디오 코딩에서 픽처 출력 플래그 표시
WO2021244563A1 (en) Reference picture resampling
JP2023526494A (ja) 一般制約フラグのシグナリング
CN115699747A (zh) 视频子比特流提取过程中的可缩放嵌套sei消息处理
CN117528004A (zh) 多层视频比特流的子比特流提取
JP2023520828A (ja) ビデオコーディングにおける一般制約情報
CN115812304A (zh) 具有不同的编解码块大小的层间预测
KR20230013052A (ko) 코딩된 비디오의 시퀀스 끝 표시
KR20230017203A (ko) 일반 제약 정보의 시그널링
KR20220159987A (ko) 비디오 코딩에서의 적합성 윈도우 파라미터
KR20230021664A (ko) 다중 계층 비디오 코딩에 대한 픽처 헤더 제약들
CN115486067A (zh) 视频图片标头中的滤波器参数信令通知
CN115836524A (zh) 自适应环路滤波
CN115428457A (zh) 基于颜色格式的自适应参数集的约束

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination