CN115211044A - 使用条带头信令通知控制缩放处理 - Google Patents

使用条带头信令通知控制缩放处理 Download PDF

Info

Publication number
CN115211044A
CN115211044A CN202180019098.3A CN202180019098A CN115211044A CN 115211044 A CN115211044 A CN 115211044A CN 202180019098 A CN202180019098 A CN 202180019098A CN 115211044 A CN115211044 A CN 115211044A
Authority
CN
China
Prior art keywords
indicator
value
video
slice
equal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180019098.3A
Other languages
English (en)
Inventor
王业奎
张莉
张凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ByteDance Inc
Original Assignee
ByteDance Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ByteDance Inc filed Critical ByteDance Inc
Publication of CN115211044A publication Critical patent/CN115211044A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/48Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using compressed domain processing techniques other than decoding, e.g. modification of transform coefficients, variable length coding [VLC] data or run-length data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/563Motion estimation with padding, i.e. with filling of non-object values in an arbitrarily shaped picture block or region for estimation purposes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/86Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving reduction of coding artifacts, e.g. of blockiness

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

描述了用于视频编码和视频解码的几种技术。一个示例方法包括执行视频的视频块和视频的比特流之间的转换,其中,比特流符合格式规则,其中,格式规则规定,第一语法元素被包括在视频区域级别的比特流中,第一语法元素指示缩放处理被应用于视频块的变换系数还是非变换系数,并且其中,视频区域小于视频的视频图片。

Description

使用条带头信令通知控制缩放处理
相关申请的交叉引用
根据巴黎公约适用的专利法和/或规则,提出本申请是为了及时要求2020年3月3日提交的美国临时专利申请No.62/984,658的优先权和权益。出于法律规定的所有目的,上述申请的全部公开内容通过引用并入作为本申请的公开内容的部分。
技术领域
本专利文档涉及图像和视频编解码和解码。
背景技术
数字视频占互联网和其他数字通信网络上最大的带宽使用。随着能够接收和显示视频的连接用户设备数量的增加,预计数字视频使用的带宽需求将继续增长。
发明内容
本文档公开了可由视频编码器和解码器使用的技术,以使用对编解码表示的解码有用的控制信息来处理视频的编解码表示。
在一个示例方面,公开了一种视频处理方法。该方法包括,执行视频的视频块和视频的比特流之间的转换,其中,比特流符合格式规则,其中,格式规则规定,第一语法元素被包括在视频区域级别的比特流中,第一语法元素指示缩放处理是应用于视频块的变换系数还是应用于视频块的非变换系数,并且其中,视频区域小于视频的视频图片。
在另一个示例方面,公开了一种视频处理方法。该方法包括,执行视频的视频区域的视频单元和视频的比特流之间的转换,其中,比特流符合格式规则,其中,格式规则规定,比特流中的视频区域的第一级别的第一控制信息指示第二控制信息是否被包括在比特流中的视频单元的第二级别中,并且其中,第一控制信息和/或第二控制信息包括关于缩放列表是用于转换的变换系数还是用于转换的非变换系数的信息。
在另一个示例方面,公开了一种视频处理方法。该方法包括,执行视频的视频块和视频的比特流之间的转换,其中,视频块使用低频不可分变换进行转换,其中,比特流符合格式规则,格式规则规定,在比特流的语法级别包括语法元素,其中,语法元素指示是否为视频块启用从参考缩放列表推导的缩放矩阵的使用,并且其中,语法级别是序列级别、图片级别或条带级别。
在另一个示例方面,公开了一种视频处理方法。该方法包括,对于视频的视频单元和视频的比特流之间的转换,确定使用视频单元的边界外的填充样点对沿着视频单元的边界的视频单元的样点执行去方块滤波;并且根据确定来执行转换。
在另一个示例方面,公开了一种视频处理方法。该方法包括,执行包括一个或多个视频图片的视频和视频的编解码表示之间的转换,其中,每个视频图片包括一个或多个片,其中,编解码表示符合格式规则;其中,格式规则规定,在编解码表示中信令通知的第一信息和从编解码表示中推导的第二信息,其中,至少第一信息或第二信息与一个或多个片的行索引或列索引相关。
在另一个示例方面,公开了一种视频处理方法。该方法包括,执行视频的视频区域的视频单元和视频的编解码表示之间的转换,其中,编解码表示符合格式规则;其中,格式规则规定,视频区域处的第一控制信息控制是否在视频单元级别包括第二控制信息;其中,第一控制信息和/或第二控制信息包括关于用于转换的亮度映射与色度缩放(lumamapping and chroma scaling,LMCS)或色度残差缩放(chroma residue scaling,CRS)或重塑处理(reshaping process,RP)的信息。
在又一示例中,公开了另一种视频处理方法。该方法包括,执行包括一个或多个视频区域的视频和该视频的编解码表示之间的转换,该一个或多个视频区域包括一个或多个视频单元;其中,编解码表示符合格式规则;其中,格式规则规定,编解码表示包括可用于转换至少一些视频单元的缩放列表的两级别信令通知,其中,视频区域级别的两级别信令通知中的高级别信令通知控制视频单元级别的两级别信令通知中的低级别信令通知是否以及在何处被包括在编解码表示中;其中,缩放列表包括关于用于至少一些视频单元的转换的缩放的信息。
在又一示例中,公开了另一种视频处理方法。该方法包括,确定用于视频的视频单元和视频的编解码表示之间的转换的低频不可分变换的缩放列表;并且基于确定来执行转换,其中,编解码表示中的语法结构指示是否为视频单元启用缩放列表。
在又一示例方面,公开了一种视频编码器装置。视频编码器包括被配置为实施上述方法的处理器。
在又一示例方面,公开了一种视频解码器装置。视频解码器包括被配置为实施上述方法的处理器。
在又一示例方面,公开了一种其上存储有代码的计算机可读介质。该代码以处理器可执行代码的形式体现了本文描述的方法之一。
本文档中描述了这些和其他特征。
附图说明
图1示出了图片的光栅扫描条带分割的示例,其中,图片被划分为12个片和3个光栅扫描条带。
图2示出了图片的矩形条带分割的示例,其中,图片被划分为24个片(6个片列和4个片行)和9个矩形条带。
图3示出了被分割为片和矩形条带的图片的示例,其中,图片被划分为4个片(2个片列和2个片行)和4个矩形条带。
图4示出了被分割为15个片、24个条带和24个子图片的图片。
图5为示例视频处理系统的框图。
图6为视频处理装置的框图。
图7为视频处理的示例方法的流程图。
图8是图示根据本公开的一些实施例的视频编解码系统的框图。
图9是图示根据本公开的一些实施例的编码器的框图。
图10是图示根据本公开的一些实施例的解码器的框图。
图11示出了去方块滤波的填充处理的示例。
图12至图15是视频处理的示例方法的流程图。
具体实施方式
本文档中使用章节标题是为了便于理解并且不将各章节中公开的技术和实施例的适用性仅限制于该章节。此外,在一些描述中使用H.266术语仅仅是为了易于理解,而不是为了限制所公开技术的范围。因此,本文描述的技术也适用于其他视频编解码器协议和设计。在本文档中,相对于VVC规范的当前草案,编辑更改显示为指示取消文本的斜体文本和指示添加文本的粗体斜体文本。
1.介绍
本文档涉及视频编解码技术。具体来说,其为关于对子图片、LMCS、AMVR和缩放列表的支持。关于子图片的方面包括推导一个子图片中包含的片行和列的数量,以及当每个子图片仅包含一个条带时推导条带中包含的CTU的光栅扫描CTU地址列表。LMCS方面是关于在不同级别上启用LMCS的信令通知。AMVR的方面是关于sps_affine_amvr_enabled_flag的语义。缩放列表的方面是关于启用在不同级别上使用显式缩放列表。这些想法可以单独或以各种组合应用于支持单层和/或多层视频编解码的任何视频编解码标准或非标准视频编解码器,例如正在开发的多功能视频编解码(Versatile Video Coding,VVC)。
2.缩写
ALF(Adaptive Loop Filter) 自适应环路滤波器
AMVR(Adaptive Motion Vector difference Resolution) 自适应运动矢量差精度
APS(Adaptation Parameter Set) 自适应参数集
AU(Access Unit) 接入单元
AUD(Access Unit Delimiter) 接入单元分隔符
AVC(Advanced Video Coding) 高级视频编解码
CLVS(Coded Layer Video Sequence) 编解码层视频序列
CPB(Coded Picture Buffer) 编解码图片缓冲器
CRA(Clean Random Access) 清理随机接入
CTU(Coding Tree Unit) 编解码树单元
CVS(Coded Video Sequence) 编解码视频序列
DPB(Decoded Picture Buffer) 解码图片缓冲器
DPS(Decoding Parameter Set) 解码参数集
EOB(End Of Bitstream) 比特流结尾
EOS(End Of Sequence) 序列结尾
GDR(Gradual Decoding Refresh) 逐渐解码刷新
HEVC(High Efficiency Video Coding) 高效视频编解码
HRD(Hypothetical Reference Decoder) 假设参考解码器
IDR(Instantaneous Decoding Refresh) 即时解码刷新
JEM(Joint Exploration Model) 联合探索模型
LFNST(Low Frequency Non-Separable Transform) 低频不可分变换
LMCS(Luma Mapping with Chroma Scaling) 亮度映射与色度缩放
MCTS(Motion-Constrained Tile Sets) 运动约束片集
NAL(Network Abstraction Layer) 网络抽象层
OLS(Output Layer Set) 输出层集
PH(Picture Header) 图片标头
PPS(Picture Parameter Set) 图片参数集
PTL(Profile,Tier and Level) 档次、层和级别
PU(Picture Unit) 图片单元
RBSP(Raw Byte Sequence Payload) 原始字节序列有效载荷
SEI(Supplemental Enhancement Information) 辅助增强信息
SPS(Sequence Parameter Set) 序列参数集
SVC(Scalable Video Coding) 可缩放视频编解码
VCL(Video Coding Layer) 视频编解码层
VPS(Video Parameter Set) 视频参数集
VTM(VVC Test Model) VVC测试模型
VUI(Video Usability Information) 视频可用性信息
VVC(Versatile Video Coding) 多功能视频编解码
3.初步讨论
视频编解码标准主要是通过众所周知的ITU-T和ISO/IEC标准的发展而得以演进。ITU-T制作了H.261和H.263标准,ISO/IEC制作了MPEG-1和MPEG-4Visual标准,并且两个组织联合制作了H.262/MPEG-2视频标准和H.264/MPEG-4高级视频编解码(AVC)标准和H.265/HEVC标准。从H.262开始,视频编解码标准基于混合视频编解码结构,其中,利用时域预测加变换编解码。为了探索HEVC之外的未来视频编解码技术,由VCEG和MPEG于2015年联合成立联合视频探索团队(Joint Video Exploration Team,JVET)。从那时起,JVET采用了许多新方法并将其纳入名为联合探索模型(JEM)的参考软件。JVET会议每季度同时举行一次,新编解码标准的目标是与HEVC相比降低50%比特率。新的视频编解码标准在2018年4月的JVET会议上被正式命名为多功能视频编码(VVC),并且第一版VVC测试模型(VTM)也在当时发布。随着VVC标准化的不断努力,新的编解码技术在每次JVET会议上都被采用到VVC标准中。VVC的工作草案和测试模型VTM在每次会议后都会更新。VVC项目现在的目标是在2020年7月的会议上技术完成(FDIS)。3.1.HEVC中的图片分割方案
HEVC包括四种不同的图片分割方案,即常规条带、非独立条带、片和波前并行处理(Wavefront Parallel Processing,WPP),这可应用于最大传输单元(Maximum TransferUnit,MTU)尺寸匹配、并行处理和减小端到端延迟。
常规条带与H.264/AVC中的类似。每个常规条带都被封装在其自己的NAL单元中,并且禁用了跨条带边界的图片内预测(帧内样点预测、运动信息预测、编解码模式预测)和熵编解码依赖性。因此,可以独立于同一图片内的其他常规条带重建常规条带(尽管由于环路滤波操作可能仍然存在相互依赖性)。
常规条带是唯一可用于并行化的工具,该工具在H.264/AVC中也以几乎相同的形式可用。基于常规条带的并行化不需要太多处理器间或核间通信(除了在解码预测编解码图片时用于运动补偿的处理器间或核间数据共享,由于帧内图片预测,这通常比处理器间或核间的数据共享重得多)。然而,出于同样的原因,由于条带头的比特成本以及跨条带边界的预测缺失,使用常规条带可能会产生大量的编解码开销。此外,由于常规条带的图片内独立性以及每个常规条带都被封装在其自己的NAL中,因此常规条带(与下面提到的其他工具相比)也可作为比特流分割以匹配MTU尺寸要求的关键机制。在许多情况下,并行化的目标和MTU尺寸匹配的目标对图片中的条带布局的要求是矛盾的。这种情况的实现导致了下面提到的并行化工具的开发。
非独立条带具有短条带头并且允许在树块边界处对比特流进行分割而不破坏任何图片内预测。基本上,非独立条带将常规条带分成多个NAL单元,通过允许在整个常规条带的编码完成之前发送常规条带的一部分来减少端到端延迟。
在WPP中,图片被分割成单行的编解码树块(CTB)。允许熵解码和预测以使用来自其他分割中的CTB的数据。通过CTB行的并行解码可以进行并行处理,其中,CTB行的解码开始延迟两个CTB,以确保与在主体CTB上方和右侧的CTB相关的数据可以在正在解码的主体CTB之前获得。使用这种交错开始(这以图形方式表示时看起来像一个波前),可以并行化与包含有CTB行的图片一样多的处理器/核。因为允许图片内的临近树块行之间的图片内预测,所以实现图片内预测所需的处理器间/核间通信可能是大量的。与未应用WPP分割相比,WPP分割不会导致产生额外的NAL单元,因此WPP不是用于MTU尺寸匹配的工具。但是,如果需要MTU尺寸匹配,则可以将常规条带与WPP一起使用,但具有一定的编解码开销。
片定义将图片分割为片列和片行的水平和垂直边界。片列从图片的上方延伸到图片下方。同样,片行从图片的左侧延伸到图片的右侧。图片中的片数可以简单地通过片列数乘以片行数推导。
在按照图片的片光栅扫描的顺序解码下一个片的左上CTB之前,CTB的扫描顺序被改变为片内的本地扫描顺序(按照片的CTB光栅扫描的顺序)。与常规条带类似,片打破了图片内预测依赖性以及熵解码依赖性。但是,它们不需要被包含在独立的NAL单元中(在这方面与WPP相同);因此片不能用于MTU尺寸匹配。每个片可由一个处理器/核处理,并且在条带跨越多个片的情况下,解码临近片的处理单元之间的图片内预测所需的处理器间/核间通信仅限于传送共享的条带头和与重建样点和元数据的共享相关的环路滤波。当条带中包含一个以上的片或WPP段时,条带中除第一个之外的每个片或WPP段的入口点字节偏移量在条带头中被信令通知。
为简单起见,在HEVC中指定了对四种不同图片分割方案的应用的限制。对于HEVC中指定的大多数档次,给定的编解码视频序列不能同时包含片和波前。对于每个条带和片,必须满足以下条件之一或两者:1)条带中的所有编解码树块都属于同一个片;2)片中的所有编解码树块属于同一个条带。最后,波前段恰好包含一个CTB行,并且当使用WPP时,如果条带在CTB行内开始,则该条带必须在同一CTB行中结束。
在JCT-VC输出文档JCTVC-AC1005、J.Boyce、A.Ramasubramonian、R.Skupin、G.J.Sullivan、A.Tourapis、Y.-KWang(编辑)中指定了HEVC的最近修订。“HEVC AdditionalSupplemental Enhancement Information(草稿4)”,2017年10月24日在此公开:http://phenix.intevry.fr/jct/doc_end_user/documents-/29_Macau/wg11/JCTVC-AC1005-v2.zip。包含此修订内,HEVC指定了三个与MCT相关的SEI消息,即时域MCTS SEI消息、MCTS提取信息集SEI消息和MCTS提取信息嵌套SEI消息。
时域MCTS SEI消息指示比特流中存在MCTS并信令通知MCTS。对于每个MCTS,运动矢量被限制为指向MCTS内的全样点位置和仅需要MCTS内的全样点位置进行插值的分数样点位置,并且不允许使用对于来自MCTS之外的块推导的时域运动矢量预测的运动矢量候选。这样,每个MCTS可以在不存在未包括在MCTS中的片的情况下进行独立解码。
MCTS提取信息集SEI消息提供补充信息,该补充信息可用于MCTS子比特流提取(指定为SEI消息的语义的部分)以生成符合MCTS组的比特流。该信息由多个提取信息集组成,每个提取信息集定义多个MCTS组并包含要在MCTS子比特流提取过程期间使用的替换VPS、SPS和PPS的RBSP字节。在根据MCTS子比特流提取过程提取子比特流时,参数集(VPS、SPS和PPS)需要重写或替换,条带头需要稍微更新,因为一个或全部与条带地址相关的语法元素(包括first_slice_segment_in_pic_flag和slice_segment_address)通常需要具有不同的值。
3.2.VVC中图片的分割
在VVC中,图片被分为一个或多个片行和一个或多个片列。片是覆盖图片的矩形区域的CTU序列。片中的CTU在该片内以光栅扫描顺序进行扫描。
条带由图片的片内的整数个完整片或整数个连续完整CTU行组成。
支持两种条带模式,即光栅扫描条带模式和矩形条带模式。在光栅扫描条带模式中,条带包含图片的片光栅扫描中的完整条带序列。在矩形条带模式中,条带包含共同形成图片的矩形区域的多个完整片或共同形成图片的矩形区域的一个片的多个连续完整CTU行。矩形条带内的片在对应于该条带的矩形区域内以片光栅扫描顺序进行扫描。
子图片包含共同覆盖图片的矩形区域的一个或多个条带。
图1示出了图片的光栅扫描条带分割的示例,其中,图片被分割为12个片和3个光栅扫描条带。
图2示出了图片的矩形条带分割的示例,其中,图片被分割为24个片(6个片列和4个片行)和9个矩形片。
图3示出了被分割为片和矩形条带的图片的示例,其中,图片被分割为4个片(2个片列和2个片行)和4个矩形条带。
图4示出了图片的子图片分割的示例,其中,图片被分割为18个片,左侧的12个片(每个覆盖一个有4x4个CTU的条带)以及右侧的6个片(每个覆盖2个有2x2个CTU的垂直堆叠的条带),总共产生24个条带和24个不同维度的子图片(每个条带是子图片)。
3.3.VVC中的SPS/PPS/图片头/条带头的信令通知(如JVET-Q2001-vC)
7.3.2.3序列参数集RBSP语法
Figure BDA0003832122980000091
Figure BDA0003832122980000101
Figure BDA0003832122980000111
Figure BDA0003832122980000121
Figure BDA0003832122980000131
Figure BDA0003832122980000141
Figure BDA0003832122980000151
Figure BDA0003832122980000161
Figure BDA0003832122980000171
7.3.2.4图片参数集RBSP语法
Figure BDA0003832122980000172
Figure BDA0003832122980000181
Figure BDA0003832122980000191
Figure BDA0003832122980000201
Figure BDA0003832122980000211
7.3.2.7图片头结构语法
Figure BDA0003832122980000221
Figure BDA0003832122980000231
Figure BDA0003832122980000241
Figure BDA0003832122980000251
Figure BDA0003832122980000261
Figure BDA0003832122980000271
7.3.7.1一般条带头语法
Figure BDA0003832122980000272
Figure BDA0003832122980000281
Figure BDA0003832122980000291
Figure BDA0003832122980000301
Figure BDA0003832122980000311
3.4.JVET-Q2001-vC中片、条带和子图片的规范
3个定义
图片级别条带索引:条带到图片中的条带列表的索引,当rect_slice_flag等于1时按照它们在PPS中被信令通知的顺序。
子图片级别条带索引:条带到子图片中的条带列表的索引,当rect_slice_flag等于1时按照它们在PPS中被信令通知的顺序。
6.5.1 CTB光栅扫描、片扫描和子图片扫描处理
变量NumTileColumns指定片列的数量,以及范围从0到NumTileColumn-1(包括端值)的i的列表colWidth[i]以CTB为单位指定第i个片列的宽度,推导如下:
Figure BDA0003832122980000321
变量NumTileRows指定片行数,以及范围从0到NumTileRows-1(包括端值)的j的列表RowHeight[j]以单位为CTB指定第j个片行的高度,推导如下:
Figure BDA0003832122980000322
变量NumTilesInPic被设置为等于NumTileColumns*NumTileRows。
范围从0到NumTileColumns(包括端值)的i的列表tileColBd[i]以CTB为单位指定第i个片列边界的位置,推导如下:
for(tileColBd[0]=0,i=0;i<NumTileColumns;i++)
tileColBd[i+1]=tileColBd[i]+colWidth[i] (25)
注1–数组tileColBd[]的尺寸比CtbToTileColBd[]的推导中的片列的实际数量大1。
范围从0到NumTileRows(包括端值)的j的列表tileRowBd[j]以CTB为单位指定第j个片行边界的位置,推导如下:
for(tileRowBd[0]=0,j=0;j<NumTileRows;j++)
tileRowBd[j+1]=tileRowBd[j]+RowHeight[j] (26)
注2–上述推导中的数组tileRowBd[]的尺寸比CtbToTileRowBd[]的推导中的片行的实际数量大1。
范围从0到PicWidthInCtbsY(包括端值)的ctbAddrX的列表CtbToTileColBd[ctbAddrX]以CTB为单位指定从水平CTB地址到左侧片列边界的转换,推导如下:
Figure BDA0003832122980000331
注3–在上述推导中的数组CtbToTileColBd[]的尺寸比slice_data()信令通知的推导中CTB中的图片宽度的实际数量大1。
范围从0到PicHeightInCtbsY(包括端值)的ctbAddrY的列表CtbToTileRowBd[ctbAddrY]以CTB为单位指定从垂直CTB地址到的上方片列边界的转换,推导如下:
Figure BDA0003832122980000332
Figure BDA0003832122980000341
注4–在上述推导中的数组CtbToTileRowBd[]的尺寸比slice_data()信令通知中CTB中的图片高度的实际数量大1。
对于矩形条带,范围从0到num_slices_in_pic_minus1(包括端值)的i的列表NumCtusInSlice[i]指定第i个条带中CTU的数量,范围从0到num_slices_in_pic_minus1(包括端值)的i的列表SliceTopLeftTileIdx[i]指定条带的左上片的索引,并且范围从0到num_slices_in_pic_minus1(包括端值)的i和范围从0到NumCtusInSlice[i]–1(包括端值)的j的矩阵指定第i个条带内的第j个CTB的图片光栅扫描地址,推导如下:
Figure BDA0003832122980000342
Figure BDA0003832122980000351
其中,函数AddCtbsToSlice(sliceIdx,startX,stopX,startY,stopY)被指定如下:[Ed.(YK):考虑以与规范中定义的其他函数一致的方式定义这个函数。]
Figure BDA0003832122980000352
Figure BDA0003832122980000361
比特流一致性的要求是,范围从0到num_slices_in_pic_minus1(包括端值)的i的NumCtusInSlice[i]的值应大于0。此外,比特流一致性的要求是,范围从0到num_slices_in_pic_minus1(包括端值)的i以及范围从0到NumCtusInSlice[i]-1(包括端值)的j的矩阵CtbAddrInSlice[i][j]应包括0到PicSizeInCtbsY-1范围内的所有CTB地址一次且仅一次。
范围从0到PicSizeInCtbsY-1(包括端值)的ctbAddrRs的列表CtbToSubpicIdx[ctbAddrRs]指定了从图片光栅扫描中的CTB地址到子图片索引的转换,推导如下:[Ed.(YK):考虑将CtbToSubpicIdx[]定义为局部变量,因为它仅在本子条款中使用。]
Figure BDA0003832122980000362
列表NumSlicesInSubpic[i]指定第i个子图片中的矩形条带的数量,推导如下:
Figure BDA0003832122980000363
Figure BDA0003832122980000371
7.3.4.3图片参数集RBSP语义
subpic_id_mapping_in_pps_flag等于1指定在pps中信令通知子图片ID映射。subpic_id_mapping_in_pps_flag等于0指定PPS中不信令通知子图片ID映射。如果subpic_id_mapping_explicitly_signaled_flag为0或subpic_id_mapping_in_sps_flag等于1,则subpic_id_mapping_in_pps_flag的值应等于0。否则(sub pic_id_mapping_explicitly_signaled_flag等于1,并且subpic_id_mapping_in_sps_flag等于0),subpic_id_mapping_in_pps_flag的值应等于1。
pps_num_subpics_minus1应等于sps_num_subpics_minus1。
pps_subpic_id_len_minus1应等于sps_subpic_id_len_minus1。
pps_subpic_id[i]指定第i个子图片的子图片ID。pps_subpic_id[i]语法元素的长度为pps_subpic_id_len_minus1+1位。
对于0到sps_num_subpics_minus1范围内的每个i值,变量SubpicIdVal[i]的推导如下:
Figure BDA0003832122980000372
比特流一致性的要求是应用以下两个约束:
--对于0到sps_num_subpics_minus1(包括端值)范围内的i和j的任何两个不同值,SubpicIdVal[i]不应等于SubpicIdVal[j]。
--当当前图片不是CLVS的第一个图片时,对于0到sps_num_subpics_minus1(包括端值)范围内的每个i值,如果SubpicIdVal[i]的值不等于同一层中按照解码顺序的前一个图片的SubpicIdVal[i]的值,则具有子图片索引i的当前图片中的子图片的所有编解码条带NAL单元的nal_unit_type应等于IDR_W_RADL到CRA_NUT(包括端值)范围内的特定值。
no_pic_partition_flag等于1指定不将图片分割应用于参考PPS的每个图片。no_pic_partition_flag等于0指定参考PPS的每个图片可以被分割成一个以上的片或条带。
比特流一致性的要求是,对于CLVS内的编解码图片所参考的所有PPS,no_pic_partition_flag的值应相同。
比特流一致性的要求是,当sps_num_subpics_minus1+1的值大于1时,no_pic_partition_flag的值不应等于1。
pps_log2_ctu_size_minus5加5指定每个CTU的亮度编解码树块尺寸。pps_log2_ctu_size_minus5应等于sps_log2_ctu_size_minus5。
num_exp_tile_columns_minus1加1指定显式提供的片列宽的数量。num_exp_tile_columns_minus1的值应在0到PicWidthInCtbsY–1(包括端值)的范围内。当no_pic_partition_flag等于1时,num_exp_tile_columns_minus1的值被推断为等于0。
num_exp_tile_rows_minus1加1指定显式提供的片行高的数量。num_exp_tile_rows_minus1的值应在0到PicHeightInCtbsY–1(包括端值)的范围内。当no_pic_partition_flag等于1时,num_tile_rows_minus1的值被推断为等于0。
tile_column_width_minus1[i]加1以CTB为单位指定第i个片列的宽度,i的范围为0到num_exp_tile_columns_minus1-1(包括端值)。
tile_column_width_minus1[num_exp_tile_columns_minus1]用于推导索引大于或等于num_exp_tile_columns_minus1的片列的宽度,如条款6.5.1中所规定。tile_column_width_minus1[i]的值应在0到PicWidthInCtbsY–1(包括端值)的范围内。当不存在时,tile_column_width_minus1[0]的值推断为等于PicWidthInCtbsY-1。
tile_row_height_minus1[i]加1以CTB为单位指定第i个片行的高度,i的范围为0到num_exp_tile_rows_minus1–1(包括端值)。
tile_row_height_minus1[num_exp_tile_rows_minus1]用于推导索引大于或等于num_exp_tile_rows_minus1的片行的高度,如条款6.5.1中所规定。tile_row_height_minus1[i]的值应在0到PicHeightInCtbsY–1(包括端值)的范围内。当不存在时,tile_row_height_minus1[0]的值推断为等于PicHeightInCtbsY-1。
rect_slice_flag等于0指定每个条带内的片处于光栅扫描顺序,并且条带信息在PPS中没有被信令通知。rect_slice_flag等于1指定每个条带内的片覆盖图片的矩形区域,并且条带信息在PPS中被信令通知。当不存在时,rect_slice_flag被推断为等于1。当subpic_info_present_flag等于1时,rect_slice_flag的值应等于1。
single_slice_per_subpic_flag等于1指定每个子图片由一个且仅一个矩形条带组成。single_slice_per_subpic_flag等于0指定每个子图片可以由一个或多个矩形条带组成。当single_slice_per_subpic_flag等于1时,num_slices_in_pic_minus1被推断为等于sps_num_subpics_minus1。当不存在时,single_slice_per_subpic_flag的值被推断为等于0。[Ed.(GJS):考虑重新命名该标志或以另一种方式澄清,以避免解释该标志仅在每个图片中有一个以上子图片时才相关。]
num_slices_in_pic_minus1加1指定参考PPS的每个图片中矩形条带的数量。num_slices_in_pic_minus1的值应在0到MaxSlicesPerPicture–1(包括端值)的范围内,其中,MaxSlicesPerPicture在附录A中指定。当no_pic_partition_flag等于1时,num_slices_in_pic_minus1的值被推断为等于0。
tile_idx_delta_present_flag等于0指定tile_idx_delta值不存在于PPS中,并且根据条款6.5.1中定义的过程,参考PPS的图片中的所有矩形条带以光栅顺序指定。[Ed.(RS):添加对公式的参考。]
tile_idx_delta_present_flag等于1指定tile_idx_delta值可以存在于PPS中,并且参考PPS的图片中的所有矩形条带以tile_idx_delta的值所指示的顺序来指定。当不存在时,tile_idx_delta_present_flag的值被推断为等于0。
slice_width_in_tiles_minus1[i]加1以片列为单位指定第i个矩形条带的宽度。slice_width_in_tiles_minus1[i]的值应在0到NumTileColumns–1(包括端值)的范围内。
当slice_width_in_tiles_minus1[i]不存在时,以下适用:
--如果NumTileColumns等于1,则slice_width_in_tiles_minus1[i]的值被推断为等于0。
--否则,如条款6.5.1中所规定的,推断slice_width_in_tiles_minus1[i]的值。[Ed.(YK):添加对公式的参考。]
slice_height_in_tiles_minus1[i]加1以片行为单位指定第i个矩形条带的高度。slice_height_in_tiles_minus1[i]的值应在0到NumTileRows–1(包括端值)的范围内。
当slice_height_in_tiles_minus1[i]不存在时,以下适用:
--如果NumTileRows等于1,或者tile_idx_delta_present_flag等于0,并且tileIdx%NumTileColumns大于0,则slice_height_in_tiles_minus1[i]的值被推断为等于0。
--否则(NumTileRows不等于1,且tile_idx_delta_present_flag等于1或tileIdx%NumTileColumns等于0),当tile_idx_delta_present_flag等于1或tileIdx%NumTileColumns等于0时,slice_height_in_tiles_minus1[i]的值被推断为等于slice_height_in_tiles_minus1[i-1]。
num_exp_slices_in_tile[i]指定在包含多个矩形条带的当前片中显式提供的条带高度的数量。num_exp_slices_in_tile[i]的值应在0至RowHeight[tileY]–1(包括端值)的范围内,其中,tileY是包含第i个条带的条带行索引。当不存在时,num_exp_slices_in_tile[i]的值被推断为等于0。当num_exp_slices_in_tile[i]等于0时,变量NumSlicesInTile[i]的值被推导为等于1。
exp_slice_height_in_ctus_minus1[j]加1以CTU行为单位指定当前片中的第j个矩形条带的高度。exp_slice_height_in_ctus_minus1[j]的值应在0至RowHeight[tileY]–1(包括端值)的范围内,其中,tileY是当前片的片行索引。
当num_exp_slices_in_tile[i]大于0时,范围为0至NumSlicesInTile[i]–1的k的变量NumSlicesInTile[i]和SliceHeightInCtusMinus1[i+k]被推导如下:
Figure BDA0003832122980000411
tile_idx_delta[i]指定第i个矩形条带中的第一个片的片索引和第(i+1)个矩形条带中的第一个片的片索引之间的差。tile_idx_delta[i]的值应在-NumTilesInPic+1至NumTilesInPic–1(包括端值)的范围内。当不存在时,tile_idx_delta[i]的值被推断为等于0。当存在时,tile_idx_delta[i]的值不应等于0。
...
7.4.2.4.5 VCL NAL单元的顺序及其与编解码图片的关联
编解码图片内的VCL NAL单元的顺序被约束如下:
--对于编解码图片的任意两个编解码条带NAL单元A和B,设subpicIdxA和subpicIdxB为它们的子图片级别索引值,并且sliceAddrA和sliceddrB为它们的slice_address值。
--当以下任一条件为真时,编解码条带NAL单元A应在编解码条带NAL单元B之前:
–subpicIdxA小于subpicIdxB。
--subpicidxa等于subpicIdxB,并且sliceAddrA小于sliceAddrB。
7.4.8.1一般条带头语义
指定包含cu_qp_delta_abs的编解码单元的亮度量化参数与其预测之间的差的变量CuQpDeltaVal被设置为等于0。在确定包含cu_chroma_qp_offset_flag的编解码单元的Qp′Cb、Qp′Cr和Qp′CbCr量化参数的相应值时,指定要使用的值的变量CuQpOffsetCb、CuQpOffsetCr和CuQpOffsetCbCr都被设置为等于0。
picture_header_in_slice_header_flag等于1指定PH语法结构存在于条带头中。picture_header_in_slice_header_flag等于0指定PH语法结构不存在于条带头中。
比特流一致性的要求是,在CLVS中的所有编解码条带中,picture_header_in_slice_header_flag的值应该相同。
当编解码条带的picture_header_in_slice_header_flag等于1时,比特流一致性的要求是CLVS中不应出现nal_unit_type等于PH_NUT的VCL NAL单元。
当picture_header_in_slice_header_flag等于0时,当前图片中的所有编解码条带都应当具有等于0的picture_header_in_slice_header_flag,并且当前PU应当具有PHNAL单位。
slice_subpic_id指定包含条带的子图片的子图片ID。如果slice_subpic_id存在,则变量CurrSubpicIdx的值被推导,使得SubpicIdVal[CurrSubpicIdx]等于slice_subpic_id。否则(slice_subpic_id不存在),CurrSubpicIdx被推导为等于0。slice_subpic_id的长度为sps_subpic_id_len_minus1+1位。
slice_address指定条带的条带地址。当不存在时,slice_address的值被推断为等于0。当rect_slice_flag等于1且NumSlicesInSubpic[CurrSubpicIdx]等于1时,slice_address的值被推断为等于0。
如果rect_slice_flag等于0,则以下适用:
-条带地址是光栅扫描片索引。
-slice_address的长度为Ceil(Log2(NumTilesInPic))位。
-slice_address的值应在0到NumTilesInPic–1(包括端值)的范围内。
否则(rect_slice_flag等于1),以下适用:
-条带地址是条带的子图片级别条带索引。
-slice_address的长度为Ceil(Log2(NumSlicesInSubpic[CurrSubpicIdx]))位。
-slice_address的值应在0到NumSlicesInSubpic[CurrSubpicIdx]–1(包括端值)的范围内。
比特流一致性的要求是应用以下约束:
-如果rect_slice_flag等于0或subpic_info_present_flag等于0,则slice_address的值不应等于同一编解码图片的任何其它编解码条带NAL单元的slice_address的值。
-否则,一对slice_subpic_id和slice_address值不应等于同一编解码图片的任何其它编解码条带NAL单元的一对slice_subpic_id和slice_address值。
-图片的条带的形状应使得每个CTU在解码时,其整个左侧边界和整个上方边界由图片边界组成或由先前解码的(多个)CTU的边界组成。
sh_extra_bit[i]可以等于1或0。符合此版本的该规范的解码器应忽略sh_extra_bit[i]的值。它的值不影响解码器与此版本规范中指定的档次的一致性。
num_tiles_in_slice_minus1加1(如果存在)指定条带中的片的数量。num_tiles_in_slice_minus1的值应在0到NumTilesInPic–1(包括端值)的范围内。
变量NumCtusInCurrSlice指定当前条带中CTU的数量,并且范围从0到NumCtusInCurrSlice–1(包括端值)的i的列表CtbAddrInCurrSlice[i]指定条带内第i个CTB的图片光栅扫描地址,推导如下:
Figure BDA0003832122980000431
Figure BDA0003832122980000441
变量SubpicLeftBoundaryPos、SubpicTopBoundaryPos、SubpicRightBoundaryPos和SubpicBotBoundaryPos的推导如下:
Figure BDA0003832122980000442
...
3.5.亮度映射与色度缩放(LMCS)
LMCS包括两个方面:亮度映射(重塑过程,用RP表示)和依赖于亮度的色度残差缩放(CRS)。对于亮度信号,LMCS模式基于两个域进行操作,其中包括作为原始域的第一域和作为根据重塑模型将亮度样点映射到特定值的重塑域的第二域。此外,对于色度信令,可以应用残差缩放,其中,缩放因子是从亮度样点中推导的。
SPS、图片头(PH)和条带头(slice header,SH)中的相关语法元素和语义描述如下:
语法表
7.3.2.3序列参数集RBSP语法
Figure BDA0003832122980000451
7.3.2.7图片头结构语法
Figure BDA0003832122980000452
Figure BDA0003832122980000461
7.3.7条带头语法
7.3.7.1一般条带头语法
Figure BDA0003832122980000471
语义
sps_lmcs_enabled_flag等于1指定在CLVS中使用亮度映射与色度缩放。sps_lmcs_enabled_flag等于0指定CLVS中不使用亮度映射与色度缩放。
ph_lmcs_enabled_flag等于1指定为与PH相关的所有条带启用亮度映射与色度缩放,ph_lmcs_enabled_flag等于0指定可以为与PH相关的一个、多个或所有条带禁用亮度映射与色度缩放。当不存在时,ph_lmcs_enabled_flag的值被推断为等于0。
ph_lmcs_aps_id指定与PH相关联的条带所参考的LMCS APS的adaptation_parameter_set_id。aps_params_type等于LMCS_APS且adaptation_parameter_set_id等于ph_lmcs_aps_id的APS NAL单元的TemporalId应小于或等于与PH相关的图片的TemporalId。
ph_chroma_residual_scale_flag等于1指定为与PH关联的所有条带启用色度残差缩放。ph_chroma_residual_scale_flag等于0指定可以为与PH关联的一个、多个或所有条带禁用色度残差缩放。当ph_chroma_residual_scale_flag不存在时,其被推断为等于0。
slice_lmcs_enabled_flag等于1指定为当前条带启用亮度映射与色度缩放。slice_lmcs_enabled_flag等于0指定为当前条带不启用亮度映射与色度缩放。当slice_lmcs_enabled_flag不存在时,其被推断为等于0。
3.6.仿射编解码块的自适应运动矢量差精度(AMVR)
仿射AMVR是一种编解码工具,其允许仿射帧间编解码块以不同精度发送MV差,例如以1/4亮度样点(默认,amvr_flag设置为0)、1/16亮度样点、1亮度样点为精度。
SPS中的相关语法元素和语义描述如下:
语法表
7.3.2.3序列参数集RBSP语法
Figure BDA0003832122980000481
Figure BDA0003832122980000491
语义
sps_affine_amvr_enabled_flag等于1指定在仿射帧间模式的运动矢量编解码中使用自适应运动矢量差精度。sps_affine_amvr_enabled_flag等于0指定在仿射帧间模式的运动矢量编解码中不使用自适应运动矢量差精度。当不存在时,sps_affine_amvr_enabled_flag的值被推断为等于0。
3.7子图片级别信息SEI消息
D.7.1子图片级别信息SEI消息语法
Figure BDA0003832122980000492
Figure BDA0003832122980000501
D.7.2子图片级别信息SEI消息语义
子图片级别信息SEI消息包含有关在根据附件A测试提取的包含子图片序列的比特流的一致性时比特流中的子图片序列符合的级别的信息。
当子图片级别信息SEI消息存在于CLVS的任何图片时,子图片级别信息SEI消息将存在于CLVS的第一个图片。子图片级别信息SEI消息以解码顺序从当前图片持续到当前层,直到CLVS结束。适用于同一CLVS的所有子图片级别信息SEI消息应具有相同的内容。子图片序列由CLVS内具有相同子图片索引值的所有子图片组成。
比特流一致性的要求是,当CLVS的子图片级别信息SEI消息存在时,对于0到sps_num_subpics_minus1的(包括端值)的范围内的每个i值,subpic_treated_as_pic_flag[i]的值应等于1。
num_ref_levels_minus1加1指定为每个sps_num_subpics_minus1+1子图片信令通知的参考级别的数量。
sli_cbr_constraint_flag等于0指定为了通过使用在提取的子比特流中使用任何CPB规范的HRD来根据条款C.7对由提取比特流的任何子图片所产生的子比特流进行解码,假设的流调度器(hypothetical stream scheduler,HSS)以间歇比特率模式运行。sli_cbr_constraint_flag等于1指定HSS以恒定比特率(constant bit rate,CBR)模式运行。
explicit_fraction_present_flag等于1指定存在语法元素ref_level_fraction_minus1[i]。explicit_fraction_present_flag等于0指定语法元素ref_level_fraction_minus1[i]不存在。
sli_num_subpics_minus1加1指定CLVS的图片中子图片的数量。当存在时,sli_num_subpics_minus1的值应等于CLVS中的图片所参考的SPS中的sps_num_subpics_minus1的值。
sli_alignment_zero_bit应等于0。
ref_level_idc[i]指示附录A中指定的每个子图符合的级别。除了附录A中指定的值之外,比特流不得包含ref_level_idc的值。ref_level_idc[i]的其他值保留供ITU-T|ISO/IEC将来使用。比特流一致性的要求是,对于大于i的任何k值,ref_level_idc[i]的值应小于或等于ref_level_idc[k]。
ref_level_fraction_minus1[i][j]加1指定与第j个子图片符合的ref_level_idc[i]相关的级别限制的分数,如条款A.4.1中所规定的。
变量SubpicSizeY[j]被设置为等于(subpic_width_minus1[j]+1)*CtbSizeY*(subpic_height_minus1[j]+1)*CtbSizeY。
当不存在时,ref_level_fraction_minus1[i][j]的值推断为等于Ceil(256*SubpicSizeY[j]÷PicSizeInSamplesY*MaxLumaPs(general_level_idc)÷MaxLumaPs(ref_level_idc[i])-1。[Ed.(HD):这里的PicSizeInSamplesY不应该是条款A.4.2中指定的PicSizeMaxInSamplesY吗?]
变量RefLevelFraction[i][j]被设置为等于ref_level_fraction_minus1[i][j]+1。
变量SubpicNumTileCols[j]和SubpicNumTileRows[j]的推导如下:
Figure BDA0003832122980000511
变量SubpicCpbSizeVcl[i][j]和SubpicCpbSizeNal[i][j]的推导如下:
SubpicCpbSizeVcl[i][j]=Floor(CpbVclFactor*MaxCPB*RefLevelFraction[i][j]÷256) (D.6)
SubpicCpbSizeNal[i][j]=Floor(CpbNalFactor*MaxCPB*RefLevelFraction[i][j]÷256) (D.7)其中,根据条款A.4.2的规定,MaxCPB从ref_level_idc[i]中推导。
变量SubpicBitRateVcl[i][j]和SubpicBitRateNal[i][j]的推导如下:
SubpicBitRateVcl[i][j]=Floor(CpbVclFactor*MaxBR*RefLevelFraction[i][j]÷256) (D.8)
SubpicBitRateNal[i][j]=Floor(CpbNalFactor*MaxBR*RefLevelFraction[i][j]÷256) (D.9)
其中,根据条款A.4.2的规定,MaxBR由ref_level_idc[i]推导。
注1–当提取子图片时,产生的比特流具有大于或等于SubpicCpbSizeVcl[i][j]和SubpicCpbSizeNal[i][j]的CpbSize(在SPS中指示或推断),以及大于或等于SubpicBitRateVcl[i][j]和SubpicBitRateNal[i][j]的比特率(在SPS中指示或推断)。
比特流一致性的要求是,由提取范围从0到sps_num_subpics_minus1(包括端值)的j的第j个子图片产生的比特流,并符合具有general_tier_flag等于0和级别等于范围从0到num_ref_level_minus1(包括端值)的i的ref_level_idc[i]的档次,应遵守附录C中指定的每个比特流一致性测试的以下约束:
-Ceil(256*SubpicSizeY[j]÷RefLevelFraction[i][j])应小于或等于MaxLumaPs,其中,MaxLumaPs在表A.1中为级别ref_level_idc[i]指定。
-Ceil(256*(subpic_width_minus1[j]+1)*CtbSizeY÷RefLevelFraction[i][j])的值应小于或等于Sqrt(MaxLumaPs*8)。
-Ceil(256*(subpic_height_minus1[j]+1)*CtbSizeY÷RefLevelFraction[i][j])的值应小于或等于Sqrt(MaxLumaPs*8)。
-SubpicNumTileCols[j]的值应小于或等于MaxTileCols,并且SubpicNumTileRows[j]的值应小于或等于MaxTileRows,其中,在表A.1中为级别ref_level_idc[i]指定MaxTileCols和MaxTileRows。
-SubpicNumTileCols[j]*SubpicNumTileRows[j]的值应小于或等于MaxTileCols*MaxTileRows*RefLevelFraction[i][j],其中,在表A.1中为级别ref_level_idc[i]指定MaxTileCols和MaxTileRows。
-对于AU 0的SubpicSizeInSamplesY的值,对应于第j个子图片的AU 0的NumBytesInNalUnit变量之和应小于或等于FormatCapabilityFactor*(Max(SubpicSizeY[j],fR*MaxLumaSr*RefLevelFr action[i][j]÷256)+MaxLumaSr*(AuCpbRemovalTime[0]-AuNominalRemovalTime[0])*RefLevelFraction[i][j])÷(256*MinCr),其中,MaxLumaSr和FormatCapabilityFactor分别为表A.2和表A.3中指定的值,适用于级别ref_level_idc[i]的AU 0,并且MinCr的推导如A.4.2所示[Ed.(RS):fR是A.4.2中定义的档次特定变量。]
-对应于第j个子图片的AU n(其中,n大于0)的NumBytesInNalUnit变量之和应小于或等于FormatCapabilityFactor*MaxLumaSr*(AuCpbRemovalTime[n]-AuCpbRemovalTime[n-1])*RefLevelFraction[i][j]÷(256*MinCr),其中,MaxLumaSr和FormatCapabilityFactor分别为表A.2和表A.3中指定的值,适用于级别ref_level_idc[i]的AU n,并且MinCr的推导如A.4.2所示。
对于包含一个或多个子图片并由子图片索引SubpicSetIndices列表和子图片组NumSubpicsInSet中的多个子图片组成的任何子图片组,推导子图片组的级别信息。
相对于参考级别ref_level_idc[i]的总级别分数的变量SubpicSetAccLevelFraction[i],以及子图片组的变量SubpicSetCpbSizeVcl[i]、SubpicSetCpbSizeNal[i]、SubpicSetBitRateVcl[i]和SubpicSetBitRateNal[i]推导如下:
Figure BDA0003832122980000531
Figure BDA0003832122980000541
子图片组序列级别指示符SubpicSetLevelIdc的值推导如下:
Figure BDA0003832122980000542
其中,表A.1中为ref_level_idc[i]指定了MaxTileCols和MaxTileRows。
符合general_tier_flag等于0且级别等于SubpicSetLevelIdc的档次的子图片组比特流应遵守附录C中指定的每个比特流一致性测试的以下约束:
-对于VCL HRD参数,SubpicSetCpbSizeVcl[i]应小于或等于CpbVclFactor*MaxCPB,其中,CpbVclFactor在表A.3中指定,并且MaxCPB在表A.1中以CpbVclFactor位为单位指定。
-对于NAL HRD参数,SubpicSetCpbSizeNal[i]应小于或等于CpbNalFactor*MaxCPB,其中,CpbNalFactor在表A.3中指定,并且MaxCPB在表A.1中以CpbNalFactor位为单位指定。
-对于VCL HRD参数,SubpicSetBitRateVcl[i]应小于或等于CpbVclFactor*MaxBR,其中,CpbVclFactor在表A.3中指定,并且MaxBR在表A.1中以CpbVclFactor位为单位指定。
-对于NAL HRD参数,SubpicSetBitRateNal[i]应小于或等于CpbNalFactor*MaxCR,其中,CpbNalFactor在表A.3中指定,并且MaxBR在表A.1中以CpbNalFactor位为单位指定。
注2–当提取子图片组时,产生的比特流具有大于或等于SubpicSetCpbSizeVcl[i][j]和SubpicSetCpbSizeNal[i][j]的CpbSize(在SPS中指示或推断),以及大于或等于SubpicSetBitRateVcl[i][j]和SubpicSetBitRateNal[i][j]的比特率(在SPS中指示或推断)。
3.8.缩放列表
当前VVC草案文本中与缩放列表最相关的文本如下:
序列参数集RBSP语法和语义
Figure BDA0003832122980000551
....
sps_scaling_list_enabled_flag等于1指定缩放列表用于变换系数的缩放处理。sps_scaling_list_enabled_flag等于0指定缩放列表不用于变换系数的缩放处理。
...
图片头结构语法和语义
Figure BDA0003832122980000552
Figure BDA0003832122980000561
...
ph_scaling_list_present_flag等于1指定用于与PH相关联的条带的缩放列表数据是基于包含在参考缩放列表APS中的缩放列表数据推导的。ph_scaling_list_present_flag等于0指定用于与PH相关联的条带的缩放列表数据被设置为等于16。当不存在时,ph_scaling_list_present_flag的值被推断为等于0。当不存在时,ph_scaling_list_present_flag的值被推断为等于0。
ph_scaling_list_aps_id指定缩放列表APS的adaptation_parameter_set_id。具有aps_params_type等于SCALING_APS且adaptation_parameter_set_id等于ph_scaling_list_aps_id的APS NAL单元的TemporalId应小于或等于与PH相关的图片的TemporalId。
...
一般条带头语法和语义
Figure BDA0003832122980000562
...
slice_scaling_list_present_flag等于1指定用于当前条带的缩放列表数据是基于包含在参考缩放列表APS中的缩放列表数据推导的,其中,aps_params_type等于SCALING_APS且adaptation_parameter_set_id等于ph_scaling_list_aps_id。slice_scaling_list_present_flag等于0指定用于当前图片的缩放列表数据是条款7.4.3.21中规定的推导的默认缩放列表数据。当不存在时,slice_scaling_list_present_flag的值被推断为等于0。
...
变换系数的缩放处理
...
对于x=0..nTbW-1,y=0..nTbH-1的缩放变换系数d[x][y]的推导,以下适用:
--中间缩放因子m[x][y]被推导如下:
--如果以下一个或多个条件为真,m[x][y]设置为等于16:
--sps_scaling_list_enabled_flag等于0。
--ph_scaling_list_present_flag等于0。
--transform_skip_flag[xTbY][yTbY][cIdx]等于1。
--scaling_matrix_for_lfnst_disabled_flag等于1,并且ApplyLfnstFlag等于1。
--...
...
7.3.2.5自适应参数集RBSP语法
Figure BDA0003832122980000571
7.3.2.21缩放列表数据语法
Figure BDA0003832122980000581
Figure BDA0003832122980000591
scaling_matrix_for_lfnst_disabled_flag等于1指定缩放矩阵不应用于用LFNST编解码的块。scaling_matrix_for_lfnst_disabled_flag等于0指定缩放矩阵可以应用于用LFNST编解码的块。
4.由公开的技术方案解决的技术问题
VVC中的子图片和LMCS的现有设计存在以下问题:
1)列表SubpicNumTileRows[](指定包括在子图片中的片行的数量)的推导是公式D.5是不正确的,因为公式中CtbToTileRowBd[idx]中的索引值idx可能大于最大允许值。此外,SubpicNumTileRows[]和SubpicNumTileCols[](指定子图片中包括的片列的数量)两者的偏差使用了基于CTU的运算,这是不必要的复杂化。
2)当single_slice_per_subpic_flag等于1时,公式29中的数组CtbAddrInSlice的推导是不正确的,因为每个条带的数组中的光栅扫描CTB地址的值需要按照CTU的解码顺序,而不是按照CTU的光栅扫描顺序。
3)LMCS信令通知是低效的。当ph_lmcs_enabled_flag等于1时,大多数情况下,将为图片的所有条带启用lmcs。然而,在当前的VVC设计中,对于当为图片的所有条带启用LMCS的情况,不仅ph_lmcs_enabled_flag等于1,还需要为每个条带信令通知具有值1的slice_lmcs_enabled_flag。
a.当ph_lmcs_enabled_flag为真时,ph_lmcs_enabled_flag的语义与信令通知条带级别LMCS标志的动机相冲突。在当前的VVC中,当ph_lmcs_enabled_flag为真时,意味着所有的条带都应该启用LMCS。因此,不需要在条带头中进一步信令通知LMCS启用标志。
b.此外,当图片头告知LMCS被启用时,通常,对于所有条带,LMCS都被启用。条带头中LCMS的控制主要是为了处理极端情况。因此,如果PH LMCS标志为真并且SH LMCS标志总是被信令通知,这可能导致对于普通用户情况信令通知不必要的比特。
4)SPS仿射AMVR标志的语义不正确,因为对于每个仿射帧间编解码的CU,仿射AMVR可以被启用或禁用。
5)条带头中的缩放列表标志,即slice_scaling_list_present_flag,不用于控制变换系数的缩放处理,并且实际上是无用的。
6)即使当slice_scaling_list_present_flag用于控制变换系数的缩放处理时,缩放列表信令也是低效的。当ph_scaling_list_present_flag等于1时,在大多数情况下,显式缩放列表将用于图片的所有条带。然而,在当前的VVC设计中,对于当为图片的所有条带启用显式缩放列表时的情况,不仅ph_scaling_list_present_flag需要等于1,还需要为每个条带信令通知具有值1的条带标志slice_scaling_list_present_flag。
7)对于LFNST编解码块,残差分布可能与仅应用主变换时不同。显式信令通知的缩放列表更有可能不应用于那些LFNST编解码块。然而,是否允许应用显式信令通知的缩放列表在APS中被信令通知,这可能浪费不必要的比特。
5.技术和实施例的示例
为解决上述问题和未提及的一些其他问题,公开了如下总结的方法。这些项目应该被认为是解释一般概念的示例,而不应该以狭隘的方式被解释。此外,这些项目可以单独应用或以任何方式组合应用。
与解决第一和第二问题的子图片相关
1.公开了一种或多种以下方法:
a.推导图片的每个CTU列的片列索引。
b.子图片中包含的片列的数量的推导是基于子图片中包含的最左侧和/或最右侧CTU的片列索引。
c.推导图片的每个CTU行的片行索引。
d.子图片中包含的片行的数量的推导是基于子图片中包含的上方和/或下方CTU的片行索引。
e.定义术语图片级别条带索引如下:条带到图片中的条带列表的索引(当rect_slice_flag等于1时定义该索引),当single_slice_per_subpic_flag等于0时按照条带在PPS中被信令通知的顺序,或者当single_slice_per_subpic_flag等于1时按照对应于条带的子图片的增加的子图片索引的顺序。
f.在一个示例中,当子图片包含从片分割的条带时,子图片的高度不能根据片来计算。
g.在一个示例中,可以根据CTU而不是片来计算子图片的高度。
h.推导子图片的高度是否小于一个片行。
i.在一个示例中,当子图片仅包括来自一个片行的CTU并且当子图片中的上方CTU不是片行的上方CTU或者子图片中的下方CTU不是片行的下方CTU时,子图片的高度是否小于一个片行被推导为真。
ii.当指示每个子图片仅包含一个条带并且子图片的高度小于一个片行时,对于图片的具有图片级别条带索引i的每个条带,将在其中0到条带中的CTU的数量减1(含端值)的范围内的j的CtbAddrInSlice[i][j]的值推导为子图片的CTU光栅扫描中第j个CTU的图片光栅扫描CTU地址。
iii.在一个示例中,当子图片中的上方CTU和子图片中的下方CTU之间的距离小于根据CTU的片的高度时,子图片的高度是否小于一个片行被推导为真。
iv.当指示每个子图片仅包含一个条带并且子图片的高度大于或等于一个片行时,对于图片的具有图片级别条带索引i的每个条带,将在其中0到条带中的CTU的数量减1(含端值)的范围内的j的CtbAddrInSlice[i][j]被推导为第j个CTU的图片光栅扫描CTU地址,CTU的顺序如下:
1)子图片中不同片中的CTU被排序,使得具有较小片索引值的第一个片中的第一CTU在具有较大片索引值的第二片中的第二CTU之前。
2)子图片中一个片内的CTU在片的CTU光栅扫描中排序。
与解决第三个问题(包括子问题)的LMCS相关
2.引入了LMCS的两级别控制(其包括两个方面:亮度映射(重塑过程,由RP表示)和依赖于亮度的色度残差缩放(CRS)),其中使用了较高级别(例如,图片级别)和较低级别(例如,条带级别)控制,并且较低级别控制信息是否存在取决于高级别控制信息。此外,以下也适用:
a.在第一个示例中,应用了下面的一个或多个子项目符号:
i.第一指示符(例如,ph_lmcs_enabled_type)可以在较高级别(例如,在图片头(PH)中)被信令通知,以指定如何在非二进制值的较低级别启用LMCS。
1)在一个示例中,当第一指示符等于X(例如,X=2)时,其指定为与PH相关联的所有条带启用LMCS;当第一指示符等于Y(Y!=X)(例如,Y=1),其指定为与PH相关联的一个或多个但不是所有条带启用LMCS;当第一指示符等于Z(Z!=X和Z!=Y)(例如,Z=0),其指定为与PH相关联的所有条带禁用LMCS
a)或者,此外,当第一指示符不存在时,指示符的值被推断为等于默认值,例如Z。
2)在一个示例中,当第一指示符等于X(例如,X=2)时,其指定为与PH相关联的所有条带禁用LMCS;当第一指示符等于Y(Y!=X)(例如,Y=1),其指定为于与PH相关联的一个或多个但不是所有条带禁用LMCS;当第一指示符等于Z(Z!=X和Z!=Y)(例如,Z=0),其指定为与PH相关联的所有条带启用LMCS
a)或者,此外,当第一指示符不存在时,指示符的值被推断为等于默认值,例如X。
3)或者,此外,第一指示符可以根据序列级别中的LMCS启用标志(例如,sps_lmcs_enabled_flag)的值被有条件地信令通知。
4)或者,此外,第一指示符可以用u(v)、或u(2)或ue(v)编解码。
5)或者,此外,第一指示符可以用截断的一元码来编解码。
6)或者,此外,由条带和/或CS启用标志(例如,ph_chroma_residual_scale_flag)使用的LMCS APS信息(例如,ph_lmcs_aps_id)可以在第一指示符的值的条件检查下被信令通知。
ii.可以在较低级别(例如,在条带头中)信令通知为较低级别启用/禁用LMCS的第二指示符(例如,slice_lmcs_enabled_flag),并且可以通过检查第一指示符的值来有条件地信令通知该第二指示符。
1)在一个示例中,可以在“第一指示符等于Y”的条件检查下信令通知第二指示符。
a)或者,在“第一指示符的值>>1”或“第一指示符的值/2”或“第一指示符的值&0x01”的条件检查下,可以信令通知第二指示符。
b)或者,此外,当第一指示符等于X时,可以推断其被启用;或者当第一指示符等于z时可以推断其被禁用。
b.在第二个示例中,应用了下面的一个或多个子项目符号:
i.可以在较高级别(例如,在图片头(PH)中)信令通知一个以上的指示符,以指定如何在较低级别启用LMCS。
1)在一个示例中,可以在PH中信令通知两个指示符(例如,两个1位标志)。
a)在一个示例中,第一指示符指定是否存在与启用LMCS的PH相关联的至少一个条带。并且第二指示符指定是否与PH相关联的所有条带都启用LMCS。
i.或者,此外,可以根据第一指示符的值有条件地信令通知第二指示符,例如,当第一指示符指定存在启用LMCS的至少一个条带时。
i.或者,此外,当第二指示符不存在时,推断所有条带都启用LMCS。
ii.或者,此外,可以根据第二指示符的值在SH中有条件地信令通知第三指示符,例如当第二指示符指定并非所有条带都启用LMCS时。
i.或者,此外,当第三指示符不存在时,其可以根据第一和/或第二指示符的值来推断(例如,推断为等于第一指示符的值)。
b)或者,第一指示符指定是否存在与禁用LMCS的PH相关联的至少一个条带。并且第二指示符指定是否所有与PH相关联的条带都禁用LMCS。
i.或者,此外,可以根据第一指示符的值有条件地信令通知第二指示符,例如,当第一指示符指定存在禁用LMCS的至少一个条带时。
i.或者,此外,当第二指示符不存在时,推断与PH相关的所有条带禁用LMCS。
ii.或者,此外,根据第二指示符的值,可以在SH中有条件地信令通知第三指示符,例如,当第二指示符指定并非所有条带都禁用LMCS时。
i.或者,此外,当第三指示符不存在时,其可以根据第一和/或第二指示符的值来被推断(例如,被推断为等于第一指示符的值)。
2)或者,此外,第一指示符可以根据序列级别中的LMCS启用标志(例如,sps_lmcs_enabled_flag)的值被有条件地信令通知。
ii.可以在较低级别(例如,在条带头中)信令通知为较低级别启用/禁用LMCS的第三指示符(例如,slice_lmcs_enabled_flag),并且可以通过检查第一指示符和/或第二指示符的值来有条件地信令通知该第三指示符。
1)在一个示例中,在“并非所有条带都启用LMCS”或“并非所有条带都禁用LMCS”的条件检查下,可以信令通知第三指示符。
c.在又一示例中,第一/第二示例中提到的第一和/或第二和/或第三指示符可以用于控制RP或CRS而不是LMCS的使用。
3.SPS/PH/SH中三个LMCS标志的语义更新如下:
sps_lmcs_enabled_flag等于1指定在CLVS中可以使用使用亮度映射与色度缩放。sps_lmcs_enabled_flag等于0指定CLVS中不使用亮度映射与色度缩放。
ph_lmcs_enabled_flag等于1指定为与PH相关的所有条带可以使用启用亮度映射与色度缩放。ph_lmcs_enabled_flag等于0指定可以为与PH相关的一个、多个或不使用所有条带禁用亮度映射与色度缩放。当不存在时,则ph_lmcs_enabled_flag的值被推断为等于0。
slice_lmcs_enabled_flag等于1指定为当前条带使用启用亮度映射与色度缩放。slice_lmcs_enabled_flag等于0指定为当前条带使用不启用亮度映射与色度缩放。当slice_lmcs_enabled_flag不存在时,其被推断为等于0。
a.改变PH和/或SH LMCS信令,使得当LMCS用于图片的所有条带时,在SH中不存在LMCS信令。
i.或者,此外,如何推断LMCS取决于PH LMCS信令。
1)在一个示例中,当LMCS用于图片的所有条带时,推断其被启用;并且当LMCS没有被用于图片的所有条带时,推断其被禁用。
与仿射AMVR相关
4.SPS中仿射AMVR标志的语义更新如下:
sps_affine_amvr_enabled_flag等于1指定在仿射帧间模式的运动矢量编解码中可以使用自适应运动矢量差精度。sps_affine_amvr_enabled_flag等于0指定在仿射帧间模式的运动矢量编解码中不使用自适应运动矢量差精度。当不存在时,sps_affine_amvr_enabled_flag的值被推断为等于0。
与解决第五个和第六个问题的缩放列表相关
5.对于块,变换系数和/或非变换系数的缩放处理是根据与小于图片的视频区域(例如,条带)相关联的语法元素来控制的。
a.在一个示例中,使用条带头中的缩放列表标志,例如slice_scaling_list_present_flag,例如,如在实施例3中,而不是使用SPS标志sps_scaling_list_enabled_flag和PH标志ph_scaling_list_present_flag来控制变换系数的缩放处理。
6.引入了显式缩放列表的两级别控制,其中使用较高级别控制(例如,图片级别)和较低级别控制(例如,条带级别),并且较低级别控制信息是否存在取决于较高级别控制信息。显式缩放列表可用于变换系数和/或非变换系数的缩放处理。此外,以下也适用:
a.在第一个示例中,应用了下面的一个或多个子项目符号:
i.可以在较高级别(例如,在图片头(PH)中)信令通知第一非二进制值指示符(例如,ph_explicit_scaling_list_enabled_type)以指定如何在较低级别启用显式缩放列表。
1)在一个示例中,当第一指示符等于X(例如,X=2)时,其指定为与PH相关联的所有条带启用显式缩放列表;当第一指示符等于Y(Y!=X)(例如,Y=1),其指定为与PH相关联的一个或多个但不是所有条带启用显式缩放列表;当第一指示符等于Z(Z!=X和Z!=Y)(例如,Z=0),其指定为与PH相关联的所有条带禁用显式缩放列表。
a)或者,此外,当第一指示符不存在时,指示符的值被推断为等于默认值,例如Z。
b)或者,当第一指示符等于Y(Y!=X)(例如,Y=1),其指定,当解码条带时,为图片启用在变换和/或非变换系数的缩放处理中显式缩放列表的使用。
c)或者,当第一指示符等于Y(Y!=X)(例如,Y=1)时,其指定,当解码条带时,可以为图片启用在变换和/或非变换系数的缩放处理中显式缩放列表的使用。
2)在一个示例中,当第一指示符等于X(例如,X=2)时,其指定为与PH相关联的所有条带禁用显式缩放列表;当第一指示符等于Y(Y!=X)(例如,Y=1),其指定为与PH相关联的一个或多个但不是所有条带禁用显式缩放列表;当第一指示符等于Z(Z!=X和Z!=Y)(例如,Z=0),其指定为与PH相关联的所有条带启用显式缩放列表。
a)或者,此外,当第一指示符不存在时,指示符的值被推断为等于默认值,例如X。
b)或者,当第一指示符等于Y(Y!=X)(例如,Y=1),其指定,当解码条带时,可以为图片禁用在变换和/或非变换系数的缩放处理中显式缩放列表的使用。
c)或者,当第一指示符等于Y(Y!=X)(例如,Y=1)时,其指定,当解码条带时,为图片禁用在变换和/或非变换系数的缩放处理中显式缩放列表的使用。
3)或者,此外,可以根据序列级别中的显式缩放列表启用标志(例如,sps_explicit_scaling_list_enabled_flag)的值有条件地信令通知第一指示符。
4)或者,此外,可以用u(v)、或u(2)或ue(v)来编解码第一指示符。
5)或者,此外,可以用截断的一元码来编解码第一指示符。
6)或者,此外,条带使用的缩放列表APS信息(例如,ph_explicit_scaling_list_aps_id)可以在第一指示符的值的条件检查下被信令通知。
ii.启用/禁用较低级别的显式缩放列表的第二指示符(例如,slice_scaling_list_present_flag)可以在较低级别(例如,在片头中)被信令通知,并且可以通过检查第一指示符的值来有条件地信令通知。
1)在一个示例中,可以在“第一指示符等于Y”的条件检查下信令通知第二指示符。
a)或者,可以在“第一指示符的值> >1”或“第一指示符的值/2”或“第一指示符的值&0x01”的条件检查下信令通知第二指示符。
b)或者,此外,当第一指示符等于X时,第二指示符可以不存在并且被推断为被启用;或者当第一指示符等于Z时,第二指示符可以被推断为被禁用。
b.在第二个示例中,应用了下面的一个或多个子项目符号:
iii.可以在较高级别(例如,在图片头(PH)中)信令通知多个指示符,以指定如何在较低级别启用显式缩放列表。
1)在一个示例中,可以在PH中信令通知两个指示符(例如,两个1位标志)
a)在一个示例中,第一指示符指定是否存在启用显式缩放列表的与PH相关联的至少一个条带。并且第二指示符指定与PH相关联的所有条带是否都启用显式缩放列表。
i.或者,此外,可以根据第一指示符的值有条件地信令通知第二指示符,例如,当第一指示符指定存在启用显式缩放列表的至少一个条带时。
i.或者,此外,当第二指示符不存在时,推断所有条带都启用显式缩放列表。
ii.或者,如果一致性比特流中的第一指示符为假,则要求第二指示符必须为假。
ii.或者,此外,根据第一指示符的值和第二指示符的值中的至少一个,可以在SH中有条件地信令通知第三指示符,例如,当第一指示符指定至少一个条带启用显式缩放列表并且第二指示符指定并非所有条带都启用显式缩放列表时。
i.或者,此外,当第三指示符不存在时,其可以根据第一和/或第二指示符的值来被推断(例如,被推断为等于第一指示符的值)。
b)或者,第一指示符指定是否存在禁用显式缩放列表的与PH相关联的至少一个条带。并且第二指示符指定是否与PH相关联的所有条带都禁用显式缩放列表。
i.或者,此外,可以根据第一指示符的值有条件地信令通知第二指示符,例如,当第一指示符指定存在禁用显式缩放列表的至少一个条带时。
i.或者,此外,当第二指示符不存在时,推断与PH相关联的所有条带禁用显式缩放列表。
ii.或者,此外,根据第一指示符的值和第二指示符的值中的至少一个,可以在SH中有条件地信令通知第三指示符,例如,当第一指示符指定至少一个条带启用显式缩放列表并且第二指示符指定并非所有条带都禁用显式缩放列表时。
i.或者,此外,当第三指示符不存在时,其可以根据第一和/或第二指示符的值来被推断(例如,被推断为等于第一指示符的值)。
2)或者,此外,可以根据序列级别中的显式缩放列表启用标志(例如,sps_explicit_scaling_list_enabled_flag)的值有条件地信令通知第一指示符。
iv.可以在较低级别(例如,在条带头中)信令通知启用/禁用较低级别的显式缩放列表的第三指示符(例如,slice_explicit_scaling_list_enabled_flag),并且可以通过检查第一指示符和/或第二指示符的值来有条件地信令通知该第三指示符。
1)在一个示例中,在“并非所有条带都启用显式缩放列表”或“并非所有条带都禁用显式缩放列表”的条件检查下,可以信令通知第三指示符。
c.在第三示例中,可以在较高级别(例如,在图片头(PH)中)信令通知两个1位标志,以指定如何在较低级别(例如,在条带头(SH)中)启用显式缩放列表。
i.第一PH标志(例如命名为ph_all_slices_use_explicit_scaling_list_flag)等于1指定图片的所有条带使用显式缩放列表。第一PH标志等于0指定图片的每个条带可以使用或不使用显式缩放列表。
ii.第二PH标志(例如,命名为ph_no_slice_uses_explicit_scaling_list_flag)等于1指定没有图片的条带使用显式缩放列表。第二PH标志等于0指定图片的每个条带可以使用或不使用显式缩放列表。
iii.仅当第一PH标志等于0时,才信令通知第二PH标志。
iv.当第一个PH标志等于1时或当(第一个PH标志等于0,并且第二个PH标志等于0)时,在PH中信令通知缩放列表APS ID。
v.当第一PH标志等于0并且第二标志等于0时,在SH中信令通知SH标志(例如,命名为slice_use_explicit_scaling_list_flag)。
vi.当第一PH标志等于1时,SH标志的值被推断为等于0。
vii.当第一PH标志等于0且第二PH标志等于0时,SH标志的值被推断为等于0。
viii.如果SH标志的值等于1,则使用显式缩放列表对条带进行解码。
否则,使用显式缩放列表对条带进行解码。
d.在第四示例中,可以信令通知PH或SH中是否存在一个或多个或每个缩放列表相关方面(例如,启用/禁用、APS ID)的一个或多个指示符。
i.或者,使用一个指示符,此外,该指示符是1位标志。
1)在一个实例中,当指示符指定相关方面存在于PH中,所有条带推断出存在于PH中的值,并且那些相关方面的信令通知在SH中被跳过时。
2)在一个示例中,当指示符指定相关方面存在于SH中,并且那些相关方面的信令通知在PH中被跳过时。
ii.在一个示例中,在PH中信令通知一个或多个指示符。
iii.在另一个示例中,在PPS中信令通知一个或多个指示符。
iv.在另一个示例中,在SPS中信令通知一个或多个指示符。
7.是否启用LFNST编解码块的显式缩放列表可以在序列/图片/条带级别中被指示,而不是在APS中被指示。
a.在一个示例中,语法元素(例如,标志)可以在SPS/PPS/PH/SH中被信令通知。
i.或者,此外,语法元素可以在是否启用LFNST的条件检查下被信令通知(例如,sps_lfnst_enabled_flag等于1)。
ii.或者,此外,对于视频块,是应用显式缩放列表还是应用默认缩放列表可以取决于语法元素的值以及是否为该视频块启用LFNST。
8.提出了可以基于填充样点对沿着视频单元的边界的视频单元的样点执行去方块滤波过程。图11示出了一个示例,其中,样点p0、p1和p2是沿着视频单元的边界的视频单元的样点,并且样点q0、q1和q2是将在滤波过程中使用的填充样点。
a.在一个示例中,视频单元可以是图片。
b.在一个实例中,视频单元可以是子图片。
c.在一个实例中,视频单元可以是条带。
d.在一个实例中,视频单元可以是片。
e.在一个示例中,视频单元可以是逐步解码刷新(GDR)中的刷新区域,并且边界可以是图片中的刷新区域和未刷新区域之间的边界,此外,这种边界可以被信令通知为虚拟边界。
f.在一个示例中,可以以复制的方式执行填充。例如,q0、q1和q2的值都可以被设置为等于p0的值。
在一个示例中,可以以对称的方式执行填充。例如,q0、q1和q2的值可以分别被设置为等于p0、p1和p2的值。
6.实施例
在实施例中,某些文本是粗体和斜体的,以突出对当前版本规范的更改。斜体文本将从对应实施例的当前VVC规范的描述中删除。
6.1.实施例1:子图片的支持
该实施例针对项目1及其子项目。
3个定义
图片级别条带索引:条带到图片中的条带列表的索引(当rect_slice_flag等于1时定义该索引),当single_slice_per_subpic_flag等于0时按照条带在PPS中被信令通知的顺序,或者当single_slice_per_subpic_flag等于1时按照对应于条带的子图片的增加的子图片索引的顺序。
图片级别条带索引:条带到图片中的条带列表的索引,当rect_slice_flag等于1时按照它们在PPS中被信令通知的顺序。
6.5.1 CTB光栅扫描、片扫描和子图片扫描处理
...
范围从0到PicWidthInCtbsY(包括端值)的ctbAddrX的列表CtbToTileColBd[ctbAddrX]和ctbToTileColIdx[ctbAddrX]分别指定从水平CTB地址到以CTB为单位的左侧片列边界和到片列索引的转换,推导如下:
Figure BDA0003832122980000711
注3–在上述推导中的数组CtbToTileColBd[]和ctbToTileColIdx[]的尺寸比CTB中的实际图片宽度大1。
范围从0到PicHeightInCtbsY(包括端值)的ctbAddrY的列表CtbToTileRowBd[ctbAddrY]和ctbToTileRowIdx[ctbAddrY]分别指定从垂直CTB地址到以CTB为单位的上方片列边界和到片行索引的转换,推导如下:
Figure BDA0003832122980000712
注4–上述推导中的数组CtbToTileRowBd[]和ctbToTileRowIdx[]的尺寸比CTB中的实际图片高度大1。
范围从0到sps_num_subpics_minus1(包括端值)的i的列表SubpicWidthInTiles[i]和SubpicHeightInTiles[i]分别指定片行和片列中第i个子图片的宽度和高度,并且范围从0到sps_num_subpics_minus1(包括端值)的i的列表subpicHeightLessThanOneTileFlag[i]指定第i个子图片的高度是否小于一个片行,推导如下:
Figure BDA0003832122980000721
或者,在上面的公式中,以下条件:
if(SubpicHeightInTiles[i]==1&&(bottomY+1-topY<RowHeight[ctbToTileRowIdx[topY]])
可以更改为如下:
if(SubpicHeightInTiles[i]==1&&(topY!=CtbToTileRowBd[topY]||bottomY+1!=CtbToTileRowBd[bottomY+1])
注5–当片被分割为多个矩形条带,并且只有该片的矩形条带的子集包含在第i个子图片中时,该片在SubpicHeightInTiles[i]的值中被计算为一个片。
当rect_slice_flag等于1时,范围从0到num_slices_in_pic_minus1(包括端值)的i的列表NumCtusInSlice[i]指定第i个条带中CTU的数量,范围从0到num_slices_in_pic_minus1(包括端值)的i的列表SliceTopLeftTileIdx[i]指定包含条带中第一个CTU的片的片索引,以及范围从0到num_slices_in_pic_minus1(包括端值)的i和范围从0到j到NumCtusInSlice[i]–1(包括端值)的j的矩阵CtbAddrInSlice[i][j]指定第i个条带内的第j个CTB的图片光栅扫描地址,并且变量NumSlicesInTile[i]指定包含第i个条带的片中的片的数量,推导如下:
Figure BDA0003832122980000731
Figure BDA0003832122980000741
Figure BDA0003832122980000751
....
D.7.2子图片级别信息SEI消息语义
...
ref_level_fraction_minus1[i][j]加1指定与第j个子图片符合的ref_level_idc[i]相关的级别限制的分数,如条款A.4.1所规定的。
变量SubpicSizeY[j]被设置为等于(subpic_width_minus1[j]+1)*CtbSizeY*(subpic_height_minus1[j]+1)*CtbSizeY。
当不存在时,ref_level_fraction_minus1[i][j]的值推断为等于Ceil(256*SubpicSizeY[j]÷PicSizeInSamplesY*MaxLumaPs(general_level_idc)÷MaxLumaPs(ref_level_idc[i])-1。
变量RefLevelFraction[i][j]被设置为等于ref_level_fraction_minus1[i][j]+1。
变量SubpicNumTileCols[j]和SubpicNumTileRows[j]的推导如下:
Figure BDA0003832122980000761
...
-SubpicWidthInTiles[j]的值应小于或等于MaxTileCols,并且SubpicHeightInTiles[j]的值应小于或等于MaxTileRows,其中,在表A.1中为级别ref_level_idc[i]指定MaxTileCols和MaxTileRows。
-SubpicWidthInTiles[j]*SubpicHeightInTiles[j]的值应小于或等于MaxTileCols*MaxTileRows*RefLevelFraction[i][j],其中,在表A.1中为级别ref_level_idc[i]指定MaxTileCols和MaxTileRows。
...
相对于参考级别ref_level_idc[i]的总级别分数的变量SubpicSetAccLevelFraction[i],以及子图片组的变量SubpicSetCpbSizeVcl[i]、SubpicSetCpbSizeNal[i]、SubpicSetBitRateVcl[i]和SubpicSetBitRateNal[i]的推导如下:
Figure BDA0003832122980000771
...
6.2.实施例2:LMCS的支持
在该实施例中,修改了图片头中的LMCS相关语法元素的语法和语义,使得当LMCS用于图片的所有条带时,在SH中不存在LMCS信令通知。
7.3.2.7图片头结构语法
Figure BDA0003832122980000772
Figure BDA0003832122980000781
Figure BDA0003832122980000791
7.3.7.1一般条带头语法
Figure BDA0003832122980000792
ph_lmcs_enabled_typeflag等于M(e.g.,M=1)1指定为与PH相关联的所有条带启用亮度映射与色度缩放。ph_lmcs_enabled_type等于N(例如,N=2)指定为至少一个条带启用亮度映射与色度缩放,并且为与PH相关的至少一个条带禁用亮度映射与色度缩放。ph_lmcs_enabled_typeflag等于0指定可以为为与PH相关的一个、多个或所有条带禁用禁用亮度映射与色度缩放。ph_lmcs_enabled_type的值应等于0、M或n。当不存在时,ph_lmcs_enabled_typeflag的值被推断为等于0。
slice_lmcs_enabled_flag等于1指定为当前条带启用亮度映射与色度缩放。slice_lmcs_enabled_flag等于0指定为当前条带不启用亮度映射与色度缩放。当slice_lmcs_enabled_flag不存在时,其被推断为等于0(ph_lmcs_enabled_type?1:0)。或者,当slice_lmcs_enabled_flag不存在时,其被推断为等于0(ph_lmcs_enabled_type==M)?1:0。
在上面的示例中,M和N的值可以分别设置为1和2。或者,M和N的值可以分别设置为2和1。
6.3.实施例3:支持缩放列表的方法#1
在该实施例中,修改了与缩放列表相关的文本,使得使用条带头中的缩放列表标志,而不是使用缩放列表的SPS标志和缩放列表的PH标志来控制变换系数的缩放处理。
序列参数集RBSP语法和语义
Figure BDA0003832122980000801
....
sps_scaling_list_enabled_flag等于1指定缩放列表用于变换系数的缩放处理。sps_scaling_list_enabled_flag等于0指定缩放列表不用于变换系数的缩放处理。
sps_explicit_scaling_list_enabled_flag等于1指定,当解码条带时,为CLVS启用变换系数的缩放处理中显式缩放列表的使用,该显式缩放列表在缩放列表APS中被信令通知。sps_explicit_scaling_list_enabled_flag等于0指定,当解码条带时,为CLVS禁用变换系数的缩放处理中显式缩放列表的使用。
...
图片头结构语法和语义
Figure BDA0003832122980000802
Figure BDA0003832122980000811
...
ph_scaling_list_present_flag等于1指定用于与PH相关联的条带的缩放列表数据是基于包含在参考缩放列表APS中的缩放列表数据推导的。ph_scaling_list_present_flag等于0指定用于与PH相关联的条带的缩放列表数据被设置为等于16。当不存在时,ph_scaling_list_present_flag的值被推断为等于0。当不存在时,ph_scaling_list_present_flag的值被推断为等于0。
ph_explicit_scaling_list_enabled_flag等于1指定,当解码条带时,为图片启用变换系数的缩放处理中显式缩放列表的使用,该显式缩放列表在参考缩放列表APS(即,其中aps_params_type等于SCALING_APS并且adaptation_parameter_set_id等于ph_explicit_scaling_list_aps_id的APS)中被信令通知。ph_explicit_scaling_list_enabled_flag等于0指定,当解码条带时,为图片禁用变换系数的缩放处理中显式缩放列表的使用。当不存在时,ph_explicit_scaling_list_enabled_flag的值被推断为等于0。
ph_explicit_scaling_list_aps_id指定缩放列表APS的adaptation_parameter_set_id。具有aps_params_type等于SCALING_APS且adaptation_parameter_set_id等于ph_explicit_scaling_list_aps_id的APS NAL单元的TemporalId应小于或等于与PH相关的图片的TemporalId。
...
一般条带头语法和语义
Figure BDA0003832122980000821
...
slice_scaling_list_present_flag等于1指定用于当前条带的缩放列表数据是基于包含在参考缩放列表APS中的缩放列表数据推导的,其中,aps_params_type等于SCALING_APS并且adaptation_parameter_set_id等于ph_scaling_list_aps_id。slice_scaling_list_present_flag等于0指定用于当前图片的缩放列表数据是在条款7.4.3.21中规定的推导的默认缩放列表数据。当不存在时,slice_scaling_list_present_flag的值被推断为等于0。
slice_explicit_scaling_list_enabled_flag等于1指定,当解码当前条带时,在变换系数的缩放处理中使用在参考缩放列表APS中被信令通知的显式缩放列表。slice_explicit_scaling_list_enabled_flag等于0指定,当解码当前条带时,在变换系数的缩放处理中不使用显式缩放列表。当不存在时,slice_explicit_scaling_list_enabled_flag的值被推断为等于0。
...
变换系数的缩放处理
...
对于x=0..nTbW-1,y=0..nTbH–1的缩放变换系数d[x][y]的推导,以下适用:
--中间缩放因子m[x][y]被推导如下:
--如果以下一个或多个条件为真,m[x][y]设置为等于16:
--sps_scaling_list_enabled_flag等于0。
--ph_scaling_list_present_flag等于0。
--slice_explicit_scaling_list_enabled_flag等于0。
--transform_skip_flag[xTbY][yTbY][cIdx]等于1。
--scaling_matrix_for_lfnst_disabled_flag等于1,并且ApplyLfnstFlag等于1。
--...
...
6.4.实施例4:支持缩放列表的方法#2
在该实施例中,修改了与缩放列表相关的文本,使得以下适用:
1)使用条带头中的缩放列表标志,而不是使用用于缩放列表的SPS标志和用于缩放列表的PH标志来控制变换系数的缩放处理。
2)当显式缩放列表用于图片的所有条带时,在SH中不存在缩放列表信令通知。
在下文中,M和N的值可以分别设置为1和2。
或者,M和N的值可以分别设置为2和1。
或者,以下适用:
1)语法元素ph_explicit_scaling_list_enabled_type被重命名为ph_explicit_scaling_list_mode。
2)等于M、N和0的ph_explicit_scaling_list_enabled_type的值分别被分别被替换为等于A、B和C(例如,0、1和2)的ph_explicit_scaling_list_mode。
3)ph_explicit_scaling_list_aps_id的语法条件“if(ph_explicit_scaling_list_enabled_type>0”被替换为“if(ph_explicit_scaling_list_mode!=C)”。
序列参数集RBSP语法和语义
Figure BDA0003832122980000831
Figure BDA0003832122980000841
....
sps_scaling_list_enabled_flag等于1指定缩放列表用于变换系数的缩放处理。sps_scaling_list_enabled_flag等于0指定缩放列表不用于变换系数的缩放处理。
sps_explicit_scaling_list_enabled_flag等于1指定,当解码条带时,为CLVS启用变换系数的缩放处理中显式缩放列表的使用,该显式缩放列表在缩放列表APS中被信令通知。sps_explicit_scaling_list_enabled_flag等于0指定,当解码条带时,为CLVS禁用变换系数的缩放处理中显式缩放列表的使用。
...
图片头结构语法和语义
Figure BDA0003832122980000842
...
ph_scaling_list_present_flag等于1指定用于与PH相关联的条带的缩放列表数据是基于包含在参考缩放列表APS中的缩放列表数据推导的。ph_scaling_list_present_flag等于0指定用于与PH相关联的条带的缩放列表数据被设置为等于16。当不存在时,ph_scaling_list_present_flag的值被推断为等于0。当不存在时,ph_scaling_list_present_flag的值被推断为等于0。
ph_explicit_scaling_list_enabled_type等于M(例如,M=1)指定,当在图片中解码所有条带时,在变换系数的缩放处理中使用显式缩放列表,该显式缩放列表在参考缩放列表APS(即,aps_params_type等于SCALING_APS并且adaptation_parameter_set_id等于ph_explicit_scaling_list_aps_id的APS)中被信令通知。ph_explicit_scaling_list_enabled_type等于N(例如,N=2)指定,当解码条带时,为图片启用变换系数的缩放处理中显式缩放列表的使用。ph_explicit_scaling_list_enabled_type等于0指定,当解码条带时,为图片禁用变换系数的缩放处理中显式缩放列表的使用。ph_explicit_scaling_list_enabled_type的值应等于0、M或N。当不存在时,ph_explicit_scaling_list_enabled_flag的值被推断为等于0。
ph_explicit_scaling_list_aps_id指定缩放列表APS的adaptation_parameter_set_id。具有aps_params_type等于SCALING_APS且adaptation_parameter_set_id等于ph_explicit_scaling_list_aps_id的APS NAL单元的TemporalId应小于或等于与PH相关的图片的TemporalId。
...
一般条带头语法和语义
Figure BDA0003832122980000851
Figure BDA0003832122980000861
...
slice_scaling_list_present_flag等于1指定用于当前条带的缩放列表数据是基于包含在参考缩放列表APS中的缩放列表数据推导的,其中,aps_params_type等于SCALING_APS并且adaptation_parameter_set_id等于ph_scaling_list_aps_id。slice_scaling_list_present_flag等于0指定用于当前图片的缩放列表数据是在条款7.4.3.21中规定的推导的默认缩放列表数据。当不存在时,slice_scaling_list_present_flag的值被推断为等于0。
slice_explicit_scaling_list_enabled_flag等于1指定,当解码当前条带时,在变换系数的缩放处理中使用在参考缩放列表APS中被信令通知的显式缩放列表。slice_explicit_scaling_list_enabled_flag等于0指定,当解码当前条带时,在变换系数的缩放处理中不使用显式缩放列表。当不存在时,slice_explicit_scaling_list_enabled_flag的值被推断为等于(ph_explicit_scaling_list_enabled_type==M)?1:0。
...
变换系数的缩放处理
...
对于x=0..nTbW-1,y=0..nTbH–1的缩放变换系数d[x][y]的推导,以下适用:
--中间缩放因子m[x][y]被推导如下:
--如果以下一个或多个条件为真,m[x][y]设置为等于16:
--sps_scaling_list_enabled_flag等于0。
--ph_scaling_list_present_flag等于0。
--slice_explicit_scaling_list_enabled_flag等于0。
--transform_skip_flag[xTbY][yTbY][cIdx]等于1。
--scaling_matrix_for_lfnst_disabled_flag等于1,并且ApplyLfnstFlag等于1。
-...
...
图5是可实现本文中所公开的各种技术的示例视频处理系统1900的框图。各种实现方式可以包括系统1900中的一些或全部组件。系统1900可以包括用于接收视频内容的输入1902。视频内容可以以原始或未压缩的格式(例如8或10比特多分量像素值)接收,或者可以以压缩或编码的格式接收。输入1902可以代表网络接口、外围总线接口或存储接口。网络接口的示例包括有线接口(诸如以太网、无源光网络(passive optical network,PON)等)和无线接口(诸如Wi-Fi或蜂窝接口)。
系统1900可以包括可以实现本文档中描述的各种编解码或编码方法的编解码组件1904。编解码组件1904可以减少从输入1902到编解码组件1904的输出的视频的平均比特率,以产生视频的编解码表示。因此,编解码技术有时称为视频压缩或视频转码技术。编解码组件1904的输出可以被存储或经由所连接的通信来发送,如组件1906所表示的。在输入1902处接收的视频的存储或通信的比特流(或编解码)表示可以由组件1908使用,以生成被发送到显示接口1910的像素值或可显示视频。从比特流表示中生成用户可见的视频的过程有时称为视频解压缩。此外,尽管某些视频处理操作被称为“编解码”操作或工具,但是应当理解,在编码器处使用编解码工具或操作,并且将由解码器进行反演编解码的结果的对应解码工具或操作。
外围总线接口或显示接口的示例可以包括通用串行总线(universal serialbus,USB)或高清晰度多媒体接口(high definition multimedia interface,HDMI)或Displayport等。存储接口的示例包括SATA(串行高级技术附件)、PCI、IDE接口等。本文档中描述的技术可以实施在各种电子设备中,诸如移动电话、膝上型计算机、智能电话或其它能够进行数字数据处理和/或视频显示的装设备。
图6是视频处理装置3600的框图。装置3600可以用于实施本文中所述的方法中的一个或多个。装置3600可以实施在智能电话、平板电脑、计算机、物联网(IoT)接收器等中。装置3600可以包括一个或多个处理器3602、一个或多个存储器3604和视频处理硬件3606。(多个)处理器3602可以配置为实现本文档中所述的一个或多个方法。(多个)存储器3604可以用于存储数据和代码,该代码用于实现本文所描述的方法和技术。视频处理硬件3606可以用于在硬件电路中实现本文档中所描述的一些技术。
图8是图示可利用本公开的技术的示例视频编解码系统100的框图。
如图8所示,视频编解码系统100可以包括源设备110和目标设备120。源设备110生成编码的视频数据,其可以被称为视频编码设备。目标设备120可以解码由源设备110生成的编码的视频数据,该目标设备120可以被称为视频解码设备。
源设备110可以包括视频源112、视频编码器114和输入/输出(I/O)接口116。
视频源112可以包括诸如视频捕获设备的源、从视频内容提供者接收视频数据的接口、和/或生成视频数据的计算机图形系统,或这些源的组合。视频数据可以包括一个或多个图片。视频编码器114对来自视频源112的视频数据进行编码以生成比特流。比特流可以包括形成视频数据的编解码表示的比特序列。比特流可以包括编解码图片和相关联的数据。编解码图片是图片的编解码表示。相关联的数据可以包括序列参数集、图片参数集和其他语法元素。I/O接口116包括调制器/解调器(调制解调器)和/或发送器。可以将编码的视频数据经由I/O接口116通过网络130a直接发送到目标设备120。还可以将编码的视频数据存储到存储介质/服务器130b上,用于由目标设备120存取。
目标设备120可以包括I/O接口126、视频解码器124和显示设备122。
I/O接口126可以包括接收器和/或调制解调器。I/O接口126可以从源设备110或存储介质/服务器130b获取编码的视频数据。视频解码器124可以对编码的视频数据进行解码。显示设备122可以向用户显示解码的视频数据。显示设备122可以与目标设备120集成,或可以在配置为与外置显示设备相接的目标设备120外部。
视频编码器114和视频解码器124可以根据视频压缩标准(诸如,高效视频编解码(HEVC)标准、多功能视频编解码(VVC)标准和其他当前和/或其他标准)进行操作。
图9是图示视频编码器200的示例的框图,该视频编码器200可以是图8中图示的系统100中的视频编码器114。
视频编码器200可以被配置为执行本公开的任何或全部技术。在图9的示例中,视频编码器200包括多个功能组件。本公开所描述的技术可以在视频编码器200的各种组件之间共享。在一些示例中,处理器可以配置为进行本公开中描述的任何或全部技术。
视频编码器200的功能组件可以包括分割单元201、预测单元202(其可以包括模式选择单元203、运动估计单元204、运动补偿单元205和帧内预测单元206)、残差生成单元207、变换单元208、量化单元209、逆量化单元210、逆变换单元211、重建单元212、缓冲器213和熵编码单元214。
在其他示例中,视频编码器200可以包括更多、更少或不同的功能组件。在一个示例中,预测单元202可以包括帧内块复制(intra block copy,IBC)单元。IBC单元可以以IBC模式进行预测,其中,至少一个参考图片是当前视频块所位于的图片。
此外,诸如运动估计单元204和运动补偿单元205的一些组件可以被高度集成,但是出于解释的目的在图9的示例中分开表示。
分割单元201可以将图片分割成一个或多个视频块。视频编码器200和视频解码器300可以支持各种视频块尺寸。
模式选择单元203可以例如基于错误结果选择帧内或帧间的编解码模式中的一个,并且将得到的帧内或帧间编解码块提供到残差生成单元207来生成残差块数据而且提供到重建单元212来重建编码块以用作参考图片。在一些示例中,模式选择单元203可以选择帧内和帧间预测的组合(combination of intra and inter predication,CIIP)模式,其中,预测是基于帧间预测信号和帧内预测信号。模式选择单元203还可以为帧间预测情况下的块选择运动矢量的精度(例如子像素或整个像素精度)。
为了对当前视频块执行帧间预测,运动估计单元204可以通过将来自缓冲器213的一个或多个参考帧与当前视频块进行比较,生成当前视频块的运动信息。运动补偿单元205可以基于来自缓冲器213的图片(而不是与当前视频块相关联的图片)的运动信息和解码样点来为当前视频块确定预测的视频块。
运动估计单元204和运动补偿单元205可以为当前视频块进行不同操作,例如执行不同操作取决于当前视频块是在I条带、P条带还是B条带中。
在一些示例中,运动估计单元204可以进行当前视频块的单向预测,并且运动估计单元204可以在列表0或列表1的参考图片中搜索当前视频块的参考视频块。运动估计单元204然后可以生成指示列表0或列表1的参考图片中含有参考视频块的参考索引以及指示在当前视频块与参考视频块之间的空域位移的运动矢量。运动估计单元204可以输出参考索引、预测方向指示符、和运动矢量作为当前视频块的运动信息。运动补偿单元205可以基于由当前视频块的运动信息指示的参考视频块来生成当前块的预测视频块。
在其他示例中,运动估计单元204可以进行当前视频块的双向预测,运动估计单元204可以在列表0的参考图片中搜索当前视频块的参考视频块并且还可以在列表1的参考图片中搜索当前视频块的另一个参考视频块。运动估计单元204然后可以生成指示列表0或列表1的参考图片中含有参考视频块的参考索引以及指示在参考视频块与当前视频块之间的空域位移的运动矢量。运动估计单元204可以输出参考索引和当前视频块的运动矢量作为当前视频块的运动信息。运动补偿单元205可以基于由当前视频块的运动信息指示的参考视频块来生成当前视频块的预测视频块。
在一些示例中,运动估计单元204可以输出运动信息的全部集合,用于解码器的解码处理。
在一些示例中,运动估计单元204可以不输出当前视频的运动信息的全部集合。而是,运动估计单元204可以参考另一个视频块的运动信息来信令通知当前视频块的运动信息。例如,运动估计单元204可以确定当前视频块的运动信息与临近视频块的运动信息足够相似。
在一个示例中,运动估计单元204可以在与当前视频块相关联的语法结构中指示:向视频解码器300指示当前视频块具有与另一个视频块相同的运动信息的值。
在另一个示例中,运动估计单元204可以在与当前视频块相关联的语法结构中标识另一个视频块和运动矢量差(motion vector difference,MVD)。运动矢量差指示当前视频块的运动矢量与指示视频块的运动矢量之间的差。视频解码器300可以使用指示视频块的运动矢量和运动矢量差来确定当前视频块的运动矢量。
如上所讨论的,视频编码器200可以预测性地信令通知运动矢量。可以由视频编码器200实现的预测性的信令通知技术的两个示例包括高级运动矢量预测(advanced motionvector predication,AMVP)和merge模式信令通知。
帧内预测单元206可以对当前视频块进行帧内预测。当帧内预测单元206对当前视频块进行帧内预测时,帧内预测单元206可以基于相同图片中其他视频块的解码样点来生成当前视频块的预测数据。当前视频块的预测数据可以包括预测视频块和各种语法元素。
残差生成单元207可以通过从当前视频块中减去(例如,由减号表示)当前视频块的(多个)预测视频块来生成当前视频块的残差数据。当前视频块的残差数据可以包括对应于当前视频块中样点的不同样点分量的残差视频块。
在其他示例中,例如在跳过模式下,对于当前视频块可能不存在当前视频块的残差数据,并且残差生成单元207可以不进行减去操作。
变换处理单元208可以通过将一个或多个变换应用于与当前视频块相关联的残差视频块来生成当前视频块的一个或多个变换系数视频块。
在变换处理单元208生成与当前视频块相关联的变换系数视频块之后,量化单元209可以基于与当前视频块相关联的一个或多个量化参数(quantization parameter,QP)值来量化与当前视频块相关联的变换系数视频块。
逆量化单元210和逆变换单元211可以将逆量化和逆变换分别应用于变换系数视频块,来从变换系数视频块重建残差视频块。重建单元212可以将重建的残差视频块添加到来自由预测单元202生成的一个或多个预测视频块的对应样点,以产生与当前块相关联的重建视频块用于存储在缓冲器213中。
在重建单元212重建视频块之后,可以进行环路滤波操作以降低视频块中视频块化伪影。
熵编码单元214可以从视频编码器200的其他功能组件接收数据。当熵编码单元214接收数据时,熵编码单元214可以进行一个或多个熵编码操作以生成熵编码数据并且输出包括熵编码数据的比特流。
本公开的技术的一些实施例包括决定或确定启用视频处理工具或模式。在示例中,当启用视频处理工具或模式时,编码器将使用或实现在视频块的处理过程中的工具或模式,但是不必基于工具或模式的使用来修改得到的比特流。换言之,当基于决定或确定启用视频处理工具或模式时,从视频块到视频的比特流(或比特流表示)的转换将使用视频处理工具或模式。在另一个示例中,当启用视频处理工具或模式时,解码器将利用已经基于视频处理工具或模式修改比特流的知识来处理比特流。换言之,使用基于决定或确定启用的视频处理工具或模式,将执行从视频的比特流到视频块的转换。
图10是图示视频解码器300的示例的框图,该视频解码器300可以是图8中图示的系统100中的视频解码器114。
视频解码器300可以被配置为进行本公开的任何或全部技术。在图10的示例中,视频解码器300包括多个功能组件。本公开所描述的技术可以在视频解码器300的各种组件之间共享。在一些示例中,处理器可以配置为进行本公开中描述的任何或全部技术。
在图10的示例中,视频解码器300包括熵解码单元301、运动补偿单元302、帧内预测单元303、逆量化单元304、逆变换单元305以及重建单元306和缓冲器307。在一些示例中,视频解码器300可以进行与关于视频编码器200(图9)所描述的编码过程总体反演的解码过程。
熵解码单元301可以检索编码的比特流。编码的比特流可以包括熵编解码视频数据(例如,视频数据的编码块)。熵解码单元301可以对熵编解码视频进行解码,并且根据熵解码视频数据,运动补偿单元302可以确定包括运动矢量、运动矢量精度、参考图片列表索引和其他运动信息的运动信息。运动补偿单元302例如可以通过进行AMVP和merge模式确定此类信息。
运动补偿单元302可以产生运动补偿块,可能地基于插值滤波器进行插值。要以子像素精度使用的插值滤波器的标识符可以包括在语法元素中。
运动补偿单元302可以使用由视频编码器200在编码视频块的期间所使用的插值滤波器,来计算出参考块的子整数个像素的插值的值。运动补偿单元302可以根据接收的语法信息确定由视频编码器200所使用的插值滤波器并且使用插值滤波器来产生预测块。
运动补偿单元302可以使用一些语法信息来确定:用于对编码视频序列的(多个)帧和/或(多个)条带进行编码的块的尺寸,描述编码视频序列的图片的每个宏块如何被分割的分割信息,指示如何编码每个分割的模式,每个帧间编码块的一个或多个参考帧(和参考帧列表),以及对编码视频序列进行解码的其他信息。
帧内预测单元303可以使用例如在比特流中接收的帧内预测模式来从空域相邻块形成预测块。逆量化单元303逆量化(即去量化)在比特流中提供的且由熵解码单元301解码的量化的视频块系数。逆变换单元303应用逆变换。
重建单元306可以用由运动补偿单元202或帧内预测单元303生成的对应预测块求和残差块,以形成解码块。如所期望的,去块化滤波器还可以应用于滤波解码块以便移除块化伪影。解码视频块然后存储在缓冲器307中,该缓冲器307提供用于随后的运动补偿/帧内预测的参考块,并且还产生用于在显示设备上呈现的解码视频。
接下来提供了一些实施例优选的解决方案的列表。
以下解决方案示出了上一章节中讨论的技术的示例实施例(例如,项目1)。
1.一种视频处理方法(例如,图7中描绘的方法900),包括:执行(902)包括一个或多个视频图片的视频和视频的编解码表示之间的转换,其中,每个视频图片包括一个或多个片,其中,编解码表示符合格式规则;其中,格式规则规定,在编解码表示中信令通知的第一信息和从编解码表示中推导的第二信息,其中,至少第一信息或第二信息与一个或多个片的行索引或列索引相关。
2.根据解决方案1的方法,其中,格式规则规定,推导每个视频图片的每个编解码树单元列的片列索引。
3.根据解决方案1的方法,其中,格式规则规定,推导每个视频图片的每个编解码树单元行的片行索引。
以下解决方案示出了上一章节中讨论的技术的示例实施例(例如,项目2)。在这些解决方案中,视频区域可以是视频图片,并且视频单元可以是视频块或编解码树单元或视频条带。
4.一种视频处理方法,包括:执行视频的视频区域的视频单元和视频的编解码表示之间的转换,其中,编解码表示符合格式规则;其中,格式规则规定,视频区域处的第一控制信息控制是否在视频单元级别包括第二控制信息;其中,第一控制信息和/或第二控制信息包括关于用于转换的亮度映射与色度缩放(LMCS)或色度残差缩放(CRS)或重塑处理(RP)的信息。
5.根据解决方案4的方法,其中,第一控制信息包括指示第二控制信息是否被包括在编解码表示中的指示符。
6.根据解决方案4-5的方法,其中,第一控制信息的特定值指示对视频区域中的所有视频单元禁用LMCS。
7.根据解决方案4-6中任一项的方法,其中,第二控制信息控制视频单元处的LMCS的启用。
8.根据解决方案4的方法,其中,第一控制信息包括多个指示符。
以下解决方案示出了上一章节中讨论的技术的示例实施例(例如,项目5-8)。
9.一种视频处理方法,包括:执行包括一个或多个视频区域的视频和该视频的编解码表示之间的转换,该一个或多个视频区域包括一个或多个视频单元;其中,编解码表示符合格式规则;其中,格式规则规定,编解码表示包括可用于至少一些视频单元的转换的缩放列表的两级别信令通知,其中,视频区域级别的两级别信令通知中的高级别信令通知控制视频单元级别的两级别信令通知中的低级别信令通知是否以及在哪里被包括在编解码表示中;其中,缩放列表包括关于用于至少一些视频单元的转换的缩放的信息。
10.根据解决方案9的方法,其中,高级别信令通知中的二进制值字段控制低级别信令通知的发生。
11.根据解决方案9-10中任一项的方法,其中,低级别信令通知中的二进制值字段控制包括在低级别信令通知中的缩放列表的禁用。
12.根据解决方案9-11中任一项的方法,其中,一个或多个视频区域对应于视频图片。
13.根据解决方案9-12中任一项的方法,其中,一个或多个视频单元包括视频条带或视频编解码单元。
以下解决方案示出了上一章节中讨论的技术的示例实施例(例如,项目5-8)。
14.一种视频处理的方法,包括:确定用于视频的视频单元和视频的编解码表示之间的转换的低频不可分变换的缩放列表;以及基于确定来执行转换,其中,编解码表示中的语法结构指示是否为视频单元启用缩放列表。
15.根据解决方案14的方法,其中,语法结构被包括在序列头或图片头或条带头中。
16.根据解决方案14-15中任一项的方法,其中,视频单元包括视频块。
17.根据解决方案1至16中任一项的方法,其中,转换包括将视频编码成编解码表示。
18.根据解决方案1至16中任一项的方法,其中,转换包括解码编解码表示以生成视频的像素值。
19.一种视频解码装置,包括被配置为实施解决方案1至18中的一个或多个中的方法的处理器。
20.一种视频编解码装置,包括被配置为实施解决方案1至18中的一个或多个中的方法的处理器。
21.一种其上存储有计算机代码的计算机程序产品,该代码在由处理器执行时使处理器实施解决方案1至18中任一项的方法。
22.本文档中描述的方法、装置或系统。
在本文描述的解决方案中,编码器可以通过根据格式规则产生编解码表示来符合格式规则。在本文描述的解决方案中,解码器可以使用格式规则来解析编解码表示中的语法元素,其中,根据格式规则了解语法元素的存在和不存在,以产生解码的视频。
图12是视频处理的示例方法1200的流程图。操作1202包括执行视频的视频块和视频的比特流之间的转换,其中,比特流符合格式规则,其中,格式规则规定,第一语法元素被包括在视频区域级别的比特流中,第一语法元素指示缩放处理是应用于视频块的变换系数还是应用于视频块的非变换系数,并且其中,视频区域小于视频的视频图片。
在方法1200的一些实施例中,格式规则规定,第一语法元素在条带的条带头中,并且格式规则规定,缩放处理不受第二语法元素控制,第二语法元素指示是否在比特流中的序列参数集中启用缩放列表。在方法1200的一些实施例中,第二语法元素指定是否启用缩放列表,缩放列表在条带转换期间被包括在变换系数的缩放处理中的缩放列表自适应参数集中。在方法1200的一些实施例中,格式规则规定,第一语法元素在条带的条带头中,并且格式规则规定,缩放处理不受第三语法元素控制,第三语法元素指示缩放列表是否存在于比特流中的图片头中。在方法1200的一些实施例中,第一语法元素指定是否启用缩放列表,缩放列表在条带转换期间被包括变换系数的缩放处理中的缩放列表自适应参数集中。
图13是视频处理的示例方法1300的流程图。操作1302包括执行视频的视频区域的视频单元和视频的比特流之间的转换,其中,比特流符合格式规则,其中,格式规则规定,比特流中的视频区域的第一级别的第一控制信息指示第二控制信息是否被包括在比特流中的视频单元的第二级别中,并且其中,第一控制信息和/或第二控制信息包括关于缩放列表是用于转换的变换系数还是用于转换的非变换系数的信息。
在方法1300的一些实施例中,第一控制信息选择性地包括第一指示符,第一指示符指示是否为视频区域的第一级别的一个或多个条带启用缩放列表以指定是否在视频单元的第二级别启用缩放列表,并且第一指示符是非二进制值。在方法1300的一些实施例中,视频区域的第一级别包括图片头。在方法1300的一些实施例中,视频区域的第一级别包括图片头,第一控制信息包括第一指示符,当第一指示符等于第一值时,为图片头的所有条带启用缩放列表,当第一指示符等于第二值时,为少于图片头的所有条带启用缩放列表,当第一指示符等于第三值时,为图片头的所有条带禁用缩放列表,并且第一值、第二值和第三值彼此不同。在方法1300的一些实施例中,当第一控制信息不包括第一指示符时,第一指示符的值被推断为默认值。
在方法1300的一些实施例中,视频区域的第一级别包括图片头,第一控制信息包括第一指示符,当第一指示符等于第一值时,为图片头的所有条带启用缩放列表,当第一指示符等于第二值时,当解码包括视频图片的视频区域的条带时,启用缩放列表,当第一指示符等于第三值时,为图片头的所有条带禁用缩放列表,并且第一值、第二值和第三值彼此不同。在方法1300的一些实施例中,视频区域的第一级别包括图片头,第一控制信息包括第一指示符,当第一指示符等于第一值时,为图片头的所有条带启用缩放列表,当第一指示符等于第二值时,当解码包括视频图片的视频区域的条带时,选择性地启用缩放列表,当第一指示符等于第三值时,为图片头的所有条带禁用缩放列表,以及第一值、第二值和第三值彼此不同。
在方法1300的一些实施例中,视频区域的第一级别包括图片头,第一控制信息包括第一指示符,当第一指示符等于第一值时,为图片头的所有条带禁用缩放列表,当第一指示符等于第二值时,为少于图片头的所有条带禁用缩放列表,当第一指示符等于第三值时,为图片头的所有条带启用缩放列表,并且第一值、第二值和第三值彼此不同。在方法1300的一些实施例中,视频区域的第一级别包括图片头,第一控制信息包括第一指示符,当第一指示符等于第一值时,为图片头的所有条带启用缩放列表,当第一指示符等于第二值时,当解码包括视频图片的视频区域的条带时,选择性地禁用缩放列表,当第一指示符等于第三值时,为图片头的所有条带禁用缩放列表,并且第一值、第二值和第三值彼此不同。在方法1300的一些实施例中,视频区域的第一级别包括图片头,第一控制信息包括第一指示符,当第一指示符等于第一值时,为图片头的所有条带启用缩放列表,当第一指示符等于第二值时,当解码包括视频图片的视频区域的条带时,禁用缩放列表,当第一指示符等于第三值时,为图片头的所有条带禁用缩放列表,以及第一值、第二值和第三值彼此不同。
在方法1300的一些实施例中,第一指示符是否被选择性地包括在第一控制信息中是基于比特流中指示缩放列表是否在序列级别被启用的语法元素的值。在方法1300的一些实施例中,用u(v)或u(2)或ue(v)编解码第一指示符。在方法1300的一些实施例中,用截断的一元码编解码第一指示符。在方法1300的一些实施例中,基于指示是否为视频区域的第一级别的一个或多个条带启用缩放列表的第一指示符的值,将一个或多个条带使用的缩放列表的自适应参数集(APS)信息包括在比特流中。在方法1300的一些实施例中,第二控制信息选择性地包括第二指示符,第二指示符指示为视频单元的第二级别的一个或多个条带是启用还是禁用缩放列表,基于包括在第一控制信息中的第一指示符的值,第二指示符被包括在比特流中,并且第一指示符指示为视频单元的第二级别的一个或多个条带是启用还是禁用缩放列表。在方法1300的一些实施例中,第二控制信息包括条带头。在方法1300的一些实施例中,响应于第一指示符等于第一值,第二指示符被包括在第二控制信息中。在方法1300的一些实施例中,响应于执行以下条件检查,第二指示符被包括在第二控制信息中:第一指示符> >1,或第一指示符/2,或第一指示符&0x01,其中,>>描述了右移位操作,并且其中,&描述了按位逻辑与运算。
在方法1300的一些实施例中,响应于第二控制信息中不存在第二指示符:响应于第一指示符等于第一值,推断第二指示符的值被启用,或者响应于第一指示符等于第三值,推断第二指示符的值被禁用,并且第一值、第一指示符的第二值和第三值彼此不同。在方法1300的一些实施例中,第一控制信息包括多个指示符,多个指示符指示是否为视频区域的第一级别的一个或多个条带启用缩放列表,以指定缩放列表是否在视频单元的第二级别被启用,并且多个指示符具有非二进制值。在方法1300的一些实施例中,多个指示符包括包含在图片头中的至少两个指示符。在方法1300的一些实施例中,至少两个指示符包括第一指示符,第一指示符指定是否为与图片头相关联的至少一个条带启用缩放列表,并且至少两个指示符选择性地包括第二指示符,第二指示符指定是否为与图片头相关联的所有条带启用缩放列表。在方法1300的一些实施例中,基于第一指示符的值,在多个指示符中选择性地信令通知第二指示符。
在方法1300的一些实施例中,第一指示符的值指定为至少一个条带启用缩放列表。在方法1300的一些实施例中,响应于第二指示符不存在于比特流中,推断为与图片头相关联的所有条带启用缩放列表。在方法1300的一些实施例中,响应于第一指示符在一致性比特流中为假,第二指示符为假。在方法1300的一些实施例中,至少两个指示符包括第三指示符,基于第一指示符的第一值或第二指示符的第二值在条带头中选择性地信令通知第三指示符。在方法1300的一些实施例中,第一指示符的第一值指定为至少一个条带启用缩放列表,并且第二指示符的第二值指定为所有条带禁用缩放列表。在方法1300的一些实施例中,响应于比特流中不存在第三指示符,基于第一指示符的第一值和/或第二指示符的第二值来推断第三指示符的值。在方法1300的一些实施例中,至少两个指示符包括第一指示符,第一指示符指定是否为与图片头相关联的至少一个条带禁用缩放列表,并且至少两个指示符选择性地包括第二指示符,第二指示符指定是否为与图片头相关联的所有条带禁用缩放列表。
在方法1300的一些实施例中,基于第一指示符的第一值,在多个指示符中信令通知第二指示符。在方法1300的一些实施例中,第一指示符的第一值指定为至少一个条带禁用缩放列表。在方法1300的一些实施例中,响应于第二指示符不存在于比特流中,推断为与图片头相关联的所有条带禁用缩放列表。在方法1300的一些实施例中,至少两个指示符基于第二指示符的第二值选择性地包括条带头中的第三指示符。在方法1300的一些实施例中,第一指示符的第一值指定为至少一个条带启用缩放列表,并且其中,第二指示符的第二值指定为所有条带启用缩放列表。在方法1300的一些实施例中,响应于第三指示符不存在于比特流中,基于第一指示符的第一值和/或第二指示符的第二值来推断第三指示符的值。在方法1300的一些实施例中,多个指示符基于指示缩放列表是否在序列级别被启用的语法元素的值选择性地包括第一指示符。
在方法1300的一些实施例中,多个指示符选择性地包括第三指示符,第三指示符指示缩放列表在视频单元的第二级别是被启用还是被禁用,并且,基于第一指示符的第一值和/或第二指示符的第二值,选择性地信令通知第三指示符。在方法1300的一些实施例中,基于指示没有为所有条带启用缩放列表或没有为所有条带禁用缩放列表的第二指示符,选择性地信令通知第三指示符。在方法1300的一些实施例中,在视频区域的第一级别的第一控制信息中选择性地信令通知两个1位语法元素,以指定在视频单元的第二级别是否启用缩放列表,视频区域包括视频图片,并且视频单元包括一个或多个条带。在方法1300的一些实施例中,第一控制信息包括视频图片的图片头,并且其中,第二控制信息包括来自一个或多个条带的条带的条带头。
在方法1300的一些实施例中,两个1位语法元素包括第一图片头语法元素,响应于第一图片头语法元素等于1,视频图片的所有条带使用缩放列表,并且响应于第一图片头语法元素等于0,视频图片的每个条带选择性地使用缩放列表。在方法1300的一些实施例中,两个1位语法元素包括第二图片头语法元素,响应于第二图片头语法元素等于1,视频图片的条带均不使用缩放列表,并且响应于第二图片头语法元素等于0,视频图片的每个条带选择性地使用缩放列表。在方法1300的一些实施例中,当第一图片头语法元素等于0时,在比特流中信令通知第二图片头语法元素。在方法1300的一些实施例中,在图片头中信令通知缩放列表的自适应参数集(APS)标识符,响应于:第一图片头语法元素等于1,或者第一图片头语法元素等于0,并且第二图片头语法元素等于0。在方法1300的一些实施例中,在条带头中信令通知条带头语法元素,响应于:第一图片头语法元素等于0,并且第二图片头语法元素等于0。
在方法1300的一些实施例中,响应于第一图片头语法元素等于1,将条带头中的条带头语法元素的值推断为0。在方法1300的一些实施例中,响应于第一图片头语法元素等于0并且第二图片头语法元素等于0,将条带头中的条带头语法元素的值推断为0。在方法1300的一些实施例中,响应于条带头中的条带头语法元素的值等于1,缩放列表用于解码条带。在方法1300的一些实施例中,比特流选择性地包括一个或多个指示符,一个或多个指示符指示与缩放列表相关的信息是在图片头中还是在条带头中被指示。在方法1300的一些实施例中,一个或多个指示符包括一位指示符。
在方法1300的一些实施例中,响应于一位指示符指示第一控制信息中的图片头包括与缩放列表相关的信息,视频单元的所有条带从图片头推断值,并且从条带头中排除与缩放列表相关的信息的信令通知。在方法1300的一些实施例中,响应于一位指示符指示与缩放列表相关的信息在条带头中被指示,从图片头中排除与缩放列表相关的信息。在方法1300的一些实施例中,在图片头中信令通知一个或多个指示符。在方法1300的一些实施例中,在图片参数集(PPS)中信令通知一个或多个指示符。在方法1300的一些实施例中,在序列参数集(SPS)中信令通知一个或多个指示符。
图14为视频处理的示例方法1400的流程图。操作1402包括执行视频的视频块和视频的比特流之间的转换,其中,视频块使用低频不可分变换进行转换,其中,比特流符合格式规则,格式规则规定,在比特流的语法级别包括语法元素,其中,语法元素指示是否为视频块启用从参考缩放列表推导的缩放矩阵的使用,并且其中,语法级别是序列级别、图片级别或条带级别。
在方法1400的一些实施例中,语法元素被包括在序列参数集(SPS)、图片参数集(PPS)、图片头或条带头中。在方法1400的一些实施例中,基于是否为视频块启用低频不可分变换,将语法元素包括在SPS、PPS、图片头或条带头中。在方法1400的一些实施例中,基于sps_lfnst_enabled_flag的值是否等于1,语法元素被包括在SPS中。在方法1400的一些实施例中,该方法还包括确定是否基于语法元素将从显式缩放列表或默认缩放列表推导的缩放矩阵应用于视频块以及是否为视频块启用低频不可分变换。
图15是视频处理的示例方法1500的流程图。操作1502包括:对于视频的视频单元和视频的比特流之间的转换,确定使用视频单元的边界外的填充样点对沿着视频单元的边界的视频单元的样点执行去方块滤波。操作1504包括根据确定来执行转换。
在方法1500的一些实施例中,视频单元包括视频图片。在方法1500的一些实施例中,视频单元包括视频图片的子图片。在方法1500的一些实施例中,视频单元包括条带。在方法1500的一些实施例中,视频单元包括片。在方法1500的一些实施例中,视频单元是从逐渐解码刷新(GDR)获得的刷新区域,并且其中,边界位于视频图片的刷新区域和未刷新区域之间。在方法1500的一些实施例中,边界在比特流中被指示为虚拟边界。在方法1500的一些实施例中,以重复的方式执行填充处理,使得填充样点中的两个或更多个的值等于沿着视频单元的边界的样点中的样点的值。在方法1500的一些实施例中,以对称方式执行填充处理,使得来自填充样点的至少第一填充样点和第二填充样点的值分别等于来自沿着视频单元的边界的样点的第一样点和第二样点的值。
在一些实施例中,执行转换包括将视频编码成比特流。在一些实施例中,执行转换包括从视频生成比特流,并且该方法还包括将比特流存储在非暂时性计算机可读记录介质中。在一些实施例中,执行转换包括从比特流中解码视频。在一些实施例中,一种视频解码装置包括处理器,该处理器被配置成实施本专利文档中描述的一个或多个操作。在一些实施例中,一种视频编解码装置包括处理器,该处理器被配置成实施本专利文档中描述的一个或多个操作。在一些实施例中,一种其上存储有计算机指令的计算机程序产品,该指令在由处理器执行时使得处理器实施本专利文档中描述的一个或多个操作。在一些实施例中,一种非暂时性计算机可读存储介质,其存储根据本专利文档中描述的一个或多个操作生成的比特流。在一些实施例中,一种存储指令的非暂时性计算机可读存储介质,该指令使处理器执行本专利文档中描述的一个或多个操作。在一些实施例中,一种生成比特流的方法,包括:根据本专利文档中描述的一个或多个操作生成视频的比特流,并将比特流存储在计算机可读程序介质上。在一些实施例中,一种方法、一种装置、一种根据本文档中描述的所公开的方法或系统生成的比特流。
在本文档中,术语“视频处理”可指视频编码、视频解码、视频压缩或视频解压缩。例如,在从视频的像素表示到对应的比特流表示的转换期间,可以应用视频压缩算法,反之亦然。如语法所定义,当前视频块的比特流表示可(例如)对应于共位或散布在比特流内不同位置的比特。例如,可以根据变换和编解码的误差残差值并且还使用头中的比特和比特流中的其他字段,对宏块进行编码。此外,在转换期间,解码器可以基于该确定,在知道一些字段可能存在或不存在的情况下解析比特流,如以上解决方案中所述。类似地,编码器可确定包括或不包括某些语法字段,并通过从编解码表示中包括或排除语法字段来相应地生成编解码表示。
本文档中所述的公开和其他方案、示例、实施例、模块和功能操作可以被实现在数字电子电路中或者在计算机软件、固件或硬件中,含有本文档中所公开的结构以及其结构的等同物,或者它们中的一个或多个的组合。所公开的和其他实施例可以被实现为计算机可读介质上所编码的一个或多个计算机程序产品,例如一个或多个计算机程序指令模块,用于由数据处理装置执行或者控制数据处理装置的操作。该计算机可读介质可以是机器可读存储设备、机器可读存储基板、存储器设备、影响机器可读可传播信号的复合物,或其一个或多个的组合。术语“数据处理装置”涵盖用于处理数据的所有装置、设备和机器,包括例如可编程处理器、计算机或多个处理器或计算机。除了硬件之外,该装置还可以包括为所讨论的计算机程序创建执行环境的代码,例如,构成处理器固件、协议栈、数据库管理系统、操作系统、或者它们中的一个或多个的组合的代码。传播信号是人工生成的信号,例如,机器生成的电、光或电磁信号,其被生成来编码信息以传输到合适的接收器装置。
计算机程序(也称为程序、软件、软件应用、脚本或代码)可以用任何形式的编程语言编写,包括编译或解释语言,并且可以以任何形式来部署计算机程序,包括独立程序或适合在计算环境中使用的模块、组件、子例程或其它单元。计算机程序不必须对应于文件系统中的文件。程序可以存储在保存其他程序或数据的文件的部分中(例如,在标记语言文档中存储的一个或多个脚本)、在专用于所讨论的程序的单个文件中、或在多个协同文件中(例如存储一个或多个模块、子程序或代码部分的文件)。计算机程序可以部署为在一个计算机上或者在多个计算机上执行,该多个计算机位于一个站点处或者分布跨多个站点并由通信网络互连。
可以由执行一个或多个计算机程序的一个或多个可编程处理器来进行在本文档中所描述的过程和逻辑流,以通过在输入数据上操作并且生成输出来进行功能。也可以由专用逻辑电路(例如,现场可编程门阵列(FPGA)或专用集成电路(ASIC))进行过程和逻辑流,并且装置可以实现为专用逻辑电路(例如FPGA或ASIC)。
适合于计算机程序的执行的处理器包括例如通用和专用微处理器两者,以及任何类型的数字计算机的任何一个或多个处理器。通常,处理器将从只读存储器或随机存取存储器或者该两者接收指令和数据。计算机的基本元件是用于进行指令的处理器和用于存储指令和数据的一个或多个存储器设备。通常,计算机还将包括用于存储数据的一个或多个海量存储设备(例如磁、磁光盘或光盘),或者可操作地耦合以从海量存储设备(例如磁、磁光盘或光盘)接收数据或者将数据传输到海量存储设备(例如磁、磁光盘或光盘),或者以上两者。但是,计算机不必具有此类设备。适用于存储计算机程序指令和数据的计算机可读介质含有所有形式的非易失性存储器、介质和存储器设备,含有例如半导体存储器设备(例如EPROM、EEPROM和闪速存储器设备);磁盘(例如内部硬盘或可移动磁盘);磁光盘;和CD ROM和DVD-ROM磁盘。处理器和存储器可以由专用逻辑电路补充,或者合并在专用逻辑电路中。
虽然本专利文档含有许多细节,但这些细节不应被解释为对任何主题或可要求保护的范围的限制,而是作为指定于特定技术的特定实施例的特征的描述。在本专利文档中,在单独的实施例的上下文中描述的某些特征也可以在单个实施例中组合实现。相反地,在单个实施例的上下文中所描述的各种特征还可以分别在多个实施例中来实现或者以各种合适的子组合来实现。此外,尽管特征可以如上文描述为以某些组合起作用并且甚至最初同样地要求,但是在某些情况下来自所要求保护的组合的一个或多个特征可以从组合中去除,并且所要求保护的组合可以针对子组合或子组合的变化。
类似地,尽管在附图中以特定顺序描绘了操作,但这不应当理解为要求按所示的特定次序或顺序次序进行此类操作或者进行所有示出的操作,以实现期望的结果。此外,在本专利文档中描述的实施例中的各种系统组件的分开不应被理解为在所有实施例中都要求这种分开。
仅描述了几个实现方式和示例,并且可以基于本专利文档中描述和示出的内容来作出其它实现方式、增强和变型。

Claims (71)

1.一种视频处理的方法,包括:
执行视频的视频块和所述视频的比特流之间的转换,
其中,所述比特流符合格式规则,
其中,所述格式规则规定,第一语法元素被包括在视频区域级别的所述比特流中,所述第一语法元素指示缩放处理是应用于所述视频块的变换系数还是应用于所述视频块的非变换系数,并且
其中,所述视频区域小于所述视频的视频图片。
2.根据权利要求1所述的方法,
其中,所述格式规则规定,所述第一语法元素在条带的条带头中,并且
其中,所述格式规则规定,所述缩放处理不受第二语法元素控制,所述第二语法元素指示是否在所述比特流中的序列参数集中启用缩放列表。
3.根据权利要求2所述的方法,其中,所述第二语法元素指定是否启用所述缩放列表,所述缩放列表在所述条带的转换期间被包括在所述变换系数的所述缩放处理中的缩放列表自适应参数集中。
4.根据权利要求1或2所述的方法,
其中,所述格式规则规定,所述第一语法元素在条带的条带头中,并且
其中,所述格式规则规定,所述缩放处理不受第三语法元素控制,所述第三语法元素指示所述缩放列表是否存在于所述比特流中的图片头中。
5.根据权利要求2至4中任一项所述的方法,其中,所述第一语法元素指定是否启用所述缩放列表,所述缩放列表在所述条带的转换期间被包括在所述变换系数的所述缩放处理中的缩放列表自适应参数集中。
6.一种视频处理的方法,包括:
执行视频的视频区域的视频单元和所述视频的比特流之间的转换,
其中,所述比特流符合格式规则,
其中,所述格式规则规定,所述比特流中的所述视频区域的第一级别的第一控制信息指示第二控制信息是否被包括在所述比特流中的所述视频单元的第二级别中,并且
其中,所述第一控制信息和/或所述第二控制信息包括关于缩放列表是用于所述转换的变换系数还是用于所述转换的非变换系数的信息。
7.根据权利要求6所述的方法,
其中,所述第一控制信息选择性地包括第一指示符,所述第一指示符指示是否为所述视频区域的第一级别的一个或多个条带启用所述缩放列表以指定是否在所述视频单元的第二级别启用所述缩放列表,并且
其中,所述第一指示符是非二进制值。
8.根据权利要求7所述的方法,其中,所述视频区域的第一级别包括图片头。
9.根据权利要求7所述的方法,
其中,所述视频区域的第一级别包括图片头,
其中,所述第一控制信息包括所述第一指示符,
其中,当所述第一指示符等于第一值时,为所述图片头的所有条带启用所述缩放列表,
其中,当所述第一指示符等于第二值时,为少于所述图片头的所有条带启用所述缩放列表,
其中,当所述第一指示符等于第三值时,为所述图片头的所有条带禁用所述缩放列表,并且
其中,所述第一值、所述第二值和所述第三值彼此不同。
10.根据权利要求7所述的方法,其中,当所述第一控制信息不包括所述第一指示符时,所述第一指示符的值被推断为默认值。
11.根据权利要求7所述的方法,
其中,所述视频区域的第一级别包括图片头,
其中,所述第一控制信息包括所述第一指示符,
其中,当所述第一指示符等于第一值时,为所述图片头的所有条带启用所述缩放列表,
其中,当所述第一指示符等于第二值时,当解码包括视频图片的所述视频区域的条带时,启用所述缩放列表,
其中,当所述第一指示符等于第三值时,为所述图片头的所有条带禁用所述缩放列表,并且
其中,所述第一值、所述第二值和所述第三值彼此不同。
12.根据权利要求7所述的方法,
其中,所述视频区域的第一级别包括图片头,
其中,所述第一控制信息包括所述第一指示符,
其中,当所述第一指示符等于第一值时,为所述图片头的所有条带启用所述缩放列表,
其中,当所述第一指示符等于第二值时,当解码包括视频图片的所述视频区域的条带时,选择性地启用所述缩放列表,
其中,当所述第一指示符等于第三值时,为所述图片头的所有条带禁用所述缩放列表,以及
其中,所述第一值、所述第二值和所述第三值彼此不同。
13.根据权利要求7所述的方法,
其中,所述视频区域的第一级别包括图片头,
其中,所述第一控制信息包括所述第一指示符,
其中,当所述第一指示符等于第一值时,为所述图片头的所有条带禁用所述缩放列表,
其中,当所述第一指示符等于第二值时,为少于所述图片头的所有条带禁用所述缩放列表,
其中,当所述第一指示符等于第三值时,为所述图片头的所有条带启用所述缩放列表,并且
其中,所述第一值、所述第二值和所述第三值彼此不同。
14.根据权利要求7所述的方法,
其中,所述视频区域的第一级别包括图片头,
其中,所述第一控制信息包括所述第一指示符,
其中,当所述第一指示符等于第一值时,为所述图片头的所有条带启用所述缩放列表,
其中,当所述第一指示符等于第二值时,当解码包括视频图片的所述视频区域的条带时,选择性地禁用所述缩放列表,
其中,当所述第一指示符等于第三值时,为所述图片头的所有条带禁用所述缩放列表,并且
其中,所述第一值、所述第二值和所述第三值彼此不同。
15.根据权利要求7所述的方法,
其中,所述视频区域的第一级别包括图片头,
其中,所述第一控制信息包括所述第一指示符,
其中,当所述第一指示符等于第一值时,为所述图片头的所有条带启用所述缩放列表,
其中,当所述第一指示符等于第二值时,当解码包括视频图片的所述视频区域的条带时,禁用所述缩放列表,
其中,当所述第一指示符等于第三值时,为所述图片头的所有条带禁用所述缩放列表,以及
其中,所述第一值、所述第二值和所述第三值彼此不同。
16.根据权利要求7所述的方法,其中,所述第一指示符是否被选择性地包括在所述第一控制信息中是基于所述比特流中指示所述缩放列表是否在序列级别被启用的语法元素的值。
17.根据权利要求7所述的方法,其中,用u(v)或u(2)或ue(v)编解码所述第一指示符。
18.根据权利要求7所述的方法,其中,用截断的一元码编解码所述第一指示符。
19.根据权利要求7所述的方法,其中,
基于指示是否为所述视频区域的第一级别的一个或多个条带启用所述缩放列表的所述第一指示符的值,将所述一个或多个条带使用的所述缩放列表的自适应参数集APS信息包括在所述比特流中。
20.根据权利要求6所述的方法,
其中,所述第二控制信息选择性地包括第二指示符,所述第二指示符指示为所述视频单元的第二级别的一个或多个条带是启用还是禁用所述缩放列表,
其中,基于包括在所述第一控制信息中的第一指示符的值,所述第二指示符被包括在所述比特流中,并且
其中,所述第一指示符指示为所述视频单元的第二级别的所述一个或多个条带是启用还是禁用所述缩放列表。
21.根据权利要求20所述的方法,其中,所述第二控制信息包括条带头。
22.根据权利要求20所述的方法,其中,响应于所述第一指示符等于第一值,所述第二指示符被包括在所述第二控制信息中。
23.根据权利要求20所述的方法,其中,响应于执行以下条件检查,所述第二指示符被包括在所述第二控制信息中:
所述第一指示符> >1,或
所述第一指示符/2,或
所述第一指示符&0x01,
其中,>>描述了右移位操作,并且
其中,&描述了按位逻辑与运算。
24.根据权利要求20所述的方法,其中,响应于所述第二控制信息中不存在所述第二指示符:
响应于所述第一指示符等于第一值,推断所述第二指示符的值被启用,或者
响应于所述第一指示符等于第三值,推断所述第二指示符的值被禁用,并且
其中,所述第一值、所述第一指示符的第二值和所述第三值彼此不同。
25.根据权利要求6所述的方法,
其中,所述第一控制信息包括多个指示符,所述多个指示符指示是否为所述视频区域的第一级别的一个或多个条带启用所述缩放列表,以指定所述缩放列表是否在所述视频单元的第二级别被启用,并且
其中,所述多个指示符具有非二进制值。
26.根据权利要求25所述的方法,其中,所述多个指示符包括包含在图片头中的至少两个指示符。
27.根据权利要求26所述的方法,
其中,所述至少两个指示符包括第一指示符,所述第一指示符指定是否为与所述图片头相关联的至少一个条带启用所述缩放列表,并且
其中,所述至少两个指示符选择性地包括第二指示符,所述第二指示符指定是否为与所述图片头相关联的所有条带启用所述缩放列表。
28.根据权利要求27所述的方法,其中,基于所述第一指示符的值,在所述多个指示符中选择性地信令通知所述第二指示符。
29.根据权利要求28所述的方法,其中,所述第一指示符的值指定为至少一个条带启用所述缩放列表。
30.根据权利要求27所述的方法,其中,响应于所述第二指示符不存在于所述比特流中,推断为与所述图片头相关联的所有条带启用所述缩放列表。
31.根据权利要求27所述的方法,其中,响应于所述第一指示符在一致性比特流中为假,所述第二指示符为假。
32.根据权利要求27所述的方法,其中,所述至少两个指示符包括第三指示符,基于所述第一指示符的第一值或所述第二指示符的第二值在条带头中选择性地信令通知所述第三指示符。
33.根据权利要求32所述的方法,其中,所述第一指示符的第一值指定为至少一个条带启用所述缩放列表,并且所述第二指示符的第二值指定为所有条带禁用所述缩放列表。
34.根据权利要求32所述的方法,其中,响应于所述比特流中不存在所述第三指示符,基于所述第一指示符的第一值和/或所述第二指示符的第二值来推断所述第三指示符的值。
35.根据权利要求26所述的方法,
其中,所述至少两个指示符包括第一指示符,所述第一指示符指定是否为与所述图片头相关联的至少一个条带禁用所述缩放列表,并且
其中,所述至少两个指示符选择性地包括第二指示符,所述第二指示符指定是否为与所述图片头相关联的所有条带禁用所述缩放列表。
36.根据权利要求35所述的方法,其中,基于所述第一指示符的第一值,在所述多个指示符中信令通知所述第二指示符。
37.根据权利要求36所述的方法,其中,所述第一指示符的第一值指定为至少一个条带禁用所述缩放列表。
38.根据权利要求35所述的方法,其中,响应于所述第二指示符不存在于所述比特流中,推断为与所述图片头相关联的所有条带禁用所述缩放列表。
39.根据权利要求35所述的方法,其中,所述至少两个指示符基于所述第二指示符的第二值选择性地包括条带头中的第三指示符。
40.根据权利要求39所述的方法,其中,所述第一指示符的第一值指定为至少一个条带启用所述缩放列表,并且其中,所述第二指示符的第二值指定为所有条带启用所述缩放列表。
41.根据权利要求39所述的方法,其中,响应于所述第三指示符不存在于所述比特流中,基于所述第一指示符的第一值和/或所述第二指示符的第二值来推断所述第三指示符的值。
42.根据权利要求25所述的方法,其中,所述多个指示符基于指示所述缩放列表是否在序列级别被启用的语法元素的值选择性地包括第一指示符。
43.根据权利要求6所述的方法,
其中,所述多个指示符选择性地包括第三指示符,所述第三指示符指示所述缩放列表在所述视频单元的第二级别是被启用还是被禁用,并且
其中,基于所述第一指示符的第一值和/或所述第二指示符的第二值,选择性地信令通知所述第三指示符。
44.根据权利要求43所述的方法,其中,基于指示没有为所有条带启用所述缩放列表或没有为所有条带禁用所述缩放列表的第二指示符,选择性地信令通知所述第三指示符。
45.根据权利要求6所述的方法,
其中,在所述视频区域的第一级别的所述第一控制信息中选择性地信令通知两个1位语法元素,以指定在所述视频单元的第二级别是否启用所述缩放列表,
其中,所述视频区域包括视频图片,并且
其中,所述视频单元包括一个或多个条带。
46.根据权利要求45所述的方法,其中,所述第一控制信息包括所述视频图片的图片头,并且其中,所述第二控制信息包括来自所述一个或多个条带的条带的条带头。
47.根据权利要求46所述的方法,
其中,所述两个1位语法元素包括第一图片头语法元素,
其中,响应于所述第一图片头语法元素等于1,所述视频图片的所有条带使用所述缩放列表,并且
其中,响应于所述第一图片头语法元素等于0,所述视频图片的每个条带选择性地使用所述缩放列表。
48.根据权利要求47所述的方法,
其中,所述两个1位语法元素包括第二图片头语法元素,
其中,响应于所述第二图片头语法元素等于1,所述视频图片的条带均不使用所述缩放列表,并且
其中,响应于所述第二图片头语法元素等于0,所述视频图片的每个条带选择性地使用所述缩放列表。
49.根据权利要求48所述的方法,其中,当所述第一图片头语法元素等于0时,在所述比特流中信令通知所述第二图片头语法元素。
50.根据权利要求47所述的方法,其中,在所述图片头中信令通知所述缩放列表的自适应参数集APS标识符,响应于:
所述第一图片头语法元素等于1,或者
所述第一图片头语法元素等于0,并且所述第二图片头语法元素等于0。
51.根据权利要求47所述的方法,其中,在所述条带头中信令通知条带头语法元素,响应于:
所述第一图片头语法元素等于0,并且所述第二图片头语法元素等于0。
52.根据权利要求47所述的方法,其中,响应于所述第一图片头语法元素等于1,将所述条带头中的条带头语法元素的值推断为0。
53.根据权利要求47所述的方法,其中,响应于所述第一图片头语法元素等于0并且所述第二图片头语法元素等于0,将所述条带头中的条带头语法元素的值推断为0。
54.根据权利要求47所述的方法,其中,响应于所述条带头中的条带头语法元素的值等于1,所述缩放列表用于解码所述条带。
55.根据权利要求6所述的方法,其中,所述比特流选择性地包括一个或多个指示符,所述一个或多个指示符指示与所述缩放列表相关的信息是在图片头中还是在条带头中被指示。
56.根据权利要求55所述的方法,其中,所述一个或多个指示符包括一位指示符。
57.根据权利要求56所述的方法,
其中,响应于所述一位指示符指示所述第一控制信息中的图片头包括所述与所述缩放列表相关的信息,所述视频单元的所有条带从图片头推断值,并且
其中,从条带头中排除所述与所述缩放列表相关的信息的信令通知。
58.根据权利要求56所述的方法,其中,响应于所述一位指示符指示所述与所述缩放列表相关的信息在所述条带头中被指示,从所述图片头中排除所述与所述缩放列表相关的信息。
59.根据权利要求55所述的方法,其中,在所述图片头中信令通知所述一个或多个指示符。
60.根据权利要求55所述的方法,其中,在图片参数集PPS中信令通知所述一个或多个指示符。
61.根据权利要求55所述的方法,其中,在序列参数集SPS中信令通知所述一个或多个指示符。
62.根据权利要求1至61中任一项所述的方法,其中,执行所述转换包括将所述视频编码成所述比特流。
63.根据权利要求1至61中任一项所述的方法,其中,执行所述转换包括从所述视频生成所述比特流,并且所述方法还包括将所述比特流存储在非暂时性计算机可读记录介质中。
64.根据权利要求1至61中任一项所述的方法,其中,执行所述转换包括从所述比特流中解码所述视频。
65.一种视频解码装置,包括被配置为实施权利要求1至64中的一项或多项所述的方法的处理器。
66.一种视频编解码装置,包括被配置为实施权利要求1至64中的一项或多项所述的方法的处理器。
67.一种其上存储有计算机指令的计算机程序产品,所述指令在由处理器执行时使所述处理器实施权利要求1至64中任一项所述的方法。
68.一种非暂时性计算机可读存储介质,存储根据权利要求1至64中任一项所述的方法生成的比特流。
69.一种存储指令的非暂时性计算机可读存储介质,所述指令使处理器实施权利要求1至64中任一项所述的方法。
70.一种生成比特流的方法,包括:
根据权利要求1至64中任一项所述的方法生成视频的比特流,并将所述比特流存储在计算机可读程序介质上。
71.一种方法、一种装置、一种根据本文档中描述的所公开的方法或系统生成的比特流。
CN202180019098.3A 2020-03-03 2021-03-03 使用条带头信令通知控制缩放处理 Pending CN115211044A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202062984658P 2020-03-03 2020-03-03
US62/984,658 2020-03-03
PCT/US2021/020615 WO2021178501A1 (en) 2020-03-03 2021-03-03 Controlling a scaling process using slice header signaling

Publications (1)

Publication Number Publication Date
CN115211044A true CN115211044A (zh) 2022-10-18

Family

ID=77613699

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202180019067.8A Pending CN115211125A (zh) 2020-03-03 2021-03-03 视频编解码中的低频不可分变换信令通知
CN202180019098.3A Pending CN115211044A (zh) 2020-03-03 2021-03-03 使用条带头信令通知控制缩放处理

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN202180019067.8A Pending CN115211125A (zh) 2020-03-03 2021-03-03 视频编解码中的低频不可分变换信令通知

Country Status (6)

Country Link
US (2) US11936865B2 (zh)
EP (1) EP4097980A4 (zh)
JP (2) JP7479492B2 (zh)
KR (1) KR20220143857A (zh)
CN (2) CN115211125A (zh)
WO (2) WO2021178501A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021164781A1 (en) * 2020-02-21 2021-08-26 Beijing Bytedance Network Technology Co., Ltd. Picture partitioning in video coding
EP4128759A1 (en) * 2020-04-02 2023-02-08 Telefonaktiebolaget LM ERICSSON (PUBL) Virtual boundary signaling
EP4131971A4 (en) * 2020-04-02 2024-04-17 LG Electronics, Inc. IMAGE CODING METHODS BASED ON CHROMA DEBLOCKING PARAMETER INFORMATION FOR SINGLE COLOR FORMAT IN A VIDEO OR IMAGE CODING SYSTEM

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013154869A1 (en) * 2012-04-13 2013-10-17 Qualcomm Incorporated View synthesis mode for three-dimensional video coding
CN103988437A (zh) * 2011-11-08 2014-08-13 高通股份有限公司 用于上下文自适应二进制算术译码的上下文缩减
US20150264404A1 (en) * 2014-03-17 2015-09-17 Nokia Technologies Oy Method and apparatus for video coding and decoding
US20180270480A1 (en) * 2017-03-20 2018-09-20 Qualcomm Incorporated Enhanced deblocking filtering design in video coding
US20190253624A1 (en) * 2017-07-17 2019-08-15 Ki Baek Kim Image data encoding/decoding method and apparatus

Family Cites Families (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9001883B2 (en) 2011-02-16 2015-04-07 Mediatek Inc Method and apparatus for slice common information sharing
US10244246B2 (en) 2012-02-02 2019-03-26 Texas Instruments Incorporated Sub-pictures for pixel rate balancing on multi-core platforms
JP2013236358A (ja) 2012-03-14 2013-11-21 Sharp Corp 画像フィルタ装置、画像復号装置、画像符号化装置、およびデータ構造
WO2013155897A1 (en) 2012-04-16 2013-10-24 Mediatek Inc. Method and apparatus for loop filtering across slice or tile boundaries
US9479774B2 (en) 2012-09-24 2016-10-25 Qualcomm Incorporated Buffering period and recovery point supplemental enhancement information messages
US20160173887A1 (en) * 2013-07-10 2016-06-16 Sharp Kabushiki Kaisha Scaling list signaling and parameter sets activation
US10142642B2 (en) * 2014-06-04 2018-11-27 Qualcomm Incorporated Block adaptive color-space conversion coding
US10148961B2 (en) 2015-05-29 2018-12-04 Qualcomm Incorporated Arithmetic coder with multiple window sizes
US10038917B2 (en) 2015-06-12 2018-07-31 Microsoft Technology Licensing, Llc Search strategies for intra-picture prediction modes
US10349085B2 (en) * 2016-02-15 2019-07-09 Qualcomm Incorporated Efficient parameter storage for compact multi-pass transforms
US10390048B2 (en) * 2016-02-15 2019-08-20 Qualcomm Incorporated Efficient transform coding using optimized compact multi-pass transforms
US11095893B2 (en) * 2016-10-12 2021-08-17 Qualcomm Incorporated Primary transform and secondary transform in video coding
EP3422724B1 (en) 2017-06-26 2024-05-01 Nokia Technologies Oy An apparatus, a method and a computer program for omnidirectional video
KR20190024212A (ko) 2017-08-31 2019-03-08 세종대학교산학협력단 타일 구조의 구성 방법 및 이의 장치
KR102411337B1 (ko) 2017-10-09 2022-06-22 노키아 테크놀로지스 오와이 비디오 코딩 및 디코딩을 위한 장치, 방법 및 컴퓨터 프로그램
US10873754B2 (en) 2017-12-12 2020-12-22 Coherent Logix, Incorporated Low latency video codec and transmission with parallel processing
US11012715B2 (en) 2018-02-08 2021-05-18 Qualcomm Incorporated Intra block copy for video coding
WO2019167849A1 (en) 2018-02-28 2019-09-06 Sharp Kabushiki Kaisha Systems and methods for partitioning regions of a picture for video coding using different coding unit sizes
CN112567745A (zh) * 2018-03-29 2021-03-26 弗劳恩霍夫应用研究促进协会 用于视频编码的候选变换集合的确定
US11317085B2 (en) * 2018-03-30 2022-04-26 Vid Scale, Inc. Template-based inter prediction techniques based on encoding and decoding latency reduction
KR102504694B1 (ko) * 2018-06-03 2023-02-28 엘지전자 주식회사 축소된 변환을 이용하여 비디오 신호를 처리하는 방법 및 장치
TWI728390B (zh) 2018-06-29 2021-05-21 大陸商北京字節跳動網絡技術有限公司 查找表尺寸
EP3815364A1 (en) 2018-06-29 2021-05-05 InterDigital VC Holdings, Inc. Wavefront parallel processing of luma and chroma components
TWI743514B (zh) 2018-07-09 2021-10-21 弗勞恩霍夫爾協會 用於經編碼圖像多樣化空間劃分之編碼器、解碼器、編碼方法及解碼方法
KR102636267B1 (ko) * 2018-08-16 2024-02-14 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 변형 행렬 선택의 계수에 따른 코딩
KR20210065161A (ko) 2018-09-28 2021-06-03 지티이 코포레이션 비디오 인코딩 및 디코딩 방법 및 장치
KR20240000610A (ko) 2019-01-15 2024-01-02 로즈데일 다이나믹스 엘엘씨 변환 스킵 플래그를 이용한 영상 코딩 방법 및 장치
EP3935856A4 (en) * 2019-03-08 2022-07-06 ZTE Corporation PARAMETER SET SIGNALING IN DIGITAL VIDEO
US11616966B2 (en) * 2019-04-03 2023-03-28 Mediatek Inc. Interaction between core transform and secondary transform
MX2021013073A (es) * 2019-04-25 2021-11-17 Op Solutions Llc Movimiento global para los candidatos al modo de fusion en la prediccion inter.
GB2584295A (en) 2019-05-28 2020-12-02 Canon Kk Method and apparatus for encoding and decoding a video bitstream for merging regions of interest
US11134275B2 (en) * 2019-06-04 2021-09-28 Tencent America LLC Method and apparatus for performing primary transform based on filtering of blocks
WO2020251269A1 (ko) 2019-06-11 2020-12-17 엘지전자 주식회사 영상 디코딩 방법 및 그 장치
KR20240093880A (ko) 2019-06-11 2024-06-24 엘지전자 주식회사 크로마 양자화 파라미터 데이터 기반 영상 디코딩 방법 및 그 장치
WO2021027774A1 (en) 2019-08-10 2021-02-18 Beijing Bytedance Network Technology Co., Ltd. Subpicture dependent signaling in video bitstreams
US11153576B2 (en) * 2019-09-20 2021-10-19 Qualcomm Incorporated Scaling matrices and signaling for video coding
WO2021063420A1 (en) 2019-10-02 2021-04-08 Beijing Bytedance Network Technology Co., Ltd. Slice level signaling in video bitstreams that include sub-pictures
CN114600462A (zh) 2019-10-25 2022-06-07 夏普株式会社 用于在视频编码中发送信号通知图片信息的系统和方法
JP7402016B2 (ja) * 2019-11-06 2023-12-20 オッポ広東移動通信有限公司 画像復号装置及び画像符号化装置
GB2590632B (en) 2019-12-20 2023-07-26 Canon Kk Video coding and decoding
GB2590636B (en) 2019-12-20 2024-01-10 Canon Kk High level syntax for video coding and decoding
US11477450B2 (en) 2019-12-20 2022-10-18 Zte (Uk) Limited Indication of video slice height in video subpictures
AU2020414207B2 (en) 2019-12-23 2024-05-02 Lg Electronics Inc. Image coding apparatus and method based on sub-picture
CN115176468A (zh) 2020-02-03 2022-10-11 抖音视界有限公司 跨分量自适应环路滤波器
US20220039430A1 (en) 2020-08-07 2022-02-10 Innovative Strategic Design, Llc Reduced-sugar fruit juice and fruit must

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103988437A (zh) * 2011-11-08 2014-08-13 高通股份有限公司 用于上下文自适应二进制算术译码的上下文缩减
WO2013154869A1 (en) * 2012-04-13 2013-10-17 Qualcomm Incorporated View synthesis mode for three-dimensional video coding
US20150264404A1 (en) * 2014-03-17 2015-09-17 Nokia Technologies Oy Method and apparatus for video coding and decoding
US20180270480A1 (en) * 2017-03-20 2018-09-20 Qualcomm Incorporated Enhanced deblocking filtering design in video coding
US20190253624A1 (en) * 2017-07-17 2019-08-15 Ki Baek Kim Image data encoding/decoding method and apparatus

Also Published As

Publication number Publication date
WO2021178504A1 (en) 2021-09-10
EP4097980A1 (en) 2022-12-07
JP7479492B2 (ja) 2024-05-08
CN115211125A (zh) 2022-10-18
US11936865B2 (en) 2024-03-19
WO2021178501A1 (en) 2021-09-10
EP4097980A4 (en) 2023-04-19
KR20220143857A (ko) 2022-10-25
US20230007253A1 (en) 2023-01-05
JP2023515884A (ja) 2023-04-14
JP2024010169A (ja) 2024-01-23
US20240121389A1 (en) 2024-04-11

Similar Documents

Publication Publication Date Title
JP7479492B2 (ja) ビデオ・コーディングにおける低周波ノン・セパラブル変換シグナリング
KR20220123650A (ko) 비디오 스트림들 내의 필러 데이터 유닛들의 프로세싱
CN115699756A (zh) 视频编解码中的缩放窗口
CN115211130A (zh) 条带和片图片分割的信令通知
CN114930825A (zh) 用于在编解码图片中实现解码顺序的技术
CN114930837A (zh) 对子图片的帧间预测的限制
JP7395005B2 (ja) サブピクチャの高さの導出
CN115299050A (zh) 包括条带和片的图片的编解码
CN115462085A (zh) 视频编解码中滤波的高级控制
CN115699772A (zh) 视频编解码中的补充增强信息的约束

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination