CN117376555A - 视频编解码中缩减二次变换的矩阵的选择 - Google Patents

视频编解码中缩减二次变换的矩阵的选择 Download PDF

Info

Publication number
CN117376555A
CN117376555A CN202311452261.2A CN202311452261A CN117376555A CN 117376555 A CN117376555 A CN 117376555A CN 202311452261 A CN202311452261 A CN 202311452261A CN 117376555 A CN117376555 A CN 117376555A
Authority
CN
China
Prior art keywords
block
mode
intra
prediction mode
chroma
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311452261.2A
Other languages
English (en)
Inventor
张莉
张凯
刘鸿彬
王悦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing ByteDance Network Technology Co Ltd
ByteDance Inc
Original Assignee
Beijing ByteDance Network Technology Co Ltd
ByteDance Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing ByteDance Network Technology Co Ltd, ByteDance Inc filed Critical Beijing ByteDance Network Technology Co Ltd
Publication of CN117376555A publication Critical patent/CN117376555A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking

Abstract

公开了视频编解码中缩减二次变换的矩阵的选择。描述一种视频处理的方法。该方法包括:对于视频的色度块,做出是否将非正常的色度帧内预测模式应用到视频的所述色度块的第一确定;对于对应于色度块的亮度块,做出将亮度帧内预测模式应用到亮度块的第二确定;基于亮度帧内预测模式做出将变换集或变换矩阵应用到色度块的第三确定;以及根据第三确定执行视频与视频的编解码表示之间的转换,并且其中非正常的色度帧内预测模式包括在不使用沿着色度预测方向外推的邻域像素值的情况下编解码色度块。

Description

视频编解码中缩减二次变换的矩阵的选择
相关申请的交叉引用
本申请是申请日为2020年8月3日、申请号为202080055674.5、发明名称为“视频编解码中缩减二次变换的矩阵的选择”的发明专利申请的分案申请。
技术领域
本专利文档涉及视频处理技术、装置和系统。
背景技术
尽管视频压缩不断发展,数字视频仍然占据因特网和其它数字通信网络上的最大的带宽使用。随着能够接收和显示视频的所连接的用户装置的数量增加,预计数字视频使用的带宽需求将继续增长。
发明内容
装置、系统和方法涉及数字视频编解码,并且具体涉及视频编解码中残差编解码的上下文建模。描述的方法可以应用到现有的视频编解码标准(例如,高性能视频编解码(HEVC))以及未来视频编解码标准或视频编解码二者。
在一个代表性方面,所公开的技术可以用来提供视频处理的方法。该方法包括:对于视频的视频单元的当前视频块与视频的编解码表示之间的转换,为使用一定的帧内预测模式编解码的视频单元确定默认帧内预测模式,使得在不沿着方向外推当前视频块的邻域像素的情况下生成当前视频块的预测块;以及基于该确定执行转换。
在另一个代表性方面,所公开的技术可以用来提供视频处理的方法。该方法包括:使用规则来确定视频的亮度块覆盖视频的色度块的预定位置;以及基于该确定执行视频与视频的编解码表示之间的转换,其中,以使用帧内预测模式的编解码表示来表示色度块。
在又一个代表性方面,所公开的技术可以用来提供视频处理的方法。该方法包括:使用规则来基于与色度块对应的亮度块的编解码模式导出视频的色度块的帧内预测模式;以及基于导出的帧内预测模式来执行亮度块与视频的编解码表示之间的转换,其中,规则指定使用默认帧内预测模式以防亮度块的编解码模式是一定的帧内预测模式,其中在不沿着方向外推亮度块的邻域像素的情况下生成亮度块的预测块。
在又一个代表性方面,所公开的技术可以用来提供视频处理的方法。该方法包括:对于视频的色度块,做出是否将非正常的色度帧内预测模式应用到视频的所述色度块的第一确定;对于对应于色度块的亮度块,做出将亮度帧内预测模式应用到亮度块的第二确定;基于亮度帧内预测模式做出将变换集或变换矩阵应用到色度块的第三确定;以及根据第三确定执行视频与视频的编解码表示之间的转换,并且其中非正常的色度帧内预测模式包括在不使用沿着色度预测方向外推的邻域像素值的情况下编解码色度块。
在又一个代表性方面,所公开的技术可以用来提供视频处理的方法。该方法包括:对于视频的色度块,做出对应于色度块的亮度块是使用非正常的亮度帧内预测模式来编解码的第一确定;基于第一确定,根据规则做出色度块的变换集或变换矩阵的第二确定;以及根据第二确定执行视频与视频的编解码表示之间的转换,并且其中,该规则指定了由于亮度块是使用非正常的亮度帧内预测模式来编解码的因而与色度块相关联的一个或多个默认模式或默认变换集确定变换集或变换矩阵,以防色度块是使用非正常的色度帧内预测模式来编解码的,其中,非正常的亮度帧内预测模式包括在不使用沿着色度预测方向外推的邻域像素值的情况下编解码亮度块。
在又一个代表性方面,所公开的技术可以用来提供视频处理的方法。该方法包括:对于视频的当前视频块与视频的编解码表示之间的转换,基于以下中的至少一个确定向一个色彩分量的当前视频块应用二次变换工具的适用性:1)另一个色彩分量的对应块的编解码模式,或2)当前视频块的编解码模式;以及基于确定来执行转换,并且其中,使用二次变换工具:在编码期间,在量化之前将前向二次变换应用到向当前视频块的残差应用的前向一次变换的输出,或解码期间,在应用反向一次变换之前,将反向一次变换应用到当前视频块的去量化的输出。
在又一个代表性方面,所公开的技术可以用来提供视频处理的方法。该方法包括:对于视频的色度块,做出覆盖色度块的预定义位置的亮度块是使用非正常的亮度帧内预测模式编码的第一确定;基于第一确定,做出第二确定以由于色度块是使用非正常的亮度帧内预测模式编码的因而将预定义帧内预测模式应用到色度块;以及根据第二确定来执行视频与视频的编解码表示的转换,其中,非正常的亮度帧内预测模式包括在不使用沿着亮度预测方向外推的邻域像素值的情况下编码亮度块。
在又一个代表性方面,所公开的技术可以用来提供视频处理的方法。该方法包括:对于视频的色度块,做出覆盖色度块的预定义位置的亮度块是使用正常亮度帧内预测模式编码的第一确定;基于第一确定,做出第二确定以基于亮度块的正常亮度帧内预测模式导出色度帧内预测模式;以及根据第二确定来执行视频与视频的编解码表示的转换,其中,正常亮度帧内预测模式包括使用沿着亮度预测方向外推的邻域像素值编码亮度块。
在又一个代表性方面,上述方法以处理器可执行代码的形式实施并存储在计算机可读介质中。
在又一个代表性方面,公开了配置或可操作为执行上述方法的装置。装置可以包括编程以实现该方法的处理器。
在又一个代表性方面,视频解码器设备可以实现本文中所描述的方法。
公开的技术的上述或其他方面和特征将在附图、说明书和权利要求书中更为详细地描述。
附图说明
图1示出了示例编码器的框图。
图2示出了67个帧内预测模式的示例。
图3示出了4×4块的ALWIP的示例。
图4示出了8×8块的ALWIP的示例。
图5示出了8×4块的ALWIP的示例。
图6示出了16×16块的ALWIP的示例。
图7示出了邻域预测块的四个参考行的示例。
图8示出了4×8块和8×4块的划分的示例。
图9示出了除4×8、8×4、4×4以外的所有块的划分的示例。
图10示出了JEM中二次变换的示例。
图11示出了提出的缩减二次变换(RST)的示例。
图12示出了前向和反向缩减变换的示例。
图13示出了使用16×48矩阵的前向RST 8×8过程的示例。
图14示出了8×8矩阵的归零区域的示例。
图15示出了子块变换模式SBT-V和SBT-H的示例。
图16示出了4×4编解码组的对角向右上方扫描顺序的示例。
图17示出了具有4×4尺寸编解码组的8×8块的对角向右上方扫描顺序的示例。
图18示出了用于选择概率模型的模板的示例。
图19示出了用于相关量化的两个标量量化器的示例。
图20示出了用于提出的相关量化过程的状态变换和量化器选择的示例。
图21是具有4编解码组的8×8块的示例。
图22A至22F示出了视频处理的示例方法的流程图。
图23A和23B是实现本文档描述的可视媒体解码或可视媒体编码技术的硬件平台的示例的框图。
图24A和24B示出了双树分割下的一个色度块和其对应的亮度块的示例。
图25示出了从对应亮度块的导出DM的‘CR’位置的示例。
图26A至26C示出了视频处理的示例方法的流程图。
图27A至27E示出了视频处理的示例方法的流程图。
具体实施方式
所公开的技术的实施例可以应用到现有视频编解码标准(例如,HEVC、H.265)和未来标准以改善压缩性能。章节标题用在本文档中来改善说明书的可读性,并且不以任何方式将讨论和实施例(和/或实现方式)仅限制于相应章节。
2视频编解码介绍
由于对更高分辨率视频的需求不断增长,视频编解码方法和技术普遍存在于当代技术中。视频编解码典型地包括压缩或解压缩数字视频的电子电路或软件,并且继续地改进以提供更高编解码效率。视频编解码将未压缩视频转换成压缩格式或反之亦然。在视频质量、用于表示视频的(由比特率确定的)数据量、编码和解码算法的复杂度、对数据丢失和错误的灵敏度、易于编辑、随机存取以及端到端延迟(等待时间)之间存在复杂的关系。压缩格式通常符合标准视频压缩规范,例如,高性能视频编解码(HEVC)标准(还称为H.265或MPEG-H第2部分)、待制定的通用视频编解码标准、或者其他当前和/或未来视频编解码标准。
视频编解码标准主要是通过众所周知的ITU-T和ISO/IEC标准的发展而得以演进。ITU-T制作了H.261和H.263标准,ISO/IEC制作了MPEG-1和MPEG-4Visual标准,并且两个组织联合制作了H.262/MPEG-2视频标准和H.264/MPEG-4高级视频编解码(Advanced VideoCoding,AVC)标准和H.265/HEVC标准。从H.262开始,视频编解码标准基于混合视频编解码结构,其中利用时域预测加变换编解码。为了探索HEVC之外的未来视频编解码技术,由VCEG和MPEG于2015年联合成立联合视频探索团队(JVET)。从那时起,JVET采用了许多新方法并将其纳入名为联合探索模型(JEM)的参考软件[3][4]。2018年4月,VCEG(Q6/16)和ISO/IECJTC1 SC29/WG11(MPEG)之间的联合视频专家团队(JVET)成立,致力于VVC标准,目标是与HEVC相比降低50%比特率。
2.1典型视频编解码的编解码流程
图1示出了VCC的编码器框图的示例,其包含三个环路滤波块:去块化滤波器(DF)、样点自适应偏移(SAO)和ALF。不同于使用预定义滤波器的DF,在编解码边信息信令通知偏移和滤波器系数的情况下,SAO和ALF分别通过添加该偏移和通过应用有限脉冲响应(FIR)滤波器,利用当前图片的原始样点来降低原始样点与重构样点之间的均方差。ALF被定位在每个图片的最后处理阶段并可以视为尝试捕捉和修复由先前阶段创建的伪影的工具。
2.2VVC中的帧内编解码
2.2.1用67个帧内预测模式进行帧内模式编解码
为了捕获自然视频中出现的任意边缘方向,方向性帧内模式的数目从33个(如HEVC中所使用的)扩展到65个。附加的方向性模式在图2以虚线箭头来描绘,并且平面和DC模式保持相同。这些较密集的方向性帧内预测模式应用到所有块尺寸并应用到亮度和色度帧内预测。
传统带角度的帧内预测方向在逆时针方向上从45度到-135度来定义,如图2所述。VTM中,若干传统带角度的帧内预测模式自适应地替换为用于非正方形块的宽角度的帧内预测模式。替换的模式使用原始方法进行信令通知并且在解析之后重新映射到宽角度模式的索引。帧内预测模式的总数未改变、即67个,并且帧内模式编解码未改变。
HEVC中,每个帧内编解码块具有正方形形状并且该编解码块的每条边的长度是2的幂。因此,不需要分区操作来使用DC模式生成帧内预测符。VVV2中,块可以具有矩形形状,这在一般情况下需要使用每块分区操作。为了避免DC预测的分区操作,对于非正方形块仅长边用于计算平均值。
除67个帧内预测模式以外,对于一定的块还启用非正方形块的宽角度帧内预测(WAIP)和位置相关的帧内预测组合(PDPC)方法。PDPC在不进行信令通知的情况下应用到以下帧内模式:平面、DC、水平、垂直、左下方带角度模式及其8个相邻带角度模式、以及右上方带角度模式及其8个相邻带角度模式。
2.2.2仿射线性加权的帧内预测(ALWIP或基于矩阵的帧内预测)
JVET-N0217中提出仿射线性加权的帧内预测(ALWIP,又称为基于矩阵的帧内预测(MIP))。
2.2.2.1由矩阵矢量乘法生成缩减的预测信号
经由平均化首先下采样邻域参考样点以生成缩减的参考信号bdryred。然后,缩减的预测信号predred通过计算矩阵矢量乘积和添加偏移来计算。
predred=A·bdryred+b
在此,A是具有Wred·Hred行和4列(如果W=H=4则为4列并且在所有其他情况下为8列)的矩阵。b是尺寸为Wred·Hred的矢量。
2.2.2.2整个ALWIP过程的说明
图3-6以不同形状图示了平均化、矩阵矢量乘法和线性插值的整个过程。注意到,剩余形状被视为所描绘情况中的一种。
1.给定4×4块,ALWIP沿着边界的每个轴线求取两个平均值。得到的四个输入样点进入矩阵矢量乘法。矩阵取自集合S0。在添加偏移之后,这产生了16个最终预测样点。线性插值不必生成预测信号。因此,每个样点执行乘法总数为(4·16)/(4·4)=4。
2.给定8×8块,ALWIP沿着边界的每个轴线求取四个平均值。得到的八个输入样点进入矩阵矢量乘法。矩阵取自集合S1。这在预测块的奇数位置上产生了16个样点。因此,每个样点执行乘法总数为(8·16)/(8·8)=2。在添加偏移之后,这些样点通过使用缩减的顶部边界来垂直地插值。通过使用原始左边界随后进行水平插值。
3.给定8×4块,ALWIP沿着边界的水平轴线求取四个平均值并且在左边界求取四个原始边界值。得到的八个输入样点进入矩阵矢量乘法。矩阵取自集合S1。这在预测块的奇数个水平位置和每个垂直位置上产生了16个样点。因此,每个样点执行乘法总数为(8·16)/(8·4)=4。在添加偏移之后,这些样点通过使用原始左边界来水平地插值。
4.给定16×16块,ALWIP沿着边界的每个轴线求取四个平均值。得到的八个输入样点进入矩阵矢量乘法。矩阵取自集合S2。这在预测块的奇数位置上产生了64个样点。因此,每个样点执行乘法总数为(8·64)/(16·16)=2。在添加偏移之后,这些样点通过使用顶部边界的八个平均值来垂直地插值。通过使用原始左边界随后进行水平插值。在这种情况下插值过程不会添加任何乘法。因此,每个样点总共需要两次乘法来计算ALWIP预测。
对于较大形状,过程基本上相同并且易于检验每个样点的乘法次数小于四次。
对于W×8块,其中W>8,因为样点在奇数个水平位置和每个垂直位置处给定,因此只有水平插值是必要的。
最终,对于W×4块,其中W>8,令A_k为通过省去沿着下采样块的水平轴线对应于奇数条目的每一行而产生的矩阵。因此,输出尺寸是32,并且再次只有水平插值保持待执行。
相应地处理转置的情况。
当为帧内预测块构造MPM列表时,如果以MIP模式编解码邻域块,则通过使用下表将MIP模式映射到帧内预测模式。在此,假设邻域亮度块的宽度和高度分别是widthNeig和heightNeig,则MipSizeId导出如下:
·如果widthNeig和heightNeig二者都等于4,则MipSizeId设置为等于0。
·否则,如果widthNeig和heightNeig二者都小于或等于8,则MipSizeId设置为等于1。
·否则,将MipSizeId设置为等于2。
表8-4–MIP与帧内预测模式之间的映射的规范
2.2.2.3语法和语义
7.3.6.5编解码单元语法
2.2.3多个参考行(MRL)
多个参考行(MRL)帧内预测使用更多参考行以供帧内预测。在图7中,描绘了四个参考行的示例,其中段A和F的样点不能从重构邻域样点中提取而是分别用与段B和E最靠近的样点填充。HEVC帧内图片预测使用最近参考行(即,参考行0)。MRL中,使用两个附加行(参考行1和参考行3)。
选择的参考行的索引(mrl_idx)被信令通知并且用于生成帧内预测符。对于大于0的参考行索引,在MPM列表中仅包含附加的参考行模式并且在没有剩余模式的情况下只有单个MPM索引。在帧内预测模式之前信令通知参考行索引,并且从帧内预测模式中排除平面和DC模式以防非零参考行索引被信令通知。
为CTU内的第一行块禁用MRL以防止在当前CTU行外使用扩展的参考样点。同样地,当使用附加线时禁用PDPC。
2.2.4帧内子块分割(ISP)
JVET-M0102中,提出ISP,其根据块尺寸维度将亮度帧内预测块垂直或水平地分成2或4个子分割,如表1所示。图8和图9示出了两种可能的示例。所有子分割实现具有至少16个样点的条件。对于块尺寸,可以存在4×N或N×4(其中N>8),如果允许的话,还可以存在1×N或N×1子分割。
表1:取决于块尺寸(由maxTBSize表示最大变换尺寸)的子分割的数目
对于这些子分割的每一个,通过对由编码器发送的系数进行熵解码然后将它们反量化和反变换,来生成残差信号。然后,子分割是帧内预测的,并且最终对应重构的样点通过将残差信号添加到预测信号来获得。因此,每个子分割的重构值将是可用的,以生成下一个子分割的预测,下一个子分割将重复该过程等等。所有子分割共享相同帧内模式。
表2:取决于predModeIntra的trTypeHor和trTypeVer的规范
2.2.4.1语法和语义
7.3.7.5编解码单元语法
/>
/>
intra_subpartitions_mode_flag[x0][y0]等于1指定当前帧内编解码单元被分割成NumIntraSubPartitions[x0][y0]矩形变换块子分割。
intra_subpartitions_mode_flag[x0][y0]等于0指定当前帧内编解码单元未被分割成矩形变换块子分割。
当不存在intra_subpartitions_mode_flag[x0][y0]时,则将其推断为等于0。
intra_subpartitions_split_flag[x0][y0]指定帧内子分割划分类型是水平的还是垂直的。
当不存在intra_subpartitions_split_flag[x0][y0时,可如下推断:
–如果cbHeight大于MaxTbSizeY,则推断
intra_subpartitions_split_flag[x0][y0]等于0。
–否则(cbWidth大于MaxTbSizeY),则推断
intra_subpartitions_split_flag[x0][y0]等于1。
变量IntraSubPartitionsSplitType指定用于当前亮度编解码块的划分类型,如表7-9中说明的。IntraSubPartitionsSplitType导出如下:
–如果intra_subpartitions_mode_flag[x0][y0]等于0,则推断
IntraSubPartitionsSplitType等于0。
–否则,IntraSubPartitionsSplitType设置为等于
1+intra_subpartitions_split_flag[x0][y0]。
表7-9–与IntraSubPartitionsSplitType相关联的命名
变量NumIntraSubPartitions指定帧内亮度编解码块被分成变换块子分割的数目。NumIntraSubPartitions导出如下:
–如果IntraSubPartitionsSplitType等于ISP_NO_SPLIT,则
NumIntraSubPartitions设置为等于1。
–否则,如果以下条件中的一个为真,则NumIntraSubPartitions设置为等于2:
–cbWidth等于4并且cbHeight等于4,
–cbWidth等于8并且cbHeight等于4,
–否则,NumIntraSubPartitions设置为等于4。
2.3色度帧内模式编解码
对于色度帧内模式编解码,取决于是否启用跨分量线性模型(CCLM),允许总共8个或5个帧内模式用于色度帧内模式编解码。这些模式包括五个传统帧内模式和三个跨分量线性模型模式。色度DM模式使用对应亮度帧内预测模式。因为在I条带中启用亮度和色度分量的分立块分割结构,一个色度块可以对应于多个亮度块。因此,对于色度DM模式,覆盖当前色度块的中部位置的对应亮度块的帧内预测模式被直接继承。
表8-2–当sps_cclm_enabled_flag等于0时取决于intra_chroma_pred_mode[xCb][yCb]和IntraPredModeY[xCb+cbWidth/2][yCb+cbHeight/2]的IntraPredModeC[xCb][yCb]的规范
表8-3–当sps_cclm_enabled_flag等于1时取决于intra_chroma_pred_mode[xCb][yCb]和IntraPredModeY[xCb+cbWidth/2][yCb+cbHeight/2]的IntraPredModeC[xCb][yCb]的规范
2.4VVC中的变换编解码
2.4.1VVC中的多个变换集(MTS)
2.4.1.1显式多个变换集(MTS)
VTM4中,启用大块尺寸的变换,尺寸上多达64×64,其主要用于较高分辨率视频,例如1080p和4K序列。对于变换块,其中尺寸(宽度或高度、或者宽度和高度二者)等于64,高频变换系数归零,使得只保留低频系数。例如,对于M×N变换块,其中M为块宽度和N为块高度,当M等于64时,仅保留变换系数的左边32列。类似地,当N等于64时,仅保留变换系数的顶部32行。当变换跳过模式用于大块时,使用整个块而不会归零任何值。
除HEVC中已经采用的DCT-II以外,多个变换选择(MTS)方案用于对帧间和帧内编解码块二者进行残差编解码。该方案使用多个从DCT8/DST7选择的变换。新引入的变化矩阵为DST-VII和DCT-VIII。下面表4示出了选择的DST/DCT的基函数。
表4:VVC中使用的变换矩阵的基函数
为了保持变换矩阵的正交性,变换矩阵比HEVC中的变换矩阵更加准确地被量化。为了保持变换系数的中间值在16比特范围内,在水平变换后和垂直变换后,所有系数要具有10比特。
为了控制MTS方案,为帧内和帧间分别在SPS级处指定分立启用标志。当以SPS启用MTS时,信令通知CU级标志以指示是否应用MTS。在此,MTS仅应用到亮度。当满足以下条件时,信令通知MTS CU级标志。
○宽度和高度二者小于或等于32
○CBF标志等于一
如果MTS CU标志等于零,则在两个方向上应用DCT2。然而,如果MTS CU标志等于一,则其他两个标志被附加地信令通知以分别指示水平方向和垂直方向的变换类型。变换和信令通知映射表如表5所示。当达到变换矩阵精度时,使用8比特一次变换核心。因此,HEVC中所使用的所有变换核心保持相同,包括4点DCT-2和DST-7,8点、16点和32点DCT-2。同样,其他变换核心(包括64点DCT-2,4点DCT-8,8点、16点、32点DST-7和DCT-8)使用8比特一次变换核心。
表5:tu_mts_idx的解码值与水平方向和垂直方向的对应变换矩阵的映射。
/>
为了降低大尺寸DST-7和DCT-8的复杂度,对于尺寸(宽度或高度,或宽度和高度二者)等于32的DST-7和DCT-8块,高频变换系数归零。仅保留16x16低频区域内的系数。
除其中应用不同变换的情况以外,VVC还支持称为变换跳过(TS)的模式,该变换跳过(TS)的模式与HEVC中TS的构思类似。TS被视为MTS的特殊情况。
2.4.2JVET-N0193中提出的缩减二次变换(RST)
2.4.2.1JEM中不可分二次变换(NSST)
JEM中,二次变换应用在前向一次变换与量化(编码器处)之间以及在去量化与反向一次变换(解码器侧处)之间。如图10所示,4x4(或8x8)二次变换的执行取决于块尺寸。例如,对于每个8x8块,4x4二次变换应用到小块(即,min(宽度,高度)<8),并且8x8二次变换应用到大块(即,min(宽度,高度)>4)。
如下使用输入作为示例来描述不可分变换的应用。为了应用不可分变换,4x4输入块X
首先表示为矢量
将不可分变换计算为其中/>指示变换系数矢量,并且T是16x16变换矩阵。使用4x4块的扫描顺序(水平、垂直或对角),将16x1系数矢量/>随后重新组织为该4x4块。具有较小索引的系数将以较小扫描索引放置在4x4系数块中。存在总共35个变换集,并且每个变换集使用3个不可分变换矩阵(核)。预定义从帧内预测模式到变换集的映射。对于每个变换集,由显式信令通知的二次变换索引进一步指定选择的不可分二次变换(NSST)候选。在变换系数之后每个帧内CU在比特流中信令通知该索引一次。
2.4.2JVET-N0193中的缩减二次变换(RST)
JVET-K0099中引入RST(又称为低频不可分变换(LFNST))并且JVET-L0133中引入4个变换集(代替35个变换集)映射。在该JVET-N0193中,采用16x64(进一步缩减至16x48)和16x16矩阵。为了便于注释,16x64(缩减至16x48)变换表示为RST 8x8并且16x16变换表示为RST 4x4。图11示出了RST的示例。
2.4.2.2.1RST计算
缩减变换(RT)的主要想法是在不同空间中将N维度矢量映射到R维度矢量,其中R/N(R<N)是缩减因子。
RT矩阵是R×N矩阵,如下:
其中,R行变换是N维空间的R基。RT的反向变换矩阵是前向变换的转置。图12中描绘前向和反向RT。
在该贡献中,应用具有缩减因子为4(1/4尺寸)的RST 8x8。因此,代替64x64(其为传统8x8不可分变换矩阵尺寸),使用16x64直连矩阵(direct matrix)。换言之,解码器侧处使用64×16反向RST矩阵以在8×8左上区域中生成核心(一次)变换系数。前向RST 8x8使用16×64(或8x8块的8x64)矩阵,使得前向RST 8x8仅在给定8x8区域内的左上4×4区域中产生非零系数。换言之,如果应用RST,则除左上4×4区域以外的8×8区域仅具有零系数。对于RST 4x4,应用16x16(或4x4块的8x16)直连矩阵乘法。
当满足以下两个条件时,有条件地应用反向RST:
○块尺寸大于或等于给定阈值(W>=4&&H>=4)
○变换跳过模式标志等于零
如果变换系数块的宽度(W)和高度(H)二者大于4,则RST 8x8应用到变换系数块的左上8×8区域。否则,RST 4x4应用在变换系数块的左上min(8,W)×min(8,H)区域上。
如果RST索引等于0,则不应用RST。否则,应用RST,用RST索引选择RST的核。稍后解释RST选择方法和RST索引的编解码。
此外,RST应用到帧内和帧间条带二者中的帧内CU,并且应用到亮度和色度二者。如果启用双树,则分开地信令通知亮度和色度的RST索引。对于帧间条带(禁用双树),信令通知单个RST索引并将其用于亮度和色度二者。
2.4.2.2.2RST的限制
当选择ISP模式时,禁用RST,并且不信令通知RST索引,因为即使RST应用到每个可实行的分割块但是性能改进也是微不足道的。此外,为ISP预测的残差禁用RST可以降低编码复杂度。
2.4.2.2.3RST选择
RST矩阵选自四个变换集,其中每一个变换集包括两个变换。从帧内预测模式确定应用的变换集,如下:
(1)如果指示三个CCLM模式中的一个,则选择变换集0。
(2)否则,根据下表执行变换集选择:
变换集选择表
存取上表的索引(表示为IntraPredMode)具有[-14,83]的范围,该索引是用于宽角度帧内预测的变换模式索引。
稍后,用于以CCLM模式编解码的色度块的低频不可分变换(LFNST,又称为RST)集选择要基于变量IntraPredMode_CCLM进行修改,其中IntraPredMode_CCLM具有[-14,83]的范围。由共位亮度帧内预测模式和当前色度块的维度来确定IntraPredMode_CCLM。
当启用双树时,覆盖当前色度块中左上方色度样点的对应亮度样点的块(例如PU)定义为共位亮度块。示例在图24a和24b中示出,其中由TL表示共位位置。
2.4.2.2.4缩减维度的RST矩阵
如进一步简化,16x48矩阵代替16x64以相同变换集配置来应用,16x48矩阵中的每一个从排除右下4x4块的左上8x8块中的三个4x4块取得48个输入数据(如图13所示)。
2.4.2.2.5RST信令通知
前向RST 8x8使用16×48矩阵,使得前向RST 8x8仅在前三个4x4区域内的左上4×4区域中产生非零系数。换言之,如果应用RST 8x8,则仅左上4×4区域(由于RST 8x8)和右下4×4区域(由于一次变换)可以具有非零系数。因此,当在右上4×4块区域和左下4×4块区域(图14所示,并且称为“归零”区域)内检测到任何非零元素时不对RST索引进行编解码,因为这隐含没有应用RST。在这样的情况下,RST索引推断为零。
2.4.2.2.6一个CG内的归零区域
通常,在对4×4子块应用反向RST之前,4×4子块中的任何系数可以是非零的。然而,在一些情况下约束为,在对子块应用反向RST之前,4×4子块中的一些系数必须为零。
令nonZeroSize是变量。需要的是,当任何系数重新布置成一维阵列时,任何系数的索引不小于nonZeroSize,然后反向RST必须为零。
当nonZeroSize等于16时,左上方4×4子块中的系数不存在归零约束。
JVET-N0193中,当当前块尺寸为4×4或8×8时,nonZeroSize设置为等于8(即,如图14所示,具有在范围[8,15]中的扫描索引的系数应为0)。对于其他块维度,nonZeroSize设置为等于16。
2.4.2.2.7工作草案的RST的描述
7.3.2.3序列参数集RBSP语法
7.3.7.11残差编解码语法
7.3.7.5编解码单元语法
/>
sps_st_enabled_flag等于1指定st_idx可以存在于帧内编解码单元的残差编解码语法中。sps_st_enabled_flag等于0指定st_idx不存在于帧内编解码单元的残差编解码语法中。
st_idx[x0][y0]指定在选择的变换集中哪个二次变换核应用在两个候选核之间。st_idx[x0][y0]等于0指定不应用二次变换。阵列索引x0、y0指定所考虑的变换块的左上样点相对于图片的左上样点的位置(x0,y0)。
当不存在st_idx[x0][y0]时,则将st_idx[x0][y0]推断为等于0。
注意到,是否发送st_idx取决于CU内所有TU中的非零系数的数目(例如,对于单树,3个块(即,Y、Cb、Cr)中非零系数的数目);对于双树和对亮度编解码,亮度块中的非零系数的数目;对于双树和对色度编解码,两个色度块中的非零系数的数目)。附加的,阈值取决于分割结构,(treeType==SINGLE_TREE)?2:1)。
st_idx的二进制数是上下文编解码的。更具体地,如下适用:
表9-9–语法元素及其相关联的二值化
表9-15–用上下文编解码的二进制向语法元素分配ctxInc
9.5.4.2.8语法元素st_idx的ctxInc的导出过程
此过程的输入是:色彩分量索引cIdx;亮度或色度位置(x0,y0),取决于cIdx指定当前亮度或色度编解码块的左上样点相对于当前图片的左上样点;树类型treeType;如节8.4.2中指定的亮度帧内预测模式
IntraPredModeY[x0][y0];如节7.4.7.5中指定的为色度样点指定帧内预测模式的语法元素intra_chroma_pred_mode[x0][y0];以及多个变换选择索引tu_mts_idx[x0][y0]。
此过程的输出是变量ctxInc。
变量intraModeCtx导出如下:
如果cIdx等于0,则intraModeCtx导出如下:
intraModeCtx=(IntraPredModeY[x0][y0]<=1)?1:0
否则(cIdx大于0),则intraModeCtx导出如下:
intraModeCtx=(intra_chroma_pred_mode[x0][y0]>=4)?1:0
变量mtsCtx导出如下:
mtsCtx=(tu_mts_idx[x0][y0]==0&&treeType!=SINGLE_TREE)?1:0
变量ctxInc导出如下:
ctxInc=(binIdx<<1)+intraModeCtx+(mtsCtx<<2)
2.4.2.2.8RST使用的总结
仅当对于单树和可分树而言一个块中的非零系数的数目分别大于2和1时,才可以启用RST。此外,当启用RST时,还需要对应用RST的编解码组(CG)的非零系数的位置进行如下限制。
表1:RST的使用
/>
2.4.3子块变换
对于具有cu_cbf等于1的帧间预测CU,可以信令通知cu_sbt_flag以指示是解码整个残差块还是残差块的子部分。在前一种情况中,帧间MTS信息被进一步解析以确定CU的变换类型。在后一种情况中,用推断的自适应变换来编解码残差块的一部分并且将该残差块的其他部分归零。SBT不应用到组合的帧间帧内模式。
在子块变换中,对SBT-V和SBT-H中的亮度变换块(色度TB总是使用DCT-2)应用位置相关的变换。SBT-V和SBT-H的两个位置与不同核心变换相关联。更具体地,图3为每个SBT位置指定水平和垂直变换。例如,SBT-V位置0的水平变换和垂直变换分别是DCT-8和DST-7。当残差TU的一侧大于32时,对应变换设置为DCT-2。因此,子块变换联合地指定残差块的TU片化(tiling)、cbf、以及水平变换和垂直变换,对于块的主要残差是在块的一侧处的情况,可以认为是语法捷径。
2.4.3.1语法元素
7.3.7.5编解码单元语法
/>
/>
cu_sbt_flag等于1指定对于当前编解码单元使用子块变换。cu_sbt_flag等于0指定对于当前编解码单元不使用子块变换。
当不存在cu_sbt_flag时,则推断其值等于0。
注释—:当使用子块变换时,编解码单元划分成两个变换单元;一个变换单元具有残差数据,另一个变换单元不具有残差数据。
cu_sbt_quad_flag等于1指定对于当前编解码单元,子块变换包括当前编解码单元的1/4尺寸的变换单元。cu_sbt_quad_flag等于0指定对于当前编解码单元,子块变换包括当前编解码单元的1/2尺寸的变换单元。
当不存在cu_sbt_quad_flag时,则推断其值等于0。
cu_sbt_horizontal_flag等于1指定当前编解码单元被水平划分成2个变换单元。cu_sbt_horizontal_flag[x0][y0]等于0指定当前编解码单元被垂直划分成2个变换单元。
当不存在cu_sbt_horizontal_flag时,其值导出如下:
–如果cu_sbt_quad_flag等于0,则cu_sbt_horizontal_flag设置为等于allowSbtHorQ。
–否则(cu_sbt_quad_flag等于0),则cu_sbt_horizontal_flag设置为等于allowSbtHorH。
cu_sbt_pos_flag等于1指定比特流中不存在当前编解码单元中第一变换单元的tu_cbf_luma、tu_cbf_cb和tu_cbf_cr。cu_sbt_pos_flag等于0指定比特流中不存在当前编解码单元中第二变换单元的tu_cbf_luma、tu_cbf_cb和tu_cbf_cr。
变量SbtNumFourthsTb0导出如下:
sbtMinNumFourths=cu_sbt_quad_flag?1:2 (7-117)
SbtNumFourthsTb0=cu_sbt_pos_flag?(4-sbtMinNumFourths):2(7-118)
sps_sbt_max_size_64_flag等于0指定用于允许子块变换的最大CU宽度和高度是32个亮度样点。sps_sbt_max_size_64_flag等于1指定用于允许子块变换的最大CU宽度和高度是64个亮度样点。
MaxSbtSize=sps_sbt_max_size_64_flag?64:32 (7-33)
2.4.4量化的残差域块差分脉冲编解码的调制编解码(QR-BDPCM)
JVET-N0413中,提出了量化的残差域BDPCM(在下文中表示为RBDPCM)。通过在与帧内预测相似的预测方向(水平或垂直预测)上进行样点复制,在整个块上完成帧内预测。量化残差,并且对所量化的残差与其预测符(水平或垂直)量化的值之间的增量进行编解码。
对于尺寸为M(行)×N(列)的块,令ri,j,0≤i≤M-1,0≤j≤N-1是这样的预测残差:使用从上方或左方块边界样点中未滤波的样点,在水平地(在预测块上逐行复制左方邻域像素值)或垂直地(在预测块中将顶部邻域行复制到每一行)执行帧内预测之后的预测残差。令Q(ri,j),0≤i≤M-1,0≤j≤N-1表示残差ri,j的量化版本,其中,残差是原始块与预测块值之间的差。然后,块DPCM应用到量化的残差样点,得到具有元素的修改的M×N阵列/>当信令通知垂直BDPCM时:
对于水平预测,相似规则应用,并且残差量化样点获得为
残差量化样点发送到编解码器。
在编解码器侧上,相反进行上述计算以产生Q(ri,j),0≤i≤M-1,0≤j≤N-1。对于垂直编解码情况,
对于水平情况,
将反向量化残差Q-1(Q(ri,j))添加到帧内块预测值以产生重构样点值。
当选择QR-BDPCM时,没有应用变换。
2.5系数的熵编解码
2.5.1应用变换的块的系数编解码
HEVC中,使用不重叠的系数组(或子块)对编解码块的变换系数进行编解码,并且每个CG含有编解码块的4x4块的系数。编解码块内的CG和CG内的变换系数根据预定义扫描顺序进行编解码。
编解码块内的CG和CG内的变换系数根据预定义扫描顺序进行编解码。CG和CG内的系数二者遵循对角向右上方扫描顺序。图16和图17分别描绘4x4块和8x8扫描顺序的示例。
注意到,编解码顺序是相反的扫描顺序(即从图17的CG3到CG0解码),当解码一个块时,首先解码最后一个非零系数的坐标。
具有至少一个非零变换系数的CG的变换系数水平的编解码可以分开成多个扫描途径。在第一途径中,编解码第一二进制数(由bin0表示,还称为significant_coeff_flag,其指示系数的幅度大于0)。接下来,可以应用用于对第二/第三二进制数(分别由bin1和bin2表示,还称为coeff_abs_greater1_flag和coeff_abs_greater2_flag)进行上下文编解码的两个扫描途径。最终,如果必要,则多调用两个扫描途径,用于编解码符号信息和系数水平的剩余值(还称为coeff_abs_level_remaining)。注意到,只有在前三个扫描途径中的二进制数是以常规模式编解码的,并且这些二进制数被称为以下描述中的常规二进制数。
VVC3中,对于每个CG,常规编解码二进制数和旁路编解码二进制数以编解码顺序被分开,首先传输子块的所有常规编解码二进制数,此后传输旁路编解码二进制数。在扫描位置上以五个途径对子块的变换系数水平进行编解码,如下:
○途径1:以编解码顺序处理对显著性(sig_flag)、大于1标志(gt1_flag)、奇偶性(par_level_flag)和大于2标志(gt2_flag)的编解码。如果sig_flag等于1,则首先编解码gt1_flag(其指定是否绝对水平大于1)。如果gt1_flag等于1,则附加编解码par_flag(它指定绝对水平减2的奇偶性)。
○途径2:在gt2_flag等于1或gt1_flag等于1的情况下,为所有扫描位置处理对剩余绝对水平(剩余部分)的编解码。非二进制语法元素以哥伦布-赖斯(Golomb-Rice)码来二值化,并且得到的二进制数是以算术编解码引擎的旁路模式编解码的。
○途径3:使用哥伦布-赖斯码以算术编解码引擎的旁路模式来完整编解码系数的绝对水平(absLevel),对于该系数的绝对水平第一途径中没有编解码sig_flag(由于达到常规编解码的二进制数的限制)。
○途径4:在sig_coeff_flag等于1的情况下,为所有扫描位置编解码符号(sign_flag)
保证对于4x4子块编码或解码不超过32个常规编解码的二进制数(sig_flag、par_flag、gt1_flag和gt2_flag)。对于2x2色度子块,常规编解码的二进制数的数目限制为8个。
用于对非二进制的语法元素剩余部分进行编解码的赖斯参数(ricePar)(途径3中)类似于HEVC导出。在每个子块的开始时,ricePar设置等于0。在编解码语法元素剩余部分之后,根据预定义等式修改赖斯参数。为了编解码非二进制的语法元素absLevel(途径4中),确定局部模板中的绝对值的总和sumAbs。由查找表基于相关的量化和sumAbs来确定变量ricePar和posZero。中间变量codeValue导出如下:
如果absLevel[k]等于0,则codeValue设置为等于posZero;
如果absLevel[k]小于或等于posZero,则codeValue设置为等于absLevel[k]-1;
否则(absLevel[k]大于posZero),codeValue设置为等于absLevel[k]。
使用哥伦布-赖斯码以赖斯参数ricePar来编解码codeValue的值。
2.5.1.1系数编解码的上下文建模
与变换系数水平的绝对值有关的语法元素选择概率模型取决于局部邻域中绝对水平或部分重构绝对水平的值。图18中图示了所使用的模板。
选择的概率模型取决于局部邻域中绝对水平(或部分重构的绝对水平)的总和以及局部邻域中大于0的绝对水平的数目(由等于1的sig_coeff_flags的数目给定)。上下文建模和二值化取决于局部邻域的以下量度:
○numSig:局部邻域中非零水平的数目;
○sumAbs1:局部邻域中第一途径之后部分重构的绝对水平的总和(absLevel1);
○sumAbs:局部邻域中重构绝对水平的总和;
○对角位置(d):变换块内的当前扫描位置的水平坐标和垂直坐标的总和。
基于numSig、sumAbs1和d的值,选择用于编解码sig_flag、par_flag、gt1_flag、和gt2_flag的概率模型。基于sumAbs和numSig的值,选择用于二值化abs_remainder的赖斯参数。
2.5.1.2相关量化(DQ)
此外,以称为相关标量量化的新构思使用相同HEVC标量量化。相关标量量化指代一方法,该方法中变换系数的可允许重构值的集合取决于在以重构顺序的当前变换系数水平之前的变换系数水平的值。该方法的主要效果在于,与HEVC中所使用的常规无关标量量化相比较,可允许重构矢量是在N维矢量空间(N表示变换块中变换系数的数目)中更密集地分组的。这意味着,对于每个N维单元体积的可允许重构矢量的给定平均数目,输入矢量和最靠近的重构矢量之间的平均失真被降低。相关标量量化的方法由以下来实现:(a)限定两个具有不同重构级的标量量化器,并且(b)限定在两个标量量化器之间切换的过程。
图19图示了由Q0和Q1表示的所使用的两个标量量化器。可用重构级的位置由量化步长Δ唯一指定。比特流中不显式信令通知所使用的标量量化器(Q0或Q1)。代替地,用于当前变换系数的量化器是由在以编解码/重构顺序的当前变换系数之前的变换系数水平的奇偶性确定的。
如图20所示,经由具有四个状态的状态机来实现两个标量量化器(Q0和Q1)之间的切换。状态可以取得四个不同值:0、1、2、3。这是由在以编解码/重构顺序的当前变换系数之前的变换系数水平的奇偶性唯一确定的。在变换块的反向量化的开始时,状态设置为等于0。以扫描顺序重构变换系数(即,以对它们进行熵解码的相同顺序)。在重构当前变换系数之后,状态如图20所示更新,其中k表示变换系数水平的值。
2.5.1.3语法和语义
7.3.7.11残差编解码语法
/>
/>
/>
/>
/>
/>
/>
2.5.2TS编解码块和QR-BDPCM编解码块的系数编解码
QR-BDPCM遵循用于TS编解码块的上下文建模方法。
修改的变换系数水平用于TS残差编解码。相对于常规残差编解码情况,TS的残差编解码包括以下改变:
(1)不信令通知最后的x/y位置
(2)当所有前述标志等于0时,为除最后一个子块的每一个子块编解码的coded_sub_block_flag;
(3)使用缩减模板上下文建模的sig_coeff_flag,
(4)用于abs_level_gt1_flag和par_level_flag的单个上下文建模;
(5)符号标志的上下文建模,附加地大于5个、7个、9个标志,
(6)剩余部分二值化的修改的赖斯参数导出;
(7)每个样点的上下文编解码的二进制数的数目的限制,一个块内每个样点2个二进制数。
2.5.2.1语法和语义
7.3.6.10变换单元语法
/>
/>
/>
对于每个CG,上下文编解码的二进制数的数目限制于不大于每个样点2个二进制数。
表9-15–用上下文编解码的二进制数向语法元素分配ctxInc
2.5色度直连模式(Direct Mode)
在直连模式(DM)中,共位亮度块的预测模式用于导出色度帧内预测模式。
首先,导出帧内预测模式lumaIntraPredMode:
·如果以MIP模式编解码共位亮度块,则lumaIntraPredMode设置为等于平面模式。
·否则,如果以IBC模式或调色板模式编解码共位亮度块,则lumaIntraPredMode设置为等于DC模式。
·否则,lumaIntraPredMode设置为等于覆盖色度块的中部的对应亮度样点的共位亮度块的帧内预测模式。图25中描绘了示例。
其次,根据lumaIntraPredMode导出帧内色度预测模式(表示为IntraPredModeC),如下表以粗体和斜体突出显示的。注意到,intra_chroma_pred_mode等于4指代DM模式。
表8-2–取决于cclm_mode_flag、cclm_mode_idx、intra_chroma_pred_mode和lumaIntraPredMode的IntraPredModeC[xCb][yCb]的规范
最终,如果图片的色彩格式为4:2:2,则根据下表为DM模式进一步修改IntraPredModeC。
当chroma_format_idc等于2时从色度帧内预测模式X到模式Y的4:2:2映射过程的规范
如下指定详细的草案。
8.4.3色度帧内预测模式的导出过程
此过程的输入是:
–指定当前色度编解码块的左上样点相对于当前图片的左上亮度样点的亮度位置(xCb,yCb),
–变量cbWidth,指定亮度样点中的当前编解码块的宽度,
–变量cbHeight,指定亮度样点中的当前编解码块的高度。
在此过程中,导出色度帧内预测模式IntraPredModeC[xCb][yCb]。
对应的亮度帧内预测模式lumaIntraPredMode导出如下:
–如果intra_mip_flag[xCb][yCb]等于1,则lumaIntraPredMode设置为等于INTRA_PLANAR。
–否则,如果CuPredMode[0][xCb][yCb]等于MODE_IBC或MODE_PLT,则lumaIntraPredMode设置为等于INTRA_DC。
–否则,lumaIntraPredMode设置为等于
IntraPredModeY[xCb+cbWidth/2][yCb+cbHeight/2]。
使用cclm_mode_flag、cclm_mode_idx、intra_chroma_pred_mode和lumaIntraPredMode导出色度帧内预测模式IntraPredModeC[xCb][yCb],如表8-2指定的。
表8-2–取决于cclm_mode_flag、cclm_mode_idx、intra_chroma_pred_mode和lumaIntraPredMode的IntraPredModeC[xCb][yCb]的规范
当chroma_format_idc等于2时,色度帧内预测模式Y是使用表8-2中色度帧内预测模式X导出的,如表8-3指定的,并且然后色度帧内预测模式X设置等于色度帧内预测模式Y。
表8-3-当chroma_format_idc等于2时从色度帧内预测模式X到模式Y的4:2:2映射过程的规范
3现有实现方式的缺点
当前设计具有以下问题:
(1)色度分量的四个预定义变换集与亮度分量的四个预定义变换集相同。附加地,具有相同帧内预测模式的亮度和色度块使用相同变换集。然而,色度信号典型地比亮度分量更平滑。使用相同集可能是次优的。
(2)RST仅应用到一定的CG以而不是所有CG。然而,信令通知RST索引的决定是取决于整个块中非零系数的数目。当应用RST的CG中所有系数为零时,不需要信令通知RST索引。然而,当前设计仍可能仍信令通知索引,这浪费不必要的比特。
(3)RST索引是在残差编解码后信令通知的,因为这需要记录非零系数的个数、在一定的位置中是否存在非零系数(例如,章节2.3.2.2.7中的numZeroOutSigCoeff、numSigCoeff)。这样的设计使得解析过程更加复杂。
(4)RST索引是上下文编解码的,并且上下文建模是取决于编解码亮度/色度帧内预测模式、以及MTS索引。这样的设计在帧内预测模式的重构方面引入解析延迟。并且引入8个上下文,其可能是硬件实现方式的负担。
(a)DM和CCLM共享相同上下文索引偏移,这是没有意义的,因为它们是两种不同的色度帧内预测模式。
(5)非TS残差编解码的当前设计首先编解码系数信息,接下来RST的索引(即,是否使用RST,如果使用的话,则选择哪一个矩阵)。在这样的设计的情况下,在残差的熵编解码中不考虑RST开/关的信息。
(6)RST总是以应用的一次变换应用到变换块的左上区域。然而,对于不同的一次变换基,能量并不总是集中在变换块的左上区域中。
(7)对于双树和单树编解码结构以不同方式引导确定是否信令通知RST相关的信息。
(8)当CU中(例如CU尺寸为128×128)存在多于一个TU时,在解码所有TU之后仅可以确定是否解析RST相关的信息。例如,对于128x128CU,在不等待最后一个PB之后的LFNST索引的情况下,不能处理第一PB。尽管这不一定打断整个基于64x64的解码器管线(如果可以解耦CABAC的话),但是对于一定数目的解码器管线阶段,数据缓冲增加了4倍。这是高代价的。
(9)JVET-O0219中,共位亮度块的帧内预测模式用于确定以CCLM模式编解码的色度块的LFNST变换集。然而,共位亮度块可以是以非帧内预测模式(即,不是传统帧内预测方法,诸如使用DC/平面/带角度的预测方向)编解码的。例如,在双树情况中,共位亮度块可以是以调色板模式、IBC模式等编解码的。在这种情况下,未定义共位亮度块的帧内预测模式。因此,如何为色度块导出二次变换集是未知的。
(10)子章节8.4.4中定义的色度帧内预测块的导出检验覆盖对应左上亮度样点的亮度块是否以MIP/IBC/调色板模式编解码。如果为真,则给定默认模式。否则,使用中部亮度样点的帧内预测模式。这将引发两个问题:
a.当覆盖左上亮度样点(例如图24(a)和24(b)中的TL,当前色度块中的左上色度样点的对应亮度样点)的编解码块是以MIP模式编解码的,并且覆盖中部亮度样点(例如图25中CR)的编解码块是以正常帧内模式编解码的时,在这种情况下,使用默认模式并且将其设置为打断当前色度块与覆盖CR的亮度块之间的关联的色度帧内预测模式。将造成更低的编解码性能。
b.当覆盖左上亮度样点(例如图24(a)和24(b)中的TL,当前色度块中的左上色度样点的对应亮度样点)的编解码块是以帧内模式编解码的,并且覆盖中部亮度样点(例如图25中CR)的编解码块是以IBC/调色板/MIP模式编解码的时,在这种情况下,来自覆盖CR的编解码块的帧内预测模式用于导出色度DM模式。然而,没有定义这样的与MIP/IBC/调色板模式相关联的帧内预测模式。
4用于残差编解码的上下文建模的示例方法
本公开的技术的实施例克服现有实现方式的缺点,从而提供具有更高编解码效率的视频编解码。基于公开的技术的用于残差编解码的上下文建模的方法可以提高现有和未来视频编解码标准两者,并且在下文中被阐明为各种实现方式所描述的示例。下文提供的本公开技术的示例解释了总体构思,并且不意味着解释为限制。在示例中,除非明显相反地指示,否则可以组合这些示例中描述的各种特征。
在以下描述中,“块”可以是指编解码单元(CU)或变换单元(TU)或视频数据的任何矩形区域。“当前块”可以是指当前正在解码/编解码的编解码单元(CU)或当前正在解码/编解码的变换单元(TU)或视频数据的正在解码/编解码的编解码矩形区域。“CU”或“TU”还可以被称为“编解码块”和“变换块”。
在这些示例中,RST可以是JVET-N0193中设计的任何变化。RST可以是可将二次变化应用到一个块或将变换应用到变换跳过(TS)编解码的块(例如JVET-N0193中提出的RST应用到TS编解码块)的任何技术。
在下文中,“正常帧内预测模式”用于指代传统帧内预测方法,其中,预测信号由从某一方向外推邻域像素来生成预测信号,诸如DC模式、平面模式和带角度帧内预测模式(例如还可以包括宽角度帧内预测模式)。对于不使用正常帧内预测模式编解码的块,块可以是以以下编解码方法中的至少一个编解码的,例如IBC、MIP、调色板、BDPCM帧内预测模式。
此外,“归零区域”或“归零CG”可以指示这些区域/CG总是具有零系数,由于在二次变换过程中所使用的缩减变换尺寸。例如,如果二次变换尺寸为16x32且CG尺寸为4x4,则它将应用到前两个CG,但是只有第一CG可以具有非零系数,而第二4x4 CG也称为归零CG。
RST中选择变换矩阵
1.应用RST的子区域可以是不作为块的左上部分的子区域。
a.在一个示例中,RST可以应用到块的右上或右下或左下或中部子区域。
b.哪个子区域应用RST可以取决于帧内预测模式和/或一次变换矩阵(例如,DCT-II、DST-VII、标识变换)。
2.选择RST中所使用的变换集和/或变换矩阵可以取决于色彩分量。
a.在一个示例中,变换矩阵的一个集可以用于亮度(或G)分量,并且一个集用于色度分量(或B/R)。
b.在一个示例中,每个色彩分量可以对应于一个集。
c.在一个示例中,对于不同色彩分量,至少一个矩阵在两个或多个集中的任意个集中是不同的。
3.选择RST中所使用的变换集和/或变换矩阵可以取决于帧内预测方法(例如,CCLM、基于多个参考行的帧内预测方法、基于矩阵的帧内预测方法)。
a.在一个示例中,变换矩阵的一个集可以用于CCLM编解码块,并且另一个集可以用于非CCLM编解码块。
b.在一个示例中,变换矩阵的一个集可以用于正常帧内预测编解码块,并且另一个集可以用于启用多个参考行的块(即,其不使用相邻行进行帧内预测)。
c.在一个示例中,变换矩阵的一个集可以用于以联合色度残差编解码的块,并且另一个集可以用于不应用联合色度残差编解码的块。
d.在一个示例中,对于不同帧内预测方法,至少一个矩阵在两个或多个集中的任意个集中是不同的。
e.替代地,可以为以一定的帧内预测方向和/或一定的编解码工具(例如CCLM、和/或联合色度残差编解码、和/或某一色彩分量(例如色度))编解码的块,禁用RST。
4.可以将默认帧内预测模式分配给不是以正常帧内预测模式(诸如MIP、IBC、调色板)编解码的块(例如,CU/PU/CB/PB)。
a.默认模式可以取决于编解码方法(MIP/IBC/调色板)。
b.可以及时信令通知或导出默认模式。
c.默认模式可以用于导出色度导出模式(DM)。
d.默认模式可以用于预测其他块的帧内预测模式。例如,默认模式可以用于导出对当前块的后续块进行编解码的最可能模式(MPM)列表。
e.向一个色彩分量(例如亮度)的块分配的默认模式可以用于导出另一个色彩分量(例如色度)的变换集或变换索引。
f.替代地,此外,默认模式可以与预测模式(例如,帧内/帧间/IBC)一起存储。
g.默认模式不可以分配到帧间编解码块。
5.提出在色度帧内预测模式导出过程的所有操作中使用覆盖色度编解码块的相同预定义位置的一个亮度编解码块(其还可以称为对应亮度块)的信息。例如,覆盖色度编解码块的相同预定义位置的相同亮度编解码块用于检验亮度编解码块的预测模式(或编解码方法,像是IBC/MIP/调色板)并且用于提取亮度编解码块的帧内预测模式。
a.在一个示例中,相同预定义位置定义为与当前色度块的中部色度样点的对应亮度样点(例如,图25的CR)相关联。
b.在一个示例中,相同预定义位置定义为与当前色度块的左上色度样点的对应亮度样点(例如,图24b的TL)相关联。
c.替代地,此外,如果覆盖相同预定义位置的编解码块是以IBC/调色板/MIP模式/其他任何非正常帧内预测模式编解码的,则默认帧内预测模式可以用于导出色度帧内预测模式。否则,覆盖相同预定义位置的编解码块的解码的帧内预测模式可以用于导出色度帧内预测模式。
6.对于以非正常帧内预测模式(例如CCLM)编解码的色度块,当对应亮度块是以非正常帧内预测模式(例如IBC/调色板/MIP)编解码的时,可以从一个或多个默认模式或默认变换集中导出RST中所使用的变换集/变换矩阵或者其他编解码工具。
a.是使用默认变换集/变换矩阵还是从对应亮度块的帧内亮度预测模式中导出变换集/变换矩阵可以取决于对应亮度块的编解码模式。
i.在一个示例中,如果对应亮度块是以正常帧内预测模式和/或BDPCM编解码的,则可以根据与对应亮度块(例如共位亮度块或本发明项目符号5中限定的亮度块)相关联的亮度帧内预测模式来导出变换集/变换矩阵。
ii.在一个示例中,如果对应亮度块是以非正常帧内预测模式(例如IBC/调色板和/或BDPCM)编解码的,则可以使用默认变换集(例如其中集索引等于K(例如,K=0))。
b.是否为一个色彩分量的块启用RST可以取决于另一个色彩分量中的一个或多个对应的块的编解码方法和/或当前块的编解码方法。
i.是否为色度块启用RST可以取决于一个或多个对应亮度块的编解码方法和/或当前色度块的编解码方法。
ii.在一个示例中,如果对应亮度块是以正常帧内预测模式和/或BDPCM编解码的,则可以为色度块启用RST。
iii.在一个示例中,如果对应亮度块是以非正常帧内预测模式(例如IBC/调色板和/或BDPCM)编解码的,则可以为色度块禁用RST。
1)替代地,此外,如果对应亮度块是以非正常帧内预测模式(例如IBC/调色板和/或BDPCM)编解码的,则可以为以非正常帧内预测模式编解码的色度块禁用RST。
c.当共位亮度块不以正常帧内预测模式编解码时,可以分配预定义帧内预测模式,其然后用于选择RST中所使用的变换集和/或变换矩阵(例如,根据章节2.4.2.2.3中所示的变换集选择表)。
i.在一个示例中,如果共位亮度块是以IBC(帧内块复制)模式编解码的,则可以分配第一预定义帧内预测模式(例如DC或平面模式)。
ii.在一个示例中,如果共位亮度块是以调色板模式编解码的,则可以分配第二预定义帧内预测模式(例如DC或平面模式)。
iii.在一个示例中,如果共位亮度块是以MIP模式编解码的,则可以分配第三预定义帧内预测模式(例如平面或DC模式)。
iv.在一个示例中,如果共位亮度块是以BDPCM(基于块增量脉冲编解码调制)模式编解码的,则可以分配第四预定义帧内预测模式(例如平面或DC模式)。
v.在一个示例中,对于预定义帧内预测模式中的每一个,可以是DC模式或平面模式或垂直模式或水平模式或45度模式或135度模式。
vi.替代地,如果共位亮度块是以MIP模式编解码的,则可以根据MIP模式和共位亮度块的维度(例如通过使用章节2.2.2.2中的表“在MIP与帧内预测模式之间映射的规范”)将MIP模式映射到帧内预测模式。
vii.可以从若干候选(诸如DC模式和平面模式)中自适应地选择预定义模式。
1)可以将预定义模式从编码器信令通知到解码器。
2)可以将预定义模式从编码器导出到解码器。
a.例如,如果解码器确定当前图片是屏幕内容图片,则预定义模式可以是DC模式,否则,预定义模式是平面模式。
viii.可以以与用于色度DM导出过程所利用的方式(例如子节8.4.3中的lumaIntraPredMode)相同的式,来定义预定义模式。
d.当共位亮度块以正常帧内预测模式和/或BDPCM模式编解码时,可以取决于共位亮度块的帧内预测模式,以与DM模式(诸如章节2.7指定的)相同的式来导出色度帧内预测模式。导出的色度帧内预测模式然后用于选择RST中所使用的变换集和/或变换矩阵(例如根据章节2.6中所示的变换集选择表)。
e.在以上项目符号中,共位亮度块可以是覆盖指定亮度位置的编解码块,诸如图24b的TL或图25的CR。
7.选择RST中所使用的变换集和/或变换矩阵可以取决于一次变换。
a.在一个示例中,如果应用到一个块的一次变换是标识变换(例如,将TS模式应用到一个块),则RST中所使用的变换集和/或变换矩阵可以与其他类型的一次变换不同。
b.在一个示例中,如果应用到一个块的水平和垂直一维一次变换是相同的基(例如,DCT-II二者),则RST中所使用的变换集和/或变换矩阵可以与来自不同方向(垂直或水平)的不同基的一次变换不同。
信令通知RST边信息和残差编解码
8.是否和/或如何信令通知RST的边信息(例如st_idx)可以取决于块中的最后一个非零系数(以扫描顺序)。
a.在一个示例中,仅当最后一个非零系数位于应用RST的CG中,才可以启用RST,并且可以信令通知RST的索引。
b.在一个示例中,当最后一个非零系数不是位于应用RST的CG中,则禁用RST并且跳过信令通知RST。
9.是否和/或如何信令通知RST的边信息(例如st_idx)可以取决于某一色彩分量的系数,而不是CU中所有可用的色彩分量的系数。
a.在一个示例中,只有亮度信息可以用于确定是否和/或如何信令通知RST的边信息。
i.替代地,此外,仅当块的维度满足一定的条件时才应用上述方法。
1)条件是W<T1或H<T2。
2)例如,T1=T2=4。因此,对于4x4 CU,亮度块尺寸为4x4,以4:2:0格式的两个色度块为2x2,在这种情况下,仅可以利用亮度信息。
ii.替代地,此外,仅当当前分割类型树是单树时才应用上述方法。
b.是使用一个色彩分量信息还是全部色彩分量信息可以取决于块维度/编解码信息。
10.是否和/或如何信令通知RST的边信息(例如st_idx)可以取决于一个块的部分区域内的系数而不是整个块内的系数。
a.在一个示例中,部分区域可以限定为应用RST的CG。
b.在一个示例中,部分区域可以限定为在块的扫描顺序或反向扫描顺序中的前M个或后M个(例如M=1或2)CG。
i.在一个示例中,M可以取决于块维度。
ii.在一个示例中,如果块尺寸为4xN和/或Nx4(N>8),则M设置为2。
iii.在一个示例中,如果块尺寸为4x8和/或8x4和/或WxH(W>=8,H>=8),则M设置为1。
c.在一个示例中,具有维度W×H的块的信息(例如,块的非零系数的数目)可能不被允许考虑来确定使用RST和/或信令通知RST相关的信息。
i.例如,如果W<T1或H<T2,则块的非零系数的数目不被计数。例如,T1=T2=4。
d.在一个示例中,部分区域可以限定为具有维度W×H的当前块的左上M×N区域。
i.在一个示例中,M可以小于W和/或N可以小于H。
ii.在一个示例中,M和N可以固定的数目。例如,M=N=4。
iii.在一个示例中,M和/或N可以取决于W和/或H。
iv.在一个示例中,M和/或N可以取决于最大允许的变换尺寸。
1)例如,如果W大于8和H等于4,则M=8和N=4。
2)例如,如果H大于8和W等于4,则M=4和N=8。
3)例如,如果不满足上述两个条件中的任一个,则M=4和N=4。
v.替代地,此外,这些方法仅可以应用到一定的块维度,诸如不满足7.c中条件。
e.在一个示例中,部分区域对于所有块可以是相同的。
i.替代地,部分区域可以基于块维度和/或编解码信息来改变。
f.在一个示例中,部分区域可以取决于扫描顺序索引的给定范围。
i.在一个示例中,部分区域可以是覆盖位于指定范围内的系数的区域,其中,基于维度为W×H的当前块的系数扫描顺序(例如,反向解码顺序),该指定范围内的系数的扫描顺序索引在[dxS,IdxE](含端值)内。
1)在一个示例中,IdxS等于0。
2)在一个示例中,IdxE可以小于W×H-1。
3)在一个示例中,IdxE可以固定数目。例如,IdxE=15。
4)在一个示例中,IdxE可以取决于W和/或H。
a.例如,如果W大于8和H等于4,则IdxE=31。
b.例如,如果H大于8和W等于4,则IdxE=31。
c.例如,如果W等于8和H等于8,则IdxE=7。
d.例如,如果W等于4和H等于4,则IdxE=7。
e.例如,如果不满足上述两个条件a)和b)中的任一个,则IdxE=15。
f.例如,如果不满足上述四个条件a)、b)、c)和d)中的任一个,则IdxE=15。
g.例如,如果不满足上述两个条件c)和d)中的任一个,则IdxE=15。
ii.替代地,此外,这些方法仅可以应用到一定的块维度,诸如不满足7.c中条件。
g.在一个示例中,方法可以取决于部分区域内非零系数的位置。
h.在一个示例中,方法可以取决于部分区域内非零系数的能量(诸如平方的总和或绝对值的总和)。
i.在一个示例中,方法可以取决于一个块的部分区域内而不是整个块内非零系数的数目。
i.在一个示例中,方法可以取决于CU中一个或多个块的部分区域内非零系数的数目。
ii.当一个块的部分区域内的非零系数的数目小于阈值时,可以跳过信令通知RST的边信息。
iii.在一个示例中,将阈值固定为N(例如,N=1或2)。
iv.在一个示例中,阈值可以取决于条带类型/图片类型/分割树类型(双树或单树)/视频内容(屏幕内容或相机捕获的内容)。
v.在一个示例中,阈值可以取决于色彩格式,诸如4:2:0或4:4:4,和/或色彩分量,诸如Y或Cb/Cr。
11.当在可以应用RST的CG中没有非零系数时,应该禁用RST。
a.在一个示例中,当将RST应用到一个块时,应用RST的至少一个CG必须含有至少一个非零系数。
b.在一个示例中,对于4xN和/或Nx4(N>8),如果应用RST,则前两个4x4 CG必须含有至少一个非零系数。
c.在一个示例中,对于4x8和/或8x4,如果应用RST,则左上4x4必须含有至少一个非零系数。
d.在一个示例中,对于WxH(W>=8和H>=8),如果应用RST,则左上4x4必须含有至少一个非零系数。
e.一致性比特流必须满足上述条件的一个或多个。
12.可以在编解码残差(例如变换系数/直接量化)之前信令通知RST有关的语法元素。
a.在一个示例中,在系数的解析过程中移除对归零区域中非零系数的数目(例如numZeroOutSigCoeff)和整个块中非零系数的数目(例如numSigCoeff)的计数。
b.在一个示例中,RST有关的语法元素(例如st_idx)可以是在residual_coding之前编解码的。
c.可以有条件地信令通知RST有关的语法元素(例如根据编解码块标志、TS模式使用)。
vi.在一个示例中,RST有关的语法元素(例如st_idx)可以是在信令通知编解码块标志之后或在信令通知TS/MTS有关的语法元素之后编解码的。
vii.在一个示例中,当启用TS模式(例如,解码的transform_skip_flag等于1)时,跳过信令通知RST有关的语法元素。
d.不可以为归零CG信令通知残差有关的语法。
e.如何编解码残差(例如,扫描顺序、二值化、要解码的语法、上下文建模)可以取决于RST。
i.在一个示例中,可以应用栅格扫描顺序而不是对角向右上方扫描顺序。
1)格栅格扫描顺序是从左到右和从上到下,或者相反顺序。
2)替代地,可以应用垂直扫描顺序(从上到下和从左到右或相反顺序)而不是对角向右上方扫描顺序。
3)替代地,此外,可以修改上下文建模。
a.在一个示例中,上下文建模可以取决于模板中先前编解码的信息,该先前编解码信息是以该扫描顺序的最近扫描的N个邻域,而不是使用右方、下方、右下方邻域。
b.在一个示例中,上下文建模可以取决于模板中根据扫描索引(例如-1,-2,..假设当前索引等于0)的先前编解码的信息。
ii.在一个示例中,可以应用不同二值化方法(例如,赖斯参数导出)对与RST编解码和非RST编解码块相关联的残差进行编解码。
iii.在一个示例中,对于RST编解码块,可以跳过信令通知
一定的语法元素。
1)对于应用RST的CG,可以跳过信令通知CG编解码块标志(coded_sub_block_flag)。
a.在一个示例中,当以对角扫描顺序将RST 8x8应用到前三个CG时,对于第二和第三CG(例如,在块的左上8x8区域中的左上4x4 Cg和左下4x4 CG)跳过信令通知CG编解码块标志。
i.替代地,此外,将对应的CG编解码块标志推断为0,即所有系数为零。
b.在一个示例中,当将RST应用到一个块时,对于扫描顺序中的第一CG(或者相反扫描顺序中的最后一个CG)跳过信令通知CG编解码块标志。
ii.替代地,此外,将块中左上CG的CG编解码块标志推断为1,即它含有至少一个非零系数。
c.图21描绘了8x8块的示例。当将RST 8x8或RST 4x4应用到8x8块时,CG0的coded_sub_block_flag推断为1,CG1和CG2的coded_sub_block_flag推断为0。
2)可以跳过信令通知一定的坐标的系数幅度和/或符号标志。
a.在一个示例中,如果在扫描顺序中相对于一个CG的索引不小于可以存在非零系数的最大允许的索引(例如,区段0中的nonZeroSize),则可以跳过信令通知系数。
b.在一个示例中,可以跳过信令通知语法元素,诸如sig_coeff_flag、abs_level_gtX_flag、par_level_flag、abs_remainder、coeff_sign_flag、dec_abs_level。
3)替代地,可以持续信令通知残差(例如,CG编解码的块标志、一定的坐标的系数幅度和/或符号标志),但是上下文建模可以修改为不同于其他CG。
iv.在一个示例中,在应用RST的CG和其他CG中对残差的编解码可以不同。
1)对于上述子项目符号,仅可以将它们应用到应用
RST的CG。
13.可以在其他变换指示(诸如变换跳过和/或MTS索引)之前信令通知RST有关的语法元素。
a.在一个示例中,信令通知变换跳过可以取决于RST信息。
i.在一个示例中,如果将RST应用到块中,则对于该块不信令通知变换跳过指示并且将其推断为0。
b.在一个示例中,信令通知MTS索引可以取决于RST信息。
i.在一个示例中,如果将RST应用到块中,则不信令通知一个或多个MTS变换指示并且将其推断为不用于该块。
14.提出将不同的上下文建模方法用在一个块内不同部分的算术编解码中。
a.在一个示例中,块被处理成两个部分,扫描顺序中的前M个
CG和剩余CG。
i.在一个示例中,M设置为1。
ii.在一个示例中,对于4xN和Nx4(N>8)块,M设置为2;并且对于所有其他情况,M设置为1。
b.在一个示例中,块被处理成两个部分,应用RST的子区域和不应用RST的子区域。
i.如果应用RST 4x4,则应用RST的子区域是当前块的前一个或两个CG。
ii.如果应用RST 4x4,则应用RST的子区域是当前块的前三个CG。
c.在一个示例中,提出对于一个块内第一部分禁用上下文建模中的先前编解码的信息的使用,但是对于第二部分启用上下文建模中的先前编解码的信息的使用。
d.在一个示例中,当解码第一CG时,可以不允许使用剩余一个或多个CG的信息。
i.在一个示例中,当对第一CG的CG编解码块标志进行编解码时,不考虑第二CG(例如,右方或下方)的值。
ii.在一个示例中,当对第一CG的CG编解码块标志进行编解码时,不考虑第二CG和第三CG(例如,WxH(W>=8和H>=8)的右方或下方CG)的值。
iii.在一个示例中,当对当前系数进行编解码时,如果它在上下文模板中的邻域是在不同CG中,则不允许使用来自该邻域的信息。
e.在一个示例中,当对应用RST的区域中的系数进行解码时,可以不允许使用不应用RST的剩余区域的信息。
f.替代地,此外,在一定的条件下可以应用上述方法。
i.条件可以包括是否启用RST。
ii.条件可以包括块维度。
RST边信息的算术编解码中的上下文建模
15.当对RST索引进行编解码时,上下文建模可以取决于是启用显式还是隐式多个变换选择(MTS)。
a.在一个示例中,当启用隐式MTS时,可以为以相同帧内预测模式编解码的块选择不同上下文。
i.在一个示例中,诸如形状(正方形或非正方形)的块维度用于选择上下文。
b.在一个示例中,代替检验显式MTS编解码的变换索引(例如tu_mts_idx),可以替代地使用变换矩阵基。
i.在一个示例中,对于具有水平和垂直一维变换二者的DCT-II的变换矩阵基,对应的上下文可以不同于其他类型的变换矩阵。
16.当对RST索引进行编解码时,上下文建模可以取决于是否启用CCLM(例如,sps_cclm_enabled_flag)。
a.替代地,是否启用或如何选择用于RST索引编解码的上下文可以取决于是否将CCLM应用到一个块。
b.在一个示例中,上下文建模可以取决于是否为当前块启用CCLM。
i.在一个示例中,intraModeCtx=sps_cclm_enabled_flag?(intra_chroma_pred_mode[x0][y0]is CCLM:intra_chroma_pred_mode[x0][y0]is DM)?1:0。
c.替代地,是否启用或如何选择用于RST索引编解码的上下文可以取决于是否以DM模式编解码当前色度块。
i.在一个示例中,the intraModeCtx=(intra_chroma_pred_mode[x0][y0]==(sps_cclm_enabled_flag?7:4))?1:0。
17.当对RST索引进行编解码时,上下文建模可以取决于块维度/划分深度(例如,四叉树深度和/或BT/TT深度)。
18.当对RST索引进行编解码时,上下文建模可以取决于色彩格式和/或色彩分量。
19.当对RST索引进行编解码时,上下文建模可以与帧内预测模式和/或MTS索引无关。
20.当对RST索引进行编解码时,第一和/或第二二进制树可以是以唯一上下文来上下文编解码的;或是旁路编解码的。
条件下调用RST过程
21.是否调用反向RST过程可以取决于CG编解码块标志。
a.在一个示例中,如果左上CG编解码块标志是零,则不需要调用该过程。
i.在一个示例中,如果左上CG编解码块标志是零且块尺寸不等于4xN/Nx4(N>8),则不需要调用该过程。
b.在一个示例中,如果扫描顺序中前两个CG编解码块标志二者都等于零,则不需要调用该过程。
i.在一个示例中,如果扫描顺序中前两个CG编解码块标志二者都等于零且块尺寸等于4xN/Nx4(N>8),则不需要调用该过程。
22.是否调用反向RST过程可以取决于块维度。
a.在一个示例中,对于一定的块维度(诸如4x8/8x4),可以禁用RST。替代地,此外,可以跳过信令通知RST有关的语法元素。
双树和单树编解码的统一
23.在双树和单树编解码中,可以以相同方式确定RST的使用和/或RST有关的信息的信令通知。
a.例如,当计数的非零系数的数目(例如JVET-N0193中指定的numSigCoeff)的数目在双树编解码情况下不大于T1或者在单树编解码情况下不大于T2时,不应应用RST,并且不信令通知有关的信息,其中T1等于T2。
b.在一个示例中,T1和T2二者都设置为N,例如N=1或2。
考虑CU中的多个TU
24.是否和/或如何应用RST可以取决于块维度W×H。
a.在一个示例中,如果W>T1或H>T2,则可以不应用RST。
b.在一个示例中,如果W>T1和H>T2,则可以不应用RST。
c.在一个示例中,如果W*H>=T,则可以不应用RST。
d.对于上述示例,如下适用:
i.在一个示例中,块为CU。
ii.在一个示例中,T1=T2=64。
iii.在一个示例中,T1和/或T2可以取决于允许的最大变换尺寸。例如,T1=T2=允许的最大变换尺寸。
iv.在一个示例中,T设置为4096。
e.替代地,此外,如果确定不应用RST,则可以不信令通知有关的信息。
25.当CU中存在N(N>1)个TU时,N个TU的唯一一个TU的编解码信息用于确定RST的使用和/或RST有关的信息的信令通知。
a.在一个示例中,解码顺序中CU的第一TU可以用于做出确定。
b.在一个示例中,解码顺序中CU的左上TU可以用于做出确定。
c.在一个示例中,对于在CU中存在唯一一个TU时的情况,可以以相同方法做出指定TU的确定。
26.可以以TU级或PU级而不是CU级来执行RST的使用和/或RST的有关信息的信令通知。
a.替代地,此外,CU内不同TU/PU可以选择不同二次变换矩阵或启用/禁用控制标志。
b.替代地,此外,对于双树情况并且编解码色度块,不同色彩分量可以选择不同二次变换矩阵或启用/禁用控制标志。
c.替代地,是否以视频单元级信令通知RST有关的信息可以取决于分割树类型(双树或单数)。
d.替代地,是否以视频单元级信令通知RST有关的信息可以取决于CU/PU/TU之间关系和最大允许的变换块尺寸,诸如更大或更小。
5本公开的技术的示例实现方式
在以下示例性实施例中,JVET-N0193之上的改变以粗体和斜体突出显示。用双括号标记删除的文本(例如,[[a]]表示删除字符“a”)。
5.1实施例#1
RST索引的信令通知是取决于块的子区域内而不是整个块内的非零系数的数目。
7.3.6.11残差编解码语法
/>
/>
/>
/>
替代地,条件可以替换为:
5.2实施例#2
RST可以不根据一定的CG的编解码块标志来调用。
8.7.4.缩放变换系数的变换过程
8.7.4.1一般性
此过程的输入是:
–指定当前亮度变换块的左上样点相对于当前图片的左上亮度样点的亮度位置(xTbY,yTbY),
–变量nTbW,指定当前变换块的宽度,
–变量nTbH,指定当前变换块的高度,
–变量cIdx,指定当前块的色彩分量,
–缩放变换系数的(nTbW)x(nTbH)阵列d[x][y],其中x=0..nTbW–1,y=0..nTbH-1。
此过程的输出是残差样点的(nTbW)x(nTbH)阵列r[x][y],其中x=0..nTbW–1,y=0..nTbH-1。
变量bInvokeST设置为0,并且如果以下条件中的一个为真则将该变量进一步修改为1:
–如果coded_sub_block_flag[0][0]等于1并且nTbW x nTbH!=32
–如果coded_sub_block_flag[0][0]和coded_sub_block_flag[0][1]等于1并且nTbW等于4并且nTbH大于8。
–如果coded_sub_block_flag[0][0]和coded_sub_block_flag[1][0]等于1并且nTbW等于8并且nTbH等于4。
如果bInvokeST等于1并且st_idx[xTbY][yTbY]不等于0,则以下适用:
1.变量nStSize、log2StSize、numStX、numStY和nonZeroSize导出如下:
–如果nTbW和nTbH二者都大于或等于8,则log2StSize设置为3并且nStOutSize设置为48。
–否则,log2StSize设置为2并且nStOutSize设置为16。
–nStSize设置为(1<<log2StSize)。
–如果nTbH等于4并且nTbW大于8,则numStX设置为等于2。
–否则,numStX设置为等于1。
–如果nTbW等于4并且nTbH大于8,则numStY设置为等于2。
–否则,numStY设置为等于1。
–如果nTbW和nTbH二者都等于4或nTbW和nTbH二者都等于8,则nonZeroSize设置为等于8。
–否则,nonZeroSize设置为等于16。
2.对于xSbIdx=0..numStX–1和ySbIdx=0..numStY–1,以下适用:
–变量array u[x],其中x=0..nonZeroSize–1,导出如下:
xC=(xSbIdx<<log2StSize)+DiagScanOrder[log2StSize][log2StSize][x][0]
yC=(ySbIdx<<log2StSize)+DiagScanOrder[log2StSize][log2StSize][x][1]
u[x]=d[xC][yC]
–通过使用以下调用节8.7.4.4中指定的一维变换过程,将u[x](其中x=0..nonZeroSize–1)变换为变量阵列v[x](其中x=0..nStOutSize–1):缩放变换系数变换输入长度nonZeroSize、变换输出长度nStOutSize、列表u[x](其中x=0..nonZeroSize–1)、变换集选择的索引stPredModeIntra、以及变换集中变换选择的索引st_idx[xTbY][yTbY]作为输入,并且输出是列表v[x](其中x=0..nStOutSize–1)。变量stPredModeIntra设置为节8.4.4.2.1指定的predModeIntra。
–阵列d[(xSbIdx<<log2StSize)+x][(ySbIdx<<log2StSize)+y],其中x=0..nStSize–1,y=0..nStSize–1,导出如下:
–如果stPredModeIntra小于或等于34、或等于INTRA_LT_CCLM、INTRA_T_CCLM或INTRA_L_CCLM,则如下适用:
d[(xSbIdx<<log2StSize)+x][(ySbIdx<<log2StSize)+y]=(y<4)?v[x+(y<<log2StSize)]:((x<4)?v[32+x+((y–4)<<2)]:d[(xSbIdx<<log2StSize)+x][(ySbIdx<<log2StSize)+y])
–否则,如下适用:
d[(xSbIdx<<log2StSize)+x][(ySbIdx<<log2StSize)+y]=(y<4)?v[y+(x<<log2StSize)]:((x<4)?v[32+(y–4)+(x<<2)]:d[(xSbIdx<<log2StSize)+x][(ySbIdx<<log2StSize)+y])
变量implicitMtsEnabled导出如下:
–如果sps_mts_enabled_flag等于1并且以下条件中的一个为真,则implicitMtsEnabled设置为等于1:
–IntraSubPartitionsSplitType不等于ISP_NO_SPLIT
–cu_sbt_flag等于1并且Max(nTbW,nTbH)小于或等于32
–sps_explicit_mts_intra_enabled_flag和sps_explicit_mts_inter_enabled_flag都等于0并且CuPredMode[xTbY][yTbY]等于MODE_INTRA。
–否则,implicitMtsEnabled设置为等于0。
指定水平变换核的变量trTypeHor和指定垂直变换核的变量trTypeVer导出如下:
–如果cIdx大于0,则trTypeHor和trTypeVer设置为等于0。
–否则,如果implicitMtsEnabled等于1,则如下适用:
–如果IntraSubPartitionsSplitType不等于ISP_NO_SPLIT,则trTypeHor和trTypeVer被指定在表8-15中,取决于intraPredMode。
–否则,如果cu_sbt_flag等于1,则trTypeHor和trTypeVer被指定在表8-14中,取决于cu_sbt_horizontal_flag和cu_sbt_pos_flag。
–否则(sps_explicit_mts_intra_enabled_flag和sps_explicit_mts_inter_enabled_flag等于0),trTypeHor和trTypeVer导出如下:
trTypeHor=(nTbW>=4&&nTbW<=16&&nTbW<=nTbH)?1:0(8-1029)
trTypeVer=(nTbH>=4&&nTbH<=16&&nTbH<=nTbW)?1:0(8-1030)
–否则,trTypeHor和trTypeVer被指定在表8-13,取决于tu_mts_idx[xTbY][yTbY]。
变量nonZeroW和nonZeroH导出如下:
nonZeroW=Min(nTbW,(trTypeHor>0)?16:32) (8-1031)
nonZeroH=Min(nTbH,(trTypeVer>0)?16:32) (8-1032)
残差样点的(nTbW)x(nTbH)阵列导出如下:
1.当nTbH大于1时,通过使用以下调用节8.7.4.2指定的一维变换过程将每个(垂直)列缩放变换系数d[x][y](其中x=0..nonZeroW–1,y=0..nonZeroH–1)变换为e[x][y](其中x=0..nonZeroW–1,y=0..nTbH–1):对于每个列x=0..nonZeroW-1,变换块的高度nTbH、缩放变换系数的非零高度nonZeroH、列表d[x][y](其中y=0..nonZeroH–1)以及设置为等于trTypeVer的变换类型变量trType作为输入,并且输出是列表e[x][y],其中y=0..nTbH-1。
2.当nTbH和nTbW都大于1时,中间样点值g[x][y],其中x=0..nonZeroW–1,y=0..nTbH–1,导出如下:
g[x][y]=Clip3(CoeffMin,CoeffMax,(e[x][y]+64)>>7)(8-1033)
当nTbW大于1时,通过使用以下调用节8.7.4.2指定的一维变换过程将每个(水平)行得到的阵列g[x][y](其中x=0..nonZeroW–1,y=0...nTbH–1)变换为r[x][y](其中x=0...nTbW–1,y=0..nTbH–1):对于每个行y=0...nTbH-1,变换块的宽度nTbW、得到的阵列g[x][y]的非零宽度nonZeroW、列表g[x][y](其中x=0..nonZeroW–1)以及设置为等于trTypeHor的变换类型变量trType作为输入,并且输出是列表r[x][y],其中y=0..nTbW-1。
5.3实施例#3
修订RST索引的上下文建模。
5.3.1替代例#1
9.5.4.2.8语法元素st_idx的ctxInc的导出过程
此过程的输入是:色彩分量索引cIdx;亮度或色度位置(x0,y0),取决于cIdx指定相对于当前图片的左上样点的当前亮度或色度编解码块的左上样点;树类型treeType;如节8.4.2中指定的亮度帧内预测模式IntraPredModeY[x0][y0];如节7.4.7.5中指定的为色度样点指定帧内预测模式的语法元素intra_chroma_pred_mode[x0][y0];块宽度nTbW和高度nTbH;以及多个变换选择索引tu_mts_idx[x0][y0]。
此过程的输出是变量ctxInc。
变量intraModeCtx导出如下:
如果cIdx等于0,则intraModeCtx导出如下:
intraModeCtx=(IntraPredModeY[x0][y0]<=1)?1:0
否则(cIdx大于0),则intraModeCtx导出如下:
intraModeCtx=(intra_chroma_pred_mode[x0][y0]>=4)?1:0
变量mtsCtx导出如下:
mtsCtx=((sps_explicit_mts_intra_enabled_flag?tu_mts_idx[x0][y0]==0:nTbW==nTbH)&&treeType!=SINGLE_TREE)?1:0
变量ctxInc导出如下:
ctxInc=(binIdx<<1)+intraModeCtx+(mtsCtx<<2)
5.3.2替代例#2
表9-15–用上下文编解码的二进制数向语法元素分配ctxInc
[[9.5.4.2.8语法元素st_idx的ctxInc的导出过程
此过程的输入是:色彩分量索引cIdx;亮度或色度位置(x0,y0),取决于cIdx指定相对于当前图片的左上样点的当前亮度或色度编解码块的左上样点;树类型treeType;如节8.4.2中指定的亮度帧内预测模式IntraPredModeY[x0][y0];如节7.4.7.5中指定的为色度样点指定帧内预测模式的语法元素intra_chroma_pred_mode[x0][y0];以及多个变换选择索引tu_mts_idx[x0][y0]。
此过程的输出是变量ctxInc。
变量intraModeCtx导出如下:
如果cIdx等于0,则intraModeCtx导出如下:
intraModeCtx=(IntraPredModeY[x0][y0]<=1)?1:0
否则(cIdx大于0),则intraModeCtx导出如下:
intraModeCtx=(intra_chroma_pred_mode[x0][y0]>=4)?1:0
变量mtsCtx导出如下:
mtsCtx=(tu_mts_idx[x0][y0]==0&&treeType!=SINGLE_TREE)?1:0
变量ctxInc导出如下:
ctxInc=(binIdx<<1)+intraModeCtx+(mtsCtx<<2)]]
5.4实施例#4
对应于项目符号7.c和7.d。
7.3.7.11残差编解码语法
在替代的示例中,如下可以适用:
在一个示例中,如下可以适用:
如果log2TbWidth>3&&log2TbHeight==2,则SigRangeX等于8。否则,SigRangeX等于4。如果log2TbHeight>3&&log2TbWidth==2,则SigRangeY等于8。否则,SigRangeY等于4。
5.5实施例#5
对应于项目条目19
7.3.6.5编解码单元语法
/>
5.6实施例#6
对应于项目条目20
7.3.6.5编解码单元语法
/>
5.7实施例#7
对应于项目条目21
7.3.7.11残差编解码语法
/>
(CbX[x0][y0],CbY[x0][y0])指定编解码单元覆盖位置(x0,y0)的左上位置。
5.8实施例#8
从分配到非正常帧内预测模式的默认模式中导出RST变换集索引。新添加的部分以粗体和斜体突出显示并且用双括号标记删除的部分(例如,[[a]]表示删除字符“a”)。
8.7.4.1一般性
此过程的输入是:
–指定当前亮度变换块的左上样点相对于当前图片的左上亮度样点的亮度位置(xTbY,yTbY),
–变量nTbW,指定当前变换块的宽度,
–变量nTbH,指定当前变换块的高度,
–变量cIdx,指定当前块的色彩分量,
–缩放变换系数的(nTbW)x(nTbH)阵列d[x][y],其中x=0..nTbW–1,
y=0..nTbH-1。
此过程的输出是残差样点的(nTbW)x(nTbH)阵列r[x][y],其中x=0..nTbW–1,y=0..nTbH-1。
当lfnst_idx[xTbY][yTbY]不等于0并且nTbW和nTbH二者都大于或等于4时,如下适用:
–变量predModeIntra、nLfnstOutSize、log2LfnstSize、nLfnstSize、和nonZeroSize导出如下:
predModeIntra=(cIdx==0)?IntraPredModeY[xTbY][yTbY]:IntraPredModeC[xTbY][yTbY] (8-965)
nLfnstOutSize=(nTbW>=8&&nTbH>=8)?48:16 (8-966)
log2LfnstSize=(nTbW>=8&&nTbH>=8)?3:2 (8-967)
nLfnstSize=1<<log2LfnstSize (8-968)
nonZeroSize=((nTbW==4&&nTbH==4)||(nTbW==8&&nTbH==8))?8:16(8-969)
–当intra_mip_flag[xTbComp][yTbComp]等于1并且cIdx等于0时,predModeIntra设置为等于INTRA_PLANAR。
–当predModeIntra等于INTRA_LT_CCLM、INTRA_L_CCLM或INTRA_T_CCLM时,predModeIntra导出如下:[[设置为等于IntraPredModeY[xTbY+nTbW/2][yTbY+nTbH/2]。]]
–如果intra_mip_flag[xTbY][yTbY]等于1,则predModeIntra设置为等于INTRA_PLANAR。
–否则,如果CuPredMode[0][xTbY][yTbY]等于MODE_IBC或MODE_PLT,则predModeIntra设置为等于INTRA_DC。
–否则,predModeIntra设置为等于IntraPredModeY[xTbY+nTbW/2][yTbY+nTbH/2]。
–使用以下调用节8.4.5.2.6中指定的宽角度帧内预测模式映射过程:
predModeIntra、nTbW、nTbH和cIdx作为输入,并且修改的predModeIntra作为输出。
替代地,如下可以适用:
–当predModeIntra等于INTRA_LT_CCLM、INTRA_L_CCLM或INTRA_T_CCLM时,predModeIntra导出如下:[[设置为等于IntraPredModeY[xTbY+nTbW/2][yTbY+nTbH/2]。]]
–如果intra_mip_flag[xTbY+nTbW/2][yTbY+nTbH/2]等于1,则predModeIntra设置为等于INTRA_PLANAR。
–否则,如果CuPredMode[0][xTbY+nTbW/2][yTbY+nTbH/2]等于MODE_IBC或MODE_PLT,则predModeIntra设置为等于INTRA_DC。
–否则,predModeIntra设置为等于IntraPredModeY[xTbY+nTbW/2][yTbY+nTbH/2]。
5.9实施例#9
RST变换集索引是从分配到非正常帧内预测模式的默认模式中导出的,并且取决于色彩格式。新添加的部分以粗体和斜体突出显示并且用双括号标记删除的部分(例如,[[a]]表示删除字符“a”)。
8.7.4.2一般性
此过程的输入是:
–指定当前亮度变换块的左上样点相对于当前图片的左上亮度样点的亮度位置(xTbY,yTbY),
–变量nTbW,指定当前变换块的宽度,
–变量nTbH,指定当前变换块的高度,
–变量cIdx,指定当前块的色彩分量,
–缩放变换系数的(nTbW)x(nTbH)阵列d[x][y],其中x=0..nTbW–1,y=0..nTbH-1。
此过程的输出是残差样点的(nTbW)x(nTbH)阵列r[x][y],其中x=0..nTbW–1,y=0..nTbH-1。
当lfnst_idx[xTbY][yTbY]不等于0并且nTbW和nTbH二者都大于或等于4,如下适用:
–变量predModeIntra、nLfnstOutSize、log2LfnstSize、nLfnstSize、和nonZeroSize导出如下:
predModeIntra=(cIdx==0)?IntraPredModeY[xTbY][yTbY]:IntraPredModeC[xTbY][yTbY] (8-965)
nLfnstOutSize=(nTbW>=8&&nTbH>=8)?48:16 (8-966)
log2LfnstSize=(nTbW>=8&&nTbH>=8)?3:2 (8-967)
nLfnstSize=1<<log2LfnstSize (8-968)
nonZeroSize=((nTbW==4&&nTbH==4)||(nTbW==8&&nTbH==8))?8:16(8-969)
–当intra_mip_flag[xTbComp][yTbComp]等于1并且cIdx等于0时,predModeIntra设置为等于INTRA_PLANAR。
–当predModeIntra等于INTRA_LT_CCLM、INTRA_L_CCLM或INTRA_T_CCLM时,predModeIntra导出如下:[[设置为等于IntraPredModeY[xTbY+nTbW/2][yTbY+nTbH/2]。]]
–如果intra_mip_flag[xTbY][yTbY]等于1,则predModeIntra设置为等于INTRA_PLANAR。
–否则,如果CuPredMode[0][xTbY][yTbY]等于MODE_IBC或MODE_PLT,则predModeIntra设置为等于INTRA_DC。
–其他,predModeIntra设置为等于IntraPredModeY[xTbY+nTbW/2][yTbY+nTbH/2]。
–当chroma_format_idc等于2时,根据表8-3进一步修改predModeIntra。色度帧内预测模式X设置为等于predModeIntra以导出色度帧内预测模式Y。然后,predModeIntra设置为等于Y。
–使用以下调用节8.4.5.2.6中指定的宽角度帧内预测模式映射过程:
predModeIntra、nTbW、nTbH和cIdx作为输入,并且修改的predModeIntra作为输出。
表8-3-当chroma_format_idc等于2时从色度帧内预测模式X到模式Y的4:2:2映射过程的规范
替代地,如下可以适用:
–当predModeIntra等于INTRA_LT_CCLM、INTRA_L_CCLM或INTRA_T_CCLM时,predModeIntra导出如下:[[设置为等于IntraPredModeY[xTbY+nTbW/2][yTbY+nTbH/2]。]]
–如果intra_mip_flag[xTbY+nTbW/2][yTbY+nTbH/2]等于1,则predModeIntra设置为等于INTRA_PLANAR。
–否则,如果CuPredMode[0][xTbY+nTbW/2][yTbY+nTbH/2]等于MODE_IBC或MODE_PLT,则predModeIntra设置为等于INTRA_DC。
–否则,predModeIntra设置为等于IntraPredModeY[xTbY+nTbW/2][yTbY+nTbH/2]。
–当chroma_format_idc等于2时,根据表8-3进一步修改predModeIntra。色度帧内预测模式X设置为等于predModeIntra以导出色度帧内预测模式Y。然后,predModeIntra设置为等于Y。
5.10实施例#10
在该实施例中,检验当前色度块的对应亮度区域的中部亮度样点是否以MIP或IBC或调色板模式编解码;并且DM的设置也是基于中部亮度样点。
新添加的部分以粗体和斜体突出显示并且用双括号标记删除的部分(例如,[[a]]表示删除字符“a”)。
8.4.3色度帧内预测模式的导出过程
此过程的输入是:
–指定当前色度编解码块的左上样点相对于当前图片的左上亮度样点的亮度位置(xCb,yCb),
–变量cbWidth,指定亮度样点中的当前编解码块的宽度,
–变量cbHeight,指定亮度样点中的当前编解码块的高度。
在此过程中,导出色度帧内预测模式IntraPredModeC[xCb][yCb]。
对应的亮度帧内预测模式lumaIntraPredMode导出如下:
–如果intra_mip_flag[xCb+cbWidth/2][yCb+cbHeight/2]等于1,则lumaIntraPredMode设置为等于INTRA_PLANAR。
–否则,如果CuPredMode[0][xCb+cbWidth/2][yCb+cbHeight/2]等于MODE_IBC或MODE_PLT,则lumaIntraPredMode设置为等于INTRA_DC。
–否则,lumaIntraPredMode设置为等于
IntraPredModeY[xCb+cbWidth/2][yCb+cbHeight/2]。
使用cclm_mode_flag、cclm_mode_idx、intra_chroma_pred_mode和lumaIntraPredMode导出色度帧内预测模式IntraPredModeC[xCb][yCb],如表8-2指定的。
表8-2–取决于cclm_mode_flag、cclm_mode_idx、intra_chroma_pred_mode和lumaIntraPredMode的IntraPredModeC[xCb][yCb]的规范
当chroma_format_idc等于2时,色度帧内预测模式Y是使用表8-2中色度帧内预测模式X导出的,如表8-3指定的,并且然后色度帧内预测模式X设置等于色度帧内预测模式Y。
5.11实施例#11
在该实施例中,检验当前色度块的对应亮度区域的左上亮度样点是否以MIP或IBC或调色板模式编解码;以及DM的设置也是基于中部亮度样点。
新添加的部分以粗体和斜体突出显示并且用双括号标记删除的部分(例如,[[a]]表示删除字符“a”)。
8.4.3色度帧内预测模式的导出过程
此过程的输入是:
–指定当前色度编解码块的左上样点相对于当前图片的左上亮度样点的亮度位置(xCb,yCb),
–变量cbWidth,指定亮度样点中的当前编解码块的宽度,
–变量cbHeight,指定亮度样点中的当前编解码块的高度。
在此过程中,导出色度帧内预测模式IntraPredModeC[xCb][yCb]。
对应的亮度帧内预测模式lumaIntraPredMode导出如下:
–如果intra_mip_flag[xCb][yCb]等于1,则lumaIntraPredMode设置为等于INTRA_PLANAR。
–否则,如果CuPredMode[0][xCb][yCb]等于MODE_IBC或MODE_PLT,则lumaIntraPredMode设置为等于INTRA_DC。
–否则,lumaIntraPredMode设置为等于IntraPredModeY[xCb+cbWidth/2][yCb+cbHeight/2]。
使用cclm_mode_flag、cclm_mode_idx、intra_chroma_pred_mode和lumaIntraPredMode导出色度帧内预测模式IntraPredModeC[xCb][yCb],如表8-2指定的。
表8-2–取决于cclm_mode_flag、cclm_mode_idx、intra_chroma_pred_mode和lumaIntraPredMode的IntraPredModeC[xCb][yCb]的规范
当chroma_format_idc等于2时,色度帧内预测模式Y是使用表8-2中色度帧内预测模式X导出的,如表8-3指定的,并且然后色度帧内预测模式X设置等于色度帧内预测模式Y。
上文描述的示例可以并入下面描述的方法的上下文中,例如方法2200、2210、2220、2230、2240和2250,该方法可以在视频解码器或视频编码器处实现。
图22A示出了视频处理的示例性方法的流程图。方法2200包括,步骤2202处,基于当前视频块的特性选择变换集或变换矩阵,以将缩减二次变换应用到当前视频块。
方法2200包括,步骤2204处,作为当前视频块与包括当前视频块的视频的比特流表示之间的转换的部分,将选择的变换集或变换矩阵应用到当前视频块的一部分。
在一些实施例中,当前视频块的该部分是当前视频块的右上子区域、右下子区域、左下子区域或中部子区域。
在一些实施例中,当前视频块的特性是当前视频块的帧内预测模式或一次变换矩阵。
在一些实施例中,特性是当前视频块的色彩分量。在示例中,为当前视频块的亮度分量选择第一变换集,并且其中,为当前视频块的一个或多个色度分量选择与第一变换集不同的第二变换集。
在一些实施例中,特性是当前视频块的帧内预测模式或帧内编解码方法。在示例中,帧内预测方法包括基于多个参考行(MRL)的预测方法或基于矩阵的帧内预测方法。在另一个示例中,当当前视频块是跨分量线性模型(CCLM)编解码的块时,选择第一变换集,并且其中,当当前视频块是非CCLM编解码的块时,选择与第一变换集不同的第二变换集。在另一个示例中,当当前视频块是以联合色度残差编解码方法编解码的时,选择第一变换集,并且其中,当当前视频块不是以联合色度残差编解码方法编解码的时,选择与第一变换集不同的第二变换集。
在一些实施例中,特性是当前视频块的一次变换。
图22B示出了视频处理的示例性方法的流程图。方法2210包括,步骤2212处,基于与当前视频块相关联的一个或多个系数做出决定,该决定关于选择性包括信令通知边信息,以将缩减二次变换(RST)应用在当前视频块的比特流表示中。
方法2210包括,步骤2214处,基于该决定执行当前视频块与包括当前视频块的比特流表示的视频之间的转换。
在一些实施例中,一个或多个系数包括当前视频块的扫描顺序中最后一个非零系数。
在一些实施例中,一个或多个系数包括当前视频块的部分区域内的多个系数。在示例中,部分区域包括可应用RST的一个或多个编解码组。在另一个示例中,部分区域包括当前视频块的扫描顺序中前M个或后M个编解码组。在又一个示例中,部分区域包括当前视频块的反向扫描顺序中前M个或后M个编解码组。在又一个示例中,基于多个系数中的一个或多个非零系数的能量进一步作出决定。
图22C示出了视频处理的示例性方法的流程图。方法2220包括,步骤2222处,配置当前视频块的比特流表示以将缩减二次变换(RST)应用到当前视频块,其中,在编解码残差信息之前在比特流表示中信令通知RST有关的语法元素。
方法2220包括,步骤2224处,基于该配置执行当前视频块与当前视频块的比特流表示之间的转换。
在一些实施例中,信令通知RST有关的语法元素是基于至少一个编解码块标志或变换选择模式的使用。
在一些实施例中,比特流表示排除对应于具有所有零系数的编解码组的编解码残差信息。
在一些实施例中,编解码残差信息是基于RST的应用。
图22D示出了视频处理的示例性方法的流程图。方法2230,步骤2232处,配置当前视频块的比特流表示以将缩减二次变换(RST)应用到当前视频块,其中,在变换跳过指示或是多个变换集(MTS)索引之前在比特流表示中信令通知RST有关的语法元素。
方法2230包括,步骤2234处,基于该配置执行当前视频块与当前视频块的比特流表示之间的转换。
在一些实施例中,变换跳过指示或MTS索引基于RST有关的语法元素。
图22E示出了视频处理的示例性方法的流程图。方法2240包括,步骤2242处,基于当前视频块的特性来配置上下文模型以编解码缩减二次变换(RST)的索引。
方法2240包括,步骤2244处,基于该配置执行当前视频块与包括当前视频块的视频的比特流表示之间的转换。
在一些实施例中,特性是显式或隐式启用多个变换选择(MTS)过程。
在一些实施例中,特性是在当前视频块中启用跨分量线性模型(CCLM)编解码模式。
在一些实施例中,特性是当前视频块的尺寸。
在一些实施例中,特性是应用到当前视频块的分割过程的划分深度。在示例中,分割过程是四叉树(QT)分割过程、二叉树(BT)分割过程或三叉树(TT)分割过程。
在一些实施例中,特性是当前视频块的色彩格式或色彩分量。
在一些实施例中,特性排除当前视频块的帧内预测模式和多个变换选择(MTS)过程的索引。
图22F示出了视频处理的示例性方法的流程图。方法2250包括,步骤2252处,基于当前视频块的特性做出决定,该决定关于将反向缩减二次变换(RST)过程选择性应用在当前视频块上。
方法2250包括,步骤2254处,基于该决定执行当前视频块与包括当前视频块的视频的比特流表示之间的转换。
在一些实施例中,特性是当前视频块的编解码组的编解码块标志。在示例中,不应用反向RST过程,并且其中,左上编解码组的编解码块标志为零。在另一个示例中,不应用反向RST过程,并且其中,当前视频块的扫描顺序中第一和第二编解码组的编解码块标志为零。
在一些实施例中,特性是当前视频块的高度(M)或宽度(N)。在示例中,不应用反向RST过程,并且其中,(i)M=8和N=4,或者(ii)M=4和N=8。
图26A示出了视频处理的示例性方法的流程图。方法2610包括,步骤2612处,对于视频的视频单元的当前视频块与视频的编解码表示之间的转换,为使用一定的帧内预测模式编解码的视频单元确定默认帧内预测模式,使得生成当前视频块的预测块,而无需沿着方向外推当前视频块的邻域像素。方法2610还包括,步骤2614处,基于该确定执行转换。
图26B示出了视频处理的示例性方法的流程图。方法2620包括,步骤2622处,使用规则来确定视频的亮度块覆盖所述视频的色度块的预定位置。方法2620还包括,步骤2624处,基于该确定执行视频与视频的编解码表示之间的转换。在一些实现方式中,其中,以使用帧内预测模式的编解码表示来表示色度块。
图26C示出了视频处理的示例性方法的流程图。方法2630包括,步骤2632处,使用规则来基于对应于色度块的亮度块的编解码模式导出视频的色度块的帧内预测模式。方法2630还包括,步骤2634处,基于导出的帧内预测模式执行色度块与视频的编解码表示之间的转换。在一些实现方式中,该规则指定使用默认帧内预测模式以防亮度块的编解码模式是一定的帧内预测模式,其中,在不沿着方向外推所述亮度块的领域像素的情况下生成所述亮度块的预测块。
图27A示出了视频处理的示例性方法的流程图。方法2710包括,步骤2712处,对于视频的色度块,做出是否将非正常的色度帧内预测模式应用到视频的色度块的第一确定。方法2710还包括,步骤2714处,对于对应于色度块的亮度块,做出将亮度帧内预测模式应用到亮度块的第二确定。方法2710还包括,步骤2716处,基于亮度帧内预测模式做出将变换集或变换矩阵应用到色度块的第三确定。方法2710还包括,步骤2718处,根据第三确定执行视频与视频的编解码表示之间的转换。在一些实现方式中,非正常的色度帧内预测模式包括在不使用沿着色度预测方向外推的邻域像素值的情况下编解码色度块。
图27B示出了视频处理的示例性方法的流程图。方法2720包括,步骤2722处,对于视频的色度块,做出对应于色度块的亮度块是使用非正常的亮度帧内预测模式编解码的第一确定。方法2720还包括,步骤2724处,基于第一确定,根据规则做出色度块的变换集或变换矩阵的第二确定。方法2720还包括,步骤2726处,根据第二确定执行视频与视频的编解码表示之间的转换。在一些实现方式中,规则指定由于亮度块是使用非正常的亮度帧内预测模式编解码的,因而与色度块相关联的一个或多个默认模式或默认变换集确定变换集或变换矩阵以防色度块是使用非正常的色度帧内预测模式编解码的,其中,非正常的亮度帧内预测模式包括在不使用沿着亮度预测方向外推的邻域像素值的情况下编解码亮度块,并且其中,非正常的色度帧内预测模式包括在不使用沿着色度预测方向外推的邻域像素的情况下编解码色度块。
图27C示出了视频处理的示例性方法的流程图。方法2730包括,步骤2732处,对于视频的当前视频块与视频的编解码表示之间的转换,基于以下的至少一个确定向一个色彩分量的当前视频块应用的二次变换工具的适用性:1)另一个色彩分量的对应块的编解码模式,或2)当前视频块的编解码模式。方法2730还包括,步骤2734处,基于该确定执行转换。在一些实现方式中,使用第二变换工具:编码期间,在量化之前将前向二次变换应用到向当前视频块的残差应用的前向一次变换的输出,或者解码期间,在应用反向一次变换之前将反向二次变换应用到当前视频块的去量化的输出。
图27D示出了视频处理的示例性方法的流程图。方法2740包括,步骤2742处,对于视频的色度块,做出覆盖色度块的预定义位置的亮度块是使用非正常的亮度帧内预测模式编码的第一确定。方法2740还包括,步骤2744处,基于第一确定,做出第二确定以由于色度块是使用非正常的亮度帧内预测模式编码的因而将预定义帧内预测模式应用到色度块。方法2740还包括,步骤2746处,根据第二确定执行视频与视频的编解码表示之间的转换。在一些实现方式中,非正常的亮度帧内预测模式包括在不使用沿着亮度预测方向外推的邻域像素值的情况下编码亮度块。
图27E示出了视频处理的示例性方法的流程图。方法2750包括,步骤2752处,对于视频的色度块,做出覆盖色度块的预定义位置的亮度块是使用正常亮度帧内预测模式编码的第一确定。方法2750还包括,步骤2754处,基于第一确定,做出第二确定以基于亮度块的正常亮度帧内预测模式导出色度帧内预测模式。方法2750还包括,步骤2756处,根据第二确定执行视频与视频的编解码表示之间的转换,其中正常亮度帧内预测模式包括使用沿着亮度预测方向外推的邻域像素值编码亮度块。
图23A是视频处理设备2300的框图。设备2300可以用于实现文中所述的方法中的一个或多个。设备2300可以实施为智能电话、平板计算机、物联网(IoT)接收器等。设备2300可以包括一个或多个处理器2302、一个或多个存储器2304和视频处理硬件2306。(一个或多个)处理器2302可以配置为实现本文档中所述的一个或多个方法(包括但不限于方法2200至2750)。(一个或多个)存储器2304可以用于存储数据和代码,该代码用于实现本文所描述的的方法和技术。视频处理硬件2306可以用于在硬件电路中实现本文档中所描述的一些技术。在一些实施例中,硬件2306可以至少部分位于处理器2302,例如图形联合处理器中。
图23B是其中可以实现所公开的技术的视频处理系统的框图的另一个示例。图23B是其中可以实现本文中所公开的各种技术的示例视频处理系统2400的框图。各种实现方式可以包括系统2400中的一些或全部组件。系统2400可以包括接收视频内容的输入2402。视频内容可以以原始或未压缩的格式(例如8或10比特多分量像素值)接收,或者可以以压缩或编码的格式接收。输入2402可以代表网络接口、外围总线接口或存储接口。网络接口的示例包括有线接口(诸如以太网、无源光网络(PON)等)和无线接口(诸如Wi-Fi或蜂窝接口)。
系统2400可以包括可以实现本文档中描述的各种编解码或编码方法的编解码组件2404。编解码组件2404可以减少从输入2402到编解码组件2404的输出的视频的平均比特率,以产生视频的编解码表示。因此,编解码技术有时称为视频压缩或视频转码技术。编解码组件2404的输出可以被存储或经由所连接的通信来发送,如组件2406所表示的。在输入2402处接收的视频的存储或通信的比特流(或编解码)表示可以由组件2408使用,以生成被发送到显示接口2410的像素值或可显示视频。从比特流表示中生成用户可见的视频的过程有时称为视频解压缩。此外,尽管某些视频处理操作被称为“编解码”操作或工具,但是应当理解,在编码器处使用编解码工具或操作,并且将由解码器执行反向编解码结果的对应解码工具或操作。
外围总线接口或显示接口的示例可以包括通用串行总线(USB)或高清晰度多媒体接口(HDMI)或Displayport等。存储接口的示例包括SATA(串行高级技术附件)、PCI、IDE接口等。本文档中描述的技术可以实施在各种电子装置中,诸如移动电话、膝上型计算机、智能电话或其它能够执行数字数据处理和/或视频显示的装置。
在一些实施例中,本专利文档中讨论的视频处理方法可以使用如关于图23A或23B所描述的硬件平台上实现的设备来实现。
本公开的技术的一些实施例包括决定或确定启用视频处理工具或模式。在示例中,当启用视频处理工具或模式时,编码器将使用或实现在视频块的处理过程中的工具或模式,但是不必基于工具或模式的使用来修改得到的比特流。换言之,当基于决定或确定启用视频处理工具或模式时,从视频块到视频的比特流的转换将使用视频处理工具或模式。在另一个示例中,当启用视频处理工具或模式时,解码器将利用已经基于视频处理工具或模式修改比特流的知识来处理比特流。换言之,将使用基于决定或确定启用的视频处理工具或模式,执行从视频的比特流到视频块的转换。
本公开的技术的一些实施例包括决定或确定禁用视频处理工具或模式。在示例中,当禁用视频处理工具或模式时,编码器在视频块到视频的比特流表示的转换中将不会使用的工具或模式。在另一个示例中,当禁用视频处理工具或模式时,解码器将利用尚未使用基于决定或确定禁用的视频处理工具或模式修改比特流的知识来处理比特流。
在本文档中,术语“视频处理”可以指代视频编码、视频解码、视频压缩或视频解压缩。例如,在从视频的像素表示到对应比特流表示的转换期间可以应用视频压缩算法,反之亦然。当前视频块的比特流表示或编解码表示例如可以对应于比特流内不同位置中共位或扩展的比特,如语法所定义。例如,可以根据变换的和编解码的误差残差值并且还使用头中的比特和比特流中的其他字段来对宏块进行编码。
使用以下基于条款的格式可以描述各种技术和实施例。第一组条款描述先前章节中所公开的技术的某些特征和方面。
1.一种视频处理的方法,包括:基于当前视频块的特性,选择变换集或变换矩阵以将缩减二次变换应用到当前视频块;以及作为当前视频块与包括当前视频块的视频的比特流表示之间的转换的部分,将所选择的变换集或变换矩阵应用到当前视频块的一部分。
2.如条款1所述的方法,其中,当前视频块的该部分是当前视频块的右上子区域、右下子区域、左下子区域或中部子区域。
3.如条款1或2所述的方法,其中,当前视频块的特性是当前视频块的帧内预测模式或一次变换矩阵。
4.如条款1所述的方法,其中,特性是当前视频块的色彩分量。
5.如条款4所述的方法,其中,为当前视频块的亮度分量选择第一变换集,并且其中,为当前视频块的一个或多个色度分量选择与第一变换集不同的第二变换集。
6.如条款1所述的方法,其中,特性是当前视频块的帧内预测模式或帧内编解码方法。
7.如条款6所述的方法,其中,帧内预测方法包括基于多个参考行(MRL)的预测方法或基于矩阵的帧内预测方法。
8.如条款6所述的方法,其中,当当前视频块是跨分量线性模型(CCLM)编解码的块时,选择第一变换集,并且其中,当当前视频块是非CCLM编解码的块时,选择与第一变换集不同的第二变换集。
9.如条款6所述的方法,其中,当当前视频块是以联合色度残差编解码方法编解码的时,选择第一变换集,并且其中,当当前视频块不是以联合色度残差编解码方法编解码的时,选择与第一变换集不同的第二变换集。
10.如条款1所述的方法,其中,特性是当前视频块的一次变换。
11.一种视频处理的方法,包括:基于与当前视频块相关联的一个或多个系数,做出决定,该决定关于选择性包括信令通知边信息以将缩减二次变换(RST)应用到当前视频块的比特流表示中;以及基于该决定执行当前视频块与包括当前视频块的比特流表示的视频之间的转换。
12.如条款11所述的方法,其中,一个或多个系数包括当前视频块的扫描顺序中最后一个非零系数。
13.如条款11所述的方法,其中,一个或多个系数包括当前视频块的部分区域内的多个系数。
14.如条款13所述的方法,其中,部分区域包括可应用RST的一个或多个编解码组。
15.如条款13所述的方法,其中,部分区域包括当前视频块的扫描顺序中前M个编解码组或后M个编解码组。
16.如条款13所述的方法,其中,部分区域包括当前视频块的相反扫描顺序中前M个编解码组或后M个编解码组。
17.如条款13所述的方法,其中,基于多个系数中的一个或多个非零系数的能量进一步作出决定。
18.一种视频处理的方法,包括:配置当前视频块的比特流表示以将缩减二次变换(RST)应用到当前视频块,其中,在编解码残差信息之前在比特流表示中信令通知与RST有关的语法元素;以及基于该配置执行当前视频块与当前视频块的比特流表示之间的转换。
19.如条款18所述的方法,其中,信令通知RST有关的语法元素是基于至少一个编解码块标志或变换选择模式的使用。
20.如条款18所述的方法,其中,比特流表示排除对应于具有所有零系数的编解码组的编解码残差信息。
21.如条款18所述的方法,其中,编解码残差信息基于RST的应用。
22.一种视频处理的方法,包括:配置当前视频块的比特流表示以将缩减二次变换(RST)应用到当前视频块,其中,在变换跳过指示或多个变换集(MTS)索引之前在比特流表示中信令通知与RST有关的语法元素;以及基于该配置执行当前视频块与当前视频块的比特流表示之间的转换。
23.如条款22所述的方法,其中,变换跳过指示或MTS索引基于RST有关的语法元素。
24.一种视频处理的方法,包括:基于当前视频块的特性来配置上下文模型以对缩减二次变换(RST)的索引进行编解码;以及基于该配置执行当前视频块与包括当前视频块的视频的比特流表示之间的转换。
25.如条款24所述的方法,其中,特性是显式或隐式启用多个变换选择(MTS)过程。
26.如条款24所述的方法,其中,特性是在当前视频块中启用跨分量线性模型(CCLM)编解码模式。
27.如条款24所述的方法,其中,特性是当前视频块的尺寸。
28.如条款24所述的方法,其中,特性是应用到当前视频块的分割过程的划分深度。
29.如条款28所述的方法,其中,分割过程是四叉树(QT)分割过程、二叉树(BT)分割过程或三叉树(TT)分割过程。
30.如条款24所述的方法,其中,特性是当前视频块的色彩格式或色彩分量。
31.如条款24所述的方法,其中,特性排除当前视频块的帧内预测模式和多个变换选择(MTS)过程的索引。
32.一种视频处理的方法,包括:基于当前视频块的特性做出决定,该决定关于将反向缩减二次变换(RST)选择性应用在当前视频块上;以及基于该决定执行当前视频块与包括当前视频块的视频的比特流表示之间的转换。
33.如条款32所述的方法,其中,特性是当前视频块的编解码组的编解码块标志。
34.如条款33所述的方法,其中,不应用反向RST过程,并且其中,左上编解码组的编解码块标志为零。
35.如条款33所述的方法,其中,不应用反向RST过程,并且其中,当前视频块的扫描顺序中第一和第二编解码组的编解码块标志为零。
36.如条款32所述的方法,其中,特性是当前视频块的高度(M)或宽度(N)。
37.如条款36所述的方法,其中,不应用反向RST过程,并且其中,(i)M=8和N=4,或者(ii)M=4和N=8。
38.一种视频处理的方法,包括:基于当前视频块的特性做出决定,该决定关于将反向缩减二次变换(RST)选择性应用在当前视频块上;以及基于该决定执行当前视频块与包括当前视频块的视频的比特流表示之间的转换;其中,比特流表示包括关于RST的边信息,其中,基于当前视频块的单个色彩分量或亮度分量而包括边信息。
39.如条款38所述的方法,其中,进一步基于当前视频块的维度包括边信息。
40.如条款38或39中任一项所述的方法,其中,在不考虑当前视频块的块信息的情况下包括边信息。
41.如条款1至40中任一项所述的方法,其中,转换包括从当前视频块生成比特流表示。
42.如条款1至40中任一项所述的方法,其中,转换包括从比特流表示生成当前视频块。
43.一种视频系统中的设备,包括处理器和其上具有指令的非暂时性存储器,其中,指令在由处理器执行时使得处理器实现条款1至42中任一项所述的方法。
44.一种非暂时性计算机可读介质上存储的计算机程序产品,该计算机程序产品包括用于实行条款1至42中任一项所述的方法的程序代码。
第二组条款描述先前章节中所公开的技术的某些特征和方面,例如示例项目4和5。
1.一种视频处理的方法,包括:对于视频的视频单元的当前视频块与视频的编解码表示之间的转换,为使用一定的帧内预测模式编解码的视频单元确定默认帧内预测模式,使得在不沿着方向外推当前视频块的邻域像素的情况下生成当前视频块的预测块;并且基于该确定执行转换。
2.如条款1所述的方法,其中,所述视频单元对应于编解码单元、预测单元、编解码块或预测块。
3.如条款1所述的方法,其中,所述视频单元是使用基于矩阵的帧内预测(MIP)来编解码的,所述基于矩阵的帧内预测使用矩阵矢量乘法生成所述预测块。
4.如条款1所述的方法,其中,所述视频单元是使用帧内块复制(IBC)模式来编解码的,所述帧内块复制模式至少使用指向含有所述当前视频块的视频帧的块矢量来生成所述预测块。
5.如条款1所述的方法,其中,所述视频单元是使用调色板模式来编解码的,所述调色板模式允许使用代表性样点值的调色板来表示或重构所述当前视频块。
6.如条款1所述的方法,其中,所述默认帧内预测模式是基于所述当前视频块的编解码模式确定的。
7.如条款1所述的方法,其中,关于所述默认帧内预测模式的信息被包括在所述编解码表示中。
8.如条款1所述的方法,其中,导出而不是信令通知关于所述默认帧内预测模式的信息。
9.如条款1所述的方法,其中,所述确定默认帧内预测模式还用在色度导出模式(DM)的导出中。
10.如条款1所述的方法,其中,所述确定默认帧内预测模式还用于预测所述视频的其他块的帧内预测模式。
11.如条款1所述的方法,其中,所述确定向一个色彩分量的所述当前视频块分配的默认帧内预测模式用在另一个色彩分量的变换集或变换索引的导出中。
12.如条款1所述的方法,其中,所述默认帧内预测模式与所述视频的块的预测模式一起存储。
13.如条款1所述的方法,其中,不将所述默认帧内预测模式分配给帧间编解码块。
14.如条款1所述的方法,其中,所述默认帧内预测模式是平面帧内预测模式。
15.一种视频处理的方法,包括:使用规则来确定视频的亮度块覆盖所述视频的色度块的预定位置;以及基于所述确定执行所述视频与所述视频的编解码表示之间的转换,其中,以使用帧内预测模式的所述编解码表示来表示色度块。
16.如条款15所述的方法,其中,所述执行所述转换包括检验所述亮度块的预测模式或编解码模式并提取所述亮度块的帧内预测模式。
17.如条款15所述的方法,其中,所述亮度块包括以与所述色度块的中部处的色度样点对应定位的亮度样点。
18.如条款15所述的方法,其中,所述亮度块包括以与所述色度块的左上方处的色度样点对应定位的亮度样点。
19.一种视频处理的方法,包括:使用规则来基于与色度块对应的亮度块的编解码模式导出视频的所述色度块的帧内预测模式;以及基于所导出的帧内预测模式来执行所述亮度块与所述视频的编解码表示之间的转换,并且其中,所述规则指定使用默认帧内预测模式以防所述亮度块的编解码模式是一定的帧内预测模式,其中,在不沿着方向外推所述亮度块的邻域像素的情况下生成所述亮度块的预测块。
20.如条款19所述的方法,其中,所述规则指定使用解码的帧内预测模式,以防所述亮度块的编解码模式不是所述一定的帧内预测模式。
21.如条款19所述的方法,其中,所述亮度块的编解码模式对应于基于矩阵的帧内预测(MIP),所述基于矩阵的帧内预测使用矩阵矢量乘法生成所述预测块。
22.如条款21所述的方法,其中,所述解码的帧内预测模式是平面帧内预测模式。
23.如条款19所述的方法,其中,所述亮度块的编解码模式对应于帧内块复制(IBC)模式,所述帧内块复制模式至少使用指向含有当前视频块的视频帧的块矢量来生成所述预测块。
24.如条款19所述的方法,其中,所述亮度块的编解码模式对应于调色板模式,所述调色板模式允许使用代表性样点值的调色板来表示或重构当前视频块。
25.如条款23或24所述的方法,其中,所述解码的帧内预测模式是DC帧内预测模式。
26.如条款1至25中任一项所述的方法,其中,所述执行所述转换包括向所述当前视频块应用二次变换工具,并且其中,使用所述二次变换工具:编码期间,在量化之前将前向二次变换应用到向所述当前视频块的残差应用的前向一次变换的输出,或者解码期间,在应用反向一次变换之前将反向二次变换应用到所述当前视频块的去量化的输出。
27.如条款1至26中任一项所述的方法,其中,所述执行所述转换包括从所述视频生成所述编解码表示。
28.如条款1至26中任一项所述的方法,其中,所述执行所述转换包括从所述编解码表示生成所述视频。
29.一种视频处理设备,包括处理器,配置为实现条款1至28中任一项或多项所述的方法。
30.一种存储程序代码的计算机可读介质,所述程序代码在执行时使得处理器实现条款1至28中任一项或多项所述的方法。
第三组条款描述先前章节中所公开的技术的某些特征和方面,例如示例项目5和6。
1.一种视频处理的方法,包括:对于视频的色度块,做出是否将非正常的色度帧内预测模式应用到视频的所述色度块的第一确定;对于对应于色度块的亮度块,做出将亮度帧内预测模式应用到亮度块的第二确定;基于亮度帧内预测模式做出将变换集或变换矩阵应用到色度块的第三确定;以及根据第三确定执行视频与视频的编解码表示之间的转换,并且其中,非正常的色度帧内预测模式包括在不使用沿着色度预测方向外推的邻域像素值的情况下编解码色度块。
2.如条款1所述的方法,其中,变换集或变换矩阵用在应用到色度块的二次变换工具中。
3.如条款2所述的方法,其中,二次变换工具对应于低频不可分变换(LFNST)工具,并且其中,使用二次变换工具:编码期间,在量化之前将前向二次变换应用到向色度块的残差应用的前向一次变换的输出,或者解码期间,在应用反向一次变换之前将反向二次变换应用到色度块的去量化的输出。
4.如条款1所述的方法,其中,非正常的色度帧内预测模式对应于跨分量线性模型(CCLM)预测模式,该模式使用线性模式来从另一个分量导出色度分量的预测值。
5.如条款1所述的方法,其中,亮度块覆盖与定位在色度块的预定义位置处的色度样点对应的亮度样点。
6.如条款1所述的方法,其中,亮度块覆盖与色度块的中部色度样点对应的亮度样点。
7.如条款1所述的方法,其中,亮度块覆盖与当前视频块的左上色度样点对应的亮度样点。
8.如条款1所述的方法,其中,亮度帧内预测是非正常的亮度帧内预测模式,并且其中,非正常的亮度帧内预测模式包括在不使用沿着亮度预测方向外推的邻域像素值的情况下编解码亮度块。
9.如条款8所述的方法,其中,非正常的亮度帧内预测模式对应于基于矩阵的帧内预测(MIP),该基于矩阵的帧内预测使用矩阵矢量乘法生成预测值。
10.如条款8所述的方法,其中,非正常的亮度帧内预测模式对应于帧内块复制(IBC)模式,该帧内块复制模式至少使用指向含有亮度块的视频帧的块矢量来生成预测值。
11.如条款8所述的方法,其中,非正常的亮度帧内预测模式对应于调色板模式,该调色板模式允许使用代表性样点值的调色板来表示或重构亮度块。
12.如条款8至11中任一项所述的方法,其中,响应于亮度帧内预测模式是非正常的亮度帧内预测模式,将预定义帧内预测模式分配到色度块,并且其中,代替非正常的色度帧内预测模式,预定义帧内预测模式还用于导出应用到色度块的变换集或变换矩阵。
13.如条款12所述的方法,其中,基于亮度块的非正常的亮度帧内预测模式,确定预定义帧内预测模式。
14.如条款13所述的方法,其中,响应于非正常的亮度帧内预测模式是IBC模式或调色板模式,预定义帧内预测模式确定为DC模式。
15.如条款13所述的方法,其中,响应于非正常的亮度帧内预测模式是MIP模式,预定义帧内预测模式确定为平面模式。
16.如条款1所述的方法,其中,亮度帧内预测是正常亮度帧内预测模式,并且其中,正常亮度帧内预测模式包括使用沿着亮度预测方向外推的邻域像素值编解码亮度块。
17.如条款8所述的方法,其中,响应于亮度帧内预测模式是正常亮度帧内预测模式,将亮度帧内预测分配到色度块,并且其中,代替非正常的色度帧内预测模式,亮度帧内预测模式还用于导出应用到色度块的变换集或变换矩阵。
18.一种视频处理的方法,包括:对于视频的色度块,做出对应于色度块的亮度块是使用非正常的亮度帧内预测模式来编解码的第一确定;基于第一确定,根据规则做出色度块的变换集或变换矩阵的第二确定;以及根据第二确定执行视频与视频的编解码表示之间的转换,并且其中,该规则指定了由于亮度块是使用非正常的亮度帧内预测模式来编解码的因而与色度块相关联的一个或多个默认模式或默认变换集确定变换集或变换矩阵,以防色度块是使用非正常的色度帧内预测模式来编解码的,其中,非正常的亮度帧内预测模式包括在不使用沿着色度预测方向外推的邻域像素值的情况下编解码亮度块。
19.如条款18所述的方法,其中,非正常的色度帧内预测模式对应于跨分量线性模型(CCLM)预测模式,该模式使用线性模式来从另一个分量导出色度分量的预测值。
20.如条款18所述的方法,其中,非正常的亮度帧内预测模式对应于基于矩阵的帧内预测(MIP),该基于矩阵的帧内预测使用矩阵矢量乘法生成预测值。
21.如条款18所述的方法,其中,非正常的亮度帧内预测模式对应于帧内块复制(IBC)模式,该帧内块复制模式至少使用指向含有亮度块的视频帧的块矢量来生成预测值。
22.如条款18所述的方法,其中,非正常的亮度帧内预测模式对应于调色板模式,该调色板模式允许使用代表性样点值的调色板来表示或重构亮度块。
23.如条款18所述的方法,其中,亮度块覆盖与定位在色度块的预定义位置处的色度样点对应的亮度样点。
24.如条款18所述的方法,其中,亮度块覆盖与色度块的中部色度样点对应的亮度样点。
25.如条款18所述的方法,其中,亮度块覆盖与当前视频块的左上色度样点对应的亮度样点。
26.如条款18所述的方法,其中,规则指定是使用默认变换集或默认变换矩阵中的至少一个还是基于亮度块的编解码模式从亮度块的帧内亮度预测模式导出变换集或变换矩阵。
27.如条款18所述的方法,其中,规则指定根据亮度块的帧内亮度预测模式导出变换集或变换矩阵,因为亮度块是使用正常帧内预测模式编码的,该正常帧内预测模式通过外推亮度块的邻域像素生成亮度块的预测块。
28.如条款18所述的方法,其中,规则指定根据亮度块的帧内亮度预测模式导出变换集或变换矩阵,因为亮度块是使用基于块增量脉冲编解码调制(BDPCM)模式编码的。
29.如条款26所述的方法,其中,规则指定使用默认变换集或默认变换矩阵中的至少一个,因为亮度块是使用非正常的亮度帧内预测模式编码的。
30.一种视频处理的方法,包括:对于视频的当前视频块与视频的编解码表示之间的转换,基于以下中的至少一个确定向一个色彩分量的当前视频块应用的二次变换工具的适用性:1)另一个色彩分量的对应块的编解码模式,或2)当前视频块的编解码模式;以及基于确定执行转换,并且其中,使用二次变换工具:编码期间,在量化之前将前向二次变换应用到向当前视频块的残差应用的前向一次变换的输出,或者解码期间,在应用反向一次变换之前将反向二次变换应用到当前视频块的去量化的输出。
31.如条款30所述的方法,其中,二次变换工具对应于低频不可分变换(LFNST)工具。
32.如条款30所述的方法,其中,当前视频块对应于色度块,并且对应块与对应于色度块的亮度块相对应。
33.如条款31所述的方法,其中,确定确定了将二次变换工具应用到当前视频块,因为对应块的编解码模式是i)正常帧内预测模式,该正常帧内预测模式包括使用沿着预测方向外推的邻域像素值编码对应块,和/或ii)基于块的增量脉冲编解码调制(BDPCM)模式。
34.如条款31所述的方法,其中,确定确定了对当前视频块禁用二次变换工具,因为对应块的编解码模式是非正常的帧内预测模式,该非正常的帧内预测模式包括在不使用沿着预测方向外推的邻域像素值的情况下编码对应块。
35.如条款30所述的方法,其中,当前视频块的编解码模式对应于跨分量线性模型(CCLM)预测模式,该预测模式使用线性模式来从另一个分量导出色度分量的预测值。
36.一种视频处理的方法,包括:对于视频的色度块,做出使用非正常的亮度帧内预测模式对覆盖色度块的预定义位置的亮度块进行编码的第一确定;基于第一确定,由于亮度块是使用非正常的亮度帧内预测模式编码的而做出将预定义帧内预测模式应用到亮度块的第二确定;以及根据第二确定来执行视频与视频的编解码表示的转换,其中,非正常的亮度帧内预测模式包括在不是使用沿着亮度预测方向外推的邻域像素值的情况下编码亮度块。
37.如条款36所述的方法,其中,在应用到色度块的二次变换工具中所使用的变换集或变换矩阵是基于预定义帧内预测模式选择的。
38.如条款36所述的方法,其中,二次变换工具对应于低频不可分变换(LFNST)工具,并且其中,使用二次变换工具:编码期间,在量化之前将前向二次变换应用到向色度块的残差应用的前向一次变换的输出,或者解码期间,在应用反向一次变换之前将反向二次变换应用到色度块的去量化的输出。
39.如条款36至38中任一项所述的方法,其中,应用到色度块的预定义帧内预测模式取决于亮度块的非正常的亮度帧内预测模式。
40.如条款36至38中任一项所述的方法,其中,预定义帧内预测模式对应于以下模式中的至少一个:DC模式、平面模式、垂直模式、水平模式、45度模式或135度模式。
41.如条款36至38中任一项所述的方法,其中,非正常的亮度帧内预测模式对应于以下模式中的至少一个:帧内块复制(IBC)模式、调色板模式、基于矩阵的帧内预测(MIP)、或基于块的增量脉冲编解码调制(BDPCM)模式。
42.如条款36至38中任一项所述的方法,其中,以防非正常的亮度帧内预测模式对应于基于矩阵的帧内预测(MIP)模式,基于MIP模式和亮度块的维度将MIP模式映射到指定的帧内预测模式。
43.如条款36至38中任一项所述的方法,其中,在候选之中选择预定义帧内预测模式。
44.如条款36至38中任一项所述的方法,其中,信令通知预定义帧内预测模式。
45.如条款36至38中任一项所述的方法,其中,导出预定义帧内预测模式。
46.一种视频处理的方法,包括:对于视频的色度块,做出使用正常亮度帧内预测模式对覆盖色度块的预定义位置的亮度块进行编码的第一确定;基于第一确定,做出第二确定以基于亮度块的正常亮度帧内预测模式导出色度帧内预测模式;以及根据第二确定来执行视频与视频的编解码表示的转换,其中,正常亮度帧内预测模式包括使用沿着亮度预测方向外推的邻域像素值编码亮度块。
47.如条款46所述的方法,其中,在应用到色度块的二次变换工具中所使用的变换集或变换矩阵是基于色度帧内预测模式选择的。
48.如条款46所述的方法,其中,二次变换工具对应于低频不可分变换(LFNST)工具,并且其中,使用二次变换工具:编码期间,在量化之前将前向二次变换应用到向当前视频块的残差应用的前向一次变换的输出,或者解码期间,在应用反向一次变换之前将反向二次变换应用到当前视频块的去量化的输出。
49.如条款46至48中任一项所述的方法,其中,亮度块包括以与色度块的中部处的色度样点对应定位的亮度样点。
50.如条款46至48中任一项所述的方法,其中,亮度块包括以与所述色度块的左上方处的色度样点对应定位的亮度样点。
51.如条款1至50中任一项所述的方法,其中,执行转换包括从视频生成编解码表示或者从编解码表示生成视频。
52.一种视频处理设备,包括处理器,配置为实现条款1至51中任一项或多项所述的方法。
53.一种存储程序代码的计算机可读介质,所述程序代码在执行时使得处理器实现条款1至51中任一项或多项所述的方法。
根据前述,将理解出于图示的目的已经描述本公开的技术的指定实施例,但是可以做出各种修改而不会偏离本发明的范围。相应地,本公开的技术不限于如所附权利要求所主张的。
本专利文档中所描述的主题的实现方式和功能性操作可以被实现在各种系统、数字电子电路中或者在计算机软件、固件或硬件中,包含本说明书中所公开的结构以及其结构的等同物,或者它们中的一个或多个的组合。本说明书中所描述的主题的实现方式可以被实现为一个或多个计算机程序产品,即在有形且非易失性计算机可读介质上所编码的计算机程序指令的一个或多个模块,用于由数据处理设备执行或者控制数据处理设备的操作。该计算机可读介质可以是机器可读存储装置、机器可读存储基板、存储器装置、影响机器可读可传播信号的复合物、或其一个或多个的组合。术语“数据处理单元”或“数据处理设备”涵盖用于处理数据的所有设备、装置和机器,包括例如可编程处理器、计算机或多个处理器或计算机。除了硬件之外,该装置还可以包括为所讨论的计算机程序创建执行环境的代码,例如,构成处理器固件、协议栈、数据库管理系统、操作系统、或者它们中的一个或多个的组合的代码。
计算机程序(也称为程序、软件、软件应用、脚本或代码)可以用任何形式的编程语言编写,包括编译或解释语言,并且可以以任何形式来部署计算机程序,包括独立程序或适合在计算环境中使用的模块、组件、子例程或其它单元。计算机程序不必须对应于文件系统中的文件。程序可以存储在保存其他程序或数据的文件的部分中(例如,在标记语言文档中存储的一个或多个脚本)、在专用于所讨论的程序的单个文件中、或在多个协同文件中(例如存储一个或多个模块、子程序或代码部分的文件)。计算机程序可以部署为在一个计算机上或者在多个计算机上执行,该多个计算机位于一个站点处或者分布跨越多个站点并由通信网络互连。
本说明书中描述的过程和逻辑流程可以由执行一个或多个计算机程序以通过对输入数据进行操作并生成输出来执行功能的一个或多个可编程处理器来执行。过程和逻辑流也可以由专用逻辑电路(例如FPGA(现场可编程门阵列)或ASIC(专用集成电路))执行,并且设备可以实现为专用逻辑电路(例如FPGA(现场可编程门阵列)或ASIC(专用集成电路))。
适合于计算机程序的执行的处理器包括例如通用和专用微处理器两者,以及任何类型的数字计算机的任何一个或多个处理器。通常,处理器将从只读存储器或随机存取存储器或者该两者接收指令和数据。计算机的基本元件是用于执行指令的处理器和用于存储指令和数据的一个或多个存储器装置。通常,计算机还将包括用于存储数据的一个或多个海量存储装置(例如磁、磁光盘或光盘),或者可操作地耦合以从海量存储装置(例如磁、磁光盘或光盘)接收数据或者将数据传输到海量存储装置(例如磁、磁光盘或光盘),或者以上两者。但是,计算机不必具有这样的装置。适用于存储计算机程序指令和数据的计算机可读介质包含所有形式的非易失性存储器、介质和存储器装置,包含例如半导体存储器装置(例如EPROM、EEPROM和闪速存储器装置)。处理器和存储器可以由专用逻辑电路补充,或者合并在专用逻辑电路中。
旨在说明书与附图一起仅被示例性地考虑,其中示例性意味着示例。如本文所使用的,除非上下文明确指示,否则“或”的使用旨在包括“和/或”。
虽然本专利文档包含许多细节,但这些细节不应被解释为对任何发明或可要求保护的范围的限制,而是作为指定于特定发明的特定实施例的特征的描述。在本专利文档中,在单独的实施例的上下文中描述的某些特征也可以在单个实施例中组合实现。相反地,在单个实施例的上下文中所描述的各种特征还可以分别在多个实施例中来实现或者以各种合适的子组合来实现。此外,尽管特征可以如上文描述为以某些组合起作用并且甚至最初同样地要求,但是在某些情况下来自所要求保护的组合的一个或多个特征可以从组合中去除,并且所要求保护的组合可以针对子组合或子组合的变化。
类似地,尽管在附图中以特定次序描绘了操作,但这不应当理解为要求按所示的特定次序或顺序次序进行这样的操作或者进行所有示出的操作,以实现期望的结果。此外,在本专利文档中描述的实施例中的各种系统组件的分开不应被理解为在所有实施例中都要求这种分开。
仅描述了几个实现方式和示例,并且可以基于本专利文档中描述和示出的内容来做出其它实现方式、增强和变型。

Claims (42)

1.一种处理视频数据的方法,包括:
在视频的当前色度块与所述视频的比特流之间的转换期间,做出第一确定,所述第一确定是使用跨分量线性模型帧内预测模式对所述当前色度块进行编解码;
做出第二确定,所述第二确定是在亮度块的编解码模式是指定编解码模式的情况下,在用于所述当前色度块的二次变换过程中采用预定义帧内预测模式,其中所述亮度块覆盖定位为与所述当前色度块的中部处的色度样点对应的亮度样点;
基于所述预定义帧内预测模式确定用于所述二次变换过程的变换集;以及
基于所述变换集执行所述转换,
其中,在所述二次变换过程期间:
对于编码,在量化之前将前向二次变换应用到向所述当前色度块的残差应用的前向一次变换的输出,或者
对于解码,在应用反向一次变换之前将反向二次变换应用到所述当前色度块的去量化的输出。
2.根据权利要求1所述的方法,其中,在所述亮度块的指定编解码模式是基于矩阵的帧内预测(MIP)模式的情况下,所述预定义帧内预测模式被确定为平面帧内预测模式,其中所述基于矩阵的帧内预测模式使用矩阵矢量乘法来生成所述亮度块的预测样点。
3.根据权利要求1所述的方法,其中,在所述亮度块的指定编解码模式是帧内块复制(IBC)模式的情况下,所述预定义帧内预测模式被确定为DC帧内预测模式,其中所述帧内块复制模式从由块矢量确定的相同视频区域的样点值的块导出所述亮度块的预测样点。
4.根据权利要求1所述的方法,其中,在所述亮度块的指定编解码模式是调色板模式的情况下,所述预定义帧内预测模式被确定为DC帧内预测模式,其中所述调色板模式允许使用代表性样点值的调色板来表示或重构所述亮度块。
5.根据权利要求1所述的方法,其中,在所述亮度块的指定编解码模式既不是基于矩阵的帧内预测(MIP)模式、也不是帧内块复制(IBC)模式、也不是调色板模式的情况下,在确定所述变换集时采用所述亮度块的亮度帧内预测模式。
6.根据权利要求1所述的方法,其中,所述变换集是从预定义变换集选择表中选择的,并且其中,表示为IntraPredMode的用于访问所述变换集选择表的索引在所述亮度块使用所述指定编解码模式进行编解码的情况下等于所述预定义帧内预测模式,或者在所述亮度块不使用所述指定编解码模式进行编解码的情况下等于所述亮度块的亮度帧内预测模式。
7.根据权利要求6所述的方法,其中,所述预定义变换集选择表如下:
所述预定义变换集选择表
IntraPredMode 变换集索引 IntraPredMode<0 1 0<=IntraPredMode<=1 0 2<=IntraPredMode<=12 1 13<=IntraPredMode<=23 2 24<=IntraPredMode<=44 3 45<=IntraPredMode<=55 2 56<=IntraPredMode 1
并且其中,所述IntraPredMode的范围为[-14,80]。
8.根据权利要求1所述的方法,其中,在最后一个非零系数不位于应用所述二次变换的所述当前色度块的区域中的情况下,对所述当前色度块禁用所述二次变换。
9.根据权利要求1所述的方法,其中,所述二次变换对应于低频不可分变换(LFNST)工具。
10.根据权利要求1所述的方法,其中,所述转换包括将所述当前色度块编码到所述比特流中。
11.根据权利要求1所述的方法,其中,所述转换包括从所述比特流解码所述当前色度块。
12.一种用于处理视频数据的装置,包括处理器和其上具有指令的非暂时性存储器,其中所述指令在由所述处理器执行时使所述处理器:
在视频的当前色度块与所述视频的比特流之间的转换期间,做出第一确定,所述第一确定是使用跨分量线性模型帧内预测模式对所述当前色度块进行编解码;
做出第二确定,所述第二确定是在亮度块的编解码模式是指定编解码模式的情况下,在用于所述当前色度块的二次变换过程中采用预定义帧内预测模式,其中所述亮度块覆盖定位为与所述当前色度块的中部处的色度样点对应的亮度样点;
基于所述预定义帧内预测模式确定用于所述二次变换过程的变换集;以及
基于所述变换集执行所述转换,
其中,在所述二次变换过程期间:
对于编码,在量化之前将前向二次变换应用到向所述当前色度块的残差应用的前向一次变换的输出,或者
对于解码,在应用反向一次变换之前将反向二次变换应用到所述当前色度块的去量化的输出。
13.根据权利要求12所述的装置,其中,在所述亮度块的指定编解码模式是基于矩阵的帧内预测(MIP)模式的情况下,所述预定义帧内预测模式被确定为平面帧内预测模式,其中所述基于矩阵的帧内预测模式使用矩阵矢量乘法来生成所述亮度块的预测样点;
其中,在所述亮度块的指定编解码模式是帧内块复制(IBC)模式的情况下,所述预定义帧内预测模式被确定为DC帧内预测模式,其中所述帧内块复制模式从由块矢量确定的相同视频区域的样点值的块导出所述亮度块的预测样点;
其中,在所述亮度块的指定编解码模式是调色板模式的情况下,所述预定义帧内预测模式被确定为DC帧内预测模式,其中所述调色板模式允许使用代表性样点值的调色板来表示或重构所述亮度块;或者
其中,在所述亮度块的指定编解码模式既不是基于矩阵的帧内预测(MIP)模式、也不是帧内块复制(IBC)模式、也不是调色板模式的情况下,在确定所述变换集时采用所述亮度块的亮度帧内预测模式。
14.根据权利要求12所述的装置,其中,所述变换集是从预定义变换集选择表中选择的,并且其中,表示为IntraPredMode的用于访问所述变换集选择表的索引在所述亮度块使用所述指定编解码模式进行编解码的情况下等于所述预定义帧内预测模式,或者在所述亮度块不使用所述指定编解码模式进行编解码的情况下等于所述亮度块的亮度帧内预测模式;
其中,所述预定义变换集选择表如下:
所述预定义变换集选择表
IntraPredMode 变换集索引 IntraPredMode<0 1 0<=IntraPredMode<=1 0 2<=IntraPredMode<=12 1 13<=IntraPredMode<=23 2 24<=IntraPredMode<=44 3 45<=IntraPredMode<=55 2 56<=IntraPredMode 1
并且其中,所述IntraPredMode的范围为[-14,80];
其中,在最后一个非零系数不位于应用所述二次变换的所述当前色度块的区域中的情况下,对所述当前色度块禁用所述二次变换;并且
其中,所述二次变换对应于低频不可分变换(LFNST)工具。
15.一种存储指令的非暂时性计算机可读存储介质,所述指令使处理器:
在视频的当前色度块与所述视频的比特流之间的转换期间,做出第一确定,所述第一确定是使用跨分量线性模型帧内预测模式对所述当前色度块进行编解码;
做出第二确定,所述第二确定是在亮度块的编解码模式是指定编解码模式的情况下,在用于所述当前色度块的二次变换过程中采用预定义帧内预测模式,其中所述亮度块覆盖定位为与所述当前色度块的中部处的色度样点对应的亮度样点;
基于所述预定义帧内预测模式确定用于所述二次变换过程的变换集;以及
基于所述变换集执行所述转换,
其中,在所述二次变换过程期间:
对于编码,在量化之前将前向二次变换应用到向所述当前色度块的残差应用的前向一次变换的输出,或者
对于解码,在应用反向一次变换之前将反向二次变换应用到所述当前色度块的去量化的输出。
16.根据权利要求15所述的非暂时性计算机可读存储介质,其中,在所述亮度块的指定编解码模式是基于矩阵的帧内预测(MIP)模式的情况下,所述预定义帧内预测模式被确定为平面帧内预测模式,其中所述基于矩阵的帧内预测模式使用矩阵矢量乘法来生成所述亮度块的预测样点;
其中,在所述亮度块的指定编解码模式是帧内块复制(IBC)模式的情况下,所述预定义帧内预测模式被确定为DC帧内预测模式,其中所述帧内块复制模式从由块矢量确定的相同视频区域的样点值的块导出所述亮度块的预测样点;
其中,在所述亮度块的指定编解码模式是调色板模式的情况下,所述预定义帧内预测模式被确定为DC帧内预测模式,其中所述调色板模式允许使用代表性样点值的调色板来表示或重构所述亮度块;或者
其中,在所述亮度块的指定编解码模式既不是基于矩阵的帧内预测(MIP)模式、也不是帧内块复制(IBC)模式、也不是调色板模式的情况下,在确定所述变换集时采用所述亮度块的亮度帧内预测模式。
17.根据权利要求15所述的非暂时性计算机可读存储介质,其中,所述变换集是从预定义变换集选择表中选择的,并且其中,表示为IntraPredMode的用于访问所述变换集选择表的索引在所述亮度块使用所述指定编解码模式进行编解码的情况下等于所述预定义帧内预测模式,或者在所述亮度块不使用所述指定编解码模式进行编解码的情况下等于所述亮度块的亮度帧内预测模式;
其中,所述预定义变换集选择表如下:
所述预定义变换集选择表
IntraPredMode 变换集索引 IntraPredMode<0 1 0<=IntraPredMode<=1 0 2<=IntraPredMode<=12 1 13<=IntraPredMode<=23 2 24<=IntraPredMode<=44 3 45<=IntraPredMode<=55 2 56<=IntraPredMode 1
并且其中,所述IntraPredMode的范围为[-14,80];
其中,在最后一个非零系数不位于应用所述二次变换的所述当前色度块的区域中的情况下,对所述当前色度块禁用所述二次变换;并且
其中,所述二次变换对应于低频不可分变换(LFNST)工具。
18.一种存储视频的比特流的非暂时性计算机可读记录介质,所述视频的比特流由视频处理装置执行的方法生成,其中所述方法包括:
做出第一确定,所述第一确定是使用跨分量线性模型帧内预测模式对所述视频的当前色度块进行编解码;
做出第二确定,所述第二确定是在亮度块的编解码模式是指定编解码模式的情况下,在用于所述当前色度块的二次变换过程中采用预定义帧内预测模式,其中所述亮度块覆盖定位为与所述当前色度块的中部处的色度样点对应的亮度样点;
基于所述预定义帧内预测模式确定用于所述二次变换过程的变换集;以及
基于所述变换集生成所述比特流,
其中,在所述二次变换过程期间:
对于编码,在量化之前将前向二次变换应用到向所述当前色度块的残差应用的前向一次变换的输出,或者
对于解码,在应用反向一次变换之前将反向二次变换应用到所述当前色度块的去量化的输出。
19.根据权利要求18所述的非暂时性计算机可读记录介质,其中,在所述亮度块的指定编解码模式是基于矩阵的帧内预测(MIP)模式的情况下,所述预定义帧内预测模式被确定为平面帧内预测模式,其中所述基于矩阵的帧内预测模式使用矩阵矢量乘法来生成所述亮度块的预测样点;
其中,在所述亮度块的指定编解码模式是帧内块复制(IBC)模式的情况下,所述预定义帧内预测模式被确定为DC帧内预测模式,其中所述帧内块复制模式从由块矢量确定的相同视频区域的样点值的块导出所述亮度块的预测样点;
其中,在所述亮度块的指定编解码模式是调色板模式的情况下,所述预定义帧内预测模式被确定为DC帧内预测模式,其中所述调色板模式允许使用代表性样点值的调色板来表示或重构所述亮度块;或者
其中,在所述亮度块的指定编解码模式既不是基于矩阵的帧内预测(MIP)模式、也不是帧内块复制(IBC)模式、也不是调色板模式的情况下,在确定所述变换集时采用所述亮度块的亮度帧内预测模式。
20.根据权利要求18所述的非暂时性计算机可读记录介质,其中,所述变换集是从预定义变换集选择表中选择的,并且其中,表示为IntraPredMode的用于访问所述变换集选择表的索引在所述亮度块使用所述指定编解码模式进行编解码的情况下等于所述预定义帧内预测模式,或者在所述亮度块不使用所述指定编解码模式进行编解码的情况下等于所述亮度块的亮度帧内预测模式;
其中,所述预定义变换集选择表如下:
所述预定义变换集选择表
IntraPredMode 变换集索引 IntraPredMode<0 1 0<=IntraPredMode<=1 0 2<=IntraPredMode<=12 1 13<=IntraPredMode<=23 2 24<=IntraPredMode<=44 3 45<=IntraPredMode<=55 2 56<=IntraPredMode 1
并且其中,所述IntraPredMode的范围为[-14,80];
其中,在最后一个非零系数不位于应用所述二次变换的所述当前色度块的区域中的情况下,对所述当前色度块禁用所述二次变换;并且
其中,所述二次变换对应于低频不可分变换(LFNST)工具。
21.一种用于存储视频的比特流的方法,包括:
做出第一确定,所述第一确定是使用跨分量线性模型帧内预测模式对所述视频的当前色度块进行编解码;
做出第二确定,所述第二确定是在亮度块的编解码模式是指定编解码模式的情况下,在用于所述当前色度块的二次变换过程中采用预定义帧内预测模式,其中所述亮度块覆盖定位为与所述当前色度块的中部处的色度样点对应的亮度样点;
基于所述预定义帧内预测模式确定用于所述二次变换过程的变换集;
基于所述变换集生成所述比特流;以及
将所述比特流存储到非暂时性计算机可读记录介质中,
其中,在所述二次变换过程期间:
对于编码,在量化之前将前向二次变换应用到向所述当前色度块的残差应用的前向一次变换的输出,或者
对于解码,在应用反向一次变换之前将反向二次变换应用到所述当前色度块的去量化的输出。
22.一种处理视频数据的方法,包括:
在视频的视频单元的当前色度块与所述视频的比特流之间的转换期间,确定在亮度块的编解码模式是指定编解码模式的情况下,在用于所述当前色度块的色度帧内预测模式的导出过程中采用默认帧内预测模式,其中所述亮度块覆盖定位为与所述当前色度块的中部处的色度样点对应的亮度样点;
基于所述默认帧内预测模式,导出用于所述当前色度块的所述色度帧内预测模式;以及
基于所述色度帧内预测模式执行所述转换。
23.根据权利要求22所述的方法,其中,在所述亮度块的指定编解码模式是基于矩阵的帧内预测(MIP)模式的情况下,所述默认帧内预测模式被确定为平面帧内预测模式,其中所述基于矩阵的帧内预测模式使用矩阵矢量乘法来生成所述亮度块的预测样点。
24.根据权利要求22所述的方法,其中,在所述亮度块的指定编解码模式是帧内块复制(IBC)模式的情况下,所述默认帧内预测模式被确定为DC帧内预测模式,其中所述帧内块复制模式从由块矢量确定的相同视频区域的样点值的块导出所述亮度块的预测样点。
25.根据权利要求22所述的方法,其中,在所述亮度块的指定编解码模式是调色板模式的情况下,所述默认帧内预测模式被确定为DC帧内预测模式,其中所述调色板模式允许使用代表性样点值的调色板来表示或重构所述亮度块。
26.根据权利要求22所述的方法,其中,在所述亮度块的指定编解码模式既不是基于矩阵的帧内预测(MIP)模式、也不是帧内块复制(IBC)模式、也不是调色板模式的情况下,在用于所述当前色度块的所述色度帧内预测模式的导出过程中利用所述亮度块的亮度帧内预测模式。
27.根据权利要求22所述的方法,其中,使用第一标志(cclm_mode_flag)、第二标志(cclm_mode_idx)、第三标志(intra_chroma_pred_mode)和表示为lumaIntraPredMode的变量来导出所述色度帧内预测模式,所述第一标志(cclm_mode_flag)指示跨分量线性模型预测模式是否应用于所述当前色度块,所述第二标志(cclm_mode_idx)指示INTRA_LT_CCLM、INTRA_L_CCLM和INTRA_T_CCLM色度帧内预测模式中的哪一者应用于所述当前色度块,所述第三标志(intra_chroma_pred_mode)指示用于所述当前色度块的色度样点的帧内预测模式,表示为lumaIntraPredMode的所述变量在所述亮度块使用所述指定编解码模式进行编解码的情况下等于所述默认帧内预测模式,或者在所述亮度块不使用所述指定编解码模式进行编解码的情况下等于所述亮度块的亮度帧内预测模式。
28.根据权利要求27所述的方法,其中,使用以下表1中指定的cclm_mode_flag、cclm_mode_idx、intra_chroma_pred_mode和lumaIntraPredMode来导出所述色度帧内预测模式:
表1
29.根据权利要求28所述的方法,其中,当所述视频单元的色度格式为4:2:2时,根据预定义的映射表将表1中的色度帧内预测模式X映射到色度帧内预测模式Y,并且之后将表1中的所述色度帧内预测模式X设置为等于所述色度帧内预测模式Y。
30.根据权利要求22所述的方法,其中,所述默认帧内预测模式不分配给帧间编解码块。
31.根据权利要求22所述的方法,其中,所述转换包括将所述当前色度块编码到所述比特流中。
32.根据权利要求22所述的方法,其中,所述转换包括从所述比特流解码所述当前色度块。
33.一种用于处理视频数据的装置,包括处理器和其上具有指令的非暂时性存储器,其中所述指令在由所述处理器执行时使所述处理器:
在视频的视频单元的当前色度块与所述视频的比特流之间的转换期间,确定在亮度块的编解码模式是指定编解码模式的情况下,在用于所述当前色度块的色度帧内预测模式的导出过程中采用默认帧内预测模式,其中所述亮度块覆盖定位为与所述当前色度块的中部处的色度样点对应的亮度样点;
基于所述默认帧内预测模式,导出用于所述当前色度块的所述色度帧内预测模式;以及
基于所述色度帧内预测模式执行所述转换。
34.根据权利要求33所述的装置,其中,在所述亮度块的指定编解码模式是基于矩阵的帧内预测(MIP)模式的情况下,所述默认帧内预测模式被确定为平面帧内预测模式,其中所述基于矩阵的帧内预测模式使用矩阵矢量乘法来生成所述亮度块的预测样点;
其中,在所述亮度块的指定编解码模式是帧内块复制(IBC)模式的情况下,所述默认帧内预测模式被确定为DC帧内预测模式,其中所述帧内块复制模式从由块矢量确定的相同视频区域的样点值的块导出所述亮度块的预测样点;
其中,在所述亮度块的指定编解码模式是调色板模式的情况下,所述默认帧内预测模式被确定为DC帧内预测模式,其中所述调色板模式允许使用代表性样点值的调色板来表示或重构所述亮度块;或者
其中,在所述亮度块的指定编解码模式既不是基于矩阵的帧内预测(MIP)模式、也不是帧内块复制(IBC)模式、也不是调色板模式的情况下,在用于所述当前色度块的所述色度帧内预测模式的导出过程中利用所述亮度块的亮度帧内预测模式。
35.根据权利要求33所述的装置,其中,使用第一标志(cclm_mode_flag)、第二标志(cclm_mode_idx)、第三标志(intra_chroma_pred_mode)和表示为lumaIntraPredMode的变量来导出所述色度帧内预测模式,所述第一标志(cclm_mode_flag)指示跨分量线性模型预测模式是否应用于所述当前色度块,所述第二标志(cclm_mode_idx)指示INTRA_LT_CCLM、INTRA_L_CCLM和INTRA_T_CCLM色度帧内预测模式中的哪一者应用于所述当前色度块,所述第三标志(intra_chroma_pred_mode)指示用于所述当前色度块的色度样点的帧内预测模式,表示为lumaIntraPredMode的所述变量在所述亮度块使用所述指定编解码模式进行编解码的情况下等于所述默认帧内预测模式,或者在所述亮度块不使用所述指定编解码模式进行编解码的情况下等于所述亮度块的亮度帧内预测模式;
其中,使用以下表1中指定的cclm_mode_flag、cclm_mode_idx、intra_chroma_pred_mode和lumaIntraPredMode来导出所述色度帧内预测模式:
表1
其中,当所述视频单元的色度格式为4:2:2时,根据预定义的映射表将表1中的色度帧内预测模式X映射到色度帧内预测模式Y,并且之后将表1中的所述色度帧内预测模式X设置为等于所述色度帧内预测模式Y;并且
其中,所述默认帧内预测模式不分配给帧间编解码块。
36.一种存储指令的非暂时性计算机可读存储介质,所述指令使处理器:
在视频的视频单元的当前色度块与所述视频的比特流之间的转换期间,确定在亮度块的编解码模式是指定编解码模式的情况下,在用于所述当前色度块的色度帧内预测模式的导出过程中采用默认帧内预测模式,其中所述亮度块覆盖定位为与所述当前色度块的中部处的色度样点对应的亮度样点;
基于所述默认帧内预测模式,导出用于所述当前色度块的所述色度帧内预测模式;以及
基于所述色度帧内预测模式执行所述转换。
37.根据权利要求36所述的非暂时性计算机可读存储介质,其中,在所述亮度块的指定编解码模式是基于矩阵的帧内预测(MIP)模式的情况下,所述默认帧内预测模式被确定为平面帧内预测模式,其中所述基于矩阵的帧内预测模式使用矩阵矢量乘法来生成所述亮度块的预测样点;
其中,在所述亮度块的指定编解码模式是帧内块复制(IBC)模式的情况下,所述默认帧内预测模式被确定为DC帧内预测模式,其中所述帧内块复制模式从由块矢量确定的相同视频区域的样点值的块导出所述亮度块的预测样点;
其中,在所述亮度块的指定编解码模式是调色板模式的情况下,所述默认帧内预测模式被确定为DC帧内预测模式,其中所述调色板模式允许使用代表性样点值的调色板来表示或重构所述亮度块;或者
其中,在所述亮度块的指定编解码模式既不是基于矩阵的帧内预测(MIP)模式、也不是帧内块复制(IBC)模式、也不是调色板模式的情况下,在用于所述当前色度块的所述色度帧内预测模式的导出过程中利用所述亮度块的亮度帧内预测模式。
38.根据权利要求36所述的非暂时性计算机可读存储介质,其中,使用第一标志(cclm_mode_flag)、第二标志(cclm_mode_idx)、第三标志(intra_chroma_pred_mode)和表示为lumaIntraPredMode的变量来导出所述色度帧内预测模式,所述第一标志(cclm_mode_flag)指示跨分量线性模型预测模式是否应用于所述当前色度块,所述第二标志(cclm_mode_idx)指示INTRA_LT_CCLM、INTRA_L_CCLM和INTRA_T_CCLM色度帧内预测模式中的哪一者应用于所述当前色度块,所述第三标志(intra_chroma_pred_mode)指示用于所述当前色度块的色度样点的帧内预测模式,表示为lumaIntraPredMode的所述变量在所述亮度块使用所述指定编解码模式进行编解码的情况下等于所述默认帧内预测模式,或者在所述亮度块不使用所述指定编解码模式进行编解码的情况下等于所述亮度块的亮度帧内预测模式;
其中,使用以下表1中指定的cclm_mode_flag、cclm_mode_idx、intra_chroma_pred_mode和lumaIntraPredMode来导出所述色度帧内预测模式:
表1
其中,当所述视频单元的色度格式为4:2:2时,根据预定义的映射表将表1中的色度帧内预测模式X映射到色度帧内预测模式Y,并且之后将表1中的所述色度帧内预测模式X设置为等于所述色度帧内预测模式Y;并且
其中,所述默认帧内预测模式不分配给帧间编解码块。
39.一种存储视频的比特流的非暂时性计算机可读记录介质,所述视频的比特流由视频处理装置执行的方法生成,其中所述方法包括:
对于所述视频的视频单元的当前色度块,确定在亮度块的编解码模式是指定编解码模式的情况下,在用于所述当前色度块的色度帧内预测模式的导出过程中采用默认帧内预测模式,其中所述亮度块覆盖定位为与所述当前色度块的中部处的色度样点对应的亮度样点;
基于所述默认帧内预测模式,导出用于所述当前色度块的所述色度帧内预测模式;以及
基于所述色度帧内预测模式生成所述比特流。
40.根据权利要求39所述的非暂时性计算机可读记录介质,其中,在所述亮度块的指定编解码模式是基于矩阵的帧内预测(MIP)模式的情况下,所述默认帧内预测模式被确定为平面帧内预测模式,其中所述基于矩阵的帧内预测模式使用矩阵矢量乘法来生成所述亮度块的预测样点;
其中,在所述亮度块的指定编解码模式是帧内块复制(IBC)模式的情况下,所述默认帧内预测模式被确定为DC帧内预测模式,其中所述帧内块复制模式从由块矢量确定的相同视频区域的样点值的块导出所述亮度块的预测样点;
其中,在所述亮度块的指定编解码模式是调色板模式的情况下,所述默认帧内预测模式被确定为DC帧内预测模式,其中所述调色板模式允许使用代表性样点值的调色板来表示或重构所述亮度块;或者
其中,在所述亮度块的指定编解码模式既不是基于矩阵的帧内预测(MIP)模式、也不是帧内块复制(IBC)模式、也不是调色板模式的情况下,在用于所述当前色度块的所述色度帧内预测模式的导出过程中利用所述亮度块的亮度帧内预测模式。
41.根据权利要求39所述的非暂时性计算机可读记录介质,其中,使用第一标志(cclm_mode_flag)、第二标志(cclm_mode_idx)、第三标志(intra_chroma_pred_mode)和表示为lumaIntraPredMode的变量来导出所述色度帧内预测模式,所述第一标志(cclm_mode_flag)指示跨分量线性模型预测模式是否应用于所述当前色度块,所述第二标志(cclm_mode_idx)指示INTRA_LT_CCLM、INTRA_L_CCLM和INTRA_T_CCLM色度帧内预测模式中的哪一者应用于所述当前色度块,所述第三标志(intra_chroma_pred_mode)指示用于所述当前色度块的色度样点的帧内预测模式,表示为lumaIntraPredMode的所述变量在所述亮度块使用所述指定编解码模式进行编解码的情况下等于所述默认帧内预测模式,或者在所述亮度块不使用所述指定编解码模式进行编解码的情况下等于所述亮度块的亮度帧内预测模式;
其中,使用以下表1中指定的cclm_mode_flag、cclm_mode_idx、intra_chroma_pred_mode和lumaIntraPredMode来导出所述色度帧内预测模式:
表1
其中,当所述视频单元的色度格式为4:2:2时,根据预定义的映射表将表1中的色度帧内预测模式X映射到色度帧内预测模式Y,并且之后将表1中的所述色度帧内预测模式X设置为等于所述色度帧内预测模式Y;并且
其中,所述默认帧内预测模式不分配给帧间编解码块。
42.一种用于存储视频的比特流的方法,包括:
对于所述视频的视频单元的当前色度块,确定在亮度块的编解码模式是指定编解码模式的情况下,在用于所述当前色度块的色度帧内预测模式的导出过程中采用默认帧内预测模式,其中所述亮度块覆盖定位为与所述当前色度块的中部处的色度样点对应的亮度样点;
基于所述默认帧内预测模式,导出用于所述当前色度块的所述色度帧内预测模式;
基于所述色度帧内预测模式生成所述比特流;以及
将所述比特流存储到非暂时性计算机可读记录介质中。
CN202311452261.2A 2019-08-03 2020-08-03 视频编解码中缩减二次变换的矩阵的选择 Pending CN117376555A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
CNPCT/CN2019/099158 2019-08-03
CN2019099158 2019-08-03
CN202080055674.5A CN114208190B (zh) 2019-08-03 2020-08-03 视频编解码中缩减二次变换的矩阵的选择
PCT/CN2020/106561 WO2021023152A1 (en) 2019-08-03 2020-08-03 Selection of matrices for reduced secondary transform in video coding

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN202080055674.5A Division CN114208190B (zh) 2019-08-03 2020-08-03 视频编解码中缩减二次变换的矩阵的选择

Publications (1)

Publication Number Publication Date
CN117376555A true CN117376555A (zh) 2024-01-09

Family

ID=74503764

Family Applications (3)

Application Number Title Priority Date Filing Date
CN202080055680.0A Pending CN114208183A (zh) 2019-08-03 2020-08-03 视频的缩减二次变换中基于位置的模式导出
CN202311452261.2A Pending CN117376555A (zh) 2019-08-03 2020-08-03 视频编解码中缩减二次变换的矩阵的选择
CN202080055674.5A Active CN114208190B (zh) 2019-08-03 2020-08-03 视频编解码中缩减二次变换的矩阵的选择

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN202080055680.0A Pending CN114208183A (zh) 2019-08-03 2020-08-03 视频的缩减二次变换中基于位置的模式导出

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN202080055674.5A Active CN114208190B (zh) 2019-08-03 2020-08-03 视频编解码中缩减二次变换的矩阵的选择

Country Status (6)

Country Link
US (3) US11638008B2 (zh)
EP (1) EP3994887A4 (zh)
JP (2) JP7422858B2 (zh)
KR (1) KR20220038682A (zh)
CN (3) CN114208183A (zh)
WO (2) WO2021023151A1 (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4329309A3 (en) 2019-05-10 2024-03-27 Beijing Bytedance Network Technology Co., Ltd. Selection of secondary transform matrices for video processing
CN113950828A (zh) 2019-06-07 2022-01-18 北京字节跳动网络技术有限公司 视频比特流中的简化二次变换的有条件信令
WO2021023151A1 (en) 2019-08-03 2021-02-11 Beijing Bytedance Network Technology Co., Ltd. Position based mode derivation in reduced secondary transforms for video
CN115834879A (zh) * 2019-08-14 2023-03-21 Lg电子株式会社 图像编解码方法、发送比特流的方法和记录介质
CN114223208B (zh) 2019-08-17 2023-12-29 北京字节跳动网络技术有限公司 为视频中的缩减二次变换的边信息的上下文建模
CA3156856A1 (en) * 2019-10-04 2021-04-08 Lg Electronics Inc. Transform-based image coding method, and device therefor
CA3159068A1 (en) 2019-10-29 2021-05-06 Lg Electronics Inc. Method for low-frequency non-separable transform-based image coding and apparatus therefor
MX2022005105A (es) 2019-10-29 2022-08-04 Lg Electronics Inc Metodo de codificacion de imagenes a base de transformacion y aparato para el mismo.
US11575909B2 (en) * 2020-04-07 2023-02-07 Tencent America LLC Method and apparatus for video coding
WO2023009608A1 (en) * 2021-07-27 2023-02-02 Beijing Dajia Internet Information Technology Co., Ltd. Coding enhancement in cross-component sample adaptive offset
WO2023080691A1 (ko) * 2021-11-03 2023-05-11 주식회사 윌러스표준기술연구소 비디오 신호 처리 방법 및 이를 위한 장치
WO2023140547A1 (ko) * 2022-01-19 2023-07-27 현대자동차주식회사 다중 참조라인들을 이용하는 크로마 채널 코딩을 위한 방법 및 장치

Family Cites Families (105)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5796842A (en) 1996-06-07 1998-08-18 That Corporation BTSC encoder
EP3094084A1 (en) 2005-08-10 2016-11-16 Mitsubishi Electric Corporation Recording medium, reproducing apparatus, and reproducing method
WO2011016250A1 (ja) 2009-08-06 2011-02-10 パナソニック株式会社 符号化方法、復号方法、符号化装置及び復号装置
US9172968B2 (en) 2010-07-09 2015-10-27 Qualcomm Incorporated Video coding using directional transforms
US8693795B2 (en) 2010-10-01 2014-04-08 Samsung Electronics Co., Ltd. Low complexity secondary transform for image and video compression
KR101756442B1 (ko) 2010-11-29 2017-07-11 에스케이텔레콤 주식회사 인트라예측모드의 중복성을 최소화하기 위한 영상 부호화/복호화 방법 및 장치
AU2015249109B2 (en) 2011-03-08 2017-08-24 Qualcomm Incorporated Coding of transform coefficients for video coding
US9338449B2 (en) 2011-03-08 2016-05-10 Qualcomm Incorporated Harmonized scan order for coding transform coefficients in video coding
US20120320972A1 (en) * 2011-06-16 2012-12-20 Samsung Electronics Co., Ltd. Apparatus and method for low-complexity optimal transform selection
US20130003856A1 (en) 2011-07-01 2013-01-03 Samsung Electronics Co. Ltd. Mode-dependent transforms for residual coding with low latency
CN107959857B (zh) 2011-10-18 2022-03-01 株式会社Kt 视频信号解码方法
KR20130058524A (ko) * 2011-11-25 2013-06-04 오수미 색차 인트라 예측 블록 생성 방법
KR102375821B1 (ko) 2011-12-29 2022-03-16 엘지전자 주식회사 비디오 인코딩 및 디코딩 방법과 이를 이용하는 장치
RS60786B1 (sr) 2012-01-20 2020-10-30 Dolby Laboratories Licensing Corp Postupak mapiranja režima intra predikcije
CN104488270B (zh) 2012-06-29 2018-05-18 韩国电子通信研究院 一种利用解码设备的视频解码方法
US9277212B2 (en) * 2012-07-09 2016-03-01 Qualcomm Incorporated Intra mode extensions for difference domain intra prediction
AU2012232992A1 (en) 2012-09-28 2014-04-17 Canon Kabushiki Kaisha Method, apparatus and system for encoding and decoding the transform units of a coding unit
EP2891312A2 (en) 2012-10-05 2015-07-08 Huawei Technologies Co., Ltd. Improved architecture for hybrid video codec
US10291912B2 (en) 2013-01-16 2019-05-14 Blackberry Limited Context determination for entropy coding of run-length encoded transform coefficients
US20140254661A1 (en) 2013-03-08 2014-09-11 Samsung Electronics Co., Ltd. Method and apparatus for applying secondary transforms on enhancement-layer residuals
CN104488266B (zh) 2013-06-27 2018-07-06 北京大学深圳研究生院 Avs视频压缩编码方法及编码器
KR20150043226A (ko) * 2013-10-14 2015-04-22 삼성전자주식회사 깊이 인트라 부호화 방법 및 그 장치, 복호화 방법 및 그 장치
US9948933B2 (en) 2014-03-14 2018-04-17 Qualcomm Incorporated Block adaptive color-space conversion coding
US10142642B2 (en) * 2014-06-04 2018-11-27 Qualcomm Incorporated Block adaptive color-space conversion coding
BR112017004886A2 (pt) * 2014-09-12 2017-12-05 Vid Scale Inc dispositivo de codificação de vídeo e método de codificação de vídeo
CN105516730B (zh) 2014-09-24 2018-04-24 晨星半导体股份有限公司 视讯编码装置及视讯解码装置以及其编码与解码方法
US10091504B2 (en) 2015-01-08 2018-10-02 Microsoft Technology Licensing, Llc Variations of rho-domain rate control
US10306229B2 (en) 2015-01-26 2019-05-28 Qualcomm Incorporated Enhanced multiple transforms for prediction residual
US20170034530A1 (en) 2015-07-28 2017-02-02 Microsoft Technology Licensing, Llc Reduced size inverse transform for decoding and encoding
WO2017041271A1 (en) 2015-09-10 2017-03-16 Mediatek Singapore Pte. Ltd. Efficient context modeling for coding a block of data
US10491922B2 (en) 2015-09-29 2019-11-26 Qualcomm Incorporated Non-separable secondary transform for video coding
CN108141585B (zh) 2015-10-22 2021-11-19 Lg 电子株式会社 视频编码系统中的帧内预测方法和装置
CA3013317A1 (en) 2016-02-08 2017-08-17 Sharp Kabushiki Kaisha Systems and methods for transform coefficient coding
CN105791867B (zh) 2016-03-23 2019-02-22 北京大学 基于边界自适应变换的优化视频数据编码方法
WO2017173593A1 (en) 2016-04-06 2017-10-12 Mediatek Singapore Pte. Ltd. Separate coding secondary transform syntax elements for different color components
US10708164B2 (en) 2016-05-03 2020-07-07 Qualcomm Incorporated Binarizing secondary transform index
WO2017191782A1 (en) 2016-05-04 2017-11-09 Sharp Kabushiki Kaisha Systems and methods for coding transform data
WO2017192898A1 (en) * 2016-05-05 2017-11-09 Vid Scale, Inc. Control-point based intra direction representation for intra coding
US11722677B2 (en) 2016-05-06 2023-08-08 Interdigital Madison Patent Holdings, Sas Method and system for decoder-side intra mode derivation for block-based video coding
CN109076242B (zh) * 2016-05-13 2023-01-03 索尼公司 图像处理设备和方法
CN109076222B9 (zh) 2016-05-13 2021-10-15 索尼公司 图像处理装置和方法
CN109076223B (zh) 2016-05-13 2021-07-09 夏普株式会社 图像解码装置以及图像编码装置
US10547854B2 (en) * 2016-05-13 2020-01-28 Qualcomm Incorporated Neighbor based signaling of intra prediction modes
CN114401407A (zh) 2016-06-24 2022-04-26 韩国电子通信研究院 用于基于变换的图像编码/解码的方法和设备
US10972733B2 (en) 2016-07-15 2021-04-06 Qualcomm Incorporated Look-up table for enhanced multiple transform
CN115914625A (zh) 2016-08-01 2023-04-04 韩国电子通信研究院 图像编码/解码方法
JP6962325B2 (ja) 2016-08-24 2021-11-05 ソニーグループ株式会社 画像処理装置、画像処理方法、及びプログラム
US10880564B2 (en) 2016-10-01 2020-12-29 Qualcomm Incorporated Transform selection for video coding
US11095893B2 (en) 2016-10-12 2021-08-17 Qualcomm Incorporated Primary transform and secondary transform in video coding
WO2018128323A1 (ko) 2017-01-03 2018-07-12 엘지전자(주) 이차 변환을 이용한 비디오 신호의 인코딩/디코딩 방법 및 장치
US11025903B2 (en) * 2017-01-13 2021-06-01 Qualcomm Incorporated Coding video data using derived chroma mode
CN110313179B (zh) 2017-01-31 2022-01-28 夏普株式会社 用于按比例缩放变换系数水平值的系统和方法
EP4007277A1 (en) 2017-03-16 2022-06-01 HFI Innovation Inc. Method and apparatus of enhanced multiple transforms and non-separable secondary transform for video coding
US20180288439A1 (en) 2017-03-31 2018-10-04 Mediatek Inc. Multiple Transform Prediction
US10855997B2 (en) 2017-04-14 2020-12-01 Mediatek Inc. Secondary transform kernel size selection
US10638126B2 (en) 2017-05-05 2020-04-28 Qualcomm Incorporated Intra reference filter for video coding
US10742975B2 (en) 2017-05-09 2020-08-11 Futurewei Technologies, Inc. Intra-prediction with multiple reference lines
US10750181B2 (en) 2017-05-11 2020-08-18 Mediatek Inc. Method and apparatus of adaptive multiple transforms for video coding
US10805641B2 (en) 2017-06-15 2020-10-13 Qualcomm Incorporated Intra filtering applied together with transform processing in video coding
JP2021010046A (ja) * 2017-10-06 2021-01-28 シャープ株式会社 画像符号化装置及び画像復号装置
US10827173B2 (en) 2017-11-13 2020-11-03 Electronics And Telecommunications Research Institute Method and apparatus for quantization
US10764590B2 (en) 2017-11-15 2020-09-01 Google Llc Entropy coding primary and secondary coefficients of video data
BR122021010330B1 (pt) 2017-12-15 2023-03-14 Lg Electronics Inc Método de codificação de imagem com base em transformada secundária não separável e dispositivo para o mesmo
US11252420B2 (en) 2017-12-15 2022-02-15 Lg Electronics Inc. Image coding method on basis of secondary transform and device therefor
WO2020035829A1 (en) 2018-08-16 2020-02-20 Beijing Bytedance Network Technology Co., Ltd. Coefficient dependent coding of transform matrix selection
GB2570711B (en) 2018-02-05 2023-04-05 Sony Corp Data encoding and decoding
CN108322745B (zh) 2018-02-28 2019-12-03 中南大学 一种基于不可分二次变换模式的帧内快速选择方法
CN116366844A (zh) 2018-03-09 2023-06-30 韩国电子通信研究院 使用样点滤波的图像编码/解码方法和设备
CN115604468A (zh) 2018-04-01 2023-01-13 Lg电子株式会社(Kr) 编码器、解码器、计算机可读存储介质及发送数据的设备
US11019355B2 (en) 2018-04-03 2021-05-25 Electronics And Telecommunications Research Institute Inter-prediction method and apparatus using reference frame generated based on deep learning
WO2019231291A1 (ko) 2018-05-31 2019-12-05 엘지전자 주식회사 레이어드 기븐스 변환을 이용하여 변환을 수행하는 방법 및 장치
HRP20230521T1 (hr) 2018-06-03 2023-08-04 Lg Electronics Inc. Postupak i uređaj za obradu video signala pomoću smanjene transformacije
CN117812254A (zh) 2018-06-29 2024-04-02 弗劳恩霍夫应用研究促进协会 扩展参考图像内预测
US11166044B2 (en) 2018-07-31 2021-11-02 Tencent America LLC Method and apparatus for improved compound orthonormal transform
JP7052075B2 (ja) 2018-09-02 2022-04-11 エルジー エレクトロニクス インコーポレイティド 映像信号を処理するための方法および装置
CN115379211A (zh) 2018-09-02 2022-11-22 Lg电子株式会社 对视频信号进行解码/编码的方法和计算机可读存储介质
CN111742555B (zh) 2018-09-05 2022-08-30 Lg电子株式会社 对视频信号进行编码/解码的方法及其设备
JP7106652B2 (ja) 2018-09-05 2022-07-26 エルジー エレクトロニクス インコーポレイティド 映像信号を処理するための方法及び装置
US10819979B2 (en) 2018-09-06 2020-10-27 Tencent America LLC Coupled primary and secondary transform
US11039139B2 (en) 2018-09-14 2021-06-15 Tencent America LLC Method and apparatus for identity transform in multiple transform selection
EP3900342A2 (en) 2018-12-20 2021-10-27 FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. Intra predictions using linear or affine transforms with neighbouring sample reduction
KR20200083321A (ko) * 2018-12-28 2020-07-08 한국전자통신연구원 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체
KR20210077776A (ko) 2019-01-14 2021-06-25 엘지전자 주식회사 영상 코딩 시스템에서 레지듀얼 정보를 사용하는 영상 디코딩 방법 및 그 장치
US11523136B2 (en) 2019-01-28 2022-12-06 Hfi Innovation Inc. Methods and apparatuses for coding transform blocks
KR20200093468A (ko) 2019-01-28 2020-08-05 주식회사 엑스리스 영상 신호 부호화/복호화 방법 및 이를 위한 장치
US11595663B2 (en) 2019-02-01 2023-02-28 Qualcomm Incorporated Secondary transform designs for partitioned transform units in video coding
KR20210114386A (ko) 2019-02-08 2021-09-23 주식회사 윌러스표준기술연구소 이차 변환을 이용하는 비디오 신호 처리 방법 및 장치
US11616966B2 (en) 2019-04-03 2023-03-28 Mediatek Inc. Interaction between core transform and secondary transform
US11134257B2 (en) 2019-04-04 2021-09-28 Tencent America LLC Simplified signaling method for affine linear weighted intra prediction mode
US11172211B2 (en) 2019-04-04 2021-11-09 Tencent America LLC Method and apparatus for video coding
WO2020207493A1 (en) 2019-04-12 2020-10-15 Beijing Bytedance Network Technology Co., Ltd. Transform coding based on matrix-based intra prediction
CN113748680B (zh) 2019-04-16 2024-01-02 寰发股份有限公司 视频编解码系统中编解码视频数据的方法及装置
FI3944618T3 (fi) 2019-04-16 2024-01-11 Lg Electronics Inc Muunnos matriisipohjaista intraennustusta varten kuvan koodauksessa
CN113711591B (zh) 2019-04-20 2023-10-27 北京字节跳动网络技术有限公司 用于色度残差的联合编解码的语法元素的信令
JP7256296B2 (ja) 2019-05-08 2023-04-11 エルジー エレクトロニクス インコーポレイティド Mip及びlfnstを行う画像符号化/復号化方法、装置、及びビットストリームを伝送する方法
EP4329309A3 (en) 2019-05-10 2024-03-27 Beijing Bytedance Network Technology Co., Ltd. Selection of secondary transform matrices for video processing
CN113940070B (zh) 2019-06-06 2023-11-21 Lg电子株式会社 基于变换的图像解码和编码方法及发送比特流的方法
CN113950828A (zh) 2019-06-07 2022-01-18 北京字节跳动网络技术有限公司 视频比特流中的简化二次变换的有条件信令
US11115658B2 (en) * 2019-06-25 2021-09-07 Qualcomm Incorporated Matrix intra prediction and cross-component linear model prediction harmonization for video coding
KR20220032565A (ko) * 2019-07-19 2022-03-15 주식회사 윌러스표준기술연구소 비디오 신호 처리 방법 및 장치
KR20220035154A (ko) * 2019-07-21 2022-03-21 엘지전자 주식회사 팔레트 모드의 적용 여부에 따라 크로마 성분 예측 정보를 시그널링 하는 영상 부호화/복호화 방법, 장치 및 비트스트림을 전송하는 방법
AU2020318106B2 (en) * 2019-07-24 2023-11-23 Huawei Technologies Co., Ltd. An encoder, a decoder and corresponding methods related to intra prediction mode
WO2021023151A1 (en) 2019-08-03 2021-02-11 Beijing Bytedance Network Technology Co., Ltd. Position based mode derivation in reduced secondary transforms for video
CN114223208B (zh) 2019-08-17 2023-12-29 北京字节跳动网络技术有限公司 为视频中的缩减二次变换的边信息的上下文建模
WO2021110018A1 (en) 2019-12-02 2021-06-10 Beijing Bytedance Network Technology Co., Ltd. Separable secondary transform processing of coded video

Also Published As

Publication number Publication date
JP2022543102A (ja) 2022-10-07
US11638008B2 (en) 2023-04-25
US20220150498A1 (en) 2022-05-12
CN114208190A (zh) 2022-03-18
US11882274B2 (en) 2024-01-23
KR20220038682A (ko) 2022-03-29
CN114208190B (zh) 2023-12-15
EP3994887A4 (en) 2022-09-28
WO2021023151A1 (en) 2021-02-11
CN114208183A (zh) 2022-03-18
WO2021023152A1 (en) 2021-02-11
JP2024041836A (ja) 2024-03-27
JP7422858B2 (ja) 2024-01-26
US20220150502A1 (en) 2022-05-12
US20240080442A1 (en) 2024-03-07
EP3994887A1 (en) 2022-05-11

Similar Documents

Publication Publication Date Title
CN114208190B (zh) 视频编解码中缩减二次变换的矩阵的选择
CN113841409B (zh) 用于视频处理的简化二次变换的有条件使用
CN114223208B (zh) 为视频中的缩减二次变换的边信息的上下文建模
WO2020244656A1 (en) Conditional signaling of reduced secondary transform in video bitstreams
CN113966611B (zh) 视频编解码中的重要系数信令
KR102655582B1 (ko) 비디오 처리를 위한 다중 이차 변환 행렬
US11968367B2 (en) Context modeling of side information for reduced secondary transforms in video

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination