CN115066897A - 低位深度视觉媒体数据的编解码 - Google Patents

低位深度视觉媒体数据的编解码 Download PDF

Info

Publication number
CN115066897A
CN115066897A CN202080078183.2A CN202080078183A CN115066897A CN 115066897 A CN115066897 A CN 115066897A CN 202080078183 A CN202080078183 A CN 202080078183A CN 115066897 A CN115066897 A CN 115066897A
Authority
CN
China
Prior art keywords
video
ibd
current block
bit depth
mode
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080078183.2A
Other languages
English (en)
Inventor
许继征
张莉
张凯
刘鸿彬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Douyin Vision Co Ltd
ByteDance Inc
Original Assignee
Douyin Vision Co Ltd
ByteDance Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Douyin Vision Co Ltd, ByteDance Inc filed Critical Douyin Vision Co Ltd
Publication of CN115066897A publication Critical patent/CN115066897A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

描述了一种用于视频编解码的设备、系统和方法,其包括低位深度视频和图像编解码。用于视频处理的示例方法包括:对于视频的当前块和视频的比特流表示之间的转换,基于当前块中源样点的输入位深度来确定自适应颜色变换编解码工具的使用。该方法还包括基于上述确定执行转换。

Description

低位深度视觉媒体数据的编解码
相关申请的交叉引用
根据适用的专利法和/或巴黎公约的规定,本申请及时要求于2019年11月14日提交的国际专利申请No.PCT/CN2019/118476的优先权和利益。出于法律上的全部目的,上述申请的全部公开内容通过引用并入,作为本申请公开内容的一部分。
技术领域
本专利文档涉及视频编解码技术、系统和设备。
背景技术
数字视频在互联网和其他数字通信网络上占最大的带宽使用量。随着能够接收和显示视频的连接用户设备的数量增加,预计数字视频使用所需的带宽将继续增长。
发明内容
描述了一种与数字视频编解码相关的设备、系统和方法,其包括低位深度视频和图像编解码。所描述的方法可以应用于现有的视频编解码标准(例如,高效视频编解码(High Efficiency Video Coding,HEVC)和/或通用视频编解码(Versatile VideoCoding,VVC)和未来的视频编解码标准或视频编解码器。
在一个代表性方面中,所公开的技术可用于提供一种视频处理的方法。该方法包括,对于视频的当前块和视频的比特流表示之间的转换,基于当前块中源样点的输入位深度来确定自适应颜色变换编解码工具的使用。该方法还包括基于该确定执行转换。
在另一个代表性方面中,所公开的技术可用于提供一种视频处理的方法。该方法包括,对于视频的当前块和视频的比特流表示之间的转换,根据样点的源值的输入位深度来确定当前块的样点的重构值或预测值被取整。该方法还包括基于该确定执行转换。
在另一个代表性方面中,所公开的技术可用于提供一种视频处理的方法。该方法包括,对于视频的当前块和视频的比特流表示之间的转换,基于当前块中源样点的输入位深度来确定环路滤波过程的使用。该方法还包括基于该确定执行转换。
在另一个代表性方面中,所公开的技术可用于提供一种视频处理的方法。该方法包括,对于视频的当前块和视频的比特流表示之间的转换,基于当前块中源样点的输入位深度来确定亮度映射与色度缩放(luma mapping with chroma scaling,LMCS)编解码工具的使用。该方法还包括基于该确定执行转换。
在另一个代表性方面中,所公开的技术可用于提供一种视频处理的方法。该方法包括,对于视频的当前块和视频的比特流表示之间的转换,基于源像素的输入位深度确定像素裁剪范围。该方法还包括基于该确定执行转换。
在另一个代表性方面中,所公开的技术可用于提供一种视频处理的方法。该方法包括,在当前视频块和视频的比特流表示之间的转换期间,基于用于表示视频的位深度来确定给定的位深度,以及对于转换的至少一个或多个计算,使用给定的位深度作为计算位深度来执行转换。
在另一个代表性方面中,上述方法以处理器可执行代码的形式体现并存储在计算机可读程序介质中。
在又一个代表性方面中,公开了一种被配置为或可操作以执行上述方法的设备。该设备可以包括经编程以执行该方法的处理器。
在又一个代表性方面中,视频解码器设备可以执行本公开所描述的方法。
附图、说明书和权利要求中更详细描述了本公开技术的以上和其他方面和特征。
附图说明
图1示出了帧内块复制的示例。
图2示出了调色板模式编解码块的示例。
图3示出了使用调色板预测器信令通知调色板条目的示例。
图4示出了水平和垂直遍历扫描的示例。
图5示出了调色板索引的编解码的示例。
图6示出了67种帧内预测模式的示例。
图7示出了当前块的左侧和上方的相邻块的示例。
图8A示出了自适应环路滤波(adaptive loop filtering,ALF)的滤波器形状的示例。
图8B示出了自适应环路滤波(ALF)的滤波器形状的另一示例。
图9A示出了二次采样拉普拉斯计算的示例。
图9B示出了二次采样拉普拉斯计算的另一示例。
图9C示出了二次采样拉普拉斯计算的另一示例。
图9D示出了二次采样拉普拉斯计算的又一示例。
图10示出了在虚拟边界处修改的块分类的示例。
图11示出了虚拟边界处亮度分量的修改的ALF滤波的示例。
图12示出了在样点自适应偏移(sample adaptive offset,SAO)操作的边缘偏移(edge offset,EO)情况下用于像素分类的四个1-D 3-像素模式的示例。
图13示出了被分组在一起并由其起始波段位置表示的四个波段的示例。
图14示出了在组合的帧间和帧内预测(combined inter and intra prediction,CIIP)权重推导中使用的顶部和左侧相邻块的示例。
图15示出了亮度映射与色度缩放(LMCS)架构的示例。
图16示出了利用自适应颜色变换(adaptive color transform,ACT)的编码流程的示例。
图17示出了利用ACT的解码流程的示例。
图18是视频处理方法的示例流程图。
图19是其中可以实施所公开的技术的示例视频处理系统的框图。
图20是说明示例视频编解码系统的框图。
图21是示出根据本公开的一些实施例的编码器的框图。
图22是示出根据本公开的一些实施例的编码器的框图。
图23是示出本技术的视频处理的方法的流程图表示。
图24是示出本技术的视频处理的另一种方法的流程图表示。
图25是示出本技术的视频处理的另一种方法的流程图表示。
图26是示出本技术的视频处理的另一种方法的流程图表示。
图27是示出本技术的视频处理的又一种方法的流程图表示。
具体实施方式
本文档提供了可由图像或视频比特流的解码器使用的各种技术以提高解压缩或解码的数字视频或图像的质量。为简洁起见,此处使用的术语“视频”包括图片序列(传统上称为视频)和单个图像。此外,视频编码器也可以在编码过程中实施这些技术,以便重构用于进一步编码的解码帧。
在本文档中使用章节标题以便于理解,并且不将实施例和技术限制于相应的部分。由此,一个部分的实施例可以与其他部分的实施例相组合。
1概要
本文档涉及视频编解码技术。具体来说,涉及低位深度视频和图像编解码。可以应用于现有的视频编解码标准,如HEVC,或即将最终确定的标准(通用视频标准)。也可以应用于未来的视频编解码标准或视频编解码器。
2视频编解码的示例实施例
视频编解码标准主要是通过众所周知的ITU-T和ISO/IEC标准发展而来的。ITU-T制定了H.261和H.263,ISO/IEC制定了MPEG-1和MPEG-4视觉,这两个组织联合制定了H.262/MPEG-2视频标准、H.264/MPEG-4高级视频编解码(AVC)标准和H.265/HEVC标准。从H.262开始,视频编解码标准是基于混合视频编解码结构,其中使用了时间预测加变换编解码。为了探索HEVC之外的未来视频编解码技术,VCEG和MPEG于2015年联合成立了联合视频探索团队(JVET)。此后,JVET采用了许多新方法,并将其放入名为联合探索模型(JEM)的参考软件中。2018年4月,VCEG(Q6/16)和ISO/IEC JTC1 SC29/WG11(MPEG)成立了联合视频专家团队(JVET),致力于VVC标准的研究,目标是比HEVC降低50%的比特率。
2.1帧内块复制
HEVC屏幕内容编解码扩展(HEVC Screen Content Coding extensions,HEVC-SCC)和当前的VVC测试模型(VTM-4.0)中采用了帧内块复制(Intra block copy,IBC),即当前图片参考。IBC将运动补偿的概念从帧间编解码扩展到帧内编解码。如图1所示,当应用IBC时,当前块由同一图片中的参考块预测。参考块中的样点必须在当前块被编解码或解码之前已经被重构。尽管IBC对于大多数摄像机捕获的序列来说效率不高,但它显示出了屏幕内容的显著的编解码增益。原因是屏幕内容图片中有很多重复的图案,例如图标和文字字符。IBC可以有效地消除这些重复模式之间的冗余。在HEVC-SCC中,如果帧间编解码的编解码单元(coding unit,CU)选择当前图片作为其参考图片,则其可以应用IBC。在这种情况下,MV被重命名为块向量(block vector,BV),并且BV始终具有整数像素精度。为了与主配置文件HEVC兼容,当前图片在解码图片缓冲区(Decoded Picture Buffer,DPB)中被标记为“长期”参考图片。需要注意的是,类似地,在多视图/3D视频编解码标准中,视图间参考图片也被标记为“长期”参考图片。
跟随BV找到其参考块,可以通过复制参考块来产生预测。可以通过从原始信号中减去参考像素来获得残差。然后可以像在其他编解码模式中一样应用变换和量化。
然而,当参考块在图片之外,或与当前块重叠,或在重构区域之外,或在某些约束限制的有效区域之外时,部分或全部像素值未被定义。基本上,有两种解决方案来处理这样的问题。一种是在例如比特流一致性中禁止这种情况。另一种是为那些未定义的像素值应用填充(padding)。以下子章节详细描述了解决方案。
2.2 HEVC屏幕内容编解码扩展中的IBC
在HEVC屏幕内容编解码扩展中,当一个块使用当前图片作为参考时,其应该保证整个参考块都在可用的重构区域内,如以下规范文本所示:
变量offsetX和offsetY推导如下:
offsetX=(ChromaArrayType==0)?0:(mvCLX[0]&0x7?2:0) (8-104)
offsetY=(ChromaArrayType==0)?0:(mvCLX[1]&0x7?2:0) (8-105)
作为比特流一致性的要求,当参考图片为当前图片时,亮度运动矢量mvLX应遵循以下约束:
-当调用条款6.4.1中规定的z扫描顺序块可用性的推导过程,其中,(xCurr,yCurr)设置等于(xCb,yCb)并且相邻亮度位置(xNbY,yNbY)设置等于(xPb+(mvLX[0]>>2)-offsetX时,yPb+(mvLX[1]>>2)-offsetY)作为输入,输出应等于TRUE。
-当调用条款6.4.1中规定的z扫描顺序块可用性的推导过程,其中,(xCurr,yCurr)设置等于(xCb,yCb)并且相邻亮度位置(xNbY,yNbY)设置等于(xPb+(mvLX[0]>>2)+nPbW-1+offsetX时,yPb+(mvLX[1]>>2)+nPbH-1+offsetY)作为输入,输出应等于TRUE。
-以下条件之一或两者应为真:
-(mvLX[0]>>2)+nPbW+xB1+offsetX的值小于或等于0。
-(mvLX[1]>>2)+nPbH+yB1+offsetY的值小于或等于0。
因此,不会发生参考块与当前块重叠或参考块在图片之外的情况。无需填充参考或预测块。
2.3 VVC测试模型中的IBC
在当前的VVC测试模型中,例如VTM-4.0设计,整个参考块应伴随当前编解码树单元(coding tree unit,CTU)并且不与当前块重叠。因此,不需要填充参考或预测块。IBC标志被编解码为当前CU的预测模式。因此,每个CU共有三种预测模式,MODE_INTRA、MODE_INTER和MODE_IBC。
2.3.1 IBC Merge模式
在IBC merge模式中,从比特流中解析指向IBC merge候选列表中的条目的索引。可以按照以下步骤序列总结IBC Merge列表的构建:
步骤1:推导空域候选(candidates)
步骤2:插入HMVP候选
步骤3:插入成对平均候选
在空域merge候选的推导中,在位于图中所示位置的候选中选择最多四个merge候选。推导顺序为A1、B1、B0、A0、B2。仅当位置A1、B1、B0、A0的任何PU不可用(例如,因为其属于另一个条带或片)或未使用IBC模式编解码时,才考虑位置B2。在添加位置A1的候选后,对剩余候选的插入进行冗余校验,确保将具有相同运动信息的候选排除在列表之外,从而提高编解码效率。为了降低计算复杂度,在提到的冗余校验中并未考虑所有可能的候选对。相反,仅考虑与图中描绘的箭头链接的对,并且仅当用于冗余校验的对应候选具有不同的运动信息时,才将候选添加到列表中。
在插入空域候选之后,如果IBC merge列表尺寸仍然小于最大的IBC merge列表尺寸,则可以插入来自HMVP表的IBC候选。插入HMVP候选时实施冗余检查。
最后,成对平均候选被插入到IBC merge列表中。
当由merge候选标识的参考块在图片之外,或与当前块重叠,或在重构区域之外,或在某些约束限制的有效区域之外时,merge候选被称为无效merge候选。
需要注意的是,无效的merge候选可能会被插入到IBC merge列表中。
2.3.2IBC AMVP模式
在IBC AMVP模式下,从比特流中解析指向IBC AMVP列表中条目的AMVP索引。可以按照以下步骤序列总结IBC AMVP列表的构建:
步骤1:推导空域候选
检查A0、A1,直到找到可用的候选。
检查B0、B1、B2,直到找到可用的候选。
步骤2:插入HMVP候选
步骤3:插入零候选
在插入空域候选之后,如果IBC AMVP列表尺寸仍然小于最大的IBC AMVP列表尺寸,则可以插入来自HMVP表的IBC候选。
最后,零候选被插入到IBC AMVP列表中。
2.4调色板模式
调色板模式背后的基本思想是CU中的样点由一小组代表性颜色值表示。该组被称为调色板。也可以通过信令通知之后为(可能被量化的)分量值的逸出(escape)符号来指示调色板之外的样点。这在图2中进行了说明。
2.5 HEVC屏幕内容编解码扩展(HEVC-SCC)中的调色板模式
在HEVC-SCC的调色板模式中,使用预测的方式对调色板和索引图进行编解码。
2.5.1调色板条目的编解码
对于调色板条目的编解码,保留调色板预测器。调色板的最大尺寸以及调色板预测器在SPS中信令通知。在HEVC-SCC中,在PPS中引入了palette_predictor_initializer_present_flag。当此标志为1时,用于初始化调色板预测器的条目在比特流中信令通知。调色板预测器在每个CTU行、每个条带和每个片的开始部分进行初始化。根据palette_predictor_initializer_present_flag的值,将调色板预测器重置为0或使用在PPS中信令通知的调色板预测器初始化程序(intializer)条目进行初始化。在HEVC-SCC中,启用(enabled)了尺寸为0的调色板预测器初始化程序,以允许在PPS级别明确禁用调色板预测器初始化。
对于调色板预测器中的每个条目,都会发送一个重用标志以指示其是否为当前调色板的一部分。这在图3中进行了说明。使用零行程编解码发送重用标志。在此之后,新调色板条目的数量使用0阶的指数哥伦布码信令通知。最后,信令通知新调色板条目的分量值。
2.5.2调色板索引(indices)的编解码
调色板索引使用水平和垂直遍历扫描进行编解码,如图4所示。使用palette_transpose_flag在比特流中明确地信令通知扫描顺序。对于本小节的其余部分,假定扫描是水平的。
调色板索引使用两种主要的调色板样点模式进行编解码:“INDEX”和“COPY_ABOVE”。如前所述,逸出符号也作为“INDEX”模式被信令通知,并被分配一个等于最大调色板尺寸的索引。使用标志信令通知该模式,但最上面一行除外,或者前一个模式为“COPY_ABOVE”时。在“COPY_ABOVE”模式下,复制上一行样点的调色板索引。在“INDEX”模式下,明确地信令通知调色板索引。对于“INDEX”和“COPY_ABOVE”模式两者,信令通知游程(run)值,其指定也使用相同模式进行编解码的后续样点的数量。当逸出符号是“INDEX”或“COPY_ABOVE”模式下游程的一部分时,对于每个逸出符号信令通知逸出分量值。调色板索引的编解码如图5所示。
该语法顺序是按以下方式完成的。首先信令通知CU的索引值的数量。随后信令通知使用截断二进制编解码的整个CU的实际索引值。索引的数量和索引值都以旁路模式编解码。这会将与索引相关的旁路二进制(bins)组合在一起。然后以交错方式信令通知调色板样点模式(如果需要)和游程。最后,将整个CU的逸出样点对应的分量逸出值组合在一起,并以旁路模式进行编解码。
在信令通知索引值之后,信令通知附加语法元素last_run_type_flag。该语法元素与索引的数量相结合,消除了信令通知与块中的最后一个游程对应的游程值的需要。
在HEVC-SCC中,还为4:2:2、4:2:0和单色色度格式启用了调色板模式。对于所有色度格式,调色板条目和调色板索引的信令几乎相同。在非单色格式的情况下,每个调色板条目由3个分量组成。对于单色格式,每个调色板条目都由单个分量组成。对于二次采样的色度方向,色度样点与可被2整除的亮度样点索引相关联。在重建CU的调色板索引后,如果样点只有一个与之关联的分量,则仅使用调色板条目的第一个分量。信令的唯一区别是逸出分量值。对于每个逸出样点,信令通知的逸出分量值的数量可能会有所不同,具体取决于与该样点相关联的分量的数量。
2.6 VVC中的帧内模式编解码
为了捕捉自然视频中呈现的任意边缘方向,VTM5中的方向帧内模式的数量从HEVC中使用的33扩展到65。不在HEVC中的新方向模式在图6中被描绘为红色虚线箭头,平面模式和DC模式保持不变。这些更密集的定向帧内预测模式适用于所有块尺寸以及亮度和色度帧内预测。
在VTM5中,几种传统的角度帧内预测模式被自适应地替换为非方形块的广角帧内预测模式。
在HEVC中,每个帧内编解码块都是正方形,每条边的长度都是2的幂。因此,使用DC模式产生帧内预测器不需要除法运算。在VTM5中,块可以具有矩形形状,这需要在一般情况下对每个块使用除法运算。为了避免DC预测的除法运算,只有较长的边用于计算非方形块的平均值。
为了使最可能模式(most probable mode,MPM)列表的产生保持较低的复杂度,通过考虑两个可用的相邻帧内模式,使用具有6个MPM的帧内模式编解码方法。构建MPM列表考虑以下三个方面:
○默认帧内模式
○相邻帧内模式
○推导的帧内模式
无论是否应用了MRL和ISP编解码工具,一个统一的6-MPM列表用于帧内块。MPM列表是基于左侧和上方相邻块的帧内模式构建的。假设左侧块的模式记为Left,上方块的模式记为Above,则统一的MPM列表构造如下(在图7中示出了左侧和上方块):
-当相邻块不可用时,其帧内模式默认设置为平面(Planar)。
-如果Left和Above模式都是非角度模式:
○MPM列表{Planar、DC、V、H、V-4、V+4}
-如果Left和Above模式之一是角度模式,而另一个是非角度:
○将模式Max设置为Left和Above中的较大模式
○MPM列表{Planar、Max、DC、Max-1、Max+1、Max-2}
-如果Left和Above都有角度并且彼此不同的:
○将模式Max设置为Left和Above中的较大模式
○如果模式Left和Above的差异在2到62范围内,包括端值
■MPM列表{Planar、Left、Above、DC、Max-1、Max+1}
○否则
■MPM列表{Planar、Left、Above、DC、Max-2、Max+2}
-如果Left和Above都是角度并且彼此相同:
○MPM列表{Planar、Left、Left-1、Left+1、DC、Left-2}
此外,mpm索引码字的第一个bin是CABAC上下文编解码的。总共使用三个上下文,对应于当前帧内块是否启用MRL、启用ISP或是正常的帧内块。
在6MPM列表产生过程中,修剪(pruning)用于去除重复的模式,以便只有唯一的模式可以包含到MPM列表中。对于61种非MPM模式的熵编解码,使用截断二进制编解码(Truncated Binary Code,TBC)。
对于色度帧内模式编解码,色度帧内模式编解码总共允许有8个帧内模式。这些模式包括五种传统的帧内模式和三种跨分量线性模型模式(CCLM、LM_A和LM_L)。色度模式信令通知和推导过程如表1所示。色度模式编解码直接依赖于对应亮度块的帧内预测模式。由于在I条带中启用了用于亮度和色度分量的单独块分割结构,因此一个色度块可能对应于多个亮度块。因此,对于色度DM模式,直接继承覆盖当前色度块的中心位置的对应亮度块的帧内预测模式。
表1:启用cclm_is时从亮度模式推导色度预测模式
Figure BDA0003636073970000101
2.7块差分脉冲编解码调制(Block Differential Pulse-Code Modulation,BDPCM)
在一些实施例中,提出了量化残差块差分脉冲编解码调制(quantized residualblock differential pulse-code modulation,QR-BDPCM)来有效地编解码屏幕内容。
QR-BDPCM中使用的预测方向可以是垂直和水平预测模式。与帧内预测类似,通过在预测方向(水平或垂直预测)上的样点复制来对整个块进行帧内预测。对残差进行量化,并对量化残差与其预测(水平或垂直)量化值之间的差值进行编解码。其可以通过以下方式描述:对于尺寸为M(行)×N(列)的块,设ri,j,0≤i≤M-1,0≤j≤N-1为使用来自上方或左侧块边界样点的未过滤样点,水平(在预测块上逐行复制左相邻像素值)或垂直(将顶部相邻行复制到预测块中的每一行)实施帧内预测后的预测残差。设Q(ri,j),0≤i≤M-1,0≤j≤N-1表示残差ri,j的量化版本,其中残差是原始块与预测块值之间的差异。然后将块DPCM应用于量化的残差样点,从而产生具有元素
Figure BDA0003636073970000111
的修改后的M×N阵列
Figure BDA0003636073970000112
当信令通知垂直BDPCM时:
Figure BDA0003636073970000113
对于水平预测,类似的规则适用,残差量化样点通过以下方式获得:
Figure BDA0003636073970000114
发送残差量化样点
Figure BDA0003636073970000115
到解码器。
在解码器侧,将上述计算反向来产生Q(ri,j),0≤i≤M-1,0≤j≤N-1。对于垂直预测情况,
Figure BDA0003636073970000116
对于水平情况,
Figure BDA0003636073970000117
将逆量化的残差Q-1(Q(ri,j))添加到帧块内预测值以产生重构的样点值。
该方案的主要好处是可以在系数解析期间动态完成逆向DPCM,只需在解析系数时添加预测器,也可以在解析后实施。
2.8自适应环路滤波器
在VTM5中,应用了基于块的滤波器自适应的自适应环路滤波器(ALF)。对于亮度分量,根据局部梯度的方向值和活动值,为每个4×4块选择25个滤波器中的一个。
2.8.1.1滤波器形状
在VTM5中,使用了两个菱形滤波器形状(如图8所示)。7×7菱形用于亮度分量,5×5菱形用于色度分量。
2.8.1.2块分类
对于亮度分量,每个块被分类为25个类别中的一个。分类索引C是根据其方向值D和活动值
Figure BDA0003636073970000121
的量化值推导出来的,如下:
Figure BDA0003636073970000122
为了计算D和
Figure BDA0003636073970000123
首先使用一维拉普拉斯算子计算水平、垂直和两个对角线方向的梯度:
Figure BDA0003636073970000124
Figure BDA0003636073970000125
Figure BDA0003636073970000126
Figure BDA0003636073970000127
其中索引i和j指的是4×4块内左上样点的坐标,而R(i,j)表示坐标(i,j)处的重建样点。
为了降低块分类的复杂性,应用了二次采样的一维拉普拉斯计算。如图9A-9D所示,相同的二次采样位置用于所有方向的梯度计算。
然后设置水平和垂直方向梯度的D最大值和最小值为:
Figure BDA0003636073970000128
两个对角线方向梯度的最大值和最小值设置为:
Figure BDA0003636073970000131
为了得出方向值D的值,将这些值相互比较,并与两个阈值t1和t2进行比较:
步骤1.如果
Figure BDA0003636073970000132
Figure BDA0003636073970000133
两者都为真,则设置D为0。
步骤2.如果
Figure BDA0003636073970000134
从步骤3继续;否则从步骤4继续。
步骤3.如果
Figure BDA0003636073970000135
设置D为2;否则设置D为0。
步骤4.如果
Figure BDA0003636073970000136
设置D为4;否则设置D为3。
活动值A计算如下:
Figure BDA0003636073970000137
A被进一步量化到0到4的范围,包括端值,量化后的值记为
Figure BDA0003636073970000138
对于图片中的色度分量,不应用分类方法,例如,对每个色度分量应用一组ALF系数。
2.8.1.3滤波器系数的几何变换和裁剪(clipping)值
在对每个4×4亮度块进行滤波之前,根据为该块计算的梯度值,将诸如旋转或对角线以及垂直翻转之类的几何变换应用于滤波器系数f(k,l)和对应的滤波器裁剪值c(k,l)。这相当于将这些变换应用于滤波器支持区域中的样点。这个想法是通过调整其方向性使应用ALF的不同块更相似。
介绍了三种几何变换,包括对角线、垂直翻转和旋转:
对角线:fD(k,l)=f(l,k),cD(k,l)=c(l,k),
垂直翻转:fV(k,l)=f(k,K-l-1),cV(k,l)=c(k,K-l-1)
旋转:fR(k,l)=f(K-l-1,k),cR(k,l)=c(K-l-1,k)
这里,K是滤波器的尺寸,0≤k,l≤K-1是系数坐标,因此位置(0,0)在左上角,位置(K-1,K-1)在右下角。根据为该块计算的梯度值,将变换应用于滤波器系数f(k,l)和裁剪值c(k,l)。变换与四个方向的四个梯度之间的关系总结在表2中。
表2:对一个块计算的梯度与变换的映射
梯度值 变换
g<sub>d2</sub>&lt;g<sub>d1</sub>和g<sub>h</sub>&lt;g<sub>v</sub> 无变换
g<sub>d2</sub>&lt;g<sub>d1</sub>和g<sub>v</sub>&lt;g<sub>h</sub> 对角线
g<sub>d1</sub>&lt;g<sub>d2</sub>和g<sub>h</sub>&lt;g<sub>v</sub> 垂直翻转
g<sub>d1</sub>&lt;g<sub>d2</sub>和g<sub>v</sub>&lt;g<sub>h</sub> 旋转
2.8.1.4滤波器参数信令
在VTM5中,在自适应参数集(Adaptation Parameter Set,APS)中信令通知ALF滤波器参数。在一个APS中,最多可以发送25组亮度滤波器系数和裁剪值索引,以及最多一组色度滤波器系数和nd裁剪值索引。为了减少比特开销,能够合并不同分类的滤波器系数。在条带标头中,信令通知当前条带使用的APS的索引。
从APS解码的裁剪值索引允许使用裁剪值的亮度表和裁剪值的色度表来确定裁剪值。这些裁剪值取决于内部位深度。更准确地说,裁剪值的Luma表和裁剪值的Chroma表是通过以下公式获得的:
Figure BDA0003636073970000141
Figure BDA0003636073970000142
此处,B等于内部位深度,N等于4,其为VTM5.0中允许的裁剪值的数量。
滤波过程可以在CTB级别进行控制。始终信令通知标志来指示ALF是否应用于亮度CTB。亮度CTB可以从16个固定滤波器组和APS中的滤波器组中选择一个滤波器组。对于亮度CTB信令通知滤波器组索引以指示应用了哪个滤波器组。16个固定滤波器组在编码器和解码器中都是预定义和硬编解码(hard-coded)的。
滤波器系数被量化为范数等于128。为了限制乘法复杂度,应用了比特流一致性,使得非中心位置的系数值应在-27到27-1的范围内,包括端值。中心位置系数未在比特流中被信令通知,并且被认为等于128。
2.8.1.5滤波过程
在解码器端,当CTB启用ALF时,CU内的每个样点都被滤波,产生如下所示的样点值,
Figure BDA0003636073970000151
其中,f(k,l)表示解码后的滤波器系数,K(x,y)为裁剪函数,c(k,l)表示解码后的裁剪参数。变量k和l在
Figure BDA0003636073970000152
Figure BDA0003636073970000153
之间变化,其中,L表示滤波器长度。裁剪函数K(x,y)=min(y,max(-y,x)),其对应于函数Clip3(-y,y,x)。
2.8.1.6减少行缓冲区的虚拟边界滤波过程
在VTM5中,为了减少ALF的行缓冲区需求,对水平CTU边界附近的样点采用了改进的块分类和滤波。为此目的,虚拟边界被定义为通过用“N”个样点移动水平CTU边界的线,如图10所示,其中N=4用于亮度分量,N=2用于色度分量。
如图11所示,对色度分量应用修改后的块分类。对于虚拟边界上方的4×4块的一维拉普拉斯梯度计算,仅使用虚拟边界上方的样点。类似地,对于虚拟边界下方的4×4块的一维拉普拉斯梯度计算,仅使用虚拟边界下方的样点。考虑到一维拉普拉斯梯度计算中使用的样点数量减少,活动值A的量化相应地进行了缩放。
对于滤波过程,虚拟边界处的对称填充操作用于亮度和色度分量。如图11所示,当被滤波的样点位于虚拟边界下方时,位于虚拟边界上方的相邻样点被填充。同时,另一侧的相应样点也被对称填充。
2.9样点自适应偏移(SAO)
通过使用编码器为每个CTB指定的偏移量,样点自适应偏移(SAO)应用于去方块滤波器后的重构信号。HM编码器首先决定是否对当前条带应用SAO过程。如果对条带应用SAO,则每个CTB被分类为五种SAO类型之一,如表3所示。SAO的概念是将像素分类,并通过为每个类别的像素添加偏移量来减少失真。SAO操作包括使用边缘属性进行SAO类型1-4中的像素分类的边缘偏移(EO)和使用像素强度进行SAO类型5中的像素分类的带偏移(Band Offset,BO)。每个适用的CTB都有SAO参数,包括sao_merge_left_flag、sao_merge_up_flag、SAO类型和四个偏移量。如果sao_merge_left_flag等于1,则当前CTB将重用SAO类型和CTB向左的偏移量。如果sao_merge_up_flag等于1,则当前CTB将重用上述CTB的SAO类型和偏移量。
表3:SAO类型规格
SAO类型 要使用的样点自适应偏移类型 类别数
0 0
1 一维0度模式边缘偏移 4
2 一维90度模式边缘偏移 4
3 一维135度模式边缘偏移 4
4 一维45度模式边缘偏移 4
5 带偏移 4
2.9.1每种SAO类型的操作
如图12所示,边缘偏移通过考虑边缘方向信息使用四个一维3像素模式对当前像素p进行分类。从左到右分别是:0度、90度、135度和45度。
根据表4,每个CTB被分类为5个类别之一。
表4:EO像素分类规则
类别 条件 含义
0 以下都不是 大体上单调
1 p<2的相邻 局部最小值
2 p<1的相邻&&p==1的相邻 边缘
3 p>1的相邻&&p==1的相邻 边缘
4 p>2的相邻 局部最大值
带偏移(BO)将一个CTB区域中的所有像素分为32个均匀带,使用像素值的最高5位作为带索引。换言之,像素强度范围被分成从零到最大强度值的32个相等的段(例如8位像素为255)。四个邻近的带组合在一起,每组由其最左侧的位置表示,如图13所示。编码器通过补偿每个带的偏移搜索所有位置以获得具有最大失真减少的组。
2.10组合的帧间和帧内预测(CIIP)
在VTM5中,当一个CU以merge模式编解码时,如果CU包含至少64个亮度样点(即CU宽度乘以CU高度等于或大于64),如果CU宽度和CU高度都小于128亮度样点,信令通知附加标志以指示组合的帧间/帧内预测(CIIP)模式是否应用于当前CU。顾名思义,CIIP预测将帧间预测信令与帧内预测信令相结合。使用应用于常规merge模式的相同帧间预测过程推导CIIP模式下的帧间预测信令Pinter;按照平面模式的常规帧内预测过程推导帧内预测信令Pintra。然后,使用加权平均来组合帧内和帧间预测信令,其中,权重值根据顶部和左侧相邻块的编解码模式(如图14所示)计算如下:
-如果顶部相邻值可用且为帧内编解码,则将isIntraTop设置为1,否则将isIntraTop设置为0;
-如果左侧相邻值可用且为帧内编解码,则将isIntraLeft设置为1,否则将isIntraLeft设置为0;
-如果(isIntraLeft+isIntraLeft)等于2,则将wt设置为3;
-否则,如果(isIntraLeft+isIntraLeft)等于1,则将wt设置为2;
-否则,将wt设置为1。
CIIP预测形成如下:
PCIIP=((4-wt)*Pinter+wt*Pintra+2)>>2
2.11亮度映射与色度缩放(LMCS)
在VTM5中,在环路滤波器之前添加了一个被称为亮度映射与色度缩放(LMCS)的编解码工具作为新的处理块。LMCS有两个主要的分量:LMCS有两个主要组件:1)基于自适应分段线性模型的亮度分量的环路映射;2)对于色度分量,应用与亮度相关的色度残差缩放。图15从解码器的角度示出了LMCS架构。图15中的浅蓝色阴影块表示在映射域中应用处理的位置;其包括逆量化、逆变换、亮度帧内预测以及亮度预测与亮度残差的相加。图15中的无阴影块指示在原始(例如,非映射)域中应用处理的位置;其包括诸如去方块、ALF和SAO之类的环路滤波器、运动补偿预测、色度帧内预测、色度预测与色度残差的相加以及将解码图像存储为参考图像。图15中的浅黄色阴影块是新的LMCS功能块,包括亮度信令的正向和逆向映射以及与亮度相关的色度缩放过程。与VVC中的大多数其他工具一样,LMCS可以使用SPS标志在序列级别启用/禁用。
2.12自适应颜色变换(ACT)
2.12.1 HEVC屏幕内容编解码扩展中的ACT
在HEVC SCC扩展中,已经提出并使用了几种工具来提高HEVC框架下的SCC效率。例如,为了利用SC中的重复模式,采用了帧内块复制(IBC)方案。与用于帧间图像的运动补偿方案类似,IBC模式在当前图像的已重构区域中搜索重复模式。改进SCC的另一个方向是减少4:4:4色度格式的RGB/YCbCr序列的颜色分量间冗余。
跨分量预测(cross-component prediction,CCP)技术信令通知变换单元的每个色度颜色分量的加权参数索引。CCP提供了良好的编解码效率改进且具有有限增加的复杂性,因此,其被HEVC范围扩展采用,并且是指定了范围扩展和其他扩展的描述的HEVC版本2的一部分。
为了进一步利用SCC的颜色分量间相关性,采用了HEVC SCC扩展的环内自适应颜色空间变换(adaptive color-space transform,ACT)。ACT的基本思想是将预测残差自适应地转换为三色分量之间冗余减少的颜色空间。在此之前和之后,信令遵循HEVC范围扩展中现有的编解码路径。为了尽可能降低复杂度,只考虑了一种额外的颜色空间(例如,RGB到YCgCo-R逆变换),其可以通过移位和加法操作轻松实现。
使用ACT的编码流程如图16所示。
使用ACT的解码流程如图17所示。
2.12.2 ACT中使用的变换
对于有损编解码,使用YCgCo变换,而其可逆变体(例如YCgCo-R)用于无损编解码。
YCgCo正向和逆向变换过程如下:以(R,G,B)颜色格式的像素为例:
正向:
Figure BDA0003636073970000181
逆向:
Figure BDA0003636073970000182
与可以通过矩阵乘法实现的YCgCo变换不同,ACT中使用的可逆颜色空间变换(例如YCgCo-R)只能在基于提升的操作中实施,如下所示:
正向:
Figure BDA0003636073970000183
逆向:
Figure BDA0003636073970000184
2.12.3 ACT的使用
对于每个TU,可以信令通知标志来指示颜色空间变换的使用。此外,对于帧内编解码的CU,仅当色度和亮度帧内预测模式相同时才启用ACT,例如,色度块采用DM模式编解码。
图16示出了在编码器处提出的方法的框图,其中以从帧内/帧间预测导出的残差信号作为输入。提议的功能块包括正向和反向颜色空间变换,位于编解码环路中并突出显示。如图16所示,在帧内或帧间预测过程(包括IBC模式的预测过程)之后,确定是否实施正向颜色空间变换。通过引入颜色空间变换,可以将输入信号的颜色空间转换为三色分量之间相关性较小的YCgCo。之后,进一步按顺序调用原始编解码流程,例如CCP、整数变换(例如,图16中的T),如果适用,量化(例如,图16中的Q)和熵编解码过程。同时,在如图17所示的重构或解码过程中,在传统的逆量化(例如,图17中的IQ)、逆变换(例如,图17中的IT)和逆CCP(如果适用)之后,调用逆向颜色变换将编解码残差转换回原始颜色空间。需要注意的是,颜色空间转换过程是应用于残差信号而不是重构信号。使用这种方法,解码器只需要实施颜色空间逆变换过程,可以将复杂度的增加保持在尽可能低的水平。此外,在ACT中,无论输入颜色空间如何,都使用固定颜色空间变换,例如YCgCo和YCgCo-R。
2.12.4 VVC中的ACT
ACT是基于CU而不是TU。用于颜色空间转换的核心变换与用于HEVC的核心变换保持相同。具体地,应用如下所述的正向和逆向YCgCo颜色变换矩阵。
另外,为了补偿残差信号在颜色变换前后的动态范围变化,对变换残差应用(-5,-5,-3)的QP调整。
另一方面,正向和逆向颜色变换需要访问所有三个分量的残差。相应地,在提议的实施方式中,ACT在以下两种情况下被禁用,其中,三个分量的所有残差都不可用。
分离树分割:当应用分离树时,一个CTU内的亮度和色度样点被不同的结构分割。这导致亮度树中的CU仅包含亮度分量,而色度树中的CU仅包含两个色度分量。
帧内子分割预测(intra sub-partition prediction,ISP):ISP子分割仅应用于亮度,而色度信号被编解码而不被划分。在当前的ISP设计中,除了最后一个ISP子分割外,其他子分割只包含亮度分量。
2.13内部位深度增加(Internal bit-depth increase,IBDI)
在HEVC和VVC编解码中,IBDI用于提高环内处理精度,以获得更好的编解码效率。
例如,对于具有8位位深度的图像/视频,不是直接对8位信号进行编码,而是通过将每个像素p左移2位来产生10位的源,例如,P<<2。那么对于编码器和解码器来说,它们没有来自8位的原始源的信息。相反,其将被视为10位视频。在解码时,如果需要重构8位视频,则将应用从10位到8位的转换并进行取整。例如,设p表示10位重构像素,则8位重构为clip3(0,255,(P+1)>>2))。
但是,不知道原始源的位深度,例如输入位深度,有时可能会损害编解码效率。例如,在变换跳过编解码中,允许的最低QP应与输入位深度而不是内部位深度对齐。
3.实施例解决的问题示例
(1)目前视频编解码中的量化和反量化只依赖于内部位深度,不考虑输入位深度。
(2)目前的环路滤波过程只依赖于内部位深度,不考虑输入位深度。
(3)目前的预测过程只依赖于内部位深度,不考虑输入位深度。
(4)目前LMCS过程只依赖内部位深度,不考虑输入位深度。
(5)目前重构过程只依赖于内部位深度,不考虑输入位深度。
(6)目前像素裁剪不考虑输入位深度。
(7)目前自适应颜色变换不考虑输入位深度。
4.实施例的示例
以下详细的项目应被视为解释一般概念的示例。不应狭隘地解释这些项目。此外,这些项目可以以任何方式组合。
在下文中,将内部位深度表示为IBD,输入位深度表示为iBD。
1.重构值可以根据输入位深度进行取整。
a.在一个示例中,对于IBD位深度中的值P,重构可以为clip3(0,(1<<IBD)–1,(P+(1<<(IBD–iBD–1)))>>(IBD–iBD)<<(IBD–iBD))。
b.在一个示例中,对于IBD位深度中的值P,重构可以为P>>(IBD–iBD)<<(IBD–iBD)。
c.可替换地,可以根据变换跳过块的最低允许QP对重构值进行取整。
2.预测值可以根据输入位深度进行取整。
a.在一个示例中,对于IBD位深度中的值P,之后使用的预测可以为clip3(0,(1<<IBD)–1,(P+(1<<(IBD–iBD–1)))>>(IBD–iBD)<<(IBD–iBD))。
b.在一个示例中,对于IBD位深度中的值P,之后使用的预测可以为P>>(IBD–iBD)<<(IBD–iBD)。
c.可替换地,可以根据变换跳过块的最低允许QP对预测值进行取整。3.环路滤波过程可以取决于输入位深度。
a.在一个示例中,可以根据输入位深度对环路滤波过程的输出进行取整。
i.在一个示例中,可以根据输入位深度对去方块过程的输出进行取整。
ii.在一个示例中,可以根据输入位深度对ALF过程的输出进行取整。
iii.在一个示例中,可以根据输入位深度对SAO过程的输出进行取整。
iv.在一个示例中,可以根据输入位深度对CC-ALF过程的输出进行取整。
b.可替换地,环路滤波过程可以取决于变换跳过块的最低允许QP。
4.LMCS过程可以取决于输入位深度。
a.在一个示例中,LMCS映射的输出可以根据输入位深度进行取整。
b.可替换地,LMCS过程可以取决于变换跳过块的最低允许QP。
5.像素裁剪范围可以取决于输入位深度。
a.在一个示例中,像素裁剪范围可以为[0,((1<<iBD)–1)<<(IBD–iBD)]。
b.在一个示例中,当IBD等于10并且iBD等于8时,像素裁剪范围可以为[0,1020]。
c.可替换地,像素裁剪范围可以取决于变换跳过块的最低允许QP。
6.自适应颜色变换可以取决于输入位深度。
a.在一个示例中,当iBD等于IBD时,可以应用YCoCg-R颜色变换。YCoCg颜色模型,也称为YCgCo颜色模型,是由关联的RGB颜色空间到亮度值(表示为Y)以及称为绿色色度(Cg)和橙色色度(Co)的两个色度值的简单变换形成的颜色空间。变换的缩放版本,有时称为YCoCg-R(其中“-R”指RGB可逆性),可以通过降低位深度有效地实施。
b.在一个示例中,当IBD–iBD>=2时,可以应用YCoCg颜色变换。
c.可替换地,自适应颜色变换可以取决于变换跳过块的最低允许QP。
7.在上述方法中,可以指示输入位深度为高级语法元素。
a.在一个示例中,可以在DPS/VPS/SPS/图片标头/条带标头中指示输入位深度。
b.在一个示例中,可以由变换跳过块的最低允许QP推断输入位深度。
8.是否和/或如何应用上述方法可以取决于当前块的特性。
a.在一个示例中,当当前块的QP小于给定阈值时,可以应用上述方法。
b.在一个示例中,当当前块的QP大于给定阈值时,可以应用上述方法。
c.在一个示例中,当(QP%6)等于当前块的某个值时,可以应用上述方法。
d.在一个示例中,当当前块的宽度和/或高度和/或尺寸小于给定阈值时,可以应用上述方法。
e.在一个示例中,当当前块的宽度和/或高度和/或尺寸大于给定阈值时,可以应用上述方法。
f.在一个示例中,上述方法可以仅应用于亮度块。
g.在一个示例中,上述方法可以仅应用于色度块。
h.在一个示例中,当当前块以模式X编解码时,可以应用上述方法。
i.在一个示例中,X可以指代帧内模式。
ii.在一个示例中,X可以指代帧间模式。
iii.在一个示例中,X可以指代变换跳过编解码模式。
iv.在一个示例中,X可以指代BDPCM模式。
v.在一个示例中,X可以指代IBC模式。
vi.在一个示例中,X可以指代调色板模式。
vii.在一个示例中,X可以指代ISP模式。
viii.在一个示例中,X可以指代MIP模式。
ix.在一个示例中,X可以指代LMCS模式。
x.在一个示例中,X可以指代CCLM模式。
xi.在一个示例中,X可以指代DM模式。
xii.在一个示例中,X可以指代DC模式。
xiii.在一个示例中,X可以指代ACT模式。
以上描述的示例可以结合到以下描述的方法的上下文中,例如,方法1800,其可以在视频解码器或视频编码器中执行。
图18示出了用于视频处理的示例性方法1800的流程图。方法1800包括,在操作1810,在视频的当前块和视频的比特流表示之间的转换期间,基于用于表示视频的位深度来确定给定位深度(bit-depth,BD)。
方法1800包括,在操作1820,对于转换的至少一个或多个计算,使用给定位深度作为计算位深度(computational bit-depth,cBD)来执行转换。
在一些实施例中,可以实现以下技术方案:
A1.一种视频处理方法,包括:在视频的当前块和视频的比特流表示之间的转换期间,基于用于表示视频的位深度来确定给定位深度(BD);以及对于转换的至少一个或多个计算,使用给定位深度作为计算位深度(cBD)来执行转换。
A2.方案A1的方法,其中,至少一个或多个计算包括对重构值或预测值的取整操作。
A3.方案A2的方法,其中,取整操作定义为:Clip3(0,(1<<cBD)–1,(P+(1<<(cBD–BD–1)))>>(cBD–BD)<<(cBD–BD)),其中,值P为具有计算位深度的重构值或预测值,其中Clip3(x,min,max)定义为:
Figure BDA0003636073970000231
A4.方案A2的方法,其中,取整操作定义为:P>>(cBD–BD)<<(cBD–BD),其中,值P为具有计算位深度的重构值或预测值。
A5.方案A2的方法,其中,取整操作是基于变换跳过块的最低允许量化参数(QP)。
A6.方案A1的方法,其中,至少一个或多个计算包括对环路滤波过程的输出值的取整操作。
A7.方案A6的方法,其中,环路滤波过程包括去方块过程、自适应环路滤波(ALF)过程、样点自适应偏移(SAO)过程或跨分量ALF(CC-ALF)过程中的至少一种。
A8.方案A6的方法,其中,环路滤波过程是基于变换跳过块的最低允许量化参数(QP)。
A9.方案A1的方法,其中,至少一个或多个计算包括亮度映射与色度缩放(LMCS)过程。
A10.方案A9的方法,其中,至少一个或多个计算包括对LMCS过程的输出的取整操作。
A11.方案A9的方法,其中,LMCS过程是基于变换跳过块的最低允许量化参数(QP)。
A12.方案A1的方法,其中,至少一个或多个计算包括对输出像素裁剪范围的像素裁剪操作。
A13.方案A12的方法,其中,输出像素裁剪范围为[0,((1<<BD)–1)<<(cBD–BD)]。
A14.方案A13的方法,其中,cBD=10,BD=8,其中,输出像素裁剪范围为[0,1020]。
A15.方案A12的方法,其中,输出像素裁剪范围是基于变换跳过块的最低允许量化参数(QP)。
A16.方案A1的方法,其中,至少一个或多个计算包括自适应颜色变换(ACT)。
A17.方案A16的方法,其中,ACT包括在确定BD等于cBD时的YCoCg-R颜色变换。
A18.方案A16的方法,其中,ACT包括在确定(cBD-BD)≥2时的YCoCg颜色变换。
A19.方案A16的方法,其中,ACT是基于变换跳过块的最低允许量化参数(QP)。
A20.方案A1的方法,其中,给定位深度在比特流表示中作为高级别语法元素信令通知。
A21.方案A20的方法,其中,在解码器参数集(DPS)、视频参数集(VPS)、序列参数集(SPS)、图片标头或条带标头中信令通知给定位深度。
A22.方案A20的方法,其中,给定位深度是从变换跳过块的最低允许量化参数(QP)推断的。
A23.方案A1至A22中任一项的方法,其中,至少一个或多个计算进一步基于当前块的一个或多个特性。
A24.方案A23的方法,其中,一个或多个特性包括当前块的量化参数(QP)小于预定阈值。
A25.方案A23的方法,其中,一个或多个特性包括当前块的量化参数(QP)大于预定阈值。
A26.方案A23的方法,其中,一个或多个特性包括(QP%6)为预定值,其中,QP为当前块的量化参数。
A27.方案A23的方法,其中,一个或多个特性包括当前块的宽度、高度或尺寸小于预定阈值。
A28.方案A23的方法,其中,一个或多个特性包括当前块的宽度、高度或尺寸大于预定阈值。
A29.方案A23的方法,其中,一个或多个特性包括当前块是亮度块或色度块。
A30.方案A23的方法,其中,一个或多个特性包括当前块的编解码模式是帧内模式、帧间模式、变换跳过编解码模式、块差分脉冲编解码调制(BDPCM)模式、帧内块复制(IBC)模式、调色板模式、帧内子分割预测(ISP)模式、基于矩阵的帧内预测(MIP)模式、亮度映射与色度缩放(LMCS)模式、跨分量线性模型(CCLM)模式、DM模式、DC模式或自适应颜色变换(ACT)模式。
A31.方案A1至A30中任一项的方法,其中,转换从比特流表示产生当前块。
A32.方案A1至A30中任一项的方法,其中,转换从当前块产生比特流表示。
A33.一种视频系统中的装置,包括处理器和其上具有指令的非暂态存储器,其中,指令在被处理器执行后,使处理器执行方案A1至A32中任一项的方法。
A34.一种存储在非暂态计算机可读介质上的计算机程序产品,该计算机程序产品包括用于执行方案A1至A32中任一项中的方法的程序代码。
图19示出了示例视频处理系统1900的框图,其可以实施本公开的各种技术。各种实施可以包括系统1900的一些或所有组件。系统1900可以包括用于接收视频内容的输入1902。视频内容可以以原始或未压缩格式(例如,8或10位多分量像素值)接收,或者可以以压缩或编码格式接收。输入1902可以表示网络接口、外围总线接口或存储接口。网络接口的示例包括例如以太网、无源光网络(PON)等的有线接口和例如Wi-Fi或蜂窝接口的无线接口。
系统1300可以包括编解码组件1904,其可以实现本文档中描述的各种编解码或编码方法。编解码组件1904可以降低从输入1902到编解码组件1304输出的视频平均比特率以产生视频的编解码表示。因此,编解码技术有时被称为视频压缩或视频转码技术。编解码组件1904的输出可以被存储或通过连接的通信传输,如组件1906所示。在输入1902处接收的视频的存储或传送的比特流(或编解码)表示可以被组件1908用于产生发送到显示接口1910的像素值或可显示视频。从比特流表示产生用户可见视频的过程有时被称为视频解压缩。此外,虽然某些视频处理操作被称为“编解码”操作或工具,还应认识到,编解码工具或操作用于编码器,且相应的将编解码结果反转的解码工具或操作将由解码器执行。
外围总线接口或显示接口的示例可以包括通用串行总线(USB)或高清多媒体接口(HDMI)或显示端口等。存储接口的示例包括SATA(串行高级技术附件)、PCI、IDE接口等。本文档中描述的技术可以体现在各种电子设备中,例如移动电话、笔记本电脑、智能电话或能够执行数字数据处理和/或视频显示的其他设备。
图20是描述可以利用本公开的技术的示例视频编解码系统100的框图。
如图20所示,视频编解码系统100可以包括源设备110和目的设备120。源设备110产生可以被称为视频编码设备的编码视频数据。目的设备120可以解码由源设备110产生的编码视频数据,可以被称为视频解码设备。
源设备110可以包括视频源112、视频编码器114和输入/输出(I/O)接口116。
视频源112可以包括诸如视频捕获设备、从视频内容提供者接收视频数据的接口、和/或用于产生视频数据的计算机图形系统之类的源,或这些源的组合。视频数据可以包括一幅或多幅图片。视频编码器114对来自视频源112的视频数据进行编码以产生比特流。比特流可以包括形成视频数据的编解码表示的位序列。比特流可以包括编解码图片和相关数据。编解码图片是图片的编解码表示。关联数据可以包括序列参数集、图片参数集和其他语法结构。I/O接口116可以包括调制器/解调器(调制解调器)和/或发射器。编码的视频数据可以通过网络130a经由I/O接口116直接发送到目的设备120。编码的视频数据也可以存储在存储介质/服务器130b上以供目的设备120访问。
目的设备120可以包括I/O接口126、视频解码器124和显示设备122。
I/O接口126可以包括接收器和/或调制解调器。
I/O接口126可以从源设备110或存储介质/服务器130b获取编码视频数据。视频解码器124可解码经编码视频数据。显示设备122可以向用户显示解码的视频数据。显示设备122可以与目标设备120集成,或者可以在目标设备120外部,目标设备120配置为与外部显示设备接口。
视频编码器114和视频解码器124可以根据视频压缩标准操作,例如高效视频编码(HEVC)标准、通用视频编码(VVC)标准和其他当前和/或进一步的标准。
图21是说明视频编码器200的示例的框图,视频编码器200可以是在图20中说明的系统100中的视频编码器114。
视频编码器200可经配置以执行本公开的任何或所有技术。在图21的示例中,视频编码器200包括多个功能组件。本公开中描述的技术可在视频编码器200的各种组件之间共享。在一些示例中,处理器可以被配置为执行本公开中描述的任何或所有技术。
视频编码器200的功能组件可以包括分区单元201、预测单元202(可以包括模式选择单元203、运动估计单元204、运动补偿单元205和帧内预测单元206)、残差产生单元207、变换单元208、量化单元209、逆量化单元210、逆变换单元211、重构单元212、缓冲器213和熵编码单元214。
在其他示例中,视频编码器200可包括更多、更少或不同的功能组件。在一个示例中,预测单元202可以包括帧内块复制(IBC)单元。IBC单元可以在IBC模式下执行预测,其中至少一个参考图片是当前视频块所在的图片。
此外,诸如运动估计单元204和运动补偿单元205的一些组件可以高度集成,但是为了解释的目的而在图5的示例中单独表示。
分割单元201可将图片分割成一个或多个视频块。视频编码器200和视频解码器300可以支持各种视频块尺寸。
模式选择单元203可以选择编解码模式之一(帧内或帧间,例如基于错误结果),并且将得到的帧内或帧间编解码块提供给残差产生单元207以产生残差块数据,并提供给重构单元212以重构编码块以用作参考图片。在一些示例中,模式选择单元203可以选择帧内和帧间预测(CIIP)模式的组合,其中预测基于帧间预测信号和帧内预测信号。在帧间预测的情况下,模式选择单元203还可以为块选择运动矢量(例如,子像素或整数像素精度)的分辨率。
为了对当前视频块执行帧间预测,运动估计单元204可以通过将来自缓冲器213的一个或多个参考帧与当前视频块进行比较来产生当前视频块的运动信息。运动补偿单元205可以基于来自缓冲器213的除了与当前视频块相关联的图片之外的图片的运动信息和解码样点来确定当前视频块的预测视频块。
运动估计单元204和运动补偿单元205可以对当前视频块执行不同的操作,例如,取决于当前视频块是在I条带、P条带还是B条带中。
在一些示例中,运动估计单元204可为当前视频块执行单向预测,且运动估计单元204可搜索列表0或列表1的参考图片以寻找当前视频块的参考视频块。运动估计单元204可接着产生指示列表0或列表1中包含参考视频块的参考图片的参考索引和指示当前视频块与参考视频块之间的空间位移的运动矢量。运动估计单元204可输出参考索引、预测方向指示符和运动矢量作为当前视频块的运动信息。运动补偿单元205可以基于由当前视频块的运动信息指示的参考视频块来产生当前块的预测视频块。
在其他示例中,运动估计单元204可为当前视频块执行双向预测,运动估计单元204可在列表0中的参考图片中搜索当前视频块的参考视频块,并且还可在列表1中的参考图片中搜索当前视频块的另一参考视频块。运动估计单元204可接着产生指示列表0和列表1中的参考图片的参考索引,其包含参考视频块和指示参考视频块与当前视频块之间的空间位移的运动矢量。运动估计单元204可以输出当前视频块的参考索引和运动矢量作为当前视频块的运动信息。运动补偿单元205可以基于由当前视频块的运动信息指示的参考视频块来产生当前视频块的预测视频块。
在一些示例中,运动估计单元204可以输出完整的运动信息集以用于解码器的解码处理。
在一些示例中,运动估计单元204可以不输出当前视频的完整的运动信息集。相反,运动估计单元204可参考另一视频块的运动信息来信令通知当前视频块的运动信息。例如,运动估计单元204可确定当前视频块的运动信息与相邻视频块的运动信息足够相似。
在一个示例中,运动估计单元204可在与当前视频块相关联的句法结构中指示一个值,该值向视频解码器300指示当前视频块具有与另一视频块相同的运动信息。
在另一示例中,运动估计单元204可在与当前视频块相关联的语法结构中识别另一视频块和运动矢量差(motion vector difference,MVD)。运动矢量差表示当前视频块的运动矢量与指示的视频块的运动矢量之间的差。视频解码器300可以使用所指示的视频块的运动矢量和运动矢量差来确定当前视频块的运动矢量。
如上文所讨论,视频编码器200可预测性地信令通知运动矢量。可由视频编码器200实施的预测信令通知技术的两个示例包括高级运动矢量预测(advanced motionvector predication,AMVP)和merge模式信令通知。
帧内预测单元206可以对当前视频块执行帧内预测。当帧内预测单元206对当前视频块执行帧内预测时,帧内预测单元206可以基于同一图片中的其他视频块的解码样点产生当前视频块的预测数据。当前视频块的预测数据可以包括预测视频块和各种语法元素。
残差产生单元207可通过从当前视频块减去(例如,由负号指示)当前视频块的预测视频块来产生当前视频块的残差数据。当前视频块的残差数据可以包括残差视频块,该残差视频块对应于当前视频块中样点的不同样点分量。
在其他示例中,对于当前视频块可能不存在当前视频块的残差数据,例如在跳过模式中,并且残差产生单元207可能不执行减法运算。
变换处理单元208可以通过对与当前视频块相关联的残差视频块应用一个或多个变换,为当前视频块产生一个或多个变换系数视频块。
在变换处理单元208产生与当前视频块相关联的变换系数视频块之后,量化单元209可基于与当前视频块相关联的一个或多个量化参数(QP)值来量化与当前视频块相关联的变换系数视频块。
逆量化单元210和逆变换单元211可以分别对变换系数视频块应用逆量化和逆变换,以从变换系数视频块重构残差视频块。重构单元212可将重构的残差视频块添加到来自预测单元202产生的一个或多个预测视频块的对应样点中,以产生与当前块相关联的重构视频块以存储在缓冲器213中。
在重构单元212重构视频块之后,可以执行环路滤波操作以减少视频块中的视频块伪影。
熵编码单元214可以从视频编码器200的其他功能组件接收数据。当熵编码单元214接收数据时,熵编码单元214可执行一个或多个熵编码操作以产生熵编码数据并输出包括熵编码数据的比特流。
图22是说明视频解码器300的示例框图,视频解码器300可以是图20中说明的系统100中的视频解码器114。
视频解码器300可经配置以执行本公开任何或所有技术。在图22的示例中,视频解码器300包括多个功能组件。本公开中描述的技术可在视频解码器300的各种组件之间共享。在一些示例中,处理器可以被配置为执行本公开中描述的任何或所有技术。
在图22的示例中,视频解码器300包括熵解码单元301、运动补偿单元302、帧内预测单元303、逆量化单元304、逆变换单元305、以及重构单元306和缓冲器307。在一些示例中,视频解码器300可以执行通常与关于视频编码器200(例如,图21)描述的编码通道(pass)相反的解码通道。
熵解码单元301可以检索编码比特流。编码比特流可以包括熵编解码的视频数据(例如,编码的视频数据块)。熵解码单元301可以解码熵编解码的视频数据,并且根据熵解码的视频数据,运动补偿单元302可以确定包括运动矢量、运动矢量精度、参考图片列表索引和其他运动信息的运动信息。例如,运动补偿单元302可以通过执行AMVP和merge模式来确定该信息。
运动补偿单元302可以产生运动补偿块,可能基于插值滤波器执行插值。以子像素精度使用的插值滤波器的标识符可以包括在语法元素中。
运动补偿单元302可使用视频编码器20在对视频块进行编码期间使用的内插滤波器来计算参考块的子整数像素的内插值。运动补偿单元302可根据接收的语法信息来确定由视频编码器200使用的内插滤波器并且使用内插滤波器来产生预测块。
运动补偿单元302可以使用一些语法信息来确定用于对编码视频序列的帧和/或条带进行编码的块的尺寸、描述编码视频序列的图片的每个宏块如何分割的分割信息、指示每个分割如何编码的模式、每个帧间编码块的一个或多个参考帧(和参考帧列表)以及其他解码编码的视频序列的信息。
帧内预测单元303可以使用例如在比特流中接收的帧内预测模式来从空间相邻块形成预测块。逆量化单元303对在比特流中提供并由熵解码单元301解码的量化视频块系数进行逆量化,即反量化。逆变换单元303应用逆变换。
重建单元306可将残差块与由运动补偿单元202或帧内预测单元303产生的对应预测块相加以形成解码块。如果需要,还可以应用去方块滤波器来过滤解码的块,以便去除块状伪影。然后将解码的视频块存储在缓冲器307中,缓冲器307为随后的运动补偿提供参考块并且还产生用于在显示设备上呈现的解码视频。
图23是本技术的视频处理方法的流程图表示。方法2300包括,在操作2310,对于视频的当前块和视频的比特流表示之间的转换,基于当前块中源样点的输入位深度来确定自适应颜色变换编解码工具的使用。方法2300还包括,在操作2320,基于该确定执行转换。
在一些实施例中,在转换期间,在输入位深度与自适应颜色变换编解码工具的内部位深度相同的情况下,应用从绿-蓝-红颜色空间到亮度值Y和两个色度值的颜色变换,两个色度值包括具有可逆性的绿色色度(Cg)和橙色色度(Co)。在一些实施例中,自适应颜色变换编解码工具的内部位深度表示为IBD,输入位深度表示为iBD。在转换过程中,在IBD-iBD≥2的情况下,应用从绿-蓝-红颜色空间到亮度值Y和两个色度值的颜色变换,两个色度值包括绿色色度(Cg)和橙色色度(Co)。在一些实施例中,基于与当前块相关联的一个或多个变换跳过块的最低允许量化参数应用自适应颜色变换编解码工具。
图24是本技术的视频处理方法的流程图表示。方法2400包括,在操作2410,对于视频的当前块和视频的比特流表示之间的转换,根据样点的源值的输入位深度来确定当前块的样点的重构值或预测值被取整。方法2400还包括,在操作2420,基于该确定执行转换。
在一些实施例中,输入位深度表示为iBD。值P表示在内部位深度IBD中。与值P对应的重构值或预测值等于clip3(0,(1<<IBD)-1,(P+(1<<(IBD-iBD-1)))>>(IBD-iBD)<<(IBD-iBD)),其中,clip3定义为
Figure BDA0003636073970000321
在一些实施例中,输入位深度表示为iBD,其中,值P表示在内部位深度IBD中,并且其中,与值P对应的重构值或预测值等于P>>(IBD-iBD)<<(IBD-iBD)。
在一些实施例中,基于与当前块相关联的一个或多个变换跳过块的最低允许量化参数来确定重构值或预测值。
图25是本技术的视频处理方法的流程图表示。方法2500包括,在操作2510,对于视频的当前块和视频的比特流表示之间的转换,基于当前块中源样点的输入位深度来确定环路滤波过程的使用。方法2500包括,在操作2520,基于该确定执行转换。
在一些实施例中,根据输入位深度对环路滤波过程的输出进行取整。在一些实施例中,环路滤波过程包括以下至少一项:去方块过程、自适应环路滤波过程、样点自适应偏移过程或跨分量自适应环路滤波过程。在一些实施例中,基于与当前块相关联的一个或多个变换跳过块的最低允许量化参数来确定环路滤波过程的使用。
图26是本技术的视频处理方法的流程图表示。方法2600包括,在操作2610,对于视频的当前块和视频的比特流表示之间的转换,基于当前块中源样点的输入位深度来确定亮度映射与色度缩放(LMCS)编解码工具的使用。方法2600还包括,在操作2620,基于该确定执行转换。
在一些实施例中,根据输入位深度对LMCS编解码工具的输出进行取整。在一些实施例中,基于与当前块相关联的一个或多个变换跳过块的最低允许量化参数来确定LMCS编解码工具的使用。
图27是本技术的视频处理方法的流程图表示。方法2700包括,在操作2710,对于视频块和视频的比特流表示之间的转换,基于源像素的输入比特深度确定关于像素裁剪范围。方法2700还包括,在操作2720,基于该确定执行转换。
在一些实施例中,转换的内部位深度表示为IBD,并且输入位深度表示为iBD,并且其中,像素裁剪范围等于[0,((1<<iBD))-1)<<(IBD-iBD)]。在一些实施例中,在内部位深度为10且输入位深度为8的情况下,像素裁剪范围为[0,1020]。在一些实施例中,像素裁剪范围是基于与当前块相关联的一个或多个变换跳过块的最低允许量化参数。
在一些实施例中,输入位深度被指示为比特流表示中的语法元素。在一些实施例中,语法元素被包括在比特流表示中的解码器参数集、视频参数集、序列参数集、图片标头或条带标头中。在一些实施例中,基于与当前块相关联的一个或多个变换跳过块的最低允许量化参数来确定输入位深度。
在一些实施例中,在上述方法中应用确定的方式是基于当前块的特性。在一些实施例中,在当前块的量化参数小于阈值的情况下应用确定。在一些实施例中,在当前块的量化参数大于阈值的情况下应用确定。在一些实施例中,当前块的特性包括表示为QP的当前块的量化参数,并且其中,在(QP%6)等于预定义值的情况下应用确定。在一些实施例中,在当前块的维度小于阈值的情况下应用确定。在一些实施例中,在当前块的维度大于阈值的情况下应用确定。在一些实施例中,在当前块与视频的亮度分量相关联的情况下应用确定。在一些实施例中,在当前块与视频的色度分量相关联的情况下应用确定。在一些实施例中,在当前块以特定编解码模式编解码的情况下应用确定。在一些实施例中,特定编解码模式至少包括:帧内模式、帧间模式、变换跳过模式、块差分脉冲编解码调制(BDPCM)模式、帧内块复制模式、调色板模式、帧内子分割预测模式、基于矩阵的帧内预测模式、亮度映射与色度缩放模式、跨分量线性模型模式、推导的模式、DC预测模式或自适应颜色变换模式。
在一些实施例中,转换从比特流表示生成当前块。在一些实施例中,转换从当前块生成比特流表示。
应当理解,所公开的技术可以体现在视频编码器或解码器中,以使用增强的编解码树结构来提高压缩效率。
所公开技术的一些实施例包括做出以启用视频处理工具或模式的决定或确定。在一个示例中,当视频处理工具或模式被启用时,编码器将在处理视频块时使用或实施该工具或模式,但可能不必基于该工具或模式的使用来修改生成的比特流。也就是说,从视频块到视频的比特流表示的转换将使用视频处理工具或模式,当其基于决定或确定被启用时。在另一示例中,当视频处理工具或模式被启用时,解码器将在已知比特流已基于视频处理工具或模式修改的情况下处理比特流。也就是说,从视频的比特流表示到视频块的转换将使用基于决定或确定启用的视频处理工具或模式来执行。
所公开技术的一些实施例包括做出禁用视频处理工具或模式的决定或确定。在一个示例中,当视频处理工具或模式被禁用时,编码器将不使用该工具或模式将视频块转换为视频的比特流表示。在另一示例中,当视频处理工具或模式被禁用时,解码器将在已知比特流尚未使用基于决定或确定而启用的视频处理工具或模式被修改的情况下处理比特流。
本文档中所公开的和其他解决方案、示例、实施例、模块和功能操作可以在数字电子电路或计算机软件、固件或硬件中实现,包括本文档中公开的结构及其结构等效物,或其中的一种或多种的组合。所公开的和其他实施例可以实施为一个或多个计算机程序产品,即,在计算机可读介质上编码的一个或多个计算机程序指令模块,由数据处理设备执行或控制操作。计算机可读介质可以是机器可读存储设备、机器可读存储基板、存储器设备、影响机器可读传播信号的物质组合物,或者其中的一个或多个的组合。计算机可读介质可以是机器可读存储设备、机器可读存储基板、存储设备、影响机器可读传播信号的物质组合,或其中一项或多项的组合。术语“数据处理装置”涵盖处理数据的所有装置、设备和机器,例如包括可编程处理器、计算机或多个处理器或计算机。除了硬件之外,该装置还可以包括为所讨论的计算机程序创建执行环境的代码,例如,构成处理器固件、协议栈、数据库管理系统、操作系统或其中一个或多个的组合代码。传播的信号是人工产生的信号,例如机器产生的电、光或电磁信号,其被产生是为了对信息进行编码以传输到合适的接收器设备。
计算机程序(也称为程序、软件、软件应用程序、脚本或代码)可以以任何形式的编程语言(包括编译或解释语言)编写,并且可以以任何形式进行部署,包括独立程序或适合在计算环境中使用的模块、组件、子例程或其他单元。计算机程序不一定与文件系统中的文件相对应。程序可以存储在保存其他程序或数据的文件的一部分中(例如,存储在标记语言文档中的一个或多个脚本),存储在专用于所讨论程序的单个文件中或多个协调文件(例如,存储一个或多个模块、子程序或部分代码的文件)。可以部署计算机程序,以在一台计算机或位于一个位置上或分布在多个位置上并通过通信网络互连的多台计算机上执行。
本文档中描述的过程和逻辑流程可以由一个或多个可编程处理器来执行,以执行一个或多个计算机程序,从而通过对输入数据进行操作并产生输出来执行功能。处理和逻辑流程也可以由专用逻辑电路执行,并且也可以实现为专用逻辑电路,例如FPGA(fieldprogrammable gate array,现场可编程门阵列)或ASIC(application specificintegrated circuit,应用专用集成电路)。
例如,适合于执行计算机程序的处理器包括通用和专用微处理器,以及任何种类的数字计算机的任何一个或多个处理器。通常,处理器将从只读存储器或随机存取存储器或两者接收指令和数据。计算机的基本元件是用于执行指令的处理器和用于存储指令和数据的一个或多个存储器装置。通常,计算机还将包括或可操作地耦合到一个或多个用于存储数据的大容量存储设备,例如,磁盘、磁光盘或光盘,以从中接收数据,或将数据传输到一个或多个大容量存储设备,或两者。但是,计算机不必具有这样的装置。适用于存储计算机程序指令和数据的计算机可读介质包括所有形式的非易失性存储器、介质和存储器装置,包括例如半导体存储设备,例如EPROM、EEPROM和闪存设备;磁盘,例如内置硬盘或可移动磁盘;磁光盘;以及CD ROM和DVD-ROM磁盘。处理器和存储器可以由专用逻辑电路补充或并入专用逻辑电路中。
尽管本专利文档包含许多细节,但是这些细节不应解释为对任何发明或可要求保护的范围的限制,而应解释为对特定发明的特定实施例可能特定的特征的描述。在单独的实施例的上下文中在本专利文档中描述的某些特征也可以在单个实施例中组合实现。相反,在单个实施例的上下文中描述的各种特征也可以分别在多个实施例中或以任何合适的子组合来实现。此外,尽管以上可以将特征描述为以某些组合起作用并且甚至最初如此要求保护,但是在某些情况下,可以从组合中剔除所要求保护的组合中的一个或多个特征,并且所要求保护的组合可以涉及子组合或子组合的变体。
类似地,虽然在附图中以特定顺序描绘了操作,但是这不应理解为要求以所示的特定顺序或以连续的顺序执行这样的操作,或者执行所有示出的操作以实现期望的效果。此外,在该专利文档中描述的实施例中的各种系统组件的分离不应被理解为在所有实施例中都需要这种分离。
仅描述了一些实施方式和示例,并且可以基于本专利文档中描述和示出的内容进行其他实施方式、增强和变化。

Claims (38)

1.一种视频处理方法,包括:
对于视频的当前块和所述视频的比特流表示之间的转换,基于所述当前块中源样点的输入位深度来确定自适应颜色变换编解码工具的使用;以及
基于所述确定执行转换。
2.如权利要求1所述的方法,其中,在所述转换期间,在所述输入位深度与所述自适应颜色变换编解码工具的内部位深度相同的情况下,应用从绿-蓝-红颜色空间到亮度值Y和两个色度值的颜色变换,所述两个色度值包括具有可逆性的绿色色度(Cg)和橙色色度(Co)。
3.如权利要求1所述的方法,其中,所述自适应颜色变换编解码工具的内部位深度表示为IBD,所述输入位深度表示为iBD,并且其中,在所述转换过程中,在IBD-iBD≥2的情况下,应用从绿-蓝-红颜色空间到亮度值Y和两个色度值的颜色变换,所述两个色度值包括绿色色度(Cg)和橙色色度(Co)。
4.如权利要求1至3任一所述的方法,其中,基于与所述当前块相关联的一个或多个变换跳过块的最低允许量化参数,应用所述自适应颜色变换编解码工具。
5.一种视频处理方法,包括:
对于视频的当前块和所述视频的比特流表示之间的转换,根据样点的源值的输入位深度来确定所述当前块的所述样点的重构值或预测值被取整;以及
基于所述确定执行转换。
6.如权利要求5所述的方法,其中,所述输入位深度表示为iBD,其中,值P表示在内部位深度IBD中,并且其中,与所述值P对应的所述重构值或所述预测值等于clip3(0,(1<<IBD)-1,(P+(1<<(IBD-iBD-1)))>>(IBD-iBD)<<(IBD-iBD)),其中,clip3定义为
Figure FDA0003636073960000011
7.如权利要求5所述的方法,其中,所述输入位深度表示为iBD,其中,值P表示在内部位深度IBD中,并且其中,与所述值P对应的所述重构值或所述预测值等于P>>(IBD-iBD)<<(IBD-iBD)。
8.如权利要求5至7任一所述的方法,其中,基于与所述当前块相关联的一个或多个变换跳过块的最低允许量化参数来确定所述重构值或所述预测值。
9.一种视频处理方法,包括:
对于视频的当前块和所述视频的比特流表示之间的转换,基于所述当前块中源样点的输入位深度来确定环路滤波过程的使用;以及
基于所述确定执行转换。
10.如权利要求9所述的方法,其中,根据所述输入位深度对所述环路滤波过程的输出进行取整。
11.如权利要求10所述的方法,其中,所述环路滤波过程包括以下至少一项:去方块过程、自适应环路滤波过程、样点自适应偏移过程或跨分量自适应环路滤波过程。
12.如权利要求9至11任一所述的方法,其中,基于与所述当前块相关联的一个或多个变换跳过块的最低允许量化参数来确定所述环路滤波过程的使用。
13.一种视频处理方法,包括:
对于视频的当前块和所述视频的比特流表示之间的转换,基于所述当前块中源样点的输入位深度来确定亮度映射与色度缩放(LMCS)编解码工具的使用;以及
基于所述确定执行转换。
14.如权利要求13所述的方法,其中,根据所述输入位深度对所述LMCS编解码工具的输出进行取整。
15.如权利要求13或14所述的方法,其中,基于与所述当前块相关联的一个或多个变换跳过块的最低允许量化参数来确定所述LMCS编解码工具的使用。
16.一种视频处理方法,包括:
对于视频的当前块和所述视频的比特流表示之间的转换,基于源像素的输入位深度确定像素裁剪范围;以及
基于所述确定执行转换。
17.如权利要求16所述的方法,其中,所述转换的内部位深度表示为IBD,并且所述输入位深度表示为iBD,并且其中,所述像素裁剪范围等于[0,((1<<iBD))-1)<<(IBD-iBD)]。
18.如权利要求17所述的方法,其中,在所述内部位深度为10且所述输入位深度为8的情况下,所述像素裁剪范围为[0,1020]。
19.如权利要求16至18任一所述的方法,其中,所述像素裁剪范围是基于与所述当前块相关联的一个或多个变换跳过块的最低允许量化参数。
20.如权利要求1至19任一所述的方法,其中,所述输入位深度被指示为所述比特流表示中的语法元素。
21.如权利要求20所述的方法,其中,所述语法元素被包括在所述比特流表示中的解码器参数集、视频参数集、序列参数集、图片标头或条带标头中。
22.如权利要求20或21所述的方法,其中,基于与所述当前块相关联的一个或多个变换跳过块的最低允许量化参数来确定所述输入位深度。
23.如权利要求1至22任一所述的方法,其中,应用所述确定的方式是基于所述当前块的特性。
24.如权利要求23所述的方法,其中,在所述当前块的量化参数小于阈值的情况下应用所述确定。
25.如权利要求23所述的方法,其中,在所述当前块的量化参数大于阈值的情况下应用所述确定。
26.如权利要求23所述的方法,其中,所述当前块的特性包括表示为QP的所述当前块的量化参数,并且其中,在(QP%6)等于预定义值的情况下应用所述确定。
27.如权利要求23所述的方法,其中,在所述当前块的维度小于阈值的情况下应用所述确定。
28.如权利要求23所述的方法,其中,在所述当前块的维度大于阈值的情况下应用所述确定。
29.如权利要求23所述的方法,其中,在所述当前块与所述视频的亮度分量相关联的情况下应用所述确定。
30.如权利要求23所述的方法,其中,在所述当前块与所述视频的色度分量相关联的情况下应用所述确定。
31.如权利要求23所述的方法,其中,在所述当前块以特定编解码模式编解码的情况下应用所述确定。
32.如权利要求31所述的方法,其中,所述特定编解码模式至少包括:帧内模式、帧间模式、变换跳过模式、块差分脉冲编解码调制(BDPCM)模式、帧内块复制模式、调色板模式、帧内子分割预测模式、基于矩阵的帧内预测模式、亮度映射与色度缩放模式、跨分量线性模型模式、推导的模式、DC预测模式或自适应颜色变换模式。
33.如权利要求1至32任一所述的方法,其中,所述转换从所述比特流表示生成所述当前块。
34.如权利要求1至32任一所述的方法,其中,所述转换从所述当前块生成所述比特流表示。
35.一种视频系统中的装置,包括处理器和带有指令的非暂时性存储器,其中,所述指令在被所述处理器执行时,使所述处理器执行如权利要求1至32任一项所述的方法。
36.一种存储在非暂时性计算机可读介质上的计算机程序产品,其中,所述计算机程序产品包括用于执行如权利要求1至32任一项所述的方法的程序代码。
37.一种视频处理装置,包括处理器,所述处理器被配置为执行如权利要求1至32任一项或多项所述的方法。
38.一种其上存储有视频的比特流表示的计算机可读介质,所述比特流表示是根据权利要求1至32中任一项或多项所述的方法生成的。
CN202080078183.2A 2019-11-14 2020-11-12 低位深度视觉媒体数据的编解码 Pending CN115066897A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN2019118476 2019-11-14
CNPCT/CN2019/118476 2019-11-14
PCT/CN2020/128301 WO2021093801A1 (en) 2019-11-14 2020-11-12 Coding of low bit-depth visual media data

Publications (1)

Publication Number Publication Date
CN115066897A true CN115066897A (zh) 2022-09-16

Family

ID=75911826

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080078183.2A Pending CN115066897A (zh) 2019-11-14 2020-11-12 低位深度视觉媒体数据的编解码

Country Status (2)

Country Link
CN (1) CN115066897A (zh)
WO (1) WO2021093801A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024083248A1 (en) * 2022-10-21 2024-04-25 Douyin Vision Co., Ltd. Method, apparatus, and medium for visual data processing

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024193431A1 (en) * 2023-03-17 2024-09-26 Mediatek Inc. Method and apparatus of combined prediction in video coding system

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB201119206D0 (en) * 2011-11-07 2011-12-21 Canon Kk Method and device for providing compensation offsets for a set of reconstructed samples of an image
CN104322062B (zh) * 2012-06-26 2016-12-21 英特尔公司 跨层跨通道样本预测
US10334253B2 (en) * 2013-04-08 2019-06-25 Qualcomm Incorporated Sample adaptive offset scaling based on bit-depth
US20140376611A1 (en) * 2013-06-21 2014-12-25 Qualcomm Incorporated Adaptive color transforms for video coding
US9948933B2 (en) * 2014-03-14 2018-04-17 Qualcomm Incorporated Block adaptive color-space conversion coding
US9838662B2 (en) * 2014-10-10 2017-12-05 Qualcomm Incorporated Harmonization of cross-component prediction and adaptive color transform in video coding
CN113453000B (zh) * 2016-07-22 2024-01-12 夏普株式会社 使用自适应分量缩放对视频数据进行编码的系统和方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024083248A1 (en) * 2022-10-21 2024-04-25 Douyin Vision Co., Ltd. Method, apparatus, and medium for visual data processing

Also Published As

Publication number Publication date
WO2021093801A1 (en) 2021-05-20

Similar Documents

Publication Publication Date Title
CN113728642B (zh) 编解码视频的量化残差差分脉冲编解码调制表示
CN114208174B (zh) 预测过程中的调色板模式编解码
CN113711591A (zh) 用于色度残差的联合编解码的语法元素的信令
CN114630132A (zh) 视频编解码的基于神经网络的环路内滤波器中的模型选择
US12081758B2 (en) Block dimension settings of transform skip mode
US11870996B2 (en) Transform bypass coded residual blocks in digital video
US20230217024A1 (en) Size Restriction Based for Chroma Intra Mode
CN113796069B (zh) 使用量化残差差分脉冲编解码调制编解码的帧内编解码视频
CN114208191A (zh) 基于颜色格式的视频区域分割
US20240048735A1 (en) Cross-component adaptive loop filter
US20240015328A1 (en) Selective use of adaptive in-loop color-space transform and other video coding tools
US20230291894A1 (en) Quantization properties of adaptive in-loop color-space transform for video coding
CN113475077A (zh) 调色板模式使用指示的独立编解码
CN115066899A (zh) 编解码视频的可分二次变换处理
CN114930832A (zh) 跨分量自适应滤波和子块编解码
CN117769833A (zh) 视频编解码中的自适应双边滤波器
WO2021093801A1 (en) Coding of low bit-depth visual media data
US20240137573A1 (en) Bilateral filter in video coding
JP7442673B2 (ja) ビデオコーディングにおけるスキップブロックの変換のための最小許容量子化
WO2023274370A1 (en) Advanced bilateral filter in video coding
US20230023579A1 (en) Configurable Neural Network Model Depth In Neural Network-Based Video Coding
CN117716690A (zh) 自适应双边滤波器的使用条件

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination