CN113892267A - 使用编解码树结构类型控制编解码模式 - Google Patents
使用编解码树结构类型控制编解码模式 Download PDFInfo
- Publication number
- CN113892267A CN113892267A CN202080040213.0A CN202080040213A CN113892267A CN 113892267 A CN113892267 A CN 113892267A CN 202080040213 A CN202080040213 A CN 202080040213A CN 113892267 A CN113892267 A CN 113892267A
- Authority
- CN
- China
- Prior art keywords
- block
- tree structure
- current video
- current
- video block
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T9/00—Image coding
- G06T9/002—Image coding using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T9/00—Image coding
- G06T9/40—Tree coding, e.g. quadtree, octree
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
Abstract
一种用于可视媒体处理的示例性方法包括:为将可视媒体数据的视频区域中的当前视频块编码为可视媒体数据的比特流表示,做出关于至少基于与视频区域相关联的编解码树结构或至少从与视频区域相关联的编解码树结构推断的跨分量线性模型(CCLM)预测模式的应用的决定,其中,在CCLM预测模式下,在当前视频块的重构亮度样点上使用线性模型预测当前视频块的色度样点;以及在比特流表示中选择性地包括语法元素,其中该语法元素指示至少基于编解码树结构或至少从编解码树结构推断的CCLM预测模式的应用。
Description
相关申请的交叉引用
根据适用的专利法和/或巴黎公约的规则,本申请旨在及时要求2019年5月30日提交的国际专利申请No.PCT/CN2019/089250的优先权和权益。出于该法律的所有目的,前述申请的全部公开内容通过引用而并入,作为本专利公开内容的一部分。
技术领域
本文档涉及视频和图像编码/解码技术。
背景技术
数字视频占互联网和其他数字通信网络上最大的带宽使用。随着能够接收和显示视频的连网用户设备数量的增加,预计对数字视频使用的带宽需求将继续增长。
发明内容
描述了与数字视频编码/解码相关的设备、系统和方法,并且具体地,描述了用于视频编码/解码的变换跳过模式中的系数编解码。所描述的方法可以应用于现有的视频编解码标准(例如,高效视频编解码(High Efficiency Video Coding,HEVC))和未来的视频编解码标准(例如,多功能视频编解码(Versatile Video Coding,VVC))或编解码器。
在一个示例性方面,公开了一种用于可视媒体编码的方法。该方法包括:为将可视媒体数据的视频区域中的当前视频块编码为可视媒体数据的比特流表示,做出关于至少基于与视频区域相关联的编解码树结构或至少从与视频区域相关联的编解码树结构推断的跨分量线性模型(CCLM)预测模式的应用的决定,其中,在CCLM预测模式下,在当前视频块的重构亮度样点上使用线性模型预测当前视频块的色度样点;以及在比特流表示中选择性地包括语法元素,其中该语法元素指示至少基于编解码树结构或至少从编解码树结构推断的CCLM预测模式的应用。
在一个示例性方面,公开了一种用于可视媒体解码的方法。该方法包括:从包括包含当前视频块的视频区域的可视媒体数据的比特流表示确定与当前视频块相关联的编解码树结构;至少基于编解码树结构,确定语法元素是否被包括在比特流表示中,其中,语法元素指示跨分量线性模型(CCLM)预测模式对当前视频区域的应用,其中,在CCLM预测模式下,在当前视频块的重构亮度样点上使用线性模型预测当前视频块的色度样点;以及从比特流表示生成当前视频块。
在一个示例性方面,公开了一种用于可视媒体编码的方法。该方法包括:为将可视媒体数据的视频区域中的当前视频块编码为可视媒体数据的比特流表示,做出关于至少基于与视频区域相关联的编解码树结构或至少从与视频区域相关联的编解码树结构推断的亮度映射与色度缩放(LMCS)处理步骤对视频区域的应用的决定,其中,在LMCS处理步骤中,使用自适应分段线性模型映射视频区域中的亮度样点和/或对视频区域中的色度样点进行亮度依赖的色度残差缩放操作;以及在比特流表示中选择性地包括语法元素,其中该语法元素指示LMCS处理步骤对视频区域的应用。
在一个示例性方面,公开了一种用于可视媒体编码的方法。该方法包括:从包括包含当前视频块的视频区域的可视媒体数据的比特流表示确定与当前视频块相关联的编解码树结构;至少基于编解码树结构,确定语法元素是否被包括在比特流表示中,其中,语法元素指示亮度映射与色度缩放(LMCS)处理步骤对视频区域的应用,其中,在LMCS处理步骤中,使用自适应分段线性模型映射亮度样点,并且对色度样点进行亮度依赖的色度残差缩放操作;以及从比特流表示生成当前视频块。
在又一个示例方面,上述方法可以由包括处理器的视频编码器装置来实施。
在又一个示例方面,上述方法可以由包括处理器的视频解码器装置来实施。
在又一个示例方面,这些方法可以以处理器可执行指令的形式体现,并存储在计算机可读程序介质上。
本文档中还描述了这些和其他方面。
附图说明
图1示出了帧内块复制的示例。
图2示出了以调色板模式编解码的块的示例。
图3示出了使用调色板预测值来信令通知调色板条目的示例。
图4示出了水平和垂直横向扫描的示例。
图5示出了调色板索引的编解码的示例。
图6示出了多类型树划分模式的示例。
图7示出了用于在跨分量线性模型(CCLM)预测模式中导出参数的样点的示例。
图8示出了利用色度缩放的亮度映射的示例性架构。
图9A-图9E是视频处理方法的示例的流程图。
图10是用于实施本文档中描述的可视媒体解码或可视媒体编码技术的硬件平台的示例的框图。
图11是其中可以实施所公开的技术的示例视频处理系统的框图。
图12是可视媒体编码方法的示例的流程图。
图13是可视媒体解码方法的示例的流程图。
图14是可视媒体编码方法的示例的流程图。
图15是可视媒体解码方法的示例的流程图。
具体实施方式
本文档提供了图像或视频比特流的解码器可以使用的各种技术,以改进解压缩或解码的数字视频或图像的质量。为简洁起见,本文使用的术语“视频”包括图片序列(传统上称为视频)和单个图像。此外,视频编码器还可以在编码过程中实施这些技术,以便重构用于进一步编码的解码帧。
为了便于理解,在本文档中使用了章节标题,但是不将实施例和技术限制到相应的章节。这样,来自一个章节的实施例可以与来自其他章节的实施例相结合。
1.概述
本文档涉及视频编解码技术。具体地,它涉及视频编解码中的变换跳过模式中的系数编解码。它可以应用于现有的视频编解码标准(如HEVC)、或即将要定案的标准(例如,多功能视频编码(VCC))。它也可以应用于未来的视频编解码标准或视频编解码器。
2.初步讨论
视频编解码标准主要是通过熟知的ITU-T和ISO/IEC标准的发展而演变的。ITU-T制定了H.261和H.263,ISO/IEC制定了MPEG-1和MPEG-4可视化,并且这两个组织联合制定了H.262/MPEG-2视频和H.264/MPEG-4高级视频编解码(Advanced Video Coding,AVC)和H.265/HEVC标准[1,2]。自H.262以来,视频编解码标准基于混合视频编解码结构,其中利用时域预测加变换编解码。为了探索HEVC以外的未来视频编解码技术,VCEG和MPEG于2015年联合成立了联合视频探索组(Joint Video Exploration Team,JVET)。此后,JVET采用了许多新方法,并将其放入名为联合探索模型(Joint Exploration Model,JEM)的参考软件中。2018年4月,VCEG(Q6/16)和ISO/IEC JTC1 SC29/WG11(MPEG)之间的联合视频专家组(JVET)成立,以致力于VVC标准,目标是与HEVC相比比特率降低50%。
VVC草案的最新版本,即多功能视频编解码(草案4),可在以下网址找到:http://phenix.it-sudparis.eu/jvet/doc_end_user/current_document.php?id=5755
VVC最新的参考软件(名为VTM),可在以下网址找到:https://vcgit.hhi.fraunhofer.de/jvet/VVCSoftware_VTM/tags/VTM-4.0
2.1帧内块复制
在HEVC屏幕内容编码扩展(HEVC-SCC)和当前VVC测试模型(VTM-4.0)中采用了帧内块复制(Intra Block Copy,IBC),也称为当前图片参考。IBC将运动补偿的概念从帧间编解码扩展到帧内编解码。如图1所示,当应用IBC时,当前块由同一图片中的参考块预测。在当前块被编解码或解码之前,参考块中的样点必须已经被重构。尽管IBC对于大多数相机拍摄的序列来说效率不高,但它显示了屏幕内容的显著编解码增益。原因是屏幕内容图片中有许多重复图案,诸如图标和文本字符。IBC可以有效地消除这些重复图案之间的冗余。在HEVC-SCC中,如果帧间编解码单元(coding unit,CU)选择当前图像作为其参考图片,则它可以应用IBC。在这种情况下,MV被重命名为块矢量(block vector,BV),并且BV始终具有整数像素精度。为了与主简表(profile)HEVC兼容,当前图像在解码图像缓冲区(DecodedPicture Buffer,DPB)中被标记为“长期”参考图片。应当注意,类似地,在多视图/3D视频编解码标准中,视图间参考图片也被标记为“长期”参考图片。
在BV之后找到其参考块,可以通过复制参考块来生成预测。残差可以通过从原始信号中减去参考像素来获得。然后,可以像在其他编解码模式中一样应用变换和量化。
然而,当参考块在图片之外,或与当前块重叠,或在重构区域之外,或在受某些约束限制的有效区域之外时,部分或全部像素值未被定义。基本上,有两种方法可以解决这个问题。一种是不允许这种情况,例如,在比特流一致性中。另一种是为那些未定义的像素值应用填充(padding)。以下子章节详细描述了解决方案。
2.2 HEVC屏幕内容编解码扩展中的IBC
在HEVC的屏幕内容编解码扩展中,当块使用当前图片作为参考时,它应该保证整个参考块在可用的重构区域内,如以下规范文本所指示的:
变量offsetX和offsetY如下推导:
offsetX=(ChromaArrayType==0)?0:(mvCLX[0]&0x7?2:0) (8-106)
offsetY=(ChromaArrayType==0)?0:(mvCLX[1]&0x7?2:0) (8-107)
比特流一致性的要求是,当参考图片是当前图片时,亮度运动矢量mvLX应遵守以下约束:
–当条款6.4.1中规定的z扫描顺序块可用性的推导过程以设置为等于(xCb,yCb)的(xCurr,yCurr)和设置为等于(xPb+(mvLX[0]>>2)-offsetX,yPb+(mvLX[1]>>2)-offsetY)的邻近亮度位置(xNbY,yNbY)作为输入而被调用时,其中,输出应当等于TRUE(真)。
–当条款6.4.1中规定的z扫描顺序块可用性的推导过程以设置为等于(xCb,yCb)的(xCurr,yCurr)和设置为等于(xPb+(mvLX[0]>>2)+nPbW-1+offsetX,yPb+(mvLX[1]>>2)+nPbH-1+offsetY)的邻近亮度位置(xNbY,yNbY)作为输入而被调用时,输出应当等于TRUE。
–一个或两个以下条件应当为真:
–(mvLX[0]>>2)+nPbW+xB1+offsetX的值小于或等于0。
–(mvLX[1]>>2)+nPbH+yB1+offsetY的值小于或等于0。
–以下条件应当为真:
(xPb+(mvLX[0]>>2)+nPbSw-1+offsetX)/CtbSizeY-xCurr/CtbSizeY<=yCurr/CtbSizeY-(yPb+(mvLX[1]>>2)+nPbSh-1+offsetY)/CtbSizeY(8-108)
因此,参考块与当前块重叠或者参考块在图片之外的情况将不会发生。不需要填充参考或预测块。
2.3 VVC测试模型中的IBC
在当前的VVC测试模型中,即VTM-4.0设计中,整个参考块应该与当前的编解码树单元(Coding Tree Unit,CTU)一致,并且不与当前块重叠。因此,不需要填充参考或预测块。IBC标志被编解码为当前CU的预测模式。因此,对于每个CU,总共有三种预测模式,MODE_INTRA、MODE_INTER和MODE_IBC。
2.3.1 IBC Merge模式
在IBC Merge模式中,从比特流中解析指向IBC Merge候选列表中的条目的索引。IBC Merge列表的构造可以根据以下步骤序列进行总结:
步骤1:推导空域候选
步骤2:插入HMVP候选
步骤3:插入成对平均候选
在空域Merge候选的推导中,在位于位置A1、B1、B0、A0和B2中的候选当中选择最多四个Merge候选。推导的顺序是A1、B1、B0、A0和B2。仅当位置A1、B1、B0、A0的任何PU不可用(例如,因为它属于另一条带(slice)或片(tile))或者不用IBC模式被编解码时,才考虑位置B2。在添加位置A1处的候选之后,对剩余候选的添加进行冗余检查,其确保具有相同运动信息的候选被排除在列表之外,从而改进编解码效率。
在插入空域候选之后,如果IBC Merge列表尺寸仍然小于最大IBC Merge列表尺寸,则可以插入来自HMVP表的IBC候选。当插入HMVP候选时,执行冗余检查。
最后,成对平均候选被插入到IBC Merge列表中。
当由Merge候选对象标识的参考块在图片之外,或者与当前块重叠,或者在重构区域之外,或者在受某些约束限制的有效区域之外时,该Merge候选对象被称为无效Merge候选对象。
请注意,无效的Merge候选可能会被插入到IBC Merge列表中。
2.3.2 IBC AMVP模式
在IBC AMVP模式下,从比特流中解析指向IBC AMVP列表中的条目的AMVP索引。IBCAMVP列表的构造可以根据以下步骤序列进行总结:
步骤1:推导空域候选
○检查A0、A1,直到找到可用的候选。
○检查B0、B1、B2,直到找到可用的候选。
步骤2:插入HMVP候选
步骤3:插入零候选
在插入空域候选之后,如果IBC AMVP列表尺寸仍然小于IBC AMVP列表的最大尺寸,则可以插入来自HMVP表的IBC候选。
最后,零候选被插入IBC AMVP列表。
2.4自适应运动矢量分辨率(Adaptive Motion Vector Resolution,AMVR)
在HEVC中,当在条带头中的use_integer_mv_flag等于0时,以四分之一(quarter)亮度样点为单位信令通知(CU的运动矢量和预测运动矢量之间的)运动矢量差(MotionVector Difference,MVD)。在VVC中,引入了CU级别自适应运动矢量分辨率(AMVR)。AMVR允许以不同的精度对CU的MVD进行编解码。根据当前控制CU的模式(正常AMVP模式或仿射AVMP模式),当前CU的MVD可以自适应选择如下:
-正常AMVP模式:四分之一亮度样点、整数亮度样点或四亮度样点。
-仿射AMVP模式:四分之一亮度样点、整数亮度样点或1/16亮度样点。
如果当前CU具有至少一个非零MVD分量,则有条件地信令通知CU级别MVD分辨率指示。如果所有MVD分量(即,参考列表L0和参考列表L1的水平MVD和垂直MVD两者)为零,则推断四分之一亮度样点MVD分辨率。
对于具有至少一个非零MVD分量的CU,信令通知第一标志以指示是否四分之一亮度样点MVD精度用于CU。如果第一标志为0,则不需要进一步的信令,并且四分之一亮度样点MVD精度用于当前CU。否则,信令通知第二标志以指示整数亮度样点还是四亮度样点MVD精度用于正常AMVP CU。相同的第二标志用于指示是整数亮度样点还是1/16亮度样点MVD精度用于仿射AMVP CU。为了确保重构的MV具有预期的精度(四分之一亮度样点、整数亮度样点或四亮度样点),CU的运动矢量预测值在与MVD相加之前将被舍入(rounded)到与MVD相同的精度。运动矢量预测值被向零舍入(即,负运动矢量预测值被向正无穷大舍入,并且正运动矢量预测值被向负无穷大舍入)。
编码器使用RD检查确定当前CU的运动矢量分辨率。为了避免对于每个MVD分辨率总是执行CU级别RD检查三次,在VTM4中,除了四分之一亮度样点之外,MVD精度的RD检查只是有条件地调用。对于正常的AVMP模式,首先计算四分之一亮度样点MVD精度和整数亮度样点MV精度的RD代价。然后,将整数亮度样点MVD精度的RD代价与四分之一亮度样点MVD精度的RD代价进行比较,以决定是否有必要进一步检查四亮度样点MVD精度的RD代价。当四分之一亮度样点MVD精度的RD代价远小于整数亮度样点MVD精度的RD代价时,将跳过四亮度样点MVD精度的RD检查。对于仿射AMVP模式,如果在检查仿射Merge/跳过模式、Merge/跳过模式、四分之一亮度样点MVD精度正常AMVP模式和四分之一亮度样点MVD精度仿射AMVP模式的率失真代价之后未选择仿射帧间模式,则不检查1/16亮度样点MV精度和1像素MV精度仿射帧间模式。此外,在1/4亮度样点MV精度仿射帧间模式中获得的仿射参数被用作1/16亮度样点和1/4亮度样点MV精度仿射帧间模式中的起始搜索点。
2.5调色板模式
调色板模式背后的基本思想是CU中的样点由小的代表性色彩值集合来表示。该集合被称为调色板。还可以通过信令通知后面跟着(可能量化的)分量值的逸出符号(escapesymbol)来指示调色板之外的样点。这如图2所示。
2.6 HEVC屏幕内容编解码扩展(HEVC-SCC)中的调色板模式
在HEVC-SCC的调色板模式中,使用预测方式对调色板和索引映射进行编解码。
2.6.1调色板条目的编解码
对于调色板条目的编解码,保持调色板预测值。调色板的最大尺寸以及调色板预测值在SPS中信令通知。在HEVC-SCC中,在PPS中引入了palette_predictor_initializer_present_flag。当该标志为1时,用于初始化调色板预测值的条目在比特流中被信令通知。调色板预测值在每个CTU行、每个条带和每个片的开头被初始化。根据palette_predictor_initializer_present_flag的值,调色板预测值被重置为0,或者使用在PPS中信令通知的调色板预测值初始化器条目来被初始化。在HEVC-SCC中,尺寸为0的调色板预测值初始化器被启用,以允许在PPS级别显式禁用调色板预测值初始化。
对于调色板预测值中的每个条目,重用标志被信令通知以指示它是否是当前调色板的一部分。这如图3所示。使用为零的游程长度(run-length)编解码来发送重用标志。在此之后,新调色板条目的数量使用0阶的指数哥伦布(Golomb)码来信令通知。最后,新调色板条目的分量值被信令通知。
2.6.2调色板索引的编解码
调色板索引使用水平和垂直遍历扫描进行编解码,如图5所示。使用palette_transpose_flag在比特流中显式地信令通知扫描顺序。对于子章节的其余部分,假设扫描是水平的。
调色板索引使用两种主要调色板样点模式进行编解码:“INDEX”和“COPY_ABOVE”。如前所解释的,逸出符号也被信令通知作为“INDEX”模式,并被分配有等于最大调色板尺寸的索引。除了顶行或在先前模式为“COPY_ABOVE”时,使用标志来信令通知模式。在“COPY_ABOVE”模式下,上面一行中样点的调色板索引被复制。在“INDEX”模式下,调色板索引是显式地信令通知的。对于“INDEX”和“COPY_ABOVE”两种模式,都会信令通知游程值,其指定使用相同模式来编解码的后续样点的数量。当逸出符号是“INDEX”或“COPY_ABOVE”模式下的游程的一部分时,将针对每个逸出符号信令通知逸出分量值。调色板索引的编解码如图5所示。
这种语法顺序按如下方式完成。首先,信令通知CU的索引值的数量。接下来是使用截短的二进制编解码来信令通知整个CU的实际索引值。索引数量和索引值都以旁路模式来编解码。这将索引相关的旁路二进制位分组在一起。然后以交错方式信令通知调色板样点模式(如果有必要)和游程。最后,对应于整个CU的逸出样点的分量逸出值被分组在一起,并以旁路模式进行编解码。
在信令通知索引值之后信令通知额外的语法元素last_run_type_flag。这个语法元素与索引的数量相结合,消除了信令通知与块中最后的游程相对应的游程值的需要。
在HEVC-SCC中,对于4:2:2、4:2:0和单色色度格式,也可以启用调色板模式。对于所有色度格式,调色板条目和调色板索引的信令几乎是相同的。在非单色格式的情况下,每个调色板条目包括3个分量。对于单色格式,每个调色板条目包括单个分量。对于下采样色度方向,色度样点与可被2整除的亮度样点索引相关联。在为CU重构调色板索引之后,如果样点只有与之相关联的单个分量,则只使用调色板条目的第一分量。信令通知的唯一区别是逸出分量值。对于每个逸出样点,信令通知的逸出分量值的数量可能根据与该样点相关联的分量的数量而不同。
2.7变换跳过模式下的系数编解码
在JVET-M0464和JVET-N0280中,为了使残差编解码适应变换跳过级别的统计和信号特征,对变换跳过(Transform Skip,TS)模式中的系数编解码提出了几种修改。
提出的修改列出如下。
没有最末有效(significant)扫描位置:由于残差信号反映预测之后的空域残差,并且没有对TS执行通过变换的能量集中(compaction),所以不再给出在变换块的右下角的尾部零或无效级别的较高概率。因此,在这种情况下,最末有效扫描位置信令被省略。
子块CBF:最末有效扫描位置信令的缺失要求具有TS的coded_sub_block_flag的子块CBF信令修改如下:
○由于量化,上述无效序列仍可能局部出现在变换块内。因此,如前所述,最末有效扫描位置被去除,并且coded_sub_block_flag针对所有子块被编解码。
○覆盖DC频率位置(左上子块)的子块的coded_sub_block_flag存在一种特殊情况。在VVC草案3中,这个子块的coded_sub_block_flag从不信令通知,并且总是被推断为等于1。当最末有效扫描位置位于另一个子块中时,这意味着在DC子块之外至少有一个有效级别。因此,尽管该子块的coded_sub_block_flag被推断为等于1,但是DC子块可以仅包含零/非有效级别。在TS中没有最末扫描位置信息的情况下,每个子块的coded_sub_block_flag被信令通知。这还包括DC子块的coded_sub_block_flag,除了所有其他coded_sub_block_flag语法元素已经等于0时。在这种情况下,DC coded_sub_block_flag被推断为等于1(inferDcSbCbf=1)。由于在这个DC子块中必须至少有一个有效级别,所以如果在这个DC子块中的所有其他sig_coeff_flag语法元素都等于0,则在(0,0)处的第一位置的sig_coeff_flag语法元素不被信令通知并且被推导为等于1(inferSbDcSigCoeffFlag=1)。
○改变coded_sub_block_flag的上下文建模。上下文模型索引被计算为当前子块左侧的coded_sub_block_flag和当前子块上方的coded_sub_block_flag之和,而不是两者的逻辑或(logical disjunction)。
sig_coeff_flag上下文建模:sig_coeff_flag上下文建模中的本地模板被修改为仅包括当前扫描位置左侧的邻居(NB0)和当前扫描位置上方的邻居(NB1)。上下文模型偏移量只是有效邻近位置的数量sig_coeff_flag[NB0]+sig_coeff_flag[NB1]。因此,根据当前变换块内的对角线d对不同的上下文集合的选择被移除。这产生了三个上下文模型和用于对sig_coeff_flag flag标志进行编解码的单个上下文模型集合。
abs_level_gt1_flag和par_level_flag上下文建模:对abs_level_gt1_flag和par_level_flag采用单个上下文模型。
abs_remainder编解码:尽管变换跳过残差绝对级别的经验分布通常仍然符合拉普拉斯或几何分布,但是存在比变换系数绝对级别更大的不稳定性(instationarities)。特别是,对于残差绝对级别,连续实现窗内的方差更高。这激发了对abs_remainder语法二值化和上下文建模的以下修改:
○在二值化中使用较高的截止值,即,从利用sig_coeff_flag、abs_level_gt1_flag、par_level_flag和abs_level_gt3_flag的编码到abs_remainder的Rice码的转移点,以及用于每个二进制位位置的专用上下文模型产生较高的压缩效率。增大截止值将导致更多的“大于X”标志,例如,引入abs_level_gt5_flag、abs_level_gt7_flag等,直到达到截止值。截止值本身固定为5(numGtFlags=5)。
○修改rice参数推导的模板,即,只有当前扫描位置左侧的邻居和当前扫描位置上方的邻居被认为与sig_coeff_flag上下文建模的本地模板类似。
coeff_sign_flag上下文建模:由于符号(sign)序列内部的不稳定性以及预测残差经常有偏差的事实,即使当全局经验分布几乎均匀分布时,也可以使用上下文模型对符号进行编解码。单个专用上下文模型用于符号的编解码,并且在sig_coeff_flag之后对符号进行解析,以将所有上下文编解码的二进制位保持在一起。
2.8量化残差块差分脉码调制(QR-BDPCM)
在JVET-M0413中,提出了一种量化残差块差分脉码调制(quantized residualblock differential pulse-code modulation,QR-BDPCM)来有效编解码屏幕内容。
QR-BDPCM中使用的预测方向可以是垂直和水平预测模式。类似于帧内预测,通过在预测方向(水平或垂直预测)上的样点复制对整个块进行帧内预测。残差被量化,并且量化残差与其预测值(水平或垂直)量化值之间的差值被编解码。这可以用以下内容来描述:对于尺寸为M(行)×N(列)的块,令ri,j,0≤i≤M-1,0≤j≤N-1,为使用来自上方或左侧块边界样点的未滤波样点水平地(跨预测块逐行复制左邻近像素值)或垂直地(将顶部邻近行复制到预测块中的每一行)执行帧内预测之后的预测残差。令Q(ri,j),0≤i≤M-1,0≤j≤N-1,表示残差ri,j的量化版本,其中残差是原始块和预测块值之间的差。然后块DPCM被应用于量化残差样点,得到具有元素的修改后的M×N阵列当信令通知垂直BDPCM时:
对于水平预测,应用类似的规则,并且通过以下方式获得残差量化样点
在解码器侧,上述计算是相反的,以产生:Q(ri,j),0≤i≤M-1,0≤j≤N-1。对于垂直预测情况,
对于水平情况,
逆量化残差Q-1(Q(ri,j))被添加到帧内块预测值,以产生重构的样点值。
这种方案的主要好处是,在系数解析期间可以动态地进行DPCM,只要系数被解析时添加预测值,或者可以在解析之后执行逆DPCM。
QR-BDPCM的草案文本更改如下所示。
7.3.6.5编解码单元语法
bdpcm_flag[x0][y0]等于1指定bdpcm_dir_flag存在于包括位置(x0,y0)处的亮度编解码块的编解码单元中
bdpcm_dir_flag[x0][y0]等于0指定要在bdpcm块中使用的预测方向是水平的,否则是垂直的。
2.9分割结构
2.9.1使用树结构分割CTU
在HEVC中,通过使用被表示为编解码树的四叉树结构将CTU被划分CU,以适应各种局部特性。是使用帧间图片(时域)预测还是帧内图片(空域)预测来编解码图片区域的决定是在叶CU级别做出的。根据PU划分类型,每个叶子CU可以进一步划分为一个、两个或四个PU。在一个PU之内,应用相同的预测过程,并且在PU的基础上将相关信息发送到解码器。在通过应用基于PU划分类型的预测过程获得残差块之后,可以根据与用于CU的编解码树类似的另一四叉树结构将叶CU分割为变换单元(TU)。HEVC结构的一个重要特征是它具有多个分割概念,包括CU、PU和TU。
在VVC中,使用二元和三元划分结构的嵌套多类型树的四叉树取代了多个分割单元类型的概念,即,它消除了CU、PU和TU概念的分离,除了对于最大变换长度来说尺寸太大的CU需要之外,并且支持CU分割形状的更大灵活性。在编解码树结构中,CU可以是正方形或矩形。编解码树单元(CTU)首先由四元树(也称为四元树)结构分割。然后,可以通过多类型树结构进一步分割四叉树叶节点。如图6所示,在多类型树结构中有四种划分类型,垂直二元划分(SPLIT_BT_VER)、水平二元划分(SPLIT_BT_HOR)、垂直三元划分(SPLIT_TT_VER)和水平三元划分(SPLIT_TT_HOR)。多类型的树叶节点被称为编解码单元(CU),除非CU对于最大变换长度来说太大,否则这种分段被用于预测和变换处理,而不需要任何进一步的分割。这意味着,在大多数情况下,在具有嵌套多类型树编解码块结构的四叉树中,CU、PU和TU具有相同的块尺寸。当支持的最大变换长度小于CU色彩分量的宽度或高度时,就会出现例外。另外,亮度和色度分量在I条带上具有独立的分割结构。
2.10跨分量线性模型预测
为了减少跨分量冗余,在VTM4中使用跨分量线性模型(CCLM)预测模式,为此,通过使用如下线性模型,基于同一CU的重构亮度样点来预测色度样点:
predC(i,j)=α·recL′(i,j)+β
其中,predC(i,j)表示CU中的预测色度样点,并且recL(i,j)表示同一CU的下采样重构亮度样点。线性模型参数α和β是从来自两个样点的亮度值和色度值之间的关系中推导的,这两个样点是在下采样的邻近亮度样点集合之内具有最小样点值和最大样点的亮度样点,以及它们对应的色度样点。线性模型参数α和β根据以下等式而获得。
β=Yb-α·Xb
其中,Ya和Xa表示具有最大亮度样点值的亮度样点的亮度值和色度值。并且Xb和Yb分别表示具有最小亮度样点的亮度样点的亮度值和色度值。图7示出了CCLM模式中涉及的左侧和上方样点以及当前块的样点的位置的示例。
2.11亮度映射与色度缩放(LMCS)
在VTM4中,称为亮度映射与色度缩放(LMCS)的编解码工具被添加为环路滤波器之前的新处理块。LMCS有两个主要部分:1)基于自适应分段线性模型的亮度分量的环路映射;2)对于色度分量,应用亮度相关的色度残差缩放。图8从解码器的角度示出了LMCS架构。图8中的阴影块指示处理在映射域中的应用;这些处理包括逆量化、逆变换、亮度帧内预测以及亮度预测与亮度残差的相加。图8中的无阴影块指示处理在原始(即,未映射)域中的应用;并且这些处理包括诸如去方块、ALF和SAO之类的环路滤波器、运动补偿预测、色度帧内预测、色度预测与色度残差的相加以及解码图像作为参考图像的存储。图8中的阴影块是新的LMCS功能块,包括亮度信号的正向和逆映射以及亮度相关的色度缩放过程。像VVC中的大多数其他工具一样,可以使用SPS标志在序列级别启用/禁用LMCS。
3.实施例解决的问题的示例
虽然JVET-N0280中的系数编解码可以在屏幕内容编解码上实现编解码优势,但系数编码和TS模式可能仍有一些缺点。
(1)TS模式的最大允许宽度或高度由PPS中的一个公共值控制,这可能会限制灵活性。
(2)每个编解码组(Coding Group,CG)需要信令通知TS模式的cbf标志,这可能会增加开销成本。
(3)系数扫描顺序不考虑帧内预测模式。
(4)符号标志编解码仅采用一个上下文。
(5)不支持对色度分量的变换跳过。
(6)变换跳过标志被应用于所有预测模式,这增加了开销成本和编码复杂性。
4.实施例的示例
下面的详细发明应该被认为是解释一般概念的示例。这些发明不应该被狭义地解释。此外,这些发明可以以任何方式组合。
1.变换跳过的最大允许宽度和高度的指示都可以在SPS/VPS/PPS/图片头/条带头/片组头/LCU行/LCU组中被信令通知。
a.在一个示例中,变换跳过的最大允许宽度和高度可以由在SPS/VPS/PPS/图片头/条带头/片组头/LCU行/LCU组中信令通知的不同消息来指示。
b.在一个示例中,最大允许宽度和/或高度可以首先在SPS/PPS中被信令通知,然后在图片头/条带头/片组头/LCU行/LCU组中被更新。
2.TS编解码块可以被划分成几个系数组(CG),并且可以跳过至少一个CG的编解码块标志(Cbf)标志的信令通知。
a.在一个示例中,可以例如对于TS编解码块跳过所有CG的Cbf标志的信令通知。
b.在一个示例中,对于TS模式,CG的跳过的cbf标志可以被推断为1。
c.在一个示例中,跳过CG的部分还是全部Cbf标志可以取决于编解码模式。
i.在一个示例中,对于TS编解码帧内块,跳过CG的所有Cbf标志的信令通知。
d.在一个示例中,CG的跳过的Cbf标志可以基于以下来推断
i.在SPS/VPS/PPS/图片头/条带头/片组头/LCU行/LCU组/LCU/CU中信令通知的消息
ii.CG的位置
iii.当前块和/或其邻近块的块维度
iv.当前块和/或其邻近块的块形状
v.当前块和/或其邻近块的最可能模式
vi.当前块的邻近块的预测模式(帧内/帧间)
vii.当前块的邻近块的帧内预测模式
viii.当前块的邻近块的运动矢量
ix.当前块的邻近块的QR-BDPCM模式的指示
x.当前块和/或其邻近块的当前量化参数
xi.色彩格式的指示(诸如4:2:0、4:4:4)
xii.单独/双编解码树结构
xiii.条带/片组类型和/或图片类型
3.TS编解码块中的系数扫描顺序可以取决于在SPS/VPS/PPS/图片头/条带头/片组头/LCU行/LCU组/LCU/CU中信令通知的消息。
a.可替换地,当采用TS时,CG和/或系数扫描顺序可以取决于帧内预测模式
i.在一个示例中,如果帧内预测模式是水平主导的,则扫描顺序可以是垂直的
1.在一个示例中,如果帧内预测模式索引的范围从2到34,则扫描顺序可以是垂直的。
2.在一个示例中,如果帧内预测模式索引的范围从2到33,则扫描顺序可以是垂直的。
ii.在一个示例中,如果帧内预测模式是垂直主导的,则扫描顺序可以是垂直的。
1.在一个示例中,如果帧内预测模式索引的范围从34-66,则扫描顺序可以是垂直的。
2.在一个示例中,如果帧内预测模式索引的范围从35-66,则扫描顺序可以是垂直的。
iii.在一个示例中,如果帧内预测模式是垂直主导的,则扫描顺序可以是水平的
1.在一个示例中,如果帧内预测模式索引的范围从34到66,则扫描顺序可以是垂直的。
2.在一个示例中,如果帧内预测模式索引的范围从35到66,则扫描顺序可以是垂直的。
iv.在一个示例中,如果帧内预测模式是水平主导的,则扫描顺序可以是水平的
1.在一个示例中,如果帧内预测模式索引的范围从2到34,则扫描顺序可以是垂直的。
2.在一个示例中,如果帧内预测模式索引的范围从2到33,则扫描顺序可以是垂直的。
4.提出符号标志编解码的上下文可以取决于TS模式的系数块中的邻近信息。
a.在一个示例中,对当前符号标志进行编解码的上下文可以取决于TS模式的邻近符号标志的值。
i.在一个示例中,对当前符号标志进行编解码的上下文可以取决于左侧和/或上方邻居的符号标志的值。
1.在一个示例中,当前符号标志的上下文可以被推导为C=(L+A),其中C是上下文id,L是其左侧邻居的符号标志,并且A是其上方邻居的符号标志
2.在一个示例中,当前符号标志的上下文可以被推导为C=(L+A*2),其中C是上下文id,L是其左侧邻居的符号标志,并且A是其上方邻居的符号标志
3.在一个示例中,当前符号标志的上下文可以被推导为C=(L*2+A),其中C是上下文id,L是其左侧邻居的符号标志,并且A是其上方邻居的符号标志
ii.在一个示例中,对当前符号标志进行编解码的上下文可以取决于左侧、上方邻居和左上邻居的符号标志的值。
iii.在一个示例中,对当前符号标志进行编解码的上下文可以取决于左侧、上方邻居、左上邻居、右上邻居的符号标志的值。
b.在一个示例中,对当前符号标志进行编解码的上下文可以取决于系数的位置。
i.在一个示例中,符号标志的上下文在不同位置可以不同。
ii.在一个示例中,符号标志的上下文可以取决于x+y,其中x和y是位置的水平和垂直位置。
iii.在一个示例中,符号标志的上下文可以取决于min(x,y),其中x和y是位置的水平和垂直位置。
iv.在一个示例中,符号标志的上下文可以取决于max(x,y),其中x和y是位置的水平和垂直位置。
5.提出可以支持色度变换跳过模式。
a.在一个示例中,色度变换跳过模式的使用可以基于在SPS/VPS/PPS/图片头/条带头/片组头/LCU行/LCU组/LCU/CU/视频数据单元中信令通知的消息。
b.可替换地,色度变换跳过模式的使用可以基于相同色彩分量或其他色彩分量中的一个或多个代表性先前编解码块的解码信息。
i.在一个示例中,如果代表性块的色度TS标志的指示为假,则色度TS标志的指示可以被推断为假。可替换地,如果代表性块的色度TS标志的指示为真,则色度TS标志的指示可以被推断为真。
ii.在一个示例中,代表性块可以是亮度块或色度块。
iii.在一个示例中,代表性块可以是并置亮度块内的任何块。
iv.在一个示例中,代表性块可以是当前色度块的邻近色度块之一。
v.在一个示例中,代表性块可以是覆盖当前色度块内的中心色度样点的对应亮度样点的块。
vi.在一个示例中,代表性块可以是覆盖当前色度块内的右下色度样点的对应亮度样点的块。
6.是否和/或如何应用变换跳过模式可以取决于在SPS/VPS/PPS/图片头/条带头/片组头/LCU行/LCU组/LCU/CU/视频数据单元中信令通知的消息。
a.在一个示例中,何时和/或如何应用变换跳过模式的指示可以取决于
i.当前块和/或其邻近块的块维度
ii.当前块和/或其邻近块的块形状
iii.当前块和/或其邻近块的最可能模式
iv.当前块的邻近块的预测模式(帧内/帧间)
v.当前块的邻近块的帧内预测模式
vi.当前块的邻近块的运动矢量
vii.当前块的邻近块的QR-BDPCM模式的指示
viii.当前块和/或其邻近块的当前量化参数
ix.色彩格式的指示(诸如4:2:0、4:4:4)
x.单独/双编解码树结构
xi.条带/片组类型和/或图片类型
xii.时域层ID
b.在一个示例中,当预测模式是IBC模式并且块宽度和/或高度小于/大于/等于阈值时,可以应用变换跳过模式
i.在一个示例中,阈值可以为4、8、16或32。
ii.在一个示例中,阈值可以在比特流中被信令通知。
iii.在一个示例中,阈值可以基于
1.在SPS/VPS/PPS/图片头/条带头/片组头/LCU行/LCU组/LCU/CU中信令通知的消息
2.当前块和/或其邻近块的块维度
3.当前块和/或其邻近块的块形状
4.当前块和/或其邻近块的最可能模式
5.当前块的邻近块的预测模式(帧内/帧间)
6.当前块的邻近块的帧内预测模式
7.当前块的邻近块的运动矢量
8.当前块的邻近块的QR-BDPCM模式的指示
9.当前块和/或其邻近块的当前量化参数
10.色彩格式的指示(诸如4:2:0、4:4:4)
11.单独/双编解码树结构
12.条带/片组类型和/或图片类型
13.时域层ID
7.是否信令通知TS模式的指示可以取决于解码/推导的帧内预测模式。
a.可替换地,此外,它可以取决于在QR-BDPCM编解码块中使用的允许的帧内预测模式/方向以及QR-BDPCM的使用。
b.对于解码或推导的帧内预测模式,如果它是在QR-BDPCM编解码块中使用的帧内预测模式/方向的允许集合的一部分,则可以跳过TS标志的信令通知。
i.在一个示例中,如果QR-BDPCM被允许用于对一个条带/图片/片/图砖(brick)进行编解码,则垂直和水平模式是QR-BDPCM过程中的两种允许模式,并且解码/推导的帧内模式是垂直或水平模式,则不信令通知TS模式的指示。
c.在一个示例中,当QR-BDPCM模式的指示(例如,bdpcm_flag)为1时,可以推断变换跳过模式被启用。
d.上述方法可以基于以下来应用
i.在SPS/VPS/PPS/图片头/条带头/片组头/LCU行/LCU组/LCU/CU中信令通知的消息
ii.当前块和/或其邻近块的块维度
iii.当前块和/或其邻近块的块形状
iv.当前块和/或其邻近块的最可能模式
v.当前块的邻近块的预测模式(帧内/帧间)
vi.当前块的邻近块的帧内预测模式
vii.当前块的邻近块的运动矢量
viii.当前块的邻近块的QR-BDPCM模式的指示
ix.当前块和/或其邻近块的当前量化参数
x.色彩格式的指示(诸如4:2:0、4:4:4)
xi.单独/双编解码树结构
xii.条带/片组类型和/或图片类型
xiii.时域层ID
8.是否和/或如何应用QR-BDPCM可以取决于TS模式的指示。
a.在一个示例中,是否应用QR-BDPCM的指示可以在变换单元(TU)级别被信令通知,而不是在CU中被信令通知。
i.在一个示例中,是否应用QR-BDPCM的指示可以在TS模式的指示应用于TU之后被信令通知。
b.在一个示例中,QR-BDPCM被视为TS模式的特殊情况。
i.当一个块以TS模式进行编解码时,可以进一步信令通知另一标志,以指示是应用QR-BDPCM还是传统TS模式。如果它用QR-BDPCM来编解码,则在QR-BDPCM中使用的预测方向可以被进一步信令通知。
ii.可替换地,当一个块以TS模式进行编解码时,可以进一步信令通知另一标志,以指示应用哪种QR-BDPCM(例如,基于水平/垂直预测方向的QR-BDPCM)或传统TS模式。
c.在一个示例中,是否应用QR-BDPCM的指示可以基于TS模式的指示来推断。
i.在一个示例中,如果是否在同一块上应用变换跳过标志的指示为真,则是否在亮度和/或色度块上应用QR-BDPCM的指示可以被推断为真。可替换地,如果是否在亮度和/或色度块上应用变换跳过标志的指示为真,则是否在同一块上应用QR-BDPCM的指示可以被推断为真。
ii.在一个示例中,如果是否在同一块上应用变换跳过标志的指示为假,则是否在亮度和/或色度块上应用QR-BDPCM的指示可以被推断为假。可替换地,如果是否在亮度和/或色度块上应用变换跳过标志的指示为假,则是否在同一块上应用QR-BDPCM的指示可以被推断为假。
9.是否和/或如何应用单独/双树可以取决于在SPS/VPS/PPS/图片头/条带头/片组头/LCU行/LCU组/LCU/CU/视频数据单元中信令通知的消息。
a.在一个示例中,是否应用单独/双树的指示可以取决于当前条带/片/LCU/LCU行/LCU组/视频数据单元是否被确定为屏幕内容。
i.此外,在一个示例中,条带/片/LCU/LCU行/LCU组/视频数据单元是否被确定为屏幕内容可以取决于
1.在SPS/VPS/PPS/图片头/条带头/片组头/LCU行/LCU组/LCU/CU/视频数据单元中信令通知的消息/标志。
2.当前CTU和/或其邻近CTU的块维度
3.当前CTU和/或其邻近CTU的块形状
4.当前CTU和/或其邻近CTU的当前量化参数
5.色彩格式的指示(诸如4:2:0、4:4:4)
6.先前的条带/片/LCU/LCU行/LCU组/视频数据单元的单独/双编解码树结构类型
7.条带/片组类型和/或图片类型
8.时域层ID
b.在一个示例中,可以推断是否应用单独/双树的指示,这可以取决于
i.在SPS/VPS/PPS/图片头/条带头/片组头/LCU行/LCU组/LCU/CU/视频数据单元中信令通知的消息。
ii.先前的编解码图片/片/条带/重构区域中IBC/帧间模式的哈希命中率(hashhit ratio)
iii.当前CTU和/或其邻近CTU的块维度
iv.当前CTU和/或其邻近CTU的块形状
v.当前CTU和/或其邻近CTU的当前量化参数
vi.色彩格式的指示(诸如4:2:0、4:4:4)
vii.先前的条带/片/LCU/LCU行/LCU组/视频数据单元的单独/双编解码树结构类型
viii.条带/片组类型和/或图片类型
ix.时域层ID
c.在一个示例中,是否应用CCLM和/或LMCS的指示可以取决于单独/双编解码树结构类型
i.在一个示例中,当使用单独树时,CCLM和/或LMCS的指示可以被推断为假。
d.上述方法也可以适用于单树分割情况,或单/双编解码树结构类型。
10.是否启用IBC可以取决于编解码树结构类型。
a.在一个示例中,对于给定的编解码树结构类型(例如,双树),可以跳过和推断IBC模式的指示、IBC模式下使用的块矢量和/或与IBC模式相关的其他语法的信令通知。
b.在一个示例中,当应用双编解码树结构类型时,IBC模式的指示可以被推断为假。
c.在一个示例中,当应用双编解码树结构类型时,亮度块的IBC模式的指示可以被推断为假。
d.在一个示例中,当应用双编解码树结构类型时,色度块的IBC模式的指示可以被推断为假。
e.在一个示例中,IBC模式的指示可以基于以下来推断
i.在SPS/VPS/PPS/图片头/条带头/片组头/LCU行/LCU组/LCU/CU/视频数据单元中信令通知的消息。
ii.先前的编解码图片/片/条带/重构区域中IBC/帧间模式的哈希命中率
iii.当前CTU和/或其邻近CTU的块维度
iv.当前CTU和/或其邻近CTU的块形状
v.当前CTU和/或其邻近CTU的当前量化参数
vi.色彩格式的指示(诸如4:2:0、4:4:4)
vii.先前的条带/片/LCU/LCU行/LCU组/视频数据单元的编解码树结构类型
viii.条带/片组类型和/或图片类型
ix.时域层ID
11.是否启用CCLM可以取决于编解码树结构类型。
a.在一个示例中,对于给定的编解码树结构类型(例如,双树),可以跳过和推断CCLM模式的指示和/或与CCLM模式相关的其他语法的信令通知。
b.在一个示例中,当应用双编解码树结构类型时,CCLM模式的指示可以被推断为假。
c.在一个示例中,当应用双编解码树结构类型时,CCLM模式的指示可以基于以下来推断
i.在SPS/VPS/PPS/图片头/条带头/片组头/LCU行/LCU组/LCU/CU/视频数据单元中信令通知的消息。
ii.先前的编解码图片/片/条带/重构区域中IBC/帧间模式的哈希命中率
iii.当前CTU和/或其邻近CTU的块维度
iv.当前CTU和/或其邻近CTU的块形状
v.当前CTU和/或其邻近CTU的当前量化参数
vi.色彩格式的指示(诸如4:2:0、4:4:4)
vii.先前的条带/片/LCU/LCU行/LCU组/视频数据单元的编解码树结构类型
viii.条带/片组类型和/或图片类型
ix.时域层ID
12.是否对色度分量启用LMCS可以取决于编解码树结构类型。
a.在一个示例中,对于给定的编解码树结构类型(例如,双树),可以跳过和推断色度分量的LMCS的指示和/或与LMCS模式相关的其他语法的信令通知。
b.在一个示例中,当应用双编解码树结构类型时,色度分量的LMCS的指示可以被推断为假。
c.在一个示例中,当应用双编解码树结构类型时,色度分量的LMCS的指示可以基于以下来推断
i.在SPS/VPS/PPS/图片头/条带头/片组头/LCU行/LCU组/LCU/CU/视频数据单元中信令通知的消息。
ii.先前的编解码图片/片/条带/重构区域中IBC/帧间模式的哈希命中率
iii.当前CTU和/或其邻近CTU的块维度
iv.当前CTU和/或其邻近CTU的块形状
v.当前CTU和/或其邻近CTU的当前量化参数
vi.色彩格式的指示(诸如4:2:0、4:4:4)
vii.先前的条带/片/LCU/LCU行/LCU组/视频数据单元的编解码树结构类型
viii.条带/片组类型和/或图片类型
ix.时域层ID
13.编解码树结构可以取决于是否使用IBC。
a.在一个示例中,双树结构和IBC方法可以不在序列/图片/片/图砖/CTU/VPDU/32x32块/64x32块/32x64块级别同时启用。
b.此外,可替换地,在一个示例中,如果启用IBC方法,则可以在序列/图片/片/图砖/CTU/VPDU/32x32块/64x32块/32x64块级别禁用双树结构。
c.在一个示例中,当在区域中使用IBC时,色度编解码树结构可以与亮度编解码树结构对齐
i.在一个示例中,该区域可以是序列/图片/片/图砖/CTU/VPDU/32x32块/64x32块/32x64块。
ii.在一个示例中,当并置亮度块被划分成子块时,如果允许色度块被划分,则色度快可以被划分成子块。
iii.在一个示例中,是否以及如何划分色度块可以从其并置亮度块的编解码结构中推断。
iv.在一个示例中,当色度编解码树结构从亮度编解码树结构中推断时,可以跳过对色度编解码树结构进行编解码的信号。
v.在一个示例中,标志可以用于指示色度编解码结构是否可以从亮度编解码结构中推断。标志的信令通知可以取决于
1.在SPS/VPS/PPS/图片头/条带头/片组头/LCU行/LCU组/LCU/CU/视频数据单元中信令通知的消息。
2.先前的编解码图片/片/条带/重构区域中IBC/帧间模式的哈希命中率
3.当前CTU和/或其邻近CTU的块维度
4.当前CTU和/或其邻近CTU的块形状
5.当前CTU和/或其邻近CTU的当前量化参数
6.色彩格式的指示(诸如4:2:0、4:4:4)
7.先前的条带/片/LCU/LCU行/LCU组/视频数据单元的编解码树结构类型
8.条带/片组类型和/或图片类型
9.时域层ID
14.是否启用调色板编解码模式可以取决于编解码树结构类型。
a.在一个示例中,对于给定的编解码树结构类型(例如,双树),可以跳过和推断调色板编解码模式的指示的信令通知。
b.在一个示例中,当应用双编解码树结构类型时,调色板编解码模式的指示可以被推断为假。
c.在一个示例中,当应用双编解码树结构类型时,亮度块的调色板编解码模式的指示可以被推断为假。
d.在一个示例中,当应用双编解码树结构类型时,色度块的调色板编解码模式的指示可以被推断为假。
e.在一个示例中,推断的调色板编解码模式的指示可以基于
i.在SPS/VPS/PPS/图片头/条带头/片组头/LCU行/LCU组/LCU/CU/视频数据单元中信令通知的消息。
ii.先前的编解码图片/片/条带/重构区域中IBC/帧间模式的哈希命中率
iii.当前CTU和/或其邻近CTU的块维度
iv.当前CTU和/或其邻近CTU的块形状
v.当前CTU和/或其邻近CTU的当前量化参数
vi.色彩格式的指示(诸如4:2:0、4:4:4)
vii.先前的条带/片/LCU/LCU行/LCU组/视频数据单元的编解码树结构类型
viii.条带/片组类型和/或图片类型
ix.时域层ID
15.编解码树结构可以取决于是否使用调色板编解码模式。
a.在一个示例中,当在区域中使用调色板编解码模式时,色度编解码树结构可以与亮度编解码树结构对齐
i.在一个示例中,该区域可以是序列/图片/片/图砖/CTU/VPDU/32x32块/64x32块
ii.在一个示例中,当并置亮度块被划分成子块时,如果允许色度块被划分,则色度块可以被划分成子块。
iii.在一个示例中,是否以及如何划分色度块可以从其并置亮度块的编解码结构中推断。
iv.在一个示例中,当色度编解码树结构从亮度编解码树结构中推断时,可以跳过对色度编解码树结构进行编解码的信号。
v.在一个示例中,标志可以用于指示色度编解码结构是否可以从亮度编解码结构中推断。标志的信令通知可以取决于
1.在SPS/VPS/PPS/图片头/条带头/片组头/LCU行/LCU组/LCU/CU/视频数据单元中信令通知的消息。
2.先前的编解码图片/片/条带/重构区域中IBC/帧间模式的哈希命中率
3.当前CTU和/或其邻近CTU的块维度
4.当前CTU和/或其邻近CTU的块形状
5.当前CTU和/或其邻近CTU的当前量化参数
6.色彩格式的指示(诸如4:2:0、4:4:4)
7.先前的条带/片/LCU/LCU行/LCU组/视频数据单元的编解码树结构类型
8.条带/片组类型和/或图片类型
9.时域层ID
16.色度IBC编解码块中的子块/样点的运动/块矢量可以从并置亮度块内的第一可用IBC编解码子区域中推导。
a.在一个示例中,可以定义并置亮度块内的子区域的扫描顺序,诸如光栅扫描顺序。
b.在一个示例中,子区域可以被定义为最小编解码单元/最小变换单元。
c.在一个示例中,色度IBC模式下的整个样点的运动/块矢量可以基于并置亮度块中在IBC或帧间模式下编解码的最左上样点的运动矢量来推导。
17.运动/块矢量可以在色度IBC模式下信令通知。
a.在一个示例中,可以信令通知运动矢量和运动矢量预测值之间的差。
i.在一个示例中,运动矢量预测值可以基于并置亮度块、并置亮度块的邻近亮度块、当前色度块的邻近色度块的运动矢量来推导。
1.在一个示例中,运动/块矢量预测值可以基于并置亮度块中的左上样点的运动矢量来推导。
2.在一个示例中,运动/块矢量预测值可以基于并置亮度块中具有中心位置的样点的运动矢量来推导。
3.在一个示例中,运动/块矢量预测值可以基于并置亮度块中在IBC或帧间模式下编解码的最左上样点的运动矢量来推导。
ii.在一个示例中,与亮度分量的一个子区域相关联的运动矢量预测值可以在用作预测值之前被缩放。
iii.在一个示例中,块矢量可以从邻近(相邻或非相邻)色度块的运动矢量/块矢量中推导。
b.在一个示例中,可以构建块矢量候选列表,并且可以信令通知该列表的索引。
i.在一个示例中,候选列表可以包括来自并置亮度块、并置亮度块的邻近亮度块、邻近色度块的运动矢量/块矢量。
c.在一个示例中,可以推断AMVR标志的指示
i.在一个示例中,在色度IBC模式下编解码的块中,AMVR标志的指示可以被推断为假(0)
ii.在一个示例中,在色度IBC模式下编解码的块中,运动矢量差的指示可以被推断为整数精度
d.在一个示例中,可以在色度IBC模式上使用单独的HMVP表。
i.在一个示例中,色度HMVP表和亮度HMVP表的尺寸可以不同。
e.在一个示例中,是否在色度IBC模式下信令通知块/运动矢量可以基于
i.是否以IBC模式对并置亮度块内的所有子区域进行编解码。
1.如果是,则不需要信令通知色度块的块矢量。否则,可以信令通知色度块的块矢量。
ii.是否以IBC模式对并置亮度块内的所有子区域进行编解码,并且所有相关联的块矢量是否有效。
1.如果是,则不需要信令通知色度块的块矢量。否则,可以信令通知色度块的块矢量。
iii.在SPS/VPS/PPS/图片头/条带头/片组头/LCU行/LCU组/LCU/CU/视频数据单元中信令通知的消息。
iv.先前的编解码图片/片/条带/重构区域中IBC/帧间模式的哈希命中率
v.当前CTU和/或其邻近CTU的块维度
vi.当前CTU和/或其邻近CTU的块形状
vii.当前CTU和/或其邻近CTU的当前量化参数
viii.色彩格式的指示(诸如4:2:0、4:4:4)
ix.先前的条带/片/LCU/LCU行/LCU组/视频数据单元的编解码树结构类型
x.条带/片组类型和/或图片类型
xi.时域层ID
上面描述的示例可以结合在下面描述的方法的上下文中,例如方法900、910、920、930和940,其可以在视频解码器或视频编码器处实施。
一种用于视频处理的示例性方法包括,执行当前视频块和包括当前视频块的视频的比特流表示之间的转换,其中该转换基于比特流表示中包括的指示符来选择性地使用变换跳过模式用于转换,并且其中,使用变换跳过模式,当前视频块的预测误差的残差在比特流表示中被表示,而不应用变换。
在一些实施例中,指示符是变换跳过模式的最大允许宽度和最大允许高度。
在一些实施例中,最大允许宽度和高度在序列参数集(SPS)、视频参数集(VPS)、图片参数集(PPS)、图片头、条带头、片组头、最大编解码单元(LCU)行或LCU组中被信令通知。
在一些实施例中,最大允许宽度和高度在不同的消息中被信令通知。
在一些实施例中,最大允许宽度和高度在序列参数集(SPS)或图片参数集(PPS)中被信令通知,并且其中最大允许宽度和高度的更新值在图片头、条带头、片组头、最大编解码单元(LCU)行或LCU组中被信令通知。
图9A示出了用于视频处理的另一示例性方法的流程图。方法900包括,在步骤902,确定当前视频块使用变换跳过模式进行编解码。
方法900包括,在步骤904,基于该确定,执行当前视频块和包括当前视频块的视频的比特流表示之间的转换。
在一些实施例中,当前视频块被划分成多个系数组,并且比特流表示省略多个系数组中的至少一个系数组的编解码块标志的信令。在示例中,比特流表示省略多个系数组中的每一个系数组的编解码块标志的信令。
在一些实施例中,在比特流表示中的信令中省略的编解码块标志基于以下中的一个或多个来推断:(1)在序列参数集(SPS)、视频参数集(VPS)、图片参数集(PPS)、图片头、条带头、片组头、最大编解码单元(LCU)、LCU行、LCU组或编解码单元(CU)中信令通知的消息,(2)多个系数组中的至少一个系数组的位置,(3)当前视频块或当前视频块的至少一个邻近块的块维度,(4)当前视频块或至少一个邻近块的块形状,(5)当前视频块或至少一个邻近块的最可能模式,(6)至少一个邻近块的预测模式,(7)至少一个邻近块的帧内预测模式,(8)至少一个邻近块的一个或多个运动矢量,(9)至少一个邻近块的量化残差块差分脉码调制(QR-BDPCM)模式的指示,(10)当前视频块或至少一个邻近块的当前量化参数(QP),(11)当前视频块的色彩格式的指示,(12)与当前视频块相关联的单独或双编解码树结构,或者(13)当前视频块的条带类型、片组类型或图片类型。
在一些实施例中,当前视频块被划分成多个系数组,并且方法900还包括确定多个系数组的系数扫描顺序的步骤。在示例中,系数扫描顺序基于在序列参数集(SPS)、视频参数集(VPS)、图片参数集(PPS)、图片头、条带头、片组头、最大编解码单元(LCU)、LCU行、LCU组或编解码单元(CU)中信令通知的消息。
在一些实施例中,多个系数组或系数扫描顺序基于当前视频块的帧内预测模式。在示例中,系数扫描顺序是垂直的,并且其中,帧内预测模式是水平主导的。在另一示例中,系数扫描顺序是水平的,并且其中,帧内预测模式是水平主导的。例如,帧内预测模式的索引的范围从2到33或从2到34。
在一些实施例中,多个系数组或系数扫描顺序基于当前视频块的帧内预测模式。在示例中,系数扫描顺序是垂直的,并且其中,帧内预测模式是垂直主导的。在另一示例中,系数扫描顺序是水平的,并且其中,帧内预测模式是垂直主导的。例如,帧内预测模式的索引的范围从34到66或从35到66。
在一些实施例中,符号标志的上下文基于与当前视频块相关联的系数块中的邻近信息。在示例中,符号标志的上下文还基于系数块的系数的位置。在另一示例中,符号标志的上下文基于(x+y)、min(x,y)或max(x,y),其中x和y分别是系数的位置的水平值和垂直值。
图9B示出了用于视频处理的又一示例性方法的流程图。方法910包括,在步骤912,为当前视频块确定色度变换跳过模式是适用的。
方法910包括,在步骤914,基于该确定,执行当前视频块和包括当前视频块的视频的比特流表示之间的转换。
在一些实施例中,该确定基于在序列参数集(SPS)、视频参数集(VPS)、图片参数集(PPS)、图片头、条带头、片组头、最大编解码单元(LCU)、LCU行、LCU组、编解码单元(CU)或视频数据单元中信令通知的消息。
在一些实施例中,该确定基于来自在执行转换之前解码的一个或多个代表性视频块的解码信息,并且其中,一个或多个代表性视频块和当前视频块中的每一个中的样点基于公共色彩信息。在示例中,一个或多个代表性视频块包括亮度块或色度块。在另一示例中,一个或多个代表性视频块包括并置亮度块内的块。
图9C示出了用于视频处理的又一示例性方法的流程图。方法920包括,在步骤922,在当前视频块和包括当前视频块的视频的比特流表示之间的转换期间,做出关于基于条件的变换跳过模式对当前视频块的选择性应用的决定。
方法920包括,在步骤924,基于该决定来执行转换。
在一些实施例中,该条件基于在序列参数集(SPS)、视频参数集(VPS)、图片参数集(PPS)、图片头、条带头、片组头、最大编解码单元(LCU)、LCU行、LCU组、编解码单元(CU)或视频数据单元中信令通知的消息。
在一些实施例中,该条件基于以下中的一个或多个:(1)当前视频块或当前视频块的至少一个邻近块的块维度,(2)当前视频块或至少一个邻近块的块形状,(3)当前视频块或至少一个邻近块的最可能模式,(4)至少一个邻近块的预测模式,(5)至少一个邻近块的帧内预测模式,(6)至少一个邻近块的一个或多个运动矢量,(7)至少一个邻近块的量化残差块差分脉码调制(QR-BDPCM)模式的指示,(8)当前视频块或至少一个邻近块的当前量化参数(QP),(9)当前视频块的色彩格式的指示,(10)与当前视频块相关联的单独或双编解码树结构,(11)当前视频块的条带类型、片组类型或图片类型,或者(12)时域层标识(ID)。
在一些实施例中,执行变换跳过模式的应用,当前视频块的预测模式是帧间块复制(IBC)模式,并且将当前视频块的宽度或高度与阈值进行比较。在示例中,阈值在比特流表示中被信令通知。在另一示例中,阈值为4、8、16或32。
在又一示例中,阈值基于以下中的一个或多个:(1)在序列参数集(SPS)、视频参数集(VPS)、图片参数集(PPS)、图片头、条带头、片组头、最大编解码单元(LCU)、LCU行、LCU组或编解码单元(CU)中信令通知的消息,(2)时域层标识(ID),(3)当前视频块或当前视频块的至少一个邻近块的块维度,(4)当前视频块或至少一个邻近块的块形状,(5)当前视频块或至少一个邻近块的最可能模式,(6)至少一个邻近块的预测模式,(7)至少一个邻近块的帧内预测模式,(8)至少一个邻近块的一个或多个运动矢量,(9)至少一个邻近块的量化残差块差分脉码调制(QR-BDPCM)模式的指示,(10)当前视频块或至少一个邻近块的当前量化参数(QP),(11)当前视频块的色彩格式的指示,(12)与当前视频块相关联的单独或双编解码树结构,或者(13)当前视频块的条带类型、片组类型或图片类型。
图9D示出了用于视频处理的又一示例性方法的流程图。方法930包括,在步骤932,在当前视频块和包括当前视频块的视频的比特流表示之间的转换期间,做出关于基于比特流表示中的变换跳过模式的指示的量化残差块差分脉码调制(QR-BDPCM)的选择性应用的决定。
方法930包括,在步骤934,基于该决定来执行转换。
在一些实施例中,变换跳过模式的指示在变换单元(TU)级别被信令通知。
图9E示出了用于视频处理的又一示例性方法的流程图。方法940包括,在步骤942,在当前视频块和包括当前视频块的视频的比特流表示之间的转换期间,做出关于基于条件的单独树或双树的选择性应用的决定。
方法940包括,在步骤944,基于该决定来执行转换。
在一些实施例中,该条件基于在序列参数集(SPS)、视频参数集(VPS)、图片参数集(PPS)、图片头、条带头、片组头、最大编解码单元(LCU)、LCU行、LCU组、编解码单元(CU)或视频数据单元中信令通知的消息。
在一些实施例中,该条件基于确定条带、片、最大编解码单元(LCU)、LCU行、LCU组或包括当前视频块的视频数据单元是否是屏幕内容。在示例中,该确定基于以下中的一个或多个:(1)在序列参数集(SPS)、视频参数集(VPS)、图片参数集(PPS)、图片头、条带头、片组头、LCU、LCU行、LCU组、编解码单元(CU)或视频数据单元中信令通知的消息,(2)当前视频块或当前视频块的至少一个邻近块的块维度,(3)当前视频块或至少一个邻近块的块形状,(4)当前视频块或至少一个邻近块的当前量化参数(QP),(5)当前视频块的色彩格式的指示,(6)与当前视频块相关联的单独或双编解码树结构,(7)当前视频块的条带类型、片组类型或图片类型,或者(8)时域层标识(ID)。
图10是视频处理设备1000的框图。装置1000可用以于实施本文所述的一种或多种方法。装置1000可以体现在智能手机、平板电脑、计算机、物联网(Internet of Things,IoT)接收器等中。装置1000可以包括一个或多个处理器1002、一个或多个存储器1004和视频处理硬件1006。(多个)处理器1002可以被配置为实施本文档中描述的一种或多种方法(包括但不限于方法900、910、920、930和940)。存储器(多个存储器)1004可以用于存储用于实施本文描述的方法和技术的数据和代码。视频处理硬件1006可以被用于在硬件电路中实施本文档中描述的一些技术。
在一些实施例中,视频编解码方法可以使用在如参考图10所述的硬件平台上实施的装置来实施。
在一些实施例中,例如,如以上第5项和第10项及以下所述,视频处理的方法包括:基于与当前视频块相对应的编解码树结构的类型,做出关于帧内块复制模式是否适用于视频的当前视频块和比特流表示之间的转换的确定;以及基于该确定来执行转换。
在上述方法中,比特流表示排除帧内块复制模式的指示。换句话说,比特流不携带IBC模式的显式信令。
在上述方法中,编解码树结构的类型是双编解码树结构,并且该确定是帧内块复制模式不适用。
图11是其中可以实施所公开的技术的示例视频处理系统的框图。各种实施方式可以包括系统1100的一些或所有组件。系统1100可以包括用于接收视频内容的输入1102。视频内容可以以原始或未压缩格式接收,例如,8或10比特多分量像素值,或者可以是压缩或编码格式。输入1102可以标识网络接口、外围总线接口或存储接口。网络接口的示例包括有线接口,诸如以太网、无源光网络(Passive Optical Network,PON)等,和无线接口,诸如Wi-Fi或蜂窝接口。
系统1100可以包括编解码组件1104,其可以实施本文档中描述的各种编解码或编码方法。编解码组件1104可以降低从输入1102到编解码组件1104的输出的视频的平均比特率,以产生视频的编解码表示。因此,编解码技术有时被称为视频压缩或视频代码转换技术。编解码组件1104的输出可以被存储,或者经由连接的通信来发送,如组件1106所表示的。组件1108可以使用在输入1102处接收的视频的存储或传送的比特流(或编解码)表示来生成发送到显示接口1110的像素值或可显示视频。从比特流表示生成用户可视视频的过程有时被称为视频解压缩。此外,虽然某些视频处理操作被称为“编解码”操作或工具,但是应当理解,编解码工具或操作在编码器处使用,并且反转编码结果的相应解码工具或操作将由解码器执行。
外围总线接口或显示接口的示例可以包括通用串行总线(Universal SerialBus,USB)或高清晰度多媒体接口(High Definition Multimedia Interface,HDMI)或显示端口等。存储接口的示例包括SATA(Serial Advanced Technology Attachment,串行高级技术附件)、PCI、IDE接口等。本文档中描述的技术可以体现在各种电子设备中,诸如移动电话、膝上型电脑、智能手机或能够执行数字数据处理和/或视频显示的其他设备。
图12是可视媒体编码方法的示例的流程图。本流程图的步骤将结合本文档第4节中的示例11进行讨论。在步骤1202,该过程为将可视媒体数据的视频区域中的当前视频块编码为可视媒体数据的比特流表示,做出关于至少基于与视频区域相关联的编解码树结构或至少从与视频区域相关联的编解码树结构推断的跨分量线性模型(CCLM)预测模式的应用的决定,其中,在CCLM预测模式下,在当前视频块的重构亮度样点上使用线性模型预测当前视频块的色度样点。在步骤1204,该过程在比特流表示中选择性地包括语法元素,其中该语法元素指示至少基于编解码树结构或至少从编解码树结构推断的CCLM预测模式的应用。
图13是可视媒体解码方法的示例的流程图。本流程图的步骤将结合本文档第4节中的示例11进行讨论。在步骤1302,该过程从包括包含当前视频块的视频区域的可视媒体数据的比特流表示确定与当前视频块相关联的编解码树结构。在步骤1304,该过程至少基于编解码树结构,确定语法元素是否被包括在比特流表示中,其中,语法元素指示跨分量线性模型(CCLM)预测模式对当前视频区域的应用,其中,在CCLM预测模式下,在当前视频块的重构亮度样点上使用线性模型预测当前视频块的色度样点。在步骤1306,该过程从比特流表示生成当前视频块。
图14是可视媒体编码方法的示例的流程图。本流程图的步骤将结合本文档第4节中的示例12进行讨论。在步骤1402,该过程为将可视媒体数据的视频区域中的当前视频块编码为可视媒体数据的比特流表示,做出关于至少基于与视频区域相关联的编解码树结构或至少从与视频区域相关联的编解码树结构推断的亮度映射与色度缩放(LMCS)处理步骤对视频区域的应用的决定,其中,在LMCS处理步骤中,使用自适应分段线性模型映射视频区域中的亮度样点和/或对视频区域中的色度样点进行亮度依赖的色度残差缩放操作。在步骤1404,该过程在比特流表示中选择性地包括语法元素,其中该语法元素指示LMCS处理步骤对视频区域的应用。
图15是可视媒体解码方法的示例的流程图。本流程图的步骤将结合本文档第4节中的示例12进行讨论。在步骤1502,该过程从包括包含当前视频块的视频区域的可视媒体数据的比特流表示确定与当前视频块相关联的编解码树结构。在步骤1504,该过程至少基于编解码树结构,确定语法元素是否被包括在比特流表示中,其中,语法元素指示亮度映射与色度缩放(LMCS)处理步骤对视频区域的应用,其中,在LMCS处理步骤中,使用自适应分段线性模型映射亮度样点,并且对色度样点进行亮度依赖的色度残差缩放操作。在步骤1506,该过程从比特流表示生成当前视频块。
本文档的一些实施例现在以基于条款的格式呈现。
1.一种用于可视媒体编码的方法,包括:
为将可视媒体数据的视频区域中的当前视频块编码为可视媒体数据的比特流表示,做出关于至少基于与视频区域相关联的编解码树结构或至少从与视频区域相关联的编解码树结构推断的跨分量线性模型(CCLM)预测模式的应用的决定,其中,在CCLM预测模式下,在当前视频块的重构亮度样点上使用线性模型预测当前视频块的色度样点;以及
在比特流表示中选择性地包括语法元素,其中该语法元素指示至少基于编解码树结构或至少从编解码树结构推断的CCLM预测模式的应用。
2.一种用于可视媒体解码的方法,包括:
从包括包含当前视频块的视频区域的可视媒体数据的比特流表示确定与当前视频块相关联的编解码树结构;
至少基于编解码树结构,确定语法元素是否被包括在比特流表示中,其中,语法元素指示跨分量线性模型(CCLM)预测模式对当前视频区域的应用,其中,在CCLM预测模式下,在当前视频块的重构亮度样点上使用线性模型预测当前视频块的色度样点;以及
从比特流表示生成当前视频块。
3.根据条款1-2中任一项或多项所述的方法,其中,在比特流表示中排除语法元素的情况下,指示CCLM预测模式的应用的语法元素被推断。
4.根据条款1-3中任一项或多项所述的方法,其中,在编解码树结构是双编解码树结构类型的情况下,语法元素被推断为布尔假值。
5.根据条款1-4中任一项或多项所述的方法,其中,在编解码树结构是双编解码树结构类型的情况下,语法元素从比特流表示中排除,并且基于当前视频块或当前视频块的至少一个邻近块的块维度来推断。
6.根据条款1-4中任一项或多项所述的方法,其中,在编解码树结构是双编解码树结构类型的情况下,语法元素从比特流表示中排除,并且基于以下中的一个或多个来推断:
(1)在序列参数集(SPS)、视频参数集(VPS)、图片参数集(PPS)、图片头、条带头、片组头、最大编解码单元(LCU)、LCU行、LCU组或编解码单元(CU)中信令通知的消息,
(2)与其他视频块相关联的编解码图片/片/条带/重构区域中的IBC模式和/或帧间模式的哈希命中率,
(3)当前视频块或至少一个邻近块的块形状,
(4)当前视频块或至少一个邻近块的当前量化参数(QP),
(5)当前视频块的色彩格式的指示,
(6)与当前视频块相关联的单独或双编解码树结构,
(7)当前视频块的条带类型、片组类型或图片类型,或者
(8)时域层ID。
7.一种用于可视媒体编码的方法,包括:
做出关于至少基于与视频区域相关联的编解码树结构或至少从与视频区域相关联的编解码树结构推断的亮度映射与色度缩放(LMCS)处理步骤对视频区域的应用的决定,为将可视媒体数据的视频区域中的当前视频块编码为可视媒体数据的比特流表示,其中,在LMCS处理步骤中,使用自适应分段线性模型映射视频区域中的亮度样点和/或对视频区域中的色度样点进行亮度依赖的色度残差缩放操作;以及
在比特流表示中选择性地包括语法元素,其中该语法元素指示LMCS处理步骤对视频区域的应用。
8.一种用于可视媒体解码的方法,包括:
从包括包含当前视频块的视频区域的可视媒体数据的比特流表示确定与当前视频块相关联的编解码树结构;
至少基于编解码树结构,确定语法元素是否被包括在比特流表示中,其中,语法元素指示亮度映射与色度缩放(LMCS)处理步骤对视频区域的应用,其中,在LMCS处理步骤中,使用自适应分段线性模型映射亮度样点,并且对色度样点进行亮度依赖的色度残差缩放操作;以及
从比特流表示生成当前视频块。
9.根据条款7-8中任一项或多项所述的方法,其中,在比特流表示中排除语法元素的情况下,指示LMCS处理步骤的应用的语法元素被推断。
10.根据条款7-9中任一项或多项所述的方法,其中,在编解码树结构是双编解码树结构类型的情况下,语法元素被推断为布尔假值。
11.根据条款7-10中任一项或多项所述的方法,其中,在编解码树结构是双编解码树结构类型的情况下,语法元素从比特流表示中排除,并且基于以下中的一个或多个来推断:
(1)在序列参数集(SPS)、视频参数集(VPS)、图片参数集(PPS)、图片头、条带头、片组头、最大编解码单元(LCU)、LCU行、LCU组或编解码单元(CU)中信令通知的消息,
(2)与其他视频块相关联的编解码图片/片/条带/重构区域中的IBC模式和/或帧间模式的哈希命中率,
(3)当前视频块或当前视频块的至少一个邻近块的块维度,
(4)当前视频块或至少一个邻近块的块形状,
(5)当前视频块或至少一个邻近块的当前量化参数(QP),
(6)当前视频块的色彩格式的指示,
(7)与当前视频块相关联的单独或双编解码树结构,
(8)当前视频块的条带类型、片组类型或图片类型,或者
(9)时域层ID。
12.根据条款6或11中任一项或多项所述的方法,其中,当前视频块的色彩格式是4:2:0格式或4:4:4格式。
13.一种视频编码器装置,包括被配置为实施根据条款1-12中任一项或多项所述的方法的处理器。
14.一种视频解码器装置,包括被配置为实施根据条款1-12中任一项或多项所述的方法的处理器。
15.一种其上存储有代码的计算机可读介质,该代码体现用于实施根据条款1-12中任一项或多项所述的方法的处理器可执行指令。
在本文档中,术语“视频处理”或“可视媒体处理”可以指视频编码、视频解码、视频压缩或视频解压缩。例如,视频压缩算法可以在从视频的像素表示到对应的比特流表示或相反的转换期间应用。如语法所定义的,当前视频块的比特流表示可以例如对应于在比特流内并置的比特或者分布在比特流内不同位置的比特。例如,宏块可以根据变换和编解码的误差残差值并且还使用头中的比特和比特流中的其他字段进行编码。此外,在转换期间,解码器可以基于该确定,在知道一些字段可能存在或不存在的情况下解析比特流,如以上技术方案中所述。类似地,编码器可以确定是否包括某些语法字段,并通过从编码表示中包括或排除语法字段来相应地生成编解码表示。
从以上所述,将会理解,为了说明的目的,本文已经描述了当前公开的技术的具体实施例,但是在不脱离本发明的范围的情况下,可以进行各种修改。因此,除了由所附权利要求之外,本公开的技术不受限制。
本专利文档中描述的主题和功能操作的实施方式能够被实施在各种系统、数字电子电路中,或者实施在包括本说明书中公开的结构及其等同物的计算机软件、固件或硬件中,或者实施在它们中的一个或多个的组合中。本说明书中描述的主题的实施方式能够被实施为一个或多个计算机程序产品,即,编码在有形的非瞬时性计算机可读存储介质上的计算机程序指令的一个或多个模块,以便被数据处理装置运行或者用来控制数据处理装置的操作。计算机可读介质可以是机器可读存储设备、机器可读存储基底、存储器设备、实现机器可读传播信号的物质组合,或者它们中的一个或多个的组合。术语“数据处理单元”或“数据处理装置”涵盖用于处理数据的所有装置、设备和机器,例如,包括可编程处理器、计算机或多个处理器或计算机。除了硬件之外,该装置还可以包括为所讨论的计算机程序创建运行环境的代码,例如,构成处理器固件、协议栈、数据库管理系统、操作系统或它们中的一个或多个的组合的代码。
计算机程序(也称为程序、软件、软件应用、脚本或代码)可以以任何形式的编程语言编写,包括编译或解释语言,并且可以以任何形式部署,包括作为独立程序或作为模块、组件、子例程或适合在计算环境中使用的其它单元。计算机程序不一定对应于文档系统中的文件。程序可以存储在保存其它程序或数据的文件的一部分中(例如,存储在标志语言文档中的一个或多个脚本),存储在专用于所讨论的程序的单个文件中,或者存储在多个协调文件(例如,存储一个或多个模块、子程序或部分代码的文件)中。计算机程序可以被部署为在位于一个站点或分布在多个站点并通过通信网络互连的一个或多个计算机上执行。
本说明书中描述的过程和逻辑流程可以由一个或多个可编程处理器运行,该处理器运行一个或多个计算机程序以通过对输入数据进行操作并生成输出来执行功能。过程和逻辑流程也可以由专用逻辑电路来执行,并且装置也可以实施为专用逻辑电路,例如,FPGA(field programmable gate array,现场可编程门阵列)或ASIC(application specificintegrated circuit,专用集成电路)。
举例来说,适于执行计算机程序的处理器包括通用和专用微处理器,以及任何类型的数字计算机的任何一个或多个处理器。通常,处理器将从只读存储器或随机存取存储器或两者接收指令和数据。计算机的基本元件是用于执行指令的处理器和用于存储指令和数据的一个或多个存储器设备。通常,计算机还将包括一个或多个用于存储数据的大容量存储设备,例如,磁盘、磁光盘或光盘,或者被可操作地耦合以从一个或多个大容量存储设备接收数据或向其传送数据或两者兼有。然而,计算机不必须具有这样的设备。适于存储计算机程序指令和数据的计算机可读介质包括所有形式的非易失性存储器、介质和存储设备,包括例如半导体存储设备,例如,可编程只读存储器(EPROM)、可编程只读存储器(EEPROM)和闪存设备。处理器和存储器可以由专用逻辑电路来补充或并入专用逻辑电路。
说明书和附图仅被认为是示例性的,其中示例性意味着示例。如这里所使用的,单数形式“一”、“一个”和“该”意图也包括复数形式,除非上下文清楚地另外指示。此外,“或”的使用旨在包括“和/或”,除非上下文中清楚地指示。
虽然本专利文档包含许多细节,但这些不应被解释为对任何发明或所要求保护的范围的限制,而是对特定发明的特定实施例所特有的特征的描述。本专利文档中在单独实施例的上下文中描述的某些特征也可以在单个实施例中组合实施。相反,在单个实施例的上下文中描述的各种特征也可以在多个实施例中单独或以任何合适的子组合来实施。此外,尽管上述特征可以被描述为以某些组合起作用,甚至最初被要求这样来保护,但是在某些情况下,可以从所要求保护的组合中删除该组合中的一个或多个特征,并且所要求保护的组合可以指向子组合或子组合的变体。
类似地,尽管在附图中以特定顺序描述了操作,但这不应理解为要求以所示的特定顺序或顺序地执行这些操作,或者要求执行所有所示的操作,以获得期望的结果。此外,在本专利文档中描述的实施例中的各种系统组件的分离不应该理解为在所有实施例中都需要这种分离。
仅描述了几个实施方式和示例,并且可以基于本专利文档中描述和图示的内容进行其它实施方式、增强和变化。
Claims (15)
1.一种用于可视媒体编码的方法,包括:
为将可视媒体数据的视频区域中的当前视频块编码为可视媒体数据的比特流表示,做出关于至少基于与视频区域相关联的编解码树结构或至少从与视频区域相关联的编解码树结构推断的跨分量线性模型(CCLM)预测模式的应用的决定,其中,在CCLM预测模式下,在当前视频块的重构亮度样点上使用线性模型预测当前视频块的色度样点;以及
在比特流表示中选择性地包括语法元素,其中该语法元素指示至少基于编解码树结构或至少从编解码树结构推断的CCLM预测模式的应用。
2.一种用于可视媒体解码的方法,包括:
从包括包含当前视频块的视频区域的可视媒体数据的比特流表示确定与当前视频块相关联的编解码树结构;
至少基于编解码树结构,确定语法元素是否被包括在比特流表示中,其中,语法元素指示跨分量线性模型(CCLM)预测模式对当前视频区域的应用,其中,在CCLM预测模式下,在当前视频块的重构亮度样点上使用线性模型预测当前视频块的色度样点;以及
从比特流表示生成当前视频块。
3.根据权利要求1-2中任一项或多项所述的方法,其中,在比特流表示中排除语法元素的情况下,指示CCLM预测模式的应用的语法元素被推断。
4.根据权利要求1-3中任一项或多项所述的方法,其中,在编解码树结构是双编解码树结构类型的情况下,语法元素被推断为布尔假值。
5.根据权利要求1-4中任一项或多项所述的方法,其中,在编解码树结构是双编解码树结构类型的情况下,语法元素从比特流表示中排除,并且基于当前视频块或当前视频块的至少一个邻近块的块维度来推断。
6.根据权利要求1-4中任一项或多项所述的方法,其中,在编解码树结构是双编解码树结构类型的情况下,语法元素从比特流表示中排除,并且基于以下中的一个或多个来推断:
(1)在序列参数集(SPS)、视频参数集(VPS)、图片参数集(PPS)、图片头、条带头、片组头、最大编解码单元(LCU)、LCU行、LCU组或编解码单元(CU)中信令通知的消息,
(2)与其他视频块相关联的编解码图片/片/条带/重构区域中的IBC模式和/或帧间模式的哈希命中率,
(3)当前视频块或至少一个邻近块的块形状,
(4)当前视频块或至少一个邻近块的当前量化参数(QP),
(5)当前视频块的色彩格式的指示,
(6)与当前视频块相关联的单独或双编解码树结构,
(7)当前视频块的条带类型、片组类型或图片类型,或者
(8)时域层ID。
7.一种用于可视媒体编码的方法,包括:
做出关于至少基于与视频区域相关联的编解码树结构或至少从与视频区域相关联的编解码树结构推断的亮度映射与色度缩放(LMCS)处理步骤对视频区域的应用的决定,为将可视媒体数据的视频区域中的当前视频块编码为可视媒体数据的比特流表示,其中,在LMCS处理步骤中,使用自适应分段线性模型映射视频区域中的亮度样点和/或对视频区域中的色度样点进行亮度依赖的色度残差缩放操作;以及
在比特流表示中选择性地包括语法元素,其中该语法元素指示LMCS处理步骤对视频区域的应用。
8.一种用于可视媒体解码的方法,包括:
从包括包含当前视频块的视频区域的可视媒体数据的比特流表示确定与当前视频块相关联的编解码树结构;
至少基于编解码树结构,确定语法元素是否被包括在比特流表示中,其中,语法元素指示亮度映射与色度缩放(LMCS)处理步骤对视频区域的应用,其中,在LMCS处理步骤中,使用自适应分段线性模型映射亮度样点,并且对色度样点进行亮度依赖的色度残差缩放操作;以及
从比特流表示生成当前视频块。
9.根据利要求7-8中任一项或多项的方法,其中,在比特流表示中排除语法元素的情况下,指示LMCS处理步骤的应用的语法元素被推断。
10.根据权利要求7-9中任一项或多项所述的方法,其中,在编解码树结构是双编解码树结构类型的情况下,语法元素被推断为布尔假值。
11.根据权利要求7-10中任一项或多项所述的方法,其中,在编解码树结构是双编解码树结构类型的情况下,语法元素从比特流表示中排除,并且基于以下中的一个或多个来推断:
(1)在序列参数集(SPS)、视频参数集(VPS)、图片参数集(PPS)、图片头、条带头、片组头、最大编解码单元(LCU)、LCU行、LCU组或编解码单元(CU)中信令通知的消息,
(2)与其他视频块相关联的编解码图片/片/条带/重构区域中的IBC模式和/或帧间模式的哈希命中率,
(3)当前视频块或当前视频块的至少一个邻近块的块维度,
(4)当前视频块或至少一个邻近块的块形状,
(5)当前视频块或至少一个邻近块的当前量化参数(QP),
(6)当前视频块的色彩格式的指示,
(7)与当前视频块相关联的单独或双编解码树结构,
(8)当前视频块的条带类型、片组类型或图片类型,或者
(9)时域层ID。
12.根据权利要求6或11中任一项或多项所述的方法,其中,所述当前视频块的色彩格式是4:2:0格式或4:4:4格式。
13.一种视频编码器装置,包括被配置为实施根据权利要求1-12中任一项或多项所述的方法的处理器。
14.一种视频解码器装置,包括被配置为实施根据权利要求1-12中任一项或多项所述的方法的处理器。
15.一种其上存储有代码的计算机可读介质,所述代码体现用于实施根据权利要求1-12中任一项或多项所述的方法的处理器可执行指令。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2019089250 | 2019-05-30 | ||
CNPCT/CN2019/089250 | 2019-05-30 | ||
PCT/US2020/034839 WO2020243246A1 (en) | 2019-05-30 | 2020-05-28 | Using coding tree structure type to control coding mode |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113892267A true CN113892267A (zh) | 2022-01-04 |
Family
ID=73552927
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202080040213.0A Pending CN113892267A (zh) | 2019-05-30 | 2020-05-28 | 使用编解码树结构类型控制编解码模式 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN113892267A (zh) |
WO (1) | WO2020243246A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023138628A1 (en) * | 2022-01-21 | 2023-07-27 | Mediatek Inc. | Method and apparatus of cross-component linear model prediction in video coding system |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023138627A1 (en) * | 2022-01-21 | 2023-07-27 | Mediatek Inc. | Method and apparatus of cross-component linear model prediction with refined parameters in video coding system |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9860540B2 (en) * | 2014-01-03 | 2018-01-02 | Qualcomm Incorporated | Inference of nooutputofpriorpicsflag in video coding |
WO2017139937A1 (en) * | 2016-02-18 | 2017-08-24 | Mediatek Singapore Pte. Ltd. | Advanced linear model prediction for chroma coding |
US10390015B2 (en) * | 2016-08-26 | 2019-08-20 | Qualcomm Incorporated | Unification of parameters derivation procedures for local illumination compensation and cross-component linear model prediction |
EP3662664A4 (en) * | 2017-08-03 | 2020-11-25 | Sharp Kabushiki Kaisha | SYSTEMS AND METHODS FOR DIVIDING VIDEO BLOCKS INTO AN INTERPREDICTION SLICE OF VIDEO DATA |
-
2020
- 2020-05-28 WO PCT/US2020/034839 patent/WO2020243246A1/en active Application Filing
- 2020-05-28 CN CN202080040213.0A patent/CN113892267A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023138628A1 (en) * | 2022-01-21 | 2023-07-27 | Mediatek Inc. | Method and apparatus of cross-component linear model prediction in video coding system |
TWI821112B (zh) * | 2022-01-21 | 2023-11-01 | 聯發科技股份有限公司 | 視頻編解碼系統中跨分量線性模型預測的方法和裝置 |
Also Published As
Publication number | Publication date |
---|---|
WO2020243246A1 (en) | 2020-12-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113711611B (zh) | 用于变换跳过模式中的系数编解码的方法、装置和介质 | |
CN113728642B (zh) | 编解码视频的量化残差差分脉冲编解码调制表示 | |
CN113785568B (zh) | 变换跳过模式下的信令通知 | |
US11438602B2 (en) | Coding mode based on a coding tree structure type | |
US11490089B2 (en) | Transform bypass coded residual blocks in digital video | |
CN113796069B (zh) | 使用量化残差差分脉冲编解码调制编解码的帧内编解码视频 | |
CN113892267A (zh) | 使用编解码树结构类型控制编解码模式 | |
JP2023521119A (ja) | ビデオコーディングにおけるスキップブロックの変換のための最小許容量子化 | |
CN114747217A (zh) | 调色板编解码模式 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |