CN117376567A - 局部双树的调色板模式 - Google Patents

局部双树的调色板模式 Download PDF

Info

Publication number
CN117376567A
CN117376567A CN202311524935.5A CN202311524935A CN117376567A CN 117376567 A CN117376567 A CN 117376567A CN 202311524935 A CN202311524935 A CN 202311524935A CN 117376567 A CN117376567 A CN 117376567A
Authority
CN
China
Prior art keywords
video
palette
video block
flag
block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311524935.5A
Other languages
English (en)
Inventor
许继征
张莉
王业奎
张凯
朱维佳
王悦
王洋
刘鸿彬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Douyin Vision Co Ltd
ByteDance Inc
Original Assignee
Douyin Vision Co Ltd
ByteDance Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Douyin Vision Co Ltd, ByteDance Inc filed Critical Douyin Vision Co Ltd
Publication of CN117376567A publication Critical patent/CN117376567A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

提供了一种处理视频数据的方法,包括:对于视频的第一视频块与所述视频的比特流之间的转换,确定第一预测模式被应用于所述第一视频块;维护预测器调色板表;在所述第一预测模式中,基于所述预测器调色板表构建包括用于所述第一视频块的一个或多个调色板预测器的第一调色板;以及基于所述第一预测模式执行所述转换,其中,在所述第一预测模式中,所述第一视频块的重构样点由代表性颜色值集合表示,所述代表性颜色值集合包括以下中的至少一种1)从所述第一调色板推导的调色板预测器,2)逸出样点,或者3)所述比特流中包括的调色板信息,其中,所述第一调色板中的最大条目数基于所述第一视频块的树类型。

Description

局部双树的调色板模式
本申请是下列发明专利申请的分案申请:
申请号:202180013088.9
申请日:2021年2月5日
发明名称:局部双树的调色板模式
相关申请的交叉引用
根据适用的《专利法》和/或《巴黎公约》的规定,本申请要求于2020年2月5日提交的国际专利申请PCT/CN2020/074316和于2020年5月21日提交的国际专利申请PCT/CN2020/091661的优先权和利益。出于法律上的所有目的,将前述申请的全部公开以引用方式并入本文,作为本申请公开的一部分。
技术领域
本专利文档涉及图片和视频的编码和解码技术。
背景技术
在互联网和其他数字通信网络中,数字视频占用了最大的带宽。随着能够接收和显示视频的连接用户设备数量的增加,预计数字视频使用的带宽需求将继续增长。
发明内容
本文档公开了能够由视频编码器和解码器用于使用调色板模式进行视频处理的技术,在调色板模式中,代表性样点值的调色板用于视频的表示。
根据本公开的一方面,提供了一种处理视频数据的方法,包括:对于视频的第一视频块与所述视频的比特流之间的转换,确定第一预测模式被应用于所述第一视频块;维护预测器调色板表;在所述第一预测模式中,基于所述预测器调色板表构建包括用于所述第一视频块的一个或多个调色板预测器的第一调色板;以及基于所述第一预测模式执行所述转换,其中,在所述第一预测模式中,所述第一视频块的重构样点由代表性颜色值集合表示,所述代表性颜色值集合包括以下中的至少一种1)从所述第一调色板推导的调色板预测器,2)逸出样点,或者3)所述比特流中包括的调色板信息,其中,所述第一调色板中的最大条目数基于所述第一视频块的树类型。
根据本公开的另一方面,提供了一种用于处理视频数据的设备,包括处理器和其上具有指令的非瞬态存储器,其中所述指令在由所述处理器执行时使所述处理器:对于视频的第一视频块与所述视频的比特流之间的转换,确定第一预测模式被应用于所述第一视频块;维护预测器调色板表;在所述第一预测模式中,基于所述预测器调色板表构建包括用于所述第一视频块的一个或多个调色板预测器的第一调色板;以及基于所述第一预测模式执行所述转换,其中,在所述第一预测模式中,所述第一视频块的重构样点由代表性颜色值集合表示,所述代表性颜色值集合包括以下中的至少一种1)从所述第一调色板推导的调色板预测器,2)逸出样点,或者3)所述比特流中包括的调色板信息,其中,所述第一调色板中的最大条目数基于所述第一视频块的树类型。
根据本公开的另一方面,提供了一种非暂时性计算机可读存储介质,其中存储有指令,所述指令使得处理器:对于视频的第一视频块与所述视频的比特流之间的转换,确定第一预测模式被应用于所述第一视频块;维护预测器调色板表;在所述第一预测模式中,基于所述预测器调色板表构建包括用于所述第一视频块的一个或多个调色板预测器的第一调色板;以及基于所述第一预测模式执行所述转换,其中,在所述第一预测模式中,所述第一视频块的重构样点由代表性颜色值集合表示,所述代表性颜色值集合包括以下中的至少一种1)从所述第一调色板推导的调色板预测器,2)逸出样点,或者3)所述比特流中包括的调色板信息,其中,所述第一调色板中的最大条目数基于所述第一视频块的树类型。
根据本公开的另一方面,提供了一种存储由视频处理设备执行的方法生成的视频比特流的非暂时性计算机可读记录介质,其中所述方法包括:对于视频的第一视频块,确定第一预测模式被应用于所述第一视频块;维护预测器调色板表;在所述第一预测模式中,基于所述预测器调色板表构建包括用于所述第一视频块的一个或多个调色板预测器的第一调色板;以及基于所述第一预测模式生成所述视频的比特流,其中,在所述第一预测模式中,所述第一视频块的重构样点由代表性颜色值集合表示,所述代表性颜色值集合包括以下中的至少一种1)从所述第一调色板推导的调色板预测器,2)逸出样点,或者3)所述比特流中包括的调色板信息,其中,所述第一调色板中的最大条目数基于所述第一视频块的树类型。
根据本公开的另一方面,提供了一种存储视频的比特流的方法,包括:对于视频的第一视频块,确定第一预测模式被应用于所述第一视频块;维护预测器调色板表;在所述第一预测模式中,基于所述预测器调色板表构建包括用于所述第一视频块的一个或多个调色板预测器的第一调色板;基于所述第一预测模式生成所述视频的比特流;以及将所述比特流存储在非暂时性计算机可读记录介质中,其中,在所述第一预测模式中,所述第一视频块的重构样点由代表性颜色值集合表示,所述代表性颜色值集合包括以下中的至少一种1)从所述第一调色板推导的调色板预测器,2)逸出样点,或者3)所述比特流中包括的调色板信息,其中,所述第一调色板中的最大条目数基于所述第一视频块的树类型。
在一个示例方面,公开了一种视频处理方法。该方法包括使用调色板模式执行视频的视频块和该视频的比特流之间的转换,在调色板模式中,使用代表性颜色值的调色板来表示该视频块的样点。基于局部双树是否被应用于视频块确定该视频块的调色板的尺寸。
在另一示例方面,公开了一种视频处理方法。该方法包括使用调色板模式在视频的视频块和该视频的比特流之间执行转换,在调色板模式中,使用代表性颜色值的调色板来表示该视频块的样点。该视频块的调色板预测器的尺寸基于局部双树是否被应用于该视频块。
在另一示例方面,公开了一种视频处理方法。该方法包括使用调色板模式执行视频的视频块和该视频的比特流之间的转换,在调色板模式中,使用代表性颜色值的调色板来表示该视频块的样点。比特流符合规则,该各种指定使用至少受最大允许值或最小允许值约束的量化参数在比特流中编解码逸出样点的值。
在另一示例方面,公开了一种视频处理方法。该方法包括根据格式规则执行视频的块和该视频的比特流之间的转换,该格式规则指定在比特流的自适应参数集中是否存在与色度编码工具相关联的参数是基于自适应参数集中的控制标志。
在另一示例方面,公开了一种视频处理方法。该方法包括执行视频的块和该视频的比特流之间的转换。该比特流符合格式规则,该格式规则指定在视频是单色的或者视频的颜色分量被单独处理的情况下,在比特流的图片标头中省略与量化参数相关联的语法元素。
在另一示例方面,公开了一种视频处理方法。该方法包括根据规则执行视频的视频块和该视频的比特流之间的转换,该规则指定,对于该转换,使用代表性颜色值的调色板来表示该视频块的样点的调色板模式和在残差域中执行颜色空间转换的自适应颜色变换模式被互斥地启用。
在另一示例方面,公开了一种视频处理方法。该方法包括执行视频的视频块和该视频的比特流之间的转换。其中在残差域中执行颜色空间转换的自适应颜色变换模式被应用于该视频块的残差块,而不管残差块的颜色空间。
在另一示例方面,公开了一种视频处理方法。该方法包括执行视频的视频块和该视频的比特流之间的转换。使用变换跳过残差编解码工具对该视频块进行编解码,其中使用上下文编解码过程或旁路编解码过程对视频块的变换跳过编解码的残差系数进行编解码。在转该换期间,在旁路编解码过程的开始或结束时,将操作应用于指定视频块中允许的剩余上下文编码的二进制数的数量的变量。
在另一示例方面,公开了一种视频处理方法。该方法包括使用变换跳过残差编解码过程来执行视频的视频块和该视频的比特流之间的转换。在该转换期间,将操作应用于指示语法元素是否属于特定扫描阶段的变量。
在另一示例方面,公开了一种视频处理方法。该方法包括执行视频的视频块和该视频的比特流之间的转换。在该转换期间,指示系数级的符号的语法元素是使用旁路编解码过程还是上下文编解码过程进行编解码基于扫描阶段的索引,在该扫描阶段中,视频块的区域中的一个或多个系数的相同语法元素按次序被编解码。
在另一示例方面,公开了一种视频处理方法。该方法包括使用变换跳过残差编解码过程来执行视频的视频块和该视频的比特流之间的转换。在该转换期间,指示系数级的符号的语法元素是使用旁路编解码过程还是上下文编解码过程进行编解码基于语法元素是否在与另一语法元素相同的扫描阶段中被信令通知。
在另一示例方面,公开了一种视频处理方法。该方法包括执行视频的视频块和该视频的编解码表示之间的转换,其中,调色板模式被用于该视频块的编解码表示,其中,使用代表性颜色值的调色板来表示该视频块的样点;并且其中,使用逸出符和使用量化参数量化的值对调色板之外的样点进行编解码,该量化参数在由规则确定的最小允许值和最大允许值之间的范围内。
在另一示例方面,公开了一种视频处理方法。该方法包括执行视频的视频块和该视频的编解码表示之间的转换,其中,调色板模式被用于该视频块的编解码表示,其中,使用代表性颜色值的调色板来表示该视频块的样点;并且其中,调色板的尺寸取决于关于局部双树是否用于视频块和编解码表示之间的转换的规则。
在另一示例方面,公开了一种视频处理方法。该方法包括执行视频的视频块和该视频的编解码表示之间的转换,其中,调色板模式被用于该视频块的编解码表示,其中,使用代表性颜色值的调色板来表示该视频块的样点;并且其中,调色板预测器的尺寸取决于关于局部双树是否用于视频块和编解码表示之间的转换的规则。
在另一示例方面,公开了一种视频处理方法。该方法包括,对于视频的视频区域的视频块和该视频的编解码表示之间的转换,基于编解码条件确定标识视频的色度分量的去方块偏移的语法元素是否被包括在视频区域级的编解码表示中;并且基于该确定来执行转换;其中,去方块偏移被用于选择性地启用对该视频块的去方块操作。
在另一示例方面,公开了一种视频处理方法。该方法包括,对于视频的视频区域的视频块和该视频的编解码表示之间的转换,基于编解码条件确定标识色度编解码工具的使用的语法元素是否被包括在视频区域级的编解码表示中;并且基于该确定来执行转换;其中,去方块偏移被用于选择性地启用对该视频块的去方块操作。
在另一示例方面,公开了一种视频处理方法。该方法包括执行视频的视频区域的视频块和该视频的编解码表示之间的转换,其中,编解码表示符合格式;其中,该格式指定指示视频的色度分量的去方块偏移的第一标志是否被包括在编解码表示中是基于指示色度分量的量化参数偏移的第二标志是否被包括在编解码表示中。
在另一示例方面,公开了一种视频处理方法。该方法包括执行视频的视频区域的视频块和该视频的编解码表示之间的转换,其中,编解码表示符合格式规则;其中,该格式规则指定该编解码表示中的语法元素控制指示一个或多个色度编解码工具的适用性的一个或多个参数是否被包括在视频区域或视频块级的编解码表示中。
在又一示例方面,公开了一种视频编码器装置。该视频编码器包括被配置为实现上述方法的处理器。
在又一示例方面,公开了一种视频解码器装置。该视频解码器包括被配置为实现上述方法的处理器。
在又一示例方面,公开了一种其上存储有代码的计算机可读介质。该代码以处理器可执行代码的形式实现本文描述的方法之一。
这些以及其他特征将在本文档中描述。
附图说明
图1示出了以调色板模式编解码的块的示例。
图2图示了使用调色板预测器来信令通知调色板条目。
图3示出了水平和垂直遍历扫描的示例。
图4图示了调色板索引的示例编解码。
图5A-图5B示出了最小色度帧间预测单元(SCIPU)的示例。
图6是利用ACT的解码过程的示意图。
图7是示例视频处理系统的框图。
图8是视频处理装置的框图。
图9是视频处理的示例方法的流程图。
图10是图示根据本公开的一些实施例的视频编解码系统的框图。
图11是图示根据本公开的一些实施例的编码器的框图。
图12是图示根据本公开的一些实施例的解码器的框图。
图13是根据本技术的视频处理方法的流程图表示。
图14是根据本技术的另一视频处理方法的流程图表示。
图15是根据本技术的另一视频处理方法的流程图表示。
图16是根据本技术的另一视频处理方法的流程图表示。
图17是根据本技术的另一视频处理方法的流程图表示。
图18是根据本技术的另一视频处理方法的流程图表示。
图19是根据本技术的另一视频处理方法的流程图表示。
图20是根据本技术的另一视频处理方法的流程图表示。
图21是根据本技术的另一视频处理方法的流程图表示。
图22是根据本技术的另一视频处理方法的流程图表示。
图23是根据本技术的又一视频处理方法的流程图表示。
具体实施方式
在本文档中使用章节标头是为了易于理解,而不是将每个章节中公开的技术和实施例的适用性仅限制于该章节。此外,在一些描述中使用H.266术语仅仅是为了易于理解,而不是为了限制所公开技术的范围。因此,本文描述的技术也适用于其他视频编解码器协议和设计。
1.概览
本文档涉及视频编解码技术。具体地说,它涉及调色板编解码中的索引和逸出符号编解码、色度格式信令通知和残差编解码。它可以应用于现有的视频编解码标准,如HEVC,或者即将完成的标准(多功能视频编解码)。它也可以应用于未来的视频编解码标准或视频编解码器。
2.视频编解码标准
视频编解码标准主要通过众所周知的ITU-T和ISO/IEC标准的发展而演进。ITU-T制定了H.261和H.263,ISO/IEC制定了MPEG-1和MPEG-4Visual,这两个组织联合制定了H.262/MPEG-2视频和H.264/MPEG-4高级视频编就码(AVC)和H.265/HEVC标准。自H.262以来,视频编解码标准基于混合视频编解码结构,其中,利用了时域预测加变换编解码。为了探索HEVC以外的未来视频编解码技术,VCEG和MPEG于2015年联合成立了联合视频探索小组(JVET)。此后,JVET采用了许多新方法,并将其输入到名为联合探索模型(JEM)的参考软件中。2018年4月,VCEG(Q6/16)和ISO/IEC JTC1SC29/WG11(MPEG)成立了联合视频专家小组(JVET),其致力于VVC标准,目标是与HEVC相比将比特率降低50%。
2.1HEVC屏幕内容编解码扩展(HEVC-SCC)中的调色板模式
2.1.1调色板模式的概念
调色板模式背后的基本思想是CU中的像素由代表性的颜色值小集合来表示。这个集合被称为调色板。并且还可以通过信令通知后跟(可能量化的)分量值的逸出符来指示调色板之外的样点。这种像素称为逸出像素。调色板模式如图1所示。如图1所示,对于具有三个颜色分量(亮度和两个色度分量)的每个像素,建立调色板的索引,并且可以基于在调色板中建立的值来重建块。
2.1.2调色板条目的编解码
对于调色板条目的编解码,维护调色板预测器。在SPS中信令通知调色板和调色板预测器的最大尺寸。在HEVC-SCC中,在PPS中引入了palette_predictor_initializer_present_flag。当该标志为1时,在比特流中用信令通知用于初始化调色板预测器的条目。调色板预测器在每个CTU行、每个条带和每个片的开始被初始化。根据palette_predictor_initializer_present_flag的值,调色板预测器被重置为0或使用PPS中信令通知的调色板预测器初始化器条目来进行初始化。在HEVC-SCC中,启用尺寸为0的调色板预测器初始化器,以允许在PPS级别显式禁用调色板预测器初始化。
对于调色板预测器中的每个条目,信令通知重用标志,以指示其是否是当前调色板的一部分。这在图2中图示。使用零的游程编解码递送重用标志。此后,使用0阶指数Golomb(EG)码,即EG-0,来信令通知新调色板条目的数量。最后,信令通知新调色板条目的分量值。
2.1.3调色板索引的编解码
如图3所示,使用水平和垂直遍历扫描对调色板索引进行编码。使用palette_transpose_flag在比特流中明确地信令通知扫描顺序。对于本小节的其余部分,假设扫描是水平的。
调色板索引使用两种调色板样点模式进行编解码:“COPY_LEFT”和“COPY_ABOVE”。在“COPY_LEFT”模式下,调色板索引被分配给解码索引。在“COPY_ABOVE”模式下,复制上一行中样点的调色板索引。对于“COPY_LEFT”和“COPY_ABOVE”两种模式,信令通知指定也使用相同模式编解码的后续样点的数量的游程值。
在调色板模式中,逸出符的索引值是调色板条目的数量。并且,当逸出符号是“COPY_LEFT”或“COPY_ABOVE”模式下游程的一部分时,逸出分量值会针对每个逸出符号信令通知。调色板索引的编解码如图4所示。
这种语法顺序是按如下方式完成的。首先,信令通知CU的索引值的数量。接下来是使用截断二进制编解码来信令通知整个CU的实际索引值。索引数量和索引值都以旁路模式编解码。这将与索引相关的旁路二进制数分组在一起。然后,调色板样点模式(如有必要)和游程以交错方式被信令通知。最后,与整个CU的逸出样点相对应的分量逸出值被分组在一起,并以旁路模式进行编解码。逸出样点的二进制化是具有三阶的EG编码,即EG-3。
附加的语法元素last_run_type_flag在信令通知索引值之后被信令通知。该语法元素与索引的数量相结合,消除了信令通知与块中最后一个游程相对应的游程值的需要。
在HEVC-SCC中,调色板模式也支持4:2:2、4:2:0和单色色度格式。对于所有色度格式,调色板条目和调色板索引的信令通知几乎是相同的。在非单色格式的情况下,每个调色板条目由3个分量组成。对于单色格式,每个调色板条目由一个分量组成。对于子采样色度方向,色度样点与可被2整除的亮度样点索引相关联。为CU重建调色板索引后,如果样点只有一个与之相关联的分量,则只使用调色板条目的第一分量。信令通知的唯一区别是逸出分量值。对于每个逸出符号,取决于与该符号相关联的分量的数量,信令通知的逸出分量值的数量可能不同。
图4图示了调色板索引的示例编解码。
此外,调色板索引编解码中还有索引调整过程。当信令通知调色板索引时,左相邻索引或上相邻索引应该不同于当前索引。因此,通过去除一种可能性,当前调色板索引的范围可以减少1。之后,索引用截断二进制(TB)二进制化来信令通知。
与该部分相关的文本如下所示,其中CurrPaletteIndex是当前调色板索引,adjustedRefPaletteIndex是预测索引。
变量PaletteIndexMap[xC][yC]指定调色板索引,它是由CurrentPaletteEntries表示的数组的索引。数组索引xC、yC指定样点相对于图片左上亮度样点的位置(xC,yC)。PaletteIndexMap[xC][yC]的值应在0到MaxPaletteIndex的范围内,包括端值。
变量adjustedRefPaletteIndex的推导如下:
当CopyAboveIndicesFlag[xC][yC]等于0时,变量CurrPaletteIndex的推导如下:
if(CurrPaletteIndex>=adjustedRefPaletteIndex)
CurrPaletteIndex++
此外,调色板模式中的游程长度元素是上下文编解码的。JVET-O2011-vE中描述的相关上下文推导过程如下所示。
用于语法元素palette_run_prefix的ctxInc的推导过程
该过程的输入是二进制数索引binIdx和语法元素copy_above_palette_indexes_flag和palette_idx_idc。
该过程的输出是变量ctxInc。
变量ctxInc的推导如下:
–如果copy_above_palette_indexes_flag等于0且binIdx等于0,
则ctxInc的推导如下:
ctxInc=(palette_idx_idc<1)?0:((palette_idx_idc<3)?1:2)(9-69)
–否则,ctxInc由表1提供:
表1–ctxIdxMap[copy_above_palette_indices_flag][binIdx]的规范
2.2VCC中的调色板模式
2.2.1双树中的调色板
在VVC中,双树编解码结构被用于对帧内条带进行编解码,因此亮度分量和两个色度分量可以具有不同的调色板和调色板索引。此外,两个色度分量共享相同的调色板和调色板索引。
2.2.2作为分离模式的调色板
在一些实施例中,用于编解码单元的预测模式能够是MODE_INTRA、MODE_INTER、MODE_IBC和MODE_PLT。预测模式的二进制化相应地改变。
当IBC被关闭时,对于I片,第一二进制数被采用以指示当前预测模式是否是MODE_PLT。对于P/B片,第一二进制数被采用以指示当前预测模式是否是MODE_INTRA。如果不是,则一个额外的二进制数被采用以指示当前预测模式是MODE_PLT还是MODE_INTER。
当IBC被开启时,对于I片,第一二进制数被采用以指示当前预测模式是否是MODE_IBC。如果不是,则第二二进制数被采用以指示当前预测模式是MODE_PLT还是MODE_INTRA。对于P/B片,第一二进制数被采用以指示当前预测模式是否是MODE_INTRA。如果是帧内模式,则第二二进制数被采用以指示当前预测模式是MODE_PLT还是MODE_INTRA。如果不是,则第二二进制数被采用以指示当前预测模式是MODE_IBC还是MODE_INTER。
示例文本如下所示。
2.2.3调色板模式语法
/>
/>
/>
/>
/>
2.2.4调色板模式语义
在以下语义中,数组索引x0、y0指定所考虑的编解码块的左上亮度样点相对于图片的左上亮度样点的位置(x0,y0)。数组索引xC、yC指定该样点相对于图片左上亮度样点的位置(xC,yC)。数组索引startComp指定了当前调色板表的第一颜色分量。startComp等于0表示Y分量;startComp等于1表示Cb分量;startComp等于2表示Cr分量。numComps指定当前调色板表格中颜色分量的数量。
预测器调色板包括用于预测当前调色板中的条目的、来自先前编解码单元的调色板条目。
变量PredictorPaletteSize[startComp]指定当前调色板表格的第一颜色分量startComp的预测器调色板的尺寸。PredictorPaletteSize根据条款8.4.5.3中的规定导出。
变量PalettePredictorEntryReuseFlags[i]等于1指定预测器调色板中的第i个条目在当前调色板中被重用。PalettePredictorEntryReuseFlags[i]等于0指定预测器调色板中的第i个条目不是当前调色板中的条目。数组PalettePredictorEntryReuseFlags[i]的所有元素都被初始化为0。
palette_predictor_run用于确定数组PalettePredictorEntryReuseFlags中非零条目前面的零的数量。
比特流一致性的要求是palette_predictor_run的值应在0到(PredictorPaletteSize-predictorEntryIdx)的范围内,包括端值,其中predictorEntryIdx与数组PalettePredictorEntryReuseFlags中的当前位置相对应。变量NumPredictedPaletteEntries指定当前调色板中从预测器调色板中重用的条目数。NumPredictedPaletteEntries的值应在0到palette_max_size的范围内,包括端值。
num_signalled_palette_entries指定当前调色板中为当前调色板表格的第一颜色分量startComp明确信令通知的条目数。
当num_signalled_palette_entries不存在时,其被推断为等于0。
变量CurrentPaletteSize[startComp]为当前调色板表格的第一颜色分量startComp指定当前调色板的尺寸,并且被推导如下:
CurrentPaletteSize[startComp]=NumPredictedPaletteEntries+num_signalled_palette_entries(7-155)
CurrentPaletteSize[startComp]的值应在0到palette_max_size的范围内,包括端值。
new_palette_entries[cIdx][i]指定用于颜色分量cIdx的第i个信令通知的调色板条目的值。
变量PredictorPaletteEntries[cIdx][i]指定用于颜色分量cIdx的预测器调色板中的第i个元素。
变量CurrentPaletteEntries[cIdx][i]指定用于颜色分量cIdx的当前调色板中的第i个元素,并且被推导如下:
palette_escape_val_present_flag等于1指定当前编解码单元包含至少一个逸出编解码样点。escape_val_present_flag等于0指定当前编解码单元中没有逸出编解码样点。当不存在时,palette_escape_val_present_flag的值被推断为等于1。
变量MaxPaletteIndex指定当前编解码单元的调色板索引的最大可能值。MaxPaletteIndex的值被设置为等于CurrentPaletteSize[startComp]-1+palette_escape_val_present_flag。
num_palette_indices_minus1加1是为当前块显式信令通知或推断的调色板索引的数量。
当num_palette_indices_minus1不存在时,其被推断为等于0。
palette_idx_idc是调色板表格的索引CurrentPaletteEntries的指示。对于块中的第一索引,palette_idx_idc的值应在0到MaxPaletteIndex的范围内,包括端值,对于块中的剩余索引,palette_idx_idc的值应在0到MaxPaletteIndex-1的范围内,包括端值。
当palette_idx_idc不存在时,其被推断为等于0。
变量PaletteIndexIdc[i]存储显式信令通知或推断的第i个palette_idx_idc。数组PaletteIndexIdc[i]的所有元素都被初始化为0。
copy_above_indices_for_final_run_flag等于1指定如果使用水平遍历扫描,则从上一行中的调色板索引复制编解码单元中最后位置的调色板索引,或者如果使用垂直遍历扫描,则从左列中的调色板索引复制。copy_above_indices_for_final_run_flag等于0指定从PaletteIndexIdc[num_palette_indices_minus1]复制编解码单元中最后位置的调色板索引。
当copy_above_indices_for_final_run_flag不存在时,其被推断为等于0。
palette_transpose_flag等于1指定应用垂直遍历扫描来扫描当前编解码单元中样点的索引。palette_transpose_flag等于0指定应用水平遍历扫描来扫描当前编解码单元中样点的索引。当不存在时,palette_transpose_flag的值被推断为等于0。
数组TraverseScanOrder指定调色板编解码的扫描顺序数组。如果palette_transpose_flag等于0,则TraverseScanOrder被分配水平扫描顺序HorTravScanOrder,并且如果palette_transpose_flag等于1,则TraverseScanOrder被分配垂直扫描顺序VerTravScanOrder。
copy_above_palette_indices_flag等于1指定如果使用水平遍历扫描,则调色板索引等于上一行中相同位置的调色板索引,或如果使用垂直遍历扫描,则调色板索引等于左列中相同位置的调色板索引。copy_above_palette_indices_flag等于0指定样点的调色板索引的指示在比特流中被编解码或被推断。
变量CopyAboveIndicesFlag[xC][yC]等于1指定调色板索引是从上一行(水平扫描)或左列(垂直扫描)中的调色板索引复制的。CopyAboveIndicesFlag[xC][yC]等于0指定调色板索引在比特流中被显式编解码或被推断。数组索引xC、yC指定样点相对于图片左上亮度样点的位置(xC,yC)。PaletteIndexMap[xC][yC]的值应在0到(MaxPaletteIndex–1)的范围内,包括端值。
变量PaletteIndexMap[xC][yC]指定调色板索引,其是由CurrentPaletteEntries表示的数组的索引。数组索引xC、yC指定样点相对于图片左上亮度样点的位置(xC、yC)。PaletteIndexMap[xC][yC]的值应在0到MaxPaletteIndex的范围内,包括端值。
变量adjustedRefPaletteIndex被推导如下:
当CopyAboveIndicesFlag[xC][yC]等于0时,变量CurrPaletteIndex被推导如下:
if(CurrPaletteIndex>=adjustedRefPaletteIndex)
CurrPaletteIndex++(7-158)
palette_run_prefix,当存在时,指定PaletteRunMinus1的二进制化中的前缀部分。
palette_run_suffix用于变量PaletteRunMinus1的推导。当不存在时,palette_run_suffix的值被推断为等于0。
当RunToEnd等于0时,变量PaletteRunMinus1被推导如下:
–如果PaletteMaxRunMinus1等于0,则PaletteRunMinus1被设置为等于0。
–否则(PaletteMaxRunMinus1大于0),适用以下:
–如果palette_run_prefix小于2,则适用以下:
PaletteRunMinus1=palette_run_prefix (7-159)
–否则(palette_run_prefix大于或等于2),适用以下:
PrefixOffset=1<<(palette_run_prefix-1)
PaletteRunMinus1=PrefixOffset+palette_run_suffix (7-160)
变量PaletteRunMinus1被如下使用:
–如果CopyAboveIndicesFlag[xC][yC]等于0,则PaletteRunMinus1指定具有相同调色板索引的连续位置的数量减1。
–否则,如果palette_transpose_flag等于0,则PaletteRunMinus1指定具有与上一行中相应位置中使用的相同的调色板索引的连续位置的数量减1。
–否则,PaletteRunMinus1指定调色板索引与左列相应位置中使用的调色板索引相同的连续位置的数量减1。
当RunToEnd等于0时,变量PaletteMaxRunMinus1表示PaletteMaxRunMinus1的最大可能值,并且比特流一致性的要求是PaletteMaxRunMinus1的值应该大于或等于0。
palette_escape_val指定分量的量化逸出编解码样点值。
变量PaletteEscapeVal[cIdx][xC][yC]指定样点的逸出值,其中PaletteIndexMap[xC][yC]等于MaxPaletteIndex,palette_escape_val_present_flag等于1。数组索引cIdx指定颜色分量。数组索引xC、yC指定样点相对于图片左上亮度样点的位置(xC、yC)。
比特流一致性的要求是,对于cIdx等于0,PaletteEscapeVal[cIdx][xC][yC]应在0至(1<<(BitDepthY+1))-1的范围内,包括端值,对于cIdx不等于0,则在0至(1<<(BitDepthC+1))-1的范围内,包括端值。
2.2.5基于线条的CG调色板模式
VVC采用了基于线条的CG调色板模式。在该方法中,调色板模式的每个CU根据遍历扫描模式被分成多个包括m个样点的段(在该测试中m=16)。每个段中调色板游程编解码的编码顺序如下:对于每个像素,信令通知1个上下文编码的二进制数run_copy_flag=0,指示该像素是否与前一像素具有相同的模式,即,前一扫描像素和当前像素是否都是游程类型COPY_ABOVE,或者前一扫描像素和当前像素是否都是游程类型INDEX和相同的索引值。否则,信令通知run_copy_flag=1。如果像素和前一个像素是不同的模式,则信令通知一个上下文编码的二进制数copy_above_palette_indices_flag,指示像素的游程类型,即INDEX或COPY_ABOVE。与VTM6.0中的调色板模式相同,如果样点位于第一行(水平遍历扫描)或第一列(垂直遍历扫描),解码器不必解析游程类型,因为默认情况下使用索引模式。此外,如果之前解析的游程类型是COPY_ABOVE,则解码器不必解析游程类型。在对一个段中的像素进行调色板游程编解码之后,索引值(对于INDEX模式)和量化的逸出颜色被旁路编码,并且与上下文编码二进制数的编码/解析分开分组,以提高每个线条CG内的吞吐量。因为索引值现在是在游程编解码之后被编码/解析,而不是像在VTM中那样在调色板游程编解码之前被处理,所以编码器不必信令通知索引值的数目num_palette_indices_minus1和最后的游程类型copy_above_indices_for_final_run_flag。
一些实施例中基于线条的CG调色板模式的文本如下所示。
调色板编解码语法
/>
/>
/>
/>
/>
7.4.9.6调色板编解码语义
在以下语义中,数组索引x0、y0指定所考虑的编解码块的左上亮度样点相对于图片的左上亮度样点的位置(x0,y0)。数组索引xC、yC指定该样点相对于图片左上亮度样点的位置(xC,yC)。数组索引startComp指定了当前调色板表的第一颜色分量。startComp等于0表示Y分量;startComp等于1表示Cb分量;startComp等于2表示Cr分量。numComps指定当前调色板表格中颜色分量的数量。
预测器调色板由来自先前编解码单元的调色板条目组成,先前编解码单元用于预测当前调色板中的条目。
变量PredictorPaletteSize[startComp]指定当前调色板表格startComp的第一颜色分量的预测器调色板的尺寸。PredictorPaletteSize根据条款8.4.5.3中的规定导出。
变量PalettePredictorEntryReuseFlags[i]等于1指定预测器调色板中的第i个条目在当前调色板中被重用。PalettePredictorEntryReuseFlags[i]等于0指定预测器调色板中的第i个条目不是当前调色板中的条目。数组PalettePredictorEntryReuseFlags[i]的所有元素都被初始化为0。
palette_predictor_run用于确定数组PalettePredictorEntryReuseFlags中非零条目前面的零的数量。
比特流一致性的要求是palette_predictor_run的值应在0到(PredictorPaletteSize-predictorEntryIdx)的范围内,包括端值,其中predictorEntryIdx与数组PalettePredictorEntryReuseFlags中的当前位置相对应。变量NumPredictedPaletteEntries指定当前调色板中从预测器调色板中重用的条目数。NumPredictedPaletteEntries的值应在0到palette_max_size的范围内,包括端值。
num_signalled_palette_entries指定当前调色板中为当前调色板表格startComp的第一颜色分量明确信令通知的条目数。
当num_signalled_palette_entries不存在时,其被推断为等于0。
变量CurrentPaletteSize[startComp]为当前调色板表格startComp的第一颜色分量指定当前调色板的尺寸,并且被推导如下:
CurrentPaletteSize[startComp]=NumPredictedPaletteEntries+num_signalled_palette_entries (7-155)
CurrentPaletteSize[startComp]的值应在0到palette_max_size的范围内,包括端值。
new_palette_entries[cIdx][i]为颜色分量cIdx指定第i个信令通知的调色板条目的值。
变量PredictorPaletteEntries[cIdx][i]为颜色分量cIdx指定预测器调色板中的第i个元素。
变量CurrentPaletteEntries[cIdx][i]为颜色分量cIdx指定当前调色板中的第i个元素,并且被推导如下:
palette_escape_val_present_flag等于1指定当前编解码单元包含至少一个逸出编码样点。escape_val_present_flag等于0指定当前编解码单元中没有逸出编码样点。当不存在时,palette_escape_val_present_flag的值被推断为等于1。
变量MaxPaletteIndex指定当前编解码单元的调色板索引的最大可能值。MaxPaletteIndex的值被设置为等于CurrentPaletteSize[startComp]-1+palette_escape_val_present_flag。
palette_idx_idc是调色板表格CurrentPaletteEntries的索引的指示。对于块中的第一索引,palette_idx_idc的值应在0到MaxPaletteIndex的范围内,包括端值,对于块中的剩余索引,palette_idx_idc的值应在0到MaxPaletteIndex-1的范围内,包括端值。
当palette_idx_idc不存在时,其被推断为等于0。
palette_transpose_flag等于1指定应用垂直遍历扫描来扫描当前编解码单元中样点的索引。palette_transpose_flag等于0指定应用水平遍历扫描来扫描当前编解码单元中样点的索引。不存在时,palette_transpose_flag的值被推断为等于0。
数组TraverseScanOrder指定用于调色板编解码的扫描顺序数组。如果palette_transpose_flag等于0,则TraverseScanOrder被分配水平扫描顺序HorTravScanOrder,如果palette_transpose_flag等于1,则TraverseScanOrder被分配垂直扫描顺序VerTravScanOrder。
run_copy_flag等于1指定如果copy_above_palette_indices_flag等于0,则调色板游程类型与先前扫描位置的游程类型相同,并且调色板游程索引与先前位置的索引相同。否则,run_copy_flag等于0
copy_above_palette_indices_flag等于1指定如果使用水平遍历扫描,则调色板索引等于上一行中相同位置的调色板索引,或者如果使用垂直遍历扫描,则调色板索引等于左列中相同位置的调色板索引。copy_above_palette_indices_flag等于0指定样点的调色板索引的指示在比特流中被编码或被推断。
CopyAboveIndicesFlag[xC][yC]等于1指定调色板索引是从上一行(水平扫描)或左列(垂直扫描)中的调色板索引复制的。CopyAboveIndicesFlag[xC][yC]等于0指定调色板索引在比特流中被显式编码或被推断。数组索引xC、yC指定样点相对于图片左上亮度样点的位置(xC,yC)。
变量PaletteIndexMap[xC][yC]指定调色板索引,其是由CurrentPaletteEntries表示的数组的索引。数组索引xC、yC指定样点相对于图片左上亮度样点的位置(xC、yC)。PaletteIndexMap[xC][yC]的值应在0到MaxPaletteIndex的范围内,包括端值。
变量adjustedRefPaletteIndex被推导如下:
当CopyAboveIndicesFlag[xC][yC]等于0时,变量CurrPaletteIndex被推导如下:
if(CurrPaletteIndex>=adjustedRefPaletteIndex)
CurrPaletteIndex++ (7-158)
palette_escape_val指定组件的量化逸出编解码样点值。
变量PaletteEscapeVal[cIdx][xC][yC]指定样点的逸出值,其中PaletteIndexMap[xC][yC]等于MaxPaletteIndex,palette_escape_val_present_flag等于1。数组索引cIdx指定颜色分量。数组索引xC、yC指定样点相对于图片左上亮度样点的位置(xC、yC)。
比特流一致性的要求是,对于cIdx等于0,PaletteEscapeVal[cIdx][xC][yC]应在0至(1<<(BitDepthY+1))-1的范围内,包括端值,对于cIdx不等于0,则在0至(1<<(BitDepthC+1))-1的范围内,包括端值。
2.3VVC中的局部双树
在典型的硬件视频编码器和解码器中,由于相邻帧内块之间的样点处理数据依赖性,当图片具有更多小帧内块时,处理吞吐量下降。帧内块的预测器生成需要来自相邻块的顶部和左侧边界重建样点。因此,必须逐块地顺序处理帧内预测。
在HEVC,最小的帧内CU是8×8亮度样点。最小帧内CU的亮度分量能够被进一步划分成四个4×4亮度帧内预测单元(PU),但最小帧内CU的色度分量不能进一步分割。因此,当处理4×4色度帧内块或4×4亮度帧内块时,硬件处理吞吐量最差。
在VTM5.0中,在单个编解码树中,由于色度分割始终遵循亮度,并且最小帧内CU为4×4亮度样点,因此最小色度帧内CB为2×2。因此,在VTM5.0中,单个编解码树中最小的色度帧内CB为2×2。VVC解码的最坏情况硬件处理吞吐量仅为HEVC解码的1/4。此外,在采用包括交叉分量线性模型(CCLM)、4抽头内插滤波器、位置相关的帧内预测组合(PDPC)和组合的帧间帧内预测(CIIP)的工具之后,色度帧内CB的重建过程变得比HEVC中的复杂得多。在硬件解码器中实现高处理吞吐量具有挑战性。在本节中,我们将提出一种提高最坏情况下硬件处理吞吐量的方法。
该方法的目标是通过约束色度帧内CB的分割来禁止小于16个色度样点的色度帧内CB。
在单个编解码树中,SCIPU被定义为编解码树节点,其色度块尺寸大于或等于TH个色度样点,并且具有至少一个小于4TH个亮度样点的子亮度块,其中TH在该提议中被设置为16。要求在每个SCIPU中,所有CB都是帧间,或者所有CB都是非帧间,即帧内或IBC。在非帧间SCIPU的情况下,进一步要求非帧间SCIPU的色度不应该被进一步划分,并且允许SCIPU的亮度被进一步划分。以此方式,最小色度帧内CB尺寸为16个色度样点,并且移除了2×2、2×4和4×2色度CB。此外,在非帧间SCIPU的情况下,不应用色度缩放。此外,当亮度块被进一步划分而色度块未被划分时,构建局部双树编解码结构。
图5A-图5B中示出了两个SCIPU示例。在图5A中,8×4色度样点的一个色度CB和三个亮度CB(4×8、8×8、4×8亮度CB)形成一个SCIPU,因为从8×4色度样点划分的三叉树(TT)将导致小于16个色度样点的色度CB。在图5B中,4×4色度样点的一个色度CB(8×4色度样点的左侧)和三个亮度CB(8×4、4×4、4×4亮度CB)形成一个SCIPU,并且4×4样点的另一个色度CB(8×4色度样点的右侧)和两个亮度CB(8×4、8×4亮度CB)形成一个SCIPU,因为从4×4色度样点划分的二叉树(BT)将导致小于16个色度样点的色度CB。
在所提出的方法中,如果当前条带是I条带或者当前SCIPU在进一步划分一次之后在其中具有4×4亮度分割(因为在VVC不允许帧间4×4),则SCIPU的类型被推断为非帧间;否则,在解析SCIPU中的CU之前,由一个信令通知的标志指示SCIPU的类型(帧间或非帧间)。
通过应用上述方法,当处理4×4、2×8或8×2色度块而不是2×2色度块时,出现最坏情况的硬件处理吞吐量。最差情况下的硬件处理吞吐量与HEVC相同,是VTM5.0的4倍。
2.4变换跳过(TS)
如在HEVC,块的残差能够以变换跳过模式来编解码。为了避免语法编解码的冗余,当CU级别MTS_CU_flag不等于零时,不信令通知变换跳过标志。变换跳过的块尺寸限制与JEM4中的MTS的块尺寸限制相同,这指示当块宽度和高度都等于或小于32时,变换跳过适用于CU。请注意,当为当前CU激活LFNST或MIP时,隐式MTS变换被设置为DCT2。此外,当为帧间编解码块启用MTS时,隐式MTS仍可被启用。
此外,对于变换跳过块,最小允许量化参数(QP)被定义为6*(internalBitDepth–inputBitDepth)+4。
2.5替代的亮度半像素插值滤波器
在一些实施例中,提出了替代的半像素插值滤波器。
半像素亮度插值滤波器的切换取决于运动矢量准确性。除了现有的四分之一像素、全像素和4像素AMVR模式,还引入了新的半像素精度AMVR模式。只有在半像素运动矢量精度的情况下,才可以选择替代的半像素亮度插值滤波器。
对于使用半像素运动向量准确性的非仿射non-merge帧间编解码CU(即,半像素AMVR模式),基于新语法元素hpelIfIdx的值在HEVC/VVC半像素亮度插值滤波器和一个或多个替代的半像素插值之间进行切换。语法元素hpelIfIdx仅在半像素AMVR模式下被信令通知。在使用空间merging候选的跳过/merge模式的情况下,语法元素hpelIfIdx的值从相邻块继承。
2.6自适应颜色变换(ACT)
图6图示了应用ACT的解码流程图。如图6所示,颜色空间转换是在残差域中进行的。具体地,在逆变换之后引入一个附加解码模块,即逆ACT,以将来自YCgCo域的残差转换回原始域。
在VVC中,除非最大变换尺寸小于一个编解码单元(CU)的宽度或高度,否则一个CU叶节点也被用作变换处理的单位。因此,在所提出的实现中,为一个CU信令通知ACT标志,以选择用于对其残差进行编解码的颜色空间。此外,遵循HEVC ACT设计,对于帧间和IBC CU,ACT仅在CU中至少有一个非零系数时被启用。对于帧内CU,仅当色度分量选择亮度分量的相同帧内预测模式(即,DM模式)时,ACT才被启用。
用于颜色空间转换的核心变换与用于HEVC的核心变换保持相同。具体而言,应用如下所述的以下正向和反向YCgCo颜色变换矩阵。
此外,为了补偿颜色变换前后残差信号的动态范围变化,将(-5,-5,-3)的QP调整应用于变换残差。
另一方面,正向和反向颜色变换需要访问所有三个分量的残差。相应地,在所提出的实现中,ACT在以下两种情况下被禁用,其中并非三个分量的所有残差都可用。
1.分离树分割:当应用分离树时,一个CTU内的亮度和色度样点由不同的结构分割。这导致亮度树中的CU仅包含亮度分量,而色度树中的CU仅包含两个色度分量。
2.帧内子分割预测(ISP):ISP子分割仅被应用于亮度,而色度信号在没有划分的情况下被编解码。在当前的ISP设计中,除了最后的ISP子分割,其他子分割仅包含亮度分量。
2.7使用EG(k)的逸出值二进制化
当使用EG(k)进行逸出值二值化时,当基Qp足够大(或者要被编解码的符号足够小时),EG(k)的比特长度不能再减少了。例如,当基Qp>=23时,对于EG(5),比特长度达到6,这是EG5的最小比特长度。类似地,当基数Qp>=35时,比特长度达到EG3的最小值。当基数Qp>=29时,比特长度达到EG4的最小值。在这种情况下,进一步增加Qp不能降低比特率,但会增加失真。这是比特的浪费。
2.8变换跳过模式下的系数编解码
在当前的VVC草案中,与非TS系数编解码相比,对变换跳过(TS)模式中的系数编解码提出了若干修改,以便使残差编解码适应变换跳过级的统计和信号特性。
在当前的VVC中,在变换跳过残差编解码过程中使用三次扫描阶段来对系数进行编解码。第一扫描阶段被用于对指示变换系数级是否大于0的语法元素和其它相关语法元素(例如,sig_coeff_flag、coeff_sign_flag和par_level_flag)进行编解码。第二/大于X扫描阶段被用于对指示变换系数级是否大于X(例如,X=1,2,3,4,5)的语法元素进行编解码。第三/剩余扫描阶段被用于对剩余语法元素(例如,abs_remainder和coeff_sign_flag)进行编解码。
在当前VVC中,如表131中所示,指示变换系数级的符号的语法元素(例如,coeff_sign_flag)是用旁路模式还是用上下文编解码模式来编解码取决于指示变换是否被应用于相关联的变换块的语法元素(例如,transform_skip_flag)、剩余的允许的上下文编解码的二进制数的数量(例如,RemCcbs)、指示residual_coding()语法结构是否被用于解析当前条带的变换跳过块的残差样点的语法元素(例如,sh_ts_residual_coding_disabled_flag)
7.3.10.11残差编解码语法
/>
/>
/>
/>
/>
/>
/>
/>
2.8.1符号标志coeff_sign_flag的上下文建模和上下文索引偏移推导
表51–初始化过程中用于每个initializationType的ctxIdx和语法元素的关联
表125-coeff_sign_flag的ctxInc的initValue和shiftIdx的规范
表131-将ctxInc分配给具有上下文编码的二进制数的语法元素
/>
9.3.4.2.10用于变换跳过模式的语法元素coeff_sign_flag的ctxInc的推导过程
该过程的输入是颜色分量索引cIdx、指定当前变换块的左上样点相对于当前图片的左上样点的亮度位置(x0,y0)、当前系数扫描位置(xC,yC),该过程的输出是变量ctxInc。
变量leftSign和aboveSign被推导如下:
leftSign=(xC==0)?0:CoeffSignLevel[xC-1][yC] (1594)
aboveSign=(yC==0)?0:CoeffSignLevel[xC][yC-1] (1595)
变量ctxInc被推导如下:
–如果leftSign等于0且aboveSign等于0,或者如果leftSign等于
-aboveSign,则适用以下:
ctxInc=(BdpcmFlag[x0][y0][cIdx]==0?0:3) (1596)
–否则,如果leftSign大于或等于0且aboveSign大于或等于0,则适用以下:
ctxInc=(BdpcmFlag[x0][y0][cIdx]?1:4) (1597)
–否则,适用以下:
ctxInc=(BdpcmFlag[x0][y0][cIdx]?2:5) (1598)
3.由本文描述的技术解决方案所解决的示例技术问题
1.当Qp大于阈值时,作为逸出值的二进制化方法的EG(k)可能会浪费比特。
2.调色板尺寸对于局部双树可能太大。
3.当不应用色度工具时,不需要信令通知色度参数。
4.虽然JVET-R2001-vA中的系数编解码可以在屏幕内容编解码上实现编解码优势,但是系数编解码和TS模式可能仍然存在一些缺点:
a.对于以下情况,并不清楚对符号标志是使用旁路编解码还是上下文编解码:
i.剩余的允许上下文编解码的二进制数的数量(由RemCcbs表示)等于0。
ii.当前块用TS模式编解码。
iii.sh_ts_residual_coding_disabled_flag为否。
4.示例实施例和技术
以下项目列表应被视为解释一般概念的示例。这些项目不应以狭隘的方式解释。
此外,这些项目可以以任何方式组合。
以下示例可以被应用于VVC中的调色板方案和所有其他调色板相关方案。
1.用于逸出值重建的Qp可以具有最大和/或最小允许值。
a.在一个示例中,QP可以被限幅为不大于最大允许值和/或不小于最小允许值。
b.在一个示例中,用于逸出值重建的最大允许Qp可以取决于二进制化方法。
c.在一个示例中,用于逸出值重建的最大允许Qp可以是(T+B),其中B基于比特深度。
i.在一个示例中,T可以是常数。
1.在一个示例中,T可以是23。
2.在一个示例中,T可以是小于23的数字。
3.在一个示例中,T可以是35。
4.在一个示例中,T可以是小于35的数字。
5.在一个示例中,T可以是29。
6.在一个示例中,T可以是小于29的数字。
ii.在一个示例中,可以在视频区域(例如,序列、图片、条带/片/子图片)中指示T。
1.在一个示例中,可以在VPS/SPS/PPS/PH/SH中指示T。
iii.在一个示例中,B可以被设置为QpBdOffset(例如,6*bit_depth_minus8)。
d.在一个示例中,用于逸出值重建的最大允许Qp可以是(23+QpBdOffset)。
i.此外,可替换地,EG5用于编解码逸出值。
ii.可替换地,用于逸出值重建的最大允许Qp可以是(K+QpBdOffset),其中K是小于23的数。
e.在一个示例中,用于逸出值重建的最大允许Qp可以是(35+QpBdOffset)。
i.此外,可替换地,EG3用于编解码逸出值。
ii.可替换地,用于逸出值重建的最大允许Qp可以是(K+QpBdOffset),其中K是小于35的数。
f.或者,逸出值重建的最大允许Qp可以是(29+QpBdOffset)。
i.此外,可替换地,EG4用于编解码逸出值。
ii.可替换地,用于逸出值重建的最大允许Qp可以是(K+QpBdOffset),其中K是小于29的数。
调色板尺寸相关
2.提出在应用或不应用局部双树时,调色板尺寸可以不同。
a.在一个示例中,对于局部双树,提出可以减小调色板尺寸。
b.在一个示例中,当应用局部双树时,亮度CU和色度CU的调色板尺寸可以不同。
c.在一个示例中,与局部双树中的亮度CU的调色板尺寸相比,或与未应用局部双树时的调色板尺寸相比,可以减小色度CU的调色板尺寸。
i.在一个示例中,用于色度的调色板尺寸可以减半。
3.提出当应用或不应用局部双树时,调色板预测器的尺寸可以不同。
a.在一个示例中,对于局部双树,提出可以减小调色板预测器的尺寸。
b.在一个示例中,当应用局部双树时,亮度CU和色度CU的调色板预测器尺寸可以不同。
c.在一个示例中,与局部双树中的亮度CU的调色板预测器尺寸相比,或与未应用局部双树时的调色板预测器尺寸相比,可以减小色度CU的调色板预测器尺寸。
i.在一个示例中,用于色度的调色板预测器的尺寸可以减半。
色度去方块相关
4.是否在条带级和/或更高级(即,区域尺寸大于条带)(例如,在PPS或图片标头中)信令通知/解析色度去方块偏移可以取决于颜色格式和/或分离平面编解码使能标志和/或ChromaArrayType和/或指示色度去方块偏移是否存在的标志和/或指示色度去方块偏移或一些其他色度工具参数是否存在的标志。
a.在一个示例中,当ChromaArrayType等于0或者颜色格式是4:0:0或者应用了分离的平面编解码或者标志指示色度去方块偏移不存在时,可以总是跳过在条带级和/或更高级(即,区域尺寸大于条带)的色度去方块偏移的信令通知/解析。
b.在一个示例中,当ChromaArrayType等于0或者颜色格式是4:0:0或者应用了分离的平面编解码或者标志指示色度去方块偏移不存在时,可以总是跳过pps_cb_beta_offset_div2、pps_cb_tc_offset_div2、pps_cr_beta_offset_div2、pps_cr_tc_offset_div2的信令通知/解析。
c.在一个示例中,当ChromaArrayType等于0或者颜色格式是4:0:0或者应用了分离的平面编解码或者标志指示色度去方块偏移不存在时,可以总是跳过ph_cb_beta_offset_div2、ph_cb_tc_offset_div2、ph_cr_beta_offset_div2、ph_cr_tc_offset_div2的信令通知/解析。
d.在一个示例中,当ChromaArrayType等于0或者颜色格式是4:0:0或者应用了分离的平面编解码或者标志指示色度去方块偏移不存在时,可以总是跳过slice_cb_beta_offset_div2、slice_cb_tc_offset_div2、slice_cr_beta_offset_div2、slice_cr_tc_offset_div2的信令通知/解析。
e.可替换地,一致性比特流应满足当ChromaArrayType等于0或颜色格式为4:0:0或应用了分离的平面编解码时,pps_cb_beta_offset_div2、pps_cb_tc_offset_div2、pps_cr_beta_offset_div2、pps_cr_tc_offset_div2应等于0。
f.在一个示例中,当chroma_format_idc等于0并且separate_colour_plane_flag不等于1或者标志指示色度去方块偏移不存在时,可以总是跳过pps_cb_beta_offset_div2、pps_cb_tc_offset_div2、pps_cr_beta_offset_div2、pps_cr_tc_offset_div2的信令通知/解析。
g.在一个示例中,当chroma_format_idc等于0并且separate_colour_plane_flag不等于1或者标志指示色度去方块偏移不存在时,可以总是跳过pps_cb_beta_offset_div2、ph_cb_tc_offset_div2、ph_cr_beta_offset_div2、ph_cr_tc_offset_div2的信令通知/解析。
h.在一个示例中,当chroma_format_idc等于0并且separate_colour_plane_flag不等于1或者标志指示色度去方块偏移不存在时,可以总是跳过slice_cb_beta_offset_div2、slice_cb_tc_offset_div2、slice_cr_beta_offset_div2、slice_cr_tc_offset_div2的信令通知/解析。
i.可替换地,当语法元素的信令通知被跳过时,语法元素的值被推断为等于0。
5.可以在PPS和/或SPS和/或APS中指示颜色格式和/或分的离平面编解码使能标志和/或ChromaArrayType和/或指示色度去方块偏移是否存在的标志和/或指示色度去方块偏移或一些其他色度工具参数是否存在的标志(例如,pps_chroma_tool_params_present_flag)。
a.在一个示例中,当ChromaArrayType等于0或颜色格式为4:0:0和
/或标志为假时,可以总是跳过pps_cb_beta_offset_div2、pps_cb_tc_offset_div2、pps_cr_beta_offset_div2、pps_cr_tc_offset_div2的信令通知/解析。
b.在一个示例中,当ChromaArrayType等于0或颜色格式为4:0:0和
/或标志为假时,可以总是跳过pps_cb_beta_offset_div2、pps_cb_tc_offset_div2、pps_cr_beta_offset_div2、pps_cr_tc_offset_div2的信令通知/解析。
c.在一个示例中,在ChromaArrayType不等于0和/或标志为假的条件检查下,信令通知色度工具偏移相关的语法元素(例如,pps_cb_qp_offset,
pps_cr_qp_offset,pps_joint_cbcr_qp_offset_present_flag,pps_slice_
chroma_qp_offsets_present_flag,
pps_cu_chroma_qp_offset_list_enabled_flag)。
d.在一致性比特流中,要求在PPS中信令通知的颜色格式和/或分离的平面编解码使能标志和/或ChromaArrayType应该与相关联的SPS中信令通知的对应信息相同。
6.提出控制是否应该信令通知/解析色度qp偏移的标志也可以控制是否应该信令通知/解析色度去方块偏移。
a.在一个示例中,标志pps_chroma_tool_params_present_flag可以用于控制是否应该信令通知/解析色度qp偏移,以及是否应该信令通知/解析色度去方块偏移。
7.可以在PPS中添加控制标志,例如pps_chroma_deblocking_params_present_flag,以控制是否应该信令通知/解析色度去方块偏移。
a.在一个示例中,当标志等于0时,可以总是跳过
pps_cb_beta_offset_div2、pps_cb_tc_offset_div2、pps_cr_beta_offset_div2、pps_cr_tc_offset_div2的信令通知/解析。
b.在一个示例中,当标志等于0时,可以总是跳过
ph_cb_beta_offset_div2、ph_cb_tc_offset_div2、ph_cr_beta_offset_div2、ph_cr_tc_offset_div2的信令通知/解析。
c.在一个示例中,当标志等于0时,可以总是跳过slice_cb_beta_offset_div2、slice_cb_tc_offset_div2、slice_cr_beta_offset_div2、slice_cr_tc_offset_div2的信令通知/解析。
d.此外,可替换地,在一致性比特流中,当ChromaArrayType等于0时,要求标志应该等于0。
APS中的色度工具相关参数
8.可以在APS中添加控制标志,例如aps_chroma_tool_params_present_flag,以控制是否应该在APS中信令通知/解析色度工具相关参数。
a.在一个示例中,当aps_chroma_tool_params_present_flag等于0时,alf_chroma_filter_signal_flag、alf_cc_cb_filter_signal_flag和alf_cc_cr_filter_signal_flag可以总是被跳过并被推断为等于0。
b.在一个示例中,当aps_chroma_tool_params_present_flag等于0时,scaling_list_chroma_present_flag可以总是被跳过并被推断为等于0。
图片标头中的其他色度工具相关参数
9.在一个示例中,当ChromaArrayType等于0或者颜色格式是4:0:0或者应用了分离的平面编解码或者标志指示语法元素ph_log2_diff_min_qt_min_cb_intra_slice_luma(以及可能还有其他语法元素)不存在时,可以总是跳过ph_log2_diff_min_qt_min_cb_intra_slice_luma的信令通知/解析。
10.在一个示例中,当ChromaArrayType等于0或者颜色格式是4:0:0或者应用了分离的平面编解码或者标志指示语法元素ph_log2_diff_min_qt_min_cb_intra_slice_chroma(以及可能还有其他语法元素)不存在时,可以总是跳过ph_log2_diff_min_qt_min_cb_intra_slice_chroma的信令通知/解析。
11.在一个示例中,当ChromaArrayType等于0或者颜色格式是4:0:0或者应用了分离的平面编解码或者标志指示语法元素ph_log2_diff_min_qt_min_cb_inter_slic(以及可能还有其他语法元素)不存在时,可以总是跳过ph_log2_diff_min_qt_min_cb_inter_slice的信令通知/解析。
自适应颜色变换(ACT)相关
12.调色板模式和自适应颜色变换可以独占地被应用于块。
a.在一个示例中,当调色板模式被用于块时,自适应颜色变换不被应用于该块。
i.在一个示例中,当调色板模式被应用于块时,可以跳过ACT使用的信令通知。
1.可替换地,此外,ACT的使用被推断为否。
b.在一个示例中,当自适应颜色变换被用于块时,调色板模式不被应用于该块。
i.在一个示例中,当ACT被应用于块时,可以跳过调色板模式使用的信令通知。
1.可替换地,此外,调色板模式的使用被推断为否。
c.是否信令通知ACT开/关标志的指示可以取决于预测模式是否不等于MODE_PLT。
d.是否信令通知ACT开/关标志的指示可以取决于调色板模式的指示是否未被使用(例如,!pred_mode_plt_flag)。
13.可以对编解码单元的残差块应用自适应颜色变换,而不管其颜色空间。
e.在一个示例中,自适应颜色变换可以被应用于GBR颜色空间中的编解码单元的残差块。
f.在一个示例中,自适应颜色变换可以被应用于YCbCr颜色空间中的编解码单元的残差块。
如何对系数符号标志使用旁路编解码或上下文编解码
14.在变换跳过残差编解码过程的第三/剩余系数扫描阶段中的剩余语法元素(例如,语法元素abs_remainder和coeff_sign_flag)的旁路编解码的开始处(或/和旁路编解码的结束处),操作可以被应用于指定剩余的允许上下文编解码的二进制数的数量(例如,RemCcbs)的变量。
g.在一个示例中,操作可以使用临时变量(例如,tempRemCcbs)来保存RemCcbs并将RemCcbs设置为等于某个值(诸如0)。旁路编解码结束时,将RemCcbs设置为等于tempRemCcbs。
i.在一个示例中,操作可以是将RemCcbs设置为等于某个值N,其中该值是整数且小于M。
1.在一个示例中,M等于3。
h.指示系数级的符号的语法元素(例如,coeff_sign_flag)是用旁路模式还是上下文编解码模式来编解码可以取决于剩余的允许上下文编码的二进制数的数量(例如,RemCcbs)。
i.在一个示例中,当剩余的允许上下文编码的二进制数的数量(例如,RemCcbs)等于N(例如N=0)时,系数级的符号(例如,coeff_sign_flag)用旁路模式编解码。
ii.在一个示例中,当RemCcbs大于或等于M时,符号标志用上下文编解码模式编解码。
i.在一个示例中,操作可以是将RemCcbs设置为等于取决于除RemCcbs之外的至少一个变量或语法元素的值。
15.在变换跳过残差编解码过程中,操作可以被应用于指示语法元素(例如,coeff_sign_flag)是否属于某一扫描阶段(例如,第一扫描阶段或/和第三/残差系数扫描阶段)的变量。
j.在一个示例中,操作可以使用变量(例如,remScanPass)来指示当前扫描阶段是否是第三/剩余扫描阶段。
i.在一个示例中,在第一扫描阶段的开始,remScanPass被设置为等于A,并且在第三/剩余扫描阶段的开始,remScanPass被设置为等于B。其中A不等于B。
ii.指示系数层级的符号的语法元素(例如,coeff_sign_flag)是用旁路模式还是上下文编解码模式来编解码可以取决于remScanPass。
1.在一个示例中,当remScanPass等于B时,系数级的符号用旁路模式编解码。
2.在一个示例中,当remScanPass等于A时,系数级的符号用上下文编解码模式来编解码。
k.可替换地,操作可以使用变量来指示当前扫描阶段是否是第一扫描遍阶段。
l.可替换地,该操作可以使用变量来指示当前扫描阶段是否是第二
/大于X扫描阶段。
16.指示系数级的符号的语法元素(SE)是用旁路模式还是上下文编解码模式来编解码可以取决于扫描阶段的索引,其中在扫描阶段内,块的区域中的一个或多个系数的相同语法元素被按顺序编解码。
m.在一个示例中,当SE在第一扫描阶段中被信令通知时,可以用上下文编解码模式对其进行编解码。
n.在一个示例中,当SE在第三/剩余扫描阶段中被信令通知时,可以用旁路模式对其进行编解码。
o.在一个示例中,上述方法适用于变换跳过(TS,包括或不包括BDPCM/QR-BDPCM)残差编解码过程和/或用于非TS编解码块的系数编解码过程。
17.指示系数级的符号的语法元素(SE)是用旁路模式还是用上下文编解码模式来编解码可以取决于其是否在变换跳过残差编解码过程中与另一语法元素(例如,sig_coeff_flag、par_level_flag、abs_remainder)在同一扫描阶段中被信令通知。
p.在一个示例中,当SE在与sig_coeff_flag或/和par_level_flag相同的扫描阶段中被信令通知时,可以用上下文编解码模式对其进行编解码。
q.在一个示例中,当SE在与abs_remainder相同的扫描阶段中被信令通知时,可以用旁路模式对其进行编解码。
一般特征
18.是否和/或如何应用上述方法可以基于:
a.视频内容(例如屏幕内容或自然内容)
b.在DPS/SPS/VPS/PPS/APS/图片标头/条带标头/片组标头/最大编解码单元(LCU)/编解码单元(CU)/LCU行/LCU组/TU/PU块/视频编解码单元中信令通知的消息
c.CU/PU/TU/块/视频编解码单元的位置
d.当前块和/或其相邻块的块维度
e.当前块和/或其相邻块的块形状
f.当前块的量化参数
g.颜色格式的指示(诸如4:2:0、4:4:4、RGB或YUV)
h.编解码树结构(诸如双树或单树)
i.条带/片组类型和/或图片类型
j.颜色分量(例如,可以仅被应用于亮度分量和/或色度分量)
k.时态层ID
l.标准的配置文件/级别/层级
m.当前块是否有一个逸出样点。
i.在一个示例中,仅当当前块至少具有一个逸出样点时,才可以应用上述方法。
n.当前块是否以无损模式编解码(例如,cu_transquant_bypass_flag)
ii.在一个示例中,仅当当前块没有以无损模式编解码时,才可以应用上述方法。
o.无损编解码是否被启用(例如,transquant_bypass_enabled、cu_transquant_bypass_flag)
5.实施例
在下面的实施例中,添加的部分被标记为粗体、下划线和斜体文本。删除的部分被标记在[[]]内。
5.1实施例#1
8.4.5.3调色板模式的解码过程
–如果bIsEscapeSample等于0,则适用以下:
recSamples[x][y]=CurrentPaletteEntries[cIdx][PaletteIndexMap[xCbL+xL][yCbL+yL]] (443)
–否则(bIsEscapeSample等于1),将应用以下有序步骤:
1.量化参数qP被推导如下:
–如果cIdx等于0,
–否则,如果cIdx等于1,
–否则(cIdx等于2),
2.列表levelScale[]被指定为levelScale[k]={40,45,51,57,64,72},其中k=0..5.
3.以下适用:
tmpVal=(PaletteEscapeVal[cIdx][xCbL+xL][yCbL+yL]*levelScale[qP%6])<<(qP/6)+32)>>6 (447)
recSamples[x][y]=Clip3(0,(1<<BitDepth)-1,tmpVal) (448)
5.2实施例#2
7.3.2.4图片参数集RBSP语法
7.3.2.7图片标头结构语法
7.3.7.1通用条带标头语法
/>
5.3实施例#3
7.4.2.4图片参数集RBSP语法
/>
/>
7.3.2.5自适应参数集RBSP语法
7.3.2.7图片标头结构语法
/>
/>
/>
/>
7.3.2.19自适应环路滤波器数据语法
7.3.2.21缩放列表数据语法
/>
7.3.7.1通用条带标头语法
7.4.3.4图片参数集RBSP语义
……
等于1指定PPS RBSP语法结构中存在与色度工具[[偏移]]相关的语法元素。/>等于0指定PPS RBSP语法结构中不存在与色度工具[[偏移]]相关的语法元素。当ChromaArrayType等于0时,/>的值应等于0。
……
7.4.3.5自适应参数集语义
……
……
5.4实施例#4
7.4.2.4图片参数集RBSP语法
7.3.2.7图片标头结构语法
7.3.7.1通用条带标头语法
7.4.3.4图片参数集RBSP语义
……
等于1的指定PPS RBSP语法结构中存在色度去方块相关的语法元素。pps_chroma_deblocking_params_present_flag等于0的指定PPS RBSP语法结构中不存在色度去方块相关的语法元素。当ChromaArrayType等于0时,pps_chroma_deblocking_params_present_flag的值应等于0。
……
5.5实施例#5
/>
/>
5.5.1实施例#5.1
7.3.10.5编解码单元语法
/>
/>
/>
可替换地,可以应用以下:
5.6实施例#6
编解码单元语义
cu_act_enabled_flag等于1指定 当前编解码单元的残差[[在YCgCo颜色空间中被编解码]]。cu_act_enabled_flag等于0指定/> 当前编解码单元的残差[[在原始颜色空间中被编解码]]。当cu_act_enabled_flag不存在时,其被推断为等于0。
5.7实施例#7
7.3.10.11残差编解码语法
/>
/>
/>
/>
9.3.4解码过程流程
9.3.4.2ctxTable、ctxIdx和bypassFlag的推导过程
9.3.4.2.1通用
表131-将ctxInc分配给具有上下文编解码的二进制数的语法元素
5.8实施例#8
7.3.10.11残差编解码语法
/>
/>
/>
/>
/>
其中A不等于B。诸如A=0,B=1。
可替换地,A=1,B=0。
可替换地,A=-1,B=0。
可替换地,A=0,B=-1。
9.3.4解码过程流程
9.3.4.2ctxTable、ctxIdx和bypassFlag的推导过程
9.3.4.2.1通用
表131-将ctxInc分配给具有上下文编解码的二进制数的语法元素
/>
5.9实施例#9
7.3.10.11残差编解码语法
/>
/>
/>
/>
7.4.11.11残差编解码语义
coeff_sign_flag[n]指定扫描位置n的变换系数级的符号,如下所示:
–如果coeff_sign_flag[n]等于0,则对应的变换系数级具有正值。
–否则(coeff_sign_flag[n]等于1),对应的变换系数级具有负值。
当coeff_sign_flag[n]不存在时,其被推断为等于0。
CoeffSignLevel[xC][yC]的值指定位置(xC,yC)处的变换系数级的符号,如下所示:
–如果CoeffSignLevel[xC][yC]等于0,则对应的变换系数级等于0
–否则,如果CoeffSignLevel[xC][yC]等于1,则对应的变换系数级具有正值。
–否则(CoeffSignLevel[xC][yC]等于-1),对应的变换系数级具有负值。
9.3.2初始化过程
9.3.2.2上下文变量的初始化过程
表125–coeff_sign_ctx_coding_flag的ctxInc的initValue和shiftIdx的规范
9.3.3二进制化过程
9.3.3.1通用
表126-语法元素和相关联的二进制化
9.3.4解码过程流程
9.3.4.2ctxTable、ctxIdx和bypassFlag的推导过程
9.3.4.2.1通用
表131–将ctxInc分配给具有上下文编解码的二进制数的语法元素
9.3.4.2.10用于变换跳过模式的语法元素coeff_sign_ctx_coding_flag的ctxInc推导过程
该过程的输入是颜色分量索引cIdx、指定当前变换块的左上样点相对于当前图片的左上样点的亮度位置(x0,y0)、当前系数扫描位置(xC,yC)。
该过程的输出是变量ctxInc。
变量leftSign和aboveSign被推导如下:
leftSign=(xC==0)?0:CoeffSignLevel[xC-1][yC] (1594)
aboveSign=(yC==0)?0:CoeffSignLevel[xC][yC-1] (1595)
变量ctxInc被推导如下:
–如果leftSign等于0且aboveSign等于0,或者leftSign等于aboveSign,则适用以下:
ctxInc=(BdpcmFlag[x0][y0][cIdx]==0?0:3) (1596)
–否则,如果leftSign大于或等于0且aboveSign大于或等于0,则适用以下:
ctxInc=(BdpcmFlag[x0][y0][cIdx]?1:4) (1597)
–否则,适用以下:
ctxInc=(BdpcmFlag[x0][y0][cIdx]?2:5) (1598)
5.10实施例#10
9.3.4.2.10用于变换跳过模式的语法元素coeff_sign_flag的ctxInc的推导过程
该过程的输入是颜色分量索引cIdx、指定当前变换块的左上样点相对于当前图片的左上样点的亮度位置(x0,y0)、当前系数扫描位置(xC,yC)。
该过程的输出是变量ctxInc。
变量leftSign和aboveSign被推导如下:
leftSign=(xC==0)?0:CoeffSignLevel[xC-1][yC] (1594)
aboveSign=(yC==0)?0:CoeffSignLevel[xC][yC-1] (1595)
变量ctxInc的推导如下:
–如果leftSign等于0且aboveSign等于0,或者leftSign等于aboveSign,则适用以下:
ctxInc=(BdpcmFlag[x0][y0][cIdx]==0?0:3) (1596)
–否则,如果leftSign大于或等于0且aboveSign大于或等于0,则适用以下:
ctxInc=(BdpcmFlag[x0][y0][cIdx]==0?1:4) (1597)
–否则,适用以下:
ctxInc=(BdpcmFlag[x0][y0][cIdx]==0?2:5) (1598)
图7是示出其中可以实现本文公开的各种技术的示例视频处理系统1900的框图。各种实施方式可以包括系统1900的一些或所有组件。系统1900可以包括用于接收视频内容的输入1902。视频内容可以以原始或未压缩的格式接收,例如8或10比特多分量像素值,或者可以是压缩或编码格式。输入1902可以表示网络接口、外围总线接口或存储接口。网络接口的示例包括有线接口,诸如以太网、无源光网络(PON)等,以及诸如Wi-Fi或蜂窝接口的无线接口。
系统1900可以包括编解码组件1904,其可以实现本文档中描述的各种编解码或编码方法。编解码组件1904可以降低从输入1902到编解码组件1904的输出的视频的平均比特率,以产生视频的编码表示。因此,编解码技术有时被称为视频压缩或视频转码技术。如组件1906所表示的,编解码组件1904的输出可以被存储,或者经由连接的通信被发送。组件1908可以使用在输入1902处接收的视频的存储或传送的比特流(或编解码的)表示来生成发送到显示接口1910的像素值或可显示视频。从比特流表示生成用户可视视频的过程有时被称为视频解压缩。此外,虽然某些视频处理操作被称为“编解码”操作或工具,但是应当理解,编码工具或操作在编码器处使用,并且与编码结果相反的相应解码工具或操作将由解码器执行。
外围总线接口或显示器接口的示例可以包括通用串行总线(USB)或高清多媒体接口(HDMI)或显示端口等。存储接口的示例包括SATA(串行高级技术附件)、PCI、IDE接口等。本文档中描述的技术可以在各种电子设备中实现,诸如移动电话、膝上型电脑、智能手机或能够执行数字数据处理和/或视频显示的其他设备。
图8是视频处理装置3600的框图。装置3600可以被用于实现本文描述的一种或多种方法。装置3600可以体现在智能手机、平板电脑、计算机、物联网(IoT)接收器等中。装置3600可以包括一个或多个处理器3602、一个或多个存储器3604和视频处理硬件3606。处理器(或多个)3602可以被配置为实现本文档中描述的一种或多种方法。存储器(或多个)3604可以被用于存储用于实现本文所述方法和技术的数据和代码。视频处理硬件3606可以被用于在硬件电路中实现本文档中描述的一些技术。
图10是图示可利用本发明的技术的示例视频编解码系统100的框图。
如图10所示,视频编解码系统100可以包括源设备110和目的设备120。源设备110生成可以被称为视频编码设备的编码视频数据。目的设备120可以解码由可称为视频解码设备的源设备110生成的编码的视频数据。
源设备110可以包括视频源112、视频编码器114和输入/输出(I/O)接口116。
视频源112可以包括诸如视频捕获设备、从视频内容提供商接收视频数据的接口和/或用于生成视频数据的计算机图形系统的源,或者这些源的组合。视频数据可以包括一个或多个图片。视频编码器114对来自视频源112的视频数据进行编码以生成比特流。比特流可以包括形成视频数据的编解码表示的比特序列。比特流可以包括编解码图片和相关数据。编解码图片是图片的编解码表示。相关数据可以包括序列参数集、图片参数集和其他语法结构。I/O接口116可以包括调制器/解调器(调制解调器)和/或发射器。编码的视频数据可经由I/O接口116通过网络130a直接发送到目的设备120。编码的视频数据还可以存储在存储介质/服务器130b上以供目的设备120存取。
目的设备120可以包括I/O接口126、视频解码器124和显示设备122。
I/O接口126可以包括接收器和/或调制解调器。I/O接口126可以从源设备110或存储介质/服务器130b获取编码的视频数据。视频解码器124可以对编码的视频数据进行解码。显示设备122可以向用户显示解码的视频数据。显示设备122可以与目的设备120集成在一起,或者可以在目的设备120的外部,目的设备120被配置为与外部显示设备接口。
视频编码器114和视频解码器124可以根据视频压缩标准操作,诸如高效视频编解码(HEVC)标准、通用视频编解码(VVM)标准和其他当前和/或进一步的标准。
图11是图示视频编码器200的实例的框图,视频编码器200可以是图10所示的系统100中的视频编码器114。
视频编码器200可以被配置为执行本公开的任何或所有技术。在图11的示例中,视频编码器200包括多个功能组件。本公开中描述的技术可以在视频编码器200的各种组件之间共享。在一些示例中,处理器可以被配置为执行本公开中描述的任何或所有技术。
视频编码器200的功能组件可以包括分割单元201、可包括模式选择单元203的预测单元202、运动估计单元204、运动补偿单元205和帧内预测单元206、残差生成单元207、变换单元208、量化单元209、逆量化单元210、逆变换单元211、重建单元212、缓冲器213和熵编码单元214。
在其他示例中,视频编码器200可以包括更多、更少或不同的功能组件。在示例中,预测单元202可以包括帧内块复制(IBC)单元。IBC单元可以以IBC模式执行预测,其中至少一个参考图片是当前视频块所在的图片。
此外,一些组件,诸如运动估计单元204和运动补偿单元205,可以高度集成,但出于解释目的而在图11的示例中单独表示。
分割单元201可以将图片分割成一个或多个视频块。视频编码器200和视频解码器300可以支持各种视频块尺寸。
模式选择单元203可以,例如基于错误结果选择编解码模式——帧内或帧间,并且将所得帧内或帧间编解码块提供到残差生成单元207以生成残差块数据,并且提供到重建单元212以重建编解码块以用作参考图片。在一些示例中,模式选择单元203可以选择帧内和帧间预测(CIIP)模式的组合,在其中预测基于帧间预测信号和帧内预测信号。在帧间预测的情况下,模式选择单元203还可以为块选择运动矢量的分辨率(例如,子像素或整数像素精度)。
为了对当前视频块执行帧间预测,运动估计单元204可以通过将来自缓冲器213的一个或多个参考帧与当前视频块进行比较来生成当前视频块的运动信息。运动补偿单元205可以基于来自缓冲器213的除了与当前视频块相关联的图片之外的图片的运动信息和解码样点来确定当前视频块的预测视频块。
运动估计单元204和运动补偿单元205可以对当前视频块执行不同的操作,例如,取决于当前视频块是在I条带、P条带还是B条带中。
在一些示例中,运动估计单元204可以对当前视频块执行单向预测,并且运动估计单元204可以在列表0或列表1的参考图片中搜索当前视频块的参考视频块。然后运动估计单元204可以生成指示包含参考视频块的列表0或列表1中的参考图片的参考索引和指示当前视频块与参考视频块之间的空域位移的运动矢量。运动估计单元204可以输出参考索引、预测方向指示符和运动矢量作为当前视频块的运动信息。运动补偿单元205可以基于由当前视频块的运动信息指示的参考视频块来生成当前块的预测视频块。
在其它示例中,运动估计单元204可以对当前视频块执行双向预测,运动估计单元204可以在列表0中的参考图片中搜索当前视频块的参考视频块,并且还可在列表1中的参考图片中搜索当前视频块的另一参考视频块。然后运动估计单元204可以生成指示包含参考视频块的列表0或列表1中的参考图片的参考索引和指示当前视频块与参考视频块之间的空域位移的运动矢量。运动估计单元204可以输出当前视频块的参考索引和运动矢量作为当前视频块的运动信息。运动补偿单元205可以基于由当前视频块的运动信息指示的参考视频块来产生当前视频块的预测视频块。
在一些示例中,运动估计单元204可以输出用于解码器的解码处理的完整运动信息。
在一些示例中,运动估计单元204可以不输出当前视频的完整运动信息集。相反,运动估计单元204可以参考另一视频块的运动信息来信令通知当前视频块的运动信息。例如,运动估计单元204可以确定当前视频块的运动信息与相邻视频块的运动信息足够相似。
在一个示例中,运动估计单元204可以在与当前视频块相关联的语法结构中指示值,该值向视频解码器300指示当前视频块具有与另一视频块相同的运动信息。
在另一示例中,运动估计单元204可以在与当前视频块相关联的语法结构中标识另一视频块和运动矢量差(MVD)。运动矢量差指示当前视频块的运动矢量和所指示的视频块的运动矢量之间的差。视频解码器300可以使用所指示的视频块的运动矢量和运动矢量差来确定当前视频块的运动矢量。
如上所述,视频编码器200可以预测性地信令通知运动矢量。可以由视频编码器200实现的预测信令通知技术的两个示例包括高级运动矢量预测(AMVP)和merge模式信令。
帧内预测单元206可以对当前视频块执行帧内预测。当帧内预测单元206对当前视频块执行帧内预测时,帧内预测单元206可以基于同一图片中的其它视频块的解码样点来生成当前视频块的预测数据。当前视频块的预测数据可以包括预测的视频块和各种语法元素。
残差生成单元207可以通过从当前视频块减去(例如,由负号指示)当前视频块的预测视频块来生成当前视频块的残差数据。当前视频块的残差数据可以包括与当前视频块中样点的不同样点分量相对应的残差视频块。
在其它示例中,当前视频块可以没有当前视频块的残差数据,例如在跳过模式中,并且残差产生单元207可以不执行减法操作。
变换处理单元208可以通过将一个或多个变换应用于与当前视频块相关联的残差视频块来生成当前视频块的一个或多个变换系数视频块。
在变换处理单元208生成与当前视频块相关联的变换系数视频块之后,量化单元209可以基于与当前视频块相关联的一个或多个量化参数(QP)值来量化与当前视频块相关联的变换系数视频块。
逆量化单元210和逆变换单元211可以分别对变换系数视频块应用逆量化和逆变换,以从变换系数视频块重建残差视频块。重建单元212可以将重建的残差视频块添加到来自由预测单元202生成的一个或多个预测视频块的对应样点,以生成与当前块相关联的重建视频块,用于存储在缓冲器213中。
在重建单元212重建视频块之后,可以执行环路滤波操作以减少视频块中的视频块伪影。
熵编码单元214可以从视频编码器200的其他功能组件接收数据。当熵编码单元214接收数据时,熵编码单元214可以执行一个或多个熵编码操作以生成熵编码的数据并输出包括熵编码的数据的比特流。
图12是示出视频解码器300的示例的框图,视频解码器300可以是图10所示的系统100中的视频解码器114。
视频解码器300可以被配置为执行本公开的任何或所有技术。在图12的示例中,视频解码器300包括多个功能组件。本公开中描述的技术可以在视频解码器300的各种组件之间共享。在一些示例中,处理器可以被配置为执行本公开中描述的任何或所有技术。
在图12的示例中,视频解码器300包括熵解码单元301、运动补偿单元302、帧内预测单元303、逆量化单元304、逆变换单元305、重建单元306和缓冲器307。在一些示例中,视频解码器300可以执行通常与针对视频编码器200(图11)描述的编码过程互逆的解码过程。
熵解码单元301可以检索编码的比特流。编码的比特流可以包括熵编码的视频数据(例如,编码的视频数据块)。熵解码单元301可以解码熵编码的视频数据,并且运动补偿单元302可以从熵解码的视频数据确定包含运动矢量、运动矢量精度、参考图片列表索引和其它运动信息的运动信息。运动补偿单元302可以,例如通过执行AMVP和merge模式来确定此信息。
运动补偿单元302可以生成运动补偿块,可以基于插值滤波器执行插值。语法元素中可以包括要以子像素精度使用的插值滤波器的识别符。
运动补偿单元302可以使用如视频编码器20在视频块的编码期间所使用的插值滤波器来计算参考块的子整数像素的插值。运动补偿单元302可以根据所接收的语法信息来确定视频编码器200所使用的插值滤波器,并使用插值滤波器来产生预测块。
运动补偿单元302可以使用一些语法信息来确定用于编码经编码的视频序列的帧和/或条带的块的尺寸、描述经编码的视频序列的图片的每一宏块如何被分割的分割信息、指示每一分割如何被编码的模式、每一经帧间编码的块的一个或多个参考帧(和参考帧列表)以及解码经编码的视频序列的其它信息。
帧内预测单元303可以使用例如在比特流中接收的帧内预测模式来从空域相邻的块形成预测块。逆量化单元303逆量化(即,去量化)比特流中提供的并且由熵解码单元301解码的量化视频块系数。逆变换单元303应用逆变换。
重建单元306可以将残差块与由运动补偿单元202或帧内预测单元303生成的对应的预测块相加,以形成解码的块。如果需要,还可以应用去方块滤波器来对解码的块进行滤波,以便去除块效应伪影。然后解码的视频块被存储在缓冲器307中,缓冲器307为后续的运动补偿/帧内预测提供参考块,并且还产生解码的视频以在显示设备上呈现。
接下来提供一些实施例优选的解决方案列表。
以下解决方案示出了在前一部分(例如,项目1)中讨论的技术的示例实施例。
1.一种视频处理方法(例如,图9中描述的方法900),包括:执行(902)视频的视频块和该视频的编解码表示之间的转换,其中,调色板模式被应用于视频块的编解码表示,在调色板模式中,使用代表性颜色值的调色板来表示视频块的样点;并且其中,使用逸出符和使用量化参数量化的值对调色板之外的样点进行编解码,该量化参数在由规则确定的最小允许值和最大允许值之间的范围内。
2.根据解决方案1所述的方法,其中,最大允许值取决于用于视频块的编解码表示的二进制化方法。
3.根据解决方案1所述的方法,其中,最大允许值被表示为T+B,其中B是基于视频块的样点的表示的比特深度的数字并且T是预定义的数字。
以下解决方案示出了在前一部分(例如,项目2)中讨论的技术的示例实施例。
4.一种视频处理方法,包括:执行视频的视频块和该视频的编解码表示之间的转换,其中,调色板模式被应用于视频块的编解码表示,在调色板模式中,使用代表性颜色值的调色板来表示视频块的样点;并且其中,调色板的尺寸取决于关于局部双树是否被应用于视频块和编解码表示之间的转换的规则。
5.根据解决方案4所述的方法,其中,由于使用了局部双树,调色板的尺寸取决于视频的颜色分量。
6.根据解决方案5所述的方法,该规则指定在视频块是色度块的情况下使用比在视频块是亮度块的情况下更小的调色板尺寸。
以下解决方案示出了在前一部分(例如,项目3)中讨论的技术的示例实施例。
7.一种视频处理方法,包括:执行视频的视频块和该视频的编解码表示之间的转换,其中,调色板模式被用于视频块的编解码表示,在调色板模式中,使用代表性颜色值的调色板来表示视频块的样点;并且其中,调色板预测器的尺寸取决于关于局部双树是否被用于视频块和编解码表示之间的转换的规则。
8.根据解决方案7所述的方法,其中,由于使用了局部双树,调色板预测器的尺寸取决于视频块的颜色分量。
9.根据解决方案8所述的方法,该规则指定在视频块是色度块的情况下使用比在视频块是亮度块的情况下更小的调色板尺寸。
以下解决方案示出了在前一部分(例如,项目4)中讨论的技术的示例实施例。
10.一种视频处理方法,包括:对于视频的视频区域的视频块和该视频的编解码表示之间的转换,基于编解码条件,确定标识视频的色度分量的去方块偏移的语法元素是否被包括在视频区域级的编解码表示中;并且基于该确定来执行转换;其中,去方块偏移被用于选择性地启用对视频块的去方块操作。
11.根据解决方案10所述的方法,其中,视频区域是视频条带或视频图片。
12.根据解决方案10-11中任一项所述的方法,其中,编解码条件包括视频的颜色格式。
13.根据解决方案10-12中任一项所述的方法,其中,编解码条件基于是否对该转换启用分离的平面编解码。
14.根据解决方案10-13中任一项所述的方法,其中,编码解条件基于色度数组类型是否被包括在编解码表示中。
以下解决方案示出了在前一部分(例如,项目5)中讨论的技术的示例实施例。
15.一种视频处理方法,包括:对于视频的视频区域的视频块和该视频的编解码表示之间的转换,基于编解码条件,确定标识色度编解码工具的使用的语法元素是否被包括在视频区域级的编解码表示中;并且基于该确定来执行转换;其中,去方块偏移被用于选择性地启用对视频块的去方块操作。
16.根据解决方案15所述的方法,其中,视频区域是视频条带或视频图片。
17.根据解决方案15-16中任一项所述的方法,其中,编解码条件对应于在自适应参数集中包括语法元素。
以下解决方案示出了在前一部分(例如,项目6、7)中讨论的技术的示例实施例。
18.一种视频处理方法,包括:在视频的视频区域的视频块和该视频的编解码表示之间执行转换,其中,编解码表示符合格式;其中,该格式指定指示视频色度分量的去方块偏移的第一标志是否被包括在编解码表示中是基于指示色度分量的量化参数偏移的第二标志是否被包括在编解码表示中。
19.根据解决方案1所述的方法,其中,格式规则指定编解码表示包括第三标志,该第三标志指示第一标志和第二标志是否被包括在编解码表示中。
20.根据解决方案1-2中任一项所述的方法,其中,第三标志被包括在图片参数集中的编解码表示中。
以下解决方案示出了在前一部分(例如,项目8-12)中讨论的技术的示例实施例。
21.一种视频处理方法,包括:在视频的视频区域的视频块和该视频的编解码表示之间执行转换,其中,编解码表示符合格式规则;其中,该格式规则指定编解码表示中的语法元素控制指示一个或多个色度编解码工具的适用性的一个或多个参数是否被包括在视频区域或视频块极的编解码表示中。
22.根据解决方案1所述的方法,其中,语法元素被包括在自适应参数集中。
23.根据解决方案1-2中任一项所述的方法,其中,格式规则指定语法元素的第一值指示一个或多个参数被从编解码表示中排除,并且在编解码表示的解析期间被跳过。
24.根据前述解决方案中任一项所述的方法,其中,由于视频满足条件,转换使用该方法。
25.根据解决方案24所述的方法,其中,条件包括编解码表示所使用的视频内容的类型或配置文件或级别或层级。
26.根据前述解决方案中任一项所述的方法,其中,条件包括视频块和/或相邻视频块的块维度或视频的颜色格式或用于视频块转换的编解码树结构或视频区域的类型。
27.根据解决方案1至26中任一项所述的方法,其中,转换包括将视频编码成编解码表示。
28.根据解决方案1至26中任一项所述的方法,其中,转换包括解码编解码表示以生成视频的像素值。
29.一种视频解码装置,包括被配置为实现解决方案1至28中的一个或多个所述的方法的处理器。
30.一种视频编码装置,包括被配置为实现解决方案1至28中的一个或多个所述的方法的处理器。
31.一种其上存储有计算机代码的计算机程序产品,当由处理器执行时,该代码使处理器实现解决方案1至28中任一项所述的方法。
32.本文档中描述的方法、装置或系统。
图13是根据本技术的视频处理方法1300的流程图表示。方法1300包括,在操作1310,使用调色板模式执行视频的视频块和该视频的比特流之间的转换,在调色板模式中,使用代表性颜色值的调色板来表示视频块的样点。基于局部双树是否被应用于视频块来确定视频块的调色板的尺寸。
在一些实施例中,在局部双树被应用于编解码单元的情况下,基于编解码单元的分割参数,分割操作仅被应用于编解码单元的亮度块,并且根据编解码单元的模式类型,分割操作不适用于编解码单元的至少一个色度块。在一些实施例中,在局部双树被应用于视频块的情况下,调色板的尺寸被减小。在一些实施例中,在局部双树被应用于视频块的情况下,与局部双树没有被应用于视频块的情况下的调色板的尺寸相比,调色板的尺寸被减小。在一些实施例中,在局部双树被应用于视频块的情况下,与常规单树被应用于视频块的情况下的调色板的尺寸相比,调色板的尺寸被减小。在一些实施例中,调色板的尺寸减半。
在一些实施例中,在局部双树被应用的情况下,色度分量的视频块的调色板的尺寸不同于亮度分量的视频块的调色板的尺寸。在一些实施例中,色度分量的视频块的调色板的尺寸小于亮度分量的视频块的调色板的尺寸。在一些实施例中,色度分量的视频块的调色板的尺寸是亮度分量的视频块的调色板的尺寸的一半。
图14是根据本技术的视频处理方法1400的流程图表示。方法1400包括,在操作1410,使用调色板模式执行视频的视频块和该视频的比特流之间的转换,在调色板模式中,使用代表性颜色值的调色板来表示视频块的样点。视频块的调色板预测器的尺寸是基于局部双树是否被应用于视频块。
在一些实施例中,在局部双树被应用于转换的情况下,调色板预测器的尺寸被减小。在一些实施例中,在应用局部双树的情况下,色度分量的视频块的调色板预测器的尺寸不同于亮度分量的视频块的调色板预测器的尺寸。在一些实施例中,色度分量的视频块的调色板预测器的尺寸小于亮度分量的视频块的调色板的尺寸。在一些实施例中,与亮度分量的视频块的调色板尺寸相比,色度分量的视频块的调色板预测器的尺寸减半。
图15是根据本技术的视频处理方法1500的流程图表示。方法1500包括,在操作1510,使用调色板模式执行视频的视频块和该视频的比特流之间的转换,在调色板模式中,使用代表性颜色值的调色板来表示视频块的样点。该转换符合规则,该规则指定使用由至少受最大允许值或最小允许值约束的量化参数在比特流中编码逸出样点的值。
在一些实施例中,逸出样点包括未被分类到调色板的代表性颜色值的样点子集,并且量化参数被约束为不大于最大允许值或不小于最小允许值。在一些实施例中,基于用于转换的二进制化方法来确定最大允许值。在一些实施例中,最大允许值被表示为(T+B),其中B表示比特深度。在一些实施例中,在比特流中的视频区域中指示T。在一些实施例中,在视频参数集、序列参数集、图片参数集、图片标头或条带标头中信令通知T。在一些实施例中,B等于与量化参数相关联的比特深度偏移。在一些实施例中,最大允许值等于与量化参数相关联的比特深度偏移加上T。在一些实施例中,T是常数。在一些实施例中,T等于23、35或39。在一些实施例中,T是小于23、小于35或小于29的常数。在一些实施例中,逸出样点的值使用EG5、EG3或EG4的比特长度来编解码。
图16是根据本技术的视频处理方法1600的流程图表示。方法1600包括,在操作1610,执行视频的块和该视频比的特流之间的转换。该转换符合格式规则,该格式规则指定在于比特流的自适应参数集中是否存在与色度编解码工具相关联的参数是基于自适应参数集中的控制标志。
在一些实施例中,在控制标志等于0的情况下,在自适应参数集中省略该参数。在一些实施例中,参数至少包括自适应环路滤波器的色度分量的信号标志、自适应环路滤波器的Cb分量的信号标志、自适应环路滤波器的Cr分量的信号标志,或者指示色度分量的缩放列表是否存在的信号标志。
图17是根据本技术的视频处理方法1700的流程图表示。方法1700包括,在操作1710,执行视频的块和该视频的比特流之间的转换。比特流符合格式规则,该格式规则指定在视频是单色的或者视频的颜色分量被单独处理的情况下,在比特流的图片标头中省略与量化参数相关联的语法元素。在一些实施例中,基于(1)的语法元素ChromaArrayType等于0、(2)视频颜色格式等于4:0:0来确定视频是单色的。在一些实施例中,该语法元素包括ph_log2_diff_min_qt_min_cb_intra_slice_luma 、ph_log2_diff_min_qt_min_cb_intra_slice_chroma 或ph_log2_diff_min_qt_min_cb_inter_slice。
图18是根据本技术的视频处理方法1800的流程图表示。方法1800包括,在操作1810,根据规则执行视频的视频块和该视频的比特流之间的转换,该规则指定对于该转换,使用代表性颜色值的调色板来表示视频块的样点的调色板模式和在残差域中执行颜色空间转换的自适应颜色变换模式被互斥地启用。
在一些实施例中,在调色板模式被应用于转换的情况下,自适应颜色变换模式被禁用。在一些实施例中,对于转换,自适应颜色变换模式的信息的信令通知被省略。在一些实施例中,自适应颜色变换模式的使用被推断为被禁用。在一些实施例中,在自适应颜色变换模式被应用于转换的情况下,调色板模式被禁用。在一些实施例中,对于转换,调色板模式的信息的信令通知被省略。在一些实施例中,调色板模式的使用被推断为被禁用。
图19是根据本技术的视频处理方法1900的流程图表示。方法1900包括,在操作1910,执行视频的视频块和该视频的比特流之间的转换。其中在残差域中执行颜色空间转换的自适应颜色变换模式被应用于视频块的残差块,而不管残差块的颜色空间。在一些实施例中,残差块的颜色空间包括绿-蓝-红(GBR)颜色空间或YCbCr颜色空间。
图20是根据本技术的视频处理方法2000的流程图表示。方法2000包括,在操作2010,执行视频的视频块和该视频的比特流之间的转换。视频块使用变换跳过残差编解码工具被编解码,其中使用上下文编解码过程或旁路编解码过程对视频块的变换跳过编解码的残差系数进行编解码。在转换期间,在旁路编解码过程的开始或结束时将操作应用于指定视频块中允许的剩余上下文编解码的二进制数的数量的变量。
在一些实施例中,该操作包括将视频块中允许的剩余上下文编码的二进制数的数量存储在临时变量中;以及基于临时变量来设置变量。在一些实施例中,操作包括将变量设置为值N,其中N是整数。在一些实施例中,N小于M,并且M等于3。在一些实施例中,N基于另一变量或另一语法元素。在一些实施例中,指示系数级的符号的语法元素是使用旁路编解码过程还是上下文编解码过程来编码基于视频块中允许的剩余上下文编码的二进制数的数量。
在一些实施例中,在视频块中允许的剩余上下文编码的的二进制数的数量等于N的情况下,使用旁路编解码过程对系数级的符号进行编码,N是等于或大于0的整数。在一些实施例中,在视频块中允许的剩余上下文编码的二进制数的数量大于或等于M的情况下,使用上下文编解码过程来编码系数级的符号,M是整数。
图21是根据本技术的视频处理方法2100的流程图表示。方法2100包括,在操作2110,使用变换跳过残差编解码过程来执行视频的视频块和该视频的比特流之间的转换。在转换期间,将操作应用于指示语法元素是否属于特定扫描阶段的变量。
在一些实施例中,操作包括向变量赋值,该变量指示当前扫描阶段是第三或剩余扫描阶段。在一些实施例中,操作包括向变量赋值,该变量指示当前扫描阶段是第一扫描阶段。在一些实施例中,操作包括向变量赋值,该变量指示当前扫描阶段是第二还是大于X的扫描阶段。在一些实施例中,操作包括在第一扫描阶段的开始,将第一值分配给变量,以及在第三或剩余扫描阶段的开始,将第二值分配给变量,其中第一值不等于第二值。
在一些实施例中,指示系数级的符号的语法元素是使用旁路编解码过程还是上下文编解码过程来编解码是基于变量。在一些实施例中,在变量指示特定扫描阶段是第三或剩余扫描阶段的情况下,使用旁路编解码过程来编解码系数级的符号。在一些实施例中,在变量指示特定扫描阶段是第一扫描阶段的情况下,使用上下文编解码过程来编解码系数级的符号。
图22是根据本技术的视频处理方法2200的流程图表示。方法2200包括,在操作2210,执行视频的视频块和该视频的比特流之间的转换。在转换期间,指示系数级的符号的语法元素是使用旁路编解码过程还是上下文编解码过程来编解码基于扫描阶段的索引,在扫描阶段中,视频块的区域中的一个或多个系数的相同语法元素按顺序被编解码。在一些实施例中,使用变换跳过残差编解码过程或系数编解码过程来执行转换,其中视频块是非变换跳过编解码的。
图23是根据本技术的视频处理方法2300的流程图表示。方法2300包括,在操作2310,使用变换跳过残差编解码过程执行视频的视频块和该视频的比特流之间的转换。在转换期间,指示系数级的符号的语法元素是使用旁路编解码过程还是上下文编解码过程来编解码基于语法元素是否在与另一语法元素相同的扫描阶段中被信令通知。
在一些实施例中,语法元素被信令通知为sig_coeff_flag或par_level_flag。在一些实施例中,在语法元素在与abs_remainder相同的扫描阶段中被信令通知的情况下,使用旁路编解码过程对语法元素进行编解码。
在一些实施例中,一个或多个上述方法的适用性基于视频的特性。在一些实施例中,特性包括视频的内容。在一些实施例中,特性包括在解码器参数集、序列参数集、视频参数集、图片参数集、自适应参数集、图片标头、条带标头、片组标头、最大编解码单元(LCU)、编解码单元(CU)、LCU行、LCU组、变换单元(TU)、图片单元(PU)块或视频编解码单元中信令通知的消息。在一些实施例中,特性包括编解码单元、图片单元、变换单元或块的位置。在一些实施例中,特性包括视频块和/或视频块的相邻块的维度或形状。在一些实施例中,特性包括视频块的量化参数。在一些实施例中,特性包括视频的颜色格式。在一些实施例中,特性包括视频的编解码树结构。在一些实施例中,特性包括条带、片组或图片的类型。在一些实施例中,特性包括视频块的颜色分量。在一些实施例中,特性包括时态层标识符。在一些实施例中,特性包括视频标准的配置文件、级别或层级。在一些实施例中,特性包括视频块是否包括逸出样点。在一些实施例中,该方法仅适用于视频块包括至少一个逸出样点的情况。在一些实施例中,特性包括视频块是否使用无损模式进行编码。在一些实施例中,该方法仅适用于没有使用无损模式对视频块进行编解码的情况。
在一些实施例中,转换包括将视频编码成比特流。在一些实施例中,转换包括从比特流中解码视频。
在本文档中,术语“视频处理”可以指视频编码、视频解码、视频压缩或视频解压缩。例如,在从视频的像素表示到对应的比特流表示的转换期间,可以应用视频压缩算法,反之亦然。如语法所定义,当前视频块的比特流表示可以,例如,与共位或散布在比特流内不同位置的比特相对应。例如,宏块可以根据变换和编码的误差残差值,并且还使用比特流中的标头和其他字段中的比特进行编码。
本申请文件中描述的所公开的和其他解决方案、示例、实施例、模块和功能操作能在数字电子电路、或计算机软件、固件或硬件中实现,包括本说明书中所公开的结构及其结构等效体,或其中一个或多个的组合。所公开的和其他实施例能够实现为一个或多个计算机程序产品,即编码在有形的且非易失的计算机可读介质上的计算机程序指令的一个或多个模块,以供数据处理装置执行或控制数据处理装置的操作。计算机可读介质可以是机器可读存储设备、机器可读存储基板、存储设备、影响机器可读传播信号的物质组成或其中一个或其中多个的组合。术语“数据处理单元”或“数据处理装置”包括用于处理数据的所有装置、设备和机器,包括例如可编程处理器、计算机或多处理器或计算机组。除硬件外,该装置还可以包括为计算机程序创建执行环境的代码,例如,构成处理器固件的代码、协议栈、数据库管理系统、操作系统或其中一个或多个的组合。传播的信号是人为生成的信号,例如,机器生成的电、光或电磁信号,其被生成以编码信息以传输到合适的接收器设备。
计算机程序(也称为程序、软件、软件应用、脚本或代码)可以用任何形式的编程语言(包括编译语言或解释语言)编写,并且可以以任何形式部署,包括作为独立程序或作为模块、组件、子程序或其他适合在计算环境中使用的单元。计算机程序不一定与文件系统中的文件对应。程序可以存储在保存其他程序或数据的文件的部分中(例如,存储在标记语言文档中的一个或多个脚本)、专用于该程序的单个文件中、或多个协调文件(例如,存储一个或多个模块、子程序或部分代码的文件)中。计算机程序可以部署在一台或多台计算机上来执行,这些计算机位于一个站点上或分布在多个站点上,并通过通信网络互连。
本申请文件中描述的过程和逻辑流可以通过一个或多个可编程处理器执行,该处理器执行一个或多个计算机程序,通过在输入数据上操作并生成输出来执行功能。处理和逻辑流也可以通过特殊用途的逻辑电路来执行,并且装置也可以实现为特殊用途的逻辑电路,例如,FPGA(现场可编程门数组)或ASIC(专用集成电路)。
例如,适于执行计算机程序的处理器包括通用和专用微处理器,以及任何类型数字计算机的任何一个或多个。通常,处理器将从只读存储器或随机存取存储器或两者接收指令和数据。计算机的基本元件是执行指令的处理器和存储指令和数据的一个或多个存储设备。通常,计算机还将包括一个或多个用于存储数据的大容量存储设备,例如,磁盘、磁光盘或光盘,或通过操作耦合到一个或多个大容量存储设备来从其接收数据或将数据传输到一个或多个大容量存储设备,或两者兼有。然而,计算机不一定具有这样的设备。适用于存储计算机程序指令和数据的计算机可读介质包括所有形式的非易失性存储器、介质和存储器设备,包括例如半导体存储器设备,例如EPROM、EEPROM和闪存设备;磁盘,例如,内部硬盘或可移动硬盘;磁光盘;以及CD ROM和DVD ROM盘。处理器和存储器可以由专用逻辑电路来补充,或merge到专用逻辑电路中。
虽然本专利文件包含许多细节,但不应将其解释为对任何发明或权利要求范围的限制,而应解释为对特定发明的特定实施例的特征的描述。本专利文件在单独实施例的上下文描述的某些特征也可以在单个实施例中组合实施。相反,在单个实施例的上下文中描述的各种功能也可以在多个实施例中单独实施,或在任何合适的子组合中实施。此外,尽管上述特征可以描述为在某些组合中起作用,甚至最初要求是这样,但在某些情况下,可以从组合中移除权利要求组合中的一个或多个特征,并且权利要求的组合可以指向子组合或子组合的变体。
同样,尽管附图中以特定顺序描述了操作,但这不应理解为要获得想要的结果必须按照所示的特定顺序或顺序执行此类操作,或执行所有说明的操作。此外,本专利文件所述实施例中各种系统组件的分离不应理解为在所有实施例中都需要这样的分离。
仅描述了一些实现和示例,可以基于本专利文件中描述和说明的内容做出其他实现、增强和变体。

Claims (42)

1.一种处理视频数据的方法,包括:
对于视频的第一视频块与所述视频的比特流之间的转换,确定第一预测模式被应用于所述第一视频块;
维护预测器调色板表;
在所述第一预测模式中,基于所述预测器调色板表构建包括用于所述第一视频块的一个或多个调色板预测器的第一调色板;以及
基于所述第一预测模式执行所述转换,
其中,在所述第一预测模式中,所述第一视频块的重构样点由代表性颜色值集合表示,所述代表性颜色值集合包括以下中的至少一种1)从所述第一调色板推导的调色板预测器,2)逸出样点,或者3)所述比特流中包括的调色板信息,
其中,所述第一调色板中的最大条目数基于所述第一视频块的树类型。
2.根据权利要求1所述的方法,其中,基于所述第一调色板更新所述预测器调色板表。
3.根据权利要求1所述的方法,其中,所述第一预测模式被应用于所述视频的第二视频块,并且基于所述预测器调色板表构建所述第二视频块的第二调色板;以及
在单树应用于所述第一视频块并且局部双树应用于所述第二视频块的情况下,所述第一调色板中的最大条目数不同于所述第二调色板中的最大条目数。
4.根据权利要求3所述的方法,其中,在所述单树应用于所述第一视频块并且所述局部双树应用于所述第二视频块的情况下,所述第二调色板中的最大条目数小于所述第一调色板中的最大条目数。
5.根据权利要求4所述的方法,其中,在所述单树应用于所述第一视频块并且所述局部双树应用于所述第二视频块的情况下,所述第二调色板中的最大条目数是所述第一调色板中的最大条目数的一半。
6.根据权利要求3所述的方法,其中,所述第二视频块是亮度块,并且所述第二视频块具有不等于单树的树类型并且具有不等于I条带的条带类型。
7.根据权利要求3所述的方法,其中,所述第二视频块是亮度块,并且所述第二视频块是通过划分编解码树节点的亮度父块获得的,其中不允许划分所述编解码树节点中的色度父块。
8.根据权利要求7所述的方法,其中,所述第一视频块是亮度块,并且对应于所述第一视频块的色度块的调色板尺寸大于所述色度父块的调色板尺寸。
9.根据权利要求7所述的方法,其中,所述第二调色板的尺寸大于所述色度父块的调色板尺寸。
10.根据权利要求1所述的方法,其中,所述第一预测模式被应用于所述视频的第二视频块,并且基于所述预测器调色板表构建所述第二视频块的第二调色板;以及
当双树应用于所述第一视频块并且局部双树应用于所述第二视频块的情况下,所述预测器调色板表中的最大条目数对于所述第一视频块和所述第二视频块是不同的。
11.根据权利要求10所述的方法,其中,所述第一视频块是色度块,
其中,所述第二视频块是亮度块,并且所述第二视频块是通过划分编解码树节点的亮度父块获得的,其中不允许划分所述编解码树结点的色度父块,以及
其中,所述第一调色板的尺寸大于所述色度父块的调色板尺寸。
12.根据权利要求1所述的方法,其中,所述转换包括将所述视频编码为所述比特流。
13.根据权利要求1所述的方法,其中,所述转换包括从所述比特流解码所述视频。
14.一种用于处理视频数据的设备,包括处理器和其上具有指令的非瞬态存储器,其中所述指令在由所述处理器执行时使所述处理器:
对于视频的第一视频块与所述视频的比特流之间的转换,确定第一预测模式被应用于所述第一视频块;
维护预测器调色板表;
在所述第一预测模式中,基于所述预测器调色板表构建包括用于所述第一视频块的一个或多个调色板预测器的第一调色板;以及
基于所述第一预测模式执行所述转换,
其中,在所述第一预测模式中,所述第一视频块的重构样点由代表性颜色值集合表示,所述代表性颜色值集合包括以下中的至少一种1)从所述第一调色板推导的调色板预测器,2)逸出样点,或者3)所述比特流中包括的调色板信息,
其中,所述第一调色板中的最大条目数基于所述第一视频块的树类型。
15.根据权利要求14所述的装置,其中,所述第一预测模式被应用于所述视频的第二视频块,并且基于所述预测器调色板表构建所述第二视频块的第二调色板;以及
在单树应用于所述第一视频块并且局部双树应用于所述第二视频块的情况下,所述第一调色板中的最大条目数不同于所述第二调色板中的最大条目数。
16.根据权利要求15所述的装置,其中,在所述单树应用于所述第一视频块并且所述局部双树应用于所述第二视频块的情况下,所述第二调色板中的最大条目数小于所述第一调色板中的最大条目数。
17.一种非暂时性计算机可读存储介质,其中存储有指令,所述指令使得处理器:
对于视频的第一视频块与所述视频的比特流之间的转换,确定第一预测模式被应用于所述第一视频块;
维护预测器调色板表;
在所述第一预测模式中,基于所述预测器调色板表构建包括用于所述第一视频块的一个或多个调色板预测器的第一调色板;以及
基于所述第一预测模式执行所述转换,
其中,在所述第一预测模式中,所述第一视频块的重构样点由代表性颜色值集合表示,所述代表性颜色值集合包括以下中的至少一种1)从所述第一调色板推导的调色板预测器,2)逸出样点,或者3)所述比特流中包括的调色板信息,
其中,所述第一调色板中的最大条目数基于所述第一视频块的树类型。
18.根据权利要求17所述的非暂时性计算机可读存储介质,其中,所述第一预测模式被应用于所述视频的第二视频块,并且基于所述预测器调色板表构建所述第二视频块的第二调色板;以及
在单树应用于所述第一视频块并且局部双树应用于所述第二视频块的情况下,所述第一调色板中的最大条目数不同于所述第二调色板中的最大条目数。
19.一种存储由视频处理设备执行的方法生成的视频比特流的非暂时性计算机可读记录介质,其中所述方法包括:
对于视频的第一视频块,确定第一预测模式被应用于所述第一视频块;
维护预测器调色板表;
在所述第一预测模式中,基于所述预测器调色板表构建包括用于所述第一视频块的一个或多个调色板预测器的第一调色板;以及
基于所述第一预测模式生成所述视频的比特流,
其中,在所述第一预测模式中,所述第一视频块的重构样点由代表性颜色值集合表示,所述代表性颜色值集合包括以下中的至少一种1)从所述第一调色板推导的调色板预测器,2)逸出样点,或者3)所述比特流中包括的调色板信息,
其中,所述第一调色板中的最大条目数基于所述第一视频块的树类型。
20.根据权利要求19所述的非暂时性计算机可读记录介质,其中,所述第一预测模式被应用于所述视频的第二视频块,并且基于所述预测器调色板表构建所述第二视频块的第二调色板;以及
在单树应用于所述第一视频块并且局部双树应用于所述第二视频块的情况下,所述第一调色板中的最大条目数不同于所述第二调色板中的最大条目数。
21.一种存储视频的比特流的方法,包括:
对于视频的第一视频块,确定第一预测模式被应用于所述第一视频块;
维护预测器调色板表;
在所述第一预测模式中,基于所述预测器调色板表构建包括用于所述第一视频块的一个或多个调色板预测器的第一调色板;
基于所述第一预测模式生成所述视频的比特流;以及
将所述比特流存储在非暂时性计算机可读记录介质中,
其中,在所述第一预测模式中,所述第一视频块的重构样点由代表性颜色值集合表示,所述代表性颜色值集合包括以下中的至少一种1)从所述第一调色板推导的调色板预测器,2)逸出样点,或者3)所述比特流中包括的调色板信息,
其中,所述第一调色板中的最大条目数基于所述第一视频块的树类型。
22.一种处理视频数据的方法,包括:
根据规则执行视频与所述视频的比特流之间的转换,
其中,所述规则指定与用于色度分量的编解码工具偏移相关的第一标志包括在所述比特流中的图片参数集(PPS)中,
其中,所述规则进一步指定基于所述第一标志的值确定指定色度去方块参数偏移的第一组语法元素是否包括在所述比特流中的所述PPS中,
其中,所述规则进一步指定基于所述第一标志的值确定指定用于所述视频的视频图片的色度去方块参数偏移的第二组语法元素是否包括在参考所述PPS的图片标头中,
其中,所述规则进一步指定基于所述第一标志的值来确定指定用于所述视频图片的条带的色度去方块参数偏移的第三组语法元素是否包括在参考所述PPS的条带标头中,以及
其中,所述第一标志的值与所述视频图片的颜色格式相关。
23.根据权利要求22所述的方法,其中,所述规则进一步指定基于所述第一标志的值确定是否在条带级别、图片级别或者PPS级别信令通知或者解析所述色度去方块参数偏移。
24.根据权利要求23所述的方法,其中,所述规则进一步指定,在所述第一标志具有第一值的情况下,所述第一组语法元素、所述第二组语法元素和所述第三组语法元素不存在。
25.根据权利要求24所述的方法,其中,在所述第一标志具有所述第一值的情况下,跳过在PPS级别信令通知或解析用于所述视频图片的色度去方块参数偏移,并且跳过在图片级别信令通知或解析用于所述条带的色度去方块参数偏移。
26.根据权利要求25所述的方法,其中,在所述第一标志具有所述第一值的情况下,在图片级别信令通知或解析用于所述视频图片的色度去方块参数偏移,并且在条带级别信令通知或解析用于所述条带的色度去方块参数偏移。
27.根据权利要求25所述的方法,其中,所述规则进一步指定所述第一组语法元素、所述第二组语法元素和所述第三组语法元素是否包括在所述比特流中是基于与去方块滤波器的应用相关的第二标志的值,
其中,所述规则进一步指定,基于所述第二标志的值,指定亮度去方块参数偏移的语法元素被有条件地包括在所述PPS中,
其中,所述规则进一步指定,基于所述第二标志的值,指定用于所述视频图片的亮度去方块参数偏移的语法元素被有条件地包括在参考所述PPS的图片标头中,
其中,所述规则进一步规定,基于所述第二标志的值,指定用于所述条带的亮度去方块参数偏移的语法元素被有条件地包括在参考所述PPS的条带标头中。
28.根据权利要求27所述的方法,其中,在所述第一标志具有所述第一值的情况下,基于指定用于所述视频图片的亮度去方块参数偏移的语法元素来信令通知或解析用于所述视频图片的色度去方块参数偏移,以及基于指定用于所述条带的亮度去方块参数偏移的语法元素来信令通知或解析用于所述条带的色度去方块参数偏移。
29.根据权利要求22所述的方法,其中,所述第一组语法元素包括以下中的至少一种:
pps_cb_beta_offset_div2、pps_cb_tc_offset_div2、pps_cr_beta_offset_div2或者pps_cr_tc_offset_div2;
其中,所述第二组语法元素包括以下中的至少一种:
ph_cb_beta_offset_div2、ph_cb_tc_offset_div2、ph_cr_beta_offset_div2或者ph_cr_tc_offset_div2;
其中,所述第三组语法元素包括以下中的至少一种:
sh_cb_beta_offset_div2、sh_cb_tc_offset_div2、sh_cr_beta_offset_div2或者sh_cr_tc_offset_div2。
30.根据权利要求22所述的方法,其中,在所述视频图片的颜色格式为4:0:0的情况下,在所述比特流中省略所述第一组语法元素、所述第二组语法元素和所述第三组语法元素。
31.根据权利要求22所述的方法,其中,所述规则进一步指定,基于所述第一标志的值来确定指定与色度量化参数相关的偏移的第四组语法元素是否包括在所述比特流的所述图片参数集(PPS)中。
32.根据权利要求31所述的方法,其中,所述规则进一步指定,在所述第四组语法元素不存在的情况下,所述第四组语法元素的值被推断为等于0。
33.根据权利要求31所述的方法,其中,在所述视频图片的颜色格式为4:0:0的情况下,在所述比特流中省略所述第四组语法元素。
34.根据权利要求22所述的方法,其中,所述转换包括将所述视频编码为所述比特流。
35.根据权利要求22所述的方法,其中,所述转换包括从所述比特流解码所述视频。
36.一种用于处理视频数据的装置,包括处理器和其上具有指令的非瞬态存储器,其中所述指令在由所述处理器执行时使所述处理器:
根据规则执行视频与所述视频的比特流之间的转换,
其中,所述规则指定与用于色度分量的编解码工具偏移相关的第一标志包括在所述比特流中的图片参数集(PPS)中,
其中,所述规则进一步指定基于所述第一标志的值确定指定色度去方块参数偏移的第一组语法元素是否包括在所述比特流中的所述PPS中,
其中,所述规则进一步指定基于所述第一标志的值确定指定用于所述视频的视频图片的色度去方块参数偏移的第二组语法元素是否包括在参考所述PPS的图片标头中,
其中,所述规则进一步指定基于所述第一标志的值来确定指定用于所述视频图片的条带的色度去方块参数偏移的第三组语法元素是否包括在参考所述PPS的条带标头中,以及
其中,所述第一标志的值与所述视频图片的颜色格式相关。
37.根据权利要求36所述的装置,其中,所述规则进一步指定基于所述第一标志的值确定是否在条带级别、图片级别或者PPS级别信令通知或者解析所述色度去方块参数偏移,
其中,所述规则进一步指定,在所述第一标志具有第一值的情况下,所述第一组语法元素、所述第二组语法元素和所述第三组语法元素不存在。
38.一种非暂时性计算机可读存储介质,其中存储有指令,所述指令使得处理器:
根据规则执行视频与所述视频的比特流之间的转换,
其中,所述规则指定与用于色度分量的编解码工具偏移相关的第一标志包括在所述比特流中的图片参数集(PPS)中,
其中,所述规则进一步指定基于所述第一标志的值确定指定色度去方块参数偏移的第一组语法元素是否包括在所述比特流中的所述PPS中,
其中,所述规则进一步指定基于所述第一标志的值确定指定用于所述视频的视频图片的色度去方块参数偏移的第二组语法元素是否包括在参考所述PPS的图片标头中,
其中,所述规则进一步指定基于所述第一标志的值来确定指定用于所述视频图片的条带的色度去方块参数偏移的第三组语法元素是否包括在参考所述PPS的条带标头中,以及
其中,所述第一标志的值与所述视频图片的颜色格式相关。
39.根据权利要求37所述的非暂时性计算机可读存储介质,其中,所述规则进一步指定基于所述第一标志的值确定是否在条带级别、图片级别或者PPS级别信令通知或者解析所述色度去方块参数偏移,
其中,所述规则进一步指定,在所述第一标志具有第一值的情况下,所述第一组语法元素、所述第二组语法元素和所述第三组语法元素不存在。
40.一种存储由视频处理设备执行的方法生成的视频比特流的非暂时性计算机可读记录介质,其中所述方法包括:
根据规则生成视频的比特流,
其中,所述规则指定与用于色度分量的编解码工具偏移相关的第一标志包括在所述比特流中的图片参数集(PPS)中,
其中,所述规则进一步指定基于所述第一标志的值确定指定色度去方块参数偏移的第一组语法元素是否包括在所述比特流中的所述PPS中,
其中,所述规则进一步指定基于所述第一标志的值确定指定用于所述视频的视频图片的色度去方块参数偏移的第二组语法元素是否包括在参考所述PPS的图片标头中,
其中,所述规则进一步指定基于所述第一标志的值来确定指定用于所述视频图片的条带的色度去方块参数偏移的第三组语法元素是否包括在参考所述PPS的条带标头中,以及
其中,所述第一标志的值与所述视频图片的颜色格式相关。
41.根据权利要求40所述的非暂时性计算机可读记录介质,其中,所述规则进一步指定基于所述第一标志的值确定是否在条带级别、图片级别或者PPS级别信令通知或者解析所述色度去方块参数偏移,
其中,所述规则进一步指定,在所述第一标志具有第一值的情况下,所述第一组语法元素、所述第二组语法元素和所述第三组语法元素不存在。
42.一种存储视频的比特流的方法,包括:
根据规则生成视频的比特流;以及
将所述比特流存储在非暂时性计算机可读记录介质中,
其中,所述规则指定与用于色度分量的编解码工具偏移相关的第一标志包括在所述比特流中的图片参数集(PPS)中,
其中,所述规则进一步指定基于所述第一标志的值确定指定色度去方块参数偏移的第一组语法元素是否包括在所述比特流中的所述PPS中,
其中,所述规则进一步指定基于所述第一标志的值确定指定用于所述视频的视频图片的色度去方块参数偏移的第二组语法元素是否包括在参考所述PPS的图片标头中,
其中,所述规则进一步指定基于所述第一标志的值来确定指定用于所述视频图片的条带的色度去方块参数偏移的第三组语法元素是否包括在参考所述PPS的条带标头中,以及
其中,所述第一标志的值与所述视频图片的颜色格式相关。
CN202311524935.5A 2020-02-05 2021-02-05 局部双树的调色板模式 Pending CN117376567A (zh)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
CNPCT/CN2020/074316 2020-02-05
CN2020074316 2020-02-05
CN2020091661 2020-05-21
CNPCT/CN2020/091661 2020-05-21
CN202180013088.9A CN115176460A (zh) 2020-02-05 2021-02-05 局部双树的调色板模式
PCT/CN2021/075408 WO2021155833A1 (en) 2020-02-05 2021-02-05 Palette mode for local dual tree

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN202180013088.9A Division CN115176460A (zh) 2020-02-05 2021-02-05 局部双树的调色板模式

Publications (1)

Publication Number Publication Date
CN117376567A true CN117376567A (zh) 2024-01-09

Family

ID=77199712

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202180013088.9A Pending CN115176460A (zh) 2020-02-05 2021-02-05 局部双树的调色板模式
CN202311524935.5A Pending CN117376567A (zh) 2020-02-05 2021-02-05 局部双树的调色板模式

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN202180013088.9A Pending CN115176460A (zh) 2020-02-05 2021-02-05 局部双树的调色板模式

Country Status (6)

Country Link
US (2) US11917169B2 (zh)
EP (1) EP4088456A4 (zh)
JP (2) JP2023513518A (zh)
KR (1) KR20220131249A (zh)
CN (2) CN115176460A (zh)
WO (1) WO2021155833A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021158633A (ja) * 2020-03-30 2021-10-07 Kddi株式会社 画像復号装置、画像復号方法及びプログラム

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101500914B1 (ko) 2010-04-09 2015-03-10 미쓰비시덴키 가부시키가이샤 동화상 복호 장치
US9756327B2 (en) 2012-04-03 2017-09-05 Qualcomm Incorporated Quantization matrix and deblocking filter adjustments for video coding
US9451258B2 (en) 2012-04-03 2016-09-20 Qualcomm Incorporated Chroma slice-level QP offset and deblocking
US11330297B2 (en) * 2014-08-19 2022-05-10 Qualcomm Incorporated Methods incorporating extensions to copy-above mode for palette mode coding
US20160234498A1 (en) * 2015-02-05 2016-08-11 Sharp Laboratories Of America, Inc. Methods and systems for palette table coding
WO2019216710A1 (ko) * 2018-05-10 2019-11-14 삼성전자주식회사 영상의 부호화 및 복호화를 위한 영상의 분할 방법 및 장치
KR102648120B1 (ko) * 2018-06-29 2024-03-18 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 슬라이스/타일/lcu 행마다의 룩업 테이블 리셋
CN110662054B (zh) * 2018-06-29 2023-01-06 北京字节跳动网络技术有限公司 用于视频处理的方法、装置、计算机可读存储介质
EP3794825A1 (en) * 2018-06-29 2021-03-24 Beijing Bytedance Network Technology Co. Ltd. Update of look up table: fifo, constrained fifo
CN110719463B (zh) * 2018-07-14 2022-11-22 北京字节跳动网络技术有限公司 用时间信息扩展基于查找表的运动矢量预测
US10848787B2 (en) * 2018-08-28 2020-11-24 Google Llc Lossy image compression using palettization of locally mixed colors
US11025905B2 (en) * 2018-09-14 2021-06-01 Tencent America LLC Method and device for decoding with palette mode
CN113475062A (zh) * 2019-02-24 2021-10-01 北京字节跳动网络技术有限公司 确定屏幕内容编解码的条件
CN111919441A (zh) * 2019-03-10 2020-11-10 北京字节跳动网络技术有限公司 组合的屏幕内容编码模式
CA3164388A1 (en) 2020-01-10 2021-07-15 Minwoo Park Video decoding method and apparatus for obtaining quantization parameter, and video encoding method and apparatus for transmitting quantization parameter
US11184632B2 (en) 2020-01-20 2021-11-23 Tencent America LLC Method and apparatus for palette based coding mode under local dual tree structure

Also Published As

Publication number Publication date
WO2021155833A1 (en) 2021-08-12
KR20220131249A (ko) 2022-09-27
US20240107037A1 (en) 2024-03-28
CN115176460A (zh) 2022-10-11
US20220394282A1 (en) 2022-12-08
US11917169B2 (en) 2024-02-27
EP4088456A4 (en) 2023-06-21
JP2024014958A (ja) 2024-02-01
EP4088456A1 (en) 2022-11-16
JP2023513518A (ja) 2023-03-31

Similar Documents

Publication Publication Date Title
CN113906753B (zh) 编解码视频的量化残差差分脉冲编解码调制表示的约束
US11528497B2 (en) Palette mode with different partition structures
WO2021155834A1 (en) Deblocking parameters for chroma component
US11503344B2 (en) Entropy coding for palette escape symbol
CN115211123A (zh) 视频编解码的通用约束信息
US11563946B2 (en) Quantization parameter derivation for palette mode
US20240107037A1 (en) Palette Mode For Local Dual Tree
CN115088192A (zh) 视频数据的基于字典的编解码
JP2023526494A (ja) 一般制約フラグのシグナリング
CN115699769A (zh) 使用通用约束信息语法元素的约束信令
CN115211118A (zh) 用于视频编解码的基于聚类的调色板模式
CN114946187A (zh) 色度残差的联合编解码和自适应颜色变换
CN115211119A (zh) 视频编码中的调色板尺寸信令

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination