CN113785568A - 变换跳过模式下的信令通知 - Google Patents

变换跳过模式下的信令通知 Download PDF

Info

Publication number
CN113785568A
CN113785568A CN202080032953.XA CN202080032953A CN113785568A CN 113785568 A CN113785568 A CN 113785568A CN 202080032953 A CN202080032953 A CN 202080032953A CN 113785568 A CN113785568 A CN 113785568A
Authority
CN
China
Prior art keywords
block
current video
video block
codec
mode
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202080032953.XA
Other languages
English (en)
Other versions
CN113785568B (zh
Inventor
朱维佳
张莉
许继征
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ByteDance Inc
Original Assignee
ByteDance Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ByteDance Inc filed Critical ByteDance Inc
Publication of CN113785568A publication Critical patent/CN113785568A/zh
Application granted granted Critical
Publication of CN113785568B publication Critical patent/CN113785568B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • H04N19/619Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding the transform being operated outside the prediction loop
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/98Adaptive-dynamic-range coding [ADRC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

描述了用于变换跳跃模式下的系数编解码的设备、系统和方法。一种用于可视媒体处理的示例性方法包括:为了将可视媒体数据的视频区域中的当前视频块编码为可视媒体数据的比特流表示,识别编解码模式和/或帧内预测模式和/或可允许帧内预测模式集合的使用;以及在识别出使用时,做出在比特流表示中包括还是排除指示选择性地将变换跳过模式应用于当前视频块的语法元素的决定,其中在变换跳过模式下,当前视频块和参考视频块之间的预测误差的残差被表示在可视媒体数据的比特流表示中,而不应用变换。

Description

变换跳过模式下的信令通知
相关申请的交叉引用
根据适用的专利法和/或依据巴黎公约的规则,本申请旨在及时要求2019年5月2日提交的国际专利申请No.PCT/CN2019/085405和2019年6月25日提交的国际专利申请No.PCT/CN2019/092831的优先权和利益。出于根据法律的所有目的,前述申请的全部公开通过引用而并入本文作为本申请的公开的一部分。
技术领域
本文档涉及视频和图像编码/解码技术。
背景技术
数字视频占互联网和其他数字通信网络上最大的带宽使用。随着能够接收和显示视频的连接用户设备的数量增加,预计对数字视频使用的带宽需求将继续增长。
发明内容
描述了与数字视频编码/解码有关的设备、系统和方法,并且具体地,描述了用于视频编码/解码的变换跳过模式下的系数编解码。所描述的方法可以被应用于现有的视频编解码标准(例如,高效视频编解码(HEVC))和未来的视频编解码标准(例如,通用视频编解码(VVC))或编解码器。
在一个示例性方面,公开了一种可视媒体处理的方法。该方法包括,为了将可视媒体数据的视频区域中的当前视频块编码为可视媒体数据的比特流表示,识别编解码模式和/或帧内预测模式和/或可允许帧内预测模式集合的使用;以及在识别出使用时,做出在比特流表示中包括还是排除指示选择性地将变换跳过模式应用于当前视频块的语法元素的决定,其中在变换跳过模式下,当前视频块和参考视频块之间的预测误差的残差被表示在可视媒体数据的比特流表示中,而不应用变换。
在另一个示例性方面,公开了一种可视媒体处理的方法。该方法包括,为了从可视媒体数据的比特流表示解码可视媒体数据的视频区域中的当前视频块,识别编解码模式和/或帧内预测模式和/或可允许帧内预测模式集合的使用;以及在识别出使用时,做出在比特流表示中包括还是排除指示选择性地将变换跳过模式应用于当前视频块的语法元素的决定,其中在变换跳过模式下,当前视频块和参考视频块之间的预测误差的残差被表示在可视媒体数据的比特流表示中,而不应用变换。
在又一示例性方面,公开了一种可视媒体处理的方法。该方法包括,为了从可视媒体数据的比特流表示解码可视媒体数据的视频区域中的当前视频块,识别编解码模式和/或帧内预测模式和/或可允许帧内预测模式集合的使用;以及在识别出使用时,做出在比特流表示中包括还是排除指示选择性地将变换跳过模式应用于当前视频块的语法元素的决定,其中在变换跳过模式下,当前视频块和预测视频块之间的残差被表示在可视媒体数据的比特流表示中,而不应用变换。
在又一示例性方面,公开了一种可视媒体处理的方法。该方法包括,为了将可视媒体数据的视频区域中的当前视频块编码为可视媒体数据的比特流表示,做出关于至少基于确定双树编解码结构被启用或至少从确定双树编解码结构被启用而推断的单树编解码结构或双树编解码结构的选择性应用的决定;以及在比特流表示中包括指示单树或双树的选择性应用的语法元素。
在又一个示例性方面,公开了一种可视媒体处理的方法。该方法包括,从包括包含当前视频块的视频区域的可视媒体数据的比特流表示解析语法元素,其中语法元素指示至少基于确定双树编解码结构被启用或至少从确定双树编解码结构被启用而推断的单树编解码结构或双树编解码结构的选择性应用;以及通过根据语法元素解码当前视频块,从比特流表示生成解码的视频区域。
在又一个示例性方面,公开了一种可视媒体处理的方法。该方法包括,为可视媒体数据的当前视频块和可视媒体的比特流表示之间的转换确定帧内块复制(IBC)模式被应用于当前视频块的色度分量;以及使用当前视频块的并置亮度块内的IBC编解码子区域中包括的首先可用样点来推导与当前视频块的子块相关联的运动信息。
在又一个示例性方面,公开了一种可视媒体处理的方法。该方法包括:为可视媒体数据的当前视频块和可视媒体的比特流表示之间的转换确定帧内块复制(IBC)模式被应用于当前视频块;以及在比特流表示中包括指示与当前视频块相关联的运动信息的语法元素。
在又一个示例性方面,公开了一种可视媒体处理的方法。该方法包括,为可视媒体数据的当前视频块和可视媒体的比特流表示之间的转换确定帧内块复制(IBC)模式被应用于当前视频块;以及至少基于一个或多个条件,确定在比特流表示中选择性地包括还是排除指示与当前视频块相关联的运动信息的语法元素。
在又一个示例方面,上述方法可以由包括处理器的视频编码器装置实施。
在又一个示例方面,这些方法可以以处理器可执行指令的形式体现,并被存储在计算机可读程序介质上。
这些和其他方面在本文档中进一步描述。
附图说明
图1示出了帧内块复制的示例。
图2示出了以调色板模式编解码的块的示例。
图3示出了使用调色板预测值来信令通知调色板条目的示例。
图4示出了水平和垂直遍历扫描的示例。
图5示出了调色板索引的编解码的示例。
图6示出了多类型树划分模式的示例。
图7示出了用于在跨分量线性模型(CCLM)预测模式下推导参数的样点的示例。
图8示出了利用色度缩放的亮度映射的示例性架构。
图9A-图9E是视频处理方法的示例的流程图。
图10是用于实施本文档中描述的可视媒体解码或可视媒体编码技术的硬件平台的示例的框图。
图11是所公开的技术可以被实施的示例视频处理系统的框图。
图12是可视媒体处理方法的示例的流程图。
图13是可视媒体处理方法的示例的流程图。
图14是可视媒体处理方法的示例的流程图。
图15是可视媒体处理方法的示例的流程图。
图16是可视媒体处理方法的示例的流程图。
图17是可视媒体处理方法的示例的流程图。
图18是可视媒体处理方法的示例的流程图。
图19是可视媒体处理方法的示例的流程图。
具体实施方式
本文档提供了图像或视频比特流的解码器可以用于提高解压缩或解码的数字视频或图像的质量的各种技术。为简洁起见,术语“视频”在本文用于包括图像序列(传统上称为视频)和单独图像。此外,视频编码器也可以在编码过程期间实施这些技术,以便重构用于进一步编码的解码帧。
为了便于理解,在本文档中使用了章节标题,并且不将实施例和技术限制于对应章节。这样,来自一个章节的实施例可以与来自其他章节的实施例组合。
1.摘要
本文档涉及视频编解码技术。具体地,它涉及视频编解码中的变换跳过模式下的系数编解码。它可以应用于现有的视频编解码标准,如HEVC,或即将要定案的标准(多功能视频编解码)。它也可以应用于未来的视频编解码标准或视频编解码器。
2.初步讨论
视频编解码标准主要是通过熟知的ITU-T和ISO/IEC标准的发展而演变的。ITU-T制定了H.261和H.263,ISO/IEC制定了MPEG-1和MPEG-4可视化,并且这两个组织联合制定了H.262/MPEG-2视频和H.264/MPEG-4高级视频编解码(Advanced Video Coding,AVC)和H.265/HEVC标准[1,2]。自H.262以来,视频编解码标准基于混合视频编解码结构,其中利用了时域预测加变换编解码。为了探索HEVC以外的未来视频编解码技术,VCEG和MPEG于2015年联合成立了联合视频探索组(Joint Video Exploration Team,JVET)。此后,JVET采用了许多新方法,并将其放入名为联合探索模型(Joint Exploration Model,JEM)的参考软件中。2018年4月,VCEG(Q6/16)和ISO/IEC JTC1 SC29/WG11(MPEG)之间的联合视频专家组(JVET)成立,以致力于VVC(Versatile Video Coding,多功能视频编解码)标准,目标是与HEVC相比比特率降低50%。
VVC草案的最新版本,即通用视频编解码(草案4)可以在以下处找到:
http://phenix.it-udparis.eu/jvet/doc_end_user/current_document.php?id=5755
VVC的最新参考软件(名为VTM)可以在以下处找到:
https://vcgit.hhi.fraunhofer.de/jvet/VVCSoftware_VTM/tags/VTM-4.0
2.1帧内块复制
HEVC屏幕内容编解码扩展(HEVC-SCC)和当前VVC测试模型(VTM-4.0)采用了帧内块复制(IBC),也称为当前图片参考。IBC将运动补偿的概念从帧间编解码扩展到帧内编解码。如图1所示范的,当应用IBC时,当前块由相同图片中的参考块预测。在当前块被编解码或解码之前,参考块中的样点必须已经被重构。尽管IBC对大多数相机捕捉的序列并不那么有效,但它示出对屏幕内容的显著编解码增益。原因是屏幕内容图片中有很多重复的图案,诸如图标和文本字符。IBC可以有效地移除这些重复图案之间的冗余。在HEVC-SCC中,如果帧间编解码单元(CU)选择当前图片作为其参考图片,则它可以应用IBC。在这种情况下,MV被重命名为块矢量(BV),并且BV总是具有整数像素精度。为了与主简档HEVC兼容,当前图片在解码图片缓冲区(DPB)中被标记为“长期”参考图片。应当注意,类似地,在多视图/3D视频编解码标准中,帧间视图参考图片也被标记为“长期”参考图片。
在BV找到其参考块之后,可以通过复制参考块来生成预测。残差可以通过从原始信号中减去参考像素得到。然后,可以像在其他编解码模式下一样应用变换和量化。
然而,当参考块在图片之外,或与当前块重叠,或在重构区域之外,或在受一些约束限制的有效区域之外时,部分或全部像素值没有被定义。基本上,有两种解决方案来处理这样的问题。一种是不允许这样的情况,例如在比特流一致性中。另一种是对那些未定义的像素值应用填充。以下子章节详细描述了解决方案。
2.2HEVC屏幕内容编解码扩展中的IBC
在HEVC的屏幕内容编解码扩展中,当块使用当前图片作为参考时,它应该保证整个参考块在可用的重构区域内,如以下规范文本所指示的:
变量offsetX和offsetY被推导如下:
offsetX=(ChromaArrayType==0)?0:(mvCLX[0]&0x7?2:0) (8-106)
offsetY=(ChromaArrayType==0)?0:(mvCLX[1]&0x7?2:0) (8-107)
比特流一致性的要求是,当参考图片是当前图片时,亮度运动矢量mvLX应当遵守以下约束:
-当调用第6.4.1条中指定的z扫描顺序块可用性的推导过程时,其中以设置为等于(xCb,yCb)的(xCurr,yCurr)和设置为等于(xPb+(mvLX[0]>>2)-offsetX,yPb+(mvLX[1]>>2)-offsetY)的邻近亮度位置(xNbY,yNbY)作为输入,输出应当等于TRUE(真)。
-当调用第6.4.1条中指定的z扫描顺序块可用性的推导过程时,其中以设置为等于(xCb,yCb)的(xCurr,yCurr)和设置为等于(xPb+(mvLX[0]>>2)+nPbW-1+offsetX,yPb+(mvLX[1]>>2)+nPbH-1+offsetY)的邻近亮度位置(xNbY,yNbY)作为输入,输出应当等于TRUE。
-一个或两个以下条件应当为真:
-(mvLX[0]>>2)+nPbW+xB1+offsetX的值小于或等于0。
-(mvLX[1]>>2)+nPbH+yB1+offsetY的值小于或等于0。
-以下条件应当为真:
(xPb+(mvLX[0]>>2)+nPbSw-1+offsetX)/CtbSizeY-xCurr/CtbSizeY<=yCurr/CtbSizeY-(yPb+(mvLX[1]>>2)+nPbSh-1+offsetY)/CtbSizeY(8-108)
因此,参考块与当前块重叠或者参考块在图片之外的情况将不会发生。不需要填充参考或预测块。
2.3VVC测试模型中的IBC
在当前VVC测试模型(即,VTM-4.0设计)中,整个参考块应该与当前编解码树单元(CTU)一起,并且不与当前块重叠。因此,不需要填充参考或预测块。IBC标志被编解码为当前CU的预测模式。因此,对于每个CU,总共有三种预测模式,MODE_INTRA、MODE_INTER和MODE_IBC。
2.3.1IBC Merge模式
在IBC Merge模式中,从比特流中解析指向IBC Merge候选列表中的条目的索引。IBC Merge列表的构建可以根据以下步骤顺序进行总结:
·步骤1:推导空域候选
·步骤2:插入HMVP候选
·步骤3:插入成对平均候选
在空域Merge候选的推导中,在位于位置A1、B1、B0、A0和B2的候选当中最多选择四个Merge候选。推导的顺序为A1、B1、B0、A0和B2。仅当位置A1、B1、B0、A0的任何PU不可用(例如,因为它属于另一个条带或片)或未以IBC模式编解码时,才考虑位置B2。在位置A1处的候选被添加之后,剩余候选的插入经受冗余检查,该冗余检查确保具有相同运动信息的候选从列表中排除,以便提高编解码效率。
在插入空域候选之后,如果IBC Merge列表尺寸仍然小于最大IBC Merge列表尺寸,则可以插入来自HMVP表的IBC候选。在插入HMVP候选时执行冗余检查。
最终,成对平均候选被插入到IBC Merge列表中。
当由Merge候选标识的参考块在图片之外,或者与当前块重叠,或者在重构区域之外,或者在受一些约束限制的有效区域之外时,该Merge候选被称为无效Merge候选。
注意,无效Merge候选可以被插入到IBC Merge列表中。
2.3.2IBC AMVP模式
在IBC AMVP模式下,从比特流中解析指向IBC AMVP列表中的条目的AMVP索引。IBCAMVP列表的构建可以根据以下步骤顺序进行总结:
·步骤1:推导空域候选
ο检查A0、A1,直到找到可用候选。
ο检查B0、B1、B2,直到找到可用候选。
·步骤2:插入HMVP候选
·步骤3:插入零候选
在插入空域候选之后,如果IBC AMVP列表尺寸仍然小于最大IBC AMVP列表尺寸,则可以插入HMVP表中的IBC候选。
最后,零候选被插入到IBC AMVP列表中。
2.4自适应运动矢量分辨率(AMVR)
在HEVC中,当条带头中的use_integer_mv_flag等于0时,(CU的运动矢量和预测运动矢量之间的)运动矢量差以四分之一亮度样点为单元进行信令通知。在VVC中,引入了CU级别自适应运动矢量分辨率(AMVR)方案。AMVR允许以不同的精度对CU的MVD进行编解码。根据当前CU的模式(正常AMVP模式或仿射AVMP模式),可以如下自适应地选择当前CU的MVD:
-正常AMVP模式:四分之一亮度样点、整数亮度样点或四亮度样点。
-仿射AMVP模式:四分之一亮度样点、整数亮度样点或1/16亮度样点。
如果当前CU具有至少一个非零MVD分量,则有条件地信令通知CU级别MVD分辨率指示。如果所有MVD分量(即,参考列表L0和参考列表L1的水平和垂直MVD)都为零,则推断四分之一亮度样点MVD分辨率。
对于具有至少一个非零MVD分量的CU,第一标志被信令通知以指示四分之一亮度样点MVD精度是否用于CU。如果第一标志为0,则不需要进一步信令通知,并且四分之一亮度样点MVD精度用于当前CU。否则,第二标志被信令通知,以指示整数亮度样点还是四亮度样点MVD精度用于正常AMVP CU。相同的第二标志用于指示整数亮度样点还是1/16亮度样点MVD精度用于仿射AMVP CU。为了确保重构MV具有预期的精度(四分之一亮度样点、整数亮度样点或四亮度样点),在与MVD加在一起之前,CU的运动矢量预测值将被取整到与MVD相同的精度。运动矢量预测值向零取整(即,负运动矢量预测值向正无穷大取整,并且正运动矢量预测值向负无穷大取整)。
编码器使用RD检查确定当前CU的运动矢量分辨率。为了避免总是对每个MVD分辨率执行三次CU级别RD检查,在VTM4中,除了四分之一亮度样点之外,MVD精度的RD检查仅有条件地调用。对于正常AVMP模式,首先计算四分之一亮度样点MVD精度和整数亮度样点MV精度的RD成本。然后,将整数亮度样点MVD精度的RD成本与四分之一亮度样点MVD精度的RD成本进行比较,以决定是否有必要进一步检查四亮度样点MVD精度的RD成本。当四分之一亮度样点MVD精度的RD成本远小于整数亮度样点MVD精度的RD成本时,跳过四亮度样点MVD精度的RD检查。对于仿射AMVP模式,如果在检查仿射Merge/跳过模式、Merge/跳过模式、四分之一亮度样点MVD精度正常AMVP模式和四分之一亮度样点MVD精度仿射AMVP模式的率失真成本之后没有选择仿射帧间模式,则不检查1/16亮度样点MV精度和1像素MV精度仿射帧间模式。此外,在1/16亮度样点和四分之一亮度样点MV精确仿射帧间模式下,在四分之一亮度样点MV精确仿射帧间模式下获得的仿射参数用作开始搜索点。
2.5调色板模式
调色板模式背后的基本思想是CU中的样点由代表性色彩值的小集合表示。该集合被称为调色板。也可以通过信令通知逸出符号(escape symbol)(其后是(可能是量化的)分量值)来指示调色板之外的样点。这在图2中示出。
2.6 HEVC屏幕内容编解码扩展(HEVC-SCC)中的调色板模式
在HEVC-SCC中的调色板模式下,使用预测方式对调色板和索引图进行编解码。
2.6.1调色板条目的编解码
对于调色板条目的编解码,保持调色板预测值。调色板的最大尺寸以及调色板预测值在SPS中被信令通知。在HEVC-SCC中,在PPS中引入了palette_predictor_initializer_present_flag。当该标志为1时,用于初始化调色板预测值的条目在比特流中信令通知。调色板预测值在每个CTU行、每个条带和每个片的开头初始化。根据palette_predictor_initializer_present_flag的值,调色板预测值被重置为0或使用PPS中信令通知的调色板预测值初始化器条目进行初始化。在HEVC-SCC中,启用了尺寸为0的调色板预测值初始化器,以允许在PPS级别显式禁用调色板预测值初始化。
对于调色板预测值中的每个条目,信令通知重用标志,以指示它是否是当前调色板的一部分。这在图3中示出。使用零的游程长度编解码来传送重用标志。此后,新调色板条目的数量使用0阶的指数Golomb码来信令通知。最终,新调色板条目的分量值被信令通知。
2.6.2调色板索引的编解码
如图4所示,使用水平和垂直遍历扫描对调色板索引进行编解码。使用palette_transpose_flag在比特流中显式信令通知扫描顺序。对于该子章节的其余部分,假设扫描为水平。
调色板索引使用两种主要的调色板样点模式进行编解码:“INDEX”和“COPY_ABOVE”。如前所解释的,逸出符号也作为“INDEX”模式被信令通知,并被分配等于最大调色板尺寸的索引。除了顶行或先前模式为“COPY_ABOVE”时,该模式使用标志来信令通知。在“COPY_ABOVE”模式下,复制上面行中的样点的调色板索引。在“INDEX”模式下,调色板索引是显式信令通知的。对于“INDEX”和“COPY_ABOVE”模式两者,指定也使用相同模式进行编解码的后续样点的数量的游程值被信令通知。当逸出符号是“INDEX”或“COPY_ABOVE”模式下的游程的一部分时,针对每个逸出符号信令通知逸出分量值。调色板索引的编解码在图5中示出。
该语法顺序按如下方式完成。首先,信令通知CU的索引值的数量。随后是使用截断二进制编解码的整个CU的实际索引值的信令通知。索引数量以及索引值都在旁路模式下进行编解码。这将索引相关的旁路二进制位分组在一起。然后调色板样点模式(如有必要)和游程以交错方式信令通知。最终,对应于整个CU的逸出样点的分量逸出值被分组在一起,并在旁路模式下进行编解码。
附加语法元素,last_run_type_flag,在信令通知索引值之后被信令通知。该语法元素与索引的数量相结合,消除了信令通知与块中的最后游程相对应的游程值的需要。
在HEVC-SCC中,也针对4:2:2、4:2:0和单色色度格式启用调色板模式。对于所有色度格式,调色板条目和调色板索引的信令通知几乎是相同的。在非单色格式的情况下,每个调色板条目由3个分量组成。对于单色格式,每个调色板条目由单个分量组成。对于子采样色度方向,色度样点与可被2整除的亮度样点索引相关联。在为CU重构调色板索引后,如果样点只有与其相关联的单个分量,则只使用调色板条目的第一分量。信令通知的唯一差别是逸出分量值。对于每个逸出样点,根据与该样点相关联的分量的数量,信令通知的逸出分量值的数量可能不同。
2.7变换跳过模式下的系数编解码
在JVET-M0464和JVET-N0280中,为了使残差编解码适应变换跳过级别的统计和信号特征,对变换跳过(TS)模式下的系数编解码提出了几个修改。
提议的修改列出如下。
没有最后的显著扫描位置:由于残差信号反映了预测之后的空域残差,并且没有对TS执行通过变换的能量集中,所以不再给出在变换块的右下角的尾随零或不显著级别的更高概率。因此,在这种情况下,省略了最后显著扫描位置信令。
子块CBF:最后显著扫描位置信令的缺失要求TS的具有coded_sub_block_flag的子块CBF信令被修改如下:
ο由于量化,前述无意义序列可能仍然局部地出现在变换块内。因此,如上所述移除最后显著扫描位置,并为所有子块编解码coded_sub_block_flag。
ο覆盖DC频率位置的子块(左顶部子块)的coded_sub_block_flag呈现了特殊情况。在VVC草案3中,该子块的coded_sub_block_flag从不被信令通知并且总是被推断为等于1。当最后显著扫描位置位于另一个子块中时,这意味着在DC子块之外有至少一个显著级别。因此,DC子块可以只包含零/非显著级别,尽管该子块的coded_sub_block_flag被推断为等于1。在TS中缺失最后扫描位置信息的情况下,每个子块的coded_sub_block_flag被信令通知。这还包括DC子块的coded_sub_block_flag,除了当所有其他coded_sub_block_flag语法元素已经等于0时。在这种情况下,DCcoded_sub_block_flag被推断为等于1(inferDcSbCbf=1)。因为在该DC子块中必须有至少一个显著级别,所以如果该DC子块中的所有其他sig_coeff_flag语法元素都等于0,则反而(0,0)处的第一位置的sig_coeff_flag语法元素不被信令通知并被推导为等于1(injectsbdcsigcoefflag=1)。
οcoded_sub_block_flag的上下文建模被改变。上下文模型索引被计算为当前子块的左边的coded_sub_block_flag和上方的coded_sub_block_flag之和,而不是两者的逻辑析取(disjunction)。
sig_coeff_flag上下文建模:修改sig_coeff_flag上下文建模中的局部模板,以仅包括当前扫描位置左边的邻居(NB0)和上方的邻居(NB1)。上下文模型偏移只是重要邻近位置sig_coeff_flag[NB0]+sig_coeff_flag[NB1]的数量。因此,根据当前变换块内的对角线d的不同上下文集的选择被移除。这产生了三个上下文模型和用于编解码sig_coeff_flag标志的单个上下文模型集。
abs_level_gt1_flag和par_level_flag上下文建模:对abs_level_gt1_flag和par_level_flag采用单个上下文模型。
abs_remainder编解码:尽管变换跳过残差绝对级别的经验分布通常仍然符合拉普拉斯或几何分布,但是存在比变换系数绝对级别更大的不稳定性。具体地,对于残差绝对级别,连续实现窗口内的方差更高。这激发了对abs_remainder语法二值化和上下文建模的以下修改:
ο在二值化中使用更高的截止值(即,从利用sig_coeff_flag、abs_level_gt1_flag、par_level_flag和abs_level_gt3_flag的编解码到abs_remainder的Rice码的转变点)、以及每个二进制位位置的专用上下文模型产生更高的压缩效率。增加截止值将导致更多的“大于X”标志,例如引入abs_level_gt5_flag、abs_level_gt7_flag等,直到达到截止值。截止值本身固定为5(numGtFlags=5)。
ο修改Rice参数推导的模板,即仅当前扫描位置的左边的邻居和上方的邻居被认为类似于sig_coeff_flag上下文建模的局部模板。
coeff_sign_flag上下文建模:由于记号序列内的不稳定性以及预测残差常常偏置的事实,即使当全局经验分布几乎均匀分布时,也可以使用上下文模型对记号进行编解码。单个专用上下文模型用于记号的编解码,并且符号在sig_coeff_flag之后被解析,以将所有上下文编解码二进制位保持在一起。
2.8量化残差块差分脉冲码调制(QR-BDPCM)
在JVET-M0413中,提出了量化残差块差分脉冲码调制(QR-BDPCM)来有效编解码屏幕内容。
QR-BDPCM中使用的预测方向可以是垂直和水平预测模式。通过在类似于帧内预测的预测方向(水平或垂直预测)上的样点复制,对整个块进行帧内预测。残差被量化,量化残差与其预测值(水平或垂直)量化值之间的增量(delta)被编解码。这可以通过以下进行描述:对于尺寸为M(行)×N(列)的块,假设ri,j,0≤i≤M-1,0≤j≤N-1是在使用来自上方或左边块边界样点的未滤波样点水平地(跨预测块逐线复制左边邻近像素值)或垂直地(在预测块中将顶部邻近线复制到每条线)执行帧内预测之后的预测残差。假设Q(ri,j),0≤i≤M-1,0≤j≤N-1表示残差ri,j的量化版本,其中残差是原始块和预测块值之间的差。然后将块DPCM应用于量化残差样点,得到具有元素
Figure BDA0003332960520000121
的修改后的M×N阵列
Figure BDA0003332960520000122
当信令通知垂直BDPCM时:
Figure BDA0003332960520000123
对于水平预测,应用类似的规则,通过以下获得残差量化样点
Figure BDA0003332960520000124
残差量化样点
Figure BDA0003332960520000125
被传送到解码器。
在解码器侧,使上面计算相反,以产生Q(ri,j),0≤i≤M-1,0≤j≤N-1。对于垂直预测情况,
Figure BDA0003332960520000126
对于水平情况,
Figure BDA0003332960520000131
逆量化残差Q-1(Q(ri,j))被添加到帧内块预测值,以产生重构样点值。
该方案的主要好处是,在系数解析期间可以动态地执行逆DPCM,只要在解析系数时添加预测值,或者其可以在解析之后被执行。
QR-BDPCM的草案文本改变如下所示。
7.3.6.5编解码单元语法
Figure BDA0003332960520000132
Figure BDA0003332960520000141
等于1的bdpcm_flag[x0][y0]指定bdpcm_dir_flag存在于包括位置(x0,y0)处的亮度编解码块的编解码单元中
等于0的bdpcm_dir_flag[x0][y0]指定要在bdpcm块中使用的预测方向为水平,否则为垂直。
2.9分割结构
2.9.1使用树结构分割CTU
在HEVC中,通过使用表示为编解码树的四元树结构来适应各种局部特征,CTU被划分为CU。使用帧间图片(时域)预测还是帧内图片(空域)预测来编解码图片区域的决定是在叶CU级别做出的。根据PU划分类型,每个叶CU可以被进一步划分为一个、两个或四个PU。在一个PU内,应用相同的预测过程,并且在PU的基础上将相关信息发送到解码器。在通过应用基于PU划分类型的预测过程获得残差块之后,可以根据与CU的编解码树类似的另一四元树结构将叶CU分割为变换单元(TU)。HEVC结构的一个重要特征是它具有多个分割概念,包括CU、PU和TU。
在VVC中,具有使用二元和三元划分段结构的嵌套多类型树的四叉树代替多个分割单元类型的概念,即,除了对于对最大变换长度来说尺寸太大的CU的需要之外,它移除了CU、PU和TU概念的分离,并且支持CU分割形状的更大灵活性。在编解码树结构中,CU可以具有正方形或矩形形状。编解码树单元(CTU)首先通过四元树(也称为四叉树)结构分割。然后,可以通过多类型树结构进一步分割四元树叶节点。如图6所示,多类型树结构中有四种划分类型,垂直二元划分(SPLIT_BT_VER)、水平二元划分(SPLIT_BT_HOR)、垂直三元划分(SPLIT_TT_VER)和水平三元划分(SPLIT_TT_HOR)。多类型树叶节点被称为编解码单元(CU),除非CU对于最大变换长度来说太大,否则该段用于预测和变换处理,而不需要任何进一步分割。这意味着,在大多数情况下,在具有嵌套的多类型树编解码块结构的四叉树中,CU、PU和TU具有相同的块尺寸。当最大支持的变换长度小于CU的色彩分量的宽度或高度时,出现异常。此外,亮度和色度分量在I片上具有单独的分割结构。
2.10跨分量线性模型预测
为了减少跨分量冗余,在VTM4中使用跨分量线性模型(CCLM)预测模式,为此,通过使用线性模型,基于相同CU的重构亮度样点来预测色度样点,如下:
predC(i,j)=α·recL′(i,j)+β
其中predC(i,j)表示CU中的预测色度样点,并且recL(i,j)表示相同CU的下采样的重构亮度样点。线性模型参数α和β是从两个样点的亮度值和色度值之间的关系推导的,这两个样点是下采样的邻近亮度样点集合内具有最小样点值和最大样点的亮度样点、以及它们的对应色度样点。线性模型参数α和β根据以下等式获得。
Figure BDA0003332960520000151
β=Yb-α·Xb
其中Ya和Xa表示具有最大亮度样点值的亮度样点的亮度值和色度值。Xb和Yb分别表示具有最小亮度样点的亮度样点的亮度值和色度值。图7示出了左边和上方样点以及CCLM模式下涉及的当前块的样点的位置的示例。
2.11亮度映射与色度缩放(LMCS)
在VTM4中,称为亮度映射与色度缩放(LMCS)的编解码工具被添加作为环路滤波器之前的新处理模块。LMCS具有两个主要部件:1)基于自适应分段线性模型的亮度分量的环路映射;2)对于色度分量,应用依赖于亮度的色度残差缩放。图8示出了从解码器的角度的LMCS架构。图8中的阴影块指示映射域中在哪里应用该处理;并且这些包括逆量化、逆变换、亮度帧内预测以及亮度预测与亮度残差加在一起。图8中的无阴影块指示原始(即,未映射)域中在哪里应用该处理;并且这些包括诸如去方块、ALF和SAO的环路滤波器、运动补偿预测、色度帧内预测、色度预测与色度残差加在一起以及解码图片作为参考图片的存储。图8中的浅黄色阴影块是新的LMCS功能块,包括亮度信号的正映射和逆映射以及依赖于亮度的色度缩放过程。像VVC中的大多数其他工具一样,可以使用SPS标志在序列级别启用/禁用LMCS。
3.实施例解决的问题的示例
尽管JVET-N0280中的系数编解码可以在屏幕内容编解码上实现编解码益处,但系数编解码和TS模式可能仍有一些缺点。
(1)TS模式的最大允许宽度或高度由PPS中的一个共同值控制,这可能限制灵活性。
(2)每个编解码组(CG)需要信令通知TS模式的cbf标志,这可能增加开销成本。
(3)系数扫描顺序不考虑帧内预测模式。
(4)符号标志编解码仅采用一个上下文。
(5)不支持色度分量上的变换跳过。
(6)变换跳过标志被应用于所有预测模式,这增加了开销成本和编码复杂性。
4.实施例的示例
下面的详细发明应该被认为是解释一般构思的示例。这些发明不应该被狭义地解释。此外,这些发明可以以任何方式组合。
1.变换跳过的最大允许宽度和高度的指示都可以在SPS/VPS/PPS/图片头/条带头/片组头/LCU行/LCU组中被信令通知。
a.在一个示例中,变换跳过的最大允许宽度和高度可以由在SPS/VPS/PPS/图片头/条带头/片组头/LCU行/LCU组中信令通知的不同消息指示。
b.在一个示例中,最大允许宽度和/或高度可以首先在SPS/PPS中被信令通知,然后在图片头/条带头/片组头/LCU行/LCU组中被更新。
2.TS编解码块可以被分为几个系数组(CG),并且至少一个CG的编解码块标志(Cbf)标志的信令通知可以被跳过。
a.在一个示例中,可以跳过所有CG的Cbf标志的信令通知,例如,对于TS编解码块。
b.在一个示例中,对于TS模式,CG的跳过的cbf标志可以被推断为1
c.在一个示例中,跳过CG的部分还是全部Cbf标志可以取决于编解码模式。
i.在一个示例中,对于TS编解码帧内块,跳过CG的所有Cbf标志的信令通知。
d.在一个示例中,CG的跳过的Cbf标志可以基于以下来推断
i.SPS/VPS/PPS/图片头/条带头/片组头/LCU行/LCU组/LCU/CU中信令通知的消息
ii.CG的位置
iii.当前块和/或其邻近块的块大小
iv.当前块和/或其邻近块的块形状
v.当前块和/或其邻近块的最可能模式
vi.当前块的邻近块的预测模式(帧内/帧间)
vii.当前块的邻近块的帧内预测模式
viii.当前块的邻近块的运动矢量
ix.当前块的邻近块的QR-BDPCM模式的指示
x.当前块的当前量化参数和/或其邻近块的当前量化参数
xi.色彩格式的指示(诸如4:2:0、4:4:4)
xii.单/双编解码树结构
xiii.条带/片组类型和/或图片类型
3.TS编解码块中的系数扫描顺序可以取决于在SPS/VPS/PPS/图片头/条带头/片组头/LCU行/LCU组/LCU/CU中信令通知的消息。
a.可替代地,当采用TS时,CG和/或系数扫描顺序可以取决于帧内预测模式
i.在一个示例中,如果帧内预测模式是水平主导的,则扫描顺序可以为垂直
1.在一个示例中,如果帧内预测模式索引的范围从2到34,则扫描顺序可以为垂直。
2.在一个示例中,如果帧内预测模式索引的范围从2到33,则扫描顺序可以为垂直。
ii.在一个示例中,如果帧内预测模式是垂直主导的,则扫描顺序可以为垂直
1.在一个示例中,如果帧内预测模式索引的范围从34-66,则扫描顺序可以为垂直。
2.在一个示例中,如果帧内预测模式索引的范围从35-66,则扫描顺序可以为垂直。
iii.在一个示例中,如果帧内预测模式是垂直主导的,则扫描顺序可以为水平
1.在一个示例中,如果帧内预测模式索引的范围从34到66,则扫描顺序可以为垂直。
2.在一个示例中,如果帧内预测模式索引的范围从35到66,则扫描顺序可以为垂直。
iv.在一个示例中,如果帧内预测模式是水平主导的,则扫描顺序可以为水平
1.在一个示例中,如果帧内预测模式索引的范围从2到34,则扫描顺序可以为垂直。
2.在一个示例中,如果帧内预测模式索引的范围从2到33,则扫描顺序可以为垂直。
4.提出了符号标志编解码的上下文可以取决于TS模式的系数块中的邻近信息。
a.在一个示例中,对当前符号标志进行编解码的上下文可以取决于TS模式的邻近符号标志的值。
i.在一个示例中,对当前符号标志进行编解码的上下文可以取决于左邻居(neighbor)和/或上邻居的符号标志的值。
1.在一个示例中,当前符号标志的上下文可以被推导为C=(L+A),其中C是上下文id,L是其左邻居的符号标志,并且A是其上邻居的符号标志
2.在一个示例中,当前符号标志的上下文可以被推导为C=(L+A*2),其中C是上下文id,L是其左邻居的符号标志,并且A是其上邻居的符号标志
3.在一个示例中,当前符号标志的上下文可以被推导为C=(L*2+A),其中C是上下文id,L是其左邻居的符号标志,并且A是其上邻居的符号标志
ii.在一个示例中,对当前符号标志进行编解码的上下文可以取决于左邻居、上邻居和左上邻居的符号标志的值。
iii.在一个示例中,对当前符号标志进行编解码的上下文可以取决于左邻居、上邻居、左上邻居、右上邻居的符号标志的值。
b.在一个示例中,对当前符号标志进行编解码的上下文可以取决于系数的位置。
i.在一个示例中,符号标志的上下文在不同位置可以不同。
ii.在一个示例中,符号标志的上下文可以取决于x+y,其中x和y是位置的水平和垂直位置。
iii.在一个示例中,符号标志的上下文可以取决于min(x,y),其中x和y是位置的水平和垂直位置。
iv.在一个示例中,符号标志的上下文可以取决于max(x,y),其中x和y是位置的水平和垂直位置。
5.提出了可以支持色度变换跳过模式。
a.在一个示例中,色度变换跳过模式的使用可以基于在SPS/VPS/PPS/图片头/条带头/片组头/LCU行/LCU组/LCU/CU/视频数据单元中信令通知的消息。
b.可替代地,色度变换跳过模式的使用可以基于相同色彩分量或其他色彩分量中的一个或多个代表性先前编解码块的解码信息。
i.在一个示例中,如果代表性块的TS标志的指示为假,则色度TS标志的指示可以被推断为假。可替代地,如果代表性块的TS标志的指示为真,则色度TS标志的指示可以被推断为真。
ii.在一个示例中,代表性块可以是亮度块或色度块。
iii.在一个示例中,代表性块可以是并置亮度块内的任何块。
iv.在一个示例中,代表性块可以是当前色度块的邻近色度块中的一个。
v.在一个示例中,代表性块可以是覆盖当前色度块内的中心色度样点的对应亮度样点的块。
vi.在一个示例中,代表性块可以是覆盖当前色度块内的右底部色度样点的对应亮度样点的块。
6.是否和/或如何应用变换跳过模式可以取决于在SPS/VPS/PPS/图片头/条带头/片组头/LCU行/LCU组/LCU/CU/视频数据单元中信令通知的消息。
a.在一个示例中,何时和/或如何应用变换跳过模式的指示可以取决于
i.当前块和/或其邻近块的块大小
ii.当前块和/或其邻近块的块形状
iii.当前块和/或其邻近块的最可能模式
iv.当前块的邻近块的预测模式(帧内/帧间)
v.当前块的邻近块的帧内预测模式
vi.当前块的邻近块的运动矢量
vii.当前块的邻近块的QR-BDPCM模式的指示
viii.当前块的当前量化参数和/或其邻近块的当前量化参数
ix.色彩格式的指示(诸如4:2:0、4:4:4)
x.单/双编解码树结构
xi.条带/片组类型和/或图片类型
xii.时域层ID
b.在一个示例中,当预测模式是IBC模式并且块宽度和/或高度小于/大于/等于阈值时,可以应用变换跳过模式
i.在一个示例中,阈值可以为4、8、16或32。
ii.在一个示例中,可以在比特流中信令通知阈值。
iii.在一个示例中,阈值可以基于
1.在SPS/VPS/PPS/图片头/条带头/片组头/LCU行/LCU组/LCU/CU中信令通知的消息
2.当前块和/或其邻近块的块大小
3.当前块和/或其邻近块的块形状
4.当前块和/或其邻近块的最可能模式
5.当前块的邻近块的预测模式(帧内/帧间)
6.当前块的邻近块的帧内预测模式
7.当前块的邻近块的运动矢量
8.当前块的邻近块的QR-BDPCM模式的指示
9.当前块的当前量化参数和/或其邻近块的当前量化参数
10.色彩格式的指示(诸如4:2:0、4:4:4)
11.单/双编解码树结构
12.条带/片组类型和/或图片类型
13.时域层ID
7.是否信令通知TS模式的指示可以取决于解码/推导的帧内预测模式。
a.此外,可替代地,它可以取决于在QR-BDPCM编解码块中使用的允许帧内预测模式/方向以及QR-BDPCM的使用。
b.对于解码或推导的帧内预测模式,如果它是在QR-BDPCM编解码块中使用的允许的帧内预测模式/方向集合的一部分,则可以跳过TS标志的信令通知。
i.在一个示例中,如果允许QR-BDPCM用于对一个条带/图片/片/砖块(brick)进行编解码,则垂直和水平模式是QR-BDPCM过程中的两种允许模式,并且解码/推导的帧内模式是垂直或水平模式,则不信令通知TS模式的指示。
c.在一个示例中,当QR-BDPCM模式的指示(例如,bdpcm_flag)为1时,可以推断变换跳过模式被启用。
d.以上方法可以基于以下来应用
i.在SPS/VPS/PPS/图片头/条带头/片组头/LCU行/LCU组/LCU/CU中信令通知的消息
ii.当前块和/或其邻近块的块大小
iii.当前块和/或其邻近块的块形状
iv.当前块和/或其邻近块的最可能模式
v.当前块的邻近块的预测模式(帧内/帧间)
vi.当前块的邻近块的帧内预测模式
vii.当前块的邻近块的运动矢量
viii.当前块的邻近块的QR-BDPCM模式的指示
ix.当前块的当前量化参数和/或其邻近块的当前量化参数
x.色彩格式的指示(诸如4:2:0、4:4:4)
xi.单/双编解码树结构
xii.条带/片组类型和/或图片类型
xiii.时域层ID
8.是否和/或如何应用QR-BDPCM可以取决于TS模式的指示。
a.在一个示例中,是否应用QR-BDPCM的指示可以在变换单元(TU)级别上被信令通知,而不是在CU中被信令通知。
i.在一个示例中,是否应用QR-BDPCM的指示可以在将TS模式的指示应用于TU之后被信令通知。
b.在一个示例中,QR-BDPCM被视为TS模式的特殊情况。
i.当一个块以TS模式进行编解码时,可以进一步信令通知另一个标志,以指示应用QR-BDPCM还是传统TS模式。如果它用QR-BDPCM进行编解码,则可以进一步信令通知在QR-BDPCM中使用的预测方向。
ii.可选地,当一个块以TS模式进行编解码时,可以进一步信令通知另一个标志,以指示应用哪种QR-BDPCM(例如,基于水平/垂直预测方向的QR-BDPCM)或传统TS模式。
c.在一个示例中,是否进行QR-BDPCM的指示可以基于TS模式的指示来推断。
i.在一个示例中,如果是否将变换跳过标志应用于相同块的指示为真,则是否将QR-BDPCM应用于亮度和/或色度块的指示可以被推断为真。可替代地,如果是否将变换跳过标志应用于亮度和/或色度块的指示为真,则是否将QR-BDPCM应用于相同块的指示可以被推断为真。
ii.在一个示例中,如果是否将变换跳过标志应用于相同块的指示为假,则是否将QR-BDPCM应用于亮度和/或色度块的指示可以被推断为假。可替代地,如果是否将变换跳过标志应用于亮度和/或色度块的指示为假,则是否将QR-BDPCM应用于相同块的指示可以被推断为假。
9.是否和/或如何应用单/双树可以取决于在SPS/VPS/PPS/图片头/条带头/片组头/LCU行/LCU组/LCU/CU/视频数据单元中信令通知的消息。
a.在一个示例中,是否应用单/双树的指示可以取决于当前条带/片/LCU/LCU行/LCU组/视频数据单元是否被确定为屏幕内容。
i.此外,在一个示例中,条带/片/LCU/LCU行/LCU组/视频数据单元是否被确定为屏幕内容可以取决于
1.在SPS/VPS/PPS/图片头/条带头/片组头/LCU行/LCU组/LCU/CU/视频数据单元中信令通知的消息/标志。
2.当前CTU和/或其邻近CTU的块大小
3.当前CTU和/或其邻近CTU的块形状
4.当前CTU和/或其邻近CTU的当前量化参数
5.色彩格式的指示(诸如4:2:0、4:4:4)
6.先前条带/片/LCU/LCU行/LCU组/视频数据单元的单/双编解码树结构类型
7.条带/片组类型和/或图片类型
8.时域层ID
b.在一个示例中,可以推断是否应用单/双树的指示,这可以取决于
i.在SPS/VPS/PPS/图片头/条带头/片组头/LCU行/LCU组/LCU/CU/视频数据单元中信令通知的消息。
ii.先前编解码图片/片/条带/重构区域中的IBC/帧间模式的哈希命中率
iii.当前CTU和/或其邻近CTU的块大小
iv.当前CTU和/或其邻近CTU的块形状
v.当前CTU和/或其邻近CTU的当前量化参数
vi.色彩格式的指示(诸如4:2:0、4:4:4)
vii.先前条带/片/LCU/LCU行/LCU组/视频数据单元的单/双编解码树结构类型
viii.条带/片组类型和/或图片类型
ix.时域层ID
c.在一个示例中,是否应用CCLM和/或LMCS的指示可以取决于单/双编解码树结构类型
i.在一个示例中,当使用单/双树时,指示CCLM和/或LMCS可以被推断为假。
d.在一个示例中,是否应用单/双树(即,单树或双树的CTU级别适应性)的指示可以取决于启用双树的指示(例如,qtbtt_dual_tree_intra_flag)是否为真。
i.此外,可替代地,如果序列/条带/片/砖块的双树没有被启用(例如,qtbtt_dual_tree_intra_flag为假),则是否在更低级别(例如,CTU)应用单/双树的指示可以被推断为假1.可替代地,如果双树被启用(例如,qtbtt_dual_tree_intra_flag为真),则可以信令通知是否对小于序列/条带/片/砖块的视频单元应用单/双树的指示。
e.在一个示例中,是否应用单/双树(即,单树或双树的CTU级别适应性)的指示可以取决于高于CTU级别的级别的标志(例如,sps_asdt_flag和/或slice_asdt_flag)是否为真。
i.此外,可替代地,如果高于CTU级别的级别的标志(例如,sps_asdt_flag和/或slice_asdt_flag)为假,则是否应用单/双树(即,单树或双树的CTU级别适应性)的指示可以被推断为假。
f.以上方法也可以适用于单树分割情况、或单/双编解码树结构类型。
10.是否启用IBC可以取决于编解码树结构类型。
a.在一个示例中,对于给定的编解码树结构类型(例如,双树),可以跳过并推断IBC模式的指示和/或在IBC模式下使用的块矢量的信令通知。
b.在一个示例中,当应用双编解码树结构类型时,IBC模式的指示可以被推断为假。
c.在一个示例中,当应用双编解码树结构类型时,亮度块的IBC模式的指示可以被推断为假。
d.在一个示例中,当应用双编解码树结构类型时,色度块的IBC模式的指示可以被推断为假。
e.在一个示例中,IBC模式的指示可以基于以下来推断
i.在SPS/VPS/PPS/图片头/条带头/片组头/LCU行/LCU组/LCU/CU/视频数据单元中信令通知的消息。
ii.先前编解码图片/片/条带/重构区域中的IBC/帧间模式的哈希命中率
iii.当前CTU和/或其邻近CTU的块大小
iv.当前CTU和/或其邻近CTU的块形状
v.当前CTU和/或其邻近CTU的当前量化参数
vi.色彩格式的指示(诸如4:2:0、4:4:4)
vii.先前条带/片/LCU/LCU行/LCU组/视频数据单元的编解码树结构类型
viii.条带/片组类型和/或图片类型
ix.时域层ID
11.是否启用CCLM可以取决于编解码树结构类型。
a.在一个示例中,对于给定的编解码树结构类型(例如,双树),可以跳过并推断CCLM模式的指示和/或与CCLM模式有关的其他语法的信令通知。
b.在一个示例中,当应用双编解码树结构类型时,CCLM模式的指示可以被推断为假。
c.在一个示例中,当应用双编解码树结构类型时,CCLM模式的指示可以基于以下来推断
i.在SPS/VPS/PPS/图片头/条带头/片组头/LCU行/LCU组/LCU/CU/视频数据单元中信令通知的消息。
ii.先前编解码图片/片/条带/重构区域中的IBC/帧间模式的哈希命中率
iii.当前CTU和/或其邻近CTU的块大小
iv.当前CTU和/或其邻近CTU的块形状
v.当前CTU和/或其邻近CTU的当前量化参数
vi.色彩格式的指示(诸如4:2:0、4:4:4)
vii.先前条带/片/LCU/LCU行/LCU组/视频数据单元的编解码树结构类型
viii.条带/片组类型和/或图片类型
ix.时域层ID
12.是否对色度分量启用LMCS可以取决于编解码树结构类型。
a.在一个示例中,对于给定的编解码树结构类型(例如,双树),可以跳过并推断色度分量的LMCS的指示和/或与LMCS模式有关的其他语法的信令通知。
b.在一个示例中,当应用双编解码树结构类型时,色度分量的LMCS的指示可以被推断为假。
c.在一个示例中,当应用双编解码树结构类型时,色度分量的LMCS的指示可以基于以下来推断
i.在SPS/VPS/PPS/图片头/条带头/片组头/LCU行/LCU组/LCU/CU/视频数据单元中信令通知的消息。
ii.先前编解码图片/片/条带/重构区域中的IBC/帧间模式的哈希命中率
iii.当前CTU和/或其邻近CTU的块大小
iv.当前CTU和/或其邻近CTU的块形状
v.当前CTU和/或其邻近CTU的当前量化参数
vi.色彩格式的指示(诸如4:2:0、4:4:4)
vii.先前条带/片/LCU/LCU行/LCU组/视频数据单元的编解码树结构类型
viii.条带/片组类型和/或图片类型
ix.时域层ID
13.编解码树结构可以取决于是否使用IBC。
a.在一个示例中,可以不在序列/图片/片/砖块/CTU/VPDU/32x32块/64x32块/32x64块级别同时启用双树结构和IBC方法。
b.此外,可替代地,在一个示例中,如果启用了IBC方法,则可以在序列/图片/片/砖块/CTU/VPDU/32x32块/64x32块/32x64块级别禁用双树结构。
c.在一个示例中,当在区域中使用IBC时,色度编解码树结构可以与亮度编解码树结构对齐
i.在一个示例中,区域可以是序列/图片/片/砖块/CTU/VPDU/32x32块/64x32块/32x64块。
ii.在一个示例中,当并置亮度块被划分为子块时,如果色度块被允许划分,则它可以被划分为子块。
iii.在一个示例中,是否以及如何划分色度块可以从其并置亮度块的编解码结构推断。
iv.在一个示例中,当从亮度编解码树结构推断色度编解码树结构时,可以跳过对色度编解码树结构进行编解码的信号。
v.在一个示例中,标志可以用于指示是否可以从亮度编解码结构推断色度编解码结构。标志的信令通知可以取决于
1.在SPS/VPS/PPS/图片头/条带头/片组头/LCU行/LCU组/LCU/CU/视频数据单元中信令通知的消息。
2.先前编解码图片/片/条带/重构区域中的IBC/帧间模式的哈希命中率
3.当前CTU和/或其邻近CTU的块大小
4.当前CTU和/或其邻近CTU的块形状
5.当前CTU和/或其邻近CTU的当前量化参数
6.色彩格式的指示(诸如4:2:0、4:4:4)
7.先前条带/片/LCU/LCU行/LCU组/视频数据单元的编解码树结构类型
8.条带/片组类型和/或图片类型
9.时域层ID
14.是否启用调色板编解码模式可以取决于编解码树结构类型。
a.在一个示例中,对于给定的编解码树结构类型(例如,双树),可以跳过并推断调色板编解码模式的指示的信令通知。
b.在一个示例中,当应用双编解码树结构类型时,调色板编解码模式的指示可以被推断为假。
c.在一个示例中,当应用双编解码树结构类型时,亮度块的调色板编解码模式的指示可以被推断为假。
d.在一个示例中,当应用双编解码树结构类型时,色度块的调色板编解码模式的指示可以被推断为假。
e.在一个示例中,调色板编解码模式的指示可以基于以下来推断
i.在SPS/VPS/PPS/图片头/条带头/片组头/LCU行/LCU组/LCU/CU/视频数据单元中信令通知的消息。
ii.先前编解码图片/片/条带/重构区域中的IBC/帧间模式的哈希命中率
iii.当前CTU和/或其邻近CTU的块大小
iv.当前CTU和/或其邻近CTU的块形状
v.当前CTU和/或其邻近CTU的当前量化参数
vi.色彩格式的指示(诸如4:2:0、4:4:4)
vii.先前条带/片/LCU/LCU行/LCU组/视频数据单元的编解码树结构类型
viii.条带/片组类型和/或图片类型
ix.时域层ID
15.编解码树结构可以取决于是否使用调色板编解码模式。
a.在一个示例中,当在区域中使用调色板编解码模式时,色度编解码树结构可以与亮度编解码树结构对齐
i.在一个示例中,区域可以是序列/图片/片/砖块/CTU/VPDU/32x32块/64x32块
ii.在一个示例中,当并置亮度块被划分为子块时,如果色度块被允许划分,则它可以被划分为子块。
iii.在一个示例中,是否以及如何划分色度块可以从其并置亮度块的编解码结构推断。
iv.在一个示例中,当从亮度编解码树结构推断色度编解码树结构时,可以跳过对色度编解码树结构进行编解码的信号。
v.在一个示例中,标志可以用于指示是否可以从亮度编解码结构推断色度编解码结构。标志的信令通知可以取决于
1.在SPS/VPS/PPS/图片头/条带头/片组头/LCU行/LCU组/LCU/CU/视频数据单元中信令通知的消息。
2.先前编解码图片/片/条带/重构区域中的IBC/帧间模式的哈希命中率
3.当前CTU和/或其邻近CTU的块大小
4.当前CTU和/或其邻近CTU的块形状
5.当前CTU和/或其邻近CTU的当前量化参数
6.色彩格式的指示(诸如4:2:0、4:4:4)
7.先前条带/片/LCU/LCU行/LCU组/视频数据单元的编解码树结构类型
8.条带/片组类型和/或图片类型
9.时域层ID
16.色度IBC编解码块中的子块/样点的运动/块矢量可以从并置亮度块内的第一可用IBC编解码子区域推导。
a.在一个示例中,可以定义并置亮度块内的子区域的扫描顺序,诸如光栅扫描顺序。
b.在一个示例中,子区域可以被定义为最小编解码单元/最小变换单元。
c.在一个示例中,色度IBC模式下的整体样点的运动/块矢量可以基于并置亮度块中在IBC或帧间模式下编解码的最左顶部样点的运动矢量来推导。
17.运动/块矢量可以在色度IBC模式下被信令通知。
a.在一个示例中,可以信令通知运动矢量和运动矢量预测值之间的差。
i.在一个示例中,运动矢量预测值可以基于并置亮度块、并置亮度块的邻近亮度块、当前色度块的邻近色度块的运动矢量来推导。
1.在一个示例中,运动/块矢量预测值可以基于并置亮度块中的左顶部样点的运动矢量来推导。
2.在一个示例中,运动/块矢量预测值可以基于并置亮度块中具有中心位置的样点的运动矢量来推导。
3.在一个示例中,运动/块矢量预测值可以基于并置亮度块中在IBC或帧间模式下编解码的最左顶部样点的运动矢量来推导。
ii.在一个示例中,与亮度分量的一个子区域相关联的运动矢量预测值可以在用作预测值之前被缩放。
iii.在一个示例中,块矢量可以从邻近(相邻或非相邻)色度块的运动矢量/块矢量推导。
b.在一个示例中,可以构建块矢量候选列表,并且可以信令通知列表的索引。
i.在一个示例中,候选列表可以包括来自并置亮度块、并置亮度块的邻近亮度块、邻近色度块的运动矢量/块矢量。
c.在一个示例中,可以推断AMVR标志的指示
i.在一个示例中,AMVR标志的指示可以在色度IBC模式下编解码的块中被推断为假(0)
ii.在一个示例中,运动矢量差的指示可以在色度IBC模式下编解码的块中被推断为整数精度
d.在一个示例中,可以在色度IBC模式上使用单独的HMVP表。
i.在一个示例中,色度HMVP表和亮度HMVP表的尺寸可以不同。
e.在一个示例中,是否在色度IBC模式下信令通知块/运动矢量可以基于
i.是否以IBC模式对并置亮度块内的所有子区域进行编解码。
1.如果是,则不需要信令通知色度块的块矢量。
否则,可以信令通知色度块的块矢量。
ii.是否以IBC模式对并置亮度块内的所有子区域进行编解码以及所有相关联的块矢量是否有效。
1.如果是,则不需要信令通知色度块的块矢量。
否则,可以信令通知色度块的块矢量。
iii.在SPS/VPS/PPS/图片头/条带头/片组头/LCU行/LCU组/LCU/CU/视频数据单元中信令通知的消息。
iv.先前编解码图片/片/条带/重构区域中的IBC/帧间模式的哈希命中率
v.当前CTU和/或其邻近CTU的块大小
vi.当前CTU和/或其邻近CTU的块形状
vii.当前CTU和/或其邻近CTU的当前量化参数
viii.色彩格式的指示(诸如4:2:0、4:4:4)
ix.先前条带/片/LCU/LCU行/LCU组/视频数据单元的编解码树结构类型
x.条带/片组类型和/或图片类型
xi.时域层ID
18.单树和单独/双树选择/信令通知可以在CTU/CTB以下的级别上
a.在一个示例中,单树和单独/双树选择/信令通知可以在VPDU级别上。
b.在一个示例中,单树和单独/双树选择/信令通知可以在显式分割树信令通知开始的级别上。
上面描述的示例可以并入在下面描述的方法(例如,方法900、910、920、930和940)的上下文,其可以在视频解码器或视频编码器处实施。
一种用于视频处理的示例性方法包括执行当前视频块和包括当前视频块的视频的比特流表示之间的转换,其中该转换基于被包括在比特流表示中的指示符来选择性地使用变换跳过模式用于转换,并且其中使用变换跳过模式,当前视频块的预测误差的残差被表示在比特流表示中,而不应用变换。
在一些实施例中,指示符是变换跳过模式的最大允许宽度和最大允许高度。
在一些实施例中,最大允许宽度和高度在序列参数集(SPS)、视频参数集(VPS)、图片参数集(PPS)、图片头、条带头、片组头、最大编解码单元(LCU)行或LCU组中被信令通知。
在一些实施例中,最大允许宽度和高度在不同的消息中被信令通知。
在一些实施例中,最大允许宽度和高度在序列参数集(SPS)或图片参数集(PPS)中被信令通知,并且其中最大允许宽度和高度的更新值在图片头、条带头、片组头、最大编解码单元(LCU)行或LCU组中被信令通知。
图9A示出了用于视频处理的另一示例性方法的流程图。方法900包括,在步骤902,确定当前视频块使用变换跳过模式进行编解码。
方法900包括,在步骤904,基于该确定,执行当前视频块和包括当前视频块的视频的比特流表示之间的转换。
在一些实施例中,当前视频块被划分为多个系数组,并且比特流表示省略多个系数组中的至少一个的编解码块标志的信令。在示例中,比特流表示省略多个系数组中的每一个的编解码块标志的信令。
在一些实施例中,在比特流表示中的信令中省略的编解码块标志是基于以下中的一个或多个来推断的:(1)在序列参数集(SPS)、视频参数集(VPS)、图片参数集(PPS)、图片头、条带头、片组头、最大编解码单元(LCU)、LCU行、LCU组或编解码单元(CU)中信令通知的消息,(2)多个系数组中的至少一个的位置,(3)当前视频块或当前视频块的至少一个邻近块的块大小,(4)当前视频块或至少一个邻近块的块形状,(5)当前视频块或至少一个邻近块的最可能模式,(6)至少一个邻近块的预测模式,(7)至少一个邻近块的帧内预测模式,(8)至少一个邻近块的一个或多个运动矢量,(9)至少一个邻近块的量化残余块差分脉冲编解码调制(QR-BDPCM)模式的指示,(10)当前视频块或至少一个邻近块的当前量化参数(QP),(11)当前视频块的色彩格式的指示,(12)与当前视频块相关联的单独编解码树结构或双编解码树结构,或者(13)当前视频块的条带类型、片组类型或图片类型。
在一些实施例中,当前视频块被划分为多个系数组,并且方法900还包括确定多个系数组的系数扫描顺序的步骤。在示例中,系数扫描顺序基于在序列参数集(SPS)、视频参数集(VPS)、图片参数集(PPS)、图片头、条带头、片组头、最大编解码单元(LCU)、LCU行、LCU组或编解码单元(CU)中信令通知的消息。
在一些实施例中,多个系数组或系数扫描顺序基于当前视频块的帧内预测模式。在示例中,系数扫描顺序为垂直,并且其中帧内预测模式是水平主导的。在另一示例中,系数扫描顺序为水平,并且其中帧内预测模式是水平主导的。例如,帧内预测模式的索引的范围从2到33或者从2到34。
在一些实施例中,多个系数组或系数扫描顺序基于当前视频块的帧内预测模式。在示例中,系数扫描顺序为垂直,并且其中帧内预测模式是垂直主导的。在另一示例中,系数扫描顺序为水平,并且其中帧内预测模式是垂直主导的。例如,帧内预测模式的索引的范围从34到66或者从35到66。
在一些实施例中,符号标志的上下文基于与当前视频块相关联的系数块中的邻近信息。在示例中,符号标志的上下文进一步基于系数块的系数的位置。在另一示例中,符号标志的上下文基于(x+y)、min(x,y)或max(x,y),其中x和y分别是系数的位置的水平值和垂直值。
图9B示出了用于视频处理的又一示例性方法的流程图。方法910包括,在步骤912,对于当前视频块,确定色度变换跳过模式是适用的。
方法910包括,在步骤914,基于该确定,执行当前视频块和包括当前视频块的视频的比特流表示之间的转换。
在一些实施例中,该确定基于在序列参数集(SPS)、视频参数集(VPS)、图片参数集(PPS)、图片头、条带头、片组头、最大编解码单元(LCU)、LCU行、LCU组、编解码单元(CU)或视频数据单元中信令通知的消息。
在一些实施例中,该确定基于来自在执行转换之前解码的一个或多个代表性视频块的解码信息,并且其中一个或多个代表性视频块和当前视频块中的每一个中的样点基于公共色彩信息。在示例中,一个或多个代表性视频块包括亮度块或色度块。在另一示例中,一个或多个代表性视频块包括并置亮度块内的块。
图9C示出了用于视频处理的又一示例性方法的流程图。方法920包括在步骤922,在当前视频块和包括当前视频块的视频的比特流表示之间的转换期间,基于条件做出关于对当前视频块选择性应用变换跳过模式的决定。
方法920包括,在步骤924,基于该决定来执行转换。
在一些实施例中,该条件基于在序列参数集(SPS)、视频参数集(VPS)、图片参数集(PPS)、图片头、条带头、片组头、最大编解码单元(LCU)、LCU行、LCU组、编解码单元(CU)或视频数据单元中信令通知的消息。
在一些实施例中,该条件基于以下中的一个或多个:(1)当前视频块或当前视频块的至少一个邻近块的块大小,(2)当前视频块或至少一个邻近块的块形状,(3)当前视频块或至少一个邻近块的最可能模式,(4)至少一个邻近块的预测模式,(5)至少一个邻近块的帧内预测模式,(6)至少一个邻近块的一个或多个运动矢量,(7)至少一个邻近块的量化残余块差分脉冲编解码调制(QR-BDPCM)模式的指示,(8)当前视频块或至少一个邻近块的当前量化参数(QP),(9)当前视频块的色彩格式的指示,(10)与当前视频块相关联的单独编解码树结构或双编解码树结构,(11)当前视频块的条带类型、片组类型或图片类型,或者(12)时域层标识(ID)。
在一些实施例中,变换跳过模式的应用被执行,当前视频块的预测模式是帧间块复制(IBC)模式,并且当前视频块的宽度或高度与阈值进行比较。在示例中,阈值在比特流表示中被信令通知。在另一示例中,阈值为4、8、16或32。
在又一示例中,阈值基于以下中的一个或多个:(1)在序列参数集(SPS)、视频参数集(VPS)、图片参数集(PPS)、图片头、条带头、片组头、最大编解码单元(LCU)、LCU行、LCU组或编解码单元(CU)中信令通知的消息,(2)时域层标识(ID),(3)当前视频块或当前视频块的至少一个邻近块的块大小,(4)当前视频块或至少一个邻近块的块形状,(5)当前视频块或至少一个邻近块的最可能模式,(6)至少一个邻近块的预测模式,(7)至少一个邻近块的帧内预测模式,(8)至少一个邻近块的一个或多个运动矢量,(9)至少一个邻近块的量化残余块差分脉冲编解码调制(QR-BDPCM)模式的指示,(10)当前视频块或至少一个邻近块的当前量化参数(QP),(11)当前视频块的色彩格式的指示,(12)与当前视频块相关联的单独编解码树结构或双编解码树结构,或者(13)当前视频块的条带类型、片组类型或图片类型。
图9D示出了用于视频处理的又一示例性方法的流程图。方法930包括,在步骤932,在当前视频块和包括当前视频块的视频的比特流表示之间的转换期间,基于比特流表示中的变换跳过模式的指示,做出关于量化残差块差分脉冲编解码调制(QR-BDPCM)的选择性应用的决定。
方法930包括,在步骤934,基于该决定来执行转换。
在一些实施例中,变换跳过模式的指示在变换单元(TU)级别上被信令通知。
图9E示出了用于视频处理的又一示例性方法的流程图。方法940包括,在步骤942,在当前视频块和包括当前视频块的视频的比特流表示之间的转换期间,基于条件做出关于单独树或双树的选择性应用的决定。
方法940包括,在步骤944,基于该决定来执行转换。
在一些实施例中,该条件基于在序列参数集(SPS)、视频参数集(VPS)、图片参数集(PPS)、图片头、条带头、片组头、最大编解码单元(LCU)、LCU行、LCU组、编解码单元(CU)或视频数据单元中信令通知的消息。
在一些实施例中,该条件基于确定包括当前视频块的条带、片、最大编解码单元(LCU)、LCU行、LCU组或视频数据单元是否是屏幕内容。在示例中,该确定基于以下中的一个或多个:(1)在序列参数集(SPS)、视频参数集(VPS)、图片参数集(PPS)、图片头、条带头、片组头、LCU、LCU行、LCU组、编解码单元(CU)或视频数据单元中信令通知的消息,(2)当前视频块或当前视频块的至少一个邻近块的块大小,(3)当前视频块或至少一个邻近块的块形状,(4)当前视频块或至少一个邻近块的当前量化参数(QP),(5)当前视频块的色彩格式的指示,(6)与当前视频块相关联的单独编解码树结构或双编解码树结构,(7)当前视频块的条带类型、片组类型或图片类型,或者(8)时域层标识(ID)。
图10是视频处理装置1000的框图。装置1000可以用于实施本文描述的一个或多个方法。装置1000可以体现在智能手机、平板电脑、计算机、物联网(IoT)接收器等中。装置1000可以包括一个或多个处理器1002、一个或多个存储器1004和视频处理硬件1006。(多个)处理器1002可以被配置为实施本文档中描述的一种或多种方法(包括但不限于方法900、910、920、930和940)。存储器(多个存储器)1004可以用于存储用于实施本文描述的方法和技术的数据和代码。视频处理硬件1006可以用于在硬件电路系统中实施本文档中描述的一些技术。
在一些实施例中,视频编解码方法可以使用如参考图10所述的在硬件平台上实施的装置来实施。
在一些实施例中,例如,如以上项5和项10及以下所述,视频处理的方法包括基于对应于当前视频块的编解码树结构的类型,做出关于帧内块复制模式是否适用于视频的当前视频块和比特流表示之间的转换的确定;以及基于该确定来执行转换。
在以上方法中,比特流表示排除帧内块复制模式的指示。换句话说,比特流不携带IBC模式的显式信令。
在以上方法中,编解码树结构的类型是双编解码树结构,并且该确定是帧内块复制模式不适用。
图11是所公开的技术可以被实施的示例视频处理系统的框图。各种实施方式可以包括系统1100的一些或所有组件。系统1100可以包括用于接收视频内容的输入1102。视频内容可以以例如8或10比特多分量像素值的原始或未压缩格式而接收,或者可以是压缩或编码格式。输入1102可以表示网络接口、外围总线接口或存储接口。网络接口的示例包括诸如以太网、无源光网络(PON)等的有线接口和诸如Wi-Fi或蜂窝接口的无线接口。
系统1100可以包括可以实施本文档中描述的各种编解码或编码方法的编解码组件1104。编解码组件1104可以将来自输入1102的视频的平均比特率减小到编解码组件1104的输出,以产生视频的编解码表示。编解码技术因此有时被称为视频压缩或视频转码技术。编解码组件1104的输出可以被存储,或者经由如由组件1106表示的通信连接而发送。在输入1102处接收的视频的存储或通信传送的比特流(或编解码)表示可以由组件1108用于生成像素值或传送到显示接口1110的可显示视频。从比特流表示生成用户可视视频的过程有时被称为视频解压缩。此外,虽然特定视频处理操作被称为“编解码”操作或工具,但是将理解,编解码工具或操作在编码器处被使用,并且反转编解码结果的对应的解码工具或操作将由解码器执行。
外围总线接口或显示接口的示例可以包括通用串行总线(USB)、或高清晰度多媒体接口(HDMI)、或显示端口(Displayport)等。存储接口的示例包括SATA(串行高级技术附件)、PCI、IDE接口等。本文档中描述的技术可以体现在各种电子设备中,诸如移动电话、膝上型电脑、智能电话、或能够执行数字数据处理和/或视频显示的其他设备。
图12是可视媒体处理方法的示例的流程图。结合本文档的第4节中讨论的示例实施例7讨论该流程图的步骤。在步骤1202,该过程识别使用编解码模式和/或帧内预测模式和/或可允许帧内预测模式集合用于将可视媒体数据的视频区域中的当前视频块编码为可视媒体数据的比特流表示。在步骤1204,该过程在识别出使用时,做出在比特流表示中包括还是排除指示选择性地将变换跳过模式应用于当前视频块的语法元素的决定,其中在变换跳过模式下,当前视频块和参考视频块之间的预测误差的残差被表示在可视媒体数据的比特流表示中,而不应用变换。
图13是可视媒体处理方法的示例的流程图。结合本文档的第4节中讨论的示例实施例7讨论该流程图的步骤。在步骤1302,该过程识别使用编解码模式和/或帧内预测模式和/或可允许帧内预测模式集合用于从可视媒体数据的比特流表示解码可视媒体数据的视频区域中的当前视频块。在步骤1304,该过程在识别出使用时,做出在比特流表示中包括还是排除指示选择性地将变换跳过模式应用于当前视频块的语法元素的决定,其中在变换跳过模式下,当前视频块和参考视频块之间的预测误差的残差被表示在可视媒体数据的比特流表示中,而不应用变换。
图14是可视媒体处理方法的示例的流程图。结合本文档的第4节中讨论的示例实施例7讨论该流程图的步骤。在步骤1402,该过程识别使用编解码模式和/或帧内预测模式和/或可允许帧内预测模式集合用于从可视媒体数据的比特流表示解码可视媒体数据的视频区域中的当前视频块。在步骤1404,该过程在识别出使用时,做出在比特流表示中包括还是排除指示选择性地将变换跳过模式应用于当前视频块的语法元素的决定,其中在变换跳过模式下,当前视频块和预测视频块之间的残差被表示在可视媒体数据的比特流表示中,而不应用变换。
图15是可视媒体处理方法的示例的流程图。结合本文档的第4节中讨论的示例实施例9d讨论该流程图的步骤。在步骤1502,该过程为了将可视媒体数据的视频区域中的当前视频块编码为可视媒体数据的比特流表示,做出关于至少基于确定双树编解码结构被启用或至少从确定双树编解码结构被启用而推断的单树编解码结构或双树编解码结构的选择性应用的决定。在步骤1504,该过程在比特流表示中包括指示单树或双树的选择性应用的语法元素。
图16是可视媒体处理方法的示例的流程图。结合本文档的第4节中讨论的示例实施例9d讨论该流程图的步骤。在步骤1602,该过程从包括包含当前视频块的视频区域的可视媒体数据的比特流表示解析语法元素,其中语法元素指示至少基于确定双树编解码结构被启用或至少从确定双树编解码结构被启用而推断的单树编解码结构或双树编解码结构的选择性应用。在步骤1604,该过程通过根据语法元素解码当前视频块,从比特流表示生成解码的视频区域。
图17是可视媒体处理方法的示例的流程图。结合本文档的第4节中讨论的示例实施例16讨论该流程图的步骤。在步骤1702,该过程为可视媒体数据的当前视频块和可视媒体的比特流表示之间的转换确定帧内块复制(IBC)模式被应用于当前视频块的色度分量。在步骤1704,该过程使用当前视频块的并置亮度块内的IBC编解码子区域中包括的首先可用样点来推导与当前视频块的子块相关联的运动信息。
图18是可视媒体处理方法的示例的流程图。结合本文档的第4节中讨论的示例实施例17讨论该流程图的步骤。在步骤1802,该过程为可视媒体数据的当前视频块和可视媒体的比特流表示之间的转换确定帧内块复制(IBC)模式被应用于当前视频块。在步骤1804,该过程在比特流表示中包括指示与当前视频块相关联的运动信息的语法元素。
图19是可视媒体处理方法的示例的流程图。结合本文档的第4节中讨论的示例实施例17e讨论该流程图的步骤。在步骤1902,该过程为可视媒体数据的当前视频块和可视媒体的比特流表示之间的转换确定帧内块复制(IBC)模式被应用于当前视频块。在步骤1904,该过程至少基于一个或多个条件,确定在比特流表示中选择性地包括还是排除指示与当前视频块相关联的运动信息的语法元素。
本文档的一些实施例现在以基于条款的格式呈现。
1.一种用于可视媒体编码的方法,包括:
为了将可视媒体数据的视频区域中的当前视频块编码为可视媒体数据的比特流表示,识别编解码模式和/或帧内预测模式和/或可允许帧内预测模式集合的使用;以及
在识别出使用时,做出在比特流表示中包括还是排除指示选择性地将变换跳过模式应用于当前视频块的语法元素的决定,其中在变换跳过模式下,当前视频块和参考视频块之间的预测误差的残差被表示在可视媒体数据的比特流表示中,而不应用变换。
2.一种用于可视媒体解码的方法,包括:
为了从可视媒体数据的比特流表示解码可视媒体数据的视频区域中的当前视频块,识别编解码模式和/或帧内预测模式和/或可允许帧内预测模式集合的使用;以及
在识别出使用时,做出在比特流表示中包括还是排除指示选择性地将变换跳过模式应用于当前视频块的语法元素的决定,其中在变换跳过模式下,当前视频块和参考视频块之间的预测误差的残差被表示在可视媒体数据的比特流表示中,而不应用变换。
3.根据条款1-2中任一项或多项所述的方法,其中,可允许帧内预测模式集合对应于当前视频块上在量化残差块差分脉冲编解码调制(QR-BDPCM)技术中使用的帧内模式集合,并且其中在QR-BDPCM技术中,当前视频块的帧内预测的量化残差和量化残差的预测之间的差使用差分脉冲编解码调制(DPCM)被表示在当前视频块的比特流表示中。
4.根据条款1-2中任一项或多项所述的方法,其中,如果编解码模式属于在QR-BDPCM技术中使用的多种编解码模式之一,则语法元素从比特流表示中排除,并且其中在QR-BDPCM技术中,当前视频块的帧内预测的量化残差和量化残差的预测之间的差使用差分脉冲编解码调制(DPCM)被表示在当前视频块的比特流表示中。
5.根据条款1-2中任一项或多项所述的方法,其中,如果帧内预测模式属于当前视频块上在QR-BDPCM技术中使用的帧内模式集合,则语法元素从比特流表示中排除,并且其中在QR-BDPCM技术中,当前视频块的帧内预测的量化残差和量化残差的预测之间的差使用差分脉冲编解码调制(DPCM)被表示在当前视频块的比特流表示中。
6.根据条款1-2中任一项或多项所述的方法,其中,响应于确定QR-BDPCM技术被应用于当前视频块,语法元素从比特流表示中排除并且变换跳过模式被推断为应用,并且其中在QR-BDPCM技术中,当前视频块的帧内预测的量化残差和量化残差的预测之间的差使用差分脉冲编解码调制(DPCM)被表示在当前视频块的比特流表示中。
7.根据条款1-6中任一项或多项所述的方法,其中,选择性地应用或跳过变换跳过模式还基于以下中的一个或多个:
(1)在序列参数集(SPS)、视频参数集(VPS)、图片参数集(PPS)、图片头、条带头、片组头、最大编解码单元(LCU)、LCU行、LCU组或编解码单元(CU)中信令通知的消息,
(2)当前视频块或当前视频块的至少一个邻近块的块大小,
(3)当前视频块或至少一个邻近块的块形状,
(4)当前视频块或至少一个邻近块的最可能模式,
(5)至少一个邻近块的预测模式,
(6)至少一个邻近块的帧内预测模式,
(7)至少一个邻近块的一个或多个运动矢量,
(8)至少一个邻近块的QR-BDPCM技术的指示,
(9)当前视频块或至少一个邻近块的当前量化参数(QP),
(10)当前视频块的色彩格式的指示,
(11)与当前视频块相关联的单独编解码树结构或双编解码树结构
(12)当前视频块的条带类型、片组类型或图片类型,或者
(13)时域层ID。
8.一种用于可视媒体解码的方法,包括:
为了从可视媒体数据的比特流表示解码可视媒体数据的视频区域中的当前视频块,识别编解码模式和/或帧内预测模式和/或可允许帧内预测模式集合的使用;以及
在识别出使用时,做出在比特流表示中包括还是排除指示选择性地将变换跳过模式应用于当前视频块的语法元素的决定,其中在变换跳过模式下,当前视频块和预测视频块之间的残差被表示在可视媒体数据的比特流表示中,而不应用变换。
9.一种用于可视媒体编码的方法,包括:
为了将可视媒体数据的视频区域中的当前视频块编码为可视媒体数据的比特流表示,做出关于至少基于确定双树编解码结构被启用或至少从确定双树编解码结构被启用而推断的单树编解码结构或双树编解码结构的选择性应用的决定;以及
在比特流表示中包括指示单树或双树的选择性应用的语法元素。
10.一种用于可视媒体解码的方法,包括:
从包括包含当前视频块的视频区域的可视媒体数据的比特流表示解析语法元素,其中语法元素指示至少基于确定双树编解码结构被启用或至少从确定双树编解码结构被启用而推断的单树编解码结构或双树编解码结构的选择性应用;以及
通过根据语法元素解码当前视频块,从比特流表示生成解码的视频区域。
11.根据条款9-10中任一项或多项所述的方法,其中,双树编解码结构与第一视频级别相关联,并且语法元素与第二视频级别相关联,还包括:
在确定与第一视频级别相关联的双树编解码结构被禁用时,将与第二视频级别相关联的语法元素推断为布尔假。
12.根据条款11所述的方法,其中,语法元素被包括在比特流表示中。
13.根据条款11-12中任一项或多项所述的方法,其中,第二视频级别低于第一视频级别。
14.根据条款11-12中任一项或多项所述的方法,其中,第二视频级别是编解码树单元(CTU)级别,并且第一视频级别是序列/条带/片/砖块级别。
15.根据条款9-10中任一项或多项所述的方法,其中,语法元素与编解码树单元(CTU)级别相关联,还包括:
至少基于标志为布尔真,在比特流表示中包括语法元素。
16.根据条款15所述的方法,其中,标志在高于CTU级别的级别。
17.根据条款9-10中任一项或多项所述的方法,其中,语法元素与编解码树单元(CTU)级别相关联,还包括:
在确定高于CTU级别的级别的标志为布尔假时,将比特流表示中的语法元素推断为布尔假。
18.根据条款9-10中任一项或多项所述的方法,其中,语法元素在编解码树单元(CTU)级别以下的级别。
19.根据条款18所述的方法,其中,语法元素在虚拟流水线数据单元(VPDU)级别。
20.根据条款18所述的方法,其中,语法元素在与分割树的信令级别相对应的级别。
21.一种用于可视媒体处理的方法,包括:
为可视媒体数据的当前视频块和可视媒体的比特流表示之间的转换确定帧内块复制(IBC)模式被应用于当前视频块的色度分量;以及
使用当前视频块的并置亮度块内的IBC编解码子区域中包括的首先可用样点来推导与当前视频块的子块相关联的运动信息。
22.根据条款21所述的方法,其中,并置亮度块内的IBC编解码子区域根据顺序来扫描。
23.根据条款22所述的方法,其中,顺序是光栅扫描顺序。
24.根据条款21所述的方法,其中,运动信息是子块或子样点的运动矢量或块矢量。
25.根据条款21所述的方法,其中,IBC编解码子区域的尺寸对应于最小编解码单元的尺寸。
26.根据条款21所述的方法,其中,IBC编解码子区域的尺寸对应于最小变换单元的尺寸。
27.根据条款22所述的方法,其中,首先可用样点包括并置亮度块的左顶部样点,其中左顶部样点是IBC编解码样点。
28.根据条款22所述的方法,其中,首先可用样点包括并置亮度块的左顶部样点,其中左顶部样点是帧间模式编解码样点。
29.根据条款21-28中任一项或多项的方法,其中,转换包括从当前视频块生成比特流表示。
30.根据条款21-28中任一项或多项的方法,其中,转换包括从比特流表示生成当前视频块的像素值。
31.一种用于可视媒体处理的方法,包括:
为可视媒体数据的当前视频块和可视媒体的比特流表示之间的转换确定帧内块复制(IBC)模式被应用于当前视频块;以及
在比特流表示中包括指示与当前视频块相关联的运动信息的语法元素。
32.根据条款31所述的方法,其中,语法元素对应于与当前视频块相关联的运动信息和运动信息预测值之间的差。
33.根据条款32所述的方法,其中,运动信息预测值使用并置亮度块、并置亮度块的一个或多个邻近块或者当前视频块的邻近色度块中包括的样点的运动信息来计算。
34.根据条款32所述的方法,其中,并置亮度块中包括的样点是并置亮度块的左顶部样点。
35.根据条款32所述的方法,其中,并置亮度块中包括的样点是并置亮度块的中心样点。
36.根据条款34所述的方法,其中,并置亮度块的左顶部样点是IBC编解码样点。
37.根据条款34所述的方法,其中,并置亮度块的左顶部样点是帧间模式编解码样点。
38.根据条款33所述的方法,其中,运动信息预测值与并置亮度块的子区域相关联,并且其中运动信息预测值在用于当前视频块之前被缩放。
39.根据条款33所述的方法,其中,邻近色度块是当前视频块的相邻或非相邻的邻居。
40.根据条款31所述的方法,其中,与当前视频块相关联的运动信息被包括在候选运动矢量列表中,并且其中比特流表示中包括的语法元素对应于指向候选运动矢量列表的索引。
41.根据条款31所述的方法,其中,候选运动矢量列表包括以下之一中包括的样点的运动信息:并置亮度块、并置亮度块的一个或多个邻近块、或当前视频块的邻近色度块。
42.根据条款32所述的方法,其中,使用自适应运动矢量分辨率(AMVR)技术的指示至少部分地基于解析比特流表示来推断。
43.根据条款42所述的方法,其中,当前视频块是色度、IBC编解码块,还包括:
使用该使用AMVR技术的指示来推断AMVR技术没有应用于当前视频块。
44.根据条款43所述的方法,其中,与当前视频块相关联的运动信息和运动信息预测值之间的差被推断为具有整数值精度。
45.根据条款31-44中任一项或多项所述的方法,其中,转换包括从当前视频块生成比特流表示。
46.根据条款31-44中任一项或多项所述的方法,其中,转换包括从比特流表示生成当前视频块的像素值。
47.一种用于可视媒体处理的方法,包括:
为可视媒体数据的当前视频块和可视媒体的比特流表示之间的转换确定帧内块复制(IBC)模式被应用于当前视频块;以及
至少基于一个或多个条件,确定在比特流表示中选择性地包括还是排除指示与当前视频块相关联的运动信息的语法元素。
48.根据条款47所述的方法,其中,一个或多个条件包括:
(1)当前视频块的并置亮度块内的子区域的IBC编解码模式,
(2)与当前视频块的并置亮度块内的IBC编解码子区域相关联的有效运动矢量,
(3)在序列参数集(SPS)、视频参数集(VPS)、图片参数集(PPS)、图片头、条带头、片组头、最大编解码单元(LCU)、LCU行、LCU组或编解码单元(CU)中信令通知的消息,
(4)与其他视频块相关联的编解码图片/片/条带/重构区域中的IBC模式和/或帧间模式的哈希命中率,
(5)当前视频块或当前视频块的至少一个邻近块的块大小,
(6)当前视频块或至少一个邻近块的块形状,
(7)当前视频块或至少一个邻近块的当前量化参数(QP),
(8)当前视频块的色彩格式的指示,
(9)与当前视频块相关联的单独编解码树结构或双编解码树结构
(10)当前视频块的条带类型、片组类型或图片类型,或者
(11)时域层ID。
49.根据条款48所述的方法,其中,响应于确定当前视频块的并置亮度块内的所有子区域是IBC编解码的,语法元素从比特流表示中排除。
50.根据条款48所述的方法,其中,响应于确定与当前视频块的并置亮度块内的所有IBC编解码子区域相关联的所有运动矢量有效,语法元素从比特流表示中排除。
51.根据条款47-48中任一项或多项所述的方法,其中,转换包括从当前视频块生成比特流表示。
52.根据条款47-48中任一项或多项所述的方法,其中,转换包括从比特流表示生成当前视频块的像素值。
53.一种视频编码器装置,包括被配置为实施根据条款1-52中任一项或多项所述的方法的处理器。
54.一种视频解码器装置,包括被配置为实施根据条款1-52中任一项或多项所述的方法的处理器。
55.一种存储有代码的计算机可读介质,该代码体现用于实施根据条款1-52中任一项或多项所述的方法的处理器可执行指令。
在本文档中,术语“视频处理”或“可视媒体处理”可以指视频编码、视频解码、视频压缩或视频解压缩。例如,视频压缩算法可以在从视频的像素表示到对应的比特流表示的转换期间被应用,反之亦然。当前视频块的比特流表示可以例如对应于比特流内并置的或分散在不同地方的比特,如通过语法定义的。例如,宏块可以根据变换和编解码误差残差值并且也使用比特流中的头和其它字段中的比特进行编码。此外,在转换期间,解码器可以基于该确定,在知道一些字段可能存在或不存在的情况下解析比特流,如以上解决方案所述。类似地,编码器可以确定是否包括特定语法字段,并通过从编解码表示中包括或排除语法字段来相应地生成编解码表示。
从前面可以理解,为了说明的目的,本文已经描述了当前公开的技术的特定实施例,但是在不脱离本发明的范围的情况下,可以进行各种修改。因此,当前公开的技术不受除了所附权利要求之外的限制。
本专利文档中描述的主题和功能操作的实施方式可以在各种系统、数字电子电路中被实施,或者在计算机软件、固件或硬件(包括本说明书中公开的结构及其结构等同物)中被实施,或者在它们中的一个或多个的组合中被实施。本说明书中描述的主题的实施方式可以被实施为一个或多个计算机程序产品,即编码在有形和非暂时性计算机可读介质上的计算机程序指令的一个或多个模块,该计算机程序指令用于由数据处理装置执行或控制数据处理装置的操作。计算机可读介质可以是机器可读存储设备、机器可读存储基板、存储器设备、影响机器可读传播信号的物质的组合、或它们中的一个或多个的组合。术语“数据处理单元”或“数据处理装置”包含用于处理数据的所有装置、设备和机器,包括例如可编程处理器、计算机、或多个处理器或计算机。除了硬件之外,装置还可以包括为所讨论的计算机程序创建执行环境的代码,例如,构成处理器固件、协议栈、数据库管理系统、操作系统、或它们中的一个或多个的组合的代码。
计算机程序(也已知为程序、软件、软件应用、脚本或代码)可以以任何形式的编程语言(包括编译或解释语言)编写,并且其可以以任何形式部署,包括作为独立程序或作为适合在计算环境中使用的模块、组件、子例程或其他单元。计算机程序不一定对应于文件系统中的文件。程序可以存储在保存其他程序或数据(例如,存储在标记语言文档中的一个或多个脚本)的文件的一部分中,存储在专用于所讨论的程序的单个文件中,或存储在多个协调文件中(例如,存储一个或多个模块、子程序或代码部分的文件)。计算机程序可以被部署以在一个计算机上或在位于一个站点上或跨多个站点分布并通过通信网络互连的多个计算机上执行。
本说明书中描述的过程和逻辑流程可以由执行一个或多个计算机程序的一个或多个可编程处理器执行,以通过对输入数据进行操作并生成输出来执行功能。过程和逻辑流程也可以由专用逻辑电路执行,并且装置也可以被实施为专用逻辑电路,例如,FPGA(现场可编程门阵列)或ASIC(专用集成电路)。
适合于执行计算机程序的处理器包括例如通用和专用微处理器、以及任何类型的数字计算机的任何一个或多个处理器。通常,处理器将从只读存储器或随机存取存储器或两者接收指令和数据。计算机的基本元件是用于执行指令的处理器和用于存储指令和数据的一个或多个存储器设备。通常,计算机还将包括用于存储数据的一个或多个大容量存储设备(例如,磁盘、磁光盘或光盘),或可操作地耦合以从该一个或多个大容量存储设备接收数据或向该一个或多个大容量存储设备传递数据、或者从其接收数据并向其传递数据。然而,计算机不需要这样的设备。适用于存储计算机程序指令和数据的计算机可读介质包括所有形式的非易失性存储器、介质和存储器设备,包括例如半导体存储器设备,例如EPROM、EEPROM和闪存设备。处理器和存储器可以由专用逻辑电路补充或并入专用逻辑电路中。
本说明书以及附图旨在被认为仅是示例性的,其中示例性意味着示例。如本文所使用的,单数形式“一个”、“一个”和“该”旨在也包括复数形式,除非上下文另外清楚地指示。此外,“或”的使用旨在包括“和/或”,除非上下文另外清楚地指示。
虽然本专利文档包含许多细节,但这些细节不应被解释为对任何发明或可能要求保护的范围的限制,而是作为特定于特定发明的特定实施例的特征的描述。在本专利文档中在单独的实施例的上下文中描述的某些特征也可以在单个实施例中组合实施。相反,在单个实施例的上下文中描述的各种特征也可以在多个实施例中分开实施或以任何合适的子组合实施。此外,尽管特征可以在上面描述为以某些组合起作用并且甚至最初如此要求保护,但是在一些情况下可以从组合排除来自所要求保护的组合的一个或多个特征,并且所要求保护的组合可以针对子组合或子组合的变化。
类似地,虽然在附图中以特定顺序描绘了操作,但是这不应该被理解为需要以所示的特定顺序或以先后顺序执行这样的操作或者执行所有示出的操作以实现期望的结果。此外,在本专利文档中描述的实施例中的各种系统组件的分离不应被理解为在所有实施例中都需要这样的分离。
仅描述了一些实施方式和示例,并且可以基于本专利文档中描述和示出的内容来进行其他实施方式、增强和变化。
5.所公开的技术的附加实施例
5.1双树相关实施例
提出的对JVET-N1001-v7提供的草案的改变如下呈现。要添加的文本以粗体、斜体字体示出。要删除的文本以粗体、大写字体示出。
5.1.1实施例#1
Figure BDA0003332960520000471
5.1.2实施例#2
7.3.2.3序列参数集RBSP语法
Figure BDA0003332960520000472
5.1.3实施例#3
7.3.5条带头语法
7.3.5.1通用条带头语法
Figure BDA0003332960520000481
等于1的sps_asdt_flag指定可以在当前序列上启用提出的方法。它等于0指定不能在当前序列上启用提出的方法。当sps_ASDT_flag不存在时,它被推断为等于0。
等于1的slice_asdt_flag指定可以在当前条带上启用提出的方法。它等于0指定不能在当前条带上启用提出的方法。当slice_ASDT_flag不存在时,它被推断为等于0。
7.3.7.2编解码树单元语法
Figure BDA0003332960520000482
等于1的ctu_dual_tree_intra_flag指定当前CTU采用双树编解码结构。它等于0指定当前CTU采用单树编解码结构。当ctu_dual_tree_intra_flag不存在时,它被推断为等于0。
5.1.4实施例#4
7.3.5条带头语法
7.3.5.1通用条带头语法
Figure BDA0003332960520000491
等于1的sps_asdt_flag指定可以在当前序列上启用提出的方法。它等于0指定不能在当前序列上启用提出的方法。当sps_ASDT_flag不存在时,它被推断为等于0。
等于1的slice_asdt_flag指定可以在当前条带上启用提出的方法。它等于0指定不能在当前条带上启用提出的方法。当slice_ASDT_flag不存在时,它被推断为等于0。
7.3.7.2编解码树单元语法
Figure BDA0003332960520000492
Figure BDA0003332960520000501
等于1的ctu_dual_tree_intra_flag指定当前CTU采用双树编解码结构。它等于0指定当前CTU采用单树编解码结构。当ctu_dual_tree_intra_flag不存在时,它被推断为等于0。
5.2IBC相关实施例
7.3.7.5编解码单元语法
Figure BDA0003332960520000502
8.6在IBC预测模式下编解码的编解码单元的解码过程
8.6.1在IBC预测模式下编解码的编解码单元的通用解码过程
该过程的输入是:
-亮度位置(xCb,yCb),指定当前编解码块相对于当前图片的左顶部亮度样点的左顶部样点,
-变量cbWidth,指定亮度样点中的当前编解码块的宽度,
-变量cbHeight,指定亮度样点中的当前编解码块的高度,
-变量treeType,指定使用单树还是双树,并且如果使用双树,则指定当前树对应于亮度分量还是色度分量。
该过程的输出是环路滤波之前的修改的重构图片。
如条款8.7.1所指定的量化参数的推导过程以亮度位置(xCb,yCb)、亮度样点中的当前编解码块的宽度cbWidth和亮度样点中的当前编解码块的高度cbHeight以及变量treeType作为输入来调用。
在ibc预测模式下编解码的编解码单元的解码过程由以下有序步骤组成:
1.当前编解码单元的运动矢量分量被推导如下:
1.如果treeType等于SINGLE_TREE或DUAL_TREE_LUMA,则以下适用:
-如条款8.6.2.1所指定的运动矢量分量的推导过程以亮度编解码块位置(xCb,yCb)、亮度编解码块宽度cbWidth和亮度编解码块高度cbHeight作为输入以及亮度运动矢量mvL[0][0]作为输出来调用。
-当treeType等于SINGLE_TREE时,条款8.6.2.5中的色度运动矢量的推导过程以亮度运动矢量mvL[0][0]作为输入以及色度运动矢量mvC[0][0]作为输出来调用。
-水平方向上的亮度编解码子块的数量numSbX和垂直方向上的亮度编解码子块的数量numSbY都被设置为等于1。
1.否则,如果treeType等于DUAL_TREE_CHROMA,则以下适用:
-水平方向上的亮度编解码子块的数量numSbX和垂直方向上的亮度编解码子块的数量numSbY被推导如下:
numSbX=(cbWidth>>2) (8-871)
numSbY=(cbHeight>>2) (8-872)
-对于xSbIdx=0..numSbX-1,ySbIdx=0..numSbY-1,色度运动矢量mvC[xSbIdx][ySbIdx]被推导如下:
-亮度运动矢量mvL[xSbIdx][ySbIdx]被推导如下:
-并置亮度编解码单元的位置(xCuY,yCuY)被推导如下:
xCuY=xCb+xSbIdx*4(8-873)
yCuY=yCb+ySbIdx*4(8-874)
-如果CuPredMode[xCuY][yCuY]等于MODE_INTRA,则以下适用。
mvL[xSbIdx][ySbIdx][0]=0 (8-875)
mvL[xSbIdx][ySbIdx][1]=0 (8-876)
predFlagL0[xSbIdx][ySbIdx]=0 (8-877)
predFlagL1[xSbIdx][ySbIdx]=0 (8-878)
-否则(CuPredMode[xCuY][yCuY]等于MODE_IBC),以下适用:
mvL[xSbIdx][ySbIdx][0]=MvL0[xCuY][yCuY][0] (8-879)
mvL[xSbIdx][ySbIdx][1]=MvL0[xCuY][yCuY][1] (8-880)
predFlagL0[xSbIdx][ySbIdx]=1 (8-881)
predFlagL1[xSbIdx][ySbIdx]=0 (8-882)
-条款8.6.2.5中的色度运动矢量的推导过程以mvL[xSbIdx][ySbIdx]作为输入以及mvC[xSbIdx][ySbIdx]作为输出来调用。
-比特流一致性要求色度运动矢量mvC[xSbIdx][ySbIdx]应当遵守以下约束:
-当如条款6.4.X[Ed.(BB):Neighbouring blocks availability checkingprocess tbd]所指定的块可用性的推导过程以设置为等于(xCb/SubWidthC,yCb/SubHeightC)的当前色度位置(xCurr,yCurr)以及邻近色度位置(xCb/SubWidthC+(mvC[xSbIdx][ySbIdx][0]>>5),yCb/SubHeightC+(mvC[xSbIdx][ySbIdx][1]>>5))作为输入来调用时,输出应当等于TRUE。
-当如条款6.4.X[Ed.(BB):Neighbouring blocks availability checkingprocess tbd]所指定的块可用性的推导过程以设置为等于(xCb/SubWidthC,yCb/SubHeightC)的当前色度位置(xCurr,yCurr)以及邻近色度位置(xCb/SubWidthC+(mvC[xSbIdx][ySbIdx][0]>>5)+cbWidth/SubWidthC-1,yCb/SubHeightC+(mvC[xSbIdx][ySbIdx][1]>>5)+cbHeight/SubHeightC-1)作为输入来调用时,输出应当等于TRUE。
-以下条件中的一个或两个应当为TRUE:
-(mvC[xSbIdx][ySbIdx][0]>>5)+xSbIdx*2+2小于或等于0。
-(mvC[xSbIdx][ySbIdx][1]>>5)+ySbIdx*2+2小于等于0。
2.当前编解码单元的预测样点被推导如下:
-如果treeType等于SINGLE_TREE或DUAL_TREE_LUMA,则当前编解码单元的预测样点被推导如下:
·如条款8.6.3.1所指定的ibc块的解码过程以亮度编解码块位置(xCb,yCb)、亮度编解码块宽度cbWidth和亮度编解码块高度cbHeight、水平方向上的亮度编解码子块的数量numSbX和垂直方向上的亮度编解码子块的数量numSbY、亮度运动矢量mvL[xSbIdx][ySbIdx](其中,xSbIdx=0..numSbX-1,并且ySbIdx=0..numSbY-1)、设置为等于0的变量cIdx作为输入以及作为预测亮度样点的(cbWidth)x(cbHeight)阵列predSamplesL的ibc预测样点(predSamples)作为输出来调用。
-否则,如果treeType等于SINGLE_TREE或DUAL_TREE_CHROMA,则当前编解码单元的预测样点被推导如下:
·如条款8.6.3.1所指定的解码过程ibc块以亮度编解码块位置(xCb,yCb)、亮度编解码块宽度cbWidth和亮度编解码块高度cbHeight、水平方向上的亮度编解码子块的数量numSbX和垂直方向上的亮度编解码子块的数量numSbY、色度运动矢量mvC[xSbIdx][ySbIdx](其中,xSbIdx=0..numSbX-1,并且ySbIdx=0..numSbY-1)和设置为等于1的变量cIdx作为输入以及作为色度分量Cb的预测色度样点的(cbWidth/2)x(cbHeight/2)阵列predSamplesCb的ibc预测样点(predSamples)作为输出来调用。
·如条款8.6.3.1所指定的ibc块的解码过程以亮度编解码块位置(xCb,yCb)、亮度编解码块宽度cbWidth和亮度编解码块高度cbHeight、水平方向上的亮度编解码子块的数量numSbX和垂直方向上的亮度编解码子块的数量numSbY、色度运动矢量mvC[xSbIdx][ySbIdx](其中,xSbIdx=0..numSbX-1,并且ySbIdx=0..numSbY-1)和设置为等于2的变量cIdx作为输入以及作为色度分量Cr的预测色度样点的(cbWidth/2)x(cbHeight/2)阵列predSamplesCr的ibc预测样点(predSamples)作为输出来调用。
3.变量NumSbX[xCb][yCb]和NumSbY[xCb][yCb]分别被设置为等于numSbX和numSbY。
4.当前编解码单元的残差样点被推导如下:
-当treeType等于SINGLE_TREE或treeType等于DUAL_TREE_LUMA时,如条款8.5.8所指定的在帧间预测模式下编解码的编解码块的残差信号的解码过程以设置为等于亮度位置(xCb,yCb)的位置(xTb0,yTb0)、设置为等于亮度编解码块宽度cbWidth的宽度nTbW、设置为等于亮度编解码块高度cbHeight的高度nTbH和设置为等于0的变量cIdx作为输入以及阵列resSamplesL作为输出来调用。
-当treeType等于SINGLE_TREE或treeType等于DUAL_TREE_CHROMA时,如条款8.5.8所指定的在帧间预测模式下编解码的编解码块的残差信号的解码过程以设置为等于色度位置(xCb/2,yCb/2)的位置(xTb0,yTb0)、设置为等于色度编解码块宽度cbWidth/2的宽度nTbW、设置为等于色度编解码块高度cbHeight/2的高度nTbH和设置为等于1变量cIdx作为输入以及阵列resSamplesCb作为输出来调用。
-当treeType等于SINGLE_TREE或treeType等于DUAL_TREE_CHROMA时,如条款8.5.8所指定的在帧间预测模式下编解码的编解码块的残差信号的解码过程以设置为等于色度位置(xCb/2,yCb/2)的位置(xTb0,yTb0)、设置为等于色度编解码块宽度cbWidth/2的宽度nTbW、设置为等于色度编解码块高度cbHeight/2的高度nTbH和设置为等于2的变量cIdx作为输入以及阵列resSamplesCr作为输出来调用。
5.当前编解码单元的重构样点被推导如下:
-当treeType等于SINGLE_TREE或treeType等于DUAL_TREE_LUMA时,如条款8.7.5所指定的色彩分量的图片重构过程以设置为等于(xCb,yCb)的块位置(xB,yB)、设置为等于cbWidth的块宽度bWidth、设置为等于cbHeight的块高度bHeight、设置为等于0的变量cIdx、设置为等于predSamplesL的(cbWidth)x(cbHeight)阵列predSamples和设置为等于resSamplesL的(cbWidth)x(cbHeight)阵列resSamples作为输入来调用,并且输出是环路滤波之前的修改的重构图片。
-当treeType等于SINGLE_TREE或treeType等于DUAL_TREE_CHROMA时,如条款8.7.5所指定的色彩分量的图片重构过程以设置为等于(xCb/2,yCb/2)的块位置(xB,yB)、设置为等于cbWidth/2的块宽度bWidth、设置为等于cbHeight/2的块高度bHeight、设置为等于1的变量cIdx、设置为等于predSamplesCb的(cbWidth/2)x(cbHeight/2)阵列predSamples、设置为等于resSamplesCb的(cbWidth/2)x(cbHeight/2)阵列resSamples作为输入来调用,并且输出是环路滤波之前的修改的重构图片。
-当treeType等于SINGLE_TREE或treeType等于DUAL_TREE_CHROMA时,如条款8.7.5所指定的色彩分量的图片重构过程以设置为等于(xCb/2,yCb/2)的块位置(xB,yB)、设置为等于cbWidth/2的块宽度bWidth、设置为等于cbHeight/2的块高度bHeight、设置为等于2的变量cIdx、设置为等于predSamplesCr的(cbWidth/2)x(cbHeight/2)阵列predSamples、设置为等于resSamplesCr的(cbWidth/2)x(cbHeight/2)阵列resSamples作为输入来调用,并且输出是环路滤波之前的修改的重构图片。

Claims (55)

1.一种用于可视媒体编码的方法,包括:
为了将可视媒体数据的视频区域中的当前视频块编码为可视媒体数据的比特流表示,识别编解码模式和/或帧内预测模式和/或可允许帧内预测模式集合的使用;以及
在识别出使用时,做出在比特流表示中包括还是排除指示选择性地将变换跳过模式应用于当前视频块的语法元素的决定,其中在变换跳过模式下,当前视频块和参考视频块之间的预测误差的残差被表示在可视媒体数据的比特流表示中,而不应用变换。
2.一种用于可视媒体解码的方法,包括:
为了从可视媒体数据的比特流表示解码可视媒体数据的视频区域中的当前视频块,识别编解码模式和/或帧内预测模式和/或可允许帧内预测模式集合的使用;以及
在识别出使用时,做出在比特流表示中包括还是排除指示选择性地将变换跳过模式应用于当前视频块的语法元素的决定,其中在变换跳过模式下,当前视频块和参考视频块之间的预测误差的残差被表示在可视媒体数据的比特流表示中,而不应用变换。
3.根据权利要求1-2中任一项或多项所述的方法,其中,所述可允许帧内预测模式集合对应于当前视频块上在量化残差块差分脉冲编解码调制(QR-BDPCM)技术中使用的帧内模式集合,并且其中在QR-BDPCM技术中,当前视频块的帧内预测的量化残差和量化残差的预测之间的差使用差分脉冲编解码调制(DPCM)被表示在当前视频块的比特流表示中。
4.根据权利要求1-2中任一项或多项所述的方法,其中,如果编解码模式属于在QR-BDPCM技术中使用的多种编解码模式之一,则语法元素从比特流表示中排除,并且其中在QR-BDPCM技术中,当前视频块的帧内预测的量化残差和量化残差的预测之间的差使用差分脉冲编解码调制(DPCM)被表示在当前视频块的比特流表示中。
5.根据权利要求1-2中任一项或多项所述的方法,其中,如果帧内预测模式属于当前视频块上在QR-BDPCM技术中使用的帧内模式集合,则语法元素从比特流表示中排除,并且其中在QR-BDPCM技术中,当前视频块的帧内预测的量化残差和量化残差的预测之间的差使用差分脉冲编解码调制(DPCM)被表示在当前视频块的比特流表示中。
6.根据权利要求1-2中任一项或多项所述的方法,其中,响应于确定QR-BDPCM技术被应用于当前视频块,语法元素从比特流表示中排除并且变换跳过模式被推断为应用,并且其中在QR-BDPCM技术中,当前视频块的帧内预测的量化残差和量化残差的预测之间的差使用差分脉冲编解码调制(DPCM)被表示在当前视频块的比特流表示中。
7.根据权利要求1-6中任一项或多项所述的方法,其中,选择性地应用或跳过变换跳过模式还基于以下中的一个或多个:
(1)在序列参数集(SPS)、视频参数集(VPS)、图片参数集(PPS)、图片头、条带头、片组头、最大编解码单元(LCU)、LCU行、LCU组或编解码单元(CU)中信令通知的消息,
(2)当前视频块或当前视频块的至少一个邻近块的块大小,
(3)当前视频块或至少一个邻近块的块形状,
(4)当前视频块或至少一个邻近块的最可能模式,
(5)至少一个邻近块的预测模式,
(6)至少一个邻近块的帧内预测模式,
(7)至少一个邻近块的一个或多个运动矢量,
(8)至少一个邻近块的QR-BDPCM技术的指示,
(9)当前视频块或至少一个邻近块的当前量化参数(QP),
(10)当前视频块的色彩格式的指示,
(11)与当前视频块相关联的单独编解码树结构或双编解码树结构,
(12)当前视频块的条带类型、片组类型或图片类型,或者
(13)时域层ID。
8.一种用于可视媒体解码的方法,包括:
为了从可视媒体数据的比特流表示解码可视媒体数据的视频区域中的当前视频块,识别编解码模式和/或帧内预测模式和/或可允许帧内预测模式集合的使用;以及
在识别出使用时,做出在比特流表示中包括还是排除指示选择性地将变换跳过模式应用于当前视频块的语法元素的决定,其中在变换跳过模式下,当前视频块和预测视频块之间的残差被表示在可视媒体数据的比特流表示中,而不应用变换。
9.一种用于可视媒体编码的方法,包括:
为了将可视媒体数据的视频区域中的当前视频块编码为可视媒体数据的比特流表示,做出关于至少基于确定双树编解码结构被启用或至少从确定双树编解码结构被启用而推断的单树编解码结构或双树编解码结构的选择性应用的决定;以及
在比特流表示中包括指示单树或双树的选择性应用的语法元素。
10.一种用于可视媒体解码的方法,包括:
从包括包含当前视频块的视频区域的可视媒体数据的比特流表示解析语法元素,其中语法元素指示至少基于确定双树编解码结构被启用或至少从确定双树编解码结构被启用而推断的单树编解码结构或双树编解码结构的选择性应用;以及
通过根据语法元素解码当前视频块,从比特流表示生成解码的视频区域。
11.根据权利要求9-10中任一项或多项所述的方法,其中,所述双树编解码结构与第一视频级别相关联,并且语法元素与第二视频级别相关联,还包括:
在确定与第一视频级别相关联的双树编解码结构被禁用时,将与第二视频级别相关联的语法元素推断为布尔假。
12.根据权利要求11所述的方法,其中,所述语法元素被包括在比特流表示中。
13.根据权利要求11-12中任一项或多项所述的方法,其中,所述第二视频级别低于第一视频级别。
14.根据权利要求11-12中任一项或多项所述的方法,其中,所述第二视频级别是编解码树单元(CTU)级别,并且第一视频级别是序列/条带/片/砖块级别。
15.根据权利要求9-10中任一项或多项所述的方法,其中,所述语法元素与编解码树单元(CTU)级别相关联,还包括:
至少基于标志为布尔真,在比特流表示中包括语法元素。
16.根据权利要求15所述的方法,其中,所述标志在高于CTU级别的级别。
17.根据权利要求9-10中任一项或多项所述的方法,其中语法元素与编解码树单元(CTU)级别相关联,还包括:
在确定高于CTU级别的级别的标志为布尔假时,将比特流表示中的语法元素推断为布尔假。
18.根据权利要求9-10中任一项或多项所述的方法,其中,所述语法元素在编解码树单元(CTU)级别以下的级别。
19.根据权利要求18所述的方法,其中,所述语法元素在虚拟流水线数据单元(VPDU)级别。
20.根据权利要求18所述的方法,其中,所述语法元素在与分割树的信令级别相对应的级别。
21.一种用于可视媒体处理的方法,包括:
为可视媒体数据的当前视频块和可视媒体的比特流表示之间的转换确定帧内块复制(IBC)模式被应用于当前视频块的色度分量;以及
使用当前视频块的并置亮度块内的IBC编解码子区域中包括的首先可用样点来推导与当前视频块的子块相关联的运动信息。
22.根据权利要求21所述的方法,其中,并置亮度块内的IBC编解码子区域根据顺序来扫描。
23.根据权利要求22所述的方法,其中,所述顺序是光栅扫描顺序。
24.根据权利要求21所述的方法,其中,所述运动信息是子块或子样点的运动矢量或块矢量。
25.根据权利要求21所述的方法,其中,所述IBC编解码子区域的尺寸对应于最小编解码单元的尺寸。
26.根据权利要求21所述的方法,其中,所述IBC编解码子区域的尺寸对应于最小变换单元的尺寸。
27.根据权利要求22所述的方法,其中,所述首先可用样点包括并置亮度块的左顶部样点,其中左顶部样点是IBC编解码样点。
28.根据权利要求22所述的方法,其中,所述首先可用样点包括并置亮度块的左顶部样点,其中左顶部样点是帧间模式编解码样点。
29.根据权利要求21-28中任一项或多项所述的方法,其中,所述转换包括从当前视频块生成比特流表示。
30.根据权利要求21-28中任一项或多项所述的方法,其中,所述转换包括从比特流表示生成当前视频块的像素值。
31.一种用于可视媒体处理的方法,包括:
为可视媒体数据的当前视频块和可视媒体的比特流表示之间的转换确定帧内块复制(IBC)模式被应用于当前视频块;以及
在比特流表示中包括指示与当前视频块相关联的运动信息的语法元素。
32.根据权利要求31所述的方法,其中,所述语法元素对应于与当前视频块相关联的运动信息和运动信息预测值之间的差。
33.根据权利要求32所述的方法,其中,所述运动信息预测值使用并置亮度块、并置亮度块的一个或多个邻近块或者当前视频块的邻近色度块中包括的样点的运动信息来计算。
34.根据权利要求32所述的方法,其中,所述并置亮度块中包括的样点是并置亮度块的左顶部样点。
35.根据权利要求32所述的方法,其中,所述并置亮度块中包括的样点是并置亮度块的中心样点。
36.根据权利要求34所述的方法,其中,所述并置亮度块的左顶部样点是IBC编解码样点。
37.根据权利要求34所述的方法,其中,所述并置亮度块的左顶部样点是帧间模式编解码样点。
38.根据权利要求33所述的方法,其中,所述运动信息预测值与并置亮度块的子区域相关联,并且其中运动信息预测值在用于当前视频块之前被缩放。
39.根据权利要求33所述的方法,其中,所述邻近色度块是当前视频块的相邻或非相邻的邻居。
40.根据权利要求31所述的方法,其中,与当前视频块相关联的运动信息被包括在候选运动矢量列表中,并且其中比特流表示中包括的语法元素对应于指向候选运动矢量列表的索引。
41.根据权利要求31所述的方法,其中,所述候选运动矢量列表包括以下之一中包括的样点的运动信息:并置亮度块、并置亮度块的一个或多个邻近块、或当前视频块的邻近色度块。
42.根据权利要求32所述的方法,其中,使用自适应运动矢量分辨率(AMVR)技术的指示至少部分地基于解析比特流表示来推断。
43.根据权利要求42所述的方法,其中,所述当前视频块是色度、IBC编解码块,还包括:
使用所述使用AMVR技术的指示来推断AMVR技术没有应用于当前视频块。
44.根据权利要求43所述的方法,其中,与当前视频块相关联的运动信息和运动信息预测值之间的差被推断为具有整数值精度。
45.根据权利要求31-44中任一项或多项所述的方法,其中,所述转换包括从当前视频块生成比特流表示。
46.根据权利要求31-44中任一项或多项所述的方法,其中,所述转换包括从比特流表示生成当前视频块的像素值。
47.一种用于可视媒体处理的方法,包括:
为可视媒体数据的当前视频块和可视媒体的比特流表示之间的转换确定帧内块复制(IBC)模式被应用于当前视频块;以及
至少基于一个或多个条件,确定在比特流表示中选择性地包括还是排除指示与当前视频块相关联的运动信息的语法元素。
48.根据权利要求47所述的方法,其中,所述一个或多个条件包括:
(1)当前视频块的并置亮度块内的子区域的IBC编解码模式,
(2)与当前视频块的并置亮度块内的IBC编解码子区域相关联的有效运动矢量,
(3)在序列参数集(SPS)、视频参数集(VPS)、图片参数集(PPS)、图片头、条带头、片组头、最大编解码单元(LCU)、LCU行、LCU组或编解码单元(CU)中信令通知的消息,
(4)与其他视频块相关联的编解码图片/片/条带/重构区域中的IBC模式和/或帧间模式的哈希命中率,
(5)当前视频块或当前视频块的至少一个邻近块的块大小,
(6)当前视频块或至少一个邻近块的块形状,
(7)当前视频块或至少一个邻近块的当前量化参数(QP),
(8)当前视频块的色彩格式的指示,
(9)与当前视频块相关联的单独编解码树结构或双编解码树结构,
(10)当前视频块的条带类型、片组类型或图片类型,或者
(11)时域层ID。
49.根据权利要求48所述的方法,其中,响应于确定当前视频块的并置亮度块内的所有子区域是IBC编解码的,语法元素从比特流表示中排除。
50.根据权利要求48所述的方法,其中,响应于确定与当前视频块的并置亮度块内的所有IBC编解码子区域相关联的所有运动矢量有效,语法元素从比特流表示中排除。
51.根据权利要求47-48中任一项或多项所述的方法,其中,所述转换包括从当前视频块生成比特流表示。
52.根据权利要求47-48中任一项或多项所述的方法,其中,所述转换包括从比特流表示生成当前视频块的像素值。
53.一种视频编码器装置,包括被配置为实施根据权利要求1-52中任一项或多项所述的方法的处理器。
54.一种视频解码器装置,包括被配置为实施根据权利要求1-52中任一项或多项所述的方法的处理器。
55.一种存储有代码的计算机可读介质,所述代码体现用于实施根据权利要求1-52中任一项或多项所述的方法的处理器可执行指令。
CN202080032953.XA 2019-05-02 2020-05-01 变换跳过模式下的信令通知 Active CN113785568B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
CNPCT/CN2019/085405 2019-05-02
CN2019085405 2019-05-02
CN2019092831 2019-06-25
CNPCT/CN2019/092831 2019-06-25
PCT/US2020/030979 WO2020223612A1 (en) 2019-05-02 2020-05-01 Signaling in transform skip mode

Publications (2)

Publication Number Publication Date
CN113785568A true CN113785568A (zh) 2021-12-10
CN113785568B CN113785568B (zh) 2024-03-08

Family

ID=73029378

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080032953.XA Active CN113785568B (zh) 2019-05-02 2020-05-01 变换跳过模式下的信令通知

Country Status (6)

Country Link
US (2) US20220030280A1 (zh)
EP (1) EP3949387A4 (zh)
JP (2) JP7288084B2 (zh)
KR (1) KR20220002918A (zh)
CN (1) CN113785568B (zh)
WO (1) WO2020223612A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114339231A (zh) * 2021-12-27 2022-04-12 杭州当虹科技股份有限公司 利用运动矢量快速跳Cu级模式选择的方法

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113906753B (zh) 2019-04-24 2023-12-01 字节跳动有限公司 编解码视频的量化残差差分脉冲编解码调制表示的约束
CN117857783A (zh) 2019-05-01 2024-04-09 字节跳动有限公司 使用量化残差差分脉冲码调制编解码的帧内编解码视频
WO2020223615A1 (en) 2019-05-02 2020-11-05 Bytedance Inc. Coding mode based on a coding tree structure type
FI4002843T3 (fi) 2019-07-21 2024-04-25 Lg Electronics Inc Kuvankoodaus/-dekoodausmenetelmä ja laite kroma-komponentin ennustusinformaation signaloimiseksi sen mukaisesti, onko palettitila sovellettavissa, ja menetelmä bittivirran lähettämiseksi
US11627327B2 (en) * 2019-08-05 2023-04-11 Qualcomm Incorporated Palette and prediction mode signaling
CN115633172A (zh) * 2020-12-06 2023-01-20 浙江大华技术股份有限公司 基于ibc模式编码方法、电子设备及存储介质
US11683509B1 (en) * 2021-10-28 2023-06-20 Meta Platforms, Inc. Prediction unit skip detection in encoder

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104041048A (zh) * 2011-11-09 2014-09-10 Sk电信有限公司 利用跳过模式进行视频编码和解码的方法和设备
US20140362917A1 (en) * 2013-06-05 2014-12-11 Qualcomm Incorporated Residual differential pulse code modulation (dpcm) extensions and harmonization with transform skip, rotation, and scans
US20150016515A1 (en) * 2013-07-12 2015-01-15 British Broadcasting Corporation Video encoding and decoding with prediction at higher precision
CN104380734A (zh) * 2012-06-07 2015-02-25 联发科技(新加坡)私人有限公司 用于帧内变换跳过模式的方法和装置
CN105556963A (zh) * 2013-10-14 2016-05-04 联发科技(新加坡)私人有限公司 用于hevc范围扩展的残差差分脉冲编码调制方法
CN106105227A (zh) * 2014-03-16 2016-11-09 Vid拓展公司 用于无损视频译码的信令的方法和设备
CN108632611A (zh) * 2012-06-29 2018-10-09 韩国电子通信研究院 视频解码方法、视频编码方法和计算机可读介质

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DK2984837T3 (en) * 2013-04-08 2018-04-30 Ge Video Compression Llc Inter-component prediction
EP3308540B1 (en) * 2015-06-09 2020-04-15 Microsoft Technology Licensing, LLC Robust encoding/decoding of escape-coded pixels in palette mode
CN109792516B (zh) * 2016-10-04 2021-05-25 联发科技股份有限公司 图像和视频编解码中用于帧内色度编解码的方法及装置
MX2021000525A (es) * 2018-07-18 2021-04-12 Beijing Dajia Internet Information Tech Co Ltd Metodos y aparato de codificacion de video que usa el campo tecnico de prediccion de vectores de movimiento basado en el historial.
KR20240000610A (ko) * 2019-01-15 2024-01-02 로즈데일 다이나믹스 엘엘씨 변환 스킵 플래그를 이용한 영상 코딩 방법 및 장치
KR20210119429A (ko) * 2019-02-19 2021-10-05 주식회사 윌러스표준기술연구소 인트라 예측 기반 비디오 신호 처리 방법 및 장치
CN112740677A (zh) * 2019-02-28 2021-04-30 株式会社 Xris 用于对图像信号进行编码/解码的方法及其装置
US11825120B2 (en) * 2019-02-28 2023-11-21 Qualcomm Incorporated Subblock coding by generalized intra prediction in video coding
US11451826B2 (en) * 2019-04-15 2022-09-20 Tencent America LLC Lossless coding mode and switchable residual coding
CN113728640A (zh) * 2019-04-23 2021-11-30 北京字节跳动网络技术有限公司 帧内预测和残差编解码
KR20210145123A (ko) * 2019-04-23 2021-12-01 주식회사 윌러스표준기술연구소 다중 변환 커널을 사용하는 비디오 신호 처리 방법 및 장치

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104041048A (zh) * 2011-11-09 2014-09-10 Sk电信有限公司 利用跳过模式进行视频编码和解码的方法和设备
CN104380734A (zh) * 2012-06-07 2015-02-25 联发科技(新加坡)私人有限公司 用于帧内变换跳过模式的方法和装置
CN108632611A (zh) * 2012-06-29 2018-10-09 韩国电子通信研究院 视频解码方法、视频编码方法和计算机可读介质
US20140362917A1 (en) * 2013-06-05 2014-12-11 Qualcomm Incorporated Residual differential pulse code modulation (dpcm) extensions and harmonization with transform skip, rotation, and scans
CN105264891A (zh) * 2013-06-05 2016-01-20 高通股份有限公司 具有变换跳过、旋转和扫描的残余差分脉码调制(dpcm)扩展和协调
US20150016515A1 (en) * 2013-07-12 2015-01-15 British Broadcasting Corporation Video encoding and decoding with prediction at higher precision
CN105556963A (zh) * 2013-10-14 2016-05-04 联发科技(新加坡)私人有限公司 用于hevc范围扩展的残差差分脉冲编码调制方法
CN106105227A (zh) * 2014-03-16 2016-11-09 Vid拓展公司 用于无损视频译码的信令的方法和设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114339231A (zh) * 2021-12-27 2022-04-12 杭州当虹科技股份有限公司 利用运动矢量快速跳Cu级模式选择的方法
CN114339231B (zh) * 2021-12-27 2023-10-27 杭州当虹科技股份有限公司 利用运动矢量快速跳Cu级模式选择的方法

Also Published As

Publication number Publication date
KR20220002918A (ko) 2022-01-07
US20230300379A1 (en) 2023-09-21
JP2023120212A (ja) 2023-08-29
US20220030280A1 (en) 2022-01-27
WO2020223612A1 (en) 2020-11-05
JP2022531282A (ja) 2022-07-06
EP3949387A4 (en) 2022-05-18
CN113785568B (zh) 2024-03-08
EP3949387A1 (en) 2022-02-09
JP7288084B2 (ja) 2023-06-06

Similar Documents

Publication Publication Date Title
CN113711611B (zh) 用于变换跳过模式中的系数编解码的方法、装置和介质
CN113728642B (zh) 编解码视频的量化残差差分脉冲编解码调制表示
CN113785568B (zh) 变换跳过模式下的信令通知
JP7288083B2 (ja) 符号化ツリー構造タイプに基づく符号化モード
US11490089B2 (en) Transform bypass coded residual blocks in digital video
CN113796069B (zh) 使用量化残差差分脉冲编解码调制编解码的帧内编解码视频
CN113892267A (zh) 使用编解码树结构类型控制编解码模式
JP2023521119A (ja) ビデオコーディングにおけるスキップブロックの変換のための最小許容量子化
CN114747217A (zh) 调色板编解码模式

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant