CN114208191A - 基于颜色格式的视频区域分割 - Google Patents
基于颜色格式的视频区域分割 Download PDFInfo
- Publication number
- CN114208191A CN114208191A CN202080055797.9A CN202080055797A CN114208191A CN 114208191 A CN114208191 A CN 114208191A CN 202080055797 A CN202080055797 A CN 202080055797A CN 114208191 A CN114208191 A CN 114208191A
- Authority
- CN
- China
- Prior art keywords
- mode
- video
- chroma
- codec
- intra
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000011218 segmentation Effects 0.000 title claims description 5
- 238000000034 method Methods 0.000 claims abstract description 272
- 238000000638 solvent extraction Methods 0.000 claims abstract description 102
- 238000012545 processing Methods 0.000 claims abstract description 71
- 241000023320 Luma <angiosperm> Species 0.000 claims description 124
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 claims description 124
- 238000006243 chemical reaction Methods 0.000 claims description 30
- 239000013598 vector Substances 0.000 claims description 20
- 230000002123 temporal effect Effects 0.000 claims description 3
- 230000009977 dual effect Effects 0.000 description 45
- 239000000523 sample Substances 0.000 description 36
- 230000008569 process Effects 0.000 description 28
- 230000011664 signaling Effects 0.000 description 23
- 238000005192 partition Methods 0.000 description 16
- 238000010586 diagram Methods 0.000 description 14
- 230000007704 transition Effects 0.000 description 12
- 238000004590 computer program Methods 0.000 description 10
- 238000005516 engineering process Methods 0.000 description 8
- 238000001914 filtration Methods 0.000 description 8
- 230000003044 adaptive effect Effects 0.000 description 7
- 238000009795 derivation Methods 0.000 description 7
- 229910003460 diamond Inorganic materials 0.000 description 7
- 239000010432 diamond Substances 0.000 description 7
- 238000005070 sampling Methods 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 6
- 230000009466 transformation Effects 0.000 description 6
- 230000001419 dependent effect Effects 0.000 description 5
- 238000013507 mapping Methods 0.000 description 5
- 230000015654 memory Effects 0.000 description 5
- 238000013461 design Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 230000006835 compression Effects 0.000 description 3
- 238000007906 compression Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- FZEIVUHEODGHML-UHFFFAOYSA-N 2-phenyl-3,6-dimethylmorpholine Chemical compound O1C(C)CNC(C)C1C1=CC=CC=C1 FZEIVUHEODGHML-UHFFFAOYSA-N 0.000 description 2
- 101100129500 Caenorhabditis elegans max-2 gene Proteins 0.000 description 2
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 230000006837 decompression Effects 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000003252 repetitive effect Effects 0.000 description 2
- 238000013515 script Methods 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 101150114515 CTBS gene Proteins 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000013138 pruning Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/119—Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/105—Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/107—Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/11—Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/12—Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
- H04N19/122—Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/132—Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
- H04N19/159—Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/174—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/186—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/1883—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit relating to sub-band structure, e.g. hierarchical level, directional tree, e.g. low-high [LH], high-low [HL], high-high [HH]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/593—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/96—Tree coding, e.g. quad-tree coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Discrete Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Color Television Systems (AREA)
- Processing Of Color Television Signals (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
Abstract
提供了一种视频处理的方法,包括:根据规则基于视频的颜色格式确定用于将视频的色度视频区域分割为一个或多个色度块的分割方案;以及根据分割方案在视频与视频的编解码表示之间进行转换。
Description
相关申请的交叉引用
根据适用专利法和/或适用于巴黎公约的规则,本申请及时要求2019年8月6日提交的国际专利申请No.PCT/CN2019/099447号的优先权和权益。出于法律的所有目的,上述申请的全部公开作为本申请公开的一部分通过引用并入。
技术领域
本文档涉及视频和图像编解码和解码技术。
背景技术
数字视频占据了互联网和其它数字通信网络上最大的带宽使用。随着能够接收和显示视频的已连接用户设备的数量增加,预期对数字视频使用的带宽需求将继续增长。
发明内容
所公开的技术可以由视频或图像解码器或编码器实施例使用,在视频或图像解码器或编码器实施例中,在视频编解码或解码中使用参考图片。
在一个示例方面,公开了一种视频处理的方法。该方法包括:根据规则基于视频的颜色格式确定用于将视频的色度视频区域分割为一个或多个色度块的分割方案;以及根据分割方案在视频与视频的编解码表示之间进行转换。
在另一个示例方面,公开了另一种视频处理的方法。该方法包括:基于视频的颜色格式,确定用于视频的编解码树节点的子块的预测模式或预测类型;以及基于确定在视频与视频的编解码表示之间进行转换,其中,将编解码树节点分割为子块以用于在编解码表示中进行编解码。
在另一个示例方面,公开了另一种视频处理的方法。该方法包括:根据规则,在视频与视频的编解码表示之间进行转换,视频包括包含一个或多个亮度块和一个或多个色度块的一个或多个视频区域;其中规则指定不允许使用帧内模式或帧内块复制模式在编解码表示中表示一个或多个色度块中的尺寸为MxN的色度块,其中M和N分别是指示色度块的宽度和高度的整数;其中帧内模式包括基于先前编码或重建的视频块对色度块进行编码,并且其中帧内块复制模式包括至少使用指向包含视频区域的视频帧的块矢量来对色度块进行编码。
在另一个示例方面,公开了另一种视频处理的方法。该方法包括:对于视频的视频区域和视频的编解码表示之间的转换,根据规则确定使用组合的帧间和帧内预测(CIIP)模式作为帧内模式或帧间模式;以及基于确定进行转换,并且其中,CIIP模式包括使用加权系数来组合帧内预测信号和帧间预测信号。
在另一个示例方面,公开了另一种视频处理的方法。该方法包括:在视频的色度块与视频的编解码表示之间进行转换,其中,根据尺寸规则使用帧内编解码模式在编解码表示中表示色度块;其中尺寸规则指定:在色度块的宽度等于M或色度块的高度等于N的情况下,其中M和N是整数,帧内编解码模式来自帧内编解码模式类型的第一集合;否则,帧内编解码模式来自帧内编解码模式类型的第二集合。
在另一个示例方面,公开了另一种视频处理的方法。该方法包括:在视频的色度块与视频的编解码表示之间进行转换,其中,根据规则使用变换类型在编解码表示中表示色度块;其中,规则指定:在色度块的宽度等于M或色度块的高度等于N的情况下,其中M和N是整数,变换类型来自变换类型的第一集合;否则,变换类型来自变换类型的第二集合。
在另一个示例方面,公开了另一种视频处理的方法。该方法包括:根据规则,在视频与视频的编解码表示之间进行转换,视频包括具有一个或多个亮度块和一个或多个色度块的视频区域,其中,规则指定帧内块复制(IBC)模式的使用可用于块尺寸为MxN的一个或多个亮度块和一个或多个色度块,对于M和N的所有值,其中M和N是整数;其中,使用IBC模式,至少使用指向包含视频块的视频帧的块矢量来对视频块进行编解码。
在另一个示例方面,公开了另一种视频处理的方法。该方法包括:在视频的视频块与视频块的编解码表示之间进行转换,其中,编解码表示符合格式化规则,其中,格式化规则指定基于视频块的模式类型在编解码表示中选择性地包括指示使用帧间块复制(IBC)模式的语法元素,并且其中IBC模式包括至少使用指向包含视频块的视频帧的块矢量对视频块进行编码。
在另一个示例方面,公开了另一种视频处理的方法。该方法包括:在视频的视频块与视频块的编解码表示之间进行转换,其中,编解码表示符合格式化规则,其中格式化规则指定无论视频块的模式类型,在编解码表示中都包括指示使用调色板模式的语法元素,并且其中调色板模式包括使用代表性样点值的调色板对视频块进行编码。
在另一个示例方面,公开了另一种视频处理的方法。该方法包括:对于视频的视频区域与视频的编解码表示之间的转换,基于规则确定准许对于视频区域使用帧间块复制(IBC)模式;以及基于确定来进行转换,其中,IBC模式包括至少使用指向包含视频区域的视频帧的块矢量来对视频区域进行编码。
在另一个示例方面,公开了另一种视频处理的方法。该方法包括:对于视频的视频区域与视频的编解码表示之间的转换,基于规则确定是否准许对于视频区域使用调色板模式;以及基于确定进行转换,其中,规则基于视频区域的编解码模式类型或视频区域的颜色类型;并且其中调色板模式包括使用代表性样点值的调色板对视频区域进行编码。
在又一个示例方面,上述方法可以由包括处理器的视频编码器装置实现。
在又一个示例方面,上述方法可以由包括处理器的视频解码器装置实现。
在又一个示例方面,这些方法可以以处理器可执行指令的形式实施并存储在计算机可读程序介质上。
在本文档中进一步描述了这些以及其它方面。
附图说明
图1示出了帧内块复制编解码工具的示例。
图2示出了以调色板模式编解码的块的示例。
图3示出了使用调色板预测器来信令通知调色板条目的示例。
图4示出了水平和垂直遍历扫描的示例中的示例。
图5示出了对调色板索引进行编解码的示例。
图6示出了67个帧内预测模式的示例。
图7示出了当前块的左领域和上领域的示例。
图8示出了ALF滤波器形状的示例(色度:5×5菱形,亮度:7×7菱形)。
图9示出了子采样的拉普拉斯计算的示例。
图10示出了在虚拟边界处的修改的块分类的示例。
图11是图示在虚拟边界处的用于亮度分量的修改的ALF滤波的示例。
图12示出了EO中的像素分类的四个1维3像素图案的示例。
图13示出了四个带被分组在一起并由其起始带位置表示。
图14示出了在CIIP权重导出中使用的顶邻域块和左邻域块。
图15示出了具有色度缩放架构的亮度映射。
图16示出了SCIPU的示例。
图17A和17B是用于实现本文档中所描述的技术的硬件平台的示例的框图。
图18是视频处理的示例方法的流程图。
图19示出了空域Merge候选的位置的示例。
图20示出了考虑用于空域Merge候选的冗余检查的候选对的示例。
图21A和21B示出了基于所公开的技术的一些实现方式的视频处理的示例方法的流程图。
图22A和22B示出了基于所公开的技术的一些实现方式的视频处理的示例方法的流程图。
图23A和23B示出了基于所公开的技术的一些实现方式的视频处理的示例方法的流程图。
具体实施方式
本文档提供可由图像或视频比特流的解码器使用的各种技术,以提高解压缩或解码的数字视频或图像的质量。为简洁起见,术语“视频”在本文中用于包括图片的序列(传统上称为视频)和各个图像。此外,视频编码器还可以在编码过程期间实现这些技术,以便重建用于进一步编码的解码帧。
在本文档中使用章节标题是为了易于理解,并且不将实施例和技术限于对应的章节。这样,一个章节的实施例可以与其它章节的实施例组合。
1.概述
本文档与视频编解码技术有关。具体地,它涉及在视频编解码中采用基于基色的表示的调色板编解码。它可以应用于现有的视频编解码标准(如HEVC)或者要最终确定的标准(通用视频编解码)。它也可能适用于未来的视频编解码标准或视频编码器。
2.初步讨论
视频编解码标准主要通过公知的ITU-T和ISO/IEC标准的发展而演进。ITU-T产生了H.261和H.263,ISO/IEC产生了MPEG-1和MPEG-4Visual,这两个组织联合产生了H.262/MPEG-2视频和H.264/MPEG-4高级视频编解码(AVC)和H.265/HEVC标准。从H.262开始,视频编解码标准基于混合视频编解码结构,其中利用了时域预测加变换编解码。为了探索HEVC之外的未来视频编解码技术,VCEG和MPEG于2015年联合成立了联合视频探索小组(JVET)。此后,JVET采用了许多新方法并将其引入到名为“联合探索模型”(JEM)的参考软件中。2018年4月,VCEG(Q6/16)与ISO/IEC JTC1 SC29/WG11(MPEG)之间的联合视频专家团队(JVET)创立,致力于VVC标准,目标是与HEVC相比比特率降低50%。
可以在以下位置找到VVC草案的最新版本,即通用视频编解码(草案4):
http://phenix.it-sudparis.eu/jvet/doc_end_user/current_document.php?id=5755
可以在以下位置找到名为VTM的VVC的最新参考软件:
https://vcgit.hhi.fraunhofer.de/jvet/VVCSoftware_VTM/tags/VTM-5.0
2.1帧内块复制
帧内块复制(IBC),也称为当前图片参考,已在HEVC屏幕内容编解码扩展(HEVC-SCC)和当前VVC测试模型(通过VTM-4.0)中被采用。IBC将运动补偿的概念从帧间编解码扩展到了帧内编解码。如图1所示,当应用IBC时,由相同图片中的参考块预测当前块。在对当前块进行编解码或解码之前,必须已经重建了参考块中的样点。尽管IBC对于大部分相机捕获的序列而言效率不高,但它示出了屏幕内容的显著编解码增益。原因是屏幕内容图片中存在许多重复的图案,诸如图标和文本字符。IBC可以有效地移除这些重复模式之间的冗余。在HEVC-SCC中,如果选择当前图片作为参考图片,则帧间编解码单元(CU)可以应用IBC。在这种情况下,MV被重命名为块矢量(BV),并且BV始终具有整数像素精度。为了与主要配置文件HEVC兼容,当前图片在解码图片缓冲器(DPB)中被标记为“长期”参考图片。应当注意,类似地,在多视图/3D视频编解码标准中,视图间参考图片也被标记为“长期”参考图片。
在BV找到其参考块之后,可以通过复制参考块来生成预测。可以通过从原始信号中减去参考像素来获得残差。然后可以像在其它编解码模式中一样应用变换和量化。
图1是帧内块复制的图示。
然而,当参考块在图片外部、或与当前块重叠、或在重建区域外部、或在受一些约束限制的有效区域外部时,不定义部分或全部像素值。基本上,存在两种解决此问题的方法。一种是不允许这种情况,例如在比特流一致性方面。另一种是对那些未定义的像素值应用填充。以下子章节详细描述了解决方案。
2.2在HEVC屏幕内容编解码扩展中的IBC
在HEVC屏幕内容编解码扩展中,当块使用当前图片作为参考时,应保证整个参考块在可用的重建区域内,如以下规范文本所示:
变量offsetX和offsetY的导出如下:
offsetX=(ChromaArrayType==0)?0:(mvCLX[0]&0x7?2:0)
(8-104)
offsetY=(ChromaArrayType==0)?0:(mvCLX[1]&0x7?2:0)
(8-105)
比特流一致性的要求为,当参考图片是当前图片时,亮度运动矢量mvLX应当遵循以下限制:
-当以将设置为(xCb,yCb)的(xCurr,yCurr)、将设置为等于(xPb+(mvLX[0]>>2)-offsetX,yPb+(mvLX[1]>>2)-offsetY)的相邻亮度位置(xNbY,yNbY)作为输入调用第6.4.1节中规定的z扫描顺序块可用性的导出过程时,输出应当为真(TRUE)。
-当以将设置为(xCb,yCb)的(xCurr,yCurr)、将设置为等于(xPb+(mvLX[0]>>2)+nPbW-1+offsetX,yPb+(mvLX[1]>>2)+nPbH-1+offsetY)的相邻亮度位置(xNbY,yNbY)作为输入调用第6.4.1节中规定的z扫描顺序块可用性的导出过程时,输出应当为真(TRUE)
-以下条件中的一个或两者应当为真:
-(mvLX[0]>>2)+nPbW+xB1+offsetX的值小于或等于0。
-(mvLX[1]>>2)+nPbH+yB1+offsetY的值小于或等于0。
-以下条件应当为真:
(xPb+(mvLX[0]>>2)+nPbSw-1+offsetX)/CtbSizeY-xCurr/CtbSizeY<=yCurr/CtbSizeY-(yPb+(mvLX[1]>>2)+nPbSh-1+offsetY)/CtbSizeY(8-106)
因此,将不会发生参考块与当前块重叠或参考块在图片外部的情况。无需填充参考块或预测块。
2.3在VVC测试模型中的IBC
在当前的VVC测试模型中,即VTM-4.0设计中,整个参考块应在当前编解码树单元(CTU)内并且不与当前块重叠。因此,不需要填充参考块或预测块。IBC标志被编解码为当前CU的预测模式。因此,对于每个CU,总共存在三种预测模式:MODE_INTRA、MODE_INTER和MODE_IBC。
2.3.1 IBC Merge模式
在IBC Merge模式中,从比特流中解析出指向IBC Merge候选列表中的条目的索引。IBC Merge列表的构建可以根据以下步骤顺序进行总结:
步骤1:导出空域候选
步骤2:插入HMVP候选
步骤3:插入成对平均候选
在导出空域Merge候选时,在位于图19所示位置的候选中最多选择四个Merge候选。导出顺序为A1、B1、B0、A0和B2。仅当位置A1、B1、B0、A0中的任何PU不可用(例如,因为它属于另一个条带或片)或未使用IBC模式编解码时,才考虑位置B2。在添加位置A1处的候选之后,对剩余的候选的插入进行冗余检查,以确保将具有相同运动信息的候选从列表中排除,从而提高了编解码效率。为了降低计算复杂度,在提到的冗余检查中并未考虑所有可能的候选对。替代地,仅考虑与图20中的箭头链接的对,并且只有当用于冗余检查的对应候选不具有相同的运动信息时,才会将候选添加到列表中。
在插入空域候选之后,如果IBC Merge列表尺寸仍然小于最大IBC Merge列表尺寸,则可以插入来自HMVP表的IBC候选。当插入HMVP候选时执行冗余检查。
最后,将成对平均候选插入IBC Merge列表中。
当由Merge候选标识的参考块在图片外部、或与当前块重叠、或在重建区域外部、或在受一些约束限制的有效区域外部时,Merge候选称为无效Merge候选。
注意,无效Merge候选可以被插入到IBC Merge列表中。
2.3.2 IBC AMVP模式
在IBC AMVP模式中,指向IBC AMVP列表中的条目的AMVP索引从比特流解析。IBCAMVP列表的构建可以根据以下步骤顺序进行总结:
步骤1:导出空域候选
检查A0、A1,直到找到可用候选。
检查B0、B1、B2,直到找到可用候选。
步骤2:插入HMVP候选
步骤3:插入零候选
在插入空域候选之后,如果IBC AMVP列表尺寸仍然小于最大IBC AMVP列表尺寸,则可以插入来自HMVP表的IBC候选。
最后,将零候选插入到IBC AMVP列表中。
2.4调色板模式(Palette Mode)
调色板模式背后的基本思想是CU中的样点由代表性颜色值的小的集合表示。该集合称为调色板。而且,还可能通过信令通知后跟(可能是量化后的)分量值的转义(escape)符号来指示调色板外部的样点。这种样点称为转义样点。调色板模式如图2所示。
图2示出了以调色板模式编解码的块的示例。
2.5在HEVC屏幕内容编解码扩展(HEVC-SCC)中的调色板模式
在HEVC-SCC的调色板模式中,一种预测方法用于编解码调色板和索引图。
2.5.1调色板条目的编解码
为了对调色板条目进行编解码,维护调色板预测器。在SPS中信令通知调色板的最大尺寸以及调色板预测器。在HEVC-SCC中,在PPS中引入了palette_predictor_initializer_present_flag。当该标志为1时,在比特流中信令通知用于初始化调色板预测器的条目。在每个CTU行、每个条带和每个片的开始处初始化调色板预测器。取决于palette_predictor_initializer_present_flag的值,将调色板预测器重置为0或使用PPS中信令通知的调色板预测器初始化器条目进行初始化。在HEVC-SCC中,启用尺寸为0的调色板预测器初始化器,以允许在PPS级别显式禁用调色板预测器初始化。
对于调色板预测器中的每个条目,信令通知重用标志以指示其是否是当前调色板的一部分。这如图3所示。使用零的游程长度(run-length)编解码发送重用标志。此后,使用阶数为0的指数Golomb代码信令通知新调色板条目的数量。最后,信令通知新调色板条目的分量值。
图3示出了使用调色板预测器来信令通知调色板条目的示例。
2.5.2调色板索引编解码
如图4所示,使用水平和垂直遍历扫描对调色板索引进行编解码。使用palette_transpose_flag在比特流中显式信令通知扫描顺序。对于子章节的其余部分,假定扫描是水平的。
图4示出了水平和垂直遍历扫描的示例。
使用两个主要调色板样点模式对调色板索引进行编解码:“INDEX”和“COPY_ABOVE”。如前所述,转义符号也信令通知为“INDEX”模式,并分配等于最大调色板尺寸的索引。使用除顶行以外的标志或当先前模式为“COPY_ABOVE”时信令通知该模式。在“COPY_ABOVE”模式下,复制上方行中样点的调色板索引。在“INDEX”模式下,显式信令通知调色板索引。对于“INDEX”和“COPY_ABOVE”模式,都信令通知游程值,该值指定也使用相同模式进行编解码的后续样点的数量。当“INDEX”或“COPY_ABOVE”模式下转义符号是游程的一部分时,为每个转义符号信令通知转义分量值。调色板索引的编解码如图5所示。
该语法顺序如下完成。首先,信令通知CU的索引值的数量。这之后是使用截断的二进制编解码来信令通知整个CU的实际索引值。索引的数量以及索引值两者以旁路模式进行编解码。这将与索引相关的旁路二进制数(bin)分组在一起。然后以交错方式信令通知调色板样点模式(如果需要)和游程。最后,将与整个CU的转义样点相对应的分量转义值分组在一起,并以旁路模式进行编解码。
在信令通知索引值之后信令通知附加的语法元素,last_run_type_flag。该语法元素结合索引的数量,消除了信令通知与块中最后的游程相对应的游程值的需要。
在HEVC-SCC中,还对4:2:2、4:2:0和单色色度格式启用调色板模式。对于所有色度格式,调色板条目和调色板索引的信令通知几乎相同。在非单色格式的情况下,每个调色板条目由3个分量组成。对于单色格式,每个调色板条目均由单个分量组成。对于子采样的色度方向,色度样点与可被2整除的亮度样点索引相关联。在为CU重建调色板索引之后,如果样点仅具有与其相关联的单个分量,则仅适用调色板条目的第一分量。信令通知的唯一区别在于转义分量值。对于每个转义样点,取决于与该样点相关联的分量的数量,信号通知的转义分量值的数量可能不同。
在VVC,双树编解码结构用于基于对帧内条带进行编解码,因此亮度分量和两个色度分量可以具有不同的调色板和调色板索引。另外,两个色度分量共享相同的调色板和调色板索引。
图5示出了对调色板索引进行编解码的示例。
2.6 VVC中的帧内模式编解码
为了捕获自然视频中呈现的任意边缘方向,VTM5中的定向帧内模式的数量从HEVC中使用的33扩展到65。HEVC中没有的新定向模式在图6中用红色虚线箭头描绘,并且平面和DC模式保持相同。这些较密集的定向帧内预测模式适用于所有块尺寸以及亮度和色度帧内预测。
在VTM5中,对于非正方形块,使用广角帧内预测模式自适应地替换几种常规角度帧内预测模式。
在HEVC中,每个帧内编解码块具有正方形形状,并且其每侧的长度是2的幂。因此,使用DC模式生成帧内预测器不需要除法运算。在VTM5中,块可以具有矩形形状,这通常情况下需要对每个块使用除法运算。对于DC预测为了避免除法运算,对于非正方形块仅使用较长侧来计算平均。
图6示出了67个帧内预测模式的示例。
为了保持最可能模式(MPM)列表生成的复杂度低,通过考虑两个可用的邻域帧内模式,使用具有6个MPM的帧内模式编解码方法。考虑以下三个方面来构建MPM列表:
-默认帧内模式
-邻域帧内模式
-导出帧内模式
不管是否应用MRL和ISP编解码工具,统一的6-MPM列表都用于帧内块。MPM列表是基于左方和上方邻域块的帧内模式构建的。假设左方块的模式表示为Left,而上方块的模式表示为Above,则统一的MPM列表的构建如下(左方块和上方块如图7所示):
图7是当前块的左方领域和上方领域的示例。
–当邻域块不可用时,其内部模式默认设置为平面。
–如果Left和Above两者是非角度模式:
○MPM列表→{平面,DC,V,H,V-4,V+4}
–如果“Left”和“Above”中的一个是角度模式,而另一个是非角度模式:
○设置模式Max作为“Left”和“Above”中的最大模式
○MPM列表→{平面,Max,DC,Max-1,Max+1,Max-2}
–如果Left和Above都是角度并且它们是不同的:
○设置模式Max作为“Left”和“Above”中的最大模式
○如果模式“Left”和“Above”的差在2至62的范围(含端值)
■MPM列表→{平面,Left,Above,DC,Max-1,Max+1}
○否则
■MPM列表→{平面,Left,Above,DC,Max-2,Max+2}
–如果Left和Above都是角度并且它们是相同的:
○MPM列表→{平面,Left,Left-1,Left+1,DC,Left-2}
此外,mpm索引码字的第一二进制数是CABAC上下文编解码的。使用总共三种上下文,对应于当前帧内块是启用MRL、启用ISP还是正常帧内块。
在6个MPM列表生成过程期间,使用修剪来移除重复的模式,以便仅唯一模式可以包括在MPM列表中。对于61个非MPM模式的熵编解码,使用截断二进制码(TBC)。
对于色度帧内模式编解码,总共允许8个帧内模式用于色度帧内模式编解码。这些模式包括5个传统帧内模式和3个跨分量线性模型模式(CCLM、LM_A和LM_L)。色度模式信令通知和导出过程如表2-4所示。色度模式编解码直接取决于对应亮度块的帧内预测模式。由于在I条带中启用用于亮度和色度分量的分开的块分割结构,所以一个色度块可以对应于多个亮度块。因此,对于色度DM模式,覆盖当前色度块的中心位置的对应亮度块的帧内预测模式被直接继承。
表2-4当启用cclm时从亮度模式导出色度预测模式
2.7量化残差块差分脉冲编解码调制(QR-BDPCM)
在JVET-M0413中,提出了一种量化残差块差分脉冲编解码调制(QR-BDPCM)以有效地对屏幕内容将进行编解码。
在QR-BDPCM中使用的预测方向可以是垂直和水平预测模式。通过在类似于帧内预测的预测方向(水平或垂直预测)上进行样点复制来对整个块进行帧内预测。对残差进行量化,并对量化后的残差及其预测器(水平或垂直)量化后的值之间的增量进行编解码。这可以通过以下来描述:对于尺寸为M(行)×N(列)的块,令ri,j,0≤i≤M-1,0≤j≤N-1是使用来自上方块或左方块边界样点的未滤波样点水平(在预测块上逐线复制左方领域像素值)或垂直(将顶部领域线复制到预测块中的每条线)执行帧内预测之后的预测残差。令Q(ri,j),0≤i≤M-1,0≤j≤N-1表示残差ri,j的量化后的版本,其中残差是原始块与预测块值之间的差。然后,将块DPCM应用于量化后的残差样点,得到具有元素的修改后的M×N数组当信令通知垂直BDPCM时:
对于水平预测,适用类似的规则,并且通过以下方式获得残差量化后的样点:
在解码器侧,逆进行上述计算以产生Q(ri,j),0≤i≤M-1,0≤j≤N-1。对于垂直预测情况,
对于水平情况,
逆量化后的残差Q-1(Q(ri,j))被添加到帧内块预测值以产生重建的样点值。
该方案的主要优点在于,可以在系数解析期间即时完成逆DPCM,也可以在解析系数时简单地添加预测器,或者在解析后执行逆DPCM。
2.8自适应环路滤波器
在VTM5中,应用了具有基于块的滤波器自适应的自适应环路滤波器(ALF)。对于亮度分量,基于局部梯度的方向和活度,为每个4×4块选择25个滤波器中的一个。
2.8.1.1滤波器形状
在VTM5中,使用了两种菱形滤波器形状(如图8所示)。7×7菱形应用于亮度分量,而5×5菱形应用于色度分量。
图8示出了ALF滤波器形状的示例(色度:5×5菱形,亮度:7×7菱形)
2.8.1.2块分类
其中索引i和j指代4×4块内左上样点的坐标,而R(i,j)指示在坐标(i,j)处的重建样点。
为了降低块分类的复杂度,应用子采样的一维拉普拉斯计算。如图9所示,相同的子采样位置用于所有方向的梯度计算。
图9示出了子采样的拉普拉斯计算的示例。(a)垂直梯度的子采样位置(b)水平梯度的子采样位置(c)对角梯度的子采样位置(d)对角梯度的子采样位置。
然后,将水平方向和垂直方向的梯度的D最大值和最小值设置为:
两个对角方向的梯度的最大值和最小值设置为:
为了导出方向性D的值,将这些值彼此比较,并使用两个阈值t1和t2:
活度值A计算为:
对于图片中的色度分量,不应用分类方法,即,针对每个色度分量应用ALF系数的单个集合。
2.8.1.3滤波器系数和剪裁值的几何变换
在对每个4×4亮度块进行滤波之前,取决于针对该块计算的梯度值,将几何变换(诸如旋转或对角和垂直翻转)应用于滤波器系数f(k,l)以及对应的滤波器剪裁值c(k,l)。这等同于将这些变换应用于在滤波器支持区域中的点。想法是通过对齐方向性来使应用了ALF的不同块更加相似。
引入了三种几何变换,包括对角、垂直翻转和旋转:
对角:fD(k,l)=f(l,k),cD(k,l)=c(l,k) (2-9-9)
垂直翻转:fV(k,l)=f(k,K-l-1),cV(k,l)=c(k,K-l-1) (2-9-10)
旋转:fR(k,l)=f(K-l-1,k),cR(k,l)=c(K-l-1,k) (2-9-11)
其中,K是滤波器的尺寸,并且0≤k,l≤K-1是系数坐标,使得位置(0,0)在左上角而位置(K-1,K-1)在右下角。取决于针对该块计算的梯度值,将变换应用于滤波器系数f(k,l)和剪裁值c(k,l)。下表总结了变换与四个方向的四个梯度之间的关系。
表2-5针对一个块计算的梯度与变换的映射
梯度值 | 变换 |
g<sub>d2</sub><g<sub>d1</sub>且g<sub>h</sub><g<sub>v</sub> | 无变换 |
g<sub>d2</sub><g<sub>d1</sub>且g<sub>v</sub><g<sub>h</sub> | 对角 |
g<sub>d1</sub><g<sub>d2</sub>且g<sub>h</sub><g<sub>v</sub> | 垂直翻转 |
g<sub>d1</sub><g<sub>d2</sub>且g<sub>v</sub><g<sub>h</sub> | 旋转 |
2.8.1.4滤波器参数信令通知
在VTM5中,在自适应参数集(APS)中信令通知ALF滤波器参数。在一个APS中,最多可以信令通知25个亮度滤波器系数和剪裁值索引的集合,以及最多一个色度滤波器系数和剪裁值索引的集合。为了减少比特开销,可以合并不同分类的滤波器系数。在条带头中,信令通知用于当前条带的APS的索引。
从APS解码的剪裁值索引允许使用剪裁值的亮度表和剪裁值的色度表来确定剪裁值。这些剪裁值取决于内部比特深度。更精确地,裁剪值的亮度表和裁剪值的色度表通过以下公式获得:
其中B等于内部比特深度,N等于4,这是VTM5.0中允许的剪裁值的数量。
可以在CTB级别控制滤波过程。始终信令通知标志,以指示是否将ALF应用于亮度CTB。亮度CTB可以从16个固定滤波器集合和来自APS的滤波器集合中选择滤波器集合。信令通知用于亮度CTB的滤波器集合索引,以指示应用了哪个滤波器集合。16个固定滤波器集合在编码器和解码器两者中是预定义和硬编解码的。
滤波器系数以等于128的范数进行量化。为了限制乘法复杂度,应用比特流一致性,使得非中心位置的系数值应在-27至27-1的范围内(含端值)。中心位置系数未在比特流中信令通知,并且被认为等于128。
2.8.1.5滤波过程
在解码器侧,当针对CTB启用ALF时,对CU内的每个样点R(i,j)进行滤波,得到样点值R′(i,j),如下所示,
R′(i,j)=R(i,j)+((∑k≠0∑l≠0f(k,l)×K(R(i+k,j+l)-R(i,j),c(k,l))+64>>7)(2-9-14)
其中,f(k,l)表示解码的滤波器系数,K(x,y)是剪裁函数,并且c(k,l)表示解码的剪裁参数。变量k和l在和之间变化,其中L表示滤波器长度。裁剪函数K(x,y)=min(y,max(-y,x))对应于函数Clip3(-y,y,x)。
2.8.1.6减少线缓冲器的虚拟边界滤波过程
在VTM5中,为了减少ALF的线缓冲器要求,对水平CTU边界附近的样点采用修改的块分类和滤波。为此,通过移位具有“N”个样点的水平CTU边界将虚拟边界定义为线,如图10所示,其中对于亮度分量N等于4,而对于色度分量N等于2。
图10示出了在虚拟边界处的修改的块分类的示例。
如图11所示,将修改的块分类应用于亮度分量,通过考虑在一维拉普拉斯梯度计算中使用的样点的减少的数量,来相应地缩放活度值A。
对于滤波处理,在虚拟边界处的对称填充操作用于亮度和色度分量两者。如图11所示,当被滤波的样点位于虚拟边界下方时,填充位于虚拟边界上方的邻域样点。同时,也对称地填充另一侧处的对应样点。
图11示出了在虚拟边界处的用于亮度分量的修改的ALF滤波的示例。
2.9样点自适应偏移(SAO)
编码器通过使用为每个CTB指定的偏移,将样点自适应偏移(SAO)应用于在解块滤波器之后的重建信号。HM编码器首先决定是否将SAO过程应用于当前条带。如果将SAO应用于条带,则每个CTB被分类为表2-6中所示的五种SAO类型中的一种。SAO的概念是将像素分类到各类别,并通过向每个类别的像素添加偏移来减少失真。SAO操作包括边缘偏移(EdgeOffset,EO)和带偏移(Band Offset,BO),该边缘偏移(EO)对SAO类型1-4中的像素分类使用边缘属性,该带偏移(BO)对SAO类型5中的像素分类使用像素强度。每个适用的CTB具有SAO参数,包括sao_merge_left_flag、sao_merge_up_flag、SAO类型和四个偏移。如果sao_merge_left_flag等于1,则当前CTB将重用SAO类型和CTB向左的偏移。如果sao_merge_up_flag等于1,则当前CTB将重用SAO类型和CTB向上的偏移。
表2–6 SAO类型的规定
SAO类型 | 要使用的样点自适应偏移类型 | 类别号 |
0 | 无 | 0 |
1 | 1维0度图案边缘偏移 | 4 |
2 | 1维90度图案边缘偏移 | 4 |
3 | 1维135度图案边缘偏移 | 4 |
4 | 1维45度图案边缘偏移 | 4 |
5 | 带偏移 | 4 |
2.9.1每种SAO类型的操作
边缘偏移通过考虑边缘定向信息对当前像素p的分类使用四个1维3像素图案,如图12所示。从左到右,它们分别是:0度、90度、135度和45度。
图12示出了EO中的像素分类的四个1维3像素图案的示例。
每个CTB根据表2–7分类为五个类别中的一个。
表2–7 EO的像素分类规则
类别 | 条件 | 含义 |
0 | 以下都不是 | 大部分单调 |
1 | p<2领域 | 局部最小值 |
2 | p<1领域&&p==1领域 | 边缘 |
3 | p>1领域&&p==1领域 | 边缘 |
4 | p>2领域 | 局部最大值 |
带偏移(BO)通过使用像素值的五个最高有效比特作为带索引,将一个CTB区域中的所有像素分类为32个均匀带。换言之,像素强度范围被分为从零到最大强度值(例如,对于8比特像素为255)的32个相等的段。四个相邻的带被分组在一起,每个组由其最左边的位置指示,如图13所示。编码器搜索所有位置,以通过补偿每个带的偏移来获得具有最大失真减小的组。
图13示出了四个带被分组在一起并由其起始带位置表示的示例。
2.10组合的帧间和帧内预测(CIIP)
在VTM5中,当以Merge模式编解码CU时,如果CU包含至少64个亮度样点(即CU宽度乘以CU高度等于或大于64),并且如果CU宽度和CU高度都如果小于128个亮度样点,则信令通知附加标志以指示是否将组合的帧间/帧内预测(CIIP)模式应用于当前CU。顾名思义,CIIP预测将帧间预测信号与帧内预测信号进行组合。CIIP模式下的帧间预测信号Pinter是使用与应用于常规Merge模式相同的帧间预测过程导出的;并且帧内预测信号Pintra是在具有平面模式的常规帧内预测过程之后导出的。然后,使用加权平均对帧内和帧间预测信号进行组合,其中,取决于顶邻域块和左邻域块(如图14所示)的编解码模式来计算权重值,如下:
–如果顶领域可用并且是帧内编解码的,则将isIntraTop设置为1,否则将isIntraTop设置为0;
–如果左领域可用并且是帧内编解码的,则将isIntraLeft设置为1,否则将isIntraLeft设置为0;
–如果(isIntraLeft+isIntraLeft)等于2,则将wt设置为3;
–否则,如果(isIntraLeft+isIntraLeft)等于1,则将wt设置为2;
–否则,将wt设置为1。
CIIP预测被形成如下:
PCIIP=((4-wt)*Pinter+wt*Pintra+2)>>2 (3-2)
图14示出了在CIIP权重导出中使用的顶邻域块和左邻域块的示例。
2.11具有色度缩放的亮度映射(LMCS)
在VTM5中,在环路滤波器之前,将称为具有色度缩放的亮度映射(LMCS)的编解码工具添加为新的处理块。LMCS有两个主要组成部分:1)基于自适应分段线性模型的亮度分量的环路映射;2)对于色度分量,应用取决于亮度的色度残差缩放。图15从解码器的角度示出了LMCS架构。在图15的块中,其包括逆量化、逆变换、亮度帧内预测以及将亮度预测与亮度残差相加,该处理被应用于映射域。图15中无阴影的块指示在原始(即,非映射)域中的何处应用处理;并且这些包括诸如去块、ALF和SAO的环路滤波器,运动补偿预测,色度帧内预测,将色度预测与色度残差相加,以及将解码的图片存储为参考图片。图15示出了新的LMCS功能块,包括亮度信号以及取决于亮度的色度缩放过程的前向映射和逆映射。像VVC中的大多数其它工具一样,可以使用SPS标志在序列级别启用/禁用LMCS。
图15示出了具有色度缩放的亮度映射架构的示例。
2.12双树分割
在当前的VVC设计中,对于I条带,可以使用隐式四叉树划分将每个CTU划分为具有64x64亮度样点的编解码单元,并且这些编解码单元是用于亮度和色度的两个分开的coding_tree语法结构的根。
由于与亮度编解码树相比,帧内图片中的双树允许在色度编解码树中应用不同的分割,因此双树引入了更长的编解码管线,并且色度树中的QTBT MinQTSizeC值范围以及MinBtSizeY和MinTTSizeY允许较小的色度块,诸如2x2、4x2和2x4。这给实际的解码器设计带来了困难。此外,若干预测模式(诸如CCLM、平面和角度模式)需要乘法。为了减轻上述问题,在双树中限制小的色度块尺寸(2×2/2×4/4×2)作为分割限制。
2.13 JVET-O0050中的最小色度帧内预测单元(SCIPU)
小色度尺寸对硬件实现方式不友好。在双树情况下,不允许具有过小尺寸的色度块。但是,在单树情况下,VVC草案5仍允许2x2、2x4、4x2色度块。为了限制色度块的尺寸,在单个编解码树中,SCIPU在JVET-O0050中定义为编解码树节点,该编解码树节点的色度块尺寸大于或等于TH色度样点并且具有至少一个小于4TH亮度样点的子亮度块,其中在此稿中TH设置为16。要求在每个SCIPU中,所有CB都是帧间的,或者所有CB是非帧间,即帧内或IBC。在非帧间SCIPU的情况下,进一步要求非帧间SCIPU的色度不应该被进一步划分并且SCIPU的亮度被允许进一步划分。这样,最小的色度帧内CB尺寸为16个色度样点,并移除2x2、2x4和4x2的色度CB。另外,在非帧间SCIPU的情况下,不应用色度缩放。
图16示出了两个SCIPU示例。在图16(a)中,一个8x4色度样点的色度CB和三个亮度CB(4x8、8x8、4x8亮度CB)形成一个SCIPU,因为从8x4色度样点中划分的三叉树(TT)将导致色度CB小于16个色度样点。在图16(b)中,一个4x4色度样点的色度CB(8x4色度样点的左侧)和三个亮度CB(8x4、4x4、4x4亮度CB)形成一个SCIPU,并且另一个4x4样点的色度CB(8x4色度样点的右侧)和两个亮度CB(8x4、8x4亮度CB)形成一个SCIPU,因为从4x4色度样点中划分的二叉树(BT)将导致色度CB小于16个色度样点。
图16示出了SCIPU示例。
如果当前条带是I条带或当前SCIPU在进一步划分一次之后其中具有4x4亮度分割,则将SCIPU的类型推断为非帧间的(因为在VVC中不允许帧间4x4);否则,在解析SCIPU中的CU之前,通过一个信令通知的标志来指示SCIPU的类型(帧间或非帧间)。
2.14 VVC草案6中的小色度块约束
在VVC草案6(JVET-O2001-vE.docx)中,对小色度块的约束实现如下(有关的部分被标记为粗体斜体)。
变量modeTypeCondition导出如下:
–如果以下条件中的一个为真,则将modeTypeCondition设置为等于0
–slice_type==I,并且qtbtt_dual_tree_intra_flag等于1
–modeTypeCurr不等于MODE_TYPE_ALL
–否则,如果以下条件中的一个为真,则将modeTypeCondition设置为等于1
–cbWidth*cbHeight等于64,并且split_qt_flag等于1
–cbWidth*cbHeight等于64,并且MttSplitMode[x0][y0][mttDepth]等于SPLIT_TT_HOR或SPLIT_TT_VER
–cbWidth*cbHeight等于32,并且MttSplitMode[x0][y0][mttDepth]等于SPLIT_BT_HOR或SPLIT_BT_VER
–否则,如果以下条件中的一个为真,则将modeTypeCondition设置为等于1+(slice_type!=I?1:0)
–cbWidth*cbHeight等于64,并且MttSplitMode[x0][y0][mttDepth]等于SPLIT_BT_HOR或SPLIT_BT_VER
–cbWidth*cbHeight等于128,并且MttSplitMode[x0][y0][mttDepth]等于SPLIT_TT_HOR或SPLIT_TT_VER
–否则,将modeTypeCondition设置为等于0
允许的四划分过程
此过程的输入是:
–亮度样点中的编解码块尺寸cbSize,
–多种类型的树深度mttDepth,
–变量treeType,其指定是使用单树(SINGLE_TREE)还是双树对CTU进行分割,并且在使用双树时,指定当前正在处理亮度(DUAL_TREE_LUMA)还是色度分量(DUAL_TREE_CHROMA),
–变量modeType,其指定是否可以使用帧内(MODE_INTRA)、IBC(MODE_IBC)、调色板(MODE_PLT)和帧间编解码模式(MODE_TYPE_ALL),或者仅可以使用帧内、IBC和调色板编解码模式(MODE_TYPE_INTRA),或者仅可以使用帧间编解码模式(MODE_TYPE_INTER),以用于编解码树节点内部的编解码单元。
此过程的输出是变量allowSplitQt。
变量allowSplitQt导出如下:
–如果以下条件中的一个或多个为真,则将allowSplitQt设置为等于假:
–treeType等于SINGLE_TREE或DUAL_TREE_LUMA,并且cbSize小于或等于MinQtSizeY
–treeType等于DUAL_TREE_CHROMA,并且cbSize/SubWidthC小于或等于MinQtSizeC
–mttDepth不等于0
–treeType等于DUAL_TREE_CHROMA,并且(cbSize/SubWidthC)小于或等于4
–treeType等于DUAL_TREE_CHROMA,并且modeType等于MODE_TYPE_INTRA
–否则,将allowSplitQt设置为等于真。
允许的二进制划分过程
此过程的输入是:
–二进制划分模式btSplit,
–亮度样点中的编解码块宽度cbWidth,
–亮度样点中的编解码块高度cbHeight,
–所考虑的编解码块的左上亮度样点相对于图片的左上亮度样点的位置(x0,y0),
–多种类型的树深度mttDepth,
–具有偏移的最大多种类型的树深度maxMttDepth,
–最大二叉树尺寸maxBtSize,
–最小四叉树尺寸minQtSize,
–分割索引partIdx,
–变量treeType,其指定是使用单树(SINGLE_TREE)还是双树对CTU进行分割,并且在使用双树时,指定当前正在处理亮度(DUAL_TREE_LUMA)还是色度分量(DUAL_TREE_CHROMA),
–变量modeType,其指定是否可以使用帧内(MODE_INTRA)、IBC(MODE_IBC)、调色板(MODE_PLT)和帧间编解码模式(MODE_TYPE_ALL),或者仅可以使用帧内、IBC和调色板编解码模式(MODE_TYPE_INTRA),或者仅可以使用帧间编解码模式(MODE_TYPE_INTER),以用于编解码树节点内部的编解码单元。
此过程的输出是变量allowBtSplit。
表6–2基于btSplit的parallelTtSplit和cbSize的规定
btSplit==SPLIT_BT_VER | btSplit==SPLIT_BT_HOR | |
parallelTtSplit | SPLIT_TT_VER | SPLIT_TT_HOR |
cbSize | cbWidth | cbHeight |
变量parallelTtSplit和cbSize如表6–2中规定的被导出。
变量allowBtSplit导出如下:
–如果以下条件中一个或多个为真,则将allowBtSplit设置为等于假:
–cbSize小于或等于MinBtSizeY
–cbWidth大于maxBtSize
–cbHeight大于maxBtSize
–mttDepth大于或等于maxMttDepth
–treeType等于DUAL_TREE_CHROMA,并且(cbWidth/SubWidthC)*(cbHeight/SubHeightC)小于或等于16
–treeType等于DUAL_TREE_CHROMA,并且modeType等于MODE_TYPE_INTRA
–否则,如果以下所有条件为真,则将allowBtSplit设置为等于假
–btSplit等于SPLIT_BT_VER
–y0+cbHeight大于pic_height_in_luma_samples
–否则,如果以下所有条件为真,则将allowBtSplit设置为等于假
–btSplit等于SPLIT_BT_VER
–cbHeight大于MaxTbSizeY
–x0+cbWidth大于pic_width_in_luma_samples
–否则,如果以下所有条件为真,则将allowBtSplit设置为等于假
–btSplit等于SPLIT_BT_HOR
–cbWidth大于MaxTbSizeY
–y0+cbHeight大于pic_height_in_luma_samples
–否则,如果以下所有条件为真,则将allowBtSplit设置为等于假
–x0+cbWidth大于pic_width_in_luma_samples
–y0+cbHeight大于pic_height_in_luma_samples
–cbWidth大于minQtSize
–否则,如果以下所有条件为真,则将allowBtSplit设置为等于假
–btSplit等于SPLIT_BT_HOR
–x0+cbWidth大于pic_width_in_luma_samples
–y0+cbHeight小于或等于pic_height_in_luma_samples
–否则,如果以下所有条件为真,则将allowBtSplit设置为等于假:
–mttDepth大于0
–partIdx等于1
-MttSplitMode[x0][y0][mttDepth-1]等于parallelTtSplit
–否则,如果以下所有条件为真,则将allowBtSplit设置为等于假
–btSplit等于SPLIT_BT_VER
–cbWidth小于或等于MaxTbSizeY
–cbHeight大于MaxTbSizeY
–否则,如果以下所有条件为真,则将allowBtSplit设置为等于假
–btSplit等于SPLIT_BT_HOR
–cbWidth大于MaxTbSizeY
–cbHeight小于或等于MaxTbSizeY
–否则,将allowBtSplit设置为等于真。
允许的三进制划分过程
此过程的输入是:
–三进制划分模式ttSplit,
–亮度样点中的编解码块宽度cbWidth,
–亮度样点中的编解码块高度cbHeight,
–所考虑的编解码块的左上亮度样点相对于图片的左上亮度样点的位置(x0,y0),
–多种类型的树深度mttDepth
–具有偏移的最大多种类型的树深度maxMttDepth,
–最大三叉树尺寸maxTtSize,
–变量treeType,其指定是使用单树(SINGLE_TREE)还是双树对CTU进行分割,并且在使用双树时,指定当前正在处理亮度(DUAL_TREE_LUMA)还是色度分量(DUAL_TREE_CHROMA),
–变量modeType,其指定是否可以使用帧内(MODE_INTRA)、IBC(MODE_IBC)、调色板(MODE_PLT)和帧间编解码模式(MODE_TYPE_ALL),或者仅可以使用帧内、IBC和调色板编解码模式(MODE_TYPE_INTRA),或者仅可以使用帧间编解码模式(MODE_TYPE_INTER),以用于编解码树节点内部的编解码单元。
此过程的输出是变量allowTtSplit。
表6–3基于ttSplit的cbSize的规定
ttSplit==SPLIT_TT_VER | ttSplit==SPLIT_TT_HOR | |
cbSize | cbWidth | cbHeight |
变量cbSize如表6–3中规定的被导出。
变量allowTtSplit导出如下:
–如果以下条件中一个或多个为真,则将allowTtSplit设置为等于假:
–cbSize小于或等于2*MinTtSizeY
–cbWidth大于Min(MaxTbSizeY,maxTtSize)
–cbHeight大于Min(MaxTbSizeY,maxTtSize)
–mttDepth大于或等于maxMttDepth
–x0+cbWidth大于pic_width_in_luma_samples
–y0+cbHeight大于pic_height_in_luma_samples
–treeType等于DUAL_TREE_CHROMA,并且(cbWidth/SubWidthC)*(cbHeight/SubHeightC)小于或等于32
–treeType等于DUAL_TREE_CHROMA,并且modeType等于MODE_TYPE_INTRA
–否则,将allowTtSplit设置为等于真。
pred_mode_flag等于0指定当前编解码单元是以帧间预测模式编解码的。pred_mode_flag等于1指定当前编解码单元是以帧内预测模式编解码的。
当不存在pred_mode_flag时,推断如下:
-如果cbWidth等于4和cbHeight等于4,则推断pred_mode_flag等于1。
–否则,如果modeType等于MODE_TYPE_INTRA,则推断pred_mode_flag等于1。
–否则,如果modeType等于MODE_TYPE_INTER,则推断pred_mode_flag等于0。
–否则,分别在解码I条带时推断pred_mode_flag等于1,在解码P或B条带时推断pred_mode_flag等于0。
对于x=x0..x0+cbWidth-1且y=y0..y0+cbHeight-1,变量CuPredMode[chType][x][y]导出如下:
–如果pred_mode_flag等于0,则将CuPredMode[chType][x][y]设置为等于MODE_INTER。
–否则(pred_mode_flag等于1),将CuPredMode[chType][x][y]设置为等于MODE_INTRA。
pred_mode_ibc_flag等于1指定当前编解码单元是以IBC预测模式编解码的。pred_mode_ibc_flag等于0指定当前编解码单元不是以IBC预测模式编解码的。
当不存在pred_mode_ibc_flag时,推断如下:
–如果cu_skip_flag[x0][y0]等于1,且cbWidth等于4,且cbHeight等于4,则推断pred_mode_ibc_flag等于1。
–否则,如果cbWidth和cbHeight都等于128,则推断pred_mode_ibc_flag等于0。
–否则,如果modeType等于MODE_TYPE_INTER,则推断pred_mode_ibc_flag等于0。
–否则,如果treeType等于DUAL_TREE_CHROMA,则推断pred_mode_ibc_flag等于0。
–否则,分别在解码I条带时推断pred_mode_ibc_flag等于sps_ibc_enabled_flag的值,在解码P或B条带时推断pred_mode_ibc_flag等于0。
当pred_mode_ibc_flag等于1时,对于x=x0..x0+cbWidth–1且y=y0..y0+cbHeight-1,将变量CuPredMode[chType][x][y]设置为等于MODE_IBC。
3.问题
1.当前,IBC被视为MODE_TYPE_INTRA,并且因此不允许小色度块,这导致不必要的编解码效率损失。
2.当前,调色板被视为MODE_TYPE_INTRA,并且因此不允许小色度块,这导致不必要的编解码效率损失。
3.当前,小色度块约束不考虑颜色子采样格式。
4.当前,对小块的相同分割和预测模式约束被应用于所有色度格式。然而,可能期望在4:2:0和4:2:2色度格式中对小块设计不同的约束机制。
5.当前,调色板模式标志信令通知取决于modeType,这是不期望的,因为调色板可能不应用小块约束。
6.当前,在cu_skip_flag等于1但MODE_TYPE等于MODE_TYPE_INTRA的情况下,对于P/B条带,推断IBC模式标志为0,这在语法解析中是不合法的。
7.当前,对于SCIPU亮度块不允许非4x4亮度IBC模式,这可能是不期望的,并且可能导致编解码效率损失。
8.仍然允许2x H色度块,这对硬件实现方式不友好。
9.尽管CIIP使用帧内预测,但CIIP被视为MODE_INTER,这在一些情况下打破了约束。
4.技术方案和实施例的示例
以下列出的应被视为示例。这些技术不应狭义地解释。此外,可以以任何方式组合这些技术。
在本文档中,“MxN编解码树节点”指示M×N块,在亮度样点中M是块宽度,N是块高度,其可以被进一步分割,诸如通过QT/BT/TT。例如,块可以是QT节点或BT节点或TT节点。编解码树节点可以是编解码单元(例如,对于单树具有三个颜色分量,对于双树色度编解码具有两个色度颜色分量,而对于双树亮度编解码仅具有亮度颜色分量),或亮度编解码块,或色度编解码块。“小编解码树节点单元”可以指示在亮度样点中块尺寸MxN等于32/64/128的编解码树节点。
如果没有特别提及,则在亮度样点中测量编解码块的宽度W和高度H。例如,MxN编解码块是指MxN亮度块,和/或两个(M/SubWidthC)x(N/SubHeightC)色度块,其中SubWidthC和SubHeightC由色度格式导出如下。
1.是否和/或如何分割为小块可以取决于颜色格式。
a.在一个示例中,对于4:4:4颜色格式,对色度块尺寸的约束可以遵循对亮度块的那些约束。
b.在一个示例中,对于4:2:2颜色格式,对色度块尺寸的约束可以遵循对于4:2:0颜色格式的那些约束。
c.在一个示例中,对于4:0:0和/或4:4:4色度格式,可以不应用对小块分割和/或预测模式的约束。
d.在一个示例中,对于不同的色度格式可以不同地应用对小块分割和/或预测模式的约束。
i.在一个示例中,对于具有水平BT划分的MxN(诸如8x8)编解码树节点,在4:2:2色度格式中,可以对于色度块和亮度块两者允许水平BT划分,而在4:2:0色度格式中,可以对于亮度块允许但对于色度块禁用水平BT划分。
ii.在一个示例中,对于具有垂直BT划分的MxN(诸如16x4)编解码树节点,在4:2:2色度格式中,可以对于色度块和亮度块两者允许垂直BT划分,而在4:2:0色度格式中,可以对于亮度块允许但对于色度块禁用垂直BT划分。
iii.在一个示例中,对于具有水平TT划分的MxN(诸如8x16)编解码树节点,在4:2:2色度格式中,可以对于色度块和亮度块两者允许水平TT划分,而在4:2:0色度格式中,可以对于亮度块允许但对于色度块禁用水平TT划分。
iv.在一个示例中,对于具有垂直TT划分的MxN(诸如32x4)编解码树节点,在4:2:2色度格式中,可以对于色度块和亮度块两者允许垂直TT划分,而在4:2:0色度格式中,可以对于亮度块允许但对于色度块禁用垂直TT划分。
v.在一个示例中,对于4:0:0和/或4:4:4颜色格式,可以不应用小块约束。
e.在一示例中,是否启用SCIPU取决于颜色格式。
i.在一个示例中,对于4:2:0和4:2:2颜色格式启用SCIPU。
ii.在一个示例中,对于4:0:0和/或4:4:4颜色格式禁用SCIPU。2.如何确定用于编解码树节点的(子)块的预测模式(和/或modeType)
可以取决于色度格式。
a.在一个示例中,如果以下条件中的一个为真,则对于4:2:2色度格式由此编解码树节点分割的(子)块的modeType可以等于MODE_TYPE_ALL,而对于4:2:0色度格式,modeType可以等于MODE_TYPE_INTRA或MODE_TYPE_INTER。
i.具有水平BT划分的MxN(诸如8x8)编解码树节点
ii.具有垂直BT划分的MxN(诸如16x4)编解码树节点
iii.具有水平TT划分的MxN(诸如8x16)编解码树节点
iv.具有垂直TT划分的MxN(诸如32x4)编解码树节点
例如,当以下条件中的一个为真时,对于4:2:2可以将modeType设置为MODE_TYPE_ALL;而对于4:2:0,modeType必须为MODE_TYPE_INTRA或MODE_TYPE_INTER:i)具有水平BT的亮度8x8块,ii)具有垂直BT的亮度16x4块,iii)具有水平TT的亮度8x16块,iv)具有垂直TT的亮度32×4块。
因此,对于在编解码树中具有三个颜色分量的块,当上述条件中的一个为真时,4:2:0的块不被归类为MODE_TYPE_ALL(其中可以选择所有编解码模式)。它是MODE_TYPE_INTRA(其中块可以选择调色板、帧内或帧内块复制)或MODE_TYPE_INTER(其中只可以选择帧间模式)。
3.可以不允许块宽度等于M(诸如,M=2)色度样点的色度帧内(和/或IBC)块。
a.在一个示例中,在双树中可以不允许2×N(诸如N≤64)色度帧内块。
i.在一个示例中,当treeType等于DUAL_TREE_CHROMA并且块宽度等于4个色度样点时,可以禁用垂直BT划分。
ii.在一个示例中,当treeType等于DUAL_TREE_CHROMA并且块宽度等于8个色度样点时,可以禁用垂直TT划分。
b.在一个示例中,在单树中可以不允许2xN(诸如N<=64)色度帧内(和/或IBC)块。
i.在一个示例中,对于具有垂直BT划分的M×N(诸如M=8和N<=64)编解码树节点,可以应用以下过程中的一个。
1.对于4xN或4x(N/2)色度块,可以不允许垂直BT划分,但对于8xN亮度块,可以允许垂直BT划分。
2.4xN或4x(N/2)色度块可以不是垂直BT划分,并且它可以由MODE_INTRA或MODE_IBC编解码。
3.对于8xN亮度块和4xN或4x(N/2)色度块两者可以允许垂直BT划分,但是亮度块和色度块两者不以MODE_INTRA编解码(例如,可以以MODE_INTER或MODE_IBC编解码)。
ii.在一个示例中,对于具有垂直TT划分的M×N(诸如M=16和N<=64)编解码树节点,可以应用以下过程中的一个。
1.对于8xN或8x(N/2)色度块,可以不允许垂直TT划分,但对于16xN亮度块,可以允许垂直TT划分。
2.8xN或8×(N/2)色度块可以不是垂直TT划分,并且以MODE_INTRA或MODE_IBC编解码。
3.对于16xN亮度块和8xN或8×(N/2)色度块两者可以允许垂直TT划分,但是亮度块和色度块两者可以不以MODE_INTRA编解码(例如,可以以MODE_INTER或MODE_IBC编解码)。
4.无论亮度块和/或色度块是否为小块尺寸,对于亮度块和/或色度块都可以允许IBC模式。
a.在一个示例中,对于亮度块——包括8×4/8×8/16×4和4xN(诸如N<=64)亮度块——可以允许IBC模式,即使modeType等于MODE_TYPE_INTRA。
b.在一个示例中,对于色度块可以允许IBC模式,即使modeType等于MODE_TYPE_INTRA。
5.IBC预测模式标志的信令通知可以取决于预测模式类型(例如,MODE_TYPE_INTRA)。
a.在一个示例中,当treeType不等于DUAL_TREE_CHROMA并且modeType等于MODE_TYPE_INTRA时,可以在比特流中显式信令通知用于非SKIP块(例如,不以跳过模式编解码的编解码块)的IBC预测模式标志。
6.可以取决于CU SKIP标志和模式类型(例如,modeType)来推断IBC预测模式标志。
a.在一个示例中,如果当前块以跳过模式编解码(诸如cu_skip_flag等于1),并且modeType等于MODE_TYPE_INTRA,则IBC预测模式标志(诸如pred_mode_ibc_flag)可以推断为等于1。
7.调色板模式标志的显式信令通知可以不取决于modeType。
a.在一个示例中,无论modeType是什么,调色板模式标志(诸如pred_mode_plt_flag)信令通知都可以取决于条带类型、块尺寸、预测模式等。
b.在一个示例中,当modeType等于MODE_TYPE_INTER或MODE_TYPE_INTRA时,将调色板模式标志(诸如pred_mode_plt_flag)推断为0。
8.当modeType等于MODE_TYPE_INTER时可以允许使用IBC模式
a.在一个示例中,当modeType等于MODE_TYPE_INTRA时,可以不允许色度IBC。
b.在一个示例中,当modeType等于MODE_TYPE_INTRA或MODE_TYPE_INTER时,可以允许使用IBC模式。
c.在一个示例中,无论modeType是什么,都可以允许使用IBC模式。
d.在一个示例中,在一个SCIPU内,可以允许IBC和帧间模式两者。
e.在一个示例中,IBC色度块的尺寸可以总是对应于对应的亮度块的尺寸。
f.在一个示例中,当modeType等于MODE_TYPE_INTER并且亮度中编解码单元尺寸为4x4时,可以跳过pred_mode_ibc_flag的信令通知并且可以推断pred_mode_ibc_flag等于1。
9.当modeType为MODE_TYPE_INTER时,可以允许使用调色板模式
a.在一个示例中,当modeType为MODE_TYPE_INTRA时,可以不允许色度调色板。
b.在一个示例中,当modeType等于MODE_TYPE_INTRA或MODE_TYPE_INTER时,可以允许使用调色板模式。
c.在一个示例中,不管modeType是什么,可以允许使用调色板模式。
d.在一个示例中,在一个SCIPU内,可以允许调色板和帧间模式二者。
e.在一个示例中,在一个SCIPU内,可以允许调色板、IBC和帧间模式全部。
f.在一个示例中,调色板色度块的尺寸可以总是对应于对应的亮度块的尺寸。
g.在一个示例中,当modeType等于MODE_TYPE_INTER并且在亮度中编解码单元尺寸为4x4时,可以跳过pred_mode_plt_flag的信令通知并且可以推断pred_mode_plt_flag等于1。
h.在一个示例中,当modeType等于MODE_TYPE_INTER并且亮度中编解码单元尺寸为4×4时,可以发送一条消息来指示当前预测模式是IBC还是调色板。
10.对于宽度等于M(例如,M=2)或高度等于N(例如,N=2)的小色度块,被允许的帧内预测模式可以被限制为与大色度块所允许的帧内预测模式不同。
a.在一个示例中,可以仅使用可用色度帧内预测模式的帧内预测模式的子集。
b.在一个示例中,可以仅使用INTRA_DC模式。
c.在一个示例中,可以仅使用INTRA_PLANAR模式。
d.在一个示例中,可以仅使用INTRA_ANGULAR18模式。
e.在一个示例中,可以仅使用INTRA_ANGULAR50模式。
f.在一个示例中,可以不允许CCLM模式。
11.对于宽度等于M(例如,M=2)或高度等于N(例如,N=2)的小色度块,变换类型可以被限制为与大色度块所允许的变换类型不同。
a.在一个示例中,可以仅使用变换跳过。
b.在一个示例中,可以仅使用一维变换。
c.在一个示例中,不允许支持多种类型变换的编解码工具。
i.可替代地,省略支持多种类型变换的编解码工具的信令通知。
12.CIIP可以被视为MODE_TYPE_INTRA。
a.在一个示例中,当使用双树分割时,可以允许CIIP模式。
i.在一个示例中,当CU类型为DUAL_TREEE_CHROMA时,可以允许CIIP模式。
b.可替代地,CIIP可以被视为MODE_TYPE_INTER
i.在一个示例中,当色度块宽度等于M(例如,M=2)时,可以不允许CIIP模式。
ii.在一个示例中,当色度块宽度等于M(例如,M=2)时,CIIP中用于色度的帧内预测模式可以被限制为简单帧内预测模式。
1.在一个示例中,当色度块宽度等于M(例如,M=2)时,可以将INTRA_DC用于色度帧内预测。
2.在一个示例中,当色度块宽度等于M(例如,M=2)时,可以将INTRA_ANGULAR18用于色度帧内预测。
3.在一个示例中,当色度块宽度等于M(例如,M=2)时,可以将INTRA_ANGULAR50用于色度帧内预测。
iii.在一个示例中,CIIP中用于色度的帧内预测模式可以被限制为简单的帧内预测模式。
1.在一个示例中,可以将INTRA_DC用于色度帧内预测。
2.在一个示例中,可以将INTRA_ANGULAR18模式用于色度帧内预测。
3.在一个示例中,可以将INTRA_ANGULAR50模式用于色度帧内预测。
13.对于以上项目符号,变量M和/或N可以是预定义的或信令通知的。
a.在一个示例中,M和/或N可以进一步取决于颜色格式(例如4:2:0、4:2:2、4:4:4)。
5.实施例
新添加的部分以粗体和斜体突出显示,并且从VVC工作草案中删除的部分使用双括号标记(例如,[[a]]表示删除字符“a”)。修改基于最新的VVC工作草案(JVET-O2001-v11)
5.1示例实施例#1
以下实施例关于:对小块分割和预测模式的约束仅应用于4:2:0和4:4:4色度格式(不应用于4:0:0和4:4:4色度格式)。
7.4.9.4编解码树语义
变量modeTypeCondition导出如下:
–如果以下条件中的一个为真,则将modeTypeCondition设置为等于0
–slice_type==I,并且qtbtt_dual_tree_intra_flag等于1
–modeTypeCurr不等于MODE_TYPE_ALL
–chroma_format_idc等于0
–chroma_format_idc等于3
–否则,如果以下条件中的一个为真,则将modeTypeCondition设置为等于1
–cbWidth*cbHeight等于64,并且split_qt_flag等于1
–cbWidth*cbHeight等于64,并且MttSplitMode[x0][y0][mttDepth]等于SPLIT_TT_HOR或SPLIT_TT_VER
–cbWidth*cbHeight等于32,并且MttSplitMode[x0][y0][mttDepth]等于SPLIT_BT_HOR或SPLIT_BT_VER
–否则,如果以下条件中的一个为真,则将modeTypeCondition设置为等于1+(slice_type!=I?1:0)
–cbWidth*cbHeight等于64,并且MttSplitMode[x0][y0][mttDepth]等于SPLIT_BT_HOR或SPLIT_BT_VER
–cbWidth*cbHeight等于128,并且MttSplitMode[x0][y0][mttDepth]等于SPLIT_TT_HOR或SPLIT_TT_VER
–否则,将modeTypeCondition设置为等于0
5.2示例实施例#2
以下实施例关于:调色板模式标志的信令通知不取决于modeType。
7.3.8.5编解码单元语法
5.3示例实施例#3
以下实施例关于:取决于CU SKIP标志和modeType来推断IBC预测模式标志。
pred_mode_ibc_flag等于1指定当前编解码单元是以IBC预测模式下编解码的。pred_mode_ibc_flag等于0指定当前编解码单元不是以IBC预测模式编解码的。
当不存在pred_mode_ibc_flag时,推断如下:
–如果cu_skip_flag[x0][y0]等于1,且cbWidth等于4,且cbHeight等于4,则推断pred_mode_ibc_flag等于1。
–否则,如果cbWidth和cbHeight都等于128,则推断pred_mode_ibc_flag等于0。
–否则,如果cu_skip_flag[x0][y0]等于1,并且modeType等于MODE_TYPE_INTRA,则推断pred_mode_ibc_flag等于1。
–否则,如果modeType等于MODE_TYPE_INTER,则推断pred_mode_ibc_flag等于0。
–否则,如果treeType等于DUAL_TREE_CHROMA,则推断pred_mode_ibc_flag等于0。
–否则,分别在解码I条带时推断pred_mode_ibc_flag等于sps_ibc_enabled_flag的值,在解码P或B条带时推断pred_mode_ibc_flag等于0。
当pred_mode_ibc_flag等于1时,对于x=x0..x0+cbWidth–1且y=y0..y0+cbHeight-1,将变量CuPredMode[chType][x][y]设置为等于MODE_IBC。
5.4示例实施例#4
以下实施例关于:IBC预测模式标志的信令通知取决于MODE_TYPE_INTRA,和/或对于亮度块允许IBC模式,而无论亮度块是否为小块尺寸。
7.3.8.5编解码单元语法
5.5示例实施例#5
以下实施例关于:对于4:2:0和4:2:2颜色格式应用不同的帧内块约束。
7.4.9.4编解码树语义
变量modeTypeCondition导出如下:
–如果以下条件中的一个为真,则将modeTypeCondition设置为等于0
–slice_type==I,并且qtbtt_dual_tree_intra_flag等于1
–modeTypeCurr不等于MODE_TYPE_ALL
–否则,如果以下条件中的一个为真,则将modeTypeCondition设置为等于1
–cbWidth*cbHeight等于64,并且split_qt_flag等于1
–cbWidth*cbHeight等于64,并且MttSplitMode[x0][y0][mttDepth]等于SPLIT_TT_HOR或SPLIT_TT_VER
–cbWidth*cbHeight等于32,并且MttSplitMode[x0][y0][mttDepth]等于SPLIT_BT_HOR或SPLIT_BT_VER
–否则,如果以下条件中的一个为真,则将modeTypeCondition设置为等于1+(slice_type!=I?1:0)
–cbWidth*cbHeight等于64,并且MttSplitMode[x0][y0][mttDepth]等于SPLIT_BT_HOR或SPLIT_BT_VER,并且chroma_format_idc等于1
–cbWidth*cbHeight等于128,并且MttSplitMode[x0][y0][mttDepth]等于SPLIT_TT_HOR或SPLIT_TT_VER,并且chroma_format_idc等于1
–cbWidth等于8,并且cbHeight等于8,并且MttSplitMode[x0][y0][mttDepth]等于SPLIT_BT_VER,并且chroma_format_idc等于2
–cbWidth等于4,并且cbHeight等于16,并且MttSplitMode[x0][y0][mttDepth]等于SPLIT_BT_HOR,并且chroma_format_idc等于2
–cbWidth等于16,并且cbHeight等于8,并且MttSplitMode[x0][y0][mttDepth]等于SPLIT_TT_VER,并且chroma_format_idc等于2
–cbWidth等于4,并且cbHeight等于32,并且MttSplitMode[x0][y0][mttDepth]等于SPLIT_TT_HOR,并且chroma_format_idc等于2
–否则,将modeTypeCondition设置为等于0
5.6示例实施例#6
以下实施方式关于:在单树中不允许2×N色度帧内块。
7.4.9.4编解码树语义
变量modeTypeCondition导出如下:
–如果以下条件中的一个为真,则将modeTypeCondition设置为等于0
–slice_type==I,并且qtbtt_dual_tree_intra_flag等于1
–modeTypeCurr不等于MODE_TYPE_ALL
–否则,如果以下条件中的一个为真,则将modeTypeCondition设置为等于1
–cbWidth*cbHeight等于64,并且split_qt_flag等于1
–cbWidth*cbHeight等于64,并且MttSplitMode[x0][y0][mttDepth]等于SPLIT_TT_HOR或SPLIT_TT_VER
–cbWidth*cbHeight等于32,并且MttSplitMode[x0][y0][mttDepth]等于SPLIT_BT_HOR或SPLIT_BT_VER
–否则,如果以下条件中的一个为真,则将modeTypeCondition设置为等于1+(slice_type!=I?1:0)
–cbWidth*cbHeight等于64,并且MttSplitMode[x0][y0][mttDepth]等于SPLIT_BT_HOR或SPLIT_BT_VER
–cbWidth*cbHeight等于128,并且MttSplitMode[x0][y0][mttDepth]等于SPLIT_TT_HOR或SPLIT_TT_VER
–cbWidth等于8,并且MttSplitMode[x0][y0][mttDepth]等于SPLIT_BT_VER
–cbWidth等于16,并且MttSplitMode[x0][y0][mttDepth]等于SPLIT_TT_VER
–否则,将modeTypeCondition设置为等于0
5.7示例实施例#7
以下实施例关于:在双树中不允许2×N色度帧内块。
6.4.2允许的二进制划分过程
变量allowBtSplit导出如下:
–如果以下条件中一个或多个为真,则将allowBtSplit设置为等于假:
–cbSize小于或等于MinBtSizeY
–cbWidth大于maxBtSize
–cbHeight大于maxBtSize
–mttDepth大于或等于maxMttDepth
–treeType等于DUAL_TREE_CHROMA,并且(cbWidth/SubWidthC)*(cbHeight/SubHeightC)小于或等于16
–btSplit等于SPLIT_BT_VER,并且treeType等于DUAL_TREE_CHROMA,并且(cbWidth/SubWidthC)小于或等于4
–treeType等于DUAL_TREE_CHROMA,并且modeType等于MODE_TYPE_INTRA
…
6.4.3允许的三进制划分过程
变量allowTtSplit导出如下:
–如果以下条件中的一个或多个为真,则将allowTtSplit设置为等于假:
–cbSize小于或等于2*MinTtSizeY
–cbWidth大于Min(MaxTbSizeY,maxTtSize)
–cbHeight大于Min(MaxTbSizeY,maxTtSize)
–mttDepth大于或等于maxMttDepth
–x0+cbWidth大于pic_width_in_luma_samples
–y0+cbHeight大于pic_height_in_luma_samples
–treeType等于DUAL_TREE_CHROMA,并且(cbWidth/SubWidthC)*(cbHeight/SubHeightC)小于或等于32
–btSplit等于SPLIT_TT_VER,并且treeType等于DUAL_TREE_CHROMA,并且(cbWidth/SubWidthC)小于或等于8
–treeType等于DUAL_TREE_CHROMA,并且modeType等于MODE_TYPE_INTRA
–否则,将allowTtSplit设置为等于真。
5.8示例实施例#8
以下实施例关于:对于SCIPU色度块启用MODE_IBC。
7.3.8.5编解码单元语法
图17A是视频处理装置1700的框图。装置1700可以用于实现一个或多个本文所述的方法。装置1700可以实施在智能电话、平板计算机、计算机、物联网(IoT)接收器等中。装置1700可以包括一个或多个处理器1702,一个或多个存储器1704和视频处理硬件1706。(一个或多个)处理器1702可以被配置为实现本文档中描述的一个或多个方法。(一个或多个)存储器1704可以用于存储用于实现本文描述的方法和技术的数据和代码。视频处理硬件1706可以用于以硬件电路实现本文档中描述的一些技术。在一些实施例中,硬件1706可以至少部分地或完全地包括在处理器1702(例如,图形协处理器)内。
图17B是其中可实现所公开的技术的视频处理系统的框图的另一个示例。图17B是示出可以在其中实现本文所公开的各种技术的示例视频处理系统1710的框图。各种实现方式可以包括系统1710的一些或所有组件。系统1710可以包括输入1712,用于接收视频内容。视频内容可以以原始或未压缩的格式(例如8或10比特多分量像素值)接收,或者可以以压缩或编码的格式接收。输入1712可以表示网络接口、外围总线接口或储存接口。网络接口的示例包括有线接口(诸如以太网、无源光网络(PON)等)和无线接口(诸如Wi-Fi或蜂窝接口)。
系统1710可以包括编解码组件1714,该编解码组件1714可以实现本文中档描述的各种编解码或编码方法。编解码组件1714可以减少从编解码组件1714的输入1712到输出的视频的平均比特率,以产生视频的编解码表示。因此,编解码技术有时称为视频压缩或视频转码技术。如组件1716所示,编解码组件1714的输出可以被存储或经由所连接的通信来发送。在输入1712处接收的视频的存储或传送的比特流(或编解码)表示可以被组件1718使用,以生成被发送到显示接口1720的像素值或可显示视频。从比特流表示中生成用户可见视频的过程有时称为视频解压缩。此外,尽管某些视频处理操作被称为“编解码”操作或工具,但是应当理解,在编码器处使用编解码工具或操作,并且将由解码器执行将编解码结果相逆的对应的解码工具或操作。
外围总线接口或显示接口的示例可以包括通用串行总线(USB)或高清多媒体接口(HDMI)或Displayport等。储存接口的示例包括SATA(串行高级技术附件)、PCI、IDE接口等。本文档中描述的技术可以实施在各种电子设备中,诸如移动电话、膝上型计算机、智能电话或其它能够执行数字数据处理和/或视频显示的设备。
图18是用于处理视频的方法1800的流程图。方法1800包括:1802,对于视频的视频区域与视频区域的编解码表示之间的转换,根据语法规则解析编解码表示,该语法规则定义色度块尺寸和视频区域的颜色格式之间的关系;1804,通过根据语法规则执行解析来进行转换。
图21A是用于处理视频的方法2110的流程图。方法2110包括,在步骤2112中处,根据规则基于视频的颜色格式确定用于将视频的色度视频区域分割为一个或多个色度块的分割方案。方法2110还包括,在步骤2114处,根据分割方案在视频与视频的编解码表示之间进行转换。
图21B是用于处理视频的方法2120的流程图。方法2120包括,在步骤2122处,基于视频的颜色格式,确定用于视频的编解码树节点的子块的预测模式或预测类型。方法2120还包括,在步骤2124处,基于确定在视频与视频的编解码表示之间进行转换。在一些实现方式中,将编解码树节点分割为多个子块以用于在编解码表示中进行编解码。
图22A是用于处理视频的方法2210的流程图。方法2210包括,在步骤2212处,在视频和视频的编解码表示之间进行转换。在一些实现方式中,根据规则,在视频与编解码表示之间进行转换,该视频包括包含一个或多个亮度块和一个或多个色度的一个或多个视频区域,其中规则指定不允许使用帧内模式或帧内块复制模式在编解码表示中表示一个或多个色度块中的尺寸为MxN的色度块,其中M和N分别是指示色度块宽度和高度的整数,其中帧内模式包括基于先前编码或重建的视频块对色度块进行编码,并且其中帧内块复制模式包括至少使用指向包含视频区域的视频帧的块矢量来对色度块进行编码。
在一些实现方式中,在视频的色度块与视频的编解码表示之间进行转换,其中,根据尺寸规则使用帧内编解码模式在编解码表示中表示色度块;其中,尺寸规则指定:在色度块的宽度等于M或色度块的高度等于N的情况下,其中M和N是整数,帧内编解码模式来自帧内编解码模式类型的第一集合;否则,帧内编解码模式来自帧内编解码模式类型的第二集合。
在一些实现方式中,在视频的色度块与视频的编解码表示之间进行转换,其中,根据规则使用变换类型在编解码表示中表示色度块,其中,规则指定:在色度块的宽度等于M或色度块的高度等于N的情况下,其中M和N是整数,变换类型来自变换类型的第一集合;否则,变换类型来自变换类型的第二集合。
在一些实现方式中,根据规则在视频与视频的编解码表示之间进行转换,该视频包括具有一个或多个亮度块和一个或多个色度块的视频区域,其中,规则指定帧内块复制(IBC)模式的使用可用于块尺寸为MxN的一个或多个亮度块和一个或多个色度块,对于M和N的所有值,其中M和N是整数;其中,使用IBC模式,至少使用指向包含视频块的视频帧的块矢量来对视频块进行编码。
在一些实现方式中,在视频的视频块与视频块的编解码表示之间进行转换,其中编解码表示符合格式化规则,其中格式化规则指定基于视频块的模式类型在编解码表示中选择性地包括语法元素,该语法元素指示使用帧间块复制(IBC)模式,并且其中IBC模式包括至少使用指向包含视频块的视频帧的块矢量对视频块进行编码。
在一些实现方式中,在视频的视频块与视频块的编解码表示之间进行转换,其中编解码表示符合格式化规则,其中格式化规则指定无论视频块的模式类型在编解码表示中都包括语法元素,该语法元素指示使用调色板模式,并且其中调色板模式包括使用代表性样点值的调色板对视频块进行编码。
图22B是用于处理视频的方法2220的流程图。方法2220包括,在步骤2222处,对于视频的视频区域和视频的编解码表示之间的转换,根据规则确定使用组合的帧间和帧内预测(CIIP)模式作为帧内模式或帧间模式。方法2220还包括在步骤2224处基于该确定来进行转换。CIIP模式包括使用加权系数来组合帧内预测信号和帧间预测信号。
图23A是用于处理视频的方法2310的流程图。方法2310包括,在步骤2312处,对于视频的视频区域与视频的编解码表示之间的转换,基于规则确定准许对于视频区域使用帧间块复制(IBC)模式。方法2310还包括,在步骤2314处,基于确定来进行转换。IBC模式包括至少使用指向包含视频区域的视频帧的块矢量来对视频区域进行编码。
图23B是用于处理视频的方法2320的流程图。方法2320包括,在步骤2322处,对于视频的视频区域与视频的编解码表示之间的转换,基于规则确定是否准许对于视频区域使用调色板模式。方法2320还包括,在步骤2324中,基于确定来进行转换。在一些实现方式中,规则基于视频区域的编解码模式类型或视频区域的颜色类型,并且其中调色板模式包括使用代表性样点值的调色板对视频区域进行编码。
所公开的技术的一些实施例包括决定或确定启用视频处理工具或模式。在示例中,当启用视频处理工具或模式时,编码器将在视频块的处理中使用或实现该工具或模式,但是不一定基于该工具或模式的使用来修改所得到的比特流。换言之,从视频块到视频的比特流表示的转换将在基于决定或确定启用视频处理工具或模式时使用视频处理工具或模式。在另一示例中,当启用视频处理工具或模式时,解码器将在知道已经基于视频处理工具或模式修改比特流的情况下处理比特流。换言之,将使用基于决定或确定而启用的视频处理工具或模式来执行从视频的比特流表示到视频块的转换。
所公开的技术的一些实施例包括决定或确定禁用视频处理工具或模式。在示例中,当禁用视频处理工具或模式时,编码器将在视频块到视频的比特流表示的转换中不使用该工具或模式。在另一示例中,当禁用视频处理工具或模式时,解码器将在知道尚未使用基于决定或确定而禁用的视频处理工具或模式修改比特流的情况下处理比特流。
在本文档中,术语“视频处理”可以指代视频编码、视频解码、视频压缩或视频解压缩。例如,可以在从视频的像素表示到对应的比特流表示的转换期间应用视频压缩算法,反之亦然。如语法所定义,当前视频块的比特流表示可以例如对应于位于比特流内的不同位置中并置或散布的比特。例如,可以根据变换和编解码的误差残差值并且还使用头中的比特和比特流中的其它字段来对宏块进行编码。
以下条款描述了一些实施例和技术。条款的第一集合描述了先前章节中所公开的技术的某些特征和方面。
1.一种视频处理的方法,包括:对于视频的视频区域与所述视频区域的编解码表示之间的转换,根据语法规则解析所述编解码表示,所述语法规则定义色度块尺寸与所述视频区域的颜色格式之间的关系;以及通过根据所述语法规则进行所述解析来进行所述转换。
2.根据条款1所述的方法,其中,所述颜色格式为4:4:4,并且其中所述语法规则指定所述色度块受到与用于亮度块的尺寸约束相同的尺寸约束。
3.根据条款1所述的方法,其中,所述颜色格式为4:2:2,并且其中所述语法规则指定所述色度块受到与4:2:0颜色格式的尺寸约束相同的尺寸约束。
4.根据条款1-3中任一项所述的方法,其中,所述语法指定以取决于色度格式的方式使用预测模式和小块分割。
5.根据条款1所述的方法,其中,所述语法规则定义基于所述视频区域的颜色格式对于所述视频区域的转换启用最小允许尺寸特征。
以下条款可以与在先前章节的项目2中所描述的附加技术一起实现。
6.一种视频处理的方法,包括:基于视频的属性和所述视频的色度格式,确定所述视频的编解码树节点的编解码模式;以及使用所确定的编解码模式在所述视频的编解码表示与所述编解码树节点的视频块之间进行转换。
7.根据条款6所述的方法,其中,在所述属性为以下的情况下,对于所述色度格式为4:2:2,所述编解码模式被确定为MODE_TYPE_ALL,对于所述色度格式为4:2:0,所述编解码模式被确定为MODE_TYPE_INTRA或MODE_TYPE_INTER:
i.所述编解码节点是具有水平二叉树划分的MxN编解码树节点;
ii.所述编解码节点是具有垂直二叉树划分的MxN编解码树节点;
iii.所述编解码节点是具有水平三叉树划分的MxN编解码树节点;或者
iv.所述编解码节点是具有垂直三叉树划分的MxN编解码树节点。
8.根据条款7所述的方法,其中,M=8或16或32,并且N=4或8或16。
以下条款可以与先前章节的项目3中所描述的附加技术一起实现。
9.一种视频处理的方法,包括:基于规则确定在视频的视频区域中是否允许某一尺寸的色度块;以及基于所述确定在所述视频区域与所述视频区域的编解码表示之间进行转换。
10.根据条款9所述的方法,其中,所述规则指定由于所述视频区域包括双树分割而不允许2xN色度块。
11.根据条款9所述的方法,其中,所述规则指定由于所述视频区域包括单树分割而不允许2N色度块。
12.根据条款10或11所述的方法,其中,N≤64。
以下条款可以与先前章节的项目4、8和9中所描述的附加技术一起实现。
13.一种视频处理的方法,包括:基于允许对于视频条件使用编解码模式的规则,确定对于视频区域准许编解码模式;以及基于所述确定在所述视频区域中的像素的编解码表示与所述视频区域的像素之间进行转换。
14.根据条款13所述的方法,其中,所述视频条件是块尺寸,并且其中所述规则允许对于小块尺寸亮度块使用帧内块复制模式。
15.根据条款14所述的方法,其中,所述小块尺寸包括8x4、8x8、16x4或4xN亮度块尺寸。
16.根据条款13所述的方法,其中,所述规则允许对于使用MODE_TYPE_INTER模式进行编解码的所述视频区域的转换使用帧内块复制模式。
17.根据条款13所述的方法,其中,所述规则允许对于使用MODE_TYPE_INTER模式进行编解码的所述视频区域的转换使用调色板编解码模式。
以下条款可以与先前章节的项目5、6和7中所描述的附加技术一起实现。
18.一种视频处理的方法,包括:使用视频编解码模式在视频的视频块与所述视频块的编解码表示之间进行转换,其中,基于规则将信令通知所述编解码模式的语法元素选择性地包括在所述编解码表示中。
19.根据条款18所述的方法,其中,所述视频编解码模式是帧内块编解码模式,并且其中所述规则指定使用所述视频编解码模式的类型来控制所述语法元素包括在所述编解码表示中。
20.根据条款19所述的方法,其中,所述规则指定显式信令通知非SKIP块。
21.根据条款18所述的方法,其中,所述规则指定基于所述视频块的模式类型和跳过模式隐式信令通知帧内块复制标志。
22.根据条款18所述的方法,其中,所述编解码模式是调色板编解码模式,并且其中所述规则指定基于所述视频块的模式类型选择性地包括调色板编解码指示符。
以下条款可以与先前章节的项目11中所描述的附加技术一起实现。
23.一种视频处理的方法,包括:由于色度块具有小于阈值尺寸的尺寸,确定在所述色度块与所述色度块的编解码表示之间的转换期间使用的变换类型与用于对应的亮度块转换的变换类型不同;以及基于所述确定进行所述转换。
24.根据条款23所述的方法,其中,阈值尺寸为MxN,其中M是2或N是2。
以下条款可以与先前章节的项目12中所描述的附加技术一起实现。
25.根据条款1至24中任一项所述的方法,其中,所述转换使用组合的帧间和帧内预测模式作为MODE_TYPE_INTRA模式。
26.根据条款18至22中任一项所述的方法,其中,所述转换使用组合的帧间和帧内预测模式作为MODE_TYPE_INTER模式。例如,当将CIIP视为MODE_TYPE_INTER时,可以应用先前章节的项目5+6+7中所描述的方法。或者,当应用项目5+6+7中所描述的方法时,CIIP可被视为MODE_TYPE_INTER。
27.根据条款1至26中任一项所述的方法,其中,所述转换包括将所述视频编码为所述编解码表示。
28.根据条款1至26中任一项所述的方法,其中,所述转换包括对所述编解码表示进行解码以生成所述视频的像素值。
29.一种视频解码装置,包括处理器,所述处理器配置为实现条款1至28中的一项或多项所述的方法。
30.一种视频编码装置,包括处理器,所述处理器配置为实现条款1至28中的一项或多项所述的方法。
31.一种其上存储有计算机代码的计算机程序产品,所述代码在由处理器执行时使得所述处理器实现条款1至28中任一项所述的方法。
32.本文档中所描述的方法、装置或系统。
条款的第二集合描述了先前章节中所公开的技术的某些特征和方面,例如,示例实现方式1、2和13。
1.一种视频处理的方法,包括:根据规则基于视频的颜色格式确定用于将视频的色度视频区域分割为一个或多个色度块的分割方案;以及根据所述分割方案在所述视频与所述视频的编解码表示之间进行转换。
2.根据条款1所述的方法,其中,所述规则指定对于帧间条带或帧内条带具有由相同的编解码树节点表示的三个颜色分量。
3.根据条款1或2所述的方法,其中,所述规则指定对于4:4:4颜色格式对色度块和亮度块使用相同的分割方案。
4.根据条款1或2所述的方法,其中,所述规则指定对于4:2:0和4:2:2颜色格式使用相同的分割约束。
5.根据条款1或2所述的方法,其中,所述规则指定对于4:0:0或4:4:4颜色格式不对预测模式应用的分割方案和/或约束。
6.根据条款1或2中任一项所述的方法,其中,所述规则指定基于所述视频的颜色格式而应用所述分割方案和/或预测模式。
7.根据条款6所述的方法,其中,对于具有水平BT(二叉树)划分或水平TT(三叉树)划分的M×N编解码树节点,在4:2:2颜色格式中,对于色度块和亮度块两者允许所述水平BT划分或所述水平TT划分。
8.根据条款6所述的方法,其中,对于具有水平BT(二叉树)划分或水平TT(三叉树)划分的M×N编解码树节点,在4:2:0颜色格式中,对于亮度块允许但对于色度块不允许所述水平BT划分或所述水平TT(三叉树)划分。
9.根据条款6所述的方法,其中,对于具有垂直BT(二叉树)划分或垂直TT(三叉树)划分的MxN编解码树节点,在4:2:2颜色格式中,对于色度块和亮度块两者允许所述垂直BT划分或所述垂直TT划分。
10.根据条款6所述的方法,其中,对于具有垂直BT(二叉树)划分或垂直TT(三叉树)划分的MxN编解码树节点,在4:2:0颜色格式中,对于亮度块允许但对于色度块不允许所述垂直BT划分或所述垂直TT(三叉树)划分。
11.根据条款7-10中任一项所述的方法,其中,M和/或N是预定义的或信令通知的。
12.根据条款11所述的方法,其中,M和/或N取决于所述视频区域的颜色格式。
13.根据条款6所述的方法,其中,所述规则指定不将分割方案应用于4:0:0和/或4:4:4颜色格式。
14.根据条款1所述的方法,其中,所述规则指定基于所述视频的颜色格式对于所述转换启用定义为限制色度块的尺寸的最小色度帧内预测单元(SCIPU)。
15.根据条款14所述的方法,其中,对于4:2:0和/或4:2:2颜色格式允许最小色度帧内预测单元。
16.根据条款14所述的方法,其中,对于4:0:0和/或4:4:4颜色格式不允许最小色度帧内预测单元。
17.一种视频处理的方法,包括:基于视频的颜色格式,确定用于所述视频的编解码树节点的子块的预测模式或预测类型;以及基于所述确定在所述视频与所述视频的编解码表示之间进行转换,其中,将所述编解码树节点分割为所述子块以用于在所述编解码表示中进行编解码。
18.根据条款17所述的方法,其中,由于所述颜色格式为4:2:2,将子块的预测模式确定为MODE_TYPE_ALL,其指示帧间编解码模式、帧内模式、调色板模式和帧内块复制模式的适用性。
19.根据条款17所述的方法,其中,由于所述颜色格式为4:2:0,将子块的预测模式确定为i)MODE_TYPE_INTER,其仅指示帧间编解码模式的适用性,或者ii)MODE_TYPE_INTRA,其指示帧内模式、调色板模式和帧内块复制模式的适用性。
20.根据条款18或19所述的方法,其中,所述帧间编解码模式包括使用时域相关性来表示或重建所述视频,所述帧间模式包括基于先前处理的视频块来表示或重建所述视频,所述调色板模式包括使用代表性样点值的调色板来表示或重建所述视频,或者所述帧内块复制模式包括至少使用指向视频帧的块矢量来表示或重建所述视频。
21.根据条款18至20中任一项所述的方法,其中,所述编解码树节点满足以下条件中的一个:i)所述编解码树节点对应于具有水平二叉树划分的8x8亮度块,ii)所述编解码树节点对应于具有垂直二叉树划分的16x4亮度块,iii)所述编解码树节点对应于具有水平三叉树划分的8x16亮度块,或者iv)所述编解码树节点对应于具有垂直三叉树划分的32x4亮度块。
22.根据条款17所述的方法,其中,所述编解码树节点是M×N编解码树节点,并且M和/或N是预定义的或信令通知的。
23.根据条款22所述的方法,其中,M和/或N取决于所述视频的颜色格式。
24.根据条款1至23中任一项所述的方法,其中,进行所述转换包括从所述视频生成所述编解码表示。
25.根据条款1至23中任一项所述的方法,其中,进行所述转换包括从所述编解码表示生成所述视频。
26.一种视频处理装置,包括处理器,所述处理器配置为实现条款1至25中任一项或多项所述的方法。
27.一种存储程序代码的计算机可读介质,所述程序代码在被执行时使得处理器实现条款1至25中任一项或多项所述的方法。
条款的第三集合描述了先前章节中所公开的技术的某些特征和方面,例如,示例实现方式3和10-13。
1.一种视频处理的方法,包括:根据规则,在视频与所述视频的编解码表示之间进行转换,所述视频包括包含一个或多个亮度块和一个或多个色度块的一个或多个视频区域;其中所述规则指定不允许使用帧内模式或帧内块复制模式在所述编解码表示中表示所述一个或多个色度块中的尺寸为MxN的色度块,其中M和N分别是指示所述色度块的宽度和高度的整数;其中所述帧内模式包括基于先前编码或重建的视频块对所述色度块进行编码,并且其中所述帧内块复制模式包括至少使用指向包含视频区域的视频帧的块矢量来对所述色度块进行编码。
2.根据条款1所述的方法,其中,所述规则指定由于所述视频区域被分割为双树分割而不允许尺寸为2×N的色度块。
3.根据条款2所述的方法,其中,所述规则指定在以下情况下对于所述色度块禁用垂直BT(二叉树)划分:i)所述色度块的树类型等于双树类型,以及ii)M等于4个色度样点。
4.根据条款2所述的方法,其中,所述规则指定在以下情况下对于所述色度块禁用垂直TT(三叉树)划分:i)所述色度块的树类型等于双树类型,以及ii)M等于8个色度样点。
5.根据条款1所述的方法,其中,所述规则指定由于所述视频区域被分割为单树分割而不允许尺寸为2×N的色度块。
6.根据条款5所述的方法,其中,对于具有垂直BT(二叉树)划分的M×N编解码树节点,对于尺寸为4×N或4x(N/2)的所述色度块不允许但对于尺寸为8xN的亮度块允许所述垂直BT划分。
7.根据条款5所述的方法,其中,对于具有垂直BT(二叉树)划分的MxN编解码树节点,对于尺寸为4xN或4x(N/2)的所述色度块不允许所述垂直BT划分。
8.根据条款5所述的方法,其中,对于具有垂直BT(二叉树)划分的MxN编解码树节点,对于尺寸为4xN或4x(N/2)的所述色度块和尺寸为8×N的亮度块允许所述垂直BT划分,并且其中所述色度块和所述亮度块不以所述帧内模式编解码。
9.根据条款5所述的方法,其中,对于具有垂直TT(三叉树)划分的MxN编解码树节点,对于尺寸为8xN或8x(N/2)的所述色度块不允许但对于尺寸为16xN的亮度块允许所述垂直TT划分。
10.根据条款5所述的方法,其中,对于具有垂直TT(三叉树)划分的MxN编解码树节点,对于尺寸为8xN或8x(N/2)的所述色度块不允许所述垂直TT划分。
11.根据条款5所述的方法,其中,对于具有垂直TT(三叉树)划分的MxN编解码树节点,对于尺寸为8xN或8x(N/2)的所述色度块和尺寸为16×N的亮度块允许所述垂直TT划分,并且其中所述色度块和所述亮度块不以所述帧内模式编解码。
12.一种视频处理的方法,包括:对于视频的视频区域和所述视频的编解码表示之间的转换,根据规则确定使用组合的帧间和帧内预测(CIIP)模式作为帧内模式或帧间模式;以及基于所述确定进行所述转换,并且其中,所述CIIP模式包括使用加权系数来组合帧内预测信号和帧间预测信号。
13.根据条款12所述的方法,其中,所述规则指定由于在所述视频区域中使用双树分割而使用所述CIIP模式作为所述帧内模式。
14.根据条款12所述的方法,其中,所述规则指定使用所述CIIP模式作为所述帧间模式。
15.根据条款14所述的方法,其中,所述规则指定由于色度块宽度等于M而禁用所述CIIP模式。
16.根据条款12所述的方法,其中,所述规则指定将用于以CIIP模式编解码的色度块的帧内预测模式限制为所述帧内模式。
17.根据条款16所述的方法,其中,所述帧内预测模式包括intra_DC、intra_angular18模式或intra_angular50模式。
18.根据条款16所述的方法,其中,所述色度块宽度等于2。
19.一种视频处理的方法,包括:在视频的色度块与所述视频的编解码表示之间进行转换,其中,根据尺寸规则使用帧内编解码模式在所述编解码表示中表示所述色度块;其中所述尺寸规则指定:在所述色度块的宽度等于M或所述色度块的高度等于N的情况下,其中M和N是整数,所述帧内编解码模式来自帧内编解码模式类型的第一集合;否则,所述帧内编解码模式来自帧内编解码模式类型的第二集合。
20.根据条款19所述的方法,其中M=2或N=2。
21.根据条款19或20所述的方法,其中,帧内编解码模式类型的所述第一集合是在所述转换中所有允许的帧内编解码模式类型的子集。
22.根据条款19或20所述的方法,其中,帧内编解码模式类型的所述第一集合对应于INTRA_DC模式。
23.根据条款19或20所述的方法,其中,帧内编解码模式类型的所述第一集合对应于INTRA_PLANAR模式。
24.根据条款19或20所述的方法,其中,帧内编解码模式类型的所述第一集合对应于INTRA_ANGULAR18模式。
25.根据条款19或20所述的方法,其中,帧内编解码模式类型的所述第一集合对应于INTRA_ANGULAR50模式。
26.根据条款19或20所述的方法,其中,所述规则指定不允许CCLM模式,所述CCLM模式使用线性模式从另一个分量导出色度分量的预测值。
27.一种视频处理的方法,包括:在视频的色度块与所述视频的编解码表示之间进行转换,其中,根据规则使用变换类型在所述编解码表示中表示所述色度块;其中,所述规则指定:在所述色度块的宽度等于M或所述色度块的高度等于N的情况下,其中M和N是整数,所述变换类型来自变换类型的第一集合;否则,所述变换类型来自变换类型的第二集合。
28.根据条款27所述的方法,其中,M是2或N是2。
29.根据条款1-11、15、19-28中任一项所述的方法,其中,M和/或N是预定义的或信令通知的。
30.根据条款29所述的方法,其中,M和/或N取决于所述视频区域的颜色格式。
31.根据条款1至30中任一项所述的方法,其中,所述转换包括将所述视频编码为所述编解码表示。
32.根据条款1至30中任一项所述的方法,其中,所述转换包括对所述编解码表示进行解码以生成所述视频。
33.一种视频处理装置,包括处理器,所述处理器配置为实现条款1至32中任一项或多项所述的方法。
34.一种存储程序代码的计算机可读介质,所述程序代码在被执行时使得处理器实现条款1至32中任一项或多项所述的方法。
条款的第四集合描述了先前章节中所公开的技术的某些特征和方面,例如,示例实现方式4-9和13。
1.一种视频处理的方法,包括:根据规则,在视频与所述视频的编解码表示之间进行转换,所述视频包括具有一个或多个亮度块和一个或多个色度块的视频区域,其中,所述规则指定帧内块复制(IBC)模式的使用可用于块尺寸为MxN的所述一个或多个亮度块和所述一个或多个色度块,对于M和N的所有值,其中M和N是整数;其中,使用所述IBC模式,至少使用指向包含所述视频块的视频帧的块矢量来对所述视频块进行编解码。
2.根据条款1所述的方法,其中,所述规则指定亮度块的尺寸为8×4、8×8、16×4或4×N。
3.根据条款2所述的方法,其中,所述亮度块具有等于MODE_TYPE_INTRA的模式类型,所述MODE_TYPE_INTRA指示帧内模式、IBC模式和调色板模式的适用性。
4.根据条款1所述的方法,其中,所述规则指定色度块具有等于MODE_TYPE_INTRA的模式类型,所述MODE_TYPE_INTRA指示帧内模式、IBC模式和调色板模式的适用性。
5.一种视频处理的方法,包括:在视频的视频块与所述视频块的编解码表示之间进行转换,其中,所述编解码表示符合格式化规则,其中,所述格式化规则指定基于所述视频块的模式类型在所述编解码表示中选择性地包括指示使用帧间块复制(IBC)模式的语法元素,并且其中所述IBC模式包括至少使用指向包含所述视频块的视频帧的块矢量对所述视频块进行编码。
6.根据条款5所述的方法,其中,所述格式化规则指定在所述视频块的树类型不等于DUAL_TREE_CHROMA且所述视频块的模式类型等于所述MODE_TYPE_INTRA的情况下,其中所述MODE_TYPE_INTRA指示帧内模式、所述IBC模式和调色板模式的适用性,显式信令通知不以跳过模式编解码的所述视频块的所述语法元素。
7.根据条款5所述的方法,其中,所述格式化规则指定基于所述视频块的模式类型和跳过标志来推断所述语法元素。
8.根据条款7所述的方法,其中,所述格式化规则指定在所述视频块的模式类型等于MODE_TYPE_INTRA的情况下,其中所述MODE_TYPE_INTRA指示帧内模式、所述IBC模式和调色板模式的适用性,对于以跳过模式编解码的所述视频块,推断所述语法元素等于1。
9.一种视频处理的方法,包括:在视频的视频块与所述视频块的编解码表示之间进行转换,其中,所述编解码表示符合格式化规则,其中所述格式化规则指定无论所述视频块的模式类型,在所述编解码表示中都包括指示使用调色板模式的语法元素,并且其中调色板模式包括使用代表性样点值的调色板对所述视频块进行编码。
10.根据条款9所述的方法,其中,所述格式化规则指定基于所述视频块的条带类型、块尺寸或预测模式中的至少一者的所述显式信令通知。
11.根据条款9所述的方法,其中,所述格式化规则指定在所述视频块的模式类型等于所述MODE_TYPE_INTER或所述MODE_TYPE_INTRA的情况下,其中所述MODE_TYPE_INTER仅指示帧间编解码模式的适用性,所述MODE_TYPE_INTRA指示帧内模式、所述IBC模式和调色板模式的适用性,推断所述语法元素等于0。
12.一种视频处理的方法,包括:对于视频的视频区域与所述视频的编解码表示之间的转换,基于规则确定准许对于所述视频区域使用帧间块复制(IBC)模式;以及基于所述确定来进行所述转换,其中,所述IBC模式包括至少使用指向包含所述视频区域的视频帧的块矢量来对所述视频区域进行编码。
13.根据条款12所述的方法,其中,所述规则指定在所述视频区域的模式类型等于MODE_TYPE_INTER的情况下,其中MODE_TYPE_INTER仅指示帧间编解码模式的适用性,允许所述IBC模式。
14.根据条款12所述的方法,其中,所述规则指定在所述视频区域的模式类型等于MODE_TYPE_INTRA的情况下,其中所述MODE_TYPE_INTRA指示帧内模式、所述IBC模式和调色板模式的适用性,对于色度块不允许所述IBC模式。
15.根据条款12所述的方法,其中,所述规则指定在所述模式类型等于MODE_TYPE_INTER或MODE_TYPE_INTRA的情况下,其中所述MODE_TYPE_INTER仅指示帧间编解码模式的适用性,所述MODE_TYPE_INTRA指示帧内编解码模式、所述IBC模式和调色板模式的适用性,允许所述IBC模式。
16.根据条款12所述的方法,其中,所述规则指定独立于所述视频区域的模式类型而允许IBC模式。
17.根据条款12所述的方法,其中,在定义为限制色度块的尺寸的最小色度帧内预测单元(SCIPU)内允许所述IBC模式和帧间模式。
18.根据条款12所述的方法,其中,使用所述IBC模式编解码的色度块具有与对应于所述色度块的亮度块的尺寸相对应的尺寸。
19.根据条款12所述的方法,其中,在所述视频区域的模式类型等于MODE_TYPE_INTER且所述视频区域对应于4x4亮度块的情况下,其中所述MODE_TYPE_INTER仅指示帧间编解码模式的适用性,跳过指示使用所述IBC模式的语法元素的信令通知,并且推断所述语法元素等于1。
20.一种视频处理的方法,包括:对于视频的视频区域与所述视频的编解码表示之间的转换,基于规则确定是否准许对于所述视频区域使用调色板模式;以及基于所述确定进行所述转换,其中,所述规则基于所述视频区域的编解码模式类型或所述视频区域的颜色类型;其中所述调色板模式包括使用代表性样点值的调色板对所述视频区域进行编码。
21.根据条款20所述的方法,所述规则指定在所述视频区域的模式类型等于MODE_TYPE_INTER的情况下,其中所述MODE_TYPE_INTER仅指示帧间编解码模式的适用性,允许所述调色板模式。
22.根据条款20所述的方法,其中,所述规则指定在所述视频区域的模式类型等于MODE_TYPE_INTRA的情况下,其中所述MODE_TYPE_INTRA指示帧内模式、IBC模式和调色板模式的适用性,对于色度块不允许所述调色板模式,并且其中所述IBC模式包括至少使用指向包含所述视频区域的视频帧的块矢量对所述视频区域进行编码。
23.根据条款20所述的方法,其中,所述规则指定在所述模式类型等于MODE_TYPE_INTER或MODE_TYPE_INTRA的情况下,其中所述MODE_TYPE_INTER仅指示帧间编解码模式的适用性,所述MODE_TYPE_INTRA指示帧内模式、IBC模式和调色板模式的适用性,允许所述调色板模式,并且其中所述IBC模式包括至少使用指向包含所述视频区域的视频帧的块矢量来对所述视频区域进行编码。
24.根据条款20所述的方法,其中,所述规则指定独立于所述视频区域的模式类型而允许所述调色板模式。
25.根据条款20所述的方法,其中,在定义为限制色度块的尺寸的最小色度帧内预测单元(SCIPU)内允许所述调色板模式和帧间模式。
26.根据条款20所述的方法,其中,在定义为限制色度块的尺寸的最小色度帧内预测单元(SCIPU)内允许所述调色板模式、IBC模式和帧间模式的全部,所述IBC模式包括至少使用指向包含所述视频区域的视频帧的块矢量来对所述视频区域进行编码。
27.根据条款20所述的方法,其中,使用所述调色板模式编解码的色度块具有与对应于所述色度块的亮度块的尺寸相对应的尺寸。
28.根据条款20所述的方法,其中,在所述视频区域的模式类型等于MODE_TYPE_INTER且所述视频区域对应于4x4亮度块的情况下,其中所述MODE_TYPE_INTER仅指示帧间编解码模式的适用性,跳过指示使用所述调色板模式的语法元素的信令通知,并且推断所述语法元素等于1。
29.根据条款20所述的方法,其中,在以下情况下,将指示使用所述调色板模式或IBC模式的语法元素包括在所述编解码表示中:1)所述视频区域的模式类型等于MODE_TYPE_INTER,所述MODE_TYPE_INTER仅指示帧间编解码模式的适用性;2)所述视频区域对应于4x4亮度块,并且其中所述IBC模式包括至少使用指向包含所述视频区域的视频帧的块矢量对所述视频区域进行编码。
30.根据条款1-4中任一项所述的方法,其中,M和/或N是预定义的或信令通知的。
31.根据条款30所述的方法,其中,M和/或N取决于所述视频区域的颜色格式。
32.根据条款1至31中任一项所述的方法,其中,进行所述转换包括从所述视频生成所述编解码表示。
33.根据条款1至31中任一项所述的方法,其中,进行所述转换包括从所述编解码表示生成所述视频。
34.一种视频处理装置,包括处理器,所述处理器配置为实现条款1至33中任一项或多项所述的方法。
35.一种存储程序代码的计算机可读介质,所述程序代码在被执行时使得处理器实现条款1至33中任一项或多项所述的方法。
本文档中描述的所公开的和其它的解决方案、示例、实施例、模块和功能性操作可以在数字电子电路中实现,或者在计算机软件、固件或硬件(包括本文档中所公开的结构及其结构等同物)中实现,或者在其一个或多个的组合中实现。所公开的和其它的实施例可以被实现为一个或多个计算机程序产品,即,在计算机可读介质上编码的计算机程序指令的一个或多个模块,以用于由数据处理装置执行或控制数据处理装置的操作。计算机可读介质可以是机器可读储存设备、机器可读储存基板、存储器设备、影响机器可读传播信号的物质的合成、或者其一个或多个的组合。术语“数据处理装置”包括用于处理数据的所有装置、设备和机器,包括例如可编程处理器、计算机或者多个处理器或计算机。除了硬件之外,装置可以包括为所讨论的计算机程序创建执行环境的代码,例如,构成处理器固件、协议栈、数据库管理系统、操作系统及其一个或多个的组合的代码。传播信号是人工生成的信号,例如机器生成的电、光或电磁信号,其被生成以对信息进行编码以传输到合适的接收器装置。
计算机程序(也称为程序、软件、软件应用、脚本或代码)可以用任何形式的编程语言(包括编译语言或解释语言)编写,并且可以以任何形式部署,包括作为独立程序或作为模块、组件、子程序或其它适合在计算环境中使用的单元。计算机程序不一定与文件系统中的文件相对应。程序可以存储在保存其它程序或数据的文件的部分中(例如,存储在标记语言文档中的一个或多个脚本)、专用于所讨论的程序的单个文件中、或多个协调文件(例如,存储一个或多个模块、子程序或部分代码的文件)中。计算机程序可以部署在一台或多台计算机上来执行,这些计算机位于一个站点或分布在多个站点并通过通信网络互连。
本文档中描述的过程和逻辑流可以由一个或多个可编程处理器执行,该一个或多个处理器执行一个或多个计算机程序,通过对输入数据进行操作并生成输出来执行功能。过程和逻辑流也可以由专用逻辑电路来执行,并且装置也可以实现为专用逻辑电路,例如,FPGA(现场可编程门阵列)或ASIC(专用集成电路)。
例如,适用于执行计算机程序的处理器包括通用和专用微处理器、以及任何类型的数字计算机的任何一个或多个处理器。通常,处理器将从只读存储器或随机存取存储器或两者接收指令和数据。计算机的基本元件是用于执行指令的处理器和用于存储指令和数据的一个或多个存储器设备。通常,计算机还将包括用于存储数据的一个或多个大容量储存设备,例如,磁盘、磁光盘或光盘,或可操作地耦接到一个或多个大容量储存设备,以从其接收数据或向其传送数据,或两者兼有。然而,计算机不必具有这样的设备。适用于存储计算机程序指令和数据的计算机可读介质包括所有形式的非易失性存储器、介质和存储器设备,包括例如半导体存储器设备,例如EPROM、EEPROM和闪速存储器设备;磁盘,例如内部硬盘或可移动磁盘;磁光盘;和CD ROM和DVD-ROM磁盘。处理器和存储器可以由专用逻辑电路来补充,或并入到专用逻辑电路中。
虽然本专利文档包含许多细节,但不应将其解释为对任何主题或要求保护的范围的限制,而应解释为针对特定技术的特定实施例的特征的描述。本专利文档在分开的实施例的上下文描述的某些特征也可以在单个实施例中组合实现。相反,在单个实施例的上下文中描述的各种特征也可以在多个实施例中分开地实现,或在任何合适的子组合中实现。此外,虽然特征可以被描述为在某些组合中起作用,甚至最初这样要求保护,但在一些情况下,可以从组合中移除来自要求保护的组合的一个或多个特征,并且要求保护的组合可以指向子组合或子组合的变体。
类似地,尽管在附图中以特定顺序描述了操作,但这不应理解为要实现期望的结果必须按照所示的特定顺序或次序顺序来执行这些操作,或执行所有图示的操作。此外,本专利文档所述实施例中的各种系统组件的分开不应理解为在所有实施例中都需要这样的分开。
仅描述了一些实现方式和示例,其它实现方式、增强和变体可以基于本专利文档中描述和说明的内容做出。
Claims (27)
1.一种视频处理的方法,包括:
根据规则基于视频的颜色格式确定用于将视频的色度视频区域分割为一个或多个色度块的分割方案;以及
根据所述分割方案在所述视频与所述视频的编解码表示之间进行转换。
2.根据权利要求1所述的方法,其中,所述规则指定对于帧间条带或帧内条带具有由相同的编解码树节点表示的三个颜色分量。
3.根据权利要求1或2所述的方法,其中,所述规则指定对于4:4:4颜色格式对色度块和亮度块使用相同的分割方案。
4.根据权利要求1或2所述的方法,其中,所述规则指定对于4:2:0和4:2:2颜色格式使用相同的分割约束。
5.根据权利要求1或2所述的方法,其中,所述规则指定对于4:0:0或4:4:4颜色格式不对预测模式应用的所述分割方案和/或约束。
6.根据权利要求1或2中任一项所述的方法,其中,所述规则指定基于所述视频的颜色格式而应用所述分割方案和/或预测模式。
7.根据权利要求6所述的方法,其中,对于具有水平BT(二叉树)划分或水平TT(三叉树)划分的M×N编解码树节点,在4:2:2颜色格式中,对于色度块和亮度块两者允许所述水平BT划分或所述水平TT划分。
8.根据权利要求6所述的方法,其中,对于具有水平BT(二叉树)划分或水平TT(三叉树)划分的M×N编解码树节点,在4:2:0颜色格式中,对于亮度块允许但对于色度块不允许所述水平BT划分或所述水平TT(三叉树)划分。
9.根据权利要求6所述的方法,其中,对于具有垂直BT(二叉树)划分或垂直TT(三叉树)划分的MxN编解码树节点,在4:2:2颜色格式中,对于色度块和亮度块两者允许所述垂直BT划分或所述垂直TT划分。
10.根据权利要求6所述的方法,其中,对于具有垂直BT(二叉树)划分或垂直TT(三叉树)划分的MxN编解码树节点,在4:2:0颜色格式中,对于亮度块允许但对于色度块不允许所述垂直BT划分或所述垂直TT(三叉树)划分。
11.根据权利要求7-10中任一项所述的方法,其中,M和/或N是预定义的或信令通知的。
12.根据权利要求11所述的方法,其中,M和/或N取决于所述视频区域的颜色格式。
13.根据权利要求6所述的方法,其中,所述规则指定不将所述分割方案应用于4:0:0和/或4:4:4颜色格式。
14.根据权利要求1所述的方法,其中,所述规则指定基于所述视频的颜色格式对于所述转换启用定义为限制色度块的尺寸的最小色度帧内预测单元(SCIPU)。
15.根据权利要求14所述的方法,其中,对于4:2:0和/或4:2:2颜色格式允许最小色度帧内预测单元。
16.根据权利要求14所述的方法,其中,对于4:0:0和/或4:4:4颜色格式不允许最小色度帧内预测单元。
17.一种视频处理的方法,包括:
基于视频的颜色格式,确定用于所述视频的编解码树节点的子块的预测模式或预测类型;以及
基于所述确定在所述视频与所述视频的编解码表示之间进行转换,
其中,将所述编解码树节点分割为所述子块以用于在所述编解码表示中进行编解码。
18.根据权利要求17所述的方法,其中,由于所述颜色格式为4:2:2,将子块的预测模式确定为MODE_TYPE_ALL,所述MODE_TYPE_ALL指示帧间编解码模式、帧内模式、调色板模式和帧内块复制模式的适用性。
19.根据权利要求17所述的方法,其中,由于所述颜色格式为4:2:0,将子块的预测模式确定为i)MODE_TYPE_INTER,所述MODE_TYPE_INTER仅指示帧间编解码模式的适用性,或者ii)MODE_TYPE_INTRA,所述MODE_TYPE_INTRA指示帧内模式、调色板模式和帧内块复制模式的适用性。
20.根据权利要求18或19所述的方法,其中,所述帧间编解码模式包括使用时域相关性来表示或重建所述视频,所述帧间模式包括基于先前处理的视频块来表示或重建所述视频,所述调色板模式包括使用代表性样点值的调色板来表示或重建所述视频,或者所述帧内块复制模式包括至少使用指向视频帧的块矢量来表示或重建所述视频。
21.根据权利要求18至20中任一项所述的方法,其中,所述编解码树节点满足以下条件中的一个:i)所述编解码树节点对应于具有水平二叉树划分的8x8亮度块,ii)所述编解码树节点对应于具有垂直二叉树划分的16x4亮度块,iii)所述编解码树节点对应于具有水平三叉树划分的8x16亮度块,或者iv)所述编解码树节点对应于具有垂直三叉树划分的32x4亮度块。
22.根据权利要求17所述的方法,其中,所述编解码树节点是M×N编解码树节点,并且M和/或N是预定义的或信令通知的。
23.根据权利要求22所述的方法,其中,M和/或N取决于所述视频的颜色格式。
24.根据权利要求1至23中任一项所述的方法,其中,进行所述转换包括从所述视频生成所述编解码表示。
25.根据权利要求1至23中任一项所述的方法,其中,进行所述转换包括从所述编解码表示生成所述视频。
26.一种视频处理装置,包括处理器,所述处理器配置为实现权利要求1至25中任一项或多项所述的方法。
27.一种存储程序代码的计算机可读介质,所述程序代码在被执行时使得处理器实现权利要求1至25中任一项或多项所述的方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNPCT/CN2019/099447 | 2019-08-06 | ||
CN2019099447 | 2019-08-06 | ||
PCT/CN2020/107381 WO2021023258A1 (en) | 2019-08-06 | 2020-08-06 | Video region partition based on color format |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114208191A true CN114208191A (zh) | 2022-03-18 |
CN114208191B CN114208191B (zh) | 2024-01-12 |
Family
ID=74503319
Family Applications (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311458831.9A Pending CN117241033A (zh) | 2019-08-06 | 2020-08-06 | 使用屏幕内容编码工具进行视频编码和解码 |
CN202080055805.XA Active CN114208189B (zh) | 2019-08-06 | 2020-08-06 | 使用屏幕内容编码工具进行视频编码和解码 |
CN202080055811.5A Pending CN114208195A (zh) | 2019-08-06 | 2020-08-06 | 基于颜色格式的尺寸限制 |
CN202080055797.9A Active CN114208191B (zh) | 2019-08-06 | 2020-08-06 | 基于颜色格式的视频区域分割 |
Family Applications Before (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311458831.9A Pending CN117241033A (zh) | 2019-08-06 | 2020-08-06 | 使用屏幕内容编码工具进行视频编码和解码 |
CN202080055805.XA Active CN114208189B (zh) | 2019-08-06 | 2020-08-06 | 使用屏幕内容编码工具进行视频编码和解码 |
CN202080055811.5A Pending CN114208195A (zh) | 2019-08-06 | 2020-08-06 | 基于颜色格式的尺寸限制 |
Country Status (8)
Country | Link |
---|---|
US (4) | US20220159255A1 (zh) |
EP (2) | EP3994886A4 (zh) |
JP (3) | JP2022543796A (zh) |
KR (2) | KR102601022B1 (zh) |
CN (4) | CN117241033A (zh) |
BR (2) | BR112022001981A2 (zh) |
MX (2) | MX2022001243A (zh) |
WO (3) | WO2021023261A1 (zh) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021023261A1 (en) | 2019-08-06 | 2021-02-11 | Beijing Bytedance Network Technology Co., Ltd. | Size restriction based on color format |
EP4005215A4 (en) * | 2019-08-15 | 2022-10-26 | Beijing Dajia Internet Information Technology Co., Ltd. | LOW CHROMINANCE BLOCK SIZE RESTRICTION IN VIDEO CODING |
WO2021036939A1 (en) * | 2019-08-23 | 2021-03-04 | Mediatek Inc. | Method and apparatus of partitioning small size coding units with partition constraints |
US20220224890A1 (en) * | 2019-08-23 | 2022-07-14 | Hfi Innovation Inc. | Method and Apparatus of Partitioning Small Size Coding Units with Partition Constraints |
JP7381722B2 (ja) | 2019-09-02 | 2023-11-15 | 北京字節跳動網絡技術有限公司 | カラーフォーマットに基づいたコーディングモード決定 |
CN118055248A (zh) | 2019-09-21 | 2024-05-17 | 北京字节跳动网络技术有限公司 | 处理视频数据的方法、装置以及计算机可读记录介质 |
WO2021244419A1 (en) * | 2020-05-31 | 2021-12-09 | Beijing Bytedance Network Technology Co., Ltd. | Constraint signaling using general constraint information syntax element |
US20220301228A1 (en) * | 2021-03-19 | 2022-09-22 | Intel Corporation | Variable width interleaved coding for graphics processing |
WO2023198063A1 (en) * | 2022-04-11 | 2023-10-19 | Beijing Bytedance Network Technology Co., Ltd. | Method, apparatus, and medium for video processing |
WO2024140853A1 (en) * | 2022-12-30 | 2024-07-04 | Douyin Vision Co., Ltd. | Method, apparatus, and medium for video processing |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103931185A (zh) * | 2011-10-25 | 2014-07-16 | 高通股份有限公司 | 确定视频译码的解块滤波的边界强度值 |
US20150124865A1 (en) * | 2013-11-01 | 2015-05-07 | Qualcomm Incorporated | Color residual prediction for video coding |
WO2015078304A1 (en) * | 2013-11-27 | 2015-06-04 | Mediatek Singapore Pte. Ltd. | Method of video coding using prediction based on intra picture block copy |
WO2016100424A1 (en) * | 2014-12-19 | 2016-06-23 | Mediatek Inc. | Methods of palette based prediction for non-444 color format in video and image coding |
WO2018116802A1 (ja) * | 2016-12-22 | 2018-06-28 | シャープ株式会社 | 画像復号装置、画像符号化装置、及び画像予測装置 |
CN109076210A (zh) * | 2016-05-28 | 2018-12-21 | 联发科技股份有限公司 | 视频编解码的当前图像参考的方法和装置 |
CN109479137A (zh) * | 2016-05-28 | 2019-03-15 | 联发科技股份有限公司 | 用于彩色视频数据的调色板模式编解码的方法及装置 |
Family Cites Families (74)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4011165B2 (ja) | 1997-11-21 | 2007-11-21 | 泰和 楊 | 把手を備えたマウス |
US8139875B2 (en) | 2007-06-28 | 2012-03-20 | Mitsubishi Electric Corporation | Image encoding device, image decoding device, image encoding method and image decoding method |
US9049444B2 (en) | 2010-12-22 | 2015-06-02 | Qualcomm Incorporated | Mode dependent scanning of coefficients of a block of video data |
WO2013109123A1 (ko) | 2012-01-19 | 2013-07-25 | 삼성전자 주식회사 | 인트라 예측 처리 속도 향상을 위한 비디오의 부호화 방법 및 장치, 비디오의 복호화 방법 및 장치 |
CN104205843A (zh) | 2012-04-20 | 2014-12-10 | 华为技术有限公司 | Hevc中无损编码中的改进帧内预测 |
GB2501535A (en) | 2012-04-26 | 2013-10-30 | Sony Corp | Chrominance Processing in High Efficiency Video Codecs |
US20130294524A1 (en) | 2012-05-04 | 2013-11-07 | Qualcomm Incorporated | Transform skipping and lossless coding unification |
US9549182B2 (en) | 2012-07-11 | 2017-01-17 | Qualcomm Incorporated | Repositioning of prediction residual blocks in video coding |
US20140029670A1 (en) * | 2012-07-27 | 2014-01-30 | Motorola Mobility Llc | Devices and methods for processing of partition mode in high efficiency video coding |
WO2014071439A1 (en) | 2012-11-08 | 2014-05-15 | Canon Kabushiki Kaisha | Method, apparatus and system for encoding and decoding the transform units of a coding unit |
US9332257B2 (en) * | 2012-10-01 | 2016-05-03 | Qualcomm Incorporated | Coded black flag coding for 4:2:2 sample format in video coding |
WO2015005132A1 (ja) | 2013-07-08 | 2015-01-15 | ソニー株式会社 | 画像符号化装置および方法、並びに画像復号装置および方法 |
WO2015011752A1 (ja) | 2013-07-22 | 2015-01-29 | ルネサスエレクトロニクス株式会社 | 動画像符号化装置およびその動作方法 |
EP3078194B1 (en) | 2014-01-02 | 2019-09-11 | HFI Innovation Inc. | Method and apparatus for intra prediction coding with boundary filtering control |
WO2015103496A2 (en) | 2014-01-02 | 2015-07-09 | Vid Scale, Inc. | Two-demensional palette coding for screen content coding |
US9883197B2 (en) * | 2014-01-09 | 2018-01-30 | Qualcomm Incorporated | Intra prediction of chroma blocks using the same vector |
US20150271515A1 (en) * | 2014-01-10 | 2015-09-24 | Qualcomm Incorporated | Block vector coding for intra block copy in video coding |
WO2015134360A1 (en) | 2014-03-03 | 2015-09-11 | Sony Corporation | Strong intra smoothing for in rext |
US9860559B2 (en) | 2014-03-17 | 2018-01-02 | Mediatek Singapore Pte. Ltd. | Method of video coding using symmetric intra block copy |
EP3120556B1 (en) | 2014-03-17 | 2021-01-13 | Microsoft Technology Licensing, LLC | Encoder-side decisions for screen content encoding |
US20150312573A1 (en) * | 2014-03-17 | 2015-10-29 | Nokia Technologies Oy | Method and technical equipment for video encoding and decoding |
WO2015180014A1 (en) * | 2014-05-26 | 2015-12-03 | Mediatek Singapore Pte. Ltd. | An improved merge candidate list construction method for intra block copy |
AU2014202921B2 (en) * | 2014-05-29 | 2017-02-02 | Canon Kabushiki Kaisha | Method, apparatus and system for de-blocking a block of video samples |
US10327001B2 (en) * | 2014-06-19 | 2019-06-18 | Qualcomm Incorporated | Systems and methods for intra-block copy |
CN106716999B (zh) | 2014-06-20 | 2019-08-09 | 寰发股份有限公司 | 用于视频编码的调色板预测器信令的方法 |
CN105491379A (zh) * | 2014-10-01 | 2016-04-13 | 财团法人工业技术研究院 | 解码器、编码器、解码方法、编码方法与编解码系统 |
JP2017535169A (ja) | 2014-10-06 | 2017-11-24 | ヴィド スケール インコーポレイテッド | スクリーンコンテンツコード化のための改善されたパレットコード化 |
US9883184B2 (en) | 2014-10-07 | 2018-01-30 | Qualcomm Incorporated | QP derivation and offset for adaptive color transform in video coding |
CN107079166A (zh) * | 2014-10-28 | 2017-08-18 | 联发科技(新加坡)私人有限公司 | 用于视频编码的引导交叉分量预测的方法 |
CN110460845B (zh) * | 2014-11-06 | 2021-08-27 | 联发科技股份有限公司 | 调色板编码的方法 |
US10382795B2 (en) | 2014-12-10 | 2019-08-13 | Mediatek Singapore Pte. Ltd. | Method of video coding using binary tree block partitioning |
CN107211121B (zh) | 2015-01-22 | 2020-10-23 | 联发科技(新加坡)私人有限公司 | 视频编码方法与视频解码方法 |
US20160234494A1 (en) | 2015-02-10 | 2016-08-11 | Qualcomm Incorporated | Restriction on palette block size in video coding |
TWI816224B (zh) | 2015-06-08 | 2023-09-21 | 美商Vid衡器股份有限公司 | 視訊解碼或編碼方法及裝置 |
US10148977B2 (en) * | 2015-06-16 | 2018-12-04 | Futurewei Technologies, Inc. | Advanced coding techniques for high efficiency video coding (HEVC) screen content coding (SCC) extensions |
US11146794B2 (en) * | 2015-07-27 | 2021-10-12 | Mediatek Inc. | Method of system for video coding using intra block copy mode |
EP3357245A4 (en) | 2015-11-05 | 2019-03-13 | MediaTek Inc. | METHOD AND DEVICE OF INTERPRESSATION USING AN AVERAGE MOTION VECTOR FOR VIDEO CODING |
US11032550B2 (en) | 2016-02-25 | 2021-06-08 | Mediatek Inc. | Method and apparatus of video coding |
US10455228B2 (en) * | 2016-03-21 | 2019-10-22 | Qualcomm Incorporated | Determining prediction parameters for non-square blocks in video coding |
US11223852B2 (en) * | 2016-03-21 | 2022-01-11 | Qualcomm Incorporated | Coding video data using a two-level multi-type-tree framework |
US10609423B2 (en) * | 2016-09-07 | 2020-03-31 | Qualcomm Incorporated | Tree-type coding for video coding |
CN117176948A (zh) | 2016-10-04 | 2023-12-05 | 有限公司B1影像技术研究所 | 图像编码/解码方法、记录介质和传输比特流的方法 |
EP3503550A4 (en) * | 2016-10-10 | 2019-06-26 | Samsung Electronics Co., Ltd. | METHOD AND DEVICE FOR ENCODING OR DECODING A LUMINANCE BLOCK AND A CHROMINANCE BLOCK |
KR20180039323A (ko) * | 2016-10-10 | 2018-04-18 | 디지털인사이트 주식회사 | 다양한 블록 분할 구조를 결합하여 사용하는 비디오 코딩 방법 및 장치 |
US10848788B2 (en) * | 2017-01-06 | 2020-11-24 | Qualcomm Incorporated | Multi-type-tree framework for video coding |
US11025903B2 (en) * | 2017-01-13 | 2021-06-01 | Qualcomm Incorporated | Coding video data using derived chroma mode |
EP3383045A1 (en) * | 2017-03-27 | 2018-10-03 | Thomson Licensing | Multiple splits prioritizing for fast encoding |
CN107071494B (zh) | 2017-05-09 | 2019-10-11 | 珠海市杰理科技股份有限公司 | 视频图像帧的二进制语法元素的生成方法和系统 |
JP2021010046A (ja) | 2017-10-06 | 2021-01-28 | シャープ株式会社 | 画像符号化装置及び画像復号装置 |
CN111919446B (zh) | 2018-04-02 | 2022-10-28 | 夏普株式会社 | 解码视频图片中的当前视频块的方法 |
US10834396B2 (en) * | 2018-04-12 | 2020-11-10 | Qualcomm Incorporated | Bilateral filter for predicted video data |
EP3738315B1 (en) * | 2018-04-19 | 2022-01-26 | Huawei Technologies Co., Ltd. | Luma and chroma block partitioning |
WO2019216325A1 (en) * | 2018-05-09 | 2019-11-14 | Sharp Kabushiki Kaisha | Systems and methods for performing motion vector prediction using a derived set of motion vectors |
US11477474B2 (en) * | 2018-06-08 | 2022-10-18 | Mediatek Inc. | Methods and apparatus for multi-hypothesis mode reference and constraints |
CN113115046A (zh) | 2018-06-21 | 2021-07-13 | 北京字节跳动网络技术有限公司 | 分量相关的子块分割 |
KR20200001554A (ko) | 2018-06-27 | 2020-01-06 | 한국전자통신연구원 | 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체 |
US20210329233A1 (en) | 2018-07-14 | 2021-10-21 | Mediatek Inc. | Methods and Apparatuses of Processing Video Pictures with Partition Constraints in a Video Coding System |
AU2018233042B2 (en) | 2018-09-21 | 2024-06-13 | Canon Kabushiki Kaisha | Method, apparatus and system for encoding and decoding a tree of blocks of video samples |
US10939118B2 (en) * | 2018-10-26 | 2021-03-02 | Mediatek Inc. | Luma-based chroma intra-prediction method that utilizes down-sampled luma samples derived from weighting and associated luma-based chroma intra-prediction apparatus |
CN109743576B (zh) * | 2018-12-28 | 2020-05-12 | 杭州海康威视数字技术股份有限公司 | 编码方法、解码方法及装置 |
JP2021513755A (ja) | 2019-01-15 | 2021-05-27 | エルジー エレクトロニクス インコーポレイティド | 変換スキップフラグを利用した映像コーディング方法及び装置 |
CN113557527B (zh) * | 2019-03-12 | 2024-07-23 | 腾讯美国有限责任公司 | 视频解码方法、视频解码器及介质 |
CN113906753B (zh) | 2019-04-24 | 2023-12-01 | 字节跳动有限公司 | 编解码视频的量化残差差分脉冲编解码调制表示的约束 |
CN113785306B (zh) * | 2019-05-02 | 2024-06-14 | 字节跳动有限公司 | 基于编解码树结构类型的编解码模式 |
US11330298B2 (en) * | 2019-06-25 | 2022-05-10 | Qualcomm Incorporated | Simplified intra chroma mode coding in video coding |
JP2022120213A (ja) * | 2019-06-25 | 2022-08-18 | 株式会社Jvcケンウッド | 画像復号装置、画像復号方法及び画像復号プログラム |
CN110381311B (zh) | 2019-07-01 | 2023-06-30 | 腾讯科技(深圳)有限公司 | 视频帧的编码方法、装置、计算机可读介质及电子设备 |
JP7379655B2 (ja) | 2019-07-19 | 2023-11-14 | ウィルス インスティテュート オブ スタンダーズ アンド テクノロジー インコーポレイティド | ビデオ信号処理方法及び装置 |
US11399199B2 (en) * | 2019-08-05 | 2022-07-26 | Qualcomm Incorporated | Chroma intra prediction units for video coding |
WO2021023261A1 (en) * | 2019-08-06 | 2021-02-11 | Beijing Bytedance Network Technology Co., Ltd. | Size restriction based on color format |
EP4005215A4 (en) | 2019-08-15 | 2022-10-26 | Beijing Dajia Internet Information Technology Co., Ltd. | LOW CHROMINANCE BLOCK SIZE RESTRICTION IN VIDEO CODING |
WO2021036939A1 (en) | 2019-08-23 | 2021-03-04 | Mediatek Inc. | Method and apparatus of partitioning small size coding units with partition constraints |
JP7381722B2 (ja) * | 2019-09-02 | 2023-11-15 | 北京字節跳動網絡技術有限公司 | カラーフォーマットに基づいたコーディングモード決定 |
KR20220054360A (ko) | 2019-09-25 | 2022-05-02 | 엘지전자 주식회사 | 컬러 포맷에 기반하여 분할 모드를 결정하는 영상 부호화/복호화 방법, 장치 및 비트스트림을 전송하는 방법 |
-
2020
- 2020-08-06 WO PCT/CN2020/107400 patent/WO2021023261A1/en unknown
- 2020-08-06 JP JP2022506732A patent/JP2022543796A/ja active Pending
- 2020-08-06 EP EP20850328.4A patent/EP3994886A4/en active Pending
- 2020-08-06 JP JP2022506731A patent/JP2022543795A/ja active Pending
- 2020-08-06 WO PCT/CN2020/107381 patent/WO2021023258A1/en unknown
- 2020-08-06 CN CN202311458831.9A patent/CN117241033A/zh active Pending
- 2020-08-06 CN CN202080055805.XA patent/CN114208189B/zh active Active
- 2020-08-06 CN CN202080055811.5A patent/CN114208195A/zh active Pending
- 2020-08-06 BR BR112022001981A patent/BR112022001981A2/pt active IP Right Grant
- 2020-08-06 BR BR112022002006A patent/BR112022002006A2/pt unknown
- 2020-08-06 KR KR1020227003027A patent/KR102601022B1/ko active IP Right Grant
- 2020-08-06 WO PCT/CN2020/107408 patent/WO2021023262A1/en active Application Filing
- 2020-08-06 MX MX2022001243A patent/MX2022001243A/es unknown
- 2020-08-06 KR KR1020227003028A patent/KR20220039721A/ko unknown
- 2020-08-06 EP EP20850766.5A patent/EP3994889A4/en active Pending
- 2020-08-06 CN CN202080055797.9A patent/CN114208191B/zh active Active
- 2020-08-06 MX MX2022001244A patent/MX2022001244A/es unknown
-
2022
- 2022-01-31 US US17/589,483 patent/US20220159255A1/en active Pending
- 2022-01-31 US US17/589,168 patent/US11533483B2/en active Active
- 2022-01-31 US US17/589,537 patent/US11496736B2/en active Active
-
2023
- 2023-11-07 JP JP2023189742A patent/JP2024010175A/ja active Pending
- 2023-11-07 US US18/503,754 patent/US20240114133A1/en active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103931185A (zh) * | 2011-10-25 | 2014-07-16 | 高通股份有限公司 | 确定视频译码的解块滤波的边界强度值 |
US20150124865A1 (en) * | 2013-11-01 | 2015-05-07 | Qualcomm Incorporated | Color residual prediction for video coding |
WO2015078304A1 (en) * | 2013-11-27 | 2015-06-04 | Mediatek Singapore Pte. Ltd. | Method of video coding using prediction based on intra picture block copy |
CN110087089A (zh) * | 2013-11-27 | 2019-08-02 | 寰发股份有限公司 | 用于颜色视频数据的视频编解码方法 |
WO2016100424A1 (en) * | 2014-12-19 | 2016-06-23 | Mediatek Inc. | Methods of palette based prediction for non-444 color format in video and image coding |
CN109076210A (zh) * | 2016-05-28 | 2018-12-21 | 联发科技股份有限公司 | 视频编解码的当前图像参考的方法和装置 |
CN109479137A (zh) * | 2016-05-28 | 2019-03-15 | 联发科技股份有限公司 | 用于彩色视频数据的调色板模式编解码的方法及装置 |
WO2018116802A1 (ja) * | 2016-12-22 | 2018-06-28 | シャープ株式会社 | 画像復号装置、画像符号化装置、及び画像予測装置 |
Non-Patent Citations (2)
Title |
---|
BENJAMIN BROSS: "Versatile Video Coding (Draft 4)", JOINT VIDEO EXPERTS TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11 13TH MEETING: MARRAKECH, MA, 9–18 JAN. 2019,JVET-M1001, pages 6 - 7 * |
LING LI: "Various chroma format support in VVC", JOINT VIDEO EXPERTS TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11 14TH MEETING: GENEVA, CH, 19–27 MARCH 2019,JVET-N0225 * |
Also Published As
Publication number | Publication date |
---|---|
EP3994886A4 (en) | 2022-12-28 |
US11533483B2 (en) | 2022-12-20 |
US20220159254A1 (en) | 2022-05-19 |
JP2022543795A (ja) | 2022-10-14 |
EP3994889A4 (en) | 2023-01-11 |
CN117241033A (zh) | 2023-12-15 |
CN114208189B (zh) | 2024-01-16 |
CN114208191B (zh) | 2024-01-12 |
CN114208195A (zh) | 2022-03-18 |
KR102601022B1 (ko) | 2023-11-13 |
WO2021023262A1 (en) | 2021-02-11 |
JP2022543796A (ja) | 2022-10-14 |
CN114208189A (zh) | 2022-03-18 |
US11496736B2 (en) | 2022-11-08 |
MX2022001243A (es) | 2022-02-17 |
US20240114133A1 (en) | 2024-04-04 |
BR112022001981A2 (pt) | 2022-05-10 |
BR112022002006A2 (pt) | 2022-03-29 |
US20220159255A1 (en) | 2022-05-19 |
JP2024010175A (ja) | 2024-01-23 |
KR20220039721A (ko) | 2022-03-29 |
KR20220038692A (ko) | 2022-03-29 |
EP3994886A1 (en) | 2022-05-11 |
MX2022001244A (es) | 2022-02-22 |
WO2021023261A1 (en) | 2021-02-11 |
WO2021023258A1 (en) | 2021-02-11 |
US20220167011A1 (en) | 2022-05-26 |
EP3994889A1 (en) | 2022-05-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114208191B (zh) | 基于颜色格式的视频区域分割 | |
CN114342365B (zh) | 基于色彩格式的视频区分割 | |
CN114424565B (zh) | 基于色度帧内模式的尺寸限制 | |
CN114145013A (zh) | 调色板模式编解码的模式确定 | |
CN113475062A (zh) | 确定屏幕内容编解码的条件 | |
CN114175662A (zh) | 调色板模式使用指示的条件相关编解码 | |
CN113475077A (zh) | 调色板模式使用指示的独立编解码 | |
CN113615188A (zh) | 调色板模式使用指示的联合编解码 | |
JP7442673B2 (ja) | ビデオコーディングにおけるスキップブロックの変換のための最小許容量子化 | |
CN113678448A (zh) | 调色板模式编解码的条目构造 | |
RU2807441C2 (ru) | Ограничение размера на основе внутрикадрового режима цветности |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40063728 Country of ref document: HK |
|
GR01 | Patent grant | ||
GR01 | Patent grant |