CN113678456A - 用信号通知关于色度格式的信息的方法和装置 - Google Patents
用信号通知关于色度格式的信息的方法和装置 Download PDFInfo
- Publication number
- CN113678456A CN113678456A CN202080027970.4A CN202080027970A CN113678456A CN 113678456 A CN113678456 A CN 113678456A CN 202080027970 A CN202080027970 A CN 202080027970A CN 113678456 A CN113678456 A CN 113678456A
- Authority
- CN
- China
- Prior art keywords
- chroma
- current block
- component
- value
- prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 105
- 230000011664 signaling Effects 0.000 title description 10
- 238000005070 sampling Methods 0.000 claims abstract description 18
- 230000009977 dual effect Effects 0.000 claims description 34
- 241000023320 Luma <angiosperm> Species 0.000 claims description 32
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 claims description 32
- 230000003044 adaptive effect Effects 0.000 claims description 13
- 239000000523 sample Substances 0.000 description 69
- 230000008569 process Effects 0.000 description 25
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 15
- 238000001914 filtration Methods 0.000 description 15
- 238000010586 diagram Methods 0.000 description 14
- 239000013598 vector Substances 0.000 description 13
- 238000013139 quantization Methods 0.000 description 9
- 238000012545 processing Methods 0.000 description 7
- 230000009466 transformation Effects 0.000 description 7
- 238000003491 array Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 5
- 239000013074 reference sample Substances 0.000 description 5
- 230000006835 compression Effects 0.000 description 4
- 238000007906 compression Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000014509 gene expression Effects 0.000 description 4
- 238000013507 mapping Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 238000000638 solvent extraction Methods 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 101100155952 Escherichia coli (strain K12) uvrD gene Proteins 0.000 description 2
- 230000002146 bilateral effect Effects 0.000 description 2
- 238000009795 derivation Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000001747 exhibiting effect Effects 0.000 description 2
- 238000011017 operating method Methods 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- IESVDEZGAHUQJU-ZLBXKVHBSA-N 1-hexadecanoyl-2-(4Z,7Z,10Z,13Z,16Z,19Z-docosahexaenoyl)-sn-glycero-3-phosphocholine Chemical compound CCCCCCCCCCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CC\C=C/C\C=C/C\C=C/C\C=C/C\C=C/C\C=C/CC IESVDEZGAHUQJU-ZLBXKVHBSA-N 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 239000011449 brick Substances 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000010454 slate Substances 0.000 description 1
- 239000004984 smart glass Substances 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/96—Tree coding, e.g. quad-tree coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/132—Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/11—Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/117—Filters, e.g. for pre-processing or post-processing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/119—Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
- H04N19/159—Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/186—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/42—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/593—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/80—Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
- H04N19/82—Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Television Systems (AREA)
Abstract
根据本公开,一种由解码装置执行的图像解码方法包括以下步骤:接收包括用于当前块的预测信息的比特流;基于指示三个颜色分量是否被分别编译的单独颜色平面标志和指示用于当前块的色度格式采样结构的色度格式索引来推导用于当前块的色度阵列类型,该色度格式索引和该单独颜色平面标志被包括在用于当前块的预测信息中;基于所推导的色度阵列类型来推导当前块的预测样本;以及基于预测样本来推导当前块的重构样本。
Description
技术领域
本公开涉及图像编译技术,并且更具体地,本公开涉及一种用于在图像编译系统中用信号通知关于色度格式的信息的方法和设备。
背景技术
最近,在各种领域中对诸如4K或8K超高清(UHD)图像/视频的高分辨率、高质量图像/视频的需求不断增加。随着图像/视频分辨率或质量变得更高,与传统图像/视频数据相比发送相对更多的信息或比特。因此,如果图像/视频数据经由诸如现有有线/无线宽带线路的介质发送或被存储在传统存储介质中,则传输和存储的成本容易增加。
此外,对虚拟现实(VR)和人工现实(AR)内容以及诸如全息图的沉浸式媒体的兴趣和需求日益增长;并且表现出与实际图像/视频不同的图像/视频特性的图像/视频(例如,游戏图像/视频)的广播也日益增长。
因此,需要高度高效的图像/视频压缩技术来有效地压缩并发送、存储或播放如上所述显示出各种特性的高分辨率、高质量图像/视频。
发明内容
技术问题
本公开是为了提供一种用于改进图像编译效率的方法和设备。
本公开也是为了提供一种用于改进帧内预测的效率的方法和设备。
本公开仍然也是为了提供一种用于用信号通知关于色度格式的信息的方法和设备。
本公开仍然也是为了提供一种用于基于用于当前块的色度阵列类型来预测当前块的方法和设备。
本公开仍然也是为了提供了一种方法和设备,该方法和设备基于用于当前块的色度阵列类型的值不为0的确定,确定用于推导当前块的树类型是否是单树或双树内的色度树,并且基于是单树或双树内的色度树的确定,预测当前块。
技术方案
根据本公开的实施方式,提供了一种由解码设备执行的图像解码方法。该方法包括:接收包括用于当前块的预测信息的比特流;基于与用于当前块的色度格式采样结构有关的色度格式索引并且基于与三个颜色分量是否被分别编译有关的单独颜色平面标志,推导用于当前块的色度阵列类型,其中,色度格式索引和单独颜色平面标志被包括在用于当前块的预测信息中;基于所推导的色度阵列类型,推导当前块的预测样本;以及基于预测样本推导当前块的重构样本,其中,三个颜色分量包括亮度分量和色度分量,并且色度分量包括Cb分量和Cr分量。
根据本公开的另一实施方式,提供了一种用于执行图像解码的解码设备。该解码设备包括:熵解码器,该熵解码器接收包括用于当前块的预测信息的比特流,并且基于与用于当前块的色度格式采样结构有关的色度格式索引并且基于与三个颜色分量是否被分别编译有关的单独颜色平面标志,推导用于当前块的色度阵列类型,其中,色度格式索引和单独颜色平面标志被包括在用于当前块的预测信息中;预测器,该预测器基于所推导的色度阵列类型推导当前块的预测样本;以及加法器,该加法器基于预测样本推导当前块的重构样本,其中,三个颜色分量包括亮度分量和色度分量,并且色度分量包括Cb分量和Cr分量。
根据本公开的再一实施方式,提供了一种由编码设备执行的图像编码方法。该方法包括:生成与用于当前块的色度格式采样结构有关的色度格式索引;生成与三个颜色分量是否被分别编译有关的单独颜色平面标志;基于色度格式索引和单独颜色平面标志,推导用于当前块的色度阵列类型;基于所推导的色度阵列类型推导当前块的预测样本;基于预测样本推导用于当前块的残差样本;以及对包括关于残差样本的信息的残差信息进行编码,其中,三个颜色分量包括亮度分量和色度分量,并且色度分量包括Cb分量和Cr分量。
根据本公开的再一实施方式,提供了一种用于执行图像编码的编码设备。该编码设备包括:预测器,该预测器生成与用于当前块的色度格式采样结构有关的色度格式索引,生成与三个颜色分量是否被分别编译有关的单独颜色平面标志,基于色度格式索引和单独颜色平面标志,推导用于当前块的色度阵列类型,并且基于所推导的色度阵列类型推导当前块的预测样本;残差处理器,该残差处理器基于预测样本推导用于当前块的残差样本;以及熵编码器,该熵编码器对包括关于残差样本的信息的残差信息进行编码,其中,三个颜色分量包括亮度分量和色度分量,并且色度分量包括Cb分量和Cr分量。
根据本公开的再一实施方式,提供了一种解码器可读存储介质,该解码器可读存储介质存储关于使视频解码设备执行根据一些实施方式的解码方法的指令的信息。
根据本公开的再一实施方式,提供了一种解码器可读存储介质,该解码器可读存储介质存储关于使视频解码设备执行根据实施方式的解码方法的指令的信息。根据实施方式的解码方法包括:接收包括用于当前块的预测信息的比特流;基于与用于当前块的色度格式采样结构有关的色度格式索引并且基于与三个颜色分量是否被分别编译有关的单独颜色平面标志,推导用于当前块的色度阵列类型,其中,色度格式索引和单独颜色平面标志被包括在用于当前块的预测信息中;基于推导的色度阵列类型,推导当前块的预测样本;基于预测样本推导当前块的重构样本,其中,三个颜色分量包括亮度分量和色度分量,并且色度分量包括Cb分量和Cr分量。
技术效果
根据本公开,可以改进整体图像/视频压缩效率。
根据本公开,可以改进帧内预测效率。
根据本公开,可以基于MPM列表高效地执行帧内预测。
根据本公开,能够通过高效地用信号通知关于色度格式的信息来提高帧内预测的效率。
根据本公开,可基于用于当前块的色度阵列类型高效地预测当前块。
根据本公开,通过基于用于当前块的色度阵列类型的值不为0的确定来确定用于推导当前块的树类型是否是单树或双树内的色度树,能够高效地预测当前块。
附图说明
图1示意性地图示可应用本公开的视频/图像编译系统的示例。
图2是示意性地图示可应用本公开的视频/图像编码设备的配置的图。
图3是用于示意性地说明可应用本公开的视频/图像解码设备的配置的图。
图4a和图4b是图示由根据实施方式的编码设备执行的图像编码方法的示例以及由根据实施方式的解码设备执行的图像解码方法的示例的图。
图5是图示根据实施方式的帧内预测方法的流程图。
图6是图示定向帧内预测模式的示例的图。
图7是用于图示根据实施方式的基于CCLM的帧内预测的图。
图8是图示根据实施方式的编码设备的操作的流程图。
图9是图示根据实施方式的编码设备的配置的框图。
图10是图示根据实施方式的解码设备的操作的流程图。
图11是图示根据实施方式的解码设备的配置的框图。
图12图示可应用本文件的公开的内容流系统的示例。
具体实施方式
本公开可按各种形式修改,将描述并且在附图中图示其特定实施方式。然而,这些实施方式并非旨在限制本公开。以下描述中使用的术语仅用于描述特定实施方式,而非旨在限制本公开。单数表达包括复数表达,只要不是明确地不同的理解。诸如“包括”和“具有”的术语旨在指示存在以下描述中使用的特征、数量、步骤、操作、元素、组件或其组合,因此应该理解,不排除存在或添加一个或更多个不同的特征、数量、步骤、操作、元素、组件或其组合的可能性。
另外,本公开中描述的附图的各个配置是为了说明作为彼此不同的特征的功能的独立图示,而不意味着各个配置通过彼此不同的硬件或不同的软件被实现。例如,能够组合配置中的两个或更多个配置以形成一个配置,并且也能够将一个配置划分成多个配置。在不脱离本公开的主旨的情况下,配置被组合和/或分离的实施例被包括在本公开的范围内。
在下文中,将参考附图详细地描述本公开的实施方式。另外,贯穿附图使用相似的附图标记来指示相似的元素,并且将省略对相似的元素的相同描述。
图1图示可应用本公开的视频/图像编译系统的示例。
本文涉及视频/图像编译。例如,本文中公开的方法/实施方式可应用于通用视频编译(VVC)、基本视频编译(EVC)标准、AOMedia Video1(AV1)标准、第2代音频视频编译标准(AVS2)或下一代视频/图像编译标准(例如,H.267、H.268等)中公开的方法。
本文提出了视频/图像编译的各种实施方式,并且除非另外指定,否则上述实施方式也可彼此组合执行。
在本文中,视频可指随时间的一系列图像。图片通常是指表示特定时间帧处的一个图像的单元,并且切片(slice)/拼块(tile)是指在编译时构成图片的部分的单元。切片/拼块可包括一个或更多个编译树单元(CTU)。一个图片可由一个或更多个切片/拼块组成。一个图片可由一个或更多个拼块组组成。一个拼块组可包括一个或更多个拼块。图块(brick)可表示图片中的拼块内的CTU行的矩形区域(图块可表示图片中的拼块内的CTU行的矩形区域)。拼块可被分区成多个图块,各个图块可用拼块内的一个或更多个CTU行构造(拼块可被分区成多个图块,各个图块由拼块内的一个或更多个CTU行组成)。未被分区成多个图块的拼块也可被称为图块。图块扫描可表示分区图片的CTU的特定顺序排序,其中可以在图块内以CTU栅格扫描对CTU进行排序,并且拼块内的图块可以以拼块的图块的栅格扫描连续地排序,并且在图片中的拼块可以以图片中的拼块的栅格扫描连续地排序(图块扫描是分区图片的CTU的特定顺序排序,其中可以以图块中的CTU栅格扫描对CTU连续地排序,拼块内的图块可以以拼块的图块的栅格扫描连续地排序,并且图片中的拼块可以以图片的拼块的栅格扫描连续地排序)。拼块是特定拼块列和特定拼块列内的CTU的矩形区域(拼块是图片中的特定拼块列和特定拼块行内的CTU的矩形区域)。拼块列是高度等于图片的高度并且宽度可由图片参数集中的语法元素指定的CTU的矩形区域(拼块列是高度等于图片的高度并且宽度由图片参数集中的语法元素指定的CTU的矩形区域)。拼块行是宽度由图片参数集中的语法元素指定并且高度可等于图片的高度的CTU的矩形区域(拼块行是高度由图片参数集中的语法元素指定并且宽度等于图片的宽度的CTU的矩形区域)。拼块扫描可表示分区图片的CTU的特定顺序排序,并且CTU可以以拼块中的CTU栅格扫描连续地排序,而图片中的拼块可以以图片的拼块的栅格扫描连续地排序(拼块扫描是分区图片的CTU的特定顺序排序,其中CTU可以以拼块中的CTU栅格扫描连续地排序,而图片中的拼块可以以图片的拼块的栅格扫描连续地排序)。切片可包括图片的整数数量的图块,并且可在单个NAL单元中包括整数数量的图块(切片包括可排他地包含在单个NAL单元中的图片的整数数量的图块)。切片可用多个完整拼块构造,或者可以是一个拼块的完整图块的连续序列(切片可由多个完整拼块或仅一个拼块的完整图块的连续序列组成)。在本文中,拼块组和切片可代替彼此使用。例如,在本文中,拼块组/拼块组头可被称为切片/切片头。
像素或像元(pel)可意指构成一个图片(或图像)的最小单元。另外,“样本”可被用作与像素对应的术语。样本通常可表示像素或像素的值,并且可表示仅亮度分量的像素/像素值或仅色度分量的像素/像素值。
单元可表示图像处理的基本单元。单元可包括图片的特定区域和与该区域有关的信息中的至少一个。一个单元可包括一个亮度块和两个色度(例如cb、cr)块。在一些情况下,单元可与诸如块或面积这样的术语互换地使用。在一般情况下,M×N块可包括M列N行的样本(或样本阵列)或变换系数的集合(或阵列)。
在本公开中,术语“/”和“、”应该被解释为指示“和/或”。例如,表达“A/B”可意指“A和/或B”。此外,“A、B”可意指“A和/或B”。此外,“A/B/C”可意指“A、B和/或C中的至少一个”。另外,“A/B/C”可意指“A、B和/或C中的至少一个”。
此外,在本文中,术语“或”应该被解释为指示“和/或”。例如,表达“A或B”可包括1)仅A、2)仅B和/或3)A和B二者。换句话说,本公开中的术语“或”应该被解释为指示“附加地或另选地。”
参照图1,视频/图像编译系统可包括源装置和接收装置。源装置可通过数字存储介质或网络将编码的视频/图像信息或数据以文件或流的形式传送至接收装置。
源装置可包括视频源、编码设备和发送器。接收装置可包括接收器、解码设备和渲染器。编码设备可被称为视频/图像编码设备,解码设备可被称为视频/图像解码设备。发送器可被包括在编码设备中。接收器可被包括在解码设备中。渲染器可包括显示器,并且显示器可被配置为单独的装置或外部组件。
视频源可通过捕获、合成或生成视频/图像的处理来获取视频/图像。视频源可包括视频/图像捕获装置,和/或视频/图像生成装置。例如,视频/图像捕获装置可包括一个或更多个相机、包括先前捕获的视频/图像的视频/图像档案等。例如,视频/图像生成装置可包括计算机、平板计算机和智能电话,并且可(以电子方式)生成视频/图像。例如,可通过计算机等生成虚拟视频/图像。在这种情况下,视频/图像捕获处理可由生成相关数据的处理代替。
编码设备可对输入视频/图像进行编码。为了压缩和编译效率,编码设备可执行诸如预测、变换和量化的一系列过程。编码的数据(编码的视频/图像信息)可按比特流的形式输出。
发送器可通过数字存储介质或网络将以比特流的形式输出的编码的图像/图像信息或数据以文件或流的形式发送至接收装置的接收器。数字存储介质可包括诸如USB、SD、CD、DVD、蓝光、HDD、SSD等的各种存储介质。发送器可包括用于通过预定文件格式生成媒体文件的元件,并且可包括用于通过广播/通信网络传输的元件。接收器可接收/提取比特流并且将所接收的比特流发送至解码设备。
解码设备可通过执行与编码设备的操作对应的诸如解量化、逆变换和预测的一系列过程对视频/图像进行解码。
渲染器可渲染解码的视频/图像。渲染的视频/图像可通过显示器显示。
图2是示意性地图示可应用本公开的视频/图像编码设备的配置的图。在下文中,被称为视频编码设备的东西可包括图像编码设备。
参照图2,编码设备200包括图像分割器210、预测器220、残差处理器230和熵编码器240、加法器250、滤波器260和存储器270。预测器220可包括帧间预测器221和帧内预测器222。残差处理器230可包括变换器232、量化器233、解量化器234和逆变换器235。残差处理器230还可包括减法器231。加法器250可被称为重构器或重构块生成器。根据实施方式,图像分割器210、预测器220、残差处理器230、熵编码器240、加法器250和滤波器260可由至少一个硬件组件(例如,编码器芯片组或处理器)配置。另外,存储器270可包括解码图片缓冲器(DPB),或者可由数字存储介质配置。硬件组件还可包括存储器270作为内部/外部组件。
图像分割器210可将输入到编码设备200的输入图像(或图片、帧)分割成一个或更多个处理单元。例如,可将处理单元称作编译单元(CU)。在这种情况下,可根据四叉树二叉树三叉树(QTBTTT)结构从编译树单元(CTU)或最大编译单元(LCU)递归地分割编译单元。例如,可基于四叉树结构、二叉树结构和/或三叉树结构将一个编译单元分割成较深深度的多个编译单元。在这种情况下,例如,首先应用四叉树结构,和/或可稍后应用二叉树结构和/或三叉树结构。另选地,也可首先应用二叉树结构。可基于不再分割的最终编译单元来执行根据本公开的编译过程。在这种情况下,基于根据图像特征等的编译效率,可将最大编译单元直接用作最终编译单元,或者必要时,可将编译单元递归地分割成较深深度的编译单元,使得可将具有最佳大小的编译单元用作最终编译单元。这里,编译过程可包括诸如要稍后描述的预测、变换和重构的过程。作为另一示例,处理单元可进一步包括预测单元(PU)或变换单元(TU)。在这种情况下,预测单元和变换单元中的每一个可从前述最终编译单元分割或分区。预测单元可以是样本预测的单元,并且变换单元可以是用于导出变换系数的单元和/或用于从变换系数导出残差信号的单元。
在一些情况下,单元可与诸如块或区域的术语互换使用。在一般情况下,M×N块可表示由M列和N行组成的样本或变换系数的集合。样本通常可表示像素或像素值,可仅表示亮度分量的像素/像素值或者仅表示色度分量的像素/像素值。样本可用作与像素或像元的一个图片(或图像)对应的术语。
在编码设备200中,从输入图像信号(原始块、原始样本阵列)减去从帧间预测器221或帧内预测器222输出的预测信号(预测块、预测样本阵列)以生成残差信号(残差块、残差样本阵列),并且所生成的残差信号被发送到变换器232。在这种情况下,如所示,在编码器200中从输入图像信号(原始块、原始样本阵列)减去预测信号(预测块、预测样本阵列)的单元可被称为减法器231。预测器可对要处理的块(以下,称为当前块)执行预测并且生成包括当前块的预测样本的预测块。预测器可确定基于当前块或CU应用帧内预测还是帧间预测。如在各个预测模式的描述中稍后描述的,预测器可生成与预测有关的各种类型的信息(例如,预测模式信息)并将所生成的信息发送到熵编码器240。关于预测的信息可在熵编码器240中编码并以比特流的形式输出。
帧内预测器222可参考当前图片中的样本来预测当前块。根据预测模式,所参考的样本可位于当前块附近或者可隔开。在帧内预测中,预测模式可包括多个非定向模式和多个定向模式。例如,非定向模式可包括DC模式和平面模式。例如,根据预测方向的详细程度,定向模式可包括33个定向预测模式或65个定向预测模式。然而,这仅是示例,可根据设置使用更多或更少的定向预测模式。帧内预测器222可使用应用于邻近块的预测模式来确定应用于当前块的预测模式。
帧间预测器221可基于参考图片上运动向量所指定的参考块(参考样本阵列)来推导当前块的预测块。这里,为了减少在帧间预测模式下发送的运动信息量,可基于邻近块与当前块之间的运动信息的相关性以块、子块或样本为单位预测运动信息。运动信息可包括运动向量和参考图片索引。运动信息还可包括帧间预测方向(L0预测、L1预测、Bi预测等)信息。在帧间预测的情况下,邻近块可包括存在于当前图片中的空间邻近块和存在于参考图片中的时间邻近块。包括参考块的参考图片和包括时间邻近块的参考图片可相同或不同。时间邻近块可被称为并置参考块、并置CU(colCU)等,并且包括时间邻近块的参考图片可被称为并置图片(colPic)。例如,帧间预测器221可基于邻近块来配置运动信息候选列表并且生成指示哪一候选用于推导当前块的运动向量和/或参考图片索引的信息。可基于各种预测模式执行帧间预测。例如,在跳过模式和合并模式的情况下,帧间预测器221可使用邻近块的运动信息作为当前块的运动信息。在跳过模式下,与合并模式不同,可不发送残差信号。运动向量预测(MVP)模式可以通过将邻近块的运动向量用作运动向量预测子,并且用信号通知运动向量差来指示当前块的运动向量。
预测器220可基于下面描述的各种预测方法来生成预测信号。例如,预测器可不仅应用帧内预测或帧间预测以预测一个块,而且同时应用帧内预测和帧间预测二者。这可被称为组合帧间和帧内预测(CIIP)。另外,预测器可基于帧内块复制(IBC)预测模式或调色板模式来预测块。IBC预测模式或调色板模式可用于游戏等的内容图像/视频编译,例如屏幕内容编译(SCC)。IBC基本上在当前图片中执行预测,但是可与帧间预测相似地执行,使得在当前图片中推导参考块。即,IBC可使用本文中描述的至少一个帧间预测技术。调色板模式可被视为帧内编译或帧内预测的示例。当应用调色板模式时,可基于关于调色板表和调色板索引的信息用信号通知图片内的样本值。
由预测器(包括帧间预测器221和/或帧内预测器222)生成的预测信号可用于生成重构信号或生成残差信号。变换器232可通过对残差信号应用变换技术来生成变换系数。例如,变换技术可包括离散余弦变换(DCT)、离散正弦变换(DST)、Karhunen–Loève变换(KLT)、基于图形的变换(GBT)或条件非线性变换(CNT)中的至少一个。这里,当像素之间的关系信息由图形表示时,GBT意指从图形获得的变换。CNT是指基于使用所有先前重构的像素生成的预测信号生成的变换。另外,变换处理可应用于具有相同大小的正方形像素块或者可应用于具有正方形以外的可变大小的块。
量化器233可将变换系数量化并将它们发送到熵编码器240,并且熵编码器240可对量化的信号(关于量化的变换系数的信息)进行编码并输出比特流。关于量化的变换系数的信息可被称为残差信息。量化器233可基于系数扫描顺序将块类型量化的变换系数重排为一维向量形式,并且基于一维向量形式的量化的变换系数来生成关于量化的变换系数的信息。可生成关于变换系数的信息。熵编码器240可执行例如指数Golomb编译、上下文自适应可变长度编译(CAVLC)、上下文自适应二进制算术编译(CABAC)等的各种编码方法。熵编码器240可对量化的变换系数以外的视频/图像重构所需的信息(例如,语法元素的值等)一起或单独地进行编码。编码的信息(例如,编码的视频/图像信息)可按比特流的形式以NAL(网络抽象层)为单位发送或存储。视频/图像信息还可包括关于各种参数集的信息,例如自适应参数集(APS)、图片参数集(PPS)、序列参数集(SPS)或视频参数集(VPS)。另外,视频/图像信息还可包括一般约束信息。在本文中,从编码设备发送/用信号通知给解码设备的信息和/或语法元素可被包括在视频/图片信息中。视频/图像信息可通过上述编码过程编码并被包括在比特流中。比特流可经由网络发送或者可被存储在数字存储介质中。网络可包括广播网络和/或通信网络,并且数字存储介质可包括诸如USB、SD、CD、DVD、蓝光、HDD、SSD等的各种存储介质。发送从熵编码器240输出的信号的发送器(未示出)和/或存储该信号的存储单元(未示出)可被包括作为编码设备200的内部/外部元件,并且另选地,发送器可被包括在熵编码器240中。
从量化器233输出的量化的变换系数可用于生成预测信号。例如,可通过经由解量化器234和逆变换器235对量化的变换系数应用解量化和逆变换来重构残差信号(残差块或残差样本)。加法器250将重构的残差信号与从帧间预测器221或帧内预测器222输出的预测信号相加以生成重构信号(重构图片、重构块、重构样本阵列)。如果要处理的块不存在残差(例如,应用跳过模式的情况),则预测块可用作重构块。加法器250可被称为重构器或重构块生成器。如下所述,所生成的重构信号可用于当前图片中要处理的下一块的帧内预测并且可通过滤波用于下一图片的帧间预测。
此外,可在图片编码和/或重构期间应用亮度映射与色度缩放(LMCS)。
滤波器260可通过对重构信号应用滤波来改进主观/客观图像质量。例如,滤波器260可通过对重构图片应用各种滤波方法来生成修改的重构图片并将修改的重构图片存储在存储器270(具体地,存储器270的DPB)中。例如,各种滤波方法可包括去块滤波、样本自适应偏移、自适应环路滤波器、双边滤波器等。滤波器260可生成与滤波有关的各种类型的信息并且将所生成的信息发送到熵编码器240,如在各个滤波方法的描述中稍后描述的。与滤波有关的信息可由熵编码器240编码并以比特流的形式输出。
发送到存储器270的修改的重构图片可用作帧间预测器221中的参考图片。当通过编码设备应用帧间预测时,可避免编码设备200与解码设备之间的预测失配并且编译效率可改进。
存储器270DPB的DPB可存储用作帧间预测器221中的参考图片的修改的重构图片。存储器270可存储推导(或编码)当前图片中的运动信息的块的运动信息和/或图片中已经重构的块的运动信息。所存储的运动信息可被发送到帧间预测器221并用作空间邻近块的运动信息或时间邻近块的运动信息。存储器270可存储当前图片中的重构块的重构样本并且可将重构样本传送至帧内预测器222。
图3是用于示意性地说明本公开适用于的视频/图像解码设备的配置的图。
参照图3,解码设备300可包括熵解码器310、残差处理器320、预测器330、加法器340、滤波器350和存储器360。预测器330可包括帧间预测器331和帧内预测器332。残差处理器320可包括解量化器321和逆变换器321。根据实施方式,熵解码310、残差处理器320、预测器330、加法器340和滤波器350可由硬件组件(例如,解码器芯片组或处理器)配置。另外,存储器360可包括解码图片缓冲器(DPB)或者可由数字存储介质配置。硬件组件还可包括存储器360作为内部/外部组件。
当输入包括视频/图像信息的比特流时,解码设备300可重构与在图2的编码设备中处理视频/图像信息的处理对应的图像。例如,解码设备300可基于从比特流获得的块分割相关信息来推导单元/块。解码设备300可使用编码设备中应用的处理器来执行解码。因此,例如,解码的处理器可以是编译单元,并且编译单元可根据四叉树结构、二叉树结构和/或三叉树结构从编译树单元或最大编译单元分割。可从编译单元推导一个或更多个变换单元。通过解码设备300解码和输出的重构图像信号可通过再现设备再现。
解码设备300可接收从图2的编码设备以比特流的形式输出的信号,并且所接收的信号可通过熵解码器310解码。例如,熵解码器310可解析比特流以推导图像重构(或图片重构)所需的信息(例如,视频/图像信息)。视频/图像信息还可包括关于各种参数集的信息,例如自适应参数集(APS)、图片参数集(PPS)、序列参数集(SPS)或视频参数集(VPS)。另外,视频/图像信息还可包括一般约束信息。解码设备还可基于关于参数集的信息和/或一般约束信息将图片解码。本文中稍后描述的用信号通知/接收的信息和/或语法元素可通过解码过程解码并从比特流获得。例如,熵解码器310基于诸如指数Golomb编译、CAVLC或CABAC的编译方法对比特流中的信息进行解码,并且输出图像重构所需的语法元素和残差的变换系数的量化值。更具体地,CABAC熵解码方法可接收与比特流中的各个语法元素对应的bin(二进制位),使用解码目标语法元素信息、解码目标块的解码信息或在先前阶段中解码的符号/bin的信息来确定上下文模型,并且通过根据所确定的上下文模型预测bin出现的概率对bin执行算术解码,并且生成与各个语法元素的值对应的符号。在这种情况下,CABAC熵解码方法可在确定上下文模型之后通过将解码的符号/bin的信息用于下一符号/bin的上下文模型来更新上下文模型。熵解码器310所解码的信息当中与预测有关的信息可被提供给预测器(帧间预测器332和帧内预测器331),并且在熵解码器310中执行了熵解码的残差值(即,量化的变换系数和相关参数信息)可被输入到残差处理器320。残差处理器320可推导残差信号(残差块、残差样本、残差样本阵列)。另外,熵解码器310所解码的信息当中关于滤波的信息可被提供给滤波器350。此外,用于接收从编码设备输出的信号的接收器(未示出)还可被配置成解码设备300的内部/外部元件,或者接收器可以是熵解码器310的组件。此外,根据本文的解码设备可被称为视频/图像/图片解码设备,并且解码设备可被分类为信息解码器(视频/图像/图片信息解码器)和样本解码器(视频/图像/图片样本解码器)。信息解码器可包括熵解码器310,并且样本解码器可包括解量化器321、逆变换器322、加法器340、滤波器350、存储器360、帧间预测器332和帧内预测器331中的至少一个。
解量化器321可将量化的变换系数解量化并输出变换系数。解量化器321可按二维块形式重排量化的变换系数。在这种情况下,可基于在编码设备中执行的系数扫描顺序来执行重排。解量化器321可使用量化参数(例如,量化步长信息)对量化的变换系数执行解量化并且获得变换系数。
逆变换器322对变换系数逆变换以获得残差信号(残差块、残差样本阵列)。
预测器330可对当前块执行预测并生成包括当前块的预测样本的预测块。预测器可基于从熵解码器310输出的关于预测的信息来确定对当前块应用帧内预测还是帧间预测并且可确定特定帧内/帧间预测模式。
预测器可基于下述各种预测方法来生成预测信号。例如,预测器不仅可应用帧内预测或帧间预测以预测一个块,而且可同时应用帧内预测和帧间预测。这可被称为组合帧间和帧内预测(CIIP)。另外,预测器可基于帧内块复制(IBC)预测模式或调色板模式来预测块。IBC预测模式或调色板模式可用于游戏等的内容图像/视频编译,例如屏幕内容编译(SCC)。IBC基本上执行当前图片中的预测,但是可与帧间预测相似地执行,使得在当前图片中推导参考块。即,IBC可使用本文中描述的至少一种帧间预测技术。调色板模式可被视为帧内编译或帧内预测的示例。当应用调色板模式时,可基于关于调色板表和调色板索引的信息用信号通知图片内的样本值。帧内预测器331可参考当前图片中的样本来预测当前块。根据预测模式,所参考的样本可位于当前块附近或者可隔开。在帧内预测中,预测模式可包括多个非定向模式和多个定向模式。帧内预测器331可使用应用于邻近块的预测模式来确定应用于当前块的预测模式。
帧内预测器331可参考当前图片中的样本来预测当前块。根据预测模式,所参考的样本可位于当前块附近或者可隔开。在帧内预测中,预测模式可包括多个非定向模式和多个定向模式。帧内预测器331可使用应用于邻近块的预测模式来确定应用于当前块的预测模式。
帧间预测器332可基于参考图片上运动向量所指定的参考块(参考样本阵列)来推导当前块的预测块。在这种情况下,为了减少在帧间预测模式下发送的运动信息量,可基于邻近块与当前块之间的运动信息的相关性以块、子块或样本为单位预测运动信息。运动信息可包括运动向量和参考图片索引。运动信息还可包括帧间预测方向(L0预测、L1预测、Bi预测等)信息。在帧间预测的情况下,邻近块可包括存在于当前图片中的空间邻近块和存在于参考图片中的时间邻近块。例如,帧间预测器332可基于邻近块来配置运动信息候选列表并且基于所接收的候选选择信息来推导当前块的运动向量和/或参考图片索引。可基于各种预测模式来执行帧间预测,并且关于预测的信息可包括指示当前块的帧间预测模式的信息。
加法器340可通过将所获得的残差信号与从预测器(包括帧间预测器332和/或帧内预测器331)输出的预测信号(预测块、预测样本阵列)相加来生成重构信号(重构图片、重构块、重构样本阵列)。如果要处理的块不存在残差,例如当应用跳过模式时,预测块可用作重构块。
加法器340可被称为重构器或重构块生成器。所生成的重构信号可用于当前图片中要处理的下一块的帧内预测,可如下所述通过滤波输出,或者可用于下一图片的帧间预测。
此外,可在图片解码处理中应用亮度映射与色度缩放(LMCS)。
滤波器350可通过对重构信号应用滤波来改进主观/客观图像质量。例如,滤波器350可通过对重构图片应用各种滤波方法来生成修改的重构图片并且将修改的重构图片存储在存储器360(具体地,存储器360的DPB)中。例如,各种滤波方法可包括去块滤波、样本自适应偏移、自适应环路滤波器、双边滤波器等。
存储在存储器360的DPB中的(修改的)重构图片可用作帧间预测器332中的参考图片。存储器360可存储推导(或解码)当前图片中的运动信息的块的运动信息和/或图片中已经重构的块的运动信息。所存储的运动信息可被发送到帧间预测器260以用作空间邻近块的运动信息或时间邻近块的运动信息。存储器360可存储当前图片中的重构块的重构样本并将重构样本传送至帧内预测器331。
在本公开中,在编码设备200的滤波器260、帧间预测器221和帧内预测器222中描述的实施方式可与解码设备300的滤波器350、帧间预测器332和帧内预测器331相同或分别与之对应应用。这也可适用于单元332和帧内预测器331。
如上所述,在执行视频编译时,执行预测以增强压缩效率。可通过预测生成包括当前块(即,目标编译块)的预测样本的预测块。在这种情况下,预测块包括空间域(或像素域)中的预测样本。预测块在编码设备和解码设备中相同地推导。编码设备可通过用信号向解码设备通知关于原始块(而非原始块的原始样本值本身)与预测块之间的残差的信息(残差信息)来增强图像编译效率。解码设备可基于残差信息来推导包括残差样本的残差块,可通过将残差块和预测块相加来生成包括重构样本的重构块,并且可生成包括重构块的重构图片。
残差信息可通过变换过程和量化过程来生成。例如,编码设备可推导原始块与预测块之间的残差块,可通过对包括在残差块中的残差样本(残差样本阵列)执行变换过程来推导变换系数,可通过对变换系数执行量化过程来推导量化的变换系数,并且可将相关残差信息(通过比特流)用信号通知给解码设备。在这种情况下,残差信息可包括诸如量化的变换系数的值信息、位置信息、变换方案、变换核心和量化参数的信息。解码设备可基于残差信息来执行解量化/逆变换过程并且可推导残差样本(或残差块)。解码设备可基于预测块和残差块来生成重构图片。此外,编码设备可通过对供后续图片的帧间预测参考的量化的变换系数进行解量化/逆变换来推导残差块,并且可生成重构图片。
图4a和图4b是图示由根据实施方式的编码设备执行的图像编码方法的示例以及由根据实施方式的解码设备执行的图像解码方法的示例的图。
图4a图示由视频编码设备执行的图像编码方法的示例。参照图4a,图像编码方法可包括块分区、帧内/帧间预测、变换、量化和熵编码过程。例如,可将当前图片分区成多个块,可通过帧内/帧间预测来生成当前块的预测块,并且可通过减去当前块的输入块和预测块来生成当前块的残差块。此后,可通过对残差块进行变换来生成系数块,即,当前块的变换系数。变换系数可被量化和熵编码并存储在比特流中。
图4b图示由解码设备执行的图像解码方法的示例。参照图4b,图像解码方法可包括熵解码、逆量化、逆变换和帧内/帧间预测过程。例如,解码设备可执行编码方法的逆过程。具体地,可通过对比特流的熵解码来获得量化的变换系数,并且可通过量化的变换系数的逆量化过程来获得当前块的系数块,即变换系数。可通过对变换系数的逆变换来推导当前块的残差块,并且可通过将通过帧内/帧间预测推导的当前块的预测块和残差块相加来推导当前块的重构块。
图5是图示根据实施方式的帧内预测方法的流程图。
如图5所示,根据实施方式的帧内预测方法可包括以下三个步骤。也就是说,根据实施方式的帧内预测方法可包括参考样本构建步骤、样本预测步骤和后滤波步骤。在样本预测步骤中,根据该实施方式的帧内预测方法可使用已知的邻近参考样本和帧内预测模式来对未知样本执行预测。
图6是图示定向帧内预测模式的示例的图。
当对当前块应用帧内预测时,根据实施方式的编码设备和/或解码设备可推导用于当前块的帧内预测模式,并且基于该帧内预测模式来推导当前块的预测样本。也就是说,编码设备和/或解码设备可基于当前块的邻近参考样本通过启用定向帧内预测模式或非定向帧内预测模式来推导当前块的预测样本。
在示例中,帧内预测模式可包括两个非定向(或非角度)帧内预测模式和65个定向(或角度)帧内预测模式。非定向帧内预测模式可包括编号0平面帧内预测模式和编号1DC帧内预测模式,而定向帧内预测模式可包括介于编号2帧内预测模式与编号66帧内预测模式之间的65个帧内预测模式。基于65个定向帧内预测模式的帧内预测可被应用于所有大小的块,并且可被应用于亮度分量和色度分量二者。然而,这仅是示例,并且帧内预测模式的配置可以是不同的。
另选地,帧内预测模式可包括两个非定向帧内预测模式和129个定向帧内预测模式。非定向帧内预测模式可包括平面帧内预测模式和DC帧内预测模式,而定向帧内预测模式可包括编号2至编号130帧内预测模式。
同时,除了上述帧内预测模式之外,帧内预测模式还可进一步包括用于色度样本的跨分量线性模型(CCLM)模式。CCLM模式可取决于是考虑左样本、考虑上样本还是考虑二者来推导LM参数而被分类为LT_CCLM、L_CCLM和T_CCLM,并且可被仅应用于色度分量。
可给帧内预测模式编索引,例如,如下表1所示。
[表1]
帧内预测模式 | 相关名称 |
0 | INTRA_PLANAR |
1 | INTRA_DC |
2..66 | INTRA_ANGULAR2..INTRA_ANGULAR66 |
81..83 | INTRA_LT_CCLM、INTRA_L_CCLM、INTRA_T_CCLM |
同时,帧内预测类型(或附加帧内预测模式等)可包括上述LIP、PDPC、MRL和ISP中的至少一种。可基于帧内预测类型信息来指示帧内预测类型,并且可以各种形式实现帧内预测类型信息。在一个示例中,帧内预测类型信息可包括指示帧内预测类型中的一种的帧内预测类型索引信息。在另一示例中,帧内预测类型信息可包括以下各项中的至少一种:与是否对当前块应用MRL并且在被应用的情况下哪个参考样本线被使用有关的参考样本线信息(例如,intra_luma_ref_idx)、与是否对当前块应用ISP有关的ISP标志信息(例如,intra_subpartitions_split_flag)、与是否应用PDCP有关的标志信息、或与是否应用LIP有关的标志信息。
参照图6,可以围绕具有左向上对角线预测方向的编号34帧内预测模式区分具有水平方向性的帧内预测模式和具有垂直方向性的帧内预测模式。图6的H和V分别意指水平方向性和垂直方向性,并且数字-32至32指示样本网格位置上以1/32为单位的位移。编号2至33帧内预测模式具有水平方向性,而编号34至66帧内预测模式具有垂直方向性。编号18帧内预测模式和编号50帧内预测模式分别可以是水平帧内预测模式和垂直帧内预测模式;可将编号2帧内预测模式称作左向下对角线帧内预测模式;可将编号34帧内预测模式称作左向上对角线帧内预测模式;并且可将编号66帧内预测模式称作右向上对角线帧内预测模式。
通常,当图像被划分成块时,要编译的当前块和邻近块具有类似的图像特性。因此,高度可能的是,当前块和邻近块具有相同或类似的帧内预测模式。因此,编码器可使用邻近块的帧内预测模式来对当前块的帧内预测模式进行编码。
更具体地,解码设备可基于当前块的邻近块(例如,左邻近块和/或上邻近块)的帧内预测模式和附加候选模式来推导最可能模式(MPM)列表,并且可基于接收到的MPM索引来选择所推导的MPM列表中的MPM候选中的一个,或者可基于剩余帧内预测模式信息来选择未包括在MPM候选中的剩余帧内预测模式中的一个。MPM列表可被称为帧内预测模式候选列表或者可被表示为candModeList。
当邻近块被帧内编译时,编码设备(或编码器)可检查或推导邻近块的预测模式。例如,可基于左邻近块的预测模式和上邻近块的预测模式来确定当前块的预测模式,并且在这种情况下,可将所对应邻近块的预测模式确定为最可能模式(MPM)。可将确定MPM表达为MPM(最可能模式)候选(或MPM列表)的列举。
在实施方式中,当对当前块执行帧内预测时,对当前块的亮度分量块(亮度块)的预测和对色度分量块(色度块)的预测被执行,并且在这种情况下,用于色度分量(色度块)的帧内预测模式可与用于亮度分量(亮度块)的帧内预测模式分别地设置。
例如,可基于帧内色度预测模式信息来指示用于色度分量的帧内预测模式,并且可以intra_chroma_pred_mode语法元素的形式用信号通知帧内色度预测模式信息。在示例中,帧内色度预测模式信息可指示平面模式、DC模式、垂直模式、水平模式、推导模式(DM)和CCLM(跨分量线性模型)模式中的一种。就此而论,平面模式可以是编号0帧内预测模式;DC模式可以是编号1帧内预测模式;垂直模式可以是编号26帧内预测模式;并且水平模式可以是编号10帧内预测模式。也可将DM称作直接模式。能够将CCLM称作LM。
图7是用于图示根据实施方式的基于CCLM的帧内预测的图。
在实施方式中,可将CCLM模式应用于当前色度块。CCLM模式可将可基于亮度块的邻近样本和色度块的邻近样本推导线性模型的模式表示为使用亮度块和与该亮度块对应的色度块之间的相关性的帧内预测模式,并且基于线性模型和亮度块的重构样本来推导色度块的预测样本。更具体地,当对当前色度块应用CCLM模式时,可基于用于当前色度块的帧内预测的邻近样本和用于当前亮度块的帧内预测的邻近样本来推导用于线性模型的参数。例如,可基于以下等式1来表达线性模型。
[等式1]
predC(i,j)=α·recL′(i,j)+β
这里,predc(i,j)可表示当前色度块的(i,j)坐标处的预测样本,并且recL'(i,j)可表示当前亮度块的(i,j)坐标处的重构样本。另外,recL'(i,j)可表示当前亮度块的下采样重构样本。
同时,可基于用于当前亮度块的帧内预测的邻近样本和用于当前色度块的帧内预测的邻近样本来推导线性模型的参数α和β。可基于以下等式2和3来推导参数α和参数β。
[等式2]
[等式3]
这里,L(n)可表示当前亮度块的上邻近样本和/或左邻近样本,并且C(n)可表示当前色度块的上邻近样本和/或左邻近样本。另外,L(n)可表示当前亮度块的下采样上邻近样本和/或左邻近样本。此外,N可表示为当前色度块的宽度和高度中的较小值的两倍的值。
在实施方式中,为了对色度帧内预测模式进行编译,对于色度帧内模式编译可允许总共八个帧内预测模式。八个帧内预测模式可包括五个现有的帧内预测模式和跨分量线性模式(CCLM)模式。要稍后描述的表2示出用于在CCLM不可用时推导帧内色度预测模式的映射表,而表3示出用于在CCLM可用时推导帧内预测模式的映射表。
[表2]
表2示出当sps_cclm_enabled_flag的值为0时取决于intra_chroma_pred_mode[xCb][yCb]和IntraPredModeY[xCb+cbWidth/2][yCb+cbHeight/2]的IntraPredModeC[xCb][yCb]。
[表3]
表3示出了当sps_cclm_enabled_flag的值为1时取决于intra_chroma_pred_mode[xCb][yCb]和IntraPredModeY[xCb+cbWidth/2][yCb+cbHeight/2]的IntraPredModeC[xCb][yCb]。
在表2和表3中,sps_cclm_enabled_flag可以是用于在SPS(序列参数集)级别下用信号通知的CCLM是否被启用的标志;intra_chroma_pred_mode可以是帧内色度预测模式信息;IntraPredModeY可以是亮度块的帧内预测模式信息;IntraPredModeC可以是色度块的帧内预测模式信息;xCb可以是当前块的左上样本的x坐标;yCb可以是当前块的左上样本的y坐标;cbWidth可以是当前块的宽度;并且cbHeight可以是当前块的高度。
如表2和表3所示,可基于用于覆盖当前块或色度块的中心右下样本的亮度块(例如,当应用DUAL_TREE时)的帧内亮度预测模式和用信号通知的帧内色度预测模式(intra_chroma_pred_mode)信息的值,来确定帧内色度预测模式。
在下文中,将描述色度格式。
在本公开中,特定术语或句子被用于定义特定信息或概念。例如,与用于当前块的色度格式采样结构有关的色度格式索引被表达为“chroma_format_idc”;与三个颜色分量是否被分别编译有关的单独颜色平面标志被表达为“separate_colour_plane_flag”;色度阵列类型被表达为“ChromaArrayType”;如果用于推导当前块的树类型是单树,则它被表达为“SINGLE_TREE”;如果用于推导当前块的树类型是双树内的色度树,则它被表达为“DUAL_TREE_CHROMA”;与基于亮度分量来推导Cb分量或Cr分量的CCLM是否被启用有关的CCLM标志被表达为“sps_cclm_enabled_flag”;与三个颜色分量相对于当前块内的预定义区域是否被分别编译有关的双树帧内标志被表达为“qtbtt_dual_tree_intra_flag”;以及与ALF是否被应用于Cb分量和Cr分量中的至少一个有关的ALF色度索引被表达为“alf_chroma_idc”。
然而,“chroma_format_idc”可用诸如chroma_format_idx和ChromaFormat_idc的各种术语替换;“separate_colour_plane_flag”可用诸如separate_color_plane_flag、separate_colorplane_flag的各种术语替换;“ChromaArrayType”可用chromaArrayType等替换;“sps_cclm_enabled_flag”可用cclm_flag、cclm_enabled_flag等替换;并且“qtbtt_dual_tree_intra_flag”可用诸如dual_tree_intra_flag、dual_tree_implicit_split_flag、dual_tree_qtbtt_flag等的各种术语替换。因此,在整个说明书中,当解释用于在本公开中定义特定信息或概念的特定术语或句子时,应该避免限于该名称的解释,而是相反需要在根据旨在由术语表达的内容注意各种操作、功能和效果的同时解释它们。
在视频中可存在各种色度格式,诸如单色、4:2:0、4:2:2、4:4:4。在单色采样中,可存在一个样本阵列,并且该样本阵列可以是亮度阵列。在4:2:0采样中,两个色度阵列中的每一个可具有亮度阵列的一半高度和亮度阵列的一半宽度。在4:2:2采样中,两个色度阵列中的每一个可具有与亮度阵列相同的高度,并且具有亮度阵列的一半宽度。
在4:4:4采样中,可取决于separate_colour_plane_flag的值而应用下列。如果separate_colour_plane_flag的值为0,则两个色度阵列中的每一个可具有与亮度阵列相同的高度和相同的宽度。可将ChromaArrayType设置为与chroma_format_idc相同。如果separate_colour_plane_flag的值为1,则可像单色采样的图片一样分别处理三个颜色平面。可将ChromaArrayType设置为0。下表4示出了根据实施方式的色度格式分类。
[表4]
可基于根据上表4的色度格式分类来提供以下各种实施方式。
在一个实施方式中,可提供用于推导用于色度(块)的帧内预测模式的方法。当ChromaArrayType的值不为0时,可如下表5所示的那样解析用于指示色度帧内预测模式的语法元素intra_chroma_pred_mode。当ChromaArrayType的值为0时,可省略用于推导色度帧内预测模式的过程。
[表5]
在表5中,intra_chroma_pred_mode[x0][y0]可表示用于色度样本的帧内预测模式。x0和y0表示图片的左上亮度样本的(当前)编译块的左上亮度样本的位置(x0,y0)。
如表5中公开的,当ChromaArrayType!=0时,可检查是否满足if(treeType==SINGLE_TREE||treeType==DUAL_TREE_CHROMA)以便推导intra_chroma_pred_mode[x0][y0]。也就是说,基于ChromaArrayType的值不为0的确定,可以确定用于推导当前块的树类型是否是单树或双树内的色度树,并且取决于此确定,可选择是否推导intra_chroma_pred_mode[x0][y0]。
在实施方式中,可提供用于色度(块)的PCM样本推导方法。当ChromaArrayType的值不为0时,可如下表6所公开的那样解析用于指示编译后的色度样本值的语法元素pcm_sample_chroma。
[表6]
在表6中,pcm_sample_chroma[i]可表示编译单元内按光栅扫描顺序的编译的色度样本值。前半部分的值可以是编译的Cb样本,而后半部分的值可以是编译的Cr样本。用于表示这些样本中的每一个的比特数是PcmBitDepthC。
在实施方式中,可提供解析色度(块)的编译块标志(CBF)的方法。当chromaArrayType的值不为0时,可如下表7所公开的那样解析用于指示色度帧内预测模式的tu_cbf_cb和tu_cbf_cr。当chromaArrayType的值为0时,可将tu_cbf_cb和tu_cbf_cr估计为0,因此可省略推导用于色度的变换系数的过程。
[表7]
如果tu_cbf_cb[x0][y0]的值为1,则Cb变换块可包括一个或更多个非零变换系数级别。阵列索引x0和y0指示变换块的左上位置(x0,y0)。如果在当前CU中不存在tu_cbf_cb[x0][y0],则可将其值估计为0。
如果tu_cbf_cr[x0][y0]的值为1,则Cr变换块可包括一个或更多个非零变换系数级别。阵列索引x0和y0指示变换块的左上位置(x0,y0)。如果在当前CU中不存在tu_cbf_cr[x0][y0],则可将其值估计为0。
在实施方式中,可关于色度格式提供用于在I拼块组的双树内分割的隐式四叉树的编译方法。I拼块组可具有两种类型的树类型。一个是单树而另一个是双树。当应用I拼块组双树时,亮度分量和色度分量可具有它们自己的块结构。换句话说,色度分量可具有与亮度分量相同的块结构,或者可具有不同的块结构。
当chromaArrayType的值不为0时,亮度和色度可能具有依赖性,诸如根据亮度的色度帧内预测模式推导、用于色度帧内块的CCLM等。当考虑硬件实现方式复杂性时,可能有必要在一定范围内(例如,可被称为流水线区域)限制亮度与色度之间的依赖性以启用流水线。流水线区域可被设置为64x64,或者可考虑到一些有限的硬件资源被设置为32x32。
当qtbtt_dual_tree_intra_flag的值为1时,对于I拼块组,可将每个编译树单元(CTU)划分成在预定义亮度样本区域中使用隐式四叉树划分的编译单元。编译单元可以是用于亮度和色度的两个单独的coding_tree语法结构的根。当qtbtt_dual_tree_intra_flag的值为0时,可省略隐式四叉树划分。下表8示出当ChromaArrayType的值不为0时在序列参数集(SPS)级别下解析qtbtt_dual_tree_intra_flag的示例。
[表8]
seq_parameter_set__rbsp(){ | 描述符 |
... | |
if(ChromaArrayType!=0) | |
qtbtt_dual_tree_intra_flag | u(1) |
... | |
} |
参考表8,当chromaArrayType的值不为0时可解析qtbtt_dual_tree_intra_flag。当chromaArrayType的值为0时,qtbtt_dual_tree_intra_flag不出现并且可被估计为0。当在单色或单独的颜色平面中采用色度格式4∶4∶4时,chromaArrayType的值可以是0。在单色或单独的颜色平面中采用色度格式4∶4∶4的情况下,由于没有亮度和色度依赖性,所以可以不需要嵌套划分。
在实施方式中,可关于色度格式提供CCLM帧内预测方法。当chromaArrayType的值不为0时,亮度和色度可具有与用于色度帧内块的CCLM预测相同的依赖性。对于色度样本帧内预测,可对重构亮度样本应用CCLM参数。下表9示出当ChromaArrayType的值不为0时解析sps_cclm_enabled_flag的示例。
[表9]
seq_parameter_set_rbsp(){ | 描述符 |
... | |
if(ChromaArrayType!=0) | |
sps_cclm_enabled_flag | u(1) |
if(sps_cclm_enabled_flag&&chroma_format_idc==1) | |
sps_cclm_colocated_chroma_flag | u(1) |
... | |
} |
在表9中,当sps_cclm_enabled_flag的值为0时,可以不启用从亮度分量到色度分量的CCLM。当sps_cclm_enabled_flag的值为1时,可启用从亮度分量到色度分量的CCLM。当不存在sps_cclm_enabled_flag时,可将sps_cclm_enabled_flag的值估计为0。
在实施方式中,可关于色度格式用信号通知关于颜色平面的信息。下表10和11公开了作为关于颜色平面的信息的separate_colour_plane_fiag和colour_plane_id以及作为关于色度格式的信息的chroma_format_idc如下。
[表10]
seq_parameter_set_rbsp(){ | 描述符 |
... | |
if(chroma_format_idc==3) | |
separate_colour_plane_flag | u(1) |
... | |
} |
[表11]
tile_group_header(){ | 描述符 |
... | |
if(separate_colour_plane_flag==1) | |
colour_plane_id | u(2) |
... | |
} |
在表10和表11中,当separate_colour_plane_flag的值为1时,可分别对4∶4∶4色度格式的三个颜色分量进行编译。如果separate_colour_plane_flag的值为1,则可解析colour_plane_id以指定不同的颜色分量。当separate_colour_plane_flag的值为1时,colour_plane_id可指示与当前拼块RBSP关联的颜色平面。colour_plane_id的值可以包括在0至2的范围内。colour_plane_id值0、1和2分别可对应于亮度(Y)、色度Cb和色度Cr。在具有不同的colour_plane_id值的图片之间的解码过程中可能不存在依赖性。
在实施方式中,可提供关于色度格式用信号通知自适应环路滤波器(ALF)色度索引的方法。当APS_NUT(自适应参数集)的网络相关层(NAL)单元被用信号通知时,可包括ALF数据。ALF数据可包括与是否应该对色度分量应用ALF有关的alf_chroma_idc。如下表12中描述的,当ChromaArrayType的值不为0时可解析alf_chroma_idc。
[表12]
alf_data(){ | 描述符 |
... | |
if(ChromaArrayType!=0) | |
alf_chroma_idc | tu(v) |
... | |
} |
如果alf_chroma_idc的值为0,则ALF可以不被应用于Cb颜色分量和Cr颜色分量。当alf_chroma_idc的值为1时,ALF可以被应用于Cb颜色分量。当alf_chroma_idc的值为2时,ALF可以被应用于Cr颜色分量。当alf_chroma_idc的值为3时,ALF可以被应用于Cb颜色分量和Cr颜色分量。如果不存在alf_chroma_idc,则可将alf_chroma_idc的值估计为0。
图8是图示根据实施方式的编码设备的操作的流程图,并且图9是图示根据实施方式的编码设备的配置的框图。
根据图8和图9的编码设备可执行与根据图10和图11的解码设备的操作对应的操作。因此,可对根据图8和图9的编码设备类似地应用要稍后在图10和图11中描述的解码设备的操作。
图8中公开的每个步骤可由图2中公开的编码设备200执行。更具体地,步骤S800至S830可由图2中公开的预测器220执行,步骤S840可由图2中公开的残差处理器230执行,并且步骤S850可由图2中公开的熵编码器240执行。此外,根据S800至S850的操作基于上面在图4a至图7中描述的内容中的一些。因此,将省略或简要地描述针对与上面在图2和图4a至图7中描述的那些冗余的特定内容的说明。
如图11所示,根据实施方式的编码设备可包括预测器220和熵编码器240。然而,在一些情况下,图11所示的所有组件可能不是编码设备的必要组件,并且编码设备可由比图11所示的组件更多或更少的组件实现。
在根据实施方式的编码设备中,预测器220和熵编码器240可由单独的芯片实现,或者至少两个或更多个组件可由单个芯片实现。
根据实施方式的编码设备可生成与用于当前块的色度格式采样结构有关的色度格式索引(S800)。更具体地,编码设备的预测器220可生成与用于当前块的色度格式采样结构有关的色度格式索引。
根据实施方式的编码设备可生成与三个颜色分量是否被分别编译有关的单独颜色平面标志(S810)。更具体地,编码设备的预测器220可生成与三个颜色分量是否被分别编译有关的单独颜色平面标志。
根据实施方式的编码设备可基于色度格式索引和单独颜色平面标志来推导用于当前块的色度阵列类型(S820)。更具体地,编码设备的预测器220可基于色度格式索引和单独颜色平面标志来推导用于当前块的色度阵列类型。
根据实施方式的编码设备可基于所推导的色度阵列类型来推导当前块的预测样本(S830)。更具体地,编码设备的预测器220可基于所推导的色度阵列类型来推导当前块的预测样本。
根据实施方式的编码设备可基于预测样本来推导当前块的残差样本(S840)。更具体地,编码设备的残差处理器230可基于预测样本来推导当前块的残差样本。
根据实施方式的编码设备可对包括关于残差样本的信息的残差信息进行编码(S850)。更具体地,编码设备的熵编码器240可对包括关于残差样本的信息的残差信息进行编码。
在实施方式中,三个颜色分量可包括亮度分量和色度分量,并且色度分量可包括Cb分量和Cr分量。
在一个实施方式中,推导当前块的预测样本可包括检查色度阵列类型的值不是0并且用于推导当前块的树类型是否是单树或双树内的色度树。
在实施方式中,可基于色度格式索引的值为0或者单独颜色平面标志的值为1的确定来将色度阵列类型的值确定为0。可基于色度格式索引的值不为0并且单独颜色平面标志的值为0的确定来确定色度阵列类型的值不是0。
根据实施方式的编码设备在推导当前块的预测样本时,可基于用于推导当前块的树类型是单树或双树内的色度树的确定来推导用于当前块的帧内色度预测模式,并且基于帧内色度预测模式来推导当前块的预测样本。
根据实施方式的编码设备可基于色度阵列类型的值不为0的确定来推导与三个颜色分量相对于当前块内的预定义区域是否被分别编译有关的双树帧内标志。
根据实施方式的编码设备可基于色度阵列类型的值不为0的确定来创建与是否应用用于基于亮度分量来推导Cb分量或Cr分量的跨分量线性模型(CLLM)有关的CCLM标志。
根据实施方式的编码设备可基于色度阵列类型的值不为0的确定来生成与是否对Cb分量和Cr分量中的至少一个应用自适应环路滤波器(ALF)有关的ALF色度索引。
在实施方式中,基于ALF色度索引的值为0的确定,ALF可以不被应用于Cb分量和Cr分量;基于ALF色度索引的值为1的确定,ALF可以被应用于Cb分量;基于ALF色度索引的值为2的确定,ALF可以被应用于Cr分量;以及基于ALF色度索引的值为3的确定,ALF可以被应用于Cb分量和Cr分量。
根据图8和图9的编码设备以及编码设备的操作方法,编码设备可生成与用于当前块的色度格式采样结构有关的色度格式索引(S800),生成与三个颜色分量是否被分别编译有关的单独颜色平面标志(S810),基于色度格式索引和单独颜色平面标志来推导用于当前块的色度阵列类型(S820),基于所推导的色度阵列类型来推导当前块的预测样本(S830),基于预测样本来推导当前块的残差样本(S840),并且对包括关于残差样本的信息的残差信息进行编码(S850),其中在这种情况下,三个颜色分量包括亮度分量和色度分量,并且色度分量包括Cb分量和Cr分量,并且其中,推导当前块的预测样本可包括检查色度阵列类型的值不是0并且用于推导当前块的树类型是否是单树或双树内的色度树。
也就是说,根据本公开,能够通过高效地用信号通知关于色度格式的信息来提高帧内预测的效率。另选地,根据本公开,可基于用于当前块的色度阵列类型高效地预测当前块。另选地,根据本公开,通过基于用于当前块的色度阵列类型的值不为0的确定来确定用于推导当前块的树类型是否是单树或双树内的色度树,并且通过根据关于色度树类型的确定来选择是否推导intra_chroma_pred_mode,能够高效地预测当前块。
图10是图示根据实施方式的解码设备的操作的流程图,并且图11是图示根据实施方式的解码设备的配置的框图。
图10中公开的步骤中的每一个可由图3中公开的解码设备300执行。更具体地,S1000可由图3中公开的熵解码器310执行,S1010和S1020可由图3中公开的预测器330执行,并且S1030可由图3中公开的加法器340执行。另外,根据S1000至S1030的操作基于上面参照图4a至图7描述的内容中的一些。因此,将省略或简要地描述针对与上面在图3至图7中描述的内容冗余的特定内容的说明。
如图11所示,根据实施方式的解码设备可包括熵解码器310、预测器330和加法器340。然而,在一些情况下,图11所示的所有组件可能不一定是解码设备所必要的,并且解码设备可由比图11所示的组件更多或更少的组件实现。
在根据实施方式的解码设备中,熵解码器310、预测器330和加法器340可由单独的芯片实现,或者至少两个或更多个组件可由单个芯片实现。
根据实施方式的解码设备可接收包括用于当前块的预测信息的比特流(S1000)。更具体地,解码设备的熵解码器310可接收包括用于当前块的预测信息的比特流。
根据实施方式的解码设备可基于与用于当前块的色度格式采样结构有关的色度格式索引以及与三个颜色分量是否被分别编译有关的单独颜色平面标志,来推导用于当前块的色度阵列类型,其中,色度格式索引和单独颜色平面标志被包括在用于当前块的预测信息中(S1010)。更具体地,解码设备的预测器330可基于与用于当前块的色度格式采样结构有关的色度格式索引,以及与三个颜色分量是否被分别编译有关的单独颜色平面标志,来推导用于当前块的色度阵列类型,其中,色度格式索引和单独颜色平面标志被包括在用于当前块的预测信息中。
在一个示例中,可将色度格式索引表达为chroma_format_idc;可将单独颜色平面标志表达为separate_colour_plane_flag;并且可将色度阵列类型表达为ChromaArrayType。
根据实施方式的解码设备可基于所推导的色度阵列类型来推导当前块的预测样本(S1020)。更具体地,解码设备的预测器330可基于所推导的色度阵列类型来推导当前块的预测样本。
根据实施方式的解码设备可基于预测样本来推导当前块的重构样本(S1030)。更具体地,解码设备的加法器340可基于预测样本来推导当前块的重构样本。
在实施方式中,三个颜色分量可包括亮度分量和色度分量,并且色度分量可包括Cb分量和Cr分量。在一个示例中,可将亮度分量表达为亮度颜色分量;可将色度分量表达为色度颜色分量;可将Cb分量表达为Cb颜色分量;并且可将Cr分量表达为Cr颜色分量。
根据实施方式的解码设备在推导当前块的预测样本时,可检查色度阵列类型的值不是0并且用于推导当前块的树类型是否是单树或双树内的色度树。在一个示例中,可将单树表达为SINGLE_TREE,并且可将双树内的色度树表达为DUAL_TREE_CHROMA。
在实施方式中,可基于色度格式索引的值为0或者单独颜色平面标志的值为1的确定来将色度阵列类型的值确定为0。可基于色度格式索引的值不为0并且单独颜色平面标志的值为0的确定来确定色度阵列类型的值不是0。这能够通过参考上表4来确认。
根据实施方式的解码设备在推导当前块的预测样本时,可基于色度阵列类型的值不为0并且用于推导当前块的树类型为单树或双树内的色度树的确定来推导用于当前块的帧内色度预测模式,并且基于该帧内色度预测模式来推导当前块的预测样本。
根据实施方式的解码设备可基于色度阵列类型的值不为0的确定来对双树帧内标志进行解码,所述双树帧内标志被包括在用于当前块的预测信息中,并且与三个颜色分量相对于当前块内的预定义区域是否被分别编译有关。在示例中,可将双树帧内标志表达为qtbtt_dual_tree_intra_flag。
根据实施方式的解码设备可基于色度阵列类型的值不为0的确定来对CCLM标志进行解码,所述CCLM标志被包括在用于当前块的预测信息中,并且与用于基于亮度分量来推导Cb分量或Cr分量的跨分量线性模型(CLLM)是否被启用有关。在示例中,可将CCLM标志表示为sps_cclm_enabled_flag。
在实施方式中,比特流可进一步包括自适应环路滤波器(ALF)信息,并且解码设备可基于色度阵列类型的值不为0的确定来对ALF色度索引进行解码,所述ALF色度索引被包括在ALF信息中,并且与是否对Cb分量或Cr分量中的至少一个应用ALF有关。在示例中,可将ALF色度索引表达为alf_chroma_idc。
在一个实施方式中,基于ALF色度索引的值为0的确定,ALF可以不被应用于Cb分量和Cr分量;基于ALF色度索引的值为1的确定,ALF可以被应用于Cb分量;基于ALF色度索引的值为2的确定,ALF可以被应用于Cr分量;以及基于ALF色度索引的值为3的确定,ALF可以被应用于Cb分量和Cr分量。
根据图10和图11中公开的解码设备和解码设备的操作方法,解码设备可接收包括用于当前块的预测信息的比特流(S1000),基于与用于当前块的色度格式采样结构有关的色度格式索引并且基于与三个颜色分量是否被分别编译有关的单独颜色平面标志来推导用于当前块的色度阵列类型,其中,色度格式索引和单独颜色平面标志被包括在用于当前块的预测信息中(S1010),基于所推导的色度阵列类型来推导当前块的预测样本(S1020),以及基于预测样本来推导当前块的重构样本(S1030),其中,三个颜色分量包括亮度分量和色度分量,并且色度分量包括Cb分量和Cr分量,并且其中,推导当前块的预测样本包括检查色度阵列类型的值不是0并且用于推导当前块的树类型是否是单树或双树内的色度树。
也就是说,根据本公开,可通过高效地用信号通知关于色度格式的信息来提高帧内预测的效率。另选地,根据本公开,可基于用于当前块的色度阵列类型高效地预测当前块。另选地,根据本公开,通过基于当前块的色度阵列类型的值是不为0的确定来确定用于推导当前块的树类型是否是单树或双树内的色度树,并且通过根据关于色度树类型的确定来选择是否推导intra_chroma_pred_mode,能够高效地预测当前块。
尽管已经在上述实施方式中基于按顺序列举步骤和框的流程图描述了方法,但是本公开的步骤不限于某个次序,并且可在不同的步骤中或者按与上述步骤不同的次序或同时地执行某个步骤。此外,本领域的普通技术人员应理解,流程图的步骤不是排他性的,并且可在其中包括另一步骤,或者在不影响本公开的范围的情况下,可删除流程图的一个或更多个步骤。
根据本公开的前述方法可具有软件的形式,并且可将根据本公开的编码设备和/或解码设备包括在用于执行图像处理的装置如TV、计算机、智能电话、机顶盒和显示装置等中。
当实施方式在本公开中用软件加以实现时,前述方法可使用执行前述功能的模块(过程、功能等)来实现。模块可被存储在存储器中并由处理器执行。存储器可被设置在处理器内部或外部并且使用各种公知手段连接到处理器。处理器可包括专用集成电路(ASIC)、其它芯片组、逻辑电路和/或数据处理装置。存储器可包括只读存储器(ROM)、随机存取存储器(RAM)、闪速存储器、存储卡、存储介质和/或其它存储装置。也就是说,可在处理器、微处理器、控制器或芯片上实现并执行本文描述的实施方式。例如,可在计算机、处理器、微处理器、控制器或芯片上实现并执行各个附图中示出的功能单元。在这种情况下,可在数字存储介质中存储用于实现方式的信息(例如,关于指令的信息)或算法。
此外,应用本公开的解码设备和编码设备可被包括在以下各项中:多媒体广播收发器、移动通信终端、家庭影院视频装置、数字影院视频装置、监视相机、视频聊天装置以及诸如视频通信的实时通信装置、移动流装置、存储介质、摄像机、视频点播(VoD)服务提供商、过顶(OTT)视频装置、互联网流服务提供商、3D视频装置、虚拟现实(VR)装置、增强现实(AR)装置、图像电话视频装置、车辆终端(例如,车辆(包括自主车辆)终端、飞机终端或船舶终端)和医疗视频装置等,并且可用于处理图像信号或数据。例如,OTT视频装置可包括游戏机、蓝光播放器、连接互联网的TV、家庭影院系统、智能电话、平板PC和数字录像机(DVR)等。
此外,应用本公开的处理方法可被以由计算机执行的程序的形式产生并且可被存储在计算机可读记录介质中。也可将具有根据本公开的数据结构的多媒体数据存储在计算机可读记录介质中。计算机可读记录介质包括在其中存储计算机可读数据的所有种类的存储装置和分布式存储装置。计算机可读记录介质可包括例如蓝光盘(BD)、通用串行总线(USB)、ROM、PROM、EPROM、EEPROM、RAM、CD-ROM、磁带、软盘和光学数据存储装置。计算机可读记录介质也包括以载波(例如,通过互联网的传输)的形式体现的介质。此外,通过编码方法生成的比特流可被存储在计算机可读记录介质中或者通过有线或无线通信网络来发送。
另外,可将本公开的实施方式体现为基于程序代码的计算机程序产品,并且可在根据本公开的实施方式的计算机上执行程序代码。可将程序代码存储在计算机可读载体上。
图12表示可应用本文的公开内容的内容流系统的示例。
参照图12,应用本公开的实施方式的内容流系统通常可包括编码服务器、流服务器、网络服务器、媒体存储装置、用户装置和多媒体输入装置。
编码服务器用来将从多媒体输入设备如智能电话、照相机、摄像机等输入的内容压缩为数字数据,以生成比特流,并且以将其发送到流服务器。作为另一示例,在诸如智能电话、相机、摄像机等的多媒体输入装置直接生成比特流的情况下,可省略编码服务器。
可通过应用本公开的实施方式的编码方法或比特流生成方法来生成比特流。并且流服务器可在发送或接收比特流的过程中暂时存储比特流。
流服务器基于用户的请求通过网络服务器向用户设备发送多媒体数据,该网络服务器充当向用户通知存在什么服务的工具。当用户请求用户想要的服务时,网络服务器将请求转移至流服务器,并且流服务器将多媒体数据发送到用户。在这方面,内容流系统可包括单独的控制服务器,并且在这种情况下,控制服务器用来控制内容流系统中的各个设备之间的命令/响应。
流服务器可从媒体存储装置和/或编码服务器接收内容。例如,在从编码服务器接收到内容的情况下,可实时地接收内容。在这种情况下,流服务器可将比特流存储预定时间段以流畅地提供流服务。
例如,用户设备可包括移动电话、智能电话、膝上型计算机、数字广播终端、个人数字助理(PDA)、便携式多媒体播放器(PMP)、导航、板式PC、平板PC、超极本、可穿戴装置(例如,手表型终端(智能手表)、眼镜型终端(智能眼镜)、头戴式显示器(HMD))、数字TV、台式计算机、数字标牌等。
可将内容流系统中的每个服务器作为分布式服务器操作,并且在这种情况下,可以分布式方式处理由每个服务器接收的数据。
Claims (15)
1.一种由解码设备执行的图像解码方法,所述方法包括:
接收包括用于当前块的预测信息的比特流;
基于与用于所述当前块的色度格式采样结构有关的色度格式索引并且基于与三个颜色分量是否被分别编译有关的单独颜色平面标志,推导用于所述当前块的色度阵列类型,其中,所述色度格式索引和所述单独颜色平面标志被包括在用于所述当前块的所述预测信息中;
基于推导的色度阵列类型,推导所述当前块的预测样本;以及
基于所述预测样本,推导所述当前块的重构样本,
其中,所述三个颜色分量包括亮度分量和色度分量,并且所述色度分量包括Cb分量和Cr分量。
2.根据权利要求1所述的图像解码方法,其中,基于所述色度格式索引的值为0或者所述单独颜色平面标志的值为1的确定,所述色度阵列类型的值被确定为0,以及
其中,基于所述色度格式索引的值不为0并且所述单独颜色平面标志的值为0的确定,所述色度阵列类型的值被确定为不为0。
3.根据权利要求1所述的图像解码方法,其中,推导所述当前块的所述预测样本包括:
检查所述色度阵列类型的值不是0并且用于推导所述当前块的树类型是否是单树或双树内的色度树;
基于所述色度阵列类型的值不为0并且用于推导所述当前块的所述树类型是所述单树或所述双树内的所述色度树的确定,推导用于所述当前块的帧内色度预测模式;以及
基于所述帧内色度预测模式,推导所述当前块的所述预测样本。
4.根据权利要求1所述的图像解码方法,进一步包括:
基于所述色度阵列类型的值不为0的确定,对双树帧内标志进行解码,所述双树帧内标志被包括在用于所述当前块的所述预测信息中,并且与所述三个颜色分量相对于所述当前块内的预定义区域是否被分别编译有关。
5.根据权利要求1所述的图像解码方法,进一步包括:
基于所述色度阵列类型的值不为0的确定,对跨分量线性模型(CCLM)标志进行解码,所述CCLM标志被包括在用于所述当前块的所述预测信息中,并且与基于所述亮度分量推导所述Cb分量或所述Cr分量的CLLM是否被启用有关。
6.根据权利要求1所述的图像解码方法,其中,所述比特流进一步包括自适应环路滤波器(ALF)信息;并且
其中,所述方法进一步包括:基于所述色度阵列类型的值不为0的确定,对ALF色度索引进行解码,所述ALF色度索引被包括在所述ALF信息中,并且与ALF是否被应用于所述Cb分量和所述Cr分量中的至少一个有关。
7.根据权利要求6所述的图像解码方法,其中:
基于所述ALF色度索引的值为0的确定,所述ALF不被应用于所述Cb分量和所述Cr分量;
基于所述ALF色度索引的值为1的确定,所述ALF被应用于所述Cb分量;
基于所述ALF色度索引的值为2的确定,所述ALF被应用于所述Cr分量;以及
基于所述ALF色度索引的值为3的确定,所述ALF被应用于所述Cb分量和所述Cr分量。
8.一种由编码设备执行的图像编码方法,所述方法包括:
生成与用于当前块的色度格式采样结构有关的色度格式索引;
生成与三个颜色分量是否被分别编译有关的单独颜色平面标志;
基于所述色度格式索引和所述单独颜色平面标志,推导用于所述当前块的色度阵列类型;
基于推导的色度阵列类型,推导所述当前块的预测样本;
基于所述预测样本,推导所述当前块的残差样本;以及
对包括关于所述残差样本的信息的残差信息进行编码,
其中,所述三个颜色分量包括亮度分量和色度分量,并且所述色度分量包括Cb分量和Cr分量。
9.根据权利要求8所述的图像编码方法,其中,基于所述色度格式索引的值为0或者所述单独颜色平面标志的值为1的确定,所述色度阵列类型的值被确定为0,以及
其中,基于所述色度格式索引的值不为0并且所述单独颜色平面标志的值为0的确定,所述色度阵列类型的值被确定为不为0。
10.根据权利要求8所述的图像编码方法,其中,推导所述当前块的所述预测样本包括:
检查所述色度阵列类型的值不是0并且用于推导所述当前块的树类型是否是单树或双树内的色度树;
基于所述色度阵列类型的值不为0并且用于推导所述当前块的所述树类型是所述单树或所述双树内的所述色度树的确定,推导用于所述当前块的帧内色度预测模式;以及
基于所述帧内色度预测模式,推导所述当前块的所述预测样本。
11.根据权利要求8所述的图像编码方法,进一步包括:
基于所述色度阵列类型的值不为0的确定,推导双树帧内标志,所述双树帧内标志与所述三个颜色分量相对于所述当前块内的预定义区域是否被分别编译有关。
12.根据权利要求8所述的图像编码方法,进一步包括:
基于所述色度阵列类型的值不为0的确定,生成跨分量线性模型(CCLM)标志,所述CCLM标志与基于所述亮度分量推导所述Cb分量或所述Cr分量的CLLM是否被启用有关。
13.根据权利要求8所述的图像编码方法,进一步包括:
基于所述色度阵列类型的值不为0的确定,生成ALF色度索引,所述ALF色度索引与ALF是否被应用于所述Cb分量和所述Cr分量中的至少一个有关。
14.根据权利要求13所述的图像编码方法,其中:
基于所述ALF色度索引的值为0的确定,所述ALF不被应用于所述Cb分量和所述Cr分量;
基于所述ALF色度索引的值为1的确定,所述ALF被应用于所述Cb分量;
基于所述ALF色度索引的值为2的确定,所述ALF被应用于所述Cr分量;以及
基于所述ALF色度索引的值为3的确定,所述ALF被应用于所述Cb分量和所述Cr分量。
15.一种计算机可读存储介质,包括:
使解码设备执行图像解码方法的编码信息,
其中,所述图像解码方法包括:
接收包括用于当前块的预测信息的比特流;
基于与用于所述当前块的色度格式采样结构有关的色度格式索引并且基于与三个颜色分量是否被分别编译有关的单独颜色平面标志,推导用于所述当前块的色度阵列类型,其中,所述色度格式索引和所述单独颜色平面标志被包括在用于所述当前块的所述预测信息中;
基于推导的色度阵列类型,推导所述当前块的预测样本;以及
基于所述预测样本,推导所述当前块的重构样本,
其中,所述三个颜色分量包括亮度分量和色度分量,并且所述色度分量包括Cb分量和Cr分量。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962819489P | 2019-03-15 | 2019-03-15 | |
US62/819,489 | 2019-03-15 | ||
PCT/KR2020/003463 WO2020189960A1 (ko) | 2019-03-15 | 2020-03-12 | 크로마 포맷에 대한 정보를 시그널링 하는 방법 및 장치 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113678456A true CN113678456A (zh) | 2021-11-19 |
Family
ID=72520433
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202080027970.4A Pending CN113678456A (zh) | 2019-03-15 | 2020-03-12 | 用信号通知关于色度格式的信息的方法和装置 |
Country Status (6)
Country | Link |
---|---|
US (3) | US11431985B2 (zh) |
EP (1) | EP3941065A4 (zh) |
KR (1) | KR20210118951A (zh) |
CN (1) | CN113678456A (zh) |
AU (2) | AU2020240943B2 (zh) |
WO (1) | WO2020189960A1 (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113711612B (zh) | 2019-04-20 | 2023-05-26 | 北京字节跳动网络技术有限公司 | 视频编解码中的色度语法元素的信令 |
CN111866510A (zh) * | 2019-04-30 | 2020-10-30 | 华为技术有限公司 | 视频序列的帧内预测方法及装置 |
DE112020002032B4 (de) | 2019-05-16 | 2024-01-04 | Lg Electronics Inc. | Bilddecodierverfahren und Bilddecodiervorrichtung |
CN115567707A (zh) | 2019-05-30 | 2023-01-03 | 抖音视界有限公司 | 色度分量的自适应环路滤波 |
WO2023132508A1 (ko) * | 2022-01-04 | 2023-07-13 | 현대자동차주식회사 | 크로마 성분을 위한 템플릿 기반 인트라 모드 유도를 위한 방법 |
WO2023219290A1 (ko) * | 2022-05-13 | 2023-11-16 | 현대자동차주식회사 | 크로마 성분별 인트라 예측모드의 부호화를 위한 방법 및 장치 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140105276A1 (en) * | 2011-06-23 | 2014-04-17 | JVC Kenwood Corporation | Picture coding device, picture coding method, picture coding program, picture decoding device, picture decoding method, and picture decoding program |
EP2858367A2 (en) * | 2012-04-26 | 2015-04-08 | Sony Corporation | Quantisation parameter selection for different colour sampling formats |
US20160105687A1 (en) * | 2013-07-14 | 2016-04-14 | Sharp Kabushiki Kaisha | Video parameter set signaling |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5649105B2 (ja) * | 2007-01-11 | 2015-01-07 | トムソン ライセンシングThomson Licensing | 符号化のための装置及び方法並びに復号化のための装置及び方法 |
US9451252B2 (en) * | 2012-01-14 | 2016-09-20 | Qualcomm Incorporated | Coding parameter sets and NAL unit headers for video coding |
US9743091B2 (en) * | 2012-12-17 | 2017-08-22 | Lg Electronics Inc. | Method for encoding/decoding image, and device using same |
GB2512826B (en) * | 2013-04-05 | 2017-05-10 | Canon Kk | Method and device for determining the value of a quantization parameter |
US10142642B2 (en) | 2014-06-04 | 2018-11-27 | Qualcomm Incorporated | Block adaptive color-space conversion coding |
US10419757B2 (en) * | 2016-08-31 | 2019-09-17 | Qualcomm Incorporated | Cross-component filter |
CN113316931B (zh) * | 2018-11-22 | 2024-04-12 | 北京字节跳动网络技术有限公司 | 视频处理中的脉冲编解码调制技术 |
-
2020
- 2020-03-12 AU AU2020240943A patent/AU2020240943B2/en active Active
- 2020-03-12 CN CN202080027970.4A patent/CN113678456A/zh active Pending
- 2020-03-12 WO PCT/KR2020/003463 patent/WO2020189960A1/ko unknown
- 2020-03-12 EP EP20773455.9A patent/EP3941065A4/en active Pending
- 2020-03-12 KR KR1020217029420A patent/KR20210118951A/ko not_active Application Discontinuation
-
2021
- 2021-09-14 US US17/475,104 patent/US11431985B2/en active Active
-
2022
- 2022-07-22 US US17/871,562 patent/US11792404B2/en active Active
-
2023
- 2023-07-26 AU AU2023208132A patent/AU2023208132A1/en active Pending
- 2023-09-11 US US18/244,764 patent/US12088816B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140105276A1 (en) * | 2011-06-23 | 2014-04-17 | JVC Kenwood Corporation | Picture coding device, picture coding method, picture coding program, picture decoding device, picture decoding method, and picture decoding program |
EP2858367A2 (en) * | 2012-04-26 | 2015-04-08 | Sony Corporation | Quantisation parameter selection for different colour sampling formats |
US20160105687A1 (en) * | 2013-07-14 | 2016-04-14 | Sharp Kabushiki Kaisha | Video parameter set signaling |
Non-Patent Citations (2)
Title |
---|
BENJAMIN,BROSS 等: "Versatile Video Coding (Draft 2)", 《JOINT VIDEO EXPERTS TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11 11TH MEETING: LJUBLJANA, SI》, 18 July 2018 (2018-07-18), pages 6 - 1 * |
LI,LING 等: "CE3-related: ISP support for 4:2:2 and 4:4:4", 《JOINT VIDEO EXPERTS TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11 14TH MEETING: GENEVA, CH》, 13 March 2019 (2019-03-13), pages 4 * |
Also Published As
Publication number | Publication date |
---|---|
EP3941065A1 (en) | 2022-01-19 |
US20220007028A1 (en) | 2022-01-06 |
US11431985B2 (en) | 2022-08-30 |
US12088816B2 (en) | 2024-09-10 |
AU2020240943B2 (en) | 2023-07-13 |
EP3941065A4 (en) | 2022-05-18 |
KR20210118951A (ko) | 2021-10-01 |
US11792404B2 (en) | 2023-10-17 |
AU2020240943A1 (en) | 2021-11-11 |
US20220368919A1 (en) | 2022-11-17 |
AU2023208132A1 (en) | 2023-08-17 |
US20230421771A1 (en) | 2023-12-28 |
WO2020189960A1 (ko) | 2020-09-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US12088816B2 (en) | Method and device for signaling information on chroma format | |
CN112956201B (zh) | 使用句法来执行编码的句法设计方法和设备 | |
US20220191471A1 (en) | Intra prediction method on basis of mpm list and apparatus therefor | |
CN113316938B (zh) | 使用去块滤波的图像编译方法和装置 | |
CN114762351A (zh) | 图像/视频编译方法和装置 | |
CN114788291A (zh) | 用于处理图像信息以进行图像/视频编译的方法和装置 | |
CN114930856A (zh) | 图像/视频编译方法和装置 | |
CN114982242A (zh) | 发信号通知图片分割信息的方法和设备 | |
CN114128267A (zh) | 图像编译系统中用于关于变换核集的信息的上下文编译 | |
US11843779B2 (en) | Method and apparatus for coding information about merge data | |
CN113767625B (zh) | 基于mpm列表的帧内预测方法及其设备 | |
CN114902664A (zh) | 图像/视频编码/解码方法和装置 | |
CN115004709A (zh) | 用于发信号通知切片相关信息的方法和装置 | |
CN114902681A (zh) | 图像/视频编码/解码系统中与切片相关的信令信息的方法和设备 | |
CN114982231A (zh) | 图像解码方法及用于其的装置 | |
CN115004708A (zh) | 用于发信号通知图像信息的方法和设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |