CN117241026A - 解码设备和编码设备、存储介质及发送图像的数据的设备 - Google Patents
解码设备和编码设备、存储介质及发送图像的数据的设备 Download PDFInfo
- Publication number
- CN117241026A CN117241026A CN202311444206.9A CN202311444206A CN117241026A CN 117241026 A CN117241026 A CN 117241026A CN 202311444206 A CN202311444206 A CN 202311444206A CN 117241026 A CN117241026 A CN 117241026A
- Authority
- CN
- China
- Prior art keywords
- lmcs
- information
- chroma
- samples
- residual
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 claims description 153
- 241000023320 Luma <angiosperm> Species 0.000 claims description 148
- 238000013507 mapping Methods 0.000 claims description 144
- 230000003044 adaptive effect Effects 0.000 claims description 14
- 230000001419 dependent effect Effects 0.000 claims description 11
- 230000011664 signaling Effects 0.000 abstract description 33
- 238000009795 derivation Methods 0.000 abstract description 20
- 238000000034 method Methods 0.000 description 162
- 230000008569 process Effects 0.000 description 93
- 239000000523 sample Substances 0.000 description 76
- 238000007493 shaping process Methods 0.000 description 38
- 230000002441 reversible effect Effects 0.000 description 36
- 230000006870 function Effects 0.000 description 23
- 238000001914 filtration Methods 0.000 description 21
- 230000009466 transformation Effects 0.000 description 14
- 238000012545 processing Methods 0.000 description 13
- 230000002123 temporal effect Effects 0.000 description 13
- 230000009977 dual effect Effects 0.000 description 12
- 238000005192 partition Methods 0.000 description 12
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 11
- 238000013139 quantization Methods 0.000 description 11
- 239000013074 reference sample Substances 0.000 description 10
- 230000006835 compression Effects 0.000 description 7
- 238000007906 compression Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 7
- 238000003491 array Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 5
- 238000013341 scale-up Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 239000012634 fragment Substances 0.000 description 3
- 238000000638 solvent extraction Methods 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 101150114515 CTBS gene Proteins 0.000 description 2
- 230000002146 bilateral effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 238000005315 distribution function Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000004895 liquid chromatography mass spectrometry Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000010454 slate Substances 0.000 description 1
- 239000004984 smart glass Substances 0.000 description 1
- 230000000153 supplemental effect Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/117—Filters, e.g. for pre-processing or post-processing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/186—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/132—Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/137—Motion inside a coding unit, e.g. average field, frame or block difference
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
- H04N19/159—Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/1887—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a variable length codeword
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/44—Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/80—Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
- H04N19/82—Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/96—Tree coding, e.g. quad-tree coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本公开涉及解码设备和编码设备、存储介质及发送图像的数据的设备。根据本文献的公开,可通过关于色度残差缩放因子的值的信息的明确信令来控制色度残差缩放因子的值的粒度。另外,可通过关于色度残差缩放因子的值的信息的隐含推导来高效地执行色度残差缩放。
Description
本申请是原案申请号为202080060682.9的发明专利申请(国际申请号:PCT/KR2020/008799,申请日:2020年7月6日,发明名称:基于亮度样本的映射和色度样本的缩放的视频或图像编码)的分案申请。
技术领域
本文献的技术涉及基于亮度样本的映射和色度样本的缩放的视频或图像编码。
背景技术
最近,在各种领域中对诸如4K或8K或更高的超高清(UHD)图像/视频的高分辨率、高质量图像/视频的需求已增加。随着图像/视频数据具有高分辨率和高质量,要发送的信息量或比特量相对于现有图像/视频数据增加,因此,使用诸如现有有线/无线宽带线路或现有存储介质的介质发送图像数据或者使用现有存储介质存储图像/视频数据增加了传输成本和存储成本。
另外,对诸如虚拟现实(VR)和人工现实(AR)内容或全息图的沉浸式媒体的兴趣和需求最近已增加,并且具有与现实图像不同的特性的图像/视频(例如,游戏图像)的广播已增加。
因此,需要非常高效的图像/视频压缩技术来有效地压缩、发送、存储和再现具有如上所述的各种特性的高分辨率、高质量图像/视频的信息。
此外,为了改进压缩效率并增加主观/客观视觉质量,执行亮度映射与色度缩放(LMCS)过程,并且讨论了通过LMCS过程来增加主观/客观图像质量的计划。
发明内容
技术方案
根据本文献的实施方式,提供了一种用于增加图像编码效率的方法和设备。
根据本文献的实施方式,提供了高效滤波应用方法和设备。
根据本文献的实施方式,提供了高效LMCS应用方法和设备。
根据本文献的实施方式,可约束LMCS码字(或其范围)。
根据本文献的实施方式,可使用在LMCS的色度缩放中直接用信号通知的单个色度残差缩放因子。
根据本文献的实施方式,可使用线性映射(线性LMCS)。
根据本文献的实施方式,可明确地用信号通知关于线性映射所需的枢轴点的信息。
根据本文献的实施方式,灵活数量的仓(bin)可用于亮度映射。
根据本文献的实施方式,用于反向亮度映射和/或色度残差缩放的索引推导过程可简化。
根据本文献的实施方式,即使当一个编码树单元(CTU)中的亮度块和色度块具有单独的块树结构(双树结构)时,也可应用LMCS过程。
根据本文献的实施方式,可明确地用信号通知或隐含地推导关于色度残差缩放因子的值的信息。
根据本文献的实施方式,提供了一种由解码设备执行的视频/图像解码方法。
根据本文献的实施方式,提供了一种用于执行视频/图像解码的解码设备。
根据本文献的实施方式,提供了一种由编码设备执行的视频/图像编码方法。
根据本文献的实施方式,提供了一种用于执行视频/图像编码的编码设备。
根据本文献的一个实施方式,提供了一种计算机可读数字存储介质,其中存储有根据本文献的至少一个实施方式中公开的视频/图像编码方法生成的编码的视频/图像信息。
根据本文献的实施方式,提供了一种计算机可读数字存储介质,其中存储有使得解码设备执行本文献的至少一个实施方式中公开的视频/图像解码方法的编码的信息或编码的视频/图像信息。
有益效果
根据本文献的实施方式,总图像/视频压缩效率可改进。
根据本文献的实施方式,可通过高效滤波改进主观/客观视觉质量。
根据本文献的实施方式,可高效地执行用于图像/视频编码的LMCS处理。
根据本文献的实施方式,可使LMCS处理所需的(软件或硬件的)资源/成本最小化。
根据本文献的实施方式,可方便LMCS处理的硬件实现。
根据本文献的实施方式,可通过约束LMCS码字(或其范围)来去除或最小化在映射(整形)中LMCS码字的推导所需的除法运算。
根据本文献的实施方式,可使用单个色度残差缩放因子来去除根据分段索引标识的延迟。
根据本文献的实施方式,可使用LMCS中的线性映射来执行色度残差缩放处理而无需依赖于亮度块(的重构),因此可去除缩放中的延迟。
根据本文献的实施方式,LMCS中的映射效率可增加。
根据本文献的实施方式,通过简化用于反向亮度映射和/或色度残差缩放的索引推导过程,LMCS的复杂度可降低,因此视频/图像编码效率可增加。
根据本文献的实施方式,甚至对具有双树结构的块也可执行LMCS过程,因此LMCS的效率可增加。此外,具有双树结构的块的编码性能(例如,客观/主观图像质量)可改进。
根据本文献的实施方式,可通过关于色度残差缩放因子的值的信息的明确信令来控制色度残差缩放因子的值的粒度。
根据本文献的实施方式,可通过关于色度残差缩放因子的值的信息的隐含推导来高效地执行色度残差缩放。
附图说明
图1示意性地示出可应用本文献的实施方式的视频/图像编码系统的示例。
图2是示意性地示出可应用本文献的实施方式的视频/图像编码设备的配置的示图。
图3是示意性地示出可应用本文献的实施方式的视频/图像解码设备的配置的示图。
图4示出示例性块树架构。
图5示例性地示出编码视频/图像的分层架构。
图6示例性地示出根据本文献的实施方式的CVS的分层架构。
图7示出根据本文献的实施方式的示例性LMCS架构。
图8示出根据本文献的另一实施方式的LMCS架构。
图9示出显示示例性前向映射的曲线图。
图10是示出根据本文献的实施方式的推导色度残差缩放索引的方法的流程图。
图11示出根据本文献的实施方式的枢轴点的线性拟合。
图12示出根据本文献的实施方式的线性整形器的示例。
图13示出本文献的实施方式中的线性前向映射的示例。
图14示出本文献的实施方式中的反向前向映射的示例。
图15是示出根据本文献的实施方式的LMCS过程的示图。
图16和图17示意性地示出根据本文献的实施方式的视频/图像编码方法和相关组件的示例。
图18和图19示意性地示出根据本文献的实施方式的图像/视频解码方法和相关组件的示例。
图20示出可应用本文献中所公开的实施方式的内容流系统的示例。
具体实施方式
本文献可按各种形式修改,将描述并且在附图中示出其特定实施方式。然而,这些实施方式并非旨在限制本文献。以下描述中使用的术语仅用于描述特定实施方式,而非旨在限制本文献。单数表达包括复数表达,只要清楚地不同阅读即可。诸如“包括”和“具有”的术语旨在指示存在以下描述中使用的特征、数量、步骤、操作、元件、组件或其组合,因此应该理解,不排除存在或添加一个或更多个不同的特征、数量、步骤、操作、元件、组件或其组合的可能性。
此外,在本文献中描述的附图中的各个配置为了方便描述不同特性功能而被独立地示出,并不意味着各个配置被实现为单独的硬件或单独的软件。例如,各个组件当中的两个或更多个组件可被组合以形成一个组件,或者一个组件可被划分成多个组件。各个组件被集成和/或分离的实施方式也被包括在本文献的公开范围内。
以下,将参照附图详细描述本实施方式的示例。另外,相似的标号用于贯穿附图指示相似的元件,并且将省略关于相似元件的相同描述。
图1示出可应用本文献的实施方式的视频/图像编码系统的示例。
参照图1,视频/图像编码系统可包括第一装置(源装置)和第二装置(接收装置)。源装置可通过数字存储介质或网络将编码的视频/图像信息或数据以文件或流的形式发送到接收装置。
源装置可包括视频源、编码设备和发送器。接收装置可包括接收器、解码设备和渲染器。编码设备可被称为视频/图像编码设备,解码设备可被称为视频/图像解码设备。发送器可被包括在编码设备中。接收器可被包括在解码设备中。渲染器可包括显示器,并且显示器可被配置为单独的装置或外部组件。
视频源可通过捕获、合成或生成视频/图像的处理来获取视频/图像。视频源可包括视频/图像捕获装置和/或视频/图像生成装置。例如,视频/图像捕获装置可包括一个或更多个相机、包括先前捕获的视频/图像的视频/图像档案等。例如,视频/图像生成装置可包括计算机、平板计算机和智能电话,并且可(以电子方式)生成视频/图像。例如,可通过计算机等生成虚拟视频/图像。在这种情况下,视频/图像捕获处理可由生成相关数据的处理代替。
编码设备可对输入视频/图像进行编码。为了压缩和编码效率,编码设备可执行诸如预测、变换和量化的一系列过程。编码的数据(编码的视频/图像信息)可按比特流的形式输出。
发送器可通过数字存储介质或网络将以比特流的形式输出的编码的图像/图像信息或数据以文件或流的形式发送到接收装置的接收器。数字存储介质可包括诸如USB、SD、CD、DVD、蓝光、HDD、SSD等的各种存储介质。发送器可包括用于通过预定文件格式生成媒体文件的元件,并且可包括用于通过广播/通信网络传输的元件。接收器可接收/提取比特流并将所接收的比特流发送到解码设备。
解码设备可通过执行与编码设备的操作对应的诸如解量化、逆变换和预测的一系列过程将视频/图像解码。
渲染器可渲染解码的视频/图像。渲染的视频/图像可通过显示器显示。
本文献涉及视频/图像编码。例如,本文献中公开的方法/实施方式可应用于通用视频编码(VVC)标准、基本视频编码(EVC)标准、AOMedia Video 1(AV1)标准、第2代音频视频编码标准(AVS2)或下一代视频/图像编码标准(例如,H.267、H.268等)中公开的方法。
本文献提出了视频/图像编码的各种实施方式,并且除非另外指明,否则上述实施方式也可彼此组合执行。
在本文献中,视频可指随时间的一系列图像。画面通常是指表示特定时间范围的一个图像的单元,切片/拼块是指就编码而言构成画面的一部分的单元。切片/拼块可包括一个或更多个编码树单元(CTU)。一个画面可由一个或更多个切片/拼块组成。一个画面可由一个或更多个拼块组组成。一个拼块组可包括一个或更多个拼块。图块可表示画面中的拼块内的CTU行的矩形区域。拼块可被分割成多个图块,各个图块可由拼块内的一个或更多个CTU行构成。未被分割成多个图块的拼块也可被称为图块。图块扫描可表示分割画面的CTU的特定顺序排序,其中,在图块内的CTU光栅扫描中CTU可排序,并且在拼块的图块的光栅扫描中拼块内的图块可连续地排序,并且在画面的拼块的光栅扫描中画面中的拼块可连续地排序。拼块是画面中的特定拼块列和特定拼块行内的CTU的矩形区域。拼块列是高度等于画面的高度并且宽度由画面参数集中的句法元素指定的CTU的矩形区域。拼块行是高度由画面参数集中的句法元素指定并且宽度等于画面的宽度的CTU的矩形区域。拼块扫描是分割画面的CTU的特定顺序排序,其中在拼块的CTU光栅扫描中CTU连续地排序,而在画面的拼块的光栅扫描中画面中的拼块连续地排序。切片包括可排他地包含在单个NAL单元中的画面的整数数量的图块。切片可由多个完整拼块或仅一个拼块的完整图块的连续序列组成。在本文献中,拼块组和切片可代替彼此使用。例如,在本文献中,拼块组/拼块组头可被称为切片/切片头。
此外,一个画面可被划分成两个或更多个子画面。子画面可以是画面内的一个或更多个切片的矩形区域。
像素或画素可意指构成一个画面(或图像)的最小单元。另外,“样本”可用作与像素对应的术语。样本通常可表示像素或像素值,并且可仅表示亮度分量的像素/像素值或仅表示色度分量的像素/像素值。
单元可表示图像处理的基本单位。单元可包括画面的特定区域和与该区域有关的信息中的至少一个。一个单元可包括一个亮度块和两个色度(例如,cb、cr)块。在一些情况下,单元可与诸如块或区域的术语互换使用。在一般情况下,M×N块可包括M列和N行的样本(或样本阵列)或变换系数的集合(或阵列)。另选地,样本可意指空间域中的像素值,并且当这种像素值被变换至频域时,其可意指频域中的变换系数。
在本文献中,“A或B”可意指“仅A”、“仅B”或“A和B二者”。换言之,本文献中的“A或B”可被解释为“A和/或B”。例如,在本文献中,“A、B或C(A,B或C)”意指“仅A”、“仅B”、“仅C”或“A、B和C的任何组合”。
本文献中使用的斜线(/)或顿号(、)可意指“和/或”。例如,“A/B”可意指“A和/或B”。因此,“A/B”可意指“仅A”、“仅B”或“A和B二者”。例如,“A、B、C”可意指“A、B或C”。
在本文献中,“A和B中的至少一个”可意指“仅A”、“仅B”或“A和B二者”。另外,在本文献中,表达“A或B中的至少一个”或“A和/或B中的至少一个”可与“A和B中的至少一个”相同地解释。
另外,在本文献中,“A、B和C中的至少一个”意指“仅A”、“仅B”、“仅C”或“A、B和C的任何组合”。另外,“A、B或C中的至少一个”或“A、B和/或C中的至少一个”可意指“A、B和C中的至少一个”。
另外,本文献中使用的括号可意指“例如”。具体地,当指示“预测(帧内预测)”时,可提议“帧内预测”作为“预测”的示例。换言之,本文献中的“预测”不限于“帧内预测”,可提议“帧内预测”作为“预测”的示例。另外,即使当指示“预测(即,帧内预测)”时,也可提议“帧内预测”作为“预测”的示例。
在本文献中在一张图中单独描述的技术特性可单独地实现或同时实现。
图2是示意性地示出可应用本文献的实施方式的视频/图像编码设备的配置的图。以下,所谓的视频编码设备可包括图像编码设备。
参照图2,编码设备200包括图像分割器210、预测器220、残差处理器230和熵编码器240、加法器250、滤波器260和存储器270。预测器220可包括帧间预测器221和帧内预测器222。残差处理器230可包括变换器232、量化器233、解量化器234和逆变换器235。残差处理器230还可包括减法器231。加法器250可被称为重构器或重构块生成器。根据实施方式,图像分割器210、预测器220、残差处理器230、熵编码器240、加法器250和滤波器260可由至少一个硬件组件(例如,编码器芯片组或处理器)配置。另外,存储器270可包括解码画面缓冲器(DPB),或者可由数字存储介质配置。硬件组件还可包括存储器270作为内部/外部组件。
图像分割器210可将输入到编码设备200的输入图像(或者画面或帧)分割成一个或更多个处理器。例如,处理器可被称为编码单元(CU)。在这种情况下,编码单元可根据四叉树二叉树三叉树(QTBTTT)结构从编码树单元(CTU)或最大编码单元(LCU)递归地分割。例如,一个编码单元可基于四叉树结构、二叉树结构和/或三元结构被分割成深度更深的多个编码单元。在这种情况下,例如,可首先应用四叉树结构,稍后可应用二叉树结构和/或三元结构。另选地,可首先应用二叉树结构。可基于不再分割的最终编码单元来执行根据本公开的编码过程。在这种情况下,根据图像特性基于编码效率,最大编码单元可用作最终编码单元,或者如果需要,编码单元可被递归地分割成深度更深的编码单元并且具有最优大小的编码单元可用作最终编码单元。这里,编码过程可包括预测、变换和重构的过程(将稍后描述)。作为另一示例,处理器还可包括预测单元(PU)或变换单元(TU)。在这种情况下,预测单元和变换单元可从上述最终编码单元拆分或分割。预测单元可以是样本预测的单元,变换单元可以是用于推导变换系数的单元和/或用于从变换系数推导残差信号的单元。
在一些情况下,单元可与诸如块或区域的术语互换使用。在一般情况下,M×N块可表示由M列和N行组成的样本或变换系数的集合。样本通常可表示像素或像素值,可仅表示亮度分量的像素/像素值或者仅表示色度分量的像素/像素值。样本可用作与像素或画素的一个画面(或图像)对应的术语。
在编码设备200中,从输入图像信号(原始块、原始样本阵列)减去从帧间预测器221或帧内预测器222输出的预测信号(预测块、预测样本阵列)以生成残差信号(残差块、残差样本阵列),并且所生成的残差信号被发送到变换器232。在这种情况下,如所示,在编码设备200中从输入图像信号(原始块、原始样本阵列)减去预测信号(预测块、预测样本阵列)的单元可被称为减法器231。预测器可对要处理的块(以下,称为当前块)执行预测并且生成包括当前块的预测样本的预测块。预测器可确定基于当前块或CU应用帧内预测还是帧间预测。如在各个预测模式的描述中稍后描述的,预测器可生成与预测有关的各种信息(例如,预测模式信息)并将所生成的信息发送到熵编码器240。关于预测的信息可在熵编码器240中编码并以比特流的形式输出。
帧内预测器222可参考当前画面中的样本来预测当前块。根据预测模式,所参考的样本可位于当前块附近或者可隔开。在帧内预测中,预测模式可包括多个非定向模式和多个定向模式。例如,非定向模式可包括DC模式和平面模式。例如,根据预测方向的详细程度,定向模式可包括33个定向预测模式或65个定向预测模式。然而,这仅是示例,可根据设置使用更多或更少的定向预测模式。帧内预测器222可使用应用于邻近块的预测模式来确定应用于当前块的预测模式。
帧间预测器221可基于参考画面上运动向量所指定的参考块(参考样本阵列)来推导当前块的预测块。这里,为了减少在帧间预测模式下发送的运动信息量,可基于邻近块与当前块之间的运动信息的相关性以块、子块或样本为单位预测运动信息。运动信息可包括运动向量和参考画面索引。运动信息还可包括帧间预测方向(L0预测、L1预测、Bi预测等)信息。在帧间预测的情况下,邻近块可包括存在于当前画面中的空间邻近块和存在于参考画面中的时间邻近块。包括参考块的参考画面和包括时间邻近块的参考画面可相同或不同。时间邻近块可被称为并置参考块、并置CU(colCU)等,并且包括时间邻近块的参考画面可被称为并置画面(colPic)。例如,帧间预测器221可基于邻近块来配置运动信息候选列表并且生成指示哪一候选用于推导当前块的运动向量和/或参考画面索引的信息。可基于各种预测模式执行帧间预测。例如,在跳过模式和合并模式的情况下,帧间预测器221可使用邻近块的运动信息作为当前块的运动信息。在跳过模式下,与合并模式不同,可不发送残差信号。在运动向量预测(MVP)模式的情况下,邻近块的运动向量可用作运动向量预测器,并且可通过用信号通知运动向量差来指示当前块的运动向量。
预测器220可基于下面描述的各种预测方法来生成预测信号。例如,预测器可不仅应用帧内预测或帧间预测以预测一个块,而且同时应用帧内预测和帧间预测二者。这可被称为组合帧间和帧内预测(CIIP)。另外,预测器可基于帧内块复制(IBC)预测模式或调色板模式来预测块。IBC预测模式或调色板模式可用于游戏等的内容图像/视频编码,例如屏幕内容编码(SCC)。IBC基本上在当前画面中执行预测,但是可与帧间预测相似地执行,使得在当前画面中推导参考块。即,IBC可使用本公开中描述的至少一个帧间预测技术。调色板模式可被视为帧内编码或帧内预测的示例。当应用调色板模式时,可基于关于调色板表和调色板索引的信息用信号通知画面内的样本值。
由预测器(包括帧间预测器221和/或帧内预测器222)生成的预测信号可用于生成重构信号或生成残差信号。变换器232可通过对残差信号应用变换技术来生成变换系数。例如,变换技术可包括离散余弦变换(DCT)、离散正弦变换(DST)、karhunen-loève变换(KLT)、基于图形的变换(GBT)或条件非线性变换(CNT)中的至少一个。这里,当像素之间的关系信息由图形表示时,GBT意指从图形获得的变换。CNT是指基于使用所有先前重构的像素生成的预测信号生成的变换。另外,变换处理可应用于具有相同大小的正方形像素块或者可应用于正方形以外的具有可变大小的块。
量化器233可将变换系数量化并将它们发送到熵编码器240,并且熵编码器240可对量化的信号(关于量化的变换系数的信息)进行编码并输出比特流。关于量化的变换系数的信息可被称为残差信息。量化器233可基于系数扫描顺序将块类型量化的变换系数重排为一维向量形式,并且基于一维向量形式的量化的变换系数来生成关于量化的变换系数的信息。可生成关于变换系数的信息。熵编码器240可执行例如指数Golomb、上下文自适应可变长度编码(CAVLC)、上下文自适应二进制算术编码(CABAC)等的各种编码方法。熵编码器240可对量化的变换系数以外的视频/图像重构所需的信息(例如,句法元素的值等)一起或单独地进行编码。编码的信息(例如,编码的视频/图像信息)可按比特流的形式以NAL(网络抽象层)为单位发送或存储。视频/图像信息还可包括关于各种参数集的信息,例如自适应参数集(APS)、画面参数集(PPS)、序列参数集(SPS)或视频参数集(VPS)。另外,视频/图像信息还可包括一般约束信息。在本公开中,从编码设备发送/用信号通知给解码设备的信息和/或句法元素可被包括在视频/画面信息中。视频/图像信息可通过上述编码过程编码并被包括在比特流中。比特流可经由网络发送或者可被存储在数字存储介质中。网络可包括广播网络和/或通信网络,并且数字存储介质可包括诸如USB、SD、CD、DVD、蓝光、HDD、SSD等的各种存储介质。发送从熵编码器240输出的信号的发送器(未示出)和/或存储该信号的存储单元(未示出)可被包括作为编码设备200的内部/外部元件,并且另选地,发送器可被包括在熵编码器240中。
从量化器233输出的量化的变换系数可用于生成预测信号。例如,可通过经由解量化器234和逆变换器235对量化的变换系数应用解量化和逆变换来重构残差信号(残差块或残差样本)。加法器250将重构的残差信号与从帧间预测器221或帧内预测器222输出的预测信号相加以生成重构信号(重构画面、重构块、重构样本阵列)。如果要处理的块不存在残差(例如,应用跳过模式的情况),则预测块可用作重构块。加法器250可被称为重构器或重构块生成器。如下所述,所生成的重构信号可用于当前画面中要处理的下一块的帧内预测并且可通过滤波用于下一画面的帧间预测。
此外,可在画面编码和/或重构期间应用与色度缩放的亮度映射(LMCS)。
滤波器260可通过对重构信号应用滤波来改进主观/客观图像质量。例如,滤波器260可通过对重构画面应用各种滤波方法来生成修改的重构画面并将修改的重构画面存储在存储器270(具体地,存储器270的DPB)中。例如,各种滤波方法可包括去块滤波、样本自适应偏移、自适应环路滤波器、双边滤波器等。滤波器260可生成与滤波有关的各种信息并且将所生成的信息发送到熵编码器240,如在各个滤波方法的描述中稍后描述的。与滤波有关的信息可由熵编码器240编码并以比特流的形式输出。
发送到存储器270的修改的重构画面可用作帧间预测器221中的参考画面。当通过编码设备应用帧间预测时,可避免编码设备200与解码设备300之间的预测失配并且编码效率可改进。
存储器270的DPB可存储用作帧间预测器221中的参考画面的修改的重构画面。存储器270可存储推导(或编码)当前画面中的运动信息的块的运动信息和/或画面中已经重构的块的运动信息。所存储的运动信息可被发送到帧间预测器221并用作空间邻近块的运动信息或时间邻近块的运动信息。存储器270可存储当前画面中的重构块的重构样本并且可将重构样本传送至帧内预测器222。
图3是示出可应用本公开的实施方式的视频/图像解码设备的配置的示意图。
参照图3,解码设备300可包括熵解码器310、残差处理器320、预测器330、加法器340、滤波器350、存储器360。预测器330可包括帧间预测器332和帧内预测器331。残差处理器320可包括解量化器321和逆变换器322。根据实施方式,熵解码器310、残差处理器320、预测器330、加法器340和滤波器350可由硬件组件(例如,解码器芯片组或处理器)配置。另外,存储器360可包括解码画面缓冲器(DPB)或者可由数字存储介质配置。硬件组件还可包括存储器360作为内部/外部组件。
当输入包括视频/图像信息的比特流时,解码设备300可重构与在图2的编码设备中处理视频/图像信息的处理对应的图像。例如,解码设备300可基于从比特流获得的块分割相关信息来推导单元/块。解码设备300可使用编码设备中应用的处理器来执行解码。因此,例如,解码的处理器可以是编码单元,并且编码单元可根据四叉树结构、二叉树结构和/或三叉树结构从编码树单元或最大编码单元分割。可从编码单元推导一个或更多个变换单元。通过解码设备300解码和输出的重构的图像信号可通过再现设备再现。
解码设备300可接收从图2的编码设备以比特流的形式输出的信号,并且所接收的信号可通过熵解码器310解码。例如,熵解码器310可解析比特流以推导图像重构(或画面重构)所需的信息(例如,视频/图像信息)。视频/图像信息还可包括关于各种参数集的信息,例如自适应参数集(APS)、画面参数集(PPS)、序列参数集(SPS)或视频参数集(VPS)。另外,视频/图像信息还可包括一般约束信息。解码设备还可基于关于参数集的信息和/或一般约束信息将画面解码。本公开中稍后描述的用信号通知/接收的信息和/或句法元素可通过解码过程解码并从比特流获得。例如,熵解码器310基于诸如指数Golomb编码、CAVLC或CABAC的编码方法对比特流中的信息进行解码,并且输出图像重构所需的句法元素和残差的变换系数的量化值。更具体地,CABAC熵解码方法可接收与比特流中的各个句法元素对应的信元(bin),使用解码目标句法元素信息、解码目标块的解码信息或在先前阶段中解码的符号/信元的信息来确定上下文模型,并且通过根据所确定的上下文模型预测信元出现的概率对信元执行算术解码,并且生成与各个句法元素的值对应的符号。在这种情况下,CABAC熵解码方法可在确定上下文模型之后通过将解码的符号/信元的信息用于下一符号/信元的上下文模型来更新上下文模型。熵解码器310所解码的信息当中与预测有关的信息可被提供给预测器(帧间预测器332和帧内预测器331),并且在熵解码器310中执行了熵解码的残差值(即,量化的变换系数和相关参数信息)可被输入到残差处理器320。残差处理器320可推导残差信号(残差块、残差样本、残差样本阵列)。另外,熵解码器310所解码的信息当中关于滤波的信息可被提供给滤波器350。此外,用于接收从编码设备输出的信号的接收器(未示出)还可被配置成解码设备300的内部/外部元件,或者接收器可以是熵解码器310的组件。此外,根据本公开的解码设备可被称为视频/图像/画面解码设备,并且解码设备可被分类为信息解码器(视频/图像/画面信息解码器)和样本解码器(视频/图像/画面样本解码器)。信息解码器可包括熵解码器310,并且样本解码器可包括解量化器321、逆变换器322、加法器340、滤波器350、存储器360、帧间预测器332和帧内预测器331中的至少一个。
解量化器321可将量化的变换系数解量化并输出变换系数。解量化器321可按二维块形式重排量化的变换系数。在这种情况下,可基于在编码设备中执行的系数扫描顺序来执行重排。解量化器321可使用量化参数(例如,量化步长信息)对量化的变换系数执行解量化并且获得变换系数。
逆变换器322对变换系数逆变换以获得残差信号(残差块、残差样本阵列)。
预测器可对当前块执行预测并生成包括当前块的预测样本的预测块。预测器可基于从熵解码器310输出的关于预测的信息来确定对当前块应用帧内预测还是帧间预测并且可确定特定帧内/帧间预测模式。
预测器330可基于下述各种预测方法来生成预测信号。例如,预测器不仅可应用帧内预测或帧间预测以预测一个块,而且可同时应用帧内预测和帧间预测。这可被称为组合帧间和帧内预测(CIIP)。另外,预测器可基于帧内块复制(IBC)预测模式或调色板模式来预测块。IBC预测模式或调色板模式可用于游戏等的内容图像/视频编码,例如屏幕内容编码(SCC)。IBC基本上执行当前画面中的预测,但是可与帧间预测相似地执行,使得在当前画面中推导参考块。即,IBC可使用本公开中描述的至少一种帧间预测技术。调色板模式可被视为帧内编码或帧内预测的示例。当应用调色板模式时,可基于关于调色板表和调色板索引的信息用信号通知画面内的样本值。
帧内预测器331可参考当前画面中的样本来预测当前块。根据预测模式,所参考的样本可位于当前块附近或者可隔开。在帧内预测中,预测模式可包括多个非定向模式和多个定向模式。帧内预测器331可使用应用于邻近块的预测模式来确定应用于当前块的预测模式。
帧间预测器332可基于参考画面上运动向量所指定的参考块(参考样本阵列)来推导当前块的预测块。在这种情况下,为了减少在帧间预测模式下发送的运动信息量,可基于邻近块与当前块之间的运动信息的相关性以块、子块或样本为单位预测运动信息。运动信息可包括运动向量和参考画面索引。运动信息还可包括帧间预测方向(L0预测、L1预测、Bi预测等)信息。在帧间预测的情况下,邻近块可包括存在于当前画面中的空间邻近块和存在于参考画面中的时间邻近块。例如,帧间预测器332可基于邻近块来配置运动信息候选列表并且基于所接收的候选选择信息来推导当前块的运动向量和/或参考画面索引。可基于各种预测模式来执行帧间预测,并且关于预测的信息可包括指示当前块的帧间预测模式的信息。
加法器340可通过将所获得的残差信号与从预测器(包括帧间预测器332和/或帧内预测器331)输出的预测信号(预测块、预测样本阵列)相加来生成重构信号(重构画面、重构块、重构样本阵列)。如果要处理的块不存在残差,例如当应用跳过模式时,预测块可用作重构块。
加法器340可被称为重构器或重构块生成器。所生成的重构信号可用于当前画面中要处理的下一块的帧内预测,可如下所述通过滤波输出,或者可用于下一画面的帧间预测。
此外,可在画面解码处理中应用与色度缩放的亮度映射(LMCS)。
滤波器350可通过对重构信号应用滤波来改进主观/客观图像质量。例如,滤波器350可通过对重构画面应用各种滤波方法来生成修改的重构画面并且将修改的重构画面存储在存储器360(具体地,存储器360的DPB)中。例如,各种滤波方法可包括去块滤波、样本自适应偏移、自适应环路滤波器、双边滤波器等。
存储在存储器360的DPB中的(修改的)重构画面可用作帧间预测器332中的参考画面。存储器360可存储推导(或解码)当前画面中的运动信息的块的运动信息和/或画面中已经重构的块的运动信息。所存储的运动信息可被发送到帧间预测器332以用作空间邻近块的运动信息或时间邻近块的运动信息。存储器360可存储当前画面中的重构块的重构样本并将重构样本传送至帧内预测器331。
在本文献中,在编码设备200的滤波器260、帧间预测器221和帧内预测器222中描述的实施方式可与解码设备300的滤波器350、帧间预测器332和帧内预测器331相同或分别与之对应应用。这也可适用于帧间预测器332和帧内预测器331。
如上所述,在视频编码中,执行预测以增加压缩效率。由此,可生成包括当前块(要编码的块)的预测样本的预测块。这里,预测块包括空间域(或像素域)中的预测样本。预测块从编码装置和解码装置相同地推导,并且编码装置对关于原始块与预测块之间的残差的信息(残差信息)而非原始块的原始样本值本身进行解码。通过用信号通知装置,图像编码效率可增加。解码设备可基于残差信息来推导包括残差样本的残差块,并且通过对残差块和预测块求和来生成包括重构样本的重构块,并且生成包括重构块的重构画面。
残差信息可通过变换处理和量化处理来生成。例如,编码设备可推导原始块与预测块之间的残差块,并且对包括在残差块中的残差样本(残差样本阵列)执行变换处理以推导变换系数,然后,通过对变换系数执行量化处理,推导量化的变换系数,以将残差相关信息(经由比特流)用信号通知给解码设备。这里,残差信息可包括位置信息、变换技术、变换核和量化参数、量化的变换系数的值信息等。解码设备可基于残差信息来执行解量化/逆变换处理并推导残差样本(或残差块)。解码设备可基于预测块和残差块来生成重构画面。编码设备还可对供稍后画面的帧间预测参考的量化的变换系数进行解量化/逆变换以推导残差块,并且基于其来生成重构画面。
在本文献中,量化/解量化和/或变换/逆变换中的至少一个可被省略。当量化/解量化被省略时,量化的变换系数可被称为变换系数。当变换/逆变换被省略时,变换系数可被称为系数或残差系数,或者为了表达的一致性,仍可称为变换系数。
在本文献中,量化的变换系数和变换系数可分别被称为变换系数和缩放的变换系数。在这种情况下,残差信息可包括关于变换系数的信息,并且关于变换系数的信息可通过残差编码句法用信号通知。变换系数可基于残差信息(或关于变换系数的信息)来推导,缩放的变换系数可通过对变换系数的逆变换(缩放)来推导。残差样本可基于缩放的变换系数的逆变换(变换)来推导。这也可在本文献的其它部分中应用/表达。
帧内预测可指基于当前块所属的画面(以下,称为当前画面)中的参考样本来生成当前块的预测样本的预测。当对当前块应用帧内预测时,可推导要用于当前块的帧内预测的邻近参考样本。当前块的邻近参考样本可包括与大小为nW×nH的当前块的左边界相邻的样本和邻近左下的总共2×nH个样本、与当前块的上边界相邻的样本和邻近右上的总共2×nW个样本以及邻近当前块的左上的一个样本。另选地,当前块的邻近参考样本可包括多个上邻近样本和多个左邻近样本。另外,当前块的邻近参考样本可包括与大小为nW×nH的当前块的右边界相邻的总共nH个样本、与当前块的下边界相邻的总共nW个样本以及邻近当前块的右下的一个样本。
然而,当前块的一些邻近参考样本可能还未解码或可用。在这种情况下,解码器可通过利用可用样本替换不可用的样本来配置要用于预测的邻近参考样本。另选地,要用于预测的邻近参考样本可通过可用样本的插值来配置。
当推导邻近参考样本时,(i)可基于当前块的邻近参考样本的平均或插值来推导预测样本,并且(ii)可基于当前块的外围参考样本当中存在于预测样本的特定(预测)方向上的参考样本来推导预测样本。(i)的情况可被称为非定向模式或非角模式,(ii)的情况可被称为定向模式或角模式。
此外,预测样本也可通过邻近参考样本当中基于当前块的预测样本位于与当前块的帧内预测模式的预测方向相反的方向上的第二邻近样本与第一邻近样本之间的插值来生成。上述情况可被称为线性插值帧内预测(LIP)。另外,可使用线性模型基于亮度样本来生成色度预测样本。这种情况可被称为LM模式。
另外,可基于滤波的邻近参考样本来推导当前块的暂时预测样本,并且现有邻近参考样本当中根据帧内预测模式推导的至少一个参考样本(即,未滤波的邻近参考样本)和暂时预测样本可加权求和以推导当前块的预测样本。上述情况可被称为位置相关帧内预测(PDPC)。
另外,可选择当前块的邻近多参考样本行中预测准确性最高的参考样本行,以使用对应行上位于预测方向上的参考样本来推导预测样本,然后本文所使用的参考样本行可被指示(用信号通知)给解码设备,从而执行帧内预测编码。上述情况可被称为多参考行(MRL)帧内预测或基于MRL的帧内预测。
另外,可基于相同的帧内预测模式通过将当前块划分为垂直或水平子分区来执行帧内预测,并且邻近参考样本可以子分区为单位推导并使用。即,在这种情况下,当前块的帧内预测模式同样适用于子分区,并且在一些情况下通过以子分区为单位推导并使用邻近参考样本,帧内预测性能可改进。这种预测方法可被称为子分区内(ISP)或基于ISP的帧内预测。
上述帧内预测方法可与帧内预测模式分开称为帧内预测类型。帧内预测类型可用诸如帧内预测技术或附加帧内预测模式的各种术语来称呼。例如,帧内预测类型(或附加帧内预测模式)可包括上述LIP、PDPC、MRL和ISP中的至少一个。除了诸如LIP、PDPC、MRL或ISP的特定帧内预测类型之外的一般帧内预测方法可被称为正常帧内预测类型。正常帧内预测类型通常可在不应用特定帧内预测类型时应用,并且可基于上述帧内预测模式来执行预测。此外,可根据需要对推导的预测样本执行后滤波。
具体地,帧内预测过程可包括帧内预测模式/类型确定步骤、邻近参考样本推导步骤和基于帧内预测模式/类型的预测样本推导步骤。另外,可根据需要对推导的预测样本执行后滤波步骤。
当应用帧内预测时,应用于当前块的帧内预测模式可使用邻近块的帧内预测模式来确定。例如,解码设备可基于所接收的最可能模式(mpm)索引来选择基于当前块的邻近块(例如,左和/或上邻近块)的帧内预测模式推导的mpm列表的mpm候选之一,并且基于剩余帧内预测模式信息来选择未包括在mpm候选(和平面模式)中的其它剩余帧内预测模式之一。mpm列表可被配置为包括或不包括平面模式作为候选。例如,如果mpm列表包括平面模式作为候选,则mpm列表可具有六个候选。如果mpm列表不包括平面模式作为候选,则mpm列表可具有三个候选。当mpm列表不包括平面模式作为候选时,可用信号通知指示当前块的帧内预测模式是否不是平面模式的非平面标志(例如,intra_luma_not_planar_flag)。例如,可首先用信号通知mpm标志,当mpm标志的值为1时,可用信号通知mpm索引和非平面标志。另外,当非平面标志的值为1时,可用信号通知mpm索引。这里,mpm列表被配置为不包括平面模式作为候选,不首先用信号通知非平面标志以首先检查它是否为平面模式,因为平面模式始终被视为mpm。
例如,应用于当前块的帧内预测模式是在mpm候选(和平面模式)中还是在剩余模式中可基于mpm标志(例如,Intra_luma_mpm_flag)来指示。mpm标志的值1可指示当前块的帧内预测模式在mpm候选(和平面模式)内,mpm标志的值0可指示当前块的帧内预测模式不在mpm候选(和平面模式)中。非平面标志(例如,Intra_luma_not_planar_flag)的值0可指示当前块的帧内预测模式是平面模式,非平面标志值的值1可指示当前块的帧内预测模式不是平面模式。mpm索引可按照mpm_idx或intra_luma_mpm_idx句法元素的形式用信号通知,剩余帧内预测模式信息可按照rem_intra_luma_pred_mode或intra_luma_mpm_remainder句法元素的形式用信号通知。例如,剩余帧内预测模式信息可按照预测模式编号的顺序对所有帧内预测模式当中未包括在mpm候选(和平面模式)中的剩余帧内预测模式进行索引以指示它们中的一个。帧内预测模式可以是亮度分量(样本)的帧内预测模式。以下,帧内预测模式信息可包括mpm标志(例如,Intra_luma_mpm_flag)、非平面标志(例如,Intra_luma_not_planar_flag)、mpm索引(例如,mpm_idx或intra_luma_mpm_idx)和剩余帧内预测模式信息(rem_intra_luma_pred_mode或intra_luma_mpm_remainder)中的至少一个。在本文献中,MPM列表可被称为诸如MPM候选列表和candModeList的各种术语。当对当前块应用MIP时,可用信号通知用于MIP的单独mpm标志(例如,intra_mip_mpm_flag)、mpm索引(例如,intra_mip_mpm_idx)和剩余帧内预测模式信息(例如,intra_mip_mpm_remainder),并且不用信号通知非平面标志。
换言之,通常,当对图像执行块拆分时,要编码的当前块和邻近块具有相似的图像特性。因此,当前块和邻近块具有相同或相似的帧内预测模式的概率较高。因此,编码器可使用邻近块的帧内预测模式来对当前块的帧内预测模式进行编码。
例如,编码器/解码器可为当前块配置最可能模式(MPM)的列表。MPM列表也可被称为MPM候选列表。本文中,MPM可指在帧内预测模式编码中考虑当前块和邻近块之间的相似性来改进编码效率的模式。如上所述,MPM列表可被配置为包括平面模式,或者可被配置为不包括平面模式。例如,当MPM列表包括平面模式时,MPM列表中的候选数量可为6。并且,如果MPM列表不包括平面模式,则MPM列表中的候选数量可为5。
编码器/解码器可配置包括5或6个MPM的MPM列表。
为了配置MPM列表,可考虑三种类型的模式:默认帧内模式、邻居帧内模式和推导帧内模式。
对于邻近帧内模式,可考虑两个邻近块,即,左邻近块和上邻近块。
如上所述,如果MPM列表被配置为不包括平面模式,则从列表排除平面模式,并且MPM列表候选的数量可被设定为5。
另外,帧内预测模式当中的非定向模式(或非角模式)可包括基于当前块的邻近参考样本的平均的DC模式或基于插值的平面模式。
当应用帧间预测时,编码设备/解码设备的预测器可通过以块为单位执行帧间预测来推导预测样本。帧间预测可以是以取决于当前画面以外的画面的数据元素(例如,样本值或运动信息)的方式推导的预测。当对当前块应用帧间预测时,可基于参考画面索引所指示的参考画面上运动向量所指定的参考块(参考样本阵列)来推导当前块的预测块(预测样本阵列)。这里,为了减少在帧间预测模式下发送的运动信息量,可基于邻近块与当前块之间的运动信息的相关性以块、子块或样本为单位预测当前块的运动信息。运动信息可包括运动向量和参考画面索引。运动信息还可包括帧间预测类型(L0预测、L1预测、Bi预测等)信息。在帧间预测的情况下,邻近块可包括存在于当前画面中的空间邻近块和存在于参考画面中的时间邻近块。包括参考块的参考画面和包括时间邻近块的参考画面可相同或不同。时间邻近块可被称为并置参考块、并置CU(colCU)等,并且包括时间邻近块的参考画面可被称为并置画面(colPic)。例如,可基于当前块的邻近块来配置运动信息候选列表,并且可用信号通知指示选择(使用)哪一候选的标志或索引信息以推导当前块的运动向量和/或参考画面索引。可基于各种预测模式来执行帧间预测。例如,在跳过模式和合并模式的情况下,当前块的运动信息可与邻近块的运动信息相同。在跳过模式下,与合并模式不同,可不发送残差信号。在运动向量预测(MVP)模式的情况下,所选邻近块的运动向量可用作运动向量预测器,并且可用信号通知当前块的运动向量。在这种情况下,可使用运动向量预测器与运动向量差之和来推导当前块的运动向量。
根据帧间预测类型(L0预测、L1预测、Bi预测等),运动信息可包括L0运动信息和/或L1运动信息。L0方向上的运动向量可被称为L0运动向量或MVL0,L1方向上的运动向量可被称为L1运动向量或MVL1。基于L0运动向量的预测可被称为L0预测,基于L1运动向量的预测可被称为L1预测,基于L0运动向量和L1运动向量二者的预测可被称为双预测。这里,L0运动向量可指示与参考画面列表L0(L0)关联的运动向量,L1运动向量可指示与参考画面列表L1(L1)关联的运动向量。参考画面列表L0可包括按输出顺序比当前画面早的画面作为参考画面,参考画面列表L1可包括按输出顺序比当前画面晚的画面。先前画面可被称为前向(参考)画面,后续画面可被称为后向(参考)画面。参考画面列表L0还可包括按输出顺序比当前画面晚的画面作为参考画面。在这种情况下,先前画面可在参考画面列表L0中首先进行索引,后续画面可稍后进行索引。参考画面列表L1还可包括按输出顺序比当前画面早的先前画面作为参考画面。在这种情况下,后续画面可在参考画面列表1中首先进行索引,先前画面可稍后进行索引。输出顺序可对应于画面顺序计数(POC)顺序。
图4示出示例性块树结构。图4例示性地示出CTU基于四叉树和嵌套多类型树结构被划分成多个CU。
粗体块边缘表示四叉树分割,其余边缘表示多类型树分割。利用嵌套多类型树的四叉树分割可提供内容自适应编码树结构。CU可对应于编码块(CB)。另选地,CU可包括亮度样本的编码块和对应色度样本的两个编码块。CU的大小可与CTU一样大,或者可如亮度样本单元的4×4一样小。例如,在4:2:0颜色格式(或色度格式)的情况下,最大色度CB大小可为64×64,并且最小色度CB大小可为2×2。
在本文献中,例如,最大允许亮度TB大小可为64×64,最大允许色度TB大小可为32×32。当根据树结构划分的CB的宽度或高度大于最大变换宽度或最大变换高度时,可自动地(或隐含地)划分对应CB,直至满足水平方向和垂直方向上的TB大小极限。
在本文献中,编码树方案可支持亮度(分量)块和色度(分量)块具有单独的块树结构。具有单独块树结构的块可以是已被编码为单独的树的块。一个CTU中的亮度块和色度块具有相同的块树结构的情况可被表示为SINGLE_TREE(单树结构)。一个CTU中的亮度块和色度块具有单独的块树结构的情况可被表示为DUAL_TREE(双树结构)。在这种情况下,亮度分量的块树类型可被称为DUAL_TREE_LUMA,色度分量的块树类型可被称为DUAL_TREE_CHROMA。具有双树结构的块可以是已被编码为双树的块。对于P和B切片/拼块组,一个CTU中的亮度CTB和色度CTB可被限制为具有相同的编码树结构。然而,对于I切片/拼块组,亮度块和色度块可分别具有单独的块树结构。当应用单独的块树模式时,可基于特定编码树结构将亮度CTB划分为CU,可基于另一编码树结构将色度CTB划分为色度CU。这可意味着I切片/拼块组中的CU由亮度分量的编码块或两个色度分量的编码块构成,并且P或B切片/拼块组的CU由三个颜色分量的块构成。在本文献中,切片可被称为拼块/拼块组,拼块/拼块组可被称为切片。
尽管已描述了伴随多类型树的四叉树编码树结构,但是划分CU的结构不限于此。例如,BT结构和TT结构可被解释为包括在多分区树(MPT)结构中的概念,CU可被解释为通过QT结构和MPT结构来划分。在通过QT结构和MPT结构划分CU的示例中,可通过用信号通知包括关于QT结构的叶节点被划分成多少块的信息的句法元素(例如,MPT_split_type)以及包括关于QT结构的叶节点是在垂直方向还是水平方向上划分的信息的句法元素(例如,MPT_split_mode)来确定分割结构。
此外,在另一示例中,CU可利用QT结构、BT结构或TT结构以外的任何其它方法来划分。即,与根据QT结构将较低深度处的CU划分成较高深度处的1/4大小的CU,或者根据BT结构将较低深度处的CU划分成较高深度处的1/2大小的CU,或者根据TT结构将较低深度处的CU划分成较高深度处的1/4或1/2大小的CU不同,可根据情况将较低深度处的CU划分成较高深度处的1/5、1/3、3/8、3/5、2/3或5/8大小的CU,并且CU分割方法不限于此。
图5示例性地示出编码的图像/视频的分层结构。
参照图5,编码的图像/视频被划分成处理图像/视频及自身的解码处理的视频编码层(VCL)、发送和存储编码的信息的子系统以及负责功能并存在于VCL和子系统之间的NAL(网络抽象层)。
在VCL中,生成包括压缩图像数据(切片数据)的VCL数据,或者可生成包括画面参数集(PSP)、序列参数集(SPS)和视频参数集(VPS)的参数集或者图像解码处理另外需要的补充增强信息(SEI)消息。
在NAL中,可通过将头信息(NAL单元头)添加到VCL中生成的原始字节序列有效载荷(RBSP)来生成NAL单元。在这种情况下,RBSP是指VCL中生成的切片数据、参数集、SEI消息等。NAL单元头可包括根据包括在对应NAL单元中的RBSP数据指定的NAL单元类型信息。
如图中所示,NAL单元可根据VCL中生成的RBSP被分类为VCL NAL单元和非VCL NAL单元。VCL NAL单元可意指包括关于图像(切片数据)的信息的NAL单元,非VCL NAL单元可意指包括对图像进行解码所需的信息(参数集或SEI消息)的NAL单元。
可通过根据子系统的数据标准附加头信息来通过网络发送上述VCL NAL单元和非VCL NAL单元。例如,NAL单元可被变换为诸如H.266/VVC文件格式、实时传输协议(RTP)、传输流(TS)等的预定标准的数据格式并通过各种网络发送。
如上所述,NAL单元可根据包括在对应NAL单元中的RBSP数据结构以NAL单元类型来指定,并且关于NAL单元类型的信息可被存储在NAL单元头中并用信号通知。
例如,NAL单元可根据NAL单元是否包括关于图像的信息(切片数据)而被分类为VCL NAL单元类型和非VCL NAL单元类型。VCL NAL单元类型可根据包括在VCL NAL单元中的画面的本质和类型来分类,并且非VCL NAL单元类型可根据参数集的类型来分类。
以下是根据包括在非VCL NAL单元类型中的参数集的类型指定的NAL单元类型的示例。
-APS(自适应参数集)NAL单元:包括APS的NAL单元的类型
-DPS(解码参数集)NAL单元:包括DPS的NAL单元的类型
-VPS(视频参数集)NAL单元:包括VPS的NAL单元的类型
-SPS(序列参数集)NAL单元:包括SPS的NAL单元的类型
-PPS(画面参数集)NAL单元:包括PPS的NAL单元的类型
-PH(画面头)NAL单元:包括PH的NAL单元的类型
上述NAL单元类型可具有NAL单元类型的句法信息,并且该句法信息可被存储在NAL单元头中并用信号通知。例如,句法信息可以是nal_unit_type,NAL单元类型可由nal_unit_type值指定。
此外,如上所述,一个画面可包括多个切片,一个切片可包括切片头和切片数据。在这种情况下,一个画面头可被进一步添加到一个画面中的多个切片(切片头和切片数据集)。画面头(画面头句法)可包括通常适用于画面的信息/参数。在本文献中,切片可与拼块组混合或由拼块组替换。另外,在本文献中,切片头可与拼块组头混合或由拼块组头替换。
切片头(切片头句法)可包括通常可应用于切片的信息/参数。APS(APS句法)或PPS(PPS句法)可包括通常可应用于一个或更多个切片或画面的信息/参数。SPS(SPS句法)可包括通常可应用于一个或更多个序列的信息/参数。VPS(VPS句法)可包括通常可应用于多个层的信息/参数。DPS(DPS句法)可包括通常可应用于总视频的信息/参数。DPS可包括与编码视频序列(CVS)的级联有关的信息/参数。本文献中的高级句法(HLS)可包括APS句法、PPS句法、SPS句法、VPS句法、DPS句法和切片头句法中的至少一个。
在本文献中,从编码设备编码并以比特流的形式用信号通知给解码设备的图像/图像信息不仅包括画面中的分割相关信息、帧内/帧间预测信息、残差信息、回路滤波信息等,而且包括切片头中所包括的信息、APS中所包括的信息、PPS中所包括的信息、SPS中所包括的信息和/或VPS中所包括的信息。
此外,为了补偿由于诸如量化的压缩编码处理中出现的错误而引起的原始图像与重构图像之间的差异,可如上所述对重构样本或重构画面执行回路滤波处理。如上所述,回路滤波可由编码设备的滤波器和解码设备的滤波器执行,并且可应用去块滤波器、SAO和/或自适应环路滤波器(ALF)。例如,可在去块滤波处理和/或SAO处理完成之后执行ALF处理。然而,即使在这种情况下,也可省略去块滤波处理和/或SAO处理。
此外,为了增加编码效率,可如上所述应用亮度映射与色度缩放(LMCS)。LMCS可被称为环路整形器(整形)。为了增加编码效率,LMCS控制和/或LMCS相关信息的信令可分层执行。
图6示例性地示出根据本文献的实施方式的CVS的分层结构。编码视频序列(CVS)可包括SPS、PPS、拼块组头、拼块数据和/或CTU。这里,拼块组头和拼块数据可分别被称为切片头和切片数据。
SPS可包括本地标志以使得工具能够在CVS中使用。另外,SPS可由包括关于对于各个画面改变的参数的信息的PPS参考。各个编码画面可包括一个或更多个编码矩形域拼块。拼块可被分组为形成拼块组的光栅扫描。各个拼块组以称为拼块组头的头信息封装。各个拼块由包括编码数据的CTU组成。这里,数据可包括原始样本值、预测样本值及其亮度分量和色度分量(亮度预测样本值和色度预测样本值)。
根据现有方法,ALF数据(ALF参数)或LMCS数据(LMCS参数)被并入拼块组头中。由于一个视频由多个画面构成并且一个画面包括多个拼块,所以以拼块组为单位频繁地用信号通知ALF数据(ALF参数)或LMCS数据(LMCS参数)导致了编码效率降低的问题。
根据本文献中提出的实施方式,ALF参数或LMCS数据(LMCS参数)可被并入APS中并用信号通知。
在实施方式中,定义APS,并且APS可承载必要ALF数据(ALF参数)。另外,APS可具有自识别参数和ALF数据。APS的自识别参数可包括APS ID。即,APS可包括示出ALF数据字段以外的APS ID的信息。拼块组头或切片头可使用APS索引信息来参考APS。换言之,拼块组头或切片头可包括APS索引信息,并且可基于包括在具有APS索引信息所指示的APS ID的APS中的ALF数据(ALF参数)来执行目标块的ALF过程。在这种情况下,APS索引信息可被称为APSID信息。
此外,SPS可包括允许使用ALF的标志。例如,当CVS开始时,可检查SPS,并且可检查SPS中的标志。例如,SPS可包括下表1的句法。表1中的句法可以是SPS的一部分。
[表1]
例如,包括在表1的句法中的句法元素的语义可如下表所示表示。
[表2]
即,sps_alf_enabled_flag句法元素可基于其值是0还是1来指示ALF是否被启用。sps_alf_enabled_flag句法元素可被称为ALF启用标志(这可被称为第一ALF启用标志),并且可被包括在SPS中。即,可在SPS(或SPS级别)中用信号通知ALF启用标志。当SPS中用信号通知的ALF启用标志的值为1时,ALF可被确定为对于CVS中参考SPS的画面基本上启用。此外,如上所述,ALF可通过在比SPS更低的级别用信号通知附加启用标志来单独地开启/关闭。
例如,如果对于CVS启用ALF工具,则可在拼块组头或切片头中用信号通知附加启用标志(这可被称为第二ALF启用标志)。例如,当在SPS级别启用ALF时,可解析/用信号通知第二ALF启用标志。当第二ALF启用标志的值为1时,可通过拼块组头或切片头来解析ALF数据。例如,第二ALF启用标志可指定亮度分量和色度分量的ALF启用条件。可通过APS ID信息来访问ALF数据。
[表3]
[表4]
例如,包括在以上表3或表4的句法中的句法元素的语义可如下表所示表示。
[表5]
[表6]
第二ALF启用标志可包括tile_group_alf_enabled_flag句法元素或slice_alf_enabled_flag句法元素。
对应拼块组或对应切片参考的APS可基于APS ID信息(例如,tile_group_aps_id句法元素或slice_aps_id句法元素)来标识。APS可包括ALF数据。
此外,例如,包括ALF数据的APS的结构可基于以下句法和语义来描述。表7的句法可以是APS的一部分。
[表7]
[表8]
如上所述,adaptation_parameter_set_id句法元素可指示对应APS的标识符。即,APS可基于adaptation_parameter_set_id句法元素来标识。adaptation_parameter_set_id句法元素可被称为APS ID信息。另外,APS可包括ALF数据字段。ALF数据字段可在adaptation_parameter_set_id句法元素之后解析/用信号通知。
另外,例如,APS扩展标志(例如,aps_extension_flag句法元素)可在APS中解析/用信号通知。APS扩展标志可指示是否存在APS扩展数据标志(aps_extension_data_flag)句法元素。例如,APS扩展标志可用于为VVC标准的稍后版本提供扩展点。
图7示出根据本文献的实施方式的示例性LMCS结构。图7的LMCS结构700包括基于自适应分段线性(自适应PWL)模型的亮度分量的回路映射部710和色度分量的亮度相关色度残差缩放部720。回路映射部710的解量化和逆变换711、重构712和帧内预测713块表示在映射(整形)域中应用的处理。环路滤波器715、回路映射部710的运动补偿或帧间预测717块以及色度残差缩放部720的重构722、帧内预测723、运动补偿或帧间预测724、环路滤波器725块表示在原始(非映射、非整形)域中应用的处理。
如图7所示,当LMCS被启用时,可应用反向映射(整形)处理714、前向映射(整形)处理718和色度缩放处理721中的至少一个。例如,可对重构画面中的(重构)亮度样本(或亮度样本或亮度样本阵列)应用反向映射处理。可基于亮度样本的分段函数(反向)索引来执行反向映射处理。分段函数(反向)索引可标识亮度样本所属的片段。反向映射处理的输出是修改的(重构)亮度样本(或修改的亮度样本或修改的亮度样本阵列)。LMCS可在拼块组(或切片)、画面或更高的级别被启用或禁用。
可应用前向映射处理和/或色度缩放处理以生成重构画面。画面可包括亮度样本和色度样本。以亮度样本的重构画面可被称为重构亮度画面,以色度样本的重构画面可被称为重构色度画面。重构亮度画面和重构色度画面的组合可被称为重构画面。重构亮度画面可基于前向映射处理来生成。例如,如果对当前块应用帧间预测,则对基于参考画面中的(重构)亮度样本推导的亮度预测样本应用前向映射。由于参考画面中的(重构)亮度样本基于反向映射处理来生成,所以可对亮度预测样本应用前向映射,因此可推导映射的(整形的)亮度预测样本。可基于亮度预测样本的分段函数索引来执行前向映射处理。可基于亮度预测样本的值或用于帧间预测的参考画面中的亮度样本的值来推导分段函数索引。如果对当前块应用帧内预测(或块内复制(IBC)),则不需要前向映射,因为还未对当前画面中的重构样本应用反向映射处理。重构亮度画面中的(重构)亮度样本基于映射的亮度预测样本和对应亮度残差样本来生成。
重构色度画面可基于色度缩放处理来生成。例如,重构色度画面中的(重构)色度样本可基于当前块中的色度残差样本(cres)和色度预测样本来推导。基于当前块的(缩放的)色度残差样本(cresScale)和色度残差缩放因子(cScaleInv可被称为varScale)来推导色度残差样本(cres)。可基于当前块的整形的亮度预测样本值来计算色度残差缩放因子。例如,可基于整形的亮度预测样本值Y'pred的平均亮度值ave(Y'pred)来计算缩放因子。作为参考,基于逆变换/解量化推导的(缩放的)色度残差样本可被称为cresScale,通过对(缩放的)色度残差样本执行(逆)缩放处理而推导的色度残差样本可被称为cres。
图8示出根据本文献的另一实施方式的LMCS结构。图8参照图7来描述。这里,主要描述图8的LMCS结构与图7的LMCS结构700之间的差异。图8的回路映射部和亮度相关色度残差缩放部可与图7的回路映射部710和亮度相关色度残差缩放部720相同(相似地)操作。
参照图8,可基于亮度重构样本来推导色度残差缩放因子。在这种情况下,可基于重构块外部的邻近亮度重构样本,而非重构块的内部亮度重构样本来获得(推导)平均亮度值(avgYr),并且基于平均亮度值(avgYr)来推导色度残差缩放因子。这里,邻近亮度重构样本可以是当前块的邻近亮度重构样本,或者可以是包括当前块的虚拟流水线数据单元(VPDU)的邻近亮度重构样本。例如,当对目标块应用帧内预测时,可根据基于帧内预测推导的预测样本来推导重构样本。在另一示例中,当对目标块应用帧间预测时,对基于帧间预测推导的预测样本应用前向映射,并且基于整形的(或前向映射的)亮度预测样本来生成(推导)重构样本。
通过比特流用信号通知的视频/图像信息可包括LMCS参数(关于LMCS的信息)。LMCS参数可被配置成高级句法(HLS,包括切片头句法)等。LMCS参数的详细描述和配置将稍后描述。如上所述,本文献(和以下实施方式)中描述的句法表可在编码器端配置/编码,并且通过比特流用信号通知给解码器端。解码器可解析/解码关于句法表中的LMCS的信息(以句法组件的形式)。下面要描述的一个或更多个实施方式可被组合。编码器可基于关于LMCS的信息对当前画面进行编码,并且解码器可基于关于LMCS的信息对当前画面进行解码。
亮度分量的回路映射可通过横跨动态范围重分布码字来调节输入信号的动态范围以改进压缩效率。对于亮度映射,可使用前向映射(整形)函数(FwdMap)以及与前向映射函数(FwdMap)对应的反向映射(整形)函数(InvMap)。可使用分段线性模型用信号通知FwdMap函数,例如,分段线性模型可具有16个片段或仓,片段可具有相等的长度。在一个示例中,InvMap函数不需要用信号通知,而是从FwdMap函数推导。即,反向映射可以是前向映射函数。例如,反向映射函数可在数学上构建为前向映射的对称函数,如线y=x所反映的。
回路(亮度)整形可用于将输入亮度值(样本)映射至整形域中的更改值。整形值可被编码,然后在重构之后映射回原始(未映射、未整形)域。为了补偿亮度信号和色度信号之间的相互作用,可应用色度残差缩放。回路整形通过指定整形器模型的高级句法来完成。整形器模型句法可用信号通知分段线性模型(PWL模型)。例如,整形器模型句法可用信号通知具有相同长度的16个仓或片段的PWL模型。可基于分段线性模型来推导前向查找表(FwdLUT)和/或反向查找表(InvLUT)。例如,PWL模型预先计算1024条目前向(FwdLUT)和反向(InvLUT)查找表(LUT)。作为示例,当推导前向查找表FwdLUT时,可基于前向查找表FwdLUT来推导反向查找表InvLUT。前向查找表FwdLUT可将输入亮度值Yi映射至更改值Yr,反向查找表InvLUT可将更改值Yr映射至重构值Y'i。重构值Y′i可基于输入亮度值Yi来推导。
在一个示例中,SPS可包括下表9的句法。表9的句法可包括sps_reshaper_enabled_flag作为工具启用标志。这里,sps_reshaper_enabled_flag可用于指定在编码视频序列(CVS)中是否使用整形器。即,sps_reshaper_enabled_flag可以是在SPS中启用整形的标志。在一个示例中,表9的句法可以是SPS的一部分。
[表9]
在一个示例中,关于句法元素sps_seq_parameter_set_id和sps_reshaper_enabled_flag的语义可如下表10所示。
[表10]
在一个示例中,拼块组头或切片头可包括以下表11或表12的句法。
[表11]
[表12]
包括在表11或表12的句法中的句法元素的语义可包括例如下表中公开的事项。
[表13]
[表14]
作为一个示例,一旦在SPS中解析启用整形的标志(即,sps_reshaper_enabled_flag),拼块组头可解析用于构造查找表(FwdLUT和/或InvLUT)的附加数据(即,包括在上表13或表14中的信息)。为此,可在切片头或拼块组头中首先检查SPS整形器标志(sps_reshaper_enabled_flag)的状态。当sps_reshaper_enabled_flag为真(或1)时,可解析附加标志,即,tile_group_reshaper_model_present_flag(或slice_reshaper_model_present_flag)。tile_group_reshaper_model_present_flag(或slice_reshaper_model_present_flag)的目的可以是指示整形模型的存在。例如,当tile_group_reshaper_model_present_flag(或slice_reshaper_model_present_flag)为真(或1)时,可指示对于当前拼块组(或当前切片)存在整形器。当tile_group_reshaper_model_present_flag(或slice_reshaper_model_present_flag)为假(或0)时,可指示对于当前拼块组(或当前切片)不存在整形器。
如果存在整形器并且在当前拼块组(或当前切片)中启用整形器,则可处理整形器模型(即,tile_group_reshaper_model()或slice_reshaper_model())。更进一步,还可解析附加标志tile_group_reshaper_enable_flag(或slice_reshaper_enable_flag)。tile_group_reshaper_enable_flag(或slice_reshaper_enable_flag)可指示整形模型是否用于当前拼块组(或切片)。例如,如果tile_group_reshaper_enable_flag(或slice_reshaper_enable_flag)为0(或假),则可指示整形模型不用于当前拼块组(或当前切片)。如果tile_group_reshaper_enable_flag(或slice_reshaper_enable_flag)为1(或真),则可指示整形模型用于当前拼块组(或切片)。
作为一个示例,tile_group_reshaper_model_present_flag(或slice_reshaper_model_present_flag)可为真(或1),并且tile_group_reshaper_enable_flag(或slice_reshaper_enable_flag)可为假(或0)。这意味着整形模型存在,但未在当前拼块组(或切片)中使用。在这种情况下,整形模型可在未来拼块组(或切片)中使用。作为另一示例,tile_group_reshaper_enable_flag可为真(或1)并且tile_group_reshaper_model_present_flag可为假(或0)。在这种情况下,解码器使用来自先前初始化的整形器。
当解析整形模型(即,tile_group_reshaper_model()或slice_reshaper_model())和tile_group_reshaper_enable_flag(或slice_reshaper_enable_flag)时,可确定(评估)是否存在色度缩放所需的条件。上述条件包括条件1(当前拼块组/切片还未被帧内编码)和/或条件2(当前拼块组/切片还未被分割为用于亮度和色度的两个单独的编码四叉树结构,即,当前拼块组/切片的块结构不是双树结构)。如果条件1和/或条件2为真和/或tile_group_reshaper_enable_flag(或slice_reshaper_enable_flag)为真(或1),则可解析tile_group_reshaper_chroma_residual_scale_flag(或slice_reshaper_chroma_residual_scale_flag)。当tile_group_reshaper_chroma_residual_scale_flag(或slice_reshaper_chroma_residual_scale_flag)被启用(如果为1或真)时,可指示对于当前拼块组(或切片)启用色度残差缩放。当tile_group_reshaper_chroma_residual_scale_flag(或slice_reshaper_chroma_residual_scale_flag)被禁用(如果为0或假)时,可指示对于当前拼块组(或切片)禁用色度残差缩放。
拼块组整形模型的目的是解析构造查找表(LUT)所需的数据。这些LUT的构造理念是,亮度值的允许范围的分布可被划分为多个仓(例如,16个仓),这可使用一组16个PWL方程组来表示。因此,落在给定仓内的任何亮度值可被映射至更改的亮度值。
图9示出表示示例性前向映射的图。在图9中,示例性地示出五个仓。
参照图9,x轴表示输入亮度值,y轴表示更改的输出亮度值。x轴被划分为5个仓或切片,各个仓的长度为L。即,映射至更改的亮度值的五个仓具有相同的长度。前向查找表(FwdLUT)可使用从拼块组头可用的数据(即,整形器数据)来构造,因此可方便映射。
在一个实施方式中,可计算与仓索引关联的输出枢轴点。输出枢轴点可设定(标记)亮度码字整形的输出范围的最小边界和最大边界。输出枢轴点的计算处理可通过计算码字数量的分段累积分布函数(CDF)来执行。输出枢轴范围可基于要使用的仓的最大数量和查找表(FwdLUT或InvLUT)的大小来切片。作为一个示例,输出枢轴范围可基于仓的最大数量与查找表的大小之间的乘积(LUT的大小*仓索引的最大数量)来切片。例如,如果仓的最大数量与查找表的大小之间的乘积为1024,则输出枢轴范围可被切片为1024个条目。输出枢轴范围的这种锯齿可基于(使用)缩放因子来执行(应用或实现)。在一个示例中,缩放因子可基于下式1来推导。
[式1]
SF=(y2-y1)*(1<<FP_PREC)+c
在式1中,SF表示缩放因子,y1和y2表示与各个仓对应的输出枢轴点。另外,FP_PREC和c可以是预定常数。基于式1确定的缩放因子可被称为用于前向整形的缩放因子。
在另一实施方式中,关于反向整形(反向映射),对于所定义的要使用的仓的范围(即,从reshaper_model_min_bin_idx至reshape_model_max_bin_idx),获取与前向LUT的映射枢轴点对应的输入整形枢轴点和映射反向输出枢轴点(由所考虑的仓索引*初始码字数量给出)。在另一示例中,缩放因子SF可基于下式2来推导。
[式2]
SF=(y2-y1)*(1<<FP_PREC)/(x2-x1)在式2中,SF表示缩放因子,x1和x2表示输入枢轴点,y1和y2表示与各个片段(仓)对应的输出枢轴点(反向映射的输出枢轴点)。这里,输入枢轴点可以是基于前向查找表(FwdLUT)映射的枢轴点,输出枢轴点可以是基于反向查找表(InvLUT)反向映射的枢轴点。另外,FP_PREC可以是预定常数值。式2的FP_PREC可与式1的FP_PREC相同或不同。基于式2确定的缩放因子可被称为用于反向整形的缩放因子。在反向整形期间,输入枢轴点的分割可基于式2的缩放因子来执行。缩放因子SF用于对输入枢轴点的范围进行切片。基于分割的输入枢轴点,从0至最小仓索引(reshaper_model_min_bin_idx)和/或从最小仓索引(reshaper_model_min_bin_idx)至最大仓索引(reshape_model_max_bin_idx)的范围内的仓索引被指派与最小仓值和最大仓值对应的枢轴值。
在一个示例中,LMCS数据(lmcs_data)可被包括在APS中。例如,APS的语义可以是为编码用信号通知的32个APS。
下表示出根据本文献的实施方式的示例性APS的句法和语义。
[表15]
[表16]
参照表15,可在APS中解析/用信号通知APS参数的类型信息(例如,aps_params_type)。可在adaptation_parameter_set_id之后解析/用信号通知APS参数的类型信息。
包括在上表15中的APS_params_type、ALF_APS和LMCS_APS可根据下表来描述。即,根据包括在表15中的APS_params_type,应用于APS的APS参数的类型可如包括在表16中的表3.2所示设定。
参照表16,例如,aps_params_type可以是用于对对应APS参数的类型进行分类的句法元素。APS参数的类型可包括ALF参数和LMCS参数。参照表16,当类型信息(aps_params_type)的值为0时,aps_params_type的名称可被确定为ALF_APS(或ALF APS),APS参数的类型可被确定为ALF参数(APS参数可表示ALF参数)。在这种情况下,ALF数据字段(即,alf_data())可被解析/用信号通知给APS。当类型信息(aps_params_type)的值为1时,aps_params_type的名称可被确定为LMCS_APS(或LMCS APS),APS参数的类型可被确定为LMCS参数(APS参数可表示LMCS参数)。在这种情况下,LMCS(整形器模型、整形器)数据(即,lmcs_data())可被解析/用信号通知给APS。
下面的表17和/或表18示出根据实施方式的整形器模型的句法。整形器模型可被称为LMCS模型。尽管这里整形器模型被示例性地描述为拼块组整形器,但本说明书未必限于此实施方式。例如,整形器模型可被包括在APS中,或者拼块组整形器模型可被称为切片整形器模型或LMCS数据(LMCS数据字段)。另外,前缀“reshaper_model”或“Rsp”可与“lmcs”互换使用。例如,在以下的表和下面的描述中,reshaper_model_min_bin_idx、reshaper_model_delta_max_bin_idx、reshaper_model_max_bin_idx、RspCW、RsepDeltaCW可分别与lmcs_min_bin_idx、lmcs_delta_cs_bin_idx、lmx mixed、lmcs_delta_csDcs_bin_idx、Wlm_idx互换使用。
包括在上表15中的LMCS数据(lmcs_data())或整形器模型(拼块组整形器或切片整形器)可被表示为包括在下表中的句法。
[表17]
[表18]
包括在表17和/或表18的句法中的句法元素的语义可包括例如下表中公开的事项。
[表19]
[表20]
根据本文献的亮度样本的反向映射处理可如下表所示以标准文献的形式描述。
[表21]
根据本文献的亮度样本的分段函数索引处理的标识可如下表所示以标准文献的形式描述。在表22中,idxYInv可被称为反向映射索引,并且反向映射索引可基于重构的亮度样本(lumaSample)来推导。
[表22]
可基于上述实施方式和示例来执行亮度映射,并且上述句法和包括在其中的组件可以仅是示例性表示,本文献中的实施方式不限于上述表或式。以下,描述基于亮度映射来执行色度残差缩放(残差样本的色度分量的缩放)的方法。
(亮度相关)色度残差缩放被设计为补偿亮度信号及其对应色度信号之间的相互作用。例如,还在拼块组级别用信号通知色度残差缩放是否被启用。在一个示例中,如果亮度映射被启用并且如果不对当前拼块组应用双树分区(也称为单独的色度树),则用信号通知附加标志以指示亮度相关色度残差缩放是否被启用。在其它示例中,当不使用亮度映射时,或者当在当前拼块组中使用双树分区时,亮度相关色度残差缩放被禁用。在另一示例中,对于面积小于或等于4的色度块,亮度相关色度残差缩放始终被禁用。
色度残差缩放可基于对应亮度预测块的平均值(应用了帧内预测模式和/或帧间预测模式的预测块的亮度分量)。编码器端和/或解码器侧的缩放操作可基于下式3以定点整数算术来实现。
[式3]
c’=sign(c)*((abs(c)*s+2CSCALE_FP_PREC-1))>>CSCALE_FP_PREC)
在式3中,c'表示缩放的色度残差样本(残差样本的缩放的色度分量),c表示色度残差样本(色度残差样本、残差样本的色度分量),s表示色度残差缩放因子,CSCALE_FP_PREC表示(预定义的)常数值以指定精度。例如,CSCALE_FP_PREC可为11。
图10是示出根据本文献的实施方式的用于推导色度残差缩放索引的方法的流程图。图10中的方法可基于图7以及包括在与图7有关的描述中的表、式、变量、阵列和函数来执行。
在步骤S1010中,可基于预测模式信息确定当前块的预测模式是帧内预测模式还是帧间预测模式。如果预测模式是帧内预测模式,则当前块或当前块的预测样本被认为已经在整形(映射)区域中。如果预测模式是帧间预测模式,则当前块或当前块的预测样本被认为在原始(未映射、未整形)区域中。
在步骤S1020中,当预测模式是帧内预测模式时,可计算(推导)当前块的平均(或当前块的亮度预测样本)。即,直接计算在已经整形的区域中当前块的平均。平均也可被称为平均值或均值。
在步骤S1021中,当预测模式是帧间预测模式时,可对当前块的亮度预测样本执行(应用)前向整形(前向映射)。通过前向整形,基于帧间预测模式的亮度预测样本可从原始区域映射至整形区域。在一个示例中,亮度预测样本的前向整形可基于以上面的表17和/或表18描述的整形模型来执行。
在步骤S1022中,可计算(推导)前向整形的(前向映射的)亮度预测样本的平均。即,可执行前向整形结果的平均处理。
在步骤S1030中,可计算色度残差缩放索引。当预测模式是帧内预测模式时,可基于亮度预测样本的平均来计算色度残差缩放索引。当预测模式是帧间预测模式时,色度残差缩放索引可基于前向整形的亮度预测样本的平均来计算。
在实施方式中,可基于for循环句法来计算色度残差缩放索引。下表示出用于推导(计算)色度残差缩放索引的示例性for循环句法。
[表23]
在表23中,idxS表示色度残差缩放索引,idxFound表示标识是否获得满足if语句的条件的色度残差缩放索引的索引,S表示预定常数值,MaxBinIdx表示最大允许仓索引。ReshapPivot[idxS+1](换言之,LmcsPivot[idxS+1])可基于上述表19和/或表20来推导。
在实施方式中,可基于色度残差缩放索引来推导色度残差缩放因子。式4是用于推导色度残差缩放因子的示例。
[式4]
s=ChromaScaleCoef[idxS]
在式4中,s表示色度残差缩放因子,ChromaScaleCoef可以是基于上述表19和/或表20推导的变量(或阵列)。
如上所述,可获得参考样本的平均亮度值,并且可基于平均亮度值来推导色度残差缩放因子。如上所述,可基于色度残差缩放因子来缩放色度分量残差样本,并且可基于缩放的色度分量残差样本来生成色度分量重构样本。
在本文献的一个实施方式中,提出了用于高效地应用上述LMCS的信令结构。根据本文献的此实施方式,例如,LMCS数据可被包括在HLS(即,APS)中,并且通过APS的较低级别的头信息(即,画面头、切片头),LMCS模型(整形器模型)可通过用信号通知APS的ID(称为头信息)来自适应地推导。LMCS模型可基于LMCS参数来推导。另外,例如,可通过头信息用信号通知多个APS ID,并且由此,可在同一画面/切片内以块为单位应用不同的LMCS模型。
在根据本文献的一个实施方式中,提出了高效地执行LMCS所需的操作的方法。根据上面在表19和/或表20中描述的语义,需要通过片段长度lmcsCW[i](在本文献中也称为RspCW[i])的除法运算以推导InvScaleCoeff[i]。反向映射的片段长度可能不是2的幂,这意味着无法通过比特移位执行除法。
例如,计算InvScaleCoeff可能需要每切片至多16次除法。根据上述表19和/或表20,对于10比特编码,lmcsCW[i]的范围是从8至511,因此为了实现使用LUT按照lmcsCW[i]的除法运算,LUT的大小必须为504。另外,对于12比特编码,lmcsCW[i]的范围是从32至2047,因此LUT大小需要为2016,以实现使用LUT按照lmcsCW[i]的除法运算。即,除法在硬件实现方面昂贵,因此,可取的是尽可能避免除法。
在此实施方式的一个方面,lmcsCW[i]可被约束为固定数量(或预定数量)的倍数。因此,除法的查找表(LUT)(LUT的容量或大小)可减小。例如,如果lmcsCW[i]变为2的倍数,则替换除法处理的LUT的大小可减小一半。
在此实施方式的另一方面,提出对于以更高内部比特深度编码进行编码,在现有约束“lmcsCW[i]的值应在(OrgCW>>3)至(OrgCW<<3-1)的范围内”之上,如果编码比特深度高于10,则进一步将lmcsCW[i]约束为1<<(BitDepthY-10)的倍数。这里,BitDepthY可以是亮度比特深度。因此,lmcsCW[i]的可能数量不会随编码比特深度而变化,并且计算InvScaleCoeff所需的LUT的大小不会由于更高的编码比特深度而增加。例如,对于12比特内部编码比特深度,lmcsCW[i]的极限值是4的倍数,则替换除法处理的LUT将与用于10比特编码的相同。这方面可单独实现,但是也可与上述方面组合实现。
在此实施方式的另一方面,lmcsCW[i]可被约束为更窄的范围。例如,lmcsCW[i]可被约束在从(OrgCW>>1)至(OrgCW<<1)-1的范围内。然后对于10比特编码,lmcsCW[i]的范围可为[32,127],因此,仅需要大小为96的LUT来计算InvScaleCoeff。
在本实施方式的另一方面,lmcsCW[i]可被近似为与2的幂最接近的数,并在整形器设计中使用。因此,可通过比特移位来执行(并替换)反向映射中的除法。
在根据本文献的一个实施方式中,提出了LMCS码字范围的约束。根据上述表8,LMCS码字的值在从(OrgCW>>3)至(OrgCW<<3)-1的范围内。此码字范围太宽。当RspCW[i]和OrgCW之间存在较大差异时,可能导致视觉伪影问题。
依据根据本文献的一个实施方式,提出了将LMCS PWL映射的码字约束至窄范围。例如,lmcsCW[i]的范围可在范围(OrgCW>>1)至(OrgCW<<1)-1内。
在根据本文献的一个实施方式中,对于LMCS中的色度残差缩放提出使用单个色度残差缩放因子。推导色度残差缩放因子的现有方法使用对应亮度块的平均值并推导反向亮度映射的每一片段的斜率作为对应缩放因子。另外,识别分段索引的处理需要对应亮度块的可用性,这导致延迟问题。这对于硬件实现而言是不可取的。根据本文献的此实施方式,色度块中的缩放可能不依赖于亮度块值,并且可能不需要识别分段索引。因此,LMCS中的色度残差缩放处理可在没有延迟问题的情况下执行。
在根据本文献的一个实施方式中,可基于亮度LMCS信息从编码器和解码器二者推导单个色度缩放因子。当接收到LMCS亮度模型时,可更新色度残差缩放因子。例如,当LMCS模型更新时,单个色度残差缩放因子可更新。
下表示出根据本实施方式的获得单个色度缩放因子的示例。
[表24]
参照表24,可通过对LMCS_min_bin_idx和lmcs_max_bin_idx内的所有片段的反向亮度映射斜率取平均来获得单个色度缩放因子(例如,ChromaScaleCoeff或ChromaScaleCoeffSingle)。
图11示出根据本文献的实施方式的枢轴点的线性拟合。在图11中,示出枢轴点P1、Ps和P2。以下实施方式或其示例将以图11来描述。
在此实施方式的示例中,可基于枢轴点lmcs_min_bin_idx和lmcs_max_bin_idx+1(LmcsMaxBinIdx+1)之间的亮度PWL映射的线性近似来获得单个色度缩放因子。即,线性映射的反斜率可用作色度残差缩放因子。例如,图11的线性线1可以是连接枢轴点P1和P2的直线。参照图11,在P1中,输入值为x1并且映射值为0,并且在P2中,输入值为x2并且映射值为y2。线性线1的反斜率(反标度)为(x2-x1)/y2,并且可基于枢轴点P1、P2的输入值和映射值以及下式来计算单个色度缩放因子ChromaScaleCoeffSingle。
[式5]
ChromaScaleCoeffSingle=(x2-x1)*(1<<CSCALE_FP_PREC)/y2
在式5中,CSCALE_FP_PREC表示移位因子,例如,CSCALE_FP_PREC可以是预定常数值。在一个示例中,CSCALE_FP_PREC可为11。
在根据此实施方式的另一示例中,参照图11,枢轴点Ps处的输入值为min_bin_idx+1,枢轴点Ps处的映射值为ys。因此,线性线1的反斜率(反标度)可被计算为(xs-x1)/ys,并且可基于枢轴点P1、Ps的输入值和映射值以及下式来计算单个色度缩放因子ChromaScaleCoeffSingle。
[式6]
ChromaScaleCoeffSingle=(xs-x1)*(1<<CSCALE_EP_PREC)/ys
在式6中,CSCALE_FP_PREC表示移位因子(比特移位因子),例如,CSCALE_FP_PREC可以是预定常数值。在一个示例中,CSCALE_FP_PREC可为11,并且可基于CSCALE_FP_PREC执行反标度的比特移位。
在根据此实施方式的另一示例中,可基于线性近似线来推导单个色度残差缩放因子。推导线性近似线的示例可包括枢轴点(即,lmcs_min_bin_idx、lmcs_max_bin_idx+1)的线性连接。例如,线性近似结果可由PWL映射的码字表示。P2处的映射值y2可以是所有仓(分片)的码字之和,并且P2处的输入值与P1处的输入值之差(x2-x1)为OrgCW*(lmcs_max_bin_idx-lmcs_min_bin_idx+1)(对于OrgCW,参见上面的表19和/或表20)。下表示出根据上述实施方式获得单个色度缩放因子的示例。
[表25]
参照表25,可从两个枢轴点(即,lmcs_min_bin_idx、lmcs_max_bin_idx)获得单个色度缩放因子(例如,ChromaScaleCoeffSingle)。例如,线性映射的反斜率可用作色度缩放因子。
在此实施方式的另一示例中,可通过枢轴点的线性拟合来获得单个色度缩放因子以使线性拟合与现有PWL映射之间的误差(或均方误差)最小化。此示例可比简单连接lmcs_min_bin_idx和lmcs_max_bin_idx处的两个枢轴点更准确。寻找最优线性映射有许多方式,下面描述这样的示例。
在一个示例中,用于使最小二乘误差之和最小化的线性拟合式y=b1*x+b0的参数b1和b0可基于下式7和/或式8来计算。
[式7]
[式8]
在式7和式8中,x是原始亮度值,y是整形亮度值,和是x和y的均值,xi和yi表示第i枢轴点的值。
参照图11,识别线性映射的另一简单近似被给出为:
-通过连接lmcs_min_bin_idx和lmcs_max_bin_idx+1处的PWL映射的枢轴点来得到线性线1,以OrgW的倍数的输入值计算此线性线的lmcs_pivots_linear[i]
-使用线性线1并使用PWL映射对枢轴点映射值之差进行求和。
-得到平均差avgDiff。
-根据平均差来调节线性线的最后枢轴点,例如,2*avgDiff
-使用调节的线性线的反斜率作为色度残差标度。
根据上述线性拟合,色度缩放因子(即,前向映射的反斜率)可基于下式9或式10来推导(获得)。
[式9]
ChromaScaleCoeffSingle=OrgCW*(1<<CSCALE_FP_PREC)/lmcs_pivots_linear[lmcs_min_bin_idx+1]
[式10]
ChromaScaleCoeffSingle=OrgCW*(lmcs_max_bin_idx-lmcs_max_bin_idx+1)*(1<<CSCALE_FP_PREC)/lmcs_pivots_linear[lmcs_max_bin_idx+1]
在上述式中,lmcs_pivots_lienar[i]可以是线性映射的映射值。对于线性映射,最小仓索引和最大仓索引之间的PWL映射的所有片段可具有相同的LMCS码字(lmcsCW)。即,lmcs_pivots_linear[lmcs_min_bin_idx+1]可与lmcsCW[lmcs_min_bin_idx]相同。
另外,在式9和式10中,CSCALE_FP_PREC表示移位因子(比特移位因子),例如,CSCALE_FP_PREC可以是预定常数值。在一个示例中,CSCALE_FP_PREC可为11。
利用单个色度残差缩放因子(ChromaScaleCoeffSingle),不再需要计算对应亮度块的平均,在PWL线性映射中寻找索引以得到色度残差缩放因子。因此,使用色度残差缩放的编码效率可增加。这不仅消除了对对应亮度块的依赖性,解决了延迟问题,而且降低了复杂度。
根据上述本实施方式的与LMCS数据有关的语义和/或色度样本的亮度相关色度残差缩放过程可如下表所示以标准文献格式描述。
[表26]
[表27]
在本文献的另一实施方式中,编码器可确定与单个色度缩放因子有关的参数并将这些参数用信号通知给解码器。利用信令,编码器可利用编码器处可用的其它信息来推导色度缩放因子。此实施方式旨在消除色度残差缩放延迟问题。
例如,识别要用于确定色度残差缩放因子的线性映射的另一示例给出如下:
-通过连接lmcs_min_bin_idx和lmcs_max_bin_idx+1处的PWL映射的枢轴点,以OrgW的倍数的输入值计算此线性线的lmcs_pivots_linear[i]
-使用线性线1和亮度PWL映射的那些来得到枢轴点的映射值之差的加权和。权重可基于编码器统计数据(例如,仓的直方图)。
-得到加权平均差avgDiff。
-根据加权平均差来调节线性线1的最后枢轴点,例如,2*avgDiff
-使用调节的线性线的反斜率来计算色度残差标度。
下表示出用信号通知用于色度缩放因子推导的y值的句法的示例。
[表28]
在表28中,句法元素lmcs_chroma_scale可指定用于LMCS色度残差缩放的单个色度(残差)缩放因子(ChromaScaleCoeffSingle=lmcs_chroma_scale)。即,可直接用信号通知关于色度残差缩放因子的信息,并且用信号通知的信息可被推导为色度残差缩放因子。换言之,用信号通知的关于色度残差缩放因子的信息的值可被(直接)推导为单个色度残差缩放因子的值。这里,句法元素lmcs_chroma_scale可与其它LMCS数据(即,与码字的绝对值和符号等有关的句法元素)一起用信号通知。
另选地,编码器可仅用信号通知必要参数以在解码器处推导色度残差缩放因子。为了在解码器处推导色度残差缩放因子,需要输入值x和映射值y。由于x值是仓长度并且是已知数,所以不需要用信号通知。毕竟,仅需要用信号y值通知以便推导色度残差缩放因子。这里,y值可以是线性映射中的任何枢轴点的映射值(即,图11中的P2或Ps的映射值)。
下表示出用信号通知用于推导色度残差缩放因子的映射值的示例。
[表29]
[表30]
上述表29和表30的句法之一可用于用信号通知编码器和解码器所指定的任何线性枢轴点处的y值。即,编码器和解码器可使用相同的句法来推导y值。
首先,描述根据表29的实施方式。在表29中,lmcs_cw_linear可表示Ps或P2处的映射值。即,在根据表29的实施方式中,可通过lmcs_cw_linear用信号通知固定数。
在根据此实施方式的示例中,如果lmcs_cw_linear表示一个仓的映射值(即,图11的Ps中的lmcs_pivots_linear[lmcs_min_bin_idx+1]),则可基于下式来推导色度缩放因子。
[式11]
ChromaScaleCoeffSinglc=OrgCw*(1<<CSCALE_FP_PREC)/lmcs_cw_linear
在根据此实施方式的另一示例中,如果lmcs_cw_linear表示lmcs_max_bin_idx+1(即,图11的P2中的lmcs_pivots_linear[lmcs_max_bin_idx+1]),则可基于下式来推导色度缩放因子。
[式12]
ChromaScaleCoeffSingle=OrgCW*(lmcs_max_bin_idx-lmcs_max_bin_idx+1)*(1<<CSCALE_FP_PREC)/lmcs_cw_linear
在上述式中,CSCALE_FP_PREC表示移位因子(比特移位因子),例如,CSCALE_FP_PREC可以是预定常数值。在一个示例中,CSCALE_FP_PREC可为11。
接下来,描述根据表30的实施方式。在此实施方式中,可用信号通知lmcs_cw_linear作为相对于固定数(即,lmcs_delta_abs_cw_linear、lmcs_delta_sign_cw_linear_flag)的增量值。在此实施方式的示例中,当lmcs_cw_linear表示lmcs_pivots_linear[lmcs_min_bin_idx+1](即,图11的Ps)中的映射值时,可基于下式来推导lmcs_cw_linear_delta和lmcs_cw_linear。
[式13]
lmcs_cw_linear_delta=(1-2*lmcs_delta_sign_cw_linear_flag)*lmcs_delta_abs_linear_cw
[式14]
lmcs_cw_linear=lmcs_cw_linear_delta+OrgCW
在此实施方式的另一示例中,当lmcs_cw_linear表示lmcs_pivots_linear[lmcs_max_bin_idx+1](即,图11的P2)中的映射值时,可基于下式来推导lmcs_cw_linear_delta和lmcs_cw_linear。
[式15]
lmcs_cw_linear_delta=(1-2*lmcs_delta_sign_cw_linear_flag)*lmcs_delta_abs_linear_cw[式16]
lmcs_cw_linear=lmcs_cw_linear_delta+OrgCW*(lmcs_max_bin_idx-lmcs_max_bin_idx+1)
在上述式中,OrgCW可以是基于上述表19和/或表20推导的值。
根据上述本实施方式的用于与LMCS数据有关的语义和/或色度样本的亮度相关色度残差缩放过程可如下表所示以标准文献格式来描述。
[表31]
[表32]
图12示出根据本文献的实施方式的线性整形(或线性整形、线性映射)的一个示例。即,在此实施方式中,提出了在LMCS中使用线性整形器。例如,图12中的此示例可涉及前向线性整形(映射)。
参照图12,线性整形器可包括两个枢轴点,即,P1和P2。P1和P2可表示输入值和映射值,例如P1可为(min_input,0)并且P2可为(max_input,max_mapped)。这里,min_input表示最小输入值,max_input表示最大输入值。小于或等于min_input的任何输入值被映射至0,大于max_input的任何输入值被映射至max_mapped。min_input和max_input内的任何输入亮度值被线性映射至其它值。图12示出映射的示例。可在编码器处确定枢轴点P1、P2,并且可使用线性拟合来近似分段线性映射。
在根据本文献的另一实施方式中,可提出用信号通知线性整形器的方法的另一示例。可明确用信号通知线性整形器模型的枢轴点P1、P2。下表示出根据此示例的明确用信号通知线性整形器模型的句法和语义的示例。
[表33]
[表34]
参照表33和表34,可基于句法元素lmcs_min_input来推导第一枢轴点的输入值,并且可基于句法元素lmcs_max_input来推导第二枢轴点的输入值。第一枢轴点的映射值可以是预定值(编码器和解码器二者已知的值),例如,第一枢轴点的映射值为0。可基于句法元素lmcs_max_mapped来推导第二枢轴点的映射值。即,可基于在表33的句法中用信号通知的信息来明确(直接)用信号通知线性整形器模型。
另选地,lmcs_max_input和lmcs_max_mapped可作为增量值用信号通知。下表示出作为增量值用信号通知线性整形器模型的句法和语义的示例。
[表35]
[表36]
参照表36,可基于句法元素lmcs_min_input来推导第一枢轴点的输入值。例如,lmcs_min_input可具有映射值0。lmcs_max_input_delta可指定第二枢轴点的输入值与最大亮度值(即,(1<<bitdepthY)-1)之差。lmcs_max_mapped_delta可指定第二枢轴点的映射值与最大亮度值(即,(1<<bitdepthY)-1)之差。
根据本文献的实施方式,可基于线性整形器的上述示例来执行亮度预测样本的前向映射、亮度重构样本的反向映射和色度残差缩放。在一个示例中,在基于线性整形器的反向映射中对于亮度(重构)样本(像素)的反向缩放可仅需要一个反向缩放因子。对于前向映射和色度残差缩放也是如此。即,确定ScaleCoeff[i]、InvScaleCoeff[i]和ChromaScaleCoeff[i](i是仓索引)的步骤可仅由一个单一因子代替。这里,一个单一因子是线性映射的(正)斜率或反斜率的固定点表示。在一个示例中,可基于下式中的至少一个来推导反向亮度映射缩放因子(亮度重构样本的反向映射中的反向缩放因子)。
[式17]
InvScaleCoeffSingle=OrgCW/lmcsCWLinear
[式18]
InvScaleCoeffSingle=OrgCW*(lmcs_max_bin_idx-lmcs_max_bin_idx+1)/lmcsCWLinearAll
[式19]
InvScaleCoeffSingle=(lmcs_max_input-lmcs_min_input)/lmcsCWLinearAll
式17的lmcsCWLinear可从上述表31推导。式18和式19的lmcsCWLinearALL可从上述表33至表36中的至少一个推导。在式17或式18中,OrgCW可从表19和/或表20推导。
下表描述了指示在画面重构中对亮度样本(即,亮度预测样本)的前向映射处理的式和句法(条件语句)。在下面的表和式中,FP_PREC是比特移位的常数值,并且可以是预定值。例如,FP_PREC可为11或15。
[表37]
[表38]
表37可用于基于上述表17至表20在亮度映射处理中推导前向映射的亮度样本。即,表37可与表19和表20一起描述。在表37中,作为输出的前向映射的亮度(预测)样本PredMapPSamples[i][j]可从作为输入的亮度(预测)样本predSamples[i][j]推导。表37的idxY可被称为(前向)映射索引,映射索引可基于预测亮度样本来推导。
表38可用于在基于线性整形器的亮度映射中推导前向映射的亮度样本。例如,表38的lmcs_min_input、lmcs_max_input、lmcs_max_mapped和ScaleCoeffSingle可通过表33至表36中的至少一个推导。在表38中,在“lmcs_min_input<predSamples[i][j]<lmcs_max_input”的情况下,前向映射的亮度(预测)样本PredMapSamples[i][j]可从输入的亮度(预测)样本predSamples[i][j]推导作为输出。在表37和表38之间比较,可从前向映射的角度看出根据线性整形器的应用相对于现有LMCS的改变。
下式和表描述了亮度样本(即,亮度重构样本)的反向映射处理。在下式和表中,作为输入的“lumaSample”可以是反向映射之前(修改之前)的亮度重构样本。作为输出的“invSample”可以是反向映射的(修改的)亮度重构样本。在其它情况下,剪辑的invSample可被称为修改的亮度重构样本。
[式20]
invSample=InputPivot[idxYInv]+(InvScaleCoeff[idxYInv]*(lumaSample-LmcsPivot[idxYInv])+(1<<(FP_PREC-1)))>>FP_PREC
[式21]
invSample=lmcs_min_input+(InvScaleCoeffSingle*(lumaSample-lmcs_min_input)+(1<<(FP_PREC-1)))>>FP_PREC
[表39]
[表40]
式21可用于在根据本文献的亮度映射中推导反向映射的亮度样本。在式20中,索引idxInv可基于稍后描述的表50、表51或表52来推导。
式21可用于根据线性整形器的应用从亮度映射推导反向映射的亮度样本。例如,式21的lmcs_min_input可从表33至表36中的至少一个推导。通过式20和式21之间的比较,可从前向映射的角度看出根据线性整形器的应用相对于现有LMCS的改变。
表39可包括在亮度映射中推导反向映射的亮度样本的式的示例。例如,索引idxInv可基于稍后描述的表50、表51或表52来推导。
表40可包括在亮度映射中推导反向映射的亮度样本的式的其它示例。例如,表40的lmcs_min_input和/或lmcs_max_mapped可通过表33至表36中的至少一个推导,和/或表40的InvScaleCoeffSingle至少是表33至表36,和/或式17至式19可由一推导。
基于线性整形器的上述示例,分段索引识别处理可被省略。即,在本示例中,由于仅存在一个具有有效整形亮度像素的片段,所以可去除用于反向亮度映射和色度残差缩放的分段索引识别处理。因此,反向亮度映射的复杂度可降低。另外,由在色度残差缩放期间依赖于亮度分段索引识别导致的延迟问题可消除。
根据使用上述线性整形器的实施方式,可为LMCS提供以下优点:i)可简化编码器整形器设计,从而防止由分段线性片段之间的突然改变导致的可能伪影;ii)可通过消除分段索引识别处理来简化可去除分段索引识别处理的解码器反向映射处理;iii)通过去除分段索引识别处理,可去除色度残差缩放中由依赖于对应亮度块导致的延迟问题;iv)可减少信令开销,并使整形器的频繁更新更可行;v)对于过去需要16个片段的循环的许多地方,循环可被消除。例如,为了推导InvScaleCoeff[i],按照lmcsCW[i]的除法运算的数量可减少至1。
在根据本文献的另一实施方式中,提出基于灵活仓的LMCS。这里,灵活仓可指数量未固定为预定(预定义、特定)数量的仓。在现有实施方式中,LMCS中的仓的数量被固定为16,对于输入样本值,这16个仓相等地分布。在此实施方式中,提出了灵活数量的仓,并且这些片段(仓)在原始像素值方面可能没有相等地分布。
下表示例性地示出根据此实施方式的LMCS数据(数据字段)的句法和包括在其中的句法元素的语义。
[表41]
[表42]
参照表41,可用信号通知关于仓的数量的信息lmcs_num_bins_minus1。参照表42,lmcs_num_bins_minus1+1可等于仓的数量,仓的数量可在从1至(1<<BitDepthY)-1的范围内。例如,lmcs_num_bins_minus1或lmcs_num_bins_minus1+1可以是2的幂的倍数。
在与表41和表42一起描述的实施方式中,不管整形器是否为线性的(lmcs_num_bins_minus1的信令),可基于lmcs_num_bins_minus1(关于仓的数量的信息)来推导枢轴点的数量,并且可基于用信号通知的码字值(lmcs_delta_input_cw[i]、lmcs_delta_mapped_cw[i])的总和来推导枢轴点的输入值和映射值(LmcsPivot_input[i]、LmcsPivot_mapped[i])(这里,初始输入值LmcsPivot_input[0]和初始输出值LmcsPivot_mapped[0]为0)。
图13示出本文献的实施方式中的线性前向映射的示例。图14示出本文献的实施方式中的逆前向映射的示例。
在根据图13和图14的实施方式中,提出了支持常规LMCS和线性LMCS二者的方法。在根据此实施方式的示例中,常规LMCS和/或线性LMCS可基于句法元素lmcs_is_linear来指示。在编码器中,在确定线性LMCS线之后,映射值(即,图13和图14的pL中的映射值)可被划分为相等的片段(即,LmcsMaxBinIdx-lmcs_min_bin_idx+1)。可使用上述LMCS数据或整形器模式的句法用信号通知仓LmcsMaxBinIdx中的码字。
下表示例性地示出根据此实施方式的示例的LMCS数据(数据字段)的句法和包括在其中的句法元素的语义。
[表43]
[表44]
下表示例性地示出根据此实施方式的另一示例的LMCS数据(数据字段)的句法和包括在其中的句法元素的语义。
[表45]
[表46]
参照表43至表46,当lmcs_is_linear_flag为真时,lmcs_min_bin_idx和LmcsMaxBinIdx之间的所有LMCSDeltaCW[i]可具有相同的值。即,lmcs_min_bin_idx和LmcsMaxBinIdx之间的所有片段的lmcsCW[i]可具有相同的值。lmcs_min_bin_idx和lmcsMaxBinIdx之间的所有片段的标度和反标度和色度标度可相同。然后如果线性整形器为真,则不需要推导片段索引,它可使用仅来自一个片段的标度、反标度。
下表示例性地示出根据本实施方式的分段索引的识别处理。
[表47]
根据本文献的另一实施方式,常规16片段PWL LMCS和线性LMCS的应用可取决于更高级别的句法(即,序列级别)。
下表示例性地示出根据本实施方式的SPS的句法和包括在其中的句法元素的语义。
[表48]
[表49]
参照表48和表49,可由包括在SPS中的句法元素确定(用信号通知)常规LMCS和/或线性LMCS的启用。参照表48,基于句法元素sps_linear_lmcs_enabled_flag,常规LMCS或线性LMCS之一可以序列为单位使用。
另外,是否仅启用线性LMCS或常规LMCS还是二者也可取决于简档级别。在一个示例中,对于特定简档(即,SDR简档),可仅允许线性LMCS,对于另一简档(即,HDR简档),可仅允许常规LMCS,对于另一简档,可允许常规LMCS和/或线性LMCS二者。
根据本文献的另一实施方式,可在反向亮度映射和色度残差缩放中使用LMCS分段索引识别处理。在此实施方式中,分段索引的识别处理可用于色度残差缩放被启用的块,并且也被调用用于整形(映射)域中的所有亮度样本。本实施方式旨在保持其复杂度低。
下表示出现有分段函数索引的识别处理(推导处理)。
[表50]
在示例中,在分段索引识别处理中,输入样本可被分类为至少两个类别。例如,输入样本可被分类为三个类别,第一、第二和第三类别。例如,第一类别可表示小于LmcsPivot[lmcs_min_bin_idx+1]的样本(其值),第二类别可表示大于或等于LmcsPivot[LmcsMaxBinIdx](其值)的样本(其值),第三类别可指示LmcsPivot[lmcs_min_bin_idx+1]和LmcsPivot[LmcsMaxBinIdx]之间的样本(其值)。
在此实施方式中,提出了通过消除类别分类来优化识别处理。这是因为分段索引识别处理的输入是整形(映射)域中的亮度值,不应有值超过枢轴点lmcs_min_bin_idx和LmcsMaxBinIdx+1处的映射值。因此,现有分段索引识别处理中将样本分类为类别的条件处理是不必要的。对于更多细节,将在下面以表来描述具体示例。
在根据此实施方式的示例中,包括在表50中的识别处理可由下面的表51或表52之一代替。参照表51和表52,表50的前两个类别可被去除,对于最后类别,迭代的for循环中的边界值(第二边界值或终点)从LmcsMaxBinIdx改变为LmcsMaxBinIdx+1。即,识别处理可被简化,并且分段索引推导的复杂度可降低。因此,可根据本实施方式高效地执行LMCS相关编码。
[表51]
[表52]
参照表51,可对从最小仓索引到最大仓索引的所有仓索引迭代地执行与if语句的条件对应的比较处理(与if语句的条件对应的式)。在与if语句的条件对应的式为真的情况下,仓索引可被推导为反向亮度映射的反向映射索引(或色度残差缩放的反向缩放索引)。基于反向映射索引,可推导修改的重构亮度样本(或缩放的色度残差样本)。
根据表51,可解决在识别(反向)分段函数索引的过程中可能产生的问题。由于表51的实施方式,可去除计算漏洞和/或可省略由于交叠边界条件而产生的交叠计算处理。如果本文献不遵循表51的实施方式,则在关于当前块的LMCS中使用的映射值可能超过(偏离)用于识别分段索引(反向映射索引)的for句法(循环句法)中的LmcsPivot[idxYInv+1]。根据本实施方式,关于当前块的LMCS中使用的适当范围内的映射值可用于索引识别过程。
根据本文献的实施方式,可应用(执行)明确色度残差缩放因子信令或隐含(间接)色度残差缩放因子推导。示出(指示)是应用明确色度残差缩放因子信令还是隐含色度残差缩放因子推导的标志信息可包括在SPS中。即,标志信息可以是SPS级别标志。在本实施方式中,LMCS模型(LMCS数据字段)可在APS中用信号通知。
在实施方式中,在明确色度残差缩放因子推导中,可从编码器将关于色度残差缩放因子的值的信息明确地用信号通知给解码器。例如,关于色度残差缩放因子的值的信息可以n×m个块(CTU)为单位用信号通知。这里,n和/或m可以是预先定义的正整数。可在切片头用信号通知n和/或m的值。因此,可控制色度残差缩放因子的值的粒度(关于信令和应用)(从切片单位到CTU(块)单位)。在明确信令中,可以n×m CTU为单位对色度残差缩放因子的值进行解码。可应用色度残差缩放以使用为属于n×m CTU的区域的所有色度块解码的色度残差缩放因子的值。例如,色度残差缩放因子的值的编码过程可与增量量化参数(QP)的编码过程基本上相同或相似。
在一个示例中,在隐含色度残差缩放因子推导中,可基于当前块(例如,属于VPDU级别的块)的亮度分量(当前块的亮度样本)来推导色度残差缩放因子。在隐含推导中,可基于包括在先前编码的相邻块(VPDU)中的亮度样本(的值)来推导各个块(VPDU)的色度残差缩放因子。为了推导各个块的色度残差缩放因子,可使用左相邻重构亮度样本和/或上相邻重构亮度样本。
图15是示出根据本文献的实施方式的LMCS过程的示图。可参照图15描述隐含色度残差缩放因子的推导。
参照图15,用于推导色度残差缩放因子的亮度样本可包括M个左相邻亮度样本和M个上亮度样本。在一个示例中,M个左相邻亮度样本和/或M个上亮度样本可靠近左上样本的位置。例如,M可为16。如图16所示,可推导(计算)M个左相邻亮度样本和M个上亮度样本的平均值以推导色度残差缩放因子。参照图11和相关描述详细描述了基于亮度样本的平均值推导色度残差缩放因子。为一个块(VPDU)推导的色度残差缩放因子可用于包括在一个块中的所有色度块(样本)。根据上述实施方式,可执行对当前块的编码而不再需要亮度样本和色度样本之间的额外的依赖性。
当对于画面边界处的最右列中所包括的块,上相邻样本的数量小于M时,可填充画面边界样本直至M。当对于最下行中所包括的块,左相邻样本的数量小于M时,可填充画面边界样本直至M。因此,平均的样本数量可始终为2M(例如,M是2的倍数),因此,可省略除法。对于最左列中所包括的块,仅M个上相邻样本可用于推导平均值。此外,对于最上行中所包括的块,仅M个左相邻样本可用于推导平均值。另外,对于画面的左上块,平均值可被设定为预先确定的值,并且例如,预先确定的值可以是1<<(bitdepth-1)。
下表示出根据本实施方式的SPS的示例性句法。
[表53]
参照表53,SPS可包括示出(指示)是应用明确色度残差缩放因子信令还是隐含色度残差缩放因子推导的明确信令启用标志sps_cs_explicit_flag和/或示出LMCS数据字段是否被启用的LMCS启用标志sps_lmcs_enabled_flag。基于LMCS启用标志的值为1的事实,明确信令启用标志可被包括在SPS中。
下表示出根据本实施方式的切片头的示例性句法。
[表54]
参照表54,头信息可包括示出在当前切片(或当前画面)LMCS数据字段是否被启用的LMCS启用标志slice_lmcs_enabled_flag。包括在SPS中的LMCS启用标志可被称为第一LMCS启用标志,包括在头信息中的LMCS启用标志可被称为第二LMCS启用标志。例如,当第一LMCS启用标志的值为1时,第二LMCS启用标志可包括在头信息中。当第二LMCS启用标志的值为1时,头信息可包括示出当前画面所参考的LMCS APS的ID的LMCS APS相关ID信息slice_lmcs_aps_id以及色度残差缩放启用标志slice_chroma_residual_scale_flag。头信息可以是画面头信息。即,表54中的句法可被应用于关于画面头的信息,并且在这种情况下,前缀slice_可由ph_代替。
在一个示例中,头信息可包括基于明确信令启用标志sps_cs_explicit_flag和/或色度残差缩放启用标志slice_chroma_residual_scale_flag的条件。当明确信令启用标志和色度残差缩放启用标志二者为真(或1)的条件为真时,头信息可包括关于共享相同色度残差缩放索引的块的数量的信息(例如,slice_cs_horiz_size_minus1、slice_cs_vertic_size_minus1)。
下表示出关于包括在表54中的句法元素的语义。
[表55]
参照表55,关于共享相同色度残差缩放索引的块的数量的信息可包括关于共享相同色度残差缩放索引的块的水平数量的信息slice_cs_horiz_size_minus1和/或关于共享相同色度残差缩放索引的块的垂直数量的信息slice_cs_vertic_size_minus1。共享相同色度残差缩放索引的块的水平数量CsVerticSize可基于句法元素slice_cs_horiz_size_minus1来推导,共享相同色度残差缩放索引的块的垂直数量CsVerticSize可基于句法元素slice_cs_vertic_size_minus1来推导。在这种情况下,块的水平数量可意指共享相同色度残差缩放索引的块所属的区域的水平长度,块的垂直数量可意指共享相同色度残差缩放索引的块所属的区域的垂直长度。在一个示例中,共享相同色度残差缩放索引的块所属的区域可以是水平数量和垂直数量的乘积。
下表示出根据本实施方式的编码(树)单元信息的示例性句法。
[表56]
参照表56,编码单元信息可包括基于明确信令启用标志sps_cs_explicit_flag和/或色度残差缩放启用标志slice_chroma_residual_scale_flag的条件。当明确信令启用标志和色度残差缩放启用标志二者均为真(或1)的条件为真时,编码单元信息可包括关于色度残差缩放因子的值的信息。关于色度残差缩放因子的值的信息可包括关于色度残差缩放增量值的绝对值的信息cu_crs_delta_abs和/或关于色度残差缩放增量值的符号的信息cu_crs_delta_sign_flag。例如,当关于色度残差缩放增量值的绝对值的信息的值为1(或关于色度残差缩放增量值的绝对值的信息的值大于0)时,关于色度残差缩放增量值的符号的信息可包括在编码单元信息中。
结果,根据本文献的实施方式,集成色度残差缩放可应用于双树架构和单树架构二者。高级句法(例如,SPS)可包括关于色度残差缩放因子的明确信令或隐含推导的启用信息。可通过明确信令从CTU标度到切片标度控制特殊粒度。可使用包括在当前块VPDU中的相邻重构亮度样本对各个当前块应用隐含推导。根据本实施方式,可去除色度残差缩放中的管线延迟。此外,可通过明确信令去除亮度-色度依赖性。即,可明确地用信号通知关于明确色度残差缩放因子的值的信息,并且因此,可去除亮度样本和色度样本之间的依赖性。
构造下面要描述的图以描述本文献的详细示例。图中描述的设备的详细名称或信号/消息/字段的详细名称仅作为示例提供,本说明书的技术特性不限于以下图中使用的详细名称。
图16和图17示意性地示出根据本文献的实施方式和相关组件的视频/图像编码方法的示例。图16中所示的方法可由图2中公开的编码装置执行。详细地,例如,在图16中,S1600和/或S1610可由编码装置的残差处理器230执行,S1620至S1640可由编码装置的预测器220执行,S1650至S1680可由编码装置的残差处理器230执行,S1690可由编码装置的熵编码器240执行。图16中公开的方法可包括本文献中上面描述的实施方式。
参照图16,编码装置可推导LMCS码字(S1600)。编码装置可分别为多个仓推导LMCS码字。例如,上述lmcsCW[i]可对应于由编码装置推导的LMCS码字。
编码装置可生成LMCS相关信息(S1610)。编码装置可基于LMCS码字来生成LMCS相关信息。编码装置可推导可应用于对重构样本进行滤波的LMCS相关参数,并且可基于LMCS相关参数来生成LMCS相关信息。例如,LMCS相关信息可包括关于上述亮度映射(例如,前向映射、反向映射和线性映射)的信息、关于色度残差缩放和/或与LMCS(或整形或整形器)有关的索引(例如,最大仓索引和最小仓索引)的信息、关于色度残差缩放增量值的绝对值的信息、关于色度残差缩放增量值的符号的信息和/或关于共享相同色度残差缩放索引的块的数量的信息。
编码装置可推导当前画面中的当前块的预测模式(S1620)。编码装置可为当前块推导预测模式的本文献中所公开的各种模式中的至少一种。
编码装置可基于预测模式来生成预测相关信息(S1630)。预测相关信息可包括关于针对当前块执行的预测过程的信息。例如,预测信息可包括预测模式/类型信息。
编码装置可基于预测模式来生成预测色度样本(S1640)。编码装置可基于当前块的原始色度样本和预测色度样本来推导残差色度样本(S1650)。例如,编码装置可基于预测色度样本与原始色度样本之间的差来推导残差色度样本。
此外,编码装置可基于预测模式来生成预测亮度样本。在这种情况下,可应用本文献中所公开的各种预测方法(例如,帧间预测或帧内预测)。
编码装置可生成映射的预测亮度样本。例如,编码装置可推导用于亮度映射的枢轴点的输入值和映射值(输出值),并且可基于输入值和映射值来生成映射的预测亮度样本。在一个示例中,编码装置可基于第一预测亮度样本来推导映射索引idxY,并且可基于与映射索引对应的枢轴点的输入值和映射值来生成初步映射的预测亮度样本。在另一示例中,可使用线性映射(线性整形、线性LMCS),可在线性映射中基于从两个枢轴点推导的前向映射缩放因子来生成映射的预测亮度样本,并且因此,索引推导过程可由于线性映射而被省略。
编码装置可基于映射的预测亮度样本来生成残差亮度样本。例如,编码装置可基于映射的预测亮度样本与原始亮度样本之间的差来推导残差亮度样本。
编码装置可生成重构亮度样本。编码装置可基于映射的预测亮度样本来生成重构亮度样本。详细地,编码装置可对残差亮度样本与映射的预测亮度样本求和,并且可基于求和结果来生成重构亮度样本。
编码装置可基于用于亮度映射的仓、LMCS码字和重构亮度样本来生成修改的重构亮度样本。编码装置可通过对重构亮度样本的反向映射过程来生成修改的重构亮度样本。例如,编码装置可在反向映射过程中基于重构亮度样本和/或分别为仓索引指定的映射值(例如,LmcsPivot[i],i=lmcs_min_bin_idx...LmcsMaxBinIdx+1)来推导反向映射索引(例如,invYIdx)。编码装置可基于指定给反向映射索引的映射值LmcsPivot[invYIdx]来生成修改的重构亮度样本。
编码装置可基于LMCS码字和亮度样本来推导用于亮度依赖色度残差缩放的色度残差缩放因子(S1660)。例如,编码装置可基于LMCS码字为多个仓推导色度残差缩放系数。编码装置可基于重构亮度样本来推导逆缩放(仓)索引(或分段函数索引,例如invYIdx)。编码装置可推导逆缩放索引所指示的色度残差缩放系数作为色度残差缩放因子。
编码装置可生成缩放的残差色度样本(S1670)。详细地,编码装置可推导色度残差缩放因子并且可基于色度残差缩放因子来生成缩放的残差色度样本。在这种情况下,编码端的色度残差缩放可被称为前向色度残差缩放。因此,由编码装置推导的色度残差缩放因子可被称为前向色度残差缩放因子,并且可生成前向缩放的残差色度样本。
编码装置可推导残差信息(S1680)。编码装置可基于缩放的残差色度样本和/或残差亮度样本来推导残差信息。编码装置可基于对缩放的残差色度样本和残差亮度样本的变换过程来推导变换系数。例如,变换过程可包括DCT、DST、GBT或CNT中的至少一个。编码装置可基于变换系数的量化过程来推导量化的变换系数。量化的变换系数可具有基于系数扫描顺序的一维向量形式。编码装置可生成示出量化的变换系数的残差信息。可通过诸如指数Golomb、CAVLC和CABAC的各种编码方法来生成残差信息。
编码装置可对图像/视频信息进行编码(S1690)。图像信息可包括LMCS相关信息和/或残差信息。例如,LMCS相关信息可包括线性LMCS相关信息。例如,可基于线性LMCS相关信息来推导至少一个LMCS码字。编码的视频/图像信息可按比特流的形式输出。比特流可通过存储介质的网络发送至解码装置。
图像/视频信息可包括根据本文献的实施方式的各种信息项。例如,图像/视频信息可包括上述表1至表56中的至少任一个中公开的信息。
在一个实施方式中,图像信息可包括关于色度残差缩放增量值的绝对值的信息(例如,cu_crs_delta_abs)和关于色度残差缩放增量值的符号的信息(例如,cu_crs_delta_sign_flag)。例如,关于色度残差缩放增量值的绝对值的信息和关于色度残差缩放增量值的符号的信息可以是色度残差缩放因子的信息。即,关于色度残差缩放增量值的绝对值的信息和关于色度残差缩放增量值的符号的信息可示出色度残差缩放因子。
在一个实施方式中,图像信息可包括APS。APS可包括LMCS数据字段。LMCS数据字段可包括LMCS相关信息。
在一个实施方式中,图像信息可包括SPS。SPS可包括示出LMCS数据字段是否被启用的第一LMCS启用标志。
在一个实施方式中,图像信息可包括头信息。在这种情况下,头信息可以是关于切片头或画面头的信息。基于第一LMCS启用标志的值为1的事实,头信息可包括示出画面中LMCS数据字段是否被启用的第二LCMS启用标志以及示出当前画面所参考的LMCS APS的ID的LMCS相关APS ID信息。
在一个实施方式中,基于第二LMCS启用标志的值为1的事实,LMCS相关APS ID信息可包括在头信息中。
在一个实施方式中,当当前块是单树架构或双树架构时(当当前块是单独的树架构并且当前块以单独的树编码时),示出对于当前块是否应用色度残差缩放的色度残差缩放启用标志可包括在头信息(可由编码装置生成)中。当对于当前画面、当前切片和/或当前块应用色度残差缩放时,色度残差缩放启用标志的值可为1。
在一个实施方式中,当第一LMCS启用标志和第二LMCS启用标志的值为1时,色度残差缩放启用标志可包括在头信息中。
在一个实施方式中,图像信息可包括关于共享相同色度残差缩放索引的块的数量的信息(表54和/或表55的slice_cs_horiz_size_munus1或slice_cs_vertic_size_munus1)。可基于关于共享相同色度残差缩放索引的块的数量的信息来推导色度残差缩放因子。
在一个实施方式中,关于共享相同色度残差缩放索引的块的数量的信息可包括表54和/或表55的关于共享相同色度残差缩放索引的块的水平数量的信息slice_cs_horiz_size_munus1和/或表54和/或表55的关于共享相同色度残差缩放索引的块的垂直数量的信息slice cs vertic size munus1。
在一个实施方式中,编码装置可生成用于色度残差缩放的分段索引。编码装置可基于分段索引来推导色度残差缩放因子。编码装置可基于残差色度样本和色度残差缩放因子来生成缩放的残差色度样本。
在一个实施方式中,当当前块是单树架构或双树架构时(当当前块是单独的树架构并且当前块以单独的树编码时),可由编码装置生成示出是否对当前块应用色度残差缩放的色度残差缩放启用标志。当对当前画面、当前切片和/或当前块应用色度残差缩放时,色度残差缩放启用标志的值可为1。
在一个实施方式中,色度残差缩放因子可以是单个色度残差缩放因子。
在一个实施方式中,图像信息可包括SPS(序列参数集)。SPS可包括示出线性LMCS是否被启用的线性LMCS启用标志。
在一个实施方式中,可基于关于LMCS数据的信息来推导最小仓索引(例如,lmcs_min_bin_idx)和/或最大仓索引(例如,LmcsMaxBinIdx)。可基于最小仓索引来推导第一映射值LmcsPivot[lmcs_min_bin_idx]。可基于最大仓索引来推导第二映射值LmcsPivot[LmcsMaxBinIdx]或LmcsPivot[LmcsMaxBinIdx+1]。重构亮度样本(例如,表36或37中的lumaSample)的值可在第一映射值至第二映射值的范围内。在一个实施方式中,所有重构亮度样本的值可在第一映射值至第二映射值的范围内。在另一实施方式中,重构亮度样本的一些样本的值可在第一映射值至第二映射值的范围内。
在一个实施方式中,关于LMCS数据的信息可包括关于LMCS数据字段和线性LMCS的信息。关于线性LMCS的信息可被称为关于线性映射的信息。LMCS数据字段可包括示出是否应用线性LMCS的线性LMCS标志。当线性LMCS标志的值为1时,可基于关于线性LMCS的信息来生成映射的预测亮度样本。
在一个实施方式中,关于线性LMCS的信息可包括关于第一枢轴点(例如,图11中的P1)的信息和关于第二枢轴点(例如,图11中的P2)的信息。例如,第一枢轴点的输入值和映射值可分别是最小输入值和最小映射值。第二枢轴点的输入值和映射值可分别是最大输入值和最大映射值。最小输入值和最大输入值之间的输入值可被线性地映射。
在一个实施方式中,图像信息可包括关于最大输入值的信息和关于最大映射值的信息。最大输入值可与关于最大输入值的信息(例如,表33中的lmcs_max_input)的值相同。最大映射值可与关于最大映射值的信息(例如,表33中的lmcs_max_mapped)的值相同。
在一个实施方式中,关于线性映射的信息可包括关于第二枢轴点的输入增量值的信息(例如,表35中的lmcs_max_input_delta)和关于第二枢轴点的映射增量值的信息(例如,表35中的lmcs_max_mapped_delta)。最大输入值可基于第二枢轴点的输入增量值来推导,最大映射值可基于第二枢轴点的映射增量值来推导。
在一个实施方式中,最大输入值和最大映射值可基于包括在上述表36中的至少一个式来推导。
在一个实施方式中,生成映射的预测亮度样本的步骤可包括为预测亮度样本推导前向映射缩放因子(例如,上述ScaleCoeffSingle)的步骤以及基于前向映射缩放因子生成映射的预测亮度样本的步骤。前向映射缩放因子可以是用于预测亮度样本的单个因子。
在一个实施方式中,前向映射缩放因子可基于包括在上述表36和/或表38中的至少一个式来推导。
在一个实施方式中,映射的预测亮度样本可基于包括在上述表38中的至少一个式来推导。
在一个实施方式中,编码装置可为重构亮度样本(例如,上述lumaSample)推导反向映射缩放因子(例如,上述InvScaleCoeffSingle)。此外,编码装置可基于重构样本和反向映射缩放因子来生成修改的重构亮度样本(例如,invSample)。反向映射缩放因子可以是用于重构亮度样本的单个因子。
在一个实施方式中,反向映射缩放因子可使用基于重构亮度样本推导的分段索引来推导。
在一个实施方式中,分段索引可基于上述表50来推导。即,可从分段索引为最小仓索引时至分段索引为最大仓索引时重复地执行包括在表50中的比较过程lumaSample<LmcsPivot[idxYInv+1]。
在一个实施方式中,反向映射缩放因子可基于包括在上述表33、表34、表35和表36中的至少一个式或者式11或式12来推导。
在一个实施方式中,修改的重构亮度样本可基于式20、式21、表39和/或表40来推导。
在一个实施方式中,LMCS相关信息可包括关于用于推导映射的预测亮度样本的仓的数量的信息(例如,表41的lmcs_num_bins_minus1)。例如,用于亮度映射的枢轴点的数量可被设定为与仓的数量相同。在一个示例中,编码装置可分别根据仓的数量生成枢轴点的增量输入值和增量映射值。在一个示例中,基于增量输入值(例如,表41的lmcs_delta_input_cw[i])和增量映射值(例如,表41的lmcs_delta_mapped_cw[i])来推导枢轴点的输入值和映射值,并且可基于输入值(例如,表42的LmcsPivot_input[i])和映射值(例如,表42的LmcsPivot_mapped[i])来生成映射的预测亮度样本。
在一个实施方式中,编码装置可基于包括在LMCS相关信息中的至少一个LMCS码字和原始码字OrgCW来推导LMCS增量码字,并且可基于至少一个LMCS码字和原始码字来推导映射的亮度预测样本。在一个示例中,关于线性映射的信息可包括关于LMCS增量码字的信息。
在一个实施方式中,可基于LMCS增量码字和OrgCW的总和来推导至少一个LMCS码字,例如,OrgCW可为(1<<BitDepthY)/16,其中BitDepthY可示出亮度比特深度。本实施方式可以基于式12。
在一个实施方式中,至少一个LMCS码字可基于LMCS增量码字和OrgCW*(lmcs_max_bin_idx-lmcs_min_bin_idx+1)的总和来推导,lmcs_max_bin_idx和lmcs_min_bin_idx可分别是最大仓索引和最小仓索引,OrgCW可为(1<<BitDepthY)/16。本实施方式可基于式15和式16。
在一个实施方式中,至少一个LMCS码字可以是2的倍数。
在一个实施方式中,当重构亮度样本的亮度比特深度BitDepthY高于10时,至少一个LMCS码字可以是1<<(BitDepthY-10)的倍数。
在一个实施方式中,至少一个LMCS码字可在(OrgCW>>1)至(OrgCW<<1)-1的范围内。
图18和图19示意性地示出根据本文献的实施方式的图像/视频解码方法和相关组件的示例。图18所示的方法可由图3中公开的解码装置执行。详细地,例如,在图18中,S1800可由解码装置的熵解码器310执行,S1810可由解码装置的残差处理器320、预测器330和/或加法器340执行,S1820可由解码装置的预测器330执行,S1830可由解码装置的残差处理器320执行,S1840可由解码装置的残差处理器320、预测器330和/或加法器340执行,S1850可由解码装置的加法器340执行。图18中公开的方法可包括本文献中上面描述的实施方式。
参照图18,解码装置可接收/获得视频/图像信息(S1800)。视频/图像信息可包括LMCS相关信息、预测相关信息和/或残差信息。例如,LMCS相关信息可包括关于上述亮度映射(例如,前向映射、反向映射和线性映射)的信息、关于色度残差缩放的信息、与LMCS(或整形或整形器)有关的索引(例如,最大仓索引、最小仓索引和映射索引)、关于色度残差缩放增量值的绝对值的信息、关于色度残差缩放增量值的符号的信息和/或关于共享相同色度残差缩放索引的块的数量的信息。解码装置可通过比特流接收/获得图像/视频信息。
图像/视频信息可包括根据本文献的实施方式的各种信息项。例如,图像/视频信息可包括上述表1至表56中的至少任一个中公开的信息。
解码装置可基于LMCS相关信息来推导LMCS码字(S1810)。解码装置可基于LMCS相关信息来推导关于多个仓的信息和关于LMCS码字的信息。解码装置可分别为多个仓推导LMCS码字。例如,上述lmcsCW[i]可对应于基于LMCS相关信息推导的LMCS码字。
解码装置可生成预测亮度样本。解码装置可基于预测相关信息来推导当前块的预测模式并且可基于预测模式来推导当前块的预测亮度样本。在这种情况下,可应用本文献中公开的各种预测方法(例如,帧间预测或帧内预测)。
解码装置可生成预测色度样本(S1820)。解码装置可基于预测相关信息来为当前块推导预测模式并且可基于预测模式来推导当前块的预测色度样本。在这种情况下,可应用本文献中所公开的各种预测方法(例如,帧间预测或帧内预测)。
解码装置可基于残差信息来生成残差色度样本(S1830)。此外,解码装置可基于残差信息来生成残差亮度样本。详细地,解码装置可基于残差信息来推导量化的变换系数。量化的变换系数可具有基于系数扫描顺序的一维向量形式。解码装置可基于对量化的变换系数的解量化过程来推导变换系数。解码装置可基于变换系数来推导残差色度样本和/或残差亮度样本。
解码装置可生成映射的预测亮度样本。例如,解码装置可推导用于亮度映射的枢轴点的输入值和映射值(输出值),并且可基于输入值和映射值来生成映射的预测亮度样本。在一个示例中,解码装置可基于第一预测亮度样本来推导(前向)映射索引idxY,并且可基于与映射索引对应的枢轴点的输入值和映射值来生成初步映射的预测亮度样本。在另一示例中,可使用线性映射(线性成形、线性LMCS),可在线性映射中基于从两个枢轴点推导的前向映射缩放因子来生成映射的预测亮度样本,因此,索引推导过程可由于线性映射而被省略。
解码装置可生成重构亮度样本。解码装置可基于映射的预测亮度样本来生成重构亮度样本。详细地,解码装置可将残差亮度样本与映射的预测亮度样本求和,并且可基于求和结果生成重构亮度样本。
解码装置可基于LMCS码字和亮度样本来推导用于亮度依赖色度残差缩放的色度残差缩放因子(S1840)。例如,解码装置可为多个仓推导色度残差缩放系数(包括在表19和/或表20中的ChromaScaleCoeff[i])。解码装置可基于重构亮度样本来推导逆缩放(仓)索引(或分段函数索引)。解码装置可基于多个仓的色度残差缩放系数和逆缩放索引来推导色度残差缩放因子。在一个示例中,解码装置推导多个仓的色度残差缩放系数中的由逆缩放仓索引所指示的色度残差缩放系数作为色度残差缩放因子。逆缩放索引的推导可基于上述表51和/或表52来实现。
解码装置可生成缩放的残差色度样本。解码装置可基于残差色度样本和色度残差缩放因子来生成缩放的残差色度样本。例如,解码装置可基于残差色度样本与色度残差缩放因子的乘积(其绝对值)来生成缩放的残差色度样本。在这种情况下,与编码端相反,解码端的色度残差缩放可被称为反向色度残差缩放。因此,由解码装置推导的色度残差缩放因子可被称为反向色度残差缩放因子,并且可生成反向缩放的残差色度样本。
解码装置可生成重构色度样本(S1850)。解码装置可基于预测色度样本、残差色度样本和/或色度残差缩放因子来生成重构色度样本。详细地,解码装置可通过将缩放的残差色度样本与预测色度样本求和来生成重构色度样本。
解码装置可基于LMCS码字和重构亮度样本来生成修改的重构亮度样本。解码装置可通过对重构亮度样本的反向映射过程来生成修改的重构亮度样本。
在一个实施方式中,图像信息可包括关于色度残差缩放增量值的绝对值的信息(例如,cu_crs_delta_abs)和关于色度残差缩放增量值的符号的信息(例如,cu_crs_delta_sign_flag)。例如,关于色度残差缩放增量值的绝对值的信息和关于色度残差缩放增量值的符号的信息可以是色度残差缩放因子的信息。即,色度残差缩放因子可基于关于色度残差缩放增量值的绝对值的信息和关于色度残差缩放增量值的符号的信息来推导。
在一个实施方式中,图像信息可包括APS。例如,APS可包括LMCS数据字段。LMCS数据字段可包括LMCS相关信息。
在一个实施方式中,图像信息可包括SPS。SPS可包括示出LMCS数据字段是否被启用的第一LMCS启用标志。
在一个实施方式中,图像信息可包括头信息。在这种情况下,头信息可以是关于切片头或画面头的信息。基于第一LMCS启用标志的值为1的事实,头信息可包括示出画面中LMCS数据字段是否被启用的第二LMCS启用标志。
在一个实施方式中,基于第二LMCS启用标志的值为1的事实,LMCS相关APS ID信息可包括在头信息中。
在一个实施方式中,当当前块是单树架构或双树架构时(当当前块是单独的树架构并且当前块以单独的树编码时),示出对于当前块是否应用色度残差缩放的色度残差缩放启用标志可用信号通知。当对于当前画面、当前切片和/或当前块应用色度残差缩放时,色度残差缩放启用标志的值可为1。
在一个实施方式中,当第一LMCS启用标志和第二LMCS启用标志的值为1时,色度残差缩放启用标志可包括在头信息中。
在一个实施方式中,图像信息可包括关于共享相同色度残差缩放索引的块的数量的信息(表54和/或表55的slice_cs_horiz_size_munus1或slice_cs_vertic_size_munus1)。可基于关于共享相同色度残差缩放索引的块的数量的信息来推导色度残差缩放因子。
在一个实施方式中,关于共享相同色度残差缩放索引的块的数量的信息可包括表54和/或表55的关于共享相同色度残差缩放索引的块的水平数量的信息slice_cs_horiz_size_munus1和/或表54和/或表55的关于共享相同色度残差缩放索引的块的垂直数量的信息slice_cs_vertic_size_munus1。
在一个实施方式中,分段索引(例如,表35、表36或表37的idxYInv)可基于关于LMCS数据的信息来识别。解码装置可基于分段索引来推导色度残差缩放因子。解码装置可基于残差色度样本和色度残差缩放因子来生成缩放的残差色度样本。
在一个实施方式中,当当前块是单树架构或双树架构时(当当前块是单独的树架构并且当前块以单独的树编码时),可用信号通知示出是否对当前块应用色度残差缩放的色度残差缩放启用标志。当对当前画面、当前切片和/或当前块应用色度残差缩放时,色度残差缩放启用标志的值可为1。
在一个实施方式中,色度残差缩放因子可以是单个色度残差缩放因子。
在一个实施方式中,基于类型信息的值为1的事实,APS可包括LMCS数据字段,LMCS数据字段包括LMCS参数。
在一个实施方式中,图像信息可包括头信息。在这种情况下,头信息可以是画面头(或切片头)。头信息可包括LMCS相关APS ID信息。LMCS相关APS ID信息可示出当前画面、当前块或当前切片的LMCS APS的标识符信息。即,LMCS相关APS ID信息的值可与LMCS APS的标识符信息的值相同。例如,LMCS相关APS ID信息的值可在0至3的范围内。即,LMCS相关APSID信息的值可为0、1、2或3。
在一个实施方式中,可基于关于LMCS数据的信息来推导最小仓索引(例如,lmcs_min_bin_idx)和/或最大仓索引(例如,LmcsMaxBinIdx)。可基于最小仓索引来推导第一映射值LmcsPivot[lmcs_min_bin_idx]。可基于最大仓索引来推导第二映射值LmcsPivot[LmcsMaxBinIdx]或LmcsPivot[LmcsMaxBinIdx+1]。重构亮度样本(例如,表51或表52中的lumaSample)的值可在第一映射值至第二映射值的范围内。在一个实施方式中,所有重构亮度样本的值可在第一映射值至第二映射值的范围内。在另一实施方式中,重构亮度样本的一些样本的值可在第一映射值至第二映射值的范围内。
在一个实施方式中,图像信息可包括SPS(序列参数集)。SPS可包括示出线性LMCS是否被启用的线性LMCS启用标志。
在一个实施方式中,色度残差缩放因子可以是单个色度残差缩放因子。
在一个实施方式中,关于LMCS数据的信息可包括关于LMCS数据字段和线性LMCS的信息。关于线性LMCS的信息可被称为关于线性映射的信息。LMCS数据字段可包括示出是否应用线性LMCS的线性LMCS标志。当线性LMCS标志的值为1时,可基于关于线性LMCS的信息来生成映射的预测亮度样本。
在一个实施方式中,关于线性LMCS的信息可包括关于第一枢轴点(例如,图11中的P1)的信息和关于第二枢轴点(例如,图11中的P2)的信息。例如,第一枢轴点的输入值和映射值可分别是最小输入值和最小映射值。第二枢轴点的输入值和映射值可分别是最大输入值和最大映射值。最小输入值和最大输入值之间的输入值可线性地映射。
在实施方式中,图像信息可包括关于最大输入值的信息和关于最大映射值的信息。最大输入值可与关于最大输入值的信息(例如,表33中的lmcs_max_input)的值相同。最大映射值可与关于最大映射值的信息(例如,表33中的lmcs_max_mapped)的值相同。
在实施方式中,关于线性映射的信息可包括关于第二枢轴点的输入增量值的信息(例如,表35的lmcs_max_input_delta)以及关于第二枢轴点的映射增量值的信息(例如,表35的lmcs_max_mapped_delta)。可基于第二枢轴点的输入增量值来推导最大输入值,并且可基于第二枢轴点的映射增量值来推导最大映射值。
在实施方式中,最大输入值和最大映射值可基于包括在上述表36中的至少一个式来推导。
在一个实施方式中,生成映射的预测亮度样本包括:推导预测亮度样本的前向映射缩放因子(即,ScaleCoeffSingle);以及基于前向映射缩放因子来生成映射的预测亮度样本。前向映射缩放因子可以是预测亮度样本的单个因子。
在一个实施方式中,可使用基于重构亮度样本推导的分段索引来推导反向映射缩放因子。
在一个实施方式中,可基于上述表51来推导分段索引。即,可从作为最小仓索引的分段索引到作为最大仓索引的分段索引迭代地执行包括在表51中的比较处理(lumaSample<LmcsPivot[idxYInv+1])。
在一个实施方式中,前向映射缩放因子可基于包括在上述表36和/或表38中的至少一个式来推导。
在一个实施方式中,映射的预测亮度样本可基于包括在上述表38中的至少一个式来推导。
在一个实施方式中,解码设备可推导重构亮度样本(即,lumaSample)的反向映射缩放因子(即,InvScaleCoeffSingle)。另外,解码设备可基于重构亮度样本和反向映射缩放因子来生成修改的重构亮度样本(即,invSample)。反向映射缩放因子可以是重构亮度样本的单个因子。
在一个实施方式中,反向映射缩放因子可基于包括在上述表33、表34、表35和表36中的至少一个式或者式11或式12来推导。
在一个实施方式中,修改的重构亮度样本可基于上述式20、式21、表39和/或表40来推导。
在一个实施方式中,LMCS相关信息可包括关于用于推导映射的预测亮度样本的仓的数量的信息(即,表41中的lmcs_num_bins_minus1)。例如,亮度映射的枢轴点的数量可被设定为等于仓的数量。在一个示例中,解码设备可分别根据仓的数量生成枢轴点的增量输入值和增量映射值。在一个示例中,基于增量输入值(即,表41中的lmcs_delta_input_cw[i])和增量映射值(即,表41中的lmcs_delta_mapped_cw[i])来推导枢轴点的输入值和映射值,并且可基于输入值(即,表42的LmcsPivot_input[i])和映射值(即,表42的LmcsPivot_mapped[i])来生成映射的预测亮度样本。
在一个实施方式中,解码设备可基于至少一个LMCS码字和包括在LMCS相关信息中的原始码字(OrgCW)来推导LMCS增量码字,并且可基于至少一个LMCS码字和原始码字来推导映射的亮度预测样本。在一个示例中,关于线性映射的信息可包括关于LMCS增量码字的信息。
在一个实施方式中,可基于LMCS增量码字和OrgCW的总和来推导至少一个LMCS码字,例如,OrgCW为(1<<BitDepthY)/16,其中BitDepthY表示亮度比特深度。此实施方式可基于式14。
在一个实施方式中,可基于LMCS增量码字和OrgCW*(lmcs_max_bin_idx-lmcs_min_bin_idx+1)的总和来推导至少一个LMCS码字,例如,lmcs_max_bin_idx和lmcs_min_bin_idx分别是最大仓索引和最小仓索引,OrgCW可为(1<<BitDepthY)/16。此实施方式可基于式15和式16。
在一个实施方式中,至少一个LMCS码字可以是2的倍数。
在一个实施方式中,当重构亮度样本的亮度比特深度(BitDepthY)高于10时,至少一个LMCS码字可以是1<<(BitDepthY-10)的倍数。
在一个实施方式中,至少一个LMCS码字可在从(OrgCW>>1)至(OrgCW<<1)-1的范围内。
在上述段落中,关于LMCS数据的信息可以与关于LMCS的信息相同。
在上述实施方式中,基于具有一系列步骤或方框的流程图来描述方法。本公开不限于上述步骤或方框的顺序。一些步骤或方框可同时发生或按照与如上所述的其它步骤或方框不同的顺序发生。此外,本领域技术人员将理解,上述流程图中所示的步骤不是排他性的,可包括另外的步骤,或者可删除流程图中的一个或更多个步骤,而不影响本公开的范围。
根据本文献的上述实施方式的方法可按软件形式实现,并且根据本文献的编码装置和/或解码装置例如可被包括在执行TV、计算机、智能电话、机顶盒、显示装置等的图像处理的装置中。
当本文献中的实施方式以软件实现时,上述方法可被实现为执行上述功能的模块(进程、函数等)。模块可被存储在存储器中并由处理器执行。存储器可位于处理器的内部或外部,并且可通过各种熟知手段联接到处理器。处理器可包括专用集成电路(ASIC)、其它芯片组、逻辑电路和/或数据处理装置。存储器可包括只读存储器(ROM)、随机存取存储器(RAM)、闪存、存储卡、存储介质和/或其它存储装置。即,本文献中描述的实施方式可在处理器、微处理器、控制器或芯片上实现和执行。例如,各个附图中所示的功能单元可在计算机、处理器、微处理器、控制器或芯片上实现和执行。在这种情况下,关于用于实现的指令或算法的信息可被存储在数字存储介质中。
另外,应用了本公开的解码设备和编码设备可被包括在多媒体广播发送/接收设备、移动通信终端、家庭影院视频设备、数字影院视频设备、监视相机、视频聊天设备、实时通信设备(例如,视频通信)、移动流设备、存储介质、摄像机、VoD服务提供设备、顶置(OTT)视频设备、互联网流服务提供设备、三维(3D)视频设备、电话会议视频设备、运输工具用户设备(即,车辆用户设备、飞机用户设备、船舶用户设备等)和医疗视频设备中,并且可用于处理视频信号和数据信号。例如,顶置(OTT)视频设备可包括游戏机、蓝光播放器、互联网访问TV、家庭影院系统、智能电话、平板PC、数字视频记录仪(DVR)等。
另外,应用了本文献的处理方法可按照要由计算机执行的程序的形式生成,并且可被存储在计算机可读记录介质中。具有根据本公开的数据结构的多媒体数据也可被存储在计算机可读记录介质中。计算机可读记录介质包括存储计算机系统可读的数据的所有类型的存储装置。例如,计算机可读记录介质可包括BD、通用串行总线(USB)、ROM、PROM、EPROM、EEPROM、RAM、CD-ROM、磁带、软盘和光学数据存储装置。另外,计算机可读记录介质包括以载波的形式实现的介质(即,通过互联网的传输)。另外,通过该编码方法生成的比特流可被存储在计算机可读记录介质中或者可经由有线/无线通信网络发送。
另外,本文献的实施方式可根据程序代码以计算机程序产品来实现,并且可通过本文献的实施方式在计算机中执行程序代码。程序代码可被存储在计算机可读的载体上。
图20示出本文献中公开的实施方式可应用于的内容流系统的示例。
参照图20,应用了本文献的实施方式的内容流系统可主要包括编码服务器、流服务器、网络服务器、媒体存储装置、用户装置和多媒体输入装置。
编码服务器将从多媒体输入装置(例如,智能电话、相机、摄像机等)输入的内容压缩为数字数据以生成比特流并将比特流发送到流服务器。作为另一示例,当多媒体输入装置(例如,智能电话、相机、摄像机等)直接生成比特流时,可省略编码服务器。
可通过应用了本公开的实施方式的编码方法或比特流生成方法来生成比特流,并且在发送或接收比特流的过程中,流服务器可暂时存储比特流。
流服务器通过网络服务器基于用户的请求将多媒体数据发送到用户装置,并且网络服务器用作告知用户服务的介质。当用户向网络服务器请求期望的服务时,网络服务器将其传送至流服务器,并且流服务器将多媒体数据发送到用户。在这种情况下,内容流系统可包括单独的控制服务器。在这种情况下,控制服务器用于控制内容流系统中的装置之间的命令/响应。
流服务器可从媒体存储装置和/或编码服务器接收内容。例如,当从编码服务器接收内容时,内容可实时地接收。在这种情况下,为了提供平滑的流服务,流服务器可将比特流存储达预定时间。
用户装置的示例可包括移动电话、智能电话、膝上型计算机、数字广播终端、个人数字助理(PDA)、便携式多媒体播放器(PMP)、导航、石板PC、平板PC、超级本、可穿戴装置(例如,智能手表、智能眼镜、头戴式显示器)、数字TV、台式计算机、数字标牌等。内容流系统中的各个服务器可作为分布式服务器来操作,在这种情况下从各个服务器接收的数据可被分布。
内容流系统中的各个服务器可作为分布式服务器来操作,并且在这种情况下,从各个服务器接收的数据可被分布和处理。
本文中所描述的权利要求可按各种方式组合。例如,本文献的方法权利要求的技术特征可被组合并实现为设备,并且本文献的设备权利要求的技术特征可被组合并实现为方法。另外,本文献的方法权利要求的技术特征和设备权利要求的技术特征可被组合以实现为设备,本文献的方法权利要求的技术特征和设备权利要求的技术特征可被组合并实现为方法。
Claims (4)
1.一种用于图像解码的解码设备,所述解码设备包括:
存储器;以及
至少一个处理器,所述至少一个处理器连接到所述存储器,所述至少一个处理器被配置为:
从比特流获得包括亮度映射与色度缩放LMCS相关信息、预测相关信息和残差信息的图像信息;
基于所述LMCS相关信息来推导LMCS码字;
基于所述预测相关信息来将帧间预测模式确定为当前画面中的当前块的预测模式;
基于所述预测模式来生成所述当前块的预测色度样本;
基于所述残差信息来推导所述当前块的变换系数;
基于所述变换系数来生成所述当前块的残差色度样本;
基于所述LMCS码字和亮度样本来推导用于亮度依赖色度残差缩放的色度残差缩放因子;以及
基于所述色度残差缩放因子来生成所述当前块的重构色度样本,
其中,所述图像信息包括关于色度残差缩放增量值的绝对值的信息和关于所述色度残差缩放增量值的符号的信息,并且
其中,基于关于所述色度残差缩放增量值的绝对值的信息和关于所述色度残差缩放增量值的符号的信息来推导所述色度残差缩放因子。
2.一种用于图像编码的编码设备,所述编码设备包括:
存储器;以及
至少一个处理器,所述至少一个处理器连接到所述存储器,所述至少一个处理器被配置为:
推导亮度映射与色度缩放LMCS码字;
基于所述LMCS码字来生成LMCS相关信息;
将帧间预测模式确定为当前画面中的当前块的预测模式;
基于所述预测模式来生成预测相关信息;
基于所述预测模式来生成所述当前块的预测色度样本;
基于所述预测色度样本来生成所述当前块的残差色度样本;
基于所述LMCS码字和亮度样本来推导用于亮度依赖色度残差缩放的色度残差缩放因子;
基于所述色度残差缩放因子来生成所述当前块的缩放的残差色度样本;
基于所述缩放的残差色度样本来推导所述当前块的变换系数;
基于所述变换系数来生成残差信息;以及
对包括所述LMCS相关信息、所述预测相关信息和所述残差信息的图像信息进行编码,
其中,所述图像信息包括关于色度残差缩放增量值的绝对值的信息和关于所述色度残差缩放增量值的符号的信息,并且
其中,关于所述色度残差缩放增量值的绝对值的信息和关于所述色度残差缩放增量值的符号的信息表示所述色度残差缩放因子。
3.一种计算机可读存储介质,所述计算机可读存储介质存储由根据权利要求2所述的用于图像编码的编码设备生成的比特流。
4.一种用于发送图像的数据的设备,所述设备包括:
至少一个处理器,所述至少一个处理器被配置为获得所述图像的比特流,其中,所述比特流是基于以下操作来生成的:推导亮度映射与色度缩放LMCS码字,基于所述LMCS码字来生成LMCS相关信息,将帧间预测模式确定为当前画面中的当前块的预测模式,基于所述预测模式来生成预测相关信息,基于所述预测模式来生成预测色度样本,基于所述预测色度样本来生成残差色度样本,基于所述LMCS码字和亮度样本来推导用于亮度依赖色度残差缩放的色度残差缩放因子,基于所述色度残差缩放因子来生成缩放的残差色度样本,基于所述缩放的残差色度样本来推导变换系数,基于所述变换系数来生成残差信息,以及对包括所述LMCS相关信息、所述预测相关信息和所述残差信息的图像信息进行编码;以及
发送器,所述发送器被配置为发送包括所述比特流的所述数据,
其中,所述图像信息包括自适应参数集APS、关于色度残差缩放增量值的绝对值的信息和关于所述色度残差缩放增量值的符号的信息,并且
其中,关于所述色度残差缩放增量值的绝对值的信息和关于所述色度残差缩放增量值的符号的信息表示所述色度残差缩放因子。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962871070P | 2019-07-05 | 2019-07-05 | |
US62/871,070 | 2019-07-05 | ||
CN202080060682.9A CN114342381B (zh) | 2019-07-05 | 2020-07-06 | 图像解码和编码方法及用于图像的数据的发送方法 |
PCT/KR2020/008799 WO2021006580A1 (ko) | 2019-07-05 | 2020-07-06 | 루마 샘플들의 맵핑 및 크로마 샘플들의 스케일링 기반 비디오 또는 영상 코딩 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202080060682.9A Division CN114342381B (zh) | 2019-07-05 | 2020-07-06 | 图像解码和编码方法及用于图像的数据的发送方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117241026A true CN117241026A (zh) | 2023-12-15 |
Family
ID=74114297
Family Applications (5)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311444206.9A Pending CN117241026A (zh) | 2019-07-05 | 2020-07-06 | 解码设备和编码设备、存储介质及发送图像的数据的设备 |
CN202311439041.6A Pending CN117278748A (zh) | 2019-07-05 | 2020-07-06 | 图像解码和编码方法、存储介质及数据的发送方法 |
CN202080060682.9A Active CN114342381B (zh) | 2019-07-05 | 2020-07-06 | 图像解码和编码方法及用于图像的数据的发送方法 |
CN202311440285.6A Pending CN117241025A (zh) | 2019-07-05 | 2020-07-06 | 图像解码和编码方法、存储介质及数据的发送方法 |
CN202311444046.8A Pending CN117241024A (zh) | 2019-07-05 | 2020-07-06 | 解码设备和编码设备、存储介质及发送图像的数据的设备 |
Family Applications After (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311439041.6A Pending CN117278748A (zh) | 2019-07-05 | 2020-07-06 | 图像解码和编码方法、存储介质及数据的发送方法 |
CN202080060682.9A Active CN114342381B (zh) | 2019-07-05 | 2020-07-06 | 图像解码和编码方法及用于图像的数据的发送方法 |
CN202311440285.6A Pending CN117241025A (zh) | 2019-07-05 | 2020-07-06 | 图像解码和编码方法、存储介质及数据的发送方法 |
CN202311444046.8A Pending CN117241024A (zh) | 2019-07-05 | 2020-07-06 | 解码设备和编码设备、存储介质及发送图像的数据的设备 |
Country Status (4)
Country | Link |
---|---|
US (3) | US11695942B2 (zh) |
KR (1) | KR20220017425A (zh) |
CN (5) | CN117241026A (zh) |
WO (1) | WO2021006580A1 (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020177702A1 (en) * | 2019-03-04 | 2020-09-10 | Beijing Bytedance Network Technology Co., Ltd. | Two-level signaling of filtering information in video processing |
CN117241026A (zh) * | 2019-07-05 | 2023-12-15 | Lg电子株式会社 | 解码设备和编码设备、存储介质及发送图像的数据的设备 |
CN115997382A (zh) * | 2020-06-24 | 2023-04-21 | 北京达佳互联信息技术有限公司 | 用于针对视频编解码的预测相关残差缩放的方法和设备 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101791078B1 (ko) * | 2010-04-16 | 2017-10-30 | 에스케이텔레콤 주식회사 | 영상 부호화/복호화 장치 및 방법 |
CN115065823A (zh) * | 2012-07-02 | 2022-09-16 | 韩国电子通信研究院 | 视频编码/解码方法和非暂时性计算机可读记录介质 |
US9648330B2 (en) * | 2013-07-15 | 2017-05-09 | Qualcomm Incorporated | Inter-color component residual prediction |
US10397607B2 (en) * | 2013-11-01 | 2019-08-27 | Qualcomm Incorporated | Color residual prediction for video coding |
CN113453000B (zh) * | 2016-07-22 | 2024-01-12 | 夏普株式会社 | 使用自适应分量缩放对视频数据进行编码的系统和方法 |
US10652575B2 (en) * | 2016-09-15 | 2020-05-12 | Qualcomm Incorporated | Linear model chroma intra prediction for video coding |
WO2019022568A1 (ko) * | 2017-07-28 | 2019-01-31 | 한국전자통신연구원 | 영상 처리 방법, 그를 이용한 영상 부호화/복호화 방법 및 그 장치 |
CN113574889B (zh) * | 2019-03-14 | 2024-01-12 | 北京字节跳动网络技术有限公司 | 环路整形信息的信令和语法 |
JP7302009B2 (ja) * | 2019-04-18 | 2023-07-03 | 北京字節跳動網絡技術有限公司 | クロスコンポーネントモードの利用可能性に対する制約 |
KR102641796B1 (ko) * | 2019-05-08 | 2024-03-04 | 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 | 교차-성분 코딩의 적용가능성에 대한 조건들 |
CN113785574B (zh) * | 2019-05-30 | 2022-10-11 | 北京字节跳动网络技术有限公司 | 色度分量的自适应环路滤波 |
EP3973707A4 (en) | 2019-06-22 | 2022-08-31 | Beijing Bytedance Network Technology Co., Ltd. | CHROMA REST SCALE SYNTAX ELEMENT |
CN117241026A (zh) * | 2019-07-05 | 2023-12-15 | Lg电子株式会社 | 解码设备和编码设备、存储介质及发送图像的数据的设备 |
-
2020
- 2020-07-06 CN CN202311444206.9A patent/CN117241026A/zh active Pending
- 2020-07-06 WO PCT/KR2020/008799 patent/WO2021006580A1/ko active Application Filing
- 2020-07-06 CN CN202311439041.6A patent/CN117278748A/zh active Pending
- 2020-07-06 CN CN202080060682.9A patent/CN114342381B/zh active Active
- 2020-07-06 CN CN202311440285.6A patent/CN117241025A/zh active Pending
- 2020-07-06 CN CN202311444046.8A patent/CN117241024A/zh active Pending
- 2020-07-06 KR KR1020217042554A patent/KR20220017425A/ko not_active Application Discontinuation
-
2021
- 2021-12-31 US US17/566,971 patent/US11695942B2/en active Active
-
2023
- 2023-04-26 US US18/139,479 patent/US11930192B2/en active Active
-
2024
- 2024-01-16 US US18/413,610 patent/US20240163460A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
CN114342381B (zh) | 2023-11-17 |
CN114342381A (zh) | 2022-04-12 |
US11695942B2 (en) | 2023-07-04 |
KR20220017425A (ko) | 2022-02-11 |
WO2021006580A1 (ko) | 2021-01-14 |
US20230308664A1 (en) | 2023-09-28 |
CN117278748A (zh) | 2023-12-22 |
CN117241024A (zh) | 2023-12-15 |
US20240163460A1 (en) | 2024-05-16 |
US20220124353A1 (en) | 2022-04-21 |
CN117241025A (zh) | 2023-12-15 |
US11930192B2 (en) | 2024-03-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114342381B (zh) | 图像解码和编码方法及用于图像的数据的发送方法 | |
CN113412616B (zh) | 基于亮度映射与色度缩放的视频或图像编译 | |
CN114128273B (zh) | 图像解码和编码方法及用于图像的数据的发送方法 | |
CN113475073B (zh) | 基于亮度映射的视频或图像编译 | |
US20230328264A1 (en) | Video or image coding based on mapping of luma samples and scaling of chroma samples | |
US11889082B2 (en) | Video or image coding based on luma mapping and chroma scaling | |
CN114128272B (zh) | 基于亮度样本的映射和色度样本的缩放的视频或图像编码 | |
CN114270823A (zh) | 基于亮度映射和色度缩放的视频或图像编码 | |
CN114270851A (zh) | 基于亮度映射的视频或图像编码 | |
CN114391258B (zh) | 基于亮度映射的视频或图像编码 | |
CN114303368A (zh) | 基于亮度映射和色度缩放的视频或图像编码 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |