CN113475073B - 基于亮度映射的视频或图像编译 - Google Patents

基于亮度映射的视频或图像编译 Download PDF

Info

Publication number
CN113475073B
CN113475073B CN202080012555.1A CN202080012555A CN113475073B CN 113475073 B CN113475073 B CN 113475073B CN 202080012555 A CN202080012555 A CN 202080012555A CN 113475073 B CN113475073 B CN 113475073B
Authority
CN
China
Prior art keywords
value
lmcs
information
index
samples
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202080012555.1A
Other languages
English (en)
Other versions
CN113475073A (zh
Inventor
赵杰
金昇焕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Priority to CN202410896884.7A priority Critical patent/CN118694952A/zh
Priority to CN202410898259.6A priority patent/CN118694953A/zh
Priority to CN202410896800.XA priority patent/CN118694951A/zh
Priority to CN202410897969.7A priority patent/CN118741136A/zh
Publication of CN113475073A publication Critical patent/CN113475073A/zh
Application granted granted Critical
Publication of CN113475073B publication Critical patent/CN113475073B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • H04N19/82Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Color Television Systems (AREA)
  • Processing Of Color Television Signals (AREA)

Abstract

根据本文的公开,可以简化推导用于逆亮度映射和/或色度残差缩放的索引的过程,并且可以应用线性LMCS。因此,可以降低LMCS的复杂度,并且可以提高视频/图像编译的效率。

Description

基于亮度映射的视频或图像编译
技术领域
本文涉及基于亮度映射的视频或图像编译。
背景技术
最近,在各种领域中对诸如4K或8K超高清(UHD)图像/视频的高分辨率、高质量图像/视频的需求不断增加。随着图像/视频分辨率或质量变得更高,与传统图像/视频数据相比发送相对更多的信息或比特。因此,如果图像/视频数据经由诸如现有有线/无线宽带线路的介质发送或被存储在传统存储介质中,则传输和存储的成本容易增加。
此外,对虚拟现实(VR)和人工现实(AR)内容以及诸如全息图的沉浸式媒体的兴趣和需求日益增长;并且表现出与实际图像/视频不同的图像/视频特性的图像/视频(例如,游戏图像/视频)的广播也日益增长。
因此,需要高度高效的图像/视频压缩技术来有效地压缩并发送、存储或播放如上所述显示出各种特性的高分辨率、高质量图像/视频。
此外,执行亮度映射与色度缩放(LMCS)过程以提高压缩效率并且增加主/客观视觉质量,以及存在增加LMCS过程的效率的讨论。
发明内容
技术方案
根据本文的实施例,提供了一种提高图像编译效率的方法和装置。
根据本文的实施例,提供了高效的滤波应用方法和装置。
根据本文的实施例,提供了高效的LMCS应用方法和装置。
根据本文的实施例,可以约束LMCS码字(或其范围)。
根据本文的实施例,可以使用在LMCS的色度缩放中直接发信号告知的单个色度残差缩放因子。
根据本文的实施例,可以使用线性映射(线性LMCS)。
根据本文的实施例,可以明确地发信号告知关于线性映射所需的轴心点的信息。
根据本文的实施例,灵活数量的bin可以用于亮度映射。
根据本文的实施例,可以简化用于逆亮度映射和/或色度残差缩放的索引推导过程。
根据本文的实施例,提供了一种由解码装置执行的视频/图像解码方法。
根据本文的实施例,提供了一种用于执行视频/图像解码的解码装置。
根据本文的实施例,提供了一种由编码装置执行的视频/图像编码方法。
根据本文的实施例,提供了一种用于执行视频/图像编码的编码装置。
根据本文的一个实施例,提供了一种计算机可读数字存储介质,其中存储根据在本文的至少一个实施例中公开的视频/图像编码方法生成的编码视频/图像信息。
根据本文的实施例,提供了一种计算机可读数字存储介质,其中存储使得由解码装置执行在本文的至少一个实施例中公开的视频/图像解码方法的编码信息或编码视频/图像信息。
有益效果
根据本文的实施例,可以提高整体图像/视频压缩效率。
根据本文的实施例,可以通过有效滤波来提高主/客观视觉质量。
根据本文的实施例,可以有效地执行用于图像/视频编译的LMCS过程。
根据本文的实施例,可以最小化LMCS过程所需的(软件或硬件的)资源/成本。
根据本文的实施例,可以促进用于LMCS过程的硬件实现。
根据本文的实施例,可以通过约束LMCS码字(或其范围),去除或最小化映射(整形)中的LMCS码字的推导所需的除法运算。
根据本文的实施例,可以通过使用单个色度残差缩放因子来去除根据分段索引识别的延迟。
根据本文的实施例,通过使用LMCS中的线性映射,可以在不依赖亮度块(的重构)的情况下,执行色度残差缩放过程,从而可以去除缩放中的延迟。
根据本文的实施例,可以提高LMCS中的映射效率。
根据本文的实施例,可以通过简化用于逆亮度映射和/或色度残差缩放的索引推导过程,降低LMCS的复杂度,从而可以提高视频/图像编译效率。
附图说明
图1图示了可以应用本文的实施例的视频/图像编译系统的示例。
图2是示意性地图示可以应用本文的实施例的视频/图像编码装置的配置的图。
图3是示意性地图示可以应用本文的实施例的视频/图像解码装置的配置的图。
图4示例性地示出了用于编译图像/视频的层次结构。
图5示例性地图示根据本文的实施例的CVS的层次结构。
图6图示了根据本文的实施例的示例性LMCS结构。
图7图示了根据本文的另一实施例的LMCS结构。
图8示出了表示示例性前向映射的图。
图9是图示根据本文的实施例的用于推导色度残差缩放索引的方法的流程图。
图10图示了根据本文的实施例的轴心点的线性拟合。
图11图示了根据本文的实施例的线性整形器的一个示例。
图12示出了本文的实施例中的线性前向映射的示例。
图13示出了本文的实施例中的逆前向映射的示例。
图14和图15示意性地示出了根据本文的实施例的视频/图像编码方法和相关组件的示例。
图16和图17示意性地示出了根据本文的实施例的图像/视频解码方法和相关组件的示例。
图18示出了可以应用本文中公开的实施例的内容流传输系统的示例。
具体实施方式
本文可按各种形式修改,将描述并且在附图中示出其特定实施方式。然而,这些实施方式并非旨在限制本文。以下描述中使用的术语仅用于描述特定实施方式,而非旨在限制本文。单数表达包括复数表达,除非可清楚地不同地理解。诸如“包括”和“具有”的术语旨在指示存在以下描述中使用的特征、数量、步骤、操作、元件、组件或其组合,因此应该理解,不排除存在或添加一个或多个不同的特征、数量、步骤、操作、元件、组件或其组合的可能性。
同时,为了方便描述关于不同特性功能,独立地示出在本文中描述的附图中的各个配置,并不意味着将每个配置实现为单独的硬件或单独的软件。例如,各种组件中的两个或更多个组件可以被组合以形成一个组件,或者一个组件可以被划分成多个组件。集成和/或分离每个组件的实施例也包括在本文的公开的范围中。
在下文中,将参考附图详细描述本实施例的示例。此外,贯穿附图使用相同的附图标记来指示相同的元件,并且将省略对相同元件的相同描述。
图1图示了可以应用本文的实施例的视频/图像编译系统的示例。
参照图1,视频/图像编译系统可以包括第一设备(源设备)和第二设备(接收设备)。源设备可以通过数字存储介质或网络,将编码的视频/图像信息或数据以文件或流传输的形式传送到接收设备。
源设备可以包括视频源、编码装置和发送器。接收设备可以包括接收器、解码装置和渲染器。编码装置可以被称为视频/图像编码装置,解码装置可以被称为视频/图像解码装置。发送器可以被包括在编码装置中。接收器可以被包括在解码装置中。渲染器可以包括显示器,并且显示器可以被配置为单独的设备或外部组件。
视频源可以通过捕获、合成或生成视频/图像的过程来获取视频/图像。视频源可以包括视频/图像捕获设备和/或视频/图像生成设备。例如,视频/图像捕获设备可以包括一个或多个相机、包括先前捕获的视频/图像的视频/图像档案等。例如,视频/图像生成设备可以包括计算机、平板计算机和智能电话,并且可以(电子地)生成视频/图像。例如,可以通过计算机等生成虚拟视频/图像。在这种情况下,视频/图像捕获过程可以由生成相关数据的过程代替。
编码装置可以对输入视频/图像进行编码。为了压缩和编译效率,编码装置可以执行诸如预测、变换和量化的一系列过程。编码的数据(编码的视频/图像信息)可以按比特流的形式输出。
发送器可以通过数字存储介质或网络,将以比特流的形式输出的编码的图像/图像信息或数据以文件或流传输的形式发送到接收设备的接收器。数字存储介质可以包括诸如USB、SD、CD、DVD、蓝光、HDD、SSD等的各种存储介质。发送器可以包括用于通过预定文件格式生成媒体文件的元件,并且可以包括用于通过广播/通信网络传输的元件。接收器可以接收/提取比特流并且将所接收的比特流发送到解码装置。
解码装置可以通过执行与编码装置的操作相对应的诸如去量化、逆变换和预测的一系列过程来解码视频/图像。
渲染器可以渲染解码的视频/图像。渲染的视频/图像可以通过显示器显示。
本文涉及视频/图像编译。例如,本文中公开的方法/实施例可以应用于通用视频编译(VVC)标准、基本视频编译(EVC)标准、AOMedia Video 1(AV1)标准、第2代音视频编译标准(AVS2)或下一代视频/图像编译标准(例如,H.267或H.268等)中公开的方法。
本文建议了视频/图像编译的各种实施例,并且除非另外提及,否则实施例可以彼此组合执行。
在本文中,视频可以指随时间的一系列图像。图片通常是指表示特定时间帧处的一个图像的单元,切片(slice)/拼块(tile)是指在编译方面,构成图片的一部分的单元。切片/拼块可以包括一个或多个编译树单元(CTU)。一个图片可以由一个或多个切片/拼块组成。一个图片可以由一个或多个拼块组组成。一个拼块组可以包括一个或多个拼块。图块(brick)可以表示图片中的拼块内的CTU行的矩形区域。拼块可以被分割成多个图块,各个图块由拼块内的一个或多个CTU行组成。未被分割成多个图块的拼块也可以被称为图块。图块扫描可以表示分割图片的CTU的特定顺序排序,其中,以图块内的CTU栅格扫描连续地排序CTU,以及以拼块的图块的栅格扫描连续地排序拼块内的图块,并且以图片的图块的栅格扫描连续地排序图片中的拼块。拼块是图片中的特定拼块列和特定拼块行内的CTU的矩形区域。拼块列是高度等于图片的高度并且宽度由图片参数集中的句法元素指定的CTU的矩形区域。拼块行是高度由图片参数集中的句法元素指定并且宽度等于图片的宽度的CTU的矩形区域。拼块扫描是分割图片的CTU的特定顺序排序,其中,在拼块中的CTU栅格扫描连续地排序CTU,而以图片的拼块的栅格扫描连续地排序图片中的拼块。切片包括可以排他地包含在单个NAL单元中的图片的整数数量的图块。切片可以由多个完整拼块或仅一个拼块的完整图块的连续序列组成。在本文中,拼块组和切片可以互换使用。例如,在本文中,拼块组/拼块组头可以被称为切片/切片头。
同时,一个图片可以被分成两个或更多子图片。子图片可以是图片内的一个或多个切片的矩形区域。
像素或像元(pel)可以是指构成一个图片(或图像)的最小单元。另外,“样本”可以用作对应于像素的术语。样本通常可以表示像素或像素值,并且可以仅表示亮度分量的像素/像素值或仅表示色度分量的像素/像素值。
单元可以表示图像处理的基本单位。单元可以包括图片的特定区域和与该区域有关的信息中的至少一个。一个单元可以包括一个亮度块和两个色度(例如,cb、cr)块。在一些情况下,单元可以与诸如块或区域的术语互换使用。在一般情况下,M×N块可以包括M列和N行的样本(或样本阵列)或变换系数的集合(或阵列)。可替代地,样本可以是指空间域中的像素值,以及当这样的像素值被变换到频域时,可以是指频域中的变换系数。
在本文中,“A或B”可以是指“仅A”、“仅B”或“A和B”。换句话说,本文中的“A或B”可以被解释为“A和/或B”。例如,在本文中,“A、B或C(A、B或C)”是指“仅A”、“仅B”、“仅C”或“A、B和C的任意组合”。
本文中使用的斜线(/)或逗号(逗号)可以是指“和/或”。例如,“A/B”可以是指“A和/或B”。因此,“A/B”可以是指“仅A”、“仅B”或“A和B”。例如,“A,B,C”可以是指“A、B或C”。
在本文中,“A和B中的至少一个”可以是指“仅A”、“仅B”或“A和B”。此外,在本文中,表述“A或B中的至少一个”或“A和/或B中的至少一个”可以被解释为“A和B中的至少一个”。
此外,在本文中,“A、B和C中的至少一个”是指“仅A”、“仅B”、“仅C”或“A、B和C的任意组合”。此外,“A、B或C中的至少一个”或“A、B和/或C中的至少一个”可以是指“A、B和C中的至少一个”。
此外,本文中使用的括号可以是指“例如”。具体地,当指示“预测(帧内预测)”时,可以将“帧内预测”作为“预测”的示例提出。换言之,本文中的“预测”不限于“帧内预测”,以及“帧内预测”可以作为“预测”的示例提出。此外,即使当指示“预测(即,帧内预测)”时,也可以将“帧内预测”作为“预测”的示例提出。
可以单独或同时实现本文的一个附图中单独描述的技术特征。
图2是示意性地图示可以应用本文的实施例的视频/图像编码装置的配置的图。在下文中,所谓的视频编码装置可以包括图像编码装置。
参照图2,编码装置200包括图像分割器210、预测器220、残差处理器230和熵编码器240、加法器250、滤波器260和存储器270。预测器220可包括帧间预测器221和帧内预测器222。残差处理器230可包括变换器232、量化器233、去量化器234和逆变换器235。残差处理器230还可包括减法器231。加法器250可被称为重构器或重构块生成器。根据实施方式,图像分割器210、预测器220、残差处理器230、熵编码器240、加法器250和滤波器260可由至少一个硬件组件(例如,编码器芯片组或处理器)配置。另外,存储器270可包括解码图片缓冲器(DPB),或者可由数字存储介质配置。硬件组件还可包括存储器270作为内部/外部组件。
图像分割器210可将输入到编码设备200的输入图像(或者图片或帧)分割成一个或多个处理器。例如,处理器可被称为编译单元(CU)。在这种情况下,编译单元可根据四叉树二叉树三叉树(QTBTTT)结构从编译树单元(CTU)或最大编译单元(LCU)递归地分割。例如,一个编译单元可基于四叉树结构、二叉树结构和/或三元结构被分割成深度更深的多个编译单元。在这种情况下,例如,可首先应用四叉树结构,稍后可应用二叉树结构和/或三元结构。另选地,可首先应用二叉树结构。可基于不再分割的最终编译单元来执行根据本公开的编译过程。在这种情况下,根据图像特性基于编译效率,最大编译单元可用作最终编译单元,或者如果需要,编译单元可被递归地分割成深度更深的编译单元并且具有最优大小的编译单元可用作最终编译单元。这里,编译过程可包括预测、变换和重构的过程(将稍后描述)。作为另一示例,处理器还可包括预测单元(PU)或变换单元(TU)。在这种情况下,预测单元和变换单元可从上述最终编译单元拆分或分割。预测单元可以是样本预测的单元,变换单元可以是用于推导变换系数的单元和/或用于从变换系数推导残差信号的单元。
在一些情况下,单元可与诸如块或区域的术语互换使用。在一般情况下,M×N块可表示由M列和N行组成的样本或变换系数的集合。样本通常可表示像素或像素值,可仅表示亮度分量的像素/像素值或者仅表示色度分量的像素/像素值。样本可用作与像素或像元的一个图片(或图像)对应的术语。
在编码装置200中,从输入图像信号(原始块、原始样本阵列)减去从帧间预测器221或帧内预测器222输出的预测信号(预测块、预测样本阵列)以生成残差信号(残差块、残差样本阵列),并且所生成的残差信号被发送到变换器232。在这种情况下,如所示,在编码器200中从输入图像信号(原始块、原始样本阵列)减去预测信号(预测块、预测样本阵列)的单元可被称为减法器231。预测器可对要处理的块(以下,称为当前块)执行预测并且生成包括当前块的预测样本的预测块。预测器可确定基于当前块或CU应用帧内预测还是帧间预测。如在各个预测模式的描述中稍后描述的,预测器可生成与预测有关的各种类型的信息(例如,预测模式信息)并将所生成的信息发送到熵编码器240。关于预测的信息可在熵编码器240中编码并以比特流的形式输出。
帧内预测器222可参考当前图片中的样本来预测当前块。根据预测模式,所参考的样本可位于当前块附近或者可隔开。在帧内预测中,预测模式可包括多个非定向模式和多个定向模式。例如,非定向模式可包括DC模式和平面模式。例如,根据预测方向的详细程度,定向模式可包括33个定向预测模式或65个定向预测模式。然而,这仅是示例,可根据设置使用更多或更少的定向预测模式。帧内预测器222可使用应用于邻近块的预测模式来确定应用于当前块的预测模式。
帧间预测器221可基于参考图片上运动向量所指定的参考块(参考样本阵列)来推导当前块的预测块。这里,为了减少在帧间预测模式下发送的运动信息量,可基于邻近块与当前块之间的运动信息的相关性以块、子块或样本为单位预测运动信息。运动信息可包括运动向量和参考图片索引。运动信息还可包括帧间预测方向(L0预测、L1预测、Bi预测等)信息。在帧间预测的情况下,邻近块可包括存在于当前图片中的空间邻近块和存在于参考图片中的时间邻近块。包括参考块的参考图片和包括时间邻近块的参考图片可相同或不同。时间邻近块可被称为并置参考块、并置CU(colCU)等,并且包括时间邻近块的参考图片可被称为并置图片(colPic)。例如,帧间预测器221可基于邻近块来配置运动信息候选列表并且生成指示哪一候选用于推导当前块的运动向量和/或参考图片索引的信息。可基于各种预测模式执行帧间预测。例如,在跳过模式和合并模式的情况下,帧间预测器221可使用邻近块的运动信息作为当前块的运动信息。在跳过模式下,与合并模式不同,可不发送残差信号。在运动向量预测(MVP)模式的情况下,邻近块的运动向量可用作运动向量预测器,并且可通过发信号告知运动向量差来指示当前块的运动向量。
预测器220可基于下面描述的各种预测方法来生成预测信号。例如,预测器可不仅应用帧内预测或帧间预测以预测一个块,而且同时应用帧内预测和帧间预测二者。这可被称为组合帧间和帧内预测(CIIP)。另外,预测器可基于帧内块复制(IBC)预测模式或调色板模式来预测块。IBC预测模式或调色板模式可用于游戏等的内容图像/视频编译,例如屏幕内容编译(SCC)。IBC基本上在当前图片中执行预测,但是可与帧间预测相似地执行,使得在当前图片中推导参考块。即,IBC可使用本文中描述的至少一个帧间预测技术。调色板模式可被视为帧内编译或帧内预测的示例。当应用调色板模式时,可基于关于调色板表和调色板索引的信息发信号告知图片内的样本值。
由预测器(包括帧间预测器221和/或帧内预测器222)生成的预测信号可用于生成重构信号或生成残差信号。变换器232可通过对残差信号应用变换技术来生成变换系数。例如,变换技术可包括离散余弦变换(DCT)、离散正弦变换(DST)、Karhunen–Loève变换(KLT)、基于图形的变换(GBT)或条件非线性变换(CNT)中的至少一个。这里,当像素之间的关系信息由图形表示时,GBT意指从图形获得的变换。CNT是指基于使用所有先前重构的像素生成的预测信号生成的变换。另外,变换处理可应用于具有相同大小的正方形像素块或者可应用于具有正方形以外的可变大小的块。
量化器233可将变换系数量化并将它们发送到熵编码器240,并且熵编码器240可对量化的信号(关于量化的变换系数的信息)进行编码并输出比特流。关于量化的变换系数的信息可被称为残差信息。量化器233可基于系数扫描顺序将块类型量化的变换系数重排为一维向量形式,并且基于一维向量形式的量化的变换系数来生成关于量化的变换系数的信息。可生成关于变换系数的信息。熵编码器240可执行例如指数Golomb、上下文自适应可变长度编译(CAVLC)、上下文自适应二进制算术编译(CABAC)等的各种编码方法。熵编码器240可对量化的变换系数以外的视频/图像重构所需的信息(例如,句法元素的值等)一起或单独地进行编码。编码的信息(例如,编码的视频/图像信息)可按比特流的形式以NAL(网络抽象层)为单位发送或存储。视频/图像信息还可包括关于各种参数集的信息,例如自适应参数集(APS)、图片参数集(PPS)、序列参数集(SPS)或视频参数集(VPS)。另外,视频/图像信息还可包括一般约束信息。在本文中,从编码装置发送/发信号告知解码装置的信息和/或句法元素可被包括在视频/图片信息中。视频/图像信息可通过上述编码过程编码并被包括在比特流中。比特流可经由网络发送或者可被存储在数字存储介质中。网络可包括广播网络和/或通信网络,并且数字存储介质可包括诸如USB、SD、CD、DVD、蓝光、HDD、SSD等的各种存储介质。发送从熵编码器240输出的信号的发送器(未示出)和/或存储该信号的存储单元(未示出)可被包括作为编码装置200的内部/外部元件,并且另选地,发送器可被包括在熵编码器240中。
从量化器233输出的量化的变换系数可用于生成预测信号。例如,可通过经由去量化器234和逆变换器235对量化的变换系数应用去量化和逆变换来重构残差信号(残差块或残差样本)。加法器250将重构的残差信号与从帧间预测器221或帧内预测器222输出的预测信号相加以生成重构信号(重构图片、重构块、重构样本阵列)。如果要处理的块不存在残差(例如,应用跳过模式的情况),则预测块可用作重构块。加法器250可被称为重构器或重构块生成器。如下所述,所生成的重构信号可用于当前图片中要处理的下一块的帧内预测并且可通滤波波用于下一图片的帧间预测。
此外,可在图片编码和/或重构期间应用与色度缩放的亮度映射(LMCS)。
滤波器260可通过对重构信号应用滤波来改进主观/客观图像质量。例如,滤波器260可通过对重构图片应用各种滤波方法来生成修改的重构图片并将修改的重构图片存储在存储器270(具体地,存储器270的DPB)中。例如,各种滤波方法可包括去块滤波、样本自适应偏移、自适应环路滤波器、双边滤波器等。滤波器260可生成与滤波有关的各种类型的信息并且将所生成的信息发送到熵编码器240,如在各个滤波方法的描述中稍后描述的。与滤波有关的信息可由熵编码器240编码并以比特流的形式输出。
发送到存储器270的修改的重构图片可用作帧间预测器221中的参考图片。当通过编码装置应用帧间预测时,可避免编码装置200与解码装置之间的预测失配并且编码效率可改进。
存储器270DPB的DPB可存储用作帧间预测器221中的参考图片的修改的重构图片。存储器270可存储推导(或编码)当前图片中的运动信息的块的运动信息和/或图片中已经重构的块的运动信息。所存储的运动信息可被发送到帧间预测器221并用作空间邻近块的运动信息或时间邻近块的运动信息。存储器270可存储当前图片中的重构块的重构样本并且可将重构样本传送至帧内预测器222。
图3是图示可以应用本公开的实施例的视频/图像解码装置的配置的示意图。
参照图3,解码装置300可包括熵解码器310、残差处理器320、预测器330、加法器340、滤波器350和存储器360。预测器330可包括帧间预测器331和帧内预测器332。残差处理器320可包括去量化器321和逆变换器321。根据实施方式,熵解码器310、残差处理器320、预测器330、加法器340和滤波器350可由硬件组件(例如,解码器芯片组或处理器)配置。另外,存储器360可包括解码图片缓冲器(DPB)或者可由数字存储介质配置。硬件组件还可包括存储器360作为内部/外部组件。
当输入包括视频/图像信息的比特流时,解码装置300可重构与在图2的编码装置中处理视频/图像信息的处理对应的图像。例如,解码装置300可基于从比特流获得的块分割相关信息来推导单元/块。解码装置300可使用编码装置中应用的处理器来执行解码。因此,例如,解码的处理器可以是编译单元,并且编译单元可根据四叉树结构、二叉树结构和/或三叉树结构从编译树单元或最大编译单元分割。可从编译单元推导一个或多个变换单元。通过解码装置300解码和输出的重构图像信号可通过再现装置再现。
解码装置300可接收从图2的编码装置以比特流的形式输出的信号,并且所接收的信号可通过熵解码器310解码。例如,熵解码器310可解析比特流以推导图像重构(或图片重构)所需的信息(例如,视频/图像信息)。视频/图像信息还可包括关于各种参数集的信息,例如自适应参数集(APS)、图片参数集(PPS)、序列参数集(SPS)或视频参数集(VPS)。另外,视频/图像信息还可包括一般约束信息。解码装置还可基于关于参数集的信息和/或一般约束信息将图片解码。本文中稍后描述的发信号告知/接收的信息和/或句法元素可通过解码过程解码并从比特流获得。例如,熵解码器310基于诸如指数Golomb编译、CAVLC或CABAC的编译方法对比特流中的信息进行解码,并且输出图像重构所需的句法元素和残差的变换系数的量化值。更具体地,CABAC熵解码方法可接收与比特流中的各个句法元素对应的bin,使用解码目标句法元素信息、解码目标块的解码信息或在先前阶段中解码的符号/bin的信息来确定上下文模型,并且通过根据所确定的上下文模型预测bin出现的概率对bin执行算术解码,并且生成与各个句法元素的值对应的符号。在这种情况下,CABAC熵解码方法可在确定上下文模型之后通过将解码的符号/bin的信息用于下一符号/bin的上下文模型来更新上下文模型。熵解码器310所解码的信息当中与预测有关的信息可被提供给预测器(帧间预测器332和帧内预测器331),并且在熵解码器310中执行了熵解码的残差值(即,量化的变换系数和相关参数信息)可被输入到残差处理器320。残差处理器320可推导残差信号(残差块、残差样本、残差样本阵列)。另外,熵解码器310所解码的信息当中关于滤波的信息可被提供给滤波器350。此外,用于接收从编码装置输出的信号的接收器(未示出)还可被配置成解码装置300的内部/外部元件,或者接收器可以是熵解码器310的组件。此外,根据本文的解码装置可被称为视频/图像/图片解码装置,并且解码装置可被分类为信息解码器(视频/图像/图片信息解码器)和样本解码器(视频/图像/图片样本解码器)。信息解码器可包括熵解码器310,并且样本解码器可包括去量化器321、逆变换器322、加法器340、滤波器350、存储器360、帧间预测器332和帧内预测器331中的至少一个。
去量化器321可将量化的变换系数去量化并输出变换系数。去量化器321可按二维块形式重排量化的变换系数。在这种情况下,可基于在编码装置中执行的系数扫描顺序来执行重排。去量化器321可使用量化参数(例如,量化步长信息)对量化的变换系数执行去量化并且获得变换系数。
逆变换器322对变换系数逆变换以获得残差信号(残差块、残差样本阵列)。
预测器可对当前块执行预测并生成包括当前块的预测样本的预测块。预测器可基于从熵解码器310输出的关于预测的信息来确定对当前块应用帧内预测还是帧间预测并且可确定特定帧内/帧间预测模式。
预测器320可基于下述各种预测方法来生成预测信号。例如,预测器不仅可应用帧内预测或帧间预测以预测一个块,而且可同时应用帧内预测和帧间预测。这可被称为组合帧间和帧内预测(CIIP)。另外,预测器可基于帧内块复制(IBC)预测模式或调色板模式来预测块。IBC预测模式或调色板模式可用于游戏等的内容图像/视频编译,例如屏幕内容编译(SCC)。IBC基本上执行当前图片中的预测,但是可与帧间预测相似地执行,使得在当前图片中推导参考块。即,IBC可使用本文中描述的至少一种帧间预测技术。调色板模式可被视为帧内编译或帧内预测的示例。当应用调色板模式时,可基于关于调色板表和调色板索引的信息发信号告知图片内的样本值。
帧内预测器331可参考当前图片中的样本来预测当前块。根据预测模式,所参考的样本可位于当前块附近或者可隔开。在帧内预测中,预测模式可包括多个非定向模式和多个定向模式。帧内预测器331可使用应用于邻近块的预测模式来确定应用于当前块的预测模式。帧内预测器331可参考当前图片中的样本来预测当前块。根据预测模式,所参考的样本可位于当前块附近或者可隔开。在帧内预测中,预测模式可包括多个非定向模式和多个定向模式。帧内预测器331可使用应用于邻近块的预测模式来确定应用于当前块的预测模式。
帧间预测器332可基于参考图片上运动向量所指定的参考块(参考样本阵列)来推导当前块的预测块。在这种情况下,为了减少在帧间预测模式下发送的运动信息量,可基于邻近块与当前块之间的运动信息的相关性以块、子块或样本为单位预测运动信息。运动信息可包括运动向量和参考图片索引。运动信息还可包括帧间预测方向(L0预测、L1预测、Bi预测等)信息。在帧间预测的情况下,邻近块可包括存在于当前图片中的空间邻近块和存在于参考图片中的时间邻近块。例如,帧间预测器332可基于邻近块来配置运动信息候选列表并且基于所接收的候选选择信息来推导当前块的运动向量和/或参考图片索引。可基于各种预测模式来执行帧间预测,并且关于预测的信息可包括指示当前块的帧间预测模式的信息。
加法器340可通过将所获得的残差信号与从预测器(包括帧间预测器332和/或帧内预测器331)输出的预测信号(预测块、预测样本阵列)相加来生成重构信号(重构图片、重构块、重构样本阵列)。如果要处理的块不存在残差,例如当应用跳过模式时,预测块可用作重构块。
加法器340可被称为重构器或重构块生成器。所生成的重构信号可用于当前图片中要处理的下一块的帧内预测,可如下所述通滤波波输出,或者可用于下一图片的帧间预测。
此外,可在图片解码处理中应用亮度映射与色度缩放(LMCS)。
滤波器350可通过对重构信号应用滤波来改进主观/客观图像质量。例如,滤波器350可通过对重构图片应用各种滤波方法来生成修改的重构图片并且将修改的重构图片存储在存储器360(具体地,存储器360的DPB)中。例如,各种滤波方法可包括去块滤波、样本自适应偏移、自适应环路滤波器、双边滤波器等。
存储在存储器360的DPB中的(修改的)重构图片可用作帧间预测器332中的参考图片。存储器360可存储推导(或解码)当前图片中的运动信息的块的运动信息和/或图片中已经重构的块的运动信息。所存储的运动信息可被发送到帧间预测器260以用作空间邻近块的运动信息或时间邻近块的运动信息。存储器360可存储当前图片中的重构块的重构样本并将重构样本传送至帧内预测器331。
在本公开中,在编码装置200的滤波器260、帧间预测器221和帧内预测器222中描述的实施方式可与解码装置300的滤波器350、帧间预测器332和帧内预测器331相同或分别与之对应应用。这也可适用于单元332和帧内预测器331。
如上所述,在执行视频编译时,执行预测以增强压缩效率。可通过预测生成包括当前块(即,目标编译块)的预测样本的预测块。在这种情况下,预测块包括空间域(或像素域)中的预测样本。预测块在编码设备和解码设备中相同地推导。编码设备可通过用信号向解码设备通知关于原始块(而非原始块的原始样本值本身)与预测块之间的残差的信息(残差信息)来增强图像编码效率。解码装置可基于残差信息来推导包括残差样本的残差块,可通过将残差块和预测块相加来生成包括重构样本的重构块,并且可生成包括重构块的重构图片。
残差信息可通过变换过程和量化过程来生成。例如,编码装置可推导原始块与预测块之间的残差块,可通过对包括在残差块中的残差样本(残差样本阵列)执行变换过程来推导变换系数,可通过对变换系数执行量化过程来推导量化的变换系数,并且可将相关残差信息(通过比特流)发信号告知解码装置。在这种情况下,残差信息可包括诸如量化的变换系数的值信息、位置信息、变换方案、变换核心和量化参数的信息。解码装置可基于残差信息来执行去量化/逆变换过程并且可推导残差样本(或残差块)。解码装置可基于预测块和残差块来生成重构图片。此外,编码装置可通过对供后续图片的帧间预测参考的量化的变换系数进行去量化/逆变换来推导残差块,并且可生成重构图片。
在本文中,可以省略量化/去量化和/或变换/逆变换中的至少一个。当省略量化/去量化时,量化的变换系数可以被称为变换系数。当省略变换/逆变换时,变换系数可以称为系数或残差系数,或者为了表达统一,仍可以称为变换系数。
在本文中,量化变换系数和变换系数可以分别被称为变换系数和缩放变换系数。在这种情况下,残差信息可以包括关于变换系数的信息,并且可以通过残差编译句法发信号告知关于变换系数的信息。可以基于残差信息(或关于变换系数的信息)推导变换系数,并且可以通过对变换系数进行逆变换(缩放)来推导缩放变换系数。可以基于缩放变换系数的逆变换(变换)来推导残差样本。这也可以在本文的其他部分中应用/表达。
帧内预测可以是指基于当前块所属的图片(在下文中,称为当前图片)中的参考样本,为当前块生成预测样本的预测。当将帧内预测应用于当前块时,可以推导要用于当前块的帧内预测的邻近参考样本。当前块的邻近参考样本可以包括与具有nWxnH大小的当前块的左边界相邻的样本和与左下相邻的总共2xnH个样本、与当前块的上边界相邻的样本以及与右上相邻的总共2xnW个样本,以及与当前块的左上相邻的一个样本。可替代地,当前块的邻近参考样本可以包括多个上邻近样本和多个左邻近样本。此外,当前块的邻近参考样本可以包括与大小为nWxnH的当前块的右边界相邻的总共nH个样本、与当前块的下边界相邻的总共nW个样本以及与当前块的右下相邻的一个样本。
然而,当前块的一些邻近参考样本可能尚未解码或可用。在这种情况下,解码器可以通过用可用样本替换不可用的样本来配置邻近参考样本以用于预测。可替代地,可以通过可用样本的内插来配置要用于预测的邻近参考样本。
当推导邻近参考样本时,(i)可以基于当前块的邻近参考样本的平均或内插来推导预测样本,以及(ii)可以基于当前块的外围参考样本中,存在于用于预测样本的特定(预测)方向中的参考样本来推导预测样本。情况(i)可以被称为非定向模式或非角度模式,并且情况(ii)可以被称为定向模式或角度模式。
进一步地,还可以基于邻近参考样本中的当前块的预测样本,通过在位于与当前块的帧内预测模式的预测方向中的第一邻近样本与位于该预测方向的相反的方向中的第二邻近样本之间内插,可以生成预测样本。上述情况可以被称为线性内插帧内预测(LIP)。此外,可以使用线性模型,基于亮度样本生成色度预测样本。这种情况可以被称为LM模式。
此外,可以基于滤波的邻近参考样本推导当前块的临时预测样本,并且可以对现有的邻近参考样本(即未滤波的邻近参考样本)当中,根据帧内预测模式推导的至少一个参考样本与临时预测样本进行加权求和来推导当前块的预测样本。上述情况可以被称为位置相关帧内预测(PDPC)。
另外,可以选择当前块的邻近多参考样本线当中预测准确度最高的参考样本线,以通过使用位于相应线上的预测方向中的参考样本来推导预测样本,然后,本文使用的参考样本线可以被指示(发信号告知)给解码装置,从而执行帧内预测编码。上述情况可以被称为多参考线(MRL)帧内预测或基于MRL的帧内预测。
另外,可以基于相同的帧内预测模式,通过将当前块划分为垂直或水平子分区来执行帧内预测,并且可以以子分区为单位推导和使用邻近参考样本。也就是说,在这种情况下,当前块的帧内预测模式同样适用于子分区,并且在一些情况下,可以通过以子分区为单位推导和使用邻近参考样本来提高帧内预测性能。这种预测方法可以被称为帧内子分区(ISP)或基于ISP的帧内预测。
上述帧内预测方法可以被称为与帧内预测模式分开的帧内预测类型。帧内预测类型可以用各种术语来称呼,诸如帧内预测技术或附加帧内预测模式。例如,帧内预测类型(或附加帧内预测模式)可以包括上述LIP、PDPC、MRL和ISP中的至少一个。除了诸如LIP、PDPC、MRL或ISP的特定帧内预测类型之外的一般帧内预测方法可以被称为正常帧内预测类型。当不应用特定的帧内预测类型时,通常可以应用正常的帧内预测类型,并且可以基于上述帧内预测模式执行预测。同时,可以根据需要对推导的预测样本执行后滤波。
具体地,帧内预测过程可以包括帧内预测模式/类型确定步骤、邻近参考样本推导步骤和基于帧内预测模式/类型的预测样本推导步骤。此外,可以根据需要对推导的预测样本执行后滤波步骤。
当应用帧内预测时,可以使用邻近块的帧内预测模式来确定应用于当前块的帧内预测模式。例如,解码装置可以基于所接收的最可能模式(mpm)索引,选择基于当前块的邻近块(例如左和/或上邻近块)的帧内预测模式推导的mpm列表中的mpm候选之一,并且基于剩余帧内预测模式信息,选择未包括在mpm候选(和平面模式)中的其他剩余帧内预测模式之一。mpm列表可以被配置为包括或不包括平面模式作为候选。例如,如果mpm列表包括平面模式作为候选,则mpm列表可以有六个候选。如果mpm列表不包括平面模式作为候选,则mpm列表可能有五个候选。当mpm列表不包括平面模式作为候选时,可以发信号告知指示当前块的帧内预测模式是否不是平面模式的非平面标志(例如,intra_luma_not_planar_flag)。例如,可以首先发信号告知mpm标志,并且当mpm标志的值为1时,可以发信号告知mpm索引和非平面标志。此外,当非平面标志的值为1时,可以发信号告知mpm索引。在此,mpm列表被配置为不包括平面模式作为候选不意在指示平面模式不是mpm,而是首先发信号告知非平面标志以首先检查它是否是平面模式,因为平面模式总是被认为是mpm。
例如,可以基于mpm标志(例如Intra_luma_mpm_flag)指示应用于当前块的帧内预测模式是在mpm候选(和平面模式)中还是在剩余模式中。mpm标志的值为1可以指示用于当前块的帧内预测模式在mpm候选(和平面模式)内,并且mpm标志的值为0可以指示用于当前块的帧内预测模式不在mpm候选(和平面模式)中。非平面标志(例如Intra_luma_not_planar_flag)的值为0可以指示当前块的帧内预测模式是平面模式,非平面标志值的值为1可以指示当前块的帧内预测模式不是平面模式。可以以mpm_idx或intra_luma_mpm_idx句法元素的形式发信号告知mpm索引,并且可以以rem_intra_luma_pred_mode或intra_luma_mpm_remainder句法元素的形式发信号告知剩余帧内预测模式信息。例如,剩余帧内预测模式信息可以按照预测模式编号的顺序,对所有帧内预测模式中未包括在mpm候选(和平面模式)中的剩余帧内预测模式编索引以指示其中之一。帧内预测模式可以是用于亮度分量(样本)的帧内预测模式。在下文中,帧内预测模式信息可以包括mpm标志(例如Intra_luma_mpm_flag)、非平面标志(例如Intra_luma_not_planar_flag)、mpm索引(例如mpm_idx或intra_luma_mpm_idx)和剩余帧内预测模式信息(rem_intra_luma_pred_mode或intra_luma_mpm_remainder)中的至少一个。在本文中,MPM列表可以用多种术语来指代,诸如MPM候选列表和candModeList。当MIP应用于当前块时,可以发信号告知用于MIP的单独mpm标志(例如,intra_mip_mpm_flag)、mpm索引(例如,intra_mip_mpm_idx)和剩余帧内预测模式信息(例如,intra_mip_mpm_remainder)并且不发信号告知非平面标志。
换言之,一般而言,当对图像执行块分割时,要编译的当前块和邻近块具有相似的图像特性。因此,当前块和邻近块具有相同或相似的帧内预测模式的概率很高。因此,编码器可以使用邻近块的帧内预测模式来对当前块的帧内预测模式进行编码。
例如,编码器/解码器可以配置用于当前块的最可能模式(MPM)的列表。MPM列表也可以被称为MPM候选列表。在此,MPM可以指在帧内预测模式编译中,考虑当前块和邻近块之间的相似性来提高编译效率的模式。如上所述,MPM列表可以被配置为包括平面模式或者可以被配置为排除平面模式。例如,当MPM列表包括平面模式时,MPM列表中的候选数量可以是6。而如果MPM列表不包括平面模式,则MPM列表中的候选数量可以是5。
编码器/解码器可以配置包括5或6个MPM的MPM列表。
为了配置MPM列表,可以考虑三种模式:默认帧内模式、邻域帧内模式和推导的帧内模式。
对于邻域帧内模式,可以考虑两个邻近块,即左邻近块和上邻近块。
如上所述,如果MPM列表被配置为不包括平面模式,则从列表中排除平面模式,并且MPM列表候选的数量可以设置为5。
此外,帧内预测模式当中的非定向模式(或非角度模式)可以包括基于当前块的邻近参考样本的平均的DC模式或基于内插的平面模式。
当应用帧间预测时,编码装置/解码装置的预测器可以通过以块为单位执行帧间预测来推导预测样本。帧间预测可以是以依赖于除当前图片之外的图片的数据元素(例如,样本值或运动信息)的方式推导的预测。当帧间预测应用于当前块时,可以基于由参考图片索引指示的参考图片上的由运动向量指定的参考块(参考样本阵列)来推导当前块的预测块(预测样本阵列)。在此,为了减少在帧间预测模式中发送的运动信息量,可以基于邻近块和当前块之间的运动信息的相关性,以块、子块或样本为单位来预测当前块的运动信息。运动信息可以包括运动向量和参考图片索引。运动信息可以进一步包括帧间预测类型(L0预测、L1预测、Bi预测等)信息。在帧间预测的情况下,邻近块可以包括当前图片中存在的空间邻近块和参考图片中存在的时间邻近块。包括参考块的参考图片和包括时间邻近块的参考图片可以相同或不同。时间邻近块可以被称为并置参考块、并置CU(colCU)等,而包括时间邻近块的参考图片可以被称为并置图片(colPic)。例如,可以基于当前块的邻近块来配置运动信息候选列表,并且可以发信号告知指示选择(使用)哪个候选的标志或索引信息以推导当前块的运动向量和/或参考图片索引。可以基于各种预测模式来执行帧间预测。例如,在跳过模式和合并模式的情况下,当前块的运动信息可以与邻近块的运动信息相同。在跳过模式中,与合并模式不同,可以不发送残差信号。在运动向量预测(MVP)模式的情况下,所选择的邻近块的运动向量可以被用作运动向量预测器(predictor)并且可以发信号告知当前块的运动向量。在这种情况下,可以使用运动向量预测器和运动向量差的和来推导当前块的运动向量。
根据帧间预测类型(L0预测、L1预测、Bi预测等),运动信息可以包括L0运动信息和/或L1运动信息。L0方向的运动向量可以被称为L0运动向量或MVL0,而L1方向的运动向量可以被称为L1运动向量或MVL1。基于L0运动向量的预测可以被称为L0预测,基于L1运动向量的预测可以被称为L1预测,以及基于L0运动向量和L1运动向量两者的预测可以被称为双重预测。在此,L0运动向量可以指示与参考图片列表L0(L0)相关联的运动向量,而L1运动向量可以指示与参考图片列表L1(L1)相关联的运动向量。参考图片列表L0可以将输出顺序上比当前图片早的图片包括为参考图片,而参考图片列表L1可以将输出顺序上比当前图片晚的图片包括为参考图片。先前的图片可以被称为前向(参考)图片,而后续的图片可以被称为反向(参考)图片。参考图片列表L0可以进一步将在输出顺序上比当前图片晚的图片包括为参考图片。在这种情况下,可以在参考图片列表L0中首先对先前图片编索引,稍后对后续图片编索引。参考图片列表L1可以进一步将在输出顺序中,在当前图片之前的图片包括为参考图片。在这种情况下,在参考图片列表1中可以首先对后续图片编索引,稍后对先前的图片编索引。输出顺序可以对应于图片顺序计数(POC)顺序。
图4示例性地示出了用于编译图像/视频的层次结构。
参照图4,编译图像/视频被分为处置图像/视频的解码处理及其自身的视频编译层(VCL)、发送和存储编译信息的子系统,以及负责网络适配功能并且存在于VCL和子系统之间的NAL(网络抽象层)。
在VCL中,生成包括压缩图像数据(切片数据)的VCL数据,或者可以生成包括图片参数集(PSP)、序列参数集(SPS)和视频参数集(VPS)的参数集或者图像解码过程额外所需的补充增强信息(SEI)消息。
在NAL中,可以通过向VCL中生成的原始字节序列有效载荷(RBSP)添加头信息(NAL单元头)来生成NAL单元。在这种情况下,RBSP是指在VCL中生成的切片数据、参数集、SEI消息等。NAL单元头可以包括根据包括在相应NAL单元中的RBSP数据指定的NAL单元类型信息。
如图所示,根据VCL中生成的RBSP,NAL单元可以被分类为VCL NAL单元和非VCLNAL单元。VCL NAL单元可以是指包括关于图像(切片数据)的信息的NAL单元,以及非VCLNAL单元可以是指包括解码图像所需的信息(参数集或SEI消息)的NAL单元。
可以根据子系统的数据标准,通过附接头信息,通过网络发送上述VCL NAL单元和非VCL NAL单元。例如,可以将NAL单元转换为诸如H.266/VVC文件格式、实时传输协议(RTP)、传输流(TS)等的预定标准的数据格式,并且通过各种网络发送。
如上所述,可以根据包括在相应NAL单元中的RBSP数据结构,利用NAL单元类型指定NAL单元,以及关于NAL单元类型的信息可以被存储在NAL单元头中并且发信号告知。
例如,根据NAL单元是否包括关于图像的信息(切片数据),可以将NAL单元分类为VCL NAL单元类型和非VCL NAL单元类型。可以根据包括在VCL NAL单元中的图片的性质和类型来对VCL NAL单元类型进行分类,并且可以根据参数集的类型来对非VCL NAL单元类型进行分类。
下文是根据包括在非VCL NAL单元类型中的参数集的类型指定的NAL单元类型的示例。
-APS(自适应参数集)NAL单元:用于包括APS的NAL单元的类型
-DPS(解码参数集)NAL单元:用于包括DPS的NAL单元的类型
-VPS(视频参数集)NAL单元:用于包括VPS的NAL单元的类型
-SPS(序列参数集)NAL单元:用于包括SPS的NAL单元的类型
-PPS(图片参数集)NAL单元:用于包括PPS的NAL单元的类型
-PH(图片头)NAL单元:用于包括PH的NAL单元的类型
上述NAL单元类型可以具有用于NAL单元类型的句法信息,并且可以在NAL单元头中存储和发信号告知该句法信息。例如,句法信息可以是nal_unit_type,可以由nal_unit_type值指定NAL单元类型。
同时,如上所述,一个图片可以包括多个切片,并且一个切片可以包括切片头和切片数据。在这种情况下,一个图片头可以被进一步添加到一个图片中的多个切片(切片头和切片数据集)。图片头(图片头句法)可以包括通常适用于图片的信息/参数。在本文中,切片可以与拼块组混用或被替换。此外,在本文中,切片头可以与拼块组头混用或被替换。
切片头(切片头句法)可以包括通常应用于切片的信息/参数。APS(APS句法)或PPS(PPS句法)可以包括可以共同应用于于一个或多个切片或图片的信息/参数。SPS(SPS句法)可以包括可以共同应用于一个或多个序列的信息/参数。VPS(VPS句法)可以包括可以共同应用于多个层的信息/参数。DPS(DPS句法)可以包括可以共同应用于整个视频的信息/参数。DPS可以包括与编译视频序列(CVS)的级联相关的信息/参数。本文中的高级句法(HLS)可以包括APS句法、PPS句法、SPS句法、VPS句法、DPS句法和切片头句法中的至少一个。
在本文中,从编码装置编码并以比特流的形式发信号告知解码装置的图像/图像信息不仅包括图片中的分割相关信息、帧内/帧间预测信息、残差信息、环内滤波信息等,而且还包括在切片头中包括的信息、在APS中包括的信息、在PPS中包括的信息、在SPS中包括的信息和/或在VPS中包括的信息。
同时,为了补偿由于在诸如量化的压缩编译过程中出现的误差而导致的原始图像和重构图像之间的差异,可以对如上所述的重构样本或重构图片执行环内滤波处理。如上所述,可以由编码装置的滤波器和解码装置的滤波器执行环内滤波,并且可以应用去块滤波器、SAO和/或自适应环路滤波器(ALF)。例如,可以在完成去块滤波过程和/或SAO过程之后执行ALF过程。然而,即使在这种情况下,也可以省略去块滤波过程和/或SAO过程。
同时,为了提高编译效率,可以如上所述地应用亮度映射与色度缩放(LMCS)。LMCS可以被称为循环整形器(整形)。为了提高编译效率,可以分层地执行LMCS控制和/或LMCS相关信息的信令。
图5示例性地示出了根据本文的实施例的CVS的层次结构。编译视频序列(CVS)可以包括序列参数集(SPS)、图片参数集(PPS)、拼块组头、拼块数据和/或CTU。在此,拼块组头和拼块数据可以分别被称为切片头和切片数据。
SPS可以原始地包括标志以使得工具能够在CVS中使用。另外,SPS可以由包括关于针对每个图片改变的参数的信息的PPS参考。编译图片中的每一个可以包括一个或多个编译矩形域拼块。拼块可以通过栅格扫描被分组为形成拼块组。每个拼块组都封装有称为拼块组头的头信息。每个拼块由包括编译数据的CTU组成。在此,数据可以包括原始样本值、预测样本值及其亮度和色度分量(亮度预测样本值和色度预测样本值)。
图6图示了根据本文的实施例的示例性LMCS结构。图6的LMCS结构600包括基于自适应分段线性(自适应PWL)模型的亮度分量的环内映射部610和用于色度分量的亮度相关的色度残差缩放部620。环内映射部610的去量化和逆变换611、重构612和帧内预测613块表示映射(整形)域中应用的过程。环路滤波器615、环内映射部610的运动补偿或帧间预测617块,以及色度残差缩放部620的重构622、帧内预测623、运动补偿或帧间预测624、环路滤波器625块表示应用于原始(非映射、非整形)域中的过程。
如图6所示,当启用LMCS时,可以应用逆映射(整形)过程614、前向映射(整形)过程618和色度缩放过程621中的至少一个。例如,逆映射过程可以应用于重构图片中的(重构的)亮度样本(或亮度样本或亮度样本阵列)。可以基于亮度样本的分段函数(逆)索引来执行逆映射过程。分段函数(逆)索引可以识别亮度样本所属的片段。逆映射过程的输出是修改的(重构的)亮度样本(或修改的亮度样本或修改的亮度样本阵列)。可以在拼块组(或切片)、图片或更高的级别启用或禁用LMCS。
可以应用前向映射过程和/或色度缩放过程来生成重构图片。图片可以包括亮度样本和色度样本。具有亮度样本的重构图片可以被称为重构亮度图片,并且具有色度样本的重构图片可以被称为重构色度图片。重构亮度图片和重构色度图片的组合可以被称为重构图片。可以基于前向映射过程生成重构的亮度图片。例如,如果帧间预测应用于当前块,则前向映射应用于基于参考图片中的(重构的)亮度样本推导的亮度预测样本。因为基于逆映射过程生成参考图片中的(重构的)亮度样本,所以可以将前向映射应用于亮度预测样本,从而可以推导映射(整形)的亮度预测样本。可以基于亮度预测样本的分段函数索引来执行前向映射过程。可以基于用于帧间预测的参考图片中的亮度预测样本的值或亮度样本的值来推导分段函数索引。如果将帧内预测(或帧内块复制(IBC))应用于当前块,则不需要前向映射,因为逆映射过程尚未应用于当前图片中的重构样本。基于映射的亮度预测样本和相应的亮度残差样本生成重构亮度图片中的(重构的)亮度样本。
可以基于色度缩放过程生成重构的色度图片。例如,可以基于当前块中的色度预测样本和色度残差样本(cres)推导重构色度图片中的(重构的)色度样本。基于当前块的(缩放的)色度残差样本(cresScale)和色度残差缩放因子(cScaleInv可以被称为varScale)推导色度残差样本(cres)。可以基于当前块的整形亮度预测样本值来计算色度残差缩放因子。例如,可以基于整形亮度预测样本值Y'pred的平均亮度值ave(Y'pred)来计算缩放因子。作为参考,在图6中,基于逆变换/去量化推导的(缩放的)色度残差样本可以被称为cresScale,以及通过对(缩放的)色度残差样本执行(逆)缩放过程推导的色度残差样本可以被称为cres
图7图示了根据本文的另一实施例的LMCS结构。参照图6描述图7。在此,主要描述图7的LMCS结构与图6的LMCS结构600之间的差异。图7的环内映射部和亮度相关色度残差缩放部可以与图6的环内映射部610和亮度相关色度残差缩放部620相同地(类似地)操作。
参考图7,可以基于亮度重构样本推导色度残差缩放因子。在这种情况下,可以基于重构块外部的邻近亮度重构样本而不是重构块的内部亮度重构样本,获得(推导)平均亮度值(avgYr),以及基于平均亮度值(avgYr),推导色度残差缩放因子。在此,邻近亮度重构样本可以是当前块的邻近亮度重构样本,或可以是包括当前块的虚拟管道数据单元(VPDU)的邻近亮度重构样本。例如,当帧内预测应用于目标块时,可以基于以帧内预测基础推导的预测样本推导重构样本。在另一个示例中,当帧间预测应用于目标块时,前向映射应用于基于帧间预测推导的预测样本,并且基于整形(或前向映射)亮度预测样本生成(推导)重构样本。
通过比特流发信号告知的视频/图像信息可以包括LMCS参数(关于LMCS的信息)。LMCS参数可以被配置为高级句法(HLS,包括切片头句法)等。稍后描述LMCS参数的详细描述和配置。如上所述,本文(以及以下实施例)中描述的句法表可以在编码器端配置/编码并且通过比特流发信号告知解码器端。解码器可以解析/解码句法表中关于LMCS的信息(以句法元素的形式)。可以组合下文描述的一个或多个实施例。编码器可以基于关于LMCS的信息对当前图片进行编码,以及解码器可以基于关于LMCS的信息对当前图片进行解码。
亮度分量的环内映射可以通过跨动态范围重新分发码字来调整输入信号的动态范围以提高压缩效率。对于亮度映射,可以使用前向映射(整形)函数(FwdMap)和与前向映射函数(FwdMap)相对应的逆映射(整形)函数(InvMap)。可以使用分段线性模型来发信号告知FwdMap函数,例如,分段线性模型可以具有16个片段或bin。这些片段可以具有相等的长度。在一个示例中,不需要发信号告知InvMap函数,而是从FwdMap函数推导。即,逆映射可以是前向映射的函数。例如,逆映射函数可以在数学上构建为以y=x为基准的前向映射的对称函数。
环内(亮度)整形可以被用来在整形域中将输入亮度值(样本)映射为变更值。可以编译整形值,然后在重构之后映射回原始(未映射、未整形的)域。为了补偿亮度信号和色度信号之间的相互作用,可以应用色度残差缩放。环内整形是通过为整形器模型指定高级句法来完成的。整形器模型句法可以发信号告知分段线性模型(PWL模型)。可以基于分段线性模型推导前向查找表(FwdLUT)和/或逆向查找表(InvLUT)。例如,在推导前向查找表FwdLUT时,可以基于前向查找表FwdLUT推导逆向查找表InvLUT。前向查找表FwdLUT可以将输入亮度值Yi映射到变更值Yr,而逆向查找表InvLUT可以将变更值Yr映射到重构值Y'i。可以基于输入亮度值Yi推导重构值Y'i。
在一个示例中,SPS可以包括下表1的句法。表1的句法可以包括作为工具启用标志的sps_reshaper_enabled_flag。在此,可以使用sps_reshaper_enabled_flag来指定在编译视频序列(CVS)中是否使用整形器。即,sps_reshaper_enabled_flag可以是SPS中启用整形的标志。在一个示例中,表1的句法可以是SPS的一部分。
[表1]
在一个示例中,关于句法元素sps_seq_parameter_set_id和sps_reshaper_enabled_flag的语义可以如下表2中所示。
[表2]
在一个示例中,拼块组头或切片头可以包括以下表3或表4的句法。
[表3]
[表4]
包括在表3或表4的句法中的句法元素的语义可以包括例如在下表中公开的内容。
[表5]
[表6]
作为一个示例,一旦在SPS中解析了启用整形的标志(即sps_reshaper_enabled_flag),拼块组头就可以解析用于构造查找表(FwdLUT和/或InvLUT)的附加数据(即,包括在上表5或6中的信息)。为了做到这一点,可以首先在切片头或拼块组头中检查SPS整形器标志(sps_reshaper_enabled_flag)的状态。当sps_reshaper_enabled_flag为真(或1)时,可以解析附加标志,即tile_group_reshaper_model_present_flag(或slice_reshaper_model_present_flag)。tile_group_reshaper_model_present_flag(或slice_reshaper_model_present_flag)的目的可以是指示存在整形模型。例如,当tile_group_reshaper_model_present_flag(或slice_reshaper_model_present_flag)为真(或1)时,可以指示对于当前拼块组(或当前切片)存在整形器。当tile_group_reshaper_model_present_flag(或slice_reshaper_model_present_flag)为假(或0)时,可以指示当前拼块组(或当前切片)不存在整形器。
如果存在整形器并且在当前切片组(或当前切片)中启用了整形器,则可以处理整形器模型(即,tile_group_reshaper_model()或slice_reshaper_model())。除此之外,还可以解析附加标志tile_group_reshaper_enable_flag(或slice_reshaper_enable_flag)。tile_group_reshaper_enable_flag(或slice_reshaper_enable_flag)可以指示整形模型是否用于当前拼块组(或切片)。例如,如果tile_group_reshaper_enable_flag(或slice_reshaper_enable_flag)为0(或假),则可以指示整形模型未用于当前拼块组(或当前切片)。如果tile_group_reshaper_enable_flag(或slice_reshaper_enable_flag)为1(或真),则可以指示整形模型用于当前拼块组(或切片)。
作为一个示例,tile_group_reshaper_model_present_flag(或slice_reshaper_model_present_flag)可以为真(或1)并且tile_group_reshaper_enable_flag(或slice_reshaper_enable_flag)可以为假(或0)。这是指整形模型存在但未用在当前拼块组(或切片)中。在这种情况下,可以在未来拼块组(或切片)中使用整形模型。作为另一个示例,tile_group_reshaper_enable_flag可以为真(或1)并且tile_group_reshaper_model_present_flag可以为假(或0)。在这种情况下,解码器使用来自先前初始化的整形器。
当解析整形模型(即tile_group_reshaper_model()或slice_reshaper_model())以及tile_group_reshaper_enable_flag(或slice_reshaper_enable_flag)时,可以确定(评估)色度缩放所需的条件是否存在。上述条件包括条件1(没有帧内编译当前拼块组/切片)和/或条件2(当前拼块组/切片没有被分割为用于亮度和色度的两个单独的编译四叉树结构,即用于当前拼块组/切片的块结构不是双树结构)。如果条件1和/或条件2为真和/或tile_group_reshaper_enable_flag(或slice_reshaper_enable_flag)为真(或1),则可以解析tile_group_reshaper_chroma_residual_scale_flag(或slice_reshaper_chroma_residual_scale_flag)。当启用tile_group_reshaper_chroma_residual_scale_flag(或slice_reshaper_chroma_residual_scale_flag)时(如果为1或真),则可以指示对当前图块组(或切片)启用色度残差缩放。当禁用tile_group_reshaper_chroma_residual_scale_flag(或slice_reshaper_chroma_residual_scale_flag)时(如果为0或假),可以指示对当前拼块组(或切片)禁用色度残差缩放。
拼块组整形模型的目的是解析构建查找表(LUT)所需的数据。构建这些LUT的理念是,亮度值的可容许范围的分布可以被分为多个bin(例如16个bin),这些bin可以使用16个PWL方程组集合来表示。因此,位于给定bin内的任何亮度值都可以被映射到变更的亮度值。
图8示出了表示示例性前向映射的图。在图8中,示例性地图示了五个bin。
参考图8,x轴表示输入亮度值,而y轴表示变更的输出亮度值。x轴被分成5个bin或切片,每个bin的长度为L。也就是说,被映射到变更亮度值的五个bin具有相同的长度。前向查找表(FwdLUT)可以使用可从拼块组头获得的数据(即,整形器数据)构建,因此可以促进映射。
在一个实施例中,可以计算与bin索引相关联的输出轴心点。输出轴心点可以设置(标记)亮度码字整形的输出范围的最小和最大边界。输出轴心点的计算过程可以通过计算码字数量的分段累积分布函数(CDF)来执行。可以基于要使用的最大bin数和查找表(FwdLUT或InvLUT)的大小对输出轴心范围进行切片。作为一个示例,可以基于最大bin数量与查找表的大小之间的乘积(LUT的大小*bin索引的最大数量)来对输出轴心范围进行切分。例如,如果最大bin数量与查找表大小之间的乘积为1024,则可以将输出轴心范围切分成1024个条目。可以基于(使用)缩放因子来执行(应用或实现)输出轴心范围的这种切分。在一个示例中,可以基于下面的等式1推导缩放因子。
[等式1]
SF=(y2-y1)*(1<<FP_PREC)+c
在等式1中,SF表示缩放因子,y1和y2表示对应于每个bin的输出轴心点。此外,FP_PREC和c可以是预定常数。基于等式1确定的缩放因子可以被称为用于前向整形的缩放因子。
在另一个实施例中,关于逆整形(逆映射),对于要使用的bin的定义范围(即,从reshaper_model_min_bin_idx到reshape_model_max_bin_idx),提取对应于前向LUT的映射轴心点的输入整形轴心点和映射的逆输出轴心点(由所考虑的bin索引*初始码字的数量给出)。在另一示例中,可以基于下面的等式2推导缩放因子SF。
[等式2]
SF=(y2-y1)*(1<<FP_PREC)/(x2-x1)
在等式2中,SF表示缩放因子,x1和x2表示输入轴心点,以及y1和y2表示对应于每个片段(bin)的输出轴心点(逆映射的输出轴心点)。在此,输入轴心点可以是基于前向查找表(FwdLUT)映射的轴心点,并且输出轴心点可以是基于逆向查找表(InvLUT)逆映射的轴心点。此外,FP_PREC可以是预定的常数值。等式2的FP_PREC可以与等式1的FP_PREC相同或不同。基于等式2确定的缩放因子可以被称为用于逆整形的缩放因子。在逆整形期间,可以基于等式2的缩放因子来执行输入轴心点的分割。缩放因子SF被用于切分输入轴心点的范围。基于分割的输入轴心点,从0到最小bin索引(reshaper_model_min_bin_idx)和/或从最小bin索引(reshaper_model_min_bin_idx)到最大bin索引(reshape_model_max_bin_idx)范围内的bin索引被指配对应于最小和最大bin值的轴心值。
下表7示出了根据实施例的整形器模型的句法。整形器模型可以称为整形模型或LMCS模型。在此,整形器模型已经被示例性地描述为拼块组整形器,但是本文不必受限于该实施例。例如,整形器模型可以被包括在APS中,或者拼块组整形器模型可以被称为切片整形器模型或LMCS数据。此外,前缀reshaper_model或Rsp可以与lmcs互换地使用。例如,在下表以及下述描述中,reshaper_model_min_bin_idx、reshaper_model_delta_max_bin_idx、reshaper_model_max_bin_idx、RspCW、RsepDeltaCW可以分别与lmcs_min_bin_idx、lmcs_delta_max_bin_idx、lmcs_max_bin_idx、lmcsCW、lmcsDeltaCW互换地使用。
[表7]
包括在表7的句法中的句法元素的语义可以包括例如下表中公开的内容。
[表8]
根据本文的亮度样本的逆映射过程可以以如下表所示的标准文献的形式来描述。
[表9]
可以以如下表所示的标准文件的形式来描述根据本文的用于亮度样本的分段函数索引过程的识别。在表10中,idxYInv可以被称为逆映射索引,并且可以基于重构亮度样本(lumaSample)推导逆映射索引。
[表10]
可以基于上述实施例和示例执行亮度映射,其中包括的上述句法和组件可以仅仅是示例性的表示,本文中的实施例不受上述表格或等式的限制。在下文中,描述一种基于亮度映射执行色度残差缩放(对残差样本的色度分量进行缩放)的方法。
(亮度相关)色度残差缩放被设计为补偿亮度信号与其相应色度信号之间的相互作用。例如,是否启用色度残差缩放也在拼块组级别发信号告知。在一个示例中,如果启用亮度映射并且如果双树分割(也被称为单独的色度树)未应用于当前拼块组,则发信号告知附加标志以指示是否启用亮度相关的色度残差缩放。在其他示例中,当不使用亮度映射时,或者当在当前拼块组中使用双树分割时,禁用亮度相关的色度残差缩放。在另一个示例中,对于面积小于或等于4的色度块,总是禁用亮度相关的色度残差缩放。
色度残差缩放可以基于相应亮度预测块(应用了帧内预测模式和/或帧间预测模式的预测块的亮度分量)的平均值。可以基于下面的等式3,利用定点整数算法来实现编码器端和/或解码器端的缩放操作。
[等式3]
c’=sign(c)*((abs(c)*s+2CSCALE_FP_PREC-1)>>CSCALE_FP_PREC)
在等式3中,c表示色度残差(色度残差样本、残差样本的色度分量),c'表示缩放的色度残差样本(残差样本的缩放色度分量),s表示色度残差缩放因子,以及CSCALE_FP_PREC表示(预定义的)常数值以指定精度。例如,CSCALE_FP_PREC可以是11。。
图9是图示了根据本文的实施例的用于推导色度残差缩放索引的方法的流程图。可以基于图6以及包括在与图6有关的描述中的表、等式、变量、阵列和函数执行图9的方法。
在步骤S910中,可以基于预测模式信息确定当前块的预测模式是帧内预测模式还是帧间预测模式。如果预测模式为帧内预测模式,则认为当前块或当前块的预测样本已经在整形(映射)区域中。如果预测模式为帧间预测模式,则认为当前块或当前块的预测样本在原始(未映射、未整形)区域中。
在步骤S920中,当预测模式为帧内预测模式时,可以计算(推导)当前块(或当前块的亮度预测样本)的平均。即直接计算已整形区域中的当前块的平均。平均也可以被称为平均值、平均数或均值。
在步骤S921中,当预测模式为帧间预测模式时,可以对当前块的亮度预测样本执行(应用)前向整形(前向映射)。通过前向整形,可以将基于帧间预测模式的亮度预测样本从原始区域映射到整形区域。在一个示例中,基于上表7所描述的整形模型来执行亮度预测样本的前向整形。
在步骤S922中,可以计算(推导)前向整形(前向映射)亮度预测样本的平均。即,可以执行前向整形结果的平均处理。
在步骤S930中,可以计算色度残差缩放索引。当预测模式为帧内预测模式时,可以基于亮度预测样本的平均计算色度残差缩放索引。当预测模式为帧间预测模式时,可以基于前向整形亮度预测样本的平均来计算色度残差缩放索引。
在实施例中,可以基于循环句法来计算色度残差缩放索引。下表示出了用于推导(计算)色度残差缩放索引的循环句法的示例。
[表11]
在表11中,idxS表示色度残差缩放索引,idxFound表示是否获得满足if语句条件的色度残差缩放索引的索引,S表示预定的常数值,以及MaxBinIdx表示最大允许bin索引。可以基于上表7和/或8推导ReshapPivot[idxS+1]。
在实施例中,可以基于色度残差缩放索引来推导色度残差缩放因子。等式4是用于推导色度残差缩放因子的示例。
[等式4]
s=ChromaScaleCoef[idxS]
在等式4中,s表示色度残差缩放因子,以及ChromaScaleCoef可以是基于上表7和/或表8推导的变量(或阵列)。
如上所述,可以获得参考样本的平均亮度值,并且可以基于平均亮度值推导色度残差缩放因子。如上所述,可以基于色度残差缩放因子来缩放色度分量残差样本,并且可以基于缩放的色度分量残差样本来生成色度分量重构样本。
在本文的一个实施例中,提出了一种用于有效地应用上述LMCS的信令结构。根据本文的实施例,例如,LMCS数据可以被包括在HLS(即APS)中,以及通过APS的下级的头信息(即图片头、切片头),可以通过发信号告知APS的ID(其被称为头信息)来自适应地推导LMCS模型(整形器模型)。可以基于LMCS参数推导LMCS模型。此外,例如,可以通过头信息发信号告知多个APS ID,并且通过这种方式,可以以相同图片/切片内的块为单位应用不同的LMCS模型。
在根据本文的一个实施例中,提出了一种用于有效地执行LMCS所需的操作的方法。根据上表8中所述的语义,需要通过片段长度lmcsCW[i](在本文中也记为RspCW[i])的除法运算来推导InvScaleCoeff[i]。逆映射的片段长度可能不是2的幂,这意味着不能通过比特移位来执行除法。
例如,计算InvScaleCoeff每个切片可能需要最多16个除法。根据上述表8,对于10比特编译,lmcsCW[i]的范围是从8到511,因此,为使用LUT实现lmcsCW[i]的除法运算,LUT的大小必须是504。另外,对于12比特编译,lmcsCW[i]的范围是从32到2047,因此,LUT大小需要是2016才能使用LUT实现lmcsCW[i]的除法运算。也就是说,除法在硬件实现中是昂贵的,因此期望尽可能避免除法。
在本实施例的一个方面中,可以将lmcsCW[i]约束为固定数(或预定数或预先确定数)的倍数。因此,可以减少用于除法的查找表(LUT)(LUT的容量或大小)。例如,如果lmcsCW[i]变成2的倍数,则用于替换除法过程的LUT的大小可能被减少一半。
在本实施例的另一方面中,提出了具有较高内部比特深度的编译。具有较高内部比特深度的编译可以是lmcsCW[i]的范围约束的上位条件。例如,如果编译比特深度高于10,则lmcsCW[i]可以被约束为1<<(BitDepthY-10)的倍数。在此,BitDepthY可以是亮度比特深度。因此,lmcsCW[i]的可能的值不会随着编译比特深度而改变,并且计算InvScaleCoeff所需的LUT的大小不会因为较高编译比特深度而增加。例如,对于12比特内部编译比特深度,将lmcsCW[i]的值限制为4的倍数,因此,替换除法过程的LUT的大小将与用于10比特编译的LUT的大小相同。该方面可以单独地实现,也可以与上述方面结合实现。
在该实施例的另一方面中,lmcsCW[i]可以被约束到更窄的范围。例如,lmcsCW[i]可以被约束在从(OrgCW>>1)到(OrgCW<<1)-1的范围内。因此对于10比特编译,lmcsCW[i]的范围可以是[32,127],因此,仅需要大小为96的LUT以计算InvScaleCoeff。
在本实施例的另一方面中,lmcsCW[i]可以近似为2的幂的最接近的数,并且在整形器设计中使用。因此,逆映射中的除法可以通过比特移位来执行(和替代)。
在根据本文的一个实施例中,提出了LMCS码字范围的约束。根据上表8,LMCS码字的值在从(OrgCW>>3)到(OrgCW<<3)-1的范围内。该码字范围太宽了。当RspCW[i]和OrgCW之间存在较大差异时,可能会导致视觉伪影问题。
根据本文的一个实施例,提出将LMCS PWL映射的码字约束到窄范围。例如,lmcsCW[i]的范围可以在(OrgCW>>1)到(OrgCW<<1)-1的范围内。
在根据本文的一个实施例中,提出使用单个色度残差缩放因子用于LMCS中的色度残差缩放。用于推导色度残差缩放因子的现有方法使用相应亮度块的平均值,并且将逆亮度映射的每个片段的斜率推导为相应的缩放因子。此外,识别分段索引的过程需要相应亮度块的可用性,这会导致延迟问题。这对于硬件实现来说是不可取的。根据本文的实施例,色度块中的缩放可以不取决于亮度块值,也可以不需要识别分段索引。因此,可以在没有延迟问题的情况下执行LMCS中的色度残差缩放过程。
在根据本文的一个实施例中,可以基于亮度LMCS信息,从编码器和解码器两者推导单个色度缩放因子。当接收到LMCS亮度模型时,可以更新色度残差缩放因子。例如,当更新LMCS模型时,可以更新单个色度残差缩放因子。
下表示出了根据本实施例的用于获得单个色度缩放因子的示例。
[表12]
参考表12,可以通过对lmcs_min_bin_idx和lmcs_max_bin_idx内的所有片段的逆亮度映射斜率进行平均来获得单个色度缩放因子(例如ChromaScaleCoeff或ChromaScaleCoeffSingle)。
图10图示了根据本文的实施例的轴心点的线性拟合。在图10中,示出了轴心点P1、Ps和P2。将利用图10描述下述实施例或其示例。
在该实施例的示例中,可以基于轴心点lmcs_min_bin_idx和lmcs_max_bin_idx+1之间的亮度PWL映射的线性近似来获得单个色度缩放因子。即,线性映射的逆斜率可以被用作色度残差缩放因子。例如,图10的线性线1可以是连接轴心点P1和P2的直线。参考图10,在P1中,输入值为x1以及映射值为0,以及在P2中,输入值为x2以及映射值为y2。线性线1的逆斜率(逆缩放)为(x2-x1)/y2,可以基于轴心点P1、P2的输入值和映射值以及下述等式,计算单个色度缩放因子ChromaScaleCoeffSingle。
[等式5]
ChromaScaleCoeffSingle=(x2-x1)*(1<<CSCALE_FP_PREC)/y2
在等式5中,CSCALE_FP_PREC表示移位因子,例如,CSCALE_FP_PREC可以是预定的常数值。在一个示例中,CSCALE_FP_PREC可以是11。
在根据本实施例的另一个示例中,参考图10,轴心点Ps处的输入值为min_bin_idx+1,以及轴心点Ps处的映射值为ys。相应地,线性线1的逆斜率(逆缩放)可以被计算为(xs-x1)/ys,并且可以基于轴心点P1,Ps的输入值和映射值以及以下等式,计算单个色度缩放因子ChromaScaleCoeffSingle。
[等式6]
ChromaScaleCoeffSingle=(xs-x1)*(1<<CSCALE_FP_PREC)/ys
在等式6中,CSCALE_FP_PREC表示移位因子(用于比特移位的因子),例如,CSCALE_FP_PREC可以是预定常数值。在一个示例中,CSCALE_FP_PREC可以是11,并且可以基于CSCALE_FP_PREC来执行逆缩放的比特移位。
在根据该实施例的另一示例中,可以基于线性近似线推导单个色度残差缩放因子。用于推导线性近似线的示例可以包括轴心点的线性连接(即,lmcs_min_bin_idx、lmcs_max_bin_idx+1)。例如,线性逼近结果可以用PWL映射的码字来表示。P2处的映射值y2可以是所有bin(分片)的码字之和,P2处的输入值与P1处的输入值之间的差(x2-x1)为OrgCW*(lmcs_max_bin_idx-lmcs_min_bin_idx+1)(对于OrgCW,见上表8)。下表示出了根据上述实施例获得单个色度缩放因子的示例。
[表13]
参考表13,可以从两个轴心点(即lmcs_min_bin_idx、lmcs_max_bin_idx)获得单个色度缩放因子(例如ChromaScaleCoeffSingle)。例如,线性映射的逆斜率可以用作色度缩放因子。
在该实施例的另一个示例中,可以通过轴心点的线性拟合来获得单个色度缩放因子以最小化线性拟合和现有PWL映射之间的误差(或均方差)。该示例可能比简单地连接lmcs_min_bin_idx和lmcs_max_bin_idx处的两个轴心点更准确。有很多方法可以找到最佳线性映射,在下文中描述这样的示例。
在一个示例中,可以基于下文的方程7和/或8来计算用于最小化最小二乘误差的总和的线性拟合方程y=b1*x+b0中的参数b1和b0。
[等式7]
[等式8]
在等式7和8中,x是原始亮度值,y是整形的亮度值,是x和y的均值,以及xi和yi表示第i个轴心点的值。
参考图10,识别线性映射的另一简单近似给出如下:
-通过连接lmcs_min_bin_idx和lmcs_max_bin_idx+1处的PWL映射的轴心点来获得线性线1,在OrgCW的倍数的输入值处计算该线性线的lmcs_pivots_linear[i]
-使用线性线1和使用PWL映射,总计轴心点映射值之间的差。
-获得平均差值avgDiff。
-根据平均差值(例如,2*avgDiff),调整线性线的最后轴心点
-将调整的线性线的逆斜率用作色度残差缩放。
根据上述线性拟合,可以基于下文的等式9或10推导(获得)色度缩放因子(即,前向映射的逆斜率)。
[等式9]
ChromaScaleCoeffSingle=OrgCW*(1<<CSCALE_FP_PREC)/lmcs_pivots_linear[lmcs_min_bin_idx+1]
[等式10]
ChromaScaleCoeffSingle=OrgCW*(lmcs_max_bin_idx-lmcs_max_bin_idx+1)*(1<<CSCALE_FP_PREC)/lmcs_pivots_linear[lmcs_max_bin_idx+1]
在上述等式中,lmcs_pivots_lienar[i]可以是线性映射的映射值。利用线性映射,最小和最大bin索引之间的所有PWL映射可以具有相同的LMCS码字(lmcsCW)。也就是说,lmcs_pivots_linear[lmcs_min_bin_idx+1]可能与lmcsCW[lmcs_min_bin_idx]相同。
此外,在等式9和10中,CSCALE_FP_PREC表示移位因子(用于比特移位的因子),例如,CSCALE_FP_PREC可以是预定的常数值。在一个示例中,CSCALE_FP_PREC可以是11。
利用单个色度残差缩放因子(ChromaScaleCoeffSingle),不需要计算相应亮度块的平均,在PWL线性映射中找到索引以得到色度残差缩放因子。因此,可以提高使用色度残差缩放的编译效率。这不仅消除了对相应亮度块的依赖,解决了延迟问题,而且还降低了复杂性。
在本文的另一个实施例中,编码器可以确定与单个色度缩放因子相关的参数并且将这些参数发信号告知解码器。利用信令,编码器可以利用编码器处可获得的其他信息来推导色度缩放因子。本实施例旨在消除色度残差缩放延迟问题。
例如,识别用于确定色度残差缩放因子的线性映射的另一个示例如下:
-通过连接lmcs_min_bin_idx和lmcs_max_bin_idx+1处的PWL映射的轴心点获得线性线1,在OrgCW的倍数的输入值处计算该线性线的lmcs_pivots_linear[i]
-使用线性线1和亮度PWL映射的轴心点,获得轴心点的映射值之间的差的加权和。权重可以基于编码器统计(诸如bin的直方图)。
-获取加权平均差值avgDiff。
-根据加权平均差值(例如2*avgDiff),调整线性线1的最后轴心点
-使用调整的线性线的逆斜率来计算色度残差缩放。
下表示出了用于发信号告知用于色度缩放因子推导的y值的句法的示例。
[表14]
在表14中,句法元素lmcs_chroma_scale可以指定用于LMCS色度残差缩放的单个色度(残差)缩放因子(ChromaScaleCoeffSingle=lmcs_chroma_scale)。即,关于色度残差缩放因子的信息可以被直接发信号告知,并且发信号告知的信息可以被推导为色度残差缩放因子。换言之,关于色度残差缩放因子的发信号告知的信息的值可以(直接)被推导为单个色度残差缩放因子的值。在此,句法元素lmcs_chroma_scale可以与其他LMCS数据(即,与码字的绝对值和符号相关的句法元素等)一起发信号告知。
可替代地,编码器可以仅发信号告知必要的参数以在解码器处推导色度残差缩放因子。为了在解码器处推导色度残差缩放因子,需要输入值x和映射值y。由于x值是bin长度,并且是已知数,因此无需发信号告知。结果,只需要发信号告知y值,以便推导色度残差缩放因子。在此,y值可能是线性映射中的任何轴心点的映射值(即,图10中的P2或Ps的映射值)。
下表示出了用于推导色度残差缩放因子的信令映射值的示例。
[表15]
[表16]
上表15和表16的句法之一可以被用于发信号告知在由编码器和解码器指定的任何线性轴心点处的y值。即,编码器和解码器可以使用相同的句法推导y值。
首先,描述根据表15的实施例。在表15中,lmcs_cw_linear可以表示Ps或P2处的映射值。即,在根据表15的实施例中,可以通过lmcs_cw_linear发信号告知固定数。
在根据该实施例的示例中,如果lmcs_cw_linear表示一个bin的映射值(即,图10的Ps中的lmcs_pivots_linear[lmcs_min_bin_idx+1]),则可以基于以下等式推导色度缩放因子。
[等式11]
ChromaScaleCoeffSingle=OrgCW*(1<<CSCALE_FP_PREC)/lmcs_cw_linear
在根据本实施例的另一示例中,如果lmcs_cw_linear表示lmcs_max_bin_idx+1(即图10的P2中的lmcs_pivots_linear[lmcs_max_bin_idx+1]),则可以基于以下等式推导色度缩放因子。
[等式12]
ChromaScaleCoeffSingle=OrgCW*(lmcs_max_bin_idx-lmcs_max_bin_idx+1)*(1<<CSCALE_FP_PREC)/lmcs_cw_linear
在上述等式中,CSCALE_FP_PREC表示移位因子(用于比特移位的因子),例如,CSCALE_FP_PREC可以是预定的常数值。在一个示例中,CSCALE_FP_PREC可以是11。
接下来,描述根据表16的实施例。在该实施例中,lmcs_cw_linear可以被发信号告知为相对于固定数的变化量值(即lmcs_delta_abs_cw_linear、lmcs_delta_sign_cw_linear_flag)。在该实施例的一个示例中,当lmcs_cw_linear表示lmcs_pivots_linear[lmcs_min_bin_idx+1]中的映射值(即图10的Ps)时,可以基于以下等式推导lmcs_cw_linear_delta和lmcs_cw_linear。
[等式13]
lmcs_cw_linear_delta=(1-2*lmcs_delta_sign_cw_linear_flag)*lmcs_delta_abs_linear_cw
[等式14]
lmcs_cw_linear=lmcs_cw_linear_delta+OrgCW
在该实施例的另一示例中,当lmcs_cw_linear表示lmcs_pivots_linear[lmcs_max_bin_idx+1]中的映射值(即图10的P2)时,可以基于以下等式推导lmcs_cw_linear_delta和lmcs_cw_linear。
[等式15]
lmcs_cw_linear_delta=(1-2*lmcs_delta_sign_cw_linear_flag)*lmcs_delta_abs_linear_cw
[等式16]
lmcs_cw_linear=lmcs_cw_linear_delta+OrgCW*(lmcs_max_bin_idx-lmcs_max_bin_idx+1)
在上述等式中,OrgCW可以是基于上述表8推导的值。
图11图示了根据本文的实施例的线性整形(或线性整形器、线性映射)的一个示例。即,在该实施例中,提出了在LMCS中使用线性整形器。例如,图11的该示例可能与前向线性整形(映射)有关。
在现有示例中,LMCS可以使用具有固定16个片段的分段线性映射。这使得整形器设计复杂化,因为轴心点之间的突然过渡可能会导致不良的伪影。另外,对于整形器的逆亮度映射,需要识别分段函数索引。分段函数索引识别过程是具有多次比较的迭代过程。此外,对于使用相应亮度块平均的色度残差缩放,还需要这样的亮度分段索引识别过程。这不仅存在复杂性问题,还会导致依赖于整个亮度块的重构的色度残差缩放延迟。为了解决该问题,对于LMCS提出了使用线性整形器。
参照图11,线性整形器可以包括两个轴心点,即P1和P2。P1和P2可以表示输入和映射值,例如P1可以是(min_input,0),并且P2可以是(max_input,max_mapped)。在此,min_input表示最小输入值,max_input表示最大输入值。小于或等于min_input的任何输入值被映射到0,大于max_input的任何输入值被映射到max_mapped。min_input和max_input内的任何输入亮度值被线性映射到其他值。图11示出了映射的示例。可以在编码器处确定轴心点P1、P2,以及可以使用线性拟合来近似分段线性映射。
有很多方法来发信号告知线性整形器。在发信号告知线性整形器的方法的示例中,原始亮度范围可以除以相等数量的bin。即,最小bin和最大bin之间的亮度映射可以均匀地分布。例如,所有bin可以具有相同的LMCS码字(lmcsCW)。为此,可以发信号告知最小和最大bin索引。因此,只需要发信号告知一组reshape_model_bin_delta_abs_CW(或reshaper_model_delta_abs_CW、lmcs_delta_abs_CW)以及reshaper_model_bin_delta_sign_CW_flag(或reshaper_model_delta_sign_CW_flag、lmcs_delta_sign_CW_flag)。
下表示例性地示出了根据该示例发信号告知线性整形器的句法和语义。
[表17]
lmcs_data(){ 描述符
log2_lmcs_num_bins_minus4 ue(v)
lmcs_min_bin_idx ue(v)
lmcs_delta_max_bin_idx ue(v)
lmcs_delta_cw_prec_minus1 ue(v)
lmcs_delta_abs_CW_linear u(v)
if(lmcs_delta_abs_CW_linear>0)
lmcs_delta_sign_CW_linear_flag u(l)
[表18]
参考表17和表18,句法元素log2_lmcs_num_bins_minus4可以是关于bin的数量的信息。基于该信息,可以发信号告知bin的数量以允许对最小和最大轴心点进行更精细的控制。在另一个现有示例中,编码器和/或解码器可以在没有信令的情况下推导(指定)(固定)数量的bin,例如,将bin的数量推导为16或32。然而,根据表17和18的示例,log2_lmcs_num_bins_minus4加4可以表示bin数量的以2为底的对数。基于句法元素推导的bin的数量可以在从4到亮度比特深度BitDepthY的值的范围内。
在表18中,ScaleCoeffSingle可以被称为单个亮度前向缩放因子,而InvScaleCoeffSingle可以被称为单个亮度逆向缩放因子。可以基于单个亮度前向缩放因子执行对预测亮度样本的(前向)映射,并且可以基于单个亮度逆向缩放因子执行对重构亮度样本的(逆向)映射。ChromaSclaeCoeffSingle,如上所述,可以被称为单个色度残差缩放因子。ScaleCoeffSingle、InvScaleCoeffSingle和ChromaSclaeCoeffSingle可以分别被用于前向亮度映射、逆向亮度映射和色度残差缩放。ScaleCoeffSingle、InvScaleCoeffSingle和ChromaSclaeCoeffSingle可以被作为单个因子统一应用于所有bin(16个binPWL映射)。
参考表18,FP_PREC和CSCALE_FP_PREC可以是用于比特移位的常数值。FP_PREC和CSCALE_FP_PREC可能相同也可能不同。例如,FP_PREC可能大于或等于CSCALE_FP_PREC。在一个示例中,FP_PREC和CSCALE_FP_PREC都可以是11。在另一个示例中,FP_PREC可以是15,而CSCALE_FP_PREC可以是11。
在发信号告知线性整形器的方法的另一个示例中,可以基于表19中的下述等式推导LMCS码字(lmcsCWlinearALL)。同样在该示例中,可以使用表17中的线性整形句法元素。下表示出了根据该示例描述的语义示例。
[表19]
参考表19,FP_PREC和CSCALE_FP_PREC可以是用于比特移位的常数值。FP_PREC和CSCALE_FP_PREC可能相同也可能不同。例如,FP_PREC可能大于或等于CSCALE_FP_PREC。在一个示例中,FP_PREC和CSCALE_FP_PREC都可以是11。在另一个例子中,FP_PREC可以是15,而CSCALE_FP_PREC可以是11。
在表19中,lmcs_max_bin_idx可以与LmcsMaxBinIdx互换使用。可以基于上述表17和18的句法的lmcs_delta_max_bin_idx推导lmcs_max_bin_idx和LmcsMaxBinIdx。因此,可以参考表18来解释表19。
在根据本文的另一个实施例中,可以提出用于发信号告知线性整形器的方法的另一个示例。可以明确地发信号告知线性整形器模型的轴心点P1、P2。下表示出了用于根据该示例明确地发信号告知线性整形器模型的句法和语义的示例。
[表20]
lmcs_data(){ 描述符
lmcs_min_input ue(v)
lmcs_max_input ue(v)
lmcs_max_mapped ue(v)
[表21]
参考表20和表21,可以基于句法元素lmcs_min_input推导第一轴心点的输入值,以及可以基于句法元素lmcs_max_input推导第二轴心点的输入值。第一轴心点的映射值可以是预定值(编码器和解码器都知道的值),例如第一轴心点的映射值是0。可以基于句法元素lmcs_max_mapped推导第二轴心点的映射值。也就是说,可以基于表20的句法中发信号告知的信息明确地(直接)发信号告知线性整形器模型。
可替代地,lmcs_max_input和lmcs_max_mapped可以发信号告知为变化量值。下表示出了用于将线性整形器模型发信号告知为变化量值的句法和语义的示例。
[表22]
lmcs_data(){ 描述符
lmcs_min_input ue(v)
lmcs_max_input_delta ue(v)
lmcs_max_mapped_delta ue(v)
[表23]
参考表23,可以基于句法元素lmcs_min_input推导第一轴心点的输入值。例如,lmcs_min_input的映射值可以为0。lmcs_max_input_delta可以指定第二轴心点的输入值与最大亮度值(即(1<<bitdepthY)-1)之间的差。lmcs_max_mapped_delta可以指定第二轴心点的映射值与最大亮度值(即(1<<bitdepthY)-1)之间的差。
根据本文的实施例,可以基于线性整形器的上述示例来执行亮度预测样本的前向映射、亮度重构样本的逆映射和色度残差缩放。在一个示例中,对于基于线性整形器的逆映射中的亮度(重构)样本(像素)的逆缩放,可以只需要一个逆缩放因子。对于前向映射和色度残差缩放也是如此。也就是说,确定ScaleCoeff[i]、InvScaleCoeff[i]和ChromaScaleCoeff[i](其中i是bin索引)的步骤可以替换为仅一个单个因子。在此,一个单个因子是线性映射的(前向)斜率或逆斜率的固定小数点表示。在一个示例中,可以基于下述等式中的至少一个推导逆向亮度映射缩放因子(用于亮度重构样本的逆映射中的逆向缩放因子)。
[等式17]
InvScaleCoeffSingle=OrgCW/lmcsCWLinear
[等式18]
InvScaleCoeffSingle=OrgCW*(lmcs_max_bin_idx-lmcs_max_bin_idx+1)/lmcsCWLinearAll
[等式19]
InvScaleCoeffSingle=(lmcs_max_input-lmcs_min_input)/lmcsCWLinearAll
可以从上述表17和18推导等式17的lmcsCWLinear。可以从上述表19至23中的至少一个推导等式18和19的lmcsCWLinearALL。在等式17或18中,可以从表8或18中推导OrgCW。
下表描述了指示在图片重构中,用于亮度样本(即亮度预测样本)的前向映射过程的等式和句法(条件语句)。在下述表和等式中,FP_PREC是用于比特移位的常数值,并且可以是预定值。例如,FP_PREC可以是11或15。
[表24]
[表25]
表24可以用于在基于上述表7和表8的亮度映射过程中推导前向映射亮度样本。即,表24可以与表7和表8一起描述。在表24中,可以从作为输入的亮度(预测)样本predSamples[i][j]推导作为输出的前向映射亮度(预测)样本PredMAPSamples[i][j]。表24的idxY可以被称为(前向)映射索引,以及可以基于预测亮度样本来推导映射索引。
表25可以用于在基于线性整形器的亮度映射中推导前向映射亮度样本。例如,可以由表20至表23中的至少一个,推导表25的lmcs_min_input、lmcs_max_input、lmcs_max_mapped和ScaleCoeffSingle。在表25中,在′lmcs_min_input<predSamples[i][j]<lmcs_max_input′的情况下,可以由输入(亮度(预测)样本predSamples[i][j])推导前向映射亮度(预测)样本PredMAPSamples[i][j]作为输出。比较表24和表25,从前向映射的角度可以看出根据线性整形器的应用的与现有LMCS的变化。
以下等式描述了用于亮度样本(即亮度重构样本)的逆映射过程。在以下等式中,“lumaSample”作为输入可以是逆映射之前(修改之前)的亮度重构样本。“invSample”作为输出可以是逆映射(修改)的亮度重构样本。在其他情况下,修剪的invSample可以被称为修改的亮度重构样本。
[等式20]
invSample=InputPivot[idxYInv]+(InvScaleCoeff[idxYInv]*(lumaSample-LmcsPivot[idxYInv])+(1<<(FP_PREC-1)))>>FP_PREC
[等式21]
invSample=lmcs_min_input+(InvScaleCoeffSingle*(lumaSample-lmcs_min_input)+(1<<(FP_PREC-1)))>>FP_PREC
参考等式20,可以基于上述表10推导索引idxInv。即,等式20可以用于在基于上述表7和8的亮度映射过程中推导逆映射亮度样本。等式20可以与上述表9一起描述。
等式21可以用于在基于线性整形器的亮度映射中推导逆映射亮度样本。例如,可以根据表20至表23中的至少一个推导等式21的lmcs_min_input。比较等式20和等式21,从前向映射的角度可以看出根据线性整形器的应用与现有LMCS的变化。
基于线性整形器的上述示例,可以省略分段索引识别过程。即,在本示例中,由于只有一个片段具有有效整形亮度像素,因此可以去除用于逆亮度映射和色度残差缩放的分段索引识别过程。因此,可以降低逆亮度映射的复杂度。此外,可以消除由取决于色度残差缩放期间的亮度分段索引识别导致的延迟问题。
根据使用上述线性整形器的实施例,可以为LMCS提供以下优点:i)可以简化编码器整形器设计,防止分段线性片段之间的突然变化可能造成的伪影;ii)在其中可以去除分段索引识别过程的解码器逆映射过程可以通过消除分段索引识别过程被简化;iii)通过去除分段索引识别过程,可以去除由取决于相应的亮度块引起的色度残差缩放的延迟问题;iv)可以减少信令开销,并且使整形器的频繁更新更加可行;v)对于过去需要16个片段循环的许多地方,可以消除循环。例如,要推导InvScaleCoeff[i],lmcsCW[i]的除法运算次数可以减少到1。
在根据本文的另一个实施例中,提出了基于灵活bin的LMCS。在此,灵活bin可以是指不固定为预定(预定义的、特定的)数量的bin的数量。在现有实施例中,LMCS中的bin的数量固定为16个,并且对于输入样本值均匀分布16个bin。在本实施例中,提出了灵活数量的bin,并且这些片段(bin)在原始像素值方面可能不是均匀分布的。
下表示例性地示出了根据该实施例的LMCS数据(数据字段)的句法和其中包括的句法元素的语义。
[表26]
[表27]
参考表26,可以发信号告知关于bin的数量lmcs_num_bins_minus1的信息。参考表27,lmcs_num_bins_minus1+1可以等于bin的数量,bin的数量可以在从1到(1<<BitDepthY)-1的范围内。例如,lmcs_num_bins_minus1或lmcs_num_bins_minus1+1可以是2的幂的倍数。
在连同表26和表27一起描述的实施例中,可以基于lmcs_num_bins_minus1(关于bin的数量的信息)推导轴心点的数量,而不管整形器是否是线性的(lmcs_num_bins_minus1的信令),以及可以基于发信号告知的码字值(lmcs_delta_input_cw[i],lmcs_delta_mapped_cw[i])(在此,初始输入值LmcsPivot_input[0]和初始输出值LmcsPivot_mapped[0]为0)的总和推导轴心点的输入值和映射值(LmcsPivot_input[i],LmcsPivot_mapped[i])。
图12示出了本文的实施例中的线性前向映射的示例。图13示出了本文的实施例中的逆前向映射的示例。在根据图12和图13的实施例中,提出了一种支持常规LMCS和线性LMCS两者的方法。在根据该实施例的示例中,可以基于句法元素lmcs_is_linear来指示常规LMCS和/或线性LMCS。在编码器中,在确定线性LMCS线之后,映射值(即,图12和图13的pL中的映射值)可以被分成相等的片段(即,LmcsMaxBinIdx-lmcs_min_bin_idx+1)。binLmcsMaxBinIdx中的码字可以使用上述用于lmcs数据或整形器模式的句法发信号告知。
下表示例性地示出了根据本实施例的示例的LMCS数据(数据字段)的句法和其中包括的句法元素的语义。
[表28]
[表29]
下表示例性地示出了根据本实施例的另一示例的LMCS数据(数据字段)的句法和其中包括的句法元素的语义。
[表30]
[表31]
参考表28至表31,当lmcs_is_linear_flag为真时,lmcs_min_bin_idx和LmcsMaxBinIdx之间的所有lmcsDeltaCW[i]可以具有相同的值。也就是说,lmcs_min_bin_idx和LmcsMaxBinIdx之间的所有片段的lmcsCW[i]可能具有相同的值。lmcs_min_bin_idx和LmcsMaxBinIdx之间的所有片段的缩放和逆缩放以及色度缩放可能相同。然后,如果线性整形器为真,则不需要推导片段索引,可以使用来自片段中的仅一个的缩放、逆缩放。
下表示例性地示出了根据本实施例的分段索引的识别过程。
[表32]
根据本文的另一个实施例,常规的16片段PWL LMCS和线性LMCS的应用可以取决于较高级别的句法(即,序列级)。
下表示例性地示出了根据本实施例的SPS的句法以及其中包括的句法元素的语义。
[表33]
sec_parameter_est_rbsp() 描述符
....
sps_linear_lmce_enabled_flag u(l)
...
[表34]
参考表33和34,可以通过包括在SPS中的句法元素来确定(发信号告知)启用常规LMCS和/或线性LMCS。参考表34,基于句法元素sps_linear_lmcs_enabled_flag,可以以序列为单位使用常规LMCS或线性LMCS之一。
此外,是否仅启用线性LMCS,或常规LMCS或两者也可以取决于简档级别。在一个示例中,对于特定的简档(即SDR简档),可能仅允许线性LMCS,而对于另一个简档(即,HDR简档),可能仅允许常规LMCS,而对于另一个简档,可能允许常规LMCS和/或线性LMCS两者。
根据本文的另一个实施例,LMCS分段索引识别过程可以用于逆亮度映射和色度残差缩放。在本实施例中,分段索引的识别过程可以用于色度残差缩放被启用的块,也可以被调用以用于整形(映射)域中的所有亮度样本。本实施例旨在保持其低复杂度。
下表示出了现有分段函数索引的识别过程(推导过程)。
[表35]
在示例中,在分段索引识别过程中,可以将输入样本分为至少两个类别。例如,输入样本可以分为三个类别,第一类别、第二类别和第三类别。例如,第一类别可以表示小于LmcsPivot[lmcs_min_bin_idx+1]的样本(其值),第二类别可以表示大于或等于LmcsPivot[LmcsMaxBinIdx]的样本(其值),第三类别可以指示在LmcsPivot[lmcs_min_bin_idx+1]和LmcsPivot[LmcsMaxBinIdx]之间的样本(的值)。
在本实施例中,提出通过消除类别分类来优化识别过程。这是因为分段索引识别过程的输入是整形(映射)域中的亮度值,在轴心点lmcs_min_bin_idx和LmcsMaxBinIdx+1处不应有超出映射值的值。因此,现有的分段索引识别过程中将样本分类为类别的条件性过程是不必要的。更详细的,下面结合表说明具体的示例。
在根据本实施例的示例中,表35中包括的识别过程可以用下表36或37之一代替。参考表36和表37,可以去掉表35的前两个类别,对于最后一个类别,将迭代循环中的边界值(第二边界值或终点)从LmcsMaxBinIdx改变为LmcsMaxBinIdx+1。即,可以简化识别过程并且可以降低分段索引推导的复杂度。因此,根据本实施例可以有效地执行LMCS相关编译。
[表36]
[表37]
参见表36,可以对从最小bin索引到最大bin索引的所有bin索引迭代地执行对应于if语句的条件的比较过程(对应于if语句的条件的等式)。在对应于if语句的条件的等式为真的情况下,可以将bin索引推导为逆亮度映射的逆映射索引(或色度残差缩放的逆缩放索引)。基于逆映射索引,可以推导修改的重构亮度样本(或缩放色度残差样本)。
创建以下附图以解释本说明书的具体示例。由于附图中描述的特定设备的名称或特定信号/消息/字段的名称以示例的方式呈现,因此本说明书的技术特征不限于以下附图中使用的特定名称。
图14和图15示意性地示出了根据本文的实施例的视频/图像编码方法和相关组件的示例。图14中公开的方法可以由图2中公开的编码装置执行。具体地,例如,图14的S1400可以由编码装置的残差处理器230或预测器220执行,而S1410可以由编码装置的预测器220或加法器250执行。S1420可以由编码设备的残差处理器230或加法器250执行,S1430和/或S1440可以由编码设备的残差处理器230执行,以及S1450可以由编码装置的熵编码器240执行。图14中公开的方法可以包括本文中的上述实施例。
参照图14,编码装置可以生成预测亮度样本(S1400)。关于预测亮度样本,编码装置可以基于预测模式来推导当前块的预测亮度样本。在这种情况下,可以应用本文中公开的各种预测方法,诸如帧间预测或帧内预测。
编码装置可以推导预测色度样本。编码装置可以基于当前块的原始色度样本和预测色度样本推导残差色度样本。例如,编码装置可以基于预测色度样本和原始色度样本之间的差来推导残差色度样本。
编码装置可以生成映射的预测亮度样本(S1410)。例如,编码装置可以推导用于亮度映射的轴心点的输入值和映射值(输出值),并且可以基于输入值和映射值生成映射的预测亮度样本。在一个示例中,编码设备可以基于第一预测亮度样本推导映射索引(idxY),并且可以基于输入值和与映射索引对应的轴心点的映射值生成第一映射的预测亮度样本。在其他示例中,可以使用线性映射(线性整形、线性LMCS)并且可以基于从线性映射中的两个轴心点推导的前向映射缩放因子来生成映射的预测亮度样本,因此由于线性映射,可以省略索引推导过程。
编码装置可以生成缩放的残差色度样本。具体地,编码装置可以推导色度残差缩放因子并且基于色度残差缩放因子生成缩放的残差色度样本。在此,编码端的色度残差缩放可以被称为前向色度残差缩放。因此,由编码装置推导的色度残差缩放因子可以被称为前向色度残差缩放因子,并且可以生成前向缩放残差色度样本。
编码装置可以基于映射的预测亮度样本推导LMCS相关信息(S1420)。此外,编码装置可以基于映射的预测亮度样本和/或缩放的残差色度样本生成LMCS相关信息。编码装置可以为重构样本生成LMCS相关信息。编码装置可以推导可以应用于对重构样本进行滤波的LMCS相关参数,并且可以基于LMCS相关参数生成LMCS相关信息。例如,LMCS相关信息可以包括关于亮度映射(即,前向映射、逆映射、线性映射)的信息、关于色度残差缩放的信息和/或与LMCS(或整形、整形器)相关的索引(即,最大bin索引、最小bin索引、映射索引)。
编码装置可以基于映射的预测亮度样本生成残差亮度样本(S1430)。例如,编码装置可以基于映射的预测亮度样本和原始亮度样本之间的差来推导残差亮度样本。
编码装置可以推导残差信息(S1440)。编码装置可以基于缩放的残差色度样本和/或残差亮度样本推导残差信息。编码装置可以基于缩放的残差色度样本和残差亮度样本的变换过程来推导变换系数。例如,变换过程可以包括DCT、DST、GBT或CNT中的至少一个。编码装置可以基于对变换系数的量化过程来推导量化的变换系数。量化的变换系数可以具有基于系数扫描顺序的一维向量形式。编码装置可以生成指定量化的变换系数的残差信息。残差信息可以通过各种编码方法(诸如指数哥伦布、CAVLC、CABAC等)生成。
编码装置可以对图像/视频信息进行编码(S1450)。图像信息可以包括LMCS相关信息和/或残差信息。例如,LMCS相关信息可以包括关于线性LMCS的信息。在一个示例中,可以基于关于线性LMCS的信息来推导至少一个LMCS码字。编码的视频/图像信息可以以比特流的形式输出。比特流可以通过网络或存储介质发送到解码设备。
根据本文的实施例,图像/视频信息可以包括各种信息。例如,图像/视频信息可以包括在上述表1至37的至少一个中公开的信息。
在一个实施例中,可以基于LMCS相关信息推导最小bin索引(即,lmcs_min_bin_idx)和/或最大bin索引(即,LmcsMaxBinIdx)。关于最小bin索引(即,lmcs_min_bin_idx)和/或最大bin索引(即,LmcsMaxBinIdx)的信息可以被包括在LMCS相关信息中。可以基于最小bin索引推导第一映射值(LmcsPivot[lmcs_min_bin_idx])。可以基于最大bin索引推导第二映射值(LmcsPivot[LmcsMaxBinIdx]或LmcsPivot[LmcsMaxBinIdx+1])。重构亮度样本的值(即,表36或37的lumaSample)可以在从第一映射值到第二映射值的范围内。在一个示例中,所有重构亮度样本的值可以在从第一映射值到第二映射值的范围内。在另一示例中,一些重构亮度样本的值可以在从第一映射值到第二映射值的范围内。
在一个实施例中,图像信息可以包括序列参数集(SPS)。SPS可以包括指定是否启用线性LMCS的线性LMCS启用标志。
在一个实施例中,编码装置可以生成(推导)用于色度残差缩放的分段索引。编码装置可以基于分段索引推导色度残差缩放因子。编码装置可以基于残差色度样本和色度残差缩放因子生成缩放残差色度样本。
在一个实施例中,色度残差缩放因子可以是单个色度残差缩放因子。
在一个实施例中,LMCS相关信息可以包括LMCS数据字段和关于线性LMCS的信息。关于线性LMCS的信息可以被称为关于线性映射的信息。LMCS数据字段可以包括指示是否应用线性LMCS的线性LMCS标志。当线性LMCS标志的值为1时,可以基于关于线性LMCS的信息生成映射的预测亮度样本。
在一个实施例中,关于线性LMCS的信息包括关于第一轴心点(即,图11中的P1)的信息和关于第二轴心点(即,图11中的P2)的信息。例如,第一轴心点的输入值和映射值分别为最小输入值和最小映射值。第二轴心点的输入值和映射值分别为最大输入值和最大映射值。线性地映射最小输入值和最大输入值之间的输入值。
在一个实施例中,图像信息包括关于最大输入值的信息和关于最大映射值的信息。最大输入值等于关于最大输入值的信息的值(即,表20中的lmcs_max_input)。最大映射值等于关于最大映射值的信息的值(即,表20中的lmcs_max_mapped)。
在一个实施例中,关于线性映射的信息包括关于第二轴心点的输入变化量值的信息(即,表22中的lmcs_max_input_delta)和关于第二轴心点的映射变化量值的信息(即,表22中的lmcs_max_mapped_delta)。可以基于第二轴心点的输入变化量值推导最大输入值,并且可以基于第二轴心点的映射变化量值推导最大映射值。
在一个实施例中,可以基于包括在上述表23中的至少一个等式推导最大输入值和最大映射值。
在一个实施例中,生成映射的预测亮度样本包括推导用于预测亮度样本的前向映射缩放因子(即ScaleCoeffSingle),并且基于前向映射缩放因子生成映射的预测亮度样本。前向映射缩放因子可以是用于预测亮度样本的单个因子。
在一个实施例中,可以基于包括在上述表21和/或表23中的至少一个等式推导前向映射缩放因子。
在一个实施例中,可以基于包括在上述表25中的至少一个等式推导映射的预测亮度样本。
在一个实施例中,编码装置可以推导用于重构亮度样本(即,lumaSample)的逆映射缩放因子(即,InvScaleCoeffSingle)。此外,编码装置可以基于重构亮度样本和逆映射缩放因子生成修改的重构亮度样本(即,invSample)。逆映射缩放因子可以是用于重构亮度样本的单个因子。
在一个实施例中,可以使用基于重构亮度样本推导的分段索引来推导逆映射缩放因子。
在一个实施例中,可以基于上述表36推导分段索引。即,可以从作为最小bin索引的分段索引到作为最大bin索引的分段索引迭代地执行包括在表36中的比较过程(lumaSample<LmcsPivot[idxYInv+1])。
在一个实施例中,可以基于以从最小bin索引到最大bin索引的bin索引为基础的映射值来生成修改的重构亮度样本。
在一个实施例中,bin索引包括指示第一映射值的第一bin索引。可以基于以从最小bin索引到最大bin索引的bin索引为基础的映射值以及重构亮度样本的值之间的比较来推导第一bin索引。可以基于重构亮度样本和第一映射值来推导修改的重构亮度样本中的至少一个。
在一个实施例中,bin索引包括指示第一映射值的第一bin索引,并且可以基于包括在表36中的比较式(lumaSample<LmcsPivot[idxYInv+1])推导第一bin索引。例如,在上述式中,lumaSample表示重构亮度样本中的目标亮度样本的值,idxYInv表示bin索引之一,以及LmcsPivot[idxYinv+1]表示基于从最小bin索引到最大bin的bin索引的映射值之一。可以基于重构亮度样本和第一映射值推导重构亮度样本中的至少一个。
在一个实施例中,可以对从最小bin索引到最大bin索引的所有bin索引执行表36中包括的比较过程(lumaSample<LmcsPivot[idxYInv+1])。
在一个实施例中,可以基于包括在表18、19、21和23中的等式或上述等式11或12中的至少一个来推导逆映射缩放因子。
在实施例中,可以基于上述等式21推导修改的重构亮度样本。
在一个实施例中,LMCS相关信息可以包括关于用于推导映射的预测亮度样本的bin的数量的信息(即,表26中的lmcs_num_bins_minus1)。例如,用于亮度映射的轴心点的数量可以被设置为等于bin的数量。在一个示例中,编码装置可以分别根据bin的数量生成轴心点的变化量输入值和变化量映射值。在一个示例中,基于变化量输入值(即表26中的lmcs_delta_input_cw[i])和变化量映射值(即表26中的lmcs_delta_mapped_cw[i])推导轴心点的输入值和映射值,并且可以基于输入值(即表27的LmcsPivot_input[i],或表8的InputPivot[i])和映射值(即表27的LmcsPivot_mapped[i],或表8的LmcsPivot[i])生成映射的预测亮度样本。
在一个实施例中,编码装置可以基于至少一个LMCS码字和包括在LMCS相关信息中的原始码字(OrgCW)推导LMCS变化量码字,并且可以基于至少一个LMCS码字和原始码字推导映射的亮度预测样本。在一个示例中,关于线性映射的信息可以包括关于LMCS变化量码字的信息。
在一个实施例中,可以基于LMCS变化量码字和OrgCW的总和推导至少一个LMCS码字,例如OrgCW是(1<<BitDepthY)/16,其中BitDepthY表示亮度比特深度。该实施例可以基于等式12。
在一个实施例中,可以基于LMCS变化量码字和OrgCW*(lmcs_max_bin_idx-lmcs_min_bin_idx+1)的总和推导至少一个LMCS码字,例如,lmcs_max_bin_idx和lmcs_min_bin_idx分别是最大bin索引和最小bin索引,并且OrgCW可以是(1<<BitDepthY)/16。该实施例可以基于等式15和16。
在一个实施例中,至少一个LMCS码字可以是二的倍数。
在实施例中,当重构亮度样本的亮度比特深度(BitDepthY)大于10时,至少一个LMCS码字可以是1<<(BitDepthY-10)的倍数。
在一个实施例中,至少一个LMCS码字可以在从(OrgCW>>1)到(OrgCW<<1)-1的范围内。
图16和图17示意性地示出了根据本文的实施例的图像/视频解码方法和相关组件的示例。图16中公开的方法可以由图3所示的解码装置执行。具体地,例如,图16的S1600可以由解码装置的熵解码器310执行,S1610可以由解码装置的预测器330执行,S1620可以由解码装置的残差处理器320、预测器330和/或加法器340执行,以及S1630可以由解码装置的加法器340执行。图16中公开的方法可以包括本文中的上述实施例。
参照图16,解码装置可以接收/获得视频/图像信息(S1600)。视频/图像信息可以包括LMCS相关信息。例如,LMCS相关信息可以包括关于亮度映射(即,前向映射、逆映射、线性映射)的信息、关于色度残差缩放的信息和/或与LMCS(或整形、整形器)相关的索引(即,最大bin索引、最小bin索引、映射索引)。解码装置可以通过比特流接收/获得图像/视频信息。
根据本文的实施例,图像/视频信息可以包括各种信息。例如,图像/视频信息可以包括在上述表1至37的至少一个中公开的信息。
解码装置可以生成预测亮度样本(S1610)。解码装置可以基于预测模式推导当前块的预测亮度样本。在这种情况下,可以应用本文中公开的各种预测方法,诸如帧间预测或帧内预测。
图像信息可以包括残差信息。解码装置可以基于残差信息生成残差色度样本和/或残差亮度样本。具体地,解码装置可以基于残差信息推导量化的变换系数。量化的变换系数可以具有基于系数扫描顺序的一维向量形式。解码装置可以基于量化的变换系数的去量化过程来推导变换系数。解码装置可以基于变换系数推导残差色度样本和/或残差亮度样本。
解码装置可以生成映射的预测亮度样本(S1620)。例如,解码装置可以推导用于亮度映射的轴心点的输入值和映射值(输出值),并且可以基于输入值和映射值生成映射的预测亮度样本。在一个示例中,解码装置可以基于第一预测亮度样本推导(前向)映射索引(idxY),并且可以基于输入值和与映射索引对应的轴心点的映射值生成第一映射的预测亮度样本。在其他示例中,可以使用线性映射(线性整形、线性LMCS)并且可以基于从线性映射中的两个轴心点推导的前向映射缩放因子来生成映射的预测亮度样本,因此由于线性映射,可以省略索引推导过程。
解码装置可以生成重构亮度样本(S1630)。解码装置可以基于映射的预测亮度样本生成重构亮度样本。具体地,解码装置可以对残差亮度样本与映射的预测亮度样本求和,并且可以基于求和的结果生成重构亮度样本。
解码装置可以生成缩放的残差色度样本。具体地,解码装置可以推导色度残差缩放因子并且基于色度残差缩放因子生成缩放的残差色度样本。在此,与编码侧相反,解码侧的色度残差缩放可以被称为逆色度残差缩放。相应地,由解码装置推导的色度残差缩放因子可以被称为逆色度残差缩放因子,并且可以生成逆缩放的残差色度样本。
解码装置可以生成重构色度样本。解码装置可以基于缩放的残差色度样本生成重构色度样本。具体地,解码装置可以执行用于色度分量的预测过程,并且生成预测色度样本。解码装置可以基于预测色度样本和缩放的残差色度样本的总和来生成重构色度样本。
在一个实施例中,可以基于LMCS相关信息推导最小bin索引(例如lmcs_min_bin_idx)和/或最大bin索引(例如LmcsMaxBinIdx)。可以基于最小bin索引推导第一映射值(LmcsPivot[lmcs_min_bin_idx])。可以基于最大bin索引推导第二映射值(LmcsPivot[LmcsMaxBinIdx]或LmcsPivot[LmcsMaxBinIdx+1])。重构亮度样本的值(即,表36或表37的lumaSample)可以在从第一映射值到第二映射值的范围内。在一个示例中,所有重构亮度样本的值可以在从第一映射值到第二映射值的范围内。在另一示例中,一些重构亮度样本的值可以在从第一映射值到第二映射值的范围内。
在一个实施例中,图像信息可以包括序列参数集(SPS)。SPS可以包括指定是否启用线性LMCS的线性LMCS启用标志。
在一个实施例中,可以基于LMCS相关信息来识别分段索引(即,表35、36或37中的idxYInv)。解码装置可以基于分段索引推导色度残差缩放因子。解码装置可以基于残差色度样本和色度残差缩放因子生成缩放残差色度样本。
在一个实施例中,色度残差缩放因子可以是单个色度残差缩放因子。
在一个实施例中,LMCS相关信息可以包括LMCS数据字段和关于线性LMCS的信息。关于线性LMCS的信息可以被称为关于线性映射的信息。LMCS数据字段可以包括指示是否应用线性LMCS的线性LMCS标志。当线性LMCS标志的值为1时,可以基于关于线性LMCS的信息生成映射的预测亮度样本。
在一个实施例中,关于线性LMCS的信息包括关于第一轴心点(即,图11中的P1)的信息和关于第二轴心点(即,图11中的P2)的信息。例如,第一轴心点的输入值和映射值分别为最小输入值和最小映射值。第二轴心点的输入值和映射值分别为最大输入值和最大映射值。线性地映射最小输入值和最大输入值之间的输入值。
在一个实施例中,图像信息包括关于最大输入值的信息和关于最大映射值的信息。最大输入值等于关于最大输入值的信息的值(即,表20中的lmcs_max_input)。最大映射值等于关于最大映射值的信息的值(即,表20中的lmcs_max_mapped)。
在一个实施例中,关于线性映射的信息包括关于第二轴心点的输入变化量值的信息(即,表22中的lmcs_max_input_delta)和关于第二轴心点的映射变化量值的信息(即,表22中的lmcs_max_mapped_delta)。可以基于第二轴心点的输入变化量值推导最大输入值,并且可以基于第二轴心点的映射变化量值推导最大映射值。
在一个实施例中,可以基于包括在上述表23中的至少一个等式推导最大输入值和最大映射值。
在一个实施例中,生成映射的预测亮度样本包括推导用于预测亮度样本的前向映射缩放因子(即ScaleCoeffSingle),并且基于前向映射缩放因子生成映射的预测亮度样本。前向映射缩放因子可以是用于预测亮度样本的单个因子。
在一个实施例中,可以使用基于重构亮度样本推导的分段索引来推导逆映射缩放因子。
在一个实施例中,分段索引可以基于上述表36推导。即,可以从作为最小bin索引的分段索引到作为最大bin索引的分段索引迭代地执行包括在表36中的比较过程(lumaSample<LmcsPivot[idxYInv+1])。
在一个实施例中,可以基于以从最小bin索引到最大bin索引的bin索引为基础的映射值来生成修改的重构亮度样本。
在一个实施例中,bin索引包括指示第一映射值的第一bin索引。可以基于以从最小bin索引到最大bin索引的bin索引为基础的映射值以及重构亮度样本的值之间的比较来推导第一bin索引。可以基于重构亮度样本和第一映射值来推导修改的重构亮度样本中的至少一个。
在一个实施例中,bin索引包括指示第一映射值的第一bin索引,并且可以基于包括在表36中的比较式(lumaSample<LmcsPivot[idxYInv+1])推导第一bin索引。例如,在上述式中,lumaSample表示重构亮度样本中的目标亮度样本的值,idxYInv表示bin索引之一,以及LmcsPivot[idxYinv+1]表示基于从最小bin索引到最大bin索引的bin索引的映射值之一。可以基于重构亮度样本和第一映射值推导重构亮度样本中的至少一个。
在一个实施例中,可以对从最小bin索引到最大bin索引的所有bin索引执行表36中包括的比较过程(lumaSample<LmcsPivot[idxYInv+1])。
在一个实施例中,可以基于包括在上述表21和/或表23中的至少一个等式推导前向映射缩放因子。
在一个实施例中,可以基于包括在上述表25中的至少一个等式推导映射的预测亮度样本。
在一个实施例中,解码装置可以推导用于重构亮度样本(即,lumaSample)的逆映射缩放因子(即,InvScaleCoeffSingle)。此外,解码装置可以基于重构亮度样本和逆映射缩放因子生成修改的重构亮度样本(即,invSample)。逆映射缩放因子可以是用于重构亮度样本的单个因子。
在一个实施例中,可以基于包括在表18、19、21和23中的等式或上述等式11或12中的至少一个来推导逆映射缩放因子。
在实施例中,可以基于上述等式21推导修改的重构亮度样本。
在一个实施例中,LMCS相关信息可以包括关于用于推导映射的预测亮度样本的bin的数量的信息(即,表26中的lmcs_num_bins_minus1)。例如,用于亮度映射的轴心点的数量可以被设置为等于bin的数量。在一个示例中,解码装置可以分别根据bin的数量生成轴心点的变化量输入值和变化量映射值。在一个示例中,基于变化量输入值(即表26中的lmcs_delta_input_cw[i])和变化量映射值(即表26中的lmcs_delta_mapped_cw[i])推导轴心点的输入值和映射值,并且可以基于输入值(即表27的LmcsPivot_input[i],或表8的InputPivot[i])和映射值(即表27的LmcsPivot_mapped[i],或表8的LmcsPivot[i])生成映射的预测亮度样本。
在一个实施例中,解码装置可以基于至少一个LMCS码字和包括在LMCS相关信息中的原始码字(OrgCW)推导LMCS变化量码字,并且可以基于至少一个LMCS码字和原始码字推导映射的亮度预测样本。在一个示例中,关于线性映射的信息可以包括关于LMCS变化量码字的信息。
在一个实施例中,可以基于LMCS变化量码字和OrgCW的总和推导至少一个LMCS码字,例如OrgCW是(1<<BitDepthY)/16,其中BitDepthY表示亮度比特深度。该实施例可以基于等式12。
在一个实施例中,可以基于LMCS变化量码字和OrgCW*(lmcs_max_bin_idx-lmcs_min_bin_idx+1)的总和推导至少一个LMCS码字,例如,lmcs_max_bin_idx和lmcs_min_bin_idx分别是最大bin索引和最小bin索引,并且OrgCW可以是(1<<BitDepthY)/16。该实施例可以基于等式15和16。
在一个实施例中,至少一个LMCS码字可以是二的倍数。
在实施例中,当重构亮度样本的亮度比特深度(BitDepthY)大于10时,至少一个LMCS码字可以是1<<(BitDepthY-10)的倍数。
在一个实施例中,至少一个LMCS码字可以在从(OrgCW>>1)到(OrgCW<<1)-1的范围内。
在上述实施例中,基于具有一系列步骤或框的流程图来描述方法。本公开不限于上述步骤或框的顺序。一些步骤或框可以与如上所述的其他步骤或框同时发生或以不同的顺序发生。此外,本领域技术人员将理解到,上述流程图中所示的步骤并非排他性的,在不影响本公开的范围的情况下,可以包括进一步的步骤,或者可以删除流程图中的一个或多个步骤。
可以以软件形式实现根据本文的上述实施例的方法,以及根据本文的编码设备和/或解码设备例如可以被包括在执行TV、计算机、智能手机、机顶盒、显示设备等的图像处理的设备中。
当以软件实现本文中的实施例时,上述方法可以被实现为执行上述功能的模块(进程、函数等)。模块可以存储在存储器中并由处理器执行。存储器可以在处理器内部或外部,并且可以通过各种众所周知的方式耦合到处理器。处理器可以包括专用集成电路(ASIC)、其他芯片组、逻辑电路和/或数据处理设备。存储器可以包括只读存储器(ROM)、随机存取存储器(RAM)、闪存、存储器卡、存储介质和/或其他存储设备。即,本文中描述的实施例可以在处理器、微处理器、控制器或芯片上实现和执行。例如,各图中所示的功能单元可以在计算机、处理器、微处理器、控制器或芯片上实现和执行。在这种情况下,关于指令的信息或用于实现的算法可以被存储在数字存储介质中。
此外,应用本公开的解码装置和编码装置可以被包括在多媒体广播传输/接收装置、移动通信终端、家庭影院视频装置、数字影院视频装置、监控摄像机、视频聊天装置、诸如视频通信的实时通信装置、移动流传输装置、存储介质、摄像机、VoD服务提供装置、过顶(OTT)视频装置、互联网流传输服务提供装置、三维(3D)视频装置、电话会议视频装置、交通用户设备(即车辆用户设备、飞机用户设备、船舶用户设备等)和医疗视频装置,并且可以被用于处理视频信号和数据信号。例如,过顶(OTT)视频装置可以包括游戏机、蓝光播放器、互联网接入电视、家庭影院系统、智能手机、平板电脑、数字录像机(DVR)等。
此外,应用本文的处理方法可以以将由计算机执行的程序的形式产生并且可以被存储在计算机可读记录介质中。具有根据本公开的数据结构的多媒体数据也可以被存储在计算机可读记录介质中。计算机可读记录介质包括所有类型的存储设备,其中存储了可由计算机系统读取的数据。例如,计算机可读记录介质可以包括BD、通用串行总线(USB)、ROM、PROM、EPROM、EEPROM、RAM、CD-ROM、磁带、软盘和光学数据存储设备。此外,计算机可读记录介质包括以载波形式(即,通过互联网传输)实现的介质。此外,通过编码方法生成的比特流可以被存储在计算机可读记录介质中或者可以通过有线/无线通信网络发送。
另外,本文的实施例可以利用根据程序代码用计算机程序产品来实现,程序代码可以通过本文实施例在计算机中执行。程序代码可以被存储可由计算机读取的载体上。
图18示出了可以应用本文中公开的实施例的内容流传输系统的示例。
参照图18,应用本文的实施例的内容流传输系统可以主要包括编码服务器、流传输服务器、网络服务器、媒体存储、用户设备和多媒体输入设备。
编码服务器将从诸如智能手机、相机、摄像机等多媒体输入设备输入的内容压缩成数字数据以生成比特流并将该比特流发送到流传输服务器。又如,当诸如智能手机、相机、摄像机等多媒体输入设备直接生成比特流时,可以省略编码服务器。
比特流可以通过应用本公开的实施例的编码方法或比特流生成方法生成,以及流传输服务器可以在发送或接收比特流的过程中临时存储比特流。
流传输服务器基于用户通过网络服务器的请求,将多媒体数据发送到用户设备,以及网络服务器用作将服务告知用户的媒介。当用户从网络服务器请求所需的服务时,网络服务器将其传递给流传输服务器,流传输服务器将多媒体数据发送给用户。在这种情况下,内容流传输系统可以包括单独的控制服务器。在这种情况下,控制服务器用于控制内容流传输系统中的设备之间的命令/响应。
流传输服务器可以从介质存储和/或编码服务器接收内容。例如,当从编码服务器接收到内容时,可以实时接收该内容。在这种情况下,为了提供流畅的流传输服务,流传输服务器可以将比特流存储预定时间。
用户设备的示例可以包括移动电话、智能电话、膝上型计算机、数字广播终端、个人数字助理(PDA)、便携式多媒体播放器(PMP)、导航、板式PC、平板PC、超级本、可穿戴设备(例如智能手表、智能眼镜、头戴式显示器)、数字电视、台式计算机、数字标牌等。内容流传输系统中的每个服务器都可以被操作为分布式服务器运行,在这种情况下,可以分发从每个服务器接收到的数据。
内容流传输系统中的每个服务器可以被操作为分布式服务器,在这种情况下,可以分发和处理从每个服务器接收的数据。
在此描述的权利要求可以以各种方式组合。例如,可以将本文的方法权利要求的技术特征组合并且实现为装置,以及将本文的装置权利要求的技术特征组合并实现为方法。此外,本文方法权利要求的技术特征和装置权利要求的技术特征可以组合以实现为装置,以及本文的方法权利要求的技术特征和装置权利要求的技术特征可以组合并且被实现为方法。

Claims (16)

1.一种由解码装置执行的图像解码方法,所述方法包括:
从比特流中获得图像信息,所述图像信息包括预测相关信息以及亮度映射与色度缩放LMCS相关信息;
基于所述预测相关信息,生成预测亮度样本;
基于所述预测亮度样本,生成重构亮度样本;
基于所述LMCS相关信息,推导分段函数索引;以及
基于所述重构亮度样本和所述分段函数索引,生成修改的重构亮度样本;
其中,基于所述LMCS相关信息推导最小bin索引和最大bin索引,
其中,推导所述分段函数索引包括:
确定在所述分段函数索引等于所述最小bin索引的情况下,第一映射值是否大于所述重构亮度样本的值;
确定在所述分段函数索引等于所述最大bin索引-1的情况下,第二映射值是否大于所述重构亮度样本的值;
基于确定在所述分段函数索引等于所述最大bin索引-1的情况下,所述第二映射值不大于所述重构亮度样本的值,确定在所述分段函数索引等于所述最大bin索引的情况下,第三映射值是否大于所述重构亮度样本的值,以及
其中,基于确定在所述分段函数索引等于所述最大bin索引-1的情况下所述第二映射值不大于所述重构亮度样本的值,基于确定所述第三映射值大于所述重构亮度样本的值,将所述分段函数索推导为所述最大bin索引。
2.根据权利要求1所述的方法,其中,所述图像信息包括序列参数集SPS,以及
其中,所述SPS包括指定是否启用线性LMCS的线性LMCS启用标志。
3.根据权利要求1所述的方法,其中,所述图像信息包括残差信息,
其中,基于所述残差信息生成残差色度样本,
其中,基于所述分段函数索引推导色度残差缩放因子,以及
其中,基于所述残差色度样本和所述色度残差缩放因子,生成缩放的残差色度样本。
4.根据权利要求3所述的方法,其中,所述色度残差缩放因子是单个色度残差缩放因子。
5.根据权利要求1所述的方法,其中,所述LMCS相关信息包括LMCS数据字段和关于线性LMCS的信息,
其中,所述LMCS数据字段包括指示是否应用所述线性LMCS的线性LMCS标志,以及
其中,基于所述线性LMCS标志的值为1,基于所述关于线性LMCS的信息,生成映射的预测亮度样本。
6.根据权利要求5所述的方法,其中,所述关于线性LMCS的信息包括关于第一轴心点的信息和关于第二轴心点的信息,
其中,所述第一轴心点的输入值和映射值分别是最小输入值和最小映射值,
其中,所述第二轴心点的输入值和映射值分别是最大输入值和最大映射值,以及
其中,线性地映射所述最小输入值和所述最大输入值之间的输入值。
7.根据权利要求6所述的方法,其中,所述图像信息包括关于所述最大输入值的信息和关于所述最大映射值的信息,
其中,所述最大输入值等于关于所述最大输入值的信息的值,以及
其中,所述最大映射值等于关于所述最大映射值的信息的值。
8.根据权利要求6所述的方法,其中,所述关于线性LMCS的信息包括关于所述第二轴心点的输入变化量值的信息和关于所述第二轴心点的映射变化量值的信息,
其中,基于所述第二轴心点的输入变化量值推导所述最大输入值,以及
其中,基于所述第二轴心点的映射变化量值推导所述最大映射值。
9.根据权利要求1所述的方法,其中,所述方法进一步包括生成映射的预测亮度样本,以及
其中,生成所述映射的预测亮度样本包括:
推导所述预测亮度样本的前向映射缩放因子;
基于所述前向映射缩放因子,生成所述映射的预测亮度样本,以及
其中,所述前向映射缩放因子是用于所述预测亮度样本的单个因子。
10.根据权利要求1所述的方法,其中,在所述分段函数索引等于所述最大bin索引-1的情况下所述第二映射值是由所述最大bin索引指示的bin中的映射值,以及
其中,在所述分段函数索引等于所述最大bin索引的情况下所述第三映射值是由所述最大bin索引+1指示的bin中的映射值。
11.根据权利要求1所述的方法,其中,推导所述分段函数索引包括:
针对从lmcs_min_bin_idx的值到LmcsMaxBinIdx的值的范围中的每个idxYInv,重复地检查条件是否为真,
其中,所述条件是lumaSample的值是否小于LmcsPivot[idxYInv+1]的值,并且
其中,所述分段函数索引被导出为对应于所述条件为真的所述idxYInv的值,
其中,所述idxYInv表示所述分段函数索引,所述lmcs_min_bin_idx表示所述最小bin索引,所述LmcsMaxBinIdx表示所述最大bin索引,所述lumaSample表示所述重构亮度样本的值,以及所述LmcsPivot[idxYInv+1]表示第idxYInv+1个bin中的映射值。
12.根据权利要求11所述的方法,其中,所述最小bin索引不等于0。
13.根据权利要求1所述的方法,其中,所述LMCS相关信息包括关于用于推导映射的预测亮度样本的bin的数量的信息,
其中,用于亮度映射的轴心点的数量被设置为等于bin的数量,
其中,发信号告知与所述bin的数量一样多的所述轴心点的变化量输入值和变化量映射值,
其中,基于所述变化量输入值和所述变化量映射值,推导所述轴心点的输入值和映射值,以及
其中,基于所述输入值和所述映射值,生成所述映射的预测亮度样本。
14.一种由编码装置执行的图像编码方法,所述方法包括:
生成预测亮度样本;
基于所述预测亮度样本,生成映射的预测亮度样本;
基于所述映射的预测亮度样本,生成亮度映射与色度缩放LMCS相关信息;
基于所述映射的预测亮度样本,生成残差亮度样本;
基于所述残差亮度样本推导残差信息;以及
编码图像信息,所述图像信息包括所述LMCS相关信息和所述残差信息,
其中,所述图像编码方法进一步包括:
基于所述预测亮度样本,生成重构亮度样本;
基于所述LMCS相关信息,推导分段函数索引;以及
基于所述重构亮度样本和所述分段函数索引,生成修改的重构亮度样本,
其中,基于所述LMCS相关信息推导最小bin索引和最大bin索引,
其中,推导所述分段函数索引包括:
确定在所述分段函数索引等于所述最小bin索引的情况下,第一映射值是否大于所述重构亮度样本的值;
确定在所述分段函数索引等于所述最大bin索引-1的情况下,第二映射值是否大于所述重构亮度样本的值;
基于确定在所述分段函数索引等于所述最大bin索引-1的情况下,所述第二映射值不大于所述重构亮度样本的值,确定在所述分段函数索引等于所述最大bin索引的情况下,第三映射值是否大于所述重构亮度样本的值,以及
其中,基于确定在所述分段函数索引等于所述最大bin索引-1的情况下所述第二映射值不大于所述重构亮度样本的值,基于确定所述第三映射值大于所述重构亮度样本的值,将所述分段函数索引推导为所述最大bin索引。
15.根据权利要求14所述的方法,其中,所述方法进一步包括:
生成残差色度样本;
基于所述分段函数索引,推导色度残差缩放因子;以及
基于所述残差色度样本和色度残差缩放因子,生成缩放的残差色度样本。
16.一种发送图像信息的数据的方法,包括:
获取图像信息的比特流,所述图像信息包括亮度映射与色度缩放LMCS相关信息和残差信息,其中,通过生成预测亮度样本、基于所述预测亮度样本生成映射的预测亮度样本以及基于所述映射的预测亮度样本推导所述LMCS相关信息来生成所述LMCS相关信息,以及其中,通过基于所述映射的预测亮度样本生成残差亮度样本,以及基于所述残差亮度样本推导残差信息来生成所述残差信息;以及
发送包括所述图像信息的比特流的所述数据,所述图像信息包括所述LMCS相关信息和所述残差信息,
其中,基于所述预测亮度样本生成重构亮度样本;
其中,基于所述LMCS相关信息推导分段函数索引;以及
其中,基于所述重构亮度样本和所述分段函数索引,生成修改的重构亮度样本,
其中,基于所述LMCS相关信息推导最小bin索引和最大bin索引,
其中,为推导所述分段函数索引,
确定在所述分段函数索引等于所述最小bin索引的情况下,第一映射值是否大于所述重构亮度样本的值;
确定在所述分段函数索引等于所述最大bin索引-1的情况下,第二映射值是否大于所述重构亮度样本的值;
基于确定在所述分段函数索引等于所述最大bin索引-1的情况下,所述第二映射值不大于所述重构亮度样本的值,确定在所述分段函数索引等于所述最大bin索引的情况下,第三映射值是否大于所述重构亮度样本的值,以及
其中,基于确定在所述分段函数索引等于所述最大bin索引-1的情况下所述第二映射值不大于所述重构亮度样本的值,基于确定所述第三映射值大于所述重构亮度样本的值,将所述分段函数索引推导为所述最大bin索引。
CN202080012555.1A 2019-06-17 2020-06-17 基于亮度映射的视频或图像编译 Active CN113475073B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN202410896884.7A CN118694952A (zh) 2019-06-17 2020-06-17 基于亮度映射的视频或图像编译
CN202410898259.6A CN118694953A (zh) 2019-06-17 2020-06-17 基于亮度映射的视频或图像编译
CN202410896800.XA CN118694951A (zh) 2019-06-17 2020-06-17 基于亮度映射的视频或图像编译
CN202410897969.7A CN118741136A (zh) 2019-06-17 2020-06-17 基于亮度映射的视频或图像编译

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962862651P 2019-06-17 2019-06-17
US62/862,651 2019-06-17
PCT/KR2020/007818 WO2020256393A1 (ko) 2019-06-17 2020-06-17 루마 맵핑 기반 비디오 또는 영상 코딩

Related Child Applications (4)

Application Number Title Priority Date Filing Date
CN202410898259.6A Division CN118694953A (zh) 2019-06-17 2020-06-17 基于亮度映射的视频或图像编译
CN202410897969.7A Division CN118741136A (zh) 2019-06-17 2020-06-17 基于亮度映射的视频或图像编译
CN202410896884.7A Division CN118694952A (zh) 2019-06-17 2020-06-17 基于亮度映射的视频或图像编译
CN202410896800.XA Division CN118694951A (zh) 2019-06-17 2020-06-17 基于亮度映射的视频或图像编译

Publications (2)

Publication Number Publication Date
CN113475073A CN113475073A (zh) 2021-10-01
CN113475073B true CN113475073B (zh) 2024-07-23

Family

ID=74040241

Family Applications (5)

Application Number Title Priority Date Filing Date
CN202080012555.1A Active CN113475073B (zh) 2019-06-17 2020-06-17 基于亮度映射的视频或图像编译
CN202410896800.XA Pending CN118694951A (zh) 2019-06-17 2020-06-17 基于亮度映射的视频或图像编译
CN202410897969.7A Pending CN118741136A (zh) 2019-06-17 2020-06-17 基于亮度映射的视频或图像编译
CN202410898259.6A Pending CN118694953A (zh) 2019-06-17 2020-06-17 基于亮度映射的视频或图像编译
CN202410896884.7A Pending CN118694952A (zh) 2019-06-17 2020-06-17 基于亮度映射的视频或图像编译

Family Applications After (4)

Application Number Title Priority Date Filing Date
CN202410896800.XA Pending CN118694951A (zh) 2019-06-17 2020-06-17 基于亮度映射的视频或图像编译
CN202410897969.7A Pending CN118741136A (zh) 2019-06-17 2020-06-17 基于亮度映射的视频或图像编译
CN202410898259.6A Pending CN118694953A (zh) 2019-06-17 2020-06-17 基于亮度映射的视频或图像编译
CN202410896884.7A Pending CN118694952A (zh) 2019-06-17 2020-06-17 基于亮度映射的视频或图像编译

Country Status (7)

Country Link
US (2) US11949872B2 (zh)
EP (1) EP3985977A4 (zh)
JP (2) JP7425810B2 (zh)
KR (1) KR20210096281A (zh)
CN (5) CN113475073B (zh)
MX (1) MX2021008601A (zh)
WO (1) WO2020256393A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022178433A1 (en) * 2021-02-22 2022-08-25 Beijing Dajia Internet Information Technology Co., Ltd. Improved local illumination compensation for inter prediction
WO2023193925A1 (en) * 2022-04-08 2023-10-12 Telefonaktiebolaget Lm Ericsson (Publ) Multiple mappings for a single slice of a picture

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019006300A1 (en) * 2017-06-29 2019-01-03 Dolby Laboratories Licensing Corporation INTEGRATED IMAGE REMODELING AND VIDEO CODING

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2051527A1 (en) * 2007-10-15 2009-04-22 Thomson Licensing Enhancement layer residual prediction for bit depth scalability using hierarchical LUTs
US20120127003A1 (en) 2009-08-06 2012-05-24 Youji Shibahara Coding method, decoding method, coding apparatus, and decoding apparatus
US9215470B2 (en) 2010-07-09 2015-12-15 Qualcomm Incorporated Signaling selected directional transform for video coding
EP3113495A1 (en) 2015-06-30 2017-01-04 Thomson Licensing Methods and devices for encoding and decoding a hdr color picture
US20170150176A1 (en) * 2015-11-25 2017-05-25 Qualcomm Incorporated Linear-model prediction with non-square prediction units in video coding
US10652575B2 (en) * 2016-09-15 2020-05-12 Qualcomm Incorporated Linear model chroma intra prediction for video coding
WO2018166429A1 (en) 2017-03-16 2018-09-20 Mediatek Inc. Method and apparatus of enhanced multiple transforms and non-separable secondary transform for video coding
US20200177889A1 (en) 2017-03-21 2020-06-04 Lg Electronics Inc. Transform method in image coding system and apparatus for same
WO2018231968A1 (en) * 2017-06-16 2018-12-20 Dolby Laboratories Licensing Corporation Efficient end-to-end single layer inverse display management coding
EP3627836A4 (en) 2017-06-21 2021-04-07 LG Electronics Inc. METHOD AND DEVICE FOR DECODING IMAGES ACCORDING TO INTRAPREDICTION IN AN IMAGE ENCODING SYSTEM
CN113366833A (zh) * 2019-02-01 2021-09-07 北京字节跳动网络技术有限公司 对环路整形的限制
BR112021016736A2 (pt) * 2019-03-13 2021-10-13 Interdigital Vc Holdings, Inc. Direção de remodelador adaptativa para a remodelagem in-loop
MX2021014971A (es) * 2019-06-17 2022-01-24 Lg Electronics Inc Codificacion de video o imagen en base a mapeo de luma y escalado de croma.

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019006300A1 (en) * 2017-06-29 2019-01-03 Dolby Laboratories Licensing Corporation INTEGRATED IMAGE REMODELING AND VIDEO CODING

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Versatile Video Coding (Draft 4);Benjamin Bross等;Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11 13th Meeting: Marrakech, MA, 9–18 Jan. 2019Document: JVET-M1001-v7;第7.3-8.8.2.5章节 *

Also Published As

Publication number Publication date
CN118694953A (zh) 2024-09-24
US11949872B2 (en) 2024-04-02
KR20210096281A (ko) 2021-08-04
US20240275972A1 (en) 2024-08-15
CN118694952A (zh) 2024-09-24
JP7425810B2 (ja) 2024-01-31
JP2024038444A (ja) 2024-03-19
EP3985977A4 (en) 2023-07-12
CN118741136A (zh) 2024-10-01
US20220109847A1 (en) 2022-04-07
EP3985977A1 (en) 2022-04-20
JP2022535906A (ja) 2022-08-10
MX2021008601A (es) 2021-09-21
WO2020256393A1 (ko) 2020-12-24
CN118694951A (zh) 2024-09-24
CN113475073A (zh) 2021-10-01

Similar Documents

Publication Publication Date Title
CN113412616B (zh) 基于亮度映射与色度缩放的视频或图像编译
US11924448B2 (en) Luma-mapping-based video or image coding
US20240275972A1 (en) Luma mapping-based video or image coding
CN114342381B (zh) 图像解码和编码方法及用于图像的数据的发送方法
US20240073434A1 (en) Luma mapping-based video or image coding
US20230328264A1 (en) Video or image coding based on mapping of luma samples and scaling of chroma samples
CN114128272B (zh) 基于亮度样本的映射和色度样本的缩放的视频或图像编码
CN114391258B (zh) 基于亮度映射的视频或图像编码

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant