CN114424531A - 基于环路内滤波的视频或图像编码 - Google Patents

基于环路内滤波的视频或图像编码 Download PDF

Info

Publication number
CN114424531A
CN114424531A CN202080063207.7A CN202080063207A CN114424531A CN 114424531 A CN114424531 A CN 114424531A CN 202080063207 A CN202080063207 A CN 202080063207A CN 114424531 A CN114424531 A CN 114424531A
Authority
CN
China
Prior art keywords
information
filter
alf
current block
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080063207.7A
Other languages
English (en)
Inventor
S·帕鲁利
金昇焕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Publication of CN114424531A publication Critical patent/CN114424531A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • H04N19/82Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

根据本文献的公开,从ALF信息推导替代滤波器的索引,并且可基于替代滤波器的索引来执行用于当前块的色度分量的ALF过程。

Description

基于环路内滤波的视频或图像编码
技术领域
本公开涉及基于环路内滤波的视频或图像编码。
背景技术
最近,在各种领域中对诸如4K或8K或更高的超高清(UHD)图像/视频的高分辨率、高质量图像/视频的需求已增加。随着图像/视频数据具有高分辨率和高质量,要发送的信息量或比特量相对于现有图像/视频数据增加,因此,使用诸如现有有线/无线宽带线路或现有存储介质的介质发送图像数据或者使用现有存储介质存储图像/视频数据增加了传输成本和存储成本。
另外,对诸如虚拟现实(VR)和人工现实(AR)内容或全息图的沉浸式媒体的兴趣和需求最近已增加,并且具有与现实图像不同的特性的图像/视频(例如,游戏图像)的广播已增加。
因此,需要非常高效的图像/视频压缩技术来有效地压缩、发送、存储和再现具有如上所述的各种特性的高分辨率、高质量图像/视频的信息。
另外,讨论了使用自适应环路滤波(ALF)来改进压缩效率并增加主观/客观视觉质量的滤波技术。为了高效地应用这些技术,需要一种高效地用信号通知相关信息的方法。
发明内容
技术方案
根据本公开的实施方式,提供了一种由解码设备执行的图像解码方法。该方法包括以下步骤:从比特流获得包括自适应环路滤波器(ALF)信息和预测相关信息的图像信息;基于预测相关信息来推导当前块的预测样本;基于预测样本来生成重构样本;以及基于ALF信息来对重构样本执行ALF过程,其中,ALF信息包括用于当前块的色度分量的替代滤波器信息,应用于当前块的色度分量的替代滤波器的索引是基于替代滤波器信息来推导的,并且基于替代滤波器的索引对当前块的色度分量执行ALF过程。
根据本公开的另一实施方式,提供了一种由编码设备执行的视频编码方法。该方法包括以下步骤:确定当前块的预测模式,并且基于预测模式来推导预测样本;基于预测样本来生成重构样本;对重构样本执行自适应环路滤波器(ALF)过程;以及对包括ALF信息和预测相关信息的图像信息进行编码,其中,ALF信息包括用于当前块的色度分量的替代滤波器信息,并且替代滤波器信息指示应用于当前块的色度分量的替代滤波器的索引。
根据本公开的另一实施方式,提供了一种计算机可读数字存储介质,其中存储有包括使得解码设备执行图像解码方法的图像信息的比特流。该图像解码方法包括以下步骤:从比特流获得包括自适应环路滤波器(ALF)信息和预测相关信息的图像信息;基于预测相关信息来推导当前块的预测样本;基于预测样本来生成重构样本;以及基于ALF信息来对重构样本执行ALF过程,其中,ALF信息包括用于当前块的色度分量的替代滤波器信息,应用于当前块的色度分量的替代滤波器的索引是基于替代滤波器信息来推导的,并且基于替代滤波器的索引对当前块的色度分量执行ALF过程。
有益效果
根据本公开的实施方式,总体图像/视频压缩效率可增加。
根据本公开的实施方式,通过高效滤波,主观/客观视觉质量可增加。
根据本公开的实施方式,可高效地用信号通知ALF相关信息。
附图说明
图1示出可应用本公开的实施方式的视频/图像编码系统的示例。
图2是示意性地示出可应用本文献的实施方式的视频/图像编码设备的配置的图。
图3是示意性地示出可应用本文献的实施方式的视频/图像解码设备的配置的图。
图4示例性地示出包括CTU的画面。
图5示例性地示出用于对句法元素进行编码的上下文自适应二进制算术编码(CABAC)。
图6示出编码设备的编码器。
图7示出解码设备的解码器。
图8示例性地示出用于编码图像/视频的分层结构。
图9是示意性地示出ALF处理的示例的流程图。
图10示出ALF滤波器的形状的示例。
图11示出ALF数据的分层结构的示例。
图12示出ALF数据的分层结构的另一示例。
图13示出与位置相关滤波器系数对应的固定顺序。
图14和图15示意性地示出根据本文献的实施方式的视频/图像编码方法和相关组件的示例。
图16和图17示意性地示出根据本文献的实施方式的图像/视频解码方法和相关组件的示例。
图18示出可应用本文献中所公开的实施方式的内容流系统的示例。
具体实施方式
尽管本公开可具有各种修改和配置,但某些实施方式已示出于附图中并在本文中详细说明。然而,这不应被解释为将本公开限于任何特定实施方式。本文所使用的术语是为了描述特定实施方式而呈现的,并非旨在限制本公开的技术思想。除非另外指明,否则单数形式的术语可包括复数形式。将理解,术语“包括”或“具有”在用在本文中时指定存在所述特征、整数、步骤、操作、元件、组件或其组合,但不排除一个或更多个其它特征、整数、步骤、操作、元件、组件或其组合的存在或添加。
本公开中描述的附图中的各个组件为了方便描述不同的特性功能而独立地示出,并非意指组件实现于单独的硬件或单独的软件中。例如,两个或更多个配置可被组合以形成一个配置,或者一个配置可被分成多个配置。在不脱离本公开的精神的情况下,各个配置被集成和/或分离的实施方式也包括在本公开的范围内。
在本说明书中,“A或B”可意指“仅A”、“仅B”或“A和B二者”。换言之,在本说明书中,“A或B”可被解释为“A和/或B”。例如,在本说明书中,“A、B或C”可意指“仅A”、“仅B”、“仅C”或“A、B、C的任何组合”。
本说明书中所使用的斜杠(/)或逗号可意指“和/或”。例如,“A/B”可意指“A和/或B”。因此,“A/B”可意指“仅A”、“仅B”或“A和B二者”。例如,“A、B、C”可意指“A、B或C”。
在本说明书中,“A和B中的至少一个”可意指“仅A”、“仅B”或“A和B二者”。另外,在本说明书中,表达“A或B中的至少一个”或“A和/或B中的至少一个”可被解释为“A和B中的至少一个”。
另外,在本说明书中,“A、B和C中的至少一个”可意指“仅A”、“仅B”、“仅C”或“A、B和C的任何组合”。另外,“A、B或C中的至少一个”或“A、B和/或C中的至少一个”可意指“A、B和C中的至少一个”。
另外,本说明书中所使用的括号可意指“例如”。具体地,当指示为“预测(帧内预测)”时,可意指“帧内预测”被提出作为“预测”的示例。换言之,本说明书的“预测”不限于“帧内预测”,“帧内预测”可被提出作为“预测”的示例。另外,当指示为“预测(即,帧内预测)”时,也可意指“帧内预测”被提出作为“预测”的示例。
在本说明书中的一幅图中单独描述的技术特征可单独地实现,或者可同时实现。
以下,将参照附图更详细地描述本公开的优选实施方式。以下,在附图中相同的标号用于相同的组件,并且可省略相同组件的重复描述。
图1示出可应用本公开的视频/图像编码系统的示例。
参照图1,视频/图像编码系统可包括第一装置(源装置)和第二装置(接收装置)。源装置可通过数字存储介质或网络将编码的视频/图像信息或数据以文件或流的形式发送到接收装置。
源装置可包括视频源、编码设备和发送器。接收装置可包括接收器、解码设备和渲染器。编码设备可被称为视频/图像编码设备,解码设备可被称为视频/图像解码设备。发送器可被包括在编码设备中。接收器可被包括在解码设备中。渲染器可包括显示器,并且显示器可被配置为单独的装置或外部组件。
视频源可通过捕获、合成或生成视频/图像的处理来获取视频/图像。视频源可包括视频/图像捕获装置和/或视频/图像生成装置。例如,视频/图像捕获装置可包括一个或更多个相机、包括先前捕获的视频/图像的视频/图像档案等。例如,视频/图像生成装置可包括计算机、平板计算机和智能电话,并且可(以电子方式)生成视频/图像。例如,可通过计算机等生成虚拟视频/图像。在这种情况下,视频/图像捕获处理可由生成相关数据的处理代替。
编码设备可对输入视频/图像进行编码。为了压缩和编码效率,编码设备可执行诸如预测、变换和量化的一系列过程。编码的数据(编码的视频/图像信息)可按比特流的形式输出。
发送器可通过数字存储介质或网络将以比特流的形式输出的编码的图像/图像信息或数据以文件或流的形式发送到接收装置的接收器。数字存储介质可包括诸如USB、SD、CD、DVD、蓝光、HDD、SSD等的各种存储介质。发送器可包括用于通过预定文件格式生成媒体文件的元件,并且可包括用于通过广播/通信网络传输的元件。接收器可接收/提取比特流并将所接收的比特流发送到解码设备。
解码设备可通过执行与编码设备的操作对应的诸如解量化、逆变换和预测的一系列过程将视频/图像解码。
渲染器可渲染解码的视频/图像。渲染的视频/图像可通过显示器显示。
本文献涉及视频/图像编码。例如,本文献中公开的方法/实施方式可应用于通用视频编码(VVC)标准、基本视频编码(EVC)标准、AOMedia Video 1(AV1)标准、第2代音频视频编码标准(AVS2)或下一代视频/图像编码标准(例如,H.267、H.268等)中公开的方法。
本文献提出了视频/图像编码的各种实施方式,并且除非另外指明,否则上述实施方式也可彼此组合执行。
在本文献中,视频可指随时间的一系列图像。画面通常是指表示特定时间范围的一个图像的单元,切片/拼块是指就编码而言构成画面的一部分的单元。切片/拼块可包括一个或更多个编码树单元(CTU)。一个画面可由一个或更多个切片/拼块组成。
拼块是画面中的特定拼块列和特定拼块行内的CTU的矩形区域。拼块列是高度等于画面的高度并且宽度由画面参数集中的句法元素指定的CTU的矩形区域。拼块行是高度由画面参数集中的句法元素指定并且宽度等于画面的宽度的CTU的矩形区域。拼块扫描是分割画面的CTU的特定顺序排序,其中在拼块的CTU光栅扫描中CTU连续地排序,而在画面的拼块的光栅扫描中画面中的拼块连续地排序。切片可包括画面的多个完整拼块或一个拼块中的多个连续CTU行,其可包括在一个NAL单元中。在本文献中,拼块组和切片可互换使用。例如,在本文献中,拼块组/拼块组头可被称为切片/切片头。
此外,一个画面可被划分成两个或更多个子画面。子画面可以是画面内的一个或更多个切片的矩形区域。
像素或画素可意指构成一个画面(或图像)的最小单元。另外,“样本”可用作与像素对应的术语。样本通常可表示像素或像素值,并且可仅表示亮度分量的像素/像素值或仅表示色度分量的像素/像素值。
单元可表示图像处理的基本单位。单元可包括画面的特定区域和与该区域有关的信息中的至少一个。一个单元可包括一个亮度块和两个色度(例如,cb、cr)块。在一些情况下,单元可与诸如块或区域的术语互换使用。在一般情况下,M×N块可包括M列和N行的样本(或样本阵列)或变换系数的集合(或阵列)。另选地,样本可意指空间域中的像素值,并且当这种像素值被变换至频域时,其可意指频域中的变换系数。
图2是示意性地示出可应用本文献的视频/图像编码设备的配置的图。以下,视频编码设备可包括图像编码设备。
参照图2,编码设备200包括图像分割器210、预测器220、残差处理器230和熵编码器240、加法器250、滤波器260和存储器270。预测器220可包括帧间预测器221和帧内预测器222。残差处理器230可包括变换器232、量化器233、解量化器234和逆变换器235。残差处理器230还可包括减法器231。加法器250可被称为重构器或重构块生成器。根据实施方式,图像分割器210、预测器220、残差处理器230、熵编码器240、加法器250和滤波器260可由至少一个硬件组件(例如,编码器芯片组或处理器)配置。另外,存储器270可包括解码画面缓冲器(DPB),或者可由数字存储介质配置。硬件组件还可包括存储器270作为内部/外部组件。
图像分割器210可将输入到编码设备200的输入图像(或者画面或帧)分割成一个或更多个处理器。例如,处理器可被称为编码单元(CU)。在这种情况下,编码单元可根据四叉树二叉树三叉树(QTBTTT)结构从编码树单元(CTU)或最大编码单元(LCU)递归地分割。例如,一个编码单元可基于四叉树结构、二叉树结构和/或三元结构被分割成深度更深的多个编码单元。在这种情况下,例如,可首先应用四叉树结构,稍后可应用二叉树结构和/或三元结构。另选地,可首先应用二叉树结构。可基于不再分割的最终编码单元来执行根据本公开的编码过程。在这种情况下,根据图像特性基于编码效率,最大编码单元可用作最终编码单元,或者如果需要,编码单元可被递归地分割成深度更深的编码单元并且具有最优大小的编码单元可用作最终编码单元。这里,编码过程可包括预测、变换和重构的过程(将稍后描述)。作为另一示例,处理器还可包括预测单元(PU)或变换单元(TU)。在这种情况下,预测单元和变换单元可从上述最终编码单元拆分或分割。预测单元可以是样本预测的单元,变换单元可以是用于推导变换系数的单元和/或用于从变换系数推导残差信号的单元。
在一些情况下,单元可与诸如块或区域的术语互换使用。在一般情况下,M×N块可表示由M列和N行组成的样本或变换系数的集合。样本通常可表示像素或像素值,可仅表示亮度分量的像素/像素值或者仅表示色度分量的像素/像素值。样本可用作与像素或画素的一个画面(或图像)对应的术语。
在编码设备200中,从输入图像信号(原始块、原始样本阵列)减去从帧间预测器221或帧内预测器222输出的预测信号(预测块、预测样本阵列)以生成残差信号(残差块、残差样本阵列),并且所生成的残差信号被发送到变换器232。在这种情况下,如所示,在编码设备200中从输入图像信号(原始块、原始样本阵列)减去预测信号(预测块、预测样本阵列)的单元可被称为减法器231。预测器可对要处理的块(以下,称为当前块)执行预测并且生成包括当前块的预测样本的预测块。预测器可确定基于当前块或CU应用帧内预测还是帧间预测。如在各个预测模式的描述中稍后描述的,预测器可生成与预测有关的各种信息(例如,预测模式信息)并将所生成的信息发送到熵编码器240。关于预测的信息可在熵编码器240中编码并以比特流的形式输出。
帧内预测器222可参考当前画面中的样本来预测当前块。根据预测模式,所参考的样本可位于当前块附近或者可隔开。在帧内预测中,预测模式可包括多个非定向模式和多个定向模式。例如,非定向模式可包括DC模式和平面模式。例如,根据预测方向的详细程度,定向模式可包括33个定向预测模式或65个定向预测模式。然而,这仅是示例,可根据设置使用更多或更少的定向预测模式。帧内预测器222可使用应用于邻近块的预测模式来确定应用于当前块的预测模式。
帧间预测器221可基于参考画面上运动向量所指定的参考块(参考样本阵列)来推导当前块的预测块。这里,为了减少在帧间预测模式下发送的运动信息量,可基于邻近块与当前块之间的运动信息的相关性以块、子块或样本为单位预测运动信息。运动信息可包括运动向量和参考画面索引。运动信息还可包括帧间预测方向(L0预测、L1预测、Bi预测等)信息。在帧间预测的情况下,邻近块可包括存在于当前画面中的空间邻近块和存在于参考画面中的时间邻近块。包括参考块的参考画面和包括时间邻近块的参考画面可相同或不同。时间邻近块可被称为并置参考块、并置CU(colCU)等,并且包括时间邻近块的参考画面可被称为并置画面(colPic)。例如,帧间预测器221可基于邻近块来配置运动信息候选列表并且生成指示哪一候选用于推导当前块的运动向量和/或参考画面索引的信息。可基于各种预测模式执行帧间预测。例如,在跳过模式和合并模式的情况下,帧间预测器221可使用邻近块的运动信息作为当前块的运动信息。在跳过模式下,与合并模式不同,可不发送残差信号。在运动向量预测(MVP)模式的情况下,邻近块的运动向量可用作运动向量预测器,并且可通过用信号通知运动向量差来指示当前块的运动向量。
预测器220可基于下面描述的各种预测方法来生成预测信号。例如,预测器可不仅应用帧内预测或帧间预测以预测一个块,而且同时应用帧内预测和帧间预测二者。这可被称为组合帧间和帧内预测(CIIP)。另外,预测器可基于帧内块复制(IBC)预测模式或调色板模式来预测块。IBC预测模式或调色板模式可用于游戏等的内容图像/视频编码,例如屏幕内容编码(SCC)。IBC基本上在当前画面中执行预测,但是可与帧间预测相似地执行,使得在当前画面中推导参考块。即,IBC可使用本公开中描述的至少一个帧间预测技术。调色板模式可被视为帧内编码或帧内预测的示例。当应用调色板模式时,可基于关于调色板表和调色板索引的信息用信号通知画面内的样本值。
由预测器(包括帧间预测器221和/或帧内预测器222)生成的预测信号可用于生成重构信号或生成残差信号。变换器232可通过对残差信号应用变换技术来生成变换系数。例如,变换技术可包括离散余弦变换(DCT)、离散正弦变换(DST)、karhunen-loève变换(KLT)、基于图形的变换(GBT)或条件非线性变换(CNT)中的至少一个。这里,当像素之间的关系信息由图形表示时,GBT意指从图形获得的变换。CNT是指基于使用所有先前重构的像素生成的预测信号生成的变换。另外,变换处理可应用于具有相同大小的正方形像素块或者可应用于正方形以外的具有可变大小的块。
量化器233可将变换系数量化并将它们发送到熵编码器240,并且熵编码器240可对量化的信号(关于量化的变换系数的信息)进行编码并输出比特流。关于量化的变换系数的信息可被称为残差信息。量化器233可基于系数扫描顺序将块类型量化的变换系数重排为一维向量形式,并且基于一维向量形式的量化的变换系数来生成关于量化的变换系数的信息。可生成关于变换系数的信息。熵编码器240可执行例如指数Golomb、上下文自适应可变长度编码(CAVLC)、上下文自适应二进制算术编码(CABAC)等的各种编码方法。熵编码器240可对量化的变换系数以外的视频/图像重构所需的信息(例如,句法元素的值等)一起或单独地进行编码。编码的信息(例如,编码的视频/图像信息)可按比特流的形式以NAL(网络抽象层)为单位发送或存储。视频/图像信息还可包括关于各种参数集的信息,例如自适应参数集(APS)、画面参数集(PPS)、序列参数集(SPS)或视频参数集(VPS)。另外,视频/图像信息还可包括一般约束信息。在本公开中,从编码设备发送/用信号通知给解码设备的信息和/或句法元素可被包括在视频/画面信息中。视频/图像信息可通过上述编码过程编码并被包括在比特流中。比特流可经由网络发送或者可被存储在数字存储介质中。网络可包括广播网络和/或通信网络,并且数字存储介质可包括诸如USB、SD、CD、DVD、蓝光、HDD、SSD等的各种存储介质。发送从熵编码器240输出的信号的发送器(未示出)和/或存储该信号的存储单元(未示出)可被包括作为编码设备200的内部/外部元件,并且另选地,发送器可被包括在熵编码器240中。
从量化器233输出的量化的变换系数可用于生成预测信号。例如,可通过经由解量化器234和逆变换器235对量化的变换系数应用解量化和逆变换来重构残差信号(残差块或残差样本)。加法器250将重构的残差信号与从帧间预测器221或帧内预测器222输出的预测信号相加以生成重构信号(重构画面、重构块、重构样本阵列)。如果要处理的块不存在残差(例如,应用跳过模式的情况),则预测块可用作重构块。加法器250可被称为重构器或重构块生成器。如下所述,所生成的重构信号可用于当前画面中要处理的下一块的帧内预测并且可通过滤波用于下一画面的帧间预测。
此外,可在画面编码和/或重构期间应用与色度缩放的亮度映射(LMCS)。
滤波器260可通过对重构信号应用滤波来改进主观/客观图像质量。例如,滤波器260可通过对重构画面应用各种滤波方法来生成修改的重构画面并将修改的重构画面存储在存储器270(具体地,存储器270的DPB)中。例如,各种滤波方法可包括去块滤波、样本自适应偏移、自适应环路滤波器、双边滤波器等。滤波器260可生成与滤波有关的各种信息并且将所生成的信息发送到熵编码器240,如在各个滤波方法的描述中稍后描述的。与滤波有关的信息可由熵编码器240编码并以比特流的形式输出。
发送到存储器270的修改的重构画面可用作帧间预测器221中的参考画面。当通过编码设备应用帧间预测时,可避免编码设备200与解码设备300之间的预测失配并且编码效率可改进。
存储器270的DPB可存储用作帧间预测器221中的参考画面的修改的重构画面。存储器270可存储推导(或编码)当前画面中的运动信息的块的运动信息和/或画面中已经重构的块的运动信息。所存储的运动信息可被发送到帧间预测器221并用作空间邻近块的运动信息或时间邻近块的运动信息。存储器270可存储当前画面中的重构块的重构样本并且可将重构样本传送至帧内预测器222。
在本公开中,可省略量化/解量化和/或变换/逆变换中的至少一个。当省略量化/解量化时,量化的变换系数可被称为变换系数。当省略变换/逆变换时,变换系数可被称为系数或残差系数,或者为了表达的一致性,仍可被称为变换系数。
此外,在本公开中,量化的变换系数和变换系数可分别被称为变换系数和缩放的变换系数。在这种情况下,残差信息可包括关于变换系数的信息,并且关于变换系数的信息可通过残差编码句法用信号通知。可基于残差信息(或关于变换系数的信息)来推导变换系数,并且可通过变换系数的逆变换(缩放)来推导缩放的变换系数。可基于缩放的变换系数的逆变换(变换)来推导残差样本。这些细节也可在本公开的其它部分中应用/表达。
图3是示意性地示出可应用本公开的视频/图像解码设备的配置的图。
参照图3,解码设备300可包括熵解码器310、残差处理器320、预测器330、加法器340、滤波器350、存储器360。预测器330可包括帧内预测器331和帧间预测器332。残差处理器320可包括解量化器321和逆变换器321。根据实施方式,熵解码器310、残差处理器320、预测器330、加法器340和滤波器350可由硬件组件(例如,解码器芯片组或处理器)配置。另外,存储器360可包括解码画面缓冲器(DPB)或者可由数字存储介质配置。硬件组件还可包括存储器360作为内部/外部组件。
当输入包括视频/图像信息的比特流时,解码设备300可重构与在图2的编码设备中处理视频/图像信息的处理对应的图像。例如,解码设备300可基于从比特流获得的块分割相关信息来推导单元/块。解码设备300可使用编码设备中应用的处理器来执行解码。因此,例如,解码的处理器可以是编码单元,并且编码单元可根据四叉树结构、二叉树结构和/或三叉树结构从编码树单元或最大编码单元分割。可从编码单元推导一个或更多个变换单元。通过解码设备300解码和输出的重构的图像信号可通过再现设备再现。
解码设备300可接收从图2的编码设备以比特流的形式输出的信号,并且所接收的信号可通过熵解码器310解码。例如,熵解码器310可解析比特流以推导图像重构(或画面重构)所需的信息(例如,视频/图像信息)。视频/图像信息还可包括关于各种参数集的信息,例如自适应参数集(APS)、画面参数集(PPS)、序列参数集(SPS)或视频参数集(VPS)。另外,视频/图像信息还可包括一般约束信息。解码设备还可基于关于参数集的信息和/或一般约束信息将画面解码。本公开中稍后描述的用信号通知/接收的信息和/或句法元素可通过解码过程解码并从比特流获得。例如,熵解码器310基于诸如指数Golomb编码、CAVLC或CABAC的编码方法对比特流中的信息进行解码,并且输出图像重构所需的句法元素和残差的变换系数的量化值。更具体地,CABAC熵解码方法可接收与比特流中的各个句法元素对应的信元(bin),使用解码目标句法元素信息、解码目标块的解码信息或在先前阶段中解码的符号/信元的信息来确定上下文模型,并且通过根据所确定的上下文模型预测信元出现的概率对信元执行算术解码,并且生成与各个句法元素的值对应的符号。在这种情况下,CABAC熵解码方法可在确定上下文模型之后通过将解码的符号/信元的信息用于下一符号/信元的上下文模型来更新上下文模型。熵解码器310所解码的信息当中与预测有关的信息可被提供给预测器(帧间预测器332和帧内预测器331),并且在熵解码器310中执行了熵解码的残差值(即,量化的变换系数和相关参数信息)可被输入到残差处理器320。残差处理器320可推导残差信号(残差块、残差样本、残差样本阵列)。另外,熵解码器310所解码的信息当中关于滤波的信息可被提供给滤波器350。此外,用于接收从编码设备输出的信号的接收器(未示出)还可被配置成解码设备300的内部/外部元件,或者接收器可以是熵解码器310的组件。此外,根据本公开的解码设备可被称为视频/图像/画面解码设备,并且解码设备可被分类为信息解码器(视频/图像/画面信息解码器)和样本解码器(视频/图像/画面样本解码器)。信息解码器可包括熵解码器310,并且样本解码器可包括解量化器321、逆变换器322、加法器340、滤波器350、存储器360、帧间预测器332和帧内预测器331中的至少一个。
解量化器321可将量化的变换系数解量化并输出变换系数。解量化器321可按二维块形式重排量化的变换系数。在这种情况下,可基于在编码设备中执行的系数扫描顺序来执行重排。解量化器321可使用量化参数(例如,量化步长信息)对量化的变换系数执行解量化并且获得变换系数。
逆变换器322对变换系数逆变换以获得残差信号(残差块、残差样本阵列)。
预测器可对当前块执行预测并生成包括当前块的预测样本的预测块。预测器可基于从熵解码器310输出的关于预测的信息来确定对当前块应用帧内预测还是帧间预测并且可确定特定帧内/帧间预测模式。
预测器330可基于下述各种预测方法来生成预测信号。例如,预测器不仅可应用帧内预测或帧间预测以预测一个块,而且可同时应用帧内预测和帧间预测。这可被称为组合帧间和帧内预测(CIIP)。另外,预测器可基于帧内块复制(IBC)预测模式或调色板模式来预测块。IBC预测模式或调色板模式可用于游戏等的内容图像/视频编码,例如屏幕内容编码(SCC)。IBC基本上执行当前画面中的预测,但是可与帧间预测相似地执行,使得在当前画面中推导参考块。即,IBC可使用本公开中描述的至少一种帧间预测技术。调色板模式可被视为帧内编码或帧内预测的示例。当应用调色板模式时,可基于关于调色板表和调色板索引的信息用信号通知画面内的样本值。
帧内预测器331可参考当前画面中的样本来预测当前块。根据预测模式,所参考的样本可位于当前块附近或者可隔开。在帧内预测中,预测模式可包括多个非定向模式和多个定向模式。帧内预测器331可使用应用于邻近块的预测模式来确定应用于当前块的预测模式。
帧间预测器332可基于参考画面上运动向量所指定的参考块(参考样本阵列)来推导当前块的预测块。在这种情况下,为了减少在帧间预测模式下发送的运动信息量,可基于邻近块与当前块之间的运动信息的相关性以块、子块或样本为单位预测运动信息。运动信息可包括运动向量和参考画面索引。运动信息还可包括帧间预测方向(L0预测、L1预测、Bi预测等)信息。在帧间预测的情况下,邻近块可包括存在于当前画面中的空间邻近块和存在于参考画面中的时间邻近块。例如,帧间预测器332可基于邻近块来配置运动信息候选列表并且基于所接收的候选选择信息来推导当前块的运动向量和/或参考画面索引。可基于各种预测模式来执行帧间预测,并且关于预测的信息可包括指示当前块的帧间预测模式的信息。
加法器340可通过将所获得的残差信号与从预测器(包括帧间预测器332和/或帧内预测器331)输出的预测信号(预测块、预测样本阵列)相加来生成重构信号(重构画面、重构块、重构样本阵列)。如果要处理的块不存在残差,例如当应用跳过模式时,预测块可用作重构块。
加法器340可被称为重构器或重构块生成器。所生成的重构信号可用于当前画面中要处理的下一块的帧内预测,可如下所述通过滤波输出,或者可用于下一画面的帧间预测。
此外,可在画面解码处理中应用与色度缩放的亮度映射(LMCS)。
滤波器350可通过对重构信号应用滤波来改进主观/客观图像质量。例如,滤波器350可通过对重构画面应用各种滤波方法来生成修改的重构画面并且将修改的重构画面存储在存储器360(具体地,存储器360的DPB)中。例如,各种滤波方法可包括去块滤波、样本自适应偏移、自适应环路滤波器、双边滤波器等。
存储在存储器360的DPB中的(修改的)重构画面可用作帧间预测器332中的参考画面。存储器360可存储推导(或解码)当前画面中的运动信息的块的运动信息和/或画面中已经重构的块的运动信息。所存储的运动信息可被发送到帧间预测器260以用作空间邻近块的运动信息或时间邻近块的运动信息。存储器360可存储当前画面中的重构块的重构样本并将重构样本传送至帧内预测器331。
在本文献中,在编码设备200的滤波器260、帧间预测器221和帧内预测器222中描述的实施方式可与解码设备300的滤波器350、帧间预测器332和帧内预测器331相同或分别与之对应应用。这也可适用于单元332和帧内预测器331。
如上所述,在视频编码中,执行预测以增加压缩效率。由此,可生成包括当前块(要编码的块)的预测样本的预测块。这里,预测块包括空间域(或像素域)中的预测样本。预测块从编码装置和解码装置相同地推导,并且编码装置对关于原始块与预测块之间的残差的信息(残差信息)而非原始块的原始样本值本身进行解码。通过用信号通知装置,图像编码效率可增加。解码设备可基于残差信息来推导包括残差样本的残差块,并且通过对残差块和预测块求和来生成包括重构样本的重构块,并且生成包括重构块的重构画面。
残差信息可通过变换处理和量化处理来生成。例如,编码设备可推导原始块与预测块之间的残差块,并且对包括在残差块中的残差样本(残差样本阵列)执行变换处理以推导变换系数,然后,通过对变换系数执行量化处理,推导量化的变换系数,以将残差相关信息(经由比特流)用信号通知给解码设备。这里,残差信息可包括位置信息、变换技术、变换核和量化参数、量化的变换系数的值信息等。解码设备可基于残差信息来执行解量化/逆变换处理并推导残差样本(或残差块)。解码设备可基于预测块和残差块来生成重构画面。编码设备还可对供稍后画面的帧间预测参考的量化的变换系数进行解量化/逆变换以推导残差块,并且基于其来生成重构画面。
在本文献中,量化/解量化和/或变换/逆变换中的至少一个可被省略。当量化/解量化被省略时,量化的变换系数可被称为变换系数。当变换/逆变换被省略时,变换系数可被称为系数或残差系数,或者为了表达的一致性,仍可称为变换系数。
在本文献中,量化的变换系数和变换系数可分别被称为变换系数和缩放的变换系数。在这种情况下,残差信息可包括关于变换系数的信息,并且关于变换系数的信息可通过残差编码句法用信号通知。变换系数可基于残差信息(或关于变换系数的信息)来推导,缩放的变换系数可通过对变换系数的逆变换(缩放)来推导。残差样本可基于缩放的变换系数的逆变换(变换)来推导。这也可在本文献的其它部分中应用/表达。
帧内预测可指基于当前块所属的画面(以下,称为当前画面)中的参考样本来生成当前块的预测样本的预测。当对当前块应用帧内预测时,可推导要用于当前块的帧内预测的邻近参考样本。当前块的邻近参考样本可包括与大小为nW×nH的当前块的左边界相邻的样本和邻近左下的总共2×nH个样本、与当前块的上边界相邻的样本和邻近右上的总共2×nW个样本以及邻近当前块的左上的一个样本。另选地,当前块的邻近参考样本可包括多个上邻近样本和多个左邻近样本。另外,当前块的邻近参考样本可包括与大小为nW×nH的当前块的右边界相邻的总共nH个样本、与当前块的下边界相邻的总共nW个样本以及邻近当前块的右下的一个样本。
然而,当前块的一些邻近参考样本可能还未解码或可用。在这种情况下,解码器可通过利用可用样本替换不可用的样本来配置要用于预测的邻近参考样本。另选地,要用于预测的邻近参考样本可通过可用样本的插值来配置。
当推导邻近参考样本时,(i)可基于当前块的邻近参考样本的平均或插值来推导预测样本,并且(ii)可基于当前块的外围参考样本当中存在于预测样本的特定(预测)方向上的参考样本来推导预测样本。(i)的情况可被称为非定向模式或非角模式,(ii)的情况可被称为定向模式或角模式。
此外,预测样本也可通过邻近参考样本当中基于当前块的预测样本位于与当前块的帧内预测模式的预测方向相反的方向上的第二邻近样本与第一邻近样本之间的插值来生成。上述情况可被称为线性插值帧内预测(LIP)。另外,可使用线性模型基于亮度样本来生成色度预测样本。这种情况可被称为LM模式。
另外,可基于滤波的邻近参考样本来推导当前块的暂时预测样本,并且现有邻近参考样本当中根据帧内预测模式推导的至少一个参考样本(即,未滤波的邻近参考样本)和暂时预测样本可加权求和以推导当前块的预测样本。上述情况可被称为位置相关帧内预测(PDPC)。
另外,可选择当前块的邻近多参考样本行中预测准确性最高的参考样本行,以使用对应行上位于预测方向上的参考样本来推导预测样本,然后本文所使用的参考样本行可被指示(用信号通知)给解码设备,从而执行帧内预测编码。上述情况可被称为多参考行(MRL)帧内预测或基于MRL的帧内预测。
另外,可基于相同的帧内预测模式通过将当前块划分为垂直或水平子分区来执行帧内预测,并且邻近参考样本可以子分区为单位推导并使用。即,在这种情况下,当前块的帧内预测模式同样适用于子分区,并且在一些情况下通过以子分区为单位推导并使用邻近参考样本,帧内预测性能可改进。这种预测方法可被称为子分区内(ISP)或基于ISP的帧内预测。
上述帧内预测方法可与帧内预测模式分开称为帧内预测类型。帧内预测类型可用诸如帧内预测技术或附加帧内预测模式的各种术语来称呼。例如,帧内预测类型(或附加帧内预测模式)可包括上述LIP、PDPC、MRL和ISP中的至少一个。除了诸如LIP、PDPC、MRL或ISP的特定帧内预测类型之外的一般帧内预测方法可被称为正常帧内预测类型。正常帧内预测类型通常可在不应用特定帧内预测类型时应用,并且可基于上述帧内预测模式来执行预测。此外,可根据需要对推导的预测样本执行后滤波。
具体地,帧内预测过程可包括帧内预测模式/类型确定步骤、邻近参考样本推导步骤和基于帧内预测模式/类型的预测样本推导步骤。另外,可根据需要对推导的预测样本执行后滤波步骤。
当应用帧内预测时,应用于当前块的帧内预测模式可使用邻近块的帧内预测模式来确定。例如,解码设备可基于所接收的最可能模式(mpm)索引来选择基于当前块的邻近块(例如,左和/或上邻近块)的帧内预测模式推导的mpm列表的mpm候选之一,并且基于剩余帧内预测模式信息来选择未包括在mpm候选(和平面模式)中的其它剩余帧内预测模式之一。mpm列表可被配置为包括或不包括平面模式作为候选。例如,如果mpm列表包括平面模式作为候选,则mpm列表可具有六个候选。如果mpm列表不包括平面模式作为候选,则mpm列表可具有三个候选。当mpm列表不包括平面模式作为候选时,可用信号通知指示当前块的帧内预测模式是否不是平面模式的非平面标志(例如,intra_luma_not_planar_flag)。例如,可首先用信号通知mpm标志,当mpm标志的值为1时,可用信号通知mpm索引和非平面标志。另外,当非平面标志的值为1时,可用信号通知mpm索引。这里,mpm列表被配置为不包括平面模式作为候选,不首先用信号通知非平面标志以首先检查它是否为平面模式,因为平面模式始终被视为mpm。
例如,应用于当前块的帧内预测模式是在mpm候选(和平面模式)中还是在剩余模式中可基于mpm标志(例如,Intra_luma_mpm_flag)来指示。mpm标志的值1可指示当前块的帧内预测模式在mpm候选(和平面模式)内,mpm标志的值0可指示当前块的帧内预测模式不在mpm候选(和平面模式)中。非平面标志(例如,Intra_luma_not_planar_flag)的值0可指示当前块的帧内预测模式是平面模式,非平面标志值的值1可指示当前块的帧内预测模式不是平面模式。mpm索引可按照mpm_idx或intra_luma_mpm_idx句法元素的形式用信号通知,剩余帧内预测模式信息可按照rem_intra_luma_pred_mode或intra_luma_mpm_remainder句法元素的形式用信号通知。例如,剩余帧内预测模式信息可按照预测模式编号的顺序对所有帧内预测模式当中未包括在mpm候选(和平面模式)中的剩余帧内预测模式进行索引以指示它们中的一个。帧内预测模式可以是亮度分量(样本)的帧内预测模式。以下,帧内预测模式信息可包括mpm标志(例如,Intra_luma_mpm_flag)、非平面标志(例如,Intra_luma_not_planar_flag)、mpm索引(例如,mpm_idx或intra_luma_mpm_idx)和剩余帧内预测模式信息(rem_intra_luma_pred_mode或intra_luma_mpm_remainder)中的至少一个。在本文献中,MPM列表可被称为诸如MPM候选列表和candModeList的各种术语。当对当前块应用MIP时,可用信号通知用于MIP的单独mpm标志(例如,intra_mip_mpm_flag)、mpm索引(例如,intra_mip_mpm_idx)和剩余帧内预测模式信息(例如,intra_mip_mpm_remainder),并且不用信号通知非平面标志。
换言之,通常,当对图像执行块拆分时,要编码的当前块和邻近块具有相似的图像特性。因此,当前块和邻近块具有相同或相似的帧内预测模式的概率较高。因此,编码器可使用邻近块的帧内预测模式来对当前块的帧内预测模式进行编码。
例如,编码器/解码器可为当前块配置最可能模式(MPM)的列表。MPM列表也可被称为MPM候选列表。本文中,MPM可指在帧内预测模式编码中考虑当前块和邻近块之间的相似性来改进编码效率的模式。如上所述,MPM列表可被配置为包括平面模式,或者可被配置为不包括平面模式。例如,当MPM列表包括平面模式时,MPM列表中的候选数量可为6。并且,如果MPM列表不包括平面模式,则MPM列表中的候选数量可为5。
编码器/解码器可配置包括5或6个MPM的MPM列表。
为了配置MPM列表,可考虑三种类型的模式:默认帧内模式、邻居帧内模式和推导帧内模式。
对于邻近帧内模式,可考虑两个邻近块,即,左邻近块和上邻近块。
如上所述,如果MPM列表被配置为不包括平面模式,则从列表排除平面模式,并且MPM列表候选的数量可被设定为5。
另外,帧内预测模式当中的非定向模式(或非角模式)可包括基于当前块的邻近参考样本的平均的DC模式或基于插值的平面模式。
当应用帧间预测时,编码设备/解码设备的预测器可通过以块为单位执行帧间预测来推导预测样本。帧间预测可以是以取决于当前画面以外的画面的数据元素(例如,样本值或运动信息)的方式推导的预测。当对当前块应用帧间预测时,可基于参考画面索引所指示的参考画面上运动向量所指定的参考块(参考样本阵列)来推导当前块的预测块(预测样本阵列)。这里,为了减少在帧间预测模式下发送的运动信息量,可基于邻近块与当前块之间的运动信息的相关性以块、子块或样本为单位预测当前块的运动信息。运动信息可包括运动向量和参考画面索引。运动信息还可包括帧间预测类型(L0预测、L1预测、Bi预测等)信息。在帧间预测的情况下,邻近块可包括存在于当前画面中的空间邻近块和存在于参考画面中的时间邻近块。包括参考块的参考画面和包括时间邻近块的参考画面可相同或不同。时间邻近块可被称为并置参考块、并置CU(colCU)等,并且包括时间邻近块的参考画面可被称为并置画面(colPic)。例如,可基于当前块的邻近块来配置运动信息候选列表,并且可用信号通知指示选择(使用)哪一候选的标志或索引信息以推导当前块的运动向量和/或参考画面索引。可基于各种预测模式来执行帧间预测。例如,在跳过模式和合并模式的情况下,当前块的运动信息可与邻近块的运动信息相同。在跳过模式下,与合并模式不同,可不发送残差信号。在运动向量预测(MVP)模式的情况下,所选邻近块的运动向量可用作运动向量预测器,并且可用信号通知当前块的运动向量。在这种情况下,可使用运动向量预测器与运动向量差之和来推导当前块的运动向量。
根据帧间预测类型(L0预测、L1预测、Bi预测等),运动信息可包括L0运动信息和/或L1运动信息。L0方向上的运动向量可被称为L0运动向量或MVL0,L1方向上的运动向量可被称为L1运动向量或MVL1。基于L0运动向量的预测可被称为L0预测,基于L1运动向量的预测可被称为L1预测,基于L0运动向量和L1运动向量二者的预测可被称为双预测。这里,L0运动向量可指示与参考画面列表L0(L0)关联的运动向量,L1运动向量可指示与参考画面列表L1(L1)关联的运动向量。参考画面列表L0可包括按输出顺序比当前画面早的画面作为参考画面,参考画面列表L1可包括按输出顺序比当前画面晚的画面。先前画面可被称为前向(参考)画面,后续画面可被称为后向(参考)画面。参考画面列表L0还可包括按输出顺序比当前画面晚的画面作为参考画面。在这种情况下,先前画面可在参考画面列表L0中首先进行索引,后续画面可稍后进行索引。参考画面列表L1还可包括按输出顺序比当前画面早的先前画面作为参考画面。在这种情况下,后续画面可在参考画面列表1中首先进行索引,先前画面可稍后进行索引。输出顺序可对应于画面顺序计数(POC)顺序。
图4示例性地示出包括CTU的画面。在图4的画面中,通过虚线划分的矩形可指示CTU,通过粗线划分的矩形可指示拼块,阴影区域可指示拼块组(或切片)。在根据本公开的视频/图像编码中,图像处理单元可具有分层结构。一个画面可被划分成一个或更多个拼块或拼块组(或切片)。一个拼块组(或切片)可包括一个或更多个拼块。一个拼块可包括一个或更多个CTU。CTU可被划分成一个或更多个CU。拼块是画面内的特定拼块行和特定拼块列中包含CTU的矩形区域。根据画面中的拼块光栅扫描,拼块组可包括整数个拼块。拼块组头可承载适用于对应拼块组的信息/参数。当编码/解码设备具有多核处理器时,对拼块或拼块组的编码/解码过程可并行处理。这里,拼块组可具有包括帧内(I)拼块组、预测(P)拼块组和双预测(B)拼块组的拼块组类型之一。对于I拼块组中的块,不使用帧间预测进行预测,可仅使用帧内预测。另外,在这种情况下,原始样本值可被编码并用信号通知,而无需预测。对于P拼块组中的块,可使用帧内预测或帧间预测,并且当使用帧间预测时,可仅使用单预测。此外,帧内预测或帧间预测可用于B拼块组中的块,并且当使用帧间预测时,可使用至多最大对(bi)预测。
编码器可根据视频图像的特性(例如,分辨率)或考虑编码的效率或并行处理来确定拼块/拼块组以及最大编码单元大小和最小编码单元大小,关于其的信息或可得出其的信息可被包括在比特流中。
解码器可获得指示当前画面的拼块/拼块组是否被划分成多个编码单元以及拼块中的CTU是否被划分成多个编码单元的信息。当仅在特定条件下获得(发送)这种信息时,效率可增加。
拼块组头(拼块组头句法或切片头、切片头句法)可包括可共同应用于拼块组(或切片)的信息/参数。APS(APS句法)或PPS(PPS句法)可包括可共同应用于一个或更多个画面的信息/参数。SPS(SPS句法)可包括可共同应用于一个或更多个序列的信息/参数。VPS(VPS句法)可包括可共同应用于整个视频的信息/参数。本公开中的高级句法可包括APS句法、PPS句法、SPS句法和VPS句法中的至少一个。
另外,例如,关于拼块/拼块组(或切片)的划分和配置的信息可在编码端通过高级句法配置并以比特流的形式发送至解码设备。
图5示例性地示出用于对句法元素进行编码的上下文自适应二进制算术编码(CABAC)。
例如,在CABAC的编码处理中,当输入信号是句法元素而非二进制值时,编码设备可通过将输入信号的值二值化来将输入信号转换为二进制值。另外,当输入信号已经是二进制值时(即,当输入信号的值是二进制值时),可旁路而不进行二值化。这里,构成二进制值的各个二进制数0或1被称为信元。例如,当二值化后的二进制串为110时,1、1和0中的每一个被称为一个信元。用于一个句法元素的信元可指示句法元素的值。
此后,句法元素的二值化的信元可被输入到常规编码引擎或旁路编码引擎。
编码设备的常规编码引擎可向对应信元分配反映概率值的上下文模型,并且基于所分配的上下文模型对对应信元进行编码。在编码设备的常规编码引擎中,在对各个信元进行编码之后,可更新对应信元的上下文模型。以这种方式编码的信元被称为上下文编码的信元。
可针对要上下文编码(常规编码)的各个信元分配和更新上下文模型,并且可基于ctxIdx或ctxInc来指示上下文模型。可基于ctxInc来推导ctxIdx。例如,指示各个常规编码的信元的上下文模型的上下文索引(ctxIdx)可被推导为上下文索引增量(ctxInc)与上下文索引偏移(ctxIdxOffset)之和。这里,可针对各个信元不同地推导ctxInc。ctxIdxOffset可由ctxIdx的最小值表示。ctxIdx的最小值可被称为ctxIdx的初始值(initValue)。ctxIdxOffset是通常用于区分其它句法元素的上下文模型的值,并且可基于ctxIdx来区分/推导一个句法元素的上下文模型。
当句法元素的二值化的信元被输入到旁路编码引擎时,其可被如下编码。例如,编码设备的旁路编码引擎省略了估计输入信元的概率的过程以及在编码之后更新应用于信元的概率模型的过程。当应用旁路编码时,编码设备可通过应用均匀概率分布而非分配上下文模型来对输入信元进行编码,从而改进编码速度。如上所述编码的信元可被称为旁路信元。
在熵编码过程中,可确定是通过常规编码引擎执行编码还是通过旁路编码引擎执行编码,因此,可切换编码路径。熵解码可按相反的顺序执行与熵编码相同的处理。
例如,当句法元素基于上下文模型来解码时,解码设备可通过比特流接收与句法元素对应的信元,使用句法元素和解码目标块或邻近块的解码信息或者在前一级中解码的符号/信元的信息来确定上下文模型,并且通过根据所确定的上下文模型预测所接收的信元的出现概率来执行信元的算术解码,从而推导句法元素的值。此后,可利用所确定的上下文模型更新接下来解码的信元的上下文模型。
另外,例如,当句法元素被旁路解码时,解码设备可通过比特流接收与句法元素对应的信元,并且可通过应用均匀概率分布将输入信元解码。在这种情况下,可省略解码设备推导句法元素的上下文模型的过程以及在解码之后更新应用于信元的上下文模型的过程。
图6示出编码设备的熵编码器。
图6的熵编码器600可与上述图2的熵编码器240相同。熵编码器600中的二值化单元601可对目标句法元素执行二值化。这里,二值化可基于诸如截断莱斯(rice)二值化处理和定长二值化处理的各种二值化方法,并且用于目标句法元素的二值化方法可预定义。
熵编码器600中的熵编码处理器602可对目标句法元素执行熵编码。编码设备可基于诸如上下文自适应二进制算术编码(CABAC)或上下文自适应可变长度编码(CAVLC)的熵编码技术基于常规编码(基于上下文)或旁路编码对目标句法元素的空串进行编码,并且输出可被包括在比特流中。如上所述,比特流可通过(数字)存储介质或网络发送至解码设备。
图7示出解码设备的熵解码器。
图7的熵解码器700可与上述图3的熵解码器310相同。熵编码器700中的二值化单元701可对目标句法元素执行二值化。这里,二值化可基于诸如截断莱斯二值化处理和定长二值化处理的各种二值化方法,并且用于目标句法元素的二值化方法可预定义。解码设备可通过二值化处理来推导目标句法元素的可用值的可用信元串(信元串候选)。
熵解码器700中的熵解码处理器702可对目标句法元素执行熵解码。解码设备从比特流中的输入比特依次解码和解析目标句法元素的各个信元,并将所推导的信元串与对应句法元素的可用信元串进行比较。如果所推导的信元串与可用信元串之一相同,则与信元串对应的值被推导为对应句法元素的值。如果否,则在进一步解析比特流中的下一比特之后再次执行上述处理。通过该处理,对应信息可使用可变长度比特用信号通知,而无需使用比特流中的特定信息(特定句法元素)的开始比特或结束比特。由此,相对少的比特可被分配给低值,并且总体编码效率可增加。
图8示例性地示出用于编码图像/视频的分层结构。
参照图8,编码的图像/视频被划分成处理图像/视频及自身的解码处理的视频编码层(VCL)、发送和存储编码的信息的子系统以及负责功能并存在于VCL和子系统之间的NAL(网络抽象层)。
在VCL中,生成包括压缩图像数据(切片数据)的VCL数据,或者可生成包括画面参数集(PSP)、序列参数集(SPS)和视频参数集(VPS)的参数集或者图像解码处理另外需要的补充增强信息(SEI)消息。
在NAL中,可通过将头信息(NAL单元头)添加到VCL中生成的原始字节序列有效载荷(RBSP)来生成NAL单元。在这种情况下,RBSP是指VCL中生成的切片数据、参数集、SEI消息等。NAL单元头可包括根据包括在对应NAL单元中的RBSP数据指定的NAL单元类型信息。
如图中所示,NAL单元可根据VCL中生成的RBSP被分类为VCL NAL单元和非VCL NAL单元。VCL NAL单元可意指包括关于图像(切片数据)的信息的NAL单元,非VCL NAL单元可意指包括对图像进行解码所需的信息(参数集或SEI消息)的NAL单元。
可通过根据子系统的数据标准附加头信息来通过网络发送上述VCL NAL单元和非VCL NAL单元。例如,NAL单元可被变换为诸如H.266/VVC文件格式、实时传输协议(RTP)、传输流(TS)等的预定标准的数据格式并通过各种网络发送。
如上所述,NAL单元可根据包括在对应NAL单元中的RBSP数据结构以NAL单元类型来指定,并且关于NAL单元类型的信息可被存储在NAL单元头中并用信号通知。
例如,NAL单元可根据NAL单元是否包括关于图像的信息(切片数据)而被分类为VCL NAL单元类型和非VCL NAL单元类型。VCL NAL单元类型可根据包括在VCL NAL单元中的画面的本质和类型来分类,并且非VCL NAL单元类型可根据参数集的类型来分类。
以下是根据包括在非VCL NAL单元类型中的参数集的类型指定的NAL单元类型的示例。
-APS(自适应参数集)NAL单元:包括APS的NAL单元的类型
-DPS(解码参数集)NAL单元:包括DPS的NAL单元的类型
-VPS(视频参数集)NAL单元:包括VPS的NAL单元的类型
-SPS(序列参数集)NAL单元:包括SPS的NAL单元的类型
-PPS(画面参数集)NAL单元:包括PPS的NAL单元的类型
-PH(画面头)NAL单元:包括PH的NAL单元的类型
上述NAL单元类型可具有NAL单元类型的句法信息,并且该句法信息可被存储在NAL单元头中并用信号通知。例如,句法信息可以是nal_unit_type,NAL单元类型可由nal_unit_type值指定。
此外,如上所述,一个画面可包括多个切片,一个切片可包括切片头和切片数据。在这种情况下,一个画面头可被进一步添加到一个画面中的多个切片(切片头和切片数据集)。画面头(画面头句法)可包括通常适用于画面的信息/参数。在本文献中,拼块组可与切片或画面混合或由切片或画面替换。另外,在本文献中,拼块组头可与切片头或画面头混合或由切片头或画面头替换。
切片头(切片头句法)可包括通常可应用于切片的信息/参数。APS(APS句法)或PPS(PPS句法)可包括通常可应用于一个或更多个切片或画面的信息/参数。SPS(SPS句法)可包括通常可应用于一个或更多个序列的信息/参数。VPS(VPS句法)可包括通常可应用于多个层的信息/参数。DPS(DPS句法)可包括通常可应用于总视频的信息/参数。DPS可包括与编码视频序列(CVS)的级联有关的信息/参数。本文献中的高级句法(HLS)可包括APS句法、PPS句法、SPS句法、VPS句法、DPS句法和切片头句法中的至少一个。
在本文献中,从编码设备编码并以比特流的形式用信号通知给解码设备的图像/图像信息不仅包括画面中的分割相关信息、帧内/帧间预测信息、残差信息、回路滤波信息等,而且包括切片头中所包括的信息、APS中所包括的信息、PPS中所包括的信息、SPS中所包括的信息和/或VPS中所包括的信息。
此外,为了补偿由于诸如量化的压缩编码处理中出现的错误而引起的原始图像与重构图像之间的差异,可如上所述对重构样本或重构画面执行回路滤波处理。如上所述,回路滤波可由编码设备的滤波器和解码设备的滤波器执行,并且可应用去块滤波器、SAO和/或自适应环路滤波器(ALF)。例如,可在去块滤波处理和/或SAO处理完成之后执行ALF处理。然而,即使在这种情况下,也可省略去块滤波处理和/或SAO处理。
图9是示意性地示出ALF处理的示例的流程图。图9中公开的ALF处理可在编码设备和解码设备中执行。在本文献中,编码设备可包括编码设备和/或解码设备。
参照图9,编码设备推导用于ALF的滤波器(S900)。滤波器可包括滤波器系数。编码设备可确定是否应用ALF,并且当确定应用ALF时,可推导包括用于ALF的滤波器系数的滤波器。用于推导用于ALF的滤波器(系数)的信息或用于ALF的滤波器(系数)可被称为ALF参数。关于是否应用ALF的信息(即,ALF启用标志)和用于推导滤波器的ALF数据可从编码设备用信号通知给解码设备。ALF数据可包括用于推导用于ALF的滤波器的信息。另外,例如,为了ALF的分层控制,可分别在SPS、画面头、切片头和/或CTB级别用信号通知ALF启用标志。
为了推导用于ALF的滤波器,推导当前块(或ALF目标块)的活动性和/或方向性,并且可基于活动性和/或方向性来推导滤波器。例如,可以4×4块为单位(基于亮度分量)应用ALF处理。当前块或ALF目标块可以是例如CU,或者可以是CU内的4×4块。具体地,例如,用于ALF的滤波器可基于从包括在ALF数据中的信息推导的第一滤波器和预定义的第二滤波器来推导,并且编码设备可基于活动性和/或方向性选择滤波器之一。编码设备可使用包括在所选滤波器中的滤波器系数来进行ALF。
编码设备基于滤波器执行滤波(S910)。可基于滤波来推导修改的重构样本。例如,滤波器中的滤波器系数可根据滤波器形状布置或分配,并且可对当前块中的重构样本执行滤波。这里,当前块中的重构样本可以是去块滤波处理和SAO处理完成之后的重构样本。例如,可使用一个滤波器形状,或者可从多个预定滤波器形状当中选择并使用一个滤波器形状。例如,应用于亮度分量的滤波器形状和应用于色度分量的滤波器形状可不同。例如,7×7菱形滤波器形状可用于亮度分量,5×5菱形滤波器形状可用于色度分量。
图10示出ALF滤波器的形状的示例。图10的(a)中的C0~C11和图10的(b)中的C0~C5可以是取决于各个滤波器形状内的位置的滤波器系数。
图10的(a)示出7×7菱形滤波器的形状,图10的(b)示出5×5菱形滤波器的形状。在图10中,滤波器形状中的Cn表示滤波器系数。当Cn中的n相同时,这指示可指派相同的滤波器系数。在本文献中,根据ALF的滤波器形状指派滤波器系数的位置和/或单元可被称为滤波器抽头。在这种情况下,一个滤波器系数可被指派给各个滤波器抽头,滤波器抽头的布置可与滤波器形状对应。位于滤波器形状的中心的滤波器抽头可被称为中心滤波器抽头。相同的滤波器系数可被指派给相对于中心滤波器抽头存在于彼此对应的位置处的相同n值的两个滤波器抽头。例如,在7×7菱形滤波器形状的情况下,包括25个滤波器抽头,并且由于滤波器系数C0至C11以中心对称的形式指派,所以可仅使用13个滤波器系数向25个滤波器抽头指派滤波器系数。另外,例如,在5×5菱形滤波器形状的情况下,包括13个滤波器抽头,并且由于滤波器系数C0至C5以中心对称的形式指派,所以可仅使用7个滤波器系数向13个滤波器抽头指派滤波器系数。例如,为了减少用信号通知的关于滤波器系数的信息的数据量,可(明确地)用信号通知7×7菱形滤波器形状的13个滤波器系数当中的12个滤波器系数,并且可(隐含地)推导一个滤波器系数。另外,例如,可(明确地)用信号通知5×5菱形滤波器形状的7个滤波器系数当中的6个滤波器系数,并且可(隐含地)推导一个滤波器系数。
根据本文献的实施方式,可通过自适应参数集(APS)用信号通知用于ALF处理的ALF参数。可从用于ALF的滤波器信息或ALF数据推导ALF参数。
ALF是如上所述可在视频/图像编码中应用的一种环路内滤波技术。可使用基于维纳(Wiener)的自适应滤波器来执行ALF。这可以是为了使原始样本与解码样本(或重构样本)之间的均方误差(MSE)最小化。ALF工具的高级设计可包含可从SPS和/或切片头(或拼块组头)访问的句法元素。
图11示出ALF数据的分层结构的示例。
参照图11,编码视频序列(CVS)1100可包括SPS、一个或更多个PPS以及随后的一个或更多个编码画面。各个编码画面可被分成矩形区域。矩形区域可被称为拼块。一个或更多个拼块可被聚合以形成拼块组或切片。在这种情况下,拼块组头可链接至PPS,并且PPS可链接至SPS。根据现有方法,ALF数据(ALF参数)包括在拼块组头中。考虑到一个视频由多个画面组成并且一个画面包括多个拼块,以拼块组为单位的频繁ALF数据(ALF参数)信令降低了编码效率。
根据本公开中提出的实施方式,ALF参数可被包括在APS中并如下用信号通知。
图12示出ALF数据的分层结构的另一示例。
参照图12,CVS 1200可包括SPS、一个或更多个PPS、一个或更多个APS以及随后的一个或更多个编码画面。即,定义APS,并且APS可承载必要的ALF数据(ALF参数)。另外,APS可具有自识别参数和ALF数据。APS的自识别参数可包括APS ID。即,除了ALF数据字段之外,APS可包括指示APS ID的信息。拼块组头或切片头可使用APS索引信息来参考APS。换言之,拼块组头或切片头可包括APS索引信息,并且可基于包括在具有APS索引信息所指示的APSID的APS中的ALF数据(ALF参数)来执行对目标块的ALF处理。这里,APS索引信息可被称为APS ID信息。
另外,SPS可包括允许使用ALF的标志。例如,当CVS开始时,可检查SPS,并且可在SPS中检查该标志。例如,SPS可包括下表1的句法。表1的句法可以是SPS的一部分。
[表1]
Figure BDA0003535230020000251
例如,包括在表1的句法中的句法元素的语义可如下表2所示表示。
[表2]
Figure BDA0003535230020000261
即,句法元素sps_alf_enabled_flag可指示ALF是否被启用。当通过SPS(或SPS级别)用信号通知的ALF启用标志sps_alf_enabled_flag的值为1时,可确定对于参考SPS的CVS中的画面启用ALF。另外,当sps_alf_enabled_flag的值为0时,可确定对于参考SPS的CVS中的画面未启用ALF。
此外,如上所述,可通过在比SPS更低的级别用信号通知附加启用标志来单独地打开/关闭ALF。例如,当对于CVS启用ALF工具时,可在拼块组头或切片头中用信号通知slice_alf_enabled_flag。例如,切片头可包括下表3的句法。
[表3]
Figure BDA0003535230020000262
例如,包括在表3的句法中的句法元素的语义可如下表中所示表示。
[表4]
Figure BDA0003535230020000263
Figure BDA0003535230020000271
例如,当在SPS级别启用ALF时,可解析/用信号通知slice_alf_enabled_flag。由一个或更多个拼块组成的各个拼块组可基于slice_alf_enabled_flag确定ALF是否被启用。
当拼块组头或切片头中用信号通知的ALF启用标志sps_alf_enabled_flag的值为1时,可通过切片头解析ALF数据。例如,slice_alf_enabled_flag可指定亮度和色度分量的ALF启用条件。
可通过APS ID信息(即,slice_alf_aps_id)来访问ALF数据。对应拼块组或对应切片所参考的APS可基于APS ID信息来识别。APS可包括ALF数据。
此外,可基于例如下表5的句法来描述包括ALF数据的APS的结构。表5的句法可以是APS的一部分。
[表5]
Figure BDA0003535230020000272
例如,包括在表5的句法中的句法元素的语义可如下表6所示表示。
[表6]
Figure BDA0003535230020000273
Figure BDA0003535230020000281
如上所述,句法元素adaptation_parameter_set_id可指示对应APS的标识符。即,可基于句法元素adaptation_parameter_set_id来识别APS。句法元素adaptation_parameter_set_id可被称为APS ID信息。另外,APS可包括ALF数据字段。可在句法元素adaptation_parameter_set_id之后解析/用信号通知ALF数据字段alf_data()。
可在切片头或拼块组头中执行ALF信息的核心处理/操纵。上述ALF数据字段可包括关于ALF滤波器的处理的信息。例如,可从ALF数据字段提取的信息包括关于所使用的滤波器的数量的信息、指示是否仅对亮度分量应用ALF的信息、关于颜色分量的信息、关于指数哥伦布(EG)参数的信息和/或滤波器系数的增量值等。
此外,例如,ALF数据字段可包括如下ALF数据句法。
[表7]
Figure BDA0003535230020000282
Figure BDA0003535230020000291
Figure BDA0003535230020000301
例如,包括在表7的句法中的句法元素的语义可如下表中所示表示。
[表8]
Figure BDA0003535230020000302
Figure BDA0003535230020000311
Figure BDA0003535230020000321
Figure BDA0003535230020000331
Figure BDA0003535230020000341
Figure BDA0003535230020000351
Figure BDA0003535230020000361
Figure BDA0003535230020000371
通过首先解析/用信号通知指示是否用信号通知亮度滤波器集合的句法元素alf_luma_filter_signal_flag来开始切片头中的ALF数据的解析。类似地,可解析/用信号通知指示是否用信号通知色度滤波器的句法元素alf_chroma_filter_signal_flag。
当alf_luma_filter_signal_flag被启用时,可解析alf_luma_clip_flag。
当该标志被禁用时,可指定对亮度分量应用线性自适应环路滤波。当该标志被启用时,可指定对亮度分量应用非线性自适应环路滤波。
另外,可解析关于所使用的亮度滤波器的数量的信息。
作为示例,可使用的最大滤波器数量可被设定为25。当用信号通知的亮度滤波器的数量为至少一个时,对于从0至最大滤波器数量(即,25,可另选地称为类)的范围内的各个滤波器,可解析/用信号通知滤波器的索引信息。这可意指每一类(即,从0至最大滤波器数量)与滤波器索引关联。
接下来,可解析/用信号通知alf_luma_use_fixed_filter_flag,它是指示当前切片中是否使用固定滤波器的标志。当alf_luma_use_fixed_filter_flag被启用时,可使用alf_luma_fixed_filter_set_idx参数来用信号通知固定滤波器集合的索引。该参数可具有0至15范围的值。另外,可解析/用信号通知alf_luma_fixed_filter_pred_present_flag。该标志可指定是否使用固定滤波器预测第i滤波器系数。然后,对于各个滤波器,指示固定滤波器是否用于对应滤波器的标志可被解码。
当基于滤波器索引来标记要用于各类的滤波器时,可解析/用信号通知alf_luma_coeff_delta_flag。该标志可用于解释切片头中是否存在与ALF亮度滤波器系数增量值的预测有关的标志alf_luma_coeff_delta_prediction_flag。
如果由句法元素alf_luma_num_filters_signalled_minus1用信号通知的亮度滤波器的数量大于0并且句法元素alf_luma_coeff_delta_flag的值为0,则意指切片头中存在句法元素alf_luma_coeff_delta_prediction_flag并且评估其状态。如果句法元素alf_luma_coeff_delta_prediction_flag的状态指示1,则这可意指从先前亮度(滤波器)系数预测亮度滤波器系数。如果句法元素alf_luma_coeff_delta_prediction_flag的状态指示0,则这可意指不从先前亮度(滤波器)系数的增量预测亮度滤波器系数。
另外,当增量滤波器系数(即,alf_luma_coeff_delta_abs)基于指数哥伦布码编码时,可确定指数哥伦布(EG)码的阶数k(阶k)以便将增量亮度滤波器系数(即,alf_luma_coeff_delta_abs)解码。例如,可基于指数哥伦布编码使用阶数k将滤波器系数解码。指数哥伦布码的阶数可被表示为EG(k)。
为了确定EG(k),可解析/用信号通知句法元素alf_luma_min_eg_order_minus1。句法元素alf_luma_min_eg_order_minus1可以是熵编码的句法元素。句法元素alf_luma_min_eg_order_minus1可指示用于增量亮度滤波器系数的解码的EG的最小阶。例如,句法元素alf_luma_min_eg_order_minus1的值可在0至6的范围内。
在解析/用信号通知句法元素alf_luma_min_eg_order_minus1之后,可解析/用信号通知句法元素alf_luma_eg_order_increase_flag。如果句法元素alf_luma_eg_order_increase_flag的值为1,则这指示句法元素alf_luma_min_eg_order_minus1所指示的EG的阶数增加1。如果句法元素alf_luma_eg_order_increase_flag的值为0,则这指示句法元素alf_luma_min_eg_order_minus1所指示的EG的阶数不增加。EG的阶数可由EG的索引表示。例如,可如下确定基于句法元素alf_luma_min_eg_order_minus1和句法元素alf_luma_eg_order_increase_flag的EG阶数(或EG索引)(与亮度分量有关)。
[表9]
Figure BDA0003535230020000381
Figure BDA0003535230020000391
基于确定处理,expGoOrderY可被推导为expGoOrderY=KminTab。由此,可推导包括EG阶数的阵列,其可由解码设备使用。expGoOrderY可指示EG阶数(或EG索引)。
下表可表示用于基于上述算法推导哥伦布阶数的方法。即,上述算法可基于下表。在下表中,哥伦布索引可以是输入,要使用的k阶可以是对应输出。
[表10]
哥伦布索引=0 哥伦布索引=1 哥伦布索引=2
Kmin=1 1 1 2
alf_luma_eg_order_increase_flag[i] 0 1 1
哥伦布阶k 1 2 3
参照表10,(最小)哥伦布阶数和/或(最小)哥伦布索引可基于alf_eg_order_increase_flag[i]增加。例如,如果alf_luma_min_eg_order_minus1=0,则Kmin可被设定为=0+1。当哥伦布索引为0时,可解析alf_luma_eg_order_increase_flag[i]。当该标志被启用时(如果可用),与哥伦布索引=0对应的哥伦布阶数可从初始Kmin值增加1。如表11所示,当该标志被禁用时(不可用),当哥伦布索引=0时,哥伦布阶数可不增加。Kmin可利用哥伦布阶数更新,例如哥伦布索引可被视为(更新为)1。这里,alf_luma_eg_order_increase_flag[1]的值可为1。因此,Kmin哥伦布阶数可增加至2。类似地,alf_luma_eg_order_increase_flag[2]被启用(可用),这可指示Kmin增加1以使最终哥伦布阶数为3。
图13示例性地示出根据滤波器类型的滤波器系数的哥伦布索引。图13的(a)可表示5×5滤波器,图13的(b)可表示7×7滤波器。这里,可仅示出对称滤波器的一部分。在图13中,各个位置的数字可表示与各个位置对应的ALF滤波器系数的预先指派的哥伦布索引。
在一个示例中,给定滤波器系数的第k阶哥伦布阶数可通过将给定系数位置的哥伦布索引索引到上表11中来确定。各个ALF滤波器系数可使用第k阶来解码。
在一个示例中,可存在预定义的哥伦布阶数索引(即,golombOrderIdxY)。预定义的哥伦布阶数可用于确定用于对系数进行编码的最终哥伦布阶数。
例如,预定义的哥伦布阶数可例如如下式配置。
[式1]
golombOrderIdxY[]={0,0,1,0,1,2,1,0,0,1,2}
这里,阶数k=expGoOrderY[golombOrderIdxY[j]],并且j可表示第j用信号通知的滤波器系数。例如,如果j=2(即,第三滤波器系数),则golomborderIdxY[2]=1,因此k=expGoOrderY[1]。
在这种情况下,例如,如果句法元素alf_luma_coeff_delta_flag的值表示真(即,1),则可为用信号通知的每一个滤波器用信号通知句法元素alf_luma_coeff_flag。句法元素alf_luma_coeff_flag指示是否(明确地)用信号通知亮度滤波器系数。
当确定EG阶数和上述相关标志(即,alf_luma_coeff_delta_flag、alf_luma_coeff_flag等)的状态时,可解析/用信号通知亮度滤波器系数的差信息和符号信息(即,alf_luma_coeff_flag为真)(如果指示)。可解析/用信号通知12个滤波器系数中的每一个的增量绝对值信息(alf_luma_coeff_delata_abs句法元素)。另外,如果句法元素alf_luma_coeff_delta_abs具有值,则可解析/用信号通知符号信息(句法元素alf_luma_coeff_delta_sign)。包括亮度滤波器系数的差信息和符号信息的信息可被称为关于亮度滤波器系数的信息。
滤波器系数的增量可连同符号一起确定并存储。在这种情况下,带符号的滤波器系数的增量可按阵列的形式存储,其可被表示为filterCoefficients。滤波器系数的增量可被称为增量亮度系数,带符号的滤波器系数的增量可被称为带符号的增量亮度系数。
为了从带符号的增量亮度系数确定最终滤波器系数,(亮度)滤波器系数可如下式更新。
[式2]
filterCoefficients[sigFiltIdx][j]+=filterCoefficients[sigFiltIdx][j]
这里,j可指示滤波器系数索引,sigFiltIdx可指示用信号通知的滤波器索引。j={0,...,11},并且sigFiltIdx={0,...,alf_luma_filters_signaled_minus1}。
系数可被复制到最终AlfCoeffL[filtIdx][j]中。在这种情况下,filtidx=0,...,24,并且j=0,...,11。
给定滤波器索引的带符号的增量亮度系数可用于确定前12个滤波器系数。例如,7×7滤波器的第十三滤波器系数可基于下式确定。第十三滤波器系数可指示上述中心抽头滤波器系数。
[式3]
AlfCoeffL[filtIdx][12]=128-∑kAlfCoeffC[filtIdx][k]<<1
这里,滤波器系数索引12可指示第十三滤波器系数。
例如,为了确保比特流一致性,最终滤波器系数AlfCoeffL[filtIdx][k]的值的范围为0,...,11,可在-27至27-1范围内,并且当k为12时可在0至28-1范围内。这里,k可由i代替。
当执行对亮度分量的处理时,可基于句法元素alf_chroma_idc执行对色度分量的处理。如果句法元素alf_chroma_idc的值大于0,则可解析/用信号通知色度分量的最小EG阶数信息(即,句法元素alf_chroma_min_eg_order_minus1)。根据本文献的上述实施方式,5×5菱形滤波器形状可用于色度分量。在这种情况下,最大哥伦布索引可为2。在这种情况下,例如,色度分量的EG阶数(或EG索引)可如下确定。
[表11]
Figure BDA0003535230020000411
基于确定处理,expGoOrderC可被推导为expGoOrderC=KminTab。由此,可推导包括EG阶数的阵列,其可由解码设备使用。expGoOrderC可指示色度分量的EG阶数(或EG索引)。
如果alf_luma_clip_flag被启用(如果可用),则可解析用于限幅的最小指数哥伦布阶数。类似于ALF系数信令,可解析alf_luma_clip_eg_order_increase_flag。然后,对于各个滤波器索引,alf_luma_doeff_flag被启用(可用),并且如果存在滤波器系数(即,j=0..1),则可解析限幅索引。
一旦亮度滤波器系数被重构,也可解析色度系数。另外,可存在预定义的哥伦布阶数索引(golombOrderIdxC)。预定义的哥伦布阶数可用于确定用于对系数进行编码的最终哥伦布阶数。
例如,预定义的哥伦布阶数可例如如下式配置。
[式4]
golombOrderIdxC[]={0,0,1,0,0,1}
这里,阶数k=expGoOrderC[golombOrderIdxC[j]],并且j可表示第j用信号通知的滤波器系数。例如,如果j=2,则其指示第三滤波器系数,golomborderIdxY[2]=1,因此k=expGoOrderC[1]。
基于此,可解析/用信号通知色度滤波器系数的绝对值信息和符号信息。包括色度滤波器系数的绝对值信息和符号信息的信息可被称为关于色度滤波器系数的信息。例如,可对色度分量应用5×5菱形滤波器形状,在这种情况下,可解析/用信号通知六个(色度分量)滤波器系数中的每一个的绝对增量信息(句法元素alf_chroma_coeff_abs)。另外,如果句法元素alf_chroma_coeff_abs的值大于0,则可解析/用信号通知符号信息(句法元素alf_chroma_coeff_sign)。例如,可基于关于色度滤波器系数的信息来推导六个色度滤波器系数。在这种情况下,例如,第七色度滤波器系数可基于下式确定。第七滤波器系数可表示上述中心抽头滤波器系数。
[式5]
AlfCoeffC[6]=128-∑kAlfCoeffC[filtIdx][k]<<1
这里,滤波器系数索引6可指示第七滤波器系数。作为参考,由于滤波器系数索引从0开始,所以值6可指示第七滤波器系数。
例如,为了确保比特流一致性,当k为0,...,5时,最终滤波器系数AlfCoeffC[filtIdx][k]的值的范围可为-27至27-1,当k为6时,最终滤波器系数AlfCoeffC[filtIdx][k]的值的范围可为-28至28-1。这里,k可由j代替。
然后,类似于亮度的情况,当确定色度的限幅索引时,可检查alf_luma_clip_flag。如果该标志被启用(如果可用),则可解析限幅的最小哥伦布阶数。然后,如果存在滤波器系数,则可解析alf_chroma_clip_index。
如上所述,当推导(亮度/色度)滤波器系数时,可基于滤波器系数或包括滤波器系数的滤波器执行基于ALF的滤波。由此,如上所述,可推导修改的重构样本。另外,可推导多个滤波器,并且多个滤波器之一的滤波器系数可用于ALF处理。例如,可基于用信号通知的滤波器选择信息来指示多个滤波器之一。或者,例如,可基于当前块或ALF目标块的活动性和/或方向性选择多个滤波器之一,并且所选滤波器的滤波器系数可用于ALF处理。
一旦来自APS和切片头的层信息被解码,编码树单元(CTU)就被解码。一个网络抽象层(NAL)单元可包括切片头和切片数据。切片数据可方便编码树单元的解码。
下表示例性地表示编码树单元的句法。
[表12]
Figure BDA0003535230020000431
例如,包括在表12的句法中的句法元素的语义可如下表中所示表示。
[表13]
Figure BDA0003535230020000432
Figure BDA0003535230020000441
在CTU级别处理中,当对于切片启用ALF时,可解析/用信号通知句法元素alf_ctb_flag。alf_ctb_flag可指定对编码树块(CTB)应用ALF。当对CTB应用ALF并且所发送的APSID的数量大于0时,可解析/用信号通知另一标志alf_use_aps_flag。当alf_use_aps_flag为1时,可指定对亮度CTB应用APS的滤波器信息。然而,当alf_use_aps_flag被停用时,可对CTB应用固定滤波器集合之一。
在本文献的实施方式中,提出了用于高效地应用上述ALF的编码处理。根据本文献的实施方式,提出了上述句法元素alf_luma_fixed_filter_idx的二值化处理的示例。这里,alf_luma_fixed_filter_idx可指定应用于(亮度)CTB(重构样本)的固定滤波器。
在一个示例中,如果alf_use_aps_flag为真(值1),则可对(亮度)CTB(重构样本)应用来自APS的滤波器集合,并且基于关于先前滤波器的信息(例如,alf_luma_prev_filter_idx_minus1),可推导滤波器系数。当alf_use_aps_flag为假(值0)时,可对(亮度)CTB(重构样本)应用固定滤波器。例如,alf_luma_fixed_filter_idx的值可在0至15的范围内。
下表示出与ALF有关的句法元素的二值化处理的示例。
[表14]
Figure BDA0003535230020000451
在表14中,句法元素alf_luma_fixed_filter_idx可基于截断二元(TB)二值化处理来编码。例如,与句法元素有关的最大值(例如,cMax)可为15。根据TB二值化处理,仅复杂度会不必要地增加,而没有任何额外益处。为此,提出了基于定长(FL)二值化处理的以下示例。
下表示出与ALF过程有关的句法元素的二值化信息的另一示例。
[表15]
Figure BDA0003535230020000452
聚焦于与表14的不同来描述表15。在表15中,句法元素alf_luma_fixed_filter_idx可基于FL二值化处理来编码。例如,与句法元素有关的最大值(例如,cMax)可使用4比特表示。
下表示出将ctxInc指派给以上下文编码信元作为根据上表15的上下文编码信元的句法元素的示例。在表15中,例如,对于句法元素alf_luma_fixed_filter_idx,binIdx大于或等于5的信元可能不存在(或者可能不可用)。
[表16]
Figure BDA0003535230020000453
Figure BDA0003535230020000461
根据本公开的实施方式,提出了上述句法元素alf_luma_fixed_filter_set_idx的二值化过程的示例。这里,alf_luma_fixed_filter_set_idx可指定固定滤波器集合的索引。
例如,可为alf_luma_fixed_filter_set_idx的信令应用定长(FL)二值化过程。
下表举例说明了ALF数据句法。
[表17]
Figure BDA0003535230020000462
参考上表,alf_luma_fixed_filter_set_idx可基于定长(FL)二值化过程而非截断二元(TB)二值化过程来编码。例如,包括在表中的alf_luma_fixed_filter_set_idx的语义可如下表中所示表示。
[表18]
Figure BDA0003535230020000463
在本文献的实施方式中,提出了用于简化哥伦布阶数的信令推导处理的与ALF系数有关的信令方法。例如,在本文献的实施方式中,所提出的方法可通过固定信令实现。在一个示例中,指数哥伦布码的第k阶对于亮度可固定为2,对于色度可固定为3。然而,本文献的实施方式未必限于这种示例,k阶可被固定为另一适当值。
下表示出应用了上述简化的ALF数据字段的句法。
[表19]
Figure BDA0003535230020000471
Figure BDA0003535230020000481
Figure BDA0003535230020000491
例如,包括在表19的句法中的句法元素的语义可如下表中所示表示。
[表20]
Figure BDA0003535230020000492
Figure BDA0003535230020000501
在本文献的实施方式中,提出了对于各个ALF滤波器系数使用预定哥伦布阶数的方法。
下表示例性地示出用于对ALF亮度系数进行解码的哥伦布阶数(第k阶)。C0至C11表示ALF亮度系数索引(或者例如,取决于根据图6用于ALF的滤波器形状中的位置的滤波器系数),其中,例如,第k阶可为2或3。
[表21]
系数索引 第k阶
C<sub>0</sub> 2
C<sub>1</sub> 2
C<sub>2</sub> 2
C<sub>3</sub> 2
C<sub>4</sub> 2
C<sub>5</sub> 3
C<sub>6</sub> 3
C<sub>7</sub> 3
C<sub>8</sub> 2
C<sub>9</sub> 2
C<sub>10</sub> 2
C<sub>11</sub> 3
下表举例说明了根据此实施方式的基于编码的语义。例如,下表可以是修改以固定亮度系数或色度系数的哥伦布阶数的语义。
[表22]
Figure BDA0003535230020000502
Figure BDA0003535230020000511
Figure BDA0003535230020000521
在本文献的实施方式中,提出了仅针对色度分量用信号通知固定哥伦布阶数的方法。即,根据此实施方式实现用于固定色度分量的哥伦布阶数的信令的示例。
下表示例性地示出根据本文献的实施方式的基于编码的ALF数据字段的句法。
[表23]
Figure BDA0003535230020000531
Figure BDA0003535230020000541
Figure BDA0003535230020000551
例如,包括在表23的句法中的句法元素的语义可如下表中所示表示。
[表24]
Figure BDA0003535230020000552
在本文献的实施方式中,提出了用于对关于ALF限幅的信息进行编码的固定信令(例如,alf_luma_clip_idx[sfIdx][j]、alf_chroma_clip_idx[j]等)。例如,k阶哥伦布可预定或预先固定,并且如上述实施方式中那样使用。
下表举例说明了根据本实施方式的基于编码的ALF数据字段的句法。
[表25]
Figure BDA0003535230020000561
Figure BDA0003535230020000571
例如,包括在表25的句法中的句法元素的语义可如下表中所示表示。
[表26]
Figure BDA0003535230020000581
Figure BDA0003535230020000591
在本文献的实施方式中,提出了基于(或依赖于)指数哥伦布编码从ALF数据字段的各种角度的信令组合。即,可通过此实施方式实现将上述实施方式中的至少一个组合的信令的示例。
下表示例性地示出根据本实施方式的基于编码的ALF数据字段的句法。
[表27]
Figure BDA0003535230020000601
Figure BDA0003535230020000611
例如,包括在表27的句法中的句法元素的语义可如下表中所示表示。
[表28]
Figure BDA0003535230020000612
Figure BDA0003535230020000621
在本公开的实施方式中,提出了防止色度的APS ID被用信号通知和推断的方法。
下表举例说明了根据本实施方式的基于编码的切片头的句法。
[表29]
Figure BDA0003535230020000631
例如,包括在上表的句法中的句法元素的语义可如下表中所示表示。
[表30]
Figure BDA0003535230020000632
参考上表,不管切片类型是否为I或者切片所参考的ALF APS的数量是否为一个,可用信号通知slice_alf_aps_id_chroma。
另外,在本公开的实施方式中,提出了解析/用信号通知色度分量的替代滤波器信息的方法。
下表示例性地示出根据本实施方式的基于编码的ALF数据字段的句法。
[表31]
Figure BDA0003535230020000641
例如,包括在上表的句法中的句法元素的语义可如下表中所示表示。
[表32]
Figure BDA0003535230020000651
Figure BDA0003535230020000661
Figure BDA0003535230020000671
Figure BDA0003535230020000681
Figure BDA0003535230020000691
Figure BDA0003535230020000701
参考上表,ALF数据字段可包括色度分量的替代滤波器信息。
例如,句法元素alf_chroma_num_alts_minus1可指示用于色度分量的替代滤波器的数量。用于色度分量的替代滤波器的索引altIdx可具有0至alf_chroma_num_alts_minus1范围内的值。另外,句法元素alf_chroma_coeff_abs[altIdx][j]可指示具有索引altIdx的替代滤波器中所包括的第i系数的绝对值。另外,句法元素alf_chroma_coeff_sign[altIdx][j]可指示具有索引altIdx的替代滤波器中所包括的第i系数的符号。
比较上表32与上表7,可以理解,在本公开的实施方式中,与ALF系数和限幅系数的指数哥伦布编码有关的句法被简化,并且通过使用固定滤波器预测去除了用于预测滤波器系数的句法。另外,参考上表32,在本公开的实施方式中,提出了用信号通知固定指数哥伦布阶数,而非用信号通知指数哥伦布(EG)码的阶数k的方法。
下表举例说明了编码树单元(CTU)的句法。
[表33]
Figure BDA0003535230020000711
例如,包括在上表的句法中的句法元素的语义可如下表中所示表示。
[表34]
Figure BDA0003535230020000712
Figure BDA0003535230020000721
参考上表,可包括用于应用ALF的编码树单元(CTU)或当前块的色度分量的替代滤波器的索引信息。例如,句法元素alf_ctb_filter_alt_idx可指定当对色度索引为1或2的色度分量应用ALF时用于色度分量的替代滤波器的索引。
下表举例说明了样本自适应偏移句法(SAO)的句法。
[表35]
Figure BDA0003535230020000731
下表以标准文档格式示出ALF过程的示例。
[表36]
Figure BDA0003535230020000732
Figure BDA0003535230020000741
另外,下表以标准文档格式示出对亮度样本的编码树单元滤波过程的示例。
[表37]
Figure BDA0003535230020000742
Figure BDA0003535230020000751
Figure BDA0003535230020000761
Figure BDA0003535230020000771
另外,下表以标准文档格式示出用于推导亮度样本的ALF转置和滤波器索引的过程的示例。
[表38]
Figure BDA0003535230020000772
Figure BDA0003535230020000781
Figure BDA0003535230020000791
Figure BDA0003535230020000801
另外,下表以标准文档格式示出对色度样本的编码树单元滤波过程的示例。
[表39]
Figure BDA0003535230020000802
Figure BDA0003535230020000811
Figure BDA0003535230020000821
另外,下表示出根据句法元素alf_ctb_filter_alt_idx的上下文索引增量(ctxInc)的初始化值(initValue)和移位索引(shiftIdx)的示例。
[表40]
Figure BDA0003535230020000822
Figure BDA0003535230020000831
参考上表,指示替代滤波器的索引信息的句法元素alf_ctb_filter_alt_idx的初始化值(initValue)可基于alf_ctb_filter_alt_idx的上下文索引增量(ctxInc)或初始化类型(initType)来确定。另外,alf_ctb_filter_alt_idx的移位索引(shiftIdx)可基于alf_ctb_filter_alt_idx的上下文索引增量(ctxInc)来确定。
另外,下表示出与包括句法元素alf_ctb_filter_alt_idx的各种句法有关的二值化的示例。
[表41]
Figure BDA0003535230020000832
Figure BDA0003535230020000841
Figure BDA0003535230020000851
参考上表,指示用于应用ALF的编码树单元(CTU)或当前块的色度分量的替代滤波器的索引信息的句法元素alf_ctb_filter_alt_idx可基于替代滤波器的索引参数的截断莱斯二值化方法来编码。另外,用于色度分量的替代滤波器的索引参数的最大值(cMax)可对应于alf_chroma_num_alts_minus1。alf_chroma_num_alts_minus1可对应于比用于色度分量的替代滤波器的数量小1的值。另外,截断莱斯二值化方法可基于莱斯参数(cRiceParam)值0来执行。
另外,下表以标准文档格式示出用于推导句法元素alf_ctb_filter_alt_idx的上下文索引增量(ctxInc)的过程的示例。
[表42]
Figure BDA0003535230020000861
替代滤波器的索引信息的信元串中的信元可基于上下文模型来熵解码,并且替代滤波器的索引信息的信元串中的信元的上下文模型可基于信元的上下文索引增量来确定。参考上表,替代滤波器的索引信息的上下文模型可基于指示替代滤波器的索引信息的句法元素alf_ctb_filter_alt_idx的上下文索引增量来确定,并且替代滤波器的索引信息的上下文索引增量可基于应用ALF的CTU或当前块的色度分量来确定。例如,替代滤波器的索引信息的上下文索引增量可基于色度分量的索引来确定。例如,当当前块的色度分量为cb时推导的上下文索引增量可不同于当当前块的色度分量为cr时推导的上下文索引增量。例如,当色度分量的索引为0时,alf_ctb_filter_alt_idx的上下文索引增量可具有值0,当色度分量的索引为1时,alf_ctb_filter_alt_idx的上下文索引增量可具有值1。另选地,例如,当色度分量的索引为1时,alf_ctb_filter_alt_idx的上下文索引增量可具有值1,当色度分量的索引为2时,alf_ctb_filter_alt_idx的上下文索引增量可具有值2。
图14和图15示意性地示出根据本公开的实施方式的视频/图像编码方法和相关组件的示例。图14所示的方法可由图2所示的编码设备执行。具体地,例如,S1400可由编码设备的预测器220执行,S1410可由编码设备的加法器250执行。S1420可由编码设备的滤波器260执行,S1430可由编码设备的熵编码器240执行。图14所示的方法可包括本公开中上面描述的实施方式。
参照图14,编码设备确定当前块的预测模式并基于该预测模式来推导预测样本(S1400)。编码设备可确定本文献中描述的各种预测模式(例如,帧间预测或帧内预测)当中的任一个预测模式。编码设备可基于所确定的预测模式来推导当前块的预测样本。编码设备可生成指示应用于当前块的预测模式的预测模式信息。
解码设备基于预测样本来生成重构样本(S1410)。首先,解码设备可基于预测样本和原始样本来推导残差样本。例如,解码设备可基于原始样本与修改的重构样本之间的比较来推导残差样本。
编码设备可基于预测样本和残差样本之和来生成重构样本。编码设备可基于重构样本执行帧内预测。
编码设备对重构样本执行ALF过程(S1220)。编码设备推导可应用于对重构样本进行滤波的ALF相关参数,并且执行ALF过程。
编码设备对包括ALF信息和预测相关信息的图像信息进行编码(S1430)。例如,预测相关信息可包括帧间预测模式信息或帧间预测类型信息。例如,帧间预测模式信息可包括指示各种帧间预测模式的至少一部分的信息。例如,可使用诸如合并模式、跳过模式、运动向量预测(MVP)模式、仿射模式、子块合并模式或合并与MVD(MMVD)模式的各种模式。另外,除了或代替辅助模式,可使用解码器侧运动向量细化(DMVR)模式、自适应运动向量分辨率(AMVR)模式、以CU级别权重(BCW)的双预测或双向光流(BDOF)。例如,帧间预测类型信息可包括inter_pred_idc句法元素。另选地,帧间预测类型信息可包括指示L0预测、L1预测或成对(bi)预测中的任一个的信息。
例如,ALF信息可包括本公开中上面描述的关于ALF滤波器系数的信息、关于固定滤波器的信息、关于限幅的信息等。另外,例如,ALF信息可包括用于当前块的色度分量的替代滤波器信息。替代滤波器信息可指示用于推导当前块的色度分量的修改的重构样本的替代滤波器。另选地,替代滤波器信息可指示应用于当前块的色度分量的替代滤波器的索引。
图像/视频信息可包括用于生成重构样本的信息和/或与ALF有关的信息。用于生成重构样本的信息可包括例如预测相关信息、残差信息和/或量化/变换相关信息。预测相关信息可包括关于各种预测模式(例如,合并模式、MVP模式等)的信息、MVD信息等。
编码的图像/视频信息可按比特流的形式输出。比特流可通过网络或存储介质发送至解码设备。
根据本公开的实施方式,图像/视频信息可包括各种类型的信息。
在实施方式中,替代滤波器信息可包括关于用于当前块的色度分量的替代滤波器的数量的信息、包括在用于当前块的色度分量的替代滤波器中的系数的绝对值信息以及用于当前块的色度分量的替代滤波器中所包括的系数的符号信息。
在实施方式中,替代滤波器信息可包括用于当前块的色度分量的替代滤波器的索引信息。并且替代滤波器的索引信息可基于截断莱斯二值化。
在实施方式中,替代滤波器的索引信息的最大值(cMax)可等于比用于当前块的色度分量的替代滤波器的数量小1的值,并且截断莱斯二值化可基于莱斯参数(cRiceParam)值0来执行。
在实施方式中,用于替代滤波器的索引信息的信元串中的信元可基于上下文模型来熵编码。相对于替代滤波器的索引信息的信元串中的信元的上下文模型可基于信元的上下文索引增量来确定。另外,上下文索引增量可基于当前块的色度分量的索引来确定。
在实施方式中,当当前块的色度分量为cb时推导的上下文索引增量可不同于当当前块的色度分量为cr时推导的上下文索引增量。
在实施方式中,图像信息可包括关于ALF限幅的信息,并且关于ALF限幅的信息可包括指示是否对当前块的色度分量应用限幅的标志以及指示限幅值的限幅索引信息。
图16和图17示意性地示出根据本公开的实施方式的图像/视频解码方法和相关组件的示例。图16所示的方法可由图3所示的解码设备执行。具体地,例如,S1600可由解码设备的熵解码器310执行,S1610可由解码设备的预测器330执行。S1620可由解码设备的加法器340执行,S1630可由解码设备的滤波器350执行。图16所示的方法可包括本公开中上面描述的实施方式。
参照图16,解码设备从比特流获得包括自适应环路滤波器(ALF)信息和预测相关信息的图像信息(S1600)。图像信息可包括根据本公开的上述实施方式的各种信息。例如,图像信息可包括预测相关信息或残差相关信息的至少一部分。
例如,预测相关信息可包括帧间预测模式信息或帧间预测类型信息。例如,帧间预测模式信息可包括指示各种帧间预测模式的至少一部分的信息。例如,可使用诸如合并模式、跳过模式、运动向量预测(MVP)模式、仿射模式、子块合并模式或合并与MVD(MMVD)模式的各种模式。另外,除了或代替辅助模式,可使用解码器侧运动向量细化(DMVR)模式、自适应运动向量分辨率(AMVR)模式、具有CU级别权重的双预测(BCW)或双向光流(BDOF)等。例如,帧间预测类型信息可包括inter_pred_idc句法元素。另选地,帧间预测类型信息可包括指示L0预测、L1预测和成对(双)预测中的任一个的信息。
另外,图像信息可包括根据本公开的实施方式的各种信息。例如,图像信息可包括ALF信息,并且ALF信息可包括上述表1至表42中的至少一个中描述的信息。例如,ALF信息可包括关于本公开中上面描述的ALF滤波器系数的信息、关于固定滤波器的信息、关于限幅的信息等。另选地,例如,ALF信息可包括用于当前块的色度分量的替代滤波器信息。替代滤波器信息可指示应用于当前块的色度分量的替代滤波器的索引。
解码设备基于预测相关信息来推导当前块的预测样本(S1610)。例如,预测相关信息可包括帧间预测模式信息或帧间预测类型信息。例如,帧间预测模式信息可包括指示各种帧间预测模式的至少一部分的信息。例如,可使用诸如合并模式、跳过模式、运动向量预测(MVP)模式、仿射模式、子块合并模式或合并与MVD(MMVD)模式的各种模式。另外,除了或代替辅助模式,可使用解码器侧运动向量细化(DMVR)模式、自适应运动向量分辨率(AMVR)模式、具有CU级别权重的双预测(BCW)或双向光流(BDOF)等。例如,帧间预测类型信息可包括inter_pred_idc句法元素。另选地,帧间预测类型信息可包括指示L0预测、L1预测和成对(双)预测中的任一个的信息。
解码设备基于预测样本生成当前块的重构样本(S1620)。解码设备可基于包括在图像/视频信息中的预测相关信息来推导当前块的预测样本。解码设备可基于包括在图像/视频信息中的残差信息来推导残差样本。解码设备可基于预测样本和残差样本来生成重构样本。重构块和重构画面可基于重构样本来推导。
解码设备基于ALF信息对重构样本执行ALF过程(S1630)。解码设备可从ALF信息推导ALF的滤波器系数,并且基于重构样本和滤波器系数来执行ALF过程。作为执行ALF过程的结果,解码设备可生成修改的重构样本。
例如,解码设备可通过对重构样本进行滤波来生成修改的重构样本,并且可使用基于滤波器系数的滤波器来执行重构样本的滤波过程。由解码设备重构的画面可包括重构样本。
在实施方式中,替代滤波器信息可包括关于用于当前块的色度分量的替代滤波器的数量的信息、包括在用于当前块的色度分量的替代滤波器中的系数的绝对值信息以及包括在用于当前块的色度分量的替代滤波器中的系数的符号信息。
在实施方式中,替代滤波器信息可包括用于当前块的色度分量的替代滤波器的索引信息,并且替代滤波器的索引信息可基于截断莱斯二值化。
在实施方式中,替代滤波器的索引信息的最大值(cMax)可等于比用于当前块的色度分量的替代滤波器的数量小1的值,并且可基于莱斯参数(cRiceParam)值0执行截断莱斯二值化。
在实施方式中,用于替代滤波器的索引信息的信元串中的信元可基于上下文模型来熵编码。相对于替代滤波器的索引信息的信元串中的信元的上下文模型可基于信元的上下文索引增量来确定。另外,上下文索引增量可基于当前块的色度分量的索引来确定。
在实施方式中,当当前块的色度分量为cb时推导的上下文索引增量可不同于当当前块的色度分量为cr时推导的上下文索引增量。
在实施方式中,图像信息可包括关于ALF限幅的信息,并且关于ALF限幅的信息可包括指示是否对当前块的色度分量应用限幅的标志以及指示限幅值的限幅索引信息。
在上述实施方式中,基于具有一系列步骤或方框的流程图来描述方法。本公开不限于上述步骤或方框的顺序。一些步骤或方框可同时发生或按照与如上所述的其它步骤或方框不同的顺序发生。此外,本领域技术人员将理解,上述流程图中所示的步骤不是排他性的,可包括另外的步骤,或者可删除流程图中的一个或更多个步骤,而不影响本公开的范围。
根据本文献的上述实施方式的方法可按软件形式实现,并且根据本文献的编码设备和/或解码设备例如可被包括在执行TV、计算机、智能电话、机顶盒、显示装置等的图像处理的设备中。
当本文献中的实施方式以软件实现时,上述方法可被实现为执行上述功能的模块(进程、函数等)。模块可被存储在存储器中并由处理器执行。存储器可位于处理器的内部或外部,并且可通过各种熟知手段联接到处理器。处理器可包括专用集成电路(ASIC)、其它芯片组、逻辑电路和/或数据处理装置。存储器可包括只读存储器(ROM)、随机存取存储器(RAM)、闪存、存储卡、存储介质和/或其它存储装置。即,本公开中描述的实施方式可在处理器、微处理器、控制器或芯片上实现和执行。例如,各个附图中所示的功能单元可在计算机、处理器、微处理器、控制器或芯片上实现和执行。在这种情况下,关于用于实现的指令或算法的信息可被存储在数字存储介质中。
另外,应用了本公开的解码设备和编码设备可被包括在多媒体广播发送/接收设备、移动通信终端、家庭影院视频设备、数字影院视频设备、监视相机、视频聊天设备、实时通信设备(例如,视频通信)、移动流设备、存储介质、摄像机、VoD服务提供设备、顶置(OTT)视频设备、互联网流服务提供设备、三维(3D)视频设备、电话会议视频设备、运输工具用户设备(即,车辆用户设备、飞机用户设备、船舶用户设备等)和医疗视频设备中,并且可用于处理视频信号和数据信号。例如,顶置(OTT)视频设备可包括游戏机、蓝光播放器、互联网访问TV、家庭影院系统、智能电话、平板PC、数字视频记录仪(DVR)等。
另外,应用了本文献的处理方法可按照要由计算机执行的程序的形式生成,并且可被存储在计算机可读记录介质中。具有根据本公开的数据结构的多媒体数据也可被存储在计算机可读记录介质中。计算机可读记录介质包括存储计算机系统可读的数据的所有类型的存储装置。例如,计算机可读记录介质可包括BD、通用串行总线(USB)、ROM、PROM、EPROM、EEPROM、RAM、CD-ROM、磁带、软盘和光学数据存储装置。另外,计算机可读记录介质包括以载波的形式实现的介质(即,通过互联网的传输)。另外,通过该编码方法生成的比特流可被存储在计算机可读记录介质中或者可经由有线/无线通信网络发送。
另外,本文献的实施方式可根据程序代码以计算机程序产品来实现,并且可通过本文献的实施方式在计算机中执行程序代码。程序代码可被存储在计算机可读的载体上。
图18示出本文献中公开的实施方式可应用于的内容流系统的示例。
参照图18,应用了本文献的实施方式的内容流系统可主要包括编码服务器、流服务器、网络服务器、媒体存储装置、用户装置和多媒体输入装置。
编码服务器将从多媒体输入装置(例如,智能电话、相机、摄像机等)输入的内容压缩为数字数据以生成比特流并将比特流发送到流服务器。作为另一示例,当多媒体输入装置(例如,智能电话、相机、摄像机等)直接生成比特流时,可省略编码服务器。
可通过应用了本公开的实施方式的编码方法或比特流生成方法来生成比特流,并且在发送或接收比特流的过程中,流服务器可暂时存储比特流。
流服务器通过网络服务器基于用户的请求将多媒体数据发送到用户装置,并且网络服务器用作告知用户服务的介质。当用户向网络服务器请求期望的服务时,网络服务器将其传送至流服务器,并且流服务器将多媒体数据发送到用户。在这种情况下,内容流系统可包括单独的控制服务器。在这种情况下,控制服务器用于控制内容流系统中的装置之间的命令/响应。
流服务器可从媒体存储装置和/或编码服务器接收内容。例如,当从编码服务器接收内容时,内容可实时地接收。在这种情况下,为了提供平滑的流服务,流服务器可将比特流存储达预定时间。
用户装置的示例可包括移动电话、智能电话、膝上型计算机、数字广播终端、个人数字助理(PDA)、便携式多媒体播放器(PMP)、导航、石板PC、平板PC、超级本、可穿戴装置(例如,智能手表、智能眼镜、头戴式显示器)、数字TV、台式计算机、数字标牌等。内容流系统中的各个服务器可作为分布式服务器来操作,在这种情况下从各个服务器接收的数据可被分布。
内容流系统中的各个服务器可作为分布式服务器来操作,并且在这种情况下,从各个服务器接收的数据可被分布和处理。
本文中所描述的权利要求可按各种方式组合。例如,本文献的方法权利要求的技术特征可被组合并实现为设备,并且本文献的设备权利要求的技术特征可被组合并实现为方法。另外,本文献的方法权利要求的技术特征和设备权利要求的技术特征可被组合以实现为设备,本文献的方法权利要求的技术特征和设备权利要求的技术特征可被组合并实现为方法。

Claims (15)

1.一种由解码设备执行的图像解码方法,该图像解码方法包括以下步骤:
从比特流获得包括自适应环路滤波器ALF信息和预测相关信息的图像信息;
基于所述预测相关信息来推导当前块的预测样本;
基于所述预测样本来生成重构样本;以及
基于所述ALF信息来对所述重构样本执行ALF过程,
其中,
所述ALF信息包括用于所述当前块的色度分量的替代滤波器信息;
应用于所述当前块的所述色度分量的替代滤波器的索引是基于所述替代滤波器信息来推导的;并且
基于所述替代滤波器的所述索引对所述当前块的所述色度分量执行所述ALF过程。
2.根据权利要求1所述的图像解码方法,其中,所述替代滤波器信息包括关于用于所述当前块的所述色度分量的替代滤波器的数量的信息、包括在用于所述当前块的所述色度分量的所述替代滤波器中的系数的绝对值信息以及包括在用于所述当前块的所述色度分量的所述替代滤波器中的系数的符号信息。
3.根据权利要求2所述的图像解码方法,其中,所述替代滤波器信息包括用于所述当前块的所述色度分量的替代滤波器的索引信息,并且所述替代滤波器的所述索引信息基于截断莱斯二值化。
4.根据权利要求3所述的图像解码方法,其中,所述替代滤波器的所述索引信息的最大值cMax等于比用于所述当前块的所述色度分量的所述替代滤波器的数量小1的值,并且基于莱斯参数cRiceParam值0来执行所述截断莱斯二值化。
5.根据权利要求3所述的图像解码方法,其中,
所述替代滤波器的所述索引信息的信元串中的信元是基于上下文模型来熵编码的;
相对于所述替代滤波器的所述索引信息的所述信元串中的所述信元的所述上下文模型是基于所述信元的上下文索引增量来确定的;并且
所述上下文索引增量是基于所述当前块的所述色度分量来确定的。
6.根据权利要求5所述的图像解码方法,其中,当所述当前块的所述色度分量为cb时推导的所述上下文索引增量不同于当所述当前块的所述色度分量为cr时推导的所述上下文索引增量。
7.根据权利要求1所述的图像解码方法,其中,所述图像信息包括关于ALF限幅的信息,并且关于ALF限幅的所述信息包括指示是否对所述当前块的所述色度分量应用限幅的标志以及指示限幅值的限幅索引信息。
8.一种由编码设备执行的视频编码方法,该视频编码方法包括以下步骤:
确定当前块的预测模式,并且基于所述预测模式来推导预测样本;
基于所述预测样本来生成重构样本;
对所述重构样本执行自适应环路滤波器ALF过程;以及
对包括ALF信息和预测相关信息的图像信息进行编码,
其中,
所述ALF信息包括用于所述当前块的色度分量的替代滤波器信息;并且
所述替代滤波器信息指示应用于所述当前块的所述色度分量的替代滤波器的索引。
9.根据权利要求8所述的视频编码方法,其中,所述替代滤波器信息包括关于用于所述当前块的所述色度分量的替代滤波器的数量的信息、包括在用于所述当前块的所述色度分量的所述替代滤波器中的系数的绝对值信息以及包括在用于所述当前块的所述色度分量的所述替代滤波器中的系数的符号信息。
10.根据权利要求9所述的视频编码方法,其中,所述替代滤波器信息包括用于所述当前块的所述色度分量的替代滤波器的索引信息,并且所述替代滤波器的所述索引信息基于截断莱斯二值化。
11.根据权利要求10所述的视频编码方法,其中,所述替代滤波器的所述索引信息的最大值cMax等于比用于所述当前块的所述色度分量的所述替代滤波器的数量小1的值,并且基于莱斯参数cRiceParam值0来执行所述截断莱斯二值化。
12.根据权利要求10所述的视频编码方法,其中,
所述替代滤波器的所述索引信息的信元串中的信元是基于上下文模型来熵编码的;
相对于所述替代滤波器的所述索引信息的所述信元串中的所述信元的所述上下文模型是基于所述信元的上下文索引增量来确定的;并且
所述上下文索引增量是基于所述当前块的所述色度分量来确定的。
13.根据权利要求12所述的视频编码方法,其中,当所述当前块的所述色度分量为cb时推导的所述上下文索引增量不同于当所述当前块的所述色度分量为cr时推导的所述上下文索引增量。
14.根据权利要求8所述的视频编码方法,其中,所述图像信息包括关于ALF限幅的信息,并且关于ALF限幅的所述信息包括指示是否对应用了所述当前块的替代滤波器的所述色度分量应用限幅的标志以及指示限幅值的限幅索引信息。
15.一种计算机可读存储介质,所述计算机可读存储介质存储使得解码设备执行图像解码方法的编码信息,其中,所述图像解码方法包括以下步骤:
从比特流获得包括自适应环路滤波器ALF信息和预测相关信息的图像信息;
基于所述预测相关信息来推导当前块的预测样本;
基于所述预测样本来生成重构样本;以及
基于所述ALF信息来对所述重构样本执行ALF过程,
其中,
所述ALF信息包括用于所述当前块的色度分量的替代滤波器信息;
应用于所述当前块的所述色度分量的替代滤波器的索引是基于所述替代滤波器信息来推导的;并且
基于所述替代滤波器的所述索引对所述当前块的所述色度分量执行所述ALF过程。
CN202080063207.7A 2019-07-08 2020-07-08 基于环路内滤波的视频或图像编码 Pending CN114424531A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962871226P 2019-07-08 2019-07-08
US62/871,226 2019-07-08
PCT/KR2020/008958 WO2021006633A1 (ko) 2019-07-08 2020-07-08 인루프 필터링 기반 비디오 또는 영상 코딩

Publications (1)

Publication Number Publication Date
CN114424531A true CN114424531A (zh) 2022-04-29

Family

ID=74115062

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080063207.7A Pending CN114424531A (zh) 2019-07-08 2020-07-08 基于环路内滤波的视频或图像编码

Country Status (4)

Country Link
US (2) US11677939B2 (zh)
KR (1) KR20220019243A (zh)
CN (1) CN114424531A (zh)
WO (1) WO2021006633A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023213265A1 (en) * 2022-05-05 2023-11-09 Beijing Bytedance Network Technology Co., Ltd. Extended taps using different sources for adaptive loop filter in video coding

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021006621A1 (ko) * 2019-07-08 2021-01-14 엘지전자 주식회사 적응적 루프 필터 기반 비디오 또는 영상 코딩
KR20220036977A (ko) * 2019-07-25 2022-03-23 에이치에프아이 이노베이션 인크. 비디오 코딩을 위한 가상 경계를 사용한 교차 성분 적응적 루프 필터링의 방법 및 장치
US11792412B2 (en) * 2020-04-15 2023-10-17 Qualcomm Incorporated Adaptive loop filtering for color format support

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160373769A1 (en) * 2015-06-18 2016-12-22 Qualcomm Incorporated Intra prediction and intra mode coding
CN108141620A (zh) * 2015-10-13 2018-06-08 Lg电子株式会社 图像编码系统中的图像解码方法和设备
KR20180116468A (ko) * 2011-06-24 2018-10-24 엘지전자 주식회사 영상 정보 부호화 및 복호화 방법

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20130034566A (ko) * 2011-09-28 2013-04-05 한국전자통신연구원 제한된 오프셋 보상 및 루프 필터를 기반으로 하는 영상 부호화 및 복호화 방법 및 그 장치
US9807403B2 (en) * 2011-10-21 2017-10-31 Qualcomm Incorporated Adaptive loop filtering for chroma components
WO2016190627A1 (ko) * 2015-05-27 2016-12-01 주식회사 케이티 비디오 신호 처리 방법 및 장치
CN110870319B (zh) * 2017-05-31 2022-12-06 交互数字麦迪逊专利控股公司 画面编码和解码的方法和设备
WO2020013497A1 (ko) * 2018-07-13 2020-01-16 엘지전자 주식회사 영상 코딩 시스템에서 인트라 예측 정보를 사용하는 영상 디코딩 방법 및 그 장치
JP7256874B2 (ja) * 2019-03-08 2023-04-12 キヤノン株式会社 アダプティブループフィルタ
CN113711591B (zh) * 2019-04-20 2023-10-27 北京字节跳动网络技术有限公司 用于色度残差的联合编解码的语法元素的信令
US11356662B2 (en) * 2019-05-21 2022-06-07 Qualcomm Incorporated Simplification of clipping value calculation for adaptive loop filters
CN113785574B (zh) * 2019-05-30 2022-10-11 北京字节跳动网络技术有限公司 色度分量的自适应环路滤波
US20220030232A1 (en) * 2020-07-24 2022-01-27 Qualcomm Incorporated Multiple adaptive loop filter sets

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180116468A (ko) * 2011-06-24 2018-10-24 엘지전자 주식회사 영상 정보 부호화 및 복호화 방법
US20160373769A1 (en) * 2015-06-18 2016-12-22 Qualcomm Incorporated Intra prediction and intra mode coding
CN108141620A (zh) * 2015-10-13 2018-06-08 Lg电子株式会社 图像编码系统中的图像解码方法和设备

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JONATHAN TAQUET等: "CE5-4: Alternative luma filter sets and alternative chroma filters for ALF", JOINT VIDEO EXPERTS TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11 15TH MEETING: GOTHENBURG, SE, 3–12 JULY 2019 JVET-O0090, 4 July 2019 (2019-07-04), pages 1 - 6 *
JONATHAN TAQUET等: "Non-CE5: Complementary results of tests CE5-3 on Non-Linear ALF", JOINT VIDEO EXPERTS TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11 14TH MEETING: GENEVA, CH, 19–27 MARCH 2019 JVET-N0243, 21 March 2019 (2019-03-21), pages 2 - 2 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023213265A1 (en) * 2022-05-05 2023-11-09 Beijing Bytedance Network Technology Co., Ltd. Extended taps using different sources for adaptive loop filter in video coding

Also Published As

Publication number Publication date
US20220132114A1 (en) 2022-04-28
US20230269371A1 (en) 2023-08-24
KR20220019243A (ko) 2022-02-16
WO2021006633A1 (ko) 2021-01-14
US11677939B2 (en) 2023-06-13

Similar Documents

Publication Publication Date Title
EP3843405A1 (en) Image coding method using history-based motion information, and device therefor
CN114402597B (zh) 应用自适应环路滤波器的视频或图像编码
US11503287B2 (en) Adaptive loop filter-based video or image coding
CN114600466A (zh) 基于交叉分量滤波的图像编码设备和方法
CN114391252A (zh) 基于自适应环路滤波器的视频或图像编码
US11849151B2 (en) Syntax design method and apparatus for performing coding by using syntax
CN114556957A (zh) 基于环路内滤波的视频编译设备和方法
CN114424531A (zh) 基于环路内滤波的视频或图像编码
CN114586349A (zh) 基于滤波编译视频的设备和方法
CN114586350A (zh) 基于交叉分量自适应环路滤波的图像编译装置和方法
CN114930816A (zh) 对图像进行编译的装置和方法
CN113767625A (zh) 基于mpm列表的帧内预测方法及其设备
CN115104318A (zh) 基于子画面的图像编码设备和方法
KR20220074952A (ko) 영상/비디오 코딩 방법 및 장치
CN114586351A (zh) 基于自适应环路滤波的图像编译设备和方法
KR20220163401A (ko) 인루프 필터링 기반 영상 코딩 장치 및 방법
CN115398910A (zh) 图像解码方法和用于图像解码方法的设备
CN113273210B (zh) 用于编译关于合并数据的信息的方法和装置
US20230079866A1 (en) Image decoding method associated with residual coding, and device therefor
CN115443659A (zh) 与残差编码相关的图像解码方法以及用于其的装置
CN117356091A (zh) 使用辅mpm列表的帧内预测方法和装置
CN115152237A (zh) 图像编码装置和方法
CN115428460A (zh) 图像编码系统中残差编码的图像解码方法及用于其的设备
CN115668946A (zh) 编码包括tsrc可用标志的图像信息的图像解码方法及其装置
CN115136608A (zh) 基于虚拟边界的图像编码装置和方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination