CN115136608A - 基于虚拟边界的图像编码装置和方法 - Google Patents

基于虚拟边界的图像编码装置和方法 Download PDF

Info

Publication number
CN115136608A
CN115136608A CN202080097300.XA CN202080097300A CN115136608A CN 115136608 A CN115136608 A CN 115136608A CN 202080097300 A CN202080097300 A CN 202080097300A CN 115136608 A CN115136608 A CN 115136608A
Authority
CN
China
Prior art keywords
information
picture
sub
sps
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080097300.XA
Other languages
English (en)
Inventor
亨得利·亨得利
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Publication of CN115136608A publication Critical patent/CN115136608A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • H04N19/82Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/13Edge detection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/86Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving reduction of coding artifacts, e.g. of blockiness
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

可执行用于改进重构图像(视频)的画面质量的环路内滤波过程。也可对分成子画面的画面执行环路内滤波过程。根据本文献的实施方式,可高效地用信号通知子画面相关信息和环路内滤波相关信息。

Description

基于虚拟边界的图像编码装置和方法
技术领域
本文献涉及基于虚拟边界的图像编码设备和方法。
背景技术
最近,在各种领域中对诸如4K或8K或更高的超高清(UHD)图像/视频的高分辨率、高质量图像/视频的需求已增加。随着图像/视频数据具有高分辨率和高质量,要发送的信息量或比特量相对于现有图像/视频数据增加,因此,使用诸如现有有线/无线宽带线路或现有存储介质的介质发送图像数据或者使用现有存储介质存储图像/视频数据增加了传输成本和存储成本。
另外,对诸如虚拟现实(VR)和人工现实(AR)内容或全息图的沉浸式媒体的兴趣和需求最近已增加,并且具有与现实图像不同的特性的图像/视频(例如,游戏图像)的广播已增加。
因此,需要非常高效的图像/视频压缩技术来有效地压缩、发送、存储和再现具有如上所述的各种特性的高分辨率、高质量图像/视频的信息。
具体地,对于图像/视频解码,可执行环路内滤波过程。可针对划分成子画面的重构画面执行环路内滤波过程。正在讨论用于子画面相关信息和环路内滤波相关信息的高效信令的方案。
发明内容
技术方案
根据本文献的实施方式,提供了一种用于增加图像/视频编码效率的方法和设备。
根据本文献的实施方式,提供了高效滤波应用方法和设备。
根据本文献的实施方式,提供了一种用于有效地应用去块、样本自适应环路(SAO)和自适应环路滤波(ALF)的方法和设备。
根据本文献的实施方式,可基于虚拟边界来执行环路内滤波。
根据本文献的实施方式,解码的画面可由子画面组成。
根据本文献的实施方式,关于虚拟边界的位置的信息的信令位置可基于关于子画面的信息的信令来确定。
根据本文献的实施方式,可基于子画面相关信息的信令来执行虚拟边界相关信息的信令。
根据本文献的实施方式,提供了一种用于执行视频/图像编码的编码设备。
根据本文献的实施方式,提供了一种计算机可读数字存储介质,其中存储有根据本文献的至少一个实施方式中公开的视频/图像编码方法生成的编码的视频/图像信息。
根据本文献的实施方式,提供了一种计算机可读数字存储介质,其中存储有使得解码设备执行本文献的至少一个实施方式中公开的视频/图像解码方法的编码的信息或编码的视频/图像信息。
有益效果
根据本文献的实施方式,总图像/视频压缩效率可改进。
根据本文献的实施方式,可通过高效滤波增加主观/客观视觉质量。
根据本文献的实施方式,可通过省略基于子画面的信令通过虚拟边界信令重写比特流的过程来实现高效编码。
附图说明
图1示意性地示出可应用本文献的实施方式的视频/图像编码系统的示例。
图2是示意性地示出可应用本文献的实施方式的视频/图像编码设备的配置的示图。
图3是示意性地示出可应用本文献的实施方式的视频/图像解码设备的配置的示图。
图4示例性地示出编码视频/图像的分层架构。
图5示出根据本文献的实施方式的画面。
图6示出根据本文献的实施方式的基于子画面/切片/拼块的编码方法。
图7示出根据本文献的实施方式的基于子画面/切片/拼块的解码方法。
图8是说明编码设备中的基于滤波的编码方法的流程图。
图9是说明解码设备中的基于滤波的解码方法的流程图。
图10和图11示意性地示出根据本文献的实施方式的视频/图像编码方法和相关组件的示例。
图12和图13示意性地示出根据本文献的实施方式的图像/视频解码方法和相关组件的示例。
图14示出可应用本文献中所公开的实施方式的内容流系统的示例。
具体实施方式
本文献提出了视频/图像编码的各种实施方式,并且除非另外指明,否则上述实施方式也可彼此组合执行。
在本文献中,视频可指随时间的一系列图像。画面通常是指表示特定时间帧的一个图像的单元,切片/拼块是指在编码方面构成画面的一部分的单元。切片/拼块可包括一个或更多个编码树单元(CTU)。一个画面可由一个或更多个切片/拼块组成。一个画面可由一个或更多个拼块组组成。一个拼块组可包括一个或更多个拼块。
本文献中描述的附图的各个配置是为了方便作为不同的特征说明功能的独立例示,并不意味着各个配置由相互不同的硬件或不同的软件实现。例如,两个或更多个配置可被组合以形成一个配置,并且一个配置也可被分成多个配置。在不脱离本文献的主旨的情况下,配置被组合和/或分离的实施方式被包括在权利要求的范围内。
此外,本文献可按各种形式修改,将描述并且在附图中示出其特定实施方式。然而,这些实施方式并非旨在限制本文献。以下描述中使用的术语仅用于描述特定实施方式,而非旨在限制本文献。单数表达包括复数表达,只要清楚地不同阅读即可。诸如“包括”和“具有”的术语旨在指示存在以下描述中使用的特征、数量、步骤、操作、元件、组件或其组合,应该理解,不排除存在或添加一个或更多个不同的特征、数量、步骤、操作、元件、组件或其组合的可能性。
以下,将参照附图详细描述本实施方式的示例。另外,相似的标号用于贯穿附图指示相似的元件,并且将省略关于相似元件的相同描述。
本文献涉及视频/图像编码。例如,本文献中公开的方法/实施方式可涉及通用视频编码(VVC)标准(ITU-T Rec.H.266)、VVC之后的下一代视频/图像编码标准或其它视频编码相关标准(例如,高效视频编码(HEVC)标准(ITU-T Rec.H.265)、基本视频编码(EVC)标准、AVS2标准等)。
像素或画素可意指构成一个画面(或图像)的最小单元。另外,“样本”可用作与像素对应的术语。样本通常可表示像素或像素值,并且可仅表示亮度分量的像素/像素值或仅表示色度分量的像素/像素值。
单元可表示图像处理的基本单位。单元可包括画面的特定区域和与该区域有关的信息中的至少一个。一个单元可包括一个亮度块和两个色度(例如,cb、cr)块。在一些情况下,单元可与诸如块或区域的术语互换使用。在一般情况下,M×N块可包括M列和N行的样本(或样本阵列)或变换系数的集合(或阵列)。另选地,样本可意指空间域中的像素值,并且当这种像素值被变换至频域时,其可意指频域中的变换系数。
在本文献中,术语“/”和“,”应该被解释为指示“和/或”。例如,表达“A/B”可意指“A和/或B”。此外,“A,B”可意指“A和/或B”。此外,“A/B/C”可意指“A、B和/或C中的至少一个”。另外,“A/B/C”可意指“A、B和/或C中的至少一个”。
此外,在本文献中,术语“或”应该被解释为指示“和/或”。例如,表达“A或B”可包括1)仅A、2)仅B和/或3)A和B二者。换言之,本文献中的术语“或”应该被解释为指示“另外地或另选地”。
在本说明书中,“A和B中的至少一个”可意指“仅A”、“仅B”或“A和B二者”。此外,在本说明书中,表达“A或B中的至少一个”或“A和/或B中的至少一个”可与“A和B中的至少一个”相同地解释。
此外,在本说明书中,“A、B和C中的至少一个”可意指“仅A”、“仅B”、“仅C”或“A、B和C的任何组合”。此外,“A、B或C中的至少一个”或“A、B和/或C中的至少一个”可意指“A、B和C中的至少一个”。
此外,本说明书中使用的括号可意指“例如”。具体地,在表达“预测(帧内预测)”的情况下,可指示提议“帧内预测”作为“预测”的示例。换言之,本说明书中的术语“预测”不限于“帧内预测”,可指示提议“帧内预测”作为“预测”的示例。此外,即使在表达“预测(即,帧内预测)”的情况下,也可指示提议“帧内预测”作为“预测”的示例。
在本说明书中,在一张图中单独说明的技术特性可单独地实现,或者可同时实现。
图1示意性地示出可应用本文献的实施方式的视频/图像编码系统的示例。
参照图1,视频/图像编码系统可包括源装置和接收装置。源装置可通过数字存储介质或网络将编码的视频/图像信息或数据以文件或流的形式发送到接收装置。
源装置可包括视频源、编码设备和发送器。接收装置可包括接收器、解码设备和渲染器。编码设备可被称为视频/图像编码设备,解码设备可被称为视频/图像解码设备。发送器可被包括在编码设备中。接收器可被包括在解码设备中。渲染器可包括显示器,并且显示器可被配置为单独的装置或外部组件。
视频源可通过捕获、合成或生成视频/图像的处理来获取视频/图像。视频源可包括视频/图像捕获装置和/或视频/图像生成装置。例如,视频/图像捕获装置可包括一个或更多个相机、包括先前捕获的视频/图像的视频/图像档案等。例如,视频/图像生成装置可包括计算机、平板计算机和智能电话,并且可(以电子方式)生成视频/图像。例如,可通过计算机等生成虚拟视频/图像。在这种情况下,视频/图像捕获处理可由生成相关数据的处理代替。
编码设备可对输入视频/图像进行编码。为了压缩和编码效率,编码设备可执行诸如预测、变换和量化的一系列过程。编码的数据(编码的视频/图像信息)可按比特流的形式输出。
发送器可通过数字存储介质或网络将以比特流的形式输出的编码的图像/图像信息或数据以文件或流的形式发送到接收装置的接收器。数字存储介质可包括诸如USB、SD、CD、DVD、蓝光、HDD、SSD等的各种存储介质。发送器可包括用于通过预定文件格式生成媒体文件的元件,并且可包括用于通过广播/通信网络传输的元件。接收器可接收/提取比特流并将所接收的比特流发送到解码设备。
解码设备可通过执行与编码设备的操作对应的诸如解量化、逆变换和预测的一系列过程将视频/图像解码。
渲染器可渲染解码的视频/图像。渲染的视频/图像可通过显示器显示。
图2是示意性地示出可应用本文献的公开的视频/图像编码设备的配置的图。以下,所谓的视频编码设备可包括图像编码设备。
参照图2,编码设备200可包括并配置有图像分割器210、预测器220、残差处理器230、熵编码器240、加法器250、滤波器260和存储器270。预测器220可包括帧间预测器221和帧内预测器222。残差处理器230可包括变换器232、量化器233、解量化器234和逆变换器235。残差处理器230还可包括减法器231。加法器250可被称为重构器或重构块生成器。根据实施方式,上述图像分割器210、预测器220、残差处理器230、熵编码器240、加法器250和滤波器260可由一个或更多个硬件组件(例如,编码器芯片组或处理器)配置。另外,存储器270可包括解码画面缓冲器(DPB),并且还可由数字存储介质配置。硬件组件还可包括存储器270作为内部/外部组件。
图像分割器210可将输入到编码设备200的输入图像(或者画面、帧)划分成一个或更多个处理单元。作为示例,处理单元可被称为编码单元(CU)。在这种情况下,编码单元可根据四叉树二叉树三叉树(QTBTTT)结构从编码树单元(CTU)或最大编码单元(LCU)递归地划分。例如,一个编码单元可基于四叉树结构、二叉树结构和/或三叉树结构被划分成深度更深的多个编码单元。在这种情况下,例如,首先应用四叉树结构,稍后可应用二叉树结构和/或三叉树结构。另选地,也可首先应用二叉树结构。可基于不再划分的最终编码单元来执行根据本公开的编码过程。在这种情况下,根据图像特性等基于编码效率,最大编码单元可直接用作最终编码单元,或者如果需要,编码单元可被递归地划分成深度更深的编码单元,使得具有最优大小的编码单元可用作最终编码单元。这里,编码过程可包括诸如预测、变换和重构的过程(稍后描述)。作为另一示例,处理单元还可包括预测器(PU)或变换单元(TU)。在这种情况下,预测器和变换单元中的每一个可从上述最终编码单元拆分或分割。预测器可以是样本预测的单元,变换单元可以是用于推导变换系数的单元和/或用于从变换系数推导残差信号的单元。
在一些情况下,单元可与诸如块或区域的术语互换使用。通常,M×N块可表示由M列和N行组成的样本或一组变换系数。样本通常可表示像素或像素值,还可仅表示亮度分量的像素/像素值,并且还仅表示色度分量的像素/像素值。样本可用作与配置一个画面(或图像)的像素或画素对应的术语。
减法器231可通过从输入图像信号(原始块、原始样本或原始样本阵列)减去从预测器220输出的预测信号(预测块、预测样本或预测样本阵列)来生成残差信号(残差块、残差样本或残差样本阵列),并且所生成的残差信号被发送到变换器232。预测器220可对处理目标块(以下,称为“当前块”)执行预测并且生成包括当前块的预测样本的预测块。预测器220可确定对当前块或以CU为单位应用帧内预测还是帧间预测。如在各个预测模式的描述中稍后描述的,预测器可生成与预测有关的各种类型的信息(例如,预测模式信息)并将所生成的信息传送到熵编码器240。关于预测的信息可在熵编码器240中编码并以比特流的形式输出。
帧内预测器222可参考当前画面内的样本来预测当前块。根据预测模式,所参考的样本可位于当前块附近,或者也可远离当前块。帧内预测中的预测模式可包括多个非定向模式和多个定向模式。例如,非定向模式可包括DC模式或平面模式。例如,根据预测方向的精细程度,定向模式可包括33个定向预测模式或65个定向预测模式。然而,这是例示性的,可根据设置使用比上述数量更多或更少的定向预测模式。帧内预测器222还可使用应用于邻近块的预测模式来确定应用于当前块的预测模式。
帧间预测器221可基于参考画面上运动向量所指定的参考块(参考样本阵列)来推导当前块的预测块。此时,为了减少在帧间预测模式下发送的运动信息量,可基于邻近块与当前块之间的运动信息的相关性以块、子块或样本为单位预测运动信息。运动信息可包括运动向量和参考画面索引。运动信息还可包括帧间预测方向(L0预测、L1预测、Bi预测等)信息。在帧间预测的情况下,邻近块可包括存在于当前画面内的空间邻近块和存在于参考画面中的时间邻近块。包括参考块的参考画面和包括时间邻近块的参考画面也可彼此相同,并且也可彼此不同。时间邻近块可被称为诸如并置参考块、并置CU(colCU)等的名称,并且包括时间邻近块的参考画面也可被称为并置画面(colPic)。例如,帧间预测器221可基于邻近块来配置运动信息候选列表并且生成指示哪一候选用于推导当前块的运动向量和/或参考画面索引的信息。可基于各种预测模式执行帧间预测,例如,在跳过模式和合并模式的情况下,帧间预测器221可使用邻近块的运动信息作为当前块的运动信息。在跳过模式下,与合并模式不同,可不发送残差信号。运动向量预测(MVP)模式可通过使用邻近块的运动向量作为运动向量预测子,并且用信号通知运动向量差来指示当前块的运动向量。
预测器220可基于下面描述的各种预测方法来生成预测信号。例如,预测器可不仅应用帧内预测或帧间预测以预测一个块,而且同时应用帧内预测和帧间预测二者。这可被称为组合帧间和帧内预测(CIIP)。另外,预测器可执行帧内块复制(IBC)以用于预测块。帧内块复制可用于游戏等的内容图像/运动图像编码,例如屏幕内容编码(SCC)。IBC基本上在当前画面中执行预测,但是可与帧间预测相似地执行,使得在当前画面中推导参考块。即,IBC可使用本文献中描述的至少一个帧间预测技术。
通过帧间预测器221和/或帧内预测器222生成的预测信号可用于生成重构信号或生成残差信号。变换器232可通过对残差信号应用变换技术来生成变换系数。例如,变换技术可包括离散余弦变换(DCT)、离散正弦变换(DST)、基于图形的变换(GBT)或条件非线性变换(CNT)中的至少一个。这里,当像素之间的关系信息由图形表示时,GBT意指从图形获得的变换。CNT是指基于使用所有先前重构的像素生成的预测信号获得的变换。另外,变换处理可应用于具有相同大小的正方形像素块或者可应用于正方形以外的具有可变大小的块。
量化器233可将变换系数量化并将它们发送到熵编码器240,并且熵编码器240可对量化的信号(关于量化的变换系数的信息)进行编码并输出比特流。关于量化的变换系数的信息可被称为残差信息。量化器233可基于系数扫描顺序将块类型量化的变换系数重排为一维向量形式,并且基于一维向量形式的量化的变换系数来生成关于量化的变换系数的信息。熵编码器240可执行例如指数Golomb、上下文自适应可变长度编码(CAVLC)、上下文自适应二进制算术编码(CABAC)等的各种编码方法。熵编码器240可与量化的变换系数(例如,句法元素的值等)一起或分开对视频/图像重构所需的信息进行编码。编码的信息(例如,编码的视频/图像信息)可按比特流的形式以网络抽象层(NAL)为单位发送或存储。视频/图像信息还可包括关于各种参数集的信息,例如自适应参数集(APS)、画面参数集(PPS)、序列参数集(SPS)或视频参数集(VPS)。另外,视频/图像信息还可包括一般约束信息。在本文献中,稍后描述的用信号通知/发送的信息和/或句法元素可通过上述编码过程编码并被包括在比特流中。比特流可通过网络发送或者可被存储在数字存储介质中。这里,网络可包括广播网络和/或通信网络,并且数字存储介质可包括诸如USB、SD、CD、DVD、蓝光、HDD、SSD等的各种存储介质。发送从熵编码器240输出的信号的发送器(未示出)和/或存储该信号的存储单元(未示出)可被配置为编码设备200的内部/外部元件,并且另选地,发送器可被包括在熵编码器240中。
从量化器233输出的量化的变换系数可用于生成预测信号。例如,可通过经由解量化器234和逆变换器235对量化的变换系数应用解量化和逆变换来重构残差信号(残差块或残差样本)。加法器250将重构的残差信号与从预测器220输出的预测信号相加以生成重构信号(重构画面、重构块、重构样本或重构样本阵列)。如果处理目标块不存在残差(例如,应用跳过模式的情况),则预测块可用作重构块。如下所述,所生成的重构信号可用于当前画面中的下一处理目标块的帧内预测并且可通过滤波用于下一画面的帧间预测。
此外,可在画面编码和/或重构处理期间应用与色度缩放的亮度映射(LMCS)。
滤波器260可通过对重构信号应用滤波来改进主观/客观图像质量。例如,滤波器260可通过对重构画面应用各种滤波方法来生成修改的重构画面并将修改的重构画面存储在存储器270(具体地,存储器270的DPB)中。例如,各种滤波方法可包括去块滤波、样本自适应偏移(SAO)、自适应环路滤波器、双边滤波器等。滤波器260可生成与滤波有关的各种类型的信息并且将所生成的信息传送到熵编码器290,如在各个滤波方法的描述中稍后描述的。与滤波有关的信息可由熵编码器290编码并以比特流的形式输出。
发送到存储器270的修改的重构画面可用作帧间预测器221中的参考画面。当通过编码设备应用帧间预测时,可避免编码设备200与解码设备300之间的预测失配并且编码效率可改进。
存储器270的DPB可存储用作帧间预测器221中的参考画面的修改的重构画面。存储器270可存储推导(或编码)当前画面中的运动信息的块的运动信息和/或画面中已经重构的块的运动信息。所存储的运动信息可被传送到帧间预测器221以用作空间邻近块的运动信息或时间邻近块的运动信息。存储器270可存储当前画面中的重构块的重构样本并且可将重构样本传送至帧内预测器222。
图3是用于示意性地说明可应用本文献的公开的视频/图像解码设备的配置的图。
参照图3,解码设备300可包括并配置有熵解码器310、残差处理器320、预测器330、加法器340、滤波器350和存储器360。预测器330可包括帧间预测器331和帧内预测器332。残差处理器320可包括解量化器321和逆变换器322。根据实施方式,上面已描述的熵解码器310、残差处理器320、预测器330、加法器340和滤波器350可由一个或更多个硬件组件(例如,解码器芯片组或处理器)配置。另外,存储器360可包括解码画面缓冲器(DPB)并且可由数字存储介质配置。硬件组件还可包括存储器360作为内部/外部组件。
当输入包括视频/图像信息的比特流时,解码设备300可响应于在图2所示的编码设备中处理视频/图像信息的处理而重构图像。例如,解码设备300可基于从比特流获取的块划分相关信息来推导单元/块。解码设备300可使用应用于编码设备的处理单元来执行解码。因此,例如,用于解码的处理单元可以是编码单元,并且编码单元可根据四叉树结构、二叉树结构和/或三叉树结构从编码树单元或最大编码单元划分。可从编码单元推导一个或更多个变换单元。另外,通过解码设备300解码和输出的重构的图像信号可通过再现设备再现。
解码设备300可接收从图2的编码设备以比特流的形式输出的信号,并且所接收的信号可通过熵解码器310解码。例如,熵解码器310可解析比特流以推导图像重构(或画面重构)所需的信息(例如,视频/图像信息)。视频/图像信息还可包括关于各种参数集的信息,例如自适应参数集(APS)、画面参数集(PPS)、序列参数集(SPS)或视频参数集(VPS)。另外,视频/图像信息还可包括一般约束信息。解码设备还可基于关于参数集的信息和/或一般约束信息将画面解码。本文献中稍后描述的用信号通知/接收的信息和/或句法元素可通过解码过程解码并从比特流获得。例如,熵解码器310基于诸如指数Golomb编码、CAVLC或CABAC的编码方法对比特流中的信息进行解码,并且输出图像重构所需的句法元素和残差的变换系数的量化值。更具体地,CABAC熵解码方法可接收与比特流中的各个句法元素对应的信元(bin),使用解码目标句法元素信息、解码目标块的解码信息或在先前阶段中解码的符号/信元的信息来确定上下文模型,并且通过根据所确定的上下文模型预测信元出现的概率对信元执行算术解码,并且生成与各个句法元素的值对应的符号。在这种情况下,CABAC熵解码方法可在确定上下文模型之后通过将解码的符号/信元的信息用于下一符号/信元的上下文模型来更新上下文模型。熵解码器310所解码的信息当中与预测有关的信息可被提供给预测器330,并且关于在熵解码器310中执行了熵解码的残差的信息(即,量化的变换系数和相关参数信息)可被输入到解量化器321。另外,熵解码器310所解码的信息当中关于滤波的信息可被提供给滤波器350。此外,用于接收从编码设备输出的信号的接收器(未示出)还可被配置成解码设备300的内部/外部元件,或者接收器可以是熵解码器310的组成元件。此外,根据本文献的解码设备可被称为视频/图像/画面解码设备,并且解码设备可被分类为信息解码器(视频/图像/画面信息解码器)和样本解码器(视频/图像/画面样本解码器)。信息解码器可包括熵解码器310,并且样本解码器可包括解量化器321、逆变换器322、预测器330、加法器340、滤波器350和存储器360中的至少一个。
解量化器321可将量化的变换系数解量化以输出变换系数。解量化器321可按二维块形式重排量化的变换系数。在这种情况下,可基于编码设备所执行的系数扫描顺序来执行重排。解量化器321可使用量化参数(例如,量化步长信息)对量化的变换系数执行解量化并且获取变换系数。
逆变换器322对变换系数逆变换以获取残差信号(残差块、残差样本阵列)。
预测器330可执行当前块的预测并生成包括当前块的预测样本的预测块。预测器可基于从熵解码器310输出的关于预测的信息来确定对当前块应用帧内预测还是应用帧间预测并且确定特定帧内/帧间预测模式。
预测器可基于下述各种预测方法来生成预测信号。例如,预测器不仅可应用帧内预测或帧间预测以预测一个块,而且可同时应用帧内预测和帧间预测。这可被称为组合帧间和帧内预测(CIIP)。另外,预测器可执行帧内块复制(IBC)以用于预测块。帧内块复制可用于游戏等的内容图像/运动图像编码,例如屏幕内容编码(SCC)。IBC基本上执行当前画面中的预测,但是可与帧间预测相似地执行,使得在当前画面中推导参考块。即,IBC可使用本文献中描述的至少一种帧间预测技术。
帧内预测器332可参考当前画面中的样本来预测当前块。根据预测模式,所参考的样本可位于当前块附近或者可远离当前块。在帧内预测中,预测模式可包括多个非定向模式和多个定向模式。帧内预测器332可使用应用于邻近块的预测模式来确定要应用于当前块的预测模式。
帧间预测器331可基于参考画面上运动向量所指定的参考块(参考样本阵列)来推导当前块的预测块。在这种情况下,为了减少在帧间预测模式下发送的运动信息量,可基于邻近块与当前块之间的运动信息的相关性以块、子块或样本为单位预测运动信息。运动信息可包括运动向量和参考画面索引。运动信息还可包括关于帧间预测方向(L0预测、L1预测、Bi预测等)的信息。在帧间预测的情况下,邻近块可包括存在于当前画面中的空间邻近块和存在于参考画面中的时间邻近块。例如,帧间预测器331可基于邻近块来构造运动信息候选列表并且基于所接收的候选选择信息来推导当前块的运动向量和/或参考画面索引。可基于各种预测模式来执行帧间预测,并且关于预测的信息可包括指示当前块的帧间预测模式的信息。
加法器340可通过将所获得的残差信号与从预测器330输出的预测信号(预测块或预测样本阵列)相加来生成重构信号(重构画面、重构块和重构样本阵列)。如果处理目标块不存在残差,例如应用跳过模式的情况,预测块可用作重构块。
加法器340可被称为重构器或重构块生成器。所生成的重构信号可用于当前画面中要处理的下一块的帧内预测,并且如稍后描述的,也可通过滤波输出,或者也可用于下一画面的帧间预测。
此外,也可在画面解码处理中应用与色度缩放的亮度映射(LMCS)。
滤波器350可通过对重构信号应用滤波来改进主观/客观图像质量。例如,滤波器350可通过对重构画面应用各种滤波方法来生成修改的重构画面并且将修改的重构画面存储在存储器360(具体地,存储器360的DPB)中。例如,各种滤波方法可包括去块滤波、样本自适应偏移、自适应环路滤波器、双边滤波器等。
存储在存储器360的DPB中的(修改的)重构画面可用作帧间预测器331中的参考画面。存储器360可存储推导(或解码)当前画面中的运动信息的块的运动信息和/或画面中已经重构的块的运动信息。所存储的运动信息可被传送到帧间预测器331以用作空间邻近块的运动信息或时间邻近块的运动信息。存储器360可存储当前画面中的重构块的重构样本并将重构样本传送至帧内预测器332。
在本说明书中,解码设备300的预测器330、解量化器321、逆变换器322和滤波器350中描述的实施方式也可按照与编码设备200的预测器220、解量化器234、逆变换器235和滤波器260相同或对应的方式应用。
此外,如上所述,在执行视频编码时,执行预测以改进压缩效率。由此,可生成包括作为要编码的块(即,编码目标块)的当前块的预测样本的预测块。这里,预测块包括空间域(或像素域)中的预测样本。预测块按照与编码设备和解码设备中相同的方式推导,并且编码设备可用信号通知解码设备关于原始块与预测块之间的残差的信息(残差信息)而非原始块的原始样本值,从而增加图像编码效率。解码设备可基于残差信息来推导包括残差样本的残差块,将残差块和预测块相加以生成包括重构样本的重构块,并且生成包括重构块的重构画面。
残差信息可通过变换和量化过程来生成。例如,编码设备可推导原始块与预测块之间的残差块,对包括在残差块中的残差样本(残差样本阵列)执行变换过程以推导变换系数,对变换系数执行量化过程以推导量化的变换系数,并且将相关残差信息(通过比特流)用信号通知给解码设备。这里,残差信息可包括量化的变换系数的值信息、位置信息、变换技术、变换核、量化参数等。解码设备可基于残差信息来执行解量化/逆变换过程并推导残差样本(或残差块)。解码设备可基于预测块和残差块来生成重构画面。另外,作为稍后画面的帧间预测的参考,编码设备还可对量化的变换系数进行解量化/逆变换以推导残差块,并且基于其来生成重构画面。
在本文献中,量化/解量化和/或变换/逆变换中的至少一个可被省略。当量化/解量化被省略时,量化的变换系数可被称为变换系数。当变换/逆变换被省略时,变换系数可被称为系数或残差系数,或者为了表达的一致性,仍可称为变换系数。
在本文献中,量化的变换系数和变换系数可分别被称为变换系数和缩放的变换系数。在这种情况下,残差信息可包括关于变换系数的信息,并且关于变换系数的信息可通过残差编码句法用信号通知。变换系数可基于残差信息(或关于变换系数的信息)来推导,缩放的变换系数可通过对变换系数的逆变换(缩放)来推导。残差样本可基于缩放的变换系数的逆变换(变换)来推导。这也可在本文献的其它部分中应用/表达。
编码设备/解码设备的预测器可通过以块为单位执行帧间预测来推导预测样本。帧间预测可以是以取决于当前画面以外的画面的数据元素(例如,样本值或运动信息等)的方式推导的预测。当对当前块应用帧间预测时,基于指向参考画面索引的参考画面上运动向量所指定的参考块(参考样本阵列),可推导当前块的预测块(预测样本阵列)。在这种情况下,为了减少在帧间预测模式下发送的运动信息量,可基于邻近块与当前块之间的运动信息之间的相关性以块、子块或样本为单位预测当前块的运动信息。运动信息可包括运动向量和参考画面索引。运动信息还可包括帧间预测类型(L0预测、L1预测、Bi预测等)信息。当应用帧间预测时,邻近块可包括存在于当前画面中的空间邻近块和存在于参考画面中的时间邻近块。包括参考块的参考画面和包括时间邻近块的参考画面可相同或不同。时间邻近块可被称为并置参考块、并置CU(colCU)等,并且包括时间邻近块的参考画面可被称为并置画面(colPic)。例如,可基于当前块的邻近块来构造运动信息候选列表,并且可用信号通知指示选择(使用)哪一候选以推导当前块的运动向量和/或参考画面索引的标志或索引信息。可基于各种预测模式来执行帧间预测。例如,在跳过模式和合并模式下,当前块的运动信息可与所选邻近块的运动信息相同。在跳过模式下,与合并模式不同,可不发送残差信号。在运动向量预测(MVP)模式的情况下,所选邻近块的运动向量可用作运动向量预测器,并且可用信号通知运动向量差。在这种情况下,可使用运动向量预测器与运动向量差之和来推导当前块的运动向量。
根据帧间预测类型(L0预测、L1预测、Bi预测等),运动信息可包括L0运动信息和/或L1运动信息。L0方向上的运动向量可被称为L0运动向量或MVL0,L1方向上的运动向量可被称为L1运动向量或MVL1。基于L0运动向量的预测可被称为L0预测,基于L1运动向量的预测可被称为L1预测,基于L0运动向量和L1运动向量二者的预测可被称为双预测。这里,L0运动向量可指示与参考画面列表L0(L0)关联的运动向量,L1运动向量可指示与参考画面列表L1(L1)关联的运动向量。参考画面列表L0可包括按输出顺序比当前画面靠前的画面作为参考画面,参考画面列表L1可包括按输出顺序比当前画面靠后的画面。先前画面可被称为前向(参考)画面,后续画面可被称为后向(参考)画面。参考画面列表L0还可包括按输出顺序比当前画面靠后的画面作为参考画面。在这种情况下,在参考画面列表L0中,先前画面可首先进行索引,后续画面可接下来进行索引。参考画面列表L1还可包括按输出顺序比当前画面靠前的画面作为参考画面。在这种情况下,后续画面可在参考画面列表1中首先进行索引,先前画面可接下来进行索引。这里,输出顺序可对应于画面顺序计数(POC)顺序。
图4示例性地示出编码的图像/视频的分层结构。
参照图4,编码的图像/视频被划分成处理图像/视频解码处理及自身的VCL(视频编码层)、发送和存储编码的信息的子系统以及存在于VCL和子系统之间并负责网络适配功能的网络抽象层(NAL)。
VCL可生成包括压缩图像数据(切片数据)的VCL数据,或者生成包括画面参数集(Picture Parameter Set:PSP)、序列参数集(Sequence Parameter Set:SPS)、视频参数集(Video Parameter Set:VPS)等的参数集或者图像的解码处理另外需要的补充增强信息(SEI)消息。
在NAL中,可通过将头信息(NAL单元头)添加到VCL中生成的原始字节序列有效载荷(RBSP)来生成NAL单元。在这种情况下,RBSP是指VCL中生成的切片数据、参数集、SEI消息等。NAL单元头可包括根据包括在对应NAL单元中的RBSP数据指定的NAL单元类型信息。
如图中所示,NAL单元可根据VCL中生成的RBSP被分为VCL NAL单元和非VCL NAL单元。VCL NAL单元可意指包括关于图像的信息(切片数据)的NAL单元,非VCL NAL单元可意指包含对图像进行解码所需的信息(参数集或SEI消息)的NAL单元。
可通过根据子系统的数据标准附加头信息来通过网络发送上述VCL NAL单元和非VCL NAL单元。例如,NAL单元可被变换为诸如H.266/VVC文件格式、实时传输协议(RTP)、传输流(TS)等的预定标准的数据形式并通过各种网络发送。
如上所述,在NAL单元中可根据包括在对应NAL单元中的RBSP数据结构指定NAL单元类型,并且关于该NAL单元类型的信息可被存储在NAL单元头中并用信号通知。
例如,NAL单元可根据NAL单元是否包括关于图像的信息(切片数据)而被大致分类为VCL NAL单元类型和非VCL NAL单元类型。VCL NAL单元类型可根据包括在VCL NAL单元中的画面的性质和类型来分类,并且非VCL NAL单元类型可根据参数集的类型来分类。
以下是根据包括在非VCL NAL单元类型中的参数集的类型指定的NAL单元类型的示例。
-APS(自适应参数集)NAL单元:包括APS的NAL单元的类型
-DPS(解码参数集)NAL单元:包括DPS的NAL单元的类型
-VPS(视频参数集)NAL单元:包括VPS的NAL单元的类型
-SPS(序列参数集)NAL单元:包括SPS的NAL单元的类型
-PPS(画面参数集)NAL单元:包括PPS的NAL单元的类型
-PH(画面头)NAL单元:包括PH的NAL单元的类型
上述NAL单元类型具有NAL单元类型的句法信息,并且该句法信息可被存储在NAL单元头中并用信号通知。例如,句法信息可以是nal_unit_type,NAL单元类型可由nal_unit_type值指定。
此外,如上所述,一个画面可包括多个切片,一个切片可包括切片头和切片数据。在这种情况下,一个画面头可被进一步添加到一个画面中的多个切片(切片头和切片数据集)。画面头(画面头句法)可包括通常适用于画面的信息/参数。在本文献中,切片可与拼块组混合或由拼块组替换。另外,在本文献中,切片头可与拼块组头混合或由类型组头替换。
切片头(切片头句法或切片头信息)可包括通常适用于切片的信息/参数。APS(APS句法)或PPS(PPS句法)可包括通常适用于一个或更多个切片或画面的信息/参数。SPS(SPS句法)可包括通常适用于一个或更多个序列的信息/参数。VPS(VPS句法)可包括通常适用于多个层的信息/参数。DPS(DPS句法)可包括通常适用于整个视频的信息/参数。DPS可包括与编码视频序列(CVS)的级联有关的信息/参数。在本文献中,高级句法(HLS)可包括APS句法、PPS句法、SPS句法、VPS句法、DPS句法、画面头句法和切片头句法中的至少一个。
在本文献中,在编码设备中编码并以比特流的形式用信号通知给解码设备的图像/视频信息可不仅包括画面中的分割相关信息、帧内/帧间预测信息、残差信息、回路滤波信息等,而且包括切片头中所包括的信息、画面头中所包括的信息、APS中所包括的信息、PPS中所包括的信息、SPS中所包括的信息、VPS中所包括的信息和/或DPS中所包括的信息。另外,图像/视频信息还可包括NAL单元头的信息。
此外,为了补偿由于诸如量化的压缩编码处理中出现的错误而引起的原始图像与重构图像之间的差异,可如上所述对重构样本或重构画面执行回路滤波处理。如上所述,回路滤波可由编码设备的滤波器和解码设备的滤波器执行,并且可应用去块滤波器、SAO和/或自适应环路滤波器(ALF)。例如,可在去块滤波处理和/或SAO处理完成之后执行ALF处理。然而,即使在这种情况下,也可省略去块滤波处理和/或SAO处理。
以下,将描述画面重构和滤波的详细说明。在图像/视频编码中,可基于帧内预测/帧间预测针对各个块生成重构块,并且可生成包括重构块的重构画面。当当前画面/切片是I画面/切片时,可仅基于帧内预测来重构包括在当前画面/切片中的块。此外,当当前画面/切片是P或B画面/切片时,可基于帧内预测或帧间预测来重构包括在当前画面/切片中的块。在这种情况下,可对当前画面/切片中的一些块应用帧内预测,并且可对剩余块应用帧间预测。
帧内预测可表示基于当前块所属的画面(以下,当前画面)中的参考样本来生成当前块的预测样本的预测。在对当前块应用帧内预测的情况下,可推导要用于当前块的帧内预测的邻近参考样本。当前块的邻近参考样本可包括与大小为nW×nH的当前块的左边界相邻的样本、邻近左下的总共2×nH个样本、与当前块的上边界相邻的样本、邻近右上的总共2×nW个样本以及邻近当前块的左上的一个样本。另选地,当前块的邻近参考样本可包括多列的上邻近样本和多行的左邻近样本。另选地,当前块的邻近参考样本可包括与大小为nW×nH的当前块的右边界相邻的总共nH个样本、与当前块的右边界相邻的总共nH个样本、与当前块的下边界相邻的总共nW个样本以及邻近当前块的右下的一个样本。
然而,当前块的一些邻近参考样本可能还未解码或者可能不可用。在这种情况下,解码器可通过用可用样本替换不可用样本来配置要用于预测的邻近参考样本。另选地,要用于预测的邻近参考样本可通过可用样本的插值来配置。
当推导邻近参考样本时,(i)可基于当前块的邻近参考样本的平均或插值来推导预测样本,并且(ii)可基于当前块的邻近参考样本当中相对于预测样本存在于特定(预测)方向上的参考样本来推导预测样本。(i)的情况可被称为非定向模式或非角模式,(ii)的情况可被称为定向模式或角模式。此外,可通过邻近参考样本当中基于当前块的预测样本位于与当前块的帧内预测模式的预测方向相反的方向上的第一邻近样本与第二邻近样本之间的插值来生成预测样本。上述情况可被称为线性插值帧内预测(LIP)。此外,可使用线性模型基于亮度样本来生成色度预测样本。这种情况可被称为LM模式。此外,可基于滤波的外围参考样本来推导当前块的时间预测样本,并且可通过对时间预测样本与现有邻近参考样本(即,未滤波的邻近参考样本)当中根据帧内预测模式推导的至少一个参考样本加权求和来推导当前块的预测样本。上述情况可被称为位置依赖帧内预测(PDPC)。此外,通过选择当前块的多个邻近参考样本线当中具有最高预测精度的参考样本线,可使用对应线中位于预测方向上的参考样本来推导预测样本。在这种情况下,可通过将所使用的参考样本线指示(用信号通知)给解码设备来执行帧内预测编码。上述情况可被称为多参考线(MRL)帧内预测或基于MRL的帧内预测。此外,可将当前块分成垂直子分区或水平子分区以基于相同的帧内预测模式执行帧内预测,但是可以子分区为单位推导和使用邻近参考样本。即,在这种情况下,当前块的帧内预测模式可等同地应用于子分区,但是在一些情况下可通过以子分区为单位推导和使用外围参考样本来改进帧内预测性能。这种预测方法可被称为帧内子分区(ISP)或基于ISP的帧内预测。上述帧内预测方法可被称为与内容1.2的表中的帧内预测模式相区分的帧内预测类型。帧内预测类型可被称为诸如帧内预测技术或附加帧内预测模式的各种术语。例如,帧内预测类型(或附加帧内预测模式等)可包括上述LIP、PDPC、MRL和ISP中的至少一种。除了诸如LIP、PDPC、MRL和ISP的特定帧内预测类型之外的一般帧内预测方法可被称为正常帧内预测类型。当不应用上述特定帧内预测类型时,通常可应用正常帧内预测类型,并且可基于上述帧内预测模式执行预测。此外,如果需要,可对推导的预测样本执行后处理滤波。
具体地,帧内预测过程可包括:确定帧内预测模式/类型;推导外围参考样本;以及基于帧内预测模式/类型来推导预测样本。另外,如果需要,可对推导的预测样本执行后处理滤波。
可生成通过环路内滤波过程修改的重构画面,并且修改的重构画面可作为解码的画面从解码设备输出。此外,修改的重构画面可存储在编码设备/解码设备的解码画面缓冲器或存储器中,然后可在对画面进行编码/解码时在帧间预测过程中用作参考画面。如上所述,环路内滤波过程可包括去块滤波过程、样本自适应偏移(SAO)过程和/或自适应环路滤波器(ALF)过程。在这种情况下,可依次应用去块滤波过程、样本自适应偏移(SAO)过程、自适应环路滤波器(ALF)过程和双边滤波过程中的一个或一些,或者可依次应用所有过程。例如,在对重构画面应用去块滤波过程之后,可执行SAO过程。此外,例如,在对重构画面应用去块滤波过程之后,可执行ALF过程。这甚至可由编码设备以相同的方式执行。
去块滤波是去除在重构画面中的块之间的边界处出现的失真的滤波技术。例如,去块滤波过程可从重构画面推导目标边界,确定目标边界的边界强度(bS),并且基于bS对目标边界执行去块滤波。bS可基于与目标边界相邻的两个块的预测模式、运动向量差、参考画面是否相同以及是否存在非0有效系数来确定。
SAO是用于以样本为单位补偿重构画面和原始画面之间的偏移差的方法,并且例如,可基于带偏移、边缘偏移等的类型来应用。根据SAO,样本根据SAO类型被分类为不同的类别,并且可基于类别将偏移值与各个样本相加。SAO的滤波信息可包括关于是否应用SAO的信息、SAO类型信息和SAO偏移值信息。可在应用去块滤波之后对重构画面应用SAO。
自适应环路滤波器(ALF)是根据滤波器形状基于滤波器系数以样本为单位对重构画面的滤波技术。编码设备可通过将重构画面和原始画面彼此比较来确定是否应用ALF、ALF形状和/或ALF滤波系数,并且可将其用信号通知给解码设备。即,ALF的滤波信息可包括关于是否应用ALF的信息、ALF滤波器形状信息和ALF滤波系数信息。还可在应用去块滤波之后对重构画面应用ALF。
图5示出根据本文献的实施方式的画面。图5的示例性画面可被分成子画面、切片和拼块。
参照图5,画面可被分成子画面。例如,子画面可包括一个或更多个切片。切片可表示画面的矩形区域。此外,画面可被分成拼块。例如,矩形切片可仅包括一个拼块的一部分(子集)。即,在图5中,两个矩形切片在同一拼块内,并且这两个矩形切片可属于不同的子画面。可由图5的情况导致的问题及其解决方案将稍后描述。
在示例中,画面/子画面可基于子画面/切片/拼块来编码。编码设备可基于子画面/切片/拼块结构对当前画面进行编码,或者编码设备可对当前画面的一个或更多个子画面(包括切片/拼块)进行编码,并且可输出包括关于子画面的(编码的)信息的(子)比特流。解码设备可基于包括子画面/切片/拼块的(编码的)信息的(子)比特流来对当前画面中的一个或更多个子画面进行解码。
图6示出根据本文献的实施方式的基于子画面/切片/拼块的编码方法。
编码器可将(输入)画面分成多个(或者一个或更多个)子画面/切片/拼块。各个子画面可被单独地/独立地编码,并且可输出比特流。这里,用于子画面的比特流可被称为子流、子集或子比特流。关于子画面/切片/拼块的信息可包括本文献中描述的信息/句法元素。例如,关于切片的信息可包括与为各个画面/子画面用信号通知的切片的数量和拼块中的切片的宽度/高度有关的信息。例如,关于拼块的信息可包括与拼块的数量(例如,拼块列的数量和/或拼块行的数量)有关的信息以及与各个拼块的大小(例如,宽度和/或高度)有关的信息。
编码器可将一个或更多个子画面编码为关于子画面的信息。编码器可将一个或更多个切片/拼块编码为关于切片/拼块的信息。
图7示出根据本文献的实施方式的基于子画面/切片/拼块的解码方法。
解码器可对一个或更多个子画面(包括切片/拼块)进行解码,并且可输出一个或更多个解码的子画面或包括子画面的当前画面。比特流可包括用于子画面的子流或子比特流。如上所述,关于子画面/切片/拼块的信息可配置在包括在比特流中的高级句法(HLS)中。解码器可基于关于子画面的信息来推导一个或更多个子画面。解码器可基于关于切片/拼块的信息来推导一个或更多个切片/拼块。解码器可对所有或一些子画面进行解码。解码器可基于CABAC、预测、残差处理(变换和量化)和环路内滤波对子画面(包括当前块(或CU))、CTU、切片和/或拼块进行解码。因此,可输出解码的子画面。解码的子画面可包括重构/解码的块。输出子画面集(OPS)中的解码的子画面可一起输出。作为示例,如果画面与360度或全向图像/视频有关,则可渲染它们中的一些,并且在这种情况下,所有子画面中的仅一些可被解码,并且可根据用户视口或观看位置渲染一些或所有解码的子画面。另外,如果指示(表示)是否跨子画面边界启用环路内滤波的信息被启用,则解码器可针对位于两个子画面之间的子画面边界应用环路内滤波过程(例如,去块滤波)。例如,如果子画面边界与画面边界相同,则可应用或者可不执行针对子画面边界的环路内滤波过程。
在本文献的实施方式中,图像/视频信息可包括HLS,并且HLS可包括关于子画面/切片/拼块的信息。关于子画面的信息可包括表示当前画面中的一个或更多个子画面的信息。关于切片的信息可包括表示当前画面、子画面或拼块中的一个或更多个切片的信息。关于拼块的信息可包括表示当前画面、子画面或切片中的一个或更多个拼块的信息。画面可包括包含一个或更多个切片的拼块和/或包含一个或更多个拼块的切片。此外,画面可包括包含一个或更多个切片/拼块的子画面。
以下的表表示与上述画面划分(子画面/切片/拼块)有关的句法。关于子画面/切片/拼块的信息可包括以下表中的句法元素。
下表表示基于画面划分(子画面/切片/拼块)的序列参数集(SPS)的句法。
[表1]
Figure BDA0003808760290000201
下表表示基于画面划分(子画面/切片/拼块)的画面参数集(PPS)的句法。
[表2]
Figure BDA0003808760290000211
下表表示基于画面划分(子画面/切片/拼块)的切片头的句法。
[表3]
Figure BDA0003808760290000212
图8是说明编码设备中基于滤波的编码方法的流程图。图8的方法可包括步骤S800至S830。
在步骤S800中,编码设备可生成重构画面。步骤S800可基于上述生成重构画面(或重构样本)的过程来执行。
在步骤S810中,编码设备可基于环路内滤波相关信息来确定是否(跨虚拟边界)应用环路内滤波。这里,环路内滤波可包括上述去块滤波、SAO或ALF中的至少一个。
在步骤S820中,编码设备可基于步骤S810中的确定来生成修改的重构画面(修改的重构样本)。这里,修改的重构画面(修改的重构样本)可以是滤波的重构画面(滤波的重构样本)。
在步骤S830中,编码设备可基于环路内滤波过程对包括环路内滤波相关信息的图像/视频信息进行编码。
图9是说明解码设备中基于滤波的解码方法的流程图。图9的方法可包括步骤S900至S930。
在步骤S900中,解码设备可从比特流获得包括环路内滤波相关信息的图像/视频信息。这里,比特流可基于从编码设备发送的编码图像/视频信息。
在步骤S910中,解码设备可生成重构画面。步骤S910可基于上述生成重构画面(或重构样本)的过程来执行。
在步骤S920中,解码设备可基于环路内滤波相关信息来确定是否(跨虚拟边界)应用环路内滤波。这里,环路内滤波可包括上述去块滤波、SAO或ALF中的至少一个。
在步骤S930中,解码设备可基于步骤S920中的确定来生成修改的重构画面(修改的重构样本)。这里,修改的重构画面(修改的重构样本)可以是滤波的重构画面(滤波的重构样本)。
如上所述,可对重构画面应用环路内滤波过程。在这种情况下,为了进一步增强重构画面的主观/客观视觉质量,可定义虚拟边界,并且可跨虚拟边界应用环路内滤波过程。例如,虚拟边界可包括诸如360度图像、VR图像或画中画(PIP)的不连续边缘。例如,虚拟边界可存在于预定接合位置,并且可用信号通知其存在/不存在和/或位置。作为示例,虚拟边界可位于CTU行的上面第四样本线(具体地,例如,CTU行的上面第四样本线上方)。作为另一示例,可通过HLS用信号通知关于虚拟边界的存在/不存在和/或位置的信息。如上所述,HLS可包括SPS、PPS、画面头和切片头。
以下,将描述根据本文献的实施方式的高级句法信令和语义。
本文献的实施方式可包括用于控制环路滤波器的方法。用于控制环路滤波器的方法可应用于重构画面。环路内滤波器(环路滤波器)可用于对编码比特率进行解码。环路滤波器可包括上述去块、SAO和ALF。SPS可包括分别与去块、SAO和ALF有关的标志。标志可表示是否为参考SPS的编码层视频序列(CLVS)和编码视频序列(CVS)的编码启用各个工具。
如果为CVS启用环路滤波器,则可控制不跨特定边界应用环路滤波器。例如,可控制环路滤波器是否跨子画面边界。此外,可控制环路滤波器是否跨拼块边界。另外,可控制环路滤波器是否跨虚拟边界。这里,可基于线缓冲器的可用性在CTU上定义虚拟边界。
关于是否跨虚拟边界执行环路内滤波过程,环路内滤波相关信息可包括SPS虚拟边界启用标志(SPS中的虚拟边界启用标志)、SPS虚拟边界存在标志、画面头虚拟边界存在标志、SPS画面头虚拟边界存在标志和关于虚拟边界的位置的信息中的至少一个。
在本文献中所包括的实施方式中,关于虚拟边界的位置的信息可包括关于垂直虚拟边界的x坐标的信息和关于水平虚拟边界的y坐标的信息。具体地,关于虚拟边界的位置的信息可包括关于垂直虚拟边界的x坐标的信息和/或以亮度样本为单位的水平虚拟边界的y坐标。此外,关于虚拟边界的位置的信息可包括关于存在于SPS中的垂直虚拟边界的x坐标的信息(句法元素)的数量的信息。此外,关于虚拟边界的信息可包括关于存在于SPS中的水平虚拟边界的y坐标的信息(句法元素)的数量的信息。此外,关于虚拟边界的位置的信息可包括关于存在于画面头中的垂直虚拟边界的x坐标的信息(句法元素)的数量的信息。此外,关于虚拟边界的位置的信息可包括关于存在于画面头中的水平虚拟边界的y坐标的信息(句法元素)的数量的信息。
以下的表表示根据本实施方式的序列参数集(SPS)的示例性句法和语义。
[表4]
Figure BDA0003808760290000242
[表5]
Figure BDA0003808760290000241
Figure BDA0003808760290000251
Figure BDA0003808760290000261
以下的表表示根据本实施方式的画面参数集(PPS)的示例性句法和语义。
[表6]
Figure BDA0003808760290000263
[表7]
Figure BDA0003808760290000262
Figure BDA0003808760290000271
以下的表表示根据本实施方式的画面头的示例性句法和语义。
[表8]
Figure BDA0003808760290000281
Figure BDA0003808760290000291
[表9]
Figure BDA0003808760290000292
Figure BDA0003808760290000301
Figure BDA0003808760290000311
以下的表表示根据本实施方式的切片头的示例性句法和语义。
[表10]
Figure BDA0003808760290000321
[表11]
Figure BDA0003808760290000322
Figure BDA0003808760290000331
Figure BDA0003808760290000341
以下,将描述与子画面有关的信息、与可用于环路内滤波的虚拟边界有关的信息及其信令。
在示例中,两个不同的矩形切片可在共享相同拼块的同时属于不同的子画面。在这种情况下,可能出现编码复杂度增加的问题。
为了简化画面划分,本文献的实施方式可包括画面被分成两个或更多个子画面的条件示例。在示例中,一个拼块中的所有CTU可属于同一子画面。在另一示例中,子画面中的所有CTU可属于同一拼块。上述两个示例可单独地应用于图像/视频编码,可依次应用,或者可组合应用。此外,在本文献的实施方式中,在子画面包括作为一个拼块中所有CTU的子集的CTU的情况下,子画面可不包括属于另一拼块的CTU。
在用于当前画面的信令中,如果subpic_present_flag的值为1,则参考SPS的各个画面中的子画面的数量可为1(sps_num_subpics_minus1的值为0)。已具备这种条件以支持子画面提取使用示例,其中子画面从比特流独立地编码以便形成另一比特流,甚至无需改变小于参数集的值的值。因此,即使subpic_present_flag的值为1,并且sps_num_subpics_minus1的值为0,仍存在subpic_ctu_top_left_x[0]、subpic_ctu_top_left_y[0]、subpic_width_minus1[0]、subpic_height_minus1[0]、subpic_treated_as_pic_flag[i]和/或loop_filter_across_subpic_enabled_flag[i]。在这种情况下,这些句法元素可能彼此交叠存在,并且如果针对对应句法元素接收到错误值的信号,则也可使得解码器的操作不可预测。例如,如果subpics_present_flag的值为1,并且sps_num_subpics_minus1的值为0,则这意味着仅存在一个子画面(画面本身),并且subpic_treat_as_pic_flag[0]的值等于1。在这种情况下,如果用信号通知对应值为值0,则在解码过程中可能出现矛盾的问题。
为了解决上述问题,本文献的实施方式包括能够在存在子画面信令(例如,subpic_present_flag的值为1)并且在画面中仅存在一个子画面(例如,sps_num_subpics_minus1的值为0)的情况下应用的条件示例。上述条件示例可如下表中一样。
[表12]
Figure BDA0003808760290000351
Figure BDA0003808760290000361
在示例中,在存在子画面信令,并且虚拟边界的位置存在于画面头中的情况下,在子画面提取和子画面合并场景中存在画面头应该被重写以便标识虚拟边界位置的信令是否正确的问题。这可能违背子画面提取/合并的设计目的,其中不需要为比参数集低的层的NAL单元重写比特流。
为了解决上述问题,根据本文献的实施方式,如果存在子画面信令(例如,如果SPS中存在子画面信令),则画面头中可不包括虚拟边界位置的信令。作为示例,如果存在子画面信令,则关于虚拟边界的位置的信息可包括在高级参数集中。例如,如果存在子画面信令,则关于虚拟边界的位置的信息可包括在SPS中。此外,如果存在子画面信令,则关于虚拟边界的位置的信息可包括在PPS中。
在本文献的实施方式中,如果存在子画面ID信令(如果sps_subpic_id_present_flag的值为1),则所有子画面可以是独立编码的子画面(subpic_treated_as_pic_flag[i]的值为1)。在这种情况下,子画面ID信令的位置(例如,SPS、PPS或画面头)可没有关系。
根据本文献的实施方式以及上述表,可基于是否存在子画面信息来确定序列参数集中是否用信号通知虚拟边界相关信息(例如,虚拟边界位置相关信息)。例如,在对应序列中存在子画面信息的情况下,可在序列参数集中用信号通知虚拟边界相关信息(例如,虚拟边界位置相关信息)。因此,可有效地执行根据本文献的实施方式的基于虚拟边界的编码方法,而无需重写或改变高级句法。
此外,根据本文献的实施方式,(解码的)画面可由子画面组成。可由解码设备获得关于子画面的信息,并且基于关于子画面的信息,可执行解码过程。在示例中,基于关于子画面的信息,解码设备可确定用信号通知关于用于环路内滤波的虚拟边界的位置的信息的位置(例如,SPS)。
图10和图11示意性地示出根据本文献的实施方式的视频/图像编码方法和相关组件的示例。
图10中公开的方法可由图2或图11中公开的编码设备执行。具体地,例如,图10的S1000和S1010可由图11的编码设备的预测器220执行,图10的S1020至S1040可由图11的编码设备的残差处理器230执行,图10的S1050可由图11的编码设备的滤波器260执行,图10的S1060可由图11的编码设备的熵编码器240执行。图10中公开的方法可包括本文献的上述实施方式。
编码设备可推导子画面。编码设备可将当前画面分成子画面。编码设备可确定子画面的大小(例如,高度/宽度)。此外,编码设备可确定包括在当前画面中的子画面的数量。
编码设备可生成子画面相关信息。例如,编码设备可基于包括在当前画面中的子画面的数量、子画面的大小(例如,高度/宽度)和/或子画面的边界来生成子画面相关信息。子画面相关信息可包括关于是否存在子画面的信息、关于子画面是否被视为画面的信息、关于包括在当前画面中的子画面的数量的信息、关于子画面的大小(例如,高度/宽度)的信息、关于子画面的边界是否与当前画面的边界重合的信息和/或关于子画面的ID的信息。
参照图10,编码设备可生成预测样本(S1000)。编码设备可通过基于原始样本执行预测过程来生成预测样本。例如,编码设备可基于子画面来生成预测样本。
编码设备可基于预测样本来生成预测相关信息(S1010)。预测相关信息可包括帧内预测模式信息、帧间预测模式信息和参考画面相关信息。
编码设备可推导残差样本(S1020)。编码设备可推导当前块的残差样本,并且当前块的残差样本可基于当前块的原始样本和预测样本来推导。具体地,编码设备可基于预测模式来推导当前块的预测样本。在这种情况下,可应用本文献中公开的各种预测方法,例如帧间预测或帧内预测。残差样本可基于预测样本和原始样本来推导。
编码设备可推导变换系数(S1030)。编码设备可基于对残差样本的变换过程来推导变换系数。例如,变换过程可包括DCT、DST、GBT或CNT中的至少一种。
编码设备可推导量化的变换系数。编码设备可基于对变换系数的量化过程来推导量化的变换系数。基于系数扫描顺序,量化的变换系数可具有1维向量形式。
编码设备可生成残差信息(S1040)。编码设备可基于当前块的残差样本来生成残差信息。编码设备可生成表示量化的变换系数的残差信息。残差信息可通过诸如指数Golomb、CAVLC和CABAC的各种编码方法来生成。
编码设备可生成重构样本。编码设备可基于残差信息来生成重构样本。可通过将基于残差信息的残差样本与预测样本相加来生成重构样本。具体地,编码设备可对当前块执行预测(帧内或帧间预测),并且可基于原始样本和通过预测生成的预测样本来生成重构样本。
重构样本可包括重构亮度样本和重构色度样本。具体地,残差样本可包括残差亮度样本和残差色度样本。可基于原始亮度样本和预测亮度样本来生成残差亮度样本。可基于原始色度样本和预测色度样本来生成残差色度样本。编码设备可推导残差亮度样本的变换系数(亮度变换系数)和/或残差色度样本的变换系数(色度变换系数)。量化的变换系数可包括量化的亮度变换系数和/或量化的色度变换系数。
编码设备可确定是否跨虚拟边界执行环路内滤波过程。基于上述确定,编码设备可生成关于虚拟边界的数量和虚拟边界的位置的信息。例如,编码设备可生成关于垂直虚拟边界的数量的信息、关于垂直虚拟边界的位置的信息、关于水平虚拟边界的数量的信息和关于水平虚拟边界的位置的信息。
编码设备可为当前画面的重构样本生成环路内滤波相关信息(S1050)。编码设备可对重构样本执行环路内滤波过程,并且可基于环路内滤波过程生成环路内滤波相关信息。例如,环路内滤波相关信息可包括本文献中上面描述的关于虚拟边界的信息(SPS虚拟边界启用标志、画面头虚拟边界启用标志、SPS虚拟边界存在标志、画面头虚拟边界存在标志和关于虚拟边界的位置的信息)。在示例中,编码设备可基于关于垂直虚拟边界的数量的信息、关于垂直虚拟边界的位置的信息、关于水平虚拟边界的数量的信息和关于水平虚拟边界的位置的信息生成环路内滤波相关信息。
编码设备可对视频/图像信息进行编码(S1060)。图像信息可包括残差信息、预测相关信息、子画面相关信息和/或环路内滤波相关信息。编码的视频/图像信息可按比特流的形式输出。比特流可通过网络或存储介质传输至解码设备。
图像/视频信息可包括根据本文献的实施方式的各种信息。例如,图像/视频信息可包括上述表1至表12中的至少一个中公开的信息。
在实施方式中,图像信息可包括序列参数集(SPS)和参考SPS的画面头信息。基于SPS是否包括子画面相关信息,可确定与虚拟边界有关的附加信息包括在SPS中还是画面头中。
在实施方式中,与虚拟边界有关的附加信息可包括虚拟边界的数量和虚拟边界的位置。
在实施方式中,附加虚拟边界相关信息可包括关于垂直虚拟边界的数量的信息、关于垂直虚拟边界的位置的信息、关于水平虚拟边界的数量的信息和关于水平虚拟边界的位置的信息。
在实施方式中,图像信息可包括子画面存在标志(例如,subpic_present_flag)。可基于子画面存在标志确定SPS是否包括子画面相关信息。
在实施方式中,图像信息可包括子画面ID存在标志。基于子画面ID存在标志的值为1,当前画面中的子画面可以是独立编码的子画面。
在实施方式中,当前画面可包括子画面和拼块。一个拼块中的编码树单元(CTU)可属于同一子画面。
在实施方式中,当前画面可包括子画面和拼块。一个子画面中的编码树单元(CTU)可属于同一拼块。
在实施方式中,SPS可包括与SPS是否包括与虚拟边界有关的附加信息有关的SPS虚拟边界存在标志。基于SPS包括子画面相关信息,SPS虚拟边界存在标志的值可被确定为1。
在实施方式中,基于SPS包括子画面相关信息,画面头中可不包括与虚拟边界有关的附加信息。
在实施方式中,基于SPS包括子画面相关信息,SPS可包括与虚拟边界有关的附加信息。
图12和图13示意性地示出根据本文献的实施方式的视频/图像解码方法和相关组件的示例。
图12中所公开的方法可由图12或图13中公开的解码设备执行。具体地,例如,图12的S1200可由解码设备的熵解码器310执行,图12的S1210和S1220可由解码设备的残差处理器320执行,图12的S1230可由解码设备的预测器330执行,S1240可由解码设备的加法器340执行,S1250可由解码设备的滤波器350执行。图12中公开的方法可包括本文献中的上述实施方式。
参照图12,解码设备可接收/获得视频/图像信息(S1200)。视频/图像信息可包括残差信息、预测相关信息、子画面相关信息和/或环路内滤波相关信息。解码设备可通过比特流接收/获得图像/视频信息。
图像/视频信息可包括根据本文献的实施方式的各种信息。例如,图像/视频信息可包括上述表1至表12中的至少一个中公开的信息。
解码设备可推导当前画面的子画面。解码设备可根据基于比特流获得的子画面相关信息来推导子画面。基于子画面相关信息,可确定子画面的数量、子画面的大小和子画面是否被视为画面。稍后要描述的残差样本和/或预测样本可基于子画面来生成。
解码设备可推导量化的变换系数。解码设备可基于残差信息来推导量化的变换系数。基于系数扫描顺序,量化的变换系数可具有1维向量形式。量化的变换系数可包括量化的亮度变换系数和/或量化的色度变换系数。
解码设备可推导变换系数(S1210)。解码设备可基于对量化的变换系数的解量化过程来推导变换系数。解码设备可基于量化的亮度变换系数通过解量化来推导亮度变换系数。解码设备可基于量化的色度变换系数通过解量化来推导色度变换系数。
解码设备可生成/推导残差样本(S1220)。解码设备可基于对变换系数的逆变换过程来推导残差样本。解码设备可基于亮度变换系数通过逆变换过程来推导残差亮度样本。解码设备可基于色度变换系数通过逆变换过程来推导残差色度样本。
解码设备可生成预测样本(S1230)。解码设备可基于预测相关信息来生成预测样本。例如,解码设备可基于预测相关信息来推导当前块的预测模式,并且可基于推导的预测模式来生成当前块的预测样本。
解码设备可生成/推导重构样本(S1240)。例如,解码设备可生成/推导重构亮度样本和/或重构色度样本。解码设备可基于残差信息来生成重构亮度样本和/或重构色度样本。解码设备可基于残差信息来生成重构样本。重构样本可包括重构亮度样本和/或重构色度样本。重构样本的亮度分量可对应于重构亮度样本,重构样本的色度分量可对应于重构色度样本。解码设备可通过预测过程来生成预测亮度样本和/或预测色度样本。解码设备可基于预测亮度样本和残差亮度样本来生成重构亮度样本。解码设备可基于预测色度样本和残差色度样本来生成重构的色度样本。另外,解码设备可基于残差样本、预测样本和/或子画面来生成当前画面的重构样本。
解码设备可生成修改(滤波)的重构样本(S1250)。解码设备可基于针对重构样本的环路内滤波过程来生成修改的重构样本。解码设备可基于环路内滤波相关信息来生成修改的重构样本。为了生成修改的重构样本,解码设备可使用去块过程、SAO过程和/或ALF过程。
在实施方式中,图像信息可包括序列参数集(SPS)和参考SPS的画面头信息。基于SPS是否包括子画面相关信息,可确定与虚拟边界有关的附加信息包括在SPS中还是画面头中。
在实施方式中,与虚拟边界有关的附加信息可包括虚拟边界的数量和虚拟边界的位置。
在实施方式中,与虚拟边界有关的附加信息可包括关于垂直虚拟边界的数量的信息、关于垂直虚拟边界的位置的信息、关于水平虚拟边界的数量的信息和关于水平虚拟边界的位置的信息。
在实施方式中,图像信息可包括子画面存在标志(例如,subpic_present_flag)。可基于子画面存在标志确定SPS是否包括子画面相关信息。
在实施方式中,图像信息可包括子画面ID存在标志。基于子画面ID存在标志的值为1,当前画面中的子画面可以是独立编码的子画面。
在实施方式中,当前画面可包括子画面和拼块。一个拼块中的编码树单元(CTU)可属于同一子画面。
在实施方式中,当前画面可包括子画面和拼块。一个子画面中的编码树单元(CTU)可属于同一拼块。
在实施方式中,SPS可包括与SPS是否包括与虚拟边界有关的附加信息有关的SPS虚拟边界存在标志。基于SPS包括子画面相关信息,SPS虚拟边界存在标志的值可被确定为1。
在实施方式中,基于SPS包括子画面相关信息,画面头中可不包括与虚拟边界有关的附加信息。
当存在当前块的残差样本时,解码设备可接收关于当前块的残差的信息。关于残差的信息可包括关于残差样本的变换系数。解码设备可基于残差信息推导当前块的残差样本(或残差样本阵列)。具体地,解码设备可基于残差信息来推导量化的变换系数。基于系数扫描顺序,量化的变换系数可具有1维向量形式。解码设备可基于对量化的变换系数的解量化处理来推导变换系数。解码设备可基于变换系数来推导残差样本。
解码设备可基于(帧内)预测样本和残差样本来生成重构样本,并且可基于重构样本推导重构块或重构画面。具体地,解码设备可基于(帧内)预测样本和残差样本之和来生成重构样本。此后,如上所述,如果需要,为了改进主观/客观画面质量,解码设备可对重构画面应用环路内滤波处理,例如去块滤波和/或SAO处理。
例如,解码设备可通过对比特流或编码信息进行解码来获得包括上述信息(或句法元素)的全部或部分的图像信息。此外,比特流或编码信息可被存储在计算机可读存储介质中,并且可使得上述解码方法执行。
尽管在上述实施方式中基于按顺序列出步骤或块的流程图描述了方法,但本文献的步骤不限于特定顺序,特定步骤可相对于上述内容在不同的步骤中或按不同的顺序或同时执行。此外,本领域普通技术人员将理解,流程图的步骤并非排他性的,在不影响本公开的范围的情况下,可在其中包括另一步骤,或者流程图中的一个或更多个步骤可被删除。
根据本公开的上述方法可为软件的形式,并且根据本公开的编码设备和/或解码设备可包括在用于图像处理的装置(例如,TV、计算机、智能电话、机顶盒、显示装置等)中。
当本公开的实施方式由软件实现时,上述方法可由执行上述功能的模块(进程或函数)实现。模块可被存储在存储器中并由处理器执行。存储器可被安装在处理器内部或外部,并且可经由各种熟知的手段来连接到处理器。处理器可包括专用集成电路(ASIC)、其它芯片组、逻辑电路和/或数据处理装置。存储器可包括只读存储器(ROM)、随机存取存储器(RAM)、闪存、存储卡、存储介质和/或其它存储装置。换言之,根据本公开的实施方式可在处理器、微处理器、控制器或芯片上实现和执行。例如,各个图中所示的功能单元可在计算机、处理器、微处理器或控制器或芯片上实现和执行。在这种情况下,关于实现的信息(例如,关于指令的信息)或算法可存储在数字存储介质中。
另外,应用了本文献的实施方式的解码设备和编码设备可被包括在多媒体广播收发器、移动通信终端、家庭影院视频装置、数字影院视频装置、监控相机、视频聊天装置和实时通信装置(例如,视频通信)、移动流装置、存储介质、摄像机、视频点播(VoD)服务提供商、顶置(OTT)视频装置、互联网流服务提供商、3D视频装置、虚拟现实(VR)装置、增强现实(AR)装置、图像电话视频装置、载具终端(例如,车辆(包括自主车辆)终端、飞机终端或船舶终端)和医疗视频装置中;并且可用于处理图像信号或数据。例如,OTT视频装置可包括游戏机、蓝光播放器、互联网连接TV、家庭影院系统、智能电话、平板PC和数字视频记录仪(DVR)。
另外,应用了本文献的实施方式的处理方法可按照由计算机执行的程序的形式生成,并且可被存储在计算机可读记录介质中。具有根据本文献的实施方式的数据结构的多媒体数据也可被存储在计算机可读记录介质中。计算机可读记录介质包括存储计算机可读数据的所有类型的存储装置和分布式存储装置。例如,计算机可读记录介质可包括蓝光盘(BD)、通用串行总线(USB)、ROM、PROM、EPROM、EEPROM、RAM、CD-ROM、磁带、软盘和光学数据存储装置。计算机可读记录介质还包括以载波的形式具体实现的介质(例如,经由互联网的传输)。另外,通过该编码方法生成的比特流可被存储在计算机可读记录介质中或者通过有线或无线通信网络发送。
另外,本文献的实施方式可基于程序代码具体实现为计算机程序产品,并且可根据本文献的实施方式在计算机上执行程序代码。程序代码可被存储在计算机可读载体上。
图14表示可应用本文献的实施方式的内容流系统的示例。
参照图14,应用了本文献的实施方式的内容流系统通常可包括编码服务器、流服务器、网络服务器、媒体存储装置、用户装置和多媒体输入装置。
编码服务器用于将从多媒体输入装置(例如,智能电话、相机、摄像机等)输入的内容压缩为数字数据,以生成比特流并将其发送到流服务器。作为另一示例,在多媒体输入装置(例如,智能电话、相机、摄像机等)直接生成比特流的情况下,可省略编码服务器。
可通过应用了本文献的实施方式的编码方法或比特流生成方法来生成比特流。并且,在发送或接收比特流的过程中,流服务器可暂时存储比特流。
流服务器通过网络服务器基于用户的请求将多媒体数据发送到用户设备,网络服务器用作告知用户有什么服务的仪器。当用户请求用户想要的服务时,网络服务器将该请求传送至流服务器,并且流服务器将多媒体数据发送到用户。在这方面,内容流系统可包括单独的控制服务器,并且在这种情况下,控制服务器用于控制内容流系统中的各个设备之间的命令/响应。
流服务器可从媒体存储装置和/或编码服务器接收内容。例如,在从编码服务器接收内容的情况下,内容可实时地接收。在这种情况下,流服务器可将比特流存储预定时间段,以顺畅地提供流服务。
例如,用户设备可包括移动电话、智能电话、膝上型计算机、数字广播终端、个人数字助理(PDA)、便携式多媒体播放器(PMP)、导航、石板PC、平板PC、超级本、可穿戴装置(例如,手表型终端(智能手表)、眼镜型终端(智能眼镜)、头戴式显示器(HMD))、数字TV、台式计算机、数字标牌等。
内容流系统中的各个服务器可作为分布式服务器来操作,并且在这种情况下,各个服务器接收的数据可按分布式方式处理。
本说明书中的权利要求可按各种方式组合。例如,本说明书的方法权利要求中的技术特征可被组合以在设备中实现或执行,设备权利要求中的技术特征可被组合以在方法中实现或执行。此外,方法权利要求和设备权利要求中的技术特征可被组合以在设备中实现或执行。此外,方法权利要求和设备权利要求中的技术特征可被组合以在方法中实现或执行。

Claims (20)

1.一种由解码设备执行的图像解码方法,该图像解码方法包括以下步骤:
通过比特流获得包括残差信息、预测相关信息和环路内滤波相关信息的图像信息;
基于所述残差信息来推导变换系数;
基于所述变换系数来生成残差样本;
基于所述预测相关信息来生成预测样本;
基于所述残差样本和所述预测样本来生成当前画面的重构样本;以及
通过基于所述环路内滤波相关信息对所述当前画面的所述重构样本执行环路内滤波过程来生成修改的重构样本,
其中,所述图像信息包括序列参数集SPS和参考所述SPS的画面头信息,并且
其中,基于所述SPS是否包括子画面相关信息来确定与虚拟边界有关的附加信息是否包括在所述SPS或画面头中。
2.根据权利要求1所述的图像解码方法,其中,与所述虚拟边界有关的所述附加信息包括所述虚拟边界的数量和所述虚拟边界的位置。
3.根据权利要求1所述的图像解码方法,其中,与所述虚拟边界有关的所述附加信息包括关于垂直虚拟边界的数量的信息、关于所述垂直虚拟边界的位置的信息、关于水平虚拟边界的数量的信息和关于所述水平虚拟边界的位置的信息。
4.根据权利要求1所述的图像解码方法,其中,所述图像信息包括子画面存在标志,并且
其中,基于所述子画面存在标志来确定所述SPS是否包括所述子画面相关信息。
5.根据权利要求1所述的图像解码方法,其中,所述当前画面包括子画面和拼块,并且
其中,一个拼块中的编码树单元CTU属于同一子画面。
6.根据权利要求1所述的图像解码方法,其中,所述当前画面包括子画面和拼块,并且
其中,一个子画面中的编码树单元CTU属于同一拼块。
7.根据权利要求1所述的图像解码方法,其中,所述SPS包括与所述SPS是否包括与所述虚拟边界有关的所述附加信息有关的SPS虚拟边界存在标志,并且
其中,基于所述SPS包括所述子画面相关信息,所述SPS虚拟边界存在标志的值被确定为1。
8.根据权利要求1所述的图像解码方法,其中,基于所述SPS包括所述子画面相关信息,所述画面头中不包括与所述虚拟边界有关的所述附加信息。
9.根据权利要求8所述的图像解码方法,其中,基于所述SPS包括所述子画面相关信息,所述SPS包括与所述虚拟边界有关的所述附加信息。
10.一种由编码设备执行的图像编码方法,该图像编码方法包括以下步骤:
推导当前块的残差样本;
基于所述当前块的所述残差样本来推导变换系数;
基于所述变换系数来生成残差信息;
基于所述残差样本来生成所述当前块的预测样本;
基于所述预测样本来生成预测相关信息;
为重构样本的环路内滤波过程生成环路内滤波相关信息;以及
对包括所述残差信息、所述预测相关信息和所述环路内滤波相关信息的图像信息进行编码,
其中,所述图像信息包括序列参数集SPS和参考所述SPS的画面头信息,并且
其中,基于所述SPS是否包括子画面相关信息来确定与虚拟边界有关的附加信息是否包括在所述SPS或画面头中。
11.根据权利要求10所述的图像编码方法,其中,与所述虚拟边界有关的所述附加信息包括所述虚拟边界的数量和所述虚拟边界的位置。
12.根据权利要求10所述的图像编码方法,其中,与所述虚拟边界有关的所述附加信息包括关于垂直虚拟边界的数量的信息、关于所述垂直虚拟边界的位置的信息、关于水平虚拟边界的数量的信息和关于所述水平虚拟边界的位置的信息。
13.根据权利要求10所述的图像编码方法,其中,所述图像信息包括子画面存在标志,并且
其中,基于所述子画面存在标志来确定所述SPS是否包括所述子画面相关信息。
14.根据权利要求10所述的图像编码方法,其中,所述图像信息包括子画面ID存在标志,并且
其中,基于所述子画面ID存在标志的值为1,当前画面中的子画面被独立地编码。
15.根据权利要求10所述的图像编码方法,其中,当前画面包括子画面和拼块,并且
其中,一个拼块中的编码树单元CTU属于同一子画面。
16.根据权利要求10所述的图像编码方法,其中,当前画面包括子画面和拼块,并且
其中,一个子画面中的编码树单元CTU属于同一拼块。
17.根据权利要求10所述的图像编码方法,其中,所述SPS包括与所述SPS是否包括与所述虚拟边界有关的所述附加信息有关的SPS虚拟边界存在标志,并且
其中,基于所述SPS包括所述子画面相关信息,所述SPS虚拟边界存在标志的值被确定为1。
18.根据权利要求10所述的图像编码方法,其中,基于所述SPS包括所述子画面相关信息,所述画面头中不包括与所述虚拟边界有关的所述附加信息。
19.根据权利要求18所述的图像编码方法,其中,基于所述SPS包括所述子画面相关信息,所述SPS包括与所述虚拟边界有关的所述附加信息。
20.一种计算机可读存储介质,该计算机可读存储介质存储使得图像解码设备执行图像解码方法的编码信息,所述图像解码方法包括以下步骤:
通过比特流获得包括残差信息、预测相关信息和环路内滤波相关信息的图像信息;
基于所述残差信息来推导变换系数;
基于所述变换系数来生成残差样本;
基于所述预测相关信息来生成预测样本;
基于所述残差样本和所述预测样本来生成当前画面的重构样本;以及
通过基于所述环路内滤波相关信息对所述当前画面的所述重构样本执行环路内滤波过程来生成修改的重构样本,
其中,所述图像信息包括序列参数集SPS和参考所述SPS的画面头信息,并且
其中,基于所述SPS是否包括子画面相关信息来确定与虚拟边界有关的附加信息是否包括在所述SPS或画面头中。
CN202080097300.XA 2019-12-23 2020-12-23 基于虚拟边界的图像编码装置和方法 Pending CN115136608A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962953165P 2019-12-23 2019-12-23
US62/953,165 2019-12-23
PCT/KR2020/019008 WO2021133062A1 (ko) 2019-12-23 2020-12-23 가상 경계 기반 영상 코딩 장치 및 방법

Publications (1)

Publication Number Publication Date
CN115136608A true CN115136608A (zh) 2022-09-30

Family

ID=76573197

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080097300.XA Pending CN115136608A (zh) 2019-12-23 2020-12-23 基于虚拟边界的图像编码装置和方法

Country Status (4)

Country Link
US (1) US20230046583A1 (zh)
KR (1) KR20220100048A (zh)
CN (1) CN115136608A (zh)
WO (1) WO2021133062A1 (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109685907A (zh) * 2017-10-18 2019-04-26 深圳市掌网科技股份有限公司 基于增强现实的图像结合方法及系统

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2382940A (en) * 2001-11-27 2003-06-11 Nokia Corp Encoding objects and background blocks
US9584819B2 (en) * 2011-10-24 2017-02-28 Qualcomm Incorporated Grouping of tiles for video coding
KR20230080500A (ko) * 2013-01-04 2023-06-07 지이 비디오 컴프레션, 엘엘씨 효율적인 확장가능한 코딩 개념

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109685907A (zh) * 2017-10-18 2019-04-26 深圳市掌网科技股份有限公司 基于增强现实的图像结合方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
BENJAMIN BROSS: "Versatile Video Coding (Draft 7)", JOINT VIDEO EXPERTS TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11 16TH MEETING: GENEVA, CH, 1–11 OCT. 2019, 11 October 2019 (2019-10-11), pages 2 - 7 *

Also Published As

Publication number Publication date
US20230046583A1 (en) 2023-02-16
KR20220100048A (ko) 2022-07-14
WO2021133062A1 (ko) 2021-07-01

Similar Documents

Publication Publication Date Title
US20240187602A1 (en) In-loop filtering-based image coding apparatus and method
CN114600466A (zh) 基于交叉分量滤波的图像编码设备和方法
CN114586349A (zh) 基于滤波编译视频的设备和方法
CN114402597A (zh) 应用自适应环路滤波器的视频或图像编码
US11595697B2 (en) Adaptive loop filtering-based image coding apparatus and method
CN114982245A (zh) 基于滤波的图像编码装置和方法
CN114946190B (zh) 用于控制环路滤波的图像编码装置和方法
CN114982244A (zh) 图像编码装置和方法
CN115023954A (zh) 用于控制环路滤波的图像编码装置和方法
CN115053522A (zh) 采用自适应环路滤波器的视频或图像编码
JP2024036651A (ja) サブピクチャに基づく映像コーディング装置及び方法
CN114946191B (zh) 基于用于滤波的信息的信令的图像编码设备和方法
CN115104317A (zh) 图像编码装置和用于控制环路滤波的方法
CN115136607A (zh) 基于滤波的图像编码装置和方法
CN115088265A (zh) 用于控制环路滤波的图像编码装置和方法
CN114982242A (zh) 发信号通知图片分割信息的方法和设备
CN114762350A (zh) 基于切片类型的图像/视频编译方法和设备
CN115088262A (zh) 用于发信号通知图像信息的方法和装置
CN115104313A (zh) 发信号通知在图片或切片级适用的视频信息的方法和装置
US12088813B2 (en) Picture splitting-based image coding device and method
US20230041024A1 (en) Image coding device and method
US20230046583A1 (en) Virtual boundary-based image coding device and method
US20230046209A1 (en) Filtering-based image coding device and method
CN115004709A (zh) 用于发信号通知切片相关信息的方法和装置
CN115004708A (zh) 用于发信号通知图像信息的方法和设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination