CN115668932A - 图像解码方法和用于该图像解码方法的装置 - Google Patents

图像解码方法和用于该图像解码方法的装置 Download PDF

Info

Publication number
CN115668932A
CN115668932A CN202180035728.6A CN202180035728A CN115668932A CN 115668932 A CN115668932 A CN 115668932A CN 202180035728 A CN202180035728 A CN 202180035728A CN 115668932 A CN115668932 A CN 115668932A
Authority
CN
China
Prior art keywords
picture
dpb
current
output
variable
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180035728.6A
Other languages
English (en)
Inventor
亨得利·亨得利
金昇焕
S·帕鲁利
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Publication of CN115668932A publication Critical patent/CN115668932A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/423Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation characterised by memory arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

根据本文献的一种由解码装置执行的图像解码方法包括以下步骤:基于当前图片是否是作为不是访问单元(AU)0的编码视频序列开始访问单元(CVSS AU)的当前AU的第一图片来推导变量的值,其中,所述变量指示解码图片缓冲器(DPB)内的所有图片存储缓冲器是否被清空而没有输出;基于所述变量来更新所述DPB;以及基于更新后的所述DPB来解码所述当前图片。

Description

图像解码方法和用于该图像解码方法的装置
技术领域
本公开涉及图像编码技术,并且更具体地,涉及用于在图像编码系统中执行DPB管理过程的图像解码方法和设备。
背景技术
近来,在各种领域中,对诸如HD(高清)图像和UHD(超高清)图像这样的高分辨率、高质量图像的需求正在增长。因为图像数据具有高分辨率和高质量,所以相对于传统图像数据,待传输的信息或比特的量增加。因此,当使用诸如传统有线/无线宽带线路这样的介质发送图像数据或者使用现有存储介质存储图像数据时,其传输成本和存储成本增加。
因此,需要用于有效地发送、存储和再现高分辨率高质量图像的信息的高效图像压缩技术。
发明内容
技术问题
本公开提供了用于提高图像编码效率的方法和设备。
本公开的另一技术挑战是提供用于执行DPB管理过程的方法和设备。
技术方案
根据本公开的实施方式,提供了一种由解码设备执行的图像解码方法。该方法包括以下步骤:基于当前图片是否是作为除了访问单元(AU)0之外的编码视频序列开始访问单元(CVSS AU)的当前AU的第一图片来推导变量的值;基于所述变量来更新所述DPB;以及基于更新后的所述DPB来解码所述当前图片。所述变量指示解码图片缓冲器(DPB)中的所有图片存储缓冲器是否被清空而没有输出。
根据本公开的另一实施方式,提供了一种用于执行图像解码的解码设备。所述解码设备包括:DPB,所述DPB用于基于当前图片是否是作为除了访问单元(AU)0之外的编码视频序列开始访问单元(CVSS AU)的当前AU的第一图片来推导变量的值并基于所述变量来更新所述DPB;以及预测器,所述预测器用于基于更新后的所述DPB来解码所述当前图片。所述变量指示解码图片缓冲器(DPB)中的所有图片存储缓冲器是否被清空而没有输出。
根据本公开的另一实施方式,提供了一种由编码设备执行的图像编码方法。所述方法包括以下步骤:基于当前图片是否是作为除了访问单元(AU)0之外的编码视频序列开始访问单元(CVSS AU)的当前AU的第一图片来推导变量的值;基于所述变量来更新所述DPB;以及对所述当前图片的图像信息进行编码。所述变量指示解码图片缓冲器(DPB)中的所有图片存储缓冲器是否被清空而没有输出。
根据本公开的另一实施方式,提供了一种视频编码设备。所述编码设备包括:DPB,所述DPB用于基于当前图片是否是作为除了访问单元(AU)0之外的编码视频序列开始访问单元(CVSS AU)的当前AU的第一图片来推导变量的值并基于所述变量来更新所述DPB;以及熵编码器,所述熵编码器用于对所述当前图片的图像信息进行编码。所述变量指示解码图片缓冲器(DPB)中的所有图片存储缓冲器是否被清空而没有输出。
根据本公开的另一实施方式,提供了一种其中存储有包括致使图像解码方法被执行的图像信息的比特流的计算机可读数字存储介质。在计算机可读数字存储介质中,该图像解码方法包括以下步骤:基于当前图片是否是作为除了访问单元(AU)0之外的编码视频序列开始访问单元(CVSS AU)的当前AU的第一图片来推导变量的值;基于所述变量来更新所述DPB;以及基于更新后的所述DPB来解码所述当前图片。所述变量指示解码图片缓冲器(DPB)中的所有图片存储缓冲器是否被清空而没有输出。
技术效果
根据本公开,是否执行在DPB中去除图片而没有输出它们的过程可以在仅解码除了AU 0之外的CVSS AU的第一图片之前确定,而非在解码除了AU 0之外的CVSS AU的所有图片之前确定。通过这样,可以不针对每个图片改变影响CVS中所有层的DPB状态,并且可以提高编码效率。
根据本公开,指示是否去除DPB中的图片而没有输出的变量可以在仅解码除了AU0之外的CVSS AU的第一图片之前确定,而非在解码除了AU 0之外的CVSS AU的所有图片之前确定。通过这样,可以不针对每个图片改变影响CVS中所有层的DPB状态,并且可以提高编码效率。
附图说明
图1简要例示了适用本公开的实施方式的视频/图像编码装置的示例。
图2是例示了可以应用本公开的实施方式的视频/图像编码设备的配置的示意图。
图3是例示了可以应用本公开的实施方式的视频/图像解码设备的配置的示意图。
图4示例性例示了根据本公开的实施方式的编码过程。
图5示例性例示了根据本公开的实施方式的解码过程。
图6示意性示出了根据本文献的由编码设备进行的图像编码方法。
图7示意性示出了根据本文献的用于执行图像编码方法的编码设备。
图8示意性示出了根据本文献的由解码设备进行的图像解码方法。
图9示意性示出了根据本文献的用于执行图像解码方法的解码设备。
图10例示了应用本公开的内容流传输系统的结构示图。
具体实施方式
本公开可以按各种形式进行修改,并且将在附图中描述和例示其具体实施方式。然而,这些实施方式并不旨在限制本公开。以下描述中使用的术语仅仅用于描述具体实施方式,而不旨在限制本公开。单数的表述包括复数的表述,只要它被清楚不同地读出即可。诸如“包括”和“具有”这样的术语旨在指示存在以下描述中使用的特征、数字、步骤、操作、元件、组件或其组合,因此应该理解,没有排除存在或添加一个或更多个不同特征、数字、步骤、操作、元件、组件或其组合的可能性。
此外,出于方便说明不同特定功能的目的,独立地绘制本公开中描述的图中的元件,这并不意味着这些元件是由独立硬件或独立软件实施的。例如,可以将这些元件中的两个或更多个元件组合,以形成单个元件,或者可以将一个元件分割为多个元件。在不脱离本公开的概念的情况下,其中元件被组合和/或分割的实施方式属于本公开。
下文中,将参考附图来详细地描述本公开的实施方式。另外,在整个附图中,类似的附图标记用于指示类似的元件,并且将省略对类似元件的相同描述。
图1简要例示了可应用本公开的实施方式的视频/图像编码装置的示例。
参照图1,视频/图像编码系统可以包括第一装置(源装置)和第二装置(接收在)。源装置可以经由数字存储介质或网络以文件或流的形式向接收装置发送编码视频/图像信息或数据。
源装置可以包括视频源、编码设备和发送器。接收装置可以包括接收器、解码设备和渲染器。编码设备可以称为视频/图像编码设备,并且解码设备可以称为视频/图像解码设备。发送器可以包括在编码设备中。接收器可以包括在解码设备中。渲染器可以包括显示器,并且显示器可以被配置为单独的装置或外部组件。
视频源可以通过捕获、合成或生成视频/图像的处理来获取视频/图像。视频源可以包括视频/图像捕获装置和/或视频/图像生成装置。视频/图像捕获装置可以包括例如一个或更多个相机、包括先前捕获的视频/图像的视频/图像档案等。视频/图像生成装置可以包括例如计算机、平板电脑和智能电话,并且可以(电子地)生成视频/图像。例如,可以通过计算机等生成虚拟视频/图像。在这种情况下,视频/图像捕获处理可以由生成相关数据的处理代替。
编码设备可以对输入的视频/图像进行编码。编码设备可以执行诸如预测、变换和量化的一系列过程,以实现压缩和编码效率。编码数据(编码视频/图像信息)能够以比特流的形式输出。
发送器可以通过数字存储介质或网络以文件或流的形式向接收装置的接收器发送以比特流形式输出的编码后的图像/图像信息或数据。数字存储介质可以包括诸如USB、SD、CD、DVD、蓝光、HDD、SSD等的各种存储介质。发送器可以包括用于通过预定文件格式生成媒体文件的元件,并且可以包括用于通过广播/通信网络进行发送的元件。接收器可以接收/提取比特流,并向解码装置发送接收到的比特流。
解码设备可以通过执行与编码设备的操作相对应的诸如反量化、逆变换和预测之类的一系列过程,来对视频/图像进行解码。
渲染器可以渲染解码后的视频/图像。可以通过显示器显示渲染后的视频/图像。
本公开涉及视频/图像编码。例如,本公开中公开的方法/实施方式可以应用于以通用视频编码(VVC)、EVC(基本视频编码)标准、AOMedia Video 1(AV1)标准、第二代音频视频编码标准(AVS2)或下一代视频/图像编码标准(例如,H.267或H.268等)中公开的方法H.267或H.268等)公开的方法。
本公开提出了视频/图像编码的各种实施方式,并且除非另外提到,否则这些实施方式可以彼此组合地执行。
在本公开中,视频可以是指随时间推移的一系列图像。图片通常是指表示特定时间区域中的一副图像的单元,并且子图片/切片/图块是编码时构成图片的一部分的单元。子图片/切片/图块可以包括一个或更多个编码树单元(CTU)。一个图片可以由一个或更多个子图片/切片/图块组成。一个图片可以由一个或更多个图块组组成。一个图块组可以包括一个或更多个图块。砖块(brick)可以表示图片中的图块内的CTU行的矩形区域。图块可以被分割成多个砖块,砖块中的每一个由图块内的一个或更多个CTU行组成。没有被分割成多个砖块的图块也可以称为砖块。砖块扫描是以下的分割图片的CTU的特定顺序排序:按砖块中的CTU光栅扫描对CTU进行排序,按图块的砖块的光栅扫描对图块内的砖块进行连续排序,并且按图片的图块的光栅扫描对图片中的图块进行连续排序。另外,子图片可以表示图片内的一个或更多个切片的矩形区域。即,子图片包含一齐覆盖图片的矩形区域的一个或更多个切片。图块是图片中的特定图块列和特定图块行内的CTU的矩形区域。图块列是高度等于图片的高度并且宽度由图片参数集中的语法元素指定的CTU的矩形区域。图块行是高度由图片参数集中的语法元素指定并且宽度等于图片宽度的CTU的矩形区域。图块扫描是以下的分割图片的CTU的特定顺序排序:按图块中的CTU光栅扫描对CTU进行连续排序,而按图片的图块的光栅扫描对图片中的图块进行连续排序。切片包括可以被排他性包含在单个NAL单元中的图片的整数个砖块。切片可以由要么多个完整图块组成要么仅一个图块的完整砖块的连续序列组成。在本公开中,可以将图块组与切片互换地使用。例如,在本公开中,图块组/图块组头可以被称为切片/切片头。
像素或画素(pel)可以意指构成一个图片(或图像)的最小单元。另外,“样本”可以被用作与像素对应的术语。样本通常可以表示像素或像素的值,可以仅表示亮度分量的像素/像素值,或仅表示色度分量的像素/像素值。
单元可以表示图像处理的基本单元。单元可以包括图片的特定区域和与该区域相关的信息中的至少一个。一个单元可以包括一个亮度块和两个色度(例如,cb、cr)块。在某些情况下,可以将单元与诸如块或区域这样的术语互换地使用。在通常情况下,M×N块可以包括M列N行的样本(或样本阵列)或变换系数的集合(或阵列)。
在本说明书中,“A或B”可以意指“仅A”、“仅B”或“A和B二者”。换句话说,在本说明书中,“A或B”可以被解释为“A和/或B”。例如,本文中的“A、B或C”意指“仅A”、“仅B”、“仅C”或“A、B和C中的任一个及任何组合”。
在本说明书中使用的斜杠(/)或逗号(,)可以意指“和/或”。例如,“A/B”可以意指“A和/或B”。相应地,“A/B”可以意指“仅A”、“仅B”或“A和B二者”。例如,“A、B、C”可以意指“A、B或C”。
在本说明书中,“A和B中的至少一个”可以意指“仅A”、“仅B”或“A和B二者”。另外,在本说明书中,表述“A或B中的至少一个”或“A和/或B中的至少一个”可以被解释为与“A和B中的至少一个”相同。
另外,在本说明书中,“A、B和C中的至少一个”意指“仅A”、“仅B”、“仅C”或“A、B和C的任何组合”。另外,“A、B或C中的至少一个”或“A、B和/或C中的至少一个”可以意指“A、B和C中的至少一个”。
另外,在本说明书中使用的括号可以意指“例如”。具体地,当指示“预测(帧内预测)”时,“帧内预测”可以被提议作为“预测”的示例。换句话说,本说明书中的“预测”不限于“帧内预测”,并且“帧内预测”可以被提议作为“预测”的示例。另外,即使当指示“预测(即,帧内预测)”时,“帧内预测”可以被提议作为“预测”的示例。
在本说明书中,在一个附图中被单独描述的技术特征可以被单独地实现或可以同时地实现。
创建以下附图以便说明本说明书的具体示例。由于在附图中描述的具体装置的名称或具体信号/消息/字段的名称是以示例的方式提出的,因此本说明书的技术特征不限于在以下附图中使用的具体名称。
图2是例示了可以应用本公开的实施方式的视频/图像编码设备的配置的示意图。下文中,视频编码设备可以包括图像编码设备。
参照图2,编码设备200包括图像分割器210、预测器220、残差处理器230和熵编码器240、加法器250、滤波器260和存储器270。预测器220可以包括帧间预测器221和帧内预测器222。残差处理器230可以包括变换器232、量化器233、反量化器234和逆变换器235。残差处理器230还可以包括减法器231。加法器250可以称为重构器或重构块生成器。根据实施方式,图像分割器210、预测器220、残差处理器230、熵编码器240、加法器250和滤波器260可以由至少一个硬件组件(例如,编码器芯片组或处理器)构成。另外,存储器270可以包括解码图片缓冲器(DPB)或者可以由数字存储介质构成。硬件组件还可以包括作为内部/外部组件的存储器270。
图像分割器210可以将输入到编码设备200的输入图像(或图片或帧)分割到一个或更多个处理器中。例如,处理器可以被称为编码单元(CU)。在这种情况下,可以根据四叉树二叉树三叉树(QTBTTT)结构从编码树单元(CTU)或最大编码单元(LCU)来递归地分割编码单元。例如,一个编码单元可以基于四叉树结构、二叉树结构和/或三元结构而被分割为深度更深的多个编码单元。在这种情况下,例如,可以首先应用四叉树结构,随后可以应用二叉树结构和/或三元结构。可替选地,可以首先应用二叉树结构。可以基于不再分割的最终编码单元来执行根据本公开的编码过程。在这种情况下,可以根据图像特性基于编码效率将最大编码单元用作最终编码单元,或者如果需要,可以将编码单元递归地分割为深度更深的编码单元并且具有最佳大小的编码单元可以用作最终编码单元。这里,编码过程可以包括预测、变换和重构的过程,这将在后面描述。作为另一示例,处理器还可以包括预测单元(PU)或变换单元(TU)。在这种情况下,可以从上述最终编码单元来分离或分割预测单元和变换单元。预测单元可以是样本预测的单元,并且变换单元可以是用于推导变换系数的单元和/或用于从变换系数推导残差信号的单元。
在一些情况下,单元可以与诸如块或区域的术语互换使用。在一般情况下,M×N块可以表示由M列和N行组成的样本或变换系数的集合。样本通常可以表示像素或像素值,可以仅表示亮度分量的像素/像素值,或者仅表示色度分量的像素/像素值。样本可以用作与像素或画素的一幅图片(或图像)相对应的术语。
在编码设备200中,从输入图像信号(原始块、原始样本阵列)中减去从帧间预测器221或帧内预测器222输出的预测信号(预测块、预测样本阵列),以生成残差信号(残差块、残差样本阵列)并且所生成的残差信号被发送到变换器232。在这种情况下,如图所示,在编码设备200中用于从输入图像信号(原始块、原始样本阵列)减去预测信号(预测块、预测样本阵列)的单元可以称为减法器231。预测器可以对要处理的块(在下文中称为当前块)执行预测,并生成包括当前块的预测样本的预测块。预测器能够以当前块或CU为基础来确定是应用帧内预测还是应用帧间预测。如稍后在每个预测模式的描述中所述,预测器可以生成与预测有关的、诸如预测模式信息之类的各种信息,并向熵编码器240发送所生成的信息。关于预测的信息可以在熵编码器240中编码并以比特流的形式输出。
帧内预测器222可以通过参考当前图片中的样本来预测当前块。根据预测模式,参考的样本可以位于当前块的附近,或者可以远离当前块。在帧内预测中,预测模式可以包括多个非定向模式和多个定向模式。非定向模式可以包括例如DC模式和平面模式。根据预测方向的详细程度,定向模式可以包括例如33个定向预测模式或65个定向预测模式。然而,这仅是示例,依据设置,可以使用更多或更少的定向预测模式。帧内预测器222可以通过使用应用于邻近块的预测模式来确定应用于当前块的预测模式。
帧间预测器221可以基于由参照图片上的运动向量指定的参考块(参考样本阵列)来推导当前块的预测块。这里,为了减少在帧间预测模式下发送的运动信息的量,可以基于邻近块和当前块之间的运动信息的相关性,以块、子块或样本为单位来预测运动信息。运动信息可以包括运动向量和参照图片索引。运动信息还可包括帧间预测方向(L0预测、L1预测、Bi预测等)信息。在帧间预测的情况下,邻近块可以包括存在于当前图片中的空间邻近块和存在于参照图片中的时间邻近块。包括参考块的参照图片和包括时间邻近块的参照图片可以相同或不同。时间邻近块可以称为并置参考块、共位CU(colCU)等,并且包括时间邻近块的参照图片可以称为并置图片(colPic)。例如,帧间预测器221可以基于邻近块来配置运动信息候选列表,并且生成指示使用哪个候选来推导当前块的运动向量和/或参照图片索引的信息。可以基于各种预测模式来执行帧间预测。例如,在跳过模式和合并模式的情况下,帧间预测器221可以将邻近块的运动信息用作当前块的运动信息。在跳过模式下,与合并模式不同,可能无法发送残差信号。在运动向量预测(MVP)模式的情况下,可以将邻近块的运动向量用作运动向量预测子,并且可以通过发信号通知运动向量差来指示当前块的运动向量。
预测器220可以基于以下描述的各种预测方法来生成预测信号。例如,预测器不仅可以应用帧内预测或帧间预测来预测一个块,而且可以同时应用帧内预测和帧间预测这二者。这可以称为帧间帧内组合预测(CIIP)。另外,预测器可以基于帧内块复制(IBC)预测模式或调色板模式来预测块。IBC预测模式或调色板模式可用于游戏等的内容图像/视频编码,例如,屏幕内容编码(SCC)。IBC基本上在当前图片中执行预测,但是可以类似于帧间预测来执行IBC,因为参考块是在当前图片中推导的。即,IBC可以使用本公开中描述的帧间预测技术中的至少一种。调色板模式可以被视为帧内编码或帧内预测的示例。当应用调色板模式时,可以基于关于调色板表和调色板索引的信息来发信号通知图片内的样本值。
由预测器(包括帧间预测器221和/或帧内预测器222)生成的预测信号可以用于生成重构信号或生成残差信号。变换器232可以通过向残差信号应用变换技术来生成变换系数。例如,变换技术可以包括离散余弦变换(DCT)、离散正弦变换(DST)、karhunen-loève变换(KLT)、基于图的变换(GBT)或条件非线性变换(CNT)中的至少一种。这里,GBT表示当像素之间的关系信息由图表示时从图获得的变换。CNT是指基于使用所有先前重构的像素生成的预测信号而生成的变换。另外,变换处理可以应用于具有相同大小的正方形像素块,或者可以应用于具有可变大小而非正方形的块。
量化器233可以对变换系数进行量化,并且将它们发送给熵编码器240,并且熵编码器240可以对量化信号(关于量化变换系数的信息)进行编码并且输出比特流。关于量化变换系数的信息可以称为残差信息。量化器233可以基于系数扫描顺序将块类型量化变换系数重新布置为一维向量形式,并且基于一维向量形式的量化变换系数来生成关于量化变换系数的信息。可以生成关于变换系数的信息。熵编码器240可以执行各种编码方法,诸如,例如指数哥伦布(Golomb)、上下文自适应可变长度编码(CAVLC)、上下文自适应二进制算术编码(CABAC)等。熵编码器240可以对除了量化变换系数以外的视频/图像重构所需的信息(例如,语法元素的值等)一起或分开地进行编码。能够以比特流的形式以NAL(网络抽象层)为单位发送或存储编码信息(例如,编码视频/图像信息)。视频/图像信息还可以包括关于诸如自适应参数集(APS)、图片参数集(PPS)、序列参数集(SPS)或视频参数集(VPS)之类的各种参数集的信息。另外,视频/图像信息还可包括一般约束信息。在本公开中,从编码设备向解码设备发送/发信号通知的信息和/或语法元素可以包括在视频/图片信息中。视频/图像信息可以通过上述编码过程被编码并且被包括在比特流中。比特流可以通过网络发送,或者可以存储在数字存储介质中。网络可以包括广播网络和/或通信网络,并且数字存储介质可以包括诸如USB、SD、CD、DVD、蓝光、HDD、SSD等的各种存储介质。可以包括发送从熵编码器240输出的信号的发送器(未示出)和/或存储该信号的存储单元(未示出)作为编码设备200的内部/外部元件,并且可替选地,发送器可以包括在熵编码器240中。
从量化器233输出的量化变换系数可以用于生成预测信号。例如,可以通过利用反量化器234和逆变换器235对量化变换系数应用反量化和逆变换,来重构残差信号(残差块或残差样本)。加法器250将重构的残差信号与从帧间预测器221或帧内预测器222输出的预测信号相加,以生成重构信号(重构图片、重构块、重构样本阵列)。如果要处理的块没有残差(诸如应用了跳过模式的情况),则可以将预测块用作重构块。加法器250可以称为重构器或重构块生成器。所生成的重构信号可以用于在当前图片中要处理的下一块的帧内预测,并且可以通过如下所述的滤波用于下一图片的帧间预测。
此外,在图片编码和/或重构期间,可以应用亮度映射与色度缩放(LMCS)。
滤波器260可以通过对重构信号应用滤波来改善主观/客观图像质量。例如,滤波器260可以通过对重构图片应用各种滤波方法来生成修改后的重构图片,并将修改后的重构图片存储在存储器270(具体地,存储器270的DPB)中。各种滤波方法可包括例如去块滤波、样本自适应偏移、自适应环路滤波器、双边滤波器等。滤波器260可以生成与滤波有关的各种信息,并且将生成的信息发送给熵编码器240,如稍后在各种滤波方法的描述中所述。与滤波有关的信息可以由熵编码器240编码并且以比特流的形式输出。
发送给存储器270的修改后的重构图片可以用作帧间预测器221中的参照图片。当通过编码设备应用帧间预测时,可以避免编码设备200与解码设备之间的预测不匹配,并且可以提高编码效率。
存储器270的DPB可以存储用作帧间预测器221中的参照图片的修改后的重构图片。存储器270可以存储从中推导(或编码)当前图片中的运动信息的块的运动信息和/或图片中已重构的块的运动信息。所存储的运动信息可以发送给帧间预测器221,并且用作空间邻近块的运动信息或时间邻近块的运动信息。存储器270可以存储当前图片中的重构块的重构样本,并且可以将重构样本传送给帧内预测器222。
图3是例示了可以应用本公开的实施方式的视频/图像解码设备的配置的示意图。
参照图3,解码设备300可以包括熵解码器310、残差处理器320、预测器330、加法器340、滤波器350、存储器360。预测器330可以包括帧间预测器332和帧内预测器331。残差处理器320可以包括反量化器321和逆变换器322。根据实施方式,熵解码器310、残差处理器320、预测器330、加法器340和滤波器350可以由硬件组件(例如,解码器芯片组或处理器)构成。另外,存储器360可以包括解码图片缓冲器(DPB),或者可以由数字存储介质构成。硬件组件还可以包括存储器360作为内部/外部组件。
当输入包括视频/图像信息的比特流时,解码设备300可以与在图2的编码设备中处理视频/图像信息的处理相对应地重构图像。例如,解码设备300可以基于从比特流获得的块分割相关信息来推导单元/块。解码设备300可以使用在编码设备中应用的处理器来执行解码。因此,解码的处理器可以是例如编码单元,并且可以根据四叉树结构、二叉树结构和/或三叉树结构,从编码树单元或最大编码单元对编码单元进行分割。可以从编码单元推导一个或更多个变换单元。可以通过再现装置来再现通过解码设备300解码并输出的重构图像信号。
解码设备300可以接收以比特流形式从图2的编码设备输出的信号,并且可以通过熵解码器310对接收到的信号进行解码。例如,熵解码器310可以解析比特流,以推导图像重构(或图片重构)所需的信息(例如,视频/图像信息)。视频/图像信息还可以包括关于诸如自适应参数集(APS)、图片参数集(PPS)、序列参数集(SPS)或视频参数集(VPS)之类的各种参数集的信息。另外,视频/图像信息还可以包括一般约束信息。解码设备还可以基于关于参数集的信息和/或一般约束信息来对图片进行解码。本公开中稍后描述的发信号通知的/接收的信息和/或语法元素可以通过解码过程被解码,并从比特流中获取。例如,熵解码器310基于诸如指数哥伦布编码、CAVLC或CABAC之类的编码方法对比特流中的信息进行解码,并输出图像重构所需的语法元素和残差的变换系数的量化值。更具体地,CABAC熵解码方法可以接收与比特流中的每个语法元素相对应的bin,使用解码目标语法元素信息、解码目标块的解码信息或在先前级中解码的符号/bin的信息来确定上下文模型,并通过根据所确定的上下文模型预测bin的出现概率来对该bin进行算术解码,并且生成与每个语法元素的值相对应的符号。在这种情况下,在确定上下文模型之后,CABAC熵解码方法可以通过将经解码的符号/bin的信息用于下一符号/bin的上下文模型来更新上下文模型。由熵解码器310解码的信息之中与预测有关的信息可以提供给预测器(帧间预测器332和帧内预测器331),并且在熵解码器310中对其执行了熵解码的残差值(也就是说,量化变换系数和相关参数信息)可以被输入到残差处理器320。残差处理器320可以推导残差信号(残差块、残差样本、残差样本阵列)。另外,由熵解码器310解码的信息之中关于滤波的信息可以提供给滤波器350。此外,用于接收从编码设备输出的信号的接收器(未示出)可以进一步被配置为解码设备300的内部/外部元件,或者接收器可以是熵解码器310的组件。此外,根据本公开的解码设备可以称为视频/图像/图片解码设备,并且解码设备可以分类为信息解码器(视频/图像/图片信息解码器)和样本解码器(视频/图像/图片样本解码器)。信息解码器可以包括熵解码器310,并且样本解码器可以包括反量化器321、逆变换器322、加法器340、滤波器350、存储器360、帧间预测器332和帧内预测器331中的至少一个。
反量化器321可以对量化变换系数进行反量化并且输出变换系数。反量化器321能够以二维块的形式重新布置量化变换系数。在这种情况下,可以基于在编码设备中执行的系数扫描顺序来执行重新布置。反量化器321可以通过使用量化参数(例如,量化步长信息)对量化变换系数执行反量化,并且获得变换系数。
逆变换器322对变换系数进行逆变换以获得残差信号(残差块、残差样本阵列)。
预测器可以对当前块执行预测,并生成包括当前块的预测样本的预测块。预测器可以基于从熵解码器310输出的关于预测的信息来确定向当前块应用帧内预测还是帧间预测,并且可以确定具体的帧内/帧间预测模式。
预测器可以基于以下描述的各种预测方法来生成预测信号。例如,预测器不仅可以应用帧内预测或帧间预测来预测一个块,而且可以同时应用帧内预测和帧间预测。这可以称为帧间和帧内组合预测(CIIP)。另外,预测器可以基于帧内块复制(IBC)预测模式或调色板模式来预测块。IBC预测模式或调色板模式可以用于游戏等的内容图像/视频编码,例如,屏幕内容编码(SCC)。IBC基本上在当前图片中执行预测,但是可以类似于帧间预测来执行IBC,因为在当前图片中推导参考块。即,IBC可以使用本公开中描述的帧间预测技术中的至少一种。调色板模式可以被视为帧内编码或帧内预测的示例。当应用调色板模式时,可以基于关于调色板表和调色板索引的信息来发信号通知图片内的样本值。
帧内预测器331可以通过参考当前图片中的样本来预测当前块。根据预测模式,参考的样本可以位于当前块的附近,或者可以远离当前块。在帧内预测中,预测模式可以包括多个非定向模式和多个定向模式。帧内预测器331可以通过使用应用于邻近块的预测模式来确定应用于当前块的预测模式。
帧间预测器332可以基于参照图片上的由运动向量指定的参考块(参考样本阵列)来推导当前块的预测块。在这种情况下,为了减少在帧间预测模式中发送的运动信息的量,可以基于邻近块和当前块之间的运动信息的相关性,以块、子块或样本为单位来预测运动信息。运动信息可以包括运动向量和参照图片索引。运动信息还可包括帧间预测方向(L0预测、L1预测、Bi预测等)信息。在帧间预测的情况下,邻近块可以包括存在于当前图片中的空间邻近块和存在于参照图片中的时间邻近块。例如,帧间预测器332可以基于邻近块来配置运动信息候选列表,并基于接收到的候选选择信息来推导当前块的运动向量和/或参照图片索引。可以基于各种预测模式来执行帧间预测,并且关于预测的信息可以包括指示针对当前块的帧间预测的模式的信息。
加法器340可以通过将所获得的残差信号与从预测器(包括帧间预测器332和/或帧内预测器331)输出的预测信号(预测块、预测样本阵列)相加来生成重构信号(重构图片、重构块、重构样本阵列)。如果要处理的块没有残差(例如当应用跳过模式时),则可以将预测块用作重构块。
加法器340可以称为重构器或重构块生成器。所生成的重构信号可以用于当前图片中要处理的下一块的帧内预测,可以通过如下所述的滤波输出,或者可以用于下一图片的帧间预测。
此外,在图片解码过程中可以应用亮度映射与色度缩放(LMCS)。
滤波器350可以通过向重构信号应用滤波来改善主观/客观图像质量。例如,滤波器350可以通过对重构图片应用各种滤波方法来生成修改后的重构图片,并将修改后的重构图片存储在存储器360(具体地,存储器360的DPB)中。各种滤波方法可包括例如去块滤波、样本自适应偏移、自适应环路滤波器、双边滤波器等。
存储器360的DPB中存储的(修改后的)重构图片可以用作帧间预测器332中的参照图片。存储器360可以存储从中推导(或解码)当前图片中的运动信息的块的运动信息和/或图片中已重构的块的运动信息。所存储的运动信息可以发送给帧间预测器332,以作为空间邻近块的运动信息或时间邻近块的运动信息来利用。存储器360可以存储当前图片中的重构块的重构样本,并且可以将重构样本传送给帧内预测器331。
在本公开中,在编码设备200的滤波器260、帧间预测器221和帧内预测器222中描述的实施方式可以与解码设备300的滤波器350、帧间预测器332和帧内预测器331相同或者分别被应用以对应于解码设备300的滤波器350、帧间预测器332和帧内预测器331。相同的内容也可以应用于帧间预测器332和帧内预测器331。
在本公开中,可以省略量化/逆量化和/或变换/逆变换中的至少一种。当省略量化/逆量化时,量化的变换系数可以被称为变换系数。当省略变换/逆变换时,变换系数可以被称为系数或残差系数,或者为了表达的统一性,仍可以被称为变换系数。
在本公开中,量化变换系数和变换系数可以分别被称为变换系数和缩放变换系数。在这种情况下,残差信息可以包括关于变换系数的信息,并且可以通过残差编码语法发信号通知关于变换系数的信息。可以基于残差信息(或关于变换系数的信息)推导变换系数,并且可以通过对变换系数逆变换(缩放)来推导缩放变换系数。可以基于对缩放变换系数逆变换(变换)来推导残差样本。这也可以在本公开的其他部分中应用/表达。
此外,可以执行解码图片缓冲器(DPB)中的图片输出和去除过程。视频/图像编码系统的现有VVC标准中的解码图片缓冲器(DPB)中的图片输出和去除过程可以如下表中所示。
[表1]
Figure BDA0003946056620000141
Figure BDA0003946056620000151
Figure BDA0003946056620000152
Figure BDA0003946056620000161
Figure BDA0003946056620000162
Figure BDA0003946056620000171
例如,根据视频/图像编码系统的VVC标准,在解码当前图片之前(但在解析当前图片的第一切片的切片头之后),如上表中公开的,可以针对每个图片调用一次图片输出过程。
另外,例如,参照表1,当当前访问单元(AU)是除了AU 0之外的编码视频序列开始AU(CVSS AU)时,可以应用以下顺序的步骤。
-首先,对于待测试解码器,可以如下地推导变量NoOutputOfPriorPicsFlag。
-当针对当前AU推导的PicWidthMaxInSamplesY、PicHeightMaxInSamplesY、MaxChromaFormat、MaxBitDepthMinus8或max_dec_pic_buffering_minus1[Htid]的值不同于针对先前AU推导的的PicWidthMaxInSamplesY、PicHeightMaxInSamplesY、MaxChromaFormat、MaxBitDepthMinus8或max_dec_pic_buffering_minus1[Htid]的值时,NoOutputOfPriorPicsFlag可以被待测试解码器设置为等于1,不管当前AU的ph_no_output_of_prior_pics_flag的值如何。
-否则,NoOutputOfPriorPicsFlag可以被设置为等于当前AU的ph_no_output_of_prior_pics_flag的值。
-其次,针对待测试解码器推导的变量NoOutputOfPriorPicsFlag可以应用于假想参考解码器(HRD)。因此,当NoOutputOfPriorPicsFlag的值为1时,DPB的所有图片存储缓冲器可以被清空而没有输出它们包含的图片,并且DPB充满度可以被设置为0。
另外,例如,参照表1,当以下所有条件对于DPB的任何图片k为真时,可以从DPB去除DPB的所有这种图片k。
-图片k被标记为“不用于参考”。
-图片k具有等于0的PictureOutputFlag或者图片k的DPB输出时间少于或等于当前图片n的第一解码单元(DU)(表示为DU m)的CPB去除时间;即,DpbOutputTime[k]小于或等于DuCpbRemovalTime[m]。
另外,例如,参照表1,当当前访问单元(AU)是除了AU 0之外的编码视频序列开始AU(CVSS AU)时,可以应用以下顺序的步骤。
-首先,对于待测试解码器,可以如下地推导变量NoOutputOfPriorPicsFlag。
-当针对当前AU推导的PicWidthMaxInSamplesY、PicHeightMaxInSamplesY、MaxChromaFormat、MaxBitDepthMinus8或max_dec_pic_buffering_minus1[Htid]的值不同于针对先前AU推导的PicWidthMaxInSamplesY、PicHeightMaxInSamplesY、MaxChromaFormat、MaxBitDepthMinus8或max_dec_pic_buffering_minus1[Htid]的值时,NoOutputOfPriorPicsFlag可以被待测试解码器设置为等于1,不管当前AU的ph_no_output_of_prior_pics_flag的值如何。
-否则,NoOutputOfPriorPicsFlag可以被设置为等于当前AU的ph_no_output_of_prior_pics_flag的值。
-其次,针对待测试解码器推导的变量NoOutputOfPriorPicsFlag可以如下地应用于HRD(假想参考解码器)。
-例如,当NoOutputOfPriorPicsFlag的值为1时,DPB的所有图片存储缓冲器可以被清空而没有输出它们包含的图片,并且DPB充满度可以被设置为0。
-否则(即,当NoOutputOfPriorPicsFlag的值为0时),DPB中包含被标记为“不需要输出”和“不用于参考”的图片的所有图片存储缓冲器可以被清空(而没有输出),并且DPB中的所有非空图片存储缓冲器可以通过重复调用(VVC标准的)条款C.5.2.4中指定的“凹凸(bumping)”过程来清空,并且DPB充满度可以被设置为0。
此外,凹凸过程可以由以下顺序的步骤组成。
1.在标记为“需要输出”的DPB的所有图片当中,首先输出的一个图片(或多个图片)可以被选定为具有最小PicOrderCntVal值的图片。
2.可以使用用于图片的一致裁剪窗口来裁剪按升序的nuh_layer_id次序的图片中的每一个,可以输出裁剪的图片,并且可以将图片标记为“不需要输出”。
3.包含被标记为“不用于参考”并且是裁剪和输出的图片之一的图片的每个图片存储缓冲器可以被清空,并且DPB的充满度可以递减1。
另外,例如,参照表1,当当前AU不是CVSS AU时,包含被标记为“不需要输出”和“不用于参考”的图片的所有图片存储缓冲器可以被清空(而没有输出)。对于每个图片存储缓冲器,DPB充满度可以递减1。另外,当下述条件中的一个或更多个为真时,可以重复调用(VVC标准的)条款C.5.2.4中指定的“凹凸”过程,同时对于被清空的每个附加图片存储缓冲器将DPB充满度进一步递减1,直到以下条件都不为真。
-DPB中的标记为“需要输出”的图片的数目大于max_num_reorder_pics[Htid]。
-max_latency_increase_plus1[Htid]不等于0,并且DPB中至少有一个被标记为“需要输出”并且其关联的变量PicLatencyCount大于或等于MaxLatencyPictures[Htid]的图片。
-DPB中的图片数目大于或等于max_dec_pic_buffering_minus1[Htid]+1。
另一方面,现有的用于上述图片输出和去除过程的VVC标准可能具有以下问题。
例如,首先,在对图片的所有切片进行解码之后,可以将图片标记为“用于短期参考”。因此,当图片被解码时,图片在DPB中不能处于清除状态。结果,DPB的图片存储数目可能受影响。
其次,可能在凹凸过程期间执行图片的输出状态(即,需要输出)的指派。根据现有的VVC标准,对于作为编码视频序列开始AU的AU的图片,不能调用该过程。据此,不能初始化与对应图片相关的PicLatencyCount的值。
如上所述,在DPB中输出和去除图片的过程可以每个图片被调用一次,但该过程可能影响供CVS的所有层共享的DPB的状态(即,存储在DPB中的图片的状态)。考虑到以上事实,基于NoOutputOfPriorPicsFlag的值从DPB推导NoOutputOfPriorPicsFlag并去除图片的过程可能有问题。根据现有的视频/图像标准,对于除了AU 0之外的CVSS AU的所有图片,可以调用基于标志(即,NoOutputOfPriorPicsFlag)的值从DPB推导和去除图片的过程。如上所述过程的执行可能仅对于第一张图片是可以的。从第二图片开始的过程可能在输出先前图片(即,按解码顺序的先前顺序的图片)之前从DPB中去除先前图片。该行为可以不是正确解码器行为。
相应地,本公开提出了一种上述问题的解决方案。所提出的实施方式可以被独立地或组合地应用。
作为示例,推导指示是否从DPB去除参考图片而没有输出它的标志或变量的值的过程可以每个访问单元(AU)仅调用一次。即,例如,可以提出使得推导指示是否去除DPB的参考图片而没有输出它的标志或变量的值的过程每个访问单元(AU)仅调用一次的方法。这里,变量可以是NoOutputOfPriorPicsFlag。
另外,作为示例,可以在编码视频序列开始AU(CVSS AU)中的第一图片的解码过程之前但在解析当前图片的第一切片的切片头之后,调用推导NoOutputOfPriorPicsFlag的值的过程。即,例如,可以提出以下方法:在CVSS AU的第一图片的解码过程之前但在解析当前图片的第一切片的切片头之后,执行推导NoOutputOfPriorPicsFlag的值的过程。
另外,作为示例,当NoOutputOfPriorPicsFlag为1时,去除存储在DPB中的图片而没有输出它的过程可以每个AU仅调用一次。即,例如,当NoOutputOfPriorPicsFlag为1时,可以提出去除存储在DPB中的图片而没有输出它的过程每个AU仅调用一次。
另外,作为示例,当NoOutputOfPriorPicsFlag为1时,在CVSS AU中的第一图片的解码过程之前但在解析当前图片的第一切片的切片头之后,可以调用去除存储在DPB中的图片而没有输出它的过程。即,例如,当NoOutputOfPriorPicsFlag为1时,可以提出以下方法:在CVSS AU中的第一图片的解码过程之前但在解析当前图片的第一切片的切片头之后,调用去除存储在DPB中的图片而没有输出它的过程。
另外,作为示例,上述实施方式中的图片去除可以不包括DPB中的当前图片去除。即,例如,可以提出以上实施方式中的图片去除不包括DPB中的当前图片去除的方法。
上述实施方式可以被如下地实现。例如,上述实施方式可以基于VVC标准规范来表示,如下所述。
[表2]
Figure BDA0003946056620000201
Figure BDA0003946056620000211
Figure BDA0003946056620000212
Figure BDA0003946056620000221
Figure BDA0003946056620000222
Figure BDA0003946056620000231
例如,参照表2,当当前图片是第一图片并且当前AU(即,包括当前图片的AU)是除了AU 0之外的编码视频序列开始AU(CVSS AU)时,可以应用以下顺序的步骤。
-首先,对于待测试解码器,可以如下地推导变量NoOutputOfPriorPicsFlag。
-当针对当前AU推导的PicWidthMaxInSamplesY、PicHeightMaxInSamplesY、MaxChromaFormat、MaxBitDepthMinus8或max_dec_pic_buffering_minus1[Htid]的值不同于针对先前AU推导的PicWidthMaxInSamplesY、PicHeightMaxInSamplesY、MaxChromaFormat、MaxBitDepthMinus8或max_dec_pic_buffering_minus1[Htid]的值时,NoOutputOfPriorPicsFlag可以被待测试解码器设置为等于1,不管当前AU的ph_no_output_of_prior_pics_flag的值如何。
-否则,NoOutputOfPriorPicsFlag可以被设置为等于当前AU的ph_no_output_of_prior_pics_flag的值。
-其次,针对待测试解码器推导的变量NoOutputOfPriorPicsFlag可以应用于假想参考解码器(HRD)。因此,当NoOutputOfPriorPicsFlag的值为1时,DPB的所有图片存储缓冲器可以被清空而没有输出它们包含的图片,并且DPB充满度可以被设置为0。
另外,例如,参照表2,当当前AU不是CVSS AU或者当前AU是除了AU 0之外的CVSSAU但当前图片不是当前AU中的第一图片时以及当以下所有条件对于DPB中的任何图片k为真时,DPB中的所有这种图片k都被可以从DPB中去除。
-图片k被标记为“不用于参考”。
-图片k具有等于0的PictureOutputFlag或者图片k的DPB输出时间少于或等于当前图片n的第一解码单元(DU)(表示为DU m)的CPB去除时间;即,DpbOutputTime[k]小于或等于DuCpbRemovalTime[m]。
另外,例如,参照表2,当当前图片是第一图片并且当前AU(即,包括当前图片的AU)是除了AU 0之外的编码视频序列开始AU(CVSS AU)时,可以应用以下顺序的步骤。
-首先,对于待测试解码器,可以如下地推导变量NoOutputOfPriorPicsFlag。
-当针对当前AU推导的PicWidthMaxInSamplesY、PicHeightMaxInSamplesY、MaxChromaFormat、MaxBitDepthMinus8或max_dec_pic_buffering_minus1[Htid]的值不同于针对先前AU推导的的PicWidthMaxInSamplesY、PicHeightMaxInSamplesY、MaxChromaFormat、MaxBitDepthMinus8或max_dec_pic_buffering_minus1[Htid]的值时,NoOutputOfPriorPicsFlag可以被待测试解码器设置为等于1,不管当前AU的ph_no_output_of_prior_pics_flag的值如何。
-否则,NoOutputOfPriorPicsFlag可以被设置为等于当前AU的ph_no_output_of_prior_pics_flag的值。
-其次,针对待测试解码器推导的变量NoOutputOfPriorPicsFlag可以如下地应用于假想参考解码器(HRD)。
-例如,当NoOutputOfPriorPicsFlag的值为1时,DPB的所有图片存储缓冲器可以被清空而没有输出它们包含的图片,并且DPB充满度可以被设置为0。
-否则(即,当NoOutputOfPriorPicsFlag的值为0时),DPB中包含被标记为“不需要输出”和“不用于参考”的图片的所有图片存储缓冲器可以被清空(而没有输出),并且DPB中的所有非空图片存储缓冲器可以通过重复调用(VVC标准的)条款C.5.2.4中指定的“凹凸”过程来清空,并且DPB充满度可以被设置为0。
另外,例如,参照表2,当当前AU不是CVSS AU时或者当前AU是除了AU 0之外的CVSSAU但当前图片不是当前AU的第一图片时,包含被标记为“不需要输出”和“不用于参考”的图片的所有图片存储缓冲器可以被清空(而没有输出)。对于被清空的每个图片存储缓冲器,DPB充满度可以递减1。另外,当下述条件中的一个或更多个为真时,可以重复调用(VVC标准的)条款C.5.2.4中指定的”凹凸”过程,同时对于被清空的每个附加图片存储缓冲器将DPB充满度进一步递减1,直到以下条件都不为真。
-DPB中的标记为“需要输出”的图片的数目大于max_num_reorder_pics[Htid]。
-max_latency_increase_plus1[Htid]不等于0,并且DPB中至少有一个被标记为“需要输出”并且其关联的变量PicLatencyCount大于或等于MaxLatencyPictures[Htid]的图片。
-DPB中的图片数目大于或等于max_dec_pic_buffering_minus1[Htid]+1。
另选地,上述实施方式可以被如下地实现。例如,上述实施方式可以基于VVC标准规范来表示,如下所述。
[表3]
Figure BDA0003946056620000251
Figure BDA0003946056620000261
Figure BDA0003946056620000262
Figure BDA0003946056620000271
Figure BDA0003946056620000272
例如,参照表3,当当前图片是当前AU的第一图片并且当前AU是除了AU 0之外的编码视频序列开始AU(CVSS AU)时,可以应用以下顺序的步骤。
-首先,对于待测试解码器,可以如下地推导变量NoOutputOfPriorPicsFlag。
-当针对当前AU推导的PicWidthMaxInSamplesY、PicHeightMaxInSamplesY、MaxChromaFormat、MaxBitDepthMinus8或max_dec_pic_buffering_minus1[Htid]的值不同于针对先前AU推导的的PicWidthMaxInSamplesY、PicHeightMaxInSamplesY、MaxChromaFormat、MaxBitDepthMinus8或max_dec_pic_buffering_minus1[Htid]的值时,NoOutputOfPriorPicsFlag可以被待测试解码器设置为等于1,不管当前AU的ph_no_output_of_prior_pics_flag的值如何。
-否则,NoOutputOfPriorPicsFlag可以被设置为等于当前AU的ph_no_output_of_prior_pics_flag的值。
-其次,针对待测试解码器推导的变量NoOutputOfPriorPicsFlag可以应用于假想参考解码器(HRD)。因此,当NoOutputOfPriorPicsFlag的值为1时,DPB的所有图片存储缓冲器可以被清空而没有输出它们包含的图片,并且DPB充满度可以被设置为0。
另外,例如,参照表3,当当前AU不是CVSS AU或者当前AU是除了AU 0之外的CVSSAU但当前图片不是当前AU的第一图片时以及当以下所有条件对于DPB中的任何图片k为真时,DPB中的所有这种图片k都被可以从DPB中去除。
-图片k被标记为“不用于参考”。
-图片k具有等于0的PictureOutputFlag或者图片k的DPB输出时间少于或等于当前图片n的第一解码单元(DU)(表示为DU m)的CPB去除时间;即,DpbOutputTime[k]小于或等于DuCpbRemovalTime[m]。
另外,例如,参照表3,当当前图片是第一图片并且当前访问单元(AU)是除了AU 0之外的编码视频序列开始AU(CVSS AU)时,可以应用以下顺序的步骤。
-首先,对于待测试解码器,可以如下地推导变量NoOutputOfPriorPicsFlag。
-当针对当前AU推导的PicWidthMaxInSamplesY、PicHeightMaxInSamplesY、MaxChromaFormat、MaxBitDepthMinus8或max_dec_pic_buffering_minus1[Htid]的值不同于针对先前AU推导的的PicWidthMaxInSamplesY、PicHeightMaxInSamplesY、MaxChromaFormat、MaxBitDepthMinus8或max_dec_pic_buffering_minus1[Htid]的值时,NoOutputOfPriorPicsFlag可以被待测试解码器设置为等于1,不管当前AU的ph_no_output_of_prior_pics_flag的值如何。
-否则,NoOutputOfPriorPicsFlag可以被设置为等于当前AU的ph_no_output_of_prior_pics_flag的值。
-其次,针对待测试解码器推导的变量NoOutputOfPriorPicsFlag可以如下地应用于假想参考解码器(HRD)。
-例如,当NoOutputOfPriorPicsFlag的值为1时,DPB的所有图片存储缓冲器可以被清空而没有输出它们包含的图片,并且DPB充满度可以被设置为0。
-否则(即,当NoOutputOfPriorPicsFlag的值为0时),DPB中包含被标记为“不需要输出”和“不用于参考”的图片的所有图片存储缓冲器可以被清空(而没有输出),并且DPB中的所有非空图片存储缓冲器可以通过重复调用(VVC标准的)条款C.5.2.4中指定的“凹凸”过程来清空,并且DPB充满度可以被设置为0。
另外,例如,参照表3,当当前AU不是CVSS AU或者当前AU是除了AU 0之外的CVSSAU但当前图片不是当前AU的第一图片时,包含被标记为“不需要输出”和“不用于参考”的图片的所有图片存储缓冲器可以被清空(而没有输出)。对于被清空的每个图片存储缓冲器,DPB充满度可以递减1。另外,当下述条件中的一个或更多个为真时,可以重复调用(VVC标准的)条款C.5.2.4中指定的”凹凸”过程,同时对于被清空的每个附加图片存储缓冲器将DPB充满度进一步递减1,直到以下条件都不为真。
-DPB中的标记为“需要输出”的图片的数目大于max_num_reorder_pics[Htid]。
-max_latency_increase_plus1[Htid]不等于0,并且DPB中至少有一个被标记为“需要输出”并且其关联的变量PicLatencyCount大于或等于MaxLatencyPictures[Htid]的图片。
-DPB中的图片数目大于或等于max_dec_pic_buffering_minus1[Htid]+1。
此外,例如,可以根据以下过程应用实施方式。可以省略将在稍后描述的过程的一个或更多个步骤。
图4示例性例示了根据本公开的实施方式的编码过程。
参照图4,编码设备对图片进行解码(恢复)(S400)。编码设备可以对当前AU的图片进行解码。
编码设备基于DPB参数来管理DPB(S410)。这里,DPB管理可以被称为DPB更新。DPB管理过程可以包括在DPB中标记和/或去除解码图片的过程。解码图片可以被用作后续图片的帧间预测的参考。即,解码图片可以被用作用于按解码顺序在后的图片的帧间预测的参考图片。每个解码图片可以基本上被插入到DPB中。另外,DPB通常可以在解码当前图片之前更新。当与DPB相关的层不是输出层(或者DPB参数与输出层不相关)并且是参考层时,DPB中的解码图片不能被输出。如果与DPB(或DPB参数)相关的层是输出层,则可以基于DPB和/或DPB参数来输出DPB中的解码图片。DPB管理可以包括从DPB输出解码图片。
编码设备对包括与DPB参数相关的信息的图像信息进行编码(S420)。与DPB参数相关的信息可以包括在上述实施方式中公开的信息/语法元素和/或在稍后将描述的表中公开的语法元素。
[表4]
Figure BDA0003946056620000301
例如,上述的表4可以表示包括用于待发信号通知的DPB参数的语法元素的视频参数集(VPS)。
用于上表4中示出的语法元素的语义可以如下。
[表5]
Figure BDA0003946056620000302
Figure BDA0003946056620000311
Figure BDA0003946056620000312
Figure BDA0003946056620000321
例如,语法元素vps_num_dpb_params可以指示VPS中的dpb_parameters()语法结构的数目。例如,vps_num_dpb_params的值可以在0至16的范围内。另外,当语法元素vps_num_dpb_params不存在时,语法元素vps_num_dpb_params的值可以被推断为等于0。
另外,例如,语法元素same_dpb_size_output_or_nonoutput_flag可以指示语法元素layer_nonoutput_dpb_params_idx[i]是否可以存在于VPS中。例如,当语法元素same_dpb_size_output_or_nonoutput_flag的值为1时,语法元素same_dpb_size_output_or_nonoutput_flag可以指示在VPS中不存在语法元素layer_nonoutput_dpb_params_idx[i],并且当语法元素same_dpb_size_output_or_nonoutput_flag的值为0时,语法元素same_dpb_size_output_or_nonoutput_flag可以指示语法元素layer_nonoutput_dpb_params_idx[i]可以存在于VPS中。
另外,例如,语法元素vps_sublayer_dpb_params_present_flag可以用于控制VPS的dpb_parameters()语法结构中的语法元素max_dec_pic_buffering_minus1[]、max_num_reorder_pics[]和max_latency_increase_plus1[]的存在。另外,当语法元素vps_sublayer_dpb_params_present_flag不存在时,语法元素vps_sublayer_dpb_params_present_flag的值可以被推断为等于0。
另外,例如,语法元素dpb_size_only_flag[i]可以指示语法元素max_num_reorder_pics[]和max_latency_increase_plus1[]是否可以存在于VPS的第i个dpb_parameters()语法结构中。例如,当语法元素dpb_size_only_flag[i]的值为1时,语法元素dpb_size_only_flag[i]可以指示语法元素max_num_reorder_pics[]和max_latency_increase_plus1[]不存在于VPS的第i个dpb_parameters()语法结构中。当语法元素dpb_size_only_flag[i]的值为0时,语法元素dpb_size_only_flag[i]可以指示语法元素max_num_reorder_pics[]和max_latency_increase_plus1[]可以存在于VPS的第i个dpb_parameters()语法结构中。
另外,例如,语法元素dpb_max_temporal_id[i]可以指示其中DPB参数可以存在于VPS中的第i个dpb_parameters()语法结构中的最高子层表示的TemporalId。另外,dpb_max_temporal_id[i]的值可以在0至vps_max_sublayers_minus1的范围内。另外,例如,当vps_max_sublayers_minus1的值为0时,dpb_max_temporal_id[i]的值可以被推断为0。另外,例如,当vps_max_sublayers_minus1的值大于0并且vps_all_layers_same_num_sublayers_flag为1时,dpb_max_temporal_id[i]的值可以被推断为等于vps_max_sublayers_minus1。
另外,例如,语法元素layer_output_dpb_params_idx[i]可以向VPS中的dpb_parameters()语法结构的列表指定应用于作为OLS的输出层的第i层的dpb_parameters()语法结构的索引。当存在语法元素layer_output_dpb_params_idx[i]时,语法元素layer_output_dpb_params_idx[i]的值可以在0至vps_num_dpb_params-1的范围内。
例如,当vps_independent_layer_flag[i]为1时,它可以是应用于作为输出层的第i层的dpb_parameters()语法结构层所参考的SPS中的dpb_parameters()语法结构。
另选地,例如,当vps_independent_layer_flag[i]为0时,可以应用以下内容。
-当vps_num_dpb_params为1时,layer_output_dpb_params_idx[i]的值可以被推断为0。
-比特流一致的要求是,layer_output_dpb_params_idx[i]的值使dpb_size_only_flag[layer_output_dpb_params_idx[i]]的值为0。
另外,例如,语法元素layer_nonoutput_dpb_params_idx[i]可以向VPS中的dpb_parameters()语法结构的列表指定应用于作为OLS的非输出层的第i层的dpb_parameters()语法结构的索引。当存在语法元素layer_nonoutput_dpb_params_idx[i]时,语法元素layer_nonoutput_dpb_params_idx[i]的值可以在0至vps_num_dpb_params-1的范围内。
例如,当same_dpb_size_output_or_nonoutput_flag为1时,可以应用以下内容。
-当vps_independent_layer_flag[i]为1时,它可以是应用于作为非输出层的第i层的dpb_parameters()语法结构的层所参考的SPS中的dpb_parameters()语法结构。
-当vps_independent_layer_flag[i]为0时,layer_nonoutput_dpb_params_idx[i]的值可以被推断为等于layer_output_dpb_params_idx[i]。
另选地,例如,当same_dpb_size_output_or_nonoutput_flag为0时,如果vps_num_dpb_params为1,则layer_output_dpb_params_idx[i]的值可以被推断为0。
此外,例如,作为在上表4中公开的DPB参数语法结构的dpb_parameters()语法结构可以如下。
[表6]
Figure BDA0003946056620000341
参照表6,dpb_parameters()语法结构可以提供关于CVS的每个CLVS的DPB大小、最大图片重排序数目和最大等待时间的信息。dpb_parameters()语法结构可以表示关于DPB参数的信息或DPB参数信息。
当dpb_parameters()语法结构被包括在VPS中时,VPS可以指定应用dpb_parameters()语法结构的OLS。另外,当dpb_parameters()语法结构被包括在SPS中时,dpb_parameters()语法结构可以应用于仅包括引用SPS的层当中的最低层的OLS,其中,最低层可以是独立层。
用于上表6中示出的语法元素的语义可以如下。
[表7]
Figure BDA0003946056620000342
Figure BDA0003946056620000351
例如,通过将1与语法元素max_dec_pic_buffering_minus1[i]相加而获得的值可以针对CVS的每个CLVS表示当Htid等于i时,以图片存储缓冲器为单位的DPB的最大所需大小。例如,max_dec_pic_buffering_minus1[i]可以是关于DPB大小的信息。例如,语法元素max_dec_pic_buffering_minus1[i]的值可以在0至MaxDpbSize-1的范围内。另外,例如,当i大于0时,max_dec_pic_buffering_minus1[i]可能大于或等于max_dec_pic_buffering_minus1[i-1]。另外,例如,当对于0至maxSubLayersMinus1-1的范围内的i而言不存在max_dec_pic_buffering_minus1[i]时,因为subLayerInfoFlag为0,所以语法元素max_dec_pic_buffering_minus1[i]的值可以被推断为等于max_dec_pic_buffer_minus1[maxSubLayersMinus1]。
另外,例如,语法元素max_num_reorder_pics[i]可以针对CVS的每个CLVS表示当Htid等于i时可以按解码顺序在CLVS的所有图片之前并且按输出顺序在这些图片之后的CLVS的图片的最大允许数目。例如,max_num_reorder_pics[i]可以是关于DPB的最大图片重排序编号的信息。max_num_reorder_pics[i]的值可以在0至max_dec_pic_buffering_minus1[i]的范围内。另外,例如,当i大于0时,max_num_reorder_pics[i]可以大于或等于max_num_reorder_pics[i-1]。另外,例如,当对于0至maxSubLayersMinus1-1的范围内的i而言不存在max_num_reorder_pics[i]时,因为subLayerInfoFlag为0,所以语法元素max_num_reorder_pics[i]可以被推断为等于max_num_reorder_pics[maxSubLayersMinus1]。
另外,例如,可以使用其值不为0的语法元素max_latency_increase_plus1[i]来计算MaxLatencyPictures[i]的值。MaxLatencyPictures[i]可以针对CVS的每个CLVS表示当Htid等于i时可以按输出顺序在CLVS的所有图片之前并且按解码顺序在这些图片之后的CLVS的图片的最大数目。例如,max_latency_increase_plus1[i]可以是关于DPB的最大等待时间的信息。
例如,当max_latency_increase_plus1[i]不为0时,MaxLatencyPictures[i]的值可以被如下地推导。
[式1]
MaxLatencyPictures[i]=max_num_reorder_pics[i]+max_latency_increase_plus1[i]-1
另一方面,例如,如果max_latency_increase_plus1[i]为0,则对应的极限可以不被表达。max_latency_increase_plus1[i]的值可以在0至232-2的范围内。另外,例如,当对于0至maxSubLayersMinus1-1的范围内的i而言不存在max_latency_increase_plus1[i]时,因为subLayerInfoFlag为0,所以语法元素max_latency_increase_plus1[i]可以被推断为等于max_latency_increase_plus1[maxSubLayersMinus1]。
可以基于与上述DPB参数相关的信息/语法元素来执行上述DPB管理。可以根据当前层是输出层还是参考层来发信号通知其他DPB参数,或者可以根据DPB(或DPB参数)是否用于OLS(映射到OLS)来发信号通知其他DPB参数。
此外,尽管在图4中未例示,但编码设备可以基于更新/管理的DPB来解码当前图片。此外,解码的当前图片可以被插入到DPB中,并且包括解码的当前图片的DPB可以在按解码顺序解码当前图片的下一图片之前基于DPB参数来更新。
图5示例性例示了根据本公开的实施方式的解码过程。
解码设备从比特流获得包括与DPB参数相关的信息的图像信息(S500)。解码设备可以获得包括与DPB参数相关的信息的图像信息。与DPB参数相关的信息/语法元素可以如上所述。
解码设备基于DPB参数来管理DPB(S510)。这里,DPB管理可以被称为DPB更新。DPB管理过程可以包括在DPB中标记和/或去除解码图片的过程。解码设备可以基于与DPB参数相关的信息来推导DPB参数,并可以基于推导的DPB参数来执行DPB管理过程。
解码设备基于DPB来解码/输出当前图片(S520)。解码设备可以基于更新/管理的DPB来解码当前图片。例如,可以基于使用DPB中的(先前)解码的图片作为参考图片的帧间预测来解码当前图片中的块/切片。
图6示意性例示了根据本公开的由编码设备进行的图像编码方法。图6中公开的方法可以由图2中例示的编码设备执行。具体地,例如,图6中的S600至S610可以由编码设备的DPB执行,并且S620可以由编码设备的熵编码器执行。另外,虽然未示出,但解码当前图片的过程可以由编码设备的预测器和残差处理器来执行。
编码设备基于当前图片是否是作为除了访问单元(AU)0之外的编码视频序列开始访问单元(CVSS AU)的当前AU的第一图片来推导变量的值(S600)。编码设备可以推导变量的值,以在解码当前图片之前并在生成/编码当前图片的切片头之后更新DPB。DPB可以包括在当前图片之前解码的图片。
例如,编码设备可以基于当前图片是否是作为除了访问单元(AU)0之外的CVSS AU的当前AU的第一图片来推导变量的值。这里,该变量可以指示解码图片缓冲器(DPB)中的所有图片存储缓冲器是否被清空而没有输出。当前AU可以是包括当前图片的AU。另外,例如,AU 0可以是按解码顺序的比特流的第一AU。即,例如,AU 0可以是将要解码的比特流的第一AU。另一方面,编码设备可以生成/编码当前图片的切片头,然后,基于当前图片是否是作为除了访问单元(AU)0之外的CVSS AU的当前AU的第一图片来推导变量的值。
例如,编码设备可以确定当前图片是否是作为除了访问单元(AU)0之外的CVSS AU的当前AU的第一图片。当当前AU是除了AU 0之外的CVSS AU并且当前图片是当前AU的第一图片时,编码设备可以推导变量的值。
例如,当当前AU是除了AU 0之外的CVSS AU并且当前图片是当前AU的第一图片时,编码设备可以确定当前AU的参数中的至少一个是否在解码顺序上不同于当前AU的先前AU的参数。当当前AU的参数中的至少一个不同于先前AU的参数时,变量的值可以被设置为等于1,并且当当前AU的参数与先前AU的参数相同时,变量的值可以被设置为等于用于变量的语法元素的值。编码设备可以生成/编码当前图片的图像信息,并且图像信息可以包括语法元素。语法元素可以是上述的ph_no_output_of_prior_pics_flag。此外,当前AU的参数包括最大图片宽度的参数、最大图片高度的参数、可用色度格式的参数、最大比特深度的参数和最大DPB大小的参数。最大图片宽度的参数、最大图片高度的参数、可用色度格式的参数、最大比特深度的参数和最大DPB大小的参数可以分别是上述的PicWidthMaxInSamplesY、PicHeightMaxInSamplesY、MaxChromaFormat、MaxBitDepthMinus8和max_dec_pic_buffering_minus1[Htid]。
另一方面,例如,当当前访问单元(AU)不是CVSS AU或者当前图片不是作为除了AU0之外的CVSS AU的当前AU的第一图片时,编码设备可以不推导变量的值。
通过这样,可以在仅解码作为当前AU的第一图片的当前图片之前而非在解码作为除了AU 0之外的CVSS AU的当前AU的所有图片之前推导变量。可以在仅解码作为当前AU的第一图片的当前图片之前,执行清空解码图片缓冲器(DPB)中的所有图片存储缓冲器而没有输出的过程。
编码设备基于变量来更新DPB(S610)。例如,编码设备可以基于变量来更新DPB。
例如,当变量的值为1时,DPB中的所有图片存储缓冲器可以被清空而没有输出,并且DPB充满度可以被设置为等于0。另外,例如,当变量的值为0时,DPB中的包括特定图片的图片存储缓冲器可以被清空而没有输出,并且可以对DPB中的非空图片存储缓冲器执行凹凸过程。另外,DPB充满度可以被设置为0。这里,例如,特定图片可以是标记为“不需要输出”和“不用于参考”的图片。凹凸过程可以如上所述。
另外,例如,当当前图片不是作为除了AU 0之外的CVSS AU的当前AU的第一图片时,编码设备可以从DPB去除DPB中的满足第一条件和第二条件的特定图片。这里,第一条件可以是特定图片是标记为“不用于参考”的图片,并且第二条件可以是特定图片具有等于0的图片输出标志或者特定图片的DPB输出时间(DPB)少于或等于当前图片的第一解码单元(DU)的CPB去除时间。这里,图片输出标志可以是上述的PictureOutputFlag。
另外,例如,当当前图片不是作为除了AU 0之外的CVSS AU的当前AU的第一图片时,DPB中的包括特定图片的图片存储缓冲器可以被清空而没有输出。这里,特定图片可以是标记为“不需要输出”和“不用于参考”的图片。另外,对于清空的图片存储缓冲器,DPB充满度可以递减1。即,例如,每当图片存储缓冲器被清空时,DPB充满度可以递减1。此外,当下述的一个或更多个条件为真时,可以重复执行上述凹凸过程,同时针对被清空的每个附加图片存储缓冲器,进一步将DPB充满度递减1,直到所有条件都不为真。
例如,第一条件可以是DPB中的标记为“需要输出”的图片的数目大于当前AU的语法元素max_num_reorder_pics[Htid]。第二条件可以是当前AU的语法元素max_latency_increase_plus1[Htid]不等于0并且DPB中至少有一个被标记为“需要输出”并且其关联的变量PicLatencyCount大于或等于MaxLatencyPictures[Htid]的图片。第三条件可以是DPB中的图片的数目大于或等于通过将1与当前AU的语法元素max_dec_pic_buffering_minus1[Htid]相加而获得的值。图像信息可以包括当前AU的语法元素。
编码设备对当前图片的图像信息进行编码(S620)。编码设备可以对包括用于更新DPB的语法元素的图像信息进行编码。另外,图像信息可以包括当前图片的切片头。
此外,尽管未例示,但编码设备可以基于更新后的DPB来解码当前图片。例如,编码设备可以通过基于DPB的参考图片对当前图片中的块执行帧间预测来推导预测样本,并可以基于预测样本针对当前图片生成重构样本和/或重构图片。此外,例如,编码设备可以推导当前图片中的块的残差样本,并可以通过预测样本与残差样本相加来生成重构样本和/或重构图片。如上所述,可以向重构样本应用诸如去块滤波、SAO和/或ALF过程这样的环路滤波过程,以便改善主观/客观图片质量。编码设备可以生成/编码块的预测相关信息和/或残差信息,并且图像信息可以包括预测相关信息和/或残差信息。另外,编码设备可以将解码的当前图片插入到DPB中。另外,例如,编码设备可以推导当前AU的DPB参数,并可以生成DPB参数的DBP相关信息。图像信息可以包括DBP相关信息。
此外,可以通过网络或(数字)存储介质将包括图像信息的比特流发送到解码设备。这里,网络可以包括广播网络和/或通信网络,并且数字存储介质可以包括诸如USB、SD、CD、DVD、蓝光、HDD和SSD这样的各种存储介质。
图7示意性例示了根据本公开的执行图像编码方法的编码设备。图7中公开的方法可以由图6中公开的编码设备执行。具体地,例如,图7的编码设备的DPB可以执行S600至S610,并且图7的编码设备的熵编码器可以执行S620。另外,虽然未示出,但解码当前图片的过程可以由编码设备的预测器和残差处理器来执行。
图8示意性例示了根据本公开的由解码设备进行的图像解码方法。图8中公开的方法可以由图3中例示的解码设备执行。具体地,例如,图8中的S800至S810可以由解码设备的DPB执行,并且图8中的S820可以由解码设备的预测器和残差处理器执行。
解码设备基于当前图片是否是作为除了访问单元(AU)0之外的编码视频序列开始访问单元(CVSS AU)的当前AU的第一图片来推导变量的值(S800)。解码设备可以基于当前图片是否是作为除了访问单元(AU)0之外的CVSS AU的当前AU的第一图片来推导变量的值。这里,该变量可以指示解码图片缓冲器(DPB)中的所有图片存储缓冲器是否被清空而没有输出。当前AU可以是包括当前图片的AU。另外,例如,AU 0可以是按解码顺序的比特流的第一AU。即,例如,AU 0可以是解码设备将要解码的比特流的第一AU。另一方面,解码设备可以解析当前图片的切片头,然后,可以基于当前图片是否是作为除了访问单元(AU)0之外的CVSS AU的当前AU的第一图片来推导变量的值。
例如,解码设备可以确定当前图片是否是作为除了访问单元(AU)0之外的CVSS AU的当前AU的第一图片。当当前AU是除了AU 0之外的CVSS AU并且当前图片是当前AU的第一图片时,解码设备可以推导变量的值。
例如,当当前AU是除了AU 0之外的CVSS AU并且当前图片是当前AU的第一图片时,解码设备可以确定当前AU的参数中的至少一个是否在解码顺序上不同于当前AU的先前AU的参数。当当前AU的参数中的至少一个不同于先前AU的参数时,变量的值可以被设置为等于1。当当前AU的参数与先前AU的参数相同时,变量的值可以被设置为等于针对该变量发信号通知的语法元素的值。解码设备可以获得当前图片的图像信息,并且图像信息可以包括语法元素。语法元素可以是上述的ph_no_output_of_prior_pics_flag。此外,当前AU的参数包括最大图片宽度的参数、最大图片高度的参数、可用色度格式的参数、最大比特深度的参数和最大DPB大小的参数。最大图片宽度的参数、最大图片高度的参数、可用色度格式的参数、最大比特深度的参数和最大DPB大小的参数可以分别是上述的PicWidthMaxInSamplesY、PicHeightMaxInSamplesY、MaxChromaFormat、MaxBitDepthMinus8和max_dec_pic_buffering_minus1[Htid]。
另一方面,例如,当当前访问单元(AU)不是CVSS AU或者当前图片不是作为除了AU0之外的CVSS AU的当前AU的第一图片时,解码设备可以不推导变量的值。
通过这样,可以在仅解码作为当前AU的第一图片的当前图片之前而非在解码作为除了AU 0之外的CVSS AU的当前AU的所有图片之前推导变量。可以在仅解码作为当前AU的第一图片的当前图片之前执行清空解码图片缓冲器(DPB)中的所有图片存储缓冲器而没有输出的过程。
解码设备基于变量来更新DPB(S810)。例如,解码设备可以基于变量来更新DPB。在被更新之前,DPB可以包括在当前图片之前解码的图片。
例如,当变量的值为1时,DPB中的所有图片存储缓冲器可以被清空而没有输出,并且DPB充满度可以被设置为等于0。另外,例如,当变量的值为0时,DPB中的包括特定图片的图片存储缓冲器可以被清空而没有输出,并且可以对DPB中的非空图片存储缓冲器执行凹凸过程。另外,DPB充满度可以被设置为等于0。这里,例如,特定图片可以是标记为“不需要输出”和“不用于参考”的图片。凹凸过程可以如上所述。
另外,例如,当当前图片不是作为除了AU 0之外的CVSS AU的当前AU的第一图片时,解码设备可以从DPB去除DPB中的满足第一条件和第二条件的特定图片。这里,第一条件可以是特定图片是标记为“不用于参考”的图片。第二条件可以是特定图片具有等于0的图片输出标志或者特定图片的DPB输出时间(DPB)少于或等于当前图片的第一解码单元(DU)的CPB去除时间。这里,图片输出标志可以是上述的PictureOutputFlag。
另外,例如,当当前图片不是作为除了AU 0之外的CVSS AU的当前AU的第一图片时,DPB中的包括特定图片的图片存储缓冲器可以被清空而没有输出。这里,特定图片可以是标记为“不需要输出”和“不用于参考”的图片。另外,对于清空的图片存储缓冲器,DPB充满度可以递减1。即,例如,每当图片存储缓冲器被清空时,DPB充满度可以递减1。此外,当下述条件的至少一个为真时,可以重复执行上述凹凸过程,同时针对被清空的每个附加图片存储缓冲器,进一步将DPB充满度递减1,直到所有条件都不为真。
例如,第一条件可以是DPB中的标记为“需要输出”的图片的数目大于当前AU的语法元素max_num_reorder_pics[Htid]。第二条件可以是当前AU的语法元素max_latency_increase_plus1[Htid]不等于0并且DPB中至少有一个被标记为“需要输出”并且其关联的变量PicLatencyCount大于或等于MaxLatencyPictures[Htid]的图片。第三条件可以是DPB中的图片的数目大于或等于通过将1与当前AU的语法元素max_dec_pic_buffering_minus1[Htid]相加而获得的值。图像信息可以包括当前AU的语法元素。
解码设备基于更新后的DPB来解码当前图片(S820)。例如,解码设备可以基于更新后的DPB来解码当前图片。例如,解码设备可以通过基于DPB的参考图片对当前图片中的块执行帧间预测来推导预测样本,并可以基于预测样本针对当前图片生成重构样本和/或重构图片。此外,例如,解码设备可以基于通过比特流接收的当前图片的残差信息来推导当前图片中的块的残差样本,并可以通过将预测样本与残差样本相加来生成重构样本和/或重构图片。图像信息可以包括残差信息。另外,解码设备可以将解码的当前图片插入到DPB中。
如上所述,可以向重构样本应用诸如去块滤波、SAO和/或ALF过程这样的环路滤波过程,以便此后在必要时改善主观/客观图片质量。
图9示意性例示了根据本公开的执行图像解码方法的解码设备。图8中公开的方法可以由图9中例示的解码设备执行。具体地,例如,图9的解码设备的DPB可以执行图8中的S800至S810,并且图9的解码设备的预测器和残差处理器可以执行图8中的S820。
根据上述的本公开,是否执行在DPB中去除图片而没有输出它们的过程可以在仅解码除了AU 0之外的CVSS AU的第一图片之前确定,而非在解码除了AU 0之外的CVSS AU的所有图片之前确定。通过这样,可以不针对每个图片改变影响CVS中的所有层的DPB状态,并且可以提高编码效率。
另外,根据本公开,指示是否去除DPB中的图片而没有输出的变量可以在仅解码除了AU 0之外的CVSS AU的第一图片之前确定,而非在解码除了AU 0之外的CVSS AU的所有图片之前确定。通过这样,可以不针对每个图片改变影响CVS中的所有层的DPB状态,并且可以提高编码效率。
在以上实施方式中,基于具有一系列步骤或方框的流程图描述了方法。本公开不限于以上步骤或方框的顺序。一些步骤或方框能够以与上述的其他步骤或方框不同的顺序执行或同时执行。此外,本领域技术人员将理解,流程图中所示的步骤不是排它的,并且可以还包括其他步骤,或者可以在不影响本公开的范围的情况下删除流程图中的一个或更多个步骤。
在本说明书中所描述的实施方式可以通过被实现在处理器、微处理器、控制器或芯片上来执行。例如,每个图中所示的功能单元可以通过被实现在计算机、处理器、微处理器、控制器或芯片上来执行。在这种情况下,用于实现的信息(例如,关于指令的信息)或算法可以存储在数字存储介质中。
另外,应用本公开的解码设备和编码设备可以被包括在如下装置中:多媒体广播发送/接收装置、移动通信终端、家庭影院视频装置、数字影院视频装置、监视相机、视频聊天装置、诸如视频通信的实时通信装置、移动流装置、存储介质、便携式摄像机、VoD服务提供装置、过顶(OTT)视频装置、互联网流服务提供装置、三维(3D)视频装置、电话会议视频装置、运输用户装置(例如,车辆用户装置、飞机用户装置和轮船用户装置)和医疗视频设备;并且应用本公开的解码设备和编码设备可以用于处理视频信号或数据信号。例如,过顶(OTT)视频装置可以包括游戏机、蓝光播放器、互联网接入电视机、家庭影院系统、智能电话、平板电脑、数字视频记录仪(DVR)等。
另外,应用本公开的处理方法能够以计算机执行的程序的形式产生,并且可以存储在计算机可读记录介质中。根据本公开的具有数据结构的多媒体数据也可以存储在计算机可读记录介质中。计算机可读记录介质包括其中存储计算机可读数据的所有类型的存储设备。计算机可读记录介质可以包括例如BD、通用串行总线(USB)、ROM、PROM、EPROM、EEPROM、RAM、CD-ROM、磁带、软盘和光学数据存储设备。另外,计算机可读记录介质包括以载波(例如,经由互联网的传输)形式实现的介质。另外,由编码方法生成的比特流可以存储在计算机可读记录介质中或通过有线/无线通信网络来传输。
另外,本公开的实施方式可以根据程序代码利用计算机程序产品来实现,并且程序代码可以通过本公开的实施方式在计算机中执行。程序代码可以存储在计算机可读载体上。
图10例示了应用本公开的内容流传输系统的结构示图。
应用本公开的实施方式的内容流传输系统可以主要包括编码服务器、流传输服务器、网络服务器、媒体存储器、用户设备和多媒体输入设备。
编码服务器将从诸如智能手机、相机或便携式摄像机等的多媒体输入设备输入的内容压缩为数字数据,以生成比特流并将比特流发送到流传输服务器。作为另一示例,当诸如智能手机、相机或便携式摄像机等的多媒体输入设备直接生成比特流时,可以省略编码服务器。
可以通过应用了本公开的实施方式的编码方法或比特流生成方法来生成比特流,并且流传输服务器可以在发送或接收比特流的过程中临时存储比特流。
流传输服务器基于用户请求通过网络服务器向用户设备发送多媒体数据,并且网络服务器用作向用户通知服务的媒介。当用户从网络服务器请求所需的服务时,网络服务器向流传输服务器递送该请求,并且流传输服务器向用户发送多媒体数据。在这种情况下,内容流传输系统可以包括单独的控制服务器。在这种情况下,控制服务器用于控制内容流传输系统内的设备之间的命令/响应。
流传输服务器可以从媒体储存器和/或编码服务器接收内容。例如,当从编码服务器接收内容时,可以实时接收内容。在这种情况下,为了提供平稳的流服务,流传输服务器可以将比特流存储预定时间段。
用户设备的示例可以包括移动电话、智能电话、膝上型计算机、数字广播终端、个人数字助理(PDA)、便携式多媒体播放器(PMP)、导航仪、触屏PC、平板PC、超级本、可穿戴设备(例如,智能手表、智能眼镜和头戴式显示器)、数字TV、台式计算机和数字标牌等。内容流传输系统内的每个服务器可以作为分布式服务器来操作,在这种情况下,从每个服务器接收的数据可以被分布。
本公开中描述的权利要求能够以各种方式组合。例如,可以组合本公开的方法权利要求的技术特征以实现为装置,以及可以组合本公开的装置权利要求的技术特征以实现为方法。此外,可以组合本公开的方法权利要求的技术特征和装置权利要求的技术特征以实施为装置,以及可以组合本公开的方法权利要求的技术特征和装置权利要求的技术特征以实现为方法。

Claims (15)

1.一种由解码设备执行的图像解码方法,该图像解码方法包括以下步骤:
基于当前图片是否是当前访问单元AU的第一图片来推导变量的值,所述当前AU是除了AU 0之外的编码视频序列开始AU,即CVSS AU,所述变量指示解码图片缓冲器DPB中的所有图片存储缓冲器是否被清空而没有输出;
基于所述变量来更新所述DPB;以及
基于更新后的所述DPB来解码所述当前图片,
其中,所述AU 0是比特流中的第一AU。
2.根据权利要求1所述的图像解码方法,其中,当所述变量的值为1时,所述DPB中的所有图片存储缓冲器被清空而没有输出,并且DPB充满度被设置为等于0。
3.根据权利要求2所述的图像解码方法,其中,当所述变量的值为0时,所述DPB中的包括特定图片的图片存储缓冲器被清空而没有输出,并且对所述DPB中的非空图片存储缓冲器执行凹凸过程,并且
其中,所述特定图片是标记为不需要输出并且不用于参考的图片。
4.根据权利要求1所述的图像解码方法,其中,推导所述变量的值包括以下步骤:
当所述当前AU是作为除了所述AU 0之外的所述CVSS AU的所述当前AU的所述第一图片时,确定所述当前AU的参数中的至少一个在解码顺序上是否不同于所述当前AU的先前AU的参数,
其中,当所述当前AU的参数中的所述至少一个不同于所述先前AU的参数时,所述变量的值被设置为等于1,并且
其中,当所述当前AU的参数与所述先前AU的参数相同时,所述变量的值被设置为等于针对所述变量发信号通知的语法元素的值。
5.根据权利要求4所述的图像解码方法,其中,所述当前AU的参数包括所述当前AU的最大图片宽度的参数、最大图片高度的参数、可用色度格式的参数、最大比特深度的参数和最大DPB大小的参数。
6.根据权利要求1所述的图像解码方法,其中,更新所述DPB包括以下步骤:
当所述当前图片不是作为除了所述AU 0之外的所述CVSS AU的所述当前AU的所述第一图片时,从所述DPB去除满足第一条件和第二条件的特定图片,
其中,所述第一条件是所述特定图片是标记为不用于参考的图片,
其中,所述第二条件是所述特定图片具有等于0的图片输出标志或者所述特定图片的DPB输出时间少于或等于所述当前图片的第一解码单元DU的CPB去除时间。
7.根据权利要求1所述的图像解码方法,其中,当所述当前图片不是作为除了所述AU 0之外的所述CVSS AU的所述当前AU的所述第一图片时,所述DPB中的包括特定图片的图片存储缓冲器被清空而没有输出,并且
其中,所述特定图片是标记为不需要输出并且不用于参考的图片。
8.一种由编码设备执行的图像编码方法,该图像编码方法包括以下步骤:
基于当前图片是否是当前访问单元AU的第一图片来推导变量的值,所述当前AU是除AU0之外的编码视频序列开始AU,即CVSS AU,所述变量指示解码图片缓冲器DPB中的所有图片存储缓冲器是否被清空而没有输出;
基于所述变量来更新所述DPB;以及
对所述当前图片的图像信息进行编码,
其中,所述AU 0是比特流中的第一AU。
9.根据权利要求8所述的图像编码方法,其中,当所述变量的值为1时,所述DPB中的所有图片存储缓冲器被清空而没有输出,并且DPB充满度被设置为等于0。
10.根据权利要求9所述的图像编码方法,其中,当所述变量的值为0时,所述DPB中的包括特定图片的图片存储缓冲器被清空而没有输出,并且对所述DPB中的非空图片存储缓冲器执行凹凸过程,并且
其中,所述特定图片是标记为不需要输出并且不用于参考的图片。
11.根据权利要求8所述的图像编码方法,其中,推导所述变量的所述值包括以下步骤:
当所述当前AU是作为除了所述AU 0之外的所述CVSS AU的所述当前AU的所述第一图片时,确定所述当前AU的参数中的至少一个在解码顺序上是否不同于所述当前AU的先前AU的参数,
其中,当所述当前AU的所述参数中的所述至少一个不同于所述先前AU的参数时,所述变量的所述值被设置为等于1,
其中,当所述当前AU的参数与所述先前AU的参数相同时,所述变量的所述值被设置为等于针对所述变量的语法元素的值,并且
其中,所述图像信息包括所述语法元素。
12.根据权利要求11所述的图像编码方法,其中,所述当前AU的参数包括所述当前AU的最大图片宽度的参数、最大图片高度的参数、可用色度格式的参数、最大比特深度的参数和最大DPB大小的参数。
13.根据权利要求8所述的图像编码方法,其中,更新所述DPB包括以下步骤:
当所述当前图片不是作为除了所述AU 0之外的所述CVSS AU的所述当前AU的所述第一图片时,从所述DPB去除满足第一条件和第二条件的特定图片,
其中,所述第一条件是所述特定图片是标记为不用于参考的图片,
其中,所述第二条件是所述特定图片具有等于0的图片输出标志或者所述特定图片的DPB输出时间少于或等于所述当前图片的第一解码单元DU的CPB去除时间。
14.根据权利要求8所述的图像编码方法,其中,当所述当前图片不是作为除了所述AU0之外的所述CVSS AU的所述当前AU的所述第一图片时,所述DPB中的包括特定图片的图片存储缓冲器被清空而没有输出,并且
其中,所述特定图片是标记为不需要输出和不用于参考的图片。
15.一种存储包括致使解码设备执行图像解码方法的图像信息的比特流的非暂态计算机可读存储介质,该图像解码方法包括以下步骤:
基于当前图片是否是当前访问单元AU的第一图片来推导变量的值,所述当前AU是除了AU 0之外的编码视频序列开始AU即CVSS AU,所述变量指示解码图片缓冲器DPB中的所有图片存储缓冲器是否被清空而没有输出;
基于所述变量来更新所述DPB;以及
基于更新后的所述DPB来解码所述当前图片,
其中,所述AU 0是所述比特流中的第一AU。
CN202180035728.6A 2020-05-18 2021-05-04 图像解码方法和用于该图像解码方法的装置 Pending CN115668932A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US202063026684P 2020-05-18 2020-05-18
US63/026,684 2020-05-18
US202063029385P 2020-05-22 2020-05-22
US63/029,385 2020-05-22
PCT/KR2021/005601 WO2021235740A1 (ko) 2020-05-18 2021-05-04 영상 디코딩 방법 및 그 장치

Publications (1)

Publication Number Publication Date
CN115668932A true CN115668932A (zh) 2023-01-31

Family

ID=78708760

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180035728.6A Pending CN115668932A (zh) 2020-05-18 2021-05-04 图像解码方法和用于该图像解码方法的装置

Country Status (6)

Country Link
US (1) US20230209075A1 (zh)
EP (1) EP4156687A4 (zh)
JP (1) JP2023526389A (zh)
KR (1) KR20230013080A (zh)
CN (1) CN115668932A (zh)
WO (1) WO2021235740A1 (zh)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106416250B (zh) * 2013-12-02 2020-12-04 诺基亚技术有限公司 视频编码和解码
US9860540B2 (en) * 2014-01-03 2018-01-02 Qualcomm Incorporated Inference of nooutputofpriorpicsflag in video coding
US9807406B2 (en) * 2014-03-17 2017-10-31 Qualcomm Incorporated Picture flushing and decoded picture buffer parameter inference for multi-layer bitstreams
EP3563571A4 (en) * 2016-12-30 2020-02-12 Telefonaktiebolaget LM Ericsson (publ) DECODED IMAGE BUFFER MEMORY MANAGEMENT FOR PROCESSING PREDICTION OF CROSS IMAGE DATA

Also Published As

Publication number Publication date
WO2021235740A1 (ko) 2021-11-25
US20230209075A1 (en) 2023-06-29
KR20230013080A (ko) 2023-01-26
EP4156687A1 (en) 2023-03-29
JP2023526389A (ja) 2023-06-21
EP4156687A4 (en) 2024-04-10

Similar Documents

Publication Publication Date Title
CN114208175A (zh) 基于色度量化参数数据的图像解码方法及其设备
CN115516860A (zh) 图像解码方法及其设备
CN114258677A (zh) 编译色度量化参数偏移相关信息的图像解码方法和设备
US20220408115A1 (en) Image decoding method and device
US20230013167A1 (en) Image/video coding method and apparatus
CN115211120A (zh) 基于包括ols dpb参数索引的图像信息对图像进行解码的方法及其设备
CN115211122A (zh) 用于对包括画面头的图像信息进行编码的图像解码方法和设备
CN115552910A (zh) 用于残差编码的图像解码方法及其装置
CN116962691A (zh) 解码和编码设备、存储介质及发送用于图像的数据的设备
EP4156687A1 (en) Image decoding method and device therefor
US11509905B2 (en) Method and device for signaling information related to slice in image/video encoding/decoding system
JP7439267B2 (ja) Dpbパラメータをコーディングする映像デコーディング方法及びその装置
CN115349258B (zh) 图像编码系统中用于残差编码的图像解码方法及其设备
US20230344987A1 (en) Image/video encoding/decoding method and apparatus using same
US20230156228A1 (en) Image/video encoding/decoding method and device
US20220417561A1 (en) Image/video coding method and apparatus on basis of picture division structure
CN115428460A (zh) 图像编码系统中残差编码的图像解码方法及用于其的设备
CN116195250A (zh) 基于dpb操作的图像或视频编码
CN114930855A (zh) 用于图像/视频编译的切片和拼块配置
CN115336274A (zh) 与残差编码关联的图像解码方法以及用于其的装置
CN114175644A (zh) 使用色度量化参数表的图像解码方法及其设备
CN115668918A (zh) 基于画面划分信息和子画面信息的图像编码/解码方法和设备及存储比特流的记录介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination