CN115211122A - 用于对包括画面头的图像信息进行编码的图像解码方法和设备 - Google Patents

用于对包括画面头的图像信息进行编码的图像解码方法和设备 Download PDF

Info

Publication number
CN115211122A
CN115211122A CN202080097941.5A CN202080097941A CN115211122A CN 115211122 A CN115211122 A CN 115211122A CN 202080097941 A CN202080097941 A CN 202080097941A CN 115211122 A CN115211122 A CN 115211122A
Authority
CN
China
Prior art keywords
nal unit
picture
image
flag
nal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080097941.5A
Other languages
English (en)
Inventor
亨得利·亨得利
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Publication of CN115211122A publication Critical patent/CN115211122A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/188Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a video data packet, e.g. a network abstraction layer [NAL] unit
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder

Abstract

根据本文献的由解码设备执行的图像解码方法包括以下步骤:获取指示是否存在画面头(PH)网络抽象层(NAL)单元的标志;基于该标志获取PH;以及基于PH对与PH有关的当前画面进行解码。

Description

用于对包括画面头的图像信息进行编码的图像解码方法和 设备
技术领域
本公开涉及图像编码技术,更具体地,涉及一种在图像编码系统中对PH NAL单元自适应地编码的视频解码方法和设备。
背景技术
近来,在各种领域中,对诸如HD(高清)图像和UHD(超高清)图像的高分辨率、高质量图像的需求正在增长。因为图像数据具有高分辨率和高质量,所以相对于传统图像数据,要传输的信息或比特的量增加。因此,当使用诸如传统有线/无线宽带线路的介质发送图像数据或者使用现有存储介质存储图像数据时,其传输成本和存储成本增加。
因此,需要用于有效地发送、存储和再现高分辨率高质量图像的信息的高效图像压缩技术。
发明内容
技术问题
本公开的技术目的在于提供一种改进图像编码效率的方法和设备。
本公开的另一技术目的在于提供一种对指示是否存在PH NAL单元的标志进行编码的方法和设备。
技术方案
根据本公开的实施方式,提供了一种由解码设备执行的图像解码方法。该方法包括以下步骤:获得针对是否存在画面头(PH)网络抽象层(NAL)单元的标志;基于所述标志获得PH;以及基于PH对与PH有关的当前画面进行解码。
根据本公开的另一实施方式,提供了一种执行图像解码的解码设备。该解码设备包括:熵解码器,其被配置为获得针对是否存在画面头(PH)网络抽象层(NAL)单元的标志,基于所述标志获得PH;以及预测器,其被配置为基于PH对与PH有关的当前画面进行解码。
根据本公开的另一实施方式,提供了一种由编码设备执行的视频编码方法。该方法包括以下步骤:确定是否存在包括与当前画面有关的画面头(PH)的PH网络抽象层(NAL)单元;基于确定的结果生成针对是否存在PH NAL单元的标志;以及对包括所述标志的图像信息进行编码。
根据本公开的另一实施方式,提供了一种视频编码设备。该编码设备包括:熵编码器,其被配置为确定是否存在包括与当前画面有关的画面头(PH)的PH网络抽象层(NAL)单元,基于确定的结果生成针对是否存在PH NAL单元的标志,并且对包括所述标志的图像信息进行编码。
根据本公开的另一实施方式,提供了一种计算机可读数字存储介质,其存储包括图像信息的比特流并且使得执行图像解码方法。在该计算机可读数字存储介质中,该图像解码方法包括以下步骤:获得针对是否存在画面头(PH)网络抽象层(NAL)单元的标志;基于该标志获得PH;以及基于PH对与PH有关的当前画面进行解码。
有益效果
根据本公开,可用信号通知指示是否存在PH NAL单元的标志,基于该标志自适应于比特流的比特率调节NAL单元,并且改进总体编码效率。
根据本公开,可基于指示是否存在PH NAL单元的标志来为相关画面设定关于当前画面中的切片数量的约束和关于PH NAL单元的存在的约束,以自适应于比特流的比特率控制NAL单元,从而改进总体编码效率。
附图说明
图1简要例示了可应用本公开的实施方式的视频/图像编码装置的示例。
图2是例示了可以应用本公开的实施方式的视频/图像编码设备的配置的示意图。
图3是例示了可以应用本公开的实施方式的视频/图像解码设备的配置的示意图。
图4示意性地示出了编码图像信息的分层结构。
图5示意性地示出了根据本公开的实施方式的编码过程。
图6示意性地示出了根据本公开的实施方式的解码过程。
图7示意性地示出了根据是否存在PH NAL单元的NAL单元中的画面头配置。
图8示意性地示出了根据本文献的编码设备的图像编码方法。
图9示意性地示出了根据本文献的用于执行图像编码方法的编码设备。
图10示意性地示出了根据本文献的解码设备的图像解码方法。
图11示意性地示出了根据本文献的用于执行图像解码方法的解码设备。
图12例示了应用本公开的内容流系统的结构图。
具体实施方式
本公开可以以各种形式修改,并且将在附图中描述和例示其特定实施方式。然而,实施方式并非旨在限制本公开。在以下描述中使用的术语仅用于描述特定实施方式,并非旨在限制本公开。只要清楚地以不同的方式理解,单数的表达包括复数的表达。诸如“包括”和“具有”的术语旨在指示存在以下描述中使用的特征、数量、步骤、操作、元件、组件或其组合,因此应理解的是,不排除存在或添加一个或更多个不同的特征、数量、步骤、操作、元件、组件或其组合的可能性。
此外,本公开中描述的附图中的元件是为了方便解释不同的特定功能而独立地绘制的,并不意味着这些元件由独立的硬件或独立的软件来具体实现。例如,可以将元件中的两个或更多个元件组合以形成单个元件,或者可以将一个元件分割为多个元件。组合和/或分割元件的实施方式属于本公开,而没有脱离本公开的概念。
在下文中,将参照附图详细描述本公开的实施方式。另外,在整个附图中,相似的附图标记用于指示相似的元件,并且将省略对相似元件的相同描述。
图1简要例示了可应用本公开的实施方式的视频/图像编码装置的示例。
参照图1,视频/图像编码系统可以包括第一装置(源装置)和第二装置(接收装置)。源装置可以经由数字存储介质或网络以文件或流的形式向接收装置传送编码视频/图像信息或数据。
源装置可以包括视频源、编码设备和发送器。接收装置可以包括接收器、解码设备和渲染器。编码设备可以称为视频/图像编码设备,并且解码设备可以称为视频/图像解码设备。发送器可以被包括在编码设备中。接收器可以被包括在解码设备中。渲染器可以包括显示器,并且显示器可以被配置为单独的装置或外部组件。
视频源可以通过捕获、合成或生成视频/图像的处理来获取视频/图像。视频源可以包括视频/图像捕获装置和/或视频/图像生成装置。视频/图像捕获装置可以包括例如一个或更多个相机、包括先前捕获的视频/图像的视频/图像档案等。视频/图像生成装置可以包括例如计算机、平板计算机和智能电话,并且可以(电子地)生成视频/图像。例如,可以通过计算机等生成虚拟视频/图像。在这种情况下,视频/图像捕获处理可以由生成相关数据的处理代替。
编码设备可以对输入的视频/图像进行编码。编码设备可以执行诸如预测、变换和量化的一系列过程,以实现压缩和编码效率。编码数据(编码视频/图像信息)可以以比特流的形式输出。
发送器可以通过数字存储介质或网络以文件或流的形式向接收装置的接收器发送以比特流的形式输出的经编码的视频/图像信息或数据。数字存储介质可以包括诸如USB、SD、CD、DVD、蓝光、HDD、SSD等的各种存储介质。发送器可以包括用于通过预定文件格式生成媒体文件的元件,并且可以包括用于通过广播/通信网络进行发送的元件。接收器可以接收/提取比特流,并向解码设备发送接收到的比特流。
解码设备可以通过执行与编码设备的操作相对应的诸如解量化、逆变换和预测的一系列过程来对视频/图像进行解码。
渲染器可以渲染经解码的视频/图像。经渲染的视频/图像可以通过显示器显示。
本公开涉及视频/图像编码。例如,本公开中所公开的方法/实施方式可以应用于在多功能视频编码(VVC)、EVC(基本视频编码)标准、AOMedia Video 1(AV1)标准、第2代音频视频编码标准(AVS2)或下一代视频/图像编码标准(例如,H.267、或H.268等)中公开的方法。
本公开呈现了视频/图像编码的各种实施方式,并且除非另外提及,否则实施方式可以彼此组合地执行。
在本公开中,视频可以是指随时间推移的一系列图像。通常,画面是指表示特定时间区域中的一个图像的单元,并且子画面/切片/拼块(tile)是构成编码中的画面的一部分的单元。子画面/切片/拼块可以包括一个或更多个编码树单元(CTU)。一幅画面可以由一个或更多个子画面/切片/拼块构成。一幅画面可以由一个或更多个拼块组构成。一个拼块组可以包括一个或更多个拼块。图块(brick)可以表示画面中的拼块内的CTU行的矩形区域。拼块可以被分区为多个图块,每个图块由拼块内的一个或更多个CTU行组成。没有被分区为多个图块的拼块也可以被称为图块。图块扫描是对画面进行分区的CTU的特定依次排序,其中,在图块中按CTU光栅扫描对CTU进行连续排序,按拼块的图块的光栅扫描对拼块内的图块进行连续排序,并且按画面的拼块的光栅扫描对画面中的拼块进行连续排序。另外,子画面可以表示画面内的一个或更多个切片的矩形区域。即,子画面包含共同覆盖画面的矩形区域的一个或更多个切片。拼块是画面中的特定拼块列和特定拼块行内的CTU的矩形区域。拼块列是CTU的矩形区域,该矩形区域的高度等于画面的高度并且宽度由画面参数集中的语法元素指定。拼块行是CTU的矩形区域,该矩形区域的高度由画面参数集中的语法元素指定并且宽度等于画面的宽度。拼块扫描是对画面进行分区的CTU的特定依次排序,其中,可以在拼块中按CTU光栅扫描对CTU进行连续排序,而可以按画面的拼块的光栅扫描对画面中的拼块进行连续排序。切片包括画面的可以被排他性地包含在单个NAL单元中的整数个图块。切片可以由多个完整拼块组成或者仅由一个拼块的连续序列的完整图块组成。在本公开中,可以互换地使用拼块组和切片。例如,在本公开中,拼块组/拼块组头可以被称为切片/切片头。
像素或像元(pel)可以表示组成一幅画面(或图像)的最小单位。另外,“样本”可以用作与像素相对应的术语。样本通常可以表示像素或像素值,并且可以仅表示亮度分量的像素/像素值或仅表示色度分量的像素/像素值。
单元可以表示图像处理的基本单位。单元可以包括画面的特定区域和与该区域有关的信息中的至少一个。一个单元可以包括一个亮度块和两个色度(例如,cb、cr)块。在一些情况下,单元可以与诸如块或区域的术语互换使用。在一般情况下,M×N块可以包括M列和N行的样本(或样本阵列)或变换系数的集合(或阵列)。
在本说明书中,“A或B”可以是指“仅A”、“仅B”或“A和B”。换言之,在本说明书中,“A或B”可以被解释为“A和/或B”。例如,“A、B或C”在本文中是指“仅A”、“仅B”、“仅C”或“A、B和C的任何一个和任何组合”。
本说明书中使用的斜线(/)或逗号(comma)可以是指“和/或”。例如,“A/B”可以是指“A和/或B”。因此,“A/B”可以是指“仅A”、“仅B”或“A和B”。例如,“A,B,C”可以是指“A、B或C”。
在本说明书中,“A和B中的至少一个”可以是指“仅A”、“仅B”或“A和B两者”。另外,在本说明书中,表述“A或B中的至少一个”或“A和/或B中的至少一个”可以被解释为与“A和B中的至少一个”相同。
另外,在本说明书中,“A、B和C中的至少一个”是指“仅A”、“仅B”、“仅C”或“A、B和C的任意组合”。此外,“A、B或C中的至少一个”或“A、B和/或C中的至少一个”可以是指“A、B和C中的至少一个”。
此外,本说明书中使用的括号可以是指“例如”。具体地,当指示“预测(帧内预测)”时,可能将“帧内预测”作为“预测”的示例提出。换言之,本说明书中的“预测”不限于“帧内预测”,可以将“帧内预测”作为“预测”的示例提出。此外,即使当指示“预测(即,帧内预测)”时,“帧内预测”也可以作为“预测”的示例提出。
在本说明书中,在一幅图中单独描述的技术特征可以单独实现或可以同时实现。
创建以下附图以解释本说明书的具体示例。由于附图中描述的特定装置的名称或特定信号/消息/字段的名称通过示例呈现,因此本说明书的技术特征不限于在以下附图中使用的特定名称。
图2是例示了可以应用本公开的实施方式的视频/图像编码设备的配置的示意图。在下文中,视频编码设备可以包括图像编码设备。
参照图2,编码设备200包括图像分割器210、预测器220、残差处理器230和熵编码器240、加法器250、滤波器260和存储器270。预测器220可以包括帧间预测器221和帧内预测器222。残差处理器230可以包括变换器232、量化器233、解量化器234和逆变换器235。残差处理器230还可以包括减法器231。加法器250可以称为重构器或重构块生成器。根据实施方式,图像分割器210、预测器220、残差处理器230、熵编码器240、加法器250和滤波器260可以由至少一个硬件组件(例如,编码器芯片组或处理器)构成。另外,存储器270可以包括解码画面缓冲器(DPB)或者可以由数字存储介质构成。硬件组件还可以包括作为内部/外部组件的存储器270。
图像分割器210可以将输入到编码设备200的输入图像(或画面或帧)分割到一个或更多个处理器中。例如,处理器可以被称为编码单元(CU)。在这种情况下,可以根据四叉树二叉树三叉树(QTBTTT)结构从编码树单元(CTU)或最大编码单元(LCU)来递归地分割编码单元。例如,一个编码单元可以基于四叉树结构、二叉树结构和/或三元结构而被分割为深度更深的多个编码单元。在这种情况下,例如,可以首先应用四叉树结构,随后可以应用二叉树结构和/或三元结构。另选地,可以首先应用二叉树结构。可以基于不再分割的最终编码单元来执行根据本公开的编码过程。在这种情况下,可以根据图像特性基于编码效率将最大编码单元用作最终编码单元,或者如果需要,可以将编码单元递归地分割为深度更深的编码单元并且具有最优大小的编码单元可以用作最终编码单元。这里,编码过程可以包括预测、变换和重构的过程,这将在后面描述。作为另一示例,处理器还可以包括预测单元(PU)或变换单元(TU)。在这种情况下,可以从上述最终编码单元来分离或分割预测单元和变换单元。预测单元可以是样本预测的单元,并且变换单元可以是用于推导变换系数的单元和/或用于从变换系数推导残差信号的单元。
在一些情况下,单元可以与诸如块或区域的术语互换使用。在一般情况下,M×N块可以表示由M列和N行组成的样本或变换系数的集合。样本通常可以表示像素或像素值,可以仅表示亮度分量的像素/像素值,或者仅表示色度分量的像素/像素值。样本可用作与像素或像元的一幅画面(或图像)相对应的术语。
在编码设备200中,从输入图像信号(原始块、原始样本阵列)中减去从帧间预测器221或帧内预测器222输出的预测信号(预测块、预测样本阵列),以生成残差信号(残差块、残差样本阵列)并且所生成的残差信号被发送到变换器232。在这种情况下,如图所示,在编码设备200中用于从输入图像信号(原始块、原始样本阵列)减去预测信号(预测块、预测样本阵列)的单元可以称为减法器231。预测器可以对要处理的块(在下文中称为当前块)执行预测,并生成包括当前块的预测样本的预测块。预测器可以以当前块或CU为单位来确定是应用帧内预测还是应用帧间预测。如稍后在每个预测模式的描述中所述,预测器可以生成与预测有关的各种信息(诸如预测模式信息),并向熵编码器240发送所生成的信息。关于预测的信息可以在熵编码器240中编码并以比特流的形式输出。
帧内预测器222可以通过参考当前画面中的样本来预测当前块。根据预测模式,参考的样本可以位于当前块的附近,或者可以远离当前块。在帧内预测中,预测模式可以包括多个非定向模式和多个定向模式。非定向模式可以包括例如DC模式和平面模式。根据预测方向的详细程度,定向模式可以包括例如33个定向预测模式或65个定向预测模式。然而,这仅是示例,依据设置,可以使用更多或更少的定向预测模式。帧内预测器222可以通过使用应用于相邻块的预测模式来确定应用于当前块的预测模式。
帧间预测器221可以基于由参考画面上的运动矢量指定的参考块(参考样本阵列)来推导当前块的预测块。这里,为了减少在帧间预测模式下发送的运动信息的量,可以基于相邻块和当前块之间的运动信息的相关性,以块、子块或样本为单位来预测运动信息。运动信息可以包括运动矢量和参考画面索引。运动信息还可包括帧间预测方向(L0预测、L1预测、Bi预测等)信息。在帧间预测的情况下,相邻块可以包括存在于当前画面中的空间相邻块和存在于参考画面中的时间相邻块。包括参考块的参考画面和包括时间相邻块的参考画面可以相同或不同。时间相邻块可以称为并置参考块、共位CU(colCU)等,并且包括时间相邻块的参考画面可以称为并置画面(colPic)。例如,帧间预测器221可以基于相邻块来配置运动信息候选列表,并且生成指示使用哪个候选来推导当前块的运动矢量和/或参考画面索引的信息。可以基于各种预测模式来执行帧间预测。例如,在跳过模式和合并模式的情况下,帧间预测器221可以将相邻块的运动信息用作当前块的运动信息。在跳过模式下,与合并模式不同,可能无法发送残差信号。在运动矢量预测(MVP)模式的情况下,可以将相邻块的运动矢量用作运动矢量预测子,并且可以通过发信号通知运动矢量差来指示当前块的运动矢量。
预测器220可以基于以下描述的各种预测方法来生成预测信号。例如,预测器不仅可以应用帧内预测或帧间预测来预测一个块,而且可以同时应用帧内预测和帧间预测二者。这可以称为帧间帧内组合预测(CIIP)。另外,预测器可以基于帧内块复制(IBC)预测模式或调色板模式来预测块。IBC预测模式或调色板模式可用于游戏等的内容图像/视频编码,例如,屏幕内容编码(SCC)。IBC基本上在当前画面中执行预测,但是可以类似于帧间预测来执行IBC,因为参考块是在当前画面中推导出的。即,IBC可以使用本公开中描述的帧间预测技术中的至少一种。调色板模式可以被视为帧内编码或帧内预测的示例。当应用调色板模式时,可以基于关于调色板表和调色板索引的信息来发信号通知画面内的样本值。
由预测器(包括帧间预测器221和/或帧内预测器222)生成的预测信号可以用于生成重构信号或生成残差信号。变换器232可以通过向残差信号应用变换技术来生成变换系数。例如,变换技术可以包括离散余弦变换(DCT)、离散正弦变换(DST)、karhunen-loève变换(KLT)、基于图的变换(GBT)或条件非线性变换(CNT)中的至少一种。这里,GBT表示当像素之间的关系信息由图表示时从图获得的变换。CNT是指基于使用所有先前重构的像素生成的预测信号而生成的变换。另外,变换处理可以应用于具有相同大小的正方形像素块,或者可以应用于具有可变大小而非正方形的块。
量化器233可以对变换系数进行量化,并且将它们发送给熵编码器240,并且熵编码器240可以对量化信号(关于量化变换系数的信息)进行编码并且输出比特流。关于量化变换系数的信息可以称为残差信息。量化器233可以基于系数扫描顺序将块类型量化变换系数重新布置为一维矢量形式,并且基于一维矢量形式的量化变换系数来生成关于量化变换系数的信息。可以生成关于变换系数的信息。熵编码器240可以执行各种编码方法,诸如,例如指数哥伦布(Golomb)、上下文自适应变长编码(CAVLC)、上下文自适应二进制算术编码(CABAC)等。熵编码器240可以对除了量化变换系数以外的视频/图像重构所需的信息(例如,语法元素的值等)一起或分开地进行编码。可以以比特流的形式以NAL(网络抽象层)为单位发送或存储编码信息(例如,编码视频/图像信息)。视频/图像信息还可以包括关于诸如自适应参数集(APS)、画面参数集(PPS)、序列参数集(SPS)或视频参数集(VPS)的各种参数集的信息。另外,视频/图像信息还可包括一般约束信息。在本公开中,从编码设备向解码设备发送/发信号通知的信息和/或语法元素可以被包括在视频/画面信息中。视频/图像信息可以通过上述编码过程被编码并且被包括在比特流中。比特流可以通过网络发送,或者可以存储在数字存储介质中。网络可以包括广播网络和/或通信网络,并且数字存储介质可以包括诸如USB、SD、CD、DVD、蓝光、HDD、SSD等的各种存储介质。可以包括发送从熵编码器240输出的信号的发送器(未示出)和/或存储该信号的存储单元(未示出)作为编码设备200的内部/外部元件,另选地,发送器可以被包括在熵编码器240中。
从量化器233输出的量化变换系数可以用于生成预测信号。例如,可以通过利用解量化器234和逆变换器235对量化变换系数应用解量化和逆变换来重构残差信号(残差块或残差样本)。加法器250将重构的残差信号与从帧间预测器221或帧内预测器222输出的预测信号相加,以生成重构信号(重构画面、重构块、重构样本阵列)。如果要处理的块没有残差(诸如应用了跳过模式的情况),则可以将预测块用作重构块。加法器250可以称为重构器或重构块生成器。所生成的重构信号可以用于在当前画面中要处理的下一块的帧内预测,并且可以通过如下所述的滤波用于下一画面的帧间预测。
此外,在画面编码和/或重构期间,可以应用亮度映射与色度缩放(LMCS)。
滤波器260可以通过对重构信号应用滤波来改进主观/客观图像质量。例如,滤波器260可以通过对重构画面应用各种滤波方法来生成经修改的重构画面,并将经修改的重构画面存储在存储器270(具体地,存储器270的DPB)中。各种滤波方法可包括例如解块滤波、样本自适应偏移、自适应环路滤波器、双边滤波器等。滤波器260可以生成与滤波有关的各种信息,并且将生成的信息发送给熵编码器240,如稍后在各种滤波方法的描述中所述。与滤波有关的信息可以由熵编码器240编码并且以比特流的形式输出。
发送给存储器270的经修改的重构画面可以用作帧间预测器221中的参考画面。当通过编码设备应用帧间预测时,可以避免编码设备200与解码设备之间的预测不匹配,并且可以改进编码效率。
存储器270的DPB可以存储用作帧间预测器221中的参考画面的经修改的重构画面。存储器270可以存储从中推导(或编码)当前画面中的运动信息的块的运动信息和/或画面中已重构的块的运动信息。所存储的运动信息可以发送给帧间预测器221,并且用作空间相邻块的运动信息或时间相邻块的运动信息。存储器270可以存储当前画面中的重构块的重构样本,并且可以将重构样本传送给帧内预测器222。
图3是例示了可以应用本公开的实施方式的视频/图像解码设备的配置的示意图。
参照图3,解码设备300可以包括熵解码器310、残差处理器320、预测器330、加法器340、滤波器350、存储器360。预测器330可以包括帧间预测器332和帧内预测器331。残差处理器320可以包括解量化器321和逆变换器322。根据实施方式,熵解码器310、残差处理器320、预测器330、加法器340和滤波器350可以由硬件组件(例如,解码器芯片组或处理器)构成。另外,存储器360可以包括解码画面缓冲器(DPB),或者可以由数字存储介质构成。硬件组件还可以包括存储器360作为内部/外部组件。
当输入包括视频/图像信息的比特流时,解码设备300可以与在图2的编码设备中处理视频/图像信息的处理相对应地重构图像。例如,解码设备300可以基于从比特流获得的块分割相关信息来推导单元/块。解码设备300可以使用在编码设备中应用的处理器来执行解码。因此,解码的处理器可以是例如编码单元,并且可以根据四叉树结构、二叉树结构和/或三叉树结构从编码树单元或最大编码单元对编码单元进行分割。可以从编码单元推导一个或更多个变换单元。可以通过再现设备来再现通过解码设备300解码并输出的重构图像信号。
解码设备300可以接收以比特流形式从图2的编码设备输出的信号,并且可以通过熵解码器310对接收到的信号进行解码。例如,熵解码器310可以解析比特流,以推导图像重构(或画面重构)所需的信息(例如,视频/图像信息)。视频/图像信息还可以包括关于诸如自适应参数集(APS)、画面参数集(PPS)、序列参数集(SPS)或视频参数集(VPS)的各种参数集的信息。另外,视频/图像信息还可以包括一般约束信息。解码设备还可以基于关于参数集的信息和/或一般约束信息来对画面进行解码。本公开中稍后描述的发信号通知的/接收的信息和/或语法元素可以通过解码过程被解码,并从比特流中获取。例如,熵解码器310基于诸如指数哥伦布编码、CAVLC或CABAC的编码方法对比特流中的信息进行解码,并输出图像重构所需的语法元素和残差的变换系数的量化值。更具体地,CABAC熵解码方法可以接收与比特流中的每个语法元素相对应的bin,使用解码目标语法元素信息、解码目标块的解码信息或在先前级中解码的符号/bin的信息来确定上下文模型,并通过根据所确定的上下文模型预测bin的出现概率来对该bin进行算术解码,并且生成与每个语法元素的值相对应的符号。在这种情况下,在确定上下文模型之后,CABAC熵解码方法可以通过将经解码的符号/bin的信息用于下一符号/bin的上下文模型来更新上下文模型。由熵解码器310解码的信息当中与预测有关的信息可以提供给预测器(帧间预测器332和帧内预测器331),并且在熵解码器310中对其执行了熵解码的残差值(也就是说,量化变换系数和相关参数信息)可以被输入到残差处理器320。残差处理器320可以推导残差信号(残差块、残差样本、残差样本阵列)。另外,由熵解码器310解码的信息当中关于滤波的信息可以提供给滤波器350。此外,用于接收从编码设备输出的信号的接收器(未示出)可以进一步被配置为解码设备300的内部/外部元件,或者接收器可以是熵解码器310的组件。此外,根据本公开的解码设备可以称为视频/图像/画面解码设备,并且解码设备可以分类为信息解码器(视频/图像/画面信息解码器)和样本解码器(视频/图像/画面样本解码器)。信息解码器可以包括熵解码器310,并且样本解码器可以包括解量化器321、逆变换器322、加法器340、滤波器350、存储器360、帧间预测器332和帧内预测器331中的至少一个。
解量化器321可以对量化变换系数进行解量化并且输出变换系数。解量化器321可以以二维块的形式重新布置量化变换系数。在这种情况下,可以基于在编码设备中执行的系数扫描顺序来执行重新布置。解量化器321可以通过使用量化参数(例如,量化步长信息)对量化变换系数执行解量化,并且获得变换系数。
逆变换器322对变换系数进行逆变换以获得残差信号(残差块、残差样本阵列)。
预测器可以对当前块执行预测,并生成包括当前块的预测样本的预测块。预测器可以基于从熵解码器310输出的关于预测的信息来确定向当前块应用帧内预测还是帧间预测,并且可以确定具体的帧内/帧间预测模式。
预测器320可以基于以下描述的各种预测方法来生成预测信号。例如,预测器不仅可以应用帧内预测或帧间预测来预测一个块,而且可以同时应用帧内预测和帧间预测。这可以称为帧间帧内组合预测(CIIP)。另外,预测器可以基于帧内块复制(IBC)预测模式或调色板模式来预测块。IBC预测模式或调色板模式可以用于游戏等的内容图像/视频编码,例如,屏幕内容编码(SCC)。IBC基本上在当前画面中执行预测,但是可以类似于帧间预测来执行IBC,因为在当前画面中推导参考块。即,IBC可以使用本公开中描述的帧间预测技术中的至少一种。调色板模式可以被视为帧内编码或帧内预测的示例。当应用调色板模式时,可以基于关于调色板表和调色板索引的信息来发信号通知画面内的样本值。
帧内预测器331可以通过参考当前画面中的样本来预测当前块。根据预测模式,参考的样本可以位于当前块的附近,或者可以远离当前块。在帧内预测中,预测模式可以包括多个非定向模式和多个定向模式。帧内预测器331可以通过使用应用于相邻块的预测模式来确定应用于当前块的预测模式。
帧间预测器332可以基于参考画面上的由运动矢量指定的参考块(参考样本阵列)来推导当前块的预测块。在这种情况下,为了减少在帧间预测模式中发送的运动信息的量,可以基于相邻块和当前块之间的运动信息的相关性,以块、子块或样本为单位来预测运动信息。运动信息可以包括运动矢量和参考画面索引。运动信息还可包括帧间预测方向(L0预测、L1预测、Bi预测等)信息。在帧间预测的情况下,相邻块可以包括存在于当前画面中的空间相邻块和存在于参考画面中的时间相邻块。例如,帧间预测器332可以基于相邻块来配置运动信息候选列表,并基于接收到的候选选择信息来推导当前块的运动矢量和/或参考画面索引。可以基于各种预测模式来执行帧间预测,并且关于预测的信息可以包括指示针对当前块的帧间预测的模式的信息。
加法器340可以通过将所获得的残差信号与从预测器(包括帧间预测器332和/或帧内预测器331)输出的预测信号(预测块、预测样本阵列)相加来生成重构信号(重构画面、重构块、重构样本阵列)。如果要处理的块没有残差(例如当应用跳过模式时),则可以将预测块用作重构块。
加法器340可以称为重构器或重构块生成器。所生成的重构信号可以用于当前画面中要处理的下一块的帧内预测,可以通过如下所述的滤波输出,或者可以用于下一画面的帧间预测。
此外,在画面解码过程中可以应用亮度映射与色度缩放(LMCS)。
滤波器350可以通过向重构信号应用滤波来改进主观/客观图像质量。例如,滤波器350可以通过对重构画面应用各种滤波方法来生成经修改的重构画面,并将经修改的重构画面存储在存储器360(具体地,存储器360的DPB)中。各种滤波方法可包括例如解块滤波、样本自适应偏移、自适应环路滤波器、双边滤波器等。
存储器360的DPB中存储的(经修改的)重构画面可以用作帧间预测器332中的参考画面。存储器360可以存储从中推导(或解码)当前画面中的运动信息的块的运动信息和/或画面中已重构的块的运动信息。所存储的运动信息可以发送给帧间预测器260,以作为空间相邻块的运动信息或时间相邻块的运动信息来利用。存储器360可以存储当前画面中的重构块的重构样本,并且可以将重构样本传送给帧内预测器331。
在本公开中,在编码设备200的滤波器260、帧间预测器221和帧内预测器222中描述的实施方式可以与解码设备300的滤波器350、帧间预测器332和帧内预测器331相同或者分别被应用以对应于解码设备300的滤波器350、帧间预测器332和帧内预测器331。相同的内容也可以应用于帧间预测器332和帧内预测器331。
在本公开中,可以省略量化/逆量化和/或变换/逆变换中的至少一种。当省略量化/逆量化时,量化的变换系数可以被称为变换系数。当省略变换/逆变换时,变换系数可以被称为系数或残差系数,或者为了表达的统一性,仍可以被称为变换系数。
在本公开中,量化变换系数和变换系数可以分别被称为变换系数和缩放变换系数。在这种情况下,残差信息可以包括关于变换系数的信息,并且可以通过残差编码语法发信号通知关于变换系数的信息。可以基于残差信息(或关于变换系数的信息)推导变换系数,并且可以通过对变换系数逆变换(缩放)来推导缩放变换系数。可以基于对缩放变换系数逆变换(变换)来推导残差样本。这也可以在本公开的其它部分中应用/表达。
图4示意性地示出编码图像信息的分层结构。
图4可以示意性地示出根据本公开的编码层和结构编码的视频/图像。参照图4,编码视频/图像可以被分成处理视频/图像和视频/图像解码处理的视频编码层(VCL)、发送和存储编码信息的子系统以及存在于VCL和子系统之间并负责功能的网络抽象层(NAL)。
例如,在VCL中,可以生成包括压缩图像数据(切片数据)的VCL数据,或者可以生成画面参数集(PPS)、序列参数集(SPS)、视频参数集(VPS)或者包括图像解码处理另外所需的补充增强信息(SEI)消息的参数集。
例如,在NAL中,可以通过向VCL中生成的原始字节序列有效载荷(RBSP)添加头信息(NAL单元头)来生成NAL单元。在这种情况下,RBSP可以指VCL中生成的切片数据、参数集、SEI消息等。NAL单元头可以包括根据包括在对应NAL单元中的RBSP数据指定的NAL单元类型信息。
例如,如图4所示,NAL单元可以根据VCL中生成的RBSP被分类为VCL NAL单元和非VCL NAL单元。VCL NAL单元可以指包括关于图像的信息(切片数据)的NAL单元,非VCL NAL单元可以指包括图像解码所需的信息(参数集或SEI消息)的NAL单元。
头信息可以根据子系统的数据标准附到上述VCL NAL单元和非VCL NAL单元,并且包括头信息的VCL NAL单元和非VCL NAL单元可以通过网络发送。例如,NAL单元可以被转换为诸如H.266/VVC文件格式、实时传输协议(RTP)、传输流(TS)等的预定标准的数据格式并且经由各种网络发送。
另外,如上所述,NAL单元的类型可以根据包括在NAL单元中的RBSP数据结构来指定,并且关于NAL单元类型的信息可以存储在NAL单元头中并用信号通知。
例如,NAL单元可以根据是否包括关于图像的信息(切片数据)被分类为VCL NAL单元类型和非VCL NAL单元类型。另外,VCL NAL单元类型可以根据包括在VCL NAL单元中的画面的特性和类型来分类,非VCL NAL单元类型可以根据参数集的类型来分类。
以下可以是根据包括在非VCL NAL单元类型中的参数集的类型指定的NAL单元类型的示例。
-适配参数集(APS)NAL单元:包括APS的NAL单元类型
-解码参数集(DPS)NAL单元:包括DPS的NAL单元类型
-视频参数集(VPS)NAL单元:包括VPS的NAL单元类型
-序列参数集(SPS)NAL单元:包括SPS的NAL单元类型
-画面参数集(PPS)NAL单元:包括PPS的NAL单元类型
-画面头(PH)NAL单元:包括PH的NAL单元类型
上述NAL单元类型可以具有关于NAL单元类型的语法信息,该语法信息可以存储在NAL单元头中并用信号通知。例如,该语法信息可以是nal_unit_type,NAL单元类型可以被指定为nal_unit_type值。
此外,如上所述,一个画面可以包括多个切片,并且切片可以包括切片头和切片数据。在这种情况下,可以为多个切片(切片头和切片数据的集合)添加(嵌入)一个画面头。画面头(画面头语法)可以包括可共同应用于画面的信息/参数。切片头(切片头语法)可以包括可共同应用于切片的信息/参数。APS(APS语法)或PPS(PPS语法)可以包括可共同应用于一个或更多个切片或画面的信息/参数。SPS(SPS语法)可以包括可共同应用于一个或更多个序列的信息/参数。VPS(VPS语法)可以包括可共同应用于多个层的信息/参数。DPS(DPS语法)可以包括可共同应用于整个图像的信息/参数。DPS可以包括与编码视频序列(CVS)的级联有关的信息/参数。在本公开中,高级语法(HLS)可以包括APS语法、PPS语法、SPS语法、VPS语法、DPS语法、画面头语法和切片头语法中的至少一个。
此外,如上所述,通常,可以为一个画面设定一个NAL单元类型,并且如上所述,可以通过包括切片的NAL单元的NAL单元头中的nal_unit_type用信号通知NAL单元类型。下表示出NAL单元类型代码和NAL单元类型类的示例。
[表1]
Figure BDA0003827441310000151
Figure BDA0003827441310000161
此外,如上所述,画面可以由一个或更多个切片组成。另外,描述画面的参数可以通过画面头(PH)用信号通知,描述切片的参数可以通过切片头(SH)用信号通知。PH可以在其自己的NAL单元类型中传送。此外,SH可以存在于包括切片的有效载荷(即,切片数据)的NAL单元的开始处。
例如,用信号通知的PH的语法元素可以如下。
[表2]
Figure BDA0003827441310000171
Figure BDA0003827441310000181
Figure BDA0003827441310000191
Figure BDA0003827441310000201
Figure BDA0003827441310000211
Figure BDA0003827441310000221
此外,采用PH可以意指每一个编码画面必须有至少两个NAL单元。例如,两个单元中的一个可以是用于PH的NAL单元,另一个可以是用于包括切片头(SH)和切片数据的编码切片的NAL单元。这对于具有低比特率的比特流可能是问题,因为每画面的附加NAL单元可能显著影响比特率。因此,可能可取的是PH具有不消耗新NAL单元的模式。
因此,本公开提出了用于解决上述问题的实施方式。所提出的实施方式可以单独应用或组合应用。
作为示例,提出了一种用信号通知高级参数集中指示编码层视频序列(CLVS)中是否存在PH NAL单元的标志的方法。即,该标志可以指示NAL单元(即,PH NAL单元)或切片头中是否存在画面头。这里,例如,CLVS可以意指nuh_layer_id的值相同的画面单元(PU)的序列。画面单元可以是编码画面的NAL单元集合。此外,例如,高级参数集可以是序列参数集(SPS)、画面参数集(PPS)或切片头。该标志可以被称为ph_nal_present_flag。另选地,该标志可以被称为PH NAL存在标志。
另外,关于PH NAL存在标志,本公开提出了ph_nal_present_flag的值对于相同CVS的画面所参考的所有SPS被约束相同的实施方式。该约束可以意指ph_nal_present_flag的值对于多层比特流中的一个编码视频序列必须相同。
此外,作为示例,当ph_nal_present_flag的值等于1时,存在一个PH NAL单元,并且该PH NAL单元与画面的视频编码层(VCL)NAL单元关联。
此外,作为示例,当ph_nal_present_flag的值等于0时(即,当对于各个画面不存在PH NAL单元时),提出了应用以下约束的方法。
例如,上述约束可以如下。
首先,CLVS的所有画面可以仅包括一个切片。
其次,可不存在PH NAL单元。PH语法表可以连同切片头(SH)和切片数据一起存在于切片层RBSP中。即,PH语法表可以存在于切片头中。
第三,PH语法表和SH语法表可以从字节对齐位置处开始。为了实现这一点,可以在PH和SH之间添加字节对齐比特。
第四,参考SPS的所有PPS中的picture_header_extension_present_flag的值可为0。
第五,可存在于PH或SH中的所有语法元素可存在于PH而非SH中。
此外,作为示例,可以提出一种更新访问单元检测的方法。即,代替检查PH,每一个新VCL NAL单元可以意指新访问单元(AU)。即,当ph_nal_present_flag的值指示不存在PHNAL单元时,包括ph_nal_present_flag的VCL NAL单元不是先前AU的VCL NAL单元(即,先前AU的画面),可以意指解析新AU的VCL NAL单元(即,新AU的画面)。因此,当ph_nal_present_flag的值指示不存在PH NAL单元时,包括ph_nal_present_flag的VCL NAL单元可以是新AU的画面(例如,要解码的当前画面)的第一VCL NAL单元。这里,AU可以意指属于不同层并且包括与解码画面缓冲器(DPB)的输出的相同时间有关的编码画面的画面单元(PU)的集合。另外,PU可以意指关联并且具有连续解码顺序的包括一个编码画面的NAL单元集合。即,PU可以意指关联并且具有连续解码顺序的用于一个编码画面的NAL单元集合。此外,当比特流是单层比特流而非多层比特流时,AU可以与PU相同。
本公开中提出的实施方式可以如下所述实现。
例如,用信号通知本公开的实施方式中提出的ph_nal_present_flag的SPS语法可以如下。
[表3]
Figure BDA0003827441310000241
参照表3,SPS可以包括ph_nal_present_flag。
例如,语法元素ph_nal_present_flag的语义可以如下表所示。
[表4]
Figure BDA0003827441310000242
例如,参照表4,语法元素ph_nal_present_flag可以指示对于参考SPS的CLVS的各个编码画面是否存在具有与PH_NUT相同的nal_unit_type的NAL单元。例如,ph_nal_present_flag等于1可以指示对于参考SPS的CLVS的各个编码画面存在具有与PH_NUT相同的nal_unit_type的NAL单元。此外,例如,ph_nal_present_flag等于0可以指示对于参考SPS的CLVS的各个编码画面不存在具有与PH_NUH相同的nal_unit_type的NAL单元。
此外,例如,当ph_nal_present_flag为1时,以下可以适用。
-nal_unit_type为PH_NUT的NAL单元(即,PH NAL单元)可不存在于参考SPS的CLVS中。
-参考SPS的CLVS的各个画面可包括一个切片。
-PH可存在于切片层RBSP中。
此外,尽管表3和表4中提出了通过SPS用信号通知ph_nal_present_flag的方法,但是表3和表4所示的方法是本公开中提出的实施方式,也可提出通过PPS或切片头而非SPS来用信号通知ph_nal_present_flag的实施方式。
此外,例如,根据本公开中提出的实施方式,画面头语法表和画面头RBSP可以如下表所示单独地用信号通知。
[表5]
Figure BDA0003827441310000251
此外,用信号通知的画面头语法表可以如下。
[表6]
Figure BDA0003827441310000252
Figure BDA0003827441310000261
Figure BDA0003827441310000271
Figure BDA0003827441310000281
Figure BDA0003827441310000291
Figure BDA0003827441310000301
此外,根据本公开中提出的实施方式,例如,切片层RBSP可以如下用信号通知。
[表7]
Figure BDA0003827441310000302
此外,例如,根据本公开中提出的实施方式,可以应用下表所示的一个或更多个约束。
[表8]
Figure BDA0003827441310000311
例如,参照表8,如果ph_nal_present_flag为0,则picture_header_extension_present_flag的值可为0。
另外,例如,当以下两个条件为真时,比特流适用性可以要求pic_rpl_present_flag的值必须等于1。
-ph_nal_present_flag为0,并且与PH关联的画面不是IDR画面。
-ph_nal_present_flag为0,与PH关联的画面是IDR画面,并且sps_id_rpl_present_flag等于1。
这里,rpl可以意指参考画面列表。
另外,例如,当ph_nal_present_flag的值为0时,比特流适用性可以要求pic_sao_enabled_present_flag的值必须等于1。
此外,例如,当ph_nal_present_flag的值为0时,比特流适用性可以要求pic_alf_enabled_present_flag的值必须等于1。
此外,例如,当ph_nal_present_flag的值为0时,比特流适用性可以要求pic_deblocking_filter_override_present_flag的值必须等于1。
此外,例如,可以根据以下过程应用实施方式。
图5示意性地示出根据本公开的实施方式的编码过程。
参照图5,编码设备可以生成包括关于画面的信息的NAL单元(S500)。编码设备可以确定是否存在用于画面头的NAL单元(S510)并且可以决定是否存在用于画面头的NAL单元(S520)。
例如,当存在用于画面头的NAL单元时,编码设备可以生成包括包含切片头的VCLNAL单元和包含画面头的PH NAL单元的比特流(S530)。
此外,例如,当不存在用于画面头的NAL单元时,编码设备可以生成包括包含切片头和画面头的VCL NAL单元的比特流(S540)。即,画面头语法结构可以存在于切片头中。
图6示意性地示出根据本公开的实施方式的解码过程。
参照图6,解码设备可以接收包括NAL单元的比特流(S600)。此后,解码设备可以确定是否存在用于画面头的NAL单元(S610)。
例如,当存在用于画面头的NAL单元时,解码设备可以基于VCL NAL单元中的切片头和PH NAL单元中的画面头来解码/重构画面/切片/块/样本(S620)。
此外,例如,当不存在用于画面头的NAL单元时,解码设备可以基于VCL NAL单元中的切片头和画面头来解码/重构画面/切片/块/样本(S630)。
这里,(编码)比特流可以包括用于对画面解码的一个或更多个NAL单元。另外,NAL单元可以是VCL NAL单元或非VCL NAL单元。例如,VCL NAL单元可以包括关于编码切片的信息,VAL NAL单元可以具有上表1所示的NAL单元类型类“VCL”的NAL单元类型。
此外,根据本公开中提出的实施方式,比特流可以包括PH NAL单元(用于画面头的NAL单元),或者比特流可不包括用于当前画面的PH NAL单元。指示是否存在PH NAL单元的信息(例如,ph_nal_present_flag)可以通过HLS(例如,VPS、DPS、SPS、切片头等)用信号通知。
图7示意性地示出根据是否存在PH NAL单元的NAL单元中的画面头配置。例如,图7的(a)示出存在用于当前画面的PH NAL单元的情况,图7的(b)示出不存在用于当前画面的PH NAL单元,但是画面头包括在VCL NAL单元中的情况。
例如,当存在PH NAL单元时,画面头可以包括在PH NAL单元中。另一方面,当不存在PH NAL单元时,画面头仍可以配置,但是可以包括在另一类型的NAL单元中。例如,画面头可以包括在VCL NAL单元中。VCL NAL单元可以包括关于编码切片的信息。VCL单元可以包括用于编码切片的切片头。例如,当特定切片头包括表示编码/关联的切片是画面或子画面中的第一切片的信息时,画面头可以包括在包括该特定切片头的特定VAL NAL单元中。或者,例如,当不存在PH NAL单元时,画面头可以包括在诸如PPS NAL单元、APS NAL单元等的非VCL NAL单元中。
图8示意性地示出根据本文献的编码设备的图像编码方法。图8中公开的方法可以由图2所示的编码设备执行。具体地,例如,图8的S800至S820可以由编码设备的熵编码器执行。此外,尽管未示出,对当前画面进行解码的处理可以由编码设备的预测器和残差处理器执行。
编码设备确定是否存在包括与当前画面有关的画面头(PH)的PH网络抽象层(NAL)单元(S800)。编码设备可以生成用于当前画面的NAL单元。例如,用于当前画面的NAL单元可以包括:包括与当前画面有关的PH的PH NAL单元和/或包括关于当前画面中的切片的信息(例如,切片头和切片数据)的视频编码层(VCL)NAL单元。编码设备可以确定是否存在PHNAL单元。例如,当存在PH NAL单元时,编码设备可以生成包括与当前画面有关的PH的PHNAL单元和/或包括关于当前画面的切片的信息(例如,切片头和切片数据)的视频编码层(VCL)NAL单元。另外,例如,当不存在PH NAL单元时,编码设备可以生成包括与当前画面有关的PH和关于当前画面的一个切片的信息(例如,切片头和切片数据)的视频编码层(VCL)NAL单元。此外,例如,当该标志表示不存在PH NAL单元时,当前画面可以包括一个切片。这里,例如,PH可以包括表示当前画面的参数的语法元素。
编码设备基于确定结果生成针对是否存在PH NAL单元的标志(S810)。例如,编码设备可以基于确定结果生成针对是否存在PH NAL单元的标志。例如,该标志可以表示是否存在PH NAL单元。例如,当该标志的值为1时,该标志可以表示存在PH NAL单元,并且当该标志的值为0时,该标志可以表示不存在PH NAL单元。另选地,例如,当该标志的值为0时,该标志可以表示存在PH NAL单元,并且当该标志的值为1时,该标志可以表示不存在PH NAL单元。该标志的语法元素可以是上述ph_nal_present_flag。
编码设备对包括该标志的图像信息进行编码(S820)。编码设备可以对包括该标志的图像信息进行编码。图像信息可以包括该标志。此外,例如,图像信息可以包括高级语法,该标志可以包括在高级语法中。例如,高级语法可以是序列参数集(SPS)。或者,例如,高级语法可以是切片头(SH)。即,例如,该标志可以包括在切片头中。
此外,例如,当该标志表示存在PH NAL单元时,PH可以包括在PH NAL单元中,当该标志表示不存在PH NAL单元时,PH可以包括在与当前画面有关的切片头中。例如,当该标志表示存在PH NAL单元时,PH可以包括在PH NAL单元中,当该标志表示不存在PH NAL单元时,PH可以包括在包括切片头的VCL NAL单元中。即,例如,当该标志表示存在PH NAL单元时,PH可以包括在PH NAL单元中,当该标志表示不存在PH NAL单元时,PH可以包括在切片头中。例如,当该标志表示存在PH NAL单元时,图像信息可以包括包含PH的PH NAL单元和包含与当前画面有关的切片头的至少一个VCL NAL单元,当该标志表示不存在PH NAL单元时,图像信息可以包括包含PH和切片头的VCL NAL单元。此外,例如,当该标志表示不存在PH NAL单元时,图像信息可不包括PH NAL单元。
此外,例如,当该标志表示不存在PH NAL单元时,可对于包括当前画面的编码视频层序列(CLVS)中的所有画面不存在PH NAL单元。即,例如,表示是否对于编码视频层序列(CLVS)中的所有画面存在PH NAL单元的标志可以具有相同的值。此外,例如,当该标志表示不存在PH NAL单元时,CLVS中的所有画面的画面头可以包括在所有画面的切片头中。
此外,例如,AU检测可以从现有方法修改。例如,新VCL NAL单元可以意指新AU。即,例如,当该标志表示不存在PH NAL单元时,包括切片头的VCL NAL单元可以是当前画面的第一VCL NAL单元(对于新AU(即,用于当前画面的AU))。例如,该标志可以包括在VCL NAL单元的切片头中。或者,例如,当该标志表示存在PH NAL单元时,其可以是在PH NAL单元之后(即,在PH NAL单元之后用信号通知)的当前画面的第一VCL NAL单元。
此外,编码设备可以对当前画面进行解码。例如,编码设备可以基于PH的语法元素对当前画面进行解码。例如,PH的语法元素可以是表6所示的语法元素。PH可以包括表示当前画面的参数的语法元素,并且编码设备可以基于这些语法元素对当前画面进行解码。另外,例如,包括切片头的VCL NAL单元可以包括当前画面中的切片的切片数据,编码设备可以基于切片数据对当前画面中的切片进行解码。例如,解码设备可以推导当前画面的预测样本和残差样本,并且基于预测样本和残差样本来生成重构样本/重构画面。
此外,例如,编码设备可以生成并编码当前画面中的块的预测信息。在这种情况下,可以应用本公开中公开的各种预测方法(例如,帧间预测或帧内预测)。例如,编码设备可以确定是对块执行帧间预测还是帧内预测,并且可以基于RD成本确定特定帧间预测模式或特定帧内预测模式。根据所确定的模式,编码设备可以推导块的预测样本。预测信息可以包括块的预测模式信息。图像信息可以包括预测信息。
此外,例如,编码设备可以对当前画面的块的残差信息进行编码。
例如,编码设备可以通过从块的原始样本减去预测样本来推导残差样本。
然后,例如,编码设备可以将残差样本量化以推导量化残差样本,可以基于量化残差样本来推导变换系数,并且基于变换系数来生成并编码残差信息。另选地,例如,编码设备可以将残差样本量化以推导量化残差样本,对量化残差样本进行变换以推导变换系数,并且基于变换系数来生成并编码残差信息。图像信息可以包括残差信息。另外,例如,编码设备可以对图像信息进行编码并且以比特流的形式输出编码的图像信息。
编码设备可以通过预测样本和残差样本的相加来生成重构样本和/或重构画面。如上所述,可以对重构样本应用诸如去块滤波、SAO和/或ALF过程的环路内滤波过程,以改进主观/客观画面质量。
此外,包括图像信息的比特流可以通过网络或(数字)存储介质发送至解码设备。这里,网络可以包括广播网络和/或通信网络,并且数字存储介质可以包括诸如USB、SD、CD、DVD、蓝光、HDD和SSD的各种存储介质。
图9示意性地示出用于执行根据本文献的图像编码方法的编码设备。图8所示的方法可以由图9所示的编码设备执行。具体地,例如,图9的编码设备的熵编码器可以执行S800至S820。尽管未示出,对当前画面进行解码的处理可以由编码设备的预测器和残差处理器执行。
图10示意性地示出根据本文献的解码设备的图像解码方法。图10所示的方法可以由图3所示的解码设备执行。具体地,例如,图10的S1000至S1010可以由解码设备的熵解码器执行,图10的S1020可以由解码设备的预测器和残差处理器执行。
解码设备获得针对是否存在画面头(PH)网络抽象层(NAL)单元的标志(S1000)。解码设备可以通过比特流获得针对是否存在画面头(PH)网络抽象层(NAL)单元的标志。例如,解码设备可以通过比特流获得图像信息,并且图像信息可以包括该标志。另外,例如,图像信息可以包括高级语法,并且该标志可以包括在高级语法中。例如,高级语法可以是序列参数集(SPS)。或者,例如,高级语法可以是切片头(SH)。即,例如,该标志可以包括在切片头中。
例如,该标志可以表示是否存在PH NAL单元。例如,当该标志的值为1时,该标志可以表示存在PH NAL单元,当该标志的值为0时,该标志可以表示不存在PH NAL单元。另选地,例如,当该标志的值为0时,该标志可以表示存在PH NAL单元,当该标志的值为1时,该标志可以表示不存在PH NAL单元。该标志的语法元素可以是上述ph_nal_present_flag。
解码设备基于该标志获得PH(S1010)。解码设备可以基于该标志从PH NAL单元或包括切片头的VCL NAL单元获得PH。即,例如,解码设备可以基于该标志从PH NAL单元或切片头获得PH。
例如,当该标志表示存在PH NAL单元时,可以从PH NAL单元获得PH,当该标志表示不存在PH NAL单元时,可以从切片头获得PH。例如,当该标志表示存在PH NAL单元时,PH可以包括在PH NAL单元中,当该标志表示不存在PH NAL单元时,PH可以包括在包括切片头的VCL NAL单元中。即,例如,当该标志表示存在PH NAL单元时,PH可以包括在PH NAL单元中,当该标志表示不存在PH NAL单元时,PH可以包括在切片头中。例如,当该标志表示存在PHNAL单元时,图像信息可以包括包含PH的PH NAL单元和包含切片头的VCL NAL单元,当该标志表示不存在PH NAL单元时,图像信息可以包括包含PH和切片头的VCL NAL单元。此外,例如,当该标志表示不存在PH NAL单元时,图像信息可不包括PH NAL单元。
此外,例如,当该标志表示不存在PH NAL单元时,PH的当前画面可以包括一个切片。即,例如,当该标志表示不存在PH NAL单元时,图像信息可以包括包含当前画面中的一个切片的切片头的VCL NAL单元。
此外,例如,当该标志表示存在PH NAL单元时,可以通过比特流获得用于当前画面的PH NAL单元和包括当前画面的切片头的至少一个VCL NAL单元。即,例如,当该标志表示存在PH NAL单元时,图像信息可以包括用于当前画面的PH NAL单元和包含当前画面中的至少一个切片的切片头的VCL NAL单元。
此外,例如,当该标志表示不存在PH NAL单元时,可对于包括当前画面的编码视频层序列(CLVS)中的所有画面不存在PH NAL单元。即,例如,表示是否对于编码视频层序列(CLVS)中的所有画面存在PH NAL单元的标志可以具有相同的值。此外,例如,当该标志表示不存在PH NAL单元时,CLVS中的所有画面的画面头可以包括在所有画面的切片头中。
此外,例如,AU检测可以从现有方法修改。例如,新VCL NAL单元可以意指新AU。即,例如,当该标志表示不存在PH NAL单元时,包括切片头的VCL NAL单元可以是当前画面的第一VCL NAL单元(对于新AU(即,用于当前画面的AU))。例如,该标志可以包括在VCL NAL单元的切片头中。或者,例如,当该标志表示存在PH NAL单元时,其可以是在PH NAL单元之后(即,在PH NAL单元之后用信号通知)的当前画面的第一VCL NAL单元。
解码设备基于PH对与PH有关的当前画面进行解码(S1020)。解码设备可以基于PH的语法元素对当前画面进行解码。例如,PH的语法元素可以是表6所示的语法元素。PH可以包括表示当前画面的参数的语法元素,解码设备可以基于这些语法元素对当前画面进行解码。另外,例如,包括切片头的VCL NAL单元可以包括当前画面中的切片的切片数据,解码设备可以基于切片数据对当前画面中的切片进行解码。例如,解码设备可以推导当前画面的预测样本和残差样本,并且基于预测样本和残差样本来生成当前画面的重构样本/重构画面。
如上所述,可以根据需要对重构样本应用诸如去块滤波、SAO和/或ALF过程的环路内滤波过程以便改进主观/客观画面质量。
图11示意性地示出用于执行根据本文献的图像解码方法的解码设备。图10所示的方法可以由图11所示的解码设备执行。具体地,例如,图11的解码设备的熵解码器可以执行图10的S1000至S1010,图11的解码设备的预测器和残差处理器可以执行图10的S1020。
根据上述公开,可用信号通知表示是否存在PH NAL单元的标志,基于该标志自适应于比特流的比特率调节NAL单元,并且改进总体编码效率。
另外,根据本公开,可基于表示是否存在PH NAL单元的标志来为相关画面设定关于当前画面中的切片数量的约束和关于是否存在PH NAL单元的约束并且自适应于比特率控制NAL单元,从而改进总体编码效率。
在上述实施方式中,基于具有一系列步骤或方框的流程图描述了方法。本公开不限于以上步骤或方框的顺序。一些步骤或方框可以以与上述的其它步骤或方框不同的顺序执行或同时执行。此外,本领域技术人员将理解,流程图中所示的步骤不是排它的,并且可以还包括其它步骤,或者可以在不影响本公开的范围的情况下删除流程图中的一个或更多个步骤。
在本说明书中所描述的实施方式可以通过被实现在处理器、微处理器、控制器或芯片上来执行。例如,每幅图中所示的功能单元可以通过被实现在计算机、处理器、微处理器、控制器或芯片上来执行。在这种情况下,用于实现的信息(例如,关于指令的信息)或算法可以存储在数字存储介质中。
另外,应用本公开的解码设备和编码设备可以被包括在如下设备中:多媒体广播发送/接收设备、移动通信终端、家庭影院视频设备、数字影院视频设备、监控相机、视频聊天设备、诸如视频通信的实时通信设备、移动流设备、存储介质、便携式摄像机、VoD服务提供设备、过顶(OTT)视频设备、互联网流服务提供设备、三维(3D)视频设备、电话会议视频设备、运输用户设备(例如,车辆用户设备、飞机用户设备和轮船用户设备)和医疗视频装置;并且应用本公开的解码设备和编码设备可以用于处理视频信号或数据信号。例如,过顶(OTT)视频设备可以包括游戏机、蓝光播放器、互联网接入电视机、家庭影院系统、智能电话、平板计算机、数字视频记录仪(DVR)等。
另外,应用本公开的处理方法可以以计算机执行的程序的形式产生,并且可以存储在计算机可读记录介质中。根据本公开的具有数据结构的多媒体数据也可以存储在计算机可读记录介质中。计算机可读记录介质包括其中存储计算机可读数据的所有类型的存储装置。计算机可读记录介质可以包括例如BD、通用串行总线(USB)、ROM、PROM、EPROM、EEPROM、RAM、CD-ROM、磁带、软盘和光学数据存储装置。另外,计算机可读记录介质包括以载波(例如,经由互联网的传输)的形式实现的介质。另外,由编码方法生成的比特流可以存储在计算机可读记录介质中或通过有线/无线通信网络来传输。
另外,本公开的实施方式可以根据程序代码利用计算机程序产品来实现,并且程序代码可以通过本公开的实施方式在计算机中执行。程序代码可以存储在计算机可读载体上。
图12例示了应用本公开的内容流系统的结构图。
应用本公开的实施方式的内容流系统可以主要包括编码服务器、流服务器、网络服务器、媒体储存器、用户装置和多媒体输入装置。
编码服务器将从诸如智能手机、相机或便携式摄像机等的多媒体输入装置输入的内容压缩为数字数据,以生成比特流并将比特流发送到流服务器。作为另一示例,当诸如智能手机、相机或便携式摄像机等的多媒体输入装置直接生成比特流时,可以省略编码服务器。
可以通过应用了本公开的实施方式的编码方法或比特流生成方法来生成比特流,并且流服务器可以在发送或接收比特流的过程中临时存储比特流。
流服务器基于用户请求通过网络服务器向用户装置发送多媒体数据,并且网络服务器用作向用户通知服务的媒介。当用户从网络服务器请求所需的服务时,网络服务器向流服务器传送该请求,并且流服务器向用户发送多媒体数据。在这种情况下,内容流系统可以包括单独的控制服务器。在这种情况下,控制服务器用于控制内容流系统内的装置之间的命令/响应。
流服务器可以从媒体储存器和/或编码服务器接收内容。例如,当从编码服务器接收内容时,可以实时接收内容。在这种情况下,为了提供平稳的流服务,流服务器可以将比特流存储达预定时间。
用户装置的示例可以包括移动电话、智能电话、膝上型计算机、数字广播终端、个人数字助理(PDA)、便携式多媒体播放器(PMP)、导航仪、触屏PC、平板PC、超级本、可穿戴装置(例如,智能手表、智能眼镜和头戴式显示器)、数字TV、台式计算机和数字标牌等。内容流系统内的每个服务器可以作为分布式服务器来操作,在这种情况下,从每个服务器接收的数据可以被分布。
本公开中描述的权利要求可以以各种方式组合。例如,可以组合本公开的方法权利要求的技术特征以实现为设备,并且可以组合本公开的设备权利要求的技术特征以实现为方法。此外,可以组合本公开的方法权利要求的技术特征和设备权利要求的技术特征以实现为设备,并且可以组合本公开的方法权利要求的技术特征和设备权利要求的技术特征以实现为方法。

Claims (15)

1.一种由解码设备执行的图像解码方法,该图像解码方法包括以下步骤:
获得针对是否存在画面头PH网络抽象层NAL单元的标志;
基于所述标志获得PH;以及
基于所述PH对与所述PH有关的当前画面进行解码。
2.根据权利要求1所述的图像解码方法,其中,当所述标志表示存在所述PH NAL单元时,从所述PH NAL单元获得所述PH,并且
当所述标志表示不存在所述PH NAL单元时,从切片头获得所述PH。
3.根据权利要求2所述的图像解码方法,其中,当所述标志表示不存在所述PH NAL单元时,所述当前画面包括一个切片。
4.根据权利要求2所述的图像解码方法,其中,当所述标志表示存在所述PH NAL单元时,通过比特流获得用于所述当前画面的所述PH NAL单元和包括切片头的至少一个视频编码层VCL NAL单元。
5.根据权利要求2所述的图像解码方法,其中,当所述标志表示不存在所述PH NAL单元时,对于包括所述当前画面的编码视频层序列CLVS中的所有画面不存在PH NAL单元。
6.根据权利要求5所述的图像解码方法,其中,当所述标志表示不存在所述PH NAL单元时,所述CLVS中的所有所述画面的画面头被包括在所有所述画面的切片头中。
7.一种由编码设备执行的图像编码方法,该图像编码方法包括以下步骤:
确定是否存在包括与当前画面有关的画面头PH的PH网络抽象层NAL单元;
基于确定的结果生成针对是否存在所述PH NAL单元的标志;以及
对包括所述标志的图像信息进行编码。
8.根据权利要求7所述的图像编码方法,其中,当所述标志表示存在所述PH NAL单元时,所述PH被包括在所述PH NAL单元中,并且
当所述标志表示不存在所述PH NAL单元时,所述PH被包括在与所述当前画面有关的切片头中。
9.根据权利要求7所述的图像编码方法,其中,当所述标志表示不存在所述PH NAL单元时,所述当前画面包括一个切片。
10.根据权利要求7所述的图像编码方法,其中,当所述标志表示存在所述PH NAL单元时,所述图像信息包括所述PH NAL单元和包括与所述当前画面有关的切片头的至少一个视频编码层VCL NAL单元。
11.根据权利要求7所述的图像编码方法,其中,当所述标志表示不存在所述PH NAL单元时,对于包括所述当前画面的编码视频层序列CLVS中的所有画面不存在PH NAL单元。
12.根据权利要求11所述的图像编码方法,其中,当所述标志表示不存在所述PH NAL单元时,所述CLVS中的所有所述画面的画面头被包括在所有所述画面的切片头中。
13.一种非暂时性计算机可读存储介质,该非暂时性计算机可读存储介质存储比特流,所述比特流在被执行时使得解码设备执行以下步骤:
获得针对是否存在画面头PH网络抽象层NAL单元的标志;
基于所述标志获得PH;以及
基于所述PH对与所述PH有关的当前画面进行解码。
14.根据权利要求13所述的计算机可读存储介质,其中,当所述标志表示存在所述PHNAL单元时,从所述PH NAL单元获得所述PH,并且
当所述标志表示不存在所述PH NAL单元时,从切片头获得所述PH。
15.根据权利要求13所述的计算机可读存储介质,其中,当所述标志表示不存在所述PHNAL单元时,所述当前画面包括一个切片。
CN202080097941.5A 2020-01-02 2020-12-29 用于对包括画面头的图像信息进行编码的图像解码方法和设备 Pending CN115211122A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202062956634P 2020-01-02 2020-01-02
US62/956,634 2020-01-02
PCT/KR2020/019319 WO2021137588A1 (ko) 2020-01-02 2020-12-29 픽처 헤더를 포함하는 영상 정보를 코딩하는 영상 디코딩 방법 및 그 장치

Publications (1)

Publication Number Publication Date
CN115211122A true CN115211122A (zh) 2022-10-18

Family

ID=76686654

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080097941.5A Pending CN115211122A (zh) 2020-01-02 2020-12-29 用于对包括画面头的图像信息进行编码的图像解码方法和设备

Country Status (11)

Country Link
US (2) US11729402B2 (zh)
EP (1) EP4087255A4 (zh)
JP (1) JP2023509684A (zh)
KR (1) KR20220100062A (zh)
CN (1) CN115211122A (zh)
AU (1) AU2020418309B2 (zh)
BR (1) BR112022012587A2 (zh)
CA (1) CA3166542A1 (zh)
MX (1) MX2022008072A (zh)
WO (1) WO2021137588A1 (zh)
ZA (1) ZA202207802B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220119675A (ko) * 2020-01-09 2022-08-30 텔레폰악티에볼라겟엘엠에릭슨(펍) 화상 헤더 존재

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9560367B2 (en) * 2004-09-03 2017-01-31 Nokia Technologies Oy Parameter set and picture header in video coding
US9215473B2 (en) * 2011-01-26 2015-12-15 Qualcomm Incorporated Sub-slices in video coding
KR20130116782A (ko) * 2012-04-16 2013-10-24 한국전자통신연구원 계층적 비디오 부호화에서의 계층정보 표현방식
US20130343465A1 (en) * 2012-06-26 2013-12-26 Qualcomm Incorporated Header parameter sets for video coding
US9565452B2 (en) * 2012-09-28 2017-02-07 Qualcomm Incorporated Error resilient decoding unit association
US20170220283A1 (en) * 2016-01-29 2017-08-03 Microsoft Technology Licensing, Llc Reducing memory usage by a decoder during a format change
US11356667B2 (en) * 2018-12-20 2022-06-07 Telefonaktiebolaget Lm Ericsson (Publ) Methods providing encoding and/or decoding of video using a syntax indicator and picture header

Also Published As

Publication number Publication date
WO2021137588A1 (ko) 2021-07-08
JP2023509684A (ja) 2023-03-09
US20230336744A1 (en) 2023-10-19
MX2022008072A (es) 2022-09-19
EP4087255A4 (en) 2024-01-17
US11729402B2 (en) 2023-08-15
CA3166542A1 (en) 2021-07-08
ZA202207802B (en) 2023-12-20
BR112022012587A2 (pt) 2022-09-06
AU2020418309B2 (en) 2024-04-04
KR20220100062A (ko) 2022-07-14
US20220232229A1 (en) 2022-07-21
AU2020418309A1 (en) 2022-07-28
EP4087255A1 (en) 2022-11-09

Similar Documents

Publication Publication Date Title
EP3843405A1 (en) Image coding method using history-based motion information, and device therefor
US20220182681A1 (en) Image or video coding based on sub-picture handling structure
US20240080486A1 (en) Syntax design method and apparatus for performing coding by using syntax
US20220303542A1 (en) Image decoding method for coding chroma quantization parameter data, and device for same
CN113455006A (zh) 图像解码方法和装置
CN114586349A (zh) 基于滤波编译视频的设备和方法
CN114208175A (zh) 基于色度量化参数数据的图像解码方法及其设备
CN114258677A (zh) 编译色度量化参数偏移相关信息的图像解码方法和设备
CN115516860A (zh) 图像解码方法及其设备
CN114930841A (zh) 用于亮度分量和色度分量的基于bdpcm的图像解码方法及其装置
CN114175660A (zh) 使用bdpcm的图像解码方法及其装置
US20240146920A1 (en) Method for decoding image by using block partitioning in image coding system, and device therefor
CN115053522A (zh) 采用自适应环路滤波器的视频或图像编码
AU2020418309B2 (en) Image decoding method and apparatus for coding image information including picture header
US20220408115A1 (en) Image decoding method and device
US20220408093A1 (en) Video decoding method and device for coding chroma quantization parameter offset-related information
US20220368917A1 (en) Image Decoding Method Using Chroma Quantization Parameter Table, And Device Therefor
CN115211120A (zh) 基于包括ols dpb参数索引的图像信息对图像进行解码的方法及其设备
CN115280771A (zh) 基于滤波相关信息信令的图像编码设备和方法
US11902528B2 (en) Method and device for signaling information related to slice in image/video encoding/decoding system
US11956450B2 (en) Slice and tile configuration for image/video coding
EP4156687A1 (en) Image decoding method and device therefor
US20230156228A1 (en) Image/video encoding/decoding method and device
US20220417526A1 (en) Image decoding method for coding dpb parameter, and device therefor
US20230029653A1 (en) Method and apparatus for signaling picture partitioning information

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination