CN115104316A - 用于切片或图片的基于nal单元类型的图像或视频编码 - Google Patents

用于切片或图片的基于nal单元类型的图像或视频编码 Download PDF

Info

Publication number
CN115104316A
CN115104316A CN202080096777.6A CN202080096777A CN115104316A CN 115104316 A CN115104316 A CN 115104316A CN 202080096777 A CN202080096777 A CN 202080096777A CN 115104316 A CN115104316 A CN 115104316A
Authority
CN
China
Prior art keywords
nal unit
unit type
picture
slice
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080096777.6A
Other languages
English (en)
Inventor
亨得利·亨得利
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Publication of CN115104316A publication Critical patent/CN115104316A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/188Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a video data packet, e.g. a network abstraction layer [NAL] unit
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

根据本文献的公开内容,可以基于与图片是否具有混合NAL单元类型相关的NAL单元类型相关信息来确定图片中的切片的NAL单元类型,并且可以为具有混合NAL单元类型的图片提供与IRAP和另一类型的NAL单元混合的类型。

Description

用于切片或图片的基于NAL单元类型的图像或视频编码
技术领域
本技术涉及视频或图像编码,例如,涉及用于切片或图片的基于网络抽象层(NAL)单元类型的图像或视频编码技术。
背景技术
最近,在各种领域中对诸如4K或8K超高清(UHD)图像/视频的高分辨率、高质量图像/视频的需求不断增加。随着图像/视频分辨率或质量变得更高,与传统图像/视频数据相比发送相对更多的信息或比特。因此,如果图像/视频数据经由诸如现有有线/无线宽带线路的介质发送或被存储在传统存储介质中,则传输和存储的成本容易增加。
此外,对虚拟现实(VR)和人工现实(AR)内容以及诸如全息图这样的沉浸式媒体的兴趣和需求日益增长;并且表现出与实际图像/视频不同的图像/视频特性的图像/视频(例如,游戏图像/视频)的广播也日益增长。
因此,需要高度高效的图像/视频压缩技术来有效地压缩并发送、存储或播放如上所述显示出各种特性的高分辨率、高质量图像/视频。
另外,需要用于提高图像/视频编码效率的方法,并且为此,用于有效发信号通知并编码与网络抽象层(NAL)单元相关的信息的方法是必需的。
发明内容
技术问题
本文献提供了用于提高视频/图像编码效率的方法和设备。
本文献还提供了用于基于NAL单元相关信息来提高视频/图像编码效率的方法和设备。
本文献还提供了用于提高具有混合(混合的)NAL单元类型的图片的视频/图像编码效率的方法和设备。
本文献还提供了用于允许针对相对于具有混合NAL单元类型的图片具有特定NAL单元类型的图片中的切片发信号通知或存在参考图片列表相关信息的方法和设备。
技术方案
根据本文献的实施方式,可以基于NAL单元类型相关信息来确定图片是否具有混合NAL单元类型,并且可以针对具有混合NAL单元类型的图片的切片来确定NAL单元类型。例如,基于NAL单元类型相关信息的值为1,图片中的第一切片的NAL单元类型可具有前导图片NAL单元类型,并且图片中的第二切片的NAL单元类型可具有非帧内随机访问点(IRAP)NAL单元类型或非前导图片NAL单元类型。根据本文献的实施方式,基于图片被允许具有混合NAL单元类型的情况,对于图片中具有特定NAL单元类型的切片,可以存在与发信号通知参考图片列表相关的信息。
根据本文献的实施方式,基于图片被允许具有混合NAL单元类型的情况,对于图片中具有特定NAL单元类型的切片,可以存在与发信号通知参考图片列表相关的信息。
根据本文献的实施方式,提供了由解码设备执行的视频/图像解码方法。视频/图像解码方法可以包括本文献的实施方式中公开的方法。
根据本文献的实施方式,提供了执行视频/图像解码的解码设备。解码设备可以执行本文献的实施方式中公开的方法。
根据本文献的实施方式,提供了由编码设备执行的视频/图像编码方法。视频/图像编码方法可以包括本文献的实施方式中公开的方法。
根据本文献的实施方式,提供了执行视频/图像编码的编码设备。编码设备可以执行本文献的实施方式中公开的方法。
根据本文献的实施方式,提供了存储根据本文献的实施方式中的至少一个中公开的视频/图像编码方法生成的编码后的视频/图像信息的计算机可读数字存储介质。
根据本文献的实施方式,提供了存储使解码设备执行在本文献的实施方式中的至少一个中公开的视频/图像解码方法的编码后的信息或编码后的视频/图像信息的计算机可读数字存储介质。
技术效果
本文献可以具有各种效果。例如,根据本文献的实施方式,可以提高整体图像/视频压缩效率。另外,根据本文献的实施方式,可以基于NAL单元相关信息来提高视频/图像编码效率。另外,根据本文献的实施方式,可以提高具有混合NAL单元类型的图片的视频/图像编码效率。另外,根据本文献的实施方式,对于具有混合NAL单元类型的图片,可以有效地发信号通知和编码参考图片列表相关信息。另外,根据本文献的实施方式,通过允许以混合形式包括前导图片NAL单元类型(例如,RASL_NUT、RADL_NUT)和其它非IRAP NAL单元类型(例如,TRAIL_NUT、STSA、NUT)的图片,对于具有混合NAL单元类型的图片,可以提供不仅与IRAP而且与其它类型的NAL单元混合的形式,并且据此,可以具有更灵活的特性。
可以通过本文献的详细示例获得的效果不限于以上列举的效果。例如,可以存在相关领域的普通技术人员能够从本文献中理解或推导的各种技术效果。因此,本文献的详细效果不限于在本文献中明确阐述的效果,而是可以包括可以从本文献的技术特征中理解或推导的各种效果。
附图说明
图1示意性例示了适用本文献的实施方式的视频/图像编码系统的示例。
图2是示意性例示了可以应用本文献的实施方式的视频/图像编码设备的配置的示图。
图3是例示了可以应用本文献的实施方式的视频/图像解码设备的配置的示意图。
图4表示适用本文献的实施方式的示意性视频/图像编码方法的示例。
图5表示适用本文献的实施方式的示意性视频/图像解码方法的示例。
图6示例性地表示编码图像/视频的层级结构。
图7示意性地示出了适用本文献的实施方式的熵编码方法的示例,图8示意性地示出了编码设备中的熵编码器。
图9示意性地示出了适用本文献的实施方式的熵解码方法的示例,图10示意性地示出了解码设备中的熵解码器。
图11是示出支持时间可伸缩性的比特流中NAL单元的时间层结构的示图。
图12是用于描述可能被随机访问的图片的示图。
图13是用于描述IDR图片的示图。
图14是用于描述CRA图片的示图。
图15示意性表示适用本文献的实施方式的视频/图像编码方法的示例。
图16示意性表示适用本文献的实施方式的视频/图像解码方法的示例。
图17和图18示意性例示了根据本文献的实施方式的视频/图像编码方法和相关部件的示例。
图19和图20示意性例示了根据本文献的实施方式的视频/图像解码方法和相关部件的示例。
图21例示了适用本文献中公开的实施方式的内容流系统的示例。
具体实施方式
本公开可按各种形式修改,将描述并且在附图中图示其特定实施方式。然而,这些实施方式并非旨在限制本公开。以下描述中使用的术语仅用于描述特定实施方式,而非旨在限制本公开。单数表达包括复数表达,只要清楚地不同解读即可。诸如“包括”和“具有”这样的术语旨在指示存在以下描述中使用的特征、数量、步骤、操作、元件、部件或其组合,因此应该理解,不排除存在或添加一个或更多个不同的特征、数量、步骤、操作、元件、部件或其组合的可能性。
另外,本文献描述的附图的各个配置是为了说明作为彼此不同的特征的功能而独立的图示的,并不意指各个配置通过彼此不同的硬件或不同的软件被实现。例如,可以组合配置中的两个或更多个的配置以形成一个配置,并且也可以将一个配置划分为多个配置。在不脱离本文献的主旨的情况下,配置被组合和/或分离的实施方式被包括在权利要求的范围内。
在本文献中,术语“A或B”可以意指“仅A”、“仅B”或“A和B二者”。换句话说,在本文献中,术语“A或B”可以被解释为指示“A和/或B”。例如,在本文献中,术语“A、B或C”可以意指“仅A”、“仅B”、“仅C”或“A、B、C的任何组合”。
在本文献中使用的斜杠(/)或逗号可以意指“和/或”。例如,“A/B”可以意指“A和/或B”。因此,“A/B”可以意指“仅A”、“仅B”或“A和B二者”。例如,“A、B、C”可以意指“A、B或C”。
在本文献中,“A和B中的至少一个”可以意指“仅A”、“仅B”或“A和B二者”。另外,在本文献中,表述“A或B中的至少一者”或“A和/或B中的至少一者”可以被解释为与“A和B中的至少一者”相同。
另外,在本文献中,“A、B和C中的至少一者”可以意指“仅A”、“仅B”、“仅C”或“A、B和C的任何组合”。另外,“A、B或C中的至少一者”或“A、B和/或C中的至少一者”可以意指“A、B和C中的至少一者”。
另外,在本文献中使用的括号可以意指“例如”。具体地,在表达“预测(帧内预测)”的情况下,可以指示“帧内预测”被提议为“预测”的示例。换句话说,本文献中的术语“预测”不限于“帧内预测”,并且可以指示“帧内预测”被提议为“预测”的示例。另外,即使在表达“预测(即,帧内预测)”的情况下,也可以指示“帧内预测”被提议为“预测”的示例。
本文献涉及视频/图像编码。例如,本文献中公开的方法/实施方式可以应用于通用视频编码(VVC)标准中公开的方法。另外,本文献中公开的方法/实施方式可以应用于基本视频编码(EVC)标准、AOMedia Video 1(AV1)标准、第二代音频视频编码标准(AVS2)或下一代视频/图像编码标准(例如,H.267或H.268等)中公开的方法。
本文献提议了视频/图像编码的各种实施方式,并且除非另外提到,否则以上实施方式也可以彼此组合地执行。
在本文献中,视频可以意指根据时间推移的一系列图像的集合。图片通常意指表示特定时间段中的一副图像的单元,并且切片/图块是编码时构成图片的一部分的单元。切片/图块可以包括一个或更多个编码树单元(CTU)。一个图片可以由一个或更多个切片/图块组成。图块是图片中的特定图块列和特定图块行内的CTU的矩形区域。图块列是高度等于图片的高度并且宽度由图片参数集中的语法元素指定的CTU的矩形区域。图块行是宽度由图片参数集中的语法元素指定并且高度等于图片高度的CTU的矩形区域。图块扫描是以下的分割图片的CTU的特定顺序排序:CTU在图块中的CTU光栅扫描中被连续排序,而图片中的图块在图片的图块的光栅扫描中被连续排序。切片包括可以被排他性包含在单个NAL单元中的图片的整数个完整图块或图块内的整数个连续的完整CTU行。
此外,一个图片可以被划分为两个或更多个子图片。子图片可以是图片内的一个或更多个切片的矩形区域。
像素或画素(pel)可意指构成一个图片(或图像)的最小单元。另外,“样本”可用作与像素对应的术语。样本通常可表示像素或像素值,并且可仅表示亮度分量的像素/像素值或仅表示色度分量的像素/像素值。或者,样本可以意指空间域中的像素值,或者当像素值被变换到频域中时可以意指频域中的变换系数。
单元可表示图像处理的基本单位。单元可包括图片的特定区域和与该区域有关的信息中的至少一个。一个单元可包括一个亮度块和两个色度(例如,cb、cr)块。在一些情况下,单元可与诸如块或区域这样的术语互换使用。在一般情况下,M×N块可包括M列和N行的样本(或样本数组)或变换系数的集合(或数组)。
另外,在本文献中,量化/反量化和/或变换/逆变换中的至少一者可以被省略。当量化/反量化被省略时,量化变换系数可以被称为变换系数。当变换/逆变换被省略时,变换系数可以被称为系数或残差系数,或者为了表述一致性的缘故,可以仍被称为变换系数。
在本文献中,量化变换系数和变换系数可以分别被称为变换系数和缩放变换系数。在这种情况下,残差信息可以包括关于变换系数的信息,并可以通过残差编码语法发信号通知关于变换系数的信息。可以基于残差信息(或关于变换系数的信息)来推导变换系数,并且可以通过对变换系数的逆变换(缩放)来推导缩放变换系数。可以基于对缩放变换系数的逆变换(变换)来推导残差样本。这也可以在本文献的其它部分中应用/表达。
在本文献中,在一个附图中被单独说明的技术特征可以单独实现,或者可以同时实现。
下文中,参考附图更具体地描述本文献的优选实施方式。下文中,在附图中,相同的附图标记被用于相同的元件,并且可以省略对相同元件的冗余描述。
图1例示了可以应用本文献的实施方式的视频/图像编码系统的示例。
参照图1,视频/图像编码系统可以包括源装置和接收装置。源装置可以通过数字存储介质或网络以文件或流传输的形式将编码后的视频/图像信息或数据发送到接收装置。
源装置可包括视频源、编码设备和发送器。接收装置可包括接收器、解码设备和渲染器。编码设备可被称为视频/图像编码设备,解码设备可被称为视频/图像解码设备。发送器可被包括在编码设备中。接收器可被包括在解码设备中。渲染器可包括显示器,并且显示器可被配置为单独的装置或外部部件。
视频源可通过捕获、合成或生成视频/图像的处理来获取视频/图像。视频源可包括视频/图像捕获装置和/或视频/图像生成装置。例如,视频/图像捕获装置可包括一个或更多个相机、包括先前捕获的视频/图像的视频/图像档案等。例如,视频/图像生成装置可包括计算机、平板计算机和智能电话,并且可(以电子方式)生成视频/图像。例如,可通过计算机等生成虚拟视频/图像。在这种情况下,视频/图像捕获处理可由生成相关数据的处理代替。
编码设备可对输入视频/图像进行编码。为了压缩和编码效率,编码设备可执行诸如预测、变换和量化这样的一系列过程。编码的数据(编码的视频/图像信息)可按比特流的形式输出。
发送器可通过数字存储介质或网络将以比特流的形式输出的编码的图像/图像信息或数据以文件或流传输的形式发送至接收装置的接收器。数字存储介质可包括诸如USB、SD、CD、DVD、蓝光、HDD、SSD等的各种存储介质。发送器可包括用于通过预定文件格式生成媒体文件的元件,并且可包括用于通过广播/通信网络传输的元件。接收器可接收/提取比特流并且将所接收的比特流发送至解码设备。
解码设备可通过执行与编码设备的操作对应的诸如反量化、逆变换和预测这样的一系列过程对视频/图像进行解码。
渲染器可渲染解码的视频/图像。渲染的视频/图像可通过显示器显示。
图2是示意性例示了可以应用本文献的实施方式的视频/图像编码设备的配置的示图。下文中,所谓的编码设备可以包括图像编码设备和/或视频编码设备。
参照图2,编码设备200可以包括并配置有图像分割器210、预测器220、残差处理器230、熵编码器240、加法器250、滤波器260和存储器270。预测器220可包括帧间预测器221和帧内预测器222。残差处理器230可包括变换器232、量化器233、反量化器234和逆变换器235。残差处理器230还可包括减法器231。加法器250可被称为重构器或重构块生成器。根据实施方式,上面已经描述的图像分割器210、预测器220、残差处理器230、熵编码器240、加法器250和滤波器260可由一个或更多个硬件部件(例如,编码器芯片组或处理器)配置。另外,存储器270可包括解码图片缓冲器(DPB),并且可由数字存储介质配置。硬件部件还可包括存储器270作为内部/外部部件。
图像分割器210可将输入到编码设备200的输入图像(或者图片或帧)分割成一个或更多个处理单元。例如,处理单元可被称为编码单元(CU)。在这种情况下,编码单元可根据四叉树二叉树三叉树(QTBTTT)结构从编码树单元(CTU)或最大编码单元(LCU)递归地分割。例如,一个编码单元可基于四叉树结构、二叉树结构和/或三叉树结构被分割成深度更深的多个编码单元。在这种情况下,例如,可首先应用四叉树结构,稍后可应用二叉树结构和/或三叉树结构。另选地,可首先应用二叉树结构。可基于不再分割的最终编码单元来执行根据本公开的编码过程。在这种情况下,根据图像特性基于编码效率等,最大编码单元可用作最终编码单元,或者如果需要,编码单元可被递归地分割成深度更深的编码单元,使得具有最优尺寸的编码单元可用作最终编码单元。这里,编码过程可包括诸如预测、变换和重构这样的过程(将稍后描述)。作为另一示例,处理单元还可包括预测单元(PU)或变换单元(TU)。在这种情况下,预测单元和变换单元中的每一者可从上述最终编码单元拆分或分割。预测单元可以是样本预测的单元,并且变换单元可以是用于推导变换系数的单元和/或用于从变换系数推导残差信号的单元。
在一些情况下,单元可与诸如块或区域这样的术语互换使用。通常,M×N块可表示由M列和N行组成的样本或变换系数的集合。样本通常可表示像素或像素值,并且可仅表示亮度分量的像素/像素值,也可以仅表示色度分量的像素/像素值。样本可用作与构成一个图片(或图像)的像素或像元对应的术语。
编码设备200可以通过从输入图像信号(原始块、原始样本数组)中减去从帧间预测器221或帧内预测器222输出的预测信号(预测块、预测样本数组)来生成残差信号(残差块、残差样本数组),并且所生成的残差信号被发送到变换器232。在这种情况下,如所例示的,用于在编码器200内从输入图像信号(原始块、原始样本数组)中减去预测信号(预测块、预测样本数组)的单元可以被称为减法器231。预测器可以对待处理块(下文中,被称为当前块)执行预测并生成包括当前块的预测样本的预测块。预测器可以以当前块或CU为单位确定是应用帧内预测还是应用帧间预测。预测器可以生成诸如预测模式信息这样的各种关于预测的信息,以将所生成的信息传送到熵编码器240,如随后在描述每个预测模式时描述的。关于预测的信息可以被熵编码器240编码,从而以比特流的形式输出。
帧内预测器222可参考当前图片中的样本来预测当前块。根据预测模式,所参考的样本可位于当前块附近,也可以远离当前块。在帧内预测中,预测模式可包括多个非定向模式和多个定向模式。例如,非定向模式可包括DC模式和平面模式。例如,根据预测方向的精细程度,定向模式可包括33个定向预测模式或65个定向预测模式。然而,这仅是示例,可根据设置使用更多或更少的定向预测模式。帧内预测器222可使用应用于邻近块的预测模式来确定应用于当前块的预测模式。
帧间预测器221可基于参考图片上运动矢量所指定的参考块(参考样本数组)来推导当前块的预测块。这里,为了减少在帧间预测模式下发送的运动信息量,可基于邻近块与当前块之间的运动信息的相关性以块、子块或样本为单位预测运动信息。运动信息可包括运动矢量和参考图片索引。运动信息还可包括帧间预测方向(L0预测、L1预测、Bi预测等)信息。在帧间预测的情况下,邻近块可包括存在于当前图片中的空间邻近块和存在于参考图片中的时间邻近块。包括参考块的参考图片和包括时间邻近块的参考图片可相同,还可以彼此不同。时间邻近块可被称为并置参考块、并置CU(colCU)等,并且包括时间邻近块的参考图片还可被称为并置图片(colPic)。例如,帧间预测器221可基于邻近块来配置运动信息候选列表并且生成指示哪一候选用于推导当前块的运动矢量和/或参考图片索引的信息。可基于各种预测模式执行帧间预测。例如,在跳过模式和合并模式的情况下,帧间预测器221可使用邻近块的运动信息作为当前块的运动信息。在跳过模式下,与合并模式不同,可不发送残差信号。运动矢量预测(MVP)模式可通过使用邻近块的运动矢量作为运动矢量预测器并且发信号通知运动矢量差来指示当前块的运动矢量。
预测器220可以基于随后将描述的各种预测方法来生成预测信号。例如,预测器不仅可以应用帧内预测或帧间预测来预测一个块,而且还可以同时应用帧内预测和帧间预测。这可以被称为组合的帧间和帧内预测(CIIP)。另外,预测器可以基于块内复制(IBC)预测模式或调色板模式,以便对块执行预测。IBC预测模式或调色板模式可以用于诸如屏幕内容编码(SCC)这样的游戏等的内容图像/视频编码。IBC基本上在当前图片中执行预测,但在推导当前图片中的参考块方面,其与帧间预测类似地执行。即,IBC可以使用本文献中描述的帧间预测技术中的至少一种。调色板模式可以被视为帧内编码或帧内预测的示例。当应用调色板模式时,可以基于关于调色板索引和调色板表的信息来发信号通知图片中的样本值。
通过预测器(包括帧间预测器221和/或帧内预测器222)生成的预测信号可以用于生成重构信号或者用于生成残差信号。变换器232可以通过向残差信号应用变换技术来生成变换系数。例如,变换技术可以包括离散余弦变换(DCT)、离散正弦变换(DST)、Karhunen-Loève变换(KLT)、基于图的变换(GBT)或有条件非线性变换(CNT)中的至少一种。这里,当像素之间的关系信息被例示为曲线图时,GBT意指从该曲线图获得的变换。CNT意指基于通过使用所有先前重构的像素生成的预测信号而获取的变换。另外,变换处理也可以被应用于正方形的尺寸相同的像素块,并也可以应用于不是正方形的尺寸可变的块。
量化器233可以对变换系数进行量化以将量化变换系数发送到熵编码器240,并且熵编码器240可以将量化信号(关于量化变换系数的信息)编码为编码量化信号并作为比特流输出。关于量化变换系数的信息可以被称为残差信息。量化器233可以基于系数扫描顺序将具有块形式的量化变换系数重新布置成一维矢量形式,并还基于一维矢量形式的量化变换系数来生成关于量化变换系数的信息。熵编码器240可以执行例如诸如指数哥伦布(Golomb)编码、上下文自适应可变长度编码(CAVLC)和上下文自适应二进制算术编码(CABAC)这样的各种编码方法。熵编码器240还可以一起或分别地对量化变换系数之外的视频/图像重构所必需的信息(例如,语法元素的值等)进行编码。编码后的信息(例如,编码后的视频/图像信息)可以以比特流的形式发送或以网络抽象层(NAL)单元为单位存储。视频/图像信息还可以包括关于诸如适应参数集(APS)、图片参数集(PPS)、序列参数集(SPS)或视频参数集(VPS)这样的各种参数集的信息。另外,视频/图像信息还可以包括常规约束信息。随后将在本文献中描述的被发信号通知/发送的信息和/或语法元素可以通过以上提到的编码过程被编码,从而被包括在比特流中。比特流可以通过网络发送或者被存储在数字存储介质中。这里,网络可以包括广播网络和/或通信网络等,并且数字存储介质可以包括诸如USB、SD、CD、DVD、蓝光、HDD和SSD这样的各种存储介质。用于发送从熵编码器240输出的信号的发送器(未例示)和/或用于存储信号的存储器(未例示)可以被配置为编码设备200的内部/外部元件,或者发送器也可以被包括在熵编码器240中。
从量化器233输出的量化变换系数可以用于生成预测信号。例如,反量化器234和逆变换器235向量化变换系数应用反量化和逆变换,使得可以重构残差信号(残差块或残差样本)。加法器250将重构残差信号与从帧间预测器221或帧内预测器222输出的预测信号相加,使得可以生成重构信号(重构图片、重构块、重构样本数组)。如在应用跳过模式的情况下,如果待处理块不存在残差,则可以将预测块用作重构块。加法器250可以被称为重构器或重构块生成器。所生成的重构信号可以用于将在当前图片内处理的下一个块的帧内预测,并且如随后描述的,还用于通过滤波对下一个图片进行帧间预测。
此外,可以在图片编码和/或重构处理中应用具有色度缩放的亮度映射(LMCS)。
滤波器260可以向重构信号应用滤波从而改善主观/客观图像质量。例如,滤波器260可以向重构图片应用各种滤波方法以生成修改后的重构图片,并将修改后的重构图片存储在存储器270中,具体地,存储在存储器270的DPB中。各种滤波方法可以包括例如解块滤波、样本自适应偏移、自适应环路滤波器、双边滤波器等。滤波器260可以生成与滤波相关的各种信息,以将所生成的信息传送到熵编码器240,如随后在每种滤波方法的描述中描述的。与滤波相关的信息可以由熵编码器240编码并以比特流的形式被输出。
发送到存储器270的修改后的重构图片可以被用作帧间预测器221中的参考图片。如果通过帧间预测器应用帧间预测,则可以避免编码设备200与解码设备之间的预测失配,并且可以提高编码效率。
存储器270的DPB可以存储修改后的重构图片,以用作帧间预测器221中的参考图片。存储器270可以存储从其推推导(或编码)当前图片内的运动信息的块的运动信息和/或先前重构的图片内的块的运动信息。所存储的运动信息可以被传送到帧间预测器221,以被用作空间邻近块的运动信息或时间邻近块的运动信息。存储器270可以存储当前图片中的重构块的重构样本,并可以将重构样本传送到帧内预测器222。
图3是示意性说明了适用本文献的视频/图像解码设备的配置的示图。下文中,所谓的解码设备可以包括图像解码设备和/或视频解码设备。
参照图3,解码设备300可包括熵解码器310、残差处理器320、预测器330、加法器340、滤波器350和存储器360。预测器330可包括帧间预测器332和帧内预测器331。残差处理器320可包括反量化器321和逆变换器322。根据实施方式,以上已描述的熵解码器310、残差处理器320、预测器330、加法器340和滤波器350可由硬件部件(例如,解码器芯片组或处理器)配置。另外,存储器360可包括解码图片缓冲器(DPB)或者可由数字存储介质配置。硬件部件还可包括存储器360作为内部/外部部件。
当输入包括视频/图像信息的比特流时,解码设备300可响应于在图2中例示的编码设备中处理视频/图像信息的处理来重构图像。例如,解码设备300可基于从比特流获得的块分割相关信息来推导单元/块。解码设备300可使用应用于编码设备的处理单元来执行解码。因此,例如,解码的处理单元可以是编码单元,并且编码单元可根据四叉树结构、二叉树结构和/或三叉树结构从编码树单元或最大编码单元分割。可从编码单元推导一个或更多个变换单元。另外,通过解码设备300解码和输出的重构图像信号可通过再现设备再现。
解码设备300可以以比特流的形式接收从图2中例示的编码设备输出的信号,并且可以通过熵解码器310对接收到的信号进行解码。例如,熵解码器310可以通过对比特流进行解析来推导图像重构(或图片重构)所必需的信息(例如,视频/图像信息)。视频/图像信息还可以包括关于诸如自适应参数集(APS)、图片参数集(PPS)、序列参数集(SPS)和视频参数集(VPS)这样的各种参数集的信息。另外,视频/图像信息还可以包括常规约束信息。解码设备可以进一步基于关于参数集的信息和/或常规约束信息对图片进行解码。随后将在本文献中描述的被发信号通知/接收的信息和/或语法元素可以通过解码过程被解码并从比特流获取。例如,熵解码器310可以基于诸如指数哥伦布编码、CAVLC或CABAC这样的编码方法对比特流内的信息进行解码,并输出图像重构所必需的语法元素的值和残差相关变换系数的量化值。更具体地,CABAC熵解码方法可以从比特流接收与每个语法元素对应的bin,使用待解码的语法元素信息以及邻近块和待解码块的解码信息或在前一级中解码的符号/bin的信息来确定上下文模型,并通过根据所确定的上下文模型预测bin生成概率以执行bin的算术解码来生成与每个语法元素的值对应的符号。此时,CABAC熵解码方法可以确定上下文模型,然后使用针对下一个符号/bin的上下文模型的解码符号/bin的信息来更新上下文模型。由熵解码器310解码的信息当中的关于预测的信息可以被提供到预测器(帧间预测器332和帧内预测器331),并且由熵解码器310执行熵解码的残差值(即,量化变换系数和相关的参数信息)可以被输入到残差处理器320。残差处理器320可以推推导残差信号(残差块、残差样本、残差样本数组)。另外,由熵解码器310解码的信息当中的关于滤波的信息可以被提供到滤波器350。此外,用于接收从编码设备输出的信号的接收器(未例示)可以进一步被配置为解码设备300的内部/外部元件,或者接收器也可以是熵解码器310的部件。此外,根据本文献的解码设备可以被称为视频/图像/图片解码设备,并且解码设备也可以被分为信息解码器(视频/图像/图片信息解码器)和样本解码器(视频/图像/图片样本解码器)。信息解码器可以包括熵解码器310,并且样本解码器可以包括反量化器321、逆变换器322、加法器340、滤波器350、存储器360、帧间预测器332和帧内预测器331中的至少一个。
反量化器321可将量化后的变换系数反量化以输出变换系数。反量化器321可按二维块形式重排量化后的变换系数。在这种情况下,可基于由编码设备执行的系数扫描顺序来执行重排。反量化器321可使用量化参数(例如,量化步长信息)对量化后的变换系数执行反量化并且获得变换系数。
逆变换器322对变换系数逆变换以获得残差信号(残差块、残差样本数组)。
预测器330可执行当前块的预测并生成包括当前块的预测样本的预测块。预测器可基于从熵解码器310输出的关于预测的信息来确定对当前块应用帧内预测还是帧间预测并且可确定特定帧内/帧间预测模式。
预测器可以基于随后将描述的各种预测方法来生成预测信号。例如,预测器不仅可以应用帧内预测或帧间预测来预测一个块,而且同时应用帧内预测和帧间预测。这可以被称为组合的帧间和帧内预测(CIIP)。另外,预测器可以基于块内复制(IBC)预测模式或调色板模式,以便对块执行预测。IBC预测模式或调色板模式可以用于诸如屏幕内容编码(SCC)这样的游戏等的内容图像/视频编码。IBC基本上在当前图片中执行预测,但在推导当前图片中的参考块方面,其与帧间预测类似地执行。即,IBC可以使用本文献中描述的帧间预测技术中的至少一种。调色板模式可以被视为帧内编码或帧内预测的示例。当应用调色板模式时,关于调色板表和调色板索引的信息可以被包括在视频/图像信息中并被发信号通知。
帧内预测器331可以通过参考当前图片中的样本来预测当前块。根据预测模式,所参考的样本可以位于当前块的邻居中,或者其位置可以与当前块分开。在帧内预测中,预测模式可以包括多种非定向模式和多种定向模式。帧内预测器331还可以通过使用应用于邻近块的预测模式来确定将应用于当前块的预测模式。
帧间预测器332可以基于参考图片上的运动矢量所指定的参考块(参考样本数组)来推导当前块的预测块。在这种情况下,为了减少在帧间预测模式下发送的运动信息的量,可以基于邻近块与当前块之间的运动信息相关性以块、子块或样本为单位来预测运动信息。运动信息可以包括运动矢量和参考图片索引。运动信息还可以包括关于帧间预测方向(L0预测、L1预测、Bi预测等)的信息。在帧间预测的情况下,邻近块可以包括当前图片中存在的空间邻近块和参考图片中存在的时间邻近块。例如,帧间预测器332可以基于邻近块来构造运动信息候选列表,并基于接收到的候选选择信息来推导当前块的运动矢量和/或参考图片索引。可以基于各种预测模式来执行帧间预测,并且关于预测的信息可以包括指示针对当前块的帧间预测的模式的信息。
加法器340可以将所获得的残差信号与从预测器330(包括帧内预测器331和帧间预测器332)输出的预测信号(预测块或预测样本数组)相加以生成重构信号(重构图片、重构块或重构样本数组)。如在应用跳变模式的情况下,如果不存在待处理块的残差,则预测块可以用作重构块。
加法器340可以被称为重构器或重构块生成器。所生成的重构信号可以用于在当前图片中将处理的下一个块的帧内预测,并且如随后描述的,还可以通过滤波来输出或者还可以用于下一个图片的帧间预测。
此外,具有色度缩放的亮度映射(LMCS)还可以被应用于图片解码处理。
滤波器350可以通过向重构信号应用滤波来改善主观/客观图像质量。例如,滤波器350可以通过向重构图片应用各种滤波方法来生成修改后的重构图片,并将修改后的重构图片存储在存储器360中,具体地,存储在存储器360的DPB中。各种滤波方法可以包括例如解块滤波、样本自适应偏移、自适应环路滤波器、双边滤波器等。
存储在存储器360的DPB中的(修改后的)重构图片可以被用作帧间预测器332中的参考图片。存储器360可以存储从其推推导(或解码出)当前图片中的运动信息的块的运动信息和/或已经重构的图片中的块的运动信息。所存储的运动信息可以被传送到帧间预测器332,以便被用作空间邻近块的运动信息或时间邻近块的运动信息。存储器360可以存储当前图片中的重构块的重构样本,并将重构样本传送到帧内预测器331。
在本文献中,在编码设备200的滤波器260、帧间预测器221和帧内预测器222中描述的示例性实施方式可以分别同等地或对应地应用于解码设备300的滤波器350、帧间预测器332和帧内预测器331。
此外,如上所述,在执行视频编码时,执行预测以增强压缩效率。据此,可生成包括作为待编码的当前块(即,目标编码块)的预测样本的预测块。这里,预测块包括空间域(或像素域)中的预测样本。预测块在编码设备和解码设备中相同地推导,并且编码设备可向解码设备发信号通知关于原始块与预测块之间的残差(而非原始块的原始样本值本身)的信息(残差信息)从而增强图像编码效率。解码设备可基于残差信息来推导包括残差样本的残差块,可将残差块和预测块相加以生成包括重构样本的重构块,并且可生成包括重构块的重构图片。
残差信息可通过变换过程和量化过程来生成。例如,编码设备可推导原始块与预测块之间的残差块,可对包括在残差块中的残差样本(残差样本数组)执行变换过程以推导变换系数,可对变换系数执行量化过程以推导量化后的变换系数,并且可将相关残差信息(通过比特流)用信号通知给解码设备。在这种情况下,残差信息可包括量化后的变换系数、位置信息、变换方案、变换核和量化参数等的值信息。解码设备可基于残差信息来执行反量化/逆变换过程并且可推导残差样本(或残差块)。解码设备可基于预测块和残差块来生成重构图片。此外,为了后续图片的帧间预测参考,编码设备还可对量化后的变换系数进行反量化/逆变换以推导残差块,并且可基于此来生成重构图片。
此外,如上所述,当对当前块执行预测时,可以应用帧内预测或帧间预测。在实施方式中,当向当前块应用帧间预测时,编码/解码设备的预测器(更具体地,帧间预测器)可以通过以块为单位执行帧间预测来推导预测样本。帧间预测可以表示由取决于除了当前图片之外的图片的数据元素(例如,样本值或运动信息)的方法推推导的预测。当向当前块应用帧间预测时,可以基于参考图片索引所指示的参考图片上的运动矢量所指定的参考块(参考样本数组)来推导当前块的预测块(预测样本数组)。在这种情况下,为了减少在帧间预测模式下发送的运动信息的量,可以基于邻近块与当前块之间的运动信息的相关性以块、子块或样本为单位来预测当前块的运动信息。运动信息可以包括运动矢量和参考图片索引。运动信息还可以包括帧间预测类型(L0预测、L1预测、Bi预测等)信息。在应用帧间预测的情况下,邻近块可以包括当前图片中存在的空间邻近块和参考图片中存在的时间邻近块。包括参考块的参考图片和包括时间邻近块的参考图片可以彼此相同或彼此不同。时间邻近块可以被称为诸如并置参考块、并置CU(colCU)等这样的名称,并且包括时间邻近块的参考图片可以被称为并置图片(colPic)。例如,可以基于当前块的邻近块来配置运动信息候选列表并且可以发信号通知指示选择(使用)哪个候选的标志或索引信息以便推导当前块的运动矢量和/或参考图片索引。可以基于各种预测模式来执行帧间预测,并且例如,在跳过模式和合并模式下,当前块的运动信息可以与所选择的邻近块的运动信息相同。在跳过模式的情况下,可以不像合并模式那样发送残差信号。在运动矢量预测(MVP)模式的情况下,所选择的邻近块的运动矢量可以被用作运动矢量预测子,并且可以发信号通知运动矢量差。在这种情况下,可以使用运动矢量预测子和运动矢量差之和来推导当前块的运动矢量。
根据帧间预测类型(L0预测、L1预测、Bi预测等),运动信息还可以包括L0运动信息和/或L1运动信息。L0方向运动矢量可以被称为L0运动矢量或MVL0,并且L1方向运动矢量可以被称为L1运动矢量或MVL1。基于L0运动矢量的预测可以被称为L0预测,基于L1运动矢量的预测可以被称为L1预测,并且基于L0运动矢量和L1运动矢量二者的预测可以被称为双向预测。这里,L0运动矢量可以指示与参考图片列表L0关联的运动矢量,并且L1运动矢量可以指示与参考图片列表L1关联的运动矢量。作为参考图片,参考图片列表L0可以包括按输出顺序在当前图片之前的图片,并且参考图片列表L1可以包括按输出顺序在当前图片之后的图片。之前的图片可以被称为前向(参考)图片,并且之后的图片可以被称为反向(参考)图片。参考图片列表L0还可以包括按输出顺序在当前图片之后的图片作为参考图片。在这种情况下,可以首先在参考图片列表L0中索引之前的图片,然后索引之后的图片。参考图片列表L1还可以包括按输出顺序在当前图片之前的图片作为参考图片。在这种情况下,可以首先在参考图片列表L1中索引之后的图片,然后可以索引之前的图片。这里,输出顺序可以对应于图片顺序计数(POC)顺序。
图4表示适用本文献的实施方式的示意性视频/图像编码方法的示例。
图4中公开的方法可以由图2的上述编码设备200执行。具体地,S400可由编码设备200的帧间预测器221或帧内预测器222来执行,并且S410、S420、S430和S440可分别由编码设备200的减法器231、变换器232、量化器233和熵编码器240来执行。
参照图4,编码设备可通过对当前块的预测来推导预测样本(S400)。编码设备可确定是否对当前块执行帧间预测或帧内预测,并基于RD成本确定特定的帧间预测模式或特定的帧内预测模式。根据所确定的模式,编码设备可推导当前块的预测样本。
编码设备可将当前块的预测样本与原始样本进行比较,并推导残差样本(S410)。
编码设备可通过对残差样本的变换处理来推导变换系数(S420),并可通过对推导出的变换系数进行量化来推导量化变换系数(S430)。
可基于量化参数执行量化。可以跳过变换处理和/或量化处理。当跳过变换处理时,可根据稍后描述的残差编码技术来对残差样本的(量化)(残差)系数进行编码。为了术语的统一,(量化)(残差)系数也可以被称为(量化)变换系数。
编码设备可对包括残差信息和预测信息的图像信息进行编码,并可以比特流的形式输出编码后的图像信息(S440)。预测信息可包括关于运动信息(例如,当应用帧间预测时)和预测模式信息的信息作为与预测处理相关的多个信息。残差信息可包括关于量化变换系数的信息。可对残差信息进行熵编码。可替换地,残差信息可包括关于(量化)(残差)系数的信息。
输出比特流可以通过存储介质或网络传送到解码设备。
图5表示适用本文献的实施方式的示意性视频/图像解码方法的示例。
图5中公开的方法可以由图3的上述解码设备300执行。具体地,S500可由解码设备300的帧间预测器332或帧内预测器331来执行。在S500中,可由解码设备300的熵解码器310执行对包括在比特流中的预测信息进行解码并推导相关语法元素的值的处理。S510、S520、S530和S540可分别由解码设备300的熵解码器310、反量化器321、逆变换器322和加法器340执行。
参照图5,解码设备可执行与已在编码设备中执行的操作对应的操作。解码设备可对当前块执行帧间预测或帧内预测,并基于接收到的预测信息推导预测样本(S500)。
解码设备可基于接收的残差信息推导当前块的量化变换系数(S510)。解码设备可通过熵解码从残差信息推导量化变换系数。
解码设备可对量化变换系数进行反量化并推导变换系数(S520)。可以基于量化参数执行反量化。
解码设备可通过对变换系数的逆变换处理来推导残差样本(S530)。
可以跳过逆变换处理和/或反量化处理。当跳过逆变换处理时,可从残差信息推导(量化)(残差)系数,并且可基于(量化)(残差)系数推导残差样本。
解码设备可基于残差样本和预测样本生成当前块的重构样本,并基于这些重构样本生成重构图片(S540)。此后,可以将环路滤波处理进一步应用于如上所述的重构图片。
图6示例性地示出了编码后的图像/视频的层级结构。
参照图6,编码后的图像/视频被划分为操纵图像/视频解码处理及其自身的VCL(视频编码层)、发送和存储编码信息的子系统以及存在于VCL和子系统之间并负责网络适配功能的网络抽象层(NAL)。
VCL可以生成包括压缩图像数据(切片数据)的VCL数据,或者生成包括图片参数集(图片参数集:PPS)、序列参数集(序列参数集:SPS)、视频参数集(视频参数集:VPS)等的参数集或图像的解码处理另外必要的补充增强信息(SEI)消息。
在NAL中,可以通过向在VCL中生成的原始字节序列有效载荷(RBSP)添加头信息(NAL单元头)来生成NAL单元。在这种情况下,RBSP是指在VCL中生成的切片数据、参数集、SEI消息等。NAL单元头可以包括根据对应NAL单元中所包括的RBSP数据指定的NAL单元类型信息。
另外,根据在VCL中生成的RBSP,NAL单元可以划分为VCL NAL单元和非VCL NAL单元。VCL NAL单元可以是指包括关于图像的信息(切片数据)的NAL单元,并且非VCL-NAL单元可以是指包括对图像进行解码所需的信息(参数集或SEI消息)的NAL单元。
VCL NAL单元和非VCL NAL单元可以通过根据子系统的数据标准附接头信息来通过网络发送。例如,NAL单元可以被变换为诸如H.266/VVC文件格式、实时传输协议(RTP)和传输流(TS)等这样的预定标准的数据格式,并通过各种网络来发送。
如上所述,在NAL单元中,可以根据对应NAL单元中所包括的RBSP数据结构来指定NAL单元类型,并且关于该NAL单元类型的信息可以被存储在NAL单元头中并被发信号通知。
例如,根据NAL单元是否包括关于图像的信息(切片数据),NAL单元可以大致分为VCL NAL单元类型和非VCL NAL单元类型。VCL NAL单元类型可以根据VCL NAL单元中所包括的图片的性质和类型来分类,并且非VCL NAL单元类型可以根据参数集的类型来分类。
以下是根据非VCL NAL单元类型中所包括的参数集的类型指定的NAL单元类型的示例。
-APS(自适应参数集)NAL单元:包括APS的NAL单元的类型
-DPS(解码参数集)NAL单元:包括DPS的NAL单元的类型
-VPS(视频参数集)NAL单元:包括VPS的NAL单元的类型
-SPS(序列参数集)NAL单元:包括SPS的NAL单元的类型
-PPS(图片参数集)NAL单元:包括PPS的NAL单元的类型
-PH(图片头)NAL单元:包括PH的NAL单元的类型
上述NAL单元类型具有针对NAL单元类型的语法信息,并且语法信息可以被存储在NAL单元头中并被发信号通知。例如,语法信息可以是nal_unit_type,并且可以通过nal_unit_type值指定NAL单元类型。
此外,如上所述,一个图片可以包括多个切片,并且一个切片可以包括切片头和切片数据。在这种情况下,可以向一个图片中的多个切片(切片头和切片数据集)进一步添加一个图片头。图片头(图片头语法)可以包括共用于图片的信息/参数。在本文献中,图块组可以与切片或图片相混合或者被替换为切片或图片。另外,在本文献中,图块组头可以与切片头或图片头相混合或者被替换为切片头或图片头。
切片头(切片头语法)可以包括共用于切片的信息/参数。APS(APS语法)或PPS(PPS语法)可以包括共用于一个或更多个切片或图片的信息/参数。SPS(SPS语法)可以包括共用于一个或更多个序列的信息/参数。VPS(VPS语法)可以包括共用于多个层的信息/参数。DPS(DPS语法)可以包括共用于整个视频的信息/参数。DPS可以包括与编码视频序列(CVS)的级联相关的信息/参数。在本文献中,高级语法(HLS)可以包括APS语法、PPS语法、SPS语法、VPS语法、DPS语法、图片头语法和切片头语法中的至少一个。
在本文献中,在编码设备中编码并以比特流的形式发信号通知给解码设备的图像/视频信息可以不仅包括图片中的图片分割相关信息、帧内/帧间预测信息、残差信息、环路滤波信息等,还包括切片头中所包括的信息、图片头中所包括的信息、APS中所包括的信息、PPS中所包括的信息、SPS中所包括的信息、VPS中所包括的信息和/或DPS中所包括的信息。另外,图像/视频信息还可以包括NAL单元头的信息。
如上所述,可以对高级语法(HLS)进行编码/发信号通知,以用于视频/图像编码。在本文献中,视频/图像信息可以包括HLS。例如,被编码的图片可以由一个或更多个切片构成。描述被编码的图片的参数可以在图片头(PH)中发信号通知,并且描述切片的参数可以在切片头(SH)中发信号通知。PH可以按其本身的NAL单元类型发送。SH可以存在于包括切片的有效载荷(即,切片数据)的NAL单元的起始部分。PH和SH的语法和语义的细节可以如在VVC标准中公开的。每个图片可以与PH关联。图片可以由不同类型的切片构成:帧内编码切片(即,I切片)和帧间编码切片(即,P切片和B切片)。结果,PH可以包括图片的帧内切片和图片的帧间切片所必需的语法元素。
此外,如上所述,编码设备基于诸如指数哥伦布、上下文自适应可变长度编码(CAVLC)、上下文自适应二进制算术编码(CABAC)等这样的各种编码方法来执行熵编码。此外,解码设备可基于诸如指数哥伦布编码、CAVLC或CABAC这样的编码方法来执行熵解码。在下文中,将描述熵编码/解码处理。
图7示意性地示出了适用本文献的实施方式的熵编码方法的示例,并且图8示意性地示出了编码设备中的熵编码器。图8的编码设备中的熵编码器也可以等同地或相应地应用于上述图2的编码设备200的熵编码器240。
参照图7和图8,编码设备(熵编码器)对图像/视频信息执行熵编码处理。图像/视频信息可包括分割相关信息、预测相关信息(例如,帧间/帧内预测区分信息,帧内预测模式信息,帧间预测模式信息等)、残差信息、环路滤波相关信息,或者可包括与其相关的各种语法元素。熵编码可以在语法元素单元中执行。S700和S710可由图2的编码设备200的上述熵编码器240执行。
编码设备可对目标语法元素执行二进制化(S700)。这里,二进制化可基于诸如截短莱斯二进制化处理、固定长度二进制化处理等这样的各种二进制化方法,并且可预定义用于目标语法元素的二进制化方法。二进制化处理可以由熵编码器240中的二进制化器242执行。
编码设备可对目标语法元素执行熵编码(S710)。编码设备可基于诸如上下文自适应算术编码(CABAC)或上下文自适应可变长度编码(CAVLC)这样的熵编码方案,对目标语法元素的bin串进行基于规则编码(基于上下文)或基于旁路编码的编码,并且其输出可被合并到比特流中。熵编码处理可以由熵编码器240中的熵编码处理器243执行。如上所述,可以通过(数字)存储介质或网络将比特流传送到解码设备。
图9示意性地示出了适用本文献的实施方式的熵解码方法的示例,并且图10示意性地示出了解码设备中的熵解码器。图10的解码设备中的熵解码器也可以与上述图3的解码设备300的熵解码器310等同或相应。
参考图9和图10,解码设备(熵解码器)可以对编码后的图像/视频信息进行解码。图像/视频信息可包括分割相关信息、预测相关信息(例如,帧间/帧内预测区分信息,帧内预测模式信息,帧间预测模式信息等)、残差信息、环路滤波相关信息,或者可包括与其相关的各种语法元素。熵编码可以在语法元素单元中执行。S900和S910可由图3的解码设备300的上述熵解码器310执行。
解码设备可对目标语法元素执行二进制化(S900)。这里,二进制化可基于诸如截短莱斯二进制化处理、固定长度二进制化处理等这样的各种二进制化方法,并且可预定义用于目标语法元素的二进制化方法。解码设备可通过二进制化处理推导目标语法元素的启用值的启用bin串(bin串候选)。二进制化处理可由熵解码器310中的二进制化器312执行。
解码设备可对目标语法元素执行熵解码(S910)。当从比特流中的输入比特顺序地解码和解析目标语法元素的每个bin时,解码设备将推导出的bin串与相应语法元素的启用bin串进行比较。当推导出的bin串与启用bin串之一相同时,可以将对应于bin串的值推导为语法元素的值。如果不是,则可以在进一步解析比特流中的下一比特之后再次执行上述处理。通过这些处理,即使对于比特流中的特定信息(特定语法元素)不使用开始比特或结束比特,解码设备也可以使用可变长度比特来发信号通知该信息。据此,可以将相对较少的比特分配给低值,从而提高整体编码效率。
解码设备可基于诸如CABAC、CAVLC等这样的熵编码技术对来自比特流的bin串中的各个bin执行基于上下文或基于旁路的解码。就此而论,比特流可以包括如上所述的用于图像/视频解码的各种信息。如上所述,可以通过(数字)存储介质或网络将比特流传送到解码设备。
此外,通常,可以针对一个图片设置一个NAL单元类型。NAL单元类型可以通过包括切片的NAL单元的NAL单元头中的nal_unit_type来发信号通知。nal_unit_type是用于指定NAL单元类型的语法信息,即,如下表1或表2中所示,可以指定NAL单元中所包含的RBSP数据结构的类型。
下表1示出NAL单元类型代码和NAL单元类型类别的示例。
[表1]
Figure BDA0003800333790000221
另选地,作为示例,可以如下表2中所示地定义NAL单元类型代码和NAL单元类型类别。
[表2]
Figure BDA0003800333790000231
如表1或表2中所示,NAL单元类型的名称及其值可以根据NAL单元中所包括的RBSP数据结构来指定,并可以根据NAL单元是否包括关于图像的信息(切片数据)而划分为VCLNAL单元类型和非VCL NAL单元类型。可以根据图片的性质、种类等对VCL NAL单元类型进行分类,并且可以根据参数集的种类等对非VCL NAL单元类型进行分类。例如,可以如下根据VCL NAL单元中所包括的图片的性质和种类来指定NAL单元类型。
TRAIL:它指示包括尾随图片/子图片的编码切片数据的NAL单元的类型。例如,nal_unit_type可以被定义为TRAIL_NUT,并且nal_unit_type的值可以被指定为0。
这里,尾随图片是指可以按输出顺序和解码顺序随机访问的图片之后的图片。尾随图片可以是按输出顺序在关联的IRAP图片之后的非IRAP图片,并且不是STSA图片。例如,与IRAP图片关联的尾随图片按解码顺序在IRAP图片之后。不允许按输出顺序在关联的IRAP图片之后并按解码顺序在关联的IRAP图片之前的图片。
STSA(逐步时间子层访问):它指示包括STSA图片/子图片的编码切片数据的NAL单元的类型。例如,nal_unit_type可以被定义为STSA_NUT,并且nal_unit_type的值可以被指定为1。
这里,STSA图片是可以在支持时间可伸缩性的比特流中的时间子层之间切换的图片,并且是指示有可能进行从下子层到比下子层高一步的上子层的上切换的位置的图片。STSA图片不将与STSA图片TemporalId相同以及与STSA图片相同的层中的图片用于帧间预测。按解码顺序与STSA图片TemporalId相同并且在相同层中的STSA图片之后的图片不将按解码顺序与STSA图片TemporalId相同并在相同层中的STSA图片之前的图片用于帧间预测参考。STSA图片使得在STSA图片中能够进行从紧接的下一子层到包括STSA图片的子层的上切换。在这种情况下,被编码的图片不得属于最低子层。即,STSA图片必须始终具有大于0的TemporalId。
RADL(随机访问可解码前导(图片)):它指示包括要编码的RADL图片/子图片的切片数据的NAL单元的类型。例如,nal_unit_type可以被定义为RADL_NUT,并且nal_unit_type的值可以被指定为2。
这里,所有RADL图片都是前导图片。RADL图片不被用作同一关联的IRAP图片的尾随图片的解码处理的参考图片。具体地,具有等于layerId的nuh_layer_id的RADL图片是按输出顺序在与RADL图片关联的IRAP图片之后的图片,并且不被用作具有等于layerId的nuh_layer_id的图片的解码处理的参考图片。当field_seq_flag(即,sps_field_seq_flag)为0时,所有RADL图片都按解码顺序在同一关联的IRAP图片的所有非前导图片之前(即,如果存在RADL图片)。此外,前导图片是指按输出顺序在相关IRAP图片之前的图片。
RASL(随机访问跳过前导(图片)):它指示包括要编码的RASL图片/子图片的切片数据的NAL单元的类型。例如,nal_unit_type可以被定义为RASL_NUT,并且nal_unit_type的值可以被指定为3。
这里,所有RASL图片都是关联的CRA图片的前导图片。当关联的CRA图片具有其值为1的NoOutputBeforeRecoveryFlag时,由于RASL图片可能包括对比特流中不存在的图片的引用,所以可能既无法输出也无法正确解码RASL图片。RASL图片不被用作同一层的非RASL图片的解码处理的参考图片。然而,同一层的RASL图片中的RADL子图片可以用于对与和RASL图片相同的CRA图片关联的RADL图片中的并置RADL子图片的帧间预测。当field_seq_flag(即,sps_field_seq_flag)为0时,所有RASL图片都按解码顺序在同一关联的CRA图片的所有非前导图片之前(即,如果存在RASL图片)。
对于非IRAP VCL NAL单元类型,可以存在保留的nal_unit_type。例如,nal_unit_type可以被定义为RSV_VCL_4和RSV_VCL_6,并且nal_unit_type的值可以分别被指定为4至6。
这里,帧内随机访问点(IRAP)是指示用于能够随机访问的图片的NAL单元的信息。IRAP图片可以是CRA图片或IDR图片。例如,IRAP图片是指具有如上表1或表2中一样的nal_unit_type被定义为IDR_W_RADL、IDR_N_LP和CRA_NUT并且nal_unit_type的值可以被分别指定为7至9的NAL单元类型的图片。
IRAP图片在解码处理中不将同一层中的任何参考图片用于帧间预测。换句话说,IRAP图片在解码处理中不引用除其本身以外的任何图片以用于帧间预测。比特流中按解码顺序的第一图片成为IRAP或GDR图片。对于单层比特流,如果必要的参数集在需要引用它时可用,则可以在不执行按解码顺序在IRAP图片之前的图片的解码处理的情况下,准确地解码按解码顺序的编码层视频序列(CLVS)的所有后续非RASL图片和IRAP图片。
IRAP图片的mixed_nalu_types_in_pic_flag的值为0。当图片的mixed_nalu_types_in_pic_flag的值为0时,图片中的一个切片可以具有从IDR_W_RADL到CRA_NUT的范围内的NAL单元类型(nal_unit_type)(例如,表1或表2中的NAL单元类型的值为7至9),并且图片中的所有其它切片可以具有相同的NAL单元类型(nal_unit_type)。在这种情况下,该图片可以被视为IRAP图片。
瞬时解码刷新(IDR):它指示包括要编码的IDR图片/子图片的切片数据的NAL单元的类型。例如,IDR图片/子图片的nal_unit_type可以被定义为IDR_W_RADL或IDR_N_LP,并且nal_unit_type的值可以被分别指定为7或8。
这里,IDR图片可以在解码处理中不使用帧间预测(即,它不参考除其本身以外的图片进行帧间预测),但可以在比特流中成为按解码顺序的第一图片,或者可以在比特流中稍后出现(即,不是第一,而是稍后)。每个IDR图片是按解码顺序的编码视频序列(CVS)的第一图片。例如,当IDR图片与可解码前导图片关联时,IDR图片的NAL单元类型可以被表示为IDR_W_RADL,而当IDR图片与前导图片没有关联时,IDR图片的NAL单元类型可以被表示为IDR_N_LP。即,其NAL单元类型为IDR_W_RADL的IDR图片可以不具有存在于比特流中的关联的RASL图片,但可以在比特流中具有关联的RADL图片。其NAL单元类型为IDR_N_LP的IDR图片不具有存在于比特流中的关联的前导图片。
清洁随机访问(CRA):它指示包括要编码的CRA图片/子图片的切片数据的NAL单元的类型。例如,nal_unit_type可以被定义为CRA_NUT,并且nal_unit_type的值可以被指定为9。
这里,CRA图片可以在解码处理中不使用帧间预测(即,它不参考除其本身以外的图片进行帧间预测),但可以在比特流中成为按解码顺序的第一图片,或者可以在比特流中稍后出现(即,不是第一,而是稍后)。CRA图片可以具有存在于比特流中的关联的RADL或RASL图片。对于其中NoOutputBeforeRecoveryFlag的值为1的CRA图片,关联的RASL图片可以不由解码器输出。这是因为,由于包括了对比特流中不存在的图片的参考,因此在这种情况下不可能进行解码。
逐渐解码刷新(GDR):它指示包括要编码的GDR图片/子图片的切片数据的NAL单元的类型。例如,nal_unit_type可以被定义为GDR_NUT,并且nal_unit_type的值可以被指定为10。
这里,GDR图片的pps_mixed_nalu_types_in_pic_flag值可以为0。当图片的pps_mixed_nalu_types_in_pic_flag的值为0并且图片中的一个切片具有GDR_NUT的NAL单元类型时,图片中的所有其它切片都具有相同的NAL单元类型(nal_unit_type)的值,并且在这种情况下,该图片可以在接收到第一切片后成为GDR图片。
另外,例如,可以根据非VCL NAL单元中所包括的参数的种类来指定NAL单元类型,并且,如以上表1或表2中所示,可以包括下述NAL单元类型(nal_unit_type):例如,指示包括视频参数集的NAL单元的类型的VPS_NUT、指示包括序列参数集的NAL单元的类型的SPS_NUT、指示包括图片参数集的NAL单元的类型的PPS_NUT和指示包括图片头的NAL单元的类型的PH_NUT。
此外,支持时间可伸缩性的比特流(或时间可伸缩比特流)包括关于时间伸缩的时间层的信息。关于时间层的信息可以是根据NAL单元的时间可伸缩性指定的时间层的标识信息。例如,时间层的标识信息可以使用temporal_id语法信息,并且temporal_id语法信息可以被存储在编码设备中的NAL单元头中,并发信号通知给解码设备。下文中,在本说明书中,时间层可以被称为子层、时间子层、时间可伸缩层等。
图11是示出支持时间可伸缩性的比特流中的NAL单元的时间层结构的示图。
当比特流支持时间可伸缩性时,比特流中所包括的NAL单元具有时间层的标识信息(例如,temporal_id)。作为示例,由其temporal_id值为0的NAL单元构成的时间层可以提供最低时间可伸缩性,并且由其temporal_id值为2的NAL单元构成的时间层可以提供最高时间可伸缩性。
在图11中,标记有I的块是指I图片,并且标记有B的块是指B图片。另外,箭头指示与图片是否参考另一图片有关的参考关系。
如图11中所示,其temporal_id值为0的时间层的NAL单元是可以供其temporal_id值为0、1或2的时间层的NAL单元参考的参考图片。其temporal_id值为1的时间层的NAL单元是可以供其temporal_id值为1或2的时间层的NAL单元参考的参考图片。其temporal_id值为2的时间层的NAL单元可以是相同时间层(即,其temporal_id值为2的时间层)的NAL单元可以参考的参考图片,或者可以是不供其它图片参考的非参考图片。
如果如图11中所示其temporal_id值为2的时间层(即,最高时间层)的NAL单元是非参考图片,则在解码处理中从比特流中提取(或去除)这些NAL单元而不影响其它图片。
此外,在上述NAL单元类型当中,IDR和CRA类型是指示包括能够随机访问(或拼接)的图片(即,随机访问点(RAP)或用作随机访问点的帧内随机访问点(IRAP)图片)的NAL单元的信息。换句话说,IRAP图片可以是IDR或CRA图片,并可以仅包括I切片。在比特流中,按解码顺序的第一图片成为IRAP图片。
如果在比特流中包括IRAP图片(IDR、CRA图片),则可以存在按输出顺序在IRAP图片之前但按解码顺序在其之后的图片。这些图片被称为前导图片(LP)。
图12是用于描述可以进行随机访问的图片的示图。
可以随机访问的图片(即,用作随机访问点的RAP或IRAP图片)是随机访问期间比特流中按解码顺序的第一图片,并且仅包括I切片。
图12示出了图片的输出顺序(或显示顺序)和解码顺序。如例示的,图片的输出顺序和解码顺序可以彼此不同。为了方便起见,在将图片划分为预定组的同时进行描述。
属于第一组(I)的图片指示按输出顺序和解码顺序都在IRAP图片之前的图片,并且属于第二组(II)的图片指示按输出顺序在IRAP图片之前但按解码顺序在其之后的图片。第三组(III)的图片按输出顺序和解码顺序都在IRAP图片之后。
可以对第一组(I)的图片进行解码和输出,而不管IRAP图片如何。
在IRAP图片之前输出的属于第二组(II)的图片被称为前导图片,并且当IRAP图片用作随机访问点时,前导图片可能成为解码处理中的问题。
按输出顺序和解码顺序在IRAP图片之后的属于第三组(III)的图片被称为正常图片。正常图片不被用作前导图片的参考图片。
在比特流中出现随机访问的随机访问点成为IRAP图片,并且随着第二组(II)的第一图片被输出,随机访问开始。
图13是用于描述IDR图片的示图。
IDR图片是当一组图片具有封闭结构时成为随机访问点的图片。如上所述,由于IDR图片是IRAP图片,因此它仅包括I切片,并且可以是比特流中按解码顺序的第一图片,或者可以出现在比特流的中间。当IDR图片被解码时,存储在解码图片缓冲器(DPB)中的所有参考图片被标记为“未用于参考”。
图13中示出的条指示图片,并且箭头指示与图片是否可以使用另一图片作为参考图片有关的参考关系。箭头上的x标记指示图片不能参考该箭头所指示的图片。
如所示出的,其POC为32的图片是IDR图片。POC是25至31,并且在IDR图片之前输出的图片是前导图片1310。其POC为33或更大的图片对应于正常图片1320。
按输出顺序在IDR图片之前的前导图片1310可以使用不同于IDR图片的前导图片作为参考图片,但不可以使用按输出顺序和解码顺序在前导图片1310之前的过去图片1330作为参考图片。
按输出顺序和解码顺序在IDR图片之后的正常图片1320可以参考IDR图片、前导图片和其它正常图片来解码。
图14是用于描述CRA图片的示图。
CRA图片是当一组图片具有开放结构时成为随机访问点的图片。如上所述,由于CRA图片也是IRAP图片,因此它仅包括I切片,并且可以是比特流中按解码顺序的第一图片,或者可以出现在比特流的中间以供正常显示。
图14中示出的条指示图片,并且箭头指示与图片是否可以使用另一图片作为参考图片有关的参考关系。箭头上的x标记指示一张图片或多张图片不能参考该箭头所指示的图片。
按输出顺序在CRA图片之前的前导图片1410可以使用CRA图片、其它前导图片和按输出顺序和解码顺序在前导图片1410之前的过去图片1430中的全部作为参考图片。
相反地,按输出顺序和解码顺序在CRA图片之后的正常图片1420可以参考与CRA图片不同的正常图片来解码。正常图片1420可以不使用前导图片1410作为参考图片。
此外,在VVC标准中,可以允许被编码的图片(即,当前图片)包括不同NAL单元类型的切片。当前图片是否包括不同NAL单元类型的切片可以基于语法元素mixed_nalu_types_in_pic_flag来指示。例如,当当前图片包括不同NAL单元类型的切片时,语法元素mixed_nalu_types_in_pic_flag的值可以被表示为1。在这种情况下,当前图片必须参考包括具有值1的mixed_nalu_types_in_pic_flag的PPS。标志(mixed_nalu_types_in_pic_flag)的语义如下:
当语法元素mixed_nalu_types_in_pic_flag的值为1时,可以指示参考PPS的每个图片具有一个或更多个VCL NAL单元,VCL NAL单元没有相同的NAL单元类型(nal_unit_type),并且该图片不是IRAP图片。
当语法元素mixed_nalu_types_in_pic_flag的值为0时,可以指示参考PPS的每个图片具有一个或更多个VCL NAL单元,并且参考PPS的每个图片的VCL NAL单元具有相同值的NAL单元类型(nal_unit_type)。
当no_mixed_nalu_types_in_pic_constraint_flag的值为1时,mixed_nalu_types_in_pic_flag的值必须为0。no_mixed_nalu_types_in_pic_constraint_flag语法元素指示关于图片的mixed_nalu_types_in_pic_flag的值是否必须为0的约束。例如,基于从较高级语法(例如,PPS)或包括关于约束的信息(例如,GCI;一般约束信息)的语法发信号通知的no_mixed_nalu_types_in_pic_constraint_flag信息,可以确定mixed_nalu_types_in_pic_flag的值是否必须为0。
在还包括具有不同值的NAL单元类型的一个或更多个切片的图片picA中(即,当图片picA的mixed_nalu_types_in_pic_flag的值为1时),对于具有从IDR_W_RADL到CRA_NUT的范围内的NAL单元类型值nalUnitTypeA的每个切片(例如,在表1或表2中,NAL单元类型的值为7至9),可以应用以下。
-切片必须属于其中相应subpic_treated_as_pic_flag的值为1的子图片subpicA。这里,subpic_treated_as_pic_flag是关于在CLVS中编码的每个图片的第i个子图片是否在除环路滤波操作以外的解码处理中被当作图片的信息。例如,当subpic_treated_as_pic_flag的值为1时,可以指示第i个子图片在除环路滤波操作以外的解码处理中被当作图片。另选地,当subpic_treated_as_pic_flag的值为0时,可以指示第i个子图片在除环路滤波操作以外的解码处理中未被当作图片。
-切片不得属于包括具有不等于nalUnitTypeA的NAL单元类型(nal_unit_type)的VCL NAL单元的picA的子图片。
-对于按解码顺序在CLVS之后的所有PU,subpicA中的切片的RefPicList或RefPicList不得包括活动条目中按解码顺序在picA之前的图片。
为了操作如上所述的概念,可以指定以下内容。例如,可以将以下内容应用于特定图片的VCL NAL单元。
-当mixed_nalu_types_in_pic_flag的值为0时,对于在图片中编码的所有切片NAL单元,NAL单元类型(nal_unit_type)的值必须相同。图片或PU可以被视为具有与在图片或PU中编码的切片NAL单元相同的NAL单元类型。
-否则(当mixed_nalu_types_in_pic_flag的值为1时),一个或更多个VCL NAL单元必须具有从IDR_W_RADL到CRA_NUT的范围内的特定值的NAL单元类型(例如,表1或表2中NAL单元类型的值为7至9),并且所有其它VCL NAL单元必须具有与GRA_NUT相同的NAL单元类型或从TRAIL_NUT到RSV_VCL_6的范围内的特定值的NAL单元类型(例如,表1或表2中NAL单元类型的值为0至6)。
在当前VVC标准中,在具有混合NAL单元类型的图片的情况下,可能存在至少以下问题。
1.当图片包括IDR和非IRAP NAL单元时,并且当用于参考图片列表(RPL)的信令存在于切片头中时,该信令也必须存在于IDR切片的头中。当sps_idr_rpl_present_flag的值为1时,RPL信令存在于IDR切片的切片头中。当前,即使当存在一个或更多个具有混合NAL单元类型的图片时,该标志(sps_idr_rpl_present_flag)的值也可以为0。这里,sps_idr_rpl_present_flag语法元素可以指示RPL语法元素是否可以存在于具有诸如IDR_N_LP或IDR_W_RADL这样的NAL单元类型的切片的切片头中。例如,当sps_idr_rpl_present_flag的值为1时,它可以指示RPL语法元素可以存在于具有诸如IDR_N_LP或IDR_W_RADL这样的NAL单元类型的切片的切片头中。另选地,当sps_idr_rpl_present_flag的值为0时,它可以指示RPL语法元素不存在于具有诸如IDR_N_LP或IDR_W_RADL这样的NAL单元类型的切片的切片头中。
2.当当前图片参考mixed_nalu_types_in_pic_flag的值为1的PPS时,当前图片的VCL NAL单元中的一个或更多个必须具有从IDR_W_RADL到CRA_NUT的范围内的特定值的NAL单元类型(例如,以上表1或表2中NAL单元类型的值为7至9),并且所有其它VCL NAL单元必须具有与GRA_NUT相同的NAL单元类型或从TRAIL_NUT到RSV_VCL_6的范围内的特定值的NAL单元类型(例如,以上表1或表2中NAL单元类型的值为0至6)。该约束仅应用于包括IRAP和非IRAP NAL单元类型的混合情况的当前图片。然而,其尚未正确应用于包括RASL/RADL和非IRAP NAL单元类型的混合情况的图片。
本文献提供了以上提到的问题的解决方案。即,如上所述,包括两个或更多个子图片的图片(即,当前图片)可以具有混合NAL单元类型。在当前VVC标准的情况下,具有混合NAL单元类型的图片可以具有IRAP NAL单元类型和非IRAP NAL单元类型的混合形式。然而,与CRA NAL单元类型关联的前导图片也可以具有与非IRAP NAL单元类型混合的形式,并且在当前标准下不支持具有该混合NAL单元类型的图片。因此,需要针对以混合形式具有CRANAL单元类型和非IRAP NAL单元类型的图片的解决方案。
因此,本文献提供了允许以混合形式包括前导图片NAL单元类型(例如,RASL_NUT、RADL_NUT)和另一非IRAP NAL单元类型(例如,TRAIL_NUT、STSA、NUT)的图片的方法。另外,本文献定义了允许在IDR子图片和其它非IRAP子图片混合的情况下存在或发信号通知参考图片列表的约束。因此,具有混合NAL单元类型的图片设置有不仅混合有IRAP而且还混合有CRA NAL单元的形式,以具有更灵活的特性。
例如,其可以在以下实施方式中应用,因此可以解决上述问题。以下实施方式可以独立地或组合地应用。
在一个实施方式中,当允许图片具有混合NAL单元类型时(当mixed_nal_types_in_pic_flag的值为1时),关于参考图片列表的信令允许它甚至对于具有IDR型NAL单元类型(例如,IDR_W_RADL或IDR_N_LP)的切片也存在。可以如下地表示该约束。
-当存在至少一个引用其mixed_nal_types_in_pic_flag的值为1的SPS的PPS时,sps_idr_rpl_present_flag的值必须成为1。该约束可以是比特流一致性的要求。
另选地,在一个实施方式中,对于具有混合NAL单元类型的图片,允许图片包括具有前导图片的特定NAL单元类型(例如,RADL或RASL)和非前导图片的特定NAL单元类型(非IRAP)的切片。这可以被如下地表示。
对于特定图片的VCL NAL单元,可以应用以下内容。
-当mixed_nalu_types_in_pic_flag的值为0时,对于在图片中编码的所有切片NAL单元,NAL单元类型(nal_unit_type)的值必须相同。图片或PU可以被视为具有与在图片或PU中编码的切片NAL单元相同的NAL单元类型。
-否则(当mixed_nalu_types_in_pic_flag的值为1时),必须满足以下之一(即,以下之一可以具有为真的值)。
1)一个或更多个VCL NAL单元必须具有从IDR_W_RADL到CRA_NUT的范围内的特定值的NAL单元类型(nal_unit_type)(例如,以上表1或表2中NAL单元类型的值为7至9),并且所有其它VCL NAL单元必须具有与GRA_NUT相同的NAL单元类型或从TRAIL_NUT到RSV_VCL_6的范围内的特定值的NAL单元类型(例如,以上表1或表2中NAL单元类型的值为0至6)。
2)一个或更多个VCL NAL单元必须都具有与RADL_NUT(例如,在以上表1或表2中,NAL单元类型的值为2)或RASL_NUT(例如,在以上表1或表2中,NAL单元类型的值为3)相同的NAL单元类型的特定值,并且所有其它VCL NAL单元必须具有与TRAIL_NUT(例如,以上表1或表2中的NAL单元类型的值为0)、STSA_NUT(例如,以上表1或表2中的NAL单元类型的值为1)、RSV_VCL_4(例如,以上表1或表2中的NAL单元类型的值为4)、RSV_VCL_5(例如,以上表1或表2中NAL单元类型的值为5)、RSV_VCL_6(例如,以上表1或表2中NAL单元类型的值为6)或GRA_NUT相同的NAL单元类型的特定值。
此外,本文献提出了即使对于单层比特流也提供具有上述混合NAL单元类型的图片的方法。作为实施方式,在单层比特流的情况下,可以应用以下约束。
-在比特流中,除按解码顺序的第一图片以外的每张图片被认为与按解码顺序的前一IRAP图片关联。
-如果图片是IRAP图片的前导图片,则它必须是RADL或RASL图片。
-如果图片是IRAP图片的尾随图片,则它必须既不是RADL也不是RASL图片。
-RASL图片不得存在于与IDR图片关联的比特流中。
-RADL图片不得存在于与其NAL单元类型(nal_unit_type)为IDR_N_LP的IDR图片关联的比特流中。
当被引用时,并且当每个参数集可用时,可以通过丢弃IRAP PU之前的所有PU来在IRAP PU的位置处执行随机访问(并且可以按解码顺序正确地解码IRAP图片和所有后续的非RASL图片)。
-按解码顺序在IRAP图片之前的图片必须按输出顺序在IRAP图片之前,并且必须按输出顺序在与IRAP图片关联的RADL图片之前。
-与CRA图片关联的RASL图片必须按输出顺序在与CRA图片关联的RADL图片之前。
-与CRA图片关联的RASL图片必须按输出顺序在按解码顺序在CRA图片之前的IRAP图片之后。
-如果field_seq_flag的值为0并且当前图片是与IRAP图片关联的前导图片,则它必须按解码顺序在与同一IRAP图片关联的所有非前导图片之前。否则,当图片picA和picB分别是按解码顺序的与IRAP图片关联的第一个和最后一个前导图片时,按解码顺序在picA之前最多只能存在一个非前导图片,并且按解码顺序在picA和picB之间不得存在非前导图片。
预备以下附图是为了说明本文献的具体示例。由于附图中描述的特定术语或名称或特定装置的名称(例如,语法/语法元素的名称等)被呈现为示例,因此本文献的技术特征不限于下图中使用的特定名称。
图15示意性表示适用本文献的实施方式的视频/图像编码方法的示例。可以由图2中公开的编码设备200执行图15中公开的方法。
参照图15,编码设备可以确定图片中的切片的NAL单元类型(S1500)。
例如,编码设备可以根据如以上表1和表2中描述的图片或子图片的性质、种类等来确定NAL单元类型,并且基于图片或子图片的NAL单元类型,可以确定每个切片的NAL单元类型。
例如,当mixed_nalu_types_in_pic_flag的值为0时,与PPS关联的图片中的切片可以被确定为相同的NAL单元类型。即,当mixed_nalu_types_in_pic_flag的值为0时,在包括关于图片的第一切片的信息的第一NAL单元的第一NAL单元头中定义的NAL单元类型与在包括关于同一图片的第二切片的信息的第二NAL单元的第二NAL单元头中定义的NAL单元类型相同。另选地,对于mixed_nalu_types_in_pic_flag的值为1的情况,与PPS关联的图片中的切片可以被确定为不同的NAL单元类型。这里,可以基于在上述实施方式中提出的方法来确定图片中的切片的NAL单元类型。
编码设备可以生成NAL单元类型相关信息(S1510)。NAL单元类型相关信息可以包括与上述实施方式和/或以上表1和表2中描述的NAL单元类型相关的信息/语法元素。例如,与NAL单元类型相关的信息可以包括PPS中所包括的mixed_nalu_types_in_pic_flag语法元素。另外,与NAL单元类型相关的信息可以在包括关于编码切片的信息的NAL单元的NAL单元头中包括nal_unit_type语法元素。
编码设备可以生成比特流(S1520)。比特流可以包括至少一个包括关于编码切片的图像信息的NAL单元。另外,比特流可以包括PPS。
图16示意性表示适用本文献的实施方式的视频/图像解码方法的示例。可以由图3中公开的解码设备300执行图16中公开的方法。
参照图16,解码设备可以接收比特流(S1600)。这里,比特流可以包括至少一个包括关于编码切片的图像信息的NAL单元。另外,比特流可以包括PPS。
解码设备可以获得NAL单元类型相关信息(S1610)。NAL单元类型相关信息可以包括与上述实施方式和/或以上表1和表2中描述的NAL单元类型相关的信息/语法元素。例如,与NAL单元类型相关的信息可以包括PPS中所包括的mixed_nalu_types_in_pic_flag语法元素。另外,与NAL单元类型相关的信息可以在包括关于编码切片的信息的NAL单元的NAL单元头中包括nal_unit_type语法元素。
解码设备可以确定图片中的切片的NAL单元类型(S1620)。
例如,当mixed_nalu_types_in_pic_flag的值为0时,与PPS关联的图片中的切片使用相同的NAL单元类型。即,当mixed_nalu_types_in_pic_flag的值为0时,在包括关于图片的第一切片的信息的第一NAL单元的第一NAL单元头中定义的NAL单元类型与包括关于同一图片的第二切片的信息的第二NAL单元的第二NAL单元头中定义的NAL单元类型相同。另选地,当mixed_nalu_types_in_pic_flag的值为1时,与PPS关联的图片中的切片使用不同的NAL单元类型。这里,可以基于在上述实施方式中提出的方法来确定图片中的切片的NAL单元类型。
解码设备可以基于切片的NAL单元类型对样本/块/切片进行解码/重构(S1630)。可以基于切片的NAL单元类型来解码/重构切片中的样本/块。
例如,当针对当前图片的第一切片设置第一NAL单元类型并且针对当前图片的第二切片设置第二NAL单元类型(不同于第一NAL单元类型)时,可以基于第一NAL单元类型来解码/重构第一切片中的样本/块或第一切片本身,并且可以基于第二NAL单元类型来解码/重构第二切片中的样本/块或第二切片本身。
图17和图18示意性表示根据本文献的实施方式的视频/图像编码方法和关联部件的示例。
图17中公开的方法可由图2或图18中公开的编码设备200执行。这里,图18中公开的编码设备200是图2中公开的编码设备200的简化表示。具体地,图17的步骤S1700至S1730可由图2中公开的熵编码器240执行,此外,根据实施方式,每个步骤可由图2中公开的图像分割器210、预测器220、残差处理器230、加法器340等执行。此外,可以执行包括以在本文献中描述的实施方式的图17中公开的方法。因此,在图17中,将省略或简化与上述实施方式的重复相对应的内容的详细描述。
参照图17,编码设备可确定当前图片中的切片的NAL单元类型(S1700)。
当前图片可包括多个切片,并且一个切片可包括切片头和切片数据。此外,可以通过将NAL单元头添加到切片(切片头和切片数据)来生成NAL单元。NAL单元头可包括根据包括在相应NAL单元中的切片数据指定的NAL单元类型信息。
作为实施方式,编码设备可产生当前图片中的第一切片的第一NAL单元和当前图片中的第二切片的第二NAL单元。另外,编码设备可根据第一和第二切片的类型确定第一切片的第一NAL单元类型和第二切片的第二NAL单元类型。
例如,基于包括在上述表1或表2中所示的NAL单元中的切片数据的类型,NAL单元类型可以包括TRAIL_NUT、STSA_NUT、RADL_NUT、RASL_NUT、IDR_W_RADL、IDR_N_LP、CRA_NUT等。此外,可以基于NAL单元头中的nal_unit_type语法元素来发信号通知NAL单元类型。nal_unit_type语法元素是用于指定NAL单元类型的语法信息,并且如上面的表1或表2中所示,可以被表示为对应于特定NAL单元类型的特定值。
编码设备可基于NAL单元类型确定当前图片是否具有混合NAL单元类型(S1710)。
例如,当当前图片中的切片的所有NAL单元类型相同时,编码设备可确定当前图片不具有混合NAL单元类型。另选地,当当前图片中的切片的所有NAL单元类型不相同时,编码设备可确定当前图片具有混合NAL单元类型。
编码设备可基于当前图片是否具有混合NAL单元类型来生成NAL单元类型相关信息(S1720)。
NAL单元类型相关信息可以包括与上述实施方式和/或上述表1和表2中描述的NAL单元类型相关的信息/语法元素。例如,NAL单元类型相关信息可以是关于当前图片是否具有混合NAL单元类型的信息,并且可以由包括在PPS中的mixed_nalu_types_in_pic_flag语法元素来表示。例如,当mixed_nalu_types_in_pic_flag语法元素的值为0时,可指示当前图片中的NAL单元具有相同的NAL单元类型。另选地,当mixed_nalu_types_in_pic_flag语法元素的值为1时,可指示当前图片中的NAL单元具有不同的NAL单元类型。
在一个实施方式中,当当前图片中的切片的所有NAL单元类型相同时,编码设备可确定当前图片不具有混合NAL单元类型,并且可生成NAL单元类型相关信息(例如,mixed_nalu_type_in_pic_flag)。在这种情况下,NAL单元类型相关信息(例如,mixed_nalu_type_in_pic_flag)的值可被确定为0。另选地,当当前图片中的切片的NAL单元类型不相同时,编码设备可确定当前图片具有混合NAL单元类型,并可产生NAL单元类型相关信息(例如,mixed_nalu_type_in_pic_flag)。在这种情况下,NAL单元类型相关信息(例如,mixed_nalu_type_in_pic_flag)的值可被确定为1。
即,基于具有混合NAL单元类型的关于当前图片的NAL单元类型相关信息(例如,mixed_nalu_types_in_pic_flag的值为1),当前图片的第一切片的第一NAL单元和当前图片的第二切片的第二NAL单元可以具有不同的NAL单元类型。另选地,基于不具有混合NAL单元类型的关于当前图片的NAL单元类型相关信息(例如,mixed_nalu_types_in_pic_flag的值为0),当前图片的第一切片的第一NAL单元和当前图片的第二切片的第二NAL单元可以具有相同的NAL单元类型。
作为示例,基于具有混合NAL单元类型的关于当前图片的NAL单元类型相关信息(例如,mixed_nalu_types_in_pic_flag的值为1),第一切片的第一NAL单元可以具有前导图片NAL单元类型,并且第二切片的第二NAL单元可以具有非IRAP NAL单元类型或非前导图片NAL单元类型。这里,前导图片NAL单元类型可以包括RADL NAL单元类型或RASL NAL单元类型,并且非IRAP NAL单元类型或非前导图片NAL单元类型可以包括踪迹(trail)NAL单元类型或STSA NAL单元类型。
另选地,作为示例,基于具有混合NAL单元类型的关于当前图片的NAL单元类型相关信息(例如,mixed_nalu_types_in_pic_flag的值为1),第一切片的第一NAL单元可以具有IRAP NAL单元类型,并且第二切片的第二NAL单元可以具有非IRAP NAL单元类型或非前导图片NAL单元类型。这里,IRAP NAL单元类型可以包括IDR NAL单元类型(即,IDR_N_LPNAL或IDR_W_RADL NAL单元类型)或CRA NAL单元类型,并且非IRAP NAL单元类型或非前导图片NAL单元类型可以包括追踪NAL单元类型或STSA NAL单元类型。另外,根据实施方式,非IRAP NAL单元类型或非前导图片NAL单元类型可以仅是指追踪NAL单元类型。
根据实施方式,基于允许当前图片具有混合NAL单元类型的情况,对于当前图片中具有IDR NAL单元类型(例如,IDR_W_RADL或IDR_N_LP)的切片,必须存在与发信号通知参考图片列表相关的信息。与发信号通知参考图片列表相关的信息可以指示关于用于发信号通知参考图片列表的语法元素是否存在于切片的切片头中的信息。即,基于与发信号通知参考图片列表相关的信息的值为1,用于发信号通知参考图片列表的语法元素可以存在于具有IDR NAL单元类型的切片的切片头中。另选地,基于与发信号通知参考图片列表相关的信息的值为0,用于发信号通知参考图片列表的语法元素可以不存在于具有IDR NAL单元类型的切片的切片头中。
例如,与发信号通知参考图片列表相关的信息可以是上述sps_idr_rpl_present_flag语法元素。当sps_idr_rpl_present_flag的值为1时,它可以指示用于发信号通知参考图片列表的语法元素可以存在于具有诸如IDR_N_LP或IDR_W_RADL这样的NAL单元类型的切片的切片头中。另选地,当sps_idr_rpl_present_flag的值为0时,它可以指示用于发信号通知参考图片列表的语法元素可以不存在于具有诸如IDR_N_LP或IDR_W_RADL这样的NAL单元类型的切片的切片头中。
编码设备可以对包括NAL单元类型相关信息的图像/视频信息进行编码(S1730)。
例如,当当前图片中的第一切片的第一NAL单元和当前图片中的第二切片的第二NAL单元具有不同的NAL单元类型时,编码设备可以对包括具有值1的NAL单元类型相关信息(例如,mixed_nalu_types_in_pic_flag)的图像/视频信息进行编码。另选地,当当前图片中的第一切片的第一NAL单元和当前图片中的第二切片的第二NAL单元具有相同的NAL单元类型时,编码设备可以对包括具有值0的NAL单元类型相关信息(例如,mixed_nalu_types_in_pic_flag)的图像/视频信息进行编码。
另外,例如,编码设备可以对包括指示当前图片中的切片的每种NAL单元类型的nal_unit_type信息的图像/视频信息进行编码。
另外,例如,编码设备可以对包括与发信号通知参考图片列表相关的信息(例如,sps_idr_rpl_present_flag)的图像/视频信息进行编码。
另外,例如,编码设备可以对包括当前图片中的切片的NAL单元的图像/视频信息进行编码。
包括如上所述的各种信息的图像/视频信息可以以比特流的形式被编码和输出。可以通过网络或(数字)存储介质将比特流发送到解码设备。这里,网络可以包括广播网络、通信网络和/或类似物,并且数字存储介质可以包括诸如通用串行总线(USB)、安全数字(SD)、光盘(CD)、数字视频盘(DVD)、蓝光、硬盘驱动器(HDD)、固态驱动器(SSD)等这样的各种存储介质。
图19和图20示意性表示根据本文献的实施方式的视频/图像解码方法和关联部件的示例。
图19中公开的方法可以由图3或图20中公开的解码设备300执行。这里,图20中公开的解码设备300是图3中公开的解码设备300的简化表示。具体地,图19的步骤S1900至S1930可以由图3中公开的熵解码器310执行,另外,根据实施方式,每个步骤可以由图3中公开的残差处理器320、预测器330、加法器340等执行。另外,可以执行包括以上在本文献中描述的实施方式的图19中公开的方法。因此,在图19中,将省略或简化对与上述实施方式的重复对应的内容的详细描述。
参照图19,解码设备可以从比特流获得包括NAL单元类型相关信息的图像/视频信息(S1900)。
例如,解码设备可以对比特流进行解析,并推导图像重构(或图片重构)所需的信息(例如,视频/图像信息)。在这种情况下,图像信息可以包括上述NAL单元类型相关信息(例如,mixed_nalu_types_in_pic_flag)、指示当前图片中的切片的每个NAL单元类型的nal_unit_type信息、与发信号通知参考图片列表相关的信息(例如,sps_idr_rpl_present_flag)、当前图片内的切片的NAL单元等。即,图像信息可以包括解码处理中需要的各种信息,并可以基于诸如指数哥伦布编码、CAVLC或CABAC这样的编码方法来解码。
如上所述,NAL单元类型相关信息可以包括与上述实施方式和/或以上表1和表2中描述的NAL单元类型相关的信息/语法元素。例如,NAL单元类型相关信息可以是关于当前图片是否具有混合NAL单元类型的信息,并可以由PPS中所包括的mixed_nalu_types_in_pic_flag语法元素表示。例如,当mixed_nalu_types_in_pic_flag语法元素的值为0时,可以指示当前图片中的NAL单元具有相同的NAL单元类型。另选地,当mixed_nalu_types_in_pic_flag语法元素的值为1时,可以指示当前图片中的NAL单元具有不同的NAL单元类型。
解码设备可以基于NAL单元类型相关信息来确定当前图片是否具有混合NAL单元类型(S1910)。
例如,解码设备可基于NAL单元类型相关信息(例如,mixed_nalu_type_in_pic_flag)的值为1来确定当前图片具有混合NAL单元类型。或者,解码设备可基于NAL单元类型相关信息(例如,mixed_nalu_type_in_pic_flag)的值为0来确定当前图片不具有混合NAL单元类型。
解码设备可基于关于当前图片是否具有混合NAL单元类型的NAL单元类型相关信息来确定当前图片中的切片的NAL单元类型(S1920)。
当前图片可以包括多个切片,并且一个切片可以包括切片头和切片数据。另外,可以通过将NAL单元头添加到切片(切片头和切片数据)来生成NAL单元。NAL单元头可以包括根据相应NAL单元中所包括的切片数据指定的NAL单元类型信息。
例如,基于如以上表1或表2中所示的NAL单元中所包括的切片数据的类型,NAL单元类型可以包括TRAIL_NUT、STSA_NUT、RADL_NUT、RASL_NUT、IDR_W_RADL、IDR_N_LP、CRA_NUT等。另外,可以基于NAL单元头中的nal_unit_type语法元素来发信号通知NAL单元类型。nal_unit_type语法元素是用于指定NAL单元类型的语法信息,并且如以上表1或表2中所示,可以被表示为对应于特定NAL单元类型的特定值。
在实施方式中,解码设备可以基于具有混合NAL单元类型的关于当前图片的NAL单元类型相关信息(例如,mixed_nalu_types_in_pic_flag的值为1)来确定当前图片的第一切片的第一NAL单元和当前图片的第二切片的第二NAL单元可以具有不同的NAL单元类型。另选地,解码设备可以基于不具有混合NAL单元类型的关于当前图片的NAL单元类型相关信息(例如,mixed_nalu_types_in_pic_flag的值为0)来确定当前图片的第一切片的第一NAL单元和当前图片的第二切片的第二NAL单元可以具有相同的NAL单元类型。
作为示例,基于具有混合NAL单元类型的关于当前图片的NAL单元类型相关信息(例如,mixed_nalu_types_in_pic_flag的值为1),第一切片的第一NAL单元可以具有前导图片NAL单元类型,并且第二切片的第二NAL单元可以具有非IRAP NAL单元类型或非前导图片NAL单元类型。这里,前导图片NAL单元类型可以包括RADL NAL单元类型或RASL NAL单元类型,并且非IRAP NAL单元类型或非前导图片NAL单元类型可以包括追踪NAL单元类型或STSA NAL单元类型。
另选地,作为示例,基于具有混合NAL单元类型的关于当前图片的NAL单元类型相关信息(例如,mixed_nalu_types_in_pic_flag的值为1),第一切片的第一NAL单元可以具有IRAP NAL单元类型,并且第二切片的第二NAL单元可以具有非IRAP NAL单元类型或非前导图片NAL单元类型。这里,IRAP NAL单元类型可以包括IDR NAL单元类型(即,IDR_N_LPNAL或IDR_W_RADL NAL单元类型)或CRA NAL单元类型,并且非IRAP NAL单元类型或非前导图片NAL单元类型可以包括追踪NAL单元类型或STSA NAL单元类型。另外,根据实施方式,非IRAP NAL单元类型或非前导图片NAL单元类型可以仅是指追踪NAL单元类型。
根据实施方式,基于允许当前图片具有混合NAL单元类型的情况,对于当前图片中具有IDR NAL单元类型(例如,IDR_W_RADL或IDR_N_LP)的切片,必须存在与发信号通知参考图片列表相关的信息。与发信号通知参考图片列表相关的信息可以指示关于用于发信号通知参考图片列表的语法元素是否存在于切片的切片头中的信息。即,基于与发信号通知参考图片列表相关的信息的值为1,用于发信号通知参考图片列表的语法元素可以存在于具有IDR NAL单元类型的切片的切片头中。另选地,基于与发信号通知参考图片列表相关的信息的值为0,用于发信号通知参考图片列表的语法元素可以不存在于具有IDR NAL单元类型的切片的切片头中。
例如,与发信号通知参考图片列表相关的信息可以是上述sps_idr_rpl_present_flag语法元素。当sps_idr_rpl_present_flag的值为1时,它可以指示用于发信号通知参考图片列表的语法元素可以存在于具有诸如IDR_N_LP或IDR_W_RADL这样的NAL单元类型的切片的切片头中。另选地,当sps_idr_rpl_present_flag的值为0时,它可以指示用于发信号通知参考图片列表的语法元素可以不存在于具有诸如IDR_N_LP或IDR_W_RADL这样的NAL单元类型的切片的切片头中。
解码设备可以基于NAL单元类型来解码/重构当前图片(S1930)。
例如,针对被确定为第一NAL单元类型的当前图片中的第一切片和被确定为第二NAL单元类型的当前图片中的第二切片,解码设备可以基于第一NAL单元类型对第一切片进行解码/恢复并基于第二NAL单元类型对第二切片进行解码/重构。另外,解码设备可以基于第一NAL单元类型对第一切片中的样本/块进行解码/重构,并基于第二NAL单元类型对第二切片中的样本/块进行解码/重构。
尽管在上述实施方式中已经基于顺序列出步骤或块的流程图描述了方法,但本文献的步骤不限于特定的顺序,并且特定步骤可以相对于上述步骤在不同的步骤中或以不同的顺序或者同时地执行。另外,本领域的普通技术人员将理解,流程图中的步骤不是排他性的,并且在没有对本公开的范围施加影响的情况下,可以在其中包括另一步骤,或者可以删除流程图中的一个或更多个步骤。
根据本公开的以上提到的方法可以是软件的形式,并且根据本公开的编码设备和/或解码设备可以被包括在用于执行图像处理的装置(例如,TV、计算机、智能电话、机顶盒、显示装置等)中。
当用软件实现本公开的实施方式时,可以用执行以上提到的功能的模块(处理或功能)实现以上提到的方法。模块可以被存储在存储器中并且由处理器执行。存储器可以安装在处理器的内部或外部,并可以经由各种公知装置连接到处理器。处理器可以包括专用集成电路(ASIC)、其他芯片集、逻辑电路和/或数据处理装置。存储器可以包括只读存储器(ROM)、随机存取存储器(RAM)、闪速存储器、存储卡、存储介质和/或其他存储装置。换句话说,根据本公开的实施方式可以在处理器、微处理器、控制器或芯片上实现和执行。例如,相应图中例示的功能单元可以在计算机、处理器、微处理器、控制器或芯片上实现和执行。在这种情况下,关于实现方式的信息(例如,关于指令的信息)或算法可以被存储在数字存储介质中。
另外,应用本文献的实施方式的解码设备和编码设备可以被包括在多媒体广播收发器、移动通信终端、家庭影院视频装置、数字影院视频装置、监视相机、视频聊天装置、诸如视频通信这样的实时通信装置、移动流传输装置、存储介质、便携式摄像机、视频点播(VoD)服务提供器、顶置(OTT)视频装置、互联网流传输服务提供器、3D视频装置、虚拟现实(VR)装置、增强现实(AR)装置、图像电话视频装置、车载终端(例如,车(包括自主车辆)载终端、飞机终端或轮船终端)和医疗视频装置中;并且可以被用于处理图像信号或数据。例如,OTT视频装置可以包括游戏控制台、Blueray(蓝光)播放器、联网TV、家庭影院系统、智能手机、平板PC和数字视频记录仪(DVR)。
另外,应用本文献的实施方式的处理方法可以以由计算机执行的程序的形式产生,并可以被存储在计算机可读记录介质中。根据本文献的实施方式的具有数据结构的多媒体数据也可以被存储在计算机可读记录介质中。计算机可读记录介质包括存储有计算机可读数据的所有种类的存储装置和分布式存储装置。计算机可读记录介质可以包括例如蓝光盘(BD)、通用串行总线(USB)、ROM、PROM、EPROM、EEPROM、RAM、CD-ROM、磁带、软盘和光学数据存储装置。计算机可读记录介质还包括以载波(例如,互联网上的传输)的形式实施的媒体。另外,通过编码方法生成的比特流可以被存储在计算机可读记录介质中,或者可以通过有线或无线通信网络传输。
另外,本文献的实施方式可以基于程序代码被实施为计算机程序产品,并且程序代码可以根据本文献的实施方式在计算机上执行。程序代码可以被存储在计算机可读载体上。
图21表示可以应用本文献的实施方式的内容流系统的示例。
参照图21,应用本文献的实施方式的内容流系统可以通常包括编码服务器、流传输服务器、网络服务器、媒体存储器、用户设备和多媒体输入装置。
编码服务器用来将从诸如智能电话、照相机、便携式摄像机等这样的多媒体输入装置输入的内容压缩为数字数据,生成比特流,并且将其传送至流传输服务器。作为另一示例,在诸如智能电话、照相机、便携式摄像机等这样的多媒体输入装置直接生成码流的情况下,可省略编码服务器。
可通过本文献的实施方式应用于的编码方法或比特流生成方法来生成比特流。并且流传输服务器可在发送或接收比特流的处理中暂时存储比特流。
流传输服务器基于用户的请求通过网络服务器向用户设备传送多媒体数据,该网络服务器充当向用户通知存在什么服务的工具。当用户请求用户想要的服务时,网络服务器将请求转移至流传输服务器,并且流传输服务器将多媒体数据传送至用户。在这方面,内容流系统可包括单独的控制服务器,并且在这种情况下,控制服务器用来控制内容流系统中的各个设备之间的命令/响应。
流传输服务器可从媒体存储装置和/或编码服务器接收内容。例如,在从编码服务器接收到内容的情况下,可实时地接收内容。在这种情况下,流传输服务器可将比特流存储预定时间段以流畅地提供流传输服务。
例如,用户设备可包括移动电话、智能电话、膝上型计算机、数字广播终端、个人数字助理(PDA)、便携式多媒体播放器(PMP)、导航、板式PC、平板PC、超级本、可穿戴装置(例如,手表型终端(智能手表)、眼镜型终端(智能眼镜)、头戴式显示器(HMD))、数字TV、台式计算机、数字标牌等。
可将内容流系统中的每个服务器作为分布式服务器操作,并且在这种情况下,可以分布式方式处理由每个服务器接收的数据。
本说明书中的权利要求可以以各种方式组合。例如,本说明书的方法权利要求中的技术特征可以组合以在设备中实施或执行,并且设备权利要求中的技术特征可以组合以在方法中实施或执行。此外,方法权利要求和设备权利要求中的技术特征可以组合以在设备中实施或执行。此外,方法权利要求和设备权利要求中的技术特征可以组合以在方法中实施或执行。

Claims (15)

1.一种由解码设备执行的图像解码方法,所述图像解码方法包括:
从比特流中获取包括网络抽象层NAL单元类型相关信息的图像信息;
基于所述NAL单元类型相关信息确定当前图片是否具有混合NAL单元类型;
基于具有所述混合NAL单元类型的所述当前图片的所述NAL单元类型相关信息确定所述当前图片中的切片的NAL单元类型;以及
基于所述NAL单元类型来对所述当前图片进行解码,
其中,基于所述NAL单元类型相关信息的值为1,确定所述当前图片具有所述混合NAL单元类型,并且
其中,对于具有所述混合NAL单元类型的所述当前图片,所述当前图片中的第一切片的NAL单元类型与所述当前图片中的第二切片的NAL单元类型不同。
2.根据权利要求1所述的图像解码方法,其中,基于所述NAL单元类型相关信息的所述值为0,确定所述当前图片不具有所述混合NAL单元类型,并且
其中,对于不具有所述混合NAL单元类型的所述当前图片,所述当前图片中的所述第一切片的NAL单元类型与所述当前图片中的所述第二切片的NAL单元类型相同。
3.根据权利要求1所述的图像解码方法,其中,基于所述NAL单元类型相关信息的值为1,所述当前图片中的所述第一切片的所述NAL单元类型具有前导图片NAL单元类型,并且所述当前图片中的所述第二切片的所述NAL单元类型具有非帧内随机访问点IRAP NAL单元类型或非前导图片NAL单元类型。
4.根据权利要求3所述的图像解码方法,其中,所述前导图片NAL单元类型包括随机访问可解码前导RADL NAL单元类型或随机访问跳过前导RASL NAL单元类型,并且
其中,所述非IRAP NAL单元类型或所述非前导图片NAL单元类型包括尾随NAL单元类型或逐步时间子层访问STSA NAL单元类型。
5.根据权利要求1所述的图像解码方法,其中,对所述当前图片进行解码的步骤包括以下步骤:
对于被确定为第一NAL单元类型的所述当前图片中的所述第一切片和被确定为第二NAL单元类型的所述当前图片中的所述第二切片,
基于所述第一NAL单元类型对所述第一切片进行解码,并且基于所述第二NAL单元类型对所述第二切片进行解码。
6.根据权利要求1所述的图像解码方法,其中,基于所述当前图片被允许具有所述混合NAL单元类型,对于所述当前图片中具有IDR NAL单元类型的切片,存在与发信号通知参考图片列表相关的信息。
7.根据权利要求6所述的图像解码方法,其中,与发信号通知所述参考图片列表相关的信息是关于用于发信号通知所述参考图片列表的语法元素是否存在于所述切片的切片头中的信息,并且
其中,基于与发信号通知所述参考图片列表相关的所述信息的值为1,用于发信号通知所述参考图片列表的语法元素存在于具有所述IDR NAL单元类型的所述切片的切片头中。
8.一种由编码设备执行的图像编码方法,所述图像编码方法包括:
确定当前图片中的切片的NAL单元类型;
基于所述NAL单元类型确定所述当前图片是否具有混合NAL单元类型;
基于所述当前图片是否具有所述混合NAL单元类型来生成NAL单元类型相关信息;以及
对包括所述NAL单元类型相关信息的图像信息进行编码,
其中,基于所述当前图片具有所述混合NAL单元类型,所述NAL单元类型相关信息的值被确定为1,并且
其中,基于所述NAL单元类型相关信息的值为1,所述当前图片中的第一切片的NAL单元类型与所述当前图片中的第二切片的NAL单元类型不同。
9.根据权利要求8所述的图像编码方法,其中,基于所述当前图片不具有所述混合NAL单元类型,所述NAL单元类型相关信息的值被确定为0,并且
其中,基于所述NAL单元类型相关信息的值为0,所述当前图片中的所述第一切片的NAL单元类型与所述当前图片中的所述第二切片的NAL单元类型相同。
10.根据权利要求8所述的图像编码方法,其中,基于所述NAL单元类型相关信息的值为1,所述当前图片中的所述第一切片的NAL单元类型具有前导图片NAL单元类型,并且所述当前图片中的所述第二切片的NAL单元类型具有非帧内随机访问点IRAP NAL单元类型或非前导图片NAL单元类型。
11.根据权利要求10所述的图像编码方法,其中,所述前导图片NAL单元类型包括随机访问可解码前导RADL NAL单元类型或随机访问跳过前导RASL NAL单元类型,并且
其中,所述非IRAP NAL单元类型或所述非前导图片NAL单元类型包括尾随NAL单元类型或逐步时间子层访问STSA NAL单元类型。
12.根据权利要求8所述的图像编码方法,其中,基于所述当前图片被允许具有混合NAL单元类型,对于所述当前图片中具有IDR NAL单元类型的切片,存在与发信号通知参考图片列表相关的信息。
13.根据权利要求12所述的图像编码方法,其中,与发信号通知所述参考图片列表相关的所述信息是关于用于发信号通知所述参考图片列表的语法元素是否存在于所述切片的切片头中的信息,并且
其中,基于与用信号通知所述参考图片列表相关的所述信息的值为1,用于发信号通知所述参考图片列表的所述语法元素存在于具有所述IDR NAL单元类型的所述切片的所述切片头中。
14.根据权利要求12所述的图像编码方法,其中,所述图像信息还包括与发信号通知所述当前图片中具有所述IDR NAL单元类型的所述切片的参考图片列表相关的信息。
15.一种计算机可读存储介质,用于存储使图像解码设备执行图像解码方法的编码信息,所述图像解码方法包括:
从比特流中获取包括网络抽象层NAL单元类型相关信息的图像信息;
基于所述NAL单元类型相关信息确定当前图片是否具有混合NAL单元类型;
基于具有所述混合NAL单元类型的所述当前图片的所述NAL单元类型相关信息,确定所述当前图片中的切片的NAL单元类型;以及
基于所述NAL单元类型来对所述当前图片进行解码,
其中,基于所述NAL单元类型相关信息的值为1,确定所述当前图片具有所述混合NAL单元类型,并且
其中,对于具有混合NAL单元类型的所述当前图片,所述当前图片中的第一切片的NAL单元类型与所述当前图片中的第二切片的NAL单元类型不同。
CN202080096777.6A 2019-12-23 2020-12-10 用于切片或图片的基于nal单元类型的图像或视频编码 Pending CN115104316A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962953111P 2019-12-23 2019-12-23
US62/953,111 2019-12-23
PCT/KR2020/018061 WO2021132963A1 (ko) 2019-12-23 2020-12-10 슬라이스 또는 픽처에 대한 nal 유닛 타입 기반 영상 또는 비디오 코딩

Publications (1)

Publication Number Publication Date
CN115104316A true CN115104316A (zh) 2022-09-23

Family

ID=76574407

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080096777.6A Pending CN115104316A (zh) 2019-12-23 2020-12-10 用于切片或图片的基于nal单元类型的图像或视频编码

Country Status (4)

Country Link
US (1) US20230030394A1 (zh)
KR (1) KR20220101712A (zh)
CN (1) CN115104316A (zh)
WO (1) WO2021132963A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20230045490A1 (en) * 2019-12-23 2023-02-09 Lg Electronics Inc. Image or video coding based on nal unit-associated information
US11825073B2 (en) * 2020-03-20 2023-11-21 Qualcomm Incorporated High level syntax for video with mixed NAL unit types

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MX2014003992A (es) * 2011-10-19 2014-05-07 Panasonic Corp Metodo de codificacion de imagenes, metodo de decodificacion de imagenes, aparato de codificacion de imagenes, aparato de decodificacion de imagenes y aparato de codificacion y decodificacion de imagenes.
KR20130116782A (ko) * 2012-04-16 2013-10-24 한국전자통신연구원 계층적 비디오 부호화에서의 계층정보 표현방식
KR20130118798A (ko) * 2012-04-20 2013-10-30 한국전자통신연구원 영상 복호화 방법 및 장치
KR101701120B1 (ko) * 2012-11-21 2017-02-01 엘지전자 주식회사 영상 디코딩 방법 및 이를 이용하는 장치
EP3906685A4 (en) * 2019-01-04 2022-03-30 Huawei Technologies Co., Ltd. RANDOM ACCESS BASED ON A SUB-PICTURE
EP3925213B9 (en) * 2019-03-11 2024-01-03 Huawei Technologies Co., Ltd. Mixed nal unit type picture constraints
WO2021007225A1 (en) * 2019-07-08 2021-01-14 Futurewei Technologies, Inc. Mixed nal unit picture constraints in video coding
EP4226631A1 (en) * 2020-10-07 2023-08-16 Nokia Technologies Oy A coded picture with mixed vcl nal unit type

Also Published As

Publication number Publication date
KR20220101712A (ko) 2022-07-19
WO2021132963A1 (ko) 2021-07-01
US20230030394A1 (en) 2023-02-02

Similar Documents

Publication Publication Date Title
CN114402597A (zh) 应用自适应环路滤波器的视频或图像编码
US20230045490A1 (en) Image or video coding based on nal unit-associated information
CN114982245A (zh) 基于滤波的图像编码装置和方法
CN115104317A (zh) 图像编码装置和用于控制环路滤波的方法
CN115023954A (zh) 用于控制环路滤波的图像编码装置和方法
CN115104316A (zh) 用于切片或图片的基于nal单元类型的图像或视频编码
CN115136607A (zh) 基于滤波的图像编码装置和方法
CN114762351A (zh) 图像/视频编译方法和装置
CN116134821A (zh) 用于在图像/视频编码系统中处理高级语法的方法和设备
CN115699768A (zh) 在视频或图像编码系统中基于poc信息和非参考图片标志的图像编码方法
CN114762349A (zh) 用于图像/视频编译的高级别语法信令方法和装置
CN114762350A (zh) 基于切片类型的图像/视频编译方法和设备
CN114762339A (zh) 基于变换跳过和调色板编码相关高级语法元素的图像或视频编码
US11805264B2 (en) NAL unit type-based image or video coding
US11716464B2 (en) Image/video encoding/decoding method and apparatus using same
AU2020392150B2 (en) Slice and tile configuration for image/video coding
US20240129475A1 (en) Method and device for signaling information related to slice in image/video encoding/decoding system
US20220417498A1 (en) Method for coding image on basis of tmvp and apparatus therefor
CN115668940A (zh) 基于与画面输出相关的信息的图像或视频编码
CN115004708A (zh) 用于发信号通知图像信息的方法和设备
CN114982242A (zh) 发信号通知图片分割信息的方法和设备
CN114762335A (zh) 基于变换跳过和调色板编码相关数据的图像或视频编码
CN115004709A (zh) 用于发信号通知切片相关信息的方法和装置
CN114747215A (zh) 调色板编码或变换单元的基于量化参数信息的图像或视频编码
CN116195247A (zh) 图像编码方法和用于该图像编码方法的装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination