CN115552903A - 处理图像/视频编码系统中的单层比特流内的参数集的参考的方法和装置 - Google Patents

处理图像/视频编码系统中的单层比特流内的参数集的参考的方法和装置 Download PDF

Info

Publication number
CN115552903A
CN115552903A CN202180034840.8A CN202180034840A CN115552903A CN 115552903 A CN115552903 A CN 115552903A CN 202180034840 A CN202180034840 A CN 202180034840A CN 115552903 A CN115552903 A CN 115552903A
Authority
CN
China
Prior art keywords
layer
video
value
prediction
picture
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180034840.8A
Other languages
English (en)
Inventor
亨得利·亨得利
金昇焕
S·帕鲁利
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Publication of CN115552903A publication Critical patent/CN115552903A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/188Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a video data packet, e.g. a network abstraction layer [NAL] unit
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

根据本公开,由视频解码装置来解码视频的方法包括以下步骤:从比特流获取图像信息,图像信息包括视频编码层(VCL)网络抽象层(NAL)单元;基于所述图像信息对当前图片内的当前块执行帧间预测或帧内预测来生成关于当前块的预测样本;以及基于预测样本恢复当前块,其中,所述图像信息包括指示视频参数集的标识符的值的sps_video_parameter_set_id语法元素;并且基于sps_video_parameter_set_id语法元素的值等于1,由视频参数集指定的输出层集(OLS)总数量的值、以及OLS内的层的数量的值可以被得出为1。

Description

处理图像/视频编码系统中的单层比特流内的参数集的参考 的方法和装置
技术领域
本公开涉及在对图像/视频编码系统中的图像/视频信息进行编码/解码时处置单层比特流内的参数集的参考的方法和装置。
背景技术
最近,各种领域对高分辨率、高质量图像/视频(诸如4K、8K或更超高清(UHD)图像/视频)的需求正在增加。随着图像/视频分辨率或质量变高,与传统图像/视频数据相比,发送更多的信息量或比特。因此,如果图像/视频数据经由诸如现有的有线/无线宽带线路的介质发送或者存储在传统存储介质中,则会增加传输和存储的成本。
此外,对于虚拟现实(VR)和人工现实(AR)内容以及诸如全息图的沉浸式媒体的关注和需求正在增长;并且诸如游戏图像/视频这样的呈现与实际图像/视频的图像/视频特性不同的图像/视频特性的图像/视频的广播也正在增长。
因此,需要高效的图像/视频压缩技术来有效地压缩并发送、存储或播放示出如上所述的各种特性的高分辨率、高质量图像/视频。
发明内容
技术问题
本公开的技术目的是提供提高图像/视频的编码效率的方法和装置。
本公开的另一技术目的是提供高效地处理单层比特流的方法和装置。
本公开的又一技术目的是提供在比特流为单层比特流时得出由VCL NAL单元参考的参数集的层标识符的方法和装置。
本公开的又一技术目的是提供在比特流为单层比特流时得出关于输出层集的信息的方法和装置。
技术方案
根据本说明书的实施方式,本文提供了一种由视频解码装置执行的视频解码方法。所述方法可以包括以下步骤:从比特流获得包括视频编码层VCL网络抽象层NAL单元的图像信息;通过基于所述图像信息对当前图片内的当前块执行帧间预测或帧内预测,生成所述当前块的预测样本;以及基于所述预测样本重构所述当前块,其中,所述图像信息可以包括指示视频参数集的标识符值的sps_video_parameter_set_id语法元素;并且其中,基于所述sps_video_parameter_set_id语法元素的值等于0,由所述视频参数集指定的输出层集OLS总数量的值、以及OLS内的层的数量的值可以被推断为等于1。
根据本说明书的另一实施方式,本文提供了一种由视频编码装置执行的视频编码方法。所述方法可以包括以下步骤:对当前图片内的当前块执行帧间预测或帧内预测;基于所述帧间预测或所述帧内预测生成所述当前块的预测信息;以及对包括所述预测信息的图像信息进行编码,其中,所述图像信息可以包括视频编码层VCL网络抽象层NAL单元以及指示视频参数集的标识符值的sps_video_parameter_set_id语法元素;并且其中,基于所述sps_video_parameter_set_id语法元素的值等于0,由所述视频参数集指定的输出层集OLS的总数量的值、以及OLS内的层的数量的值可以被推断为等于1。
根据本说明书的又一实施方式,本文提供了一种计算机可读数字记录介质,所述计算机可读数字记录介质存储信息,所述信息使视频解码装置执行视频解码方法,其中,所述视频解码方法可以包括以下步骤;获得包括视频编码层VCL网络抽象层NAL单元的图像信息;通过基于所述图像信息针对当前图片内的当前块执行帧间预测或帧内预测,生成所述当前块的预测样本;以及基于所述预测样本重构所述当前块,其中,所述图像信息可以包括指示视频参数集的标识符值的sps_video_parameter_set_id语法元素;并且其中,基于所述sps_video_parameter_set_id语法元素的值等于0,由所述视频参数集指定的输出层集OLS总数量的值、以及OLS内的层的数量的值可以被推断为等于1。
技术效果
根据本公开的实施方式,可以增强图像/视频的整体压缩效率。
根据本公开的实施方式,可以高效地处置单层比特流。
根据本公开的实施方式,当比特流为单层比特流时,可以得出由VCL NAL单元参考的参数集的层标识符。
根据本公开的实施方式,可以提供对应于单层比特流的约束。
根据本公开的实施方式,即使当比特流为不包括视频参数集的单层比特流时,也可以得出关于输出层集的信息。
附图说明
图1示意性地示出了可应用本文的实施方式的视频/图像编码系统的示例。
图2是示意性地示出可应用本文的实施方式的视频/图像编码装置的配置的图。
图3是用于示意性地描述可以应用本公开的实施方式的基于多层的视频/图像编码装置的配置的图。
图4是用于示意性地解释可以应用本公开的实施方式的视频/图像解码装置的配置的图。
图5是用于示意性地描述可以应用本公开的实施方式的基于多层的视频/图像解码装置的配置的图。
图6示出了可以应用本公开的实施方式的图片解码过程的示意性示例。
图7示出了可以应用本公开的实施方式的图片编码过程的示意性示例。
图8示例性地示出了用于编码后的图像/视频的分层结构。
图9和图10分别示出了根据本公开的实施方式的视频/图像编码方法和相关组件的一般示例。
图11和图12分别示出了根据本公开的实施方式的视频/图像解码方法和相关组件的一般示例。
图13示出了可以应用本公开的实施方式的内容流系统的示例。
具体实施方式
可以以各种形式修改本公开的公开内容,并且将在附图中描述和例示其特定实施方式。在本公开中使用的术语仅用于描述特定实施方式,而不旨在限制本公开中所公开的方法。单个数字的表达包括“至少一个”的表达,只要它被清楚地不同地阅读即可。诸如“包括”和“具有”的术语旨在指示存在公开中所使用的特征、数字、步骤、操作、元件、组件或其组合,并且因此应当理解,不排除存在或添加一个或更多个不同特征、数字、步骤、操作、元件、组件或其组合的可能性。
本公开涉及视频/图像编码。例如,本公开中公开的方法/实施方式可以应用于在通用视频编码(VVC)标准中公开的方法。另外,本公开中公开的方法/实施方式可以应用于在基本视频编码(EVC)标准、AO媒体视频1(AV1)标准、第二代音频视频编码标准(AVS2)或下一代视频/图像编码标准(例如,H.267、H.268等)中公开的方法。
在本公开中呈现了与视频/图像编码有关的各种实施方式,并且除非另有说明,否则实施方式可以彼此组合。
另外,在本公开中描述的附图的各个配置是用于解释作为彼此不同的特征的功能的独立例示图,并且不意味着各个配置由相互不同的硬件或不同的软件实现。例如,配置中的两个或更多个配置可以被组合以形成一个配置,并且一个配置也可以被划分成多个配置。在不脱离本公开的所公开的方法的主旨的情况下,将配置组合和/或分离的实施方式包括在本公开的公开的范围内。
在本公开中,措辞“/”和“,”应被解释为指示“和/或”。例如,表述“A/B”可以意指“A和/或B”。此外,“A、B”可以意指“A和/或B”。此外,“A/B/C”可以意指“A、B和/或C中的至少一个”。另外,“A/B/C”可以意指“A、B和/或C中的至少一者”。
此外,在本公开中,措辞“或”应被解释为指示“和/或”。例如,表述“A或B”可以包括:1)仅A,2)仅B,和/或3)A和B两者。换言之,本公开中的术语“或”应被解释为指示“另外地或另选地”。
此外,本公开中使用的括号可以意指“例如”。具体地,在表述“预测(帧内预测)”的情况下,可以指表示提出了“帧内预测”作为“预测”的示例。换言之,本公开中的措辞“预测”不限于“帧内预测”,并且提出“帧内预测”作为“预测”的示例。此外,即使在表述“预测(即,帧内预测)”的情况下,也可以表示提出“帧内预测”作为“预测”的示例。
在本公开中,可以单独地实现或同时实现在一个附图中单独解释的技术特征。
在下文中,将参照附图详细描述本公开的实施方式。另外,贯穿附图,相同的附图标记用于指示相同的元件,并且可以省略对相同元件的相同描述。
图1例示了可应用本公开的实施方式的视频/图像编码系统的示例。
参照图1,视频/图像编码系统可以包括第一装置(源装置)和第二装置(接收在)。源装置可以经由数字存储介质或网络以文件或流的形式向接收装置发送编码视频/图像信息或数据。
源装置可以包括视频源、编码装置和发送器。接收装置可以包括接收器、解码装置和渲染器。编码装置可以称为视频/图像编码装置,并且解码装置可以称为视频/图像解码装置。发送器可以包括在编码装置中。接收器可以包括在解码装置中。渲染器可以包括显示器,并且显示器可以被配置为单独的装置或外部组件。
视频源可以通过捕获、合成或生成视频/图像的处理来获取视频/图像。视频源可以包括视频/图像捕获装置和/或视频/图像生成装置。视频/图像捕获装置可以包括例如一个或更多个照相机、包括先前捕获的视频/图像的视频/图像档案等。视频/图像生成装置可以包括例如计算机、平板电脑和智能电话,并且可以(电子地)生成视频/图像。例如,可以通过计算机等生成虚拟视频/图像。在这种情况下,视频/图像捕获处理可以由生成相关数据的处理代替。
编码装置可以对输入的视频/图像进行编码。编码装置可以执行诸如预测、变换和量化的一系列过程,以实现压缩和编码效率。编码数据(编码视频/图像信息)能够以比特流的形式输出。
发送器可以通过数字存储介质或网络以文件或流的形式向接收装置的接收器发送以比特流形式输出的编码后的图像/图像信息或数据。数字存储介质可以包括诸如USB、SD、CD、DVD、蓝光、HDD、SSD等的各种存储介质。发送器可以包括用于通过预定文件格式生成媒体文件的元件,并且可以包括用于通过广播/通信网络进行发送的元件。接收器可以接收/提取比特流,并向解码装置发送接收到的比特流。
解码装置可以通过执行与编码装置的操作相对应的诸如解量化、逆变换和预测之类的一系列过程,来对视频/图像进行解码。
渲染器可以渲染解码后的视频/图像。可以通过显示器显示渲染后的视频/图像。
在本公开中,视频可以是指随时间推移的一系列图像。图片通常是指表示特定时间帧的一个图像的单元,并且切片/拼块是指在编码方面构成图片的一部分的单元。切片/拼块可以包括一个或更多个编码树单元(CTU)。一个图片可以由一个或更多个切片/拼块组成。一个图片可以由一个或更多个拼块组组成。一个拼块组可以包括一个或更多个拼块。图块可以表示图片中的拼块内的CTU行的矩形区域。可以将拼块分割成多个图块,所述多个图块中的每一者由拼块内的一个或更多个CTU行组成。未被分割成多个图块的拼块也可以被称为图块。图块扫描是分割图片的CTU的特定顺序排序,其中CTU在图块中的CTU光栅扫描中连续排序,拼块内的图块在拼块的图块的光栅扫描中连续排序,并且图片中的拼块在图片的拼块的光栅扫描中连续排序。拼块为图片中的特定拼块列以及特定拼块行内的CTU的矩形区域。拼块列是具有等于图片的高度的高度和由图片参数集中的语法元素指定的宽度的多个CTU的矩形区域。拼块扫描是分割图片的CTU的特定顺序排序,其中CTU在拼块中的CTU光栅扫描中连续排序,而图片中的拼块在图片的拼块的光栅扫描中连续排序。切片包括可以专有地包括在单个NAL单元中的图片的整数个图块。切片可以由多个完整拼块或一个拼块的仅完整图块的连续序列组成。在本公开中,拼块组和切片可以互换使用。例如,在本公开中,拼块组/拼块组报头可以被称作切片/切片报头。
像素或画素(pel)可以意指构成一个图片(或图像)的最小单元。另外,“样本”可以被用作与像素对应的术语。样本通常可以表示像素或像素的值,可以仅表示亮度分量的像素/像素值,或仅表示色度分量的像素/像素值。
单元可以表示图像处理的基本单元。单元可以包括图片的特定区域和与该区域相关的信息中的至少一个。一个单元可以包括一个亮度块和两个色度(例如,cb、cr)块。在某些情况下,可以将单元与诸如块或区域这样的术语互换地使用。在通常情况下,M×N块可以包括M列N行的样本(或样本阵列)或变换系数的集合(或阵列)。另选地,样本可以表示空间域中的像素值,并且当这样的像素值被变换到频率域时,可以表示频率域中的变换系数。
在一些情况下,单元可以与诸如块或区域的术语互换地使用。通常,M×N块可以表示由M列和N行或一组变换系数组成的样本。样本通常可以表示像素或像素的值,并且还可以仅表示亮度分量的像素/像素值,并且还仅表示色度分量的像素/像素值。样本可以用作对应于配置一个图片(或图像)的像素或画素的项。
图2是例示了可以应用本公开的实施方式的视频/图像编码装置的配置的示意图。下文中,视频编码装置可以包括图像编码装置。
参照图2,编码装置200可以包括并配置有图像分割器210、预测器220、残差处理器230和熵编码器240、加法器250、滤波器260和存储器270。预测器220可以包括帧间预测器221和帧内预测器222。残差处理器230可以包括变换器232、量化器233、反量化器234和逆变换器235。残差处理器230还可以包括减法器231。加法器250可以称为重构器或重构块生成器。根据实施方式,上文描述的图像分割器210、预测器220、残差处理器230、熵编码器240、加法器250和滤波器260可以由至少一个硬件组件(例如,编码器芯片组或处理器)构成。另外,存储器270可以包括解码图片缓冲器(DPB)或者可以由数字存储介质构成。硬件组件还可以包括作为内部/外部组件的存储器270。
图像分割器210可以将输入到编码装置200的输入图像(或图片或帧)分割到一个或更多个处理单元中。例如,处理单元可以被称为编码单元(CU)。在这种情况下,可以根据四叉树二叉树三叉树(QTBTTT)结构从编码树单元(CTU)或最大编码单元(LCU)来递归地分割编码单元。例如,一个编码单元可以基于四叉树结构、二叉树结构和/或三叉树结构而被分割为深度更深的多个编码单元。在这种情况下,例如,可以首先应用四叉树结构,随后可以应用二叉树结构和/或三叉树结构。可替选地,也可以首先应用二叉树结构。可以基于不再分割的最终编码单元来执行根据本公开的编码过程。在这种情况下,可以根据图像特性基于编码效率将最大编码单元用作最终编码单元,或者如果需要,可以将编码单元递归地分割为深度更深的编码单元并且具有最佳大小的编码单元可以用作最终编码单元。这里,编码过程可以包括预测、变换和重构的过程,这将在后面描述。作为另一示例,处理单元还可以包括预测单元(PU)或变换单元(TU)。在这种情况下,可以从上述最终编码单元来分离或分割预测单元和变换单元。预测单元可以是样本预测的单元,并且变换单元可以是用于推导变换系数的单元和/或用于从变换系数推导残差信号的单元。
在编码装置200中,可以从输入图像信号(原始块、原始样本阵列)中减去从帧间预测器221或帧内预测器222输出的预测信号(预测块、预测样本阵列),以生成残差信号(残差块、残差样本阵列)并且所生成的残差信号被发送到变换器232。在这种情况下,如图所示,在编码装置200中用于从输入图像信号(原始块、原始样本阵列)减去预测信号(预测块、预测样本阵列)的单元可以称为减法器231。预测器220可以对要处理的块(在下文中称为当前块)执行预测,并生成包括当前块的预测样本的预测块。预测器能够以当前块或CU为单位来确定是应用帧内预测还是应用帧间预测。如稍后在每个预测模式的描述中所述,预测器220可以生成与预测有关的、诸如预测模式信息之类的各种信息,并向熵编码器240发送所生成的信息。关于预测的信息可以在熵编码器240中编码并以比特流的形式输出。
帧内预测器222可以通过参考当前图片中的样本来预测当前块。根据预测模式,参考的样本可以位于当前块的附近,或者也可以远离当前块。在帧内预测中,预测模式可以包括多个非定向模式和多个定向模式。非定向模式可以包括例如DC模式和平面模式。根据预测方向的详细程度,定向模式可以包括例如33个定向预测模式或65个定向预测模式。然而,这仅是示例,依据设置,可以使用更多或更少的定向预测模式。帧内预测器222也可以通过使用应用于邻近块的预测模式来确定应用于当前块的预测模式。
帧间预测器221可以基于由参照图片上的运动向量指定的参考块(参考样本阵列)来推导当前块的预测块。这里,为了减少在帧间预测模式下发送的运动信息的量,可以基于邻近块和当前块之间的运动信息的相关性,以块、子块或样本为单位来预测运动信息。运动信息可以包括运动向量和参照图片索引。运动信息还可包括帧间预测方向(L0预测、L1预测、Bi预测等)信息。在帧间预测的情况下,邻近块可以包括存在于当前图片中的空间邻近块和存在于参照图片中的时间邻近块。包括参考块的参照图片和包括时间邻近块的参照图片可以相同或不同。时间邻近块可以称为并置参考块、共位CU(colCU)等,并且包括时间邻近块的参照图片可以称为并置图片(colPic)。例如,帧间预测器221可以基于邻近块来配置运动信息候选列表,并且生成指示使用哪个候选来推导当前块的运动向量和/或参照图片索引的信息。可以基于各种预测模式来执行帧间预测。例如,在跳过模式和合并模式的情况下,帧间预测器221可以将邻近块的运动信息用作当前块的运动信息。在跳过模式下,与合并模式不同,可能无法发送残差信号。在运动向量预测(MVP)模式的情况下,可以通过将邻近块的运动向量用作运动向量预测子并且发信号通知运动向量差来指示当前块的运动向量。
预测器220可以基于以下描述的各种预测方法来生成预测信号。例如,预测器220不仅可以应用帧内预测或帧间预测来预测一个块,而且可以同时应用帧内预测和帧间预测这二者。这可以称为帧间帧内组合预测(CIIP)。另外,预测器可以基于帧内块复制(IBC)预测模式或基于调色板模式来预测块。IBC预测模式或调色板模式可用于游戏等的内容的图像/视频编码,例如,屏幕内容编码(SCC)。IBC基本上在当前图片中执行预测,但是可以类似于帧间预测来执行IBC,因为参考块是在当前图片中推导的。即,IBC可以使用本公开中描述的帧间预测技术中的至少一种。调色板模式可以被视为帧内编码或帧内预测的示例。当应用调色板模式时,可以基于关于调色板表和调色板索引的信息来发信号通知图片内的样本值。
由预测器(包括帧间预测器221和/或帧内预测器222)生成的预测信号可以用于生成重构信号或可以用于生成残差信号。
变换器232可以通过向残差信号应用变换技术来生成变换系数。例如,变换技术可以包括离散余弦变换(DCT)、离散正弦变换(DST)、基于图的变换(GBT)或条件非线性变换(CNT)中的至少一种。这里,GBT表示当像素之间的关系信息由图表示时从图获得的变换。CNT是指基于使用所有先前重构的像素生成的预测信号而生成的变换。另外,变换处理可以应用于具有相同大小的正方形像素块,或者可以应用于具有可变大小而非正方形的块。
量化器233可以对变换系数进行量化,并且将它们发送给熵编码器240,并且熵编码器240可以对量化信号(关于量化变换系数的信息)进行编码并且输出比特流。关于量化变换系数的信息可以称为残差信息。量化器233可以基于系数扫描顺序将块形式的量化变换系数重新布置为一维向量形式,并且基于一维向量形式的量化变换系数来生成关于量化变换系数的信息。
熵编码器240可以执行各种编码方法,诸如,例如指数哥伦布(Golomb)、上下文自适应可变长度编码(CAVLC)、上下文自适应二进制算术编码(CABAC)等。熵编码器240可以对除了量化变换系数以外的视频/图像重构所需的信息(例如,语法元素的值等)一起或分开地进行编码。能够以比特流的形式以NAL(网络抽象层)为单位发送或存储编码信息(例如,编码视频/图像信息)。视频/图像信息还可以包括关于诸如自适应参数集(APS)、图片参数集(PPS)、序列参数集(SPS)或视频参数集(VPS)之类的各种参数集的信息。另外,视频/图像信息还可包括一般约束信息。在本公开中,从编码装置向解码装置发送/发信号通知的信息和/或语法元素可以包括在视频/图片信息中。视频/图像信息可以通过上述编码过程被编码并且被包括在比特流中。比特流可以通过网络发送,或者可以存储在数字存储介质中。网络可以包括广播网络和/或通信网络,并且数字存储介质可以包括诸如USB、SD、CD、DVD、蓝光、HDD、SSD的各种存储介质。可以包括发送从熵编码器240输出的信号的发送单元(未示出)和/或存储该信号的存储单元(未示出)作为编码装置200的内部/外部元件,并且可替选地,发送器可以包括在熵编码器240中。
从量化器233输出的量化变换系数可以用于生成预测信号。例如,可以通过利用反量化器234和逆变换单元235对量化变换系数应用解量化和逆变换,来重构残差信号(残差块或残差样本)。加法器250将重构的残差信号与从帧间预测器221或帧内预测器222输出的预测信号相加,以生成重构信号(重构图片、重构块、重构样本阵列)。如果要处理的块没有残差(诸如应用了跳过模式的情况),则可以将预测块用作重构块。加法器250可以称为重构单元或重构块生成器。所生成的重构信号可以用于在当前图片中要处理的下一块的帧内预测,并且可以通过如下所述的滤波用于下一图片的帧间预测。
此外,在图片编码和/或重构过程期间,可以应用亮度映射与色度缩放(LMCS)。
滤波器260可以通过对重构信号应用滤波来改善主观/客观图像质量。例如,滤波器260可以通过对重构图片应用各种滤波方法来生成修改后的重构图片,并将修改后的重构图片存储在存储器270(具体地,存储器270的DPB)中。各种滤波方法可包括例如去块滤波、样本自适应偏移、自适应环路滤波器、双边滤波器等。滤波器260可以生成与滤波有关的各种信息,并且将生成的信息发送给熵编码器240,如稍后在各种滤波方法的描述中所述。与滤波有关的信息可以由熵编码器240编码并且以比特流的形式输出。
发送给存储器270的修改后的重构图片可以用作帧间预测器221中的参照图片。当通过编码装置应用帧间预测时,可以避免编码装置200与解码装置之间的预测不匹配,并且可以提高编码效率。
存储器270的DPB可以存储用作帧间预测器221中的参照图片的修改后的重构图片。存储器270可以存储从中推导(或编码)当前图片中的运动信息的块的运动信息和/或图片中已重构的块的运动信息。所存储的运动信息可以发送给帧间预测器221,并且用作空间邻近块的运动信息或时间邻近块的运动信息。存储器270可以存储当前图片中的重构块的重构样本,并且可以将重构样本传送给帧内预测器222。
此外,根据本公开的图像/视频编码可以包括基于多层的图像/视频编码。基于多层的图像/视频编码可以包括可缩放编码。基于多层的编码或可缩放编码可以处理各个层的输入信号。输入信号(输入图像/图片)可以依赖于层而在分辨率、帧速率、比特深度、色彩格式、纵横比和视图中的至少一者上不同。在该情况下,可以通过使用层之间的差(即,基于可缩放性)在层之间执行预测来减少信息的重复传输/处理并且提高压缩效率。
图3是根据本公开的实施方式的执行视频/图像信号的基于多层的编码的编码装置的框图。
图3的编码装置可以包括图2的编码装置。在图3中,省略了图像分割器和加法器。然而,编码装置可以包括图像分割器和加法器。在这种情况下,可以以层为单位来包括图像分割器和加法器。本公开主要描述基于多层的预测。除此之外的描述可以参考参照图2给出的描述。
为了便于描述,图3的示例假设由两个层组成的多层结构。然而,本公开的实施方式不限于特定示例,并且应注意,应用本公开的实施方式的多层结构可以包括两个或更多个层。
参照图3,编码装置300包括用于层1的编码器300-1和用于层0的编码器300-0。
层0可以为基础层、参考层或较低层;层1可以为增强层、当前层或较高层。
层1的编码器300-1包括预测器320-1、残差处理器330-1、滤波器360-1、存储器370-1、熵编码器340-1和复用器(MUX)370。MUX可以被包括作为外部组件。
层0的编码器200-0包括预测器320-0、残差处理器330-0、滤波器360-0、存储器370-0和熵编码器340-0。
预测器320-0、320-1可以基于如上所述的各种预测技术对输入图像执行预测。例如,预测器320-0、320-1可以执行帧间预测和帧内预测。预测器320-0、320-1可以以预定处理单位来执行预测。预测单位可以是编码单位(CU)或变换单位(TU)。可以根据预测结果生成预测块(包括预测样本),并且残差处理器可以基于预测块得出残差块(包括残差样本)。
通过帧间预测,可以通过基于关于当前图片的前一图片和/或后续图片中的至少一者的信息执行预测来生成预测块。通过帧内预测,可以通过基于当前图片内的邻近样本执行预测来生成预测块。
上文描述的各种预测模式方法可以用于帧间预测模式或方法。帧间预测可以选择相对于待预测的当前块的参考图片和参考图片内的与当前块相关的参考块。预测器320-0、320-1可以基于参考块生成预测块。
此外,预测器320-1可以使用层0的信息对层1执行预测。在本公开中,为了便于描述,使用另一层的信息预测当前层的信息的方法被称作层间预测。
基于另一层的信息预测的当前层的信息(即,通过层间预测来预测)包括纹理、运动信息、单元信息和预定参数(例如,滤波参数)中的至少一者。
此外,用于当前层的预测(即,用于层间预测)的另一层的信息可以包括纹理、运动信息、单元信息和预定参数(例如,滤波参数)中的至少一者。
在层间预测中,当前块可以为当前层(例如,层1)的当前图片内的块,并且可以为待编码的目标块。参考块可以为用于当前块的预测而参考的层(参考层,例如,层0)中的、与当前块所属的图片(当前图片)属于同一存取单位(AU)的图片(参考图片)内的块,并且可以为对应于当前块的块。这里,存取单位可以为包括与来自不同层和DPB的相同时间输出相关的编码图片的一组图片单位(PU)。图片单位可以为根据特定分类规则彼此相关、按解码顺序连续并且含有仅一个编码图片的一组NAL单元。编码后的视频序列(CVS)可以为一组AU。
层间预测的一个示例为使用参考层的运动信息预测当前层的运动信息的层间运动预测。根据层间运动预测,可以基于参考块的运动信息来预测当前块的运动信息。换言之,在基于待稍后描述的帧间预测模式得出运动信息时,可以使用层间参考块而非时间邻近块的运动信息来得出运动信息候选。
当应用层间运动预测时,预测器320-1可以缩放并使用参考层的参考块(即,层间参考块)运动信息。
在层间预测的另一示例中,层间纹理预测可以使用重构的参考块的纹理作为当前块的预测值。在这种情况下,预测器220-1可以通过上采样来缩放参考块的纹理。层间纹理预测可以被称作层间(重构)样本预测或简单地称为层间预测。
在层间参数预测(层间预测的又一示例)中,可以在当前层中再使用从参考层得出的参数,或可以基于参考层中使用的参数得出当前层的参数。
在层间残差预测(层间预测的再一示例)中,可以使用另一层的残差信息来预测当前层的残差,并且可以基于预测残差执行当前块的预测。
在层间差分预测(层间预测的再一示例)中,可以使用通过对当前层的重构图片以及参考层的重构图片进行上采样或下采样而获得的图像之间的差来执行对当前块的预测。
在层间语法预测(层间预测的再一示例)中,可以使用参考层的语法信息来预测或生成当前块的纹理。在这种情况下,所参考的参考层的语法信息可以包括关于帧内预测模式和运动信息的信息。
当预测特定块时,使用层间预测的多个预测方法可以使用多个层
这里,作为层间预测的示例,已描述了层间纹理预测、层间运动预测、层间单元信息预测、层间参数预测、层间残差预测、层间差分预测以及层间语法预测;然而,适用于本公开的层间预测不限于上文的示例。
例如,层间预测可以被应用为当前层的帧间预测的扩展。换言之,可以通过将从参考层得出的参考图片包括在用于当前块的帧间预测而可以参考的参考图片中来执行当前块的帧间预测。
在这种情况下,可以将层间参考图片包括在当前块的参考图片列表中。使用层间参考图片,预测器320-1可以对当前块执行帧间预测。
这里,层间参考图片可以为通过对参考层的重构图片进行采样以对应于当前层而构造的参考图片。因此,当参考层的重构图片对应于当前层的图片时,参考层的重构图片可以在不经采样的情况下用作层间参考图片。例如,当参考层的重构图片中的样本的宽度和高度与当前层的重构图片中的样本的宽度和高度相同时;并且参考层的图片的左上方、右上方、左下方和右下方与当前层的图片的左上方、右上方、左下方和右下方之间的偏移是0时,参考层的重构图片可以在不重新采样的情况下用作当前层的层间参考图片。
另外,用于得出层间参考图片的参考层的重构图片可以为与待编码的当前图片属于同一AU的图片。
当通过在参考图片列表中包括层间参考图片来执行当前块的帧间预测时,层间参考图片在参考图片列表L0和L1内的位置可以彼此不同。例如,在参考图片列表L0的情况下,层间参考图片可以位于当前图片之前的短期参考图片之后,并且在参考图片列表L1的情况下,层间参考图片可以位于参考图片列表的末尾。
这里,参考图片列表L0为用于P切片的帧间预测的参考图片列表或在B切片的帧间预测中用作第一参考图片列表的参考图片列表。参考图片列表L1是用于B切片的帧间预测的第二参考图片列表。
因此,参考图片列表L0可以以当前图片之前的短期参考图片、层间参考图片、当前图片之后的短期参考图片和长期参考图片的顺序组成。参考图片列表L1可以以当前图片之后的短期参考图片、当前图片之前的短期参考图片、长期参考图片和层间参考图片的顺序组成。
此时,预测切片(P切片)是在其上执行帧内预测或使用每预测块多达一个运动向量和参考图片索引来执行帧间预测的切片。双预测切片(B切片)是在其上执行帧内预测或使用每预测块多达两个运动向量和参考图片索引来执行预测的切片。在这方面,帧内切片(I切片)是仅应用帧内预测的切片。
另外,当基于包括层间参考图片的参考图片列表执行当前块的帧间预测时,参考图片列表可以包括从多个层得出的多个层间参考图片。
当参考图片列表包括多个层间参考图片时,层间参考图片可以交叉布置于参考图片列表L0和L1内。例如,假设用于当前块的帧间预测的参考图片列表中包括两个层间参考图片(层间参考图片ILRPi以及层间参考图片ILRPj)。在这种情况下,在参考图片列表L0中,ILRPi可以位于当前图片之前的短期参考图片之后,并且ILRPj可以位于列表的末尾。而且,在参考图片列表L1中,ILRPi可以位于列表的末尾,并且ILRPj可以位于当前图片之后的短期参考图片之后。
在这种情况下,参考图片列表L0可以以当前图片之前的短期参考图片、层间参考图片ILRPi、当前图片之后的短期参考图片、长期参考图片和层间参考图片ILRPj的顺序组成。参考图片列表L1可以以当前图片之后的短期参考图片、层间参考图片ILRPj、当前图片之前的短期参考图片、长期参考图片和层间参考图片ILRPi的顺序组成。
另外,两个层间参考图片中的一者可以为从与分辨率相关的可缩放层得出的层间参考图片,并且另一者可以为从提供不同视图的层得出的层间参考图片。在这种情况下,例如,假设ILRPi是从提供不同分辨率的层得出的层间参考图片,并且ILRPj是从提供不同视图的层得出的层间参考图片。接着,在仅支持除视图外的可缩放性的可缩放视频编码的情况下,参考图片列表L0可以以当前图片之前的短期参考图片、层间参考图片ILRPi、当前图片之后的短期参考图片以及长期参考图片的顺序组成。另一方面,参考图片列表L1可以以当前图片之后的短期参考图片、当前图片之前的短期参考图片、长期参考图片以及层间参考图片ILRPj的顺序组成。
此外,对于层间预测,层间参考图片的信息可以由仅样本值、仅运动信息(运动向量)或样本值和运动信息两者组成。当参考图片索引指示层间参考图片时,预测器220-1根据从编码装置接收的信息仅使用层间参考图片的样本值、层间参考图片的运动信息(运动向量)或层间参考图片的样本值和运动信息两者。
当仅使用层间参考图片的样本值时,预测器320-1可以将由层间参考图片中的运动向量指定的块的样本得出为当前块的预测样本。在不考虑视图的可缩放视频编码的情况下,可以将使用层间参考图片的帧间预测(层间预测)中的运动向量设定为固定值(例如,0)。
当仅使用层间参考图片的运动信息时,预测器320-1可以使用层间参考图片中指定的运动向量作为用于得出当前块的运动向量的运动向量预测子。另外,预测器320-1可以使用层间参考图片中指定的运动向量作为当前块的运动向量。
当使用层间参考图片的样本和运动信息两者时,预测器220-1可以使用层间参考图片中的与当前块相关的样本和在层间参考图片中指定的运动信息(运动向量)来预测当前块。
当应用层间预测时,编码装置可以向解码装置发送指示参考图片列表内的层间参考图片的参考索引,并且还向解码装置发送指定使用来自层间参考图片的哪些信息(样本信息、运动信息或样本信息和运动信息)的信息(即,指定与两个层之间的层间预测相关的依赖性的依赖性类型的信息)。
图4是用于示意性地说明可以应用本公开的实施方式的视频/图像解码装置的配置的图。
参照图4,解码装置300可以包括并且配置有熵解码器310、残差处理器320、预测器330、加法器340、滤波器350和存储器360。预测器330可以包括帧间预测器332和帧内预测器331。残差处理器320可以包括反量化器321和逆变换器322。根据实施方式,上面已经描述的熵解码器310、残差处理器320、预测器330、加法器340和滤波器350可以由硬件组件(例如,解码器芯片组或处理器)构成。另外,存储器360可以包括解码图片缓冲器(DPB),或者可以由数字存储介质构成。硬件组件还可以包括存储器360作为内部/外部组件。
当输入包括视频/图像信息的比特流时,解码装置300可以与在图2的编码装置中处理视频/图像信息的处理相对应地重构图像。例如,解码装置300可以基于从比特流获得的块分割相关信息来推导单元/块。解码装置300可以使用在编码装置中应用的处理单元来执行解码。因此,解码的处理单元可以是例如编码单元,并且可以根据四叉树结构、二叉树结构和/或三叉树结构,从编码树单元或最大编码单元对编码单元进行分割。可以从编码单元推导一个或更多个变换单元。可以通过再现装置来再现通过解码装置300解码并输出的重构图像信号。
解码装置300可以接收以比特流形式从图2的编码装置输出的信号,并且可以通过熵解码器310对接收到的信号进行解码。例如,熵解码器310可以解析比特流,以推导图像重构(或图片重构)所需的信息(例如,视频/图像信息)。视频/图像信息还可以包括关于诸如自适应参数集(APS)、图片参数集(PPS)、序列参数集(SPS)或视频参数集(VPS)之类的各种参数集的信息。另外,视频/图像信息还可以包括一般约束信息。解码装置还可以基于关于参数集的信息和/或一般约束信息来对图片进行解码。本公开中稍后描述的发信号通知的/接收的信息和/或语法元素可以通过解码过程被解码,并从比特流中获取。例如,熵解码器310基于诸如指数哥伦布编码、上下文自适应可变长度编码(CAVLC)或上下文自适应算术编码(CABAC)之类的编码方法对比特流中的信息进行解码,并输出图像重构所需的语法元素和残差的变换系数的量化值。更具体地,CABAC熵解码方法可以接收与比特流中的每个语法元素相对应的bin,使用解码目标语法元素信息、解码目标块的解码信息或在先前级中解码的符号/bin的信息来确定上下文模型,并通过根据所确定的上下文模型预测bin的出现概率来对该bin进行算术解码,并且生成与每个语法元素的值相对应的符号。在这种情况下,在确定上下文模型之后,CABAC熵解码方法可以通过将经解码的符号/bin的信息用于下一符号/bin的上下文模型来更新上下文模型。由熵解码器310解码的信息之中与预测有关的信息可以提供给预测器(帧间预测器332和帧内预测器331),并且在熵解码器310中对其执行了熵解码的残差值(也就是说,量化变换系数和相关参数信息)可以被输入到残差处理器320。
残差处理器320可以推导残差信号(残差块、残差样本、残差样本阵列)。另外,由熵解码器310解码的信息之中关于滤波的信息可以提供给滤波器350。此外,用于接收从编码装置输出的信号的接收单元(未示出)可以进一步被配置为解码装置300的内部/外部元件,或者接收单元可以是熵解码器310的组件。此外,根据本公开的解码装置可以称为视频/图像/图片解码装置,并且解码装置可以分类为信息解码器(视频/图像/图片信息解码器)和样本解码器(视频/图像/图片样本解码器)。信息解码器可以包括熵解码器310,并且样本解码器可以包括反量化器321、逆变换器322、加法器340、滤波器350、存储器360、帧间预测器332和帧内预测器331中的至少一个。
反量化器321可以对量化变换系数进行解量化并且输出变换系数。反量化器321能够以二维块的形式重新布置量化变换系数。在这种情况下,可以基于在编码装置中执行的系数扫描顺序来执行重新布置。反量化器321可以通过使用量化参数(例如,量化步长信息)对量化变换系数执行解量化,并且获得变换系数。
逆变换器322对变换系数进行逆变换以获得残差信号(残差块、残差样本阵列)。在本公开中,可以省略量化/解量化和/或变换/逆变换中的至少一者。当省略量化/解量化时,量化变换系数可以被称作变换系数。当省略变换/逆变换时,变换系数可以被称为系数或残差系数,或为了表达的一致性可以仍被称为变换系数。
在本公开中,量化变换系数和变换系数可以分别被称为变换系数和缩放变换系数。在这种情况下,残差信息可以包括关于变换系数的信息,并且可以通过残差编码语法用信号发送关于变换系数的信息。可以基于残差信息(或关于变换系数的信息)得出变换系数,并且可以通过变换系数的逆变换(缩放)得出缩放变换系数。可以基于缩放变换系数的逆变换(变换)得出残差样本。这也可以在本公开的其它部分中应用/表达。
预测器330可以对当前块执行预测,并生成包括当前块的预测样本的预测块。预测器可以基于从熵解码器310输出的关于预测的信息来确定向当前块应用帧内预测还是应用帧间预测,并且可以确定具体的帧内/帧间预测模式。
预测器330可以基于以下描述的各种预测方法来生成预测信号。例如,预测器不仅可以应用帧内预测或帧间预测来预测一个块,而且可以同时应用帧内预测和帧间预测。这可以称为帧间和帧内组合预测(CIIP)。另外,预测器可以基于帧内块复制(IBC)预测模式或调色板模式来预测块。IBC预测模式或调色板模式可以用于游戏等的内容图像/视频编码,例如,屏幕内容编码(SCC)。IBC基本上在当前图片中执行预测,但是可以类似于帧间预测来执行IBC,因为在当前图片中推导参考块。即,IBC可以使用本公开中描述的帧间预测技术中的至少一种。调色板模式可以被视为帧内编码或帧内预测的示例。当应用调色板模式时,可以基于关于调色板表和调色板索引的信息来发信号通知图片内的样本值。
帧内预测器331可以通过参考当前图片中的样本来预测当前块。根据预测模式,参考的样本可以位于当前块的附近,或者可以远离当前块。在帧内预测中,预测模式可以包括多个非定向模式和多个定向模式。帧内预测器331可以通过使用应用于邻近块的预测模式来确定应用于当前块的预测模式。
帧间预测器332可以基于参照图片上的由运动向量指定的参考块(参考样本阵列)来推导当前块的预测块。在这种情况下,为了减少在帧间预测模式中发送的运动信息的量,可以基于邻近块和当前块之间的运动信息的相关性,以块、子块或样本为单位来预测运动信息。运动信息可以包括运动向量和参照图片索引。运动信息还可包括帧间预测方向(L0预测、L1预测、Bi预测等)信息。在帧间预测的情况下,邻近块可以包括存在于当前图片中的空间邻近块和存在于参照图片中的时间邻近块。例如,帧间预测器332可以基于邻近块来配置运动信息候选列表,并基于接收到的候选选择信息来推导当前块的运动向量和/或参照图片索引。可以基于各种预测模式来执行帧间预测,并且关于预测的信息可以包括指示针对当前块的帧间预测的模式的信息。
加法器340可以通过将所获得的残差信号与从预测器(包括帧间预测器332和/或帧内预测器331)输出的预测信号(预测块、预测样本阵列)相加来生成重构信号(重构图片、重构块、重构样本阵列)。如果要处理的块没有残差(例如当应用跳过模式时),则可以将预测块用作重构块。
加法器340可以称为重构器或重构块生成器。所生成的重构信号可以用于当前图片中要处理的下一块的帧内预测,还可以通过如下所述的滤波输出,或者可以用于下一图片的帧间预测。
此外,在图片解码过程中还可以应用亮度映射与色度缩放(LMCS)。
滤波器350可以通过向重构信号应用滤波来改善主观/客观图像质量。例如,滤波器350可以通过对重构图片应用各种滤波方法来生成修改后的重构图片,并将修改后的重构图片存储在存储器360(具体地,存储器360的DPB)中。各种滤波方法可包括例如去块滤波、样本自适应偏移、自适应环路滤波器、双边滤波器等。
存储器360的DPB中存储的(修改后的)重构图片可以用作帧间预测器332中的参照图片。存储器360可以存储从中推导(或解码)当前图片中的运动信息的块的运动信息和/或图片中已重构的块的运动信息。所存储的运动信息可以发送给帧间预测器332,以作为空间邻近块的运动信息或时间邻近块的运动信息来利用。存储器360可以存储当前图片中的重构块的重构样本,并且可以将重构样本传送给帧内预测器331。
在本公开中,在编码装置200的滤波器260、帧间预测器221和帧内预测器222中描述的实施方式可以与滤波器350、帧间预测器332和帧内预测器331相同或对应。
图5是用于示意性地描述可以应用本公开的实施方式的基于多层的视频/图像解码装置的配置的图。
图5的解码装置可以包括图4的解码装置。在图5中,可以省略重新布置器或将其包括在解量化器中。将主要根据基于多层的预测来描述该图。剩余部分可以包括关于图4的描述的内容。
为了便于描述,图5的示例假设由两个层组成的多层结构。然而,本公开的实施方式不限于特定示例,并且应注意,应用本公开的实施方式的多层结构可以包括两个或更多个层。
参照图5,解码装置500包括用于层1的解码器500-1和用于层0的解码器500-0。
层1的解码器500-1可以包括熵解码器510-1、残差处理器520-1、预测器530-1、加法器540-1、滤波器550-1以及存储器560-1。
层0的解码器500-0可以包括熵解码器510-0、残差处理器520-0、预测器530-0、加法器540-0、滤波器550-0和存储器560-0。
当从编码装置发送包括图像信息的比特流时,解复用器505可以对各个层的信息进行解复用,并且针对各个层将所述信息递送到解码装置。
熵解码器510-1、510-0可以根据编码装置中使用的编码方法来执行解码。例如,当在编码装置中使用CABAC时,熵解码器510-1、510-0还可以基于CABAC执行熵解码。
在用于当前块的预测模式为帧内预测模式时,预测器530-1、530-0可以基于当前图片内的邻近重构样本对当前块执行帧内预测。
当用于当前块的预测模式为帧间预测模式时,预测器530-1、530-0可以基于包括在当前图片之前的图片或当前图片之后的图片中的至少一者中的信息对当前块执行帧间预测。可以检查从编码装置接收的信息,并且可以基于所检查的信息得出帧间预测所需的运动信息的部分或全部。
当跳过模式被应用为帧间预测模式时,可以不从编码装置发送残差,并且可以将预测块用作重构块。
此外,层1的预测器530-1可以仅使用层1内的信息执行帧间预测或帧内预测,或可以使用另一层(层0)的信息执行层间预测。
使用不同层的信息预测(即,通过层间预测来预测)的当前层的信息包括纹理、运动信息、单元信息和预定参数(例如,滤波参数)中的至少一者。
此外,用于当前层的预测(即,用于层间预测)的不同层的信息可以包括纹理、运动信息、单元信息和预定参数(例如,滤波参数)中的至少一者。
在层间预测中,当前块可以为当前层(例如,层1)的当前图片内的块,并且可以为待解码的目标块。参考块可以为用于当前块的预测而参考的层(参考层,例如,层0)中的、与当前块所属的图片(当前图片)属于同一存取单位(AU)的图片(参考图片)内的块,并且可以为对应于当前块的块。
层间预测的一个示例是使用参考层的运动信息预测当前层的运动信息的层间运动预测。根据层间运动预测,可以基于参考块的运动信息预测当前块的运动信息。换言之,在基于稍后待描述的帧间预测模式得出运动信息时,可以使用层间参考块而非时间邻近块的运动信息来得出运动信息候选。
当应用层间运动预测时,预测器530-1可以缩放并使用参考层的参考块(即,层间参考块)运动信息。
在层间预测的另一示例中,层间纹理预测可以使用重构的参考块的纹理作为当前块的预测值。在这种情况下,预测器530-1可以通过上采样来缩放参考块的纹理。层间纹理预测可以称为层间(重构)样本预测或简单称为层间预测。
在层间参数预测(层间预测的又一示例)中,可以在当前层中再使用从参考层得出的参数,或可以基于参考层中使用的参数得出当前层的参数。
在层间残差预测(层间预测的再一示例)中,可以使用另一层的残差信息来预测当前层的残差,并且可以基于预测残差执行当前块的预测。
在层间差分预测(层间预测的再一示例)中,可以使用通过对当前层的重构图片以及参考层的重构图片进行上采样或下采样而获得的图像之间的差来执行对当前块的预测。
在层间语法预测(层间预测的再一示例)中,可以使用参考层的语法信息来预测或生成当前块的纹理。在这种情况下,参考的参考层的语法信息可以包括关于帧内预测模式和运动信息的信息。
当预测特定块时,使用层间预测的多个预测方法可以使用多个层
这里,作为层间预测的示例,已描述了层间纹理预测、层间运动预测、层间单元信息预测、层间参数预测、层间残差预测、层间差分预测以及层间语法预测;然而,适用于本公开的层间预测不限于上文的示例。
例如,层间预测可以应用为当前层的帧间预测的扩展。换言之,可以通过将从参考层得出的参考图片包括在用于当前块的帧间预测而可以参考的参考图片中来执行当前块的帧间预测。
当从编码装置接收的参考图片索引或从邻近块得出的参考图片索引指示参考图片列表内的层间参考图片时,预测器530-1可以使用层间参考图片来执行层间预测。例如,当参考图片索引指示层间参考图片时,预测器530-1可以得出由层间参考图片中的运动向量指定的区域的样本值,作为当前块的预测块。
在这种情况下,层间参考图片可以被包括在当前块的参考图片列表中。使用层间参考图片,预测器530-1可以对当前块执行帧间预测。
这里,层间参考图片可以为通过对参考层的重构图片进行采样以对应于当前层而构造的参考图片。因此,当参考层的重构图片对应于当前层的图片时,参考层的重构图片可以在不采样的情况下用作层间参考图片。例如,当参考层的重构图片中的样本的宽度和高度与当前层的重构图片中的样本的宽度和高度相同时;并且参考层的图片的左上方、右上方、左下方和右下方与当前层的图片的左上方、右上方、左下方和右下方之间的偏移是0时,参考层的重构图片可以在不重新采样的情况下用作当前层的层间参考图片。
另外,用于得出层间参考图片的参考层的重构图片可以为与待编码的当前图片属于同一AU的图片。当通过在参考图片列表中包括层间参考图片来执行当前块的帧间预测时,层间参考图片在参考图片列表L0和L1内的位置可以彼此不同。例如,在参考图片列表L0的情况下,层间参考图片可以位于当前图片之前的短期参考图片之后,并且在参考图片列表L1的情况下,层间参考图片可以位于参考图片列表的末尾。
这里,参考图片列表L0为用于P切片的帧间预测的参考图片列表或在B切片的帧间预测中用作第一参考图片列表的参考图片列表。参考图片列表L1是用于B切片的帧间预测的第二参考图片列表。
因此,参考图片列表L0可以以当前图片之前的短期参考图片、层间参考图片、当前图片之后的短期参考图片和长期参考图片的顺序组成。参考图片列表L1可以以当前图片之后的短期参考图片、当前图片之前的短期参考图片、长期参考图片和层间参考图片的顺序组成。
此时,预测切片(P切片)是在其上执行帧内预测或使用每预测块多达一个运动向量和参考图片索引来执行帧间预测的切片。双预测切片(B切片)是在其上执行帧内预测或使用每预测块多达两个运动向量和参考图片索引来执行预测的切片。在这方面,帧内切片(I切片)是仅应用帧内预测的切片。
另外,当基于包括层间参考图片的参考图片列表执行当前块的帧间预测时,参考图片列表可以包括从多个层得出的多个层间参考图片。
当参考图片列表包括多个层间参考图片时,层间参考图片可以交叉布置于参考图片列表L0和L1内。例如,假设两个层间参考图片(层间参考图片ILRPi以及层间参考图片ILRPj)包括在用于当前块的帧间预测的参考图片列表中。在这种情况下,在参考图片列表L0中,ILRPi可以位于当前图片之前的短期参考图片之后,并且ILRPj可以位于列表的末尾。而且,在参考图片列表L1中,ILRPi可以位于列表的末尾,并且ILRPj可以位于当前图片之后的短期参考图片之后。
在这种情况下,参考图片列表L0可以以当前图片之前的短期参考图片、层间参考图片ILRPi、当前图片之后的短期参考图片、长期参考图片和层间参考图片ILRPj的顺序组成。参考图片列表L1可以以当前图片之后的短期参考图片、层间参考图片ILRPj、当前图片之前的短期参考图片、长期参考图片和层间参考图片ILRPi的顺序组成。
另外,两个层间参考图片中的一者可以为从与分辨率相关的可缩放层得出的层间参考图片,并且另一者可以为从提供不同视图的层得出的层间参考图片。在这种情况下,例如,假设ILRPi是从提供不同分辨率的层得出的层间参考图片,并且ILRPj是从提供不同视图的层得出的层间参考图片。接着,在仅支持除视图外的可缩放性的可缩放视频编码的情况下,参考图片列表L0可以以当前图片之前的短期参考图片、层间参考图片ILRPi、当前图片之后的短期参考图片以及长期参考图片的顺序组成。另一方面,参考图片列表L1可以以当前图片之后的短期参考图片、当前图片之前的短期参考图片、长期参考图片以及层间参考图片ILRPj的顺序组成。
此外,对于层间预测,层间参考图片的信息可以由仅样本值、仅运动信息(运动向量)或样本值和运动信息两者组成。当参考图片索引指示层间参考图片时,预测器530-1根据从编码装置接收的信息仅使用层间参考图片的样本值、层间参考图片的运动信息(运动向量)或层间参考图片的样本值和运动信息两者。
当仅使用层间参考图片的样本值时,预测器530-1可以将由层间参考图片中的运动向量指定的块的样本得出为当前块的预测样本。在不考虑视图的可缩放视频编码的情况下,可以将使用层间参考图片的帧间预测(层间预测)中的运动向量设定为固定值(例如,0)。
当仅使用层间参考图片的运动信息时,预测器530-1可以使用层间参考图片中指定的运动向量作为用于得出当前块的运动向量的运动向量预测子。另外,预测器530-1可以使用层间参考图片中指定的运动向量作为当前块的运动向量。
当使用层间参考图片的样本和运动信息两者时,预测器530-1可以使用层间参考图片中的与当前块相关的样本和在层间参考图片中指定的运动信息(运动向量)来预测当前块。
解码装置可以从编码装置接收指示参考图片列表内的层间参考图片的参考索引,并且基于接收的参考索引执行层间预测。此外,解码装置可以从编码装置接收指定将从层间参考图片使用哪些信息(样本信息、运动信息或样本信息和运动信息两者)的信息,即,指定与两个层之间的层间预测相关的依赖性的依赖性类型的信息。
此外,在根据本公开的视频/图像编码中,图像处理单元可以具有分层结构。一个图片可以分割成一个或更多个拼块、图块、切片和/或拼块组。一个切片可以包括一个或更多个图块。一个图块可以包括拼块内的一个或更多个CTU行。切片可以包括图片的整数个图块。一个拼块组可以包括一个或更多个拼块。一个拼块可以包括一个或更多个CTU。CTU可以分割成一个或更多个CU。拼块表示图片中特定拼块列和特定拼块行内的CTU的矩形区域。拼块组可以包括根据图片中的拼块光栅扫描的整数个拼块。切片报头可以携带可以适用于对应切片(切片中的图块)的信息/参数。在编码/解码装置具有多核处理器的情况下,可以并行地处理针对拼块、切片、图块和/或拼块组的编码/解码过程。在本公开中,切片或拼块组可以互换地使用。也就是说,拼块组报头可以被称为切片报头。这里,切片可以具有包括帧内(I)切片、预测(P)切片和双预测(B)切片的切片类型中的一者。在预测I切片中的图块时,可以不使用帧间预测,并且可以仅使用帧内预测。当然,即使在这种情况下,可以通过在不预测的情况下对原始样本值进行编码来执行通知。关于P切片中的图块,可以使用帧内预测或帧间预测,并且在使用帧间预测的情况下,可以仅使用单预测。此外,关于B切片中的图块,可以使用帧内预测或帧间预测,并且在使用帧间预测的情况下,最大程度可以使用多达双预测。
编码装置可以考虑到编码效率或并行处理或根据视频图像的特性(例如,分辨率)来确定拼块/拼块组、图块、切片以及最大和最小编码单位大小,并且可以将用于该内容的其信息或能够获得该内容的信息包括在比特流中。
解码装置可以获得表示当前图片的拼块/拼块组、图块和切片以及拼块中的CTU是否被分割成多个编码单位的信息。通过使这样的信息仅在特定条件下被获得(被发送),可以提高效率。
此外,如上文所描述,一个图片可以包括多个切片,并且一个切片可以包括切片报头和切片数据。在这种情况下,可以将一个图片报头进一步添加到一个图片中的多个切片(切片报头和切片数据集)。图片报头(图片报头语法)可以包括通常适用于图片的信息/参数。切片报头(切片报头语法)可以包括可以共同地应用于切片的信息/参数。APS(APS语法)或PPS(PPS语法)可以包括可以共同地应用于一个或更多个切片或图片的信息/参数。SPS(SPS语法)可以包括可以共同地应用于一个或更多个序列的信息/参数。VPS(VPS语法)可以包括可以共同地应用于多个层的信息/参数。DCI可以包括与解码能力有关的信息/参数。
本说明书中的高级语法(HLS)可以包括APS语法、PPS语法、SPS语法、VPS语法、DCI语法、图片报头语法和切片报头语法中的至少一者。
另外,例如,可以基于高级语法在编码装置中配置关于拼块/拼块组/图块/切片的分割和配置等的信息,并且接着可以以比特流格式将其递送(或传送)到解码装置。
图6示出了可以应用本公开的实施方式的图片解码过程的示意性示例。
在图像/视频编码中,可以根据解码顺序来编码/解码配置图像/视频的图片。可以以与解码顺序不同地配置对应于解码图片的输出顺序的图片顺序。并且,当基于所配置的图片顺序执行帧间预测时,可以执行正向预测以及反向预测。
在图6中,S600可以由以上在图4中描述的解码装置的熵解码器310执行,S610可以由预测器330执行,S620可以由残差处理器320执行,S630可以由加法器340执行,并且S640可以由滤波器350执行。S600可以包括本说明书中描述的信息解码过程,S610可以包括本说明书中描述的帧间/帧内预测过程,S620可以包括本说明书中描述的残差处理过程,S630可以包括本说明书中描述的块/图片重构过程,并且S640可以包括本说明书中描述的环路滤波过程。
参照图6,如上文在图4中所描述,图片解码过程总体上可以包括(通过解码)从比特流获得图像/视频信息的过程(S600)、图片重构过程(S610到S630)以及用于重构图片的环路滤波过程(S640)。可以基于通过执行帧间/帧内预测过程(S610)和残差处理(或处理)过程(S620,对量化变换系数的解量化和逆变换过程)获得的预测样本和残差样本来执行图片重构过程。通过对执行图片重构过程生成的重构图片执行环路滤波过程,可以生成修改后的重构图片,并且可以输出修改后的重构图片作为解码图片,然后将其存储在解码装置的解码图片缓冲器或存储器360中,以当在稍后的过程中执行图片的解码时用作帧间预测过程期间的参考图片。在一些情况下,可以跳过环路滤波过程。并且,在这种情况下,可以输出重构图片作为解码图片,然后将其存储在解码装置的解码图片缓冲器或存储器360中,以在稍后的过程中执行图片的解码时用作帧间预测过程期间的参考图片。如上所述,环路滤波过程(S640)可以包括去块滤波过程、样本自适应偏移(SAO)过程、自适应环路滤波器(ALF)过程和/或双边滤波器过程等,并且可以跳过环路滤波过程的部分或全部。另外,可以顺序地应用去块滤波过程、样本自适应偏移(SAO)过程、自适应环路滤波器(ALF)过程以及双向滤波器过程中的一者或部分,或可以顺序地应用去块滤波过程、样本自适应偏移(SAO)过程、自适应环路滤波器(ALF)过程以及双向滤波器过程中的全部。例如,在将去块滤波过程应用于重构图片之后,可以执行SAO过程。另选地,例如,在将去块滤波过程应用于重构图片之后,可以执行ALF过程。这也可以同样在编码装置中执行。
图7示出了可以应用本公开的实施方式的图片编码过程的示意性示例。
在图7中,S700可以由以上在图2中描述的编码装置的预测器220执行,S710可以由残差处理器230执行,并且S720可以由熵编码器240执行。S700可以包括本说明书中描述的帧间/帧内预测过程,S710可以包括本说明书中描述的残差处理过程,并且S720可以包括本说明书中描述的信息编码过程。
参照图7,如上文在图2中所描述,图片编码过程通常可以包括对用于图片重构的信息(例如,预测信息、残差信息、分割信息等)进行编码并且以比特流形式输出编码后的信息的过程,以及生成用于当前图片的重构图片的过程和将环路滤波应用于重构图片的过程(任选的)。编码装置可以通过解量化器234和逆变换器235从量化变换系数得出残差样本(其被修改),并且接着,编码装置可以基于作为S700的输出的预测样本以及(修改的)残差样本生成重构图片。如上文所描述而生成的重构图片可以与在解码装置中生成的上述重构图片相同。可以通过对重构图片执行环路滤波过程来生成修改的重构的图片,修改后的重构图片随后被存储在解码装置的解码图片缓冲器或存储器270中。并且,如在解码装置中,修改后的重构图片可以在对图片进行编码时在帧间预测过程期间用作参考图片。如上文所描述,在一些情况下,可以跳过环路滤波过程的部分或全部。当执行环路滤波过程时,(环路)滤波相关信息(参数)可以在熵编码器240中被编码,然后以比特流形式发送,并且解码装置可以基于滤波相关信息通过使用与编码装置相同的方法来执行环路滤波过程。
通过执行上述环路滤波过程,可以减少在对图像/移动图片图像进行编码时发生的噪声(诸如阻挡伪影以及振铃伪影),并且可以增强主观/客观视觉质量。另外,通过使编码装置和解码装置两者执行环路滤波过程,编码装置和解码装置可以得出相同预测结果,增加图片编码中的可以靠性,并且减小应发送以用于图片编码的数据的大小(或量)。
如上文所描述,可以在解码装置以及编码装置中执行图片重构过程。可以基于帧内预测/帧间预测针对各个块单元生成重构块,并且可以生成包括重构块的重构图片。在当前图片/切片/拼块组为I图片/切片/拼块组时,可以仅基于帧内预测重构当前图片/切片/拼块组中包括的块。此外,在当前图片/切片/拼块组为P或B图片/切片/拼块组时,可以基于帧内预测或帧间预测重构当前图片/切片/拼块组中包括的块。在这种情况下,帧间预测可以应用于当前图片/切片/拼块组内的块的部分,并且帧内预测可以应用于剩余块。图片的颜色分量可以包括亮度分量以及色度分量。并且,除非在本说明书中明确地限制(或约束),否则本说明书中提出的方法和实施方式可以应用于亮度分量和色度分量。
图8示例性地示出了用于编码后的图像/视频的分层结构。
参照图8,编码后的图像/视频被划分成负责图像/视频解码过程和其自身的VCL(视频编码层)、发送和存储编码后的信息的子系统以及存在于VCL与子系统之间并且负责网络自适应功能的网络抽象层(NAL)。
VCL可以生成包括压缩图像数据(切片数据)的VCL数据,或生成包括图片参数集(图片参数集:PPS)、序列参数集(序列参数集:SPS)、视频参数集(视频参数集:VPS)等的参数集或图像解码过程另外需要的补充增强信息(SEI)消息。
在NAL中,可以通过将报头信息(NAL单元报头)添加到在VCL中生成的原始字节序列载荷(RBSP)而生成NAL单元。在这种情况下,RBSP指在VCL中生成的切片数据、参数集、SEI消息等。NAL单元报头可以包括NAL单元类型信息,该NAL单元类型信息是根据包括在对应NAL单元中的RBSP数据指定的。
如图所示,可以根据在VCL中生成的RBSP将NAL单元划分成VCL NAL单元以及非VCLNAL单元。VCL NAL单元可以意指包括关于图像的信息(切片数据)的NAL单元,并且非VCLNAL单元可以意指含有对图像进行解码所需的信息(参数集或SEI消息)的NAL单元。
上文所描述的VCL NAL单元以及非VCL NAL单元可以通过根据子系统的数据标准附接报头信息而通过网络发送。例如,NAL单元可以被变换为预定标准的数据形式(诸如H.266/VVC文件格式、实时传输协议(RTP)、传输流(TS)等)并且通过各种网络发送。
如上文所描述,在NAL单元中,可以根据包括在对应NAL单元中的RBSP数据结构来指定NAL单元类型,并且可以在NAL单元报头中存储以及用信号通知关于该NAL单元类型的信息。
例如,NAL单元可以依赖于NAL单元是否包括关于图像的信息(切片数据)而大致分类为VCL NAL单元型以及非VCL NAL单元型。VCL NAL单元型可以根据包括在VCL NAL单元中的图片的性质以及类型而分类,并且非VCL NAL单元型可以根据参数集的类型而分类。
以下是根据包括在非VCL NAL单元型中的参数集的类型指定的NAL单元类型的示例。
-DCI(解码能力信息)NAL单元:包括DCI的NAL单元的类型
-VPS(视频参数集)NAL单元:包括VPS的NAL单元的类型
-SPS(序列参数集)NAL单元:包括SPS的NAL单元的类型
-PPS(图片参数集)NAL单元:包括PPS的NAL单元的类型
-APS(自适应参数集)NAL单元:包括APS的NAL单元的类型
-PH(图片报头)NAL单元:包括PH的NAL单元的类型
上文所描述的NAL单元类型具有针对NAL单元类型的语法信息,并且可以在NAL单元报头中存储以及用信号通知该语法信息。例如,该语法信息可以为nal_unit_type,并且NAL单元类型可以由nal_unit_type值指定。
此外,如上文所描述,一个图片可以包括多个切片,并且一个切片可以包括切片报头和切片数据。在这种情况下,可以将一个图片报头进一步添加到一个图片中的多个切片(切片报头和切片数据集)。图片报头(图片报头语法)可以包括共同地适用于图片的信息/参数。切片报头(切片报头语法)可以包括共同地适用于切片的信息/参数。APS(APS语法)或PPS(PPS语法)可以包括共同地适用于一个或更多个切片或图片的信息/参数。SPS(SPS语法)可以包括共同地适用于一个或更多个序列的信息/参数。VPS(VPS语法)可以包括共同地适用于多个层的信息/参数。DCI(DCI语法)可以包括与解码能力相关的信息/参数。
在本说明书中,高级语法(HLS)可以包括APS语法、PPS语法、SPS语法、VPS语法、DCI语法、图片报头语法和切片报头语法中的至少一者。此外,在本说明书中,低层级语法(LLS)可以例如包括切片数据语法、CTU语法、变换单元语法等。
在本说明书中,从编码装置编码到解码装置并且接着以比特流格式用信号通知的图像/视频信息可以不仅包括与图片内分割相关的信息、帧内/帧间预测信息、残差信息、环路滤波信息等,而且可以包括切片报头的信息、图片报头的信息、APS的信息、PPS的信息、SPS的信息、VPS的信息和/或DCI的信息。另外,图像/视频信息可以进一步包括一般约束信息和/或NAL单元报头的信息。
此外,如上所述,本说明书的视频/图像信息可以包括高层信令,并且可以基于视频/图像信息执行视频/图像编码方法。
编码后的图片可以包括一个或更多个切片。可以在图片报头中用信号通知描述编码后的图片的参数,并且可以在切片报头中用信号通知描述所述切片的参数。图片报头(PH)承载于其自身NAL单元类型中。切片报头存在于包括切片载荷(切片数据)的NAL单元的开始部分中。
另外,编码后的图片可以包括另一NAL单元类型的切片。图片应参考包括mixed_nalu_type_in_pic_flag语法元素的图片参数集。
如果mixed_nalu_type_in_pic_flag值等于1,则这指示参考PPS的各个图片具有一个或更多个VCL NAL单元,VCL NAL单元不具有与nal_unit_type相同的值,并且所述图片不是IRAP图片。并且,如果mixed_nalu_type_in_pic_flag值等于0,则这指示参考PPS的各个图片具有一个或更多个VCL NAL单元,并且参考PPS的各个图片的VCL NAL单元具有与nal_unit_type相同的值。
在no_mixed_nalu_type_in_pic_constraint_flag的值等于1的情况下,mixed_nalu_type_in_pic_flag值等于0。
对于具有为nalUnitTypeA的nal_unit_type值的各个切片,在从IDR_W_RADL到CRA_NUT的范围内,在包括具有为另一值的nal_unit_type的一个或更多个切片的图片picA中(即,图片picA的mixed_nalu_type_in_pic_flag值等于1),成立以下内容。
-切片应属于具有等于1的对应subpic_treat_as_pic_flag[i]值的子图片subpicA。
-切片不应属于picA的子图片,其包括具有不同于nalUnitTypeA的nal_unit_type的VCL NAL单元。
-对于编码层视频序列(CLVS)内的以下PU中的所有PU,subpicA内的切片的RefPicList[0]或RefPicList[1]不应包括位于有效条目内的以解码顺序在picA之前的图片。
另外,以下内容将针对特定图片的VCL NAL单元适用。
-如果mixed_nalu_type_in_pic_flag的值等于0,则nal_unit_type值应与图片内的所有编码后的切片NAL单元相同。图片或PU具有与该图片或PU的编码后的切片NAL单元相同的NAL单元类型。
-否则(如果mixed_nalu_type_in_pic_flag值等于1),则一个或更多个VCL NAL单元应全部具有在IDR_W_RADL到CRA_NUT的范围内的nal_unit_type的特定值,并且其它VCLNAL单元应全部具有在TRAIL_NUT到RSV_VCL_6的范围内的nal_unit_type的特定值。
在下文中,将详细描述视频参数集内的多层信息的信令。
下文示出可以针对多层比特流来解码的可用层集(输出层集(OLS))、简档、层级和级别(PTL)、关于OLS的信息、DPB信息、HRD信息等)。
[表1]
Figure BDA0003939424660000301
Figure BDA0003939424660000311
表1的VPS RBSP在被参考之前应可用于解码过程,并且VPS RBSP应包括具有等于0或应通过外部途径提供的临时标识符(temporalId)的至少一个AU。
编码视频序列(CVS)内各自具有为特定值的vps_video_parameter_set_id的VPSNAL单元应全部具有相同内容。
vps_video_parameter_set_id提供针对VPS的标识符,使得可以由另一语法元素进行参考。vps_video_parameter_set_id值应大于0。
vps_max_layers_minus1+1指示参考VPS的各个CVS内的允许层的最大数量。
vps_max_sublayer_minus1加1指示可以存在于参考VPS的各个CVS内的层中的时间子层的最大数量。vps_max_sublayer_minus1的值应在0到6的范围内。
当vps_all_layers_same_num_sublayer_flag值等于1时,这指示时间子层的数量对于参考VPS的各个CVS内的所有层是相同的。并且,当vps_all_layers_same_num_sublayer_flag值等于0时,这指示参考VPS的各个CVS内的层可以具有相同数量的时间子层或可以不具有相同数量的时间子层。当vps_all_layers_same_num_sublayer_flag语法元素不存在于VPS语法中时,vps_all_layers_same_num_sublayer_flag值被推断为等于1(或被推演为1)。
如果vps_all_independent_layers_flag的值等于1,则这指示CVS内的所有层在不使用层间预测的情况下被独立地编码。如果vps_all_independent_layers_flag值等于1,则这指示CVS内的一个或更多个层可以使用层间预测。当vps_all_independent_layers_flag语法元素不存在于VPS语法中时,vps_all_independent_layers_flag值被推断为等于1。
vps_layer_id[i]指示第i层的nuh_layer_id值。对于m至n之间的两个非负整数值,m小于n,vps_layer_id[m]值应小于vps_layer_id[n]值。
当vps_independent_layer_flag[i]值等于1时,这指示具有索引i的层不使用层间预测。并且,当vps_independent_layer_flag[i]值等于0时,这指示具有索引i的层可以使用层间预测,并且语法元素vps_direct_ref_layer_flag[i][j]存在于VPS内,j的范围为从0到i-1(包括端点)。当vps_independent_layer_flag语法元素不存在于VPS语法中时,vps_independent_layer_flag值被推断为等于1。
当vps_max_tid_ref_present_flag[i]值等于1时,这指示存在语法元素vps_max_tid_il_ref_pics_plus1[i][j]。并且,当vps_max_tid_ref_present_flag[i]值等于0时,这指示不存在语法元素vps_max_tid_il_ref_pics_plus1[i][j]。
如果vps_direct_ref_layer_flag[i][j]值等于0,则这指示具有索引j的层不是具有索引i的层的直接参考层。并且,如果vps_direct_ref_layer_flag[i][j]值等于1,则这指示具有索引j的层是具有索引i的层的直接参考层。如果针对在从0到vps_max_layers_minus1的范围内的i和j不存在vps_direct_ref_layer_flag[i][j],则vps_direct_ref_layer_flag[i][j]的值被推断为等于0。当vps_independent_layer_flag[i]值等于0时,应存在从0到i-1的范围(包括端点)的j的一个或更多个值,使得允许vps_direct_ref_layer_flag[i][j]等于1。
如下文所描述,得出(或推断)NumDirectRefLayers[i]、DirectRefLayerIdx[i][d]、NumRefLayers[i]、RefLayerIdx[i][r]以及LayerUsedAsRefLayerFlag[j]。
如果vps_max_tid_il_ref_pics_plus1[i][j]值等于0,则这指示不作为IRAP图片也不作为具有ph_recovery_poc_cnt值0的GDR图片的第j层的图片不被用作用于第i层图片的图片解码的ILRP。当vps_max_tid_il_ref_pics_plus1[i][j]的值大于0时,这指示当解码第i层图片时,具有大于vps_max_tid_il_ref_pics_plus1[i][j]-1的TemporalId的第j层图片不被用作ILRP。当vps_max_tid_il_ref_pics_plus1语法元素不存在于VPS中时,vps_max_tid_il_ref_pics_plus1[i][j]值被推断为等于vps_max_sublayer_minus1+1。
如果vps_each_layer_is_an_ols_flag值等于1,则这指示各个OLS包括仅一个层,并且包括在参考VPS的CVS内的各个层自身中的层为OLS,其为唯一输出层。如果vps_each_layer_is_an_ols_flag等于0,则这指示一个或更多个OLS包括两个或更多个层。如果vps_max_layers_minus1值等于0,则vps_each_layer_is_an_ols_flag的值可以被推断为等于1。否则,如果vps_all_independent_layers_flag等于0,则vps_each_layer_is_an_ols_flag的值可以被推断为等于0。
如果vps_ols_mode_idc的值等于0,则这指示由VPS指示的OLS的总数量等于vps_max_layers_minus1+1,并且这还指示第i个OLS包括各自具有范围从0到i的层索引的层,并且对于各个OLS而言该OLS内的仅最高层为输出层。
如果vps_ols_mode_idc的值等于1,则这指示由VPS指示的OLS的总数量等于vps_max_layers_minus1+1,并且这还指示第i个OLS包括各自具有范围从0到i的层索引的层,并且对于各个OLS而言该OLS的所有层为输出层。
如果vps_ols_mode_idc的值等于2,则这指示显式地用信号通知由VPS指示的OLS的总数量,对于各个OLS显式地用信号通知输出层,并且其它层是OLS的输出层的直接或间接参考层。
vps_ols_mode_idc的值应在0到2的范围内。
如果vps_all_independent_layers_flag值等于1,并且如果vps_each_layer_is_an_ols_flag值等于0,则vps_ols_mode_idc的值被推断为等于2。
vps_num_output_layer_sets_minus1+1指示当vps_ols_mode_idc值等于2时由VPS指示的OLS的总数量。
如下所示得出(或推断)变量TotalNumOlss,该变量指示由VPS指示的OLS的总数量。
[表2]
Figure BDA0003939424660000341
当vps_ols_output_layer_flag[i][j]的值等于1时,这指示当vps_ols_mode_idc值等于2时,具有等于vps_layer_id[j]的nuh_layer_id的层为第i个OLS的输出层。当vps_ols_output_layer_flag[i][j]的值等于0时,这指示当vps_ols_mode_idc值等于2时,具有等于vps_layer_id[j]的nuh_layer_id的层不是第i个OLS的输出层。
如下所示得出指示第i个OLS内的输出层的数量的变量NumOutputLayersInOls[i]、指示第i个OLS内的第j层的子层的数量的变量NumSubLayersInLayerInLayerInOLS[i][j]、指示第i个OLS内的第j个输出层的nuh_layer_id值的变量OutputLayerIdInOls[i][j]以及指示第k层是否用作至少一个OLS内的输出层的变量LayerUsedAsOutputLayerFlag[k]。
[表3]
Figure BDA0003939424660000351
Figure BDA0003939424660000361
对于存在于从0到vps_max_layers_minus1的范围内的i的各个值,LayerUsedAsRefLayerFlag[i]和LayerUsedAsOutputLayerFlag[i]的值两者不等于0。也就是说,不应存在不是至少一个OLS的输出层的层或不是另一层的直接参考层的层。应当存在作为各个OLS的输出层的一个或更多个层。也就是说,对于在从0到TotalNumOlsl-1的范围内(包括端点)的i值而言,NumOutputLayersInOls[i]值应等于或大于1。
如下所示得出指示第i个OLS内的层的数量的变量NumLayersInOls[i]、指示第i个OLS内的第j层的nuh_layer_id值的变量LayerIdInOls[i][j]、指示多层OLS(即,包括两个或更多个层的OLS)的数量的变量NumMultiLayerOlss以及指示当NumLayersInOls[i]大于0时用于多层OLS列表或第i个OLS的索引的变量MultiLayerOlsIdx[i]。
[表4]
Figure BDA0003939424660000371
第0个OLS仅包括最低层(即,具有等于vps_layer_id[0]的nuh_layer_id的层),并且在第0个OLS的情况下,输出所包括的唯一层。
如下所示,得出(或推断)变量OlsLayerIdx[i][j],该变量指示具有等于LayerIdInOls[i][j]的nuh_layer_id的层的OLS层索引。
[表5]
Figure BDA0003939424660000372
各个OLS的最低层应该是独立层。也就是说,对于从0到TotalNumOlss-1的范围(包括端点)的i的各个值而言,vps_independent_layer_flag[GeneralLayerIdx[LayerIdInOls[i][0]]]的值应等于1。
各个层应被包括在由VPS指示的一个或更多个OLS中。也就是说,应存在一对或更多对i和j值,使得对于具有等于vps_layer_id[k]值中的一个值的特定nuh_layer_idnuhLayerId的各个层而言,LayerIdInOls[i][j]值可以等于nuhLayerId,k在从0到vps_max_layers_minus1的范围内。本文中,i在从0到TotalNumOlss-1的范围内,并且j在从0到NumLayersInOls[i]-1的范围内(包括端点)。
vps_num_ptls_minus1+1指示VPS内的profile_tier_level()语法结构的数量。vps_num_ptls_minus1值应小于TotalNumOlss。
如果vps_pt_present_flag[i]的值等于1,则这指示简档、层级和一般约束信息存在于VPS内的第i个profile_tier_level()语法结构中。如果vps_pt_present_flag[i]的值等于0,则这指示简档、层级和一般约束信息不存在于VPS内的第i个profile_tier_level()语法结构中。vps_pt_present_flag[0]值被推断为等于1。如果vps_pt_present_flag[i]等于0,则VPS内的第i个profile_tier_level()语法结构的简档、层级和一般约束信息被得出(或推断)为与VPS内的第i-1个profile_tier_level()语法结构相同。
vps_ptl_max_temporal_id[i]指示的最高子层表示的TemporalId,其中级别信息存在于第i个profile_tier_level()语法结构中。vps_ptl_max_temporal_id[i]值应在0到vps_max_sublayer_minus1的范围内。当vps_ptl_max_temporal_id语法元素不存在于VPS中时,vps_ptl_max_temporal_id[i]值被推断为等于vps_max_sublayer_minus1。
vps_ptl_alignment_zero_bit应等于0。
vps_ols_ptl_idx[i]指定对于VPS内的profile_tier_level()语法结构列表而言,被应用于第i个OLS的profile_tier_level()语法结构的索引。当vps_ols_ptl_idx语法元素存在于VPS中时,vps_ols_ptl_idx[i]值应在从0到vps_num_ptls_minus1的范围内(包括端点)。
当vps_ols_ptl_idx语法元素不存在于VPS中时,如下文所描述得出(或推断)vps_ols_ptl_idx[i]值。
-如果vps_num_ptls_minus1值等于0,则vps_ols_ptl_idx[i]值被推断为等于0。
-否则(vps_num_ptls_minus1值大于0,并且vps_num_ptls_minus1+1等于TotalNumOlss),则vps_ols_ptl_idx[i]值被推断为等于i。
如果NumLayersInOls[i]值等于1,则应用于第i个OLS的profile_tier_level()语法结构也存在于由第i个OLS内的层参考的SPS中。当NumLayersInOls[i]值等于1时,根据比特流符合性要求,在VPS中用信号通知的profile_tier_level()语法结构和针对第i个OLS在SPS中用信号通知的profile_tier_level()语法结构应是相同的。
VPS内的各个profile_tier_level()语法结构应由至少一个vps_ols_ptl_idx[i]值参考,i范围从0到TotalNumOlss-1(包括端点)。
(当存在时)vps_num_dpb_params_minus1+1指示VPS内的dpb_parameters()语法结构的数量。vps_num_dpb_params_minus1值应在从0到NumMultiLayerOlss-1的范围内(包括端点)。
如下所示,得出(或推断)变量VpsNumDpbParams,该变量指示VPS内的dpb_parameters()语法结构的数量。
[表6]
Figure BDA0003939424660000391
vps_sublayer_dpb_params_present_flag用于控制VPS内的dpb_parameters()语法元素中存在max_dec_pic_buffering_minus1[]、max_num_reorder_pics[]以及max_latency_increase_plus1[]语法元素。如果不存在,则vps_sub_dpb_params_info_present_flag值被推断为等于0。
vps_dpb_max_temporal_id[i]指示最高子层表示的TemporalId,其中,DPB参数可以存在于VPS内的第i个dpb_parameters()语法结构中。vps_dpb_max_temporal_id[i]值应在0到vps_max_sublayer_minus1的范围内。当不存在时,vps_dpb_max_temporal_id[i]值被推断为等于vps_max_sublayer_minus1。
vps_ols_dpb_pic_width[i]以亮度样本为单位指示用于第i个多层OLS的各个图片存储缓冲器的宽度。
vps_ols_dpb_pic_height[i]以亮度样本为单位指示用于第i个多层OLS的各个图片存储缓冲器的高度。
vps_ols_dpb_chroma_format[i]指示对于由用于第i个多层OLS的CVS内的CLVS参考的所有SPS而言的sps_chroma_format_idc的最大允许值。
vps_ols_dpb_bitdepth_minus8[i]指示对于由用于第i个多层OLS的CVS内的CLVS参考的所有SPS而言的sps_bit_depth_minus8的最大允许值。
为了对第i个多层OLS进行解码,解码装置可以根据语法元素vps_ols_dpb_pic_width[i]、vps_ols_dpb_pic_height[i]、vps_ols_dpb_chroma_format[i]以及vps_ols_dpb_bitdepth_ols_dpb_bitdepth_ols_dpb_bitdepth的语法元素值将存储器安全地分配到DPB。
vps_ols_dpb_params_idx[i]指示对于VPS内的dpb_parameters()语法结构列表,被应用于第i多层OLS的dpb_parameters()语法结构的索引。当存在时,vps_ols_dpb_params_idx[i]值应在从0到VpsNumDpbParams-1的范围内(包括端点)。
如果不存在,则如下所述推断vps_ols_dpb_params_idx[i]。
-当VpsNumDpbParams等于1时,vps_ols_dpb_params_idx[i]的值等于0。
-否则(VpsNumDpbParams大于1并且等于NumMultiLayerOlss),vps_ols_dpb_params_idx[i]值被推断为等于i。
在单层OLS的情况下,可应用的dpb_parameters()语法结构存在于由OLS内的层参考的SPS中。
VPS内的各个dpb_parameters()语法结构应由至少一个vps_ols_dpb_params_idx[i]值参考,i的范围从0到NumMultiLayerOlss-1(包括端点)。
如果vps_general_hrd_params_present_flag值等于1,则这指示VPS包括general_hrd_parameters()语法结构以及其它HRD参数。如果vps_general_hrd_params_present_flag值等于0,则这指示VPS不包括general_hrd_parameters()语法结构也不包括其它HRD参数。当不存在时,vps_general_hrd_params_present_flag值被推断为等于0。
当NumLayersInOls[i]的值等于1时,应用于第i个OLS的general_hrd_parameters()语法结构和ols_hrd_parameters()语法结构存在于由第i个OLS内的层参考的SPS中。
如果vps_sublayer_cpb_params_present_flag值等于1,则这指示VPS内的第i个ols_hrd_parameters()语法结构包括用于具有从0到vps_hrd_max_tid[i]的范围(包括端点)的TemporalId的子层表示的HRD参数。并且,如果vps_sublayer_cpb_params_present_flag值等于0,则这指示VPS内的第i个ols_hrd_parameters()语法结构仅包括用于具有等于vps_hrd_max_tid[i]的TemporalId的子层表示的HRD参数。如果vps_max_sublayer_minus1值等于0,则vps_sublayer_cpb_params_present_flag值被推断为等于0。
当vps_sublayer_cpb_params_present_flag值等于0时,用于具有从0到vps_hrd_max_tid[i]-1的范围(包括端点)的TemporalId的子层表示的HRD参数被推断为等于具有等于vps_hrd_max_tid[i]的TemporalId的子层表示。这包括从fixed_pic_rate_general_flag[i]语法元素开始到sublayer_hrd_parameters(i)语法结构的HRD参数,所述sublayer_hrd_parameters(i)语法结构紧接在ols_hrd_parameters语法结构内的“if(general_vcl_hrd_params_present_flag)”条件下。
vps_num_ols_hrd_params_minus1加1指示当vps_general_hrd_params_present_flag值等于1时存在于VPS内的ols_hrd_parameters()语法结构的数量。vps_num_ols_hrd_params_minus1值应在从0到NumMultiLayerOlss-1的范围内(包括端点)。
vps_hrd_max_tid[i]指示具有包括在第i个ols_hrd_parameters()语法结构中的HRD参数的最高子层表示的TemporalId。vps_hrd_max_tid[i]的值应在0到vps_max_sublayer_minus1的范围内。当不存在时,vps_hrd_max_tid[i]值被推断为等于vps_max_sublayer_minus1。
vps_ols_hrd_idx[i]指示对于VPS内的ols_hrd_parameters()语法结构列表而言,被应用于第i多层OLS的ols_hrd_parameters()语法结构的索引。vps_ols_hrd_idx[i]值应在0到vps_num_ols_hrd_params_minus1的范围内。
如果不存在,则如下推断(或推演)vps_ols_hrd_idx[i]。
-如果vps_num_ols_hrd_params_minus1值等于0,则vps_ols_hrd_idx[i]值被推断为等于0。
-否则(vps_num_ols_hrd_params_minus1+1大于1并且等于NumMultiLayerOlss),vps_ols_hrd_idx[i]值被推断为等于i。
在单层OLS的情况下,可应用的ols_hrd_parameters()语法结构存在于由OLS内的层参考的SPS中。
VPS内的各个ols_hrd_parameters()语法结构应由至少一个vps_ols_hrd_idx[i]值参考,i的范围从0到NumMultiLayerOlss-1(包括端点)。
如果vps_extension_flag值等于0,则这指示vps_extension_data_flag语法元素不存在于VPS RBSP语法结构中。并且,如果vps_extension_flag值等于1,则这指示vps_extension_data_flag语法元素存在于VPS RBSP语法结构中。
vps_extension_data_flag可以具有随机值。
在具有单层的比特流的情况下,VPS的存在是可选的。如果不存在VPS,则sps_video_parameter_set_id语法元素的值等于0,并且如下文所描述推断参数值的部分。
如果sps_video_parameter_set_id的值等于0,则适用以下内容。
-SPS不参考VPS,并且当对参考SPS的各个CLVS进行解码时,VPS不被参考。
-vps_max_layers_minus1值被推断为等于0。
-vps_max_sublayer_minus1值被推断为等于6。
-CVS应包括仅一个层(即,CVS内的所有VCL NAL单元应具有相同的nuh_layer_id值)。
-GeneralLayerIdx[nuh_layer_id]值被推断为等于0。
-vps_independent_layer_flag[GeneralLayerIdx[nuh_layer_id]]值被推断为等于1。
当执行视频/图像编码时,可以在层之间共享参数集(PPS、SPS、VPS等)。也就是说,特定层内的VCL NAL单元可以参考另一层内的参数集。当使用参数集共享函数时,存在以下约束。
spsLayerId设定为特定(或具体)SPS NAL单元的nuh_layer_id,并且vclLayerId设定为特定VCL NAL单元的nuh_layer_id值。除了当spsLayerId小于或不等于vclLayerId时以及当由包括各自具有与vclLayerId相同的nuh_layer_id的层的VPS指示的OLS当中,并非所有OLS包括具有与spslayerId相同的nuh_layer_id的层时,特定VCL NAL单元不参考特定SPS NAL单元。
ppsLayerId设定为特定PPS NAL单元的nuh_layer_id,并且vclLayerId设定为特定VCL NAL单元的nuh_layer_id值。除了当ppsLayerId小于或不等于vclLayerId时以及当由包括各自具有与vclLayerId相同的nuh_layer_id的层的VPS指示的OLS当中,并非所有OLS包括具有与ppslayerId相同的nuh_layer_id的层时,特定VCL NAL单元不应参考特定PPS NAL单元。
apsLayerId设定为特定APS NAL单元的nuh_layer_id,并且vclLayerId设定为特定VCL NAL单元的nuh_layer_id值。除了当apsLayerId小于或不等于vclLayerId时以及当由包括各自具有与vclLayerId相同的nuh_layer_id的层的VPS指示的OLS当中,并非所有OLS包括具有与apslayerId相同的nuh_layer_id的层时,特定VCL NAL单元不应参考特定APS NAL单元。
此外,当VPS不存在于CVS中时(即,当比特流为单层比特流时),比特流内的所有VCL NAL单元应具有相同的nuh_layer_id,并且所有VCL NAL单元应参考同一层内的参数集。然而,由于这样的约束不包括在前述约束中,因此会在被设计以仅处置单层比特流的解码装置的情况下产生附加复杂性。
另外,当VPS不存在于CVS中时,不建立OLS信息。因此,不得出(或推断)或初始化解码所需的参数的部分,诸如TotalNumOlss、NumLayersInOls[]、NumOutputLayersInOls[]等。这在解码装置的工作中引起问题。
为了描述本说明书的详细示例,例示了以下附图。装置(或设备)的详细术语或附图中指定的信号/信息的详细术语仅是示例性的。因此,本说明书的技术特征将不限于在以下附图中使用的详细术语。
本说明书提供了以下方法以解决上述问题。每种方法的内容可以独立应用或者可以组合应用。
例如,当对于CVS不存在VPS时(即,当sps_video_parameter_set_id值等于0时),可以应用以下约束。
a)参考SPS的CVS内的所有VCL NAL单元的层标识符(nuh_layer_id)各自具有与SPS的层标识符(nuh_layer_id)相同的值。
b)所有VCL NAL单元的层标识符(nuh_layer_id)值与由所有VCL NAL单元参考的参数集的层标识符(nuh_layer_id)的值相同。
在本文中,由VCL NAL单元参考的参数集包括用于对本说明书中公开的视频/图像信息进行解码的参数集。例如,参数集可以包括APS、PPS、SPS、VPS等。
另选地,前述约束可以表达如下。
a)CVS内的所有VCL NAL单元具有相同的层标识符(nuh_layer_id)值。
b)由CVS内的各个VCL NAL单元参考的参数集的层标识符(nuh_layer_id)与VCLNAL单元的层标识符(nuh_layer_id)相同。
另选地,前述约束可以表达如下。
a)CVS内的所有VCL NAL单元以及由VCL NAL单元参考的参数集具有相同的层标识符(nuh_layer_id)值。
另选地,当VCL NAL单元参考具有与VCL NAL单元的层标识符(nuh_layer_id)不同的层标识符(nuh_layer_id)的参数时,前述约束可以表达(或表示)成使得sps_video_parameter_set_id值等于0。
另外,例如,当VPS不存在于CVS时(即,当sps_video_parameter_set_id值等于0时),仅一个输出层集存在于CVS内,并且输出层集包括CVS内的仅一个层,并且该层可以被得出(或推断)为输出层集的输出层。
在针对CVS不存在VPS的情况下,如下文所描述,可以得出(或推断)以下参数的值。
a)TotalNumOlss被推断为等于1。
b)NumLayersInOls[0]被推断为等于1。
c)NumOutputLayersInOls[0]被推断为等于1。
d)OutputLayerIdInOls[0][0]被推断为等于SPS的nuh_layer_id。
根据实施方式,下文所示的表7可以适用于sps_video_parameter_set_id语法元素。
[表7]
Figure BDA0003939424660000441
参照表7,当sps_video_parameter_set_id语法元素的值等于0或更大时(即,当包括sps_video_parameter_set_id语法元素的比特流是多层比特流时),sps_video_parameter_set_id语法元素指示由对应比特流内的SPS参考的VPS的vps_video_parameter_set_id语法元素的值。
当sps_video_parameter_set_id语法元素等于0时(即,当包括sps_video_parameter_set_id语法元素的比特流是单层比特流时),对应比特流可以不包括VPS。因此,对应比特流内的SPS不参考VPS,并且当对参考SPS的各个CLVS进行解码时,VPS不被参考。
并且,指示CVS内的层的最大数量的语法元素(vps_max_layers_minus1)被得出(或推演)为等于0,并且指示可以存在于CVS中的时间子层的数量的语法元素(vps_max_sublayer_minus1)的值可以被推断为等于6。
另外,当sps_video_parameter_set_id语法元素的值等于0时,CVS包括仅一个层,并且以下内容适用于该CVS。
-参考对该CVS进行参考的SPS的所有VCL NAL单元的nuh_layer_id语法元素的值与SPS的nuh_layer_id语法元素的值相同。
-该CVS内的所有VCL NAL单元的nuh_layer_id语法元素的值与由VCL NAL单元参考的参数集的nuh_layer_id语法元素的值相同。
在本文中,参数集可以包括APS、PPS、SPS、VPS等。因此,当CVS包括仅一个层时,VPS的nuh_layer_id(apsLayerId)、PPS的nuh_layer_id(ppsLayerId)、SPS的nuh_layer_id(spsLayerId)以及VPS的nuh_layer_id(vps_layer_id)与VCL NAL单元的nuh_layer_id相同。
另外,与层间预测相关的语法元素(vps_independent_layer_flag[GeneralLayerIdx[nuh_layer_id]])的值被推断为等于1。也就是说,不使用层间预测。
当vps_independent_layer_flag[GeneralLayerIdx[nuh_layer_id]]的值等于1时,由具有特定nuh_layer_id值的nuhLayerId的CLVS参考的SPS具有与nuhLayerId相同的nuh_layer_id。
对于由CVS内的CLVS参考的所有SPS而言,sps_video_parameter_set_id的值是相同的。
根据另一实施方式,下文所示的表8可以适用于sps_video_parameter_set_id语法元素。
[表8]
Figure BDA0003939424660000451
Figure BDA0003939424660000461
参照表8,当sps_video_parameter_set_id语法元素的值等于0或更大时,sps_video_parameter_set_id语法元素指示用于由对应比特流内的SPS参考的VPS的vps_video_parameter_set_id语法元素的值。
当sps_video_parameter_set_id语法元素等于0时,对应比特流内的SPS不参考VPS,并且当对参考SPS的各个CLVS进行解码时,VPS不被参考。
并且,指示CVS内的层的最大数量的语法元素(vps_max_layers_minus1)被得出(或推演)为等于0,并且指示可以存在于CVS中的时间子层的数量的语法元素(vps_max_sublayer_minus1)的值可以被推断为等于6。
另外,当sps_video_parameter_set_id语法元素的值等于0时,CVS包括仅一个层,并且以下内容适用于该CVS。
-该CVS内的所有VCL NAL单元具有相同的nuh_layer_id值。
-由该CVS内的各个VCL NAL单元参考的参数集的nuh_layer_id与VCL NAL单元的nuh_layer_id相同。
另外,与层间预测相关的语法元素(vps_independent_layer_flag[GeneralLayerIdx[nuh_layer_id]])的值被推断为等于1。
当vps_independent_layer_flag[GeneralLayerIdx[nuh_layer_id]]的值等于1时,由具有特定nuh_layer_id值的nuhLayerId的CLVS参考的SPS具有与nuhLayerId相同的nuh_layer_id。
对于由CVS内的CLVS参考的所有SPS而言,sps_video_parameter_set_id的值是相同的。
根据又一实施方式,下文所示的表9可以适用于sps_video_parameter_set_id语法元素。
[表9]
Figure BDA0003939424660000471
参照表9,当sps_video_parameter_set_id语法元素的值等于0或更大时,sps_video_parameter_set_id语法元素指示由对应比特流内的SPS参考的VPS的vps_video_parameter_set_id语法元素的值。
当sps_video_parameter_set_id语法元素等于0时,对应比特流内的SPS不参考VPS,并且当对参考SPS的各个CLVS进行解码时,VPS不被参考。
并且,指示CVS内的层的最大数量的语法元素(vps_max_layers_minus1)被得出(或推演)为等于0,并且指示可以存在于CVS中的时间子层的数量的语法元素(vps_max_sublayer_minus1)的值可以被推断为等于6。
另外,当sps_video_parameter_set_id语法元素的值等于0时,CVS包括仅一个层,并且CVS内的所有VCL NAL单元和由VCL NAL单元参考的参数集具有相同的nuh_layer_id值。
另外,与层间预测相关的语法元素(vps_independent_layer_flag[GeneralLayerIdx[nuh_layer_id]])的值被推断为等于1。
当vps_independent_layer_flag[GeneralLayerIdx[nuh_layer_id]]的值等于1时,由具有特定nuh_layer_id值nuhLayerId的CLVS参考的SPS具有与nuhLayerId相同的nuh_layer_id。
对于由CVS内的CLVS参考的所有SPS而言,sps_video_parameter_set_id的值是相同的。
作为又一实施方式,当CVS包括仅一个层时,可以应用以下约束,如下文在表10中所示。
[表10]
Figure BDA0003939424660000481
也就是说,spsLayerId被设定为特定(或具体)SPS NAL单元的nuh_layer_id,并且vclLayerId被设定为特定VCL NAL单元的nuh_layer_id值。除了当spsLayerId小于或不等于vclLayerId时,当sps_video_parameter_set_id值不等于0时,以及当由包括各自具有与vclLayerId相同的nuh_layer_id的层的VPS指示的OLS当中不是所有OLS包括具有与spslayerId相同的nuh_layer_id的层时,特定VCL NAL单元不参考特定SPS NAL单元。
ppsLayerId被设定为特定PPS NAL单元的nuh_layer_id,并且vclLayerId被设定为特定VCL NAL单元的nuh_layer_id值。除了当ppsLayerId小于或不等于vclLayerId时,当sps_video_parameter_set_id值不等于0时,以及当由包括各自具有与vclLayerId相同的nuh_layer_id的层的VPS指示的OLS当中不是所有OLS包括具有与spslayerId相同的nuh_layer_id的层时,特定VCL NAL单元不应参考特定PPS NAL单元。
apsLayerId被设定为特定APS NAL单元的nuh_layer_id,并且vclLayerId被设定为特定VCL NAL单元的nuh_layer_id值。除了当apsLayerId小于或不等于vclLayerId时,以及当由包括各自具有与vclLayerId相同的nuh_layer_id的层的VPS指示的OLS当中不是所有OLS包括具有与apslayerId相同的nuh_layer_id的层时,特定VCL NAL单元不应参考特定APS NAL单元。
另外,当CVS包括仅一个层时,可以应用以下约束,如下文在表11中所示。
[表11]
Figure BDA0003939424660000491
参照表11,当sps_video_parameter_set_id语法元素等于0时,对应比特流内的SPS不参考VPS,并且当对参考SPS的各个CLVS进行解码时,VPS不被参考。
另外,指示CVS内的层的最大数量的语法元素(vps_max_layers_minus1)被得出(或推演)为等于0,并且指示可以存在于CVS中的时间子层的数量的语法元素(vps_max_sublayer_minus1)的值被推断为等于6。
另外,CVS包括仅一个层,并且以下内容适用于该CVS。也就是说,该CVS内的所有VCL NAL单元具有相同的nuh_layer_id值。
另外,指示由VPS指定的OLS的总数量的TotalNumOlss被推断为等于1,并且指示第0个OLS内的层的数量的NumLayersInOls[0]被推断为等于1。
另外,指示第0个OLS内的输出层的数量的NumOutputLayersInOls[0]被推断为等于1,并且指示第0个OLS内的第0输出层的nuh_layer_id值的OutputLayerIdInOls[0][0]被推断为等于1。
另外,GeneralLayerIdx[nuh_layer_id]值被推断为等于nuh_layer_id,并且vps_independent_layer_flag[GeneralLayerIdx[nuh_layer_id]]值被推断为等于1。当vps_independent_layer_flag[GeneralLayerIdx[nuh_layer_id]]值等于1时,由具有特定nuh_layer_id值nuhLayerId的CLSV参考的SPS具有与nuhLayerId相同的nuh_layer_id。
在由CVS内的CLVS参考的所有SPS中,sps_video_parameter_set_id值相同。
此外,如下文所描述,可以得出(或推断)当前图片的变量PictureOutputFlag。
-在当前层不是输出层时(即,当对于在0到NumOutputLayersInOls[TargetOlsIdx]-1的范围内(包括端点)的i值,nuh_layer_id不与OutputLayerIdInOls[TargetOlsIdx][i]相同时),或当以下条件中的一者为真时,PictureOutputFlag被设定为等于0。
-当前图片为RASL图片,并且相关IRAP图片的NoOutputBeforeRecoveryFlag等于1。
-当前图片为具有等于1的NoOutputBeforeRecoveryFlag的GDR图片,或当前图片为具有等于1的NoOutputBeforeRecoveryFlag的GDR图片的重构图片。
-否则,PictureOutputFlag被设定为与ph_pic_output_flag相同。
此外,解码装置可以输出不属于输出层的图片。例如,当AU不能使用输出层的图片时,当仅存在一个输出层时(例如,归因于丢失或层下切换),在AU的可以使用的所有图片当中,对于具有最高nuh_layer_id值以及等于1的ph_pic_output_flag的图片,解码装置可以将PictureOutputFlag设定为1。对于AU的可以使用的所有其它图片,解码装置可以将PictureOutputFlag设定为0。
图9和图10分别示出了根据本公开的实施方式的视频/图像编码方法和相关组件的一般示例。
图9中公开的视频/图像编码方法可以由图2、图3和图10中公开的(视频/图像)编码装置200来执行。更具体地,例如,图9的S900和S910可以由编码装置200的预测器220执行,并且S920可以由编码装置200的熵编码器240执行。图9中公开的视频/图像编码方法可以包括以上在本说明书中描述的实施方式。
更具体地,参照图9和图10,编码装置的预测器220可以对当前图片内的当前块执行帧间预测或帧内预测中的至少一者(S900),并且接着基于所述预测生成关于当前块的预测样本(预测块)以及预测信息(S910)。
当执行帧内预测时,预测器220可以通过参考当前图片内的样本(当前块的邻近样本)来预测当前块。预测器220可以通过使用应用于邻近样本的预测模式来确定将应用于当前块的预测模式。
当执行帧间预测时,预测器220可以通过基于当前块的运动信息执行帧间预测来生成预测信息和针对当前块预测的块。上文所描述的预测信息可以包括与预测模式相关的信息、与运动信息相关的信息等。与运动信息相关的信息可以包括候选选择信息(例如,合并索引、mvp_flag或mvp_index),其为用于得出运动向量的信息。另外,与运动信息相关的信息可以包括关于运动向量差(MVD)的上述信息和/或参考图片索引信息。另外,与运动信息相关的信息可以包括指示是应用L0预测、L1预测还是双预测的信息。例如,预测器220可以基于运动估计得出当前图片内的当前块的运动信息。为此,通过使用对应于当前块的原始图片内的原始块,预测器220可以在参考图片内的确定的搜索范围内以分数像素为单位搜索具有高相关性的类似参考块。并且接着,预测器220可以通过所搜索的参考块得出运动信息。可以根据基于相位的样本值之间的差得出块的相似性。例如,可以基于当前块(或当前块模板)与参考块(或参考块模板)之间的绝对差总和(SAD)计算块的相似性。在这种情况下,可以基于在搜索区域内具有最小SAD的参考块得出运动信息。可以通过使用基于帧间预测模式的各种方法将得出的运动信息用信号通知给解码装置。
编码装置的残差处理器230可以基于从预测器220生成的预测样本和原始图片(原始块、原始样本)生成残差样本和残差信息。在本文中,残差信息是与残差样本相关的信息,并且残差信息可以包括与残差样本的(量化)变换系数相关的信息。
编码装置的加法器(或重构器)可以通过将在残差处理器230中生成的残差样本和在预测器220中生成的预测样本相加来生成重构样本(重构图片、重构块、重构样本阵列)。
编码装置的熵编码器240可以对包括在预测器220中生成的预测信息、在残差处理器230中生成的残差信息等的图像信息进行编码(S920)。在本文中,图像信息可以进一步包括关于VCL NAL单元的信息以及关于HLS的信息,并且可以以比特流形式传递(或传送)到解码装置。比特流是以形成构成一个或更多个CVS的存取单位(AU)的表达的NAL单元流或字节流的形式配置的比特序列。在单层比特流的情况下,比特流可以由一个CVS形成,并且在这种情况下,CVS可以作为与比特流相同的含义来使用。
与HLS相关的信息可以包括与用于对图像/视频信息进行解码的参数集相关的信息/语法。例如,参数集可以包括APS、PPS、SPS、VPS等。SPS可以包括sps_video_parameter_set_id语法元素。
在本实施方式中,可以基于sps_video_parameter_set_id语法元素的值得出包括在比特流中的VCL NAL单元的层标识符和由VCL NAL单元参考的参数集的层标识符。
例如,当sps_video_parameter_set_id语法元素的值大于0时,即,当sps_video_parameter_set_id语法元素值不等于0时,sps_video_parameter_set_id语法元素可以指示SPS参考的VPS的标识符(vps_video_parameter_set_id语法元素)的值。
当sps_video_parameter_set_id语法元素的值等于0时,CVS内的SPS的所有VCLNAL单元的nuh_layer_id语法元素的值可以等于SPS的nuh_layer_id语法元素的值。并且VCL NAL单元的nuh_layer_id语法元素的值可以等于由VCL NAL单元参考的参数集的nuh_layer_id语法元素的值。
另选地,当sps_video_parameter_set_id语法元素值等于0时,CVS内的所有VLSNAL单元可以具有相同NAL单元报头层标识符(nuh_layer_id)值,并且CVS内的各个VCL NAL单元参考的参数集的NAL单元报头层标识符(nuh_layer_id)可以与VCL NAL单元的NAL单元报头层标识符(nuh_layer_id)相同。
另选地,当sps_video_parameter_set_id语法元素值等于0时,CVS内的所有VCLNAL单元和由VCL NAL单元参考的参数集具有相同NAL单元报头层标识符(nuh_layer_id)。
另外,根据本实施方式,可以基于sps_video_parameter_set_id语法元素的值得出与OLS相关的信息。与OLS相关的信息可以包括上述TotalNumOlss、NumLayersInOls[i]、NumOutputLayersInOls[i]、OutputLayerIdInOls[i][j]等。在本文中,TotalNumOlss指示由视频参数集指定OLS的总数量。NumOutputLayersInOls[i]指示第i个OLS内的输出层的数量。OutputLayerIdInOls[i][j]指示第i个OLS内的第j个输出层的NAL单元报头的层标识符(nuh_layer_id)的值。
例如,当sps_video_parameter_set_id语法元素值等于0时,TotalNumOlss、NumLayersInOls[0]、NumOutputLayersInOls[0]以及OutputLayerIdInOls[0][0]中的至少一者的值可以被推断为等于1。另外,GeneralLayerIdx[nuh_layer_id]值可以被推断为与nuh_layer_id相同。
因此,根据本说明书,即使是在单层比特流(CVS中不存在VSP)的情况下,由于可以得出(或推断)由VCL NAL单元参考的VPS的层标识符,因此可以提高设计为仅处置单层比特流的解码装置的编码效率。此外,即使CVS中不存在VSP,由于可以得出(或推断)或初始化与OLS相关的信息,因此可以防止在CVS中不存在VSP的情况下在解码过程期间可以能发生的问题。
图11和图12分别示出了根据本公开的实施方式的视频/图像解码方法和相关组件的一般示例。
图11中公开的视频/图像解码方法可以由图4、图5和图12中公开的(视频/图像)解码装置300来执行。更具体地,例如,图11的S1100可以由解码装置的熵解码器310执行。S1110可以由解码装置的预测器330执行,并且S1120可以由解码装置的加法器340执行。图11中公开的视频/图像解码方法可以包括上文在本说明书中所描述的实施方式。
参照图11和图12,解码装置的熵解码器310可以从比特流获得包括VCL NAL单元的图像信息(S1100)。除了与VCL NAL单元相关的信息之外,图像信息还可以包括预测信息、残差信息、与HLS相关的信息、与环路滤波相关的信息等。预测信息可以包括帧间/帧内预测区分信息、帧内预测模式相关信息、帧间预测模式相关信息等。与HLS相关的信息可以包括与用于对图像/视频信息进行解码的参数集相关的信息/语法。在本文中,参数集可以包括APS、PPS、SPS、VPS等。SPS可以包括sps_video_parameter_set_id语法元素。
解码装置的熵解码器310可以基于sps_video_parameter_set_id语法元素值得出(或推断)VCL NAL单元的层标识符、由VCL NAL单元参考的参数集的层标识符和/或与OLS相关的信息。
例如,当从比特流解析的sps_video_parameter_set_id语法元素的值大于0时,解码装置的熵解码器310可以得出(或推断)sps_video_parameter_set_id语法元素值等于由SPS参考的VPS(vps_video_parameter_set_id语法元素)的标识符的值。然而,如果sps_video_parameter_set_id语法元素值等于0,则解码装置的熵解码器310可以得出(或推断)CVS内的SPS的所有VCL NAL单元的nuh_layer_id语法元素的值与SPS的nuh_layer_id语法元素的值相同,并且可以得出(或推断)VCL NAL单元的nuh_layer_id语法元素的值与由VCLNAL单元参考的参数集的nuh_layer_id语法元素的值相同。
作为另一示例,如果从比特流解析的sps_video_parameter_set_id语法元素的值大于0,则解码装置的熵解码器310可以得出(或推断)CVS内的所有VLS NAL单元与NAL单元报头层标识符(nuh_layer_id)值相同,并且可以得出(或推断)由CVS内的各个VCL NAL单元参考的参数集的NAL单元报头层标识符(nuh_layer_id)与VCL NAL单元的NAL单元报头层标识符(nuh_layer_id)相同。
作为又一示例,如果从比特流解析的sps_video_parameter_set_id语法元素的值大于0,则解码装置的熵解码器310可以得出(或推断)CVS内的所有VCL NAL单元与由VCLNAL单元参考的参数集具有相同的NAL单元报头层标识符(nuh_layer_id)。
另外,解码装置的熵解码器310可以基于从比特流解析的sps_video_parameter_set_id语法元素的值得出与OLS相关的信息。与OLS相关的信息可以包括指示由视频参数集指定的OLS总数量的TotalNumOlss、指示第i个OLS内的层的数量的NumLayersInOls[i]、指示第i个OLS内的输出层的数量的NumOutputLayersInOls[i]以及指示第i个OLS内的第j个输出层的NAL单元报头的层标识符(nuh_layer_id)的值的OutputLayerIdInOls[i][j]。
例如,如果从比特流解析的sps_video_parameter_set_id语法元素的值等于0,则TotalNumOlss、NumLayersInOls[0]、NumOutputLayersInOls[0]以及OutputLayerIdInOls[0][0]中的至少一者的值可以被推断等于1。另外,GeneralLayerIdx[nuh_layer_id]值可以被推断为与nuh_layer_id相同。
更具体地,解码装置的预测器330可以基于从比特流获得的预测信息对当前图片内的当前块执行帧间预测和/或帧内预测,以生成当前块的预测样本(S1110)。此后,解码装置的残差处理器320可以基于从比特流获得的残差信息生成残差样本。解码装置的加法器340可以基于在预测器330中生成的预测样本和在残差处理器320中生成的残差样本生成重构样本,并且然后可以基于重构样本生成重构图片(重构块)(S1120)。
此后,可以根据需要将环路滤波过程(诸如去块滤波、SAO和/或ALF过程)应用于重构图片,以增强主观/客观图片质量。
尽管已经基于以上述实施方式中的序列列出步骤或块的流程图描述了方法,但是本公开的步骤不限于特定顺序,并且可以以相对于上面描述的不同的步骤或以不同的顺序或同时执行特定步骤。此外,本领域普通技术人员将理解,流程图的步骤不是排他性的,并且可以在其中包括另一步骤,或者可以删除流程图中的一个或更多个步骤,而不对本公开的范围施加影响。
根据本公开的前述方法可以是软件的形式,并且根据本公开的编码装置和/或解码装置可以包括在用于执行图像处理的装置中,例如TV、计算机、智能电话、机顶盒、显示装置等。
当本公开的实施方式通过软件实现时,上述方法可以由执行上述功能的模块(过程或功能)来实现。模块可以存储在存储器中并且由处理器执行。存储器可以安装在处理器内部或外部,并且可以经由各种公知的方式连接到处理器。处理器可以包括专用集成电路(ASIC)、其它芯片组、逻辑电路和/或数据处理装置。存储器可以包括只读存储器(ROM)、随机存取存储器(RAM)、闪存、存储卡、存储介质和/或其它存储装置。换言之,根据本公开的实施方式可以在处理器、微处理器、控制器或芯片上实现和执行。例如,相应图中所示的功能单元可以在计算机、处理器、微处理器、控制器或芯片上实现和执行。在这种情况下,关于实现方式的信息(例如,关于指令的信息)或算法可以存储在数字存储介质中。
另外,应用本公开的实施方式的解码装置和编码装置可以包括在多媒体广播收发器、移动通信终端、家庭电影视频装置、数字电影视频装置、监视摄像机、视频聊天装置和实时通信装置中,诸如视频通信、移动流装置、存储介质、摄像机、视频点播(VoD)服务提供商、过顶(OTT)视频装置、互联网流服务提供商、3D视频装置、虚拟现实(VR)装置、增强现实(AR)装置、图像电话视频装置、车辆终端(例如,车辆(包括自主车辆)终端、飞机终端或船舶终端)和医疗视频装置;并且可以用于处理图像信号或数据。例如,OTT视频装置可以包括游戏控制台、蓝光播放器、互联网连接TV、家庭影院系统、智能电话、平板PC和数字视频记录器(DVR)。
另外,应用本公开的实施方式的处理方法可以以由计算机执行的程序的形式生成,并且可以存储在计算机可读记录介质中。具有根据本公开的实施方式的数据结构的多媒体数据也可以存储在计算机可读记录介质中。计算机可读记录介质包括存储计算机可读数据的所有类型的存储装置和分布式存储装置。计算机可读记录介质可以包括例如蓝光盘(BD)、通用串行总线(USB)、ROM、PROM、EPROM、EEPROM、RAM、CD-ROM、磁带、软盘和光学数据存储装置。计算机可读记录介质还包括以载波(例如,通过互联网的传输)的形式体现的介质。此外,通过编码方法生成的比特流可以存储在计算机可读记录介质中或通过有线或无线通信网络发送。
另外,本公开的实施方式可以基于程序代码体现为计算机程序产品,并且程序代码可以根据本公开的实施方式在计算机上执行。程序代码可以存储在计算机可读载体上。
图13表示可以应用本公开的实施方式的内容流系统的示例。
参照图13,应用本公开的实施方式的内容流系统通常可以包括编码服务器、流服务器、网络服务器、媒体存储装置、用户装置和多媒体输入装置。
编码服务器用于将从诸如智能手机、照相机或便携式摄像机等的多媒体输入装置输入的内容压缩为数字数据,以生成比特流并将比特流发送到流传输服务器。作为另一示例,当诸如智能手机、照相机或便携式摄像机等的多媒体输入装置直接生成比特流时,可以省略编码服务器。
可以通过应用了本公开的实施方式的编码方法或比特流生成方法来生成比特流,并且流传输服务器可以在发送或接收比特流的过程中临时存储比特流。
流传输服务器基于用户请求通过网络服务器向用户装置发送多媒体数据,并且网络服务器用作向用户通知服务的媒介。当用户从网络服务器请求所需的服务时,网络服务器向流传输服务器递送该请求,并且流传输服务器向用户发送多媒体数据。在这种情况下,内容流传输系统可以包括单独的控制服务器。在这种情况下,控制服务器用于控制内容流传输系统内的装置之间的命令/响应。
流传输服务器可以从媒体储存器和/或编码服务器接收内容。例如,当从编码服务器接收内容时,可以实时接收内容。在这种情况下,为了提供平稳的流传输服务,流传输服务器可以将比特流存储预定时间段。
例如,用户装置可以包括移动电话、智能电话、膝上型计算机、数字广播终端、个人数字助理(PDA)、便携式多媒体播放器(PMP)、导航、平板PC、平板电脑PC、超级本、可穿戴装置(例如,手表型终端(智能手表)、眼镜型终端(智能眼镜)、头戴式显示器(HMD))、数字TV、台式计算机、数字标牌等。
内容流系统中的服务器中的各个服务器可以作为分布式服务器工作,并且在这种情况下,可以以分布式方式处理由各个服务器接收的数据。

Claims (15)

1.一种由视频解码装置执行的视频解码方法,所述视频解码方法包括以下步骤:
从比特流获得包括视频编码层VCL网络抽象层NAL单元的图像信息;
通过基于所述图像信息对当前图片内的当前块执行帧间预测或帧内预测,生成所述当前块的预测样本;以及
基于所述预测样本重构所述当前块,
其中,所述图像信息包括指示视频参数集的标识符值的sps_video_parameter_set_id语法元素,并且
其中,基于所述sps_video_parameter_set_id语法元素的值等于0,将由所述视频参数集指定的输出层集OLS的总数量的值以及OLS内的层的数量的值推断为等于1。
2.根据权利要求1所述的视频解码方法,其中,所述比特流为单层比特流。
3.根据权利要求1所述的视频解码方法,其中,基于所述sps_video_parameter_set_id语法元素的所述值等于0,所述OLS内的输出层的数量被推断为等于1。
4.根据权利要求1所述的视频解码方法,其中,基于所述sps_video_parameter_set_id语法元素的所述值,推断所述VCL NAL单元的层标识符和由所述VCL NAL单元参考的参数集的层标识符。
5.根据权利要求1所述的视频解码方法,其中,所述参数集包括图片参数集、序列参数集或视频参数集中的至少一者。
6.根据权利要求5所述的视频解码方法,其中,基于所述sps_video_parameter_set_id语法元素的所述值等于0,由所述序列参数集参考的所有VCL NAL单元的nuh_layer_id语法元素的值与所述序列参数集的nuh_layer_id语法元素的值相同。
7.根据权利要求5所述的视频解码方法,其中,基于所述sps_video_parameter_set_id语法元素的所述值大于0,所述sps_video_parameter_set_id语法元素指示由所述序列参数集参考的视频参数集的vps_video_parameter_set_id语法元素的值。
8.根据权利要求4所述的视频解码方法,其中,基于所述sps_video_parameter_set_id语法元素的所述值等于0,所述VCL NAL单元的nuh_layer_id语法元素的值和所述参数集的nuh_layer_id语法元素的值相同。
9.根据权利要求1所述的视频解码方法,其中,基于所述sps_video_parameter_set_id语法元素的所述值等于0,由所述图像信息内的各个VCL NAL单元参考的参数集的NAL单元报头的层标识符与所述VCL NAL单元的NAL单元报头的层标识符相同。
10.根据权利要求1所述的视频解码方法,其中,基于所述VCL NAL单元内的VCL NAL单元参考具有与该VCL NAL单元的层标识符不同的层标识符的参数集,所述sps_video_parameter_set_id语法元素的所述值被推断为等于0。
11.一种由视频编码装置执行的视频编码方法,所述视频编码方法包括以下步骤:
对当前图片内的当前块执行帧间预测或帧内预测;
基于所述帧间预测或所述帧内预测生成所述当前块的预测信息;以及
对包括所述预测信息的图像信息进行编码,
其中,所述图像信息包括视频编码层VCL网络抽象层NAL单元以及指示视频参数集的标识符值的sps_video_parameter_set_id语法元素,并且
其中,基于所述sps_video_parameter_set_id语法元素的值等于0,由所述视频参数集指定的输出层集OLS的总数量的值以及OLS内的层的数量的值被推断为等于1。
12.根据权利要求11所述的视频编码方法,其中,所述图像信息包括仅一个层。
13.根据权利要求11所述的视频编码方法,其中,基于所述sps_video_parameter_set_id语法元素的所述值,推断所述VCL NAL单元的层标识符和由所述VCL NAL单元参考的参数集的层标识符。
14.根据权利要求13所述的视频编码方法,其中,基于所述sps_video_parameter_set_id语法元素的所述值等于0,所述VCL NAL单元的nuh_layer_id语法元素的值和所述参数集的nuh_layer_id语法元素的值相同。
15.一种计算机可读数字记录介质,所述计算机可读数字记录介质存储有信息,所述信息使视频解码装置执行视频解码方法,其中,所述视频解码方法包括以下步骤;
获得包括视频编译层VCL网络抽象层NAL单元的图像信息;
通过基于所述图像信息对当前图片内的当前块执行帧间预测或帧内预测来生成所述当前块的预测样本;以及
基于所述预测样本重构所述当前块,
其中,所述图像信息包括指示视频参数集的标识符值的sps_video_parameter_set_id语法元素;并且
其中,基于所述sps_video_parameter_set_id语法元素的值等于0,将由所述视频参数集指定的OLS的总数量的值、以及输出层集OLS内的层的数量的值推断为等于1。
CN202180034840.8A 2020-05-12 2021-05-11 处理图像/视频编码系统中的单层比特流内的参数集的参考的方法和装置 Pending CN115552903A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US202063023795P 2020-05-12 2020-05-12
US202063023827P 2020-05-12 2020-05-12
US63/023,827 2020-05-12
US63/023,795 2020-05-12
PCT/KR2021/005896 WO2021230629A1 (ko) 2020-05-12 2021-05-11 영상/비디오 코딩 시스템에서 단일 레이어 비트스트림 내 파라미터 세트의 참조를 처리하는 방법 및 장치

Publications (1)

Publication Number Publication Date
CN115552903A true CN115552903A (zh) 2022-12-30

Family

ID=78524619

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180034840.8A Pending CN115552903A (zh) 2020-05-12 2021-05-11 处理图像/视频编码系统中的单层比特流内的参数集的参考的方法和装置

Country Status (4)

Country Link
US (1) US20230179770A1 (zh)
KR (1) KR20230011990A (zh)
CN (1) CN115552903A (zh)
WO (1) WO2021230629A1 (zh)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20130116782A (ko) * 2012-04-16 2013-10-24 한국전자통신연구원 계층적 비디오 부호화에서의 계층정보 표현방식
KR101775250B1 (ko) * 2012-09-28 2017-09-05 노키아 테크놀로지스 오와이 비디오 코딩 및 디코딩을 위한 장치, 방법 및 컴퓨터 프로그램
US9930342B2 (en) * 2014-06-20 2018-03-27 Qualcomm Incorporated Systems and methods for signaling hypothetical reference decoder parameters in a parameter set
WO2021170096A1 (en) * 2020-02-29 2021-09-02 Beijing Bytedance Network Technology Co., Ltd. Constrains for different coding tools
WO2021180169A1 (en) * 2020-03-11 2021-09-16 Beijing Bytedance Network Technology Co., Ltd. Conformance window parameters for video coding

Also Published As

Publication number Publication date
WO2021230629A1 (ko) 2021-11-18
KR20230011990A (ko) 2023-01-25
US20230179770A1 (en) 2023-06-08

Similar Documents

Publication Publication Date Title
JP2024091785A (ja) Nalユニット関連情報に基づく映像又はビデオコーディング
CN115244938A (zh) 基于预测加权表对图像/视频进行编译的方法和装置
CN115516860A (zh) 图像解码方法及其设备
US20240089506A1 (en) Method and apparatus for processing high level syntax in image/video coding system
US20230030394A1 (en) Nal unit type-based image or video coding for slice or picture
CN115244927A (zh) 图像/视频编码系统中的帧间预测方法和设备
CN115280783A (zh) 用于图像/视频编码的加权预测的方法和装置
CN114762351A (zh) 图像/视频编译方法和装置
US20230209041A1 (en) Multilayer-based image coding method in video or image coding system
CN115699768A (zh) 在视频或图像编码系统中基于poc信息和非参考图片标志的图像编码方法
CN116195247A (zh) 图像编码方法和用于该图像编码方法的装置
CN115668927A (zh) 基于输出层集合确定是否参考参数集的图像编码/解码方法和设备及发送比特流的方法
CN114982242A (zh) 发信号通知图片分割信息的方法和设备
CN114762350A (zh) 基于切片类型的图像/视频编译方法和设备
CN114930856A (zh) 图像/视频编译方法和装置
CN114762349A (zh) 用于图像/视频编译的高级别语法信令方法和装置
US20230179770A1 (en) Method and device for processing reference of parameter set within single layer bitstream in image/video coding system
US11902528B2 (en) Method and device for signaling information related to slice in image/video encoding/decoding system
US11917210B2 (en) Method and device for processing general constraint information in image/video coding system
US20230171419A1 (en) Image or video coding on basis of information related to picture output
US20240022742A1 (en) Nal unit type-based image or video coding
US20230179769A1 (en) Multilayer-based image coding method in video or image coding system
CN114930855A (zh) 用于图像/视频编译的切片和拼块配置
CN114930820A (zh) 基于图片划分结构的图像/视频编译方法及设备
CN115004708A (zh) 用于发信号通知图像信息的方法和设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination