CN115004710A - 图像头存在 - Google Patents

图像头存在 Download PDF

Info

Publication number
CN115004710A
CN115004710A CN202080093926.3A CN202080093926A CN115004710A CN 115004710 A CN115004710 A CN 115004710A CN 202080093926 A CN202080093926 A CN 202080093926A CN 115004710 A CN115004710 A CN 115004710A
Authority
CN
China
Prior art keywords
picture
slice
header
image
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080093926.3A
Other languages
English (en)
Inventor
R·舍贝里
M·达姆加尼安
M·彼得松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Telefonaktiebolaget LM Ericsson AB
Original Assignee
Telefonaktiebolaget LM Ericsson AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Telefonaktiebolaget LM Ericsson AB filed Critical Telefonaktiebolaget LM Ericsson AB
Priority claimed from PCT/EP2020/076815 external-priority patent/WO2021139905A1/en
Publication of CN115004710A publication Critical patent/CN115004710A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/188Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a video data packet, e.g. a network abstraction layer [NAL] unit
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

一种用于从比特流解码图像的方法。在一个实施例中,该方法包括:接收用于图像的切片的切片头,其中,切片头包括状态语法元素;从切片头中的状态语法元素解码(805)状态值,其中,a)如果状态值不等于第一值,则状态值指示i)比特流包括用于图像的图像头,该图像头包括图像语法元素集,并且ii)切片头不包括图像语法元素集,以及b)如果状态值等于第一值,则状态值指示i)切片头包含所述图像语法元素集,并且ii)比特流不包括用于图像的图像头;以及使用图像语法元素集来对图像的切片进行解码。

Description

图像头存在
技术领域
本发明一般涉及用于视频编码和解码的方法和装置。
背景技术
高效视频编码(HEVC)是由ITU-T(国际电信联盟电信标准化部门)和MPEG(运动图像专家组)标准化的基于块的视频编解码,其利用时间和空间预测两者。使用来自当前图像内的帧内(I)预测来实现空间预测。使用来自先前解码的参考图像的块级别的单向(P)或双向帧间(B)预测来实现时间预测。在编码器中,原始像素数据与预测像素数据之间的差(被称为残差)被转换到频域、量化、然后被熵编码,之后与也被熵编码的必要预测参数(诸如预测模式和运动矢量)一起传输。解码器执行熵解码、反量化和反变换以获得残差,然后,将残差添加到帧内或帧间预测以重建图像。
MPEG和ITU-T正在联合视频开发团队(JVET)内进行HEVC的后继者的工作。正在开发的该视频编解码器的名称是通用视频编码(VVC)。在提交本申请时,VVC规范的当前版本是JVET-Q0041-v2_DraftText.docx。
NAL单元
HEVC和VVC都定义了网络抽象层(NAL)。所有数据(即,HEVC和VVC中的视频编码层(VCL)或非VCL数据)都被封装在NAL单元中。VCL NAL单元包含代表图像样本值的数据。非VCL NAL单元包含附加关联数据,诸如参数集和补充增强信息(SE)消息。HEVC中的NAL单元以头(header)开始,该头指定NAL单元的NAL单元类型(其标识在NAL单元中携带的数据的类型)、层ID和NAL单元所属的时间ID。NAL单元类型在NAL单元头中的nal_unit_type码字中被传输,并且该类型指示和定义应当如何解析和解码NAL单元。NAL单元的其余字节是由NAL单元类型指示的类型的有效载荷。比特流由一系列级联的NAL单元组成。比特流由一系列级联的NAL单元组成。
在表1中示出用 于HEVC NAL单元和NAL单元头的语法。
nal_unit_header(){ 描述符
forbidden_zero_bit f(1)
nuh_reserved_zero_bit u(1)
nuh_layer_id u(6)
nal_unit_type u(5)
nuh_temporal_id_plus1 u(3)
}
表1-HEVC NAL单元语法
在表2中示出当前VVC草案的NAL单元类型。
解码顺序是NAL单元应被解码的顺序,其与比特流内的NAL单元的顺序相同。解码顺序可以不同于输出顺序,输出顺序是解码图像将要由解码器输出以例如用于显示的顺序。
Figure BDA0003736209600000021
Figure BDA0003736209600000031
Figure BDA0003736209600000041
表2-VVC中NAL单元类型
对于HEVC中的单层编码,接入单元(AU)是图像的编码表示,它可由若干视频编码层(VCL)NAL单元以及非VCL NAL单元组成。HEVC中的编码视频序列(CVS)是从帧内随机接入点(IRAP)接入单元开始直到但不包括解码顺序中的下一个IRAP接入单元的一系列接入单元。解码顺序是NAL单元应被解码的顺序,其与比特流内的NAL单元的顺序相同。解码顺序可以与输出顺序不同,输出顺序是解码图像将要由解码器输出以例如用于显示的顺序。
非VCL NAL单元是不直接携带编码样本值(例如参数集)的NAL单元。VVC和HEVC都定义了图像参数集(PPS)和序列参数集(SPS),其分别包含对于图像或序列有效的参数。在HEVC中有另一个参数集:视频参数集(VPS),其包含对于若干层有效的信息。新的VPS可以仅在新的CVS开始时被激活。在VVC被最终确定时,它可以包括或者可以不包括VPS或类似物。
VVC和HEVC中的每个NAL单元的第一个字节包含nal_unit_type语法元素。解码器或比特流解析器可以在查看第一个字节后得出NAL单元应当被如何处理(例如被解析和解码)的结论。
时间层
在HEVC并且在VVC的当前版本中,所有图像都与TemporalId值相关联,该TemporalId值指定图像所属的时间层。从NAL单元头中的nuh_temporal_id_plus1语法元素解码TemporalId值。在HEVC中,编码器需要设置TemporalId值,以使得当更高的时间层被丢弃时,属于较低层的图像可完全解码。例如,假设编码器已使用时间层0、1和2输出比特流。则移除所有层2NAL单元或者移除所有层1和层2NAL单元将导致比特流可被解码而没有问题。这是由编码器必须遵守的HEVC/VVC规范中的限制确保的。例如,不允许时间层的图像引用更高时间层的图像。
层、依赖层和独立层
在VVC中,层被定义为其中所有VCL NAL单元具有nuh_layer_id的特定值的VCLNAL单元和相关联的非VCL NAL单元的集合。
在VVC中,层接入单元被定义为其中的VCL NAL单元都具有nuh_layer_id的特定值的一组NAL单元,这些NAL单元根据特定的分类规则而相互关联,在解码顺序上是连续的,并包含恰好一个编码图像。
VVC的当前版本中的编码层视频序列(CLVS)被定义为按解码顺序包括CLVS层接入单元的层接入单元序列,在CLVS层接入单元后跟随零个或多个不是CLVS层接入单元的层接入单元,包括所有后续的层接入单元直到但不包括是CLVS层接入单元的任何后续的层接入单元。层接入单元与编码层视频序列之间的关系如图1所示。在VVC的当前版本中,层可以相互独立地或相互依赖地被编码。当层被独立编码时,具有例如nuh_layer_id 0的层可以不预测来自具有例如nuh_layer_id 1的另一个层的视频数据。在VVC的当前版本中,可以使用层之间的依赖编码,这使得能够支持具有SNR、空间和视图可伸缩性的可伸缩编码。
图像头
当前VVC草案包括图像头,它是nal_unit_type等于PH_NUT的NAL单元。图像头与切片头(slice header)类似,但是,图像头中的语法元素的值用于解码一个图像的所有切片。每个VVC图像包括一个图像头NAL单元,在其后跟随该图像的所有编码切片,其中,每个编码切片在一个编码切片NAL单元中传递。
VVC块结构
草拟的VVC视频编码标准使用被称为四叉树加二叉树加三叉树块结构(QTBT+TT)的块结构,其中,每个图像首先被分割成方形块,其被称为编码树单元(CTU)。所有CTU的大小都相同,并且分割是在没有任何语法控制的情况下完成的。每个CTU进一步被分割成具有方形或矩形形状的编码单元(CU)。CTU首先通过四叉树结构来分割,然后,它可以在二叉树结构中垂直或水平地以大小相等的分区来进一步被分割,以形成编码单元(CU)。因此,块可具有方形或矩形形状。四叉树和二叉树的深度可以由编码器在比特流中设置。使用QTBT划分CTU的示例如图1A和1B所示。三叉树(TT)部分添加了将CU划分成三个分区而不是两个大小相等的分区的可能性;这增加了使用更适合图像中的内容结构的块结构的可能性。
参数集
HEVC规定了三种类型的参数集,即图像参数集(PPS)、序列参数集(SPS)和视频参数集(VPS)。PPS包含对于全图共用的数据,SPS包含对于编码视频序列(CVS)共用的数据,VPS包含对于多个CVS共用的数据。
VVC也使用这些参数集类型。在VVC中,还有自适应参数集(APS)和解码参数集(DPS)。AP可包含可用于多个切片的信息,并且同一图像的两个切片可以使用不同的APS。DPS包括指定解码器在整个比特流中将遇到的在配置文件和级别方面的“最坏情况”的信息。
切片(slice)
在HEVC中,切片的概念将图像划分成独立编码的切片,其中,图像中的一个切片的解码独立于同一图像的其他切片。不同的编码类型可用于同一图像的各切片,即,切片可以是I切片、P切片或B切片。切片的一个目的是在数据丢失的情况下启用重新同步。在HEVC中,切片是一组CTU。
在VVC的当前版本中,图像可以被分割成光栅扫描切片或矩形切片。光栅扫描切片由按光栅扫描顺序的多个完整图块(tile)组成。矩形切片由共同占据图像中的矩形区域的一组图块或一个图块内的连续多个CTU行组成。每个切片包括切片头和编码切片数据。具有包括语法元素的切片头。当对切片进行解码时,使用从这些语法元素解码的切片头值。每个切片在一个VCL NAL单元中被携带。
在VVC草案规范的早期版本中,切片被称为图块组。
图块(Tile)
草拟的VVC视频编码标准包括被称为图块的技术,该技术将图像划分为矩形空间独立区域。在草拟的VVC编码标准中的图块与在HEVC中使用的图块非常相似。使用图块,VVC图像可以被分割成样本的行和列,其中,图块是行和列的交叉。下面的图2示出了使用4个图块行和5个图块列的图块分割的示例,对于图像产生总共20个图块。
通过指定行的厚度和列的宽度,在图像参数集(PPS)中标记图块结构。各个行和列可以有不同的大小,但分割总是横跨整个图像,分别从左到右,从上到下。
在同一图像的图块之间没有解码依赖。这包括帧内预测、用于熵编码的上下文选择、以及运动矢量预测。一个例外是在图块之间通常允许环路滤波依赖性。
在VVC中的矩形切片模式下,图块可进一步被分割成多个切片,其中,每个切片由一个图块内的连续多个CTU行组成。图3示出了使用VVC中的图块分割的图块分割和矩形切片分割的示例。
合并图像头和切片头
VET输入提案JVET-Q0255-v1.zip和JVET-Q0426-v2.zip都建议合并图像头和切片头。两个提案都建议使图像头(PH)可选,宣称节省BDR,并且它们都建议当PH不存在时,在单个VCL NAL单元中携带PH、切片头和切片数据的语法。JVET-Q0255和JVET-Q0426之间的设计差异可以总结为:对于包含PH和切片头两者的新VCL NAL单元使用当前保留的NAL单元类型(JVET-Q0255),或者使用具有添加的标志的当前VCL NAL单元类型(JVET-Q0426);限制CLVS对于所有图像使用PH或者对于图像不使用PH(JVET-Q0426),或者允许混合(JVET-Q0255);当PH不存在时,限制每个图像由一个切片组成(JVET-Q0255),或者允许多个切片而无需PH(JVET-Q0426)。
JVET-Q0255-v1.zip提案在新的NAL单元类型中建议以下内容:
picture_layer_rbsp(){ 描述符
pic_nal_type u(4)
picture_header_rbsp()
slice_header()
slice_data()
}
pic_nal_type指示图像的对应Nal单元类型。
如下导出NalType的值:
NalType=(nal_unit_type==CODED_PIC)?pic_nal_type:nal_unit_type
JVET-Q0426-v2.zip提案针对切片头建议以下内容:
Figure BDA0003736209600000081
Figure BDA0003736209600000091
附图说明
被包括以提供对本公开的进一步理解并被并入并构成本申请的一部分的附图示出本发明概念的某些非限制性实例。在附图中:
图1是根据一些实施例的说明层接入单元与编码层视频序列之间的关系的图;
图2A是使用QTBT将CTU分割成CU的示例的图示;
图2B是使用QTBT将CTU分割成CU的示例的图示;
图3是图像的图块分割的示例的图示;
图4是使用VVC中的图块分割的图块分割和矩形切片分割的示例的图示;
图5是说明根据本发明概念的一些实施例的操作环境的框图;
图6是说明根据本发明概念的一些实施例的编码器的框图;
图7是说明根据本发明概念的一些实施例的解码器的框图;
图8A、8B、9A、9B和10是说明根据本发明概念的一些实施例的解码器的操作的流程图;
图11是说明根据本发明概念的一些实施例的编码器的操作的流程图。
具体实施方式
下面将参考附图更全面地描述本发明概念,在附图中示出了本发明概念的实施例的示例。然而,本发明概念可以以多种不同的形式体现,而不应被解释为限于本文所述的实施例。相反,提供这些实施例使得本发明将是深入和完整的,并且这些实施例将向本领域技术人员充分传达本发明概念的范围。还应注意的是,这些实施例不是相互排斥的。默认假设来自一个实施例的组件可以在另一个实例中存在/使用。
以下描述呈现了本文所公开的主题的各种实施例。这些实施例被呈现为教导示例,而不被解释为限制本文所公开的主题的范围。例如,在不脱离所描述的主题的范围的情况下,可以修改、省略或扩展所描述的实例的某些细节。
图5说明了如本文所描述的可用于对比特流编码的编码器500的操作环境的示例。编码器500从网络502和/或从存储设备504接收媒体,并将媒体编码为如下所述的比特流,并将编码媒体经由网络508发送到解码器506。存储设备504可以是视频存储库(诸如商店或流传输视频服务的存储库)的一部分、单独的存储组件、移动设备的组件等。解码器506可以是具有显示器512的设备510的一部分。设备510可以是移动设备、机顶设备、头戴式显示器等等。
图6是说明根据本发明概念的一些实施例的被配置为对视频帧编码的编码器500的各元件的框图。如图所示,编码器500可以包括网络接口电路605(也称为网络接口),其被配置为提供与其他设备/实体/功能等的通信。编码器500还可以包括耦合到网络接口电路605的处理器电路601(也称为处理器)以及耦合到处理器电路的存储器电路603(也称为存储器)。存储器电路603可包括计算机可读程序代码,该计算机可读程序代码在由处理器电路601执行时使处理器电路执行根据本文所公开的实施例的操作。
根据其他实施例,处理器电路601可被定义为包括存储器,因此不需要单独的存储器电路。如本文所讨论的,编码器500的操作可由处理器601和/或网络接口605执行。例如,处理器601可以控制网络接口605向解码器506发送通信和/或通过网络接口605从一个或多个其他网络节点/实体/服务器(诸如其他编码器节点、存储库服务器等)接收通信。此外,模块可以被存储在存储器603中,并且这些模块可以提供指令,以使得当模块的指令由处理器601执行时,处理器601执行相应的操作。
图7是说明根据本发明概念的一些实施例的被配置为解码视频帧的解码器506的元件的框图。如图所示,解码器506可以包括网络接口电路705(也称为网络接口),其被配置为提供与其他设备/实体/功能等的通信。解码器506还可以包括耦合到网络接口电路705的处理器电路701(也称为处理器)和耦合到处理器电路的存储器电路703(也称为存储器)。存储器电路703可以包括计算机可读程序代码,该计算机可读程序代码在由处理器电路701执行使得处理器电路执行根据本文所公开的实施例的操作。
根据其他实例,处理器电路701可被定义为包括存储器,因此不需要单独的存储器电路。如本文所讨论的,解码器506的操作可由处理器701和/或网络接口705来执行。例如,处理器701可以控制网络接口705从编码器500接收通信。此外,模块可以被存储在存储器703中,并且这些模块可以提供指令,以使得当模块的指令由处理器701执行时,处理器701执行相应的操作。
JVET-Q0255解决方案的问题是,JVET-Q0255解决方案建议使用NAL单元类型,这是宝贵的资源。此外,JVET-Q0255引入码字pic_nal_type以携带用于在NAL单元中携带的图像的nal_unit_type的必要部分。语法元素的成本是每个图像4比特,这听起来可能不多,但是对于100kbps 50fps视频流,每个图像4比特相当于0.2%的份额。0.2%的份额是很重要。在视频编码标准化期间作出了许多设计决定,它们都是基于节省0.2%甚至更少的比特而做出的。
JVET-Q0255的另一个问题是它不支持每个图像多个切片,这是多余的限制。JVET-Q0255的再一个问题是它没有解释解码器如何进行图像边界的检测。
JVET-Q0426中的设计是sps_picture_header_enabled_flag的值需要切片识别图像参数集(PPS)并再从所识别的图像参数集的语法元素值中识别序列参数集(SPS)。这样做的问题是,识别图像参数集的语法元素(slice_pic_parameter_set_id)在使用了sps_picture_header_enabled_flag的值之后而来,并且语法元素是以sps_picture_header_enabled_flag的值为条件的。可能的解决方案可以是将slice_pic_parameter_set_id无条件地首先放在字段头中。然而,当在包含切片的图像的比特流中存在图像头时,从图像头中的语法元素识别图像参数集,并且在图像头和切片头两者中具有相同的语法元素带来显著的比特成本。
在本发明概念的一些实施例中,状态语法元素被添加到切片头中。状态语法元素的一个值指定存在用于包括切片的图像的图像头。状态语法元素的另一个值指定不存在用于包括切片的图像的图像头。状态语法元素可以是1比特语法元素标志。
在本发明概念的一个实施例中,指定不存在用于包括切片的图像的图像头的值还指定该图像由单个切片组成,这意味着对于该图像不允许有多个切片。
在本发明概念的一个实施例中,可以允许将编码视频流(CVS)内的标志的值混合到编码层视频序列(CLVS)。这意味着在第一CVS或CLVS中可以存在用于第一图像的一个图像头,然后在第一CVS或CLVS中可以存在没有图像头的第二图像。
在本发明概念的一个实施例中,不允许混合。在该实施例中,在参数集中有另一个单独的状态语法元素,并且要求切片头中的状态语法元素的值应表达(或重复)参数集中的状态语法元素的值的含义。
在本发明概念的一个实施例中,通过查找图像头或者查找具有其值指定不存在用于包括切片的图像的图像头的状态语法元素的NAL单元,确定比特流中的编码图像的起始的检测。
在本发明概念的一个实施例中,状态语法元素的一个值指定对于包括切片的图像可以存在或者可以不存在图像头。
在本发明概念的一个实施例中,在切片头中不存在状态语法元素。相反,状态值是从图像的图像头的存在中导出的。如果在解码或解析切片时针对图像没有检测到图像头,则状态被设置为等于指定不存在用于包括切片的图像的图像头的值。如果在解码或解析片之前针对图像检测到图像头,则状态被设置为等于指定存在用于包括切片的图像的图像头的值。
使用本发明概念的上述实施例的优点是,不使用额外的NAL单元类型。pic_nal_type语法元素也不需要,这节省了4比特。与JVET-Q0426相比,本发明概念的实施例可以解决上述的一个或多个问题。
在下面描述的本发明概念的实施例中,切片是在图像自己的NAL单元中标记的图像的编码部分。切片包括编码切片数据和切片头,两者都在同一个NAL单元中被信号发送。一个切片可以或者可以不覆盖整个图像。
在本发明概念的一个版本中,切片被称为(取自VVC草案)整数数量的完整图块或者图像的图块内的整数数量的连续完整CTU行,这些图块或者CTU行被专有地包含在单个NAL单元中。
在以下本发明概念的实施例中使用的术语“公共语法元素集”是一个或多个语法元素的集合,其可在图像头中或在切片头中被信号发送。
在下面描述的本发明概念的实施例中,术语“用于图像”用于意味着数据、参数、图像头等属于所描述的图像。例如,“用于图像的图像头”是与特定图像相关联的图像头。在这种情况下,图像头最好在图像的编码数据之前。
在本发明概念的第一实施例中,状态语法元素被添加到切片头。状态语法元素指定是否存在用于包括切片的图像的图像头。状态语法元素可以是一比特语法元素标志。在第一实施例的一个实施例中,优选地,该标志被提前放置在切片头中。在本发明概念的该实例的替代解决方案中,该标志可被放置在诸如APS的参数集中。
在本发明概念的该第一实施例中,使用公共语法元素集。可以使用基于用于当前图像的当前切片的图像头和公共语法元素集的存在和位置的以下一个或多个规则。
规则1.如果当前切片中的状态语法元素值(状态值)等于第一值,则不应存在用于当前图像的任何图像头,并且公共语法元素集应被包括在当前切片的切片头中。
规则2.如果当前切片中的状态值等于第二值,则应该存在用于当前图像的图像头。图像头应包括公共语法元素集,并且公共语法元素集中的语法元素不应在当前切片中存在。
规则3.如果存在用用当前图像的图像头,则图像头应位于与当前切片相同的接入单元或层接入单元中的当前切片前。
在本发明概念的第一实施例的变型中,如果在当前图像中存在多于一个切片,则当前图像中的所有切片中的状态语法元素应具有相同的状态值。如果解码器接收到图像的多个切片,并且用于图像中的所有切片的状态值不相等,则解码器可以得出比特流不符合编解码器规范的结论,并且可以将其解释为比特错误、数据丢失或不符合的比特流或编码器。它可以报告错误,执行错误隐藏或基于比特流不符合的知识采取其他动作。
解码器可以执行用于使用该实施例从比特流解码当前图像的以下步骤的全部或子集:
步骤1.解码器从当前图像的当前切片的切片头中的状态语法元素解码状态值,该状态值指定图像头是否用于当前图像。
步骤2.如果状态值等于第一值,则解码器推断不存在用于当前图像的图像头。解码器从切片头解码语法元素集S,并在解码当前切片时使用集合S的解码值。
步骤3.如果状态值等于第二值,则解码器推断应该存在用于当前图像的图像头。解码器从用于当前图像的图像头解码语法元素集T,并在解码当前切片时使用语法元素集T(又名PH语法结构或图像语法元素集)的解码值,其中,图像语法元素集T包含与集合S相同的语法元素(即,语法元素集S也是PH语法结构(图像语法元素集))。
步骤4.可选地,从与当前切片NAL单元分离的图像头NAL单元解码用于当前图像的图像头,其中,图像头NAL单元在解码顺序上在当前切片NAL单元之前,并且图像头NAL单元和当前切片NAL单元属于相同的接入单元或图像单元。
在本发明概念的第二实施例中,不使用多个切片头。
在本发明概念的该第二实施例中,指定不存在用于包括切片的图像的图像头的值还指定该图像由单个切片组成,这意味着对于该图像不允许多个切片。
解码器可以执行用于使用该实施例从比特流解码当前图像的以下步骤的全部或子集:
步骤1.解码器从当前图像的当前切片的切片头中的状态语法元素解码状态值,该状态值指定图像头是否用于当前图像。
步骤2.如果状态值等于第一值,则解码器推断不存在用于当前图像的图像头。解码器此外推断该图像包括单个切片。解码器从切片头解码语法元素集S,并在解码当前切片时使用集合S的解码值。
步骤3.如果状态值等于第二值,则解码器推断应存在用于当前图像的图像头。解码器从用于当前图像的图像头解码语法元素集T,并在解码当前切片时使用集合T的解码值,其中集合T包含与集合S相同的语法元素。
步骤4.可选地,从与当前切片NAL单元分离的图像头NAL单元解码用于当前图像的图像头,其中,图像头NAL单元在解码顺序上在当前切片NAL单元之前,并且图像头NAL单元和当前切片NAL单元属于相同的接入单元或图像单元。
如果状态值等于第一值,并且解码器接收到图像的多个切片,则解码器可得出比特流不符合编解码器规范的结论,并可将其解释为比特错误、数据丢失或不符合的比特流或编码器。它可报告错误,执行错误隐藏或基于比特流不符合的知识采取其它动作。
在本发明概念的第三实施例中,使用具有图像头的接入单元和不具有图像头的接入单元的混合。
在第三实施例的一个实施例中,允许混合CVS或CLVS内的(表示状态语法元素的)标志的值。这意味着在第一CVS或CLVS中可存在用于第一图像的一个图像头,然后在第一CVS或CLVS中可以存在没有图像头的第二图像。
在本发明概念的第四实施例中,CVS或CLVS中的层接入单元或分层接入单元可以被限制为全部具有图像头或者都不具有图像头。
在本发明概念的第四实施例的一个实施例中,不允许第三实施例中的CVS或CLVS内的标志值的混合。这意味着在当前CVS或CLVS中,这两个语句之一应是真:
1)在当前CVS或CLVS中存在用于所有图像的图像头;
2)在当前CVS或CLVS中没有图像头。
在该实施例中,在参数集(例如DPS、SPS、PPS或APS)中可存在另一个单独的状态语法元素,并且要求切片头中的状态语法元素的值应表达(或重复)参数集中的状态语法元素的值的含义。
状态语法元素可以是二进制标志。
解码器可以执行用于使用该实施例从比特流解码当前图像的以下步骤的全部或子集:
步骤1.解码器从比特流中的参数集中的状态语法元素SA解码状态值VA,该状态值VA指定在比特流中的每个图像的编码视频数据之前是否有图像头。
步骤2.解码器从当前图像的当前切片的切片头中的状态语法元素SB解码状态值VB,该值VB指定图像头是否用于当前图像。
步骤3.如果状态值VB不等于状态值VA(或不表达状态值VA的相同含义),则解码器可以得出比特流不符合编解码器规范的结论,并且可以将其解释为比特错误、数据丢失或不符合的比特流或编码器。它可以报告错误、执行错误隐藏或基于比特流不符合的知识采取其他动作。
步骤4.如果状态值VB等于第一值,则解码器推断不存在用于当前图像的图像头。解码器从切片头解码语法元素集S,并在解码当前切片时使用集合S的解码值。
步骤5.如果状态值VB等于第二值,则解码器推断应存在用于当前图像的图像头。解码器从当前图像的图像头解码语法元素集T,并在解码当前切片时使用集合T的解码值,其中,集合T包含与集合S相同的语法元素。
在该实施例的版本中,没有另一个单独的状态语法元素。相反,有一条规则规定,当前CVS或CLVS中的所有状态语法元素应具有相同的值。这也意味着在CVS或CLVS中存在用于所有图像的图像头,或者在CVS或CLVS中没有图像头。
解码器可以执行使用实施例的该版本的以下步骤的全部或子集:
步骤1.解码器从第一图像的切片的切片头中的状态语法元素解码状态值VA,该状态值VA指定图像头是否用于第一图像。
步骤2.解码器从第二图像的切片的切片头中的状态语法元素解码状态值VB,该状态值VB指定图像头是否用于第二图像。
步骤3.如果状态值VB不等于状态值VA(或不表达状态值VA的相同含义),则解码器可以得出比特流不符合编解码器规范的结论,并且可以将其解释为比特错误、数据丢失或不符合的比特流或编码器。它可以报告错误,执行错误隐藏或基于比特流不符合的知识采取其他动作。
步骤4.如果状态值VA等于第一值,则解码器推断不存在用于第一图像的图像头。解码器从切片头解码语法元素集S,并在解码第一图像的切片时使用集合S的解码值。
步骤5.如果状态值VA等于第二值,则解码器推断应该存在用于第一图像的图像头。解码器从第一图像的图像头解码语法元素集T,并在解码第一图像的切片时使用集合T的解码值,其中,集合T包含与集合S相同的语法元素。
图像头可以是指图像头NAL单元,以使得在CVS或CLVS中存在用于所有图像的图像头NAL单元,或者在CVS或CLVS中不存在图像头NAL单元。
在第五实施例中,提供了编码图像的起始的检测。
在该第五实施例中,通过查找图像头或者查找具有其值指定不存在用于包括切片的图像的图像头的状态语法元素的NAL单元,确定比特流中的编码图像的起始。
在该实施例的一个变型中,解码器可以执行以下步骤以确定图像的第一个VCLNAL单元。重复这些步骤,直到过程停止。
步骤1.解码器从比特流中获取当前NAL单元。
步骤2.解码器确定当前NAL单元是否是图像头NAL单元或者当前NAL单元是否是VCL NAL单元。
步骤3.如果当前NAL单元是图像头NAL单元,则解码器确定图像的第一个VCL NAL单元是按照解码顺序跟随当前NAL单元的VCL NAL单元,否则停止。
步骤4.如果当前NAL单元是VCL NAL单元,则解码器检查当前NAL单元中的状态语法元素值,并且如果状态语法元素值等于指定不存在用于包括切片的图像的图像头的值,则解码器确定图像的第一个VCL NAL单元是当前NAL单元,否则停止。
步骤5.解码器获取按照解码顺序的下一个NAL单元作为新的当前NAL单元,并继续步骤2。
在该实施例的变型中,状态语法元素可以具有第三状态值,该第三状态值指定比特流中的编码图像的起始。在该实施例的一个示例中,状态语法元素的第一值指定图像头不用于当前图像,状态语法元素的第二值指定图像头用于当前图像,状态语法元素的第三个值指定图像头不用于当前图像,并指定比特流中的编码图像的起始。
现在已经描述了本发明概念的各种实施例,应描述解码器执行以执行本发明概念的各种实施例的操作。转到图8A和图8B,现在将根据本发明概念的一些实施例,参考图8A和图8B的流程图来讨论(使用图7的框图的结构实现的)解码器506的操作。例如,模块可以被存储在图7的存储器705中,并且这些模块可以提供指令,以便当模块的指令由相应的无线设备处理电路703执行时,处理电路703执行流程图的相应操作。
在框801中,处理电路703可从参数集中的第一状态语法元素解码第一状态值,该第一状态值指定来自CVS或CLVS中的所有切片头中的第二状态语法元素的第二状态值是否应该对于所有图像头相同。如果第一状态值未指示来自第二状态语法元素的第二状态值应该相同,则每个切片将自行解码。
在框803中,处理电路703可确定第一状态值是否指示来自第二状态语法元素的第二状态值应该对于所有图像头相同。
响应于第一状态值指示来自第二状态语法元素的第二状态值应该相同,在框805中,处理电路73可从第一图像的切片头中的第二状态语法元素解码第二状态值,第二状态值指定图像头是否用于第一图像。
在框807中,响应于用于第一图像的状态值是处理电路703可推断不存在用于当前图像的图像头的第一值。在框809中,处理电路703可以针对切片头解码第一语法元素集,以获得第一组语法元素集的解码值。在框811中,处理电路703可以使用第一语法元素集的解码值来解码第一图像的切片。
在框813中,响应于状态值是第二值,处理电路703可以推断存在用于当前图像图像头。在框815中,处理电路703可以针对切片头解码第二语法元素集,以获得第二语法元素集的解码值。在框817中,处理电路703可以使用第二语法元素集的解码值来解码第一图像的当前切片,其中,第二语法元素集包含与第一语法元素集相同的语法元素。
在框819中,处理电路703可以从第二图像的切片头中的第二状态语法元素解码第二状态值,第二状态值指定图像头是否用于第二当前图像。
在框821中,响应于第二状态值是第二值,处理电路703可以推断存在用于第二图像的图像头。在框823中,处理电路703可以针对第二图像解码第二语法元素集,以获得第二语法元素集的解码值。在框825中,处理电路703可以使用第二语法元素集的解码值来解码第二图像的切片。
响应于状态值是第一值,处理电路703可以推断图像包含单个切片。在一个实施例中,响应于状态值是第一值,处理电路703可以响应于接收用于当前图像的多个切片而执行动作。在一个实施例中,执行动作包括确定比特流不符合编解码器规范。在另一个实施例中,执行动作包括:确定已发生了比特错误,以及响应于确定已发生了比特错误,报告比特错误。在另一实施例中,在执行动作时,处理电路703可以确定已发生了比特错误。处理电路703可以确定已发生了数据丢失。处理电路703可以响应于确定已发生了数据丢失,执行错误隐藏。在另一个实施例中,执行动作包括确定编码器是不符合的编码器。
关于解码器和相关方法的一些实施例,来自图8的流程图中的各种操作可以是可选的。关于示例性实施例1的方法(如下所述),例如,图8A和图8B的框801、803、819、821、823和825的操作是可选的。
在上述的本发明概念的另一个实施例中,可以有一条规则是,当前CVS或CLVS中的所有状态语法元素应该具有相同的值。现在转向图9A和图9B,在框901中,处理电路703可以从第一图像的切片的切片头中的第一状态语法元素解码第一状态值,第一状态值指定图像头是否用于第一图像。在框903中,处理电路703可以从第二图像的切片头中的第一状态语法元素解码第二状态值,第二状态值指定图像头是否用于第二图像。
响应于第二状态值不表达与第一状态值相同的含义,在框905中,处理电路703可确定比特流不符合编解码器规范,并且可执行动作。处理电路703可以执行与上面所指示的相同的动作。
响应于第二状态值表达与第一状态值相同的含义,并且响应于状态值是第一值,在框907中,处理电路703可以推断不存在用于当前图像的图像头。在框909中,处理电路703可以针对切片头解码第一语法元素集以获得第一语法元素集的解码值。在框911中,处理电路703可以使用第一语法元素集的解码值来解码当前图像的当前切片。
响应于第二状态值表达与第一状态值相同的含义,并且响应于状态值是第二值,在框913中,处理电路703可以推断存在用于当前图像的图像头。在框915中,处理电路703可以针对切片头解码第二语法元素集以获得第二语法元素集的解码值。第二语法元素集可以是与第一语法元素集相同的元素。在框917中,处理电路703可以使用第二语法元素集的解码值来解码当前图像的当前切片。
如上所指示的,通过查找图像头或者查找具有其值指定不存在用于包括切片的图像的图像头的状态语法元素的NAL单元,确定比特流中的编码图像的起始。转向图10,在框1001中,处理电路703可以从比特流中获取网络抽象层NAL单元。在框1003中,处理电路703可以确定当前NAL单元是否是图像头NAL单元或者当前NAL单元是否是视频编码层VCL NAL单元。
在框1005中,响应于当前NAL单元是图像头NAL单元,处理单元703可以确定图像的第一个VCL NAL单元是按照解码顺序跟随当前NAL单元的VCL NAL单元。
响应于当前NAL单元是VCL NAL单元,处理电路703可以检查当前NAL单元中的状态语法元素值,并且如果状态语法元素值等于指定不存在用于包括切片的图像的图像头的值,在框1009中,确定图像的第一个VCL NAL单元是当前NAL单元。
响应于当前NAL单元不是图像头NAL单元或者当前NAL单元是VCL NAL单元,并且如果状态语法元素值不等于指定不存在用于包括切片头的图像的图像头的值,则在框1011中,获取按照解码顺序的下一个NAL单元作为新的当前NAL单元。
现在将根据本发明概念的一些实施例参考图11的流程图讨论(使用图6的结构实现的)编码器500的操作。例如,模块可以被存储在图6的存储器605中,并且这些模块可以提供指令,以便当模块的指令由相应的编码器处理电路603执行时,处理电路603执行流程图的相应操作。
转向图11,在框1101中,处理电路603可以确定是否将存在用于当前图像的图像头。响应于确定将不存在用于当前图像的图像头,在框103中,处理电路603可以将状态语法元素的第一值编码到比特流中。状态语法元素可以被编码在当前图像的切片中或在参数集中。在框1105中,处理电路603可以使用第一语法元素集对当前图像进行编码。
响应于确定将存在用于当前图像的图像头,在框1107中,处理电路603可以将状态语法元素的第二值编码到比特流中。在框1109中,处理电路603可以使用第二语法元素集对当前图像进行编码。
下面讨论示例性实施例
A1.一种从比特流解码当前图像的方法,该方法包括:从当前图像的当前切片的切片头中的状态语法元素解码(805)状态值,该状态值指定图像头是否用于当前图像;响应于状态值是第一值:推断(807)不存在用于当前图像的图像头;以及针对切片头解码(809)第一语法元素集,以获得第一语法元素集的解码值;使用(811)第一语法元素集的解码值来解码当前图像的当前切片;响应于状态值是第二值:推断(813)存在用于当前图像的图像头;针对切片头解码(815)第二语法元素集,以获得第二语法元素集的解码值;以及使用(817)第二语法元素集的解码值来解码当前图像的当前切片,其中,第二语法元素集包含与第一语法元素集相同的语法元素。
A2.根据实施例A1的方法,还包括:响应于状态值是第一值:推断图像包含单个切片。
A3.根据实施例A1-A2中的任一实施例的方法,还包括:响应于状态值是第一值:响应于接收用于当前图像的多个切片,执行动作。
A4.根据实施例A3的方法,其中,执行动作包括:确定比特流不符合编解码器规范。
A5.根据实施例A3的方法,其中,执行动作包括:确定已发生了比特错误;以及响应于已发生了比特错误,报告比特错误。
A6.根据实施例A3的方法,其中,执行动作包括:确定已发生数据丢失;以及响应于确定已发生数据丢失,执行错误隐藏。
A7.根据实施例A3的方法,其中,执行动作包括:确定编码器是不符合的解码器。
A8.一种从比特流解码多个图像的方法,该方法包括:从参数集中的第一状态语法元素解码(801)第一状态值,第一状态值指定来自编码视频流CVS或编码层视频序列CLVS中的所有切片头中的第二状态语法元素的第二状态值是否应该对于所有图像头相同;响应第一状态值指示来自第二状态语法元素的第二状态值应该相同(803):从第一图像的切片头中的第二状态语法元素解码(805)第二状态值,第二状态值指定图像头是否用于第一图像;响应于用于第一图像的状态值是第一值:推断(807)不存在用于当前图像的图像头;针对切片头解码(809)第一语法元素集,以获得第一语法元素集的解码值;以及使用(811)第一语法元素集的解码值来解码第一图像的切片;从第二图像的切片头中的第二状态语法元素解码(819)第二状态值,第二状态值指定图像头是否用于当前图像;响应于第二状态值是第二值:推断(821)存在用于第二图像的图像头;针对第二图像解码(823)第二语法元素集,以获得第二语法元素集的解码值;以及使用(825)第二语法元素集的解码值来解码第二图像的切片。
A9.一种从比特流解码多个图像的方法,该方法包括:从第一图像的切片的切片头中的第一状态语法元素解码(901)第一状态值,第一状态值指定图像头是否用于第一图像;从第二图像的切片的切片头中的第一状态语法元素解码(903)第二状态值,第二状态值指定图像头是否用于第二图像;响应于第二状态值不表达与第一状态值相同的含义,确定(905)比特流不符合编解码器规范,以及执行动作;响应于第二状态值表达与第一状态值相同的含义:响应于状态值是第一值:推断(907)不存在用于当前图像的图像头;针对切片头解码(909)第一语法元素集,以获得第一语法元素集的解码值;以及使用(911)第一语法元素集的解码值来解码当前图像的当前切片;响应于状态值是第二值:推断(913)存在用于当前图像的图像头;针对切片头解码(915)第二语法元素集,以获得第二语法元素集的解码值;以及使用(917)第二语法元素集的解码值来解码当前图像的当前切片,其中,第二语法元素集包含与第一语法元素集相同的语法元素。
A10.一种从比特流解码多个图像的方法,该方法包括:从比特流中获取(1001)当前网络抽象层NAL单元;确定(1003)当前NAL单元是否是图像头NAL单元或者当前NAL单元是否是视频编码层VCL NAL单元;响应于当前NAL单元是图像头NAL单元,确定(1005)图像的第一个VCL NAL单元是按照解码顺序跟随当前NAL单元的VCL NAL单元;响应于当前NAL单元是VCL NAL单元,检查(1007)当前NAL单元中的状态语法元素值,并且如果状态语法元素值等于指定不存在用于包括切片的图像的图像头的值,则确定(1009)图像的第一个VCL NAL单元是当前NAL单元;以及响应于当前NAL单元不是图像头NAL单元或者当前NAL单元是VCLNAL单元,并且如果状态语法元素值不等于指定不存在用于包括切片的图像的图像头的值,则获取(1011)按照解码顺序的下一个NAL单元作为新的当前NAL单元。
A11.一种用于通信网络的解码器(506),该解码器(506)包括:处理器(701);以及与处理器耦合的存储器(703),其中,存储器包括指令,这些指令在由处理器执行时使处理器执行操作,该操作包括:从当前图像的当前切片的切片头中的状态语法元素解码(805)状态值,该状态值指定图像头是否用于当前图像;响应于状态值是第一值:推断(807)对于当前图像没有图像头;针对切片头解码(809)第一语法元素集,以获得第一语法集的解码值;以及使用(811)第一语法元素集的解码值来解码当前图像的当前切片;响应于状态值是第二值:推断(813)存在用于当前图像的图像头;针对切片头解码(815)第二语法元素集,以获得第二语法集的解码值;以及使用(817)第二语法元素集的解码值来解码当前图像的当前切片,其中,第二语法元素集包含与第一语法元素集相同的语法元素。
A12.根据实施例A11的解码器,其中,存储器(503)包括进一步的指令,其在由处理器(501)执行时使处理器(501)执行根据实施例A2-A7中任一实施例的操作。
A13.一种包括计算机可执行指令的计算机程序产品,该计算机可执行指令可配置为当在设备(306)中包括的处理器(501)上执行计算机可执行指令时使设备(306)执行操作,该操作包括:从当前图像的当前切片的切片头中的状态语法元素解码(805)状态值,该状态值指定图像头是否用于当前图像;响应于状态值是第一值:推断(807)不存在用于当前图像的图像头;针对切片头解码(809)第一语法元素集,以获得第一语法元素集的解码值;以及使用(811)第一语法元素集的解码值来解码当前图像的当前切片;响应于状态值是第二值:推断(813)存在用于当前图像的图像头;针对切片头解码(815)第二语法元素集,以获得第二语法元素集的解码值;以及使用(817)第二语法元素集的解码值来解码当前图像的当前切片,其中,第二语法元素集包含与第一语法元素集相同的语法元素。
A14.根据实施例A13的计算机程序产品,包括进一步的计算机可执行指令,其被配置为当计算机可执行指令在设备(506)中包括的处理器上执行时使设备(506)执行根据实施例A2-A7中任一实施例的方法。
A15.一种包括计算机可读存储介质的计算机程序产品,该计算机可读存储介质具有计算机可执行指令,该计算机可执行指令配置为当计算机可执行指令在被包括在设备(306)中的处理器上执行时使设备(306)执行操作,该操作包括:从当前图像的当前切片的切片头中的状态语法元素解码(805)状态值,该状态值指定图像头是否用于当前图像;响应于状态值是第一值:推断(807)不存在用于当前图像的图像头;针对切片头解码(809)第一语法元素集,以获得第一语法元素集的解码值;以及使用(811)第一语法元素集的解码值来解码当前图像的当前切片;响应于状态值是第二值:推断(813)存在用于当前图像的图像头;针对切片头解码(815)第二语法元素集,以获得第二语法元素集的解码值;以及使用(817)第二语法元素集的解码值来解码当前图像的当前切片,其中,第二语法元素集包含与第一语法元素集相同的语法元素。
A16.根据实施例A15的计算机程序产品,具有进一步的计算机可执行指令,其被配置为当进一步的计算机可执行指令在设备(306)中包括的处理器(501)上执行时使设备(306)执行根据实施例A2-A7中任一实施例的方法。
A17.一种将当前图像编码到比特流中的方法,该方法包括:确定(1101)是否将存在用于当前图像的图像头;响应于确定将不存在用于当前图像的图像头:将状态语法元素的第一值编码(1103)到比特流中;以及使用(1105)第一语法元素集编码当前图像;响应于确定将存在用于当前图像的图像头:将状态语法元素的第二值编码(1107)到比特流中;以及使用(1109)第二语法元素集编码当前图像。
A18.一种用于通信网络的编码器,该编码器包括:处理器(501);以及与处理器耦合的存储器(503),其中,存储器包括指令,该指令在由处理器执行时使处理器执行操作,该操作包括:确定(1101)是否将存在用于当前图像的图像头;响应于确定将不存在用于当前图像的图像头:将状态语法元素的第一值编码(1103)到比特流中;以及使用(1105)第一语法元素集来对当前图像的当前切片进行编码;响应于确定将存在用于当前图像的图像头:将状态语法元素的第二值编码(1107)到比特流中;以及使用(1109)第二语法元素集来对当前图像的当前切片进行编码。
A19.一种包括计算机可执行指令的计算机程序产品,该计算机可执行指令配置为当在被包括在设备(500)中的处理器上执行计算机可执行指令时使设备(500)执行操作,该操作包括:确定(1101)是否将存在用于当前图像的图像头;响应于确定将不存在用于当前图像的图像头:将状态语法元素的第一值编码(1103)到比特流中;以及使用(1105)第一语法元素集来对当前图像的当前切片进行编码;响应于确定将存在用于当前图像的图像头:将状态语法元素的第二值编码(1107)到比特流中;以及使用(1109)第二语法元素集来对当前图像的当前切片进行编码。
A20.一种包括计算机可读存储介质的计算机程序产品,该计算机可读存储介质具有计算机可执行指令,该计算机可执行指令被配置为当在被包括在设备(500)中的处理器上执行计算机可执行指令时使设备(500)执行操作,该操作包括:确定(1101)是否将存在用于当前图像的图像头;响应于确定将不存在用于当前图像的图像头:将状态语法元素的第一值编码(1103)到比特流中;以及使用(1105)第一语法元素集来对当前图像的当前切片进行编码;响应于确定将存在用于当前图像的图像头:将状态语法元素的第二值编码(1107)到比特流中;以及使用(1109)第二语法元素集来对当前图像的当前切片进行编码。
下面提供附加说明。
一般来说,本文中使用的所有术语将根据其在相关技术领域中的一般含义进行解释,除非明确给出和/或根据所使用的上下文暗示不同的含义。对一/一个/该元件、装置、组件、手段、步骤等的所有引用应被公开地解释为引用该元件、装置、组件、手段、步骤等的至少一个实例,除非另有明确规定。本文所公开的任何方法的步骤不必按照所公开的确切顺序执行,除非步骤明确被描述为在另一个步骤之后或之前,和/或暗示步骤必须在另一步骤之后或之前。本文所公开的任何实施例的任何特点在适当的情况下可应用于任何其他实施例。同样,任何实施例的任何优点可应用于任何其他实施例,反之亦然。根据以下描述,所包含的实施例的其他目标、特征和优点将是明显的。
本文所公开的任何适当的步骤、方法、特征、功能或益处可以通过一个或多个虚拟装置的一个或多个功能单元或模块来执行。每个虚拟装置可以包括多个这种功能单元。这些功能单元可以通过处理电路来实现,处理电路可以包括一个或多个微处理器或微控制器以及其他数字硬件,这些数字硬件可以包括数字信号处理器(DSP)、专用数字逻辑等。处理电路可被配置为执行被存储在存储器中的程序代码,存储器可以包括一种或几种类型的存储器,诸如只读存储器(ROM)、随机存取存储器(RAM)、高速缓存存储器、闪存存储设备、光存储设备等。被存储在存储器中的程序代码包括用于执行一个或多个电信和/或数据通信协议的程序指令以及用于执行本文所描述的一个或多个技术的指令。在一些实现中,处理电路可用于使相应的功能单元根据本公开的一个或多个实施例执行对应的功能。
术语“单元”可具有在电子、电气设备和/或电子设备领域的常规含义,并且可包括例如电气和/或电子电路、设备、模块、处理器、存储器、逻辑固态和/或离散设备、用于执行相应任务、程序、计算、输出和/或显示功能的计算机程序或指令等等,诸如本文所描述的那些。
缩写
在本公开中可以使用以下缩写的至少一部分。如果缩写之间存在不一致,则应优先考虑在上文如何使用它。如果在下面多次列出,则第一次列出应优先于任何后续的列出:
AU 接入单元
AUD 接入单元分界符
ALF 自适应环路滤波器
APS 自适应参数集
BLA 断链接入
CLVS 编码层视频序列
CRA 净随机接入
CVS 编码视频流
CVSS CVS起始
CU 编码单元
DPS 解码参数集
DRAP 相关随机接入点
GDR 逐渐解码刷新
HEVC 高效视频编码
IDR 即时解码刷新
IDR 帧内随机接入点
LMCS 亮度映射和色度缩放
MPEG 运动图像专家组
NAL 网络抽象层
NALU NAL单元
NUT NAL单元类型
PPS 图像参数集
RADL 随机接入可解码前置
RAP 随机接入点
RASL 随机接入跳过前置
RBSP 原始字节序列有效载荷
RPL 参考图像列表
SEI 补充增强层
SPS 序列参数集
STSA 步进式时间层接入
VCL 视频编码层
VPS 视频参数集
VVC 通用视频编码
在以上对本发明概念的各种实施例的描述中,应当理解,本文所使用的术语是仅为了描述特定实施例的目的,并不旨在限制本发明概念。除非另有规定,本文所使用的所有术语(包括技术和科学术语)具有与本发明所属领域的普通技术人员通常理解的相同含义。将进一步理解,术语(诸如在通用词典中定义的那些)应当被解释为具有与它们在本说明书的上下文和相关领域中的含义一致的含义,除非本文明确定义,否则不会以理想化或过于正式的意义进行解释。
当元件被称为“连接到”、“耦合到”、“响应于”另一个元件或其变体时,它可以直接地连接到、耦合到或响应于另一个元件,或者可存在中间元件。相反,当元件被称为“直接连接”、“直接耦合”、“直接响应”或其变体时,不存在中间元件。相似的数字在全文指代相似的元件。此外,本文所使用的“耦合”、“连接”、“响应”或其变体可以包括无线耦合、连接或响应。如本文所使用的,单数形式“一”、“一个”和“该”旨在也包括复数形式,除非上下文另有明确指出。为了简洁和/或清楚起见,可能不详细描述众所周知的功能或结构。术语“和/或”(缩写为“/”)包括一个或多个相关列出项的任何和全部组合。
可以理解,尽管在本文中使用术语“第一”、“第二”、“第三”等来描述各种元件/操作,但这些元件/操作不应受到这些术语的限制。这些术语仅用于区分一个元件/操作与另一个元件/操作。因此,在一些实施例中的第一元件/操作可以在其他实施例中被称为第二元件/操作,而不脱离本发明概念的教导。相同的参考数字或相同的参考标记表示整个说明书中的相同或类似的元件。
如本文所使用的,术语“包括”、“包含”、“具有”或其变型是开放式的,并且包括一个或多个所陈述的特征、整数、元件、步骤、组件或功能,但不排除存在或添加一个或多个其他特征、整数、元件、步骤、组件、功能或这些的组。此外,如本文所使用的,源自拉丁短语“exempli gratia”的常见缩写“例如”可用于引入或指定先前提到的项的一个或多个一般示例,并不旨在限制这种项。源自拉丁语短语“id est”的常见缩写“即”可以用于从更一般的记载中指定特定项。
本文参考计算机实现的方法、装置(系统和/或设备)和/或计算机程序产品的框图和/或流程图描述了示例性实施例。可以理解,框图和/或流程图图示的框以及框图和/或流程图图示中的框的组合可以通过由一个或多个计算机电路执行的计算机程序指令来实现。这些计算机程序指令可以被提供给通用计算机电路、专用计算机电路和/或其他可编程数据处理电路的处理器电路以产生一种机器,以使得经由计算机的处理器和/或其他可编程数据处理装置执行的该指令转换并控制晶体管、被存储在存储器位置的值以及这种电路内的其他硬件组件,以实现在框图和/或一个或多个流程图框中规定的功能/行为,从而创建用于实现在框图和/或(一个或多个)流程图框中规定的功能/动作的方法(功能)和/或结构。
这些计算机程序指令也可以被存储在有形的计算机可读介质中,该介质可以引导计算机或其他可编程数据处理设备以特定方式运行,以使得被存储在计算机可读介质中的指令产生包括实现在框图和/或一个或多个流程图框中指定的功能/动作的指令的制品。因此,本发明概念的实施例可以在硬件和/或在处理器(诸如数字信号处理器)上运行的软件(包括固件、驻留软件、微代码等)中体现,处理器可被统称为“电路”、“模块”或其变型。
还应注意,在一些替代实现中,在框中标注的功能/动作可以不按照在流程图中标注的顺序发生。例如,被连续显示的两个框实际上可以基本上同时执行,或者这些框有时可以以相反的顺序执行,这取决于所涉及的功能/动作。此外,流程图和/或框图的给定框的功能可被分为多个框,和/或流程图和/或框图的两个或多个框的功能框可以至少部分地被集成。最后,在不脱离发明概念的范围的情况下,可以在所示的框之间添加/插入其他块,和/或可以省略框/操作。此外,尽管一些图包括通信路径上的箭头,以显示通信的主要方向,但应理解,通信可以在与所绘的箭头相反的方向上发生。
在实质上不背离本发明概念的原则的情况下,可以对实施例进行许多变更和修改。所有这种变更和修改旨在被包括在本发明概念的范围内。因此,上述公开的主题将被视为说明性的,而不是限制性的,并且实施例的示例旨在涵盖所有这些修改、增强、和落入本发明概念的精神和范围内的其他实施例。因此,在法律允许的最大范围内,本发明概念的范围将由包括实施例的示例及其等同的示例的本公开的最广泛允许解释来确定,并且不应受到前面的详细描述的限制或约束。
参考文献
JVET-Q0255-v1.zip,通用视频编码,B.Bross,J.Chen,S.Liu,Y.-K.Wang
JVET-Q0426-v1.zip,通用视频编码,B.Bross,J.Chen,S.Liu,Y.-K.Wang

Claims (33)

1.一种用于从比特流解码图像的方法,所述方法包括:
接收用于所述图像的切片的切片头,其中,所述切片头包括状态语法元素;
从所述切片头中的所述状态语法元素解码(805)状态值,其中,a)如果所述状态值不等于第一值,则所述状态值指示i)所述比特流应当包括用于所述图像的图像头,所述图像头包括图像语法元素集,并且ii)所述切片头不应包括所述图像语法元素集,以及b)如果所述状态值等于所述第一值,则所述状态值指示i)所述切片头应当包含所述图像语法元素集,并且ii)所述比特流不应包括用于所述图像的图像头;以及
使用所述图像语法元素集来对所述图像的所述切片进行解码。
2.一种用于从比特流解码图像的方法,其中,所述图像包括一个或多个切片的有序集,所述方法包括:
接收用于所述图像的切片的切片头,其中,所述切片头包括状态语法元素;
从所述切片头中的所述状态语法元素解码(805)状态值,其中,如果所述状态值等于第一值,则所述状态值指示所述切片是所述图像的第一个且唯一的切片,并且所述切片头应当包含图像语法元素集;以及
使用所述图像语法元素集来对所述图像的所述切片进行解码。
3.根据权利要求1或2所述的方法,其中,所述状态语法元素是二进制标志。
4.根据权利要求1、2或3所述的方法,其中,所述图像语法元素集包括对用于标识图像参数集PPS的值进行编码的PPS语法元素。
5.根据权利要求1至4中任一项所述的方法,其中,接收所述切片头包括:接收包括所述切片头和切片数据的网络抽象层NAL单元。
6.根据权利要求1至5中任一项所述的方法,其中,所述状态值不等于所述第一值,并且所述状态值指示所述比特流包括用于所述图像的图像头。
7.根据权利要求6所述的方法,还包括:在接收所述切片头之前,接收所述图像头。
8.根据权利要求7所述的方法,其中,
接收所述图像头包括:接收包括所述图像头的第一网络抽象层NAL单元,
接收所述切片头包括:接收包括所述切片头的第二NAL单元,
包括所述图像头的所述第一NAL单元在解码顺序上先于包括所述切片头的所述第二NAL单元。
9.根据权利要求8所述的方法,其中,
所述第一NAL单元是非视频编码层NAL单元,即非VCL NAL单元,
所述第二NAL单元是视频编码层VCL NAL单元。
10.根据权利要求8或9所述的方法,其中,所述第一NAL单元和所述第二NAL单元属于相同的接入单元或图像单元。
11.根据权利要求1至10中任一项所述的方法,其中,
所述比特流包括编码层视频序列CLVS,
所述图像是所述CLVS内的图像,
所述CLVS包括多个切片头,所述多个切片头包括所述切片头,
在所述CLVS中包括的每个切片头包括所述状态语法元素,
每个所述状态语法元素必须编码相同的值。
12.一种由编码器执行的方法,所述方法包括:
生成比特流,其中,生成所述比特流包括:
生成用于图像的切片的切片头,其中,所述切片头包括对状态值进行编码的状态语法元素,其中,a)如果所述状态值不等于第一值,则所述状态值指示i)由所述编码器生成的所述比特流应当包括用于所述图像的图像头,所述图像头包括图像语法元素集,并且ii)所述切片头不包括所述图像语法元素集,以及b)如果所述状态值等于所述第一值,则所述状态值指示i)所述切片头应当包含所述图像语法元素集,并且ii)所述比特流不应包括用于所述图像的图像头。
13.一种由编码器执行的方法,所述方法包括:
生成比特流,其中,生成所述比特流包括:
生成用于图像的切片的切片头,其中,所述切片头包括对状态值进行编码的状态语法元素,其中,如果所述状态值等于第一值,则所述状态值指示所述切片是所述图像的第一个且唯一的切片,并且所述切片头包含图像语法元素集。
14.根据权利要求12或13中任一项所述的方法,其中,所述状态语法元素是二进制标志。
15.根据权利要求12至14中任一项所述的方法,其中,所述图像语法元素集包括对用于标识图像参数集PPS的值进行编码的PPS语法元素。
16.根据权利要求12至15中任一项所述的方法,还包括:向编码器发送所述切片头。
17.根据权利要求16所述的方法,其中,所述状态值不等于所述第一值,并且所述状态值指示所述比特流包括用于所述图像的图像头。
18.根据权利要求17所述的方法,还包括:在向所述编码器发送所述切片头之前,向所述编码器发送所述图像头。
19.根据权利要求18所述的方法,其中,
向所述编码器发送所述切片头包括:向所述编码器发送包括所述切片头和切片数据的视频编码层VCL网络抽象层NAL单元,
向所述编码器发送所述图像头包括:向所述编码器发送包括所述图像头的非视频编码层NAL单元,即非VCL NAL单元。
20.根据权利要求所述的方法,其中,所述NAL单元属于相同的接入单元或图像单元。
21.根据权利要求12至20中任一项所述的方法,其中,
所述比特流包括编码层视频序列CLVS,
所述图像是所述CLVS内的图像,
所述CLVS包括多个切片头,所述多个切片头包括所述切片头,
在所述CLVS中包括的每个切片头包括所述状态语法元素,
每个所述状态语法元素必须编码相同的值。
22.一种包括指令的计算机程序,所述指令在由处理电路执行时使得所述处理电路执行权利要求1至21中任一项所述的方法。
23.一种载体,包含权利要求22所述的计算机程序,其中,所述载体是电子信号、光信号、无线电信号和计算机可读存储介质中的一种。
24.一种解码器(506),所述解码器适于:
接收用于所述图像的切片的切片头,其中,所述切片头包括状态语法元素;
从所述切片头中的所述状态语法元素解码(805)状态值,其中,a)如果所述状态值不等于第一值,则所述状态值指示i)所述比特流应当包括用于所述图像的图像头,所述图像头包括图像语法元素集,并且ii)所述切片头不应包括所述图像语法元素集,以及b)如果所述状态值等于所述第一值,则所述状态值指示i)所述切片头应当包含所述图像语法元素集,并且ii)所述比特流不应包括用于所述图像的图像头;以及
使用所述图像语法元素集来对所述图像的所述切片进行解码。
25.根据权利要求24所述的解码器,进一步适于执行权利要求3至11中任一项所述的方法。
26.一种解码器(506),所述解码器适于:
接收用于所述图像的切片的切片头,其中,所述切片头包括状态语法元素;
从所述切片头中的所述状态语法元素解码(805)状态值,其中,如果所述状态值等于第一值,则所述状态值指示所述切片是所述图像的第一个且唯一的切片,并且所述切片头应当包含图像语法元素集;以及
使用所述图像语法元素集来对所述图像的所述切片进行解码。
27.根据权利要求26所述的解码器,进一步适于执行权利要求3至11中任一项所述的方法。
28.一种解码器(506),所述解码器包括:
处理器(603);以及
存储器(605),所述存储器包含可由所述处理器执行的指令,由此所述解码器可操作以执行权利要求1至11中任一项所述的方法。
29.一种编码器(500),所述编码器适于:
生成比特流,其中,生成所述比特流包括:生成用于图像的切片的切片头,其中,所述切片头包括对状态值进行编码的状态语法元素,其中,a)如果所述状态值不等于第一值,则所述状态值指示i)由所述编码器生成的所述比特流应当包括用于所述图像的图像头,所述图像头包括图像语法元素集,并且ii)所述切片头不包括所述图像语法元素集,以及b)如果所述状态值等于所述第一值,则所述状态值指示i)所述切片头应当包含所述图像语法元素集,并且ii)所述比特流不应包括用于所述图像的图像头。
30.根据权利要求29所述的编码器,进一步适于执行权利要求13至21中任一项所述的方法。
31.一种编码器(500),所述编码器适于:
生成比特流,其中,生成所述比特流包括:生成用于图像的切片的切片头,其中,所述切片头包括对状态值进行编码的状态语法元素,其中,如果所述状态值等于第一值,则所述状态值指示所述切片是所述图像的第一个且唯一的切片,并且所述切片头包含图像语法元素集。
32.根据权利要求31所述的编码器,进一步适于执行权利要求13至21中任一项所述的方法。
33.一种编码器(500),所述编码器包括:
处理器(703);以及
存储器(705),所述存储器包含可由所述处理器执行的指令,由此所述编码器可操作以执行权利要求12至21中任一项所述的方法。
CN202080093926.3A 2020-01-09 2020-09-24 图像头存在 Pending CN115004710A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202062959123P 2020-01-09 2020-01-09
US62/959,123 2020-01-09
PCT/EP2020/076815 WO2021139905A1 (en) 2020-01-09 2020-09-24 Picture header presence

Publications (1)

Publication Number Publication Date
CN115004710A true CN115004710A (zh) 2022-09-02

Family

ID=76763752

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080093926.3A Pending CN115004710A (zh) 2020-01-09 2020-09-24 图像头存在

Country Status (5)

Country Link
US (4) US11190792B2 (zh)
EP (1) EP4088469A1 (zh)
JP (1) JP7473656B2 (zh)
KR (1) KR20220119675A (zh)
CN (1) CN115004710A (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220119675A (ko) 2020-01-09 2022-08-30 텔레폰악티에볼라겟엘엠에릭슨(펍) 화상 헤더 존재
EP4307669A2 (en) 2020-02-14 2024-01-17 Beijing Bytedance Network Technology Co., Ltd. Reference picture resampling activation in video coding

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6956600B1 (en) * 2001-09-19 2005-10-18 Bellsouth Intellectual Property Corporation Minimal decoding method for spatially multiplexing digital video pictures
SG10201506682SA (en) * 2010-09-30 2015-10-29 Mitsubishi Electric Corp Moving image encoding device, moving image decoding device, moving image coding method, and moving image decoding method
JP5947405B2 (ja) * 2012-02-01 2016-07-06 ノキア テクノロジーズ オーユー ビデオ符号化方法および装置
US20130343465A1 (en) * 2012-06-26 2013-12-26 Qualcomm Incorporated Header parameter sets for video coding
RU2720534C2 (ru) * 2012-06-29 2020-04-30 ДжиИ Видео Компрешн, ЭлЭлСи Концепция потока видеоданных
KR101851479B1 (ko) * 2014-01-03 2018-04-23 노키아 테크놀로지스 오와이 파라미터 세트 코딩
KR20180116835A (ko) * 2017-04-18 2018-10-26 한국전자통신연구원 비디오 비트 스트림 혼합 방법 및 이를 수행하는 장치
WO2020176636A1 (en) * 2019-02-27 2020-09-03 Futurewei Technologies, Inc. Luma mapping with chroma scaling adaptation parameter set in video coding
US11395007B2 (en) * 2019-12-12 2022-07-19 Tencent America LLC Method for signaling dependent and independent picture header
US11343524B2 (en) * 2019-12-27 2022-05-24 Tencent America LLC Method for adaptation parameter set reference and constraints in coded video stream
US11399188B2 (en) * 2020-01-01 2022-07-26 Tencent America LLC Method for mixed NAL unit type support in a coded picture
CA3166542A1 (en) * 2020-01-02 2021-07-08 Lg Electronics Inc. Image decoding method and apparatus for coding image information including picture header
US11356706B2 (en) * 2020-01-08 2022-06-07 Qualcomm Incorporated Storage and delivery of video data for video coding
KR20220119675A (ko) * 2020-01-09 2022-08-30 텔레폰악티에볼라겟엘엠에릭슨(펍) 화상 헤더 존재
US11303892B2 (en) * 2020-01-23 2022-04-12 Qualcomm Incorporated Adaptive rounding for loop filters
US11706428B2 (en) * 2020-04-06 2023-07-18 Tencent America LLC Method for signaling picture header in coded video stream

Also Published As

Publication number Publication date
US20220078463A1 (en) 2022-03-10
JP7473656B2 (ja) 2024-04-23
US20240064322A1 (en) 2024-02-22
EP4088469A1 (en) 2022-11-16
US11490106B2 (en) 2022-11-01
US11778221B2 (en) 2023-10-03
US20210218978A1 (en) 2021-07-15
KR20220119675A (ko) 2022-08-30
US20230125007A1 (en) 2023-04-20
JP2023514662A (ja) 2023-04-07
US11190792B2 (en) 2021-11-30

Similar Documents

Publication Publication Date Title
KR102079803B1 (ko) 영상 디코딩 방법 및 이를 이용하는 장치
US10264286B2 (en) Bitstream conformance constraints in scalable video coding
US11677957B2 (en) Methods providing encoding and/or decoding of video using a syntax indicator and picture header
US11778221B2 (en) Picture header presence
CN113615190A (zh) 用于视频编码的恢复点过程的方法及相关装置
US20220286710A1 (en) Signaling of access unit delimiter
TWI777601B (zh) 靜止圖像設定檔之偵測
US20230076537A1 (en) Picture header prediction
KR20220160104A (ko) 양방향 픽처 조건에 기초한 디코딩
WO2021139905A1 (en) Picture header presence
CN114586361A (zh) 具有子图片片位置导出的片段位置信令
US20220360787A1 (en) Video coding layer up-switching indication
KR20220065804A (ko) 세그먼트 존재 정보 제공

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination