CN105723712B - 基于多层的图像编码/解码方法和设备 - Google Patents

基于多层的图像编码/解码方法和设备 Download PDF

Info

Publication number
CN105723712B
CN105723712B CN201480062557.6A CN201480062557A CN105723712B CN 105723712 B CN105723712 B CN 105723712B CN 201480062557 A CN201480062557 A CN 201480062557A CN 105723712 B CN105723712 B CN 105723712B
Authority
CN
China
Prior art keywords
flag
layer
value
tiles
picture
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201480062557.6A
Other languages
English (en)
Other versions
CN105723712A (zh
Inventor
姜晶媛
李镇浩
李河贤
崔振秀
金镇雄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Electronics and Telecommunications Research Institute ETRI
Original Assignee
Electronics and Telecommunications Research Institute ETRI
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Electronics and Telecommunications Research Institute ETRI filed Critical Electronics and Telecommunications Research Institute ETRI
Priority to CN201910476959.5A priority Critical patent/CN110225349B/zh
Priority claimed from PCT/KR2014/009580 external-priority patent/WO2015056941A1/ko
Publication of CN105723712A publication Critical patent/CN105723712A/zh
Application granted granted Critical
Publication of CN105723712B publication Critical patent/CN105723712B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/436Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation using parallelised computational arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability

Abstract

公开了支持多层的图像解码方法和图像解码设备。所述图像解码方法包括步骤:获得指示是否存在拼接块相关信息的信息;和基于所述指示是否存在拼接块相关信息的信息,来获得该拼接块相关信息。

Description

基于多层的图像编码/解码方法和设备
技术领域
本发明涉及视频编码和解码,并更具体地,涉及当在视频比特流中存在一个或多层时、表达拼接块(tile)和画面的方法。
背景技术
最近几年,在已增进多媒体环境的同时,已使用各个终端和网络,并且结果,用户的需求已被多样化。
例如,随着终端的性能和计算能力已被多样化,支持的性能也已被多样化用于每一设备。此外,在其中传送信息的网络的情况下,传送的信息的图案、数量、速度等以及诸如有线和无线网络的外部结构已被多样化用于每一功能。用户已根据期望的功能选择要使用的终端和网络,并且进一步,企业向用户提供的终端和网络的谱已被多样化。
在这方面,最近几年,随着具有高清晰度(HD)分辨率的广播已在全世界以及全国扩展和服务,许多用户已熟悉高清晰度和高质量视频。结果,与许多视频服务关联的组织已进行许多努力来开发下一代视频设备。
另外,随着对于具有比HDTV的分辨率高四倍的分辨率的超高清晰度 (UHD)和HDTV的兴趣已增加,对于压缩和处理更高分辨率和更高清晰度视频的技术的需求已进一步增加。
为了压缩和处理视频,可使用根据时间上在前和/或在后的视频来预测当前视频中包括的像素值的帧间预测技术、使用当前视频中的像素信息来预测当前视频中包括的另一像素值的帧内预测技术、以及向其中出现频率高的码元分配短符号并向其中出现频率低的码元分配长符号的熵编码技术等。
如上所述,当考虑具有不同的支持功能、和多样化用户需求的相应终端和网络时,支持的视频的质量、尺寸、帧等所以需要被多样化。
这样,由于具有终端的各个功能和各个类型的异类通信网络、以及终端,所以按照各种方式支持视频的质量、分辨率、尺寸、帧频等的可伸缩性成为视频格式的主要功能。
因此,必须提供可伸缩性功能从而实现时间、空间、视频质量等方面的视频编码和解码,以便基于用于视频编码的高效率方法、在各种环境下提供用户需要的服务。
发明内容
【技术问题】
本发明的目的是提供能够改进视频编码/解码效率的、用于视频编码/解码的方法和设备。
本发明的另一目的是提供能够改进编码/解码效率的、在可伸缩视频编码中用信令传输拼接块信息的方法和设备。
本发明的另一目的是提供能够改进编码/解码效率的、在可伸缩视频编码中用信令传输代表格式信息的方法和设备。
【技术方案】
根据本发明的实施例,提供了支持多层的用于视频解码的方法。所述用于视频解码的方法包括:获取指示是否存在拼接块信息的信息,并基于所述指示是否存在拼接块信息的信息,来获取该拼接块信息。
该拼接块信息可以是代表当前层的画面中存在的拼接块的地点与当前层所参考的参考层的画面中存在的拼接块的地点是否并置的信息。
根据本发明的另一实施例,提供了支持多层的用于视频解码的方法。所述用于视频解码的方法包括:获取指示是否存在色度格式信息和比特深度信息的信息,并基于所述指示是否存在色度格式信息和比特深度信息的信息,来获取所述色度格式信息和比特深度信息。
【有利效果】
根据本发明的实施例,当每一层由分层比特流中的一个或更多拼接块配置时,可通过信令执行分层比特流的并行编码/解码用于层之间的相关性,并且可容易地执行拼接块构成的感兴趣区域的编码/解码。此外,可通过有效地信令传输画面代表信息,来改进编码/解码效率。
附图说明
图1是图示了根据本发明实施例的用于视频编码的设备的配置的框图。
图2是图示了根据本发明实施例的用于视频解码的设备的配置的框图。
图3是示意性图示了根据本发明实施例的使用多层的可伸缩视频编码结构的概念图。
图4是图示了一个画面中去除的空拼接块区域的图。
图5是示意性图示了根据本发明实施例的用于在支持多层的可伸缩视频编码结构中获取拼接块信息的方法的流程图。
图6是示意性图示了根据本发明实施例的用于在支持多层的可伸缩视频编码结构中获取代表格式信息的方法的流程图。
具体实施方式
其后,将参考附图来详细描述本发明的实施例。在描述本发明的示范实施例时,当确定与本发明相关的已知技术的详细描述可使得本发明的要义模糊时,可省略其对应描述。
将理解的是,当在本描述中元件被简单称为“连接到”或“耦接到”另一元件而没有被称为“直接连接到”或“直接耦接到”另一元件时,该元件可“直接连接到”或“直接耦接到”另一元件,或者可在其间插入有其他元件的情况下连接或耦接到另一元件。此外,在本说明书中描述“包括”特定组件的内容并不排除除了对应组件之外的组件,并且意味着附加组件可被包括在本发明的实施例或本发明的技术精神的范围中。
可使用诸如第一、第二等术语来描述各个组件,但是这些组件不应受到这些术语的限制。以上术语仅用来将一个组件与另一组件彼此区分。例如,在不脱离本发明的范围的情况下,第一组件可被称为第二组件,并且类似地,第二组件可被称为第一组件。
另外,独立图示了本发明的实施例中描述的组件,以便示出不同特性功能,并且每一组件不由单独硬件或一个软件构成单元构成。即,每一组件包括为了简单描述而安排的相应组件,并且相应组件的至少两个组件可构成一个组件,或者一个组件被划分为可执行它们的功能的多个组件。甚至每一组件的集成实施例和分离实施例也被包括在本发明的范围中,而不脱离本发明的精神。
另外,一些组件不是执行本发明的必然功能的必要组件,而是仅改进本发明的性能的选择性组件。本发明还可利用除了仅用于改进性能的组件之外的、用于实现本发明的精神的必要组件来实现,并且仅包括除了仅用于改进性能的选择性组件之外的必要组件的结构也被包括在本发明的范围中。
图1图示了根据本发明实施例的用于视频编码的设备的配置的框图。
可通过扩展具有单层结构的用于视频编码的一般设备,来实现支持多层结构的用于视频编码的可伸缩设备。图1的框图图示了可向多层结构应用的、可作为用于视频编码的可伸缩设备的基础的、用于视频编码的设备的实施例。
参考图1,用于视频编码的设备100包括帧间预测模块110、帧内预测模块120、开关115、减法器125、变换模块130、量化模块140、熵编码模块150、逆量化模块160、逆变换模块170、加法器175、滤波器模块180、和参考画面缓冲器190。
用于视频编码的设备100可按照帧内模式或按照帧间模式来对输入视频进行编码,并输出比特流。
在帧内模式中,开关115可切换到帧内,而在帧间模式中,开关115可切换到帧间。帧内预测意味着屏幕内预测,并且帧间预测意味着屏幕间预测。用于视频编码的设备100可生成用于输入视频的输入块的预测块,并其后,编码输入块和预测块之间的残差。在该情况下,输入视频可意味着原始画面。
在帧内模式中,帧内预测模块120可使用当前块周围的已编码/已解码块的样本值作为参考样本。帧内预测模块120可使用参考样本执行空间预测,以生成用于当前块的预测样本。
在帧间模式中,帧间预测模块110可通过在运动预测处理期间在参考视频缓冲器190中存储的参考画面中规定与输入块(当前块)具有最小差别的参考块,来获取运动向量。帧间预测模块110通过使用该运动向量和画面缓冲器190中存储的参考画面来校正运动,以生成用于当前块的预测块。
在多层结构的情况下,帧间模式中应用的帧间预测可包括层间预测。帧间预测模块110通过采样参考层的画面来配置层间参考画面,并在参考画面列表中封装层间参考画面,以执行层间预测。可通过规定层间从属性的信息用信令传输层间参考关系。
其间,当当前层画面和参考层画面具有相同尺寸时,向参考层画面应用的采样可意味着通过从参考层画面拷贝的样本的参考样本的生成。当当前层画面和参考层画面具有不同分辨率时,向参考层画面应用的采样可意味着上采样。
例如,作为其中层具有不同分辨率的情况,可通过在支持关于分辨率的可伸缩性的层之间上采样参考层的重构画面,来配置层间参考画面。
可通过考虑编码成本等来确定使用哪个层的画面来配置层间参考画面。编码设备可向解码设备传送规定要用作层间参考画面的画面所属于的层的信息。
此外,在层间预测中参考的层(即,参考层)内的、用来预测当前块的画面可以是与当前画面(当前层内的预测目标画面)相同的访问单元(AU) 的画面。
减法器125可生成由输入块和生成的预测块之间的残差所导致的残差块。
变换模块130对残差块进行变换以输出变换系数。这里,变换系数可意味着通过变换残差块和/或残差信号所生成的系数值。其后,在该说明书中,当量化该变换系数时所生成的量化后变换系数级别也可被称为变换系数。
当应用变换跳过模式时,变换模块130可跳过变换该残差块。
量化模块140根据量化参数来对输入变换系数进行量化,以输出量化后的系数。量化后的系数也可被称为量化后的变换系数级别。在该情况下,量化模块140可通过使用量化矩阵对输入变换系数进行量化。
熵编码模块150根据概率分布对量化模块140所计算的值或在编码期间计算的编码后的参数值执行熵编码,以输出比特流。除了视频的像素信息之外,熵编码模块150可对用于视频编码的信息(例如,语法元素等)进行熵编码。
编码参数是用于编码和解码所需要的参数,并且可包括如同语法元素的要向解码设备传递的编码设备中编码的信息、和要在编码或解码处理期间推断的信息。
例如,编码参数可包括帧内/帧间预测模式、移动/运动向量、参考视频索引、编码块图案、残差信号的存在、变换系数、量化的变换系数、量化参数、块尺寸、块分段信息等的值或统计值。
残差信号可意味着原始信号和预测信号之间的差,并且还可以意味着具有原始信号和预测信号之间的差的变换形式的信号、或具有原始信号和预测信号之间的差的变换和量化形式的信号。残差信号可被称为块单元中的残差块。
在其中应用熵编码的情况下,向具有高出现概率的码元分配少比特,并向具有低出现概率的码元分配多比特,来表达码元,并且结果,可降低用于要编码的码元的比特流的尺寸。因此,可通过熵编码增强视频编码的压缩性能。
熵编码模块150可使用诸如指数哥伦布、上下文自适应可变长度编码 (CAVLC)、上下文自适应二进制算术编码(CABAC)的编码方法用于熵编码。例如,熵编码模块150可使用可变长度编码/代码(VLC)表来执行熵编码。此外,熵编码模块150导出目标码元的二值化方法以及目标码元/仓(bin) 的概率模型,并然后还可以使用导出的二值化方法或概率模型,来执行熵编码。
由于根据图1的实施例的用于视频编码的设备100执行帧间预测编码,即,屏幕间预测编码,所以当前编码的视频需要被解码和存储以便用作参考视频。因此,量化的系数可在逆量化模块160中逆量化,并且在逆变换模块 170中逆变换。加法器175可将逆量化和逆变换后的系数添加到预测块,并且生成重构块。
重构块经过滤波器模块180,并且滤波器模块180可向重构块或重构画面应用解块滤波、样本自适应偏移(SAO)、和自适应环路滤波(ALF)中的至少一个。滤波器模块180可被称为自适应环内滤波器。解块滤波可去除在块之间的边界上出现的块失真。SAO可向像素值添加适当偏移值,以便补偿编码误差。ALF可基于通过比较重构视频和原始视频所获取的值,来执行滤波。经过滤波器模块180的重构块可被存储在参考视频缓冲器190中。
图2是图示了根据本发明实施例的用于视频解码的设备的配置的框图。
可通过扩展具有单层结构的用于视频解码的一般设备,来实现支持多层结构的用于可伸缩视频解码的设备。图2的框图图示了可向多层结构应用的、可作为用于可伸缩视频解码的设备的基础的用于视频解码的设备的实施例。
参考图2,用于视频解码的设备200包括熵解码模块210、逆量化模块220、逆变换模块230、帧内预测模块240、帧间预测模块250、加法器255、滤波器模块260、和参考画面缓冲器270。
用于视频解码的设备200可接收由编码器输出的比特流,并按照帧内模式或帧间模式来解码所接收的比特流,并输出修改的视频(即,重构的视频)。
在帧内模式中,开关可切换到帧内,而在帧间模式中,开关可切换到帧间。
用于视频解码的设备200可从接收的比特流获取重构的残差块,并生成预测块,并然后生成通过将重构的残差块和预测块相加所修改的块(即,重构块)。
熵解码模块210根据概率分布对输入比特流进行熵解码,以生成关于量化后的系数和语法元素的信息。
量化后的系数由逆量化模块220逆量化并由逆变换模块230逆变换。量化后的系数被逆量化/逆变换,并结果,可生成重构的残差块。在该情况下,逆量化模块220可向量化后的系数应用量化矩阵。
在帧内模式中,帧内预测模块240可通过使用当前块周围的已解码块的样本值来执行空间预测,并生成用于当前块的预测样本。
在帧间模式中,帧间预测模块250通过使用运动向量和参考画面缓冲器 270中存储的参考画面补偿运动,以生成用于当前块的预测块。
在多层结构的情况下,在帧间模式中应用的帧间预测可包括层间预测。帧间预测模块2500通过采样参考层的画面来配置层间参考画面,并在参考画面列表中封装层间参考画面,以执行层间预测。可通过规定层间从属性的信息,用信令传输层间参考关系。
其间,当当前层画面和参考层画面具有相同尺寸时,向参考层画面应用的采样可意味着通过从参考层画面拷贝的样本的参考样本的生成。当当前层画面和参考层画面具有不同分辨率时,向参考层画面应用的采样可意味着上采样。
例如,作为其中层具有不同分辨率的情况,当在支持关于分辨率的可伸缩性的层之间应用层间预测时,可通过上采样参考层的重构画面,来配置层间参考画面。
在该情况下,可从编码设备向解码设备传送规定要用作层间参考画面的画面所属于的层的信息。
此外,在层间预测中参考的层(即,参考层)内的、用来预测当前块的画面可以是与当前画面(当前层内的预测目标画面)相同的访问单元(AU) 的画面。
重构的残差块和预测块由加法器255相加,并结果,可生成重构块。换言之,残差样本和预测样本彼此相加,并结果,生成重构的样本或重构的画面。
重构的画面由滤波器模块260滤波。滤波器模块260可向重构块或重构画面应用解块滤波、SAO、和ALF中的至少一个。滤波器模块260输出修改的或滤波的重构画面。重构的视频被存储在参考画面缓冲器270中以用于帧间预测。
此外,用于视频解码的设备200可进一步包括解析单元(未图示),用于解析关于比特流中包括的编码后视频的信息。解析单元可包括熵解码模块210,并且还可以被包括在熵解码模块210中。解析单元还可以被实现为解码单元的一个组成元件。
尽管已描述了在图1和2中一个编码设备/解码设备处理多层的编码/解码,但是这是为了容易描述,并且编码设备/解码设备可对于每一层配置。
在该情况下,上层的编码设备/解码设备可通过使用上层的信息和下层的信息来执行对应上层的编码/解码。例如,上层的预测单元(帧间预测单元) 可通过使用上层的像素信息或画面信息来执行用于当前块的帧内预测或帧间预测,并通过从下层接收重构的画面信息并使用其,来执行上层的当前块的帧间预测(层间预测)。这里,仅层间预测已被描述为示例,但是编码设备/解码设备可通过使用另一层的信息对于当前层执行编码/解码,而不管对于每一层配置编码设备/解码设备还是一个设备处理多层。
在本发明中,该层可包括视图。在该情况下,在层间预测的情况下,不是仅通过使用下层的信息来执行上层的预测,而是可使用由规定层间从属性的信息规定为从属的层之中的另一层的信息来执行层间预测。
图3是示意性图示了根据本发明实施例的使用多层的可伸缩视频编码结构的概念图。在图3中,画面组(GOP)代表画面组,即,一组画面。
需要传送介质来传送视频数据,并且其性能根据各种网络环境对于每一传送介质改变。可提供可伸缩视频编码方法,以应用到各种传送介质或网络环境。
支持可伸缩性的视频编码方法(其后,称为“可伸缩编码”或“可伸缩视频编码”)是通过使用层间纹理信息、运动信息、残差信号等去除层间冗余来增加编码和解码性能的编码方法。可伸缩视频编码方法可根据诸如传送比特率、传送误差率、和系统资源的周围条件,来提供空间、时间、质量和视图方面的各种可伸缩性。
可使用多层结构来执行可伸缩视频编码,以便提供可向各种网络情形应用的比特流。例如,可伸缩视频编码结构可包括通过使用用于视频解码的一般方法来压缩和处理视频数据的基本层,并且可包括通过使用基本层的解码信息和一般视频解码方法两者、来压缩和处理视频数据的增强层。
基本层可被称为基本层或下层。增强层可被指定为增强层或上层。在该情况下,下层可意味着支持具有比特定层更低级别的可伸缩性(空间、时间、质量或视图可伸缩性)的层,并且上层可意味着支持具有比特定层更高级别的可伸缩性(空间、时间、质量或视图可伸缩性)的层。此外,用于不同层的编码/解码所参考的层可被称为参考层,并且通过使用不同层所编码/解码的层可以是当前层。参考层可以是当前层的下层,并且当前层可以是参考层的上层。
这里,层意味着基于空间(例如,视频尺寸)、时间(例如,解码顺序、视频输出顺序、和帧频)、质量、复杂度、和视图而区分的视频和比特流的集合。
参考图3,例如,基本层可被定义为标准清晰度(SD)、15Hz的帧频、和1Mbps的比特率,并且第一增强层可被定义为高清晰度(HD)、30Hz的帧频、和3.9Mbps的比特率,并且第二增强层可被定义为超高清晰度 (4K-HD)、60Hz的帧频、和27.2Mbps的比特率。
必要时可不同地确定作为一个实施例的格式、帧频、比特率等。此外,使用的层的数目不限于该实施例并且可根据情形不同地确定。例如,如果传送带宽是4Mbps,则可通过减少第一增强层HD的帧频而按照15Hz或更低来传送数据。
可伸缩视频编码方法可通过图3的实施例中描述的方法来提供空间、时间、质量、和视图可伸缩性。在该说明书中,可伸缩视频编码在编码方面和可伸缩视频编码具有相同含义并且在解码方面和可伸缩视频解码具有相同含义。
在高效率视频编码(HEVC)标准中,存在其中一个画面按照拼接块格式被分段以被独立编码的方法。换言之,一个画面被划分为多个拼接块并且一个画面中划分的每一拼接块被独立编码/解码以并行处理。因此,需要指示如何按照拼接块格式配置比特流中的画面的信息,并且在HEVC中,应在画面参数集(PPS)中描述拼接块信息。此外,在HEVC中,应在序列参数集(SPS) 中描述画面代表信息,诸如,空间分辨率、色度格式、和比特深度信息。
在作为扩展HEVC以便提供可伸缩性的视频标准的可伸缩视频编码的情况下,多个层可存在于比特流中,并且可存在层之间的相关性。因此,在分层的比特流中,当画面由每一层中的一个或多个拼接块配置时,本发明提供了对于层之间的相关性通过信令传输来有效编码/解码拼接块信息的方法。此外,本发明提供了用于在可伸缩视频编码中有效信令传输该画面代表信息的方法。
拼接块信息
拼接块意味着一个画面中由编码树块或编码树单元构成的矩形区域,并且可以是一连串编码树块或编码树单元。拼接块总是由整数个编码树单元配置。这里,编码树块或编码树单元可以是画面中的样本的处理单元。
例如,一个画面可由画面中的垂直拼接块边界划分为两个拼接块。每一划分的拼接块包括整数数目的编码树单元,并且可以是矩形区域。
在作为用于支持可伸缩视频编码的标准的可伸缩HEVC(SHVC)和用于支持多视图的多视图HEVC(MV-HEVC)中,拼接块信息可在视频参数集 (VPS)和PPS中用信令传输。特别是,在VPS中,存在指示是否执行编码/ 解码、使得对应层中包括的拼接块的地点与对应层的参考层中包括的拼接块的地点并置/一致的标志信息。在该情况下,当参考层的空间分辨率与对应层的空间分辨率不相同时,参考层的空间分辨率被缩放为与对应层的空间分辨率相同,并且可确定对应层的拼接块的地点是否与缩放的参考层中包括的拼接块的地点并置/一致。
拼接块之间的地点彼此并置/一致的事实意味着拼接块的边界彼此并置 /一致。因此,作为指示是否执行编码/解码、使得对应层中包括的拼接块的地点与对应层的参考层中包括的拼接块的地点并置/一致的标志信息,可使用tile_boundaries_aligned_flag[i][j]。tile_boundaries_aligned_flag[i][j]指示第i 层在拼接块的地点(拼接块的边界)中是否与第j层一致。然而,在其中在整个比特流中对于每一层仅包括一个拼接块的情况下,不需要用信令传输 tile_boundaries_aligned_flag[i][j]。
因此,仅当存在包括至少两个拼接块的画面时,用信令传输 tile_boundaries_aligned_flag[i][j]可以是有效的。
其后,在本发明中,作为有效用信令传输tile_boundaries_aligned_flag[i][j]的方法,将作为示例描述语法。
表格1是图示了根据本发明实施例用信令传输 tile_boundaries_aligned_flag[i][j]的方法的语法的示例。
[表格1]
参考表格1,当vps_tiles_enabled_flag具有值1时,参考对应VPS的画面之中的包括两个或更多拼接块的画面可存在。当vps_tiles_enabled_flag具有值0时,编码后视频流(CVS)的所有画面仅包括一个拼接块。
例如,当vps_tiles_enabled_flag为1时,可用信令传输 tile_boundaries_aligned_flag[i][j]。
表格2是图示了根据本发明实施例用信令传输 tile_boundaries_aligned_flag[i][j]的方法的语法的另一示例。
[表格2]
参考表格2,当tiles_not_in_use_flag具有值1时,CVS的所有画面仅包括一个拼接块。当tiles_not_in_use_flag具有值0时,参考对应VPS的画面之中的包括两个或更多拼接块的画面可存在。
例如,当tiles_not_in_use_flag为0时,可用信令传输tile_boundaries_aligned_flag[i][j]。
表格3是图示了根据本发明实施例用信令传输 tile_boundaries_aligned_flag[i][j]的方法的语法的另一示例。
[表格3]
参考表格3,当vps_tiles_enabled_flag[i]具有值1时,第i层的每一画面包括至少两个拼接块。当vps_tiles_enabled_flag具有值0时,第i层的所有画面仅包括一个拼接块。
例如,当vps_tiles_enabled_flag为1时,可用信令传输 tile_boundaries_aligned_flag[i][j]。
表格4是图示了根据本发明实施例的通过使用表格1中的VPS中用信令传输的vps_tiles_enabled_flag的、PPS中的信令方法的语法的示例。
[表格4]
参考表格4,当tiles_enabled_flag具有值1时,参考对应PPS的所有画面包括两个或更多拼接块。当tiles_enabled_flag具有值0时,参考PPS的所有画面仅包括一个拼接块。如果不用信令传输tiles_enabled_flag值,则假设 tiles_enabled_flag值为0。
与表格4类似,可确定是否通过vps_tiles_enabled_flag用信令传输 tiles_enabled_flag。然而,与vps_tiles_enabled_flag无关,如同表格5,在其中用信令传输tiles_enabled_flag的情况下,仅当vps_tiles_enabled_flag的值为1时,tiles_enabled_flag的值可为1。换言之,当vps_tiles_enabled_flag的值为0时,tiles_enabled_flag的值应总为0。
[表格5]
表格6是图示了根据本发明实施例的在SPS中用信令传输 sps_tiles_enabled_flag而没有vps_tiles_enabled_flag的信令传输的方法的语法的示例。
[表格6]
参考表格6,当sps_tiles_enabled_flag具有值1时,参考对应SPS的所有画面包括两个或更多拼接块。当sps_tiles_enabled_flag具有值0时,参考 SPS的所有画面包括一个拼接块。
关联于表格6,在PPS中,也可如同以下表格7(而不是表格4)那样用信令传输tiles_enabled_flag。
[表格7]
PPS中的使能拼接块的标志的修订
根据HEVC标准,tiles_enabled_flag具有以下约束。
“针对在编码后视频流(CVS)中激活的所有PPS,tiles_enabled_flag应具有相同值。”
根据这些约束,在本发明中,为了相干地简化CVS中包括的PPS,当层标识符nuh_layer_id的值大于0时,提出了不在PPS中用信令传输 tiles_enabled_flag、而在SPS中用信令传输tiles_enabled_flag的方法。
表格8是图示了根据本发明实施例的基于层标识符nuh_layer_id信息在 SPS中用信令传输tiles_enabled_flag的方法的语法的示例。
[表格8]
表格8中图示的语法的含义与上面描述的那些相同,并且这里,将省略该语法的描述。
表格9是图示了根据本发明实施例的基于层标识符nuh_layer_id信息在 SPS中用信令传输tiles_enabled_flag的方法的语法的另一示例。
[表格9]
参考表格9,当tiles_enabled_flag具有值1时,参考对应PPS的所有画面包括两个或更多拼接块。当sps_tiles_enabled_flag具有值0时,参考对应 PPS的所有画面仅包括一个拼接块。如果没有用信令传输tiles_enabled_flag 的值,则tiles_enabled_flag的值被推断为sps_tiles_enabled_flag的值。
在该情况下,tiles_enabled_flag的值需要在CVS的特定层中激活的所有 PPS中具有相同值。
VPS中的拼接块信息
任何CVS可以是复杂的,以在一些解码器中实时解码。如果将拼接块信息传递到解码器,则解码器可预先确定是否可解码对应CVS。即,在VPS 中,可使用用信令传输的拼接块信息用于会话协商。此外,如果特定层中的画面具有相同拼接块设置、即相同缺省拼接块形状,则不需要用信令传输所有PPS中的拼接块信息。
因此,在本发明中,在VPS中,一般,提出了描述缺省拼接块信息或关于拼接块的最大和最小数目的信息。
第一实施例
表格10是图示了根据本发明实施例的在VPS中用信令传输拼接块信息的方法的语法的示例。
[表格10]
参考表格10,当tiles_not_in_use_flag具有值1时,CVS中包括的所有画面仅包括一个拼接块。当tiles_not_in_use_flag具有值0时,可存在参考对应VPS的画面之中的、包括两个或更多拼接块的画面。
当default_tile_info_flag[i]具有值1时,第i层的画面具有缺省拼接块设置。当default_tile_info_flag[i]具有值0时,第i层的画面可具有缺省拼接块设置或没有。
num_tile_columns_minus1[i]加上1的值代表分割第i层的画面的拼接块列的数目。当不用信令传输num_tile_columns_minus1[i]时,假设 num_tile_columns_minus1[i]为0。
num_tile_rows_minus1[i]加上1的值代表分割第i层的画面的拼接块行的数目。当不用信令传输num_tile_rows_minus1[i]时,假设 num_tile_rows_minus1[i]为0。
当uniform_spacing_flag[i]具有值1时,按照预定间隔定位第i层的画面中的拼接块列和拼接块行。当uniform_spacing_flag[i]具有值0时,不按照预定间隔定位第i层的画面中的拼接块列和拼接块行。在该情况下,可通过每一拼接块的column_width_minus1[i][j]和row_height_minus1[i][j],用信令传输列的宽度和行的高度。当不存在uniform_spacing_flag的值时,可假设uniform_spacing_flag的值为1。
column_width_minus1[i][j]加上1的值应代表通过编码树块单元的第i 层的第j拼接块的列的宽度。
row_height_minus1[i][j]加上1的值应代表通过编码树块单元的第i层的第j拼接块的行的高度。
当loop_filter_across_tiles_enabled_flag[i]具有值1时,示出了对第i层的画面中的拼接块边界执行环内滤波。当 loop_filter_across_tiles_enabled_flag[i]具有值0时,示出了不对第i层的画面中的拼接块边界执行环内滤波。环内滤波操作包括解块滤波操作和自适应偏移滤波操作。当不用信令传输loop_filter_across_tiles_enabled_flag的值时,假设loop_filter_across_tiles_enabled_flag的值为1。
如同表格10,可在补充增强信息(SEI)消息中用信令传输上述相同信息,而不在VPS中传送拼接块信息。
此外,可修订PPS以便仅当必要时、更新在PPS中用信令传输的拼接块信息。
表格11是图示了根据本发明实施例仅当必要时、更新在PPS中用信令传输的拼接块信息的方法的语法的示例。
[表格11]
参考表格11,当tiles_enabled_flag具有值1时,意味着参考对应PPS的所有画面包括两个或更多拼接块。当tiles_enabled_flag具有值0时,意味着参考PPS的所有画面仅包括一个拼接块。如果不用信令传输tiles_enabled_flag的值,则tiles_enabled_flag的值被推断为0。
当update_tiles_info_flag具有值1时,示出了更新参考对应PPS的画面的拼接块信息。当update_tiles_info_flag具有值0时,示出了不更新参考对应PPS的画面的拼接块信息。
第二实施例
表格12是图示了根据本发明实施例的在VPS中用信令传输拼接块信息的方法的语法的另一示例。
[表格12]
可仅向与环路滤波信令关联的拼接块的数目和内容应用PPS的更新机制。
[表格13]
表格12和13中图示的语法的语义与第一实施例中的表格10和11中描述的语法的语义相同。
第三实施例
表格14是图示了根据本发明实施例的在VPS中用信令传输拼接块信息的方法的语法的另一示例。
[表格14]
表格14中图示的语法的语义与第一实施例中的表格10和11中描述的语法的语义相同。
第四实施例
表格15是图示了根据本发明实施例的在VPS中用信令传输拼接块信息的方法的语法的另一示例。
[表格15]
参考表格15,当min_max_tile_info_flag[i]具有值1时,这意味着用信令传输比特流中包括的第i层的画面的最大拼接块数目和最小拼接块数目。当 min_max_tile_info_flag[i]具有值0时,这意味着不用信令传输比特流中包括的第i层的画面的最大拼接块数目和最小拼接块数目。
max_num_tile_columns_minus1[i]加上1的值代表分割第i层的画面的拼接块列的最大数目。当不用信令传输max_num_tile_columns_minus1[i]时,假设max_num_tile_columns_minus1[i]为0。
min_num_tile_columns_minus1[i]加上1的值代表分割第i层的画面的拼接块列的最小数目。当不用信令传输min_num_tile_columns_minus1[i]时,假设min_num_tile_columns_minus1[i]为0。
max_num_tile_rows_minus1[i]加上1的值代表分割第i层的画面的拼接块行的最大数目。当不用信令传输max_num_tile_rows_minus1[i]时,假设max_num_tile_rows_minus1[i]为0。
min_num_tile_rows_minus1[i]加上1的值代表分割第i层的画面的拼接块行的最小数目。当不用信令传输min_num_tile_rows_minus1[i]时,假设 min_num_tile_rows_minus1[i]为0。
第五实施例
表格16是图示了根据本发明实施例的在VPS中用信令传输拼接块信息的方法的语法的另一示例。
[表格16]
参考表格16,当max_tile_info_flag[i]具有值1时,这意味着用信令传输比特流中包括的第i层的画面的最大拼接块数目。当max_tile_info_flag[i] 具有值0时,这意味着不用信令传输比特流中包括的第i层的画面的最大拼接块数目。
当min_tile_info_flag[i]具有值1时,这意味着用信令传输比特流中包括的第i层的画面的最小拼接块数目。当min_tile_info_flag[i]具有值0时,这意味着不用信令传输比特流中包括的第i层的画面的最小拼接块数目。
可在vps_vui()中用信令传输实施例4和5。
SPS中的拼接块信息
一般来说,由于特定层中的画面的拼接块设置彼此相同,所以描述拼接块信息的另一方法可在SPS中描述。如果没有修订VPS中的拼接块信息,则可如同下表17修订SPS。
表格17是图示了根据本发明实施例的在SPS中用信令传输拼接块信息的方法的语法的示例。
[表格17]
由于表格17中描述的语法的语义与上面描述的在VPS中用信令传输拼接块信息的语法的语义相同,所以这里,将省略其描述。
不存在拼接块集合的描述
在一个当前CVS中可独立解码的区域(即,拼接块区域或拼接块集合) 可在“层间约束拼接块集合SEI消息”和“运动约束SEI消息”中描述。在该情况下,可跳过所描述的区域的外部区(除了CVS中可独立解码的区域之外的区域),而不向对应部分传送编码后数据。
然而,如图4中图示的,可存在企图稍后去除的空拼接块集合。所述空拼接块集合可稍后由在(用于广告盒等所使用的)内容传递路径上存在的装置填充。为此,有用的是,解码器可确定去除哪些拼接块集合(即,可独立解码的区域)。
当前“层间约束拼接块集合SEI消息”仅描述了可独立解码的区域,而没有描述在传递路径上去除哪个区域。
因此,本发明提供了这样的方法,其描述关于拼接块集合的信息,以便区分画面中的可解码区域和去除的区域。
例如,可向定义的每一拼接块集合添加标志,以便代表是否存在画面中的拼接块集合。
表格18是图示了根据本发明实施例的使用代表是否存在拼接块集合的标志的方法的语法的示例。
[表格18]
参考表格18,当present_flag[i]具有值1时,这意味着存在CVS中识别的拼接块集合。当present_flag[i]具有值0时,这意味着不存在CVS中识别的拼接块集合。
作为另一示例,可创建指示在CVS中是否存在每一拼接块集合的新SEI 消息。在该情况下,不应修订“层间约束拼接块集合SEI消息”。
代表格式的修订
其后,在本发明中,提出了用于改进在VPS和SPS中描述的“代表格式”的代表的方法。
表格19是图示了根据本发明实施例的用信令传输代表格式的方法的语法的示例。
[表格19]
参考表格19,vps_rep_format_idx[i]代表用于向第i层应用的rep_format() 语法的列表的索引。
可如同以下表格20那样修订表格19的语法。当如同表格20那样修订语法时,当在解码器或中间盒中的VPS解析处理处 vps_num_rep_formats_minus1=0时,不用信令传输“for”循环是有益的。
表格20是图示了根据本发明实施例的用信令传输代表格式的方法的语法的另一示例。
[表格20]
当仅在一些层中改变画面的尺寸或比特深度时,为了防止复制信息的信令传输,可如同以下表格21那样用信令传输关于代表格式的信息。
表格21是图示了根据本发明实施例的用于改进用信令传输复制信息的代表格式语法的示例。
[表格21]
参考表格21,当chroma_size_vps_present_flag具有值1时,示出了在语法中包括关于色度格式和画面尺寸的信息。当 chroma_size_vps_present_flag具有值0时,这意味着关于色度格式和画面尺寸的信息指代前面用信令传输的rep_format()。第一rep_format()的 chroma_size_vps_present_flag的值需要为1。
当bit_depth_vps_present_flag具有值1时,示出了在语法中包括关于比特深度的信息。当bit_depth_vps_present_flag具有值0时,这意味着关于比特深度的信息指代前面用信令传输的rep_format()。第一rep_format()的 bit_depth_vps_present_flag的值需要为1。
画面的尺寸对于每一层改变,但是当在许多情况下色度格式和比特深度对于每一层不改变时,为了防止复制信息的信令传输,可如同以下表格22 那样用信令传输关于代表格式的信息。
表格22是图示了根据本发明实施例的用于改进用信令传输复制信息的代表格式语法的另一示例。
[表格22]
参考表格22,当depth_chroma_vps_present_flag具有值1时,示出了在语法中包括关于色度格式和比特深度的信息。当 depth_chroma_vps_present_flag具有值0时,这意味着关于色度格式和比特深度的信息指代前面用信令传输的rep_format()。在该情况下,前面用信令传输的rep_format()可意味着向当前rep_format()所应用到的层下面的层应用的 rep_format()。第一rep_format()的depth_chroma_vps_present_flag的值需要为1。
另外,在SPS中,可以用代表存在关于色度格式和画面尺寸的更新信息的update_chroma_size_flag和代表存在关于比特深度的更新信息的 update_bit_depth_flag,来代替update_re_format_flag。
表格23是图示了根据本发明实施例的在SPS中用信令传输关于色度格式、画面尺寸、和比特深度的更新信息的方法的语法的示例。
[表格23]
参考表格23,当update_chroma_size_flag具有值1时,在SPS中用信令传输chroma_format_idc、separate_colour_plane_flag、 pic_width_in_luma_samples和pic_height_in_luma_samples,并且其中参考对应SPS的nuh_layer_id的值大于0的所有层使用所述信令传输的值。在该情况下,其中nuh_layer_id的值大于0的层不使用与在VPS中用信令传输的 chroma_format_idc、separate_colour_plane_flag、pic_width_in_luma_samples 和pic_height_in_luma_samples关联的值。
当update_chroma_size_flag具有值0时,这意味着不在SPS中用信令传输chroma_format_idc、separate_colour_plane_flag、pic_width_in_luma_samples 和pic_height_in_luma_samples的值,并且参考对应SPS的所有层使用在VPS 中用信令传输的chroma_format_idc、separate_colour_plane_flag、 pic_width_in_luma_samples和pic_height_in_luma_samples的值。当不用信令传输update_chroma_size_flag时,update_chroma_size_flag的值被看作1。
当具有其nuh_layer_id的值大于0(nuh_layer_id=layerIdCurr>0)的值的当前画面参考特定SPS时,chroma_format_idc、separate_colour_plane_flag、pic_width_in_luma_samples和pic_height_in_luma_samples可被看作以下值或限于此。
-当激活的SPS的nuh_layer_id的值为0时,chroma_format_idc、 separate_colour_plane_flag、pic_width_in_luma_samples和 pic_height_in_luma_samples的值被看作激活的VPS的第vps_ref_format_idx[j] 个rep_format()的chroma_format_idc、separate_colour_plane_flag、 pic_width_in_luma_samples、pic_height_in_luma_samples。在该情况下,j是 LayerIdxInVps[layerIdCurr],并且忽略在激活的SPS中用信令传输的 chroma_format_idc、separate_colour_plane_flag、pic_width_in_luma_samples和pic_height_in_luma_samples的值。
当活动的非基础层参考甚至基础层中使用的SPS时,从VPS推断出 chroma_format_idc、separate_colour_plane_flag、pic_width_in_luma_samples 和pic_height_in_luma_samples的值,并且在该情况下,SPS具有作为0的 nuh_layer_id的值。在活动基础层中,应用在激活的SPS中用信令传输的 chroma_format_idc、separate_colour_plane_flag、pic_width_in_luma_samples 和pic_height_in_luma_samples的值。
-当激活的SPS的nuh_layer_id的值大于0时,应用以下。
如果update_chroma_size_flag的值为0,则chroma_format_idc、 separate_colour_plane_flag、pic_width_in_luma_samples和 pic_height_in_luma_samples的值被看作激活的VPS的第vps_ref_format_idx[j] 个rep_format()的chroma_format_idc、separate_colour_plane_flag、 pic_width_in_luma_samples、pic_height_in_luma_samples。在该情况下,j是 LayerIdxInVps[layerIdCurr]。
如果update_chroma_size_flag的值为1,则chroma_format_idc、 separate_colour_plane_flag、pic_width_in_luma_samples和 pic_height_in_luma_samples的值小于或等于激活的VPS的第 vps_ref_format_idx[j]个rep_format()的chroma_format_idc、 separate_colour_plane_flag、pic_width_in_luma_samples、 pic_height_in_luma_samples的值。在该情况下,j是 LayerIdxInVps[layerIdCurr]。
当update_bit_depth_flag具有值1时,在SPS中用信令传输 bit_depth_luma_minus8和bit_depth_chroma_minus8,并且其中参考对应SPS 的nuh_layer_id的值大于0的所有层使用所述信令传输的值。在该情况下,在其nuh_layer_id的值大于0的层中,不使用与在VPS中用信令传输的 bit_depth_luma_minus8和bit_depth_chroma_minus8关联的值。
当update_bit_depth_flag具有值0时,示出了不在SPS中用信令传输 bit_depth_luma_minus8和bit_depth_chroma_minus8的值,并且参考对应SPS 的所有层使用在VPS中用信令传输的bit_depth_luma_minus8和 bit_depth_chroma_minus8的值。当不用信令传输update_bit_depth_flag时, update_bit_depth_flag的值被看作1。
当具有其nuh_layer_id的值大于0(nuh_layer_id=layerIdCurr>0)的值的当前画面参考特定SPS时,bit_depth_luma_minus8和 bit_depth_chroma_minus8可被看作以下值或限于此。
-当激活的SPS的nuh_layer_id的值为0时,bit_depth_luma_minus8和 bit_depth_chroma_minus8的值被看作激活的VPS的第vps_ref_format_idx[j] 个rep_format()的bit_depth_luma_minus8和bit_depth_chroma_minus8。在该情况下,j是LayerIdxInVps[layerIdCurr],并且忽略在激活的SPS中用信令传输的bit_depth_luma_minus8和bit_depth_chroma_minus8的值。
当活动的非基础层参考甚至基础层中使用的SPS时,从VPS推断出 bit_depth_luma_minus8和bit_depth_chroma_minus8的值,并且在该情况下, SPS具有作为0的nuh_layer_id的值。在活动基础层中,应用在在激活的SPS 中用信令传输的the bit_depth_luma_minus8和bit_depth_chroma_minus8的值。
-当激活的SPS的nuh_layer_id的值大于0时,应用以下。
当update_bit_depth_flag的值为0时,bit_depth_luma_minus8和 bit_depth_chroma_minus8的值被看作激活的VPS的第vps_ref_format_idx[j] 个rep_format()的bit_depth_luma_minus8和bit_depth_chroma_minus8。在该情况下,j是LayerIdxInVps[layerIdCurr]。
如果update_bit_depth_flag的值为1,则bit_depth_luma_minus8和 bit_depth_chroma_minus8的值小于或等于激活的VPS的第 vps_ref_format_idx[j]个rep_format()的bit_depth_luma_minus8和 bit_depth_chroma_minus8。在该情况下,j是LayerIdxInVps[layerIdCurr]。
在VPS扩展中涉及的Sps_max_sub_layers_minus1信令
可在VPS扩展中用信令传输比特流中包括的用于每一层的时间子层的数目。
表格24是图示了根据本发明实施例的用信令传输最大数目的时间子层的方法的语法的示例。
[表格24]
参考表格24,当vps_sub_layers_max_minus_present_flag为1时,示出了用信令传输sub_layer_vps_max_minus1[i]的值,并且当 vps_sub_layers_max_minus_present_flag为0时,示出了不用信令传输 sub_layer_vps_max_minus1[i]的值。
Sub_layers_vps_max_minus1[i]+1代表其中nuh_layer_id的值为 layer_id_in_nuh[i]的层中存在的时间子层的最大数目。 sub_layers_vps_max_minus1[i]的值具有0到vps_max_sub_layers_minus1的范围,并且当不用信令传输sub_layers_vps_max_minus1[i]的值时, sub_layers_vps_max_minus1[i]的值被推断为vps_max_sub_layers_minus1的值。
其间,在SPS中,当参考对应SPS的层具有nuh_layer_id值0时,用信令传输代表对应层的时间子层的最大数目的sps_max_sub_layers_minus1。然而,在SPS中,当参考对应SPS的层具有大于0的nuh_layer_id值时,不单独用信令传输代表对应层的时间子层的最大数目的 sps_max_sub_layers_minus1。在该情况下,定义 vps_max_sub_layers_minus1+1,其是整个比特流中存在的时间子层的最大数目,而不是对应层的时间子层的最大数目。
然而,如上所述,在VPS扩展中用信令传输每一层的时间子层的最大数目的情况下,可明显的是,将其中nuh_layer_id的值大于0的 sps_max_sub_layers_minus1的值定义为sub_layers_vps_max_minus1[i]值的以下值。
当参考对应SPS的层具有大于0的nuh_layer_id的值时, sps_max_sub_layers_minus1+1代表对应层的时间子层的最大数目。 sps_max_sub_layers_minus1具有0到6的值。当不用信令传输 sps_max_sub_layers_minus1时,推断出sps_max_sub_layers_minus1的值与其中nuh_layer_id的值为layer_id_in_nuh_[i]的第i层的 sub_layers_vps_max_minus1[i]的值相同。
VPS中的时间id嵌套标志信令
使用VPS中用信令传输的Vps_temporal_id_nesting_flag,用于通知可针对比特流中的所有层执行时间子层的切换(switching-up)。即,当 vps_max_sub_layers_minus1的值大于0时,vps_temporal_id_nesting_flag的值代表是否针对参考对应VPS的CVS(编码后视频比特流)附加限制屏幕间预测。当vps_max_sub_layers_minus1的值为0时, vps_temporal_id_nesting_flag需要具有值0。
然而,可以有用的是,解码器或比特流提取器确定是否可对于每一层执行切换,而不分析SPS。因此,如同下表25那样提出了在VPS中用信令传输temporal_id_nesting_flag的方法,temporal_id_nesting_flag代表是否可对于每一层执行切换。
表格25是图示了根据本发明实施例的用信令传输代表是否可对于每一层执行切换的标志的方法的语法的示例。
[表格25]
参考表格25,当vps_layer_temporal_id_nesting_present_flag的值为1时,示出存在vps_layer_temporal_id_nesting_flag[i]。当 vps_layer_temporal_id_nesting_present_flag的值为0时,示出不用信令传输 vps_layer_temporal_id_nesting_flag[i]。
当sub_layers_vps_max_minus1[i]大于0时, vps_layer_temporal_id_nesting_flag[i]代表是否针对第i层的画面附加限制屏幕间预测。当sub_layers_vps_max_minus[i]为0时, vps_layer_temporal_id_nesting_flag[i]需要具有值1。当不用信令传输vps_layer_temporal_id_nesting_flag[i]时,推断出 vps_layer_temporal_id_nesting_flag[i]与vps_temporal_id_nesting_flag的值相同。
另外,可如下修订在SPS中用信令传输的sps_temporal_id_nesting_flag 的语义。
当sps_max_sub_layers_minus1大于0时,sps_temporal_id_nesting_flag 代表是否针对参考对应SPS的编码后视频流(CVS)附加限制屏幕间预测。
当vps_temporal_id_nesting_flag的值为1时,sps_temporal_id_nesting_flag的值需要为1。当sps_max_sub_layers_minus1为0时, sps_temporal_id_nesting_flag的值需要为1。当不用信令传输 sps_temporal_id_nesting_flag的值时,推断出sps_temporal_id_nesting_flag的值与其中nuh_layer_id的值为layer_id_in_nuh_[i]的第i层的 vps_layer_temporal_id_nesting_flag[i]的值相同。
图5是示意性图示了根据本发明实施例的用于在支持多层的可伸缩视频编码结构中获取拼接块信息的方法的流程图。
图5的方法可由上述图2的用于视频解码的设备(更详细地,熵解码单元)执行。在该实施例中,为了易于描述,描述了由解码设备执行该方法,但是可由编码设备执行其相反处理。
参考图5,解码设备获取指示是否存在拼接块信息的信息(S500)。
解码设备可接收可伸缩比特流,并对接收的比特流进行熵解码,以获取指示是否存在拼接块信息的信息。
指示是否存在拼接块信息的信息可以是代表是否存在层中的画面之中的、包括两个或更多拼接块的画面的信息,如上所述。
例如,当存在层中的画面之中的、包括两个或更多拼接块的画面时,指示是否存在拼接块信息的信息可被设置为存在拼接块信息。相反,当不存在层中的画面之中的、包括两个或更多拼接块的画面时,即,当层中的所有画面仅包括一个拼接块时,指示是否存在拼接块信息的信息可被设置为不存在拼接块信息。
解码设备基于指示是否存在拼接块信息的信息获取拼接块信息(S510)。
在指示在比特流中存在拼接块信息的情况下,解码设备可通过熵解码获取拼接块信息。
拼接块信息可以是代表当前层的画面中存在的拼接块的地点与当前层所参考的参考层的画面中存在的拼接块的地点是否并置的信息。例如,如上所述,拼接块信息可以是tile_boundaries_aligned_flag。
指示是否存在拼接块信息的信息、和拼接块信息可通过VPS、PPS、SPS 等从编码器传送。
上述根据本发明实施例的基于指示是否存在拼接块信息的信息来获取拼接块信息的处理可如同表格1到7中描述的语法那样执行,并且可在这些实施例的各个组合中应用。
图6是示意性图示了根据本发明实施例的用于在支持多层的可伸缩视频编码结构中获取代表格式信息的方法的流程图。
图6的方法可由上述图2的用于视频解码的设备(更详细地,熵解码单元)执行。在该实施例中,为了易于描述,描述了由解码设备执行该方法,但是可由编码设备执行其相反处理。
参考图6,解码设备获取指示是否存在色度格式信息和比特深度信息的信息(S600)。
解码设备可接收可伸缩比特流,并对接收的比特流进行熵解码,以获取指示是否存在色度格式信息和比特深度信息的信息。
指示是否存在色度格式信息和比特深度信息的信息通过表格19到23描述,并且例如,可以是rep_format_idx_present_flag、 depth_chroma_vps_present_flag、chroma_size_vps_present_flag、 bit_depth_vps_present_flag等。
解码设备基于指示是否存在色度格式信息和比特深度信息的信息,获取色度格式信息和比特深度信息(S610)。
在指示在比特流中存在色度格式信息和比特深度信息的情况下,解码设备可通过熵解码获取色度格式信息和比特深度信息。
作为关于色度和亮度采样的信息的色度格式信息包括单色采样、4:2:0 采样、4:2:2采样、和4:4:4采样色度格式。
单色采样意味着仅通过亮度阵列构成样本阵列。4:2:0采样意味着两个色度阵列中的每一个具有亮度阵列的1/2高度和1/2宽度。4:2:2采样意味着两个色度阵列中的每一个具有亮度阵列的相同高度和1/2宽度。4:4:4采样意味着两个色度阵列中的每一个具有亮度阵列的相同高度和宽度,或者由单色采样处理。
在指示在比特流中不存在色度格式信息和比特深度信息的情况下,色度格式信息可指代先前用信令传输的色度格式信息,并且比特深度信息可指代先前用信令传输的比特深度信息。
指示是否存在色度格式信息和比特深度信息的信息、色度格式信息、和比特深度信息可通过VPS、PPS、SPS、作为描述代表格式信息的语法的 rep_format()等从编码器传送。
上述根据本发明实施例的基于指示是否存在色度格式信息和比特深度信息的信息、来获取色度格式信息和比特深度信息的处理在表格19到23中描述,并且这里,将省略其详细描述。
根据本发明实施例的方法被准备为要在计算机可读介质中存储的计算机中运行的程序,并且计算机可读记录介质的示例包括ROM、RAM、 CD-ROM、磁带、软盘、光学数据存储装置,并且该计算机可读记录介质也可按照载波的形式(例如,通过因特网传送)实现。
此外,计算机可读记录介质在通过网络连接的计算机系统上分布,并由此计算机可读记录介质可通过分布方案存储和运行为计算机可读代码。此外,用于实现该方法的功能程序、代码、和代码段可由本发明所属技术领域的程序员容易地推断。
在前述实施例中,方法已基于流程图被描述为一连串步骤或块,但是所述方法并不限于本发明的步骤的顺序,并且可按照与前述步骤或顺序不同的步骤或顺序、或者可与前述步骤或顺序同时,发生任何步骤。此外,本领域技术人员能理解的是,流程图中示出的步骤不是排他的,并且可包括其他步骤,或者一个或更多步骤不影响本发明的范围并且可被删除。
尽管已参考附图描述了本发明的一些实施例,但是本领域技术人员可按照各种方式改变、修改、和替换本发明,而不脱离本发明的必要特性。因此,这里公开的各个实施例不意欲限制技术精神,而是在由以下权利要求指示真实范围和精神的情况下来描述。本发明的范围可由所附权利要求解释,并且本发明意欲覆盖等效范围中的技术精神。

Claims (1)

1.一种用于支持多层的视频解码的方法,该方法包括:
从比特流获取tiles_not_in_use_flag;
基于所述tiles_not_in_use_flag从比特流获取tiles_in_use_flag[i];
基于所述tiles_not_in_use_flag来从比特流获取tile_boundaries_aligned_flag[i][j];和
基于所述tiles_not_in_use_flag和tiles_in_use_flag[i]从比特流获取loop_filter_across_tiles_enabled_flag[i],
其中,当存在视频可用性信息VUI时,用信令传输tiles_not_in_use_flag,
其中,tiles_not_in_use_flag等于1指示属于视频序列的所有画面由单个拼接块组成,
其中,tiles_in_use_flag[i]等于1指示属于第i层的所有画面由多个拼接块组成,
其中,tile_boundaries_aligned_flag[i][j]等于1指示第i层在拼接块的边界中与第j参考层一致,
其中,loop_filter_across_tiles_enabled_flag[i]等于1指示跨越第i层的画面中的拼接块边界来执行环内滤波,并且
其中,仅当tiles_not_in_use_flag等于0时,才从比特流获取tile_boundaries_aligned_flag[i][j],并且
其中,仅当tiles_not_in_use_flag等于0并且tiles_in_use_flag[i]等于1时,才从比特流获取loop_filter_across_tiles_enabled_flag[i]。
CN201480062557.6A 2013-10-14 2014-10-13 基于多层的图像编码/解码方法和设备 Active CN105723712B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910476959.5A CN110225349B (zh) 2013-10-14 2014-10-13 用于支持多层的视频编码/解码方法和计算机可读记录介质

Applications Claiming Priority (13)

Application Number Priority Date Filing Date Title
KR10-2013-0122252 2013-10-14
KR20130122252 2013-10-14
KR10-2013-0124205 2013-10-17
KR20130124205 2013-10-17
KR20130127469 2013-10-25
KR10-2013-0127469 2013-10-25
KR20130128202 2013-10-28
KR10-2013-0128202 2013-10-28
KR20140000426 2014-01-02
KR10-2014-0000426 2014-01-02
KR10-2014-0004131 2014-01-13
KR20140004131 2014-01-13
PCT/KR2014/009580 WO2015056941A1 (ko) 2013-10-14 2014-10-13 다계층 기반의 영상 부호화/복호화 방법 및 장치

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN201910476959.5A Division CN110225349B (zh) 2013-10-14 2014-10-13 用于支持多层的视频编码/解码方法和计算机可读记录介质

Publications (2)

Publication Number Publication Date
CN105723712A CN105723712A (zh) 2016-06-29
CN105723712B true CN105723712B (zh) 2019-06-28

Family

ID=53036366

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201910476959.5A Active CN110225349B (zh) 2013-10-14 2014-10-13 用于支持多层的视频编码/解码方法和计算机可读记录介质
CN201480062557.6A Active CN105723712B (zh) 2013-10-14 2014-10-13 基于多层的图像编码/解码方法和设备

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201910476959.5A Active CN110225349B (zh) 2013-10-14 2014-10-13 用于支持多层的视频编码/解码方法和计算机可读记录介质

Country Status (3)

Country Link
US (5) US10091519B2 (zh)
KR (1) KR102290091B1 (zh)
CN (2) CN110225349B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9794595B2 (en) 2014-03-18 2017-10-17 Qualcomm Incorporated Derivation of end of sequence NAL unit information for multi-layer bitstreams
KR101915037B1 (ko) * 2016-07-01 2018-11-06 에스케이 텔레콤주식회사 고해상도 영상 스트리밍을 위한 영상 비트스트림 생성방법 및 장치
JP2018107500A (ja) * 2016-12-22 2018-07-05 キヤノン株式会社 符号化装置、符号化方法及びプログラム、復号装置、復号方法及びプログラム
US10484703B2 (en) * 2017-02-07 2019-11-19 Mediatek Inc. Adapting merge candidate positions and numbers according to size and/or shape of prediction block
CA3059870A1 (en) * 2017-04-11 2018-10-18 Vid Scale, Inc. 360-degree video coding using face continuities
KR20210129210A (ko) * 2019-03-08 2021-10-27 지티이 코포레이션 비디오 코딩에서의 널 타일 코딩
CN113875246A (zh) * 2019-05-12 2021-12-31 北京字节跳动网络技术有限公司 用于参考图片重采样的信令
CA3152464A1 (en) 2019-09-24 2021-04-01 Xiang Ma Methods and systems to signal inter-layer enabled syntax element in video coding
CN111277911B (zh) * 2020-01-10 2021-10-15 聚好看科技股份有限公司 一种全景视频的图像处理方法、显示设备及服务器
JP7397211B2 (ja) * 2020-02-14 2023-12-12 北京字節跳動網絡技術有限公司 映像ビットストリームにおけるサブピクチャ情報の信号通知

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105284114A (zh) * 2013-07-07 2016-01-27 韦勒斯标准与技术协会公司 视频信号处理方法及装置

Family Cites Families (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060122663A (ko) * 2005-05-26 2006-11-30 엘지전자 주식회사 영상신호의 엔코딩 및 디코딩에서의 픽처 정보를 전송하고이를 이용하는 방법
EP3518547B1 (en) * 2007-04-12 2021-10-06 InterDigital VC Holdings, Inc. Methods and apparatus for video usability information (vui) for scalable video coding (svc)
KR101517768B1 (ko) 2008-07-02 2015-05-06 삼성전자주식회사 영상의 부호화 방법 및 장치, 그 복호화 방법 및 장치
US8385404B2 (en) * 2008-09-11 2013-02-26 Google Inc. System and method for video encoding using constructed reference frame
WO2010086501A1 (en) * 2009-01-28 2010-08-05 Nokia Corporation Method and apparatus for video coding and decoding
US20110170608A1 (en) * 2010-01-08 2011-07-14 Xun Shi Method and device for video transcoding using quad-tree based mode selection
WO2011127961A1 (en) * 2010-04-13 2011-10-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V. Adaptive image filtering method and apparatus
US8654860B2 (en) * 2010-11-01 2014-02-18 Mediatek Inc. Apparatus and method for high efficiency video coding using flexible slice structure
US10116932B2 (en) * 2010-12-14 2018-10-30 Sharp Kabushiki Kaisha Image filter device, decoding device, encoding device, and data structure
PT3373581T (pt) 2010-12-21 2020-01-27 Ntt Docomo Inc Codificação com intra-predição melhorada utilizando representações planares
US10244239B2 (en) * 2010-12-28 2019-03-26 Dolby Laboratories Licensing Corporation Parameter set for picture segmentation
US10298939B2 (en) * 2011-06-22 2019-05-21 Qualcomm Incorporated Quantization in video coding
US9338465B2 (en) * 2011-06-30 2016-05-10 Sharp Kabushiki Kaisha Context initialization based on decoder picture buffer
MY167857A (en) * 2011-08-11 2018-09-26 Sun Patent Trust Image coding method, image decoding method, image coding apparatus, image decoding apparatus, and image coding and decoding apparatus
WO2013042884A1 (ko) 2011-09-19 2013-03-28 엘지전자 주식회사 영상 부호화/복호화 방법 및 그 장치
CN107222744B (zh) 2011-10-28 2020-10-27 三星电子株式会社 用于视频的帧内预测的方法和设备
US9124895B2 (en) * 2011-11-04 2015-09-01 Qualcomm Incorporated Video coding with network abstraction layer units that include multiple encoded picture partitions
US20150098508A1 (en) 2011-12-30 2015-04-09 Humax Co., Ltd. Method and device for encoding three-dimensional image, and decoding method and device
US9451252B2 (en) * 2012-01-14 2016-09-20 Qualcomm Incorporated Coding parameter sets and NAL unit headers for video coding
US9525861B2 (en) * 2012-03-14 2016-12-20 Qualcomm Incorporated Disparity vector prediction in video coding
US20140003504A1 (en) * 2012-07-02 2014-01-02 Nokia Corporation Apparatus, a Method and a Computer Program for Video Coding and Decoding
US9357212B2 (en) * 2012-12-07 2016-05-31 Qualcomm Incorporated Advanced residual prediction in scalable and multi-view video coding
KR102539065B1 (ko) * 2013-01-04 2023-06-01 지이 비디오 컴프레션, 엘엘씨 효율적인 확장가능한 코딩 개념
US9578339B2 (en) * 2013-03-05 2017-02-21 Qualcomm Incorporated Parallel processing for video coding
US20140301463A1 (en) * 2013-04-05 2014-10-09 Nokia Corporation Method and apparatus for video coding and decoding
US20150016503A1 (en) * 2013-07-15 2015-01-15 Qualcomm Incorporated Tiles and wavefront processing in multi-layer context
US9628792B2 (en) * 2013-07-15 2017-04-18 Qualcomm Incorporated Cross-layer parallel processing and offset delay parameters for video coding
KR20200045013A (ko) * 2013-07-15 2020-04-29 소니 주식회사 상호작용성을 위한 모션-구속된 타일 세트들 sei 메시지의 확장들
US9967575B2 (en) * 2013-10-29 2018-05-08 Kt Corporation Multilayer video signal encoding/decoding method and device
US10356415B2 (en) * 2014-06-20 2019-07-16 Qualcomm Incorporated Systems and methods for constraining representation format parameters for a parameter set

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105284114A (zh) * 2013-07-07 2016-01-27 韦勒斯标准与技术协会公司 视频信号处理方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
High Efficiency Video Coding (HEVC) text specification draft 10 (for FDIS & Last Call) (JCTVC-L1003_v34);Benjamin Bross等;《Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11 12th Meeting: Geneva,CH》;20130319;正文第7.4.3.3节
On Tile Alignment (JCTVC-N0199,m29830);Sachin Deshpande,Kiran Misra;《Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11 14th Meeting: Vienna,AT》;20130731;正文第1-3章

Also Published As

Publication number Publication date
US20180332295A1 (en) 2018-11-15
CN110225349A (zh) 2019-09-10
KR102290091B1 (ko) 2021-08-18
KR20150043986A (ko) 2015-04-23
US10701380B2 (en) 2020-06-30
CN110225349B (zh) 2023-06-02
US10701382B2 (en) 2020-06-30
US20190014336A1 (en) 2019-01-10
US10091519B2 (en) 2018-10-02
US20180324448A1 (en) 2018-11-08
US20160255350A1 (en) 2016-09-01
US10701381B2 (en) 2020-06-30
US20180324447A1 (en) 2018-11-08
US10701379B2 (en) 2020-06-30
CN105723712A (zh) 2016-06-29

Similar Documents

Publication Publication Date Title
CN105723712B (zh) 基于多层的图像编码/解码方法和设备
US10924752B2 (en) Method and apparatus for predicting inter-layer based on temporal sub-layer information
CN104396253B (zh) 解码和编码视频数据的方法和装置及计算机可读存储媒体
CN112740681A (zh) 自适应多重变换译码
CA2951522C (en) Extensible design of nesting supplemental enhancement information (sei) messages
CN113728634A (zh) 自适应环路滤波器(alf)参数的自适应参数集(aps)
US20160080753A1 (en) Method and apparatus for processing video signal
JP2022529685A (ja) イントラ予測モード導出のためのブロックベースの量子化された残差ドメインのパルスコード変調割り当て
CN104335585A (zh) 图像解码方法和使用其的装置
CN105122799B (zh) 用于解码图像的方法以及使用其的设备
JP7381731B2 (ja) マルチレイヤービデオビットストリームにおける不要なレイヤーの禁止
CN104969554B (zh) 图像编码/解码方法和装置
JP2022513980A (ja) ビデオコーディング方法及び機器
KR20140043240A (ko) 영상 부호화/복호화 방법 및 장치
CN115567713B (zh) 基于子图像的解码方法、解码设备和存储码流的设备
KR20240046714A (ko) 그린 메타데이터 시그널링

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant