CN113812151A - 具有配置文件和级别相关编码选项的编码器和解码器、编码方法和解码方法 - Google Patents

具有配置文件和级别相关编码选项的编码器和解码器、编码方法和解码方法 Download PDF

Info

Publication number
CN113812151A
CN113812151A CN202080035030.XA CN202080035030A CN113812151A CN 113812151 A CN113812151 A CN 113812151A CN 202080035030 A CN202080035030 A CN 202080035030A CN 113812151 A CN113812151 A CN 113812151A
Authority
CN
China
Prior art keywords
video
encoded
pictures
value
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080035030.XA
Other languages
English (en)
Inventor
亚当·维科夫斯基
罗伯特·斯库宾
雅各·桑切斯德拉弗恩特
科尼利厄斯·黑尔格
托马斯·斯切尔
德特勒夫·马尔佩
卡尔斯滕·祖灵
托马斯·威甘德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Publication of CN113812151A publication Critical patent/CN113812151A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/527Global motion vector estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/43Hardware specially adapted for motion estimation or compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/537Motion estimation other than block-based
    • H04N19/54Motion estimation other than block-based using feature points or meshes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/563Motion estimation with padding, i.e. with filling of non-object values in an arbitrarily shaped picture block or region for estimation purposes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • H04N19/82Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop

Abstract

提供了一种根据实施例的视频编码器(101)。视频编码器(101)被配置用于通过生成编码视频信号来对视频的多个图片进行编码,其中,多个图片中的每个图片包括原始图片数据。视频编码器(101)包括数据编码器(110),数据编码器(110)被配置用于生成包括编码图片数据的编码视频信号,其中,数据编码器被配置为将视频的多个图片编码为编码图片数据。此外,视频编码器(101)包括输出接口(120),输出接口(120)被配置用于输出多个图片中的每个图片的编码图片数据。另外,提供了根据实施例的视频解码器、系统、用于编码和解码的方法、计算机程序以及编码视频信号。

Description

具有配置文件和级别相关编码选项的编码器和解码器、编码 方法和解码方法
技术领域
本发明涉及视频编码和视频解码,并且具体地,涉及具有配置文件和级别相关编码选项的编码器和解码器、编码方法以及解码方法。
背景技术
H.265/HEVC(HEVC=高效率视频编码)是一种已经提供了用于在编码器处和/或解码器处提升或者甚至启用并行处理工具的视频编解码器。例如,HEVC支持将图片细分为彼此独立编码的图块阵列。HEVC支持的另一概念涉及WPP,根据WPP,可以从左至右例如以条带并行地处理图片的CTU行或CTU线,前提是在处理连续的CTU线时遵守一些最小CTU偏移(CTU=编码树单元)。然而,具有更有效地支持视频编码器和/或视频解码器的并行处理能力的视频编解码器将是有利的。
在下文中,描述了对根据当前技术的VCL划分的介绍(VCL=视频编码层)。
通常,在视频编码中,图片样本的编码过程需要较小的分区,其中将样本分为一些矩形区域以用于联合处理,例如预测或变换编码。因此,将图片划分为特定大小的块,该大小在视频序列的编码期间是恒定的。在H.264/AVC标准中,使用16x16样本的固定大小块,即所谓的宏块(AVC=高级视频编码)。
在最先进的HEVC标准(参见[1])中,存在最大大小为64x64样本的编码树块(CTB)或编码树单元(CTU)。在HEVC的进一步描述中,对于这种类型的块,使用了更常用的术语CTU。
以光栅扫描顺序处理CTU,从左上CTU开始,按照线处理图片中的CTU,直到右下CTU。
将经编码的CTU数据组织为一种被称为片的容器。最初,在以前的视频编码标准中,片意味着包括图片的一个或多个连续CTU的片段。片用于编码数据的分段。从另一个角度来看,完整的图片也可以被定义为一个大的片段,因此,在历史上,术语片仍然适用。除了经编码的图片样本之外,片还包括与片本身的编码过程有关的附加信息,附加信息被放置在所谓的片标头中。
根据当前技术,VCL(视频编码层)还包括用于分片和空间划分的技术。例如,出于各种原因,可以将这种划分应用于视频编码中,原因包括并行化中的处理负载平衡、网络传输中的CTU大小匹配、误差缓解等。
发明内容
本发明的目的是提供用于视频编码和视频解码的改进概念。
本发明的目的是通过独立权利要求的主题来解决的。
在从属权利要求中提供了优选实施例。
附图说明
在下文中,将参考附图详细地描述本发明的实施例,在附图中:
图1示出了根据实施例的视频编码器。
图2示出了根据实施例的视频解码器。
图3示出了根据实施例的系统。
图4示出了具有概览的视口相关图块布置。
图5示出了通过子块分割的仿射运动。
图6示出了具有仿射预测的缩放运动。
图7示出了用于不同通道中的仿射预测的子块分割。
图8示出了用于这种情况的当前技术示例比特流顺序。
图9示出了视频编码器。
图10示出了视频解码器。
图11示出了一方面的经重构的信号(即经重构的图片)与另一方面的如数据流中以信号通知的预测残差信号和预测信号的组合之间的关系。
具体实施方式
附图的以下描述从对基于块的预测编解码器的编码器和解码器的描述的呈现开始,该基于块的预测编解码器用于对视频的图片进行编码,以便形成对可以内置本发明实施例的编码框架的示例。参照图9至图11描述了相应的编码器和解码器。在下文中,给出了本发明的概念的实施例的描述以及关于如何将这些概念分别构建到图9的编码器和图10的解码器中的描述,尽管随后的图1至图3及后续描述也可用于形成不根据图9的编码器和图10的解码器下的编码框架操作的编码器和解码器。
图9示出了视频编码器,一种用于示例性地使用基于变换的残差编码将图片12预测地编码到数据流14中的装置。使用参考标记10指示该装置或编码器。图10示出了对应的视频解码器20,即被配置为也使用基于变换的残差解码从数据流14中预测地解码图片12'的装置20,其中,撇号已被用于指示由解码器20重构的图片12'在通过预测残差信号的量化引入的编码损失方面偏离了由装置10原始进行编码的图片12。图9和图10示例性地使用基于变换的预测残差编码,尽管本申请的实施例不限于这种预测残差编码。对于参照图9和图10描述的其他细节也是如此,如下文将概述的。
编码器10被配置为对预测残差信号进行空间到频谱变换,并将由此获得的预测残差信号编码到数据流14中。同样地,解码器20被配置为从数据流14中解码预测残差信号,并对由此获得的预测残差信号进行频谱到空间变换。
在内部,编码器10可以包括预测残差信号形成器22,该预测残差信号形成器22生成预测残差24,以便度量预测信号26与原始信号(即与图片12)的偏差。预测残差信号形成器22可以例如是减法器,其从原始信号,即从图片12减去预测信号。然后,编码器10还包括变换器28,变换器28对预测残差信号24进行空间到频谱变换,以获得频谱域预测残差信号24',然后由也包括在编码器10中的量化器32对频谱域预测残差信号24'进行量化。将由此量化的预测残差信号24”编码到比特流14中。为此,编码器10可以可选地包括熵编码器34,熵编码器34对经变换和量化的预测残差信号进行熵编码,以将其编码到数据流14中。预测信号26由编码器10的预测级36基于编码到数据流14中并可从数据流14中解码的预测残差信号24”来生成。为此,如图9所示,预测级36可以在内部包括反量化器38,随后是逆变换器40,反量化器38对预测残差信号24”进行反量化,以便获得除了量化损失之外与信号24'相对应的频谱域预测残差信号24”',逆变换器40对后一预测残差信号24”'进行逆变换,即频谱到空间变换,以获得除了量化损失之外与原始预测残差信号24相对应的预测残差信号24””。然后,预测级36的组合器42例如通过加法将预测信号26和预测残差信号24””重新组合,以便获得经重构的信号46,即原始信号12的重构。经重构的信号46可以与信号12'相对应。然后,预测级36的预测模块44通过使用例如空间预测(即图片内预测)和/或时间预测(即图片间预测),来基于信号46生成预测信号26。
同样地,如图10所示,解码器20可以在内部由与预测级36相对应并以与预测级36相对应的方式互连的组件组成。具体地,解码器20的熵解码器50可以从数据流中熵解码经量化的频谱域预测残差信号24”,于是以上面关于预测级36的模块描述的方式互连和协作的反量化器52、逆变换器54、组合器56和预测模块58基于预测残差信号24”来恢复经重构的信号,使得如图10所示,组合器56的输出产生经重构的信号,即图片12'。
尽管上面没有具体描述,但是容易清楚,编码器10可以根据一些优化方案(例如以优化一些率失真相关标准,如编码损失的方式)来设置一些编码参数,包括例如预测模式、运动参数等。例如,编码器10和解码器20以及对应的模块44、58分别可以支持不同的预测模式,例如帧内编码模式和帧间编码模式。编码器和解码器在这些预测模式类型之间切换的粒度可以与图片12和12'分别到编码片段或编码块的细分相对应。例如,以这些编码片段为单位,可以将图片细分为帧内编码块和帧间编码块。如下文更详细概述的,帧内编码块基于相应块的空间上已经编码/解码的邻域来进行预测。可以存在包括方向性或角度帧内编码模式在内的若干帧内编码模式,并为相应的帧内编码片段选择帧内编码模式,根据所选择的帧内编码模式,通过沿着特定于相应的方向性帧内编码模式的某个方向,将邻域的样本值外推到相应的帧内编码片段中来填充相应的片段。帧内编码模式还可以例如包括一个或多个其他模式,例如DC编码模式和/或平面帧内编码模式,根据DC编码模式,对相应的帧内编码块的预测将DC值分配给相应的帧内编码片段内的所有样本,根据平面帧内编码模式,相应块的预测被近似或确定为由二维线性函数描述的在相应的帧内编码块的样本位置上的样本值的空间分布,其中基于相邻样本来驱动由二维线性函数定义的平面的斜率和偏移。与此相比,可以例如在时间上预测帧间编码块。对于帧间编码块,可以在数据流内以信号通知运动矢量,运动矢量指示图片12所属的视频的先前编码的图片中的部分的空间位移,在该位置对先前编码/解码的图片进行采样,以便获得相应帧间编码块的预测信号。这意味着,除了数据流14包括的残差信号编码,例如表示经量化的频谱域预测残差信号24”的经熵编码的变换系数水平之外,数据流14可以在其中编码用于将编码模式分配给各个块的编码模式参数、用于一些块的预测参数(例如用于帧间编码片段的运动参数)、以及可选的其他参数(例如用于控制和以信号通知将图片12和12’分别细分为片段的参数)。解码器20使用这些参数以与编码器相同的方式细分图片,将相同的预测模式分配给片段,并且执行相同的预测以产生相同的预测信号。
图11示出了一方面的经重构的信号(即经重构的图片12')与另一方面的在数据流14中以信号通知的预测残差信号24””和预测信号26的组合之间的关系。如上所述,组合可以是加法。预测信号26在图11中被示为将图片区域细分为用阴影线示意性指示的帧内编码块和未用阴影线示意性指示的帧间编码块。细分可以是任何细分,例如将图片区域规则地细分为正方形块或非正方形块的行和列,或者将图片12从树根块多树细分(例如四叉树细分等)为不同大小的多个叶块,其中图11示出了它们的混合,其中首先将图片区域细分为树根块的行和列,然后根据递归多树细分将树根块的行和列进一步细分为一个或多个叶块。
再次,数据流14可以具有编码到其中的用于帧内编码块80的帧内编码模式,其将若干支持的帧内编码模式之一分配给相应的帧内编码块80。对于帧间编码块82,数据流14可以具有编码到其中的一个或多个运动参数。一般而言,帧间编码块82不限于在时间上编码。备选地,帧间编码块82可以是从除了当前图片12本身之外的先前编码的部分(例如图片12所属的视频的先前编码的图片,或者在编码器和解码器分别为可伸缩编码器和解码器的情况下,为另一视图或层级较低的层的图片)预测的任何块。
图11中的预测残差信号24””也被示为图片区域到块84的细分。这些块可以被称为变换块,以便将其与编码块80和82区分开。实际上,图11示出了编码器10和解码器20可以分别使用两种不同的细分将图片12和图片12'细分为块,即一种分别细分为编码块80和82,而另一种细分为块84。两种细分可能是相同的,即每个编码块80和82可以同时形成变换块84,但是图11示出了以下情况:其中例如到变换块84的细分形成到编码块80、82的细分的扩展,使得块80和82的两个块之间的任何边框都覆盖两个块84之间的边框,或者备选地说,每个块80、82或者与变换块84之一重合,或者与变换块84的集群重合。然而,也可以彼此独立地确定或选择细分,使得变换块84可以备选地跨越块80、82之间的块边框。就细分为变换块84而言,类似的陈述因此与关于细分为块80、82所提出的一样是正确的,即块84可以是将图片区域则地细分为块(排列为行和列或者未排列为行和列)的结果、图片区域的递归多树细分的结果或者它们的组合或任何其他类型的分块方式(blockation)。顺便提一下,要注意,块80、82和84不限于正方形、矩形或任何其他形状。
图11还示出了预测信号26和预测残差信号24””的组合直接产生经重构的信号12'。然而,应当注意,根据备选实施例,可以将多于一个预测信号26与预测残差信号24””组合以产生图片12'。
在图11中,变换块84应具有以下意义。变换器28和逆变换器54以这些变换块84为单位执行它们的变换。例如,许多编解码器对所有变换块84使用某种DST或DCT。一些编解码器允许跳过变换,使得对于一些变换块84,直接在空间域中对预测残差信号进行编码。然而,根据以下描述的实施例,编码器10和解码器20以它们支持若干变换的方式配置。例如,编码器10和解码器20支持的变换可以包括:
οDCT-II(或DCT-III),其中DCT代表离散余弦变换
οDST-IV,其中DST代表离散正弦变换
οDCT-IV
οDST-VII
ο恒等变换(IT)
自然地,变换器28将支持这些变换的所有正向变换版本,同时解码器20或逆变换器54将支持其对应的反向或逆向版本:
ο逆DCT-II(或逆DCT-III)
ο逆DST-IV
ο逆DCT-IV
ο逆DST-VII
ο恒等变换(IT)
后续描述提供了关于编码器10和解码器20可以支持哪些变换的更多细节。在任何情况下,应当注意,所支持的变换的集合可以仅包括一个变换,例如一个频谱到空间或空间到频谱变换。
如上所述,已经呈现了图9至图11作为示例,其中可以实施以下进一步描述的发明构思,以便形成根据本申请的编码器和解码器的具体示例。就此而言,图9的编码器和图10的解码器分别可以表示本文下面描述的编码器和解码器的可能实现。然而,图9和图10仅是示例。然而,根据本申请的实施例的编码器可以使用下面更详细概述的概念来执行对图片12的基于块的编码,该编码器与图9的编码器例如在以下方面不同:不是视频编码器而是静止图片编码器,不支持帧间预测,或者以与图11示例的不同方式执行到块80的细分。同样地,根据本申请的实施例的解码器可以使用以下进一步概述的编码概念来执行从数据流14中基于块的解码图片12',但是该解码器可以与图10的解码器20例如在以下方面不同:不是视频编码器而是静止图片编码器,不支持帧内预测,或者以与参照图11描述的方式不同的方式将图片12'细分为块,和/或不是在变换域中,而是例如在空间域中从数据流14中导出预测残差。
在下文中,根据实施例的通用视频编码器在图1中描述,根据实施例的通用视频解码器在图2中描述,并且根据实施例的通用系统在图3中描述。
图1示出了根据实施例的通用视频编码器101。
视频编码器101被配置用于通过生成编码视频信号来对视频的多个图片进行编码,其中,多个图片中的每个图片包括原始图片数据。
视频编码器101包括数据编码器110,数据编码器110被配置用于生成包括编码图片数据的编码视频信号,其中,数据编码器被配置为将视频的多个图片编码为编码图片数据。
此外,视频编码器101包括输出接口120,输出接口120被配置用于输出多个图片中的每个图片的编码图片数据。
图2示出了根据实施例的通用视频解码器151。
视频解码器151被配置用于对包括编码图片数据的编码视频信号进行解码,以重构视频的多个图片。
视频解码器151包括输入接口160,输入接口160被配置用于接收编码视频信号。
此外,视频解码器包括数据解码器170,数据解码器170被配置用于通过对编码图片数据进行解码,来重构视频的多个图片。
图3示出了根据实施例的通用系统。
该系统包括图1的视频编码器101和图2的视频解码器151。
视频编码器101被配置为生成编码视频信号。视频解码器151被配置为对编码视频信号进行解码,以重构视频的图片。
权利要求1至15要求保护本发明的第一方面。
权利要求16至30要求保护本发明的第二方面。
权利要求31至45要求保护本发明的第三方面。
权利要求46至58要求保护本发明的第四方面。
权利要求59至71要求保护本发明的第五方面。
权利要求72至90要求保护本发明的第六方面。
在下文中,现在详细描述本发明的第一方面。
具体地,第一方面涉及运动矢量环绕。
当使用诸如广泛部署的ERP格式(ERP=等量矩形投影)之类的某些投影格式对全向内容进行编码时,所投影的图片的左右边界上的样本在重新投影之后在3d空间中实际上是相邻的。为了在当前技术的视频编码中利用该特性并防止视觉伪影,当基于运动补偿块的帧间预测到达图片边界外部时,调整对左右图片边界上的图像样本值进行外推的典型过程。
代替通过图片的左侧和右侧上的最后一个像素列的垂直外推来创建传统的边界填充样本值,在参考样本位置的导出中使用如下裁剪操作,这导致运动矢量和参考块将围绕所定义的样本列环绕:
xInti=sps_ref_wraparound_enabled_flag?ClipH(sps_ref_wraparound_offset,picW,(xIntL+i-3)):Clip3(0,picW-1,xIntL+i-3)
yInti=Clip3(0,picH-1,yIntL+i-3)
其中ClipH(o,W,x)被定义为:
mod(x,o);对于x<0
mod((x-W),o)+W-o;对于x>W-1,或者
X;其他
Clip3在[1]中被定义为:
Figure BDA0003347084190000091
当这种内容进一步例如基于使用图块的OMAF视口相关配置文件(OMAF=全向媒体格式)用于全向视频服务时,问题出现。在这种服务中,ERP内容版本的低分辨率变体通常与完整内容的其他高分辨率分段混合,以创建视口相关流。将高分辨率全场景的分段和内容的低分辨率变体布置到矩形视频帧上的必要性可以导致低分辨率ERP内容的旋转,由此编码无法利用上述特性来避免视觉伪影。例如,在图4中,展示了两个布置,其特征为低分辨率ERP概览和高分辨率图块。可以看出,ERP图块或者旋转,或者与右侧的图块相邻。
因此,图4中所示的两个图块布置对MV环绕提出了当前技术的设计无法满足的要求。
图4示出了根据实施例的具有概览的视口相关图块布置。
根据该方面,MV环绕可以例如以以下方式适配以允许上述图块布置。在一个实施例中,使用信令sps_ref_wraparound_idc来区分MV环绕选项,以如下处理如图4的左侧中的旋转:
Figure BDA0003347084190000101
在另一实施例中,环绕区域被定义为覆盖图4的右侧上描绘的场景。
在下文中,现在详细描述本发明的第二方面。
具体地,第二方面涉及仿射预测运行时间成本。
当前技术的视频编解码器通常旨在覆盖广泛的应用、用例和场景。例如,诸如HEVC之类的编解码器包括针对流传输、广播、实时对话或监控服务的技术。这些服务中的每一个通常以取决于服务约束的不同分辨率工作:广播通常使用比对话更高的分辨率,等等。虽然编解码器包括的众多单独工具被调谐以适合该广泛的关联要求,但在每个单独的操作点处可能存在效率损失或增加的复杂度。
例如,视频编码传统上采用仅平移的运动模型,即矩形块根据二维运动矢量移位,以形成当前块的运动补偿预测子。这样的模型不能表达在许多视频序列中常见的旋转或缩放运动,因此,已经在努力稍微扩展传统的平移运动模型,例如被称为JEM中的仿射运动(JEM=联合探索模型)。如图5所示,在该仿射运动模型中,每块的两个(或三个)所谓的控制点运动矢量(v0,v1,…)用于模型化旋转和缩放运动。从相邻块的MV候选中选择控制点运动矢量。经由计算基于子块的运动矢量场并依赖于矩形子块的传统平移运动补偿,导出所得运动补偿预测子。
图5示出了通过子块分割的仿射运动。具体地,图5示例性地示出了用于右上子块(红色实线)的所得子块参考或预测子(红色虚线)。
虽然取决于控制点运动矢量,图5表示更简单或更不简单的旋转运动,但是可以发生各个子块参考跨越图片中的宽距离,例如在表示缩放运动时。在这种情况下,所得子块参考可以例如如图6所示定位,示例性地用导致2x2子块的较小块大小示出。
具体地,图6示出了具有仿射预测的缩放运动。
在这种情况下,解码器需要从由完整当前块覆盖的更大总图片区域中提取各个子块参考。为了成本效益高地实现这种仿射预测模式,需要在当前可用的硬件上协调各个子块参考的提取。这种协调例如可以是包括所有子块参考的连续参考图片区域的联合提取。因此,由于排除了有效的参考提取策略,因此在解码器侧上实现极端的缩放运动可能是昂贵的。
为了在不牺牲仿射预测模式的实质编码增益的情况下限制最坏情况的参考图片访问,在当前技术中提出了限制预测块在参考图片中的扩展的方法。
根据该方面,例如可以取决于所允许的最大存储器带宽来导出这样的限制。这可以在整体最大存储器带宽方面(例如使用级别限制的规范)来指定,近似地限制存储器带宽开销(定义所需的参考存储器访问相对于惯常平移预测的最大增加)或者由编码器在高级别参数中显式地以信号通知。这些方法可能混合。
在一个实施例中,通过保证围绕所得子块参考块的边界框不超过阈值来强制执行对参考子块扩展的限制。这样的阈值可以从块大小、图片分辨率、最大允许带宽中导出或在高级别参数中显式地以信号通知。
在另一实施例中,对参考子块扩展的限制取决于编码图片分辨率或由级别限制定义。
在下文中,现在详细描述本发明的第三方面。
具体地,第三方面涉及仿射预测色度处理。
上述仿射预测模型的编码效率与子块大小成反比,因为较小的子块允许使用潜在的基于平移块的运动模型更好地近似仿射运动。然而,细粒度的参考图片访问伴随着显著的运行时间费用。
当视频的亮度和色度分量不均匀采样时,例如在主要的消费者视频格式4:2:0中,预测/参考块通常以相同的比率进行采样。例如,当通过传统方法(例如基于平移运动补偿块的预测)预测16x16亮度块时,使用相同的亮度块运动矢量来预测8x8的相应色度块。
在上述仿射预测模型的上下文中,由于亮度子块已经非常细粒度或已经很小,用于处理色度块的当前技术的解决方案使色度处理基于相同的亮度块大小,而不管格式子采样。因此,仿射预测中的亮度通道中的4x4子块导致色度通道中的4x4子块,由此色度通道中的数量少于亮度通道中的数量,如图7所示。
图7示出了用于不同通道中的仿射预测的子块分割。
因此,需要导出用于对应色度块的运动信息的方式。存在不同风格的解决方案。例如,最简单的当前技术的解决方案对所有四个对应亮度子块的运动信息mvLX[]进行平均,例如如下所示:
mvAvgLX=(mvLX[(xSbIdx>>1<<1)][(ySbIdx>>1<<1)]+mvLX[(xSbIdx>>1<<1)+1][(ySbIdx>>1<<1)]+mvLX[(xSbIdx>>1<<1)][(ySbIdx>>1<<1)+1]+mvLX[(xSbIdx>>1<<1)+1][(ySbIdx>>1<<1)+1]+2)>>2
另一选项是仅对对应的左上和右下亮度运动矢量进行平均,如下:
mvAvgLX=(mvLX[(xSbIdx>>1<<1)][(ySbIdx>>1<<1)]+mvLX[(xSbIdx>>1<<1)+1][(ySbIdx>>1<<1)+1]+1)>>1
此外,可以如下引入对称舍入:
mvAvgLX=(mvLX[(xSbIdx>>1<<1)][(ySbIdx>>1<<1)]+mvLX[(xSbIdx>>1<<1)+1][(ySbIdx>>1<<1)+1])
mvAvgLX[0]=(mvAvgLX[0]>=0?(mvAvgLX[0]+1)>>1:-((-mvAvgLX[0]+1)>>1))
mvAvgLX[1]=(mvAvgLX[1]>=0?(mvAvgLX[1]+1)>>1:-((-mvAvgLX[1]+1)>>1))
然而,当使用不同于4:2:0的色度格式(其中需要超出上述当前技术风格的其他平均方案)时,问题出现。例如,当使用4:4:4色度格式时,应避免平均,因为每个4x4色度子块恰好与一个4x4亮度子块相对应,而4:2:2色度格式仅需要在一个维度上进行平均。因此,根据该方面,通过将色度子采样率引入mvAvgLX的导出中,来导出平均操作所涉及的正确亮度块。在一个实施例中,导出被实现如下:
mvAvgLX=(mvLX[(xSbIdx>>SubWidthC<<SubWidthC)]
[(ySbIdx>>SubHeightC<<SubHeightC)]+mvLX[(xSbIdx>>SubWidthC<<SubWidthC)+SubWidthC]
[(ySbIdx>>SubHeightC<<SubHeightC)+SubHeightC])
mvAvgLX[0]=(mvAvgLX[0]>=0?(mvAvgLX[0]+1)>>1:-((-mvAvgLX[0]+1)>>1))
mvAvgLX[1]=(mvAvgLX[1]>=0?(mvAvgLX[1]+1)>>1:-((-mvAvgLX[1]+1)>>1))
其中从所应用的色度格式中导出SubWidthC和SubHeightC,如下所示:
色度格式 SubWidthC SubHeightC
4:2:0 1 1
4:2:2 1 0
4:4:4 0 0
在下文中,现在详细描述本发明的第四方面。
具体地,第四方面涉及插值滤波器开销。
经运动补偿的帧间预测可以使用子样本位置(例如半像素、四分之一像素)处的样本值,子样本位置处的样本值通过卷积滤波器从整数样本位置处的样本值进行插值。当前技术的编解码器一般使用固定抽头的滤波器核,例如8抽头来生成这些子像素样本值。
然而,当基于子块的帧间预测,例如仿射预测或DMVR(解码器侧运动矢量细化)导致相对小的亮度和色度子块(例如4x4大小)时,发生存储器带宽问题。随着(子)块大小相对于固定插值滤波器大小减小,在用于(子)块的所生成的参考亮度子像素样本的所访问的样本总数方面的开销增加。因此,已经提出使用相对较短的抽头滤波器核对小子块(例如4x4)进行子像素插值,其示出了随着内容分辨率增加而降低的最小编码惩罚。
根据该方面,取决于编码内容的分辨率而适配用于子像素插值的较短抽头插值滤波器的选择,以便针对高分辨率内容,从峰值存储器带宽减少方面的增益中受益,而不牺牲较低分辨率内容的编码效率。
在一个实施例中,若干子像素插值滤波器可用(例如双线性、4抽头、6抽头、8抽头),并且内容分辨率和块大小用于确定适用的滤波器。
需要在编码器或解码器中实现并保持随时可用的单独滤波器的量每次增加使实现更加昂贵。因此,减少要在编码器或解码器中并行实现的单独滤波器的量是有利的。
例如,当前技术是视频信号的色度分量使用空间子采样,例如在使用4:2:0色度格式时。在这种情况下,色度分量通常也使用比亮度分量更短的抽头子像素插值滤波器。因此,除了用于亮度分量的传统较长抽头子像素插值滤波器核之外,解码器/编码器实现还需要准备好这种较短抽头子像素插值滤波器。在实施例中,在子块处理需要减少的抽头滤波器以减少峰值存储器带宽的情况下,引入了对较短抽头子像素插值滤波器的重用,例如取决于编码图片大小或通过编码器选择和比特流指示。
在下文中,现在详细描述本发明的第五方面。
具体地,第五方面涉及比特流属性描述和配置文件集操作。
通常,视频流伴随有描述其特性且允许识别视频解码器所需的能力类型的信令,使得可以对比特流进行解码。
当前技术的视频编码标准,例如AVC(高级视频编码)、HEVC,将配置文件和级别指示包括在比特流中的参数集中,允许识别需要支持哪些工具以及例如视频编码序列的分辨率限制,使得可以容易地识别解码器是否可以对视频序列进行解码。
在配置文件方面,可以识别仅支持帧内编码工具或帧内及帧间工具、但是仅8比特配置或10比特配置、分层或不分层编码等的配置文件。
在级别(更多地与比特率、分辨率和/或帧速率相关)方面,可以区分1080p@30Hz、4Kp@30Hz、4Kp@60Hz、8Kp@30Hz等。
该信息通常在视频流传输系统中使用以用于能力交换,使得特性被暴露并且不同的接收机可以将其能力与对所提供的比特流进行解码的要求进行匹配。
例如,在DASH(HTTP上的动态自适应流传输)中,媒体呈现描述(MPD)可以包括针对相同内容使用对应不同参数提供的若干视频。这是通过在称为@codec=“xxx”的属性中指示来完成的,其中指示了编解码器、配置文件、级别等。类似地,在RTP流传输(RTP=实时传输协议)中,存在会话描述协议(SDP),通过该协议对会话的操作点进行协商。然后,会话中涉及的各方就应当使用哪个编解码器、配置文件和级别建立会话达成一致。此外,在传输流MPEG2-TS(MPEG=运动图像专家组;TS=传输流)(在广播传输中大量使用)中,存在将该值暴露给终端设备的手段。这是通过将对应的视频描述符包括在节目表中来完成的,该视频描述符识别节目(即例如TV通道)的编解码器、配置文件和级别,因此可以选取可由终端设备解码的适当通道。
当前,包括在比特流中的属性仅应用于编码视频序列(CVS)。CVS以第一个IRAP(帧内随机访问点)开始,并且以具有以下属性之一的IRAP结束:
·它是IDR(瞬时解码器刷新)
·它是BLA(断链访问)(仅与HEVC相关)
·它具有序列结束(EOS)SEI消息(SEI=补充增强信息)。
在大多数视频服务中,“会话”可以包括若干时间上连续的CVS,因此针对AVC和HEVC在参数集中指示的参数是不够的,因为它们仅描述“会话”中涉及的所有CVS中的第一个CVS。该问题已在MPEG2-TS中通过以下文本解决:
“注意——在AVC视频流中的一个或多个序列中,级别可以低于AVC视频描述符中以信号通知的级别,同时也可以出现作为AVC视频描述符中以信号通知的配置文件的子集的配置文件。然而,在整个AVC视频流中,仅应使用包括在AVC视频描述符中以信号通知的配置文件中的工具(如果存在)。例如,如果以信号通知主配置文件,则可以在一些序列中使用基线配置文件,但是仅使用主配置文件中的那些工具。如果AVC视频流中的序列参数集以信号通知不同的配置文件,并且没有以信号通知附加的约束,则该流可能需要检查以确定整个流符合哪个配置文件(如果有)。如果AVC视频描述符要与不符合单个配置文件的AVC视频流相关联,则必须将AVC视频流划分为两个或更多个子流,使得AVC视频描述符可以针对每个这种子流以信号通知单个配置文件。”
换言之,描述符中指示的配置文件和级别是作为在AVC视频流的CVS中使用的任何配置文件的超集的配置文件,并且该级别是任何CVS的最高级别。
以类似的方式,MPD(媒体呈现描述)或SDP中指示的配置文件和级别可以比视频比特流中的配置文件和级别“更高”(意味着配置文件超集,或者比每个CVS的配置文件需要的工具多)。
将期望比特流自身包括这种信令,使得从一开始就清楚哪个是对视频“会话”的所有CVS进行解码所需的工具集合。(这里,术语视频会话例如也包括TV通道节目)。信令由适用于若干CVS(即适用于比特流)的参数集组成。
存在两种特别感兴趣的情况:
·具有配置文件的CVS,其中不存在同时是两个CVS的超集的配置文件。
·可能相对于层的数量而随时间改变的CVS。
一个选项将是使用每个工具标志来以信号通知对所有CVS进行解码所需的所有工具,但这将导致不期望的解决方案,因为基于配置文件工作通常更方便,与可以导致极其高数量的组合的多个工具相比,基于配置文件工作更简单。
比特流内多于一个配置文件活动可以导致以下四种情况。对比特流进行解码所需的工具与以下相对应:
·两个配置文件的交集,其中不存在与该交集相对应的配置文件。
·两个配置文件的交集,其中一个配置文件是两个配置文件的交集。
·两个配置文件的并集,其中不存在与交集相对应的配置文件。
·两个配置文件的并集,其中存在与交集相对应的配置文件。
对于存在与所有所需工具相对应的配置文件的情况,单个配置文件指示将足够。
然而,对于不存在配置文件来描述所有必要工具的情况,应当以信号通知多于一个配置文件,并且应当以信号通知交集或并集,以指示是支持单个配置文件足以对比特流(交集)进行解码,还是需要支持两个配置文件以对比特流进行解码。
在下文中,现在详细描述本发明的第六方面。
具体地,第六方面涉及缓冲周期SEI和图片定时SEI消息解析相关性
在如HEVC的现有设计中,缓冲周期SEI消息(SEI=补充增强信息)、图片定时SEI消息和解码单元SEI消息中的语法元素取决于SPS(序列参数集)中携带的语法元素。该相关性包括用于对特定语法元素以及语法元素的存在进行编码的比特数。
然而,不期望将所有缓冲周期/图片定时/解码单元相关信息放在相同的语法位置,因为:
1)当前在SPS中的语法元素对于会话/能力协商是有用的,这通过交换参数集来完成。因此,它们不能仅在缓冲周期SEI消息中以信号通知。
2)缓冲周期SEI消息中的语法元素不能移动到SPS,因为激活新的SPS仅在IRAP图片(IRAP=帧内随机访问点)处是可能的,而缓冲周期可以从与时间子层0相关联的任何图片处开始。需要在每个缓冲周期激活新的参数集也是不期望的。
上述解析相关性导致了启动问题:在视频比特流的第一个VCL NAL单元被解析之前,不存在活动的SPS。由于SEI消息在第一个VCL NAL单元(NAL=网络抽象层)之前发送,因此它们将在SPS被激活之前到达。
此外,在参数集的带外信令中,诸如对理解比特流的HRD参数感兴趣(例如用于拼接比特流)的拼接器之类的中间设备可能无法解析相应的SEI消息,因为相关参数集没有包括在比特流中。
此外,对于简单的中间设备(例如拼接器),可能难以解析完整个SPS,直到它到达VUI中的HRD参数。
此外,NAL单元的顺序没有被明确地约束为需要SPS在参考SPS的缓冲周期SEI消息之前发送。在这种情形下,解码器可能必须以比特流格式存储相应的SEI消息(而无法解析它),直到SPS到达并被激活为止。直到那时,才可以解析SEI消息。
图8示出了用于这种情况的当前技术示例比特流顺序。
在实施例中,相应SEI消息的解析以以下方式独立于SPS进行:
以下所有语法元素被移动到缓冲周期SEI消息中:
·在相应的SEI消息中指定另一语法元素的长度,或者
·不需要用于会话/能力协商(子图片时脉除数)。
缓冲周期SEI中的所有语法元素的长度完全独立于其他语法结构。定时SEI消息和解码单元SEI消息中的语法元素的长度可以取决于缓冲周期SEI消息中的语法元素,但不取决于任何参数集值。
特定HRD参数(NAL、VCL、DU等)的存在标志、CPB参数(vui_cpb_cnt_minus1[i]和bp_cpb_cnt_minus1)的计数以及其他语法部分在参数集和缓冲周期SEI消息中重复,并且该方面包括将这些重复的语法元素的值限制为在两个位置相等。
通过将指示其他语法元素存在的所有语法元素(例如frame_field_info_present_flag)移动到相应的SEI消息中或复制它,使图片定时SEI消息和解码单元SEI消息独立。
作为该方面的一部分,为了实现比特流一致性,上述语法元素的值应当等于参数集中的相应值。
作为该方面的一部分,除非concatenation_flag等于1(即发生拼接),否则缓冲周期中的tick_devisors(指示子图片定时粒度)将具有相同值。
如已经概述的,在实施例中,提出了将HRD参数、缓冲周期、图片定时和解码单元信息SEI消息添加到VVC规范。通用语法和语义基于对应的HEVC结构。SEI消息的解析可能独立于SPS的存在。
如上所述,为了检查比特流的一致性,需要缓冲模型。VVC缓冲模型可以例如基于对在HEVC中使用的假设参考解码器(HRD)规范的一些简化。
HRD参数存在于SPS VUI中。缓冲周期SEI、图片定时SEI和解码单元信息SEI消息被添加到它们参考的访问单元中。
在HEVC中,SPS与HRD相关的SEI消息之间存在解析相关性。尽管语义仅允许参考在相同访问单元中活动的SPS,但是比特流顺序允许SEI可以在SPS之前到达的情形。在这种情况下,需要存储经编码的SEI消息,直到正确的SPS到达。
该解析相关性存在问题的另一情况是网络元素和拼接器,尤其是在带外(例如在会话协商中)交换参数集时。在这种情况下,比特流中可能根本不包括参数集,使得网络元素或拼接器根本无法对缓冲/定时信息进行解码。在识别如解码时间和帧/场信息的值时,可能仍对这些元素感兴趣。
在实施例中,提出了通过以下方式使缓冲周期、图片定时和解码单元信息SEI消息的解析独立于SPS VUI/HRD参数:
-将指示其他语法元素的长度或存在的所有语法元素从VUI移动到缓冲周期SEI消息中。#
-复制在两个位置都需要的语法元素。将这些语法元素的值约束为相同。
设计决策:
-并非所有语法元素都应从VUI移动到缓冲周期SEI,因为参数集通常被交换以用于会话协商。所以对会话协商重要的参数保持在VUI中。
-将所有缓冲周期参数移动到SPS中是不可能的,因为缓冲周期可以从非IRAP图片开始,其中激活新的SPS是不可能的。
-缓冲周期SEI与(图片定时SEI或解码单元SEI)之间的相关性不被认为是有害的,因为这些消息之间也存在逻辑相关性。
下面给出了基于HEVC语法的语法示例。
以下语法图基于HEVC语法,改变被标记为红色。语义通常移动到语法元素的新位置(适配于语法元素名称)。每当语法元素重复时,添加比特流约束:这些语法元素应具有相同的值。
VUI/HRD参数:
Figure BDA0003347084190000211
Figure BDA0003347084190000221
Figure BDA0003347084190000231
缓冲周期SEI消息:
Figure BDA0003347084190000232
Figure BDA0003347084190000241
图片定时SEI消息:
Figure BDA0003347084190000251
解码单元信息SEI消息:
Figure BDA0003347084190000261
虽然已经在装置的上下文中描述了一些方面,但是将清楚的是,这些方面还表示对应方法的描述,其中,块或设备对应于方法步骤或方法步骤的特征。类似地,在方法步骤上下文中描述的方面也表示对相应块或项或者相应装置的特征的描述。可以由(或使用)硬件设备(诸如,微处理器、可编程计算机或电子电路)来执行一些或全部方法步骤。在一些实施例中,可以由这种装置来执行最重要方法步骤中的一个或多个方法步骤。
根据某些实现要求,本发明的实施例可以用硬件或软件实现,或者至少部分用硬件实现,或至少部分用软件实现。可以使用其上存储有电子可读控制信号的数字存储介质(例如,软盘、DVD、蓝光、CD、ROM、PROM、EPROM、EEPROM或闪存)来执行实现,该电子可读控制信号与可编程计算机系统协作(或者能够与之协作)从而执行相应方法。因此,数字存储介质可以是计算机可读的。
根据本发明的一些实施例包括具有电子可读控制信号的数据载体,其能够与可编程计算机系统协作以便执行本文所述的方法之一。
通常,本发明的实施例可以实现为具有程序代码的计算机程序产品,程序代码可操作以在计算机程序产品在计算机上运行时执行方法之一。程序代码可以例如存储在机器可读载体上。
其他实施例包括存储在机器可读载体上的计算机程序,该计算机程序用于执行本文所述的方法之一。
换言之,本发明方法的实施例因此是具有程序代码的计算机程序,该程序代码用于在计算机程序在计算机上运行时执行本文所述的方法之一。
因此,本发明方法的另一实施例是其上记录有计算机程序的数据载体(或者数字存储介质或计算机可读介质),该计算机程序用于执行本文所述的方法之一。数据载体、数字存储介质或记录的介质通常是有形的和/或非暂时性的。
因此,本发明方法的另一实施例是表示计算机程序的数据流或信号序列,所述计算机程序用于执行本文所述的方法之一。数据流或信号序列可以例如被配置为经由数据通信连接(例如,经由互联网)传送。
另一实施例包括处理装置,例如,计算机或可编程逻辑器件,所述处理装置被配置为或适于执行本文所述的方法之一。
另一实施例包括其上安装有计算机程序的计算机,该计算机程序用于执行本文所述的方法之一。
根据本发明的另一实施例包括被配置为向接收机(例如,以电子方式或以光学方式)传送计算机程序的装置或系统,该计算机程序用于执行本文所述的方法之一。接收机可以是例如计算机、移动设备、存储设备等。装置或系统可以例如包括用于向接收机传送计算机程序的文件服务器。
在一些实施例中,可编程逻辑器件(例如,现场可编程门阵列)可以用于执行本文所述的方法的功能中的一些或全部。在一些实施例中,现场可编程门阵列可以与微处理器协作以执行本文所述的方法之一。通常,方法优选地由任意硬件装置来执行。
本文描述的装置可以使用硬件装置、或者使用计算机、或者使用硬件装置和计算机的组合来实现。
本文描述的方法可以使用硬件装置、或者使用计算机、或者使用硬件装置和计算机的组合来执行。
上述实施例对于本发明的原理仅是说明性的。应当理解的是,本文所述的布置和细节的修改和变形对于本领域其他技术人员将是显而易见的。因此,旨在仅由所附专利权利要求的范围来限制而不是由借助对本文的实施例的描述和解释所给出的具体细节来限制。
参考文献
[1]ISO/IEC,ITU-T.High efficiency video coding.ITU-T RecommendationH.265|ISO/IEC 23008 10(HEVC),第1版,2013;第2版,2014。

Claims (90)

1.一种视频解码器(151),用于对包括编码图片数据的编码视频信号进行解码,以重构视频的多个图片,其中,所述视频解码器(151)包括:
输入接口(160),被配置用于接收所述编码视频信号,以及
数据解码器(170),被配置用于通过对所述编码图片数据进行解码,来重构所述视频的多个图片,
其中,所述数据解码器(170)被配置为取决于所述多个图片中的当前图片,来确定所述多个图片中的后续图片的重构样本,其中,所述数据解码器(170)被配置为确定参考样本在所述当前图片内的参考位置,
其中,所述数据解码器(170)被配置为对编码在所述编码视频信号内的环绕参数的值进行解码,
其中,所述数据解码器(170)被配置为取决于所述重构样本的位置、取决于运动矢量、并且取决于所述环绕参数的值,来确定所述参考样本的参考位置,
其中,所述数据解码器(170)被配置为取决于位于所述参考位置的所述参考样本,来确定所述后续图片的重构样本。
2.根据权利要求1所述的视频解码器(151),
其中,所述当前图片具有位于下限x值处的第一垂直边界,其中,当前样本具有位于上限x值处的第二垂直边界,所述上限x值大于所述下限x值,
其中,所述当前图片具有位于下限y值处的第一水平边界,其中,所述当前样本具有位于上限y值处的第二水平边界,所述上限y值大于所述下限y值,并且
其中,所述数据解码器(170)被配置为取决于所述下限x值、所述上限x值、所述下限y值和所述上限y值中的至少一个,来确定所述参考位置。
3.根据权利要求2所述的视频解码器(151),
其中,所述参考位置具有x值和y值,
其中,所述数据解码器(170)被配置为取决于要确定的重构样本的位置并且取决于所述运动矢量,来确定具有x值和y值的中间位置,
其中,如果所述中间位置的x值小于所述下限x值或大于所述上限x值,则所述数据解码器(170)被配置为取决于所述中间位置的x值并且取决于所述环绕参数的值,来确定所述参考位置,使得所述参考位置的x值大于或等于所述下限x值,并且使得所述参考位置的x值小于或等于所述上限x值,并且
其中,如果所述中间位置的y值小于所述下限y值或大于所述上限y值,则所述数据解码器(170)被配置为取决于所述中间位置的y值并且取决于所述环绕参数的值,来确定所述参考位置,使得所述参考位置的y值大于或等于所述下限y值,并且使得所述参考位置的y值小于或等于所述上限y值。
4.根据权利要求3所述的视频解码器(151),
其中,如果所述中间位置的x值大于或等于所述下限x值,并且如果所述中间位置的x值小于或等于所述上限x值,则所述数据解码器(170)被配置为确定所述参考位置,使得所述参考位置的x值等于所述中间位置的x值,
其中,如果所述中间位置的y值大于或等于所述下限y值,并且如果所述中间位置的y值小于或等于所述上限y值,则所述数据解码器(170)被配置为确定所述参考位置,使得所述参考位置的y值等于所述中间位置的y值。
5.根据权利要求3或4所述的视频解码器(151),
其中,如果所述环绕参数具有第一值,并且如果所述中间位置的y值小于所述下限y值,则所述数据解码器(170)被配置为确定所述参考位置,使得所述参考位置的y值等于所述下限y值,
其中,如果所述环绕参数具有所述第一值,并且如果所述中间位置的y值大于所述上限y值,则所述数据解码器(170)被配置为确定所述参考位置,使得所述参考位置的y值等于所述上限y值,并且
其中,如果所述环绕参数具有第二值,并且如果所述中间位置的y值小于所述下限y值或大于所述上限y值,则所述数据解码器(170)被配置为确定所述参考位置,使得所述参考位置的y值大于所述下限y值且小于所述上限y值。
6.根据权利要求5所述的视频解码器(151),
其中,如果所述环绕参数具有第三值,并且如果所述中间位置的y值小于所述下限y值或大于所述上限y值,则所述数据解码器(170)被配置为确定所述参考位置,使得所述参考位置的y值大于所述下限y值且小于所述上限y值,
其中,如果所述环绕参数具有所述第二值,并且如果所述中间位置的x值小于所述下限x值,则所述数据解码器(170)被配置为确定所述参考位置,使得所述参考位置的x值等于所述下限x值,
其中,如果所述环绕参数具有所述第二值,并且如果所述中间位置的x值大于所述上限x值,则所述数据解码器(170)被配置为确定所述参考位置,使得所述参考位置的x值等于所述上限x值,并且
其中,如果所述环绕参数具有所述第一值或所述第三值,并且如果所述中间位置的x值小于所述下限x值或大于所述上限x值,则所述数据解码器(170)被配置为确定所述参考位置,使得所述参考位置的x值大于所述下限x值且小于所述上限x值。
7.根据权利要求6所述的视频解码器(151),
其中,如果所述环绕参数具有所述第一值或所述第三值,并且如果所述中间位置的x值小于所述下限x值或大于所述上限x值,则所述数据解码器(170)被配置为取决于第一偏移参数来确定所述参考位置,并且
其中,如果所述环绕参数具有所述第二值或所述第三值,并且如果所述中间位置的y值小于所述下限y值或大于所述上限y值,则所述数据解码器(170)被配置为取决于第二偏移参数来确定所述参考位置。
8.根据权利要求7所述的视频解码器(151),
其中,所述数据解码器(170)被配置为基于以下来确定所述参考位置:
Figure FDA0003347084180000041
其中,sps_ref_wraparound_idc指示所述环绕参数,其中0是所述环绕参数的第一值,1是所述环绕参数的第二值,并且2是所述环绕参数的第三值,
其中,xInti指示所述参考位置的x值,其中,yInti指示所述参考位置的y值,
其中,xIntL指示所述中间位置的x值,其中,yIntL指示所述中间位置的y值,
其中,picW-1指示所述上限x值,0指示所述下限x值,
其中,picH-1指示所述上限y值,0指示所述下限y值,
其中,sps_ref_wraparound_offset指示所述第一偏移参数,
其中,sps_ref_wraparound_offset_second指示所述第二偏移参数,
其中,
ClipH(o,W,x)被定义为:
mod(x,o);对于x<0
mod((x-W),o)+W-o;对于x>W-1,或者
X;其他
其中,mod是模运算。
9.一种视频编码器(101),用于通过生成编码视频信号来对视频的多个图片进行编码,其中,所述多个图片中的每个图片包括原始图片数据,其中,所述视频编码器(101)包括:
数据编码器(110),被配置用于生成包括编码图片数据的编码视频信号,其中,所述数据编码器(110)被配置为将所述视频的多个图片编码为所述编码图片数据,以及
输出接口(120),被配置用于输出所述多个图片中的每个图片的编码图片数据,
其中,所述数据编码器(110)被配置为生成包括对运动矢量的编码和对环绕参数的值的编码的编码视频信号。
10.根据权利要求9所述的视频编码器(101),
其中,数据解码器(170)被配置为生成包括对第一偏移参数和/或第二偏移参数的编码的编码视频信号,使得解码器能够取决于所述第一偏移参数和/或所述第二偏移参数,来确定参考样本在当前图片内的参考位置。
11.一种用于解码的方法,用于对包括编码图片数据的编码视频信号进行解码,以重构视频的多个图片,其中,所述用于解码的方法包括:
接收所述编码视频信号,以及
通过对所述编码图片数据进行解码,来重构所述视频的多个图片,
其中,重构所述多个图片包括对编码在所述编码视频信号内的环绕参数的值进行解码,
其中,重构所述多个图片包括取决于所述多个图片中的当前图片,来确定所述多个图片中的后续图片的重构样本,其中,所述方法包括确定参考样本在所述当前图片内的参考位置,其中,取决于所述重构样本的位置、取决于运动矢量、并且取决于所述环绕参数的值,来进行对所述参考样本的参考位置的确定,并且
其中,取决于位于所述参考位置的所述参考样本,来进行对后续图片的重构样本的确定。
12.一种用于通过生成编码视频信号来对视频的多个图片进行编码的方法,其中,所述多个图片中的每个图片包括原始图片数据,其中,所述方法包括:
生成包括编码图片数据的编码视频信号,其中,生成编码视频信号包括将所述视频的多个图片编码为所述编码图片数据,以及
输出所述多个图片中的每个图片的编码图片数据,
其中,进行所述编码视频信号的生成,使得所述编码视频信号包括对运动矢量的编码和对环绕参数的值的编码。
13.一种计算机程序,用于当在计算机或信号处理器上执行时实现根据权利要求11或12所述的方法。
14.一种编码图片的编码视频信号,其中,所述编码视频信号包括编码所述图片的编码图片数据,
其中,所述编码视频信号包括对运动矢量的编码和对环绕参数的值的编码,使得解码器能够取决于重构样本在多个图片中的后续图片内的位置、取决于所述运动矢量、并且取决于所述环绕参数的值,来确定参考样本在所述多个图片中的当前图片内的参考位置。
15.一种系统,包括:
根据权利要求9或10所述的视频编码器(101),以及
根据权利要求1至8中的一项所述的视频解码器(151),
其中,所述视频编码器(101)被配置为生成编码视频信号,并且
其中,所述视频解码器(151)被配置为对所述编码视频信号进行解码,以重构视频的图片。
16.一种视频编码器(101),用于通过生成编码视频信号来对视频的多个图片进行编码,其中,所述多个图片中的每个图片包括原始图片数据,其中,所述视频编码器(101)包括:
数据编码器(110),被配置用于生成包括编码图片数据的编码视频信号,其中,所述数据编码器(110)被配置为将所述视频的多个图片编码为所述编码图片数据,以及
输出接口(120),被配置用于输出所述多个图片中的每个图片的编码图片数据,
其中,所述数据编码器(110)被配置为通过取决于所允许的最大参考图片存储器带宽或者取决于所允许的围绕所得参考子块的最大边界框或者取决于参考子块扩展的限制对限制信息进行编码,来生成所述编码视频信号。
17.根据权利要求16所述的视频编码器(101),
其中,所述数据编码器(110)被配置为对所述限制信息进行编码,所述限制信息包括:通过定义所需参考存储器访问相对于惯常平移预测的最大增加来对最大带宽开销进行限制的指示。
18.根据权利要求16或17所述的视频编码器(101),
其中,所述数据编码器(110)被配置为对所述限制信息进行编码,所述限制信息包括围绕子块参考块的边界框的大小的阈值。
19.根据权利要求18所述的视频编码器(101),
其中,所述阈值取决于图片分辨率和/或最大允许带宽。
20.根据权利要求16至19中的一项所述的视频编码器(101),
其中,所述数据编码器(110)被配置为对所述限制信息进行编码,所述限制信息包括对参考子块扩展的限制。
21.一种视频解码器(151),用于对包括编码图片数据的编码视频信号进行解码,以重构视频的多个图片,其中,所述视频解码器(151)包括:
输入接口(160),被配置用于接收所述编码视频信号,以及
数据解码器(170),被配置用于通过对所述编码图片数据进行解码,来重构所述视频的多个图片,
其中,所述数据解码器(170)被配置为从所述编码视频信号中解码限制信息,所述限制信息取决于所允许的最大存储器带宽或者取决于所允许的围绕所得参考子块的最大边界框或者取决于参考子块扩展的限制,并且
其中,所述数据解码器(170)被配置为取决于所述限制信息,来重构所述视频的多个图片。
22.根据权利要求21所述的视频解码器(151),
其中,所述数据解码器(170)被配置为从所述编码视频信号中解码所述限制信息,所述限制信息包括:通过定义所需参考存储器访问相对于惯常平移预测的最大增加来对最大带宽开销进行限制的指示。
23.根据权利要求21或22所述的视频解码器(151),
其中,所述数据解码器(170)被配置为从所述编码视频信号中解码所述限制信息,所述限制信息包括围绕子块参考块的边界框的大小的阈值。
24.根据权利要求23所述的视频解码器(151),
其中,所述阈值取决于图片分辨率和/或最大允许带宽。
25.根据权利要求21至24中的一项所述的视频解码器(151),
其中,所述数据解码器(170)被配置为从所述编码视频信号中解码所述限制信息,所述限制信息包括对参考子块扩展的限制,所述对参考子块扩展的限制取决于编码图片分辨率或者取决于级别限制。
26.一种用于通过生成编码视频信号来对视频的多个图片进行编码的方法,其中,所述多个图片中的每个图片包括原始图片数据,其中,所述方法包括:
生成包括编码图片数据的编码视频信号,其中,生成编码视频信号包括将所述视频的多个图片编码为所述编码图片数据,以及
输出所述多个图片中的每个图片的编码图片数据,
其中,生成编码视频信号包括:取决于所允许的最大存储器带宽或者取决于所允许的围绕所得参考子块的最大边界框或者取决于参考子块扩展的限制,对限制信息进行编码。
27.一种用于对包括编码图片数据的编码视频信号进行解码以重构视频的多个图片的方法,其中,所述方法包括:
接收所述编码视频信号,以及
通过对所述编码图片数据进行解码,来重构所述视频的多个图片,
其中,所述方法还包括从所述编码视频信号中解码限制信息,所述限制信息取决于所允许的最大存储器带宽或者取决于所允许的围绕所得参考子块的最大边界框或者取决于参考子块扩展的限制,并且
其中,取决于所述限制信息来进行所述视频的多个图片的重构。
28.一种计算机程序,用于当在计算机或信号处理器上执行时实现根据权利要求26或27所述的方法。
29.一种编码图片的编码视频信号,其中,所述编码视频信号包括编码所述图片的编码图片数据,
其中,所述编码视频信号包括限制信息,所述限制信息取决于所允许的最大存储器带宽或者取决于所允许的围绕所得参考子块的最大边界框或者取决于参考子块扩展的限制。
30.一种系统,包括:
根据权利要求16或20所述的视频编码器(101),以及
根据权利要求21至25中的一项所述的视频解码器(151),
其中,所述视频编码器(101)被配置为生成编码视频信号,并且
其中,所述视频解码器(151)被配置为对所述编码视频信号进行解码,以重构视频的图片。
31.一种视频解码器(151),用于对包括编码图片数据的编码视频信号进行解码,以重构视频的多个图片,其中,所述视频解码器(151)包括:
输入接口(160),被配置用于接收所述编码视频信号,以及
数据解码器(170),被配置用于通过对所述编码图片数据进行解码,来重构所述视频的多个图片,
其中,所述数据解码器(170)被配置为对编码在所述编码视频信号内的色度格式信息进行解码,
其中,所述数据解码器(170)被配置为取决于所述色度格式信息,根据多个亮度子块中的一个或多个亮度子块的运动信息,来确定多个色度子块中的色度子块的运动信息,
其中,所述数据解码器(170)被配置为取决于亮度子块中的所述一个或多个亮度子块的运动信息并且取决于所述色度子块的运动信息,来重构所述多个图片。
32.根据权利要求31所述的视频解码器(151),
其中,所述数据解码器(170)被配置为将所述色度子块的运动矢量确定为所述色度子块的运动信息,
其中,如果所述色度格式信息指示第一格式,则所述数据解码器(170)被配置为取决于亮度子块中的恰好一个亮度子块的运动矢量,来确定所述色度子块的运动矢量,并且
其中,如果所述色度格式信息指示不同于所述第一格式的格式,则所述数据解码器(170)被配置为取决于亮度子块中的至少两个亮度子块的各自的运动矢量,来确定所述色度子块的运动矢量。
33.根据权利要求32所述的视频解码器(151),
其中,如果所述色度格式信息指示不同于所述第一格式的第二格式,则所述数据解码器(170)被配置为取决于亮度子块中的恰好两个亮度子块的各自的运动矢量,来确定所述色度子块的运动矢量。
34.根据权利要求33所述的视频解码器(151),
其中,如果所述色度格式信息指示所述第二格式,则所述数据解码器(170)被配置为通过对亮度子块中的所述恰好两个亮度子块的运动矢量进行平均,或者通过对亮度子块中的所述恰好两个亮度子块的运动矢量进行对称舍入,来确定所述色度子块的运动矢量。
35.根据权利要求33或34所述的视频解码器(151),
其中,亮度块包括至少四个亮度子块,其中,所述亮度块的两行或更多行中的每一行包括所述至少四个亮度子块中的至少两个亮度子块,其中,所述亮度块的两列或更多列中的每一列包括所述至少四个亮度子块中的两个或更多个亮度子块,
其中,如果所述色度格式信息指示所述第二格式,则所述数据解码器(170)被配置为取决于所述至少四个亮度子块中的所述恰好两个亮度子块,来确定所述色度子块的运动矢量。
36.根据权利要求35所述的视频解码器(151),
其中,所述两行或更多行中的第一行包括左上亮度子块,其中,所述两行或更多行中的第二行包括右下亮度子块,其中,所述左上亮度子块和所述右下亮度子块相对于彼此对角布置,并且
其中,如果所述色度格式信息指示所述第二格式,则所述数据解码器(170)被配置为取决于所述左上亮度子块的运动矢量并且取决于所述右下亮度子块的运动矢量,来确定所述色度子块的运动矢量。
37.根据权利要求35或36所述的视频解码器(151),
其中,如果所述色度格式信息指示第三格式,则所述数据解码器(170)被配置为取决于来自所述亮度块的所述两行或更多行中的恰好一行的亮度子块中的恰好两个亮度子块的各自的运动矢量,来确定所述色度子块的运动矢量;或者所述数据解码器(170)被配置为取决于来自所述亮度块的所述两列或更多列中的恰好一列的亮度子块中的恰好两个亮度子块的各自的运动矢量,来确定所述色度子块的运动矢量,所述第三格式不同于所述第一格式且不同于所述第二格式。
38.根据权利要求35至27中的一项所述的视频解码器(151)
其中,如果所述色度格式信息指示所述第三格式,则所述数据解码器(170)被配置为取决于来自所述亮度块的所述两行或更多行中的恰好一行的亮度子块中的恰好两个亮度子块的各自的运动矢量,来确定所述色度子块的运动矢量;并且
其中,如果所述色度格式信息指示第四格式,则所述数据解码器(170)被配置为取决于来自所述亮度块的两列或更多列中的恰好一列的亮度子块中的恰好两个亮度子块的各自的运动矢量,来确定所述色度子块的运动矢量,所述第四格式不同于所述第三格式且不同于所述第一格式且不同于所述第一格式。
39.根据权利要求38所述的视频解码器(151),
其中,所述数据解码器(170)被配置为基于以下来确定所述色度子块的运动矢量:
mvAvgLX=(mvLX[(xSbIdx>>SubWidthC<<SubWidthC)]
[(ySbIdx>>SubHeightC<<SubHeightC)]+mvLX[(xSbIdx>>SubWidthC<<SubWidthC)+SubWidthC]
[(ySbIdx>>SubHeightC<<SubHeightC)+SubHeightC])
其中,mvAvgLX是所述色度子块的运动矢量,
其中,mvLX[][]是亮度子块中的一个亮度子块的运动矢量,
其中,xSbIdx是亮度子块中的所述一个亮度子块的x索引,
其中,ySbIdx是亮度子块中的所述一个亮度子块的y索引,
其中,mvAvgLX[0]根据以下定义:
mvAvgLX[0]=(mvAvgLX[0]>=0?
(mvAvgLX[0]+1)>>1:
-((-mvAvgLX[0]+1)>>1))
其中,mvAvgLX[1]根据以下定义:
mvAvgLX[1]=(mvAvgLX[1]>=0?
(mvAvgLX[1]+1)>>1:
-((-mvAvgLX[1]+1)>>1))
其中,SubWidthC和SubHeightC根据以下定义:
色度格式 SubWidthC SubHeightC 4:2:0 1 1 4:2:2 1 0 4:4:4 0 0
40.一种视频编码器(101),用于通过生成编码视频信号来对视频的多个图片进行编码,其中,所述多个图片中的每个图片包括原始图片数据,其中,所述视频编码器(101)包括:
数据编码器(110),被配置用于生成包括编码图片数据的编码视频信号,其中,所述数据编码器(110)被配置为将所述视频的多个图片编码为所述编码图片数据,以及
输出接口(120),被配置用于输出所述多个图片中的每个图片的编码图片数据,
其中,所述数据编码器(110)被配置为生成所述编码视频信号,使得所述编码视频信号包括对色度格式信息的编码和对多个亮度子块中的一个或多个亮度子块的运动信息的编码。
41.一种用于对包括编码图片数据的编码视频信号进行解码以重构视频的多个图片的方法,其中,所述方法包括:
接收所述编码视频信号,以及
通过对所述编码图片数据进行解码,来重构所述视频的多个图片,
其中,重构所述多个图片包括对编码在所述编码视频信号内的色度格式信息进行解码,
其中,重构所述多个图片包括取决于所述色度格式信息,根据多个亮度子块中的一个或多个亮度子块的运动信息,来确定多个色度子块中的色度子块的运动信息,
其中,取决于亮度子块中的所述一个或多个亮度子块的运动信息并且取决于所述色度子块的运动信息,来进行所述多个图片的重构。
42.一种用于通过生成编码视频信号来对视频的多个图片进行编码的方法,其中,所述多个图片中的每个图片包括原始图片数据,其中,所述方法包括:
生成包括编码图片数据的编码视频信号,其中,生成编码视频信号包括将所述视频的多个图片编码为所述编码图片数据,以及
输出所述多个图片中的每个图片的编码图片数据,
其中,进行所述编码视频信号的生成,使得所述编码视频信号包括对色度格式信息的编码和对多个亮度子块中的一个或多个亮度子块的运动信息的编码。
43.一种计算机程序,用于当在计算机或信号处理器上执行时实现根据权利要求41或42所述的方法。
44.一种编码图片的编码视频信号,其中,所述编码视频信号包括编码所述图片的编码图片数据,
其中,所述编码视频信号还包括对色度格式信息的编码和对多个亮度子块中的一个或多个亮度子块的运动信息的编码。
45.一种系统,包括:
根据权利要求40所述的视频编码器(101),以及
根据权利要求31至39中的一项所述的视频解码器(151),
其中,所述视频编码器(101)被配置为生成编码视频信号,并且
其中,所述视频解码器(151)被配置为对所述编码视频信号进行解码,以重构视频的图片。
46.一种视频解码器(151),用于对包括编码图片数据的编码视频信号进行解码,以重构视频的多个图片,其中,所述视频解码器(151)包括:
输入接口(160),被配置用于接收所述编码视频信号,以及
数据解码器(170),被配置用于通过对所述编码图片数据进行解码,来重构所述视频的多个图片,
其中,所述数据解码器(170)被配置为取决于所述编码图片数据的编码内容的分辨率和/或取决于所述编码图片数据的块大小,从两个或更多个插值滤波器中选择插值滤波器作为所选择的插值滤波器,并且
其中,所述数据解码器(170)被配置为使用所选择的插值滤波器来重构所述多个图片。
47.根据权利要求46所述的视频解码器(151),
其中,所述两个或更多个插值滤波器是用于子像素插值的两个或更多个抽头插值滤波器。
48.根据权利要求46或47所述的视频解码器(151),
其中,所述两个或更多个插值滤波器包括双线性插值滤波器、4抽头插值滤波器、6抽头插值滤波器和8抽头插值滤波器。
49.根据权利要求46至48中的一项所述的视频解码器(151),
其中,所述两个或更多个插值滤波器包括适合色度子像素插值且适合亮度子像素插值的色度子像素插值滤波器。
50.一种视频编码器(101),用于通过生成编码视频信号来对视频的多个图片进行编码,其中,所述多个图片中的每个图片包括原始图片数据,其中,所述视频编码器(101)包括:
数据编码器(110),被配置用于生成包括编码图片数据的编码视频信号,其中,所述数据编码器(110)被配置为将所述视频的多个图片编码为所述编码图片数据,以及
输出接口(120),被配置用于输出所述多个图片中的每个图片的编码图片数据,
其中,所述数据编码器(110)被配置为取决于所述编码图片数据的编码内容的分辨率和/或取决于所述编码图片数据的块大小,从两个或更多个插值滤波器中选择插值滤波器作为所选择的插值滤波器,并且其中,所述数据编码器(110)被配置为生成所述编码视频信号,使得所述编码视频信号包括对指示所选择的插值滤波器的指示的编码,或者
其中,所述数据编码器(110)被配置为生成所述编码视频信号,使得所述编码视频信号对指示所述两个或更多个插值滤波器的指示进行编码。
51.根据权利要求50所述的视频编码器(101),
其中,所述两个或更多个插值滤波器是用于子像素插值的两个或更多个抽头插值滤波器。
52.根据权利要求50或51所述的视频编码器(101),
其中,所述两个或更多个插值滤波器包括双线性插值滤波器、4抽头插值滤波器、6抽头插值滤波器和8抽头插值滤波器。
53.根据权利要求50至52中的一项所述的视频编码器(101),
其中,所述两个或更多个插值滤波器包括适合色度子像素插值且适合亮度子像素插值的色度子像素插值滤波器。
54.一种用于对包括编码图片数据的编码视频信号进行解码以重构视频的多个图片的方法,其中,所述方法包括:
接收所述编码视频信号,以及
通过对所述编码图片数据进行解码,来重构所述视频的多个图片,
其中,重构所述多个图片包括:取决于所述编码图片数据的编码内容的分辨率和/或取决于所述编码图片数据的块大小,从两个或更多个插值滤波器中选择插值滤波器作为所选择的插值滤波器,并且
其中,使用所选择的插值滤波器来进行所述多个图片的重构。
55.一种用于通过生成编码视频信号来对视频的多个图片进行编码的方法,其中,所述多个图片中的每个图片包括原始图片数据,其中,所述方法包括:
生成包括编码图片数据的编码视频信号,其中,生成所述编码视频信号包括将所述视频的多个图片编码为所述编码图片数据,以及
输出所述多个图片中的每个图片的编码图片数据,
其中,生成所述编码视频信号包括:取决于所述编码图片数据的编码内容的分辨率和/或取决于所述编码图片数据的块大小,从两个或更多个插值滤波器中选择插值滤波器作为所选择的插值滤波器,并且其中,生成所述编码视频信号,使得所述编码视频信号包括对指示所选择的插值滤波器的指示的编码,或者
其中,进行所述编码视频信号的生成,使得所述编码视频信号包括对指示所述两个或更多个插值滤波器的指示的编码。
56.一种计算机程序,用于当在计算机或信号处理器上执行时实现根据权利要求54或55所述的方法。
57.一种编码图片的编码视频信号,其中,所述编码视频信号包括编码所述图片的编码图片数据,
其中,所述编码视频信号包括指示所选择的插值滤波器的指示,所选择的插值滤波器取决于所述编码图片数据的编码内容的分辨率和/或取决于所述编码图片数据的块大小,或者
其中,所述编码视频信号包括指示两个或更多个插值滤波器的指示。
58.一种系统,包括:
根据权利要求50至53中的一项所述的视频编码器(101),以及
根据权利要求46至49中的一项所述的视频解码器(151),
其中,所述视频编码器(101)被配置为生成编码视频信号,并且
其中,所述视频解码器(151)被配置为对所述编码视频信号进行解码,以重构视频的图片。
59.一种视频编码器(101),用于通过生成编码视频信号来对视频的多个图片进行编码,其中,所述多个图片中的每个图片包括原始图片数据,其中,所述视频编码器(101)包括:
数据编码器(110),被配置用于生成包括编码图片数据的编码视频信号,其中,所述数据编码器(110)被配置为将所述视频的多个图片编码为所述编码图片数据,以及
输出接口(120),被配置用于输出所述多个图片中的每个图片的编码图片数据,
其中,视频会话包括多个编码视频序列,其中,将多个视频配置文件中的CVS配置文件分配给所述多个编码视频序列中的每个编码视频序列,其中,所述编码视频序列的CVS配置文件定义多个工具中对所述编码视频序列进行解码所需的一个或多个工具,其中,所述多个视频配置文件中的每个视频配置文件定义对所述多个编码视频序列中的至少一个编码视频序列进行解码所需的至少一个工具,
其中,所述数据编码器(110)被配置为取决于所述视频会话中的多个编码视频序列的CVS配置文件,来确定所述视频会话的会话配置文件,其中,所述会话配置文件定义所述多个工具中对所述视频会话中的多个编码视频序列进行解码所需的至少一个工具,
其中,所述数据编码器(110)被配置为生成所述编码视频信号,使得所述编码视频信号包括对指示所述会话配置文件的指示的编码,
其中,所述数据编码器(110)被配置为从所述多个视频配置文件中确定所述会话配置文件,使得所述会话配置文件包括所述多个工具中对所述视频会话中的所有编码视频序列进行解码所需的所有工具。
60.根据权利要求59所述的视频编码器(101),
其中,所述数据编码器(110)被配置为如果所述多个视频配置文件中不存在如下所述的视频配置文件:所述视频配置文件包括所述多个工具中对所述视频会话中的所有编码视频序列进行解码所需的所有工具,则确定所述会话配置文件,使得所述会话配置文件是所述多个视频配置文件中的至少两个视频配置文件的并集。
61.根据权利要求59所述的视频编码器(101),
其中,所述数据编码器(110)被配置为如果所述多个视频配置文件中存在如下所述的视频配置文件:所述视频配置文件包括所述多个工具中对所述视频会话中的所有编码视频序列进行解码所需的所有工具,则从所述多个视频配置文件中确定恰好一个视频配置文件作为所述会话配置文件,其中,所述视频配置文件是所述恰好一个会话配置文件。
62.根据权利要求59所述的视频编码器(101),
其中,所述数据编码器(110)被配置为如果所述多个视频配置文件中不存在如下所述的视频配置文件:所述视频配置文件包括所述多个工具中对所述视频会话中的所有编码视频序列进行解码所需的所有工具,则确定所述会话配置文件,使得所述会话配置文件是所述多个视频配置文件中的至少两个视频配置文件的交集。
63.一种视频解码器(151),用于对包括编码图片数据的编码视频信号进行解码,以重构视频的多个图片,其中,所述视频解码器(151)包括:
输入接口(160),被配置用于接收所述编码视频信号,以及
数据解码器(170),被配置用于通过对所述编码图片数据进行解码,来重构所述视频的多个图片,
其中,所述数据解码器(170)被配置为从所述编码视频信号中解码包括多个编码视频序列的视频会话的会话配置文件,其中,多个视频配置文件中的每个视频配置文件定义多个工具中对多个编码视频序列中的至少一个码视频序列进行解码所需的至少一个工具,其中,所述会话配置文件定义所述多个工具中对所述视频会话的多个编码视频序列进行解码所需的至少一个工具,
其中,所述数据解码器(170)被配置为取决于所述会话配置文件,来重构所述视频的多个图片。
64.根据权利要求63所述的视频解码器(151),
其中,所述会话配置文件是所述多个视频配置文件中的至少两个视频配置文件的并集。
65.根据权利要求63所述的视频解码器(151),
其中,所述数据解码器(170)被配置为如果所述多个视频配置文件中存在如下所述的视频配置文件:所述视频配置文件包括所述多个工具中对所述视频会话中的所有编码视频序列进行解码所需的所有工具,则从所述多个视频配置文件中确定恰好一个视频配置文件作为所述会话配置文件。
66.根据权利要求63所述的视频解码器(151),
其中,所述会话配置文件是所述多个视频配置文件中的至少两个视频配置文件的交集。
67.一种用于通过生成编码视频信号来对视频的多个图片进行编码的方法,其中,所述多个图片中的每个图片包括原始图片数据,其中,所述方法包括:
生成包括编码图片数据的编码视频信号,其中,生成所述编码视频信号包括将所述视频的多个图片编码为所述编码图片数据,以及
输出所述多个图片中的每个图片的编码图片数据,
其中,视频会话包括多个编码视频序列,其中,将多个视频配置文件中的CVS配置文件分配给所述多个编码视频序列中的每个编码视频序列,其中,所述编码视频序列的CVS配置文件定义多个工具中对所述编码视频序列进行解码所需的一个或多个工具,其中,所述多个视频配置文件中的每个视频配置文件定义对所述多个编码视频序列中的至少一个编码视频序列进行解码所需的至少一个工具,
其中,所述方法包括:取决于所述视频会话中的多个编码视频序列的CVS配置文件,来确定所述视频会话的会话配置文件,其中,所述会话配置文件定义所述多个工具中对所述视频会话中的多个编码视频序列进行解码所需的至少一个工具,
其中,进行所述编码视频信号的生成,使得所述编码视频信号包括对指示所述会话配置文件的指示的编码,
其中,进行从所述多个视频配置文件中确定所述会话配置文件,使得所述会话配置文件包括所述多个工具中对所述视频会话中的所有编码视频序列进行解码所需的所有工具。
68.一种用于对包括编码图片数据的编码视频信号进行解码以重构视频的多个图片的方法,其中,所述方法包括:
接收所述编码视频信号,以及
通过对所述编码图片数据进行解码,来重构所述视频的多个图片,
其中,所述方法包括:从所述编码视频信号中解码包括多个编码视频序列的视频会话的会话配置文件,其中,多个视频配置文件中的每个视频配置文件定义多个工具中对多个编码视频序列中的至少一个编码视频序列进行解码所需的至少一个工具,其中,所述会话配置文件定义所述多个工具中对所述视频会话中的多个编码视频序列进行解码所需的至少一个工具,
其中,取决于所述会话配置文件,来进行所述视频的多个图片的重构。
69.一种计算机程序,用于当在计算机或信号处理器上执行时实现根据权利要求67或68所述的方法。
70.一种编码图片的编码视频信号,其中,所述编码视频信号包括编码所述图片的编码图片数据,
其中,视频会话包括多个编码视频序列,其中,将多个视频配置文件中的CVS配置文件分配给所述多个编码视频序列中的每个编码视频序列,其中,所述编码视频序列的CVS配置文件定义多个工具中对所述编码视频序列进行解码所需的一个或多个工具,其中,所述多个视频配置文件中的每个视频配置文件定义对所述多个编码视频序列中的至少一个编码视频序列进行解码所需的至少一个工具,
其中,所述视频会话的会话配置文件取决于所述视频会话中的多个编码视频序列的CVS配置文件,
其中,所述编码视频信号包括对指示所述会话配置文件的指示的编码,
其中,所述会话配置文件包括所述多个工具中对所述视频会话中的所有编码视频序列进行解码所需的所有工具。
71.一种系统,包括:
根据权利要求59至62中的一项所述的视频编码器(101),以及
根据权利要求63至66中的一项所述的视频解码器(151),
其中,所述视频编码器(101)被配置为生成编码视频信号,并且
其中,所述视频解码器(151)被配置为对所述编码视频信号进行解码,以重构视频的图片。
72.一种视频编码器(101),用于通过生成编码视频信号来对视频的多个图片进行编码,其中,所述多个图片中的每个图片包括原始图片数据,其中,所述视频编码器(101)包括:
数据编码器(110),被配置用于生成包括编码图片数据的编码视频信号,其中,所述数据编码器(110)被配置为将所述视频的多个图片编码为所述编码图片数据,以及
输出接口(120),被配置用于输出所述多个图片中的每个图片的编码图片数据,
其中,所述数据编码器(110)被配置为通过对序列参数集进行编码并通过对补充增强信息消息进行编码,来生成所述编码视频信号,其中,所述序列参数集与所述多个图片中的两个或更多个图片相关并且包括由多个语法元素中的一个或多个语法元素组成的第一组语法元素,并且其中,所述补充增强信息消息与所述多个图片中的恰好一个图片相关并且包括由所述多个语法元素中的一个或多个语法元素组成的第二组语法元素,
其中,所述数据编码器(110)被配置为生成所述序列参数集和所述补充增强信息消息,使得所述序列参数集不包括所述补充增强信息消息中的第二组语法元素中的至少一个语法元素,并且使得所述序列参数集不包括针对所述补充增强信息消息中的第二组语法元素中的所述至少一个语法元素的长度信息。
73.根据权利要求72所述的视频编码器(101),
其中,所述数据编码器(110)被配置为生成所述序列参数集和所述补充增强信息消息,使得所述序列参数集不包括所述补充增强信息消息中的第二组语法元素中的至少一个另外的语法元素,并且使得所述序列参数集不包括针对所述补充增强信息消息中的第二组语法元素中的所述至少一个另外的语法元素的存在信息。
74.根据权利要求72或73所述的视频编码器(101),
其中,所述数据编码器(110)被配置为生成所述序列参数集,使得所述序列参数集包括所述多个语法元素中包含会话协商信息和/或能力协商信息的至少一个第一语法元素,
其中,所述数据编码器(110)被配置为生成所述补充增强信息消息,使得所述补充增强信息消息不包括所述包含会话协商信息和/或能力协商信息的至少一个第一语法元素,
其中,所述数据编码器(110)被配置为生成所述补充增强信息消息,使得所述补充增强信息消息包括所述多个语法元素中不包含会话协商信息和/或能力协商信息的至少一个第二语法元素信息,并且
其中,所述数据编码器(110)被配置为生成所述序列参数集,使得所述序列参数集不包括所述不包含会话协商信息和/或能力协商信息的至少一个第二语法元素信息。
75.根据权利要求72至74中的一项所述的视频编码器(101),
其中,所述数据编码器(110)被配置为生成所述序列参数集,使得所述序列参数集包括所述多个语法元素中包含会话协商信息和/或能力协商信息的所有语法元素,
其中,所述数据编码器(110)被配置为生成所述补充增强信息消息,使得所述补充增强信息消息不包括所述多个语法元素中包含会话协商信息和/或能力协商信息的任何语法元素,
其中,所述数据编码器(110)被配置为生成所述补充增强信息消息,使得所述补充增强信息消息包括所述多个语法元素中不包含会话协商信息和/或能力协商信息的所有语法元素,并且
其中,所述数据编码器(110)被配置为生成所述序列参数集,使得所述序列参数集不包括所述多个语法元素中不包含会话协商信息和/或能力协商信息的任何语法元素。
76.根据权利要求72至75中的一项所述的视频编码器(101),
其中,所述补充增强信息消息是缓冲周期补充增强信息消息,或者是定时补充增强信息消息,或者是解码单元补充增强信息消息。
77.根据权利要求72至76中的一项所述的视频编码器(101),
其中,对于所述多个语法元素中的至少一个语法元素,所述数据编码器(110)被配置为生成所述序列参数集和所述补充增强信息消息,使得所述序列参数集包括所述至少一个语法元素,并且使得所述补充增强信息消息也包括所述语法元素,并且
其中,所述数据编码器(110)被配置为生成所述序列参数集和所述补充增强信息消息,使得对于所述多个语法元素中存在于所述序列参数集中且还存在于所述补充增强信息消息中的每个语法元素,所述语法元素的值在所述序列参数集中和所述补充增强信息消息中相等。
78.根据权利要求72至77中的一项所述的视频编码器(101),
其中,所述数据编码器(110)被配置为生成所述序列参数集和所述补充增强信息消息,使得如果级联标志未设置为1,则子图片定时粒度在所述序列参数集中和所述补充增强信息消息中相等。
79.一种视频解码器(151),用于对包括编码图片数据的编码视频信号进行解码,以重构视频的多个图片,其中,所述视频解码器(151)包括:
输入接口(160),被配置用于接收所述编码视频信号,以及
数据解码器(170),被配置用于通过对所述编码图片数据进行解码,来重构所述视频的多个图片,
其中,所述数据解码器(170)被配置为从所述编码视频信号中解码序列参数集和补充增强信息消息,其中,所述序列参数集与所述多个图片中的两个或更多个图片相关并且包括由多个语法元素中的一个或多个语法元素组成的第一组语法元素,并且其中,所述补充增强信息消息与所述多个图片中的恰好一个图片相关并且包括由所述多个语法元素中的一个或多个语法元素组成的第二组语法元素,其中,所述序列参数集不包括所述补充增强信息消息中的第二组语法元素中的至少一个语法元素,并且其中,所述序列参数集不包括针对所述补充增强信息消息中的第二组语法元素中的所述至少一个语法元素的长度信息,
其中,所述数据解码器(170)被配置为取决于所述序列参数集并且取决于所述补充增强信息消息,来重构所述视频的多个图片。
80.根据权利要求79所述的视频解码器(151),
其中,所述序列参数集不包括所述补充增强信息消息中的第二组语法元素中的至少一个另外的语法元素,并且其中,所述序列参数集不包括针对所述补充增强信息消息中的第二组语法元素中的所述至少一个另外的语法元素的存在信息。
81.根据权利要求79或80所述的视频解码器(151),
其中,所述序列参数集包括所述多个语法元素中包含会话协商信息和/或能力协商信息的至少一个第一语法元素,
其中,所述补充增强信息消息不包括所述包含会话协商信息和/或能力协商信息的至少一个第一语法元素,
其中,所述补充增强信息消息包括所述多个语法元素中不包含会话协商信息和/或能力协商信息的至少一个第二语法元素,并且
其中,所述序列参数集不包括所述不包含会话协商信息和/或能力协商信息的至少一个第二语法元素。
82.根据权利要求79至81中的一项所述的视频解码器(151),
其中,所述序列参数集包括所述多个语法元素中包含会话协商信息和/或能力协商信息的所有语法元素,
其中,所述补充增强信息消息不包括所述多个语法元素中包含会话协商信息和/或能力协商信息的任何语法元素,
其中,所述补充增强信息消息包括所述多个语法元素中不包含会话协商信息和/或能力协商信息的所有语法元素,并且
其中,所述序列参数集不包括所述多个语法元素中不包含会话协商信息和/或能力协商信息的任何语法元素。
83.根据权利要求79至82中的一项所述的视频解码器(151),
其中,所述补充增强信息消息是缓冲周期补充增强信息消息,或者是定时补充增强信息消息,或者是解码单元补充增强信息消息。
84.根据权利要求79至83中的一项所述的视频解码器(151),
其中,对于所述多个语法元素中的至少一个语法元素,所述序列参数集包括所述至少一个语法元素,并且使得所述补充增强信息消息也包括所述语法元素,并且
其中,对于所述多个语法元素中存在于所述序列参数集中且还存在于所述补充增强信息消息中的每个语法元素,所述语法元素的值在所述序列参数集中和所述补充增强信息消息中相等。
85.根据权利要求79至84中的一项所述的视频解码器(151),
其中,如果级联标志未被设置为1,则子图片定时粒度在所述序列参数集中和所述补充增强信息消息中相等。
86.一种用于通过生成编码视频信号来对视频的多个图片进行编码的方法,其中,所述多个图片中的每个图片包括原始图片数据,其中,所述方法包括:
生成包括编码图片数据的所述编码视频信号,其中,生成所述编码视频信号包括将所述视频的多个图片编码为所述编码图片数据,以及
输出所述多个图片中的每个图片的编码图片数据,
其中,通过对序列参数集进行编码并通过对补充增强信息消息进行编码来进行所述编码视频信号的生成,其中,所述序列参数集与所述多个图片中的两个或更多个图片相关并且包括由多个语法元素中的一个或多个语法元素组成的第一组语法元素,并且其中,所述补充增强信息消息与所述多个图片中的恰好一个图片相关并且包括由所述多个语法元素中的一个或多个语法元素组成的第二组语法元素,
其中,所述方法包括生成所述序列参数集和所述补充增强信息消息,使得所述序列参数集不包括所述补充增强信息消息中的第二组语法元素中的至少一个语法元素,并且使得所述序列参数集不包括针对所述补充增强信息消息中的第二组语法元素中的所述至少一个语法元素的长度信息。
87.一种用于对包括编码图片数据的编码视频信号进行解码以重构视频的多个图片的方法,其中,所述方法包括:
接收所述编码视频信号,以及
通过对所述编码图片数据进行解码,来重构所述视频的多个图片,
其中,所述方法包括从所述编码视频信号中解码序列参数集和补充增强信息消息,其中,所述序列参数集与所述多个图片中的两个或更多个图片相关并且包括由多个语法元素中的一个或多个语法元素组成的第一组语法元素,并且其中,所述补充增强信息消息与所述多个图片中的恰好一个图片相关并且包括由所述多个语法元素中的一个或多个语法元素组成的第二组语法元素,其中,所述序列参数集不包括所述补充增强信息消息中的第二组语法元素中的至少一个语法元素,并且其中,所述序列参数集不包括针对所述补充增强信息消息中的第二组语法元素中的所述至少一个语法元素的长度信息,
其中,取决于所述序列参数集并取决于所述补充增强信息消息,来进行所述视频的多个图片的重构。
88.一种计算机程序,用于当在计算机或信号处理器上执行时实现根据权利要求86或87所述的方法。
89.一种编码图片的编码视频信号,其中,所述编码视频信号包括编码所述图片的编码图片数据,
其中,所述编码视频信号包括对序列参数集的编码和对补充增强信息消息的编码,其中,所述序列参数集与多个图片中的两个或更多个图片相关并且包括由多个语法元素中的一个或多个语法元素组成的第一组语法元素,并且其中,所述补充增强信息消息与所述多个图片中的恰好一个图片相关并且包括由所述多个语法元素中的一个或多个语法元素组成的第二组语法元素,
其中,所述序列参数集不包括所述补充增强信息消息中的第二组语法元素中的至少一个语法元素,并且其中,所述序列参数集不包括针对所述补充增强信息消息中的第二组语法元素中的所述至少一个语法元素的长度信息。
90.一种系统,包括:
根据权利要求72至78中的一项所述的视频编码器(101),以及
根据权利要求79至85中的一项所述的视频解码器(151),
其中,所述视频编码器(101)被配置为生成编码视频信号,并且
其中,所述视频解码器(151)被配置为对所述编码视频信号进行解码以重构视频的图片。
CN202080035030.XA 2019-03-11 2020-03-10 具有配置文件和级别相关编码选项的编码器和解码器、编码方法和解码方法 Pending CN113812151A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP19162052 2019-03-11
EP19162052.5 2019-03-11
PCT/EP2020/056355 WO2020182815A1 (en) 2019-03-11 2020-03-10 Encoder and decoder, encoding method and decoding method with profile and level dependent coding options

Publications (1)

Publication Number Publication Date
CN113812151A true CN113812151A (zh) 2021-12-17

Family

ID=65766854

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080035030.XA Pending CN113812151A (zh) 2019-03-11 2020-03-10 具有配置文件和级别相关编码选项的编码器和解码器、编码方法和解码方法

Country Status (8)

Country Link
US (1) US20210409718A1 (zh)
EP (1) EP3939271A1 (zh)
JP (2) JP7379518B2 (zh)
KR (1) KR20210152475A (zh)
CN (1) CN113812151A (zh)
MX (1) MX2021010917A (zh)
TW (2) TWI826969B (zh)
WO (1) WO2020182815A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021049644A1 (ja) * 2019-09-11 2021-03-18 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化装置、復号装置、符号化方法、および復号方法
CN114731441A (zh) * 2019-09-11 2022-07-08 松下电器(美国)知识产权公司 编码装置、解码装置、编码方法和解码方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003169349A (ja) * 2001-11-30 2003-06-13 Sony Corp 画像情報符号化方法及び装置、画像情報復号方法及び装置、並びにプログラム
JP2011077761A (ja) * 2009-09-30 2011-04-14 Sony Corp 画像処理装置および方法
CN102685556A (zh) * 2007-04-18 2012-09-19 汤姆森许可贸易公司 编码系统
US20140086333A1 (en) * 2012-09-24 2014-03-27 Qualcomm Incorporated Bitstream properties in video coding
US20140301464A1 (en) * 2013-04-08 2014-10-09 Microsoft Corporation Control data for motion-constrained tile set
US20160100189A1 (en) * 2014-10-07 2016-04-07 Qualcomm Incorporated Intra bc and inter unification
US20180302640A1 (en) * 2015-11-06 2018-10-18 Microsoft Technology Licensing, Llc Flexible reference picture management for video encoding and decoding
CN108702501A (zh) * 2016-02-22 2018-10-23 联发科技(新加坡)私人有限公司 用于视频编码的色度预测的区域化亮度预测模式继承的方法及装置

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107105280B (zh) * 2010-12-14 2020-01-03 M&K控股株式会社 用于编码运动画面的设备
KR101668583B1 (ko) * 2011-06-23 2016-10-21 가부시키가이샤 제이브이씨 켄우드 화상 인코딩 장치, 화상 인코딩 방법 및 화상 인코딩 프로그램, 및 화상 디코딩 장치, 화상 디코딩 방법 및 화상 디코딩 프로그램
CN104378639B (zh) * 2011-10-19 2018-05-04 株式会社Kt 解码视频信号的方法
US8934726B2 (en) * 2011-12-19 2015-01-13 Dolby Laboratories Licensing Corporation Video codecs with integrated gamut management
US9602827B2 (en) 2012-07-02 2017-03-21 Qualcomm Incorporated Video parameter set including an offset syntax element
WO2015069734A1 (en) * 2013-11-05 2015-05-14 Arris Enterprises, Inc. Bit depth variable for high precision data in weighted prediction syntax and semantics
US10412387B2 (en) * 2014-08-22 2019-09-10 Qualcomm Incorporated Unified intra-block copy and inter-prediction
US9854237B2 (en) * 2014-10-14 2017-12-26 Qualcomm Incorporated AMVP and merge candidate list derivation for intra BC and inter prediction unification
MX2018003687A (es) 2015-09-23 2018-04-30 Arris Entpr Llc Alto rango dinamico de señalizacion y contenido de amplia gama de colores en corrientes de transporte.
WO2017051072A1 (en) * 2015-09-23 2017-03-30 Nokia Technologies Oy A method, an apparatus and a computer program product for coding a 360-degree panoramic video
JP7249948B2 (ja) * 2017-03-17 2023-03-31 ヴィド スケール インコーポレイテッド ジオメトリパディングに基づいた360度ビデオのための予測符号化
US11546602B2 (en) * 2018-08-24 2023-01-03 Samsung Electronics Co., Ltd. Method and apparatus for image encoding, and method and apparatus for image decoding
CA3121671A1 (en) * 2018-12-07 2020-06-11 Beijing Bytedance Network Technology Co., Ltd. Context-based intra prediction
CN113228675A (zh) * 2018-12-21 2021-08-06 北京字节跳动网络技术有限公司 视频处理中的运动矢量比特深度
EP3884675B1 (en) 2018-12-21 2023-11-29 Beijing Dajia Internet Information Technology Co., Ltd. Methods and apparatus of video coding for deriving affine motion vectors for chroma components
US11632563B2 (en) * 2019-02-22 2023-04-18 Qualcomm Incorporated Motion vector derivation in video coding
SG11202109131PA (en) 2019-02-22 2021-09-29 Huawei Tech Co Ltd Method and apparatus for affine based inter prediction of chroma subblocks
CA3132485A1 (en) * 2019-03-12 2020-09-17 Tencent America LLC Method and apparatus for video encoding or decoding

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003169349A (ja) * 2001-11-30 2003-06-13 Sony Corp 画像情報符号化方法及び装置、画像情報復号方法及び装置、並びにプログラム
CN102685556A (zh) * 2007-04-18 2012-09-19 汤姆森许可贸易公司 编码系统
JP2011077761A (ja) * 2009-09-30 2011-04-14 Sony Corp 画像処理装置および方法
US20140086333A1 (en) * 2012-09-24 2014-03-27 Qualcomm Incorporated Bitstream properties in video coding
US20140301464A1 (en) * 2013-04-08 2014-10-09 Microsoft Corporation Control data for motion-constrained tile set
US20160100189A1 (en) * 2014-10-07 2016-04-07 Qualcomm Incorporated Intra bc and inter unification
US20180302640A1 (en) * 2015-11-06 2018-10-18 Microsoft Technology Licensing, Llc Flexible reference picture management for video encoding and decoding
CN108702501A (zh) * 2016-02-22 2018-10-23 联发科技(新加坡)私人有限公司 用于视频编码的色度预测的区域化亮度预测模式继承的方法及装置

Also Published As

Publication number Publication date
JP2024001318A (ja) 2024-01-09
EP3939271A1 (en) 2022-01-19
MX2021010917A (es) 2021-11-12
KR20210152475A (ko) 2021-12-15
TW202301875A (zh) 2023-01-01
JP2022524110A (ja) 2022-04-27
US20210409718A1 (en) 2021-12-30
WO2020182815A1 (en) 2020-09-17
TWI826969B (zh) 2023-12-21
JP7379518B2 (ja) 2023-11-14
TWI761783B (zh) 2022-04-21
TW202042554A (zh) 2020-11-16

Similar Documents

Publication Publication Date Title
US11218694B2 (en) Adaptive multiple transform coding
EP3588957B1 (en) Method and apparatus for efficient slice header processing
EP3815365A1 (en) Position dependent intra prediction combination with multiple reference lines for intra prediction
US20140198846A1 (en) Device and method for scalable coding of video information
US20140056356A1 (en) Method and apparatus for efficient signaling of weighted prediction in advanced coding schemes
US11363301B2 (en) Conditionally parsed extension syntax for HEVC extension processing
JP2024001318A (ja) プロファイルおよびレベル依存コーディングオプションによる符号化器および復号器、符号化方法および復号方法
US20200244953A1 (en) Excluding intra coded reference samples from local illumination compensation parameter derivation
US11909957B2 (en) Encoder and decoder, encoding method and decoding method for reference picture resampling extensions
US20230124010A1 (en) Histogram of gradient generation
US20220201329A1 (en) Intra prediction using enhanced interpolation filters
AU2021410074A1 (en) Intra prediction using enhanced interpolation filters

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40066115

Country of ref document: HK