CN117083862A - 允许对漂移进行限制的视频编码概念 - Google Patents

允许对漂移进行限制的视频编码概念 Download PDF

Info

Publication number
CN117083862A
CN117083862A CN202280017315.XA CN202280017315A CN117083862A CN 117083862 A CN117083862 A CN 117083862A CN 202280017315 A CN202280017315 A CN 202280017315A CN 117083862 A CN117083862 A CN 117083862A
Authority
CN
China
Prior art keywords
pictures
picture
video
encoded
encoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280017315.XA
Other languages
English (en)
Inventor
R·斯库平
C·巴特尼克
A·维科夫斯基
Y·桑切斯德拉富恩特
C·赫尔格
B·布罗斯
T·席尔
T·韦根
D·马尔佩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Publication of CN117083862A publication Critical patent/CN117083862A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/33Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/521Processing of motion vectors for estimating the reliability of the determined motion vectors or motion vector field, e.g. for smoothing the motion vector field or for correcting motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/587Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal sub-sampling or interpolation, e.g. decimation or subsequent interpolation of pictures in a video sequence

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

一种用于从数据流解码视频的视频解码器被配置成从所述数据流解码指示,所述指示对所述视频的图片的序列有效并且指示图片的所述序列内的RASL图片以排除一个或多个编码工具的预定的集合的方式来被编码。

Description

允许对漂移进行限制的视频编码概念
技术领域
本申请涉及适于限制漂移的视频编码和概念。
背景技术
编码的视频的HTTP流传输在过去的十年已成为视频分发的重要途径,并且OTT服务提供商现今能够经由公共互联网到达数亿用户。标准协议(诸如HTTP上的动态自适应流传输(DASH)[1])使得服务提供商能够通过使服务器以各个比特率、按时间上分段的形式提供媒体来向客户端流传送媒体。客户端装置然后能够通过根据可用网络带宽及其解码能力以动态和自适应方式在所提供的特定区段(segment)的变体中进行选择,来下载接连的区段以用于连续回放。在实践中,内容被提供为通常涉及多个分辨率和保真度的最佳化的比特率阶梯所生成的多个所谓的表示,以便最佳化针对特定比特率的所感知质量并且由此最佳化用户体验[2]。由于每个区段典型地使用所谓的闭合的图片的组(GOP)编码结构[2]而不依赖于较早区段来被编码,因此下载和去分组化的区段数据能够被连系成一致的比特流并被馈送到解码器中。与这类闭合的GOP结构相反,使用所谓的开放GOP编码结构的区段含有采用来自较早区段中的图片的帧间预测(这有益于编码效率)的一些图片。虽然当随机接入区段时,使用来自较早区段的帧间预测的图片能够被跳过以免被输出而没有回放问题或视觉假象(因为它们按呈现顺序首先到来),但是当分辨率切换在连续播出期间发生时会出现问题,因为这些图片在这类非无缝切换下被跳过。即使在纯比特率切换中,当区段未被合适地编码以用于切换时,一些图片可能被丢弃或展现严重的视觉假象。
激增的较早代编解码器(诸如AVC[4]和HEVC[5])不提供为使用不同分辨率的参考图片所要求的参考图片重采样(RPR)功能性。因此,在分辨率切换后,当以这类开放GOP结构来被执行时,区段的一些图片不能够被正确解码,因为来自较早区段的参考图片在所要求的分辨率下不可用,这导致自丢弃图片的区段切换下的非恒定帧率播出。在[6]中,作者提出了通过对HEVC解码过程采用规范改变或者使用提供RPR功能性的不太激增的HEVC的可缩放扩展(SHVC)来克服开放GOP分辨率切换的问题的方法。然而,可用的解决方案至今尚未使能开放GOP编码在HTTP流传输中的实质采用。
最近敲定的多功能视频编码(VVC)标准[7]的版本1是从ITU-T的视频编码专家组和ISO/IEC的分委员会29(又称为移动图片专家组)的合作工作所显现的最新视频编码标准。除了提供相比于较早代编解码器实质上提高的编码效率[8]以外,VVC还在初始Main10简档中包含许多应用驱动的特征,诸如RPR。在VVC开发期间,RPR主要在具有低延迟编码结构的会话场景的上下文中被研究[9],其中对时延和缓冲大小的真实世界要求为用于分辨率切换的帧内编码的图片的插入的可行性设定严格限制。
然而,VVC中的RPR也能够将实质益处提供到针对流传输领域的视频编码中的编码效率。
手头具有使能在使用编解码器(诸如VVC)的HTTP流传输中使用开放GOP分辨率切换的概念将是有利的,其中上文概述的问题不仅针对RPR而出现,而且还出现在通过连系与例如不同SNR相关联的区段来形成视频比特流时。
发明内容
因此,本发明的目的是提供一种视频编码概念,所述视频编码概念使能更有效地限制由漂移对视频质量的负面影响,所述漂移例如由在不同视频比特流表示之间的切换下的分段视频比特流形成来引起。
此目的由本申请的独立权利要求的主题来达成。
根据本发明的第一方面的实施例提供用于从数据流解码视频的视频解码器,所述视频解码器被配置成从所述数据流解码指示(例如,gci_rasl_pictures_tool_constraint_flag),所述指示对所述视频的图片的序列有效,并且所述指示指示图片的所述序列内的RASL图片以排除一个或多个编码工具的预定的集合的方式来被编码。例如,所述指示可用作一种承诺,使得所述解码器知道,通过连系以不同空间分辨率和/或不同SNR来编码的视频的分开编码的开放GOP版本而进行的开放GOP切换不导致RASL图片中的过多漂移。进一步的实施例提供用于将视频编码到数据流中的视频编码器,所述视频编码器被配置用于将所述指示编码到所述数据流中。例如,RASL图片表示按解码顺序在例如CRA的图片的所述序列的帧内编码的图片之后、但按呈现顺序在它之前的图片,并且其可使用按解码顺序在帧内编码的图片之前的参考图片。例如,在前的图片可属于图片的先前序列,例如,帧内编码的图片按编码顺序可以是所述序列的第一图片。由于对按解码顺序在帧内编码的图片之前的图片的参考,当针对包括先前帧内编码的图片的视频的先前区段切换帧内编码的图片处的分辨率时,可发生上文提到的漂移假象或其他类型的假象。在数据流中发信号通知上文提到的指示可向解码器给出保证:相比于图片的先前序列,图片的所述序列处的分辨率切换不涉及RASL图片中的过多漂移。相应地,解码器可基于所述指示来判定分辨率切换是否是有利的。
根据本发明的进一步的实施例提供用于从数据流解码视频的视频解码器,所述视频解码器被配置成从所述数据流解码指示(例如,使用sps_extra_ph_bit_present_flag和ph_extra_bit,或使用gci_rasl_pictures_tool_contraint_flag),所述指示按所述视频的图片的序列的图片、针对相应图片而全局地或在每切片的基础上指示是否相应图片以排除一个或多个编码工具的预定的集合的方式来被编码,所述预定的集合包括基于跨分量线性模型的预测工具(例如,作为一种逐图片指示,其使得看出RASL图片处的潜在漂移为充分地低是可能的)。进一步的实施例提供用于将视频编码到数据流中的视频编码器,所述视频编码器被配置用于将所述指示编码到所述数据流中。
本申请的有利方面是从属权利要求的主题。下文针对附图来描述本申请的优选实施例。
附图说明
图1示出根据一实施例的视频编码器,
图2示出根据一实施例的视频解码器,
图3示出根据一实施例的基于块的残差编码方案,
图4示出根据一实施例的包括两个区段的视频数据流,
图5示出根据一实施例的光流(optical flow)工具的操作方案,
图6示出根据一实施例的编码工具的应用方案,
图7示出根据一实施例的时间运动向量预测工具的操作方案,
图8示出根据一实施例的解码器侧运动向量细化工具的操作方案,
图9示出根据一实施例的跨分量线性模型工具的操作方案,
图10示出根据一实施例的亮度(luma)映射和色度缩放工具的操作方案,
图11示出根据一实施例的亮度映射和色度缩放工具的另一操作方案,
图12示出开放GOP场景中的预测误差的一示例。
具体实施方式
对附图的以下描述以对用于编码视频的图片的基于块的预测性编解码器的编码器和解码器的描述的呈现来开始,以便形成编码框架的一示例,本发明的实施例可被创建到所述编码框架中。针对图1至3来描述相应的编码器和解码器。后文中对本发明的概念的实施例的描述连同与如何能够将这类概念分别创建到图1和2的编码器和解码器中有关的描述一起被呈现,但利用随后的图4及在后附图来描述的实施例也可用于形成不根据构成图1和2的编码器和解码器的基础的编码框架来进行操作的编码器和解码器。
图1示出用于示例性地使用基于变换的残差编码将图片A12预测性地编码到数据流A14中的设备。所述设备或编码器使用参考符号A10来被指示。图2示出对应的解码器A20,即配置成也使用基于变换的残差解码将图片A12'从数据流A14预测性地解码的设备A20,其中撇号已用于指示如由解码器A20重构的图片A12'在预测残差信号的量化所引入的编码损耗方面偏离于由设备A10初始编码的图片A12。图1和图2示例性地使用基于变换的预测残差编码,但本申请的实施例不限于此种预测残差编码。这对于针对图1和2来描述的其他细节也成立,如后文中将概述的。
编码器A10被配置成使预测残差信号经历空间至谱(spatial-to-spectral)变换,并将因此获得的预测残差信号编码到数据流A14中。同样,解码器A20被配置成从数据流A14解码预测残差信号,并使因此获得的预测残差信号经历谱至空间变换。
在内部,编码器A10可包括生成预测残差A24的预测残差信号形成器A22,以便测量预测信号A26与初始信号(即与图片A12)的偏差。预测残差信号形成器A22可例如是从初始信号(即从图片A12)减去预测信号的减法器。编码器A10接着进一步包括变换器A28,所述变换器使预测残差信号A24经历空间至谱变换,以获得谱域预测残差信号A24',A24'然后经历由(也由编码器A10包括的)量化器A32进行的量化。因此所量化的预测残差信号A24”被编码到比特流A14中。为此,编码器A10可以可选地包括熵编码器A34,所述熵编码器将如经变换和量化的预测残差信号熵编码到数据流A14中。预测信号A26由编码器A10的预测级A36在编码到数据流A14中并可解码自数据流A14的预测残差信号A24”的基础上生成。为此,如图1中示出的,预测级A36内部可包括:去量化器A38,所述去量化器对预测残差信号A24”进行去量化,以便得到谱域预测残差信号A24”',A24”'除量化损耗外对应于信号A24';后接的逆变换器A40,所述逆变换器使后者的预测残差信号A24”'经历逆变换(即谱至空间变换),以获得预测残差信号A24””,A24””除量化损耗外对应于初始预测残差信号A24。预测级A36的组合器A42然后重新组合(诸如通过相加)预测信号A26和预测残差信号A24””,以便获得重构的信号A46,即初始信号A12的重构。重构的信号A46可对应于信号A12'。预测级A36的预测模块A44然后通过使用例如空间预测(即图片内预测)和/或时间预测(即图片间预测)在信号A46的基础上生成预测信号A26。
同样,解码器A20(如图2中示出的)在内部可由对应于预测级A36并以与预测级A36相对应的方式互连的组件构成。特别是,解码器A20的熵解码器A50可从数据流对所量化的谱域预测残差信号A24”进行熵解码,于是(以上文针对预测级A36的模块所描述的方式互连和协作的)去量化器A52、逆变换器A54、组合器A56和预测模块A58在预测残差信号A24”的基础上恢复所重构信号,使得组合器A56的输出产生所重构信号(即图片A12'),如图2中示出的。
虽然在上文没有具体描述,但容易明确的是,编码器A10可根据某个优化方案(诸如例如以优化某个率和失真相关标准(即编码成本)的方式)设置一些编码参数,所述编码参数包含例如预测模式、运动参数和诸如此类。例如,编码器A10和解码器A20以及对应的模块A44、A58分别可支持不同的预测模式,诸如帧内编码模式和帧间编码模式。编码器和解码器在这些预测模式类型之间切换所按的粒度可对应于使图片A12和A12'分别变成编码区段或编码块而进行的细分。以这些编码区段为单位,例如图片可细分成被帧内编码的块和被帧间编码的块。帧内编码的块在相应块的空间、已编码/解码的邻域的基础上被预测,如下文更详细概述的。若干帧内编码模式可存在以及被选择用于包含方向或角度的帧内编码模式的相应的帧内编码的区段,相应区段根据所述方向或角度的帧内编码模式、通过将邻域的样本值沿对于相应方向的帧内编码模式特定的某个方向外推来被填充到相应的帧内编码的区段中。帧内编码模式还可例如包括一个或多个另外的模式,诸如:DC编码模式,相应的帧内编码的块的预测根据所述DC编码模式将DC值指派到相应的帧内编码的区段内的所有样本;和/或平面帧内编码模式,相应块的预测根据所述平面帧内编码模式被近似或确定成与相应的帧内编码的块的样本位置相关的二维线性函数所描述的样本值的空间分布,其中平面的驱动倾斜和偏移由所述二维线性函数在相邻样本的基础上定义。与其相比,可例如在时间上预测帧间编码的块。对于帧间编码的块,可在数据流内发信号通知运动向量,所述运动向量指示图片A12属于的视频的先前编码的图片的部分的空间位移,于其对先前编码/解码的图片进行采样,以便获得相应帧间编码的块的预测信号。这意味着,除了数据流A14所包括的残差信号编码(诸如表示所量化谱域预测残差信号A24”的熵编码的变换系数级别)外,数据流A14可具有:被编码到其中的用于将编码模式指派到各个块的编码模式参数;用于块中的一些块的预测参数,诸如用于帧间编码的区段的运动参数;以及可选的另外的参数,诸如用于对使图片A12和A12'分别变成区段而进行的细分进行控制和发信号通知的参数。解码器A20使用这些参数以按与编码器进行细分的相同方式来细分图片、将相同的预测模式指派到区段以及执行相同的预测来产生相同的预测信号。
图3示出(在一方面)所重构信号(即所重构图片A12')与(在另一方面)如在数据流A14中发信号通知的预测残差信号A24””和预测信号A26的组合之间的关系。如上文已经表示的,所述组合可以是相加。预测信号A26在图3中示为使图片区域变成使用影线图示性地指示的帧内编码的块和未经影线图示性地指示的帧间编码的块而进行的细分。所述细分可以是任何细分,诸如使图片区域变成方块或非方块的行和列而进行的常规细分或使图片A12从树根块变成变化大小的多个叶块而进行的多树细分,诸如四叉树(quadtree)细分或诸如此类,其中,其混合在图3中被示出,图3中图片区域首先被细分成树根块的行和列,所述树根块然后根据递归多树细分而进一步被细分成一个或多个叶块。
再者,数据流A14可具有被编码到其中的用于帧内编码的块A80的帧内编码模式,其将若干支持的帧内编码模式之一指派到相应的帧内编码的块A80。对于帧间编码的块A82,数据流A14可具有被编码到其中的一个或多个运动参数。一般来说,帧间编码的块A82不限于在时间上被编码。备选地,帧间编码的块A82可以是从超出当前图片A12本身之外的先前编码的部分(诸如图片A12属于的视频的先前编码的图片,或在编码器和解码器分别是可缩放编码器和解码器的情况下的层次上较低的层或另一视图的图片)所预测的任何块。
图3中的预测残差信号A24””也示为使图片区域变成块A84而进行的细分。这些块可称为变换块,以便将所述块与编码块A80和A82区分。实际上,图3示出编码器A10和解码器A20可使用使图片A12和图片A12'分别变成块而进行的两个不同细分,即对分别变成编码块A80和A82而进行的一个细分,以及对变成变换块A84而进行的另一细分。两个细分可相同,即每个编码块A80和A82可并发地形成变换块A84,但图3示出以下的情况:其中例如对变成变换块A84而进行的细分形成对变成编码块A80、A82而进行的细分的扩展,使得块A80和A82的两个块之间的任何边界重叠两个块A84之间的边界,或者换言之,每个块A80、A82与变换块A84之一相符或者与变换块A84的群集相符。然而,也可彼此独立确定或选择所述细分,使得变换块A84能够备选地跨越块A80、A82之间的块边界。就对变成变换块A84而进行的细分而言,类似的陈述因此如针对对变成块A80、A82而进行的细分所提出的那些陈述一样成立,即块A84可以是将图片区域常规地细分成块(带有或不带有对变成行和列而进行的布置)的结果、图片区域的递归多树细分的结果或其组合或任何其他种块动作。只是作为题外话,注意,块A80、A82和A84不限于是正方形、矩形或任何其他形状的。
图3进一步示出预测信号A26与预测残差信号A24””的组合直接产生所重构信号A12'。然而,应注意的是,可根据备选实施例将多于一个预测信号A26与预测残差信号A24””组合以产生图片A12'。
在图3中,变换块A84应具有以下意义。变换器A28和逆变换器A54以这些变换块A84为单位来执行其变换。例如,许多编解码器对所有变换块A84使用某种DST或DCT。一些编解码器允许跳过变换,使得对于变换块A84中的一些变换块,预测残差信号直接在空间域中被编码。然而,根据下文所描述的实施例,编码器A10和解码器A20以使得它们支持若干变换的方式来被配置。例如,由编码器A10和解码器A20支持的变换能够包括:
οDCT-II(或DCT-III),其中DCT代表离散余弦变换
οDST-IV,其中DST代表离散正弦变换
οDCT-IV
οDST-VII
ο标识变换(IT)
当然,在变换器A28将支持这些变换的正向变换版本中的所有正向变换版本时,解码器A20或逆变换器A54将支持其对应的反向或逆版本:
ο逆DCT-II(或逆DCT-III)
ο逆DST-IV
ο逆DCT-IV
ο逆DST-VII
ο标识变换(IT)
随后的描述提供关于哪些变换能够由编码器A10和解码器A20支持的更多细节。在任何情况下,应注意的是,支持的变换的集合可包括仅仅一个变换,诸如一个谱至空间或空间至谱变换。
如上文已概述的,图1至3已呈现为一示例,其中下文进一步描述的发明概念可被实现,以便形成根据本申请的编码器和解码器的具体示例。就此程度,图1和2的编码器和解码器可分别表示下面在本文中所描述的编码器和解码器的可能实现。图1和2然而只是示例。根据本申请的实施例的编码器然而可使用下文更详细概述的概念来执行图片A12的基于块的编码并且不同于图1的编码器,诸如例如,因为对变成块A80而进行的细分以不同于图3中例示的方式来被执行。同样,根据本申请的实施例的解码器可使用下文进一步概述的编码概念执行图片A12'从数据流A14的基于块的解码,但可例如与图2的解码器A20相异,因为所述解码器不支持帧内预测,或者因为所述解码器以不同于针对图3所描述的方式将图片A12'细分成块,及/或因为所述解码器不在变换域中但在例如空间域中从数据流A14导出预测残差。
如所讨论的,图1至3其中仅仅意在提供视频编解码器的粗略概述,本申请的随后所概述实施例可基于所述视频编解码器。VVC例如是图1和2的视频解码器和视频编码器可适配的视频编解码器的一示例。
以下描述被构造如下。初步地,VVC用作视频编解码器环境的一示例,并且基于这个示例,以下描述提供关于某些实验的报告,所述实验调查开放GOP编码结构的一般编码效率影响以及区段切换下的图片质量影响。再者,稍后描述的实施例不限于VVC,并且针对这些实施例所讨论的编码工具不限于针对VVC讨论的那些编码工具,但这些实验及其成果的表示提供引起稍后描述的实施例的动机。进一步,随后的描述将提供GOP编码结构和分段的概览,伴随着继而呈现约束的编码以使能开放GOP切换,诸如开放GOP分辨率切换,其中有效限制与切换相关联的漂移。后文中,呈现从与VVC有关的考虑显现的本申请的若干实施例。
以下提供用于流传输的VVC比特流和媒体分段内的结构的概览。媒体区段一般仅使用帧内编码工具与帧内随机接入点(IRAP)图片对准。IRAP图片可频繁出现在编码的视频比特流中,以允许诸如查找或快进之类的功能性,但也用作自适应HTTP流传输的切换点。用于视频点播(VoD)流传输的系统典型地将区段与IRAP图片周期对准,即IRAP图片典型地被放置在区段开头并且所期望的区段持续期确定IRAP图片之间的时间距离。然而,存在其中并非所有媒体区段都含有IRAP图片的用例(例如极低延迟流传输),使得能够使小区段可用于传输而不需要等待IRAP图片,并且因此减少内容生成侧处的时延。区段大小可取决于目标应用而在长度上变化。例如,VoD服务允许播放器创建较大的缓冲(例如30秒)以克服吞吐量波动,对于此情况,区段大小至多为若干秒(例如5秒)能够是合理的设计选择[3]。然而,要求更严格的端到端延迟的直播服务不允许客户端侧处的这类大的缓冲,并且因此要求更频繁的切换点和1秒或更少的更短区段。
只要解码延迟要求允许,两个IRAP图片之间的图片典型地以涉及呈现之前的重新排序的双预测的分层GOP结构来被编码,因为这类结构提供实质编码效率益处,如AVC[10]中引入的。GOP的层次结构能够用于时间可缩放性,其中解码所有图片直至给定层对应于给定帧率,以及对应的时间Id(Tid)值被指派到每个图片,如图1中针对8个图片的GOP大小所示出的。GOP能够被定义为按解码顺序从第一Tid0图片直至但不包含在后的Tid 0图片的所有图片。典型地,区段包含取决于IRAP周期和GOP大小的一个或多个GOP结构。虽然在HEVC中,解码的图片缓冲(DBP)中的参考图片时隙的量允许16个图片的典型GOP大小,但DPB容量在VVC中被增加,从而允许至多为32个图片的分层GOP大小。
按解码顺序在IRAP图片之后但按呈现顺序在它之前的图片在HEVC中被引入并被称为前导图片。它们能够被进一步区分成随机接入跳过前导(RASL)和随机接入可解码前导(RADL)。虽然RADL图片仅可使用按解码顺序从IRAP图片起的参考图片,但RASL图片此外可使用在IRAP之前的参考图片。瞬时随机接入(IDR)类型的IRAP图片重置DBP,并且仅能够具有前导图片,所述前导图片是引起所谓闭合的GOP结构的RADL图片。此外,在另一方面,干净随机接入(CRA)类型的IRAP图片不重置DPB。因此,按解码顺序来自CRA之前的重构的图片可用作对未来图片(即允许所谓的开放GOP编码结构的RASL图片)的参考。与RADL图片相比,RASL图片展现增加的编码效率但在参考图片不可用时(例如,未解码先前区段的情况下,在区段的开头处的所关联IRAP处的随机接入期间)可能变得不可解码。在[11]中能够发现VVC高级别句法的更详细概览。
图4示出例如视频数据流从具有不同分辨率的两个接连区段的连系的形成,其中第二区段采用具有来自第一区段的参考图片的开放GOP编码结构。特别是,参考的参考图片是图4中的那些矩形,箭头自所述矩形显现。所述箭头本身示出预测互依性,即它们从参考图片指向进行参考的图片。每个图片与某个时间ID Tid相关联,并且如能够看到的,编码顺序偏离于图片的输出/呈现顺序。如能够看到的,输出顺序排名9至15的图片是RASL图片,所述RASL图片直接或间接地参考它们属于的自己的区段(区段1)的CRA图片以及来源于先前区段(区段0)的图片(主要为具有输出顺序排名8的图片)。例如,视频的区段也可称为图片的序列,其可例如包括一个GOP。
当RASL图片的参考图片位于先前区段中并且流传输客户端在这类先前区段之后切换表示时,客户端解码器与编码器侧相比将使用参考图片的至少部分的不同变体来解码RASL图片。这类情况可能导致不一致的比特流(如果内容不被适当地生成)或者导致所重构RASL图片中的明显不匹配,并且此漂移可传播到所有RASL图片直至但不包含所关联CRA图片。下文中,讨论内容的适当生成,所述生成允许使用开放GOP结构,同时保持区段切换下的比特流一致性以及避免将在切换期间对视觉质量有害的不期望的漂移。
VVC中的众多帧间预测工具在开放GOP切换被执行时展现引起漂移的变化潜在性,并且同时,工具使用由一致性约束来限制。接下来,我们分析开放GOP分辨率切换下的VVC中的帧间预测工具的漂移潜在性,并且本文提出一种克服开放GOP分辨率切换的严重假象同时确保VVC一致性的约束的编码方法。
至于VVC编码工具的漂移潜在性,VVC中的编码工具的第一集合能够被分类为样本到样本预测,例如,从VVC的许多前身已知的常规基于块的平移运动补偿的样本预测,或称为仿射运动补偿(AMC)的VVC中新引入的帧间预测模式,其将预测块分解成较小子块,所述较小子块被各个地运动补偿以模拟仿射运动补偿[12]。作为AMC的可选组件的带有光流的预测细化(PROF)或双向光流(BDOF)是VVC中另外的新引入的帧间预测工具,所述帧间预测工具通过依靠基于光流的方法更改预测的样本,以便模拟逐样本帧间预测。当不同的表示使用这类样本到样本预测工具而被用作重构的参考时,所重构图片的视觉质量将偏向所述表示的视觉质量而远离初始表示的视觉质量。然而,这类样本到样本预测具有引起视觉上干扰假象的相对低的潜在性,却相反在RASL图片的给定序列中导致优美的质量过渡,因为第一视觉质量的预测源样本通过残差信息在第二视觉质量下被逐步更新。
图5例如示出光流工具300及其功能性。图片12内的帧间预测的块10c被示出。帧间预测的块10c与运动向量302相关联。也就是说,针对帧间预测的块10c在数据流中发信号通知运动向量302。运动向量302指示帧间预测的块10c的平移位移,在所述平移位移时参考图片304将被采样/复制,以便产生帧间预测的块10c的平移帧间预测信号。如果光流300将用于帧间预测的块10c,则光流工具300借助于基于光流的分析来改进平移帧间预测信号。更准确地说,与仅仅按根据运动向量302而位移的块10c的占据面积对参考图片304进行采样相反,光流工具300使用参考图片304内的比图片10c的占据面积略大的区域(即区域306),以便确定帧间预测的块10c的帧间预测信号,即通过检查区域306内的梯度以便确定帧间预测的信号。换句话说,在块10c的样本根据运动向量302而位移、落在参考图片304的子像素位置的情况下,除了可能通过插值滤波的使用之外,还通过光流工具300的使用、通过梯度敏感的FIR滤波的使用来确定块10c的帧间预测的信号的每个样本。
应注意的是,虽然图5仅仅示出一个参考图片和一个运动向量,但光流工具也可针对两个参考图片和两个运动向量执行光流分析,其中图片12处于参考图片与含有帧间预测的块10c的图片两者之间。
稍后,当描述本申请的实施例时,光流工具300可形成受排除在编码之外以便避免漂移的编码工具的一个示例。因此,根据下文描述的一些实施例,视频解码器和/或视频编码器支持这类光流工具。如图1和2示出视频解码器和视频编码器的可能实现,支持根据图5的光流工具的根据图1和2的视频解码器和编码器可表示针对本申请的实施例的示例性基础。无论如何,对于如何分别在解码器之侧和编码器之侧判定是否光流工具300将应用于帧间预测的块10c,存在不同的可能性。例如,光流工具300可以是固有地应用的编码工具。例如,是否光流工具应用于块10c可取决于与除了光流工具之外的另外的编码工具相关、针对块10c在数据流中发信号通知的一个或多个编码选项。甚至备选地,光流工具300可以是固有地应用的编码工具,针对所述编码工具,取决于块10c的大小而做出是否光流工具300应用于块10c的判定。当然,两个依赖性都可应用。甚至备选地,光流工具300可以是显式应用的编码工具,意味着句法元素被编码到数据流中,所述数据流排他地发信号通知是否光流工具300将应用于块10c。换句话说,这个句法元素将特定于块10c。注意,这个句法元素可不是在只是能够于工具350的应用与非应用之间切变的意义上的标志或二进制值。相反,所述句法元素可以是m-ary句法元素,其中其m个状态之一例如与工具350的应用相关联。备选地,句法元素可以是m-ary句法元素,其中其m个状态之一例如与工具350的非应用相关联。
在随后解释的实施例中,编码器向解码器发信号通知从RASL图片的编码排除某些编码工具,诸如光流工具300。稍后讨论的这个发信号不需要充当这些编码工具针对某个图片或图片的切片的块的可用性与否的实际控制。相反,下文进一步描述的实施例中呈现的这个发信号或指示而是可充当从编码器到解码器的一种附加发信号或承诺:下文进一步讨论的这些某些编码工具(或仅仅一个编码工具)已从某些图片(诸如RASL图片)的编码被排除。在后者情况下,随后讨论的指示或发信号对数据流内部配置信令是冗余的或作为其补充,所述配置信令停用某些编码工具,使得它们不可用于应用于某些图片或图片切片内的图片块。编码器遵守通过设置配置信令和(如果可适用)与块基础工具应用相应关联的句法元素而给出的保证,即,使得所述(一个或多个)工具不用于例如RASL图片中。因此,光流工具可以是可停用编码工具,所述可停用编码工具就其于帧间预测的块(诸如块10c)之应用而论可通过数据流内部的配置数据以图片或切片为单位来停用。例如,这类配置信令可由切片报头或图片报头所包括。是否光流工具300将应用于某个帧间预测的块10c将相应地基于配置信令来判定,并且仅仅如果配置信令对帧间预测的块10c是其部分的图片12(或图片12的切片)指示光流工具300被激活(即可用),才做出上文描述的显式发信号或关于其应用的固有判定。
后者的状况在图6中再次被描绘,因为对判定应用还是不应用某个编码工具的一般可能性对本文中讨论的编码工具类似。相应地,图6示出当前编码的图片12以及作为图片12的部分的块10。图片块10仅仅被说明性地描绘并且实际上仅仅是图片12划分成的一个图片块。块10属于的块级别可例如对应于针对其而做出帧内/帧间预测模式判定的块,但也存在其他可能性,诸如比后者块更小的块。已经针对图3来描述将图片12划分成块(诸如块10)的一可能的示例。表示性的编码工具350在图6中被示出。是否这个编码工具实际应用于块10可经由以下状况来被控制:应用可取决于如由箭头352指示的块的大小和/或针对预定的块10在数据流中发信号通知的编码选项,诸如块10是使用块内模式还是块间模式来被编码。图6中使用箭头354描绘后者依赖性。备选地或附加地,对于块大小依赖性,可应用与块纵横比或对应的基于递归多树的划分树的树划分级别相关的依赖性。编码选项可涉及以下项中的一个或多个:块被帧内编码、块被帧间编码、块被双预测、块利用相等间隔且相反放置的参考图片而被双预测和诸如此类。两个信息实体(即块大小/纵横比/分割级别和编码选项)在数据流中被发信号通知,即依据与将图片12划分成包含块10的块有关的划分信息的块大小/纵横比/分割级别和特定于例如块10的编码选项。与依赖于隐式块级别判定相反,以句法元素353的形式的显式信令可用于控制工具350针对块10的应用。句法元素将特定于块10以及特定于针对工具350的工具判定。虽然这个应用判定356在块级别上做出,但在更大的级别上,应用判定可附加地取决于在更大级别(诸如针对整个图片12或图片12顺着块编码顺序而被细分成的切片,图片12按所述块编码顺序被编码到数据流中)上做出的激活判定358。激活判定358可由前面提到的配置信令(诸如与图片12相关联的参数集合(诸如图片参数集合)或图片12的图片报头中或块10属于的切片的切片报头中的设置)来控制。并非判定356和358中的所有判定都可应用。然而,在以下情况下它们也都不可应用:后文中讨论的指示将然后不但将用于某个切片、图片或RASL图片的某个编码工具350的激活或停用指示为一种承诺或冗余信令,而且表现得像配置信令。
因此,虽然图6的编码工具350可以是图5的光流工具300,但它在图6中被描绘,以表示经历下文进一步讨论的编码器约束的判定的编码工具中的任何编码工具。
VVC中编码工具的第二集合用于从句法或图片的样本进行的句法(即模型参数)预测。类似于其前身,VVC允许经由时间运动向量预测(TMVP)使用来自所谓并置的参考图片的时间MV候选在块的基础上进行运动向量(MV)预测[13]。这个特征通过引入子块的基础上的更细的粒状TMVP变体(SBTMVP)来在VVC中被扩展,从而在发现并置的参考图片中的对应运动信息中添加位移步骤。
图7示出时间运动向量预测工具500。这个工具500是图6的编码工具350的另一示例以及下文针对编码器约束的指示进一步讨论的编码工具的一进一步的示例。时间运动向量预测工具用于基于与参考图片502内的块506相关联的运动向量510来预测图片12的帧间预测的块10c的运动向量508。虽然工具500能够将参考图片502内的共置的块的运动向量用作预测器508,但根据图7的示例,工具500首先导出块10c的位移向量504(诸如空间上预测运动向量),并使用这个位移向量504来定位参考图片502内的“共置的块506”,以及这个共置的块506的运动向量510然后用于时间上预测运动向量候选508。进一步,图7示出工具500可操作以仅针对到块10c的运动向量候选列表512中的插入来确定时间上预测运动向量508,最终一个运动向量预测器从所述列表被选出(诸如通过使用针对块10c在数据流中发信号通知的索引)。备选地,以引起列表512内的运动向量候选的某个顺序的某个方式来解释列表512,并且最终仅挑选/选择具有最高排名的运动向量候选以用于帧间预测块10c中的使用。
注意,图6的运动向量预测工具应被理解成足够宽泛以还涵盖合并意义上的时间运动向量预测的情况,即,为运动向量预测器整体提供来自并置的块的其他运动预测设置,诸如参考图片索引。
针对图6讨论的所有选项可用于工具500以判定是否将工具500实际应用于块10c。更准确地说,工具500可以是图6中编码工具350的一示例,其中以句法元素353的形式的显式信令用于控制工具500针对块10的应用,即因为针对块10c在数据流中发信号通知的索引从列表512选择或不选择出TMVP候选508。如果未选择,则工具500针对块10c维持无效,这被解读为工具500针对块10c的非应用。然而,经由判定358的更高级别上的配置信令可用于更全局地停用工具500,使得对于工具500针对其而被发信号通知停用的驻留在区域(图片或切片)中的块,列表512以无论如何排除TMVP候选508的方式来被解释,并且列表索引将不再充当前面提到的块级别判定控制。编码器可判定使用哪种方式以便遵守被给到解码器的任何承诺,以便避免RASL图片中的漂移,如本文中所教导的。
前面提到的第二集合中的另外的工具能够表征为样本到句法预测工具。VVC中引入的全新的帧间预测工具是解码器侧运动向量细化(DMVR),所述DMVR基于与当前图片具有相等和相反时间距离的两个参考图片的镜像属性来细化双预测中的MV的准确性。
图8示出解码器侧运动向量细化工具400。如果被应用到图片12的帧间预测的块10d,则出于从参考图片404帧间预测这个块10d的缘故,工具400改进针对这个块10d在数据流中所编码/发信号通知的运动向量402(借助于通过最佳匹配搜索的使用来细化这个运动向量402)。最佳匹配搜索可按由解码器和编码器支持的最高分辨率(诸如1/16像素分辨率)来执行。发信号通知的运动向量可以是较低的分辨率的,并且仅仅用于“实质上”指示由DMVR工具最终确定的细化的运动向量。针对于什么应与参考图片进行匹配以便执行最佳匹配搜索,存在不同的可能性。一个可能性将是使用与帧间预测的块10d相邻的已解码的部分。这个部分将使用发信号通知的运动向量处及周围的运动向量候选而经历运动向量位移,并且产生最佳匹配的候选将被选为细化的运动向量。备选地,可以的是,块10d是针对其而存在(将由工具400进行细化的)发信号通知的运动向量的对的双预测的块。也就是说,在该情况下,帧间预测的块10d是双预测的块。可以的是,参考图片将具有按呈现顺序介于中间的图片12,即参考图片在时间上位于图片12之前和之后。可选地,所述两个参考图片与图片12在时间上相等地间隔开。工具400甚至可排他地专用于此情况,即工具400将取决于块编码选项在块级别上固有地被激活,从而指示块10d基于与当前图片10间隔相等并且具有介于其间的图片10的参考图片来被双预测。在那个情况下,发信号通知的运动向量(其中一个将是向量402)的所述对将通过在运动向量对候选(所述候选包含和围绕发信号通知的运动向量的所述对)之中执行最佳匹配搜索来被细化。最佳匹配搜索能够例如通过测试在表示运动向量对候选的部分所采样的参考图片之间的类似性来执行。运动向量对候选能够限于以下的运动向量对候选:其中一个参考图片的一个运动向量候选与这个参考图片的对应信号运动向量以与另一参考图片的另一运动向量候选偏离于此另一参考图片的另一信号运动向量相反的方式偏离。对于类似度,能够使用SAD或SSD。最佳匹配运动向量对候选将然后被用作信号运动向量的替换406,即参考图片404的向量402将由406替换,并且另一参考图片的另一发信号通知的向量将由运动向量对候选的另一向量替换。还将存在其他可能性。例如,通过在所述发信号通知的运动向量处及周围的所述两个发信号通知的运动向量执行所述两个参考图片中的所采样补片的平均的最佳匹配搜索,能够各个地细化双预测的块10d的所述两个发信号通知的运动向量。
针对是否MVR工具400将应用于块10d的判定,针对图6所讨论的所有备选可应用。也就是说,MVR工具400可以是编码工具350。
VVC中另外的新工具是跨分量线性模型(CCLM),CCLM允许使用线性模型从相应的亮度分量来帧内预测块的色度分量,其中模型参数从重构的亮度样本值导出。所述线性模型通过以下的方式将所子采样的亮度样本rec′L变换成色度预测:
P(i,j)=a·rec′L(i,j)+b,
其中参数a和b从相邻的亮度和色度样本被导出如下。其中Xl和Xs分别表示两个最大和两个最小相邻样本的平均值,以及Yl和Ys分别表示对应色度样本对的平均值,所述参数被导出为:
a=(Yl-Ys)/(Xl-Xs)
b=Ys-a·Xs
由于参数求导过程只虑及相邻样本值的极值,因此即使在相邻块中的单样本漂移异常值的情况中,所述过程也易于广泛漂移。还有由于线性模型,如果a大,则亮度漂移可能变得被放大。对于虑及相邻样本值中所有相邻样本值的其他帧内预测模式,漂移传播更不太明显,并且不能够被线性放大。由于这个固有不稳定性,这个模式在被应用于其中可接受约束的漂移的应用(如HTTP自适应流传输中的开放GOP切换)中时需要特别小心。除此之外,由于所描述应用的上下文中,漂移可能仅发生在RASL帧(即运动预测的帧)中。如果编码器判定使用CCLM(即帧内预测模式),则这将通常是由于缺少暗示出高时间活动的区的适当运动补偿的预测器。在这类区中,针对开放GOP切换的所预期的重构漂移被预期为高,从而对所讨论的不稳定性效果甚至贡献更多。
图9示意性地示出跨分量线性模型工具100的操作的模式。示出块10a,针对所述块来应用工具100。使用任何类型的预测120并且通过从数据流解码122残差信号来重构这个块10a的亮度分量,其中针对亮度来组合预测信号和残差信号。工具100的目的是基于所重构亮度分量124来预测(一个或多个)色度分量。这使用线性模型或线性映射106来进行。这个线性映射106使用标量线性函数,以便基于样本126的所重构亮度分量针对块10a的每个样本126来逐样本预测样本126的色度分量。标量线性函数的线性参数(即上文所表示的a和b),通过块10a的邻域112中的已经重构的样本的亮度和色度分量的统计的分析针对块10a而块全局地被确定。特别地,通过工具100执行的统计分析124在图9中在128被指示,并且可针对每个分量来确定在邻域112中的所重构样本内出现的外部亮度及色度值。例如,可使用两个最小亮度值以及两个最大亮度值的平均值。针对将被预测的色度分量进行所述步骤。基于作为结果的四个平均值,针对邻域112内的亮度值的跨度及色度值的跨度的测量被确定,并且其间的比率用作线性映射106的标量线性函数的斜率。针对亮度的最小值的平均值——斜率x、针对色度的最小值的平均值用于确定标量线性函数的截距。因此执行的参数求导108产生标量线性函数,并且所重构亮度分量124的每个亮度样本用于预测块10a内的对应色度样本值,由此产生块10a的色度分量间预测信号。图9中未示出但可能的是,数据流可具有在其中被编码的色度残差信号,以便校正针对色度分量C1和/或C2的色度分量间预测信号。
再者,工具100是图6中的编码工具350的另一示例。换句话说,是否编码工具应用于图片的块10a可根据针对图6讨论的选项中的任何选项来被判定。值得注意的是,VVC不提供用于图片全局地或至少切片全局地停用工具100的任何方法,但根据稍后描述的一实施例,这类发信号被提出,由此避免由工具100确切地引起的有害漂移。更准确地说,工具100可以是图6中的编码工具350的一示例,其中以句法元素353的形式的显式信令用于控制工具100针对块10的应用。句法元素能够例如是打开或关闭用于块10的工具100的标志。就稍后针对实施例所讨论的编码约束的指示的讨论而言,存在两个可能性:它只能够向接收者(即,解码器)通知关于针对某个图片12的所有句法元素353指示工具100的非应用的事实,或它能够备选地还充当针对图片12停用工具100的配置信令,作为其结果,数据流将不运送针对那个图片12内部的块10的任何句法元素353。将VVC作为一示例,例如,没有配置信令存在以便以图片或切片的粒度来停用工具100。在VVC中,这类配置信令仅存在以供控制工具100针对图片的序列的激活。逐RASL停用因此是不可行的。
还有的另外的新工具被引入至VVC的回路滤波级,并且表示亮度映射和色度缩放(LMCS),其中色度样本值使用从亮度样本导出的参数来经历缩放,如图10中示出的。
此处也存在色度对亮度依赖性,但相比CCLM的情况下不太明显。在过程的色度缩放部分期间,所变换和去量化的色度残差根据从相邻虚拟管线数据单元(VPDU)的亮度样本导出的模型参数来被缩放。出于管线时延减少的目的,CCLM依赖于相邻VPDU的样本。然而,在LMCS中,虑及相邻亮度样本中的所有亮度样本,从而允许平均化VPDU相邻样本中的漂移异常值。还有,模型参数用于缩放残差信号,所述残差信号不聚集漂移但被直接发信号通知。出于那些原因,工具具有小得多的放大漂移的潜在性,但仍应在对受控漂移应用进行编码时被考虑。
图11中描绘针对LMCS工具200的操作的模式。此处的想法为执行亮度工具映射212,以便按编码亮度色调标度208而非呈现亮度色调标度210针对预定的图片12执行亮度分量预测202和亮度分量残差解码204。更准确地说,虽然重构的亮度值可在线性标度上以某个比特深度表示图片12的所重构信号的亮度分量,但亮度色调映射212可使用诸如逐图片线性色调映射函数之类的某个色调映射函数或某个其他色调映射函数来将这个标度210映射到编码标度208上。色调映射函数可在诸如图片12的图片参数集合之类的数据流被发信号通知。所述函数由编码器适当地确定。因此,通过针对图片12的块10b的帧间预测202获得的帧间预测信号在按编码标度208与残差信号204组合之前经历亮度色调映射212,以产生图片12的所重构亮度分量。对于帧内预测的块,使用帧间预测206。在编码标度208域内执行帧内预测。工具200的进一步的目标是根据亮度色调映射212来控制色度分量的量化误差。即,色度分量量化误差针对每个块单独地来被控制,并且通过亮度色调映射212来适于亮度分量的影响。为此,针对图片12的块10b从图片块10b的邻域222内的图片12的所重构亮度分量的编码亮度色调标度版本的平均值220来确定色度残差标度因数216。从数据流针对图片块10b解码的色度残差信号224根据因此确定的色度残差标度因数216和用于进行校正228的这个标度以及图片块10b的帧内色度预测信号230来被缩放226。相较于亮度分量,帧内色度预测信号230可使用相同预测工具或其子集。通过将邻域222用于确定平均值220,块10b的亮度和色度分量可并行而非串行地被重构。图片12的所重构亮度和色度分量然后经历逆亮度色调映射240,以产生图片12的所重构最终结果并且产生接下来将被编码/解码的图片的基础,即用作此随后被编码/解码图片的参考图片。
针对编码工具200,如采用针对先前附图讨论的其他编码工具来进行的一样,相同的注释是有效的,即,编码工具200是图6的编码工具350的一示例,且用于判定这个编码工具对针对图6所讨论的特定块的应用的选项可不被使用。作为一示例,针对编码工具300可排除逐块判定356,但配置信令可用于在逐图片或逐切片的基础上控制应用。
来自句法至句法和样本至句法帧间预测工具的预测的MV中的误差具有导致随后的样本至样本预测工具中的严重假象的相对高潜在性,所述随后的样本至样本预测工具将这些错误预测的MV用作空间或时间MV候选。这对于在开放GOP切换中展现最为可见的假象的(SB)TMVP以及还有DMVR尤其有效,因为不当运动向量中的误差可按不断增加的量在随后的图片上进行传播。然而,所述情况还适用于其他预测模型,例如CCLM和/或LMCS,它们基于从所重构样本值导出的参数来被执行。图12示出一般句法或参数预测误差对使用以常规开放GOP编码的32个图片的GOP大小的RASL图片的视觉和客观质量的影响。显而易见,RASL图片遭受所重构图片的亮度以及色度分量中的显著假象。
开放GOP切换中的第三问题可能产生于VVC中的自适应参数集合(APS)的使用,所述APS携带自适应回路滤波器(ALF)的滤波器系数、具有色度缩放的亮度映射(LMCS)的参数及量化缩放列表。因为RASL图片可参考按解码顺序在相应CRA之前被传送的APS,所述APS在连续解码期间是可用的,但当在CRA图片进行随机接入时是不可用的,因为在此情况下所关联的RASL图片被丢弃。因此,开放GOP分辨率切换可能引起对使非容错解码器崩溃的缺失APS的参考或造成视觉假象(在使用具有相符匹配标识符值的不当APS的参数时)。类似于句法预测工具,这个问题具有造成视觉干扰直至完全的解码器故障的高潜在性。
为了在执行开放GOP分辨率切换时避免上文所描述的问题,可使用下文中描述的由三个支柱组成的约束的VVC编码方法。
第一,与CRA相关联的RASL图片被约束,使得没有按解码顺序在CRA之前的图片被选择为并置的参考图片来执行句法至句法预测,即(SB)TMVP。由此,与编码器侧上确切相同的参考图片及运动信息被使用,并且来自由于较早区段图片的不正确的源运动信息的任何句法预测误差被防止。在可能的实现中,按解码顺序的第一RASL图片被限于仅将其相关联的CRA图片用作并置的参考图片,所述参考图片自然托管仅零个运动向量,而另外的RASL图片得以接入按解码顺序的第一RASL图片及在后图片的非零时间MV候选。针对样本至句法预测工具,DMVR对具有按解码顺序在所关联的CRA之前的活动参考图片的所有RASL图片为禁用。在另一备选中,DMVR对所有RASL图片为禁用,而不管其参考图片,并且在进一步的备选中,DMVR仅对用作在后图片的并置的参考图片的RASL图片为禁用,并且在还有的另外的备选中,DMVR对除了属于最高时间层且由此不用作参考的RASL图片以外的所有RASL图片为禁用。由此,与其他RASL图片的编码器侧或受漂移影响的样本相异的来自较早区段的参考图片的错误样本值不引起样本至句法预测中的误差。
为了确保区段切换后的VVC一致性,必须针对具有在所关联的CRA之前的参考图片的所有RASL图片来约束另外的工具,即光流相关工具BDOF及PROF的使用被禁用。在一备选中,可以的是,为了简单起见,对所有RASL图片禁用BDOF和PROF。另外,视频内的独立编码的子图片的VVC的新特征(其例如在依赖360度视口的视频流传输是有用的)必须被禁用以使用RPR。上文工具约束中的所有工具约束也是在VVC规范中被定义以启用RPR的一致性约束的部分。除VVC中与RPR使用相关联的一致性约束以外,也要求还有的另外的工具约束,因为采用从所重构样本进行参数预测的预测技术也可产生可注意的假象。因此,在我们的实现中,通过编码器侧搜索算法逐块约束来禁用CCLM,因为当前的VVC句法仅允许逐序列禁用,这强行使整体编码效率显著降低。这有效地允许确保编码器侧的漂移的避免,但在没有彻底的低级别剖析的情况下,它不能够在解码器上容易地被确认。还有,由于启用但不使用所述工具,不必要的比特(即供CCLM使用的编码单元级别标志,诸如cclm_mode_flag或cclm_mode_idx)正被发送以发信号通知编码判定不要使用它。
第二,也对于开放GOP编码结构(即按解码顺序后接它的所关联的RASL图片的CRA图片),用于所有图片的必要的APS需要存在于区段内。注意,对于随机接入开放GOP流,这类约束并非必要,并且RASL图片被允许参考按解码顺序在所关联的CRA图片之前的比特流中所传送的APS。由于当在这类CRA图片进行随机接入时,RASL图片被丢弃而这个参考并非有问题的。还有,当不执行切换时,这类APS在连续解码中是可用的。然而,这些APS可能在具有开放GOP切换的流传输中不可用,并且因此需要防止被参考。在我们的实现中,与ALF、LMCS及量化缩放列表相关的处理以与针对封闭的GOP编码结构类似的方式来被重置。
第三,从VVC高级别句法的角度,比特流阶梯中的变体的各个编码必须以协调的方式来执行,其中牢记解码器侧上的开放GOP切换的目标。因此,所有区段变体的序列参数集合(SPS)需要被对准,使得区段切换不通过SPS中的改变触发新编码的层视频序列的开始。例如,利用适合的协调,SPS将指示比特流阶梯内的最大分辨率、匹配块大小及色度格式、适合的匹配级别指示符及相关约束标志,诸如gci_no_res_change_in_clvs_constraint_flag、sps_ref_pic_resampling_enabled_flag及sps_res_change_in_clvs_allowed_flag,它们具有在解码器侧上启用RPR的使用的适当配置。具有比所指示最大分辨率或级别所要求的能力更低的能力的装置需要通过系统机制被服务有调节的SPS。
VVC中的RPR已经以约束的方式来被设计,以限制其实现及运行时间复杂性,如从上文工具约束讨论显而易见的。这个复杂性考虑中的重要方面在于在RPR使用中接入缩放的参考样本时的存储器带宽是可接受的,并且没有比无需RPR的情况显著地更高。VVC中的编码的图片伴随用于确定两个图片之间的缩放因数的所谓缩放窗口。为了设置对RPR的存储器带宽要求的界限,使用RPR的图片的缩放窗口与其参考图片的缩放窗口的关系被限于最多允许八倍放大及两倍缩小。换句话说,假设每个缩放窗口匹配其表示的图片大小,允许当切换到具有八倍高的图片大小的表示时使用RPR。然而,如果图片大小在每个维度上减小不小于一半,则下切换仅可使用RPR。
典型地,在自适应流传输场景中,情况是以逐步方式来执行上切换,即逐渐提高分辨率或质量。然而,当谈到下切换时,可发生的是,当播放器的缓冲不足时,播放器切换至最低质量以避免缓冲欠载运行,这意味着下切换可能不逐步发生。VVC中减轻RPR的这个局限性的一个方式是利用封闭的GOP结构来编码最低质量表示,使得它能够针对当图片大小在这类非逐步下切换事件期间减小至小于一半时用作回退。
下文中,描述涉及支持上文所讨论的编码工具100、200、300、400及500中的一个、多个或所有编码工具的解码器及编码器的实施例。接下来所描述的解码器及编码器可按依从图1和2的方式来实现。尽管上文已经主要针对解码器侧讨论工具100、200、300、400及500,但明确地是,对应的工具的描述可易于转移到编码器侧上,差异在于编码器将涉及的信息插入到数据流中而非将它从所述数据流进行解码。每个所支持的编码工具表示一个编码工具350。在块的基础上使用显式句法元素控制353的任何编码工具涉及在块的基础上编码句法元素的编码器及从数据流解码所述句法元素的解码器。编码工具100可以是仅有的使用这个显式块基础句法元素的编码工具。其他编码工具200、300、400及500可将固有的块基础应用判定356连同图片基础或切片基础配置信令用于完全地停用工具。
随后解释的实施例涉及指示或信令,其向解码器指示是否已经遵守与一个或多个编码工具的刚被提到的集合的使用有关的某些编码约束。编码器在数据流中发信号通知这个指示,并且通过遵守对应的编码约束来相应地限定其编码。解码器转而使用指示并且将它解读为漂移限制性的保证或指示(在区段切换的情况下)。根据一备选实施例,下文讨论的指示/信令也能够用于实际上停用编码工具中的一个或多个。例如,在VVC中,迄今为止不可能在图片或切片的基础上停用工具100。下文讨论的指示/信令能够除了承诺功能之外还承担配置信令的功能,以便针对某些图片/切片停用工具100。用于块基础判定356的块基础句法元素则能够被排除并且未被编码成数据流以及从数据流被解码。
随后,呈现使用所呈现约束的信令以启用开放GOP分辨率切换的组合,即,当执行流切换时,CRA的RASL图片能够利用可接受漂移来被解码,因为某些编码工具在RASL图片中不是活动的。虽然最先进技术允许对作为所呈现方法的部分的工具中的一些工具(例如TMVP、SBTMVP、BDOF、PROF和DMVR)的这类指示,但在所呈现方法中存在值得注意的附加约束,所述附加约束被要求避免来自样本至句法预测工具(即,CCLM和/或LMCS)的严重假象。因此,存在对具有在比特流中能够指示这类工具针对某些图片(即CRA的RASL图片)不活动的编码器的需要。
VVC以扩展机制为特征,以按向后兼容的方式将比特标志添加到图片报头(PH)及切片报头(SH)句法。出于这个目的,相应SPS指示PH或SH句法中的用于这类目的的额外比特的数量,其在读取句法时必须被剖析,并且求导被用于将此额外比特指派到标志或变量值。下表示出由相应语义伴随的相应SPS和PH句法。SH句法和语义类似于PH句法和语义。
等于1的sps_extra_ph_bit_present_flag[i]规定第i额外比特存在于参考SPS的PH句法结构中。等于0的sps_extra_ph_bit_present_flag[i]规定第i额外比特不存在于参考SPS的PH句法结构中。
变量NumExtraPhBits被导出如下:
ph_extra_bit[i]可具有任何值。符合本说明书的这个版本的解码器应忽略ph_extra_bit[i]的存在和值。其值不影响在本说明书的这个版本中规定的解码过程。
未知晓的解码器至少能够正确地剖析比特流并且对它进行正确解码,而知晓额外比特含义的解码器能够进一步解读额外比特指示并且相应地行动,例如向客户端建议在无严重漂移的情况下进行流切换是可能的,因为根据所呈现方法的约束被满足。同样地,文档格式封装器(packager)、HTTP流传输服务器或甚至RTP流传输服务器能够在封装、提供和服务内容方面(以利用比特流切换的方式)考虑到这个比特流指示。
本发明的一实施例如下在RASL图片或所关联CRA图片的PH或SH句法的额外比特中携带所呈现方法的指示。在SPS语义中,通过sps_extra_ph_bit_present_flag[i]的索引i将特定额外比特标志识别为指示PH/SH额外比特标志的存在,其指示所呈现方法。例如,PH中的第一额外比特存在能够如通过第一SPS PH额外字节的第一SPS PH额外比特(i=0)来被识别如下。
变量ConstraintMethodFlagPresentFlag的值被设置成等于sps_extra_ph_bit_present_flag[0]。注意,索引0被使用,但另一索引能够替代地被使用,即,sps_extra_ph_bit_present_flag[i]之中的比特被选择以具有以下含义:RASL图片在被使用的工具方面是约束。
在PH语义中,指示所呈现约束方法的特点的相应变量被导出如下。
变量ConstrainedRASLFlagEnabledFlag/ConstrainedCRAFlagEnabledFlag的值被设置成等于(ConstraintMethodFlagPresentFlag&&ph_extra_bit[0])。注意,索引0被使用,但取决于由sps_extra_ph_bit_present_flag[i]指示的值以及哪个索引用于针对RASL图片ph_extra_bit[j]的约束,PH中的额外标志中的第j标志将指示所述约束对于RASL图片是否恰当。
备选1(携带RASL图片中的信令):当ConstrainedRASLFlagEnabledFlag等于1时,在没有使用CCLM的情况下编码当前图片。用于BDOF、DMVR、PROF、(SB)TMVP和LMCS的序列级别约束标志以及PH/SH控制标志已经处于VVC版本1中,而CCLM错过带有图片或切片范围的控制标志。
备选2(携带关联的CRA图片中的信令):当ConstrainedCRAFlagEnabledFlag等于1时,在没有使用TOOLSET的情况下编码与当前图片相关联的RASL图片,其中TOOLSET指代CCLM和/或LMCS和/或BDOF和/或PROF和/或DMVR,及/或RASL图片不使用在当前图片(即CRA图片)之前的用于(sb)TMVP的任何并置的图片。
类似于上文的一备选实施例能够被构建以用于针对RASL或CRA图片的切片的SH信令。
在另一备选实施例中,上文的约束如下通过在具有相同含义的DCI、VPS或SPS中添加一般约束标志(例如,一般约束信息句法中的gci_rasl_pictures_tool_constraint_flag或gci_cra_pictures_tool_constraint_flag)而被指示为CVS、CLVS和/或比特流的属性/约束。
对应于备选1:等于1的gci_rasl_pictures_tool_constraint_flag规定用于OlsInScope中的所有RASL图片的ConstrainedRASLFlagEnabledFlag应等于1。等于0的gci_rasl_pictures_tool_constraint_flag不强加这类约束。
对应于备选2:等于1的gci_cra_pictures_tool_constraint_flag规定用于OlsInScope中的所有CRA图片的ConstrainedCRAFlagEnabledFlag应等于1。等于0的gci_cra_pictures_tool_constraint_flag不强加这类约束。
即,当设置这类一般约束标志时,在没有使用TOOLSET的情况下编码与CVS、CLVS和/或比特流中的CRA相关联的所有RASL图片——其中TOOLSET指代CCLM和/或LMCS和/或BDOF和/或PROF和/或DMVR,及/或RASL图片不使用在当前图片(即CRA图片)之前的用于(sb)TMVP的任何并置的图片。
在另一备选实施例中,上文的约束在PPS扩展句法中被指示。与CRA相关联的RASL图片能够参考PPS,所述PPS指示上文的约束是活动的,而比特流的其他图片确实参考不指示上文的约束的PPS。
在另一备选实施例中,上文的约束信令通过CRA图片中或所关联的RASL图片中的SEI消息或针对图片的整个编码的层视频序列来被执行。
在另一备选实施例中,上文的约束信令用于有条件地发送编码单元级别上的CCLM标志。
在另一备选实施例中,上文的约束信令不适用于与CRA相关联的所有RASL图片,但考虑到可接受的漂移以及招致编码效率损失、取决于实际工具而被限于RASL图片的子集:
-DMVR(与上文的描述文本中相同):DMVR对具有按解码顺序在所关联的CRA之前的活动参考图片的所有RASL图片为禁用。注意,当前图片能够具有:其(一个或多个)参考图片列表(RPL)中的活动参考图片(实际上用于预测);以及非活动参考图片,所述非活动参考图片不用于预测当前图片的而是(按解码顺序)随后图片的句法或样本,并且其因此未准备好从所解码图片缓冲(DPB)被移除。在另一备选中,DMVR对所有RASL图片为禁用,而不管其参考图片,并且在另一备选中,DMVR仅对用作在后图片的并置的参考图片的RASL图片禁用,并且在还有的另外的备选中,DMVR对不属于最高时间层的RASL图片为禁用。所述备选可被组合。
-BDOF和PROF:对所有RASL图片或仅对具有按解码顺序在所关联的CRA之前的活动参考图片的RASL图片为禁用。
根据一实施例,所述指示在数据流中以SEI消息的形式被发信号通知。如上文所提到的,SEI消息对于图片的序列(例如,编码的视频序列、CVS)的所有图片可以是有效的。例如,SEI消息可在所述序列中被发信号通知。相应地,解码器可从SEI消息的存在或从SEI消息中的指示推断所述序列的所有RASL图片以排除编码工具的预定的集合的方式而被编码。例如,根据这个实施例,编码工具的集合至少包括基于跨分量线性模型的预测工具100和解码器侧运动向量细化工具400。
下文中,描述上文所描述的发明的进一步的实施例。
D1.1.用于从数据流解码视频的视频解码器,其配置成从数据流解码指示[例如,gci_rasl_pictures_tool_constraint_flag],所述指示对视频的图片的序列有效并且指示图片的序列内的RASL图片以排除一个或多个编码工具的预定的集合的方式来被编码[例如,作为一种承诺,使得解码器知道,通过连系以不同空间分辨率和/或不同SNR来编码的视频的分开编码的开放GOP版本而进行的开放GOP切换不导致RASL图片中的过多漂移]。
D1.2.任何先前实施例D1.#的视频解码器,其中一个或多个编码工具的所述集合包括基于跨分量线性模型的预测工具(100)。
D1.3.实施例D1.2的视频解码器,其中,根据基于跨分量线性模型的预测工具,图片块(10a)的色度分量(102)使用线性模型(106)从图片块(10a)的亮度分量(104)来被预测,所述线性模型的参数从图片块的已解码的邻域(112)中的极值亮度和色度值(110)来被确定(108)。
D1.4.任何先前实施例D1.#的视频解码器,其中一个或多个编码工具的所述集合包括亮度色调映射和色度残差缩放预测工具(200)。
D1.5.实施例D1.4的视频解码器,其中,根据亮度色调映射和色度残差缩放预测工具,用于预定的图片(12)的亮度分量预测(202)[例如帧间预测]和亮度分量残差解码(204)以编码亮度色调标度(208)来被执行(呈现亮度色调标度(210)通过亮度色调映射(212)而被映射到所述编码亮度色调标度上),以获得预定的图片的重构的亮度分量的编码亮度色调标度版本(214),用于预定的图片的图片块(10b)的色度残差标度因数(216)从图片块的邻域(222)内的预定的图片的重构的亮度分量的编码亮度色调标度版本的平均值(220)来被确定,以及从数据流针对图片块而解码的色度残差信号(224)根据色度残差标度因数而被缩放(226)且用于校正(228)图片块的帧内色度预测信号(230)。
D1.6.任何先前实施例D1.#的视频解码器,其中一个或多个编码工具的所述集合包括光流工具(300)。
D1.7.实施例D1.6的视频解码器,其中光流工具用于通过基于光流的分析来改进预定的帧间预测的块(10c)的平移帧间预测信号。
D1.8.任何先前实施例D1.#的视频解码器,其中一个或多个编码工具的所述集合包括解码器侧运动向量细化工具(400)。
D1.9.实施例D1.8的视频解码器,其中解码器侧运动向量细化工具用于改进数据流中编码的发信号通知的运动向量(402)(通过经由在所述发信号通知的运动向量处及周围的运动向量候选之中执行最佳匹配搜索来细化所述发信号通知的运动向量),以便从参考图片(404)帧间预测预定的帧间预测的块(10d)。
D1.9a.实施例D1.9的视频解码器,其中解码器侧运动向量细化工具配置成使用帧间预测的块的已针对参考图片而解码的邻域来执行最佳匹配搜索。
D1.9b.实施例D1.8的视频解码器,其中解码器侧运动向量细化工具配置成细化在数据流中编码的发信号通知的运动向量(402)的对(通过在包含和围绕发信号通知的运动向量的所述对的运动向量对候选之中执行最佳匹配搜索),以用于从参考图片(404)的对帧间预测预定的帧间双预测的块(10d),所述参考图片在时间上被定位在所述预定的帧间双预测的块(10d)的图片之前和之后[按呈现顺序]。
D1.10.任何先前实施例D1.#的视频解码器,其中一个或多个编码工具的所述集合包括时间运动向量预测工具(500)。
D1.11.实施例D1.10的视频解码器,其中,根据时间运动向量预测工具,帧间预测的块的运动向量候选列表形成包含来自先前解码的图片(502)的运动向量候选征集。
D1.12.实施例D1.11的视频解码器,其中,根据时间运动向量预测工具,帧间预测的块的运动向量候选列表形成包含来自由运动向量预测器(504)指向的先前解码的图片的块(506)的运动向量候选征集。
D1.13.实施例D1.12的视频解码器,其中运动向量预测器包含时间运动向量预测器。
D1.14.任何先前实施例D1.#的视频解码器,其中所述指示被包含在以下之一中:
数据流的解码器能力信息部分,以及
数据流的视频或序列参数集合,以及
补充增强信息消息。
D1.15.任何先前实施例D1.#的视频解码器,其中所述指示包括共同指示针对图片的序列内的RASL图片的编码而排除一个或多个编码工具的预定的集合的所有编码工具的一个比特。
D1.16.任何先前实施例D1.#的视频解码器,其中所述解码器配置成支持参考图片重采样。
D1.17.实施例D1.16的视频解码器,其中,根据参考图片重采样,帧间预测的块的参考图片经历样本重采样,以便弥合所述参考图片与其中含有所述帧间预测的块的图片之间的缩放窗口大小偏差或样本分辨率偏差,来为所述帧间预测的块提供帧间预测信号。
D1.18.先前实施例D1.#中的任何实施例的视频解码器,其中一个或多个编码工具的所述集合包括[例如,200、300、400、500]一个或多个第一固有应用的编码工具,其中的每个针对预定的块取决于针对所述预定的块在数据流中发信号通知的一个或多个编码选项而被应用,并且涉及另外的编码工具(除相应另外的编码工具以外),和/或一个或多个第二固有应用的编码工具,其中的每个针对预定的块取决于所述预定的块的大小而被应用。
D1.19.先前实施例D1.#中的任何实施例的视频解码器,其中一个或多个编码工具的所述集合包括[例如,100、500]一个或多个显式应用的编码工具,其中的每个针对预定的块取决于被编码到数据流中的句法元素而被应用于所述预定的块,以用于排他地发信号通知相应编码工具针对所述预定的块的应用。
D1.20.实施例D1.19的视频解码器,其中所述解码器配置成针对RASL图片内的块以及针对除RASL图片以外的图片的块从数据流解码句法元素。
D1.21.实施例D1.19的视频解码器,其中所述解码器配置成仅针对除RASL图片以外的图片内的块从数据流解码句法元素[例如,由此节省RASL图片中的比特]。
D1.22.先前实施例D1.#中的任何实施例的视频解码器,其中所述解码器配置成支持帧内预测块解码模式及帧间预测块解码模式。
D1.23.先前实施例D1.#中的任何实施例的视频解码器,其中图片的序列以一个CRA图片开始并且包含所述CRA图片,以及包括直至——按编码顺序——并终止于紧接在CRA图片之前的图片的图片,或包括按编码顺序为连贯且包括多于一个CRA的图片。
D1.24.先前实施例D1.#中的任何实施例的视频解码器,其中一个或多个编码工具的所述集合包括一个或多个可停用编码工具,其中的每个针对它对图片块的应用通过数据流内部的配置信令以图片或切片为单位而可停用。
D1.25.先前实施例D1.#中的任何实施例的视频解码器,其配置成使用指示以看出是否开放GOP切换导致可忍受的漂移。
D1.25a.先前实施例D1.#中的任何实施例的视频解码器,其配置成使用指示以看出是否开放GOP切换导致样本不匹配但保留句法和参数设置。
D1.26.先前实施例D1.#中的任何实施例的视频解码器,其中
所述指示指示图片的序列内的所有RASL图片以排除一个或多个编码工具的预定的集合的方式来被编码,和/或所述指示指示以排除一个或多个编码工具的预定的集合的方式来编码具有按解码顺序在CRA图片之前的参考图片的图片的序列内的所有RASL图片,所述CRA图片与所述所有RASL图片相关联,和/或所述指示指示以排除一个或多个编码工具的预定的集合的方式来编码用作在后图片的时间运动向量预测参考图片的图片的序列内的所有RASL图片,和/或所述指示指示以排除一个或多个编码工具的预定的集合的方式来编码不属于最高时间层的图片的序列内的所有RASL图片。
D1.27.先前实施例D1.#中的任何实施例的视频解码器,其中所述指示指示图片的序列内的RASL图片以排除一个或多个编码工具的预定的集合的方式、以使得以下情况成立的方式来被编码:
对于一个或多个编码工具的预定的集合中的一个或多个编码工具的第一子集,第一特性适用于的所有RASL图片以排除一个或多个编码工具的预定的集合中的一个或多个编码工具的第一子集的方式来被编码,以及对于一个或多个编码工具的预定的集合中的一个或多个编码工具的第二子集,所有RASL图片或第二特性适用于的所有RASL图片以排除一个或多个编码工具的预定的集合中的一个或多个编码工具的第二子集的方式来被编码,第一和第二子集相互不相交。
D1.28.实施例D1.27的视频解码器,其中第一特性和/或第二特性被选自:具有按解码顺序在CRA图片之前的参考图片,所述CRA图片与所述RASL图片相关联,用作在后图片的时间运动向量预测参考图片,以及不属于最高时间层。
D1.29.实施例D1.27(或更高)中的视频解码器,其中第一子集包含时间运动向量预测工具和解码器侧运动向量细化工具中的一个或多个。
D1.30.实施例D1.29的视频解码器,其中第一特性被选自:
具有按解码顺序在CRA图片之前的参考图片,所述CRA图片与所述RASL图片相关联,用作在后图片的时间运动向量预测参考图片,以及不属于最高时间层。
D2.1.用于从数据流解码视频的视频解码器,其配置成从数据流解码指示[例如,使用sps_extra_ph_bit_present_flag及ph_extra_bit,或使用gci_rasl_pictures_tool_contraint_flag],所述指示按视频的图片的序列的图片、针对相应图片而全局地或在每切片的基础上指示是否相应图片以排除一个或多个编码工具的预定的集合的方式来被编码,预定的集合包括基于跨分量线性模型的预测工具[例如,作为一种逐图片指示,其使得看出RASL图片处的潜在漂移为充分地低是可能的]。
D2.2.先前实施例D2.#中的任何实施例的视频解码器,其中所述解码器配置成支持帧内预测块解码模式和帧间预测块解码模式。
D2.3.任何先前实施例D2.#的视频解码器,其中,根据基于跨分量线性模型的预测工具,图片块的色度分量使用线性模型从图片块的亮度分量来被预测,所述线性模型的参数从图片块的已解码的邻域中的极值亮度和色度值来被确定。
D2.4.任何先前实施例D2.#的视频解码器,其中一个或多个编码工具的所述集合进一步包括亮度色调映射和色度残差缩放预测工具。
D2.5.实施例D2.4的视频解码器,其中,根据亮度色调映射和色度残差缩放预测工具,用于预定的图片的亮度分量预测和亮度分量残差解码以编码亮度色调标度来被执行(呈现亮度色调标度通过亮度色调映射而被映射到编码亮度色调标度上),以获得预定的图片的重构的亮度分量的编码亮度色调标度版本,用于预定的图片的图片块的色度残差标度因数从图片块的邻域内的预定的图片的重构的亮度分量的编码亮度色调标度版本的平均值来被确定,以及从数据流针对图片块而解码的色度残差信号根据色度残差标度因数而被缩放,并且用于校正图片块的帧内色度预测信号。
D2.6.任何先前实施例D2.#的视频解码器,其中一个或多个编码工具的所述集合进一步包括光流工具。
D2.7.实施例D2.6的视频解码器,其中光流工具用于通过基于光流的分析来改进预定的帧间预测的块的平移帧间预测信号。
D2.8.任何先前实施例D2.#的视频解码器,其中一个或多个编码工具的所述集合进一步包括解码器侧运动向量细化工具。
D2.9.实施例D2.8的视频解码器,其中解码器侧运动向量细化工具用于改进数据流中编码的发信号通知的运动向量(402)(通过经由在所述发信号通知的运动向量处及周围的运动向量候选之中执行最佳匹配搜索来细化所述发信号通知的运动向量),以便从参考图片(404)帧间预测预定的帧间预测的块(10d)。
D2.9a实施例D2.9的视频解码器,其中解码器侧运动向量细化工具配置成使用帧间预测的块的已针对参考图片而解码的邻域来执行最佳匹配搜索。
D2.9b.实施例D2.8的视频解码器,其中解码器侧运动向量细化工具配置成细化在数据流中编码的发信号通知的运动向量(402)的对(通过在包含和围绕发信号通知的运动向量的所述对的运动向量对候选之中执行最佳匹配搜索),以用于从参考图片(404)的对帧间预测预定的帧间双预测的块(10d),所述参考图片在时间上被定位在所述预定的帧间双预测的块(10d)的图片之前和之后。
D2.10.任何先前实施例D2.#的视频解码器,其中一个或多个编码工具的所述集合进一步包括时间运动向量预测工具。
D2.11.实施例D2.10的视频解码器,其中,根据时间运动向量预测工具,帧间预测的块的运动向量候选列表形成包含来自先前解码的图片的运动向量候选征集。
D2.12.实施例D2.11的视频解码器,其中根据时间运动向量预测工具,帧间预测的块的运动向量候选列表形成包含来自由运动向量预测器指向的先前解码的图片的块的运动向量候选征集。
D2.13.实施例D2.12的视频解码器,其中运动向量预测器包含时间运动向量预测器。
D2.14.任何先前实施例D1.#的视频解码器,其中所述指示被包含在以下之一中:由图片的序列的图片参考的一个或多个图片参数集合,图片的序列的图片的图片报头,以及图片的序列的图片的切片的切片报头。
D2.15.任何先前实施例D2.#的视频解码器,其中所述指示被包含在以下中:由图片的序列的图片参考的图片参数集合,其中图片参数集合包括:至少一个第一图片参数集合,其指示参考所述至少一个第一图片参数集合的图片以排除一个或多个编码工具的预定的集合的方式来被编码;以及至少一个第二图片参数集合,其指示参考所述至少一个第二图片参数集合的图片以潜在使用一个或多个编码工具的预定的集合的方式来被编码,或者由图片的序列的图片参考的图片参数集合,其中图片参数集合包括:至少一个第一图片参数集合,其指示与参考所述至少一个第一图片参数集合的图片相关联的RASL图片以排除一个或多个编码工具的预定的集合的方式来被编码;以及至少一个第二图片参数集合,其指示与参考所述至少一个第二图片参数集合的图片相关联的RASL图片以潜在使用一个或多个编码工具的预定的集合的方式来被编码。
D2.16.实施例D2.15的视频解码器,其中所述指示包括图片参数集合的扩展句法部分内的句法元素[例如,使用sps_extra_ph_bit_present_flag和ph_extra_bit]。
D2.17.实施例D2.16的视频解码器,其中图片参数集合的扩展句法部分的长度在数据流的序列或视频参数集合中被指示。
D2.18.任何先前实施例D2.#的视频解码器,其中所述指示是以下的扩展部分中的句法元素:图片的序列的图片的图片报头,和/或图片的序列的图片的切片的切片报头,其中数据流的图片或序列或视频参数集合指示扩展部分的长度[例如,NumExtraPhBits]。
D2.18a.实施例D2.18的视频解码器,其中句法元素指示是否句法元素属于[例如,图片报头或切片报头涉及]的图片以排除一个或多个编码工具的预定的集合的方式来被编码,或者是否与句法元素属于的图片相关联的RASL图片以排除一个或多个编码工具的预定的集合的方式来被编码。
D2.19.任何先前实施例D2.#的视频解码器,其中所述解码器配置成支持参考图片重采样。
D2.22.实施例D2.19的视频解码器,其中,根据参考图片重采样,帧间预测的块的参考图片经历样本重采样,以便弥合所述参考图片与其中含有所述帧间预测的块的图片之间的缩放窗口大小偏差或样本分辨率偏差,来为所述帧间预测的块提供帧间预测信号。
D2.23.先前实施例D2.#中的任何实施例的视频解码器,其中一个或多个编码工具的所述集合包括[例如,200、300、400、500]一个或多个第一固有应用的编码工具,其中的每个针对预定的块取决于针对所述预定的块在数据流中发信号通知的一个或多个编码选项而被应用,并且涉及另外的编码工具(除相应另外的编码工具以外),和/或一个或多个第二固有应用的编码工具,其中的每个针对预定的块取决于所述预定的块的大小而被应用。
D2.24.先前实施例D2.#中的任何实施例的视频解码器,其中一个或多个编码工具的所述集合包括[例如,100、500]一个或多个显式应用的编码工具,其中的每个针对预定的块取决于被编码到数据流中的句法元素而被应用于所述预定的块,以用于排他地发信号通知相应编码工具针对所述预定的块的应用。
D2.25.实施例D2.24的视频解码器,其中所述解码器配置成针对以下项内的块从数据流解码句法元素:一个或多个编码工具的预定的集合针对其而被发信号通知以从编码被排除的图片或切片;以及一个或多个编码工具的预定的集合针对其而未被发信号通知以从编码被排除的图片或切片。
D2.26.实施例D2.24的视频解码器,其中所述解码器配置成仅针对一个或多个编码工具的预定的集合针对其而被发信号通知以从编码被排除的图片或切片内的块来从数据流解码句法元素。
D2.27.先前实施例D2.24(或更高)中的任何实施例的视频解码器,其中基于跨分量线性模型的预测工具属于所述一个或多个显式应用的编码工具。
D2.28.先前实施例D2.16(或更高)中的任何实施例的视频解码器,其中句法元素是共同指示排除一个或多个编码工具的预定的集合的所有编码工具的一个比特。
D2.29.先前实施例D2.#中的任何实施例的视频解码器,其中一个或多个编码工具的所述集合包括一个或多个可停用编码工具,其中的每个针对它对图片块的应用通过数据流内部的配置信令以图片或切片为单位而可停用。
D2.30.先前实施例D2.#中的任何实施例的视频解码器,其配置成使用指示以看出是否开放GOP切换导致可忍受的漂移。
D2.30a.先前实施例D2.#中的任何实施例的视频解码器,其配置成使用指示以看出是否开放GOP切换导致样本不匹配但保留句法和参数设置。
E1.1.用于将视频编码到数据流中的视频编码器,其配置成将指示[例如,gci_rasl_pictures_tool_constraint_flag]编码到数据流中,所述指示对视频的图片的序列有效并且指示图片的序列内的RASL图片以排除一个或多个编码工具的预定的集合的方式来被编码[例如,作为一种承诺,使得编码器知道,通过连系以不同空间分辨率和/或不同SNR来编码的视频的分开编码的开放GOP版本而进行的开放GOP切换不导致RASL图片中的过多漂移]。
E1.2.任何先前实施例E1.#的视频编码器,其中一个或多个编码工具的所述集合包括基于跨分量线性模型的预测工具(100)。
E1.3.E1.2的视频编码器,其中,根据基于跨分量线性模型的预测工具,图片块(10a)的色度分量(102)使用线性模型(106)从图片块(10a)的亮度分量(104)来被预测,所述线性模型的参数从图片块的已编码的邻域(112)中的极值亮度和色度值(110)来被确定(108)。
E1.4.任何先前实施例E1.#的视频编码器,其中一个或多个编码工具的所述集合包括亮度色调映射和色度残差缩放预测工具(200)。
E1.5.实施例E1.4的视频编码器,其中,根据亮度色调映射和色度残差缩放预测工具,用于预定的图片(12)的亮度分量预测(202)[例如帧间预测]和亮度分量残差编码(204)以编码亮度色调标度(208)来被执行(呈现亮度色调标度(210)通过亮度色调映射(212)而被映射到所述编码亮度色调标度上),以获得预定的图片的重构的亮度分量的编码亮度色调标度版本(214),用于预定的图片的图片块(10b)的色度残差标度因数(216)从图片块的邻域(222)内的预定的图片的重构的亮度分量的编码亮度色调标度版本的平均值(220)来被确定,以及在数据流中针对图片块而编码的色度残差信号(224)根据色度残差标度因数而被缩放(226)且用于校正(228)图片块的帧内色度预测信号(230)。
E1.6.任何先前实施例E1.#的视频编码器,其中一个或多个编码工具的所述集合包括光流工具(300)。
E1.7.实施例E1.6的视频编码器,其中光流工具用于通过基于光流的分析来改进预定的帧间预测的块(10c)的平移帧间预测信号。
E1.8.任何先前实施例E1.#的视频编码器,其中一个或多个编码工具的所述集合包括解码器侧运动向量细化工具(400)。
E1.9.实施例E1.8的视频编码器,其中解码器侧运动向量细化工具用于改进数据流中编码的发信号通知的运动向量(402)(通过经由在所述发信号通知的运动向量处及周围的运动向量候选之中执行最佳匹配搜索来细化所述发信号通知的运动向量),以便从参考图片(404)帧间预测预定的帧间预测的块(10d)。
E1.9a.实施例E1.9的视频编码器,其中解码器侧运动向量细化工具配置成使用帧间预测的块的已针对参考图片而解码的邻域来执行最佳匹配搜索。
E1.9b.实施例E1.8的视频编码器,其中解码器侧运动向量细化工具配置成细化在数据流中编码的发信号通知的运动向量(402)的对(通过在包含和围绕发信号通知的运动向量的所述对的运动向量对候选之中执行最佳匹配搜索),以用于从参考图片(404)的对帧间预测预定的帧间双预测的块(10d),所述参考图片在时间上被定位在所述预定的帧间双预测的块(10d)的图片之前和之后。
E1.10.任何先前实施例E1.#的视频编码器,其中一个或多个编码工具的所述集合包括时间运动向量预测工具(500)。
E1.11.实施例E1.10的视频编码器,其中,根据时间运动向量预测工具,帧间预测的块的运动向量候选列表形成包含来自先前编码的图片(502)的运动向量候选征集。
E1.12.实施例E1.11的视频编码器,其中,根据时间运动向量预测工具,帧间预测的块的运动向量候选列表形成包含来自由运动向量预测器(504)指向的先前编码的图片的块(506)的运动向量候选征集。
E1.13.实施例E1.12的视频编码器,其中运动向量预测器包含时间运动向量预测器。
E1.14.任何先前实施例E1.#的视频编码器,其中所述指示被包含在以下之一中:数据流的解码器能力信息部分,以及数据流的视频或序列参数集合,以及补充增强信息消息。
E1.15.任何先前实施例E1.#的视频编码器,其中所述指示包括共同指示针对图片的序列内的RASL图片的编码而排除一个或多个编码工具的预定的集合的所有编码工具的一个比特。
E1.16.任何先前实施例E1.#的视频编码器,其中所述编码器配置成支持参考图片重采样。
E1.17.实施例E1.16的视频编码器,其中,根据参考图片重采样,帧间预测的块的参考图片经历样本重采样,以便弥合所述参考图片与其中含有所述帧间预测的块的图片之间的缩放窗口大小偏差或样本分辨率偏差,来为所述帧间预测的块提供帧间预测信号。
E1.18.先前实施例E1.#中的任何实施例的视频编码器,其中一个或多个编码工具的所述集合包括[例如,200、300、400、500]一个或多个第一固有应用的编码工具,其中的每个针对预定的块取决于针对所述预定的块在数据流中发信号通知的一个或多个编码选项而被应用,并且涉及另外的编码工具(除相应另外的编码工具以外),和/或一个或多个第二固有应用的编码工具,其中的每个针对预定的块取决于所述预定的块的大小而被应用。
E1.19.先前实施例E1.#中的任何实施例的视频编码器,其中一个或多个编码工具的所述集合包括[例如,100]一个或多个显式应用的编码工具,其中的每个针对预定的块取决于被编码到数据流中的句法元素而被应用于所述预定的块,以用于排他地发信号通知相应编码工具针对所述预定的块的应用。
E1.20.实施例E1.19的视频编码器,其中所述编码器配置成针对RASL图片内的块以及针对除RASL图片以外的图片的块将句法元素编码到数据流中。
E1.21.实施例E1.19的视频编码器,其中所述编码器配置成仅针对除RASL图片以外的图片内的块将句法元素编码到数据流中[例如,由此节省RASL图片中的比特]。
E1.22.先前实施例E1.#中的任何实施例的视频编码器,其中所述编码器配置成支持帧内预测块编码模式及帧间预测块编码模式。
E1.23.先前实施例E1.#中的任何实施例的视频编码器,其中图片的序列以一个CRA图片开始并且包含所述CRA图片,以及包括直至——按编码顺序——并终止于紧接在CRA图片之前的图片的图片,或包括按编码顺序为连贯且包括多于一个CRA的图片。
E1.24.先前实施例E1.#中的任何实施例的视频编码器,其中一个或多个编码工具的所述集合包括
一个或多个可停用编码工具,其中的每个针对它对图片块的应用通过数据流内部的配置信令以图片或切片为单位而可停用。
E1.25.先前实施例E1.#中的任何实施例的视频编码器,其配置成在将视频编码到数据流中的过程中将指示作为编码约束来遵守。
E1.26.先前实施例E1.#中的任何实施例的视频编码器,其中所述指示指示以排除一个或多个编码工具的预定的集合的方式来被编码,和/或所述指示指示以排除一个或多个编码工具的预定的集合的方式来编码具有按解码顺序在CRA图片之前的参考图片的图片的序列内的所有RASL图片,所述CRA图片与所述所有RASL图片相关联,和/或所述指示指示以排除一个或多个编码工具的预定的集合的方式来编码用作在后图片的时间运动向量预测参考图片的图片的序列内的所有RASL图片,和/或所述指示指示以排除一个或多个编码工具的预定的集合的方式来编码不属于最高时间层的图片的序列内的所有RASL图片。
E1.27.先前实施例E1.#中的任何实施例的视频编码器,其中所述指示指示图片的序列内的RASL图片以排除一个或多个编码工具的预定的集合的方式、以使得以下情况成立的方式来被编码:对于一个或多个编码工具的预定的集合中的一个或多个编码工具的第一子集,第一特性适用于的所有RASL图片以排除一个或多个编码工具的预定的集合中的一个或多个编码工具的第一子集的方式来被编码,以及对于一个或多个编码工具的预定的集合中的一个或多个编码工具的第二子集,所有RASL图片或第二特性适用于的所有RASL图片以排除一个或多个编码工具的预定的集合中的一个或多个编码工具的第二子集的方式来被编码,第一和第二子集相互不相交。
E1.28.实施例E1.27的视频编码器,其中第一特性和/或第二特性被选自:具有按解码顺序在CRA图片之前的参考图片,所述CRA图片与所述RASL图片相关联,用作在后图片的时间运动向量预测参考图片,以及不属于最高时间层。
E1.29.实施例E1.27(或更高)中的视频编码器,其中第一子集包含时间运动向量预测工具和解码器侧运动向量细化工具中的一个或多个。
E1.30.实施例E1.29的视频编码器,其中第一特性被选自:具有按解码顺序在CRA图片之前的参考图片,所述CRA图片与所述RASL图片相关联,用作在后图片的时间运动向量预测参考图片,以及不属于最高时间层。
E2.1.用于将视频编码到数据流中的视频编码器,其配置成将指示[例如,使用sps_extra_ph_bit_present_flag及ph_extra_bit,或使用gci_rasl_pictures_tool_contraint_flag]编码到数据流中,所述指示按视频的图片的序列的图片、针对相应图片而全局地或在每切片的基础上指示是否相应图片以排除一个或多个编码工具的预定的集合的方式来被编码,预定的集合包括基于跨分量线性模型的预测工具[例如,作为一种逐图片指示,其使得看出RASL图片处的潜在漂移为充分地低是可能的]。
E2.2.先前实施例E2.#中的任何实施例的视频编码器,其中所述编码器配置成支持帧内预测块编码模式和帧间预测块编码模式。
E2.3.任何先前实施例E2.#的视频编码器,其中,根据基于跨分量线性模型的预测工具,图片块的色度分量使用线性模型从图片块的亮度分量来被预测,所述线性模型的参数从图片块的已编码的邻域中的极值亮度和色度值来被确定。
E2.4.任何先前实施例E2.#的视频编码器,其中一个或多个编码工具的所述集合进一步包括亮度色调映射和色度残差缩放预测工具。
E2.5.实施例E2.4的视频编码器,其中,根据亮度色调映射和色度残差缩放预测工具,用于预定的图片的亮度分量预测和亮度分量残差编码以编码亮度色调标度来被执行(呈现亮度色调标度通过亮度色调映射而被映射到编码亮度色调标度上),以获得预定的图片的重构的亮度分量的编码亮度色调标度版本,用于预定的图片的图片块的色度残差标度因数从图片块的邻域内的预定的图片的重构的亮度分量的编码亮度色调标度版本的平均值来被确定,以及从数据流针对图片块而编码的色度残差信号根据色度残差标度因数而被缩放,并且用于校正图片块的帧内色度预测信号。
E2.6.任何先前实施例E2.#的视频编码器,其中一个或多个编码工具的所述集合进一步包括光流工具。
E2.7.实施例E2.6的视频编码器,其中光流工具用于通过基于光流的分析来改进预定的帧间预测的块的平移帧间预测信号。
E2.8.任何先前实施例E2.#的视频编码器,其中一个或多个编码工具的所述集合进一步包括解码器侧运动向量细化工具。
E2.9.实施例E2.8的视频编码器,其中解码器侧运动向量细化工具用于改进数据流中编码的发信号通知的运动向量(402)(通过经由在所述发信号通知的运动向量处及周围的运动向量候选之中执行最佳匹配搜索来细化所述发信号通知的运动向量),以便从参考图片(404)帧间预测预定的帧间预测的块(10d)。
E2.9a实施例E2.9的视频编码器,其中解码器侧运动向量细化工具配置成使用帧间预测的块的已针对参考图片而解码的邻域来执行最佳匹配搜索。
E2.9b.实施例E2.8的视频编码器,其中解码器侧运动向量细化工具配置成细化在数据流中编码的发信号通知的运动向量(402)的对(通过在包含和围绕发信号通知的运动向量的所述对的运动向量对候选之中执行最佳匹配搜索),以用于从参考图片(404)的对帧间预测预定的帧间双预测的块(10d),所述参考图片在时间上被定位在所述预定的帧间双预测的块(10d)的图片之前和之后。
E2.10.任何先前实施例E2.#的视频编码器,其中一个或多个编码工具的所述集合进一步包括时间运动向量预测工具。
E2.11.实施例E2.10的视频编码器,其中,根据时间运动向量预测工具,帧间预测的块的运动向量候选列表形成包含来自先前编码的图片的运动向量候选征集。
E2.12.实施例E2.11的视频编码器,其中,根据时间运动向量预测工具,帧间预测的块的运动向量候选列表形成包含来自由运动向量预测器指向的先前编码的图片的块的运动向量候选征集。
E2.13.实施例E2.12的视频编码器,其中运动向量预测器包含时间运动向量预测器。
E2.14.任何先前实施例D1.#的视频编码器,其中所述指示被包含在以下之一中:由图片的序列的图片参考的一个或多个图片参数集合,图片的序列的图片的图片报头,以及图片的序列的图片的切片的切片报头。
E2.15.任何先前实施例E2.#的视频编码器,其中所述指示被包含在以下中:由图片的序列的图片参考的图片参数集合,其中图片参数集合包括:至少一个第一图片参数集合,其指示参考所述至少一个第一图片参数集合的图片以排除一个或多个编码工具的预定的集合的方式来被编码;以及至少一个第二图片参数集合,其指示参考所述至少一个第二图片参数集合的图片以潜在使用一个或多个编码工具的预定的集合的方式来被编码,或者由图片的序列的图片参考的图片参数集合,其中图片参数集合包括:至少一个第一图片参数集合,其指示与参考所述至少一个第一图片参数集合的图片相关联的RASL图片以排除一个或多个编码工具的预定的集合的方式来被编码;以及至少一个第二图片参数集合,其指示与参考所述至少一个第二图片参数集合的图片相关联的RASL图片以潜在使用一个或多个编码工具的预定的集合的方式来被编码。
E2.16.实施例E2.15的视频编码器,其中所述指示包括图片参数集合的扩展句法部分内的句法元素[例如,使用sps_extra_ph_bit_present_flag和ph_extra_bit]。
E2.17.实施例E2.16的视频编码器,其中图片参数集合的扩展句法部分的长度在数据流的序列或视频参数集合中被指示。
E2.18.任何先前实施例E2.#的视频编码器,其中所述指示是以下的扩展部分中的句法元素:图片的序列的图片的图片报头,和/或图片的序列的图片的切片的切片报头,其中数据流的图片或序列或视频参数集合指示扩展部分的长度[例如,NumExtraPhBits]。
E2.18a.实施例E2.18的视频编码器,其中句法元素指示是否句法元素属于[例如,图片报头或切片报头涉及]的图片以排除一个或多个编码工具的预定的集合的方式来被编码,或者是否与句法元素属于的图片相关联的RASL图片以排除一个或多个编码工具的预定的集合的方式来被编码。
E2.19.任何先前实施例E2.#的视频编码器,其中所述编码器配置成支持参考图片重采样。
E2.22.实施例E2.19的视频编码器,其中,根据参考图片重采样,帧间预测的块的参考图片经历样本重采样,以便弥合所述参考图片与其中含有所述帧间预测的块的图片之间的缩放窗口大小偏差或样本分辨率偏差,来为所述帧间预测的块提供帧间预测信号。
E2.23.先前实施例E2.#中的任何实施例的视频编码器,其中一个或多个编码工具的所述集合包括[例如,200、300、400、500]一个或多个第一固有应用的编码工具,其中的每个针对预定的块取决于针对所述预定的块在数据流中发信号通知的一个或多个编码选项而被应用,并且涉及另外的编码工具(除相应另外的编码工具以外),和/或一个或多个第二固有应用的编码工具,其中的每个针对预定的块取决于所述预定的块的大小而被应用。
E2.24.先前实施例E2.#中的任何实施例的视频编码器,其中一个或多个编码工具的所述集合包括一个或多个显式应用的编码工具,其中的每个针对预定的块取决于被编码到数据流中的句法元素而被应用于所述预定的块,以用于排他地发信号通知相应编码工具针对所述预定的块的应用。
E2.25.实施例E2.24的视频编码器,其中所述编码器配置成针对以下项内的块将句法元素编码到数据流中:一个或多个编码工具的预定的集合针对其而被发信号通知以从编码被排除的图片或切片;以及一个或多个编码工具的预定的集合针对其而未被发信号通知以从编码被排除的图片或切片。
E2.26.实施例E2.24的视频编码器,其中所述编码器配置成仅针对一个或多个编码工具的预定的集合针对其而被发信号通知以从编码排除的图片或切片内的块来将句法元素编码到数据流中。
E2.27.先前实施例E2.24(或更高)中的任何实施例的视频编码器,其中基于跨分量线性模型的预测工具属于所述一个或多个显式应用的编码工具。
E2.28.先前实施例E2.16(或更高)中的任何实施例的视频编码器,其中句法元素是共同指示排除一个或多个编码工具的预定的集合的所有编码工具的一个比特。
E2.29.先前实施例E2.#中的任何实施例的视频编码器,其中一个或多个编码工具的所述集合包括一个或多个可停用编码工具,其中的每个针对它对图片块的应用通过数据流内部的配置信令以图片或切片为单位而可停用。
E2.30.先前实施例E2.#中的任何实施例的视频编码器,其配置成在将视频编码到数据流中的过程中遵守作为编码约束的指示。
B1.1.具有被编码到其中的视频的数据流,所述数据流包括指示[例如gci_rasl_pictures_tool_contraint_flag],所述指示对视频的图片的序列有效并且指示图片的序列内的RASL图片以排除一个或多个编码工具的预定的集合的方式来被编码[例如,作为一种承诺,使得编码器知道,通过连系以不同空间分辨率和/或不同SNR来编码的视频的分开编码的开放GOP版本而进行的开放GOP切换不导致RASL图片中的过多漂移]。
B1.2根据实施例B1.1的数据流,其由根据实施例E1.#中的任何实施例的编码器生成。
B2.1.具有被编码到其中的视频的数据流,所述数据流包括指示[例如,使用sps_extra_ph_bit_present_flag及ph_extra_bit,或使用gci_rasl_pictures_tool_contraint_flag],所述指示按视频的图片的序列的图片、针对相应图片而全局地或在每切片的基础上指示是否相应图片以排除一个或多个编码工具的预定的集合的方式来被编码,预定的集合包括基于跨分量线性模型的预测工具[例如,作为一种逐图片指示,其使得看出RASL图片处的潜在漂移为充分地低是可能的]。
B2.2根据实施例B2.1的数据流,其由根据实施例E2.#中的任何实施例的编码器生成。
M.由上文的解码器和编码器中的任何解码器和编码器来执行的方法。
P.计算机程序,其具有程序代码以用于当所述程序在计算机上被执行时执行根据实施例M的方法。
尽管已经在设备的上下文中描述了一些方面,但清楚的是,这些方面还表示对应方法的描述,其中块或装置对应于方法步骤或方法步骤的特征。类似地,在方法步骤的上下文中描述的方面还表示对应设备的对应块或项目或特征的描述。方法步骤中的一些或所有方法步骤可由(或使用)硬件设备(像例如微处理器、可编程计算机或电子电路)来执行。在一些实施例中,最重要的方法步骤中的一个或多个可由这类设备执行。
发明的数据流能够被存储在数字存储介质上,或者能够在诸如无线传输介质或有线传输介质(诸如因特网)之类的传输介质上被传送。
取决于某些实现要求,本发明的实施例能够在硬件或在软件中被实现。所述实现能够使用具有在其上存储的电子可读控制信号的数字存储介质(例如软盘、DVD、蓝光、CD、ROM、PROM、EPROM、EEPROM或FLASH存储器)来被执行,所述电子可读控制信号与可编程计算机系统协作(或能够与可编程计算机系统协作),使得相应的方法被执行。因此,数字存储介质可以是计算机可读的。
根据本发明的一些实施例包括具有电子可读控制信号的数据载体,所述电子可读控制信号能够与可编程计算机系统协作,使得本文描述的方法之一被执行。
一般地,本发明的实施例能够被实现为具有程序代码的计算机程序产品,所述程序代码是操作的以用于当计算机程序产品在计算机上运行时执行所述方法之一。程序代码可例如被存储在机器可读载体上。
其他实施例包括存储在机器可读载体上的用于执行本文描述的方法之一的计算机程序。
换句话说,发明的方法的一实施例因此是具有程序代码的计算机程序,所述程序代码用于当所述计算机程序在计算机上运行时执行本文描述的方法之一。
发明的方法的一进一步的实施例因此是数据载体(或数字存储介质或计算机可读介质),其包括记录在其上的用于执行本文描述的方法之一的计算机程序。数据载体、数字存储介质或记录介质典型地是有形的和/或非过渡性的。
发明的方法的一进一步的实施例因此是表示用于执行本文描述的方法之一的计算机程序的数据流或信号的序列。数据流或信号的序列可例如配置成经由数据通信连接(例如经由因特网)来被传输。
一进一步的实施例包括处理部件(例如计算机或可编程逻辑装置),其配置成或适于执行本文描述的方法之一。
一进一步的实施例包括已在其上安装用于执行本文描述的方法之一的计算机程序的计算机。
根据本发明的一进一步的实施例包括设备或系统,其配置成向接收器(例如,电子学上地或光学上地)传输用于执行本文描述的方法之一的计算机程序。所述接收器可例如是计算机、移动装置、存储器装置或诸如此类。所述设备或系统可例如包括用于向接收器传输计算机程序的文件服务器。
在一些实施例中,可编程逻辑装置(例如现场可编程门阵列)可用于执行本文描述的方法的功能性中的一些或所有功能性。在一些实施例中,现场可编程门阵列可与微处理器协作,以便执行本文描述的方法之一。一般地,所述方法可取地由任何硬件设备来执行。
本文描述的设备可使用硬件设备或使用计算机或使用硬件设备和计算机的组合来实现。
本文描述的设备或本文描述的设备的任何组件可至少部分地在硬件和/或在软件中被实现。
本文描述的方法可使用硬件设备或使用计算机或使用硬件设备和计算机的组合来执行。
本文描述的方法或本文描述的设备的任何组件可至少部分地由硬件和/或由软件来执行。
上文描述的实施例对于本发明的原理仅仅是说明性的。要理解,本文描述的细节和布置的变化和修改对于本领域的其他技术人员将显而易见。因此,旨在要仅由接下来的专利权利要求的范围而不由通过本文实施例的描述和解释的方式呈现的具体细节来限制。
参考文献
[1]ISO/IEC JTC 1,Information technology—Dynamic adaptive streamingover HTTP(DASH)—Part 1:Media presentation description and segment formats,ISO/IEC 23009-1,2012年(及随后的版本)。
[2]J.De Cock、Z.Li、M.Manohara、A.Aaron。“Complexity-based consistent-quality encoding in the cloud.”2016IEEE图像处理国际会议(ICIP)。IEEE,2016
[3]DASH Industry Forum Implementation Guidelines。[在线]。可用:https://dashif.org/guidelines/
[4]ITU-T和ISO/IEC JTC 1,Advanced Video Coding for generic audio-visual services,Rec.ITU-T H.264和ISO/IEC 14496-10(AVC),2003年5月(及随后的版本)。
[5]ITU-T和ISO/IEC JTC 1,“High Efficiency Video Coding”,Rec.ITU-TH.265和ISO/IEC 23008-2(HEVC),2013年4月(及随后的版本)。
[6]Y.Yan、M.Hannuksela和H.Li。“Seamless switching ofH.265/HEVC-codeddash representations with open GOP prediction structure”。2015IEEE图像处理国际会议(ICIP)。IEEE,2015。
[7]ITU-T和ISO/IEC JTC 1,“Versatile video coding”,Rec.ITU-T H.266和ISO/IEC 23090-3(VVC),2020年8月。
[8]V.Baroncini和M.Wien,“VVC verification test report for UHD SDRvideo content”,文件。ITU-T/ISO/IEC联合视频专家组(JVET)的JVET-T2020,第21次会议:2020年10月。
[9]D.Luo、V.Seregin、W.Wan。“Description of Core Experiment 1(CE1):Reference picture resampling filters”,文件。ITU-T/ISO/IEC联合视频专家组(JVET)的JVET-Q2021,第15次会议:2019年7月
[10]H.Schwarz、D.Marpe和T.Wiegand,“Analysis ofhierarchical B picturesand MCTF”,ICME 2006,IEEE国际多媒体会议与博览会,加拿大,安大略,多伦多,2006年7月。
[11]Y.-K.Wang等人,“The High-Level Syntax of the Versatile VideoCoding(VVC)Standard”,IEEE视频技术电路与系统会刊,印刷中
[12]H.Yang等人,“Subblock based Motion Derivation and Inter-PredictionRefinement in Versatile Video Coding Standard”,IEEE视频技术电路与系统会刊,印刷中
[13]W.-J.Chien等人,“Motion Vector Coding and Block Merging inVersatile Video Coding Standard”,IEEE视频技术电路与系统会刊,印刷中。

Claims (15)

1.用于从数据流解码视频的视频解码器,所述视频解码器被配置成从所述数据流解码指示,所述指示对所述视频的图片的序列有效并且指示图片的所述序列内的RASL图片以排除一个或多个编码工具的预定的集合的方式来被编码。
2.如权利要求1所述的视频解码器,其中,一个或多个编码工具的所述预定的集合包括
基于跨分量线性模型的预测工具(100),和/或
解码器侧运动向量细化工具(400)。
3.如先前权利要求中的任一项所述的视频解码器,其中,所述指示被包含在补充增强信息消息中。
4.如先前权利要求中的任一项所述的视频解码器,其中,所述指示包括共同指示针对图片的所述序列内的所述RASL图片的编码而排除一个或多个编码工具的所述预定的集合的所有编码工具的一个比特。
5.如先前权利要求中的任一项所述的视频解码器,其中,所述解码器被配置成支持参考图片重采样,其中,根据所述参考图片重采样,帧间预测的块的参考图片经历样本重采样,以便弥合所述参考图片与其中含有所述帧间预测的块的图片之间的缩放窗口大小偏差或样本分辨率偏差,来为所述帧间预测的块提供帧间预测信号。
6.如先前权利要求中的任一项所述的视频解码器,其中
所述指示指示图片的所述序列内的所有RASL图片以排除一个或多个编码工具的所述预定的集合的方式来被编码,和/或
所述指示指示以排除一个或多个编码工具的所述预定的集合的方式来编码具有按解码顺序在CRA图片之前的参考图片的图片的所述序列内的所有RASL图片,所述CRA图片与所述所有RASL图片相关联,和/或
所述指示指示以排除一个或多个编码工具的所述预定的集合的方式来编码用作在后图片的时间运动向量预测参考图片的图片的所述序列内的所有RASL图片,和/或
所述指示指示以排除一个或多个编码工具的所述预定的集合的方式来编码不属于最高时间层的图片的所述序列内的所有RASL图片。
7.如先前权利要求中的任一项所述的视频解码器,其中,所述指示指示图片的所述序列内的所述RASL图片以排除一个或多个编码工具的所述预定的集合的方式、以使得以下情况成立的方式来被编码:
对于一个或多个编码工具的所述预定的集合中的一个或多个编码工具的第一子集,第一特性适用于的所有RASL图片以排除一个或多个编码工具的所述预定的集合中的一个或多个编码工具的所述第一子集的方式来被编码,以及
对于一个或多个编码工具的所述预定的集合中的一个或多个编码工具的第二子集,所有RASL图片或第二特性适用于的所有RASL图片以排除一个或多个编码工具的所述预定的集合中的一个或多个编码工具的所述第二子集的方式来被编码,所述第一和所述第二子集相互不相交。
8.用于将视频编码到数据流中的视频编码器,所述视频编码器被配置成将指示编码到所述数据流中,所述指示对所述视频的图片的序列有效并且指示图片的所述序列内的RASL图片以排除一个或多个编码工具的预定的集合的方式来被编码。
9.如权利要求8所述的视频编码器,其中,一个或多个编码工具的所述预定的集合包括
基于跨分量线性模型的预测工具(100)和/或
解码器侧运动向量细化工具(400)。
10.如权利要求8至9中的任一项所述的视频编码器,其中,所述指示被包含在补充增强信息消息中。
11.如权利要求8至10中的任一项所述的视频编码器,其中,所述指示包括共同指示针对图片的所述序列内的所述RASL图片的编码而排除一个或多个编码工具的所述预定的集合的所有编码工具的一个比特。
12.如权利要求8至11中的任一项所述的视频编码器,其中,所述编码器被配置成支持参考图片重采样,其中,根据所述参考图片重采样,帧间预测的块的参考图片经历样本重采样,以便弥合所述参考图片与其中含有所述帧间预测的块的图片之间的缩放窗口大小偏差或样本分辨率偏差,来为所述帧间预测的块提供帧间预测信号。
13.如权利要求8至12中的任一项所述的视频编码器,其中
所述指示指示图片的所述序列内的所有RASL图片以排除一个或多个编码工具的所述预定的集合的方式来被编码,和/或
所述指示指示以排除一个或多个编码工具的所述预定的集合的方式来编码具有按解码顺序在CRA图片之前的参考图片的图片的所述序列内的所有RASL图片,所述CRA图片与所述所有RASL图片相关联,和/或
所述指示指示以排除一个或多个编码工具的所述预定的集合的方式来编码用作在后图片的时间运动向量预测参考图片的图片的所述序列内的所有RASL图片,和/或
所述指示指示以排除一个或多个编码工具的所述预定的集合的方式来编码不属于最高时间层的图片的所述序列内的所有RASL图片。
14.数据流,所述数据流具有被编码到其中的视频,所述数据流包括指示,所述指示对所述视频的图片的序列有效并且指示图片的所述序列内的RASL图片以排除一个或多个编码工具的预定的集合的方式来被编码。
15.根据权利要求14所述的数据流,所述数据流由根据权利要求8至13中的任一项的编码器来生成。
CN202280017315.XA 2021-02-26 2022-02-26 允许对漂移进行限制的视频编码概念 Pending CN117083862A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP21159767 2021-02-26
EP21159767.9 2021-02-26
PCT/EP2022/054900 WO2022180261A1 (en) 2021-02-26 2022-02-26 Video coding concept allowing for limitation of drift

Publications (1)

Publication Number Publication Date
CN117083862A true CN117083862A (zh) 2023-11-17

Family

ID=74867389

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280017315.XA Pending CN117083862A (zh) 2021-02-26 2022-02-26 允许对漂移进行限制的视频编码概念

Country Status (10)

Country Link
US (1) US20240155114A1 (zh)
EP (1) EP4298796A1 (zh)
JP (1) JP2024509680A (zh)
KR (1) KR20230130088A (zh)
CN (1) CN117083862A (zh)
AR (1) AR126316A1 (zh)
AU (1) AU2022225089A1 (zh)
MX (1) MX2023008464A (zh)
TW (1) TWI821923B (zh)
WO (1) WO2022180261A1 (zh)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9402076B2 (en) * 2013-01-07 2016-07-26 Qualcomm Incorporated Video buffering operations for random access in video coding
US11272201B2 (en) * 2019-01-03 2022-03-08 Qualcomm Incorporated Block size restriction for illumination compensation
ES2946163T3 (es) * 2019-05-15 2023-07-13 Huawei Tech Co Ltd Manejo de la herramienta de codificación del refinamiento del vector de movimiento del lado del decodificador (DMVR) para el remuestreo de imágenes de referencia en la codificación de vídeo
CN113826382B (zh) * 2019-05-16 2023-06-20 北京字节跳动网络技术有限公司 视频编解码中的自适应比特深度转换

Also Published As

Publication number Publication date
MX2023008464A (es) 2023-07-27
TW202234891A (zh) 2022-09-01
AU2022225089A1 (en) 2023-07-27
EP4298796A1 (en) 2024-01-03
JP2024509680A (ja) 2024-03-05
US20240155114A1 (en) 2024-05-09
WO2022180261A1 (en) 2022-09-01
AR126316A1 (es) 2023-10-04
TWI821923B (zh) 2023-11-11
KR20230130088A (ko) 2023-09-11

Similar Documents

Publication Publication Date Title
TWI504237B (zh) 視訊寫碼中之緩衝預測資料
CN110719469B (zh) 视频编解码方法、设备和存储介质
JP6580576B2 (ja) ビデオ情報のスケーラブルコーディングのためのデバイスおよび方法
JP6640102B2 (ja) ビデオコーディングの参照として現在のピクチャを使用すること
CN110719488B (zh) 视频解码的方法和装置、计算机设备及存储介质
JP7152512B2 (ja) 動画の符号化及び復号方法、装置、並びにコンピュータプログラム
CN112655205B (zh) 视频编解码的方法和装置
CN110944185B (zh) 视频解码的方法和装置、计算机设备及存储介质
JP7297874B2 (ja) ビデオコーディングにおける条件付きデコーダ側動きベクトル精緻化のための装置および方法
JP6434044B2 (ja) ビデオ情報のスケーラブルコード化のための機器及び方法
JP2017507539A (ja) マルチレイヤコーディングにおいて回復点補足エンハンスメント情報(sei)メッセージと領域リフレッシュ情報seiメッセージとをコーディングするための方法
TW201408082A (zh) 對視訊寫碼發信長期參考圖像
CN110730353A (zh) 视频解码方法和装置、计算机设备、存储介质
CN113661702A (zh) 视频编解码的方法和装置
CN111149361B (zh) 具有在用于视频译码的随机存取配置中的未来参考帧的自适应图片群组结构
CN115428445A (zh) 用于视频编码的方法和装置
JP2017507546A (ja) マルチレイヤコード化において参照ピクチャセット(rps)をコード化するための方法
CN112399180B (zh) 视频解码方法、装置及存储介质
CN112399186B (zh) 视频解码方法、装置及存储介质
US20240155114A1 (en) Video coding concept allowing for limitation of drift
CN113841412A (zh) 基于cu的插值滤波器选择的信令
CN113796082A (zh) 视频编解码方法及装置
WO2023021362A1 (en) Video coding concept for handling of motion-vectors in streaming scenarios

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40095659

Country of ref document: HK

SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination