CN113366834A - 使用切片独立约束的间预测概念 - Google Patents

使用切片独立约束的间预测概念 Download PDF

Info

Publication number
CN113366834A
CN113366834A CN201980090352.1A CN201980090352A CN113366834A CN 113366834 A CN113366834 A CN 113366834A CN 201980090352 A CN201980090352 A CN 201980090352A CN 113366834 A CN113366834 A CN 113366834A
Authority
CN
China
Prior art keywords
prediction
block
motion information
predetermined inter
motion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980090352.1A
Other languages
English (en)
Inventor
罗伯特·斯库平
亚格·桑切斯·德·拉·富恩特
科尼利厄斯·海勒格
亚当·韦克科夫斯基
瓦莱丽·乔治
本杰明·布罗斯
托马斯·斯基尔勒
卡斯滕·苏灵
托马斯·威甘德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Publication of CN113366834A publication Critical patent/CN113366834A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/55Motion estimation with spatial constraints, e.g. at image or region borders
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/109Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/521Processing of motion vectors for estimating the reliability of the determined motion vectors or motion vector field, e.g. for smoothing the motion vector field or for correcting motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/563Motion estimation with padding, i.e. with filling of non-object values in an arbitrarily shaped picture block or region for estimation purposes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/577Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/167Position within a video image, e.g. region of interest [ROI]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

描述了用于提高视频编码效率的不同概念,其中许多允许以实现切片独立编码的方式进行视频编码,然而,实现切片独立编码是通过虽然如果所有仅仅稍微地修正沿切片边界的编解码器行为来减少与切片依赖性中断另外相关的编码效率损耗来完成的。

Description

使用切片独立约束的间预测概念
技术领域
本申请涉及在基于块的编解码器,诸如例如混合视频编解码器中使用的间编码概念,尤其涉及允许基于切片的编码的概念,即切片的独立编码到视频在空间上细分中。
背景技术
现有应用,诸如基于MPEG OMAF标准的360°视频服务严重依赖空间视频划分或分割技术。在此类应用中,空间视频片段被传输到客户端并以调适当前客户端观看方向的方式联合解码。另一个依赖于视频平面的空间分割的相关应用是编码和解码操作的并行化,例如以促进现代计算平台的多核功能。
一种这样的空间分割技术是在HEVC中实现的,称为切片(tile),它将图像平面划分为形成矩形网格的片段。相对于熵编码和内预测独立地编码得到的空间片段。此外,存在指示空间片段也相对于最先进的间预测独立编码的手段。对于上面列出的某些应用,在所有三个领域,即熵编码、内和间预测都具有约束是至关重要的。
然而,随着视频编码技术的不断发展带来了新的编码工具,其中许多工具与间预测领域相关,即许多工具将新的依赖性合并到先前编码的图像或当前编码图像内的不同区域,关于如何在所有这些提到的领域中保证独立性,适当的注意必须要采纳。
到现在为止,编码器负责使用刚刚提到的可用的编码工具的编码参数,以这样一种方式设置,即遵守视频切片的独立编码。解码器“依赖”由编码器通过位流向解码器发信号通知的对应的保证。
手头有一个概念是值得的,此概念能够以一种方式实现与切片独立的编码,此方式因为由于切片划分导致的编码依赖性中断导致更少的编码效率损耗,然而,仅导致沿边界的编解码器行为的边际修改。
因此,我希望手头有一个概念,此概念允许以实现切片独立编码的方式进行视频编码,然而,实现切片独立编码是通过虽然如果所有仅仅稍微地修正沿切片边界的编解码器行为来减少与切片依赖性中断另外相关的编码效率损耗来完成的。
发明内容
此目的通过本申请的独立权利要求的主题来实现。
一般而言,本申请的发现是已经发现一种更有效的方式,如果遵守视频的切片独立编码的义务是部分地从编码器继承到解码器,或者换句话说,由解码器部分共同注意,以便编码器可以利用上述共同注意,允许视频材料的切片独立编码。更准确地说,根据本申请的实施例,解码器具有切片边界感知。即,解码器以取决于视频被空间划分成的切片之间的边界位置的方式起作用。特别是,此间切片的边界感知还与解码器从数据流中得出运动信息有关。这种“感知”导致解码器识别数据流中传递的信号通知的运动信息,如果按照信号通知的应用,这将导致违背切片独立性要求,并因此导致解码器映射这种信号通知的运动信息,这将违背切片独立性,允许与运动信息相对应的运动信息状态,当用于间预测时,不违背切片独立性。编码器可能依赖于此行为,即知道解码器的感知,并且尤其是由于解码器遵守或执行切片独立约束而导致的可信号通知的运动信息状态的冗余。特别地,编码器可以利用解码器的切片独立约束执行/遵守,以便在由于解码器行为而分别导致解码器侧的相同运动信息的可信号通知的运动信息状态中选择需要较少的位率,诸如例如与为零的信号运动信息预测残差相关联的位率。因此,在编码器侧,特定间预测块的运动信息被确定为符合以下约束:从特定间预测块被预测的分块位于且不跨越由特定间预测块组成的切片的边界,即特定间预测块位于其中,但是当编码特定间预测块的运动信息到数据流中时,编码器利用这样一个事实,即根据切片边界执行从数据流中的得出,即需要刚刚概述的切片边界感知。
根据本申请的实施例,运动信息包括特定间预测块的运动向量,并且解码器处理的切片边界感知与运动向量相关。特别地,根据本申请的实施例,解码器相对于预测编码的运动向量实施切片独立性约束。也就是说,根据这些实施例,解码器遵守或执行对运动向量的约束,从而导致要从中预测间预测块的分块超过间预测块所在内的切片的边界,确定运动向量时,一方面基于运动向量预测器/预测以及另一方面基于间预测块的数据流中传输的残差的运动信息预测。也就是说,解码器将通过使用不可逆的映射来执行刚才提到的遵守/执行:而不是例如将运动信息预测和运动信息预测残差的所有组合映射到它们的总和,以便产生要最终使用的运动向量,此映射将重定向运动向量预测和运动向量预测残差的所有可能组合,其总和将导致与超过当前切片边界的分块相关联的运动向量,即当前间预测块所在的切片的边界,朝向其相关联的切片不超过当前切片的边界的运动向量。这样,编码器可以利用信号通知预先确定的间预测块的特定运动向量时的歧义,并且可以例如为此间预测块选择导致最低位率的运动向量预测残差的信号通知。例如,这可能是零的运动向量差。
根据向解码器提供至少部分地采用切片边界感知的能力的以上概述的想法的变体,以实施切片独立性约束,对此,否则编码器仅负责,解码器应用切片独立约束执行到特定间预测块的一个或多个运动信息预测器上,而不是执行到由于组合运动信息预测和运动信息预测残差而产生的得到的运动信息上。编码器和解码器都对运动信息预测器执行切片独立性,以使得两者都使用相同的运动信息预测器。信号模糊性和利用后者以最小化位率的可能性在这里不是问题。然而,预先准备用于特定间预测块的运动信息预测器,即,在将其用于运动信息预测编码/解码之前,能够针对特定的间预测块定制或“聚焦”可用的运动向量预测器,仅指向当前切片内的分块位置,而不是浪费一个或多个指向冲突分块位置的运动信息预测器,即超过当前切片的边界的分块位置,使用其对间预测块的运动信息进行预测地编码,无论如何,将需要非零运动信息预测残差的信号化,以便将冲突的运动信息预测器重定向到当前切片内部的分块位置。甚至在这里,运动信息也可以是运动向量。
与后一种变体相关,但仍然与其不同,本申请的进一步实施例旨在避免针对特定间预测块的运动信息预测候选,直接应用所述运动信息预测候选,即,具有零运动信息预测残差,将导致对切片独立性约束的损害。即,除了先前的变体,这样的运动信息预测候选将仅仅不用于填充当前预测的间预测块的运动信息预测候选列表。编码器和解码器的作用相同。不执行重定向。这些预测器仅仅被忽略了。即建立运动信息预测候选列表将以相同的间切片边界感知方式进行。以此方式,对于当前编码的间预测块可发信号通知的所有成员将集中于非冲突运动信息预测候选。因此,完整列表可以通过数据流中的一个点发信号通知,例如,在这种指示器的可信号通知状态没有针对被禁止发信号通知的运动信息预测候选被“浪费”的情况下,在运动信息预测候选指向的切片独立约束将与此约束或者在等级位置上的任何在前的运动信息预测候选冲突时,以符合切片独立约束。
类似地,本申请的进一步实施例旨在避免用其原点驻留在位于当前块之外的块中的候选填充运动信息预测候选列表,即,当前间预测块所在内的切片。因此,并且根据这些实施例,解码器以及编码器检查间预测块是否邻接预先确定的边,诸如当前切片的下边和/或右手边,如果是,则识别运动信息参考图像中的第一块并且列表被从此第一块的运动信息得出的运动信息预测候选填充,如果没有,则识别运动信息参考图像中的第二块并且运动信息预测候选列表而被从第二块的运动信息中得出的运动信息预测候选填充。例如,第一块可以是继承与当前间预测块内的第一对齐位置同一位置的块,而第二块是包含位于间预测块外的第二预先确定的位置同一位置的块,即在与预先确定的边垂直的方向上相对于间预测块的偏移。
根据本申请的以上概述的思想的进一步变体,运动信息预测候选列表的构建/建立以某种方式进行,以将原点易于与切片独立约束冲突的运动信息预测候选转移到运动信息预测候选列表的末尾,其中原点即其原点位于当前切片之外。通过这种方式,在编码器侧将指示器信号化到运动信息预测候选列表中不会受到太多约束。换句话说,针对特定间预测块发送并且发信号通知运动信息预测候选的指示器实际用于当前间预测块,指示器通过运动信息预测候选列表中的等级位置指示实际要使用的此运动信息候选。通过转移列表中可能不可用的运动信息预测候选,因为它们的原点位于当前切片之外,以便出现在运动信息预测候选列表的末尾或至少稍后,即更高的等级,列表中在后者之前的所有运动信息预测候选仍然可以由编码器发信号通知,因此,它们可用于预测与向列表末尾不转移这种“有问题”的运动信息预测候选相比,当前块的运动信息的运动信息预测候选库仍然是大的。根据与刚刚概述的方面有关的一些实施例,以将“有问题的”运动信息预测候选转移至列表末尾的方式填充运动信息预测候选列表是以切片边界感知方式在编码器和解码器执行。以这种方式,与潜在地更可能是更有效的运动信息预测候选向列表末尾的这种转移相关联的轻微编码效率损耗被限制在视频的图像的沿着切片边界的区域。然而,根据替代方案,无论当前块是否位于沿着任何切片边界,都执行向列表末尾移动“有问题的”运动信息预测候选。虽然稍微降低了编码效率,但后一种替代方案可能会提高鲁棒性并简化编码/解码过程。“有问题的”运动信息预测候选可能是从参考图像中的块得出的那些或者可能是从运动信息历史管理得出的。
根据本申请的进一步实施例,通过对预测的运动向量实施切片独立约束,解码器和编码器以切片边界感知方式确定时间运动信息预测候选,预测的运动向量依次用于指向运动信息参考图像中的块,块的运动信息用于形成列表中的时间运动信息预测候选。预测的运动向量被剪裁以留在当前切片内或指向当前切片内的位置。因此,这样的候选的可用性在当前切片内得到保证,从而保持与切片独立约束的列表符合性。根据替代概念,如果第一运动向量指向当前切片之外,则使用第二运动向量而不是剪裁运动向量。即,如果第一运动向量指向切片外,则第二运动向量用于基于形成时间运动信息预测候选的运动信息定位块。
根据更进一步的实施例,以上概述的为解码器提供切片边界感知以帮助实施切片独立约束的想法,支持运动补偿预测的解码器,根据其运动信息被编码在特定间预测块的数据流中和解码器从中得出每个子块的子块的运动向量,此间预测块划分成所述子块的每个子块,执行子块运动向量的得出或根据切片之间的边界位置,使用得出的运动向量或两者来预测每个子块。以这种方式,由于会与切片独立约束冲突,编码器不能使用这种有效编码模式的情况大大减少。
根据本申请的进一步方面,支持运动补偿双向预测并在编码器和解码器处包括双向光流工具以改进运动补偿双向预测的编解码器,符合切片独立编码,切片独立编码在工具的应用将导致与切片独立约束发生冲突的情况下,通过为编码器和解码器提供双向光流工具的自动停用,或将使用边界填充,以确定使用双向光流工具预测的特定双向预测间预测块的分块的区域,此区域位于当前切片之外。
本申请的另一方面涉及使用存储先前使用的运动信息的运动信息历史列表来填充运动信息预测器候选列表。无论是否使用基于切片的编码,都可以使用此方面。此方面寻求通过从运动信息历史列表中呈现运动信息预测器候选的选择来提供更高压缩效率的视频编解码器,通过选择将填充当前要填充在候选列表中的条目,这取决于到目前为止填充运动信息预测器候选的那些运动信息预测器候选。此依赖性的目的是选择更有可能其运动信息远离迄今为止填充候选列表的运动信息预测器候选的历史列表中的运动信息条目。可以基于例如分别由它们的历史列表中的运动信息条目和候选列表中的运动信息预测器候选组成的运动向量和/或由它们组成的参考图像索引来定义适当的距离测量。通过这种方式,使用基于历史的候选的候选列表的填充导致结果候选列表的更高程度的“刷新”,使得与纯粹根据其在运动信息历史列表中的等级来选择基于历史的候选相比,编码器在大失真优化方面在候选列表中找到好的候选的可能性更高,即,新近相同是如何已被添加到运动信息历史列表中。此概念实际上也可以应用于当前要从一组运动信息预测器候选中选择以填充运动信息预测器候选列表的任何其他运动信息预测器候选。
本发明的有利方面是从属权利要求的主题。
附图说明
下面结合附图对本申请的优选实施例进行说明,其中:
图1示出了基于块的视频编码器的框图,作为其中根据本申请的实施例的可以实施的间预测概念的编码器的示例;
图2示出了适合图1的编码器的基于块的视频解码器的框图,作为其中可以实现根据本申请的实施例的间预测概念的编码器的示例;
图3示出了说明预测残差信号、预测信号和重构信号之间的关系的示例的示意图,以说明分别为编码模式选择、变换选择和变换性能设置细分的可能性;
图4示出了说明将视频划分为切片的示例性划分和切片独立编码的总体目标的示意图;
图5示出了说明JEM(联合探索编解码模式)仿射运动模型示意图;
图6示出了说明ATMVP(可选时域运动矢量预测)程序的示意图;
图7示出了说明BIO(双向光流)工具中使用的光流轨迹的示意图;
图8示出了说明根据本申请的一些实施例的解码器关于预先确定的间预测块的切片感知或切片感知运动信息得出以及编码器为了使切片独立编解码器更有效而利用此解码器的行为的示意图;
图8示出了说明根据对应的实施例示出解码器的遵守/执行特征的示意图;
图9示出了说明根据本申请的一些实施例的解码器的遵守/执行特征以及用于实现运动数据的关联重定向的不可逆映射的使用的示意图;
图10示出了说明预测运动信息编码/解码的示意图,以说明将解码器的遵守/执行特征应用于信号通知或最终重建的运动信息状态或运动信息预测的可能性;
图11示出了说明由于数学样本组合以计算间预测块的单个样本而导致的分块大小变化和/或分块大小扩大的可能性的示意图;
图12a和图12b示出了说明由于内插滤波器的运动精确度相关激活,与运动精确度相关分块大小相关的实现运动重定向或不可逆映射的不同可能性的示意图,目的在于允许分块在图12的情况下尽可能接近当前切片的边界,并在图12b的情况下实现运动向量的安全界限;
图13示出了说明将解码器的遵守/执行功能应用于运动信息预测的得出的可能性的示意图,另外还示出了说明运动信息预测器候选列表的可选构造;
图14示出了说明解码器的遵守/执行功能中涉及的不可逆运动向量映射以及当附加地可选地解释运动信息预测器候选列表时得到的运动信息预测器候选的示例性集合的示意图;
图15示出了说明根据特定运动信息预测器候选是否与切片独立性约束冲突来呈现在填充运动信息预测器候选列表中的候选可用性的可能性的示意图;
图16示出了说明根据间预测块是否与特定切片边相邻的时间运动信息预测器候选的得出来改变参考块识别的可能性的示意图;
图17示出了说明根据间预测块是否与某些切片边相邻来呈现填充运动信息预测器候选列表中的填充顺序的示意图,这里关于时间运动信息预测器候选和一个或多个空间运动信息预测器候选的并置;
图18示出了说明将解码器的遵守/执行功能应用于用于得出时间运动信息预测器候选的预测的运动向量的可能性的示意图;
图19示出了说明图18的概念的替代方案的示意图,其中在第一预测运动向量与切片独立约束冲突的情况下使用替代的预测的运动向量;
图20示出了说明根据仿射运动模型对当前间预测块的子块进行运动信息得出的示意图,用于说明协助实现切片独立性约束的解码器的不同概念;
图21示出了说明根据迄今为止填充列表的候选的运动信息选择用于填充运动信息候选列表的基于历史的运动信息候选以改进得到的候选列表的示意图;以及
图22示出了说明根据嵌入被内置到编码器和解码器中的BIO(双向光流)工具的功能的示意图,用于说明协助实现切片独立性约束的解码器的不同概念。
具体实施方式
附图的以下描述开始于对用于对视频的图像进行编码的基于块的预测编解码器的编码器和解码器的描述的呈现,以便形成用于间预测编解码器的实施例的编码框架的示例。之前的编码器和解码器相对于图1至图3进行描述。下面给出对本申请的间预测概念的实施例的描述。它们可以组合或组合使用。特别地,稍后描述的所有概念可以分别通过组合内置到图1和2的编码器和解码器中,尽管用随后的图4描述了实施例,之后还可以使用编码器和解码器来形成不根据图1和图2的以编码器和解码器为基础的编码框架操作的编码器和解码器。
图1示出了用于使用示例性的基于变换的残差编码将由图像序列12组成的视频11预测编码为数据流14的装置。装置或编码器使用参考符号10表示。图2示出了相应解码器20,即,装置20被配置为也使用基于变换残差解码对由来自数据流14的图像序列12’组成的视频11’进行预测性解码,其中撇号已被用于指示由解码器20重构的视频11’和图像12’在预测残差信号的量化引入的编码损耗方面偏离了最初由装置10编码的图像12。图1和图2示例性地使用基于变换的预测残差编码,但是本申请的实施例不限于这种预测残差编码。对于关于图1和2描述的其他细节也是如此,如下文将概述的。
编码器10被配置为对预测残差信号进行空间到频谱变换并将如此获得的预测残差信号编码到数据流14中。同样地,解码器20被配置为从数据流14中解码预测残差信号,并对由此获得的预测残差信号进行频谱到空间变换。
在内部,编码器10可以包括预测残差信号形成器22,其生成预测残差24以测量预测信号26与原始信号,即当前图像12的偏差。预测残差信号形成器22可以,例如,是从原始信号,即当前图像12中减去预测信号的减法器。编码器10然后进一步包括变换器28,变换器28使预测残差信号24经受空间到频谱变换以获得谱域预测残差信号24’,其然后由量化器32进行量化,量化器32由编码器10组成。如此量化的预测残差信号24”被编码到位流14中。为此,编码器10可以可选地包括熵编码器34,其熵编码转换并量化为数据流14的预测残差信号。预测残差26基于解码为数据流14并且可从数据流14解码的预测残差信号24”,由编码器10的预测级36产生。为此,预测级36可以在内部,如图1中所示,包括去量化器38,其去量化预测残差信号24”以获得谱域预测残差信号24”’,其对应于信号24’,除了量化损耗之外,接着是逆变换器40,其使后一预测残差信号24”’经历逆变换,即频谱到空间的变换,以获得预测残差信号24””,其对应于原始预测残差信号24,但量化损耗除外。然后预测级36的组合器42诸如通过加法重新组合预测信号26和预测残差信号24””以获得重构的信号46,即原始信号12的重构。重构的信号46可以对应于信号12’。然后预测级36的预测模块44通过使用例如空间预测,即内预测,和/或时间预测,即间预测,基于信号46来产生预测信号26。
同样地,解码器20可以在内部由对应于预测级36并且以对应于预测级36的方式相互连接的组件组成。特别地,解码器20的熵解码器50可以对来自数据流的量化的谱域预测残差信号24”进行熵解码,因此以上述关于预测级36的模块的方式相互连接和协作的解量化器52、逆变换器54、组合器56和预测模块58基于预测残差信号24”恢复重建的信号,从而如图2中所示,组合器56的输出产生重构的信号,即图像12’。
尽管上面没有具体描述,但是已经清楚的是,编码器10可以根据一些优化方案,诸如以优化一些速率和失真相关的标准,即编码成本的方式,设置一些编码参数,包括例如预测模式、运动参数等。例如,编码器10和解码器20以及相应模块44、58分别可以支持不同的预测模式,诸如内编码模式和间编码模式。编码器和解码器在这些预测模式类型之间切换的粒度可以分别对应于将图像12和12’细分为编码段或编码块。例如,以这些编码段为单位,可以将图像细分为被内编码的块和被间编码的块。基于对应的块的空间、已编码/已解码的邻域来预测内编码的块。多个内编码模式可以存在并且被选择用于包括方向或角度内编码模式的各个内编码段,根据这些模式通过沿特定方向外推邻域的样本值来填充对应的段,到相应内编码段内。例如,内编码模式还可以包括一个或多个进一步模式,诸如DC编码模式,根据此模式,对应的内编码块的预测将DC值分配给对应的内编码的段内的所有样本,和/或平面内编码模式,根据此模式,对应的块的预测被近似或确定为由在对应的内编码块的样本位置上的二维线性函数描述的样本值的空间分布基于领域样本得出由二维线性函数定义的平面的倾斜和偏移。与之相比,可以例如在时间上预测间编码的块。对于间编码的块,运动信息可以在数据流内用信号发送:运动信息可以包括指示图像12所属的视频的先前编码的图像的部分的空间位移的向量,先前编码/解码在此部分图像被采样以获得对应的间编码的块的预测信号。也可以使用更复杂的运动模型。这意味着,除了数据流14组成的残差信号编码,诸如代表量化的谱域预测残差信号24”的熵编码变换系数级别,数据流14可能已经在其中编码了用于分配编码模式到各种块的编码模式参数,一些块的预测参数,诸如间编码的块的运动参数,以及可选的进一步参数,诸如分别控制和信号通知将图像12和12’细分为块的参数。解码器20使用这些参数以与编码器相同的方式细分图像,将相同的预测模式分配给块,并执行相同的预测以产生相同的预测信号。
图3示出了一方面重建信号,即重建图像12’,与另一方面数据流中用信号通知的预测残差信号24””和预测信号26’的组合之间的关系。如上所述,此组合可以是加法。预测信号26在图3中被示出为将图像区域细分为使用阴影线说明性地表示的内编码块和不带阴影线说明性地表示的间编码块。细分可以是任何细分,诸如将图像区域的规则细分为块或块的行和列,或将图像12的多树细分为不同大小的叶块,诸如四叉树子划分等,成块,其中其混合如图3中所示,其中首先将图像区域细分为树根块的行和列,然后根据递归多树细分进一步细分。同样,对于内编码块80,数据流14可以具有编码到其中的内编码模式,其将几种支持的内编码模式中的一种分配给相应内编码块80。对于间编码块82,数据流14可以具有编码到其中的运动信息,诸如包括一个或多个运动向量的运动信息。详情载于下文。一般而言,间编码块82不限于被时间编码。可替代地,间编码块82可以是从超过当前图像12本身的先前编码的部分预测的任何块,诸如图像12所属的视频的先前编码图像,或者在这种图像编码器和解码器分别是可扩展的编码器和解码器的情况下另一视图或分层较低层。图3中的预测残差信号24””也被示出为将图像区域细分为块84。这些块可以被称为变换块以将其与编码块80和82区分开来。实际上,图3示出编码器10和解码器20可分别使用图像12和图像12’的两种不同细分为块,即分别一种细分为编码块80和82,另一种细分为块84。细分可能是相同的,即每个编码块80和82可以同时形成变换块84,但是图3示出了这样的情况,例如,细分为变换块84形成细分为编码块80/82的扩展使得块80和82的两个块之间的任何边界覆盖两个块84之间的边界,或者可替代地,每个块80/82要么与变换块84中的一个重合,要么与一组变换块84重合。然而,也可以彼此独立地确定或选择细分,使得变换块84可以替代地跨越块80/82之间的块边界。因此就细分为变换块84而言,与关于细分为块80/82所提出的那些类似的陈述是真实的,即块84可以是将图像区域规则地细分为块/块,按行和列排列,图像区域的递归多树细分的结果,或其组合或任何其他类型的块。顺便说一句,要注意的是,块80、82和84不限于方形、矩形或任何其他形状。
在以下描述的实施例中,以间预测块104为代表来描述各个实施例的具体细节。此块104可以是间预测块82中的一个。后续图中提到的其他块可以是块80和82中的任何一个。
图3示出预测信号26和预测残差信号24””的组合直接产生重构信号12’。然而,应当注意,根据替代实施例,可以将多于一个预测信号26与预测残差信号24””组合以形成图像12’。
在图3中,变换段84应具有以下意义。变换器28和逆变换器54以这些变换段84为单位执行它们的变换。例如,许多编解码器对所有变换块84使用某种DST或DCT。一些编解码器允许跳过变换,使得对于一些变换段84,预测残差信号直接在空间域中编码。然而,根据以下描述的实施例,编码器10和解码器20以它们支持多个变换的方式配置。例如,编码器10和解码器20支持的变换可以包括:
οDCT-II(或DCT-III),其中DCT代表离散余弦变换
οDST-IV,其中DST代表离散正弦变换
οDCT-IV
οDST-VII
ο恒等变换(IT)
自然地,虽然变换器28将支持这些变换的所有前向变换版本,但解码器20或逆变换器54将支持其相应后向或逆向版本:
ο逆DCT-II(或逆DCT-III)
ο逆DST-IV
ο逆DCT-IV
ο逆DST-VII
ο恒等变换(IT)
随后的描述提供了关于如何在编码器10和解码器20中实现间预测的更多细节。可以额外地、单独地或全部地支持上述所有其他模式,诸如上述内预测模式。残差编码可以以不同的方式进行,诸如在空间域中。
如上所述,图1-3已被呈现为使用以下更详细概述的概念中的一个或多个来执行基于块的视频编码的编码器的示例。下面阐述的细节可以转移到图1的编码器或另一个基于块的视频编码器,使得后者将不同于图1的编码器,例如,不支持内预测,或者其中细分为块80和/或82以不同于图3中示例的方式执行,或者甚至因为此编码器不使用变换预测残差编码对预测残差进行编码,例如,直接在空间域中编码。同样地,根据本申请的实施例的解码器可以使用下文进一步概述的任何间预测编码概念从数据流14执行基于块的视频解码,但是可以与例如图2的解码器20的不同之处在于其不支持内预测,或在相同的情况下以不同于关于图3描述的方式将图像12’细分为块和/或其不从变换域中数据流14中得出预测残差,但例如,在空间域中得出。
然而,在关注实施例的描述之前,解释了以划分成切片的形式编码视频的能力以及彼此独立地编码/解码切片的方式。进一步,描述了进一步的编码工具的详细描述,到目前为止还没有讨论,并且可以根据下面概述的实施例选择性地使用这些工具,但仍然保持相互切片编码的独立性。
因此,在描述了基于块的视频编码器和视频解码器的潜在实现之后,图4被用来说明切片独立编码的概念。基于切片的独立编码可能仅代表编码器的几种编码设置之一。即,编码器可以被设置为遵循切片独立编码或者可以被设置为不遵循切片独立编码。自然地,视频编码器可能不可避免地应用切片独立的编码。
根据切片独立编码,视频11的图像被划分成切片100。在图4中,说明性地,仅示出了视频11中的三个图像12a、12b和12c并且它们被示例性地示出为被划分成分别为六个切片100,尽管划分为任何其他数量的切片也是可行的,例如两个或更多个切片。此外,尽管图4示出了将切片划分成切片100的方式是使得一个图像内的切片100规则地按照行和列排列,其中每个切片100是对应的图像的矩形部分,并且切片100之间的边界形成穿过图像12a到12c的直线102,但应该注意,在切片具有另一种形状的情况下也存在替代解决方案。可能的是,为了分别对对应的图像进行编码和解码,将每个图像12划分为块,如图3所解释的,与切片边界102对齐,并且编码块、预测块和/或变换块、交叉和切片边界102中没有一个,而是专有地性地在对应的图像的切片100之一中。例如,切片划分可以以与将图像12划分成树根块,即通过递归多树划分的方式被编码器单独细分成块80/82的块对齐的方式来完成,也代表性地示出的块104属于其中,并且其中在数据流中单独的细分被用信号通知给解码器。
切片独立编码意味着以下:以独立于未定位的块104内的任何其他切片的方式进行切片的相应部分的编码,诸如图4中的块104示例性示出的。此编码独立性不仅与同一图像的其他切片有关,即,块104是其一部分的同一图像中的其他切片,图4中使用示例性箭头106说明了此图像内独立性:此箭头106被中断以示出块14的编码不依赖于同一图像中的任何其他切片。编码独立性还涉及相对于其他图像的编码依赖性:视频11的所有图像12a至12c以相同方式被划分成切片100。因此,特定图像12a的每个切片100在所有其他图像中具有对应的、共同定位的切片。因此,“切片”不仅描述了特定图像的空间片段,诸如包含块104的图4的图像12a的片段,而且还描述了由视频的所有图像的所有同位切片组合的视频11时空片段,其在特定图像中与此切片同位。在图4中,此时空片段由相对于包含块104的切片的虚线示出。当编码块104时,编码器将对应的地也将编码依赖性限制到除包含块104的图像12a之外的其他图像,以便为了不对时空片段108之外的切片产生编码依赖性。在图4中,由从包含块104的切片指向参考图像12b中的不同切片的中断箭头110示出。
下面进一步概述的概念和实施例呈现了关于如何在编码器和解码器之间保证如何避免不同图像的不同切片之间的编码依赖性的可能性,否则例如由指向远处的运动向量以离开参考图像的同位的切片引起的和/或通过从来自块104所属的切片的边界之外的区域的参考图像得出运动信息预测而引起的。
然而,在关注本申请的实施例的描述之前,将特定编码工具描述为示例,其可以在根据本申请的实施例的基于块的视频编码器和基于块的视频解码器中实现,并且其易于引起不同图像的不同切片之间的切片相互依赖性,因此易于通过使用中断箭头110引起与图4中所示的约束冲突。
现有技术的典型视频编码大量使用帧之间的间预测以提高编码效率。对于间预测约束编码,间预测过程通常需要调适空间段边界,这是通过编码位率显著运动信息预测残差或MV差(相对于可用的运动信息预测器或MV预测器)实现的。
现有技术的典型视频编码技术在很大程度上依赖于在编码过程的不同阶段收集所谓的候选列表中的运动向量预测器的概念,例如合并候选列表,其中还包括MV预测器的混合变体。
添加到此类列表的典型候选是来自时间运动向量预测(TMVP)的同位的块的MV,它是与当前编码的块相同空间位置旁边的右下块,但对于大多数当前块在参考帧中。唯一的例外是位于图像边界的块和位于CTU行底部边界的块(至少在HEVC中),其中实际的同位的块用于得出所谓的中心同位候选,因为在图像内没有右下块。
存在其中使用此类候选可能会出现问题的用例。例如,当使用切片并执行切片的部分解码时,它们的可用性可能会改变。发生这种情况是因为在编码器处使用的TMVP可能属于当前未解码的另一个切片。此过程还会影响在同位的候选的索引之后的所有候选。因此,解码这样的位流会导致编码器/解码器不匹配。
诸如AVC或HEVC等视频编码标准依赖于精度高于整数像素的高精度运动向量。这意味着运动向量可以参考先前图像的样本,这些样本不是位于整数样本位置而是位于子样本位置。因此,视频编码标准定义了一个插值过程,以通过插值滤波器得出子样本采样位置的值。例如,在HEVC的情况下,亮度分量使用了8抽头插值滤波器(色度使用了4抽头)。
由于在许多视频编码规范中采用了子像素(sup-pel)插值过程,当使用指向非整数样本位置的运动向量MV2时,可能会发生这样的情况,其长度(水平或垂直分量)小于指向同一方向的整数样本位置的运动向量MV1,由于子样本插值过程,需要距离原点更远的样本(例如,相邻切片的),而使用MV1运动向量将不需要相邻切片的样本。
传统上,视频编码采用仅平移运动模型,即矩形块根据二维运动向量进行位移,以形成当前块的运动补偿预测器。这样的模型不能表达许多视频序列中常见的旋转或缩放运动,因此,已经努力稍微扩展传统的平移运动模型,例如在JEM中称为仿射运动。如图5中所示,在此仿射运动模型中,两个(或三个)所谓的每个块104的控制点运动向量(v0,v1)用于模拟旋转和缩放运动。从相邻块的MV候选中选择控制点运动向量v0,v1。通过计算基于子块的运动向量场并依赖于矩形子块112的传统平移运动补偿,得到得出的运动补偿预测器。图1示例性地示出了得到的预测器或分块114(虚线),其中上右子块(实线)根据相应子块运动向量进行预测。
运动向量预测是一种从时间或空间-时间相关块中得出运动信息的技术。在称为替代TMVP(ATMVP)的一个这样的过程中,如图6中所示,来自当前图像12a中的块104的列表的默认MV候选(例如合并候选列表中的第一合并候选)被称为时间向量116,用于确定参考帧12b中的相关块118。
换言之,对于CTU内的当前预测块104,在参考图像12b中确定同位预测块118。为了定位同位的块118,从当前图像12a内的空间候选中选择运动向量MVTemp 116。通过将运动向量MVTemp 116添加到当前预测块位置12a来确定同位块。
然后对于当前块104的每个子块122,相关块118的相应子块124的运动信息被用于当前子块122的间预测,其还结合了附加程序,诸如用于相关帧之间的时间差的MV缩放。
双向光流(BIO)使用在逐块运动补偿之上执行的逐样本运动细化,以进行双向预测。图7说明了过程。细化基于基于光流定理最小化两个参考帧12b、12c(Ref0、Ref1)中的图像分块(A,B)之间的差,此定理又基于对应的图像分块的水平和垂直梯度。梯度图像,即图像中亮度强度方向变化的测量,在A和B中的每个图像分块的水平和垂直方向上,计算得出预测块的每个样本增强偏移。
当前最先进的视频编解码器中引入了一个新概念,诸如VVC的测试模型,称为基于历史的运动向量预测(HMVP),其中维护最后使用的MV的无重复FiFo缓冲器,以使用比零运动向量更有希望的候选来填充MV候选列表。最先进的编解码器将HMVP候选添加到(子块或块方式)同位或空间候选之后的运动向量候选列表。
在已经根据上面关于图1至图3阐述的示例描述了基于块的视频编码器和解码器的通用功能之后,并且已经总体解释了切片独立编码的目的以及一些编码工具,这些工具的使用单独地可能会缩短切片独立编码,因为没有特别考虑,或者如果以不利的方式考虑,则可能变得非常无效。在下文中,描述了能够在仍然非常有效地使用诸如上面示例性地阐述的那些的编码工具的情况下遵守切片独立性的实施例。
图8示出了根据本申请实施例的基于块的视频编码器10和基于块的视频解码器20,其中,如上所述,重复使用图1和图2的参考符号不意味着图8的编码器10和解码器20将必须如上文关于图1和图2概述的那样解释,尽管它们可能如那样解释,或可能部分如那样解释。编码器10将视频11编码到数据流14中,而解码器20从数据流14中解码视频11的重构。视频11的图像12被划分为切片100,如关于图4解释的。切片100中的编码独立性是一项任务,根据图8,不仅编码器10在将视频11编码到数据流14中时将其考虑在内。而是,解码器20还知道穿过视频11的图像12的内部的切片边界102和彼此分开的相邻切片100。特别地,如上面关于图4已经概述的,切片100也在时间维度上延伸,因为每个图像12以相同的方式被划分成切片100,使得一个图像的每个切片具有同位于视频11的任何其他图像中的切片。因此,用于预测一个图像12内的间预测块的运动信息应保持在当前切片内,即在相应间预测块的同一切片中。换句话说,用于当前图像的这种间预测块的运动信息,其从其预测相应间预测块定位参考图像中的分块,不应导致切片间依赖性。根据图8,解码器至少在一定程度上减轻了编码器10的情况,并为视频11的当前图像12a的预先确定的间预测块104得出运动信息,其取决于视频11的图像12内的边界102的位置的方式从数据流14中,将分块130定位在视频的参考图像12b中,从中预测预先确定的间预测块104。因此例如,运动信息可以定义或包括运动向量132。编码器10又可以依赖于此解码器行为并且可以如下操作:仍然,编码器10以某种方式确定用于当前图像12a的预先确定的间预测块的运动信息132,以使得分块130保持在此间预测块104所在的切片的边界102内并且不跨越所述边界102。更准确地说,编码器10确定运动信息132,使得分块在参考图像12b的同位的切片的边界内,即与块104所在的切片同位的切片。编码器10以此方式确定此运动信息132并使用此运动信息进行块104的间预测。然而,在将运动信息编码到数据流14中时,编码器利用解码器40的功能,或者更准确地说,解码器20对边界102的认识。因此,编码器10将运动信息132编码到数据流14中,使得其从数据流14的得出将依赖于,即需要依赖切片100之间的边界102的位置来执行。
根据接下来描述的实施例,解码器20使用前述的切片边界感知,即来自数据流的运动信息的得出对切片的边界位置的依赖性,以便相对于预先确定的间预测块104的运动信息的信号状态执行切片依赖性。参见图9,数据流14包括用信号发送块104的运动信息的部分或句法部分140。因此,此部分140确定用信号发送的块104的运动信息的状态。稍后,将描述部分140可以例如包括运动向量差,即运动向量预测残差,以及可选的指向运动预测器的列表的运动预测器索引。识别与运动向量相关的参考图像12b的参考图像索引也可以可选地由部分140组成。确切地使用对运动信息部分140的任何描述,只要块140的运动信息的信号通知状态导致块104随后将被预测的对应分块130在块104所属的相同切片100a内,此用信号通知状态不会与切片独立约束冲突,因此,解码器20可以离开此状态并使用此状态作为运动信息的最终状态,即作为用于块104的来自分块130的间预测的状态。图9中指示了两个示例性信号通知状态:由环绕1指示的状态与导致分块130a的运动信息132a相关联,分块130a显然在切片100a内。由环绕2的指示的另一种状态与运动信息132b相关联并且导致分块130b从当前切片100a跨越边界102到相邻切片100b。与相邻切片100b重叠的分块130b的重叠部分由图9中的阴影表示。根据分块130b的预测块104将引入切片间依赖性,因为相邻切片100b的样本将用于预测块104。因此,根据图9的示例,解码器20将检查部分140的用信号通知状态是否是类似于图9的状态2的状态,其中分块至少部分地在切片100a之外,如果是,则将运动信息从发信号通知状态重定向到重定向状态,重定向状态导致分块130保持在当前切片100a的边界102内。图9中的点划线表示这样的分块130’b由重定向运动信息130b’的重定向状态2’定位。
存在可以执行这种重定向的不同方式。下文详情描述。特别地,正如下面的描述揭示的,可能是分块130a、130b和130’b的大小不同。与块104相比,它们中的至少一些可能具有不同的大小。例如,这可能是由于需要在相应分块处从参考图像使用插值滤波器来预测块104,例如,在涉及子像素运动向量的对应的运动信息的情况。从图9的描述中可以清楚地看出,刚刚描述的重定向142导致编码器有两种选择来用信号发送数据流14内的运动信息130b’:编码器可以使用信号状态2或状态2’。这种“自由”可能会导致较低的位率。想象一下,例如,使用预测编码以用信号通知运动信息。如果块104的运动信息的预测器指示状态2,则编码器将能够简单地使用此预测器并用信号通知数据流14的部分140中为零的运动信息预测残差,从而用信号通知状态2,状态2将通过解码器重定向到状态2’。
图10示出了关于图9已经提到的可能性:解码器可以使用从数据流得出的运动信息对切片边界位置的依赖性,以便遵守或执行关于运动信息的信号通知状态的切片独立性的约束,而运动信息的信号通知状态又是运动信息的预测和使用块104的数据流14的部分140中的运动信息预测残差信号对其进行校正的结果。即,对于块104,编码器和解码器将通过使用先前编码的块,诸如基于用于编码/解码当前图像中的块104的空间相邻块或位于特定参考图像中的块104附近的块的运动信息,来提供运动信息预测或运动信息预测器150,诸如向量。后者可以是包含分块130的参考图像12b或用于运动信息预测的另一图像。在块104的部分140中用信号通知诸如运动向量差的运动信息预测残差152。因此,解码器从数据流14中解码运动信息预测残差152并以基于运动信息预测150和运动信息预测残差152确定用于块104的运动信息(诸如运动向量)。例如,在运动向量的情况下,运动向量150和152之和指示用信号通知的运动向量154,如块104的运动信息的信号通知状态,其指向足迹或分块130,其中块104将从足迹或分块130通过将运动向量154的底部放置到预先确定的位置156,诸如,例如同位于预先确定的对齐位置的参考图像中的位置来预测块104,诸如图10中所示的左上角158之类的块104的位置,诸如角。然后向量154的顶部将指向,例如,到块104的足迹的左上角。如前所述,由于过滤或其他技术,诸如用于从分块130得出块104的预测的插值滤波,分块130与纯足迹相比可以放大或以其他方式变形。根据接下来描述的实施例,正是此预测地解码的运动信息154受约束遵守/执行。
即,解码器将遵守或执行对运动信息154施加约束,使得分块130不超过块104所属的切片108的边界102。如关于图9所解释的,解码器使用不可逆映射来进行这种遵守/执行。映射将可能的信号通知状态,此处在图10中,运动信息预测150和运动信息预测残差152的可能组合,映射到运动信息154的非冲突状态。不可逆映射将每个可能组合映射到最终运动信息,使得根据这样的最终运动信息放置的分块130保持在当前分块100a的边界102内。因此,根据相对于当前切片的切片边界的位置104和/或运动信息预测150的方向和大小,存在运动信息预测150和运动信息预测残差152的组合,即可能的信号通知状态,它们被映射到相同的最终运动信息154,即相同的最终状态,尽管这些不同的组合共享例如相同的运动信息预测150并且仅在残差152上不同。因此,编码器有自由选择运动信息预测残差152。例如,图10说明了运动信息预测残差152’由于解码器侧的约束遵守/执行,可能导致有效地相同的运动信息154,即分别由于刚刚提到的不可逆映射的重定向142。
在这种情况下,在编码器可以自由选择有效地导致相同运动信息被应用于块104以执行间预测的那些中的任何运动信息预测残差的情况下,编码器10可以使用为零的一个,因为此设置可能是导致最低位率的设置。
图11示出了上面也已经提到的内容,即块104从分块130被间预测的分块130可以具有与块104相比不同的形状的可能性,其中分块130根据诸如特定运动向量132的特定运动信息定位。通常,分块130大于参考图像内块104的单纯足迹160,根据运动信息132相对于其在当前图像中的位置位移。特别地,在从分块130执行块104的实际预测时,解码器和编码器可以借助在分块160的相应部分内的样本164的数学组合来预测块104的每个样本162。通常,分块130的部分有助于用于特定块样本162的数学组合位于对应的样本162的位置处及其周围,根据运动信息132处或周围位移,即在参考图像12b内的其位移样本位置162’。例如,数学组合可以是与块104中的对应的样本相相应部分的样本的加权和。每个样本162的此部分可以在运动向量132是子像素运动向量的情况下,例如由内插滤波器的核确定,并且因此确定块104的子像素位移到参考图像12b内的子像素样本位置。有趣的是,例如,在运动信息132包括全像素运动向量的情况下,可能不需要内插滤波器,从而在这种情况下,分块130将与块104一样大,并且每个样本162将被预测为将其设置为等于分块130中的一个对应的样本164。另一种对将足迹160扩大到分块130的类型或起源或贡献可以替代地或附加地源于其他间预测工具,诸如根据以下详细描述的参考BIO工具。特别地,根据BIO从分块130得出的预测器可能只是块104的两个假设之一,在这种情况下将被双向预测。然而,为了获得此预测器,在子像素运动向量的情况下通过内插得出的预测器的初始版本和在全像素运动向量的情况下没有内插滤波器的预测器的初始版本将按照以下方式确定:相对于实际块的104大小在所有方向上通过n个样本(n>0,诸如1)放大了初始版本。这样做是为了确定分布在此初始预测器的块104区域上的多个位置上的局部亮度梯度,并在块的区域内通过线性组合的方式以根据局部梯度在块的区域上变化的方式组合两种假设,即从参考图像12b中得到的初始预测器和从另一个参考图像中得到的同样的另一个初始预测器,来获得最终的双预测预测器。关于图22解释了可以忽略后一个BIO对分块扩大的贡献,并且可以根据分块扩大的n样本宽BIO扩展贡献(n>0)是否会反而导致分块130跨越边界102而停用BIO工具。也就是说,现有的重定向过程将在不理会BIO工具的情况下初始执行,并且BIO工具将以边界感知方式被编码器停用并替换为编码器。此外,除了BIO工具之外可能使用的另一种模式是仿射运动模型工具,根据此工具,运动信息包含当前块104的两个运动向量,其定义了块104的两个不同的角处的块104内运动向量场的运动向量并基于它计算块104的子块的使用仿射运动模型的子块运动向量。由此产生的子块的分块可以被认为形成一个组合的分块,例如在图20中,由子块的分块组成,并且再次,切片独立性执行可以执行组合分块作为一个整体不跨越边界102,即没有单个子块的分块。关于重定向和执行程序的解释,分别参照图9和图10,上面解释的功能意味着分块130的变化分块大小被考虑到两个方面,实际用信号发送的运动信息的分块大小要受到条件重定向以及关于到任何“有问题”的运动信息被重定向或重新映射到其上的运动信息设置。也就是说,尽管没有针对图9明确提及,但特定运动信息状态的重定向可能导致分块大小的变化:尚未重定向状态,诸如图9中的状态2与重定向142导致的相比可能具有不同的分块大小,即2’。
关于如何执行上述不可逆映射或重定向,存在不同的可能性。这对于双方都是如此,一方面是在形成不可逆映射的输入时进行重定向状态,另一方面是不可逆映射的输出的重定向状态。图12a显示了一种可能性。图12a通过显示相对于边界102的对应块来显示或说明四个不同的设置1、2、3和4,它们尚未被重定向或经受不可逆映射,边界102一方面分离当前切片100a和另一方面分离相邻的切片100b。对于前三个状态1、2和3,切片130比在状态4的情况下小。特别地,图12a示出了在状态1、2和3中,分块130与内预测块的足迹160重合。在状态4中,分块130相对于足迹160被放大,这在图12a中针对此设置4用虚线示出。例如,放大是由于状态4中的相应运动向量是子像素运动向量,同时是状态1到3中的是全像素运动向量。由于这种放大,虽然状态1到3的分块130位于当前分块100a内并且不跨越边界102,但状态4的分块130尽管其相应运动向量位于状态2和3的全像素运动向量之间,但它延伸到边界102之外。
也就是说,在任何情况下,约束遵守/执行都必须重定向状态4。根据稍后描述的一些实施例,状态1、2和3保持原样,因为相应分块不跨越边界102。这实际上意味着,不可逆映射的共域,即重定向状态的库或域,允许分块130比扩展边缘部分172的宽度170更接近当前切片100a的边界102,与间预测块104的足迹160相比,通过边缘部分172分块130被加宽。换句话说,例如在重定向过程142中,导致不跨越边界102的分块130的全像素运动向量保持不变。在不同的实施例中,即使运动信息的那些状态被重定向,不超过边界102延伸到相邻分块中,但相对于足迹不延伸,如果它们将跨越边界102:在图12a的示例中,这些是状态1、2和3,甚至那些将被重定向,以便以至少容纳宽度170的方式与边界102保持距离。参见图12b,其中状态3的分块130显示为与边界102的距离比扩展到达170更小。因此,它被重定向到全像素状态5,其相关联的分块130或足迹160具有至少与扩展到达171一样大的距离171。也就是说,这里状态3被重定向到状态5,其中相应分块130不包括边界区域172,并且与边界102相距至少与宽度170一样大的距离171。
换言之,作为在许多视频编码规范中采用的子像素内插过程的结果,可能需要对远离最近的全像素参考块位置的多个整数采样位置进行采样。假设运动向量MV1是全像素运动向量,而MV2是子像素运动向量。更具体地,假设大小为BWxBH的块104在位置Posx,Posy位于切片100a中。关注水平分量,为了避免使用相邻切片100b或右侧切片的样本,MV1最多可以大到(假设MV1x>0)Posx+BW-1+Mv1x等于块104所属的切片100a的最右边的样本或(假设MV1x<0,即向量指向左边)Posx+Mv1x等于块所属的切片100a的最左边的样本。然而,对于MV2,我们必须合并来自过滤器内核大小的插值以避免达到相邻的切片。例如,如果我们将Mv2x视为MV2的整数部分,则MV2最多只能大到(假设MV2x>0)Posx+BW-1+Mv2x等于最右边的块所属的切片的样本–4,并且(假设MV2x<0)Posx+Mv2x等于块所属的切片的最左边的样本+3。
这里的“3”和“-4”是由插值滤波器引起的宽度170的示例。然而,其他内核大小也可能适用。
然而,希望建立能够以有效方式限制切片边界上的运动补偿预测的手段。下面描述了所述问题的多种解决方案。
一种可能性是相对于编码的图像内的独立空间区域即切片100的边界102来剪裁运动向量。此外,它们可以以调适于运动向量分辨率的方式被剪裁。
给定块104:
–大小等于BWxBH
–位置等于Posx,Posy
–属于具有由TileLeft,TileTop,TileRight和TileBottom定义的边界102的切片100a
定义:
–MVXInt为MVX>>精度
–MVYInt为MVY>>精度
–MVXFrac为MVX&(2precision-1)
–MVYFrac为MVY&(2precision-1)
其中MVX是运动向量的水平分量,MVY是运动向量的垂直分量,精度表示运动向量的准确性。例如,在HEVC中,MV的准确度是样本的1/4,因此精度=2。
我们剪裁运动向量MV的全像素部分,以便在将子像素部分设置为零时,所产生的剪裁的全像素向量会产生严格位于切片100a内的足迹或分块:
MVXInt=Clip3(TileLeft-Posx,TileRight-Posx-(BW-1),MVXInt)
MVYInt=Clip3(TileTop-Posy,TileBottom-Posy-(BH-1),MVYInt)
当MVXInt<=TileLeft-Posx+3或MVXInt>=TileRight-Posx-(BW-1)-4(假设HEVC中的8抽头滤波器)时,意味着,在水平方向上,运动向量的全像素部分(在剪裁后)更接近边界102,然后扩展到达170,
MVXFrac设置为0
当MVYInt<=TileTop-Posy+3或MVYInt>=TileBottom-Posy-(BH-1)-4(假设HEVC中的8抽头滤波器)时,这意味着,在水平方向上,运动向量的全像素部分(在剪裁后)更接近边界102,然后扩展到达170,
MVYFrac设置为0
这对应于关于图12a描述的情况,其中状态1、2和3的全像素运动向量被允许保持原样,因为相应分块没有延伸到相邻的切片100b中。导致延伸超过边界102的分块130的任何全像素运动向量将被剪裁到最近的全像素运动向量,其相应分块仍在边界102内而不穿过边界102。对于其扩大的分块130跨越边界102的子像素运动向量,应用以下过程:子像素运动向量被映射到最近的全像素运动向量,其分块留在切片100a内,但它小于子像素运动向量。即运动向量的全像素部分被对应的地剪裁,并且子像素部分被设置为零。这意味着如果子像素运动向量的全像素部分,即子像素运动向量的向下舍入版本,不会导致足迹160离开切片100a,则子像素运动向量的子像素部分只设置为零。因此,状态4被重定向到状态2。
作为将小数分量设置为零的替代方案,运动向量的整数像素部分可能不会按照上面指定的方式被舍入到下一个较小的整数像素位置,但也可以四舍五入到空间上最接近的相邻整数像素位置,如下所示:
剪裁运动向量MV的全像素部分,这样,当将子像素部分设置为零时,所产生的剪裁的全像素向量会像我们之前所做的那样,产生严格位于切片100a内的足迹或分块。
MVXInt=Clip3(TileLeft-Posx,TileRight-Posx-(BW-1),MVXInt)
MVYInt=Clip3(TileTop-Posy,TileBottom-Posy-(BH-1),MVYInt)
当MVXInt<=TileLeft-Posx+3或TileRight-Posx-(BW-1)>MVXInt>=TileRight-Posx-(BW-1)-4(假设HEVC中的8抽头滤波器)
MVXInt=MVXInt+(MVXFrac+(1<<(precision-1))>>precision)
当MVXInt<=TileLeft-Posx+3或MVXInt>=TileRight-Posx-(BW-1)-4(假设HEVC中的8抽头滤波器)
MVXFrac设置为0
当MVYInt<=TileTop-Posy+3或TileBottom-Posy-(BH-1)>MVYInt>=TileBottom-Posy-(BH-1)-4(假设HEVC中的8抽头滤波器)
MVYInt=MVYInt+(MVYFrac+(1<<(precision-1))>>precision)
当MVYInt<=TileTop-Posy+3或MVYInt>=TileBottom-Posy-(BH-1)-4(假设HEVC中的8抽头滤波器)
MVYFrac设置为0
即,先前讨论的过程将变化如下:运动向量被四舍五入到不离开切片100a的最接近的全像素运动向量。即,如果需要,可以剪裁全像素部分。然而,如果运动向量是子像素运动向量,则子像素部分不是简单地设置为零。相反,执行到最接近的全像素运动向量的四舍五入,即,通过有条件地剪裁全像素部分,到最接近不同于初始子像素运动向量的运动向量的全像素运动向量。例如,这将导致映射图12a的状态4,或将其重定向到状态3而不是状态2。
更换句话说,根据刚才讨论的第一个替代方案,其分块130在边界102之间延伸的运动向量通过剪裁运动向量的全像素部分而被重定向到全像素运动向量,使得足迹160保留在切片100a内,然后子像素被设置为零。作为第二种选择,在全像素部分剪裁之后,执行到最近的全像素运动向量的四舍五入。
另一种选择是更加严格并且以这样的方式将运动向量的整数部分和小数部分全部剪裁在一起,以确保避免最终发生的合并另一个切片的样本的子样本插值。这种可能性参见图12b。
MVX=Clip3((TileLeft-Posx+3)<<precision,(TileRight-Posx-BW-1-4)<<precision,MVX)
MVY=Clip3((TileTop-Posy+3)<<precision,(TileBottom-Posy-BH-1-4)<<precision,MVY)
正如上面的描述所揭示的,MV剪裁取决于MV应用到的块大小。
此描述忽略了空间分辨率可能不同的颜色分量的并置。因此,上面显示的剪裁过程不考虑色度格式,或者只考虑每个亮度样本都有一个色度样本的4:4:4模式。但是,还有两种附加的色度格式,色度和亮度样本之间的关系不同:
–4:2:0,色度在水平和垂直方向具有一半的亮度样本(即每个方向每两个亮度有一个色度样本)
–4:2:2,色度为水平方向有一半样本,垂直方向样本相同(即垂直方向每个亮度样本有一个色度样本,水平方向每两个亮度有一个色度样本)
色度子像素内插过程可以使用4抽头滤波器,而亮度滤波器使用8抽头滤波器,如上所述。如上所述,确切的数字并不重要。色度插值滤波器内核大小可以是亮度的一半,但在替代实施例中,即使这一点也可以改变。
对于4:2:0的情况,运动向量的整数部分和小数部分的得出如下:
–MVXInt作为MVCX>>(精度+1)
–MVYInt作为MVCY>>(精度+1)
–MVXFrac作为MVCX&(2precision+1-1)
–MVYFrac作为MVCY&(2precision+1-1)
这意味着整数部分是对应的亮度部分的一半,小数部分具有更细粒度的信令。例如,在HEVC中,精度=2,在亮度的情况下,可以在样本之间插入4个子像素,而对于色度,则有8个。
这导致以下事实:当xPos+MVXInt=TileLeft+1且MVXInt定义为用于4:2:0格式的亮度(不是上述色度)时,它落在整数亮度样本中,但落在分数色度样本中。这样的样本将通过子像素插值需要一个超过TileLeft的色度样本,这将阻止切片独立性。出现此类问题的情况是:
–4:2:0(HEVC中的色度类型=1)
οxPos+MVXInt=TileLeft+1且MVXInt定义为亮度
οxPos+(BW-1)+MVXInt=TileRight-2且MVXInt定义为亮度
οyPos+MVYInt=TileTop+1且MVYInt定义为亮度
οyPos+(BH-1)+MVYInt=TileBottom-2且MVYInt定义为亮度
–4:2:2(HEVC中的色度类型=2)
οxPos+MVXInt=TileLeft+1且MVXInt定义为亮度
οxPos+(BW-1)+MVXInt=TileRight-2且MVXInt定义为亮度
有两种可能的解决方案。
要么以基于色度类型(Ctype)的限制性方式进行剪裁:
ChromaOffsetHor=2*(Ctype==1||Ctype==2)
ChromaOffsetVer=2*(Ctype==1)
MVXInt=Clip3(TileLeft-Posx+ChromaOffsetHor,TileRight-Posx-(BW-1)-ChromaOffsetHor,MVXInt)
MVYInt=Clip3(TileTop-Posy+ChromaOffsetVer,TileBottom-Posy-(BH-1)-ChromaOffsetVer,MVYInt)
要么像之前概述的那样剪裁而没有由于色度而进行额外改变,但要检查是否:
–4:2:0(HEVC中的色度类型=1)
οxPos+MVXInt=TileLeft+1且MVXInt定义为亮度
οxPos+(BW-1)+MVXInt=TileRight-2且MVXInt定义为亮度
οyPos+MVYInt=TileTop+1且MVYInt定义为亮度
οyPos+(BH-1)+MVYInt=TileBottom-2且MVYInt定义为亮度
–4:2:2(HEVC中的色度类型=2)
οxPos+MVXInt=TileLeft+1且MVXInt定义为亮度
οxPos+(BW-1)+MVXInt=TileRight-2且MVXInt定义为亮度
并改变MVXInt或MVYInt(例如使用+1或根据分数部分四舍五入为+1或-1的最接近方向),以便禁止条件不会发生。
换句话说,虽然上面的描述只关注一种颜色分量,而忽略了视频图像的不同颜色分量可能具有不同空间分辨率的情况,可能是在切片独立性约束执行中考虑了不同空间分辨率的不同颜色分量的并置,此声明也适用于下文描述的修正,例如,执行适用于MI预测器而不是最终MI。坦率地说,当任何颜色分量需要插值滤波器并对应的地放大分块时,运动向量可以被视为子像素运动向量,同样地,执行重定向的运动向量也被选择在一种避免任何内插滤波的方式,这对于跨越当前切片100a的边界102的任何颜色分量可能变得必要。
根据替代的实施例,其中约束遵守/执行已被应用于最终用信号通知的运动向量154(比较图10)的上述实施例被修正到解码器应用相同概念的程度,即约束遵守/执行,即在运动向量的情况下剪裁到预测器150而不是最终的运动向量或运动信息154上。因此,如果块104的分块将根据相应运动信息预测器150放置,即如果运动信息预测残差152为零,编码器和解码器两者作用相同以执行所有运动信息预测器150遵守约束,则分块位于当前切片100a内的约束。所有上面概述的细节都可以传送到这些替代实施例中。
然而,就编码器10而言,刚刚概述的替代实施例导致编码器的不同情况:通过用信号通知不同的运动信息预测残差之一,编码器不再有歧义或“自由”使解码器对块104使用相同的运动信息。而是,一旦选择了要用于块104的运动信息,部分140内的信令就被唯一确定,至少相对于他的运动信息预测器150。改进在于如下几点:因为运动信息预测器150被阻止避免与切片独立约束发生冲突,不需要“通过相应非零运动信息预测残差152重定向此类运动信息预测器150,其信令通常在位率方面比零运动信息预测残差的信令成本更加大。此外,在为块104建立运动信息预测器的列表的情况下,填充块104的这种运动信息预测器的列表所依据的所有运动信息预测器的自动和同步执行不与切片独立约束相冲突,从而就速率失真优化而言,增加了这些可用的运动信息预测器中的任何一个都非常接近最佳运动信息的可能性,因为无论如何,编码器必须以遵守切片独立约束的方式来选择运动信息。
也就是说,虽然在当前的视频编码标准中,对最终MV执行任何MV剪裁,即如果有,在将运动向量差,添加到预测器之后,这是相对于预测和校正此完成的使用残差的预测在这里额外进行。当预测器指向图像外(潜在的带有边界扩展)时,如果它指向的离边界真的很远,则运动向量差可能不包含在它被剪裁的方向上的任何分量,至少在剪裁之后块位于图像的边界。只有当得到的运动向量指向参考图像中位于图像边界内的位置时,运动向量差异才有意义。然而,与让它被剪裁到图像边界相比,添加如此大的运动向量差来引用图像内的块可能成本太高。
因此,实施例将包括根据块位置剪裁预测器,使得从相邻块或时间候选块使用的所有MV预测器始终指向包含块的切片内部,因此为好的预测器发出信号的更多剩余的运动向量差更小,并且可以更有效地发出信号。
在图13中描绘了利用刚刚提到的运动向量预测器相关的切片独立性的执行的实施例。特别地,图13示出了上面经常提到的作为一种可能性的情况,即根据特定规则并使用特定顺序为块104建立运动信息预测器候选192的列表190的情况。这些运动信息预测器候选192之一然后由编码器为块104选择,并通过相应指示器193在句法部分140内用信号通知将被选择,指示器193指示选择的运动信息预测器候选192的位置其在列表190内的等级。列表190的建立在编码器和解码器侧以相同的方式完成,并且根据当前实施例涉及关于每个运动信息预测器候选192的切片独立性执行,通过此列表190被填满。因此,列表190中的所有运动信息预测器192不与不专有地地在块104所属的当前切片的边界内的任何分块相关联。然后在运动信息预测器候选192与运动向量相关的情况下,部分140中的进一步句法元素194指示运动信息预测残差,即运动向量差152。
图14示出了使列表190的每个运动信息预测候选192经受切片独立执行的效果:对于块104,示出了列表190内的三个运动信息预测器候选192a到192c的分块130a到130c。然而,分块130c与运动信息预测器候选192c相关联,然而,其实际上是重定向142的结果。也就是说,编码器和解码器实际上已经得出了块104的运动信息预测器候选,由虚线和192c’指示。然而,此预测器192c’会导致分块130c’不在当前切片100a的边界102内。因此,此运动信息预测器候选192c’被重定向,成为运动信息预测器候选192c。效果如下:运动信息预测器候选192c’已经成为,就大失真意义而言,最有效的运动信息预测器候选的可能性相当低,因为编码器需要将其与非零运动信息预测残差放在一起。因此,将这样的候选192c’包括到列表190中很可能只会导致列表190内候选位置的浪费。相反,可以通过指示器193选择预测器192a-c中的任何一个,并且很可能只是一个小的残差194需要将残差向量152(比较图10)和选择的预测器,诸如192c的组合传输到最终运动向量154(比较图10)的结果。
图13和14的概念自然也可以应用于当前块104的单个预测150而根本不建立列表190。
关于运动信息预测器候选列表构建/建立的替代概念是现在关于图15描述的实施例的主题。如上文关于图13已经概述的可能性,可以通过使用运动信息预测器候选填充列表190,其依次根据预先确定的规则从先前编码/解码的块中得出。例如,这些规则可以与对应的先前编码/解码块的定位方式有关。例如,它可能是当前块104左侧的空间相邻块或顶部的空间相邻块。相应运动信息预测器候选的得出然后可以只是采用在编码/解码中用于各个块的对应的运动信息,即块104的相应运动信息预测器候选可以被设置为等于用于对应的块的对应的运动信息。另一运动信息预测器候选可源自参考图像中的块。同样,这可能是候选192中的一个或另一个与之相关的参考图像。图15示出了这种运动信息预测器候选基元200。基元200形成运动信息预测器候选池,根据称为填充顺序的某种顺序204填充列表190中的条目。根据此顺序204,编码器和解码器得出基元200并在202检查它们的可用性。在204指示填充顺序。例如,可用性可以被拒绝,因为对应的基元200的对应块,即块已被用于预测编码/解码的运动信息与当前块104不在同一切片100a内。然而,根据图15的实施例,可用性检查202伴随或包括以下附加或替代检查:即检查是否对应的基元200与切片独立约束相冲突。即,不检查对应的基元200的原点的可用性,即左边的块、当前块104顶部的块或参考图像中的某个同位块,采用其用于预测性地编码/解码的运动信息来形成基元200,但检查由这样的基元200表示的运动向量预测器是否会被检查,即从用于预测性地编码/解码先前编码/解码块的运动信息得出的运动信息,基元与其相关联,并且将被采用以形成基元200,基元是否与位于当前切片100a内的分块130相关联而不超过其边界。如果不是,则对应的基元将被标记为不可用并且将步进到下一个基元。例如,图15示出了第二候选基元200将不可用并且列表190中的前两个运动信息预测器候选192因此将由顺序204中的第一和第三候选基元200形成。换句话说,上述问题的另一个解决方案是改变运动向量列表构建过程的可用性标志的得出。如果设置了constraintFlag,那么这可以通过使用目标独立编码区域(例如,当前编码的运动约束块)之外的样本的运动向量被设置为不可用的方式来完成。
例如,以下是运动向量预测器候选列表mvpListLX的构建过程。
Figure BDA0003180232900000271
可以看出,当mvLXA和mvLXB可用但指向给定MCTS之外时,可能更有希望的同位MV候选或零运动向量候选不会被输入到列表中,因为它已经满了。因此,在位流内具有constraintFlag信令是有利的,此信令控制MV候选的可用性的得出以结合关于空间片段边界,诸如切片的参考样本的可用性。
在另一个实施例中,在双向预测的上下文中的可用性得出可以允许对可用性状态进行更细粒度的描述,并且因此进一步允许用部分可用候选的混合版本来填充运动向量候选列表。
例如,如果当前块是与其双向预测的空间领域相似的双向预测的,则上述概念(可用性标记取决于切片中的参考样本位置)将导致这样一个事实,即MV0指向当前切片的外部的空间候选被标记为不可用,因此,具有MV0和MV1的整个候选不会进入候选列表。但是,MV1是切片内的有效参考。为了使此MV1可通过运动向量候选列表访问,将MV1添加到部分可用候选的临时列表中。临时列表中的部分候选的组合随后也可以被添加到最终的mv候选列表中。例如,将空间候选A的MV0与空间候选B的MV1或零运动向量或HMVP候选分量混合。
后一个提示清楚地表明,在块104是双向预测类型的情况下,图15中描绘的过程可以由稍微复杂一点的编码器和解码器执行。在这种情况下,每个候选基元200传递用于两个不同参考图像的两个运动向量。一种可能性是在运动向量之一导致切片独立冲突的情况下将这种候选基元200标记为不可用。因此,这对运动向量将按群体顺序被跳过并且不被添加到列表190中。然而,根据替代方案,切片独立性检查是单独执行假设的。也就是说,对于特定候选基元200,一个运动向量可能会导致切片独立性冲突,而另一个则不会。在那种情况下,可以将非冲突运动向量假设添加到替代运动信息预测器的特定替代列表中。在任何需要的情况下,即,在群体顺序204中没有进一步的候选基元200可用的情况下,编码器解码器然后可以从单个假设运动信息预测器和替代的列表中形成用于列表190的另一个或多个运动信息预测器候选192,诸如将它们的对或一个条目和替换列表与默认运动信息预测器,诸如零运动向量组合。
为了完成对图15的描述,请注意可以添加关于先前附图描述的剩余细节。例如,这样的细节可以涉及指示器193和残差194以及关于分块大小和最终用信号通知的用于预测块104的运动信息的实际使用的细节。
接下来描述的实施例处理起源于特定参考图像的块的运动信息预测候选。同样,此参考图像不必是从中执行实际间预测的参考图像。不过也有可能。为了区分用于MI(运动信息)预测的参考图像与包含分块130的参考图像,在下文中对前者使用撇号。
图16示出了当前图像12a中的当前间预测块104及其同位部分,即参考图像12b’内的未位移足迹104’。如果通过使用用于以以下方式确定的参考图像12b’中的块的运动信息来形成时间运动信息预测器候选(基元),则结果证明在RD性能方面具有成本效益:优选地,参考图像12b’中的块是包括参考图像12b中的预先确定的位置204’的块,即与块104具有预先确定的位置关系的当前图像12a中的某个对齐位置204同位的样本位置。具体而言,它是与块104的右下样本对角相邻但位于块104之外的样本位置。因此,在图16的示例中,位置204沿水平和垂直方向相对于块104偏移。包括位置204’的参考图像12b’的块在图16中由参考符号206指示。其运动信息用于得出或立即表示,在可用的情况下,时间运动信息预测器候选(基元)。然而,可用性可能不适用于例如位于图像或块206之外的位置204’和204不是间预测块而是例如内预测块的情况。在这种情况下,即在不可用的情况下,另一个对齐位置208用于识别参考图像12b内的源块或源块。这次,对齐位置208位于块104内部,诸如居中。参考图像中的对应位置由参考标号210指示。包括位置210的块由参考标号212指示并且此块替代地用于形成时间运动信息预测器候选(基元),即通过使用已经预测此块212的其运动信息。
为了避免在将刚刚提到的概念用于当前图像104内的每个块104时会导致的问题,应用以下替代概念。特别地,编码器和解码器检查块104是否与当前切片100a的预先确定的边相邻。此预先确定的边例如是当前切片100a的右侧边界和/或如在本示例中的此拼块100a的底边,例如,对齐位置204相对于块104水平和垂直地偏移。因此,如果块104与这些边之一邻接,则编码器和解码器跳过使用对齐位置204以便识别时间运动信息预测器候选(基元)的源块206,并且替代地仅使用对齐位置208。后一对齐位置仅“命中”位于与当前块104相同的切片100a内的参考图像12b内的块。对于不与当前切片100a的右手边或底边邻接的所有其他块,可以进行时间运动信息预测器候选(基元)得出,包括使用对齐位置204。
然而,应当注意,关于图16的实施例,许多变化是可行的。从关于图16提出的描述中的这种可能的修正涉及例如对齐位置204和208的准确位置。
换句话说,典型的最先进的视频编码规范也严重依赖于在编码过程的不同阶段在所谓的候选列表中收集运动向量预测器的概念。下面描述允许间预测约束编码的更高编码效率的MV候选列表构造的上下文中的概念。
合并候选列表可以解释如下
I=0
if(availableFlagA1)
mergeCandList[i++]=A1
if(availableFlagB1)
mergeCandList[i++]=B1
if(availableFlagB0)
mergeCandList[i++]=B0
if(availableFlagA0)
mergeCandList[i++]=A0
if(availableFlagB2)
mergeCandList[i++]=B2
if(availableFlagCol)
mergeCandList[i++]=Col
当slice_type等于B时,如果在许多视频编解码器规范中没有足够的候选,则执行组合双向预测合并MV候选的得出过程以填充候选列表。
–通过采用不同组合的一个MV候选的L0分量和另一个MV候选的L1分量来组合候选。
–如果列表中没有足够的候选,则添加零运动向量合并候选。
当考虑同位MV候选(Col)时,在间预测约束的上下文中合并列表的相关问题就出现了。如果同位块(不是右下角而是中央同位的)不可用,则在不解析参考图像中的相邻切片的情况下不可能知道是否存在Col候选。因此,合并列表在解码所有切片时可能不同,或者只有一个或多个切片以与编码期间不同的排列被解码。因此,编码器和解码器端的MV候选列表可能不匹配,并且无法安全使用来自某个索引(col索引)的候选。
上述图16的实施例避免了上述MV候选列表不匹配的问题是,对于切片中最右边的块和最下面的块,将中心同位的块作为属于当前切片的Col候选,而不是不属于当前切片的右下同位块。
替代解决方案将是根据群体顺序204改变列表构造。特别是,当使用关于图16描述的概念时,可以在列表构造中相对较早的时间使用时间运动信息预测器候选(基元),诸如第一基元200检查可用性(比较图15)。编码器和解码器端的切片边界感知将保证不会发生列表不匹配。然而,另一种可能性是将此类时间运动信息预测器候选(基元)移向列表190的末尾,并在优选地基于块206并且仅以基于块212的辅助方式确定的时间同位的候选之前将组合空间运动信息候选位移,诸如组合空间运动向量。与上述伪代码相关,这将意味着主要基于块的206MI和仅基于块的212MI作为替代确定的候选Col将在当前最先进的列表构建之后移动到完成的列表190的末尾。填充顺序的这种改变可以通过切片边界感知来完成:即,编码器和解码器将通过将Col候选移动到列表190的末尾来改变填充顺序,仅针对与当前切片的右侧或底部相邻的块104并以另一种方式为其他切片保留填充顺序,即以Col在组合空间运动信息候选之前的方式。
自然地,为了运动向量候选列表的更统一的创建,对切片内的所有块104而不是仅与特定边相邻的块执行刚才描述的填充顺序变化将是可行的。
图17示出了切片边界感知填充顺序变化。间预测块104与所讨论的当前切片的一边,即右边或底边,相邻的情况在图17的左半部分中描绘出,而图17的右手边描绘了块104的情况,在某处与当前切片100a的距离,或者更准确地说,与当前切片100a的特定边的距离。
使用200a,指示运动信息预测器候选基元,其以前述方式得出,根据所述方式优选地使用块206的运动信息,仅在例如,内编码类型的206的情况下使用块212的运动信息作为替代。底层基元200a的块也称为对齐块,其可能是206或212。示出了另一个运动信息预测器候选基元200b。此运动信息预测器候选基元200b是从空间相邻块220的运动信息中得出的,空间相邻块220在面向远离切片100a的特定边的一边,即当前块104的上边和左手边,在空间上与当前块104相邻。例如,相邻块220的运动信息的平均值或中值用于形成运动信息预测器候选基元200b。然而,在填充方向204上,这两种情况是不同的:在块104与当前切片100a的特定边之一相邻的情况下,组合的空间候选基元200b在时间上同位的候选基元200a之前,在另一种情况下,即对于不邻接当前切片100a的任何特定边的块104,顺序被改变,使得时间上同位的候选基元200a用于在等级顺序195中更早地填充列表190,其中指示器193沿着等级顺序指向列表190而不是组合空间候选基元200b。
应当注意,未针对图17具体讨论的许多细节可以从任何先前的实施例中采用,诸如关于图16的关于基元200a的实施例。也可以以不同方式获得基元200b。
图18示出了以有效方式获得切片独立编码的进一步可能性。这里,应用用于得出时间运动信息预测候选(基元)的技术,根据此技术,编码器和解码器使用另外预测的运动向量240,以便定位或识别参考图像12b中的预先确定的块242,其运动信息,即用于编码/解码块242的运动信息,然后被用于得出运动信息预测候选(基元)。例如,可以在空间上预测运动向量240。它可能源于列表190中的其他候选之一,而不是源于图18针对的基元。根据关于图18描述的实施例,编码器和解码器检查运动向量240相对于块104的位置是否指向当前切片100a之外的点。在图18的情况下,示出预测的运动向量240指向切片100a之外。因此,此运动向量240由剪裁操作244剪裁,以便从块104开始,或者更准确地说,从其预先确定的对齐位置246开始,保持在当前切片100a的边界102内,即如此以免指向切片100a之外。如此剪裁的运动向量250相对于块104指向的块248,然后用作得出时间运动信息预测候选(基元)的基础,诸如通过简单地采用已经预测的块248使用的运动信息。
图19中描绘了另一种可能性。这里,编码器和解码器首先测试第一预测运动向量240。通过这样做,他们检查此第一预测的运动向量是否指向切片100a之外。如果是,则他们使用另一个预测运动向量260来得出时间运动信息预测候选(基元),即通过采用已经预测第二预测的运动向量260指向的块262使用的运动信息。例如,在图19中,已经说明第一预测运动向量240指向当前切片100a之外,使得此运动240指向的块242位于参考图像12b中的当前切片100a之外。然而,运动向量260并不指向当前切片100a之外。如果是后者,则相应时间运动信息预测候选(基元)可以被标记为不可用。
换言之,在涉及诸如MCTS的独立编码空间段的使用场景中,需要限制上述ATMVP过程以避免MCTS之间的依赖性。
在子块合并候选列表构建中,subblockMergeCandList构造如下,其中第一候选SbCol是子块时间运动向量预测器:
i=0
if(availableFlagSbCol)
subblockMergeCandList[i++]=SbCol
if(availableFlagA&&i<MaxNumSubblockMergeCand)
subblockMergeCandList[i++]=A
if(availableFlagB&&i<MaxNumSubblockMergeCand)
subblockMergeCandList[i++]=B
if(availableFlagConst1&&i<MaxNumSubblockMergeCand)
subblockMergeCandList[i++]=Const1
if(availableFlagConst2&&i<MaxNumSubblockMergeCand)
subblockMergeCandList[i++]=Const2
if(availableFlagConst3&&i<MaxNumSubblockMergeCand)
subblockMergeCandList[i++]=Const3
if(availableFlagConst4&&i<MaxNumSubblockMergeCand)
subblockMergeCandList[i++]=Const4
if(availableFlagConst5&&i<MaxNumSubblockMergeCand)
subblockMergeCandList[i++]=Const5
if(availableFlagConst6&&i<MaxNumSubblockMergeCand)
subblockMergeCandList[i++]=Const6
确保由时间向量产生的参考帧中的相关块确实属于当前块的空间段是有利的。
同位预测块的位置被限制为如下定位:运动向量mvTemp,即用于定位参考图像中的同位子块的运动信息,被剪裁包含在同位的CTU边界内。这确保同位的预测块位于与当前预测块相同的MCTS区域中。
替代地,对于上述剪裁,当空间候选的mvTemp不指向同一空间段(切片)内的样本位置时,从当前块的MV候选列表中选择下一个可用的MV候选,直到候选被发现导致位于空间段内的参考块。
接下来描述的实施例涉及另一种有效的编码工具以降低位率或有效地编码视频。根据此概念,在块104的数据流内传递的运动信息允许解码器和编码器在块104内定义更复杂的运动场,即不仅是恒定运动场,而且是变化运动场。例如,此运动信息确定了块104的两个不同的角的运动场的两个运动向量,如图5中示例性描绘的。因此,解码器和编码器能够从运动信息得出用于块104被划分成的每个子块。图20中示例性地描绘了规律划分为4×4子块300,但是划分为子块300既不需要是规律的,也不需要将子块的数量限制为16个。被子划分为子块300可以在数据流内用信号通知或者可以默认设置。因此,每个子块产生运动向量,此运动向量指示此子块300与参考图像12b中的对应分块302之间的平移位移,相应子块300将从参考图像12b被预测。
为了避免切片独立性矛盾,根据本实施例,编码器和解码器如下操作。基于由图20中的两个运动向量306a和306b示例性表示的数据流中传递的运动信息得出子块运动向量304,由编码器和解码器以相同方式执行。得到的子块运动向量304呈现初始状态。根据第一实施例,例如,解码器使每个初始子块运动向量304经受以上关于图9描述的上面概述的切片独立性实施。因此,对于每个子块,解码器将测试相应子块运动向量304是否导致相应子块的相应分块302延伸超过当前切片100a的边界。如果是,则对应地处理相应子块运动向量304。每个子块300然后将使用其子块运动向量304来预测,此子块运动向量304又可能已经重定向。编码器以同样的方式,使得子块300的所有预测在编码器和解码器侧都是相同的。
可替代地,两个运动向量306a和306b被重定向,使得子块运动向量304中没有一个导致切片依赖性。因此,向量306a和306b的解码器侧剪裁可用于此目的。即,如上所述,解码器将运动向量对306a和306b视为运动信息,将子块3000的分块302的组合视为块104的分块,并执行组合分块不会与切片独立性相冲突。类似地,在组合的分块延伸到另一个切片的情况下,对应于运动向量对306a和306b的运动信息可以如上面教导的那样从候选列表中移除。或者由编码器执行具有残差的校正,即将对应的MV差152添加到向量306a和306b。
根据替代方案,以不同方式,诸如例如,使用内预测,预测对应分块302超过当前切片100a的切片边界的那些子块300。当然,可以在对块104的其他子块进行间预测之后执行此内预测,对于这些其他子块,相应子块运动向量304没有引起任何切片独立性冲突。此外,在执行对这些冲突子块的内预测之前,甚至在这些非冲突子块的数据流中传递的预测残差也可能已经在编码器和解码器侧用于重建这些非冲突子块的内部。
在涉及诸如MCTS的独立编码空间段的使用场景中,需要限制上述仿射运动过程以避免MCTS之间的依赖性。
当子块运动向量场的MV导致预测器的样本位置不在空间段边界内时,子块MV被单独剪裁到空间段边界内的样本位置。
附加地,当子块运动向量场的MV导致预测器的样本位置不在空间段边界内,得到的预测器样本被丢弃并且新的预测器样本来自内预测技术,例如采用在相邻的和已经解码的样本区域上得出的角预测模式。在此场景中使用的空间段的样本可能属于当前块的相邻块以及周围的子块。
甚至替代地,针对预测器的得到的位置以及预测器样本是否属于空间段检查运动向量候选。如果不是这种情况,则得到的子块运动向量更有可能没有指向空间段内的采样位置。因此,将指向空间段边界外的样本位置的运动向量候选剪裁为空间段边界内的位置是有利的。可替代地,在这种场景下禁用使用仿射运动模型的模式。
另一个概念涉及基于历史的运动信息预测候选(基元)构建。同样可以放置在上述填充顺序204的末尾,以便不导致不匹配。换句话说,将HMVP候选添加到运动向量候选列表引入了与之前描述的相同的问题,即当编码后时间上同位的MV的可用性由于解码期间切片布局的变化而改变时,解码器侧的候选列表如果设想这样的使用场景,则编码器侧不匹配并且不能使用Col之后的索引。这里的概念在精神上与上面的类似,其中在需要时将Col候选移到HMVP之后的列表末尾。
对于MV候选列表的创建,可以对切片内的所有块执行上述概念。
应当注意,取决于对当前包含在最近一次间预测块的存储运动信息的历史列表中的运动信息的检查,基于历史的运动信息预测器候选在填充顺序内的放置可以替代地的方式来完成。例如,包含在历史列表中的运动信息的一些中心趋势,诸如中值、平均值等可以被编码器和解码器用于检测对于当前块来说基于历史的运动信息预测器候选实际上会导致切片独立性冲突的可能性有多大。例如,如果根据某个平均值,包含在历史列表中的运动信息指向当前切片的中心,或者更一般地说,指向从块104的当前位置到当前切片100a的边界102足够远的位置,可以假设基于历史的运动信息预测器候选导致切片独立性冲突的可能性非常小,因此,在这种情况下,基于历史的运动信息预测器候选(基元)可以在填充顺序中比平均历史列表指向接近或甚至超过当前切片100a的边界102的情况更早地布置在填充顺序中。除了中心趋势测量之外,还可以使用包含在历史列表中的运动信息的分散测量。离散度越大,诸如变体等,基于历史的运动信息预测器候选引起切片独立性冲突的可能性就越高,并且应该将其进一步置于更靠近候选列表190的末尾。
图21示出了改进运动信息预测器候选列表190的填充的概念,其中运动信息预测器候选从运动信息历史列表502中选择500个,运动信息历史列表502缓冲最近使用的运动信息的集合,即,大多数最近编码/解码的间预测块的运动信息。即,列表502的条目504中的每一个存储已经用于最近编码/解码的间预测块之一的运动信息。历史列表502中的缓冲可以由编码器和解码器以先进先出的方式执行。保持更新历史列表502的内容或条目存在不同的可能性。由于相对于图21概述的概念在使用基于切片的独立编码的情况下以及在不使用基于切片的独立编码的情况下都是有用的,编码器和解码器可以限制间预测块的聚集区域并且其中用于填充历史列表502的条目504的运动信息可以被限制为单个切片100,即在检查当前编码块104时的当前切片100a,或者在不使用基于切片的独立编码的情况下可以是整个图像。进一步,关于图21描述的概念不一定在具有上述方面的概念中使用,根据此方面,基于历史的运动信息预测器候选在运动信息预测器候选列表190内朝向末尾移动,至少在空间候选后面,诸如组合空间候选。相反,以下关于图21概述的概念仅假设存在运动信息预测器候选192,在从历史列表502中选择500基于历史的运动信息预测器候选时已经使用此运动信息预测器候选192填充运动信息预测器候选列表190。作为最后的注意,即使在图21的情况下使用基于切片的独立编码,那么图21的概念如上所述可以与或不可以与任何概念组合,其中解码器对块104的最终用信号通知的运动信息或输入到列表190中的运动信息预测器候选执行切片独立执行。在图21的以下描述中,假设基于切片的独立编码适用,但解码器不执行关于运动信息预测器候选192的切片独立性执行。
如图21中所示,在编码/解码间预测块104时,编码器和解码器建立运动信息预测器候选列表190。图21示例性地假设运动信息预测器候选列表190已经被由两个运动信息预测器候选192填充,在图21中表示为A和B。“两个”自然只是一个示例。特别地,应当记住,在通过另一个基于历史的预测器候选为列表190的填充选择500个基于历史的候选时,已经为块104填充了列表190的候选192的数量取决于关于在其他参考图像中的一些同位位置和其周围空间上的间预测块的可用性。然而,图21示例性地示出了在选择500历史列表502的基于历史的候选时已经存在于列表190中的两个候选192的事实并不意味着图21的概念仅限于以下情况:至少有两个候选基元按填充顺序在基于历史的候选基元之前,也不会出现在为列表190选择500个基于历史的候选时在列表190中已经存在少于两个候选192的情况。
图21描绘了在得出基于历史的运动信息预测器候选基元时的情况,即使用候选列表190中的下一个自由条目506的选择500基于历史的运动信息预测器候选将被填充。特别地,图21示出了由迄今为止填充列表190的候选192定义的运动信息A和B,以及历史列表502的条目504中的运动信息,在图21中用圈1到圈5以运动向量的形式表示。为了便于理解图21的概念,所有运动向量A、B和1-5被示例性地指示为参考相同的参考图像12b,但是本领域技术人员应该清楚这不是必然是这种情况,并且每个候选192和条目504的运动信息实际上可以包括索引对应的运动信息所涉及的参考图像的参考图像索引,并且此索引可以分别在候选190和条目504之间变化。
编码器和解码器不是简单地选择历史列表502中最近输入的运动信息,而是使用在执行选择500时已经存在于列表190中的运动信息预测器候选192。在图21的情况下,这些是运动信息预测器候选A和B。特别地,为了执行选择500,编码器和解码器确定历史列表502中的每个条目504的相异性,相对于在选择500之前已经使用列表190填充的运动信息预测器候选192。所述相异性可以例如一方面取决于历史列表502中的对应的运动信息504与另一方面取决于列表190中的运动信息预测器候选192之间的运动向量差。在列表190中存在多于一个候选192的情况下,一方面列表502中的对应的运动信息504和另一方面列表190中的候选192的距离的最小值可以例如是用于确定所述相异性。通过使用双头箭头,在图21中示例性地示出了关于列表502中的运动信息1的差。然而,所述相异性还可能取决于参考图像索引的差。关于如何在执行选择500中使用所述相异性存在不同的可能性。一般来说,目的是以使得从列表502中选择的运动信息504与运动信息预测器候选192完全不同的方式来执行选择500,使用运动信息预测器候选192到目前为止,已填充了列表190。因此,以这样的方式设计依赖性使得对于历史列表502中的特定运动信息504被选择的可能性越高,其与列表190中已经存在的运动信息预测器候选192的相异性就越高。例如,选择500可以以这样的方式来完成,使得选择取决于所述相异性以及在对应的运动信息504的对应的运动信息504已经被输入到历史列表502中的等级。例如,图21中的箭头508将指示将运动信息504输入到列表502中的顺序,即列表502顶部的条目比其底部的条目输入的时间更近。根据特定实施例,例如,编码器和解码器从历史列表502中排除运动信息条目504,其运动信息小于预先确定的阈值,与列表190目前为止使用的运动信息预测器候选192相异。为此,编码器和解码器可以根据例如运动向量差和/或参考图像索引差来使用上述示例用于距离测量,并且针对特定预先确定的阈值参数对所得相异性进行阈值处理。此过程的结果是从列表502中排除特定运动信息条目504,从而仅保留运动信息条目的子集,然后可以通过使用最近输入的运动信息条目来完成选择500以形成将在位置506处输入到列表190中的运动信息预测器候选。在列表190按等级顺序具有另一个必须使用历史列表502填充的候选位置的情况下,可以重复此过程。在这种情况下,可能是降低前述阈值参数导致更不严格地排除列表502中的运动信息条目。也就是说,允许更相似的运动信息导致进入列表502之外的运动信息条目的子集中,然后其中选择列表190的下一个运动信息预测器候选作为最近进入历史列表502的那个。自然地,以取决于运动信息预测器候选192上的列表502中的运动信息条目504的相异性的方式来执行选择500的其他可能性存在,到目前为止已经使用运动信息预测器候选192填充候选列表190。
实际上,图21的概念导致进入预测块104的运动信息预测器候选列表190收集运动信息预测器候选192,由于它们增加的相互的相异性,就大失真优化而言,增加了编码器找到此列表190之外的最佳候选的可能性。然后编码器可以通过相应指示器193连同特定预测残差194,用信号通知从列表190中针对数据流14中的块104选出的候选。
自然地,上述可能性不限于从历史列表502中选择的基于历史的运动信息预测器候选。相反,此过程还可以用于从另一个可能运动信息预测器候选库中进行选择。例如,可以以关于图21描述的方式从更大的运动信息预测器候选集合中选择运动信息预测器候选的子集。
换句话说,最先进的技术是仅在现有列表候选中没有一个在水平和垂直分量和参考索引中与可能要添加的HMVP候选匹配的标准上添加可用HMVP候选的过程。为了提高添加到诸如合并候选列表或子块运动向量候选列表的运动向量候选列表的HMVP候选的质量,每个HMVP候选的列表插入基于自调适阈值。例如,假设运动向量候选列表已经被空间领域A填充并且进一步的候选B和Col不可用,对于下一个未占用的列表条目并且在添加第一个合格的HMVP候选之前,合格的HMVP候选和现有的列表条目(给定示例中的A)之间的差被测量。只有当阈值被满足,相应HMVP候选被添加,否则,下一个合格的HMVP被测试等等。上述差的测量可以结合MV水平和垂直分量以及参考索引。在一个实施例中,阈值适用于每个HMVP候选,例如阈值降低了。
最后,图22涉及编解码器使用双向光流工具来改进运动补偿双向预测的情况。图22示出了双向预测的编码块104。在块104的数据流中用信号通知两个运动向量1541和1542,一个与参考图像12b1相关,另一个与参考图像12b2相关。参考图像12b1和12b2’内的块104的足迹当根据相应运动向量1541和1542位移时,分别在图22中的1601和1601处指示。BIO工具确定局部跨块104区域的亮度梯度方向,以便组合从参考图像12b1和12b2中的相应分块1301和1302得出的两个假设。使用这些亮度梯度方向,BIO工具以跨块104变化的方式改变分别从两个参考图像12b1和12b2预测块104的方式。BIO工具导致分块1301和1302相对块的104大小加宽,不仅在相应运动向量1541或1542是子像素运动向量和/或需要内插滤波器的情况下,而且在是全像素向量的情况下。在这两种情况下,通过n样本宽扩展,进行的附加地加宽会加宽分块,n是n>0的整数,诸如1。这是BIO工具行为的结果:为了能够确定局部亮度梯度,BIO工具从分块1301和1302中的每一个得出各自的假设块4021和4022,其相对于块104的大小拓宽了刚刚提到的n样本宽扩展边缘部分,由图22中的参考符号432表示。为了生成加宽的假设块4021和4022,分块1301和1302的扩展边缘部分1721和1722至少容纳,与块104的宽度相比,对应的n样本加宽434,并且如果相应运动向量1541和1542是子像素运动向量,则另外加宽436对应于内插滤波器的内核范围的宽度。因此,n是与双向光流工具相关联的准样本宽度或扩展。在图22中,示例性地假设运动向量1542是子像素向量,使得BIO工具通过内插4352从分块1302得出假设块4022,而在运动向量1541是全像素运动向量BIO工具的情况下可以仅通过样本复制4351来得出块4021。BIO工具然后确定跨假设块4021和4022的局部亮度梯度,以便分别使用块4021和块4022中确定的梯度,以便组合两个假设,即从参考图像12b1获得的假设预测器4021以及从参考图像12b2获得的预测器4022,在块104的区域1601和1602内通过线性组合436以取决于局部梯度在块的区域上变化的方式获得块104的最终双向预测预测器438。特别地,对于块104的每个样本442,将块4021和4022中的对应的样本4401和4402相加,由各自的假设权重加权,诸如各自的1/2,或者由其他权重加权,这些权重的总和可以可选地求和直到产生一个,然后添加一个常数,此常数取决于为块4021和4022中的对应的样本4401和4402确定的亮度梯度,以得出对应的示例442。这是由编码器和解码器完成的,它们都具有BIO工具。
可能是,就加宽436而言,即,就由于插值引起的加宽而言,编码器注意分块1301和1302中的任何一个都不跨越边界102,无论是否具有上述解码器对用于将运动向量1541和1542编码到数据流中的运动向量预测器进行切片独立性约束执行,或者,可替代地,解码器对最终运动向量1541和1542本身执行切片独立性约束执行。然而,分块1301和1302的扩展超过边界102,小于或等于与双向光流工具相关联的样本宽度n仍然是可能的。然而,编码器和解码器都检查附加的n样本宽扩展434是否导致分块1031和1302中的任何一个仍然跨越边界102。如果是这种情况,则视频编码器和视频解码器停用BIO工具。否则,BIO工具不会停用。因此,不需要数据流中的信令来控制BIO工具。在图22中,示出了分块1302跨越当前切片100a的边界102朝向相邻切片100b。因此,这里将停用BIO工具,因为解码器和编码器认识到分块1302跨越边界102。正如一边,回忆起,如上文关于图11所述,解码器还可以考虑对于n样本加宽434,在剪裁运动向量154时,将不需要停用切片边界感知BIO工具。
例如,在停用BIO的情况下,每个样本442Sample(x,y)被得出为假设块4021和4022的对应的样本4401和4402的简单加权和,predSamplesL0[x][y]和predSamplesL1[x][y]:
Sample(x,y)=round(0.5*predSamplesL0[x][y]+0.5*predSamplesL1[x][y])
对于当前预测块的所有(x,y)。
随着BIO工具被激活,这将更改为
Sample(x,y)=round(0.5*predSamplesL0[x][y]+0.5*predSamplesL1[x][y]+bioEnh(x,y))
对于当前预测块104的所有(x,y)
bioEnh(x,y)是使用两个参考4021和4022中的每一个的每个对应参考样本4401和4402的梯度计算的偏移。
可替代地,解码器使用边界填充来填充足迹402和402’的周围432,通过这些边界填充,将其扩展到分块430和430’,分块430和430’扩展到边界102之外进入相邻的切片。
换言之,在涉及独立编码的空间段诸如MCTS的使用场景中,需要限制上述BIO过程以避免MCTS之间的依赖性。
作为刚刚描述的实施例的一部分,其中初始未精炼的参考块位于对应的图像中空间段的边界位置处的情况,以便将空间段外的样本涉及到所需的梯度计算过程中,BIO已停用。
可替代地,在这种情况下,空间段的外部通过边界填充程序进行扩展,诸如在空间段边界处重复或镜像样本值或更高级的填充模式。这种填充将允许在不使用相邻空间段的样本的情况下执行梯度计算。
将针对上述实施例和概念做出以下最后说明。如在各种实施例和概念的整个描述中多次指出的,可以在特定视频编解码器中单独地或同时地使用和实现相同的内容。进一步,在许多图中,其中描述的运动信息已被说明为包含运动向量,这一事实应仅被解释为一种可能性,不应限制没有具体利用运动信息包含运动向量这一事实的实施例。例如,关于图8解释的解码器侧的切片边界依赖运动信息得出不限于基于运动向量的运动信息。关于图9,应该注意的是,解码器的切片独立约束执行对其中描述的运动信息的应用既不限于基于运动向量的运动信息类型,也不限于运动信息的预测编码,图10中已示出。通过对图11的反馈,已经给出了可能导致分块大于间预测块的足迹的示例。然而,关于各种附图描述的本申请的实施例也可以涉及其中例如不发生这种放大的编解码器,除了那些具体涉及从情况的实施例。例如,图12a和12b的实施例专有地提到了这种情况。关于图13,已经提出了将切片独立约束执行应用于运动信息预测或运动信息预测器的概念。然而,应当注意的是,尽管图13说明了关于运动信息预测器候选列表的使用/建立的这个概念,但是这个概念也可以应用于不为间针对间预测块建立运动信息预测器候选列表的编解码器。即,可以以使用切片独立约束执行的方式为块104简单地得出一个运动信息预测/预测器。然而,就目前而言,图13和14表示可以修正为仅指一个运动信息预测器的实施例。进一步,上面已经注意到,关于先前的图描述的关于执行的所有细节,即特别是图11、12a和12b中,可用于在更多细节中指定和实施图13和14的实施例。关于图15,已经提出了实施例/概念,根据实施例/概念,运动信息预测器候选的可用性取决于其是否导致切片独立约束冲突。应当注意,此概念可能与图13和图14的实施例混淆,在于,例如,特点运动信息预测器候选(基元)是使用切片独立约束执行确定的,并且某些运动信息预测器候选(基元)取决于对应的候选是否导致切片独立约束冲突而进行可用性得出。进一步,例如,图15的实施例可以与如之前关于图9描述的在解码器侧应用切片独立约束执行相组合。在参考或利用运动信息预测器候选列表的所有实施例中,可以使用图16的概念,根据此概念以取决于当前块是否与当前切片的特定边相邻的方式进行时间运动信息预测器候选的确定,并且根据当前块是否与相对于此时间运动信息预测器候选的当前切片的特定边相邻来改变填充顺序。图17提供了详细信息。再次,图16和17可以组合对最终状态运动信息和/或预测器以及根据图12和14的可用性控制应用解码器侧切片独立约束执行。后一个陈述也是正确的,根据图18得出时间运动信息预测器候选的概念。此概念可以与所有提到的概念组合,因为可以与图16和17的概念组合,并且甚至一方面与图16和17的概念组合以及另一方面图18是可行的。由于图19表示图18的替代图,因此关于图18所做的陈述也涉及图19。特别地,如果对于块仅确定一个运动信息预测器,即没有建立候选列表,也可以使用图18和图19。关于图20,应当注意,作为此概念基础的模式,即仿射运动模型模式,除了描述的模式之外,还可以表示视频编解码器的一种模式,例如,关于这里描述的所有其他实施例,或者可以代表视频编解码器的唯一间预测模式。换言之,由向量306a和306b表示的运动信息可以是输入到关于任何其他实施例提到的候选列表中的信息,或者表示块104的唯一预测器。用于增加关于图21表现的包含在候选列表中的运动信息的可变性的可变性增加概念如上所述,可以与任何其他实施例组合,并且特别地,不限于基于历史的运动信息预测器候选。鉴于关于图21描述的生物工具实施例,关于图20的仿射运动模型实施例的类似陈述是真实的。关于本文描述的所有实施例,注意,如关于图21指示的,如果为块104得出了多于一个的运动信息预测器候选,则相同的不一定指代相同的参考图像12b,这不仅对于图22中概述的B-预测块来说是真实的。进一步,以上描述主要集中在相邻切片100a和100b之间的边界,即引导通过图像的边界。然而,应当注意,上面概述的细节也可以传送到与图像边界一致的切片边界上,即与图像圆周相邻的切片的边界。即使对于这些边界,例如可以建立前述解码器侧切片独立约束执行,或者可以应用可用性约束等等。并且更进一步,在所有以上呈现的实施例中,视频编解码器可能在数据流中包含指示是否使用切片独立约束的分类来对视频进行编码的标志。即,视频编解码器可向解码器发信号通知解码器是否应应用特定约束以及编码器是否已应用编码器侧约束监视。
尽管已经在装置的上下文中描述了一些方面,但很明显,这些方面也代表了对应的方法的描述,其中块或设备对应于方法步骤或方法步骤的特征。类似地,在方法步骤的上下文中描述的方面也表示对应的装置的对应的块或项目或特征的描述。一些或所有方法步骤可以通过(或使用)硬件装置来执行,例如微处理器、可编程计算机或电子电路。在一些实施例中,一个或多个最重要的方法步骤可以由这样的装置执行。
本发明的编码的视频信号或数据流可以分别存储在数字存储介质上或者可以在诸如无线传输介质或诸如因特网的有线传输介质的传输介质上传输。
取决于特定实施要求,本发明的实施例可以以硬件或软件来实施。此实施可以使用数字存储介质来执行,例如软盘、DVD、蓝光、CD、ROM、PROM、EPROM、EEPROM或闪存,具有存储在其上的电子可读控制信号,它们与可编程计算机系统协作(或能够协作)从而执行相应方法。因此,数字存储介质可以是计算机可读的。
根据本发明的一些实施例包括具有电子可读控制信号的数据载体,此控制信号能够与可编程计算机系统协作,从而执行本文所述的方法之一。
通常,本发明的实施例可以实现为具有程序代码的计算机程序产品,当计算机程序产品在计算机上运行时,此程序代码可操作用于执行方法之一。程序代码可以例如存储在机器可读载体上。
其他实施例包括存储在机器可读载体上的用于执行本文描述的方法之一的计算机程序。
换句话说,本发明方法的实施例因此是具有程序代码的计算机程序,当此计算机程序在计算机上运行时,此程序代码用于执行本文描述的方法之一。
因此,本发明方法的进一步实施例是数据载体(或数字存储介质,或计算机可读介质),其上记录有用于执行本文描述的方法之一的计算机程序。数据载体、数字存储介质或记录介质通常是有形的和/或非过渡性的。
因此,本发明方法的进一步实施例是数据流或信号序列,其表示用于执行本文描述的方法之一的计算机程序。数据流或信号序列可以例如被配置为经由数据通信连接、例如经由因特网来传送。
进一步实施例包括处理装置,例如计算机或可编程逻辑器件,其被配置为或适于执行本文描述的方法之一。
进一步实施例包括其上安装有用于执行本文描述的方法之一的计算机程序的计算机。
根据本发明的进一步实施例包括被配置为向接收器传送(例如,电子地或光学地)用于执行本文描述的方法之一的计算机程序的装置或系统。例如,接收器可以是计算机、移动设备、存储设备等。例如,装置或系统可以包括用于将计算机程序传送到接收器的文件服务器。
在一些实施例中,可编程逻辑器件(例如现场可编程门阵列)可用于执行本文描述的方法的一些或全部功能。在一些实施例中,现场可编程门阵列可与微处理器协作以执行本文描述的方法之一。通常,这些方法优选地由任何硬件装置执行。
本文描述的装置可以使用硬件装置实现,也可以使用计算机实现,也可以使用硬件装置和计算机的组合实现。
本文描述的装置或本文描述的装置的任何组件可以至少部分地以硬件和/或软件来实现。
本文描述的方法可以使用硬件装置、或者使用计算机、或者使用硬件装置和计算机的组合来执行。
本文描述的方法或本文描述的装置的任何组件可以至少部分地由硬件和/或软件来执行。
上述实施例仅用于说明本发明的原理。应当理解,对本领域技术人员而言,本文描述的布置和细节的修正和变化将是显而易见的。因此,其意图是仅受即将提交的专利权利要求的范围限制,而不是受通过对本文实施例的描述和解释的方式表现的具体细节的限制。

Claims (153)

1.一种支持运动补偿预测的基于块的视频解码器,被配置为
根据视频(11)被空间划分成的切片(100)之间的边界(102)的位置,从视频(11)被编码成的数据流(14)得出用于所述视频(11)的当前图像(12a)的预先确定的间预测块(104)的运动信息,所述运动信息定位所述参考图像(12b)中的分块(130),将要从所述分块(130)预测所述预先确定的间预测块(104),以及
使用所述运动信息,从所述参考图像(12b)的所述分块(130)预测所述预先确定的间预测块(104)。
2.根据权利要求1所述的基于块的视频解码器,被配置为
检查所述数据流中的所述运动信息的信号通知状态是否导致分块(130b)不在组成所述预先确定的间预测块(104)的切片(100a)的边界(102)内,并且,如果在所述边界(102)内,将所述运动信息从所述信号通知状态重定向(142)到重定向状态,使得分块(130b’)位于组成所述预先确定的间预测块(104)的所述切片(100a)的边界(102)内。
3.根据权利要求1或2所述的基于块的视频解码器,被配置为
预测用于所述预先确定的间预测块(104)的运动信息,以获得运动信息预测(150),以及
从所述数据流(14)中解码运动信息预测残差(152),
基于所述运动信息预测(150)和运动信息预测残差(152)并遵守使得分块不超过组成所述预先确定的间预测块(104)的切片(100a)的边界(102)的对于所述运动信息的约束,确定用于所述预先确定的间预测块(104)的运动信息。
4.根据权利要求3所述的基于块的视频解码器,被配置为
通过在基于所述运动信息预测(150)和运动信息预测残差(152)确定用于所述预先确定的间预测块的运动信息时使用从所述运动信息预测(150)和所述运动信息预测残差(152)到所述运动信息的不可逆映射,遵守使得所述分块(130)不超过组成所述预先确定的间预测块(104)的所述切片(100a)的边界(102)的对于所述运动信息的约束,所述不可逆映射将所述运动信息预测(150)和所述运动信息预测残差(152)的所有可能组合专有地映射到相应的可能运动信息上,使得如果使用所述相应的可能运动信息定位所述分块(130),所述分块(130)不会超过组成所述预先确定的间预测块(104)的切片(100a)的边界(102),并且所述不可逆映射将所述运动信息预测(150)和运动信息预测残差(152)的在所述运动信息预测上相等而在所述运动信息预测残差上不同的多于一个的可能组合映射到一个可能运动信息上。
5.根据权利要求3或4所述的基于块的视频解码器,被配置为
通过借助于在分块(130)的相应部分内的样本(164)的数学组合对所述预先确定的间预测块的样本(162)的每一个进行预测,和/或通过从针对所述预先确定的间预测块(104)的两个不同的角定义的运动信息得出两个运动向量(306a、306b)并针对所述预先确定的间预测块(104)被划分为的子块(104)的每一个计算对所述参考图像(12b)内的相应子块分块进行定位的子块的运动向量(304),使用所述运动信息预测所述预先确定的间预测块(104),其中所有子块的子块分块形成所述预先确定的间预测块的所述分块,以及
使得对于所述运动信息的约束被选择为使得用于所述预先确定的间预测块的所有样本(162)的部分的所有样本位于组成所述预先确定的间预测块的所述切片(100a)的边界内。
6.根据权利要求3所述的基于块的视频解码器,被配置为
通过以以下方式预测所述预先确定的间预测块的样本(162)的每一个,使用所述运动信息预测所述预先确定的间预测块(104)
如果所述运动信息落在所述运动信息的值域的第一子集内,借助于所述分块的相应部分内的样本的加权和(164),使得与所述预先确定的间预测块相比,通过扩展边缘部分(172)使所述分块加宽,
如果所述运动信息落在所述运动信息的值域的第二子集内,通过将所述样本(162)的所述每一个设置为等于所述分块的一个对应的样本(164),使得所述分块与所述预先确定的间预测块(104)一样宽,以及
使得对于所述运动信息的约束被选择为使得所述分块的所有样本(162)位于组成所述预先确定的间预测块的所述切片(100a)的边界内,并且如果所述运动信息落入所述运动信息的值域的所述第二子集内,所述约束允许所述分块更靠近于组成所述预先确定的间预测块的所述切片的边界超过所述扩展边缘部分(172)的宽度(170)。
7.根据权利要求3所述的基于块的视频解码器,被配置为
通过以以下方式预测所述预先确定的间预测块的样本(162)的每一个,使用所述运动信息预测所述预先确定的间预测块(104)
如果所述运动信息落在所述运动信息的值域的第一子集内,借助于所述分块的相应部分内的样本的加权和,使得与所述预先确定的间预测块相比,通过扩展边缘部分使所述分块被加宽,
如果所述运动信息落在所述运动信息的值域的第二子集内,通过将所述样本(162)的所述每一个设置为等于所述分块的一个对应的样本,使得所述分块与所述预先确定的间预测块一样宽,以及
使得对于所述运动信息的约束被选择为使得
如果运动信息落入运动信息的值域的第一子集内,所述分块(130)的所有样本(164)位于组成所述预先确定的间预测块的切片(100a)的边界内,
如果所述运动信息落入运动信息的值域的第一子集内,所述分块(130)的所有样本(164)与组成所述预先确定的间预测块的切片的边界相距至少容纳所述扩展边缘部分(172)的距离(171)。
8.根据权利要求1或2所述的基于块的视频解码器,其中所述运动信息包括指示所述分块与所述预先确定的间预测块之间的平移位移的运动向量(154),并且所述基于块的视频解码器被配置为
预测用于所述预先确定的间预测块的运动向量以获得运动向量预测(150),以及
从所述数据流中解码运动向量预测残差(152),
基于所述运动向量预测和运动向量预测残差、并遵守使得分块不超过组成所述预先确定的间预测块的切片(100a)的边界(102)的对于所述运动向量的约束,确定用于所述预先确定的间预测块的运动向量(154)。
9.根据权利要求8所述的基于块的视频解码器,被配置为
通过在基于所述运动向量预测和运动向量预测残差确定用于所述预先确定的间预测块的运动向量时使用从所述运动向量预测和所述运动向量预测残差到所述运动向量的不可逆映射,遵守使得分块不超过组成所述预先确定的间预测块的切片的边界的对于所述运动向量(154)的约束,所述不可逆映射将所述运动向量预测和所述运动向量预测残差的所有可能组合专有地映射到相应的可能运动向量上,使得如果使用相应的可能运动向量定位所述分块(130),所述分块不会超过组成所述预先确定的间预测块的切片(100a)的边界,并且所述不可逆映射将所述运动向量预测和所述运动向量预测残差的在运动向量预测上相等而在运动向量预测残差上不同的多于一个的可能组合,映射到一个可能运动向量上。
10.根据权利要求1或2所述的基于块的视频解码器,其中所述运动信息包括指示所述分块与所述预先确定的间预测块之间的平移位移的运动向量,并且所述基于块的视频解码器被配置为
预测所述预先确定的间预测块的运动向量以获得运动向量预测,以及
从数据流中解码运动向量预测残差,
基于所述运动向量预测和所述运动向量预测残差确定用于所述预先确定的间预测块的运动向量,
通过以以下方式预测所述预先确定的间预测块的样本(162),使用所述运动向量预测所述预先确定的间预测块
如果所述运动向量具有非零的子像素部分,借助于所述分块与滤波器内核的卷积,使得与所述预先确定的间预测块相比,所述分块由于所述滤波器内核的宽度而被加宽,以及
如果所述运动向量具有为零的子像素部分,通过将所述预先确定的间预测块的每个样本设置为所述分块的一个对应的样本(164),使得所述分块与所述预先确定的间预测块一样宽,以及
基于所述运动向量预测和运动向量预测残差执行用于所述预先确定的间预测块的运动向量的确定,使得所述分块的所有样本位于组成所述预先确定的间预测块的切片的边界内。
11.根据权利要求10所述的基于块的视频解码器,被配置为
通过以下方式,基于所述运动向量预测和运动向量预测残差执行用于所述预先确定的间预测块的运动向量的确定
基于所述运动向量预测和运动向量预测残差计算用于所述预先确定的间预测块的运动向量的初始版本,
根据所述运动向量的初始版本,检查相对于所述预先确定的间预测块发生位移的所述预先确定的间预测块的足迹(160)与组成所述预先确定的间预测块的切片的边界相距的距离(171)是否低于与预先确定的间预测块相比所述分块由于所述滤波器内核的宽度而被加宽的拓宽范围(170),以及
如果所述足迹的距离低于所述拓宽范围,将所述运动向量的初始版本的子像素部分设置为零,以获得所述运动向量。
12.根据权利要求11所述的基于块的视频解码器,被配置为
如果所述足迹(160)的距离(171)不低于所述拓宽范围,不修改所述运动向量的初始版本的子像素部分,以获得运动向量。
13.根据权利要求11或12所述的基于块的视频解码器,被配置为
当将所述运动向量的初始版本的子像素部分设置为零时,以使得所述子像素部分的置零以及全像素部分的调适导致所述运动向量的初始版本四舍五入到最接近的全像素运动向量的方式,对所述运动向量的初始版本的完全部分进行调适以获得运动向量,导致所述分块的所有样本位于组成所述预先确定的间预测块的切片的边界内、并且在所述子像素部分的置零以及全像素部分的调适之前最接近于所述运动向量的初始版本。
14.根据权利要求11或12所述的基于块的视频解码器,被配置为
在将所述运动向量的初始版本的子像素部分设置为零时,以使得所述子像素部分的置零以及全像素部分的调适导致所述运动向量的初始版本四舍五入到最接近的全像素运动向量的方式,对所述运动向量的初始版本的完全部分进行剪裁以获得运动向量,导致所述分块的所有样本位于组成所述预先确定的间预测块的切片的边界内、并且子像素部分的置零以及全像素部分的剪裁之前最接近于且小于所述运动向量的初始版本。
15.根据权利要求1至14所述的基于块的视频解码器,被配置为
检查如果按原样使用,所述运动信息的经预测状态(192c’)是否会导致所述分块不在组成所述预先确定的间预测块(104)的分块(100a)的边界(102)内,并且如果不会导致,使用所述经预测状态作为用于预先确定的间预测块的运动信息预测候选(192),以及如果会导致,将所述运动信息从所述经预测状态(192c’)重定向(142)到导致所述分块在组成所述预先确定的间预测块的分块的边界内的重定向状态(192c),以获得所述运动信息预测候选(192),
从所述数据流中解码运动信息预测残差,
基于所述运动信息预测候选和所述运动信息预测残差确定用于所述预先确定的间预测块的运动信息。
16.根据权利要求1至14中任一项所述的基于块的视频解码器,被配置为
通过预测,得出用于预先确定的间预测块(104)的运动信息预测候选(192c),其遵守对于所述运动信息预测候选(192c)的约束,使得如果所述运动信息被设置为等于所述运动信息预测候选(192c),所述分块将不会超过组成所述预先确定的间预测块的切片的边界,以及
从所述数据流中解码运动信息预测残差(152),
基于所述运动信息预测候选和所述运动信息预测残差确定用于所述预先确定的间预测块的运动信息。
17.根据权利要求16所述的基于块的解码器,被配置为
遵守对运动信息预测候选(192c)的约束,使得如果运动信息被设置为等于运动信息预测候选,则分块将不会超过组成所述预先确定的间预测块的切片的边界,通过在得出运动信息预测候选(192c)时,使用不可逆映射将初始运动信息预测候选(192c’)映射到运动信息预测候选(192c)上,运动信息预测候选(192c)专有地映射到对应的映射运动信息候选上,因此即,如果使用对应的映射的运动信息候选定位分块,则分块将不会超过组成所述预先确定的间预测块的切片的边界,这将初始运动信息预测候选的不同设置映射到一个可能的对应的映射运动信息候选的设置。
18.根据权利要求16或17所述的基于块的视频解码器,被配置为
通过预测,建立包括运动信息预测候选(192)的用于预先确定的间预测块(104)运动信息预测候选列表(190)。
19.根据权利要求18所述的基于块的视频解码器,被配置为
通过预测得出运动信息预测候选列表(190)的每个运动信息预测候选(192),其中对于相应运动信息预测候选遵守对运动信息预测候选的约束,使得如果运动信息被设置为等于相应运动信息预测候选,则分块将不会超过组成所述预先确定的间预测块的切片的边界。
20.根据权利要求18或19所述的基于块的视频解码器,被配置为
为所述预先确定的间预测块得出指向运动信息预测候选列表(190)的指示器(193),以获得不可逆映射,基于所述不可逆映射确定用于预测所述预先确定的间预测块的运动信息。
21.根据权利要求16至20中任一项所述的基于块的视频解码器,被配置为
为了使用运动信息预测预先确定的间预测块,借助于分块的相应部分内的样本的数学组合和/或通过从为预先确定的间预测块(104)的两个不同的角定义的运动信息得出的两个运动向量(306a,306b)来预测预先确定的间预测块的每个样本,并为预先确定的间预测块(104)被划分成的每个子块计算,子块的运动向量(304)定位参考图像(12b)内的相应子块分块,其中所有子块的子块分块形成预先确定的间预测块的分块,以及
从而选择对运动信息预测候选(192c)的约束,使得如果运动信息被设置为等于运动信息预测候选,则针对预先确定的间预测块的所有样本的分块部分的所有样本将位于组成所述预先确定的间预测块的切片的边界内。
22.根据权利要求16至20中任一项所述的基于块的视频解码器,被配置为
通过以以下方式预测预先确定的间预测块的每个样本,使用所述运动信息来预测预先确定的间预测块
如果运动信息落在运动信息的值域的第一子集内,借助于在分块的相应部分内样本的加权和,使得分块与预先确定的间预测块相比被扩展边缘部分加宽,
如果运动信息落入运动信息的值域的第二子集中,通过将所述预先确定的间预测块的每个样本设置为等于分块的一个对应样本,使得分块与预先确定的间预测块一样宽,以及
使得选择对运动信息预测候选的约束,以便如果运动信息被设置为等于运动信息预测候选,则分块的所有样本将位于组成所述预先确定的间预测块的切片的边界内,并且如果运动信息落入运动信息的值域的第二子集内,则约束允许分块比拓展边缘部分的宽度更接近组成所述预先确定的间预测块的切片的边界。
23.根据权利要求16至20中任一项所述的基于块的视频解码器,被配置为
通过以以下方式预测预先确定的间预测块的每个样本,使用运动信息来预测预先确定的间预测块
如果运动信息落在运动信息的值域的第一子集内,借助于在分块的相应部分内样本的加权和,使得分块与预先确定的间预测块相比被扩展边缘部分加宽,
如果运动信息落入运动信息的值域的第二子集中,通过将所述预先确定的间预测块的每个样本设置为等于分块的一个对应样本,使得分块与预先确定的间预测块一样宽,以及
使得选择对运动信息预测候选的约束,如果运动信息被设置为等于运动信息预测候选,
如果运动信息落在运动信息的值域的第一子集内,则分块的所有样本将位于组成所述预先确定的间预测块的切片的边界内,
如果运动信息落在运动信息的值域的第一子集内,则块的所有样本将与组成所述预先确定的间预测块的切片的边界相距至少一个容纳扩展边缘部分的距离。
24.根据权利要求16至20中任一项所述的基于块的视频解码器,其中所述运动信息包括指示所述分块与所述预先确定的间预测块之间的平移位移的运动向量,并且所述基于块的视频解码器被配置为
通过以以下方式预测预先确定的间预测块的样本,使用运动向量来预测预先确定的间预测块
如果所述运动向量具有非零的子像素部分,借助于所述分块与滤波器内核的卷积,使得与所述预先确定的间预测块相比,所述分块由于所述滤波器内核的宽度而被加宽,以及
如果运动向量具有为零的子像素部分,通过将所述样本设置为分块的一个对应样本,使得分块与预先确定的间预测块一样宽,以及
执行用于预先确定的间预测块的运动向量预测候选的得出,使得如果运动向量被设置为等于运动向量预测候选,块的所有样本将位于组成所述预先确定的间预测块的切片的边界内。
25.根据权利要求16至20中任一项所述的基于块的视频解码器,被配置为
通过以下方式,执行用于预先确定的间预测块的运动向量预测候选的得出
通过预测得出预先确定的间预测块的运动向量预测候选的初始版本,
根据组成所述预先确定的间预测块的切片的边界得到的运动向量预测候选的初始版本,检查相对于预先确定的间预测块的距离发生位移的预先确定的间预测块的足迹的距离是否低于与预先确定的间预测块相比所述分块由于滤波器内核的宽度而被加宽的拓宽范围,以及
如果足迹的距离低于拓宽范围,则将运动向量预测候选的初始版本的子像素部分设置为零,以获得运动向量预测候选。
26.根据权利要求25所述的基于块的视频解码器,被配置为
如果足迹(160)的距离(171)不低于拓宽范围,则不修改运动向量预测候选的初始版本的子像素部分以获得运动向量预测候选。
27.根据权利要求25或26所述的基于块的视频解码器,被配置为
在将所述运动向量预测候选的初始版本的子像素部分设置为零时,以使得所述子像素部分的置零以及全像素部分的调适导致所述运动向量预测候选的初始版本四舍五入到最接近的全像素运动向量的方式,对所述运动向量预测候选的初始版本的完全部分进行调适以获得运动向量预测候选,导致所述分块的所有样本位于组成所述预先确定的间预测块的切片的边界内、并且最接近于在所述子像素部分的置零以及所述全像素部分的调适之前所述运动向量预测候选的初始版本。
28.根据权利要求25或26所述的基于块的视频解码器,被配置为
在将运动向量预测候选的初始版本的子像素部分设置为零时,以使得子像素部分的置零和全像素部分的调适导致运动向量预测候选的初始版本四舍五入到最接近的全像素运动向量预测候选的方式,将运动向量预测候选的初始版本的完全部分剪裁,以获得运动向量预测候选,导致分块的所有样本位于组成所述预先确定的间预测块的切片的边界内,并且最接近于并小于在子像素部分的置零以及全像素部分的剪裁之前运动向量预测候选的初始版本。
29.根据权利要求1至28中任一项所述的基于块的视频解码器,被配置为
通过使用多个(200)运动信息预测候选中的至少一个运动信息预测候选选择性地填充运动信息预测候选列表(190),通过以下方式,通过预测,建立用于所述预先确定的间预测块(104)的运动信息预测候选列表(190),
如果运动信息被设置为等于至少一个运动信息预测候选,通过检查分块(130)是否将超过组成所述预先确定的间预测块的切片(100a)的边界(102),
如果是,不使用至少一个运动信息预测候选填充运动信息预测候选列表,以及
如果不是,用至少一个运动信息预测候选填充运动信息预测候选列表。
30.根据权利要求29所述的基于块的视频解码器,被配置为
如果在运动信息被设置为等于至少一个运动信息预测候选的情况下分块(103)将不会超过组成所述预先确定的间预测块的切片(100a)的边界,并且如果至少一个运动信息预测候选是双向预测运动信息的一部分,其另一部分与另一参考图像相关,如果运动信息被设置为等于另一部分,则分块将超过组成所述预先确定的间预测块的切片,将至少一个运动信息预测候选输入到运动信息预测候选的初始运动信息列表中,并在缺乏另外的运动信息预测候选的可用性的情况下,使用运动信息预测候选的初始运动信息列表的一对条目或初始运动信息列表中的一个条目的组合和默认运动信息填充运动信息预测候选列表。
31.根据权利要求29或30所述的基于块的视频解码器,被配置为
从运动信息预测候选列表(190)中进行选择以获得运动信息预测(150),以及
从数据流中解码运动信息预测残差(152),
基于运动信息预测(150)和运动信息预测残差(152)确定预先确定的间预测块的运动信息。
32.根据权利要求31所述的基于块的视频解码器,被配置为
为预先确定的间预测块得出指向运动信息预测候选列表(190)的指示器(193)以及使用指示器(193)进行选择。
33.根据权利要求1至32中任一项所述的基于块的视频解码器,被配置为
通过使用多个(200)运动信息预测候选中的至少一个运动信息预测候选(192)选择性地填充运动信息预测候选列表(190),通过以下方式,通过预测,建立用于所述预先确定的间预测块(104)的运动信息预测候选列表(190),
通过检查当前图像中的预先确定的间预测块(104)是否与组成所述预先确定的间预测块的切片(100a)的预先确定的边相邻,
如果是,从参考图像(12b)或另一参考图像(12b’)的块中识别第一块(212),并用第一块(212)预测的参考运动信息填充运动信息预测候选列表(190),以及
如果不是,从参考图像(12b)或另一参考图像(12b’)的块中识别第二块(206),并用第二块(206)预测的参考运动信息填充运动信息预测候选列表(190)。
34.根据权利要求33所述的基于块的视频解码器,被配置为
将参考图像(12b)或另一参考图像(12b’)中的第一块(212)识别为参考图像(12b)或另一参考图像(12b’)的块之一,其包括第一预先确定的位置(210),并位于当前图像(12a)中的第一对齐位置(208),具有与预先确定的间预测块(104)的第一预先确定的位置关系,
其中,第一对齐位置(208)位于预先确定的间预测块内。
35.根据权利要求34所述的基于块的视频解码器,被配置为
其中,第一对齐位置(208)是以预先确定的间预测块(104)为中心的当前图像(12a)中的样本位置。
36.根据权利要求33至35中任一项所述的基于块的视频解码器,被配置为
将第二块(206)识别为参考图像(12b)或另一参考图像(12b’)的块之一,所述块包括第二预先确定的位置(204’),并位于当前图像中的第二对齐位置(204),具有与预先确定的间预测块(104)的第二预先确定的位置关系,
其中,第二对齐位置(204)位于预先确定的间预测块(104)之外,并沿垂直于预先确定的边的方向相对于预先确定的间预测块(104)偏移。
37.根据权利要求36所述的基于块的视频解码器,被配置为
其中,第二对齐位置(204)为当前图像中位于预先确定的间预测块(104)之外且与预先确定的边相邻的预先确定的间预测块的角样本对角相邻的样本位置。
38.根据权利要求33至37中任一项所述的基于块的视频解码器,被配置为
从运动信息预测候选列表(190)中进行选择以获得运动信息预测(150),以及
从数据流中解码运动信息预测残差(152),
基于运动信息预测和运动信息预测残差确定预先确定的间预测块(104)的运动信息。
39.根据权利要求30所述的基于块的视频解码器,被配置为
为预先确定的间预测块得出指向运动信息预测候选列表(190)的指示器(193)以及使用指示器(193)进行选择。
40.根据权利要求1至39中任一项所述的基于块的视频解码器,被配置为
识别参考图像(12b)或另一参考图像(12b’)中的对齐块(206;212),与预先确定的间预测块在空间上对齐,
识别当前图像中的空间相邻块(220),空间相邻预先确定的间预测块(104),
检查当前图像(12a)中的预先确定的间预测块(104)是否与组成所述预先确定的间预测块的切片(100a)的预先确定的边相邻,
如果是,通过预测,通过用一个或多个空间运动信息预测候选(200b)和时间运动信息预测候选(200a)填充运动信息预测候选列表来建立用于预先确定的间预测块(140)的运动信息预测候选列表(190),从第一参考运动信息得出一个或多个空间运动信息预测候选(200b),使用其预测当前图像中的空间相邻块,以及从第二参考运动信息得出时间运动信息预测候选(200a),使用其预测对齐块(206;212),通过定位在时间运动信息预测候选之前的按等级的运动信息预测候选列表(190)中的一个或多个空间运动信息预测候选(200b)完成,
如果不是,通过预测,通过用一个或多个空间运动信息预测候选(200b)和时间运动信息预测候选(200a)填充运动信息预测候选列表来建立用于预先确定的间预测块(140)的运动信息预测候选列表(190),从第一参考运动信息得出一个或多个空间运动信息预测候选(200b),使用其预测当前图像中的空间相邻块(200),以及从第二参考运动信息得出时间运动信息预测候选(200a),使用其预测对齐块(206;212),通过定位在时间运动信息预测候选之后的按等级的运动信息预测候选列表中的一个或多个空间运动信息预测候选完成,
为预先确定的间预测块得出按等级顺序(195)指向运动信息预测候选列表(190)的指示器(193),
使用指示器从运动信息预测候选列表(190)中执行选择以获得运动信息预测(150)。
41.根据权利要求40所述的基于块的视频解码器,其中
从第一参考运动信息得出的一个或多个空间运动信息预测候选(200b)使用第一参考运动信息预测当前图像中的空间相邻块(220),包括至少一个等于第一参考运动信息和至少一个等于第一参考运动信息的组合,使用第一参考运动信息预测当前图像中的空间相邻块(200)并且使用第一参考运动信息的组合预测当前图像中的不同的空间相邻块(200)。
42.根据权利要求40或41所述的基于块的视频解码器,被配置为
检查是否,
如果当前图像中的预先确定的间预测块邻接当前图像的预先确定的边,则从参考图像(12b)或另一参考图像(12b’)被划分为块之一的块中识别对齐的块作为块之一,其中包括第一预先确定的位置(210),与当前图像中的第一对齐位置(208)并置,与预先确定的间预测块(104)具有第一预先确定的位置关系,其中第一对齐位置(208)位于预先确定的间预测块内,以及
如果当前图像中的预先确定的间预测块不与当前图像的预先确定的边相邻,则从参考图像(12b)或另一参考图像(12b’)被划分为块之一的块中识别对齐的块作为块之一,其中包括参考图像中的第二预先确定的位置(204’),并置于当前图像中的第二对齐位置(204),与预先确定的间预测块具有第二预先确定的位置关系,其中第二对齐位置位于预先确定的间预测块之外,并沿垂直于预先确定的边的方向相对于预先确定的间预测块偏移。
43.根据权利要求40至42中任一项所述的基于块的视频解码器,被配置为如果当前图像中的预先确定的间预测块邻接当前图像的预先确定的边,
从参考图像被划分成的块中识别参考图像中对齐的块
识别参考图像(12b)或另一参考图像(12b’)的块的第一候选块,其包括第二预先确定的位置(204’),并置到当前图像中的第二对齐位置(204),具有相对于预先确定的间预测块的第二预先确定的位置关系,其中第二对齐位置位于预先确定的间预测块之外且相对于预先确定的间预测块沿垂直于预先确定的边的方向偏移,以及
检查第一候选块是否是间预测编码的,
如果是,则将第一候选块指定为对齐块,以及
如果不是,则从参考图像(12b)或另一参考图像(12b’)被划分为的块中识别出对齐的块作为块之一,其包括参考图像中的第一预先确定的位置(210),并置于当前图像中的第一对齐位置(208),与预先确定的间预测块具有第一预先确定的位置关系,其中第一对齐位置位于预先确定的间预测块内部。
44.根据权利要求42或43所述的基于块的视频解码器,
其中,第一对齐位置是当前图像中以预先确定的间预测块为中心的样本位置。
45.根据权利要求40至44中任一项所述的基于块的视频解码器,
其中,第二对齐位置是当前图像中位于预先确定的间预测块之外且与预先确定的边相邻的预先确定的间预测块的角样本对角相邻的样本位置。
46.根据权利要求40至45中任一项所述的基于块的视频解码器,被配置为
从数据流中解码运动信息预测残差(152),
基于运动信息预测(150)和运动信息预测残差(152)确定预先确定的间预测块的运动信息(154)。
47.根据权利要求1至46中任一项所述的基于块的视频解码器,被配置为
通过预测得出预先确定的间预测块的时间运动信息预测候选
为预先确定的间预测块预测运动向量(240),
剪裁预测运动向量(240),以便从预先确定的间预测块开始,停留在组成所述预先确定的间预测块的切片(100a)的边界内,以获得剪裁的运动向量(248),以及
从参考运动信息中得出用于预先确定的间预测块的时间运动信息预测候选,参考运动信息使用所述参考运动信息来预测参考图像(12b)或另一参考图像(12b’)的块(248)为剪裁运动向量(248)点。
48.根据权利要求47所述的基于块的视频解码器,被配置为
从数据流中解码运动信息预测残差(152),
基于时间运动信息预测候选(150)和运动信息预测残差(152)确定预先确定的间预测块的运动信息(154)。
49.根据权利要求47或48所述的基于块的视频解码器,被配置为
在基于时间运动信息预测候选和运动信息预测残差确定预先确定的间预测块的运动信息时,从预先确定的间预测块的数据流中得出指示器(193)到运动信息预测候选列表和另一运动信息预测候选中,运动信息预测候选列表包含时间运动信息预测候选和另一运动信息预测候选包括预测运动向量,并使用指示器指向的运动信息预测候选连同用于确定运动信息预测残差。
50.根据权利要求1至49中任一项所述的基于块的视频解码器,被配置为
通过预测得出预先确定的间预测块的时间运动信息预测候选
为预先确定的间预测块得出第一和第二预测运动向量(240,260),
检查从预先确定的间预测块开始的第一预测运动向量是否在组成所述预先确定的间预测块的切片的边界内结束,以及
如果是,则从参考运动信息中得出用于预先确定的间预测块的时间运动信息预测候选,使用参考运动信息预测参考图像(12b)或另一参考图像(12b’)的块(242),到其中第一预测的运动向量点,以及
如果不是,则从参考运动信息中得出用于预先确定的间预测块的时间运动信息预测候选,使用参考运动信息来预测参考图像(12b)或另一参考图像(12b’)的另一块(262),到其中第二预测的运动向量点。
51.根据权利要求50所述的基于块的视频解码器,被配置为
从数据流中解码运动信息预测残差(152),
基于时间运动信息预测候选和运动信息预测残差确定预先确定的间预测块的运动信息。
52.根据权利要求50或51所述的基于块的视频解码器,被配置为
在基于时间运动信息预测候选和运动信息预测残差确定预先确定的间预测块的运动信息时,从预先确定的间预测块的数据流中得出指示器(193)到运动信息预测候选列表,列表包含包括第一预测运动向量的第一时间运动信息预测候选、包括第二预测运动向量的第二运动信息预测候选和时间运动信息预测候选,并使用由指示器指向的运动信息预测候选与用于确定的运动信息预测残差。
53.一种支持运动补偿预测的基于块的视频解码器,被配置为
从视频被编码成的数据流中解码视频的当前图像的预先确定的间预测块的运动信息(306a、306b),
从运动信息得出用于子块(300)的每个子块的运动向量(304),其中子块是由预先确定的间预测块被划分得到的,所述运动向量指示相应子块和分块(302)之间的平移位移在参考图像(12b)中,根据所述参考图像来预测相应子块,
通过使用相应子块的运动向量预测每个子块来预测预先确定的间预测块,
其中基于块的视频解码器被配置为根据视频被空间划分成的切片之间的边界的位置来执行得出和/或预测。
54.根据权利要求53所述的基于块的视频解码器,被配置为
在通过使用相应子块的运动向量预测每个子块来预测预先确定的间预测块时,预测预先确定的子块的样本
如果运动向量具有非零的子像素部分,借助于所述分块与滤波器内核的卷积使得分块与预先确定的子块相比由于滤波器内核的宽度而加宽,以及
如果运动向量具有为零的子像素部分,通过将预先确定的子块的每个样本设置为分块的一个对应的样本,使得分块与预先确定的子块一样宽,以及
对预先确定的子块进行得出
通过基于运动信息计算预先确定的子块的运动向量的初始版本,
根据来自组成所述预先确定的间预测块的切片的边界的运动向量的初始版本,检查相对于预先确定的间预测块发生位移的预先确定的子块的足迹的距离是否低于拓宽范围,在所述拓宽范围下,由于滤波器内核的宽度,与预先确定的子块相比,分块被加宽,以及
如果足迹的距离低于拓宽范围,则将运动向量的初始版本的子像素部分设置为零以获得运动向量。
55.根据权利要求54所述的基于块的视频解码器,被配置为
如果足迹的距离不低于拓宽范围,则不修改运动向量的初始版本的子像素部分以获得运动向量。
56.根据权利要求54所述的基于块的视频解码器,被配置为
在将运动向量的初始版本的子像素部分设置为零时,以使得子像素部分的置零和全像素部分的调适导致运动向量的初始版本四舍五入到最接近的全像素运动向量的方式,对运动向量的初始版本的完全部分进行调适,以获得运动向量,导致分块的所有样本位于组成所述预先确定的间预测块的切片的边界内,并且最接近于在子像素部分的置零和全像素部分的调适之前运动向量的初始版本。
57.根据权利要求54所述的基于块的视频解码器,被配置为
在将运动向量的初始版本的子像素部分设置为零时,以使得使得子像素部分的置零和全像素部分的调适导致运动向量的初始版本四舍五入到最接近的全像素运动向量的方式,对运动向量的初始版本的全部部分进行剪裁,以获得运动向量,导致分块的所有样本位于组成所述预先确定的间预测块的切片的边界内,并且最接近于并小于在子像素部分的置零以及全像素部分的剪裁之前运动向量的初始版本。
58.根据权利要求53至57中任一项所述的基于块的视频解码器,被配置为
在通过使用相应子块的运动向量预测每个子块来预测预先确定的间预测块时,
检查使用预先确定的子块的运动向量预测预先确定的子块的分块是否在组成所述预先确定的间预测块的切片的边界内,
如果不在,则在空间上预测预先确定的子块,以及
如果在,则从分块中预测预先确定的子块。
59.根据权利要求58所述的基于块的视频解码器,被配置为
在对预先确定的子块进行空间预测时,还使用已从分块预测的预先确定的间预测块的一个或多个子块的样本,其到一个或多个子块的平移位移由一个或多个子块的运动向量指示。
60.根据权利要求53至59中任一项所述的基于块的视频解码器,被配置为
其中,运动信息包括第一运动向量(306a)和第二运动向量(306b),它们定义了预先确定的间预测块的不同的角处的运动场。
61.一种基于块的视频解码器,配置为
通过预测,建立用于预先确定的间预测块的运动信息预测候选列表,
识别参考图像中的对齐块,与预先确定的间预测块在空间上对齐,
识别当前图像中的与所述预先确定的间预测块空间相邻的空间相邻块,
用从第一参考运动信息得到的一个或多个空间运动信息预测候选和从第二参考运动信息得到的时间运动信息预测候选填充运动信息预测候选列表,使用所述第一参考运动信息已经预测了当前图像中的空间相邻块,以及使用第二参考运动信息预测参考图像中的对齐块,通过定位在时间运动信息预测候选之前的按等级的运动信息预测候选列表中的一个或多个空间运动信息预测候选完成,
为预先确定的间预测块得出按等级顺序指向运动信息预测候选列表的指示器,
使用等级从运动信息预测候选列表中执行选择以获得预先确定的间预测块的运动信息预测。
62.一种基于块的视频解码器,配置为
通过以下方式,通过预测建立用于当前图像的预先确定的间预测块的运动信息预测候选列表
通过识别当前图像中的与所述预先确定的间预测块空间相邻的空间相邻块,
用从第一参考运动信息得到的一个或多个空间运动信息预测候选和从基于历史的时间运动信息预测候选列表得到的基于历史的运动信息预测候选填充运动信息预测候选列表,使用所述第一参考运动信息已经预测了当前图像中的空间相邻块,通过定位在基于历史的运动信息预测候选之前的按等级的运动信息预测候选列表中的一个或多个空间运动信息预测候选完成,
为预先确定的间预测块得出按等级顺序指向运动信息预测候选列表的指示器,
使用等级从运动信息预测候选列表中执行选择以获得预先确定的间预测块的运动信息预测。
63.根据权利要求62所述的基于块的视频解码器,被配置为
通过将最近用于预测预先确定的间预测块之前的先前块的最近使用的运动信息插入其中来管理基于历史的时间运动信息预测候选列表。
64.根据权利要求62或63所述的基于块的视频解码器,被配置为
从数据流中解码运动信息预测残差,
基于运动信息预测和运动信息预测残差确定预先确定的间预测块的运动信息。
65.一种支持运动补偿双向预测的基于块并且包括用于改进运动补偿双向预测的双向光流工具的视频解码器,其中基于块的视频解码器被配置为
根据当前图像(12a)的预先确定的间预测块的第一和第二分块(1301、1302)中的至少一个是否要进行运动补偿双向预测,停用所述双向光流工具,所述第一和第二分块(1301、1302)根据在用于所述预先确定的间预测块的数据流中用信号通知的第一和第二运动向量而相对于所述预先确定的间预测块发生位移,跨越当前图像的组成所述预先确定的间预测块的切片的边界,或者
使用边界填充,以填充要进行运动补偿双向预测的当前图像的预先确定的间预测块的第一和第二分块的一部分,所述第一和第二分块根据在用于所述预先确定的间预测块的数据流中用信号通知的第一和第二运动向量而相对于所述预先确定的间预测块发生位移,所述部分位于所述当前图像的组成所述预先确定的间预测块的切片的边界之外。
66.根据权利要求65所述的基于块的视频解码器,被配置为对于所述第一和第二运动向量中的每一个,
检查数据流中的相应运动向量的信号通知状态是否导致相应分块(130b)超过组成所述预先确定的间预测块(104)的切片(100a),超过与双向光流工具相关联的预先确定的样本宽度(n),如果是,则将相应运动向量从信号通知状态重定向(142)到重定向状态,导致相应分块(130b’)位于组成所述预先确定的间预测块(104)的切片(100a)的边界(102)内,或不超过与双向光流工具相关联的预先确定的样本宽度(n)。
67.根据权利要求65或66所述的基于块的视频解码器,被配置为对于所述第一和第二运动向量中的每一个,
为预先确定的间预测块(104)预测相应运动向量以获得相应运动信息预测(150),以及
从数据流(14)中解码相应运动向量预测残差(152),
基于相应运动向量预测(150)和相应运动向量预测残差(152)并遵守对相应运动向量的约束,确定用于预先确定的间预测块(104)的相应运动向量,使得相应分块不超过组成所述预先确定的间预测块(104)的切片(100a)的边界(102),或不超过与双向光流工具相关联的预先确定的样本宽度(n)。
68.根据权利要求65至67中任一项所述的基于块的视频解码器,被配置为对于所述第一和第二运动向量中的每一个,
使用相应运动向量获得预先确定的间预测块的对应的初始预测器(4021,4022)
如果运动向量具有非零的子像素部分,借助于相应分块与滤波器内核的卷积使得相应分块与预先确定的间预测块相比加宽了滤波器内核的宽度和n样本宽的扩展,以及
如果运动向量具有为零的子像素部分,通过将预先确定的间预测块的每个样本设置为分块的一个对应样本(164),以便与预先确定的间预测块相比,通过n样本宽扩展来加宽分块,以及
其中,双向预测包括双向光流工具,被配置为用于通过以下方式双向预测地预测预先确定的间预测块
局部确定初始预测器上的亮度梯度,并结合(436)亮度梯度以根据亮度梯度局部变化的方式为间预测块得出预测器(438)。
69.基于块的视频解码器被配置为
通过以下方式,建立用于当前图像的预先确定的间预测块的运动信息预测候选列表,
用一个或多个运动信息预测候选(192)填充运动信息预测候选列表,
根据另外的运动信息预测候选中的每一个与所述一个或多个运动信息预测候选的相异性,从所述另外的运动信息预测候选(504)的库(502)中选择预先确定的运动信息预测候选,
用所述预先确定的运动信息预测候选填充运动信息预测候选列表,
其所述中选择取决于所述相异性,使得所述运动信息预测候选列表内的相互运动信息预测候选相异性与使用所述另外的运动信息预测候选之间的相等选择概率执行选择相比增加,
为所述预先确定的间预测块得出指向所述运动信息预测候选列表的指示器,以及
使用等级从所述运动信息预测候选列表中执行选择以获得用于预先确定的间预测块的运动信息预测。
70.根据权利要求69所述的基于块的视频解码器,其中另外的运动信息预测候选(504)的库(502)是基于历史的时间运动信息预测候选列表并且基于块的视频解码器被配置为
通过将最近用于预测先前间预测块的最近使用的运动信息插入其中来管理基于历史的时间运动信息预测候选列表。
71.一种用于将视频(11)编码为数据流(14)并支持运动补偿预测的基于块的视频编码器,被配置为
确定视频(11)的当前图像(12a)的预先确定的间预测块(104)的运动信息,其在参考图像(12b)中定位分块(130),其中预先确定的间预测块(104)以使得分块(130)在组成所述预先确定的间预测块(104)的切片(100a)的边界(102)内且不跨越此边界的方式被预测,
使用所述运动信息,从所述参考图像(12b)的所述分块(130)预测所述预先确定的间预测块(104),
将运动信息编码到数据流(14)中,以将根据切片(100)之间的边界(102)的位置执行将其信号化到所述视频(11)被空间划分成的数据流(14)中。
72.根据权利要求71所述的基于块的视频编码器,被配置为在将所述运动信息编码到所述数据流(14)中时
预测用于所述预先确定的间预测块(104)的运动信息以获得运动信息预测(150),以及
将运动信息预测残差(152)编码到数据流(14)中,
通过专有地地映射运动信息预测和运动信息预测残差(152)的所有可能组合到相应的可能运动信息上的不可逆映射,使得运动信息预测(150)和运动信息预测残差(152)被映射到预先确定的间预测块(104)的运动信息上,这样,如果使用相应的可能运动信息定位分块(130),分块(130)将不会超过组成所述预先确定的间预测块(104)的切片(100a)的边界(102),并且映射了运动信息预测和运动信息预测残差(152)的多于一种的可能组合到一个可能运动信息上,在运动信息预测(150)中相等并且在运动信息预测残差(152)上不同。
73.根据权利要求72所述的基于块的视频编码器,被配置为在将所述运动信息预测残差(152)编码到所述数据流(14)中时,
如果不可逆映射将与为零的运动信息预测残差(152)组合的运动信息预测(150)和与为预先确定的非零值的运动信息预测残差(152)组合的运动信息预测(150)映射到预先确定的间预测块(104)的运动信息上,将运动信息预测残差(152)编码为零。
74.根据权利要求72或73所述的基于块的视频编码器,被配置为
为了使用运动信息预测预先确定的间预测块(104),借助于分块(103)的相应部分内的样本(164)的数学组合和/或通过从为预先确定的间预测块(104)的两个不同的角定义的运动信息得出的两个运动向量(306a,306b)来预测预先确定的间预测块(104)的样本(162)的每一个,并为预先确定的间预测块(104)被划分成的每个子块计算,子块的运动向量(304)定位参考图像(12b)内的相应子块分块,其中所有子块的子块分块形成预先确定的间预测块的分块,以及
使得专有地地映射运动信息预测(150)和运动信息预测残差(152)的所有可能组合到相应的可能运动信息上的不可逆映射,使得如果使用相应的可能运动信息定位分块(130),预先确定的间预测块(104)的所有样本(162)的部分的所有样本位于组成所述预先确定的间预测块(104)的切片(100)的边界(102)内。
75.根据权利要求72所述的基于块的视频编码器,被配置为
通过预测预先确定的间预测块(104)的样本(162)的每一个,使用运动信息来预测预先确定的间预测块(104)
如果运动信息落入运动信息的值域的第一子集内,通过在分块的相应部分内的样本(164)的加权和,使得分块(130)与预先确定的间预测块(104)相比被扩展边缘部分加宽,
如果运动信息落入运动信息的值域的第二子集内,则通过将所述样本设置为等于分块的一个对应样本,使得分块(130)与预先确定的间预测块(104)一样宽,以及
其中,使得专有地地映射运动信息预测(150)和运动信息预测残差(152)的所有可能组合到相应的可能运动信息上的不可逆映射,使得如果使用相应的可能运动信息定位分块(130),分块(130)的所有样本位于组成所述预先确定的间预测块(104)的切片(100a)的边界(102)内,因此,如果对应的可能运动信息落入运动信息的值域的第二子集内,约束允许分块(130)比拓展边缘部分的宽度更接近组成所述预先确定的间预测块(104)的切片(100a)的边界(102)。
76.根据权利要求72所述的基于块的视频编码器,被配置为
通过预测预先确定的间预测块(104)的样本(162)的每一个,使用运动信息来预测预先确定的间预测块(104)
如果运动信息落入运动信息的值域的第一子集内,通过在分块的相应部分内的样本(164)的加权和,使得分块(130)与预先确定的间预测块(104)相比被扩展边缘部分加宽,
如果运动信息落入运动信息的值域的第二子集内,则通过将所述样本设置为等于分块的一个对应样本,使得分块(130)与预先确定的间预测块(104)一样宽,以及
其中,不可逆映射将运动信息预测(150)和运动信息预测残差(152)的所有可能组合专有地映射到相应的可能运动信息上,以便如果分块(130)使用相应可能运动定位信息,
如果运动信息落在运动信息的值域的第一子集内,则分块(130)的所有样本(164)位于组成所述预先确定的间预测块(104)的切片(100a)的边界(102)内,
如果运动信息落在运动信息的值域的第一子集内,切片(130)的所有样本(164)都与组成所述预先确定的间预测块(104)的切片(100a)的边界(102)相距遥远,至少容纳扩展边缘部分的距离。
77.根据权利要求71所述的基于块的视频编码器,其中所述运动信息包括指示所述分块(130)与所述预先确定的间预测块(104)之间的平移位移的运动向量,并且所述基于块的视频编码器被配置为
预测用于所述预先确定的间预测块(104)运动向量以获得运动向量预测,以及
将运动向量预测残差编码到数据流中(14),
从而通过从运动向量预测和运动向量预测残差到运动的不可逆映射,将运动向量预测和运动向量预测残差映射到预先确定的间预测块(104)的运动向量上,其将运动向量预测和运动向量预测残差的所有可能组合专有地映射到对应的可能的运动向量上,这样,如果使用对应的可能的运动向量定位分块(130),则分块(130)不会超过组成所述预先确定的间预测块(104)的切片(100a)的边界(102),并且映射用于运动向量预测和运动向量预测残差的多于一种的可能组合到一个可能的运动向量上,在运动向量预测中相等并且在运动向量预测残差上不等。
78.根据权利要求77所述的基于块的视频编码器,被配置为在将所述运动向量预测残差编码到所述数据流(14)中时,
如果不可逆映射将与运动向量预测残差为零的运动向量预测和与作为预先确定的非零值的运动向量预测残差组合的运动向量预测映射到预先确定的间预测块(104)的运动向量,将运动向量预测残差编码为零。
79.根据权利要求71所述的基于块的视频编码器,其中所述运动信息包括指示所述分块(130)和所述预先确定的间预测块(104)之间的平移位移的运动向量,并且所述基于块的视频编码器被配置为
为预先确定的间预测块(104)预测运动向量以获得运动向量预测,以及
将运动向量预测残差编码到数据流中(14),
通过预测预先确定的间预测块(104)的样本(162),使用运动向量来预测预先确定的间预测块(104)
如果运动向量具有非零的子像素部分,借助于所述分块(130)与滤波器内核的卷积使得分块(130)由于滤波器内核的宽度而与预先确定的间预测块相比变宽,以及
如果运动向量具有为零的子像素部分,通过将预先确定的间预测块(104)的每个样本设置为分块(130)的一个对应样本,使得分块(130)与预先确定的间预测块一样宽,以及
从而通过从运动向量预测和运动向量预测残差到将运动向量预测和运动向量预测残差的所有可能组合专有地映射到相应可能运动向量上的运动向量的不可逆映射,将运动向量预测和运动向量预测残差映射到预先确定的间预测块(104)的运动向量上,以便如果分块(130)使用相应可能运动向量定位,则分块(130)的所有样本将位于组成所述预先确定的间预测块(104)的切片(100a)的边界(102)内,并且其将运动向量预测和运动向量预测残差的多于一种的可能组合映射到一个可能的运动向量上,其中运动向量预测残差不同。
80.根据权利要求79所述的基于块的视频编码器,被配置为
使得从运动向量预测和运动向量预测残差到运动向量的不可逆映射将运动向量预测和运动向量预测残差的可能组合映射到对应的可能的运动向量上,从而使对应的可能的运动向量是运动向量预测和运动向量预测残差的总和,只要,如果使用对应的可能的运动向量定位分块(130),则分块(130)的所有样本将位于预先确定的间预测块(104)的切片(100a)的边界(102)内,针对运动向量预测和运动向量预测残差映射可能组合,其中运动向量预测和运动向量预测残差的总和将导致预先确定的间预测块(104)的足迹的距离,根据来自组成所述预先确定的间预测块(104)的切片(100a)的边界(102)的运动向量预测和运动向量预测残差之和,相对于预先确定的间预测块(104)是发生位移的,其由于滤波器内核的宽度,在分块(130)与预先确定的间预测块(104)相比被加宽的拓宽范围以下,对于其子像素部分被设置为零的相应运动向量。
81.根据权利要求80所述的基于块的视频编码器,被配置为
如果足迹(160)的距离(171)不低于拓宽范围,则不修改运动向量的初始版本的子像素部分以获得运动向量。
82.根据权利要求80所述的基于块的视频编码器,被配置为
使得从运动向量预测和运动向量预测残差到运动向量的不可逆映射映射了运动向量预测和运动向量预测残差的可能组合,其运动向量预测和运动向量预测残差的总和将导致预先确定的间预测块(104)的足迹(160)的距离(171),根据来自组成所述预先确定的间预测块(104)的切片(100a)的边界(102)的运动向量预测和运动向量预测残差的总和,相对于预先确定的间预测块(104)是发生位移的,其由于滤波器内核的宽度,在分块(130)与预先确定的间预测块(104)相比被加宽的拓宽范围以下,对于其子像素部分被设置为零的相应运动向量以及等于总和的全像素部分的全像素部分。
83.根据权利要求80至82中任一项所述的基于块的视频编码器,被配置为
使得从运动向量预测和运动向量预测残差到运动向量的不可逆映射映射了运动向量预测和运动向量预测残差的可能组合,其运动向量预测和运动向量预测残差的总和将导致预先确定的间预测块(104)的足迹(160)的距离(171),根据来自组成所述预先确定的间预测块(104)的切片(100a)的边界(102)的运动向量预测和运动向量预测残差的总和,相对于预先确定的间预测块(104)是发生位移的,其由于滤波器内核的宽度,在分块(130)与预先确定的间预测块(104)相比被加宽的拓宽范围以下,对于其子像素部分被设置为零的相应运动向量以及以使得相应运动向量对应于四舍五入为最接近的全像素运动向量的总和的方式设置的完全部分,最接近总和。
84.根据权利要求80至82中任一项所述的基于块的视频编码器,被配置为
使得从运动向量预测和运动向量预测残差到运动向量的不可逆映射映射了运动向量预测和运动向量预测残差的可能组合,其运动向量预测和运动向量预测残差的总和将导致预先确定的间预测块(104)的足迹(160)的距离(171),根据来自组成所述预先确定的间预测块(104)的切片(100a)的边界(102)的运动向量预测和运动向量预测残差的总和,相对于预先确定的间预测块(104)是发生位移的,其由于滤波器内核的宽度,在分块(130)与预先确定的间预测块(104)相比被加宽的拓宽范围以下,对于其子像素部分被设置为零的相应运动向量以及以使得相应运动向量对应于四舍五入为最接近的全像素运动向量的总和的方式设置的完全部分,最接近并小于总和。
85.根据权利要求71至84中任一项所述的基于块的视频编码器,被配置为
通过预测,用信号通知用于预先确定的间预测块(104)的运动信息预测候选(192c),其中对于运动信息预测候选(192c)遵守对运动信息预测候选的约束,使得如果运动信息被设置为等于运动信息预测候选(192c),分块(130)将不会超过组成所述预先确定的间预测块(104)的切片(100a)的边界(102),以及
将运动信息预测残差(152)编码到数据流(14)中,
从而可以通过使用运动信息预测残差(152)校正运动信息预测候选,用信号通知预先确定的间预测块(104)的运动信息。
86.根据权利要求85所述的基于块的视频编码器,被配置为
遵守对运动信息预测候选(192c)的约束,因此,如果运动信息被设置为等于运动信息预测候选,则分块(130)不会超过组成所述预先确定的间预测块(104)的切片(100a)边界(102),在用信号通知运动信息预测候选(192c)时,使用不可逆映射将初始运动信息预测候选(192c’)映射到运动信息预测候选(192c),其专有地地映射到相应映射运动信息候选上,使得如果使用对应的映射运动信息候选定位分块(130),则分块(130)不会超过组成所述预先确定的间预测块(104)的切片(100a)的边界(102),并将初始运动信息预测候选的不同设置映射到对应的映射运动信息候选的一种可能设置。
87.根据权利要求85或86所述的基于块的视频编码器,被配置为
通过预测,建立包括运动信息预测候选(192)的用于所述预先确定的间预测块(104)的运动信息预测候选列表(190)。
88.根据权利要求87所述的基于块的视频编码器,被配置为
通过预测,用信号通知运动信息预测候选列表(190)的每个运动信息预测候选(192),遵循对于相应运动信息预测候选对运动信息预测候选的约束,使得如果运动信息是设置为等于相应运动信息预测候选,分块(130)将不会超过由预先确定的间预测块(104)的切片(100a)的边界(102)。
89.根据权利要求87或88所述的基于块的视频编码器,被配置为
将指向运动信息预测候选(192)的指示器(193)插入到运动信息预测候选列表(190)中的用于预先确定的间预测块(104)的数据流(14)中,在此基础上,使用它来预测预先确定的间预测块(104)来确定运动信息。
90.根据权利要求85至89中任一项所述的基于块的视频编码器,被配置为
通过在分块(130)的相应部分内的样本(164)的数学组合来预测预先确定的间预测块(104)的每个样本,从而使用运动信息来预测预先确定的间预测块(104)和/或通过从为预先确定的间预测块(104)的两个不同的角定义的运动信息得出两个运动向量(306a、306b)并计算由预先确定的间预测块(104)被划分成的每个子块,子块的运动向量(304)定位参考图像(12b)内的相应子块分块,其中所有子块的子块分块形成预先确定的间预测块的分块,以及
从而选择对运动信息预测候选的约束,使得如果运动信息被设置为等于运动信息预测候选,则针对预先确定的间预测块(104)的所有样本的分块(130)部分的所有样本将位于组成所述预先确定的间预测块(104)的切片(100a)的边界(102)内。
91.根据权利要求85至89中任一项所述的基于块的视频编码器,被配置为
通过预测预先确定的间预测块(104)的每个样本,使用运动信息来预测预先确定的间预测块(104)
如果运动信息落在运动信息的值域的第一子集内,通过在分块(130)的相应部分内的样本(164)的加权和,使得分块(130)与预先确定的间预测块(104)相比被扩展边缘部分加宽,
如果运动信息落在运动信息的值域的第二子集内,通过将所述样本设置为等于分块(130)的一个对应样本,使得分块(130)与预先确定的间预测块(104)一样宽,以及
使得选择对运动信息预测候选的约束,如果运动信息被设置为等于运动信息预测候选,则分块(130)的所有样本将位于将组成所述预先确定的间预测块(104)的切片(100a)的边界(102)内,以便如果运动信息落在运动信息的值域的第二子集内,则约束允许分块(130)比扩展边缘部分的宽度更接近组成所述预先确定的间预测块(104)的切片(100a)的边界(102)。
92.根据权利要求85至89中任一项所述的基于块的视频编码器,被配置为
通过预测预先确定的间预测块(104)的每个样本,使用运动信息来预测预先确定的间预测块(104)
如果运动信息落在运动信息的值域的第一子集内,通过在分块(130)的相应部分内的样本(164)的加权和,使得分块(130)与预先确定的间预测块(104)相比被扩展边缘部分加宽,
如果运动信息落在运动信息的值域的第二子集内,通过将所述样本设置为等于分块(130)的一个对应样本,使得分块(130)与预先确定的间预测块(104)一样宽,以及
使得选择对运动信息预测候选的约束,使得如果运动信息被设置为等于运动信息预测候选,
如果运动信息落在运动信息的值域的第一子集内,则分块(130)的所有样本将位于组成所述预先确定的间预测块(104)的切片(100a)的边界(102)内,
如果运动信息落在运动信息的值域的第一子集内,分块(130)的所有样本将与由预先确定的间预测块(104)的切片(100a)的边界(102)相距至少一个容纳扩展边缘部分的距离。
93.根据权利要求85至89中任一项所述的基于块的视频编码器,其中所述运动信息包括指示所述分块(130)与所述预先确定的间预测块(104)之间的平移位移的运动向量,以及所述基于块的视频编码器被配置为
通过预测预先确定的间预测块(104)的样本,使用运动向量来预测预先确定的间预测块(104)
如果运动向量具有非零的子像素部分,借助于所述分块(130)与滤波器内核的卷积,使得分块(130)由于滤波器内核的宽度而比预先确定的间预测块(104)加宽,以及
如果运动向量具有为零的子像素部分,通过将预先确定的间预测块(104)的每个样本设置为分块(130)的一个对应样本,使得分块(130)与预先确定的间预测块(104)一样宽,以及
对预先确定的间预测块(104)执行运动向量预测候选的信号化,以便如果运动向量被设置为等于运动向量预测候选,则分块(130)的所有样本将位于组成所述预先确定的间预测块(104)的切片(100a)的边界(102)内。
94.根据权利要求85至89中任一项所述的基于块的视频编码器,被配置为
通过以下方式对预先确定的间预测块(104)执行运动向量预测候选的信号化
通过预测用信号通知预先确定的间预测块(104)的运动向量预测候选的初始版本,
检查预先确定的间预测块(104)的足迹(160)的距离(171),根据来自组成所述预先确定的间预测块(104)的切片(100a)的边界(102)的运动向量预测候选的初始版本相对于预先确定的间预测块(104)发生位移,与预先确定的间预测块(104)相比由于滤波器内核的宽度是否低于分块(130)被加宽的拓宽范围,以及
如果足迹(171)的距离低于拓宽范围,则将运动向量预测候选的初始版本的子像素部分设置为零以获得运动向量预测候选。
95.根据权利要求94所述的基于块的视频编码器,被配置为
如果足迹(160)的距离(171)不低于拓宽范围,则不修改运动向量预测候选的初始版本的子像素部分以获得运动向量预测候选。
96.根据权利要求94或95所述的基于块的视频编码器,被配置为
当将运动向量预测候选的初始版本的子像素部分设置为零时,以使得子像素部分的置零和全像素部分的调适导致运动向量预测候选的初始版本四舍五入到最接近的全像素运动向量预测候选的方式,对运动向量预测候选的初始版本的完全部分进行调适,以获得运动向量预测候选,导致分块(130)的所有样本都位于组成所述预先确定的间预测块(104)的切片(100a)的边界(102)内并且最接近在子像素部分的置零和全像素部分的调适之前的运动向量预测候选的初始版本。
97.根据权利要求94或95所述的基于块的视频编码器,被配置为
当将运动向量预测候选的初始版本的子像素部分设置为零时,以使得子像素部分的置零和全像素部分的调适导致运动向量预测候选的初始版本四舍五入到最接近的全像素运动向量预测候选的方式对运动向量预测候选的初始版本的完全部分进行调适,以获得运动向量预测候选,导致分块(130)的所有样本都位于组成所述预先确定的间预测块(104)的切片(100a)的边界(102)内并且最接近并小于在子像素部分的置零和全像素部分的剪裁之前的运动向量预测候选的初始版本。
98.根据权利要求71至97中任一项所述的基于块的视频编码器,被配置为
通过使用多个(200)运动信息预测候选中的至少一个运动信息预测候选选择性地填充运动信息预测候选列表(190),通过预测,建立用于所述预先确定的间预测块(104)的运动信息预测候选列表(190),
通过检查如果运动信息被设置为等于至少一个运动信息预测候选,分块(130)是否将超过组成所述预先确定的间预测块(104)的切片(100a)的边界(102),
如果是,则不使用至少一个运动信息预测候选填充运动信息预测候选列表(190),以及
如果不是,则用至少一个运动信息预测候选填充运动信息预测候选列表(190)。
99.根据权利要求98所述的基于块的视频编码器,被配置为
如果,如果运动信息被设置为等于至少一个运动信息预测候选,则分块(103)将不会超过组成所述预先确定的间预测块(104)的切片(100a)的边界(102),并且如果至少一个运动信息预测候选是双向预测运动信息的一部分,其另一部分与另一参考图像相关,如果运动信息被设置为等于另一部分,则分块(130)将超过组成所述预先确定的间预测块(104)的切片的边界(102),将至少一个运动信息预测候选输入到运动信息预测候选的初始运动信息列表中,并在缺乏另外的运动信息预测候选的可用性的情况下,使用运动信息预测候选的初始运动信息列表的一对条目或初始运动信息列表中的一个条目的组合和默认运动信息填充运动信息预测候选列表(190)。
100.根据权利要求98或99所述的基于块的视频编码器,被配置为
从运动信息预测候选列表(190)中进行选择以获得运动信息预测(150),以及
将运动信息预测残差(152)编码到数据流(14)中,
基于运动信息预测(150)和运动信息预测残差(152)确定预先确定的间预测块(104)的运动信息。
101.根据权利要求100所述的基于块的视频编码器,被配置为
为预先确定的间预测块(104)用信号通知指向运动信息预测候选列表(190)的指示器(193)以及
使用指示器(193)进行选择。
102.根据权利要求71至101中任一项所述的基于块的视频编码器,被配置为
通过使用多个(200)运动信息预测候选中的至少一个运动信息预测候选(192)选择性地填充运动信息预测候选列表(190),通过预测,建立用于所述预先确定的间预测块(104)的运动信息预测候选列表(190),
通过检查当前图像(12a)中的预先确定的间预测块(104)是否与组成所述预先确定的间预测块(104)的切片(100a)的预先确定的边相邻,
如果是,则从参考图像(12b)或另一参考图像(12b’)的块中识别第一块(212),并用第一块(212)预测的参考运动信息填充运动信息预测候选列表(190),以及
如果不是,则从参考图像(12b)或另一参考图像(12b’)的块中识别第二块(206),并用第二块(206)预测的参考运动信息填充运动信息预测候选列表(190)。
103.根据权利要求102所述的基于块的视频编码器,被配置为
将参考图像(12b)或另一参考图像(12b’)中的第一块(212)识别为参考图像(12b)或另一参考图像(12b’)的块之一,其包括第一预先确定的位置(210),并位于当前图像(12a)中的第一对齐位置(208),具有与预先确定的间预测块(104)的第一预先确定的位置关系,
其中,第一对齐位置(208)位于预先确定的间预测块(104)内。
104.根据权利要求103所述的基于块的视频编码器,被配置为
其中,第一对齐位置(208)是以预先确定的间预测块(104)为中心的当前图像(12a)中的样本位置。
105.根据权利要求102至104中任一项所述的基于块的视频编码器,被配置为
将第二块(206)识别为参考图像(12b)或另一参考图像(12b’)的块之一,所述块包括第二预先确定的位置(204’),并位于当前图像(12a)中的第二对齐位置(204),具有与预先确定的间预测块(104)的第二预先确定的位置关系,
其中,第二对齐位置(204)位于预先确定的间预测块(104)之外,并沿垂直于预先确定的边的方向相对于预先确定的间预测块(104)偏移。
106.根据权利要求105所述的基于块的视频编码器,被配置为
其中,第二对齐位置(204)为当前图像(12a)中位于预先确定的间预测块(104)之外且与预先确定的边相邻的预先确定的间预测块(104)的角样本对角相邻的样本位置。
107.根据权利要求102至106中任一项所述的基于块的视频编码器,被配置为
从运动信息预测候选列表(190)中进行选择以获得运动信息预测(150),以及
将运动信息预测残差(152)编码到数据流中,
基于运动信息预测(150)和运动信息预测残(152)确定预先确定的间预测块(104)的运动信息。
108.根据权利要求99所述的基于块的视频编码器,被配置为
为预先确定的间预测块(104)得出指向运动信息预测候选列表(190)的指示器(193)以及
使用指示器(193)进行选择。
109.根据权利要求71至108中任一项所述的基于块的视频编码器,被配置为
识别参考图像(12b)或另一参考图像(12b’)中的对齐块(206;212),与预先确定的间预测块(104)在空间上对齐,
识别当前图像(12a)中的空间相邻块(220),空间相邻预先确定的间预测块(104),
检查当前图像(12a)中的预先确定的间预测块(104)是否与组成所述预先确定的间预测块(104)的切片(100a)的预先确定的边相邻,
如果是,通过预测,通过用一个或多个空间运动信息预测候选(200b)和时间运动信息预测候选(200a)填充运动信息预测候选列表(190)来建立用于预先确定的间预测块(140)的运动信息预测候选列表(190),一个或多个空间运动信息预测候选(200b)通过信号通知第一参考运动信息,使用其预测当前图像(12a)中的空间相邻块,以及时间运动信息预测候选(200a)通过信号通知第二参考运动信息,使用其预测对齐块(206;212)并定位在时间运动信息预测候选之前的按等级的运动信息预测候选列表(190)中的一个或多个空间运动信息预测候选(200b),
如果不是,通过预测,通过用一个或多个空间运动信息预测候选(200b)和时间运动信息预测候选(200a)填充运动信息预测候选列表(190)来建立用于预先确定的间预测块(140)的运动信息预测候选列表(190),一个或多个空间运动信息预测候选(200b)通过信号通知第一参考运动信息,使用其预测当前图像(12a)中的空间相邻块(200),以及时间运动信息预测候选(200a)通过信号通知第二参考运动信息,使用其预测对齐块(206;212)并定位在时间运动信息预测候选之后的按等级的运动信息预测候选列表(190)中的一个或多个空间运动信息预测候选,
为预先确定的间预测块(104)信号通知按等级顺序(195)指向运动信息预测候选列表(190)的指示器(193),
使用指示器(193)从运动信息预测候选列表(190)中执行选择以获得运动信息预测(150)。
110.根据权利要求109所述的基于块的视频编码器,其中
一个或多个空间运动信息预测候选(200b)信号通知第一参考运动信息,使用第一参考运动信息预测当前图像(12a)中的空间相邻块(220),包括至少一个等于第一参考运动信息和至少一个等于第一参考运动信息的组合,使用第一参考运动信息预测当前图像(12a)中的空间相邻块(200)并且使用第一参考运动信息的组合预测当前图像(12a)中的不同的空间相邻块(200)。
111.根据权利要求109或110所述的基于块的视频编码器,被配置为
检查是否,
如果当前图像(12a)中的预先确定的间预测块(104)邻接于当前图像(12a)的预先确定的边,则从参考图像(12b)或另一参考图像(12b’)被划分为块之一的块中识别对齐的块作为块之一,其中包括第一预先确定的位置(210),与当前图像(12a)中的第一对齐位置(208)并置,与预先确定的间预测块(104)具有第一预先确定的位置关系,其中第一对齐位置(208)位于预先确定的间预测块(104)内,以及
如果当前图像(12a)中的预先确定的间预测块(104)不与当前图像(12a)的预先确定的边相邻,则从参考图像(12b)或另一参考图像(12b’)被划分为块之一的块中识别对齐的块作为块之一,其中包括参考图像中的第二预先确定的位置(204’),并置于当前图像(12a)中的第二对齐位置(204),与预先确定的间预测块具有第二预先确定的位置关系,其中第二对齐位置位于预先确定的间预测块(104)之外,并沿垂直于预先确定的边的方向相对于预先确定的间预测块(104)偏移。
112.根据权利要求109至111中任一项所述的基于块的视频编码器,被配置为如果当前图像(12a)中的所述预先确定的间预测块(104)邻接于当前图像(12a)的预先确定的边,
通过以下方式,从所述参考图像被划分成的块中识别所述参考图像中的对齐块
识别所述参考图像(12b)或另一参考图像(12b’)的块的第一候选块,其包括第二预先确定的位置(204’),并置到当前图像(12a)中的第二对齐位置(204),具有相对于预先确定的间预测块(104)的第二预先确定的位置关系,其中第二对齐位置位于预先确定的间预测块(104)之外且相对于预先确定的间预测块(104)沿垂直于预先确定的边的方向偏移,以及
检查第一候选块是否是间预测编码的,
如果是,则将第一候选块指定为对齐块,以及
如果不是,则从参考图像(12b)或另一参考图像(12b’)被划分为的块中识别出对齐的块作为块之一,其包括参考图像中的第一预先确定的位置(210),并置于当前图像(12a)中的第一对齐位置(208),与预先确定的间预测块(104)具有第一预先确定的位置关系,其中第一对齐位置位于预先确定的间预测块(104)内部。
113.根据权利要求111或112所述的基于块的视频编码器,
其中,所述第一对齐位置是当前图像(12a)中以所述预先确定的间预测块(104)为中心的样本位置。
114.根据权利要求109至113中任一项所述的基于块的视频编码器,
其中,所述第二对齐位置是当前图像(12a)中位于所述预先确定的间预测块(104)之外、且与邻接于预先确定的边的预先确定的间预测块(104)的角样本对角相邻的样本位置。
115.根据权利要求109至114中任一项所述的基于块的视频编码器,被配置为
将运动信息预测残差(152)编码到所述数据流(14)中,
基于所述运动信息预测(150)和运动信息预测残差(152)确定用于所述预先确定的间预测块(104)的运动信息(154)。
116.根据权利要求71至115中任一项所述的基于块的视频编码器,被配置为
通过以下方式,通过预测,用信号通知用于所述预先确定的间预测块(104)的时间运动信息预测候选
预测用于所述预先确定的间预测块(104)的运动向量(240),
剪裁所预测的运动向量(240),使得从所述预先确定的间预测块(104)开始,停留在组成所述预先确定的间预测块(104)的切片(100a)的边界(102)内,以获得经剪裁的运动向量(248),以及
将用于所述预先确定的间预测块(104)的时间运动信息预测候选用信号通知到参考运动信息中,所述参考运动信息已用于预测所述经剪裁的运动向量(248)所指向的所述参考图像(12b)或另一参考图像(12b’)的块(248)。
117.根据权利要求116所述的基于块的视频编码器,被配置为
将运动信息预测残差(152)编码到所述数据流(14)中,
基于所述时间运动信息预测候选(150)和所述运动信息预测残差(152)确定用于所述预先确定的间预测块(104)的运动信息(154)。
118.根据权利要求116或117所述的基于块的视频编码器,被配置为
在基于时间运动信息预测候选和运动信息预测残差(152)确定用于所述预先确定的间预测块(104)的运动信息时,将指向运动信息预测候选列表的指示器(193)发信号通知到用于所述预先确定的间预测块(104)的数据流(14)中,所述运动信息预测候选列表包含时间运动信息预测候选和包括所述预测运动向量的另一运动信息预测候选,并且使用由指示器(193)指向的运动信息预测候选连同所述运动信息预测残差(152)的确定以进行所述确定。
119.根据权利要求71至118中任一项所述的基于块的视频编码器,被配置为
通过以下方式,通过预测,用信号通知用于所述预先确定的间预测块(104)的时间运动信息预测候选
用信号通知用于所述预先确定的间预测块(104)的第一和第二预测运动向量(240,260),
检查从所述预先确定的间预测块(104)开始的所述第一预测运动向量是否在组成所述预先确定的间预测块(104)的切片的边界(102)内结束,以及
如果在所述边界内结束,将用于所述预先确定的间预测块(104)的时间运动信息预测候选用信号通知到参考运动信息中,所述参考运动信息已用于预测所述第一预测运动向量所指向的所述参考图像(12b)或另一参考图像(12b’)的块(242),以及
如果不在所述边界内结束,将用于所述预先确定的间预测块(104)的时间运动信息预测候选发信号通知到参考运动信息中,所述参考运动信息已用于预测所述第二预测运动向量所指向的参考图像(12b)或另一参考图像(12b’)的另一块(262)。
120.根据权利要求119所述的基于块的视频编码器,被配置为
将运动信息预测残差(152)编码到所述数据流(14)中,
基于所述时间运动信息预测候选和所述运动信息预测残差(152)确定用于所述预先确定的间预测块(104)的运动信息。
121.根据权利要求119或120所述的基于块的视频编码器,被配置为
在基于所述时间运动信息预测候选和所述运动信息预测残差(152)确定用于所述预先确定的间预测块(104)的运动信息时,将指向运动信息预测候选列表的指示器(193)用信号通知到用于所述预先确定的间预测块(104)的数据流(14)中,所述运动信息预测候选列表包含包括第一预测运动向量的第一时间运动信息预测候选、包括第二预测运动向量的第二运动信息预测候选、以及所述时间运动信息预测候选,并且使用所述由指示器(193)指向的运动信息预测候选连同所述运动信息预测残差(152)以进行所述确定。
122.一种支持运动补偿预测的基于块的视频编码器,被配置为
将用于视频(11)的当前图像(12a)的预先确定的间预测块(104)的运动信息(306a、306b)编码到所述视频(11)被编码成的数据流(14)中,
将用于所述预先确定的间预测块(104)被划分成的子块(300)的每个子块的运动向量(304)发信号通知到所述运动信息中,所述运动向量指示在相应子块与参考图像(12b)中的分块(302)之间的平移位移,所述相应子块是将要根据所述参考图像来预测的,
通过使用用于相应子块的运动向量预测每个子块,来预测所述预先确定的间预测块(104),
其中所述基于块的视频编码器被配置为根据所述视频(11)被空间划分成的切片之间的边界(102)的位置来执行所述信号化和/或预测。
123.根据权利要求122所述的基于块的视频编码器,被配置为
在通过使用用于相应子块的运动矢量预测每个子块来预测所述预先确定的间预测块(104)时,通过以下方式,预测预先确定的子块的样本
如果所述运动向量具有非零的子像素部分,借助于滤波器内核与所述分块(302)的卷积,使得与所述预先确定的子块相比,所述分块(302)由于所述滤波器内核的宽度而被加宽,以及
如果所述运动向量具有为零的子像素部分,通过将所述预先确定的子块块的每个样本设置为所述分块(302)的一个对应样本,使得所述分块(302)与所述预先确定的子块一样宽,以及
通过以下方式,对所述预先确定的子块进行信号化
基于所述运动信息计算用于所述预先确定的子块的运动向量的初始版本,
检查根据所述运动向量的初始版本相对于所述预先确定的间预测块(104)发生位移的预先确定的子块的足迹(160)相距于组成所述预先确定的间预测块(104)的切片的边界(102)的距离(171),是否低于与所述预先确定的子块相比所述分块(302)由于所述滤波器内核的宽度而被加宽的拓宽范围,以及
如果所述足迹(160)的所述距离(171)低于所述拓宽范围,将所述运动向量的初始版本的子像素部分设置为零,以获得所述运动向量。
124.根据权利要求123所述的基于块的视频编码器,被配置为
如果所述足迹(160)的距离(171)不低于所述拓宽范围,不修改所述运动向量的初始版本的子像素部分,以获得运动向量。
125.根据权利要求123所述的基于块的视频编码器,被配置为
在将所述运动向量的初始版本的子像素部分设置为零时,以使得所述子像素部分的置零以及全像素部分的调适导致所述运动向量的初始版本四舍五入到最接近的全像素运动向量的方式,对所述运动向量的初始版本的完全部分进行调适以获得运动向量,导致所述分块(302)的所有样本位于组成所述预先确定的间预测块(104)的切片的边界(102)内、并且最接近于和小于在所述子像素部分的置零以及所述全像素部分的调适之前所述运动向量的初始版本。
126.根据权利要求123所述的基于块的视频编码器,被配置为
在将所述运动向量的初始版本的子像素部分设置为零时,以使得所述子像素部分的置零以及全像素部分的调适导致所述运动向量的初始版本四舍五入到最接近的全像素运动向量的方式,对所述运动向量的初始版本的完全部分进行剪裁以获得运动向量,导致所述分块(302)的所有样本位于组成所述预先确定的间预测块(104)的切片的边界(102)内、并且最接近于和小于在所述子像素部分的置零以及所述全像素部分的剪裁之前所述运动向量的初始版本。
127.根据权利要求123至126中任一项所述的基于块的视频编码器,被配置为
在通过使用用于相应子块的运动向量预测每个子块来预测所述预先确定的间预测块(104)时,
检查使用用于所述预先确定的子块的运动向量从中预测预先确定的子块的所述分块(302)是否在组成所述预先确定的间预测块(104)的切片的边界(102)内,
如果不在所述边界内,空间预测所述预先确定的子块,以及
如果在所述边界内,从所述分块(302)预测所述预先确定的子块。
128.根据权利要求127所述的基于块的视频编码器,被配置为
在对所述预先确定的子块进行空间预测时,还使用已从所述分块(302)预测的所述预先确定的间预测块(104)的一个或多个子块的样本,所述分块(302)相对于所述一个或多个子块的平移位移由所述一个或多个子块的运动向量指示。
129.根据权利要求122至129中任一项所述的基于块的视频编码器,被配置为
其中,所述运动信息包括第一运动向量(306a)和第二运动向量(306b),所述第一运动向量(306a)和第二运动向量(306b)定义所述预先确定的间预测块(104)的不同的角处的运动场。
130.一种基于块的视频编码器,被配置为
通过以下方式,通过预测建立用于预先确定的间预测块(104)的运动信息预测候选列表
识别参考图像(12b)中的与所述预先确定的间预测块(104)空间对齐的对齐块,
识别所述当前图像(12a)中的与所述预先确定的间预测块(104)空间相邻的空间相邻块,
通过一个或多个空间运动信息预测候选和时间运动信息预测候选填充所述运动信息预测候选列表(190),所述一个或多个空间运动信息预测候选被发信号通知到第一参考运动信息中,所述第一参考运动信息已被用于预测所述当前图像(12a)中的所述空间相邻块,所述时间运动信息预测候选被发信号通知到第二参考运动信息中,所述第二参考运动信息已被用于预测所述当前图像(12a)中的所述对齐块,按照在所述时间运动信息预测候选之前的等级在所述运动信息预测候选列表(190)中定位所述一个或多个空间运动信息预测候选,
为所述预先确定的间预测块(104)发信号通知按等级顺序指向所述运动信息预测候选列表的指示器(193),
使用所述等级从所述运动信息预测候选列表(190)中执行选择以获得用于预先确定的间预测块(104)的运动信息预测。
131.一种基于块的视频编码器,被配置为
通过以下方式,通过预测建立用于当前图像(12a)的预先确定的间预测块(104)的运动信息预测候选列表
识别所述当前图像(12a)中的与所述预先确定的间预测块(104)空间相邻的空间相邻块,
通过一个或多个空间运动信息预测候选和基于历史的运动信息预测候选填充所述运动信息预测候选列表(190),所述一个或多个空间运动信息预测候选被发信号通知到第一参考运动信息中,所述第一参考运动信息已被用于预测所述当前图像(12a)中的所述空间相邻块,所述基于历史的运动信息预测候选被发信号通知到基于历史的时间运动信息预测候选列表中,按照在所述基于历史的运动信息预测候选之前的等级在所述运动信息预测候选列表(190)中定位所述一个或多个空间运动信息预测候选,
为所述预先确定的间预测块(104)发信号通知按等级顺序指向所述运动信息预测候选列表(190)的指示器(193),
使用所述等级从所述运动信息预测候选列表(190)中执行选择以获得用于预先确定的间预测块(104)的运动信息预测。
132.根据权利要求131所述的基于块的视频编码器,被配置为
通过将最近用于预测在所述预先确定的间预测块(104)之前的先前块的最近使用的运动信息插入其中,来管理所述基于历史的时间运动信息预测候选列表。
133.根据权利要求131或132所述的基于块的视频编码器,被配置为
将运动信息预测残差(152)编码到所述数据流(14)中,
基于所述运动信息预测(152)和运动信息预测残差(152)确定用于所述预先确定的间预测块(104)的运动信息。
134.一种支持运动补偿双向预测并且包括用于改进运动补偿双向预测的双向光流工具的基于块的视频编码器,其中所述基于块的视频编码器被配置为
根据当前图像(12a)的预先确定的间预测块(104)的第一和第二分块(1301、1302)中的至少一个是否要进行运动补偿双向预测,停用所述双向光流工具,所述第一和第二分块(1301、1302)根据在用于所述预先确定的间预测块(104)的数据流(14)中用信号通知的第一和第二运动向量而相对于所述预先确定的间预测块(104)发生位移,跨越所述视频(11)被空间划分成的切片之间的边界(102),或者
使用边界填充,以填充要进行所述运动补偿双向预测的当前图像的预先确定的间预测块(104)的第一和第二分块的一部分,所述第一和第二分块根据在用于所述预先确定的间预测块(104)的数据流(14)中用信号通知的第一和第二运动向量而相对于所述预先确定的间预测块(104)发生位移,所述部分位于当前图像的组成所述预先确定的间预测块的切片的边界(102)之外。
135.根据权利要求134所述的基于块的视频编码器,被配置为针对所述第一和第二运动向量中的每一个,
检查所述数据流中的相应运动向量的信号通知状态是否导致相应分块(130b)与组成所述预先确定的间预测块(104)的切片(100a)相比超出与双向光流工具相关联的预先确定的样本宽度(n),如果超出所述预先确定的样本宽度(n),将所述相应运动向量从所述信号通知状态重定向(142)到重定向状态,导致相应分块(130b’)位于组成所述预先确定的间预测块(104)的切片(100a)的边界(102)内,或者不超出与所述双向光流工具相关联的所述预先确定的样本宽度(n)。
136.根据权利要求134或135所述的基于块的视频编码器,被配置为针对所述第一和第二运动向量中的每一个,
预测用于所述预先确定的间预测块(104)的相应运动向量以获得相应运动信息预测(150),以及
将相应运动向量预测残差(152)编码到所述数据流(14)中,
使得通过不可逆映射,所述运动信息预测(150)和所述运动信息预测残差(152)被映射到用于所述预先确定的间预测块(104)的所述运动信息上,所述不可逆映射将所述运动信息预测和所述运动信息预测残差(152)的所有可能组合专有地地映射到相应的可能运动信息上,使得如果使用所述相应的可能运动信息定位所述分块(130),所述分块(130)将不会超过组成所述预先确定的间预测块(104)的切片(100a)的边界(102),或者不会超出与所述双向光流工具相关联的预先确定的样本宽度(n),并且所述不可逆映射将所述运动信息预测和所述运动信息预测残差(152)的在所述运动信息预测(150)中相等并且在所述运动信息预测残差(152)上不同的多于一种的可能组合映射到一个可能运动信息上。
137.根据权利要求134至136中任一项所述的基于块的视频编码器,被配置为针对所述第一和第二运动向量中的每一个,
通过以下方式,使用相应运动向量获得用于所述预先确定的间预测块的相应初始预测器(4021,4022)
如果所述运动向量具有非零的子像素部分,借助于滤波器内核与相应分块的卷积,使得与所述预先确定的间预测块相比,所述相应分块被加宽了所述滤波器内核的宽度以及n样本宽的扩展,以及
如果所述运动向量具有为零的子像素部分,通过将所述预先确定的间预测块的每个样本设置为所述分块的一个对应样本(164),使得与所述预先确定的间预测块相比,所述分块被加宽了所述n样本宽的扩展,以及
其中,所述双向预测包括双向光流工具,被配置为通过以下方式双向预测地预测所述预先确定的间预测块
局部确定所述初始预测器上的亮度梯度,并组合(436)所述初始预测器,以便以根据所述亮度梯度局部变化的方式得出用于所述间预测块的预测器(438)。
138.一种基于块的视频编码器,被配置为
通过以下方式建立用于当前图像的预先确定的间预测块的运动信息预测候选列表
用一个或多个运动信息预测候选(192)填充所述运动信息预测候选列表,
根据另外的运动信息预测候选中的每一个与所述一个或多个运动信息预测候选的相异性,从所述另外的运动信息预测候选(504)的库(502)中选择预先确定的运动信息预测候选,
用所述预先确定的运动信息预测候选填充所述运动信息预测候选列表,
其中所述选择取决于所述相异性,使得所述运动信息预测候选列表内的相互的运动信息预测候选相异性与使用所述另外的运动信息预测候选之间的相等选择概率执行选择相比增加,
为预先确定的间预测块得出指向所述运动信息预测候选列表的指示器,以及
使用等级从所述运动信息预测候选列表中执行选择以获得用于预先确定的间预测块的运动信息预测。
139.根据权利要求138所述的基于块的视频解码器,其中所述另外的运动信息预测候选(504)的库(502)是基于历史的时间运动信息预测候选列表,并且所述基于块的视频编码器被配置为
通过将最近用于预测先前间预测块的最近使用的运动信息插入其中,来管理所述基于历史的时间运动信息预测候选列表。
140.一种支持运动补偿预测的用于基于块的视频解码的方法,包括:
根据视频(11)被空间划分成的切片(100)之间的边界(102)的位置,从所述视频(11)被编码成的数据流(14)得出用于视频(11)的当前图像(12a)的预先确定的间预测块(104)的运动信息,所述运动信息在参考图像(12b)中定位分块(130),将从所述分块(130)预测所述预先确定的间预测块(104),以及
使用所述运动信息,从所述参考图像(12b)的所述分块(130)预测所述预先确定的间预测块(104)。
141.一种支持运动补偿预测的用于基于块的视频解码的方法,包括:
从视频被编码成的数据流中解码用于所述视频的当前图像的预先确定的间预测块的运动信息(306a、306b),
从所述运动信息得出所述预先确定的间预测块被划分成的子块(300)的每个子块的运动向量(304),所述运动向量指示在相应子块与参考图像(12b)中的分块(302)之间的平移位移,所述相应子块是将要根据所述参考图像来预测的,
通过使用用于相应子块的运动向量预测每个子块,来预测所述预先确定的间预测块,
其中所述用于基于块的视频解码的方法被配置为根据所述视频被空间划分成的切片之间的边界的位置来执行所述得出和/或预测。
142.一种用于基于块的视频解码的方法,包括:
通过以下方式,通过预测建立用于预先确定的间预测块的运动信息预测候选列表
识别参考图像中的与所述预先确定的间预测块空间对齐的对齐块,
识别所述当前图像中的与所述预先确定的间预测块空间相邻的空间相邻块,
通过一个或多个空间运动信息预测候选和时间运动信息预测候选填充所述运动信息预测候选列表,所述一个或多个空间运动信息预测候选是从第一参考运动信息得出的,所述第一参考运动信息已被用于预测所述当前图像中的所述空间相邻块,所述时间运动信息预测候选是从第二参考运动信息得出的,所述第二参考运动信息已被用于预测所述当前图像中的所述对齐块,按照在所述时间运动信息预测候选之前的等级在所述运动信息预测候选列表中定位所述一个或多个空间运动信息预测候选,
为所述预先确定的间预测块得出按等级顺序指向所述运动信息预测候选列表的指示器,
使用所述等级从所述运动信息预测候选列表中执行选择以获得用于预先确定的间预测块的运动信息预测。
143.一种用于基于块的视频解码的方法,包括:
通过以下方式,通过预测建立用于当前图像的预先确定的间预测块的运动信息预测候选列表
识别所述当前图像中的与所述预先确定的间预测块空间相邻的空间相邻块,
通过一个或多个空间运动信息预测候选和基于历史的运动信息预测候选填充所述运动信息预测候选列表,所述一个或多个空间运动信息预测候选是从第一参考运动信息得出的,所述第一参考运动信息已被用于预测所述当前图像中的所述空间相邻块,所述基于历史的运动信息预测候选是从基于历史的时间运动信息预测候选列表得出的,按照在所述基于历史的运动信息预测候选之前的等级在所述运动信息预测候选列表(190)中定位所述一个或多个空间运动信息预测候选,
为所述预先确定的间预测块得出按等级顺序指向所述运动信息预测候选列表的指示器,
使用所述等级从所述运动信息预测候选列表中执行选择以获得用于预先确定的间预测块的运动信息预测。
144.一种支持运动补偿双向预测并且包括用于改进运动补偿双向预测的双向光流工具的用于基于块的视频解码的方法,所述方法包括:
根据当前图像(12a)的预先确定的间预测块的第一和第二分块(1301、1302)中的至少一个是否要进行运动补偿双向预测,停用所述双向光流工具,所述第一和第二分块(1301、1302)根据在用于所述预先确定的间预测块的数据流中用信号通知的第一和第二运动向量而相对于所述预先确定的间预测块发生位移,跨越所述当前图像的组成所述预先确定的间预测块的切片的边界,或者
使用边界填充,以填充要进行所述运动补偿双向预测的当前图像的预先确定的间预测块的第一和第二分块的一部分,所述第一和第二分块根据在用于所述预先确定的间预测块的数据流中用信号通知的第一和第二运动向量而相对于所述预先确定的间预测块发生位移,所述部分位于所述当前图像的组成所述预先确定的间预测块的切片的边界之外。
145.一种用于基于块的视频解码的方法,包括:
通过以下方式建立用于当前图像的预先确定的间预测块的运动信息预测候选列表,
用一个或多个运动信息预测候选(192)填充所述运动信息预测候选列表,
根据另外的运动信息预测候选中的每一个与所述一个或多个运动信息预测候选的相异性,从所述另外的运动信息预测候选(504)的库(502)中选择预先确定的运动信息预测候选,
用所述预先确定的运动信息预测候选填充所述运动信息预测候选列表,
其中所述选择取决于所述相异性,使得所述运动信息预测候选列表内的相互的运动信息预测候选相异性与使用所述另外的运动信息预测候选之间的相等选择概率执行选择相比增加,
为预先确定的间预测块得出指向所述运动信息预测候选列表的指示器,以及
使用等级从所述运动信息预测候选列表中执行选择以获得用于预先确定的间预测块的运动信息预测。
146.一种用于将视频(11)编码成数据流(14)中并支持运动补偿预测的用于基于块的视频编码的方法,包括:
确定用于视频(11)的当前图像(12a)的预先确定的间预测块(104)的运动信息,所述运动信息在参考图像(12b)中定位分块(130),将以使得所述分块(130)在组成所述预先确定的间预测块(104)的切片(100a)的边界(102)内且不跨越所述边界的方式,从所述分块(130)预测所述预先确定的间预测块(104),
使用所述运动信息,从所述参考图像(12b)的所述分块(130)预测所述预先确定的间预测块(104),
将所述运动信息编码到数据流(14)中,使得将根据所述视频(11)被空间划分成的切片(100)之间的边界(102)的位置执行将其信号化到所述数据流(14)中。
147.一种支持运动补偿预测的用于基于块的视频编码的方法,包括:
将用于视频(11)的当前图像(12a)的预先确定的间预测块(104)的运动信息(306a、306b)编码到所述视频(11)被编码成的数据流(14)中,
将用于所述预先确定的间预测块(104)被划分成的子块(300)的每个子块的运动向量(304)发信号通知到所述运动信息中,所述运动向量指示在相应子块与参考图像(12b)中的分块(302)之间的平移位移,所述相应子块是将要根据所述参考图像来预测的,
通过使用用于相应子块的运动向量预测每个子块,来预测所述预先确定的间预测块(104),
其中所述用于基于块的视频编码的方法被配置为根据所述视频(11)被空间划分成的切片之间的边界(102)的位置来执行信号化和/或预测。
148.一种用于基于块的视频编码的方法,包括:
通过以下方式,通过预测建立用于预先确定的间预测块(104)的运动信息预测候选列表
识别参考图像(12b)中的与所述预先确定的间预测块(104)空间对齐的对齐块,
识别所述当前图像(12a)中的与所述预先确定的间预测块(104)空间相邻的空间相邻块,
通过一个或多个空间运动信息预测候选和时间运动信息预测候选填充所述运动信息预测候选列表(190),所述一个或多个空间运动信息预测候选被发信号通知到第一参考运动信息中,所述第一参考运动信息已被用于预测所述当前图像(12a)中的所述空间相邻块,所述时间运动信息预测候选被发信号通知到第二参考运动信息中,所述第二参考运动信息已被用于预测所述当前图像(12a)中的所述对齐块,按照在所述时间运动信息预测候选之前的等级在所述运动信息预测候选列表(190)中定位所述一个或多个空间运动信息预测候选,
为所述预先确定的间预测块(104)发信号通知按等级顺序指向所述运动信息预测候选列表的指示器(193),
使用所述等级从所述运动信息预测候选列表(190)中执行选择以获得用于预先确定的间预测块(104)的运动信息预测。
149.一种用于基于块的视频编码的方法,包括:
通过以下方式,通过预测建立用于当前图像(12a)的预先确定的间预测块(104)的运动信息预测候选列表
识别所述当前图像(12a)中的与所述预先确定的间预测块(104)空间相邻的空间相邻块,
通过一个或多个空间运动信息预测候选和基于历史的运动信息预测候选填充所述运动信息预测候选列表(190),所述一个或多个空间运动信息预测候选被发信号通知到第一参考运动信息中,所述第一参考运动信息已被用于预测所述当前图像(12a)中的所述空间相邻块,所述基于历史的运动信息预测候选被发信号通知到基于历史的时间运动信息预测候选列表中,按照在所述基于历史的运动信息预测候选之前的等级在所述运动信息预测候选列表(190)中定位所述一个或多个空间运动信息预测候选,
为所述预先确定的间预测块(104)发信号通知按等级顺序指向所述运动信息预测候选列表(190)的指示器(193),
使用所述等级从所述运动信息预测候选列表(190)中执行选择以获得用于预先确定的间预测块(104)的运动信息预测。
150.一种支持运动补偿双向预测并包括用于改进所述运动补偿双向预测的双向光流工具的用于基于块的视频编码的方法,所述方法包括:
根据当前图像(12a)的预先确定的间预测块(104)的第一和第二分块(1301、1302)中的至少一个是否要进行运动补偿双向预测,停用所述双向光流工具,所述第一和第二分块(1301、1302)根据在用于所述预先确定的间预测块(104)的数据流(14)中用信号通知的第一和第二运动向量而相对于所述预先确定的间预测块(104)发生位移,跨越所述视频(11)被空间划分成的切片之间的边界(102),或者
使用边界填充,以填充要进行所述运动补偿双向预测的当前图像的预先确定的间预测块(104)的第一和第二分块的一部分,所述第一和第二分块根据在用于所述预先确定的间预测块(104)的数据流(14)中用信号通知的第一和第二运动向量而相对于所述预先确定的间预测块(104)发生位移,所述部分位于所述当前图像的组成所述预先确定的间预测块的切片的边界(102)之外。
151.一种用于基于块的视频编码的方法,包括:
通过以下方式建立用于当前图像的预先确定的间预测块的运动信息预测候选列表
用一个或多个运动信息预测候选(192)填充所述运动信息预测候选列表,
根据另外的运动信息预测候选中的每一个与所述一个或多个运动信息预测候选的相异性,从所述另外的运动信息预测候选(504)的库(502)中选择预先确定的运动信息预测候选,
用所述预先确定的运动信息预测候选填充所述运动信息预测候选列表,
其中所述选择取决于所述相异性,使得所述运动信息预测候选列表内的相互运动信息预测候选相异性与使用所述另外的运动信息预测候选之间的相等选择概率执行选择相比增加,
为所述预先确定的间预测块得出指向所述运动信息预测候选列表的指示器,以及
使用等级从所述运动信息预测候选列表中执行选择以获得用于预先确定的间预测块的运动信息预测。
152.一种通过根据权利要求146至151中任一项所述的方法编码的数据流。
153.一种具有程序代码的计算机程序,当所述程序在一台或几台计算机上运行时,所述程序代码用于执行根据权利要求140至151中任一项所述的方法。
CN201980090352.1A 2018-11-26 2019-11-25 使用切片独立约束的间预测概念 Pending CN113366834A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP18208418.6 2018-11-26
EP18208418 2018-11-26
PCT/EP2019/082435 WO2020109234A2 (en) 2018-11-26 2019-11-25 Inter-prediction concept using tile-independency constraints

Publications (1)

Publication Number Publication Date
CN113366834A true CN113366834A (zh) 2021-09-07

Family

ID=64477072

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980090352.1A Pending CN113366834A (zh) 2018-11-26 2019-11-25 使用切片独立约束的间预测概念

Country Status (8)

Country Link
US (1) US20210281855A1 (zh)
EP (1) EP3888356A2 (zh)
JP (2) JP7312826B2 (zh)
KR (3) KR20240129078A (zh)
CN (1) CN113366834A (zh)
BR (1) BR112021010054A2 (zh)
MX (1) MX2021006014A (zh)
WO (1) WO2020109234A2 (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113728651B (zh) * 2019-04-02 2022-10-25 北京字节跳动网络技术有限公司 视频处理中的自适应环路滤波
WO2020211867A1 (en) 2019-04-19 2020-10-22 Beijing Bytedance Network Technology Co., Ltd. Delta motion vector in prediction refinement with optical flow process
JP7319386B2 (ja) 2019-04-19 2023-08-01 北京字節跳動網絡技術有限公司 異なる動きベクトル微調整における勾配計算
CN113711608B (zh) 2019-04-19 2023-09-01 北京字节跳动网络技术有限公司 利用光流的预测细化过程的适用性
CN114979627A (zh) * 2021-02-24 2022-08-30 华为技术有限公司 视频编码中的运动矢量(mv)约束和变换约束
WO2023022543A1 (ko) * 2021-08-18 2023-02-23 엘지전자 주식회사 채널간 상관도에 기반한 피쳐 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체
WO2023066672A1 (en) * 2021-10-21 2023-04-27 Nokia Technologies Oy Video coding using parallel units
US12095984B2 (en) * 2022-02-07 2024-09-17 Tencent America LLC Sub-block based constraint on bi-prediction for out-of-boundary conditions

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009115901A2 (en) * 2008-03-19 2009-09-24 Nokia Corporation Combined motion vector and reference index prediction for video coding
CN101627634A (zh) * 2006-10-16 2010-01-13 诺基亚公司 用于将可并行解码片用于多视点视频编码的系统和方法
WO2011054879A2 (en) * 2009-11-06 2011-05-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Hybrid video coding
US20140119671A1 (en) * 2011-08-25 2014-05-01 Panasonic Corporation Methods and apparatuses for encoding, extracting and decoding video using tiles coding scheme
WO2014166964A1 (en) * 2013-04-08 2014-10-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Coding concept allowing efficient multi-view/layer coding
WO2015031891A2 (en) * 2013-08-30 2015-03-05 ARRIS Enterprises, Inc Multipass encoder with heterogeneous codecs
US20180270287A1 (en) * 2017-03-20 2018-09-20 Canon Kabushiki Kaisha Method and apparatus for encoding and transmitting at least a spatial part of a video sequence
WO2018210315A1 (en) * 2017-05-18 2018-11-22 Mediatek Inc. Method and apparatus of motion vector constraint for video coding

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5115498B2 (ja) 2009-03-05 2013-01-09 富士通株式会社 画像符号化装置、画像符号化制御方法およびプログラム
US9319716B2 (en) * 2011-01-27 2016-04-19 Qualcomm Incorporated Performing motion vector prediction for video coding
US9749627B2 (en) 2013-04-08 2017-08-29 Microsoft Technology Licensing, Llc Control data for motion-constrained tile set
JP2015082839A (ja) 2013-10-22 2015-04-27 パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America 動き補償方法、画像符号化方法、画像復号方法、画像符号化装置及び画像復号装置
CN116567216A (zh) * 2016-08-11 2023-08-08 Lx 半导体科技有限公司 图像编码/解码方法以及图像数据的发送方法
US10448010B2 (en) * 2016-10-05 2019-10-15 Qualcomm Incorporated Motion vector prediction for affine motion models in video coding
JP2020145484A (ja) 2017-06-28 2020-09-10 シャープ株式会社 動画像符号化装置及び動画像復号装置

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101627634A (zh) * 2006-10-16 2010-01-13 诺基亚公司 用于将可并行解码片用于多视点视频编码的系统和方法
WO2009115901A2 (en) * 2008-03-19 2009-09-24 Nokia Corporation Combined motion vector and reference index prediction for video coding
WO2011054879A2 (en) * 2009-11-06 2011-05-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Hybrid video coding
US20140119671A1 (en) * 2011-08-25 2014-05-01 Panasonic Corporation Methods and apparatuses for encoding, extracting and decoding video using tiles coding scheme
WO2014166964A1 (en) * 2013-04-08 2014-10-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Coding concept allowing efficient multi-view/layer coding
CN105308968A (zh) * 2013-04-08 2016-02-03 Ge视频压缩有限责任公司 允许有效多视图/层编码的编码概念
US20160057441A1 (en) * 2013-04-08 2016-02-25 Ge Video Compression, Llc Coding concept allowing efficient multi-view/layer coding
WO2015031891A2 (en) * 2013-08-30 2015-03-05 ARRIS Enterprises, Inc Multipass encoder with heterogeneous codecs
US20180270287A1 (en) * 2017-03-20 2018-09-20 Canon Kabushiki Kaisha Method and apparatus for encoding and transmitting at least a spatial part of a video sequence
WO2018210315A1 (en) * 2017-05-18 2018-11-22 Mediatek Inc. Method and apparatus of motion vector constraint for video coding

Also Published As

Publication number Publication date
KR102696385B1 (ko) 2024-08-20
US20210281855A1 (en) 2021-09-09
WO2020109234A3 (en) 2020-08-06
KR20240011246A (ko) 2024-01-25
JP2022509972A (ja) 2022-01-25
JP2023126972A (ja) 2023-09-12
WO2020109234A2 (en) 2020-06-04
JP7312826B2 (ja) 2023-07-21
KR102625314B1 (ko) 2024-01-15
EP3888356A2 (en) 2021-10-06
MX2021006014A (es) 2021-08-24
BR112021010054A2 (pt) 2021-08-17
KR20240129078A (ko) 2024-08-27
KR20210100123A (ko) 2021-08-13

Similar Documents

Publication Publication Date Title
US20230135855A1 (en) Method and apparatus for processing a video signal
JP7507166B2 (ja) デコーダ側動きベクトル改良に対する制約
CN113366834A (zh) 使用切片独立约束的间预测概念
KR102356262B1 (ko) 모션 보상을 이용하는 비디오 신호 처리 방법 및 장치
CN116320493A (zh) 用于滤波的方法和装置
TW201743619A (zh) 在視訊寫碼中適應性迴路濾波中之多個濾波器之混淆
US11233989B2 (en) Apparatus for selecting an intra-prediction mode for padding
KR20160110961A (ko) 비대칭 구획을 갖는 인트라 블록 카피 예측 및 인코더측 검색 패턴, 검색 범위 및 구획화 접근법
CN114402608A (zh) 视频编解码中bdof和dmvr的协调早期终止
KR20240136982A (ko) 경계 밖 블록을 이용하는 비디오 신호 처리 방법 및 이를 위한 장치
CN118511516A (zh) 使用块向量预测器精细化的视频压缩

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40060569

Country of ref document: HK