CN102484711B9

CN102484711B9 - 指向覆盖多个参考图像分区的参考区域的当前图像分区的移动向量的预测、以及使用一个这种预测的编码和解码

Info

Publication number: CN102484711B9
Application number: CN201080039103.9A
Authority: CN
Inventors: J.琼; G.拉罗什; J-M.西塞
Original assignee: France Telecom SA
Current assignee: Orange SA
Priority date: 2009-07-03
Filing date: 2010-06-25
Publication date: 2018-08-24
Anticipated expiration: 2030-06-25
Also published as: BR112012000002B1; ES2870969T3; EP2449783A1; ZA201200839B; RU2012103557A; EP3852371A1; WO2011001077A1; RU2520425C2; CN102484711A; CN102484711B; US20120121021A1; US9185425B2; BR112012000002A2; EP2449783B1; EP3852371B1

Abstract

本发明涉及一种用于与参考分区(Pr′1、Pr′2、…、Pr′p)的移动向量相关地预测当前图像分区(P1、P2、…、Pp)的移动向量的方法，所述参考分区(Pr′1、Pr′2、…、Pr′p)与所述当前分区具有相同的形式并且属于参考图像(I_N-1)，所述参考图像(I_N-1)不同于当前图像(I_N)并且在编码和随后的解码之后、已经被预切割为多个n个分区(r′1、r′2、…、r′n)。一个这种方法的特征在于：当所述参考分区覆盖了来自所述多个n个参考图像分区之中的k个参考分区的集合时，其中k≤n，根据属于与k个覆盖的参考分区分别相关联的k个参考移动向量的集合的至少一个参考移动向量的函数，来确定当前分区图像的所述移动向量。

Description

指向覆盖多个参考图像分区的参考区域的当前图像分区的移动向量的预测、以及使用一个这种预测的编码和解码

技术领域

本发明一般地属于图像处理的领域，且更精确地，属于数字图像的和数字图像序列的基于竞争的编码和解码。

背景技术

存在若干种编码和解码方法，以用于传送图像。在主要的编码类型之中，具体地是诸如所谓的“帧内(intra)”编码、亦或所谓的“帧间(inter)”编码之类的那些编码，在该所谓的“帧内”编码中，按照自治的方式(即，无需参考其它图像)来对图像进行编码，所谓的“帧间”编码在于：相对于过去的图像来对当前图像进行编码，从而表达这些图像之间的差异，并且仅仅传送此差异。

用于前述类型的编码的方法一般包括预测性编码的步骤，根据该预测性编码，当前图像的图像部分(叫做块或宏块)被相对于其它参考块或宏块(即，预先编码并然后解码的其它参考块或宏块)来进行预测。

在例如H264/MPEG-4AVC(代表了“高级视频编码”)标准的情况下，宏块的预测性编码在于，根据一般具有较小尺寸的块的形状的多个分区 (partition)来对宏块进行分割。

更精确地，在根据前述标准的帧间编码的情况下，可以根据16x16、 8x16、16x8和8x8模式来对要编码的当前宏块进行分区。如果选择了8x8模式，则根据8x8、4x8、8x4和4x4模式来对每个8x8块进行再次分区。将每个当前块与一个或多个参考图像的相应的一个或多个块进行比较。然后，获得运动向量，该运动向量描述当前块和在先前图像中的与当前宏块具有相同的位置的参考块之间的运动。然后，计算此运动向量的预测器，从而对前述的运动向量与计算的预测器运动向量之间的残差进行编码。

运动向量的这种预测不适于所有类型的分区，且尤其地，不适用于在参考宏块与参考图像的若干个参考分区重叠的情况下。在图1A中表现了这种情形，该图1A图示了用于要根据前述标准来编码的图像N的、要编码的当前宏块(被表示为MBC_N)的时间预测的情况。在所表现的示例中，这种宏块MBC_N具有正方形形状并且具有4×4类型。宏块MBC_N被其他宏块BR1、 BR2、BR3、BR4所包围，所述其他宏块BR1、BR2、BR3、BR4位于最靠近于后者的邻域中并且具有与宏块MBC_N的形状和大小相同的形状和大小。

在所表现的示例中，当前宏块MBC_N的运动向量(被表示为MV)指向被表示为N-1的参考图像(其例如是先前图像)的参考宏块MBC_N-1处。在先前图像N-1中，参考宏块MBC_N-1与当前宏块MBC_N具有相同的位置。参考宏块MBC_N-1的具体特性在于，它与已经编码并然后解码的参考分区(在图 1A中被表示为BR'1、BR'2、BR'3和BR'4)重叠。

在H264/AVC标准的应用中，仅仅在空间上预测前述的运动向量MV。更精确地，采取参考运动向量的计算，该参考运动向量等于与参考宏块BR1、 BR3、BR4分别相关联的运动向量MV1、MV3、MV4的中间值。在某些情形下，与参考宏块BR2相关联的运动向量MV2可以用于取代向量MV1、 MV3、MV4之一。

而且，最近已经出现了要编码的当前宏块的新类型的分区，该分区还没有提供在H264/AVC标准中。因而，如图1B所表现的，可以将要编码的当前宏块MBC_N分割为线性形状的、L形状的、亦或完全任意形状的几个分区 P1到Pp。

H264/AVC标准没有提供用于适用于图1B的各种类型分区的、以及适用于如下特定情况的任何预测，在所述情况中，如此分区的参考宏块与参考图像的若干个分区重叠。将这种情形表现在图1C中，该图1C图示了用于要根据前述标准来编码的图像N的、要编码的当前宏块(被表示为MBC_N)的时间预测的情况。在所表现的示例中，根据具有任意几何形状的三个较小分区 P1、P2、P3来分割这种宏块MBC_N。

在所表现的示例中，当前宏块MBC_N的第一分区P1的运动向量(被表示为MVp1)指向在先前图像N-1中与当前宏块MBC_N具有相同位置的参考图像N-1的参考宏块MBC_N-1的分区P'1处。参考宏块MBC_N-1的特定特性在于，它与已经编码并然后解码的参考分区(在图1C中被表示为BR'1、BR'2、 BR'3和BR'4)重叠。

在H264/AVC标准的应用中，为了预测前述运动向量MVp1，采取参考运动向量的计算，该参考运动向量一般等于与参考宏块BR1、BR3、BR4分别相关联的运动向量MV1、M3、MV4的空间中间值。

在顾及以下事实(该事实即，在图像N-1中，在参考分区P'1与参考宏块BR'1、BR'2、BR'3和BR'4之间存在形状上和尺寸上的差异)的情况下，运动向量的这种空间预测可能结果是缺少精确度。

而且，已知用于着眼于对当前宏块的分区进行帧间编码而计算预测器运动向量的其他方案。

所述其他方案之一描述在G Laroche,J.Jung和B.Pesquet-Popescu的公开 IEEE Transactions on Circuits and System for Video Technology，第18卷， 1247-1257(2008年九月)中，并且涉及以下情况，其中如在H264/AVC标准中一样，根据一般具有较小尺寸的块的形状的多个分区来对宏块进行分割。根据此方案，相对于参考向量来预测当前图像的宏块的运动向量，该参考向量被选定为以下向量，所述向量指向在先前图像中位于与当前宏块具有相同位置的宏块的顶部且在左边最远处的像素处。

如果我们试图将后者方案应用于图1A的向量MV的预测或者应用于图 1C的向量MVp1的预测，则将基于等于运动向量MV'2(其与参考宏块BR'2 相关联)的参考运动向量来获得向量MV和MVp1中的每一个，参考宏块 MBC_N-1的左边最远的像素位于运动向量MV'2与之相关联的参考宏块BR'2 中。

由于与上述原因相同的原因，所以利用这种方案所获得的运动向量预测也缺少精确度。

发明内容

本发明的目标之一在于补救前述现有技术的缺点。

为了此目的，根据第一方面，本发明涉及一种用于相对于与参考图像的 n个参考分区中的参考分区相关联的至少一个参考运动向量来预测当前图像分区的当前运动向量的方法，所述当前运动向量描述该当前图像分区和对应的参考分区之间的运动，在参考图像中该对应的参考分区与所述当前图像分区具有相同的形状和相同的位置，所述参考图像不同于当前图像并且在完成跟随有解码的编码时、已经被预先地分割为该n个参考分区。

根据本发明：在其中所述对应的参考分区与来自该参考图像的所述n个参考分区之中的k个参考分区的集合重叠的情况下，其中k≤n，基于属于与 k个重叠的参考分区分别相关联的k个参考运动向量的集合的至少一个参考运动向量的函数，来确定当前图像分区的所述当前运动向量，其中确定当前图像分区的所述当前运动向量包含：

-选择与所述k个参考分区的集合重叠的该对应的参考分区的特定点，以及

-选择与包含所选择的特定点的重叠的参考分区相关联的所述至少一个参考运动向量。

通过考虑以下情况，因而，这种安排使得可能显著地改善预测的精确度：

-当前宏块或参考宏块的特定分区，

-单独被参数分区重叠的区域。

而且，根据本发明的预测可适于任何类型的用于计算当前分区的预测的运动向量的方案，诸如具体地，根据H264/AVC标准的方案和在前述的IEEE 公开中描述的方案。

在一个实施例中，该确定当前分区的运动向量的步骤包括以下步骤：

-计算在该对应的参考分区与分别地k个重叠的参考分区之间共享的公共像素的数目，

-基于预定的比较准则，来比较计算出的在k个重叠的参考分区之间共享的公共像素的数目。

因而，这种安排使得可能基于某种特征来选择非常精确的参考运动向量，所述特征在此是基于在参考分区与重叠的参考分区之间共享的公共像素数量。

根据第一变体，该比较准则包含：从与k个重叠的参考分区分别相关联的k个参考运动向量之中，选择与如下的参考分区相关联的参考运动向量，该参考分区的计算出的公共像素的数目为最大。

根据第二变体，该比较准则包含：通过计算出的公共像素的数目，来对与k个重叠的参考分区分别相关联的k个参考运动向量的均值进行加权。

根据第三变体，该比较准则包含：从与k个重叠的参考分区分别相关联的k个参考运动向量之中，选择与如下的重叠的参考分区相关联的参考运动向量，相比于在所述对应的参考分区外部，所述重叠的参考分区在所述对应的参考分区内部具有大多数的像素。

在另一实施例中，该确定当前分区的运动向量的步骤包括以下步骤：

-对于k个重叠的参考分区中的每一个，计算取决于所述对应的参考分区的空间梯度的系数，

-选择其计算值为最高的系数，

-选择与已选择了其系数的重叠的参考分区对应的参考运动向量。

因而，这种安排使得可能基于某种特征来选择非常精确的参考运动向量，所述特征在此是基于表达了参考运动向量的选定中的置信度的系数的计算，所述参考运动向量被假定为相比于在均质性的图像的区域中，在包含不连续性的图像的区域中更加精确。

根据一变体，该确定当前分区的运动向量的步骤包括以下步骤：

-计算与k个重叠的参考分区分别相关联的k个参考运动向量的均值，所述均值通过所述k个计算出的系数来进行加权。

因而，这种安排使得可能基于某种特征来选择非常精确的参考运动向量，所述特征在此是基于参考分区相对于所述k个重叠的参考分区的定位的估计。

-在对应的参考分区中，标识与图像的内容相关的特征，

-选择与包含所述特征的重叠的参考分区相关联的参考运动向量。

因而，这种安排使得可能基于某种特征来选择非常精确的参考运动向量，所述特征在此是基于在参考分区中图案、颜色、轮廓等的标识。

根据第二方面，本发明涉及一种用于对图像或图像的序列进行编码、以生成数据流的方法，所述数据流包括表现了至少一个图像分区的数据，这种方法包括预测所述图像分区的运动向量的步骤。

根据本发明，根据前述预测方法来执行这种编码方法的预测步骤。

根据第三方面，本发明涉及一种用于对数据流进行解码的方法，该数据流表现了图像或图像的序列，所述流包括表现了至少一个图像分区的数据，这种方法包括预测所述图像分区的运动向量的步骤。

根据本发明，根据前述预测方法来执行这种解码方法的预测步骤。

有关联地，根据第四方面，本发明涉及一种用于相对于与参考图像的n 个参考分区中的参考分区相关联的至少一个参考运动向量来预测当前图像分区的当前运动向量的装置，所述当前运动向量描述该当前图像分区和对应的参考分区之间的运动，在参考图像中该对应的参考分区与所述当前图像分区具有相同的形状和相同的位置，所述参考图像不同于当前图像并且在完成跟随有解码的编码时、已经被预先地分割为该n个参考分区。

根据本发明，在其中所述对应的参考分区与来自该参考图像的所述n个参考分区之中的k个参考分区的集合重叠的情况下，其中k≤n，该预测装置包括计算模块，能够基于属于与k个重叠的参考分区分别相关联的k个参考运动向量的集合的至少一个参考运动向量的函数，来确定当前图像分区的所述当前运动向量，其中该计算模块被配置为通过以下来确定当前分区的当前运动向量：

-选择与包含所选择的特定点的重叠的参考分区(r'2)相关联的所述至少一个参考运动向量。

有关联地，根据第五方面，本发明涉及一种用于对图像或图像的序列进行编码、以生成数据流的装置，所述数据流包括表现了至少一个图像分区的数据，这种装置包括用于预测所述图像分区的运动向量的部件。

根据本发明，这种编码装置的用于预测所述图像分区的运动向量的部件是上述的装置。

有关联地，根据第六方面，本发明涉及一种用于对数据流进行解码的解码装置，该数据流表现了图像或图像的序列，所述流包括表现了至少一个图像分区的数据，这种装置包括用于预测所述图像分区的运动向量的部件。

根据本发明，这种解码装置的用于预测所述图像分区的运动向量的部件是上述的装置。

所述编码方法、所述解码方法、所述预测装置、所述编码装置和所述解码装置至少呈现出与根据本发明的预测方法所赋予的那些优点相同的优点。

附图说明

一旦阅读了参考附图所描述的优选实施例，其他特征和优点就将变得明显，在附图中：

-图1A表现了现有技术的示范时间预测，其利用了图像N的要编码的当前宏块与先前图像N-1的参考宏块之间的时间相关性，该参考宏块具有正方形形状，并且与若干个邻居参考宏块重叠，

-图1B表现了根据现有技术的各种类型的分区的宏块分割，

-图1C表现了现有技术的示范时间预测，其利用了图像N的要编码的当前宏块与先前图像N-1的参考宏块之间的时间相关性，该参考宏块被根据任意形状的若干个分区来进行分割，并且与若干个邻居参考宏块重叠，

-图2表现了根据本发明的编码方法的步骤，

-图3表现了根据本发明的编码装置的实施例，

-图4表现了根据本发明的示范时间预测，其利用了当前图像的要编码的当前宏块与先前图像的参考宏块之间的时间相关性，

-图5表现了根据本发明的解码装置，

-图6表现了根据本发明的解码方法的步骤。

具体实施方式

现在，将描述本发明的实施例，其中根据本发明的编码方法用于根据二进制流来对图像的序列进行帧间编码，该二进制流与经由根据H.264/MPEG-4 AVC标准的编码所获得的二进制流非常相像。在此实施例中，例如，通过修改初始地符合H.264/MPEG-4AVC标准的编码器，而按照软件或硬件方式来实现根据本发明的编码方法。按照包括在图2中表现的步骤C0到C7的算法的形式来表现根据本发明的编码方法。

在图3所表现的编码装置CO中实现根据本发明的编码方法。

在图2中表现的第一步骤C0是对于属于在图3中表示为I_N的要编码的图像的序列的图像的宏块，选择与此宏块相关联的特定分区。

应该注意到，步骤C0是可选的，可能通过在整体上考虑当前宏块(即，将当前宏块考虑为一个单一分区)来执行该当前宏块的运动向量的预测。

在步骤C0的过程中，例如，将4x4尺寸的且属于图像I_N的宏块MB_N作为输入而应用于在图3中表现的分区选择模块SP。

此分区模块SP例如使用用于通过穷举竞争来进行选定的方案，亦或使用用于借助于具有先验的算法来进行选定的方案。这种方案对于本领域技术人员是公知的(参见：G.J.Sullivan和T.Wiegand,"Rate-distortion optimization for video compression",IEEE Signal Proc.Mag.,第74-90页,1998年)。因此，在下文中将不描述它们。

在编码器CO的数据库BD中将各种类型的可能的分区算法分组到一起。它们使得可能获得当前宏块到矩形或正方形形状的、或者其他几何形状(诸如，实质上线性形状)的、或完全任意形状的多个分区中的分割。

在所表现的示例中，选择模块SP选择任意类型的分区。

在图2中表现的接下来的步骤C1是将宏块MB_N分割为多个p个要预测的分区。

例如，将宏块MB_N分割为任意形状的三个分区P1、P2和P3。通过图3 所表现的宏块分区模块PMBCO来执行这种分割，该宏块分区模块PMBCO 使用传统的分区算法。

图4表现了已经在这种分区之后获得的宏块MB_N。

在分区步骤C1之后，在图2所表现的步骤C2的过程中，分区模块 PMBCO将刚刚已经分区的宏块MB_N传送到图3所表现的预测模块PREDCO。

在传统的方式中，这种预测模块PREDCO意欲预测相对于已经编码并然后解码的参考宏块(在图4中表示为MBr_N-1)所分区的当前宏块MB_N，所述参考宏块在先前图像I_N-1中与当前宏块MB_N具有相同的位置，所述先前图像 I_N-1已经在完成跟随有解码的编码时被预先地分割为多个n个分区r'1、r'2、…、 r'n。

根据本发明，参考宏块MBr_N-1与k个参考分区r'1、r'2、…、r'k的集合重叠，其中k≤n。在所表现的示例中，参考宏块MBr_N-1与四个参考分区r'1、 r'2、r'3和r'4部分地重叠。无需赘述的是，在其它可能的实施方式中，参考宏块MBr_N-1可以与参考分区r'1、r'2、r'3和r'4中的一个或多个完全重叠。

参考图3，根据H.264/MPEG-4AVC标准来编码这种参考宏块MBr_N-1，即，它按照本身已知的方式来经历：

-通过离散余弦变换和量化进行的编码，这是通过变换和量化模块 TQCO来执行的，

-和然后的通过逆离散余弦变换和逆量化进行的解码，这是通过逆变换和量化模块TQICO来执行的。

仍然参考图3，根据本发明，预测模块PREDCO包括：

-分区模块PMB，意欲根据多个参考分区来分割参考宏块MBr_N-1，-计算模块CAL，意欲基于属于k个参考运动向量MVr'1、MVr'2、…、MVr'k(其分别与k个重叠的参考分区r1'、r'2、…r'k相关联)的集合的至少一个参考运动向量的函数，来计算与当前宏块MB_N的分区P1、P2、…、Pp分别相关联的每个运动向量MVp1、MVp2、…、MVpp。

在图2所表现的步骤C3的过程中，图3的分区模块PMB经历根据p个参考分区的参考宏块MBr_N-1的分割。在图4所表现的示例中，按照与当前宏块MB_N一致的方式(即，根据全都具有不同形状和尺寸的三个分区Pr'1、Pr'2 和Pr'3)来分割参考宏块MBr_N-1。

在图2所表现的步骤C4的过程中，图3的计算模块CAL按照根据本发明的在下文中描述的各种方案，来对于每个当前分区P1、P2和P3，计算与其相关联的预测的运动向量MVp1、MVp2和MVp3。

根据第一方案，模块CAL作为与在图4中表现的四个重叠的参考分区 r'1、r'2、r'3和r'4分别相关联的参考运动向量MVr'1、MVr'2、MVr'3和MVr'4 的函数，来确定预测的当前分区P1的运动向量MVp1。这种确定例如在于：根据在下文中的等式来计算参考运动向量MVr'1、MVr'2、MVr'3和MVr'4的均值。

MVp1＝Moy(MVr'1,MVr'2,MVr'3,MVr'4)

根据第二方案，参考图4，模块CAL将预测的运动向量MVp1确定为等于与如下的重叠的参考分区相关联的参考运动向量，该重叠的参考分区具有与参考宏块MBr_N-1的参考分区Pr'1公共的像素的最大数目。

在图4所表现的示例中，MVp1＝MVr'2。

根据此第二方案的第一变体，模块CAL将预测的运动向量MVp1确定为等于与如下的重叠的参考分区相关联的参考运动向量，该重叠的参考分区具有与参考宏块MBr_N-1的参考分区Pr'1公共的像素的最大百分比。

在图4所表现的示例中，MVp1＝MVr'2。

根据此第二方案的第二变体，模块CAL确定参考运动向量MVr'1、MVr'2、 MVr'3和MVr'4的均值，该均值通过在宏块MBr_N-1的参考分区Pr'1与重叠的参考分区r'1、r'2、r'3和r'4中的每一个之间共享的像素的公共数目来进行加权。这种确定相当于：根据在下文中的等式来计算预测的运动向量MVp1。

其中：

-K＝4，

-T表现了构成参考宏块MBr_N-1的像素的数目，

-[pr'1∩r'_k]表现了在宏块MBr_N-1的参考分区Pr'1与重叠的参考分区r'1、 r'2、r'3和r'4中的每一个之间共享的像素的公共数目。

在图4所表现的示例中，MVp1＝MVr'2。

通过替换方案的方式，前述均值可以通过公共像素的数目减去非公共像素的数目来进行加权。

另一替换方案在于：通过在参考宏块MBr_N-1的分区Pr'1与参考分区r'1、 r'2、r'3和r'4中的每一个之间公共的像素的百分比来对均值进行加权。

又一替换方案是，将预测的运动向量MVp1确定为等于与如下的重叠的参考分区相关联的参考运动向量，相比于在Pr'1外部，所述重叠的参考分区在Pr'1内部具有大多数的像素。

根据第三方案，参考图4，计算模块CAL：

-对于k个重叠的参考分区r'1、r'2、r'3、r'4中的每一个，确定取决于所述参考分区Pr'1的空间梯度g的系数C_k(其中k＝4)，

-根据在下文中的等式，来选择其计算值为最高的系数C_j(其中1≤j≤ k)：

该第三方案提出了第一替换方案，根据该第一替换方案，计算模块CAL 将预测的运动向量MVp1确定为等于与如下的重叠的参考分区相关联的参考运动向量，所述重叠的参考分区对应于计算出的系数C_j。

该第三方案提出了第二替换方案，根据该第二替换方案，计算模块CAL 将预测的运动向量MVp1确定为等于与通过计算出的系数C₁、C₂、C₃、C₄ 来加权的参考运动向量MVr'1、MVr'2、MVr'3和MVr'4的均值。

根据第四方案，参考图4，计算模块CAL首先标识参考分区Pr'1的特定点，例如参考分区Pr'1的中心，该中心被表示为CTr'1。借助于使得相对于参考分区Pr'1的所有点的距离的总和最小化的算法，来计算中心CTr'1。

其次，计算模块CAL将预测的运动向量MVp1确定为等于与如下的重叠的参考分区相关联的参考运动向量，所述重叠的参考分区包含选择的特定点(即，中心CTr'1)。在所表现的示例中，它是包含中心CTr'1的参考分区 r'2，并因此，MVp1＝MVr'2。

根据第五方案，参考图4，计算模块CAL首先在参考分区Pr'1中标识与图像的内容相关的特定特征。在所表现的示例中，通过在图像I_N-1中嵌入的十字形(被表示为Clr'1)来图示这种特征。

其次，计算模块CAL将预测的运动向量MVp1确定为与如下的重叠的参考分区相关联的参考运动向量，所述重叠的参考分区包含选择的特征(即，十字形Clr'1)。在所表现的示例中，它是包含十字形Clr'1的参考分区r'1，并因此，MVp1＝MVr'1。

通过对于此第五方案的替换方案，与图像的内容相关的特征可以是特定的颜色、特定的图案、与参考分区Pr'1交叉的轮廓、或者了破坏后者的均质性的其它特定的图像特性。

在依照根据本发明的前述方案中的这个或那个方案来完成计算步骤C4 时，预测计算模块PREDCO然后传递第一预测的向量MVp1，在其中编码器 CO将该第一预测的向量MVp1保持为最优运动向量类型的情况下，通过变换和量化模块TQCO来对该第一预测的向量MVp1立即进行编码，并然后通过逆变换和量化模块TQICO来对它进行解码，所述模块表现在图3中。

其后，重复前述步骤C4，从而预测与当前宏块MB_N的分区P2和P3分别相关联的其他运动向量MVp2和MVp3。

一旦预测计算模块PREDCO已经计算出各种可能的预测，在图2所表现的步骤C5的过程中，图3所表现的决定模块DCNCO就遍历分区的图像I_N 的宏块，并且在此步骤C5中，选定用于对这些宏块中的每一个进行编码的预测的模式。从用于宏块的可能预测之中，决定模块DCNCO根据本领域技术人员公知的失真率准则来选定最优的预测。

参考图2，如在H.264/MPEG-4AVC标准中一样，在步骤C6的过程中，对每个预测的宏块进行编码。

参考图3，一旦决定模块DCNCO已经执行了此结构编码，就将与图像 I_N的块对应的残差(如果它们存在的话)的系数分派到变换和量化模块 TQCO，以经历离散余弦变换，该离散余弦变换之后跟随有量化。其后，将具有这些量化系数的宏块的切片传送到所表现的熵编码模块CE，从而利用已经按照与图像I_N相同的方式而编码的视频序列的其他图像来产生根据本发明所编码的二进制视频流F。

通过通信网络来将如此编码的二进制流F传送到远程终端。该远程终端包括图5所表现的、根据本发明的解码器DO。

首先，将二进制流F分派到熵解码模块DE，该解码与在图3中表现的熵编码模块CE所执行的编码相逆。接下来，对于要重构的每个图像宏块，将模块DE所解码的系数分派到逆量化和逆变换模块QTIDO。

然后，图像重构模块RI将与模块DCNCO(图3)在根据本发明的编码步骤C5中产生的数据对应的解码数据接收在传送误差内。模块RI实现根据本发明的解码方法的、诸如图6所表现的步骤D0到D6。同样，通过修改初始地符合H.264/MPEG-4AVC标准的解码器，而按照软件或硬件方式来实现根据本发明的这种解码方法。

第一步骤D0是对在要解码的图像I_N的当前宏块的切片中编码的数据结构进行解码。按照本身已知的方式，重构模块RI基于所述宏块切片的数据来确定：

-所述数据的编码的类型，帧内或帧间：根据本发明的帧间，

-要重构的宏块的分区的类型，帧间4x4、8x8、线条等…：在所描述的实施例中的帧间4x4，

-诸如决定模块DCNCO在前述步骤C5中选择的最优预测器的索引。

在图6中表现的接下来的步骤D1是根据在步骤D0中所确定的分区来分割要解码的当前宏块。为此目的，参考图5，在所有方面类似于图3所表现的分区模块的宏块分区模块PMBDO将宏块分割为多个p个分区，即，在所表现的示例中的任意形状的三个分区。

在图6所表现的步骤D2的过程中，分区模块PMBDO将要解码的并且刚刚已经分区为p＝3个分区的当前宏块传送到图5所表现的预测模块 PREDDO，该预测模块PREDDO在所有方面类似于图3的编码器CO的预测模块PREDCO，并且为此原因，所以将不再详细地进行描述。

在图6所表现的步骤D3和D4的过程中，图5的预测模块PREDDO执行与前述编码器CO的预测模块PREDCO所执行的算法相同的算法，从而获得当前宏块，已经根据在上文中描述的方案中的这个或那个方案来预测了该当前宏块的相关联的运动向量。

在步骤D5的过程中，决定模块DCNDO根据本领域技术人员公知的失真率准则来选定最优的预测。

其后，如在H.264/MPEG-AVC标准中一样，在步骤D6的过程中，对每个预测的宏块进行解码。

一旦已经解码了图像I_N的所有宏块，参考图5，图像重构模块RI就作为来自解码器DO的输出而提供与图像I_N的解码对应的图像ID_N。

在顾及以下事实(该事实即，在解码器DO处执行的预测算法在每个方面与在编码器CO处执行的预测算法相同)的情况下，极大地减少了所使用的预测器所引入的信息损耗。

无需赘述的是，已经单纯地借助于完全非限制性的指示而给出了已经在上文中描述的实施例，并且本领域技术人员可以容易地做出许多修改，然而并不脱离本发明的范围。

Claims

1.一种用于相对于与参考图像的n个参考分区(r'1、r'2、…、r'n)中的参考分区(r'2)相关联的至少一个参考运动向量(MVr'2)来预测当前图像分区(P1)的当前运动向量(MVp1)的方法，所述当前运动向量描述该当前图像分区(P1)和对应的参考分区(Pr'1)之间的运动，在参考图像中该对应的参考分区(Pr'1)与所述当前图像分区具有相同的形状和相同的位置，所述参考图像不同于当前图像并且已经被预先地分割为已经编码并解码的该n个参考分区(r'1、r'2、…、r'n)，

所述方法的特征在于：在其中所述对应的参考分区(Pr'1)与来自该参考图像的所述n个参考分区(r'1、r'2、…、r'n)之中的k个参考分区的集合重叠的情况下，其中k≤n，基于属于与k个重叠的参考分区分别相关联的k 个参考运动向量(MVr'1、MVr'2、…、MVr'k)的集合的至少一个参考运动向量的函数，来确定当前图像分区的所述当前运动向量，其中确定当前图像分区的所述当前运动向量包含：

-选择与所述k个参考分区的集合重叠的该对应的参考分区(Pr'1)的特定点(CTr'1)，以及

-选择与包含所选择的特定点的重叠的参考分区(r'2)相关联的所述至少一个参考运动向量(MVr'2)。

2.如权利要求1所述的预测方法，其中，该确定当前分区的运动向量的步骤包括以下步骤：

3.如权利要求2所述的预测方法，其中，该比较准则包含：从与k个重叠的参考分区分别相关联的k个参考运动向量之中，选择与如下的参考分区相关联的参考运动向量，该参考分区的计算出的公共像素的数目为最大。

4.如权利要求2所述的预测方法，其中，该比较准则包含：通过计算出的公共像素的数目，来对与k个重叠的参考分区分别相关联的k个参考运动向量的均值进行加权。

5.如权利要求2所述的预测方法，其中，该比较准则包含：从与k个重叠的参考分区分别相关联的k个参考运动向量之中，选择与如下的重叠的参考分区相关联的参考运动向量，相比于在所述对应的参考分区外部，所述重叠的参考分区在所述对应的参考分区内部具有大多数的像素。

6.如权利要求1所述的预测方法，其中，该确定当前分区的运动向量的步骤包括以下步骤：

-选择其计算值为最高的系数，

7.如权利要求1所述的预测方法，其中，该确定当前分区的运动向量的步骤包括以下步骤：

8.如权利要求1所述的预测方法，其中，该确定当前分区的运动向量的步骤包括以下步骤：

-在对应的参考分区中，标识与图像的内容相关的特征，

9.一种用于对图像或图像的序列进行编码、以生成数据流(F)的方法，所述数据流(F)包括表现了至少一个图像分区的数据，所述方法包括预测所述图像分区的运动向量的步骤，

所述方法的特征在于：根据如权利要求1到8中任何一个所述的方法来执行所述预测。

10.一种用于对数据流(F)进行解码的方法，该数据流(F)表现了图像或图像的序列，所述流包括表现了至少一个图像分区的数据，所述方法包括预测所述图像分区的运动向量的步骤，

11.一种用于相对于与参考图像的n个参考分区(r'1、r'2、…、r'n)中的参考分区(r'2)相关联的至少一个参考运动向量(MVr'2)来预测当前图像分区(P1)的当前运动向量(MVp1)的装置(PREDCO)，所述当前运动向量描述该当前图像分区(P1)和对应的参考分区(Pr'1)之间的运动，在参考图像中该对应的参考分区(Pr'1)与所述当前图像分区具有相同的形状和相同的位置，所述参考图像不同于当前图像并且已经被预先地分割为已经编码并解码的该n个参考分区(r'1、r'2、…、r'n)，

该预测装置的特征在于：在其中所述对应的参考分区(Pr'1)与来自该参考图像的所述n个参考分区(r'1、r'2、…、r'n)之中的k个参考分区的集合重叠的情况下，其中k≤n，该预测装置包括计算模块(CAL)，能够基于属于与k个重叠的参考分区分别相关联的k个参考运动向量(MVr'1、 MVr'2、…、MVr'k)的集合的至少一个参考运动向量的函数，来确定当前图像分区的所述当前运动向量，其中该计算模块被配置为通过以下来确定当前分区的当前运动向量：

12.一种用于对图像或图像的序列进行编码、以生成数据流(F)的装置 (CO)，所述数据流(F)包括表现了至少一个图像分区的数据，所述装置包括用于预测所述图像分区的运动向量的部件，

其特征在于，所述用于预测所述图像分区的运动向量的部件是如权利要求11所述的装置(PREDCO)。

13.一种用于对数据流(F)进行解码的装置(DO)，该数据流(F)表现了图像或图像的序列，所述流(F)包括表现了至少一个图像分区的数据，所述装置包括用于预测所述图像分区的运动向量的部件，

其特征在于，所述用于预测所述图像分区的运动向量的部件是如权利要求11所述的装置(PREDDO)。