CN101350928A

CN101350928A - 一种运动估计方法及装置

Info

Publication number: CN101350928A
Application number: CN 200810117340
Authority: CN
Inventors: 季鹏飞
Original assignee: Vimicro Corp
Current assignee: Vimicro Corp
Priority date: 2008-07-29
Filing date: 2008-07-29
Publication date: 2009-01-21

Abstract

本发明公开一种运动估计方法及装置，属于视频编码技术领域，该方法包括：将16×16的宏块划分为多个分块模式，每个分块模式包括多个大小不同的子块；在参考帧图像中搜索并获得与每种分块模式中的多个子块匹配的预测块，并得到对应的每个子块的运动向量。通过设计不同的分块模式，将宏块划分为与AVC中不同的子块，可增加运动估计的匹配精度。

Description

一种运动估计方法及装置

技术领域

本发明涉及视频编码技术领域，尤其涉及一种运动估计方法及装置。

背景技术

运动估计是一种描述相邻帧差别的方法，具体来说是描述前面一帧的每个小块怎么样移动当前帧中的某个位置去，这种方法经常被视频压缩/视频编解码器用来减少视频序列中的时域冗余。

在H.264标准中采用了不同大小和形状的宏块分割与亚分割的方法。一个宏块的16×16亮度值可以按照16×16、8×16、16×8或8×8进行分割；而如果选择了8×8分割，还可以按照8×8、8×4、4×8或4×4进行亚分割，如图1所示。这些宏块分割与亚分割的方法将宏块划分为不同的子块。利用各种子块进行运动估计的方法我们将称为树结构的运动估计(tree structured motionestimation)。

一般情况下大的分块方式(16×16、16×8或8×16)适合视频运动平缓或者无运动情况，表达MV(运动向量)所需的比特数也会较少。小的分块方式(8×8、8×4、4×8或4×4)适合运动剧烈或者图像画面复杂的情况，不过表达MV所需的比特数也会相应的增加。因此对于分块的选择将会对压缩效果有着重大的影响。实验证明，分块大小为8×8以下(不包含8×8)的子块在运动估计过程中对提高压缩率和视频质量的贡献不大。

发明内容

为了解决上述问题，本发明的目的是提供一种运动估计方法及装置，通过将16×16的宏块划分为多个分块模式，每个分块模式包括多个大小不同的子块，从而可增加运动估计的匹配精度。

为了达到上述目的，本发明提供一种运动估计方法，所述方法包括：

将16×16的宏块划分为多个分块模式，每个所述分块模式包括多个大小不同的子块；

在参考帧图像中搜索并获得与每一种分块模式中的多个子块匹配的预测块，并得到对应的每一个子块的运动向量；

当搜索结束时，在所述多个分块模式中选择最优的分块模式。

优选地，所述将16×16的宏块划分为多个分块模式的步骤具体包括：

将一个所述16×16的宏块划分为一个位于所述16×16的宏块上部16×8的子块，和两个位于所述16×16的宏块下部8×8的子块；和/或，

将一个所述16×16的宏块划分为两个位于所述16×16的宏块上部的8×8的子块，和一个位于所述16×16的宏块下部的16×8的子块；和/或，

将一个所述16×16的宏块划分为一个位于所述16×16的宏块左侧的8×16的子块，和两个位于所述16×16的宏块右侧的8×8的子块；和/或

将一个所述16×16的宏块划分为两个位于所述16×16的宏块左侧的8×8的子块，和一个位于所述16×16的宏块右侧的8×16的子块。

优选地，所述在所述多个分块模式中选择最优的分块模式的步骤具体为：

根据率失真代价函数来选择最优的分块模式。

本发明还提供一种运动估计装置，包括：

划分模块，用于将16×16的宏块划分为多个分块模式，每个所述分块模式包括多个大小不同的子块；

估计模块，用于在参考帧图像中搜索并获得与每种分块模式中的多个子块匹配的预测块，并得到对应的每个子块的运动向量；

选择模块，用于在搜索结束时，在所述多个分块模式中选择最优的分块模式。

优选地，所述划分模块包括：

第一划分单元，用于将一个所述16×16的宏块划分为一个位于所述16×16的宏块上部16×8的子块，和两个位于所述16×16的宏块下部8×8的子块。

优选地，所述划分模块还包括：

第二划分单元，用于将一个所述16×16的宏块划分为两个位于所述16×16的宏块上部的8×8的子块，和一个位于所述16×16的宏块下部的16×8的子块。

优选地，所述划分模块还包括：

第三划分单元，用于将一个所述16×16的宏块划分为一个位于所述16×16的宏块左侧的8×16的子块，和两个位于所述16×16的宏块右侧的8×8的子块。

优选地，所述划分模块还包括：

第四划分单元，用于将一个所述16×16的宏块划分为两个位于所述16×16的宏块左侧的8×8的子块，和一个位于所述16×16的宏块右侧的8×16的子块。

上述技术方案中的一个技术方案具有如下有益效果：通过将16×16的宏块划分为多个分块模式，每个分块模式包括多个大小不同的子块，例如可将16×16的宏块划分为一个位于16×16的宏块上部16×8的子块，和两个位于16×16的宏块下部8×8的子块，采用这种分块模式可获得更好的匹配效果，提高了运动估计过程的匹配精度。

附图说明

图1为H.264标准中的宏块和子块分区示意图；

图2为本发明的实施例中子块分区示意图；

图3为本发明的实施例中运动估计方法流程图；

图4为本发明的实施例中运动估计装置框图。

具体实施方式

为了使本发明实施例的目的、技术方案和优点更加清楚明白，下面结合实施例和附图，对本发明实施例做进一步详细地说明。在此，本发明的示意性实施例及说明用于解释本发明，但并不作为对本发明的限定。

本发明的实施例提供一种运动估计方法，通过将16×16的宏块划分为多个分块模式，其中每个分块模式包括多个大小不同的子块，可提高运动估计过程的匹配精度，并且新型的分块模式采用了较少的子块个数，进而减少了需要描述运动向量MV(Motion Vector)的个数的比特数。

为了便于理解本发明的实施例，下面结合附图对本发明的实施例进行详细的说明。如图3所示，为本发明的实施例中运动估计方法流程图，具体步骤如下：

步骤301、将16×16的宏块划分为多个分块模式，每个分块模式包括多个大小不同的子块；

在编码当前帧图像时，需要把整个图像分为若干个宏块(宏块是编码的基本单元，为16×16的宏块)参见图2，在本实施例中，将16×16的宏块划分为多个分块模式，该分块模式包括以下四种方式中的任意一种或多种：

(一)、将一个16×16的宏块划分为由一个位于16×16的宏块上部16×8的子块，和两个位于16×16的宏块下部8×8的子块；

(二)、将一个16×16的宏块划分为由两个位于16×16的宏块上部的8×8的子块，和一个位于16×16的宏块下部的16×8的子块；

(三)、将一个16×16的宏块划分为由一个位于16×16的宏块左侧的8×16的子块，和两个位于16×16的宏块右侧的8×8的子块；

(四)、将一个16×16的宏块划分为由两个位于16×16的宏块左侧的8×8的子块，和一个位于16×16的宏块右侧的8×16的子块。

并且在实施本还可结合H.264标准中的16×16、16×8、8×16、8×8四种现有的分块模式来进行运动估计，该现有的分块模式在此就不再敷述。

在本实施例中，通过将16×16的宏块划分为不同的分块模式，从而在增加参考块与当前块匹配的准确性的同时，减少了需要传输的运动向量的个数，同时也增加了运动估计的匹配精度。上述新增的子块划分方式在降低运动估计误差和减少表达MV所需比特数方面优于H.264标准中的8×8以下的宏块划分方式。

步骤302、在参考帧图像中搜索并获得与每一种分块模式中的多个子块匹配的预测块，并得到对应的每个子块的运动向量。

在本步骤中，若将16×16的宏块划分为16×8、8×8和8×8三种子宏块，在执行步骤302时，每一个宏块按照行优先的方式来编码，先将16×8子宏块到参考帧中去搜索，得到一个16×8的匹配块，同时得到一组运动向量MV；再分别把下面的两个8×8子宏块到参考帧去搜索，分别得到两个8×8的匹配块，同时又得到两组运动向量MV，也就是说对应于这个分块模式，经过搜索，会得到三组运动向量MV，上述三组运动向量MV就分别指向了三个不同的块作为当前分块中16×8、8×8、以及8×8子宏块匹配的预测块，并将搜索到的预测块的位置信息也就是运动向量MV传给解码端，这样解码端就可以按照该运动向量MV找到预测块的位置。

步骤303、在搜索结束时，还可在该多个分块模式中选择最优的分块模式；

例如当其他的分块模式也搜索结束时，可选择参考块和当前块的SAD(差的绝对值的和)小，和/或者需要传输的比特数少的分块模式作为最优的分块模式。选择的标准是率失真代价函数SAD+λRate(拉格朗日最小二乘法)。

为了实现上述的方法实施例，本发明的其他实施例还提供了一种运动估计装置。另需首先说明的是，由于下述的实施例是为实现前述的方法实施例，故该装置中的模块都是为了实现前述方法的各步骤而设，但本发明并不限于下述的实施例，任何可实现上述方法的装置和模块都应包含于本发明的保护范围。并且在下面的描述中，与前述方法相同的内容在此省略，以节约篇幅。

如图4所示，为本发明的实施例中运动估计装置框图，由图中可知，该运动估计装置，包括：

划分模块41，用于将16×16的宏块划分为多个分块模式，每个分块模式包括多个大小不同的子块；

估计模块42，用于在参考帧图像中搜索并获得与每种分块模式中的多个子块匹配的预测块，并得到对应的每个子块的运动向量；

选择模块43，用于在搜索结束时，在所述多个分块模式中选择最优的分块模式。

在本发明的另一实施例中，该划分模块41包括：

第一划分单元411，用于将一个16×16的宏块划分为一个位于16×16的宏块上部16×8的子块，和两个位于16×16的宏块下部8×8的子块。

在本发明的另一实施例中，该划分模块41还包括：

第二划分单元412，用于将一个16×16的宏块划分为两个位于16×16的宏块上部的8×8的子块，和一个位于16×16的宏块下部的16×8的子块。

在本发明的另一实施例中，该划分模块41还包括：

第三划分单元413，用于将一个16×16的宏块划分为一个位于16×16的宏块左侧的8×16的子块，和两个位于16×16的宏块右侧的8×8的子块。

在本发明的另一实施例中，该划分模块41还包括：

第四划分单元414，用于将一个16×16的宏块划分为两个位于16×16的宏块左侧的8×8的子块，和一个位于16×16的宏块右侧的8×16的子块。

由上述技术方案可知，通过将16×16的宏块划分为不同的分块模式，例如可将16×16的宏块划分为16×8、8×8和8×8的三个子块，从而在增加参考块与当前块匹配的准确性的同时，减少了需要传输的运动向量的个数，同时也增加了运动估计的匹配精度。

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种运动估计方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述将16×16的宏块划分为多个分块模式的步骤具体包括：

3.根据权利要求1所述的方法，其特征在于，所述在所述多个分块模式中选择最优的分块模式的步骤具体为：

根据率失真代价函数来选择最优的分块模式。

4.一种运动估计装置，其特征在于，包括：

5.根据权利要求4所述的装置，其特征在于，所述划分模块包括：

6.根据权利要求4所述的装置，其特征在于，所述划分模块还包括：

7.根据权利要求4所述的装置，其特征在于，所述划分模块还包括：

8.根据权利要求4所述的装置，其特征在于，所述划分模块还包括：