CN102547262B

CN102547262B - 视频编码运动估计方法

Info

Publication number: CN102547262B
Application number: CN201010604718.3A
Authority: CN
Inventors: 金尹; 武海滨
Original assignee: Shengle Information Technolpogy Shanghai Co Ltd
Current assignee: Shanghai Zhangmen Science and Technology Co Ltd
Priority date: 2010-12-24
Filing date: 2010-12-24
Publication date: 2016-08-17
Anticipated expiration: 2030-12-24
Also published as: CN102547262A

Abstract

本发明公开了一种视频编码运动估计方法，包括步骤：取和当前帧的宏块一相对应的前一帧的宏块二、以及宏块二的周围宏块作为估计样本；计算出估计样本的各宏块的运动矢量的平均值和标准差；建立当前帧的各位置出现宏块一的最优匹配宏块的概率参数模型，并计算出所述概率参数模型的概率参数；给定一个概率值，根据当前帧的概率参数模型计算出宏块一的在当前帧中的搜索范围一，以搜索范围一确定宏块一在前一帧中的搜索范围二；在搜索范围二内进行全搜索并找到所述宏块一得最优匹配块。本发明能缩小当前帧各宏块的搜索区域、降低数据计算量以及内存吞吐量，能实现当前帧各宏块的并行搜索、能在多核CPU或GPU上实现并行计算。

Description

视频编码运动估计方法

技术领域

本发明涉及视频编码领域，特别是涉及一种视频编码运动估计方法。

背景技术

在现有的主流视频编码中如H.264，MPEG4中，采用图像组(Group Of Picture，GOP)的方式进行压缩编码。所述GOP包括三种类型的帧即I帧、B帧、P帧。其中I帧为关键帧，B帧为后向帧，P帧为参考帧。一般来说一段视频中，在一定时间间隔内视频图像之间的相似度极高，因此H.264，MPEG4等主流算法都需要对要针对帧与帧之间的信息相关性进行预测，来提升压缩率。

如图1A-图1C所示，为现有视频编码运动估计方法的帧示意图。如图1A所示，现有视频编码运动估计方法首先是将图像1分割为2倍数的宏块2如8×8或者16×16的宏块；如图1B所示，然后在和宏块2周围设置一个搜索范围3(Search Region)比如32×32的区域进行搜索；如图1C所示，寻找出和所述宏块2匹配程度最好的宏块4，得出所述宏块2和所述宏块4间的运动矢量(Motion Vector)，如图1C中的箭头所示。上述就是现有视频编码运动估计方法。

现有运动估计方法具有如下需要改进的地方：

一、现有运动估计方法的运动估计运算量极大，是视频编码中运算量最大的模块，占整个编码器运算量的60％左右。现有主流的搜索方法即现有钻石法对性能提升仍然非常有限。

二、现有运动估计方法都需要参考当前宏块的左、上、上右、上左宏块的运算结果，难以在多核CPU，GPU上实现并行运算。

三、对单个宏块进行运动估计时，不能对搜索区域内的所有点进行同时并行处理，每次只能测试4-6个运动矢量。

四、运动估计每次计算都需要吞吐大量的数据，在硬件设备比如GPU，嵌入式芯片上难以实施。

发明内容

本发明所要解决的技术问题是提供一种视频编码运动估计方法，能缩小当前帧各宏块的搜索区域、降低数据计算量以及内存吞吐量，能实现当前帧各宏块的并行搜索、并能在多核CPU或GPU上实现并行计算。

为解决上述技术问题，本发明提供的视频编码运动估计方法包括如下步骤：

步骤一、取和当前帧的宏块一相对应的前一帧的宏块二、以及所述宏块二的周围宏块作为估计样本；计算出所述估计样本的各宏块的运动矢量的横坐标的平均值和标准差、纵坐标的平均值和标准差。所述宏块二在前一帧中的位置和所述宏块一在当前帧中的位置相同。

步骤二、建立当前帧的各位置出现所述宏块一的最优匹配宏块的概率参数模型，并根据所述横坐标的标准差计算出所述概率参数模型的横坐标概率参数、根据所述纵坐标的标准差计算出所述概率参数模型的纵坐标概率参数。

步骤三、给定一个概率值，根据当前帧的所述概率参数模型计算出所述宏块一的在当前帧中的搜索范围一；以所述搜索范围一确定所述宏块一在前一帧中的搜索范围二，所述搜索范围二在前一帧中的位置和所述搜索范围一在当前帧中的位置相同。

步骤四、在所述搜索范围二内进行全搜索并找到所述宏块一的最优匹配块。

步骤二中所述概率参数模型为广义柯西分布模型，横坐标的公式为：

f_{m v x} (x) = \frac{C}{1 + {(\frac{x}{ζ_{x}})}^{\frac{3}{5}}}

F_{m v x} ({SR}_{x}) = {&Integral;}_{- {SR}_{x}}^{{SR}_{x}} \frac{C}{1 + {(\frac{x}{ζ_{x}})}^{\frac{3}{5}}} d x

f_mvx(x)为概率密度函数，F_mvx(SR_x)为对应的累积分布函数，C是归一化常数，ζ_x为横坐标概率参数，-SR_x和SR_x为分布函数F_mvx(SR_x)的横坐标的积分边界，x为当前帧的各位置的横坐标。根据所述横坐标的标准差计算出所述横坐标概率参数，公式为：

δ_X为所述估计样本的各宏块的运动矢量的横坐标的标准差；ξ_x0.5为拟合常数，ξ_x0.5的值为分布函数的方差分布的中位数，X为分布函数F(X)的横坐标积分边界，x为当前帧的各位置的横坐标。

所述概率参数模型的纵坐标的公式为：

f_{m v y} (y) = \frac{C}{1 + {(\frac{y}{ζ_{y}})}^{\frac{3}{5}}}

F_{m v y} ({SR}_{y}) = {&Integral;}_{- {SR}_{y}}^{{SR}_{y}} \frac{C}{1 + {(\frac{y}{ζ_{y}})}^{\frac{3}{5}}} d y

f_mvy(y)为概率密度函数，F_mvy(SR_y)为对应的累积分布函数，C是归一化常数，ζ_y为纵坐标概率参数，-SR_y和SR_y为分布函数F_mvy(SR_y)的纵坐标的积分边界，y为当前帧的各位置的纵坐标。根据所述纵坐标的标准差计算出所述纵坐标概率参数，公式为：

δ_Y为所述估计样本的各宏块的运动矢量的纵坐标的标准差；ξ_y0.5为拟合常数，ξ_y0.5的值为分布函数的方差分布的中位数，Y为分布函数F(Y)的纵坐标的积分边界，y为当前帧的各位置的纵坐标。

步骤一中所述宏块二的周围宏块包括所述宏块二的上、下、左、右、上左、上右、下左、下右的宏块；计算所述估计样本的各宏块的运动矢量的横坐标的平均值的公式为：

\overset{&OverBar;}{X} = \frac{1}{9} Σ_{i = 1}^{9} X_{i}

其中，为所述估计样本的各宏块的运动矢量的横坐标的平均值，X_i为所述宏块二和其周围宏块共9各宏块的运动矢量的横坐标。

计算所述估计样本的各宏块的运动矢量的横坐标的标准差的公式为：

δ_X为所述估计样本的各宏块的运动矢量的横坐标的标准差。

计算所述估计样本的各宏块的运动矢量的纵坐标的平均值的公式为：

\overset{&OverBar;}{Y} = \frac{1}{9} Σ_{i = 1}^{9} Y_{i}

其中，为所述估计样本的各宏块的运动矢量的纵坐标的平均值，Y_i为所述宏块二和其周围宏块共9各宏块的运动矢量的纵坐标。

计算所述估计样本的各宏块的运动矢量的纵坐标的标准差的公式为：

δ_Y为所述估计样本的各宏块的运动矢量的纵坐标的标准差。

步骤三中给定一个概率值，根据当前帧的所述概率参数模型计算出所述宏块一的在当前帧中的搜索范围一的方法为，包括如下步骤：

步骤1、用所述给定的概率值作为分布函数或的值，并分别求出对应的X值和Y值。

步骤2、利用公式分别求出SR_x或SR_y，以所述SR_X为所述宏块一的横坐标的搜索范围，以所述SR_y为所述宏块一的纵坐标的搜索范围，以所述宏块一的中心为原点，所述原点周围大小为SR_X×SR_y的块为所述宏块一的在当前帧中的搜索范围一。

本发明能根据前一帧的运动估计的结果，为当前宏块设置合适的搜索的区域，并不需要依赖于当前帧周围宏块的计算结果，不仅能有效缩小当前帧各宏块的搜索区域、从而降低数据计算量和内存吞吐量，还能实现当前帧各宏块的并行搜索、从而能在多核CPU或GPU上实现并行计算。

附图说明

下面结合附图和具体实施方式对本发明作进一步详细的说明:

图1A-图1C为现有视频编码运动估计方法的帧示意图；

图2是本发明实施方法中的帧示意图；

图3是本发明实施例方法的流程图；

图4是和本发明实施例方法的累积分布函数对应的搜索框示意图；

图5本发明实施例方法的搜索框示意图。

具体实施方式

如图1所示，是本发明实施例方法的流程图。本发明实施例视频编码运动估计方法包括如下步骤：

步骤一、如图2所示，取和当前帧即图2所示的Current Frame的宏块一mv₁₁相对应的前一帧即图2所示的Frame t-1的宏块二mv₀、以及所述宏块二mv₀的周围宏块作为估计样本。计算出所述估计样本的各宏块的运动矢量的横坐标的平均值和标准差、纵坐标的平均值和标准差。所述宏块二mv₀在前一帧中的位置和所述宏块一mv₁₁在当前帧中的位置相同。所述宏块二mv₀的周围宏块包括所述宏块二mv₀的周围宏块包括上宏块mv₂、下宏块mv₇、左宏块mv₄、右宏块mv₅、上左宏块mv₁、上右宏块mv₃、下左宏块mv₆、下右宏块mv₈；计算所述估计样本的各宏块的运动矢量的横坐标的平均值的公式为：

\overset{&OverBar;}{X} = \frac{1}{9} Σ_{i = 1}^{9} X_{i}

其中，为所述估计样本的各宏块的运动矢量的横坐标的平均值，X_i为所述宏块二mv₀和其周围宏块共9各宏块的运动矢量的横坐标。

δ_X为所述估计样本的各宏块的运动矢量的横坐标的标准差。

\overset{&OverBar;}{Y} = \frac{1}{9} Σ_{i = 1}^{9} Y_{i}

δ_Y为所述估计样本的各宏块的运动矢量的纵坐标的标准差。

步骤二、建立当前帧的各位置出现所述宏块一mv₁₁的最优匹配宏块的概率参数模型，并根据所述横坐标的标准差计算出所述概率参数模型的横坐标概率参数、根据所述纵坐标的标准差计算出所述概率参数模型的纵坐标概率参数。所述概率参数模型为广义柯西分布模型，横坐标的公式为：

f_{m v x} (x) = \frac{C}{1 + {(\frac{x}{ζ_{x}})}^{\frac{3}{5}}}

F_{m v x} ({SR}_{x}) = {&Integral;}_{- {SR}_{x}}^{{SR}_{x}} \frac{C}{1 + {(\frac{x}{ζ_{x}})}^{\frac{3}{5}}} d x

f_mvx(x)为概率密度函数，F_mvx(SR_x)为对应的累积分布函数，C是归一化常数，ζ_x为横坐标概率参数，-SR_x和SR_x为分布函数F_mvx(SR_x)的横坐标的积分边界，x为当前帧的各位置的横坐标。

所述概率参数模型的纵坐标的公式为：

f_{m v y} (y) = \frac{C}{1 + {(\frac{y}{ζ_{y}})}^{\frac{3}{5}}}

F_{m v y} ({SR}_{y}) = {&Integral;}_{- {SR}_{y}}^{{SR}_{y}} \frac{C}{1 + {(\frac{y}{ζ_{y}})}^{\frac{3}{5}}} d y

f_mvy(y)为概率密度函数，F_mvy(SR_y)为对应的累积分布函数，C是归一化常数，ζ_y为纵坐标概率参数，-SR_y和SR_y为分布函数F_mvy(SR_y)的纵坐标的积分边界，y为当前帧的各位置的纵坐标。

如图4所示，如果在搜索框5最大的范围为32X32，且在搜索框5内总能找到一个最优匹配块，则在搜索框5内找到的最优匹配块的概率总为1。如果缩小搜索框的大小，如将搜索框5缩小到搜索框6，那么最优匹配块在搜索框6出现的概率为搜索框6内每一点是最优匹配块的概率之和,即搜索框6的X和Y轴的累计概率的张量积：

P (SRx | SRy) = F_{mvx} ({SR}_{x}) &CircleTimes; F_{mvy} ({SR}_{y}) .

由上可知，每一个宏块的坐标概率分布取决于ζ_X和ζ_y，即F_mvx(SR_x)和F_mvy(SR_y)取决于ζ_x和ζ_y。ζ_x和ζ_y待估计的横坐标和纵坐标概率参数。在现有帧图像中，相邻两帧的概率分布是相同的即ζ_x和ζ_y是相同的。所以能根据前一帧的数据求出ζ_x和ζ_y。具体方法如下。

根据所述横坐标的标准差计算出所述横坐标概率参数，公式为：

根据所述纵坐标的标准差计算出所述纵坐标概率参数，公式为：

δ_Y为所述估计样本的各宏块的运动矢量的纵坐标的标准差；ξ_y0.5为拟合常数，ξ_y0.5的值为分布函数的概率积分值，Y为分布函数F(Y)的纵坐标的积分边界，y为当前帧的各位置的纵坐标。

分布函数的概率积分值能通过数值计算求出，如表一所示为分布函数的概率积分值表，表一中每两行为一组，其中第一行为X或Y的值，第二行为分布函数的概率积分值。

表一

步骤三、给定一个概率值，根据当前帧的所述概率参数模型计算出所述宏块一mv₁₁的在当前帧中的搜索范围一。以所述搜索范围一确定所述宏块一mv₁₁在前一帧中的搜索范围二，所述搜索范围二在前一帧中的位置和所述搜索范围一在当前帧中的位置相同。其中给定一个概率值，根据当前帧的所述概率参数模型计算出所述宏块一的在当前帧中的搜索范围一的方法为，包括如下步骤：步骤1、用所述给定的概率值作为分布函数或的值，并分别求出对应的X值和Y值；本发明实施例给定一个大小为90％的概率值，查表一可得，对应的X值或Y值的近似值为23。步骤2、利用公式分别求出SR_x或SR_y，以所述SR_x为所述宏块一mv₁₁的横坐标的搜索范围，以所述SR_y为所述宏块一mv₁₁的纵坐标的搜索范围，以所述宏块一mv₁₁的中心为原点，所述原点周围大小为SR_x×SR_y的块为所述宏块一mv₁₁的在当前帧中的搜索范围一。

步骤四、如图5所示，在前一帧8中确定的所述搜索范围二9内进行全搜索并找到所述宏块一mv₁₁的最优匹配块。其中所述宏块一mv₁₁在前一帧中对应的位置相同的宏块为宏块7也即宏块二mv₀。

以上通过具体实施例对本发明进行了详细的说明，但这些并非构成对本发明的限制。在不脱离本发明原理的情况下，本领域的技术人员还可做出许多变形和改进，这些也应视为本发明的保护范围。

Claims

1.一种视频编码运动估计方法，其特征在于，包括如下步骤：

步骤一、取和当前帧的宏块一相对应的前一帧的宏块二、以及所述宏块二的周围宏块作为估计样本，所述宏块二在前一帧中的位置和所述宏块一在当前帧中的位置相同；计算出所述估计样本的各宏块的运动矢量的横坐标的平均值和标准差、纵坐标的平均值和标准差；

步骤二、建立当前帧的各位置出现所述宏块一的最优匹配宏块的概率参数模型，并根据所述横坐标的标准差计算出所述概率参数模型的横坐标概率参数、根据所述纵坐标的标准差计算出所述概率参数模型的纵坐标概率参数；

步骤三、给定一个概率值，根据当前帧的所述概率参数模型计算出所述宏块一的在当前帧中的搜索范围一；以所述搜索范围一确定所述宏块一在前一帧中的搜索范围二，所述搜索范围二在前一帧中的位置和所述搜索范围一在当前帧中的位置相同；

步骤四、在所述搜索范围二内进行全搜索并找到所述宏块一的最优匹配块；

f_mvx(x)为概率密度函数，F_mvx(SR_x)为对应的累积分布函数，C是归一化常数，ζ_x为横坐标概率参数，-SR_x和SR_x为分布函数F_mvx(SR_x)的横坐标的积分边界，x为当前帧的各位置的横坐标；根据所述横坐标的标准差计算出所述横坐标概率参数，公式为：

δ_X为所述估计样本的各宏块的运动矢量的横坐标的标准差；ξ_x0.5为拟合常数；

所述概率参数模型的纵坐标的公式为：

f_mvy(y)为概率密度函数，F_mvy(SR_y)为对应的累积分布函数，C是归一化常数，ζ_y为纵坐标概率参数，-SR_y和SR_y为分布函数F_mvy(SR_y)的纵坐标的积分边界，y为当前帧的各位置的纵坐标；根据所述纵坐标的标准差计算出所述纵坐标概率参数，公式为：

δ_Y为所述估计样本的各宏块的运动矢量的纵坐标的标准差；ξ_y0.5为拟合常数；

步骤1、用所述给定的概率值作为分布函数或的值，并分别求出对应的X值和Y值；

2.如权利要求1所述的视频编码运动估计方法，其特征在于：步骤一中所述宏块二的周围宏块包括所述宏块二的上、下、左、右、上左、上右、下左、下右的宏块；计算所述估计样本的各宏块的运动矢量的横坐标的平均值的公式为：

其中，为所述估计样本的各宏块的运动矢量的横坐标的平均值，X_i为所述宏块二和其周围宏块共9各宏块的运动矢量的横坐标；

δ_X为所述估计样本的各宏块的运动矢量的横坐标的标准差；

其中，为所述估计样本的各宏块的运动矢量的纵坐标的平均值，Y_i为所述宏块二和其周围宏块共9各宏块的运动矢量的纵坐标；

δ_Y为所述估计样本的各宏块的运动矢量的纵坐标的标准差。