CN102547262B - 视频编码运动估计方法 - Google Patents

视频编码运动估计方法 Download PDF

Info

Publication number
CN102547262B
CN102547262B CN201010604718.3A CN201010604718A CN102547262B CN 102547262 B CN102547262 B CN 102547262B CN 201010604718 A CN201010604718 A CN 201010604718A CN 102547262 B CN102547262 B CN 102547262B
Authority
CN
China
Prior art keywords
macro block
abscissa
ordinate
standard deviation
probability parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201010604718.3A
Other languages
English (en)
Other versions
CN102547262A (zh
Inventor
金尹
武海滨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Zhangmen Science and Technology Co Ltd
Original Assignee
Shengle Information Technolpogy Shanghai Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shengle Information Technolpogy Shanghai Co Ltd filed Critical Shengle Information Technolpogy Shanghai Co Ltd
Priority to CN201010604718.3A priority Critical patent/CN102547262B/zh
Publication of CN102547262A publication Critical patent/CN102547262A/zh
Application granted granted Critical
Publication of CN102547262B publication Critical patent/CN102547262B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明公开了一种视频编码运动估计方法,包括步骤:取和当前帧的宏块一相对应的前一帧的宏块二、以及宏块二的周围宏块作为估计样本;计算出估计样本的各宏块的运动矢量的平均值和标准差;建立当前帧的各位置出现宏块一的最优匹配宏块的概率参数模型,并计算出所述概率参数模型的概率参数;给定一个概率值,根据当前帧的概率参数模型计算出宏块一的在当前帧中的搜索范围一,以搜索范围一确定宏块一在前一帧中的搜索范围二;在搜索范围二内进行全搜索并找到所述宏块一得最优匹配块。本发明能缩小当前帧各宏块的搜索区域、降低数据计算量以及内存吞吐量,能实现当前帧各宏块的并行搜索、能在多核CPU或GPU上实现并行计算。

Description

视频编码运动估计方法
技术领域
本发明涉及视频编码领域,特别是涉及一种视频编码运动估计方法。
背景技术
在现有的主流视频编码中如H.264,MPEG4中,采用图像组(Group Of Picture,GOP)的方式进行压缩编码。所述GOP包括三种类型的帧即I帧、B帧、P帧。其中I帧为关键帧,B帧为后向帧,P帧为参考帧。一般来说一段视频中,在一定时间间隔内视频图像之间的相似度极高,因此H.264,MPEG4等主流算法都需要对要针对帧与帧之间的信息相关性进行预测,来提升压缩率。
如图1A-图1C所示,为现有视频编码运动估计方法的帧示意图。如图1A所示,现有视频编码运动估计方法首先是将图像1分割为2倍数的宏块2如8×8或者16×16的宏块;如图1B所示,然后在和宏块2周围设置一个搜索范围3(Search Region)比如32×32的区域进行搜索;如图1C所示,寻找出和所述宏块2匹配程度最好的宏块4,得出所述宏块2和所述宏块4间的运动矢量(Motion Vector),如图1C中的箭头所示。上述就是现有视频编码运动估计方法。
现有运动估计方法具有如下需要改进的地方:
一、现有运动估计方法的运动估计运算量极大,是视频编码中运算量最大的模块,占整个编码器运算量的60%左右。现有主流的搜索方法即现有钻石法对性能提升仍然非常有限。
二、现有运动估计方法都需要参考当前宏块的左、上、上右、上左宏块的运算结果,难以在多核CPU,GPU上实现并行运算。
三、对单个宏块进行运动估计时,不能对搜索区域内的所有点进行同时并行处理,每次只能测试4-6个运动矢量。
四、运动估计每次计算都需要吞吐大量的数据,在硬件设备比如GPU,嵌入式芯片上难以实施。
发明内容
本发明所要解决的技术问题是提供一种视频编码运动估计方法,能缩小当前帧各宏块的搜索区域、降低数据计算量以及内存吞吐量,能实现当前帧各宏块的并行搜索、并能在多核CPU或GPU上实现并行计算。
为解决上述技术问题,本发明提供的视频编码运动估计方法包括如下步骤:
步骤一、取和当前帧的宏块一相对应的前一帧的宏块二、以及所述宏块二的周围宏块作为估计样本;计算出所述估计样本的各宏块的运动矢量的横坐标的平均值和标准差、纵坐标的平均值和标准差。所述宏块二在前一帧中的位置和所述宏块一在当前帧中的位置相同。
步骤二、建立当前帧的各位置出现所述宏块一的最优匹配宏块的概率参数模型,并根据所述横坐标的标准差计算出所述概率参数模型的横坐标概率参数、根据所述纵坐标的标准差计算出所述概率参数模型的纵坐标概率参数。
步骤三、给定一个概率值,根据当前帧的所述概率参数模型计算出所述宏块一的在当前帧中的搜索范围一;以所述搜索范围一确定所述宏块一在前一帧中的搜索范围二,所述搜索范围二在前一帧中的位置和所述搜索范围一在当前帧中的位置相同。
步骤四、在所述搜索范围二内进行全搜索并找到所述宏块一的最优匹配块。
步骤二中所述概率参数模型为广义柯西分布模型,横坐标的公式为:
f m v x ( x ) = C 1 + ( x ζ x ) 3 5
F m v x ( SR x ) = ∫ - SR x SR x C 1 + ( x ζ x ) 3 5 d x
fmvx(x)为概率密度函数,Fmvx(SRx)为对应的累积分布函数,C是归一化常数,ζx为横坐标概率参数,-SRx和SRx为分布函数Fmvx(SRx)的横坐标的积分边界,x为当前帧的各位置的横坐标。根据所述横坐标的标准差计算出所述横坐标概率参数,公式为:
δX为所述估计样本的各宏块的运动矢量的横坐标的标准差;ξx0.5为拟合常数,ξx0.5的值为分布函数的方差分布的中位数,X为分布函数F(X)的横坐标积分边界,x为当前帧的各位置的横坐标。
所述概率参数模型的纵坐标的公式为:
f m v y ( y ) = C 1 + ( y ζ y ) 3 5
F m v y ( SR y ) = ∫ - SR y SR y C 1 + ( y ζ y ) 3 5 d y
fmvy(y)为概率密度函数,Fmvy(SRy)为对应的累积分布函数,C是归一化常数,ζy为纵坐标概率参数,-SRy和SRy为分布函数Fmvy(SRy)的纵坐标的积分边界,y为当前帧的各位置的纵坐标。根据所述纵坐标的标准差计算出所述纵坐标概率参数,公式为:
δY为所述估计样本的各宏块的运动矢量的纵坐标的标准差;ξy0.5为拟合常数,ξy0.5的值为分布函数的方差分布的中位数,Y为分布函数F(Y)的纵坐标的积分边界,y为当前帧的各位置的纵坐标。
步骤一中所述宏块二的周围宏块包括所述宏块二的上、下、左、右、上左、上右、下左、下右的宏块;计算所述估计样本的各宏块的运动矢量的横坐标的平均值的公式为:
X ‾ = 1 9 Σ i = 1 9 X i
其中,为所述估计样本的各宏块的运动矢量的横坐标的平均值,Xi为所述宏块二和其周围宏块共9各宏块的运动矢量的横坐标。
计算所述估计样本的各宏块的运动矢量的横坐标的标准差的公式为:
δX为所述估计样本的各宏块的运动矢量的横坐标的标准差。
计算所述估计样本的各宏块的运动矢量的纵坐标的平均值的公式为:
Y ‾ = 1 9 Σ i = 1 9 Y i
其中,为所述估计样本的各宏块的运动矢量的纵坐标的平均值,Yi为所述宏块二和其周围宏块共9各宏块的运动矢量的纵坐标。
计算所述估计样本的各宏块的运动矢量的纵坐标的标准差的公式为:
δY为所述估计样本的各宏块的运动矢量的纵坐标的标准差。
步骤三中给定一个概率值,根据当前帧的所述概率参数模型计算出所述宏块一的在当前帧中的搜索范围一的方法为,包括如下步骤:
步骤1、用所述给定的概率值作为分布函数的值,并分别求出对应的X值和Y值。
步骤2、利用公式分别求出SRx或SRy,以所述SRX为所述宏块一的横坐标的搜索范围,以所述SRy为所述宏块一的纵坐标的搜索范围,以所述宏块一的中心为原点,所述原点周围大小为SRX×SRy的块为所述宏块一的在当前帧中的搜索范围一。
本发明能根据前一帧的运动估计的结果,为当前宏块设置合适的搜索的区域,并不需要依赖于当前帧周围宏块的计算结果,不仅能有效缩小当前帧各宏块的搜索区域、从而降低数据计算量和内存吞吐量,还能实现当前帧各宏块的并行搜索、从而能在多核CPU或GPU上实现并行计算。
附图说明
下面结合附图和具体实施方式对本发明作进一步详细的说明:
图1A-图1C为现有视频编码运动估计方法的帧示意图;
图2是本发明实施方法中的帧示意图;
图3是本发明实施例方法的流程图;
图4是和本发明实施例方法的累积分布函数对应的搜索框示意图;
图5本发明实施例方法的搜索框示意图。
具体实施方式
如图1所示,是本发明实施例方法的流程图。本发明实施例视频编码运动估计方法包括如下步骤:
步骤一、如图2所示,取和当前帧即图2所示的Current Frame的宏块一mv11相对应的前一帧即图2所示的Frame t-1的宏块二mv0、以及所述宏块二mv0的周围宏块作为估计样本。计算出所述估计样本的各宏块的运动矢量的横坐标的平均值和标准差、纵坐标的平均值和标准差。所述宏块二mv0在前一帧中的位置和所述宏块一mv11在当前帧中的位置相同。所述宏块二mv0的周围宏块包括所述宏块二mv0的周围宏块包括上宏块mv2、下宏块mv7、左宏块mv4、右宏块mv5、上左宏块mv1、上右宏块mv3、下左宏块mv6、下右宏块mv8;计算所述估计样本的各宏块的运动矢量的横坐标的平均值的公式为:
X ‾ = 1 9 Σ i = 1 9 X i
其中,为所述估计样本的各宏块的运动矢量的横坐标的平均值,Xi为所述宏块二mv0和其周围宏块共9各宏块的运动矢量的横坐标。
计算所述估计样本的各宏块的运动矢量的横坐标的标准差的公式为:
δX为所述估计样本的各宏块的运动矢量的横坐标的标准差。
计算所述估计样本的各宏块的运动矢量的纵坐标的平均值的公式为:
Y ‾ = 1 9 Σ i = 1 9 Y i
其中,为所述估计样本的各宏块的运动矢量的纵坐标的平均值,Yi为所述宏块二和其周围宏块共9各宏块的运动矢量的纵坐标。
计算所述估计样本的各宏块的运动矢量的纵坐标的标准差的公式为:
δY为所述估计样本的各宏块的运动矢量的纵坐标的标准差。
步骤二、建立当前帧的各位置出现所述宏块一mv11的最优匹配宏块的概率参数模型,并根据所述横坐标的标准差计算出所述概率参数模型的横坐标概率参数、根据所述纵坐标的标准差计算出所述概率参数模型的纵坐标概率参数。所述概率参数模型为广义柯西分布模型,横坐标的公式为:
f m v x ( x ) = C 1 + ( x ζ x ) 3 5
F m v x ( SR x ) = ∫ - SR x SR x C 1 + ( x ζ x ) 3 5 d x
fmvx(x)为概率密度函数,Fmvx(SRx)为对应的累积分布函数,C是归一化常数,ζx为横坐标概率参数,-SRx和SRx为分布函数Fmvx(SRx)的横坐标的积分边界,x为当前帧的各位置的横坐标。
所述概率参数模型的纵坐标的公式为:
f m v y ( y ) = C 1 + ( y ζ y ) 3 5
F m v y ( SR y ) = ∫ - SR y SR y C 1 + ( y ζ y ) 3 5 d y
fmvy(y)为概率密度函数,Fmvy(SRy)为对应的累积分布函数,C是归一化常数,ζy为纵坐标概率参数,-SRy和SRy为分布函数Fmvy(SRy)的纵坐标的积分边界,y为当前帧的各位置的纵坐标。
如图4所示,如果在搜索框5最大的范围为32X32,且在搜索框5内总能找到一个最优匹配块,则在搜索框5内找到的最优匹配块的概率总为1。如果缩小搜索框的大小,如将搜索框5缩小到搜索框6,那么最优匹配块在搜索框6出现的概率为搜索框6内每一点是最优匹配块的概率之和,即搜索框6的X和Y轴的累计概率的张量积:
P ( SRx | SRy ) = F mvx ( SR x ) ⊗ F mvy ( SR y ) .
由上可知,每一个宏块的坐标概率分布取决于ζX和ζy,即Fmvx(SRx)和Fmvy(SRy)取决于ζx和ζy。ζx和ζy待估计的横坐标和纵坐标概率参数。在现有帧图像中,相邻两帧的概率分布是相同的即ζx和ζy是相同的。所以能根据前一帧的数据求出ζx和ζy。具体方法如下。
根据所述横坐标的标准差计算出所述横坐标概率参数,公式为:
δx为所述估计样本的各宏块的运动矢量的横坐标的标准差;ξx0.5为拟合常数,ξx0.5的值为分布函数的方差分布的中位数,X为分布函数F(X)的横坐标积分边界,x为当前帧的各位置的横坐标。
根据所述纵坐标的标准差计算出所述纵坐标概率参数,公式为:
δY为所述估计样本的各宏块的运动矢量的纵坐标的标准差;ξy0.5为拟合常数,ξy0.5的值为分布函数的概率积分值,Y为分布函数F(Y)的纵坐标的积分边界,y为当前帧的各位置的纵坐标。
分布函数的概率积分值能通过数值计算求出,如表一所示为分布函数 的概率积分值表,表一中每两行为一组,其中第一行为X或Y的值,第二行为分布函数 的概率积分值。
表一
步骤三、给定一个概率值,根据当前帧的所述概率参数模型计算出所述宏块一mv11的在当前帧中的搜索范围一。以所述搜索范围一确定所述宏块一mv11在前一帧中的搜索范围二,所述搜索范围二在前一帧中的位置和所述搜索范围一在当前帧中的位置相同。其中给定一个概率值,根据当前帧的所述概率参数模型计算出所述宏块一的在当前帧中的搜索范围一的方法为,包括如下步骤:步骤1、用所述给定的概率值作为分布函数的值,并分别求出对应的X值和Y值;本发明实施例给定一个大小为90%的概率值,查表一可得,对应的X值或Y值的近似值为23。步骤2、利用公式分别求出SRx或SRy,以所述SRx为所述宏块一mv11的横坐标的搜索范围,以所述SRy为所述宏块一mv11的纵坐标的搜索范围,以所述宏块一mv11的中心为原点,所述原点周围大小为SRx×SRy的块为所述宏块一mv11的在当前帧中的搜索范围一。
步骤四、如图5所示,在前一帧8中确定的所述搜索范围二9内进行全搜索并找到所述宏块一mv11的最优匹配块。其中所述宏块一mv11在前一帧中对应的位置相同的宏块为宏块7也即宏块二mv0
以上通过具体实施例对本发明进行了详细的说明,但这些并非构成对本发明的限制。在不脱离本发明原理的情况下,本领域的技术人员还可做出许多变形和改进,这些也应视为本发明的保护范围。

Claims (2)

1.一种视频编码运动估计方法,其特征在于,包括如下步骤:
步骤一、取和当前帧的宏块一相对应的前一帧的宏块二、以及所述宏块二的周围宏块作为估计样本,所述宏块二在前一帧中的位置和所述宏块一在当前帧中的位置相同;计算出所述估计样本的各宏块的运动矢量的横坐标的平均值和标准差、纵坐标的平均值和标准差;
步骤二、建立当前帧的各位置出现所述宏块一的最优匹配宏块的概率参数模型,并根据所述横坐标的标准差计算出所述概率参数模型的横坐标概率参数、根据所述纵坐标的标准差计算出所述概率参数模型的纵坐标概率参数;
步骤三、给定一个概率值,根据当前帧的所述概率参数模型计算出所述宏块一的在当前帧中的搜索范围一;以所述搜索范围一确定所述宏块一在前一帧中的搜索范围二,所述搜索范围二在前一帧中的位置和所述搜索范围一在当前帧中的位置相同;
步骤四、在所述搜索范围二内进行全搜索并找到所述宏块一的最优匹配块;
步骤二中所述概率参数模型为广义柯西分布模型,横坐标的公式为:
fmvx(x)为概率密度函数,Fmvx(SRx)为对应的累积分布函数,C是归一化常数,ζx为横坐标概率参数,-SRx和SRx为分布函数Fmvx(SRx)的横坐标的积分边界,x为当前帧的各位置的横坐标;根据所述横坐标的标准差计算出所述横坐标概率参数,公式为:
δX为所述估计样本的各宏块的运动矢量的横坐标的标准差;ξx0.5为拟合常数;
所述概率参数模型的纵坐标的公式为:
fmvy(y)为概率密度函数,Fmvy(SRy)为对应的累积分布函数,C是归一化常数,ζy为纵坐标概率参数,-SRy和SRy为分布函数Fmvy(SRy)的纵坐标的积分边界,y为当前帧的各位置的纵坐标;根据所述纵坐标的标准差计算出所述纵坐标概率参数,公式为:
δY为所述估计样本的各宏块的运动矢量的纵坐标的标准差;ξy0.5为拟合常数;
步骤三中给定一个概率值,根据当前帧的所述概率参数模型计算出所述宏块一的在当前帧中的搜索范围一的方法为,包括如下步骤:
步骤1、用所述给定的概率值作为分布函数的值,并分别求出对应的X值和Y值;
步骤2、利用公式分别求出SRx或SRy,以所述SRx为所述宏块一的横坐标的搜索范围,以所述SRy为所述宏块一的纵坐标的搜索范围,以所述宏块一的中心为原点,所述原点周围大小为SRx×SRy的块为所述宏块一的在当前帧中的搜索范围一。
2.如权利要求1所述的视频编码运动估计方法,其特征在于:步骤一中所述宏块二的周围宏块包括所述宏块二的上、下、左、右、上左、上右、下左、下右的宏块;计算所述估计样本的各宏块的运动矢量的横坐标的平均值的公式为:
其中,为所述估计样本的各宏块的运动矢量的横坐标的平均值,Xi为所述宏块二和其周围宏块共9各宏块的运动矢量的横坐标;
计算所述估计样本的各宏块的运动矢量的横坐标的标准差的公式为:
δX为所述估计样本的各宏块的运动矢量的横坐标的标准差;
计算所述估计样本的各宏块的运动矢量的纵坐标的平均值的公式为:
其中,为所述估计样本的各宏块的运动矢量的纵坐标的平均值,Yi为所述宏块二和其周围宏块共9各宏块的运动矢量的纵坐标;
计算所述估计样本的各宏块的运动矢量的纵坐标的标准差的公式为:
δY为所述估计样本的各宏块的运动矢量的纵坐标的标准差。
CN201010604718.3A 2010-12-24 2010-12-24 视频编码运动估计方法 Active CN102547262B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201010604718.3A CN102547262B (zh) 2010-12-24 2010-12-24 视频编码运动估计方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201010604718.3A CN102547262B (zh) 2010-12-24 2010-12-24 视频编码运动估计方法

Publications (2)

Publication Number Publication Date
CN102547262A CN102547262A (zh) 2012-07-04
CN102547262B true CN102547262B (zh) 2016-08-17

Family

ID=46353069

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201010604718.3A Active CN102547262B (zh) 2010-12-24 2010-12-24 视频编码运动估计方法

Country Status (1)

Country Link
CN (1) CN102547262B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110993105A (zh) * 2019-12-06 2020-04-10 重庆亿只网络科技有限公司 一种宠物健康监测及管理装置及方法
CN113256744B (zh) * 2020-02-10 2023-03-24 武汉Tcl集团工业研究院有限公司 一种图像编码、解码方法及系统
CN118101943B (zh) * 2024-04-25 2024-06-25 黑龙江哲讯信息技术有限公司 一种优化5g网络拓扑结构的视频传输系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101378504A (zh) * 2007-08-31 2009-03-04 上海杰得微电子有限公司 用于h.264编码的块匹配运动估计方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8494052B2 (en) * 2006-04-07 2013-07-23 Microsoft Corporation Dynamic selection of motion estimation search ranges and extended motion vector ranges

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101378504A (zh) * 2007-08-31 2009-03-04 上海杰得微电子有限公司 用于h.264编码的块匹配运动估计方法

Also Published As

Publication number Publication date
CN102547262A (zh) 2012-07-04

Similar Documents

Publication Publication Date Title
JP5281891B2 (ja) 適応的な動き検索範囲
CN110796662B (zh) 一种实时的语义视频分割方法
CN106604035B (zh) 一种用于视频编码和压缩的运动估计的方法
CN101394566B (zh) 一种十字菱形运动估计搜索方法
US9883200B2 (en) Method of acquiring neighboring disparity vectors for multi-texture and multi-depth video
CN102291581B (zh) 支持帧场自适应运动估计的实现方法
WO2020233397A1 (zh) 在视频中对目标进行检测的方法、装置、计算设备和存储介质
CN102547262B (zh) 视频编码运动估计方法
CN103957420B (zh) 一种h.264运动估计编码的全面运动估计改进算法
CN109120940B (zh) 自适应因子的视频缩放运动估计方法
US10523961B2 (en) Motion estimation method and apparatus for plurality of frames
CN105263026A (zh) 基于概率统计与图像梯度信息的全局矢量获取方法
CN103763563B (zh) 运动估计搜索方法
CN110493599A (zh) 图像识别方法及装置
CN104159123B (zh) 一种适合于硬件实现的hevc运动估计方法
CN111292357B (zh) 一种基于相关滤波的视频帧间快速运动估计方法
CN107197281A (zh) 一种实现运动估计的方法及电子设备
CN107135393A (zh) 一种光场图像的压缩方法
CN105611299A (zh) 一种基于hevc的运动估计方法
Wang et al. A novel SSDA-based block matching algorithm for image stabilization
Jalloul A novel parallel computing approach for motion estimation based on particle swarm optimization
CN107197299A (zh) 一种运动估计实现方法及电子设备
Damodharan et al. Analysis of particle swarm optimization in block matching algorithms for video coding
Jacob et al. An efficient motion estimation algorithm based on particle swarm optimization
Alzoubi et al. Reducing the complexity of MPEG-4 global motion estimation using pixel subsampling

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20190222

Address after: 201203 7, 1 Lane 666 lane, Zhang Heng Road, Pudong New Area, Shanghai.

Patentee after: SHANGHAI ZHANGMEN TECHNOLOGY CO., LTD.

Address before: 201203 No. 356 GuoShoujing Road, Pudong New Area, Shanghai

Patentee before: Shengle Information Technology (Shanghai) Co., Ltd.

TR01 Transfer of patent right