CN101378504B - 用于h.264编码的块匹配运动估计方法 - Google Patents

用于h.264编码的块匹配运动估计方法 Download PDF

Info

Publication number
CN101378504B
CN101378504B CN 200710094054 CN200710094054A CN101378504B CN 101378504 B CN101378504 B CN 101378504B CN 200710094054 CN200710094054 CN 200710094054 CN 200710094054 A CN200710094054 A CN 200710094054A CN 101378504 B CN101378504 B CN 101378504B
Authority
CN
China
Prior art keywords
motion vector
search
mvy
mvx
avg
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN 200710094054
Other languages
English (en)
Other versions
CN101378504A (zh
Inventor
仲巡
黄小振
欧阳合
林晓芸
葛志荣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Jade Technologies Co., Ltd.
Original Assignee
SHANGHAI JADE TECHNOLOGIES Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHANGHAI JADE TECHNOLOGIES Co Ltd filed Critical SHANGHAI JADE TECHNOLOGIES Co Ltd
Priority to CN 200710094054 priority Critical patent/CN101378504B/zh
Publication of CN101378504A publication Critical patent/CN101378504A/zh
Application granted granted Critical
Publication of CN101378504B publication Critical patent/CN101378504B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明公开了一种用于H.264编码的块匹配运动估计方法,其包括以下步骤:获取视频图像中与当前宏块相邻的左边、上边、左上和右上这四个宏块的运动矢量;根据所得运动矢量确定搜索中心;根据所述运动矢量的平均值调整搜索范围;及在上述所述的搜索范围内进行运动搜索,并利用最小绝对误差SAD准则进行匹配和提前中止判定。本运动估计方法利用了图像当前宏块与相邻宏块间的运动矢量间的强相关性,能在基本不损失信噪比的前提下,大大提高搜索准确度,降低运算复杂度及提高运算速度。

Description

用于H.264编码的块匹配运动估计方法
技术领域
本发明涉及一种计算机领域中视频图像编码,特别涉及一种基于H.264编码的自适应块匹配运动估计方法。
背景技术
H.264是由ITU-T和ISO两个组织的专家为实现视频的更高压缩比,更好的图像质量和良好的网络适应性而提出的视频编码标准。事实证明,H.264编码具有比其他视频压缩标准更节省码流,并且比MPEG-4算法简单的特点。
为了提高编码效率,H.264/AVC采用了许多新的技术,其中一个新技术就是帧间编码采用了基于块匹配的运动估计(BMME,Block—MatchingMotion Estimation)技术。基于块匹配的运动估计的准确性和时间性是影响编码器整体性能的主要因素之一,对图像块进行匹配搜索的计算量很大,它和运动补偿块模式选择部分的处理共占整个编码器运算量的60%左右。所以如何在保证一定图像质量条件下,尽量减少块运动估计的计算量,成为当今研究的一个热点。
H.264视频编码标准的性能很大程度上取决于运动估计,而影响运动估计的主要因素是匹配准则和搜索算法。而搜索中心和搜索范围的确定能够大大提高搜索的效率。因此,很多针对块匹配的快速搜索算法被相继提出来。块匹配运动估计的基本原理是将当前帧分割成互不重叠的小块(如大小为16×16像素等),然后在参考帧中进行运动搜索,寻找最佳匹配位置作为预测,编码时只编码运动向量与块残差信息,以消除帧间冗余度,降低码率。在块匹配运动估计中,运动估计的精度会对码率产生很大的影响。块匹配法中,最简单、最可靠的方法是全搜索法(FS,Full Search)即穷尽搜索方法,但由于其要求对搜索窗内所有点进行匹配,所需运算量十分巨大,很难适应实际应用,特别是实时应用的要求。于是出现了许多快速搜索算法,最典型的有三步法TSS(Three—step Search)、新三步法NTSS(NewThree-step Search)、二维对数法、菱形搜索法DS(Diamond Search)等。
运动估计算法中常用的匹配准则有以下几种:最小绝对差(MAD)、最小均方差(MSE)和最小绝对误差(SAD)等,由于SAD准则不需要作乘法运算,实现简单、方便、所以使用最多,通常使用SAD准则。
对于硬件设计来说,快速搜索方法需要根据每一步搜索的结果动态调整对存储单元数据的访问区域,硬件开销较大。
发明内容
本发明要解决的技术问题是提供一种用于H.264编码的块匹配运动估计方法,其具有高度的灵活性,可减少运动估计的范围和时间。
为解决上述技术问题,本发明的用于H.264编码的块匹配运动估计方法,包括以下步骤:获取视频图像中与当前宏块相邻的左边、上边、左上和右上四个宏块的运动矢量,若其中某个宏块不存在,则相应的运动矢量赋值为0;根据所述四个宏块的运动矢量确定搜索中心;根据所述运动矢量的平均值调整搜索范围;在上述搜索范围内进行运动搜索,并利用最小绝对误差SAD准则进行匹配和提前中止判定。
与现有技术相比,本发明的运动估计方法,利用了视频图像中当前宏块与相邻宏块间的很强的空间相关性,特别是运动矢量间的强相关性,同时利用大部分相邻宏块的运动矢量代表了当前宏块基本的运动方向的特点,自适应地确定搜索中心,动态调整搜索范围的形状,能在基本不损失信噪比的前提下,大大提高搜索准确度,降低运算复杂度。与以往固定搜索区域的方法相比,它具有更高的灵活性,还可以与其他任何一种快速运动估计方法相结合。试验结果表明,在基本不影响重构图像质量的前提下,本方法平均搜索次数比全搜索方法有很大程度缩小,运算速度大大提高。
附图说明
下面结合附图与具体实施方式对本发明作进一步详细的说明:
图1本发明中当前宏块与相邻宏块位置示意图;
图2本发明的运动估计方法的流程图。
具体实施方式
本发明的方法主要依据是:视频图像运动的连续性以及图像中运动物体的整体性,从而导致了同一帧图像中相邻宏块的运动矢量具有高时空相关性,可以根据已编码块的运动矢量来预测当前块的运动矢量。通过相邻块的运动矢量预测搜索中心,使中心进一步偏向全局最优点,在全局最优点附近的小范围内,找到全局最优点的概率将大大提高,从而可以大大提高编码效率。
本发明的方法其流程包括自适应搜索中心的确定、动态调整搜索区域的大小、根据搜索匹配阈值提前中止等步骤,见图2所示。本发明的运动估计方法主要包含以下步骤:
1.获取与当前宏块相邻的四个宏块的运动矢量信息。
在4:2:0的视频编码中,编码以宏块为单位,一个宏块包含1个16×16的亮度块和2个8×8色度块。编码时,按照从左到右,从上到下的顺序一个宏块接着一个宏块进行。假设A,B,C,D为与当前宏块的相邻的左边、上边、左上和右上的四个宏块(见图1),获取这四个宏块相对应的x方向和y方向运动矢量,分别为mvx和mvy。若当前宏块四个相邻宏块中某个宏块不存在,则相应的mvx和mvy设为0。从而得到与当前宏块的左边、上边、左上和右上四个宏块相对应的4组值mvx和mvy。
2.根据上述四个宏块的运动矢量确定搜索中心的x坐标和y坐标,以search_center_x和search_center_y表示。自适应搜索中心的确定是根据图像相邻宏块之间的空间相关性,当前宏块与相邻宏块的运动矢量(motionvector)代表了图像整体的运动方向这一原理进行预测的。
具体可分以下几种情况处理:
(1)四个宏块的mvx或mvy,若0的个数大于2,则search_center_x=0,search_center_y=0;
(2)若四个宏块的mvx或mvy符号均相同,取上述四个块运动矢量的平均值作为搜索中心坐标,即
search_center_x=average(mvx_A+mvx_B+mvx_C+mvx_D),
search_center_y=average(mvy_A+mvy_B+mvy_C+mvy_D);
(3)若四个宏块的运动矢量中,有3个宏块的mvx(或mvy)符号相同,取这三个符号相同的mvx(或mvy)的中间值(即数值大小在三个数中排在中间的那个数)作为搜索中心坐标;
(4)若四个宏块的运动矢量中,X轴运动矢量mvx或Y轴运动矢量mvy符号为2正2负,则搜索中心坐标为(0,0),即search_center_x=0,search_center_y=0。
3.搜索范围(search_range_x,search_range_y)的确定。
为适应不同运动程度的视频图像序列、提高运动估计的性能,采用自适应搜索窗。扩大的搜索窗对于大运动序列,无疑可以进一步提高运动估计的精度,但对于较小运动序列,却是不必要的浪费。显然,如果能够根据序列本身的运动特性,自适应地确定一个搜索范围,使绝大部分最佳匹配点都落于该范围内,则可在保证PSNR方面性能的同时,降低运算量,提高效率。
根据运动区域的特征,特别是对同一物体,由于构成它的宏块具有高度相关的运动矢量,因此如果利用相邻宏块的运动矢量来预测当前宏块的初始运动矢量,那么找到初始搜索中心位置后,就可以使最终得到的运动矢量更接近于全局最优值,甚至优于用全搜索算法找到的运动矢量。
自适应搜索范围的确定是根据图像当前宏块的相邻宏块运动矢量的大小代表了图像整体运动的剧烈程度。在H.264中,宏块的分块方式有16×16,16×8,8×16,8×8,8×4,4×8和4×4等7种方式,运动搜索对每种分块方式独立进行,最终选取其中最佳分块方式下的最佳匹配位置。以下以16×16分块方式为例,设搜索点数为4N2(根据用户输入确定),具体实施步骤为:
1)首先计算上述四个宏块运动矢量的平均值avg_mvx,avg_mvy,即
avg_mvx=average(mvx_A+mvx_B+mvx_C+mvx_D),
avg_mvy=average(mvy_A+mvy_B+mvy_C+mvy_D);
2)根据步骤1)中四个宏块运动矢量平均值avg_mvx,avg_mvy的大小动态确定搜索范围的形状。搜索点数根据用户输入确定需搜索的像素点,假设为4N2点,设x方向搜索范围为search_range_x(其含义为搜索分布在搜索中心左边和右边各search_range_x个像素点),而y方向搜索范围为search_range_y(其含义为搜索分布在搜索中心上边和下边各search_range_y个像素点),则相应的搜索范围与搜索点数的关系应满足:2×search_range_x×2×search_range_y=4N2。搜索时,仍按照行扫描的顺序,即从左到右,从上到下,一个像素点位置接着下一像素点位置进行。
分以下几种情况分别处理:
a.若avg_mvx=0,avg_mvy不为0,则search_range_x=1,search_range_y=N×N;
b.若avg_mvy=0,avg_mvx不为0,则search_range_y=1,search_range_x=N×N;
c.若avg_mvx=0,avg_mvy=0,则search_range_y=N,search_range_x=N;
d.设|avg_mvx|/|avg_mvy|=m/n,则search_range_y=m×a,search_range_x=n×a,其中m×n×a×a=N×N。
4.在步骤3中所述的搜索范围内进行运动搜索,并利用SAD准则进行匹配和提前中止判定。
本发明方法的匹配采用SAD匹配准则,其数学表达式如下:
SAD ( i , j ) = Σ m = 1 M Σ n = 1 N | f k ( m , n ) - f l ( m + i , n + j ) |
其中,(i,j)为位移矢量分别在水平、垂直坐标上的分量,fk,fl分别为当前帧和参考帧的像素值,MxN为宏块的分块大小。SAD的计算区域根据搜索分块大小确定,在H.264中,每个宏块可分为16×16,16×8,8×16,8×8,8×4,4×8和4×4等7种分块方式,M,N值根据分块方式确定,如16×8分块方式下,M=16,N=8。根据全搜索在小区域内取得的SAD值来判定该块的时空相关性.这个SAD值也决定了编码所能接受的搜索精度与编码图像质量:即:给定一个值T(可根据该码流的场景复杂度和运动快慢确定),当SAD≤T则认为该块的时空相关性高;SAD>T则认为该块的时空相关性较弱。因此,按照这一方式,对于当前块与相邻块的时空相关性高的搜索,通过SAD≤T判定有效之后直接结束本次搜索;而对于时空相关性比较弱的情况,以少量的计算复杂度为代价,提高该块的搜索精度。
与现有技术相比,本发明提出了一种用于H.264自适应搜索中心和自适应搜索范围的快速运动估计方法,充分利用了图像当前宏块与相邻宏块间的很强的空间相关性,特别是运动矢量间的强相关性,同时充分利用大部分相邻宏块的运动矢量代表了当前宏块基本的运动方向的特点,自适应地确定搜索中心,动态调整搜索范围的形状,能在基本不损失信噪比的前提下,大大提高搜索准确度,降低运算复杂度。试验结果表明,在基本不影响重构图像质量的前提下,本方法平均搜索次数比全搜索方法有很大程度缩小,运算速度大大提高。

Claims (2)

1.一种用于H.264编码的块匹配运动估计方法,其特征在于,包括以下步骤:
(1)获取视频图像中与当前宏块相邻的左边、上边、左上和右上四个宏块的运动矢量,若其中某个宏块不存在,则相应的运动矢量赋值为0;
(2)根据所述运动矢量确定搜索中心;
所述步骤(2)中搜索中心的确定方法为:
(2.1)对于四个宏块的x轴运动矢量mvx或y轴运动矢量mvy,若0的个数大于2,则搜索中心坐标为(0,0);
(2.2)若四个宏块的x轴运动矢量mvx或y轴运动矢量mvy符号均相同,取各自的平均值作为搜索中心坐标;
(2.3)若四个宏块的x轴运动矢量mvx或y轴运动矢量mvy中,有三个宏块的x轴运动矢量mvx或y轴运动矢量mvy符号相同:取所述三个符号相同的宏块中,x轴运动矢量mvx或y轴运动矢量mvy的数值大小排在中间的宏块的x轴运动矢量mvx或y轴运动矢量mvy的数值作为搜索中心坐标;
(2.4)若四个宏块的x轴运动矢量mvx或y轴运动矢量mvy中,其符号为2正2负,则搜索中心坐标为(0,0);
(3)根据所述运动矢量的平均值调整搜索范围;
(4)在步骤(3)中所述的搜索范围内进行运动搜索,并利用最小绝对误差SAD准则进行匹配和提前中止判定。
2.按照权利要求1所述的块匹配运动估计方法,其特征在于,所述步骤(3)中调整搜索范围的方法为:
(1)计算所述四个宏块运动矢量的平均值avg_mvx,avg_mvy;
(2)根据上述四个宏块运动矢量平均值的大小确定搜索范围,分以下情况处理,其中4N2为需搜索像素点数:
a)若avg_mvx=0,avg_mvy不为0,则x方向搜索范围为1,y方向搜索范围为N×N;
b)若avg_mvy=0,avg_mvx不为0,则y方向搜索范围为1,x方向搜索范围为N×N;
c)若avg_mvx=0,avg_mvy=0,则y方向搜索范围为N,x方向搜索范围为N;
d)若|avg_mvx |/|avg_mvy|=m/n,则y方向搜索范围为m×a,x方向搜索范围为n×a,其中m×n×a×a=N×N。
CN 200710094054 2007-08-31 2007-08-31 用于h.264编码的块匹配运动估计方法 Expired - Fee Related CN101378504B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 200710094054 CN101378504B (zh) 2007-08-31 2007-08-31 用于h.264编码的块匹配运动估计方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 200710094054 CN101378504B (zh) 2007-08-31 2007-08-31 用于h.264编码的块匹配运动估计方法

Publications (2)

Publication Number Publication Date
CN101378504A CN101378504A (zh) 2009-03-04
CN101378504B true CN101378504B (zh) 2011-12-07

Family

ID=40421796

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 200710094054 Expired - Fee Related CN101378504B (zh) 2007-08-31 2007-08-31 用于h.264编码的块匹配运动估计方法

Country Status (1)

Country Link
CN (1) CN101378504B (zh)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6765964B1 (en) 2000-12-06 2004-07-20 Realnetworks, Inc. System and method for intracoding video data
CN101577826B (zh) * 2009-03-12 2014-04-23 北京中星微电子有限公司 视频编码中的运动搜索控制方法和控制装置
CN101873483B (zh) * 2009-04-24 2012-08-29 深圳市九洲电器有限公司 一种运动估计方法及采用运动估计方法的编码芯片、装置
US8917769B2 (en) 2009-07-03 2014-12-23 Intel Corporation Methods and systems to estimate motion based on reconstructed reference frames at a video decoder
US8462852B2 (en) * 2009-10-20 2013-06-11 Intel Corporation Methods and apparatus for adaptively choosing a search range for motion estimation
US9654792B2 (en) 2009-07-03 2017-05-16 Intel Corporation Methods and systems for motion vector derivation at a video decoder
WO2012083487A1 (en) 2010-12-21 2012-06-28 Intel Corporation System and method for enhanced dmvd processing
CN102340663B (zh) * 2010-07-22 2013-02-27 华为技术有限公司 图像运动估计方法和装置
CN101977325B (zh) * 2010-11-19 2012-02-22 上海师范大学 一种新型块匹配运动估计方法
CN102547262B (zh) * 2010-12-24 2016-08-17 盛乐信息技术(上海)有限公司 视频编码运动估计方法
CN102625293B (zh) 2012-03-21 2014-11-05 华为技术有限公司 通知和获知地址信息失效的方法、装置及系统
CN102740073B (zh) * 2012-05-30 2015-06-17 华为技术有限公司 一种编码方法及装置
CN103596012B (zh) * 2013-11-14 2017-05-10 山东电子职业技术学院 一种实时的基于avs的视频帧率转码中帧间宏块类型选择方法
CN109496431A (zh) * 2016-10-13 2019-03-19 富士通株式会社 图像编码/解码方法、装置以及图像处理设备
CN112104871B (zh) * 2020-11-13 2021-03-02 腾讯科技(深圳)有限公司 一种数据编码方法、装置以及计算机可读存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1791224A (zh) * 2005-12-19 2006-06-21 宁波大学 一种基于h.264的自适应块搜索范围快速运动估计方法
CN101001380A (zh) * 2006-01-10 2007-07-18 英业达股份有限公司 视频编码的移动估计方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1791224A (zh) * 2005-12-19 2006-06-21 宁波大学 一种基于h.264的自适应块搜索范围快速运动估计方法
CN101001380A (zh) * 2006-01-10 2007-07-18 英业达股份有限公司 视频编码的移动估计方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
邹晓春,等.一种块匹配的快速运动估计算法.《中国图象图形学报》.2006,第11卷(第7期),938-942. *

Also Published As

Publication number Publication date
CN101378504A (zh) 2009-03-04

Similar Documents

Publication Publication Date Title
CN101378504B (zh) 用于h.264编码的块匹配运动估计方法
EP1960967B1 (en) Motion estimation using prediction guided decimated search
US10097851B2 (en) Perceptual optimization for model-based video encoding
RU2381630C2 (ru) Способ и устройство для определения качества соответствия блока
JP6698077B2 (ja) モデルベースの映像符号化用の知覚的最適化
EP1294194B1 (en) Apparatus and method for motion vector estimation
KR0181069B1 (ko) 움직임 추정장치
CN100468982C (zh) 用于执行高质量快速预测运动搜索的方法和设备
KR0171154B1 (ko) 특징점 기반 움직임 추정을 이용하여 비디오 신호를 부호화하는 방법 및 장치
US5832115A (en) Ternary image templates for improved semantic compression
KR100619377B1 (ko) 움직임 추정 방법 및 장치
US20070064799A1 (en) Apparatus and method for encoding and decoding multi-view video
CN101888546B (zh) 一种运动估计的方法及装置
WO2000034920A1 (en) Motion vector estimation
CN109889838B (zh) 一种基于roi区域的hevc快速编码方法
KR100723840B1 (ko) 영상 움직임 추정 장치
CN102572438B (zh) 一种基于图像纹理和运动特征的运动预测方法
KR100987581B1 (ko) 고속 움직임 추정을 위한 부분 블록정합 방법
CN100469141C (zh) 一种视频数据压缩的运动估计方法
Ashwin et al. Study of the contemporary motion estimation techniques for video coding
KR0181068B1 (ko) 움직임 추정장치
CN100414998C (zh) 一种视频数据压缩中运动估计的方法
CN101977325B (zh) 一种新型块匹配运动估计方法
CN111327909B (zh) 一种针对3d-hevc的快速深度编码方法
KR100207397B1 (ko) 영상 부호화 시스템의 움직임 예측장치 및 방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
ASS Succession or assignment of patent right

Owner name: KUNSHAN JADE TECHNOLOGIES CO., LTD.

Free format text: FORMER OWNER: SHANGHAI JADE TECHNOLOGIES CO., LTD.

Effective date: 20100721

C41 Transfer of patent application or patent right or utility model
COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; FROM: 201203 BUILDING 16, NO.115, LANE 572, BIBO ROAD, ZHANGJIANG HIGH-TECH INDUSTRIAL ZONE, PUDONG NEW AREA, SHANGHAI CITY TO: 215311 TOWER ABCD, 12/F, SOUTH BUILDING, KUNSHAN PUDONG SOFTWARE PARK, BACHENG TOWN, KUNSHAN CITY

TA01 Transfer of patent application right

Effective date of registration: 20100721

Address after: A ABCD 12 layer 215311 town Kunshan city Kunshan Pudong Software Park South

Applicant after: Shanghai Jade Technologies Co., Ltd.

Address before: 201203, No. 16, building 572, Lane 115, blue wave road, Zhangjiang hi tech park, Shanghai, Pudong New Area

Applicant before: Shanghai Jiede Microelectronic Co., Ltd.

C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20111207

Termination date: 20120831