CN106604035A - 一种用于视频编码和压缩的运动估计的方法 - Google Patents
一种用于视频编码和压缩的运动估计的方法 Download PDFInfo
- Publication number
- CN106604035A CN106604035A CN201710052892.3A CN201710052892A CN106604035A CN 106604035 A CN106604035 A CN 106604035A CN 201710052892 A CN201710052892 A CN 201710052892A CN 106604035 A CN106604035 A CN 106604035A
- Authority
- CN
- China
- Prior art keywords
- search
- best point
- prediction
- threshold value
- advance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/513—Processing of motion vectors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/56—Motion estimation with initialisation of the vector search, e.g. estimating a good candidate to initiate a search
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/567—Motion estimation based on rate distortion criteria
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/573—Motion compensation with multiple frame prediction using two or more reference frames in a given prediction direction
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本发明公开了一种用于视频编码的运动估计的方法,该发明在运动估计过程中使用自适应的搜索范围和提前终止策略以节省不必要的搜索点,并且引入前一帧相同位置的块及其上下左右四个相邻块的运动矢量以提高预测矢量的准确性,同时基于预测矢量的大小采用不同模板进行搜索。本文采用的技术方案在保证编码质量的情况下,有效地降低了运动估计的复杂度。
Description
技术领域
本发明涉及多媒体技术领域中的视频编码和压缩,特别是涉及视频编码的快速运动估计。
背景技术
运动估计的块匹配方法是视频压缩的主流技术,已经被许多视频编码标准所应用,尤其在低码率方面,H264比MPEG-4而言,可以获得很高的编码效率有明显的提高,非常适合低宽带、高质量网络视频应用的需要。但是,H264为了提高编码效率,采用了许多高计算复杂度的算法。
许多研究致力于如何在运动估计过程中利用提前终止策略加速视频编码。在块匹配过程中,当匹配代价小于事先定义好的提前终止阈值时,可认为当前搜索的块为全局最佳并终止搜索,节省了搜索点数,从而加速运动估计的进程。可见,为了保证编码性能的损失尽可能小,提前终止阈值的设定就显得至关重要。在运动估计过程中搜索范围一般都是固定的,如果能够根据视频序列的特性动态调整搜索范围,就可以更快地找到最佳运动矢量,节省搜索点数,从而降低编码的计算量。
然而现有的搜索范围的调整策略都是基于同一帧内已编码相邻块的运动矢量的大小来改变搜索范围的。然而较大的运动矢量并不意味着需要一个大的搜索范围,这是因为搜索的起点不是原点,而是相对原点位移等于预测矢量的点。这使得大量不必要的搜索点被无效搜索,复杂度仍然较高。
发明内容
本发明的目的在于提出了一种用于视频编码的运动估计的方法:使用提前终止策略,结合运动矢量预测以及不同的搜索模板在自适应的搜索范围内进行块匹配,可以有效地降低运动估计的计算量。
本发明解决其技术问题采用的技术方案如下:
一种用于视频编码的运动估计的方法。首先,进行最初起始点预测:依次使用空间中值预测、上层预测、时间域邻近参考帧预测来预测当前块的运动矢量;
其次,计算提前终止阈值:设T1、T2、T3、T4、T5、T6和T7分别表示16×16、16×8、8×16、8×8、8×4、4×8和4×4块的提前终止阈值,当前帧的序号为t,16×16块的提前终止阈值定义为:
T1=min{Jt-1,Jt(a),Jt(b)Jt(c),Jt(d)}
其中:Jt-1表示前一帧相同位置宏块的最小匹配代价Jmin;Jt(a)、Jt(b)、Jt(c)、Jt(d)分别表示当前宏块的相邻块a、b、c、d的最小匹配代价Jmin。上式的含义是取五个Jmin中的最小值作为当前编码宏块的提前终止阈值;
第三,定义搜索范围大小:取Ma、Mb、Mc和Md与预测矢量坐标差值的最大值作为搜索范围search_range的大小,定义如下:
search_range=max{|Mi(x)-PMVx|,|MVi(y)-PMVy|}i∈{a,b,c,d}
其中:MVi(x)和MVi(y)表示预测矢量MVi的横坐标和纵坐标,PMVx和PMVy分别为预测矢量的横坐标和纵坐标。上式计算得到的当前搜索窗口为边长等于2×search_range的方形区域;
当匹配误差大于预定门限值时,采用双重搜索模板,增加搜索路径,找到全局最优点;分别以预测点集中的最优点和次优点作为精细搜索的起始点,形成两条独立的搜索路径。
最后,利用矩形模板和六边形模板进行最佳点搜索:
即首先进行边长为2的六边形模板搜索。如果当前最佳点的匹配代价小于提前终止阈值,终止搜索;如果当前最佳点为搜索中心或处于搜索范围以外,则以当前最佳点为中心进行六边形模板搜索,直到出现最佳点的匹配代价小于提前终止阈值、最佳点在中心和最佳点在搜索范围外这三种情形之一为止。
根据本发明的用于视频编码的运动估计的方法,进一步包括,在进行运动矢量预测时:
(1)中值预测后不直接用十字模板进行搜索,而是先进行原点预测,如果最小失真率小于自适应的阈值,则结束搜索,否则,作十字模板搜索。
(2)进行上层预测和相邻参考帧预测后,不直接做十字搜索,而是先判断最小失真率与自适应阈值的大小,若最小失真率小于自适应的阈值,结束搜索。
根据本发明的用于视频编码的运动估计的方法,在利用矩形模板和六边形模板进行搜索之后,如果当前最佳点的匹配代价小于预定最小绝对差值和,则以当前最佳点为中心进行一次九点均布的矩形模板搜索,得到优化的最佳点。
本发明与背景技术相比,具有的以下有益效果:解决了运动估计的高计算复杂度问题,在运动估计过程中使用自适应的搜索范围和提前终止策略以节省不必要的搜索点,并且引入前一帧相同位置的块及其上下左右四个相邻块的运动矢量以提高预测矢量的准确性,同时基于预测矢量的大小采用不同模板进行搜索。本文采用的技术方案在保证编码质量的情况下,有效地降低了运动估计的复杂度。
附图说明
图1是根据本发明运动估计方法的流程图。
具体实施方式
下面参照附图进一步描述本发明的优选实施例。
如图1所示,在视频编码过程对任一宏块利用H.264标准的参考实现软件JM中定义的全搜索方法,得到在参考帧上的运动矢量MV,其中N为参考帧的数目。
首先,进行最初起始点预测:依次使用空间中值预测、上层预测、时间域邻近参考帧预测来预测当前块的运动矢量。其中在进行运动矢量预测时:
(1)中值预测后不直接用十字模板进行搜索,而是先进行原点预测,如果最小率失真min_mcost小于自适应的阈值ET,则结束搜索,否则,作十字模板搜索。
(2)进行上层预测和相邻参考帧预测后,不直接做十字搜索,而是先判断min_mcost与ET的大小,若min_mcost<ET,结束搜索。
为了进一步减少预测点数,在经过此阈值判断之后,再增加一个内容自适应的新阈值来判断是否可提前结束搜索。
其次,计算提前终止阈值:
设T1、T2、T3、T4、T5、T6和T7分别表示16×16、16×8、8×16、8×8、8×4、4×8和4×4块的提前终止阈值,当前帧的序号为t,16×16块的提前终止阈值定义为:
T1=min{Jt-1,Jt(a),Jt(b)Jt(c),Jt(d)}
其中:Jt-1表示前一帧相同位置宏块的最小匹配代价Jmin;Jt(a)、Jt(b)、Jt(c)、Jt(d)分别表示相邻块a、b、c、d的最小匹配代价Jmin。上式的含义是取T1-T7的五个Jmin中的最小值作为当前编码宏块的提前终止阈值。
第三,定义搜索范围大小:
取Ma、Mb、Mc和Md与预测矢量坐标差值的最大值作为搜索范围search_range的大小,定义如下:
search_range=max{|Mi(x)-PMVx|,|MVi(y)-PMVy|}
i∈{a,b,c,d}
其中:MVi(x)和MVi(y)表示预测矢量MVi的横坐标和纵坐标,PMVx和PMVy分别为预测矢量的横坐标和纵坐标。上式计算得到的当前搜索窗口为边长等于2×search_range的方形区域。
当匹配误差大于预定门限值时,采用双重搜索模板,增加搜索路径,找到全局最优点;分别以预测点集中的最优点和次优点作为精细搜索的起始点,形成两条独立的搜索路径。
最后,利用矩形模板和六边形模板进行最佳点搜索。
首先进行一次边长为2的六边形模板搜索。如果当前最佳点的匹配代价小于提前终止阈值,终止搜索;如果当前最佳点为搜索中心或处于搜索范围以外,则当前最佳点为中心进行六边形模板搜索,直到出现最佳点的匹配代价小于提前终止阈值、最佳点在中心和最佳点在搜索范围外这三种情形之一为止。
如果当前最佳点的匹配代价小于预定最小绝对差值和,则以当前最佳点为中心进行一次九点均布的矩形模板搜索,得到优化的最佳点。
本文上述算法在保持与MPEG算法接近的编码性能的同时,计算复杂度大幅降低。与传统算法相比,在重建图像质量和码率接近的情况下,最多可减少45.39%的运动估计时间,平均节省32.76%。
本领域技术人员显而易见的是,本文采用的技术方案,基于预测矢量的大小采用不同模板进行搜索。在保证编码质量的情况下,有效地降低了运动估计的复杂度。
应该理解,上述实施例是针对特定情况下进行描述的,但是本发明并不局限于该实施例,在不脱离本发明精神和范围的情况下,可以对本发明做出各种各样的改进和变型。
Claims (3)
1.一种用于视频编码的运动估计的方法,其特征在于包括以下步骤:
依次使用空间中值预测、上层预测、时间域邻近参考帧预测来预测当前编码宏块的运动矢量;
将16×16、16×8、8×16、8×8、8×4、4×8和4×4块的提前终止阈值分别表示为T1、T2、T3、T4、T5、T6和T7,若当前帧的序号为t,则16×16块的提前终止阈值定义为:
T1=min{Jt-1,Jt(a),Jt(b)Jt(c),Jt(d)}
其中:Jt-1表示前一帧相同位置宏块的最小匹配代价Jmin;Jt(a)、Jt(b)、Jt(c)、Jt(d)分别表示相邻块a、b、c、d的最小匹配代价Jmin;
取五个Jmin中的最小值作为当前编码宏块的提前终止阈值;
取Ma、Mb、Mc和Md与预测矢量坐标差值的最大值作为搜索范围search_range的大小,即:
search_range=max{|Mi(x)-PMVx|,|MVi(y)-PMVy|}i∈{a,b,c,d}
其中:MVi(x)和MVi(y)表示预测矢量MVi的横坐标和纵坐标,PMVx和PMVy分别为预测矢量的横坐标和纵坐标;
得到的当前搜索窗口为边长等于2×search_range的方形区域;
当匹配误差大于一预定门限值时,采用双重搜索模板,增加搜索路径,找到全局最优点;分别以预测点集中的最优点和次优点作为精细搜索的起始点,形成两条独立的搜索路径;
进行边长为2的六边形模板搜索,如果当前最佳点的匹配代价小于提前终止阈值,终止搜索;
如果当前最佳点为搜索中心或处于搜索范围以外,则以当前最佳点为中心进行六边形模板搜索,直到出现最佳点的匹配代价小于提前终止阈值、最佳点在中心和最佳点在搜索范围外这三种情形之一为止。
2.根据权利要求1的用于视频编码的运动估计的方法,进一步包括,在进行运动矢量预测时:
中值预测后先进行原点预测,如果最小失真率小于自适应的阈值,则结束搜索,否则,作十字模板搜索;
进行上层预测和相邻参考帧预测后,先判断最小失真率与自适应阈值的大小,若最小失真率小于自适应的阈值,结束搜索。
3.根据权利要求1的用于视频编码的运动估计的方法,进一步包括,在利用矩形模板和六边形模板进行搜索之后,如果当前最佳点的匹配代价小于预定最小绝对差值和,则以当前最佳点为中心进行九点均布的矩形模板搜索,得到优化的最佳点。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710052892.3A CN106604035B (zh) | 2017-01-22 | 2017-01-22 | 一种用于视频编码和压缩的运动估计的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710052892.3A CN106604035B (zh) | 2017-01-22 | 2017-01-22 | 一种用于视频编码和压缩的运动估计的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106604035A true CN106604035A (zh) | 2017-04-26 |
CN106604035B CN106604035B (zh) | 2019-10-18 |
Family
ID=58585177
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710052892.3A Active CN106604035B (zh) | 2017-01-22 | 2017-01-22 | 一种用于视频编码和压缩的运动估计的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106604035B (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109660800A (zh) * | 2017-10-12 | 2019-04-19 | 北京金山云网络技术有限公司 | 运动估计方法、装置、电子设备及计算机可读存储介质 |
WO2019085892A1 (en) * | 2017-11-02 | 2019-05-09 | Mediatek Inc. | Method and apparatus for video coding |
CN110147750A (zh) * | 2019-05-13 | 2019-08-20 | 深圳先进技术研究院 | 一种基于运动加速度的图像搜索方法、系统及电子设备 |
CN110662033A (zh) * | 2018-06-28 | 2020-01-07 | 杭州海康威视数字技术股份有限公司 | 一种解码、编码方法及其设备 |
CN110832859A (zh) * | 2017-07-11 | 2020-02-21 | 华为技术有限公司 | 一种基于模板匹配的解码方法及装置 |
CN113365081A (zh) * | 2021-05-27 | 2021-09-07 | 深圳市杰理微电子科技有限公司 | 视频编码中运动估计优化方法与装置 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101001377A (zh) * | 2007-01-09 | 2007-07-18 | 浙江大学 | 一种基于多参考帧的h.264快速运动估计的方法 |
CN101184233A (zh) * | 2007-12-12 | 2008-05-21 | 中山大学 | 一种基于cfrfs数字视频压缩编码的方法 |
CN101431675A (zh) * | 2008-12-09 | 2009-05-13 | 青岛海信电子产业控股股份有限公司 | 一种像素运动估计方法和装置 |
CN101621694A (zh) * | 2009-07-29 | 2010-01-06 | 深圳市九洲电器有限公司 | 一种运动估计方法、系统及显示终端 |
US20140205013A1 (en) * | 2013-01-23 | 2014-07-24 | Electronics And Telecommunications Research Institute | Inter-prediction method and apparatus |
CN103957420A (zh) * | 2014-04-30 | 2014-07-30 | 华南理工大学 | 一种h.264运动估计编码的全面运动估计改进算法 |
US20140219355A1 (en) * | 2013-02-01 | 2014-08-07 | Semiconductor Technology Academic Research Center | Motion estimation device |
CN104159124A (zh) * | 2014-08-20 | 2014-11-19 | 哈尔滨工业大学 | 一种改进的多视点视频运动估计搜索方法 |
-
2017
- 2017-01-22 CN CN201710052892.3A patent/CN106604035B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101001377A (zh) * | 2007-01-09 | 2007-07-18 | 浙江大学 | 一种基于多参考帧的h.264快速运动估计的方法 |
CN101184233A (zh) * | 2007-12-12 | 2008-05-21 | 中山大学 | 一种基于cfrfs数字视频压缩编码的方法 |
CN101431675A (zh) * | 2008-12-09 | 2009-05-13 | 青岛海信电子产业控股股份有限公司 | 一种像素运动估计方法和装置 |
CN101621694A (zh) * | 2009-07-29 | 2010-01-06 | 深圳市九洲电器有限公司 | 一种运动估计方法、系统及显示终端 |
US20140205013A1 (en) * | 2013-01-23 | 2014-07-24 | Electronics And Telecommunications Research Institute | Inter-prediction method and apparatus |
US20140219355A1 (en) * | 2013-02-01 | 2014-08-07 | Semiconductor Technology Academic Research Center | Motion estimation device |
CN103957420A (zh) * | 2014-04-30 | 2014-07-30 | 华南理工大学 | 一种h.264运动估计编码的全面运动估计改进算法 |
CN104159124A (zh) * | 2014-08-20 | 2014-11-19 | 哈尔滨工业大学 | 一种改进的多视点视频运动估计搜索方法 |
Non-Patent Citations (1)
Title |
---|
许娜: "基于H.264/AVC运动估计算法研究及优化", 《中国优秀硕士学位论文全文数据库》 * |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110832859A (zh) * | 2017-07-11 | 2020-02-21 | 华为技术有限公司 | 一种基于模板匹配的解码方法及装置 |
CN109660800A (zh) * | 2017-10-12 | 2019-04-19 | 北京金山云网络技术有限公司 | 运动估计方法、装置、电子设备及计算机可读存储介质 |
CN109660800B (zh) * | 2017-10-12 | 2021-03-12 | 北京金山云网络技术有限公司 | 运动估计方法、装置、电子设备及计算机可读存储介质 |
WO2019085892A1 (en) * | 2017-11-02 | 2019-05-09 | Mediatek Inc. | Method and apparatus for video coding |
US11750832B2 (en) | 2017-11-02 | 2023-09-05 | Hfi Innovation Inc. | Method and apparatus for video coding |
CN110662033A (zh) * | 2018-06-28 | 2020-01-07 | 杭州海康威视数字技术股份有限公司 | 一种解码、编码方法及其设备 |
CN110662033B (zh) * | 2018-06-28 | 2021-11-23 | 杭州海康威视数字技术股份有限公司 | 一种解码、编码方法及其设备 |
CN110147750A (zh) * | 2019-05-13 | 2019-08-20 | 深圳先进技术研究院 | 一种基于运动加速度的图像搜索方法、系统及电子设备 |
CN110147750B (zh) * | 2019-05-13 | 2021-08-24 | 深圳先进技术研究院 | 一种基于运动加速度的图像搜索方法、系统及电子设备 |
CN113365081A (zh) * | 2021-05-27 | 2021-09-07 | 深圳市杰理微电子科技有限公司 | 视频编码中运动估计优化方法与装置 |
Also Published As
Publication number | Publication date |
---|---|
CN106604035B (zh) | 2019-10-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106604035A (zh) | 一种用于视频编码和压缩的运动估计的方法 | |
CN105049850B (zh) | 基于感兴趣区域的hevc码率控制方法 | |
US7720154B2 (en) | System and method for fast variable-size motion estimation | |
CN101394566B (zh) | 一种十字菱形运动估计搜索方法 | |
CN101420617B (zh) | 一种十字六边形运动估计搜索方法 | |
CN103957420B (zh) | 一种h.264运动估计编码的全面运动估计改进算法 | |
CN103414899A (zh) | 一种视频编码的运动估计方法 | |
CN103384324A (zh) | 一种avs-m视频编码快速亚像素运动估计方法 | |
CN101237580A (zh) | 基于中心预测的整数像素快速混合搜索方法 | |
CN112235570A (zh) | 基于预编码的快速预测方法 | |
CN102164283A (zh) | 一种基于avs的亚像素运动估计方法 | |
Peng et al. | Fast intra-frame coding algorithm for versatile video coding based on texture feature | |
Li et al. | Efficient search and mode prediction algorithms for motion estimation in H. 264/AVC | |
CN109547798A (zh) | 一种快速的hevc帧间模式选择方法 | |
CN102387364B (zh) | 一种快速帧内模式选择算法 | |
KR101242560B1 (ko) | 탐색 영역 조정 장치 및 방법 | |
Amirpour et al. | Predictive Three Step Search (PTSS) algorithm for motion estimation | |
Liu et al. | An adaptive motion estimation scheme for video coding | |
CN103200404A (zh) | 基于宏块运动活跃度的编码模式快速预测方法 | |
Lin et al. | A new class-based early termination method for fast motion estimation in video coding | |
CN105611299A (zh) | 一种基于hevc的运动估计方法 | |
KR20080022843A (ko) | 움직임 벡터를 이용한 탐색 영역 조절 방법 | |
Pal | An optimized block matching algorithm for motion estimation using logical image | |
Hong-ye et al. | Cross-Hexagon-based motion estimation algorithm using motion vector adaptive search technique | |
Hsia et al. | Fast multi-frame motion estimation for H264/AVC system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |