CN102790883B - 一种图像压缩运动向量搜索方法 - Google Patents
一种图像压缩运动向量搜索方法 Download PDFInfo
- Publication number
- CN102790883B CN102790883B CN201210261949.8A CN201210261949A CN102790883B CN 102790883 B CN102790883 B CN 102790883B CN 201210261949 A CN201210261949 A CN 201210261949A CN 102790883 B CN102790883 B CN 102790883B
- Authority
- CN
- China
- Prior art keywords
- mad
- search
- minimum point
- searching
- length
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本发明属于图像处理领域,具体涉及一种图像压缩运动向量搜索方法。目的是解决传统的H.264视频压缩算法中帧间运动向量搜索算法运算量大,搜索效率不高等问题。该方法以小步长搜索宏块中心的近距离区域,以大步长搜索宏块中心的远距离区域,并计算MAD值,若MAD最小值点在中心则结束搜索;若不在中心,则继续搜索MAD最小值点。该方法利用图像序列自身内容特点,采用了非对称步长的搜索图案,并且利用运动向量分级搜索策略,简化了搜索算法的运算量,提高了运动向量搜索的精度和效率。
Description
技术领域
本发明属于图像处理领域,具体涉及一种图像压缩运动向量搜索方法,尤其是一种数字图像压缩中新型的快速帧间运动向量搜索方法。
背景技术
视觉是人类最高级的感知器官,图像在人类的感知中扮有重要角色,随着计算机技术的发展和普及,数字图像相比于模拟图像具有更加便于传输、存储等优势,但是数字图像,尤其是近年来普及的高清数字图像的不足是数据量巨大,为传输带宽和存储容量带来了巨大的考验,所以数字图像压缩技术成为了近期研究的热点问题,H.264视频编码标准凭借更高效、更快捷的技术优势,成为ITU最新的国际视频编码标准。
在H.264算法中,帧间运动向量搜索算法要耗用整个压缩算法编码时间的50%以上(单前向参考帧),所以如何提出一种新型的快速帧间运动向量搜索算法具有十分重要的意义。
图像帧间压缩技术是利用连续图像序列中的时间冗余特性对图像数据进行压缩,时间冗余特性是指相邻两帧(几帧)图像对应位置的图像内容基本一致,只是少数图像宏块(图像压缩一般以宏块作为计算处理的基本单元)有一定位置的少量偏移,这种偏移称为该宏块的运动向量,在图像压缩过程中只需要利用前帧图像原位置的像素信息,加上本宏块的运动向量即可恢复当前帧的图像信息,图像帧间压缩技术大大减小了图像传输、存储所需的数据量,达到图像压缩的目的。
搜索当前宏块的运动向量一般采用宏块匹配算法,即把当前图像和参考帧分块,然后确定搜索范围的大小,把宏块在参考帧图像中移动并匹配,如图1所示。图中浅色区域为参考帧宏块,深色区域为当前帧宏块,定义平均绝对误差(MAD)为价值函数,以MAD值最小的宏块移动向量为当前宏块的运动向量。
其中N为宏块大小,C为当前帧像素值,R为参考帧像素值。
传统的运动向量搜索算法包括全搜索算法、三步法、新三步法、菱形算法等方法。全搜索法是从原点开始以1像素为步长,在搜索范围内逐点进行模板匹配;三步法如图2所示,先以最大搜索长度的一半为步长,搜索中心及周围的8个点,找出MAD值最小的向量,然后将搜索步长减半,继续搜索周围的8个点,找出MAD值最小的向量,最后再次将搜索步长减半,继续搜索周围的8个点,此时的向量即为当前宏块的运动向量。
新三步法如图3所示,搜索步骤1和原方法相同,在第二步中以步长为1对周围的8个点进行搜索,若MAD值最小点在中心则搜索结束,若MAD最小值在8个点中的一个,则以此点为中心,再次搜索周围的8个点,以MAD最小点处为该宏块运动向量。
菱形算法如图4所示,分为大搜索模式(LDSP)和小搜索模式(SDSP),第一步用LDSP按照菱形图案计算MAD值,若最小值点在中心则转到第三步,否则进行第二步,缩小步长为1对周围8个点进行搜索,若MAD最小值在中心则停止搜索,否则第三步,以最小值点为中心,以步长为1对周围8个点再次搜索,确定该宏块的运动向量。
在运动向量搜索算法中还有其他如四步法,六边形算法等,本质上都是在各个方向上以等长的均匀距离步长,对运动向量进行搜索。这些算法都是以宏块在各个方向上运动是等概率的,且在特定方向运动的距离也是等概率的,然而图像当前宏块在各个方向变化的距离并不是等概率的,宏块在小范围内移动的概率要远大于大范围移动。
发明内容
本发明针对传统的H.264视频压缩算法中帧间运动向量搜索算法运算量大,搜索效率不高等问题,提出一种基于非对称分级帧间运动向量搜索方法。
本发明所采用的技术方案是:
一种图像压缩运动向量搜索方法,以小步长搜索宏块中心的近距离区域,以大步长搜索宏块中心的远距离区域,并计算MAD值,若MAD最小值点在中心则结束搜索;若不在中心,则继续搜索MAD最小值点。
所述近距离区域为距离当前参考宏块中心棋盘距离小于等于小步长的几何区域;
所述远距离区域为距离当前参考宏块中心棋盘距离大于小步长且小于等于大步长的几何区域。
如上所述的一种图像压缩运动向量搜索方法,其中:所述继续搜索MAD最小值点为:若上次计算的MAD最小值点在宏块中心的近距离区域,则以当前MAD最小值点为中心进行近距离区域搜索得到MAD最小值点;否则以当前MAD最小值点为中心进行近距离区域以及远距离区域搜索得到MAD最小值点;若最新的MAD最小值点在中心则结束搜索,否则以最新的MAD最小值点为中心搜索近距离区域再次得到MAD最小值点。
如上所述的一种图像压缩运动向量搜索方法,其中:所述继续搜索时,保留之前计算的MAD值,在近距离区域或远距离区域搜索时只计算未搜索过的位置的MAD值。
如上所述的一种图像压缩运动向量搜索方法,其中:所述小步长为D,所述大步长为2D+1。
本发明的有益效果是:
该方法利用图像序列自身内容特点,采用了非对称步长的搜索图案,并且利用运动向量分级搜索策略,简化了搜索算法的运算量,提高了运动向量搜索的精度和效率。
附图说明
图1是运动向量宏块匹配示意图;
图2是三步法搜索运动向量;
图3是新三步法搜索运动向量;
图4是菱形算法搜索运动向量;
图5是本发明提供的一种图像压缩运动向量搜索方法的流程图;
图6是图5中第1步的搜素示意图;
图7是图5中第2步的搜素示意图;
图8是图5中第3步的搜素示意图;
图9是图5中第4步的搜素示意图;
具体实施方式
下面结合附图和实施例对本发明提供的一种图像压缩运动向量搜索方法进行介绍:
一种图像压缩运动向量搜索方法,以小步长搜索宏块中心近距离区域,以大步长搜索宏块中心远距离区域,并根据每一步搜索MAD最小值的位置分级中止搜索过程,并且在后级搜索时充分利用前级搜索的计算结果,减小了计算量,减轻算法对硬件的要求,采用分级搜索的策略还可以扩大运动向量的搜索范围。
该方法利用了当前宏块中心与参考帧中心棋盘距离越小,匹配概率越高;与参考帧中心棋盘距离越大,匹配概率越低的统计规律。并进行如下定义:
棋盘距离:定义P点坐标为(x,y),Q点坐标为(s,t),则P点与Q点的棋盘距离D(P,Q)=max(|x-s|,|y-t|)。
近距离区域:定义距离当前参考宏块中心棋盘距离小于等于小步长(例如D)的几何区域为近距离区域。
远距离区域:距离当前参考宏块中心棋盘距离大于小步长(例如D),小于等于大步长(例如2D+1)的几何区域为远距离区域。
如图5所示,一种图像压缩运动向量搜索方法,在与参考帧宏块中心的近距离区域,以步长D采取小步长搜索;在远距离区域,以步长2D+1采取大步长搜索,并按照MAD匹配情况实时更新最小的MAD值及其位置,若最小MAD值出现在本步骤的中心的像素位置,则中途停止搜索,若最小MAD值出现在非中心位置,则分步骤的继续采用非对称步长进行搜索,直至完成全部搜索流程。在搜索步长的选择上采用近距离步长为D,远距离步长为2D+1的统一标准,若前一步骤的中心点更新至下一步骤的中心点时,两点的棋盘距离互为D或2D+1,所以在当前步骤的计算过程中可以直接利用前步骤的匹配结果,这样的非对称步长选择可以显著降低匹配运算的计算量。在相同计算量的条件下,能够扩大运动向量的搜索范围。
具体流程可优选举例如下:
步骤S1:如图6所示以当前宏块中心位置为原点,以步长为1搜索原点四周4个点(该4个点为近距离区域)以及原点的MAD值,以步长为3搜索原点四周8个点(该8个点为远距离区域)的MAD值。若MAD的最小值位置在原点,则直接中止搜索流程;若MAD最小值点在近距离区域则转至步骤S2,否则转至步骤S3。此步骤需要计算的MAD次数为14。
步骤S2:如图7所示,若上次计算的MAD最小值在原点的近距离区域,则以当前MAD最小值点为中心进行搜索,可以根据上次计算的结果,只需再计算周围5个点(近距离区域)的MAD,找到最小值即可中止搜索流程。此步骤需要计算的MAD次数为5。
步骤S3:如图8所示,若上次计算(步骤S1)的MAD最小值在原点的远距离区域,以当前MAD最小值点为中心再次以非对称步长进行搜索,即以步长为1搜索近距离区域四周4个点的MAD值,以步长为3搜索远距离区域8个点的MAD值;在此步骤计算中仍然可以利用前步骤计算结果,只需再计算周围9个点的MAD,若找到的最小值在此步骤的中心,则可中止搜索流程,否则转至步骤S4。此步骤需要计算的MAD次数为9。
步骤S4:如图9所示,计算周围4个点的MAD,找到最小值,即可终止搜索流程。此步骤需要计算的MAD次数为4。
本方法与之前提出的传统方法相比,在计算量、搜索范围等方面都具有显著优势。下面估计一下本搜索方法的计算量,记第一步中MAD最小值出现在中心点及近距离区域的概率为f1,由于在不同应用中的图像序列内容不同,但是大部分的运动向量都集中在中心点附近,不失一般性我们假设f1的取值范围在0.6<f1<0.8,记在第三步中MAD最小值出现在中心点及近距离区域的概率为f2,由于此步骤的计算量对整个算法计算量影响不大,我们假设f2的取值为0.5,则可以得到该算法所需要计算量M为
M=13+f1×5+(1-f1)×9+(1-f1)×(1-f2)×4
代入刚才假设的f1和f2的取值范围,可得M的值在18.84和19.68之间。对比之前的搜索算法,计算量和搜索范围对比如下表所示。
表1运动向量搜索算法计算量和搜索范围对比
算法名称 | 计算量(次) | 搜索范围(像素) |
三步法 | 25 | 15×15 |
新三步法 | 22 | 13×13 |
菱形算法 | 18 | 13×13 |
六边形算法 | 33 | 17×17 |
本方法(非对称步长搜索) | 18.84~19.68 | 17×17 |
通过表1分析可知,本方法和三步法、新三步法、六边形算法相比计算量具有明显优势,和菱形算法相比虽然计算量稍有增大,但是运动向量的搜索范围却有比较明显的扩大。
Claims (3)
1.一种图像压缩运动向量搜索方法,以小步长搜索宏块中心的近距离区域,以大步长搜索宏块中心的远距离区域,并计算平均绝对误差MAD值,若MAD最小值点在中心则结束搜索;若不在中心,则继续搜索MAD最小值点;
所述近距离区域为距离当前参考宏块中心棋盘距离小于等于小步长的几何区域;
所述远距离区域为距离当前参考宏块中心棋盘距离大于小步长且小于等于大步长的几何区域;
所述继续搜索MAD最小值点为:若上次计算的MAD最小值点在宏块中心的近距离区域,则以当前MAD最小值点为中心进行近距离区域搜索得到MAD最小值点,否则以当前MAD最小值点为中心进行近距离区域以及远距离区域搜索得到MAD最小值点;若最新的MAD最小值点在中心则结束搜索,否则以最新的MAD最小值点为中心搜索近距离区域再次得到MAD最小值点。
2.根据权利要求1所述的一种图像压缩运动向量搜索方法,其特征在于:所述继续搜索时,保留之前计算的MAD值,在近距离区域或远距离区域搜索时只计算未搜索过的位置的MAD值。
3.根据权利要求2所述的一种图像压缩运动向量搜索方法,其特征在于:所述小步长为D,所述大步长为2D+1。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210261949.8A CN102790883B (zh) | 2012-07-26 | 2012-07-26 | 一种图像压缩运动向量搜索方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210261949.8A CN102790883B (zh) | 2012-07-26 | 2012-07-26 | 一种图像压缩运动向量搜索方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102790883A CN102790883A (zh) | 2012-11-21 |
CN102790883B true CN102790883B (zh) | 2015-06-10 |
Family
ID=47156172
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210261949.8A Active CN102790883B (zh) | 2012-07-26 | 2012-07-26 | 一种图像压缩运动向量搜索方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102790883B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109745073B (zh) * | 2019-01-10 | 2021-08-06 | 武汉中旗生物医疗电子有限公司 | 弹性成像位移的二维匹配方法及设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1558683A (zh) * | 2004-02-13 | 2004-12-29 | 南京邮电学院 | 可变形状搜索(vss)的快速运动估计算法 |
CN101009841A (zh) * | 2006-01-26 | 2007-08-01 | 深圳艾科创新微电子有限公司 | 视频快速运动估计方法 |
CN101754023A (zh) * | 2009-11-27 | 2010-06-23 | 电子科技大学 | 一种图像压缩的运动估计方法 |
-
2012
- 2012-07-26 CN CN201210261949.8A patent/CN102790883B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1558683A (zh) * | 2004-02-13 | 2004-12-29 | 南京邮电学院 | 可变形状搜索(vss)的快速运动估计算法 |
CN101009841A (zh) * | 2006-01-26 | 2007-08-01 | 深圳艾科创新微电子有限公司 | 视频快速运动估计方法 |
CN101754023A (zh) * | 2009-11-27 | 2010-06-23 | 电子科技大学 | 一种图像压缩的运动估计方法 |
Non-Patent Citations (1)
Title |
---|
基于新方向性菱形-弧形搜索的运动估计算法;林舒静 等;《计算机工程》;20090531;第35卷(第10期);第220-223页 * |
Also Published As
Publication number | Publication date |
---|---|
CN102790883A (zh) | 2012-11-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101600108B (zh) | 一种多视点视频编码中的运动和视差联合估计方法 | |
CN102903096B (zh) | 一种基于单目视频的对象深度提取方法 | |
CN102647594B (zh) | 一种整像素精度运动估计方法及其系统 | |
CN101378504B (zh) | 用于h.264编码的块匹配运动估计方法 | |
CN102801976B (zh) | 基于三维小波视频编码的帧间块模式选择方法 | |
CN101163244A (zh) | 视频解码器运动补偿过程中的像素缓存方法及系统 | |
CN107613299A (zh) | 一种利用生成网络提高帧速率上转换效果的方法 | |
CN102647588B (zh) | 一种用于分层搜索运动估计的gpu加速方法 | |
CN107087171A (zh) | Hevc整像素运动估计方法及装置 | |
CN102075757B (zh) | 通过边界检测作为运动估计参考的视频前景对象编码方法 | |
CN106952304A (zh) | 一种利用视频序列帧间相关性的深度图像计算方法 | |
CN103440664A (zh) | 一种生成高分辨率深度图的方法、系统及计算设备 | |
US20220406059A1 (en) | Closed-loop detecting method using inverted index-based key frame selection strategy, storage medium and device | |
CN107483960A (zh) | 一种基于空间预测的运动补偿帧率上转换方法 | |
CN102148990A (zh) | 一种运动矢量预测装置和方法 | |
CN104469381B (zh) | 一种h.264运动估计搜索窗口自适应调整算法的vlsi实现系统 | |
CN102790883B (zh) | 一种图像压缩运动向量搜索方法 | |
EP3596698B1 (en) | Motion estimation method and apparatus for plurality of frames | |
CN101835047A (zh) | 一种基于残差下降率的快速UMHexagonS运动估计算法 | |
CN110113608B (zh) | 一种基于率失真优化的gpu中视频编码快速搜索方法 | |
CN101527854A (zh) | 帧间模式选择方法 | |
CN105007495A (zh) | 一种基于多层3drs的差异估计方法及装置 | |
CN107707916A (zh) | 一种基于场景切变检测的帧率转换算法 | |
CN201066898Y (zh) | 一种实现菱形搜索算法的硬件结构 | |
CN103295249B (zh) | 一种多视角压缩感知图像的重建方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |