CN101350928A - 一种运动估计方法及装置 - Google Patents
一种运动估计方法及装置 Download PDFInfo
- Publication number
- CN101350928A CN101350928A CN 200810117340 CN200810117340A CN101350928A CN 101350928 A CN101350928 A CN 101350928A CN 200810117340 CN200810117340 CN 200810117340 CN 200810117340 A CN200810117340 A CN 200810117340A CN 101350928 A CN101350928 A CN 101350928A
- Authority
- CN
- China
- Prior art keywords
- sub
- piece
- block
- macro block
- macroblock partitions
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000033001 locomotion Effects 0.000 title claims abstract description 34
- 238000000034 method Methods 0.000 title claims abstract description 30
- 238000005192 partition Methods 0.000 claims description 45
- 230000008878 coupling Effects 0.000 claims description 6
- 238000010168 coupling process Methods 0.000 claims description 6
- 238000005859 coupling reaction Methods 0.000 claims description 6
- 238000010586 diagram Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 230000006835 compression Effects 0.000 description 3
- 238000007906 compression Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本发明公开一种运动估计方法及装置,属于视频编码技术领域,该方法包括:将16×16的宏块划分为多个分块模式,每个分块模式包括多个大小不同的子块;在参考帧图像中搜索并获得与每种分块模式中的多个子块匹配的预测块,并得到对应的每个子块的运动向量。通过设计不同的分块模式,将宏块划分为与AVC中不同的子块,可增加运动估计的匹配精度。
Description
技术领域
本发明涉及视频编码技术领域,尤其涉及一种运动估计方法及装置。
背景技术
运动估计是一种描述相邻帧差别的方法,具体来说是描述前面一帧的每个小块怎么样移动当前帧中的某个位置去,这种方法经常被视频压缩/视频编解码器用来减少视频序列中的时域冗余。
在H.264标准中采用了不同大小和形状的宏块分割与亚分割的方法。一个宏块的16×16亮度值可以按照16×16、8×16、16×8或8×8进行分割;而如果选择了8×8分割,还可以按照8×8、8×4、4×8或4×4进行亚分割,如图1所示。这些宏块分割与亚分割的方法将宏块划分为不同的子块。利用各种子块进行运动估计的方法我们将称为树结构的运动估计(tree structured motionestimation)。
一般情况下大的分块方式(16×16、16×8或8×16)适合视频运动平缓或者无运动情况,表达MV(运动向量)所需的比特数也会较少。小的分块方式(8×8、8×4、4×8或4×4)适合运动剧烈或者图像画面复杂的情况,不过表达MV所需的比特数也会相应的增加。因此对于分块的选择将会对压缩效果有着重大的影响。实验证明,分块大小为8×8以下(不包含8×8)的子块在运动估计过程中对提高压缩率和视频质量的贡献不大。
发明内容
为了解决上述问题,本发明的目的是提供一种运动估计方法及装置,通过将16×16的宏块划分为多个分块模式,每个分块模式包括多个大小不同的子块,从而可增加运动估计的匹配精度。
为了达到上述目的,本发明提供一种运动估计方法,所述方法包括:
将16×16的宏块划分为多个分块模式,每个所述分块模式包括多个大小不同的子块;
在参考帧图像中搜索并获得与每一种分块模式中的多个子块匹配的预测块,并得到对应的每一个子块的运动向量;
当搜索结束时,在所述多个分块模式中选择最优的分块模式。
优选地,所述将16×16的宏块划分为多个分块模式的步骤具体包括:
将一个所述16×16的宏块划分为一个位于所述16×16的宏块上部16×8的子块,和两个位于所述16×16的宏块下部8×8的子块;和/或,
将一个所述16×16的宏块划分为两个位于所述16×16的宏块上部的8×8的子块,和一个位于所述16×16的宏块下部的16×8的子块;和/或,
将一个所述16×16的宏块划分为一个位于所述16×16的宏块左侧的8×16的子块,和两个位于所述16×16的宏块右侧的8×8的子块;和/或
将一个所述16×16的宏块划分为两个位于所述16×16的宏块左侧的8×8的子块,和一个位于所述16×16的宏块右侧的8×16的子块。
优选地,所述在所述多个分块模式中选择最优的分块模式的步骤具体为:
根据率失真代价函数来选择最优的分块模式。
本发明还提供一种运动估计装置,包括:
划分模块,用于将16×16的宏块划分为多个分块模式,每个所述分块模式包括多个大小不同的子块;
估计模块,用于在参考帧图像中搜索并获得与每种分块模式中的多个子块匹配的预测块,并得到对应的每个子块的运动向量;
选择模块,用于在搜索结束时,在所述多个分块模式中选择最优的分块模式。
优选地,所述划分模块包括:
第一划分单元,用于将一个所述16×16的宏块划分为一个位于所述16×16的宏块上部16×8的子块,和两个位于所述16×16的宏块下部8×8的子块。
优选地,所述划分模块还包括:
第二划分单元,用于将一个所述16×16的宏块划分为两个位于所述16×16的宏块上部的8×8的子块,和一个位于所述16×16的宏块下部的16×8的子块。
优选地,所述划分模块还包括:
第三划分单元,用于将一个所述16×16的宏块划分为一个位于所述16×16的宏块左侧的8×16的子块,和两个位于所述16×16的宏块右侧的8×8的子块。
优选地,所述划分模块还包括:
第四划分单元,用于将一个所述16×16的宏块划分为两个位于所述16×16的宏块左侧的8×8的子块,和一个位于所述16×16的宏块右侧的8×16的子块。
上述技术方案中的一个技术方案具有如下有益效果:通过将16×16的宏块划分为多个分块模式,每个分块模式包括多个大小不同的子块,例如可将16×16的宏块划分为一个位于16×16的宏块上部16×8的子块,和两个位于16×16的宏块下部8×8的子块,采用这种分块模式可获得更好的匹配效果,提高了运动估计过程的匹配精度。
附图说明
图1为H.264标准中的宏块和子块分区示意图;
图2为本发明的实施例中子块分区示意图;
图3为本发明的实施例中运动估计方法流程图;
图4为本发明的实施例中运动估计装置框图。
具体实施方式
为了使本发明实施例的目的、技术方案和优点更加清楚明白,下面结合实施例和附图,对本发明实施例做进一步详细地说明。在此,本发明的示意性实施例及说明用于解释本发明,但并不作为对本发明的限定。
本发明的实施例提供一种运动估计方法,通过将16×16的宏块划分为多个分块模式,其中每个分块模式包括多个大小不同的子块,可提高运动估计过程的匹配精度,并且新型的分块模式采用了较少的子块个数,进而减少了需要描述运动向量MV(Motion Vector)的个数的比特数。
为了便于理解本发明的实施例,下面结合附图对本发明的实施例进行详细的说明。如图3所示,为本发明的实施例中运动估计方法流程图,具体步骤如下:
步骤301、将16×16的宏块划分为多个分块模式,每个分块模式包括多个大小不同的子块;
在编码当前帧图像时,需要把整个图像分为若干个宏块(宏块是编码的基本单元,为16×16的宏块)参见图2,在本实施例中,将16×16的宏块划分为多个分块模式,该分块模式包括以下四种方式中的任意一种或多种:
(一)、将一个16×16的宏块划分为由一个位于16×16的宏块上部16×8的子块,和两个位于16×16的宏块下部8×8的子块;
(二)、将一个16×16的宏块划分为由两个位于16×16的宏块上部的8×8的子块,和一个位于16×16的宏块下部的16×8的子块;
(三)、将一个16×16的宏块划分为由一个位于16×16的宏块左侧的8×16的子块,和两个位于16×16的宏块右侧的8×8的子块;
(四)、将一个16×16的宏块划分为由两个位于16×16的宏块左侧的8×8的子块,和一个位于16×16的宏块右侧的8×16的子块。
并且在实施本还可结合H.264标准中的16×16、16×8、8×16、8×8四种现有的分块模式来进行运动估计,该现有的分块模式在此就不再敷述。
在本实施例中,通过将16×16的宏块划分为不同的分块模式,从而在增加参考块与当前块匹配的准确性的同时,减少了需要传输的运动向量的个数,同时也增加了运动估计的匹配精度。上述新增的子块划分方式在降低运动估计误差和减少表达MV所需比特数方面优于H.264标准中的8×8以下的宏块划分方式。
步骤302、在参考帧图像中搜索并获得与每一种分块模式中的多个子块匹配的预测块,并得到对应的每个子块的运动向量。
在本步骤中,若将16×16的宏块划分为16×8、8×8和8×8三种子宏块,在执行步骤302时,每一个宏块按照行优先的方式来编码,先将16×8子宏块到参考帧中去搜索,得到一个16×8的匹配块,同时得到一组运动向量MV;再分别把下面的两个8×8子宏块到参考帧去搜索,分别得到两个8×8的匹配块,同时又得到两组运动向量MV,也就是说对应于这个分块模式,经过搜索,会得到三组运动向量MV,上述三组运动向量MV就分别指向了三个不同的块作为当前分块中16×8、8×8、以及8×8子宏块匹配的预测块,并将搜索到的预测块的位置信息也就是运动向量MV传给解码端,这样解码端就可以按照该运动向量MV找到预测块的位置。
步骤303、在搜索结束时,还可在该多个分块模式中选择最优的分块模式;
例如当其他的分块模式也搜索结束时,可选择参考块和当前块的SAD(差的绝对值的和)小,和/或者需要传输的比特数少的分块模式作为最优的分块模式。选择的标准是率失真代价函数SAD+λRate(拉格朗日最小二乘法)。
为了实现上述的方法实施例,本发明的其他实施例还提供了一种运动估计装置。另需首先说明的是,由于下述的实施例是为实现前述的方法实施例,故该装置中的模块都是为了实现前述方法的各步骤而设,但本发明并不限于下述的实施例,任何可实现上述方法的装置和模块都应包含于本发明的保护范围。并且在下面的描述中,与前述方法相同的内容在此省略,以节约篇幅。
如图4所示,为本发明的实施例中运动估计装置框图,由图中可知,该运动估计装置,包括:
划分模块41,用于将16×16的宏块划分为多个分块模式,每个分块模式包括多个大小不同的子块;
估计模块42,用于在参考帧图像中搜索并获得与每种分块模式中的多个子块匹配的预测块,并得到对应的每个子块的运动向量;
选择模块43,用于在搜索结束时,在所述多个分块模式中选择最优的分块模式。
在本发明的另一实施例中,该划分模块41包括:
第一划分单元411,用于将一个16×16的宏块划分为一个位于16×16的宏块上部16×8的子块,和两个位于16×16的宏块下部8×8的子块。
在本发明的另一实施例中,该划分模块41还包括:
第二划分单元412,用于将一个16×16的宏块划分为两个位于16×16的宏块上部的8×8的子块,和一个位于16×16的宏块下部的16×8的子块。
在本发明的另一实施例中,该划分模块41还包括:
第三划分单元413,用于将一个16×16的宏块划分为一个位于16×16的宏块左侧的8×16的子块,和两个位于16×16的宏块右侧的8×8的子块。
在本发明的另一实施例中,该划分模块41还包括:
第四划分单元414,用于将一个16×16的宏块划分为两个位于16×16的宏块左侧的8×8的子块,和一个位于16×16的宏块右侧的8×16的子块。
由上述技术方案可知,通过将16×16的宏块划分为不同的分块模式,例如可将16×16的宏块划分为16×8、8×8和8×8的三个子块,从而在增加参考块与当前块匹配的准确性的同时,减少了需要传输的运动向量的个数,同时也增加了运动估计的匹配精度。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (8)
1.一种运动估计方法,其特征在于,所述方法包括:
将16×16的宏块划分为多个分块模式,每个所述分块模式包括多个大小不同的子块;
在参考帧图像中搜索并获得与每一种分块模式中的多个子块匹配的预测块,并得到对应的每一个子块的运动向量;
当搜索结束时,在所述多个分块模式中选择最优的分块模式。
2.根据权利要求1所述的方法,其特征在于,所述将16×16的宏块划分为多个分块模式的步骤具体包括:
将一个所述16×16的宏块划分为一个位于所述16×16的宏块上部16×8的子块,和两个位于所述16×16的宏块下部8×8的子块;和/或,
将一个所述16×16的宏块划分为两个位于所述16×16的宏块上部的8×8的子块,和一个位于所述16×16的宏块下部的16×8的子块;和/或,
将一个所述16×16的宏块划分为一个位于所述16×16的宏块左侧的8×16的子块,和两个位于所述16×16的宏块右侧的8×8的子块;和/或
将一个所述16×16的宏块划分为两个位于所述16×16的宏块左侧的8×8的子块,和一个位于所述16×16的宏块右侧的8×16的子块。
3.根据权利要求1所述的方法,其特征在于,所述在所述多个分块模式中选择最优的分块模式的步骤具体为:
根据率失真代价函数来选择最优的分块模式。
4.一种运动估计装置,其特征在于,包括:
划分模块,用于将16×16的宏块划分为多个分块模式,每个所述分块模式包括多个大小不同的子块;
估计模块,用于在参考帧图像中搜索并获得与每种分块模式中的多个子块匹配的预测块,并得到对应的每个子块的运动向量;
选择模块,用于在搜索结束时,在所述多个分块模式中选择最优的分块模式。
5.根据权利要求4所述的装置,其特征在于,所述划分模块包括:
第一划分单元,用于将一个所述16×16的宏块划分为一个位于所述16×16的宏块上部16×8的子块,和两个位于所述16×16的宏块下部8×8的子块。
6.根据权利要求4所述的装置,其特征在于,所述划分模块还包括:
第二划分单元,用于将一个所述16×16的宏块划分为两个位于所述16×16的宏块上部的8×8的子块,和一个位于所述16×16的宏块下部的16×8的子块。
7.根据权利要求4所述的装置,其特征在于,所述划分模块还包括:
第三划分单元,用于将一个所述16×16的宏块划分为一个位于所述16×16的宏块左侧的8×16的子块,和两个位于所述16×16的宏块右侧的8×8的子块。
8.根据权利要求4所述的装置,其特征在于,所述划分模块还包括:
第四划分单元,用于将一个所述16×16的宏块划分为两个位于所述16×16的宏块左侧的8×8的子块,和一个位于所述16×16的宏块右侧的8×16的子块。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 200810117340 CN101350928A (zh) | 2008-07-29 | 2008-07-29 | 一种运动估计方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 200810117340 CN101350928A (zh) | 2008-07-29 | 2008-07-29 | 一种运动估计方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101350928A true CN101350928A (zh) | 2009-01-21 |
Family
ID=40269473
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 200810117340 Pending CN101350928A (zh) | 2008-07-29 | 2008-07-29 | 一种运动估计方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101350928A (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102685487A (zh) * | 2011-03-16 | 2012-09-19 | 华为技术有限公司 | 图像编解码方法、图像编解码设备及网络系统 |
CN102907098A (zh) * | 2009-10-01 | 2013-01-30 | Sk电信有限公司 | 使用可变尺寸宏块对图像进行编码/解码的方法和装置 |
CN103237222A (zh) * | 2013-05-07 | 2013-08-07 | 河海大学常州校区 | 多模式搜索的运动估计方法 |
WO2016065873A1 (zh) * | 2014-10-27 | 2016-05-06 | 华为技术有限公司 | 图像预测方法及相关装置 |
WO2016141609A1 (zh) * | 2015-03-10 | 2016-09-15 | 华为技术有限公司 | 图像预测方法和相关设备 |
CN109427071A (zh) * | 2017-08-30 | 2019-03-05 | 深圳市道通智能航空技术有限公司 | 一种全搜索块匹配方法和装置 |
CN111357288A (zh) * | 2019-01-03 | 2020-06-30 | 深圳市大疆创新科技有限公司 | 视频图像处理方法与装置 |
US11206422B2 (en) | 2019-01-03 | 2021-12-21 | SZ DJI Technology Co., Ltd. | Video image processing method and device |
-
2008
- 2008-07-29 CN CN 200810117340 patent/CN101350928A/zh active Pending
Cited By (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102907098A (zh) * | 2009-10-01 | 2013-01-30 | Sk电信有限公司 | 使用可变尺寸宏块对图像进行编码/解码的方法和装置 |
CN102907098B (zh) * | 2009-10-01 | 2016-04-20 | Sk电信有限公司 | 使用可变尺寸宏块对图像进行编码/解码的方法和装置 |
CN102685487A (zh) * | 2011-03-16 | 2012-09-19 | 华为技术有限公司 | 图像编解码方法、图像编解码设备及网络系统 |
WO2012122948A1 (zh) * | 2011-03-16 | 2012-09-20 | 清华大学 | 图像编解码方法、图像编解码设备及网络系统 |
CN102685487B (zh) * | 2011-03-16 | 2015-07-08 | 华为技术有限公司 | 图像编解码方法、图像编解码设备及网络系统 |
US9106897B2 (en) | 2011-03-16 | 2015-08-11 | Huawei Technologies Co., Ltd. | Picture encoding and decoding method, picture encoding and decoding device and network system |
CN103237222A (zh) * | 2013-05-07 | 2013-08-07 | 河海大学常州校区 | 多模式搜索的运动估计方法 |
WO2016065873A1 (zh) * | 2014-10-27 | 2016-05-06 | 华为技术有限公司 | 图像预测方法及相关装置 |
US11968386B2 (en) | 2014-10-27 | 2024-04-23 | Huawei Technologies Co., Ltd. | Picture prediction method and related apparatus |
US11172217B2 (en) | 2014-10-27 | 2021-11-09 | Huawei Technologies Co., Ltd. | Picture prediction method and related apparatus |
US10623763B2 (en) | 2014-10-27 | 2020-04-14 | Huawei Technologies Co., Ltd. | Picture prediction method and related apparatus |
US10440380B2 (en) | 2014-10-27 | 2019-10-08 | Huawei Technologies Co., Ltd. | Picture prediction method and related apparatus |
US10404993B2 (en) | 2015-03-10 | 2019-09-03 | Huawei Technologies Co., Ltd. | Picture prediction method and related apparatus |
US10659803B2 (en) | 2015-03-10 | 2020-05-19 | Huawei Technologies Co., Ltd. | Picture prediction method and related apparatus |
RU2671307C1 (ru) * | 2015-03-10 | 2018-10-30 | Хуавэй Текнолоджиз Ко., Лтд. | Способ предсказания изображений и связанное устройство |
US11178419B2 (en) | 2015-03-10 | 2021-11-16 | Huawei Technologies Co., Ltd. | Picture prediction method and related apparatus |
WO2016141609A1 (zh) * | 2015-03-10 | 2016-09-15 | 华为技术有限公司 | 图像预测方法和相关设备 |
WO2019041873A1 (zh) * | 2017-08-30 | 2019-03-07 | 深圳市道通智能航空技术有限公司 | 全搜索块匹配方法和装置 |
CN109427071A (zh) * | 2017-08-30 | 2019-03-05 | 深圳市道通智能航空技术有限公司 | 一种全搜索块匹配方法和装置 |
CN109427071B (zh) * | 2017-08-30 | 2022-06-17 | 深圳市道通智能航空技术股份有限公司 | 一种全搜索块匹配方法和装置 |
CN111357288A (zh) * | 2019-01-03 | 2020-06-30 | 深圳市大疆创新科技有限公司 | 视频图像处理方法与装置 |
US11206422B2 (en) | 2019-01-03 | 2021-12-21 | SZ DJI Technology Co., Ltd. | Video image processing method and device |
US11689736B2 (en) | 2019-01-03 | 2023-06-27 | SZ DJI Technology Co., Ltd. | Video image processing method and device |
US11743482B2 (en) | 2019-01-03 | 2023-08-29 | SZ DJI Technology Co., Ltd. | Video image processing method and device |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101350928A (zh) | 一种运动估计方法及装置 | |
RU2509435C2 (ru) | Способ и устройство для кодирования видео и способ и устройство для декодирования видео, основанные на иерархической структуре блока кодирования | |
CN108353176B (zh) | 在图像编译系统中的基于amvr的图像编译方法和装置 | |
CN103220528B (zh) | 通过使用大型变换单元编码和解码图像的方法和设备 | |
CN104811721B (zh) | 视频解码数据存储方法及运动向量数据的计算方法 | |
KR102647083B1 (ko) | 블록 분할 및 블록 병합을 지원하는 픽처 코딩 | |
CN103430545B (zh) | 用于高效视频编码的内容适应性运动补偿滤波 | |
CN110235444A (zh) | 使用多条参考线的帧内预测 | |
CN101072356B (zh) | 一种运动矢量预测方法 | |
CN110024384A (zh) | 基于帧间预测模式处理视频的方法和用于该方法的设备 | |
CN107197302A (zh) | 帧间预测方法及其装置 | |
US9020286B2 (en) | Apparatus for dividing image data and encoding and decoding image data in parallel, and operating method of the same | |
CN102186075B (zh) | 一种熵编码器及其实现方法 | |
CN105245896A (zh) | Hevc并行运动补偿方法及装置 | |
CN113170210A (zh) | 视频编码和解码中的仿射模式信令 | |
CN101179724B (zh) | 帧间压缩编码中的帧存储方法及装置 | |
CN101790096A (zh) | 基于二重预测的编解码方法及装置 | |
CN110662072A (zh) | 运动信息候选者列表构建方法、装置及可读存储介质 | |
CN103327340B (zh) | 一种整数搜索方法及装置 | |
Song et al. | Unified depth intra coding for 3D video extension of HEVC | |
CN103581685B (zh) | H264参考帧选择方法及其装置 | |
CN104602026B (zh) | 一种适用于hevc标准下编码器中全复用的重建环路结构 | |
CN100586188C (zh) | 一种基于avs的帧内预测计算的硬件实现方法 | |
KR20140031974A (ko) | 화상 부호화 방법, 화상 복호 방법, 화상 부호화 장치, 화상 복호 장치, 화상 부호화 프로그램 및 화상 복호 프로그램 | |
CN105530517B (zh) | 一种解码器及有损解码视频图像的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |
Open date: 20090121 |