CN101778281A - 一种基于结构相似度的h.264快速运动估算方法 - Google Patents
一种基于结构相似度的h.264快速运动估算方法 Download PDFInfo
- Publication number
- CN101778281A CN101778281A CN 201010019323 CN201010019323A CN101778281A CN 101778281 A CN101778281 A CN 101778281A CN 201010019323 CN201010019323 CN 201010019323 CN 201010019323 A CN201010019323 A CN 201010019323A CN 101778281 A CN101778281 A CN 101778281A
- Authority
- CN
- China
- Prior art keywords
- value
- cost
- ssim
- mode
- structural similarity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本发明公开了一种基于结构相似度的H.264快速运动估算方法,在运动估计中使用结构相似度阈值作为提前结束条件,如果当前编码块和在搜索区域中候选块的结构相似度值已经大于设定的阈值,跳过其他的搜索点,结束搜索过程,在保证压缩质量不下降的前提下,减少了因进一步搜索所造成的时间消耗;同时,本发明在运动估计过程中通过搜索位置的结构相似度值与提前结束阈值的比较,避免不必要的子模式搜索,节约了编码时间。
Description
技术领域
本发明涉及视频图像压缩领域,尤其涉及一种基于结构相似度的H.264快速运动估算方法。
背景技术
新一代的视频压缩标准H.264/AVC,由于采用一系列先进的编解码技术,如帧内预测、整数变换、高精度运动估计算法、多参考帧运动估计等,使得在相同的编码质量下,和H.263相比,节约了约50%码率。
结构相似度是近年来出现的新的图像质量评价标准,相比其他图像质量评价方法,结构相似度(SSIM)更符合主观评价标准和人眼视觉系统(HVS),其定义如下:
SSIM(x,y)=l(x,y)·c(x,y)·s(x,y) (1)
其中:x和y表示参考图像和待评估图像;SSIM(x,y)表示它们的结构相似度;l(x,y)是亮度比较,利用参考图像和待评估图像均值ηx和ηy来计算;c(x,y)是对比度比较,用参考图像和待评估图像的方差σx和σy来计算;s(x,y)是结构比较,用参考图像和待评估图像的归一化信号(x-μx)/σx和(y-μy)/σy的相关系数来表示。这三个分量表示如下:
其中参数C1,C2和C3是为避免分母为0而加上的小常数,SSIM取值一般介于0和1之间的浮点数,它反映的是两个图像块的相似程度,SSIM值越大说明这两个图像块越相似。
H.264的运动估计通过帧间多模式预测和多参考帧预测获得了更高的压缩率。帧间模式选择主要分为两个步骤:
第一步是针对每个预测模式,通过运动估计为当前编码块选择最佳匹配块。H.264使用了7种预测模式:INTER 16×16、INTER 16×8、INTER 8×16和INTER 8×8,如果INTER 8×8被选为最佳预测模式,根据设定还需检测INTER 8×4、INTER4×8和INTER 4×4子模式,最佳匹配块由公式(5)所示的率失真函数选择。MCOST(s,c)=SA(T)D(s,c)+MOTION b(ΔMV) (5)
式中:SAD(s,c)是当前编码块s与候选匹配块c的像素值差的绝对值之和,用于整数像素运动估计;SATD(s,c)表示当前编码块s与候选匹配块c的像素值差的哈达玛变换的系数和,用于分数像素运动估计;MOTION为运动估计的拉格朗日乘子,ΔMV是预测运动矢量和实际运动矢量的差值,b(ΔMV)表示用来编码ΔMV所用的比特数。对于每种预测模式,具有最小率失真代价值MCOST的候选块为当前块的最佳匹配块。
第二步是选择最佳的预测模式,由公式(6)的率失真函数来确定:
J(s,c,MODE|QP)=D(s,c,MODE|QP+MODER(s,c,MODE|QP)) (6)
其中:MODE是预测模式;QP为量化参数;D(s,c,MODE|QP)为待编码块s和重建块c像素的差值的平方和;R(s,c,MODE|QP)是用来编码残差部分所需的比特数。具有最小率失真代价J的模式当选为当前宏块的最佳预测模式。
H.264的压缩性能与传统压缩标准相比提高一倍以上,然而由于其采用了多帧和高精度运动估计以及率失真优化等技术使得编码复杂度大幅增加,限制了H.264的实时应用。其中可变块运动估计是整个编码器中复杂度最高的一部分,占用了很大的编码时间。
发明内容
本发明的目的在于提供一种基于结构相似度的H.264快速运动估算方法,其能在取得相同质量图像质量的同时,能有效的节约编码时间。
一种基于结构相似度的H.264快速运动估算方法,包括如下步骤:
1)、初始化运动估计的率失真代价值MCOST;
2)、计算当前位置编码块与搜索位置候选块的结构相似度SSIM值,
并利用公式:Mcost(s,c)=K1(1-SSIM(s,c))+MOTIONb(ΔMV)计算当前搜索位置的运动矢量编码代价,如果该值大于当前MCOST,舍弃当前搜索位置,继续下一个搜索位置,否则更新当前位置为最佳匹配位置,更新当前运动矢量编码代价值为最小MCOST;上式中:
s为当前编码块;
c为候选匹配块;
K1是一个和编码块的大小相关的自适应参数;
MOTION为运动估计的拉格朗日乘子;
ΔMV是预测运动矢量和实际运动矢量的差值;
b(ΔMV)表示用来编码ΔMV所用的比特数;
3)、计算前搜索位置的结构相似度SSIM值并和预先设定的阈值T比较,阈值T取值范围为0<T≤Mcost,本实施例取值0.75。如果SSIM比阈值T小,继续下一个搜索位置,返回步骤2,否则结束搜索过程,当前搜索位置被选为最佳匹配位置,停止搜索过程,保存最小Mcost和匹配位置矢量;
4)、利用公式:
J(s,c,MODE|QP)=K2(1-SSIM(s,c))+MODER(s,c,MODE|QP)计算每种预测模式最佳匹配块率失真代价,具有最小率失真代价的预测模式被选为当前编码块的最佳预测模式,上式中:
MODE是预测模式;
K2为自适应参数;
s为当前编码块;
c为候选匹配块;
QP为量化参数;
R(s,c,MODE|QP)是用来编码残差部分所需的比特数。
本发明在运动估计中使用SSIM阈值作为提前结束条件,如果当前编码块和在搜索区域中候选块的SSIM值已经大于设定的阈值,跳过其他的搜索点,结束搜索过程,在保证压缩质量不下降的前提下,减少了因进一步搜索所造成的时间消耗;同时,本发明在运动估算中通过搜索位置的SSIM值与提前结束阈值的比较,避免了不必要的子模式搜索,节约了编码时间。
附图说明
图1为一种基于结构相似度的H.264运动估算方法的流程示意图。
具体实施方式
下面结合附图,对本发明做进一步的说明。
实施例1:
一种基于结构相似度的H.264快速运动估算方法,包括如下步骤:
1)、初始化运动估计的率失真代价值MCOST,取值为范围为:0<Mcost≤1,本实施例取值0.99。
2)、计算当前位置编码块与搜索位置候选块的结构相似度SSIM值,
并利用公式:Mcost(s,c)=K1(1-SSIM(s,c))+MOTIONb(ΔMV)计算当前搜索位置的运动矢量编码代价,如果该值大于当前MCOST,舍弃当前搜索位置,继续下一个搜索位置,否则更新当前位置为最佳匹配位置,更新当前运动矢量编码代价值为最小MCOST;上式中:
s为当前编码块;
c为候选匹配块;
K1是一个和编码块的大小相关的自适应参数,K1的取值范围为:
block_x×block_y≤QP≤block_x×block_y×4,本实施例取值K1的取值block_x×block_y;
MOTION为运动估计的拉格朗日乘子;
ΔMV是预测运动矢量和实际运动矢量的差值;
b(ΔMV)表示用来编码ΔMV所用的比特数;
3)、计算前搜索位置的结构相似度SSIM值并和预先设定的阈值T比较。如果SSIM比阈值T小,继续下一个搜索位置,返回步骤2,否则结束搜索过程,当前搜索位置被选为最佳匹配位置,停止搜索过程,保存最小Mcost和匹配位置矢量;
4)、利用公式:
J(s,c,MODE|QP)=K2(1-SSIM(s,c))+MODER(s,c,MODE|QP)计算每种预测模式最佳匹配块率失真代价,具有最小率失真代价的预测模式被选为当前编码块的最佳预测模式,上式中:
MODE是预测模式;
K2为自适应参数,取值范围为85000≤K2≤490000,本实施例取值85000;
s为当前编码块;
c为候选匹配块;
QP为量化参数,取值范围为10≤QP≤30,本实施例取为10;
R(s,c,MODE|QP)是用来编码残差部分所需的比特数。
如果当前编码模块INTER 8×8模式被选为最佳模式,对其子模式INTER 8×4、INTER 4×8、INTER 4×4作为当前位置码块返回步骤1分别寻找最佳预测模式。
K1是一个和编码块的大小相关的自适应参数,K1取值与预测模式相关,对于较大编码块的模式K1取值较大,而对于INTER 8×8模式及其子模式编码块K1取值较小。这样可以增加大块的预测精度,减少残差信号编码的率失真代价,因而大编码块模式倾向于被选为最佳预测模式,要合理避免8×8模式及其子模式。只有那些具有剧烈复杂运动的宏块才会使用复杂的子模式选择。该方法对于那些具有较小运动或者没有运动的序列非常有效。
实施例2:
一种基于结构相似度的H.264快速运动估算方法,包括如下步骤:
1)、初始化运动估计的率失真代价值MCOST,取值为0.95或0.9或0.8。
2)、计算当前位置编码块与搜索位置候选块的结构相似度SSIM值,
并利用公式:Mcost(s,c)=K1(1-SSIM(s,c))+MOTIONb(ΔMV)计算当前搜索位置的运动矢量编码代价,如果该值大于当前MCOST,舍弃当前搜索位置,继续下一个搜索位置,否则更新当前位置为最佳匹配位置,更新当前运动矢量编码代价值为最小MCOST;上式中:
s为当前编码块;
c为候选匹配块;
K1是一个和编码块的大小相关的自适应参数,K1的取值为:
block_x×block_y×3;
MOTION为运动估计的拉格朗日乘子;
ΔMV是预测运动矢量和实际运动矢量的差值;
b(ΔMV)表示用来编码ΔMV所用的比特数;
3)、计算前搜索位置的结构相似度SSIM值并和预先设定的阈值T比较,取T为0.8。如果SSIM比阈值T小,继续下一个搜索位置,返回步骤2,否则结束搜索过程,当前搜索位置被选为最佳匹配位置,停止搜索过程,保存最小Mcost和匹配位置矢量;
4)、利用公式:
J(s,c,MODE|QP)=K2(1-SSIM(s,c))+MODER(s,c,MODE|QP)计算每种预测模式最佳匹配块率失真代价,具有最小率失真代价的预测模式被选为当前编码块的最佳预测模式,上式中:
MODE是预测模式;
K2为自适应参数,取值为260000;
s为当前编码块;
c为候选匹配块;
QP为量化参数,取值为20;
R(s,c,MODE|QP)是用来编码残差部分所需的比特数。
如果当前编码模块INTER 8×8模式被选为最佳模式,对其子模式INTER 8×4、INTER 4×8、INTER 4×4作为当前位置码块返回步骤1分别寻找最佳预测模式。
本发明使用SSIM阈值作为提前结束判断标准,即如果当前编码块和在螺旋搜索区域中候选块的SSIM值已经大于设定的阈值,跳过其他的搜索点,结束螺旋搜索过程。因为继续搜索下去对压缩质量的改善没有太大意义,反而增大了这部分的时间消耗。该算法另外一个特点就是在运动估计的率失真函数中使用自适应参数,这样可以避免不必要的子模式搜索,从而达到节约编码时间的目的。
Claims (7)
1.一种基于结构相似度的H.264快速运动估算方法,包括如下步骤:
1)、初始化运动估计的率失真代价值MCOST;
2)、计算当前位置编码块与搜索位置候选块的结构相似度SSIM值,
并利用公式:Mcost(s,c)=K1(1-SSIM(s,c))+MOTIONb(ΔMV)计算当前搜索位置的运动矢量编码代价,如果该值大于当前MCOST,舍弃当前搜索位置,继续下一个搜索位置,否则更新当前位置为最佳匹配位置,更新当前运动矢量编码代价值为最小MCOST;上式中:
s为当前编码块;
c为候选匹配块;
K1是一个和编码块的大小相关的自适应参数;
MOTION为运动估计的拉格朗日乘子;
ΔMV是预测运动矢量和实际运动矢量的差值;
b(ΔMV)表示用来编码ΔMV所用的比特数;
3)、计算前搜索位置的结构相似度SSIM值并和预先设定的阈值T比较。如果SSIM比阈值T小,继续下一个搜索位置,返回步骤2,否则结束搜索过程,当前搜索位置被选为最佳匹配位置,停止搜索过程,保存最小Mcost和匹配位置矢量;
4)、利用公式:
J(s,c,MODE|QP)=K2(1-SSIM(s,c))+MODER(s,c,MODE|QP)计算每种预测模式最佳匹配块率失真代价,具有最小率失真代价的预测模式被选为当前编码块的最佳预测模式,上式中:
MODE是预测模式;
K2为自适应参数;
s为当前编码块;
c为候选匹配块:
QP为量化参数;
R(s,c,MODE|QP)是用来编码残差部分所需的比特数。
2.根据权利要求1所述的基于结构相似度的H.264快速运动估算方法,其特征在于,所述步骤4)之后还包括判断最佳匹配宏模式是否为8X8模式,若不是,则结束运动估计搜索,若是8X8模式,则返回步骤1)分别对其子模式8X4,4X8,4X4再进行最佳预测模式搜索。
3.根据权利要求1所述的基于结构相似度的H.264快速运动估算方法,其特征在于,步骤1)所述率失真代价值Mcost的取值为范围为:0<Mcost≤1。
4.根据权利要求1所述的基于结构相似度的H.264快速运动估算方法,其特征在于,所述率失真代价值Mcost的值为0.8或0.9或0.95或0.99。
5.根据权利要求1所述的基于结构相似度的H.264快速运动估算方法,其特征在于,所述阈值T的取值范围为:0<T≤Mcost。
6.根据权利要求1所的基于结构相似度的H.264快速运动估计方法,其特征在于,所述量化参数QP取值范围为:10≤QP≤30,K1的取值范围为:
block_x×block_y≤QP≤block_x×block_y×4,K2的取值范围为:
85000≤K2≤490000。
7.根据权利要求1所述的基于结构相似度的H.264快速运动估计方法,其特征在于,所述量化参数QP取值20,K1的取值范围为:block_x×block_y×3,K2的取值为260000。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201010019323 CN101778281A (zh) | 2010-01-13 | 2010-01-13 | 一种基于结构相似度的h.264快速运动估算方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201010019323 CN101778281A (zh) | 2010-01-13 | 2010-01-13 | 一种基于结构相似度的h.264快速运动估算方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101778281A true CN101778281A (zh) | 2010-07-14 |
Family
ID=42514578
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 201010019323 Pending CN101778281A (zh) | 2010-01-13 | 2010-01-13 | 一种基于结构相似度的h.264快速运动估算方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101778281A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102413329A (zh) * | 2011-11-21 | 2012-04-11 | 西安理工大学 | 一种视频压缩中可配置速度的运动估计实现方法 |
CN102647591A (zh) * | 2012-04-17 | 2012-08-22 | 中国科学院声学研究所 | 基于ssim评价的容错率失真优化视频编码方法、装置 |
CN103584888A (zh) * | 2013-12-02 | 2014-02-19 | 深圳市恩普电子技术有限公司 | 超声目标运动追踪方法 |
CN103634600A (zh) * | 2012-08-22 | 2014-03-12 | 中国科学院声学研究所 | 一种基于ssim评价的视频编码模式选择方法、系统 |
WO2019047664A1 (zh) * | 2017-09-06 | 2019-03-14 | 浙江宇视科技有限公司 | 码率控制方法、装置、图像采集设备及可读存储介质 |
CN112738529A (zh) * | 2020-12-23 | 2021-04-30 | 北京百度网讯科技有限公司 | 帧间预测方法、装置、设备、存储介质以及程序产品 |
-
2010
- 2010-01-13 CN CN 201010019323 patent/CN101778281A/zh active Pending
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102413329A (zh) * | 2011-11-21 | 2012-04-11 | 西安理工大学 | 一种视频压缩中可配置速度的运动估计实现方法 |
CN102413329B (zh) * | 2011-11-21 | 2014-06-04 | 西安理工大学 | 一种视频压缩中可配置速度的运动估计实现方法 |
CN102647591A (zh) * | 2012-04-17 | 2012-08-22 | 中国科学院声学研究所 | 基于ssim评价的容错率失真优化视频编码方法、装置 |
CN102647591B (zh) * | 2012-04-17 | 2014-07-02 | 中国科学院声学研究所 | 基于ssim评价的容错率失真优化视频编码方法 |
CN103634600A (zh) * | 2012-08-22 | 2014-03-12 | 中国科学院声学研究所 | 一种基于ssim评价的视频编码模式选择方法、系统 |
CN103634600B (zh) * | 2012-08-22 | 2016-09-28 | 中国科学院声学研究所 | 一种基于ssim评价的视频编码模式选择方法、系统 |
CN103584888A (zh) * | 2013-12-02 | 2014-02-19 | 深圳市恩普电子技术有限公司 | 超声目标运动追踪方法 |
WO2019047664A1 (zh) * | 2017-09-06 | 2019-03-14 | 浙江宇视科技有限公司 | 码率控制方法、装置、图像采集设备及可读存储介质 |
US11902533B2 (en) | 2017-09-06 | 2024-02-13 | Zhejiang Uniview Technologies Co., Ltd. | Code rate control method and apparatus, image acquisition device, and readable storage medium |
CN112738529A (zh) * | 2020-12-23 | 2021-04-30 | 北京百度网讯科技有限公司 | 帧间预测方法、装置、设备、存储介质以及程序产品 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9781443B2 (en) | Motion vector encoding/decoding method and device and image encoding/decoding method and device using same | |
CN110087087B (zh) | Vvc帧间编码单元预测模式提前决策及块划分提前终止方法 | |
US8693543B2 (en) | Inter-frame prediction coding method, device and system | |
CN108134939B (zh) | 一种运动估计方法及装置 | |
CN100553333C (zh) | 使用自适应模式决策的运动估测方法 | |
CN101895751B (zh) | 帧内预测的方法及装置、基于帧内预测的编/解码方法及系统 | |
CN101795409B (zh) | 内容自适应分数像素运动估计方法 | |
CN101778281A (zh) | 一种基于结构相似度的h.264快速运动估算方法 | |
CN107087200B (zh) | 针对高效率视频编码标准的跳过编码模式提前判决方法 | |
CN100592798C (zh) | 一种视频编码快速变换量化的实现方法 | |
CN103384325A (zh) | 一种avs-m视频编码快速帧间预测模式选择方法 | |
CN102932642B (zh) | 一种帧间编码快速模式选择方法 | |
CN101448159B (zh) | 一种基于率失真代价和模式频率的快速帧间模式选择方法 | |
CN102047665A (zh) | 运动图像编码方法以及运动图像解码方法 | |
CN101001377A (zh) | 一种基于多参考帧的h.264快速运动估计的方法 | |
CN101699865A (zh) | 一种块运动自适应的亚像素快速搜索方法 | |
CN100481952C (zh) | 确定视频编码器中的自适应运动矢量的搜索范围的方法及设备 | |
CN104853191A (zh) | 一种hevc的快速编码方法 | |
CN104702959B (zh) | 一种视频编码的帧内预测方法及系统 | |
CN103384327A (zh) | 基于自适应阈值的avs快速模式选择算法 | |
CN101331773A (zh) | 使用速率失真特性进行视频编码的两遍速率控制技术 | |
CN108989818B (zh) | 一种图像编码参数调整方法及装置 | |
CN101883275B (zh) | 视频编码方法 | |
CN100591132C (zh) | 视频编码中快速的模式确定方法和装置 | |
US20130128954A1 (en) | Encoding method and apparatus |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Open date: 20100714 |