CN102413323B - 一种基于h.264的视频压缩方法 - Google Patents
一种基于h.264的视频压缩方法 Download PDFInfo
- Publication number
- CN102413323B CN102413323B CN201010019322.2A CN201010019322A CN102413323B CN 102413323 B CN102413323 B CN 102413323B CN 201010019322 A CN201010019322 A CN 201010019322A CN 102413323 B CN102413323 B CN 102413323B
- Authority
- CN
- China
- Prior art keywords
- value
- video
- mode
- cost
- compression method
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 43
- 230000006835 compression Effects 0.000 title claims abstract description 24
- 238000007906 compression Methods 0.000 title claims abstract description 24
- 230000033001 locomotion Effects 0.000 claims abstract description 31
- 238000001914 filtration Methods 0.000 claims abstract description 27
- 238000013139 quantization Methods 0.000 claims abstract description 15
- 230000009466 transformation Effects 0.000 claims abstract description 7
- 239000013598 vector Substances 0.000 claims description 13
- 238000012937 correction Methods 0.000 claims description 4
- 230000000694 effects Effects 0.000 abstract description 2
- 230000001131 transforming effect Effects 0.000 abstract 1
- 230000005540 biological transmission Effects 0.000 description 7
- 230000000903 blocking effect Effects 0.000 description 6
- 238000005457 optimization Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000004883 computer application Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000000151 deposition Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
一种基于H.264的视频压缩方法,采用基于结构相似度的快速运动估计选择最佳预测模式,由实际像素值与预测值相减得到残差值进行变换和量化,将所得数据采用变长编码,并对量化的数据进行反量化和反变换,重构得到的图像采用多模式的快速环路滤波后作为其它帧的参考帧。结合结构相似度进行快速运动估算,简化了复杂的搜索模式,节约编码时间和降低码率,而基于多模式的快速环路滤波,其针对不同的模式特点采用相应的滤波技术,其有效的降低滤波过程的复杂度,在保持图像客观质量的同时更好的降低了块效应。
Description
技术领域
本发明涉及一种视频压缩算法。尤其涉及一种基于H.264的视频压缩方法。
背景技术
H.264是由联合视频组(JVT)近年来致力开发研究的最新视频压缩国际标准,与以前的国际标准如H.263和MPEG-4相比,最大的优势体现在以下四个方面:
1.将每个视频帧分离成由像素组成的块,因此视频帧的编码处理的过程可以达到块的级别。
2.采用空间冗余的方法,对视频帧的一些原始块进行空间预测、转换、优化和熵编码(可变长编码)。
3.对连续帧的不同块采用临时存放的方法,这样,只需对连续帧中有改变的部分进行编码。该算法采用运动预测和运动补偿来完成。对某些特定的块,在一个或多个已经进行了编码的帧执行搜索来决定块的运动向量,并由此在后面的编码和解码中预测主块。
4.采用剩余空间冗余技术,对视频帧里的残留块进行编码。例如:对于源块和相应预测块的不同,再次采用转换、优化和熵编码。
标准的H.264编码组分图如图1所示,其包括如下步骤:
(1)采用帧内预测或者运动估计决定所采用的最佳预测模式。
(2)将实际像素值减去预测值,得到残差。
(3)对残差进行变换和量化。
(4)变长编码和算术编码,并对量化的数据进行反量化和反变换,重构得到的图像滤波后作为其它帧的参考帧。
然而,H.264编码过程中,由于采用了多帧和高精度运动估计以及率失真优化等技术使得编码复杂度大幅增加,对硬件电路的设计和运算速度都提高了要求,另外,采用基于块的离散余弦变换与量化相结合的混合编码技术。其在低码率的情况下,重构的图像中会出现严重的块效应现象,且比特率越低时块效应越严重,图像的视觉效果也就越差。由于带宽的限制,现今低码率视频传输仍占有相当大的比重,且作为视频终端的接受者,人们更加注重图像的主观感受。在低码率的情况下,低码率和块效应之间存在着比较突出的矛盾。
发明内容
本发明的目的在于提供一种基于H.264的视频压缩方法,其占用较低码率的同时,减少图像块效应。
一种视频压缩方法,包括如下步骤:
1、采用基于结构相似度的快速运动估计决定所采用的最佳预测模式;
2.将实际像素值减去预测值,得到残差;
3.对残差进行变换和量化;
4.对量化的数据变长编码,并对量化的数据进行反量化和反变换,重构得到
的图像采用多模式的快速环路滤波后作为其它帧的参考帧。
本发明采用基于结构相似度的快速运动估计选择最佳预测模式,简化了复杂的搜索模式,达到了减小运动估计复杂度、改善压缩性能、有效的节约编码时间和降低码率;基于多模式的快速环路滤波,其针对不同的模式特点采用相应的滤波技术,其有效的降低滤波过程的复杂度,在保持图像客观质量的同时更好的降低了块效应。
附图说明
图1为现有技术中基于H.264视频压缩方法流程示意图;
图2为本发明基于H.264的视频压缩方法流程示意图;
图3为基于结构相似度快速运动估计方法流程示意图;
图4为环路滤波去块算法流程示意图;
图5为增强前向纠错算法流程示意图;
图6为基于速率兼容的收缩卷积码(RCPC)信道编码的非平等保护流程示意图;
图7为可变宏块排序(FMO)码率失真优化调度流程示意图。
具体实施方式
下面结合附图,对本发明作进一步的说明。
如图1,为现有技术中H.264编码标准的功能模块图,输入的视频进入编码器,由编码器对输入的信号进行帧分析,采用帧内预测或者运动估计决定所采用的最佳预测模式。然后用实际像素值减去预测值,得到残差值后对其进行变换和量化,然后对其变长编码,并对量化的数据进行反量化和反变换,重构得到的图像滤波后作为其它帧的参考帧。
H.264编码标准提高了图像传输效率的同时,随之而产生的由于多帧和高精度运动估计以及率失真优化等技术使得编码复杂度大幅增加,对硬件电路的设计和运算速度都提高了要求。
如图2,本发明的一种基于H.264的视频压缩方法,包括如下步骤:
1、采用基于结构相似度的快速运动估计决定所采用的最佳预测模式;
2、将实际像素值减去预测值,得到残差;
3、对残差进行变换和量化;
4、变长编码和算术编码,并对量化的数据进行反量化和反变换,重构得到的图像采用多模式的快速环路滤波后作为其它帧的参考帧。
采用基于结构相似度的快速运动估计选择最佳预测模式,简化了复杂的搜索模式,达到了减小运动估计复杂度、改善压缩性能、有效的节约编码时间和降低码率;基于多模式的快速环路滤波,其针对不同的模式特点采用相应的滤波技术,其有效的降低滤波过程的复杂度,在保持图像客观质量的同时更好的降低了块效应。
如图3,上述步骤1所述的基于结构相似度的快速运动估计算法包括如下步骤:
1)、初始化运动估计的率失真代价值MCOST,取值为范围为:0<Mcost≤1,本实施例取值0.99,也可以取0.9或0.95或0.8等。
2)、计算当前位置编码块与搜索位置候选块的结构相似度SSIM值,
并利用公式:Mcost(s,c)=K1(1-SSIM(s,c))+MOTIONb(ΔMV)计算当前搜索位置的运动矢量编码代价,如果该值大于当前MCOST,舍弃当前搜索位置,继续下一个搜索位置,否则更新当前位置为最佳匹配位置,更新当前运动矢量编码代价值为最小MCOST;上式中:
s为当前编码块;
c为候选匹配块;
K1是一个和编码块的大小相关的自适应参数,K1的取值范围为:
block_x×block_y≤QP≤block_x×block_y×4,本实施例取值K1的取值block_x×block_y×3;
MOTION为运动估计的拉格朗日乘子;
ΔMV是预测运动矢量和实际运动矢量的差值;
b(ΔMV)表示用来编码ΔMV所用的比特数;
3)、计算前搜索位置的结构相似度SSIM值并和预先设定的阈值T比较,阈值T取值范围为0<T<Mcost,本实施例取值0.75。如果SSIM比阈值T小,继续下一个搜索位置,返回步骤2,否则结束搜索过程,当前搜索位置被选为最佳匹配位置,停止搜索过程,保存最小Mcost和匹配位置矢量;
4)、利用公式:
J(s,c,MODE|QP)=K2(1-SSIM(s,c))+MODER(s,c,MODE|QP)计算每种预测模式最佳匹配块率失真代价,具有最小率失真代价的预测模式被选为当前编码块的最佳预测模式,上式中:
MODE是预测模式;
K2为自适应参数,取值范围为85000≤K2≤490000,本实施例取值260000;
s为当前编码块;
c为候选匹配块;
QP为量化参数,取值范围为10≤QP≤30,本实施例取为20;
R(s,c,MODE|QP)是用来编码残差部分所需的比特数。
如果当前编码模块INTER 8×8模式被选为最佳模式,对其子模式INTER 8×4、INTER 4×8、INTER 4×4作为当前位置码块返回步骤1分别寻找最佳预测模式。
K1是一个和编码块的大小相关的自适应参数,K1取值与预测模式相关,对于较大编码块的模式K1取值较大,而对于INTER 8×8模式及其子模式编码块K1取值较小。这样可以增加大块的预测精度,减少残差信号编码的率失真代价,因而大编码块模式倾向于被选为最佳预测模式,要合理避免8×8模式及其子模式。只有那些具有剧烈复杂运动的宏块才会使用复杂的子模式选择。该方法对于那些具有较小运动或者没有运动的序列非常有效。
在运动估计中使用固定的SSIM阈值作为提前结束条件,如果当前编码块和在搜索区域中候选块的SSIM值已经大于设定的阈值,跳过其他的搜索点,结束搜索过程,在保证压缩质量不下降的前提下,减少了因进一步搜索所造成的时间消耗。
上述步骤所述多模式快速滤波方法包括如下步骤:
a)根据图像编码宏块的模式和条件进行边界分析,利用图像的空间相关性对边界强度进行划分;
b)针对不同的边界模式采用不同的滤波策略,并且根据模式划分自适应地选择编码器的偏移量。
如图4,首先对P块和Q块是否为帧内码进行判断,若为帧内码,进一步判断其边缘是否为宏块边缘,若是宏块边缘则划分为边缘强度(Boundary Strength)BS=4的模式,若不为宏块边缘,进一步判断P块或Q块是否采用16X16帧内预测,或是则划分为BS=5的模式,若不是刚划分为BS=3的模式;若P块或Q块不为帧内编码,则进一步判断P块或Q块的残差变换系数是否为零,若不为零,则判断P块或Q块的非零系数所占的百分数是否大于50%,则划分为BS=6的模式,此块的边缘不需要滤波;若小于50%则划分为BS=2的模式,若P块或Q块的残差变换系数为零,刚判断P块或Q块的参考帧不同或运动适量差值是否大于1,若大于1,则判断P块或Q块是否采用8X8帧间编码预测,或是则此块的边缘不需要滤波,不是则划分为BS=1的模式,或P块或Q块的参考帧不同或运动适量差值小于1,则不需要对其进行滤波。上述不同边缘强度值对应不同滤波方法。其具体实施过程在《计算机科学》杂志第2008年07期中“基于H.264的多模式自适应环路滤波算法”一文中已得到公开。
基于多模式的快速滤波方法根据图像编码宏块的模式和条件分析并划分模式,对不同的模式采用不同的滤波方法,其有效的降低了滤波过程的复杂度,在保持图像客观质量不变或略有提高除了更多的块效应现象,大大提高了图像的主观质量。
如图5,本发明在变长编码后还包括对数据进行增强前向纠错编码(EFEC),以支持其在无线网络中的传输,并提高H.264视频业务的传输质量,其具体实施过程在《计算机应用》杂志第2008年09期“无线网络中支持H.264的增强前向纠错算法”一文已得到公开。
如图6,本发明在变长编码后还包括基于速率兼容的收缩卷积码(RCPC)信道编码的非平等保护,对输入与输出的数据进行错误估算比较,得到传输的误码率,通过调整传输以改善了视频在无线信道系统中的传输性能,保证了视频图像序列的可靠传输,提高了传输效率,其具体实施过程在《吉林大学学报(信息科学版)》第2008年04期“基于H.264的RCPC信道编码非平等误码保护”一文中已公开。
如图7,本发明还包括在视频数据编码后对可变宏块排序(FMO)码率失真优化调度,该算法根据当前信道的参数信道容量估算值和分组丢失率与之前估算的分组丢失率进行比较,信道变化调整传输参数,以保证编码视频获得更优越的传输性能,其具体实施过程在《华南理工大学学报:自然科学版》第2008年第36卷第9期已得到公开。
Claims (10)
1.一种基于H.264的视频压缩方法,其特征在于,包括如下步骤:
(1)采用基于结构相似度的快速运动估计决定所采用的最佳预测模式,所述的基于结构相似度的快速运动估计算法包括如下步骤:
1)初始化运动估计的率失真代价MCOST;
2)计算当前位置编码块与搜索位置候选块的结构相似度SSIM值,
并利用公式:MCOST(s,c)=K1(1-SSIM(s,c))+MOTIONb(ΔMV)计算当前搜索位置的运动矢量编码代价,如果该值大于当前MCOST,舍弃当前搜索位置,继续下一个搜索位置,否则更新当前位置为最佳匹配位置,更新当前运动矢量编码代价值为最小的MCOST;上式中:
s为当前编码块;
c为候选匹配块;
K1是一个和编码块的大小相关的自适应参数;
MOTION为运动估计的拉格朗日乘子;
ΔMV是预测运动矢量和实际运动矢量的差值;
b(ΔMV)表示用来编码ΔMV所用的比特数;
3)计算当前搜索位置的结构相似度SSIM值并和预先设定的阈值T比较,如果SSIM比阈值T小,继续下一个搜索位置,返回步骤2,否则结束搜索过程,当前搜索位置被选为最佳匹配位置,停止搜索过程,保存最小MCOST和匹配位置矢量;
4)利用公式:
J(s,c,MODE|QP)=K2(1-SSIM(s,c))+MODE R(s,c,MODE|QP)计算每种预测模式最佳匹配块率,失真代价,具有最小率失真代价的预测模式被选为当前编码块的最佳预测模式,上式中:
MODE是预测模式;
K2为自适应参数;
s为当前编码块;
c为候选匹配块;
QP为量化参数;
R(s,c,MODE|QP)是用来编码残差部分所需的比特数;
5)判断最佳匹配宏模式是否为8X8模式,若不是,则结束运动估计搜索,若是8X8模式,则返回步骤1)分别对其子模式8X4,4X8,4X4再进行最佳预测模式搜索;
(2)将实际像素值减去预测值,得到残差;
(3)对残差进行变换和量化;
(4)对量化后的变长编码,并对量化的数据进行反量化和反变换,重构得到的图像采用多模式的快速环路滤波后作为其它帧的参考帧。
2.根据权利要求1所述的一种基于H.264的视频压缩方法,其特征在于,步骤1)所述率失真代价值MCOST的取值为范围为:0<MCOST≤1。
3.根据权利要求1所述的一种基于H.264的视频压缩方法,其特征在于,所述率 失真代价值MCOST的值为0.8或0.9或0.95或0.99。
4.根据权利要求1所述的一种基于H.264的视频压缩方法,其特征在于,所述阈值T的取值范围为:0<T<MCOST。
5.根据权利要求1所述的一种基于H.264的视频压缩方法,其特征在于,所述量化参数QP取值范围为:10≤QP≤30,K1的取值范围为:
block_x×block_y≤QP≤block_x×block_y×4,K2的取值范围为:85000≤K2≤490000。
6.根据权利要求1所述的一种基于H.264的视频压缩方法,其特征在于,所述量化参数QP取值20,K1的取值范围为:block_x×block_y×3,K2的取值为260000。
7.根据权利要求1所述的一种基于H.264的视频压缩方法,其特征在于,步骤(4)所述多模式快速滤波方法包括如下步骤:
a)根据图像编码宏块的模式和条件进行边界分析,利用图像的空间相关性对边界强度进行划分;
b)针对不同的边界模式采用不同的滤波策略,并且根据模式划分自适应地选择编码器的偏移量。
8.根据权利要求1所述的一种基于H.264的视频压缩方法,其特征在于,在变长编码后还包括对数据进行增强前向纠错编码。
9.根据权利要求1或3所述的一种基于H.264的视频压缩方法,其特征在于,在变长编码后还包括基于速率兼容的收缩卷积码(RCPC)信道编码的非平等保护。
10.根据权利要求1所述的一种基于H.264的视频压缩方法,其特征在于,还包括在视频数据编码后对可变宏块排序(FMO)码率失真优化调度。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201010019322.2A CN102413323B (zh) | 2010-01-13 | 2010-01-13 | 一种基于h.264的视频压缩方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201010019322.2A CN102413323B (zh) | 2010-01-13 | 2010-01-13 | 一种基于h.264的视频压缩方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102413323A CN102413323A (zh) | 2012-04-11 |
CN102413323B true CN102413323B (zh) | 2014-03-12 |
Family
ID=45915133
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201010019322.2A Expired - Fee Related CN102413323B (zh) | 2010-01-13 | 2010-01-13 | 一种基于h.264的视频压缩方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102413323B (zh) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104104947B (zh) * | 2013-04-02 | 2016-10-19 | 腾讯科技(深圳)有限公司 | 一种视频编码方法和装置 |
CN103237222B (zh) * | 2013-05-07 | 2015-12-02 | 河海大学常州校区 | 多模式搜索的运动估计方法 |
CN104244003B (zh) * | 2014-08-18 | 2017-08-15 | 北京君正集成电路股份有限公司 | 一种确定运动矢量代价的方法及装置 |
CN104270634B (zh) * | 2014-10-11 | 2017-05-10 | 武汉大学 | 一种质量自适应的无线视频编码方法 |
CN104349167B (zh) * | 2014-11-17 | 2018-01-19 | 电子科技大学 | 一种视频编码率失真优化的调整方法 |
CN104639909A (zh) * | 2015-02-06 | 2015-05-20 | 达声蔚 | 一种传输视频的方法和装置 |
CN106034235B (zh) * | 2015-03-11 | 2020-01-03 | 杭州海康威视数字技术股份有限公司 | 计算编码失真度和编码模式控制的方法及其系统 |
CN106878727A (zh) * | 2016-12-31 | 2017-06-20 | 深圳市共进电子股份有限公司 | 视频数据处理方法及装置 |
CN107623859B (zh) * | 2017-11-27 | 2021-11-30 | 珠海亿智电子科技有限公司 | 一种低码率下jpeg编码的去块效应方法 |
CN108520505B (zh) * | 2018-04-17 | 2021-12-03 | 上海交通大学 | 基于多网络联合构建与自适应选择的环路滤波实现方法 |
CN109240629A (zh) * | 2018-08-27 | 2019-01-18 | 广州视源电子科技股份有限公司 | 一种桌面投屏方法、装置、设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1457196A (zh) * | 2003-04-25 | 2003-11-19 | 北京工业大学 | 基于时空域相关性运动矢量预测的视频编码方法 |
CN1708134A (zh) * | 2004-06-11 | 2005-12-14 | 三星电子株式会社 | 用于估计运动的方法和设备 |
CN101014128A (zh) * | 2007-02-02 | 2007-08-08 | 清华大学 | H.264/avc视频编码中速率和失真的快速估计方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7689051B2 (en) * | 2004-04-15 | 2010-03-30 | Microsoft Corporation | Predictive lossless coding of images and video |
-
2010
- 2010-01-13 CN CN201010019322.2A patent/CN102413323B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1457196A (zh) * | 2003-04-25 | 2003-11-19 | 北京工业大学 | 基于时空域相关性运动矢量预测的视频编码方法 |
CN1708134A (zh) * | 2004-06-11 | 2005-12-14 | 三星电子株式会社 | 用于估计运动的方法和设备 |
CN101014128A (zh) * | 2007-02-02 | 2007-08-08 | 清华大学 | H.264/avc视频编码中速率和失真的快速估计方法 |
Also Published As
Publication number | Publication date |
---|---|
CN102413323A (zh) | 2012-04-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102413323B (zh) | 一种基于h.264的视频压缩方法 | |
CN101946515B (zh) | Cabac译码器的二回合量化 | |
JP5189172B2 (ja) | 適応性動き情報コスト推定 | |
JP5413191B2 (ja) | 動画像符号化方法及び装置並びに動画像復号装置 | |
CN104320657B (zh) | Hevc无损视频编码的预测模式选择方法及相应的编码方法 | |
CN103460700A (zh) | 以帧内预测模式解码图像的方法 | |
US20060209952A1 (en) | Image encoding/decoding method and apparatus therefor | |
JP2007089035A (ja) | 動画像符号化方法、装置及びプログラム | |
JP2010135864A (ja) | 画像符号化方法及び装置並びに画像復号化方法及び装置 | |
AU2012272779B2 (en) | Method and apparatus for motion compensation prediction | |
RU2573747C2 (ru) | Способ и устройство кодирования видео, способ и устройство декодирования видео и программы для них | |
CN102067610A (zh) | 基于视频编码的切片依赖性的码率控制模型适配 | |
WO2006096612A2 (en) | System and method for motion estimation and mode decision for low-complexity h.264 decoder | |
CN102137263A (zh) | 基于cnm关键帧分类的分布式视频编码及解码方法 | |
KR20110045950A (ko) | 복수의 프레임을 참조하여 영상을 부호화, 복호화하는 방법 및 장치 | |
CN104754337B (zh) | 视频编码方法 | |
CN101331773B (zh) | 使用速率失真特性进行速率受控视频编码的装置和方法 | |
WO2008149327A2 (en) | Method and apparatus for motion-compensated video signal prediction | |
Türkan et al. | Image prediction: Template matching vs. sparse approximation | |
CN101888556A (zh) | 编码、解码方法和编码、解码装置 | |
CN101304529A (zh) | 宏块模式的选择方法和装置 | |
CN114915789B (zh) | 一种帧间的拉格朗日乘子优化方法、系统、设备及介质 | |
CN103384327A (zh) | 基于自适应阈值的avs快速模式选择算法 | |
CN101115200B (zh) | 一种有效的运动矢量可伸缩编码方法 | |
CN101867818B (zh) | 宏块模式的选择方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20140312 |