CN100372382C - 一种视频图象编码方法 - Google Patents
一种视频图象编码方法 Download PDFInfo
- Publication number
- CN100372382C CN100372382C CNB031463010A CN03146301A CN100372382C CN 100372382 C CN100372382 C CN 100372382C CN B031463010 A CNB031463010 A CN B031463010A CN 03146301 A CN03146301 A CN 03146301A CN 100372382 C CN100372382 C CN 100372382C
- Authority
- CN
- China
- Prior art keywords
- matrix
- video image
- processing
- inverse
- frame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
一种视频编码方法,该方法先对图象进行宏块预测和补偿处理,然后对预测差值进行4×4 DCT-like整数变换处理,再对变换系数分别进行量化和熵编码处理。该方法采用了一种新的4×4 DCT-like整数变换方法和相应的逆变换、量化、逆量化方法,该变换方法的计算复杂度较低,变换过程只涉及到加法和乘法运算,变换性能非常接近于4×4 DCT,从而具有类似于DCT的较好的去相关性能,可以得到较好的视频压缩效果。
Description
技术领域
本发明涉及视频处理领域,具体地说,是一种视频图象编码方法。
技术背景
目前,视频领域的技术突飞猛进,关于视频编码的技术方案很多,但由于余弦变换具有较好的去相关性能,并且易于快速实现,因此,在视频编码领域得到了非常广泛的应用,现有的视频压缩标准MPEG-1、MPEG-2、MPEG-4(Part 2)、H.261、H.263都是基于8×8 DCT变换的,其一般的处理框架示意图如图1所示。
H.263的编码压缩框架如图2所示,其中的“T”指的就是图象数据或预测差值数据的8×8DCT变换。
余弦变换的一般表示方式为:
其中:
由于DCT变换要进行复杂的浮点运算,在IDCT中还存在由于失配而造成的精度不高问题,因此,一些专家分别提出了一些变换性能接近于DCT变换的整数变换方法,以降低计算复杂度,提高变换精度。
在文献1[Antti Hallapuro,Marta Karczewicz,“Low Complexity Tranafonm andQuantization-Part I:Basic Implementation”,ISO/IEC JTC1/SC29/WG11 and ITU-TSG16 Q.6 Document JVT-B038,January 2002.]给出了一种2D 4×4 DCT-like整数变换方法,其变换矩阵为:
还给出了相应的逆变换、量化和逆量化方法。该变换矩阵元素简单,变换计算处理中只有加法和移位操作,硬件实现容易,该方法已被应用于视频压缩标准H.264&MPEG-4(Part 10)中,其编码框图如图3所示。
文献[1]所给出的2D 4×4 DCT-like整数变换方法,虽然其变换性能比较接近于DCT变换,但其变换结果与DCT相比相差较大,从而会降低变换性能及压缩效率。
发明内容
本发明的目的就是给出了一种基于4×4 DCT-like整数变换的视频图象编码方法,为此,本发明采用如下技术方案:
一种视频图象编码方法,包括以下步骤:
步骤a、将输入视频图象分割成16×16宏块,并对I帧图象进行帧内象素预测和补偿处理,对P帧图象进行帧间运动估计及运动补偿处理;
步骤b、变换器对输入预测差值数据进行变换处理;
步骤c、对变换系数进行量化及熵编码处理,并将编码码流传递给接收端;
步骤d、接收端对编码码流进行熵解码及逆量化处理;
步骤e、逆变换器对逆量化后系数进行逆变换处理;
步骤f、对逆变换处理后的图象数据进行帧内象素补偿或帧间运动补偿,并将解码后的视频图象输出。
所述的步骤b,采用2D 4×4 DCT-like整数变换方法对视频图象进行变换处理,其变换计算采用如下公式:
Y=(CXC′)E
所述的步骤e,采用2D 4×4 IDCT-like逆变换方法对视频图象进行逆变换处理,其逆变换采用如下公式:
X=C′(YE)C
其中X为图象数据矩阵或预测差值数据矩阵,Y为相应的变换系数矩阵,表示两个矩阵对应位置的元素相乘,E为一个伸缩矩阵。
所述的视频图象编码方法,可以做如下取值:
所述的视频图象编码方法,可以做如下取值:
所述的视频图象编码方法,可以做如下取值:做如下取值:
所述的视频图象编码方法,可以做如下取值:
所述的视频图象编码方法,可以做如下取值:
所述的视频图象编码方法,可以做如下取值:
所述的视频图象编码方法,可以做如下取值:
所述的视频图象编码方法,可以做如下取值:
将所述的“E”相乘处理并入到量化和逆量化处理过程中。
本发明所给出的整数变换方法在计算性能上与现有技术相当,变换过程只涉及到加法和乘法运算,但更接近于DCT的变换性能,从而具有类似于DCT的较好的去相关性能,具有更优的变换性能,可以得到更好的视频压缩效果。
附图说明
图1是基于DCT的视频编码框架示意图;
图2是现有技术中H.263视频编码示意图;
图3是H.264&MPEG-4(Part 10)视频编码框架示意图;
图4是本发明对视频图象进行编码处理的示意图;
图5是本发明对视频图象进行编码处理的流程图。
具体实施方式
下面结合说明书附图来说明本发明的具体实施方式。
如图4及图5所示,是本发明对视频图象进行编码处理的示意图及流程图,从图中可以看出,本发明主要包括以下步骤:
a、将输入视频图象分割成16×16宏块,并对I帧图象进行帧内象素预测和补偿,对P帧图象进行帧间运动估计及运动补偿;
b、变换器对输入预测差值数据进行变换处理;
c、对变换系数进行量化及熵编码处理,并将编码码流传递给接收端;
d、接收端对编码码流进行熵解码及逆量化处理;
e、逆变换器对逆量化后系数进行逆变换处理;
f、对逆变换处理后的图象数据进行帧内象素补偿或帧间运动补偿,并将解码后的视频图象输出。
对于b和e,本发明中,采用一种新的变换方法和相应的逆变换方法,提出一种新的2D 4×4 DCT-like整数变换方法和相应的量化方法,下面具体介绍一下:其中X为4×4图象数据矩阵或预测差值数据矩阵,Y为相应的4×4变换系数矩阵,T表示矩阵的转置。
我们知道,2D 4×4正向DCT变换方法为:
2D 4×4逆向DCT变换方法为:
X=A′YA
其中A为变换矩阵,
可以将(1)式改写为:
其中表示两个矩阵对应位置的元素相乘。
正向变换:
逆向变换:
由于 比较(2)、(3)式可以看出,(3)式中的整数变换相当于取 显然过于粗糙,为了进一步提高变换精度,使变换性能更接近于DCT,本专利取 再由A′A=I可得: 因此,由(2)可得如下变换方法:
正向变换:
逆向变换:
由于 和 则:
其相乘处理可以并入到对变换系数的量化处理过程中。
下面通过两个典型的例子来进行比较说明。
例1:4×4图像为 则:
其DCT变换结果为
由(3)式计算的结果为
与DCT的误差为
由(5)式计算的结果为
与DCT的误差为
例2:4×4图像为 则:
其DCT变换结果为
由(3)式计算的结果为
与DCT的误差为
由(5)式计算的结果为
与DCT的误差为
(1)取 则得到如下变换矩阵和E矩阵为:
(2)取 则得到如下变换矩阵和E矩阵为:
(3)取 则得到如下变换矩阵和E矩阵为:
(4)取 则得到如下变换矩阵和E矩阵为:
(5)取 则得到如下变换矩阵和E矩阵为:
(6)取 则得到如下变换矩阵和E矩阵为:
(7)取 则得到如下变换矩阵和E矩阵为:
对比(3)、(4)与(5)、(6),并通过以上例子可以看出,本专利所速DCT-like整数变换方法的计算性能与文献[1]所述方法相当,但更为接近于DCT的变换性能。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求书的保护范围为准。
Claims (9)
1.一种视频图象编码方法,包括以下步骤:
步骤a、将输入视频图象分割成16×16宏块,并对I帧图象进行帧内象素预测和补偿处理,对P帧图象进行帧间运动估计及运动补偿处理;
步骤b、变换器对输入预测差值数据进行变换处理;
步骤c、对变换系数进行量化及熵编码处理,并将编码码流传递给接收端;
步骤d、接收端对编码码流进行熵解码及逆量化处理;
步骤e、逆变换器对逆量化后系数进行逆变换处理;
步骤f、对逆变换处理后的图象数据进行帧内象素补偿或帧间运动补偿,并将解码后的视频图象输出;
其特征在于所述的步骤b,采用2D 4×4 DCT-like整数变换方法对视频图象进行变换处理,其变换计算采用如下公式:
Y=(CXCT)E
所述的步骤e,采用2D 4×4 IDCT-like逆变换方法对视频图象进行逆变换处理,其逆变换采用如下公式:
X=CT(YE)C
其中X为图象数据矩阵或预测差值数据矩阵,Y为相应的变换系数矩阵,CT表示矩阵C的转置矩阵,表示两个矩阵对应位置的元素相乘,E为一个伸缩矩阵,在方法实施过程中,做如下取值:
2.如权利要求1所述的视频图象编码方法,其特征在于将所述的“E”相乘处理并入到量化和逆量化处理过程中。
3.一种视频图象编码方法,包括以下步骤:
步骤a、将输入视频图象分割成16×16宏块,并对I帧图象进行帧内象素预测和补偿处理,对P帧图象进行帧间运动估计及运动补偿处理;
步骤b、变换器对输入预测差值数据进行变换处理;
步骤c、对变换系数进行量化及熵编码处理,并将编码码流传递给接收端;
步骤d、接收端对编码码流进行熵解码及逆量化处理;
步骤e、逆变换器对逆量化后系数进行逆变换处理;
步骤f、对逆变换处理后的图象数据进行帧内象素补偿或帧间运动补偿,并将解码后的视频图象输出;
其特征在于所述的步骤b,采用2D 4×4 DCT-like整数变换方法对视频图象进行变换处理,其变换计算采用如下公式:
Y=(CXCT)E
所述的步骤e,采用2D4×4 IDCT-like逆变换方法对视频图象进行逆变换处理,其逆变换采用如下公式:
X=CT(YE)C
其中X为图象数据矩阵或预测差值数据矩阵,Y为相应的变换系数矩阵,CT表示矩阵C的转置矩阵,表示两个矩阵对应位置的元素相乘,E为一个伸缩矩阵,在方法实施过程中,做如下取值:
4.一种视频图象编码方法,包括以下步骤:
步骤a、将输入视频图象分割成16×16宏块,并对I帧图象进行帧内象素预测和补偿处理,对P帧图象进行帧间运动估计及运动补偿处理;
步骤b、变换器对输入预测差值数据进行变换处理;
步骤c、对变换系数进行量化及熵编码处理,并将编码码流传递给接收端;
步骤d、接收端对编码码流进行熵解码及逆量化处理;
步骤e、逆变换器对逆量化后系数进行逆变换处理;
步骤f、对逆变换处理后的图象数据进行帧内象素补偿或帧间运动补偿,并将解码后的视频图象输出;
其特征在于所述的步骤b,采用2D 4×4 DCT-like整数变换方法对视频图象进行变换处理,其变换计算采用如下公式:
Y=(CXCT)E
所述的步骤e,采用2D 4×4 IDCT-like逆变换方法对视频图象进行逆变换处理,其逆变换采用如下公式:
X=CT(YE)C
其中X为图象数据矩阵或预测差值数据矩阵,Y为相应的变换系数矩阵,CT表示矩阵C的转置矩阵,表示两个矩阵对应位置的元素相乘,E为一个伸缩矩阵,在方法实施过程中,做如下取值:
5.一种视频图象编码方法,包括以下步骤:
步骤a、将输入视频图象分割成16×16宏块,并对I帧图象进行帧内象素预测和补偿处理,对P帧图象进行帧间运动估计及运动补偿处理;
步骤b、变换器对输入预测差值数据进行变换处理;
步骤c、对变换系数进行量化及熵编码处理,并将编码码流传递给接收端;
步骤d、接收端对编码码流进行熵解码及逆量化处理;
步骤e、逆变换器对逆量化后系数进行逆变换处理;
步骤f、对逆变换处理后的图象数据进行帧内象素补偿或帧间运动补偿,并将解码后的视频图象输出;
其特征在于所述的步骤b,采用2D 4×4 DCT-like整数变换方法对视频图象进行变换处理,其变换计算采用如下公式:
Y=(CXCT)E
所述的步骤e,采用2D 4×4 IDCT-like逆变换方法对视频图象进行逆变换处理,其逆变换采用如下公式:
X=CT(YE)C
其中X为图象数据矩阵或预测差值数据矩阵,Y为相应的变换系数矩阵,CT表示矩阵C的转置矩阵,表示两个矩阵对应位置的元素相乘,E为一个伸缩矩阵,在方法实施过程中,做如下取值:
6.一种视频图象编码方法,包括以下步骤:
步骤a、将输入视频图象分割成16×16宏块,并对I帧图象进行帧内象素预测和补偿处理,对P帧图象进行帧间运动估计及运动补偿处理;
步骤b、变换器对输入预测差值数据进行变换处理;
步骤c、对变换系数进行量化及熵编码处理,并将编码码流传递给接收端;
步骤d、接收端对编码码流进行熵解码及逆量化处理;
步骤e、逆变换器对逆量化后系数进行逆变换处理;
步骤f、对逆变换处理后的图象数据进行帧内象素补偿或帧间运动补偿,并将解码后的视频图象输出;
其特征在于所述的步骤b,采用2D 4×4 DCT-like整数变换方法对视频图象进行变换处理,其变换计算采用如下公式:
Y=(CXCT)E
所述的步骤e,采用2D 4×4 IDCT-like逆变换方法对视频图象进行逆变换处理,其逆变换采用如下公式:
X=CT(YE)C
其中X为图象数据矩阵或预测差值数据矩阵,Y为相应的变换系数矩阵,CT表示矩阵C的转置矩阵,表示两个矩阵对应位置的元素相乘,E为一个伸缩矩阵,在方法实施过程中,做如下取值:
7.一种视频图象编码方法,包括以下步骤:
步骤a、将输入视频图象分割成16×16宏块,并对I帧图象进行帧内象素预测和补偿处理,对P帧图象进行帧间运动估计及运动补偿处理;
步骤b、变换器对输入预测差值数据进行变换处理;
步骤c、对变换系数进行量化及熵编码处理,并将编码码流传递给接收端;
步骤d、接收端对编码码流进行熵解码及逆量化处理;
步骤e、逆变换器对逆量化后系数进行逆变换处理;
步骤f、对逆变换处理后的图象数据进行帧内象素补偿或帧间运动补偿,并将解码后的视频图象输出;
其特征在于所述的步骤b,采用2D 4×4 DCT-like整数变换方法对视频图象进行变换处理,其变换计算采用如下公式:
Y=(CXCT)E
所述的步骤e,采用2D 4×4 IDCT-like逆变换方法对视频图象进行逆变换处理,其逆变换采用如下公式:
X=CT(YE)C
其中X为图象数据矩阵或预测差值数据矩阵,Y为相应的变换系数矩阵,CT表示矩阵C的转置矩阵,表示两个矩阵对应位置的元素相乘,E为一个伸缩矩阵,在方法实施过程中,做如下取值:
8.一种视频图象编码方法,包括以下步骤:
步骤a、将输入视频图象分割成16×16宏块,并对I帧图象进行帧内象素预测和补偿处理,对P帧图象进行帧间运动估计及运动补偿处理;
步骤b、变换器对输入预测差值数据进行变换处理;
步骤c、对变换系数进行量化及熵编码处理,并将编码码流传递给接收端;
步骤d、接收端对编码码流进行熵解码及逆量化处理;
步骤e、逆变换器对逆量化后系数进行逆变换处理;
步骤f、对逆变换处理后的图象数据进行帧内象素补偿或帧间运动补偿,并将解码后的视频图象输出;
其特征在于所述的步骤b,采用2D 4×4 DCT-like整数变换方法对视频图象进行变换处理,其变换计算采用如下公式:
Y=(CXCT)E
所述的步骤e,采用2D 4×4 IDCT-like逆变换方法对视频图象进行逆变换处理,其逆变换采用如下公式:
X=CT(YE)C
其中X为图象数据矩阵或预测差值数据矩阵,Y为相应的变换系数矩阵,CT表示矩阵C的转置矩阵,表示两个矩阵对应位置的元素相乘,E为一个伸缩矩阵,在方法实施过程中,做如下取值:
9.一种视频图象编码方法,包括以下步骤:
步骤a、将输入视频图象分割成16×16宏块,并对I帧图象进行帧内象素预测和补偿处理,对P帧图象进行帧间运动估计及运动补偿处理;
步骤b、变换器对输入预测差值数据进行变换处理;
步骤c、对变换系数进行量化及熵编码处理,并将编码码流传递给接收端;
步骤d、接收端对编码码流进行熵解码及逆量化处理;
步骤e、逆变换器对逆量化后系数进行逆变换处理;
步骤f、对逆变换处理后的图象数据进行帧内象素补偿或帧间运动补偿,并将解码后的视频图象输出;
其特征在于所述的步骤b,采用2D 4×4 DCT-like整数变换方法对视频图象进行变换处理,其变换计算采用如下公式:
Y=(CXCT)E
所述的步骤e,采用2D 4×4 IDCT-like逆变换方法对视频图象进行逆变换处理,其逆变换采用如下公式:
X=CT(YE)C
其中X为图象数据矩阵或预测差值数据矩阵,Y为相应的变换系数矩阵,CT表示矩阵C的转置矩阵,表示两个矩阵对应位置的元素相乘,E为一个伸缩矩阵,在方法实施过程中,做如下取值:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB031463010A CN100372382C (zh) | 2003-03-24 | 2003-07-08 | 一种视频图象编码方法 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN03120951.3 | 2003-03-24 | ||
CN03120951 | 2003-03-24 | ||
CNB031463010A CN100372382C (zh) | 2003-03-24 | 2003-07-08 | 一种视频图象编码方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1533184A CN1533184A (zh) | 2004-09-29 |
CN100372382C true CN100372382C (zh) | 2008-02-27 |
Family
ID=34314786
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB031463010A Expired - Lifetime CN100372382C (zh) | 2003-03-24 | 2003-07-08 | 一种视频图象编码方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN100372382C (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100440978C (zh) * | 2004-09-28 | 2008-12-03 | 华为技术有限公司 | 一种视频图像编码方法 |
JP4501675B2 (ja) * | 2004-12-22 | 2010-07-14 | 日本電気株式会社 | 動画像圧縮符号化方法と動画像圧縮符号化装置並びにプログラム |
US8155189B2 (en) * | 2005-10-19 | 2012-04-10 | Freescale Semiconductor, Inc. | System and method of coding mode decision for video encoding |
CN101127903B (zh) * | 2007-09-29 | 2010-12-08 | 华南理工大学 | 基于dct的分辨率可伸缩图像编解码方法 |
CN101562747B (zh) * | 2009-05-19 | 2010-08-25 | 华中科技大学 | 一种视频编码预测残差块的分解及重建方法 |
CN102137260A (zh) * | 2011-04-20 | 2011-07-27 | 深圳市融创天下科技发展有限公司 | 一种视频编码4x4整数变换方法 |
CN102395031B (zh) * | 2011-11-23 | 2013-08-07 | 清华大学 | 一种数据压缩方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1158058A (zh) * | 1995-12-06 | 1997-08-27 | 汤姆森多媒体公司 | 数字视频信号编码的方法和设备 |
JPH1118093A (ja) * | 1997-06-12 | 1999-01-22 | Internatl Business Mach Corp <Ibm> | 共用情報を用いるdctドメイン逆動き補償のためのシステム及び方法 |
US20020106027A1 (en) * | 2000-12-04 | 2002-08-08 | Samuel Moon-Ho | Regularized dequantizer for DCT-based transform coding |
-
2003
- 2003-07-08 CN CNB031463010A patent/CN100372382C/zh not_active Expired - Lifetime
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1158058A (zh) * | 1995-12-06 | 1997-08-27 | 汤姆森多媒体公司 | 数字视频信号编码的方法和设备 |
JPH1118093A (ja) * | 1997-06-12 | 1999-01-22 | Internatl Business Mach Corp <Ibm> | 共用情報を用いるdctドメイン逆動き補償のためのシステム及び方法 |
US20020106027A1 (en) * | 2000-12-04 | 2002-08-08 | Samuel Moon-Ho | Regularized dequantizer for DCT-based transform coding |
Also Published As
Publication number | Publication date |
---|---|
CN1533184A (zh) | 2004-09-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10805616B2 (en) | Parameterization for fading compensation | |
US11064214B2 (en) | System and methodology for video compression | |
JP3132456B2 (ja) | 階層的画像符号化方式、及び階層的画像復号方式 | |
CN101946515B (zh) | Cabac译码器的二回合量化 | |
EP1359770B1 (en) | Signaling for fading compensation in video encoding | |
JP2003250157A (ja) | 静止映像及び動映像を符号化/復号化するための変換係数の最適走査方法 | |
US20030206593A1 (en) | Fading estimation/compensation | |
JP2011229145A (ja) | 符号化ユニットにおける動画符号化においてハイブリッド多仮説予測を行う方法、および関連装置 | |
CN101663895B (zh) | 使用所估计译码成本的视频译码模式选择 | |
MX2013014726A (es) | Metodo y aparato para prediccion de compensacion de movimiento. | |
CN100372382C (zh) | 一种视频图象编码方法 | |
CN100440978C (zh) | 一种视频图像编码方法 | |
CN100411442C (zh) | 一种视频图象编码方法 | |
KR101419689B1 (ko) | H.264/avc 복호기에서 역양자화 및 역변환을 수행하는 복호화 장치 및 이를 이용한 복호화 방법 | |
CN101150721B (zh) | 具有适应性位元平面编码模式的编码方法 | |
KR100744435B1 (ko) | 고속 동영상 압축을 위한 dct 및 양자화 과정 생략 방법 | |
JP4642033B2 (ja) | 参照フレームの数を固定する符号化方式で画像の参照ブロックを取得する方法 | |
CN114449241B (zh) | 一种适用于图像压缩的色彩空间转化算法 | |
US7065139B2 (en) | Video encoding method and video encoder for improving performance | |
KR20060091436A (ko) | 동영상 표준 부호화 방식의 성능 향상을 위한 잔여신호 필터링 방법 | |
CN1333601C (zh) | 一种实现缩放的视频解码方法 | |
KR100497760B1 (ko) | 이동통신 단말기용 동영상 부호화 시스템 및 방법 | |
KR100991344B1 (ko) | 영상을 디코딩하는 방법 | |
JP4361665B2 (ja) | 動画像符号化データのトランスコーディング方法およびトランスコーディング装置 | |
KR100669635B1 (ko) | 상관성 기반 움직임 보상방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CX01 | Expiry of patent term | ||
CX01 | Expiry of patent term |
Granted publication date: 20080227 |