CN1533184A - 一种视频图象编码方法 - Google Patents
一种视频图象编码方法 Download PDFInfo
- Publication number
- CN1533184A CN1533184A CNA031463010A CN03146301A CN1533184A CN 1533184 A CN1533184 A CN 1533184A CN A031463010 A CNA031463010 A CN A031463010A CN 03146301 A CN03146301 A CN 03146301A CN 1533184 A CN1533184 A CN 1533184A
- Authority
- CN
- China
- Prior art keywords
- video image
- matrix
- approximate value
- following approximate
- image code
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
一种视频编码方法,该方法先对图象进行宏块预测和补偿处理,然后对预测差值进行4×4 DCT-like整数变换处理,再对变换系数分别进行量化和熵编码处理。该方法采用了一种新的4×4 DCT-like整数变换方法和相应的逆变换、量化、逆量化方法,该变换方法的计算复杂度较低,变换过程只涉及到加法和乘法运算,变换性能非常接近于4×4 DCT,从而具有类似于DCT的较好的去相关性能,可以得到较好的视频压缩效果。
Description
技术领域
本发明涉及视频处理领域,具体地说,是一种视频图象编码方法。
技术背景
目前,视频领域的技术突飞猛进,关于视频编码的技术方案很多,但由于余弦变换具有较好的去相关性能,并且易于快速实现,因此,在视频编码领域得到了非常广泛的应用,现有的视频压缩标准MPEG-1、MPEG-2、MPEG-4(Part 2)、H.261、H.263都是基于8×8 DCT变换的,其一般的处理框架示意图如图1所示。
H.263的编码压缩框架如图2所示,其中的“T”指的就是图象数据或预测差值数据的8×8 DCT变换。
余弦变换的一般表示方式为:
其中:
由于DCT变换要进行复杂的浮点运算,在IDCT中还存在由于失配而造成的精度不高问题,因此,一些专家分别提出了一些变换性能接近于DCT变换的整数变换方法,以降低计算复杂度,提高变换精度。
在文献1[Antti Hallapuro,Marta Karczewicz,“Low Complexity Transform andQuantization-Part I:Basic Implementation”,ISO/IEC JTC1/SC29/WG11 and ITU-TSG16 Q.6 Document JVT-B038,January 2002.]给出了一种2D 4×4 DCT-like整数变换方法,其变换矩阵为:
还给出了相应的逆变换、量化和逆量化方法。该变换矩阵元素简单,变换计算处理中只有加法和移位操作,硬件实现容易,该方法已被应用于视频压缩标准H.264 & MPEG-4(Part 10)中,其编码框图如图3所示。
文献[1]所给出的2D 4×4 DCT-like整数变换方法,虽然其变换性能比较接近于DCT变换,但其变换结果与DCT相比相差较大,从而会降低变换性能及压缩效率。
发明内容
本发明的目的就是给出了一种基于4×4 DCT-like整数变换的视频图象编码方法,为此,本发明采用如下技术方案:
一种视频图象编码方法,包括以下步骤:
a、将输入视频图象分割成16×16宏块,并对I帧图象进行帧内象素预测和补偿处理,对P帧图象进行帧间运动估计及运动补偿处理;
b、变换器对输入预测差值数据进行变换处理;
c、对变换系数进行量化及熵编码处理,并将编码码流传递给接收端;
d、接收端对编码码流进行熵解码及逆量化处理;
e、逆变换器对逆量化后系数进行逆变换处理;
f、对逆变换处理后的图象数据进行帧内象素补偿或帧间运动补偿,并将解码后的视频图象输出;
其特征在于所述的步骤b,采用2D 4×4 DCT-like整数变换方法对视频图象进行变换处理,其变换计算采用如下公式:
Y=(CXCT)E
所述的步骤e,采用2D 4×4 IDCT-like逆变换方法对视频图象进行逆变换处理,其逆变换采用如下公式:
X=CT(YE)C
其中X为图象数据距阵或预测差值数据距阵,Y为相应的变换系数距阵,表示两个矩阵对应位置的元素相乘,E为一个伸缩矩阵。
所述的视频图象编码方法,可以做如下近似取值:
所述的视频图象编码方法,可以做如下近似取值:
所述的视频图象编码方法,可以做如下近似取值:
所述的视频图象编码方法,可以做如下近似取值:
所述的视频图象编码方法,可以做如下近似取值:
所述的视频图象编码方法,可以做如下近似取值:
所述的视频图象编码方法,可以做如下近似取值:
所述的视频图象编码方法,可以做如下近似取值:
将所述的“E”相乘处理并入到量化和逆量化处理过程中。
本发明所给出的整数变换方法在计算性能上与现有技术相当,变换过程只涉及到加法和乘法运算,但更接近于DCT的变换性能,从而具有类似于DCT的较好的去相关性能,具有更优的变换性能,可以得到更好的视频压缩效果。
附图说明
图1是基于DCT的视频编码框架示意图;
图2是现有技术中H.263视频编码示意图;
图3是H.264 & MPEG-4(Part 10)视频编码框架示意图;
图4是本发明对视频图象进行编码处理的示意图;
图5是本发明对视频图象进行编码处理的流程图。
具体实施方式
下面结合说明书附图来说明本发明的具体实施方式。
如图4及图5所示,是本发明对视频图象进行编码处理的示意图及流程图,从图中可以看出,本发明主要包括以下步骤:
a、将输入视频图象分割成16×16宏块,并对I帧图象进行帧内象素预测和补偿,对P帧图象进行帧间运动估计及运动补偿;
b、变换器对输入预测差值数据进行变换处理;
c、对变换系数进行量化及熵编码处理,并将编码码流传递给接收端;
d、接收端对编码码流进行熵解码及逆量化处理;
e、逆变换器对逆量化后系数进行逆变换处理;
f、对逆变换处理后的图象数据进行帧内象素补偿或帧间运动补偿,并将解码后的视频图象输出。
对于b和e,本发明中,采用一种新的变换方法和相应的逆变换方法,提出一种新的2D 4×4 DCT-like整数变换方法和相应的量化方法,下面具体介绍一下:其中X为4×4图象数据矩阵或预测差值数据矩阵,Y为相应的4×4变换系数矩阵,T表示矩阵的转置。
我们知道,2D 4×4正向DCT变换方法为:
2D 4×4逆向DCT变换方法为:
X=ATYA
其中A为变换矩阵,
可以将(1)式改写为:
其中表示两个矩阵对应位置的元素相乘。
在文献[1]中,将
近似取为
再由ATA=I可得:
从而得到了如下变换方法:
正向变换:
逆向变换:
由于
比较(2)、(3)式可以看出,(3)式中的整数变换相当于取
显然过于粗糙,为了进一步提高变换精度,使变换性能更接近于DCT,本专利取
再由ATA=I可得:
因此,由(2)可得如下变换方法:
正向变换:
逆向变换:
由于
和
则:
其相乘处理可以并入到对变换系数的量化处理过程中。
下面通过两个典型的例子来进行比较说明。
例1:4×4图象为
则:
其DCT变换结果为
由(3)式计算的结果为
与DCT的误差为
由(5)式计算的结果为
与DCT的误差为
例2:4×4图象为
则:
其DCT变换结果为
由(3)式计算的结果为
与DCT的误差为
由(5)式计算的结果为
与DCT的误差为
本发明的基本思想如上所述,但可以将
取为[0,6]中的其它值,从而得到相应的变换矩阵。例如:
(1)取
则得到如下变换矩阵和E矩阵为:
(2)取
则得到如下变换矩阵和E矩阵为:
(3)取
则得到如下变换矩阵和E矩阵为:
(4)取
则得到如下变换矩阵和E矩阵为:
(5)取
则得到如下变换矩阵和E矩阵为:
(6)取
则得到如下变换矩阵和E矩阵为:
(7)取
则得到如下变换矩阵和E矩阵为:
对比(3)、(4)与(5)、(6),并通过以上例子可以看出,本专利所述DCT-like整数变换方法的计算性能与文献[1]所述方法相当,但更为接近于DCT的变换性能。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求书的保护范围为准。
Claims (9)
1、一种视频图象编码方法,包括以下步骤:
a、将输入视频图象分割成16×16宏块,并对I帧图象进行帧内象素预测和补偿处理,对P帧图象进行帧间运动估计及运动补偿处理;
b、变换器对输入预测差值数据进行变换处理;
c、对变换系数进行量化及熵编码处理,并将编码码流传递给接收端;
d、接收端对编码码流进行熵解码及逆量化处理;
e、逆变换器对逆量化后系数进行逆变换处理;
f、对逆变换处理后的图象数据进行帧内象素补偿或帧间运动补偿,并将解码后的视频图象输出;
其特征在于所述的步骤b,采用2D 4×4 DCT-like整数变换方法对视频图象进行变换处理,其变换计算采用如下公式:
Y=(CXCT)E
所述的步骤e,采用2D 4×4 IDCT-like逆变换方法对视频图象进行逆变换处理,其逆变换采用如下公式:
X=CT(YE)C
其中X为图象数据距阵或预测差值数据距阵,Y为相应的变换系数距阵,CT表示矩阵C的转置矩阵,表示两个矩阵对应位置的元素相乘,E为一个伸缩矩阵,在方法实施过程中,做如下近似取值:
2、如权利要求1所述的视频图象编码方法,其特征在于在方法实施过程中,做如下近似取值:
3、如权利要求1所述的视频图象编码方法,其特征在于在方法实施过程中,做如下近似取值:
4、如权利要求1所述的视频图象编码方法,其特征在于在方法实施过程中,做如下近似取值:
5、如权利要求1所述的视频图象编码方法,其特征在于在方法实施过程中,做如下近似取值:
6、如权利要求1所述的视频图象编码方法,其特征在于在方法实施过程中,做如下近似取值:
7、如权利要求1所述的视频图象编码方法,其特征在于在方法实施过程中,做如下近似取值:
8、如权利要求1所述的视频图象编码方法,其特征在于在方法实施过程中,做如下近似取值:
9、如权利要求1所述的视频图象编码方法,其特征在于将所述的“E”相乘处理并入到量化和逆量化处理过程中。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB031463010A CN100372382C (zh) | 2003-03-24 | 2003-07-08 | 一种视频图象编码方法 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN03120951 | 2003-03-24 | ||
CN03120951.3 | 2003-03-24 | ||
CNB031463010A CN100372382C (zh) | 2003-03-24 | 2003-07-08 | 一种视频图象编码方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1533184A true CN1533184A (zh) | 2004-09-29 |
CN100372382C CN100372382C (zh) | 2008-02-27 |
Family
ID=34314786
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB031463010A Expired - Lifetime CN100372382C (zh) | 2003-03-24 | 2003-07-08 | 一种视频图象编码方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN100372382C (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006034603A1 (en) * | 2004-09-28 | 2006-04-06 | Huawei Technologies Co., Ltd | Video image encoding method |
CN101562747B (zh) * | 2009-05-19 | 2010-08-25 | 华中科技大学 | 一种视频编码预测残差块的分解及重建方法 |
CN101305610B (zh) * | 2005-10-19 | 2010-09-08 | 飞思卡尔半导体公司 | 对视频编码进行编码模式判定的系统和方法 |
CN101127903B (zh) * | 2007-09-29 | 2010-12-08 | 华南理工大学 | 基于dct的分辨率可伸缩图像编解码方法 |
CN1794816B (zh) * | 2004-12-22 | 2010-12-22 | 日本电气株式会社 | 运动图像压缩编码方法、运动图像压缩编码装置以及程序 |
CN102333217A (zh) * | 2011-04-20 | 2012-01-25 | 深圳市融创天下科技股份有限公司 | 一种视频编码4x4整数变换方法 |
CN102395031A (zh) * | 2011-11-23 | 2012-03-28 | 清华大学 | 一种数据压缩方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE69629442T2 (de) * | 1995-12-06 | 2004-06-09 | Harman Becker Automotive Systems (Xsys Division) Gmbh | Verfahren und Einrichtung zur Kodierung digitaler Videosignale |
US6115070A (en) * | 1997-06-12 | 2000-09-05 | International Business Machines Corporation | System and method for DCT domain inverse motion compensation using shared information |
KR100386639B1 (ko) * | 2000-12-04 | 2003-06-02 | 주식회사 오픈비주얼 | 정규화된 역양자화기를 이용한 영상 및 동영상의 복원 방법 |
-
2003
- 2003-07-08 CN CNB031463010A patent/CN100372382C/zh not_active Expired - Lifetime
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006034603A1 (en) * | 2004-09-28 | 2006-04-06 | Huawei Technologies Co., Ltd | Video image encoding method |
CN100440978C (zh) * | 2004-09-28 | 2008-12-03 | 华为技术有限公司 | 一种视频图像编码方法 |
CN1794816B (zh) * | 2004-12-22 | 2010-12-22 | 日本电气株式会社 | 运动图像压缩编码方法、运动图像压缩编码装置以及程序 |
CN101305610B (zh) * | 2005-10-19 | 2010-09-08 | 飞思卡尔半导体公司 | 对视频编码进行编码模式判定的系统和方法 |
CN101127903B (zh) * | 2007-09-29 | 2010-12-08 | 华南理工大学 | 基于dct的分辨率可伸缩图像编解码方法 |
CN101562747B (zh) * | 2009-05-19 | 2010-08-25 | 华中科技大学 | 一种视频编码预测残差块的分解及重建方法 |
CN102333217A (zh) * | 2011-04-20 | 2012-01-25 | 深圳市融创天下科技股份有限公司 | 一种视频编码4x4整数变换方法 |
WO2012142776A1 (zh) * | 2011-04-20 | 2012-10-26 | 深圳市融创天下科技股份有限公司 | 一种视频编码4x4整数变换方法 |
CN102333217B (zh) * | 2011-04-20 | 2017-04-12 | 深圳市云宙多媒体技术有限公司 | 一种视频编码4x4整数变换方法 |
CN102395031A (zh) * | 2011-11-23 | 2012-03-28 | 清华大学 | 一种数据压缩方法 |
CN102395031B (zh) * | 2011-11-23 | 2013-08-07 | 清华大学 | 一种数据压缩方法 |
Also Published As
Publication number | Publication date |
---|---|
CN100372382C (zh) | 2008-02-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1225126C (zh) | 用于视频编码的新型空间预测方法及其装置 | |
CN1286322C (zh) | 一种低复杂度整数4×4离散余弦变换量化实现方法 | |
CN1575546A (zh) | 变换及后续量化的实现 | |
CN1574970A (zh) | 使用图像残余预测编码/解码图像的方法和设备 | |
CN1455599A (zh) | 图像和视频编码的2-d变换 | |
CN1640141A (zh) | 用于复合文档压缩的编码器匹配层的分离和插值 | |
CN1347620A (zh) | 转换mpeg-2 4:2:2-轮廓位流为主轮廓位流的方法及架构 | |
CN1882083A (zh) | 一种降低图像方块效应的方法 | |
CN1633811A (zh) | 图像编码方法、图像译码方法、图像编码装置、图像译码装置、程序、计算机数据信号,以及图像传送系统 | |
CN101043621A (zh) | 一种自适应插值处理方法及编解码模块 | |
CN1574968A (zh) | 运动图像解码装置及运动图像解码方法 | |
CN1842164A (zh) | 解码视频数据的解码器和系统 | |
CN1282107C (zh) | 一种对图像进行快速压缩和解压缩的方法 | |
CN1738423A (zh) | 视频编码比特率的控制方法 | |
CN1225919C (zh) | 编码图像信息的方法和设备及解码图像信息的方法和设备 | |
CN101043633A (zh) | 一种编码中量化矩阵选择方法、装置及编解码方法及系统 | |
CN1756365A (zh) | 基于多重扫描的帧内模式中编码和解码数据的方法和设备 | |
CN1531348A (zh) | 图像编码设备、方法及程序,和图像解码设备、方法及程序 | |
CN1926880A (zh) | 数据处理装置、方法和编码装置 | |
CN1543221A (zh) | 1/4像素精度插值的方法和装置 | |
CN1921627A (zh) | 视频数据压缩编码方法 | |
CN1216495C (zh) | 视频图像亚像素插值的方法和装置 | |
CN1533184A (zh) | 一种视频图象编码方法 | |
CN1290335C (zh) | 对被编码的视频信号同时进行格式压缩和解码的方法 | |
CN1756361A (zh) | 在基于多重扫描的帧内模式中编码和解码的方法和设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CX01 | Expiry of patent term |
Granted publication date: 20080227 |
|
CX01 | Expiry of patent term |