CN100409693C - 用于图像和视频压缩的正交变换方法 - Google Patents

用于图像和视频压缩的正交变换方法 Download PDF

Info

Publication number
CN100409693C
CN100409693C CNB2006100319510A CN200610031951A CN100409693C CN 100409693 C CN100409693 C CN 100409693C CN B2006100319510 A CNB2006100319510 A CN B2006100319510A CN 200610031951 A CN200610031951 A CN 200610031951A CN 100409693 C CN100409693 C CN 100409693C
Authority
CN
China
Prior art keywords
matrix
image
orthogonal
video compression
transformation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB2006100319510A
Other languages
English (en)
Other versions
CN1878308A (zh
Inventor
王国秋
呼金明
黄坚
陈宝民
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wang Guoqiu
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CNB2006100319510A priority Critical patent/CN100409693C/zh
Publication of CN1878308A publication Critical patent/CN1878308A/zh
Application granted granted Critical
Publication of CN100409693C publication Critical patent/CN100409693C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

一种用于图像和视频压缩的正交变换方法,它是先将图像分成8×8的小块M,然后用8×8正交变换矩阵D对每一个小块M作二维变换,得到变换系数矩阵N,再对N的每一个系数量化后熵编码,完成图像和视频压缩过程。本发明基于8-进正交小波理论,设计了一个新的8×8正交变换矩阵,用这个正交变换压缩图像和视频,不仅能得到比现有技术中离散余弦变换更好的压缩效果,而且在软件和集成电路实现上更加经济和高效。基于本发明,可以产生一条与基于离散余弦变换完全不同的新的压缩编码技术方案,且性能优于被广泛使用的离散余弦变换的性能。

Description

用于图像和视频压缩的正交变换方法
【技术领域】
本发明涉及信息技术领域,具体涉及一种用于数字图像和数字视频压缩编码变换方法。
【背景技术】
随着计算机、微电子、信息处理、通信以及激光等技术的迅猛发展,集图文、声音、图像于一体的多媒体技术更是迅速渗透到计算机、通信、广播电视以及消费娱乐业,在上述各领域中,越来越多地采用通过数字信号传输之数字设备。数字信号有很多优点,但当模拟信号数字化后其频带会大大加宽,如一路6MHz的普通电视信号数字化后,其数码率将高达167Mbps,这对储存器容量和传输带宽要求很大,从而使数字信号失去实用价值。数字压缩技术很好地解决了上述困难,压缩后信号所占用的频带大大低于原模拟信号的频带。因此说,数字压缩编码技术是使数字信号走向实用化的关键技术之一,数字图像和数字视频之所以能传输和保存的一个关键因素在于数字图像和数字视频的这种可压缩性。这种压缩是以降低图像或视频的质量为前提的,以牺牲图像或视频的质量换取宝贵的存储空间或传输带宽。当然,这种压缩不能过度,以致图像或视频的视觉效果变得不可接受,这就要求在一定的质量条件下,不断提高压缩效率。此外,压缩行为应该是规范的,这样将有利于信息的传输与共享。为了规范这种压缩编码行为,目前出台了不少国际标准,如图像压缩标准JPEG(国际标准ISO/ICE IS 10918,大量使用在数码相机和国际互联网),视频压缩标准MPEG-1(国际标准ISO/ICE 11172,在VCD里使用)、MPEG-2(国际标准ISO/ICE 13818,使用在DVD和数字电视里)和MPEG-4(国际标准ISO/ICE 14496,使用在流媒体技术中)等。这些标准除了规范了压缩行为外,压缩效率也在不断提高。如MPEG-2的压缩效率高于MPEG-1,MPEG-4的压缩效率高于MPEG-2。
在这些压缩标准和技术里,有一个通用的方法,那就是使用了正交变换技术。目前,在JPEG、MPEG-1、MPEG-2和MPEG-4里,所用的正交变换方法都是离散余弦变换(Discrete Cosine Transformation,简称DCT)。DCT是经典谱分析常采用的工具,它的问世,对数字图像和视频压缩技术而言具有里程碑式的意义。它是先将整体图像分成N×N像素块,然后对N×N像素块逐一进行离散余弦变换。然后舍弃对视觉不敏感的的频率信息,只保留最为重要的数据信息。这样,压缩过程对图像细腻平滑程度方面必然有所损失。人们也试图研究和寻找其它更好更有效的正交变换来取代DCT,如傅立叶变换,离散正弦变换,哈达姆变换等等。可这些变换在性能上都无法超越DCT,甚至相差还较远。理论上也有一些证据证明DCT“几乎是最优变换”了。所以,三十几年来,全世界一直在研究在图像和视频压缩上是否有更好的变换这个问题,并没有得到一个肯定的答案。
【发明内容】
本发明所要解决的技术问题是提供一种与离散余弦变换不同之用于图像和视频压缩的正交变换方法,在压缩性能和软硬件实现代价上都优于离散余弦变换。
本发明所提出的技术方案是:
一种用于图像和视频压缩的正交变换方法,先将图像分成8×8的小块M,然后用8×8正交变换矩阵D对每一个图像块M作二维变换,得到变换系数矩阵N,再对N的每一个系数量化后熵编码,其特征在于:
所述变换系数矩阵表达式为:N=DMDT,其中DT为D之转置矩阵;
所述8×8正交变换矩阵D为:
D = 1 / 8 1 / 8 1 / 8 1 / 8 1 / 8 1 / 8 1 / 8 1 / 8 - 7 / 168 - 5 / 168 - 3 / 168 - 1 / 168 1 / 168 3 / 168 5 / 168 7 / 168 7 / 168 1 / 168 - 3 / 168 - 5 168 - 5 168 - 3 168 1 / 168 7 / 168 - 7 264 5 / 264 7 / 264 3 / 264 - 3 / 264 - 7 / 264 - 5 / 264 7 / 264 7 / 616 - 13 / 616 - 3 616 9 / 616 9 / 616 - 3 / 616 - 13 / 616 7 / 616 - 7 / 2184 23 / 2184 - 17 / 2184 - 15 / 2184 15 / 2184 17 / 2184 - 23 / 2184 7 / 2184 1 / 264 - 5 / 264 9 / 264 - 5 / 264 - 5 / 264 9 / 264 - 5 / 264 1 / 264 - 1 / 3432 7 / 3432 - 21 / 3432 35 / 3432 - 35 / 3432 21 / 3432 - 7 / 3432 1 / 3432 .
上述矩阵D中,任何一行全体改变符号,为与该矩阵D之等效变换;
上述矩阵D之近似矩阵为:
0.353553 0.353553 0.353553 0.353553 0.353553 0.353553 0.353553 0.353553 - 0.540062 - 0.385758 - 0.231455 - 0.0771517 0.0771517 0.231455 0.385758 0.540062 0.540062 0.0771517 - 0.231455 - 0.385758 - 0.385758 - 0.231455 0.0771517 0.540062 - 0.43082 0.307729 0.43082 0.184637 - 0.184637 - 0.43082 - 0.307729 0.43082 0.282038 - 0.523785 - 0.120873 0.36262 0.36262 - 0.120873 - 0.523785 0.282038 - 0.149786 0.492155 - 0.363766 - 0.32097 0.32097 0.363766 - 0.492155 0.149786 0.0615457 - 0.307729 0.553912 - 0.307729 - 0.307729 0.553912 - 0.307729 0.0615457 - 0.0170697 0.119488 - 0.358464 0.59744 - 0.59744 0.358464 - 0.119488 0.0170697
本发明对用于静止图像压缩编码的量化矩阵为:
QUAN D = 17 17 26 27 34 26 36 39 22 21 25 25 32 36 41 54 19 29 27 33 41 38 50 50 34 26 33 34 36 62 52 46 27 32 37 41 51 71 61 64 29 27 45 62 57 62 92 75 31 45 50 60 80 90 90 75 55 86 70 80 90 85 80 80
本发明对经过熵解码和反量化后的数据块
Figure C20061003195100073
亦可用上述矩阵D正交变换,其二维反变换恢复图像数据块为:
M ~ = D T N ~ D .
作为本发明之进一步方案,用于软件和集成电路实现的变换整数实现表达式为:设 d 1 = 8 , d 2 = 168 , d 3 = 168 , d 4 = 264 , d 5 = 616 , d 6 = 2184 , d 7 = 264 , d 8 = 3432 , 定义一个对角矩阵(E)和整数矩阵(P)为:
E = 1 / d 1 1 / d 2 O 1 / d 3 1 / d 4 1 / d 5 O 1 / d 6 1 / d 7 1 / d 8 , P = 1 1 1 1 1 1 1 1 - 7 - 5 - 3 - 1 1 3 5 7 7 1 - 3 - 5 - 5 - 3 1 7 - 7 5 7 3 - 3 - 7 - 5 7 7 - 13 - 3 9 9 - 3 - 13 7 - 7 23 - 17 - 15 15 17 - 23 7 1 - 5 9 - 5 - 5 9 - 5 1 - 1 7 - 21 35 - 35 21 - 7 1 .
将矩阵(D)分解为:D=EP,
则变换系数矩阵表达式N=DMDT
N=DMDT=E(PMPT)E,
其中的PMPT为仅含加法和移位的整数运算,非常方便。
同时,所述表达式N=E(PMPT)E具有反变换。
本发明基于8-进正交小波理论,设计了一个新的8×8正交变换矩阵,用这个正交变换压缩图像和视频,不仅能得到比DCT更好的压缩效果,而且在软件和集成电路实现上更加经济和高效。基于本发明,可以产生一条与基于离散余弦变换完全不同的新的压缩编码技术方案,且性能优于被广泛使用的离散余弦变换的性能。
【附图说明】
图1为JPEG压缩编码流程;
图2为本发明正交矩阵变换与JPEG2000正交矩阵变换压缩图像平均峰值信噪比图。
【具体实施方式】
在图像和视频压缩中,图像压缩是最核心的基础,正交变换方法是图像和视频压缩技术中的最核心的技术。在图像压缩标准JPEG(国际标准ISO/ICE IS 10918)和视频压缩标准MPEG-1(国际标准ISO/ICE 11172)、MPEG-2(国际标准ISO/ICE 13818)以及MPEG-4(国际标准ISO/ICE 14496)里,目前,所采用的正交变换方法是8×8的离散余弦变换(DCT,即Discrete Cosine Transform)。
本发明设计了一个8×8的正交变换,完全不同于8×8的离散余弦变换DCT,具有优于DCT之压缩性能。
下面详述本发明。
(1)本发明之正交变换矩阵用D表示,即
D = 1 / 8 1 / 8 1 / 8 1 / 8 1 / 8 1 / 8 1 / 8 1 / 8 - 7 / 168 - 5 / 168 - 3 / 168 - 1 / 168 1 / 168 3 / 168 5 / 168 7 / 168 7 / 168 1 / 168 - 3 / 168 - 5 168 - 5 168 - 3 168 1 / 168 7 / 168 - 7 264 5 / 264 7 / 264 3 / 264 - 3 / 264 - 7 / 264 - 5 / 264 7 / 264 7 / 616 - 13 / 616 - 3 616 9 / 616 9 / 616 - 3 / 616 - 13 / 616 7 / 616 - 7 / 2184 23 / 2184 - 17 / 2184 - 15 / 2184 15 / 2184 17 / 2184 - 23 / 2184 7 / 2184 1 / 264 - 5 / 264 9 / 264 - 5 / 264 - 5 / 264 9 / 264 - 5 / 264 1 / 264 - 1 / 3432 7 / 3432 - 21 / 3432 35 / 3432 - 35 / 3432 21 / 3432 - 7 / 3432 1 / 3432
从数学理论中可以知道,对于一个离散序列[bk],k=1,...,8,如果 Σ k = 0 7 k n b k + 1 = 0 对n=0,1,...,r-1成立,我们就说[bk]具有r阶消失矩。该定义和小波理论的连续消失矩概念是等价的。
假设8-进小波的一支低通滤波器为[hi](i为整数),七支高通滤波器为[gi,j](i为整数,j=1,...,7)。我们考虑一个特殊的8-进正交小波系统,它的低通和所有高通滤波器的长度都为8,即i=1,...,8。同时,对每个j(j=1,...,7),[gi,j]有j阶消失矩。
现在,用[hi]作为矩阵D的第1行,用[gi,j]作为矩阵D的第j+1行(j=1,...,7),因此,根据8-进小波理论,所得到的矩阵D就是正交的。
关于D的正交性,我们只需验证DDT=I即可,这里DT是D的转置矩阵,I是一个单位矩阵。这个矩阵的特征可以概括为:一个8×8的正交矩阵,它的第i行具有i-1阶消失矩(i=1,...,8)。这样的矩阵在每一行的系数可以整体取反的意义下是唯一的。
因此,上述矩阵中任何一行全体改变符号,被视为等效变换。如第二行改变符号后的形式为:
1 / 8 1 / 8 1 / 8 1 / 8 1 / 8 1 / 8 1 / 8 1 / 8 7 / 168 5 / 168 3 / 168 1 / 168 - 1 / 168 - 3 / 168 - 5 / 168 - 7 / 168 7 / 168 1 / 168 - 3 / 168 - 5 168 - 5 168 - 3 168 1 / 168 7 / 168 - 7 264 5 / 264 7 / 264 3 / 264 - 3 / 264 - 7 / 264 - 5 / 264 7 / 264 7 / 616 - 13 / 616 - 3 616 9 / 616 9 / 616 - 3 / 616 - 13 / 616 7 / 616 - 7 / 2184 23 / 2184 - 17 / 2184 - 15 / 2184 15 / 2184 17 / 2184 - 23 / 2184 7 / 2184 1 / 264 - 5 / 264 9 / 264 - 5 / 264 - 5 / 264 9 / 264 - 5 / 264 1 / 264 - 1 / 3432 7 / 3432 - 21 / 3432 35 / 3432 - 35 / 3432 21 / 3432 - 7 / 3432 1 / 3432 .
同样地,其他任意一行全体改变符号,也是与D等效的。
在软件或集成电路实现中,都是使用上述变换的一个近似。如下面的矩阵就是D的一个近似:
0.353553 0.353553 0.353553 0.353553 0.353553 0.353553 0.353553 0.353553 - 0.540062 - 0.385758 - 0.231455 - 0.0771517 0.0771517 0.231455 0.385758 0.540062 0.540062 0.0771517 - 0.231455 - 0.385758 - 0.385758 - 0.231455 0.0771517 0.540062 - 0.43082 0.307729 0.43082 0.184637 - 0.184637 - 0.43082 - 0.307729 0.43082 0.282038 - 0.523785 - 0.120873 0.36262 0.36262 - 0.120873 - 0.523785 0.282038 - 0.149786 0.492155 - 0.363766 - 0.32097 0.32097 0.363766 - 0.492155 0.149786 0.0615457 - 0.307729 0.553912 - 0.307729 - 0.307729 0.553912 - 0.307729 0.0615457 - 0.0170697 0.119488 - 0.358464 0.59744 - 0.59744 0.358464 - 0.119488 0.0170697 .
如果某个矩阵的元素小数点后的5位有效数字与D的元素小数点后的5位有效数字完全相同,这样的变换与D是等效的。对于改变D的某行的符号得到的等效变换的此类情形也一样。
(2)对被压缩的图像数据块M(8×8矩阵),用(1)中的正交变换对这个数据块作二维变换,变换结果用N(8×8矩阵)表示,即
N=DMDT
以便完成后续的压缩编码过程。这里,“DT”表示D的转置矩阵。
(3)在(2)的基础上,具体实现N=DMDT有许多等效的矩阵运算方法,即相同的输入M导致相同的输出N的实现方法,这样的等效方法视为同一方法。同时,该变换每一行的元素具有对称性或反对称性。这个性质有利于快速实现变换或反变换运算,在增加少量存储器的前提下,计算量减半。
为了说明这个问题,我们用[di,j](i=1,...,8,j=1,...,8)来表示(1)中的矩阵D,用m=[mi](i=1,...,8)来表示一个列向量,用n=[ni](i=1,...,8)来表示变换结果。我们考虑一个一维变换n=Dm,它的具体表示为
n i = Σ j = 1 8 d i , j m j ( i = 1 , . . . , 8 ) .
这就是变换的直接计算法。但是,如果我们考虑矩阵D的一些特点,如它的奇数行是对称的,即di,j=di+4,j(i=1,3,5,7,j=1,...,8),偶数行是反对称的即di,j=-di+4,j(i=2,4,6,8,j=1,...,8),这个变换有另外的等价表示:
n i = Σ j = 1 4 d i , j ( m j + m j + 4 ) , ( i = 1,3,5,7 )
n i = Σ j = 1 4 d i , j ( m j - m j + 4 ) , ( i = 2 , 4 , 6 , 8 ) .
这种实现方法和直接计算方法是不同的,但它们是等效的。对于直接计算方法,用软件和集成电路实现时,计算量要大些,存储器需要少些;而对于等效计算方法,计算量要小些,存储器需要多些。
由大学线性代数知识可知,对于二维变换,在实际应用中可以转化为16个一维变换来实现。
还有许多其它的等效变换。
(4)在(2)和(3)的基础上,本发明提出了一种特定的变换整数实现方法。设 d 1 = 8 , d 2 = 168 , d 3 = 168 , d 4 = 264 , d 5 = 616 , d 6 = 2184 , d 7 = 264 , d 8 = 3432 . 定义一个对角矩阵E和整数矩阵P如下:
E = 1 / d 1 1 / d 2 O 1 / d 3 1 / d 4 1 / d 5 O 1 / d 6 1 / d 7 1 / d 8 , P = 1 1 1 1 1 1 1 1 - 7 - 5 - 3 - 1 1 3 5 7 7 1 - 3 - 5 - 5 - 3 1 7 - 7 5 7 3 - 3 - 7 - 5 7 7 - 13 - 3 9 9 - 3 - 13 7 - 7 23 - 17 - 15 15 17 - 23 7 1 - 5 9 - 5 - 5 9 - 5 1 - 1 7 - 21 35 - 35 21 - 7 1 .
则(1)中的矩阵可以分解为:D=EP,从而(2)中的变换N=DMDT可以写成
N=DMDT=E(PMPT)E。
注意,P的元素都是小整数,M的元素也是整数,在集成电路设计中,这样的整数运算都可以化为移位运算。如35=32+2+1=25+2+1,21=16+4+1=24+22+1,等等。从而(PMPT)可以全是移位运算和加法运算,避免了浮点运算和乘法运算,有利于计算方法的集成电路的高效实现。而矩阵E的左乘和右乘可以和量化步骤合并。
(5)经过熵解码后,对已经压缩了的数据块
Figure C20061003195100129
用(1)中的正交变换,作如下的二维反变换恢复图像数据块:
M ~ = D T N ~ D .
这里,“DT”表示D的转置矩阵。
(6)在(5)的基础上,具体实现 M ~ = D T N ~ D 有许多等效的矩阵运算方法,即相同的输入
Figure C200610031951001212
导致相同的输出的实现方法。这样的等效方法视为同一方法。有关这个问题的理解与(3)类似,但不完全相同。我们同样只需要考虑一维反变换。记号为: n ~ = [ n ~ i ] ( i = 1 , . . . , 8 ) 为输入列向量, m ~ = [ m ~ i ] ( i = 1 , . . . , 8 ) 表示输出列向量。一个一维的反变换为 m ~ = D T n ~ , 它的直接计算法是:
m ~ i = Σ j = 1 8 d j , i n ~ j , ( i = 1 , . . . , 8 ) .
同样根据D的对称性,我们可以有如下的等效计算方法。计算过程分两步。首先,计算如下的两组数:
m ~ i ( 1 ) = Σ j = 1,3,5,7 d j , i n ~ j , ( i = 1,2,3,4 ) m ~ i ( 2 ) = Σ j = 2 , 4 , 6 , 8 d j , i n ~ j , ( i = 1,2,3,4 ) .
然后,计算
m ~ i = m ~ i ( 1 ) + m ~ i ( 2 ) m ~ 9 - i = m ~ i ( 1 ) - m ~ i ( 2 ) , ( i = 1,2,3,4 ) .
这个等效反变换节省了计算量,但增加了存储器数量。
由大学线性代数知识可知,二维反变换可以转化为16个一维反变换来实现。
还有许多其它等效的反变换。
(7)在(5)和(6)的基础上,本发明还可实现反变换整数运算,这里依旧使用(4)里的记号。同样, M ~ = D T N ~ D = P T ( E N ~ E ) P 完全是整数运算。
我们可以对比一下JPEG的DCT与本发明里矩阵的性质差异。下面是著名的8×8离散余弦变换(精确到小数点后5位有效数字):
DCT 8 = 0.353553 0.353553 0.353553 0.353553 0.353553 0.353553 0.353553 0.353553 0.490393 0.415735 0.277785 0.0975452 - 0.0975452 - 0.277785 - 0.415735 - 0.490393 0.46194 0.191342 - 0.191342 - 0.46194 - 0.46494 - 0.191342 0.191342 0.46194 0.415735 - 0.0975452 - 0.490393 - 0.277785 0.277785 0.490393 0.0975452 - 0.415735 0.353553 - 0.353553 - 0.353553 0.353553 0.353553 - 0.353553 - 0.353553 0.353553 0.277785 - 0.490393 0.0975452 0.415735 - 0.415735 - 0.0975452 0.490393 - 0.277785 0.191342 - 0.46194 0.46194 - 0.191342 - 0.191342 0.46194 - 0.46194 0.191342 0.0975452 - 0.277785 0.415735 - 0.490393 0.490393 - 0.415735 0.277785 - 0.0975452 .
而本发明D的近似为:
0353553 0353553 0353553 0353553 0353553 0353553 0353553 0353553 - 0540062 - 0385758 - 0231455 - 00771517 00771517 0231455 0385758 0540062 0540062 00771517 - 0231455 - 0385758 - 0385758 - 0231455 00771517 0540062 - 043082 0307729 043082 0.184637 - 0184637 - 043082 - 0307729 043082 0282038 - 0523785 - 0.120873 036262 036262 - 0120873 - 0523785 0282038 - 0149786 0492155 - 0363766 - 032097 032097 0363766 - 0492155 0149786 00615457 - 0307729 0553912 - 0307729 - 0307729 0553912 - 0307729 00615457 - 00170697 0119488 - 0358464 059744 - 059744 0358464 - 0119488 00170697 .
简单比较可知,除了第1行与本发明的第1行相同外,其余的行与本发明的完全不同。所以,这两个矩阵是完全不同的矩阵。从数学特征看,可以验证,离散余弦变换的第2行到第7行的消失矩的阶数不超过2。这一性质反映了两个变换矩阵的数学性质的巨大差异。
根据8-进小波理论,DCT8也构成一个特殊的8-进小波结构。只是本发明构造的变换达到了最高阶数的消失矩,而DCT8的消失矩就不够高。在消失矩意义下,本发明构造的变换矩阵是最优的。这在理论上解释了为什么试验中我们的变换性能要超过DCT8的。
在JPEG、MPEG-1、MPEG-2和MPEG-4里,实施离散余弦变换都是最重要、最基本的一环。所以,凡所用到离散余弦变换的地方都可以使用本发明中的变换。利用这个变换,本发明完成了图像或视频的压缩或解压缩中最主要的一个环节,从而可以产生一条与基于离散余弦变换完全不同的新的技术路线,并且本发明压缩编码方法优于传统的基于离散余弦变换的技术。当然,在下面我们也将看到,由于变换技术不同,导致压缩编码解码过程中相关的后续技术也产生了相应的变化,以利于提高编码效率。这也是本发明突出的实质性特点。事实上,不同的变换技术导致不同的量化技术和不同的编码技术,变换技术在压缩编码技术里始终是处于树根的地位。
本发明用图像压缩编码作为具体实施例,来检验本发明的编码效果。为了便于对比,本发明利用JPEG框架来实施。
在JPEG里,图像的压缩流程分为四个大的步骤,如图1所示,包括离散余弦变换(DCT),量化变换系数,Z字扫描和熵编码。其具体步骤为:
先将图像分成8×8的小块X,然后用上述8×8离散余弦变换(DCT8)对每一个图像块X作二维变换,即
Y=(DCT8)X(DCT8 T),
其中(DCT8 T)为(DCT8)的转置矩阵。
由上式得到变换系数矩阵Y,再对Y的每一个系数除以一个数值(这个过程称为量化),这些被除数构成的矩阵称为量化矩阵,如JPEG里对应DCT8的默认量化矩阵为:
QUAN DCT = 16 11 10 16 24 40 51 61 12 12 14 19 26 58 60 55 14 13 16 24 40 57 69 56 14 17 22 29 51 87 80 62 18 22 37 56 68 109 103 77 24 35 55 64 81 104 113 92 49 64 78 87 103 121 120 101 72 92 95 98 112 100 103 99 .
量化后,对量化后的系数从左上角到右下角作所谓的Z字扫描,然后,用游长编码和Huffman编码(通常有一组固定的Huffman码表)完成对量化后的系数的压缩编码输出。关于这些内容,在JPEG的标准文件里均能找到。
为了检验和对比变换D的性能,我们依旧维持上述的JPEG压缩编码流程,只不过我们将DCT8换成了D,也就是在Y=(DCT8)X(DCT8 T)中将DCT8换成D,变换公司相应地成了Y=DXDT。由于DCT8和D的性质完全不同,替换掉DCT8后,随之改变的应该是量化矩阵和Huffman码表。但在JPEG标准中,量化矩阵是包含在图像压缩文件中的。因此,量化矩阵的变化是许可的。
对应本发明的变换矩阵的量化矩阵为:
QUAN D = 17 17 26 27 34 26 36 39 22 21 25 25 32 36 41 54 19 29 27 33 41 38 50 50 34 26 33 34 36 62 52 46 27 32 37 41 51 71 61 64 29 27 45 62 57 62 92 75 31 45 50 60 80 90 90 75 55 86 70 80 90 85 80 80 .
比较这两个量化矩阵,可以看出它们是有很大差异的。
由于本发明中的变换有非常好的性质,在具体实现中效率非常高,这一点是DCT所不及的。
测试结果:
为使研究具有可比性和客观性,我们在实验中采用JPEG标准基本系统的框架,进行本发明中的D与DCT8的实验对比。使用DCT8变换的压缩软件是JPEG组织提供的JPEG基本系统编/解码测试软件(可以在WWW.JPEG.ORG下载),而使用D变换的压缩软件只是在JPEG基本系统编/解码测试软件中做了两项修改:第一,空间域到频率域的变换方法用D替换了DCT8;第二,用QUAND取代了QUANDCT
可以用国际上通用的“标准测试图”来检验压缩效果好坏。其方法是,在不同的压缩率下对多幅图像作压缩处理,然后解压缩,得到恢复的图像。恢复的图像与原始图像是有差异的,我们可以计算原始图像与解压缩图像的峰值信噪比(PSNR,单位为dB),PSNR越高,解压图像与原始图像的之间的失真度越小。
分别计算出13个幅面大小均为512×512灰度标准测试图像,在压缩比5倍、10倍以及20倍情况下的峰值信噪比。实验结果见表1。
表1:DCT8与D压缩图像对比结果
上述列表中,第一列为不同的图像名,表内地数据为PSNR(dB),“D”的下方对应的是采用本发明的变换的结果,“DCT8”的下方对应的是采用DCT8的结果,最后一行是13幅图像的平均PSNR。
有关D和DCT8压缩图像的平均峰值信噪比见图2。图中由圆点连接的线段为D压缩图像的平均峰值信噪比,叉连接的线段为DCT8压缩图像的平均峰值信噪比。
从实验结果看,在压缩比小于或等于20倍时,D的峰值信噪比明显优于DCT8。在压缩比为5倍时,对13幅图像,D的结果比DCT8平均高出0.45个dB,这个结果是有显著意义的。事实上,对于数码相机,一般没有压缩到这个倍率(灰度图像压缩5倍时,彩色图像可压缩10倍左右)。在压缩比为10倍时,对13幅图像,D的结果比DCT8平均高出0.16个dB。压缩比等于20倍时,D的结果与DCT8的相当(DCT8平均比D的只高了0.07个dB)。在MPEG-2或MPEG-4中,I帧采用高保真压缩,并用I帧的解码图像去预测B和P帧。显然,D对I帧的压缩效率比DCT8更高,并且,I帧的解码图像质量越好,对B和P帧的压缩越有利。

Claims (7)

1. 一种用于图像和视频压缩的正交变换方法,先将图像分成8×8的小块M,然后用8×8正交变换矩阵D对每一个小块M作二维变换,得到变换系数矩阵N,再对N的每一个系数量化后熵编码,其特征在于:
所述变换系数矩阵表达式为:N=DMDT,其中8×8正交变换转置矩阵DT为上述8×8正交变换矩阵D之转置矩阵,
所述8×8正交变换矩阵D为:
D = 1 / 8 1 / 8 1 / 8 1 / 8 1 / 8 1 / 8 1 / 8 1 / 8 - 7 / 16 8 - 5 / 16 8 - 3 / 16 8 - 1 / 16 8 1 / 16 8 3 / 16 8 5 / 16 8 7 / 16 8 7 / 16 8 1 / 16 8 - 3 / 16 8 - 5 / 16 8 - 5 / 16 8 - 3 / 16 8 1 / 16 8 7 / 16 8 - 7 / 26 4 5 / 26 4 7 / 26 4 3 / 26 4 - 3 / 26 4 - 7 / 26 4 - 5 / 26 4 7 / 26 4 7 / 61 6 - 13 / 61 6 - 3 / 61 6 9 / 61 6 9 / 61 6 - 3 / 61 6 - 13 / 61 6 7 / 61 6 - 7 / 218 4 23 / 218 4 - 17 / 218 4 - 15 / 218 4 15 / 218 4 17 / 218 4 - 23 / 218 4 7 / 218 4 1 / 26 4 - 5 / 26 4 9 / 26 4 - 5 / 26 4 - 5 / 26 4 9 / 26 4 - 5 / 26 4 1 / 26 4 - 1 / 343 2 7 / 343 2 - 21 / 343 2 35 / 343 2 - 35 / 343 2 21 / 343 2 - 7 / 343 2 1 / 343 2 .
2. 根据权利要求1所述的用于图像和视频压缩的正交变换方法,其特征在于:所述8×8正交变换矩阵D中任何一行全体改变符号,为与上述8×8正交变换矩阵D之等效变换.
3. 根据权利要求1所述的用于图像和视频压缩的正交变换方法,其特征在于:所述8×8正交变换矩阵D之近似矩阵为:
0.353553 0.353553 0.353553 0.353553 0.353553 0.353553 0.353553 0.353553 - 0.540062 - 0.385758 - 0.231455 - 0.0771517 0.0771517 0.231455 0.385758 0.540062 0.540062 0.0771517 - 0.231455 - 0.385758 - 0.385758 - 0.231455 0.0771517 0.540062 - 0.43082 0.307729 0.43082 0.184637 - 0.184637 - 0.43082 - 0.307729 0.43082 0.282038 - 0.523785 - 0.120873 0.36262 0.36262 - 0.120873 - 0.523785 0.282038 - 0.149786 0.492155 - 0.363766 - 0.32097 0.32097 0.363766 - 0.492155 0.149786 0.0615457 - 0.307729 0.553912 - 0.307729 - 0.307729 0.553912 - 0.307729 0.0615457 - 0.0170697 0.119488 - 0.358464 0.59744 - 0.59744 0.358464 - 0.119488 0.0170697 .
4. 根据权利要求1或2或3所述的用于图像和视频压缩的正交变换方法,其特征在于:用于静止图像压缩编码的量化矩阵为:
QUAN D = 17 17 26 27 34 26 36 39 22 21 25 25 32 36 41 54 19 29 27 33 41 38 50 50 34 26 33 34 36 62 52 46 27 32 37 41 51 71 61 64 29 27 45 62 57 62 92 75 31 45 50 60 80 90 90 75 55 86 70 80 90 85 80 80 .
5. 根据权利要求1或2或3所述的用于图像和视频压缩的正交变换方法,其特征在于:对经过熵解码和反量化后的数据块
Figure C2006100319510003C2
用所述8×8正交变换矩阵D正交变换,其二维反变换恢复图像数据块为:
M ~ = D T N ~ D .
6. 根据权利要求1或2或3所述的用于图像和视频压缩的正交变换方法,其特征在于:用于软件和集成电路实现的变换整数实现表达式为:
d 1 = 8 , d 2 = 168 , d 3 = 168 , d 4 = 264 , d 5 = 616 , d 6 = 2184 , d 7 = 264 , d 8 = 3432 ,
定义一个对角矩阵E和整数矩阵P为:
E = 1 / d 1 1 / d 2 O 1 / d 3 1 / d 4 1 / d 5 O 1 / d 6 1 / d 7 1 / d 8 , P = 1 1 1 1 1 1 1 1 - 7 - 5 - 3 - 1 1 3 5 7 7 1 - 3 - 5 - 5 - 3 1 7 - 7 5 7 3 - 3 - 7 - 5 7 7 - 13 - 3 9 9 - 3 - 13 7 - 7 23 - 17 - 15 15 17 - 23 7 1 - 5 9 - 5 - 5 9 - 5 1 - 1 7 - 21 35 - 35 21 - 7 1
将所述8×8正交变换矩阵D分解为:D=EP,
则变换系数矩阵表达式N=DMDT
N=DMDT=E(PMPT)E,
其中的PMPT为仅含加法和移位的整数运算.
7. 根据权利要求6所述的用于图像和视频压缩的正交变换方法,其特征在于:所述表达式N=E(PMPT)E具有反变换.
CNB2006100319510A 2006-07-13 2006-07-13 用于图像和视频压缩的正交变换方法 Expired - Fee Related CN100409693C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB2006100319510A CN100409693C (zh) 2006-07-13 2006-07-13 用于图像和视频压缩的正交变换方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB2006100319510A CN100409693C (zh) 2006-07-13 2006-07-13 用于图像和视频压缩的正交变换方法

Publications (2)

Publication Number Publication Date
CN1878308A CN1878308A (zh) 2006-12-13
CN100409693C true CN100409693C (zh) 2008-08-06

Family

ID=37510573

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2006100319510A Expired - Fee Related CN100409693C (zh) 2006-07-13 2006-07-13 用于图像和视频压缩的正交变换方法

Country Status (1)

Country Link
CN (1) CN100409693C (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101742054B (zh) * 2008-11-14 2013-02-13 北京中星微电子有限公司 编码方法及装置、解码方法及装置
CN101754021B (zh) * 2009-12-18 2011-09-28 江苏省烟草公司常州市公司 基于改进小波变换图像压缩方法实现手机移动门户的方法
CN101984664B (zh) * 2010-09-09 2013-03-20 王国秋 用于图像和视频压缩编码和解码中的多进小波变换方法及应用
JP6120490B2 (ja) * 2011-11-07 2017-04-26 キヤノン株式会社 画像符号化装置、画像符号化方法及びプログラム、画像復号装置、画像復号方法及びプログラム
CN103988508B (zh) * 2011-12-19 2018-10-12 索尼公司 图像处理设备和方法
CN107196660A (zh) * 2017-04-24 2017-09-22 南京数维康信息科技有限公司 低功耗数据压缩算法
CN111556313B (zh) * 2020-04-26 2021-05-04 武汉理工大学 基于整数近似的低复杂度dtt与自适应量化的图像压缩方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030053702A1 (en) * 2001-02-21 2003-03-20 Xiaoping Hu Method of compressing digital images
CN1450803A (zh) * 2003-03-28 2003-10-22 清华大学 基于“空间组合推举体制”的小波变换ip核及其变换方法
WO2005008595A1 (en) * 2003-07-21 2005-01-27 Tubitak-Bilten (Turkiye Bilimsel Ve Teknik Arastirma Kurumu-Bilgi Teknolojileri Ve Elektronik Arastirma Enstitusu) Implementation of the jpeg2000 compression algorithm in hardware
CN1585482A (zh) * 2004-05-27 2005-02-23 复旦大学 一种三维小波等级树集合划分算法的视频压缩编码方法
CN1595453A (zh) * 2004-06-18 2005-03-16 湖南中芯数字技术有限公司 基于小波变换的图像压缩方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030053702A1 (en) * 2001-02-21 2003-03-20 Xiaoping Hu Method of compressing digital images
CN1450803A (zh) * 2003-03-28 2003-10-22 清华大学 基于“空间组合推举体制”的小波变换ip核及其变换方法
WO2005008595A1 (en) * 2003-07-21 2005-01-27 Tubitak-Bilten (Turkiye Bilimsel Ve Teknik Arastirma Kurumu-Bilgi Teknolojileri Ve Elektronik Arastirma Enstitusu) Implementation of the jpeg2000 compression algorithm in hardware
CN1585482A (zh) * 2004-05-27 2005-02-23 复旦大学 一种三维小波等级树集合划分算法的视频压缩编码方法
CN1595453A (zh) * 2004-06-18 2005-03-16 湖南中芯数字技术有限公司 基于小波变换的图像压缩方法

Also Published As

Publication number Publication date
CN1878308A (zh) 2006-12-13

Similar Documents

Publication Publication Date Title
Talukder et al. Haar wavelet based approach for image compression and quality assessment of compressed image
Askelöf et al. Region of interest coding in JPEG 2000
Wallace The JPEG still picture compression standard
CA2676099C (en) Method of compressing digital images
US6904175B2 (en) Image compression using an interger reversible wavelet transform with a property of precision preservation
CN100409693C (zh) 用于图像和视频压缩的正交变换方法
CN100576195C (zh) 以无损方式对数字图像和音频数据解码的系统和方法
Nageswara et al. Image compression using discrete cosine transform
Reddy et al. A lossless image compression using traditional and lifting based wavelets
Wei An introduction to image compression
Brahimi et al. A novel and efficient 8-point DCT approximation for image compression
Boujelbene et al. A comparative study of recent improvements in wavelet-based image coding schemes
Kountchev et al. Inverse pyramidal decomposition with multiple DCT
CN105163130B (zh) 一种基于离散Tchebichef正交多项式的图像无损压缩方法
Deshlahra et al. A comparative study of DCT, DWT & hybrid (DCT-DWT) transform
Pan et al. Context-based embedded image compression using binary wavelet transform
Deshlahra Analysis of Image Compression Methods Based On Transform and Fractal Coding
CN100426866C (zh) 全相位沃尔什双正交变换及其对jpeg的改进方法
CN1822050A (zh) 全相位反余弦双正交变换及其对jpeg的改进方法
CN100596201C (zh) 用于图像和视频压缩的正交整数变换方法
JP3198996B2 (ja) 直交変換符号化画像の画像サイズ変換方法
CN101448156B (zh) 图像分析的方波正交函数体系选取及其软硬件实现方法
CN105472395A (zh) 一种基于离散Krawtchouk正交多项式的图像无损压缩方法
CN100477789C (zh) 一种基于运动联合图像专家组2000的图像帧间增强方法
Hachemi et al. Enhancement of DCT-Based Image Compression Using Trigonometric Functions

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Free format text: FORMER OWNER: HU JINMING HUANG JIAN CHEN BAOMIN

Owner name: HU NAN HUAGUAN DIGITAL TECHNOLOGY CO., LTD.

Free format text: FORMER OWNER: WANG GUOQIU

Effective date: 20101223

C41 Transfer of patent application or patent right or utility model
COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; FROM: 410073 NO.13-403, WUTONGYUAN, KEDA JIAYUAN, KAIFU DISTRICT, CHANGSHA CITY, HU NAN PROVINCE TO: 410006 CHANGSHA CEC SOFTWARE PARK, NO.39, JIANSHAN ROAD, YUELU DISTRICT, CHANGSHA CITY, HU NAN PROVINCE

TR01 Transfer of patent right

Effective date of registration: 20101223

Address after: 410006 Changsha Electric Power Software Park, No. 39, pointed mountain road, Changsha, Hunan, Yuelu District

Patentee after: Hunan Huaguan Digital Technology Co., Ltd.

Address before: 410073 Hunan province Changsha Kaifu District, garden Indus court No. 13-403

Co-patentee before: Hu Jinming

Patentee before: Wang Guoqiu

Co-patentee before: Huang Jian

Co-patentee before: Chen Baomin

ASS Succession or assignment of patent right

Owner name: WANG GUOQIU

Free format text: FORMER OWNER: HU NAN HUAGUAN DIGITAL TECHNOLOGY CO., LTD.

Effective date: 20130104

C41 Transfer of patent application or patent right or utility model
COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; FROM: 410006 CHANGSHA, HUNAN PROVINCE TO: 410073 CHANGSHA, HUNAN PROVINCE

TR01 Transfer of patent right

Effective date of registration: 20130104

Address after: 410073 Hunan province Changsha Kaifu District, garden Indus court 13-403

Patentee after: Wang Guoqiu

Address before: 410006 Changsha Electric Power Software Park, No. 39, pointed mountain road, Changsha, Hunan, Yuelu District

Patentee before: Hunan Huaguan Digital Technology Co., Ltd.

CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20080806

Termination date: 20140713

EXPY Termination of patent right or utility model