CN100409693C

CN100409693C - 用于图像和视频压缩的正交变换方法

Info

Publication number: CN100409693C
Application number: CNB2006100319510A
Authority: CN
Inventors: 王国秋; 呼金明; 黄坚; 陈宝民
Original assignee: Individual
Current assignee: Wang Guoqiu
Priority date: 2006-07-13
Filing date: 2006-07-13
Publication date: 2008-08-06
Anticipated expiration: 2026-07-13
Also published as: CN1878308A

Abstract

一种用于图像和视频压缩的正交变换方法，它是先将图像分成8×8的小块M，然后用8×8正交变换矩阵D对每一个小块M作二维变换，得到变换系数矩阵N，再对N的每一个系数量化后熵编码，完成图像和视频压缩过程。本发明基于8-进正交小波理论，设计了一个新的8×8正交变换矩阵，用这个正交变换压缩图像和视频，不仅能得到比现有技术中离散余弦变换更好的压缩效果，而且在软件和集成电路实现上更加经济和高效。基于本发明，可以产生一条与基于离散余弦变换完全不同的新的压缩编码技术方案，且性能优于被广泛使用的离散余弦变换的性能。

Description

用于图像和视频压缩的正交变换方法

【技术领域】

本发明涉及信息技术领域，具体涉及一种用于数字图像和数字视频压缩编码变换方法。

【背景技术】

随着计算机、微电子、信息处理、通信以及激光等技术的迅猛发展，集图文、声音、图像于一体的多媒体技术更是迅速渗透到计算机、通信、广播电视以及消费娱乐业，在上述各领域中，越来越多地采用通过数字信号传输之数字设备。数字信号有很多优点，但当模拟信号数字化后其频带会大大加宽，如一路6MHz的普通电视信号数字化后，其数码率将高达167Mbps，这对储存器容量和传输带宽要求很大，从而使数字信号失去实用价值。数字压缩技术很好地解决了上述困难，压缩后信号所占用的频带大大低于原模拟信号的频带。因此说，数字压缩编码技术是使数字信号走向实用化的关键技术之一，数字图像和数字视频之所以能传输和保存的一个关键因素在于数字图像和数字视频的这种可压缩性。这种压缩是以降低图像或视频的质量为前提的，以牺牲图像或视频的质量换取宝贵的存储空间或传输带宽。当然，这种压缩不能过度，以致图像或视频的视觉效果变得不可接受，这就要求在一定的质量条件下，不断提高压缩效率。此外，压缩行为应该是规范的，这样将有利于信息的传输与共享。为了规范这种压缩编码行为，目前出台了不少国际标准，如图像压缩标准JPEG(国际标准ISO/ICE IS 10918，大量使用在数码相机和国际互联网)，视频压缩标准MPEG-1(国际标准ISO/ICE 11172，在VCD里使用)、MPEG-2(国际标准ISO/ICE 13818，使用在DVD和数字电视里)和MPEG-4(国际标准ISO/ICE 14496，使用在流媒体技术中)等。这些标准除了规范了压缩行为外，压缩效率也在不断提高。如MPEG-2的压缩效率高于MPEG-1，MPEG-4的压缩效率高于MPEG-2。

在这些压缩标准和技术里，有一个通用的方法，那就是使用了正交变换技术。目前，在JPEG、MPEG-1、MPEG-2和MPEG-4里，所用的正交变换方法都是离散余弦变换(Discrete Cosine Transformation，简称DCT)。DCT是经典谱分析常采用的工具，它的问世，对数字图像和视频压缩技术而言具有里程碑式的意义。它是先将整体图像分成N×N像素块，然后对N×N像素块逐一进行离散余弦变换。然后舍弃对视觉不敏感的的频率信息，只保留最为重要的数据信息。这样，压缩过程对图像细腻平滑程度方面必然有所损失。人们也试图研究和寻找其它更好更有效的正交变换来取代DCT，如傅立叶变换，离散正弦变换，哈达姆变换等等。可这些变换在性能上都无法超越DCT，甚至相差还较远。理论上也有一些证据证明DCT“几乎是最优变换”了。所以，三十几年来，全世界一直在研究在图像和视频压缩上是否有更好的变换这个问题，并没有得到一个肯定的答案。

【发明内容】

本发明所要解决的技术问题是提供一种与离散余弦变换不同之用于图像和视频压缩的正交变换方法，在压缩性能和软硬件实现代价上都优于离散余弦变换。

本发明所提出的技术方案是：

一种用于图像和视频压缩的正交变换方法，先将图像分成8×8的小块M，然后用8×8正交变换矩阵D对每一个图像块M作二维变换，得到变换系数矩阵N，再对N的每一个系数量化后熵编码，其特征在于：

所述变换系数矩阵表达式为：N＝DMD^T，其中D^T为D之转置矩阵；

所述8×8正交变换矩阵D为：

D = [\begin{matrix} 1 / \sqrt{8} & 1 / \sqrt{8} & 1 / \sqrt{8} & 1 / \sqrt{8} & 1 / \sqrt{8} & 1 / \sqrt{8} & 1 / \sqrt{8} & 1 / \sqrt{8} \\ - 7 / \sqrt{168} & - 5 / \sqrt{168} & - 3 / \sqrt{168} & - 1 / \sqrt{168} & 1 / \sqrt{168} & 3 / \sqrt{168} & 5 / \sqrt{168} & 7 / \sqrt{168} \\ 7 / \sqrt{168} & 1 / \sqrt{168} & - 3 / \sqrt{168} & - 5 \sqrt{168} & - 5 \sqrt{168} & - 3 \sqrt{168} & 1 / \sqrt{168} & 7 / \sqrt{168} \\ - 7 \sqrt{264} & 5 / \sqrt{264} & 7 / \sqrt{264} & 3 / \sqrt{264} & - 3 / \sqrt{264} & - 7 / \sqrt{264} & - 5 / \sqrt{264} & 7 / \sqrt{264} \\ 7 / \sqrt{616} & - 13 / \sqrt{616} & - 3 \sqrt{616} & 9 / \sqrt{616} & 9 / \sqrt{616} & - 3 / \sqrt{616} & - 13 / \sqrt{616} & 7 / \sqrt{616} \\ - 7 / \sqrt{2184} & 23 / \sqrt{2184} & - 17 / \sqrt{2184} & - 15 / \sqrt{2184} & 15 / \sqrt{2184} & 17 / \sqrt{2184} & - 23 / \sqrt{2184} & 7 / \sqrt{2184} \\ 1 / \sqrt{264} & - 5 / \sqrt{264} & 9 / \sqrt{264} & - 5 / \sqrt{264} & - 5 / \sqrt{264} & 9 / \sqrt{264} & - 5 / \sqrt{264} & 1 / \sqrt{264} \\ - 1 / \sqrt{3432} & 7 / \sqrt{3432} & - 21 / \sqrt{3432} & 35 / \sqrt{3432} & - 35 / \sqrt{3432} & 21 / \sqrt{3432} & - 7 / \sqrt{3432} & 1 / \sqrt{3432} \end{matrix}] .

上述矩阵D中，任何一行全体改变符号，为与该矩阵D之等效变换；

上述矩阵D之近似矩阵为：

[\begin{matrix} 0.353553 & 0.353553 & 0.353553 & 0.353553 & 0.353553 & 0.353553 & 0.353553 & 0.353553 \\ - 0.540062 & - 0.385758 & - 0.231455 & - 0.0771517 & 0.0771517 & 0.231455 & 0.385758 & 0.540062 \\ 0.540062 & 0.0771517 & - 0.231455 & - 0.385758 & - 0.385758 & - 0.231455 & 0.0771517 & 0.540062 \\ - 0.43082 & 0.307729 & 0.43082 & 0.184637 & - 0.184637 & - 0.43082 & - 0.307729 & 0.43082 \\ 0.282038 & - 0.523785 & - 0.120873 & 0.36262 & 0.36262 & - 0.120873 & - 0.523785 & 0.282038 \\ - 0.149786 & 0.492155 & - 0.363766 & - 0.32097 & 0.32097 & 0.363766 & - 0.492155 & 0.149786 \\ 0.0615457 & - 0.307729 & 0.553912 & - 0.307729 & - 0.307729 & 0.553912 & - 0.307729 & 0.0615457 \\ - 0.0170697 & 0.119488 & - 0.358464 & 0.59744 & - 0.59744 & 0.358464 & - 0.119488 & 0.0170697 \end{matrix}]

本发明对用于静止图像压缩编码的量化矩阵为：

{QUAN}_{D} = [\begin{matrix} 17 & 17 & 26 & 27 & 34 & 26 & 36 & 39 \\ 22 & 21 & 25 & 25 & 32 & 36 & 41 & 54 \\ 19 & 29 & 27 & 33 & 41 & 38 & 50 & 50 \\ 34 & 26 & 33 & 34 & 36 & 62 & 52 & 46 \\ 27 & 32 & 37 & 41 & 51 & 71 & 61 & 64 \\ 29 & 27 & 45 & 62 & 57 & 62 & 92 & 75 \\ 31 & 45 & 50 & 60 & 80 & 90 & 90 & 75 \\ 55 & 86 & 70 & 80 & 90 & 85 & 80 & 80 \end{matrix}]

本发明对经过熵解码和反量化后的数据块

亦可用上述矩阵D正交变换，其二维反变换恢复图像数据块为：

\tilde{M} = D^{T} \tilde{N} D .

作为本发明之进一步方案，用于软件和集成电路实现的变换整数实现表达式为：设

d_{1} = \sqrt{8},

d_{2} = \sqrt{168},

d_{3} = \sqrt{168},

d_{4} = \sqrt{264},

d_{5} = \sqrt{616},

d_{6} = \sqrt{2184},

d_{7} = \sqrt{264},

d_{8} = \sqrt{3432},

定义一个对角矩阵(E)和整数矩阵(P)为：

E = [\begin{matrix} 1 / d_{1} \\ 1 / d_{2} & O \\ 1 / d_{3} \\ 1 / d_{4} \\ 1 / d_{5} \\ O & 1 / d_{6} \\ 1 / d_{7} \\ 1 / d_{8} \end{matrix}], P = [\begin{matrix} 1 & 1 & 1 & 1 & 1 & 1 & 1 & 1 \\ - 7 & - 5 & - 3 & - 1 & 1 & 3 & 5 & 7 \\ 7 & 1 & - 3 & - 5 & - 5 & - 3 & 1 & 7 \\ - 7 & 5 & 7 & 3 & - 3 & - 7 & - 5 & 7 \\ 7 & - 13 & - 3 & 9 & 9 & - 3 & - 13 & 7 \\ - 7 & 23 & - 17 & - 15 & 15 & 17 & - 23 & 7 \\ 1 & - 5 & 9 & - 5 & - 5 & 9 & - 5 & 1 \\ - 1 & 7 & - 21 & 35 & - 35 & 21 & - 7 & 1 \end{matrix}] .

将矩阵(D)分解为：D＝EP，

则变换系数矩阵表达式N＝DMD^T为

N＝DMD^T＝E(PMP^T)E，

其中的PMP^T为仅含加法和移位的整数运算，非常方便。

同时，所述表达式N＝E(PMP^T)E具有反变换。

本发明基于8-进正交小波理论，设计了一个新的8×8正交变换矩阵，用这个正交变换压缩图像和视频，不仅能得到比DCT更好的压缩效果，而且在软件和集成电路实现上更加经济和高效。基于本发明，可以产生一条与基于离散余弦变换完全不同的新的压缩编码技术方案，且性能优于被广泛使用的离散余弦变换的性能。

【附图说明】

图1为JPEG压缩编码流程；

图2为本发明正交矩阵变换与JPEG2000正交矩阵变换压缩图像平均峰值信噪比图。

【具体实施方式】

在图像和视频压缩中，图像压缩是最核心的基础，正交变换方法是图像和视频压缩技术中的最核心的技术。在图像压缩标准JPEG(国际标准ISO/ICE IS 10918)和视频压缩标准MPEG-1(国际标准ISO/ICE 11172)、MPEG-2(国际标准ISO/ICE 13818)以及MPEG-4(国际标准ISO/ICE 14496)里，目前，所采用的正交变换方法是8×8的离散余弦变换(DCT，即Discrete Cosine Transform)。

本发明设计了一个8×8的正交变换，完全不同于8×8的离散余弦变换DCT，具有优于DCT之压缩性能。

下面详述本发明。

(1)本发明之正交变换矩阵用D表示，即

D = [\begin{matrix} 1 / \sqrt{8} & 1 / \sqrt{8} & 1 / \sqrt{8} & 1 / \sqrt{8} & 1 / \sqrt{8} & 1 / \sqrt{8} & 1 / \sqrt{8} & 1 / \sqrt{8} \\ - 7 / \sqrt{168} & - 5 / \sqrt{168} & - 3 / \sqrt{168} & - 1 / \sqrt{168} & 1 / \sqrt{168} & 3 / \sqrt{168} & 5 / \sqrt{168} & 7 / \sqrt{168} \\ 7 / \sqrt{168} & 1 / \sqrt{168} & - 3 / \sqrt{168} & - 5 \sqrt{168} & - 5 \sqrt{168} & - 3 \sqrt{168} & 1 / \sqrt{168} & 7 / \sqrt{168} \\ - 7 \sqrt{264} & 5 / \sqrt{264} & 7 / \sqrt{264} & 3 / \sqrt{264} & - 3 / \sqrt{264} & - 7 / \sqrt{264} & - 5 / \sqrt{264} & 7 / \sqrt{264} \\ 7 / \sqrt{616} & - 13 / \sqrt{616} & - 3 \sqrt{616} & 9 / \sqrt{616} & 9 / \sqrt{616} & - 3 / \sqrt{616} & - 13 / \sqrt{616} & 7 / \sqrt{616} \\ - 7 / \sqrt{2184} & 23 / \sqrt{2184} & - 17 / \sqrt{2184} & - 15 / \sqrt{2184} & 15 / \sqrt{2184} & 17 / \sqrt{2184} & - 23 / \sqrt{2184} & 7 / \sqrt{2184} \\ 1 / \sqrt{264} & - 5 / \sqrt{264} & 9 / \sqrt{264} & - 5 / \sqrt{264} & - 5 / \sqrt{264} & 9 / \sqrt{264} & - 5 / \sqrt{264} & 1 / \sqrt{264} \\ - 1 / \sqrt{3432} & 7 / \sqrt{3432} & - 21 / \sqrt{3432} & 35 / \sqrt{3432} & - 35 / \sqrt{3432} & 21 / \sqrt{3432} & - 7 / \sqrt{3432} & 1 / \sqrt{3432} \end{matrix}]

从数学理论中可以知道，对于一个离散序列[b_k]，k＝1，...，8，如果

Σ_{k = 0}^{7} k^{n} b_{k + 1} = 0

对n＝0，1，...，r-1成立，我们就说[b_k]具有r阶消失矩。该定义和小波理论的连续消失矩概念是等价的。

假设8-进小波的一支低通滤波器为[h_i](i为整数)，七支高通滤波器为[g_i，j](i为整数，j＝1，...，7)。我们考虑一个特殊的8-进正交小波系统，它的低通和所有高通滤波器的长度都为8，即i＝1，...，8。同时，对每个j(j＝1，...，7)，[g_i，j]有j阶消失矩。

现在，用[h_i]作为矩阵D的第1行，用[g_i，j]作为矩阵D的第j+1行(j＝1，...，7)，因此，根据8-进小波理论，所得到的矩阵D就是正交的。

关于D的正交性，我们只需验证DD^T＝I即可，这里D^T是D的转置矩阵，I是一个单位矩阵。这个矩阵的特征可以概括为：一个8×8的正交矩阵，它的第i行具有i-1阶消失矩(i＝1，...，8)。这样的矩阵在每一行的系数可以整体取反的意义下是唯一的。

因此，上述矩阵中任何一行全体改变符号，被视为等效变换。如第二行改变符号后的形式为：

[\begin{matrix} 1 / \sqrt{8} & 1 / \sqrt{8} & 1 / \sqrt{8} & 1 / \sqrt{8} & 1 / \sqrt{8} & 1 / \sqrt{8} & 1 / \sqrt{8} & 1 / \sqrt{8} \\ 7 / \sqrt{168} & 5 / \sqrt{168} & 3 / \sqrt{168} & 1 / \sqrt{168} & - 1 / \sqrt{168} & - 3 / \sqrt{168} & - 5 / \sqrt{168} & - 7 / \sqrt{168} \\ 7 / \sqrt{168} & 1 / \sqrt{168} & - 3 / \sqrt{168} & - 5 \sqrt{168} & - 5 \sqrt{168} & - 3 \sqrt{168} & 1 / \sqrt{168} & 7 / \sqrt{168} \\ - 7 \sqrt{264} & 5 / \sqrt{264} & 7 / \sqrt{264} & 3 / \sqrt{264} & - 3 / \sqrt{264} & - 7 / \sqrt{264} & - 5 / \sqrt{264} & 7 / \sqrt{264} \\ 7 / \sqrt{616} & - 13 / \sqrt{616} & - 3 \sqrt{616} & 9 / \sqrt{616} & 9 / \sqrt{616} & - 3 / \sqrt{616} & - 13 / \sqrt{616} & 7 / \sqrt{616} \\ - 7 / \sqrt{2184} & 23 / \sqrt{2184} & - 17 / \sqrt{2184} & - 15 / \sqrt{2184} & 15 / \sqrt{2184} & 17 / \sqrt{2184} & - 23 / \sqrt{2184} & 7 / \sqrt{2184} \\ 1 / \sqrt{264} & - 5 / \sqrt{264} & 9 / \sqrt{264} & - 5 / \sqrt{264} & - 5 / \sqrt{264} & 9 / \sqrt{264} & - 5 / \sqrt{264} & 1 / \sqrt{264} \\ - 1 / \sqrt{3432} & 7 / \sqrt{3432} & - 21 / \sqrt{3432} & 35 / \sqrt{3432} & - 35 / \sqrt{3432} & 21 / \sqrt{3432} & - 7 / \sqrt{3432} & 1 / \sqrt{3432} \end{matrix}] .

同样地，其他任意一行全体改变符号，也是与D等效的。

在软件或集成电路实现中，都是使用上述变换的一个近似。如下面的矩阵就是D的一个近似：

[\begin{matrix} 0.353553 & 0.353553 & 0.353553 & 0.353553 & 0.353553 & 0.353553 & 0.353553 & 0.353553 \\ - 0.540062 & - 0.385758 & - 0.231455 & - 0.0771517 & 0.0771517 & 0.231455 & 0.385758 & 0.540062 \\ 0.540062 & 0.0771517 & - 0.231455 & - 0.385758 & - 0.385758 & - 0.231455 & 0.0771517 & 0.540062 \\ - 0.43082 & 0.307729 & 0.43082 & 0.184637 & - 0.184637 & - 0.43082 & - 0.307729 & 0.43082 \\ 0.282038 & - 0.523785 & - 0.120873 & 0.36262 & 0.36262 & - 0.120873 & - 0.523785 & 0.282038 \\ - 0.149786 & 0.492155 & - 0.363766 & - 0.32097 & 0.32097 & 0.363766 & - 0.492155 & 0.149786 \\ 0.0615457 & - 0.307729 & 0.553912 & - 0.307729 & - 0.307729 & 0.553912 & - 0.307729 & 0.0615457 \\ - 0.0170697 & 0.119488 & - 0.358464 & 0.59744 & - 0.59744 & 0.358464 & - 0.119488 & 0.0170697 \end{matrix}] .

如果某个矩阵的元素小数点后的5位有效数字与D的元素小数点后的5位有效数字完全相同，这样的变换与D是等效的。对于改变D的某行的符号得到的等效变换的此类情形也一样。

(2)对被压缩的图像数据块M(8×8矩阵)，用(1)中的正交变换对这个数据块作二维变换，变换结果用N(8×8矩阵)表示，即

N＝DMD^T，

以便完成后续的压缩编码过程。这里，“D^T”表示D的转置矩阵。

(3)在(2)的基础上，具体实现N＝DMD^T有许多等效的矩阵运算方法，即相同的输入M导致相同的输出N的实现方法，这样的等效方法视为同一方法。同时，该变换每一行的元素具有对称性或反对称性。这个性质有利于快速实现变换或反变换运算，在增加少量存储器的前提下，计算量减半。

为了说明这个问题，我们用[d_i，j](i＝1，...，8，j＝1，...，8)来表示(1)中的矩阵D，用m＝[m_i](i＝1，...，8)来表示一个列向量，用n＝[n_i](i＝1，...，8)来表示变换结果。我们考虑一个一维变换n＝Dm，它的具体表示为

n_{i} = Σ_{j = 1}^{8} d_{i, j} m_{j} (i = 1, . . ., 8) .

这就是变换的直接计算法。但是，如果我们考虑矩阵D的一些特点，如它的奇数行是对称的，即d_i，j＝d_i+4，j(i＝1，3，5，7，j＝1，...，8)，偶数行是反对称的即d_i，j＝-d_i+4，j(i＝2，4，6，8，j＝1，...，8)，这个变换有另外的等价表示：

n_{i} = Σ_{j = 1}^{4} d_{i, j} (m_{j} + m_{j + 4}), (i = 1,3,5,7)

和

n_{i} = Σ_{j = 1}^{4} d_{i, j} (m_{j} - m_{j + 4}), (i = 2, 4, 6, 8) .

这种实现方法和直接计算方法是不同的，但它们是等效的。对于直接计算方法，用软件和集成电路实现时，计算量要大些，存储器需要少些；而对于等效计算方法，计算量要小些，存储器需要多些。

由大学线性代数知识可知，对于二维变换，在实际应用中可以转化为16个一维变换来实现。

还有许多其它的等效变换。

(4)在(2)和(3)的基础上，本发明提出了一种特定的变换整数实现方法。设

d_{1} = \sqrt{8},

d_{2} = \sqrt{168},

d_{3} = \sqrt{168},

d_{4} = \sqrt{264},

d_{5} = \sqrt{616},

d_{6} = \sqrt{2184},

d_{7} = \sqrt{264},

d_{8} = \sqrt{3432} .

定义一个对角矩阵E和整数矩阵P如下：

E = [\begin{matrix} 1 / d_{1} \\ 1 / d_{2} & O \\ 1 / d_{3} \\ 1 / d_{4} \\ 1 / d_{5} \\ O & 1 / d_{6} \\ 1 / d_{7} \\ 1 / d_{8} \end{matrix}], P = [\begin{matrix} 1 & 1 & 1 & 1 & 1 & 1 & 1 & 1 \\ - 7 & - 5 & - 3 & - 1 & 1 & 3 & 5 & 7 \\ 7 & 1 & - 3 & - 5 & - 5 & - 3 & 1 & 7 \\ - 7 & 5 & 7 & 3 & - 3 & - 7 & - 5 & 7 \\ 7 & - 13 & - 3 & 9 & 9 & - 3 & - 13 & 7 \\ - 7 & 23 & - 17 & - 15 & 15 & 17 & - 23 & 7 \\ 1 & - 5 & 9 & - 5 & - 5 & 9 & - 5 & 1 \\ - 1 & 7 & - 21 & 35 & - 35 & 21 & - 7 & 1 \end{matrix}] .

则(1)中的矩阵可以分解为：D＝EP，从而(2)中的变换N＝DMD^T可以写成

N＝DMD^T＝E(PMP^T)E。

注意，P的元素都是小整数，M的元素也是整数，在集成电路设计中，这样的整数运算都可以化为移位运算。如35＝32+2+1＝2⁵+2+1，21＝16+4+1＝2⁴+2²+1，等等。从而(PMP^T)可以全是移位运算和加法运算，避免了浮点运算和乘法运算，有利于计算方法的集成电路的高效实现。而矩阵E的左乘和右乘可以和量化步骤合并。

(5)经过熵解码后，对已经压缩了的数据块

用(1)中的正交变换，作如下的二维反变换恢复图像数据块：

\tilde{M} = D^{T} \tilde{N} D .

这里，“D^T”表示D的转置矩阵。

(6)在(5)的基础上，具体实现

\tilde{M} = D^{T} \tilde{N} D

有许多等效的矩阵运算方法，即相同的输入

导致相同的输出的实现方法。这样的等效方法视为同一方法。有关这个问题的理解与(3)类似，但不完全相同。我们同样只需要考虑一维反变换。记号为：

\tilde{n} = [{\tilde{n}}_{i}] (i = 1, . . ., 8)

为输入列向量，

\tilde{m} = [{\tilde{m}}_{i}] (i = 1, . . ., 8)

表示输出列向量。一个一维的反变换为

\tilde{m} = D^{T} \tilde{n},

它的直接计算法是：

{\tilde{m}}_{i} = Σ_{j = 1}^{8} d_{j, i} {\tilde{n}}_{j}, (i = 1, . . ., 8) .

同样根据D的对称性，我们可以有如下的等效计算方法。计算过程分两步。首先，计算如下的两组数：

{\tilde{m}}_{i}^{(1)} = \underset{j = 1,3,5,7}{Σ} d_{j, i} {\tilde{n}}_{j}, (i = 1,2,3,4)

和

{\tilde{m}}_{i}^{(2)} = \underset{j = 2, 4, 6, 8}{Σ} d_{j, i} {\tilde{n}}_{j}, (i = 1,2,3,4) .

然后，计算

{\tilde{m}}_{i} = {\tilde{m}}_{i}^{(1)} + {\tilde{m}}_{i}^{(2)}

和

{\tilde{m}}_{9 - i} = {\tilde{m}}_{i}^{(1)} - {\tilde{m}}_{i}^{(2)}, (i = 1,2,3,4) .

这个等效反变换节省了计算量，但增加了存储器数量。

由大学线性代数知识可知，二维反变换可以转化为16个一维反变换来实现。

还有许多其它等效的反变换。

(7)在(5)和(6)的基础上，本发明还可实现反变换整数运算，这里依旧使用(4)里的记号。同样，

\tilde{M} = D^{T} \tilde{N} D = P^{T} (E \tilde{N} E) P

完全是整数运算。

我们可以对比一下JPEG的DCT与本发明里矩阵的性质差异。下面是著名的8×8离散余弦变换(精确到小数点后5位有效数字)：

{DCT}_{8} = [\begin{matrix} 0.353553 & 0.353553 & 0.353553 & 0.353553 & 0.353553 & 0.353553 & 0.353553 & 0.353553 \\ 0.490393 & 0.415735 & 0.277785 & 0.0975452 & - 0.0975452 & - 0.277785 & - 0.415735 & - 0.490393 \\ 0.46194 & 0.191342 & - 0.191342 & - 0.46194 & - 0.46494 & - 0.191342 & 0.191342 & 0.46194 \\ 0.415735 & - 0.0975452 & - 0.490393 & - 0.277785 & 0.277785 & 0.490393 & 0.0975452 & - 0.415735 \\ 0.353553 & - 0.353553 & - 0.353553 & 0.353553 & 0.353553 & - 0.353553 & - 0.353553 & 0.353553 \\ 0.277785 & - 0.490393 & 0.0975452 & 0.415735 & - 0.415735 & - 0.0975452 & 0.490393 & - 0.277785 \\ 0.191342 & - 0.46194 & 0.46194 & - 0.191342 & - 0.191342 & 0.46194 & - 0.46194 & 0.191342 \\ 0.0975452 & - 0.277785 & 0.415735 & - 0.490393 & 0.490393 & - 0.415735 & 0.277785 & - 0.0975452 \end{matrix}] .

而本发明D的近似为：

[\begin{matrix} 0353553 & 0353553 & 0353553 & 0353553 & 0353553 & 0353553 & 0353553 & 0353553 \\ - 0540062 & - 0385758 & - 0231455 & - 00771517 & 00771517 & 0231455 & 0385758 & 0540062 \\ 0540062 & 00771517 & - 0231455 & - 0385758 & - 0385758 & - 0231455 & 00771517 & 0540062 \\ - 043082 & 0307729 & 043082 & 0.184637 & - 0184637 & - 043082 & - 0307729 & 043082 \\ 0282038 & - 0523785 & - 0.120873 & 036262 & 036262 & - 0120873 & - 0523785 & 0282038 \\ - 0149786 & 0492155 & - 0363766 & - 032097 & 032097 & 0363766 & - 0492155 & 0149786 \\ 00615457 & - 0307729 & 0553912 & - 0307729 & - 0307729 & 0553912 & - 0307729 & 00615457 \\ - 00170697 & 0119488 & - 0358464 & 059744 & - 059744 & 0358464 & - 0119488 & 00170697 \end{matrix}] .

简单比较可知，除了第1行与本发明的第1行相同外，其余的行与本发明的完全不同。所以，这两个矩阵是完全不同的矩阵。从数学特征看，可以验证，离散余弦变换的第2行到第7行的消失矩的阶数不超过2。这一性质反映了两个变换矩阵的数学性质的巨大差异。

根据8-进小波理论，DCT₈也构成一个特殊的8-进小波结构。只是本发明构造的变换达到了最高阶数的消失矩，而DCT₈的消失矩就不够高。在消失矩意义下，本发明构造的变换矩阵是最优的。这在理论上解释了为什么试验中我们的变换性能要超过DCT₈的。

在JPEG、MPEG-1、MPEG-2和MPEG-4里，实施离散余弦变换都是最重要、最基本的一环。所以，凡所用到离散余弦变换的地方都可以使用本发明中的变换。利用这个变换，本发明完成了图像或视频的压缩或解压缩中最主要的一个环节，从而可以产生一条与基于离散余弦变换完全不同的新的技术路线，并且本发明压缩编码方法优于传统的基于离散余弦变换的技术。当然，在下面我们也将看到，由于变换技术不同，导致压缩编码解码过程中相关的后续技术也产生了相应的变化，以利于提高编码效率。这也是本发明突出的实质性特点。事实上，不同的变换技术导致不同的量化技术和不同的编码技术，变换技术在压缩编码技术里始终是处于树根的地位。

本发明用图像压缩编码作为具体实施例，来检验本发明的编码效果。为了便于对比，本发明利用JPEG框架来实施。

在JPEG里，图像的压缩流程分为四个大的步骤，如图1所示，包括离散余弦变换(DCT)，量化变换系数，Z字扫描和熵编码。其具体步骤为：

先将图像分成8×8的小块X，然后用上述8×8离散余弦变换(DCT₈)对每一个图像块X作二维变换，即

Y＝(DCT₈)X(DCT₈ ^T)，

其中(DCT₈ ^T)为(DCT₈)的转置矩阵。

由上式得到变换系数矩阵Y，再对Y的每一个系数除以一个数值(这个过程称为量化)，这些被除数构成的矩阵称为量化矩阵，如JPEG里对应DCT₈的默认量化矩阵为：

{QUAN}_{DCT} = [\begin{matrix} 16 & 11 & 10 & 16 & 24 & 40 & 51 & 61 \\ 12 & 12 & 14 & 19 & 26 & 58 & 60 & 55 \\ 14 & 13 & 16 & 24 & 40 & 57 & 69 & 56 \\ 14 & 17 & 22 & 29 & 51 & 87 & 80 & 62 \\ 18 & 22 & 37 & 56 & 68 & 109 & 103 & 77 \\ 24 & 35 & 55 & 64 & 81 & 104 & 113 & 92 \\ 49 & 64 & 78 & 87 & 103 & 121 & 120 & 101 \\ 72 & 92 & 95 & 98 & 112 & 100 & 103 & 99 \end{matrix}] .

量化后，对量化后的系数从左上角到右下角作所谓的Z字扫描，然后，用游长编码和Huffman编码(通常有一组固定的Huffman码表)完成对量化后的系数的压缩编码输出。关于这些内容，在JPEG的标准文件里均能找到。

为了检验和对比变换D的性能，我们依旧维持上述的JPEG压缩编码流程，只不过我们将DCT₈换成了D，也就是在Y＝(DCT₈)X(DCT₈ ^T)中将DCT₈换成D，变换公司相应地成了Y＝DXD^T。由于DCT₈和D的性质完全不同，替换掉DCT₈后，随之改变的应该是量化矩阵和Huffman码表。但在JPEG标准中，量化矩阵是包含在图像压缩文件中的。因此，量化矩阵的变化是许可的。

对应本发明的变换矩阵的量化矩阵为：

{QUAN}_{D} = [\begin{matrix} 17 & 17 & 26 & 27 & 34 & 26 & 36 & 39 \\ 22 & 21 & 25 & 25 & 32 & 36 & 41 & 54 \\ 19 & 29 & 27 & 33 & 41 & 38 & 50 & 50 \\ 34 & 26 & 33 & 34 & 36 & 62 & 52 & 46 \\ 27 & 32 & 37 & 41 & 51 & 71 & 61 & 64 \\ 29 & 27 & 45 & 62 & 57 & 62 & 92 & 75 \\ 31 & 45 & 50 & 60 & 80 & 90 & 90 & 75 \\ 55 & 86 & 70 & 80 & 90 & 85 & 80 & 80 \end{matrix}] .

比较这两个量化矩阵，可以看出它们是有很大差异的。

由于本发明中的变换有非常好的性质，在具体实现中效率非常高，这一点是DCT所不及的。

测试结果：

为使研究具有可比性和客观性，我们在实验中采用JPEG标准基本系统的框架，进行本发明中的D与DCT₈的实验对比。使用DCT₈变换的压缩软件是JPEG组织提供的JPEG基本系统编/解码测试软件(可以在WWW.JPEG.ORG下载)，而使用D变换的压缩软件只是在JPEG基本系统编/解码测试软件中做了两项修改：第一，空间域到频率域的变换方法用D替换了DCT₈；第二，用QUAN_D取代了QUAN_DCT。

可以用国际上通用的“标准测试图”来检验压缩效果好坏。其方法是，在不同的压缩率下对多幅图像作压缩处理，然后解压缩，得到恢复的图像。恢复的图像与原始图像是有差异的，我们可以计算原始图像与解压缩图像的峰值信噪比(PSNR，单位为dB)，PSNR越高，解压图像与原始图像的之间的失真度越小。

分别计算出13个幅面大小均为512×512灰度标准测试图像，在压缩比5倍、10倍以及20倍情况下的峰值信噪比。实验结果见表1。

表1：DCT₈与D压缩图像对比结果

上述列表中，第一列为不同的图像名，表内地数据为PSNR(dB)，“D”的下方对应的是采用本发明的变换的结果，“DCT₈”的下方对应的是采用DCT₈的结果，最后一行是13幅图像的平均PSNR。

有关D和DCT₈压缩图像的平均峰值信噪比见图2。图中由圆点连接的线段为D压缩图像的平均峰值信噪比，叉连接的线段为DCT₈压缩图像的平均峰值信噪比。

从实验结果看，在压缩比小于或等于20倍时，D的峰值信噪比明显优于DCT₈。在压缩比为5倍时，对13幅图像，D的结果比DCT₈平均高出0.45个dB，这个结果是有显著意义的。事实上，对于数码相机，一般没有压缩到这个倍率(灰度图像压缩5倍时，彩色图像可压缩10倍左右)。在压缩比为10倍时，对13幅图像，D的结果比DCT₈平均高出0.16个dB。压缩比等于20倍时，D的结果与DCT₈的相当(DCT₈平均比D的只高了0.07个dB)。在MPEG-2或MPEG-4中，I帧采用高保真压缩，并用I帧的解码图像去预测B和P帧。显然，D对I帧的压缩效率比DCT₈更高，并且，I帧的解码图像质量越好，对B和P帧的压缩越有利。

Claims

1. 一种用于图像和视频压缩的正交变换方法，先将图像分成8×8的小块M，然后用8×8正交变换矩阵D对每一个小块M作二维变换，得到变换系数矩阵N，再对N的每一个系数量化后熵编码，其特征在于：

所述变换系数矩阵表达式为：N＝DMD^T，其中8×8正交变换转置矩阵D^T为上述8×8正交变换矩阵D之转置矩阵，

所述8×8正交变换矩阵D为：

D = [\begin{matrix} 1 / \sqrt{8} & 1 / \sqrt{8} & 1 / \sqrt{8} & 1 / \sqrt{8} & 1 / \sqrt{8} & 1 / \sqrt{8} & 1 / \sqrt{8} & 1 / \sqrt{8} \\ - 7 / \sqrt{16} 8 & - 5 / \sqrt{16} 8 & - 3 / \sqrt{16} 8 & - 1 / \sqrt{16} 8 & 1 / \sqrt{16} 8 & 3 / \sqrt{16} 8 & 5 / \sqrt{16} 8 & 7 / \sqrt{16} 8 \\ 7 / \sqrt{16} 8 & 1 / \sqrt{16} 8 & - 3 / \sqrt{16} 8 & - 5 / \sqrt{16} 8 & - 5 / \sqrt{16} 8 & - 3 / \sqrt{16} 8 & 1 / \sqrt{16} 8 & 7 / \sqrt{16} 8 \\ - 7 / \sqrt{26} 4 & 5 / \sqrt{26} 4 & 7 / \sqrt{26} 4 & 3 / \sqrt{26} 4 & - 3 / \sqrt{26} 4 & - 7 / \sqrt{26} 4 & - 5 / \sqrt{26} 4 & 7 / \sqrt{26} 4 \\ 7 / \sqrt{61} 6 & - 13 / \sqrt{61} 6 & - 3 / \sqrt{61} 6 & 9 / \sqrt{61} 6 & 9 / \sqrt{61} 6 & - 3 / \sqrt{61} 6 & - 13 / \sqrt{61} 6 & 7 / \sqrt{61} 6 \\ - 7 / \sqrt{218} 4 & 23 / \sqrt{218} 4 & - 17 / \sqrt{218} 4 & - 15 / \sqrt{218} 4 & 15 / \sqrt{218} 4 & 17 / \sqrt{218} 4 & - 23 / \sqrt{218} 4 & 7 / \sqrt{218} 4 \\ 1 / \sqrt{26} 4 & - 5 / \sqrt{26} 4 & 9 / \sqrt{26} 4 & - 5 / \sqrt{26} 4 & - 5 / \sqrt{26} 4 & 9 / \sqrt{26} 4 & - 5 / \sqrt{26} 4 & 1 / \sqrt{26} 4 \\ - 1 / \sqrt{343} 2 & 7 / \sqrt{343} 2 & - 21 / \sqrt{343} 2 & 35 / \sqrt{343} 2 & - 35 / \sqrt{343} 2 & 21 / \sqrt{343} 2 & - 7 / \sqrt{343} 2 & 1 / \sqrt{343} 2 \end{matrix}] .

2. 根据权利要求1所述的用于图像和视频压缩的正交变换方法，其特征在于：所述8×8正交变换矩阵D中任何一行全体改变符号，为与上述8×8正交变换矩阵D之等效变换.

3. 根据权利要求1所述的用于图像和视频压缩的正交变换方法，其特征在于：所述8×8正交变换矩阵D之近似矩阵为：

[\begin{matrix} 0.353553 & 0.353553 & 0.353553 & 0.353553 & 0.353553 & 0.353553 & 0.353553 & 0.353553 \\ - 0.540062 & - 0.385758 & - 0.231455 & - 0.0771517 & 0.0771517 & 0.231455 & 0.385758 & 0.540062 \\ 0.540062 & 0.0771517 & - 0.231455 & - 0.385758 & - 0.385758 & - 0.231455 & 0.0771517 & 0.540062 \\ - 0.43082 & 0.307729 & 0.43082 & 0.184637 & - 0.184637 & - 0.43082 & - 0.307729 & 0.43082 \\ 0.282038 & - 0.523785 & - 0.120873 & 0.36262 & 0.36262 & - 0.120873 & - 0.523785 & 0.282038 \\ - 0.149786 & 0.492155 & - 0.363766 & - 0.32097 & 0.32097 & 0.363766 & - 0.492155 & 0.149786 \\ 0.0615457 & - 0.307729 & 0.553912 & - 0.307729 & - 0.307729 & 0.553912 & - 0.307729 & 0.0615457 \\ - 0.0170697 & 0.119488 & - 0.358464 & 0.59744 & - 0.59744 & 0.358464 & - 0.119488 & 0.0170697 \end{matrix}] .

4. 根据权利要求1或2或3所述的用于图像和视频压缩的正交变换方法，其特征在于：用于静止图像压缩编码的量化矩阵为：

{QUAN}_{D} = [\begin{matrix} 17 & 17 & 26 & 27 & 34 & 26 & 36 & 39 \\ 22 & 21 & 25 & 25 & 32 & 36 & 41 & 54 \\ 19 & 29 & 27 & 33 & 41 & 38 & 50 & 50 \\ 34 & 26 & 33 & 34 & 36 & 62 & 52 & 46 \\ 27 & 32 & 37 & 41 & 51 & 71 & 61 & 64 \\ 29 & 27 & 45 & 62 & 57 & 62 & 92 & 75 \\ 31 & 45 & 50 & 60 & 80 & 90 & 90 & 75 \\ 55 & 86 & 70 & 80 & 90 & 85 & 80 & 80 \end{matrix}] .

5. 根据权利要求1或2或3所述的用于图像和视频压缩的正交变换方法，其特征在于：对经过熵解码和反量化后的数据块

用所述8×8正交变换矩阵D正交变换，其二维反变换恢复图像数据块为：

\tilde{M} = D^{T} \tilde{N} D .

6. 根据权利要求1或2或3所述的用于图像和视频压缩的正交变换方法，其特征在于：用于软件和集成电路实现的变换整数实现表达式为：

设

d_{1} = \sqrt{8},

d_{2} = \sqrt{168},

d_{3} = \sqrt{168},

d_{4} = \sqrt{264},

d_{5} = \sqrt{616},

d_{6} = \sqrt{2184},

d_{7} = \sqrt{264},

d_{8} = \sqrt{3432},

定义一个对角矩阵E和整数矩阵P为：

E = [\begin{matrix} 1 / d_{1} \\ 1 / d_{2} & O \\ 1 / d_{3} \\ 1 / d_{4} \\ 1 / d_{5} \\ O & 1 / d_{6} \\ 1 / d_{7} \\ 1 / d_{8} \end{matrix}],

P = [\begin{matrix} 1 & 1 & 1 & 1 & 1 & 1 & 1 & 1 \\ - 7 & - 5 & - 3 & - 1 & 1 & 3 & 5 & 7 \\ 7 & 1 & - 3 & - 5 & - 5 & - 3 & 1 & 7 \\ - 7 & 5 & 7 & 3 & - 3 & - 7 & - 5 & 7 \\ 7 & - 13 & - 3 & 9 & 9 & - 3 & - 13 & 7 \\ - 7 & 23 & - 17 & - 15 & 15 & 17 & - 23 & 7 \\ 1 & - 5 & 9 & - 5 & - 5 & 9 & - 5 & 1 \\ - 1 & 7 & - 21 & 35 & - 35 & 21 & - 7 & 1 \end{matrix}]

将所述8×8正交变换矩阵D分解为：D＝EP，

则变换系数矩阵表达式N＝DMD^T为

N＝DMD^T＝E(PMP^T)E，

其中的PMP^T为仅含加法和移位的整数运算.

7. 根据权利要求6所述的用于图像和视频压缩的正交变换方法，其特征在于：所述表达式N＝E(PMP^T)E具有反变换.