CN104867165A

CN104867165A - 一种基于变换域下采样技术的图像压缩方法

Info

Publication number: CN104867165A
Application number: CN201510257376.5A
Authority: CN
Inventors: 朱树元; 曾兵
Original assignee: University of Electronic Science and Technology of China
Current assignee: University of Electronic Science and Technology of China
Priority date: 2015-05-19
Filing date: 2015-05-19
Publication date: 2015-08-26
Anticipated expiration: 2035-05-19
Also published as: CN104867165B

Abstract

本发明提供了一种基于变换域下采样技术的图像压缩方法，它是通过对于内部比较平滑的图像区域，采用基于变换域下采样的方法进行编码，再利用插值技术进行重建，大大降低编码的比特率；采用传统的基于JPEG图像压缩标准的编码方法对于内部纹理比较复杂的图像区域进行编码；将两种编码方法相结合，对不同类型的图像区域采用不同的编码策略，实现对整个图像信号的高效压缩。与传统的JPEG图像压缩方法相比,本发明具有灵活高效的特点，能够克服传统JPEG图像压缩方法中编码模式单一，导致整体编码效率低下的缺点。

Description

一种基于变换域下采样技术的图像压缩方法

技术领域

本发明属于图像压缩领域，主要涉及数字图像的编码技术。

背景技术

图像作为人们获取和传播知识的信息载体，已经成为人们日常生活中不可缺少的一部分。随着多媒体技术的迅速发展，图像处理和传输技术已经成为数字视频广播、游戏动漫、影视制作、内容检索、媒体存储、媒体娱乐，以及多媒体通讯等数字媒体产业的共性关键技术。由于图像数据本身具有数据量大的特点，为了节约传输带宽和存储空间，人们常利用图像压缩技术减少图像的数据量。减少图像数据量的本质就是去除图像像素点之间存在的冗余，即像素点之间的相关性。而对图像的各种编码方法就是为了降低这种相关性，从而达到消除冗余的目的,实现图像数据的压缩。

图像内部的不同区域具有不同的特征，比如有些区域比较平滑，有些区域纹理比较复杂,这种不同的特征也导致不同区域内像素点之间的相关性各不相同，如果能针对具有不同特征的图像区域采用相应的有效编码策略，那么就可以提高图像的压缩编码效率。现有的基于图像块的压缩方法，在编码策略选择上存在一定的局限性，即图像块的编码模式比较单一，无法根据图像局部区域的具体内容选择合理的编码模式，从而造成整体编码效率低下，参见参考文献“JPEG(Joint Photographic Experts Group):ISO/IEC IS 10918–1/ITU-T RecommendationT.81,Digital Compression and Coding of Continuous-Tone Still Image,1993”。

发明内容

本发明的目的是提供一种基于变换域下采样技术的图像压缩方法，它是通过对图像平滑区域采用变换域的下采样技术进行压缩，对纹理比较复杂的区域采用传统的编码模式进行压缩，通过这两种不同编码模式的选择，有针对性地提高图像块的编码效率，从而实现对整个图像信号的高效压缩。与传统的JPEG图像压缩方法相比,本发明具有灵活高效的特点，能够克服传统JPEG图像压缩方法中由于编码模式单一而导致整体编码效率低下的缺点。

为了方便描述本发明的内容，首先做以下术语定义：

定义1，传统的JPEG图像压缩标准中图像分块的方法

传统的图像分块方法按照JPEG标准中对图像进行分块的方法，将原始图像划分为多个互不重叠的等尺寸图像块，具体描述过程参见“JPEG(Joint Photographic Experts Group):ISO/IEC IS 10918–1/ITU-T Recommendation T.81,Digital Compression and Coding ofContinuous-Tone Still Image,1993”；

定义2，传统的计算离散余弦变换矩阵的方法

传统的计算离散余弦变换矩阵的方法是根据离散余弦变换矩阵的定义，计算变换矩阵中的每一个元素，从而根据需要产生任意大小的离散余弦变换矩阵，具体描述过程参见文献“数字视频编码技术原理”，高文、赵德斌、马思伟著，科学出版社；

定义3，传统的矩阵Kronecker乘法

传统的矩阵Kronecker乘法表示为其中，表示Kronecker乘法算子，A是大小为m×n的矩阵，并且

B是大小为p×q的矩阵，C是大小为mp×nq的矩阵，

具体描述过程参见文献“矩阵分析与应用(第2版)”，张贤达著，清华大学出版社；

定义4，传统的基于离散余弦变换的向量填充算法

传统的基于离散余弦变换的向量填充算法利用离散余弦变换矩阵和原始输入向量的一部分分量，通过计算相应的填充值，对另一部分分量进行数据替换；具体步骤参见文献“Arbitrarily-shaped transform coding based on a new padding technique”；

定义5，传统的一维离散余弦变换方法

传统的一维离散余弦变换方法利用离散余弦变换矩阵左乘输入行向量，从而得到变换后的系数向量，具体描述过程参见文献“数字视频编码技术原理”，高文、赵德斌、马思伟著，科学出版社；

定义6，传统的JPEG图像压缩标准中的量化方法

传统的JPEG图像压缩标准中的量化方法将变换编码后系数矩阵中的每个元素与量化表格中的每个元素对应相除，然后对得到的每个结果进行四舍五入的取整操作，从而得到量化的系数矩阵；具体描述过程参见“JPEG(Joint Photographic Experts Group):ISO/IEC IS10918–1/ITU-T Recommendation T.81,Digital Compression and Coding of Continuous-Tone StillImage,1993”；

定义7，传统的JPEG图像压缩标准中的反量化方法

传统的JPEG图像压缩标准中的反量化方法将量化后系数矩阵中的每个元素与量化表格中的每个元素对应相乘，从而得到反量化的系数矩阵；具体描述过程参见“JPEG(JointPhotographic Experts Group):ISO/IEC IS 10918–1/ITU-T Recommendation T.81,DigitalCompression and Coding of Continuous-Tone Still Image,1993”；

定义8，传统的JPEG图像压缩标准中计算编码比特数的方法

传统的JPEG图像压缩标准中计算编码比特数的方法主要是计算图像块系数矩阵编码所消耗的比特数，具体描述过程参见“JPEG(Joint Photographic Experts Group):ISO/IEC IS10918–1/ITU-T Recommendation T.81,Digital Compression and Coding of Continuous-Tone StillImage,1993”；

定义9，传统的JPEG图像压缩标准中的编码方法

传统的JPEG图像压缩标准中的编码方法主要包括对每个图像块进行变换编码、量化和熵编码以及计算编码比特数；具体描述过程参见“JPEG(Joint Photographic Experts Group):ISO/IEC IS 10918–1/ITU-T Recommendation T.81,Digital Compression and Coding ofContinuous-Tone Still Image,1993”；

定义10，传统的JPEG图像压缩标准中的解码方法

传统的JPEG图像压缩标准中的解码方法主要包括对每个图像块进行反变换和反量化；具体描述过程参见“JPEG(Joint Photographic Experts Group):ISO/IEC IS 10918–1/ITU-TRecommendation T.81,Digital Compression and Coding of Continuous-Tone Still Image,1993”；

定义11，传统的二维离散余弦反变换方法

传统的二维离散余弦反变换方法分两步完成，第一步，利用离散余弦变换矩阵的逆矩阵左乘输入矩阵，得到一个矩阵；第二步，用离散余弦变换矩阵转置矩阵的逆矩阵再右乘第一步得到的矩阵，从而得到反变换后的矩阵；具体描述过程参见文献“数字视频编码技术原理”，高文、赵德斌、马思伟著，科学出版社；

定义12，传统的双三次插值方法

传统的双三次插值方法是二维空间中最常用的插值方法，在这种插值方法中，点(u,v)处的值可以通过它周围矩形网格中最近的十六个点的加权平均得到；具体描述过程参见文献“Cubic convolution interpolation for digital image processing”；

定义13，传统的计算均方误差的方法

传统的计算均方误差的方法针对两个大小均为m×n的二维输入信号X和按照下式计算它们之间的均方误差：

定义14，传统的JPEG图像压缩标准中图像块合成图像的方法

传统的图像块合成图像的方法是按照JPEG图像压缩标准中用图像块进行相互不重叠组合以合成完整图像的方法，具体描述过程参见“JPEG(Joint Photographic Experts Group):ISO/IEC IS 10918–1/ITU-T Recommendation T.81,Digital Compression and Coding ofContinuous-Tone Still Image,1993”；

本发明提供一种基于变换域下采样技术的图像压缩方法，它包括以下步骤：

步骤1，图像的预处理

将大小为W×H的图像,按照传统的JPEG图像压缩标准中图像分块的方法划分为N＝(W×H)/16²个互不重叠的，大小为16×16的正方形图像块，记为B₁，B₂，…，B_i，…，B_N，这里，W代表图像的宽度，H代表图像的高度，N代表图像划分后图像块的总个数，i代表图像块的索引，i∈{1，2，…，N}；

步骤2，索引矩阵的产生

把256个自然数1，2，…，256按从小到大，从上到下的顺序逐列摆放，产生一个大小为16×16的索引矩阵，记为I：

I中的元素记为I(x,y)(x和y都是自然数，并且1≤x≤16,1≤y≤16)，这里，x代表索引矩阵I内元素的横坐标，y代表索引矩阵I内元素的纵坐标；

步骤3，列索引向量的产生

首先，定义2个列索引子向量，分别记为这里，是一个1×64的行向量，为奇数，y为奇数，并且1≤x≤16,1≤y≤16}，即是一个1×192的行向量，和y不同时为奇数，并且1≤x≤16,1≤y≤16}，即其中，I是步骤2中产生的索引矩阵，x代表索引矩阵I内元素的横坐标，y代表索引矩阵I内元素的纵坐标，x和y都是自然数；

然后，将和按照从左到右的顺序组成一个1×256的列索引向量，记为这里，I是步骤2中产生的索引矩阵；

步骤4，行索引向量的产生

首先，定义3个行索引子向量，分别记为这里，是一个大小为1×64的行向量，即是一个大小为1×64的行向量，即是一个大小为1×128的行向量，即其中，I是步骤2中产生的索引矩阵，x代表索引矩阵I内元素的横坐标，y代表索引矩阵I内元素的纵坐标，x和y都是自然数；

然后，将按照从左到右的顺序组成一个大小为1×256的行索引向量，记为这里，I是步骤2中产生的索引矩阵；

步骤5，变换矩阵的产生

首先，按照传统的计算离散余弦变换矩阵的方法，产生两个大小为16×16的离散余弦变换矩阵，记为C₁和C₂；

其次，将离散余弦变换矩阵C₁和C₂带入传统的矩阵Kronecker乘法中，产生一个大小为256×256的变换矩阵，记为D，并且这里，符号代表传统的矩阵Kronecker乘法中的Kronecker乘法算子；

步骤6，调整变换矩阵的列

将步骤5中产生的变换矩阵D中的每个列向量记为

即

{\overset{&RightArrow;}{d}}_{k} = [\begin{matrix} D_{1, k} \\ D_{2, k} \\ . \\ . \\ . \\ D_{256, k} \end{matrix}],

这里，k为矩阵D的列向量下标索引，为步骤3中产生的列索引向量。用矩阵D中的所有列向量组成一个新的大小为256×256的变换矩阵，记为E，步骤如下：

第1次，取矩阵D的第个列向量生成矩阵E的第1列，

第2次，取矩阵D的第个列向量生成矩阵E的第2列，

同理，第256次，取矩阵D的第个列向量生成矩阵E的第256列，

即

这里，e_m,n代表矩阵E中的元素，m代表索引矩阵E内元素的横坐标，n代表索引矩阵E内元素的纵坐标，m和n都是自然数，1≤m≤256,1≤n≤256；

步骤7，调整变换矩阵的行

将步骤6产生的变换矩阵E中的每个行向量记为

即

这里，l为矩阵E的行向量下标索引，为步骤4中产生的行索引向量，用矩阵E中的所有行向量组成一个新的变换矩阵，记为F，步骤如下：

第1次，用矩阵E的第个行向量生成矩阵F的第1行，

第2次，用矩阵E的第个行向量生成矩阵F的第2行，

同理，第256次，用矩阵E的第个行向量生成矩阵F的第256行,

即这里，f_p,q代表矩阵F中的元素，p代表索引矩阵F内元素的横坐标，q代表索引矩阵F内元素的纵坐标，p和q都是自然数，1≤p≤256,1≤q≤256；

步骤8，将每个图像块转化为列向量

首先，将步骤1产生的图像块B_i中的每一个元素，按照从上到下，从左到右的顺序，依次取出，并按照从上到下的摆放顺序组成一个大小为256×1的列向量，记为

即

这里，x_j代表列向量中的元素，j是中元素的下标索引，j是自然数，1≤j≤256；i代表图像块的索引，i∈{1，2，…，N}，N代表步骤1中图像划分后图像块的总个数；

接着，将X_i中的元素依次取出，按照从上到下的顺序生成一个大小为64×1的列向量，记为

即

这里，是步骤3中产生的列索引向量，x'_j代表列向量中的元素，j是中元素的下标索引，j是自然数，1≤j≤64；i代表图像块的索引，i∈{1，2，…，N}，N代表步骤1中图像划分后图像块的总个数；

步骤9，填充向量的产生

将步骤7中产生的变换矩阵F和步骤8中产生的列向量代入传统的基于离散余弦变换的向量填充算法中，产生一个大小为192×1的填充列向量，记为

即

这里，x″_k代表列向量中的元素，k是中元素的下标索引，k是自然数，1≤k≤192；i代表图像块的索引，i∈{1，2，…，N}，N代表步骤1中图像划分后图像块的总个数；

步骤10，中间向量的产生

用步骤8中产生的列向量和步骤9中产生的列向量按照从上到下的顺序组成一个大小为256×1的列向量，记为

即

这里，y_l代表列向量中的元素，l是中元素的下标索引，l是自然数，1≤l≤256；x'_j代表步骤8中产生的列向量中的元素，j是中元素的下标索引，j是自然数，1≤j≤64；x″_k代表步骤9中产生的列向量中的元素，k是中元素的下标索引，k是自然数，1≤k≤192；i代表图像块的索引，i∈{1，2，…，N}，N代表步骤1中图像划分后图像块的总个数；

步骤11，系数向量的产生

用传统的一维离散余弦变换方法对步骤10中产生的中间向量进行离散余弦变换，得到系数向量

即

这里，z_j代表列向量中的元素，j是中元素的下标索引，j是自然数，1≤j≤256；i代表图像块的索引，i∈{1，2，…，N}，N代表步骤1中图像划分后图像块的总个数；

步骤12，系数矩阵的产生

定义大小为8×8的系数矩阵为B'_i，用的第1至8个元素按照从上到下的顺序生成B'_i的第1列；用的第9至16个元素按照从上到下的顺序生成B'_i的第2列；用的第17至24个元素按照从上到下的顺序生成B'_i的第3列；用的第25至32个元素按照从上到下的顺序生成B'_i的第4列；用的第33至40个元素按照从上到下的顺序生成B'_i的第5列；用的第41至48个元素按照从上到下的顺序生成B'_i的第6列；用的第49至56个元素按照从上到下的顺序生成B'_i的第7列；用的第57至64个元素按照从上到下的顺序生成B'_i的第8列；

即

B_{i}^{'} = [\begin{matrix} β_{1,1} & β_{1,2} & . . . & β_{1, n} \\ β_{2,1} & β_{2,2} & . . . & β_{2, n} \\ . & . & . & . \\ . & . & . & . \\ . & . & . & . \\ β_{m, 1} & β_{m, 2} & . . . & β_{m, n} \end{matrix}] = [\begin{matrix} z_{1} & z_{9} & . . . & z_{57} \\ z_{2} & z_{10} & . . . & z_{58} \\ . & . & . & . \\ . & . & . & . \\ . & . & . & . \\ z_{8} & z_{16} & . . . & z_{64} \end{matrix}],

这里，β_m,n是B'_i中的元素，m代表矩阵B'_i内元素的横坐标，n代表矩阵B'_i内元素的纵坐标，m和n是自然数，1≤m≤8，1≤n≤8；z₁，z₂，…，z₆₄代表步骤11中产生的列向量中的64个元素；i代表图像块的索引，i∈{1，2，…，N}，N代表步骤1中图像划分后图像块的总个数；

步骤13，对系数矩阵进行编码

用传统的JPEG图像压缩标准中的量化方法对步骤12中产生的系数矩阵B'_i进行量化，将量化后得到的系数矩阵，记为

这里，是中的元素，m代表矩阵内元素的横坐标，n代表矩阵内元素的纵坐标，m和n是自然数，1≤m≤8，1≤n≤8；用传统的JPEG图像压缩标准中的反量化方法对进行反量化，得到反量化后的系数矩阵B"_i，

这里，β″_m,n是B"_i中的元素，m代表矩阵B"_i内元素的横坐标，n代表矩阵B"_i内元素的纵坐标，m和n是自然数，1≤m≤8，1≤n≤8；用传统的JPEG图像压缩标准中计算编码比特数的方法计算系数矩阵B'_i的编码比特数，记为这里，i代表图像块的索引，i∈{1，2，…，N}，N代表步骤1中图像划分后图像块的总个数；

步骤14，对系数矩阵进行解码

首先，定义一个大小为16×16的全零矩阵，记为

{\hat{B}}_{i} = [\begin{matrix} 0 & 0 & . . . & 0 \\ 0 & 0 & . . . & 0 \\ . & . & . & . \\ . & . & . & . \\ . & . & . & . \\ 0 & 0 & . . . & 0 \end{matrix}];

其次，将步骤13得到的矩阵B"_i的第1列元素依次取出，并依次放入矩阵第1列的第1至8行；将矩阵B"_i的第2列元素依次取出，并依次放入矩阵第2列的第1至8行；将矩阵B"_i的第3列元素依次取出，并依次放入矩阵第3列的第1至8行；将矩阵B"_i的第4列元素依次取出，并依次放入矩阵第4列的第1至8行；将矩阵B"_i的第5列元素依次取出，并依次放入矩阵第5列的第1至8行；将矩阵B"_i的第6列元素依次取出，并依次放入矩阵第6列的第1至8行；将矩阵B"_i的第7列元素依次取出，并依次放入矩阵第7列的第1至8行；将矩阵B"_i的第8列元素依次取出，并依次放入矩阵第8列的第1至8行；将修改后的矩阵记为

这里，是中的元素，p代表矩阵内元素的横坐标，q代表矩阵内元素的纵坐标，p和q是自然数，1≤p≤16，1≤q≤16；β″_m,n是B"_i中的元素，m代表矩阵B"_i内元素的横坐标，n代表矩阵B"_i内元素的纵坐标，m和n是自然数，1≤m≤8，1≤n≤8；i代表图像块的索引，i∈{1，2，…，N}，N代表步骤1中图像划分后图像块的总个数；

最后，用传统的二维离散余弦反变换方法对矩阵进行二维离散余弦反变换，得到大小为16×16的像素矩阵，记为b_i：

这里，α_m,n是b_i中的元素，m代表矩阵b_i内元素的横坐标，n代表矩阵b_i内元素的纵坐标，m和n是自然数，1≤m≤16，1≤n≤16；i代表图像块的索引，i∈{1，2，…，N}，N代表步骤1中图像划分后图像块的总个数；

步骤15，解码像素矩阵的修正

对步骤14中产生的像素矩阵b_i，用传统的双三次插值方法对位于(u,v)位置上的像素点进行插值，得到插值后的像素矩阵，记为b'_i：

这里，u为b_i内像素点的横坐标，v为b_i内像素点的纵坐标，u和v是自然数，并且u和v不同时为奇数，1≤u≤16,1≤v≤16；α′_m,n是b'_i中的元素，m代表矩阵b'_i内元素的横坐标，n代表矩阵b'_i内元素的纵坐标，m和n是自然数，1≤m≤16，1≤n≤16；i代表图像块的索引，i∈{1，2，…，N}，N代表步骤1中图像划分后图像块的总个数；

步骤16，计算解码像素矩阵的均方误差

用传统的计算均方误差的方法计算步骤15中得到的像素矩阵b'_i与步骤1中产生的图像块B_i之间的均方误差，记为这里，i代表图像块的索引，i∈{1，2，…，N}，N代表步骤1中图像划分后图像块的总个数；

步骤17，用传统的编码方法编码原始图像块

首先，将步骤1中所产生的大小为16×16的图像块B_i，按照传统的JPEG图像压缩标准中图像分块的方法分为4个互不重叠，大小为8×8的图像块，记为

其中，

这里，是中的元素，m1代表矩阵内元素的横坐标，n1代表矩阵内元素的纵坐标，m1和n1是自然数，1≤m1≤8，1≤n1≤8；是中的元素，m2代表矩阵内元素的横坐标，n2代表矩阵内元素的纵坐标，m2和n2是自然数，1≤m2≤8，1≤n2≤8；是中的元素，m3代表矩阵内元素的横坐标，n3代表矩阵内元素的纵坐标，m3和n3是自然数，1≤m3≤8，1≤n3≤8；是中的元素，m4代表矩阵内元素的横坐标，n4代表矩阵内元素的纵坐标，m4和n4是自然数，1≤m4≤8，1≤n4≤8；i代表图像块的索引，i∈{1，2，…，N}，N代表步骤1中图像划分后图像块的总个数；

其次，对图像块使用传统的JPEG图像压缩标准中的编码方法进行编码，得到编码后的图像块，记为

这里，是中的元素，m1代表矩阵内元素的横坐标，n1代表矩阵内元素的纵坐标，m1和n1是自然数，1≤m1≤8，1≤n1≤8；

对图像块使用传统的JPEG图像压缩标准中计算编码比特数的方法计算编码比特数，记为

对图像块使用传统的JPEG图像压缩标准中的编码方法进行编码，得到编码后的图像块，记为

这里，是中的元素，m2代表矩阵内元素的横坐标，n2代表矩阵内元素的纵坐标，m2和n2是自然数，1≤m2≤8，1≤n2≤8；

这里，是中的元素，m3代表矩阵内元素的横坐标，n3代表矩阵内元素的纵坐标，m3和n3是自然数，1≤m3≤8，1≤n3≤8；

这里，是中的元素，m4代表矩阵内元素的横坐标，n4代表矩阵内元素的纵坐标，m4和n4是自然数，1≤m4≤8，1≤n4≤8；

将相加得到图像块B_i的编码比特数，记为这里，i代表图像块的索引，i∈{1，2，…，N}，N代表步骤1中图像划分后图像块的总个数；

接着，对图像块使用传统的JPEG图像压缩标准中的解码方法进行解码，得到编码后的图像块，记为

这里，是中的元素，p1代表矩阵内元素的横坐标，q1代表矩阵内元素的纵坐标，p1和q1是自然数，1≤p1≤8，1≤q1≤8；

对图像块使用传统的JPEG图像压缩标准中的解码方法进行解码，得到编码后的图像块，记为

这里，是中的元素，p2代表矩阵内元素的横坐标，q2代表矩阵内元素的纵坐标，p2和q2是自然数，1≤p2≤8，1≤q2≤8；

这里，是中的元素，p3代表矩阵内元素的横坐标，q3代表矩阵内元素的纵坐标，p3和q3是自然数，1≤p3≤8，1≤q3≤8；

这里，是中的元素，p4代表矩阵内元素的横坐标，q4代表矩阵内元素的纵坐标，p4和q4是自然数,1≤p4≤8，1≤q4≤8；

其中，i代表图像块的索引，i∈{1，2，…，N}，N代表步骤1中图像划分后图像块的总个数；

然后，将图像块按照从上到下，从左到右的顺序，组成一个大小为16×16的图像块，记为b"_i,

这里，

其中，α″_m,n是b"_i中的元素，m代表矩阵b"_i内元素的横坐标，n代表矩阵b"_i内元素的纵坐标，m和n是自然数，1≤m≤16，1≤n≤16；i代表图像块的索引，i∈{1，2，…，N}，N代表步骤1中图像划分后图像块的总个数；

最后，用传统的计算均方误差的方法计算图像块b"_i与步骤1中产生的图像块B_i之间的均方误差，记为这里，i代表图像块的索引，i∈{1，2，…，N}，N代表步骤1中图像划分后图像块的总个数；

步骤18，最优编码和解码模式的选择

首先，对步骤1产生的图像块B_i，用步骤13得到的比特数和步骤16得到均方误差相乘，将相乘的结果记为

{\cos t}_{i}^{(1)} : {\cos t}_{i}^{(1)} = {Bit}_{i}^{(1)} \times {MSE}_{i}^{(1)} .

用步骤17得到的和相乘，将相乘的结果记为

{\cos t}_{i}^{(2)} : {\cos t}_{i}^{(2)} = {Bit}_{i}^{(2)} \times {MSE}_{i}^{(2)} .

比较和的大小，如果那么选择步骤8～步骤15的编码和解码方法对步骤1中产生的图像块B_i进行编码和解码；如果那么选择步骤17的编码和解码方法对步骤1中产生的图像块B_i进行编码和解码。将解码后得到图像块，记为

这里，是中的元素，m代表矩阵内元素的横坐标，n代表矩阵内元素的纵坐标，m和n是自然数，1≤m≤16，1≤n≤16；i代表图像块的索引，i∈{1，2，…，N}，N代表步骤1中图像划分后图像块的总个数；

然后，将对图像块B_i进行编码后得到的编码比特数记为Bit_i，如果如果这里，i代表图像块的索引，i∈{1，2，…，N}，N代表步骤1中图像划分后图像块的总个数；

步骤19，重建图像

对于步骤18中产生的重建图像块采用传统的JPEG图像压缩标准中图像块合成图像的方法，产生重建图像，记为这里，i代表图像块的索引，i∈{1，2，…，N}，N代表步骤1中图像划分后图像块的总个数。

本发明的基本原理：变换域的向量填充技术可以实现变换域图像的下采样，从而有效降低图像的编码比特率，这为实现高效图像编码打下了基础。对于内部比较平滑的图像区域，利用基于变换域下采样的方法进行编码，再利用插值技术进行重建，所引起的编码失真不是特别严重，但可以大大降低编码的比特率，因此，用基于变换域下采样的方法可以实现对这类图像区域的高效编码。同时，对于内部纹理比较复杂的图像区域，传统的基于JPEG图像压缩标准的编码方法可以实现对其的高效编码。将两种编码方法相结合，对不同类型的图像区域采用不同的编码策略，可以实现对整个图像的高效编码。

本发明的实质是：为了克服传统方法中对所有图像内部区域均采用同一种编码策略的缺点，本发明通过对不同图像区域自适应地选择不同的编码模式，以提高图像内部局部区域的编码效率，从而实现整个图像的高效编码。

本发明的创新点：针对现有基于JPEG图像压缩标准的编码方法编码效率较低的问题，本发明提供了一种基于变换域下采样技术的新型编码方法以实现高效图像压缩，每个图像编码块通过自适应地选择编码模式，实现局部的最优编码，并且最终达到提高整个图像压缩效率的目的。

本发明的优点:基于变换域下采样的方法可以有效降低图像块的编码码率，同时，基于编码码率和均方误差的模式选择准则可以保证每个图像块得到最优的编码模式，最终可以提高图像的压缩效率。

附图说明

图1为本发明的实现流程；

图2为应用不同图像编码方法在相同编码码率下得到的PSNR值。

具体实施方式

本发明主要采用仿真实验的方式验证该系统模型的可行性，所有步骤都经过实验验证，为实现基于变换域下采样技术的图像压缩，具体实施步骤如下：

步骤1，图像的预处理

设定图像的宽度W＝16^m，图像的高度H＝16ⁿ，这里m和n都是自然数，按照传统的JPEG图像压缩标准中图像分块的方法划分为N＝(W×H)/16²个互不重叠的，大小为16×16的正方形图像块，记为B₁，B₂，…，B_i，…，B_N，这里，N代表图像划分后图像块的总个数，i代表图像块的索引，i∈{1，2，…，N}；

步骤2，索引矩阵的产生

步骤3，列索引向量的产生

步骤4，行索引向量的产生

步骤5，变换矩阵的产生

步骤6，调整变换矩阵的列

将步骤5中产生的变换矩阵D中的每个列向量记为

即

{\overset{&RightArrow;}{d}}_{k} = [\begin{matrix} D_{1, k} \\ D_{2, k} \\ . \\ . \\ . \\ D_{256, k} \end{matrix}],

第1次，取矩阵D的第个列向量生成矩阵E的第1列，

第2次，取矩阵D的第个列向量生成矩阵E的第2列，

同理，第256次，取矩阵D的第个列向量生成矩阵E的第256列，即

步骤7，调整变换矩阵的行

将步骤6产生的变换矩阵E中的每个行向量记为

即

第1次，用矩阵E的第个行向量生成矩阵F的第1行，

第2次，用矩阵E的第个行向量生成矩阵F的第2行，

同理，第256次，用矩阵E的第个行向量生成矩阵F的第256行,

步骤8，将每个图像块转化为列向量

即

步骤9，填充向量的产生

即

步骤10，中间向量的产生

即

步骤11，系数向量的产生

即

步骤12，系数矩阵的产生

即

B_{i}^{'} = [\begin{matrix} β_{1,1} & β_{1,2} & . . . & β_{1, n} \\ β_{2,1} & β_{2,2} & . . . & β_{2, n} \\ . & . & . & . \\ . & . & . & . \\ . & . & . & . \\ β_{m, 1} & β_{m, 2} & . . . & β_{m, n} \end{matrix}] = [\begin{matrix} z_{1} & z_{9} & . . . & z_{57} \\ z_{2} & z_{10} & . . . & z_{58} \\ . & . & . & . \\ . & . & . & . \\ . & . & . & . \\ z_{8} & z_{16} & . . . & z_{64} \end{matrix}],

步骤13，对系数矩阵进行编码

步骤14，对系数矩阵进行解码

首先，定义一个大小为16×16的全零矩阵，记为

{\hat{B}}_{i} = [\begin{matrix} 0 & 0 & . . . & 0 \\ 0 & 0 & . . . & 0 \\ . & . & . & . \\ . & . & . & . \\ . & . & . & . \\ 0 & 0 & . . . & 0 \end{matrix}];

步骤15，解码像素矩阵的修正

步骤16，计算解码像素矩阵的均方误差

步骤17，用传统的编码方法编码原始图像块

其中，

这里，

步骤18，最优编码和解码模式的选择

{\cos t}_{i}^{(1)} : {\cos t}_{i}^{(1)} = {Bit}_{i}^{(1)} \times {MSE}_{i}^{(1)} .

用步骤17得到的和相乘，将相乘的结果记为

{\cos t}_{i}^{(2)} : {\cos t}_{i}^{(2)} = {Bit}_{i}^{(2)} \times {MSE}_{i}^{(2)} .

步骤19，重建图像

将实施例应用于Lena和Barbara两幅分辨率为512×512的经典图例中，附图2是在不同的编码码率下，对不同图像应用不同的图像压缩方法进行编码和解码后得到的峰值信噪比(peak signal to noise ratio,PSNR)。很明显，本发明中的方法较现有方法有明显的性能提升。

Claims

1.一种基于变换域下采样技术的图像压缩方法，其特征是它包括以下步骤：

步骤1，图像的预处理

步骤2，索引矩阵的产生

步骤3，列索引向量的产生

步骤4，行索引向量的产生

步骤5，变换矩阵的产生

步骤6，调整变换矩阵的列

将步骤5中产生的变换矩阵D中的每个列向量记为

即

{\overset{&RightArrow;}{d}}_{k} = [\begin{matrix} D_{1, k} \\ D_{2, k} \\ \cdot \\ \cdot \\ \cdot \\ D_{256, k} \end{matrix}],

第1次，取矩阵D的第个列向量生成矩阵E的第1列，

第2次，取矩阵D的第个列向量生成矩阵E的第2列，

步骤7，调整变换矩阵的行

将步骤6产生的变换矩阵E中的每个行向量记为

即

第1次，用矩阵E的第个行向量生成矩阵F的第1行，

第2次，用矩阵E的第个行向量生成矩阵F的第2行，

同理，第256次，用矩阵E的第个行向量生成矩阵F的第256行,

步骤8，将每个图像块转化为列向量

即

步骤9，填充向量的产生

即

步骤10，中间向量的产生

即

步骤11，系数向量的产生

即

步骤12，系数矩阵的产生

即

B_{i}^{'} = [\begin{matrix} β_{1,1} & β_{1,2} & \cdot \cdot \cdot & β_{1, n} \\ β_{2,1} & β_{2,2} & \cdot \cdot \cdot & β_{2, n} \\ \cdot & \cdot & \cdot & \cdot \\ \cdot & \cdot & \cdot & \cdot \\ \cdot & \cdot & \cdot & \cdot \\ β_{m, 1} & β_{m, 2} & \cdot \cdot \cdot & β_{m, n} \end{matrix}] = [\begin{matrix} z_{1} & z_{9} & \cdot \cdot \cdot & z_{57} \\ z_{2} & z_{10} & \cdot \cdot \cdot & z_{58} \\ \cdot & \cdot & \cdot & \cdot \\ \cdot & \cdot & \cdot & \cdot \\ \cdot & \cdot & \cdot & \cdot \\ z_{8} & z_{16} & \cdot \cdot \cdot & z_{64} \end{matrix}],

步骤13，对系数矩阵进行编码

步骤14，对系数矩阵进行解码

首先，定义一个大小为16×16的全零矩阵，记为

{\hat{B}}_{i} = [\begin{matrix} 0 & 0 & \cdot \cdot \cdot & 0 \\ 0 & 0 & \cdot \cdot \cdot & 0 \\ \cdot & \cdot & \cdot & \cdot \\ \cdot & \cdot & \cdot & \cdot \\ \cdot & \cdot & \cdot & \cdot \\ 0 & 0 & \cdot \cdot \cdot & 0 \end{matrix}];

这里，是中的元素，p代表矩阵内元素的横坐标，q代表矩阵内元素的纵坐标，p和q是自然数，1≤p≤16，1≤q≤16；是B"_i中的元素，m代表矩阵B"_i内元素的横坐标，n代表矩阵B"_i内元素的纵坐标，m和n是自然数，1≤m≤8，1≤n≤8；i代表图像块的索引，i∈{1，2，…，N}，N代表步骤1中图像划分后图像块的总个数；

步骤15，解码像素矩阵的修正

步骤16，计算解码像素矩阵的均方误差

步骤17，用传统的编码方法编码原始图像块

其中，

这里，

其中，是b"_i中的元素，m代表矩阵b"_i内元素的横坐标，n代表矩阵b"_i内元素的纵坐标，m和n是自然数，1≤m≤16，1≤n≤16；i代表图像块的索引，i∈{1，2，…，N}，N代表步骤1中图像划分后图像块的总个数；

步骤18，最优编码和解码模式的选择

首先，对步骤1产生的图像块B_i，用步骤13得到的比特数和步骤16得到均方误差相乘，将相乘的结果记为用步骤17得到的和相乘，将相乘的结果记为比较和的大小，如果那么选择步骤8～步骤15的编码和解码方法对步骤1中产生的图像块B_i进行编码和解码；如果那么选择步骤17的编码和解码方法对步骤1中产生的图像块B_i进行编码和解码。将解码后得到图像块，记为

步骤19，重建图像