CN101511020A

CN101511020A - 一种基于稀疏分解的图像压缩方法

Info

Publication number: CN101511020A
Application number: CN 200910058527
Authority: CN
Inventors: 甘涛; 何艳敏; 黄晓革; 兰刚; 周南
Original assignee: University of Electronic Science and Technology of China
Current assignee: University of Electronic Science and Technology of China
Priority date: 2009-03-06
Filing date: 2009-03-06
Publication date: 2009-08-19
Anticipated expiration: 2029-03-06
Also published as: CN101511020B

Abstract

该发明属于图像处理技术领域中的基于稀疏分解的图像压缩方法，包括对输入图像分解处理，设定各次迭代的匹配系数，筛选重要图块，确定编码块中的重要原子，联合编码处理并将其结果写入编码流中。该发明根据原子位置和投影系数幅度之间的分布规律、进行综合处理，并按原子的投影系数幅度排序；大大减少了用于表示原子位置和投影系数的比特数，获得了与标准方法相当、甚至更好的率－失真性能，同时获得了更好的主观质量，加之生成的码流是嵌入式的，支持渐进质量传输和无极分辨率伸缩，因而，本发明具有图像压缩处理的率－失真性能及渐进传输性能好，更适合网络应用等特点。

Description

一种基于稀疏分解的图像压缩方法

技术领域

本发明属于图像处理技术领域中的图像数据压缩方法，具体地说是一种基于图像稀疏分解的压缩方法。该方法可应用于高压缩比的情况下图像的存储和传输等。

背景技术

随着计算机网络和通信的高速发展，目前数字图像成为最为重要的多媒体信息存储与传输形式。而常规数字图像的数据庞大，如果将原始图像直接存储和传输，无疑会给有限的存储器容量和通信线路带宽带来巨大的压力。因此，为了使得图像通信成为可能并最大限度地降低通信费用，必须采用有效的压缩手段将图像数据进行压缩后再进行存储和传输。图像压缩处理(编码)技术就是在保证图像质量的前提下，用尽可能少的比特数来表示图像信息的技术。目前作为主流的基于小波(wavelet)等正交线性变换的处理(编码)技术(如JPEG2000图像压缩国际标准)已发展到了成熟阶段。它们的成功，一方面借助于正交变换的优良特性，另一方面，在更大程度上归功于学者们对变换系数性质的深入研究和众多高效编码处理方法的提出。然而近来的研究表明，小波分析在处理一维信号时表现出的优异性能并不能简单地推广到二维和多维，对图像的边缘、轮廓等二维几何特征，小波分解并不能达到理想的精简或稀疏(sparse)图像表征。

近年来，稀疏逼近(sparse approximation)处理方法已成为信号表示的一个新的研究热点。其基本思想是用冗余函数系统(原子库)取代传统的正交基函数，并从中找到具有最佳线性组合的M项原子来表示一个信号。在该类稀疏分解方法中，匹配追踪(Matching Pursuit，简称MP)因其原理简单，已在信号的压缩、处理等多个领域得到了应用。特别是基于几何原子库的MP分解方法，在图像和视频信号的压缩处理中已表现出较传统方法更优的性能。

MP过程是以迭代的方式在整个原子库中搜索并提取与当前信号最为匹配的结构或原子，这个过程又称为全局搜索匹配追踪(Full Search Matching Pursuit，简称FSMP)。由于原子库是针对图像几何特征设计的且具有冗余性，MP分解能够获得比正交分解、如小波分解，更稀疏的图像表示，将更有利于图像编码处理。以目前处于领先地位的基于冗余表征的低码率高灵活性图像编码处理方法(Low-rate and Flexible image Coding with Redundant Representations，以下简称LFCRR)为例：该方法运用基于冗余几何原子库的FSMP对图像进行分解，再将分解原子按其投影系数幅度从大到小的顺序进行，克服了小波振铃(ringing)效应，获得了更好的主观质量；同时，为了便于网络的应用，LFCRR还提供了较传统方法更灵活的质量和分辨率的可伸缩性能(scalability)，即允许解码方对同一个编码流进行在不同位置处的截短，以获得不同质量或分辨率的恢复图像，这使得该方法成为很有发展潜力的图像压缩方法。但该方法由于在进行图像压缩处理时是单纯将分解原子按其投影系数幅度从大到小的顺序进行，而未考虑及利用原子位置和投影系数幅度之间的空间分布规律，因而存在压缩效率低，在中码率如0.25bpp到0.5bpp段，其率-失真(Rate-Distortion)性能还远低于传统小波编码方法，以及由于编码处理是为某特定码率设计的非嵌入式码流，在截断点存在性能损失，影响在网络中的渐进传输性能等缺陷。

发明内容

本发明的目的是针对背景技术存在的缺陷，根据原子位置和投影系数幅度之间的空间分布规律改进设计一种基于稀疏分解的图像压缩方法，以达到在保持现有技术特点的基础上，有效提高图像压缩处理的率-失真性能及渐进传输性能等目的。

本发明的技术方案是：根据分析、总结出的原子位置和投影系数幅度之间的空间分布规律，即原子空间位置呈现总体聚集而局部稀疏的分布，且在局部范围内不同原子对应的投影系数幅度差别较大。本发明运用基于冗余几何原子库的FSMP对图像进行分解，将分解后组合成的原子图均匀划分为四块，通过设定的递减的匹配系数(即设定的投影系数幅度)，将各原子图块中原子的投影系数幅度与对应的匹配系数比较，每次筛选出含有大于匹配系数原子的图块，作为相对于当前匹配系数的重要块，再对各重要块进行块划分，直至划分到设定的最小图块，并将该次筛选所得各最小图块作为此轮迭代的编码块；再将编码块中大于当前匹配系数的原子作为重要原子，对各重要原子的参数和投影系数进行联合编码处理；而对每次筛选后遗留下的其余图块(此轮非重要块)则进入下一轮再次进行迭代处理，进一步筛选出相对的重要块，反复进行筛选直至达到设定的最小图块，最后将编码处理结果均写入编码流中。从而大大减少了用于表示原子位置和投影系数的比特数，显著地提高了编码的率-失真性能；同时，因为是将原子按其投影系数幅度从大到小排序的，且整个处理不是针对某特定目标码率而设计的，生成的码流是嵌入式的，又克服了非嵌入式码流在截断点存在性能损失的缺陷，更适合网络应用。因此，本发明方法包括：

A.图像分解处理：首先采用匹配追踪方法对输入图像进行处理，即在原子库中搜索与当前图像最匹配的一组原子，将图像分解成由该组原子组合成的原子图，并将其均匀划分为四个图块；

B.设定匹配系数：根据步骤A所得原子图中原子的最大投影系数幅度，按递减的方式设定与各轮次迭代对应的匹配系数；

C.筛选重要图块：首先将从原子图划分出的各图块中原子的投影系数与对应的匹配系数比较，将含有大于匹配系数原子的图块作为该次筛选出的重要图块，并判断其是否为编码块；若是，则直接转步骤D；若不是，则继续将该次筛选所得各重要图块均匀划分为四块，再按步骤C进行第二次筛选重要图块；反复循环筛选，直至筛选出编码块；各次筛选遗留下的其余图块则在当轮迭代完成后再按步骤C进行新一轮迭代处理；

D.确定重要原子：将步骤C所得编码块中大于当前匹配系数的原子作为重要原子；

E.编码处理：采用基于上下文的自适应算术编码方法对步骤D所得各重要原子的参数和投影系数进行联合编码处理，并将其结果写入编码流中。

上述对输入图像的处理，首先将输入图像除去均值后再利用匹配追踪方法对其进行处理；而所述匹配追踪方法为基于冗余几何原子库的全局搜索匹配追踪方法。在步骤2中所述设定与各轮次迭代对应的匹配系数，其初始匹配系数范围为小于原子图中原子的最大投影系数幅度、而大于最大投影系数幅度的0.5倍；此后各迭代轮次的匹配系数为前一迭代轮匹配系数的0.5-0.85倍。

本发明根据原子位置和投影系数幅度之间的空间分布规律，并将两者进行有效的组织和联合处理，在编码效率上较现有的技术有了显著的提高，大大减少了用于表示原子位置和投影系数的比特数，获得了与当代先进的方法如JPEG2000和SPIHT相当甚至更好的率失真性能，并获得了更好的主观质量；同时，由于将原子按其投影系数幅度从大到小排序，生成的码流是嵌入式的，支持渐进质量传输和无极分辨率伸缩，又克服了非嵌入式码流在截断点存在性能损失的缺陷。因而，本发明具有图像压缩处理的率-失真性能及渐进传输性能好，更利于网络应用等特点。

附图说明

图1为本发明方法流程示意图(方框图)；

图2为小波编码的JPEG2000标准及SPIHT标准方法和背景技术LFCRR方法与本发明方法的率-失真性能曲线对比示意图(率-失真性能坐标图)；

图3为Cameraman(摄影师)原始图像；

图4、图5、图6、图7分别为对图3在压缩比为32倍时，采用SPIHT标准及JPEG2000标准小波编码方法和背景技术LFCRR方法与本发明方法处理后恢复图像的效果对比图(灰度图)。

具体实施方式

以图像标准为256×256的Cameraman(摄影师)灰度图像作为输入的原始图像为例；结果中的客观质量评价采用峰值信噪比(Peak Signal-to-Noise Ratio，PSNR)，其表达式为：

PSNR = 10 \lg \frac{f_{p - p}^{2}}{MSE},

其中f_p-p为原始图像信号的峰—峰值，这里取为255；MSE为均方误差(MeanSquared Error)表达式为：

MSE = \frac{Σ_{i = 1}^{M} Σ_{j = 1}^{N} {(f_{i, j} - f_{i, j}^{'})}^{2}}{256 \times 256},

其中，f_i，j、

分别表示原始图像和恢复图像在(i，j)位置处的像素值。

本实施方法中匹配追踪所使用的冗余原子库是由母函数通过几何变换形成的。这里取两种母函数，由平滑函数φ_s和小波函数ψ_s构造而成，即g₁(x，y)＝φ_s(x)φ_s(y)和g₂(x，y)＝ψ_s(x)φ_s(y)。g₁(x，y)各向平滑，适合表示图像低频区域；g₂(x，y)有类似边缘的形状，即在一个方向上平滑而在与之垂直的方向上变化较大，适合表示图像中的轮廓和边缘等奇异性特征；由于高斯函数具有较好的时频局域化特点，本实施方法分别选用归一化的高斯函数和其二阶导数(也被称为墨西哥草帽小波)作为母函数φ_s和ψ_s，它们可表达为

g_{1} (x, y) = \frac{1}{\sqrt{π}} e^{- (x^{2} + y^{2})}

g_{2} (x, y) = \frac{2}{\sqrt{3 π}} ({4 x}^{2} - 2) e^{- (x^{2} + y^{2})}

冗余原子库

通过对两母函数的平移、拉伸、旋转变换而形成，这些变换用以下的算子来表示：

·平移：

u_{b} g (x) = g (x - b)

·拉伸：

u_{a} g_{1} (x) = \frac{1}{\sqrt{a_{1} a_{2}}} g (\frac{x}{a_{1}}, \frac{y}{a_{2}})

·旋转：

u_{θ} g (x) = g (r_{θ} x)

其中

r_{θ} = [\begin{matrix} \cos θ & \sin θ \\ - \sin θ & \cos θ \end{matrix}]

这样，相对于固定的母函数，库原子g_γ由三元组γ＝(b，θ，a)唯一确定，其中b＝(b₁，b₂)^T为平移(位置)参数，θ为旋转参数，a＝(a₁，a₂)^T为拉伸参数。为了描述方便，本实施方法将由g₁生成的原子称为高斯—高斯(GG)原子，而由g₂生成的原子称为小波—高斯(WG)原子。原子库的参数采取如下的量化方案，在逼近质量和复杂度两方面取得折中；

·位置参数b：对两类原子实施相同的量化，使b可覆盖整个图像区域；

·旋转参数θ：只对WG原子有效，θ可取18个不同的角度，θ＝iπ/18，i＝0，1，...，17；

·拉伸参数a：对WG原子，a₁≤a₂，表现出各向异性；而对GG原子，a₁＝a₂，表现出各向同性。参数的取值满足a_k＝2^i/3，其中k＝1，2，对WG原子i取[0，15]区间的整数，对GG原子i取[9，18]区间的整数；

本实施方式的具体实现过程如下：

A.对图像进行匹配追踪分解处理

首先将输入的Cameraman(摄影师)图像灰度值减去图像均值118.72，再采用基于冗余几何原子库的常规全局搜索匹配追踪方法对图像进行分解，即从原子库中逐一选出与图像最为匹配的原子；在每一次迭代中，先计算当前残余图像在每一个库原子上的投影，然后选择出投影系数幅度最大的原子并把它从残余图像中剔除；如此迭代，直到达到规定的迭代次数2000；再将上述分解得到的原子图均匀划分为四个图块，并将其分别记作B₁、B₂、B₃和B₄(角标表示本次筛选出的重要块的位置编号)，将B₁-B₄四个块作为初始块添加到链表L中；

B.设定匹配系数

根据本实施方法原子图中原子的投影系数幅度最大值8103.41，按0.8倍的递减幅度依次设定21个匹配系数：4096.00，3276.80，2621.44，2097.15，1677.72，1342.18，1073.74，858.99，687.19，549.76，439.80，351.84，281.47，225.18，180.14，144.12，115.29，92.23，73.79，59.03和47.22；

C.筛选重要块

第一轮迭代：从链表L中依次取出B₁-B₄各图块，经测试得到其中B₂和B₃含有投影系数幅度大于当前匹配系数4096.00的原子，即B2和B3为此次筛选出的重要块，但不是编码块；再将B₂和B₃分别均分为四个图块继续筛选，又经4次筛选、得到两个编码块，即得左上角坐标为(144，72)和(40，192)，大小为8个像素的编码块B_2-2-3-1-3和B_3-2-1-3-2(角标依次为每次筛选出的重要块的位置编号)；每次筛选遗留下的块存入链表L中，送入下一轮迭代处理；

D.确定重要原子

在第一轮迭代中，从编码块B_2-2-3-1-3和B_3-2-1-3-2中各确定了1个重要原子，即一个拉伸参数为a₁＝a₂＝2^17/3，位置参数为(145，78)的GG原子和另一个拉伸参数为a₁＝a₂＝2^18/3，位置参数为(43，196)的GG原子；按上述方法在以后的各轮迭代中确定的重要原子数目分别为3，1，2，6，4，8，9，13，20，26，34，39，54，71，81，132，156，195，232和305个；

E.对重要原子进行编码处理

采用基于上下文的自适应算术编码方法对步骤D所得各重要原子的参数和投影系数进行编码处理，初始化时，对编码的各类符号按照其变化范围设置符号表和独立的上下文，将其初始符号概率都设置成均匀分布；由于在块划分过程中已将编码限定到了大小为8个像素的编码块，所以对原子位置参数，只需考虑编码块内的相对位置，这样，位置参数的动态范围便由原来的0-256缩小到了0-8，编码效率大为提高。编码处理的具体方法为：首先设置原子参数、投影系数符号及投影系数幅度的上下文，然后分别对其进行标准的算术编码，并依次将其编码结果写入编码流中。

表1 为本实施方式与LFCRR方法对Cameraman(摄影师)图像处理后，输出码流的比特分配结果的比较：

表中显示：在LFCRR方法中，用于表示原子位置参数和投影系数的比特数占到码流的大部分，而在本实施方法中，这两部分码率得到了显著的降低，特别是位置参数部分；如对800个原子的分解，其总体码率下降26.75％，这个优势随原子数目(或编码率)的增加而越发显著。

附图2显示了本实施方法与LFCRR及当前先进的小波压缩方法JPEG2000和SPIHT的率-失真性能比较：同样是基于匹配追踪分解的方法，本实施方法的性能比LFCRR有大幅度的提高，随着编码率的提高，其优势更明显；如本实施方法的峰值信噪比在0.0625bpp时较LFCRR高出0.58dB，而在0.5bpp时高出1.59dB；同时本实施方法获得了与JPEG2000和SPIHT相当或更好的客观质量。

图4、图5、图6、图7分别为对图3在压缩比为32倍(码率为0.25bpp)时，采用SPIHT标准及JPEG2000标准小波编码方法和背景技术LFCRR方法与本发明方法处理后的恢复图像的效果对比图(灰度图)；可以清楚看出，采用本实施方法没有出现类似于小波的恼人的振铃现象，其主观效果好于JPEG2000和SPIHT，特别是在图像的边缘轮廓的几何特征上；由于对原子参数和投影系数的编码效率得到明显提高，与LFCRR方法相比，本实施方法在相同码率下获得了更多的恢复原子，从而得到了更好的图像主观质量。

Claims

1、一种基于稀疏分解的图像压缩方法，该方法包括：

2、按权利要求1所述基于稀疏分解的图像压缩方法，其特征在于所述对输入图像的处理为首先将输入图像除去均值后再利用匹配追踪方法对其进行处理；而所述匹配追踪方法为基于冗余几何原子库的全局搜索匹配追踪方法。

3、按权利要求1所述基于稀疏分解的图像压缩方法，其特征在于所述设定与各轮次迭代对应的匹配系数，其初始匹配系数范围为小于原子图中原子的最大投影系数幅度、而大于最大投影系数幅度的0.5倍；此后各迭代轮次的匹配系数为前一迭代轮匹配系数的0.5-0.85倍。