CN102307303B

CN102307303B - 一种基于三进制表示的图像预测编码方法

Info

Publication number: CN102307303B
Application number: CN 201110246682
Authority: CN
Inventors: 李波; 周菲菲; 杨蕤
Original assignee: Beihang University
Current assignee: BEIJING CKLEADER SOFTWARE TECHNOLOGY CO., LTD.
Priority date: 2011-08-24
Filing date: 2011-08-24
Publication date: 2013-01-30
Anticipated expiration: 2031-08-24
Also published as: CN102307303A

Abstract

本发明涉及一种基于三进制表示的图像预测编码方法，尤其适合于静态图像的压缩处理。本发明对图像进行小波变换及小波系数量化，将每个小波系数用三进制数表示，扫描小波系数三进制平面；选择当前待编码符号的近邻居系数作为预测系数，针对三符号的特点，定义所述预测系数的重要性状态函数、重要性状态方向加权函数、重要性状态和函数来建立高效预测模型；根据预测模型计算得到预测值，将当前待编码符号送入对应的算术编码器进行熵编码，并在频带间对算术编码器的初始值进行重置。本发明实现了对小波系数的高效预测编码，有效提高了恢复图像的客观质量。

Description

一种基于三进制表示的图像预测编码方法

技术领域

本发明涉及一种适用于静态图像压缩的预测编码方法，尤其涉及一种利用三进制来表示小波系数，并建立相应的预测分类模型，从而提高压缩效率的小波系数预测编码方法，属于图像压缩技术领域。

背景技术

近十几年来，基于小波变换的图像压缩算法在静态图像压缩中得到广泛应用，被认为是目前压缩性能最好的方法。其压缩流程主要包括预处理、小波变换、量化、熵编码四个步骤，如图1所示。其中，熵编码根据数据出现的概率对其进行编码，能够去除数据间的统计冗余，从而用最少的数据量完成对原始图像信息的表示，是实现图像压缩的关键和保证。

常用的熵编码方法有游程编码、哈夫曼编码和算术编码。通过把其中两种熵编码方法相结合(静态图像压缩国际标准JPEG中把游程编码和哈夫曼编码结合)，或者把预测技术和熵编码相结合(简称预测编码，静态图像压缩国际标准JPEG2000中把上下文预测和算术编码结合)，能够更好地去除变换系数之间的冗余，提高熵编码的效率。

目前的小波系数预测编码方法一般是基于位平面对小波系数位数据进行组织和编码的，因为根据小波变换的基本原理，小波系数的幅值大小代表了其对恢复图像质量影响的重要程度，在给定位率下，优先编码重要系数(幅值大的系数)能够提高恢复图像的质量，但是，严格按照绝对值大小的顺序编码会增加大量的位置信息，为此引入位平面编码的思想。所谓位平面，是指将小波系数用二进制的形式来表示，此时，所有系数的相同位组成的平面就称为一个位平面。因此，位平面编码的过程，就是沿着位平面从高到低的顺序，依次扫描编码每个位平面中的所有位数据。采用这种方式，自然使得幅值较大的系数优先得到编码，从而巧妙地避免了位置信息开销。同时，在基于位平面进行编码更有利于挖掘小波系数之间的相关性，从而充分去除系数间的冗余，提高压缩效率。

在图像压缩中，图像数据的熵值是决定压缩效率最直接、最重要的因素，然而基于位平面表示的方法未能有效逼近信源的高阶条件熵，阻碍了压缩性能的进一步提高。根据统计实验，高进制表示下的小波系数对应了更小的熵值，具有更大的压缩潜力，有望进一步改善小波系数的压缩性能。然而，如果选用的进制过高，每层平面包含的信息量会很大，这一方面不利于按照率失真原则对重要信息优先编码(由于信息划分的粒度变粗)，另一方面可能会导致相关性利用不够充分(每个符号包含的信息量变大，包括那些后于当前待编码符号被扫描的系数，使得更多的预测信息无法被利用)。

基于以上分析，根据各进制表示下小波系数的熵值统计特性，三进制表示下的小波系数比位平面表示具有更小的熵值，同时其信息划分粒度比其他高进制更细。因此，本发明选择三进制来表示小波系数，给出一种基于三进制表示的小波系数预测编码方法。本发明将每个小波系数用三进制数表示，并按照压缩时的顺序扫描小波系数三进制平面；针对三符号表示的特点，建立小波系数预测模型，设计相应的算术编码方法，实现了对小波系数的高效压缩。

发明内容

针对如上所述的问题，本发明采用如下所述的技术方案：

一种基于三进制表示的图像预测编码方法，其特征在于，包括以下步骤：

步骤一：对图像进行小波变换及小波系数量化，将量化后每个小波系数用三进制数表示，得到小波系数三进制平面；对小波系数三进制平面进行扫描，得到由0、1、2组成的三符号数据流；

步骤二：选择当前待编码符号的近邻居系数作为预测系数；

根据三进制表示下符号特点，构造预测函数，包括：重要性状态函数、重要性状态方向加权函数和重要性状态和函数，反映系数间的各种相关性；

设定阈值对概率分布相似的预测函数值进行合并，建立小波系数预测模型，从而将待编码符号分为若干类，每一类对应一个预测值；将预测系数的具体取值代入到上述预测函数中，可以算出一个函数值，值域是一个有限范围内的离散值，将某些函数值合并是指不同预测系数值可算出相同的函数值，合并后的预测函数组称为预测模型；

步骤三：对于当前待编码符号，通过上述预测模型计算得到预测值，并送入相应的算术编码器进行熵编码，每当开始编码一个新的频带，就对算术编码器的初始值进行重新设置。

所述步骤二中，选择作为预测系数的近邻居系数为当前待编码符号周围相邻的8个系数N₀～N₇。

所述步骤二中，所述预测系数的重要性状态函数定义为：

S_{3} (M_{i}, p) = \{\begin{matrix} 8 & 2 \times 3^{p} \leq M_{i} \\ 4 & 3^{p} \leq M_{i} < 2 \times 3^{p} \\ 2 & 2 \times 3^{p - 1} \leq M_{i} < 3^{p} \\ 1 & 3^{p - 1} \leq M_{i} < 2 \times 3^{p - 1} \\ 0 & M_{i} < 3^{p - 1} \end{matrix}

其中，M_i表示所述预测系数N_i(0≤i≤7)的幅值，p表示当前正在编码的三进制平面层数，S₃(M_i，p)函数值表示所述预测系数在当前层平面的重要性状态值。

所述步骤二中，利用如下公式对所述重要性状态函数进行加权求和，定义重要性状态方向加权函数为：

f_{1} (M) = Σ_{i = 0}^{7} w_{i} S_{3} (M_{i}, p)

其中，w_i表示所述预测系数的权重，S₃(M_i，p)为重要性状态函数。

所述步骤二中，定义重要性状态和函数表达式为

f_{2} (M) = Σ_{i = 0}^{7} σ_{3} (M_{i})

其中，σ₃(M_i)为重要性判别函数，定义为

σ_{3} (M_{i}) = \{\begin{matrix} 1 & S_{3} (M_{i}, p) &NotEqual; 0 \\ 0 & S_{3} (M_{i}, p) = 0 \end{matrix}

其中，S₃(M_i，p)为重要性状态函数，重要性判别函数σ₃(M_i)表示了预测系数N_i(0≤i≤7)在当前层平面p是否重要。

所述步骤二中，对概率分布相似的预测函数值进行合并，构造出小波系数预测模型，其表达式定义为

pred = \{\begin{matrix} 8 & f_{1} (M) &GreaterEqual; 32 \\ 7 & f_{1} (M) &GreaterEqual; 16 \\ 6 & f_{2} (M) &GreaterEqual; 3 \\ 5 & f_{1} (M) &GreaterEqual; 8 \\ 4 & f_{2} (M) &GreaterEqual; 2 \\ 3 & f_{1} (M) &GreaterEqual; 4 \\ 2 & f_{1} (M) &GreaterEqual; 2 \\ 1 & f_{1} (M) &GreaterEqual; 1 \\ 0 & f_{1} (M) &GreaterEqual; 0 \end{matrix}

其中，f₁(M)为重要性状态方向加权函数，f₂(M)为重要性状态和函数，pred表示最终的预测值，根据不同的预测值取值，最终将小波系数三符号数据分为9类。

所述步骤三中，对算术编码器的初始值进行重新设置是指将已编码的比当前频带高一层平面低一级频带的实际频率收缩值赋值给当前频带，另外，最高层平面使用低一级频带的收缩值进行重置，最低级频带使用上一层平面的值进行重置。其中，收缩值是将所有频数值除以最小频数值得到的值。

本发明基于三进制平面表示来实现小波系数的预测编码，通过构造三进制表示下的高精度预测模型，设计相应的算术编码方法来实现对小波系数的高效压缩。实验结果表明，在相同压缩比下与基于位平面表示的静态图像压缩标准JPEG2000相比，有效提高了恢复图像的客观质量。此外，本发明所提供的预测编码方法并不局限于小波变换，同样适用于其他的多尺度变换系数的编码，并可以推广应用于其他领域的数据表示及编码。

附图说明

下面结合附图和具体实施方式对本发明作进一步的说明。

图1是基于小波变换的图像压缩方法的压缩/解压缩流程图。

图2为本发明所述的一种基于三进制表示的图像预测编码方法的基本流程图。

图3(a)所示为3级金字塔小波分解示意图，图3(b)是小波系数的三进制平面表示示意图，图3(c)给出了所选预测系数集合。

具体实施方式

本发明的基本思路在于：扫描小波系数三进制平面，并综合多个系数的预测作用建立预测模型，将待编码的小波系数三符号数据分为多类，分别送入对应的算术编码器进行编码。

下面，参照图2所示的本小波系数预测编码方法的各个实施步骤，对本发明进行详细的说明。

步骤一：对图像进行小波变换及小波系数量化，将量化后每个小波系数用三进制数表示，得到小波系数三进制平面；对小波系数三进制平面进行扫描，得到由0、1、2组成的三符号数据流。

对待压缩图像进行6级小波变换，图像压缩中小波变换相当于一个子带滤波器，对于一幅图像进行一次小波变换后得到第一级的四个频带LL₁、LH₁、HL₁和HH₁，依次对各级的低频LL_k进行分解得到更粗一级的四个频带，即小波的塔式分解，如图3(a)所示为3级小波分解示意图。对小波系数进行量化，使得压缩倍数可以满足实际应用要求。

根据各进制表示下小波系数的熵值统计特性，如表1所示，三进制表示对应了一个极小值点，与二进制表示方法相比，其熵值显著降低，大约5万bit左右；同时，相较于其他更高进制的表示方式，它层次划分的粒度更细，更符合率失真的原则。为此，本发明将每个小波系数用三进制数表示，从而得到小波系数三进制平面，如图3(b)然后按照压缩时采用的编码顺序对小波系数三进制平面进行扫描，通常可以采用Zig-zag扫描方式。

表1各进制表示下小波系数的熵值统计情况(bit)

进制	Lena图像	Barbara图像	City图像
				二进制	1459172	1588531	2117764
三进制	1409468	1533125	2050260
				四进制	1422034	1549599	2086956
五进制	1400664	1525949	2057646
				六进制	1360737	1480468	1989779
七进制	1380514	1501997	2026577
				八进制	1394885	1517309	2053100
九进制	1328246	1443209	1940238
				十进制	1337307	1454028	1958322

步骤二：选择当前待编码符号的近邻居系数作为预测系数；根据三进制表示下符号特点，构造预测系数的重要性状态函数、重要性状态方向加权函数和重要性状态和函数，反映系数间的各种相关性；设定阈值对概率分布相似的预测函数进行合并，建立小波系数预测模型，从而将待编码符号分为若干类，每一类对应一个预测值。

预测系数的选择是依据小波变换的空频局部化特性，选取与当前待编码系数相关性最强的8个近邻居系数N₀～N₇作为预测系数，如图3(c)所示。

根据所述预测系数在上层平面重要、当前层平面重要或者还未重要这三种状态以及在不同平面的取值情况，赋予所述预测系数五种不同取值，所述预测系数的重要性状态函数定义如下：

S_{3} (M_{i}, p) = \{\begin{matrix} 8 & 2 \times 3^{p} \leq M_{i} \\ 4 & 3^{p} \leq M_{i} < 2 \times 3^{p} \\ 2 & 2 \times 3^{p - 1} \leq M_{i} < 3^{p} \\ 1 & 3^{p - 1} \leq M_{i} < 2 \times 3^{p - 1} \\ 0 & M_{i} < 3^{p - 1} \end{matrix}

其中，M_i表示所述预测系数N_i(0≤i≤7)的幅值，p表示当前正在编码的三进制平面层数，S₃(M_i，p)表示所述预测系数在当前层平面的重要性状态值，S₃(M_i，p)越大表明系数N_i的重要性程度越高。

接着，定义重要性状态方向加权函数f₁(M)是M_i，0≤i≤7的线性函数，表达式为

f_{1} (M) = Σ_{i = 0}^{7} w_{i} S_{3} (M_{i}, p)

其中w_i表示对应预测系数的权重，体现预测作用的大小，S₃(M_i，p)表示预测系数在三进制平面p的重要性状态值。该函数把高维问题降为一维问题，体现了多个近邻居系数的综合预测作用。对于权重w_i的设定，主要根据预测作用的大小分配，如表2所示。对于HL频带，按照相关性由强到弱的次序是：垂直系数＞水平系数＞对角系数，按照简化区分的原则设计权重依次为4、2、1。同理可得LH频带的预测系数权重，只是水平方向系数的权重大于垂直方向。对于HH频带，由于方向性不明显，仅把权重分为2类，即水平和垂直的4个系数的权重为2，对角4个系数的权重为1。

表2近邻居预测系数权重值

预测系数	HL方向	LH方向	HH方向
				N₁，N₆	4	2	2
N₃，N₄	2	4	2
				N₀，N₂，N₅，N₇	1	1	1

接着，定义重要性状态和函数f₂(M)表达式为

f_{2} (M) = Σ_{i = 0}^{7} σ_{3} (M_{i})

其中，σ₃(M_i)为重要性判别函数，定义为

σ_{3} (M_{i}) = \{\begin{matrix} 1 & S_{3} (M_{i}, p) &NotEqual; 0 \\ 0 & S_{3} (M_{i}, p) = 0 \end{matrix}

其中，S₃(M_i，p)为重要性状态函数，重要性判别函数σ₃(M_i)表示了预测系数在当前层平面p是否重要。

为避免了上下文稀释的问题，即由于样本种类过多而数量不足所导致的学习代价过高的问题，通过对大量典型图像的统计分析，发现有些近邻居预测函数值对应的数据概率分布是相似的，可以对其进行合并。因此，本发明给出了如下预测值pred表达式

pred = \{\begin{matrix} 8 & f_{1} (M) &GreaterEqual; 32 \\ 7 & f_{1} (M) &GreaterEqual; 16 \\ 6 & f_{2} (M) &GreaterEqual; 3 \\ 5 & f_{1} (M) &GreaterEqual; 8 \\ 4 & f_{2} (M) &GreaterEqual; 2 \\ 3 & f_{1} (M) &GreaterEqual; 4 \\ 2 & f_{1} (M) &GreaterEqual; 2 \\ 1 & f_{1} (M) &GreaterEqual; 1 \\ 0 & f_{1} (M) &GreaterEqual; 0 \end{matrix}

至此，预测模型建立完毕。以上实际预测系数的选择和预测模型的建立都是通过统计大量图像数据，在离线方式下完成的。实际在线编码时，待编码符号可以根据实际预测系数的取值利用上式得到9种不同的预测值，并最终送入不同的算术编码器进行编码。

步骤三：对于当前待编码符号，通过上述小波系数预测模型计算得到预测值，根据计算出的预测值将所述当前待编码符号送入相应的算术编码器进行熵编码；当开始编码一个新的频带时，对算术编码器的初始值进行重新设置。

理论上，预测值相同的待编码符号具有相似的概率分布。然而，同一幅图像内不同区域的纹理特征存在差异，使得不同级频带对应同一个预测值的待编码符号概率分布存在较大的差异。表3给出了City图像在不同符号平面不同频带级预测值为5的类中，三符号码流对应的单位熵值(表示每一个三进制符号所需要的平均bit数)，“-”表示该平面对应频带中没有这一预测值的符号数据，或者样本数量过少没有统计意义。从中可以看出，对同一个预测值，从最低频到最高频单位熵值呈现变小的趋势，从最高平面到最低平面单位熵值逐渐变大；特别地，对角线方向的熵值具有更高的相似度，即当前平面当前频带的符号数据与比它高一层平面低一级频带的符号数据具有更相似的单位熵值，对于其它预测值也存在类似情形，而不同的单位熵值对应了不同的概率分布。

对概率分布存在差异的符号流采用同一个算术编码器编码会影响压缩效率，因为对自适应算术编码来说，只有当编码器的概率分布表和符号流的实际概率分布相同时编码效率才最高，实际符号流中如果概率分布不稳定，那么自适应算术编码器的概率更新策略会不断调整其概率分布表，从而难以达到一个稳定的概率分布。

表3City图像不同平面不同频带预测值5对应的码流单位熵值(bit)

基于上述实验结果，本发明采用以下算术编码初始值设置策略：对于预测值相同的待编码符号，编码过程中在频带间对概率估计初始值进行重置，利用已编码的比它高一层平面低一级(表中左上方向)频带的实际频率收缩值对它的概率估计值进行重置，最高层平面使用低一级频带的收缩值进行重置，最低级频带使用上一层平面的值进行重置。其中，收缩值是指将较小的频数值化为1，例如某频带实际编码中0、1、2的频数值为100∶20∶5，则收缩值为20∶4∶1。这一初始值重置策略不仅使得自适应算术编码器可以尽快适应当前频带的概率分布，同时使用收缩值而非原始值加快了其适应的速度。

本发明提供的基于三进制表示的预测编码方法能够逼近信源的高阶熵，预测模型精度高，算术编码初始值设置策略简单、有效，从而实现了小波系数的高效编码。与静态图像压缩国际标准JPEG2000的预测编码方法相比，实验结果如表4所示，在相同压缩倍数下，恢复图像客观质量均有明显提高。此外，所述方法并不局限于小波变换，同样适用于其他的多尺度变换系数的编码，并可推广应用于其他领域的数据表示和编码。

表4本发明和JPEG2000预测编码压缩性能比较(dB)

对本领域的一般技术人员而言，在不背离本发明实质精神的前提下对它所做的任何显而易见的改动，都将构成对本发明专利权的侵犯，将承担相应的法律责任。

Claims

1.一种基于三进制表示的图像预测编码方法，其特征在于，包括以下步骤：

步骤二：选择当前待编码符号的近邻居系数作为预测系数；

根据三进制表示下符号特点，构造预测函数，包括：构造预测系数的重要性状态函数、重要性状态方向加权函数和重要性状态和函数；

设定阈值对概率分布相似的预测函数值进行合并，建立小波系数预测模型，从而将待编码符号分为若干类，每一类对应一个预测值；

步骤三：对于当前待编码符号，通过上述预测模型计算得到预测值，并送入相应的算术编码器进行熵编码，每当开始编码一个新的频带，就对算术编码器的概率估计初始值进行重新设置;

所述预测系数的重要性状态函数定义为：

S_{3} (M_{i}, p) = \{\begin{matrix} 8 & 2 \times 3^{p} \leq M_{i} \\ 4 & 3^{p} \leq M_{i} < 2 \times 3^{p} \\ 2 & 2 \times 3^{p - 1} \leq M_{i} < 3^{p} \\ 1 & 3^{p - 1} \leq M_{i} < 2 \times 3^{p - 1} \\ 0 & M_{i} < 3^{p - 1} \end{matrix}

其中，M_i表示所述预测系数Ni的幅值，其中0≤i≤7,p表示当前正在编码的三进制平面层数，S₃(M_i,p)的函数值表示所述预测系数在当前层平面的重要性状态值;

f_{1} (M) = Σ_{i = 0}^{7} w_{i} S_{3} (M_{i}, p)

其中w_i表示所述预测系数的权重，S₃(M_i,p)为重要性状态函数;

所述步骤二中，定义重要性状态和函数表达式为

f_{2} (M) = Σ_{i = 0}^{7} σ_{3} (M_{i})

其中，σ₃(M_i)为重要性判别函数，定义为

σ_{3} (M_{i}) = \{\begin{matrix} 1 & S_{3} (M_{i}, p) &NotEqual; 0 \\ 0 & S_{3} (M_{i}, p) = 0 \end{matrix}

其中S₃(M_i,p)为重要性状态函数，重要性判别函数σ₃(M_i)表示了预测系数在当前层平面p是否重要。

2.如权利要求1所述的一种基于三进制表示的图像预测编码方法，其特征在于：

所述步骤二中，选择作为预测系数的近邻居系数为当前待编码符号周围相邻的8个系数N₀~N₇。

3.如权利要求1所述的一种基于三进制表示的图像预测编码方法，其特征在于：

pred = \{\begin{matrix} 8 & f_{1} (M) &GreaterEqual; 32 \\ 7 & f_{1} (M) &GreaterEqual; 16 \\ 6 & f_{2} (M) &GreaterEqual; 3 \\ 5 & f_{1} (M) &GreaterEqual; 8 \\ 4 & f_{2} (M) &GreaterEqual; 2 \\ 3 & f_{1} (M) &GreaterEqual; 4 \\ 2 & f_{1} (M) &GreaterEqual; 2 \\ 1 & f_{1} (M) &GreaterEqual; 1 \\ 0 & f_{1} (M) &GreaterEqual; 0 \end{matrix}

4.如权利要求1所述的一种基于三进制表示的图像预测编码方法，其特征在于：

所述步骤三中，对算术编码器的概率估计初始值进行重新设置是指将已编码的比当前频带高一层平面低一级频带的实际频率收缩值赋值给当前频带，最高层平面使用低一级频带的收缩值进行重置，最低级频带使用上一层平面的值进行重置；其中，收缩值是将所有频数值除以最小频数值得到的值。