CN103596006A

CN103596006A - 基于视觉冗余度量的图像压缩方法

Info

Publication number: CN103596006A
Application number: CN201310647779.1A
Authority: CN
Inventors: 吴金建; 张亚中; 石光明
Original assignee: Xidian University
Current assignee: Xidian University
Priority date: 2013-12-04
Filing date: 2013-12-04
Publication date: 2014-02-19

Abstract

本发明公开了一种基于视觉冗余度量的图像压缩方法，主要解决现有图像压缩效率低的问题。其实现步骤是：（1）采用自回归模型对待压缩图像进行预测，得到预测图像；（2）根据待压缩图像和预测图像得到残差图像，并计算残差图像中各像素的局部二值模式值；（3）统计每个像素周边邻域中相同局部二值模式值出现的概率，计算待压缩图像的不确定度；（4）根据不确定度计算各像素对应的可视阈值，以对待压缩图像进行去冗余操作，得到预处理图像；（5）对预处理图像进行压缩，得到压缩图像。本发明通过可视阈值能有效去除图像中视觉冗余信息，提升了压缩效率，可用于网络视频、手机可视电话及卫星遥感图像的传输。

Description

基于视觉冗余度量的图像压缩方法

技术领域

本发明属于图像处理技术领域，特别涉及一种基于视觉冗余度量的图像压缩的方法，从而提升数据处理能力，可用于指导天宫一号、嫦娥一号等航天领域中的图像数据压缩。

技术背景

随着数字图像、数字视频处理技术的提高，数字图像已经成为了信息的主要载体，在越来越多的应用场合中被处理、传递、存储以及重构。然而，由于图像获取设备分辨率的不断提高，数字图像的数据量也迅速增长。海量数据对存储容量和传输带宽等提出了很高的要求，如何对图像进行有效压缩是亟待解决的问题。

图像压缩的目的就是把原来较大的图像用尽量少的字节表示和传输，并且要求恢复图像有较好的质量。由于数字图像数据间存在很强的相关性，并非所有的数据都携带着有用信息，因此就存在大量的冗余。数字图像压缩算法的基本原理就是去除冗余信息。常见的冗余信息可依据其产生原因分为：空间冗余、时间冗余和视觉冗余等。

目前，现有的图像压缩标准均以峰值信噪比PSNR为指导，对于空间冗余和时间冗余具有较好的压缩效果，但是该处理方法只考虑到图像失真大小，忽视了人眼视觉对图像的感知效果，对于视觉冗余很难取得很好的效果。而恰可识别失真阈值JND（本发明中称为可视阈值）能反映人类视觉系统所能察觉到的最小图像内容失真，若在图像压缩标准中加入JND模型，则能在原有的基础上更有效地去除图像中的视觉冗余信息，从而改进基于视觉感知算法的性能。当前，人们提出了很多相关的JND模型并试图将其应用于指导图像压缩。

C.-H.Chou和Y.-C.Li在文章“A perceptually tuned subband imagecoderbased on the measure of just-noticeable distortion profile,”IEEETransactions on Circuits and Systems for Video Technology,vol.5,no.6,pp.467–476,1995中推导出了一个对比度掩膜函数，进而可用于估计视觉可视阈值。尽管该对比度掩膜函数被广泛接受，但由于它只考虑了光照对比度的影响，因此高估了边缘区域的可视阈值，往往会造成图像细节信息丢失，并且低估了纹理区域的可视阈值，而不能很好的去除冗余。

图像中的结构信息对于理解图像和分析图像是至关重要的，人类视觉系统能够高度自适应的提取输入场景中的结构信息。因此，在评估掩膜效应，进而计算图像的可视阈值时，应该将该图像的结构考虑进来。研究表明，不规则的纹理区域比边缘区域包含了更多的不确定性信息和不规则结构。K.Friston在文章“The free-energy principle:a unified brain theory?”NatureReviews Neuroscience,vol.11,no.2,pp.127–138,Feb.2010中指出，人类视觉系统对输入的视觉信息进行感知时，会对其中的规则部分进行积极预测而忽略图像中的不确定性内容。由此可以看出，人类视觉系统对那些包含不确定性结构的不规则区域是不敏感的，而正是这些区域的掩膜效应十分强烈。因此，掩膜效应同时受到光照对比度和结构不确定度两个因素的影响。

然而，计算图像的结构不确定度仍然是一个开放性问题。T.Ojala等人在文章“Multiresolution gray-scaleand rotation invariant texture classification withlocal binary patterns,”IEEE Transactions on Pattern Analysis and MachineIntelligence,vol.24,no.7,pp.971–987,Jul.2002中提出了一种局部二值模式LBP算法，用于分析图像的结构信息。但是，结构信息并不等于结构不确定度。现有的方法还不能很好地计算出图像的结构不确定度，造成对可视阈值的估计不准，影响压缩效果。

发明内容

本发明目的在于针对上述已有技术中存在的缺陷和不足，提出一种基于视觉冗余度量的图像压缩方法，以准确估计图像的可视阈值，去除视觉冗余信息，从而提高图像压缩效率。

本发明的技术方案是这样实现的：

本发明的技术思路是：模拟视觉系统对视觉信息的内在推导机制，在估计图像可视阈值时，综合考虑图像的光照对比度和不确定度这两个因素，其实现步骤包括如下：

（1）输入大小为N×N的待压缩图像I，采用自回归模型对该图像I的各个像素值进行预测，得到预测图像I′；

（2）用输入待压缩图像I中各个像素的值减去预测图像I′中对应像素的值，得到预测残差图像U；

（3）计算残差图像U中第i个像素x_i的局部二值模式LBP值；

（4）对于残差图像U中每个像素x_i，统计以它为中心的周边21×21邻域中出现相同LBP值的概率p(k)；根据统计的概率计算残差图像U中每个像素x_i的不确定度H(x_i)；

（5）利用各个像素的不确定度H(x_i)，计算待压缩图像I中各个像素v_i对应的可视阈值PM(v_i)：

（5a）计算待压缩图像I的亮度对比度对可视阈值的影响量f₁(v_i)：

f_{1} (v_{1}) = 0.115 \times \frac{αE {(v_{i})}^{2.4}}{E {(v_{i})}^{2.4} + β^{2}}, i &Element; (1 ~ N^{2}),

其中，E(v_i)为待压缩图像I中像素v_i的亮度对比度值，α为非线性增长系数，取值为16，β为非线性比例控制参数，取值为26；

（5b）计算不确定度和亮度对比度对可视阈值的交互影响量f₂(v_i)：

f_{2} (v_{i}) = 1 + (1 + k_{1} \exp (- \frac{f_{1} (v_{i})}{k_{2}})) \frac{k_{3} H {(x_{i})}^{k_{4}}}{H {(x_{i})}^{2} + k_{5}^{2}},

其中，k₁为比例控制系数，取值为2.03；k₂为衰减控制参数，取值为0.19；k₃、k₄和k₅分别为数值不等的三个非线性转换中的形状控制参数，取值为k₃＝2.6、7k₄＝3.22、k₅＝1.19；

（5c）根据步骤（5a）和（5b）的结果，得到待压缩图像I中各个像素v_i对应的可视阈值PM(v_i)为：

PM(v_i)＝f₁(v_i)f₂(v_i)；

（6）根据待压缩图像I中每个像素v_i的可视阈值PM(v_i)，对待压缩图像I去除视觉冗余，得到压缩前的预处理图像Y，该预处理图像Y中的每个像素值y_i为：

y_{i} = \{\begin{matrix} v_{i} + PM (v_{i}), & v_{i} - \overset{&OverBar;}{v} < - PM (v_{i}) \\ \overset{&OverBar;}{v}, & | v_{i} - \overset{&OverBar;}{v} | \leq PM (v_{i}) \\ v_{i} - PM (v_{i}), & v_{i} - \overset{&OverBar;}{v} > PM (v_{i}) \end{matrix},

其中，为待压缩图像I的像素平均值，

（7）对预处理图像Y进行压缩，获得压缩图像。

本发明与现有技术相比，具有如下优点：

1）本发明考虑不确定度对可视阈值的影响，结合亮度对比度和不确定度，提出了计算不确定度的具体方程，能准确计算出可视阈值，从而准确度量视觉冗余；

2）本发明模拟人类视觉系统内在推导机制，考虑人类视觉系统对不确定性结构和不规则区域的掩膜效应，通过预测残差计算图像不确定度，能有效分离出视觉系统敏感和不敏感的信息；

3）本发明通过可视阈值对图像进行预处理，去除图像中视觉冗余信息，节省了码流，提升了压缩效率。

附图说明

图1是本发明的实现总流程图；

图2是本发明中获取残差图像的不确定度子流程图。

具体实施方式

参照图1，本发明的具体实现步骤如下：

步骤1，对待压缩图像I进行预测，获得预测图像I′。

（1a）输入大小为N×N的待压缩图像I，根据该待压缩图像I中各像素v_i与其周边像素v_i+j的相关程度，计算像素v_i的预测值v_i′：

{v_{i}}^{'} = Σ_{j = 1}^{21 \times 21} c_{i + j} v_{i + j} + ϵ, i &Element; (1 ~ N^{2}),

式中，v_i+j为待压缩图像I中以v_i为中心的第j个周边像素，ε为自回归模型中的高斯白噪声，c_i+j为权重系数，表示像素v_i与周边像素v_i+j的相关程度：

I(v_i,v_i+j)表示待压缩图像I中像素v_i与v_i+j之间的互信息；

（1b）用各个预测值v_i′构成预测图像I′。

步骤2，由待压缩图像I和预测图像I′得到残差图像U。

根据待压缩图像I中各个像素值v_i和预测图像I′中对应像素值v_i′，得到残差像素值：x_i＝v_i-v′_i，进而构成残差图像U。

步骤3，计算残差图像U中每个像素值x_i的不确定度H(x_i)。

参照图2，本步骤的具体实现如下：

（3a）计算残差图像U中第i个像素x_i的局部二值模式LBP值：

LBP (x_{i}) = Σ_{j = 1}^{p} s (x_{i} - x_{i + j}) 2^{j - 1},

s (x_{i} - x_{i + j}) = \{\begin{matrix} 1, x_{i} - x_{i + j} &GreaterEqual; 0 \\ 0, x_{i} - x_{i + j} < 0 \end{matrix},

其中，x_i+j是以x_i为中心的第j个周边像素，p为周边邻近像素的个数，p＝8；

（3b）对于残差图像U中每个像素值x_i，统计以它为中心的周边21×21邻域中出现相同LBP值的概率p(k)：

p (k) = \frac{1}{21 \times 21} Σ_{j = 1}^{21 \times 21} V (LBP (x_{i + j}), k),

其中，

V (LBP (x_{i + j}), k) = \{\begin{matrix} 1, LBP (x_{i + j}) = k \\ 0, LBP (x_{i + j}) &NotEqual; k \end{matrix}, k &Element; (0 ~ M - 1), M = 2^{8};

（3c）根据统计的概率p(k)计算残差图像U中每个像素x_i的不确定度H(x_i)：

H (x_{i}) = Σ_{k = 1}^{M} - p (k) \log (p (k)) .

步骤4，利用各个像素的不确定度H(x_i)，计算待压缩图像I中各个像素v_i对应的可视阈值PM(v_i)。

（4a）计算待压缩图像I的亮度对比度对可视阈值的影响量f₁(v_i)：

f_{1} (v_{1}) = 0.115 \times \frac{αE {(v_{i})}^{2.4}}{E {(v_{i})}^{2.4} + β^{2}}, i &Element; (1 ~ N^{2}),

（4b）计算不确定度H(x_i)和可视阈值的影响量f₁(v_i)对可视阈值的交互影响量f₂(v_i)：

f_{2} (v_{i}) = 1 + (1 + k_{1} \exp (- \frac{f_{1} (v_{i})}{k_{2}})) \frac{k_{3} H {(x_{i})}^{k_{4}}}{H {(x_{i})}^{2} + k_{5}^{2}},

（4c）根据步骤（4a）和（4b）的结果，得到待压缩图像I中各个像素v_i对应的可视阈值PM(v_i)为：

PM(v_i)＝f₁(v_i)f₂(v_i)。

步骤5，根据待压缩图像I中各像素v_i的可视阈值PM(v_i)，对待压缩图像I进行去冗余操作，得到预处理图像Y。

将待压缩图像I中的每个像素v_i与该图像的像素平均值

的差值进行比较：

如果差值的绝对值小于该像素v_i的可视阈值PM(v_i)，则用整幅图像的像素平均值

作为预处理图像Y中对应位置的像素值y_i；

如果v_i与

的差大于该像素的可视阈值，则用该像素值v_i减去可视阈值PM(v_i)后的值，作为预处理图像Y中对应位置的像素值y_i；

如果v_i与

的差小于该像素可视阈值的负值，则用该像素值v_i加上可视阈值PM(v_i)后的值，作为预处理图像Y中对应位置的像素值y_i；

以上三种计算预处理图像Y中各像素值y_i可以通过如下公式表示：

y_{i} = \{\begin{matrix} v_{i} + PM (v_{i}), & v_{i} - \overset{&OverBar;}{v} < - PM (v_{i}) \\ \overset{&OverBar;}{v}, & | v_{i} - \overset{&OverBar;}{v} | \leq PM (v_{i}) \\ v_{i} - PM (v_{i}), & v_{i} - \overset{&OverBar;}{v} > PM (v_{i}) \end{matrix} .

步骤6，针对步骤（5）中得到的预处理图像Y，采用目前已有的压缩标准，比如JEPG，JEPG2000，H.264，HEVC等进行压缩，获得压缩图像。该压缩图像与现有标准得到的压缩图像相比，能在保证压缩质量的同时节省码流，提高了压缩性能。

以上描述仅是本发明的一个具体实例，不构成对本发明的任何限制。显然对于本领域的专业人员来说，在了解了本发明内容和原理后，都可能在不背离本发明原理、结构的情况下，进行形式和细节上的各种修改和改变，但是这些基于本发明思想的修正和改变仍在本发明的权利要求保护范围之内。

Claims

1.一种基于视觉冗余度量的图像压缩方法，包括如下步骤：

（3）计算残差图像U中第i个像素x_i的局部二值模式LBP值；

f_{1} (v_{1}) = 0.115 \times \frac{αE {(v_{i})}^{2.4}}{E {(v_{i})}^{2.4} + β^{2}}, i &Element; (1 ~ N^{2}),

f_{2} (v_{i}) = 1 + (1 + k_{1} \exp (- \frac{f_{1} (v_{i})}{k_{2}})) \frac{k_{3} H {(x_{i})}^{k_{4}}}{H {(x_{i})}^{2} + k_{5}^{2}},

其中，k₁为比例控制系数，取值为2.03；k₂为衰减控制参数，取值为0.19；k₃、k₄和k₅分别为数值不等的三个非线性转换中的形状控制参数，取值为k₃＝2.67、k₄＝3.22、k₅＝1.19；

（5c）根据步骤（5a）和（5b）的结果，得到待压缩图像I中各个像素v_i对应的可视阈值PM(v_i)：

PM(v_i)＝f₁(v_i)f₂(v_i)；

（6）根据待压缩图像I中每个像素v_i的可视阈值PM(v_i)，对待压缩图像I去除视觉冗余，得到压缩前的预处理图像Y，该预处理图像Y中的每个像素值y_i通过如下公式计算得到：

y_{i} = \{\begin{matrix} v_{i} + PM (v_{i}), & v_{i} - \overset{&OverBar;}{v} < - PM (v_{i}) \\ \overset{&OverBar;}{v}, & | v_{i} - \overset{&OverBar;}{v} | \leq PM (v_{i}) \\ v_{i} - PM (v_{i}), & v_{i} - \overset{&OverBar;}{v} > PM (v_{i}) \end{matrix},

其中，

为待压缩图像I的像素平均值，

（7）对预处理图像Y进行压缩，获得压缩图像。

2.如权利要求1所述的方法，其步骤（1）所述的采用自回归模型对该图像I的各个像素值进行预测，是根据中心像素v_i与周边像素v_i+j的相关程度，预测中心像素的值，得到各像素的预测值v_i′：

{v_{i}}^{'} = Σ_{j = 1}^{21 \times 21} c_{i + j} v_{i + j} + ϵ,

式中，v_i+j为待压缩图像I中以v_i为中心的第j个周边像素，ε为自回归模型中的高斯白噪声，c_i+j为权重系数，表示中心像素v_i与周边像素v_i+j的相关程度：

I(v_i,v_i+j)表示待压缩图像I中像素v_i与v_i+j之间的互信息。

3.如权利要求1所述的方法，其步骤（3）所述的计算残差图像U中第i个像素x_i的局部二值模式LBP值，通过下式计算：

LBP (x_{i}) = Σ_{j + 1}^{p} s (x_{i} - x_{i + j}) 2^{j - 1},

s (x_{i} - x_{i + j}) = \{\begin{matrix} 1, x_{i} - x_{i + j} &GreaterEqual; 0 \\ 0, x_{i} - x_{i + j} < 0 \end{matrix},

其中，i的取值范围为1～N²，x_i+j是以x_i为中心的第j个周边像素，p为周边邻近像素的个数，p＝8。

4.如权利要求1所述的方法，其中步骤（4）所述的对于残差图像U中每个像素x_i，统计以它为中心的周边21×21邻域中出现相同LBP值的概率p(k)，按如下公式进行：

p (k) = \frac{1}{21 \times 21} Σ_{j = 1}^{21 \times 21} V (LBP (x_{i + j}), k),

其中，

V (LBP (x_{i + j}), k) = \{\begin{matrix} 1, LBP (x_{i + j}) = k \\ 0, LBP (x_{i + j}) &NotEqual; k \end{matrix}, k &Element; (0 ~ M - 1), M = 2^{8} .

5.如权利要求1的方法，其中步骤（4）所述的根据统计的概率计算残差图像U中每个像素x_i的不确定度H(x_i)，通过下式计算：

H (x_{i}) = Σ_{k = 1}^{M} - p (k) \log (p (k)),

其中，p(k)为残差图像U中以像素x_i为中心的周边21×21邻域中出现相同LBP值的概率。