CN106612436A

CN106612436A - 一种基于dct变换下的视觉感知修正图像压缩方法

Info

Publication number: CN106612436A
Application number: CN201610058825.8A
Authority: CN
Inventors: 范勇; 胡成华
Original assignee: Sichuan Yonglian Information Technology Co Ltd
Current assignee: Sichuan Yonglian Information Technology Co Ltd
Priority date: 2016-01-28
Filing date: 2016-01-28
Publication date: 2017-05-03

Abstract

本发明提出了一种基于DCT变换下的视觉感知修正图像压缩方法，该方法用于图像的有损压缩，首先图像经过域空间变换，转化为Ycrcb格式，然后将图像分解成8*8大小的图像子块，对每一个图像子块进行DCT变化，在每一个子块的DCT系数中，系数通过判定方法进行处理分解成高频系数和低频系数，高频系数采用误差补偿机制，低频系数进行视觉感知修正变换，然后在进入编码；重构图像的过程为压缩过程的逆运算。通过该方法，图像不仅获得了更高的压缩比，而且并未因为增加计算量而降低图像的压缩效率。同时，对重建后的图像进行分析，图像还原程度增加，信噪比增强，图像的还原质量得到显著提升。因此，该发明具有很强的实用性。

Description

一种基于DCT变换下的视觉感知修正图像压缩方法

所属领域

本发明涉及计算机信息技术领域，具体地涉及图像压缩领域。

背景技术

现今是网络信息时代，图像信息利用网络进行传输已经逐渐占据主导地位，随着使用者对图像质量的要求越来越高，图像的传输压力越来越大，虽然在硬件方面不断进行改进，但是也无法及时满足使用者的需求，所以研究图像的压缩方法也是当今电子信息技术的一项重大课题。在压缩过程中，为了实现更高的压缩效率，我们常常采用有损压缩方式，DCT变化(离散余弦变换)作为一种性能较高的编码方法，能够得到更高的压缩比，但是图像重建后，与原图像误差较大；所以本发明在DCT变换的基础上，设计了高频系数选择机制、引入视觉感知修正量化手段，在不大量增加计算复杂度的情况下，实现高压缩比、高效率，高还原性的图像压缩方法。

发明内容

针对上述不足之处，本发明要解决的技术问题是现有技术下图像压缩后与原图像误差较大，且计算复杂度高从而导致压缩时间长的问题。因此本发明提供一种基于DCT变换下的视觉感知修正图像压缩方法解决上述问题。

本发明所采用的技术方案是：一种基于DCT变换下的视觉感知修正图像压缩方法。该方案首先：将图像经过域空间变换，转化为Ycrcb格式；然后将图像分解成8*8大小的图像子块，对每一个图像子块进行DCT变化；在每一个子块的DCT系数中，系数通过判定方法进行处理分解成高频系数和低频系数，高频系数采用误差补偿机制，低频系数进行视觉感知修正变换；然后进入编码程序；最后重构图像，过程为压缩过程的逆运算。

本发明的有益效果是：本发明较传统的DCT变换，建立高频系数修正和引入了人眼视觉特性，先根据方差大小和边缘信息对变换系数进行自适应调整，保留低频区域的部分系数，然后按照阈值法再去除一些保留的低频系数，量化时在一定范围内引起的图像变换域频谱系数的量化误差不能为人眼所觉，图像不仅获得了更高的压缩比，而且并未因为增加计算量而降低图像的压缩效率；同时，对重建后的图像进行分析，图像还原程度增加，信噪比增强，图像的还原质量得到显著提升。

附图说明

图1表示本发明的详细流程图

图2表示图像转换到三基色空间的示例图

图3表示DCT变换后，能量集中于左上的示例图

图4表示解码(解压)示例图

具体实施方式

本发明用于图像的有损压缩，首先图像经过域空间变换，转化为Ycrcb格式，然后将图像分解成8*8大小的图像子块，对每一个图像子块进行DCT变化，在每一个子块的DCT系数中，系数通过判定方法进行处理分解成高频系数和低频系数，高频系数采用误差补偿机制，低频系数进行视觉感知修正变换，然后在进入编码；重构图像的过程为压缩过程的逆运算。

一种基于DCT变换下的视觉感知修正图像压缩方法，结合图1，该发明的执行步骤如下：

步骤一：图像由RGB空间转化为YCrCb三基色空间，分解为三幅(Y，Cr，Cb)能量图；

步骤二：能量图按照像素分割为8*8大小的图像子块；

步骤三：对每一个图像子块进行DCT变换；

步骤四：按照指定的DCT筛选方法，筛选DCT系数，重构DCT系数矩阵；

步骤五：重构后的DCT系数矩阵，按照视觉感知修正方法进行量化处理；

步骤六：量化后的系数进行SPIHT编码，输出压缩数据；

步骤七：解码(解压)，解码过程为压缩过程的逆运算，补全DCT系数再进行DT逆变换。

下面，结合图1到图4对本发明详细描述。

一、图像转化和分解

由于RGB颜色空间在显示时候受显示设备的影响较大，所以在进行压缩前将RGB图像转化到不受干扰的YCrCb色空间，然后在分解为3个基色分量对应的亮度图，结合图2示例图，设图像为F(x,y)，则变化分解后记为F_Y(x，y)、F_cr(x，y)、F_cb(x，y)，

YCrCb色空间的正变化为：

正变换(用于图像压缩过程)：式(1)

逆变换(用于解码过程)：式(2)

二、DCT变化

图像经过域空间变换后，表示为三基色分量，F_Y(x，y)、F_cr(x，y)、F_cb(x，y)；由于对整幅图像进行DCT变化的话，图像误差极大，所以先将每个基色图分割为8*8大小的图像子块，图像自子块的大小影响图像重构的质量。然后对每一个8*8的图像子块进行二维DCT变换，二维DCT解析式如下表示，以三基色中F_Y进行表述：

式(3)

式中，x,y,u,v＝0,1,…,N-1。

由于图像分割为8*8，所以式中N＝8，所以

式(4)

式中，x,y,u,v＝0,1,…,N-1。

图像经过DCT变换后得到的是一个DCT系数矩阵，由于图像能量多集中于左上部分，即图像的背景部分如图3所示，所以在编码过程中，左上部分的系数有较大价值。而右下部分的数据较小，与左上相比，趋于0，其表示的细节纹理部分，如果全部舍弃，则会造成图像还原后细节部分失真过大，但是保留下来的话，又会造成数据冗余，不利于编码，所以如何处理高频区域的系数也是关系到压缩和重建的重要因素。

三、DCT系数的分域和取舍

经过DCT变换后，每一个8*8图像子块得到一个8*8的DCT变换系数矩阵，由于DCT变换将能量集中到了左上部分，系数值比较大。而其他的系数较小或者趋近于0，但是这些趋近于0的系数却是用来体现图像细节纹理的参数，如果系数一并取0，虽然能得到很好的压缩比，但是在重建的图像中，失去了部分细节的描述，图像还原质量不高，所以在系数取舍上，本发明制定以下筛选策略：

设D＝{d₁，d₂，···，d_n}是8*8DCT变换后的系数集，Q＝{d_j}，设定一个参量u:

式(5)

按从左至右的顺序扫描系数，按以下方式判定：

如果abs(d_i)≥u，则d_i＝d_j进入低频区域系数集合Q；(j，i≤n)；

如果则d_i＝0.75u＝d_j,d_j进入低频区域系数集合Q；(j，i≤n)

如果则d_i＝0.5u＝d_j，d_j进入低频区域系数集合Q；(j，i≤n)

如果则d_i＝0＝d_j，d_j进入低频区域系数集合Q；(j，i≤n)

经过以上计算，DCT变换后的系数绝大部分被舍弃，只留下能被人眼感知的细节部分，极大的减少了编码数据。此时图像表示为F`_Y(x，y)等价于{Q_j}。

四、视觉感知修正

DCT系数经过调整后得到{Q_j}，可以用来等价描述F_Y(x，y)变换后的图像F`_Y(x，y)，{Q_j}是描述DCT变换后低频区域的系数，图像的主要信息集中在这里，

图像的信噪比可描述为：

式(6)

均方误差描述为：

式(7)

由式6结合式7，定义视觉修正感知系数为：

式(8)

其中T_x，T_y为对角矩阵，e为给定的系数分布向量，由式8可求得

所以，令(T_xe，T_ye)＝T，在编码前，DCT变换系数集{Q_j}，先乘以T，得到视觉感知修正后的DCT系数集TQ，再对TQ进行编码。

五、编码和解压

对TQ编码，采用SPIHT算法，对经过处理的DCT系数矩阵进行编码，输出码流。图像的解压过程为压缩过程的逆过程，结合图4解码示例图：首先读取码流，在码流中消去视觉感知系数(T_xe T_ye)，然后按照压缩过程中系数的取舍式5逆运算重构DCT系数，此时变换的系数就由新的系数所代替，空缺的位置由0补足，重构出三基色分量，F_Y(x，y)、F_cr(x，y)、F_cb(x，y)的三个能量图，再将三基色图按照下式合成图像F`(x,y)

上述结合附图对本发明的实施例作了详细描述，应该理解上述只是示例性的，因此，本发明的保护范围应当由所附的权利要求书的内容确定。

Claims

1.一种基于DCT变换下的视觉感知修正图像压缩方法，该方法涉及计算机信息技术领域，具体地涉及图像压缩领域，其特征是：本方法的实施步骤如下：

步骤一：图像由RGB空间转化为YCrCb三基色空间，分解为三幅（Y，Cr，Cb）能量图；

步骤二：能量图按照像素分割为8*8大小的图像子块；

步骤三：对每一个图像子块进行DCT变换；

步骤六：量化后的系数进行SPIHT编码，输出压缩数据；

步骤七：解码（解压），解码过程为压缩过程的逆运算，补全DCT系数在进行DT逆变换。

2.按照权利要求1所述的一种基于DCT变换下的视觉感知修正图像压缩方法，其特征是：步骤一中，RGB转换为YCrCb的转换系数为：正变换：

。

3.按照权利要求1所述的一种基于DCT变换下的视觉感知修正图像压缩方法，其特征是：步骤四中，DCT系数的筛选和重构方法如下：

设D={，，···，}是8*8DCT变换后的系数集，Q={}，设定一个参量u:

式（5）

按从左至右的顺序扫描系数，按以下方式判定：

如果abs（）u，则=进入低频区域系数集合Q；（j，in）；

如果 u abs（）<u，则=0.75u=，进入低频区域系数集合Q；（j，in）；

如果 u abs（）u，则=0.5u=进入低频区域系数集合Q；（j，in）；

如果abs（）,则，进入低频区域系数集合Q；（j，in）；

经过以上计算，DCT变换后的系数绝大部分被舍弃，只留下能被人眼感知的细节部分，极大的减少了编码数据，此时图像表示为等价于{ }。

4.按照权利要求1所述的一种基于DCT变换下的视觉感知修正图像压缩方法，其特征是：步骤五中，视觉感知修正系数建立方法如下：

图像的信噪比可描述为：

PSNR=10l 式（6）

均方误差描述为：

MSE =x,y)

= 式（7）

由式6结合式7，定义视觉修正感知系数为：

=)* （

式（8）

），

）；

令，T在本方法中称为“视觉修正矩阵”，在编码前，DCT变换系数集{}，先乘以，得到视觉感知修正后的DCT系数集TQ，再对TQ进行编码。

5.按照权利要求1所述的一种基于DCT变换下的视觉感知修正图像压缩方法，其特征是：步骤七中，解码重建图像时，先进行SPIHT算法的逆过程，计算出TQ码流，在码流中消去T修正量，然后还原8*8DCT系数矩阵，空白处用0补足，在进行DCT变换的逆过程合成三基色能量图，再将三基色图按照下式合成图像F`（x,y），其中逆变换系数为：逆变换：

。