CN106612436A - 一种基于dct变换下的视觉感知修正图像压缩方法 - Google Patents
一种基于dct变换下的视觉感知修正图像压缩方法 Download PDFInfo
- Publication number
- CN106612436A CN106612436A CN201610058825.8A CN201610058825A CN106612436A CN 106612436 A CN106612436 A CN 106612436A CN 201610058825 A CN201610058825 A CN 201610058825A CN 106612436 A CN106612436 A CN 106612436A
- Authority
- CN
- China
- Prior art keywords
- coefficient
- image
- dct
- dct transform
- perceptible
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/625—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using discrete cosine transform [DCT]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Discrete Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Image Processing (AREA)
Abstract
本发明提出了一种基于DCT变换下的视觉感知修正图像压缩方法,该方法用于图像的有损压缩,首先图像经过域空间变换,转化为Ycrcb格式,然后将图像分解成8*8大小的图像子块,对每一个图像子块进行DCT变化,在每一个子块的DCT系数中,系数通过判定方法进行处理分解成高频系数和低频系数,高频系数采用误差补偿机制,低频系数进行视觉感知修正变换,然后在进入编码;重构图像的过程为压缩过程的逆运算。通过该方法,图像不仅获得了更高的压缩比,而且并未因为增加计算量而降低图像的压缩效率。同时,对重建后的图像进行分析,图像还原程度增加,信噪比增强,图像的还原质量得到显著提升。因此,该发明具有很强的实用性。
Description
所属领域
本发明涉及计算机信息技术领域,具体地涉及图像压缩领域。
背景技术
现今是网络信息时代,图像信息利用网络进行传输已经逐渐占据主导地位,随着使用者对图像质量的要求越来越高,图像的传输压力越来越大,虽然在硬件方面不断进行改进,但是也无法及时满足使用者的需求,所以研究图像的压缩方法也是当今电子信息技术的一项重大课题。在压缩过程中,为了实现更高的压缩效率,我们常常采用有损压缩方式,DCT变化(离散余弦变换)作为一种性能较高的编码方法,能够得到更高的压缩比,但是图像重建后,与原图像误差较大;所以本发明在DCT变换的基础上,设计了高频系数选择机制、引入视觉感知修正量化手段,在不大量增加计算复杂度的情况下,实现高压缩比、高效率,高还原性的图像压缩方法。
发明内容
针对上述不足之处,本发明要解决的技术问题是现有技术下图像压缩后与原图像误差较大,且计算复杂度高从而导致压缩时间长的问题。因此本发明提供一种基于DCT变换下的视觉感知修正图像压缩方法解决上述问题。
本发明所采用的技术方案是:一种基于DCT变换下的视觉感知修正图像压缩方法。该方案首先:将图像经过域空间变换,转化为Ycrcb格式;然后将图像分解成8*8大小的图像子块,对每一个图像子块进行DCT变化;在每一个子块的DCT系数中,系数通过判定方法进行处理分解成高频系数和低频系数,高频系数采用误差补偿机制,低频系数进行视觉感知修正变换;然后进入编码程序;最后重构图像,过程为压缩过程的逆运算。
本发明的有益效果是:本发明较传统的DCT变换,建立高频系数修正和引入了人眼视觉特性,先根据方差大小和边缘信息对变换系数进行自适应调整,保留低频区域的部分系数,然后按照阈值法再去除一些保留的低频系数,量化时在一定范围内引起的图像变换域频谱系数的量化误差不能为人眼所觉,图像不仅获得了更高的压缩比,而且并未因为增加计算量而降低图像的压缩效率;同时,对重建后的图像进行分析,图像还原程度增加,信噪比增强,图像的还原质量得到显著提升。
附图说明
图1表示本发明的详细流程图
图2表示图像转换到三基色空间的示例图
图3表示DCT变换后,能量集中于左上的示例图
图4表示解码(解压)示例图
具体实施方式
本发明用于图像的有损压缩,首先图像经过域空间变换,转化为Ycrcb格式,然后将图像分解成8*8大小的图像子块,对每一个图像子块进行DCT变化,在每一个子块的DCT系数中,系数通过判定方法进行处理分解成高频系数和低频系数,高频系数采用误差补偿机制,低频系数进行视觉感知修正变换,然后在进入编码;重构图像的过程为压缩过程的逆运算。
一种基于DCT变换下的视觉感知修正图像压缩方法,结合图1,该发明的执行步骤如下:
步骤一:图像由RGB空间转化为YCrCb三基色空间,分解为三幅(Y,Cr,Cb)能量图;
步骤二:能量图按照像素分割为8*8大小的图像子块;
步骤三:对每一个图像子块进行DCT变换;
步骤四:按照指定的DCT筛选方法,筛选DCT系数,重构DCT系数矩阵;
步骤五:重构后的DCT系数矩阵,按照视觉感知修正方法进行量化处理;
步骤六:量化后的系数进行SPIHT编码,输出压缩数据;
步骤七:解码(解压),解码过程为压缩过程的逆运算,补全DCT系数再进行DT逆变换。
下面,结合图1到图4对本发明详细描述。
一、图像转化和分解
由于RGB颜色空间在显示时候受显示设备的影响较大,所以在进行压缩前将RGB图像转化到不受干扰的YCrCb色空间,然后在分解为3个基色分量对应的亮度图,结合图2示例图,设图像为F(x,y),则变化分解后记为FY(x,y)、Fcr(x,y)、Fcb(x,y),
YCrCb色空间的正变化为:
正变换(用于图像压缩过程):式(1)
逆变换(用于解码过程):式(2)
二、DCT变化
图像经过域空间变换后,表示为三基色分量,FY(x,y)、Fcr(x,y)、Fcb(x,y);由于对整幅图像进行DCT变化的话,图像误差极大,所以先将每个基色图分割为8*8大小的图像子块,图像自子块的大小影响图像重构的质量。然后对每一个8*8的图像子块进行二维DCT变换,二维DCT解析式如下表示,以三基色中FY进行表述:
式(3)
式中,x,y,u,v=0,1,…,N-1。
由于图像分割为8*8,所以式中N=8,所以
式(4)
式中,x,y,u,v=0,1,…,N-1。
图像经过DCT变换后得到的是一个DCT系数矩阵,由于图像能量多集中于左上部分,即图像的背景部分如图3所示,所以在编码过程中,左上部分的系数有较大价值。而右下部分的数据较小,与左上相比,趋于0,其表示的细节纹理部分,如果全部舍弃,则会造成图像还原后细节部分失真过大,但是保留下来的话,又会造成数据冗余,不利于编码,所以如何处理高频区域的系数也是关系到压缩和重建的重要因素。
三、DCT系数的分域和取舍
经过DCT变换后,每一个8*8图像子块得到一个8*8的DCT变换系数矩阵,由于DCT变换将能量集中到了左上部分,系数值比较大。而其他的系数较小或者趋近于0,但是这些趋近于0的系数却是用来体现图像细节纹理的参数,如果系数一并取0,虽然能得到很好的压缩比,但是在重建的图像中,失去了部分细节的描述,图像还原质量不高,所以在系数取舍上,本发明制定以下筛选策略:
设D={d1,d2,···,dn}是8*8DCT变换后的系数集,Q={dj},设定一个参量u:
式(5)
按从左至右的顺序扫描系数,按以下方式判定:
如果abs(di)≥u,则di=dj进入低频区域系数集合Q;(j,i≤n);
如果则di=0.75u=dj,dj进入低频区域系数集合Q;(j,i≤n)
如果则di=0.5u=dj,dj进入低频区域系数集合Q;(j,i≤n)
如果则di=0=dj,dj进入低频区域系数集合Q;(j,i≤n)
经过以上计算,DCT变换后的系数绝大部分被舍弃,只留下能被人眼感知的细节部分,极大的减少了编码数据。此时图像表示为F`Y(x,y)等价于{Qj}。
四、视觉感知修正
DCT系数经过调整后得到{Qj},可以用来等价描述FY(x,y)变换后的图像F`Y(x,y),{Qj}是描述DCT变换后低频区域的系数,图像的主要信息集中在这里,
图像的信噪比可描述为:
式(6)
均方误差描述为:
式(7)
由式6结合式7,定义视觉修正感知系数为:
式(8)
其中Tx,Ty为对角矩阵,e为给定的系数分布向量,由式8可求得
所以,令(Txe,Tye)=T,在编码前,DCT变换系数集{Qj},先乘以T,得到视觉感知修正后的DCT系数集TQ,再对TQ进行编码。
五、编码和解压
对TQ编码,采用SPIHT算法,对经过处理的DCT系数矩阵进行编码,输出码流。图像的解压过程为压缩过程的逆过程,结合图4解码示例图:首先读取码流,在码流中消去视觉感知系数(Txe Tye),然后按照压缩过程中系数的取舍式5逆运算重构DCT系数,此时变换的系数就由新的系数所代替,空缺的位置由0补足,重构出三基色分量,FY(x,y)、Fcr(x,y)、Fcb(x,y)的三个能量图,再将三基色图按照下式合成图像F`(x,y)
上述结合附图对本发明的实施例作了详细描述,应该理解上述只是示例性的,因此,本发明的保护范围应当由所附的权利要求书的内容确定。
Claims (5)
1.一种基于DCT变换下的视觉感知修正图像压缩方法,该方法涉及计算机信息技术领域,具体地涉及图像压缩领域,其特征是:本方法的实施步骤如下:
步骤一:图像由RGB空间转化为YCrCb三基色空间,分解为三幅(Y,Cr,Cb)能量图;
步骤二:能量图按照像素分割为8*8大小的图像子块;
步骤三:对每一个图像子块进行DCT变换;
步骤四:按照指定的DCT筛选方法,筛选DCT系数,重构DCT系数矩阵;
步骤五:重构后的DCT系数矩阵,按照视觉感知修正方法进行量化处理;
步骤六:量化后的系数进行SPIHT编码,输出压缩数据;
步骤七:解码(解压),解码过程为压缩过程的逆运算,补全DCT系数在进行DT逆变换。
2.按照权利要求1所述的一种基于DCT变换下的视觉感知修正图像压缩方法,其特征是:步骤一中,RGB转换为YCrCb的转换系数为:正变换:
。
3.按照权利要求1所述的一种基于DCT变换下的视觉感知修正图像压缩方法,其特征是:步骤四中,DCT系数的筛选和重构方法如下:
设D={,,···,}是8*8DCT变换后的系数集,Q={},设定一个参量u:
式(5)
按从左至右的顺序扫描系数,按以下方式判定:
如果abs()u,则=进入低频区域系数集合Q;(j,in);
如果 u abs()<u,则=0.75u=,进入低频区域系数集合Q;(j,in);
如果 u abs()u,则=0.5u=进入低频区域系数集合Q;(j,in);
如果abs(),则,进入低频区域系数集合Q;(j,in);
经过以上计算,DCT变换后的系数绝大部分被舍弃,只留下能被人眼感知的细节部分,极大的减少了编码数据,此时图像表示为等价于{ }。
4.按照权利要求1所述的一种基于DCT变换下的视觉感知修正图像压缩方法,其特征是:步骤五中,视觉感知修正系数建立方法如下:
图像的信噪比可描述为:
PSNR=10l 式(6)
均方误差描述为:
MSE =x,y)
= 式(7)
由式6结合式7,定义视觉修正感知系数为:
=)* (
式(8)
),
);
令,T在本方法中称为“视觉修正矩阵”,在编码前,DCT变换系数集{},先乘以,得到视觉感知修正后的DCT系数集TQ,再对TQ进行编码。
5.按照权利要求1所述的一种基于DCT变换下的视觉感知修正图像压缩方法,其特征是:步骤七中,解码重建图像时,先进行SPIHT算法的逆过程,计算出TQ码流,在码流中消去T修正量,然后还原8*8DCT系数矩阵,空白处用0补足,在进行DCT变换的逆过程合成三基色能量图,再将三基色图按照下式合成图像F`(x,y),其中逆变换系数为:逆变换:
。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610058825.8A CN106612436A (zh) | 2016-01-28 | 2016-01-28 | 一种基于dct变换下的视觉感知修正图像压缩方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610058825.8A CN106612436A (zh) | 2016-01-28 | 2016-01-28 | 一种基于dct变换下的视觉感知修正图像压缩方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106612436A true CN106612436A (zh) | 2017-05-03 |
Family
ID=58615250
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610058825.8A Pending CN106612436A (zh) | 2016-01-28 | 2016-01-28 | 一种基于dct变换下的视觉感知修正图像压缩方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106612436A (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107645662A (zh) * | 2017-10-19 | 2018-01-30 | 电子科技大学 | 一种彩色图像压缩方法 |
CN108648155A (zh) * | 2018-05-07 | 2018-10-12 | 河北省科学院应用数学研究所 | 基于压缩域的图像增强方法及终端设备 |
CN108717687A (zh) * | 2018-05-07 | 2018-10-30 | 河北省科学院应用数学研究所 | 基于转换压缩的图像增强方法及终端设备 |
CN108769704A (zh) * | 2018-06-04 | 2018-11-06 | 浙江工业大学 | 一种基于动态能量分析的离散余弦变换图像压缩方法 |
CN111078928A (zh) * | 2019-12-20 | 2020-04-28 | 数据堂(北京)科技股份有限公司 | 一种图像去重方法及装置 |
CN113542762A (zh) * | 2021-07-20 | 2021-10-22 | 中交信捷科技有限公司 | 一种车辆红外图像的压缩与增强方法和系统 |
WO2022067526A1 (zh) * | 2020-09-29 | 2022-04-07 | 华为技术有限公司 | 一种图像压缩方法及装置 |
WO2022205094A1 (zh) * | 2021-03-31 | 2022-10-06 | 深圳市大疆创新科技有限公司 | 数据处理方法、数据传输系统、设备及存储介质 |
WO2023184088A1 (zh) * | 2022-03-28 | 2023-10-05 | Oppo广东移动通信有限公司 | 图像处理方法、装置、设备、系统、及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102281446A (zh) * | 2011-09-20 | 2011-12-14 | 西南交通大学 | 一种分布式视频编码中基于视觉感知特性的量化方法 |
CN103037212A (zh) * | 2011-10-08 | 2013-04-10 | 太原科技大学 | 基于视觉感知的自适应块压缩传感图像编码方法 |
CN103563376A (zh) * | 2011-04-08 | 2014-02-05 | 皇家飞利浦有限公司 | 视频编码和解码 |
CN104574450A (zh) * | 2014-12-31 | 2015-04-29 | 南京邮电大学 | 一种基于压缩感知的图像重构方法 |
CN105245890A (zh) * | 2015-10-16 | 2016-01-13 | 北京工业大学 | 一种基于视觉关注度优先级的高效视频编码方法 |
-
2016
- 2016-01-28 CN CN201610058825.8A patent/CN106612436A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103563376A (zh) * | 2011-04-08 | 2014-02-05 | 皇家飞利浦有限公司 | 视频编码和解码 |
CN102281446A (zh) * | 2011-09-20 | 2011-12-14 | 西南交通大学 | 一种分布式视频编码中基于视觉感知特性的量化方法 |
CN103037212A (zh) * | 2011-10-08 | 2013-04-10 | 太原科技大学 | 基于视觉感知的自适应块压缩传感图像编码方法 |
CN104574450A (zh) * | 2014-12-31 | 2015-04-29 | 南京邮电大学 | 一种基于压缩感知的图像重构方法 |
CN105245890A (zh) * | 2015-10-16 | 2016-01-13 | 北京工业大学 | 一种基于视觉关注度优先级的高效视频编码方法 |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107645662A (zh) * | 2017-10-19 | 2018-01-30 | 电子科技大学 | 一种彩色图像压缩方法 |
CN108648155A (zh) * | 2018-05-07 | 2018-10-12 | 河北省科学院应用数学研究所 | 基于压缩域的图像增强方法及终端设备 |
CN108717687A (zh) * | 2018-05-07 | 2018-10-30 | 河北省科学院应用数学研究所 | 基于转换压缩的图像增强方法及终端设备 |
CN108769704A (zh) * | 2018-06-04 | 2018-11-06 | 浙江工业大学 | 一种基于动态能量分析的离散余弦变换图像压缩方法 |
CN111078928A (zh) * | 2019-12-20 | 2020-04-28 | 数据堂(北京)科技股份有限公司 | 一种图像去重方法及装置 |
CN111078928B (zh) * | 2019-12-20 | 2023-07-21 | 数据堂(北京)科技股份有限公司 | 一种图像去重方法及装置 |
WO2022067526A1 (zh) * | 2020-09-29 | 2022-04-07 | 华为技术有限公司 | 一种图像压缩方法及装置 |
WO2022205094A1 (zh) * | 2021-03-31 | 2022-10-06 | 深圳市大疆创新科技有限公司 | 数据处理方法、数据传输系统、设备及存储介质 |
CN113542762A (zh) * | 2021-07-20 | 2021-10-22 | 中交信捷科技有限公司 | 一种车辆红外图像的压缩与增强方法和系统 |
WO2023184088A1 (zh) * | 2022-03-28 | 2023-10-05 | Oppo广东移动通信有限公司 | 图像处理方法、装置、设备、系统、及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106612436A (zh) | 一种基于dct变换下的视觉感知修正图像压缩方法 | |
CN110087092B (zh) | 基于图像重构卷积神经网络的低码率视频编解码方法 | |
CN107197260B (zh) | 基于卷积神经网络的视频编码后置滤波方法 | |
Liu et al. | Data-driven sparsity-based restoration of JPEG-compressed images in dual transform-pixel domain | |
CN104041035B (zh) | 用于复合视频的无损编码及相关信号表示方法 | |
TW517500B (en) | Contrast sensitive variance based adaptive block size DCT image compression | |
CN107645662B (zh) | 一种彩色图像压缩方法 | |
CN103607591A (zh) | 结合超分辨率重建的图像压缩方法 | |
WO2002103615A1 (en) | Method and system for achieving coding gains in wavelet-based image codecs | |
CN101742306A (zh) | 高动态范围编解码器 | |
Xiao et al. | A fast JPEG image compression algorithm based on DCT | |
CN108881913B (zh) | 图像编码的方法和装置 | |
CN104065976B (zh) | 一种基于视频的图像压缩及保密传输方法 | |
CN109361919A (zh) | 一种联合超分辨率和去压缩效应的图像编码性能提升方法 | |
CN105812805A (zh) | 一种用于视频图像的编码方法和装置 | |
CN109922339A (zh) | 结合多采样率下采样和超分辨率重建技术的图像编码框架 | |
CN110545426B (zh) | 基于编码损伤修复cnn的空域可分级视频编码方法 | |
Zhu et al. | Compression-dependent transform-domain downward conversion for block-based image coding | |
Fu et al. | An extended hybrid image compression based on soft-to-hard quantification | |
CN104488266B (zh) | Avs视频压缩编码方法及编码器 | |
CN109427032A (zh) | 一种基于压缩域的可伸缩视频水印嵌入及提取方法 | |
CN106559668B (zh) | 一种基于智能量化技术的低码率图像压缩方法 | |
CN115150628A (zh) | 具有超先验引导模式预测的由粗到细深度视频编码方法 | |
Salih et al. | Improved image compression scheme using hybrid encoding algorithm | |
JP4486847B2 (ja) | 圧縮画像から中間調画像を作成する方法と装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20170503 |
|
WD01 | Invention patent application deemed withdrawn after publication |