CN103596006A - 基于视觉冗余度量的图像压缩方法 - Google Patents
基于视觉冗余度量的图像压缩方法 Download PDFInfo
- Publication number
- CN103596006A CN103596006A CN201310647779.1A CN201310647779A CN103596006A CN 103596006 A CN103596006 A CN 103596006A CN 201310647779 A CN201310647779 A CN 201310647779A CN 103596006 A CN103596006 A CN 103596006A
- Authority
- CN
- China
- Prior art keywords
- image
- pixel
- value
- compressed
- lbp
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Image Processing (AREA)
Abstract
本发明公开了一种基于视觉冗余度量的图像压缩方法,主要解决现有图像压缩效率低的问题。其实现步骤是:(1)采用自回归模型对待压缩图像进行预测,得到预测图像;(2)根据待压缩图像和预测图像得到残差图像,并计算残差图像中各像素的局部二值模式值;(3)统计每个像素周边邻域中相同局部二值模式值出现的概率,计算待压缩图像的不确定度;(4)根据不确定度计算各像素对应的可视阈值,以对待压缩图像进行去冗余操作,得到预处理图像;(5)对预处理图像进行压缩,得到压缩图像。本发明通过可视阈值能有效去除图像中视觉冗余信息,提升了压缩效率,可用于网络视频、手机可视电话及卫星遥感图像的传输。
Description
技术领域
本发明属于图像处理技术领域,特别涉及一种基于视觉冗余度量的图像压缩的方法,从而提升数据处理能力,可用于指导天宫一号、嫦娥一号等航天领域中的图像数据压缩。
技术背景
随着数字图像、数字视频处理技术的提高,数字图像已经成为了信息的主要载体,在越来越多的应用场合中被处理、传递、存储以及重构。然而,由于图像获取设备分辨率的不断提高,数字图像的数据量也迅速增长。海量数据对存储容量和传输带宽等提出了很高的要求,如何对图像进行有效压缩是亟待解决的问题。
图像压缩的目的就是把原来较大的图像用尽量少的字节表示和传输,并且要求恢复图像有较好的质量。由于数字图像数据间存在很强的相关性,并非所有的数据都携带着有用信息,因此就存在大量的冗余。数字图像压缩算法的基本原理就是去除冗余信息。常见的冗余信息可依据其产生原因分为:空间冗余、时间冗余和视觉冗余等。
目前,现有的图像压缩标准均以峰值信噪比PSNR为指导,对于空间冗余和时间冗余具有较好的压缩效果,但是该处理方法只考虑到图像失真大小,忽视了人眼视觉对图像的感知效果,对于视觉冗余很难取得很好的效果。而恰可识别失真阈值JND(本发明中称为可视阈值)能反映人类视觉系统所能察觉到的最小图像内容失真,若在图像压缩标准中加入JND模型,则能在原有的基础上更有效地去除图像中的视觉冗余信息,从而改进基于视觉感知算法的性能。当前,人们提出了很多相关的JND模型并试图将其应用于指导图像压缩。
C.-H.Chou和Y.-C.Li在文章“A perceptually tuned subband imagecoderbased on the measure of just-noticeable distortion profile,”IEEETransactions on Circuits and Systems for Video Technology,vol.5,no.6,pp.467–476,1995中推导出了一个对比度掩膜函数,进而可用于估计视觉可视阈值。尽管该对比度掩膜函数被广泛接受,但由于它只考虑了光照对比度的影响,因此高估了边缘区域的可视阈值,往往会造成图像细节信息丢失,并且低估了纹理区域的可视阈值,而不能很好的去除冗余。
图像中的结构信息对于理解图像和分析图像是至关重要的,人类视觉系统能够高度自适应的提取输入场景中的结构信息。因此,在评估掩膜效应,进而计算图像的可视阈值时,应该将该图像的结构考虑进来。研究表明,不规则的纹理区域比边缘区域包含了更多的不确定性信息和不规则结构。K.Friston在文章“The free-energy principle:a unified brain theory?”NatureReviews Neuroscience,vol.11,no.2,pp.127–138,Feb.2010中指出,人类视觉系统对输入的视觉信息进行感知时,会对其中的规则部分进行积极预测而忽略图像中的不确定性内容。由此可以看出,人类视觉系统对那些包含不确定性结构的不规则区域是不敏感的,而正是这些区域的掩膜效应十分强烈。因此,掩膜效应同时受到光照对比度和结构不确定度两个因素的影响。
然而,计算图像的结构不确定度仍然是一个开放性问题。T.Ojala等人在文章“Multiresolution gray-scaleand rotation invariant texture classification withlocal binary patterns,”IEEE Transactions on Pattern Analysis and MachineIntelligence,vol.24,no.7,pp.971–987,Jul.2002中提出了一种局部二值模式LBP算法,用于分析图像的结构信息。但是,结构信息并不等于结构不确定度。现有的方法还不能很好地计算出图像的结构不确定度,造成对可视阈值的估计不准,影响压缩效果。
发明内容
本发明目的在于针对上述已有技术中存在的缺陷和不足,提出一种基于视觉冗余度量的图像压缩方法,以准确估计图像的可视阈值,去除视觉冗余信息,从而提高图像压缩效率。
本发明的技术方案是这样实现的:
本发明的技术思路是:模拟视觉系统对视觉信息的内在推导机制,在估计图像可视阈值时,综合考虑图像的光照对比度和不确定度这两个因素,其实现步骤包括如下:
(1)输入大小为N×N的待压缩图像I,采用自回归模型对该图像I的各个像素值进行预测,得到预测图像I′;
(2)用输入待压缩图像I中各个像素的值减去预测图像I′中对应像素的值,得到预测残差图像U;
(3)计算残差图像U中第i个像素xi的局部二值模式LBP值;
(4)对于残差图像U中每个像素xi,统计以它为中心的周边21×21邻域中出现相同LBP值的概率p(k);根据统计的概率计算残差图像U中每个像素xi的不确定度H(xi);
(5)利用各个像素的不确定度H(xi),计算待压缩图像I中各个像素vi对应的可视阈值PM(vi):
(5a)计算待压缩图像I的亮度对比度对可视阈值的影响量f1(vi):
其中,E(vi)为待压缩图像I中像素vi的亮度对比度值,α为非线性增长系数,取值为16,β为非线性比例控制参数,取值为26;
(5b)计算不确定度和亮度对比度对可视阈值的交互影响量f2(vi):
其中,k1为比例控制系数,取值为2.03;k2为衰减控制参数,取值为0.19;k3、k4和k5分别为数值不等的三个非线性转换中的形状控制参数,取值为k3=2.6、7k4=3.22、k5=1.19;
(5c)根据步骤(5a)和(5b)的结果,得到待压缩图像I中各个像素vi对应的可视阈值PM(vi)为:
PM(vi)=f1(vi)f2(vi);
(6)根据待压缩图像I中每个像素vi的可视阈值PM(vi),对待压缩图像I去除视觉冗余,得到压缩前的预处理图像Y,该预处理图像Y中的每个像素值yi为:
(7)对预处理图像Y进行压缩,获得压缩图像。
本发明与现有技术相比,具有如下优点:
1)本发明考虑不确定度对可视阈值的影响,结合亮度对比度和不确定度,提出了计算不确定度的具体方程,能准确计算出可视阈值,从而准确度量视觉冗余;
2)本发明模拟人类视觉系统内在推导机制,考虑人类视觉系统对不确定性结构和不规则区域的掩膜效应,通过预测残差计算图像不确定度,能有效分离出视觉系统敏感和不敏感的信息;
3)本发明通过可视阈值对图像进行预处理,去除图像中视觉冗余信息,节省了码流,提升了压缩效率。
附图说明
图1是本发明的实现总流程图;
图2是本发明中获取残差图像的不确定度子流程图。
具体实施方式
参照图1,本发明的具体实现步骤如下:
步骤1,对待压缩图像I进行预测,获得预测图像I′。
(1a)输入大小为N×N的待压缩图像I,根据该待压缩图像I中各像素vi与其周边像素vi+j的相关程度,计算像素vi的预测值vi′:
式中,vi+j为待压缩图像I中以vi为中心的第j个周边像素,ε为自回归模型中的高斯白噪声,ci+j为权重系数,表示像素vi与周边像素vi+j的相关程度:I(vi,vi+j)表示待压缩图像I中像素vi与vi+j之间的互信息;
(1b)用各个预测值vi′构成预测图像I′。
步骤2,由待压缩图像I和预测图像I′得到残差图像U。
根据待压缩图像I中各个像素值vi和预测图像I′中对应像素值vi′,得到残差像素值:xi=vi-v′i,进而构成残差图像U。
步骤3,计算残差图像U中每个像素值xi的不确定度H(xi)。
参照图2,本步骤的具体实现如下:
(3a)计算残差图像U中第i个像素xi的局部二值模式LBP值:
其中,xi+j是以xi为中心的第j个周边像素,p为周边邻近像素的个数,p=8;
(3b)对于残差图像U中每个像素值xi,统计以它为中心的周边21×21邻域中出现相同LBP值的概率p(k):
其中,
(3c)根据统计的概率p(k)计算残差图像U中每个像素xi的不确定度H(xi):
步骤4,利用各个像素的不确定度H(xi),计算待压缩图像I中各个像素vi对应的可视阈值PM(vi)。
(4a)计算待压缩图像I的亮度对比度对可视阈值的影响量f1(vi):
其中,E(vi)为待压缩图像I中像素vi的亮度对比度值,α为非线性增长系数,取值为16,β为非线性比例控制参数,取值为26;
(4b)计算不确定度H(xi)和可视阈值的影响量f1(vi)对可视阈值的交互影响量f2(vi):
其中,k1为比例控制系数,取值为2.03;k2为衰减控制参数,取值为0.19;k3、k4和k5分别为数值不等的三个非线性转换中的形状控制参数,取值为k3=2.6、7k4=3.22、k5=1.19;
(4c)根据步骤(4a)和(4b)的结果,得到待压缩图像I中各个像素vi对应的可视阈值PM(vi)为:
PM(vi)=f1(vi)f2(vi)。
步骤5,根据待压缩图像I中各像素vi的可视阈值PM(vi),对待压缩图像I进行去冗余操作,得到预处理图像Y。
以上三种计算预处理图像Y中各像素值yi可以通过如下公式表示:
步骤6,针对步骤(5)中得到的预处理图像Y,采用目前已有的压缩标准,比如JEPG,JEPG2000,H.264,HEVC等进行压缩,获得压缩图像。该压缩图像与现有标准得到的压缩图像相比,能在保证压缩质量的同时节省码流,提高了压缩性能。
以上描述仅是本发明的一个具体实例,不构成对本发明的任何限制。显然对于本领域的专业人员来说,在了解了本发明内容和原理后,都可能在不背离本发明原理、结构的情况下,进行形式和细节上的各种修改和改变,但是这些基于本发明思想的修正和改变仍在本发明的权利要求保护范围之内。
Claims (5)
1.一种基于视觉冗余度量的图像压缩方法,包括如下步骤:
(1)输入大小为N×N的待压缩图像I,采用自回归模型对该图像I的各个像素值进行预测,得到预测图像I′;
(2)用输入待压缩图像I中各个像素的值减去预测图像I′中对应像素的值,得到预测残差图像U;
(3)计算残差图像U中第i个像素xi的局部二值模式LBP值;
(4)对于残差图像U中每个像素xi,统计以它为中心的周边21×21邻域中出现相同LBP值的概率p(k);根据统计的概率计算残差图像U中每个像素xi的不确定度H(xi);
(5)利用各个像素的不确定度H(xi),计算待压缩图像I中各个像素vi对应的可视阈值PM(vi):
(5a)计算待压缩图像I的亮度对比度对可视阈值的影响量f1(vi):
其中,E(vi)为待压缩图像I中像素vi的亮度对比度值,α为非线性增长系数,取值为16,β为非线性比例控制参数,取值为26;
(5b)计算不确定度和亮度对比度对可视阈值的交互影响量f2(vi):
其中,k1为比例控制系数,取值为2.03;k2为衰减控制参数,取值为0.19;k3、k4和k5分别为数值不等的三个非线性转换中的形状控制参数,取值为k3=2.67、k4=3.22、k5=1.19;
(5c)根据步骤(5a)和(5b)的结果,得到待压缩图像I中各个像素vi对应的可视阈值PM(vi):
PM(vi)=f1(vi)f2(vi);
(6)根据待压缩图像I中每个像素vi的可视阈值PM(vi),对待压缩图像I去除视觉冗余,得到压缩前的预处理图像Y,该预处理图像Y中的每个像素值yi通过如下公式计算得到:
(7)对预处理图像Y进行压缩,获得压缩图像。
3.如权利要求1所述的方法,其步骤(3)所述的计算残差图像U中第i个像素xi的局部二值模式LBP值,通过下式计算:
其中,i的取值范围为1~N2,xi+j是以xi为中心的第j个周边像素,p为周边邻近像素的个数,p=8。
4.如权利要求1所述的方法,其中步骤(4)所述的对于残差图像U中每个像素xi,统计以它为中心的周边21×21邻域中出现相同LBP值的概率p(k),按如下公式进行:
其中,
5.如权利要求1的方法,其中步骤(4)所述的根据统计的概率计算残差图像U中每个像素xi的不确定度H(xi),通过下式计算:
其中,p(k)为残差图像U中以像素xi为中心的周边21×21邻域中出现相同LBP值的概率。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310647779.1A CN103596006A (zh) | 2013-12-04 | 2013-12-04 | 基于视觉冗余度量的图像压缩方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310647779.1A CN103596006A (zh) | 2013-12-04 | 2013-12-04 | 基于视觉冗余度量的图像压缩方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103596006A true CN103596006A (zh) | 2014-02-19 |
Family
ID=50085964
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310647779.1A Pending CN103596006A (zh) | 2013-12-04 | 2013-12-04 | 基于视觉冗余度量的图像压缩方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103596006A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103929652A (zh) * | 2014-04-30 | 2014-07-16 | 西安电子科技大学 | 视频标准中基于自回归模型的帧内预测快速模式选择方法 |
CN104506752A (zh) * | 2015-01-06 | 2015-04-08 | 河海大学常州校区 | 一种基于残差压缩感知的相似图像压缩方法 |
CN107155111A (zh) * | 2017-06-05 | 2017-09-12 | 李益永 | 一种视频压缩方法及装置 |
CN108521572A (zh) * | 2018-03-22 | 2018-09-11 | 四川大学 | 一种基于像素域jnd模型的残差滤波方法 |
CN109872302A (zh) * | 2019-01-15 | 2019-06-11 | 宁波大学科学技术学院 | 一种基于稀疏表示的自然图像恰可察觉失真阈值估计方法 |
CN111901594A (zh) * | 2020-06-29 | 2020-11-06 | 北京大学 | 面向视觉分析任务的图像编码方法、电子设备及介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101404772A (zh) * | 2008-11-19 | 2009-04-08 | 中国科学院光电技术研究所 | 基于小波变换的vlsi图像压缩编码器 |
CN101835048A (zh) * | 2010-03-30 | 2010-09-15 | 香港应用科技研究院有限公司 | 通过基于abt的最小可觉差模型进行视频编码的方法和装置 |
US20110255589A1 (en) * | 2009-08-03 | 2011-10-20 | Droplet Technology, Inc. | Methods of compressing data and methods of assessing the same |
-
2013
- 2013-12-04 CN CN201310647779.1A patent/CN103596006A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101404772A (zh) * | 2008-11-19 | 2009-04-08 | 中国科学院光电技术研究所 | 基于小波变换的vlsi图像压缩编码器 |
US20110255589A1 (en) * | 2009-08-03 | 2011-10-20 | Droplet Technology, Inc. | Methods of compressing data and methods of assessing the same |
CN101835048A (zh) * | 2010-03-30 | 2010-09-15 | 香港应用科技研究院有限公司 | 通过基于abt的最小可觉差模型进行视频编码的方法和装置 |
Non-Patent Citations (2)
Title |
---|
JINJIAN WU等: "《pattern masking estimation in image with structural uncertainty》", 《IEEE TRANSACTIONS ON IMAGE PROCESSING》 * |
JINJIAN WU等: "《Visual Masking Estimation Based On Structural Uncertainty》", 《IEEE INTERNATIONAL SYMPOSIUM ON CIRCUITS & SYSTEMS》 * |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103929652A (zh) * | 2014-04-30 | 2014-07-16 | 西安电子科技大学 | 视频标准中基于自回归模型的帧内预测快速模式选择方法 |
CN103929652B (zh) * | 2014-04-30 | 2017-04-19 | 西安电子科技大学 | 视频标准中基于自回归模型的帧内预测快速模式选择方法 |
CN104506752A (zh) * | 2015-01-06 | 2015-04-08 | 河海大学常州校区 | 一种基于残差压缩感知的相似图像压缩方法 |
CN104506752B (zh) * | 2015-01-06 | 2017-08-25 | 河海大学常州校区 | 一种基于残差压缩感知的相似图像压缩方法 |
CN107155111A (zh) * | 2017-06-05 | 2017-09-12 | 李益永 | 一种视频压缩方法及装置 |
CN107155111B (zh) * | 2017-06-05 | 2020-02-18 | 李益永 | 一种视频压缩方法及装置 |
CN108521572A (zh) * | 2018-03-22 | 2018-09-11 | 四川大学 | 一种基于像素域jnd模型的残差滤波方法 |
CN108521572B (zh) * | 2018-03-22 | 2021-07-16 | 四川大学 | 一种基于像素域jnd模型的残差滤波方法 |
CN109872302A (zh) * | 2019-01-15 | 2019-06-11 | 宁波大学科学技术学院 | 一种基于稀疏表示的自然图像恰可察觉失真阈值估计方法 |
CN111901594A (zh) * | 2020-06-29 | 2020-11-06 | 北京大学 | 面向视觉分析任务的图像编码方法、电子设备及介质 |
CN111901594B (zh) * | 2020-06-29 | 2021-07-20 | 北京大学 | 面向视觉分析任务的图像编码方法、电子设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Cheng et al. | Learning image and video compression through spatial-temporal energy compaction | |
CN103596006A (zh) | 基于视觉冗余度量的图像压缩方法 | |
Ma et al. | Reorganized DCT-based image representation for reduced reference stereoscopic image quality assessment | |
CN101563926B (zh) | 图像压缩与解压缩 | |
CN102137263B (zh) | 基于cnm关键帧分类的分布式视频编码及解码方法 | |
CN102119401B (zh) | 用于带状伪像检测的方法和设备 | |
CN102420988B (zh) | 一种利用视觉特性的多视点视频编码系统 | |
CN104202599B (zh) | 一种应用于hevc帧间编码的全零块检测方法 | |
Perra | A low computational complexity blockiness estimation based on spatial analysis | |
CN103002306A (zh) | 一种深度图像编码方法 | |
CN106056638B (zh) | 一种自适应纹理对比度的低复杂度压缩感知图像编码方法 | |
CN108810534A (zh) | 物联网下基于方向提升小波及改进spiht的图像压缩方法 | |
Joshua et al. | Comparison of DCT and DWT image compression | |
CN106559670A (zh) | 一种改进的分块视频压缩感知算法 | |
CN108573509B (zh) | 基于测量域显著检测模型的自适应压缩感知图像编码方法 | |
Hachicha et al. | 1D directional DCT-based stereo residual compression | |
CN108200440B (zh) | 一种基于时间相关性的分布式视频压缩感知重构方法 | |
CN107509074B (zh) | 基于压缩感知的自适应3d视频压缩编解码方法 | |
CN105141967A (zh) | 基于恰可觉察失真模型的快速自适应环路滤波算法 | |
Petrov et al. | Intra frame compression and video restoration based on conditional markov processes theory | |
CN112468826B (zh) | 一种基于多层gan的vvc环路滤波方法及系统 | |
Farid et al. | Blind depth quality assessment using histogram shape analysis | |
CN103997653A (zh) | 一种基于边缘的面向虚拟视绘制的深度视频的编码方法 | |
Xie et al. | Just noticeable visual redundancy forecasting: a deep multimodal-driven approach | |
Deng et al. | MASIC: Deep Mask Stereo Image Compression |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20140219 |