CN102934428B - 一种图像压缩中利用人眼视觉模型的小波系数量化方法 - Google Patents

一种图像压缩中利用人眼视觉模型的小波系数量化方法 Download PDF

Info

Publication number
CN102934428B
CN102934428B CN201080044548.6A CN201080044548A CN102934428B CN 102934428 B CN102934428 B CN 102934428B CN 201080044548 A CN201080044548 A CN 201080044548A CN 102934428 B CN102934428 B CN 102934428B
Authority
CN
China
Prior art keywords
component
value
coefficient
wavelet
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201080044548.6A
Other languages
English (en)
Other versions
CN102934428A (zh
Inventor
李波
曹海恒
文义红
姜宏旭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beihang University
Original Assignee
Beihang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beihang University filed Critical Beihang University
Publication of CN102934428A publication Critical patent/CN102934428A/zh
Application granted granted Critical
Publication of CN102934428B publication Critical patent/CN102934428B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/154Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients

Abstract

本发明涉及一种图像压缩过程中利用人眼视觉模型的小波系数量化方法,特别适合于遥感图像的压缩。本发明以人眼视觉特性为依据,在实验的基础上,得到小波域视觉量化模型,以反映小波系数块失真与人眼视觉特性之间的关系。该模型包括亮度分量、掩蔽分量以及频率分量,其中亮度分量用第k级小波变换之后的低频系数求取,掩蔽分量用第2级和第3级高频系数求取,频率分量则用统计的方法求取。该方法可以与任何基于主流的小波压缩方法相结合,如EZW、SPIHT、EBCOT等。实验结果表明,加入本发明所提供的量化模型之后,在同等压缩比下,能够较好地保留图像的纹理信息和小目标,主观效果优于原始方法。

Description

一种图像压缩中利用人眼视觉模型的小波系数量化方法
技术领域
本发明涉及一种用于图像压缩过程的小波系数量化方法,尤其涉及一种在图像压缩过程中,利用人眼视觉特性来提高恢复图像主观质量的小波系数量化方法,属于静态图像压缩技术领域。
背景技术
近十几年来,基于小波变换的图像压缩方法在静态图像压缩中得到广泛应用。此类方法中,最具有代表性的有EZW、SPIHT和新一代静态图像压缩标准JPEG2000的核心方法EBCOT等,其中小波变换已经成为静态图像压缩标准JPEG2000的必须步骤。
但上述方法仍存在一定的缺陷:当压缩倍数较高时,使用基于小波的压缩方法,恢复后的图像容易存在明显的视觉失真。其原因是人眼作为图像的最终接受者,对不同类型的图像失真敏感程度存在差别,而目前都以PNSR值或者MSE来评判图像压缩方法的性能,没有考虑这一重要因素。
目前基于小波变换的经典图像压缩方法如EBCOT、SPHIT等,其基本原理框图如图1所示,其中压缩过程分为预处理、小波变换、量化、编码4个步骤。在预处理阶段完成色度空间转换、去除直流分量等工作;小波变换用于降低图像数据的空间相关性,让能量聚集在低频部分,以利于压缩;量化步骤的作用是降低图像数据的熵值,有利于提高整体压缩率;最后,对量化后的小波系数进行熵编码,得到压缩码流。
在图1所示的图像压缩和恢复的整个过程中,量化步骤是引起恢复图像失真的唯一环节。在图像压缩过程中,好的量化策略应该尽量结合人眼视觉特性,对不同系数采用不同的量化值,舍弃人眼相对不敏感的、非重要的信息,保留敏感的、重要的信息,在实现压缩的同时保证恢复图像的质量。现有研究表明与图像相关的主要人眼视觉特性有亮度适应性、掩蔽效应和频率特性等,但是目前图像压缩方法中,在量化阶段很少考虑人眼视觉特性,如SPIHT和EZW都没有考虑人眼视觉特性;即便少部分压缩方法考虑了人眼视觉特性,也非常不充分,其主要表现在以下几个方面:
(1)只考虑了人眼视觉特性的部分特性。例如,在已经普遍使用的JPEG2000标准中,固定视觉权值方法(FVW,fixed visual weighting)根据人眼视觉模型计算出一个与图像无关但是与视距(人眼到显示器之间的距离)相关的子带权重表,小波变换之后直接将系数乘以对应的权值,然后进行常规编码,该方法只使用了人眼视觉特性中的频带特性,在实际应用中效果并不明显;渐进视觉编码方法(VIP,visualprogressive coding)则是先按照常规方法进行位平面扫描编码,在优化截断的时候使用了基于视觉权值的加权均方误差代替均方误差,使压缩过程中视觉失真最小。
(2)视觉实验在空域图像进行得到的模型没有与小波系数建立联系,不能直接反映不同小波系数对人眼视觉系统的敏感性程度。如著名的动态对比度量化方法(DCQ,Dynamic contrastive Quantization)是根据原始图像的纹理特性建立对比度失真模型,根据总的对比度失真来动态调节每个子带的量化值,经过循环迭代直至各子带的视觉失真相等,达到视觉效果最优。该算法因为无法直接建立小波系数与视觉量化值之间的联系,导致需要迭代计算,复杂度很高,实用性受到影响。
(3)大多数视觉模型以频带为单位建立。如上述的FVW、VIP和DCQ都是以频带为单位定义视觉量化值,其优点是视觉量化值在码流中开销较小,但是其缺点也很明显,就是粒度太粗,无法反映图像的细节特征。
发明内容
本发明所要解决的技术问题是提供一种图像压缩中利用人眼视觉模型的小波系数量化方法。该方法能够有效改善恢复图像的主观质量,同时兼顾视觉模型的准确性和方法的时间和空间复杂度等因素。
为实现上述的发明目的,本发明采用下述的技术方案:
一种图像压缩中利用人眼视觉模型的小波系数量化方法,其特征在于包括以下步骤:
步骤一:对待压缩图像进行小波变换,将获得的所有子带平均分为n×n块,每个块记为B(j,d,i),其中j表示该块所在子带的小波变换级数,d表示该块所在子带的方向,i表示该块在子带中的位置;
步骤二:计算第k级小波变换之后最低频子带LLk中小波系数的最大值MAXk、最小值MINk,以及该子带中各块系数的平均值M(i),将获得的各块系数平均值M(i)进行线性映射,获得其映射灰度值L(i):
L(i)=255×(M(i)-MINk)/(MAXk-MINk)
根据获得的映射灰度值L(i),计算视觉模型的亮度分量TA(j,d,i):
T A ( j , d , i ) = w ( a + b &CenterDot; T 1 ) c / g , L ( i ) &le; T 1 w ( a + b &CenterDot; L ( i ) ) c / g , T 1 < L ( i ) < T 2 w ( a + b &CenterDot; T 2 ) c / g , L ( i ) &GreaterEqual; T 2
其中a为CRT显示器像素值为0时的电压,b是像素值与电压值之间的比例因子,c是所述显示器的伽马值,w为韦伯比,g为小波变换在第k级的能量增益因子;T1和T2分别是韦伯定律中线性区域的上下门限值;
步骤三:分别获取待压缩图像在二级和三级小波变换之后HL和LH方向上子带的分块,计算视觉模型的掩蔽分量TM(j,d,i):
T M ( j , d , i ) = C ( 2 , HL , i ) + C ( 3 , HL , i ) + C ( 2 , LH , i ) + C ( 3 , LH , i ) 2 2
其中C(2,HL,i)表示块B(2,HL,i)中系数绝对值的最大值,C(3,HL,i)表示块B(3,HL,i)中系数绝对值的最大值,C(2,LH,i)表示块B(2,LH,i)中系数绝对值的最大值,C(3,LH,i)表示块B(3,LH,i)中系数绝对值的最大值;
步骤四:根据上述得到的亮度分量和掩蔽分量,计算二者的联合分量TG(j,d,i):
TG(j,d,i)=[TA(j,d,i)]α[TM(j,d,i)]β
其中α、β分别表示亮度分量和掩蔽分量的权重值;
步骤五:对上述获得的联合分量TG(j,d,i)按照预先设定的N个等级进行量化,得到N个等级值TG1~TGN,以及每个联合分量TG(j,d,i)被量化之后的值Q(j,d,i),对所述等级值TG1~TGN和值Q(j,d,i)分别进行编码;
步骤六:选择多幅与待压缩图像大小相同的试验图像,使用上述小波变换方法获得其小波系数,分别针对各频带按照如下方式求取视觉模型的频率分量:调整量化值,对该频带进行量化,直到复原后图像的失真度刚好能为人眼察觉,将当前量化值记为所述图像在该频带下的频率JND值,对上述多幅图像中相同频带的频率JND值进行平均,得到视觉模型的频率分量TS(j,d,i);
步骤七:利用上述获得的联合分量TG(j,d,i)的量化值Q(j,d,i)以及视觉模型的频率分量TS(j,d,i),计算视觉量化阈值T(j,d,i):
T(j,d,i)=Q(j,d,i)·[TS(j,d,i)]γ
其中γ表示频率分量权重值;
步骤八:利用上述视觉量化阈值进行量化。
其中,当压缩倍数小于8倍时,所述亮度分量权重值α、掩蔽分量权重值β、频率分量权重值γ为:0.5、0.5、0.5;当压缩倍数为8~20倍时,所述亮度分量权重值α、掩蔽分量权重值β、频率分量权重值γ为:0.5、1.0、1.0。
本发明利用视觉实验得到纹理敏感性模型,并根据不同系数块对应图像块的纹理特征计算出其量化步长,最后对小波系数进行量化。实验结果表明,在相同压缩比时与静态图像压缩标准JPEG2000相比,这种基于纹理的小波系数量化方法很好地保持了原始图像的纹理细节,提高了恢复图像的主观质量。本发明所提供的图像处理方法特别适合于遥感图像压缩。
附图说明
下面结合附图和具体实施方式对本发明作进一步的说明。
图1现有技术的小波压缩/解压缩原理框图。
图2本发明所述的基于小波域视觉量化模型的图像压缩流程图。
图3为本发明中对小波变换之后的系数进行分块的示意图。
图4为本发明中以迭代方法计算频率分量的示意图。
具体实施方式
图像压缩过程中的小波系数量化步骤是在小波域进行的,为了更直接、更准确地反应人眼的视觉特性,最理想的方法是使用心理学实验方法,通过反复的实验求出每个系数的恰可察觉失真(JND,Just NoticeableDifferences):将小波变换之后的每个系数进行分量化、反量化,只有当量化值小于一个阈值D的时候,反变换后的图像才对人眼视觉没有影响,人眼无法分辨出图像的失真,我们把此阈值D定义为该系数的JND值。求出每个系数的JND值之后,如果在量化过程中每个系数块中的量化值能够按照JND值之间的比例关系进行调节,那么恢复图像就可以达到好的视觉效果,这就是视觉量化的指导思想。但是每幅图像都有自身的特点,如果根据实验方法求出每个系数的JND再量化,需要人眼判断,过程繁琐,没有实用价值。
本发明利用人眼视觉特性,结合小波变换的特征,在小波域上建立包含亮度分量、掩蔽分量和频率分量的视觉量化模型,然后通过视觉量化模型求出视觉JND值作为人眼视觉特性的视觉量化值。考虑人眼视觉特性最主要特性的三个特性是亮度特性、频率特性和掩蔽特性,本发明将视觉量化值分解为亮度分量、频率分量和掩蔽分量3个分量,求出这3个分量之后,再以实验的方式求出3个分量的权重值,并组合成为最终的视觉模型公式。这就是本发明所提出的视觉量化模型的基本思路。
本发明对图像小波变换后的系数以块为单位建立人眼视觉量化模型,以该模型计算每个系数块的视觉失真阈值,依据该阈值,对各块进行量化,保证量化后的小波系数能够有效地保留图像的视觉信息,使解压缩后的图像视觉效果最优。
本发明所提供的小波系数量化方法尤其适合于遥感图像等纹理细节比较丰富的图像压缩。图2是本发明的利用人眼视觉模型的小波系数量化方法的流程示意图。
步骤一:小波系数分块。对待压缩图像进行小波变换,将获得的所有子带平均分为n×n块,每个块记为B(j,d,i),其中j表示该块所在子带的小波变换级数,d表示该块所在子带的方向,i表示该块在子带中的位置;如果出现子带按照这种方法分出来的块小于2×2时,则该子带不用分块,整个子带直接作为一个系数块进行处理。图3是一幅大小为256×256的图像经过四级小波变换之后每个子带的第一个分块(图中黑色部分)的位置和大小示意图,在第4级变换之后,各个子带分块小于2×2,每个子带单独成为一个块(见图3中灰色部分)。
由于量化系数需要保存在压缩码流中,便于解压缩时进行反量化,所以以量化系数为单位求视觉量化值,会导致量化值过多,占用码流过长,不具备可行性,所以比较好的解决办法是进行分块处理。本方法中不同子带分块大小不一样是考虑到了小波系数具备父子相关性的特点。采用分块可以保持图像细节特征且不明显增加码流量,同时由于上一级频带分块与下一级对应位置的分块具有父子相关性,在求取亮度分量和掩蔽分量时,只需记录任意一级的分块计算结果。
步骤二:亮度分量计算。图像块亮度越大,对失真的包容性越强,而图像块的亮度分布跟小波变换过程中的低频系数块分布具有相关性,因此可以通过小波变换过程中任一级低频系数块分布求得图像块的亮度分布,进而求得各块亮度分量。计算小波变换过程中第k级变换后低频子带LLk中小波系数的最大值MAXk、最小值MINk,以及该子带中各块系数的平均值M(i),将获得的各块系数平均值M(i)按照公式(1)进行线性映射,获得其映射灰度值L(i):
L(i)=255×(M(i)-MINk)/(MAXk-MINk)   (1)
根据获得的映射灰度值L(i),利用公式(2)计算视觉模型的亮度分量TA(j,d,i):
T A ( j , d , i ) = w ( a + b &CenterDot; T 1 ) c / g , L ( i ) &le; T 1 w ( a + b &CenterDot; L ( i ) ) c / g , T 1 < L ( i ) < T 2 w ( a + b &CenterDot; T 2 ) c / g , L ( i ) &GreaterEqual; T 2 - - - ( 2 )
其中a为CRT显示器像素值为0时的电压,b是像素值与电压值之间的比例因子,c是所述显示器的伽马值,w为韦伯比,g为小波变换在第k级的能量增益因子;T1和T2分别是韦伯定律中线性区域的上下门限值。类似的分析可用于其他图像装置,如LCD和打印机。唯一的不同就是随装置而定的伽马值。
选取的低频子带所处等级越低,系数块分布和图像块分布相关性越强,但数据量也大。因此,在本发明的实施过程中,通过对多幅图像的统计,综合考虑低频系数块跟图像块相关程度以及计算复杂度,优选k=2。k的取值越小,则与图像相关程度越低,计算复杂度越小。可以根据实际应用情况选取合适的k值。
公式(2)中的各系数优选为:a=1.77,b=0.0197,c=2.33。
步骤三:掩蔽分量计算。在小波变换域,通常第2级和3级是人眼最敏感的部分,本发明使用对人眼比较敏感的2级和3级变换的LH和HL频带数据建立掩蔽模型,并利用公式(3),计算视觉模型的掩蔽分量TM(j,d,i):
T M ( j , d , i ) = C ( 2 , HL , i ) + C ( 3 , HL , i ) + C ( 2 , LH , i ) + C ( 3 , LH , i ) 2 2 - - - ( 3 )
其中C(2,HL,i)表示块B(2,HL,i)中系数绝对值的最大值,C(3,HL,i)表示块B(3,HL,i)中系数绝对值的最大值,C(2,LH,i)表示块B(2,LH,i)中系数绝对值的最大值,C(3,LH,i)表示块B(3,LH,i)中系数绝对值的最大值。
步骤四:联合分量计算。根据上述得到的亮度分量和掩蔽分量,利用公式(4)计算二者的联合分量TG(j,d,i):
TG(j,d,i)=[TA(j,d,i)]α[TM(j,d,i)]β   (4)
其中α、β分别表示亮度分量和掩蔽分量的权重值;它们代表各视觉分量的影响程度,可以根据环境和压缩倍数进行调节。
步骤五:编码联合分量。通过公式(2)和(3)可以发现,对于任一系数块,其亮度分量TA(j,d,i)和掩蔽分量TM(j,d,i)都只与i有关,而与j、d无关,所以TG(j,d,i)也只与i有关,即所有的联合分量实际上只有n×n个与i对应的值。为了便于编码,这里首先将其量化成为N个等级,得到N个等级值TG1~TGN,以及每个块TJ(l,d,i)量化之后对应的量化值QJ(l,d,i);为减少数据量,将TG1~TGN分别对应到索引值0至N-1。由于在解压缩过程中需要使用这些数据,所以必须编码并在压缩码流中保存等级值TG1~TGN,以及每个块量化的等级值所对应的索引值。
步骤六:统计频率分量。频率分量计算与具体要编码的图像和小波系数无关,而是与变换所使用的小波基相关,因此对特定的小波基,可以统计的方式得到其频率分量。参考图4,在本实施例中,选择复杂度不同的多幅试验图像,使用上述小波变换方法获得其小波系数,分别针对各频带按照如下方式求取视觉模型的频率分量:
选取与待压缩图像大小相当的图像1到图像n,共n个图像。设定量化值的初始值为2.0,对频带进行量化并反量化。增大或减小量化值,对该频带反复进行量化,直到复原后图像的失真度刚好能为人眼察觉,将当前量化值Q1~Qn记为所述图像1~n在该频带下的频率JND值。对上述多幅图像中相同频带的频率JND值进行平均,得到视觉模型的频率分量TS(j,d,i)。
步骤七:利用上述获得的联合分量TG(j,d,i)的量化值Q(j,d,i)以及视觉模型的频率分量TS(j,d,i),按照公式(5)计算各个块的视觉量化阈值T(j,d,i):
T(j,d,i)=Q(j,d,i)·[TS(j,d,i)]γ   (5)
其中γ表示频率分量权重值。所述亮度分量权重值α变化范围为0.4~0.6,掩蔽分量权重值β变化范围为0.4~1.2,频率分量权重值γ变化范围为0.4~1.2。当压缩倍数小于8倍时,所述亮度分量权重值α、掩蔽分量权重值β、频率分量权重值γ优选为:0.5、0.5、0.5;当压缩倍数为8~20倍时,所述亮度分量权重值α、掩蔽分量权重值β、频率分量权重值γ优选为:0.5、1.0、1.0。
步骤八:利用上述视觉量化阈值进行量化。
上述本发明所提出的小波系数量化方法可以与任何基于主流的小波压缩方法相结合,如EZW、SPIHT、EBCOT等。实验结果表明,加入本发明的量化模型之后,在同等压缩比下,能够较好地保留图像的纹理信息和小目标,主观效果优于原始方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解;其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种图像压缩中利用人眼视觉模型的小波系数量化方法,其特征在于包括以下步骤:
步骤一:对待压缩图像进行小波变换,将获得的所有子带平均分为n×n块,每个块记为B(j,d,i),其中j表示该块所在子带的小波变换级数,d表示该块所在子带的方向,i表示该块在子带中的位置;
步骤二:计算第k级小波变换之后最低频子带LLk中小波系数的最大值MAXk、最小值MINk,以及该子带中各块系数的平均值M(i),将获得的各块系数平均值M(i)进行线性映射,获得其映射灰度值L(i):
L(i)=255×(M(i)-MINk)/(MAXk-MINk)
根据获得的映射灰度值L(i),计算视觉模型的亮度分量TA(j,d,i):
T A ( j , d , i ) = w ( a + b &CenterDot; T 1 ) c / g , L ( i ) &le; T 1 w ( a + b &CenterDot; L ( i ) ) c / g , T 1 < L ( i ) < T 2 w ( a + b &CenterDot; T 2 ) c / g , L ( i ) &GreaterEqual; T 2
其中a为CRT显示器像素值为0时的电压,b是像素值与电压值之间的比例因子,c是所述显示器的伽马值,w为韦伯比,g为小波变换在第k级的能量增益因子;T1和T2分别是韦伯定律中线性区域的上下门限值;
步骤三:分别获取待压缩图像在二级和三级小波变换之后HL和LH方向上子带的分块,计算视觉模型的掩蔽分量TM(j,d,i):
T M ( j , d , i ) = C ( 2 HL , i ) + C ( 3 , HL , i ) + C ( 2 , LH , i ) + C ( 3 , LH , i ) 2 2
其中C(2,HL,i)表示块B(2,HL,i)中系数绝对值的最大值,C(3,HL,i)表示块B(3,HL,i)中系数绝对值的最大值,C(2,LH,i)表示块B(2,LH,i)中系数绝对值的最大值,C(3,LH,i)表示块B(3,LH,i)中系数绝对值的最大值;
步骤四:根据上述得到的亮度分量和掩蔽分量,计算二者的联合分量TG(j,d,i):
TG(j,d,i)=[TA(j,d,i)]α[TM(j,d,i)]β
其中α、β分别表示亮度分量和掩蔽分量的权重值;
步骤五:对上述获得的联合分量TG(j,d,i)按照预先设定的N个等级进行量化,得到N个等级值TG1~TGN,以及每个联合分量TG(j,d,i)被量化之后的值Q(j,d,i),对所述等级值TG1~TGN和值Q(j,d,i)分别进行编码;
步骤六:选择多幅与待压缩图像大小相同的试验图像,使用上述小波变换方法获得其小波系数,分别针对各频带按照如下方式求取视觉模型的频率分量:调整量化值,对该频带进行量化,直到复原后图像的失真度刚好能为人眼察觉,将当前量化值记为所述图像在该频带下的频率JND值,对上述多幅图像中相同频带的频率JND值进行平均,得到视觉模型的频率分量TS(j,d,i);
步骤七:利用上述获得的联合分量TG(j,d,i)的量化值Q(j,d,i)以及视觉模型的频率分量TS(j,d,i),计算视觉量化阈值T(j,d,i):
T(j,d,i)=Q(j,d,i)·[TS(j,d,i)]γ
其中γ表示频率分量权重值;
步骤八:利用上述视觉量化阈值进行量化。
2.如权利要求1所述的小波系数量化方法,其特征在于:
所述步骤二中的系数k优选为2。
3.如权利要求1所述的小波系数量化方法,其特征在于:
所述步骤二中计算亮度分量的公式中的各系数优选为:a=1.77,b=0.0197。
4.如权利要求1所述的小波系数量化方法,其特征在于:
当压缩倍数小于8倍时,所述亮度分量权重值α、掩蔽分量权重值β、频率分量权重值γ为:0.5、0.5、0.5;当压缩倍数为8~20倍时,所述亮度分量权重值α、掩蔽分量权重值β、频率分量权重值γ为:0.5、1.0、1.0。
5.一种图像压缩中利用人眼视觉模型的小波系数量化方法,其特征在于包括以下步骤:
步骤一:对待压缩图像进行小波变换,得到各个子带;
步骤二:计算第k级小波变换之后最低频子带LLk中小波系数的最大值MAXk、最小值MINk,以及该子带中各块系数的平均值M(i),基于所述最大值MAXk、最小值MINk和平均值M(i)计算视觉模型的亮度分量TA(j,d,i),其中j表示该块所在子带的小波变换级数,d表示该块所在子带的方向,i表示该块在子带中的位置;
步骤三:分别获取待压缩图像在小波变换之后的HL和LH方向上子带的分块,计算所述视觉模型的掩蔽分量TM(j,d,i);
步骤四:根据所述亮度分量和掩蔽分量,计算二者的联合分量TG(j,d,i);
步骤五:对所述联合分量TG(j,d,i)按照预先设定的N个等级进行量化,得到每个联合分量TG(j,d,i)被量化之后的值Q(j,d,i);
步骤六:通过试验得到所述视觉模型的频率分量TS(j,d,i);
步骤七:利用所述联合分量TG(j,d,i)的量化值Q(j,d,i)以及所述视觉模型的频率分量TS(j,d,i),计算视觉量化阈值T(j,d,i):
T(j,d,i)=Q(j,d,i)·[TS(j,d,i)]γ
其中γ表示频率分量权重值;
步骤八:利用所述视觉量化阈值对所述待压缩图像进行量化。
6.如权利要求5所述的小波系数量化方法,其特征在于:
所述步骤二中计算所述亮度分量的方法是:
基于所述最大值MAXk、最小值MINk和平均值M(i)计算映射灰度值L(i):
L(i)=255×(M(i)-MINk)/(MAXk-MINk)
根据所述映射灰度值L(i),按下式计算视觉模型的亮度分量TA(j,d,i):
T A ( j , d , i ) = w ( a + b &CenterDot; T 1 ) c / g , L ( i ) &le; T 1 w ( a + b &CenterDot; L ( i ) ) c / g , T 1 < L ( i ) < T 2 w ( a + b &CenterDot; T 2 ) c / g , L ( i ) &GreaterEqual; T 2
其中a为显示器像素值为0时的电压,b是像素值与电压值之间的比例因子,c是所述显示器的伽马值,w为韦伯比,g为小波变换在第k级的能量增益因子;T1和T2分别是韦伯定律中线性区域的上下门限值。
7.如权利要求5所述的小波系数量化方法,其特征在于:
所述步骤三中计算所述掩蔽分量TM(j,d,i)的方法是:分别获取待压缩图像在二级和三级小波变换之后HL和LH方向上子带的分块,按下式计算视觉模型的掩蔽分量TM(j,d,i):
T M ( j , d , i ) = C ( 2 HL , i ) + C ( 3 , HL , i ) + C ( 2 , LH , i ) + C ( 3 , LH , i ) 2 2
其中C(2,HL,i)表示块B(2,HL,i)中系数绝对值的最大值,C(3,HL,i)表示块B(3,HL,i)中系数绝对值的最大值,C(2,LH,i)表示块B(2,LH,i)中系数绝对值的最大值,C(3,LH,i)表示块B(3,LH,i)中系数绝对值的最大值。
8.如权利要求5所述的小波系数量化方法,其特征在于:
所述步骤四中计算所述联合分量TG(j,d,i)的公式是:
TG(j,d,i)=[TA(j,d,i)]α[TM(j,d,i)]β
其中α、β分别表示亮度分量和掩蔽分量的权重值。
9.如权利要求8所述的小波系数量化方法,其特征在于:
当压缩倍数小于8倍时,所述亮度分量权重值α、掩蔽分量权重值β、频率分量权重值γ为:0.5、0.5、0.5;当压缩倍数为8~20倍时,所述亮度分量权重值α、掩蔽分量权重值β、频率分量权重值γ为:0.5、1.0、1.0。
10.一种图像压缩中利用人眼视觉模型的小波系数量化方法,其特征在于包括以下步骤:
步骤一:对待压缩图像进行小波变换,得到系数块;
步骤二:根据第k级小波变换之后的低频子带中的小波系数,计算亮度分量;
步骤三:根据小波变换之后的HL和LH方向上子带的分块,计算掩蔽分量;
步骤四:通过试验得到频率分量;
步骤五:根据所述亮度分量、所述掩蔽分量和所述频率分量,计算视觉量化阈值;
步骤六:利用所述视觉量化阈值对所述待压缩图像进行量化。
CN201080044548.6A 2010-12-16 2010-12-16 一种图像压缩中利用人眼视觉模型的小波系数量化方法 Expired - Fee Related CN102934428B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2010/079875 WO2012079237A1 (zh) 2010-12-16 2010-12-16 一种图像压缩中利用人眼视觉模型的小波系数量化方法

Publications (2)

Publication Number Publication Date
CN102934428A CN102934428A (zh) 2013-02-13
CN102934428B true CN102934428B (zh) 2015-08-05

Family

ID=46243979

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201080044548.6A Expired - Fee Related CN102934428B (zh) 2010-12-16 2010-12-16 一种图像压缩中利用人眼视觉模型的小波系数量化方法

Country Status (4)

Country Link
US (1) US8655092B2 (zh)
EP (1) EP2654294A4 (zh)
CN (1) CN102934428B (zh)
WO (1) WO2012079237A1 (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8811735B2 (en) * 2012-07-14 2014-08-19 Sigma Designs, Inc. System and method for scalar quantization error reduction
EP3167433A1 (en) * 2014-07-10 2017-05-17 Intel Corporation Method and apparatus for efficient texture compression
CN104202594B (zh) * 2014-07-25 2016-04-13 宁波大学 一种基于三维小波变换的视频质量评价方法
CN105491391A (zh) * 2014-09-15 2016-04-13 联想(北京)有限公司 一种图像压缩方法及电子设备
US10419762B2 (en) 2015-03-02 2019-09-17 Dolby Laboratories Licensing Corporation Content-adaptive perceptual quantizer for high dynamic range images
CN108718409B (zh) * 2018-06-11 2020-09-18 齐齐哈尔大学 一种遥感影像压缩方法
CN109191427B (zh) * 2018-07-24 2020-09-22 中国传媒大学 基于双目抑制的dwt域亮度掩蔽模型构建方法及装置
CN111314704B (zh) * 2018-12-12 2023-01-17 中国科学院深圳先进技术研究院 图像级jnd阈值的预测方法、装置、设备及存储介质
CN111651707B (zh) * 2020-05-28 2023-04-25 广西大学 一种基于光学浅水区卫星遥感影像的潮位反演方法
CN112738515B (zh) * 2020-12-28 2023-03-24 北京百度网讯科技有限公司 用于自适应量化的量化参数调整方法和装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000074385A2 (en) * 1999-05-27 2000-12-07 University Of Maryland, College Park 3d wavelet based video codec with human perceptual model
CN1378384A (zh) * 2001-03-23 2002-11-06 夏普公司 基于比特率预测和预测误差能量的自适应量化
CN1968419A (zh) * 2005-11-16 2007-05-23 三星电子株式会社 利用人类视觉特性对图像进行编码及解码的方法和设备

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100355375B1 (ko) * 1995-11-01 2002-12-26 삼성전자 주식회사 영상부호화장치에있어서양자화간격결정방법및회로
US7006568B1 (en) * 1999-05-27 2006-02-28 University Of Maryland, College Park 3D wavelet based video codec with human perceptual model
US6792129B1 (en) * 1999-08-25 2004-09-14 Sharp Laboratories Of America Digital watermarking in a perceptually uniform domain
US8446947B2 (en) * 2003-10-10 2013-05-21 Agency For Science, Technology And Research Method for encoding a digital signal into a scalable bitstream; method for decoding a scalable bitstream
KR100928968B1 (ko) * 2004-12-14 2009-11-26 삼성전자주식회사 영상 부호화 및 복호화장치와 그 방법

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000074385A2 (en) * 1999-05-27 2000-12-07 University Of Maryland, College Park 3d wavelet based video codec with human perceptual model
CN1378384A (zh) * 2001-03-23 2002-11-06 夏普公司 基于比特率预测和预测误差能量的自适应量化
CN1968419A (zh) * 2005-11-16 2007-05-23 三星电子株式会社 利用人类视觉特性对图像进行编码及解码的方法和设备

Also Published As

Publication number Publication date
CN102934428A (zh) 2013-02-13
US20130266237A1 (en) 2013-10-10
US8655092B2 (en) 2014-02-18
EP2654294A4 (en) 2015-11-11
WO2012079237A1 (zh) 2012-06-21
EP2654294A1 (en) 2013-10-23

Similar Documents

Publication Publication Date Title
CN102934428B (zh) 一种图像压缩中利用人眼视觉模型的小波系数量化方法
Miyahara et al. Objective picture quality scale (PQS) for image coding
Tong et al. A perceptual model for JPEG applications based on block classification, texture masking, and luminance masking
Mohammed et al. Image compression using block truncation coding
CN103051901B (zh) 视频数据编码装置和视频数据编码方法
CN103546759A (zh) 一种基于小波包和矢量量化相结合的图像压缩编码方法
CN103391437B (zh) 一种高动态图像视觉无损压缩的方法及装置
Gao et al. Quality constrained compression using DWT-based image quality metric
Rehna Hybrid approaches to image coding: A review
Lamsrichan Straightforward Color image compression using true-mean multi-level block truncation coding
Nguyen et al. Interpretability performance assessment of JPEG2000 and Part 1 compliant region of interest coding
Chourasiya et al. A Study of image compression based transmission algorithm Using SPIHT for low bit rate application
CN107749993B (zh) 基于mmse重构的分布式视频编码信源失真估算方法
CN115604489A (zh) 一种基于人类视觉质量与显示分辨率的图像压缩方法
Moreno-Escobar et al. SQbSN: JPEG2000 scalar quantizer implemented by means a statistical normalization
CN103167282A (zh) 一种图像压缩动态调整的在线更新方法
Voukelatos et al. A multiresolution adaptive VQ based still image codec with application to progressive image transmission
Liu Perceptual jpeg2000 compliant coding for color images
Delaunay et al. Best post-transforms selection in a rate-distortion sense
Kumar et al. Multi-level Block Truncation Code Algorithm for RGB Image Compression
Voukelatos et al. Wavelet based image coding using adaptive VQ
Gershikov Perceptually Optimized Coding of Color Images for Band‐Limited Information Networks
Wu et al. A fast wavelet-based image progressive transmission method based on vector quantization
TWI404421B (zh) 應用人類視覺恰可辨別差(jnd)模型之快速jpeg2000影像壓縮編碼方法及壓縮影像品質評估方法
kumar Color and multispectral image compression using Enhanced Block Truncation Coding [E-BTC] scheme

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20150805

Termination date: 20191216