CN102307303B - 一种基于三进制表示的图像预测编码方法 - Google Patents
一种基于三进制表示的图像预测编码方法 Download PDFInfo
- Publication number
- CN102307303B CN102307303B CN 201110246682 CN201110246682A CN102307303B CN 102307303 B CN102307303 B CN 102307303B CN 201110246682 CN201110246682 CN 201110246682 CN 201110246682 A CN201110246682 A CN 201110246682A CN 102307303 B CN102307303 B CN 102307303B
- Authority
- CN
- China
- Prior art keywords
- coefficient
- function
- ternary
- value
- greaterequal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
Abstract
本发明涉及一种基于三进制表示的图像预测编码方法,尤其适合于静态图像的压缩处理。本发明对图像进行小波变换及小波系数量化,将每个小波系数用三进制数表示,扫描小波系数三进制平面;选择当前待编码符号的近邻居系数作为预测系数,针对三符号的特点,定义所述预测系数的重要性状态函数、重要性状态方向加权函数、重要性状态和函数来建立高效预测模型;根据预测模型计算得到预测值,将当前待编码符号送入对应的算术编码器进行熵编码,并在频带间对算术编码器的初始值进行重置。本发明实现了对小波系数的高效预测编码,有效提高了恢复图像的客观质量。
Description
技术领域
本发明涉及一种适用于静态图像压缩的预测编码方法,尤其涉及一种利用三进制来表示小波系数,并建立相应的预测分类模型,从而提高压缩效率的小波系数预测编码方法,属于图像压缩技术领域。
背景技术
近十几年来,基于小波变换的图像压缩算法在静态图像压缩中得到广泛应用,被认为是目前压缩性能最好的方法。其压缩流程主要包括预处理、小波变换、量化、熵编码四个步骤,如图1所示。其中,熵编码根据数据出现的概率对其进行编码,能够去除数据间的统计冗余,从而用最少的数据量完成对原始图像信息的表示,是实现图像压缩的关键和保证。
常用的熵编码方法有游程编码、哈夫曼编码和算术编码。通过把其中两种熵编码方法相结合(静态图像压缩国际标准JPEG中把游程编码和哈夫曼编码结合),或者把预测技术和熵编码相结合(简称预测编码,静态图像压缩国际标准JPEG2000中把上下文预测和算术编码结合),能够更好地去除变换系数之间的冗余,提高熵编码的效率。
目前的小波系数预测编码方法一般是基于位平面对小波系数位数据进行组织和编码的,因为根据小波变换的基本原理,小波系数的幅值大小代表了其对恢复图像质量影响的重要程度,在给定位率下,优先编码重要系数(幅值大的系数)能够提高恢复图像的质量,但是,严格按照绝对值大小的顺序编码会增加大量的位置信息,为此引入位平面编码的思想。所谓位平面,是指将小波系数用二进制的形式来表示,此时,所有系数的相同位组成的平面就称为一个位平面。因此,位平面编码的过程,就是沿着位平面从高到低的顺序,依次扫描编码每个位平面中的所有位数据。采用这种方式,自然使得幅值较大的系数优先得到编码,从而巧妙地避免了位置信息开销。同时,在基于位平面进行编码更有利于挖掘小波系数之间的相关性,从而充分去除系数间的冗余,提高压缩效率。
在图像压缩中,图像数据的熵值是决定压缩效率最直接、最重要的因素,然而基于位平面表示的方法未能有效逼近信源的高阶条件熵,阻碍了压缩性能的进一步提高。根据统计实验,高进制表示下的小波系数对应了更小的熵值,具有更大的压缩潜力,有望进一步改善小波系数的压缩性能。然而,如果选用的进制过高,每层平面包含的信息量会很大,这一方面不利于按照率失真原则对重要信息优先编码(由于信息划分的粒度变粗),另一方面可能会导致相关性利用不够充分(每个符号包含的信息量变大,包括那些后于当前待编码符号被扫描的系数,使得更多的预测信息无法被利用)。
基于以上分析,根据各进制表示下小波系数的熵值统计特性,三进制表示下的小波系数比位平面表示具有更小的熵值,同时其信息划分粒度比其他高进制更细。因此,本发明选择三进制来表示小波系数,给出一种基于三进制表示的小波系数预测编码方法。本发明将每个小波系数用三进制数表示,并按照压缩时的顺序扫描小波系数三进制平面;针对三符号表示的特点,建立小波系数预测模型,设计相应的算术编码方法,实现了对小波系数的高效压缩。
发明内容
针对如上所述的问题,本发明采用如下所述的技术方案:
一种基于三进制表示的图像预测编码方法,其特征在于,包括以下步骤:
步骤一:对图像进行小波变换及小波系数量化,将量化后每个小波系数用三进制数表示,得到小波系数三进制平面;对小波系数三进制平面进行扫描,得到由0、1、2组成的三符号数据流;
步骤二:选择当前待编码符号的近邻居系数作为预测系数;
根据三进制表示下符号特点,构造预测函数,包括:重要性状态函数、重要性状态方向加权函数和重要性状态和函数,反映系数间的各种相关性;
设定阈值对概率分布相似的预测函数值进行合并,建立小波系数预测模型,从而将待编码符号分为若干类,每一类对应一个预测值;将预测系数的具体取值代入到上述预测函数中,可以算出一个函数值,值域是一个有限范围内的离散值,将某些函数值合并是指不同预测系数值可算出相同的函数值,合并后的预测函数组称为预测模型;
步骤三:对于当前待编码符号,通过上述预测模型计算得到预测值,并送入相应的算术编码器进行熵编码,每当开始编码一个新的频带,就对算术编码器的初始值进行重新设置。
所述步骤二中,选择作为预测系数的近邻居系数为当前待编码符号周围相邻的8个系数N0~N7。
所述步骤二中,所述预测系数的重要性状态函数定义为:
其中,Mi表示所述预测系数Ni(0≤i≤7)的幅值,p表示当前正在编码的三进制平面层数,S3(Mi,p)函数值表示所述预测系数在当前层平面的重要性状态值。
所述步骤二中,利用如下公式对所述重要性状态函数进行加权求和,定义重要性状态方向加权函数为:
其中,wi表示所述预测系数的权重,S3(Mi,p)为重要性状态函数。
所述步骤二中,定义重要性状态和函数表达式为
其中,σ3(Mi)为重要性判别函数,定义为
其中,S3(Mi,p)为重要性状态函数,重要性判别函数σ3(Mi)表示了预测系数Ni(0≤i≤7)在当前层平面p是否重要。
所述步骤二中,对概率分布相似的预测函数值进行合并,构造出小波系数预测模型,其表达式定义为
其中,f1(M)为重要性状态方向加权函数,f2(M)为重要性状态和函数,pred表示最终的预测值,根据不同的预测值取值,最终将小波系数三符号数据分为9类。
所述步骤三中,对算术编码器的初始值进行重新设置是指将已编码的比当前频带高一层平面低一级频带的实际频率收缩值赋值给当前频带,另外,最高层平面使用低一级频带的收缩值进行重置,最低级频带使用上一层平面的值进行重置。其中,收缩值是将所有频数值除以最小频数值得到的值。
本发明基于三进制平面表示来实现小波系数的预测编码,通过构造三进制表示下的高精度预测模型,设计相应的算术编码方法来实现对小波系数的高效压缩。实验结果表明,在相同压缩比下与基于位平面表示的静态图像压缩标准JPEG2000相比,有效提高了恢复图像的客观质量。此外,本发明所提供的预测编码方法并不局限于小波变换,同样适用于其他的多尺度变换系数的编码,并可以推广应用于其他领域的数据表示及编码。
附图说明
下面结合附图和具体实施方式对本发明作进一步的说明。
图1是基于小波变换的图像压缩方法的压缩/解压缩流程图。
图2为本发明所述的一种基于三进制表示的图像预测编码方法的基本流程图。
图3(a)所示为3级金字塔小波分解示意图,图3(b)是小波系数的三进制平面表示示意图,图3(c)给出了所选预测系数集合。
具体实施方式
本发明的基本思路在于:扫描小波系数三进制平面,并综合多个系数的预测作用建立预测模型,将待编码的小波系数三符号数据分为多类,分别送入对应的算术编码器进行编码。
下面,参照图2所示的本小波系数预测编码方法的各个实施步骤,对本发明进行详细的说明。
步骤一:对图像进行小波变换及小波系数量化,将量化后每个小波系数用三进制数表示,得到小波系数三进制平面;对小波系数三进制平面进行扫描,得到由0、1、2组成的三符号数据流。
对待压缩图像进行6级小波变换,图像压缩中小波变换相当于一个子带滤波器,对于一幅图像进行一次小波变换后得到第一级的四个频带LL1、LH1、HL1和HH1,依次对各级的低频LLk进行分解得到更粗一级的四个频带,即小波的塔式分解,如图3(a)所示为3级小波分解示意图。对小波系数进行量化,使得压缩倍数可以满足实际应用要求。
根据各进制表示下小波系数的熵值统计特性,如表1所示,三进制表示对应了一个极小值点,与二进制表示方法相比,其熵值显著降低,大约5万bit左右;同时,相较于其他更高进制的表示方式,它层次划分的粒度更细,更符合率失真的原则。为此,本发明将每个小波系数用三进制数表示,从而得到小波系数三进制平面,如图3(b)然后按照压缩时采用的编码顺序对小波系数三进制平面进行扫描,通常可以采用Zig-zag扫描方式。
表1各进制表示下小波系数的熵值统计情况(bit)
进制 | Lena图像 | Barbara图像 | City图像 |
二进制 | 1459172 | 1588531 | 2117764 |
三进制 | 1409468 | 1533125 | 2050260 |
四进制 | 1422034 | 1549599 | 2086956 |
五进制 | 1400664 | 1525949 | 2057646 |
六进制 | 1360737 | 1480468 | 1989779 |
七进制 | 1380514 | 1501997 | 2026577 |
八进制 | 1394885 | 1517309 | 2053100 |
九进制 | 1328246 | 1443209 | 1940238 |
十进制 | 1337307 | 1454028 | 1958322 |
步骤二:选择当前待编码符号的近邻居系数作为预测系数;根据三进制表示下符号特点,构造预测系数的重要性状态函数、重要性状态方向加权函数和重要性状态和函数,反映系数间的各种相关性;设定阈值对概率分布相似的预测函数进行合并,建立小波系数预测模型,从而将待编码符号分为若干类,每一类对应一个预测值。
预测系数的选择是依据小波变换的空频局部化特性,选取与当前待编码系数相关性最强的8个近邻居系数N0~N7作为预测系数,如图3(c)所示。
根据所述预测系数在上层平面重要、当前层平面重要或者还未重要这三种状态以及在不同平面的取值情况,赋予所述预测系数五种不同取值,所述预测系数的重要性状态函数定义如下:
其中,Mi表示所述预测系数Ni(0≤i≤7)的幅值,p表示当前正在编码的三进制平面层数,S3(Mi,p)表示所述预测系数在当前层平面的重要性状态值,S3(Mi,p)越大表明系数Ni的重要性程度越高。
接着,定义重要性状态方向加权函数f1(M)是Mi,0≤i≤7的线性函数,表达式为
其中wi表示对应预测系数的权重,体现预测作用的大小,S3(Mi,p)表示预测系数在三进制平面p的重要性状态值。该函数把高维问题降为一维问题,体现了多个近邻居系数的综合预测作用。对于权重wi的设定,主要根据预测作用的大小分配,如表2所示。对于HL频带,按照相关性由强到弱的次序是:垂直系数>水平系数>对角系数,按照简化区分的原则设计权重依次为4、2、1。同理可得LH频带的预测系数权重,只是水平方向系数的权重大于垂直方向。对于HH频带,由于方向性不明显,仅把权重分为2类,即水平和垂直的4个系数的权重为2,对角4个系数的权重为1。
表2近邻居预测系数权重值
预测系数 | HL方向 | LH方向 | HH方向 |
N1,N6 | 4 | 2 | 2 |
N3,N4 | 2 | 4 | 2 |
N0,N2,N5,N7 | 1 | 1 | 1 |
接着,定义重要性状态和函数f2(M)表达式为
其中,σ3(Mi)为重要性判别函数,定义为
其中,S3(Mi,p)为重要性状态函数,重要性判别函数σ3(Mi)表示了预测系数在当前层平面p是否重要。
为避免了上下文稀释的问题,即由于样本种类过多而数量不足所导致的学习代价过高的问题,通过对大量典型图像的统计分析,发现有些近邻居预测函数值对应的数据概率分布是相似的,可以对其进行合并。因此,本发明给出了如下预测值pred表达式
至此,预测模型建立完毕。以上实际预测系数的选择和预测模型的建立都是通过统计大量图像数据,在离线方式下完成的。实际在线编码时,待编码符号可以根据实际预测系数的取值利用上式得到9种不同的预测值,并最终送入不同的算术编码器进行编码。
步骤三:对于当前待编码符号,通过上述小波系数预测模型计算得到预测值,根据计算出的预测值将所述当前待编码符号送入相应的算术编码器进行熵编码;当开始编码一个新的频带时,对算术编码器的初始值进行重新设置。
理论上,预测值相同的待编码符号具有相似的概率分布。然而,同一幅图像内不同区域的纹理特征存在差异,使得不同级频带对应同一个预测值的待编码符号概率分布存在较大的差异。表3给出了City图像在不同符号平面不同频带级预测值为5的类中,三符号码流对应的单位熵值(表示每一个三进制符号所需要的平均bit数),“-”表示该平面对应频带中没有这一预测值的符号数据,或者样本数量过少没有统计意义。从中可以看出,对同一个预测值,从最低频到最高频单位熵值呈现变小的趋势,从最高平面到最低平面单位熵值逐渐变大;特别地,对角线方向的熵值具有更高的相似度,即当前平面当前频带的符号数据与比它高一层平面低一级频带的符号数据具有更相似的单位熵值,对于其它预测值也存在类似情形,而不同的单位熵值对应了不同的概率分布。
对概率分布存在差异的符号流采用同一个算术编码器编码会影响压缩效率,因为对自适应算术编码来说,只有当编码器的概率分布表和符号流的实际概率分布相同时编码效率才最高,实际符号流中如果概率分布不稳定,那么自适应算术编码器的概率更新策略会不断调整其概率分布表,从而难以达到一个稳定的概率分布。
表3City图像不同平面不同频带预测值5对应的码流单位熵值(bit)
基于上述实验结果,本发明采用以下算术编码初始值设置策略:对于预测值相同的待编码符号,编码过程中在频带间对概率估计初始值进行重置,利用已编码的比它高一层平面低一级(表中左上方向)频带的实际频率收缩值对它的概率估计值进行重置,最高层平面使用低一级频带的收缩值进行重置,最低级频带使用上一层平面的值进行重置。其中,收缩值是指将较小的频数值化为1,例如某频带实际编码中0、1、2的频数值为100∶20∶5,则收缩值为20∶4∶1。这一初始值重置策略不仅使得自适应算术编码器可以尽快适应当前频带的概率分布,同时使用收缩值而非原始值加快了其适应的速度。
本发明提供的基于三进制表示的预测编码方法能够逼近信源的高阶熵,预测模型精度高,算术编码初始值设置策略简单、有效,从而实现了小波系数的高效编码。与静态图像压缩国际标准JPEG2000的预测编码方法相比,实验结果如表4所示,在相同压缩倍数下,恢复图像客观质量均有明显提高。此外,所述方法并不局限于小波变换,同样适用于其他的多尺度变换系数的编码,并可推广应用于其他领域的数据表示和编码。
表4本发明和JPEG2000预测编码压缩性能比较(dB)
对本领域的一般技术人员而言,在不背离本发明实质精神的前提下对它所做的任何显而易见的改动,都将构成对本发明专利权的侵犯,将承担相应的法律责任。
Claims (4)
1.一种基于三进制表示的图像预测编码方法,其特征在于,包括以下步骤:
步骤一:对图像进行小波变换及小波系数量化,将量化后每个小波系数用三进制数表示,得到小波系数三进制平面;对小波系数三进制平面进行扫描,得到由0、1、2组成的三符号数据流;
步骤二:选择当前待编码符号的近邻居系数作为预测系数;
根据三进制表示下符号特点,构造预测函数,包括:构造预测系数的重要性状态函数、重要性状态方向加权函数和重要性状态和函数;
设定阈值对概率分布相似的预测函数值进行合并,建立小波系数预测模型,从而将待编码符号分为若干类,每一类对应一个预测值;
步骤三:对于当前待编码符号,通过上述预测模型计算得到预测值,并送入相应的算术编码器进行熵编码,每当开始编码一个新的频带,就对算术编码器的概率估计初始值进行重新设置;
所述预测系数的重要性状态函数定义为:
其中,Mi表示所述预测系数Ni的幅值,其中0≤i≤7,p表示当前正在编码的三进制平面层数,S3(Mi,p)的函数值表示所述预测系数在当前层平面的重要性状态值;
所述步骤二中,利用如下公式对所述重要性状态函数进行加权求和,定义重要性状态方向加权函数为:
其中wi表示所述预测系数的权重,S3(Mi,p)为重要性状态函数;
所述步骤二中,定义重要性状态和函数表达式为
其中,σ3(Mi)为重要性判别函数,定义为
其中S3(Mi,p)为重要性状态函数,重要性判别函数σ3(Mi)表示了预测系数在当前层平面p是否重要。
2.如权利要求1所述的一种基于三进制表示的图像预测编码方法,其特征在于:
所述步骤二中,选择作为预测系数的近邻居系数为当前待编码符号周围相邻的8个系数N0~N7。
3.如权利要求1所述的一种基于三进制表示的图像预测编码方法,其特征在于:
所述步骤二中,对概率分布相似的预测函数值进行合并,构造出小波系数预测模型,其表达式定义为
其中,f1(M)为重要性状态方向加权函数,f2(M)为重要性状态和函数,pred表示最终的预测值,根据不同的预测值取值,最终将小波系数三符号数据分为9类。
4.如权利要求1所述的一种基于三进制表示的图像预测编码方法,其特征在于:
所述步骤三中,对算术编码器的概率估计初始值进行重新设置是指将已编码的比当前频带高一层平面低一级频带的实际频率收缩值赋值给当前频带,最高层平面使用低一级频带的收缩值进行重置,最低级频带使用上一层平面的值进行重置;其中,收缩值是将所有频数值除以最小频数值得到的值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201110246682 CN102307303B (zh) | 2011-08-24 | 2011-08-24 | 一种基于三进制表示的图像预测编码方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201110246682 CN102307303B (zh) | 2011-08-24 | 2011-08-24 | 一种基于三进制表示的图像预测编码方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102307303A CN102307303A (zh) | 2012-01-04 |
CN102307303B true CN102307303B (zh) | 2013-01-30 |
Family
ID=45381100
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 201110246682 Active CN102307303B (zh) | 2011-08-24 | 2011-08-24 | 一种基于三进制表示的图像预测编码方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102307303B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110830169A (zh) * | 2019-11-12 | 2020-02-21 | 深圳市本特利科技有限公司 | 一种电子雷管检测装置三进制编码方法 |
CN114974579B (zh) * | 2022-04-20 | 2024-02-27 | 山东大学齐鲁医院 | 消化道粘膜下肿瘤内镜治疗预后的辅助判定系统及设备 |
CN115633168A (zh) * | 2022-09-30 | 2023-01-20 | 腾讯科技(深圳)有限公司 | 一种视频处理方法及相关设备 |
CN117714655B (zh) * | 2024-02-06 | 2024-04-09 | 长春理工大学 | 一种基于四进制脉宽调制的超高帧率投影方法和装置 |
-
2011
- 2011-08-24 CN CN 201110246682 patent/CN102307303B/zh active Active
Non-Patent Citations (6)
Title |
---|
Anthony Yezzi,Jr. et al..Binary and Ternary Flows for Image Segmentation.《IEEE》.1999,全文. |
Binary and Ternary Flows for Image Segmentation;Anthony Yezzi,Jr. et al.;《IEEE》;19991231;全文 * |
Christos Chrysafis et al..Efficient Context-Based Entropy Coding for Lossy Wavelet Image.《IEEE》.1997,全文. |
Efficient Context-Based Entropy Coding for Lossy Wavelet Image;Christos Chrysafis et al.;《IEEE》;19971231;全文 * |
利用多进制小波包变换进行遥感影像融合;杨韫澜 等;《海洋测绘》;20070731;第27卷(第4期);全文 * |
杨韫澜 等.利用多进制小波包变换进行遥感影像融合.《海洋测绘》.2007,第27卷(第4期),全文. |
Also Published As
Publication number | Publication date |
---|---|
CN102307303A (zh) | 2012-01-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102550027B (zh) | 用于图像和视频压缩的局部可变量化和混合可变长度编码 | |
CN1303820C (zh) | 基于质量的图像压缩 | |
CN103945220B (zh) | 一种用于高效视频编码hevc的量化优化方法 | |
CN103024383A (zh) | 一种基于hevc框架的帧内无损压缩编码方法 | |
CN100596198C (zh) | 一种编码方法及编码器 | |
EP2406958A2 (en) | Adaptive entropy coding for images and videos using set partitioning in generalized hierarchical trees | |
CN102307303B (zh) | 一种基于三进制表示的图像预测编码方法 | |
CN106612439A (zh) | 一种自适应快速分形图像压缩方法 | |
CN101383972A (zh) | 基于空间预测与变换的遥感图像压缩方法 | |
CN102316324B (zh) | 一种基于局部最小熵的图像编码预测方法 | |
CN104079947B (zh) | 一种基于改进ezw的声纳图像数据压缩方法 | |
CN101783939A (zh) | 一种基于人眼视觉特性的图像编码方法 | |
CN106331719B (zh) | 一种基于k-l变换误差空间拆分的图像数据压缩方法 | |
CN109951711A (zh) | 一种基于随机阈值调整的ezw数据压缩方法 | |
Kale et al. | Visually improved image compression by combining EZW encoding with texture modeling using Huffman Encoder | |
CN1276391C (zh) | 基于小波变换的图像压缩方法 | |
JP5218318B2 (ja) | ウェーブレット変換符号化方法および装置 | |
Zhang et al. | Context-based arithmetic coding reexamined for DCT video compression | |
CN100469144C (zh) | 熵编码器表格变换方法 | |
Vermeirsch et al. | Region-adaptive probability model selection for the arithmetic coding of video texture | |
Waysi et al. | Enhanced Image Coding Scheme Based on Modified Embedded Zerotree Wavelet Transform (DMEZW) | |
Zeng et al. | Learned Image Compression With Variable Neural Network Architecture | |
Wu et al. | Directional wavelet transform and block-set partitioning for image coding | |
Brahimi et al. | An efficient wavelet-based image coder | |
CN104469389A (zh) | 基于变换下采样的低码率视频编码方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20190417 Address after: 100080 Yishengyuan Business Apartment, No. 331 East Zhongguancun Road, Haidian District, Beijing, 5 doors 106 Patentee after: BEIJING CKLEADER SOFTWARE TECHNOLOGY CO., LTD. Address before: 100191 Xueyuan Road, Haidian District, Beijing, No. 37 Patentee before: Beihang University |