CN111741307A - 基于矢量量化压缩和线性回归预测的图像压缩方法 - Google Patents

基于矢量量化压缩和线性回归预测的图像压缩方法 Download PDF

Info

Publication number
CN111741307A
CN111741307A CN202010517753.5A CN202010517753A CN111741307A CN 111741307 A CN111741307 A CN 111741307A CN 202010517753 A CN202010517753 A CN 202010517753A CN 111741307 A CN111741307 A CN 111741307A
Authority
CN
China
Prior art keywords
block
compression
image
blocks
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010517753.5A
Other languages
English (en)
Other versions
CN111741307B (zh
Inventor
许舒颖
张靖群
刘燕君
袁文强
李黎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shaoxing Tuxin Technology Co ltd
Hangzhou Dianzi University
Original Assignee
Shaoxing Tuxin Technology Co ltd
Hangzhou Dianzi University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shaoxing Tuxin Technology Co ltd, Hangzhou Dianzi University filed Critical Shaoxing Tuxin Technology Co ltd
Priority to CN202010517753.5A priority Critical patent/CN111741307B/zh
Publication of CN111741307A publication Critical patent/CN111741307A/zh
Application granted granted Critical
Publication of CN111741307B publication Critical patent/CN111741307B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/167Position within a video image, e.g. region of interest [ROI]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Abstract

本发明公开了一种基于矢量量化压缩和线性回归预测的图像压缩方法。首先,将原始图像Cover切割成Block块;其次,用LBG算法对典型图像进行分群训练,得出与Block大小一致的Codeword的对应的Codebook;然后,针对特定的Codeword,以其余Codeword作为自变量进行线性回归训练,得到特定Codeword的预测等式;最后,在图像压缩过程中根据线性回归预测的结果计算OrigBlock和PredBlock的欧几里得距离,再根据门槛值判断采取动态的压缩策略进行Block压缩。本方法基于矢量量化压缩对压缩结果进行再压缩,在保证视觉阈值的前提下,大幅度的提升图像压缩率,能将Cover平均压缩到32倍,至多能压缩至50倍。

Description

基于矢量量化压缩和线性回归预测的图像压缩方法
技术领域
本发明属于信息压缩技术领域,涉及一种图像压缩的方法,具体涉及一种基于矢量量化压缩和线性回归预测的图像压缩法。
背景技术
现阶段,越来越多的数据需要通过互联网传输。但是,如果传输的信息量过大,则在带宽有限的情况下极容易造成信息阻塞。因此,对于需要通过互联网传输的数据,可以在保证视觉质量的前提下,通过压缩技术来减少数据传输总量从而提升数据传输效率。因此,为了提升传输效率,我们应该在保证恢复数据可接受的前提下,尽可能的对数据进行压缩。但是压缩率和恢复数据质量显然是两个互斥的概念。所以,如何在保持两者平衡的前提下,获取最优的结果成了非常关键的问题。
图像压缩是其传输、存储的基础。现阶段,图像压缩被划分成有损压缩和无损压缩。无损压缩其压缩比由于存在极限,并不能大幅度实现减少压缩空间的目的。由于图像中存在统计性质的冗余性,因而会产生视觉上的多余性,所以冗余数据的去除并不影响图像的视觉质量,甚至去除一些图像细节对图像质量也影响不大。因此,图像中相邻像素存在数据冗余和人的肉眼无法分辨较小的像素误差都意味着可以通过合理有损压缩技术将图像压缩,从而减少传输以及存储所需的空间。基于以上理论,可以允许有损压缩图片复原之后存在一定程度的失真,但失真程度人肉眼无法察觉。
发明内容
本发明的方法所采用的技术方案是:一种基于矢量量化压缩和线性回归预测的图像压缩方法。该方法中,首先,将原始图像Cover切割成Block块;其次,用LBG算法对典型图像进行分群训练,得出与Block大小一致的Codeword的对应的Codebook;然后,针对特定的Codeword,以其余Codeword作为自变量进行线性回归训练,得到特定Codeword的预测等式;最后,在图像压缩过程中根据线性回归预测的结果计算OrigBlock和PredBlock的欧几里得距离,再根据门槛值判断采取不同的压缩策略进行Block压缩。
本发明具体采用的技术方案如下:
一种基于矢量量化压缩和线性回归预测的图像压缩方法,其步骤如下:
S1:将待压缩的图像集合中的每张原始图像分割成若干不重叠的m×m大小的块,其中每个块包含m×m个像素C;
S2:选取若干图像进行分群训练,获得编码簿,编码簿的获取方法如S21~S25:
S21:选取若干张代表图像,并将每张代表图像分割成若干不重叠的m×m大小的块,所有代表图像的块构成OBlock集合;
S22:在OBlock集合中随机选取出M个块,记为Mblock,OBlock集合中除了Mblock之外剩余的块记为(O-M)Block;
S23:以Mblock作为M个群的初始中心,计算(O-M)Block中的每个块与M个初始中心之间的欧几里德距离ED,并将其划入ED值最小的群中,获得M个群;S24:分别针对M个群重新计算每个群的重心,M个群新的重心记为MBlock′;S25:迭代执行S23和S24共N次,使MBlock′变化趋于稳定,获得迭代N次后的M个群的重心MBlockN,即编码簿,其中每个群的重心记为BlackN,即码字;
S3:将编码簿进行线性回归训练,获得待压缩位置的线性等式,训练方法如S31~S32:
S31:每个码字对应的BlockN中包含m×m个像素T,以BlockN中最顶行和最左列的2m-1个像素值[T1,T2,...,T2m-1]为自变量,以BlockN中其余的m2-2m+1个像素中任意一个像素值T′e为因变量,建立线性预测方程
Figure BDA0002530754290000021
S32:以编码簿中的M个码字为样本,对S31中建立的每个T′e的线性预测方程进行拟合,得到m2-2m+1组线性预测方程的拟合参数[be0′,be1′,...,b2m-1′];
S4:对待压缩的图像集合中的每张原始图像进行像素预测压缩,压缩方法如S41~S43:
S41:用VQC压缩原始图像中最顶行和最左列的块,并在位置标识图中标记为1;针对原始图像中其余待压缩块,按照从上到下,从左到右的顺序,依次对每个待压缩的块执行S42和S43;
S42:当前待压缩的块记为B(i,j),则其左侧块为B(i,j-1),上方块为B(i-1,j),用B(i,j-1)内最右列的像素和B(i-1,j)内最底行的像素对B(i,j)内最顶行和最左列的2m-1个像素C进行赋值,赋值公式为:
C′P,P=(UB,1+L1,B)/2,P=1
C′1,P=UB,P,1<P≤m
C′P,1=LP,B,1<P≤m
其中:C′p,q表示B(i,j)中第p行第q列的像素赋值后的像素值,1≤p≤m,1≤q≤m;UB,P表示B(i-1,i)内最底行第P列的像素值;LP,B表示B(i,j-1)内第P行最右列的像素值;
S43:对于B(i,j)中剩余未压缩的m2-2m+1个像素C,分别基于所述S32中拟合得到的m2-2m+1组线性预测方程,以S42中已经赋值的2m-1个像素C的值作为自变量,进行像素值预测;
S5:对于每张原始图像中的每个块,将其记为OrigBlock,而OrigBlock经过S4中像素预测压缩后记为PredBlock,计算OrigBlock和PredBlock的欧几里德距离ED;
S6:根据ED与门槛值TH对每张原始图像中的每个块动态选择压缩策略,若ED≤TH则在位置标识图上标记为0,以PredBlock代替OrigBlock;若ED>TH则用编码簿中与OrigBlock的欧几里德距离最小的码字索引代替OrigBlock内所有像素C的值,并在位置标识图上标记为1;每张原始图像的每个块都进行动态压缩策略选择后,生成压缩图像PCover及其位置标识图;所述位置标识图和PCover中的码字索引用于向接收端发送。
基于上述技术方案,各步骤可以采用如下优选方式实现。各优选方式若无冲突均可进行相互组合,不构成限制。
优选的,所述的S21中,选取的代表图像数量为3~5张。
优选的,所述的S41中,对块进行VQC压缩时,将块与编码簿内所有码字计算欧几里德距离ED,以ED最小的码字的索引代替该块内所有像素。
优选的,所述的S43中,每个像素预测所采用的线性预测方程为码字中同一位置T′e拟合得到的线性预测方程,呈一一对应关系。
优选的,所述原始图像的大小为512×512。
优选的,所述块的大小为4×4。
优选的,所述M为256、512或1024。
优选的,当接收端收到位置标识图和PCover中的码字索引后,根据位置标识图进行图像恢复:若位置标识图上块的标记为1,表明该块采取VQC压缩,则在编码簿中取出该块的码字索引对应的码字,并代替该块;若位置标识图上块的标记为0,表明该块采取像素预测压缩,则重复S42和S43;对所有块执行完恢复操作后,得到压缩图像PCover。
本发明方法与现在的技术相比有如下优点和有益效果:
本发明属于信息压缩领域,具体涉及一种基于矢量量化压缩和线性回归预测的图像压缩方法,该方法运用线性回归训练进行预测,基于矢量量化压缩基础上进行再压缩,在保证视觉阈值的前提下,大幅度的提升压缩率,对于较平滑的图像能够压缩将图像压缩至五十倍以上。
附图说明
图1本发明实施例的PPC流程图。
图2本发明实施例的VQC示意图。
图3本发明实施例的首行首列压缩示意图。
图4本发明实施例的C边缘赋值示意图。
图5本发明实施例的C预测示意图。
图6本发明实施例的C预测实例示意图
图7本发明实施例的压缩图像效果图。
具体实施方式
为了便于本领域普通技术人员理解和实施本发明,下面结合附图实例对本发明做进一步详细描述,应当理解,此处所描述的实施例仅用于说明和解释本发明,并不用于限定本发明。
为了便于后续说明,先对部分名词进行定义:
当一组原始图像需要进行压缩时,用于压缩的原始图像记为Cover,原始图像集合记为Cover图像集合。将典型图像进行分群训练获得编码簿的过程记为LBG算法,简称为LBG。将具有典型区块特征的样本记为编码簿Codebook,将Codebook中向量称为Codeword。将Cover采取像素预测压缩的过程记为PPC。将Cover采取矢量量化压缩的过程记为VQC(矢量量化压缩)。将Cover图像进行PPC压缩之后的压缩图像记为PCover,压缩图像集合记为PCover集合。将计算两个Block误差的方式记为欧几里德距离计算,简称ED。将压缩过程中的块记为Block。在压缩操作中的最小操作单位,即图像中的每个像素中的单色分量,记为C。Codeword中的最小单位,记为T,T本质上是Block中的像素。
下面结合附图,对本发明的一个具体实施例做进一步详细描述:
步骤1:将待压缩的图像集合中的每张原始图像Cover分割成若干不重叠的m×m大小的块Block,其中每个Block包含m×m个像素C。
在本实施例中,选择大小为512×512的灰阶图像作为原始Cover;将Cover分割成Block,每个Block包含4×4个C,即将Cover分割成128×128个Block。
步骤2:选取若干代表图像进行LBG分群训练,获得Codebook。LBG分群训练获得Codebook的核心在于通过N次迭代获取MBlockN,其具体过程为:
步骤2.1:选取3~5张相对于Cover图像集合具有典型代表性的代表图像Origimage,并将每张代表图像分割成若干不重叠的m×m大小的块,所有代表图像切割后的块构成OBlock集合;
在本实施例中,均匀选择2张简单灰阶图像和2张复杂灰阶图像作为Origimage;将4张灰阶图像分割成Block,此处Block包含4×4个C,所有Block的集合记为OBlock集合。
步骤2.2:在OBlock集合中随机选取出M个Block,记为Mblock,OBlock集合中除了Mblock之外剩余的块记为(O-M)Block。
在本实施例中,在OBlock中随机选取的Block个数M根据需要设定。实验结果表明M可以设计为256、512以及1024,均能达到较好的阈值和压缩率。此处,将M设计为256。
步骤2.3:以Mblock作为M个群的初始中心,计算(O-M)Block中的每个块与M个初始中心之间的欧几里德距离ED,并按照最邻近划分的远足,将其划入ED值最小的群中,获得M个大小不等的群。
在本实施例中,将(O-M)Block分别依次与256个Block在对应位置上执行计算ED操作;对于(O-M)Block中任意一个Block,必然能与256个Block中的一个产生min{ED};将(O-M)Block依据min{ED}进行分群。
步骤2.4:分别针对M个群重新计算每个群的重心,M个群新的重心记为MBlock′。
在本实施例中,分群产生大小不等的M群组,对群内所有Block分别求取其重心,此时获得256个MBlock′。
步骤2.5:迭代执行步骤2.3和步骤2.4共N次,使MBlock′变化趋于稳定,获得迭代N(N>100)次后的M个群的重心MBlockN,即Codebook,其中每个群的重心记为BlockN,即Codeword。Codeword与Block大小一致,每个Codeword具有唯一的索引Index。
在该步骤中,其本质是通过不断迭代,使得群组的分类逐渐稳定,所谓趋于稳定,其判断标准可以以群的重心位置的变化值来表征,即:将MBlock′与(O-M)Block再执行计算ED操作,在分群,求取新的重心;迭代N次,直至新重心与N-1次重心并未有明显变化,即分群稳定;将N次迭代后产生的重心记为MBlockN,选取为Codebook。
步骤3:将Codebook进行线性回归训练,获得待压缩位置的线性等式。对于Codeword中任意Ta,通过由其余位置上与其有关的若干个T线性回归训练获得其近似值T′a,其具体过程为:
步骤3.1:每个Codeword对应的BlockN中包含m×m个像素T,以BlockN中最顶行和最左列的2m-1个像素值[T1,T2,...,T2m-1]为自变量,以BlockN中其余的m2-2m+1个像素中任意一个像素值T′e为因变量,建立线性预测方程
Figure BDA0002530754290000061
Figure BDA0002530754290000062
步骤3.2:以Codebook中的M个Codeword为样本,对步骤3.1中建立的每个T′e的线性预测方程进行拟合,得到m2-2m+1组线性预测方程的拟合参数[be0′,be1′,...,b2m-1′];
在本实施例中,Codebook中包含256个Codeword,其中每个Codeword中含有16个T,T本质上是BlockN中的像素。如图4,对于待压缩的Block,其最上行与最左列7个C由相邻Block赋值作为自变量,其余9个相对位置的C,则由此步骤所得9个等式预测;故在Codebook中,选取Codeword中T1,T2,T3,T4,T5,T9,T13作为自变量,拟合之后获得9个等式T′e=be0′+be1′T1+be2′T2+be3′T3+be4′T4+be5′T5+be9′T9+be13′T13(e∈6,7,8,10,11,12,14,15,16),使得
Figure BDA0002530754290000063
Te为块中的真实像素值。
步骤4:对待压缩的图像集合中的每张原始图像Cover进行像素预测压缩(PPC),PPC压缩的核心在于利用待压缩的Block上方和左侧的Block,预测其自身的Block中像素值。其具体做法如下:
步骤4.1:用VQC压缩Cover中最顶行和最左列的Block,并在位置标识图中标记为1。针对Cover中其余待压缩Block,按照从上到下,从左到右的顺序,依次对每个待压缩Block执行步骤4.2和步骤4.3。
如图3,本实施例中对于Cover中最顶行和最左列Block用VQC压缩,并在位置标识图中1。其中如图2,对Block进行VQC压缩时,将Block与Codebook内所有Codeword计算欧几里德距离ED,以ED最小的Codeword的Index代替该Block内所有像素C。所谓从上到下,从左到右,其含义是对于剩余的块,从最左侧一列块开始,从上到下依次选择最上方的块进行VQC压缩,当该列块压缩完毕后,选择左侧第二列块进行压缩,依次进行。
步骤4.2:记当前待压缩Block记为B(i,j),则其左侧Block为B(i,j-1),上方Block为B(i-1,j),用B(i,j-1)内最右列的像素和B(i-1,j)内最底行的像素对B(i,j)内最顶行和最左列的2m-1个像素C进行赋值,赋值公式(记为等式1)为:
C′P,P=(UB,1+L1,B)/2,P=1
C′1,P=UB,P,1<P≤m
C′P,1=LP,B,1<P≤m
其中:Cp,q表示B(i,j)中第p行第q列的像素赋值后的像素值,1≤p≤m,1≤q≤m;UB,P表示B(i-1,j)内最底行第P列的像素值;LP,B表示B(i,j-1)内第P行最右列的像素值。
在本实施例中,如图4所示,通过公式(1)对B(i,j)内C进行赋值,C1=(L4+U13)/2,C2=U14,C3=U15,C4=U16,C5=L8,C9=L12和C13=L16;如图6所示,右子图为赋值之后结果。
步骤4.3:对于B(i,j)中剩余未压缩的m2-2m+1个像素C,分别基于步骤3.2中拟合得到的m2-2m+1组线性预测方程,以步骤4.2中已经赋值的2m-1个像素C的值作为自变量,进行像素值预测。需注意的是,每个像素预测所采用的线性预测方程为Codeword中同一位置T′e拟合得到的线性预测方程,呈一一对应关系。
在本实施例中,如图5所示,如前面所述蓝色部分C由橙色部分C进行预测;这里假设T6′=-0.4583-0.7240×T1+0.9301×T2-0.0530×T3+0.0127×C4+0.9885×T5-0.4932×T9+0.3415×T13;如图6所示,将右子图白色C作为自变量,代入上方等式,可得C′6=155,由于C6=154,故
Figure BDA0002530754290000081
表明通过该方法可以利用周边的Block较为准确地预测出当前Block中的像素值。
步骤5:对于每张原始图像Cover中的每个Block,将其记为OrigBlock,而OrigBlock经过步骤4中像素预测压缩后记为PredBlock,计算OrigBlock和PredBlock内C的欧几里德距离ED。
在本实施例中,将C7,C8,C10,C11,C12,C14,C15,C16依照步骤4.3所述,依次求出预测值后,计算预测得到的B(i,j)′内16个C′与原始B(i,j)内16个C的ED。
步骤6:对Cover中的Block动态选择压缩策略,并标记,生成PCover。
根据ED与门槛值TH对每张原始图像Cover中的每个Block动态选择压缩策略,若ED≤TH则在位置标识图上标记为0,以PredBlock代替OrigBlock;若ED>TH则用编码簿中与OrigBlock的欧几里德距离最小的码字索引代替OrigBlock内所有像素C的值,并在位置标识图上标记为1;每张原始图像Cover的每个Block都进行动态压缩策略选择后,生成压缩图像PCover及其位置标识图。
在本实施例中,根据所求ED进行判断,这里将TH设置为40;若TH>40,则采取VQC,将B(I,j)与Codebook中256个Codeword计算ED,选取min{ED}的Codeword的Index代替该Block,并在位置标示图上标记为1;若TH≤40,则该Block不做处理,为PPC压缩Block,并在位置标识图上标记为0;对所有Block做相同动态压缩策略选择,生成PCover和位置标示图。
其中发送端向接收端发送信息时,可以直接发送位置标识图和PCover中的Index,无需发送原始的Cover。
步骤7:当接收端获取到位置标识图和PCover中的Index后,即可利用接收到的信息进行PCover恢复
当接收端收到位置标识图和PCover中的Index后,根据位置标识图进行图像恢复:若位置标识图上Block的标记为1,表明该Block采取VQC压缩,则在Codebook中取出该Block的Index对应的Codeword,并代替该Block;若位置标识图上Block的标记为0,表明该Block采取像素预测压缩,则重复步骤4.2和步骤4.3。对所有Block执行完恢复操作后,得到压缩图像PCover。
在本实施例中,根据位置标示图,若标识为1,则标识该Block采取VQC策略进行压缩,则根据Index取出对应Codeword,用Codeword代替该Block;若标识为0;则根据等式1,用B(i,j-1)内像素L和B(i-1,j)内像素U对B(i,j)内最顶行和最左侧的C进行赋值;这里假设T6′=-0.4583-0.7240×T1+0.9301×T2-0.0530×T3+0.0127×C4+0.9885×T5-0.4932×T9+0.3415×T13;则根据等式以赋值之后的C1,C2,C3,C4,C5,C9,C13作为自变量,依次求出C7,C8,C10,C11,C12,C14,C15,C16。对所有Block执行此操作,直至恢复至PCover。
为了体现本发明的具体技术效果,下面给出上述方法在实际案例中的具体应用结果。如表1、2所示,随着门槛值TH增加,图片质量逐步下降,压缩率逐步上升。如表1所示,当门槛值TH=40的情况时,和仅用VQ压缩的压缩图像相比质量没有优势,但是仍旧比使用SMVQ压缩的压缩图片质量好,并且肉眼也无法辨别出明显区别。如图7所示,为部分经过PPC压缩后解压图像示意图,可见本发明的压缩图片解压后质量较高。而且,当门槛值TH=40的情况下,压缩率都比仅使用VQ压缩和使用SMVQ压缩的压缩率有显著的优势。所以,可以说本发明提出的算法在保证图像质量可接收的前提下,大幅度的提升了图像的压缩率。
表1本发明实施例的编码簿为256时的视觉质量PSNR
Figure BDA0002530754290000091
表2本发明实施例的编码簿为256时的压缩率CR
Figure BDA0002530754290000101
由此可见,本发明的方法基于矢量量化压缩对压缩结果进行再压缩,在保证视觉阈值的前提下,大幅度的提升图像压缩率,能将Cover平均压缩到32倍,至多能压缩至50倍。
当然,以上所述的实施例只是本发明的一种较佳的方案,然其并非用以限制本发明。有关技术领域的普通技术人员,在不脱离本发明的精神和范围的情况下,还可以做出各种变化和变型。因此凡采取等同替换或等效变换的方式所获得的技术方案,均落在本发明的保护范围内。

Claims (8)

1.一种基于矢量量化压缩和线性回归预测的图像压缩方法,其特征在于,步骤如下:
S1:将待压缩的图像集合中的每张原始图像分割成若干不重叠的m×m大小的块,其中每个块包含m×m个像素C;
S2:选取若干图像进行分群训练,获得编码簿,编码簿的获取方法如S21~S25:
S21:选取若干张代表图像,并将每张代表图像分割成若干不重叠的m×m大小的块,所有代表图像的块构成OBlock集合;
S22:在OBlock集合中随机选取出M个块,记为Mblock,OBlock集合中除了Mblock之外剩余的块记为(O-M)Block;
S23:以Mblock作为M个群的初始中心,计算(O-M)Block中的每个块与M个初始中心之间的欧几里德距离ED,并将其划入ED值最小的群中,获得M个群;
S24:分别针对M个群重新计算每个群的重心,M个群新的重心记为MBlock′;
S25:迭代执行S23和S24共N次,使MBlock′变化趋于稳定,获得迭代N次后的M个群的重心MBlockN,即编码簿,其中每个群的重心记为BlockN,即码字;
S3:将编码簿进行线性回归训练,获得待压缩位置的线性等式,训练方法如S31~S32:
S31:每个码字对应的BlockN中包含m×m个像素T,以BlockN中最顶行和最左列的2m-1个像素值[T1,T2,…,T2m-1]为自变量,以BlockN中其余的m2-2m+1个像素中任意一个像素值T′e为因变量,建立线性预测方程
Figure FDA0002530754280000011
S32:以编码簿中的M个码字为样本,对S31中建立的每个T′e的线性预测方程进行拟合,得到m2-2m+1组线性预测方程的拟合参数[be0′,be1′,…,b2m-1′];
S4:对待压缩的图像集合中的每张原始图像进行像素预测压缩,压缩方法如S41~S43:
S41:用VQC压缩原始图像中最顶行和最左列的块,并在位置标识图中标记为1;针对原始图像中其余待压缩块,按照从上到下,从左到右的顺序,依次对每个待压缩的块执行S42和S43;
S42:当前待压缩的块记为B(i,j),则其左侧块为B(i,j-1),上方块为B(i-1,j),用B(i,j-1)内最右列的像素和B(i-1,j)内最底行的像素对B(i,j)内最顶行和最左列的2m-1个像素C进行赋值,赋值公式为:
C′P,P=(UB,1+L1,B)/2,P=1
C′1,P=UB,P,1<P≤m
C′P,1=LP,B,1<P≤m
其中:C′p,q表示B(i,j)中第p行第q列的像素赋值后的像素值,1≤p≤m,1≤q≤m;UB,P表示B(i-1,j)内最底行第P列的像素值;LP,B表示B(i,j-1)内第P行最右列的像素值;
S43:对于B(i,j)中剩余未压缩的m2-2m+1个像素C,分别基于所述S32中拟合得到的m2-2m+1组线性预测方程,以S42中已经赋值的2m-1个像素C的值作为自变量,进行像素值预测;
S5:对于每张原始图像中的每个块,将其记为OrigBlock,而OrigBlock经过S4中像素预测压缩后记为PredBlock,计算OrigBlock和PredBlock的欧几里德距离ED;
S6:根据ED与门槛值TH对每张原始图像中的每个块动态选择压缩策略,若ED≤TH则在位置标识图上标记为0,以PredBlock代替OrigBlock;若ED>TH则用编码簿中与OrigBlock的欧几里德距离最小的码字索引代替OrigBlock内所有像素C的值,并在位置标识图上标记为1;每张原始图像的每个块都进行动态压缩策略选择后,生成压缩图像PCover及其位置标识图;所述位置标识图和PCover中的码字索引用于向接收端发送。
2.如权利要求1所述的基于矢量量化压缩和线性回归预测的图像压缩方法,其特征在于,所述的S21中,选取的代表图像数量为3~5张。
3.如权利要求1所述的基于矢量量化压缩和线性回归预测的图像压缩方法,其特征在于,所述的S41中,对块进行VQC压缩时,将块与编码簿内所有码字计算欧几里德距离ED,以ED最小的码字的索引代替该块内所有像素。
4.如权利要求1所述的基于矢量量化压缩和线性回归预测的图像压缩方法,其特征在于,所述的S43中,每个像素预测所采用的线性预测方程为码字中同一位置T′e拟合得到的线性预测方程,呈一一对应关系。
5.如权利要求1所述的基于矢量量化压缩和线性回归预测的图像压缩方法,其特征在于,所述原始图像的大小为512×512。
6.如权利要求1所述的基于矢量量化压缩和线性回归预测的图像压缩方法,其特征在于,所述块的大小为4×4。
7.如权利要求1所述的基于矢量量化压缩和线性回归预测的图像压缩方法,其特征在于,所述M为256、512或1024。
8.如权利要求1所述的基于矢量量化压缩和线性回归预测的图像压缩方法,其特征在于,当接收端收到位置标识图和PCover中的码字索引后,根据位置标识图进行图像恢复:若位置标识图上块的标记为1,表明该块采取VQC压缩,则在编码簿中取出该块的码字索引对应的码字,并代替该块;若位置标识图上块的标记为0,表明该块采取像素预测压缩,则重复S42和S43;对所有块执行完恢复操作后,得到压缩图像PCover。
CN202010517753.5A 2020-06-09 2020-06-09 基于矢量量化压缩和线性回归预测的图像压缩方法 Active CN111741307B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010517753.5A CN111741307B (zh) 2020-06-09 2020-06-09 基于矢量量化压缩和线性回归预测的图像压缩方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010517753.5A CN111741307B (zh) 2020-06-09 2020-06-09 基于矢量量化压缩和线性回归预测的图像压缩方法

Publications (2)

Publication Number Publication Date
CN111741307A true CN111741307A (zh) 2020-10-02
CN111741307B CN111741307B (zh) 2023-06-06

Family

ID=72648636

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010517753.5A Active CN111741307B (zh) 2020-06-09 2020-06-09 基于矢量量化压缩和线性回归预测的图像压缩方法

Country Status (1)

Country Link
CN (1) CN111741307B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5444800A (en) * 1988-11-18 1995-08-22 At&T Corp. Side-match and overlap-match vector quantizers for images
US20110026830A1 (en) * 2009-07-31 2011-02-03 Cheng-Fa Tsai Codebook generating method
CN102300095A (zh) * 2011-09-15 2011-12-28 重庆邮电大学 一种超谱信号的快速压缩编码方法及图像压缩方法
CN102905137A (zh) * 2012-11-01 2013-01-30 重庆邮电大学 超光谱信号的快速差值矢量量化压缩编码方法
CN104657962A (zh) * 2014-12-12 2015-05-27 西安电子科技大学 基于级联线性回归的图像超分辨重建方法
CN108010000A (zh) * 2017-12-12 2018-05-08 南京邮电大学 基于邻近特征子空间拟合的压缩图像清晰化方法
CN108184122A (zh) * 2018-01-11 2018-06-19 马睿和 基于多元线性回归的图像可逆信息隐藏方法和装置
CN108335265A (zh) * 2018-02-06 2018-07-27 上海通途半导体科技有限公司 一种基于样本学习的快速图像超分辨率重建方法及装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5444800A (en) * 1988-11-18 1995-08-22 At&T Corp. Side-match and overlap-match vector quantizers for images
US20110026830A1 (en) * 2009-07-31 2011-02-03 Cheng-Fa Tsai Codebook generating method
CN102300095A (zh) * 2011-09-15 2011-12-28 重庆邮电大学 一种超谱信号的快速压缩编码方法及图像压缩方法
CN102905137A (zh) * 2012-11-01 2013-01-30 重庆邮电大学 超光谱信号的快速差值矢量量化压缩编码方法
CN104657962A (zh) * 2014-12-12 2015-05-27 西安电子科技大学 基于级联线性回归的图像超分辨重建方法
CN108010000A (zh) * 2017-12-12 2018-05-08 南京邮电大学 基于邻近特征子空间拟合的压缩图像清晰化方法
CN108184122A (zh) * 2018-01-11 2018-06-19 马睿和 基于多元线性回归的图像可逆信息隐藏方法和装置
CN108335265A (zh) * 2018-02-06 2018-07-27 上海通途半导体科技有限公司 一种基于样本学习的快速图像超分辨率重建方法及装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
CHIN-CHEN CHANG, THAI SON NGUYEN, CHIA-CHEN LIN: "A reversible compression code hiding using SOC and SMVQ indices", 《INFORMATION SCIENCES》 *
KAIMENG CHEN、CHIN-CHEN CHANG: "Error-free separable reversible data hiding in encrypted images using linear regression and prediction error map", 《MULTIMEDIA TOOLS AND APPLICATIONS》 *
季平,秦川: "基于多码本矢量量化的图像篡改恢复", 《应用科学学报》 *

Also Published As

Publication number Publication date
CN111741307B (zh) 2023-06-06

Similar Documents

Publication Publication Date Title
CN110225341B (zh) 一种任务驱动的码流结构化图像编码方法
CN111432207B (zh) 基于显著目标检测和显著性指导的感知高清视频编码方法
CN111684802A (zh) 用于对字节流进行分级编码和解码的方法和设备
US6438268B1 (en) Vector quantization codebook generation method
CN111093081B (zh) 一种图像无损压缩方法及系统
CN110139109A (zh) 图像的编码方法及相应终端
Hou et al. Reversible data hiding based on multiple histograms modification and deep neural networks
Shen et al. An adaptive incremental LBG for vector quantization
TWI385592B (zh) 編碼簿產生方法
CN104428793B (zh) 用于转换基于梯度直方图的图像描述符的方法和相关图像处理设备
CN103188494A (zh) 跳过离散余弦变换对深度图像编码/解码的设备和方法
CN116471412B (zh) 一种基于密度聚类的自适应图像压缩方法及系统
CN111553296B (zh) 一种基于fpga实现的二值神经网络立体视觉匹配方法
Yang et al. Sci: A spectrum concentrated implicit neural compression for biomedical data
CN111741307A (zh) 基于矢量量化压缩和线性回归预测的图像压缩方法
CN106101732B (zh) 快速压缩高光谱信号的矢量量化方案
CN112004092A (zh) 一种基于改进图像块分类算法的bp神经网络图像压缩方法
Begum et al. An efficient algorithm for codebook design in transform vector quantization
CN108259914A (zh) 基于物体库的云图像编码方法
Tai et al. Tsptq-vit: Two-scaled post-training quantization for vision transformer
CN114708343A (zh) 基于图字典学习的三维点云编解码方法、压缩方法及装置
KR102305981B1 (ko) 신경망 압축 훈련 방법 및 압축된 신경망을 이용하는 방법
Thakur et al. Optimal quantization table generation for efficient satellite image compression using teaching learning based optimization technique
TW201427425A (zh) 影像壓縮方法
Bardekar et al. A review on LBG algorithm for image compression

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant