CN104506752B - 一种基于残差压缩感知的相似图像压缩方法 - Google Patents
一种基于残差压缩感知的相似图像压缩方法 Download PDFInfo
- Publication number
- CN104506752B CN104506752B CN201510004688.5A CN201510004688A CN104506752B CN 104506752 B CN104506752 B CN 104506752B CN 201510004688 A CN201510004688 A CN 201510004688A CN 104506752 B CN104506752 B CN 104506752B
- Authority
- CN
- China
- Prior art keywords
- image
- mrow
- matrix
- residual
- msub
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 67
- 238000007906 compression Methods 0.000 title claims abstract description 41
- 230000006835 compression Effects 0.000 title claims abstract description 41
- 239000011159 matrix material Substances 0.000 claims abstract description 75
- 238000005259 measurement Methods 0.000 claims abstract description 33
- 238000012549 training Methods 0.000 claims abstract description 22
- 238000013139 quantization Methods 0.000 claims abstract description 18
- 230000001502 supplementing effect Effects 0.000 claims description 9
- 230000006870 function Effects 0.000 claims description 6
- 238000010276 construction Methods 0.000 claims description 4
- 238000003064 k means clustering Methods 0.000 claims description 3
- 238000004806 packaging method and process Methods 0.000 claims description 3
- 238000005215 recombination Methods 0.000 claims description 3
- 230000006798 recombination Effects 0.000 claims description 3
- 239000013589 supplement Substances 0.000 claims description 2
- 238000004364 calculation method Methods 0.000 abstract description 5
- 241000309551 Arthraxon hispidus Species 0.000 abstract 1
- 239000000284 extract Substances 0.000 abstract 1
- 238000000605 extraction Methods 0.000 abstract 1
- 230000008447 perception Effects 0.000 abstract 1
- 238000013500 data storage Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 238000002474 experimental method Methods 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 201000011243 gastrointestinal stromal tumor Diseases 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000031068 symbiosis, encompassing mutualism through parasitism Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/41—Bandwidth or redundancy reduction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/21—Intermediate information storage
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
Abstract
本发明公开了一种基于残差压缩感知的相似图像压缩方法,包括步骤:1)采集一组相似图像;2)对相似图像进行智能训练,提取公共模板;将首幅待压缩图像与公共模板相减得到残差,对残差采用K‑SVD算法进行训练,得到公共字典及测量值系数;对残差进行压缩感知测量得到残差测量值;提取测量值非零项进行量化、熵编码得到压缩码流,提取非零项位置信息作为头信息;3)对压缩码流反熵编码、反量化解出非零项残差测量值,结合头信息恢复测量矩阵;根据字典,采用OMP稀疏编码算法重构出残差图像;将残差图像与公共模板相加得到重构图像;4)输出重构图像。本发明可以大大减少数据存储量,有效提高压缩效率,且重构质量更好。
Description
技术领域
本发明涉及一种基于残差压缩感知的相似图像压缩方法,属于图像压缩领域。
背景技术
随着多媒体技术的发展,大量的支票、办公室公文、证书和表单等文件的电子存储成为迫切需求。目前存储的电子图像大都是采用传统的JPEG、PNG等压缩方式扫描的图像,虽然能够实现一定的压缩比,但是随着数据量的增加,对存储容量的需求会进一步增强,对物理存储设备要求会更高,这对企业会造成一定的经济负担。此外同一类图像(例如同一银行发行的支票)具有很大的相似性,如果对这类扫描图像直接存储会造成资源的极大浪费。传统的图像压缩方案主要通过变换、量化和熵编码来减少数据冗余,从而实现压缩编码。其中,变换利用图像的低通特性将信号能量集中,然而对于一组相似图像,这些方法对图像间的结构相关性尚未充分利用。如果能找到相似图像的共同结构特征作为公共模板,则只需要存储每幅图像的不同部分,在解码时加上公共模板就能很好实现存储空间的利用。目前提取结构特征的常用方法分三类:1、基于空间共生的特征表达方法,利用空间信息以及特征间的共生特性可以增强局部特征的判别能力,典型的方法有空间金字塔匹配方法和主旨(GIST)特征方法;2、基于集合验证的图像区域方法,即在进行特征表达和相似度计算时,通过验证两张图像局部特征分布的几何相似性来进一步计算图像的相似性,完成相应的匹配或检索任务,其中具有代表性的是基于随机样本一致性(RANSAC)及约束一致性的方法;3、视觉短语方法,通过图像中特征点的空间分布,将若干个特征点联合起来组成特征组,完成对图像的描述,主要有具有表达力的视觉短语表达方法和基于特征绑定的方法。
传统的图像压缩技术香农定理,采用先采样后压缩的数据处理方式。压缩感知理论将传统的数据获取与数据压缩合二为一,压缩感知理论证明:如果信号在某个变换域是稀疏的,就可以用一个与变换基不相关的测量矩阵将信号变换得到的高维信号投影到一个低维空间上,这种投影包含了原信号绝大部分有用信息,采样率远低于奈奎斯特Nyquist采样频率,然后通过求解最优化问题就可以从这些少量的投影中以高概率重构出原信号。本发明利用自然图像数据的稀疏性特点,通过压缩感知的方式对图像进行压缩编码,能够大大减少数据存储压力,同时通过自适应字典的构造,进一步提高重构质量。
发明内容
为解决现有技术中的不足,本发明提供一种基于残差压缩感知的相似图像压缩方法,可以大大减少数据存储量,有效提高压缩效率,且重构质量更好。
为了实现上述目标,本发明采用如下技术方案:一种基于残差压缩感知的相似图像压缩方法,其特征在于:包括步骤:
(1)初始化:
11)通过输入设备,采集待压缩的N组相似图像并保存;
12)将采集到的N幅尺寸为L×H图像作为公共模板训练样本读入数组I中;
(2)编码:
21)公共模板智能训练:
21a)将所有N幅图像划分为8×8不重叠的块,对边缘不足8×8的块用0补充,得到样本训练图像块集合B;
21b)在块集合B中随机选取小部分图像块进行k-means聚类,得到K个聚类中心;
21c)以21b)中K个聚类中心作为迭代初始值,对图像块集合B进行聚类,得到图像块集合Bk;
21d)对当前第k类图像块集合Bk,通过构建以的l2范数作为惩罚函数并添加到目标函数(2)中,即:
其中,为64×64的固定字典;mk为当前第k类图像块集合Bk的总块数,为当前类中的第j图像块,矩阵Ak为当前第k类在字典下的稀疏系数矩阵,尺寸为64×mk,为矩阵Ak第i行,为矩阵Ak第j列,λ为尺度参数,求解式(2)找出Ak的最小二乘表示其列为图像块在固定字典上的稀疏系数矩阵;
21e)联合稀疏系数矩阵Ak和固定字典对同一类mk个图像块重构,即:
21f)重复21d)到21e)步骤,直到所有K类图像完成重构,得到重构图像块集合
21g)对重构图像块集合中的相同位置图像块取均值,并按顺序组合,得到N幅图像的公共模板M:
其中,Mi,j代表模板中第i行第j列图像块,N代表图像总数,Bi,j,n代表第n幅图像中第i行第j列个图像块;
22)字典训练:
22a)第一幅图像I1数据减去公共模板M得到当前图像的残差图像R1,即:
R1=I1-M (5)
22b)将残差R1划分成8×8不重叠的图像块,对边缘不足8×8的块用0补充,共S块,S=ceil(L/8)×ceil(H/8),ceil代表向上取整,L为残差图像R1的行数,H为残差图像R1的列数,并按顺序列向量化组成尺寸为64×S的矩阵X1;
22c)对矩阵X1采用K-SVD算法进行训练得到公共字典D及首幅图像测量值系数Φ1,满足公式:
其中,公共字典D尺寸为64×64,测量值Φ1的尺寸为64×S,T为测量值Φ1的l0范数的阈值;
23)生成残差测量值:
23a)计算当前待压缩图像Ii(i=2~N)与公共模板M的残差Ri(i=2~N):
Ri=Ii-M(i=2~N) (7)
其中,i为当前图像序号,以8×8为单位划分Ri(i=2~N)为若干图像块,对边缘不足8的采用0作为补充;将划分好的图像块按顺序列向量化得到新的矩阵Xi(i=2~N);
23b)采用正交匹配追踪OMP算法,结合公共字典D计算当前Xi(i=2~N)的测量值Φi(i=2~N);
23c)对于其余待压缩图像Ii(i=2~N),重复以上两个步骤,直到计算出所有图像测量值Φ,并保存;
24)测量值压缩编码:
24a)选取当前测量值Φi中不为零的Wi个系数按列顺序保存到8×ceil(Wi/8)的矩阵Qi中,将不为零系数位置信息按顺序保存到矩阵Coordi中作为头信息;
24b)对矩阵Qi采用量化矩阵进行量化得到矩阵Qi′;
24c)对量化后矩阵进行熵编码得到压缩码流;
24d)将头信息及压缩码流封装并保存;
24e)重复24a)~24d)过程,直到所有测量值数据均被压缩编码;
(3)解码:
31)残差测量值解码:
31a)读取本地存储的当前待解码图像残差测量压缩码流值进行熵解码;
31b)对熵解码数据进行反量化得到反量化矩阵
31c)通过头信息矩阵Coordi中测量值位置信息对反量化矩阵重组到残差测量值
31d)重复31a)~31c)步骤直至得到当前待解码图像的全部残差测量值数据
32)残差图像压缩感知重构:
32a)将缓存中的公共字典D读出,根据公共字典D及解码的残差测量值数据相乘得到重构的残差图像矩阵
32b)将得到的残差图像矩阵按顺序重组得到最终残差图像
33)相似图像重构:
33a)将步骤32)得到的残差重构图像与公共模板M相加得到最终的重构图像数据
33b)重复以上解码过程,直到得到所有待解码图像;
(4)重构图像输出:将步骤33)得到的重构图像数据按照图像格式输出,得到解压缩后图像。
前述的一种基于残差压缩感知的相似图像压缩方法,其特征是:步骤11)中所述相似图像为同一类图像。
前述的一种基于残差压缩感知的相似图像压缩方法,其特征是:步骤21b)中对图像块进行聚类时,选取图像块间的欧式距离作为距离测度。
前述的一种基于残差压缩感知的相似图像压缩方法,其特征是:步骤21d)中所述固定字典为:其中DOWT为双正交小波字典,DDCT为离散余弦字典。
前述的一种基于残差压缩感知的相似图像压缩方法,其特征是:步骤23b)中基于OMP算法的测量值生成过程如下:
第一步,将23a)中尺寸为的L×H的残差图像Ri划分为8×8的图像块,对边缘不足8×8的以0进行补充,共K块,K=ceil(L/8)×ceil(H/8),ceil代表向上取整;
第二步,将残差图像Ri中K个图像块列向量化,并按顺序重组为新的矩阵Xi;
第三步,结合公共字典D以及矩阵Xi通过OMP算法,计算得到当前图像块的测量值Φi。
前述的一种基于残差压缩感知的相似图像压缩方法,其特征是:步骤24b)中所述量化矩阵为JPEG亮度量化矩阵。
前述的一种基于残差压缩感知的相似图像压缩方法,其特征是:步骤24c)中所述熵编码为Huffman编码。
本发明所达到的有益效果:
1、采用智能模板训练的方法,提取能够描述一组图像的共同结构特征的公共模板,使图像与公共模板的残差能量最小,在接下来的数据处理中只需压缩残差图像数据,在需要时解压当前图像的残差图像再加上公共模板就可以得到重构图像,大大减少数据存储容量;
2、采用压缩感知的方法对得到的残差数据进行压缩,由于残差数据具有稀疏性,利用压缩感知的思想,通过字典训练,得到当前残差图像最稀疏表示的测量值,进一步提高压缩率;通过字典对测量数据进行重构,其重构图像的峰值信噪比(PSNR)能够达到很高的水平;
3、测量值系数具有极大稀疏度,只保存其中非零项系数及坐标位置,再对系数进行Huffman编码可以大大减少数据存储量。
附图说明
图1是基于残差压缩感知的相似图像压缩方法的系统框图;
图2是本发明中公共模板生成模块示意图;
图3是本发明中字典训练模块示意图;
图4是本发明中测量值生成模块示意图;
图5是本发明中测量值压缩编码模块示意图;
图6是本发明方法对20幅扫描图像压缩编码再解码重构的峰值信噪比和采用JPEG方式压缩重构的对比图。
具体实施方式
下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
如图1所示,一种基于残差压缩感知的相似图像压缩方法,其特征在于,包括步骤:
步骤一:初始化,相似图像输入设备1;
11)通过输入设备,采集待压缩的N幅相似图像并保存;所述相似图像为同一类图像;
12)将采集到的N幅尺寸为L×H图像作为公共模板训练样本读入数组I中并保存。
步骤二:编码模块2
21)公共模板智能训练模块21
对输入的图像数组I采用智能训练方法,提取能够描述这组图像共同结构特征的公共模板,使得每幅图像与公共模板的残差能量总和最小。如图2所示,将所有N幅图像划分为8×8不重叠的块,对边缘不足8×8的块用0补充,得到样本训练块集合B。为加快迭代收敛速度,在块集合B中,随机选取小部分图像块以欧式距离作为距离测度进行k-均值聚类,得到K个聚类中心,综合考虑计算复杂度、图像特征及重构质量,K取50;即得到50个聚类中心,图像块p1和p2间的欧式距离d(p1,p2)为:
其中,(i,j)为图像坐标,p1(i,j)和p2(i,j)为图像块p1、p2中(i,j)位置像素点的数值。再以k个聚类中心作为迭代初始值,对所有图像块集合B进行聚类,得到块集合Bk(k=1~50);对当前第k类图像块集合Bk,通过构建以的l2范数作为惩罚函数并添加到目标函数(2)中,即:
其中,DOWT为双正交小波字典,DDCT离散余弦字典;为64×64的固定字典,mk为当前第k类图像块集合Bk的总块数,为当前第k类中的第j图像块,矩阵Ak为当前第k类在字典下的稀疏系数矩阵,矩阵大小为64×mk,为矩阵Ak第i行,为矩阵Ak第j列,λ为尺度参数,求解式(2)找出矩阵Ak的最小二乘表示,即稀疏系数矩阵其列为图像块在字典上的系数。结合稀疏系数矩阵Ak和固定字典对同一类mk个图像块重构:
重复上述公式(2)和(3)步骤,直到所有k(K=50)类图像完成重构,得到重构图像块集合
最后对重构图像块集合中的相同位置图像块取均值:将得到的均值图像块按顺序组合,得到N幅图像的公共模板M:
其中,Mi,j代表公共模板M中第i行第j列图像块,N代表图像总数,Bi,j,n代表第n幅图像中第i行第j列个图像块。
22)字典训练模块22
因输入图像具有相似性,为了提高压缩编码的有效性,仅采用第一幅图像数据进行字典训练,如图3所示,首先用第一幅图像I1减去公共模板M得到当前图像的残差图像R1,即:
R1=I1-M (5)
将残差图像R1划分成8×8非重叠的图像块,对边缘不足8×8的块采用0补充,共S块(S=ceil(L/8)×ceil(H/8),ceil代表向上取整,L为残差图像R1行数,H为残差图像R1列数),将8×8图像块按位置顺序列向量化组成新的矩阵X1,尺寸为64×S,即矩阵X1的每一列为列向量化的块图像数据;最后对矩阵X1采用K-SVD算法训练得到公共字典D及首幅图像测量值系数Φ1,使其满足:
其中,公共字典D尺寸为64×64,T为测量值Φ1的l0范数阈值,设置为3。
23)残差测量值生成模块23
为进一步提高压缩比率,采用残差进行压缩感知测量,如图4所示,首先用待压缩的当前扫描图像Ii(i=2~N)减去公共模板M得到待压缩的残差Ri(i=2~N),即:
Ri=Ii-M(i=2~N) (7)
其中,i为当前图像序号;
以8×8为单位划分为若干图像块,对边缘不足8的采用0作为补充。将划分好的图像块按顺序列向量化得到新的矩阵Xi(i=2~N)。采用步骤22)中训练得到的公共字典D通过OMP(正交匹配追踪)算法,计算当前矩阵Xi的测量值Φi(i=2~N)。
对于其余待压缩图像Ii(i=3~N),只需重复以上步骤,直到计算出所有图像测量值Φ,并保存。
其中OMP算法的原理是:首先从字典D中选取和新的矩阵Xi最匹配的原子加入到原子集中:
其中,d为公共字典D中的原子,dγ为D中的第γ个原子,Γ为D中原子总数,γ0为最佳原子位置,为最佳原子,则可将图像Xi分解为在最佳原子上的分量和残余信息两部分,即:
其中,表示图像Xi在最佳原子上的投影分量,表示最佳原子对图像Xi第一次匹配后的残余分量,然后采用迭代的方法对残余分量继续挑选最佳原子使得:
其中,dγ为D中的第γ个原子,代表字典中第m个最佳原子,代表m次迭代最佳原子对图像Xi匹配后的残余分量,将已选的原子集进行Gram-Schmidt正交化处理,得到正交化后的原子集um:
其中,up代表原子集中第p个原子。对um进行归一化处理,得到归一化后的原子集u′m:
然后将残余量投影到正交原子u′m所构成的空间上,得到:
其中,0≤m<k,k为迭代次数,为代表k次迭代最佳原子对图像Xi匹配后的残余分量。对残余分量重复以上过程直到其能量小于设定的阈值Tp或者迭代次数超过设定的上限k。最后将当前矩阵Xi与已选原子集u′m(0≤m<k)的转置相乘得到测量值Φi(i=2~N)并按顺序保存。
24)测量值压缩编码模块24
由于测量值系数具有高度稀疏性,为了进一步提高压缩比,对测量值做进一步压缩处理。如图5所示,首先提取当前测量值Φi(i=2~N)数据中不为零的Wi个系数按列顺序保存到8×ceil(Wi/8)(ceil代表向上取整)的矩阵Qi中,将不为零系数位置信息按顺序保存到矩阵Coordi中,作为头信息,对矩阵Qi采用JPEG中亮度量化矩阵进行量化,得到矩阵Q′i,对量化后矩阵采用Huffman编码的原理进行熵编码得到压缩码流,最后将头信息矩阵Coordi及压缩码流封装并存储到本地数据库中,重复以上过程,直到所有测量值数据均被压缩编码。
步骤三:解码模块3
31)残差测量值解码31
对当前待解码的图像,本地数据库中存储的是公共模板M,公共字典D以及熵编码后的压缩编码及压缩码流头信息。解码时,首先对压缩码流进行熵解码,对解码后的数据进行反量化,得到反量化矩阵然后通过头信息矩阵Coordi中测量值位置信息对反量化矩阵重组得到残差测量值重复以上步骤直至得到当前待解码图像的全部残差测量值数据
32)残差图像压缩感知重构32
对得到的每幅图像残差测量值利用公共字典D与其相乘,得到当前残差重构矩阵
其中i为当前待重构图像序号,将得到的残差矩阵按顺序重组得到最终残差图像
33)相似图像重构33:
将上一步中得到的当前待重构图像残差与本地数据库中公共模板M相加,得到完整的当前待重构图像
重复以上解码过程,直到得到所有待解码图像。
步骤四:重构图像输出4
将步骤三得到重构图像数据按照图像格式输出,得到解压缩后图像。
本发明对提出的基于压缩感知的相似图像压缩方法做了测试实验,K=50,采用扫描输入的20幅学生实验报告第一页作为测试图像,将实验结果与传统的基于JPEG压缩方式的结果进行对比,测试结果如图6所示。
从图6可以看出,提出的基于压缩感知的相似图像压缩方法重构的峰值信噪比(PSNR)比基于传统的JPEG方式效果更好,平均有0.5dB的提升,K-SVD字典的使用使得残差能量较小,重构中采用OMP算法逐步逼近原始残差,因此压缩解压过程中的失真也相对较小,所以能够得到相对较好的重构质量。
表1 20幅扫描图像压缩数据比(JPEG压缩后数据量/本发明压缩后数据量)
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
6.698 | 6.914 | 6.506 | 6.751 | 6.818 | 7.720 | 5.989 | 6.132 | 6.266 | 6.525 |
11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 |
7.240 | 6.218 | 6.443 | 8.239 | 6.406 | 6.740 | 7.240 | 7.283 | 6.988 | 6.903 |
表1代表经过压缩后的JPEG数据量与本发明提出方法压缩后数据量的比值,从表中可以看出,传统JPEG压缩后数据是本发明提出的方法压缩后数据量的6~8倍,原因是基于压缩感知的相似图像压缩方法中保存了一组图像的公共模板,只对残差进行压缩感知测量编码,使得数据能量大大减少。由此证明本发明基于压缩感知的相似图像压缩方法的有效性,在很大程度上减小数据存储容量。本发明方法的计算量是传统JPEG算法的3~4倍,但在云计算平台下,计算开销可忽略不计。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变形,这些改进和变形也应视为本发明的保护范围。
Claims (7)
1.一种基于残差压缩感知的相似图像压缩方法,其特征在于:包括步骤:
(1)初始化:
11)通过输入设备,采集待压缩的N组相似图像并保存;
12)将采集到的N幅尺寸为L×H图像作为公共模板训练样本读入数组I中;
(2)编码:
21)公共模板智能训练:
21a)将所有N幅图像划分为8×8不重叠的块,对边缘不足8×8的块用0补充,得到样本训练图像块集合B;
21b)在块集合B中随机选取小部分图像块进行k-means聚类,得到K个聚类中心;
21c)以21b)中K个聚类中心作为迭代初始值,对图像块集合B进行聚类,得到图像块集合Bk;
21d)对当前第k类图像块集合Bk,通过构建以的l2范数作为惩罚函数并添加到目标函数(2)中,即:
其中,为64×64的固定字典;mk为当前第k类图像块集合Bk的总块数,为当前类中的第j图像块,矩阵Ak为当前第k类在字典下的稀疏系数矩阵,其尺寸为64×mk,为矩阵Ak第i行,为矩阵Ak第j列,λ为尺度参数,求解式(2)找出Ak的最小二乘表示其列为图像块在固定字典上的稀疏系数矩阵;
21e)联合稀疏系数矩阵Ak和固定字典对同一类mk个图像块重构,即:
<mrow>
<msup>
<mover>
<mi>Y</mi>
<mo>^</mo>
</mover>
<mi>k</mi>
</msup>
<mo>=</mo>
<msubsup>
<mi>D</mi>
<mn>0</mn>
<mi>k</mi>
</msubsup>
<msup>
<mover>
<mi>A</mi>
<mo>^</mo>
</mover>
<mi>k</mi>
</msup>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>3</mn>
<mo>)</mo>
</mrow>
</mrow>
21f)重复21d)到21e)步骤,直到所有K类图像完成重构,得到重构图像块集合
21g)对重构图像块集合中的相同位置图像块取均值,并按顺序组合,得到N幅图像的公共模板M:
<mrow>
<msub>
<mi>M</mi>
<mrow>
<mi>i</mi>
<mo>,</mo>
<mi>j</mi>
</mrow>
</msub>
<mo>=</mo>
<mrow>
<mo>(</mo>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>n</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>N</mi>
</munderover>
<msub>
<mi>B</mi>
<mrow>
<mi>i</mi>
<mo>,</mo>
<mi>j</mi>
<mo>,</mo>
<mi>n</mi>
</mrow>
</msub>
<mo>)</mo>
</mrow>
<mo>/</mo>
<mi>N</mi>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>4</mn>
<mo>)</mo>
</mrow>
</mrow>
其中,Mi,j代表模板中第i行第j列图像块,N代表图像总数,Bi,j,n代表第n幅图像中第i行第j列个图像块;
22)字典训练:
22a)第一幅图像I1数据减去公共模板M得到当前图像的残差图像R1,即:
R1=I1-M (5)
22b)将残差R1划分成8×8不重叠的图像块,对边缘不足8×8的块用0补充,共S块,S=ceil(L/8)×ceil(H/8),ceil代表向上取整,L为残差图像R1的行数,H为残差图像R1的列数,并按顺序列向量化组成尺寸为64×S的矩阵X1;
22c)对矩阵X1采用K-SVD算法进行训练得到公共字典D及首幅图像测量值系数Φ1,满足公式:
<mrow>
<mtable>
<mtr>
<mtd>
<mrow>
<mi>min</mi>
<mo>|</mo>
<mo>|</mo>
<msub>
<mi>X</mi>
<mn>1</mn>
</msub>
<mo>-</mo>
<mi>D</mi>
<mo>&CenterDot;</mo>
<msub>
<mi>&Phi;</mi>
<mn>1</mn>
</msub>
<mo>|</mo>
<msubsup>
<mo>|</mo>
<mn>2</mn>
<mn>2</mn>
</msubsup>
</mrow>
</mtd>
<mtd>
<mrow>
<mi>s</mi>
<mo>.</mo>
<mi>t</mi>
<mo>.</mo>
</mrow>
</mtd>
<mtd>
<mrow>
<mo>|</mo>
<mo>|</mo>
<msub>
<mi>&Phi;</mi>
<mn>1</mn>
</msub>
<mo>|</mo>
<msub>
<mo>|</mo>
<mn>0</mn>
</msub>
<mo>&le;</mo>
<mi>T</mi>
</mrow>
</mtd>
</mtr>
</mtable>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>6</mn>
<mo>)</mo>
</mrow>
</mrow>
其中,公共字典D尺寸为64×64,测量值Φ1的尺寸为64×S,T为测量值Φ1的l0范数的阈值;
23)生成残差测量值:
23a)计算当前待压缩图像Ii(i=2~N)与公共模板M的残差Ri(i=2~N):
Ri=Ii-M(i=2~N) (7)
其中,i为当前图像序号,以8×8为单位划分Ri(i=2~N)为若干图像块,对边缘不足8的采用0作为补充;将划分好的图像块按顺序列向量化得到新的矩阵Xi(i=2~N);
23b)采用正交匹配追踪OMP算法,结合公共字典D计算当前Xi(i=2~N)的测量值Φi(i=2~N);
23c)对于其余待压缩图像Ii(i=2~N),重复以上23a)、23b)步骤,直到计算出所有图像测量值Φ,并保存;
24)测量值压缩编码:
24a)选取当前测量值Φi中不为零的Wi个系数按列顺序保存到8×ceil(Wi/8)的矩阵Qi中,将不为零系数位置信息按顺序保存到矩阵Coordi中作为头信息;
24b)对矩阵Qi采用量化矩阵进行量化得到矩阵Qi′;
24c)对量化后矩阵进行熵编码得到压缩码流;
24d)将头信息及压缩码流封装并保存;
24e)重复24a)~24d)过程,直到所有测量值数据均被压缩编码;
(3)解码:
31)残差测量值解码:
31a)读取本地存储的当前待解码图像残差测量压缩码流值进行熵解码;
31b)对熵解码数据进行反量化得到反量化矩阵
31c)通过头信息矩阵Coordi中测量值位置信息对反量化矩阵重组得到残差测量值
31d)重复31a)~31c)步骤直至得到当前待解码图像的全部残差测量值数据
32)残差图像压缩感知重构:
32a)将缓存中的公共字典D读出,根据公共字典D及解码的残差测量值数据相乘得到重构的残差图像矩阵
<mrow>
<msub>
<mover>
<mi>X</mi>
<mo>^</mo>
</mover>
<mi>i</mi>
</msub>
<mo>=</mo>
<mi>D</mi>
<mo>&CenterDot;</mo>
<msub>
<mover>
<mi>&Phi;</mi>
<mo>^</mo>
</mover>
<mi>i</mi>
</msub>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>14</mn>
<mo>)</mo>
</mrow>
</mrow>
32b)将得到的残差图像矩阵按顺序重组得到最终残差图像
33)相似图像重构:
33a)将步骤32)得到的残差重构图像与公共模板M相加得到最终的重构图像数据
<mrow>
<msub>
<mover>
<mi>I</mi>
<mo>^</mo>
</mover>
<mi>i</mi>
</msub>
<mo>=</mo>
<msub>
<mover>
<mi>R</mi>
<mo>^</mo>
</mover>
<mi>i</mi>
</msub>
<mo>+</mo>
<mi>M</mi>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>15</mn>
<mo>)</mo>
</mrow>
</mrow>
33b)重复以上解码过程,直到得到所有待解码图像;
(4)重构图像输出:将步骤33)得到的重构图像数据按照图像格式输出,得到解压缩后图像。
2.根据权利要求1所述的一种基于残差压缩感知的相似图像压缩方法,其特征是:步骤11)中所述相似图像为同一类图像。
3.根据权利要求1所述的一种基于残差压缩感知的相似图像压缩方法,其特征是:步骤21b)中对图像块进行聚类时,选取图像块间的欧式距离作为距离测度。
4.根据权利要求1所述的一种基于残差压缩感知的相似图像压缩方法,其特征是:步骤21d)中所述固定字典为:其中DOWT为双正交小波字典,DDCT为离散余弦字典。
5.根据权利要求1所述的一种基于残差压缩感知的相似图像压缩方法,其特征是:步骤23b)中基于OMP算法的测量值生成过程如下:
第一步,将23a)中尺寸为的L×H的残差图像Ri划分为8×8的图像块,对边缘不足8×8的以0进行补充,共K块,K=ceil(L/8)×ceil(H/8),ceil代表向上取整;
第二步,将残差图像Ri中K个图像块列向量化,并按顺序重组为新的矩阵Xi;
第三步,结合公共字典D以及矩阵Xi通过OMP算法,计算得到当前图像块的测量值Φi。
6.根据权利要求1所述的一种基于残差压缩感知的相似图像压缩方法,其特征是:步骤24b)中所述量化矩阵为JPEG亮度量化矩阵。
7.根据权利要求1所述的一种基于残差压缩感知的相似图像压缩方法,其特征是:步骤24c)中所述熵编码为Huffman编码。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510004688.5A CN104506752B (zh) | 2015-01-06 | 2015-01-06 | 一种基于残差压缩感知的相似图像压缩方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510004688.5A CN104506752B (zh) | 2015-01-06 | 2015-01-06 | 一种基于残差压缩感知的相似图像压缩方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104506752A CN104506752A (zh) | 2015-04-08 |
CN104506752B true CN104506752B (zh) | 2017-08-25 |
Family
ID=52948466
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510004688.5A Active CN104506752B (zh) | 2015-01-06 | 2015-01-06 | 一种基于残差压缩感知的相似图像压缩方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104506752B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105681790B (zh) * | 2016-01-08 | 2019-01-22 | 北京交通大学 | 图像集中的图像的编码方法和解码方法 |
CN105718513B (zh) * | 2016-01-14 | 2019-11-15 | 上海大学 | jpg文件的压缩方法及解压缩方法 |
JP2017158183A (ja) * | 2016-02-29 | 2017-09-07 | 大学共同利用機関法人情報・システム研究機構 | 画像処理装置 |
CN105872549B (zh) * | 2016-05-16 | 2018-08-03 | 中国科学技术大学 | 基于块搜索和正交匹配追踪的视频变换编码方法 |
CN106452452A (zh) * | 2016-09-08 | 2017-02-22 | 电子科技大学 | 一种基于K‑means聚类的全脉冲数据无损压缩方法 |
CN113076847B (zh) * | 2021-03-29 | 2022-06-17 | 济南大学 | 一种多模态情感识别方法及系统 |
CN118097724B (zh) * | 2024-04-23 | 2024-07-26 | 江西百胜智能科技股份有限公司 | 基于掌静脉的身份识别方法、装置、可读存储介质及设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101335819A (zh) * | 2008-08-06 | 2008-12-31 | 中兴通讯股份有限公司 | 连拍照片的处理装置、方法及图象处理设备 |
WO2009110741A2 (en) * | 2008-03-04 | 2009-09-11 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding and decoding image by using filtered prediction block |
CN102521235A (zh) * | 2010-10-28 | 2012-06-27 | 微软公司 | 连拍模式图像压缩和解压 |
CN102708576A (zh) * | 2012-05-18 | 2012-10-03 | 西安电子科技大学 | 基于结构字典的分块图像压缩感知重建方法 |
CN103596006A (zh) * | 2013-12-04 | 2014-02-19 | 西安电子科技大学 | 基于视觉冗余度量的图像压缩方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100968204B1 (ko) * | 2007-01-11 | 2010-07-06 | 전자부품연구원 | 다시점 비디오 코덱에서의 영상 예측 방법 및 이를 위한프로그램을 기록한 컴퓨터로 판독 가능한 기록매체 |
-
2015
- 2015-01-06 CN CN201510004688.5A patent/CN104506752B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009110741A2 (en) * | 2008-03-04 | 2009-09-11 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding and decoding image by using filtered prediction block |
CN101335819A (zh) * | 2008-08-06 | 2008-12-31 | 中兴通讯股份有限公司 | 连拍照片的处理装置、方法及图象处理设备 |
CN102521235A (zh) * | 2010-10-28 | 2012-06-27 | 微软公司 | 连拍模式图像压缩和解压 |
CN102708576A (zh) * | 2012-05-18 | 2012-10-03 | 西安电子科技大学 | 基于结构字典的分块图像压缩感知重建方法 |
CN103596006A (zh) * | 2013-12-04 | 2014-02-19 | 西安电子科技大学 | 基于视觉冗余度量的图像压缩方法 |
Also Published As
Publication number | Publication date |
---|---|
CN104506752A (zh) | 2015-04-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104506752B (zh) | 一种基于残差压缩感知的相似图像压缩方法 | |
CN107832837B (zh) | 一种基于压缩感知原理的卷积神经网络压缩方法及解压缩方法 | |
CN105163121B (zh) | 基于深度自编码网络的大压缩比卫星遥感图像压缩方法 | |
CN1659785B (zh) | 信号多速率点阵矢量量化的方法和系统 | |
CN102427527B (zh) | 基于分布式视频压缩感知系统非关键帧的重构方法 | |
CN104199627B (zh) | 基于多尺度在线字典学习的可分级视频编码系统 | |
CN103810755B (zh) | 基于结构聚类稀疏表示的压缩感知光谱图像重建方法 | |
CN103400402A (zh) | 基于低秩结构稀疏的压缩感知mri图像重建方法 | |
CN110598584A (zh) | 一种基于小波变换和dct的卷积神经网络人脸识别算法 | |
CN111598786B (zh) | 一种基于深度去噪自编码网络的高光谱图像解混方法 | |
CN106952317A (zh) | 基于结构稀疏的高光谱图像重建方法 | |
CN116939226A (zh) | 一种面向低码率图像压缩的生成式残差修复方法及装置 | |
CN104392207A (zh) | 一种用于数字图像内容识别的特征编码方法 | |
CN107170020A (zh) | 基于最小量化误差准则的字典学习静态图像有损压缩方法 | |
Hu et al. | Patch-based low-rank minimization for image denoising | |
CN103985100A (zh) | 一种基于自适应观测组合优化的分块压缩感知方法 | |
Gao et al. | Compressive sampling with coefficients random permutations for image compression | |
CN113052016A (zh) | 一种基于多尺度注意力残差和等变映射的人脸超分辨率方法 | |
Ghafar et al. | Convolutional autoencoder for image denoising | |
Boesandi et al. | Compressive sensing in the Huffman coding DWT SVD medical image watermarking | |
CN103942770B (zh) | 基于极限学习机的压缩感知重构方法 | |
Li et al. | An image compression method using sparse representation and grey relation | |
Safitri et al. | Wavelet Huffman Coding Image Watermarking in the Presence of Compressive Sensing | |
Zhou et al. | Residual-Recursion Autoencoder for Shape Illustration Images | |
Ouyang et al. | A Dynamic Codec with Adaptive Quantization for Convolution Neural Network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |