CN103489203A - 基于字典学习的图像编码方法及系统 - Google Patents

基于字典学习的图像编码方法及系统 Download PDF

Info

Publication number
CN103489203A
CN103489203A CN201310039436.7A CN201310039436A CN103489203A CN 103489203 A CN103489203 A CN 103489203A CN 201310039436 A CN201310039436 A CN 201310039436A CN 103489203 A CN103489203 A CN 103489203A
Authority
CN
China
Prior art keywords
coefficient
image
image block
matrix
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201310039436.7A
Other languages
English (en)
Inventor
陶晓明
孙逸鹏
葛宁
陆建华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Shenzhen Research Institute Tsinghua University
Original Assignee
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University filed Critical Tsinghua University
Priority to CN201310039436.7A priority Critical patent/CN103489203A/zh
Publication of CN103489203A publication Critical patent/CN103489203A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明公开了一种基于字典学习的图像编码方法及系统,该方法包括:从图像样本中随机选取图像块,进行基于批处理的稀疏表示,通过交替优化方法求解字典矩阵;根据已获得的字典矩阵,利用批处理的稀疏表示,对待编码图像块进行稀疏表示,并对稀疏系数向量中的非零系数进行量化熵编码;在解码端,根据已获得的字典矩阵,对上述编码后的图像进行解码和稀疏重建。该系统包括:基于批处理的稀疏表示的字典学习模块、图像编码模块、以及图像解码模块。本发明解决了字典学习中训练样本规模大的难题,同时降低了图像样本的重建误差,显著提升图像压缩的率失真性能。

Description

基于字典学习的图像编码方法及系统
技术领域
本发明涉及多媒体信息处理与通信技术领域,具体涉及一种基于字典学习的图像编码方法及系统。
背景技术
近些年来,移动互联网用户数飞速增长,人们期望能够获得更高质量的多媒体业务服务。因此,在无线网络带宽依然相对受限的环境下,如何提供高品质的多媒体业务并满足与日俱增的用户体验需求,面临着巨大挑战。例如:移动终端上大量高质量图片、照片的浏览与分享等移动多媒体应用。
为了解决高质量用户体验需求与有限带宽的矛盾,高质量的图像编码压缩技术十分必要。其中,信号的变换与表示方法被认为是图像编码压缩技术的最核心部分,例如,离散余弦变换(DCT)应用于JPEG图像压缩标准、MPEG4/H.264、HEVC视频压缩标准,离散小波变换应用于JPEG2000图像压缩标准中。然而,DCT和离散小波都是预先定义好的正交完备基信号,用于通用图像、视频压缩,并不考虑图像的内容以及其中的纹理特点。因此,对于图像的纹理特征不具有自适应性。
近些年来,关于人眼视觉心理学的研究表明,通过从自然图像库中学习得到的过完备信号基更符合人的主观视觉感受。这些通过计算学习获得的信号基组成一个字典矩阵,通过使用其中较少的元素形成某种线形组合,从而对未知图像块进行逼近和重建。其中,求解该线形组合中非零权系数的过程,称为稀疏表示或稀疏编码。在已知大量自然图像样本的前提下,归纳学习获取字典矩阵的过程,称为字典学习。现有的字典学习方法计算复杂度高,算法缓存空间开销大,无法用于大规模图像样本的训练与处理,而现有的在线学习算法虽然为处理大量样本问题提供了可能性,但是训练精度与重建误差较大。
为了解决这个问题,在保证能够处理大量样本训练的前提下,同时降低重建误差,本发明提出了一种基于批处理的稀疏表示方法(BSR,batch based sparse representation),可以提高重建精度,并基于此方法,进行高效在线字典学习。利用该字典,对图像进行稀疏表示,并对直流分量和非零系数及其索引分别进行量化、熵编码,从而提升压缩效率。
发明内容
(一)要解决的技术问题
本发明要解决的技术问题是:提供一种基于字典学习的图像编码方法及系统,其在保证能够处理大量训练样本的前提下,同时降低了图像样本的重建误差,提高了图像压缩的率失真性能。
(二)技术方案
为解决上述问题,本发明提供了一种基于字典学习的图像编码方法,包括以下步骤:
A、从图像样本中随机选取图像块,进行基于批处理的稀疏表示,通过交替优化方法求解字典矩阵;
B、根据已获得的字典矩阵,利用批处理的稀疏表示对待编码的图像块进行稀疏表示,并对稀疏系数向量中的非零系数进行量化熵编码;
C、在解码端,根据已获得的字典矩阵,对上述编码后的图像进行解码和稀疏重建。
优选地,所述步骤A进一步包括以下步骤:
A1、从图像样本中随机选取图像块,初始化中间变量矩阵H0←0、G0←0,其中H0为m行m列的实数矩阵,m为字典矩阵的列数,G0为n行m列的实数矩阵,n为图象块的维度,←表示初始化运算;初始化字典矩阵D0,所述D0为n行m列的实数矩阵;
A2、令迭代次数为t,从t=1开始,循环迭代所述图像块样本到第T次,其中T为获取样本次数;
A3、对于第t次循环,获取第t批图像块样本yt,1,...,yt,P,其中每个图像块样本为n行1列的列向量,共P个;
A4、在已知字典矩阵Dt-1的情况下,通过基于批处理的稀疏表示算法,求得P个稀疏系数列向量其中Dt-1为n行m列实数矩阵;
A5、更新中间变量矩阵:
H t ← H t - 1 + Σ p = 1 P β ^ t , p β ^ t , p T , G t ← G t - 1 + Σ p = 1 P y t , p β ^ t , p T ;
A6、初始化以下矩阵:
A=[a1,...,am],B=[b1,...,bm],Q=[q1,...,qm],其中A←Ht,B←Gt,Q←Dt-1
A7、逐列更新字典矩阵:
从第i=1列开始到第m列,依次逐列更新字典矩阵,
如果Ai,i≠0,那么 u i ← 1 A i , i ( b i - Qa i ) + q i , q i ← u i max ( | | u i | | 2 , 1 ) , 第i次循环结束;
A8、更新字典矩阵Dt←Q,循环结束;
A9、直到第T次循环结束,求得最终字典矩阵DT
优选地,所述基于批处理的稀疏表示算法的求解步骤如下:
S1、初始化图像块矩阵
Figure BDA00002802236500035
和对角字典矩阵 D ~ ← diag ( D , . . . , D ) ;
S2、求解约束条件下的最小二乘系数矩阵:
Γ ~ ← arg min | | Y ~ - D ~ Γ ~ | | 2 ,
s . t . | | Γ ~ | | 0 ≤ s ,
利用最小角度回归将
Figure BDA00002802236500039
松弛到
Figure BDA000028022365000310
其中
Figure BDA000028022365000311
是该列向量
Figure BDA000028022365000312
中的非零系数个数,
Figure BDA000028022365000313
是该列向量
Figure BDA000028022365000314
中的非零系数绝对值的和,s为非零系数个数的约束,利用最小角度回归方法LARS进行求解;
S3、从系数列向量
Figure BDA00002802236500041
中求得稀疏系数[β1,...,βP]。
优选地,所述步骤B进一步包括以下步骤:
B1、对每个图像块的直流分量DC系数和交流分量AC系数进行分离;
B2、对所述直流分量DC系数进行差分脉冲编码调制,得到残差向量;
B3、对所述交流分量AC系数进行基于批处理的稀疏表示,求得相应的稀疏系数向量共J个列向量,其中J为待编码的图像块个数;
B4、对差分脉冲编码调制后的DC系数和经过基于批处理的稀疏表示求得的稀疏系数向量进行量化和熵编码,即对所述稀疏系数向量
Figure BDA00002802236500043
中的非零元素及其索引进行量化和Huffman熵编码,形成压缩数据。
优选地,所述步骤C进一步包括以下步骤:
C1、对所述压缩数据进行Huffman熵解码和反量化,恢复图像块的稀疏系数
Figure BDA00002802236500044
及每个图像块的差分脉冲编码调制后的直流分量DC系数及残差向量;
C2、进行解码重建,从差分脉冲编码调制后的直流分量DC系数和残差向量中恢复每个图像块的直流分量DC系数;
C3、在已知字典DT的前提下,通过矩阵相乘,稀疏重建第j个图像块恢复图像块的交流分量AC系数向量
Figure BDA00002802236500046
共J个列向量;
C4、将重建后的直流分量DC系数、交流分量AC系数合并叠加,得到重建图像。
本发明还提供了一种基于字典学习的图像编码系统,该系统包括:
基于批处理的稀疏表示的字典学习模块,用于从图像样本中随机选取图像块,进行基于批处理的稀疏表示的字典学习,获得字典矩阵;
图像编码模块,与所述基于批处理的稀疏表示的字典学习模块相连,用于根据已获得的字典矩阵,利用批处理的稀疏表示对所述图像块进行稀疏表示,并进行图像编码;
图像解码模块,与所述基于批处理的稀疏表示的字典学习模块和所述图像编码模块相连,用于根据已获得的字典矩阵,对上述编码后的图像进行图像解码重建。
优选地,所述基于批处理的稀疏表示的字典学习模块包括:
训练图像样本库,用于存放用于训练学习的各种图像样本;
样本预处理单元,与所述训练图像样本库相连,用于去除图像样本块的均值,并进行归一化处理;
字典训练学习单元,与所述样本预处理单元相连,用于对预处理后的图像样本块进行稀疏表示与纹理归纳学习。
优选地,所述图像编码模块包括:
图像块分割与DC、AC系数分离单元,用于将输入的图像块划分为8x8或12x12或16x16大小的图像块,并对每块图像的直流分量DC系数与交流分量AC系数分开;
差分脉冲编码调制单元,与所述图像块分割与DC、AC系数分离单元相连,用于对图像块的直流分量DC系数进行差分编码,得到残差向量;
基于批处理的稀疏表示单元,与所述图像块分割与DC、AC系数分离单元相连,在已知字典矩阵的条件下,用于对图像块的交流分量AC系数进行稀疏变换,求得图像块的稀疏系数;
量化与熵编码单元,与所述差分脉冲编码调制单元和所述基于批处理的稀疏表示单元相连,用于对差分脉冲编码调制后的直流分量DC系数和经过基于批处理的稀疏表示求得的稀疏系数及其索引进行量化和Huffman熵编码,最终形成压缩数据。
优选地,所述图像解码模块包括:
反量化与熵解码单元,用于对上述压缩数据进行Huffman熵解码和反量化,恢复图像块的稀疏系数及每个图像块的差分脉冲编码调制后的直流分量DC系数及残差向量;
差分脉冲编码信号重建单元,与所述反量化与熵解码单元相连,用于从差分脉冲编码调制后的直流分量DC系数和残差向量中恢复每个图像块的直流分量DC系数;
基于批处理的稀疏表示的图像块稀疏重建单元,与所述反量化与熵解码单元相连,在已知字典矩阵的条件下,用于对图像块进行稀疏重建,恢复每个图像块的交流分量AC系数;
DC、AC系数合并与图像恢复单元,与所述差分脉冲编码信号重建单元和所述基于批处理的稀疏表示的图像块稀疏重建单元相连,用于对图像的直流分量DC系数和交流分量AC系数进行叠加,得到重建图像。
(三)有益效果
本发明给出了一种基于字典学习的图像编码方法及系统。从若干类自然图像样本中,获取大量图像纹理块,通过基于批处理的稀疏表示算法和快速在线学习方法,统计归纳出自然图像的纹理字典库,更符合人眼主观感受。利用该字典库,对图像进行稀疏表示,并对直流分量和非零系数及其索引分别进行量化、熵编码,从而获得更优的率失真压缩性能。
附图说明
图1是本发明方法的流程图;
图2是本发明系统的结构框图;
图3是基于BSR的字典学习模块框图;
图4是图像编码模块框图;
图5是图像解码模块框图;
图6是本发明方法与JPEG2000和JPEG标准相比的率失真性能曲线。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
如图1所示,本发明提供了一种基于字典学习的图像编码方法,包括以下步骤:
步骤A:样本训练,从大量图像样本中随机选取图像块,进行基于批处理的稀疏表示(BSR)的字典学习,获得字典矩阵;
本步骤中,进一步包括以下步骤:
A1、从图像样本中随机选取图像块,初始化中间变量矩阵H0←0,G0←0,其中H0为m行m列的实数矩阵,m为字典矩阵的列数,G0为n行m列的实数矩阵,n为图象块的维度,初始化字典矩阵D0,所述D0为n行m列的实数矩阵;
A2、令迭代次数为t,从t=1开始,循环迭代所述图像块样本到第T次,其中T为获取样本次数;
A3、对于第t次循环,获取第t批图像块样本yt,1,...,yt,P,其中每个图像块样本为n行1列的列向量,共P个;
A4、在已知字典矩阵Dt-1的情况下,通过基于批处理的稀疏表示算法,求得P个稀疏系数列向量
Figure BDA00002802236500071
其中Dt-1为n行m列实数矩阵;
A5、更新中间变量矩阵:
H t ← H t - 1 + Σ p = 1 P β ^ t , p β ^ t , p T , G t ← G t - 1 + Σ p = 1 P y t , p β ^ t , p T ;
A6、初始化以下矩阵:
A=[a1,...,am],B=[b1,...,bm],Q=[q1,...,qm],其中A←Ht,B←Gt,Q←Dt-1
A7、逐列更新字典矩阵:
从第i=1列开始到第m列,依次逐列更新字典矩阵,
如果Ai,i≠0,那么 u i ← 1 A i , i ( b i - Qa i ) + q i , q i ← u i max ( | | u i | | 2 , 1 ) , 第i次循环结束;
A8、更新字典矩阵Dt←Q,循环结束;
A9、直到第T次循环结束,求得最终字典矩阵DT
其中,基于批处理的稀疏表示(BSR)的求解步骤如下所述:
S1、初始化图像块矩阵和对角字典矩阵 D ~ ← diag ( D , . . . , D ) ;
S2、求解约束条件下的最小二乘系数矩阵:
Γ ~ ← arg min | | Y ~ - D ~ Γ ~ | | 2 ,
s . t . | | Γ ~ | | 0 ≤ s ,
利用最小角度回归将
Figure BDA00002802236500087
松弛到
Figure BDA00002802236500088
其中
Figure BDA00002802236500089
是该列向量
Figure BDA000028022365000810
中的非零系数个数,
Figure BDA000028022365000811
是该列向量中的非零系数绝对值的和,s为非零系数个数的约束,利用最小角度回归方法LARS进行求解;
S3、从系数列向量
Figure BDA000028022365000813
中求得稀疏系数[β1,...,βP]。
步骤B:在已知字典的前提下,利用批处理的稀疏表示(BSR)对图像块进行稀疏表示,并进行图像编码;
本步骤中,进一步包括以下步骤:
B1、对每个图像块的直流分量DC系数和交流分量AC系数进行分离;
B2、对所述直流分量DC系数进行差分脉冲编码调制,得到残差向量;
B3、对所述交流分量AC系数进行基于批处理的稀疏表示,求得相应的稀疏系数向量共J个列向量,其中J为待编码的图像块个数;
B4、对差分脉冲编码调制后的DC系数和经过基于批处理的稀疏表示求得的稀疏系数向量进行量化和熵编码,即对所述稀疏系数向量
Figure BDA00002802236500091
中的非零元素及其索引进行量化和Huffman熵编码,形成压缩数据。
步骤C:在已知字典的前提下,进行图像的解码重建。
本步骤中,进一步包括以下步骤:
C1、对所述压缩数据进行Huffman熵解码和反量化,恢复图像块的稀疏系数
Figure BDA00002802236500092
及每个图像块的差分脉冲编码调制后的直流分量DC系数及残差向量;
C2、进行解码重建,从差分脉冲编码调制后的直流分量DC系数和残差向量中恢复每个图像块的直流分量DC系数;
C3、在已知字典DT的前提下,通过矩阵相乘,稀疏重建第j个图像块
Figure BDA00002802236500093
恢复图像块的交流分量AC系数向量
Figure BDA00002802236500094
共J个列向量;
C4、将重建后的直流分量DC系数、交流分量AC系数合并叠加,得到重建图像。
如图2所示,本发明还提供了一种基于字典学习的图像编码系统,该系统包括:
基于BSR的字典学习模块,用于从图像样本中随机选取图像块,进行基于批处理的稀疏表示的字典学习,获得字典矩阵;
图像编码模块,与所述基于BSR的字典学习模块相连,用于根据已获得的字典矩阵,利用批处理的稀疏表示对所述图像块进行稀疏表示,并进行图像编码;
图像解码模块,与所述基于BSR的字典学习模块和所述图像编码模块相连,用于根据已获得的字典矩阵,对上述编码后的图像进行图像解码重建。
如图3所示,所述基于BSR的字典学习模块包括:
1)训练图像样本库,用于存放大量的用于训练学习的各种图像样本;
2)样本预处理单元,与所述训练图像样本库相连,用于去除图像样本块的均值,并进行归一化处理;
3)字典训练学习单元,与所述样本预处理单元相连,用于对预处理后的图像样本块进行稀疏表示与纹理归纳学习。
如图4所示,所述图像编码模块包括:
1)图像块分割与DC、AC系数分离单元,用于将输入图像划分为8x8或12x12或16x16大小的图像块,并对每块图像的直流分量DC值与交流分量AC值分开;
2)差分脉冲编码调制单元(DPCM),与所述图像块分割与DC、AC系数分离单元相连,用于对图像块的直流分量DC进行差分编码,得到残差向量;
3)基于批处理的稀疏表示单元(BSR),与所述图像块分割与DC、AC系数分离单元相连,在已知字典矩阵的条件下,用于对图像块的交流分量AC进行稀疏变换,求得图像块的稀疏系数;
4)量化与熵编码单元,与所述差分脉冲编码调制单元和所述基于批处理的稀疏表示单元相连,用于对差分编码后的DC值和经过BSR求得的稀疏系数及其索引进行量化和Huffman熵编码,最终形成压缩数据。
如图5所示,所述图像解码模块包括:
1)反量化与熵解码单元,用于对压缩数据进行Huffman熵解码和反量化,恢复图像块的稀疏系数及每个图像块的直流分量DC及残差向量;
2)差分脉冲编码信号重建单元(DPCM),与所述反量化与熵解码单元相连,用于从图像块DC值和残差向量中恢复每个图像块的DC值;
3)基于BSR的图像块稀疏重建单元,与所述反量化与熵解码单元相连,在已知字典矩阵的条件下,用于对图像块进行稀疏重建,恢复每个图像块的AC系数向量;
4)DC、AC系数合并与图像恢复单元,与所述差分脉冲编码信号重建单元和所述基于BSR的图像块稀疏重建单元相连,用于对图像的DC系数和AC系数进行叠加,从而得到重建图像。
图6为本发明所述的基于BSR字典学习的图像编码方法与JPEG2000和JPEG标准相比的率失真性能曲线。
测试条件:标准测试图像lena和barbara,灰度图像,尺寸512x512;典型参数配置如下所示:图像块大小8x8,即n=64;字典矩阵大小64x256,即m=256;批处理个数P=8;非零系数个数的约束条件s=10;总计训练样本图像块个数不少于10万(即P与获取样本次数T的乘积);对比算法为JPEG2000和JPEG图像压缩标准,如图6所示;图样为
Figure BDA00002802236500111
的曲线为本文提供的方法,图样为
Figure BDA00002802236500112
的曲线为JPEG2000压缩标准,图样为
Figure BDA00002802236500113
的曲线为JPEG压缩标准。从图中可以看出,在相同压缩率的条件下,本文提供的基于BSR字典学习的图像编码方法平均优于JPEG2000压缩标准1.5dB的峰值信噪比(PSNR,Peak Signal-to-Noise Ratio),体现出更优的率失真性能。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和替换,这些改进和替换也应视为本发明的保护范围。

Claims (9)

1.一种基于字典学习的图像编码方法,其特征在于,包括以下步骤:
A、从图像样本中随机选取图像块,进行基于批处理的稀疏表示,通过交替优化方法求解字典矩阵;
B、根据已获得的字典矩阵,利用批处理的稀疏表示对待编码的图像块进行稀疏表示,并对稀疏系数向量中的非零系数进行量化熵编码;
C、在解码端,根据已获得的字典矩阵,对上述编码后的图像进行解码和稀疏重建。
2.如权利要求1所述的方法,其特征在于,所述步骤A进一步包括以下步骤:
A1、从图像样本中随机选取图像块,初始化中间变量矩阵H0←0、G0←0,其中H0为m行m列的实数矩阵,m为字典矩阵的列数,G0为n行m列的实数矩阵,n为图像块的维度,←表示初始化运算;初始化字典矩阵D0,所述D0为n行m列的实数矩阵;
A2、令迭代次数为t,从t=1开始,循环迭代所述图像块样本到第T次,其中T为获取样本次数;
A3、对于第t次循环,获取第t批图像块样本yt,1,...,yt,P,其中每个图像块样本为n行1列的列向量,共P个;
A4、在已知字典矩阵Dt-1的情况下,通过基于批处理的稀疏表示算法,求得P个稀疏系数列向量
Figure FDA00002802236400011
其中Dt-1为n行m列实数矩阵;
A5、更新中间变量矩阵:
H t ← H t - 1 + Σ p = 1 P β ^ t , p β ^ t , p T , G t ← G t - 1 + Σ p = 1 P y t , p β ^ t , p T ;
A6、初始化以下矩阵:
A=[a1,...,am],B=[b1,...,bm],Q=[q1,...,qm],其中A←Ht,B←Gt,Q←Dt-1
A7、逐列更新字典矩阵:
从第i=1列开始到第m列,依次逐列更新字典矩阵,
如果Ai,i≠0,那么 u i ← 1 A i , i ( b i - Qa i ) + q i , q i ← u i max ( | | u i | | 2 , 1 ) , 第i次循环结束;
A8、更新字典矩阵Dt←Q,循环结束;
A9、直到第T次循环结束,求得最终字典矩阵DT
3.如权利要求2所述的方法,其特征在于,所述基于批处理的稀疏表示算法的求解步骤如下:
S1、初始化图像块矩阵
Figure FDA00002802236400023
和对角字典矩阵 D ~ ← diag ( D , . . . , D ) ;
S2、求解约束条件下的最小二乘系数矩阵:
Γ ~ ← arg min | | Y ~ - D ~ Γ ~ | | 2 ,
s . t . | | Γ ~ | | 0 ≤ s ,
利用最小角度回归将松弛到
Figure FDA00002802236400028
其中
Figure FDA00002802236400029
是该列向量
Figure FDA000028022364000210
中的非零系数个数,
Figure FDA000028022364000211
是该列向量
Figure FDA000028022364000212
中的非零系数绝对值的和,s为非零系数个数的约束,利用最小角度回归方法LARS进行求解;
S3、从系数列向量
Figure FDA000028022364000213
中求得稀疏系数[β1,...,βP]。
4.如权利要求1所述的方法,其特征在于,所述步骤B进一步包括以下步骤:
B1、对每个图像块的直流分量DC系数和交流分量AC系数进行分离;
B2、对所述直流分量DC系数进行差分脉冲编码调制,得到残差向量;
B3、对所述交流分量AC系数进行基于批处理的稀疏表示,求得相应的稀疏系数向量
Figure FDA000028022364000214
共J个列向量,其中J为待编码的图像块个数;
B4、对差分脉冲编码调制后的DC系数和经过基于批处理的稀疏表示求得的稀疏系数向量进行量化和熵编码,即对所述稀疏系数向量
Figure FDA00002802236400031
中的非零元素及其索引进行量化和Huffman熵编码,形成压缩数据。
5.如权利要求4所述的方法,其特征在于,所述步骤C进一步包括以下步骤:
C1、对所述压缩数据进行Huffman熵解码和反量化,恢复图像块的稀疏系数
Figure FDA00002802236400032
及每个图像块的差分脉冲编码调制后的直流分量DC系数及残差向量;
C2、进行解码重建,从差分脉冲编码调制后的直流分量DC系数和残差向量中恢复每个图像块的直流分量DC系数;
C3、在已知字典DT的前提下,通过矩阵相乘,稀疏重建第j个图像块
Figure FDA00002802236400033
恢复图像块的交流分量AC系数向量
Figure FDA00002802236400034
共J个列向量;
C4、将重建后的直流分量DC系数、交流分量AC系数合并叠加,得到重建图像。
6.一种基于字典学习的图像编码系统,其特征在于,该系统包括:
基于批处理的稀疏表示的字典学习模块,用于从图像样本中随机选取图像块,进行基于批处理的稀疏表示的字典学习,获得字典矩阵;
图像编码模块,与所述基于批处理的稀疏表示的字典学习模块相连,用于根据已获得的字典矩阵,利用批处理的稀疏表示对所述图像块进行稀疏表示,并进行图像编码;
图像解码模块,与所述基于批处理的稀疏表示的字典学习模块和所述图像编码模块相连,用于根据已获得的字典矩阵,对上述编码后的图像进行图像解码重建。
7.如权利要求6所述的系统,其特征在于,所述基于批处理的稀疏表示的字典学习模块包括:
训练图像样本库,用于存放用于训练学习的各种图像样本;
样本预处理单元,与所述训练图像样本库相连,用于去除图像样本块的均值,并进行归一化处理;
字典训练学习单元,与所述样本预处理单元相连,用于对预处理后的图像样本块进行稀疏表示与纹理归纳学习。
8.如权利要求6所述的系统,其特征在于,所述图像编码模块包括:
图像块分割与DC、AC系数分离单元,用于将输入的图像块划分为8x8或12x12或16x16大小的图像块,并对每块图像的直流分量DC系数与交流分量AC系数分开;
差分脉冲编码调制单元,与所述图像块分割与DC、AC系数分离单元相连,用于对图像块的直流分量DC系数进行差分编码,得到残差向量;
基于批处理的稀疏表示单元,与所述图像块分割与DC、AC系数分离单元相连,在已知字典矩阵的条件下,用于对图像块的交流分量AC系数进行稀疏变换,求得图像块的稀疏系数;
量化与熵编码单元,与所述差分脉冲编码调制单元和所述基于批处理的稀疏表示单元相连,用于对差分脉冲编码调制后的直流分量DC系数和经过基于批处理的稀疏表示求得的稀疏系数及其索引进行量化和Huffman熵编码,最终形成压缩数据。
9.如权利要求6所述的系统,其特征在于,所述图像解码模块包括:
反量化与熵解码单元,用于对上述压缩数据进行Huffman熵解码和反量化,恢复图像块的稀疏系数及每个图像块的差分脉冲编码调制后的直流分量DC系数及残差向量;
差分脉冲编码信号重建单元,与所述反量化与熵解码单元相连,用于从差分脉冲编码调制后的直流分量DC系数和残差向量中恢复每个图像块的直流分量DC系数;
基于批处理的稀疏表示的图像块稀疏重建单元,与所述反量化与熵解码单元相连,在已知字典矩阵的条件下,用于对图像块进行稀疏重建,恢复每个图像块的交流分量AC系数;
DC、AC系数合并与图像恢复单元,与所述差分脉冲编码信号重建单元和所述基于批处理的稀疏表示的图像块稀疏重建单元相连,用于对图像的直流分量DC系数和交流分量AC系数进行叠加,得到重建图像。
CN201310039436.7A 2013-01-31 2013-01-31 基于字典学习的图像编码方法及系统 Pending CN103489203A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310039436.7A CN103489203A (zh) 2013-01-31 2013-01-31 基于字典学习的图像编码方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310039436.7A CN103489203A (zh) 2013-01-31 2013-01-31 基于字典学习的图像编码方法及系统

Publications (1)

Publication Number Publication Date
CN103489203A true CN103489203A (zh) 2014-01-01

Family

ID=49829400

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310039436.7A Pending CN103489203A (zh) 2013-01-31 2013-01-31 基于字典学习的图像编码方法及系统

Country Status (1)

Country Link
CN (1) CN103489203A (zh)

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104053012A (zh) * 2014-05-28 2014-09-17 北京大学深圳研究生院 一种基于字典库的视频编解码方法及装置
CN104883567A (zh) * 2015-06-09 2015-09-02 武汉大学 一种基于过完备字典的视频监控图像压缩方法
CN105444766A (zh) * 2015-12-16 2016-03-30 清华大学 基于深度学习的室内导航方法
CN106504199A (zh) * 2016-09-13 2017-03-15 深圳大学 一种眼底图像增强方法及系统
CN106815876A (zh) * 2016-12-30 2017-06-09 清华大学 图像稀疏表征多字典学习的联合优化训练方法
CN107065006A (zh) * 2017-01-23 2017-08-18 武汉大学 一种基于在线字典更新的地震信号编码方法
CN107170020A (zh) * 2017-06-06 2017-09-15 西北工业大学 基于最小量化误差准则的字典学习静态图像有损压缩方法
CN107240138A (zh) * 2017-05-25 2017-10-10 西安电子科技大学 基于样本二叉树字典学习的全色遥感图像压缩方法
CN107274462A (zh) * 2017-06-27 2017-10-20 哈尔滨理工大学 基于熵和几何方向的分类多字典学习磁共振图像重建方法
CN107664773A (zh) * 2017-09-26 2018-02-06 武汉大学 一种基于时间移位和熵约束的地震信号编码方法
CN108230299A (zh) * 2017-12-08 2018-06-29 东华大学 一种基于稳定学习字典的机织物纹理瑕疵检测方法
CN108389161A (zh) * 2018-01-08 2018-08-10 广东工业大学 一种基于互斥性稀疏编码的雨天视频图像分离方法
CN108536750A (zh) * 2018-03-13 2018-09-14 南京大学 基于点对关系学习和重构的图像特征二值编码表示方法
CN110278444A (zh) * 2019-07-17 2019-09-24 华侨大学 一种采用几何引导的稀疏表示三维点云压缩方法
CN110678899A (zh) * 2017-06-02 2020-01-10 三菱电机株式会社 成像系统和图像处理方法
CN113112557A (zh) * 2021-02-23 2021-07-13 西南科技大学 一种基于字典学习的分块自适应纸箱图像压缩方法
WO2022063055A1 (zh) * 2020-09-22 2022-03-31 上海交通大学 基于多尺度结构化字典学习的3d点云压缩系统
WO2023272491A1 (zh) * 2021-06-29 2023-01-05 深圳高性能医疗器械国家研究院有限公司 基于联合字典学习和深度网络的pet图像重建方法
CN115834885A (zh) * 2023-02-17 2023-03-21 宁波康达凯能医疗科技有限公司 一种基于稀疏表示的帧间图像编码方法与系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102156875A (zh) * 2011-03-25 2011-08-17 西安电子科技大学 基于多任务ksvd字典学习的图像超分辨率重构方法
CN102651073A (zh) * 2012-04-07 2012-08-29 西安电子科技大学 基于稀疏动态集成选择的sar图像地物分类方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102156875A (zh) * 2011-03-25 2011-08-17 西安电子科技大学 基于多任务ksvd字典学习的图像超分辨率重构方法
CN102651073A (zh) * 2012-04-07 2012-08-29 西安电子科技大学 基于稀疏动态集成选择的sar图像地物分类方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JULIEN MAIRAL ET AL.: "Online Dictionary Learning for Sparse Coding", 《JUNE 2009 ICML "09: PROCEEDINGS OF THE 26TH ANNUAL INTERNATIONAL CONFERENCE ON MACHINE LEARNING》 *
YIPENG SUN ET AL.: "Online Dictionary Learning based Intra-Frame Video Coding via Sparse Representation", 《WIRELESS PERSONAL MULTIMEDIA COMMUNICATIONS—2012 15TH INTERNATIONAL SYMPOSIUM ON IEEE》 *

Cited By (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104053012B (zh) * 2014-05-28 2017-08-29 北京大学深圳研究生院 一种基于字典库的视频编解码方法及装置
CN104053012A (zh) * 2014-05-28 2014-09-17 北京大学深圳研究生院 一种基于字典库的视频编解码方法及装置
CN104883567A (zh) * 2015-06-09 2015-09-02 武汉大学 一种基于过完备字典的视频监控图像压缩方法
CN104883567B (zh) * 2015-06-09 2017-12-12 武汉大学 一种基于过完备字典的视频监控图像压缩方法
CN105444766A (zh) * 2015-12-16 2016-03-30 清华大学 基于深度学习的室内导航方法
CN106504199A (zh) * 2016-09-13 2017-03-15 深圳大学 一种眼底图像增强方法及系统
CN106504199B (zh) * 2016-09-13 2019-03-22 深圳大学 一种眼底图像增强方法及系统
CN106815876A (zh) * 2016-12-30 2017-06-09 清华大学 图像稀疏表征多字典学习的联合优化训练方法
CN107065006A (zh) * 2017-01-23 2017-08-18 武汉大学 一种基于在线字典更新的地震信号编码方法
CN107065006B (zh) * 2017-01-23 2019-06-11 武汉大学 一种基于在线字典更新的地震信号编码方法
CN107240138A (zh) * 2017-05-25 2017-10-10 西安电子科技大学 基于样本二叉树字典学习的全色遥感图像压缩方法
CN107240138B (zh) * 2017-05-25 2019-07-23 西安电子科技大学 基于样本二叉树字典学习的全色遥感图像压缩方法
CN110678899B (zh) * 2017-06-02 2023-04-28 三菱电机株式会社 成像系统和图像处理方法
CN110678899A (zh) * 2017-06-02 2020-01-10 三菱电机株式会社 成像系统和图像处理方法
CN107170020A (zh) * 2017-06-06 2017-09-15 西北工业大学 基于最小量化误差准则的字典学习静态图像有损压缩方法
CN107274462B (zh) * 2017-06-27 2020-06-23 哈尔滨理工大学 基于熵和几何方向的分类多字典学习磁共振图像重建方法
CN107274462A (zh) * 2017-06-27 2017-10-20 哈尔滨理工大学 基于熵和几何方向的分类多字典学习磁共振图像重建方法
CN107664773A (zh) * 2017-09-26 2018-02-06 武汉大学 一种基于时间移位和熵约束的地震信号编码方法
CN108230299A (zh) * 2017-12-08 2018-06-29 东华大学 一种基于稳定学习字典的机织物纹理瑕疵检测方法
CN108230299B (zh) * 2017-12-08 2020-02-11 东华大学 一种基于稳定学习字典的机织物纹理瑕疵检测方法
CN108389161A (zh) * 2018-01-08 2018-08-10 广东工业大学 一种基于互斥性稀疏编码的雨天视频图像分离方法
CN108536750B (zh) * 2018-03-13 2022-03-18 南京大学 基于点对关系学习和重构的图像特征二值编码表示方法
CN108536750A (zh) * 2018-03-13 2018-09-14 南京大学 基于点对关系学习和重构的图像特征二值编码表示方法
CN110278444B (zh) * 2019-07-17 2022-11-01 华侨大学 一种采用几何引导的稀疏表示三维点云压缩方法
CN110278444A (zh) * 2019-07-17 2019-09-24 华侨大学 一种采用几何引导的稀疏表示三维点云压缩方法
WO2022063055A1 (zh) * 2020-09-22 2022-03-31 上海交通大学 基于多尺度结构化字典学习的3d点云压缩系统
CN113112557A (zh) * 2021-02-23 2021-07-13 西南科技大学 一种基于字典学习的分块自适应纸箱图像压缩方法
WO2023272491A1 (zh) * 2021-06-29 2023-01-05 深圳高性能医疗器械国家研究院有限公司 基于联合字典学习和深度网络的pet图像重建方法
CN115834885A (zh) * 2023-02-17 2023-03-21 宁波康达凯能医疗科技有限公司 一种基于稀疏表示的帧间图像编码方法与系统

Similar Documents

Publication Publication Date Title
CN103489203A (zh) 基于字典学习的图像编码方法及系统
CN107197260B (zh) 基于卷积神经网络的视频编码后置滤波方法
CN107018422B (zh) 基于深度卷积神经网络的静止图像压缩方法
Ma et al. iWave: CNN-based wavelet-like transform for image compression
CN103414892B (zh) 一种大容量抗压缩的图像信息隐藏方法
JPH0630391A (ja) 大域ブロック変換を用いた圧縮画像データに頑強性を付与するための装置および方法
CN104065976B (zh) 一种基于视频的图像压缩及保密传输方法
CN109922339A (zh) 结合多采样率下采样和超分辨率重建技术的图像编码框架
Sun et al. Dictionary learning for image coding based on multisample sparse representation
George et al. Image compression based on wavelet, polynomial and Quadtree
Ernawan et al. An efficient 2× 2 Tchebichef moments for mobile image compression
CN105163130B (zh) 一种基于离散Tchebichef正交多项式的图像无损压缩方法
CN1825894A (zh) 全相位余弦双正交变换及其对jpeg的改进方法
Akbari et al. Image compression using adaptive sparse representations over trained dictionaries
CN100426866C (zh) 全相位沃尔什双正交变换及其对jpeg的改进方法
CN110234011B (zh) 一种视频压缩方法及系统
Sultana Image Compression Technique WDR and EZW for Different Wavelet Codes.
Xu et al. Sparse representation of texture patches for low bit-rate image compression
Fan et al. Learned lossless jpeg transcoding via joint lossy and residual compression
Talooh et al. Comparative study of discrete cosine transforms and set partitioning in hierarchical trees
Sultan Image compression by using walsh and framelet transform
Ranjeeta et al. Image compression: an overview
Mulla et al. High-speed cluster scanning scheme for three-dimensional constellated image processing
Karthikeyan et al. EMBEDDED ZERO TREE WAVELET AND ORTHOGONAL POLYNOMIAL BASED TRANSFORM CODING.
Muzaffar et al. Linked significant tree wavelet-based image compression

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: SHENZHEN INSTITUTE OF STINGHUA UNIVERSITY

Effective date: 20140805

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20140805

Address after: 100084 Beijing Haidian District Tsinghua Yuan 100084-82 mailbox

Applicant after: Tsinghua University

Applicant after: Shenzhen Institute of Stinghua University

Address before: 100084 Beijing Haidian District Tsinghua Yuan 100084-82 mailbox

Applicant before: Tsinghua University

RJ01 Rejection of invention patent application after publication

Application publication date: 20140101

RJ01 Rejection of invention patent application after publication