CN110267049B - 一种稀疏编码的存储优化方法 - Google Patents

一种稀疏编码的存储优化方法 Download PDF

Info

Publication number
CN110267049B
CN110267049B CN201910464813.9A CN201910464813A CN110267049B CN 110267049 B CN110267049 B CN 110267049B CN 201910464813 A CN201910464813 A CN 201910464813A CN 110267049 B CN110267049 B CN 110267049B
Authority
CN
China
Prior art keywords
reconstructed image
sparse
contrast
bits
coding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910464813.9A
Other languages
English (en)
Other versions
CN110267049A (zh
Inventor
汪建基
刘琦
陈佩
陈霸东
郑南宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian Jiaotong University
Original Assignee
Xian Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian Jiaotong University filed Critical Xian Jiaotong University
Priority to CN201910464813.9A priority Critical patent/CN110267049B/zh
Publication of CN110267049A publication Critical patent/CN110267049A/zh
Application granted granted Critical
Publication of CN110267049B publication Critical patent/CN110267049B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/90Dynamic range modification of images or parts thereof
    • G06T5/92Dynamic range modification of images or parts thereof based on global image properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/423Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation characterised by memory arrangements
    • H04N19/426Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation characterised by memory arrangements using memory downsizing methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明公开一种稀疏编码的存储优化方法,以均方误差为目标函数对目标信号y进行稀疏表征,并计算稀疏表征结果的线性系数si;在基于不同图像度量一致性的基础上,分析基于均方误差的重构图像和基于结构相似性的重构图像的PSNR值和对比度;根据分析结果,对稀疏表征结果中的线性系数si的比特进行分配,利用最少量的比特数存储稀疏编码的编码结果,实现稀疏编码的存储优化。本发明的稀疏编码的存储优化方法在对于不同图像度量方法进行深入分析研究的基础上,通过综合考虑重构图像的PSNR值和图像对比度对稀疏编码的比特分配问题进行分析,根据分析结果,完成了稀疏编码的最优化比特分配方法,即实现稀疏编码的存储优化,节省了稀疏编码的存储空间。

Description

一种稀疏编码的存储优化方法
技术领域
本发明涉及信号处理技术领域,特别涉及一种稀疏编码的存储优化方法。
背景技术
信号的表征与编码一直是信息领域的一个研究热点,同时也是信息技术中发展最为迅速的方向之一。模拟信号的数字化使现实世界中的信息可以被采集并被计算机处理,伴随着存储技术的高速发展,硬件设备的存储能力也在不断提升,各类信息也在以更快的速度增加。一般来说,采用低维空间中的点集来表示信号,具有表达信息丰富和较强的直观性等优点。但同时也包含大量冗余信息,不但占用网络资源量增加,而且也不利于计算机对信息的分析和处理。因此,编码技术具有极为重要的作用,它不仅可以减少存储信息所占用的空间,提高传输效率,同时对部分信号,例如实时视频数据的传输、显示等都具有极为重要的意义。稀疏编码就是一种常见的信息表示方式。
稀疏编码是指采用一组基函数的线性组合来获得原始图像的编码表示的过程。在这组线性组合中只有少量系数的绝对值较大,而剩余大部分系数的绝对值非常小或者接近于0。因此,只需要极少部分的系数就可以近似地逼近原始信号。
在稀疏编码中,对于任意一个维度为d的信号向量y,需要找到一个线性变换来线性逼近y。给定一个基函数集X,X中包含n个维度为d的向量{x1,x2,…,xn},具体形式如下:
y=s1x1+s2x2+…+snxn+o1
上式中,s1,s2,…,sn和o是线性标量系数,而向量1是维度为d,元素值全为1的向量。在稀疏编码中,向量集合X被称为基函数集(或码本集),集合中的每个向量xi被称为基函数(或码本)。为了存储编码结果x,只需要存储线性系数s,o和xi在基函数集中的索引(其中,i=1,2,…,m)。
经过多年的研究,稀疏编码已经在诸多领域中取得了突破性的进展,但是目前尚没有关于稀疏编码最优化存储模式的研究出现。在稀疏编码算法研究中没有人分析编码稀疏数据的比特分配。在信号的稀疏编码存储中,稀疏编码的存储模式好坏不仅影响信号保存时所占用的内存空间,而且稀疏编码的稀疏系数的数据存储精度也会对重构信号的质量产生很大的影响,目前稀疏编码的存储不够优化,占用存储空间大。
传统的图像质量度量方法种类很多,如均方误差(MSE)、信噪比(SNR)和峰值信噪比(PSNR)都是基于绝对误差的度量方法。而结构相似性(SSIM)指数是另一种重要的质量度量方法,并且已被证明在人类视觉系统(HVS)中更为有效。尽管MSE和SSIM之间在数学原理上存在许多本质的区别,但它们之间依然存在一些重要的关联。
基于绝对误差的图像度量方法,如均方误差(MSE)、信噪比(SNR)和峰值信噪比(PSNR)是最常用的相似性度量方法。对于给定的两个信号x和y,信号x可以表示为一个信号向量{x1,x2,…,xd},信号y也可以表示为{y1,y2,…,yd}。那么两个图像块x和y之间的MSE值可以计算如下,
Figure BDA0002079106400000021
因此,MSE是一种基于像素误差的度量。SNR和PSNR都源于MSE。这些信号度量方法几乎适用于所有类型的信号。而结构相似性(SSIM)指数的提出主要是为了提高图像质量评估方法(IQA)在人类视觉系统(HVS)的有效性。在SSIM中,误差分为三部分:亮度误差,对比度误差和结构误差。对于两个图像块x和y,如果μx和μy分别是图像块x和y中像素的平均值,则σx和σy分别是图像块x和y中像素的标准偏差,σxy是x和y之间的协方差,则SSIM得到如下形式:
Figure BDA0002079106400000031
发明内容
为解决现有技术中存在的问题,本发明的目的在于提供一种稀疏编码的存储优化方法,从而实现稀疏编码的存储优化。
本发明采用的技术方案如下:
一种稀疏编码的存储优化方法,包括如下步骤:
步骤1、对于目标信号y,以均方误差为目标函数对目标信号y进行稀疏表征,稀疏表征结果为:y=s1x1+s2x2+…+skxk+o,计算线性系数si,其中i=1,2,3…k,k为正整数;
步骤2、在基于不同图像度量一致性的基础上,分析基于均方误差的重构图像和基于结构相似性的重构图像的PSNR值和对比度;
步骤3、根据基于均方误差的重构图像和基于结构相似性的重构图像的PSNR值和对比度的分析结果,对稀疏表征结果中的线性系数si的比特进行分配,利用最少量的比特数存储稀疏编码的编码结果(编码结果即线性系数si),实现稀疏编码的存储优化。
步骤1中,利用均方误差图像度量方法对图像块进行稀疏表示时,令均方误差的取值最大化。
步骤2中,分析结果为:基于结构相似性得到的重建图像的对比度优于基于均方误差得到的重建图像的对比度,基于均方误差重构图像的PSNR值优于基于结构相似性重构图像的PSNR值。
步骤3中,对稀疏表征结果中的线性系数si的比特进行分配,利用最少量的比特数存储线性系数si时,采用基于均方误差的编码方案来存储线性系数si,并且通过图像对比度来优化线性系数si占用的空间。
步骤3中,基于均方误差的编码方案来存储线性系数si,并且通过图像对比度来优化线性系数si占用的空间时,利用科学计数法表示si的绝对值:|si|=a×10b,用1个比特存储si的符号,用3个比特存储b的值,用5到7个比特存储a的值。最终si仅用9到11个比特进行存储。对b的8种可能的取值进行约定;当s=0时,约定s=1×10bmin,其中bmin为当前约定b的最小值。
步骤3中,当用m个比特存储a时(m=5,6,7),a被存储为十进制数字
Figure BDA0002079106400000041
Figure BDA0002079106400000042
向下取整。当用存储的数还原si用以重现原信号时,a被还原为
Figure BDA0002079106400000043
这时有a*≥a。即对a的存储进行优化,将a的2m种可能的取值每个对应于一个实际a的取值区间,在还原时将a还原至对应区间的较大值。
本发明具有如下有益效果:
本发明的稀疏编码的存储优化方法在对于不同图像度量方法进行深入分析研究的基础上,通过综合考虑重构图像的PSNR值和图像对比度对稀疏编码的比特分配问题进行分析,根据分析结果,完成了稀疏编码的最优化比特分配方法,利用最少量的比特数存储稀疏编码的编码结果,即可实现稀疏编码的存储优化,节省了稀疏编码的存储空间。
附图说明
图1是本发明实施例中13张标准测试图像分别在基于MSE和基于SSIM的方案下进行稀疏编码得到的重构图像对比度与原始图像对比度的比值。
图2是本发明实施例中在基于不同的稀疏编码方案下两个图像块的重构图像块的对比。
图3是本发明实施例中对VOC2007中9963张图像在基于MSE的编码方案下进行稀疏编码,分别采用不同比特保存a时得到的d-PSNR均值曲线和d-图像对比度均值曲线。
图4是本发明实施例中对VOC2007中9963张图像在基于SSIM的编码方案下进行稀疏编码,分别采用不同比特保存a时得到的d-PSNR均值曲线和d-图像对比度均值曲线。
图5是本发明实施例中对VOC2007中9963张图像在基于MSE的编码方案下进行稀疏编码,分别采用4,5,6比特保存a时得到的d-PSNR均值曲线和d-图像对比度均值曲线。
图6是本发明实施例中对VOC2007中9963张图像在基于SSIM的编码方案下进行稀疏编码,分别采用4,5,6比特保存a时得到的d-PSNR均值曲线和d-图像对比度均值曲线。
图7是本发明实施例中采用不同比特存储a时解码得到的重构图像块。
具体实施方式
下面结合具体实施方式和附图对本发明做进一步详细说明。
本发明利用均方误差(MSE)和结构相似性(SSIM)作为线性分解中代价函数时两者之间的一些关联,并且基于这些关联,提出了一种稀疏编码的存储优化方法,该方法综合考虑重构图像质量和重构图像对比度,然后进行稀疏编码存储的最优比特分配,从而能够优化稀疏编码的存储。
本发明的稀疏编码的存储优化方法主要包括以下三个步骤:
步骤1、对于目标信号y,以均方误差为目标函数对目标信号y进行稀疏表征,稀疏表征结果为:y=s1x1+s2x2+…+skxk+o,计算线性系数si,其中i=1,2,3…k;
步骤2、在基于不同图像度量一致性的基础上,分析基于均方误差的重构图像和基于结构相似性的重构图像的PSNR值和对比度;
步骤3、根据基于均方误差的重构图像和基于结构相似性的重构图像的PSNR值和对比度的分析结果,对稀疏表征结果中的线性系数si的比特进行分配,利用最少量的比特数存储稀疏编码的编码结果,实现稀疏编码的存储优化。
对于稀疏编码中所需要存储的线性系数si,综合考虑PSNR值和图像对比度的实际需要来存储si的值。
对于稀疏编码中的线性系数si,利用科学计数法表示si的绝对值:|si|=a×10b,用1个比特存储si的符号,用3个比特存储b的值,用5到7个比特存储a的值。最终si仅用9到11个比特进行存储。对b的8种可能的取值进行约定;当si=0时,约定si=1×10bmin,其中bmin为当前约定b的最小值。
步骤1中,基于MSE的线性分解方案是传统的线性分解方法,这一步分析以MSE作为代价函数时向量x和y之间的关系。对于线性变换x=s1x1+s2x2+…+smxm+o1,向量x和y之间的MSE被表示成如下形式:
Figure BDA0002079106400000061
然后通过最小化MSE(x,y),推导出最小化MSE(x,y)等价于最大化向量x和y之间的皮尔逊内积相关系数,即:
Figure BDA0002079106400000062
根据这个推论计算出对于给定的目标向量y能够得到选择的字典原子xi以及对应的系数si
其次,在使用结构相似性(SSIM)评价两幅图像时,SSIM的取值的范围属于[-1,1]。当SSIM的值接近1时,表明两幅图像几乎相同;当SSIM的值为-1时,表明两幅图像具有相同的平均值,但是当它们都减去平均值时得到的图像块的像素值是相反的。因此,在求解SSIM的目标时,需要令SSIM的取值最大化,经过推导可以得出:
Figure BDA0002079106400000063
步骤2中,使用相同数量的字典原子的线性组合
Figure BDA0002079106400000064
来近似表示目标向量y的情况。根据步骤1的结论,为了找到最好的m个字典原子来近似表示目标向量y,只需要找到m个字典原子来最大化γxy,这在基于MSE的线性分解方案和基于SSIM的线性分解方案中都保持相同。因此,根据两个线性分解方案,可以得出两个关联。
关联1:在基于MSE的线性分解方案和基于SSIM的线性分解方案中,对于给定的目标向量y在相同字典集合上进行稀疏编码时,选择的字典原子完全相同。
在基于MSE的线性分解方案和基于SSIM的线性分解方案中,假设目标向量y的最佳线性近似值分别是xMSE和xSSIM,假设基于MSE的线性分解方案中的线性系数为
Figure BDA0002079106400000071
和oMSE,并且基于SSIM的线性分析方案中的线性系数是
Figure BDA0002079106400000072
和oSSIM,可以得出:
Figure BDA0002079106400000073
Figure BDA0002079106400000074
能够推导出:
Figure BDA0002079106400000075
这个等式提供了两种不同方案之间的第二种关联:
关联2:虽然在基于MSE的线性分解方案和基于SSIM的线性分解方案中得到的线性系数并不相同,但基于MSE的线性分解方案中的线性系数
Figure BDA0002079106400000076
与基于SSIM的线性分解方案中对应的线性系数
Figure BDA0002079106400000077
的比值是一个常数,这个常数就是目标向量y和线性近似向量x之间的皮尔逊相关系数γxy
基于上述两个关联,定义Fcon(·)表示图像的图像对比度,因此可得:
Fcon(xMSE)=|γxy|Fcon(xSSIM)
根据上式可知,基于MSE的方案中重构图像的图像对比度总是不大于基于SSIM方案中的图像对比度,也就是说基于SSIM的方案中得到的重建图像的对比度优于基于MSE的方案中得到的重建图像的对比度。
根据MSE和峰值信噪比(PSNR)的定义,通过计算重构图像的PSNR值,能够得出基于MSE的方案中重构图像的PSNR值优于基于SSIM的方案中的重构图像的PSNR值的结论。
步骤3中,对于稀疏编码中的线性系数si,基于MSE的编码方案中的线性系数si的值和基于SSIM的编码方案中的线性系数si是不相同的。根据关联2可知,在重构信号过程中,如果采用在基于MSE的编码方案中保存si的值,则重构图像具有较高的PSNR值;如果在基于SSIM的编码方案中保存si的值,则重构信号的对比度更接近原信号。
因此,综合考虑PSNR值和图像对比度的实际需要来存储si的值。本发明基于MSE的编码方案来存储si,并且也通过考虑图像对比度来优化si占用的空间。
由于si是一个有符号的数字,因此需要一位来保存它的符号,然后用科学记数法表示si的绝对值,|si|=a*10b。因此,在稀疏编码中需要存储的线性系数si被分成三部分:符号(1位),数值a和指数b。
对b的8种可能取值进行约定,同时对s=0这一特殊情况进行了约定。其中,指数b所占据的空间根据|si|的范围来确定。通过实验可知,当用3位来存储b的值时,具有足够精确的范围,事实上,由于字典原子都是均值为0和模长为1的向量,因此这些码本向量中的值都不超过1。所以b的最小值可以取-2,当b的值小于-2时,都可以将s的绝对值用0.01表示,此时由于码本向量中的值都不超过1,用0.01相乘后都不超过0.01。对于图像信号而言,最后单个像素都要被转换为0到255中的一个整数值,而0.01对整数值的像素影响微乎其微,所以对于图像而言,约定b的值为-2,1,0,1,2,3,4,5即可。同样地,对于s=0的情况,也可以约定s=0.01.对于非图像信号,b的取值的约定根据实际的b的取值的分布的情况进行讨论,但总体上3个比特都足够用了。
步骤3中,当用m个比特存储a时(m=5,6,7),a被存储为十进制数字
Figure BDA0002079106400000081
Figure BDA0002079106400000082
向下取整。当用存储的数还原si用以重现原信号时,a被还原为
Figure BDA0002079106400000083
这时有a*≥a。
由于采用了科学计数法,则a∈[1,10)。这里使用m位存储线性系数a,并且a最终被存储为
Figure BDA0002079106400000091
其中
Figure BDA0002079106400000092
表示向下取整,而每个a'实际上定义了[1,10)中的一个区间(标号从0到2m-1共计m个区间),而当前a的取值位于第
Figure BDA0002079106400000093
个区间。
由于a的实际值在第a'个区间内,而根据关联2,基于结构相似形的情况下a的取值总是大于等于基于均方误差的a的实际值,因此在重构信号时,本发明将a的实际值取第a'个区间内的一个较大值,例如第a'个区间的最大值
Figure BDA0002079106400000094
前面将si的绝对值表示为:|si|=a*10b。然后用m+4比特存储线性系数s,其中1比特用于保存si的符号,3比特存储b;并且m位用于存储a。对于m的值,在实际存储中,3个比特位太少,不足以存储所有有效数据,而8位或更多的比特位足够保存所需的有效数据,但可能过于冗余。因此,本发明提出采用5,6或7个比特位存储a。
在某些特殊情况,如当s=0时要求重现的信号中s也必须为0时,将a的2m种可能的取值中为这些特殊情况指定某l个选值,剩余的2m-l种可能的取值再用于存储其他的a.剩余部分对a的存储以及还原方法如步骤3,先按照a的取值进行区间划分,在还原时对区间内的值都还原至对应区间的最大值。
实施例
下面以图像信号为例来说明本发明的可行性并给出应用实例。
根据上述部分,对于一个训练好的过完备字典集X,其中有n个字典原子{x1,x2,…,xn},每个字典原子都是一个均值为0和模为1的d维向量。这里“过完备”是表示字典集合中的原子个数n远大于原子的维度p。对于要在稀疏编码中表示的目标向量y,需要找到一个线性组合s1x1+s2x2+…+snxn+o1来近似表示目标向量y,其中,s1,s2,…,sn和o是线性系数,向量1是长为d元素全1的向量。
根据基于MSE和SSIM的线性分解方法,可以对目标向量y进行稀疏表示,假设x1,x2,…,xk是对应于非零的系数si的选定字典原子,并且是目标向量y的最佳线性近似值。为了存储编码结果,只需要存储线性系数s,偏差系数o和xi在字典原子中的索引(其中,i=1,2,…,m)。
根据上述内容,可知对于给定目标向量y在不同稀疏编码方案下选定的字典原子相同,基于MSE的编码方案中得到线性参数s的绝对值总是小于基于SSIM的编码方案中得到的参数s的绝对值。表1为稀疏度k=2时,512×512的Lena图像分别在基于MSE和SSIM的编码方案下得到的前10个8×8图像块的系数对s1和s2。这里的过完备字典X中包含400个预训练好的字典原子,其中每个字典原子都是均值为0,模为1,大小为8×8的向量。
表1
Figure BDA0002079106400000101
在图1中显示了在不同方案的稀疏编码中的13个大小为512×512的标准测试图像的重建图像对比度与原始图像对比度的比值。这13个标准测试图像分别是:aerial,airplane,baboon,boat,bridge,couple,Elaine,house,Lena,peppers,sailboat,milk-drop coronet,and blonde。13张标准测试图像分别在基于MSE和基于SSIM的方案下进行稀疏编码得到的重构图像对比度与原始图像对比度的比值,这些重构图像是在稀疏度k=4时进行稀疏编码得到的。从图1中可以看到,在基于SSIM的方案中得到的重建图像的对比度优于基于MSE的方案中得到的重建图像的对比度。
在图2中显示了稀疏度k=6时两种不同的稀疏编码方案中得到的两个8×8重构图像块,从中还可以看出,基于SSIM的方案中的重构图像对比度更接近于原始图像块。根据MSE和峰值信噪比(PSNR)的定义,基于MSE的方案中重构图像的PSNR值优于基于SSIM的方案中的重构图像的PSNR值,而基于SSIM的方案中的图像对比度是优于基于MSE的方案。
通过综合考虑重构图像的PSNR值和图像对比度来分析稀疏编码的比特分配问题。这里使用VOC2007图像集中的9963张图像作为测试图像来验证本发明的算法,这些图像中包含了7,081,343个大小为8×8的图像块。过完备字典集仍然采用上述稀疏编码过程中使用的400个大小为8×8原子的字典X。
下面讨论线性系数si比特分配的具体方式。
首先,由于si是一个有符号的数字,因此需要一位来保存它的符号,然后用科学记数法表示si的绝对值,|si|=a*10b。因此,在稀疏编码中需要存储的线性系数si被分成三部分:符号(1位),数值a和指数b。然后用m+4比特存储线性参数s,其中1比特用于保存s的符号,3比特存储b;
这里基于一般情况和一些极端的例子来讨论m的值。
基于一般情况分析:对于大小为512×512的Lena和Baboon2幅图像,在基于MSE的编码方案和基于SSIM的编码方案中使用64位存储a解码得到的重构图像的PSNR值和图像对比度,以及针对a所提出的采用不同存储位数解码时得到的重构图像的PSNR值和图像对比度的最佳比特分配方案分别示于表2和表3中。表2为对于大小为512×512的Lena图像,在基于MSE的编码方案和基于SSIM的编码方案中使用64比特和3-10比特存储a解码得到的重构图像的PSNR值和图像对比度,表3为对于大小为512×512的Baboon图像,在基于MSE的编码方案和基于SSIM的编码方案中使用64比特和3-10比特存储a解码得到的重构图像的PSNR值和图像对比度。Lena和Baboon的原始图像对比度分别为98.3342dB和654.9039dB。
表2
Figure BDA0002079106400000121
表3
Figure BDA0002079106400000122
Figure BDA0002079106400000131
从表2和表3中可知,当a采用3比特位存储时,图像Lena和Baboon的PSNR值都有明显下降。而且,图像Lena的图像对比度远大于原始图像对比度。因此,采用3比特存储a显然不是一个好的选择。当采用7比特以及多于7比特存储a时,最优比特分配方案中重构图像的PSNR值和图像对比度非常接近于基于MSE的编码方案中的重构图像的PSNR值和图像对比度。
图3和图4分别显示了对VOC2007图像集中9963张图像进行稀疏编码时,分别在基于MSE的编码方案和基于SSIM的编码方案中采用不同的存储位数保存a时得到的稀疏度-PSNR均值曲线和稀疏度-图像对比度均值曲线。从图5中可以看出,如果存储a的比特不少于7位,最优比特分配方案中重构图像的PSNR值曲线几乎与基于MSE的编码方案得到的重构图像的PSNR值一致。图3还表明最优比特分配方案中的重构图像对比度非常接近基于MSE的编码方案中得到的重构图像的图像对比度。
综合上述分析,对a的存储分配,3个比特位太少,不足以存储所有有效数据,而8位或更多的比特位足够保存所需的有效数据,但可能过于冗余。
图5和图6类似于图3和图4,显示了采用4,5和6个比特位来存储a时的稀疏度-PSNR均值曲线和稀疏度-图像对比度均值曲线。
对于4,5或6个比特位存储a是否合适。
首先,如果采用4比特存储a,根据图5,尽管在k≥6时,最佳比特分配方案中的重构图像的平均图像对比度大于基于SSIM的编码方案中得到的重构图像的平均图像对比度,但是它们依然小于原始图像的平均图像对比度。而此时平均PSNR值有很大的下降。
其次,如果用5比特存储a,则根据图5,在稀疏度d≤16时,重构图像的图像对比度总是大于基于MSE的编码方案中得到的重构图像的图像对比度,并且小于基于SSIM的编码方案中得到的重构图像的图像对比度。在图6中,最佳比特分配方案中的重建图像的PSNR均值非常接近基于SSIM的编码方案的重建图像的PSNR均值。尽管在稀疏度d≥10时重建图像的PSNR均值略小于基于SSIM的编码方案中的重建图像的PSNR均值,但它们仍然可以接受,因为基于SSIM的编码方案中的重建图像的图像对比度小于原始图像的图像对比度。
如果用6个比特存储a,则根据图5,则重构图像的图像对比度大于基于MSE的编码方案中得到重构图像的图像对比度,且小于基于SSIM的编码方案中的重构图像的图像对比度;并且根据图6可以看出,重构图像与原图像的PSNR均值比基于SSIM的编码方案中得到的重构图像与原图像大,且小于的基于MSE的编码方案中得到的重构图像与原图像的PSNR值。
基于极端情况的分析:上述所提出的最优比特分配方案中得到的重构图像的图像对比度是可以大于基于SSIM的编码方案中的重建图像的图像对比度,或者大于原始图像的图像对比度。最坏的情况下,最佳比特分配方案中重建图像的图像对比度与原始图像的图像对比度之间的距离甚至大于基于MSE的编码方案中得到的重建图像的图像对比度与测试图像的原始图像的图像对比度之间的距离,这里称之为最坏的情况。
通过分析最坏的情况,得出4个比特不足以保存a,因为一些重构图像存在一些问题。在图7展示了一些采用不同比特存储a时解码得到的重构图像块,从中可以得知当用4位存储a时,块效应出现在左图图像块上。而且,其他三个图像块具有比在基于MSE的编码方案中得到的重构图像的图像对比度更高的图像对比度。
当本实施例用5位保存a时,不同稀疏度下所有最坏情况都没有块效应、图像对比度锐化等图像问题。将它们成对并列显示时,看不出最佳比特分配方案中得到的重构图像与基于MSE的编码方案中得到的重构图像之间的任何差异。为了进一步检查,本实施例将一对重建图像彼此重叠并切换它们,只有在极少数的重建图像上才可以观察到图像对比度的轻微变化。因此,采用5比特保存a。
当本实施例用6比特保存a时,即使相互重叠并交换它们,本实施例也不能在最佳比特分配方案和基于MSE的方案中看到两个重构图像之间的任何差异。因此,采用6比特保存a是满足人类视觉系统(HVS)要求的。
综上所述,本发明的稀疏编码存储优化方法在对于不同度量方法进行深入分析研究的基础上,通过综合考虑重构信号的PSNR值和对比度,完成了稀疏编码的最优化比特分配方法。本发明仅使用9到11个比特来存储稀疏系数s,极大地节省了稀疏编码的存储空间;同时本发明在恢复信号的PSNR值和对比度之间进行了折中,使得恢复信号与原信号相比既保证了有一个较高的PSNR值,同时也兼顾了恢复信号的对比度。以图像信号为例,对于人类视觉系统而言,利用本发明获得的恢复图像信号甚至优于传统的基于均方误差方法获得的恢复图像信号。

Claims (3)

1.一种稀疏编码的存储优化方法,其特征在于,包括如下步骤:
步骤1、对于目标信号y,以均方误差为目标函数对目标信号y进行稀疏表征,稀疏表征结果为:y=s1x1+s2x2+…+skxk+o,计算线性系数si,其中i=1,2,3…k;
步骤2、在基于不同图像度量一致性的基础上,分析基于均方误差的重构图像和基于结构相似性的重构图像的PSNR值和对比度;
步骤3、根据基于均方误差的重构图像和基于结构相似性的重构图像的PSNR值和对比度的分析结果,对稀疏表征结果中的线性系数si的比特进行分配,利用9到11个比特数存储线性系数si,实现稀疏编码的存储优化;
步骤3中,对稀疏表征结果中的线性系数si的比特进行分配,利用9到11个比特数存储线性系数si时,采用基于均方误差的编码方案来存储线性系数si,并且通过图像对比度来优化线性系数si占用的空间;
x1、x2、…、xk为基函数,o为偏差系数;
所述对比分析结果为:基于均方误差的重构图像的对比度总是不大于基于结构相似性的重构图像对比度,以及基于均方误差的重构图像的PSNR值总是优于基于结构相似性的重构图像PSNR值;
步骤3中,基于均方误差的编码方案来存储线性系数si,并且通过图像对比度来优化线性系数si占用的空间时,利用科学计数法表示si的绝对值:|si|=a×10b,用1个比特存储si的符号,用3个比特存储b的值,用5到7个比特存储a的值。
2.根据权利要求1所述的一种稀疏编码的存储优化方法,其特征在于,步骤2中,分析结果为:基于结构相似性得到的重构图像的对比度优于基于均方误差得到的重构图像的对比度,基于均方误差重构图像的PSNR值优于基于结构相似性重构图像的PSNR值。
3.根据权利要求1所述的一种稀疏编码的存储优化方法,其特征在于,当用m个比特存储a时,a被存储为十进制数字
Figure FDA0003084935970000021
当用存储的数还原si用以重现原信号时,a被还原为
Figure FDA0003084935970000022
5≤m≤7。
CN201910464813.9A 2019-05-30 2019-05-30 一种稀疏编码的存储优化方法 Active CN110267049B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910464813.9A CN110267049B (zh) 2019-05-30 2019-05-30 一种稀疏编码的存储优化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910464813.9A CN110267049B (zh) 2019-05-30 2019-05-30 一种稀疏编码的存储优化方法

Publications (2)

Publication Number Publication Date
CN110267049A CN110267049A (zh) 2019-09-20
CN110267049B true CN110267049B (zh) 2021-09-07

Family

ID=67916004

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910464813.9A Active CN110267049B (zh) 2019-05-30 2019-05-30 一种稀疏编码的存储优化方法

Country Status (1)

Country Link
CN (1) CN110267049B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111767718B (zh) * 2020-07-03 2021-12-07 北京邮电大学 一种基于弱化语法错误特征表示的中文语法错误更正方法
CN117289851A (zh) * 2022-06-16 2023-12-26 加特兰微电子科技(上海)有限公司 数据存储位宽的确定方法及装置、存储指数数据的方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105427264A (zh) * 2015-12-23 2016-03-23 重庆大学 一种基于群稀疏系数估计的图像重构方法
CN105654119A (zh) * 2015-12-25 2016-06-08 北京工业大学 一种字典优化方法
CN109886927A (zh) * 2019-01-23 2019-06-14 华南理工大学 一种基于核稀疏编码的图像质量评估方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008081459A2 (en) * 2007-01-03 2008-07-10 Numeri Ltd. A method and a system for wavelet based processing

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105427264A (zh) * 2015-12-23 2016-03-23 重庆大学 一种基于群稀疏系数估计的图像重构方法
CN105654119A (zh) * 2015-12-25 2016-06-08 北京工业大学 一种字典优化方法
CN109886927A (zh) * 2019-01-23 2019-06-14 华南理工大学 一种基于核稀疏编码的图像质量评估方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
SSIM-inspired image restoration using sparse representation;Rehman et al.;《EURISIP Journal on Advances in Signal Processing》;20120116;全文 *

Also Published As

Publication number Publication date
CN110267049A (zh) 2019-09-20

Similar Documents

Publication Publication Date Title
CN101371583B (zh) 编码/解码高动态范围图像的方法和设备
JP5623565B2 (ja) バタフライプロセッサを使用して離散コサイン変換をエンコードしそして計算するための装置及び方法
Balasubramanian et al. Sequential scalar quantization of color images
US5867602A (en) Reversible wavelet transform and embedded codestream manipulation
CN110248190B (zh) 一种基于压缩感知的多层残差系数图像编码方法
CN110267049B (zh) 一种稀疏编码的存储优化方法
CN101715132A (zh) 无损压缩编码装置
Dhara et al. Color image compression based on block truncation coding using pattern fitting principle
CN116939226A (zh) 一种面向低码率图像压缩的生成式残差修复方法及装置
Wu et al. An efficient BTC image compression technique
CN114708343A (zh) 基于图字典学习的三维点云编解码方法、压缩方法及装置
CN112702600B (zh) 一种图像编解码神经网络分层定点化方法
EP2076047A2 (en) Video motion estimation
Sun et al. A novel fractal coding method based on MJ sets
CN111107360B (zh) 一种光谱-空间维联合的高光谱图像无损压缩方法及系统
CN100429946C (zh) 用于处理数字运动图象的方法和装置
JP3781012B2 (ja) 画像データ圧縮方法、画像データ伸長方法、および画像データ伸長回路
CN111818345B (zh) 一种联合先验模型和细节增强的图像去压缩方法
CN101267557A (zh) 一种用复合矢量量化进行图像压缩的方法
Kamatar et al. Image Compression Using Mapping Transform with Pixel Elimination
CN116347095A (zh) 数字图像编码器、解码器、处理器和电子设备
JPS63103583A (ja) 画像信号の符号化復号化方法とその装置
CN115802048A (zh) 一种基于块间预测和图傅里叶变换的点云属性压缩方法
CN116405676A (zh) 一种rgb565图像固定压缩比快速压缩方法
CN115984080A (zh) 针对jpeg图像的基于多直方图修改的高容量可逆数据隐藏方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant