CN109936740B - 一种用于图像无损压缩的像素值预测方法 - Google Patents

一种用于图像无损压缩的像素值预测方法 Download PDF

Info

Publication number
CN109936740B
CN109936740B CN201711346564.0A CN201711346564A CN109936740B CN 109936740 B CN109936740 B CN 109936740B CN 201711346564 A CN201711346564 A CN 201711346564A CN 109936740 B CN109936740 B CN 109936740B
Authority
CN
China
Prior art keywords
predicted
vector
pixel
value
weight matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711346564.0A
Other languages
English (en)
Other versions
CN109936740A (zh
Inventor
杨建权
朱国普
黄晓霞
张云
王员根
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Institute of Advanced Technology of CAS
Original Assignee
Shenzhen Institute of Advanced Technology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Institute of Advanced Technology of CAS filed Critical Shenzhen Institute of Advanced Technology of CAS
Priority to CN201711346564.0A priority Critical patent/CN109936740B/zh
Publication of CN109936740A publication Critical patent/CN109936740A/zh
Application granted granted Critical
Publication of CN109936740B publication Critical patent/CN109936740B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Processing (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种用于图像无损压缩的像素值预测方法,包括以下步骤:输入具有i行乘以j列个像素的图像,并设定待预测像素值的待预测像素为x(i,j),取待预测像素x(i,j)的上方和左侧邻域共M*(2*N+1)个像素值,M表示行数,(2*N+1)表示列数;初始化K个大小为M*(2*N+1)的权值矩阵Wk和K个偏置标量bk,用于生成K个待预测像素x(i,j)的候选预测值
Figure DDA0001509436270000011
将得到的K个候选预测值
Figure DDA0001509436270000012
依次排列成一个候选预测值向量αi,j,初始化一个K*K的权值矩阵G和一个1*K的偏置向量c;通过候选预测值向量αi,j、权值矩阵G和偏置向量c得到一个概率值向量;根据概率值向量得到待预测像素x(i,j)的最终预测值
Figure DDA0001509436270000013
可以自主设定邻域大小,扩展性好,并可获得更小的预测误差。

Description

一种用于图像无损压缩的像素值预测方法
技术领域
本发明涉及图像处理技术领域,特别是涉及一种用于图像无损压缩的像素值预测方法。
背景技术
在工控、消费类电子的液晶屏显示中存在大量图片、图元,如果不加压缩,会使存储空间需求很大。图像压缩技术可大致分为有损压缩和无损压缩两种。有损压缩通过滤除人眼不敏感的图像成分,可获得很高的压缩率,但无法零失真地还原出原始图像。在一些如疾病诊断,精密工件探伤等需要高精度影像的应用领域,某些人眼不敏感的图像成分在经过合适的处理后,往往具有重要乃至关键信息。为有效保留这些可见性低但经计算机处理后有重要价值的信息,需要对图像进行无损压缩。
图像无损压缩相较于图像有损压缩,压缩率较低。制约压缩率提高的主要环节,在于像素值的预测方法。有效的像素值预测方法可显著提高图像无损压缩方案的压缩率。联合图像专家小组格式(JPEG)压缩标准中的无损压缩模式所采用的LOCO-I像素值预测方法。请参阅图1,LOCO-I预测方法使用像素值A,B,C来预测像素X的值。
Figure BDA0001509436250000011
LOCO-I在预测X值时,仅使用了X的左侧邻域A和上方邻域中的三个像素B、C及D,在邻域像素相关性的利用上不够充分;预测采用经验性规则且过于简单,难以有效应付图像相邻像素值的多种组合模式。
发明内容
基于此,有必要针对上述问题,提供一种提高邻域像素相关性、减小预测误差并提高图像无损压缩的压缩率的用于图像无损压缩的像素值预测方法。
一种用于图像无损压缩的像素值预测方法,包括以下步骤:
输入具有i行乘以j列个像素的图像,并设定待预测像素值的待预测像素为x(i,j),取待预测像素x(i,j)的上方和左侧邻域共M*(2*N+1)个像素值,M表示行数,(2*N+1)表示列数;
初始化K个大小为M*(2*N+1)的权值矩阵Wk和K个偏置标量bk,用于生成K个待预测像素x(i,j)的候选预测值
Figure BDA0001509436250000021
将得到的K个候选预测值
Figure BDA0001509436250000022
依次排列成一个候选预测值向量αi,j,初始化一个K*K的权值矩阵G和一个1*K的偏置向量c;通过候选预测值向量αi,j、权值矩阵G和偏置向量c得到一个概率值向量;
根据概率值向量得到待预测像素x(i,j)的最终预测值
Figure BDA0001509436250000023
本发明可以自主设定邻域大小,扩展性好,可以基于实际需要使用较大的邻域,从而更充分地利用邻域相关性进行预测;本发明的预测方法中由权值矩阵Wk、偏置标量bk、权值矩阵G及偏置向量c决定,这些参数通过批量随机梯度下降法从实际图像样本中优化得到,有利于获得更小的预测误差。
附图说明
图1为现有的无损压缩像素值预测方法的示意图;
图2为一实施例中用于图像无损压缩的像素值预测方法流程图;
图3为一实施例中用于图像无损压缩的像素值预测方法其中一个步骤的预测示意图;
图4为一实施例中用于图像无损压缩的像素值预测方法另一步骤的示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人士在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在一个实施例中,一种用于图像无损压缩的像素值预测方法,如图2所示,包括以下步骤:
步骤S10:输入具有i行乘以j列个像素的图像,其中i及是j均为大于等于1的自然数,并设定待预测像素值的待预测像素为x(i,j),取待预测像素x(i,j)的上方和左侧邻域共M*(2*N+1)个像素值,M表示行数,(2*N+1)表示列数,x(i,j)位于M*(2*N+1)邻域的正下方,即x(i,j)位于M*(2*N+1)最后一行的正中间位置。
其中M和N为可调节的参数。图3所示为本发明用于图像无损压缩的像素值预测方法在一个应用实例中待预测像素x(i,j)邻域示意图,在图3中,M=3,N=2。方格101为待预测像素x(i,j)所在位置;区域102为待预测像素x(i,j)上方及左侧领域的用于预测该待预测像素x(i,j)的像素值的对应的像素;区域103为不参与对待预测像素x(i,j)的像素值进行预测的所对应的像素,因为区域103这些位置在预测时是未知的(因为预测过程从左到右,从上到下逐个像素进行预测的)。
步骤S20:初始化K个大小为M*(2*N+1)的权值矩阵Wk和K个偏置标量bk,用于生成K个待预测像素x(i,j)的候选预测值
Figure BDA0001509436250000031
其中,候选预测值
Figure BDA0001509436250000032
通过以下方程式(1)获得:
Figure BDA0001509436250000033
式(1)中,softplus函数定义为:softplus(x)=ln(1+ex);u表示相对于i的偏移量,其取值范围为[-M+1,0],v表示相对于j的偏移量,其取值范围为[-N,N]
K为可调节的参数。由于预测时不能使用x(i,j)右侧或下方的像素(如上所述因为预测过程是从上到下,从左到右依次进行,右侧和下方像素在预测x(i,j)时是未知的),所以设定Wk(0,0),Wk(0,1),…,Wk(0,N)恒为0,权值矩阵Wk中除了这(N+1)个元素外的其它元素可以用均值为0,标准差为
Figure BDA0001509436250000041
的高斯分布随机数进行初始化,然后通过批量随机梯度下降法进行迭代更新。bk可初始化为0.1,同样通过批量随机梯度下降法进行迭代更新。批量随机梯度下降法是迭代更新神经网络权值参数和偏置参数的常用算法,本领域的从业人员应以熟知,故此这里不再赘述。
如图4所示例的,所示为本发明用于图像无损压缩的像素值预测方法在一个应用实例中为式(1)的计算示意图,图4中M=3,N=2。x(i+u,j+v)与W(u,v)对应元素相乘再累加后,进行softplus运算。
步骤S30:将得到的K个候选预测值
Figure BDA0001509436250000042
依次排列成一个候选预测值向量,初始化一个K*K的权值矩阵G和一个1*K的偏置向量c,权值矩阵G及偏置向量c也可以分别称之为投票矩阵和投票向量。计算候选预测值向量αi,j与权值矩阵G的矩阵乘积再加上偏置向量c,得到一个长度为K的行向量gi,j=αi,j*G+c。记行向量gi,j的每个元素为gi,j=[gi,j(1),…,gi,j(p),…,gi,j(K)],对行向量gi,j进行softmax运算,得到一个概率值向量
Figure BDA0001509436250000043
概率值向量通过以下方程式(2)获得:
Figure BDA0001509436250000044
步骤S40:根据概率值向量得到待预测像素x(i,j)的最终预测值
Figure BDA0001509436250000045
具体的,待预测像素x(i,j)的最终预测值
Figure BDA0001509436250000046
通过以下方程式(3)计算获得。
Figure BDA0001509436250000051
式(3)的含义是:首先找到概率值向量
Figure BDA0001509436250000052
中最大概率的位置,然后取候选值向量αi,j在这个位置上的元素作为最终的预测值
Figure BDA0001509436250000053
简言之,即最大概率值对应的候选预测值,为待预测像素x(i,j)的最终预测值。
需要说明的是,权值矩阵G可以初始化为均值为0,标准差为1/k的高斯分布随机数;偏置向量c可以初始化为0向量。同样地,权值矩阵G和偏置向量c都可以通过随机梯度下降法进行迭代更新。随机梯度下降法优化权值矩阵Wk、偏置标量bk、权值矩阵G及偏置向量c时,需要指定损失函数。本发明使用平方误差损失函数,即
Figure BDA0001509436250000054
损失函数是本领域技术人员应以熟知的概念,这里不再赘述。
步骤S40中方程式(3)也可以由以下方程式(4)替换来获得待预测像素x(i,j)的最终预测值
Figure BDA0001509436250000055
Figure BDA0001509436250000056
本发明使用的矩阵乘法,加法,softplus运算,softmax运算,argmax运算是构建神经网络的常用运算,可显著提高图像无损压缩方案的压缩率。本发明可以自主设定邻域大小,扩展性好,可以基于实际需要使用较大的邻域,从而更充分地利用邻域相关性进行预测;本发明的预测方法中由权值矩阵Wk、偏置标量bk、权值矩阵G及偏置向量c决定,这些参数通过批量随机梯度下降法从实际图像样本中优化得到,有利于获得更小的预测误差。
以上所述实施例仅表达了本发明的一种或几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (4)

1.一种用于图像无损压缩的像素值预测方法,其特征在于,包括以下步骤:
步骤S10:输入具有i行乘以j列个像素的图像,并设定待预测像素值的待预测像素为x(i,j),取待预测像素x(i,j)的上方和左侧邻域共M*(2*N+1)个像素值,M表示行数,(2*N+1)表示列数;
步骤S20:初始化K个大小为M*(2*N+1)的权值矩阵Wk和K个偏置标量bk,用于生成K个待预测像素x(i,j)的候选预测值
Figure FDA0004081262120000017
步骤S30:将得到的K个候选预测值
Figure FDA0004081262120000018
依次排列成一个候选预测值向量αi,j,初始化一个K*K的权值矩阵G和一个1*K的偏置向量c;通过候选预测值向量αi,j、权值矩阵G和偏置向量c得到一个概率值向量;
步骤S40:根据概率值向量得到待预测像素x(i,j)的最终预测值
Figure FDA0004081262120000011
步骤S20中:所述候选预测值
Figure FDA0004081262120000012
通过以下方式程式(1)获得:
Figure FDA0004081262120000013
式(1)中,softplus函数定义为:softplus(x)=ln(1+ex);
u表示相对于i的偏移量,其取值范围为[-M+1,0],v表示相对于j的偏移量,其取值范围为[-N,N];
步骤S30中:通过候选预测值向量αi,j与权值矩阵G的矩阵乘积再加上偏置向量c,得到一个长度为K的行向量gi,j=αi,j*G+c;记行向量gi,j的每个元素为gi,j=[gi,j(1),...,gi,j(p),...,gi,j(K)],对行向量gi,j进行softmax运算,得到所述概率值向量;
所述概率值向量记为
Figure FDA0004081262120000014
且满足以下关系:
Figure FDA0004081262120000015
所述待预测像素x(i,j)的最终预测值
Figure FDA0004081262120000019
通过以下方程式(3)计算获得:
Figure FDA0004081262120000016
或者,所述待预测像素x(i,j)的最终预测值
Figure FDA0004081262120000024
由以下方程式(4)来获得:
Figure FDA0004081262120000021
2.根据权利要求1所述的方法,其特征在于,步骤S10中,设定Wk(0,0),Wk(0,1),...,Wk(0,N)恒为0,权值矩阵Wk中除了这(N+1)个元素外的其它元素用均值为0,标准差为
Figure FDA0004081262120000022
的高斯分布随机数进行初始化,然后通过批量随机梯度下降法进行迭代更新;bk可初始化为0.1,同样通过批量随机梯度下降法进行迭代更新。
3.根据权利要求1所述的方法,其特征在于,权值矩阵G初始化均值为0,标准差为1/k的高斯分布随机数;偏置向量c初始化为0向量。
4.根据权利要求1所述的方法,其特征在于,通过随机梯度下降法并指定损失函数来优化权值矩阵Wk、偏置标量bk、权值矩阵G及偏置向量c,所述损失函数为
Figure FDA0004081262120000023
CN201711346564.0A 2017-12-15 2017-12-15 一种用于图像无损压缩的像素值预测方法 Active CN109936740B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711346564.0A CN109936740B (zh) 2017-12-15 2017-12-15 一种用于图像无损压缩的像素值预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711346564.0A CN109936740B (zh) 2017-12-15 2017-12-15 一种用于图像无损压缩的像素值预测方法

Publications (2)

Publication Number Publication Date
CN109936740A CN109936740A (zh) 2019-06-25
CN109936740B true CN109936740B (zh) 2023-04-18

Family

ID=66979521

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711346564.0A Active CN109936740B (zh) 2017-12-15 2017-12-15 一种用于图像无损压缩的像素值预测方法

Country Status (1)

Country Link
CN (1) CN109936740B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007049594A (ja) * 2005-08-12 2007-02-22 Institute Of Super Compression Technologies Inc 画像データの処理方法
CN101064850A (zh) * 2006-04-24 2007-10-31 富士通株式会社 图像压缩装置、图像压缩程序和图像压缩方法
CN101438597A (zh) * 2006-05-17 2009-05-20 富士通株式会社 图像数据压缩装置、压缩方法及程序、以及图像数据恢复装置、恢复方法及程序
CN105069819A (zh) * 2015-07-23 2015-11-18 西安交通大学 一种基于med预测算法的预测值补偿方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007049594A (ja) * 2005-08-12 2007-02-22 Institute Of Super Compression Technologies Inc 画像データの処理方法
CN101064850A (zh) * 2006-04-24 2007-10-31 富士通株式会社 图像压缩装置、图像压缩程序和图像压缩方法
CN101438597A (zh) * 2006-05-17 2009-05-20 富士通株式会社 图像数据压缩装置、压缩方法及程序、以及图像数据恢复装置、恢复方法及程序
CN105069819A (zh) * 2015-07-23 2015-11-18 西安交通大学 一种基于med预测算法的预测值补偿方法

Also Published As

Publication number Publication date
CN109936740A (zh) 2019-06-25

Similar Documents

Publication Publication Date Title
JP6504590B2 (ja) 画像のセマンティックセグメンテーションのためのシステム及びコンピューター実施方法、並びに非一時的コンピューター可読媒体
US11853882B2 (en) Methods, apparatus, and storage medium for classifying graph nodes
CN106796668B (zh) 用于人工神经网络中比特深度减少的方法和系统
US9443287B2 (en) Image processing method and apparatus using trained dictionary
US20170286811A1 (en) Spatiotemporal Method for Anomaly Detection in Dictionary Learning and Sparse Signal Recognition
JP2015203946A (ja) ヒストグラムの重心を計算する方法
US9495734B2 (en) Information processing apparatus, system, method, and medium storing program
CN114419406A (zh) 图像变化检测方法、训练方法、装置和计算机设备
CN109936740B (zh) 一种用于图像无损压缩的像素值预测方法
JP4563982B2 (ja) 動き推定方法,装置,そのプログラムおよびその記録媒体
JP5006263B2 (ja) 画像処理装置、プログラムおよび画像処理方法
Li et al. Sparse representation-based image restoration via nonlocal supervised coding
CN111008637A (zh) 图像分类方法及系统
US10938999B2 (en) Image processing apparatus that performs filter operation on group of regions in an image, image processing method and non-transitory computer- readable storage medium
WO2017177363A1 (en) Methods and apparatuses for face hallucination
Yao et al. More efficient accelerated proximal algorithm for nonconvex problems
CN111753773A (zh) 地表覆盖物识别方法、神经网络的训练方法及装置
Forero et al. Structured outlier models for robust dictionary learning
Samarov et al. A coordinate-descent-based approach to solving the sparse group elastic net
CN116659520B (zh) 基于仿生偏振视觉增强的匹配定位方法、装置和设备
WO2024100709A1 (ja) 最適化装置、最適化方法及びプログラム
CN114841899B (zh) 时空频联合紧致编码去除红外图像横纹的方法及红外设备
JP7231021B2 (ja) 画像認識システム、画像認識装置、画像認識方法、及び画像認識プログラム
CN109344761B (zh) 一种视频状态确定方法和装置
Bergel et al. Neural network ensembles and uncertainty estimation for predictions of inelastic mechanical deformation using a finite element method-neural network approach

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant