CN109936740B

CN109936740B - 一种用于图像无损压缩的像素值预测方法

Info

Publication number: CN109936740B
Application number: CN201711346564.0A
Authority: CN
Inventors: 杨建权; 朱国普; 黄晓霞; 张云; 王员根
Original assignee: Shenzhen Institute of Advanced Technology of CAS
Current assignee: Shenzhen Institute of Advanced Technology of CAS
Priority date: 2017-12-15
Filing date: 2017-12-15
Publication date: 2023-04-18
Anticipated expiration: 2037-12-15
Also published as: CN109936740A

Abstract

本发明涉及一种用于图像无损压缩的像素值预测方法，包括以下步骤：输入具有i行乘以j列个像素的图像，并设定待预测像素值的待预测像素为x(i,j)，取待预测像素x(i,j)的上方和左侧邻域共M*(2*N+1)个像素值，M表示行数，(2*N+1)表示列数；初始化K个大小为M*(2*N+1)的权值矩阵W_k和K个偏置标量b_k，用于生成K个待预测像素x(i,j)的候选预测值

将得到的K个候选预测值

依次排列成一个候选预测值向量α_i,j，初始化一个K*K的权值矩阵G和一个1*K的偏置向量c；通过候选预测值向量α_i,j、权值矩阵G和偏置向量c得到一个概率值向量；根据概率值向量得到待预测像素x(i,j)的最终预测值

可以自主设定邻域大小，扩展性好，并可获得更小的预测误差。

Description

一种用于图像无损压缩的像素值预测方法

技术领域

本发明涉及图像处理技术领域，特别是涉及一种用于图像无损压缩的像素值预测方法。

背景技术

在工控、消费类电子的液晶屏显示中存在大量图片、图元，如果不加压缩，会使存储空间需求很大。图像压缩技术可大致分为有损压缩和无损压缩两种。有损压缩通过滤除人眼不敏感的图像成分，可获得很高的压缩率，但无法零失真地还原出原始图像。在一些如疾病诊断，精密工件探伤等需要高精度影像的应用领域，某些人眼不敏感的图像成分在经过合适的处理后，往往具有重要乃至关键信息。为有效保留这些可见性低但经计算机处理后有重要价值的信息，需要对图像进行无损压缩。

图像无损压缩相较于图像有损压缩，压缩率较低。制约压缩率提高的主要环节，在于像素值的预测方法。有效的像素值预测方法可显著提高图像无损压缩方案的压缩率。联合图像专家小组格式(JPEG)压缩标准中的无损压缩模式所采用的LOCO-I像素值预测方法。请参阅图1，LOCO-I预测方法使用像素值A,B,C来预测像素X的值。

LOCO-I在预测X值时，仅使用了X的左侧邻域A和上方邻域中的三个像素B、C及D，在邻域像素相关性的利用上不够充分；预测采用经验性规则且过于简单，难以有效应付图像相邻像素值的多种组合模式。

发明内容

基于此，有必要针对上述问题，提供一种提高邻域像素相关性、减小预测误差并提高图像无损压缩的压缩率的用于图像无损压缩的像素值预测方法。

一种用于图像无损压缩的像素值预测方法，包括以下步骤：

输入具有i行乘以j列个像素的图像，并设定待预测像素值的待预测像素为x(i,j)，取待预测像素x(i,j)的上方和左侧邻域共M*(2*N+1)个像素值，M表示行数，(2*N+1)表示列数；

初始化K个大小为M*(2*N+1)的权值矩阵W_k和K个偏置标量b_k，用于生成K个待预测像素x(i,j)的候选预测值

将得到的K个候选预测值

依次排列成一个候选预测值向量α_i,j，初始化一个K*K的权值矩阵G和一个1*K的偏置向量c；通过候选预测值向量α_i,j、权值矩阵G和偏置向量c得到一个概率值向量；

根据概率值向量得到待预测像素x(i,j)的最终预测值

本发明可以自主设定邻域大小，扩展性好，可以基于实际需要使用较大的邻域，从而更充分地利用邻域相关性进行预测；本发明的预测方法中由权值矩阵W_k、偏置标量b_k、权值矩阵G及偏置向量c决定，这些参数通过批量随机梯度下降法从实际图像样本中优化得到，有利于获得更小的预测误差。

附图说明

图1为现有的无损压缩像素值预测方法的示意图；

图2为一实施例中用于图像无损压缩的像素值预测方法流程图；

图3为一实施例中用于图像无损压缩的像素值预测方法其中一个步骤的预测示意图；

图4为一实施例中用于图像无损压缩的像素值预测方法另一步骤的示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人士在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

在一个实施例中，一种用于图像无损压缩的像素值预测方法，如图2所示，包括以下步骤：

步骤S10：输入具有i行乘以j列个像素的图像，其中i及是j均为大于等于1的自然数，并设定待预测像素值的待预测像素为x(i,j)，取待预测像素x(i,j)的上方和左侧邻域共M*(2*N+1)个像素值，M表示行数，(2*N+1)表示列数，x(i,j)位于M*(2*N+1)邻域的正下方，即x(i,j)位于M*(2*N+1)最后一行的正中间位置。

其中M和N为可调节的参数。图3所示为本发明用于图像无损压缩的像素值预测方法在一个应用实例中待预测像素x(i,j)邻域示意图，在图3中，M＝3，N＝2。方格101为待预测像素x(i,j)所在位置；区域102为待预测像素x(i,j)上方及左侧领域的用于预测该待预测像素x(i,j)的像素值的对应的像素；区域103为不参与对待预测像素x(i,j)的像素值进行预测的所对应的像素，因为区域103这些位置在预测时是未知的(因为预测过程从左到右，从上到下逐个像素进行预测的)。

步骤S20：初始化K个大小为M*(2*N+1)的权值矩阵W_k和K个偏置标量b_k，用于生成K个待预测像素x(i,j)的候选预测值

其中，候选预测值

通过以下方程式(1)获得：

式(1)中，softplus函数定义为：softplus(x)＝ln(1+e^x)；u表示相对于i的偏移量，其取值范围为[-M+1,0]，v表示相对于j的偏移量，其取值范围为[-N,N]

K为可调节的参数。由于预测时不能使用x(i,j)右侧或下方的像素(如上所述因为预测过程是从上到下，从左到右依次进行，右侧和下方像素在预测x(i,j)时是未知的)，所以设定W_k(0,0),W_k(0,1),…,W_k(0,N)恒为0，权值矩阵W_k中除了这(N+1)个元素外的其它元素可以用均值为0，标准差为

的高斯分布随机数进行初始化，然后通过批量随机梯度下降法进行迭代更新。b_k可初始化为0.1，同样通过批量随机梯度下降法进行迭代更新。批量随机梯度下降法是迭代更新神经网络权值参数和偏置参数的常用算法，本领域的从业人员应以熟知，故此这里不再赘述。

如图4所示例的，所示为本发明用于图像无损压缩的像素值预测方法在一个应用实例中为式(1)的计算示意图，图4中M＝3，N＝2。x(i+u,j+v)与W(u,v)对应元素相乘再累加后，进行softplus运算。

步骤S30：将得到的K个候选预测值

依次排列成一个候选预测值向量，初始化一个K*K的权值矩阵G和一个1*K的偏置向量c，权值矩阵G及偏置向量c也可以分别称之为投票矩阵和投票向量。计算候选预测值向量α_i,j与权值矩阵G的矩阵乘积再加上偏置向量c，得到一个长度为K的行向量g_i,j＝α_i,j*G+c。记行向量g_i,j的每个元素为g_i,j＝[g_i,j(1),…,g_i,j(p),…,g_i,j(K)]，对行向量g_i,j进行softmax运算，得到一个概率值向量

概率值向量通过以下方程式(2)获得：

步骤S40：根据概率值向量得到待预测像素x(i，j)的最终预测值

具体的，待预测像素x(i，j)的最终预测值

通过以下方程式(3)计算获得。

式(3)的含义是：首先找到概率值向量

中最大概率的位置，然后取候选值向量α_i,j在这个位置上的元素作为最终的预测值

简言之，即最大概率值对应的候选预测值，为待预测像素x(i，j)的最终预测值。

需要说明的是，权值矩阵G可以初始化为均值为0，标准差为1/k的高斯分布随机数；偏置向量c可以初始化为0向量。同样地，权值矩阵G和偏置向量c都可以通过随机梯度下降法进行迭代更新。随机梯度下降法优化权值矩阵W_k、偏置标量b_k、权值矩阵G及偏置向量c时，需要指定损失函数。本发明使用平方误差损失函数，即

损失函数是本领域技术人员应以熟知的概念，这里不再赘述。

步骤S40中方程式(3)也可以由以下方程式(4)替换来获得待预测像素x(i,j)的最终预测值

本发明使用的矩阵乘法，加法，softplus运算，softmax运算，argmax运算是构建神经网络的常用运算，可显著提高图像无损压缩方案的压缩率。本发明可以自主设定邻域大小，扩展性好，可以基于实际需要使用较大的邻域，从而更充分地利用邻域相关性进行预测；本发明的预测方法中由权值矩阵W_k、偏置标量b_k、权值矩阵G及偏置向量c决定，这些参数通过批量随机梯度下降法从实际图像样本中优化得到，有利于获得更小的预测误差。

以上所述实施例仅表达了本发明的一种或几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变形和改进，这些都属于本发明的保护范围。因此，本发明专利的保护范围应以所附权利要求为准。

Claims

1.一种用于图像无损压缩的像素值预测方法，其特征在于，包括以下步骤：

步骤S10：输入具有i行乘以j列个像素的图像，并设定待预测像素值的待预测像素为x(i，j)，取待预测像素x(i，j)的上方和左侧邻域共M*(2*N+1)个像素值，M表示行数，(2*N+1)表示列数；

步骤S20：初始化K个大小为M*(2*N+1)的权值矩阵W_k和K个偏置标量b_k，用于生成K个待预测像素x(i，j)的候选预测值

步骤S30：将得到的K个候选预测值

依次排列成一个候选预测值向量α_i，j，初始化一个K*K的权值矩阵G和一个1*K的偏置向量c；通过候选预测值向量α_i，j、权值矩阵G和偏置向量c得到一个概率值向量；

步骤S20中：所述候选预测值

通过以下方式程式(1)获得：

式(1)中，softplus函数定义为：softplus(x)＝ln(1+e^x)；

u表示相对于i的偏移量，其取值范围为[-M+1，0]，v表示相对于j的偏移量，其取值范围为[-N，N]；

步骤S30中：通过候选预测值向量α_i，j与权值矩阵G的矩阵乘积再加上偏置向量c，得到一个长度为K的行向量g_i，j＝α_i，j*G+c；记行向量g_i，j的每个元素为g_i，j＝[g_i，j(1)，...，g_i，j(p)，...，g_i，j(K)]，对行向量g_i，j进行softmax运算，得到所述概率值向量；

所述概率值向量记为

且满足以下关系：

所述待预测像素x(i，j)的最终预测值

通过以下方程式(3)计算获得：

或者，所述待预测像素x(i，j)的最终预测值

由以下方程式(4)来获得：

2.根据权利要求1所述的方法，其特征在于，步骤S10中，设定W_k(0，0)，W_k(0，1)，...，W_k(0，N)恒为0，权值矩阵W_k中除了这(N+1)个元素外的其它元素用均值为0，标准差为

的高斯分布随机数进行初始化，然后通过批量随机梯度下降法进行迭代更新；b_k可初始化为0.1，同样通过批量随机梯度下降法进行迭代更新。

3.根据权利要求1所述的方法，其特征在于，权值矩阵G初始化均值为0，标准差为1/k的高斯分布随机数；偏置向量c初始化为0向量。

4.根据权利要求1所述的方法，其特征在于，通过随机梯度下降法并指定损失函数来优化权值矩阵W_k、偏置标量b_k、权值矩阵G及偏置向量c，所述损失函数为