CN106028043B

CN106028043B - 基于新的邻域函数的三维自组织映射图像编码方法

Info

Publication number: CN106028043B
Application number: CN201610316588.0A
Authority: CN
Inventors: 黎洪松; 程福林
Original assignee: Guilin University of Electronic Technology
Current assignee: Guilin University of Electronic Technology
Priority date: 2016-05-13
Filing date: 2016-05-13
Publication date: 2018-08-31
Anticipated expiration: 2036-05-13
Also published as: CN106028043A

Abstract

本发明公开一种基于新的邻域函数的三维自组织映射图像编码方法，首先，对图像样本进行不断学习训练，得到最佳匹配模式库；其次，对待编码的图像进行分块处理，并将这些待编码图像块与最佳匹配模式库中的模式矢量进行图像模式匹配，编码每个块在模式库中的匹配模式的索引。本发明具有模式库调整速度快，模式库训练效率高的特点。

Description

基于新的邻域函数的三维自组织映射图像编码方法

技术领域

本发明涉及图像编码技术领域，具体涉及一种基于新的邻域函数的三维自组织映射图像编码方法。

背景技术

图像编码也称图像压缩，是指在满足一定质量(信噪比的要求或主观评价得分)的条件下，以较少比特数表示图像或图像中所包含信息的技术。基于神经网络的图像编码是近年来出现的一种新的图像编码方法。人工神经网络在图像压缩中的应用是通过初步模拟人体神经系统的局部初级功能，根据图像本身的特点，自主的对其进行压缩编码。自组织神经网络在图像编码邻域有广泛的应用。

自组织映射(Self-Organizing Map，简称SOM)算法是Kohonen从人脑神经元的组织原理上受到启发而提出的一种具有自组织特性的人工神经网络算法。该算法模拟了人脑神经系统对某一图形或某一频率特定兴奋的特征，同时考虑了可以人工实现的条件，在数据挖掘和图像模式识别等领域得到了深入的研究和应用，是一种高效的数据聚类方法。SOM网络采用双层网络结构，分为输入层和映射层，输入层用于感知输入模式，每个输入神经元通过权值与每个映射层神经元连接，映射层输出结果，映射层的神经元互相连接。传统SOM网络一般采用一维输入层和二维映射层，它能有效地处理一维和二维信号。近年来，三维图像和视频等三维信号的处理日益引起了关注，然而传统SOM算法并不能直接用于三维信号的处理。三维SOM算法很好地解决了这一问题，能有效地将二维输入映射为三维输出，实现了三维信号的非线性映射。

邻域函数是SOM算法的重要组成部分，为了保证收敛，需满足随迭代时间逐渐减小的原则。在训练的初始阶段，邻域半径较大，随着训练次数的增加，网络逐渐趋于稳定，只需对获胜节点进行较细微的权值调整，因而邻域半径不断缩小。邻域函数通常取线性函数或指数函数。然而，这些邻域函数存在一定问题，如模式库调整速度慢，模式库训练效率低等，影响了三维SOM算法的性能。

发明内容

本发明所要解决的技术问题是现有SOM算法的模式库调整速度慢和训练效率低的问题，提供一种基于新的邻域函数的三维自组织映射图像编码方法。

为解决上述问题，本发明是通过以下技术方案实现的：

基于新的邻域函数的三维自组织映射图像编码方法，包括如下步骤：

步骤1、对图像样本进行不断学习训练，得到最佳匹配模式库；

步骤1.1、对图像样本进行分块，每个图像块为一个训练矢量，共得到含L个训练矢量的训练矢量集；

步骤1.2、从训练矢量集中选择N个训练矢量来构成初始模式库，该初始模式库中的训练矢量称为模式矢量，且初始模式库中的模式矢量排列成三维立体结构；上述N＜＜L；

步骤1.3、设定邻域函数

其中，B₀为最小邻域，B₁为最大邻域，C₁为邻域衰减常数、C₂为训练次数；j＝0,1,…,N-1，N为设定的三维自组织映射网络的大小；t＝0,1,…,L-1，L为训练矢量集中训练矢量的个数；

步骤1.4、输入一个训练矢量，并分别计算该训练矢量与初始模式库中的各个模式矢量的失真，从中选择出与训练矢量失真最小的模式矢量作为获胜模式矢量；

步骤1.5、调整获胜模式矢量及其三维邻域范围内的模式矢量；

步骤1.6、返回步骤1.4重新选择一个训练矢量，直到输入完所有的训练矢量，得到最佳匹配模式库；

步骤2、对待编码的图像进行分块处理，并将这些待编码图像块与最佳匹配模式库中的模式矢量进行图像模式匹配，编码每个块在模式库中的匹配模式的索引。

上述步骤1.2中，采用随机法从训练矢量集中选择N个训练矢量来构成初始模式库。

上述步骤1.4中，采用下式计算训练矢量与模式矢量的失真d_j(t)；

d_j(t)＝||X(t)-W_j(t)||²

其中，W_j(t)为模式矢量，X(t)为训练矢量；j＝0,1,…,N-1，N为设定的三维自组织映射网络的大小；t＝0,1,…,L-1，L为训练矢量集中训练矢量的个数。

上述步骤1.5中，根据下式调整获胜模式矢量及其三维邻域范围内的模式矢量

其中，W_j(t+1)为第t+1次训练时的模式矢量，W_j(t)为第t次训练时的模式矢量，X(t)为训练矢量，j^*为获胜模式矢量，为获胜模式矢量j^*在第t次训练时的邻域函数，α(t)为第t次训练时的学习速度函数；j＝0,1,…,N-1，N为设定的三维自组织映射网络的大小；t＝0,1,…,L-1，L为训练矢量集中训练矢量的个数。

上述步骤2具体为：

步骤2.1、将待编码的图像分块，其中待编码的图像分块大小与图像样本的分块大小相一致；

步骤2.2、分别计算每一个待编码图像块与最佳匹配模式库中各模式矢量的失真，并编码具有最小失真的模式矢量在模式库中的索引；

步骤2.3、对待编码的所有图像进行步骤2.2的处理，得到待编码的图像的码流。

与现有技术相比，本发明具有如下特点：模式库调整速度快，模式库训练效率高。

附图说明

图1为模式库的训练过程。

图2为三维自组织映射图像编码过程。

具体实施方式

下面结合实施例，对本发明内容作进一步地详细说明，但本发明的实施方式不限于此。

一种基于新的邻域函数的三维自组织映射图像编码方法，包括如下步骤：

步骤1)对图像样本进行不断训练，得到最佳匹配的模式库。参见图1。

步骤1.1)设定3DSOM网络大小为(N,M)，其中N、M分别为模式库的大小、模式库中模式矢量的大小。

步骤1.2)对图像样本分块，块的大小一般取8×8。每个图像块为一个训练矢量，共得到含L个训练矢量的训练矢量集{X(t)；t＝0,1,…,L-1}。用随机法从训练矢量集中选择N(N＜＜L)个训练矢量来构成初始模式库{W_j(0)；j＝0,1,…,N-1}，并将初始模式库中的模式矢量排列成三维立体结构。

步骤1.3)将初始化邻域设定为N_j(0),j＝0,1,…,N-1。

步骤1.4)输入一个训练矢量集中的训练矢量X＝(x₁,x₂,…,x_M)^T。

步骤1.5)选择均方误差失真准则，均方误差为d_j(t)＝||X(t)-W_j(t)||²，分别计算该训练矢量与模式库中各模式矢量的失真d_j(t)；并选择具有最小失真的模式矢量为获胜模式矢量j^*。

步骤1.6)按下式调整获胜模式矢量j^*及其三维邻域范围内的模式矢量，

其中，为邻域函数，通常选用单调递减函数B₀、B₁分别为获胜模式矢量j^*的最小邻域和最大邻域，C₁为邻域衰减常数,C₂为训练次数。在训练的初始阶段，邻域半径较大，随着训练次数的增加，网络逐渐趋于稳定，只需对获胜节点进行较细微的权值调整，因而邻域半径不断缩小。α(t)为学习速度函数，它反映了模式矢量调整的幅度大小，一般选用单调递减函数式中A₁为训练开始时的最大学习速度，T₁为学习衰减常数。

步骤1.7)返回步骤1.4)，直到输入完训练矢量集中所有的训练矢量，即得到最佳匹配模式库。

步骤2)对待编码图像进行图像模式识别，编码每个块在模式库中的匹配模式的索引。参见图2。

步骤2.1、将待编码图像分块，其中待编码图像分块大小与图像样本的分块大小一致；

步骤2.2、分别计算每一个待编码图像块与最佳匹配模式库中各模式矢量的失真，并选择具有最小失真的模式矢量作为该图像块的匹配模式，对该图像块编码时只编码其匹配模式在模式库中的索引；

采用均方误差准则即下式来计算待编码图像块与最佳匹配模式库中各模式矢量的失真b_j(t′)；

b_j(t′)＝||Y(t′)-W_j(t′)||²

其中，W_j(t′)为模式矢量，Y(t′)为待编码图像块；j＝0,1,…,N-1，N为设定的三维自组织映射网络的大小；t′＝0,1,…,K-1，K为待编码图像块的个数。

步骤2.3、对待编码图像每一个子图像块进行步骤2.2的处理，完成了对图像的编码。

具体地，为了说明本方法的性能，做了大量的仿真实验，实验图像选择分辨率为512×512×8bit的标准亮度测试图像Lena、Peppers，用于模式库训练和图像编码。重建图像品质的客观评价采用峰值信噪比式中E_MSE为原始图像与重建图像之间的均方误差。图像压缩比为式中M为模式矢量的维数，B_O为原始图像的每像素比特数，B_C为模式矢量地址比特数。

实验分别用基于指数邻域函数的三维SOM算法和基于本专利新的邻域函数的三维SOM算法设计图像模式识别模式库，并通过编码后重建图像的质量来比较基于这两种邻域函数的三维SOM算法的性能，其中训练矢量数为40960，模式库大小为1024。表1为选取不同实验图像时，基于指数邻域函数的三维SOM算法和基于本专利新的邻域函数的三维SOM算法用于图像模式识别编码的重建图像的峰值信噪比(PSNR)。

表1重建图像的PSNR

由表1可以看出，基于本专利新的邻域函数的三维SOM算法的性能比基于指数邻域函数的三维SOM算法提高了0.0909-0.3013dB。

Claims

1.基于新的邻域函数的三维自组织映射图像编码方法，其特征是，包括如下步骤：

步骤1.3、设定邻域函数

2.根据权利要求1所述基于新的邻域函数的三维自组织映射图像编码方法，其特征是，步骤1.2中，采用随机法从训练矢量集中选择N个训练矢量来构成初始模式库。

3.根据权利要求1所述基于新的邻域函数的三维自组织映射图像编码方法，其特征是，步骤1.4中，采用下式计算训练矢量与模式矢量的失真d_j(t)；

d_j(t)＝||X(t)-W_j(t)||²

4.根据权利要求1所述基于新的邻域函数的三维自组织映射图像编码方法，其特征是，步骤1.5中，根据下式调整获胜模式矢量及其三维邻域范围内的模式矢量

5.根据权利要求1所述基于新的邻域函数的三维自组织映射图像编码方法，其特征是，步骤2具体为：