CN114494759A

CN114494759A - 一种基于二维-增量式随机权网络的图像数据分析方法

Info

Publication number: CN114494759A
Application number: CN202111013453.4A
Authority: CN
Inventors: 王前进; 王林; 杨晓冬; 辅小荣
Original assignee: Yancheng Institute of Technology
Current assignee: Yancheng Institute of Technology
Priority date: 2021-08-31
Filing date: 2021-08-31
Publication date: 2022-05-13

Abstract

本发明公开了一种基于二维‑增量式随机权网络的图像数据分析方法，包括：获取图像样本集，设置二维‑增量式随机权网络模型的初始参数；根据模型构建过程中网络残差需逐步减小的特征，建立监督机制，并产生候选隐含层节点池；在候选隐含层节点池中，将模型残差下降最快所对应的隐含层节点添加到当前模型中；在新的隐含层节点添加完成后，采用全局优化算法来获得整个网络的输出权重。当网络的节点数达到事先设置的隐含层节点数或者网络残差满足期望精度时，结束整个网络的构建过程，最终得到一个可用于优化图像处理效果的基于二维‑增量式随机权网络模型。本发明不仅具有较好的学习与泛化性能，而且能够在二维图像数据分析中展现良好的应用潜力。

Description

一种基于二维-增量式随机权网络的图像数据分析方法

技术领域

本发明涉及图像分类技术领域，尤其涉及一种基于二维-增量式随机权网络的图像数据分析方法。

背景技术

随着上升的深度学习浪潮，具有学习算法成熟且表征能力强的神经网络被广泛应用于数据分析中。全连接神经网络通常将矢量输入作为输入层的输入。在图像数据建模中，这种矢量操作虽可使输入权重与输入之间的点积计算可行，但会不可避免地引出两个问题：1)当训练样本有限时，会发生维数灾难；2)原始的多维输入的空间信息会遭到破坏，以致获得不理想的建模性能。因此，有必要建立能够直接处理多维输入的全连接神经网络，以获得高质量的建模性能。

目前，存在两种可直接处理二维输入的网络：1)矩阵神经网络，采用较慢的基于梯度下降的训练方法来得到网络参数。该类方法容易陷入局部极小，具有慢的收敛速度；2)随机学习技术。两种有代表性的随机学习者模型是随机权网络和随机配置网络。随机权网络先在一个固定区间中随机选取隐层参数，再通过求解一个线性方程来得到网络的输出权值。该方法完全独立于训练数据，随机选取隐层参数，具有一定的盲目性。随机配置网络采用一个监督机制对隐层参数的选取加以约束，在网络的训练过程中获得高质量的隐层参数，且具有万能逼近特性。然而，该方法监督机制的约束力度有限，容易产生冗余的隐含层节点，导致结构不紧致，增加计算机存储压力。

发明内容

发明目的：针对以上问题，本发明提出一种基于二维-增量式随机权网络的图像数据分析方法，不仅具有紧致的网络结构，同时表现出较好的泛化性能，能够在图像数据分析中表现出很好的潜力。

技术方案：为实现本发明的目的，本发明所采用的技术方案是：一种基于二维-增量式随机权网络的图像数据分析方法，二维-增量式随机权网络的机构是由三部分组成的：输入层、隐层和输出层，其中采用增量构造算法来得到隐层节点数。步骤如下：

S1，获取图像样本集，设置二维-增量式随机权网络模型的初始参数；

S2，根据模型构建过程中网络残差需逐步减小的特征，建立监督机制，并产生一个候选隐含层节点池；

S3，在候选隐含层节点池中，将模型残差下降最快所对应的隐含层节点添加到当前模型中；

S4，在新的隐含层节点添加完成后，采用全局优化算法来获得整个网络的输出权重；当网络的节点数达到预先设置的隐含层节点数或者网络残差满足期望精度时，结束整个网络的构建过程，最终得到一个基于二维-增量式随机权网络模型；

S5，利用构建的二维-增量式随机权网络模型进行二维图像数据分析，最终优化了图像处理效果。

进一步的，所述步骤S1包括：

首先给定一组训练输入

x_i为图像样本集中的第i个输入图像，N为训练样本的数量，d₁×d₂为图像矩阵；输出为T＝{t₁,t₂,...,t_N},t_i∈R^m，t_i为图像样本集中的第i个输出，m为样本输出的个数；

然后对二维-增量式随机权网络模型所涉及到的模型参数进行定义，包括：模型的期望精度ε，预先设定的网络最大尺寸L_max，隐层参数的取值范围Υ：＝{λ_min:Δλ:λ_max}，其中[-λ_min,λ_min]为隐层参数选取的开始范围，Δλ为范围的变化量，[-λ_max,λ_max]为隐层参数选取的最大范围；每个隐层参数范围所能配置隐层节点的次数T_max，调节因子γ，学习参数r，将Θ₁记为模型的初始尺寸、模型残差记为e₀，并令e₀等于训练样本的输出T。

进一步的，所述步骤S2包括：

设当前模型具有k-1个隐含层节点，将要进行下一个隐含层节点建立时，分别从三个可变对称区间

和[-λλ]中随机选取隐含层参数

和

其中λ从λ_min开始，逐步增加Δλ，直至λ_max结束；w_k为左投影矢量，v_k为右投影矢量，b_k为偏置；

将随机选取的隐层参数代入激活函数

得到第k个隐层节点的输出：

在每个可变对称区间中配置T_max次隐层节点，将满足如下条件的隐层节点放入候选隐含层节点池中：

式中，e_k-1(x)为当前网络残差。

进一步的，所述步骤S3包括：

在候选隐含层节点池中计算每个节点的ξ_k值，组成一个变量集合

从这组变量集合中，找到最大的ξ_k，并将其包含的隐层参数作为新增隐层节点的最佳模型参数

和

若在当前的可变对称区间中找不到满足条件的隐层节点，则自适应地调节隐层参数的范围，并相应地调节学习参数r，即：

加大r的数值，r＝r+τ，τ由(0,1-r)区间内随机产生，并重复步骤S2和S3，直到候选隐含层节点池不为空，找到最优参数；模型的尺寸从Θ₁开始增加，将满足监督机制的隐含层节点逐个添加到模型中；

得到当前网络的隐层输出矩阵H_k：

其中，

进一步的，所述步骤S4包括：

采用全局优化算法计算当前网络的输出权重β^★：

当前网络的残差为：e_k＝T-H_kβ^*；

若当前网络的残差e_k达到期望精度ε或者当前网络的尺寸超出预先设置的网络最大尺寸数L_max，则停止网络模型的构建，建模结束。

有益效果：与现有技术相比，本发明的技术方案具有以下有益的技术效果：

本发明的基于二维-增量式随机权网络的图像数据分析方法采用左投影矢量和右投影矢量来取代矢量操作，可有效避免维数灾难，并可高效构建模型。另外，该方法从一个小尺寸规模的网络开始构建模型，并通过一个约束力度更强的监督机制来挑选最佳的模型训练参数，从而得到一个对建模贡献最大的隐层节点。同时，采用全局优化算法来得到模型的输出权值。最后，一个具有结构简单、易于实现、结构紧致且泛化性能强的二维-增量式随机权网络被建立，且能够在图像分析中展现良好的应用潜力。

附图说明

图1是基于二维-增量式随机权网络的图像数据分析方法的流程图。

具体实施方式

下面结合附图和实施例对本发明的技术方案作进一步的说明。

如图1所示，本发明所述的基于二维-增量式随机权网络的图像数据分析方法，具体步骤如下：

S1，获取图像样本集，设置二维-增量式随机权网络模型的初始参数。

首先给定一组训练输入

S2，根据模型构建过程中网络残差需逐步减小的特征，建立监督机制，并产生一个候选隐含层节点池。

设当前模型具有k-1个隐含层节点，将要进行下一个隐含层节点(第k个隐层节点)建立时，首先根据配置次数，分别从三个可变对称区间

和[-λλ]中随机选取T_max组隐含层参数

和

然后将随机选取的隐层参数代入激活函数

得到第k个隐层节点的输出：

在每个可变对称区间中配置T_max次隐层节点，将满足如下条件(监督机制)的隐层节点放入候选隐含层节点池中：

式中，e_k-1(x)为当前网络残差。

需要指出的是，在加入第k个隐层节点后，网络残差的下降量可表示为：

其中，

为将要添加的第k个隐层节点与输出层之间连接的输出权值的中间变量。因此，上述监督机制可用于实现对隐层参数的优选。

S3，在候选隐含层节点池中，将模型残差下降最快所对应的隐含层节点添加到当前模型中。

在候选隐含层节点池中，找到使当前网络残差下降最快的隐层参数作为本次构造的最优参数，并将其送入所选的激活函数中，形成网络的第k个隐层节点。若候选隐含层节点池中没有隐层节点，那就说明没有找到满足条件的隐层节点，那么将改变隐层参数的取值范围，并减轻对隐层参数约束的力度，具体如下：

从这组变量集合中，采用max函数找到最大的ξ_k，并将其包含的隐层参数作为新增隐层节点的最佳模型参数

和

若在当前的可变对称区间中找不到满足条件的隐层节点(候选隐含层节点池中没有候选隐层节点，那说明使用当前的条件搜不到所需要的隐层节点，则需要对条件进行修改，即：扩大隐层参数的参数选取范围，同时放松对隐层参数的约束尺度)，则自适应地调节隐层参数的范围，并相应地调节学习参数r，即：

加大r的数值，来减轻监督机制对隐层参数的约束力度，r＝r+τ，τ由(0,1-r)区间内随机产生，并重复步骤S2和S3，直到候选隐含层节点池不为空，找到最优参数；模型的尺寸从Θ₁开始增加，将满足监督机制的隐含层节点逐个添加到模型中；需要指出的是r的值越接近于1，就越容易找到满足约束条件的隐层参数。

此时，整个网络的隐含层输出矩阵H_k：

其中，

S4，在新的隐含层节点添加完成后，采用全局优化算法来获得整个网络的输出权重

当前网络的残差为：e_k＝T-H_kβ^*；

若当前网络的残差e_k达到期望精度ε或者当前网络的尺寸超出预先设置的网络最大尺寸数L_max，则停止网络模型的构建，建模结束，得到一个基于二维-增量式随机权网络模型。

下面将ORL人脸库来详细阐述本发明的方法。ORL人脸库的详细如下：

ORL人脸数据集包括40个不同人的10幅分辨率均为112×92图像，一共400幅图像。这些图像在拍摄时间、光照条件、面部表情、面部细节等方面具有差异。

首先，在ORL人脸数据集中，随机选取一部分人脸图像作为训练集，剩下的作为测试集；设置二维-增量式随机权网络模型的初始参数；根据模型构建过程中网络残差需逐步减小的特征，建立监督机制，并用于产生一个候选隐含层节点池；在候选隐含层节点池中，将模型残差下降最快所对应的隐含层节点添加到当前模型中；在新的隐含层节点添加完成后，采用全局优化算法来获得整个网络的输出权重。当网络的节点数达到事先设置的隐含层节点数或者网络残差满足期望精度时，结束整个网络的构建过程，最终得到一个基于二维-增量式随机权网络模型；最后，在ORL人脸库测试集上完成模型性能的测试。

参考上述实施例，本发明实施例的基于二维-增量式随机权网络的图像数据分析方法的步骤如下：

第一步：给定二维-增量式随机权网络模型的初始参数，对于每个人的图像，随机选取5幅图像作为训练样本，剩余的5幅作为测试数据集，使用数字1-40来表示人类的类别标签；学习模型的其他参数设置如下：

模型预先定义的最大尺寸为L_max＝50、期望误差ε＝0.02、调节因子γ＝10、学习参数r＝0.9、每个可变区间内隐层参数的生成次数T_max＝200、隐层参数可变对称区间Υ：＝{1:1:250}、学习模型从隐含层节点数Θ₁＝1开始构建过程，其中残差为e₀＝T、将Sigmoid函数选为隐层节点的激活函数。

第二步：在构建模型的第k个隐层节点时，在给定的隐层参数取值区间[-1,1]中，根据事先设置好的随机参数生成次数，产生200组隐层参数(

和

)，并将其代入激活函数，形成相应的隐层节点输出矩阵h_k。然后将这200个输出矩阵全部代入不等式约束

并将满足条件的隐层节点放到候选隐含层节点池中进行保存。

第三步：通过max函数找出候选隐含层节点池中最大的ξ_k，其所对应的隐层参数就是本次构造所需的最优参数，并将其代入激活函数，形成新增隐层节点，同时获得网络第k个隐层节点的输出矩阵

当候选隐含层节点池为空时，则需要改变隐层参数的取值区间，同时改变r的数值，来放松监督机制对参数生成的约束，即可变区间变为[-1-Δ,1+Δ]，其中Δ＝1为步长，r＝r+τ，其中，τ∈(0,1-r)，然后重复执行第二步和第三步，直至找到最优参数为止。

第四步：将经过第二步和第三步后找到的最佳输出矩阵

添加到当前的网络中，则整个网络的输出矩阵可表示为

再利用全局优化算法来得到网络的输出权值

那么当前网络残差可计算为e_k＝T-H_kβ^*。

当模型包含的隐含层节点数大于等于50或者网络残差小于0.02时，则将终止模型的构建，整个建模过程结束。

将每个人剩余的5幅图作为测试，其运行结果如下：

训练精度为0.99，测试精度为0.965。从上述结果可以看出，本发明所建立的模型具有简单的结构，较小的模型规模，且具有较高的学习能力和泛化性能，这说明了本发明在二维图像建模过程中表现出较好的分类与建模效果。