CN116403078A

CN116403078A - 基于机器人的广泛学习的中大规模图像识别集成学习模型

Info

Publication number: CN116403078A
Application number: CN202310678106.6A
Authority: CN
Inventors: 王茂林; 张鹏
Original assignee: Shenzhen Kim Dai Intelligence Innovation Technology Co ltd
Current assignee: Shenzhen Kim Dai Intelligence Innovation Technology Co ltd
Priority date: 2023-06-09
Filing date: 2023-06-09
Publication date: 2023-07-07

Abstract

本发明公开了基于机器人的广泛学习的中大规模图像识别集成学习模型，包括有S1通过广泛学习的集成学习模型，将输入数据分解成多个子空间并使用不同的基函数对每个子空间进行建模；S2通过使用套索自动编码器对原始图像进行特征提取，获取具有高区分性的特征表示；S3通过广泛增量扩展与学习算法，在训练过程中根据数据集的特点，动态增加网络的规模和复杂度，以适应不断变化的输入数据分布，使得基于广泛的集成学习模型在提高了图像识别的训练速度的同时，也保持了良好的学习性能。

Description

基于机器人的广泛学习的中大规模图像识别集成学习模型

技术领域

本发明涉及计算机视觉图像识别领域，特别是基于机器人的广泛学习的中大规模图像识别集成学习模型。

背景技术

广泛学习是近期图像识别领域的研究热点，旨在通过利用大量的未标记数据和大量的特征，以及灵活的神经网络结构来提高模型的泛化性能。这种学习模式需将特征空间分解为多个子空间，并为每个子空间构建一个单独的神经网络。每个神经网络都只接收部分特征输入，并且拥有独立的权重和偏置。在训练阶段，每个神经网络都使用未标记数据进行训练，并根据其输入特征和输出进行调整。在所有的神经网络训练完成后，将它们的特征向量拼接在一起，并通过一个全连接层进行分类或回归。但现有的广泛学习的图像识别存在低精度、低效以及可扩展性差等缺点。

发明内容

本发明克服了现有技术的不足，提供了一种基于机器人的广泛学习的中大规模图像识别集成学习模型，以平面网络的形式构建，集成了套索自动编码器，并使用了广泛的增量学习算法的图像识别方法。

为实现上述目的，本发明采用了下列技术方案：

基于机器人的广泛学习的中大规模图像识别集成学习模型，其特征在于，包括有如下步骤，

S1、通过广泛学习的集成学习模型，将输入数据分解成多个子空间并使用不同的基函数对每个子空间进行建模；

S2、通过使用套索自动编码器对原始图像进行特征提取，获取具有高区分性的特征表示；

S3、通过广泛增量扩展与学习算法，在训练过程中根据数据集的特点，动态增加网络的规模和复杂度，以适应不断变化的输入数据分布。

如上所述的基于机器人的广泛学习的中大规模图像识别集成学习模型，其特征在于：S1中广泛学习的集成学习模型是基于随机平面网络构建的，包括输入层和输出层。

如上所述的基于机器人的广泛学习的中大规模图像识别集成学习模型，其特征在于：

设定

是配备了/>

个训练样本的原始输入，每个样本都有/>

个属性，对于原始输入

，具有/>

特征节点的第/>

个特征空间，即/>

，表示为/>

式中，

为第/>

组投影特征的随机输入权值，/>

为随机偏差，/>

表示第/>

组投影特征空间的映射函数，投影特征的串联构成了集成学习模型的平面网络的输入，即/>

，表示为/>

基于广泛学习的集成学习模型中，输出层的分类或识别为监督学习，因此所提出的模型的输出表示为线性方程

，其中/>

为连接平面网络输入层到输出层的输出权重，且/>

，并通过计算下式的最优问题，

，/>

，其中/>

是权重/>

的进一步约束系数，/>

是单位矩阵；

因此输入矩阵对应的伪逆

为/>

，当/>

时，解近似于原始伪逆，基于广泛学习的集成学习模型的实际输出/>

为

。

如上所述的基于机器人的广泛学习的中大规模图像识别集成学习模型，其特征在于：S2中，将原始输入

通过参数为/>

，/>

的函数/>

随机转换为更高层次的表示/>

，来作为稀疏函数/>

的输入，从稀疏函数/>

得到理想权值/>

的过程为求解下式的最优解，/>

，其中/>

是参数/>

的约束系数，将得到理想权值/>

投影到一个新的输入空间/>

上，/>

，通过由理想权值/>

得到/>

，表示原始输入/>

，对应的第/>

组稀疏和紧凑的特征/>

，等于/>

，所有稀疏特征的连接构成了原始输入的特征表示。

如上所述的基于机器人的广泛学习的中大规模图像识别集成学习模型，其特征在于：S3中在每个特征组

中插入额外的特征节点，以增加每个特征空间的维度，假设初始网络有/>

组特征，附加节点/>

被插入到第/>

个/>

特征组中，定义/>

作为附加的输入权重，将/>

表示为/>

的相应调整权重，第/>

组特征空间的新输入权值变为/>

，新的特征组定义为/>

。

如上所述的基于机器人的广泛学习的中大规模图像识别集成学习模型，其特征在于：S3中通过添加广义的特征组，将附加的第

组特征映射节点表示为/>

，

。

本发明的有益效果是：

1、本发明可以实现在普通计算机上快速、有效的识别中大规模图像集的图像识别模型。其主要由三个部分组成，分别为基于广泛的集成学习模型的架构、套索稀疏自动编码器的集成，以及广泛的增量学习算法的开发；当模型不能很好地完成任务时，基于广泛的集成学习模型可以进行广泛的重构；通过套索稀疏自编码器和串联技术实现了良好的特征表示；为了快速重建模型，还开发了相应的广泛的增量训练算法。以上技术的使用使得基于广泛的集成学习模型在提高了图像识别的训练速度的同时，也保持了良好的学习性能。

2、本发明具有高精度，该模型能够有效地提高图像识别的准确率，在一些常用的数据集上取得了优秀的性能表现。

3、本发明具有高效性，该模型采用了广泛学习的思想，通过分离网络结构和特征空间，利用简单的基础分类器构建集成模型，使得模型训练和预测的速度较快，且在增量学习方面表现良好。

4、本发明可扩展性强，该模型能够适应中等到大规模的图像识别任务，支持并行计算和GPU加速，能够处理大量的特征和样本数据，具有一定的扩展性和灵活性。

附图说明

图1是本发明基于广泛学习的集成学习模型的结构示意图；

图2是本发明套索稀疏自动编码器结构示意图。

具体实施方式

下面将结合附图，对本发明实施例中的技术方案进行清楚、完整地描述。

需要说明，本发明实施例中所有方向性指示(诸如上、下、左、右、前、后…) 仅用于解释在某一特定姿态 (如附图所示) 下各部件之间的相对位置关系、运动情况等，如果该特定姿态发生改变时，则该方向性指示也相应地随之改变。另外，在本发明中涉及“优选”、“次优选”等的描述仅用于描述目的，而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“优选”、“次优选”的特征可以明示或者隐含地包括至少一个该特征。

如图1-2所示，基于机器人的广泛学习的中大规模图像识别集成学习模型，包括如下步骤，

S1、广泛学习系统，广泛学习系统是一种基于浅层神经网络的模型，通过将输入数据分解成多个子空间并使用不同的基函数对每个子空间进行建模，可以提高模型的泛化能力和鲁棒性。广泛学习系统可以快速地适应新的数据，不需要重新训练整个模型。

具体地，基于广泛学习的集成学习模型是基于随机平面网络构建的，包括输入层和输出层,具体结构如图1所示。基于广泛学习的集成学习模型使用函数

将原始输入随机映射到不同的特征空间中，并将这些特征空间的特征节点作为输入层的输入。

假设

是配备了/>

个训练样本的原始输入，每个样本都有/>

个属性。对于原始输入

，具有/>

特征节点的第/>

个特征空间，即/>

，可以表示为/>

式中，

为第/>

组投影特征的随机输入权值，/>

为随机偏差，/>

表示第/>

组投影特征空间的映射函数，在理论上可能是任意连续函数。投影特征的串联构成了集成学习模型的平面网络的输入，即/>

。

对于基于广泛学习的集成学习模型而言，输出层的分类或识别可以看作是监督学习。因此，所提出的模型的输出可以表示为以下线性方程

,其中/>

为连接平面网络输入层到输出层的输出权重，可以很容易地计算出来/>

，而计算伪逆

直接的解决方案是昂贵的，而且很难在硬件中实现。所以通过计算下式的最优问题来替代伪逆。

，/>

，其中/>

是权重/>

的进一步约束系数，/>

是单位矩阵。输入矩阵对应的伪逆/>

为

，这实际上是摩尔-彭罗斯广义逆的近似值。特别是，当/>

时，解近似于原始伪逆。基于广泛学习的集成学习模型的实际输出/>

为

。

S2、特征提取，通过使用套索自动编码器对原始图像进行特征提取，可以获取具有高区分性的特征表示。套索自动编码器是一种基于自编码器的特征学习算法，主要用于高维数据降维和特征提取。套索是最小绝对值收敛和选择算子的缩写，是一种稀疏化方法，它能够对自编码器的权重进行约束，使得自编码器能够自动地学习到最具有区分性的特征。

具体地，原始输入

随机映射到不同的特征空间/>

时，虽然通过随机初始化产生一系列随机特征的输入权值/>

易于补充，计算量较小，但随机性是不可预测的。此外，不经调整的随机权值会产生许多冗余特征，特别是在串联模式下，因此需要进行引导。基于广泛学习的集成学习模型集成了套索稀疏自动编码器，轻微调整随机输入权值，以产生一组稀疏、基本和紧凑的特征，具体结构如图2所示。

将原始输入

通过参数为/>

，/>

的函数/>

随机转换为更高层次的表示/>

，来作为稀疏函数/>

的输入。从稀疏函数/>

得到理想权值/>

的过程也可以看作是求解下式的最优解。

其中

是参数/>

的约束系数，将得到理想权值/>

投影到一个新的输入空间/>

上，/>

。通过由理想权值/>

得到/>

，可以更好地表示原始输入/>

。对应的第/>

组稀疏和紧凑的特征/>

，等于/>

。所有稀疏特征的连接构成了原始输入的特征表示。

S3、广泛增量扩展与学习算法，广泛增量扩展与学习算法是一种基于广泛学习思想的增量学习算法。与传统的深度学习算法相比，这个方法不需要事先设计复杂的深层神经网络结构，而是通过自动增加特征节点和隐层节点来逐步构建网络。广泛增量扩展与学习算法的主要思路是，在训练过程中根据数据集的特点，动态地增加网络的规模和复杂度，以适应不断变化的输入数据分布。

具体地，基于广泛学习的集成学习模型提出了基于特征节点广泛扩展的增量学习方法，这个方法有两种可采用的思路。

一种广泛扩展方法是在每个特征组

中插入额外的特征节点，以增加每个特征空间的维度。假设初始网络有/>

组特征。附加节点/>

被插入到第/>

个/>

特征组中。定义/>

作为附加的输入权重。将/>

表示为/>

的相应调整权重。第/>

组特征空间的新输入权值变为/>

，新的特征组定义为/>

。

另一种方法是添加广义的特征组。将附加的第

组特征映射节点表示为/>

，

。

以上技术的使用使得基于广泛的集成学习模型在提高了图像识别的训练速度的同时，也保持了良好的学习性能。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是在本发明的发明构思下，利用本发明说明书及附图内容所作的等效结构变换，或直接或间接运用在其他相关的技术领域均包括在本发明的专利保护范围内。