CN116403078A - 基于机器人的广泛学习的中大规模图像识别集成学习模型 - Google Patents
基于机器人的广泛学习的中大规模图像识别集成学习模型 Download PDFInfo
- Publication number
- CN116403078A CN116403078A CN202310678106.6A CN202310678106A CN116403078A CN 116403078 A CN116403078 A CN 116403078A CN 202310678106 A CN202310678106 A CN 202310678106A CN 116403078 A CN116403078 A CN 116403078A
- Authority
- CN
- China
- Prior art keywords
- learning
- feature
- learning model
- input
- extensive
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 claims abstract description 23
- 238000012549 training Methods 0.000 claims abstract description 14
- 230000006870 function Effects 0.000 claims abstract description 12
- 239000011159 matrix material Substances 0.000 claims description 6
- 238000013507 mapping Methods 0.000 claims description 4
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 241000170489 Upis Species 0.000 claims description 2
- 230000007786 learning performance Effects 0.000 abstract description 3
- 238000013528 artificial neural network Methods 0.000 description 7
- 230000007547 defect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Medical Informatics (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了基于机器人的广泛学习的中大规模图像识别集成学习模型,包括有S1通过广泛学习的集成学习模型,将输入数据分解成多个子空间并使用不同的基函数对每个子空间进行建模;S2通过使用套索自动编码器对原始图像进行特征提取,获取具有高区分性的特征表示;S3通过广泛增量扩展与学习算法,在训练过程中根据数据集的特点,动态增加网络的规模和复杂度,以适应不断变化的输入数据分布,使得基于广泛的集成学习模型在提高了图像识别的训练速度的同时,也保持了良好的学习性能。
Description
技术领域
本发明涉及计算机视觉图像识别领域,特别是基于机器人的广泛学习的中大规模图像识别集成学习模型。
背景技术
广泛学习是近期图像识别领域的研究热点,旨在通过利用大量的未标记数据和大量的特征,以及灵活的神经网络结构来提高模型的泛化性能。这种学习模式需将特征空间分解为多个子空间,并为每个子空间构建一个单独的神经网络。每个神经网络都只接收部分特征输入,并且拥有独立的权重和偏置。在训练阶段,每个神经网络都使用未标记数据进行训练,并根据其输入特征和输出进行调整。在所有的神经网络训练完成后,将它们的特征向量拼接在一起,并通过一个全连接层进行分类或回归。但现有的广泛学习的图像识别存在低精度、低效以及可扩展性差等缺点。
发明内容
本发明克服了现有技术的不足,提供了一种基于机器人的广泛学习的中大规模图像识别集成学习模型,以平面网络的形式构建,集成了套索自动编码器,并使用了广泛的增量学习算法的图像识别方法。
为实现上述目的,本发明采用了下列技术方案:
基于机器人的广泛学习的中大规模图像识别集成学习模型,其特征在于,包括有如下步骤,
S1、通过广泛学习的集成学习模型,将输入数据分解成多个子空间并使用不同的基函数对每个子空间进行建模;
S2、通过使用套索自动编码器对原始图像进行特征提取,获取具有高区分性的特征表示;
S3、通过广泛增量扩展与学习算法,在训练过程中根据数据集的特点,动态增加网络的规模和复杂度,以适应不断变化的输入数据分布。
如上所述的基于机器人的广泛学习的中大规模图像识别集成学习模型,其特征在于:S1中广泛学习的集成学习模型是基于随机平面网络构建的,包括输入层和输出层。
如上所述的基于机器人的广泛学习的中大规模图像识别集成学习模型,其特征在于:
如上所述的基于机器人的广泛学习的中大规模图像识别集成学习模型,其特征在于:S2中,将原始输入通过参数为/>,/>的函数/>随机转换为更高层次的表示/>,来作为稀疏函数/>的输入,从稀疏函数/>得到理想权值/>的过程为求解下式的最优解,/>,其中/>是参数/>的约束系数,将得到理想权值/>投影到一个新的输入空间/>上,/>,通过由理想权值/>得到/>,表示原始输入/>,对应的第/>组稀疏和紧凑的特征/>,等于/>,所有稀疏特征的连接构成了原始输入的特征表示。
如上所述的基于机器人的广泛学习的中大规模图像识别集成学习模型,其特征在于:S3中在每个特征组中插入额外的特征节点,以增加每个特征空间的维度,假设初始网络有/>组特征,附加节点/>被插入到第/>个/>特征组中,定义/>作为附加的输入权重,将/>表示为/>的相应调整权重,第/>组特征空间的新输入权值变为/>,新的特征组定义为/>。
本发明的有益效果是:
1、 本发明可以实现在普通计算机上快速、有效的识别中大规模图像集的图像识别模型。其主要由三个部分组成,分别为基于广泛的集成学习模型的架构、套索稀疏自动编码器的集成,以及广泛的增量学习算法的开发;当模型不能很好地完成任务时,基于广泛的集成学习模型可以进行广泛的重构;通过套索稀疏自编码器和串联技术实现了良好的特征表示;为了快速重建模型,还开发了相应的广泛的增量训练算法。以上技术的使用使得基于广泛的集成学习模型在提高了图像识别的训练速度的同时,也保持了良好的学习性能。
2、本发明具有高精度,该模型能够有效地提高图像识别的准确率,在一些常用的数据集上取得了优秀的性能表现。
3、本发明具有高效性,该模型采用了广泛学习的思想,通过分离网络结构和特征空间,利用简单的基础分类器构建集成模型,使得模型训练和预测的速度较快,且在增量学习方面表现良好。
4、本发明可扩展性强,该模型能够适应中等到大规模的图像识别任务,支持并行计算和GPU加速,能够处理大量的特征和样本数据,具有一定的扩展性和灵活性。
附图说明
图1是本发明基于广泛学习的集成学习模型的结构示意图;
图2是本发明套索稀疏自动编码器结构示意图。
具体实施方式
下面将结合附图,对本发明实施例中的技术方案进行清楚、完整地描述。
需要说明,本发明实施例中所有方向性指示(诸如上、下、左、右、前、后…) 仅用于解释在某一特定姿态 (如附图所示) 下各部件之间的相对位置关系、运动情况等,如果该特定姿态发生改变时,则该方向性指示也相应地随之改变。另外,在本发明中涉及“优选”、“次优选”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“优选”、“次优选”的特征可以明示或者隐含地包括至少一个该特征。
如图1-2所示,基于机器人的广泛学习的中大规模图像识别集成学习模型,包括如下步骤,
S1、广泛学习系统,广泛学习系统是一种基于浅层神经网络的模型,通过将输入数据分解成多个子空间并使用不同的基函数对每个子空间进行建模,可以提高模型的泛化能力和鲁棒性。广泛学习系统可以快速地适应新的数据,不需要重新训练整个模型。
具体地,基于广泛学习的集成学习模型是基于随机平面网络构建的,包括输入层和输出层,具体结构如图1所示。基于广泛学习的集成学习模型使用函数将原始输入随机映射到不同的特征空间中,并将这些特征空间的特征节点作为输入层的输入。
对于基于广泛学习的集成学习模型而言,输出层的分类或识别可以看作是监督学习。因此,所提出的模型的输出可以表示为以下线性方程,其中/>为连接平面网络输入层到输出层的输出权重,可以很容易地计算出来/>,而计算伪逆直接的解决方案是昂贵的,而且很难在硬件中实现。所以通过计算下式的最优问题来替代伪逆。
,/>,其中/>是权重/>的进一步约束系数,/>是单位矩阵。输入矩阵对应的伪逆/>为,这实际上是摩尔-彭罗斯广义逆的近似值。特别是,当/>时,解近似于原始伪逆。基于广泛学习的集成学习模型的实际输出/>为。
S2、特征提取,通过使用套索自动编码器对原始图像进行特征提取,可以获取具有高区分性的特征表示。套索自动编码器是一种基于自编码器的特征学习算法,主要用于高维数据降维和特征提取。套索是最小绝对值收敛和选择算子的缩写,是一种稀疏化方法,它能够对自编码器的权重进行约束,使得自编码器能够自动地学习到最具有区分性的特征。
具体地,原始输入随机映射到不同的特征空间/>时,虽然通过随机初始化产生一系列随机特征的输入权值/>易于补充,计算量较小,但随机性是不可预测的。此外,不经调整的随机权值会产生许多冗余特征,特别是在串联模式下,因此需要进行引导。基于广泛学习的集成学习模型集成了套索稀疏自动编码器,轻微调整随机输入权值,以产生一组稀疏、基本和紧凑的特征,具体结构如图2所示。
其中是参数/>的约束系数,将得到理想权值/>投影到一个新的输入空间/>上,/>。通过由理想权值/>得到/>,可以更好地表示原始输入/>。对应的第/>组稀疏和紧凑的特征/>,等于/>。所有稀疏特征的连接构成了原始输入的特征表示。
S3、广泛增量扩展与学习算法,广泛增量扩展与学习算法是一种基于广泛学习思想的增量学习算法。与传统的深度学习算法相比,这个方法不需要事先设计复杂的深层神经网络结构,而是通过自动增加特征节点和隐层节点来逐步构建网络。广泛增量扩展与学习算法的主要思路是,在训练过程中根据数据集的特点,动态地增加网络的规模和复杂度,以适应不断变化的输入数据分布。
具体地,基于广泛学习的集成学习模型提出了基于特征节点广泛扩展的增量学习方法,这个方法有两种可采用的思路。
一种广泛扩展方法是在每个特征组中插入额外的特征节点,以增加每个特征空间的维度。假设初始网络有/>组特征。附加节点/>被插入到第/>个/>特征组中。定义/>作为附加的输入权重。将/>表示为/>的相应调整权重。第/>组特征空间的新输入权值变为/>,新的特征组定义为/>。
以上技术的使用使得基于广泛的集成学习模型在提高了图像识别的训练速度的同时,也保持了良好的学习性能。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是在本发明的发明构思下,利用本发明说明书及附图内容所作的等效结构变换,或直接或间接运用在其他相关的技术领域均包括在本发明的专利保护范围内。
Claims (6)
1.基于机器人的广泛学习的中大规模图像识别集成学习模型,其特征在于,包括如下步骤,
S1、通过广泛学习的集成学习模型,将输入数据分解成多个子空间并使用不同的基函数对每个子空间进行建模;
S2、通过使用套索自动编码器对原始图像进行特征提取,获取具有高区分性的特征表示;
S3、通过广泛增量扩展与学习算法,在训练过程中根据数据集的特点,动态增加网络的规模和复杂度,以适应不断变化的输入数据分布。
2.根据权利要求1所述的基于机器人的广泛学习的中大规模图像识别集成学习模型,其特征在于:S1中广泛学习的集成学习模型是基于随机平面网络构建的,包括输入层和输出层。
3.根据权利要求2所述的基于机器人的广泛学习的中大规模图像识别集成学习模型,其特征在于:
基于广泛学习的集成学习模型中,输出层的分类或识别为监督学习,因此所提出的模型的输出表示为线性方程,其中/>为连接平面网络输入层到输出层的输出权重,且/>,并通过计算下式的最优问题,/>,,其中/>是权重/>的进一步约束系数,/>是单位矩阵;
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310678106.6A CN116403078A (zh) | 2023-06-09 | 2023-06-09 | 基于机器人的广泛学习的中大规模图像识别集成学习模型 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310678106.6A CN116403078A (zh) | 2023-06-09 | 2023-06-09 | 基于机器人的广泛学习的中大规模图像识别集成学习模型 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116403078A true CN116403078A (zh) | 2023-07-07 |
Family
ID=87014697
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310678106.6A Pending CN116403078A (zh) | 2023-06-09 | 2023-06-09 | 基于机器人的广泛学习的中大规模图像识别集成学习模型 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116403078A (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108734301A (zh) * | 2017-06-29 | 2018-11-02 | 澳门大学 | 一种机器学习方法和机器学习装置 |
CN110826570A (zh) * | 2019-10-25 | 2020-02-21 | 西安科技大学 | 一种ect两相流基于宽度学习的流型识别方法 |
CN113591653A (zh) * | 2021-07-22 | 2021-11-02 | 中南大学 | 一种基于宽度学习系统的增量式锌浮选工况判别方法 |
-
2023
- 2023-06-09 CN CN202310678106.6A patent/CN116403078A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108734301A (zh) * | 2017-06-29 | 2018-11-02 | 澳门大学 | 一种机器学习方法和机器学习装置 |
CN110826570A (zh) * | 2019-10-25 | 2020-02-21 | 西安科技大学 | 一种ect两相流基于宽度学习的流型识别方法 |
CN113591653A (zh) * | 2021-07-22 | 2021-11-02 | 中南大学 | 一种基于宽度学习系统的增量式锌浮选工况判别方法 |
Non-Patent Citations (1)
Title |
---|
C. L. PHILIP CHEN 等: ""Broad Learning System: An Effective and Efficient Incremental Learning System Without the Need for Deep Architecture "", 《IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS》, vol. 29, no. 1, pages 10 - 24, XP011675354, DOI: 10.1109/TNNLS.2017.2716952 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhang et al. | Improved deep hashing with soft pairwise similarity for multi-label image retrieval | |
JP2023534358A (ja) | 量子系の基底状態エネルギーの推定方法、およびシステム | |
CN110458187B (zh) | 一种恶意代码家族聚类方法和系统 | |
CN110046252B (zh) | 一种基于注意力机制神经网络与知识图谱的医疗文本分级方法 | |
CN108985515B (zh) | 一种基于独立循环神经网络的新能源出力预测方法及系统 | |
CN113299354A (zh) | 基于Transformer和增强交互型MPNN神经网络的小分子表示学习方法 | |
CN110264012B (zh) | 基于经验模态分解的可再生能源功率组合预测方法及系统 | |
CN109743196A (zh) | 一种基于跨双层网络随机游走的网络表征方法 | |
CN116960989B (zh) | 一种发电站的电力负荷预测方法、装置、设备及存储介质 | |
CN111723930A (zh) | 一种应用群智监督学习方法的系统 | |
CN110096630A (zh) | 一类基于聚类分析的大数据处理方法 | |
CN115470889A (zh) | 基于强化学习的片上网络自主最优映射探索系统及方法 | |
CN114925767A (zh) | 一种基于变分自编码器的场景生成方法和装置 | |
CN113313322B (zh) | Moea/d挤压工艺参数多目标优化方法及装置 | |
CN114386582A (zh) | 一种基于对抗训练注意力机制的人体动作预测方法 | |
CN117059284A (zh) | 基于协同进化离散粒子群优化的糖尿病并行属性约简方法 | |
Qian et al. | Deep learning for a low-data drug design system | |
CN116403078A (zh) | 基于机器人的广泛学习的中大规模图像识别集成学习模型 | |
CN109740221B (zh) | 一种基于搜索树的智能工业设计算法 | |
CN112418504A (zh) | 一种基于混合变量选择优化深度信念网络风速预测方法 | |
CN114880527B (zh) | 一种基于多预测任务的多模态知识图谱表示方法 | |
CN114611621A (zh) | 一种基于注意力超图神经网络的协同聚类方法 | |
CN113515685A (zh) | 一种融合Embedding强化拓扑与节点内容信息的社团检测方法 | |
Yang et al. | Deep belief networks oriented clustering | |
CN116486127A (zh) | 一种融合结构信息的图自编码器聚类方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |