CN117851921A - 基于迁移学习的设备寿命预测方法及装置 - Google Patents
基于迁移学习的设备寿命预测方法及装置 Download PDFInfo
- Publication number
- CN117851921A CN117851921A CN202410257290.1A CN202410257290A CN117851921A CN 117851921 A CN117851921 A CN 117851921A CN 202410257290 A CN202410257290 A CN 202410257290A CN 117851921 A CN117851921 A CN 117851921A
- Authority
- CN
- China
- Prior art keywords
- model
- feature extraction
- data
- life
- constructed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 99
- 238000013526 transfer learning Methods 0.000 title claims abstract description 28
- 238000012549 training Methods 0.000 claims abstract description 93
- 238000000605 extraction Methods 0.000 claims abstract description 65
- 230000009467 reduction Effects 0.000 claims abstract description 50
- 238000012545 processing Methods 0.000 claims abstract description 24
- 230000006870 function Effects 0.000 claims description 40
- 238000005457 optimization Methods 0.000 claims description 36
- 238000004422 calculation algorithm Methods 0.000 claims description 33
- 239000013598 vector Substances 0.000 claims description 24
- 238000013528 artificial neural network Methods 0.000 claims description 23
- 210000002569 neuron Anatomy 0.000 claims description 21
- 238000005259 measurement Methods 0.000 claims description 18
- 238000009826 distribution Methods 0.000 claims description 17
- 239000011159 matrix material Substances 0.000 claims description 14
- 239000011664 nicotinic acid Substances 0.000 claims description 10
- 238000011478 gradient descent method Methods 0.000 claims description 7
- 230000021615 conjugation Effects 0.000 claims description 6
- 230000003956 synaptic plasticity Effects 0.000 claims description 6
- 230000008485 antagonism Effects 0.000 claims description 4
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 230000003190 augmentative effect Effects 0.000 claims description 3
- 238000002372 labelling Methods 0.000 claims description 3
- 230000003592 biomimetic effect Effects 0.000 claims 1
- 238000004364 calculation method Methods 0.000 abstract description 14
- 230000008569 process Effects 0.000 description 14
- 238000010586 diagram Methods 0.000 description 8
- 230000008901 benefit Effects 0.000 description 7
- 230000007774 longterm Effects 0.000 description 7
- 238000003860 storage Methods 0.000 description 6
- 238000013145 classification model Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 5
- 230000007613 environmental effect Effects 0.000 description 5
- 238000012423 maintenance Methods 0.000 description 5
- 230000004913 activation Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 238000004590 computer program Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 4
- 238000005065 mining Methods 0.000 description 4
- 238000010276 construction Methods 0.000 description 3
- 230000005764 inhibitory process Effects 0.000 description 3
- 238000013508 migration Methods 0.000 description 3
- 230000005012 migration Effects 0.000 description 3
- 230000002093 peripheral effect Effects 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 239000003245 coal Substances 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000001629 suppression Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 206010063385 Intellectualisation Diseases 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000009514 concussion Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013506 data mapping Methods 0.000 description 1
- 238000013079 data visualisation Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000027928 long-term synaptic potentiation Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 238000011524 similarity measure Methods 0.000 description 1
- 230000002195 synergetic effect Effects 0.000 description 1
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种基于迁移学习的设备寿命预测方法及装置,涉及数据处理技术领域,通过获取目标设备的设备运行数据,由预先构建的寿命区间预测模型输出对应的初始分类结果和设备运行数据对应的主题特征;将主题特征和初始分类结果进行融合,得到目标设备对应的寿命预测结果以对目标设备的寿命区间进行预测。基于此,能够提高模型在处理复杂数据时的性能。寿命区间预测模型基于分类器构建,该分类器在大规模数据处理时能够提高提高计算效率。训练样本集通过特征提取模型进行特征提取,并通过降维模型进行降维,能够为分类任务提供更加有效的特征表示,充分挖掘样本的潜在特征。
Description
技术领域
本发明涉及数据处理技术领域,尤其涉及一种基于迁移学习的设备寿命预测方法及装置。
背景技术
随着工业自动化和智能化的发展,设备的有效运行和维护成为了确保生产效率和降低运营成本的关键因素。传统的设备寿命预测方法往往依赖于简单的历史数据分析或专家经验,这在处理复杂的工业环境和多样化的设备类型时精度低、效果差。而且,现有技术通过分类模型对数据进行预测,无法对复杂数据进行精确识别,在进行设备剩余寿命区间分类时精度较低。
发明内容
有鉴于此,本发明的目的在于提供一种基于迁移学习的设备寿命预测方法及装置,能够提高设备寿命的准确度。
第一方面,本发明实施例提供一种基于迁移学习的设备寿命预测方法,该方法包括:获取目标设备的设备运行数据;其中,设备运行数据包括目标设备在预设运行环境下的多种设备参数和运行指标;将设备运行数据输入至预先构建的寿命区间预测模型中,输出初始分类结果,以及设备运行数据对应的主题特征;寿命区间预测模型基于预先训练好的分类器和潜在狄利克雷分配模型构建;且,用于训练分类器的训练样本集通过预先构建的特征提取模型进行特征提取,并通过预先构建的降维模型进行降维;分类器基于流形学习的极限学习机算法进行训练;基于流形学习的极限学习机算法通过对极限学习机算法的隐层特征施加基于邻近性的正则化项,从而对极限学习机的输出层权重进行优化;将主题特征和初始分类结果进行融合,得到目标设备对应的寿命预测结果;根据寿命预测结果对目标设备的寿命区间进行预测。
第二方面,本发明实施例提供了一种基于迁移学习的设备寿命预测装置,该装置包括:数据获取模块,用于获取目标设备的设备运行数据;其中,设备运行数据包括目标设备在预设运行环境下的多种设备参数和运行指标;执行模块,用于将设备运行数据输入至预先构建的寿命区间预测模型中,输出初始分类结果,以及设备运行数据对应的主题特征;寿命区间预测模型基于预先训练好的分类器和潜在狄利克雷分配模型构建;且,用于训练分类器的训练样本集通过预先构建的特征提取模型进行特征提取,并通过预先构建的降维模型进行降维;分类器基于流形学习的极限学习机算法进行训练;基于流形学习的极限学习机算法通过对极限学习机算法的隐层特征施加基于邻近性的正则化项,从而对极限学习机的输出层权重进行优化;数据处理模块,用于将主题特征和初始分类结果进行融合,得到目标设备对应的寿命预测结果;输出模块,用于根据寿命预测结果对目标设备的寿命区间进行预测。
本发明实施例包括以下有益效果:本发明实施例提供的一种基于迁移学习的设备寿命预测方法及装置,通过预先构建好的寿命区间预测模型对目标设备的设备运行数据进行识别,得到初始分类结果和设备运行数据对应的主题特征后,将二者进行融合,以对目标设备的寿命区间进行预测。确定主题特征能够得到更丰富和有信息量的特征表示,这可以提高对数据的抽象能力,更好地捕捉数据中的非线性结构信息,能够提高分类模型在处理复杂数据时的性能。
而且,寿命区间预测模型基于分类器和潜在狄利克雷分配主题模型构建,该分类器基于流形学习的极限学习机算法进行训练。基于流形学习的极限学习机算法通过对极限学习机算法的隐层特征施加基于邻近性的正则化项,从而对极限学习机的输出层权重进行优化,正则化项促使模型保持在隐层表示的高维空间中相似的数据点接近,同时保持不相似的数据点远离,在大规模数据处理时能够提高提高计算效率。
此外,本发明实施例还对训练样本集进行特征提取、降维处理后训练分类器,能够为分类任务提供更加有效的特征表示,充分挖掘样本的潜在特征。
本发明的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点在说明书以及附图中所特别指出的结构来实现和获得。为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种基于迁移学习的设备寿命预测方法的流程图;
图2为本发明实施例提供的另一种基于迁移学习的设备寿命预测方法的流程图;
图3为本发明实施例提供的一种迁移模型的结构示意图;
图4为本发明实施例提供的一种基于迁移学习的设备寿命预测装置的结构示意图;
图5为本发明实施例提供的另一种基于迁移学习的设备寿命预测装置的结构示意图
图6为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,以下通过特定的具体实例说明本公开的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本公开的其他优点与功效。显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。本公开还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本公开的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
需要说明的是,下文描述在所附权利要求书的范围内的实施例的各种方面。应显而易见,本发明中所描述的方面可体现于广泛多种形式中,且本发明中所描述的任何特定结构及/或功能仅为说明性的。基于本公开,所属领域的技术人员应了解,本发明中所描述的一个方面可与任何其它方面独立地实施,且可以各种方式组合这些方面中的两者或两者以上。举例来说,可使用本发明中所阐述的任何数目个方面来实施设备及/或实践方法。另外,可使用除了本发明中所阐述的方面中的一或多者之外的其它结构及/或功能性实施此设备及/或实践此方法。
还需要说明的是,以下实施例中所提供的图示仅以示意方式说明本公开的基本构想,图式中仅显示与本公开中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。另外,在以下描述中,提供具体细节是为了便于透彻理解实例。然而,所属领域的技术人员将理解,可在没有这些特定细节的情况下实践所述方面。
其中,本发明实施例提供了一种基于迁移学习的设备寿命预测方法及装置,在适应不同设备和环境条件方面表现出更大的灵活性和适应性,能够提高设备寿命预测的准确度。
为便于对本实施例进行理解,首先对本发明的实施例所公开的一种基于迁移学习的设备寿命预测方法进行详细介绍,图1示出了本发明实施例提供的一种基于迁移学习的设备寿命预测方法的流程图,如图1所示,该方法包括如下步骤:
步骤S102,获取目标设备的设备运行数据。
步骤S104,将设备运行数据输入至预先构建的寿命区间预测模型中,输出初始分类结果,以及设备运行数据对应的主题特征。
步骤S106,将主题特征和初始分类结果进行融合,得到目标设备对应的寿命预测结果。
步骤S108,根据寿命预测结果对目标设备的寿命区间进行预测。
在具体实现时,本发明实施例的设备运行数据包括目标设备在预设运行环境下的多种设备参数和运行指标。而且,本发明实施例通过预先构建的寿命区间预测模型进行寿命区间预测,其中,寿命区间预测模型基于预先训练好的分类器构建;且,用于训练分类器的训练样本集通过预先构建的特征提取模型进行特征提取,并通过预先构建的降维模型进行降维。
具体的,本发明的数据来源于设备的运行日志、维护记录、使用环境参数,这些数据可以作为训练样本集构建模型。此外,设备运行数据也可参照上述参数。其中,本发明实施例的数据的格式为结构化格式,包含多种设备参数和运行指标,数据的属性可能包括多个,为使得设备寿命预测更加精确,通常不少于10个。在一个实施例中,数据属性与特征包括::设备型号(离散值);/>:运行时间(连续值,单位:小时);/>:温度(连续值,单位:摄氏度);/>:湿度(连续值,单位:%);/>:振动频率(连续值,单位:Hz);/>:电流强度(连续值,单位:安培);/>:电压水平(连续值,单位:伏特);/>:错误代码数量(离散值,单位:个数);/>:维护次数(离散值,单位:次数);/>:环境等级(离散值,如室内、室外)。
在该实施例中,假设有一设备数据,其型号为A1,运行时间为1200小时,在环境温度30摄氏度、湿度60%,振动频率为50Hz,电流强度3安培,电压水平为220伏特,错误代码出现2次,共维护过3次,环境等级为室内。该设备的数据记录可以表示为:(A1,1200,30,60,50,3,220,2,3,室内)。
本发明实施例基于训练好的分类器构建寿命区间预测模型,本发明实施例中,该分类器基于流形学习的极限学习机算法进行训练。基于流形学习的极限学习机算法通过对极限学习机算法的隐层特征施加基于邻近性的正则化项,从而对极限学习机的输出层权重进行优化。流形学习是机器学习的一个分支。它的目标是利用数据流形的几何和拓扑结构来理解和处理数据,包括特征提取、聚类和分类等问题。流形学习可以通过从高维数据中恢复低维流形结构来实现维数约简或数据可视化,帮助从观测的现象中发现内在规律,并对数据进行降维处理。极限学习机是一种高效的单隐层前馈神经网络,其特点是隐层权重和偏置在训练初期随机生成并固定,仅输出层权重通过训练得到优化。本发明实施例通过引入流形学习机制来保留数据的局部拓扑结构,通过对隐层特征施加一个基于邻近性的正则化项,从而鼓励模型保留输入数据在高维空间中的局部几何结构。该正则化项促使模型保持在隐层表示的高维空间中相似的数据点接近,同时保持不相似的数据点远离,从而在隐层特征空间中保留输入数据的局部和全局流形结构。综上,本发明实施例构建寿命区间预测模型的分类器基于流形学习的极限学习机算法构建,在大规模数据处理时能够提高提高计算效率。
此外,本发明实施例还对训练样本集进行特征提取、降维处理后训练分类器,能够为分类任务提供更加有效的特征表示,充分挖掘样本的潜在特征。此外,本发明实施例融合主题特征确定最终的预测输出,能够提高分类模型在处理复杂数据时的性能。
进一步地,现有技术存在以下技术问题:(1)现有技术可能缺乏有效的数据扩充手段,限制了模型在面对多样化数据时的泛化能力;(2)传统的特征提取模型的优化策略可能过于简化,导致特征提取不够有效和准确;(3)传统的数据降维方法可能限制了特征表示的区分度;(4)现有的分类模型在处理复杂数据结构时的进行设备剩余寿命区间分类时精度较低。对此,在上述实施例的基础上,本发明实施例还提供另一种基于迁移学习的设备寿命预测方法,图2示出了本发明实施例提供的另一种基于迁移学习的设备寿命预测方法的流程图,如图2所示,该方法包括如下步骤:
步骤S202,获取目标设备的设备运行数据。
步骤S204,通过预先构建的特征提取模型对设备运行数据进行特征提取,确定设备运行数据的特征向量。
本发明实施例的特征提取模型通过下述步骤构建:
1)获取预先构建的训练样本集和预设的特征提取模型。
本发明实施例通过获取设备的初始训练样本,对初始训练样本进行标注,生成样本标签。再基于初始训练样本和样本标签构建初始样本集。之后,对初始样本集进行数据扩充,构建训练样本集,以使用训练样本集训练特征提取模型。
其中,初始训练样本可参照上述实施例中设备运行数据部分,在此不再赘述。进一步地,对采集到的数据进行标注,标注的类型为设备的寿命阶段。在一个实施例中,标注的类别包括:初期运行阶段:是设备刚刚投入使用的阶段。稳定运行阶段:设备运行稳定,效率高,故障率低。衰退期:随着时间的推移,设备可能开始出现更频繁的维护需求和性能下降。寿命末期:是设备生命周期的最后阶段。
进一步地,本发明实施例还对采集得到的数据进行预处理。若数据集中存在缺失值,本发明采用均值填充法。再一个实施例中,对于连续值特征(如运行时间),使用该特征的均值进行填充,具体的,对于连续值特征的填充方法可以表示为:
其中,是特征/>的均值,/>是连续值特征填充值。
对于离散值特征(设备型号),使用最频繁出现的值进行填充,具体的,对于离散值特征/>的填充方法可以表示为:
其中,是特征/>的众数,是/>离散值特征填充值。
进一步地,对于离散值特征,本发明采用独热编码的方式将离散特征转换为一系列二元(0或1)特征,每个特征代表一种可能的值。在一个实施例中,环境等级的特征值为室内时,则用0表示;环境等级的特征值为室外时,则用1表示。
本发明实施例使用预设的样本扩充算法对初始样本集进行数据扩充,生成扩充样本,使用非线性共轭方法对扩充样本进行调整,直到满足预设扩充要求,基于扩充样本和初始样本集构建训练样本集。
可以理解的是,在本发明任务中,训练数据的采集获取、标注及预处理是耗时耗力的,且训练样本不足容易导致模型泛化能力差,同时影响模型的精度。本发明实施例的扩充样本通过预设的生成对抗网络生成。具体地,本发明采用基于稳健优化的生成对抗网络进行样本生成,进而实现数据扩充。生成对抗网络由两部分组成,生成器G和判别器D。生成器负责产生看似真实的数据,而判别器的任务是区分真实数据和生成器产生的假数据。在本发明中,生成对抗网络被用于生成新的设备数据样本,以增强模型的泛化能力。此外,本发明在生成对抗网络的框架下引入稳健优化策略,以提高生成数据的质量和多样性。稳健优化通过调整生成器的参数,使生成的数据能够更好地覆盖真实数据的分布,尤其是在数据稀疏或不均匀的情况下。同时,为了进一步提高生成数据的质量,本发明在生成对抗网络的训练过程中引入非线性共轭方法,允许生成器在生成新样本时考虑到数据的非线性特性,从而生成更加精确和多样的数据样本。
首先,通过下述步骤进行数据扩充,生成扩充样本:
首先,进行初始化:选择适当的初始参数为生成器和判别器。具体的,在初始化阶段,本发明设定生成器和判别器/>的初始参数,即,设定生成器和判别器的初始权重/>和,具体为,采用小随机数初始化,初始化过程可以表示为:
其中,表示均值为0,方差为/>的正态分布。在一个实施例中,/>被设置为0.01。
进一步地,使用生成器生成扩充样本。其中,在生成数据样本时,本发明实施例应用稳健优化策略,以确保数据样本覆盖真实数据的多种情况。具体的,稳健优化的目标是调整生成器的输出,使其更加多样化并覆盖真实数据的分布,稳健优化的调整可以表示为:
其中,是稳健优化率,/>是真实数据样本,/>是数据样本的总数,/>是平方误差项。在一个实施例中,/>被设置为0.05。
进一步地,平方误差项的计算方式可以表示为:
其中,是每个数据样本的特征数量,/>和/>分别是真实数据和生成数据的第个特征。
其中,为了进一步提高生成数据的质量,本发明实施例基于扩充样本,确定生成对抗网络的梯度,再计算梯度对应的梯度内积项。之后,基于梯度内积项,以及预设的非线性共轭系数,确定生成对抗网络的更新梯度。基于更新梯度,通过生成对抗网络生成更新的扩充样本,以对扩充样本进行调整。
具体地,根据非线性共轭方法调整生成器,使其能够更好地捕捉数据的非线性关系。具体的,非线性共轭方法用于调整生成器的更新方向,可以表示为:
其中,是非线性共轭系数,/>和/>分别是当前和上一步的梯度。在一个实施例中,/>被设置为0.1。进一步地,梯度内积项/>的计算方式可以表示为:
其中,表示权重向量中的元素索引,/>和/>分别是当前和上一步的梯度在第/>个元素上的值。
生成器更新:本发明实施例使用当前判别器的反馈,调整生成器的参数,以产生更加真实的数据样本。具体的,生成器的目标是最大化判别器/>错误地将其生成的数据判断为真实数据的概率,生成器的更新方式可以表示为:
其中,是生成器的学习率,其设置方式为动态自适应设置。/>是生成器的输入噪声,/>表示对生成器权重的梯度。进一步地,梯度/>是通过反向传播算法计算得到的,计算方式可以表示为:
其中,表示对生成器权重的偏导数,通过计算网络中每一层的梯度并应用链式法则得到的。进一步地,生成器的学习率/>动态自适应设置的方式为,根据损失函数的变化趋势(增加或减少)动态调整,以加速学习过程或减少震荡。当损失函数连续几个训练周期内降低时,适度增加学习率以加快收敛;当损失函数上升时,减少学习率以减小震荡。具体的,设/>和/>分别是在时间/>的生成器和判别器的损失函数,学习率的调整可以表示为:
其中,和/>分别表示生成器和判别器损失函数的变化。函数/>返回变化的符号(增加为正,减少为负)。/>是学习率调整因子,控制学习率变化的幅度。在一个实施例中,/>可以设置为0.05。
判别器更新:本发明实施例使用生成的数据和真实数据来训练判别器,以提高其区分能力。具体的,判别器的目标是正确区分真实数据和生成器/>生成的数据,判别器的更新方式可以表示为:
其中,是判别器的学习率,/>是真实数据样本。在一个实施例中,/>被设置为0.001。进一步地,梯度/>的计算方式可以表示为:
其中,表示对判别器权重的偏导数。
收敛检验:重复迭代训练过程,直到达到预设的收敛条件,具体的,收敛检验基于判别器的准确率和损失函数的平衡,收敛条件可以表示为:
其中,和/>分别是当前和上一步的判别器损失,/>是收敛阈值,/>是判别器的准确率。在一个实施例中,/>被设置为0.0001,/>被设置为0.95。
进一步地,判别器损失函数差的计算方式可以表示为:
其中,是样本数量,/>是真实数据样本,/>是生成器生成的样本。
当上述收敛条件满足时,即停止迭代,表示模型训练完成。综上,确定出生成对抗网络的更新梯度,并得到训练好的生成对抗网络,并使用该生成对抗网络训练好的生成器生成新的数据样本,以对扩充样本进行调整,用于扩充原始数据集,构建训练样本集。
本发明实施例使用的特征提取模型是从源域预训练得到的模型迁移到当前任务中的模型,且,特征提取模型的模型参数基于预训练得到的模型参数进行初始化。具体地,本发明采用3层的全连接神经网络进行特征提取,其中,一些方案使用神经网络进行特征提取,在某些神经网络结构中,可能会遇到梯度消失、梯度爆炸或陷入局部最优解的问题,影响训练的稳定性和模型的性能。本发明提出一种基于仿生信息共享优化的神经网络参数优化方法,用于特征提取模型的训练阶段。受启发于在自然界中,某些生物种群通过信息共享来实现群体智能,进而优化适应环境的行为。基于仿生信息共享优化的神经网络参数优化方法采用基于信息共享的优化策略,与传统的梯度下降算法不同,基于仿生信息共享优化的神经网络参数优化方法利用信息共享的方式来优化神经网络参数。每个神经元不再独立地更新权重和偏置,而是共享信息,以协同优化整个网络。该模型为迁移学习得到的模型,图3示出了本发明实施例提供的一种迁移模型的结构示意图。其中,当前任务在迁移学习的角度数据目标域,本发明采用的特征提取模型获取方式为,从源域预训练得到的模型迁移到当前任务中。在一个实施例中,源域可以为与本发明任务不同设备,如,本发明是对采煤机进行设备寿命预测,也即,目标域的样本为采煤机相关的训练样本,而源域的样本为掘进机相关的训练样本,且,预训练模型从源域进行预训练得到。因此,在本发明中,对预训练模型进行初始化时,基于仿生信息共享优化的神经网络参数优化方法不采用随机初始化权重和偏置,而是使用经过预训练的模型参数作为初始值,以加速收敛并提高算法的稳定性。
初始化:使用预训练模型参数初始化神经网络权重和偏置,由于模型为从源域迁移得到的模型,故,预训练的神经网络的初始状态具有一定的性能。具体的,设预训练模型的参数为θ,初始化权重矩阵W的方式可以表示为:;初始化偏置向量b的方式可以表示为:/>;其中,/>表示预训练模型的权重参数,/>表示预训练模型的偏置参数。
此外,本发明结合数据分布、网络拓扑和信息共享策略等多个因素进行损失函数的设计,使算法更适应不同任务和数据集。信息共享策略用于指示特征提取模型的神经元之间进行信息共享和局部协同更新。
2)将训练样本集输入至特征提取模型中,基于预设的信息共享策略确定训练样本集对应的初始输出。
信息共享策略:神经元之间共享信息以协同优,包括信息传递、策略选择和局部协同更新。具体的,在信息共享策略中,引入参数α用于控制信息共享的强度。在一个实施例中,参数α被设置为5。在信息共享时,信息传递的过程使每个神经元i接收来自其他神经元j的信息,其中j≠i。信息传递的方式可以表示为:
其中,表示神经元i接收到的信息,/>表示连接i和j的权重,/>表示神经元j的输出。进一步地,在信息共享策略选择时,根据信息传递结果,选择信息共享策略的方式可以表示为:
其中,表示神经元i选择信息共享策略的概率,α是控制参数。进一步地,在局部协同更新时,使用信息共享策略/>更新神经元i的输出/>,可以表示为:/>。
3)基于初始输出、目标标签和输入数据分布,计算损失函数。
本发明实施例考虑多个因素计算损失函数,如输入数据分布、网络输出和目标标签。具体的,本发明引入参数β用于损失函数的加权。在一个实施例中,参数β被设置为2。对于多元损失函数L,结合多个因素,包括数据分布、网络输出和信息共享策略,损失函数的构建方式可以表示为:
其中,K表示类别数,N表示样本数量,表示第i个样本属于第k个类别的标签,/>表示网络的预测概率。/>是损失函数中信息共享损失的加权参数,在一个实施例中被设置为2。
4)根据损失函数,使用基于仿生信息共享优化的神经网络参数优化方法对特征提取模型的模型参数进行多阶段迭代。
在具体实现时,基于仿生信息共享优化的神经网络参数优化方法分为多个迭代阶段。在每个阶段,进行网络参数的更新和优化。每个阶段的更新策略和步骤根据当前状态和损失函数值进行调整。
本发明实施例使用预设的梯度下降法更新模型参数。其中,梯度下降法的梯度基于信息共享策略和损失函数确定。具体的,在每个阶段的神经网络参数更新时,使用梯度下降法来更新神经网络参数,但是梯度的计算与信息共享策略和损失函数有关,更新方式可以表示为:
其中,t表示迭代次数,表示第t次迭代后的参数,包括权重和偏置。/>表示学习率,/>表示损失函数L的梯度。
进一步地,根据突触可塑性规则更新特征提取模型的神经元连接权重。本发明实施例采用基于突触可塑性的权重调整机制,使神经网络根据输入和输出之间的关系来自动调整连接的强度。具体地,在每次迭代中,根据突触可塑性规则来更新连接权重。突触可塑性的基本规则包括长时程增强和长时程抑制。长时程增强规则表示当两个神经元同时激活时,它们之间的连接权重应该增强,长时程增强的方式可以表示为:
其中,表示权重/>的增量,/>表示长时程增强的学习率,/>和/>分别表示神经元/>和神经元/>的输出。长时程抑制规则表示当一个神经元激活而另一个神经元不激活时,它们之间的连接权重应该减弱,长时程抑制的方式可以表示为:
其中,表示权重/>的减量,/>表示长时程抑制的学习率,/>表示神经元的输出,/>表示神经元/>的输出。
进一步地,综合考虑长时程增强和长时程抑制规则来更新连接权重:
则,最终的权重更新公式为:
其中,表示第/>次迭代后的连接权重,/>表示第/>次迭代后的连接权重。
5)直到损失函数收敛,得到训练好的特征提取模型。
其中,本发明实施例设定停止条件,如达到最大迭代次数或损失函数收敛到预设的阈值。当满足条件时,算法停止。对应的,输出优化后的神经网络模型,其中的参数已经被基于仿生信息共享优化的神经网络参数优化方法算法充分优化,以适应特定任务。
步骤S206,通过预先构建的降维模型对特征向量进行降维处理,得到降维后的特征向量。
本发明实施例的降维模型通过下述步骤构建:
1)获取预设的训练样本集。
在具体实现时,可以通过上述步骤构建训练样本集后构建降维模型。其中,本发明实施例通过特征提取模型对训练样本集进行特征提取后,构建降维模型。之后,使用构建好的降维模型对特征提取后的特征向量进行降维处理,以对目标设备进行寿命预测。
本发明采用改进的稀疏自编码神经网络结构,并结合距离度量学习,以实现更有效的特征降维。传统的自编码器通过一个编码过程将高维数据转换为低维表示,然后通过一个解码过程重构数据。本发明在此基础上引入稀疏性约束,促使模型学习更加有意义和区分性的低维表示。同时,本发明的自编码器结构通过参与度限制来进一步增强稀疏性,在编码过程中,仅有部分神经元被激活,从而使得表示更加集中和有效。此外,为了使降维后的特征更有利于后续的分类任务,本发明融合距离度量学习,通过优化特征空间中样本间的距离度量,以提高不同类别间的区分度。
2)将训练样本集输入至预设的自编码器中,将训练样本集转换为低维特征表示。
首先,初始化自编码器的权重和偏置。在初始化阶段,自编码器的权重和偏置被设置为小的随机值,以打破对称性并开始有效的学习过程,可以表示为:
其中,表示均值为0,方差为/>的正态分布。在一个实施例中,/>被设置为0.01。
进一步地,进行前向传播:输入数据通过编码层转换为低维特征表示,具体的,输入到自编码器的数据通过编码层进行前向传播,转换为低维特征表示/>,也即,/>为编码层输出的低维特征表示,可以表示为:
其中,Sig()是Sigmoid激活函数。
本发明实施例中,自编码器的编码层应用稀疏性约束对训练样本集进行数据转换;且,低维特征表示对应的低维特征空间采用基于特征的距离度量学习方法确定。具体地,本发明实施例在编码层应用稀疏性约束,通过参与度限制确保仅部分神经元被激活,本发明在编码过程中,采用稀疏性约束确保仅部分神经元被激活,可以表示为:
其中,表示Kullback-Leibler散度,/>是目标稀疏度,/>是实际稀疏度,为稀疏函数。在一个实施例中,/>被设置为0.05。
进一步地,Kullback-Leibler散度用于衡量两个概率分布之间差异的指标,也即,用于量化实际稀疏度与目标稀疏度/>之间的差异,其计算方式可以表示为:
其中,是编码层第/>个神经元的平均激活度,通常通过对所有训练样本的激活度求平均来计算。
进一步的,本发明实施例还进行距离度量优化:根据分类任务的需求调整低维特征空间,以优化不同类别间的距离度量。具体的,为了优化不同类别间的距离度量,本发明采用基于特征的距离度量学习方法,可以表示为:
其中,是距离度量损失函数,/>和/>是不同类别的低维特征表示,/>是基于类别的权重因子,用于区分不同类别的重要性。在一个实施例中,/>被设置为类别间的距离的逆。
进一步地,距离度量损失函数通过相似度度量计算得到,计算方式可以表示为:
其中,表示向量点积,/>表示向量的欧几里得范数,/>为用于距离度量学习的标签或类别信息。
3)根据低维特征表示对应的重构误差和距离度量误差,对自编码器的网络参数进行更新,直到满足预设的收敛条件,基于自编码器构建降维模型。
得到低维特征表示后,本发明实施例计算对应的重构误差和距离度量误差。并根据重构误差和距离度量误差,通过反向传播更新网络参数。具体的,通过结合重构误差和距离度量误差对自编码器的网络参数进行更新。本发明实施例通过反向传播更新网络参数,可以表所示为:
其中,是重构误差,/>是学习率。在一个实施例中,/>被设置为0.001。重构误差/>通过均方误差计算得到,距离度量误差/>通过欧式距离计算得到。
进一步地,在反向传播过程中,自编码器的权重和偏置/>的梯度的计算通过链式法则进行,如,权重的梯度可以表示为:
其中,和/>分别是重构损失和距离度量损失对低维特征表示/>的偏导数,/>是低维特征表示对权重的偏导数。
进一步地,重复上述步骤,直至满足收敛条件,基于当前自编码器构建降维模型。基于此,降维后的数据即为低维特征表示,也即降维后的特征向量。
步骤S208,将降维后的特征向量输入至训练好的分类器中,输出初始分类结果。
其中,本发明实施例的分类器基于极限学习机构建。
在具体实现时,本发明实施例利用预设的训练样本集训练分类器,并使用训练好的分类器对降维后的特征向量进行分类,用于预测设备的寿命区间。其中,训练分类器的训练样本集可以通过上述步骤构建,在此不再赘述。本发明实施例将降维后的数据输入到分类器中进行分类器的训练。
其中,本发明采用了基于流形学习的极限学习机算法。在极限学习机的基础上,引入流形学习机制,以更好地捕捉复杂数据分布中的非线性结构。具体地,分类器的训练方法,包括下述步骤:
1)对预设极限学习机的隐层权重和偏置进行初始化。
在具体实现时,本发明实施例随机生成极限学习机的隐层权重和偏置/>,以进行初始化。具体的,隐层权重/>和偏置/>在初始化时被设置为随机值,可以表示为:
其中,表示均值为0,方差为/>的正态分布。在一个实施例中,/>可以设置为0.05。
2)将输入数据映射到隐层,产生非线性特征表示。
其中,非线性特征表示根据预先计算的基于邻近性的正则化项确定,本发明实施例产生非线性特征表示的同时,引入流形学习机制来保留数据的局部拓扑结构,通过对隐层特征施加一个基于邻近性的正则化项,从而鼓励模型保留输入数据在高维空间中的局部几何结构。具体的,输入数据通过隐层进行非线性映射的方式可以表示为:
其中,是ReLU激活函数,/>为极限学习机隐层的输出特征表示,/>为正则化项系数,由人为预设。
进一步地,在计算正则化项时,定义一个加权图/>,其中/>是顶点集,对应于数据点在隐层的表示/>,/>是边集,由数据点的局部邻近性决定。每条边/>都有一个权重/>,反映了顶点/>和/>之间的相似度。权重/>通过高斯核函数计算,可以表示为:
其中,和/>分别是数据点/>和/>在隐层的表示,/>是高斯核的宽度参数。
进一步地,构建图拉普拉斯矩阵,其中/>是权重矩阵,其元素由/>组成,/>是度矩阵,是一个对角矩阵,其每个元素/>是顶点/>的权重和,即/>。/>
进一步地,流形学习的正则化项可以定义为:
其中,为权重;/>是将隐层表示映射到更高维空间的非线性函数,在一个实施例中,采用径向基函数核。该正则化项促使模型保持在隐层表示的高维空间中相似的数据点接近,同时保持不相似的数据点远离,从而在隐层特征空间中保留输入数据的局部和全局流形结构。
进一步地,激活函数的计算方式可以表示为:
3)确定非线性特征表示对应的隐层输出矩阵,并基于隐层输出矩阵,对极限学习机的输出层权重进行优化,直到输出误差最小化,得到训练好的分类器。
在具体实现时,本发明实施例使用最小二乘法或其他优化算法,计算输出层权重。具体的,输出层权重/>通过最小化输出误差得到优化,可以表示为:
其中,是隐层输出矩阵,/>是目标输出矩阵,/>是/>的转置,/>是其逆矩阵。是极限学习机输出层的权重。
对应的,本发明实施例通过上述步骤训练的分类器对降维后的特征向量进行分类,确定初始分类结果。
进一步地,本发明实施例还将分类器结合潜在狄利克雷分配的改进,以增强分类器的性能。具体的,本发明结合潜在狄利克雷分配模型,用于探索和利用特征降维后数据中的隐含主题,从而提高分类的准确性。具体的,通过下述步骤S210-S212确定最终的分类结果。
步骤S210,通过预设的潜在狄利克雷分配模型确定特征向量对应的主题特征。
具体的,本发明实施例利用潜在狄利克雷分配模型在降维后的数据上进行主题建模,提取潜在的分类特征(也即主题特征)。主题特征是从降维后的数据中得到的潜在的数据特征,这些特征与设备寿命的不同阶段或状态相关,这些主题特征可以帮助提高分类器的性能,提高分类精度,从而更准确地预测设备的寿命区间。
对于目标设备的设备运行数据,其降维后的数据是通过预先构建的降维模型降维处理得到的,也即上述特征向量。其中,本发明实施例在训练分类器阶段也对潜在狄利克雷分配模型进行训练,用于确定训练样本集对应的“主题特征”,从而能够快速确定设备运行数据对应的主题特征。
具体的,潜在狄利克雷分配主题模型用于从降维后的数据中提取主题特征,可以表示为:
其中,表示潜在狄利克雷分配模型,/>是主题的数量。在一个实施例中,/>设置为10。/>是潜在狄利克雷分配模型提取的主题特征。
通过该步骤能够得到更丰富和有信息量的特征表示。这可以提高对数据的抽象能力,更好地捕捉数据中的非线性结构信息。
步骤S212,将主题特征和初始分类结果转换为概率分布,得到目标设备对应的寿命预测结果。
进一步地,本发明实施例还对极限学习机输出与潜在狄利克雷分配的输出进行融合,结合极限学习机的输出和潜在狄利克雷分配模型提取的主题特征,进行最终的分类决策,本发明实施例通过将主题特征和初始分类结果转换为概率分布,得到目标设备对应的寿命预测结果。
具体的,最终分类决策通过融合极限学习机的输出和潜在狄利克雷分配模型提取的主题特征来进行,可以表示为:
其中,用于将输出转换为概率分布,便于进行分类。/>是最终的分类决策输出。
步骤S214,确定分类标签所指示的设备寿命阶段,并将设备寿命阶段确定为目标设备的寿命区间预测结果。
在一个实施例中,寿命预测结果包括分类标签。最终的分类决策输出可能包括:初期运行阶段:标签为0;稳定运行阶段:标签为1;衰退期:标签为2;寿命末期:标签为3。
综上,本发明实施例提供的另一种基于迁移学习的设备寿命预测方法,包括以下技术效果:
1、使用生成对抗网络进行数据扩充,并引入稳健优化策略,不仅提高了数据集的多样性,也增强了模型面对实际应用时的泛化能力。
2、仿生信息共享优化的神经网络参数优化方法在全连接神经网络的训练阶段中应用,提高了特征提取的效率和准确性。
3、融合距离度量学习的自编码器,不仅降低了特征维度,还提高了特征的区分度和意义性,为分类任务提供了更加有效的特征表示。
4、基于流形学习的极限学习机与潜在狄利克雷分配结合,结合了极限学习机的高效性和潜在狄利克雷分配的主题模型特性,提高了分类模型在处理复杂数据时的性能。
基于上述创新点,本发明的技术效果包括:
1、通过综合的数据处理和复杂的模型结构,提高了设备寿命预测的准确度。
2、通过数据扩充和高级的特征处理方法,增强了模型对于不同类型设备和条件下的泛化能力。
3、采用信息共享和基于流形学习的优化策略,提高了计算效率,尤其是在大规模数据处理时。
4、由于采用了多种数据类型和模型结构,本发明在适应不同设备和环境条件方面表现出更大的灵活性和适应性。
进一步地,本发明实施例还提供一种基于迁移学习的设备寿命预测装置,图4示出了本发明实施例提供的一种基于迁移学习的设备寿命预测装置的结构示意图,如图4所示,该装置包括:数据获取模块100,用于获取目标设备的设备运行数据;其中,设备运行数据包括目标设备在预设运行环境下的多种设备参数和运行指标;执行模块200,用于将设备运行数据输入至预先构建的寿命区间预测模型中,输出初始分类结果,以及设备运行数据对应的主题特征;寿命区间预测模型基于预先训练好的分类器和潜在狄利克雷分配模型构建;且,用于训练分类器的训练样本集通过预先构建的特征提取模型进行特征提取,并通过预先构建的降维模型进行降维;分类器基于流形学习的极限学习机算法进行训练;基于流形学习的极限学习机算法通过对极限学习机算法的隐层特征施加基于邻近性的正则化项,从而对极限学习机的输出层权重进行优化;数据处理模块300,用于将主题特征和初始分类结果进行融合,得到目标设备对应的寿命预测结果;输出模块400,用于根据寿命预测结果对目标设备的寿命区间进行预测。
本发明实施例提供的一种基于迁移学习的设备寿命预测装置,与上述实施例提供的基于迁移学习的设备寿命预测方法具有相同的技术特征,所以也能解决相同的技术问题,达到相同的技术效果。
进一步地,在上述实施例的基础上,本发明实施例还提供另一种基于迁移学习的设备寿命预测装置,图5示出了本发明实施例提供的另一种基于迁移学习的设备寿命预测装置的结构示意图,其中,寿命预测结果包括分类标签;上述输出模块400,还用于确定分类标签所指示的设备寿命阶段,并将设备寿命阶段确定为目标设备的寿命区间预测结果。
上述执行模块200,还用于通过预先构建的特征提取模型对设备运行数据进行特征提取,确定设备运行数据的特征向量;通过预先构建的降维模型对特征向量进行降维处理,得到降维后的特征向量;将降维后的特征向量输入至训练好的分类器中,输出初始分类结果;通过预设的潜在狄利克雷分配模型确定特征向量对应的主题特征。上述数据处理模块300,还用于将主题特征和初始分类结果转换为概率分布,得到目标设备对应的寿命预测结果。
进一步地,分类器基于极限学习机构建;本发明实施例还包括模型构建模块500,用于对预设极限学习机的隐层权重和偏置进行初始化;将预设的训练样本集输入至极限学习机的隐层中,产生非线性特征表示;非线性特征表示根据预先计算的基于邻近性的正则化项确定;训练样本集是通过预先构建的特征提取与降维模型进行特征提取得到的;确定非线性特征表示对应的隐层输出矩阵,并基于隐层输出矩阵,对极限学习机的输出层权重进行优化,直到输出误差最小化,得到训练好的分类器。
进一步地,上述模型构建模块500,还用于获取预先构建的训练样本集和预设的特征提取模型;特征提取模型是从源域预训练得到的模型迁移到当前任务中的模型,且,特征提取模型的模型参数基于预训练得到的模型参数进行初始化;将训练样本集输入至特征提取模型中,基于预设的信息共享策略确定训练样本集对应的初始输出;信息共享策略用于指示特征提取模型的神经元之间进行信息共享和局部协同更新;基于初始输出、目标标签和输入数据分布,计算损失函数;根据损失函数,使用基于仿生信息共享优化的神经网络参数优化方法对特征提取模型的模型参数进行多阶段迭代;直到损失函数收敛,得到训练好的特征提取模型。
上述模型构建模块500,还用于使用预设的梯度下降法更新模型参数;其中,梯度下降法的梯度基于信息共享策略和损失函数确定;根据突触可塑性规则更新特征提取模型的神经元连接权重。
上述模型构建模块500,还用于获取预设的训练样本集;将训练样本集输入至预设的自编码器中,将训练样本集转换为低维特征表示;其中,自编码器的编码层应用稀疏性约束对训练样本集进行数据转换;且,低维特征表示对应的低维特征空间采用基于特征的距离度量学习方法确定;根据低维特征表示对应的重构误差和距离度量误差,对自编码器的网络参数进行更新,直到满足预设的收敛条件,基于自编码器构建降维模型。
上述模型构建模块500,还用于获取设备的初始训练样本;对初始训练样本进行标注,生成样本标签;基于初始训练样本和样本标签构建初始样本集;使用预设的样本扩充算法对初始样本集进行数据扩充,生成扩充样本;使用非线性共轭方法对扩充样本进行调整,直到满足预设扩充要求,基于扩充样本和初始样本集构建训练样本集。
进一步地,扩充样本通过预设的生成对抗网络生成;上述模型构建模块500,还用于基于扩充样本,确定生成对抗网络的梯度;计算梯度对应的梯度内积项;基于梯度内积项,以及预设的非线性共轭系数,确定生成对抗网络的更新梯度;基于更新梯度,通过生成对抗网络生成更新的扩充样本,以对扩充样本进行调整。
本发明实施例还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述图1至图3所示的方法的步骤。
本发明实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,计算机程序被处理器运行时执行上述图1至图3所示的方法的步骤。本发明实施例还提供了一种电子设备的结构示意图,如图6所示,为该电子设备的结构示意图,其中,该电子设备包括处理器61和存储器60,该存储器60存储有能够被该处理器61执行的计算机可执行指令,该处理器61执行该计算机可执行指令以实现上述图1至图3所示的方法。在图6示出的实施方式中,该电子设备还包括总线62和通信接口63,其中,处理器61、通信接口63和存储器60通过总线62连接。
其中,存储器60可能包含高速随机存取存储器(RAM,Random Access Memory),也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。通过至少一个通信接口63(可以是有线或者无线)实现该系统网元与至少一个其他网元之间的通信连接,可以使用互联网,广域网,本地网,城域网等。总线62可以是ISA(Industry StandardArchitecture,工业标准体系结构)总线、PCI(Peripheral Component Interconnect,外设部件互连标准)总线或EISA(Extended Industry Standard Architecture,扩展工业标准结构)总线等,还可以是AMBA(Advanced Microcontroller Bus Architecture,片上总线的标准)总线,其中,AMBA定义了三种总线,包括APB(Advanced Peripheral Bus)总线、AHB(Advanced High-performance Bus)总线和AXI(Advanced eXtensible Interface)总线。总线62可以分为地址总线、数据总线、控制总线等。为便于表示,图6中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
处理器61可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器61中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器61可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital SignalProcessor,简称DSP)、专用集成电路(Application Specific Integrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器61读取存储器中的信息,结合其硬件完成前述图1至图3任一所示的方法。
本发明实施例所提供的一种基于迁移学习的设备寿命预测方法及装置的计算机程序产品,包括存储了程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行前面方法实施例中所述的方法,具体实现可参见方法实施例,在此不再赘述。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。另外,在本发明实施例的描述中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。最后应说明的是:以上实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种基于迁移学习的设备寿命预测方法,其特征在于,所述方法包括:
获取目标设备的设备运行数据;其中,所述设备运行数据包括所述目标设备在预设运行环境下的多种设备参数和运行指标;
将所述设备运行数据输入至预先构建的寿命区间预测模型中,输出初始分类结果,以及所述设备运行数据对应的主题特征;所述寿命区间预测模型基于预先训练好的分类器和潜在狄利克雷分配模型构建;且,用于训练所述分类器的训练样本集通过预先构建的特征提取模型进行特征提取,并通过预先构建的降维模型进行降维;所述分类器基于流形学习的极限学习机算法进行训练;所述基于流形学习的极限学习机算法通过对极限学习机算法的隐层特征施加基于邻近性的正则化项,从而对极限学习机的输出层权重进行优化;
将所述主题特征和所述初始分类结果进行融合,得到所述目标设备对应的寿命预测结果;
根据所述寿命预测结果对所述目标设备的寿命区间进行预测。
2.根据权利要求1所述的方法,其特征在于,所述寿命预测结果包括分类标签;根据所述寿命预测结果对所述目标设备的寿命区间进行预测的步骤,包括:
确定所述分类标签所指示的设备寿命阶段,并将所述设备寿命阶段确定为所述目标设备的寿命区间预测结果。
3.根据权利要求1所述的方法,其特征在于,将所述设备运行数据输入至预先构建的寿命区间预测模型中,输出初始分类结果,以及所述设备运行数据对应的主题特征;将所述主题特征和所述初始分类结果进行融合,得到所述目标设备对应的寿命预测结果的步骤,包括:
通过预先构建的特征提取模型对所述设备运行数据进行特征提取,确定所述设备运行数据的特征向量;
通过预先构建的降维模型对所述特征向量进行降维处理,得到降维后的特征向量;
将所述降维后的特征向量输入至训练好的分类器中,输出初始分类结果;
通过预设的潜在狄利克雷分配模型确定所述特征向量对应的主题特征;
将所述主题特征和所述初始分类结果转换为概率分布,得到所述目标设备对应的寿命预测结果。
4.根据权利要求3所述的方法,其特征在于,所述分类器基于极限学习机构建;所述分类器的训练方法,包括:
对预设极限学习机的隐层权重和偏置进行初始化;
将预设的训练样本集输入至所述极限学习机的隐层中,产生非线性特征表示;所述训练样本集是通过预先构建的特征提取与降维模型进行特征提取得到的;所述非线性特征表示根据预先计算的基于邻近性的正则化项确定;
确定所述非线性特征表示对应的隐层输出矩阵,并基于所述隐层输出矩阵,对极限学习机的输出层权重进行优化,直到输出误差最小化,得到训练好的分类器。
5.根据权利要求3所述的方法,其特征在于,特征提取模型的构建方法,包括:
获取预先构建的训练样本集和预设的特征提取模型;所述特征提取模型是从源域预训练得到的模型迁移到当前任务中的模型,且,所述特征提取模型的模型参数基于预训练得到的模型参数进行初始化;
将所述训练样本集输入至所述特征提取模型中,基于预设的信息共享策略确定所述训练样本集对应的初始输出;所述信息共享策略用于指示所述特征提取模型的神经元之间进行信息共享和局部协同更新;
基于所述初始输出、目标标签和输入数据分布,计算损失函数;
根据所述损失函数,使用基于仿生信息共享优化的神经网络参数优化方法对所述特征提取模型的模型参数进行多阶段迭代;
直到所述损失函数收敛,得到训练好的特征提取模型。
6.根据权利要求5所述的方法,其特征在于,根据所述损失函数,使用基于仿生信息共享优化的神经网络参数优化方法对所述特征提取模型的模型参数进行多阶段迭代的步骤,包括:
使用预设的梯度下降法更新所述模型参数;其中,所述梯度下降法的梯度基于所述信息共享策略和所述损失函数确定;
根据突触可塑性规则更新所述特征提取模型的神经元连接权重。
7.根据权利要求3所述的方法,其特征在于,所述降维模型的构建方法,包括:
获取预设的训练样本集;
将所述训练样本集输入至预设的自编码器中,将所述训练样本集转换为低维特征表示;其中,所述自编码器的编码层应用稀疏性约束对所述训练样本集进行数据转换;且,所述低维特征表示对应的低维特征空间采用基于特征的距离度量学习方法确定;
根据所述低维特征表示对应的重构误差和距离度量误差,对所述自编码器的网络参数进行更新,直到满足预设的收敛条件,基于所述自编码器构建降维模型。
8.根据权利要求3所述的方法,其特征在于,所述方法还包括:
获取设备的初始训练样本;
对所述初始训练样本进行标注,生成样本标签;
基于所述初始训练样本和所述样本标签构建初始样本集;
使用预设的样本扩充算法对所述初始样本集进行数据扩充,生成扩充样本;
使用非线性共轭方法对所述扩充样本进行调整,直到满足预设扩充要求,基于所述扩充样本和所述初始样本集构建训练样本集。
9.根据权利要求8所述的方法,其特征在于,所述扩充样本通过预设的生成对抗网络生成;
使用非线性共轭方法对所述扩充样本进行调整的步骤,包括:
基于所述扩充样本,确定所述生成对抗网络的梯度;
计算所述梯度对应的梯度内积项;
基于所述梯度内积项,以及预设的非线性共轭系数,确定所述生成对抗网络的更新梯度;
基于所述更新梯度,通过所述生成对抗网络生成更新的扩充样本,以对所述扩充样本进行调整。
10.一种基于迁移学习的设备寿命预测装置,其特征在于,所述装置包括:
数据获取模块,用于获取目标设备的设备运行数据;其中,所述设备运行数据包括所述目标设备在预设运行环境下的多种设备参数和运行指标;
执行模块,用于将所述设备运行数据输入至预先构建的寿命区间预测模型中,输出初始分类结果,以及所述设备运行数据对应的主题特征;所述寿命区间预测模型基于预先训练好的分类器和潜在狄利克雷分配模型构建;且,用于训练所述分类器的训练样本集通过预先构建的特征提取模型进行特征提取,并通过预先构建的降维模型进行降维;所述分类器基于流形学习的极限学习机算法进行训练;所述基于流形学习的极限学习机算法通过对极限学习机算法的隐层特征施加基于邻近性的正则化项,从而对极限学习机的输出层权重进行优化;
数据处理模块,用于将所述主题特征和所述初始分类结果进行融合,得到所述目标设备对应的寿命预测结果;
输出模块,用于根据所述寿命预测结果对所述目标设备的寿命区间进行预测。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410257290.1A CN117851921B (zh) | 2024-03-07 | 2024-03-07 | 基于迁移学习的设备寿命预测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410257290.1A CN117851921B (zh) | 2024-03-07 | 2024-03-07 | 基于迁移学习的设备寿命预测方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117851921A true CN117851921A (zh) | 2024-04-09 |
CN117851921B CN117851921B (zh) | 2024-06-18 |
Family
ID=90540328
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410257290.1A Active CN117851921B (zh) | 2024-03-07 | 2024-03-07 | 基于迁移学习的设备寿命预测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117851921B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113869563A (zh) * | 2021-09-14 | 2021-12-31 | 北京化工大学 | 一种基于故障特征迁移的航空涡扇发动机剩余寿命预测方法 |
WO2023231995A1 (zh) * | 2022-05-30 | 2023-12-07 | 浙大城市学院 | 一种基于迁移学习的航空发动机寿命预测与健康评估方法 |
CN117407797A (zh) * | 2023-12-15 | 2024-01-16 | 山东能源数智云科技有限公司 | 基于增量学习的设备故障诊断方法及模型的构建方法 |
-
2024
- 2024-03-07 CN CN202410257290.1A patent/CN117851921B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113869563A (zh) * | 2021-09-14 | 2021-12-31 | 北京化工大学 | 一种基于故障特征迁移的航空涡扇发动机剩余寿命预测方法 |
WO2023231995A1 (zh) * | 2022-05-30 | 2023-12-07 | 浙大城市学院 | 一种基于迁移学习的航空发动机寿命预测与健康评估方法 |
CN117407797A (zh) * | 2023-12-15 | 2024-01-16 | 山东能源数智云科技有限公司 | 基于增量学习的设备故障诊断方法及模型的构建方法 |
Non-Patent Citations (2)
Title |
---|
ZHAO, WJ等: "A deep learning approach incorporating attention mechanism and transfer learning for lithium-ion battery lifespan prediction", 《JOURNAL OF ENERGY STORAGE》, 31 January 2024 (2024-01-31) * |
陈仁祥;陈思杨;胡小林;董绍江;黄鑫;朱炬锟;: "源域多样本集成GFK的不同工况下滚动轴承寿命状态识别", 振动工程学报, no. 03, 15 June 2020 (2020-06-15) * |
Also Published As
Publication number | Publication date |
---|---|
CN117851921B (zh) | 2024-06-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108197736B (zh) | 一种基于变分自编码器和极限学习机的空气质量预测方法 | |
WO2020008919A1 (ja) | 機械学習装置及び方法 | |
CN108108854A (zh) | 城市路网链路预测方法、系统及存储介质 | |
CN112015863A (zh) | 一种基于图神经网络的多元特征融合中文文本分类方法 | |
CN114332578A (zh) | 图像异常检测模型训练方法、图像异常检测方法和装置 | |
CN115661550B (zh) | 基于生成对抗网络的图数据类别不平衡分类方法及装置 | |
CN110852446A (zh) | 机器学习模型训练方法、装置和计算机可读存储介质 | |
CN117077871B (zh) | 基于大数据的能源需求预测模型的构建方法及装置 | |
JP2011138484A (ja) | マルチレベル分類モデルを構築する方法とシステム | |
Wu et al. | Optimized deep learning framework for water distribution data-driven modeling | |
CN114019370A (zh) | 基于灰度图像和轻量级cnn-svm模型的电机故障检测方法 | |
Ibragimovich et al. | Effective recognition of pollen grains based on parametric adaptation of the image identification model | |
CN108154186B (zh) | 一种模式识别方法和装置 | |
CN114255371A (zh) | 一种基于组件监督网络的小样本图像分类方法 | |
CN117874639B (zh) | 基于人工智能的机械设备寿命预测方法及装置 | |
CN117407781B (zh) | 基于联邦学习的设备故障诊断方法及装置 | |
CN116245259B (zh) | 基于深度特征选择的光伏发电预测方法、装置和电子设备 | |
CN117851921B (zh) | 基于迁移学习的设备寿命预测方法及装置 | |
CN112541530A (zh) | 针对聚类模型的数据预处理方法及装置 | |
CN115564155A (zh) | 一种分散式风电机组功率预测方法及相关设备 | |
CN115438575A (zh) | 一种用于高精度翼型流场预测的分析方法 | |
CN111626376A (zh) | 一种基于判别联合概率的域适配方法及系统 | |
CN117892182B (zh) | 基于人工智能的索具耐用性测试方法及装置 | |
CN118032327A (zh) | 基于人工智能的设备智能润滑监测方法及装置 | |
Balouchi et al. | Graph Representation Learning In A Contrastive Framework For Community Detection |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |