CN116383741A - 基于多源域数据的模型训练方法和跨域分析方法 - Google Patents
基于多源域数据的模型训练方法和跨域分析方法 Download PDFInfo
- Publication number
- CN116383741A CN116383741A CN202310348280.4A CN202310348280A CN116383741A CN 116383741 A CN116383741 A CN 116383741A CN 202310348280 A CN202310348280 A CN 202310348280A CN 116383741 A CN116383741 A CN 116383741A
- Authority
- CN
- China
- Prior art keywords
- data
- fault
- training
- analysis model
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 303
- 238000012549 training Methods 0.000 title claims abstract description 201
- 238000000034 method Methods 0.000 title claims abstract description 115
- 230000006870 function Effects 0.000 claims description 95
- 238000012545 processing Methods 0.000 claims description 63
- 230000008569 process Effects 0.000 claims description 36
- 238000012360 testing method Methods 0.000 claims description 26
- 238000007781 pre-processing Methods 0.000 claims description 22
- 238000003860 storage Methods 0.000 claims description 17
- 230000002159 abnormal effect Effects 0.000 claims description 12
- 238000013434 data augmentation Methods 0.000 claims description 11
- 238000005065 mining Methods 0.000 claims description 10
- 238000010606 normalization Methods 0.000 claims description 8
- 230000000694 effects Effects 0.000 abstract description 13
- 238000004364 calculation method Methods 0.000 description 14
- 238000004519 manufacturing process Methods 0.000 description 9
- 238000005516 engineering process Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 238000000605 extraction Methods 0.000 description 7
- 239000000126 substance Substances 0.000 description 5
- 238000011161 development Methods 0.000 description 4
- 238000009826 distribution Methods 0.000 description 4
- 238000012544 monitoring process Methods 0.000 description 4
- 238000005457 optimization Methods 0.000 description 4
- 230000009467 reduction Effects 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000004088 simulation Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 230000002950 deficient Effects 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 230000003862 health status Effects 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- 238000012614 Monte-Carlo sampling Methods 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 230000001351 cycling effect Effects 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 238000013401 experimental design Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000002203 pretreatment Methods 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000010998 test method Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2431—Multiple classes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
- G06N3/0455—Auto-encoder networks; Encoder-decoder networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/092—Reinforcement learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/0985—Hyperparameter optimisation; Meta-learning; Learning-to-learn
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Test And Diagnosis Of Digital Computers (AREA)
Abstract
本申请提供了一种基于多源域数据的模型训练方法和跨域分析方法。训练方法包括:获取待训练的初始分析模型以及样本数据;基于训练样本对初始分析模型进行迭代训练,直至满足迭代停止条件时停止训练,得到训练完成的目标分析模型;一个迭代轮次的内循环中,确定故障样本数据对应的数据特征以及故障样本标签对应的标签特征,并基于数据特征、标签特征和故障样本标签,确定分析模型在内循环中的第一参数;在外循环中,基于第一参数确定外循环中的第二参数,并基于第二参数对模型参数进行更新,得到当前迭代轮次更新后的分析模型。本申请的方法,达到了提高在新领域下工业设备的故障分析的分析性能的技术效果。
Description
技术领域
本申请涉及工业设备检测技术,尤其涉及一种基于多源域数据的模型训练方法和跨域分析方法。
背景技术
随着工业互联网的不断发展,智能故障分析作为工业智能的重要组成部分,已经在许多领域得到广泛应用。例如,在制造业领域,智能故障分析技术可以通过将生产线上的各种设备连接到互联网上,实现对设备的实时监测和预测性维护,从而提高生产线的运行效率和可靠性。同时,智能故障分析技术还可以应用于能源领域,通过监测和诊断发电机、输电线路等设备的运行状态,提高能源的利用效率和生产效率。在智能故障分析的发展方面已经取得了相当大的进展,这些进展实现了对工业设备健康状态的自动监测。
由于目前工业环境和故障类型越来越复杂,基于现有源域数据对模型进行训练得到的故障分析模型,在遇到新的领域时,为特定场景设计的分析技术可能难以正确地对新领域下的故障进行分析,使得现有的故障分析模型的分析性能下降。
发明内容
本申请提供一种基于多源域数据的模型训练方法和跨域分析方法,用以解决现有技术中对于基于现有源域数据对模型进行训练,但在新领域下基于模型进行故障分析时性能下降的问题,通过在元学习框架中采用内外循环的迭代训练方式对分析模型进行模型训练优化,实现提高在新领域下工业设备故障分析的分析准确性,达到了提高故障分析性能的技术效果。
一方面,本申请提供一种基于多源域数据的故障分析模型训练方法,所述分析模型设置于元学习框架中,包括:
获取待训练的初始分析模型以及,获取用于对所述初始分析模型进行训练的样本数据;其中,所述样本数据包括训练样本和测试样本;所述训练样本包括多个源域的工业设备在多种设备工作环境下的故障样本数据,以及各所述故障样本数据分别对应的故障样本标签;
在所述元学习框架中基于所述训练样本对所述初始分析模型进行迭代训练,直至满足迭代停止条件时停止训练,得到训练完成的目标分析模型;
其中,一个迭代轮次的训练过程包括内外两个循环;
在内循环中,确定所述故障样本数据对应的数据特征以及,确定所述故障样本标签对应的标签特征,并基于所述数据特征、所述标签特征和所述故障样本标签,确定所述初始分析模型在所述内循环中的第一更新梯度参数;
在外循环中,基于所述第一更新梯度参数确定所述外循环中的第二更新梯度参数,并基于所述第一更新梯度参数和所述第二更新梯度参数对所述初始分析模型的模型参数进行更新,得到当前迭代轮次更新后的分析模型。
可选的,所述确定所述故障样本数据对应的数据特征以及,确定所述故障样本标签对应的标签特征,包括:
将各所述故障样本数据输入至所述初始分析模型,得到所述初始分析模型输出的各所述数据特征;
获取所述元学习框架中预先训练好的编码器,并将所述故障样本标签输入至所述编码器,得到所述编码器输出的标签特征。
可选的,所述基于所述数据特征、所述标签特征和所述故障样本标签,确定所述分析模型在所述内循环中的更新梯度参数,包括:
获取所述元学习框架中预先训练好的解码器,各将所述故障样本数据输入至所述解码器,得到所述解码器输出的故障预测标签;
基于各所述数据特征、各所述样本特征、各所述故障样本标签和各所述故障预测标签生成所述初始分析模型在所述内循环中的第一损失函数;
基于所述第一损失函数确定所述初始分析模型在所述内循环中的第一更新梯度参数。
可选的,所述基于各所述数据特征、各所述样本特征、各所述故障样本标签和各所述故障预测标签生成所述初始分析模型在所述内循环中的第一损失函数,包括:
基于各所述数据特征和各所述样本特征生成所述初始分析模型在所述内循环中的特征损失函数;
基于各所述故障样本标签和各所述故障预测标签生成所述初始分析模型在所述内循环中的标签损失函数;
获取所述元学习框架中的经验风险损失函数和梯度内积损失函数;
基于所述特征损失函数、所述标签损失函数、所述经验风险损失函数以及所述梯度内积损失函数生成所述初始分析模型在所述内循环中的第一损失函数。
可选的,所述故障样本标签包括各所述工业设备的设备故障类型;
在所述获取用于对所述初始分析模型进行训练的样本数据之后,所述方法还包括:
对各所述故障样本标签进行标签归一化处理,得到归一化处理后的各故障样本标签;
对各所述故障样本数据进行数据预处理,得到预处理后的故障样本数据;其中,所述预处理包括数据增广、数据信息挖掘以及异常数据处理中的至少一项。
可选的,所述基于所述第一更新梯度参数确定所述外循环中的第二更新梯度参数,包括:
基于预设的处理函数对所述第一更新梯度参数进行处理,得到处理后的估计梯度参数;
基于所述第一更新梯度参数和所述估计梯度参数生成所述初始分析模型在所述外循环中的第二损失函数;
基于所述第二损失函数确定所述分析模型在当前迭代轮次的第二更新梯度参数。
可选的,所述方法还包括:
在所述分析模型停止训练后,基于所述元学习框架得到所述测试样本对应的测试故障标签,并基于所述测试过程确定所述当前元学习框架中的冗余处理模块;
对所述元学习框架中的所述冗余模块进行剔除处理,得到处理后的元学习框架。
另一方面,本申请还提供一种工业设备的故障分析方法,应用于元学习框架,所述元学习框架包括训练完成的目标分析模型和解码器;包括:获取任一源域的待检测工业设备在任一设备工作环境下的设备数据;
将所述设备数据输入至所述目标分析模型,得到所述目标分析模型输出的预测数据特征,并将所述预测数据特征输入至所述解码器,得到所述解码器输出的预测故障类型;其中,所述目标分析模型为通过任一项实施方式所述的训练方法训练得到的目标分析模型。
可选的,在获取所述设备数据之后,还包括:
对所述设备数据进行数据预处理,得到预处理后的设备数据;其中,所述预处理包括数据增广、数据信息挖掘以及异常数据处理中的至少一项。
另一方面,本申请还提供一种基于多源域数据的故障分析模型训练装置,所述分析模型设置于元学习框架中,包括:
模型和数据获取模块,用于获取待训练的初始分析模型以及,获取用于对所述初始分析模型进行训练的样本数据;其中,所述样本数据包括训练样本和测试样本;所述训练样本包括多个源域的工业设备在多种设备工作环境下的故障样本数据,以及各所述故障样本数据分别对应的故障样本标签;
模型训练模块,用于在所述元学习框架中基于所述训练样本对所述初始分析模型进行迭代训练,直至满足迭代停止条件时停止训练,得到训练完成的目标分析模型;
其中,一个迭代轮次的训练过程包括内外两个循环;
在内循环中,确定所述故障样本数据对应的数据特征以及,确定所述故障样本标签对应的标签特征,并基于所述数据特征、所述标签特征和所述故障样本标签,确定所述初始分析模型在所述内循环中的第一更新梯度参数;
在外循环中,基于所述第一更新梯度参数确定所述外循环中的第二更新梯度参数,并基于所述第一更新梯度参数和所述第二更新梯度参数对所述初始分析模型的模型参数进行更新,得到当前迭代轮次更新后的分析模型。
另一方面,本申请还提供一种工业设备的故障分析装置,应用于元学习框架,所述元学习框架包括训练完成的目标分析模型和解码器;包括:
设备数据获取模块,用于获取任一源域的待检测工业设备在任一设备工作环境下的设备数据;
故障类型预测模块,用于将所述设备数据输入至所述目标分析模型,得到所述目标分析模型输出的预测数据特征,并将所述预测数据特征输入至所述解码器,得到所述解码器输出的预测故障类型。
另一方面,本申请还提供一种电子设备,包括:存储器,处理器;
存储器;用于存储所述处理器可执行指令的存储器;
其中,所述处理器执行所述存储器存储的可执行指令,以实现如任一实施方式所述的基于多源域数据的故障分析模型训练方法;或者,如任一实施方式所述的工业设备的故障分析方法。
另一方面,本申请还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如任一项实施方式所述的基于多源域数据的故障分析模型训练方法;或者,如任一项实施方式所述的工业设备的故障分析方法。
本申请提供的技术方案,通过在元学习框架中采用双层循环对分析模型进行训练,具体在内循环中对训练样本进行处理后进行语义匹配,实现通过少量样本进行训练得到在多个源域内具有分析泛化能力的分析模型;以及在外循环中通过对内循环得到的梯度信息进行对齐处理,并基于处理后的梯度信息对模型进行更新,实现得到在任一源域内具备良好分析性能的分析模型,解决现有技术中对于新工况下的故障分析性能下降的问题,实现提高在新工况下进行故障分析的分析准确性,从而达到提高故障分析性能的技术效果。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
图1为本申请提供的基于多源域数据的故障分析模型训练方法的应用场景图;
图2为本申请根据一示例性实施例提供的基于多源域数据的故障分析模型训练方法的流程示意图;
图3为本申请根据另一示例性实施例提供的基于多源域数据的故障分析模型训练方法的流程示意图;
图4为本申请根据另一示例性实施例提供的基于多源域数据的故障分析模型训练方法的流程示意图;
图5为本申请根据另一示例性实施例提供的基于多源域数据的故障分析模型训练方法的流程示意图;
图6为本申请根据一示例性实施例提供的工业设备的故障分析方法的流程示意图;
图7为本申请根据一示例性实施例提供的基于多源域数据的故障分析模型训练装置的结构示意图;
图8为本申请根据一示例性实施例提供的工业设备的故障分析装置的结构示意图;
图9为本申请实施例提供的一种电子设备的结构示意图。
通过上述附图,已示出本申请明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本申请构思的范围,而是通过参考特定实施例为本领域技术人员说明本申请的概念。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
机器设备的故障分析对机器设备的安全运行和高效工作起着重要作用。随着深度学习技术的迅速发展,智能故障分析的发展已经取得了相当大的进展,这些进展实现了对工业设备健康状态的自动监测。由于目前工业环境和故障类型越来越复杂,现有的故障分析技术还面临着两大待解决的技术问题:1)针对特定领域的现有技术中的分析模型具备较差的泛化能力,难以推广。具体的,当前的设备故障的分析模型主要针对特定工业领域开发,例如,航空、化工制造、消防等。由于每个工业领域的工作环境和故障类型都不同,因此针对特定工业领域的开发的分析模型难以推广到其他工业领域;2)在对于分析模型进行开发训练的过程中,处理低资源和异构数据的能力有限。现有的故障分析模型都需要大量的样本数据进行训练,以便得到的分析模型具备良好的分析性能,可以正确地分析故障。然而,在实际应用中,故障样本数据往往是低资源和异构的,这会使得训练出的故障分析模型的性能下降,难以正确地分析故障。
本申请的技术构思是:针对于第一个问题,发明人在对现有分析模型进行研究后发现,现有的故障分析模型中存在相关性偏移的问题,即只有在训练数据和测试数据遵循相同的分布时,这些基于复杂的深度学习训练得到的分析模型才能保持高性能。否则,这些分析模型的性能可能会大幅下降。不可避免地,大多数当前的故障分析模型都处于这种困境中,这严重限制了其在实际应用中的泛化能力。例如,用于训练和测试的收集传感器数据可能在实际工业环境中的各种工作环境下收集。由于人工修改操作参数或工业设备的自然恶化引起的工作环境的轻微变化,因此会影响设备状态传感器数据的分布。进一步的,由于数据分布的轻微偏移,即使故障分析的故障类别仍然保持不变,故障分析在新的工作环境下可能会失败。领域偏移现象在工业环境中经常发生,很难始终遵循相同的分布假设。并且,重新收集和标记来自新工作环境的训练样本,然后重新训练故障分析模型是昂贵甚至不可行和不切实际的。因此,赋予故障分析模型消除领域偏移的影响,并在未知数据领域中进行泛化对于工业设备故障的分析至关重要。
针对于第二个问题,发明人在对现有分析模型进行研究后发现,现有分析技术所面临的普遍挑战是遇到实际工业场景时的低资源和异构数据问题。低资源来源于复杂工业环境中稀缺的样本收集。例如,在故障分析场景中,有缺陷的设备状态数据甚至很难采样,因为存在损坏整个设备的风险。因此,在特定工作环境下收集足够的有缺陷的数据具有很大的挑战性。如何使用有限的异构数据训练具有令人满意的性能和泛化能力的故障分析模型,在新的工作环境下进行故障分析是现阶段所关注的问题。
发明人在进一步研究过程中发现,解决低资源问题的一种方法是可以利用具有不同工作环境的多个相关数据集为训练数据,基于此进行训练,得到提高泛化能力的分析模型。然而,由于没有统一的标记标准,相关数据集分别拥有自己的不同标签,这会形成异构问题,从而难以共同优化训练分析模型,基于此低资源问题陷入了僵局,即在各种工作环境下训练具有令人满意的性能和泛化能力的深度学习模型需要大量的训练数据。
为了解决上述技术问题,本申请实施例中构建了一个具有领域泛化(DomainGeneralization)技术的通用框架,使用于工业设备故障分析的分析模型在未知领域的工作环境下得以很好地泛化。具体的,提出了一种基于模型不可知的元学习(Meta Learning)框架Meta-GENE,基于元学习框架采用双层优化循环对分析模型训练,在上述循环中在内循环集成语义匹配算法,通过对异构数据的语义进行匹配实现在样本数据量少情况下也可以进行训练,得到性能良好的分析模型;在外循环中集成梯度对其算法来学习领域不变策略,以使训练得到的分析模型在未知的工作环境下也可以准确地得到故障分析结果。
图1为本申请提供的基于多源域数据的故障分析模型训练方法的应用场景图。如图1所示,本申请的执行主体可以是任意具备计算能力的电子设备,例如服务器等。该电子设备可以部署在本地也可以部署在云端,本申请不对其进行限定。具体的,以执行主体是电子设备为例,在电子设备中部署有双层循环层的元学习框架,在训练过程中首先将初始分析模型设置于元学习框架中的外循环中,并将模型参数复制到内循环中,得到具有相同结构的初始分析模型,基于获取到的训练样本在内循环中对初始分析模型进行仿真训练,具体可以包括对分别对故障样本数据和故障样本标进行特征提取,得到对应的数据特征和标签特征,为了使训练出的分析模型具备良好的分析性能以及还具备对各源域故障进行分析的泛化能力,还基于故障样本数据进行标签预测,得到故障预测标签,进而基于数据特征、标签特征,故障样本标签和故障预测标签进行语义匹配处理,基于匹配结果得到内循环仿真训练的更新梯度参数,并将该更新梯度参数输出至外循环;在外循环中,为了使训练出的分析模型在任一源域内都具备更好的分析性能,对得到的更新梯度参数进行对齐处理,并基于对齐处理后的梯度更新参数在外循环中对初始分析模型的模型参数进行更新,得到更新后的分析模型。进一步的,将更新后的分析模型的模型参数复制到内循环中重复进行下一迭代轮次的训练,直至满足迭代停止条件,停止迭代训练,得到元学习框架中训练完成的目标分析模型。进一步的,对训练完成后的元学习框架进行冗余处理模块精简,得到精简后的模型,基于精简后的元学习框架进行故障分析,可以提高分析效率。
值得注意的是,本申请实施例中的分析模型可以是任意神经网络结构,本申请不对分析模型的模型结构进行限定。
下面以执行主体是电子设备为例,通过具体地实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本申请的实施例进行描述。
图2为本申请根据一示例性实施例提供的基于多源域数据的故障分析模型训练方法的流程示意图。如图2所示,该训练方法包括如下步骤:
S210、获取待训练的初始分析模型以及,获取用于对初始分析模型进行训练的样本数据。
在本申请实施例中,初始分析模型可以是未经过训练的神经网络模型,当然还可以是现有完成训练的分析模型。可选的,若初始分析模型是未经训练的神经网络模型,则模型参数可以是网络模型的初始化参数;若初始分析模型是现有的分析模型,则模型参数可以是经过优化后的模型参数,对于本实施例中分析模型的模型状态以及模型参数不作限定。
需要说明的是,本实施例中样本数据包括训练样本和测试样本。训练样本包括多个源域的工业设备在多种设备工作环境下的故障样本数据,以及各故障样本数据分别对应的故障样本标签。其中,源域可以理解为样本数据来源的领域。例如,航空、化工制造、消防等。工业设备可以理解为用在生产经营过程中的工业产品。具体的,设备可以包括通用设备和专用设备。通用设备可以包括机械设备、电气设备、特种设备、办公设备、运输车辆、仪器仪表、计算机及网络设备等;专用设备可以包括矿山专用设备、化工专用设备、航空航天专用设备、消防专用设备等。设备工作环境可以理解为设备工作时所处的环境。例如工作温度、工作湿度以及设备在当前工作时刻下设备的健康状态等。故障样本数据可以理解为设备处于故障时的设备状态数据,例如,电机数据、温度数据、油量数据以及仪表显示数据等。故障样本标签可以理解为设备的故障类型。
需要说明的是,由于本申请实施例中的采集得到的样本数据是多源域的工业设备的故障数据,因为不同领域的设备以及同一领域的不同设备包括多种类型的设备状数据,对应的也会包括多种类型的故障。在此基础上,本申请实施例中获取到的故障样本数据和故障样本标签均为异构数据。换言之,还可以理解为上述样本数据中的各数据根据类型的不同,对应的数据表现形式也不同。
具体的,本申请中的初始分析模型可以是通过读取电子设备中预设的数据库中的模型数据,并对获取到的模型数据进行构建所得到。获取样本数据的方法可以是通过各领域中的工业设备对应的设备数据采集传感器对设备故障时的设备状态数据进行采集,并对采集后到设备状态数据进行故障分类标记所得到。可选的,获取样本数据的方法还可以是通过读取电子设备中预设的数据库中已经标记好的设备状态数据所得到。当然,上述获取初始分析模型和样本数据的方法只是对本申请技术方案的示例性介绍,并不是作为对本申请技术方案的限定,本申请实施例对于上述获取方法不做限定。
S220、在元学习框架中基于训练样本对初始分析模型进行迭代训练,直至满足迭代停止条件时停止训练,得到训练完成的目标分析模型。
在本申请实施例中,一个迭代轮次的训练过程包括内外两个循环。具体的,在内循环中,确定故障样本数据对应的数据特征以及,确定故障样本标签对应的标签特征,并基于数据特征、标签特征和故障样本标签,确定初始分析模型在内循环中的第一更新梯度参数。在外循环中,基于第一更新梯度参数确定外循环中的第二更新梯度参数,并基于第一更新梯度参数和第二更新梯度参数对初始分析模型的模型参数进行更新,得到当前迭代轮次更新后的分析模型。
在本申请实施例的训练的过程中,在元学习框架中采用内外两个循环同时进行迭代训练。具体的,在当前次的迭代训练过程中,首先获取初始分析模型并进入外循环,其次,复制初始分析模型进入内循环,在内循环中分别对获取到的训练样本中的故障样本数据和故障样本标签进行特征提取,得到数据特征和标签特征,并基于得到的数据特征、标签特征和故障样本标签进行匹配处理,上述匹配处理分别通过对高维空间中的语义信息进行匹配和低维空间中的语义信息进行匹配,基于更多的匹配信息可以实现在少量多源域异构数据样本的情况下训练模型得到在多个源域内具有分析泛化能力且具备良好分析性能的分析模型,基于上述匹配处理的结果得到内循环中的第一更新梯度参数,至此结束当前迭代轮次的内循环,并将得到的第一更新梯度参数输出至当前迭代轮次的外循环中,在外循环中实现初始分析模型的模型参数更新。具体的,在当前迭代轮次的外循环中,对内循环输出的第一更新梯度参数进行梯度对齐处理,实现得到在任一源域内具备良好分析性能的分析模型,基于上述对齐处理结果确定第一更新梯度参数对应的第二更新梯度参数,并基于第一更新梯度参数和第二更新梯度参数共同实现在外循环中对初始分析模型的模型参数进行更新,得到更新后的分析模型,实现对初始分析模型一个迭代轮次的更新。进一步的,将更新后的分析模型作为下一迭代轮次的初始分析模型进行下一迭代轮次的更新,直至满足迭代停止条件时停止训练,得到训练完成的目标分析模型。
需要说明的是,本申请实施例中迭代停止条件可以包括迭代循环的循环次数满足预设次数;还可以包括第二更新梯度参数的数值趋于零。当然,还可以是其他迭代停止条件,本申请对于迭代停止条件不进行具体限定。
在上述技术方案中,通过在元学习框架中采用双层循环对分析模型进行训练,具体在内循环中对训练样本进行处理后进行多维度的语义匹配,实现通过少量多源异构的训练样本进行训练得到在多个源域内具有分析泛化能力且具备良好分析性能的分析模型;以及在外循环中通过对内循环得到的梯度信息进行对齐处理,并基于处理后的梯度信息对模型进行更新,实现得到在任一源域内具备良好分析性能的分析模型,解决现有技术中对于新工况下的故障分析性能下降的问题,实现提高在新工况下进行故障分析的分析准确性,从而达到提高故障分析性能的技术效果。
图3为本申请根据另一示例性实施例提供的基于多源域数据的故障分析模型训练方法的流程示意图。参见图3,本实施例可理解为上述实施例介绍的方法中提及步骤的具体化介绍实施例,具体可以包括:
S310、获取待训练的初始分析模型以及,获取用于对初始分析模型进行训练的样本数据。
其中,样本数据包括训练样本和测试样本;训练样本包括多个源域的工业设备在多种设备工作环境下的故障样本数据,以及各故障样本数据分别对应的故障样本标签。
具体的,对步骤S310中技术手段、技术效果、技术名词的理解与举例,可参照上述实施例中对步骤S210的解释,本实施例中不再进行赘述。
S320、在元学习框架中基于训练样本对初始分析模型进行迭代训练,直至满足迭代停止条件时停止训练,得到训练完成的目标分析模型。
其中,一个迭代轮次的训练过程包括内外两个循环。在内循环中,确定故障样本数据对应的数据特征以及,确定故障样本标签对应的标签特征,并基于数据特征、标签特征和故障样本标签,确定初始分析模型在内循环中的第一更新梯度参数。在外循环中,基于第一更新梯度参数确定外循环中的第二更新梯度参数,并基于第一更新梯度参数和第二更新梯度参数对初始分析模型的模型参数进行更新,得到当前迭代轮次更新后的分析模型。
对步骤320中技术手段、技术效果、技术名词的理解与举例,可参照上述实施例中对步骤S220的解释。
在上述实施方式的基础上,在本实施例中,步骤S320中内循环的步骤中具体可以包括:
S321、将各故障样本数据输入至初始分析模型,得到初始分析模型输出的各数据特征。
在本申请实施例中,在获取到训练样本中的故障样本数据的情况下,将故障样本数据输入进复制到内循环中的初始分析模型中。该初始分析模型对故障样本数据进行特征提取处理,并输出处理后的数据特征。其中,数据特征的表现形式为特征向量。
在一些其他可选实施例中,输入至分析模型的故障样本数据可以是进行数据预处理后的数据,从而可以使后续训练得到的分析模型的性能更优。
在上述技术方案中,通过初始分析模型对故障样本数据进行特征提取,得到对应的数据特征,实现了将训练样本中的故障样本数据成功映射到高维的语义空间中,从而可以减小多源异构数据之间的语义差异,后续基于特征进行高维语义的匹配,实现异构数据的联合训练。
S322、获取元学习框架中预先训练好的编码器,并将故障样本标签输入至编码器,得到编码器输出的标签特征。
在本申请实施例中,在获取到训练样本中的故障样本标签的情况下,将故障样本标签输入至预设的编码模型中进行特征提取。编码器通过对故障样本标签进行标签编码,并输出编码后的标签特征。其中,编码特征的表现形式为特征向量。
在一些其他可选实施例中,输入至分析模型的故障样本标签可以是进行标签归一化后的数据,从而可以使后续训练得到的分析模型的性能更优。
在上述技术方案中,通过预设的编码器对故障样本标签进行特征提取,得到对应的标签特征,实现了将训练样本中的故障样本标签成功映射到高维的语义空间中,从而可以减小多源异构数据之间的语义差异,后续基于特征进行高维语义的匹配,实现异构数据的联合训练。
S323、获取元学习框架中预先训练好的解码器,各将故障样本数据输入至解码器,得到解码器输出的故障预测标签。
为了更有效利用有限数据量的训练样本进行模型训练,在本申请实施例可以通过对故障样本数据进行标签预测,基于得到的故障预测标签作为新的标签信息,与训练样本中的故障样本标签进行标签层次的语义匹配,得到用于模型更新的更新梯度参数,从而使后续基更新梯度参数迭代更新训练得到的目标分析模型具有更好的推广性能和泛化能力。
具体的,在元学习框架中可以预先设置训练好的解码器,将故障样本输入至解码器中进行标签预测。解码器通过对故障样本数据进行解码,得到对应的故障预测标签,进一步的可以基于得到的故障预测标签进行后续的语义匹配。
S324、基于各数据特征、各样本特征、各故障样本标签和各故障预测标签生成初始分析模型在内循环中的第一损失函数。
在本申请实施例中,在获取到样本数据映射到高维的语义空间中的样本特征的情况下,基于高维的样本特征进行高维语义匹配,基于标签进行低维语义匹配,并基于匹配结果生成初始分析模型在内循环中的第一损失函数。
可选的,在一种可选实施方式中,进行语义匹配生成第一损失函数的过程可以包括:基于各数据特征和各样本特征生成初始分析模型在内循环中的特征损失函数;基于各故障样本标签和各故障预测标签生成初始分析模型在内循环中的标签损失函数;获取元学习框架中的经验风险损失函数和梯度内积损失函数;基于特征损失函数、标签损失函数、经验风险损失函数以及梯度内积损失函数生成初始分析模型在内循环中的第一损失函数。
在传统的学习范式中,样本标签通常被用来指导模型训练和纠正偏转预测,其中样本标签是固定的,优化过程是单向的。在本申请的语义匹配方式中,利用由编码器生成的标签特征来进行模型训练。在得到样本数据对应的数据特征的情况下,为了保持标签特征和数据特征的一致性,将上述两种特征对齐处理。具体可以是通过对数据特征和标签特征进行高维语义匹配,基于匹配结果得到对应的特征损失函数。具体的,可以通过计算数据特征和标签特征之间的特征距离,将距离计算结果作为特征损失函数。在一种可选实施方式中,可以通过预设的距离计算公式计算上述特征距离。示例性的,预设的距离计算公式可以如下述表达式所示:
其中,Θe表示编码器参数;Θf表示初始分析模型参数;表示特征损失函数;S表示训练集中源域的数量;||DS||表示任意源域中的训练样本;mse表示均方误差,是测量距离的标准;l表示故障样本标签;f表示故障样本数据。
在本申请实施例中,可以通过对故障样本标签和故障预测标签进行低维的语义匹配,基于匹配结果得到对应的标签损失函数。具体的,可以通过计故障样本标签和故障预测标签之间的标签距离,将距离计算结果作为标签损失函数。在一种可选实施方式中,可以通过预设的距离计算公式计算上述标签距离。示例性的,预设的距离计算公式可如下述表达式所示:
其中,Θe表示编码器参数;Θd表示解码器参数;表示标签损失函数;S表示训练集中源域的数量;||DS||表示任一源域的训练样本;mse表示均方误差,是测量距离的标准;l表示故障样本标签;/>表示故障预测标签。
由于上述语义匹配是在元学习框架中进行处理,所以框架会自动生成元学习框架的自带损失函数,具体包括经验风险损失函数以及梯度内积损失函数。
在上述实施方式的基础上,可以对上述各损失函数进行处理,以得到第一损失函数。具体的,可以通过预设的损失函数计算表达式对上述各损失函数进行计算,得到第一损失函数。示例性的,损失函数计算表达式可以如下述所示:
S325、基于第一损失函数确定初始分析模型在内循环中的第一更新梯度参数。
在本申请实施例中,在计算得到第一损失函数的情况下,通过预设的计算方式对第一损失函数进行计算,得到初始分析模型在内循环中可以用于进行模型参数更新的第一更新梯度参数。
在上述基础上,在本实施例中,步骤S30中外循环的步骤具体可以包括:
S326、基于预设的处理函数对第一更新梯度参数进行处理,得到处理后的估计梯度参数。
一般来说,每个唯一的源域都有自己的最快参数搜索的最优方向,这是单源域训练场景的捷径。如果在训练多个源域时,这些最优方向相互偏转,则模型可能不能适当地收敛,甚至不能说在其他的域中可以很好地推广。因此需要设置一个约束条件,使来调节模型学习的方向,使其朝着最优方向学习,从而得到性能良好的训练模型。
在本申请实施例中,基于上述实施方式,在获取到内循环中输出的第一更新梯度参数的情况下,对第一更新梯度参数进行梯度估计处理,得到对应的估计梯度参数。具体的,可以采用随机函数梯度估计,例如变分推断,即一种常见的近似贝叶斯推断方法,强化学习中的策略梯度算法,实验设计中的贝叶斯优化和主动学习方法等,当然还可以是基于蒙特卡洛采样的函数进行梯度估计,得到估计梯度参数。
S327、基于第一更新梯度参数和估计梯度参数生成初始分析模型在外循环中的第二损失函数。
在本申请实施例中,通过获取初始分析模型的模型参数,基于模型参数确定元学习框架中的经验风险损失,以及基于第一更新梯度参数和估计梯度参数确定元学习框架中的梯度内积损失,进而基于经验风险损失和梯度内积损失确定初始分析模型在外循环中的第二损失函数。
在一些实施方式中,第二损失函数可以预设的损失函数计算表达式进行计算所得到。示例性的,预设的损失函数计算表达式可以如下述表示所示:
其中,表示第二损失函数,即最小化梯度对齐损失;S表示源域的数量;Dtr表示任一源域的训练样本;β表示学习率;gi表示第一更新梯度参数;gj表示梯度估计参数;表示经验风险损失函数;/>表示梯度内积损失函数。
需要说明的是,可以将第二损失函数设置为上述实施方式中设置的约束条件。具体的,通过将元学习框架中现有损失的损失项重新分级为具有平衡权重β的额外优化对象,从而制定了对象。进一步的,通过最小化梯度对齐损失/>得到对初始分析模型的模型参数进行更新。可选的,最小化梯度对齐损失/>可以等于最小化/>和最大化/>
S328、基于第二损失函数确定分析模型在当前迭代轮次的第二更新梯度参数。
在本申请实施例中,在计算得到第二损失函数的情况下,通过预设的计算方式对第二损失函数进行计算,得到初始分析模型在外循环中可以用于进行模型参数更新的第二更新梯度参数。
进一步的,通过第二更新梯度参数在外循环中对初始分析模型的模型参数进行更新,即可以得到当前迭代轮次更新后的分析模型。
在上述技术方案中,具体在内循环中对训练样本进行处理后进行语义匹配,实现通过少量样本进行训练得到在多个源域内具有分析泛化能力的分析模型;以及在外循环中通过对内循环得到的梯度信息进行对齐处理,并基于处理后的梯度信息对模型进行更新,实现得到在任一源域内具备良好分析性能的分析模型,解决现有技术中对于新工况下的故障分析性能下降的问题,实现提高在新工况下进行故障分析的分析准确性,从而达到提高故障分析性能的技术效果。
图4为本申请根据另一示例性实施例提供的基于多源域数据的故障分析模型训练方法的流程示意图。本实施例可理解为在上述各实施例的基础上,对申请技术方案进行扩展的扩展实施例,参见图4,本实施例的方法具体可以包括:
S410、获取待训练的初始分析模型以及,获取用于对初始分析模型进行训练的样本数据。
其中,样本数据包括训练样本和测试样本;训练样本包括多个源域的工业设备在多种设备工作环境下的故障样本数据,以及各故障样本数据分别对应的故障样本标签。
具体的,对步骤S410中技术手段、技术效果、技术名词的理解与举例,可参照上述实施例中对步骤S210的解释,本实施例中不再进行赘述。
S420、对各故障样本标签进行标签归一化处理,得到归一化处理后的各故障样本标签。
在本申请实施例中,由于获取到的故障样本标签包括多个源域的不同故障类型的异构数据。例如,在第一个源域中,设备故障的故障类型包括8个类型,其标签表形式为故障1、故障2、故障3……、故障7以及故障8;对于第二个源域中,设备故障的类型可能仅包括6个类型,其标签表现形式可能是故障a、故障b……、故障e和故障f。在对上述两个源域中的标签进行特征提取时,若输入至同一编码器中,可能会导致编码器不能识别所有的标签,导致提取到的特征存在特征不准确以及特征信息少等问题;可选的,若分别将不同源域的标签分别输入至多个编码器中,则需要预先在元学习框架设置多个编码器,会造成过多占用所在设备的存储空间,从而导致存在降低设备的计算效率的问题。基于上述情况,本申请实施例中可以预先对故障样本标签进行归一化处理,将上述不同表现形式的故障样本标签进行转换,得到同一表现形式的各故障样本标签。
具体的,可以将训练样本中的故障样本标签输入至预设的标签编码集中,得到编码集输出的标签形式统一的各故障样本标签。示例性的,可以是将故障样本标签输入至一个简单的标签编码集中,得到编码后的one-hot标签集,以实现标签表现形式的统一。当然,还可以基于其他标签转换方式对标签进行形式转换,得到转换后形式统一的故障样本标签,本实施例对此不进行具体限定。
S430、对各故障样本数据进行数据预处理,得到预处理后的故障样本数据。
在实际应用中,由于存在故障的设备状态数据很难采样,因为存在损坏整个设备的风险,并且是对各源域的数据进行采样,所以得到的设备状态数据为异构数据,因此在对分析模型的训练中会存在数据异构且数据量少的问题,如何使用有限的异构数据训练具有令人满意的性能和泛化能力的分析模型,是需要解决的技术问题。
针对上述情况,本申请实施例为了在有限训练样本的情况下获取更多的信息,便于后续的特征提取以及模型训练,可以对上述故障样本数据进行数据预处理。其中,数据预处理包括但不限于数据增广、数据信息挖掘以及异常数据处理中的至少一项。
在本申请实施例中,数据增广可以理解为通过对已有数据添加微小改动或从已有数据新创建合成数据,以增加数据量的方法。基于此,本申请实施例中为了增多样本数据量量可以对采集到的故障样本数据进行数据增广处理。需要说明的是,由于现有技术中已经存在多种成熟的数据增广处理方法,所以本申请实施例中可以采用任一种方式对本申请中的故障样本数据进行数据增广处理,在此不再对于各数据增广处理的方式进行一一介绍。
在本申请实施例中,数据信息挖掘可以理解为从各类信息源中抽取先前未知的、完整的信息,以在原有数据信息的基础上增加数据信息的方法。所以,为了增加本申请实施例中训练样本中的数据信息可以对训练样本中的故障样本数据进行数据信息挖掘。
需要说明的是,本申请实施例中通过传感器采集得到的故障样本数据为时序信号序列,因此本申请实施例中可以通过采用小波变换等方式对上述故障样本数据进行数据处理,以得到处理后的时频信息,从而增加故障样本数据中包含的数据信息,从而基于更多的数据信息对模型进行训练,在后续可以实现提高分析模型的分析性能。当然,本实施例中还可以采用其他方式进行信息挖掘,本申请对于信息挖掘的处理方式不进行具体限定。
在本申请实施例中,异常数据处理可以理解为将现有数据中的异常数据根据异常类型进行处理,以得到更加客观的样本数据的方法。所以,为了使基于上述训练样本进行训练得到的分析模型具备更高的分析性能,本申请实施例可以对采集得到的故障样本数据进行异常数据处理。
可选的,对于异常数据处理的方法可以包括但不限于对重复数据或者明显具备残缺的数据进行剔除以及对异常值的数据进行数据平滑修正等处理。
需要说明的是,上述预处理分方法可以仅采用其中一种,也可以同时进行多种处理。并且,在采用多种数据进行数据预处理时,对于各种处理方式的处理顺序不做限定。还需要说明的是,上述数据预处理方式只是本申请技术方案示例性的介绍,并不能作为对本申请限定,本申请还可以对训练样本进行其他形式的预处理,以使基于处理后的训练样本训练得到的分析模型具备更好的分析性能,例如,对上述故障样本数据的数据表现形式进行形式统一等。
S440、在元学习框架中基于训练样本对初始分析模型进行迭代训练,直至满足迭代停止条件时停止训练,得到训练完成的目标分析模型。
其中,一个迭代轮次的训练过程包括内外两个循环。在内循环中,确定故障样本数据对应的数据特征以及,确定故障样本标签对应的标签特征,并基于数据特征、标签特征和故障样本标签,确定初始分析模型在内循环中的第一更新梯度参数。在外循环中,基于第一更新梯度参数确定外循环中的第二更新梯度参数,并基于第一更新梯度参数和第二更新梯度参数对初始分析模型的模型参数进行更新,得到当前迭代轮次更新后的分析模型。
具体的,对步骤S440中技术手段、技术效果、技术名词的理解与举例,可参照上述实施例中对步骤S220的解释,本实施例中不再进行赘述。
在上述方案中,在基于训练样本进行内循环的仿真训练过程之前,可以分别对训练样本中的故障样本数据和故障样本标签分别进行预处理,以使基于处理后的故障样本数据和故障样本标签进行训练得到的分析模型具备更好的分析性能。
图5为本申请根据另一示例性实施例提供的基于多源域数据的故障分析模型训练方法的流程示意图。本实施例可理解为在上述各实施例的基础上,对申请技术方案进行扩展的扩展实施例,参见图5,本实施例的方法具体可以包括:
S510、获取待训练的初始分析模型以及,获取用于对初始分析模型进行训练的样本数据。
其中,样本数据包括训练样本和测试样本;训练样本包括多个源域的工业设备在多种设备工作环境下的故障样本数据,以及各故障样本数据分别对应的故障样本标签。
具体的,对步骤S510中技术手段、技术效果、技术名词的理解与举例,可参照上述实施例中对步骤S210的解释,本实施例中不再进行赘述。
S520、在元学习框架中基于训练样本对初始分析模型进行迭代训练,直至满足迭代停止条件时停止训练,得到训练完成的目标分析模型。
其中,一个迭代轮次的训练过程包括内外两个循环。在内循环中,确定故障样本数据对应的数据特征以及,确定故障样本标签对应的标签特征,并基于数据特征、标签特征和故障样本标签,确定初始分析模型在内循环中的第一更新梯度参数。在外循环中,基于第一更新梯度参数确定外循环中的第二更新梯度参数,并基于第一更新梯度参数和第二更新梯度参数对初始分析模型的模型参数进行更新,得到当前迭代轮次更新后的分析模型。
具体的,对步骤S520中技术手段、技术效果、技术名词的理解与举例,可参照上述实施例中对步骤S220的解释,本实施例中不再进行赘述。
S530、在分析模型停止训练后,基于元学习框架得到测试样本对应的测试故障标签,并基于测试过程确定当前元学习框架中的冗余处理模块。
本申请实施例中,在训练过程中由于需要对样本数据进行多种方式的数据处理,所以需要预先设置较多的处理模块。例如,数据预处理模块、编码器和解码器等处理模块。但是有些处理模块在后续的故障分析中并不会使用,因此,若将训练过程中所有的处理模块保留在元学习框架中,并直接基于该元学习框架进行后续的故障分析,则可能会导致元学习框架中存在冗余的处理模块,浪费存储空间以及处理器,从而会导致后续元学习框架在故障分析时分析效率降低。并且,由于模型预测的处理流程与后续模型应用进行故障分析的处理一致,所以,本申请实施例在训练完成后可以对训练后的元学习框架中的冗余处理模块进行处理。
可选的,获取上述样本数据中的测试样本,将上述测试样本中的故障设备数据输入至元学习框架中,得到框架输出的测试故障标签。具体的,在元学习框架中,将故障设备数据输入至目标分析模型中,得到模型输出的数据特征,进而将数据特征输入至解码器中尽显标签预测,得到对应的测试故障标签。基于上述过程可以确定,在测试过程中元学习框架中应用到了目标分析模型和解码器两个处理模块。进一步的,基于目标分析模型在元学习框架中的训练过程可知,训练过程中元学习框架中应用到的数据预处理模块、分析模型、编码器以及解码器四个处理模块。因此,基于上述两个过程可以获知元学习框架中的冗余处理模块包括数据预处理模块和编码模块。
S540、对元学习框架中的冗余模块进行剔除处理,得到处理后的元学习框架。
在本申请实施例中,在基于上述实施方式确定出冗余模块包括数据预处理模块和编码模块,进而对上述两模块进行删除处理,并适应性的修改其他处理模块之间的连接关系,以使进行处理后的元学习框架还可以成功的进行故障分析。
在上述技术方案中,通过在训练完成后对元学习框架中的各处理模块进行精简处理,得到处理后的元学习框架,可以减少元学习框架中的存储空间以及资源利用率,从而可以提高后续元学习框架在进行故障分析过程中的分析效率。
图6为本申请根据一示例性实施例提供的工业设备的故障分析方法的流程示意图。参见图6,方法的步骤包括:
S610、获取任一源域的待检测工业设备在任一设备工作环境下的设备数据。
在本申请实施例中,源域可以理解为设备数据对应的工业设备所属的领域。例如,航空、化工制造、消防等。工业设备可以理解为用在生产经营过程中的工业产品。具体的,设备可以包括通用设备和专用设备。通用设备可以包括机械设备、电气设备、特种设备、办公设备、运输车辆、仪器仪表、计算机及网络设备等;专用设备可以包括矿山专用设备、化工专用设备、航空航天专用设备、消防专用设备等。设备工作环境可以理解为设备工作时所处的环境。例如工作温度、工作湿度以及设备在当前工作时刻下设备的健康状态等。设备数据可以理解为设备的状态数据,例如,电机数据、温度数据、油量数据以及仪表盘数据等。
需要说明的是,任一源域可以是上述实施方式中对分析模型进行训练过程中所涉及到的源域,也可以是之前从未涉及的新源域,以此可以实现基于上述训练过程得到的分析模型具有跨域设备故障分析的能力,即具备良好的跨域泛化能力和模型推广能力。
具体的,获取设备数据的方法可以包括通过各领域中的工业设备对应的设备数据采集传感器对设备故障时的设备状态数据进行采集所得到。可选的,还可以通过其他数据读取的方式获取设备数据,对于设备数据的获取方式本申请不进行具体限定。
S620、将设备数据输入至目标分析模型,得到目标分析模型输出的预测数据特征,并将预测数据特征输入至解码器,得到解码器输出的预测故障类型。
在本申请实施例中,目标分析模型为基于上述任意实施方式中所介绍的训练方法训练得到的目标分析模型。在本申请实施例中,对于模型训练方法不再进行赘述。
可选的,在一些其他实施例中,在将设备数据输入至目标分析模型之前还可以对设备数据进行数据预处理,其中数据预处理包括但不限于数据增广、数据信息挖掘以及异常数据处理等,并基于预处理后的设备数据进行故障分析,可以得到更加准确的分析结果。
当然,为了保证故障分析的客观性,在得到设备数据之后可以不进行任何处理,直接进行故障分析,本实施例对于是否进行数据预处理不进行限定。
在上述技术方案中,通过采用元学习框架中的目标分析模型以及解码器对设备数据进行故障分析,得到分析结果;其中,目标分析模块为在元学习框架中采用双层循环训练所得到。具体在内循环中对训练样本进行处理后进行语义匹配,实现通过少量样本进行训练得到在多个源域内具有分析泛化能力的分析模型;以及在外循环中通过对内循环得到的梯度信息进行对齐处理,并基于处理后的梯度信息对模型进行更新,实现得到在任一源域内具备良好分析性能的分析模型,解决现有技术中对于新工况下的故障分析性能下降的问题,实现提高在新工况下进行故障分析的分析准确性,从而达到提高故障分析性能的技术效果。
图7为本申请根据一示例性实施例提供的基于多源域数据的故障分析模型训练装置的结构示意图。参见图7,该装置包括:模型和数据获取模块710和模型训练模块720;
模型和数据获取模块710,用于获取待训练的初始分析模型以及,获取用于对初始分析模型进行训练的样本数据;其中,样本数据包括训练样本和测试样本;训练样本包括多个源域的工业设备在多种设备工作环境下的故障样本数据,以及各故障样本数据分别对应的故障样本标签;
模型训练模块720,用于在元学习框架中基于训练样本对初始分析模型进行迭代训练,直至满足迭代停止条件时停止训练,得到训练完成的目标分析模型;
其中,一个迭代轮次的训练过程包括内外两个循环;
在内循环中,确定故障样本数据对应的数据特征以及,确定故障样本标签对应的标签特征,并基于数据特征、标签特征和故障样本标签,确定初始分析模型在内循环中的第一更新梯度参数;
在外循环中,基于第一更新梯度参数确定外循环中的第二更新梯度参数,并基于第一更新梯度参数和第二更新梯度参数对初始分析模型的模型参数进行更新,得到当前迭代轮次更新后的分析模型。
可选的,模型训练模块720,具体可以用于:将各故障样本数据输入至初始分析模型,得到初始分析模型输出的各数据特征;
获取元学习框架中预先训练好的编码器,并将故障样本标签输入至编码器,得到编码器输出的标签特征。
可选的,模型训练模块720,具体可以用于:获取元学习框架中预先训练好的解码器,各将故障样本数据输入至解码器,得到解码器输出的故障预测标签;
基于各数据特征、各样本特征、各故障样本标签和各故障预测标签生成初始分析模型在内循环中的第一损失函数;
基于第一损失函数确定初始分析模型在内循环中的第一更新梯度参数。
可选的,模型训练模块720,具体可以用于:基于各数据特征和各样本特征生成初始分析模型在内循环中的特征损失函数;
基于各故障样本标签和各故障预测标签生成初始分析模型在内循环中的标签损失函数;
获取元学习框架中的经验风险损失函数和梯度内积损失函数;
基于特征损失函数、标签损失函数、经验风险损失函数以及梯度内积损失函数生成初始分析模型在内循环中的第一损失函数。
可选的,故障样本标签包括各工业设备的设备故障类型;
装置,还可以用于:对各故障样本标签进行标签归一化处理,得到归一化处理后的各故障样本标签;
对各故障样本数据进行数据预处理,得到预处理后的故障样本数据;其中,预处理包括数据增广、数据信息挖掘以及异常数据处理中的至少一项。
可选的,模型训练模块720,具体可以用于:基于预设的处理函数对第一更新梯度参数进行处理,得到处理后的估计梯度参数;
基于第一更新梯度参数和估计梯度参数生成初始分析模型在外循环中的第二损失函数;
基于第二损失函数确定分析模型在当前迭代轮次的第二更新梯度参数。
装置,还可以用于:在分析模型停止训练后,基于元学习框架得到测试样本对应的测试故障标签,并基于测试过程确定当前元学习框架中的冗余处理模块;
对元学习框架中的冗余模块进行剔除处理,得到处理后的元学习框架。
图8为本申请根据一示例性实施例提供的工业设备的故障分析装置的结构示意图。参见图8,该装置应用于元学习框架,元学习框架包括训练完成的目标分析模型和解码器;包括:设备数据获取模块810和故障类型预测模块820;其中,
设备数据获取模块810,用于获取任一源域的待检测工业设备在任一设备工作环境下的设备数据;
故障类型预测模块820,用于将设备数据输入至目标分析模型,得到目标分析模型输出的预测数据特征,并将预测数据特征输入至解码器,得到解码器输出的预测故障类型;其中,目标分析模型为通过任一实施方式的训练方法训练得到的目标分析模型。
在上述技术方案中,
图9为本申请实施例提供的一种电子设备的结构示意图。如图9所示,本实施例的电子设备可以包括:
至少一个处理器901;以及
与至少一个处理器通信连接的存储器902;
其中,存储器902存储有可被至少一个处理器901执行的指令,指令被至少一个处理器901执行,以使电子设备执行如上述任一实施例的方法。
可选地,存储器902既可以是独立的,也可以跟处理器901集成在一起。
本实施例提供的电子设备的实现原理和技术效果可以参见前述各实施例,此处不再赘述。
本申请实施例还提供一种计算机可读存储介质,计算机可读存储介质中存储有计算机执行指令,当处理器执行计算机执行指令时,实现前述任一实施例的方法。
本申请实施例还提供一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现前述任一实施例的方法。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。例如,以上所描述的设备实施例仅仅是示意性的,例如,模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。
上述以软件功能模块的形式实现的集成的模块,可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器执行本申请各个实施例方法的部分步骤。
应理解,上述处理器可以是中央处理单元(Central Processing Unit,简称CPU),还可以是其它通用处理器、数字信号处理器(Digital Signal Processor,简称DSP)、专用集成电路(Application Specific Integrated Circuit,简称ASIC)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合申请所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。存储器可能包含高速RAM存储器,也可能还包括非易失性存储NVM,例如至少一个磁盘存储器,还可以为U盘、移动硬盘、只读存储器、磁盘或光盘等。
上述存储介质可以是由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。存储介质可以是通用或专用计算机能够存取的任何可用介质。
一种示例性的存储介质耦合至处理器,从而使处理器能够从该存储介质读取信息,且可向该存储介质写入信息。当然,存储介质也可以是处理器的组成部分。处理器和存储介质可以位于专用集成电路(Application Specific Integrated Circuits,简称ASIC)中。当然,处理器和存储介质也可以作为分立组件存在于电子设备或主控设备中。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本申请各个实施例的方法。
本申请的技术方案中,所涉及的用户数据等信息的收集、存储、使用、加工、传输、提供和公开等处理,均符合相关法律法规的规定,且不违背公序良俗。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由下面的权利要求书指出。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求书来限制。
Claims (10)
1.一种基于多源域数据的故障分析模型训练方法,其特征在于,所述分析模型设置于元学习框架中,包括:
获取待训练的初始分析模型以及,获取用于对所述初始分析模型进行训练的样本数据;其中,所述样本数据包括训练样本和测试样本;所述训练样本包括多个源域的工业设备在多种设备工作环境下的故障样本数据,以及各所述故障样本数据分别对应的故障样本标签;
在所述元学习框架中基于所述训练样本对所述初始分析模型进行迭代训练,直至满足迭代停止条件时停止训练,得到训练完成的目标分析模型;
其中,一个迭代轮次的训练过程包括内外两个循环;
在内循环中,确定所述故障样本数据对应的数据特征以及,确定所述故障样本标签对应的标签特征,并基于所述数据特征、所述标签特征和所述故障样本标签,确定所述初始分析模型在所述内循环中的第一更新梯度参数;
在外循环中,基于所述第一更新梯度参数确定所述外循环中的第二更新梯度参数,并基于所述第一更新梯度参数和所述第二更新梯度参数对所述初始分析模型的模型参数进行更新,得到当前迭代轮次更新后的分析模型。
2.根据权利要求1所述的方法,其特征在于,所述确定所述故障样本数据对应的数据特征以及,确定所述故障样本标签对应的标签特征,包括:
将各所述故障样本数据输入至所述初始分析模型,得到所述初始分析模型输出的各所述数据特征;
获取所述元学习框架中预先训练好的编码器,并将所述故障样本标签输入至所述编码器,得到所述编码器输出的标签特征。
3.根据权利要求1所述的方法,其特征在于,所述基于所述数据特征、所述标签特征和所述故障样本标签,确定所述分析模型在所述内循环中的更新梯度参数,包括:
获取所述元学习框架中预先训练好的解码器,各将所述故障样本数据输入至所述解码器,得到所述解码器输出的故障预测标签;
基于各所述数据特征、各所述样本特征、各所述故障样本标签和各所述故障预测标签生成所述初始分析模型在所述内循环中的第一损失函数;
基于所述第一损失函数确定所述初始分析模型在所述内循环中的第一更新梯度参数。
4.根据权利要求3所述的方法,其特征在于,所述基于各所述数据特征、各所述样本特征、各所述故障样本标签和各所述故障预测标签生成所述初始分析模型在所述内循环中的第一损失函数,包括:
基于各所述数据特征和各所述样本特征生成所述初始分析模型在所述内循环中的特征损失函数;
基于各所述故障样本标签和各所述故障预测标签生成所述初始分析模型在所述内循环中的标签损失函数;
获取所述元学习框架中的经验风险损失函数和梯度内积损失函数;
基于所述特征损失函数、所述标签损失函数、所述经验风险损失函数以及所述梯度内积损失函数生成所述初始分析模型在所述内循环中的第一损失函数。
5.根据权利要求2所述的方法,其特征在于,所述故障样本标签包括各所述工业设备的设备故障类型;
在所述获取用于对所述初始分析模型进行训练的样本数据之后,所述方法还包括:
对各所述故障样本标签进行标签归一化处理,得到归一化处理后的各故障样本标签;
对各所述故障样本数据进行数据预处理,得到预处理后的故障样本数据;其中,所述预处理包括数据增广、数据信息挖掘以及异常数据处理中的至少一项。
6.根据权利要求1所述的方法,其特征在于,所述基于所述第一更新梯度参数确定所述外循环中的第二更新梯度参数,包括:
基于预设的处理函数对所述第一更新梯度参数进行处理,得到处理后的估计梯度参数;
基于所述第一更新梯度参数和所述估计梯度参数生成所述初始分析模型在所述外循环中的第二损失函数;
基于所述第二损失函数确定所述分析模型在当前迭代轮次的第二更新梯度参数。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在所述分析模型停止训练后,基于所述元学习框架得到所述测试样本对应的测试故障标签,并基于所述测试过程确定所述当前元学习框架中的冗余处理模块;
对所述元学习框架中的所述冗余模块进行剔除处理,得到处理后的元学习框架。
8.一种工业设备的故障分析方法,其特征在于,应用于元学习框架,所述元学习框架包括训练完成的目标分析模型和解码器;包括:
获取任一源域的待检测工业设备在任一设备工作环境下的设备数据;
将所述设备数据输入至所述目标分析模型,得到所述目标分析模型输出的预测数据特征,并将所述预测数据特征输入至所述解码器,得到所述解码器输出的预测故障类型;
其中,所述目标分析模型为通过权利要求1-7任一项所述的训练方法训练得到的目标分析模型。
9.一种电子设备,其特征在于,包括:存储器,处理器;
存储器;用于存储所述处理器可执行指令的存储器;
其中,所述处理器执行所述存储器存储的可执行指令,以实现如权利要求1-7任一项所述的基于多源域数据的故障分析模型训练方法;或者,如权利要求8所述的工业设备的故障分析方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如权利要求1-7任一项所述的基于多源域数据的故障分析模型训练方法;或者,如权利要求8所述的工业设备的故障分析方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310348280.4A CN116383741A (zh) | 2023-04-03 | 2023-04-03 | 基于多源域数据的模型训练方法和跨域分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310348280.4A CN116383741A (zh) | 2023-04-03 | 2023-04-03 | 基于多源域数据的模型训练方法和跨域分析方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116383741A true CN116383741A (zh) | 2023-07-04 |
Family
ID=86965213
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310348280.4A Pending CN116383741A (zh) | 2023-04-03 | 2023-04-03 | 基于多源域数据的模型训练方法和跨域分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116383741A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116956048A (zh) * | 2023-09-19 | 2023-10-27 | 北京航空航天大学 | 一种基于跨域泛化标签的工业设备故障诊断方法及装置 |
CN118312774A (zh) * | 2024-03-29 | 2024-07-09 | 重庆赛力斯凤凰智创科技有限公司 | 故障检测模型训练和使用方法、装置、设备及存储介质 |
-
2023
- 2023-04-03 CN CN202310348280.4A patent/CN116383741A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116956048A (zh) * | 2023-09-19 | 2023-10-27 | 北京航空航天大学 | 一种基于跨域泛化标签的工业设备故障诊断方法及装置 |
CN116956048B (zh) * | 2023-09-19 | 2023-12-15 | 北京航空航天大学 | 一种基于跨域泛化标签的工业设备故障诊断方法及装置 |
CN118312774A (zh) * | 2024-03-29 | 2024-07-09 | 重庆赛力斯凤凰智创科技有限公司 | 故障检测模型训练和使用方法、装置、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Qin et al. | Neural-symbolic solver for math word problems with auxiliary tasks | |
CN116383741A (zh) | 基于多源域数据的模型训练方法和跨域分析方法 | |
CN114385178A (zh) | 基于抽象语法树结构信息增强的代码生成方法 | |
CN112257263B (zh) | 基于自注意力机制的设备剩余寿命预测系统 | |
CN112784920A (zh) | 云边端协同的旋转部件对抗域自适应故障诊断方法 | |
CN112084301A (zh) | 文本修正模型的训练方法及装置、文本修正方法及装置 | |
CN116561748A (zh) | 一种组件子序列相关性感知的日志异常检测装置 | |
CN116432611A (zh) | 文稿写作辅助方法、系统、终端及存储介质 | |
Yang et al. | Dynamic spatial–temporal graph-driven machine remaining useful life prediction method using graph data augmentation | |
CN117435901B (zh) | 一种工业互联网数据获取方法、系统、终端及储存介质 | |
US20240061739A1 (en) | Incremental causal discovery and root cause localization for online system fault diagnosis | |
Liu et al. | An anomaly detection method based on double encoder–decoder generative adversarial networks | |
CN117316462A (zh) | 一种医疗数据管理方法 | |
CN117231590A (zh) | 液压系统的故障预测系统及其方法 | |
CN117011609A (zh) | 纺织品加工进度自动跟踪系统及其方法 | |
CN115328753B (zh) | 一种故障预测方法及装置、电子设备、存储介质 | |
CN116541689A (zh) | 多模态数据采集与标注方法、装置、计算机设备 | |
CN115129826A (zh) | 电力领域模型预训练方法、精调方法、装置及设备 | |
CN112487811B (zh) | 基于强化学习的级联信息提取系统及方法 | |
CN114357160A (zh) | 基于生成传播结构特征的早期谣言检测方法及装置 | |
CN117931420B (zh) | 云工作负载预测方法、装置、设备及存储介质 | |
CN117290856B (zh) | 基于软件自动化测试技术的智能测试管理系统 | |
CN116383883B (zh) | 一种基于大数据的数据管理权限处理方法及系统 | |
CN116662160B (zh) | 基于代价敏感宽度学习的软件缺陷预测方法及处理装置 | |
US20240303436A1 (en) | Text-based relation extraction method and device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |