CN117668622B - 设备故障诊断模型的训练方法、故障诊断方法及装置 - Google Patents
设备故障诊断模型的训练方法、故障诊断方法及装置 Download PDFInfo
- Publication number
- CN117668622B CN117668622B CN202410138832.3A CN202410138832A CN117668622B CN 117668622 B CN117668622 B CN 117668622B CN 202410138832 A CN202410138832 A CN 202410138832A CN 117668622 B CN117668622 B CN 117668622B
- Authority
- CN
- China
- Prior art keywords
- model
- data
- feature extraction
- fault diagnosis
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003745 diagnosis Methods 0.000 title claims abstract description 141
- 238000012549 training Methods 0.000 title claims abstract description 107
- 238000000034 method Methods 0.000 title claims abstract description 98
- 238000012545 processing Methods 0.000 claims abstract description 57
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 36
- 238000013140 knowledge distillation Methods 0.000 claims abstract description 24
- 238000007499 fusion processing Methods 0.000 claims abstract description 20
- 238000000605 extraction Methods 0.000 claims description 113
- 239000013598 vector Substances 0.000 claims description 68
- 238000005457 optimization Methods 0.000 claims description 59
- 238000003062 neural network model Methods 0.000 claims description 34
- 230000004913 activation Effects 0.000 claims description 29
- 230000004888 barrier function Effects 0.000 claims description 26
- 230000003287 optical effect Effects 0.000 claims description 22
- 238000013528 artificial neural network Methods 0.000 claims description 20
- 230000004927 fusion Effects 0.000 claims description 16
- 230000008569 process Effects 0.000 claims description 14
- 238000012795 verification Methods 0.000 claims description 14
- 238000009825 accumulation Methods 0.000 claims description 6
- 230000007246 mechanism Effects 0.000 claims description 4
- 238000013500 data storage Methods 0.000 claims description 3
- 238000013480 data collection Methods 0.000 claims 2
- 208000037408 Device failure Diseases 0.000 claims 1
- 230000006870 function Effects 0.000 description 25
- 238000003860 storage Methods 0.000 description 11
- 238000009826 distribution Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 6
- 230000003993 interaction Effects 0.000 description 6
- 238000004519 manufacturing process Methods 0.000 description 6
- 230000006854 communication Effects 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000005389 magnetism Effects 0.000 description 4
- 241000282414 Homo sapiens Species 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 239000003245 coal Substances 0.000 description 3
- 238000004590 computer program Methods 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000009776 industrial production Methods 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000005012 migration Effects 0.000 description 2
- 238000013508 migration Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 230000005610 quantum mechanics Effects 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000004931 aggregating effect Effects 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 238000012550 audit Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000013506 data mapping Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000013209 evaluation strategy Methods 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 230000005281 excited state Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000008713 feedback mechanism Effects 0.000 description 1
- 235000019580 granularity Nutrition 0.000 description 1
- 230000005283 ground state Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 239000002096 quantum dot Substances 0.000 description 1
- 238000005316 response function Methods 0.000 description 1
- 230000004043 responsiveness Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/096—Transfer learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/098—Distributed learning, e.g. federated learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Biomedical Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了一种设备故障诊断模型的训练方法、故障诊断方法及装置,涉及设备故障诊断的技术领域,包括:获取样本数据集合;利用所述类型标签相同的所述工业设备运行数据确定基础模型集合;基于所述工业设备运行数据集合,对所述主模型进行模型训练,确定目标主模型;通过知识蒸馏算法,基于所述目标主模型对各项子模型进行信息交换处理,以使各项所述子模型学习所述目标主模型的模型训练方法,并利用所述模型训练方法进行模型训练,确定目标子模型集合;将所述目标主模型和所述目标子模型集合进行模型融合处理,确定设备故障诊断模型。本发明可以通过知识蒸馏,显著提升故障诊断效率以及故障诊断的准确性。
Description
技术领域
本发明涉及设备故障诊断的技术领域,尤其是涉及一种设备故障诊断模型的训练方法、故障诊断方法及装置。
背景技术
设备故障诊断是工业生产和各个行业中至关重要的环节,其在确保设备正常运作、提高生产效率以及维护设备安全方面发挥着核心作用。目前,相关技术提出,可以依赖人工对传感器采集到的设备运行数据进行检查和分析,但上述方案在设备运行数据的数据量较大时,处理效率较低,并且受限于人工的经验和判断,导致诊断的准确度较低,因此,传统的人工诊断方法无法满足现代工业对于故障诊断的需求。
发明内容
有鉴于此,本发明的目的在于提供一种设备故障诊断模型的训练方法、故障诊断方法及装置,可以通过知识蒸馏,显著提升故障诊断效率以及故障诊断的准确性。
第一方面,本发明实施例提供了一种设备故障诊断模型的训练方法,方法包括:获取样本数据集合,其中,样本数据集合包括:工业设备运行数据集合和工业设备运行数据集合中各项工业设备运行数据的类型标签;利用类型标签相同的工业设备运行数据确定基础模型集合,其中,基础模型集合包括:主模型和子模型集合;基于工业设备运行数据集合,对主模型进行模型训练,确定目标主模型;通过知识蒸馏算法,基于目标主模型对各项子模型进行信息交换处理,以使各项子模型学习目标主模型的模型训练方法,并利用模型训练方法进行模型训练,确定目标子模型集合;将目标主模型和目标子模型集合进行模型融合处理,确定设备故障诊断模型。
在一种实施方式中,基于工业设备运行数据集合,对主模型进行模型训练,确定目标主模型的步骤,包括:通过特征提取网络,对工业设备运行数据集合中,与主模型对应的样本数据进行特征提取处理,确定目标特征向量,其中,特征提取网络包括:第一特征提取网络和第二特征提取网络;根据目标特征向量,对预设分类器进行分类训练,确定目标主模型,其中,预设分类器根据基于改进量子编码的高阶神经网络算法进行设置。
在一种实施方式中,第一特征提取网络包括:光学衍射参数优化神经网络模型,第二特征提取网络包括:磁力优化神经网络模型,通过特征提取网络对主模型中的样本数据进行特征提取处理,确定目标特征向量的步骤,包括:通过第一特征提取网络中的光学衍射参数优化神经网络模型,基于样本数据,进行参数优化处理和特征提取处理,确定第一特征向量;通过第二特征提取网络中的磁力优化神经网络模型,基于样本数据,进行参数更新处理和特征提取处理,确定第二特征向量;将第一特征向量和第二特征向量进行特征融合处理,确定目标特征向量。
在一种实施方式中,通过第一特征提取网络中的光学衍射参数优化神经网络模型,基于样本数据,进行参数优化处理和特征提取处理,确定第一特征向量的步骤,包括:根据光学衍射参数优化神经网络模型,对第一特征提取网络中的第一特征提取模型的模型参数进行参数优化处理,并针对优化后的模型参数进行复杂度验证和稳定性验证,确定第一目标特征提取模型;通过第一目标特征提取模型,对样本数据进行特征提取处理,确定第一特征向量。
在一种实施方式中,通过第二特征提取网络中的磁力优化神经网络模型,基于样本数据,进行参数更新处理和特征提取处理,确定第二特征向量的步骤,包括:根据磁力优化神经网络模型,对第二特征提取网络中的第二特征提取模型的模型参数进行参数更新处理,对模型参数进行迭代计算,并在模型参数达到预设动态阈值时,确定第二目标特征提取模型;通过第二目标特征提取模型,对样本数据进行特征提取处理,确定第二特征向量。
在一种实施方式中,将目标主模型和目标子模型集合进行模型融合处理,确定设备故障诊断模型的步骤,包括:通过预设活化能障碍诊断模型,对目标主模型和目标子模型集合中各项目标子模型融合的活化能障碍值进行检测,其中,两个模型间的活化能障碍值越低,则模型差异越小;通过预设权重同步模型,根据活化能障碍值由低到高的顺序,对目标主模型和各项目标子模型进行模型融合处理,确定设备故障诊断模型。
第二方面,本发明实施例还提供一种故障诊断方法,方法包括:获取待诊断工业设备数据;将待诊断工业设备数据输入至预先构建的设备故障诊断模型中,确定故障诊断结果,并将故障诊断结果反馈至用户端;其中,设备故障诊断模型为基于第一方面提供的任一项的设备故障诊断模型的训练方法训练得到的。
第三方面,本发明实施例还提供一种设备故障诊断模型的训练装置,装置包括:样本数据采集模块,获取样本数据集合,其中,样本数据集合包括:工业设备运行数据集合和工业设备运行数据集合中各项工业设备运行数据的类型标签;模型生成模块,利用类型标签相同的工业设备运行数据确定基础模型集合,其中,基础模型集合包括:主模型和子模型集合;主模型训练模块,基于工业设备运行数据集合,对主模型进行模型训练,确定目标主模型;子模型训练模块,通过知识蒸馏算法,基于目标主模型对各项子模型进行信息交换处理,以使各项子模型学习目标主模型的模型训练方法,并利用模型训练方法进行模型训练,确定目标子模型集合;模型融合模块,将目标主模型和目标子模型集合进行模型融合处理,确定设备故障诊断模型。
第四方面,本发明实施例还提供一种故障诊断装置,装置包括:数据采集模块,获取待诊断工业设备数据;故障诊断模块,将待诊断工业设备数据输入至预先构建的设备故障诊断模型中,确定故障诊断结果,并将故障诊断结果反馈至用户端;其中,设备故障诊断模型为基于第一方面提供的任一项的设备故障诊断模型的训练方法训练得到的。
本发明实施例带来了以下有益效果:
本发明实施例提供的一种设备故障诊断模型的训练方法、故障诊断方法及装置,该方法在获取样本数据集合后,利用类型标签相同的工业设备运行数据确定基础模型集合,其中,基础模型集合包括:主模型和子模型集合;基于工业设备运行数据集合,对主模型进行模型训练,确定目标主模型后,通过知识蒸馏算法,基于目标主模型对各项子模型进行信息交换处理,以使各项子模型学习目标主模型的模型训练方法,并利用模型训练方法进行模型训练,确定目标子模型集合,最后将目标主模型和目标子模型集合进行模型融合处理,确定设备故障诊断模型,本发明实施例可以通过知识蒸馏,显著提升故障诊断效率以及故障诊断的准确性。
本发明的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种设备故障诊断模型的训练方法的流程示意图;
图2为本发明实施例提供的一种故障诊断方法的流程示意图;
图3为本发明实施例提供的一种设备故障诊断模型的训练装置的结构示意图;
图4为本发明实施例提供的一种故障诊断装置的结构示意图;
图5为本发明实施例提供的一种服务器的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合实施例对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
目前,设备故障诊断是工业生产和各个行业中至关重要的环节,其在确保设备正常运作、提高生产效率以及维护设备安全方面发挥着核心作用,随着制造业、电力系统和其他工业领域的发展,设备复杂程度提高,大量的设备与系统的使用提高了故障诊断的难度和复杂程度。设备故障不仅会导致生产停滞、降低生产效率,还可能导致安全事故,进一步引发经济损失和生命财产损失,因此,准确、迅速地进行设备故障诊断对于维护正常的生产运行和保障人员与设备安全具有极其重要的意义,在传统的故障诊断方法中,主要依赖人工检查和分析,这在处理大量的设备和数据时面临效率低下的问题,同时其准确性也大大受限于人的经验和判断,这使得传统的故障诊断方法无法满足现代工业对于故障诊断的需求;另一方面,随着数据量的不断增加以及分布式数据源的出现,数据的安全性和隐私性成为了人们关注的焦点,如何在保障数据的安全性和隐私性的前提下,有效地利用这些分布式的数据资源,实现更为准确和高效的设备故障诊断,是当前面临的重要挑战。
综上所述,现有技术存在以下技术问题:(1)现有方法多为数据本地训练,难以通过多节点部署的方式提高模型精度;(2)现有方法难以对设备故障数据进行高效的特征选择与提取,导致算法难以进行精准识别与分类;(3)在实际设备故障识别应用现场中,故障数据采集困难,各故障类别数据通常不均衡,算法存在执行能力弱、适应性不强、故障诊断精度低等问题;(4)随着设备数量的增加和数据的分布式存储,如何有效地利用分布式数据进行设备故障诊断,同时保护数据的隐私和安全,是现有技术面临的挑战,基于此,本发明实施提供的设备故障诊断模型的训练方法、故障诊断方法及装置,可以通过知识蒸馏,显著提升故障诊断效率以及故障诊断的准确性。
参见图1所示的一种设备故障诊断模型的训练方法的流程示意图,该方法主要包括以下步骤S102至步骤S110:
步骤S102,获取样本数据集合,其中,样本数据集合包括:工业设备运行数据集合和工业设备运行数据集合中各项工业设备运行数据的类型标签。
步骤S104,利用类型标签相同的工业设备运行数据确定基础模型集合,其中,基础模型集合包括:主模型和子模型集合,在一种实施方式中,将类型标签相同的工业设备运行数据构建基础模型,诸如,多个煤矿构成一个联邦(基础模型)、多个洗煤厂构成另一个联邦,多个储煤基地构成另外一个联邦,不同的联邦则足够独立、不存在中央服务器,并且联邦之间数据存在差异,在实际应用中,可以为每个联邦成员分配一个动态标识,然后根据多维参数空间将成员分为不同的类别,该标识是基于联邦成员的属性和行为特征计算出来的,标识符的公式可以表示为:
其中,为联邦成员的动态标识。
为多维特性函数,为第个联邦成员的多维特性参数,包括但不限于网络拓扑结构特性、数据分布特性等。
进一步地,根据每个联邦成员的多维参数空间对其进行分类,可以表示为:
其中,为第个联邦成员的分类;为分类函数,其根据网络拓扑结构特性、数据分布特性等进行分类;为第个联邦成员和第个联邦成员之间的关系向量,表示联邦成员之间的关联性。
进一步地,联邦成员根据其属性和行为特征被分组到不同的层级,不同层级的组织结构可以使用以下公式表示:
其中,为第个联邦成员所处的层次,为基于联邦成员的分类类别的层级划分函数;为权重因子,其基于第个联邦成员的关键属性来调整其在联邦结构中的位置。
步骤S106,基于工业设备运行数据集合,对主模型进行模型训练,确定目标主模型,在一种实施方式中,子模型的模型训练过称与主模型相同,即,通过光学衍射参数优化神经网络模型和磁力优化神经网络模型,进行特征提取后,输入基于改进量子编码的高阶神经网络算法进行设置的预设分类器中进行分类训练,得到目标模型。
步骤S108,通过知识蒸馏算法,基于目标主模型对各项子模型进行信息交换处理,以使各项子模型学习目标主模型的模型训练方法,并利用模型训练方法进行模型训练,确定目标子模型集合,在一种实施方式中,在各联邦成员之间的数据存储与访问机制中,联邦成员之间的传播过程分为两个阶段,即共性知识积累阶段和个性化阶段,在这两个阶段中,模型依次在联邦端传递,通过知识蒸馏进行自适应的信息交换,从而完成各子模型的模型训练,确定目标子模型集合,其中,在第一阶段,即共性知识积累阶段,为每个数据块分配动态变化的量子密钥,当数据需要被访问或修改时,该密钥会进行动态调整。同时,建立数据间的依赖关系图谱,当某个数据被访问或更改时,需要对与之关联的其他数据进行相应的调整,以保持整体数据生态的平衡,具体的,首先根据输入数据的特性和量子力学原理,为每个数据块生成初始的量子密钥。量子熵可以视作量子系统不确定性的测量,对于给定的数据块,定义它的量子熵为。设数据块由个子数据组成,即,,每个子数据与一个量子态相关联,数据块的量子熵由其所有子数据的量子熵的总和决定,则量子熵可以表示为:
其中,是观测到量子态的概率。这个概率可以由Born规则决定:
进一步地,将数据和其对应的量子密钥以及生态依赖关系一同存储在特定的存储结构中,如量子块链或生态数据库,当有外部请求访问某个数据时,首先验证请求者的身份和权限,然后动态调整其对应的量子密钥。
进一步地,在数据被访问或更改后,对整个数据生态进行检查,确定是否有必要对关联的数据进行调整。考虑数据间的依赖关系,定义数据的生态系数,其由数据块内所有子数据间的相互作用决定,如果和之间存在依赖关系,则有相互作用系数,否则。生态系数的计算方式可以表示为:
当数据块被请求访问时,需要动态地调整其量子密钥。当数据的不确定性增加或其生态依赖关系变得更紧密时,其量子密钥会进行相应的调整。定义原始密钥为和调整后的密钥为,其关系可以表示为:
进一步地,根据生态依赖关系图谱,对需要调整的数据进行处理,以恢复整体数据生态的平衡,为了保持数据生态的平衡,本发明引入平衡因子,其由数据的量子熵和生态系数共同决定,可以表示为:
当超出预定的阈值,即,则需要对数据进行调整,以恢复生态平衡。
进一步地,周期性地或在特定事件触发时,如数据被大量访问或修改,更新所有数据的量子密钥,所有的数据访问、修改和密钥调整操作都会被详细记录在日志中,为后续的审计和追溯提供依据。
同理,在第一阶段,即个性化阶段也以相同的方式进行训练,但模型在没有经过本地训练的情况下被发送到下一个联邦,防止因本地过分训练丢失共性知识,各联邦成员的模型训练完成后,采用基于环形知识蒸馏的策略,将模型的知识将从一个联邦传递到下一个,然后以此类推传递,直到返回原始的联邦,形成一个完整的循环。
具体的,设所有联邦模型为:
其中,是元联邦的数量,是联邦模型k的权重参数,是联邦模型k的样本数量,是全局模型的权重更新。
在环形知识蒸馏过程中,让上一联邦模型充当教师模型(即,主模型),并将其知识蒸馏到下一了模型(即,学生模型)中,全局模型周期性地向各个设备发送其模型参数及日志,每个设备上的学生模型(即,子模型)使用知识蒸馏损失函数进行训练,损失函数可以表示为:
其中,是交叉熵损失;是知识蒸馏损失,通常为教师和学生模型输出概率的KL散度;是权重参数;是温度参数,用于软化概率分布。
可以表示为:
其中,是学生模型的输出,是教师模型的输出,是温度参数。
进一步地,学生模型在本地数据上进行训练,然后将权重更新发送回中央服务器,中央服务器使用所有学生模型的权重更新来更新全局模型。
进一步地,每个联邦模型是由多个本地模型利用本地数据进行联邦学习训练得到,如图所示,联邦学习允许多个用户同时训练一个机器学习模型,在训练过程中并不需要上传任何私有的数据到服务器。本地用户负责训练本地数据得到本地模型,中心服务器负责加权聚合用户上传的本地模型数据从而得到全局模型,最后,经过多轮迭代后得到一个趋近于集中式机器学习结果的模型,同时还能解决传统机器学习源数据聚合带来的隐私泄露问题。
本发明中,各客户端模型在聚合节点时,通过全局模型修正本地训练的损失,在每一轮通信过程中,随机选择一定比例节点,更新本地模型得到新的,服务器整合节点得到新的全局模型。服务器的聚合公式可以表示为:
其中,是各参与节点训练数据的数量,且。
本发明基于联邦学习实现设备故障诊断模型的训练,各客户端构建一种基于联邦学习的框架并融合神经网络模型,具体的,各节点首先从服务器下载全局模型并更新本地模型进行训练;进一步地,各节点在达到预定的本地训练次数时,将模型参数上传至服务器;进一步地,服务器随机抽取节点并将节点按照一定比例聚合;进一步地,更新全局模型,并重复上述步骤直至训练结束。
在一个具体的实施例中,输入参与联邦学习的个节点,服务器迭代轮数,客户端节点迭代轮数,当前轮数,当前的全局模型;联邦学习后的全局模型为。
步骤S110,将目标主模型和目标子模型集合进行模型融合处理,确定设备故障诊断模型,其中,特征融合方式为特征向量级联的方式,在一种实施方式中,在进行模型融合时还可以根据两个融合的模型之间的差异大小,调节模型融合顺序和模型融合速率,可以通过预设活化能障碍诊断模型,对目标主模型和目标子模型集合中各项目标子模型融合的活化能障碍值进行检测,其中,两个模型间的活化能障碍值越低,则模型差异越小,通过预设权重同步模型,根据活化能障碍值由低到高的顺序,对目标主模型和各项目标子模型进行模型融合处理,确定设备故障诊断模型。
本发明实施例提供的上述故障诊断方法,可以通过知识蒸馏,显著提升故障诊断效率以及故障诊断的准确性。
本发明实施例还提供了一种训练设备故障诊断模型的实施方式,具体的参见如下(1)至(2):
(1)通过特征提取网络,对工业设备运行数据集合中,与主模型对应的样本数据进行特征提取处理,确定目标特征向量,其中,特征提取网络包括:第一特征提取网络和第二特征提取网络,第一特征提取网络包括:光学衍射参数优化神经网络模型,第二特征提取网络包括:磁力优化神经网络模型,在一种实施方式中,通过第一特征提取网络中的光学衍射参数优化神经网络模型,基于样本数据,进行参数优化处理和特征提取处理,确定第一特征向量,通过第二特征提取网络中的磁力优化神经网络模型,基于样本数据,进行参数更新处理和特征提取处理,确定第二特征向量,最后将第一特征向量和第二特征向量进行特征融合处理,确定目标特征向量的步骤包括如下(A)至(B):
(A)根据光学衍射参数优化神经网络模型,对第一特征提取网络中的第一特征提取模型的模型参数进行参数优化处理,并针对优化后的模型参数进行复杂度验证和稳定性验证,确定第一目标特征提取模型,并通过第一目标特征提取模型,对样本数据进行特征提取处理,确定第一特征向量,在一种实施方式中,第一特征提取网络为基于光学衍射参数优化算法的神经网络模型,即利用光学衍射参数优化算法对神经网络中的权重和偏置参数进行优化。受启发于光学中光波遇到障碍物会发生衍射,通过衍射的干涉,可以观察到不同的光强分布,借鉴上述原理,光学衍射参数优化算法模拟参数空间中的“光波”进行衍射与干涉,从而找到损失函数最小化的权重和偏置,具体的,光学衍射参数优化算法对神经网络的参数优化过程如下:(a)至(g):
(a)参数空间构建与初始化:构建神经网络的参数空间,定义权重和偏置,初始化参数,并设置相应的光场和光波分布。设神经网络中的权重为,偏置为,则初始化权重和偏置的方式可以表示为:
(b)高维衍射模拟:在高维参数空间中模拟光波的衍射,使用先进的衍射模型来计算每个参数位置的光强分布。定义多维空间中的光波传播函数为:
其中为多维空间中的光波传播函数;为入射光波的初始强度;为输入向量,表示网络的输入;为权重向量,用于权重参数化的一组值,其对应于神经网络中的连接权重;为偏置向量,表示神经网络中节点的偏置;为输入向量的维度;为偏置向量的维度。
(c)干涉模式分析与参数微调:分析得到的干涉模式,对参数进行微调,即,使用干涉模式分析函数来评估光波在多维空间中的传播,并据此进行参数微调。对于任意的权重和偏置,计算其梯度:
进一步地,参数微调遵循以下更新公式:
其中,为目标函数,用于评估网络性能的标量函数;和为分别表示目标函数相对于权重和偏置的偏导数;和为学习率参数,控制权重和偏置的更新步长,由人为预设。
(d)参数空间扫描与局部搜索:在微调后的参数空间进行扫描和局部搜索,利用多尺度搜索策略,在不同的尺度和范围内进行参数搜索。在每次微调后,执行局部搜索以进一步优化参数。定义局部搜索函数来找到局部最优解,局部搜索函数的定义如下:
其中,和表示权重和偏置的局部变化。局部搜索的目标是在当前的参数基础上找到能最小化目标函数的参数变化。
(e)全局优化与参数收敛:结合局部搜索的结果进行全局优化,利用多层次的优化策略和算法,确保参数快速稳定地收敛至全局最优解。在局部搜索基础上进行全局优化,定义全局优化函数,这个函数结合了所有局部最优解来找到全局最优解。此时,权重和偏置的更新为:
其中,全局优化函数的定义如下:
其中,和为全局存在的解。全局优化的目的是在所有可能的权重和偏置组合中,找到能使局部搜索函数最小化的参数。
(f)复杂度与稳定性验证:对优化后的参数复杂度和稳定性进行验证。验证参数的稳定性和复杂度,对于复杂度与稳定性验证,定义复杂度测量函数如下:
复杂度测量函数主要用来评估模型的复杂度,设定一个阈值,如果连续若干次迭代中,参数变化均小于,则认为算法已收敛。
(g)终止条件检验与算法结束:根据预定的终止条件检验参数是否收敛。如果满足收敛条件,算法终止条件的检验公式如下:
其中,为预设的精度阈值;为迭代次数。当上式成立时,算法终止,返回最优参数值,提取优化后的参数值并结束算法。否则,回到步骤2,继续迭代。
基于光学衍射原理对神经网络参数进行优化,通过局部搜索和全局优化相结合的方式,能够在高维参数空间中寻找全局最优解,避免陷入局部最优。同时,本发明引入了复杂度与稳定性验证,可以在保证模型性能的同时,避免模型的过拟合和欠拟合,保持模型的稳定性。
(B)根据磁力优化神经网络模型,对第二特征提取网络中的第二特征提取模型的模型参数进行参数更新处理,对模型参数进行迭代计算,并在模型参数达到预设动态阈值时,确定第二目标特征提取模型,并通过第二目标特征提取模型,对样本数据进行特征提取处理,确定第二特征向量,最后将第一特征向量和第二特征向量进行特征融合处理,确定目标特征向量,其中,第二特征提取网络为基于磁力优化算法的神经网络模型,受磁力运动原理启发,磁力运动原理是基于物体间存在磁性作用力的事实,即同性相斥、异性相吸。本发明通过模拟物体间的磁性交互进行神经网络参数的优化,模拟磁场中的力来推动参数更新,在一种实施方式中,磁力优化算法对神经网络的参数优化过程包括:初始化阶段、磁性交互与参数更新阶段、磁场调整阶段、性能评估与优化阶段、终止条件检验、结果输出,具体如下所示:
在一种实施方式中,在初始化阶段,首先,为网络中的每个参数(权重ws和偏置bs)分配初始值,即,对每个参数和赋初始值,并为其赋予磁性,初始化权重和偏置的方式可以表示为:
其中,是初始化范围的上限。
进一步地,为每个参数赋予磁性:
进一步地,定义磁场强度和影响范围,可以表示为:
且,。
进一步地,设置初始学习率,为每个参数分配初始磁性强度。
在一种实施方式中,在磁性交互与参数更新阶段,首先,计算每个参数对其他参数的磁性作用力。对于每个参数,其受到的总磁性作用力可计算为:
其中,是参数间的欧几里得距离。
进一步地,进行参数值更新,即,根据作用力和学习率更新参数值,参数值更新规则如下:
其中,是学习率,由人为预设。
进一步地,根据迭代次数和预设策略调整学习率,动态学习率调整方法如下:
其中,是学习率衰减系数。
进一步地,动态调整参数的磁性强度,以确保算法的收敛,磁场强度和范围动态调整规则如下:
其中,和分别是磁场强度和范围的调整系数。
进一步地,在参数空间中执行局部搜索,以更精确地定位最优参数。
在一种实施方式中,在磁场调整阶段,根据所有参数的当前值和磁性调整磁场强度和范围,磁场强度和影响范围的调整方式如下:
其中,是衰减因子。
进一步地,按照一定概率进行磁性异变,随机改变参数的磁性,增加算法的多样性,可以表示为:
其中,是磁性异变的概率。
在一种实施方式中,在性能评估与优化阶段,首先,根据当前参数值计算目标函数值。对于神经网络输出和真实值,本发明提出一种多元异质性逼近误差目标函数,综合考虑了模型输出与实际值之间的距离、方向和分布差异。定义如下:
其中,为真实值向量,代表模型的目标输出;为预测值向量,代表模型的实际输出。为向量的第个元素,代表某一特定样本的真实值;为向量的第个元素,代表相应样本的预测值;为如果是多维向量,表示在第行第列的元素;为如果是多维向量,表示在第行第列的元素。表示输出值与实际值之间的欧式距离;表示输出值与实际值的方向差异,即两者之间的角度差异;表示输出值与实际值的分布差异,通过Kullback-Leibler散度分布距离来衡量。为向量的方向;为向量的方向。
进一步地,可以表示为:
其中,为真实值和预测值向量的长度,即样本数量;为如果和是多维向量,代表向量的第二维度的长度。
可以表示为:
可以表示为:
进一步地,根据目标函数值对参数进行排序,选取一定比例的最优参数,设定精英比例为:
其中,为选择函数,即,保留一部分最优参数,与新生成的参数结合。
在一种实施方式中,在终止条件检验阶段,设定阈值和最大迭代次数,如果满足,达到最大迭代次数:或目标函数值小于阈值中的任一一项条件,则算法终止,其中,为最大迭代次数,算法在达到次迭代时会终止,上述阈值是本发明提出一种动态阈值判定方法,阈值会随着迭代次数动态变化,具体的,设定初始阈值为以及一个阈值衰减系数。每次迭代后,阈值按如下方式更新:
其中,为初始设定的阈值;为第次迭代时的动态阈值。为阈值衰减系数,控制阈值随迭代次数的衰减速度。为迭代次数,表示算法进行了多少次迭代。
同时,将此动态阈值与模型性能结合,构建综合判定条件。即,当模型性能在一定迭代次数内未能显著提升,且模型性能达到动态阈值要求时,终止迭代。
如果满足终止条件,则算法结束,否则返回磁性交互与参数更新阶段。
在一种实施方式中,在结果输出阶段,输出最终的参数值,即神经网络的权重和偏置,进一步地,对第一特征提取网络和第二特征提取网络的输出特征进行级联,输入到预设分类器。
(2)根据目标特征向量,对预设分类器进行分类训练,确定目标主模型,并在各项子模型学习目标主模型的训练方法后,进行特征提取和分类训练,并将完成训练的主模型和子模型融合,得到设备故障诊断模型,其中,预设分类器根据基于改进量子编码的高阶神经网络算法进行设置,该算法的末层神经网络的神经元数量与设备故障类别数量相同。通过采取量子编码的方式进行参数表示,能够实现更加高效与精确的参数优化,利用高阶神经网络实现更加复杂的数据映射关系,在一种实施方式中,基于改进量子编码的高阶神经网络算法的训练过程如下:
1、初始化:进行深度量子状态的编码初始化,设初始量子态为:
其中,,和为复数,表示量子态的概率幅。表示一个量子态,用来描述量子系统的状态信息;为复数,用来表征量子态的叠加状态,且满足;表示量子比特的基态和激发态。
进一步地,初始化神经元的激活状态与脉冲响应函数,利用Sigmoid函数初始化,可以表示为:
其中,为输入。
2、多阶段数据输入:以不同的阶段将数据分批输入网络,每个阶段对应不同的数据维度和特征,在每个阶段进行特征加权与数据融合,特征加权与数据融合的方式可以表示为:
其中,是第个特征的加权值,为权重,为输入数据的第个特征,为融合后的特征。
3、脉冲调控与信息同步:利用动态脉冲调整信息传递效率与精确度,多层脉冲同步机制保证信息在不同层次的一致性传递,动态脉冲调整的方式可以表示为:
其中,表示脉冲强度,为初始脉冲强度,为时间,为脉冲衰减常数。
4、高阶映射与递归优化:数据经过逐层高阶映射处理,实现复杂特征的捕捉,采用递归优化技术持续优化高阶映射结果,递归优化技术可以表示为:
其中,为分别是第次和第次递归的结果;为第次递归时的参数。
5、分布式参数优化:参数以分布式的形式进行优化,实现高效并行计算,实施基于量子力学原理的优化策略,对参数进行动态调整,优化方式可以表示为:
其中,为能量变化,为能量梯度,为参数变化。
6、多尺度模型训练:在多个尺度上分别训练模型,以适应不同粒度的数据特性,实施多阶段联合训练策略,对多尺度模型进行整合优化,多阶段联合训练的方式可以表示为:
其中,为总损失,为第个模型的权重,为第个模型的损失。
7、自适应模型验证:采用自适应策略进行模型验证,根据验证结果动态调整模型结构与参数,对模型的泛化能力、鲁棒性进行综合评估,自适应策略可以表示为:
其中,为调整后的参数,为是调整后的参数,是当前参数,是学习率。
8、量子脉冲反馈机制:根据模型输出结果,采取量子脉冲反馈策略调整网络状态与参数,利用量子脉冲反馈信息,优化模型的动态响应性与准确性,量子脉冲反馈可以表示为:
其中,为调整后的量子态,为由脉冲强度决定的量子门。
9、深度融合与知识迁移:对多尺度、多层次的模型结果进行深度融合,实现知识的高效传递与迁移。基于深度融合结果,对模型进行微调与优化,深度融合的方式可以表示为:
其中,为深度融合后的特征。
10、全局优化与模型融合:采用全局优化策略,对整个网络进行综合优化,通过模型融合技术整合多个子模型,实现更高的预测准确性,全局优化的方式可以表示为:
其中,为使损失函数最小的参数,为模型参数。
各联邦成员间模型训练完成后,本发明引入“活化能障碍”的概念来表示各联邦成员间模型同步的困难度。具体的,活化能障碍表示从一个联邦体的模型转移到另一个联邦体的模型所需的“能量”。定义活化能障碍为:
其中,表示联邦体和联邦体之间的活化能障碍,和分别代表联邦体和的模型权重;是一个调节参数,用于调整活化能障碍的大小。
进一步地,在各联邦成员之间进行模型和日志共享时,跨联邦的权重进行同步,基于活化能障碍的概念,权重同步策略可以表示为:
其中,是联邦体更新后的模型权重,是权重同步的学习率,是一个衰减因子,表示活化能障碍对模型同步的影响。
基于此,当两个联邦体的模型非常相似时(活化能障碍较小),其权重同步会更快;反之,当两个联邦体的模型差异很大时,权重的同步会比较慢,从而避免过度扰动。
进一步地,为了确保整体的学习效果,在每次跨联邦同步后进行模型的评估。评估策略可以表示为:
其中,是模型的整体评估得分,是联邦体在其数据上使用权重的模型损失,是联邦体的总数。
参见图2所示的一种故障诊断方法的流程示意图,该方法主要包括以下步骤S202至步骤S204:
步骤S202,获取待诊断工业设备数据。
步骤S204,将待诊断工业设备数据输入至预先构建的设备故障诊断模型中,确定故障诊断结果,并将故障诊断结果反馈至用户端,其中,设备故障诊断模型为基于上述设备故障诊断模型的训练方法训练得到的,在一种实施方式中,在应用设备故障诊断模型对待诊断工业设备数据进行诊断之前,还需要对设备故障诊断模型进行校验,通过多个参考诊断模型对信号数据集进行分类,得到参考分类结果,并确定设备故障诊断模型的分类结果对应的置信度分数和可信度分数,以及多个参考诊断模型的参考分类结果对应的置信度分数和可信度分数;根据置信度分数和可信度分数,确定设备故障诊断模型对应的第一校验分数,以及多个参考诊断模型对应的第二校验分数,并根据第一校验分数和第二校验分数对应的校验分数均值对设备故障诊断模型进行模型校验,最后,在校验分数均值满足预设的分数均值阈值时,得到校验后的设备故障诊断模型,并利用该模型对待诊断工业设备数据进行故障诊断。
本发明实施例提供的上述故障诊断方法,应用设备故障诊断模型对待诊断工业设备数据进行数据诊断,可以显著提升故障诊断效率以及故障诊断的准确性。
对于前述实施例提供的设备故障诊断模型的训练方法,本发明实施例提供了一种设备故障诊断模型的训练装置,参见图3所示的一种设备故障诊断模型的训练的结构示意图,该装置包括以下部分:
样本数据采集模块302,获取样本数据集合,其中,样本数据集合包括:工业设备运行数据集合和工业设备运行数据集合中各项工业设备运行数据的类型标签;
模型生成模块304,利用类型标签相同的工业设备运行数据确定基础模型集合,其中,基础模型集合包括:主模型和子模型集合;
主模型训练模块306,基于工业设备运行数据集合,对主模型进行模型训练,确定目标主模型;
子模型训练模块308,通过知识蒸馏算法,基于目标主模型对各项子模型进行信息交换处理,以使各项子模型学习目标主模型的模型训练方法,并利用模型训练方法进行模型训练,确定目标子模型集合;
模型融合模块310,将目标主模型和目标子模型集合进行模型融合处理,确定设备故障诊断模型;
本申请实施例提供的上述设备故障诊断模型的训练装置,可以通过知识蒸馏,显著提升故障诊断效率以及故障诊断的准确性。
一种实施方式中,在进行基于工业设备运行数据集合,对主模型进行模型训练,确定目标主模型的步骤时,上述主模型训练模块306还用于:通过特征提取网络,对工业设备运行数据集合中,与主模型对应的样本数据进行特征提取处理,确定目标特征向量,其中,特征提取网络包括:第一特征提取网络和第二特征提取网络;根据目标特征向量,对预设分类器进行分类训练,确定目标主模型,其中,预设分类器根据基于改进量子编码的高阶神经网络算法进行设置。
一种实施方式中,第一特征提取网络包括:光学衍射参数优化神经网络模型,第二特征提取网络包括:磁力优化神经网络模型,在进行通过特征提取网络对主模型中的样本数据进行特征提取处理,确定目标特征向量的步骤时,上述主模型训练模块306还用于:通过第一特征提取网络中的光学衍射参数优化神经网络模型,基于样本数据,进行参数优化处理和特征提取处理,确定第一特征向量;通过第二特征提取网络中的磁力优化神经网络模型,基于样本数据,进行参数更新处理和特征提取处理,确定第二特征向量;将第一特征向量和第二特征向量进行特征融合处理,确定目标特征向量。
一种实施方式中,在进行通过第一特征提取网络中的光学衍射参数优化神经网络模型,基于样本数据,进行参数优化处理和特征提取处理,确定第一特征向量的步骤时,上述主模型训练模块306还用于:根据光学衍射参数优化神经网络模型,对第一特征提取网络中的第一特征提取模型的模型参数进行参数优化处理,并针对优化后的模型参数进行复杂度验证和稳定性验证,确定第一目标特征提取模型;通过第一目标特征提取模型,对样本数据进行特征提取处理,确定第一特征向量。
一种实施方式中,在进行通过第二特征提取网络中的磁力优化神经网络模型,基于样本数据,进行参数更新处理和特征提取处理,确定第二特征向量的步骤时,上述主模型训练模块306还用于:根据磁力优化神经网络模型,对第二特征提取网络中的第二特征提取模型的模型参数进行参数更新处理,对模型参数进行迭代计算,并在模型参数达到预设动态阈值时,确定第二目标特征提取模型;通过第二目标特征提取模型,对样本数据进行特征提取处理,确定第二特征向量。
一种实施方式中,在进行将目标主模型和目标子模型集合进行模型融合处理,确定设备故障诊断模型的步骤时,上述模型融合模块310还用于:通过预设活化能障碍诊断模型,对目标主模型和目标子模型集合中各项目标子模型融合的活化能障碍值进行检测,其中,两个模型间的活化能障碍值越低,则模型差异越小;通过预设权重同步模型,根据活化能障碍值由低到高的顺序,对目标主模型和各项目标子模型进行模型融合处理,确定设备故障诊断模型。
对于前述实施例提供的故障诊断方法,本发明实施例提供了一种故障诊断装置,参见图4所示的一种故障诊断装置的结构示意图,该装置包括以下部分:
数据采集模块402,获取待诊断工业设备数据;
故障诊断模块404,将待诊断工业设备数据输入至预先构建的设备故障诊断模型中,确定故障诊断结果,并将故障诊断结果反馈至用户端,其中,设备故障诊断模型为基于上述任一项的设备故障诊断模型的训练方法训练得到的。
本申请实施例提供的上述故障诊断装置,应用设备故障诊断模型对待诊断工业设备数据进行数据诊断,可以显著提升故障诊断效率以及故障诊断的准确性。
本发明实施例所提供的装置,其实现原理及产生的技术效果和前述方法实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。
本发明实施例提供了一种服务器,具体的,该服务器包括处理器和存储装置;存储装置上存储有计算机程序,计算机程序在被所述处理器运行时执行如上所述实施方式的任一项所述的方法 。
图5为本发明实施例提供的一种服务器的结构示意图,该服务器100包括:处理器50,存储器51,总线52和通信接口53,所述处理器50、通信接口53和存储器51通过总线52连接;处理器50用于执行存储器51中存储的可执行模块,例如计算机程序。
其中,存储器51可能包含高速随机存取存储器(RAM,Random Access Memory),也可能还包括非不稳定的存储器(non-volatilememory),例如至少一个磁盘存储器。通过至少一个通信接口53(可以是有线或者无线)实现该系统网元与至少一个其他网元之间的通信连接,可以使用互联网,广域网,本地网,城域网等。
总线52可以是ISA总线、PCI总线或EISA总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图5中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
其中,存储器51用于存储程序,所述处理器50在接收到执行指令后,执行所述程序,前述本发明实施例任一实施例揭示的流过程定义的装置所执行的方法可以应用于处理器50中,或者由处理器50实现。
处理器50可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器50中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器50可以是通用处理器,包括中央处理器(CentralProcessingUnit,简称CPU)、网络处理器(NetworkProcessor,简称NP)等;还可以是数字信号处理器(Digital SignalProcessing,简称DSP)、专用集成电路(Application Specific Integrated Circuit,简称ASIC)、现成可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器51,处理器50读取存储器51中的信息,结合其硬件完成上述方法的步骤。
本发明实施例所提供的可读存储介质的计算机程序产品,包括存储了程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行前面方法实施例中所述的方法,具体实现可参见前述方法实施例,在此不再赘述。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
Claims (7)
1.一种设备故障诊断模型的训练方法,其特征在于,所述方法包括:
获取样本数据集合,其中,所述样本数据集合包括:工业设备运行数据集合和所述工业设备运行数据集合中各项工业设备运行数据的类型标签;
利用所述类型标签相同的所述工业设备运行数据确定基础模型集合,其中,所述基础模型集合包括:主模型和子模型集合;其中,将所述工业设备运行数据中所述类型标签相同的数据确定为一个基础模型;获取各个基础模型对应的属性和行为特征,并根据所述属性和所述行为特征确定各联邦对应的层级;
基于所述工业设备运行数据集合,对所述主模型进行模型训练,确定目标主模型,其中,通过特征提取网络,对所述工业设备运行数据集合中,与所述主模型对应的样本数据进行特征提取处理,确定目标特征向量,其中,所述特征提取网络包括:第一特征提取网络和第二特征提取网络;根据所述目标特征向量,对预设分类器进行分类训练,确定所述目标主模型,其中,所述预设分类器根据基于改进量子编码的高阶神经网络算法进行设置;
通过知识蒸馏算法,基于所述目标主模型对各项子模型进行信息交换处理,以使各项所述子模型学习所述目标主模型的模型训练方法,并利用所述模型训练方法进行模型训练,确定目标子模型集合,其中,在各联邦成员之间的数据存储与访问机制中,联邦成员之间的传播过程分为共性知识积累阶段和个性化阶段,在这两个阶段中,模型依次在联邦端传递,通过知识蒸馏进行自适应的信息交换,从而完成各子模型的模型训练,确定目标子模型集合;在共性知识积累阶段,为每个数据块分配动态变化的量子密钥,当数据需要被访问或修改时,该密钥会进行动态调整,同时,建立数据间的依赖关系图谱,当某个数据被访问或更改时,需要对与之关联的其他数据进行相应的调整,以保持整体数据生态的平衡;在个性化阶段,为防止因本地过分训练丢失共性知识,各联邦成员的模型训练完成后,采用基于环形知识蒸馏的策略,将模型的知识将从一个联邦传递到下一个,然后以此类推传递,直到返回原始的联邦,形成一个完整的循环,其中,在环形知识蒸馏过程中,上一联邦模型为主模型,下一联邦模型为子模型;
将所述目标主模型和所述目标子模型集合进行模型融合处理,确定设备故障诊断模型,其中,通过预设活化能障碍诊断模型,对所述目标主模型和所述目标子模型集合中各项目标子模型融合的活化能障碍值进行检测,其中,两个模型间的所述活化能障碍值越低,则模型差异越小;通过预设权重同步模型,根据所述活化能障碍值由低到高的顺序,对所述目标主模型和各项所述目标子模型进行模型融合处理,确定所述设备故障诊断模型。
2.根据权利要求1所述的设备故障诊断模型的训练方法,其特征在于,所述第一特征提取网络包括:光学衍射参数优化神经网络模型,所述第二特征提取网络包括:磁力优化神经网络模型,所述通过特征提取网络对所述主模型中的样本数据进行特征提取处理,确定目标特征向量的步骤,包括:
通过所述第一特征提取网络中的所述光学衍射参数优化神经网络模型,基于所述样本数据,进行参数优化处理和特征提取处理,确定第一特征向量;
通过所述第二特征提取网络中的所述磁力优化神经网络模型,基于所述样本数据,进行参数更新处理和特征提取处理,确定第二特征向量;
将所述第一特征向量和所述第二特征向量进行特征融合处理,确定所述目标特征向量。
3.根据权利要求2所述的设备故障诊断模型的训练方法,其特征在于,所述通过所述第一特征提取网络中的所述光学衍射参数优化神经网络模型,基于所述样本数据,进行参数优化处理和特征提取处理,确定第一特征向量的步骤,包括:
根据所述光学衍射参数优化神经网络模型,对所述第一特征提取网络中的第一特征提取模型的模型参数进行参数优化处理,并针对优化后的所述模型参数进行复杂度验证和稳定性验证,确定第一目标特征提取模型;
通过所述第一目标特征提取模型,对所述样本数据进行特征提取处理,确定所述第一特征向量。
4.根据权利要求2所述的设备故障诊断模型的训练方法,其特征在于,所述通过所述第二特征提取网络中的所述磁力优化神经网络模型,基于所述样本数据,进行参数更新处理和特征提取处理,确定第二特征向量的步骤,包括:
根据所述磁力优化神经网络模型,对所述第二特征提取网络中的第二特征提取模型的模型参数进行参数更新处理,对所述模型参数进行迭代计算,并在所述模型参数达到预设动态阈值时,确定第二目标特征提取模型;
通过所述第二目标特征提取模型,对所述样本数据进行特征提取处理,确定所述第二特征向量。
5.一种故障诊断方法,其特征在于,所述方法包括:
获取待诊断工业设备数据;
将所述待诊断工业设备数据输入至预先构建的设备故障诊断模型中,确定故障诊断结果,并将所述故障诊断结果反馈至用户端;
其中,所述设备故障诊断模型为基于权利要求1-4任一项所述的设备故障诊断模型的训练方法训练得到的。
6.一种设备故障诊断模型的训练装置,其特征在于,所述装置包括:
样本数据采集模块,获取样本数据集合,其中,所述样本数据集合包括:工业设备运行数据集合和所述工业设备运行数据集合中各项工业设备运行数据的类型标签;
模型生成模块,利用所述类型标签相同的所述工业设备运行数据确定基础模型集合,其中,所述基础模型集合包括:主模型和子模型集合;其中,将所述工业设备运行数据中所述类型标签相同的数据确定为一个基础模型;获取各个基础模型对应的属性和行为特征,并根据所述属性和所述行为特征确定各联邦对应的层级;
主模型训练模块,基于所述工业设备运行数据集合,对所述主模型进行模型训练,确定目标主模型,其中,通过特征提取网络,对所述工业设备运行数据集合中,与所述主模型对应的样本数据进行特征提取处理,确定目标特征向量,其中,所述特征提取网络包括:第一特征提取网络和第二特征提取网络;根据所述目标特征向量,对预设分类器进行分类训练,确定所述目标主模型,其中,所述预设分类器根据基于改进量子编码的高阶神经网络算法进行设置;
子模型训练模块,通过知识蒸馏算法,基于所述目标主模型对各项子模型进行信息交换处理,以使各项所述子模型学习所述目标主模型的模型训练方法,并利用所述模型训练方法进行模型训练,确定目标子模型集合,其中,在各联邦成员之间的数据存储与访问机制中,联邦成员之间的传播过程分为共性知识积累阶段和个性化阶段,在这两个阶段中,模型依次在联邦端传递,通过知识蒸馏进行自适应的信息交换,从而完成各子模型的模型训练,确定目标子模型集合;在共性知识积累阶段,为每个数据块分配动态变化的量子密钥,当数据需要被访问或修改时,该密钥会进行动态调整,同时,建立数据间的依赖关系图谱,当某个数据被访问或更改时,需要对与之关联的其他数据进行相应的调整,以保持整体数据生态的平衡;在个性化阶段,为防止因本地过分训练丢失共性知识,各联邦成员的模型训练完成后,采用基于环形知识蒸馏的策略,将模型的知识将从一个联邦传递到下一个,然后以此类推传递,直到返回原始的联邦,形成一个完整的循环,其中,在环形知识蒸馏过程中,上一联邦模型为主模型,下一联邦模型为子模型;
模型融合模块,将所述目标主模型和所述目标子模型集合进行模型融合处理,确定设备故障诊断模型,其中,通过预设活化能障碍诊断模型,对所述目标主模型和所述目标子模型集合中各项目标子模型融合的活化能障碍值进行检测,其中,两个模型间的所述活化能障碍值越低,则模型差异越小;通过预设权重同步模型,根据所述活化能障碍值由低到高的顺序,对所述目标主模型和各项所述目标子模型进行模型融合处理,确定所述设备故障诊断模型。
7.一种故障诊断装置,其特征在于,所述装置包括:
数据采集模块,获取待诊断工业设备数据;
故障诊断模块,将所述待诊断工业设备数据输入至预先构建的设备故障诊断模型中,确定故障诊断结果,并将所述故障诊断结果反馈至用户端;
其中,所述设备故障诊断模型为基于权利要求1-4任一项所述的设备故障诊断模型的训练方法训练得到的。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410138832.3A CN117668622B (zh) | 2024-02-01 | 2024-02-01 | 设备故障诊断模型的训练方法、故障诊断方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410138832.3A CN117668622B (zh) | 2024-02-01 | 2024-02-01 | 设备故障诊断模型的训练方法、故障诊断方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117668622A CN117668622A (zh) | 2024-03-08 |
CN117668622B true CN117668622B (zh) | 2024-05-10 |
Family
ID=90077316
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410138832.3A Active CN117668622B (zh) | 2024-02-01 | 2024-02-01 | 设备故障诊断模型的训练方法、故障诊断方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117668622B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118035799B (zh) * | 2024-04-11 | 2024-07-12 | 山东能源数智云科技有限公司 | 基于多维数据融合的充填开采设备故障诊断方法及装置 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103869379A (zh) * | 2014-03-24 | 2014-06-18 | 东南大学 | 基于遗传算法优化改进bp神经网络的磁力计校正方法 |
CN112101489A (zh) * | 2020-11-18 | 2020-12-18 | 天津开发区精诺瀚海数据科技有限公司 | 一种联邦学习与深度学习融合驱动的设备故障诊断方法 |
CN112286751A (zh) * | 2020-11-24 | 2021-01-29 | 华中科技大学 | 一种基于边云协同的高端装备故障智能诊断系统及方法 |
WO2021248868A1 (zh) * | 2020-09-02 | 2021-12-16 | 之江实验室 | 基于知识蒸馏的预训练语言模型的压缩方法及平台 |
CN115525038A (zh) * | 2022-10-26 | 2022-12-27 | 河北工业大学 | 一种基于联邦分层优化学习的设备故障诊断方法 |
CN116028891A (zh) * | 2023-02-16 | 2023-04-28 | 之江实验室 | 一种基于多模型融合的工业异常检测模型训练方法和装置 |
WO2023093177A1 (zh) * | 2021-11-29 | 2023-06-01 | 新智我来网络科技有限公司 | 设备故障诊断方法、装置、电子设备及存储介质 |
WO2023160060A1 (zh) * | 2022-02-24 | 2023-08-31 | 腾讯科技(深圳)有限公司 | 一种模型优化方法、装置、电子设备、计算机可读存储介质及计算机程序产品 |
CN117010534A (zh) * | 2023-09-27 | 2023-11-07 | 中国人民解放军总医院 | 一种基于环形知识蒸馏和元联邦学习的动态模型训练方法、系统及设备 |
WO2023216553A1 (zh) * | 2022-05-11 | 2023-11-16 | 广东电网有限责任公司东莞供电局 | 一种配电网多重故障诊断方法及系统 |
CN117113274A (zh) * | 2023-08-29 | 2023-11-24 | 中国人民解放军空军工程大学 | 基于联邦蒸馏的异构网络无数据融合方法、系统 |
CN117407781A (zh) * | 2023-12-14 | 2024-01-16 | 山东能源数智云科技有限公司 | 基于联邦学习的设备故障诊断方法及装置 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109933881A (zh) * | 2019-03-06 | 2019-06-25 | 武汉大学 | 一种基于优化深度信念网络的电力电子电路故障诊断方法 |
CN110780146B (zh) * | 2019-12-10 | 2021-04-27 | 武汉大学 | 基于多阶段迁移学习的变压器故障辨识与定位诊断方法 |
-
2024
- 2024-02-01 CN CN202410138832.3A patent/CN117668622B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103869379A (zh) * | 2014-03-24 | 2014-06-18 | 东南大学 | 基于遗传算法优化改进bp神经网络的磁力计校正方法 |
WO2021248868A1 (zh) * | 2020-09-02 | 2021-12-16 | 之江实验室 | 基于知识蒸馏的预训练语言模型的压缩方法及平台 |
CN112101489A (zh) * | 2020-11-18 | 2020-12-18 | 天津开发区精诺瀚海数据科技有限公司 | 一种联邦学习与深度学习融合驱动的设备故障诊断方法 |
CN112286751A (zh) * | 2020-11-24 | 2021-01-29 | 华中科技大学 | 一种基于边云协同的高端装备故障智能诊断系统及方法 |
WO2023093177A1 (zh) * | 2021-11-29 | 2023-06-01 | 新智我来网络科技有限公司 | 设备故障诊断方法、装置、电子设备及存储介质 |
WO2023160060A1 (zh) * | 2022-02-24 | 2023-08-31 | 腾讯科技(深圳)有限公司 | 一种模型优化方法、装置、电子设备、计算机可读存储介质及计算机程序产品 |
WO2023216553A1 (zh) * | 2022-05-11 | 2023-11-16 | 广东电网有限责任公司东莞供电局 | 一种配电网多重故障诊断方法及系统 |
CN115525038A (zh) * | 2022-10-26 | 2022-12-27 | 河北工业大学 | 一种基于联邦分层优化学习的设备故障诊断方法 |
CN116028891A (zh) * | 2023-02-16 | 2023-04-28 | 之江实验室 | 一种基于多模型融合的工业异常检测模型训练方法和装置 |
CN117113274A (zh) * | 2023-08-29 | 2023-11-24 | 中国人民解放军空军工程大学 | 基于联邦蒸馏的异构网络无数据融合方法、系统 |
CN117010534A (zh) * | 2023-09-27 | 2023-11-07 | 中国人民解放军总医院 | 一种基于环形知识蒸馏和元联邦学习的动态模型训练方法、系统及设备 |
CN117407781A (zh) * | 2023-12-14 | 2024-01-16 | 山东能源数智云科技有限公司 | 基于联邦学习的设备故障诊断方法及装置 |
Non-Patent Citations (2)
Title |
---|
王太勇 ; 王廷虎 ; 王鹏 ; 乔卉卉 ; 徐明达 ; .基于注意力机制BiLSTM的设备智能故障诊断方法.天津大学学报(自然科学与工程技术版).2020,(第06期),第601-608页. * |
赵琳琳 ; 温国锋 ; 邵良杉 ; .不均衡数据下的采空区煤自燃PCA-AdaBoost预测模型.中国安全科学学报.2018,(第03期),第74-78页. * |
Also Published As
Publication number | Publication date |
---|---|
CN117668622A (zh) | 2024-03-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Eggensperger et al. | Efficient benchmarking of hyperparameter optimizers via surrogates | |
Gallo | Artificial neural networks tutorial | |
CN117668622B (zh) | 设备故障诊断模型的训练方法、故障诊断方法及装置 | |
Ding et al. | Structural damage identification by sparse deep belief network using uncertain and limited data | |
CN105975573A (zh) | 一种基于knn的文本分类方法 | |
CN114548591B (zh) | 一种基于混合深度学习模型和Stacking的时序数据预测方法及系统 | |
Volna et al. | Multi-classifier based on Elliott wave’s recognition | |
Mahmoodi et al. | A developed stock price forecasting model using support vector machine combined with metaheuristic algorithms | |
CN118070682B (zh) | 基于人工智能的螺旋栓吊环受损评估方法及装置 | |
CN113159264A (zh) | 一种入侵检测方法、系统、设备及可读存储介质 | |
CN115905848A (zh) | 基于多模型融合的化工过程故障诊断方法及系统 | |
Rimal et al. | Hyperparameter determines the best learning curve on single, multi-layer and deep neural network of student grade prediction of Pokhara university Nepal | |
CN117472789B (zh) | 基于集成学习的软件缺陷预测模型构建方法和装置 | |
CN115269247A (zh) | 基于深度森林的闪存坏块预测方法、系统、介质及设备 | |
CN118151020A (zh) | 一种电池安全性能的检测方法及系统 | |
CN117407781B (zh) | 基于联邦学习的设备故障诊断方法及装置 | |
CN109255389B (zh) | 一种装备评价方法、装置、设备及可读存储介质 | |
CN118032327A (zh) | 基于人工智能的设备智能润滑监测方法及装置 | |
CN110738363A (zh) | 一种光伏发电功率预测模型及其构建方法和应用 | |
Lv et al. | An improved test selection optimization model based on fault ambiguity group isolation and chaotic discrete PSO | |
Li et al. | Cross-project defect prediction via ASTToken2Vec and BLSTM-based neural network | |
Wang et al. | Mutual information-weighted principle components identified from the depth features of stacked autoencoders and original variables for oil dry point soft sensor | |
CN115936773A (zh) | 一种互联网金融黑产识别方法与系统 | |
CN111026661B (zh) | 一种软件易用性全面测试方法及系统 | |
Chander et al. | Auto-encoder—lstm-based outlier detection method for wsns |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |