CN114169433A - 一种基于联邦学习+图学习+cnn的工业故障预测方法 - Google Patents

一种基于联邦学习+图学习+cnn的工业故障预测方法 Download PDF

Info

Publication number
CN114169433A
CN114169433A CN202111485624.3A CN202111485624A CN114169433A CN 114169433 A CN114169433 A CN 114169433A CN 202111485624 A CN202111485624 A CN 202111485624A CN 114169433 A CN114169433 A CN 114169433A
Authority
CN
China
Prior art keywords
cnn
learning
feature
module
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111485624.3A
Other languages
English (en)
Inventor
王玉乾
张卫山
陈雷鸣
董次浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China University of Petroleum East China
Original Assignee
China University of Petroleum East China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China University of Petroleum East China filed Critical China University of Petroleum East China
Priority to CN202111485624.3A priority Critical patent/CN114169433A/zh
Publication of CN114169433A publication Critical patent/CN114169433A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Image Analysis (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提出了一种基于联邦学习+图学习+CNN的工业故障预测方法,基于联邦学习框架和图结构生成的思想,结合卷积神经网络,设计了一种工业故障预测的神经网络FG‑CNN(Federate Learning+Graph Learning+Convolutional Neural Networks)。FG‑CNN首先基于了联邦学习的框架,在保证数据隐私安全以及合法合规的基础上,实现能够在业务相似的工厂之间共同建模,提升人工智能模型的效果。另外由于工厂间形成的高维时间序列数据是由不同传感器记录的,且不同传感器记录的数据之间总存在这一些微妙的联系,如何能够捕捉到这些传感器之间关系,并检测和解释这些关系的异常情况对于故障预测结果有着显著的影响。FG‑CNN能够在学习到各个特征之间关系的同时保护各个工厂的数据隐私并提高模型预测的准确率以及模型的泛化性。

Description

一种基于联邦学习+图学习+CNN的工业故障预测方法
技术领域
本发明涉及工业互联网领域、深度学习领域、具体涉及到一种基于联邦学习+图学习+CNN的工业故障预测方法。
背景技术
FG-CNN主要基于联邦学习和图结构生成的思想,通过联邦学习机制,达到在不泄露数据隐私的情况下提高训练模型的泛化性。同时在卷积神经网络的特征输入中结合图结构学习和数据融合,能够有效的将每一个特征与其他相关特征进行聚合表示,使得融合后的数据能够综合所有相关特征的信息,来提高模型预测的准确度。
发明内容
为解决现有技术中的缺点和不足,本发明提出了一种基于联邦学习+图学习+CNN的工业故障预测方法,对工业设备传感器间的关系进行学习。本发明的技术方案为:
一种基于联邦学习+图学习+CNN的工业故障预测方法,包括以下部分:特征聚类、图生成、数据融合。
(1)特征聚类是对每个特征的数据点进行K-Means聚类,输入的样本是该特征的所有数据点D={x1,x2,...xn},聚类的簇数是k,从特征数据中选择k个样本作为初始的k个质心向量:{u1,u2,...uk},然后计算特征中的每一个数据点xi和各个质心向量uj的距离:
Figure BDA0003396396270000021
并将xi标记为最小的dij所对应的类别λi
Figure BDA0003396396270000022
并对j=1,2,……k,对Cj中所有的样本点重新计算新的质心:
Figure BDA0003396396270000023
直到k个质心向量都没有变化则输出簇划分C={C1,C2,...Ck}。
(2)图生成部分首先在每个特征聚类后的k个类别中进行分层抽样,即在k个类别中等比抽取部分样本,然后对各个特征抽取后的样本点向量按照标准化欧氏距离进行相似度度量,向量a(x11,x12,...,x1n)和向量b(x21,x22,...,x2n)之间的距离可按照如下计算:
Figure BDA0003396396270000024
其中sk为向量X的标准差。筛选出与当前向量相似的前k个特征组成有向图。
(3)数据融合
定义融合函数为y(t)=f(d1(t)+d2(t)+...dn(t)),di(t)(i=1,2...N)为传感器i在t时刻收集到的数据,可选择的融合函数有sum、average、max等。表达式如下:
sum:
Figure BDA0003396396270000025
average:
Figure BDA0003396396270000026
max:max{d1(t),d2(t)...dn(t)}
本发明的有益效果:
(1)使用聚类算法对每一个特征间的数据进行处理,在保证保留原始特征数据信息的前提下,降低计算的空间复杂度。
(2)使用图结构思想来对多传感器间的关系进行学习,有效的捕捉到多个传感器之间的内在联系;
(3)利用学习到的图结构对各特征进行数据融合来作为神经网络的最终输入,因此输入的每一特征能够综合和本特征相关的其余特征的信息;
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明联邦学习部分的架构图;
图2为本发明的总体架构图;
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的一种基于联邦学习+图学习+CNN的工业故障预测方法,在原有的CNN神经网络上,对特征间的关系进行学习,并结合学习到的关系对每一个特征进行聚合表示来作为CNN神经网络的输入。使得神经网络能够更好地结合每一个传感器间的隐藏关系。该方法共包含以下六个模块:信息嵌入模块、特征聚类模块、分层抽样模块、图生成模块、数据融合模块、联邦学习模块。
下面对联邦学习+图学习+CNN的工业故障预测方法的具体流程进行详细说明:
步骤(1):对传感器采集到的数据进行数据清洗(如无效数据的去除、缺失数据的补齐等);
步骤(2):对清洗后的数据采用滑动窗口的形式每次错开指定长度进行数据增强处理;
步骤(3):将处理好的数据进行嵌入,以获取各特征在更高维空间的表示,为之后的聚类操作做好铺垫;
步骤(4):对各特征进行聚类,来确定每个特征中数据的大体类别,并在每个特征中进行分层抽样来获取每个特征中每个类别的代表数据,以方便之后特征间相似度的度量,来降低计算的空间及时间复杂度;
步骤(5):利用标准化欧氏距离分别对每个特征抽样后的数据和其他特征抽样后的数据进行相似度的计算,对输入数据集的特征间的关系进行学习并抽象成有向图。随之对每个特征与其前k个有关联的其余特征进行数据融合,来得到该特征的聚合表示;
步骤(6):将聚合表示的特征输入到本地的CNN网络中进行故障预测,并在联邦学习的框架下进行模型上传与下发,直至损失足够小或者达到指定迭代次数;
本发明的基于联邦学习+图学习+CNN的工业故障预测方法,结合图结构的特点,能够在高维度的数据中,学习到特征之间的相似度,结合联邦学习的思想,能够有效的在保护各个节点数据隐私的同时提高故障预测的准确率。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (7)

1.一种基于联邦学习+图学习+CNN的工业故障预测方法(FG-CNN),在原有的CNN神经网络上,对特征间的关系进行学习,并结合学习到的关系对每一个特征进行聚合表示来作为CNN神经网络的输入。使得神经网络能够更好地结合每一个传感器间的隐藏关系。该方法共包含以下六个模块:信息嵌入模块、特征聚类模块、分层抽样模块、图生成模块、数据融合模块、联邦学习模块。
2.根据权利要求1所述的FG-CNN,其特征在于,所述的信息嵌入模块是指:将数据集的各个特征进行嵌入,来在更高维的特征空间中得到该数据集的表示。
3.根据权利要求1所述的FG-CNN,其特征在于,所述的特征聚类模块是指:对嵌入后的每个特征进行聚类,来确定每个特征中数据的大体类别。
4.根据权利要求1所述的FG-CNN,其特征在于,所述的分层抽样模块是指:在聚类后的每个特征中进行分层抽样来获取每个特征中每个类别的代表数据,以方便之后特征间相似度的度量,来降低计算的空间及时间复杂度。
5.根据权利要求1所述的FG-CNN,其特征在于,所述的图生成模块是指:利用标准化欧氏距离分别对每个特征抽样后的数据和其他特征抽样后的数据进行相似度的计算,对输入数据集的特征间的关系进行学习并抽象成有向图。
6.根据权利要求1所述的FG-CNN,其特征在于,所述的数据融合模块是指:对每个特征与其前k个有关联的其余特征进行数据融合,来得到该特征的聚合表示。
7.根据权利要求1所述的FG-CNN,其特征在于,所述的联邦学习模块是指:将聚合表示的特征输入到本地的CNN网络中进行故障预测,并在联邦学习的框架下进行模型更新,来提高该模型的泛化性。
CN202111485624.3A 2021-12-07 2021-12-07 一种基于联邦学习+图学习+cnn的工业故障预测方法 Pending CN114169433A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111485624.3A CN114169433A (zh) 2021-12-07 2021-12-07 一种基于联邦学习+图学习+cnn的工业故障预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111485624.3A CN114169433A (zh) 2021-12-07 2021-12-07 一种基于联邦学习+图学习+cnn的工业故障预测方法

Publications (1)

Publication Number Publication Date
CN114169433A true CN114169433A (zh) 2022-03-11

Family

ID=80483887

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111485624.3A Pending CN114169433A (zh) 2021-12-07 2021-12-07 一种基于联邦学习+图学习+cnn的工业故障预测方法

Country Status (1)

Country Link
CN (1) CN114169433A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115438735A (zh) * 2022-09-09 2022-12-06 中国电信股份有限公司 基于联邦学习的质检方法、系统、可读介质及电子设备

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115438735A (zh) * 2022-09-09 2022-12-06 中国电信股份有限公司 基于联邦学习的质检方法、系统、可读介质及电子设备

Similar Documents

Publication Publication Date Title
CN111581405B (zh) 基于对偶学习生成对抗网络的跨模态泛化零样本检索方法
CN114169330B (zh) 融合时序卷积与Transformer编码器的中文命名实体识别方法
CN105512289B (zh) 基于深度学习和哈希的图像检索方法
CN109919204B (zh) 一种面向噪声图像的深度学习聚类方法
CN111428789A (zh) 一种基于深度学习的网络流量异常检测方法
CN111832647A (zh) 异常流量检测系统及方法
CN104933444B (zh) 一种面向多维属性数据的多层聚类融合机制的设计方法
CN110321805B (zh) 一种基于时序关系推理的动态表情识别方法
CN113749657A (zh) 一种基于多任务胶囊的脑电情绪识别方法
CN111723667A (zh) 基于人体关节点坐标的智慧灯杆人群行为识别方法和装置
CN111861756A (zh) 一种基于金融交易网络的团伙检测方法及其实现装置
Yu et al. Autoencoder framework based on orthogonal projection constraints improves anomalies detection
Yang et al. Classification of medical images with synergic graph convolutional networks
Dong et al. Research on image classification based on capsnet
CN114169433A (zh) 一种基于联邦学习+图学习+cnn的工业故障预测方法
Lu et al. Image-specific prior adaptation for denoising
CN112668543B (zh) 一种手模型感知的孤立词手语识别方法
CN117853861A (zh) 农作物病害识别模型的训练方法及农作物病害识别方法
CN114912109B (zh) 一种基于图嵌入的异常行为序列识别方法及系统
CN116506210A (zh) 基于流量特征融合的网络入侵检测方法及系统
CN114882288B (zh) 基于分层图增强堆叠自编码器的多视图图像分类方法
CN114265954B (zh) 基于位置与结构信息的图表示学习方法
CN113191144B (zh) 一种基于传播影响力的网络谣言识别系统及方法
CN116257786A (zh) 一种基于多元时序图结构的异步时间序列分类方法
CN115661543A (zh) 一种多尺度的基于生成对抗网络的工业零件缺陷检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication