CN112783940B - 基于图神经网络的多源时序数据故障诊断方法和介质 - Google Patents

基于图神经网络的多源时序数据故障诊断方法和介质 Download PDF

Info

Publication number
CN112783940B
CN112783940B CN202011637583.0A CN202011637583A CN112783940B CN 112783940 B CN112783940 B CN 112783940B CN 202011637583 A CN202011637583 A CN 202011637583A CN 112783940 B CN112783940 B CN 112783940B
Authority
CN
China
Prior art keywords
data
source
time sequence
fault diagnosis
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011637583.0A
Other languages
English (en)
Other versions
CN112783940A (zh
Inventor
綦科
李文康
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Guoli Information Network Co.,Ltd.
Original Assignee
Guangzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou University filed Critical Guangzhou University
Priority to CN202011637583.0A priority Critical patent/CN112783940B/zh
Publication of CN112783940A publication Critical patent/CN112783940A/zh
Priority to JP2021136415A priority patent/JP7004364B1/ja
Application granted granted Critical
Publication of CN112783940B publication Critical patent/CN112783940B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2474Sequence data queries, e.g. querying versioned data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
    • Y04S10/52Outage or fault management, e.g. fault detection or location

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computing Systems (AREA)
  • Mathematical Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Biomedical Technology (AREA)
  • Algebra (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Fuzzy Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

本发明公开了基于图神经网络的多源时序数据故障诊断方法和介质,针对于故障检测的系统,获取历史多源时序数据;并且对多源时序历史数据进行数据预处理得到训练样本,通过训练样本对图神经网络模型进行训练,得到故障诊断模型;针对于要检测故障的系统,获取多源时序实时数据,并且进行数据预处理后输入到故障诊断模型,通过故障诊断模型输出系统的故障诊断结果。本发明采用图神经网络模型建立故障诊断模型,基于系统中获取到的多源时序数据进行故障诊断,多源时序数据具有两个维度特征,分别是时间维度的时序特征和多源数据相关性特征,本发明能够较佳的融合多源数据的相关性特征和时间维度的时序特征,能够有效的提高故障诊断的准确率和抗噪性。

Description

基于图神经网络的多源时序数据故障诊断方法和介质
技术领域
本发明属于智能故障诊断技术领域,特别涉及一种基于图神经网络的多源时序数据故障诊断方法和介质。
背景技术
大型系统的运行状态监测需要多传感器的协同工作。多传感器采集的多源时序数据为大型系统的故障诊断提供了信息基础:系统故障的发生与很多因素相关,多传感器采集的多源数据之间潜在有大量的有效关联信息,即系统故障的发生具有多源数据相关性;同时,系统故障的发生是一个渐变的过程,当前系统故障的发生与先前时间段系统的运行状态有着密切联系,即系统故障的发生具有时间相关性。
现有技术中,故障诊断方法一般包括基于数学模型的故障诊断、基于参数估计的故障诊断、基于信号处理的故障诊断、基于知识的故障诊断、基于神经网络的故障诊断等方法,其共性在于需要依据经验,手工设计和提取行故障诊断所需的故障特征;然而,人工设计故障特征具有适用性差、领域知识依赖性强、诊断准确性低等不足,因此,基于深度学习的智能故障诊断方法以其特征自动提取、准确性高等优点在大数据背景的故障诊断领域得到快速发展。
基于CNN(卷积神经网络)和LSTM(长短期记忆人工神经网络)的智能故障诊断应用广泛,能实现特征自动提取和故障分类诊断,但CNN和LSTM对多源数据的特征提取,一般采用多个CNN+LSTM分支的方式,每个分支分别提取单源数据特征后再进行多分支特征融合的处理方法,既弱化或丢失了多源数据之间的相关性特征,又增加了网络的复杂度,降低了故障诊断结果的准确性和效率。
发明内容
本发明的第一目的在于克服现有技术的缺点与不足,提供一种基于图神经网络的多源时序数据故障诊断方法,该方法能够较佳的融合多源数据的相关性特征和时间维度的时序特征,能够有效的提高故障诊断的准确率和抗噪性。
本发明的第二目的在于提供一种基于图神经网络的多源时序数据故障诊断装置。
本发明的第三目的在于提供一种存储介质。
本发明的第四目的在于提供一种计算设备。
本发明的第一目的通过下述技术方案实现:一种基于图神经网络的多源时序数据故障诊断方法,包括:
S1、针对于故障检测的系统,获取多源时序历史数据;
S2、针对多源时序历史数据进行数据预处理,得到训练样本;
S3、通过训练样本对图神经网络模型进行训练,得到故障诊断模型;
S4、针对于要检测故障的系统,获取多源时序实时数据,并且进行数据预处理;
S5、将多源时序实时数据预处理后的结果输入到故障诊断模型,通过故障诊断模型输出系统的故障诊断结果。
优选的,针对于多源时序历史数据和多源时序实时数据,进行数据预处理的过程如下:
SA、数据同步处理:针对于获取到的多源时序历史数据或多源时序实时数据,对各数据源的时序数据同步采样,即按照设定时间间隔△T同步获取各数据源在同一时刻的采样值,得到同步时序数据集D:
Figure BDA0002877062570000021
其中,M是数据源的总个数,N是采样数据长度;其中
Figure BDA0002877062570000022
表示:针对第k个数据源的时序数据进行采样时在时刻t采样到的数据,t0为采样的起始时刻;
其中,采用均值插补法进行缺失值处理,用于获取各数据源在同一时刻的采样值;
SB、归一化处理:对同步时序数据集D中各数据源在不同时刻的数据
Figure BDA0002877062570000023
采用min-max标准化处理,经过标准化处理后的数据集记为D*
SC、数据切片处理:数据切片处理定义为映射fslice:
Figure BDA0002877062570000024
且映射函数f(t)为:
f(t)=D*[t:t+d-1];
t=q*λ,q=0,1,2,...,L-1;
Figure BDA0002877062570000025
其中,d为切片长度,λ为移动步长,N是采样数据长度;
数据集D*经过上述切片处理后,得到长度为L的切片序列
Figure BDA0002877062570000026
Figure BDA0002877062570000027
其中:
Figure BDA0002877062570000028
Figure BDA0002877062570000029
表示切片数据Ij中的第m组数据,该组数据中包括标准化处理后的多个数据源同一时刻的数据。
更进一步的,步骤S2中,多源时序历史数据进行数据预处理后,将得到的切片序列
Figure BDA00028770625700000210
作为训练样本,各训练样本的标签为多源时序历史数据中最后一组数据获取时,系统对应的故障情况。
更进一步的,步骤S4中,获取的多源时序实时数据为系统在之前某时刻到当前时刻T的实时数据;在数据同步采样处理后,得到各数据源在第T-(N-1)△T时刻、第T-(N-2)△T时刻,…,第T-△T时刻、第T时刻的数据采样值,构成了多源时序实时数据对应的同步时序数据集D;然后经过步骤SB和SC处理后得到切片序列
Figure BDA0002877062570000031
将切片序列/>
Figure BDA0002877062570000032
作为输入到故障诊断模型,通过故障诊断模型输出系统的故障诊断结果。
更进一步的,所述图神经网络模型包括输入层、图构造层、GNN层和softmax层;其中:
输入层,用于输入多源时序历史数据或多源时序实时数据预处理后的切片时序数据集
Figure BDA0002877062570000033
图构造层,用于构造GNN层计算所需的图节点V和连接矩阵A;
GNN层,用于根据所述图节点V和连接矩阵A,计算并更新图中每个节点的节点隐藏状态,并基于此计算每个结点的输出,其中:
GNN节点隐藏状态更新:
Figure BDA0002877062570000034
GNN节点输出:
Figure BDA0002877062570000035
其中,
Figure BDA0002877062570000036
为节点i的M维节点特征值,ek为邻接节点k的M维节点特征值,Ni为节点i的邻接节点集合,Aik为连接矩阵A中节点i与邻接节点k的边权,/>
Figure BDA0002877062570000037
表示垂直连接,
Figure BDA0002877062570000038
和/>
Figure BDA0002877062570000039
为可学习权重矩阵;
softmax层,用于执行运算y=softmax(O),其中表示对应样本的故障诊断预测概率,O为GNN层的输出向量,并根据预测概率的大小输出故障诊断结果。
更进一步的,所述GNN层为两层,分别为第一层GNN和第二层GNN;
其中,第一层GNN的图节点V1=(V1,V2,...,Vd)由各切片数据Ij中的所有组数据
Figure BDA00028770625700000310
组成,节点共有d个;各节点的节点特征对应为各切片数据中的各组数据,代表各数据源在同一时刻的数据采样值;连接矩阵A用于表示节点和相邻节点间的时间维度相关作用关系,沿时间维度建立与前后相邻3个节点之间的边连接,并赋予归一化边权,得到连接矩阵;
其中,第一层GNN分别对切片序列
Figure BDA00028770625700000311
中每个切片数据Ij进行计算,并输出嵌入向量Oj,j=1,2,...,L,并将输出嵌入向量Oj作为第二层GNN层的输入;
第二层GNN的图节点V2=(O1,O2,...,OL),L为切片序列长度;节点特征由嵌入向量构成,表示各切片的汇聚特征向量,第二层GNN中连接矩阵A与第一层GNN的连接矩阵A相同;
第二层GNN对第一层GNN的输出进行计算,并输出融合向量O,并将O作为softmax层的输入。
优选的,步骤S3中,在对图神经网络模型进行训练过程中,采用Almeida-Pineda算法作为模型训练算法,优化的代价函数选取交叉熵函数。
本发明的第二目的通过下述技术方案实现:一种基于图神经网络的多源时序数据故障诊断装置,包括:
第一数据获取模块,用于针对于故障检测的系统,获取历史多源时序数据;
第一数据处理模块,用于针对多源时序历史数据进行数据预处理,得到训练样本;
模型构建模块,用于通过训练样本对图神经网络模型进行训练,得到故障诊断模型;
第二数据处理模块,用于针对于要检测故障的系统,获取多源时序实时数据,并且进行数据预处理;
故障诊断模块,用于将多源时序实时数据预处理后的结果输入到故障诊断模型,通过故障诊断模型输出系统的故障诊断结果。
本发明的第三目的通过下述技术方案实现:一种存储介质,存储有程序,其特征在于,所述程序被处理器执行时,实现本发明第一目的所述的基于图神经网络的多源时序数据故障诊断方法。
本发明的第四目的通过下述技术方案实现:一种计算设备,包括处理器以及用于存储处理器可执行程序的存储器,其特征在于,所述处理器执行存储器存储的程序时,实现本发明第一目的所述的基于图神经网络的多源时序数据故障诊断方法。
本发明相对于现有技术具有如下的优点及效果:
本发明基于图神经网络的多源时序数据故障诊断方法,首先针对于故障检测的系统,获取历史多源时序历史数据;并且对多源时序历史数据进行数据预处理得到训练样本,通过训练样本对图神经网络模型进行训练,得到故障诊断模型;针对于要检测故障的系统,获取多源时序实时数据,并且进行数据预处理后输入到故障诊断模型,通过故障诊断模型输出系统的故障诊断结果。由上述可见,本发明采用图神经网络模型建立故障诊断模型,并且本发明基于系统中获取到的多源时序数据进行系统的故障判定,其中多源时序数据具有两个维度特征,一个是时间维度的时序特征,描述了多源数据在不同时刻的状态,一个是多源数据相关性特征,描述了在同一时刻多源数据之间的相互关系;因此本发明故障诊断模型能够较佳的融合多源数据的相关性特征和时间维度的时序特征,能够有效的提高故障诊断的准确率和抗噪性。
附图说明
图1是本发明故障诊断方法流程图。
图2是本发明故障诊断方法中数据预处理示意图。
图3是本发明故障诊断方法中故障诊断模型框架示意图。
图4是本发明故障诊断方法中图神经网络模型得到的连接矩阵图。
具体实施方式
下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。
实施例1
本实施例公开了一种基于图神经网络的多源时序数据故障诊断方法,该方法可以在针对系统的运行状态检测时,获取多个传感器检测到的数据,基于这些数据实现对系统的故障检测;其中系统可以是风力发电系统、地铁设备监测系统、电路设备监测系统等,针对系统检测采集相关数据的传感器包括温度传感器、湿度传感器、振动传感器、红外传感器、激光传感器、张力传感器、重力传感器、速度传感器、加速度传感器、超声波传感器、位移传感器、电流传感器、电压传感器、烟雾传感器等等。
本实施例的故障诊断检测方法,如图1所示,具体步骤如下:
S1、针对于故障检测的系统,获取多源时序历史数据。在本实施例中,可以获取系统上各种类型传感器在各时间段内检测到的历史数据,从而构成多源时序历史数据,多源数据包括当不限于温度传感器采集的温度数据,湿度传感器采集的湿度数据,振动传感器采集的振动数据,红外传感器采集的红外温度数据,激光传感器采集的距离数据,张力传感器采集的张力数据,重力传感器采集的重力数据,速度传感器采集的速度数据,加速度传感器采集的加速度数据,超声波传感器采集的超声波数据,位移传感器采集的位移数据,电流传感器采集的电流数据,电压传感器采集的电压数据,烟雾传感器采集的烟雾浓度数据。
S2、针对多源时序历史数据进行数据预处理,得到训练样本。
在本实施例中,可以获取多个多源时序历史数据,针对各多源时序历史数据分别数据预处理后,得到多个训练样本。其中针对于多源时序历史数据进行数据预处理的过程具体如步骤SA至SC所示:
SA、数据同步处理:对各数据源的时序数据同步采样,即按照设定时间间隔△T同步获取各数据源在同一时刻的采样值,得到同步时序数据集D:
Figure BDA0002877062570000051
其中,M是数据源的总个数,N是采样数据长度;其中
Figure BDA0002877062570000052
表示:针对第k个数据源的时序数据进行采样时在时刻t采样到的数据,t0为采样的起始时刻。
本实施例中,同步时序数据集D共有M列,分别对应M个数据源,每一列数据表示同一数据源在不同时刻即t0、t0+△T、t0+2△T,...,,t0+(N-1)×△T时刻的采样值,例如同步时序数据集D中第1列数据,各元素分别对应表示第1个数据源分别在t0、t0+△T、t0+2△T,...,,t0+(N-1)×△T时刻的采样值;同步时序数据集D共有N行,分别对应N个采样时刻,即从t0到t0+(N-1)×△T时刻,每一行数据对应不同数据源在同一时刻的采样值,例如同步时序数据集D的第一行数据,各元素分别对应表示第1,2,…,M个数据源在时刻t0的采样值。当然同步时序数据集D也不一定要为上述数据格式,也可以是行和列的数据进行调换后的。
在本步骤中,采用均值插补法进行缺失值处理,用于获取到各数据源在同一时刻的采样值。
SB、归一化处理:对同步时序数据集D中各数据源在不同时刻的数据,即如上述步骤SA中得到的数据集D中的每一列数据
Figure BDA0002877062570000061
采用min-max标准化处理,经过标准化处理后的数据集记为D*,如图2中所示,网格代表归一化处理后得到的数据集D*,每一行代表一个采集样本(不同数据源(源1、源2,…,源M)在同一时刻的采样值),每一列表示同一数据源在时间轴上的变化(同一数据源在不同时刻的采样值),最后一列是样本的标签值。
SC、数据切片处理:数据切片处理定义为映射fslice:
Figure BDA0002877062570000062
且映射函数f(t)为:
f(t)=D*[t:t+d-1];
t=q*λ,q=0,1,2,...,L-1;
Figure BDA0002877062570000063
其中,d为切片长度,λ为移动步长,N是采样数据长度;在本实施例中,切片长度的取值范围为[20,100],移动步长λ的取值范围为[2,5]。
数据集D*经过上述切片处理后,得到长度为L的切片序列
Figure BDA0002877062570000064
Figure BDA0002877062570000065
其中,
Figure BDA0002877062570000066
Figure BDA0002877062570000067
表示切片数据Ij中的第m组数据,该组数据中包括标准化处理后的多个数据源同一时刻的数据,一个切片数据Ij中包括d组数据,对应切片长度为d。如图2中所示,基于步骤SA中同步时序数据集D的格式,当q=0时,得到对应切片数据I0,I0包括数据集D*中第1行到第d行总共d行数据,即切片长度对应为d。/>
Figure BDA0002877062570000068
表示切片数据Ij的中的第m行数据,例如当Ij为I0时,/>
Figure BDA0002877062570000069
表示数据集D*的第1行到第d行的数据中的第m行数据。
在本实施例中,多源时序历史数据经过步骤SA至SC处理后,获取到步骤SC所示的长度为L的切片序列
Figure BDA00028770625700000610
将切片序列/>
Figure BDA00028770625700000611
作为训练样本,即每一训练样本包括L个切片数据,分别是切片数据I0,I1,...,Ij,...,IL-1;本实施例中,将多源时序历史数据中最后一组数据获取时系统对应的故障情况作为训练样本的标签,如图2中所示,将多源时序历史数据中最后一行数据获取时,系统对应的故障情况作为训样本的标签。
S3、通过训练样本对图神经网络模型进行训练,得到故障诊断模型。在本实施例中,在对图神经网络模型进行训练过程中,采用Almeida-Pineda算法作为模型训练算法,优化的代价函数选取交叉熵函数。
S4、针对于要检测故障的系统,获取多源时序实时数据,并且进行数据预处理。
在本实施例中,多源时序实时数据的数据预处理过程如上述步骤SA至SC所示,此处不再赘述。本实施例中获取的多源时序实时数据为系统在之前某时刻到当前时刻T的实时数据;在数据同步采样处理后,得到各数据源在第T-(N-1)△T时刻、第T-(N-2)△T时刻,…,第T-△T时刻、第T时刻总共N个数据采样值,即当前时刻T时刻对应步骤SA中的t0+(N-1)×△T时刻,每个数据源总共包括N个采样值,所有数据源的N个采样值构成了多源时序实时数据对应的同步时序数据集D;同步时序数据集D在经过步骤SB和SC处理后得到切片序列
Figure BDA0002877062570000071
切片序列/>
Figure BDA0002877062570000072
中包括L个切片数据,每个切片数据包括d行数据。
S5、将多源时序实时数据预处理后的结果输入到故障诊断模型,通过故障诊断模型输出系统的故障诊断结果。在本实施例中,将步骤S4中获取到的切片序列
Figure BDA0002877062570000073
作为输入到故障诊断模型,通过故障诊断模型输出系统的故障诊断结果。
在本实施例中,如图3中所示,上述步骤所使用的图神经网络模型包括输入层、图构造层、GNN层和softmax层;其中:
输入层,用于输入多源时序历史数据或多源时序实时数据预处理后的切片时序数据集
Figure BDA0002877062570000074
图构造层,用于构造GNN层计算所需的图节点V和连接矩阵A。
GNN层,用于根据所述图节点V和连接矩阵A,计算并更新图中每个节点的节点隐藏状态,并基于此计算每个结点的输出,其中:
GNN节点隐藏状态更新:
Figure BDA0002877062570000075
GNN节点输出:
Figure BDA0002877062570000076
其中,
Figure BDA0002877062570000077
为节点i的M维节点特征值,ek为邻接节点k的M维节点特征值,Ni为节点i的邻接节点集合,Ai,k为连接矩阵A中节点i与邻接节点k的边权,/>
Figure BDA0002877062570000078
表示垂直连接,/>
Figure BDA0002877062570000079
和/>
Figure BDA00028770625700000710
为可学习权重矩阵。/>
softmax层,用于执行运算y=softmax(O),其中表示对应样本的故障诊断预测概率,O为GNN层的输出向量,并根据预测概率的大小输出故障诊断结果。
本实施例中,GNN层为两层,分别为第一层GNN和第二层GNN;
其中,第一层GNN的图节点V1=(V1,V2,...,Vd)由各切片数据Ij中的所有组数据即所有行数据
Figure BDA0002877062570000081
组成,节点共有d个;各节点的节点特征行值构成,对应为各切片数据中的各行数据,代表各数据源在同一时刻的数据采样值;连接矩阵A用于表示节点和相邻节点间的时间维度相关作用关系,沿时间维度建立与前后相邻3个节点之间的边连接,如图4中所示,并赋予归一化边权,得到连接矩阵A,其中当d为7时,对应包括节点1至节点7,得到的连接矩阵A如下:
Figure BDA0002877062570000082
上述连接矩阵A对应图4中左边表格。
其中,在本实施例中,第一层GNN分别对切片序列
Figure BDA0002877062570000083
中每个切片数据Ij进行计算,并输出嵌入向量Oj,j=1,2,...,L,并将输出嵌入向量Oj作为第二层GNN层的输入;
第二层GNN的图节点V2=(O1,O2,...,OL),L为切片序列长度;节点特征由嵌入向量构成,表示各切片的汇聚特征向量,第二层GNN中连接矩阵A与第一层GNN的连接矩阵A相同;
第二层GNN对第一层GNN的输出进行计算,并输出融合向量O,并将O作为softmax层的输入。
本实施例中,在步骤S3完成故障诊断模型的建立后,可以通过优化的网格搜索确定故障诊断模型的超参数,包括移动步长,切片长度,其中,移动步长初始值为2,取值范围为[2,5],切片长度初始值为30,取值范围为[20,100]。在对本实施例的超参数选取时,通过不同的超参数取值,对模型进行评估,直至获取最优超参数。
在本实施例中,可以采用准确率函数评估故障诊断模型的性能。设N′为测试集的样本总数,I(x)为指标函数,当x为真时,其返回值为1;当x为假时,其返回值为0。则故障诊断模型对测试集的评估准确率定义为:
Figure BDA0002877062570000084
其中,yi为第i个样本预测值,i label(i)为第i个样本标签值。
本领域技术人员可以理解,实现本实施例方法中的全部或部分步骤可以通过程序来指令相关的硬件来完成,相应的程序可以存储于计算机可读存储介质中。应当注意,尽管在附图中以特定顺序描述了本实施例1的方法操作,但是这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。相反,描绘的步骤可以改变执行顺序,有些步骤也可以同时执行。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
实施例2
本实施例公开了一种基于图神经网络的多源时序数据故障诊断装置,包括第一数据获取模块、第一数据处理模块、模型构建模块、第二数据处理模块和故障诊断模块,各个模块实现的功能分别如下:
第一数据获取模块,用于针对于故障检测的系统,获取历史多源时序数据。
第一数据处理模块,用于针对多源时序历史数据进行数据预处理,得到训练样本。
模型构建模块,用于通过训练样本对图神经网络模型进行训练,得到故障诊断模型。
第二数据处理模块,用于针对于要检测故障的系统,获取多源时序实时数据,并且进行数据预处理。
故障诊断模块,用于将多源时序实时数据预处理后的结果输入到故障诊断模型,通过故障诊断模型输出系统的故障诊断结果。
进一步的,第一数据处理模块和第二数据处理模块均包括:
数据同步处理模块:用于数据同步处理;具体的,针对于获取到的多源时序历史数据或多源时序实时数据,对各数据源的时序数据同步采样,即按照设定时间间隔△T同步获取各数据源在同一时刻的采样值,得到同步时序数据集D:
Figure BDA0002877062570000091
其中,M是数据源的总个数,N是采样数据长度;其中
Figure BDA0002877062570000092
表示:针对第k个数据源的时序数据进行采样时在时刻t采样到的数据,t0为采样的起始时刻;
归一化处理模块,用于对数据进行归一化处理,具体的,对同步时序数据集D中各数据源在不同时刻的数据
Figure BDA0002877062570000093
采用min-max标准化处理,经过标准化处理后的数据集记为D*
数据切片模块:用于对数据集D*进行切片处理;在本实施例中,数据切片处理定义为映射fslice:
Figure BDA0002877062570000094
且映射函数f(t)为:
f(t)=D*[t:t+d-1];
t=q*λ,q=0,1,2,...,L-1;
Figure BDA0002877062570000095
其中,d为切片长度,λ为移动步长,N是采样数据长度;
数据集D*经过上述切片处理后的得到长度为L的切片序列
Figure BDA0002877062570000096
Figure BDA0002877062570000101
其中:
Figure BDA0002877062570000102
Figure BDA0002877062570000103
表示切片数据Ij中的第m组数据,该组数据中包括标准化处理后的多个数据源同一时刻的数据。
本实施例上述各个模块的具体实现可以参见上述实施例1,在此不再一一赘述。需要说明的是,本实施例提供的装置仅以上述各功能模块的划分进行举例说明,在实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。
实施例3
本实施例公开了一种存储介质,存储有程序,所述程序被处理器执行时,实现实施例1所述的基于图神经网络的多源时序数据故障诊断方法,如下:
针对于故障检测的系统,获取多源时序历史数据;
针对多源时序历史数据进行数据预处理,得到训练样本;
通过训练样本对图神经网络模型进行训练,得到故障诊断模型;
针对于要检测故障的系统,获取多源时序实时数据,并且进行数据预处理;
将多源时序实时数据预处理后的结果输入到故障诊断模型,通过故障诊断模型输出系统的故障诊断结果。
上述内容具体的操作过程见实施例1中描述,此处不再赘述。
在本实施例中,存储介质可以是磁盘、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、U盘、移动硬盘等介质。
实施例4
本实施例公开一种计算设备,包括处理器以及用于存储处理器可执行程序的存储器,其特征在于,所述处理器执行存储器存储的程序时,实现实施例1所述的基于图神经网络的多源时序数据故障诊断方法,如下:
针对于故障检测的系统,获取多源时序历史数据;
针对多源时序历史数据进行数据预处理,得到训练样本;
通过训练样本对图神经网络模型进行训练,得到故障诊断模型;
针对于要检测故障的系统,获取多源时序实时数据,并且进行数据预处理;
将多源时序实时数据预处理后的结果输入到故障诊断模型,通过故障诊断模型输出系统的故障诊断结果。
上述内容具体的操作过程见实施例1中描述,此处不再赘述。
本实施例中,计算设备可以是台式电脑、笔记本电脑、智能手机、PDA手持终端、平板电脑等终端设备。
综上,本发明采用图神经网络模型建立故障诊断模型,并且基于系统的传感器获取到的多源时序数据进行系统的故障判定,其中多源时序数据具有两个维度特征,一个是时间维度的时序特征,描述了多源数据在不同时刻的状态,一个是多源数据相关性特征,描述了在同一时刻多源数据之间的相互关系;因此本发明故障诊断模型能够较佳的融合多源数据的相关性特征和时间维度的时序特征,能够有效的提高故障诊断的准确率和抗噪性。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

Claims (9)

1.一种基于图神经网络的多源时序数据故障诊断方法,其特征在于,包括:
S1、针对于故障检测的系统,获取多源时序历史数据;
S2、针对多源时序历史数据进行数据预处理,得到训练样本,具体为:
SA、数据同步处理:针对于获取到的多源时序历史数据或多源时序实时数据,对各数据源的时序数据同步采样,即按照设定时间间隔ΔT同步获取各数据源在同一时刻的采样值,得到同步时序数据集D:
Figure FDA0004189204150000011
其中,M是数据源的总个数,N是采样数据长度;其中
Figure FDA0004189204150000012
表示:针对第k个数据源的时序数据进行采样时在时刻t采样到的数据,t0为采样的起始时刻;
其中,采用均值插补法进行缺失值处理,用于获取各数据源在同一时刻的采样值;
SB、归一化处理:对同步时序数据集D中各数据源在不同时刻的数据
Figure FDA0004189204150000013
采用min-max标准化处理,经过标准化处理后的数据集记为D*
SC、数据切片处理:数据切片处理定义为映射fslice:
Figure FDA0004189204150000014
且映射函数f(t)为:
f(t)=D*[t:t+d-1];
t=q*λ,q=0,1,2,...,L-1;
Figure FDA0004189204150000015
其中,d为切片长度,λ为移动步长,N是采样数据长度;
数据集D*经过上述切片处理后,得到长度为L的切片序列
Figure FDA0004189204150000016
Figure FDA0004189204150000017
其中:
Figure FDA0004189204150000018
Figure FDA0004189204150000019
表示切片数据Ij中的第m组数据,该组数据中包括标准化处理后的多个数据源同一时刻的数据;
S3、通过训练样本对图神经网络模型进行训练,得到故障诊断模型;
S4、针对于要检测故障的系统,获取多源时序实时数据,并且进行数据预处理;
S5、将多源时序实时数据预处理后的结果输入到故障诊断模型,通过故障诊断模型输出系统的故障诊断结果。
2.根据权利要求1所述的基于图神经网络的多源时序数据故障诊断方法,其特征在于,步骤S2中,多源时序历史数据进行数据预处理后,将得到的切片序列
Figure FDA0004189204150000021
作为训练样本,各训练样本的标签为多源时序历史数据中最后一组数据获取时,系统对应的故障情况。
3.根据权利要求1所述的基于图神经网络的多源时序数据故障诊断方法,其特征在于,步骤S4中,获取的多源时序实时数据为系统在之前某时刻到当前时刻T的实时数据;在数据同步采样处理后,得到各数据源在第T-(N-1)ΔT时刻、第T-(N-2)ΔT时刻,…,第T-ΔT时刻、第T时刻的数据采样值,构成了多源时序实时数据对应的同步时序数据集D;然后经过步骤SB和SC处理后得到切片序列
Figure FDA0004189204150000022
将切片序列/>
Figure FDA0004189204150000023
作为输入到故障诊断模型,通过故障诊断模型输出系统的故障诊断结果。
4.根据权利要求1所述的基于图神经网络的多源时序数据故障诊断方法,其特征在于,所述图神经网络模型包括输入层、图构造层、GNN层和softmax层;其中:
输入层,用于输入多源时序历史数据或多源时序实时数据预处理后的切片时序数据集
Figure FDA0004189204150000024
图构造层,用于构造GNN层计算所需的图节点V和连接矩阵A;
GNN层,用于根据所述图节点V和连接矩阵A,计算并更新图中每个节点的节点隐藏状态,并基于此计算每个结点的输出,其中:
GNN节点隐藏状态更新:
Figure FDA0004189204150000025
GNN节点输出:
Figure FDA0004189204150000026
其中,
Figure FDA0004189204150000027
为节点i的M维节点特征值,ek为邻接节点k的M维节点特征值,Ni为节点i的邻接节点集合,Ai,k为连接矩阵A中节点i与邻接节点k的边权,/>
Figure FDA0004189204150000028
表示垂直连接,
Figure FDA0004189204150000029
和/>
Figure FDA00041892041500000210
为可学习权重矩阵;
softmax层,用于执行运算y=softmax(O),其中表示对应样本的故障诊断预测概率,O为GNN层的输出向量,并根据预测概率的大小输出故障诊断结果。
5.根据权利要求4所述的基于图神经网络的多源时序数据故障诊断方法,其特征在于,所述GNN层为两层,分别为第一层GNN和第二层GNN;
其中,第一层GNN的图节点V1=(V1,V2,...,Vd)由各切片数据Ij中的所有组数据
Figure FDA00041892041500000211
组成,节点共有d个;各节点的节点特征对应为各切片数据中的各组数据,代表各数据源在同一时刻的数据采样值;连接矩阵A用于表示节点和相邻节点间的时间维度相关作用关系,沿时间维度建立与前后相邻3个节点之间的边连接,并赋予归一化边权,得到连接矩阵;
其中,第一层GNN分别对切片序列
Figure FDA00041892041500000212
中每个切片数据Ij进行计算,并输出嵌入向量Oj,j=1,2,...,L,并将输出嵌入向量Oj作为第二层GNN层的输入;
第二层GNN的图节点V2=(O1,O2,...,OL),L为切片序列长度;节点特征由嵌入向量构成,表示各切片的汇聚特征向量,第二层GNN中连接矩阵A与第一层GNN的连接矩阵A相同;
第二层GNN对第一层GNN的输出进行计算,并输出融合向量O,并将O作为softmax层的输入。
6.根据权利要求1所述的基于图神经网络的多源时序数据故障诊断方法,其特征在于,步骤S3中,在对图神经网络模型进行训练过程中,采用Almeida-Pineda算法作为模型训练算法,优化的代价函数选取交叉熵函数。
7.一种基于图神经网络的多源时序数据故障诊断装置,其特征在于,包括:
第一数据获取模块,用于针对于故障检测的系统,获取历史多源时序数据;
第一数据处理模块,用于针对多源时序历史数据进行数据预处理,得到训练样本,具体为:
SA、数据同步处理:针对于获取到的多源时序历史数据或多源时序实时数据,对各数据源的时序数据同步采样,即按照设定时间间隔ΔT同步获取各数据源在同一时刻的采样值,得到同步时序数据集D:
Figure FDA0004189204150000036
其中,M是数据源的总个数,N是采样数据长度;其中
Figure FDA0004189204150000031
表示:针对第k个数据源的时序数据进行采样时在时刻t采样到的数据,t0为采样的起始时刻;
其中,采用均值插补法进行缺失值处理,用于获取各数据源在同一时刻的采样值;
SB、归一化处理:对同步时序数据集D中各数据源在不同时刻的数据
Figure FDA0004189204150000032
采用min-max标准化处理,经过标准化处理后的数据集记为D*
SC、数据切片处理:数据切片处理定义为映射fslice:
Figure FDA0004189204150000033
且映射函数f(t)为:
f(t)=D*[t:t+d-1];
t=q*λ,q=0,1,2,...,L-1;
Figure FDA0004189204150000034
其中,d为切片长度,λ为移动步长,N是采样数据长度;
数据集D*经过上述切片处理后,得到长度为L的切片序列
Figure FDA0004189204150000035
Figure FDA0004189204150000041
其中:
Figure FDA0004189204150000042
Figure FDA0004189204150000043
表示切片数据Ij中的第m组数据,该组数据中包括标准化处理后的多个数据源同一时刻的数据;
模型构建模块,用于通过训练样本对图神经网络模型进行训练,得到故障诊断模型;
第二数据处理模块,用于针对于要检测故障的系统,获取多源时序实时数据,并且进行数据预处理;
故障诊断模块,用于将多源时序实时数据预处理后的结果输入到故障诊断模型,通过故障诊断模型输出系统的故障诊断结果。
8.一种存储介质,其特征在于,存储有程序,其特征在于,所述程序被处理器执行时,实现权利要求1~6中任一项所述的基于图神经网络的多源时序数据故障诊断方法。
9.一种计算设备,包括处理器以及用于存储处理器可执行程序的存储器,其特征在于,所述处理器执行存储器存储的程序时,实现权利要求1~6中任一项所述的基于图神经网络的多源时序数据故障诊断方法。
CN202011637583.0A 2020-12-31 2020-12-31 基于图神经网络的多源时序数据故障诊断方法和介质 Active CN112783940B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202011637583.0A CN112783940B (zh) 2020-12-31 2020-12-31 基于图神经网络的多源时序数据故障诊断方法和介质
JP2021136415A JP7004364B1 (ja) 2020-12-31 2021-08-24 グラフニューラルネットワークに基づくマルチソースタイミングデータ故障診断方法及び媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011637583.0A CN112783940B (zh) 2020-12-31 2020-12-31 基于图神经网络的多源时序数据故障诊断方法和介质

Publications (2)

Publication Number Publication Date
CN112783940A CN112783940A (zh) 2021-05-11
CN112783940B true CN112783940B (zh) 2023-06-09

Family

ID=75754968

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011637583.0A Active CN112783940B (zh) 2020-12-31 2020-12-31 基于图神经网络的多源时序数据故障诊断方法和介质

Country Status (2)

Country Link
JP (1) JP7004364B1 (zh)
CN (1) CN112783940B (zh)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114673246A (zh) * 2022-03-31 2022-06-28 成都工贸职业技术学院 一种污水管道防堵塞测量方法及其测量系统
CN114961949B (zh) * 2022-05-09 2024-01-16 潍柴动力股份有限公司 Scr系统的故障诊断方法、装置、设备和介质
CN114992138B (zh) * 2022-06-13 2024-03-26 湘潭大学 基于GAN-CNN-BiLSTM的工业循环水系统供水泵故障诊断方法
CN115051929B (zh) * 2022-06-20 2023-05-26 湖北工业大学 基于自监督目标感知神经网络的网络故障预测方法及装置
CN115453580A (zh) * 2022-09-13 2022-12-09 广东汇天航空航天科技有限公司 Gnss传感器的故障诊断方法、装置、导航系统及交通工具
CN115509789B (zh) * 2022-09-30 2023-08-11 中国科学院重庆绿色智能技术研究院 一种基于组件调用分析的计算系统故障预测方法和系统
CN115494349B (zh) * 2022-11-04 2023-04-07 国网浙江省电力有限公司金华供电公司 有源配电网单相接地故障区段定位方法
CN115712064B (zh) * 2022-11-07 2024-02-06 华能威海发电有限责任公司 一种基于lstm-cnn混合神经网络的励磁系统故障诊断方法
CN115758173B (zh) * 2022-11-16 2023-09-26 西华大学 基于并联图注意力网络的云平台系统异常检测方法及装置
CN116502172B (zh) * 2023-06-29 2023-09-01 青岛义龙包装机械有限公司 一种袋式包装机故障智能诊断方法及系统
CN116561229B (zh) * 2023-07-03 2023-09-08 厦门泛卓信息科技有限公司 一种基于图神经网络的数据同步方法、装置及存储介质
CN116699297B (zh) * 2023-08-08 2023-10-27 江西驴充充充电技术有限公司 充电桩检测系统及其方法
CN117153188A (zh) * 2023-08-29 2023-12-01 安徽理工大学 一种基于声音频率的变功率设备故障分析方法及装置
CN116910493B (zh) * 2023-09-12 2023-12-08 山东能源数智云科技有限公司 基于多源特征提取的设备故障诊断模型的构建方法及装置
CN117235465B (zh) * 2023-11-15 2024-03-12 国网江西省电力有限公司电力科学研究院 一种基于图神经网络录波分析的变压器故障类型诊断方法
CN117574327A (zh) * 2023-12-14 2024-02-20 盐城市崇达石化机械有限公司 一种压裂泵故障检测方法、系统及存储介质
CN117450688B (zh) * 2023-12-26 2024-03-29 山东历控能源有限公司 一种基于物联网的烟气余热回收能源调度管理方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104297637A (zh) * 2014-10-31 2015-01-21 国家电网公司 综合利用电气量和时序信息的电力系统故障诊断方法
CN111079931A (zh) * 2019-12-27 2020-04-28 浙江大学 一种基于图神经网络的状态空间概率性多时间序列预测方法
CN111461392A (zh) * 2020-01-23 2020-07-28 华中科技大学 一种基于图神经网络的电力故障预测方法及系统
CN111863231A (zh) * 2020-07-07 2020-10-30 广东技术师范大学天河学院 一种基于多源算法融合的智能自诊系统
CN112149730A (zh) * 2020-09-22 2020-12-29 中南大学 一种基于油样视觉的高速列车轴承故障预测方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7430602B2 (en) * 2002-12-20 2008-09-30 Qualcomm Incorporated Dynamically provisioned mobile station and method therefor
US10771488B2 (en) * 2018-04-10 2020-09-08 Cisco Technology, Inc. Spatio-temporal anomaly detection in computer networks using graph convolutional recurrent neural networks (GCRNNs)

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104297637A (zh) * 2014-10-31 2015-01-21 国家电网公司 综合利用电气量和时序信息的电力系统故障诊断方法
CN111079931A (zh) * 2019-12-27 2020-04-28 浙江大学 一种基于图神经网络的状态空间概率性多时间序列预测方法
CN111461392A (zh) * 2020-01-23 2020-07-28 华中科技大学 一种基于图神经网络的电力故障预测方法及系统
CN111863231A (zh) * 2020-07-07 2020-10-30 广东技术师范大学天河学院 一种基于多源算法融合的智能自诊系统
CN112149730A (zh) * 2020-09-22 2020-12-29 中南大学 一种基于油样视觉的高速列车轴承故障预测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Hanshuang Tong;Hanshuang Tong et al.;ArXiv;第1-9页 *

Also Published As

Publication number Publication date
CN112783940A (zh) 2021-05-11
JP2022105263A (ja) 2022-07-13
JP7004364B1 (ja) 2022-01-21

Similar Documents

Publication Publication Date Title
CN112783940B (zh) 基于图神经网络的多源时序数据故障诊断方法和介质
CN109581871B (zh) 免疫对抗样本的工业控制系统入侵检测方法
CN111352977B (zh) 基于自注意力双向长短期记忆网络的时序数据监测方法
CN115841004B (zh) 基于多维数据的带钢热轧过程力学性能软测量方法及装置
Son et al. Deep learning-based anomaly detection to classify inaccurate data and damaged condition of a cable-stayed bridge
CN116451848A (zh) 一种基于时空注意力机制的卫星遥测数据预测方法及装置
CN115329986A (zh) 基于可解释性图神经网络的风电机组异常检测与定位方法
CN114492184A (zh) 一种时频域分析航空发动机剩余使用寿命预测方法及装置
CN115146718A (zh) 基于深度表示的风电机组异常检测方法
CN116680624B (zh) 一种电力系统元数据的分类方法、系统及存储介质
CN116364203A (zh) 一种基于深度学习的水质预测方法、系统和装置
CN116244596A (zh) 基于tcn和注意力机制的工业时序数据异常检测方法
CN116008747A (zh) 基于小波阈值去噪的Yogi-mLSTM电缆局放识别方法与诊断系统
CN115270882A (zh) 基于神经常微分方程的轻量化智能故障诊断方法及系统
CN112560252A (zh) 一种航空发动机剩余寿命预测方法
CN113449465A (zh) 一种用于滚动轴承的寿命预测方法
CN113962432A (zh) 一种融合三维卷积与轻量卷积门限单元的风电预测方法及系统
CN113033414A (zh) 用电数据异常检测方法、装置、计算机设备和存储介质
Jin et al. Research on multi-sensor information fusion algorithm of fan detection robot based on improved BP neural network
CN116757338B (zh) 农作物产量预测方法、装置、电子设备及存储介质
Xia et al. A fault detection method for AUV based on multi-scale spatiotemporal feature fusion
Chen et al. A Multivariate Time Series Anomaly Detection Method Based on Generative Model
Xia et al. Research on Seismic Signal Recognition and Prejudgment Based on Deep Learning Model CNN
Gao et al. Fault Diagnosis Based on Sensitive SVD and Gaussian Process Latent Variable Model
CN117154680A (zh) 一种基于非平稳Transformer模型的风电功率预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20231211

Address after: Room 337, No. 64 Zhixin South Road, Yuexiu District, Guangzhou City, Guangdong Province, 510080

Patentee after: Guangdong Guoli Information Network Co.,Ltd.

Address before: 510006 No. 230 West Ring Road, Panyu District University, Guangdong, Guangzhou

Patentee before: Guangzhou University

TR01 Transfer of patent right