CN116881821A - 基于图神经网络的水轮机组监测数据异常检测方法及系统 - Google Patents
基于图神经网络的水轮机组监测数据异常检测方法及系统 Download PDFInfo
- Publication number
- CN116881821A CN116881821A CN202310574617.3A CN202310574617A CN116881821A CN 116881821 A CN116881821 A CN 116881821A CN 202310574617 A CN202310574617 A CN 202310574617A CN 116881821 A CN116881821 A CN 116881821A
- Authority
- CN
- China
- Prior art keywords
- monitoring data
- node
- representing
- turbine unit
- water turbine
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012544 monitoring process Methods 0.000 title claims abstract description 198
- 238000001514 detection method Methods 0.000 title claims abstract description 77
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 37
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims abstract description 80
- 238000000034 method Methods 0.000 claims abstract description 57
- 230000005856 abnormality Effects 0.000 claims abstract description 44
- 238000007781 pre-processing Methods 0.000 claims abstract description 10
- 239000013598 vector Substances 0.000 claims description 66
- 239000011159 matrix material Substances 0.000 claims description 29
- 230000006870 function Effects 0.000 claims description 28
- 238000000605 extraction Methods 0.000 claims description 26
- 230000002159 abnormal effect Effects 0.000 claims description 17
- 238000004364 calculation method Methods 0.000 claims description 14
- 230000004913 activation Effects 0.000 claims description 13
- 230000008569 process Effects 0.000 claims description 11
- ZZUFCTLCJUWOSV-UHFFFAOYSA-N furosemide Chemical compound C1=C(Cl)C(S(=O)(=O)N)=CC(C(O)=O)=C1NCC1=CC=CO1 ZZUFCTLCJUWOSV-UHFFFAOYSA-N 0.000 claims description 9
- 238000012545 processing Methods 0.000 claims description 9
- 230000002123 temporal effect Effects 0.000 claims description 6
- 238000005457 optimization Methods 0.000 claims description 5
- 238000010276 construction Methods 0.000 claims description 3
- 239000000284 extract Substances 0.000 claims description 2
- 238000011160 research Methods 0.000 abstract description 4
- 230000009286 beneficial effect Effects 0.000 description 15
- 238000013135 deep learning Methods 0.000 description 8
- 238000012360 testing method Methods 0.000 description 5
- 238000012549 training Methods 0.000 description 5
- 101100481876 Danio rerio pbk gene Proteins 0.000 description 3
- 101100481878 Mus musculus Pbk gene Proteins 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000011478 gradient descent method Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000001537 neural effect Effects 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 238000002759 z-score normalization Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2433—Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/042—Knowledge-based neural networks; Logical representations of neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02E—REDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
- Y02E10/00—Energy generation through renewable energy sources
- Y02E10/20—Hydro energy
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Testing And Monitoring For Control Systems (AREA)
Abstract
本发明公开了一种基于图神经网络的水轮机组监测数据异常检测方法及系统,属于设备检测技术领域,方法包括以下步骤:S1:采集水轮机组的历史监测数据集,并对历史监测数据集进行预处理,生成监测数据样本集;S2:利用监测数据样本集,构建并优化水轮机组监测数据异常检测模型;S3:采集水轮机组的最新监测数据,利用优化后的水轮机组监测数据异常检测模型进行监测数据异常检测。本发明的水轮机组监测数据样本集实时反映了水轮机组运行状态,针对水轮机组监测数据开展异常检测研究,及时发现异常数据,可以有效提高水轮机组安全性能,有效提升水轮机组可靠性能,保障水轮机组安全稳定运行。
Description
技术领域
本发明属于设备检测技术领域,具体涉及一种基于图神经网络的水轮机组监测数据异常检测方法及系统。
背景技术
水轮机是把水流的能量转变为旋转机械能的动力机械,是水电站关键设备之一。近年来随着水轮机组结构设计、工艺生产以及材料科学等多领域取得较大突破,水轮机组逐步向着复杂化和智能化发展,同时对水轮机组的维护需求也越来越高。
水轮机组监测数据为多元时间序列数据,具有高维度和海量的特点,实时反映了水轮机组的运行状态,监测数据内部存在复杂的时空相关性。水轮机组发生异常时,常常在出现区域异常数据特征,区域异常特征中隐含着复杂时空关系,传统机器学习方法或深度学习方法捕捉时间依赖关系的能力较差,本发明结合图神经网络强大的空间维度特征提取能力和LSTM强大时间维度特征提取能力,提出一种基于图神经网络的水轮机组异常检测方法。
发明内容
本发明的目的是为了解决水轮机组多元时间序列监测数据时空特征提取困难和异常监测准确率低的问题,提出了一种基于图神经网络的水轮机组监测数据异常检测方法及方法。
本发明的技术方案是:基于图神经网络的水轮机组监测数据异常检测方法包括以下步骤:
S1:采集水轮机组的历史监测数据集,并对历史监测数据集进行预处理,生成监测数据样本集;
S2:利用监测数据样本集,构建并优化水轮机组监测数据异常检测模型;
S3:采集水轮机组的最新监测数据,利用优化后的水轮机组监测数据异常检测模型进行监测数据异常检测。
本发明的有益效果是:
(1)本发明的水轮机组监测数据样本集实时反映了水轮机组运行状态,针对水轮机组监测数据开展异常检测研究,及时发现异常数据,可以有效提高水轮机组安全性能,有效提升水轮机组可靠性能,保障水轮机组安全稳定运行;
(2)利用嵌入向量法与注意力机制构建了水轮机组监测数据异常检测模型,明确了数据中的隐含关系,解决了传统方法处理多元时间序列数据时的特征提取不充分问题;
(3)本发明的水轮机组监测数据异常检测模型设计了一种多端口预测模型,该模型能同时输出所有监测参数下一时间戳的预测值,有效提高了异常检测准确率。
进一步地,步骤S1包括以下子步骤:
S11:采集水轮机组的历史监测数据集,剔除历史监测数据集中方差为0的监测数据,得到监测数据集;
S12:对监测数据集依次进行Z-score标准化处理和滑窗处理,得到监测数据样本集。
上述进一步方案的有益效果是:步骤S1将原始数据转化为符合深度学习的样本数据,有利于深度学习网络训练和参数优化。
进一步地,步骤S2包括以下子步骤:
S21:为监测数据样本集的每个监测数据生成对应的节点嵌入向量;
S22:计算各个节点嵌入向量之间的相关性,将相关性大于设定相关性阈值的若干个节点作为图邻接矩阵,得到基于图神经网络的水轮机组监测数据异常检测模型;
S23:在水轮机组监测数据异常检测模型中,提取各个节点的空间特征;
S24:根据各个节点的空间特征,提取各个节点的时间特征;
S25:将各个节点的时间特征转换为各个节点的输出特征;
S26:根据各个节点的输出特征,构建损失函数,利用损失函数优化水轮机组监测数据异常检测模型。
上述进一步方案的有益效果是:将每个监测数据视为一个节点,通过监测数据学习节点之间的关联关系(即图结构),利用图神经注意力和LSTM网络学习数据中时空相关关系,最后输出每个节点下一时间戳的预测值,利用残差大小组成的损失函数优化水轮机组监测数据异常检测模型。
进一步地,步骤S21中,为监测数据样本集的每个监测数据生成对应的节点嵌入向量的具体方法为:根据每个监测数据,生成对应的特征向量;将每个监测数据对应的特征向量转换为特征的潜在因子;将各个潜在因子进行拼接,得到节点嵌入向量。
上述进一步方案的有益效果是:该步骤对每个监测数据分别随机生成一个节点嵌入向量,实现了数字文字到向量表示的跨越。后续利用梯度下降法更新嵌入向量,使得嵌入向量在向量空间中能真实反映实际参数之间的关系。
进一步地,步骤S21中,各个监测数据对应的特征向量li的表达式为:
式中,xi表示监测数据的状态。
上述进一步方案的有益效果是:将监测数据用向量表示,便于后续步骤构建模型。
进一步地,步骤S22中,水轮机组监测数据异常检测模型D的表达式为:
D=(V,E)=({vi|vi∈{P∪Q}},{(vi,w,vj)|w∈W,vi∈V,vj∈V})
式中,V表示图神经网络的节点集,E表示图神经网络的图邻接矩阵集,vi表示节点i对应的节点嵌入向量,vj表示邻居节点j对应的节点嵌入向量,P表示监测数据样本集,Q表示中心节点对应的监测数据样本集,w表示中心节点对应的图邻接矩阵,W表示相关性最高的若干个节点形成的图邻接矩阵。
上述进一步方案的有益效果是:通过构建基于图神经网络的水轮机组监测数据异常检测模型,可以学习监测数据的全局信息和局部信息,保证预测结构不受数据噪声的影响。
进一步地,步骤S23中,各个节点的空间特征的计算公式为:
式中,RELU(·)表示激活函数,W1表示可训练邻接矩阵的第一参数,W2表示可训练邻接矩阵的第二参数,αi,i表示节点i的注意力系数,αi,j表示节点i与邻居节点j之间的注意力系数,表示节点i的特征,/>表示邻居节点j的特征。
进一步地,所述注意力系数αi,j的计算公式为:
式中,为拼接操作,/>为节点i的嵌入vi和映射后的/>拼接后的特征,W3∈R4d ×4d是可训练矩阵,θ(i,j)是利用LeakyReLU激活后的注意力系数。上述进一步方案的有益效果是:空间特征函数聚合相关节点信息,实现了水轮机组空间维度特征特征提取。
进一步地,步骤S24中,各个节点的时间特征的计算公式为:
式中,RELU(·)表示激活函数,LSTM(·)表示全连接函数,表示空间特征。
上述进一步方案的有益效果是:该步骤在上一步空间特征的基础上,利用共享权重LSTM提取数据中的时间维度特征,实现了时空特征提取。
进一步地,步骤S25中,各个节点的输出特征的计算公式为:
式中,表示时间特征,W4表示全连接层权重。
上述进一步方案的有益效果是:该步骤利用全连接神经网络将高维节点向量降为单点输出,使得深度学习网络满足预测目标值维度。
进一步地,步骤S26中,损失函数Loss的表达式为:
式中,I表示节点总数,表示节点i的输出特征,/>表示邻居节点j的输出特征,bi表示节点i的潜在因子,bj表示邻居节点j的潜在因子,li表示节点i的特征向量,lj表示邻居节点j的特征向量,λ表示惩罚因子,||·||2表示L2范数。
上述进一步方案的有益效果是:通过优化基于图神经网络的水轮机组监测数据异常检测模型,输出所有监测数据下一时间戳的预测值,有效提高了异常检测准确率。
水轮机组监测数据异常检测系统,包括:
数据预处理单元:用于获取历史监测数据,并对其预处理构建出监测数据样本集;
异常检测模型构建及优化单元:用于根据所述监测数据样本集构建并优化异常检测模型;
异常检测单元:用于利用优化后的异常检测模型对监测数据进行异常检测。
本发明的有益效果为:本发明他通过异常检测模型,针对水轮机组监测数据开展异常检测研究,及时发现异常数据,可以有效提高水轮机组安全性能,有效提升水轮机组可靠性能,保障水轮机组安全稳定运行。
进一步地,所述异常检测模型包括依次连接的图结构学习模块、时空特征提取模块以及异常判定模块;
所述图结构学习模块用于学习监测数据样本集中的监测参数,学习生成表征各监测参数节点之间相关性的图结构;
所述时空特征提取模块用于提取图结构中各节点的空间和时间特征;
所述异常判定模块用于根据提取的空间和时间特征,进行异常检测。
上述进一步方案的有益效果为:本发明通过构建用于水轮机组监测数据检测的异常检测模型,明确了数据中的隐含关系,解决了传统方法处理多元时间序列数据时的特征提取不充分问题。
进一步地,所述时空特征提取模块提取的各节点的空间特征的表达式为:
式中,RELU(·)表示激活函数,W1表示可训练邻接矩阵的第一参数,W2表示可训练邻接矩阵的第二参数,αi,i表示节点i的注意力系数,αi,j表示节点i与邻居节点j之间的注意力系数,表示节点i的特征,/>表示邻居节点j的特征。
上述进一步方案的有益效果为:上述空间特征函数聚合相关节点信息,实现了水轮机组空间维度特征特征提取。
进一步地,所述异常判定模块进行异常检测的判定规则为:
if li>ri:oi=1
else oi=0
式中,li为时空特征提取模块提取的节点i的空间特征和时间特征的特征向量,ri为水轮机组异常判定向量,oi为与节点i对应的输入监测数据,当oi=1时,则节点i对应的输入监测数据异常,当oi=0时,则节点i对应的输入监测数据正常;其中,ri∈r∈RN,r为构建的异常判定向量集。
上述进一步方案的有益效果为:基于预先建立的水轮机组异常判定向量,实现了异常监测数据的快速判定。
附图说明
图1为水轮机组监测数据异常检测方法的流程图。
图2为异常检测模型示意图。
具体实施方式
下面结合附图对本发明的实施例作进一步的说明。
在描述本发明的具体实施例之前,为使本发明的方案更加清楚完整,首先对本发明中出现的缩略语和关键术语定义进行说明:
Z-score标准化处理:Z-Score标准化是数据处理的一种常用方法。通过它能够将不同量级的数据转化为统一量度的Z-Score分值进行比较。提高了数据可比性,削弱了数据解释性。
实施例1:
本发明实施例提供了一种基于图神经网络的水轮机组监测数据异常检测方法,如图1所示,包括以下步骤S1-S3:
S1:采集水轮机组的历史监测数据集,并对历史监测数据集进行预处理,生成监测数据样本集;
S2:利用监测数据样本集,构建并优化水轮机组监测数据异常检测模型;
S3:采集水轮机组的最新监测数据,利用优化后的水轮机组监测数据异常检测模型进行监测数据异常检测。
本发明的水轮机组监测数据样本集实时反映了水轮机组运行状态,针对水轮机组监测数据开展异常检测研究,及时发现异常数据,可以有效提高水轮机组安全性能,有效提升水轮机组可靠性能,保障水轮机组安全稳定运行;利用嵌入向量法与注意力机制构建了水轮机组监测数据异常检测模型,明确了数据中的隐含关系,解决了传统方法处理多元时间序列数据时的特征提取不充分问题。同时,本发明的水轮机组监测数据异常检测模型设计了一种多端口预测模型,该模型能同时输出所有监测参数下一时间戳的预测值,有效提高了异常检测准确率。
实施例2:
针对实施例1中的步骤S1,包括以下分步骤S11-S12:
S11:采集水轮机组的历史监测数据集,剔除历史监测数据集中方差为0的监测数据,得到监测数据集;
S12:对监测数据集依次进行Z-score标准化处理和滑窗处理,得到监测数据样本集。
本发明实施例的步骤S1将原始数据转化为符合深度学习的样本数据,有利于深度学习网络训练和参数优化。
在本发明实施例中,水轮机组监测数据是指运行过程中利用水轮机组自身传感器采集的数据,例如转速、振动、电压、电流和压力等相关数据。水轮机组监测数据为时间序列数据,具有高维度、大样本和多模态的特征,传统机器学习或深度学习提取其内部的时空关联特征能力较差,同时计算中间过程存在不可解释性。
在剔除历史监测数据集中方差为0的监测数据后,还可以去除数据集中包含缺失值的时间戳数据;然后将数据进行Z-score标准化,得到干净数据集{s(1),s(2),…,s(T)},s(t)∈RN,0≤t≤T,其中,s(t)为时间戳t时刻采集得到的数据,N为剩余监测系统传感器数据;利用窗宽为w的窗体对各数据集进行滑窗处理,生成样本。样本输入为x(t)=[s(t-w),s(t -w+1),…,s(t-1)],x(t)∈R w×N,样本输出目标值为y(t)=s(t)。
实施例3:
针对实施例1中的步骤S2,包括以下分步骤S21-S26:
S21:为监测数据样本集的每个监测数据生成对应的节点嵌入向量;
S22:计算各个节点嵌入向量之间的相关性,将相关性大于设定相关性阈值的若干个节点作为图邻接矩阵,得到基于图神经网络的水轮机组监测数据异常检测模型;
在本发明实施例中,利用节点嵌入向量计算各节点之间的相关性,计算公式为:
并利用TopK操作选择与中心节点相关性最高的前K个节点作为图邻接矩阵,图邻接矩阵描述了节点之间的空间关系,即Aji=1{j∈TopK(eki:k∈{1,2,...N})}。该步骤利用余弦相关性计算了在向量空间中各个嵌入向量之间的相互关系,并利用TopK方法构建了图结构,明确了参数之间的相关性,实现了欧式数据到非欧式数据的跨越,使得图神经网络能在水轮机组数据上开展。
S23:在水轮机组监测数据异常检测模型中,提取各个节点的空间特征;
S24:根据各个节点的空间特征,提取各个节点的时间特征;
S25:将各个节点的时间特征转换为各个节点的输出特征;
S26:根据各个节点的输出特征,构建损失函数,利用损失函数优化水轮机组监测数据异常检测模型。
本发明实施例将每个监测数据视为一个节点,通过监测数据学习节点之间的关联关系(即图结构),利用图神经注意力和LSTM网络学习数据中时空相关关系,最后输出每个节点下一时间戳的预测值,利用残差大小组成的损失函数优化水轮机组监测数据异常检测模型。
实施例4:
针对实施例3中的步骤S21,为监测数据样本集的每个监测数据生成对应的节点嵌入向量的具体方法为:根据每个监测数据,生成对应的特征向量;将每个监测数据对应的特征向量转换为特征的潜在因子;将各个潜在因子进行拼接,得到节点嵌入向量。
本发明实施例的该步骤对每个监测数据分别随机生成一个节点嵌入向量,实现了数字文字到向量表示的跨越。后续利用梯度下降法更新嵌入向量,使得嵌入向量在向量空间中能真实反映实际参数之间的关系。本发明实施例可使用Embedding方法对每个监测数据分别随机生成一个节点嵌入向量。
实施例5:
针对实施例3中的步骤S21,各个监测数据对应的特征向量li的表达式为:
式中,xi表示监测数据的状态。
本发明实施例将监测数据用向量表示,便于后续步骤构建模型。
实施例6:
针对实施例3中的步骤S22,水轮机组监测数据异常检测模型D的表达式为:
D=(V,E)=({vi|vi∈{P∪Q}},{(vi,w,vj)|w∈W,vi∈V,vj∈V})
式中,V表示图神经网络的节点集,E表示图神经网络的图邻接矩阵集,vi表示节点i对应的节点嵌入向量,vj表示邻居节点j对应的节点嵌入向量,P表示监测数据样本集,Q表示中心节点对应的监测数据样本集,w表示中心节点对应的图邻接矩阵,W表示相关性最高的若干个节点形成的图邻接矩阵。
本发明实施例通过构建基于图神经网络的水轮机组监测数据异常检测模型,可以学习监测数据的全局信息和局部信息,保证预测结构不受数据噪声的影响。
实施例7:
针对实施例3中的步骤S23,各个节点的空间特征的计算公式为:
式中,RELU(·)表示激活函数,W1表示可训练邻接矩阵的第一参数,W2表示可训练邻接矩阵的第二参数,αi,i表示节点i的注意力系数,αi,j表示节点i与邻居节点j之间的注意力系数,表示节点i的特征,/>表示邻居节点j的特征。
本发明实施例空间特征函数聚合相关节点信息,实现了水轮机组空间维度特征特征提取。
在本发明实施例中,αi,j计算公式为:
式中,为拼接操作,/>为节点i的嵌入vi和映射后的/>拼接后的特征,W3∈R4d ×4d是可训练矩阵,θ(i,j)是利用LeakyReLU激活后的注意力系数。该步骤利用节点嵌入向量和节点输入数据计算了图网络中各条边的实时注意力系数。
实施例8:
针对实施例3中的步骤S24,各个节点的时间特征的计算公式为:
式中,RELU(·)表示激活函数,LSTM(·)表示全连接函数,表示空间特征。
本发明实施例的该步骤在上一步空间特征的基础上,利用共享权重LSTM提取数据中的时间维度特征,实现了时空特征提取。
实施例9:
针对实施例3中的步骤S25,各个节点的输出特征的计算公式为:
式中,表示时间特征,W4表示全连接层权重。
本发明实施例的该步骤利用全连接神经网络将高维节点向量降为单点输出,使得深度学习网络满足预测目标值维度。
实施例10:
针对实施例3中的步骤S26中,损失函数Loss的表达式为:
式中,I表示节点总数,表示节点i的输出特征,/>表示邻居节点j的输出特征,bi表示节点i的潜在因子,bj表示邻居节点j的潜在因子,li表示节点i的特征向量,lj表示邻居节点j的特征向量,λ表示惩罚因子,||·||2表示L2范数。
本发明实施例通过优化基于图神经网络的水轮机组监测数据异常检测模型,输出所有监测数据下一时间戳的预测值,有效提高了异常检测准确率。
在本发明实施例中,从水轮机组数据记录计算机中提取历史监测数据,并按照数据记录计算机中的维修记录,将历史监测数据分为正常数据集和异常数据集两类。将正常数据集按照8:2:3分为训练集、验证集和正常测试集,并将正常测试集和异常数据集合并为测试集。利用训练集和验证集对模型进行训练,利用测试集对模型性能进行评价。利用专家知识建立水轮机组异常判定向量r∈RN,该向量描述了每个节点允许的异常偏差值,异常判定规则为:
if li>ri:oi=1
else oi=0
式中,o∈RN,记录了输入向量中的异常节点,例如oi=1,表示输入数据中节点i异常,oi=0表示节点i正常。
实施例11:
针对实施例1~10中的水轮机组监测数据异常检测方法,本实施例提供了实现该方法对应的水轮机组监测数据异常检测系统,包括:
数据预处理单元:用于获取历史监测数据,并对其预处理构建出监测数据样本集;
异常检测模型构建及优化单元:用于根据所述监测数据样本集构建并优化异常检测模型;
异常检测单元:用于利用优化后的异常检测模型对监测数据进行异常检测。
如图2所示,本实施例中的异常检测模型包括依次连接的图结构学习模块、时空特征提取模块以及异常判定模块;
所述图结构学习模块用于学习监测数据样本集中的监测参数,学习生成表征各监测参数节点之间相关性的图结构;
所述时空特征提取模块用于提取图结构中各节点的空间和时间特征;
所述异常判定模块用于根据提取的空间和时间特征,进行异常检测。
在本实施例中,时空特征提取模块具体为LSTM模型,该时空特征提取模块提取的各节点的空间特征的表达式为:
式中,RELU(·)表示激活函数,W1表示可训练邻接矩阵的第一参数,W2表示可训练邻接矩阵的第二参数,αi,i表示节点i的注意力系数,αi,j表示节点i与邻居节点j之间的注意力系数,表示节点i的特征,/>表示邻居节点j的特征。
时空特征提取模块提取的各节点的时间特征为:
式中,RELU(·)表示激活函数,LSTM(·)表示全连接函数,表示空间特征。
在本实施例中,利用共享权重LSTM提取数据中的时间维度特征,实现了时空特征提取。
在本实施例中,异常判定模块进行异常检测的判定规则为:
if li>ri:oi=1
else oi=0
式中,li为时空特征提取模块提取的节点i的空间特征和时间特征的特征向量,ri为水轮机组异常判定向量,oi为与节点i对应的输入监测数据,当oi=1时,则节点i对应的输入监测数据异常,当oi=0时,则节点i对应的输入监测数据正常;其中,ri∈r∈RN,r为构建的异常判定向量集。其中,r∈RN描述了每个节点允许的异常偏差值。本发明中应用了具体实施例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
本领域的普通技术人员将会意识到,这里所述的实施例是为了帮助读者理解本发明的原理,应被理解为本发明的保护范围并不局限于这样的特别陈述和实施例。本领域的普通技术人员可以根据本发明公开的这些技术启示做出各种不脱离本发明实质的其它各种具体变形和组合,这些变形和组合仍然在本发明的保护范围内。
Claims (15)
1.基于图神经网络的水轮机组监测数据异常检测方法,其特征在于,包括以下步骤:
S1:采集水轮机组的历史监测数据集,并对历史监测数据集进行预处理,生成监测数据样本集;
S2:利用监测数据样本集,构建并优化水轮机组监测数据异常检测模型;
S3:采集水轮机组的最新监测数据,利用优化后的水轮机组监测数据异常检测模型进行监测数据异常检测。
2.根据权利要求1所述的基于图神经网络的水轮机组监测数据异常检测方法,其特征在于,所述步骤S1包括以下子步骤:
S11:采集水轮机组的历史监测数据集,剔除历史监测数据集中方差为0的监测数据,得到监测数据集;
S12:对监测数据集依次进行Z-score标准化处理和滑窗处理,得到监测数据样本集。
3.根据权利要求1所述的基于图神经网络的水轮机组监测数据异常检测方法,其特征在于,所述步骤S2包括以下子步骤:
S21:为监测数据样本集的每个监测数据生成对应的节点嵌入向量;
S22:计算各个节点嵌入向量之间的相关性,将相关性大于设定相关性阈值的若干个节点作为图邻接矩阵,得到基于图神经网络的水轮机组监测数据异常检测模型;
S23:在水轮机组监测数据异常检测模型中,提取各个节点的空间特征;
S24:根据各个节点的空间特征,提取各个节点的时间特征;
S25:将各个节点的时间特征转换为各个节点的输出特征;
S26:根据各个节点的输出特征,构建损失函数,利用损失函数优化水轮机组监测数据异常检测模型。
4.根据权利要求3所述的基于图神经网络的水轮机组监测数据异常检测方法,其特征在于,所述步骤S21中,为监测数据样本集的每个监测数据生成对应的节点嵌入向量的具体方法为:根据每个监测数据,生成对应的特征向量;将每个监测数据对应的特征向量转换为特征的潜在因子;将各个潜在因子进行拼接,得到节点嵌入向量。
5.根据权利要求4所述的基于图神经网络的水轮机组监测数据异常检测方法,其特征在于,所述步骤S21中,各个监测数据对应的特征向量li的表达式为:
式中,xi表示监测数据的状态。
6.根据权利要求3所述的基于图神经网络的水轮机组监测数据异常检测方法,其特征在于,所述步骤S22中,水轮机组监测数据异常检测模型D的表达式为:
D=(V,E)=({vi|vi∈{P∪Q}},{(vi,w,vj)|w∈W,vi∈V,vj∈V})
式中,V表示图神经网络的节点集,E表示图神经网络的图邻接矩阵集,vi表示节点i对应的节点嵌入向量,vj表示邻居节点j对应的节点嵌入向量,P表示监测数据样本集,Q表示中心节点对应的监测数据样本集,w表示中心节点对应的图邻接矩阵,W表示相关性最高的若干个节点形成的图邻接矩阵。
7.根据权利要求3所述的基于图神经网络的水轮机组监测数据异常检测方法,其特征在于,所述步骤S23中,各个节点的空间特征的计算公式为:
式中,RELU(·)表示激活函数,W1表示可训练邻接矩阵的第一参数,W2表示可训练邻接矩阵的第二参数,αi,i表示节点i的注意力系数,αi,j表示节点i与邻居节点j之间的注意力系数,表示节点i的特征,/>表示邻居节点j的特征。
8.根据权利要求7所述的基于图神经网络的水轮机组监测数据异常监测方法,其特征在于,所述注意力系数αi,j的计算公式为:
式中,为拼接操作,/>为节点i的嵌入vi和映射后的/>拼接后的特征,W3∈R4d×4d是可训练矩阵,θ(i,j)是利用LeakyReLU激活后的注意力系数。
9.根据权利要求3所述的基于图神经网络的水轮机组监测数据异常检测方法,其特征在于,所述步骤S24中,各个节点的时间特征的计算公式为:
式中,RELU(·)表示激活函数,LSTM(·)表示全连接函数,表示空间特征。
10.根据权利要求3所述的基于图神经网络的水轮机组监测数据异常检测方法,其特征在于,所述步骤S25中,各个节点的输出特征的计算公式为:
式中,表示时间特征,W4表示全连接层权重。
11.根据权利要求3所述的基于图神经网络的水轮机组监测数据异常检测方法,其特征在于,所述步骤S26中,损失函数Loss的表达式为:
式中,I表示节点总数,表示节点i的输出特征,/>表示邻居节点j的输出特征,bi表示节点i的潜在因子,bj表示邻居节点j的潜在因子,li表示节点i的特征向量,lj表示邻居节点j的特征向量,λ表示惩罚因子,||·||2表示L2范数。
12.基于权利要求1~11任一权利要求所述的基于图神经网络的水轮机组监测数据异常检测方法的水轮机组监测数据异常检测系统,其特征在于,包括:
数据预处理单元:用于获取历史监测数据,并对其预处理构建出监测数据样本集;
异常检测模型构建及优化单元:用于根据所述监测数据样本集构建并优化异常检测模型;
异常检测单元:用于利用优化后的异常检测模型对监测数据进行异常检测。
13.根据权利要求12所述的水轮机组监测数据异常检测系统,其特征在于,所述异常检测模型包括依次连接的图结构学习模块、时空特征提取模块以及异常判定模块;
所述图结构学习模块用于学习监测数据样本集中的监测参数,学习生成表征各监测参数节点之间相关性的图结构;
所述时空特征提取模块用于提取图结构中各节点的空间和时间特征;
所述异常判定模块用于根据提取的空间和时间特征,进行异常检测。
14.根据权利要求13所述的水轮机组监测数据异常检测系统,其特征在于,所述时空特征提取模块提取的各节点的空间特征zi (t)的表达式为:
式中,RELU(·)表示激活函数,W1表示可训练邻接矩阵的第一参数,W2表示可训练邻接矩阵的第二参数,αi,i表示节点i的注意力系数,αi,j表示节点i与邻居节点j之间的注意力系数,表示节点i的特征,/>表示邻居节点j的特征。
15.根据权利要求13所述的水轮机组监测数据异常检测系统,其特征在于,所述异常判定模块进行异常检测的判定规则为:
if li>ri:oi=1
else oi=0
式中,li为时空特征提取模块提取的节点i的空间特征和时间特征的特征向量,ri为水轮机组异常判定向量,oi为与节点i对应的输入监测数据,当oi=1时,则节点i对应的输入监测数据异常,当oi=0时,则节点i对应的输入监测数据正常;其中,ri∈r∈RN,r为构建的异常判定向量集。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211687796.3A CN115659551A (zh) | 2022-12-28 | 2022-12-28 | 一种基于图神经网络的水轮机组监测数据异常检测方法 |
CN2022116877963 | 2022-12-28 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116881821A true CN116881821A (zh) | 2023-10-13 |
Family
ID=85023264
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211687796.3A Withdrawn CN115659551A (zh) | 2022-12-28 | 2022-12-28 | 一种基于图神经网络的水轮机组监测数据异常检测方法 |
CN202310574617.3A Pending CN116881821A (zh) | 2022-12-28 | 2023-05-19 | 基于图神经网络的水轮机组监测数据异常检测方法及系统 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211687796.3A Withdrawn CN115659551A (zh) | 2022-12-28 | 2022-12-28 | 一种基于图神经网络的水轮机组监测数据异常检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (2) | CN115659551A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117829211A (zh) * | 2024-01-08 | 2024-04-05 | 国网江苏省电力有限公司扬州供电分公司 | 一种基于自注意力机制的光伏功率预测方法 |
-
2022
- 2022-12-28 CN CN202211687796.3A patent/CN115659551A/zh not_active Withdrawn
-
2023
- 2023-05-19 CN CN202310574617.3A patent/CN116881821A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117829211A (zh) * | 2024-01-08 | 2024-04-05 | 国网江苏省电力有限公司扬州供电分公司 | 一种基于自注意力机制的光伏功率预测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN115659551A (zh) | 2023-01-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111914873B (zh) | 一种两阶段云服务器无监督异常预测方法 | |
CN109102005B (zh) | 基于浅层模型知识迁移的小样本深度学习方法 | |
Mao et al. | Anomaly detection for power consumption data based on isolated forest | |
Xu et al. | Quantile regression neural network‐based fault detection scheme for wind turbines with application to monitoring a bearing | |
CN114676742A (zh) | 一种基于注意力机制和残差网络的电网异常用电检测方法 | |
CN112529678B (zh) | 一种基于自监督判别式网络的金融指数时序异常检测方法 | |
Li et al. | Deep spatio-temporal wind power forecasting | |
CN114528755A (zh) | 一种基于注意力机制结合gru的电力设备故障检测模型 | |
CN116307212B (zh) | 一种空气质量预测方法及系统 | |
CN114596726B (zh) | 基于可解释时空注意力机制的停车泊位预测方法 | |
CN116881821A (zh) | 基于图神经网络的水轮机组监测数据异常检测方法及系统 | |
CN113255209A (zh) | 一种齿轮箱轴承剩余寿命的预测方法 | |
CN114841072A (zh) | 一种基于差分融合Transformer的时序预测方法 | |
CN112731890A (zh) | 一种电厂设备故障的检测方法和装置 | |
CN116187508A (zh) | 一种融合知识图谱和深度学习的风电机组故障预测方法 | |
CN116502123A (zh) | 一种航空发动机剩余使用寿命无监督跨域预测方法 | |
CN113469013B (zh) | 一种基于迁移学习和时间序列的电机故障预测方法及系统 | |
Zhao et al. | An abnormal data processing method based on an ensemble algorithm for early warning of wind turbine failure | |
CN117154680A (zh) | 一种基于非平稳Transformer模型的风电功率预测方法 | |
CN115564075A (zh) | 一种城市电网主配一体故障协同诊断方法、系统 | |
Sicheng et al. | Abnormal line loss data detection and correction method | |
CN115217534A (zh) | 一种汽轮机服役质量状态监测方法及系统 | |
Jin et al. | Research on multi-sensor information fusion algorithm of fan detection robot based on improved BP neural network | |
CN110650130A (zh) | 基于多分类GoogLeNet-LSTM模型的工控入侵检测方法 | |
CN118332354B (zh) | 考虑设备结构信息的剩余使用寿命预测方法、装置及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |