CN116187508A - 一种融合知识图谱和深度学习的风电机组故障预测方法 - Google Patents

一种融合知识图谱和深度学习的风电机组故障预测方法 Download PDF

Info

Publication number
CN116187508A
CN116187508A CN202211566883.3A CN202211566883A CN116187508A CN 116187508 A CN116187508 A CN 116187508A CN 202211566883 A CN202211566883 A CN 202211566883A CN 116187508 A CN116187508 A CN 116187508A
Authority
CN
China
Prior art keywords
data
knowledge graph
fault
wind turbine
wind power
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211566883.3A
Other languages
English (en)
Inventor
掌旭
高阳
高宁
修唯
吴连龙
邹邦柱
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenyang Jiayue Electric Power Technology Co ltd
Original Assignee
Shenyang Jiayue Electric Power Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenyang Jiayue Electric Power Technology Co ltd filed Critical Shenyang Jiayue Electric Power Technology Co ltd
Priority to CN202211566883.3A priority Critical patent/CN116187508A/zh
Publication of CN116187508A publication Critical patent/CN116187508A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/20Administration of product repair or maintenance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/06Electricity, gas or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Abstract

本发明为一种融合知识图谱和深度学习的风电机组故障预测方法。包括:获取风电机组的故障知识数据,并对数据进行预处理;从预处理后的数据中抽取出包括实体、属性和关系的知识图谱元素,将得到的知识图谱元素在图数据库中构建出风电知识图谱;对步骤二构建的风电知识图谱进行预训练,然后利用深度学习算法建立故障预测模型,将预训练得到的数据输入该故障预测模型中进行训练,并在训练完成后保存模型参数;根据故障预测模型预测出的数据对风电场中的风电机组进行运维管理,及时排查故障。实现了故障诊断方面的知识和资源的共享与重用以及不同类型和业务数据间的贯穿统一,具有极强的完备性。

Description

一种融合知识图谱和深度学习的风电机组故障预测方法
技术领域
本发明属于风电技术领域,涉及一种融合知识图谱和深度学习的风电机组故障预测方法。
背景技术
随着社会经济的快速发展,我国的能源需求也在发生变化,以化石能源为主的传统不可再生能源正在逐渐过渡到以风能等为代表的的清洁可再生能源。近年来,风能作为典型的清洁能源代表引起了社会的关注与重视,风电行业的稳步上升使得风电领域成为了能源领域的重要驱动力。随着风力发电规模逐步增大,风电机组的数量也随之增多,因此风电场具有分布面积广、数量多等特点。但是,风电场所处的环境通常十分复杂,大多风电场靠近海边或位于偏远山区,长期工作在暴风、雷雨、冰冻等极端恶劣天气中,导致风电机组具有故障率高、故障种类多等特点。风电机组是一个由多自由度组成的复杂机电系统,一个小部件的损坏都可能“牵一发而动全身”,严重时甚至会导致整个风电机组瘫痪停机,从而大幅度影响发电量,造成巨大的经济损失。风电机组的故障诊断困难及运维成本高成为了风电行业的绊脚石。因此,如何及时发现并解决风电机组故障,降低风电机组的运维管理成本,从而提高风电场的经济效益,成为风电行业亟待解决的重要问题。
目前大部分的风电企业主要依靠SCADA系统和人工经验进行故障诊断,且主要针对风电机组当前的运行状态,对于故障诊断方面的知识和资源的共享率和重用率较低,当出现同类故障时,不具备快速诊断和提前预测的功能,造成人力物力的大量浪费、运维管理效率降低和运维管理成本提高。因此,构建具有预测功能和通用性的智能化风电机组运维系统是解决问题的关键。
发明内容
本发明所要解决的技术问题是如何利用风电场产生的多源海量故障知识数据构建风电知识图谱,同时在此基础上使用深度学习算法建立故障预测模型,对风电机组中系统关键部件及时排查,实现风电场的智慧运维管理,提供一种融合知识图谱和深度学习的风电机组故障预测方法。
本发明针对上述技术问题所采用的技术方案如下:
一种融合知识图谱和深度学习的风电机组故障预测方法,该方法包括以下步骤:
步骤一:获取风电机组的故障知识数据,并对数据进行预处理;
步骤二:从预处理后的数据中抽取出包括实体、属性和关系的知识图谱元素,将得到的知识图谱元素在图数据库中构建出风电知识图谱;
步骤三:对步骤二构建的风电知识图谱进行预训练,然后利用深度学习算法建立故障预测模型,将预训练得到的数据输入该故障预测模型中进行训练,并在训练完成后保存模型参数;
步骤四:根据故障预测模型预测出的数据对风电场中的风电机组进行运维管理,及时排查故障。
进一步地,所述步骤一中,数据预处理的具体步骤如下:
步骤1.1:将风电机组的故障知识数据划分为结构化数据和非结构化数据;
步骤1.2:对步骤1.1的结构化数据和非结构化数据中的残缺数据、错误数据、重复数据进行数据清洗。
进一步地,所述步骤二中,构建风电知识图谱的具体步骤如下:
步骤2.1:对于结构化数据,将其所包含的表格中行、列和对应单元格中的内容分别作为风电知识图谱的实体节点名称、关系名称和属性节点名称;
步骤2.2:对非结构化数据进行实体或属性抽取操作,该操作旨在从风电机组的故障知识数据抽取出表示实体或属性节点名称的词;
步骤2.3:对非结构化数据进行共指消解操作,该操作旨在将风电机组的故障知识数据中具有相同含义但表述不同的实体或属性进行合并;
步骤2.4:对非结构化数据进行关系抽取操作,该操作基于BERT模型,旨在从风电机组的故障知识数据中判别实体之间是否存在关系以及关系类型;
步骤2.5:整合结构化数据与非结构化数据的处理结果,得到所有包括实体、属性和关系的知识图谱元素,并基于图数据库Neo4j构建出风电知识图谱。
进一步地,步骤2.2中对非结构化数据进行实体或属性抽取操作,包括:首先采用隐马尔可夫模型将风电机组的故障知识数据文本切分成单独的词;然后将切分好的词逐一在风电领域专业术语集中进行检索,将检索到匹配项的词作为风电知识图谱的部分实体或属性节点名称。
进一步地,所述步骤2.3中对非结构化数据进行共指消解操作,包括:首先对词性相同的实体或属性进行分类,形成若干个词性集合;然后使用word2vec算法将每个词性集合中的词表示成指定维度的向量,分别计算词向量之间的余弦值进而判断两个词是否属于同一实体或属性;整理出属于同一实体或属性的词形成若干个同义词集,并将同义词集在风电领域专业术语集中进行检索,将检索到的匹配项的词作为风电知识图谱的部分实体或属性节点名称。
进一步地,所述步骤2.4中对非结构化数据进行关系抽取操作,包括:,首先利用包含一种或多种关系的少量标注语料对BERT模型进行训练;然后抽取预测结果不好的部分样本进行标注,数次迭代后BERT模型训练完成;最后利用训练完成的BERT模型对非结构化数据进行关系抽取。
进一步地,所述步骤三中,建立故障预测模型的具体步骤如下:
步骤3.1:采用TransR嵌入方法对风电知识图谱做预训练,具体包括:对于给定的三元组(h,r,t),将实体空间中的头实体向量h和尾实体向量t通过矩阵Mr投影到关系r的空间,最终获得风电知识图谱中节点的低维稠密嵌入向量;
步骤3.2:对于风电机组某一系统的一组关键部件C={C1,C2,...,Cm},在风电知识图谱所代表的节点的嵌入表示为
Figure BDA0003986351900000041
通过查阅风电机组的故障日志,得到某一关键部件Cm在过去一段时间产生的故障模式序列F={F1,F2,...,Fn},其中该故障模式序列按照时间顺序排列,在风电知识图谱所代表的节点的嵌入表示为/>
Figure BDA0003986351900000042
利用故障模式的序列信息预测关键部件Cm未来可能会产生的D个同类故障,该操作通过滑动L+D大小的窗口来实现,每个窗口会产生一个训练实例;
步骤3.3:提取一段时间t0内的L个故障模式序列的嵌入向量
Figure BDA0003986351900000051
采用卷积神经网络对其进行处理,该卷积神经网络包括N个卷积核,每个卷积核会对L个故障模式序列的嵌入向量构成的矩阵进行从上到下的卷积运算,运算结果表示为:
Figure BDA0003986351900000052
其中
Figure BDA0003986351900000053
为第G次卷积运算的结果;然后对cK执行最大池化操作,输出结果为:
p={max(c1),max(c2),...,max(cN)}
步骤3.4:采用注意力机制对L个故障模式序列的嵌入向量构成的矩阵进行处理,利用基于tanh激活函数的前馈神经网络计算矩阵中每个故障模式的嵌入向量对其余故障模式的嵌入向量的注意力分数:
Figure BDA0003986351900000054
其中,W1、W2、b1为第一层参数,
Figure BDA0003986351900000055
为第二层参数;通过Softmax函数对上述注意力分数进行归一化,得到最终的注意力权重:
Figure BDA0003986351900000056
利用所述注意力权重得到一个新的融合表示,如下式所示:
Figure BDA0003986351900000057
步骤3.5:采用连接策略将卷积层和自注意力层得到的结果相结合,得到L个故障模式序列的最终表示:
Figure BDA0003986351900000058
其中,W3、b2为第一层参数;
Figure BDA0003986351900000061
为RELU函数;/>
Figure BDA0003986351900000062
包含了关键部件Cm一段时间内故障模式的信息;
步骤3.6:利用点积运算关键部件Cm的嵌入向量
Figure BDA0003986351900000063
与L个故障模式序列的最终表示/>
Figure BDA0003986351900000064
的相似度:
Figure BDA0003986351900000065
根据相似度矩阵S,得到关键部件Cm级别的注意力向量:
Figure BDA0003986351900000066
/>
Figure BDA0003986351900000067
其中,Si代表相似度矩阵S的第i行向量;
步骤3.7:采用连接策略将关键部件Cm级别的注意力向量与关键部件Cm的嵌入向量
Figure BDA0003986351900000068
连接,并进行如下变换:
Figure BDA0003986351900000069
其中,W4、b5为第一层参数;σ(x)=1/(1+e-x);P(m,τ)表示关键部件Cm在未来一段时间τ内可能会产生故障模式
Figure BDA00039863519000000610
的概率;
步骤3.8:使用二元交叉熵作为故障预测模型的损失函数,如下所示:
Figure BDA00039863519000000611
其中,TIMEj={L+1,L+2,...,n}表示对故障模式进行预测的时间步长;
Figure BDA00039863519000000612
表示要预测的D个故障模式的嵌入向量的集合;通过P(m,τ)值的大小对预测关键部件Cm未来最大概率可能会产生的故障模式,P(m,τ)值越大代表该故障模式最有可能产生。个卷积核,每个卷积核会对个本发明的有益效果:
相比其他风电机组故障预测方法,本发明所述方法充分利用了风电场中的多源海量故障知识数据,实现了故障诊断方面的知识和资源的共享与重用以及不同类型和业务数据间的贯穿统一,具有极强的完备性。同时,对于风电机组的故障诊断在很大程度上摆脱了对人工经验的依赖,提高了故障诊断的准确率,当出现同类故障时,能够提前预测快速诊断并及时排查故障,把故障消除在萌芽状态,有效提高运维效率,降低运维成本,实现了风电场的智慧运维管理。
利用知识图谱技术与深度学习算法对风电机组进行故障预测,可以大幅度提高运维管理效率并降低运维管理成本,对风电场的智能运维中起到积极的作用,具有较大的实用价值和研究意义。
附图说明
图1是本发明实施例提供的系统工作流程场景图。
图2是本发明实施例提供的系统工作流程时序图。
图3是本发明实施例提供的数据预处理流程示意图。
图4是本发明实施例提供的风电知识图谱构建流程示意图。
图5是本发明实施例提供的故障预测模型训练流程示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,下面将结合附图,对本发明的具体实施方式进行详细的描述。
图1为本发明的系统工作流程场景图。
图2为本发明的系统工作流程时序图,本发明提供融合知识图谱和深度学习的风电机组故障预测方法,具体包括以下步骤:
步骤一:获取风电机组的故障知识数据,并对数据进行预处理;
步骤二:从预处理后的数据中抽取出实体、属性、关系等知识图谱元素,将得到的知识图谱元素在图数据库中构建出风电知识图谱;
步骤三:对步骤二构建的风电知识图谱进行预训练,然后利用深度学习算法建立故障预测模型,将预训练得到的数据输入该故障预测模型中进行训练,并在训练完成后保存模型参数;
步骤四:根据故障预测模型预测出的数据对风电场中的风电机组进行运维管理,及时排查故障。
图3是本发明的数据预处理流程示意图,其中,具体步骤如下:
步骤1.1:将风电机组的故障知识数据划分为结构化数据和非结构化数据;
步骤1.2:对结构化数据和非结构化数据中的残缺数据、错误数据、重复数据进行数据清洗。
图4是本发明的风电知识图谱构建流程示意图,具体步骤如下:
步骤2.1:对于结构化数据,将其所包含的表格中行、列和对应单元格中的内容分别作为风电知识图谱的实体节点名称、关系名称和属性节点名称;
步骤2.2:对非结构化数据进行实体或属性抽取操作。该操作旨在从风电机组的故障知识数据抽取出表示实体或属性节点名称的词。首先采用隐马尔可夫模型将风电机组的故障知识数据文本切分成单独的词;然后将切分好的词逐一在风电领域专业术语集中进行检索,将检索到匹配项的词作为风电知识图谱的部分实体或属性节点名称;
步骤2.3:对非结构化数据进行共指消解操作。该操作旨在将风电机组的故障知识数据中具有相同含义但表述不同的实体或属性进行合并。首先对词性相同的实体或属性进行分类,形成若干个词性集合;然后使用word2vec算法将每个词性集合中的词表示成指定维度的向量,分别计算词向量之间的余弦值进而判断两个词是否属于同一实体或属性;最后整理出属于同一实体或属性的词形成若干个同义词集,并基于风电领域专业术语集选取风电知识图谱的部分实体或属性节点名称;
步骤2.4:对非结构化数据进行关系抽取操作。该操作基于BERT模型,旨在从风电机组的故障知识数据中判别实体之间是否存在关系以及关系类型。首先利用包含一种或多种关系的少量标注语料对BERT模型进行训练;然后抽取预测结果不好的部分样本进行标注,数次迭代后BERT模型训练完成;最后利用训练完成的BERT模型对非结构化数据进行关系抽取;
步骤2.5:整合结构化数据与非结构化数据的处理结果,得到所有实体、属性、关系等知识图谱元素。最终基于图数据库Neo4j构建出风电知识图谱。
在详解本发明故障预测模型的具体建立步骤前,对问题进行以下描述:
首先,基于风电知识图谱进行数据预训练得到节点的嵌入向量,然后将嵌入向量送入故障预测模型进行训练与预测,分析该模型的预测能力,根据损失函数的结果不断调整该模型的结构及参数,进而提高本发明的可行性。最终本发明确定采用深度学习算法中的卷积神经网络和注意力网络和作为主要结构,并对参数进行优化进一步提高预测准确率,最终将训练完成的参数保存。
图5是本发明的故障预测模型训练流程示意图,具体步骤如下:
步骤3.1:采用TransR嵌入方法对风电知识图谱做预训练,具体来说,对于给定的三元组(h,r,t),将实体空间中的头实体向量h和尾实体向量t通过矩阵Mr投影到关系r的空间,最终获得风电知识图谱中节点的低维稠密嵌入向量;
步骤3.2:对于风电机组某一系统的一组关键部件C={C1,C2,...,Cm},它们在风电知识图谱所代表的节点的嵌入表示为
Figure BDA0003986351900000101
通过查阅风电机组的故障日志,得到某一关键部件Cm在过去一段时间产生的故障模式序列F={F1,F2,...,Fn},其中该故障模式序列按照时间顺序排列,它们在风电知识图谱所代表的节点的嵌入表示为
Figure BDA0003986351900000102
利用故障模式的序列信息预测关键部件Cm未来可能会产生的D个同类故障,该操作通过滑动L+D大小的窗口来实现,每个窗口会产生一个训练实例;
步骤3.3:提取一段时间t0内的L个故障模式序列的嵌入向量
Figure BDA0003986351900000103
采用卷积神经网络对其进行处理,该卷积神经网络有N个卷积核,每个卷积核会对L个故障模式序列的嵌入向量构成的矩阵进行从上到下的卷积运算,运算结果表示为:
Figure BDA0003986351900000104
其中
Figure BDA0003986351900000111
为第G次卷积运算的结果;然后对cK执行最大池化操作,输出结果为:
p={max(c1),max(c2),...,max(cN)}
步骤3.4:采用注意力机制对L个故障模式序列的嵌入向量构成的矩阵进行处理,利用基于tanh激活函数的前馈神经网络计算矩阵中每个故障模式的嵌入向量对其余故障模式的嵌入向量的注意力分数:
Figure BDA0003986351900000112
其中,W1、W2、b1为第一层参数,
Figure BDA0003986351900000113
为第二层参数;通过Softmax对上述注意力分数进行归一化,得到最终的注意力权重:
Figure BDA0003986351900000114
利用该注意力权重得到了一个新的融合表示,如下式所示:
Figure BDA0003986351900000115
步骤3.5:采用连接策略将卷积层和自注意力层得到的结果相结合,得到L个故障模式序列的最终表示:
Figure BDA0003986351900000116
其中,W3、b2为第一层参数;
Figure BDA0003986351900000117
为RELU函数;/>
Figure BDA0003986351900000118
包含了关键部件Cm一段时间内故障模式的信息;
步骤3.6:利用点积运算关键部件Cm的嵌入向量
Figure BDA0003986351900000119
与L个故障模式序列的最终表示/>
Figure BDA00039863519000001110
的相似度:
Figure BDA0003986351900000121
根据相似度矩阵S,得到关键部件Cm级别的注意力向量:
Figure BDA0003986351900000122
Figure BDA0003986351900000123
其中,Si代表相似度矩阵S的第i行向量;
步骤3.7:采用连接策略将关键部件Cm级别的注意力向量与关键部件Cm的嵌入向量
Figure BDA0003986351900000124
连接,并进行如下变换:
Figure BDA0003986351900000125
其中,W4、b5为第一层参数;σ(x)=1/(1+e-x);P(m,τ)表示关键部件Cm在未来一段时间τ内可能会产生故障模式
Figure BDA0003986351900000126
的概率;
步骤3.8:使用二元交叉熵作为故障预测模型的损失函数,如下所示:
Figure BDA0003986351900000127
其中,TIMEj={L+1,L+2,...,n}表示对故障模式进行预测的时间步长;
Figure BDA0003986351900000128
表示要预测的D个故障模式的嵌入向量的集合;通过P(m,τ)值的大小对预测关键部件Cm未来最大概率可能会产生的故障模式,P(m,τ)值越大代表该故障模式最有可能产生。/>

Claims (7)

1.一种融合知识图谱和深度学习的风电机组故障预测方法,其特征在于,该方法包括以下步骤:
步骤一:获取风电机组的故障知识数据,并对数据进行预处理;
步骤二:从预处理后的数据中抽取出包括实体、属性和关系的知识图谱元素,将得到的知识图谱元素在图数据库中构建出风电知识图谱;
步骤三:对步骤二构建的风电知识图谱进行预训练,然后利用深度学习算法建立故障预测模型,将预训练得到的数据输入该故障预测模型中进行训练,并在训练完成后保存模型参数;
步骤四:根据故障预测模型预测出的数据对风电场中的风电机组进行运维管理,及时排查故障。
2.按照权利要求1所述的一种融合知识图谱和深度学习的风电机组故障预测方法,其特征在于,所述步骤一中,数据预处理的具体步骤如下:
步骤1.1:将风电机组的故障知识数据划分为结构化数据和非结构化数据;
步骤1.2:对步骤1.1的结构化数据和非结构化数据中的残缺数据、错误数据、重复数据进行数据清洗。
3.按照权利要求1所述的一种融合知识图谱和深度学习的风电机组故障预测方法,其特征在于,所述步骤二中,构建风电知识图谱的具体步骤如下:
步骤2.1:对于结构化数据,将其所包含的表格中行、列和对应单元格中的内容分别作为风电知识图谱的实体节点名称、关系名称和属性节点名称;
步骤2.2:对非结构化数据进行实体或属性抽取操作,该操作旨在从风电机组的故障知识数据抽取出表示实体或属性节点名称的词;
步骤2.3:对非结构化数据进行共指消解操作,该操作旨在将风电机组的故障知识数据中具有相同含义但表述不同的实体或属性进行合并;
步骤2.4:对非结构化数据进行关系抽取操作,该操作基于BERT模型,旨在从风电机组的故障知识数据中判别实体之间是否存在关系以及关系类型;
步骤2.5:整合结构化数据与非结构化数据的处理结果,得到所有包括实体、属性和关系的知识图谱元素,并基于图数据库Neo4j构建出风电知识图谱。
4.按照权利要求3所述的一种融合知识图谱和深度学习的风电机组故障预测方法,其特征在于,步骤2.2中对非结构化数据进行实体或属性抽取操作,包括:首先采用隐马尔可夫模型将风电机组的故障知识数据文本切分成单独的词;然后将切分好的词逐一在风电领域专业术语集中进行检索,将检索到匹配项的词作为风电知识图谱的部分实体或属性节点名称。
5.按照权利要求3所述的一种融合知识图谱和深度学习的风电机组故障预测方法,其特征在于,所述步骤2.3中对非结构化数据进行共指消解操作,包括:首先对词性相同的实体或属性进行分类,形成若干个词性集合;然后使用word2vec算法将每个词性集合中的词表示成指定维度的向量,分别计算词向量之间的余弦值进而判断两个词是否属于同一实体或属性;整理出属于同一实体或属性的词形成若干个同义词集,并将同义词集在风电领域专业术语集中进行检索,将检索到的匹配项的词作为风电知识图谱的部分实体或属性节点名称。
6.按照权利要求3所述的一种融合知识图谱和深度学习的风电机组故障预测方法,其特征在于,所述步骤2.4中对非结构化数据进行关系抽取操作,包括:,首先利用包含一种或多种关系的少量标注语料对BERT模型进行训练;然后抽取预测结果不好的部分样本进行标注,数次迭代后BERT模型训练完成;最后利用训练完成的BERT模型对非结构化数据进行关系抽取。
7.按照权利要求1所述的一种融合知识图谱和深度学习的风电机组故障预测方法,其特征在于,所述步骤三中,建立故障预测模型的具体步骤如下:
步骤3.1:采用TransR嵌入方法对风电知识图谱做预训练,具体包括:对于给定的三元组(h,r,t),将实体空间中的头实体向量h和尾实体向量t通过矩阵Mr投影到关系r的空间,最终获得风电知识图谱中节点的低维稠密嵌入向量;
步骤3.2:对于风电机组某一系统的一组关键部件C={C1,C2,...,Cm},在风电知识图谱所代表的节点的嵌入表示为
Figure FDA0003986351890000031
通过查阅风电机组的故障日志,得到某一关键部件Cm在过去一段时间产生的故障模式序列F={F1,F2,...,Fn},其中该故障模式序列按照时间顺序排列,在风电知识图谱所代表的节点的嵌入表示为
Figure FDA0003986351890000032
利用故障模式的序列信息预测关键部件Cm未来可能会产生的D个同类故障,该操作通过滑动L+D大小的窗口来实现,每个窗口会产生一个训练实例;
步骤3.3:提取一段时间t0内的L个故障模式序列的嵌入向量
Figure FDA0003986351890000033
采用卷积神经网络对其进行处理,该卷积神经网络包括N个卷积核,每个卷积核会对L个故障模式序列的嵌入向量构成的矩阵进行从上到下的卷积运算,运算结果表示为:
Figure FDA0003986351890000041
其中
Figure FDA0003986351890000042
为第G次卷积运算的结果;然后对cK执行最大池化操作,输出结果为:
p={max(c1),max(c2),...,max(cN)}
步骤3.4:采用注意力机制对L个故障模式序列的嵌入向量构成的矩阵进行处理,利用基于tanh激活函数的前馈神经网络计算矩阵中每个故障模式的嵌入向量对其余故障模式的嵌入向量的注意力分数:
Figure FDA0003986351890000043
其中,W1、W2、b1为第一层参数,
Figure FDA0003986351890000044
为第二层参数;通过Softmax函数对上述注意力分数进行归一化,得到最终的注意力权重:
Figure FDA0003986351890000045
利用所述注意力权重得到一个新的融合表示,如下式所示:
Figure FDA0003986351890000046
步骤3.5:采用连接策略将卷积层和自注意力层得到的结果相结合,得到L个故障模式序列的最终表示:
Figure FDA0003986351890000047
其中,W3、b2为第一层参数;
Figure FDA0003986351890000048
为RELU函数;/>
Figure FDA0003986351890000049
包含了关键部件Cm一段时间内故障模式的信息;
步骤3.6:利用点积运算关键部件Cm的嵌入向量
Figure FDA0003986351890000051
与L个故障模式序列的最终表示/>
Figure FDA0003986351890000052
的相似度:
Figure FDA0003986351890000053
根据相似度矩阵S,得到关键部件Cm级别的注意力向量:
Figure FDA0003986351890000054
Figure FDA0003986351890000055
其中,Si代表相似度矩阵S的第i行向量;
步骤3.7:采用连接策略将关键部件Cm级别的注意力向量与关键部件Cm的嵌入向量
Figure FDA0003986351890000056
连接,并进行如下变换:
Figure FDA0003986351890000057
其中,W4、b5为第一层参数;σ(x)=1/(1+e-x);P(m,τ)表示关键部件Cm在未来一段时间τ内可能会产生故障模式
Figure FDA0003986351890000058
的概率;
步骤3.8:使用二元交叉熵作为故障预测模型的损失函数,如下所示:
Figure FDA0003986351890000059
其中,TIMEj={L+1,L+2,...,n}表示对故障模式进行预测的时间步长;
Figure FDA00039863518900000510
表示要预测的D个故障模式的嵌入向量的集合;通过P(m,v)值的大小对预测关键部件Cm未来最大概率可能会产生的故障模式,P(m,v)值越大代表该故障模式最有可能产生。/>
CN202211566883.3A 2022-12-07 2022-12-07 一种融合知识图谱和深度学习的风电机组故障预测方法 Pending CN116187508A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211566883.3A CN116187508A (zh) 2022-12-07 2022-12-07 一种融合知识图谱和深度学习的风电机组故障预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211566883.3A CN116187508A (zh) 2022-12-07 2022-12-07 一种融合知识图谱和深度学习的风电机组故障预测方法

Publications (1)

Publication Number Publication Date
CN116187508A true CN116187508A (zh) 2023-05-30

Family

ID=86441165

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211566883.3A Pending CN116187508A (zh) 2022-12-07 2022-12-07 一种融合知识图谱和深度学习的风电机组故障预测方法

Country Status (1)

Country Link
CN (1) CN116187508A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116777634A (zh) * 2023-06-25 2023-09-19 深圳征信服务有限公司 一种基于人工智能的金融数据分析系统及方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116777634A (zh) * 2023-06-25 2023-09-19 深圳征信服务有限公司 一种基于人工智能的金融数据分析系统及方法

Similar Documents

Publication Publication Date Title
Shamshirband et al. A survey of deep learning techniques: application in wind and solar energy resources
Li et al. Self-attention ConvLSTM and its application in RUL prediction of rolling bearings
Li et al. Deep spatio-temporal wind power forecasting
CN116307212B (zh) 一种空气质量预测方法及系统
CN116187508A (zh) 一种融合知识图谱和深度学习的风电机组故障预测方法
CN116842337A (zh) 基于LightGBM优选特征与COA-CNN模型的变压器故障诊断方法
CN115409369A (zh) 基于机理和数据混合驱动的综合能源系统可靠性评估方法
CN116109292A (zh) 一种基于联邦半监督学习的风机齿轮箱故障诊断方法
Zhang et al. Wind power prediction based on CNN-LSTM
Wang et al. Short-term wind power probabilistic forecasting using a new neural computing approach: GMC-DeepNN-PF
Chen et al. Significant wave height prediction through artificial intelligent mode decomposition for wave energy management
Wang et al. Tracking and predicting technological knowledge interactions between artificial intelligence and wind power: Multimethod patent analysis
Tian et al. A power forecasting method for ultra-short-term photovoltaic power generation using transformer model
CN117096867A (zh) 一种短期电力负荷预测方法、装置、系统及存储介质
CN115115139A (zh) 一种风电功率的实时预测方法
CN113807027A (zh) 一种风电机组健康状态评估模型、方法及系统
Yuan et al. A novel hybrid short-term wind power prediction framework based on singular spectrum analysis and deep belief network utilized improved adaptive genetic algorithm
Wang et al. Short-term wind power forecasting based on BOMLS K-means similar hours Clustering method
CN113792919A (zh) 一种基于迁移学习深度学习相结合的风电功率预测方法
CN113887049A (zh) 一种基于机器学习的石油钻井的钻速预测方法及系统
CN113536508A (zh) 一种制造网络节点分类方法及系统
Dhakal et al. Deep Learning Model with Probability Density Function and Feature Engineering for Short Term Wind Speed Prediction
Liu et al. Ultra-short-term wind power forecasting based on stacking model
Li Research on the application of artificial intelligence in diagnosing power system faults
CN111626468B (zh) 一种基于有偏凸损失函数的光伏区间预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination