CN111311059B - 基于知识图谱的水车室故障诊断方法 - Google Patents

基于知识图谱的水车室故障诊断方法 Download PDF

Info

Publication number
CN111311059B
CN111311059B CN202010045346.9A CN202010045346A CN111311059B CN 111311059 B CN111311059 B CN 111311059B CN 202010045346 A CN202010045346 A CN 202010045346A CN 111311059 B CN111311059 B CN 111311059B
Authority
CN
China
Prior art keywords
waterwheel
data
knowledge
house
fault diagnosis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010045346.9A
Other languages
English (en)
Other versions
CN111311059A (zh
Inventor
雷雨锦
冮杰
李振东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Dahui Wulian Technology Co ltd
Original Assignee
Chengdu Dahui Wulian Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Dahui Wulian Technology Co ltd filed Critical Chengdu Dahui Wulian Technology Co ltd
Priority to CN202010045346.9A priority Critical patent/CN111311059B/zh
Publication of CN111311059A publication Critical patent/CN111311059A/zh
Application granted granted Critical
Publication of CN111311059B publication Critical patent/CN111311059B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Marketing (AREA)
  • Artificial Intelligence (AREA)
  • Tourism & Hospitality (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • General Business, Economics & Management (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Biomedical Technology (AREA)
  • Operations Research (AREA)
  • Development Economics (AREA)
  • Databases & Information Systems (AREA)
  • Educational Administration (AREA)
  • Animal Behavior & Ethology (AREA)
  • Game Theory and Decision Science (AREA)
  • Primary Health Care (AREA)
  • Water Supply & Treatment (AREA)
  • Public Health (AREA)
  • Quality & Reliability (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

本发明公开了一种基于知识图谱的水车室故障诊断方法,涉及水轮机组故障诊断技术领域,该方法构建了由水车室故障知识图谱,能够解决以往非结构化文本的知识库建立的困难之处,采用Bayes网络通过学习历史数据自主构建网络,并学习网络参数,能够对不确定性知识进行表达和推理,推理结论精确,极大地提高了水车室故障诊断在工程实践中的应用效果;该方法能有效的反映出运行中的隐患和问题,对运行的劣化趋势进行判断和预警,能从根本上提前预警和感知顶盖水位的异常变化,当遇传感器故障或异常时,也能诊断出故障,能够对水车室水位变化大量不确定性因素进行精确描述,具有一致和连贯的推理,过程简单,而且诊断准确度极高。

Description

基于知识图谱的水车室故障诊断方法
技术领域
本发明涉及水轮机组故障诊断技术领域,具体而言,涉及一种基于知识图谱的水车室故障诊断方法。
背景技术
水轮发电机组在运行过程中,水车室的安全运行都是至关重要,对其最大的威胁便是水淹水车室事故,水淹水车室事故不仅导致油槽进水乳化,被迫停机处理,还会导致油槽内油漫至顶盖进而排至尾水,引发环保事件,产生不良的社会影响。引起此类事故的原因主要包括顶盖排水管路脱落、顶盖泵效率降低、真空破坏阀故障等,需要对水车室故障进行诊断。
目前绝大多数水电厂对于水车室的故障诊断方式是设置预警水位线,通过传感器实时检测水位,利用传感器检测到的参数对故障水车室的故障进行诊断,传统的水车室故障诊断方式存在以下缺陷:
1)不能从根本上提前预警和感知顶盖水位的异常变化,当遇传感器故障或异常时,便不能诊断出故障。
2)获取到的信息比较有限,不能有效的反映出运行中的隐患和问题,更无法对运行的劣化趋势进行判断和预警。
3)水车室水位上涨异常,影响因素众多,故障诊断要从采集的大量数据中判断分析异常的原因,但现实中存在大量不确定性信息。
4)传统的故障诊断建模理论与方法存在对水车室水位变化大量不确定性因素进行精确描述的局限性,缺乏一致和连贯的推理,实际诊断结果跟实际情况相差甚远。
发明内容
本发明在于提供一种基于知识图谱的水车室故障诊断方法,其能够缓解上述问题。
为了缓解上述的问题,本发明采取的技术方案如下:
本发明提供了一种基于知识图谱的水车室故障诊断方法,包括以下步骤:
S1、根据水车室机械故障诊断知识构建水车室故障知识图谱,所述水车室机械故障诊断知识包括结构化数据、半结构化数据以及非结构化数据;
S2、根据水车室检测数据,对水车室机械故障诊断知识的结构化数据进行预处理,所述预处理包括数据异常值修改及数据补全;
S3、从预处理后的结构化数据中提取若干时序特征数据,并将时序特征数据按时间维度划分为两部分,该两部分时序特征数据分别构成Bayes网络结构训练样本数据集和Bayes网络参数训练样本数据集;
S4、根据Bayes网络结构训练样本数据集,以及Bayes网络结构训练样本数据集对应时刻的水车室故障模式数据,学习得到Bayes网络结构;
S5、将Bayes网络参数训练样本数据集输入Bayes网络结构中进行参数学习,得到Bayes网络;
S6、选择水车室检测数据进行步骤S2所述的预处理后,输入Bayes网络中,计算水车室在所选择水车室检测数据对应时间点发生故障的概率;
S7、根据所述水车室故障知识图谱以及在所选择水车室检测数据对应时间点发生故障的概率,得到在所选择水车室检测数据对应时间点水车室故障发生的原因、故障部位以及处理措施。
本技术方案的技术效果是:为水轮发电机组水车室故障诊断领域的诊断算法,构建了由水车室故障知识图谱,能够解决以往非结构化文本的知识库建立的困难之处,采用Bayes网络通过学习历史数据自主构建网络,并学习网络参数,Bayes网络能够对不确定性知识进行表达和推理,且推理原理是基于Bayes概率理论,推理结论精确,极大地提高了水车室故障诊断在工程实践中的应用效果;该方法能有效的反映出运行中的隐患和问题,对运行的劣化趋势进行判断和预警,能从根本上提前预警和感知顶盖水位的异常变化,当遇传感器故障或异常时,也能诊断出故障,能够对水车室水位变化大量不确定性因素进行精确描述,具有一致和连贯的推理,过程简单,而且诊断准确度极高。
进一步地,所述步骤S1具体包括以下步骤:
S11、收集水车室机械故障诊断知识;
S12、从机械故障诊断知识的半结构化数据以及非结构化数据中提取实体、关系以及事件,组成初始三元组知识图谱;
S13、将机械故障诊断知识的结构化数据和初始三元组知识图谱进行知识融合,得到新的三元组知识图谱;
S14、对新的三元组知识图谱进行质量评估,利用其中合格的知识构成所述水车室故障知识图谱。
本技术方案的技术效果是:利用表示学习的方式进行建模,从历史数据中学习知识,不仅能够有效提升预测性能,还能够增加预测结果的可解释性。
更进一步地,所述水车室机械故障诊断知识、所述水车室检测数据和所述水车室故障模式数据均是从水轮发电机组监控系统获取;所述水车室机械故障诊断知识的结构化数据指的是水车室的传感器检测数据;所述水车室机械故障诊断知识的半结构化数据指的是试验报告数据和工作票数据;所述水车室机械故障诊断知识的非结构化数据指的是案例库数据。
本技术方案的技术效果是:各类数据从水轮发电机组监控系统中能够很方便的获取,并且各类数据中包含丰富的信息,包括设备结构信息、设备健康信息和领域专家知识。
更进一步地,所述步骤S12中,将水车室机械故障诊断知识的半结构化数据以及非结构化数据,通过谷歌的Bert模型在BiLSTM-CRF模型上进行预训练,继而识别出所述实体;使用基于文本的卷积神经网络从水车室机械故障诊断知识的半结构化数据以及非结构化数据中抽取各实体之间的关系;采用基于模式匹配的方式获取由实体和关系构成的事件。
本技术方案的技术效果是:BiLSTM-CRF模型继承了深度学习方法的优势,无需特征工程就可以达到很好的效果,对于实体关系的抽取,使用了卷积神经网络来对文本特征进行抽取和计算,是关系抽取任务解决的基础方案。
更进一步地,所述步骤S13中,知识融合指的是将若干相关数据源进行关联或者合并,其包括实体对齐和共指消解。
本技术方案的技术效果是:能够很好的判断相同知识库中的两个实体是否表示同一物理对象,以及能够对实体的相同属性或关系的不同描述进行冲突检测和消解。
更进一步地,所述步骤S14中,对新的三元组知识图谱进行质量评估的方法是:对知识的置信度进行量化,舍弃置信度较低的知识,保留置信度较高的知识作为所述合格的知识。
本技术方案的技术效果是:保证知识图谱中所有知识具有真实可靠性,能够排除偶然性,为后续的推理结果提供更精准的处理建议。
进一步地,所述步骤S4中,Bayes网络结构的学习采用基于搜索-评分的学习方法,评分函数选择最小描述长度评分MDL,搜索方法选择K2算法。
进一步地,所述步骤S5中,是在已知Bayes网络结构的条件下,采用Bayes网络参数训练样本数据集学习Bayes网络的CPT,继而获得Bayes网络。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举本发明实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1是实施例中所述基于知识图谱的水车室故障诊断方法流程图;
图2是实施例中水车室故障知识图谱的示意图;
图3是实施例中Bert模型的工作示意图;
图4是实施例中BiLSTM+CRF网络的工作示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参照图1,本实施例提供了一种基于知识图谱的水车室故障诊断方法,具体如下:
S1、根据水车室机械故障诊断知识构建水车室故障知识图谱,水车室机械故障诊断知识包括结构化数据、半结构化数据以及非结构化数据。
在本实施例中,水车室故障知识图谱的构建具体如下:
S11、收集水车室机械故障诊断知识。
在本实施例中,水车室机械故障诊断知识是从水轮发电机组监控系统获取;水车室机械故障诊断知识的结构化数据指的是水车室的传感器检测数据;水车室机械故障诊断知识的半结构化数据指的是试验报告数据和工作票数据;水车室机械故障诊断知识的非结构化数据指的是案例库数据。需要将这些内容统一搜集整理作为知识构建的基础。
S12、从机械故障诊断知识的半结构化数据以及非结构化数据中提取实体、关系以及事件,组成初始三元组知识图谱。
在本实施例中,将水车室机械故障诊断知识的半结构化数据以及非结构化数据,通过谷歌的Bert模型在BiLSTM-CRF模型上进行预训练,继而识别出实体,具体如下:
1)将原始文本数据转化为tfrecord形式或dataset形式读取,并使用IOB标注法制作标签;原始文本数据即水车室机械故障诊断知识的半结构化数据以及非结构化数据。
2)然后使用Bert模型进行Embedding,然后加载google预训练的Bert模型,如图3所示,在网络上继续反向传播训练,不断调整原有模型的权重,获得一个适用于命名实体识别任务的模型。对于Bert-BiLSTM-CRF网络,其实可以把Bert的输出看做是词向量。这里Bert模型对输入的中文句子最大长度为512个字。
3)再将Bert的输出喂入BiLSTM+CRF网络如图4,利用BiLSTM自动化地提取特征,BiLSTM的输出结果(每个单词对应标签的值)再输入到CRF中。
4)CRF的作用就是对各标签的之间的转移概率进行建模,然后在所有的标签序列中,选取一条最优结果(在概率图中叫最优路径)。在CRF内部,首先会随机初始化一个[tag_size,tag_size]的矩阵A,tag_size就是标签的个数,所以Aij就代表标签i到标签j的转移概率。这个矩阵最后通过学习得到。有了这个矩阵我们就可以对一个标签序列计算一个分值。
其中,X就是我们观测到的语句,y就是X的标签序列。T代表我们句子的长度,Ait-1,it,y就代表t-1时刻的标签转移到t时刻标签的值,从标签转移矩阵A中获得,Pit,y就是t时刻BiLSTM的输出值。并用下面的公式将分值转换成概率。
简化的公式为:/>
5)最后预测阶段,就是在所有的标签序列中,利用Viterbi算法找出分值最大的那个。
在本实施例中,使用基于文本的卷积神经网络(Text-CNN)从水车室机械故障诊断知识的半结构化数据以及非结构化数据中抽取各实体之间的关系,具体如下:
利用Text-CNN模型将其视为句子分类任务。假定长度为n且具有m个实体的句子,x={x1,x2,…,xn},其中实体分别为其中ki表示第i个实体的长度,该句子内所有实体将组成一个集合Ex={e(1),e(2),…,e(m)},任意取集合Ex中的两个实体作为一个组合(e(a),e(b))其中(a<b),并考察其是否具有关系,关系表示为ra,b,其取值为{0,1,2,...,r},r表示关系类标个数,即预设的试题关系的种类,每一个关系对应一个整数,0则表示没有关系。因此对于一个包含m个实体Ex的句子x将产生/>个关系组合Rx={r1,2,r1,3,…,rm-1,m}。将一句话x中不同组合的实体及其之间的所有单词组成一个新子句,并将其对应的word Embeddings作为输入数据。子句/>其对应的关系类标为ri,j,因此对于x将有h个子句组成的样本集X={(xi,j,ri,j|i<j,i,j∈[1,h])}。对该样本,需要进行填充0方式使各个子句长度一致,然后将其喂给Text-CNN。Text-CNN采用mini-batch法进行梯度下降训练。
在本实施例中,采用基于模式匹配的方式获取由实体和关系构成的事件,具体是结合语义角色匹配词汇-语法模式。
S13、将机械故障诊断知识的结构化数据和初始三元组知识图谱进行知识融合,得到新的三元组知识图谱。
在本实施例中,知识融合指的是将若干相关数据源进行关联或者合并,使其成为一个有机整体,按照融合元素的对象的不同可以分为,实体对齐和共指消解。实体对齐是判断相同知识库中的两个实体是否表示同一物理对象的过程,本发明采用基于知识库向量联合学习的对齐方法,通过计算同一向量空间中的实体间的相似度来判断两实体是否对应同一物理对象。共指消解是指对实体的相同属性或关系的不同描述进行冲突检测和消解,本发明采用基于质量估计的方法对冲突进行消解,具体的对于不同描述考虑知识来源的可信度,选择较高质量的结果。
S14、对新的三元组知识图谱进行质量评估,利用其中合格的知识构成水车室故障知识图谱。
在本实施例中,对新的三元组知识图谱进行质量评估的方法是:对知识的置信度进行量化,舍弃置信度较低的知识,保留置信度较高的知识作为合格的知识,其中置信度较低的知识和置信度较高的知识均是本领域技术人员根据经验判断得到。针对行业知识图谱,对质量要求较高,则需要人工参与甄别。
利用一个具体的故障案例如图2,来说明所建立的知识图谱结构:
'1F水轮机组'的某一设备'导水机构'下有一个设备部件'顶盖','顶盖'可能会出现的故障名称为'机组振摆异常',监测故障对应的指标包括'1F顶盖水位(采用传感器Ⅰ测得)'、'1F顶盖水位(采用传感器Ⅱ测得)'、'1F顶盖水位(采用传感器Ⅲ测得)'、'1F顶盖垂直振动'、'1F顶盖+X振动'、'1F顶盖+Y振动'、'1F机组有功',故障对应的征兆包括'水位上涨快'、'顶盖水平振动指标超标'和'顶盖垂直振动指标超标',其故障发生的原因可能是'过流部件损伤,水力不平衡'或'机组负荷异常,位于振动区',针对此故障建议的解决方案可以是'检查过流部件,对气蚀严重部位进行补焊、打磨,过流表面粗糙度应符合GB/T10969的规定'或'及时调整负荷,避免在振动区运行'。
S2、对水车室机械故障诊断知识的结构化数据进行预处理,预处理包括数据异常值修改及数据补全。
在本实施例中,预处理过程是以水车室检测数据为依据而进行的,水车室检测数据指的是与水位变化相关的数据,是从水轮发电机组监控系统获取。根据水车室运行,考虑影响水位变化的检测量,如顶盖水位传感器Ⅰ、顶盖水位传感器II、机组有功、蜗壳进口真空压力、主轴密封生活供水水管压力、主轴密封进水管流量、顶盖振动、顶盖泵启停信号等,对数据进行补全,异常值修改等。
S3、从步骤S2中预处理后的结构化数据中提取若干时序特征数据,并将时序特征数据按时间维度划分为两部分,该两部分时序特征数据分别构成Bayes网络结构训练样本数据集和Bayes网络参数训练样本数据集。
在本实施例中,预处理后的结构化数据包括上述的多种传感器采集的原始数据,针对水位数据,计算水位变化速率的均值、最值、方差等,针对震动数据计算时域和频域均值、方差、倍频等。
S4、根据Bayes网络结构训练样本数据集,以及Bayes网络结构训练样本数据集对应时刻的水车室故障模式数据,学习得到Bayes网络结构。
在本实施例中,水车室故障模式数据均是从水轮发电机组监控系统获取。
在本实施例中,Bayes网络结构的学习采用搜索-评分学习法,其核心思想是基于评分函数MDL在所有的结构空间进行搜索,知道找到与数据集最匹配的网络结构。网络结构的学习其实可以归结为求给定数据D=(d1,d2,…,dm)关于n个变量{X1,X2,…,Xn}的样本下,具有最大后验概率的网络结构G,G的可能取值包括所有以{X1,X2,…,Xn}为节点的又向无环图。
相应的MDL评分函数为:其中,mijk表示变量Xi取第k个值,同时父节点pa(Xi)取第j个值的样本数目,表示网络中包含的参数总量。搜索方法选择K2算法,K2算法使用贪心搜索去获取最大值,具体包括以下子步骤:
1)模型初始化;
2)利用搜索算子对当前模型进行局部更新,得到一系列候选模型。
3)计算每个候选模型的评分值,并将最优候选模型与当前模型比较,若最优候选模型分值大,则以它为下一个当前模型继续搜索,否则,停止搜索并返回当前模型。
S5、将Bayes网络参数训练样本数据集输入Bayes网络结构中进行参数学习,得到Bayes网络。
在本实施例中,是在已知Bayes网络结构的条件下,采用Bayes网络参数训练样本数据集学习Bayes网络的CPT,继而获得Bayes网络。
S6、选择水车室检测数据,将所选择的水车室检测数据进行步骤S2的预处理,即对所选择的水车室检测数据进行数据异常值修改及数据补全,之后将预处理后的水车室检测数据输入Bayes网络中,计算水车室在所选择水车室检测数据对应时间点发生故障的概率。
在本实施例中,基于已学习到的Bayes网络,根据已知节点变量的概率分布,利用条件概率的计算方法,就可计算出当前所选点发生各种故障的概率。
S7、根据水车室故障知识图谱以及在所选择水车室检测数据对应时间点发生故障的概率,得到在所选择水车室检测数据对应时间点水车室故障发生的原因、故障部位以及处理措施。例如:根据水车室故障诊断系统运行预警提示中显示,某天18:30:28时刻,水车室出现'机组振摆异常'故障的概率为81.5%,故障对应的征兆包括'顶盖水平振动指标超标'和'顶盖垂直振动指标超标',其故障发生的原因和部位为'机组负荷异常,位于振动区',针对此故障建议的处理措施是'及时调整负荷,避免在振动区运行'。
本发明所述基于知识图谱的水车室故障诊断方法具有以下优势:
以深度学习为代表的表示学习技术,将三元组对象映射到向量空间,通过向量变换实现高效计算;建立了基于知识图谱的水车室故障诊断知识库构建方法,对非结构化的文本利用实体识别技术Bert-BiLSTM-CRF网络和关系抽取技术Text-CNN进行建模,将机械故障诊断知识表示为三元组。对传统故障案例数据杂乱,发生异常全依赖人工经验处理的问题得以解决。本发明建立了Bayes故障诊断方法,该Bayes网络是基于,给定的历史数据集中自动地学习贝叶斯网络结构,发现水车室的故障模式。整个建模的过程都将由计算机完成,同时随着机组运行不同历史时期,整个模型能够自动地根据历史数据进行自主更新。整个基于知识图谱的水车室Bayes故障诊断决策系统的建立,对于故障诊断领域具有重要的意义。
以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (5)

1.一种基于知识图谱的水车室故障诊断方法,其特征在于,包括以下步骤:
S1、根据水车室机械故障诊断知识构建水车室故障知识图谱,所述水车室机械故障诊断知识包括结构化数据、半结构化数据以及非结构化数据;
S11、收集水车室机械故障诊断知识;
S12、从机械故障诊断知识的半结构化数据以及非结构化数据中提取实体、关系以及事件,组成初始三元组知识图谱;
所述水车室机械故障诊断知识、所述水车室检测数据和所述水车室故障模式数据均是从水轮发电机组监控系统获取;所述水车室机械故障诊断知识的结构化数据指的是水车室的传感器检测数据;所述水车室机械故障诊断知识的半结构化数据指的是试验报告数据和工作票数据;所述水车室机械故障诊断知识的非结构化数据指的是案例库数据;
其中,水车室机械故障诊断知识的半结构化数据以及非结构化数据,通过谷歌的Bert模型在BiLSTM-CRF模型上进行预训练,继而识别出实体的方法具体如下:
1)将原始文本数据转化为tfrecord形式或dataset形式读取,并使用IOB标注法制作标签;
2)使用Bert模型进行Embedding,加载google预训练的Bert模型,在网络上继续反向传播训练,不断调整原有模型的权重,获得一个适用于命名实体识别任务的模型;
其中,对于Bert-BiLSTM-CRF网络,Bert模型的输出为词向量,Bert模型对输入的中文句子最大长度为512个字;
3)将Bert模型的输出喂入BiLSTM+CRF网络,利用BiLSTM自动化地提取特征,
并将BiLSTM的输出结果输入到CRF中;
4)使用CRF对各标签的之间的转移概率进行建模,在所有的标签序列中,选取一条最优结果;
其中,选取一条最优结果的方法为:在CRF内部,随机初始化一个[tag_size,tag_size]的矩阵A,tag_size为标签的个数,Aij为标签i到标签j的转移概率,使用矩阵A对一个标签序列计算一个分值,其公式如下:
其中,X为观测到的语句,y为X的标签序列,T为句子的长度,为t-1时刻的标签转移到t时刻标签的值,从标签转移矩阵A中获得;/>为t时刻BiLSTM的输出值,并用以下公式将分值转换成概率:
在所有的标签序列中,利用Viterbi算法找出分值最大的标签序列,作为提取的实体;
使用基于文本的卷积神经网络从水车室机械故障诊断知识的半结构化数据以及非结构化数据中抽取各实体之间的关系;采用基于模式匹配的方式获取由实体和关系构成的事件;
S13、将机械故障诊断知识的结构化数据和初始三元组知识图谱进行知识融合,得到新的三元组知识图谱;
S14、对新的三元组知识图谱进行质量评估,利用其中合格的知识构成所述水车室故障知识图谱。
S2、对水车室机械故障诊断知识的结构化数据进行预处理,所述预处理包括数据异常值修改及数据补全;
S3、从预处理后的结构化数据中提取若干时序特征数据,并将时序特征数据按时间维度划分为两部分,该两部分时序特征数据分别构成Bayes网络结构训练样本数据集和Bayes网络参数训练样本数据集;
S4、根据Bayes网络结构训练样本数据集,以及Bayes网络结构训练样本数据集对应时刻的水车室故障模式数据,学习得到Bayes网络结构;
S5、将Bayes网络参数训练样本数据集输入Bayes网络结构中进行参数学习,得到Bayes网络;
S6、选择水车室检测数据进行步骤S2所述的预处理后,输入Bayes网络中,计算水车室在所选择水车室检测数据对应时间点发生故障的概率;
S7、根据所述水车室故障知识图谱以及在所选择水车室检测数据对应时间点发生故障的概率,得到在所选择水车室检测数据对应时间点水车室故障发生的原因、故障部位以及处理措施。
2.根据权利要求1所述基于知识图谱的水车室故障诊断方法,其特征在于,所述步骤S13中,知识融合指的是将若干相关数据源进行关联或者合并,其包括实体对齐和共指消解。
3.根据权利要求1所述基于知识图谱的水车室故障诊断方法,其特征在于,所述步骤S14中,对新的三元组知识图谱进行质量评估的方法是:对知识的置信度进行量化,舍弃置信度较低的知识,保留置信度较高的知识作为所述合格的知识。
4.根据权利要求1所述基于知识图谱的水车室故障诊断方法,其特征在于,所述步骤S4中,Bayes网络结构的学习采用基于搜索-评分的学习方法,评分函数选择最小描述长度评分MDL,搜索方法选择K2算法。
5.根据权利要求1所述基于知识图谱的水车室故障诊断方法,其特征在于,所述步骤S5中,是在已知Bayes网络结构的条件下,采用Bayes网络参数训练样本数据集学习Bayes网络的CPT,继而获得Bayes网络。
CN202010045346.9A 2020-01-16 2020-01-16 基于知识图谱的水车室故障诊断方法 Active CN111311059B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010045346.9A CN111311059B (zh) 2020-01-16 2020-01-16 基于知识图谱的水车室故障诊断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010045346.9A CN111311059B (zh) 2020-01-16 2020-01-16 基于知识图谱的水车室故障诊断方法

Publications (2)

Publication Number Publication Date
CN111311059A CN111311059A (zh) 2020-06-19
CN111311059B true CN111311059B (zh) 2023-08-29

Family

ID=71160211

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010045346.9A Active CN111311059B (zh) 2020-01-16 2020-01-16 基于知识图谱的水车室故障诊断方法

Country Status (1)

Country Link
CN (1) CN111311059B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112084781B (zh) * 2020-09-10 2024-04-12 腾讯科技(深圳)有限公司 一种标准术语确定方法、装置及存储介质
CN112269901B (zh) * 2020-09-14 2021-11-05 合肥中科类脑智能技术有限公司 一种基于知识图谱的故障判别推理方法
CN112541600A (zh) * 2020-12-07 2021-03-23 上海电科智能系统股份有限公司 一种基于知识图谱的辅助维修决策方法
CN112883192B (zh) * 2021-02-09 2023-09-05 江苏名通信息科技有限公司 一种异构领域用户与资源关联挖掘方法及系统
CN113341859B (zh) * 2021-08-06 2021-11-09 中海石油(中国)有限公司天津分公司 基于知识图谱的海上平台水处理系统平衡方法
CN114461784A (zh) * 2022-01-18 2022-05-10 中国科学院大学 一种非结构化设备故障知识的分类及知识萃取方法
CN114579875B (zh) * 2022-03-03 2022-09-27 中国科学院大学 基于知识图谱的设备故障诊断与维修知识推荐系统
CN115225457B (zh) * 2022-06-24 2023-09-26 南京邮电大学 一种基于知识和数据双驱动的网络故障分析方法
CN115683687B (zh) * 2023-01-03 2023-04-18 成都大汇物联科技有限公司 一种水电机械设备动静碰磨故障诊断方法
CN116360387B (zh) * 2023-01-18 2023-09-15 北京控制工程研究所 融合贝叶斯网络和性能-故障关系图谱的故障定位方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104777827A (zh) * 2015-01-21 2015-07-15 中国铁路总公司 高速铁路信号系统车载设备故障诊断方法
JP2017049854A (ja) * 2015-09-03 2017-03-09 ブレインズコンサルティング株式会社 障害対応支援装置、障害対応支援プログラム及び記憶媒体
CN106503813A (zh) * 2016-10-27 2017-03-15 清华大学 基于起重装备工作状态的预测性维修决策方法及系统
CN108509483A (zh) * 2018-01-31 2018-09-07 北京化工大学 基于知识图谱的机械故障诊断知识库构建方法
CN109508745A (zh) * 2018-11-14 2019-03-22 上海交通大学 基于贝叶斯网络模型的燃气轮机气路故障的检测方法
CN110008288A (zh) * 2019-02-19 2019-07-12 武汉烽火技术服务有限公司 用于网络故障分析的知识图谱库的构建方法及其应用
CN110033101A (zh) * 2019-03-07 2019-07-19 华中科技大学 基于融合特征的知识图谱的水电机组故障诊断方法和系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104777827A (zh) * 2015-01-21 2015-07-15 中国铁路总公司 高速铁路信号系统车载设备故障诊断方法
JP2017049854A (ja) * 2015-09-03 2017-03-09 ブレインズコンサルティング株式会社 障害対応支援装置、障害対応支援プログラム及び記憶媒体
CN106503813A (zh) * 2016-10-27 2017-03-15 清华大学 基于起重装备工作状态的预测性维修决策方法及系统
CN108509483A (zh) * 2018-01-31 2018-09-07 北京化工大学 基于知识图谱的机械故障诊断知识库构建方法
CN109508745A (zh) * 2018-11-14 2019-03-22 上海交通大学 基于贝叶斯网络模型的燃气轮机气路故障的检测方法
CN110008288A (zh) * 2019-02-19 2019-07-12 武汉烽火技术服务有限公司 用于网络故障分析的知识图谱库的构建方法及其应用
CN110033101A (zh) * 2019-03-07 2019-07-19 华中科技大学 基于融合特征的知识图谱的水电机组故障诊断方法和系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于知识图谱的高铁动车设备检测系统的本体框架构建与维护;韩智等;《现代电子技术》;20180312(第06期);第19-22页 *

Also Published As

Publication number Publication date
CN111311059A (zh) 2020-06-19

Similar Documents

Publication Publication Date Title
CN111311059B (zh) 基于知识图谱的水车室故障诊断方法
CN110148285B (zh) 一种基于大数据技术的油井参数智能预警系统及其预警方法
CN113723632B (zh) 一种基于知识图谱的工业设备故障诊断方法
CN111639430B (zh) 一种数字孪生驱动的天然气管道泄漏识别系统
CN105548764B (zh) 一种电力设备故障诊断方法
CN109766583A (zh) 基于无标签、不均衡、初值不确定数据的航空发动机寿命预测方法
US11840998B2 (en) Hydraulic turbine cavitation acoustic signal identification method based on big data machine learning
CN105574284B (zh) 一种基于趋势特征点的电力设备故障诊断方法
CN110941725A (zh) 一种基于知识图谱的水电机组故障诊断方法及系统
CN113360679B (zh) 一种基于知识图谱技术的故障诊断方法
CN102765643A (zh) 基于数据驱动的电梯故障诊断与预警方法
CN110232395A (zh) 一种基于故障中文文本的电力系统故障诊断方法
CN109492790A (zh) 基于神经网络与数据挖掘的风电机组健康管理方法
CN115791174B (zh) 一种滚动轴承异常诊断方法、系统、电子设备及存储介质
CN111427775A (zh) 一种基于Bert模型的方法层次缺陷定位方法
CN117574321B (zh) 基于海量监测巡检信息融合模型的大坝安全评估方法
CN116610816A (zh) 一种基于图卷积神经网络的人员画像知识图谱分析方法及系统
CN115687925A (zh) 针对不平衡样本的故障类型识别方法及装置
CN115511119A (zh) 基于知识图谱和贝叶斯的供热系统智能诊断方法及系统
Li et al. Intelligent fault diagnosis of aeroengine sensors using improved pattern gradient spectrum entropy
CN111126477A (zh) 一种混合贝叶斯网络的学习与推理方法
Xu et al. Anomaly detection with gru based bi-autoencoder for industrial multimode process
CN116204825A (zh) 一种基于数据驱动的生产线设备故障检测方法
Guo Wind turbine generator bearing condition monitoring with NEST method
CN109919446A (zh) 一种质量事故根原因识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant