CN114385403A - 基于双层知识图谱架构的分布式协同故障诊断方法 - Google Patents

基于双层知识图谱架构的分布式协同故障诊断方法 Download PDF

Info

Publication number
CN114385403A
CN114385403A CN202210036763.6A CN202210036763A CN114385403A CN 114385403 A CN114385403 A CN 114385403A CN 202210036763 A CN202210036763 A CN 202210036763A CN 114385403 A CN114385403 A CN 114385403A
Authority
CN
China
Prior art keywords
fault
local
node
knowledge graph
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210036763.6A
Other languages
English (en)
Inventor
吴昊
李昌松
周毅喆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jiaotong University
Original Assignee
Beijing Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jiaotong University filed Critical Beijing Jiaotong University
Priority to CN202210036763.6A priority Critical patent/CN114385403A/zh
Publication of CN114385403A publication Critical patent/CN114385403A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0709Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a distributed system consisting of a plurality of standalone computer nodes, e.g. clusters, client-server systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/027Frames
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Analysis (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Probability & Statistics with Applications (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Algebra (AREA)
  • Computational Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Databases & Information Systems (AREA)
  • Computer Hardware Design (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明提供基于知识图谱的协同故障诊断方法及系统,属于机械故障诊断技术领域,分布式子节点构建本地故障知识图谱;中心节点对各本地故障知识图谱进行聚合,对各故障检测模型进行选择和聚合;聚合后的全局故障知识图谱下发给各分布式子节点,根据本地故障知识图谱和全局故障知识图谱构建本地故障树模型,并映射成贝叶斯网络,进行故障成因的差异化分析,并结合全局故障知识图谱进行处理措施推荐。本发明克服现有故障诊断过程中故障数据的大规模、高维度、处理困难以及故障信息的非结构化、知识利用率较低的问题,与实际分布式场景中的故障诊断结合紧密,与数据集中式上传的故障诊断方式相比,有效保护数据隐私,节约通信带宽,具有更强的实用性。

Description

基于双层知识图谱架构的分布式协同故障诊断方法
技术领域
本发明涉及机械故障诊断技术领域,具体涉及一种基于双层知识图谱架构的分布式协同故障诊断方法。
背景技术
故障诊断是指系统在一定的工作环境下判断并能够定位和分析异常状态发生的部位,同时能够查明导致系统不正常的具体原因,判断故障的类别和等级,甚至可以进行自动修复或者给出相应修复的建议的过程。其中,如何进行大规模、高维度故障数据的处理以及如何从非结构化故障信息中进行故障知识的提取和检索是故障诊断所面临的难题。
深度学习和知识图谱这两大技术的提出可以有效解决上述故障诊断过程中所面临的问题。其中,深度学习技术因具有强大的特征学习和复杂建模能力,在处理大数据方面展现出极大的优势;知识图谱技术因具有细粒度、图形化的知识表示结构,在故障知识检索和推理方面具备极大的潜力。
在分布式场景中,以无人值守机房场景为例,无人值守机房的出现实现了机房设备监控,减轻了机房维护人员的负担,提高了系统的可靠性。然而机房故障诊断这一过程通常对运维人员的专业程度和经验积累要求较高,大型单位内无人值守机房数量众多且异地分散,像大规模集中式机房那样组建一只随时待命的高专业运维团队是不切实际的。
因此,如何实现分布式场景下的故障诊断是亟需考虑的,同时由于分布式场景的特殊性,故障诊断过程还面临以下挑战:基于深度学习的故障诊断方式通常需要大量的数据集进行故障检测模型的训练,但是部分节点中存储的数据集规模较小,最终会导致这些节点中故障检测模型的性能较差。如果将各节点中的数据进行汇总并进行集中的模型训练,固然可以提高各节点模型的故障检测能力,但是数据集传输会占用大量通信资源而且存在本地数据泄露导致的隐私保护问题。在故障成因分析环节,常采用故障树模型和贝叶斯网络相结合的方式,可以有效提升模型的反向推理能力,但是模型的构建复杂度并没有得到降低。同时考虑到各节点的具体环境和故障发生频率具有一定差异,如果仅仅按照全局的故障统计数据进行成因分析,有时并不能进行故障的准确定位。
发明内容
本发明的目的在于提供一种能够在分布式场景下的故障诊断过程中,在保护数据隐私的前提下实现各节点中故障诊断能力的提升、在降低故障成因模型构建复杂度的同时实现故障成因的差异化分析的基于双层知识图谱架构的分布式协同故障诊断方法,以解决上述背景技术中存在的至少一项技术问题。
为了实现上述目的,本发明采取了如下技术方案:
一方面,本发明提供一种基于双层知识图谱架构的分布式协同故障诊断方法,包括:
分布式子节点基于本地故障信息构建本地故障知识图谱,并将本地故障检测模型的结构参数以及性能指标添加到本地故障知识图谱中;
各分布式子节点定期将本地故障知识图谱上传至中心节点,所述中心节点对各本地故障知识图谱进行聚合,并对各故障检测模型进行选择和聚合;
中心节点将聚合后的全局故障知识图谱下发给各分布式子节点,各分布式子节点根据本地故障知识图谱和接收到的全局故障知识图谱构建本地故障树模型,并映射成贝叶斯网络,根据贝叶斯网络进行故障成因的差异化分析,并结合全局故障知识图谱进行处理措施推荐。
可选的,各分布式子节点的本地故障知识图谱构建完成后,将本地故障检测模型的结构参数以及性能指标,作为各子节点的属性信息存储在本地故障知识图谱中。
可选的,本地故障知识图谱聚合之前,需要对知识表示进行规范化和统一化并进行故障知识对齐,所述故障知识对齐包括故障实体对齐、故障关系对齐以及故障属性对齐;本地故障知识图谱聚合过程包括故障实体聚合、故障关系聚合以及故障属性聚合;
故障检测模型的选择过程中,考虑模型的故障识别种类数、模型使用的数据集规模大小、模型的识别准确率、模型的故障识别种类数的增量以及模型所使用的故障数据集规模的增量这五个因素经过选择和聚合,将得到的全局故障检测模型的模型参数添加进聚合后的全局故障知识图谱。
可选的,构建所述故障树模型的过程中,将由全局故障知识图谱梳理好的故障实体与故障原因间的因果关系以及故障原因间的逻辑关系直接进行导入,并结合双层故障知识图谱中的全局属性和局部属性信息,对所述故障树模型中的各基本事件进行定量分析,以求取所述基本事件的故障率。
可选的,以求取所述基本事件的故障率,包括:
所述故障树模型中底事件的故障率的计算公式如下:
Figure BDA0003468756460000031
其中,λb_k表示分布式子节点Ek的第b个底事件的故障率,mbg表示所有分布式子节点所统计的全部历史记录中第b个底事件发生的累计故障频次,mbl_k表示在当前第k个子节点Ek的本地历史记录中第b个底事件发生的故障频次,Tg表示故障设备在所有分布式子节点中的累计总运行时长,Tl_k表示故障设备在子节点Ek中的总运行时长,wg表示全局属性在公式中所占据的权重值,wl表示局部属性在公式中所占据的权重值;
设分布式子节点Ek中某故障模式的故障树模型中底事件的个数为n,它们的故障率分别表示为λb_k(b=1,2,...,n);当所述故障树模型中,相邻两级事件均为“与”逻辑关系时,顶事件的故障率λ(T)的计算公式如下:
Figure BDA0003468756460000041
当所述故障树模型中,相邻两级事件均为“或”逻辑关系时,顶事件的故障率λ(T)的计算公式如下:
Figure BDA0003468756460000042
可选的,权重参数wl和wg的具体计算公式如下:
Figure BDA0003468756460000043
wg=1-wl
其中,mHg表示在所有分布式子节点所统计的全部历史记录中故障模式H发生的累计故障频次,mHl_k表示在当前第k个子节点Ek的本地历史记录中故障模式H发生的故障频次,Tg表示故障设备在所有分布式子节点中的累计总运行时长,Tl_k表示故障设备在子节点Ek本地中的总运行时长。
可选的,各子节点利用所述贝叶斯网络进行故障成因的差异化分析,并结合全局故障知识图谱进行处理措施推荐,包括:贝叶斯网络中具有连接关系的相邻节点间的条件概率的计算公式如下:
Figure BDA0003468756460000044
其中,Pij表示贝叶斯网络中具有连接关系的相邻节点Bi和节点Bj之间的条件概率,mig表示在所有分布式子节点的历史记录中贝叶斯网络节点Bi发生的累计故障频次,mjg表示在所有分布式子节点的历史记录中贝叶斯网络节点Bj发生的累计故障频次,mil_k表示在当前第k个子节点Ek的历史记录中贝叶斯网络节点Bi发生的故障频次,mjl_k表示在当前第k个子节点Ek的历史记录中贝叶斯网络节点Bj发生的故障频次;
根据故障树中底事件故障率以及贝叶斯网络中邻接节点间的条件概率,并结合贝叶斯公式,当同一种故障发生于不同的节点时,各节点会因本地的故障成因的发生频次不同,从而实现差异化的故障成因分析。
第二方面,本发明提供一种计算机设备,包括存储器和处理器,所述处理器和所述存储器相互通信,所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令执行如上所述的基于双层知识图谱架构的分布式协同故障诊断方法。
第三方面,本发明提供一种电子设备,包括存储器和处理器,所述处理器和所述存储器相互通信,所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令执行如上所述的基于双层知识图谱架构的分布式协同故障诊断方法。
第四方面,本发明提供一种计算机可读存储介质,其存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的基于双层知识图谱架构的分布式协同故障诊断方法。
本发明有益效果:采用知识图谱和深度学习相结合的方法进行故障诊断,通过对各分布式节点中的故障知识以及故障检测模型进行聚合和选择,提升了各机房节点故障识别和故障处理能力。可以克服现有故障诊断过程中故障数据的大规模、高维度、处理困难以及故障信息的非结构化、知识利用率较低的问题,与实际分布式场景中的故障诊断结合紧密,与数据集中式上传的故障诊断方式相比,可以有效保护数据隐私,节约通信带宽,具有更强的实用性。
本发明附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例所述的基于双层知识图谱架构的分布式协同故障诊断方法流程图。
图2为本发明实施例所述的基于双层知识图谱架构的协同故障诊断方法中本地故障检测模型ML的训练和存储环节的流程图。
图3为本发明实施例所述的基于双层知识图谱架构的协同故障诊断方法中本地故障知识图谱Lk的聚合与全局故障检测模型MG的选择环节的流程图。
图4为本发明实施例所述的无人值守分布式机房场景下的协同故障诊断模型示意图。
图5为本发明实施例所述的故障知识图谱的结构示意图。
具体实施方式
下面详细叙述本发明的实施方式,所述实施方式的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过附图描述的实施方式是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。
还应该理解的是,诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样定义,不会用理想化或过于正式的含义来解释。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件和/或它们的组。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
为便于理解本发明,下面结合附图以具体实施例对本发明作进一步解释说明,且具体实施例并不构成对本发明实施例的限定。
本领域技术人员应该理解,附图只是实施例的示意图,附图中的部件并不一定是实施本发明所必须的。
实施例1
本实施例1提供一种基于双层知识图谱架构的分布式协同故障诊断方法,包括:
分布式场景中,在各分布式子节点Ek端,k指任一分布式子节点唯一ID号,k=1,2,…,基于本地故障信息构建本地故障知识图谱Lk,并将本地故障检测模型MLk的结构参数以及性能指标添加到所述故障知识图谱Lk中;
各子节点Ek定期将本地故障知识图谱Lk上传,由中心节点C进行接收,所述中心节点C对各故障知识图谱Lk进行聚合,并对各故障检测模型MLk进行选择和聚合;
所述中心节点C将聚合后的全局故障知识图谱Gj下发给各子节点Ek,j代表聚合的次数,j=1,2,……,各子节点Ei根据本地故障知识图谱Lk和接收到的全局故障知识图谱Gj构建本地故障树模型,并将所述故障树模型映射成贝叶斯网络,各子节点Ek利用所述贝叶斯网络进行故障成因的差异化分析,并结合全局故障知识图谱Gj进行处理措施推荐。
在各分布式子节点Ek端,基于本地故障信息构建本地故障知识图谱Lk,并将本地故障检测模型MLk的结构参数以及性能指标添加到所述故障知识图谱Lk中,包括:
基于本地故障信息构建本地故障知识图谱Lk的过程中,首先需要对非结构化的故障文本信息进行故障知识抽取,具体可以分成实体知识的抽取、关系知识的抽取以及属性知识的抽取这三个过程,可以采用自然语言处理和深度学习技术,之后需要对抽取得到的所述故障知识进行梳理和分析,可以采用设备树分析和故障树分析方法;
各子节点Ek的故障知识图谱Lk构建完成后,需要将本地故障检测模型MLk的结构参数以及性能指标,作为各子节点Ek的属性信息存储在本地故障知识图谱Lk中。
所述中心节点C对各故障知识图谱Lk进行聚合,并对各故障检测模型MLk进行选择和聚合,包括:
故障知识图谱Lk聚合之前,需要对知识表示进行规范化和统一化并进行故障知识对齐,所述故障知识对齐包括故障实体对齐、故障关系对齐以及故障属性对齐;
故障知识图谱Lk聚合过程中,所述知识图谱聚合包括故障实体聚合、故障关系聚合以及故障属性聚合;
故障检测模型MLk的选择过程中,考虑了模型的故障识别种类数、模型使用的数据集规模大小、模型的识别准确率、模型的故障识别种类数的增量以及模型所使用的故障数据集规模的增量这五个因素,模型选择评判指标的计算公式如下所示:
Figure BDA0003468756460000091
其中,ck表示第k个子节点Ek中的模型评判指标,ak表示第k个子节点Ek中模型可识别的故障种类数,aavg表示各子节点中模型可识别故障种类数累加后的均值,|Dk|表示第k个子节点Ek中模型MLk训练过程所使用的数据集规模,|Davg|表示各子节点中模型所使用的数据集累加后的均值,acck是第k个子节点Ek中模型MLk的准确率,Δak表示本轮选择过程中第k个子节点Ek中模型可识别的故障种类数与前一轮选择过程中第k个子节点Ek中模型可识别的故障种类数相比所增加的数量,Δ|Dk|表示本轮选择过程中第k个子节点Ek中模型MLk训练过程所使用的数据集规模与前一轮选择过程中第k个子节点Ek中模型MLk训练过程所使用的数据集规模相比所增加的数据集规模大小;
各子节点Ek周期性地将图谱Lk上传到中心节点C,中心节点C在一轮周期内根据模型选择评判指标ck的大小对各子节点Ek的本地故障检测模型MLk进行排序,根据排序结果选择排名前40%的本地故障检测模型MLk进行聚合,所使用的聚合算法借鉴了较为经典的联邦均值(FedAVG)算法的思想,在模型参数的权重设置方面进行改进,除了考虑各模型ML所使用的数据集规模因素外,还引入了模型ML的可识别故障种类数因素,可以一定程度上降低实际分布式场景中Non-IID数据分布所带来的影响,具体公式如下所示:
Figure BDA0003468756460000101
其中,εg表示聚合后所得到的全局故障检测模型MG的模型参数,K表示在模型评判指标排序中前40%的本地故障检测模型MLk所对应的子节点Ek的数目,ak表示第k个子节点Ek中模型可识别的故障种类数,ag表示当前K个子节点E中各本地故障检测模型ML可识别故障种类数的累加和,|Dk|表示第k个子节点Ek中模型MLk训练过程所使用的数据集规模,|Dg|表示当前K个子节点E中各本地故障检测模型ML训练过程中所使用的数据集规模的累加和,εk表示第k个子节点Ek中本地故障检测模型MLk的模型参数;
经过选择和聚合,便得到了全局故障检测模型MG的模型参数,并添加进聚合后的全局故障知识图谱Gj
各子节点Ek根据本地故障知识图谱Lk和接收到的全局故障知识图谱Gj构建本地故障树模型,并将所述故障树模型映射成贝叶斯网络,包括:
各子节点Ek接收到由中心节点C下发的全局故障知识图谱Gj后,会在各子节点Ek本地进行直接存储,因此,各子节点Ek处会同时存在聚合后的全局故障知识图谱Gj和聚合前的本地故障知识图谱Lk,使用该双层故障知识图谱架构,为之后的故障成因的差异化分析奠定了基础;
构建所述故障树模型的过程中,可以将由全局故障知识图谱Gj梳理好的故障实体与故障原因间的因果关系以及故障原因间的逻辑关系直接进行导入,并结合双层故障知识图谱中的全局属性和局部属性信息,对所述故障树模型中的各基本事件进行定量分析,以求取所述基本事件的故障率;
将构建完成的故障树模型映射成贝叶斯网络的具体过程如下:1)将故障树中的事件对应表达成贝叶斯网络中的节点B,其中,故障树中的底事件在贝叶斯网络中作为根节点Br,顶事件在贝叶斯网络中作为叶节点Bf;2)将故障树中的各基本事件的故障率作为贝叶斯网络中对应节点B的先验概率进行赋值;3)将贝叶斯网络中具有连接关系的相邻节点的故障频次的比值作为条件概率。
结合双层故障知识图谱中的全局属性和局部属性信息,对所述故障树模型中的各基本事件进行定量分析,以求取所述基本事件的故障率,包括:
所述故障树模型中底事件的故障率的计算公式如下:
Figure BDA0003468756460000111
其中,λb_k表示分布式子节点Ek的第b个底事件的故障率,mbg表示所有分布式子节点所统计的全部历史记录中第b个底事件发生的累计故障频次,mbl_k表示在当前第k个子节点Ek的本地历史记录中第b个底事件发生的故障频次,Tg表示故障设备在所有分布式子节点中的累计总运行时长,Tl_k表示故障设备在子节点Ek中的总运行时长,wg表示全局属性在公式中所占据的权重值,wl表示局部属性在公式中所占据的权重值;
设分布式子节点Ek中某故障模式的故障树模型中底事件的个数为n,它们的故障率分别表示为λb_k(b=1,2,...,n)。当所述故障树模型中,相邻两级事件均为“与”逻辑关系时,顶事件的故障率λ(T)的计算公式如下:
Figure BDA0003468756460000112
当所述故障树模型中,相邻两级事件均为“或”逻辑关系时,顶事件的故障率λ(T)的计算公式如下:
Figure BDA0003468756460000113
在实现故障成因的差异化分析过程中,全局属性的权重值wg和局部属性的权重值wl这两个参数是尤为重要的,以上两个参数代表了全局属性和局部属性在故障成因分析中所占据的重要程度,权重参数wl和wg的具体计算公式如下:
Figure BDA0003468756460000121
wg=1-wl (4)
其中,mHg表示在所有分布式子节点所统计的全部历史记录中故障模式H发生的累计故障频次,mHl_k表示在当前第k个子节点Ek的本地历史记录中故障模式H发生的故障频次,Tg表示故障设备在所有分布式子节点中的累计总运行时长,Tl_k表示故障设备在子节点Ek本地中的总运行时长。
各子节点Ek利用所述贝叶斯网络进行故障成因的差异化分析,并结合全局故障知识图谱Gj进行处理措施推荐,包括:
计算故障树中底事件的故障率和贝叶斯网络中邻接节点间的条件概率过程中,通常需要结合全局故障知识图谱Gj中的全局属性和本地故障知识图谱Lk中的局部属性这两个方面进行考虑。其中,故障树中底事件的故障率可以通过公式5计算得出,贝叶斯网络中具有连接关系的相邻节点间的条件概率的计算公式如下:
Figure BDA0003468756460000122
其中,Pij表示贝叶斯网络中具有连接关系的相邻节点Bi和节点Bj之间的条件概率,mig表示在所有分布式子节点的历史记录中贝叶斯网络节点Bi发生的累计故障频次,mjg表示在所有分布式子节点的历史记录中贝叶斯网络节点Bj发生的累计故障频次,mil_k表示在当前第k个子节点Ek的历史记录中贝叶斯网络节点Bi发生的故障频次,mjl_k表示在当前第k个子节点Ek的历史记录中贝叶斯网络节点Bj发生的故障频次,wg表示全局属性在公式中所占据的权重值,wl表示局部属性在公式中所占据的权重值。
通过公式5和公式8对故障树中底事件故障率以及贝叶斯网络中邻接节点间的条件概率进行计算,并结合贝叶斯公式,当同一种故障发生于不同的子节点时,各节点会因本地的故障成因的发生频次不同,从而实现差异化的故障成因分析。
实施例2
本发明实施例2提出了一种无人值守分布式机房场景下的基于双层知识图谱架构的分布式协同故障诊断机制,该机制的模型示意图和处理流程分别如图4和图1所示,包括以下几个步骤:
步骤1、各机房节点Ek使用自然语言处理和深度学习技术对本地所存储的非结构化故障文本信息(如:设备故障手册、维修日志等)进行故障知识抽取,其中包含了实体、关系以及属性知识的抽取。
步骤2、采用设备树分析法和故障树分析法对抽取后的故障知识进行梳理和分析,梳理后的故障知识归纳如下:
(1)实体知识可以分成两大类:设备信息类和故障信息类,其中,设备信息类中包括了设备和传感器这两个子类,故障信息类中包括了故障模式、故障原因和处理措施这三个子类;
(2)在各实体类进行实例化的过程中需要进行属性知识的描述,以故障原因类为例如表1所示对其属性知识归纳如下,主要包含了故障原因名称、故障原因类别、故障原因的局部发生频次以及故障原因的全局发生频次等信息;
(3)关系型知识可以归纳为六类:1)Has_fault:描述设备与故障模式间的从属关系;2)Has_sensor:描述设备与传感器间的从属关系;3)Effect:描述设备与设备间的影响关系;4)Has_device:描述系统与设备间的结构关系;5)Has_cause:描述故障模式与故障原因之间的因果关系;6)Has_treatment:描述故障原因和处理措施间的关系;
基于以上对知识的实体、属性及关系的定义,结合知识图谱的构建法则,可以在Neo4j中进行故障知识图谱Lk的构建,故障知识图谱的表达框架如图5所示。
表1属性知识描述
Figure BDA0003468756460000141
步骤3、各机房节点的本地故障检测模型MLk的训练流程如图2所示,如果在中心云服务器的第一次聚合之前,则中心云服务器将初始化的故障检测模型MO的结构和参数下发给各机房节点Ek,各机房节点Ek使用接收到的模型结构和参数对本地故障检测模型MLk进行初始化;如果在中心云服务器的第一次聚合之后,则各机房节点Ek使用聚合后故障知识图谱Gj中全局模型MG的结构和参数对本地故障检测模型MLk进行初始化,之后各机房使用本地故障数据集进行故障检测模型MLk的训练,训练完成后,将模型MLk的结构、参数以及性能指标作为机房的属性信息存储在本地故障知识图谱Lk中。
步骤4、各机房节点Ek定期将本地故障知识图谱Lk上传给中心云服务器,由服务器对各机房故障知识图谱Lk进行聚合,并对各故障检测模型MLk进行选择和聚合;
其中,图谱Lk的聚合以及模型MLk的选择和聚合过程如图3所示,具体步骤如下:
步骤4.1、各机房故障知识图谱Lk聚合之前,需要对知识表示进行规范化和统一化,并进行故障知识对齐,其中包括故障实体知识对齐、故障关系知识对齐以及故障属性知识对齐。
步骤4.2、故障知识图谱Lk的聚合过程中,主要包括了故障实体知识聚合、故障关系知识聚合以及故障属性知识聚合。
步骤4.3、故障检测模型MLk的选择和聚合过程中,考虑了模型的故障识别种类数、模型使用的数据集规模大小、模型的识别准确率、模型的故障识别种类数的增量以及模型所使用的故障数据集规模的增量这五个因素模型选择评判指标的计算公式如下所示:
Figure BDA0003468756460000151
其中,ck表示第k个机房节点Ek中的故障检测模型MLk的评判指标,ak表示第k个机房节点Ek中故障检测模型MLk可识别的故障种类数,aavg表示各机房节点中模型可识别故障种类数累加后的均值,|Dk|表示第k个机房节点Ek中模型MLk训练过程所使用的故障数据集规模,|Davg|表示各机房节点中模型所使用的故障数据集累加后的均值,acck表示第k个机房节点Ek中模型MLk的故障识别准确率,Δak表示本轮选择过程中第k个机房节点Ek中模型MLk可识别的故障种类数与前一轮选择过程中第k个机房节点Ek中模型MLk可识别的故障种类数相比所增加的数量,Δ|Dk|表示本轮选择过程中第k个机房节点Ek中模型MLk训练过程所使用的数据集规模与前一轮选择过程中第k个机房节点Ek中模型MLk训练过程所使用的数据集规模相比所增加的数据集规模大小;
步骤4.4、各机房节点Ek周期性的将图谱Lk上传到中心云服务器处,由中心云服务器在一轮周期内根据模型选择评判指标ck的大小对各机房节点Ek的本地故障检测模型MLk进行排序,根据排序结果选择排名前40%的本地故障检测模型MLk进行聚合,所使用的聚合算法借鉴了较为经典的联邦均值(FedAVG)算法的思想,在模型参数的权重设置方面进行改进,除了考虑各模型ML所使用的数据集规模因素外,还引入了模型ML的可识别故障种类数因素,可以一定程度上降低实际分布式场景中Non-IID数据分布所带来的影响,具体公式如下所示:
Figure BDA0003468756460000161
其中,εg表示聚合后所得到的全局故障检测模型MG的模型参数,K表示在模型评判指标排序中前40%的本地故障检测模型MLk所对应的机房节点E的数目,ak表示第k个机房节点Ek中模型MLk可识别的故障种类数,ag表示当前K个机房节点中各本地故障检测模型ML可识别故障种类数的累加和,|Dk|表示第k个机房节点Ek中模型MLk训练过程所使用的数据集规模,|Dg|表示当前K个机房节点中各本地故障检测模型ML训练过程中所使用的数据集规模的累加和,εk表示第k个机房节点Ek中本地故障检测模型MLk的模型参数;
步骤4.5、经过选择和聚合,将得到的全局故障检测模型MG的模型参数添加进聚合后的全局故障知识图谱Gj
步骤5、中心云服务器将聚合后的全局故障知识图谱Gj下发给各机房节点Ek,各机房节点Ek会将该全局故障知识图谱Gj进行直接存储,此时,各机房节点Ek会同时存在聚合后的全局故障知识图谱Gj和聚合前的本地故障知识图谱Lk,之后各机房节点Ek根据本地故障知识图谱Lk和接收到的全局故障知识图谱Gj构建本地故障树模型。
故障树模型的构建步骤如下:
步骤5.1、各机房将全局故障知识图谱Gj中梳理好的故障信息类实体作为故障树模型中的基本事件,并将图谱Gj中故障模式与故障原因间的因果关系以及专家经验中故障原因间的逻辑关系进行导入,构建本地故障树模型框架。
步骤5.2、在结合双层故障知识图谱中的全局属性和局部属性信息,对故障树模型中的各基本事件进行定量分析以及故障成因分析操作之前,需要对全局属性的权重值wg和局部属性的权重值wl这两个参数进行计算,具体公式如下:
Figure BDA0003468756460000171
wg=1-wl (4)
其中,wg表示全局属性在公式中所占据的权重值,wl表示局部属性在公式中所占据的权重值,mHg表示在所有机房节点所统计的全部历史记录中故障模式H发生的累计故障频次,mHl_k表示在当前第k个机房节点Ek的本地历史记录中故障模式H发生的故障频次,Tg表示故障设备在所有机房节点中的累计总运行时长,Tl_k表示故障设备在第k个机房节点Ek本地中的总运行时长。
通过公式5、8可以发现,在不同机房节点或是在同一机房节点Ek但是发生不同故障模式的情况下,进行故障成因分析时所使用的全局属性的权重值wg和局部属性的权重值wl这两个参数都是不同的,可以有效提升故障成因分析的准确率。
步骤5.3、结合双层故障知识图谱中的全局属性和局部属性信息,对故障树模型中的各基本事件进行定量分析,以求取各基本事件的故障率。各底事件的故障率求取公式如下:
Figure BDA0003468756460000181
其中,λb_k表示机房节点Ek的第b个底事件的故障率,mbg表示所有机房节点所统计的全部历史记录中第b个底事件发生的累计故障频次,mbl_k表示在当前第k个机房节点Ek的本地历史记录中第b个底事件发生的故障频次,Tg表示故障设备在所有机房节点中的累计总运行时长,Tl_k表示故障设备在机房节点Ek中的总运行时长,wg表示全局属性在公式中所占据的权重值,wl表示局部属性在公式中所占据的权重值;
设分布式子节点Ek中某故障模式的故障树模型中底事件的个数为n,它们的故障率分别表示为λb_k(b=1,2,...,n)。当所述故障树模型中,相邻两级事件均为“与”逻辑关系时,顶事件的故障率λ(T)的计算公式如下:
Figure BDA0003468756460000182
当所述故障树模型中,相邻两级事件均为“或”逻辑关系时,顶事件的故障率λ(T)的计算公式如下:
Figure BDA0003468756460000183
步骤6、各机房节点Ek将构建完成的故障树模型映射成贝叶斯网络,具体过程如下:1)将故障树中的事件对应表达成贝叶斯网络中的节点B,其中,故障树中的底事件在贝叶斯网络中作为根节点Br,顶事件在贝叶斯网络中作为叶节点Bf;2)将故障树中的各基本事件的故障率作为贝叶斯网络中对应节点B的先验概率进行赋值;3)将贝叶斯网络中具有连接关系的相邻节点的故障频次的比值作为条件概率。
步骤7、各机房节点Ek会结合全局故障知识图谱Gj中的全局属性和本地故障知识图谱Lk中的局部属性这两个方面进行考虑,利用贝叶斯网络进行故障成因的差异化分析,具体步骤如下:
步骤7.1、通过公式5计算得出故障树中底事件的故障率,并根据公式6或7,完成故障树中各顶事件的故障率计算,并在故障树模型映射成贝叶斯网络的过程中,将故障树中的各基本事件的故障率作为贝叶斯网络中对应节点的先验概率进行赋值;
步骤7.2、贝叶斯网络中具有连接关系的相邻节点间的条件概率可以通过如下公式计算得到:
Figure BDA0003468756460000191
其中,Pij表示贝叶斯网络中具有连接关系的相邻节点Bi和节点Bj之间的条件概率,mig表示在所有机房节点的历史记录中贝叶斯网络节点Bi发生的累计故障频次,mjg表示在所有机房节点的历史记录中贝叶斯网络节点Bj发生的累计故障频次,mil_k表示在当前第k个机房节点Ek的历史记录中贝叶斯网络节点Bi发生的故障频次,mjl_k表示在当前第k个机房节点Ek的历史记录中贝叶斯网络节点Bj发生的故障频次,wg表示全局属性在公式中所占据的权重值,wl表示局部属性在公式中所占据的权重值。
步骤7.3、结合贝叶斯公式,求取贝叶斯网络中各故障成因节点后验概率,并根据后验概率的大小对各故障成因进行排序,按照列表形式返回后验概率中排名前3的故障成因。
当同一种故障发生于不同的机房节点时,各机房节点会因本地的故障成因的发生频次不同,从而实现差异化的故障成因分析。
步骤8、结合故障知识图谱Gj,使用cypher语句作为查询语句,根据得出的故障成因列表分别进行故障修复措施的推荐。
下面通过故障成因分析流程中的某一故障设备为实例进行进一步说明,因此并不将本发明限制在所述的实施例范围中。
实例:机房中低压直流配电设备中故障模式T的差异化故障成因分析。
在机房节点E1和机房节点E2中均检测到低压直流配电设备出现故障模式T,通过全局故障知识图谱可知,导致该故障T发生的故障原因有两种,分别为故障原因K1和故障原因K2,即n=2,并且两个故障原因间存在“或”的逻辑关系。在全局故障知识图谱中,故障设备的累计总运行时长Tg为100天,故障模式T的累计故障频次mTg为34次,其中由K1导致故障模式T发生的累计故障频次mK1g为16次,由K2导致故障模式T发生的累计故障频次mK2g为18次;在机房节点E1的本地故障知识图谱中,故障设备的总运行时长Tl_E1为57天,故障模式T的故障频次mTl_E1为17次,其中由K1导致故障模式T发生的故障频次mK1l_E1为11次,由K2导致故障模式T发生的故障频次mK2l_E1为6次;在机房节点E2的本地故障知识图谱中,故障设备的总运行时长Tl_E2为43天,故障模式T的故障频次mTl_E2为17次,其中由K1导致故障模式T发生的故障频次mK1l_E2为5次,由K2导致故障模式T发生的故障频次mK2l_E2为12次。
机房节点E1对故障树模型中的各基本事件进行定量分析过程中,底事件K1、K2的故障率λK1_E1、λK2_E1可以通过公式5求得,顶事件T的故障率λT_E1可以通过公式7求得;机房节点E2对故障树模型中的各基本事件进行定量分析过程中,底事件K1、K2的故障率λK1_E2、λK2_E2可以通过公式5求得,顶事件T的故障率λT_E2可以通过公式7求得;其中,机房节点E1中的全局属性的权重值wg_E1和局部属性的权重值wl_E1可以通过公式3、4求得;机房节点E2中的全局属性的权重值wg_E2和局部属性的权重值wl_E2可以通过公式3、4求得。该过程的具体计算如下所示:
Figure BDA0003468756460000211
wg_E1=1-wl_E1=0.5327
Figure BDA0003468756460000212
Figure BDA0003468756460000213
Figure BDA0003468756460000214
Figure BDA0003468756460000215
wg_E2=1-wl_E2=0.4624
Figure BDA0003468756460000216
Figure BDA0003468756460000217
Figure BDA0003468756460000218
按照步骤6将该故障树模型映射成对应贝叶斯网络,机房节点E1将故障树中底事件K1、K2以及顶事件T的故障率λK1_E1、λK2_E1、λT_E1作为贝叶斯网络中对应根节点BK1、BK2以及叶节点BT的先验概率PE1(BK1)、PE1(BK2)、PE1(BT)进行赋值;机房节点E1将故障树中底事件K1、K2以及顶事件T的故障率λK1_E2、λK2_E2、λT_E2作为贝叶斯网络中对应根节点BK1、BK2以及叶节点BT的先验概率PE2(BK1)、PE2(BK2)、PE2(BT)进行赋值。
其中,贝叶斯网络中具有连接关系的相邻节点间的条件概率需要通过公式8求得。机房节点E1的贝叶斯网络中叶节点BT与根节点BK1、BK2之间的条件概率分别为PE1(BT|BK2)和PE1(BT|BK2),机房节点E2的贝叶斯网络中叶节点BT与根节点BK1、BK2之间的条件概率分别为PE2(BT|BK1)和PE2(BT|BK2)具体计算过程如下:
Figure BDA0003468756460000221
Figure BDA0003468756460000222
Figure BDA0003468756460000223
Figure BDA0003468756460000224
结合贝叶斯公式,分别求取机房节点E1中故障原因K1和故障原因K2的后验概率PE1(BK1|BT)和PE1(BK2|BT),具体计算公式如下:
Figure BDA0003468756460000225
Figure BDA0003468756460000226
同理,分别求取机房节点E2中故障原因K1和故障原因K2的后验概率PE2(BK1|BT)和PE2(BK2|BT),具体计算公式如下:
Figure BDA0003468756460000227
Figure BDA0003468756460000228
表2故障成因分析结果
Figure BDA0003468756460000231
根据故障成因的后验概率进行排序,返回的故障成因列表如表2所示。可以发现:经过故障成因分析后,在机房节点E1中故障原因K1的后验概率高于故障原因K2的后验概率,在机房节点E2中故障原因K2的后验概率高于故障原因K1的后验概率,这意味着当故障模式T发生时,在机房节点E1中最有可能导致该故障模式发生的故障原因是K1,然而在机房节点E2中最有可能导致该故障模式发生的故障原因是K2。
该实例充分证明了,在故障成因分析过程中,当同一种故障模式发生于不同的机房节点时,充分考虑不同机房节点中故障原因出现频次的差异性,从而根据各机房节点的具体情况实现更加准确的、具有差异化的故障成因分析是十分有必要的。
本实施例2中,相关符号示意如表3所示。
表3符号注释
Figure BDA0003468756460000232
Figure BDA0003468756460000241
综上所述,本发明实施例2采用知识图谱和深度学习相结合的方法进行故障诊断,可以在保证数据隐私保护的前提下通过故障检测模型的聚合提高各机房节点的故障检测能力,故障知识图谱的建立可以为之后的故障成因分析和故障修复提供帮助,有效提高各机房节点的故障处理能力,实现故障诊断过程的智能化。采用双层故障知识图谱的架构,将全局故障知识图谱中的全局属性和本地故障知识图谱中的局部属性相结合,通过全局属性权重参数和局部属性权重参数的设定,实现了故障成因分析的差异化,有效提升各分布式子节点中故障成因分析的准确率。
实施例3
本发明实施例3提供一种电子设备,包括存储器和处理器,所述处理器和所述存储器相互通信,所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令执行基于双层知识图谱架构的分布式协同故障诊断方法,该方法包括如下流程步骤:
分布式子节点基于本地故障信息构建本地故障知识图谱,并将本地故障检测模型的结构参数以及性能指标添加到本地故障知识图谱中;
各分布式子节点定期将本地故障知识图谱上传至中心节点,所述中心节点对各本地故障知识图谱进行聚合,并对各故障检测模型进行选择和聚合;
中心节点将聚合后的全局故障知识图谱下发给各分布式子节点,各分布式子节点根据本地故障知识图谱和接收到的全局故障知识图谱构建本地故障树模型,并映射成贝叶斯网络,根据贝叶斯网络进行故障成因的差异化分析,并结合全局故障知识图谱进行处理措施推荐。
实施例4
本发明实施例4提供一种计算机可读存储介质,其存储有计算机程序,所述计算机程序被处理器执行时实现基于双层知识图谱架构的分布式协同故障诊断方法,该方法包括如下流程步骤:
分布式子节点基于本地故障信息构建本地故障知识图谱,并将本地故障检测模型的结构参数以及性能指标添加到本地故障知识图谱中;
各分布式子节点定期将本地故障知识图谱上传至中心节点,所述中心节点对各本地故障知识图谱进行聚合,并对各故障检测模型进行选择和聚合;
中心节点将聚合后的全局故障知识图谱下发给各分布式子节点,各分布式子节点根据本地故障知识图谱和接收到的全局故障知识图谱构建本地故障树模型,并映射成贝叶斯网络,根据贝叶斯网络进行故障成因的差异化分析,并结合全局故障知识图谱进行处理措施推荐。
实施例5
本发明实施例5提供一种计算机设备,包括存储器和处理器,所述处理器和所述存储器相互通信,所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令执行基于双层知识图谱架构的分布式协同故障诊断方法,该方法包括如下步骤:
分布式子节点基于本地故障信息构建本地故障知识图谱,并将本地故障检测模型的结构参数以及性能指标添加到本地故障知识图谱中;
各分布式子节点定期将本地故障知识图谱上传至中心节点,所述中心节点对各本地故障知识图谱进行聚合,并对各故障检测模型进行选择和聚合;
中心节点将聚合后的全局故障知识图谱下发给各分布式子节点,各分布式子节点根据本地故障知识图谱和接收到的全局故障知识图谱构建本地故障树模型,并映射成贝叶斯网络,根据贝叶斯网络进行故障成因的差异化分析,并结合全局故障知识图谱进行处理措施推荐。
综上所述,本发明实施例所述的基于双层知识图谱架构的分布式协同故障诊断方法,采用知识图谱和深度学习相结合的方法进行故障诊断,可以在保证数据隐私保护的前提下通过故障检测模型的聚合提高各机房节点的故障检测能力,故障知识图谱的建立可以为之后的故障成因分析和故障修复提供帮助,有效提高各机房节点的故障处理能力,实现故障诊断过程的智能化。本发明采用双层故障知识图谱的架构,将全局故障知识图谱中的全局属性和本地故障知识图谱中的局部属性相结合,通过全局属性权重参数和局部属性权重参数的设定,实现了故障成因分析的差异化,有效提升各分布式子节点中故障成因分析的准确率。
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明公开的技术方案的基础上,本领域技术人员在不需要付出创造性劳动即可做出的各种修改或变形,都应涵盖在本发明的保护范围之内。

Claims (10)

1.一种基于双层知识图谱架构的分布式协同故障诊断方法,其特征在于,包括:
分布式子节点基于本地故障信息构建本地故障知识图谱,并将本地故障检测模型的结构参数以及性能指标添加到本地故障知识图谱中;
各分布式子节点定期将本地故障知识图谱上传至中心节点,所述中心节点对各本地故障知识图谱进行聚合,并对各故障检测模型进行选择和聚合;
中心节点将聚合后的全局故障知识图谱下发给各分布式子节点,各分布式子节点根据本地故障知识图谱和接收到的全局故障知识图谱构建本地故障树模型,并映射成贝叶斯网络,根据贝叶斯网络进行故障成因的差异化分析,并结合全局故障知识图谱进行处理措施推荐。
2.根据权利要求1所述的基于双层知识图谱架构的分布式协同故障诊断方法,其特征在于,各分布式子节点的本地故障知识图谱构建完成后,将本地故障检测模型的结构参数以及性能指标,作为各子节点的属性信息存储在本地故障知识图谱中。
3.根据权利要求1所述的基于双层知识图谱架构的分布式协同故障诊断方法,其特征在于,本地故障知识图谱聚合之前,需要对知识表示进行规范化和统一化并进行故障知识对齐,所述故障知识对齐包括故障实体对齐、故障关系对齐以及故障属性对齐;本地故障知识图谱聚合过程包括故障实体聚合、故障关系聚合以及故障属性聚合;
故障检测模型的选择过程中,考虑模型的故障识别种类数、模型使用的数据集规模大小、模型的识别准确率、模型的故障识别种类数的增量以及模型所使用的故障数据集规模的增量这五个因素经过选择和聚合,将得到的全局故障检测模型的模型参数添加进聚合后的全局故障知识图谱。
4.根据权利要求1所述的基于双层知识图谱架构的分布式协同故障诊断方法,其特征在于,构建所述故障树模型的过程中,将由全局故障知识图谱梳理好的故障实体与故障原因间的因果关系以及故障原因间的逻辑关系直接进行导入,并结合双层故障知识图谱中的全局属性和局部属性信息,对所述故障树模型中的各基本事件进行定量分析,以求取所述基本事件的故障率。
5.根据权利要求4所述的基于双层知识图谱架构的分布式协同故障诊断方法,其特征在于,以求取所述基本事件的故障率,包括:
所述故障树模型中底事件的故障率的计算公式如下:
Figure FDA0003468756450000021
其中,λb_k表示分布式子节点Ek的第b个底事件的故障率,mbg表示所有分布式子节点所统计的全部历史记录中第b个底事件发生的累计故障频次,mbl_k表示在当前第k个子节点Ek的本地历史记录中第b个底事件发生的故障频次,Tg表示故障设备在所有分布式子节点中的累计总运行时长,Tl_k表示故障设备在子节点Ek中的总运行时长,wg表示全局属性在公式中所占据的权重值,wl表示局部属性在公式中所占据的权重值;
设分布式子节点Ek中某故障模式的故障树模型中底事件的个数为n,它们的故障率分别表示为λb_k(b=1,2,...,n);当所述故障树模型中,相邻两级事件均为“与”逻辑关系时,顶事件的故障率λ(T)的计算公式如下:
Figure FDA0003468756450000022
当所述故障树模型中,相邻两级事件均为“或”逻辑关系时,顶事件的故障率λ(T)的计算公式如下:
Figure FDA0003468756450000023
6.根据权利要求5所述的基于双层知识图谱架构的分布式协同故障诊断方法,其特征在于,权重参数wl和wg的具体计算公式如下:
Figure FDA0003468756450000031
wg=1-wl
其中,mHg表示在所有分布式子节点所统计的全部历史记录中故障模式H发生的累计故障频次,mHl_k表示在当前第k个子节点Ek的本地历史记录中故障模式H发生的故障频次,Tg表示故障设备在所有分布式子节点中的累计总运行时长,Tl_k表示故障设备在子节点Ek本地中的总运行时长。
7.根据权利要求5所述的基于双层知识图谱架构的分布式协同故障诊断方法,其特征在于,各子节点利用所述贝叶斯网络进行故障成因的差异化分析,并结合全局故障知识图谱进行处理措施推荐,包括:贝叶斯网络中具有连接关系的相邻节点间的条件概率的计算公式如下:
Figure FDA0003468756450000032
其中,Pij表示贝叶斯网络中具有连接关系的相邻节点Bi和节点Bj之间的条件概率,mig表示在所有分布式子节点的历史记录中贝叶斯网络节点Bi发生的累计故障频次,mjg表示在所有分布式子节点的历史记录中贝叶斯网络节点Bj发生的累计故障频次,mil_k表示在当前第k个子节点Ek的历史记录中贝叶斯网络节点Bi发生的故障频次,mjl_k表示在当前第k个子节点Ek的历史记录中贝叶斯网络节点Bj发生的故障频次;
根据故障树中底事件故障率以及贝叶斯网络中邻接节点间的条件概率,并结合贝叶斯公式,当同一种故障发生于不同的节点时,各节点会因本地的故障成因的发生频次不同,从而实现差异化的故障成因分析。
8.一种计算机设备,包括存储器和处理器,所述处理器和所述存储器相互通信,所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令执行如权利要求1-7任一项所述的基于双层知识图谱架构的分布式协同故障诊断方法。
9.一种电子设备,其特征在于,包括存储器和处理器,所述处理器和所述存储器相互通信,所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令执行如权利要求1-7任一项所述的基于双层知识图谱架构的分布式协同故障诊断方法。
10.一种计算机可读存储介质,其特征在于,其存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1-7任一项所述的基于双层知识图谱架构的分布式协同故障诊断方法。
CN202210036763.6A 2022-01-13 2022-01-13 基于双层知识图谱架构的分布式协同故障诊断方法 Pending CN114385403A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210036763.6A CN114385403A (zh) 2022-01-13 2022-01-13 基于双层知识图谱架构的分布式协同故障诊断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210036763.6A CN114385403A (zh) 2022-01-13 2022-01-13 基于双层知识图谱架构的分布式协同故障诊断方法

Publications (1)

Publication Number Publication Date
CN114385403A true CN114385403A (zh) 2022-04-22

Family

ID=81202443

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210036763.6A Pending CN114385403A (zh) 2022-01-13 2022-01-13 基于双层知识图谱架构的分布式协同故障诊断方法

Country Status (1)

Country Link
CN (1) CN114385403A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115865625A (zh) * 2022-11-28 2023-03-28 武汉烽火技术服务有限公司 一种通信设备故障根因的分析方法和装置
CN116010886A (zh) * 2022-12-22 2023-04-25 航安云创科技(北京)有限公司 安全监测方法、装置、电子设备和存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115865625A (zh) * 2022-11-28 2023-03-28 武汉烽火技术服务有限公司 一种通信设备故障根因的分析方法和装置
CN116010886A (zh) * 2022-12-22 2023-04-25 航安云创科技(北京)有限公司 安全监测方法、装置、电子设备和存储介质
CN116010886B (zh) * 2022-12-22 2023-09-12 航安云创科技(北京)有限公司 安全监测方法、装置、电子设备和存储介质

Similar Documents

Publication Publication Date Title
CN106326585B (zh) 基于贝叶斯网络推理的预测分析方法以及装置
CN105677791B (zh) 用于分析风力发电机组的运行数据的方法和系统
Konstantelos et al. Using vine copulas to generate representative system states for machine learning
CN109858140B (zh) 一种基于信息熵离散型贝叶斯网络冷水机组故障诊断方法
CN114385403A (zh) 基于双层知识图谱架构的分布式协同故障诊断方法
CN104123448B (zh) 基于上下文的多数据流异常检测方法
CN108919059A (zh) 一种电网故障诊断方法、装置、设备及可读存储介质
JP7442001B1 (ja) 水力発電ユニットの故障総合診断方法
CN110705887A (zh) 一种基于神经网络模型的低压台区运行状态综合评价方法
CN115237717A (zh) 一种微服务异常检测方法和系统
CN111523088A (zh) 一种基于dpsir模型的生态环境评价方法
CN114692875A (zh) 一种故障诊断用gis知识图谱的构建方法
CN116842459A (zh) 一种基于小样本学习的电能计量故障诊断方法及诊断终端
CN117556369B (zh) 一种动态生成的残差图卷积神经网络的窃电检测方法及系统
Liu et al. Research on the strategy of locating abnormal data in IOT management platform based on improved modified particle swarm optimization convolutional neural network algorithm
CN116578436A (zh) 基于异步多元时间序列数据的实时在线检测方法
Zhang et al. Root cause analysis of concurrent alarms based on random walk over anomaly propagation graph
Kakadia et al. Machine learning approaches for network resiliency optimization for service provider networks
CN115237091A (zh) 一种机电装备故障溯源方法及系统
CN114298188A (zh) 一种电力设备故障智能分析方法及系统
Cai et al. Tracemodel: An automatic anomaly detection and root cause localization framework for microservice systems
Li et al. Multi-source heterogeneous log fusion technology of power information system based on big data and imprecise reasoning theory
CN117113157B (zh) 一种基于人工智能的台区用电故障检测系统
CN109558258A (zh) 一种分布式系统根源故障定位的方法及装置
Lu et al. Anomaly Recognition Method for Massive Data of Power Internet of Things Based on Bayesian Belief Network

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination