CN110825549A - 一种信息系统故障根因的确定方法、装置、设备及存储介质 - Google Patents

一种信息系统故障根因的确定方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN110825549A
CN110825549A CN201911078608.5A CN201911078608A CN110825549A CN 110825549 A CN110825549 A CN 110825549A CN 201911078608 A CN201911078608 A CN 201911078608A CN 110825549 A CN110825549 A CN 110825549A
Authority
CN
China
Prior art keywords
information
fault
preset
fact
root cause
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911078608.5A
Other languages
English (en)
Inventor
闫祎颖
何云瑞
李扬
陈亮
王宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Information and Telecommunication Co Ltd
Original Assignee
State Grid Information and Telecommunication Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Information and Telecommunication Co Ltd filed Critical State Grid Information and Telecommunication Co Ltd
Priority to CN201911078608.5A priority Critical patent/CN110825549A/zh
Publication of CN110825549A publication Critical patent/CN110825549A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Quality & Reliability (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明适用于计算机技术领域,提供了一种信息系统故障根因的确定方法、装置、设备及存储介质,该确定方法包括以下步骤:基于预设的配置管理数据库,获取待确定信息系统故障的监控告警信息及相关信息,生成初始的事实,并将所述初始的事实作为当前的事实;基于预设的BP神经网络模型,对所述当前的事实进行推理,生成推理结果;判断所述推理结果是否为故障根因;若所述推理结果是故障根因,则将所述推理结果确定为所述待确定信息系统故障的故障根因。本发明通过基于CMDB的信息系统故障定位相关技术,并结合BP神经网络模型来实现信息系统的故障根因确定,实现了故障根因快速准确定位,从而可以提高信息系统业务的恢复效率。

Description

一种信息系统故障根因的确定方法、装置、设备及存储介质
技术领域
本发明属于计算机技术领域,尤其涉及一种信息系统故障根因的确定方法、装置、设备及存储介质。
背景技术
随着大数据、云计算、人工智能等新兴技术的快速发展,电力行业信息系统建设也在不断深化。信息系统数量在增多且架构日趋复杂,一次大的异常或故障往往可能从网络、安全、系统、应用等多层次监控渠道产生大量告警事件,而这些告警之间关联复杂,运维人员无法快速确定故障根因,导致业务无法快速恢复。
目前,现有的系统故障定位的技术主要基于故障决策树、配置管理数据库(Configuration Management Database,CMDB)等方法,然而,这些方法均存在确定故障根因的准确率较低等问题。
发明内容
本发明实施例的目的在于提供一种信息系统故障根因的确定方法,旨在解决确定故障根因的准确率较低的问题。
本发明实施例是这样实现的,一种信息系统故障根因的确定方法,包括以下步骤:
基于预设的配置管理数据库,获取待确定信息系统故障的监控告警信息及相关信息,生成初始的事实,并将所述初始的事实作为当前的事实;
基于预设的BP(Back Propagation)神经网络模型,对所述当前的事实进行推理,生成推理结果;
判断所述推理结果是否为故障根因;
若所述推理结果不是故障根因,则判断所述预设的配置管理数据库中是否有相关信息可以对所述初始的事实进行补充;若所述预设的配置管理数据库中有相关信息可以对所述初始的事实进行补充,则将所述预设的配置管理数据库中的相关信息补充到所述初始的事实中,生成补充后的事实,并将所述补充后的事实作为当前的事实,同时返回至所述基于预设的BP神经网络模型,对所述当前的事实进行推理,生成推理结果的步骤;
若所述推理结果是故障根因,则将所述推理结果确定为所述待确定信息系统故障的故障根因。
本发明实施例的另一目的在于提供一种信息系统故障根因的确定装置,其包括:
信息获取单元,用于基于预设的配置管理数据库,获取待确定信息系统故障的监控告警信息及相关信息,生成初始的事实,并将所述初始的事实作为当前的事实;
故障推理单元,用于基于预设的BP神经网络模型,对所述当前的事实进行推理,生成推理结果;
故障判断单元,用于判断所述推理结果是否为故障根因;
相关信息判断单元,用于判断所述预设的配置管理数据库中是否有相关信息可以对所述初始的事实进行补充;
相关信息补充单元,用于将所述预设的配置管理数据库中的相关信息补充到所述初始的事实中,生成补充后的事实,并将所述补充后的事实作为当前的事实;
根因确定单元,用于将所述推理结果确定为所述待确定信息系统故障的故障根因。
本发明实施例的另一目的在于提供一种计算机设备,包括存储器和处理器,所述的存储器中存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行上述的信息系统故障根因的确定方法的步骤。
本发明实施例的另一目的在于提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行上述的信息系统故障根因的确定方法的步骤。
本发明实施例提供的一种信息系统故障根因的确定方法,通过基于CMDB 的信息系统故障定位相关技术,对CMDB的配置项分类、属性以及关系进行了深入研究,在此基础之上分析BP神经网络算法,结合BP神经网络模型来实现信息系统的故障根因确定,并对信息系统故障样本集进行了测试,实现了故障根因快速准确定位,从而可以提高信息系统业务的恢复效率。
附图说明
图1为本发明实施例提供的一种信息系统故障根因的确定方法的流程图;
图2为本发明实施例提供的步骤S101的流程图;
图3为本发明实施例提供的步骤S102的流程图;
图4为本发明实施例提供预设的BP神经网络模型的建立方法的流程图;
图5为本发明实施例提供的一种信息系统故障根因的确定装置的结构框图;
图6为本发明实施例提供的信息获取单元的结构框图;
图7为本发明实施例提供的故障推理单元的结构框图;
图8为本发明实施例提供的配置管理数据库中配置项关系的示例图;
图9为本发明实施例提供的三层的BP神经网络模型的示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
可以理解,本申请所使用的术语“第一”、“第二”等可在本文中用于描述各种元件,但除非特别说明,这些元件不受这些术语限制。这些术语仅用于将第一个元件与另一个元件区分。举例来说,在不脱离本申请的范围的情况下,可以将第一xx脚本称为第二xx脚本,且类似地,可将第二xx脚本称为第一xx脚本。
如附图1所示,图1为本发明实施例提供一种信息系统故障根因的确定方法的流程图,该信息系统故障根因的确定方法,包括以下步骤:
步骤S101,基于预设的配置管理数据库,获取待确定信息系统故障的监控告警信息及相关信息,生成初始的事实,并将所述初始的事实作为当前的事实。
步骤S102,基于预设的BP神经网络模型,对所述当前的事实进行推理,生成推理结果。
步骤S103,判断所述推理结果是否为故障根因;若所述推理结果不是故障根因,则进行步骤S104;若所述推理结果是故障根因,则进行步骤S106。
步骤S104,判断所述预设的配置管理数据库中是否有相关信息可以对所述初始的事实进行补充;若所述预设的配置管理数据库中有相关信息可以对所述初始的事实进行补充,则进行步骤S105。
步骤S105,将所述预设的配置管理数据库中的相关信息补充到所述初始的事实中,生成补充后的事实,并将所述补充后的事实作为当前的事实,同时返回至步骤S102。
步骤S106,若所述推理结果是故障根因,则将所述推理结果确定为所述待确定信息系统故障的故障根因。
如附图2所示,作为本发明实施例的一个优选方案,所述预设的配置管理数据库包括配置项分类信息、配置项属性信息以及配置项关系信息;所述基于预设的配置管理数据库,获取待确定信息系统故障的监控告警信息及相关信息,生成初始的事实的步骤S101,具体包括:
步骤S201,基于预设的配置管理数据库,根据所述配置项分类信息、配置项属性信息以及配置项关系信息,确定所述待确定信息系统故障的相关信息;
步骤S202,基于预设的配置管理数据库,获取所述待确定信息系统故障的监控告警信息,并将所述待确定信息系统故障的监控告警信息以及所述待确定信息系统故障的相关信息作为初始的事实。
具体的,配置管理数据库(CMDB)的构建重点在于顶层设计,其包括配置项分类、配置项属性以及配置项关系的设计。对于配置项应遵循精而不多的原则,本发明实施例为配置项设计了四级分类,由小到大,精度依次增加。其中,部分基础设备的配置项分类示例如表1所示。
表1
Figure BDA0002263263950000051
在确定配置项属性时,应针对每一个配置项分类来设计,每个层级之间的属性是具有继承性的。同时,需根据逻辑性划分,如管理属性、技术属性等。
另外,配置项关系是CMDB的重要价值体现之一,当故障发生时,可以通过配置项关系,准确快速的掌握相关信息,定位故障根因,评估故障影响范围,从而快速恢复业务。配置项关系大致包括包含、属于、运行在、安装在、连接等。如附图8所示,为一个业务信息系统的CMBD配置项关系示例图。
如附图3所示,作为本发明实施例的另一个优选方案,所述基于预设的BP 神经网络模型,对所述当前的事实进行推理,生成推理结果的步骤S102,具体包括:
步骤S301,基于预设的产生式规则,将所述当前的事实转换为所述预设的 BP神经网络模型所能识别的数值信息;
步骤S302,基于预设的BP神经网络模型,根据所述预设的BP神经网络模型所能识别的数值信息,生成对应故障根因的数值信息,即为推理结果。
具体的,产生式规则的一般形式为A→B或If A Then B,而在信息系统的故障定位场景中,前提A为当前所有监控状态,结论B为故障根因。监控状态可以有多个,但根因只有一个,因此预设的产生式规则可表示为If a1^a2^…^an Then b。
当前的事实通过产生式表达后,需要转化成数值信息的形式存储在BP神经网络中。设事实的域为U,U={fi|i=1,2,…n},fi为第i个事实,n为事实的总数,在本发明实施例中为信息系统监控总数,也为二进制编码的码长。结论的二进制编码码长可根据故障根因个数进行设定,其中,本发明实施例设定其与前提的码长相等。
监控状态分为两类,正常与异常,分别用0和1表示。假设某个系统由2 个应用节点、2个数据库服务器以及一台负载均衡设备组成,则其部分监控及状态如表2所示,其对应的故障根因如表3所示。
表2
Figure BDA0002263263950000071
表3
Figure BDA0002263263950000072
根据上表2-3,并采用如上提出的形式表示当前的事实,可以如下例所示: IF数据库实例1无法连接and数据库实例2无法连接and应用节点1端口号为7100HTTP无法连接and应用节点2端口号为7100HTTP无法连接and系统健康运行时长指标异常Then数据库会话连接数过多。
经过预设的产生式规则可以转换为数值信息:0011110001→1000000000,将数值信息输入到BP神经网络模型中,即可获得推理的结果或者作为新的知识储存在BP神经网络模型中。
如附图4所示,作为本发明实施例的另一个优选方案,所述预设的BP神经网络模型的建立方法包括以下步骤:
步骤S401,获取信息系统的故障样本以及与所述故障样本相对应的故障根因标准信息;
步骤S402,基于预设的产生式规则,将所述故障样本以及所述故障根因标准信息分别转换为故障数值信息和根因数值信息;
步骤S403,基于预设的BP神经网络学习算法,根据所述故障数值信息与所根因数值信息的对应关系,生成所述预设的BP神经网络模型。
具体的,BP神经网络是一种多层的前馈神经网络,其主要特点为前向传播信号,反向传播误差。如附图9所示,为一个典型的三层BP神经网络模型。第一阶段是信号的前向传播,从输入层经过隐含层,最后到达输出层;第二阶段是误差的反向传播,从输出层到隐含层,最后到输入层,依次调节隐含层到输出层以及输入层到隐含层的连接权和阈值。
假设输入层的节点为n个,隐含层的节点为m个,输出层的节点为z个,输入样本及对应的期望输出为X(k)以及Y(k),则预设的BP神经网络学习算法步骤如下:
1、给出输入层到隐含层以及隐含层到输出层的连接权Wih、Vho,隐含层的阈值Th,并随机给输出层的激活值To赋一个(0,1)间的较小值。
2、输入样本
Figure BDA0002263263950000081
期望输出为
Figure BDA0002263263950000083
输入,依次计算:
Figure BDA0002263263950000084
其中,Hh为隐含层节点的输出函数,I0为输出层节点输出函数。
3、计算I0
Figure BDA0002263263950000086
之间的误差a0
Figure BDA0002263263950000091
4、将误差bh反向分配至隐含层的节点:
Figure BDA0002263263950000092
5、修正连接权Wih、Vho,α、β为学习率:
ΔVho(t+1)=αHha0
ΔWih(t+1)=βxibh
6、调整阈值Th、To
ΔTh(t+1)=βbh
ΔTo(t+1)=αa0
7、若a0足够小或者为零时,停止学习,否则选择下一个样本,从步骤2开始迭代执行。
结合上述预设的产生式规则,则上述信息系统的BP神经网络模型输入层与输出层均为10个神经元。隐含层节点个数根据经验公式
Figure BDA0002263263950000093
来确定,其中m与n为输入层与输出层神经元个数,a为1-10之间的调节常数,则不同个数的隐含层的训练情况如表4所示。
表4
Figure BDA0002263263950000094
Figure BDA0002263263950000101
由上表4可知,隐含层个数可选11或13,本发明实施例选择11个,则某信息系统的BP网络模型为10-11-10结构。将该信息系统故障的样本集放入训练好的BP神经网络模型进行推理计算,其推理结果如表5所示,其中推理结果的最大误差为0.0003,因此,本发明实施例提供的信息系统故障根因的确定方法确定故障根因的准确率较高。
表5
如附图5所示,本发明实施例还提供了一种信息系统故障根因的确定装置,其包括:
信息获取单元510,用于基于预设的配置管理数据库,获取待确定信息系统故障的监控告警信息及相关信息,生成初始的事实,并将所述初始的事实作为当前的事实;
故障推理单元520,用于基于预设的BP神经网络模型,对所述当前的事实进行推理,生成推理结果;
故障判断单元530,用于判断所述推理结果是否为故障根因;
相关信息判断单元540,用于判断所述预设的配置管理数据库中是否有相关信息可以对所述初始的事实进行补充;
相关信息补充单元550,用于将所述预设的配置管理数据库中的相关信息补充到所述初始的事实中,生成补充后的事实,并将所述补充后的事实作为当前的事实;
根因确定单元560,用于将所述推理结果确定为所述待确定信息系统故障的故障根因。
如附图6所示,作为本发明实施例的另一个优选方案,所述预设的配置管理数据库包括配置项分类信息、配置项属性信息以及配置项关系信息;所述信息获取单元510包括:
相关信息确定模块611,用于基于预设的配置管理数据库,根据所述配置项分类信息、配置项属性信息以及配置项关系信息,确定所述待确定信息系统故障的相关信息;
告警信息获取模块612,用于基于预设的配置管理数据库,获取所述待确定信息系统故障的监控告警信息,并将所述待确定信息系统故障的监控告警信息以及所述待确定信息系统故障的相关信息作为初始的事实。
如附图7所示,作为本发明实施例的另一个优选方案,所述故障推理单元 520包括:
事实转换模块721,用于基于预设的产生式规则,将所述当前的事实转换为所述预设的BP神经网络模型所能识别的数值信息;
根因信息生成模块722,用于基于预设的BP神经网络模型,根据所述预设的BP神经网络模型所能识别的数值信息,生成对应故障根因的数值信息,即为推理结果。
需要说明的是,上述各单元可以实现为一种计算机程序的形式,计算机程序可在计算机设备上运行,计算机设备的存储器中可存储组成各单元中各模块构成的计算机程序使得处理器执行上述信息系统故障根因的确定方法的各个步骤。
在本发明的一个实施例中,还提供了一种计算机设备,其包括存储器和处理器,所述的存储器中存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行上述信息系统故障根因的确定方法的各个步骤。
在本发明的一个实施例中,还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行上述信息系统故障根因的确定方法的各个步骤。
应该理解的是,虽然本发明各实施例的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,各实施例中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种信息系统故障根因的确定方法,其特征在于,包括以下步骤:
基于预设的配置管理数据库,获取待确定信息系统故障的监控告警信息及相关信息,生成初始的事实,并将所述初始的事实作为当前的事实;
基于预设的BP神经网络模型,对所述当前的事实进行推理,生成推理结果;
判断所述推理结果是否为故障根因;
若所述推理结果不是故障根因,则判断所述预设的配置管理数据库中是否有相关信息可以对所述初始的事实进行补充;若所述预设的配置管理数据库中有相关信息可以对所述初始的事实进行补充,则将所述预设的配置管理数据库中的相关信息补充到所述初始的事实中,生成补充后的事实,并将所述补充后的事实作为当前的事实,同时返回至所述基于预设的BP神经网络模型,对所述当前的事实进行推理,生成推理结果的步骤;
若所述推理结果是故障根因,则将所述推理结果确定为所述待确定信息系统故障的故障根因。
2.根据权利要求1所述的一种信息系统故障根因的确定方法,其特征在于,所述预设的配置管理数据库包括配置项分类信息、配置项属性信息以及配置项关系信息;所述基于预设的配置管理数据库,获取待确定信息系统故障的监控告警信息及相关信息,生成初始的事实的步骤,具体包括:
基于预设的配置管理数据库,根据所述配置项分类信息、配置项属性信息以及配置项关系信息,确定所述待确定信息系统故障的相关信息;
基于预设的配置管理数据库,获取所述待确定信息系统故障的监控告警信息,并将所述待确定信息系统故障的监控告警信息以及所述待确定信息系统故障的相关信息作为初始的事实。
3.根据权利要求1所述的一种信息系统故障根因的确定方法,其特征在于,所述基于预设的BP神经网络模型,对所述当前的事实进行推理,生成推理结果的步骤,具体包括:
基于预设的产生式规则,将所述当前的事实转换为所述预设的BP神经网络模型所能识别的数值信息;
基于预设的BP神经网络模型,根据所述预设的BP神经网络模型所能识别的数值信息,生成对应故障根因的数值信息,即为推理结果。
4.根据权利要求1或3所述的一种信息系统故障根因的确定方法,其特征在于,所述预设的BP神经网络模型的建立方法包括以下步骤:
获取信息系统的故障样本以及与所述故障样本相对应的故障根因标准信息;
基于预设的产生式规则,将所述故障样本以及所述故障根因标准信息分别转换为故障数值信息和根因数值信息;
基于预设的BP神经网络学习算法,根据所述故障数值信息与所根因数值信息的对应关系,生成所述预设的BP神经网络模型。
5.一种信息系统故障根因的确定装置,其特征在于,包括:
信息获取单元,用于基于预设的配置管理数据库,获取待确定信息系统故障的监控告警信息及相关信息,生成初始的事实,并将所述初始的事实作为当前的事实;
故障推理单元,用于基于预设的BP神经网络模型,对所述当前的事实进行推理,生成推理结果;
故障判断单元,用于判断所述推理结果是否为故障根因;
相关信息判断单元,用于判断所述预设的配置管理数据库中是否有相关信息可以对所述初始的事实进行补充;
相关信息补充单元,用于将所述预设的配置管理数据库中的相关信息补充到所述初始的事实中,生成补充后的事实,并将所述补充后的事实作为当前的事实;
根因确定单元,用于将所述推理结果确定为所述待确定信息系统故障的故障根因。
6.根据权利要求5所述的一种信息系统故障根因的确定装置,其特征在于,所述预设的配置管理数据库包括配置项分类信息、配置项属性信息以及配置项关系信息;所述信息获取单元包括:
相关信息确定模块,用于基于预设的配置管理数据库,根据所述配置项分类信息、配置项属性信息以及配置项关系信息,确定所述待确定信息系统故障的相关信息;
告警信息获取模块,用于基于预设的配置管理数据库,获取所述待确定信息系统故障的监控告警信息,并将所述待确定信息系统故障的监控告警信息以及所述待确定信息系统故障的相关信息作为初始的事实。
7.根据权利要求5所述的一种信息系统故障根因的确定装置,其特征在于,所述故障推理单元包括:
事实转换模块,用于基于预设的产生式规则,将所述当前的事实转换为所述预设的BP神经网络模型所能识别的数值信息;
根因信息生成模块,用于基于预设的BP神经网络模型,根据所述预设的BP神经网络模型所能识别的数值信息,生成对应故障根因的数值信息,即为推理结果。
8.根据权利要求5或7所述的一种信息系统故障根因的确定装置,其特征在于,所述预设的BP神经网络模型的建立方法包括以下步骤:
获取信息系统的故障样本以及与所述故障样本相对应的故障根因标准信息;
基于预设的产生式规则,将所述故障样本以及所述故障根因标准信息分别转换为故障数值信息和根因数值信息;
基于预设的BP神经网络学习算法,根据所述故障数值信息与所根因数值信息的对应关系,生成所述预设的BP神经网络模型。
9.一种计算机设备,包括存储器和处理器,其特征在于,所述的存储器中存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行权利要求1-4中任一项所述的信息系统故障根因的确定方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行权利要求1-4中任一项所述的信息系统故障根因的确定方法的步骤。
CN201911078608.5A 2019-11-06 2019-11-06 一种信息系统故障根因的确定方法、装置、设备及存储介质 Pending CN110825549A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911078608.5A CN110825549A (zh) 2019-11-06 2019-11-06 一种信息系统故障根因的确定方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911078608.5A CN110825549A (zh) 2019-11-06 2019-11-06 一种信息系统故障根因的确定方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN110825549A true CN110825549A (zh) 2020-02-21

Family

ID=69552942

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911078608.5A Pending CN110825549A (zh) 2019-11-06 2019-11-06 一种信息系统故障根因的确定方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN110825549A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111639115A (zh) * 2020-04-29 2020-09-08 国家电网有限公司客户服务中心 基于五维模型的电网信息系统运维数据异常的分析方法
CN111858123A (zh) * 2020-07-29 2020-10-30 中国工商银行股份有限公司 基于有向图网络的故障根因分析方法和装置
CN111930547A (zh) * 2020-07-31 2020-11-13 中国工商银行股份有限公司 一种故障定位方法、装置及存储介质
CN113015198A (zh) * 2021-04-22 2021-06-22 武汉烽火技术服务有限公司 一种故障基站的定位方法、装置、设备及可读存储介质
WO2024073634A1 (en) * 2022-09-30 2024-04-04 Advanced Micro Devices, Inc. Systems and methods for generating remedy recommendations for power and performance issues within semiconductor software and hardware

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103778044A (zh) * 2012-10-23 2014-05-07 伊姆西公司 用于系统故障诊断和修复的方法和装置
CN105447568A (zh) * 2015-11-09 2016-03-30 广州供电局有限公司 基于bp神经网络的电力通信网故障分析方法
US9652618B1 (en) * 2016-06-10 2017-05-16 Optum, Inc. Systems and apparatuses for architecture assessment and policy enforcement
CN110221145A (zh) * 2019-06-03 2019-09-10 国家电网有限公司 电力设备故障诊断方法、装置及终端设备

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103778044A (zh) * 2012-10-23 2014-05-07 伊姆西公司 用于系统故障诊断和修复的方法和装置
CN105447568A (zh) * 2015-11-09 2016-03-30 广州供电局有限公司 基于bp神经网络的电力通信网故障分析方法
US9652618B1 (en) * 2016-06-10 2017-05-16 Optum, Inc. Systems and apparatuses for architecture assessment and policy enforcement
CN109478263A (zh) * 2016-06-10 2019-03-15 欧帕特公司 用于体系结构评估和策略执行的系统和设备
CN110221145A (zh) * 2019-06-03 2019-09-10 国家电网有限公司 电力设备故障诊断方法、装置及终端设备

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
曾明霏,谢朋宇: "基于CMDB 的规则推理的故障定位技术" *
曾明霏等: "基于CMDB的规则推理的故障定位技术" *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111639115A (zh) * 2020-04-29 2020-09-08 国家电网有限公司客户服务中心 基于五维模型的电网信息系统运维数据异常的分析方法
CN111858123A (zh) * 2020-07-29 2020-10-30 中国工商银行股份有限公司 基于有向图网络的故障根因分析方法和装置
CN111858123B (zh) * 2020-07-29 2023-09-26 中国工商银行股份有限公司 基于有向图网络的故障根因分析方法和装置
CN111930547A (zh) * 2020-07-31 2020-11-13 中国工商银行股份有限公司 一种故障定位方法、装置及存储介质
CN113015198A (zh) * 2021-04-22 2021-06-22 武汉烽火技术服务有限公司 一种故障基站的定位方法、装置、设备及可读存储介质
CN113015198B (zh) * 2021-04-22 2022-08-02 武汉烽火技术服务有限公司 一种故障基站的定位方法、装置、设备及可读存储介质
WO2024073634A1 (en) * 2022-09-30 2024-04-04 Advanced Micro Devices, Inc. Systems and methods for generating remedy recommendations for power and performance issues within semiconductor software and hardware
US11994939B2 (en) 2022-09-30 2024-05-28 Advanced Micro Devices, Inc. Systems and methods for generating remedy recommendations for power and performance issues within semiconductor software and hardware

Similar Documents

Publication Publication Date Title
CN110825549A (zh) 一种信息系统故障根因的确定方法、装置、设备及存储介质
Ying et al. A hidden Markov model-based algorithm for fault diagnosis with partial and imperfect tests
Mohammadi et al. Machine learning assisted stochastic unit commitment during hurricanes with predictable line outages
Kumar et al. A new approach for analysing the fuzzy system reliability using intuitionistic fuzzy number
Wang et al. A deep learning anomaly detection framework for satellite telemetry with fake anomalies
WO2019101963A1 (en) Method and device for monitoring a process of generating metric data for predicting anomalies
Li et al. Preventive maintenance interval optimization for continuous multistate systems
Liu et al. Resilience assessment and importance measure for interdependent critical infrastructures
CN111080484A (zh) 一种配电网异常数据监测方法及装置
CN113487182B (zh) 设备健康状态评估方法、装置、计算机设备和介质
Swarup et al. Neural network approach to contingency screening and ranking in power systems
Mkandawire et al. Component risk trending based on systems thinking incorporating Markov and Weibull inferences
CN116826961A (zh) 电网智能调度和运维系统、方法及存储介质
Fu et al. A tractable failure probability prediction model for predictive maintenance scheduling of large-scale modular-multilevel-converters
Wei et al. Application of rough set and neural network in water energy utilization
CN116664098A (zh) 一种光伏电站的异常检测方法及系统
CN115237091A (zh) 一种机电装备故障溯源方法及系统
Sharifi et al. Real time study of a k-out-of-n system: n identical elements with increasing failure rates
CN114239868A (zh) 开关柜绝缘劣化程度检测方法、装置、设备和程序产品
US11288159B2 (en) System model evaluation system, operation management system, system model evaluation method, and program
Duan et al. Dynamic diagnosis strategy for redundant systems based on reliability analysis and sensors under epistemic uncertainty
CN110991805A (zh) 一种配电网风险薄弱点辨识方法和系统
CN115408197B (zh) 基于流式处理及多源数据交叉校验的负荷数据校验方法
CN118282041B (zh) 一种新能源电力系统的能源管理方法和装置
Hwang et al. Development of Machine Learning based Model for Anomaly Detection and Fault Cause Diagnosis of Assets in Petrochemical Industries

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200221

RJ01 Rejection of invention patent application after publication