CN112596936A - 系统故障原因的确定方法及装置、存储介质、电子装置 - Google Patents

系统故障原因的确定方法及装置、存储介质、电子装置 Download PDF

Info

Publication number
CN112596936A
CN112596936A CN202011407642.5A CN202011407642A CN112596936A CN 112596936 A CN112596936 A CN 112596936A CN 202011407642 A CN202011407642 A CN 202011407642A CN 112596936 A CN112596936 A CN 112596936A
Authority
CN
China
Prior art keywords
fault
determining
reason
knowledge graph
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011407642.5A
Other languages
English (en)
Inventor
周权
杨邓
储贤
鲁臣
王鹏
田江
向小佳
丁永建
李璠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Everbright Technology Co ltd
Original Assignee
Everbright Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Everbright Technology Co ltd filed Critical Everbright Technology Co ltd
Priority to CN202011407642.5A priority Critical patent/CN112596936A/zh
Publication of CN112596936A publication Critical patent/CN112596936A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Abstract

本发明实施例提供了一种系统故障原因的确定方法及装置、存储介质、电子装置,该方法包括:确定系统的故障知识图谱,其中,故障知识图谱中包括系统的运行指标与预设故障原因之间的关系;在系统出现故障的情况下,在系统的运行指标中确定故障运行指标;在故障知识图谱中确定出与故障运行指标对应的目标故障原因,其中,目标故障原因包括在预设故障原因中。通过本发明,解决了相关技术中对系统的故障原因的确定效率低的问题,达到提高对系统的故障原因的确定效率的效果。

Description

系统故障原因的确定方法及装置、存储介质、电子装置
技术领域
本发明实施例涉及计算机领域,具体而言,涉及一种系统故障原因的确定方法及装置、存储介质、电子装置。
背景技术
近些年,以大数据、云计算、人工智能、区块链以及移动互联为引领的新的工业革命与科技革命,一方面新技术对算力几何式的增长需求,对数据中心运维提出了新的挑战,传统人肉运维的方式已经不能满足需求;另一方面大数据、云计算、人工智能等新技术的发展及Devops(过程、方法与系统的统称,Development Opertions)的新理念给数据中心高效智能运维提供了新的可能。
数据中心运维涉及基础设施、操作系统、中间件、数据库等方方面面,没有人能对各方面都深入了解,因此需要大量人员才能保障数据中心平稳运行;数据中心运维涉及相关指标数量多,传统故障定位难度大、速度慢且需要一定的运气;故障解决集中在部分技术专家身上,解决过程包含大量经验及主观判断因素,技能传承难度大,很难形成固定专家经验;故障解决方案不同专家会有所不同,没有标准化可复制的流程规范。
针对上述技术问题,相关技术中尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种系统故障原因的确定方法及装置、存储介质、电子装置,以至少解决相关技术中对系统的故障原因的确定效率低的问题。
根据本发明的一个实施例,提供了一种系统故障原因的确定方法,包括:确定系统的故障知识图谱,其中,上述故障知识图谱中包括上述系统的运行指标与预设故障原因之间的关系;在上述系统出现故障的情况下,在上述系统的运行指标中确定故障运行指标;在上述故障知识图谱中确定出与上述故障运行指标对应的目标故障原因,其中,目标故障原因包括在上述预设故障原因中。
根据本发明的另一个实施例,提供了一种系统故障原因的确定装置,包括:第一确定模块,用于确定系统的故障知识图谱,其中,上述故障知识图谱中包括上述系统的运行指标与预设故障原因之间的关系;第二确定模块,用于在上述系统出现故障的情况下,在上述系统的运行指标中确定故障运行指标;第三确定模块,用于在上述故障知识图谱中确定出与上述故障运行指标对应的目标故障原因,其中,目标故障原因包括在上述预设故障原因中。
在一个示例性实施例中,上述第一确定装置,包括:第一获取单元,用于获取上述系统的多个样本故障运行指标、以及与上述多个样本故障运行指标中的每个样本故障运行指标对应的样本故障原因;第一训练单元,用于利用机器学习算法,使用上述多个样本故障运行指标以及上述每个样本故障运行指标对应的样本故障原因对原始故障知识图谱进行训练,得到上述故障知识图谱。
在一个示例性实施例中,上述第二确定模块,包括:第一查找单元,用于在上述系统出现故障的情况下,在上述运行指标中查找与上述故障对应的故障运行指标。
在一个示例性实施例中,上述第三模块,包括:第二查找单元,用于在上述故障知识图谱中查找与上述故障运行指标对应的N个故障原因,其中,上述N是大于或等于1的自然数;第一确定单元,用于确定上述N个故障原因中每个故障原因出现的概率;第二确定单元,用于将上述概率大于预设阈值的故障原因确定为上述目标故障原因。
在一个示例性实施例中,上述装置还包括:第四确定模块,用于在上述故障知识图谱中确定出与上述故障运行指标对应的目标故障原因之后,从上述故障知识图谱中确定出上述与目标故障原因对应的故障解决方案的链接信息,其中,上述链接信息用于表示上述故障解决方案的存储位置。
根据本发明的又一个实施例,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
根据本发明的又一个实施例,还提供了一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述任一项方法实施例中的步骤。
通过本发明,由于确定系统的故障知识图谱,其中,故障知识图谱中包括系统的运行指标与预设故障原因之间的关系;在系统出现故障的情况下,在系统的运行指标中确定故障运行指标;在故障知识图谱中确定出与故障运行指标对应的目标故障原因,其中,目标故障原因包括在预设故障原因中。可以实现将专家经验设置在故障知识图谱中,从故障知识图谱中查找到故障原因。因此,可以解决相关技术中对系统的故障原因的确定效率低的问题,达到提高对系统的故障原因的确定效率的效果。
附图说明
图1是本发明实施例的一种系统故障原因的确定方法的移动终端的硬件结构框图;
图2是根据本发明实施例的系统故障原因的确定方法的流程图;
图3是根据本发明实施例的故障知识图谱的示意图;
图4是根据本发明实施例的整体流程图;
图5是根据本发明实施例的技术架构示意图;
图6是根据本发明实施例的时间序列示意图(一);
图7是根据本发明实施例的时间序列示意图(二);
图8是根据本发明实施例的系统故障原因的确定装置的结构框图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本发明的实施例。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
本申请实施例中所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。以运行在移动终端上为例,图1是本发明实施例的一种系统故障原因的确定方法的移动终端的硬件结构框图。如图1所示,移动终端可以包括一个或多个(图1中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)和用于存储数据的存储器104,其中,上述移动终端还可以包括用于通信功能的传输设备106以及输入输出设备108。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述移动终端的结构造成限定。例如,移动终端还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
存储器104可用于存储计算机程序,例如,应用软件的软件程序以及模块,如本发明实施例中的系统故障原因的确定方法对应的计算机程序,处理器102通过运行存储在存储器104内的计算机程序,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至移动终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括移动终端的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(Network Interface Controller,简称为NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(Radio Frequency,简称为RF)模块,其用于通过无线方式与互联网进行通讯。
在本实施例中提供了一种系统故障原因的确定方法,图2是根据本发明实施例的系统故障原因的确定方法的流程图,如图2所示,该流程包括如下步骤:
步骤S202,确定系统的故障知识图谱,其中,故障知识图谱中包括系统的运行指标与预设故障原因之间的关系;
步骤S204,在系统出现故障的情况下,在系统的运行指标中确定故障运行指标;
步骤S206,在故障知识图谱中确定出与故障运行指标对应的目标故障原因,其中,目标故障原因包括在预设故障原因中。
其中,上述步骤的执行主体可以为服务器等,但不限于此。
可选地,本实施例包括但不限于应用于对数据库、服务器等数据处理系统的故障分析场景中。
可选地,在本实施例中,故障知识图谱包括但不限于包括图3所示的图谱。其中,Ci用于表示系统运行指标,根据专家经验确定系统运行指标的阈值,超过或低于阈值取1,否则取0;Fj用于表示故障原因;Rij用于表示系统运行过程中出现i现象导致j故障的概率。
可选地,例如系统的运行指标包括:中央处理器(Central Processing Unit,简称为CPU)、内存、输入/输出(Input/Output,简称为IO)等。
通过上述步骤,由于确定系统的故障知识图谱,其中,故障知识图谱中包括系统的运行指标与预设故障原因之间的关系;在系统出现故障的情况下,在系统的运行指标中确定故障运行指标;在知识图谱中确定出与故障运行指标对应的目标故障原因,其中,目标故障原因包括在预设故障原因中。可以实现将专家经验设置在故障知识图谱中,从故障知识图谱中查找到故障原因。因此,可以解决相关技术中对系统的故障原因的确定效率低的问题,达到提高对系统的故障原因的确定效率的效果。
在一个示例性实施例中,确定系统的故障知识图谱,包括:
S1,获取系统的多个样本故障运行指标、以及与多个样本故障运行指标中的每个样本故障运行指标对应的样本故障原因;
S2,利用机器学习算法,使用多个样本故障运行指标以及每个样本故障运行指标对应的样本故障原因对原始故障知识图谱进行训练,得到故障知识图谱。
可选地,本实施例可以经过多次训练确定出故障知识图谱。
在一个示例性实施例中,在系统出现故障的情况下,在系统的运行指标中确定故障运行指标,包括:
S1,在系统出现故障的情况下,在运行指标中查找与故障对应的故障运行指标。
可选地,在本实施例中,在系统出现故障的情况下,系统自动查询运行指标中的故障运行指标。
在一个示例性实施例中,在故障知识图谱中确定出与故障运行指标对应的目标故障原因,包括:
S1,在故障知识图谱中查找与故障运行指标对应的N个故障原因,其中,N是大于或等于1的自然数;
S2,确定N个故障原因中每个故障原因出现的概率;
S3,将概率大于预设阈值的故障原因确定为目标故障原因。
可选地,在本实施例中,一个故障运行指标对应多个故障原因,通过计算故障原因的概率,可以准确的确定出最接近的故障原因。
在一个示例性实施例中,在故障知识图谱中确定出与故障运行指标对应的目标故障原因之后,方法还包括:
S1,从故障知识图谱中确定出与目标故障原因对应的故障解决方案的链接信息,其中,链接信息用于表示故障解决方案的存储位置。
可选地,在本实施例中,故障解决方案存储在数据库中,通过故障解决方案的链接信息在数据库中查找到故障解决方案。
下面结合具体实施例对本发明进行说明:
本实施例将机器学习算法运用到数据中心智能化运维中,将故障发现、故障定位、故障解决、经验积累、流程规范形成闭环,提供一站式的故障发现、定位和解决方案,如图4所示,具体包括以下内容:
故障发现:利用大数据、机器学习算法发现系统异常指标,确定各运行指标的特征与故障原因之间的关系;通过巡检,全面了解系统运行状况,便于提前发现系统异常;
故障定位:收集故障现场信息,结合专家经验,准确定位故障原因;
故障解决:推荐最优故障解决方案;
经验积累:量化故障特征,明确各指标与故障之间关系,形成标准化、系统化的故障解决方案;
流程规范:形成故障处理模板,固化经验,减少风险,标准化处理流程,输出统一规范。
基于图推荐算法的故障原因分析系统主要分为原因分析模块和机器学习模块,技术框架如图5所示,原因分析模块将传统运维专家经验固化成知识库,通过图推荐算法准确定位故障原因,推荐最优故障解决方案。知识库图谱结构如图3所示,其中,Ci用于表示系统运行指标,根据专家经验确定系统运行指标的阈值,超过或低于阈值取1,否则取0;Fj用于表示故障原因;Rij用于表示系统运行过程中出现i现象导致j故障的概率。
假设目前系统指标有三个,C1、C2、C3。故障原因有三个F1、F2、F3,反映某一故障的所有指标都是等权的。
某个场景下,C1指标正常,C2、C3指标异常,在该场景下定位故障。
构造现象矩阵如下:
Figure BDA0002819028060000081
构造关系矩阵如下:
Figure BDA0002819028060000082
C1正常,C2、C3异常的情况:
Figure BDA0002819028060000083
确定F发生的概率:(1 1 1 1 1 1)*(C*R)=(0 1 1 1/2 2/3 1);
因此,各原因概率如下:
P(F1)=1/2;
P(F2)=2/3;
P(F3)=1;
机器学习模块一方面通过机器学习发现故障现象和故障原因之间的内在联系,进一步丰富专家经验知识库;另一方面通过机器学习建立动态阈值,减少专家主观因素导致的误判等异常情况。
基于prophet对CPU、内存、IO等关键系统指标随时间变化的散点拟合时间序列模型。通过该模型可以找到系统性能拐点及合理区间,用来指导现象阀值的配置。图6、图7中曲线为拟合出的时间序列曲线,可以根据该曲线预测未来某时刻系统的载荷,指导例外实例配置。
综上所述,本实施例提供的一站式故障发现、定位、解决、经验固化全流程的数据中心智能化运维方案,可以提供端到端的解决方案。以传统运维专家经验为基础,配合监督式用户反馈、无监督机器学习算法优化补充,形成不断优化的专家经验知识库。基于图推荐算法的故障原因分析,故障图谱构造及相应推荐算法,最终端到端关联解决方案。
基于图推荐算法的故障原因分析系统,将大数据、云计算、人工智能等新兴技术运用到数据中心智能化运维中,将故障发现、故障定位、故障解决、经验积累、流程规范形成闭环,提供一站式故障发现、定位、解决、经验固化全流程的数据中心智能化运维方案。
故障原因分析系统根据专家经验知识库的丰富可以用于数据中心各种系统的故障分析,避免了需要各方面专家才能保障数据中心安全的情况,大大减少了人力消耗;故障原因分析系统操作简单,普通操作人员即可完成故障诊断及恢复,大大降低了数据中心运维门槛;故障原因分析系统结合大数据、云计算、人工智能相关技术,在很大程度上提高了故障定位速度;通过自动化、智能化、平台化的故障原因分析系统,故障定位不再依赖操作人员的经验和主观判断,流程更加标准、定位更加精确;故障相关经验能够反馈到系统,提升系统故障分析能力,固化成为专家经验知识库,不再因为人员流动等原因导致核心技术能力流失等问题。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
在本实施例中还提供了一种系统故障原因的确定装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图8是根据本发明实施例的系统故障原因的确定装置的结构框图,如图8所示,该装置包括:
第一确定模块82,用于确定系统的故障知识图谱,其中,故障知识图谱中包括系统的运行指标与预设故障原因之间的关系;
第二确定模块84,用于在系统出现故障的情况下,在系统的运行指标中确定故障运行指标;
第三确定模块86,用于在故障知识图谱中确定出与故障运行指标对应的目标故障原因,其中,目标故障原因包括在预设故障原因中。
在一个示例性实施例中,上述第一确定装置,包括:第一获取单元,用于获取上述系统的多个样本故障运行指标、以及与上述多个样本故障运行指标中的每个样本故障运行指标对应的样本故障原因;第一训练单元,用于利用机器学习算法,使用上述多个样本故障运行指标以及上述每个样本故障运行指标对应的样本故障原因对原始故障知识图谱进行训练,得到上述故障知识图谱。
在一个示例性实施例中,上述第二确定模块,包括:第一查找单元,用于在上述系统出现故障的情况下,在上述运行指标中查找与上述故障对应的故障运行指标。
在一个示例性实施例中,上述第三模块,包括:第二查找单元,用于在上述故障知识图谱中查找与上述故障运行指标对应的N个故障原因,其中,上述N是大于或等于1的自然数;第一确定单元,用于确定上述N个故障原因中每个故障原因出现的概率;第二确定单元,用于将上述概率大于预设阈值的故障原因确定为上述目标故障原因。
在一个示例性实施例中,上述装置还包括:第四确定模块,用于在上述故障知识图谱中确定出与上述故障运行指标对应的目标故障原因之后,从上述故障知识图谱中确定出上述与目标故障原因对应的故障解决方案的链接信息,其中,上述链接信息用于表示上述故障解决方案的存储位置。
需要说明的是,上述各个模块是可以通过软件或硬件来实现的,对于后者,可以通过以下方式实现,但不限于此:上述模块均位于同一处理器中;或者,上述各个模块以任意组合的形式分别位于不同的处理器中。
本发明的实施例还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
在本实施例中,上述计算机可读存储介质可以被设置为存储用于执行以下步骤的计算机程序:
S1,确定系统的故障知识图谱,其中,故障知识图谱中包括系统的运行指标与预设故障原因之间的关系;
S2,在系统出现故障的情况下,在系统的运行指标中确定故障运行指标;
S3,在故障知识图谱中确定出与故障运行指标对应的目标故障原因,其中,目标故障原因包括在预设故障原因中。
在一个示例性实施例中,上述计算机可读存储介质可以包括但不限于:U盘、只读存储器(Read-Only Memory,简称为ROM)、随机存取存储器(Random Access Memory,简称为RAM)、移动硬盘、磁碟或者光盘等各种可以存储计算机程序的介质。
本发明的实施例还提供了一种电子装置,包括存储器和处理器,该存储器中存储有计算机程序,该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。
在一个示例性实施例中,上述电子装置还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。
在一个示例性实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:
S1,确定系统的故障知识图谱,其中,故障知识图谱中包括系统的运行指标与预设故障原因之间的关系;
S2,在系统出现故障的情况下,在系统的运行指标中确定故障运行指标;
S3,在故障知识图谱中确定出与故障运行指标对应的目标故障原因,其中,目标故障原因包括在预设故障原因中。
本实施例中的具体示例可以参考上述实施例及示例性实施方式中所描述的示例,本实施例在此不再赘述。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种系统故障原因的确定方法,其特征在于,包括:
确定系统的故障知识图谱,其中,所述故障知识图谱中包括所述系统的运行指标与预设故障原因之间的关系;
在所述系统出现故障的情况下,在所述系统的运行指标中确定故障运行指标;
在所述故障知识图谱中确定出与所述故障运行指标对应的目标故障原因,其中,目标故障原因包括在所述预设故障原因中。
2.根据权利要求1所述的方法,其特征在于,确定系统的故障知识图谱,包括:
获取所述系统的多个样本故障运行指标、以及与所述多个样本故障运行指标中的每个样本故障运行指标对应的样本故障原因;
利用机器学习算法,使用所述多个样本故障运行指标以及所述每个样本故障运行指标对应的样本故障原因对原始故障知识图谱进行训练,得到所述故障知识图谱。
3.根据权利要求1所述的方法,其特征在于,在所述系统出现故障的情况下,在所述系统的运行指标中确定故障运行指标,包括:
在所述系统出现故障的情况下,在所述运行指标中查找与所述故障对应的故障运行指标。
4.根据权利要求1所述的方法,其特征在于,在所述故障知识图谱中确定出与所述故障运行指标对应的目标故障原因,包括:
在所述故障知识图谱中查找与所述故障运行指标对应的N个故障原因,其中,所述N是大于或等于1的自然数;
确定所述N个故障原因中每个故障原因出现的概率;
将所述概率大于预设阈值的故障原因确定为所述目标故障原因。
5.根据权利要求1所述的方法,其特征在于,在所述故障知识图谱中确定出与所述故障运行指标对应的目标故障原因之后,所述方法还包括:
从所述故障知识图谱中确定出与所述目标故障原因对应的故障解决方案的链接信息,其中,所述链接信息用于表示所述故障解决方案的存储位置。
6.一种系统故障原因的确定装置,其特征在于,包括:
第一确定模块,用于确定系统的故障知识图谱,其中,所述故障知识图谱中包括所述系统的运行指标与预设故障原因之间的关系;
第二确定模块,用于在所述系统出现故障的情况下,在所述系统的运行指标中确定故障运行指标;
第三确定模块,用于在所述故障知识图谱中确定出与所述故障运行指标对应的目标故障原因,其中,目标故障原因包括在所述预设故障原因中。
7.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行所述权利要求1至5任一项中所述的方法。
8.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行所述权利要求1至5任一项中所述的方法。
CN202011407642.5A 2020-12-04 2020-12-04 系统故障原因的确定方法及装置、存储介质、电子装置 Pending CN112596936A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011407642.5A CN112596936A (zh) 2020-12-04 2020-12-04 系统故障原因的确定方法及装置、存储介质、电子装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011407642.5A CN112596936A (zh) 2020-12-04 2020-12-04 系统故障原因的确定方法及装置、存储介质、电子装置

Publications (1)

Publication Number Publication Date
CN112596936A true CN112596936A (zh) 2021-04-02

Family

ID=75188442

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011407642.5A Pending CN112596936A (zh) 2020-12-04 2020-12-04 系统故障原因的确定方法及装置、存储介质、电子装置

Country Status (1)

Country Link
CN (1) CN112596936A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111209131A (zh) * 2019-12-30 2020-05-29 航天信息股份有限公司广州航天软件分公司 一种基于机器学习确定异构系统的故障的方法和系统
CN111435366A (zh) * 2019-01-14 2020-07-21 阿里巴巴集团控股有限公司 设备故障诊断方法、装置和电子设备
CN111563606A (zh) * 2020-04-30 2020-08-21 新智数字科技有限公司 一种设备预测性维护方法及装置
CN111682960A (zh) * 2020-05-14 2020-09-18 深圳市有方科技股份有限公司 一种物联网网络及设备的故障诊断方法及装置
CN112016898A (zh) * 2020-08-31 2020-12-01 光大科技有限公司 基于区块链的协同办公方法及装置、系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111435366A (zh) * 2019-01-14 2020-07-21 阿里巴巴集团控股有限公司 设备故障诊断方法、装置和电子设备
CN111209131A (zh) * 2019-12-30 2020-05-29 航天信息股份有限公司广州航天软件分公司 一种基于机器学习确定异构系统的故障的方法和系统
CN111563606A (zh) * 2020-04-30 2020-08-21 新智数字科技有限公司 一种设备预测性维护方法及装置
CN111682960A (zh) * 2020-05-14 2020-09-18 深圳市有方科技股份有限公司 一种物联网网络及设备的故障诊断方法及装置
CN112016898A (zh) * 2020-08-31 2020-12-01 光大科技有限公司 基于区块链的协同办公方法及装置、系统

Similar Documents

Publication Publication Date Title
CN108683530B (zh) 多维度数据的数据分析方法、装置及存储介质
CN109840157A (zh) 故障诊断的方法、装置、电子设备和存储介质
CN113935497A (zh) 智能运维故障处理方法、装置、设备及其存储介质
CN113254254B (zh) 系统故障的根因定位方法、装置、存储介质及电子装置
CN110221145A (zh) 电力设备故障诊断方法、装置及终端设备
CN113516244B (zh) 一种智能运维方法、装置、电子设备及存储介质
CN111859047A (zh) 一种故障解决方法及装置
CN112000502B (zh) 海量错误日志的处理方法、装置、电子装置及存储介质
CN114327964A (zh) 业务系统的故障原因处理方法、装置、设备及存储介质
CN113590451A (zh) 一种根因定位方法、运维服务器及存储介质
CN112801434A (zh) 性能指标健康度的监测方法、装置、设备和存储介质
CN113313280A (zh) 云平台的巡检方法、电子设备及非易失性存储介质
CN114461534A (zh) 软件性能测试方法、系统、电子设备及可读存储介质
CN111147306B (zh) 一种物联网设备的故障分析方法、装置以及物联网平台
CN112784025B (zh) 一种目标事件的确定方法和装置
CN115080373A (zh) 配电终端操作系统的性能检测方法、装置、设备及介质
CN110162440A (zh) 故障定位的方法、电子装置及计算机可读存储介质
CN112596936A (zh) 系统故障原因的确定方法及装置、存储介质、电子装置
CN115271277A (zh) 电力设备画像构建方法、系统、计算机设备及存储介质
CN114706893A (zh) 故障检测方法、装置、设备及存储介质
CN113259878B (zh) 话单结算方法、系统、电子设备及计算机可读存储介质
CN112579402A (zh) 一种应用系统故障定位的方法和装置
CN112764957A (zh) 应用故障定界方法及装置
CN111596641B (zh) 核电站应急柴油机故障分析方法、装置、存储介质及设备
CN117439899B (zh) 一种基于大数据的通信机房巡检方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination