CN113868008A - 一种异常处理方法及装置 - Google Patents

一种异常处理方法及装置 Download PDF

Info

Publication number
CN113868008A
CN113868008A CN202111198210.2A CN202111198210A CN113868008A CN 113868008 A CN113868008 A CN 113868008A CN 202111198210 A CN202111198210 A CN 202111198210A CN 113868008 A CN113868008 A CN 113868008A
Authority
CN
China
Prior art keywords
root cause
fault
abnormal
determining
abnormity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111198210.2A
Other languages
English (en)
Inventor
李国莹
刘威
苑志云
王艳华
常冬冬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Construction Bank Corp
Original Assignee
China Construction Bank Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Construction Bank Corp filed Critical China Construction Bank Corp
Priority to CN202111198210.2A priority Critical patent/CN113868008A/zh
Publication of CN113868008A publication Critical patent/CN113868008A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medical Informatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Quality & Reliability (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明提供了一种异常处理方法及装置,在检测到异常产生的情况下,通过对异常进行根本原因分析,得到异常产生的根本原因,从而基于异常产生的根本原因进行滑动窗口异常合并,并基于异常产生的根本原因以及异常产生的时间确定是否有新故障产生,避免将不同故障的异常合并在一起,以及未将同一故障的异常合并的问题,提高异常处理效率。

Description

一种异常处理方法及装置
技术领域
本发明涉及计算机技术领域,更具体的,涉及一种异常处理方法及装置。
背景技术
系统在运行过程中若发生故障,往往会伴随着多个异常现象的发生,如某些运行指标的取值范围不符合预期。在对异常进行处理时,为了提高处理效率,一般会将异常合并归类为某个故障进行处理,避免不必要的无效处理和重复处理。
目前,主要是基于系统和时间维度对异常进行监控,将某个系统在固定时间内,如5分钟内的所有异常合并为一个故障,存在将不同故障的异常合并在一起,以及未将同一故障的异常合并的问题。
发明内容
有鉴于此,本发明提供了一种异常处理方法及装置,避免将不同故障的异常合并在一起,以及未将同一故障的异常合并的问题,提高异常处理效率。
为了实现上述发明目的,本发明提供的具体技术方案如下:
一种异常处理方法,包括:
在检测到异常产生的情况下,对所述异常进行根本原因分析,得到所述异常产生的根本原因;
判断当前时刻之前的预设时间内是否产生与所述异常具有相同根本原因的历史异常;
若是,将所述异常合并到所述历史异常对应的故障合并类中;
若否,确定新故障产生。
可选的,对所述异常进行根本原因分析,包括:
获取所述异常的运行数据;
将所述异常的运行数据输入到预先构建的根因分析模型中进行处理,得到所述异常产生的根本原因;
所述根因分析模型为利用已标记根本原因类型的训练样本对预设机器学习模型进行训练后得到的。
可选的,对所述异常进行根本原因分析,包括:
获取所述异常的告警信息;
对所述异常的告警信息进行解析,得到所述异常的告警对象;
根据所述异常的告警对象,确定出现告警的物理设备信息和/或业务信息;
依据出现告警的物理设备信息和/或业务信息,确定所述异常产生的根本原因。
可选的,在所述确定新故障产生之后,所述方法还包括:
根据所述异常产生的根本原因,对所述新故障进行处理。
可选的,在对所述新故障进行处理之后,所述方法还包括:
判断在当前时刻之后的预设时间内是否产生与所述异常具有相同根本原因的异常;
若是,确定所述新故障未恢复;
若否,确定所述新故障已恢复。
一种异常处理装置,包括:
根因分析单元,用于在检测到异常产生的情况下,对所述异常进行根本原因分析,得到所述异常产生的根本原因;
第一判断单元,用于判断当前时刻之前的预设时间内是否产生与所述异常具有相同根本原因的历史异常,若是,触发异常合并单元,若否,触发故障确定单元;
所述异常合并单元,用于将所述异常合并到所述历史异常对应的故障合并类中;
所述故障确定单元,用于确定新故障产生。
可选的,所述根因分析单元,具体用于:
获取所述异常的运行数据;
将所述异常的运行数据输入到预先构建的根因分析模型中进行处理,得到所述异常产生的根本原因;
所述根因分析模型为利用已标记根本原因类型的训练样本对预设机器学习模型进行训练后得到的。
可选的,所述根因分析单元,具体用于:
获取所述异常的告警信息;
对所述异常的告警信息进行解析,得到所述异常的告警对象;
根据所述异常的告警对象,确定出现告警的物理设备信息和/或业务信息;
依据出现告警的物理设备信息和/或业务信息,确定所述异常产生的根本原因。
可选的,所述装置还包括:
故障处理单元,用于根据所述异常产生的根本原因,对所述新故障进行处理。
可选的,所述装置还包括第二判断单元,具体用于:
在对所述新故障进行处理之后,判断在当前时刻之后的预设时间内是否产生与所述异常具有相同根本原因的异常;
若是,确定所述新故障未恢复;
若否,确定所述新故障已恢复。
相对于现有技术,本发明的有益效果如下:
本发明公开的一种异常处理方法,在检测到异常产生的情况下,通过对异常进行根本原因分析,得到异常产生的根本原因,从而基于异常产生的根本原因进行滑动窗口异常合并,并基于异常产生的根本原因以及异常产生的时间确定是否有新故障产生,避免将不同故障的异常合并在一起,以及未将同一故障的异常合并的问题,提高异常处理效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例公开的一种异常处理方法的流程示意图;
图2为本发明实施例公开的一种异常处理方法的部分方法流程示意图;
图3为本发明实施例公开的一种异常处理方法的部分方法流程示意图;
图4为本发明实施例公开的另一种异常处理方法的流程示意图;
图5为本发明实施例公开的一种异常处理装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
发明人经过研究发现:在复杂系统里,故障发生是比较常见的问题,也存在多个故障在同一段时间内发生的现象。若基于系统和时间维度对异常进行监控,将某个系统在固定时间内的所有异常合并为一个故障,然后针对故障进行处理,很可能存在将不同故障的异常合并在一起,以及未将同一故障的异常合并的问题。从而导致无法准确定位故障,无法快速、准确的处理异常及故障。
为了解决上述技术问题,本发明提供了一种异常处理方法,在检测到异常产生的情况下,通过对异常进行根本原因分析,得到异常产生的根本原因,从而基于异常产生的根本原因进行滑动窗口异常合并,并基于异常产生的根本原因以及异常产生的时间确定是否有新故障产生,避免将不同故障的异常合并在一起,以及未将同一故障的异常合并的问题,提高异常处理效率。
具体的,请参阅图1,本发明实施例公开的一种异常处理方法包括以下步骤:
S101:在检测到异常产生的情况下,对异常进行根本原因分析,得到异常产生的根本原因;
在系统的运行过程中,实时监测系统运行的各个运行指标项,在运行指标项的取值不符合预期的情况下,确定系统产生异常。
此外,一些系统还具有异常预警机制,在系统产生异常后会发出告警信息,在检测到异常告警信息的情况下,确定系统产生异常。
当然,在实际应用中还可以有其他检测异常产生的方式,本发明实施例对此不做具体限定。
在检测到异常产生之后,需要记录该异常产生的时间以及该异常的运行数据。
对异常进行根本原因分析可以有多种实现方式,以下通过几个具体示例进行说明。
示例一
利用机器学习模型对异常进行根本原因分析。
请参阅图2,利用机器学习模型对异常进行根本原因分析包括以下步骤:
S201:获取异常的运行数据;
异常的运行数据包括:异常产生的子系统或设备、异常指标以及异常指标值等数据。
S202:将异常的运行数据输入到预先构建的根因分析模型中进行处理,得到异常产生的根本原因,根因分析模型为利用已标记根本原因类型的训练样本对预设机器学习模型进行训练后得到的。
上述机器学习模型可以为任意一种分类模型。
对机器学习模型的训练过程可以采用现有机器学习技术,本发明实施例对此不做具体限定。
对机器学习模型的训练目标为:模型预测结果趋近于训练样本的标注结果,以实现对异常产生的根本原因的准确预测。
示例二
在系统具有异常预警机制的情况下,可以利用异常的告警信息对异常进行根本原因分析。
请参阅图3,利用异常的告警信息对异常进行根本原因分析包括以下步骤:
S301:获取异常的告警信息;
S302:对异常的告警信息进行解析,得到异常的告警对象;
异常的告警对象可以为实体,也可以为虚拟对象,如物理子系统或业务应用等。
S303:根据异常的告警对象,确定出现告警的物理设备信息和/或业务信息;
S304:依据出现告警的物理设备信息和/或业务信息,确定异常产生的根本原因。
根据异常的告警对象,确定出现告警的物理设备信息和/或业务信息,其中,物理设备信息中可以包括出现告警的物理子系统的标识,业务信息中可以包括出现告警的业务应用标识。
出现告警的物理设备信息和/或业务信息结合异常的具体运行指标项,确定异常产生的根本原因。
需要说明的是,以上仅为异常根本原因分析的几个示例,当前,在实际应用中还可以结合应用场景采用其他根本原因分析方法,本发明实施例对此不做具体限定。
S102:判断当前时刻之前的预设时间内是否产生与异常具有相同根本原因的历史异常;
需要说明的是,预设时间是预先设定的。
具体的,预设时间大于故障未恢复之前具有相同根本原因的两个异常之间相隔的最长时间,其中,故障未恢复之前具有相同根本原因的两个异常之间的最长时间是根据实验得到的。
若是,执行S103:将异常合并到历史异常对应的故障合并类中;
若否,执行S104:确定新故障产生。
在确定新故障产生之后,为新故障创建一个故障合并类,后续有相同根本原因的异常都将合并到该故障合并类中。
由于本发明实施例基于异常产生的根本原因对异常进行滑动窗口异常合并,实现对异常的准确合并,不会出现将不同故障的异常合并在一起,以及未将同一故障的异常合并的问题。在此基础上,在确定新故障产生之后,能准确的根据异常产生的根本原因,对新故障进行及时、有效的处理。
其中,一种根据异常产生的根本原因,对新故障进行处理的方式可以为:预先收集系统中不同异常产生的根本原因,以及每个异常产生的根本原因对应的有效处理方式,从而构建故障处理知识库,故障处理知识库中存储不同异常产生的根本原因对应的故障处理方式。在确定新故障产生之后,在该故障处理知识库中查询新故障合并类中根本原因对应的故障处理方式,然后利用该故障处理方式有效处理故障。
在故障处理之后,需要判断故障是否恢复,在故障未恢复时采取进一步措施,如分析故障未恢复的原因,再次处理故障等,保证故障能被及时有效的处理并恢复。
在此基础上,请参阅图4,本发明实施例公开的一种异常处理方法,具体包括以下步骤:
S401:在检测到异常产生的情况下,对异常进行根本原因分析,得到异常产生的根本原因;
S402:判断当前时刻之前的预设时间内是否产生与异常具有相同根本原因的历史异常;
若是,执行S403:将异常合并到历史异常对应的故障合并类中;
若否,执行S404:确定新故障产生;
S405:根据异常产生的根本原因,对新故障进行处理;
S406:判断在当前时刻之后的预设时间内是否产生与异常具有相同根本原因的异常;
若是,执行S407:确定新故障未恢复;
若否,执行S408:确定新故障已恢复。
可见,本发明实施例公开的一种异常处理方法,在检测到异常产生的情况下,通过对异常进行根本原因分析,得到异常产生的根本原因,从而基于异常产生的根本原因进行滑动窗口异常合并,并基于异常产生的根本原因以及异常产生的时间确定是否有新故障产生,以及确定故障是否已恢复,避免将不同故障的异常合并在一起,以及未将同一故障的异常合并的问题,提高异常处理效率。
基于上述实施例公开的一种异常处理方法,本实施例对应公开了一种异常处理装置,请参阅图5,该装置包括:
根因分析单元501,用于在检测到异常产生的情况下,对所述异常进行根本原因分析,得到所述异常产生的根本原因;
第一判断单元502,用于判断当前时刻之前的预设时间内是否产生与所述异常具有相同根本原因的历史异常,若是,触发异常合并单元503,若否,触发故障确定单元504;
所述异常合并单元503,用于将所述异常合并到所述历史异常对应的故障合并类中;
所述故障确定单元504,用于确定新故障产生。
可选的,所述根因分析单元501,具体用于:
获取所述异常的运行数据;
将所述异常的运行数据输入到预先构建的根因分析模型中进行处理,得到所述异常产生的根本原因;
所述根因分析模型为利用已标记根本原因类型的训练样本对预设机器学习模型进行训练后得到的。
可选的,所述根因分析单元501,具体用于:
获取所述异常的告警信息;
对所述异常的告警信息进行解析,得到所述异常的告警对象;
根据所述异常的告警对象,确定出现告警的物理设备信息和/或业务信息;
依据出现告警的物理设备信息和/或业务信息,确定所述异常产生的根本原因。
可选的,所述装置还包括:
故障处理单元,用于根据所述异常产生的根本原因,对所述新故障进行处理。
可选的,所述装置还包括第二判断单元,具体用于:
在对所述新故障进行处理之后,判断在当前时刻之后的预设时间内是否产生与所述异常具有相同根本原因的异常;
若是,确定所述新故障未恢复;
若否,确定所述新故障已恢复。
本发明实施例公开的一种异常处理装置,在检测到异常产生的情况下,通过对异常进行根本原因分析,得到异常产生的根本原因,从而基于异常产生的根本原因进行滑动窗口异常合并,并基于异常产生的根本原因以及异常产生的时间确定是否有新故障产生,以及确定故障是否已恢复,避免将不同故障的异常合并在一起,以及未将同一故障的异常合并的问题,提高异常处理效率。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
上述各个实施例之间可任意组合,对所公开的实施例的上述说明,本说明书中各实施例中记载的特征可以相互替换或者组合,使本领域专业技术人员能够实现或使用本申请。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种异常处理方法,其特征在于,包括:
在检测到异常产生的情况下,对所述异常进行根本原因分析,得到所述异常产生的根本原因;
判断当前时刻之前的预设时间内是否产生与所述异常具有相同根本原因的历史异常;
若是,将所述异常合并到所述历史异常对应的故障合并类中;
若否,确定新故障产生。
2.根据权利要求1所述的方法,其特征在于,对所述异常进行根本原因分析,包括:
获取所述异常的运行数据;
将所述异常的运行数据输入到预先构建的根因分析模型中进行处理,得到所述异常产生的根本原因;
所述根因分析模型为利用已标记根本原因类型的训练样本对预设机器学习模型进行训练后得到的。
3.根据权利要求1所述的方法,其特征在于,对所述异常进行根本原因分析,包括:
获取所述异常的告警信息;
对所述异常的告警信息进行解析,得到所述异常的告警对象;
根据所述异常的告警对象,确定出现告警的物理设备信息和/或业务信息;
依据出现告警的物理设备信息和/或业务信息,确定所述异常产生的根本原因。
4.根据权利要求1所述的方法,其特征在于,在所述确定新故障产生之后,所述方法还包括:
根据所述异常产生的根本原因,对所述新故障进行处理。
5.根据权利要求4所述的方法,其特征在于,在对所述新故障进行处理之后,所述方法还包括:
判断在当前时刻之后的预设时间内是否产生与所述异常具有相同根本原因的异常;
若是,确定所述新故障未恢复;
若否,确定所述新故障已恢复。
6.一种异常处理装置,其特征在于,包括:
根因分析单元,用于在检测到异常产生的情况下,对所述异常进行根本原因分析,得到所述异常产生的根本原因;
第一判断单元,用于判断当前时刻之前的预设时间内是否产生与所述异常具有相同根本原因的历史异常,若是,触发异常合并单元,若否,触发故障确定单元;
所述异常合并单元,用于将所述异常合并到所述历史异常对应的故障合并类中;
所述故障确定单元,用于确定新故障产生。
7.根据权利要求6所述的方法,其特征在于,所述根因分析单元,具体用于:
获取所述异常的运行数据;
将所述异常的运行数据输入到预先构建的根因分析模型中进行处理,得到所述异常产生的根本原因;
所述根因分析模型为利用已标记根本原因类型的训练样本对预设机器学习模型进行训练后得到的。
8.根据权利要求6所述的方法,其特征在于,所述根因分析单元,具体用于:
获取所述异常的告警信息;
对所述异常的告警信息进行解析,得到所述异常的告警对象;
根据所述异常的告警对象,确定出现告警的物理设备信息和/或业务信息;
依据出现告警的物理设备信息和/或业务信息,确定所述异常产生的根本原因。
9.根据权利要求6所述的装置,其特征在于,所述装置还包括:
故障处理单元,用于根据所述异常产生的根本原因,对所述新故障进行处理。
10.根据权利要求9所述的装置,其特征在于,所述装置还包括第二判断单元,具体用于:
在对所述新故障进行处理之后,判断在当前时刻之后的预设时间内是否产生与所述异常具有相同根本原因的异常;
若是,确定所述新故障未恢复;
若否,确定所述新故障已恢复。
CN202111198210.2A 2021-10-14 2021-10-14 一种异常处理方法及装置 Pending CN113868008A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111198210.2A CN113868008A (zh) 2021-10-14 2021-10-14 一种异常处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111198210.2A CN113868008A (zh) 2021-10-14 2021-10-14 一种异常处理方法及装置

Publications (1)

Publication Number Publication Date
CN113868008A true CN113868008A (zh) 2021-12-31

Family

ID=78999705

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111198210.2A Pending CN113868008A (zh) 2021-10-14 2021-10-14 一种异常处理方法及装置

Country Status (1)

Country Link
CN (1) CN113868008A (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103414581A (zh) * 2013-07-24 2013-11-27 佳都新太科技股份有限公司 一种基于数据挖掘的设备故障报警预测处理机制
US20190025365A1 (en) * 2017-07-20 2019-01-24 The Southern Company Systems and Methods of Diagnosing Root Causes of Anomalous AMI Information
CN110609761A (zh) * 2019-09-06 2019-12-24 北京三快在线科技有限公司 确定故障源的方法、装置、存储介质和电子设备
WO2020019202A1 (zh) * 2018-07-25 2020-01-30 西门子股份公司 故障诊断装置、系统、方法及计算机可读存储介质
CN111158977A (zh) * 2019-12-12 2020-05-15 深圳前海微众银行股份有限公司 一种异常事件根因定位方法及装置
CN111224805A (zh) * 2018-11-26 2020-06-02 中兴通讯股份有限公司 一种网络故障根因检测方法、系统及存储介质
CN111814999A (zh) * 2020-07-08 2020-10-23 上海燕汐软件信息科技有限公司 一种故障工单生成方法、装置、设备

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103414581A (zh) * 2013-07-24 2013-11-27 佳都新太科技股份有限公司 一种基于数据挖掘的设备故障报警预测处理机制
US20190025365A1 (en) * 2017-07-20 2019-01-24 The Southern Company Systems and Methods of Diagnosing Root Causes of Anomalous AMI Information
WO2020019202A1 (zh) * 2018-07-25 2020-01-30 西门子股份公司 故障诊断装置、系统、方法及计算机可读存储介质
CN111224805A (zh) * 2018-11-26 2020-06-02 中兴通讯股份有限公司 一种网络故障根因检测方法、系统及存储介质
CN110609761A (zh) * 2019-09-06 2019-12-24 北京三快在线科技有限公司 确定故障源的方法、装置、存储介质和电子设备
CN111158977A (zh) * 2019-12-12 2020-05-15 深圳前海微众银行股份有限公司 一种异常事件根因定位方法及装置
CN111814999A (zh) * 2020-07-08 2020-10-23 上海燕汐软件信息科技有限公司 一种故障工单生成方法、装置、设备

Similar Documents

Publication Publication Date Title
Xu et al. Improving service availability of cloud systems by predicting disk error
US10147048B2 (en) Storage device lifetime monitoring system and storage device lifetime monitoring method thereof
US9720758B2 (en) Diagnostic analysis tool for disk storage engineering and technical support
CN102713862B (zh) 故障原因提取装置、故障原因提取方法和程序记录介质
CN111209131A (zh) 一种基于机器学习确定异构系统的故障的方法和系统
Chen et al. How incidental are the incidents? characterizing and prioritizing incidents for large-scale online service systems
US8677191B2 (en) Early detection of failing computers
WO2010032701A1 (ja) 運用管理装置、運用管理方法、および運用管理プログラム
EP2758881A1 (en) Automated detection of a system anomaly
KR20160132698A (ko) 지능형 시스템 진단 장치 및 방법
CN109034423B (zh) 一种故障预警判定的方法、装置、设备及存储介质
CN112416705A (zh) 一种异常信息的处理方法和装置
CN111209213B (zh) 应用程序运行时的异常检测方法及系统、设备及存储介质
CN108880838B (zh) 业务故障的监控方法及装置、计算机设备及可读介质
KR102315580B1 (ko) 건물의 화재 예측 분석 장치 및 방법
JP2014120001A (ja) 監視装置、監視対象ホストの監視方法、監視プログラム及び記録媒体
CN117435883A (zh) 一种基于数字孪生的设备故障预测的方法和系统
Liu et al. Smart server crash prediction in cloud service data center
CN111314110B (zh) 一种用于分布式系统的故障预警方法
CN113868008A (zh) 一种异常处理方法及装置
CN112100035A (zh) 一种页面异常检测方法、系统及相关装置
CN111858244A (zh) 一种硬盘的监控方法、系统、设备以及介质
CN115169650B (zh) 一种大数据分析的装备健康预测方法
CN115098326A (zh) 一种系统异常检测方法及装置、存储介质及电子设备
CN105279432A (zh) 一种软件监控处理方法以及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination