CN106383760A - 一种计算机故障管理方法及装置 - Google Patents

一种计算机故障管理方法及装置 Download PDF

Info

Publication number
CN106383760A
CN106383760A CN201610830155.7A CN201610830155A CN106383760A CN 106383760 A CN106383760 A CN 106383760A CN 201610830155 A CN201610830155 A CN 201610830155A CN 106383760 A CN106383760 A CN 106383760A
Authority
CN
China
Prior art keywords
fault
fault message
computer
message
type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610830155.7A
Other languages
English (en)
Inventor
闫晓峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Yunhai Information Technology Co Ltd
Original Assignee
Zhengzhou Yunhai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Yunhai Information Technology Co Ltd filed Critical Zhengzhou Yunhai Information Technology Co Ltd
Priority to CN201610830155.7A priority Critical patent/CN106383760A/zh
Publication of CN106383760A publication Critical patent/CN106383760A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2273Test methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2289Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing by configuration test

Abstract

本发明公开了一种计算机故障管理方法及装置,通过实时获取计算机子模块的故障信息;对故障信息进行提取分析,对故障信息的类型进行诊断;调用预先建立的规则数据库,查找与故障信息的类型对应的故障处理方式;根据故障处理方式执行相应的配置操作。本发明所提供的计算机故障管理方法及装置,能够实现对计算机故障信息的自动收集汇总、故障的诊断以及故障的容错处理,提升了用户的使用体验。

Description

一种计算机故障管理方法及装置
技术领域
本发明涉及计算机技术领域,特别是涉及一种计算机故障管理方法及装置。
背景技术
当前对系统高可用性要求越来越严格,尤其在关键行业,如金融、医疗、票务系统、交通运输以及移动互联网应用等方面对服务器的年停机时间要求越来越短。为了保障业务的非意外停机,不间断服务,一般采取的是多机热备或者集群方案,但是往往很多核心业务还是无法满足业务更高的需求。纵观几大服务器和存储厂商,对于系统的故障排查还停留在更换硬件模块排查故障的阶段,这样的排查效率低下,而且无法准确定位故障原因,错杂的相对性故障更无法确定潜在更大的故障危机。
鉴于此,提供一种能够进行故障自动采集、预测分析、容错处理的计算机故障管理方法及装置是非常有必要的。
发明内容
本发明的目的是提供一种计算机故障管理方法及装置,以对计算机出现的故障进行自动采集、预测分析、容错处理,提升了用户的使用体验。
为解决上述技术问题,本发明提供一种计算机故障管理方法,包括:
实时获取计算机子模块的故障信息;
对所述故障信息进行提取分析,对所述故障信息的类型进行诊断;
调用预先建立的规则数据库,查找与所述故障信息的类型对应的故障处理方式;
根据所述故障处理方式执行相应的配置操作。
可选地,所述故障信息包括:CPU故障信息、内存故障信息、磁盘故障信息和/或网卡故障信息。
可选地,所述实时获取计算机子模块的故障信息包括:
由核心态捕获各硬件设备的故障信息以及报警信息,经过汇总分析后生成预测和容错硬件故障信息;
捕获来自操作系统模块或关键服务的错误信息,进行统计分析后生成预测和容错软件级的故障信息。
可选地,在查找与所述故障信息的类型对应的故障处理方式之后还包括:对所述故障处理方式和/或故障信息进行可视化显示。
可选地,在查找与所述故障信息的类型对应的故障处理方式之后还包括:
将诊断出的故障信息的类型、故障处理方式以及故障原因对应存储于故障数据库中。
本发明还提供了一种计算机故障管理装置,包括:
故障信息获取模块,用于实时获取计算机子模块的故障信息;
诊断模块,用于对所述故障信息进行提取分析,对所述故障信息的类型进行诊断;
查找模块,用于调用预先建立的规则数据库,查找与所述故障信息的类型对应的故障处理方式;
执行模块,用于根据所述故障处理方式执行相应的配置操作。
可选地,所述故障信息包括:CPU故障信息、内存故障信息、磁盘故障信息和/或网卡故障信息。
可选地,所述故障信息获取模块包括:
第一获取单元,用于由核心态捕获各硬件设备的故障信息以及报警信息,经过汇总分析后生成预测和容错硬件故障信息;
第二获取单元,用于捕获来自操作系统模块或关键服务的错误信息,进行统计分析后生成预测和容错软件级的故障信息。
可选地,还包括:显示模块,用于在查找与所述故障信息的类型对应的故障处理方式之后,对所述故障处理方式和/或故障信息进行可视化显示。
可选地,还包括:
存储模块,用于在查找与所述故障信息的类型对应的故障处理方式之后,将诊断出的故障信息的类型、故障处理方式以及故障原因对应存储于故障数据库中。
本发明所提供的计算机故障管理方法及装置,通过实时获取计算机子模块的故障信息;对故障信息进行提取分析,对故障信息的类型进行诊断;调用预先建立的规则数据库,查找与故障信息的类型对应的故障处理方式;根据故障处理方式执行相应的配置操作。本发明所提供的计算机故障管理方法及装置,能够实现对计算机故障信息的自动收集汇总、故障的诊断以及故障的容错处理,提升了用户的使用体验。
附图说明
为了更清楚的说明本发明实施例或现有技术的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明所提供的计算机故障管理方法的一种具体实施方式的流程图;
图2为本发明所提供的计算机故障管理方法的另一种具体实施方式的流程图;
图3为本发明实施例提供的计算机故障管理装置的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明所提供的计算机故障管理方法的一种具体实施方式的流程图如图1所示,该方法包括:
步骤S101:实时获取计算机子模块的故障信息;
具体地,故障信息可以包括:CPU故障信息、内存故障信息、磁盘故障信息和/或网卡故障信息。
步骤S102:对所述故障信息进行提取分析,对所述故障信息的类型进行诊断;
步骤S103:调用预先建立的规则数据库,查找与所述故障信息的类型对应的故障处理方式;
需要指出的是,本发明实施例中规则数据库为故障类型与故障处理方式的对应关系。可根据输入的故障类型确定得到具体的处理方式。规则数据库可以预先一次性建立,也可以通过经验的不断积累,进行持续更新。
步骤S104:根据所述故障处理方式执行相应的配置操作。
本发明所提供的计算机故障管理方法,通过实时获取计算机子模块的故障信息;对故障信息进行提取分析,对故障信息的类型进行诊断;调用预先建立的规则数据库,查找与故障信息的类型对应的故障处理方式;根据故障处理方式执行相应的配置操作。本发明所提供的计算机故障管理方法,能够实现对计算机故障信息的自动收集汇总、故障的诊断以及容错故障的处理,提升了用户的使用体验。
动态优化系统是采取容错机制或者其他修复机制,无人守职的自动容错处理故障主要流程分为故障信息的收集汇总、故障的诊断、故障的处理以及故障可视化管理。
在内核态或者用户态,可通过程序的故障探针,获取硬件或者软件的有关故障的信息,进行多方面、多层次的收集到故障诊断引擎(FMS),根据规则数据,对这些故障的分析和挖掘,预测故障或者发现实时故障,根据规则数据库来对故障进行处理。
在上述实施例的基础上,本发明所提供的计算机故障管理方法中,实时获取计算机子模块的故障信息的过程可以具体包括:
对系统的硬件资源进行检测和故障容错处理:基于各种硬件检测机制,由核心态捕获各种硬件设备的故障信息和报警信息,经过汇总分析后预测和容错硬件故障。
对系统软件资源进行检测及容错处理:捕获来自操作系统模块或者关键服务的错误信息,进行统计分析,预测和容错软件级的系统错误。
在上述任一实施例的基础上,本发明所提供的计算机故障管理方法,在查找与所述故障信息的类型对应的故障处理方式之后还可以进一步包括:对所述故障处理方式和/或故障信息进行可视化显示。
通过这样的设置,可以提供给用户可视化故障管理信息。比如对web方式来实现各个错误的类型,以及如何处理这些错误的信息进行实时显示。
进一步地,在查找与所述故障信息的类型对应的故障处理方式之后还可以包括:
将诊断出的故障信息的类型、故障处理方式以及故障原因对应存储于故障数据库中。
故障数据库用来存储故障的信息供可视化工具使用,并且可以通过网络供用户查询。能够负责长期记录服务器的故障信息,提供多种方式和多种形式的查询,包含有对故障的人工处理建议以及故障原因解释等。
如图2本发明所提供的计算机故障管理方法的另一种具体实施方式的流程图所示,该方法包括:
步骤S200:对故障信息进行收集,建立故障信息以及相应的故障处理方式的对应关系;
步骤S201:实时获取计算机各个子模块的故障信息;
步骤S202:对所述故障信息进行提取分析,对所述故障信息的类型进行诊断;
步骤S203:调用预先建立的规则数据库,查找与所述故障信息的类型对应的故障处理方式;
步骤S204:根据所述故障处理方式执行相应的配置操作。
根据类型通过查找规则数据库的规则如果规则数据库中有此类型错误的处理的规则,则得到对应的故障处理方式,并根据对应的处理方法执行相应的配置操作。如果规则数据库中没有该故障的类型,则将故障信息以及相关的故障处理方式存入到数据库。
规则数据库可经过长时间的处理积累,自学习成最大的故障知识库,可以根据故障信息,查询历史上对这种故障的所有人为处理方式,汇总智慧与经验,让服务器的各种故障都不再无从下手。
下面对本发明实施例提供的计算机故障管理装置进行介绍,下文描述的计算机故障管理装置与上文描述的计算机故障管理方法可相互对应参照。
图3为本发明实施例提供的计算机故障管理装置的结构框图,参照图3计算机故障管理装置可以包括:
故障信息获取模块100,用于实时获取计算机子模块的故障信息;
诊断模块200,用于对所述故障信息进行提取分析,对所述故障信息的类型进行诊断;
查找模块300,用于调用预先建立的规则数据库,查找与所述故障信息的类型对应的故障处理方式;
执行模块400,用于根据所述故障处理方式执行相应的配置操作。
其中,所述故障信息可以具体包括:CPU故障信息、内存故障信息、磁盘故障信息和/或网卡故障信息。
在上述实施例的基础上,本发明所提供的计算机故障管理装置中,上述故障信息获取模块可以具体包括:
第一获取单元,用于由核心态捕获各硬件设备的故障信息以及报警信息,经过汇总分析后生成预测和容错硬件故障信息;
第二获取单元,用于捕获来自操作系统模块或关键服务的错误信息,进行统计分析后生成预测和容错软件级的故障信息。
在上述任一实施例的基础上,本发明所提供的计算机故障管理装置还可以进一步包括:显示模块,用于在查找与所述故障信息的类型对应的故障处理方式之后,对所述故障处理方式和/或故障信息进行可视化显示。
作为一种具体实施方式,本申请实施例还可以包括:
存储模块,用于在查找与所述故障信息的类型对应的故障处理方式之后,将诊断出的故障信息的类型、故障处理方式以及故障原因对应存储于故障数据库中。
本发明所提供的计算机故障管理装置,通过实时获取计算机子模块的故障信息;对故障信息进行提取分析,对故障信息的类型进行诊断;调用预先建立的规则数据库,查找与故障信息的类型对应的故障处理方式;根据故障处理方式执行相应的配置操作。本发明所提供的计算机故障管理装置,能够实现对计算机故障信息的自动收集汇总、故障的诊断以及容错故障的处理,提升了用户的使用体验。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上对本发明所提供的计算机故障管理方法以及装置进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。

Claims (10)

1.一种计算机故障管理方法,其特征在于,包括:
实时获取计算机子模块的故障信息;
对所述故障信息进行提取分析,对所述故障信息的类型进行诊断;
调用预先建立的规则数据库,查找与所述故障信息的类型对应的故障处理方式;
根据所述故障处理方式执行相应的配置操作。
2.如权利要求1所述的计算机故障管理方法,其特征在于,所述故障信息包括:CPU故障信息、内存故障信息、磁盘故障信息和/或网卡故障信息。
3.如权利要求2所述的计算机故障管理方法,其特征在于,所述实时获取计算机子模块的故障信息包括:
由核心态捕获各硬件设备的故障信息以及报警信息,经过汇总分析后生成预测和容错硬件故障信息;
捕获来自操作系统模块或关键服务的错误信息,进行统计分析后生成预测和容错软件级的故障信息。
4.如权利要求1至3任一项所述的计算机故障管理方法,其特征在于,在查找与所述故障信息的类型对应的故障处理方式之后还包括:对所述故障处理方式和/或故障信息进行可视化显示。
5.如权利要求4所述的计算机故障管理方法,其特征在于,在查找与所述故障信息的类型对应的故障处理方式之后还包括:
将诊断出的故障信息的类型、故障处理方式以及故障原因对应存储于故障数据库中。
6.一种计算机故障管理装置,其特征在于,包括:
故障信息获取模块,用于实时获取计算机子模块的故障信息;
诊断模块,用于对所述故障信息进行提取分析,对所述故障信息的类型进行诊断;
查找模块,用于调用预先建立的规则数据库,查找与所述故障信息的类型对应的故障处理方式;
执行模块,用于根据所述故障处理方式执行相应的配置操作。
7.如权利要求6所述的计算机故障管理装置,其特征在于,所述故障信息包括:CPU故障信息、内存故障信息、磁盘故障信息和/或网卡故障信息。
8.如权利要求7所述的计算机故障管理装置,其特征在于,所述故障信息获取模块包括:
第一获取单元,用于由核心态捕获各硬件设备的故障信息以及报警信息,经过汇总分析后生成预测和容错硬件故障信息;
第二获取单元,用于捕获来自操作系统模块或关键服务的错误信息,进行统计分析后生成预测和容错软件级的故障信息。
9.如权利要求6至8任一项所述的计算机故障管理装置,其特征在于,还包括:显示模块,用于在查找与所述故障信息的类型对应的故障处理方式之后,对所述故障处理方式和/或故障信息进行可视化显示。
10.如权利要求9所述的计算机故障管理装置,其特征在于,还包括:
存储模块,用于在查找与所述故障信息的类型对应的故障处理方式之后,将诊断出的故障信息的类型、故障处理方式以及故障原因对应存储于故障数据库中。
CN201610830155.7A 2016-09-19 2016-09-19 一种计算机故障管理方法及装置 Pending CN106383760A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610830155.7A CN106383760A (zh) 2016-09-19 2016-09-19 一种计算机故障管理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610830155.7A CN106383760A (zh) 2016-09-19 2016-09-19 一种计算机故障管理方法及装置

Publications (1)

Publication Number Publication Date
CN106383760A true CN106383760A (zh) 2017-02-08

Family

ID=57936588

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610830155.7A Pending CN106383760A (zh) 2016-09-19 2016-09-19 一种计算机故障管理方法及装置

Country Status (1)

Country Link
CN (1) CN106383760A (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106899436A (zh) * 2017-02-22 2017-06-27 郑州云海信息技术有限公司 一种云平台故障预测诊断系统
CN107222340A (zh) * 2017-05-27 2017-09-29 郑州云海信息技术有限公司 一种基于云平台的故障处理方法及装置
CN107332722A (zh) * 2017-08-31 2017-11-07 郑州云海信息技术有限公司 一种故障信息的排除方法及系统
CN107544892A (zh) * 2017-09-05 2018-01-05 合肥爱吾宠科技有限公司 企业用计算机软件故障监测维修系统
CN107608813A (zh) * 2017-09-14 2018-01-19 郑州云海信息技术有限公司 一种基于linux操作系统信息自动分析故障的方法
CN107644256A (zh) * 2017-09-14 2018-01-30 郑州云海信息技术有限公司 一种基于机器学习方式形成故障规则库的方法
CN107728008A (zh) * 2017-11-28 2018-02-23 天津浩源慧能科技有限公司 一种电网故障检测方法
CN108763037A (zh) * 2018-06-07 2018-11-06 郑州云海信息技术有限公司 一种服务器监控管理方法及装置
CN109117298A (zh) * 2018-09-03 2019-01-01 郑州云海信息技术有限公司 一种硬件故障修复方法、装置及设备
CN109245910A (zh) * 2017-07-10 2019-01-18 中兴通讯股份有限公司 识别故障类型的方法及装置
CN110502499A (zh) * 2019-06-26 2019-11-26 中电万维信息技术有限责任公司 基于贝叶斯算法的数据故障事件处理方法以及维护系统
CN111459772A (zh) * 2020-04-16 2020-07-28 江西科技学院 一种计算机故障报警系统
CN111880981A (zh) * 2020-07-30 2020-11-03 北京浪潮数据技术有限公司 一种docker容器的故障修复方法及相关装置
CN113407592A (zh) * 2021-06-07 2021-09-17 深圳明锐理想科技有限公司 一种pcb生产线故障定位方法和设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102999413A (zh) * 2011-09-13 2013-03-27 联想(北京)有限公司 芯片、显示器、计算机和故障信息显示方法
CN103166778A (zh) * 2011-12-13 2013-06-19 成都勤智数码科技有限公司 一种故障自动化智能处理方法及其装置
CN103559124A (zh) * 2013-10-24 2014-02-05 华为技术有限公司 故障快速检测方法及装置
CN105262616A (zh) * 2015-09-21 2016-01-20 浪潮集团有限公司 一种基于故障知识库的自动化故障处理系统及方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102999413A (zh) * 2011-09-13 2013-03-27 联想(北京)有限公司 芯片、显示器、计算机和故障信息显示方法
CN103166778A (zh) * 2011-12-13 2013-06-19 成都勤智数码科技有限公司 一种故障自动化智能处理方法及其装置
CN103559124A (zh) * 2013-10-24 2014-02-05 华为技术有限公司 故障快速检测方法及装置
CN105262616A (zh) * 2015-09-21 2016-01-20 浪潮集团有限公司 一种基于故障知识库的自动化故障处理系统及方法

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106899436A (zh) * 2017-02-22 2017-06-27 郑州云海信息技术有限公司 一种云平台故障预测诊断系统
CN107222340A (zh) * 2017-05-27 2017-09-29 郑州云海信息技术有限公司 一种基于云平台的故障处理方法及装置
CN109245910A (zh) * 2017-07-10 2019-01-18 中兴通讯股份有限公司 识别故障类型的方法及装置
CN107332722A (zh) * 2017-08-31 2017-11-07 郑州云海信息技术有限公司 一种故障信息的排除方法及系统
CN107544892A (zh) * 2017-09-05 2018-01-05 合肥爱吾宠科技有限公司 企业用计算机软件故障监测维修系统
CN107644256A (zh) * 2017-09-14 2018-01-30 郑州云海信息技术有限公司 一种基于机器学习方式形成故障规则库的方法
CN107608813A (zh) * 2017-09-14 2018-01-19 郑州云海信息技术有限公司 一种基于linux操作系统信息自动分析故障的方法
CN107728008A (zh) * 2017-11-28 2018-02-23 天津浩源慧能科技有限公司 一种电网故障检测方法
CN108763037A (zh) * 2018-06-07 2018-11-06 郑州云海信息技术有限公司 一种服务器监控管理方法及装置
CN109117298A (zh) * 2018-09-03 2019-01-01 郑州云海信息技术有限公司 一种硬件故障修复方法、装置及设备
CN110502499A (zh) * 2019-06-26 2019-11-26 中电万维信息技术有限责任公司 基于贝叶斯算法的数据故障事件处理方法以及维护系统
CN111459772A (zh) * 2020-04-16 2020-07-28 江西科技学院 一种计算机故障报警系统
CN111880981A (zh) * 2020-07-30 2020-11-03 北京浪潮数据技术有限公司 一种docker容器的故障修复方法及相关装置
CN113407592A (zh) * 2021-06-07 2021-09-17 深圳明锐理想科技有限公司 一种pcb生产线故障定位方法和设备
CN113407592B (zh) * 2021-06-07 2023-11-03 深圳明锐理想科技有限公司 一种pcb生产线故障定位方法和设备

Similar Documents

Publication Publication Date Title
CN106383760A (zh) 一种计算机故障管理方法及装置
US7676695B2 (en) Resolution of computer operations problems using fault trend analysis
US8892960B2 (en) System and method for determining causes of performance problems within middleware systems
US11061756B2 (en) Enabling symptom verification
US20120151276A1 (en) Early Detection of Failing Computers
US20110214020A1 (en) Root cause problem identification through event correlation
US20160378583A1 (en) Management computer and method for evaluating performance threshold value
CN104903866A (zh) 对事件根本原因的分析予以支援的管理系统以及方法
JP2008009842A (ja) コンピュータシステムの制御方法及びコンピュータシステム
EP2695057A1 (en) Creating a correlation rule defining a relationship between event types
CN110347561A (zh) 监控告警方法及终端设备
CN111858254B (zh) 数据的处理方法、装置、计算设备和介质
Tang et al. Recommending resolutions for problems identified by monitoring
US11196613B2 (en) Techniques for correlating service events in computer network diagnostics
CN109034423A (zh) 一种故障预警判定的方法、装置、设备及存储介质
US20120102363A1 (en) Automating diagnoses of computer-related incidents
US8214480B2 (en) Method of identifying a root cause of a network event
CN106911519A (zh) 一种数据采集监控方法及装置
JP5007247B2 (ja) ジョブ処理システムおよびジョブ管理方法
CN106899436A (zh) 一种云平台故障预测诊断系统
CN114791846A (zh) 一种针对云原生混沌工程实验实现可观测性的方法
CN109905261A (zh) 故障诊断方法及装置
dos Santos et al. A solution for identifying the root cause of problems in it change management
JP2016085496A (ja) 計算機システムの異常予兆検出装置および方法
AU2014200806B1 (en) Adaptive fault diagnosis

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170208

RJ01 Rejection of invention patent application after publication