CN106407030A - 一种存储集群系统故障处理方法及系统 - Google Patents

一种存储集群系统故障处理方法及系统 Download PDF

Info

Publication number
CN106407030A
CN106407030A CN201610821044.XA CN201610821044A CN106407030A CN 106407030 A CN106407030 A CN 106407030A CN 201610821044 A CN201610821044 A CN 201610821044A CN 106407030 A CN106407030 A CN 106407030A
Authority
CN
China
Prior art keywords
fault
solution
failure
storage cluster
cluster system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610821044.XA
Other languages
English (en)
Inventor
贾东伟
袁鹏飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Yunhai Information Technology Co Ltd
Original Assignee
Zhengzhou Yunhai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Yunhai Information Technology Co Ltd filed Critical Zhengzhou Yunhai Information Technology Co Ltd
Priority to CN201610821044.XA priority Critical patent/CN106407030A/zh
Publication of CN106407030A publication Critical patent/CN106407030A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • G06F11/0787Storage of error reports, e.g. persistent data storage, storage using memory protection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0793Remedial or corrective actions

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种存储集群系统故障处理方法及系统,方法包括:整理并记录存储集群系统已出现的故障以及处理对应故障的解决方案,构建故障解决方案数据库;监测得到存储集群系统中产生的故障,根据故障的故障描述,从故障解决方案数据库中检索与所述故障相匹配的故障解决方案;若检索到与所述故障相匹配的故障解决方案,则根据检索出的故障解决方案对所述故障进行修复。本发明存储集群系统故障处理方法及系统,对于存储集群系统中出现的可由固定方案进行处理的常有故障,能够根据解决方案自动修复,不需要等待管理员手动操作修复,因此本发明存储集群系统故障处理方法及系统,增加了解决存储集群系统故障的灵活度,提高了系统故障的处理效率。

Description

一种存储集群系统故障处理方法及系统
技术领域
本发明涉及存储系统技术领域,特别是涉及一种存储集群系统故障处理方法及系统。
背景技术
存储集群系统是由多台存储服务器相互连接形成一个存储服务器集群,现有技术中,对存储服务器集群的故障监测主要采用如下方式:在集群管理系统中设置有监测告警模块,通过监测告警模块监测和记录存储集群系统运行时遇到的问题和出现的故障,包括记录故障发生时间和故障描述,并将监测到的故障信息反馈给管理员并作出提示。
但现有的这种方式,仅实现了监测和告警功能,对存储服务器集群出现的一切故障,都需要由管理员在得知故障信息后亲自手动解决,如果管理员没有时间处理或者漏掉处理,系统中故障就会一直存在。因此可见,现有这种方式对存储服务器集群故障的处理效率低。
发明内容
本发明提供一种存储集群系统故障处理方法及系统,增加了解决存储集群系统故障的灵活度,提高了系统故障的处理效率。
为实现上述目的,本发明提供如下技术方案:
一种存储集群系统故障处理方法,包括:
整理并记录存储集群系统已出现的故障以及处理对应故障的解决方案,构建故障解决方案数据库;
监测得到所述存储集群系统中产生的故障,根据所述故障的故障描述,从所述故障解决方案数据库中检索与所述故障相匹配的故障解决方案;
若检索到与所述故障相匹配的故障解决方案,则根据检索出的所述故障解决方案对所述故障进行修复。
可选地,所述监测得到所述存储集群系统中产生的故障包括:
监测得到所述存储集群系统中产生的故障,并记录产生故障的发生时间、故障描述和故障级别,形成故障日志。
可选地,还包括:若未检索到与所述故障相匹配的故障解决方案,则显示产生的故障的相关数据并发出提示,所述相关数据包括产生故障的发生时间、故障描述和故障级别。
可选地,还包括:当产生的故障被修复完成后,则在显示的故障列表中删除对应该故障的相关数据。
可选地,所述根据检索出的所述故障解决方案对所述故障进行修复,包括:
对所述故障的故障描述和检索出的所述故障解决方案进行分析,对所述故障解决方案进行调整,生成精确匹配于所述故障的新故障解决方案,按照所述新故障解决方案对所述故障进行修复。
一种存储集群系统故障处理系统,包括:
数据库构建模块,用于整理并记录存储集群系统已出现的故障以及处理对应故障的解决方案,构建故障解决方案数据库;
监测与检索模块,用于监测得到所述存储集群系统中产生的故障,根据所述故障的故障描述,从所述故障解决方案数据库中检索与所述故障相匹配的故障解决方案;
处理模块,用于若检索到与所述故障相匹配的故障解决方案,则根据检索出的所述故障解决方案对所述故障进行修复。
可选地,所述监测与检索模块用于监测得到所述存储集群系统中产生的故障包括:
所述监测与检索模块具体用于监测得到所述存储集群系统中产生的故障,并记录产生故障的发生时间、故障描述和故障级别,形成故障日志。
可选地,还包括:
显示模块,用于若未检索到与所述故障相匹配的故障解决方案,则显示产生的故障的相关数据并发出提示,所述相关数据包括产生故障的发生时间、故障描述和故障级别。
可选地,所述显示模块还用于当产生的故障被修复完成后,则在显示的故障列表中删除对应该故障的相关数据。
可选地,所述处理模块用于根据检索出的所述故障解决方案对所述故障进行修复包括:
所述处理模块具体用于对所述故障的故障描述和检索出的所述故障解决方案进行分析,对所述故障解决方案进行调整,生成精确匹配于所述故障的新故障解决方案,按照所述新故障解决方案对所述故障进行修复。
由上述技术方案可知,本发明所提供的存储集群系统故障处理方法及系统,通过对存储集群系统已出现的故障以及处理对应故障的解决方案进行整理和记录,构建形成故障解决方案数据库;在对存储集群系统监测中,在监测到存储集群系统产生故障时,对监测到的故障会根据其故障描述,在故障解决方案数据库中检索与该故障相匹配的故障解决方案,若能检索到与该故障相匹配的故障解决方案,则根据该故障解决方案对产生的所述故障进行修复。因此,本发明存储集群系统故障处理方法及系统,对于存储集群系统中出现的可由固定方案进行处理的常有故障,能够自动修复,不需要等待管理员手动操作修复,因此本发明存储集群系统故障处理方法及系统,增加了解决存储集群系统故障的灵活度,提高了系统故障的处理效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种存储集群系统故障处理方法的流程图;
图2为本发明又一实施例提供的一种存储集群系统故障处理方法的流程图;
图3为本发明实施例提供的一种存储集群系统故障处理系统的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
请参考图1,本发明实施例提供的一种存储集群系统故障处理方法,包括步骤:
S10:整理并记录存储集群系统已出现的故障以及处理对应故障的解决方案,构建故障解决方案数据库;
S11:监测得到所述存储集群系统中产生的故障,根据所述故障的故障描述,从所述故障解决方案数据库中检索与所述故障相匹配的故障解决方案;
S12:若检索到与所述故障相匹配的故障解决方案,则根据检索出的所述故障解决方案对所述故障进行修复。
可以看出,本实施例存储集群系统故障处理方法,通过对存储集群系统已出现的故障以及处理对应故障的解决方案进行整理和记录,构建形成故障解决方案数据库;在对存储集群系统监测中,在监测到存储集群系统产生故障时,对监测到的故障会根据其故障描述,在故障解决方案数据库中检索与该故障相匹配的故障解决方案,若能检索到与该故障相匹配的故障解决方案,则根据该故障解决方案对产生的所述故障进行修复。因此,本实施例存储集群系统故障处理方法,对于存储集群系统中出现的可由固定方案进行处理的常有故障,能够自动修复,不需要等待管理员手动操作修复,因此本实施例存储集群系统故障处理方法,增加了解决存储集群系统故障的灵活度,提高了系统故障的处理效率。
下面对本实施例存储集群系统故障处理方法进行详细说明。请参考图2,本实施例存储集群系统故障处理方法包括步骤:
S10:整理并记录存储集群系统已出现的故障以及处理对应故障的解决方案,构建故障解决方案数据库。
在存储集群系统中,对存储集群系统已发生过的故障以及处理故障对应的解决方案进行收集和整理,对于其中解决方案为固定步骤进行修复的故障,记录这些故障及其对应的解决方案,构建故障解决方案数据库,其中故障对应的解决方案包括修复该故障进行的操作步骤。
S11:监测得到所述存储集群系统中产生的故障,根据所述故障的故障描述,从所述故障解决方案数据库中检索与所述故障相匹配的故障解决方案。
监测存储集群系统,当系统中发生故障时,监测到存储集群系统中出现故障。本实施例中,在监测到存储集群系统产生故障时,会记录产生故障的发生时间、故障描述和故障级别,形成故障日志。
并根据产生故障的故障描述,从故障解决方案数据库中检索与所述故障相匹配的故障解决方案,来搜索故障解决方案数据库中是否存在与产生的故障相匹配的故障解决方案。
S12:若检索到与所述故障相匹配的故障解决方案,则根据检索出的所述故障解决方案对所述故障进行修复。
具体的,这里所述的检索到与所述故障相匹配的故障解决方案包括两种情况,第一种情况是指从故障解决方案数据库中检索到的故障解决方案对应解决的故障与监测到的故障情况相同,则直接按照检索出的故障解决方案对该故障进行修复。
在第二种情况中,当前监测到的故障与检索出的故障解决方案对应解决的故障存在区别,并不能直接采用检索到的故障解决方案对当前故障进行修复,则先对当前监测到的所述故障的故障描述和检索出的所述故障解决方案进行分析,对所述故障解决方案进行调整,生成精确匹配于所述故障的新故障解决方案,按照新故障解决方案对所述故障进行修复。
S13:若未检索到与所述故障相匹配的故障解决方案,则显示产生的故障的相关数据并发出提示,所述相关数据包括产生故障的发生时间、故障描述和故障级别。
若从故障解决方案数据库中没有检索到与产生的故障相匹配的故障解决方案,则将该故障及其相关数据显示,并发出提示,展示给管理员并提示其系统存在故障需要修复。
优选的,本实施例中将存储集群系统发生的故障按照故障级别从高到低的顺序排列显示,管理员可以根据故障级别,对故障级别高的故障优先处理进行修复。
当产生的故障被修复完成后,则在显示的故障列表中删除对应该故障的相关数据。
本实施例存储集群系统故障处理方法,对于存储集群系统中出现的故障分类进行处理,对于可采用固定方案处理的故障,则自动进行修复,不需要等待管理员亲自手动解决故障;对于产生的其它故障则显示出,提示管理员进行修复。因此,本实施例存储集群系统故障处理方法,增加了对存储集群系统故障处理的灵活度和多样性,可提高系统故障的处理效率,保障系统良好运行。
相应的,本发明实施例还提供一种存储集群系统故障处理系统,请参考图3,所述系统包括:
数据库构建模块20,用于整理并记录存储集群系统已出现的故障以及处理对应故障的解决方案,构建故障解决方案数据库;
监测与检索模块21,用于监测得到所述存储集群系统中产生的故障,根据所述故障的故障描述,从所述故障解决方案数据库中检索与所述故障相匹配的故障解决方案;
处理模块22,用于若检索到与所述故障相匹配的故障解决方案,则根据检索出的所述故障解决方案对所述故障进行修复。
可以看出,本实施例存储集群系统故障处理系统,包括数据库构建模块、监测与检索模块和处理模块,所述处理系统通过对存储集群系统已出现的故障以及处理对应故障的解决方案进行整理和记录,构建形成故障解决方案数据库;在对存储集群系统监测中,在监测到存储集群系统产生故障时,对监测到的故障会根据其故障描述,在故障解决方案数据库中检索与该故障相匹配的故障解决方案,若能检索到与该故障相匹配的故障解决方案,则根据该故障解决方案对产生的所述故障进行修复。因此,本实施例存储集群系统故障处理系统,对于存储集群系统中出现的可由固定方案进行处理的常有故障,能够自动修复,不需要等待管理员手动操作修复,因此本实施例存储集群系统故障处理系统,增加了解决存储集群系统故障的灵活度,提高了系统故障的处理效率。
本实施例中,具体的,所述监测与检索模块21用于监测得到所述存储集群系统中产生的故障包括:所述监测与检索模块21具体用于监测得到所述存储集群系统中产生的故障,并记录产生故障的发生时间、故障描述和故障级别,形成故障日志。
本实施例存储集群系统故障处理系统,还包括显示模块23,用于若未检索到与所述故障相匹配的故障解决方案,则显示产生的故障的相关数据并发出提示,所述相关数据包括产生故障的发生时间、故障描述和故障级别。因此,对于没有从故障解决方案数据库中检索到相匹配故障解决方案的故障,将该故障及其相关数据显示,展示给管理员,并发出提示,提示管理员存储系统存在故障需要修复,以使管理员及时地对故障修复。
进一步的,所述显示模块23还用于当产生的故障被修复完成后,则在显示的故障列表中删除对应该故障的相关数据。
本实施例中,处理模块22用于若检索到与所述故障相匹配的故障解决方案,则根据检索出的所述故障解决方案对所述故障进行修复,其中,检索到与所述故障相匹配的故障解决方案包括两种情况,第一种情况是指从故障解决方案数据库中检索到的故障解决方案对应解决的故障与监测到的故障情况相同,则直接按照检索出的故障解决方案对该故障进行修复。包括两种情况,
第二种情况指当前监测到的故障与检索出的故障解决方案对应解决的故障匹配,但存在区别,并不能直接采用检索到的故障解决方案对当前故障进行修复,则由所述处理模块22对所述故障的故障描述和检索出的所述故障解决方案进行分析,对所述故障解决方案进行调整,生成精确匹配于所述故障的新故障解决方案,按照所述新故障解决方案对所述故障进行修复。
以上对本发明所提供的一种存储集群系统故障处理方法及系统进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。

Claims (10)

1.一种存储集群系统故障处理方法,其特征在于,包括:
整理并记录存储集群系统已出现的故障以及处理对应故障的解决方案,构建故障解决方案数据库;
监测得到所述存储集群系统中产生的故障,根据所述故障的故障描述,从所述故障解决方案数据库中检索与所述故障相匹配的故障解决方案;
若检索到与所述故障相匹配的故障解决方案,则根据检索出的所述故障解决方案对所述故障进行修复。
2.根据权利要求1所述的方法,其特征在于,所述监测得到所述存储集群系统中产生的故障包括:
监测得到所述存储集群系统中产生的故障,并记录产生故障的发生时间、故障描述和故障级别,形成故障日志。
3.根据权利要求1所述的方法,其特征在于,还包括:若未检索到与所述故障相匹配的故障解决方案,则显示产生的故障的相关数据并发出提示,所述相关数据包括产生故障的发生时间、故障描述和故障级别。
4.根据权利要求3所述的方法,其特征在于,还包括:当产生的故障被修复完成后,则在显示的故障列表中删除对应该故障的相关数据。
5.根据权利要求1所述的方法,其特征在于,所述根据检索出的所述故障解决方案对所述故障进行修复,包括:
对所述故障的故障描述和检索出的所述故障解决方案进行分析,对所述故障解决方案进行调整,生成精确匹配于所述故障的新故障解决方案,按照所述新故障解决方案对所述故障进行修复。
6.一种存储集群系统故障处理系统,其特征在于,包括:
数据库构建模块,用于整理并记录存储集群系统已出现的故障以及处理对应故障的解决方案,构建故障解决方案数据库;
监测与检索模块,用于监测得到所述存储集群系统中产生的故障,根据所述故障的故障描述,从所述故障解决方案数据库中检索与所述故障相匹配的故障解决方案;
处理模块,用于若检索到与所述故障相匹配的故障解决方案,则根据检索出的所述故障解决方案对所述故障进行修复。
7.根据权利要求6所述的系统,其特征在于,所述监测与检索模块用于监测得到所述存储集群系统中产生的故障包括:
所述监测与检索模块具体用于监测得到所述存储集群系统中产生的故障,并记录产生故障的发生时间、故障描述和故障级别,形成故障日志。
8.根据权利要求6所述的系统,其特征在于,还包括:
显示模块,用于若未检索到与所述故障相匹配的故障解决方案,则显示产生的故障的相关数据并发出提示,所述相关数据包括产生故障的发生时间、故障描述和故障级别。
9.根据权利要求8所述的系统,其特征在于,所述显示模块还用于当产生的故障被修复完成后,则在显示的故障列表中删除对应该故障的相关数据。
10.根据权利要求6所述的系统,其特征在于,所述处理模块用于根据检索出的所述故障解决方案对所述故障进行修复包括:
所述处理模块具体用于对所述故障的故障描述和检索出的所述故障解决方案进行分析,对所述故障解决方案进行调整,生成精确匹配于所述故障的新故障解决方案,按照所述新故障解决方案对所述故障进行修复。
CN201610821044.XA 2016-09-13 2016-09-13 一种存储集群系统故障处理方法及系统 Pending CN106407030A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610821044.XA CN106407030A (zh) 2016-09-13 2016-09-13 一种存储集群系统故障处理方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610821044.XA CN106407030A (zh) 2016-09-13 2016-09-13 一种存储集群系统故障处理方法及系统

Publications (1)

Publication Number Publication Date
CN106407030A true CN106407030A (zh) 2017-02-15

Family

ID=57999994

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610821044.XA Pending CN106407030A (zh) 2016-09-13 2016-09-13 一种存储集群系统故障处理方法及系统

Country Status (1)

Country Link
CN (1) CN106407030A (zh)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107231263A (zh) * 2017-07-13 2017-10-03 郑州云海信息技术有限公司 一种故障监控方法及监控装置
CN107332722A (zh) * 2017-08-31 2017-11-07 郑州云海信息技术有限公司 一种故障信息的排除方法及系统
CN107480877A (zh) * 2017-08-03 2017-12-15 国电南瑞科技股份有限公司 一种多级调度间的故障处置预案在线联合执行方法及系统
CN107729217A (zh) * 2017-10-30 2018-02-23 郑州云海信息技术有限公司 一种数据库异常处理方法和终端
CN109032867A (zh) * 2018-07-25 2018-12-18 郑州云海信息技术有限公司 一种故障诊断方法、装置及设备
CN109086153A (zh) * 2018-07-24 2018-12-25 郑州云海信息技术有限公司 一种存储设备故障的修复方法及其相关装置
CN109117298A (zh) * 2018-09-03 2019-01-01 郑州云海信息技术有限公司 一种硬件故障修复方法、装置及设备
CN109144755A (zh) * 2017-06-19 2019-01-04 阿里巴巴集团控股有限公司 网页故障处理方法及设备
CN109428765A (zh) * 2017-09-04 2019-03-05 优酷网络技术(北京)有限公司 处理客户端故障的方法和装置
WO2019047070A1 (zh) * 2017-09-06 2019-03-14 富璟科技(深圳)有限公司 一种数据库维护方法及其系统
WO2019047071A1 (zh) * 2017-09-06 2019-03-14 富璟科技(深圳)有限公司 一种数据库故障的响应方法及其终端
CN109542928A (zh) * 2018-11-20 2019-03-29 Oppo(重庆)智能科技有限公司 错误管理方法、装置、存储介质及终端设备
CN110309128A (zh) * 2019-07-05 2019-10-08 广东铭太信息科技有限公司 Oracle备份文件自动导入装置及其实现方法、利用该装置进行备份文件导入的方法
CN110601905A (zh) * 2019-09-29 2019-12-20 苏州浪潮智能科技有限公司 一种故障检测方法和装置
CN111083422A (zh) * 2019-10-18 2020-04-28 视联动力信息技术股份有限公司 视联网调度会议异常分析方法、装置、设备、系统及介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103812699A (zh) * 2014-02-17 2014-05-21 无锡华云数据技术服务有限公司 基于云计算的监控管理系统
CN103838637A (zh) * 2014-03-03 2014-06-04 江苏智联天地科技有限公司 基于数据挖掘的终端自主故障诊断与恢复方法
CN104092730A (zh) * 2014-06-20 2014-10-08 裴兆欣 一种云计算系统
CN104715342A (zh) * 2015-03-31 2015-06-17 国网四川省电力公司电力科学研究院 基于案例推理法的电力设备故障处理辅助决策方法
CN105162632A (zh) * 2015-09-15 2015-12-16 浪潮集团有限公司 一种服务器集群故障自动处理系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103812699A (zh) * 2014-02-17 2014-05-21 无锡华云数据技术服务有限公司 基于云计算的监控管理系统
CN103838637A (zh) * 2014-03-03 2014-06-04 江苏智联天地科技有限公司 基于数据挖掘的终端自主故障诊断与恢复方法
CN104092730A (zh) * 2014-06-20 2014-10-08 裴兆欣 一种云计算系统
CN104715342A (zh) * 2015-03-31 2015-06-17 国网四川省电力公司电力科学研究院 基于案例推理法的电力设备故障处理辅助决策方法
CN105162632A (zh) * 2015-09-15 2015-12-16 浪潮集团有限公司 一种服务器集群故障自动处理系统

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109144755A (zh) * 2017-06-19 2019-01-04 阿里巴巴集团控股有限公司 网页故障处理方法及设备
CN107231263A (zh) * 2017-07-13 2017-10-03 郑州云海信息技术有限公司 一种故障监控方法及监控装置
CN107480877A (zh) * 2017-08-03 2017-12-15 国电南瑞科技股份有限公司 一种多级调度间的故障处置预案在线联合执行方法及系统
CN107332722A (zh) * 2017-08-31 2017-11-07 郑州云海信息技术有限公司 一种故障信息的排除方法及系统
CN109428765A (zh) * 2017-09-04 2019-03-05 优酷网络技术(北京)有限公司 处理客户端故障的方法和装置
CN110063042A (zh) * 2017-09-06 2019-07-26 富璟科技(深圳)有限公司 一种数据库故障的响应方法及其终端
WO2019047070A1 (zh) * 2017-09-06 2019-03-14 富璟科技(深圳)有限公司 一种数据库维护方法及其系统
WO2019047071A1 (zh) * 2017-09-06 2019-03-14 富璟科技(深圳)有限公司 一种数据库故障的响应方法及其终端
CN110063042B (zh) * 2017-09-06 2022-12-16 富璟科技(深圳)有限公司 一种数据库故障的响应方法及其终端
CN107729217A (zh) * 2017-10-30 2018-02-23 郑州云海信息技术有限公司 一种数据库异常处理方法和终端
CN109086153A (zh) * 2018-07-24 2018-12-25 郑州云海信息技术有限公司 一种存储设备故障的修复方法及其相关装置
CN109032867A (zh) * 2018-07-25 2018-12-18 郑州云海信息技术有限公司 一种故障诊断方法、装置及设备
CN109117298A (zh) * 2018-09-03 2019-01-01 郑州云海信息技术有限公司 一种硬件故障修复方法、装置及设备
CN109542928A (zh) * 2018-11-20 2019-03-29 Oppo(重庆)智能科技有限公司 错误管理方法、装置、存储介质及终端设备
CN110309128A (zh) * 2019-07-05 2019-10-08 广东铭太信息科技有限公司 Oracle备份文件自动导入装置及其实现方法、利用该装置进行备份文件导入的方法
CN110601905A (zh) * 2019-09-29 2019-12-20 苏州浪潮智能科技有限公司 一种故障检测方法和装置
CN111083422A (zh) * 2019-10-18 2020-04-28 视联动力信息技术股份有限公司 视联网调度会议异常分析方法、装置、设备、系统及介质
CN111083422B (zh) * 2019-10-18 2021-11-19 视联动力信息技术股份有限公司 视联网调度会议异常分析方法、装置、设备、系统及介质

Similar Documents

Publication Publication Date Title
CN106407030A (zh) 一种存储集群系统故障处理方法及系统
US10122575B2 (en) Log collection, structuring and processing
US9049105B1 (en) Systems and methods for tracking and managing event records associated with network incidents
CN109271272B (zh) 基于非结构化日志的大数据组件故障辅助修复系统
US9069668B2 (en) Diagnosing distributed applications using application logs and request processing paths
CN104301136B (zh) 故障信息上报及处理的方法及设备
US8332502B1 (en) Business to business network management event detection and response system and method
CN107508722B (zh) 一种业务监控方法和装置
CN102355368B (zh) 一种网络设备的故障处理方法及系统
US20110314148A1 (en) Log collection, structuring and processing
CN102937930A (zh) 应用程序监控系统及方法
CN106789157B (zh) 堆叠系统及堆叠交换机的硬件资源管理方法
CN110088744B (zh) 一种数据库维护方法及其系统
CN111782345B (zh) 容器云平台日志收集及分析告警方法
CN106933693A (zh) 一种数据库集群节点故障自动修复方法及系统
CN105450472A (zh) 一种自动获取服务器物理部件状态的方法及装置
CN106789306A (zh) 通信设备软件故障检测收集恢复方法和系统
CN106936620B (zh) 一种告警事件的处理方法和处理装置
CN106452811B (zh) 一种故障排查方法和系统
CN110209518A (zh) 一种多数据源日志数据集中收集存储方法及装置
CN107729205A (zh) 用于业务系统的故障处理方法和装置
CN106385334A (zh) 呼叫中心系统及其异常检测及自恢复方法
CN109327076A (zh) 一种提高自动化系统运维效率的系统
CN112711493A (zh) 一种场景化根因分析应用
CN108809729A (zh) 一种分布式系统中ctdb服务的故障处理方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170215