CN106933693A - 一种数据库集群节点故障自动修复方法及系统 - Google Patents

一种数据库集群节点故障自动修复方法及系统 Download PDF

Info

Publication number
CN106933693A
CN106933693A CN201710154591.1A CN201710154591A CN106933693A CN 106933693 A CN106933693 A CN 106933693A CN 201710154591 A CN201710154591 A CN 201710154591A CN 106933693 A CN106933693 A CN 106933693A
Authority
CN
China
Prior art keywords
data
node
cluster
current
base cluster
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710154591.1A
Other languages
English (en)
Inventor
李永仙
高传集
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Yunhai Information Technology Co Ltd
Original Assignee
Zhengzhou Yunhai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Yunhai Information Technology Co Ltd filed Critical Zhengzhou Yunhai Information Technology Co Ltd
Priority to CN201710154591.1A priority Critical patent/CN106933693A/zh
Publication of CN106933693A publication Critical patent/CN106933693A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0709Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a distributed system consisting of a plurality of standalone computer nodes, e.g. clusters, client-server systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0793Remedial or corrective actions

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Hardware Redundancy (AREA)

Abstract

本发明提供了一种数据库集群节点故障自动修复方法及系统。所述的数据库集群节点故障自动修复方法基于当前监控到的数据库集群的运行状态,判定当前数据库集群是否发生故障,若判为发生故障,则确定出当前发生故障的各节点,之后遍历该确定的各故障节点,并对当前遍历出的各相应节点分别进行修复。所述的数据库集群节点故障自动修复系统,通过数据库集群运行状态监控模块监控数据库集群的运行状态,通过数据集群节点日志模块记录数据集群节点的运行日志,通过存储模块进行本系统的数据存储,通过控制模块进行本申请节点故障自动修复的控制。本发明能自动修复数据库集群,减少人工修复数据库集群节点的操作,从而提高数据库的可用性。

Description

一种数据库集群节点故障自动修复方法及系统
技术领域
本发明涉及数据库集群领域,具体是一种数据库集群节点故障自动修复方法及系统,其从数据库集群状态异常诊断至数据库集群当前发生故障的节点的修复,整个过程均自动完成,无需人工参与,用于大大减轻运维和技术人员对数据库异常修复的工作量,同时用于及时响应应用对数据库的操作。
背景技术
随着各领域信息化进程的加深,各领域相关业务数据已逐渐成为宝贵资产,而与上述业务数据相关的数据库的高可用性越来越受到重视,数据库集群就是解决数据库高可用的方案之一。
但数据库集群在使用过程中,有时会因发生宕机或人为不正常操作的原因而关闭其中的某个或某些个数据库,造成数据库集群不可用和数据丢失的现象,需要数据库相关人员及时对数据库集群进行修复。
而在实际应用过程中,从发现数据库集群不可用到数据库集群恢复需要较长的时间,严重影响相关应用的正常运行。
现有技术中存在一些用于对数据库集群状态监控的工具,但通常需要人为分析数据库集群中节点不能正常启动的原因,之后在修改故障节点相关配置参数后,启动数据库集群节点,使用非常不便,且危害系数较大。
此为现有技术的不足之处。
发明内容
本发明所要解决的技术问题是,针对现有技术的不足,提供一种数据库集群节点故障自动修复方法及系统,用于在数据库集群故障时,主动地对数据库集群故障进行修复,从而达到减轻运维及技术人员对数据库集群节点数据库异常修复的工作量、及时响应应用对数据库的操作的目的。
为解决上述技术问题,本发明提供了一种数据库集群节点故障自动修复方法,包括:
步骤A、监控数据库集群的运行状态;
步骤B、根据步骤A当前监控到的数据库集群的运行状态,判定当前数据库集群是否发生故障,若判定结果为当前数据库集群发生故障,则执行步骤C;
步骤C、确定出数据库集群当前发生故障的各节点;
步骤D、遍历步骤C中确定出的数据库集群当前发生故障的各节点,对当前遍历出的各相应节点分别进行修复。
其中,上述步骤D中对每个当前遍历出的发生故障的节点进行修复的方法步骤包括:
步骤s1、获取该当前遍历出的发生故障的节点的运行日志;
步骤s2、基于步骤s1中获取的当前遍历出的发生故障的节点的运行日志,对应定位出该当前遍历出的发生故障的节点的异常类型;
步骤s3、基于步骤s2中定位出的该当前遍历出的发生故障的节点的异常类型,对应调用预先设定的与该定位出的异常类型相对应的修复方法,对该当前遍历出的发生故障的数据库集群节点进行修复。
其中,所述的步骤A采用心跳机制周期性地监控数据库集群的运行状态。
本发明还提供了一种数据库集群节点故障自动修复系统,包括:
数据库集群运行状态监控模块,用于监控数据库集群的运行状态;
数据集群节点日志模块,用于记录数据集群各节点的运行日志;
存储模块,用于本系统的数据存储;
控制模块,连接所述的数据库集群运行状态监控模块、数据集群节点日志模块和存储模块,其基于数据库集群运行状态监控模块当前监控到的数据库集群的运行状态,判定当前数据库集群是否发生故障,若判定结果为当前数据库集群发生故障,则确定出数据库集群当前发生故障的各节点;之后遍历该确定出的数据库集群当前发生故障的各节点,对当前遍历出的各相应节点分别进行修复。
在该所述的数据库集群节点故障自动修复系统中,所述的数据库集群运行状态监控模块采用心跳机制周期性地监控数据库集群的运行状态。
在该所述的数据库集群节点故障自动修复系统中,所述的控制模块对每个当前遍历出的发生故障的节点进行修复的方法步骤包括:
步骤p1、获取该当前遍历出的发生故障的节点的运行日志;
步骤p2、基于步骤p1中获取的当前遍历出的发生故障的节点的运行日志,对应定位出该当前遍历出的发生故障的节点的异常类型;
步骤p3、基于步骤p2中定位出的该当前遍历出的发生故障的节点的异常类型,对应调用存储模块中预先存储的与该定位出的异常类型相对应的修复方法,对该当前遍历出的发生故障的数据库集群节点进行修复。
与现有技术相比,本发明的优点在于:
本发明在判定数据库集群状态为故障状态时,能够自动修复数据库集群故障节点,从而在很大程度上减少人工修复数据库集群节点的操作,进而提高数据库的可用性。
由此可见,本发明与现有技术相比,具有突出的实质性特点和显著的进步,其实施的有益效果也是显而易见的。
附图说明
图1为本发明所述数据库集群节点故障自动修复方法的方法流程示意图;
图2为本发明所述数据库集群节点故障自动修复系统的原理结构框图示意图。
具体实施方式
为使本发明的技术方案和优点更加清楚,下面将结合附图,对本发明的技术方案进行清楚、完整地描述。
具体实施方式1:
如图1所示,本发明的一种数据库集群节点故障自动修复方法,包括:
步骤A、监控数据库集群的运行状态;
步骤B、根据步骤A当前监控到的数据库集群的运行状态,判定当前数据库集群是否发生故障,若判定结果为当前数据库集群发生故障,则执行步骤C;
步骤C、确定出数据库集群当前发生故障的各节点;
步骤D、遍历步骤C中确定出的数据库集群当前发生故障的各节点,对当前遍历出的各相应节点分别进行修复。
使用时,基于当前监控到的数据库集群的运行状态,判定当前数据库集群是否发生故障,若判定结果为当前数据库集群发生故障,则确定出数据库集群当前发生故障的各节点,之后通过遍历的方式,串行修复上述确定出的数据库集群当前发生故障的各节点。本发明在数据库集群故障时,主动地对数据库集群故障进行修复,从而达到了减轻运维及技术人员对数据库集群节点数据库异常修复的工作量、及时响应应用对数据库的操作的目的。
作为优选,上述步骤D中对每个当前遍历出的发生故障的节点进行修复的方法步骤包括:
步骤s1、获取该当前遍历出的发生故障的节点的运行日志;
步骤s2、基于步骤s1中获取的当前遍历出的发生故障的节点的运行日志,对应定位出该当前遍历出的发生故障的节点的异常类型;
步骤s3、基于步骤s2中定位出的该当前遍历出的发生故障的节点的异常类型,对应调用预先设定的与该定位出的异常类型相对应的修复方法,对该当前遍历出的发生故障的数据库集群节点进行修复。
本发明基于数据库集群节点的运行日志,对于每个当前发生故障的数据库集群节点,通过其运行日志,对应定位出其异常类型,进而对应调用预先设定的与该定位出的异常类型相对应的修复方法,对该当前发生故障的数据库集群节点进行修复,便于实现。
其中,所述的步骤A采用心跳机制周期性地监控数据库集群的运行状态。具体地,在本实施方式中,所述的心跳机制通过数据库的执行命令及其相关参数创建的心跳检测机制,获取当前数据库集群的运行状态,即通过设置定时任务,定时触发该心跳机制。
如图2所示,本发明还提供了一种数据库集群节点故障自动修复系统。本发明所述的数据库集群节点故障自动修复系统包括:
数据库集群运行状态监控模块,用于监控数据库集群的运行状态;
数据集群节点日志模块,用于记录数据集群各节点的运行日志;
存储模块,用于本系统的数据存储;
控制模块,连接所述的数据库集群运行状态监控模块、数据集群节点日志模块和存储模块,其基于数据库集群运行状态监控模块当前监控到的数据库集群的运行状态,判定当前数据库集群是否发生故障,若判定结果为当前数据库集群发生故障,则确定出数据库集群当前发生故障的各节点;之后遍历该确定出的数据库集群当前发生故障的各节点,对当前遍历出的各相应节点分别进行修复。
本发明所述的数据库集群节点故障自动修复系统工作时,通过数据库集群运行状态监控模块监控数据库集群的运行状态,之后将当前监控到的数据库集群的运行状态发送给控制模块,控制模块基于接收到的数据库集群运行状态监控模块当前监控到的数据库集群的运行状态,判定当前数据库集群是否发生故障,若判定结果为当前数据库集群发生故障,则确定数据库集群当前发生故障的各节点,之后串行对该确定出的数据库集群当前发生故障的各节点进行修复,既实现了对数据库集群故障节点的自动修复,也在很大程度上缩减了从发现数据库集群故障到数据库集群恢复的时间间隔长度,这在很大程度上确保了相关应用的正常运行。
在该所述的数据库集群节点故障自动修复系统中,所述的数据库集群运行状态监控模块采用心跳机制周期性地监控数据库集群的运行状态。
在该所述的数据库集群节点故障自动修复系统中,所述的控制模块对每个当前遍历出的发生故障的节点进行修复的方法步骤包括:
步骤p1、获取该当前遍历出的发生故障的节点的运行日志(由所述的数据集群节点日志模块记录);
步骤p2、基于步骤p1中获取的当前遍历出的发生故障的节点的运行日志,对应定位出该当前遍历出的发生故障的节点的异常类型;
步骤p3、基于步骤p2中定位出的该当前遍历出的发生故障的节点的异常类型,对应调用存储模块中预先存储的与该定位出的异常类型相对应的修复方法,对该当前遍历出的发生故障的数据库集群节点进行修复。
使用时,通过当前发生故障的节点的运行日志,定位出该当前发生故障的节点的异常类型,之后调用存储模块中预先存储的与该定位出的异常类型相对应的修复方法,对该当前发生故障的节点进行修复,便于实现。
综上,本发明所述的方法及系统,在判定数据库集群状态为故障状态时,能够主动修复数据库集群故障节点,这在很大程度上减少了人工修复数据库集群节点的操作,也在很大程度上缩减了从发现数据库集群故障到数据库集群恢复的时间间隔长度,进而在一定程度上确保了相关应用的正常运行,从而提高了数据库的可用性。
以上实施方式仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施方式对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施方式所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施方式技术方案的范围。

Claims (6)

1.一种数据库集群节点故障自动修复方法,其特征在于,包括:
步骤A、监控数据库集群的运行状态;
步骤B、根据步骤A当前监控到的数据库集群的运行状态,判定当前数据库集群是否发生故障,若判定结果为当前数据库集群发生故障,则执行步骤C;
步骤C、确定出数据库集群当前发生故障的各节点;
步骤D、遍历步骤C中确定出的数据库集群当前发生故障的各节点,对当前遍历出的各相应节点分别进行修复。
2.根据权利要求1所述的数据库集群节点故障自动修复方法,其特征在于,上述步骤D中对每个当前遍历出的发生故障的节点进行修复的方法步骤包括:
步骤s1、获取该当前遍历出的发生故障的节点的运行日志;
步骤s2、基于步骤s1中获取的当前遍历出的发生故障的节点的运行日志,对应定位出该当前遍历出的发生故障的节点的异常类型;
步骤s3、基于步骤s2中定位出的该当前遍历出的发生故障的节点的异常类型,对应调用预先设定的与该定位出的异常类型相对应的修复方法,对该当前遍历出的发生故障的数据库集群节点进行修复。
3.根据权利要求1或2所述的数据库集群节点故障自动修复方法,其特征在于,所述的步骤A采用心跳机制周期性地监控数据库集群的运行状态。
4.一种数据库集群节点故障自动修复系统,其特征在于,包括:
数据库集群运行状态监控模块,用于监控数据库集群的运行状态;
数据集群节点日志模块,用于记录数据集群各节点的运行日志;
存储模块,用于本系统的数据存储;
控制模块,连接所述的数据库集群运行状态监控模块、数据集群节点日志模块和存储模块,其基于数据库集群运行状态监控模块当前监控到的数据库集群的运行状态,判定当前数据库集群是否发生故障,若判定结果为当前数据库集群发生故障,则确定出数据库集群当前发生故障的各节点;之后遍历该确定出的数据库集群当前发生故障的各节点,对当前遍历出的各相应节点分别进行修复。
5.根据权利要求4所述的数据库集群节点故障自动修复系统,其特征在于,所述的数据库集群运行状态监控模块采用心跳机制周期性地监控数据库集群的运行状态。
6.根据权利要求4或5所述的数据库集群节点故障自动修复系统,其特征在于,所述的控制模块对每个当前遍历出的发生故障的节点进行修复的方法步骤包括:
步骤p1、获取该当前遍历出的发生故障的节点的运行日志;
步骤p2、基于步骤p1中获取的当前遍历出的发生故障的节点的运行日志,对应定位出该当前遍历出的发生故障的节点的异常类型;
步骤p3、基于步骤p2中定位出的该当前遍历出的发生故障的节点的异常类型,对应调用存储模块中预先存储的与该定位出的异常类型相对应的修复方法,对该当前遍历出的发生故障的数据库集群节点进行修复。
CN201710154591.1A 2017-03-15 2017-03-15 一种数据库集群节点故障自动修复方法及系统 Pending CN106933693A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710154591.1A CN106933693A (zh) 2017-03-15 2017-03-15 一种数据库集群节点故障自动修复方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710154591.1A CN106933693A (zh) 2017-03-15 2017-03-15 一种数据库集群节点故障自动修复方法及系统

Publications (1)

Publication Number Publication Date
CN106933693A true CN106933693A (zh) 2017-07-07

Family

ID=59432843

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710154591.1A Pending CN106933693A (zh) 2017-03-15 2017-03-15 一种数据库集群节点故障自动修复方法及系统

Country Status (1)

Country Link
CN (1) CN106933693A (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107360045A (zh) * 2017-08-31 2017-11-17 郑州云海信息技术有限公司 一种存储集群系统的监控方法及装置
CN107729217A (zh) * 2017-10-30 2018-02-23 郑州云海信息技术有限公司 一种数据库异常处理方法和终端
CN108334427A (zh) * 2018-02-24 2018-07-27 腾讯科技(深圳)有限公司 存储系统中的故障诊断方法及装置
CN108809729A (zh) * 2018-06-25 2018-11-13 郑州云海信息技术有限公司 一种分布式系统中ctdb服务的故障处理方法及装置
CN108829564A (zh) * 2018-06-26 2018-11-16 郑州云海信息技术有限公司 一种对Samba的故障诊断方法、装置、设备及存储介质
CN108833131A (zh) * 2018-04-25 2018-11-16 北京百度网讯科技有限公司 分布式数据库云服务的系统、方法、设备和计算机存储介质
CN108847982A (zh) * 2018-06-26 2018-11-20 郑州云海信息技术有限公司 一种分布式存储集群及其节点故障切换方法和装置
CN111177095A (zh) * 2019-12-10 2020-05-19 中移(杭州)信息技术有限公司 日志分析方法、装置、计算机设备及存储介质
CN111522680A (zh) * 2020-04-17 2020-08-11 支付宝(杭州)信息技术有限公司 一种自动修复异常任务节点的方法、装置及设备
CN114821857A (zh) * 2022-04-24 2022-07-29 重庆长安汽车股份有限公司 基于fta分析车辆的故障诊断方法、终端设备及存储介质
CN115904822A (zh) * 2022-12-21 2023-04-04 长春吉大正元信息技术股份有限公司 一种集群修复方法及装置
CN115994044A (zh) * 2023-01-09 2023-04-21 苏州浪潮智能科技有限公司 基于监控服务的数据库故障处理方法、装置及分布式集群
CN117155937A (zh) * 2023-10-30 2023-12-01 北京腾达泰源科技有限公司 集群节点故障检测方法、装置、设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN203289491U (zh) * 2013-05-23 2013-11-13 浙江闪龙科技有限公司 一种故障节点可自动修复的集群存储系统
CN103607297A (zh) * 2013-11-07 2014-02-26 上海爱数软件有限公司 一种计算机集群系统的故障处理方法
CN104683446A (zh) * 2015-01-29 2015-06-03 广州杰赛科技股份有限公司 一种云存储集群节点服务状态实时监控方法和系统
CN105227374A (zh) * 2015-10-23 2016-01-06 浪潮(北京)电子信息产业有限公司 一种集群应用的故障迁移方法和系统
CN105337765A (zh) * 2015-10-10 2016-02-17 上海新炬网络信息技术有限公司 一种分布式hadoop集群故障自动诊断修复系统
CN106126652A (zh) * 2016-06-24 2016-11-16 武汉斗鱼网络科技有限公司 用于分布式数据库集群的故障数据库切换方法及系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN203289491U (zh) * 2013-05-23 2013-11-13 浙江闪龙科技有限公司 一种故障节点可自动修复的集群存储系统
CN103607297A (zh) * 2013-11-07 2014-02-26 上海爱数软件有限公司 一种计算机集群系统的故障处理方法
CN103607297B (zh) * 2013-11-07 2017-02-08 上海爱数信息技术股份有限公司 一种计算机集群系统的故障处理方法
CN104683446A (zh) * 2015-01-29 2015-06-03 广州杰赛科技股份有限公司 一种云存储集群节点服务状态实时监控方法和系统
CN105337765A (zh) * 2015-10-10 2016-02-17 上海新炬网络信息技术有限公司 一种分布式hadoop集群故障自动诊断修复系统
CN105227374A (zh) * 2015-10-23 2016-01-06 浪潮(北京)电子信息产业有限公司 一种集群应用的故障迁移方法和系统
CN106126652A (zh) * 2016-06-24 2016-11-16 武汉斗鱼网络科技有限公司 用于分布式数据库集群的故障数据库切换方法及系统

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107360045A (zh) * 2017-08-31 2017-11-17 郑州云海信息技术有限公司 一种存储集群系统的监控方法及装置
CN107729217A (zh) * 2017-10-30 2018-02-23 郑州云海信息技术有限公司 一种数据库异常处理方法和终端
CN108334427A (zh) * 2018-02-24 2018-07-27 腾讯科技(深圳)有限公司 存储系统中的故障诊断方法及装置
CN108334427B (zh) * 2018-02-24 2022-03-25 腾讯科技(深圳)有限公司 存储系统中的故障诊断方法及装置
CN108833131A (zh) * 2018-04-25 2018-11-16 北京百度网讯科技有限公司 分布式数据库云服务的系统、方法、设备和计算机存储介质
CN108809729A (zh) * 2018-06-25 2018-11-13 郑州云海信息技术有限公司 一种分布式系统中ctdb服务的故障处理方法及装置
CN108829564A (zh) * 2018-06-26 2018-11-16 郑州云海信息技术有限公司 一种对Samba的故障诊断方法、装置、设备及存储介质
CN108847982A (zh) * 2018-06-26 2018-11-20 郑州云海信息技术有限公司 一种分布式存储集群及其节点故障切换方法和装置
CN111177095B (zh) * 2019-12-10 2023-10-27 中移(杭州)信息技术有限公司 日志分析方法、装置、计算机设备及存储介质
CN111177095A (zh) * 2019-12-10 2020-05-19 中移(杭州)信息技术有限公司 日志分析方法、装置、计算机设备及存储介质
CN111522680A (zh) * 2020-04-17 2020-08-11 支付宝(杭州)信息技术有限公司 一种自动修复异常任务节点的方法、装置及设备
CN114821857A (zh) * 2022-04-24 2022-07-29 重庆长安汽车股份有限公司 基于fta分析车辆的故障诊断方法、终端设备及存储介质
CN115904822A (zh) * 2022-12-21 2023-04-04 长春吉大正元信息技术股份有限公司 一种集群修复方法及装置
CN115994044A (zh) * 2023-01-09 2023-04-21 苏州浪潮智能科技有限公司 基于监控服务的数据库故障处理方法、装置及分布式集群
CN115994044B (zh) * 2023-01-09 2023-06-13 苏州浪潮智能科技有限公司 基于监控服务的数据库故障处理方法、装置及分布式集群
CN117155937A (zh) * 2023-10-30 2023-12-01 北京腾达泰源科技有限公司 集群节点故障检测方法、装置、设备及存储介质
CN117155937B (zh) * 2023-10-30 2024-01-23 北京腾达泰源科技有限公司 集群节点故障检测方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN106933693A (zh) 一种数据库集群节点故障自动修复方法及系统
CN105354614B (zh) 一种基于大数据的电网信息运维主动预警方法
CN103245912B (zh) 一种风电机组运行状态分析诊断方法和系统
CN105659528B (zh) 一种实现故障定位的方法及装置
CN104378232B (zh) 主备集群组网模式下的脑裂发现、恢复方法及装置
CN106209405B (zh) 故障诊断方法及装置
CN106407030A (zh) 一种存储集群系统故障处理方法及系统
Nováczki An improved anomaly detection and diagnosis framework for mobile network operators
CN103532753B (zh) 一种基于内存换页同步的双机热备方法
CN104796273A (zh) 一种网络故障根源诊断的方法和装置
CN110716842B (zh) 集群故障检测方法和装置
CN103067209B (zh) 一种心跳模块自检测方法
CN105703481A (zh) 一种换流阀均压状态一致性统计方法
CN104574219A (zh) 电网业务信息系统运行工况的监测预警方法及系统
CN107040395A (zh) 一种告警信息的处理方法、装置和系统
CN109144789A (zh) 一种重启osd的方法、装置及系统
CN113282635A (zh) 一种微服务系统故障根因定位方法及装置
CN107360045A (zh) 一种存储集群系统的监控方法及装置
CN106897779A (zh) 一种数据中心运维系统事件的处理方法
CN108776625A (zh) 一种服务故障的修复方法、装置和存储介质
CN106130778A (zh) 一种处理集群故障的方法及一种管理节点
CN106254114A (zh) 云主机故障迁移方法及系统
CN106878062B (zh) 一种燃料电池汽车动力性能测试系统的多网冗余方法
CN103888300B (zh) Web服务系统中网络故障分析系统与方法
CN115603459A (zh) 一种基于数字孪生技术的配电网关键厂站监测方法与系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170707