CN111104237A - 可配置的故障自动化处理方法和系统及计算机存储介质 - Google Patents
可配置的故障自动化处理方法和系统及计算机存储介质 Download PDFInfo
- Publication number
- CN111104237A CN111104237A CN201811260064.XA CN201811260064A CN111104237A CN 111104237 A CN111104237 A CN 111104237A CN 201811260064 A CN201811260064 A CN 201811260064A CN 111104237 A CN111104237 A CN 111104237A
- Authority
- CN
- China
- Prior art keywords
- fault
- automatic processing
- state
- automation
- processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 44
- 238000012545 processing Methods 0.000 claims abstract description 112
- 238000012423 maintenance Methods 0.000 claims abstract description 20
- 230000002159 abnormal effect Effects 0.000 claims abstract description 15
- 238000013515 script Methods 0.000 claims description 24
- 238000004590 computer program Methods 0.000 claims description 5
- 238000000605 extraction Methods 0.000 claims description 3
- 238000003672 processing method Methods 0.000 abstract description 6
- 230000001960 triggered effect Effects 0.000 abstract 2
- 238000012544 monitoring process Methods 0.000 description 11
- 238000011084 recovery Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000007812 deficiency Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000002411 adverse Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 231100000989 no adverse effect Toxicity 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0793—Remedial or corrective actions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/32—Monitoring with visual or acoustical indication of the functioning of the machine
- G06F11/324—Display of status information
- G06F11/327—Alarm or error message display
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Debugging And Monitoring (AREA)
Abstract
本发明提供一种可配置的故障自动化处理方法和系统及介质,在故障发生后的设定时间内持续观察故障的状态,若设定时间内故障的状态持续异常,则触发故障自动化处理,否则,则不触发故障自动化处理;在故障自动化处理完成后,持续观察故障的状态,若故障的状态恢复正常,则确认故障自动化处理有效,触发关闭告警及事件,若故障的状态持续异常,则确认故障自动化处理无效,生成处理结果;将处理结果发送至运维角色,进一步进行人工干预。更好的支撑不同场景下所需要应用的不同的自动化处理策略,高效、恰当、准确的处理企业信息化系统运行过程中产生的各种风险、隐患和故障,真正做到无人化运维,极大的降低人工运维成本。
Description
技术领域
本发明涉及企业信息化系统运行状态监控及故障处理领域,具体地,涉及一种可配置的故障自动化处理方法和系统及计算机存储介质,尤其是涉及一种灵活可配置的故障自动化处理方法。
背景技术
为了保证企业信息化系统运行的稳定性和连续性,需要对系统运行中出现的各种隐患及故障进行快速、准确的发现和处理,让系统始终处于可用、好用的最佳状态。监控解决了发现故障的问题,目前绝大部分企业都对自身的信息化系统部署了监控工具,能够通过配置不同的告警规则第一时间发现隐患及故障,并基于短信或电话驱动运维工程师迅速介入处理;运维自动化解决了处理故障的问题,企业为规模化的信息化系统或数据中心部署了运维自动化平台,在平台上将人工操作固化为运维自动化流程及脚本,并通过这些运维自动化流程及脚本对各种IT资源进行管理,包括计划内的批量操作,以及故障发生时的快速处理。
已有技术或相关产品中绝大部分仅实现了监控发现故障时调用脚本或自动化流程的功能,但对When(执行自动化流程及脚本的时机)和How(判断自动化执行结果及故障恢复结果)没有进行深入的考虑和实现。对于When,已有技术或相关产品的实现大多数是发现故障马上调用自动化,没有延迟设置及更高级的判断逻辑;对于How,已有技术或相关产品更多关注脚本或自动化流程调用成功,更进一步到脚本及自动化流程执行成功,但没有将故障状态是否恢复的判断整合进来。这些不足可能导致执行自动处理时发生业务不必要中断、自动化处理后无法确认故障是否真正恢复等问题。
发明内容
针对现有技术中的缺陷,本发明的目的是提供一种可配置的故障自动化处理方法和系统及计算机存储介质。
根据本发明提供的一种可配置的故障自动化处理方法,包括:
抽取可配置参数步骤:针对故障自动化处理的场景抽取可配置参数;
第一观察告警状态步骤:在故障发生后的设定时间内持续观察故障的状态,若设定时间内故障的状态持续异常,则触发故障自动化处理,否则,则不触发故障自动化处理;
自动化处理步骤:对故障进行故障自动化处理;
第二观察告警状态步骤:在故障自动化处理完成后,持续观察故障的状态,若故障的状态恢复正常,则确认故障自动化处理有效,触发关闭告警及事件,若故障的状态持续异常,则确认故障自动化处理无效,生成处理结果;
关闭告警及事件步骤:关闭告警及事件,故障解除;
汇报处理结果步骤:将处理结果发送至运维角色,进一步进行人工干预。
优选地,所述可配置参数主要包括启动时间、自动化类型、自动化名称、关闭告警及事件时间中的任一种或任多种。
优选地,所述启动时间是故障发生时启动执行故障自动化处理的时间。
优选地,所述自动化类型是故障发生时调用的自动化流程及脚本的类型,主要包括全局资源级自动化、应用级自动化、仅自动关闭告警及事件中的任一种或任多种。
优选地,所述自动化名称是故障发生时执行的自动化流程及脚本的名称。
优选地,所述关闭告警及事件时间是执行自动化流程及脚本进行故障处理后等待故障状态恢复的时间。
根据本发明提供的一种存储有计算机程序的计算机可读存储介质,其特征在于,所述计算机程序被处理器执行时实现上述的方法的步骤。
根据本发明提供的一种可配置的故障自动化处理系统,包括:
抽取可配置参数模块:针对故障自动化处理的场景抽取可配置参数;
第一观察告警状态模块:在故障发生后的设定时间内持续观察故障的状态,若设定时间内故障的状态持续异常,则触发故障自动化处理,否则,则不触发故障自动化处理;
自动化处理模块:对故障进行故障自动化处理;
第二观察告警状态模块:在故障自动化处理完成后,持续观察故障的状态,若故障的状态恢复正常,则确认故障自动化处理有效,触发关闭告警及事件,若故障的状态持续异常,则确认故障自动化处理无效,生成处理结果;
关闭告警及事件模块:关闭告警及事件,故障解除;
汇报处理结果模块:将处理结果发送至运维角色,进一步进行人工干预。
与现有技术相比,本发明具有如下的有益效果:
1、能够在各种故障场景下,模拟人的判断和处理方式,对故障作出合理有效的处理,大大减小了人工干预的需求,降低了人工成本;
2、能够有效避免“过度运维”的情况,确保企业信息化系统能够连续、稳定运行。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为本发明的故障自动化处理策略配置界面示意图;
图2为本发明的故障自动化处理流程示意图;
图3为本发明的自动化策略配置界面示意图。
具体实施方式
下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变化和改进。这些都属于本发明的保护范围。
本发明在故障自动化处理的场景下,基于灵活可配置的自动化处理策略将信息系统故障的自动发现和处理更有效的联动起来,通过监控与自动化系统的协作完成对故障的妥当处置。将监控调用自动化所涉及到的What(故障发生时执行什么自动化流程及脚本)、When(故障发生后什么时候开始执行自动化流程及脚本)、How(如何判断自动化流程及脚本的执行结果及故障恢复结果)、Where(在哪些对象上执行自动化流程及脚本)等方面的关键参数抽取为可配置的模型和框架,更好的支撑不同场景下所需要应用的不同的自动化处理策略,高效、恰当、准确的处理企业信息化系统运行过程中产生的各种风险、隐患和故障,真正做到无人化运维,极大的降低人工运维成本。
根据本发明提供的一种可配置的故障自动化处理方法,包括:
抽取可配置参数步骤:针对故障自动化处理的场景抽取可配置参数;
第一观察告警状态步骤:在故障发生后的设定时间内持续观察故障的状态,若设定时间内故障的状态持续异常,则触发故障自动化处理,否则,则不触发故障自动化处理;
自动化处理步骤:对故障进行故障自动化处理;
第二观察告警状态步骤:在故障自动化处理完成后,持续观察故障的状态,若故障的状态恢复正常,则确认故障自动化处理有效,触发关闭告警及事件,若故障的状态持续异常,则确认故障自动化处理无效,生成处理结果;
关闭告警及事件步骤:关闭告警及事件,故障解除;
汇报处理结果步骤:将处理结果发送至运维角色,进一步进行人工干预。
具体地,所述可配置参数主要包括启动时间、自动化类型、自动化名称、关闭告警及事件时间中的任一种或任多种。
具体地,所述启动时间是故障发生时启动执行故障自动化处理的时间。
具体地,所述自动化类型是故障发生时调用的自动化流程及脚本的类型,主要包括全局资源级自动化、应用级自动化、仅自动关闭告警及事件中的任一种或任多种。
具体地,所述自动化名称是故障发生时执行的自动化流程及脚本的名称。
具体地,所述关闭告警及事件时间是执行自动化流程及脚本进行故障处理后等待故障状态恢复的时间。
根据本发明提供的一种存储有计算机程序的计算机可读存储介质,其特征在于,所述计算机程序被处理器执行时实现上述的方法的步骤。
根据本发明提供的一种可配置的故障自动化处理系统,包括:
抽取可配置参数模块:针对故障自动化处理的场景抽取可配置参数;
第一观察告警状态模块:在故障发生后的设定时间内持续观察故障的状态,若设定时间内故障的状态持续异常,则触发故障自动化处理,否则,则不触发故障自动化处理;
自动化处理模块:对故障进行故障自动化处理;
第二观察告警状态模块:在故障自动化处理完成后,持续观察故障的状态,若故障的状态恢复正常,则确认故障自动化处理有效,触发关闭告警及事件,若故障的状态持续异常,则确认故障自动化处理无效,生成处理结果;
关闭告警及事件模块:关闭告警及事件,故障解除;
汇报处理结果模块:将处理结果发送至运维角色,进一步进行人工干预。
本发明提供的可配置的故障自动化处理系统,可以通过可配置的故障自动化处理方法的步骤流程实现。本领域技术人员可以将可配置的故障自动化处理方法理解为所述可配置的故障自动化处理系统的优选例。
以下结合附图对本发明的优选例进行详细阐述。
如图1所示,针对各种故障自动化场景抽取的关键可配置参数包括:启动时间——什么时候执行故障自动化处理流程及脚本;自动化类型——故障发生时调用的自动化流程及脚本的类型;自动化名称——故障发生时执行的自动化流程及脚本名称;关闭告警及事件——执行自动化流程及脚本进行故障处理后等待故障状态恢复的时间,以及故障状态恢复后是否自动关闭监控产生的告警及事件;发送通知——是否向运维人员发送自动化处理的进展和结果。
故障自动化处理策略的配置的最小粒度为告警规则(例如,“CPU瞬时使用率连续10次中有8次大于等于80%”、“/app文件系统使用率大于等于85%且文件系统空闲容量小于等于5G”等),也就是说支持对任意IT资源的任意一条告警规则配置自动化处理策略。
为了进一步说明上述故障自动化处理策略中可配置关键参数的用途,需要结合方案中设计采用的故障处理流程进行。如图2所示,故障自动化流程在监控告警产生与执行自动化的过程当中,以及自动化执行结束后都增加了“观察告警状态”的步骤,第一个“观察告警状态”的作用是在监控监测到故障后持续观察故障的状态,如果故障状态持续异常则调用自动化流程及脚本进行处理,反之如果故障状态在指定的时间(通常不会太长)内自动恢复则不进行任何处理,这么做的原因是IT系统中有一部分隐患或故障是由业务压力或其他原因导致的短期波动造成的,在较短的时间内能够自主恢复,并不会造成不良影响,关键参数“启动时间”的作用就是对故障发生后持续观察的时间进行配置,根据实际情况“立即执行”、“五分钟后执行”、“十分钟后执行”自动化处理,在故障产生和自动化处理间增加了一道缓冲,避免因执行不必要的自动化处理(例如重启应用服务器等)对业务连续运行带来的反作用。第二个“观察告警状态”的作用是在执行完故障自动化处理手段后持续观察故障状态是否恢复正常,从而确认此次自动化处理是否有效,以及进一步决定后续的处置和升级方案,关键参数“关闭告警及事件”则是若故障状态在指定时间内恢复则认定自动化处理有效,继而自动关闭相关告警、事件等。
针对某应用服务器产生“Java线程数连续5次中有5次大于等于30”告警后的自动化处理策略配置方法及配置效果阐述如下,假定某信息化系统中有一台应用服务器(例如Apache Tomcat),运维角色人员为该应用服务器配置了应用服务器状态、Java线程数、Http请求数等一系列关键指标的监控,其中有一条告警规则“Java线程数连续5次中有5次大于等于30”。如图3所示,自动化处理策略的配置步骤如下:配置是否执行自动化处理,本实施例中配置为“是”;选择用于故障处理的自动化类型(全局资源级自动化、应用级自动化、仅自动关闭告警及事件),本实施例中选择的自动化类型是“应用级自动化”;配置自动化处理的启动时间,本实施例中配置的启动时间是“10分钟”;配置所指定自动化流程的名称,本实施例中配置的自动化名称为“重启10.10.10.1节点的Tomcat应用服务器”;配置关闭告警及事件的时间,本实施例中配置的时间为“10分钟”。产生的处理效果如下:当该应用服务器产生“Java线程数连续5次中有5次大于等于30”的告警后,监控系统将执行自动化“重启10.10.10.1节点的Tomcat应用服务器”进行自动处理;若告警状态在10分钟内恢复正常,也就是Java线程数下降到30以下,自动化“重启10.10.10.1节点的Tomcat应用服务器”将不会被执行,反之则在第10分钟执行该自动化进行故障处理;执行自动化“重启10.10.10.1节点的Tomcat应用服务器”后,若告警状态在10分钟内恢复正常,也就是Java线程数下降到30以下,系统认定自动化处理有效,自动关闭告警及事件,反之则认定自动化处理无效,将通过短信、微信等方式通知运维人员人工进行干预。
本领域技术人员知道,除了以纯计算机可读程序代码方式实现本发明提供的系统、装置及其各个模块以外,完全可以通过将方法步骤进行逻辑编程来使得本发明提供的系统、装置及其各个模块以逻辑门、开关、专用集成电路、可编程逻辑控制器以及嵌入式微控制器等的形式来实现相同程序。所以,本发明提供的系统、装置及其各个模块可以被认为是一种硬件部件,而对其内包括的用于实现各种程序的模块也可以视为硬件部件内的结构;也可以将用于实现各种功能的模块视为既可以是实现方法的软件程序又可以是硬件部件内的结构。
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变化或修改,这并不影响本发明的实质内容。在不冲突的情况下,本申请的实施例和实施例中的特征可以任意相互组合。
Claims (8)
1.一种可配置的故障自动化处理方法,其特征在于,包括:
抽取可配置参数步骤:针对故障自动化处理的场景抽取可配置参数;
第一观察告警状态步骤:在故障发生后的设定时间内持续观察故障的状态,若设定时间内故障的状态持续异常,则触发故障自动化处理,否则,则不触发故障自动化处理;
自动化处理步骤:对故障进行故障自动化处理;
第二观察告警状态步骤:在故障自动化处理完成后,持续观察故障的状态,若故障的状态恢复正常,则确认故障自动化处理有效,触发关闭告警及事件,若故障的状态持续异常,则确认故障自动化处理无效,生成处理结果;
关闭告警及事件步骤:关闭告警及事件,故障解除;
汇报处理结果步骤:将处理结果发送至运维角色,进一步进行人工干预。
2.根据权利要求1所述的可配置的故障自动化处理方法,其特征在于,所述可配置参数主要包括启动时间、自动化类型、自动化名称、关闭告警及事件时间中的任一种或任多种。
3.根据权利要求2所述的可配置的故障自动化处理方法,其特征在于,所述启动时间是故障发生时启动执行故障自动化处理的时间。
4.根据权利要求2所述的可配置的故障自动化处理方法,其特征在于,所述自动化类型是故障发生时调用的自动化流程及脚本的类型,主要包括全局资源级自动化、应用级自动化、仅自动关闭告警及事件中的任一种或任多种。
5.根据权利要求2所述的可配置的故障自动化处理方法,其特征在于,所述自动化名称是故障发生时执行的自动化流程及脚本的名称。
6.根据权利要求2所述的可配置的故障自动化处理方法,其特征在于,所述关闭告警及事件时间是执行自动化流程及脚本进行故障处理后等待故障状态恢复的时间。
7.一种可配置的故障自动化处理系统,其特征在于,包括:
抽取可配置参数模块:针对故障自动化处理的场景抽取可配置参数;
第一观察告警状态模块:在故障发生后的设定时间内持续观察故障的状态,若设定时间内故障的状态持续异常,则触发故障自动化处理,否则,则不触发故障自动化处理;
自动化处理模块:对故障进行故障自动化处理;
第二观察告警状态模块:在故障自动化处理完成后,持续观察故障的状态,若故障的状态恢复正常,则确认故障自动化处理有效,触发关闭告警及事件,若故障的状态持续异常,则确认故障自动化处理无效,生成处理结果;
关闭告警及事件模块:关闭告警及事件,故障解除;
汇报处理结果模块:将处理结果发送至运维角色,进一步进行人工干预。
8.一种存储有计算机程序的计算机可读存储介质,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811260064.XA CN111104237A (zh) | 2018-10-26 | 2018-10-26 | 可配置的故障自动化处理方法和系统及计算机存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811260064.XA CN111104237A (zh) | 2018-10-26 | 2018-10-26 | 可配置的故障自动化处理方法和系统及计算机存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111104237A true CN111104237A (zh) | 2020-05-05 |
Family
ID=70418915
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811260064.XA Pending CN111104237A (zh) | 2018-10-26 | 2018-10-26 | 可配置的故障自动化处理方法和系统及计算机存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111104237A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112330180A (zh) * | 2020-11-17 | 2021-02-05 | 深圳市智象科技有限公司 | 一种灵活配置的自动作业系统 |
CN112579574A (zh) * | 2020-12-25 | 2021-03-30 | 上海交通大学 | 一种基于事件日志的可配置流程挖掘方法及系统 |
CN113572637A (zh) * | 2021-07-16 | 2021-10-29 | 中盈优创资讯科技有限公司 | 一种网络故障自动化预处理方法及装置 |
CN115471958A (zh) * | 2021-06-10 | 2022-12-13 | 深圳市怡化时代科技有限公司 | 长按键的处理方法、装置、设备和介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105550012A (zh) * | 2015-12-07 | 2016-05-04 | 国云科技股份有限公司 | 一种自定义恢复故障虚拟机的方法 |
CN108092836A (zh) * | 2016-11-21 | 2018-05-29 | 深圳市蓝希领地科技有限公司 | 一种服务器的监控方法及装置 |
CN108429629A (zh) * | 2017-02-14 | 2018-08-21 | 腾讯科技(深圳)有限公司 | 设备故障恢复方法和装置 |
-
2018
- 2018-10-26 CN CN201811260064.XA patent/CN111104237A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105550012A (zh) * | 2015-12-07 | 2016-05-04 | 国云科技股份有限公司 | 一种自定义恢复故障虚拟机的方法 |
CN108092836A (zh) * | 2016-11-21 | 2018-05-29 | 深圳市蓝希领地科技有限公司 | 一种服务器的监控方法及装置 |
CN108429629A (zh) * | 2017-02-14 | 2018-08-21 | 腾讯科技(深圳)有限公司 | 设备故障恢复方法和装置 |
Non-Patent Citations (1)
Title |
---|
朱庆保 等: "《微型计算机系统及接口应用技术》", vol. 1, 31 October 1997, 南京大学出版社, pages: 332 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112330180A (zh) * | 2020-11-17 | 2021-02-05 | 深圳市智象科技有限公司 | 一种灵活配置的自动作业系统 |
CN112579574A (zh) * | 2020-12-25 | 2021-03-30 | 上海交通大学 | 一种基于事件日志的可配置流程挖掘方法及系统 |
CN115471958A (zh) * | 2021-06-10 | 2022-12-13 | 深圳市怡化时代科技有限公司 | 长按键的处理方法、装置、设备和介质 |
CN115471958B (zh) * | 2021-06-10 | 2023-11-10 | 深圳市怡化时代科技有限公司 | 长按键的处理方法、装置、设备和介质 |
CN113572637A (zh) * | 2021-07-16 | 2021-10-29 | 中盈优创资讯科技有限公司 | 一种网络故障自动化预处理方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111104237A (zh) | 可配置的故障自动化处理方法和系统及计算机存储介质 | |
CN107515796B (zh) | 一种设备异常监控处理方法及装置 | |
EP2940596B1 (en) | Data acquisition method and device | |
CN108710544B (zh) | 一种数据库系统的进程监控方法及轨道交通综合监控系统 | |
CN105653425B (zh) | 基于复杂事件处理引擎的监控系统 | |
CN109286529B (zh) | 一种恢复RabbitMQ网络分区的方法及系统 | |
CN111209110B (zh) | 一种实现负载均衡的任务调度管理方法、系统和存储介质 | |
CN109656742B (zh) | 一种节点异常处理方法、装置及存储介质 | |
EP2437430A1 (en) | Method and system for switching main/standby boards | |
CN103152419A (zh) | 一种云计算平台的高可用集群管理方法 | |
WO2018019242A1 (zh) | 网站服务器的自恢复方法和自恢复系统 | |
CN101996106A (zh) | 一种对软件运行状态进行监控的方法 | |
WO2017107656A1 (zh) | 虚拟化网元故障自愈方法及装置 | |
CN111538585B (zh) | 一种基于node.js的服务器进程调度方法、系统和装置 | |
CN111371599A (zh) | 一种基于etcd的集群容灾管理系统 | |
CN110268378B (zh) | 创建数据备份的方法、存储介质和虚拟服务器 | |
CN111258591A (zh) | 程序部署任务执行方法、装置、计算机设备和存储介质 | |
CN116055285A (zh) | 一种工控系统的进程管理方法及系统 | |
CN107870777A (zh) | 一种热补丁实现方法及装置、终端 | |
CN111538738B (zh) | 服务升级方法、装置、电子设备及存储介质 | |
JP6421516B2 (ja) | サーバ装置、冗長構成サーバシステム、情報引継プログラム及び情報引継方法 | |
CN111737060A (zh) | 处理组件异常的方法、装置及电子设备 | |
CN109684117B (zh) | 处理器死机恢复方法和装置 | |
CN113835966B (zh) | 服务进程管理方法、装置、存储系统以及存储介质 | |
CN113608750B (zh) | 监控组件的部署方法、装置、计算机设备以及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |