CN112131088A - 一种基于健康检查和容器的高可用方法 - Google Patents
一种基于健康检查和容器的高可用方法 Download PDFInfo
- Publication number
- CN112131088A CN112131088A CN202011045239.2A CN202011045239A CN112131088A CN 112131088 A CN112131088 A CN 112131088A CN 202011045239 A CN202011045239 A CN 202011045239A CN 112131088 A CN112131088 A CN 112131088A
- Authority
- CN
- China
- Prior art keywords
- application
- container
- flow
- health
- standby
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 39
- 230000036541 health Effects 0.000 title claims abstract description 36
- 238000013508 migration Methods 0.000 claims abstract description 16
- 230000005012 migration Effects 0.000 claims abstract description 16
- 239000011159 matrix material Substances 0.000 claims abstract description 8
- 230000008569 process Effects 0.000 claims description 19
- 238000012544 monitoring process Methods 0.000 claims description 13
- 230000002085 persistent effect Effects 0.000 claims description 5
- 230000001360 synchronised effect Effects 0.000 claims description 3
- 230000003862 health status Effects 0.000 claims 1
- 238000005516 engineering process Methods 0.000 description 19
- 238000011084 recovery Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3452—Performance evaluation by statistical analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/1675—Temporal synchronisation or re-synchronisation of redundant processing components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2023—Failover techniques
- G06F11/203—Failover techniques using migration
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3055—Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3058—Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/32—Monitoring with visual or acoustical indication of the functioning of the machine
- G06F11/324—Display of status information
- G06F11/327—Alarm or error message display
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Probability & Statistics with Applications (AREA)
- Computer Hardware Design (AREA)
- Hardware Redundancy (AREA)
Abstract
本发明涉及一种基于健康检查和容器的高可用方法,其中,包括:步骤1、采集当前时间点的数据;步骤2、如果采集的时间点个数小于p,则表示样本数不够,等待时间间隔T后进入步骤1,如果采集的时间点个数大于等于p,则进入步骤3;步骤3、删除多余的历史样本,保留p个时间点的样本数据,以p为行数,以关键数据n为列数构建p*n矩阵;步骤4、统计矩阵每列超过和低于健康状态参考范围的时间点次数;步骤5、若超过和低于健康状态范围的时间点次数大于k1且小于k2,则认为进入亚健康状态并提示告警,若次数大于k2则认为计算机临界故障,需要进行业务迁移。
Description
技术领域
本发明涉及高可用系统,特别涉及基于健康检查和容器的高可用系统。
背景技术
当前较为热门的高可用技术主要分为以下几种:单机冗余技术、双机热备技术以及虚拟机高可用容错技术。单机冗余技术通过增加冗余硬件提高自身的可靠性;双机热备技术采用在两台物理节点冗余运行相同的软件提供高可用支撑,但大多是为某类服务进行的设计,用户难以二次开发和部署;虚拟机高可用容错技术使用商用高可用软件和虚拟机迁移技术实现业务迁移,但是这种方法的高可用软件本身的开销较大,且主流的高可用软件均用于如web服务等请求响应的应用类型,不支持有流程的业务。
在军用领域中,应用软件如轨道计算、资源筹划等往往是有流程的,一旦发生故障再次启动需要重新进行计算,过程极为耗时。为满足军用计算机高可用需求,需要设计出一种支持有流程应用的高可用系统,能够保证业务迁移前后应用软件流程和数据不丢失,并兼顾检测的智能性、高可用软件的开销和用户应用软件部署的灵活性等多项要素。
发明内容
本发明的目的在于提供一种基于健康检查和容器的高可用方法,用于解决高可用系统业务迁移前后流程和数据同步问题。
本发明一种基于健康检查和容器的高可用方法,其中,包括:步骤1、采集当前时间点的数据;步骤2、如果采集的时间点个数小于p,则表示样本数不够,等待时间间隔T后进入步骤1,如果采集的时间点个数大于等于p,则进入步骤3;步骤3、删除多余的历史样本,保留p个时间点的样本数据,以p为行数,以关键数据n为列数构建p*n矩阵;步骤4、统计矩阵每列超过和低于健康状态参考范围的时间点次数;步骤5、若超过和低于健康状态范围的时间点次数大于k1且小于k2,则认为进入亚健康状态并提示告警,若次数大于k2则认为计算机临界故障,需要进行业务迁移;在主备两台物理机同步实现过程包括:步骤a、读取配置文件获取当前调用者是否为主应用容器;若为主应用容器则进入步骤b,否则进入步骤c;步骤b、主应用向备应用发送通告,告知对方当前所处流程,并等待备应用返回备应用的执行流程,主应用对比两者流程是否一致,根据对比结果通知主应用是否继续执行或等待备应用执行到相同流程;步骤c、备应用收到通告后向主应用发送自身流程,并比对二者流程是否一致,若备应用比主应用执行慢,则备应用继续执行直到与主应用所处流程一致,之后备应用向主应用发送通告,告知对方已执行到相同流程;若备应用执行的流程先于主应用,则通知被应用等待一段时间,直到主应用也处理到相同流程。
根据本发明的基于健康检查和容器的高可用方法的一实施例,其中,采集的电压、电流以及温度数据作为所述故障预警的输入,将BMC历史监控数据进行分析评估当前计算机的健康状态提前发现故障。
根据本发明的基于健康检查和容器的高可用方法的一实施例,其中,关键数据n包括:电压、电流以及温度。
根据本发明的基于健康检查和容器的高可用方法的一实施例,其中,若是硬件故障迁移控制先后调用虚拟IP漂移控制和网络流量控制,将虚拟IP的所有权绑定在备份物理机上,将业务的运行环境搬至备份物理机上,之后开放备份节点的输出。
根据本发明的基于健康检查和容器的高可用方法的一实施例,其中,若是应用容器故障,则调用网络流量控制,停止主应用容器的输出,开放备份应用容器的输出。
根据本发明的基于健康检查和容器的高可用方法的一实施例,其中,主备两台物理机均部署数据库,备份物理机实时查询主物理机的持久化数据。
根据本发明的基于健康检查和容器的高可用方法的一实施例,其中,主应用通过API操作传入当前执行的流程。
本发明提供一种基于健康检查和容器技术的高可用系统设计方法,使用健康检查技术,通过进程监控和BMC模块对软硬件进行监控并根据历史健康数据进行故障预警,可针对不同故障原因执行不同的恢复策略。使用容器技术隔离用户应用程序,在不同物理节点中冗余运行应用程序的容器并同步应用程序的处理流程和数据,在故障产生后快速回复业务,保证业务的连续性、降低高可用软件的开销和提高检测的智能性并方便用户软件的部署。
附图说明
图1为一种基于健康检查和容器的高可用系统图。
具体实施方式
为使本发明的目的、内容、和优点更加清楚,下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。
图1为一种基于健康检查和容器的高可用系统图,如图1所示,为本发明实际部署示意图。高可用系统以容器为最小节点单元,部署热备容器,通过物理机1以及物理机2配置所述虚拟IP,冗余运行相同的应用容器。
本发明提供了一种基于健康检查和容器技术的高可用系统,利用包括进程监控和BMC模块的健康检查机制和容器技术,使故障产生时业务能够在两台计算机间的快速迁移,迁移前后应用软件流程和数据不丢失。所述系统包括:
健康检查、故障预警、虚拟IP、虚拟IP漂移控制、容器热备、网络数据控制、迁移控制、数据同步。所述健康检查,是指采用BMC模块和进程监控对当前计算机运行状态实时检查。所述故障预警,是将BMC历史监控数据进行分析,评估当前计算机的健康状态提前发现故障。所述虚拟IP,是指通过VRRP实现的高可用系统对外通信的唯一IP。所述虚拟IP漂移控制,是指控制虚拟IP绑定在主物理机或者备物理机上。所述容器热备,是将用户应用程序运行在容器内,以容器作为高可用系统的节点单元,在两台物理节点上冗余运行相同的应用容器,同一时间只有主应用容器可以对外输出。所述网络数据控制,包括流入数据复制和流出数据控制。所述迁移控制,是高可用系统根据故障类型决定是进行虚拟IP漂移或是应用容器对外输出的切换控制。所述数据同步,是指采用数据库同步技术同步持久化数据和提供API接口给用户实现主备应用的流程同步。
故障的感知采用所述健康检查,通过BMC模块和进程监控对当前计算机运行状态实时检查。BMC模块实时采集计算机内部芯片的关键电压、电流、温度等信息;进程监控包括用户应用容器的监控、容器服务的监控和关键支撑服务的监控,BMC采集的关键数据和进程监控状态实时上报给健康检查守护进程,作为软硬件故障判断的依据。
BMC模块采集的电压、电流、温度等数据同时也作为所述故障预警的输入,故障预警将BMC历史监控数据进行分析评估当前计算机的健康状态提前发现故障。故障预警功能执行流程如下:
采集当前时间点关键数据
如果采集的时间点个数小于p,则表示样本数不够,等待时间间隔T后进入步骤1。如果采集的时间点个数大于等于p,则进入步骤3;
删除多余的历史样本,只保留p个时间点的样本数据,以p为行数,以电压、电流、温度等关键数据n为列数构建p*n矩阵;
统计矩阵每列超过和低于健康状态参考范围的时间点次数;
若超过和低于健康状态范围的时间点次数大于k1且小于k2,则认为进入亚健康状态并提示告警,若次数大于k2则认为计算机临界故障,需要进行业务迁移。
由于硬件故障恢复时间远大于应用容器故障恢复时间,需要区分对待,根据故障类型所述迁移控制采用不同的恢复策略。若是硬件故障迁移控制先后调用所述虚拟IP漂移控制和所述网络流量控制,先将虚拟IP的所有权绑定在备份物理机上,将业务的运行环境搬至备份物理机上,之后开放备份节点的输出;若是应用容器故障,则仅调用网络流量控制,停止主应用容器的输出,开放备份应用容器的输出。
业务迁移前后流程和数据的一致性由所述数据同步实现,数据同步分别采用数据库同步技术同步持久化数据和提供API接口给用户实现主备应用的流程同步。主备两台物理机均部署数据库,备份物理机实时查询主物理机的持久化数据,保证业务迁移前后历史数据的一致性;对于关键流程的同步问题,本发明设计了API接口供用户在执行关键流程时调用,流程同步功能实现步骤如下:
流程同步模块读取配置文件获取当前调用者是否为主应用容器;若为主应用容器则进入步骤2,否则进入步骤3
主应用通过API向流程模块传入当前执行的流程,主应用调用的流程同步模块向备应用调用的流程同步模块发送通告,告知对方当前所处流程,并等待备应用流程同步模块返回备应用的执行流程,主应用调用的流程同步模块对比两者流程是否一致,根据对比结果通知主应用是否继续执行或等待备应用执行到相同流程。
备应用调用的流程控制模块收到通告后向主应用调用的流程控制模块发送自身流程,并比对二者流程是否一致,若备应用比主应用执行慢则备应用继续执行直到与主应用所处流程一致,之后备应用调用的流程同步模块向主应用调用的流程同步模块发送通告,告知对方已执行到相同流程;若备应用执行的流程先于主应用,则通知被应用等待一段时间,直到主应用也处理到相同流程。
本发明通过容器技术提高了应用程序部署的灵活性并降低了部署成本。通过所述网络流量控制,使用流量复制和端口映射的方式将访问主节点应用容器的网络数据复制到备节点的应用容器,使两个相同的应用容器拥有相同的输入,同时控制网络数据输出,开放主应用容器输出、屏蔽备应用输出。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变形,这些改进和变形也应视为本发明的保护范围。
Claims (7)
1.一种基于健康检查和容器的高可用方法,其特征在于,包括:
步骤1、采集当前时间点的数据;
步骤2、如果采集的时间点个数小于p,则表示样本数不够,等待时间间隔T后进入步骤1,如果采集的时间点个数大于等于p,则进入步骤3;
步骤3、删除多余的历史样本,保留p个时间点的样本数据,以p为行数,以关键数据n为列数构建p*n矩阵;
步骤4、统计矩阵每列超过和低于健康状态参考范围的时间点次数;
步骤5、若超过和低于健康状态范围的时间点次数大于k1且小于k2,则认为进入亚健康状态并提示告警,若次数大于k2则认为计算机临界故障,需要进行业务迁移;
在主备两台物理机同步实现过程包括:
步骤a、读取配置文件获取当前调用者是否为主应用容器;若为主应用容器则进入步骤b,否则进入步骤c;
步骤b、主应用向备应用发送通告,告知对方当前所处流程,并等待备应用返回备应用的执行流程,主应用对比两者流程是否一致,根据对比结果通知主应用是否继续执行或等待备应用执行到相同流程;
步骤c、备应用收到通告后向主应用发送自身流程,并比对二者流程是否一致,若备应用比主应用执行慢,则备应用继续执行直到与主应用所处流程一致,之后备应用向主应用发送通告,告知对方已执行到相同流程;若备应用执行的流程先于主应用,则通知被应用等待一段时间,直到主应用也处理到相同流程。
2.如权利要求1所述的基于健康检查和容器的高可用方法,其特征在于,采集的电压、电流以及温度数据作为所述故障预警的输入,将BMC历史监控数据进行分析评估当前计算机的健康状态提前发现故障。
3.如权利要求1所述的基于健康检查和容器的高可用方法,其特征在于,关键数据n包括:电压、电流以及温度。
4.如权利要求1所述的基于健康检查和容器的高可用方法,其特征在于,若是硬件故障迁移控制先后调用虚拟IP漂移控制和网络流量控制,将虚拟IP的所有权绑定在备份物理机上,将业务的运行环境搬至备份物理机上,之后开放备份节点的输出。
5.如权利要求4所述的基于健康检查和容器的高可用方法,其特征在于,若是应用容器故障,则调用网络流量控制,停止主应用容器的输出,开放备份应用容器的输出。
6.如权利要求1所述的基于健康检查和容器的高可用方法,其特征在于,主备两台物理机均部署数据库,备份物理机实时查询主物理机的持久化数据。
7.如权利要求1所述的基于健康检查和容器的高可用方法,其特征在于,主应用通过API操作传入当前执行的流程。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011045239.2A CN112131088B (zh) | 2020-09-29 | 2020-09-29 | 一种基于健康检查和容器的高可用方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011045239.2A CN112131088B (zh) | 2020-09-29 | 2020-09-29 | 一种基于健康检查和容器的高可用方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112131088A true CN112131088A (zh) | 2020-12-25 |
CN112131088B CN112131088B (zh) | 2024-04-09 |
Family
ID=73844402
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011045239.2A Active CN112131088B (zh) | 2020-09-29 | 2020-09-29 | 一种基于健康检查和容器的高可用方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112131088B (zh) |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101707530A (zh) * | 2009-10-12 | 2010-05-12 | 南京联创科技集团股份有限公司 | 可动态配置容灾粒度的业务系统应用级容灾方法 |
CN103049348A (zh) * | 2012-12-21 | 2013-04-17 | 四川川大智胜软件股份有限公司 | 多服务器化环境下数据容错存储的方法 |
CN104199747A (zh) * | 2014-08-15 | 2014-12-10 | 中国船舶重工集团公司第七0九研究所 | 基于健康管理的高可用系统实现方法及系统 |
CN104391764A (zh) * | 2014-10-22 | 2015-03-04 | 上海海得控制系统股份有限公司 | 一种计算机容错方法及系统 |
CN106027328A (zh) * | 2016-05-13 | 2016-10-12 | 深圳市中润四方信息技术有限公司 | 一种基于应用容器部署的集群监控的方法及系统 |
CN106487644A (zh) * | 2015-08-28 | 2017-03-08 | 中国移动通信集团公司 | 一种通信方法和系统 |
US20180089349A1 (en) * | 2016-03-08 | 2018-03-29 | Az, Llc | Virtualization, visualization and autonomous design & development of objects |
CN108270726A (zh) * | 2016-12-30 | 2018-07-10 | 杭州华为数字技术有限公司 | 应用实例部署方法及装置 |
CN110520843A (zh) * | 2017-03-23 | 2019-11-29 | Dh2I公司 | 集群环境中高度可用的有状态容器 |
CN110784350A (zh) * | 2019-10-25 | 2020-02-11 | 北京计算机技术及应用研究所 | 一种实时可用集群管理系统的设计方法 |
CN111046051A (zh) * | 2019-11-08 | 2020-04-21 | 网联清算有限公司 | 数据一致性实现方法、装置及存储介质 |
CN111290834A (zh) * | 2020-01-21 | 2020-06-16 | 苏州浪潮智能科技有限公司 | 一种基于云管理平台实现业务高可用的方法、装置及设备 |
-
2020
- 2020-09-29 CN CN202011045239.2A patent/CN112131088B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101707530A (zh) * | 2009-10-12 | 2010-05-12 | 南京联创科技集团股份有限公司 | 可动态配置容灾粒度的业务系统应用级容灾方法 |
CN103049348A (zh) * | 2012-12-21 | 2013-04-17 | 四川川大智胜软件股份有限公司 | 多服务器化环境下数据容错存储的方法 |
CN104199747A (zh) * | 2014-08-15 | 2014-12-10 | 中国船舶重工集团公司第七0九研究所 | 基于健康管理的高可用系统实现方法及系统 |
CN104391764A (zh) * | 2014-10-22 | 2015-03-04 | 上海海得控制系统股份有限公司 | 一种计算机容错方法及系统 |
CN106487644A (zh) * | 2015-08-28 | 2017-03-08 | 中国移动通信集团公司 | 一种通信方法和系统 |
US20180089349A1 (en) * | 2016-03-08 | 2018-03-29 | Az, Llc | Virtualization, visualization and autonomous design & development of objects |
CN106027328A (zh) * | 2016-05-13 | 2016-10-12 | 深圳市中润四方信息技术有限公司 | 一种基于应用容器部署的集群监控的方法及系统 |
CN108270726A (zh) * | 2016-12-30 | 2018-07-10 | 杭州华为数字技术有限公司 | 应用实例部署方法及装置 |
CN110520843A (zh) * | 2017-03-23 | 2019-11-29 | Dh2I公司 | 集群环境中高度可用的有状态容器 |
CN110784350A (zh) * | 2019-10-25 | 2020-02-11 | 北京计算机技术及应用研究所 | 一种实时可用集群管理系统的设计方法 |
CN111046051A (zh) * | 2019-11-08 | 2020-04-21 | 网联清算有限公司 | 数据一致性实现方法、装置及存储介质 |
CN111290834A (zh) * | 2020-01-21 | 2020-06-16 | 苏州浪潮智能科技有限公司 | 一种基于云管理平台实现业务高可用的方法、装置及设备 |
Non-Patent Citations (2)
Title |
---|
朱震杰, 高有行, 张慧慧, 王海波: "基于软件同步的远程应用级容灾系统的研究与实现", 世界电信, no. 10, 20 October 2005 (2005-10-20), pages 35 - 39 * |
邱红飞;黄春光;: "容器管理平台测试标准研究与应用", 现代计算机(专业版), no. 34, pages 80 - 84 * |
Also Published As
Publication number | Publication date |
---|---|
CN112131088B (zh) | 2024-04-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Castelli et al. | Proactive management of software aging | |
US8020041B2 (en) | Method and computer system for making a computer have high availability | |
CN1175353C (zh) | 一种双机备份的实现方法 | |
WO2017067484A1 (zh) | 一种虚拟化数据中心调度系统和方法 | |
CN101023411A (zh) | 用于最小化计算机应用程序中的丢失的方法和系统 | |
CN110177020A (zh) | 一种基于Slurm的高性能集群管理方法 | |
US7730029B2 (en) | System and method of fault tolerant reconciliation for control card redundancy | |
CN109286529A (zh) | 一种恢复RabbitMQ网络分区的方法及系统 | |
CN104391764A (zh) | 一种计算机容错方法及系统 | |
KR100293797B1 (ko) | 분산운영시스템에서링크된프로세서의체인을해제시키는방법및시스템 | |
US7373542B2 (en) | Automatic startup of a cluster system after occurrence of a recoverable error | |
CN112948063A (zh) | 云平台的创建方法、装置、云平台以及云平台实现系统 | |
Lyu et al. | Software fault tolerance in a clustered architecture: Techniques and reliability modeling | |
Ngo et al. | Tolerating slowdowns in replicated state machines using copilots | |
CN103559188A (zh) | 元数据管理方法及管理系统 | |
CN103593251A (zh) | 一种基于进程冗余的容错系统及其设计方法 | |
CN112131088B (zh) | 一种基于健康检查和容器的高可用方法 | |
CN105988885B (zh) | 基于补偿回滚的操作系统故障自恢复方法 | |
Sun et al. | A generic availability model for clustered computing systems | |
CN107147733A (zh) | 基于soa的服务恢复方法 | |
EP4361817A1 (en) | 2*2oo2 security system based on cloud platform | |
Shin et al. | Fault-tolerance in real-time systems | |
Cristian | Basic concepts and issues in fault-tolerant distributed systems | |
CN115549751B (zh) | 遥感卫星地面站监控系统和方法 | |
Gaur et al. | Comparative Analysis of Fault Tolerance Techniques in Cloud Computing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |