CN111966469A - 一种集群虚拟机高可用方法及系统 - Google Patents

一种集群虚拟机高可用方法及系统 Download PDF

Info

Publication number
CN111966469A
CN111966469A CN202010922076.5A CN202010922076A CN111966469A CN 111966469 A CN111966469 A CN 111966469A CN 202010922076 A CN202010922076 A CN 202010922076A CN 111966469 A CN111966469 A CN 111966469A
Authority
CN
China
Prior art keywords
availability
virtual machine
node
detection
computing node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010922076.5A
Other languages
English (en)
Other versions
CN111966469B (zh
Inventor
魏传程
胡玉鹏
李红卫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202010922076.5A priority Critical patent/CN111966469B/zh
Publication of CN111966469A publication Critical patent/CN111966469A/zh
Application granted granted Critical
Publication of CN111966469B publication Critical patent/CN111966469B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/45575Starting, stopping, suspending or resuming virtual machine instances
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/45595Network integration; Enabling network access in virtual machine instances

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Hardware Redundancy (AREA)

Abstract

本发明提供一种集群虚拟机高可用方法及系统,包括:控制节点定时自动触发计算节点进行故障模拟操作,所述故障模拟操作包括:虚拟机分配操作和资源模拟调度操作;控制节点根据故障模拟操作更新高可用事件并将所述高可用事件下发到对应的计算节点;根据网络检测、共享存储检测、服务状态检测和代理虚拟机检测设置高可用触发条件;出现故障的计算节点达到高可用触发条件后并执行高可用操作、上报高可用执行结果以及更新高可用状态。本发明优化了Openstack云平台高可用的流程,提高了高可用执行可靠性。

Description

一种集群虚拟机高可用方法及系统
技术领域
本发明属于云平台技术领域,具体涉及一种集群虚拟机高可用方法及系统。
背景技术
在数据横流的大环境下,持续稳定地访问数据是业务进行的必备条件,在Openstack云平台中,对于主机高可用有了越来越多的实现方案,可以在发生计算节点硬件故障时,通过一系列的判断、调度、执行过程,将该计算节点运行的虚拟机在其他计算节点上重启,以减小虚拟机停机时间,减少业务中断,从而实现主机高可用。
高可用性集群是共同为客户机提供网络资源的一组计算机系统,其中每一台提供服务的计算机称为节点,当一个节点故障时,该请求会及时转到另外的可用节点来处理,
但是当前主机高可用方案存在普遍如下缺陷:
(1)普遍采用了Openstack原生提供的evacuate方案,需经过多个模块交互、调度和执行、步骤复杂,且依赖于云平台控制层面,当云平台控制层面存在不稳定时,出现高可用切换失败的概率很大,当发生主机高可用事件时,可能会有多个并发任务执行,造成任务执行失败;
(2)在正常运行状态下缺乏对高可用条件的判断和检测,无法保障当主机发生故障时主机高可用的执行结果。
发明内容
针对现有技术的上述不足,本发明提供一种集群虚拟机高可用方法及系统,以解决上述技术问题。
第一方面,本发明提供一种集群虚拟机高可用方法,包括:
控制节点定时自动触发计算节点进行故障模拟操作,所述故障模拟操作包括:虚拟机分配操作和资源模拟调度操作;
控制节点根据故障模拟操作更新高可用事件并将所述高可用事件下发到对应的计算节点;
根据网络检测、共享存储检测、服务状态检测和代理虚拟机检测设置高可用触发条件;
出现故障的计算节点达到高可用触发条件后并执行高可用操作、上报高可用执行结果以及更新高可用状态。
进一步的,所述方法还包括:
控制节点的各个模块进行交互,获取当前集群内所有计算节点资源;
在云平台创建资源后,定时自动触发控制节点进行故障模拟操作;
当故障模拟过程出现虚拟机无法分配或资源不足时,提示管理员并给出资源调整建议。
进一步的,所述方法还包括:
判断网络检测、共享存储检测、服务状态检测和代理虚拟机检测之间的权重规则;
根据权重规则中判断是否达到高可用触发条件。
进一步的,所述虚拟机分配操作包括:
将每个虚拟机分配到虚拟机剩余资源最大或最小的计算节。
进一步的,所述资源模拟调度操作包括:
对虚拟机的资源进行逐个分配,筛选出能满足条件的计算节点,最后在能满足条件的计算节点中,随机或者按照虚拟机分配操作的方式选出一个计算节点进行资源调度。
进一步的,所述出现故障的计算节点达到高可用触发条件后并执行高可用操作、上报高可用执行结果以及更新高可用状态,包括:
达到高可用触发条件后自动执行高可用操作,将故障主机的虚拟机分配到指定的计算节点并进行资源调度后,故障虚拟机重启动;
所有计算节点将高可用执行结果上报至控制节点;
控制节点交互所有高可用执行结果并同步更新所有计算节点的高可用状态。
进一步的,所述方法还包括:
计算节点上的虚拟机由于资源之外的原因导致重启动失败时,则将失败上报至控制节点;
由控制节点根据所述资源模拟调度操作重新指定新的节点进行重调度,并设置重新调度次数。
进一步的,所述方法还包括:
当云平台出现计算节点状态变化时触发所述模拟调度操作,所述计算节点状态变化包括:计算节点上线、离线、移出集群、增加或减少资源。
第二方面,本发明提供一种集群虚拟机高可用系统,包括:
高可用服务模块,配置用于定时自动触发计算节点进行故障模拟操作、同步和下发高可用事件以及与执行控制节点内模块的交互;
高可用代理模块,配置用于接收并执行高可用事件、上报高可用执行结果以及更新高可用状态;
高可用事件检测模块,配置用于设置并执行高可用触发条件。
本发明的有益效果在于,
本发明提供的一种集群虚拟机高可用方法及系统,针对Openstack云平台实现了:
通过定时模拟故障流程,根据实际情况更新高可用事件,保障了在高可用发生时不会因资源不足而导致失败;
通过预先下发高可用事件,减小了高可用执行时对控制层面的依赖,而且精简了高可用执行步骤,使高可用执行过程更加可靠;
通过引入单独的HA模块单独处理HA事件,将高可用执行功能下放到计算节点;各个计算节点单独执行高可用事件动作,不必完全依赖控制层面,从而提高了高可用的执行可靠性。
此外,本发明设计原理可靠,结构简单,具有非常广泛的应用前景。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一个实施例的方法的示意性流程图。
图2是本发明一个实施例的方法的模块部署及执行示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
下面对本发明中出现的关键术语进行解释:
计算节点(compute):Openstack云平台中用于运行创建虚拟机的节点,运行宿主机和代理服务。
宿主机(Hypervisior):提供虚拟机运行环境的服务器;
控制节点(controller):O penstack云平台中用于运行调度和管理功能等服务节点,通过代理器管理计算节点,是不同于计算节点之外的服务器。
高可用:通常的HA包括资源预留、节点预留两种方式。资源预留方式即在集群中预留一定百分比的资源用于HA,节点预留即预留部分节点处于备用状态,不运行虚拟机,当出现高可用事件时,将故障主机的虚拟机迁移至该备用主机。
图1是本发明一个实施例的方法的示意性流程图。其中,图1执行主体可以为一种集群虚拟机高可用系统。
如图1所示,该方法包括:
步骤110,控制节点定时自动触发计算节点进行故障模拟操作,所述故障模拟操作包括:虚拟机分配操作和资源模拟调度操作;
步骤120,控制节点根据故障模拟操作更新高可用事件并将所述高可用事件下发到对应的计算节点;
步骤130,根据网络检测、共享存储检测、服务状态检测和代理虚拟机检测设置高可用触发条件;
步骤140,出现故障的计算节点达到高可用触发条件后并执行高可用操作、上报高可用执行结果以及更新高可用状态。
进一步的,所述方法还包括:
控制节点的各个模块进行交互,获取当前集群内所有计算节点资源;
在云平台创建资源后,定时自动触发控制节点进行故障模拟操作;
当故障模拟过程出现虚拟机无法分配或资源不足时,提示管理员并给出资源调整建议。
可选地,作为本发明一个实施例,所述方法还包括:
判断网络检测、共享存储检测、服务状态检测和代理虚拟机检测之间的权重规则;
根据权重规则中判断是否达到高可用触发条件。
可选地,作为本发明一个实施例,所述虚拟机分配操作包括:
将每个虚拟机分配到虚拟机剩余资源最大或最小的计算节。
可选地,作为本发明一个实施例,所述资源模拟调度操作包括:
对虚拟机的资源进行逐个分配,筛选出能满足条件的计算节点,最后在能满足条件的计算节点中,随机或者按照虚拟机分配操作的方式选出一个计算节点进行资源调度。
可选地,作为本发明一个实施例,所述出现故障的计算节点达到高可用触发条件后并执行高可用操作、上报高可用执行结果以及更新高可用状态,包括:
达到高可用触发条件后自动执行高可用操作,将故障主机的虚拟机分配到指定的计算节点并进行资源调度后,故障虚拟机重启动;
所有计算节点将高可用执行结果上报至控制节点;
控制节点交互所有高可用执行结果并同步更新所有计算节点的高可用状态。
可选地,作为本发明一个实施例,所述方法还包括:
计算节点上的虚拟机由于资源之外的原因导致重启动失败时,则将失败上报至控制节点;
由控制节点根据所述资源模拟调度操作重新指定新的节点进行重调度,并设置重新调度次数。
可选地,作为本发明一个实施例,所述方法还包括:
当云平台出现计算节点状态变化时触发所述模拟调度操作,所述计算节点状态变化包括:计算节点上线、离线、移出集群、增加或减少资源。
为了便于对本发明的理解,下面以本发明一种集群虚拟机高可用方法的原理,结合实施例中对Openstack云平台进行管理的过程,对本发明提供的一种集群虚拟机高可用方法做进一步的描述。
具体的,所述一种集群虚拟机高可用方法包括:
在控制节点创建高可用服务模块,用于发现、同步和下发高可用事件、上报高可用工作状态以及与所在控制节点的其他模块交互;
在计算节点创建高可用代理模块,用于接受并执行高可用事件、上报高可用执行结果以及更新高可用状态;
在整个高可用系统创建高可用事件检测模块用于设置高可用触发条件,所述高可用事件检测模块包括:网络检测、共享存储检测、服务状态检测和代理虚拟机检测。
1、所述高可用服务模块执行如下过程:
高可用服务模块于控制节点的其他模块如应用程序接口模块、调度模块等模块进行交互,获取当前集群内所有计算节点资源信息,包括运行中的云主机、剩余资源等;
控制节点定时自动触发计算节点进行故障模拟操作,所述故障模拟操作包括:虚拟机分配操作和资源模拟调度操作,并将调度和分配结果保存;
之后将每个计算节点出现故障的情况时的操作任务全部下发到计算节点的高可用代理模块;
当出现故障模拟过程出现部分虚拟机无法分配或可调度资源不足时,对管理员进行提示,并给出资源调整建议。
2、所述高可用事件检测模块运行于计算节点和控制节点,有如下几种实现方式:
(1)通过网络检测:所有的高可用检测模块定时向整个网络中发送状态通告,并实时接收其他节点发送的状态通告;根据集群的配置,对集群中每个节点均保存一个状态记录信息;当某个节点发现自身记录的某个节点经过多次状态通告间隔没有发送状态通告时,将该节点状态置为离线状态,并将该信息发送给高可用服务模块高可用服务模块则会将该信息与其他节点的高可用事件检测模块发送的状态通告进行核实;当确认信息大于某个比例,则判断该节点为离线。高可用服务模块则发起HA动作;
(2)通过共享存储检测;所有计算节点的高可用检测模块将通过一个共享的光纤通道或者网络附属存储,共同向该共享存储中的某个文件定时写入状态。高可用服务模块则定时对该文件进行内容检测,若发现某个节点间隔多次的时间间隔没有写入,则判断该节点状态为离线,则高可用服务模块下发高可用操作;
(3)通过服务状态检测:此种方式为判断计算节点其他服务状态是否正常进行判断;Openstack云平台自身会对所有计算节点的服务进行检查,当计算节点核心服务状态为离线,则将该节点状态置为离线,从而发起高可用操作;
(4)通过代理虚拟机检测:通过在计算节点创建一个代理虚拟机,该虚拟机可直接与计算节点的高可用事件检测模块进行通信,报告自身运行状态。高可用事件检测模块则将该状态信息上报给高可用服务;当某个计算节点间隔多个上报周期不再上报时,则判断该节点为离线状态。
以上4种方式中,基于网络、共享存储的方式均可以采用多个网络平面或者多个共享存储的方式进行检测,减小判断错误的情况。同样的,此四种方式可用于各自组合,通过自定义的规则,设置判断权重,从而减小误判的可能。
3、所述高可用事件检测模块执行如下过程:
当出现节点故障需进行HA操作时,HA-server模块获取到HA事件后,通过云平台应用程序接口网络下发响应的执行指令到HA-agent。
达到高可用触发条件后自动执行高可用操作,将故障主机的虚拟机分配到指定的计算节点并进行资源调度后,故障虚拟机重启动;
所有计算节点将高可用执行结果上报至控制节点;
控制节点交互所有高可用执行结果并同步更新所有计算节点的高可用状态。
计算节点上的虚拟机由于资源之外的原因导致重启动失败时,则将失败上报至控制节点;
由控制节点根据所述资源模拟调度操作重新指定新的节点进行重调度,并设置重新调度次数避免无限重新调度,陷入死循环。
如图2所示,模拟了计算节点3故障后,虚拟机分布情况,当计算节点3故障后,高可用服务模块将下发指令到计算节点1、计算节点2根据模拟调度的结果直接开始进行高可用操作。
如图2示,该系统200包括:
第二方面,本发明提供一种集群虚拟机高可用系统,包括:
高可用服务模块,配置用于定时自动触发计算节点进行故障模拟操作、同步和下发高可用事件以及与执行控制节点内模块的交互;
高可用代理模块,配置用于接收并执行高可用事件、上报高可用执行结果以及更新高可用状态;
高可用事件检测模块,配置用于设置并执行高可用触发条件。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
尽管通过参考附图并结合优选实施例的方式对本发明进行了详细描述,但本发明并不限于此。在不脱离本发明的精神和实质的前提下,本领域普通技术人员可以对本发明的实施例进行各种等效的修改或替换,而这些修改或替换都应在本发明的涵盖范围内/任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (9)

1.一种集群虚拟机高可用方法,其特征在于,包括:
控制节点定时自动触发计算节点进行故障模拟操作,所述故障模拟操作包括:虚拟机分配操作和资源模拟调度操作;
控制节点根据故障模拟操作更新高可用事件并将所述高可用事件下发到对应的计算节点;
根据网络检测、共享存储检测、服务状态检测和代理虚拟机检测设置高可用触发条件;
出现故障的计算节点达到高可用触发条件后并执行高可用操作、上报高可用执行结果以及更新高可用状态。
2.根据权利要求1所述的一种集群虚拟机高可用方法,其特征在于,所述方法还包括:
控制节点的各个模块进行交互,获取当前集群内所有计算节点资源;
在云平台创建资源后,定时自动触发控制节点进行故障模拟操作;
当故障模拟过程出现虚拟机无法分配或资源不足时,提示管理员并给出资源调整建议。
3.根据权利要求1所述的一种集群虚拟机高可用方法,其特征在于,所述方法还包括:
判断网络检测、共享存储检测、服务状态检测和代理虚拟机检测之间的权重规则;
根据权重规则中判断是否达到高可用触发条件。
4.根据权利要求1所述的一种集群虚拟机高可用方法,其特征在于,所述虚拟机分配操作包括:
将每个虚拟机分配到虚拟机剩余资源最大或最小的计算节。
5.根据权利要求1所述的一种集群虚拟机高可用方法,其特征在于,所述资源模拟调度操作包括:
对虚拟机的资源进行逐个分配,筛选出能满足条件的计算节点,在能满足条件的计算节点中,随机或者按照虚拟机分配操作的方式选出一个计算节点进行资源调度。
6.根据权利要求1所述的一种集群虚拟机高可用方法,其特征在于,所述出现故障的计算节点达到高可用触发条件后并执行高可用操作、上报高可用执行结果以及更新高可用状态,包括:
达到高可用触发条件后自动执行高可用操作,将故障主机的虚拟机分配到指定的计算节点并进行资源调度后,故障虚拟机重启动;
所有计算节点将高可用执行结果上报至控制节点;
控制节点交互所有高可用执行结果并同步更新所有计算节点的高可用状态。
7.根据权利要求1所述的一种集群虚拟机高可用方法,其特征在于,所述方法还包括:
计算节点上的虚拟机由于资源之外的原因导致重启动失败时,则将失败上报至控制节点;
由控制节点根据所述资源模拟调度操作重新指定新的节点进行重调度,并设置重新调度次数。
8.根据权利要求1所述的一种集群虚拟机高可用方法,其特征在于,所述方法还包括:
当云平台出现计算节点状态变化时触发所述模拟调度操作,所述计算节点状态变化包括:计算节点上线、离线、移出集群、增加或减少资源。
9.一种集群虚拟机高可用系统,其特征在于,包括:
高可用服务模块,配置用于定时自动触发计算节点进行故障模拟操作、同步和下发高可用事件以及与执行控制节点内模块的交互;
高可用代理模块,配置用于接收并执行高可用事件、上报高可用执行结果以及更新高可用状态;
高可用事件检测模块,配置用于设置并执行高可用触发条件。
CN202010922076.5A 2020-09-04 2020-09-04 一种集群虚拟机高可用方法及系统 Active CN111966469B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010922076.5A CN111966469B (zh) 2020-09-04 2020-09-04 一种集群虚拟机高可用方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010922076.5A CN111966469B (zh) 2020-09-04 2020-09-04 一种集群虚拟机高可用方法及系统

Publications (2)

Publication Number Publication Date
CN111966469A true CN111966469A (zh) 2020-11-20
CN111966469B CN111966469B (zh) 2022-07-19

Family

ID=73392105

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010922076.5A Active CN111966469B (zh) 2020-09-04 2020-09-04 一种集群虚拟机高可用方法及系统

Country Status (1)

Country Link
CN (1) CN111966469B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115225485A (zh) * 2022-07-22 2022-10-21 济南浪潮数据技术有限公司 一种ha灵敏度的配置方法、装置、设备及可读存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9411628B2 (en) * 2014-11-13 2016-08-09 Microsoft Technology Licensing, Llc Virtual machine cluster backup in a multi-node environment
CN108959045A (zh) * 2018-06-08 2018-12-07 郑州云海信息技术有限公司 一种nas集群故障切换性能的测试方法和系统
CN109445907A (zh) * 2018-10-12 2019-03-08 西安交通大学 一种用户服务高可用的Docker与虚拟机聚合放置方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9411628B2 (en) * 2014-11-13 2016-08-09 Microsoft Technology Licensing, Llc Virtual machine cluster backup in a multi-node environment
CN108959045A (zh) * 2018-06-08 2018-12-07 郑州云海信息技术有限公司 一种nas集群故障切换性能的测试方法和系统
CN109445907A (zh) * 2018-10-12 2019-03-08 西安交通大学 一种用户服务高可用的Docker与虚拟机聚合放置方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115225485A (zh) * 2022-07-22 2022-10-21 济南浪潮数据技术有限公司 一种ha灵敏度的配置方法、装置、设备及可读存储介质

Also Published As

Publication number Publication date
CN111966469B (zh) 2022-07-19

Similar Documents

Publication Publication Date Title
US11307943B2 (en) Disaster recovery deployment method, apparatus, and system
WO2020253596A1 (zh) 一种Redis集群的高可用方法及装置
CN111290834B (zh) 一种基于云管理平台实现业务高可用的方法、装置及设备
CN107343034B (zh) 基于QConf的Redis高可用系统及方法
CN105933137B (zh) 一种资源管理方法、装置及系统
US7779298B2 (en) Distributed job manager recovery
CN108270726B (zh) 应用实例部署方法及装置
CN108632057A (zh) 一种云计算服务器的故障恢复方法、装置及管理系统
CN111314125A (zh) 用于容错通信的系统和方法
CN107239383A (zh) 一种OpenStack虚拟机的故障监控方法及装置
CN106612312A (zh) 一种虚拟化数据中心调度系统和方法
CN111935244B (zh) 一种业务请求处理系统及超融合一体机
CN108347339B (zh) 一种业务恢复方法及装置
CN109656742A (zh) 一种节点异常处理方法、装置及存储介质
CN107741876A (zh) 一种虚拟机进程监控系统及方法
CN110445662A (zh) OpenStack控制节点自适应切换为计算节点的方法及装置
CN112948063A (zh) 云平台的创建方法、装置、云平台以及云平台实现系统
CN106385330B (zh) 一种网络功能虚拟化编排器的实现方法及装置
CN113515316A (zh) 一种新型边缘云操作系统
CN114116912A (zh) 一种基于Keepalived实现数据库高可用的方法
CN110580198A (zh) OpenStack计算节点自适应切换为控制节点的方法及装置
CN110661641A (zh) 一种虚拟网络功能vnf部署方法及装置
CN112434008A (zh) 分布式数据库升级方法、设备及介质
CN114615268B (zh) 基于Kubernetes集群的服务网络、监控节点、容器节点及设备
CN111966469B (zh) 一种集群虚拟机高可用方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant