CN103152434A - 一种分布式云系统中的领导节点更替方法 - Google Patents

一种分布式云系统中的领导节点更替方法 Download PDF

Info

Publication number
CN103152434A
CN103152434A CN2013101027168A CN201310102716A CN103152434A CN 103152434 A CN103152434 A CN 103152434A CN 2013101027168 A CN2013101027168 A CN 2013101027168A CN 201310102716 A CN201310102716 A CN 201310102716A CN 103152434 A CN103152434 A CN 103152434A
Authority
CN
China
Prior art keywords
node
leader
computing
weights
maximum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2013101027168A
Other languages
English (en)
Inventor
单康杰
葛春
罗乘风
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Morning Cloud Information Technology Co Ltd
Original Assignee
Jiangsu Morning Cloud Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu Morning Cloud Information Technology Co Ltd filed Critical Jiangsu Morning Cloud Information Technology Co Ltd
Priority to CN2013101027168A priority Critical patent/CN103152434A/zh
Publication of CN103152434A publication Critical patent/CN103152434A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Hardware Redundancy (AREA)

Abstract

本发明一种分布式云系统中的领导节点更替方法,该系统包括一个管理节点和一个以上计算节点,管理节点负责整个系统管理操作,是该系统对外操作的一个接口,其上存储有控制数据和被其控制的其他计算节点的共享数据,计算节点提供具体的运行服务,在计算节点中有一个节点为领导节点,该领导节点会负责监控计算节点的同步心跳和告警,其中,每个计算节点都一个领导权值,当领导节点意外失效时其控制的计算节点中领导权值最大的成为新的领导节点。本发明能有效保证领导节点的恢复,对整个云系统的正常运行其他很好的保障作用,能在领导节点失效后有效的产生新的领导节点,较好的实现了系统的高可用,并且保证了关键数据的可靠性。

Description

一种分布式云系统中的领导节点更替方法
技术领域
本发明涉及对分布式云系统中的节点管理,特别是分布式云系统中的领导节点更替方法。
背景技术
已有的分布式系统多采用单主节点的方式管理整个集群,集群中其他节点向主节点汇报心跳,来保证分布式环境下的一致性和可用性。其中的前提是主节点必须有高可用性,已有的方案是采用备份主节点,在主节点发生故障时,备用节点在一定时间周期内接管主节点的工作。虽然备用节点可以提高系统的可用性,但是当备用节点出现问题或者主节点没有恢复的情况,还是无法完全保证整个系统的服务高可用和数据的安全。在已有实现方案中,cassandra分布式数据库也利用了已有的padox算法,并且有多副本存储机制。在现有的分布式技术方案,普遍存在的问题就是单点故障问题,当关键节点反生故障且不能被恢复,会导致整个分布式系统不可用,CAP理论决定了一致性和可用性是有一定冲突的。
发明内容
根据现有技术存在的问题,本发明着重解决在分布式系统环境下利用p2p技术,并结合分布式存储机制解决服务单点故障问题,保证领导节点的可用。
本发明的一种分布式云系统中的领导节点更替方法,该系统包括一个管理节点和一个以上计算节点,管理节点负责整个系统管理操作,是该系统对外操作的一个接口,其上存储有控制数据和被其控制的其他计算节点的共享数据,计算节点提供具体的运行服务,在计算节点中有一个节点为领导节点,该领导节点会负责监控计算节点的同步心跳和告警,其中,每个计算节点都一个领导权值,当领导节点意外失效时其控制的计算节点中领导权值最大的成为新的领导节点。领导节点上也可以存储有控制数据和全部计算节点的共享数据,这样可以在控制节点失效时还能起到控制节点的部分或全部作用。
作为上述分布式云系统中的领导节点更替方法进一步改进,所述的领导权值是根据系统负载情况、CPU频率和剩余内存三个参数共同决定的。当然还可以增加其他参数共同决定。
作为上述分布式云系统中的领导节点更替方法进一步改进,所述的领导权值为系统负载情况加上CPU频率再加上剩余内存值的十分之一,这三者之和。具体三者之间的比例可以根据实际需要而考虑的因素来决定。
作为上述分布式云系统中的领导节点更替方法进一步改进,所述的计算节点将其领导权值汇报给领导节点,领导节点收到全部计算节点的汇报后整理成计算节点领导权值表,然后将领导权值表发送给各个计算节点,当领导节点失效后,领导权值表中领导权值最大的计算节点自动成为新领导节点,如果该新领导节点也是失效节点,则导权值表中其他节点中领导权值最大的成为新领导节点。领导权值表中的权值最大的两个计算节点上面都保存有领导节点中的一些控制信息。
作为上述分布式云系统中的领导节点更替方法进一步改进,所述的领导节点在发现领导权值表中某个计算节点的领导权值比领导节点的领导权值大,且大的范围超过一定值,其将该计算节点提升为领导节点,原领导节点变为计算节点。这样做既可以保证高可用性,也可以使整个系统的领导节点能力最强。
作为上述分布式云系统中的领导节点更替方法进一步改进,所述的领导权值表是动态更新的,一定时间更新一次,当领导节点失效后领导权值表的更新停止。一定时间如5分钟。
作为上述分布式云系统中的领导节点更替方法进一步改进,所述的领导节点失效后,每个计算节点都向其他计算节点发送自己的领导权值,同时也接收其他计算节点领导权值,在一定时间内某一个计算节点通过判断发现其领导权值最大,然后向其他所有计算节点发起投票,如果有超过半数计算节点投票认为该投票发起者的领导权值最大,则认为该节点的领导权值是所有计算节点中领导权值最大的节点,该节点成为新的领导节点。
作为上述分布式云系统中的领导节点更替方法进一步改进,所述系统中新增的节点接入系统后先广播寻找领导节点,如果寻找到领导节点,就记录领导节点信息,并启动同步心跳;否则,判断是否有其他计算节点存在,如果没有其他计算节点存在,该新增的节点就为领导节点;如果有其他计算节点存在,领导权值最大的计算节点成为新的领导节点。
作为上述分布式云系统中的领导节点更替方法进一步改进,所述的领导节点意外失效是指虽然对领导节点进行备份,但是备份节点在领导节点失效后没能在一定时间内接管原来领导节点的工作而成为新的领导节点。
作为上述分布式云系统中的领导节点更替方法进一步改进,所述的领导权值最大的确定方式是根据计算节点的投票决定的,计算节点中认为自己是领导权值最大的节点发起投票,向其他节点发送消息,请求确认其为最大领导权值的节点,当有超过半数的计算节点投票认为其为具有最大领导权值的节点,该计算节点的领导权值就为最大,该节点就成为新的领导节点。
作为上述分布式云系统中的领导节点更替方法进一步改进,所述的领导节点上保存一份管理节点上存储的控制数据和所有计算节点的共享数据。
本发明的对padox投票算法进行了精简和改进,相较于现有技术,本发明的一种分布式云系统中的领导节点更替方法,能有效保证领导节点的高可用性,对整个云系统的正常运行其他很好的保障作用,能在领导节点失效后有效的产生新的领导节点,较好的实现了系统的高可用,并且保证了关键数据的可靠性。
附图说明
图1是节点架构示意图;
图2计算节点启动加入云系统流程图;
图中:1、管理节点;2、领导节点;3、计算节点;S101、计算节点启动;S102、广播寻找leader节点;S103、有无其他节点存在;S104、连接其他计算节点;S105、发起投票;S106、找到领导节点;S107、提升为领导节点。
具体实施方式
下面结合附图对发明进行详细说明。
先说一下,虚拟化云系统保持高可用的目的有两个。
首先,保证虚拟化云系统本身是一直可用的,即在有节点故障的情况下,虚拟化平台是可用的。虚拟化系统平台的可用性在节点不为0时都可以保证。
其次,保证虚拟机的停机控制在一定时间内,在一定时间间隔后(通常是5分钟以内),虚拟机重新变为可用。虚拟机高可用的极限情况是故障的节点不能超过其他节点的所能承载的极限。换句话说,非故障节点有足够的资源承担故障节点上的虚拟机。比如4台服务器,作为4个计算节点,每台服务器的磁盘是500G,运行了100个虚拟机,每个虚拟机内存刚好分配20G。这个时候有一台服务器故障,剩余三台已经没有资源来恢复故障节点上的25个虚拟机。在这样的情况,虚拟机就没法保证高可用了。
本发明的云系统中,分为两个角色:leader和agent。Leader节点负责心跳(agent和leader之间保持的消息传递,如果消息中断了一定周期后,leader节点就认为心跳失败,则可以认为agent已经失效)。Leader节点还负责执行高可用,告警等一些任务。在leader节点判定agent节点失效后,leader节点就会执行高可用的任务,将失效agent节点上的虚拟机在其他agent节点启动起来。
本发明的分布式云系统中的两大节点,console和agent。Console主要负责管理操作,即管理节点,agent负责运行实例和保持高可用,即计算节点。Tcloud系统的命令和心跳等内部通讯需要单独的管理网络。
Agent高可用通过leader即领导节点来实现的,领导节点的良性运行由投票机制来保证,领导节点负责心跳的监控,HA,告警等任务。Agent节点之间保持P2P连接,同步性能,leader,HA和告警任务等信息,副本是保证高可用非常重要的手段。Leader节点失效后,新的leader节点接管HA和告警等任务。
从图1中可见云系统中包括管理节点1、领导节点2和计算节点3。Console从leader节点获取其他agent节点的状态,普通的agent节点之间保持连接,在leader节点失效后参与投票,投票的发起者一般为领导权值最大的节点,收到一半以上节点投票支持,该节点就变为新的领导节点。Console节点可以采用apache(django)+mysql,所有集群共享数据存储在console;Agent节点可以采用python+sqlite,每个agent节点有自己的sqlite数据库,记录自身的一些状态和信息,这些记录是其他节点不关心的。
Leader推选算法。每一个agent都有一个serverid,即领导权值,serverid决定了在集群当中担任leader的优先级。Serverid在agent启动时根据自己的负载和硬件情况计算一个值。可以采用Serverid=sysload+cpu(hz)+(mem/10)公式进行计算。公式中内存的权值降到系统负载和cpu频率的1/10。
当agent启动向特定地址(*.*.*.254)发送广播包,收到其他节点的回复后对其他发起连接。和所有其他agent连接后,获取其他agent的serverid,并通知所有人自己的serverid。当集群中的leader失效时,serverid最大的agent将在有效的agent中发起投票,决定自己作为新的leader。
图2为计算节点启动加入云系统流程图包括如下步骤:
S101:计算节点启动;
S102:广播寻找leader节点,如果找到跳到步骤S106;
S103:有无其他节点存在,如果没有跳到步骤S107;
S104:连接其他计算节点;
S105:发起投票,进入投票流程,结束。
S106:找到领导节点,结束。
S107:提升为领导节点,结束。
现在举个投票的例子,假设现在有A,B,C,D四个计算节点,它们的serverid即领导权值是A>C>B>D,其中A节点是leader,我们假设A节点已经失效,B,C,D节点最终都判断到A的失效:
1、B,C,D节点几乎在同时判断到A的失效,其中C节点的serverid是最大的,这时C将发起投票,并发送消息到B,D;而B,D因为判断到自己不是最大的serverid,将等待别人发起投票。B,D都同意C为新的leader,C接到大多数节点的同意消息后通知所有agent节点C为新的leader,投票结束;
2、B,D在得到投票请求前有一个时间窗口,等待活着的agent中serverid最大的那个节点的投票请求;
3、如果A失效后,C刚刚发起投票即失效,基于第二点的描述,在一个时间窗口之后,B,D将得知C也失效了,则B发起投票,并成为新的leader;
4、如果leader推选是基于动态策略的,则节点的serverid是随时变化的,在leader失效后,serverid的更新应当停止,直到新的leader产生;
5、如果A,B,C都失效后,集群中只剩余了D这个台非leader的机器,D将执行以下流程:
a、通过隔离地址判断自身网络是否隔离;
b、如果自身网络正常,提升为leader;
c、如果自身网络不正常,停止已经设置HA的实例,其他实例根据设置决定是否停止;
上述流程中c也可以描述集群中节点失效的情况。
现再举个例子,假设有E、F、G、H、I五个计算节点,其中E节点是领导节点,有一个领导权值表,上面记录着各个节点的领导权值,除领导节点外其他计算节点中领导权值F>G>H>I,当E领导节点失效后:
S201:根据领导权值表找出领导权值最大的计算节点,发现F节点的领导权值最大;
S202:领导权值最大的节点成为新的领导节点,这样F节点成为新的领导节点。如果F节点也失效,重复上述两步,产生新的领导节点,保证整个云系统的高可用性。
以上所揭露的仅为本发明的较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种分布式云系统中的领导节点更替方法,该系统包括一个管理节点和一个以上计算节点,管理节点负责整个系统管理操作,是该系统对外操作的一个接口,其上存储有控制数据和被其控制的其他计算节点的共享数据,计算节点提供具体的运行服务,在计算节点中有一个节点为领导节点,该领导节点会负责监控计算节点的同步心跳和告警,其特征在于:每个计算节点都一个领导权值,当领导节点意外失效时其控制的计算节点中领导权值最大的成为新的领导节点。
2.根据权利要求1所述的分布式云系统中的领导节点更替方法,其特征在于:所述的领导权值是根据系统负载情况、CPU频率和剩余内存三个参数共同决定的。
3.根据权利要求2所述的分布式云系统中的领导节点更替方法,其特征在于:所述的领导权值为该计算节点的系统负载情况加上CPU频率再加上剩余内存值的十分之一,这三者之和。
4.根据权利要求1所述的分布式云系统中的领导节点更替方法,其特征在于:所述的计算节点将其领导权值汇报给领导节点,领导节点收到全部计算节点的汇报后整理成计算节点领导权值表,然后将领导权值表发送给各个计算节点,当领导节点失效后,领导权值表中领导权值最大的计算节点自动成为新领导节点,如果该新领导节点也是失效节点,则领导权值表中其他计算节点中领导权值最大的成为新领导节点。
5.根据权利要求4所述的分布式云系统中的领导节点更替方法,其特征在于:所述的领导节点在发现领导权值表中某个计算节点的领导权值比领导节点的领导权值大,且大的范围超过一定值,其将该计算节点提升为领导节点,原领导节点变为计算节点。
6.根据权利要求4所述的分布式云系统中的领导节点更替方法,其特征在于:所述的领导权值表是动态更新的,一定时间更新一次,当领导节点失效后领导权值表的更新停止。
7.根据权利要求1所述的分布式云系统中的领导节点更替方法,其特征在于:所述的领导节点失效后,每个计算节点都向其他计算节点发送自己的领导权值,同时也接收其他计算节点领导权值,在一定时间内某一个计算节点通过判断发现其领导权值最大,然后向其他所有计算节点发起投票,如果有超过半数计算节点投票认为该投票发起者的领导权值最大,则认为该节点的领导权值是所有计算节点中领导权值最大的节点,该节点成为新的领导节点。
8.根据权利要求1所述的分布式云系统中的领导节点更替方法,其特征在于:所述系统中新增的计算节点接入系统后先广播寻找领导节点,如果寻找到领导节点,就记录领导节点信息,并启动同步心跳;否则,判断是否有其他计算节点存在,如果没有其他计算节点存在,该新增的节点就为领导节点;如果有其他计算节点存在,领导权值最大的计算节点成为新的领导节点。
9.根据权利要求1所述的分布式云系统中的领导节点更替方法,其特征在于:所述的领导节点意外失效是指虽然对领导节点进行备份,但是备份节点在领导节点失效后没能在一定时间内接替原来领导节点的工作而成为新的领导节点。
10.根据权利要求1所述的分布式云系统中的领导节点更替方法,其特征在于:所述的领导权值最大的确定方式是根据计算节点的投票决定的,计算节点中认为自己是领导权值最大的节点发起投票,向其他节点发送消息,请求确认其为最大领导权值的节点,当有超过半数的计算节点投票认为其为具有最大领导权值的节点,该计算节点的领导权值就为最大,该节点就成为新的领导节点。
CN2013101027168A 2013-03-27 2013-03-27 一种分布式云系统中的领导节点更替方法 Pending CN103152434A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2013101027168A CN103152434A (zh) 2013-03-27 2013-03-27 一种分布式云系统中的领导节点更替方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2013101027168A CN103152434A (zh) 2013-03-27 2013-03-27 一种分布式云系统中的领导节点更替方法

Publications (1)

Publication Number Publication Date
CN103152434A true CN103152434A (zh) 2013-06-12

Family

ID=48550293

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2013101027168A Pending CN103152434A (zh) 2013-03-27 2013-03-27 一种分布式云系统中的领导节点更替方法

Country Status (1)

Country Link
CN (1) CN103152434A (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014173357A1 (zh) * 2013-08-30 2014-10-30 中兴通讯股份有限公司 一种用于泛在终端网络的认证方法和装置
CN104199747A (zh) * 2014-08-15 2014-12-10 中国船舶重工集团公司第七0九研究所 基于健康管理的高可用系统实现方法及系统
CN106130960A (zh) * 2016-06-12 2016-11-16 微梦创科网络科技(中国)有限公司 盗号行为的判断系统、负载调度方法和装置
CN106130898A (zh) * 2016-08-29 2016-11-16 北京神州绿盟信息安全科技股份有限公司 一种虚拟路由链路保障方法及装置
CN107070729A (zh) * 2017-06-13 2017-08-18 深圳市伊特利网络科技有限公司 网络链接中主设备推选方法及系统
CN107105032A (zh) * 2017-04-20 2017-08-29 腾讯科技(深圳)有限公司 节点设备运行方法及节点设备
CN107124305A (zh) * 2017-04-20 2017-09-01 腾讯科技(深圳)有限公司 节点设备运行方法及节点设备
WO2018120174A1 (zh) * 2016-12-30 2018-07-05 华为技术有限公司 故障恢复的方法、设备和系统
CN108810100A (zh) * 2018-05-22 2018-11-13 郑州云海信息技术有限公司 一种主节点的选举方法、装置及设备
CN110109776A (zh) * 2019-05-21 2019-08-09 无锡华云数据技术服务有限公司 一种节点处理方法、装置及电子设备
CN110597809A (zh) * 2019-08-21 2019-12-20 中山大学 一种支持树状数据结构的一致性算法系统及其实现方法
TWI701916B (zh) * 2017-12-28 2020-08-11 大陸商中國銀聯股份有限公司 用於在分布式系統中使管理能力自恢復的方法和裝置
CN111639343A (zh) * 2020-06-02 2020-09-08 重庆智者炎麒科技有限公司 一种基于可信执行环境的客流分析方法和系统
CN113568710A (zh) * 2021-08-03 2021-10-29 罗慧 一种虚拟机高可用实现方法、装置和设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060190615A1 (en) * 2005-01-21 2006-08-24 Panwar Shivendra S On demand peer-to-peer video streaming with multiple description coding
CN101715187A (zh) * 2009-11-20 2010-05-26 西安电子科技大学 基于动态网关的安全通信方法
WO2010091101A1 (en) * 2009-02-03 2010-08-12 Bittorent, Inc. Distributed storage of recoverable data
CN102149160A (zh) * 2011-04-20 2011-08-10 宁波职业技术学院 一种用于无线传感网络的能量感知路由算法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060190615A1 (en) * 2005-01-21 2006-08-24 Panwar Shivendra S On demand peer-to-peer video streaming with multiple description coding
WO2010091101A1 (en) * 2009-02-03 2010-08-12 Bittorent, Inc. Distributed storage of recoverable data
CN101715187A (zh) * 2009-11-20 2010-05-26 西安电子科技大学 基于动态网关的安全通信方法
CN102149160A (zh) * 2011-04-20 2011-08-10 宁波职业技术学院 一种用于无线传感网络的能量感知路由算法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
孙中皋,郑紫微,许少娟: "《基于双重选举机制的无线传感器网络分簇算法》", 《华南理工大学学报》 *

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104426874B (zh) * 2013-08-30 2019-01-29 中兴通讯股份有限公司 一种用于泛在终端网络的认证方法和装置
CN104426874A (zh) * 2013-08-30 2015-03-18 中兴通讯股份有限公司 一种用于泛在终端网络的认证方法和装置
WO2014173357A1 (zh) * 2013-08-30 2014-10-30 中兴通讯股份有限公司 一种用于泛在终端网络的认证方法和装置
CN104199747A (zh) * 2014-08-15 2014-12-10 中国船舶重工集团公司第七0九研究所 基于健康管理的高可用系统实现方法及系统
CN104199747B (zh) * 2014-08-15 2017-05-03 中国船舶重工集团公司第七0九研究所 基于健康管理的高可用系统实现方法及系统
CN106130960A (zh) * 2016-06-12 2016-11-16 微梦创科网络科技(中国)有限公司 盗号行为的判断系统、负载调度方法和装置
CN106130960B (zh) * 2016-06-12 2019-08-09 微梦创科网络科技(中国)有限公司 盗号行为的判断系统、负载调度方法和装置
CN106130898A (zh) * 2016-08-29 2016-11-16 北京神州绿盟信息安全科技股份有限公司 一种虚拟路由链路保障方法及装置
CN106130898B (zh) * 2016-08-29 2019-11-19 北京神州绿盟信息安全科技股份有限公司 一种虚拟路由链路保障方法及装置
WO2018120174A1 (zh) * 2016-12-30 2018-07-05 华为技术有限公司 故障恢复的方法、设备和系统
US11102084B2 (en) 2016-12-30 2021-08-24 Huawei Technologies Co., Ltd. Fault rectification method, device, and system
CN107124305A (zh) * 2017-04-20 2017-09-01 腾讯科技(深圳)有限公司 节点设备运行方法及节点设备
CN107105032B (zh) * 2017-04-20 2019-08-06 腾讯科技(深圳)有限公司 节点设备运行方法及节点设备
US10833919B2 (en) 2017-04-20 2020-11-10 Tencent Technology (Shenzhen) Company Limited Node device operation method, work status switching apparatus, node device, and medium
CN107105032A (zh) * 2017-04-20 2017-08-29 腾讯科技(深圳)有限公司 节点设备运行方法及节点设备
CN107124305B (zh) * 2017-04-20 2019-08-23 腾讯科技(深圳)有限公司 节点设备运行方法及节点设备
CN107070729A (zh) * 2017-06-13 2017-08-18 深圳市伊特利网络科技有限公司 网络链接中主设备推选方法及系统
TWI701916B (zh) * 2017-12-28 2020-08-11 大陸商中國銀聯股份有限公司 用於在分布式系統中使管理能力自恢復的方法和裝置
CN108810100A (zh) * 2018-05-22 2018-11-13 郑州云海信息技术有限公司 一种主节点的选举方法、装置及设备
CN110109776A (zh) * 2019-05-21 2019-08-09 无锡华云数据技术服务有限公司 一种节点处理方法、装置及电子设备
CN110597809A (zh) * 2019-08-21 2019-12-20 中山大学 一种支持树状数据结构的一致性算法系统及其实现方法
CN110597809B (zh) * 2019-08-21 2023-05-23 中山大学 一种支持树状数据结构的一致性算法系统及其实现方法
CN111639343A (zh) * 2020-06-02 2020-09-08 重庆智者炎麒科技有限公司 一种基于可信执行环境的客流分析方法和系统
CN113568710A (zh) * 2021-08-03 2021-10-29 罗慧 一种虚拟机高可用实现方法、装置和设备
CN113568710B (zh) * 2021-08-03 2023-07-21 罗慧 一种虚拟机高可用实现方法、装置和设备

Similar Documents

Publication Publication Date Title
CN103152434A (zh) 一种分布式云系统中的领导节点更替方法
US10560315B2 (en) Method and device for processing failure in at least one distributed cluster, and system
EP3694148A1 (en) Configuration modification method for storage cluster, storage cluster and computer system
US11307943B2 (en) Disaster recovery deployment method, apparatus, and system
CN103744809B (zh) 基于vrrp的车辆信息管理系统双机热备方法
EP3490224A1 (en) Data synchronization method and system
CN102355369B (zh) 虚拟化集群系统及其处理方法和设备
CN105159798A (zh) 一种虚拟机的双机热备方法、双机热备管理服务器和系统
WO2021136422A1 (zh) 状态管理方法、主备应用服务器的切换方法及电子设备
CN102916825A (zh) 一种双机热备系统的管理设备、管理方法及双机热备系统
CN104767794A (zh) 一种分布式系统中的节点选举方法及节点
CN111935244B (zh) 一种业务请求处理系统及超融合一体机
CN112631764A (zh) 任务调度方法、装置、计算机设备和计算机可读介质
CN109391691A (zh) 一种单节点故障下nas服务的恢复方法及相关装置
CN108173971A (zh) 一种基于主备切换的MooseFS高可用方法及系统
CN114124650A (zh) 一种sptn网络控制器主从部署方法
CN109361777A (zh) 分布式集群节点状态的同步方法、同步系统及相关装置
CN116055563A (zh) 基于Raft协议的任务调度方法、系统、电子设备和介质
CN104052799B (zh) 一种利用资源环实现高可用存储的方法
CN105323271B (zh) 一种云计算系统以及云计算系统的处理方法和装置
CN113765690A (zh) 集群切换方法、系统、装置、终端、服务器及存储介质
CN113220509B (zh) 一种双组合交替倒班系统及方法
CN107181608A (zh) 一种恢复服务及性能提升的方法及运维管理系统
CN116346588A (zh) 一种管理节点切换方法、装置、设备及介质
CN110850956B (zh) 一种基于数据覆盖集的分布式运算集群动态能耗管理方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20130612