CN104079647A - 用于虚拟化集群的选举方法及装置 - Google Patents

用于虚拟化集群的选举方法及装置 Download PDF

Info

Publication number
CN104079647A
CN104079647A CN201410301929.8A CN201410301929A CN104079647A CN 104079647 A CN104079647 A CN 104079647A CN 201410301929 A CN201410301929 A CN 201410301929A CN 104079647 A CN104079647 A CN 104079647A
Authority
CN
China
Prior art keywords
main frame
parameter information
resource occupation
occupation parameter
virtual cluster
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410301929.8A
Other languages
English (en)
Other versions
CN104079647B (zh
Inventor
罗逸秀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou H3C Technologies Co Ltd
Original Assignee
Hangzhou H3C Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou H3C Technologies Co Ltd filed Critical Hangzhou H3C Technologies Co Ltd
Priority to CN201410301929.8A priority Critical patent/CN104079647B/zh
Publication of CN104079647A publication Critical patent/CN104079647A/zh
Application granted granted Critical
Publication of CN104079647B publication Critical patent/CN104079647B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Hardware Redundancy (AREA)

Abstract

本发明提供一种用于虚拟化集群的选举方法及装置,应用于虚拟化集群中的任一主机,该方法包括:获取虚拟化集群中所有主机的资源占用参数信息;对所述虚拟化集群中的当前主机及所述虚拟化集群中除当前主机之外的其他主机中的每一个主机的资源占用参数信息分别进行求和计算;分别判断每个求和结果是否满足小于或等于预设的第一阈值,并筛除所述其他主机中不满足条件的主机;在所述其他主机中剩余的满足条件的主机中,确定当前主机对应的备份主机。通过本发明的技术方案,可以在选举备份主机时,避免占用过大的带宽,且不会限制虚拟化集群的规模。

Description

用于虚拟化集群的选举方法及装置
技术领域
本发明涉及云计算技术领域,尤其涉及用于虚拟化集群的选举方法及装置。
背景技术
在云计算领域,通过虚拟化技术的运用,使得业务应用由传统的硬件服务器转移到虚拟化的服务器平台上,构成相应的虚拟化集群。如图1所示,虚拟化集群通常包括一组物理服务器主机,每台主机上运行一个或多个虚拟机(VM,Virtual Machine)。
在虚拟化技术中,通常会使用虚拟化集群提供硬件层面的故障恢复高可靠保障,其技术目标是实现当某一台主机故障时,可以将其上运行的虚拟机运行到集群中的其他可用的主机上,以确保业务的永续。
然而,在相关技术中,当某台主机故障后,需要在所有剩余的主机中进行选举计算,需要占用较大的管理带宽,且限制了集群中主机的数量规模,尤其是当同时出现多点故障时,将极大地影响整个集群的稳定性。
发明内容
有鉴于此,本发明提供一种新的技术方案,可以解决相关技术中在选举备份主机时,由于参与的主机数量较多而导致的带宽占用较大、集群规模受限的技术问题。
为实现上述目的,本发明提供技术方案如下:
根据本发明的第一方面,提出了一种用于虚拟化集群的选举方法,应用于虚拟化集群中的任一主机,包括:
获取虚拟化集群中所有主机的资源占用参数信息;
对所述虚拟化集群中的当前主机及所述虚拟化集群中除当前主机之外的其他主机中的每一个主机的资源占用参数信息分别进行求和计算;
分别判断每个求和结果是否满足小于或等于预设的第一阈值,并筛除所述其他主机中不满足条件的主机;
在所述其他主机中剩余的满足条件的主机中,确定当前主机对应的备份主机。
根据本发明的第二方面,还提出了一种用于虚拟化集群的选举装置,应用于虚拟化集群中的任一主机,包括:
获取单元,用于获取虚拟化集群中所有主机的资源占用参数信息;
计算单元,用于对所述虚拟化集群中的当前主机及所述虚拟化集群中除当前主机之外的其他主机中的每一个主机的资源占用参数信息分别进行求和计算;
筛除单元,用于分别判断每个求和结果是否满足小于或等于预设的第一阈值,并筛除所述其他主机中不满足条件的主机;
确定单元,用于在所述其他主机中剩余的满足条件的主机中,确定当前主机对应的备份主机。
由以上技术方案可见,本发明通过由每台主机单独计算对应的备份主机,无需其他主机的参与,从而有助于节省虚拟化集群的管理带宽,并且避免对虚拟化集群的规模和扩展造成限制。
附图说明
图1示出了虚拟化集群的结构示意图;
图2示出了根据本发明的一示例性实施例的用于虚拟化集群的选举方法的示意流程图;
图3示出了根据本发明的一示例性实施例的虚拟机与物理服务器之间的关系示意图;
图4示出了根据本发明的一示例性实施例的选择备份主机的示意流程图;
图5示出了根据本发明的一示例性实施例的验证选中的备份主机的示意流程图;
图6示出了根据本发明的一示例性实施例的在虚拟化集群中建立组群的示意图;
图7示出了根据本发明的一示例性实施例的虚拟机故障恢复时间的示意图;
图8示出了根据本发明的一示例性实施例的选择仲裁主机的示意流程图;
图9示出了根据本发明的一示例性实施例的用于虚拟化集群的选举装置的示意框图。
具体实施方式
本发明通过由每台主机单独计算对应的备份主机,无需其他主机的参与,从而有助于节省虚拟化集群的管理带宽,并且避免对虚拟化集群的规模和扩展造成限制。
为对本发明进行进一步说明,提供下列实施例:
图2示出了根据本发明的一示例性实施例的选择备份主机的方法的示意流程图。
如图2所示,根据本发明的一示例性实施例的选择备份主机的方法,应用于虚拟化集群中的任一主机,包括:
步骤201,获取虚拟化集群中所有主机的资源占用参数信息;
步骤202,根据所述资源占用参数信息,确定当前主机在所述虚拟化集群中的备份主机。
在上述实施例中,由虚拟化集群中的每台主机确定对应的备份主机,即每台主机的备份主机都是通过独立的计算过程得到的,而无需其他主机的参与,从而节省虚拟化集群的管理带宽,并且避免对虚拟化集群的规模和扩展造成限制。
其中,“资源占用参数信息”即用于表明主机的资源占用情况的参数信息,该参数信息可以包括但不限于:CPU占用率、内存占用率、硬盘占用率等。
下面以一典型应用场景为例,对上述的选择备份主机的方法进行详细描述。在该典型应用场景中,假定虚拟化集群包括100台虚拟机,平均分布在10台物理服务器中(即每台物理服务器上配置10台虚拟机),即图3所示的host1、host2……host10等主机。
在上述虚拟化集群运行的过程中,假定需要计算任一主机hostX(host1至host10中的任一主机)对应的备份主机,即从除hostX之外的其余9台主机中选择一台作为hostX的备份主机,使得当hostX出现故障时,能够及时将hostX上的虚拟机转移至备份主机上,尽可能减少对相应业务的影响。
对应于上述的步骤201,hostX即当前主机,需要获取所处虚拟化集群中所有主机的资源占用信息,则其获取过程可以分为:获取当前主机hostX的资源占用参数信息和其他主机的资源占用参数信息,下面分别进行详细介绍。
当前主机:
作为一示例性实施例,可以直接读取当前主机hostX(物理服务器)的CPU占用率、内存占用率、硬盘占用率等资源占用参数信息。
作为另一示例性实施例,也可以读取当前主机hostX中运行的所有虚拟机(即10台虚拟机)的运行状态信息,以确定每台虚拟机的资源占用参数信息,并将所有虚拟机对应的每项资源占用参数信息进行数值叠加(即对所有虚拟机对应的CPU占用率、内存占用率、硬盘占用率等分别进行求和处理),从而将计算结果作为当前主机hostX的资源占用参数信息。比如图3所示,假定当前主机hostX中配置有VM1、VM2……VM10等虚拟机,则可以分别获取每台虚拟机的运行状态信息,从而统计和计算出当前主机hostX的资源占用参数信息。当基于所有虚拟机的资源占用参数信息来计算当前主机hostX的资源占用参数信息时,相对于直接读取当前主机hostX作为物理服务器的资源占用参数信息,显然有助于提升该资源占用参数信息的准确率。
其他主机:
作为一示例性实施例,可以由当前主机hostX向每一其他主机发起请求(可以通过单播或组播方式实现),以分别获取每一其他主机的资源占用参数信息。
作为另一示例性实施例,虚拟化集群中可以配置有“管理主机”(Manager),该管理主机负责收集虚拟化集群中所有主机的运行状态,并维护一个对应于所有主机的信息列表HA-host-list,该信息列表中包含每台主机的资源占用参数信息,因而当前主机hostX可以直接向管理主机请求该HA-host-list列表,从而获取所有的其他主机的资源占用参数信息。由于不需要向每台主机分别发起请求,而仅需要向管理主机发起对HA-host-list列表的获取请求,因而有助于节省管理带宽。
对应于上述的步骤202,在确定当前主机hostX的备份主机时,应当优先选择虚拟化集群中的资源占用率低的主机,以避免影响该虚拟化集群的运行状况。
作为一示例性实施例,可以直接将每一其他主机的资源占用参数信息与预设上限阈值进行比较,筛选出对应的资源占用参数信息小于或等于该预设上限阈值的主机,并在这些主机中选择出当前主机hostX的备份主机。
作为另一示例性实施例,还可以对当前主机hostX的资源占用参数信息进行一并考虑,以进一步提升筛选的“门槛”。比如图4所示,其筛选步骤可以包括:
步骤402,分别将虚拟化集群中除当前主机hostX之外的每一其他主机和当前主机hostX的资源占用参数信息进行求和计算。假定当前主机hostX为host2,且该虚拟化集群中的每台主机对应的资源占用参数信息如表1所示,则每台主机的资源占用参数信息为对应的CPU占用率和内存占用率,需要分别将每一主机的CPU占用率/内存占用率与host2对应的参数值进行求和。具体地,比如将host1和host2对应的资源占用参数信息进行求和计算时,得到的求和结果:CPU占用率之和为140%、内存占用率为60%……比如将host2和host10对应的资源占用参数信息进行求和计算时,得到的求和结果:CPU占用率之和为100%、内存占用率为35%。
主机 CPU占用率 内存占用率
host1 80% 35%
host2 60% 25%
host10 40% 10%
表1
步骤404,将求和结果与预设的第一阈值进行比较。当某个求和结果大于第一阈值时,丢弃该求和结果对应的主机,否则保留对应的主机。其中,第一阈值可以由开发者根据实际情况和需求进行设置,也可以由用户在应用过程中进行编辑。由于资源占用参数信息可能包含多个,则对应的“第一阈值”也应当为多个,以分别对应于每个参数信息。
作为一示例性实施例,在经过步骤404的筛选后,可以直接在未筛除的主机中选择任一主机来作为当前主机hostX的备份主机。
作为另一示例性实施例,为了使得所有主机的备份主机被尽可能平均地分配至各台主机,在步骤404之后,还可以进一步执行下述步骤:
步骤406,针对步骤404中,相应的求和结果小于或等于第一阈值的主机,计算这些主机的所有求和结果的平均值。
步骤408,针对参与步骤406的平均值计算的每个求和结果,计算每个求和结果与平均值之间的差值。
步骤410,选择差值最小的主机作为当前主机hostX的备份主机。在该实施例中,通过平均值的计算和差值的比较,使得选择出的备份主机并非剩余计算资源最小的主机,实现了将“备份主机”平均分配在集群中,使得每台主机不可用时,受影响的主机数量都不会过多,有助于提升虚拟化集群的整体稳定性。
需要说明的是:主机的资源占用参数信息可能包含多个参数,如同时包含主机的CPU占用率和内存占用率,则步骤410中得到的“差值最小”将同时对应于“CPU占用率的差值最小”和“内存占用率的差值最小”,则当所有参数对应的“差值最小”的主机均相同时,比如“CPU占用率的差值最小”和“内存占用率的差值最小”的主机均为hostY,直接选择该主机hostY为备份主机;当不同参数对应的“差值最小”的主机不相同时,比如“CPU占用率的差值最小”的主机为hostY1、“内存占用率的差值最小”的主机为hostY2,则需要根据预先配置的各个参数的优先级,选择优先级最高的参数对应的“差值最小”的主机,比如当“CPU占用率”的优先级高于“内存占用率”时,选择主机hostY1为当前主机hostX的备份主机。
此外,通过当前主机hostX的计算,选择了主机hostY为对应的备份主机后,还可以由该主机hostY进一步确定是否可以作为当前主机hostX的备份主机,其判断步骤如图5所示:
步骤502,主机hostY在接收到来自当前主机hostX的vote(选举)报文,该vote报文表明需要将主机hostY作为hostX的备份主机。如图6所示,在虚拟化集群中,可以为每台主机建立对应的组群(Group),比如当主机hostY作为当前主机hostX的备份主机时,相当于将主机hostY作为当前主机hostX对应的组群1中的成员。
为了便于说明,以组群1为例。由于组群1是针对当前主机hostX建立的,因而可以为当前主机hostX配置对应的角色为Main,而当主机hostY作为当前主机hostX的备份主机时,为主机hostY配置对应的角色为Backup;同时,对于主机hostY而言,也建立了对应的组群(图中未示出)且作为该组群中的Main;此外,主机hostY还可能作为其他组群的成员,并且作为Backup等各种类型的角色。
步骤504,对于每台主机来说,可以限制其被分配的组群数量,比如仅允许主机hostY加入a个组群,则主机hostY可以判断其当前已经加入的组群数量是否超出预设上限,即已经加入的组群数量为b时,判断是否满足b+1>a,若满足,则说明已经超出上限,进入步骤512,否则说明未超出上限,进入步骤506。
步骤506,主机hostY从接收到的vote报文中,读取当前主机hostX的资源占用参数信息,如CPU占用率和内存占用率等。
步骤508,主机hostY将当前主机hostX的资源占用参数信息,与主机hostY自身的资源占用参数信息进行求和计算,比如分别将主机hostY的CPU占用率和当前主机hostX的CPU占用率相加,以及将主机hostY的内存占用率和当前主机hostX的内存占用率相加。
步骤510,将求和结果与预设的第二阈值进行比较。当求和结果大于第二阈值时,进入步骤512,否则进入步骤514。其中,类似于“第一阈值”,第二阈值可以由开发者根据实际情况和需求进行设置,也可以由用户在应用过程中进行编辑;同时,由于资源占用参数信息可能包含多个,则对应的“第二阈值”也应当为多个,以分别对应于每个参数信息。
步骤512,向当前主机hostX返回验证失败消息,需要当前主机hostX重新选择备份主机。
步骤514,向当前主机hostX返回验证成功消息,则主机hostY加入组群1,并作为当前主机hostX的备份主机。
如图7所示,在相关技术中,虚拟化集群中任一主机发生故障后,对应于故障恢复时间1,具体包括:1)从主机发生故障开始,至虚拟化集群发现该主机发生故障的时间t1;2)剩余主机计算协商备份主机的时间t2;3)从选择出的备份主机启动原本位于故障主机中的虚拟机开始,直至虚拟机恢复正常工作的时间t3。为了缩短加快主机的故障恢复处理速度,本发明提出了进一步的改进:在每台主机加入虚拟化集群时,就通过上述实施例的选择备份主机的方法,计算对应的备份主机。
在本实施例中,通过更换备份主机的计算时机,使得在虚拟化集群发现主机发生故障之后,可以直接在对应的备份主机上重启相应的虚拟机,从而对应于图7所示的故障恢复时间2,相比于故障恢复时间1而言,节省了计算备份主机的时间t2。
由于时间t3是不可控的,即虚拟机的启动时间一定,因而为了进一步缩短故障恢复时间,本发明提出了进一步的改进。具体地,以图6所示的组群1为例,除了上述的角色Main和角色Backup之外,还可以包含其他更多的角色,比如角色Arbiter(仲裁)。假定主机hostZ为组群1中的仲裁主机,则主机hostX、主机hostZ和主机hostY之间相互保持联络,比如以周期性的keepalive(保活)报文的形式。举例来说,假定当主机hostX发现无法与对应的备份主机hostY保持联络时,主机hostX无法确定究竟是自身发生故障,还是主机hostY发生故障,因而主机hostX可以通过向仲裁主机hostZ发送验证报文,并由仲裁主机hostZ分别确定主机hostX和主机hostY的运行状态,从而确定是否主机hostX发生故障,或主机hostY发生故障;当主机hostY发现无法与主机hostX保持联络时,也可以通过上述方式进行确认,此处不再赘述。
因此,通过对仲裁主机的配置,能够加快对故障主机的发现,从而及时执行相应的故障恢复操作。
相应地,图8示出了根据本发明的一示例性实施例的选择仲裁主机的示意流程,包括:
步骤802,以当前主机hostX为例。针对虚拟化集群中除当前主机hostX之外的所有其他主机,计算所有其他主机的CPU占用率的平均值。当然,此处仅以“CPU占用率”为例进行说明,本领域技术人员能够理解的是,显然可以采用任意类型的资源占用参数信息,比如内存占用率等,也可以实现对仲裁主机的顺利选取。
步骤804,将每一其他主机的CPU占用率与计算得到的平均值进行比较,若大于平均值则丢弃对应的主机,否则保留对应的主机。
步骤806,在保留的所有主机中,随机选取一台主机作为当前主机hostX的仲裁主机。由于“仲裁”并不需要占用很多计算资源,因而可以通过步骤804的初步筛选后,执行随机选取即可。当然,本领域技术人员应该理解的是:显然可以通过类似图4所示的步骤408和步骤410的方式,对主机执行进一步筛选,以确定最终的仲裁主机,此处不再赘述。
此外,通过当前主机hostX的计算,选择了主机hostZ为对应组群的仲裁主机后,类似于备份主机hostY,还可以由该主机hostZ进一步确定是否可以作为当前主机hostX的仲裁主机,其判断步骤可以包括:
主机hostZ在接收到来自当前主机hostX的vote’报文,该vote’报文表明需要将主机hostZ作为hostX的仲裁主机。假定预配置为主机hostZ仅允许被分配至a’个组群,则主机hostZ可以判断其当前已经加入的组群数量是否超出预设上限,即已经加入的组群数量为b’时,判断是否满足b’+1>a’,若满足,则说明已经超出上限,返回验证失败消息,否则说明未超出上限,返回验证成功消息。
对应于上述的用于虚拟化集群的选举装置,本发明还进一步提出了图9所示的根据本申请的一示例性实施例的用于虚拟化集群的选举装置的示意框图。
请参考图9,根据本申请的一示例性实施例的用于虚拟化集群的选举装置可以包括:
获取单元,用于获取虚拟化集群中所有主机的资源占用参数信息;
计算单元,用于对所述虚拟化集群中的当前主机及所述虚拟化集群中除当前主机之外的其他主机中的每一个主机的资源占用参数信息分别进行求和计算;
筛除单元,用于分别判断每个求和结果是否满足小于或等于预设的第一阈值,并筛除所述其他主机中不满足条件的主机;
确定单元,用于在所述其他主机中剩余的满足条件的主机中,确定当前主机对应的备份主机。
可选的,所述获取单元在获取虚拟化集群中所有主机的资源占用参数信息时,通过下述方式获取虚拟化集群中除当前主机之外的其他主机的资源占用参数信息:
向所述其他主机分别发送信息获取请求,并接收分别返回的所述其他主机的资源占用参数信息;
或者,向所述虚拟化集群中的管理主机发送信息获取请求,并接收所述管理主机返回的所述其他主机的资源占用参数信息。
可选的,所述获取单元在获取虚拟化集群中所有主机的资源占用参数信息时,通过下述方式获取当前主机的资源占用参数信息:
向所述虚拟化集群中的管理主机发送信息获取请求,并接收所述管理主机返回的当前主机的资源占用参数信息;
或者,读取当前主机中的所有虚拟机的资源占用参数信息,并叠加得到所述当前主机的资源占用参数信息。
可选的,所述确定单元具体用于:
获取所有剩余的其他主机对应的资源占用参数信息的平均值;
计算每一其他主机对应的资源占用参数信息与所述平均值之间的差值;
选择对应的差值最小的其他主机,作为当前主机的备份主机。
可选的,还包括:
创建单元,用于建立对应于当前主机的组群,并将所述备份主机添加至该组群中。
可选的,还包括:
接收单元,用于接收来自所示虚拟化集群中的其他主机的备份主机选举报文;
处理单元,用于在当前主机所属组群的数量已经达到预设上限的情况下,返回验证失败消息;否则从所述备份主机选取报文中读取所述其他主机的资源占用参数信息,并与当前主机的资源占用参数信息进行求和计算;若求和结果小于预设的第二阈值,则返回验证成功消息,否则返回验证失败消息。
可选的,所述获取单元获取所述虚拟化集群中除当前主机之外的所有其他主机的资源占用参数信息;
所述计算单元计算所有其他主机的资源占用参数信息的平均值;
所述确定单元筛选出资源占用参数信息小于所述平均值的其他主机,从中确定所述当前主机的仲裁主机,并将该仲裁主机添加至对应于所述当前主机的组群中;
所述装置还包括:发送单元,用于当在预设时间长度内,所述当前主机未接收到来自所述备份主机的保活报文,或未接收到所述备份主机返回的保活报文的响应报文时,向预配置的仲裁主机发送仲裁请求,以由仲裁主机判定发生故障的主机。
因此,本发明通过由每台主机单独计算对应的备份主机,无需其他主机的参与,从而有助于节省虚拟化集群的管理带宽,并且避免对虚拟化集群的规模和扩展造成限制。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (14)

1.一种用于虚拟化集群的选举方法,应用于虚拟化集群中的任一主机,其特征在于,包括:
获取虚拟化集群中所有主机的资源占用参数信息;
对所述虚拟化集群中的当前主机及所述虚拟化集群中除当前主机之外的其他主机中的每一个主机的资源占用参数信息分别进行求和计算;
分别判断每个求和结果是否满足小于或等于预设的第一阈值,并筛除所述其它主机中不满足条件的主机;
在所述其它主机中剩余的满足条件的主机中,确定当前主机对应的备份主机。
2.根据权利要求1所述的方法,其特征在于,在获取虚拟化集群中所有主机的资源占用参数信息时,获取虚拟化集群中除当前主机之外的其他主机的资源占用参数信息包括:
向所述其他主机分别发送信息获取请求,并接收分别返回的所述其他主机的资源占用参数信息;
或者,向所述虚拟化集群中的管理主机发送信息获取请求,并接收所述管理主机返回的所述其他主机的资源占用参数信息。
3.根据权利要求1所述的方法,其特征在于,在获取虚拟化集群中所有主机的资源占用参数信息时,获取当前主机的资源占用参数信息包括:
向所述虚拟化集群中的管理主机发送信息获取请求,并接收所述管理主机返回的当前主机的资源占用参数信息;
或者,读取当前主机中的所有虚拟机的资源占用参数信息,并叠加得到所述当前主机的资源占用参数信息。
4.根据权利要求1所述的方法,其特征在于,在所述其他主机中剩余的满足条件的主机中,确定当前主机对应的备份主机包括:
获取所有剩余的其他主机对应的资源占用参数信息的平均值;
计算每一其他主机对应的资源占用参数信息与所述平均值之间的差值;
选择对应的差值最小的其他主机,作为当前主机的备份主机。
5.根据权利要求1所述的方法,其特征在于,还包括:
建立对应于当前主机的组群,并将所述备份主机添加至该组群中。
6.根据权利要求5所述的方法,其特征在于,还包括:
接收来自所示虚拟化集群中的其他主机的备份主机选举报文;
若当前主机所属组群的数量已经达到预设上限,则返回验证失败消息;否则从所述备份主机选取报文中读取所述其他主机的资源占用参数信息,并与当前主机的资源占用参数信息进行求和计算;
若求和结果小于预设的第二阈值,则返回验证成功消息,否则返回验证失败消息。
7.根据权利要求5所述的方法,其特征在于,还包括:
获取所述虚拟化集群中除当前主机之外的所有其他主机的资源占用参数信息;
计算所有其他主机的资源占用参数信息的平均值;
筛选出资源占用参数信息小于所述平均值的其他主机,并从中确定所述当前主机的仲裁主机;
将确定的仲裁主机添加至对应于所述当前主机的组群中;
其中,若在预设时间长度内,所述当前主机未接收到来自所述备份主机的保活报文,或未接收到所述备份主机返回的保活报文的响应报文,则向预配置的仲裁主机发送仲裁请求,以由仲裁主机判定发生故障的主机。
8.一种用于虚拟化集群的选举装置,应用于虚拟化集群中的任一主机,其特征在于,包括:
获取单元,用于获取虚拟化集群中所有主机的资源占用参数信息;
计算单元,用于对所述虚拟化集群中的当前主机及所述虚拟化集群中除当前主机之外的其他主机中的每一个主机的资源占用参数信息分别进行求和计算;
筛除单元,用于分别判断每个求和结果是否满足小于或等于预设的第一阈值,并筛除所述其他主机中不满足条件的主机;
确定单元,用于在所述其他主机中剩余的满足条件的主机中,确定当前主机对应的备份主机。
9.根据权利要求8所述的装置,其特征在于,所述获取单元在获取虚拟化集群中所有主机的资源占用参数信息时,通过下述方式获取虚拟化集群中除当前主机之外的其他主机的资源占用参数信息:
向所述其他主机分别发送信息获取请求,并接收分别返回的所述其他主机的资源占用参数信息;
或者,向所述虚拟化集群中的管理主机发送信息获取请求,并接收所述管理主机返回的所述其他主机的资源占用参数信息。
10.根据权利要求8所述的装置,其特征在于,所述获取单元在获取虚拟化集群中所有主机的资源占用参数信息时,通过下述方式获取当前主机的资源占用参数信息:
向所述虚拟化集群中的管理主机发送信息获取请求,并接收所述管理主机返回的当前主机的资源占用参数信息;
或者,读取当前主机中的所有虚拟机的资源占用参数信息,并叠加得到所述当前主机的资源占用参数信息。
11.根据权利要求8所述的装置,其特征在于,所述确定单元具体用于:
获取所有剩余的其他主机对应的资源占用参数信息的平均值;
计算每一其他主机对应的资源占用参数信息与所述平均值之间的差值;
选择对应的差值最小的其他主机,作为当前主机的备份主机。
12.根据权利要求8所述的装置,其特征在于,还包括:
创建单元,用于建立对应于当前主机的组群,并将所述备份主机添加至该组群中。
13.根据权利要求12所述的装置,其特征在于,还包括:
接收单元,用于接收来自所示虚拟化集群中的其他主机的备份主机选举报文;
处理单元,用于在当前主机所属组群的数量已经达到预设上限的情况下,返回验证失败消息;否则从所述备份主机选取报文中读取所述其他主机的资源占用参数信息,并与当前主机的资源占用参数信息进行求和计算;若求和结果小于预设的第二阈值,则返回验证成功消息,否则返回验证失败消息。
14.根据权利要求12所述的方法,其特征在于:
所述获取单元获取所述虚拟化集群中除当前主机之外的所有其他主机的资源占用参数信息;
所述计算单元计算所有其他主机的资源占用参数信息的平均值;
所述确定单元筛选出资源占用参数信息小于所述平均值的其他主机,从中确定所述当前主机的仲裁主机,并将该仲裁主机添加至对应于所述当前主机的组群中;
所述装置还包括:发送单元,用于当在预设时间长度内,所述当前主机未接收到来自所述备份主机的保活报文,或未接收到所述备份主机返回的保活报文的响应报文时,向预配置的仲裁主机发送仲裁请求,以由仲裁主机判定发生故障的主机。
CN201410301929.8A 2014-06-27 2014-06-27 用于虚拟化集群的选举方法及装置 Active CN104079647B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410301929.8A CN104079647B (zh) 2014-06-27 2014-06-27 用于虚拟化集群的选举方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410301929.8A CN104079647B (zh) 2014-06-27 2014-06-27 用于虚拟化集群的选举方法及装置

Publications (2)

Publication Number Publication Date
CN104079647A true CN104079647A (zh) 2014-10-01
CN104079647B CN104079647B (zh) 2017-11-14

Family

ID=51600687

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410301929.8A Active CN104079647B (zh) 2014-06-27 2014-06-27 用于虚拟化集群的选举方法及装置

Country Status (1)

Country Link
CN (1) CN104079647B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110413373A (zh) * 2019-06-21 2019-11-05 无锡华云数据技术服务有限公司 故障虚拟机的恢复方法、装置、电子设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040034807A1 (en) * 2002-08-14 2004-02-19 Gnp Computers, Inc. Roving servers in a clustered telecommunication distributed computer system
CN101217402A (zh) * 2008-01-15 2008-07-09 杭州华三通信技术有限公司 一种提高集群可靠性的方法和一种高可靠性通信节点
CN102521071A (zh) * 2011-11-24 2012-06-27 广州杰赛科技股份有限公司 一种基于私有云的虚拟机维护方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040034807A1 (en) * 2002-08-14 2004-02-19 Gnp Computers, Inc. Roving servers in a clustered telecommunication distributed computer system
CN101217402A (zh) * 2008-01-15 2008-07-09 杭州华三通信技术有限公司 一种提高集群可靠性的方法和一种高可靠性通信节点
CN102521071A (zh) * 2011-11-24 2012-06-27 广州杰赛科技股份有限公司 一种基于私有云的虚拟机维护方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110413373A (zh) * 2019-06-21 2019-11-05 无锡华云数据技术服务有限公司 故障虚拟机的恢复方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN104079647B (zh) 2017-11-14

Similar Documents

Publication Publication Date Title
US10609159B2 (en) Providing higher workload resiliency in clustered systems based on health heuristics
CN108810100B (zh) 一种主节点的选举方法、装置及设备
US12124334B2 (en) Methods and devices for failovers in processing nodes for collaborative computing
CN102546256B (zh) 用于对云计算服务进行监控的系统及方法
EP3335120B1 (en) Method and system for resource scheduling
CN107453929B (zh) 集群系统自构建方法、装置及集群系统
CN102882909B (zh) 云计算服务监控系统及方法
CN110096472B (zh) 节点集群中管理节点的选择
CN108881512B (zh) Ctdb的虚拟ip均衡分配方法、装置、设备及介质
TW201535266A (zh) 虛擬機器之資源調整方法及系統
US9110696B2 (en) Thin client system, connection management server, connection management method and connection management program
CN109873714B (zh) 云计算节点配置更新方法及终端设备
US20160164828A1 (en) Adjusting virtual machine resources
JP2016126677A (ja) 負荷算出方法、負荷算出プログラム及び負荷算出装置
CN111045808A (zh) 一种分布式网络任务调度方法及装置
CN113553179A (zh) 分布式键值存储负载均衡方法及系统
US10892940B2 (en) Scalable statistics and analytics mechanisms in cloud networking
CN109542627A (zh) 节点切换方法、装置、管理机、节点设备和分布式系统
US20200272526A1 (en) Methods and systems for automated scaling of computing clusters
CN103188099B (zh) 一种多应用系统的备份方法、装置及系统
JP2009086741A (ja) 異種ノード混在の分散環境における分散処理制御方法、そのシステム及びそのプログラム
EP2472416A1 (en) Data query system and constructing method thereof and corresponding data query method
CN106815318B (zh) 一种时序数据库的集群化方法及系统
CN106021026B (zh) 一种备份方法及装置
CN104079647A (zh) 用于虚拟化集群的选举方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 310052 Binjiang District Changhe Road, Zhejiang, China, No. 466, No.

Applicant after: Xinhua three Technology Co., Ltd.

Address before: 310052 Binjiang District Changhe Road, Zhejiang, China, No. 466, No.

Applicant before: Huasan Communication Technology Co., Ltd.

GR01 Patent grant
GR01 Patent grant