CN108376103A - 一种云平台的资源平衡控制方法及服务器 - Google Patents
一种云平台的资源平衡控制方法及服务器 Download PDFInfo
- Publication number
- CN108376103A CN108376103A CN201810128698.3A CN201810128698A CN108376103A CN 108376103 A CN108376103 A CN 108376103A CN 201810128698 A CN201810128698 A CN 201810128698A CN 108376103 A CN108376103 A CN 108376103A
- Authority
- CN
- China
- Prior art keywords
- cloud host
- cloud
- host
- migration
- calculate node
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5083—Techniques for rebalancing the load in a distributed system
- G06F9/5088—Techniques for rebalancing the load in a distributed system involving task migration
Abstract
本发明公开一种云平台的资源平衡控制方法及服务器。其中,所述方法包括:控制节点定时获取多个计算节点以及运行在所述多个计算节点上的云主机的监控信息;所述控制节点根据多个所述计算节点以及运行在所述多个计算节点上的云主机的监控信息和预设的迁移模型,获得调度结果;其中,所述调度结果包括需要进行迁移的云主机及其迁移的目标计算节点;所述控制节点基于所述调度结果生成迁移控制信息,并发送所述迁移控制信息至所述需要进行迁移的云主机所在的计算节点,以使得所述需要进行迁移的云主机迁移至所述目标计算节点。所述服务器用于执行上述方法。本发明提供的云平台的资源平衡控制方法及服务器,提高了云平台运行的稳定性。
Description
技术领域
本发明涉及互联网技术领域,具体涉及一种云平台的资源平衡控制方法及服务器。
背景技术
在通常的云平台中,包括多个计算节点,这些计算节点可以通过物理机组成的。在各计算节点上,可以配置云主机,预先分配资源给云主机,以处理各种各样的网络业务。
在云平台中,云主机的调度主要通过预分配来实现,在云主机创建时,确定所在的计算节点。然而,云主机在运行的过程中对CPU、内存等资源的需求普遍不均,上述预分配的方式势必造成云主机的资源分配的不均衡,产生一系列的问题。首先,预分配的方式,规定了云主机所在的计算节点,后期虽然可以通过冷、热迁移来重新实现云主机的调度,但需要人工干预,在云平台存在大量云主机的情况下,云主机的迁移效率低下。其次,云主机在使用过程中,对CPU、网络带宽、内存等资源的占用是不均衡,经常出现一个计算节点上CPU满负载,内存却一直维持在低值运行,而另外一个计算节点上内存满负荷,而CPU占用较低的情况,云平台中对云主机资源的使用遵循的是木桶效应,单一资源被过度占用势必影响云主机的性能。再有,云平台中,特别是部署在公网中的云平台中,常出现流量劫持等问题,使带宽资源大量占用,云平台中则出现消息拥堵等现象,严重影响云平台的运行。
因此,如何提出一种方法,能够自动对云平台的云主机进行调度,以提高云平台运行的稳定性成为业界亟待解决的重要课题。
发明内容
针对现有技术中的缺陷,本发明提供一种云平台的资源平衡控制方法及服务器。
一方面,本发明提出一种云平台的资源平衡控制方法,包括:
控制节点定时获取多个计算节点以及运行在所述多个计算节点上的云主机的监控信息;
所述控制节点根据多个所述计算节点以及运行在所述多个计算节点上的云主机的监控信息和预设的迁移模型,获得调度结果;其中,所述调度结果包括需要进行迁移的云主机及其迁移的目标计算节点;
所述控制节点基于所述调度结果生成迁移控制信息,并发送所述迁移控制信息至所述需要进行迁移的云主机所在的计算节点,以使得所述需要进行迁移的云主机迁移至所述目标计算节点。
其中,在所述控制节点根据多个计算节点以及运行在所述多个计算节点上的云主机的监控信息和预设的迁移模型,获得调度结果之前,还包括:
所述控制节点根据各个所述云主机的监控信息以及预设规则,获得需要进行隔离的云主机;
所述控制节点发送隔离控制信息至所述需要进行隔离的云主机所在的计算节点,以使得所述需要进行隔离的云主机被隔离。
其中,所述云主机的监控信息包括所述云主机的CPU使用率、内存使用量、网卡流量和硬盘转速;
相应的,所述预设规则包括:
所述云主机所在的计算节点上的其它云主机的CPU使用率之和小于等于所述云主机的CPU使用率,或者所述其它云主机的内存使用量之和小于等于所述云主机的内存使用量,或者所述其它云主机的网卡流量之和小于等于所述云主机的网卡流量,或者所述其它云主机的硬盘转速之和小于等于所述云主机的硬盘转速。
其中,所述控制节点根据多个计算节点以及运行在所述多个计算节点上的云主机的监控信息和预设的迁移模型,获得调度结果包括:
所述控制节点若获得多个所述调度结果,则选用所述需要进行迁移的云主机的数量最少的调度结果。
其中,所述计算节点的监控信息包括所述计算节点的CPU使用率、内存使用量、网卡流量、硬盘转速和主板温度,所述云主机的监控信息包括所述云主机的CPU使用率、内存使用量、网卡流量和硬盘转速。
另一方面,本发明提供一种服务器,包括:
获取单元,用于定时获取多个计算节点以及运行在所述多个计算节点上的云主机的监控信息;
第一处理单元,用于根据多个所述计算节点以及运行在所述多个计算节点上的云主机的监控信息和预设的迁移模型,获得调度结果;其中,所述调度结果包括需要进行迁移的云主机及其迁移的目标计算节点;
第二发送单元,用于基于所述调度结果生成迁移控制信息,并发送所述迁移控制信息至所述需要进行迁移的云主机所在的计算节点,以使得所述需要进行迁移的云主机迁移至所述目标计算节点。
其中,所述服务器还包括第二处理单元和第二发送单元,其中:
第二处理单元,用于根据各个所述云主机的监控信息以及预设规则,获得需要进行隔离的云主机;
第二发送单元,用于发送隔离控制信息至所述需要进行隔离的云主机所在的计算节点,以使得所述需要进行隔离的云主机被隔离。
其中,所述云主机的监控信息包括所述云主机的CPU使用率、内存使用量、网卡流量和硬盘转速;
相应的,所述预设规则包括:
所述云主机所在的计算节点上的其它云主机的CPU使用率之和小于等于所述云主机的CPU使用率,或者所述其它云主机的内存使用量之和小于等于所述云主机的内存使用量,或者所述其它云主机的网卡流量之和小于等于所述云主机的网卡流量,或者所述其它云主机的硬盘转速之和小于等于所述云主机的硬盘转速。
再一方面,本发明提供一种电子设备,包括:处理器、存储器和通信总线,其中:
所述处理器和所述存储器通过所述通信总线完成相互间的通信;
所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如上述各实施例提供的云平台的资源平衡控制方法。
又一方面,本发明提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行如上述各实施例提供的云平台的资源平衡控制方法。
本发明提供的云平台的资源平衡控制方法及服务器,由于控制节点定时获取多个计算节点以及运行在多个计算节点上的云主机的监控信息,并根据多个计算节点以及运行在多个计算节点上的云主机的监控信息和预设的迁移模型,获得调度结果,然后基于调度结果生成迁移控制信息,并发送迁移控制信息至需要进行迁移的云主机所在的计算节点,以使得需要进行迁移的云主机迁移至目标计算节点,能够平衡云主机对云平台的计算节点的资源占用,防止计算节点的单一资源的过高占用,提高了云平台运行的稳定性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一实施例云平台的结构示意图;
图2为本发明一实施例云平台的资源平衡控制方法的流程示意图;
图3为本发明另一实施例云平台的资源平衡控制方法的流程示意图;
图4为本发明一实施例服务器的结构示意图;
图5为本发明另一实施例服务器的结构示意图;
图6为本发明一实施例电子设备的实体结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明一实施例云平台的结构示意图,如图1所示,所述云平台包括至少一个控制节点1、消息服务器2和多个计算节点3。每个计算节点3可以运行多个云主机,在每个计算节点3安装有物理机监控agent,可以采集计算节点3的CPU使用率、内存使用量、网卡流量、硬盘转速和主板温度等监控信息,在每个云主机安装有云主机监控agent,可以采集所述云主机的CPU使用率、内存使用量、网卡流量和硬盘转速等监控信息。每个计算节点3的物理机监控agent以及计算节点3上运行的云主机的云主机监控agent可以将采集的监控信息上报给消息服务器2。消息服务器2安装有消息中间件,所述消息中间件例如Kafka、RabbitMQ、RocketMQ等。消息服务器2通过所述消息中间件接收上述监控信息,并对上述监控信息进行去重、清洗、合并、格式装换等步骤将处理过的上述监控信息推送到监控信息队列。控制节点1可以从消息服务器2的监控信息队列中获取到经过处理的监控信息。其中,所述控制节点可以采用服务器实现。
图2为本发明一实施例云平台的资源平衡控制方法的流程示意图,如图2所示,本发明提供的云平台的资源平衡控制方法,包括:
S201、控制节点定时获取多个计算节点以及运行在所述多个计算节点上的云主机的监控信息;
具体地,多个计算节点以及运行在所述多个计算节点上的云主机可以将各自的监控信息上报给消息服务器,控制节点可以定时从所述消息服务器获得多个计算节点以及运行在所述多个计算节点上的云主机的监控信息,例如每30秒针获取一次上述监控信息。所述计算节点的监控信息可以包括所述计算节点的CPU使用率、内存使用量、网卡流量、硬盘转速和主板温度,所述云主机的监控信息可以包括所述云主机的CPU使用率、内存使用量、网卡流量和硬盘转速。
S202、所述控制节点根据多个所述计算节点以及运行在所述多个计算节点上的云主机的监控信息和预设的迁移模型,获得调度结果;其中,所述调度结果包括需要进行迁移的云主机及其迁移的目标计算节点;
具体地,所述控制节点在获得所述多个计算节点以及运行在所述多个计算节点上的云主机的监控信息之后,将所述多个计算节点以及运行在所述多个计算节点上的云主机的监控信息进行归一化处理,并将归一化处理后的结果输入到预设的迁移模型中,从而获得调度结果,所述调度结果包括需要进行迁移的云主机及其迁移的目标计算节点,即需要将哪些所述云主机进行迁移,这些所述云主机分别要迁移到哪些所述计算节点上,那些迁移到的所述计算节点即所述目标计算节点。其中,所述迁移模型是根据动态规划算法预设的,目的是重新分配各个所述计算节点的云主机,优化所述云平台的整体资源消耗,使各个所述计算节点的资源消耗平衡。
例如,云平台Y有三个所述计算节点在工作:计算节点B,计算节点C和计算节点D。计算节点B上运行了云主机b1和云主机b2,计算节点C上运行了云主机c1、云主机c2和云主机c3,计算节点D上运行了云主机d1、云主机d2、云主机d3和云主机d4。所述控制节点获取的监控信息包括计算节点B的CPU使用率、内存使用量、网卡流量、硬盘转速和主板温度,云主机b1和云主机b2的CPU使用率、内存使用量、网卡流量和硬盘转速;计算节点C的CPU使用率、内存使用量、网卡流量、硬盘转速和主板温度,云主机c1、云主机c2和云主机c3的CPU使用率、内存使用量、网卡流量和硬盘转速;计算节点D的CPU使用率、内存使用量、网卡流量、硬盘转速和主板温度,云主机d1、云主机d2、云主机d3和云主机d4的CPU使用率、内存使用量、网卡流量和硬盘转速。所述控制节点对获取到的监控信息进行归一化处理,分别获得经过归一化处理的计算节点B的CPU使用率mB、内存使用量gB、网卡流量nB、硬盘转速iB和主板温度tB,云主机b1的CPU使用率mb1、内存使用量gb1、网卡流量nb1和硬盘转速ib1,云主机b2的CPU使用率mb2、内存使用量gb2、网卡流量nb2和硬盘转速ib2,计算节点C的CPU使用率mC、内存使用量gC、网卡流量nC、硬盘转速iC和主板温度tC,云主机c1的CPU使用率mc1、内存使用量gc1、网卡流量nc1和硬盘转速ic1,云主机c2的CPU使用率mc2、内存使用量gc2、网卡流量nc2和硬盘转速ic2,云主机c3的CPU使用率mc3、内存使用量gc3、网卡流量nc3和硬盘转速ic3,计算节点D的CPU使用率mD、内存使用量gD、网卡流量nD、硬盘转速iD和主板温度tD,云主机d1的CPU使用率md1、内存使用量gd1、网卡流量nd1和硬盘转速id1,云主机d2的CPU使用率md2、内存使用量gd2、网卡流量nd2和硬盘转速id2,云主机d3的CPU使用率md3、内存使用量gd3、网卡流量nd3和硬盘转速id3,和云主机d4的CPU使用率md4、内存使用量gd4、网卡流量nd4和硬盘转速id4。
设置R=α1m+α2g+α3n+α4i+α5t,R为所述计算节点的资源度量值,其中,m、g、n、i和t分别为经过归一化处理的所述计算节点的CPU使用率、内存使用量、网卡流量、硬盘转速和主板温度,α1、α2、α3、α4和α5为权重值,α1、α2、α3、α4和α5根据实际经验进行设置,本发明实施例不做限定。计算节点B的资源度量值为RB=α1mB+α2gB+α3nB+α4iB+α5tB,计算节点C的资源度量值,为RC=α1mC+α2gc+α3nC+α4iC+α5tC,计算节点D的资源度量值为RD=α1mD+α2gD+α3nD+α4iD+α5tD。设定目标函数为各个所述计算节点的资源度量函数值之和,所述迁移模型包括所述目标函数,云平台Y的目标函数f(R)=RB+RC+RD,通过调整所述云主机所在的计算节点,可以重新获得各个所述计算节点的资源度量值,从而重新获得所述目标函数值。假设将云主机d4从计算节点D迁移至计算节点B,那么RB′=α1(mB+md4)+α2(gB+gd4)+α3(nB+nd4)+α4(iB+id4)+α5tB,RC=RC′,RD'=α1(mD-md4)+α2(gD-gd4)+α3(nD-nd4)+α4(iD-id4)+α5tD,从而可以获得云平台Y的目标函数f(R)′,对比f(R)和f(R)',如果f(R)′的值较小,说明将云主机d4从计算节点D迁移至计算节点B云平台Y的运行更稳定。所述控制节点可以通过调整各个所述云主机所在的计算节点,获得新的目标函数值。在所述目标函数值最小时,获取各个所述计算节点上运行的云主机,与当前各个所述计算节点上运行的云主机进行对比,从而获得所述调度结果。
S203、所述控制节点基于所述调度结果生成迁移控制信息,并发送所述迁移控制信息至所述需要进行迁移的云主机所在的计算节点,以使得所述需要进行迁移的云主机迁移至所述目标计算节点。
具体地,所述控制节点在获得所述调度结果之后,即可得到需要进行迁移的所述云主机以及其迁移的目标计算节点。所述控制节点基于所述调度结果生成迁移控制信息,所述迁移控制信息封装调度信息。所述控制节点将所述迁移控制信息发送至所述需要进行迁移的云主机所在的计算节点,上述计算节点根据所述迁移控制信息中包括的调度信息发起迁移操作以使得所述需要进行迁移的云主机迁移至所述目标计算节点。
例如:调度信息的格式为:uuid:chostID:dhostID:Action。其中:uuid表示所述云主机的标识,chostID表示所述云主机所属的计算节点,dhostID表示目标计算节点的标识,Action表示执行参数:当Action为0时表示不执行任何动作,当Action为1时表示执行迁移操作。
本发明提供的云平台的资源平衡控制方法,由于控制节点定时获取多个计算节点以及运行在多个计算节点上的云主机的监控信息,并根据多个计算节点以及运行在多个计算节点上的云主机的监控信息和预设的迁移模型,获得调度结果,然后基于调度结果生成迁移控制信息,并发送迁移控制信息至需要进行迁移的云主机所在的计算节点,以使得需要进行迁移的云主机迁移至目标计算节点,能够平衡云主机对云平台的计算节点的资源占用,防止计算节点的单一资源的过高占用,提高了云平台运行的稳定性。
图3为本发明另一实施例云平台的资源平衡控制方法的流程示意图,在所述控制节点根据多个计算节点以及运行在所述多个计算节点上的云主机的监控信息和预设的迁移模型,获得调度结果之前,还包括:
S301、所述控制节点根据各个所述云主机的监控信息以及预设规则,获得需要进行隔离的云主机;
具体地,所述控制节点在获得各个所述云主机的监控信息之后,判断各个所述云主机的监控信息是否满足预设规则,如果所述云主机的监控信息满足所述预设规则,那么将所述云主机作为需要进行隔离的云主机。
例如,所述云主机的监控信息包括所述云主机的CPU使用率、内存使用量、网卡流量和硬盘转速;相应的,所述预设规则包括:所述云主机所在的计算节点上的其它云主机的CPU使用率之和小于等于所述云主机的CPU使用率,或者所述其它云主机的内存使用量之和小于等于所述云主机的内存使用量,或者所述其它云主机的网卡流量之和小于等于所述云主机的网卡流量,或者所述其它云主机的硬盘转速之和小于等于所述云主机的硬盘转速。
S302、所述控制节点发送隔离控制信息至所述需要进行隔离的云主机所在的计算节点,以使得所述需要进行隔离的云主机被隔离。
具体地,所述控制节点在确定需要进行隔离的云主机之后,生成每个所述需要进行隔离的云主机的隔离控制信息,并将所述隔离控制信息发送至所述需要进行隔离的云主机所在的计算节点,所述计算节点调用进程隔离工具,例如taskset,对所述需要进行隔离的云主机进行隔离,即对上述云主机使用的CPU、内存、硬盘等资源进行隔离。其中,所述隔离控制信息可以包括需要进行隔离的云主机的标识和进行隔离操作的命令。对满足所述预设规则的云主机进行隔离操作,降低个别流量异常或者对计算节点的资源具有较高的长时间占用的云主机,对云平台运行的影响,避免云平台由于平台资源不足引发的问题,降低云平台瘫痪的风险。可理解的是,对于需要进行隔离的云主机,不再进行迁移。
在上述各实施例的基础上,进一步地,所述云主机的监控信息包括所述云主机的CPU使用率、内存使用量、网卡流量和硬盘转速;
相应的,所述预设规则包括:
所述云主机所在的计算节点上的其它云主机的CPU使用率之和小于等于所述云主机的CPU使用率,或者所述其它云主机的内存使用量之和小于等于所述云主机的内存使用量,或者所述其它云主机的网卡流量之和小于等于所述云主机的网卡流量,或者所述其它云主机的硬盘转速之和小于等于所述云主机的硬盘转速。
具体地,所述云主机的监控信息可以包括所述云主机的CPU使用率、内存使用量、网卡流量和硬盘转速。所述预设规则包括:所述云主机所在的计算节点上的其它云主机的CPU使用率之和小于等于所述云主机的CPU使用率,或者所述其它云主机的内存使用量之和小于等于所述云主机的内存使用量,或者所述其它云主机的网卡流量之和小于等于所述云主机的网卡流量,或者所述其它云主机的硬盘转速之和小于等于所述云主机的硬盘转速。
例如,计算节点A上运行了云主机a、云主机b、云主机c和云主机d四个所述云主机。所述控制节点获得云主机a的CPU使用率为51%,云主机b的CPU使用率为5%、云主机c的CPU使用率为17%,云主机d的CPU使用率为20%。所述控制节点计算云主机b、云主机c和云主机d的CPU使用率之和为5%+17%+20%=42%,小于云主机a的CPU使用率51%,那么云主机a为所述需要进行隔离的云主机,所述控制节点会发送隔离控制信息至计算节点A,以使得云主机a被隔离。
在上述各实施例的基础上,进一步地,所述控制节点根据多个计算节点以及运行在所述多个计算节点上的云主机的监控信息和预设的迁移模型,获得调度结果包括:
所述控制节点若获得多个所述调度结果,则选用所述需要进行迁移的云主机的数量最少的调度结果。
具体地,当所述控制节点获得多个所述调度结果时,计算每个所述调度结果需要迁移的云主机的数量,选用所述需要进行迁移的云主机的数量最少的调度结果。在所述云主机的迁移的过程中,会暂时中断所述云主机的服务,选用迁移的云主机的数量最少的调度结果,以减少对所述云平台的服务的影响。
在上述各实施例的基础上,进一步地,所述计算节点的监控信息包括所述计算节点的CPU使用率、内存使用量、网卡流量、硬盘转速和主板温度,所述云主机的监控信息包括所述云主机的CPU使用率、内存使用量、网卡流量和硬盘转速。
具体地,所述计算节点的监控信息包括所述计算节点的CPU使用率、内存使用量、网卡流量、硬盘转速和主板温度,所述云主机的监控信息包括所述云主机的CPU使用率、内存使用量、网卡流量和硬盘转速。
图4为本发明一实施例服务器的结构示意图,如图4所示,本发明提供的服务器包括获取单元401、第一处理单元402和第一发送单元403,其中:
获取单元401用于定时获取多个计算节点以及运行在所述多个计算节点上的云主机的监控信息;第一处理单元402用于根据多个所述计算节点以及运行在所述多个计算节点上的云主机的监控信息和预设的迁移模型,获得调度结果;其中,所述调度结果包括需要进行迁移的云主机及其迁移的目标计算节点;第一发送单元403用于基于所述调度结果生成迁移控制信息,并发送所述迁移控制信息至所述需要进行迁移的云主机所在的计算节点,以使得所述需要进行迁移的云主机迁移至所述目标计算节点。
具体地,多个计算节点以及运行在所述多个计算节点上的云主机可以将各自的监控信息上报给消息服务器,获取单元401可以定时从所述消息服务器获得多个计算节点以及运行在所述多个计算节点上的云主机的监控信息,例如每30秒针获取一次上述监控信息。所述计算节点的监控信息可以包括所述计算节点的CPU使用率、内存使用量、网卡流量、硬盘转速和主板温度,所述云主机的监控信息可以包括所述云主机的CPU使用率、内存使用量、网卡流量和硬盘转速。
在获得所述多个计算节点以及运行在所述多个计算节点上的云主机的监控信息之后,第一处理单元402将所述多个计算节点以及运行在所述多个计算节点上的云主机的监控信息进行归一化处理,并将归一化处理后的结果输入到预设的迁移模型中,从而获得调度结果,所述调度结果包括需要进行迁移的云主机及其迁移的目标计算节点,即需要将哪些所述云主机进行迁移,这些所述云主机分别要迁移到哪些所述计算节点上,那些迁移到的所述计算节点即所述目标计算节点。其中,所述迁移模型是根据动态规划算法预设的,目的是重新分配各个所述计算节点的云主机,优化所述云平台的整体资源消耗,使各个所述计算节点的资源消耗平衡。
第一发送单元403在获得所述调度结果之后,即可得到需要进行迁移的所述云主机以及其迁移的目标计算节点。第一发送单元403基于所述调度结果生成迁移控制信息,所述迁移控制信息封装调度信息。第一发送单元403将所述迁移控制信息发送至所述需要进行迁移的云主机所在的计算节点,上述计算节点根据所述迁移控制信息中包括的调度信息发起迁移操作以使得所述需要进行迁移的云主机迁移至所述目标计算节点。
本发明提供的服务器,由于定时获取多个计算节点以及运行在多个计算节点上的云主机的监控信息,并根据多个计算节点以及运行在多个计算节点上的云主机的监控信息和预设的迁移模型,获得调度结果,然后基于调度结果生成迁移控制信息,并发送迁移控制信息至需要进行迁移的云主机所在的计算节点,以使得需要进行迁移的云主机迁移至目标计算节点,能够平衡云主机对云平台的计算节点的资源占用,防止计算节点的单一资源的过高占用,提高了云平台运行的稳定性。
图5为本发明另一实施例服务器的结构示意图,本发明提供的服务器还包括第二处理单元404和第二发送单元405,其中:
第二处理单元404用于根据各个所述云主机的监控信息以及预设规则,获得需要进行隔离的云主机;第二发送单元405用于发送隔离控制信息至所述需要进行隔离的云主机所在的计算节点,以使得所述需要进行隔离的云主机被隔离。
具体地,第二处理单元404在获得各个所述云主机的监控信息之后,判断各个所述云主机的监控信息是否满足预设规则,如果所述云主机的监控信息满足所述预设规则,那么将所述云主机作为需要进行隔离的云主机。
第二发送单元405在确定需要进行隔离的云主机之后,生成每个所述需要进行隔离的云主机的隔离控制信息,并将所述隔离控制信息发送至所述需要进行隔离的云主机所在的计算节点,所述计算节点调用进程隔离工具,例如taskset,对所述需要进行隔离的云主机进行隔离,即对上述云主机使用的CPU、内存、硬盘等资源进行隔离。其中,所述隔离控制信息可以包括需要进行隔离的云主机的标识和进行隔离操作的命令。对满足所述预设规则的云主机进行隔离操作,降低个别流量异常或者对计算节点的资源具有较高的长时间占用的云主机,对云平台运行的影响,避免云平台由于平台资源不足引发的问题,降低云平台瘫痪的风险。可理解的是,对于需要进行隔离的云主机,不再进行迁移。
在上述各实施例的基础上,进一步地,所述云主机的监控信息包括所述云主机的CPU使用率、内存使用量、网卡流量和硬盘转速;
相应的,所述预设规则包括:
所述云主机所在的计算节点上的其它云主机的CPU使用率之和小于等于所述云主机的CPU使用率,或者所述其它云主机的内存使用量之和小于等于所述云主机的内存使用量,或者所述其它云主机的网卡流量之和小于等于所述云主机的网卡流量,或者所述其它云主机的硬盘转速之和小于等于所述云主机的硬盘转速。
具体地,所述云主机的监控信息可以包括所述云主机的CPU使用率、内存使用量、网卡流量和硬盘转速。所述预设规则包括:所述云主机所在的计算节点上的其它云主机的CPU使用率之和小于等于所述云主机的CPU使用率,或者所述其它云主机的内存使用量之和小于等于所述云主机的内存使用量,或者所述其它云主机的网卡流量之和小于等于所述云主机的网卡流量,或者所述其它云主机的硬盘转速之和小于等于所述云主机的硬盘转速。
本发明提供的服务器的实施例具体可以用于执行上述各方法实施例的处理流程,其功能在此不再赘述,可以参照上述方法实施例的详细描述。
图6为本发明一实施例电子设备的实体结构示意图,如图6所示,所述电子设备包括处理器(processor)601、存储器(memory)602和通信总线603;
其中,处理器601、存储器602通过通信总线603完成相互间的通信;
处理器601用于调用存储器602中的程序指令,以执行上述各方法实施例所提供的方法,例如包括:控制节点定时获取多个计算节点以及运行在所述多个计算节点上的云主机的监控信息;所述控制节点根据多个所述计算节点以及运行在所述多个计算节点上的云主机的监控信息和预设的迁移模型,获得调度结果;其中,所述调度结果包括需要进行迁移的云主机及其迁移的目标计算节点;所述控制节点基于所述调度结果生成迁移控制信息,并发送所述迁移控制信息至所述需要进行迁移的云主机所在的计算节点,以使得所述需要进行迁移的云主机迁移至所述目标计算节点。
本实施例公开一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法实施例所提供的方法,例如包括:控制节点定时获取多个计算节点以及运行在所述多个计算节点上的云主机的监控信息;所述控制节点根据多个所述计算节点以及运行在所述多个计算节点上的云主机的监控信息和预设的迁移模型,获得调度结果;其中,所述调度结果包括需要进行迁移的云主机及其迁移的目标计算节点;所述控制节点基于所述调度结果生成迁移控制信息,并发送所述迁移控制信息至所述需要进行迁移的云主机所在的计算节点,以使得所述需要进行迁移的云主机迁移至所述目标计算节点。
本实施例提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行上述各方法实施例所提供的方法,例如包括:控制节点定时获取多个计算节点以及运行在所述多个计算节点上的云主机的监控信息;所述控制节点根据多个所述计算节点以及运行在所述多个计算节点上的云主机的监控信息和预设的迁移模型,获得调度结果;其中,所述调度结果包括需要进行迁移的云主机及其迁移的目标计算节点;所述控制节点基于所述调度结果生成迁移控制信息,并发送所述迁移控制信息至所述需要进行迁移的云主机所在的计算节点,以使得所述需要进行迁移的云主机迁移至所述目标计算节点。
此外,上述的存储器中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,装置,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种云平台的资源平衡控制方法,其特征在于,包括:
控制节点定时获取多个计算节点以及运行在所述多个计算节点上的云主机的监控信息;
所述控制节点根据多个所述计算节点以及运行在所述多个计算节点上的云主机的监控信息和预设的迁移模型,获得调度结果;其中,所述调度结果包括需要进行迁移的云主机及其迁移的目标计算节点;
所述控制节点基于所述调度结果生成迁移控制信息,并发送所述迁移控制信息至所述需要进行迁移的云主机所在的计算节点,以使得所述需要进行迁移的云主机迁移至所述目标计算节点。
2.根据权利要求1所述的方法,其特征在于,在所述控制节点根据多个计算节点以及运行在所述多个计算节点上的云主机的监控信息和预设的迁移模型,获得调度结果之前,还包括:
所述控制节点根据各个所述云主机的监控信息以及预设规则,获得需要进行隔离的云主机;
所述控制节点发送隔离控制信息至所述需要进行隔离的云主机所在的计算节点,以使得所述需要进行隔离的云主机被隔离。
3.根据权利要求2所述的方法,其特征在于,所述云主机的监控信息包括所述云主机的CPU使用率、内存使用量、网卡流量和硬盘转速;
相应的,所述预设规则包括:
所述云主机所在的计算节点上的其它云主机的CPU使用率之和小于等于所述云主机的CPU使用率,或者所述其它云主机的内存使用量之和小于等于所述云主机的内存使用量,或者所述其它云主机的网卡流量之和小于等于所述云主机的网卡流量,或者所述其它云主机的硬盘转速之和小于等于所述云主机的硬盘转速。
4.根据权利要求1所述的方法,其特征在于,所述控制节点根据多个计算节点以及运行在所述多个计算节点上的云主机的监控信息和预设的迁移模型,获得调度结果包括:
所述控制节点若获得多个所述调度结果,则选用所述需要进行迁移的云主机的数量最少的调度结果。
5.根据权利要求1至4任一项所述的方法,其特征在于,所述计算节点的监控信息包括所述计算节点的CPU使用率、内存使用量、网卡流量、硬盘转速和主板温度,所述云主机的监控信息包括所述云主机的CPU使用率、内存使用量、网卡流量和硬盘转速。
6.一种服务器,其特征在于,包括:
获取单元,用于定时获取多个计算节点以及运行在所述多个计算节点上的云主机的监控信息;
第一处理单元,用于根据多个所述计算节点以及运行在所述多个计算节点上的云主机的监控信息和预设的迁移模型,获得调度结果;其中,所述调度结果包括需要进行迁移的云主机及其迁移的目标计算节点;
第二发送单元,用于基于所述调度结果生成迁移控制信息,并发送所述迁移控制信息至所述需要进行迁移的云主机所在的计算节点,以使得所述需要进行迁移的云主机迁移至所述目标计算节点。
7.根据权利要求6所述的装置,其特征在于,还包括第二处理单元和第二发送单元,其中:
第二处理单元,用于根据各个所述云主机的监控信息以及预设规则,获得需要进行隔离的云主机;
第二发送单元,用于发送隔离控制信息至所述需要进行隔离的云主机所在的计算节点,以使得所述需要进行隔离的云主机被隔离。
8.根据权利要求7所述的装置,其特征在于,所述云主机的监控信息包括所述云主机的CPU使用率、内存使用量、网卡流量和硬盘转速;
相应的,所述预设规则包括:
所述云主机所在的计算节点上的其它云主机的CPU使用率之和小于等于所述云主机的CPU使用率,或者所述其它云主机的内存使用量之和小于等于所述云主机的内存使用量,或者所述其它云主机的网卡流量之和小于等于所述云主机的网卡流量,或者所述其它云主机的硬盘转速之和小于等于所述云主机的硬盘转速。
9.一种电子设备,其特征在于,包括:处理器、存储器和通信总线,其中:
所述处理器和所述存储器通过所述通信总线完成相互间的通信;
所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如权利要求1至5任一项所述的方法。
10.一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行如权利要求1至5任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810128698.3A CN108376103A (zh) | 2018-02-08 | 2018-02-08 | 一种云平台的资源平衡控制方法及服务器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810128698.3A CN108376103A (zh) | 2018-02-08 | 2018-02-08 | 一种云平台的资源平衡控制方法及服务器 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108376103A true CN108376103A (zh) | 2018-08-07 |
Family
ID=63017396
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810128698.3A Pending CN108376103A (zh) | 2018-02-08 | 2018-02-08 | 一种云平台的资源平衡控制方法及服务器 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108376103A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110247802A (zh) * | 2019-06-19 | 2019-09-17 | 北京百度网讯科技有限公司 | 针对云服务单机环境的资源配置方法及装置 |
CN110618739A (zh) * | 2019-10-08 | 2019-12-27 | 黄木津 | 一种具有减震缓冲功能的大数据储存设备 |
CN111104285A (zh) * | 2019-12-17 | 2020-05-05 | 武汉武钢绿色城市技术发展有限公司 | 一种基于OpenStack的云计算平台的运行监控方法 |
CN111866054A (zh) * | 2019-12-16 | 2020-10-30 | 北京小桔科技有限公司 | 一种云主机的搭建方法、装置、电子设备及可读存储介质 |
CN113961319A (zh) * | 2021-08-13 | 2022-01-21 | 北京字节跳动网络技术有限公司 | 作业热迁移的方法、装置、电子设备及存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104035542A (zh) * | 2014-05-28 | 2014-09-10 | 中国科学院计算技术研究所 | 一种计算与制冷能耗权衡的虚拟机迁移方法及系统 |
CN104468407A (zh) * | 2013-09-16 | 2015-03-25 | 中国电信股份有限公司 | 实现业务平台资源弹性分配的方法与装置 |
CN104657215A (zh) * | 2013-11-19 | 2015-05-27 | 南京鼎盟科技有限公司 | 云计算中虚拟化节能系统 |
US20160044035A1 (en) * | 2012-04-05 | 2016-02-11 | Arizona Board Of Regents On Behalf Of Arizona State University | Systems and Apparatuses for a Secure Mobile Cloud Framework for Mobile Computing and Communication |
CN105511944A (zh) * | 2016-01-07 | 2016-04-20 | 上海海事大学 | 一种云系统内部虚拟机的异常检测方法 |
CN106790726A (zh) * | 2017-03-30 | 2017-05-31 | 电子科技大学 | 一种基于Docker云平台的优先级队列动态反馈负载均衡资源调度方法 |
CN106970831A (zh) * | 2017-05-15 | 2017-07-21 | 金航数码科技有限责任公司 | 一种面向云平台的虚拟机资源动态调度系统及方法 |
CN107579858A (zh) * | 2017-09-28 | 2018-01-12 | 厦门集微科技有限公司 | 云主机的告警方法及装置、通信系统 |
-
2018
- 2018-02-08 CN CN201810128698.3A patent/CN108376103A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160044035A1 (en) * | 2012-04-05 | 2016-02-11 | Arizona Board Of Regents On Behalf Of Arizona State University | Systems and Apparatuses for a Secure Mobile Cloud Framework for Mobile Computing and Communication |
CN104468407A (zh) * | 2013-09-16 | 2015-03-25 | 中国电信股份有限公司 | 实现业务平台资源弹性分配的方法与装置 |
CN104657215A (zh) * | 2013-11-19 | 2015-05-27 | 南京鼎盟科技有限公司 | 云计算中虚拟化节能系统 |
CN104035542A (zh) * | 2014-05-28 | 2014-09-10 | 中国科学院计算技术研究所 | 一种计算与制冷能耗权衡的虚拟机迁移方法及系统 |
CN105511944A (zh) * | 2016-01-07 | 2016-04-20 | 上海海事大学 | 一种云系统内部虚拟机的异常检测方法 |
CN106790726A (zh) * | 2017-03-30 | 2017-05-31 | 电子科技大学 | 一种基于Docker云平台的优先级队列动态反馈负载均衡资源调度方法 |
CN106970831A (zh) * | 2017-05-15 | 2017-07-21 | 金航数码科技有限责任公司 | 一种面向云平台的虚拟机资源动态调度系统及方法 |
CN107579858A (zh) * | 2017-09-28 | 2018-01-12 | 厦门集微科技有限公司 | 云主机的告警方法及装置、通信系统 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110247802A (zh) * | 2019-06-19 | 2019-09-17 | 北京百度网讯科技有限公司 | 针对云服务单机环境的资源配置方法及装置 |
CN110247802B (zh) * | 2019-06-19 | 2022-04-19 | 北京百度网讯科技有限公司 | 针对云服务单机环境的资源配置方法及装置 |
CN110618739A (zh) * | 2019-10-08 | 2019-12-27 | 黄木津 | 一种具有减震缓冲功能的大数据储存设备 |
CN111866054A (zh) * | 2019-12-16 | 2020-10-30 | 北京小桔科技有限公司 | 一种云主机的搭建方法、装置、电子设备及可读存储介质 |
CN111104285A (zh) * | 2019-12-17 | 2020-05-05 | 武汉武钢绿色城市技术发展有限公司 | 一种基于OpenStack的云计算平台的运行监控方法 |
CN113961319A (zh) * | 2021-08-13 | 2022-01-21 | 北京字节跳动网络技术有限公司 | 作业热迁移的方法、装置、电子设备及存储介质 |
CN113961319B (zh) * | 2021-08-13 | 2023-11-07 | 抖音视界有限公司 | 作业热迁移的方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20200287961A1 (en) | Balancing resources in distributed computing environments | |
CN108376103A (zh) | 一种云平台的资源平衡控制方法及服务器 | |
Mazumdar et al. | Power efficient server consolidation for cloud data center | |
CN112153700B (zh) | 一种网络切片资源管理方法及设备 | |
EP2629490B1 (en) | Optimizing traffic load in a communications network | |
CN107239336B (zh) | 一种实现任务调度的方法及装置 | |
CN111966500B (zh) | 资源调度方法、装置、电子设备及存储介质 | |
CN109788046B (zh) | 一种基于改进蜂群算法的多策略边缘计算资源调度方法 | |
CN108182105B (zh) | 基于Docker容器技术的局部动态迁移方法及控制系统 | |
WO2017166643A1 (zh) | 一种任务资源的量化方法和装置 | |
CN110221920B (zh) | 部署方法、装置、存储介质及系统 | |
CN106681839B (zh) | 弹性计算动态分配方法 | |
CN106325976B (zh) | 一种渲染任务调度处理方法及服务器 | |
WO2021259246A1 (zh) | 资源调度方法和装置、电子设备、计算机可读存储介质 | |
CN113032102B (zh) | 资源重调度方法、装置、设备和介质 | |
US20210357269A1 (en) | Quality of service scheduling with workload profiles | |
CN111506413B (zh) | 一种基于业务效率优化的智能任务调度方法及系统 | |
CN109471725A (zh) | 资源分配方法、装置和服务器 | |
CN112219191A (zh) | 数据中心中的服务和服务器的自配置 | |
CN112214288B (zh) | 基于Kubernetes集群的Pod调度方法、装置、设备和介质 | |
CN110167031B (zh) | 一种面向集中式基站的资源分配方法、设备及存储介质 | |
JP5515889B2 (ja) | 仮想マシンシステム、自動マイグレーション方法および自動マイグレーションプログラム | |
CN109815204A (zh) | 一种基于拥塞感知的元数据请求分发方法及设备 | |
CN112860383A (zh) | 集群资源调度方法、装置、设备及存储介质 | |
CN115562841B (zh) | 一种云视频服务自适应资源调度系统和方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180807 |