CN102882984A - 一种云计算平台的资源负载均衡方法 - Google Patents
一种云计算平台的资源负载均衡方法 Download PDFInfo
- Publication number
- CN102882984A CN102882984A CN2012104069327A CN201210406932A CN102882984A CN 102882984 A CN102882984 A CN 102882984A CN 2012104069327 A CN2012104069327 A CN 2012104069327A CN 201210406932 A CN201210406932 A CN 201210406932A CN 102882984 A CN102882984 A CN 102882984A
- Authority
- CN
- China
- Prior art keywords
- resource
- cloud computing
- candidate
- computing platform
- request
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Computer And Data Communications (AREA)
Abstract
本发明公开了一种云计算平台的资源负载均衡方法,包括以下步骤:用户通过客户端向云计算平台发送资源请求;云计算平台接收来自客户端的资源请求,并将该资源请求消息广播给云计算平台上的各候选资源;各候选资源对用户的资源请求进行竞争,闲置度最高的候选资源中标竞得该资源请求;云计算平台对用户的资源请求上下文进行封装和移植,并根据上下文配置中标的候选资源;中标的候选资源更新其闲置度,并开始执行用户的资源请求;中标的候选资源更新其闲置度,等候新一轮的资源请求。本发明采用广播竞争机制,确保云计算平台上负载均衡的安全性和高性能,并最大程度上发挥各资源在负载均衡时的自主性和灵活性,实现云计算平台上资源负载的动态平衡。
Description
技术领域
本发明涉及拥有大量资源请求的云计算平台的资源调度应用领域,特别是一种云计算平台的资源负载均衡方法。
背景技术
在云计算应用环境下,用户的资源请求往往呈现一定的波动性和时空局部性,使得在部分峰值时刻,云计算平台上某一计算资源的实际负载大于该资源的设计负载,从而导致该计算资源的执行速度缓慢,执行时间超出用户的原先期望。为了应对这种资源请求负载峰值,一个云计算平台需要同时配备多个同类型的计算资源,以及相应的资源负载均衡方法。
目前,在云计算环境下,常用的资源负载均衡方法均是集中式的,即由一个统一的注册中心记录云计算平台上各计算资源的负载情况。这样,当一个资源请求到来时,由注册中心为该资源请求分配具体的计算资源;而当一个计算资源的负载情况发生变化时,也需要及时更新其在注册中心的记录信息。
这种集中式的资源负载均衡方法,存在诸多实施上的缺陷,具体表现如下:
(1)统一的注册中心记录了云计算平台上各计算资源的负载情况,因此,当计算资源的负载信息发生变化时,需要频繁访问并更新注册中心的负载记录信息,从而使得注册中心面临严重的拥塞问题,造成访问性能下降;
(2)在云计算平台上,统一的注册中心是记录资源负载信息的唯一场所,这种单一的信息记录方式容易受到安全性等方面的挑战;一旦注册中心遭到破坏,将会严重影响云计算平台上资源负载的均衡实现;
(3)集中式的资源负载均衡方法,本质上是一种“强制性”的资源分派方法,它忽略了底层计算资源在负载均衡时的自主性和能动性,降低了负载均衡的灵活性。
发明内容
发明目的:本发明旨在克服传统方法的不足,提供一种云计算平台的资源负载均衡方法。
为了解决上述技术问题,本发明公开了一种云计算平台的资源负载均衡方法,包括以下步骤:
(1)用户通过云计算平台提供的客户端接口,向云计算平台发送资源请求;
(2)云计算平台接收来自客户端的资源请求,并将该资源请求消息广播给云计算平台上的各候选资源;
(3)各候选资源根据其闲置度,对用户的资源请求进行竞争,其中,闲置度最高的候选资源中标竞得该资源请求;
(4)云计算平台对用户的资源请求上下文进行封装和移植,并根据上下文配置中标的候选资源;
(5)中标的候选资源更新其闲置度,并开始执行用户的资源请求;
(6)执行完毕,中标的候选资源更新其闲置度,等候新一轮的资源请求。
本发明通过将负载信息分散到各个独立的计算资源,从而克服了传统集中式负载均衡方法的缺陷,提高云计算平台上负载均衡的性能、安全性和灵活性。
本发明中,进一步地,所述云计算平台上的各候选资源,是指云计算平台中能够满足用户资源请求的各计算资源;所述资源请求消息是以即时广播的形式,由云计算平台发送给各候选资源;所述闲置度是对候选资源空闲程度的定量度量值,其值越大代表候选资源的空闲程度越高;所述资源请求上下文,是指计算资源满足用户请求所必须的约束条件(如I/O数据的格式一致等);所述计算及调整候选资源的闲置度的依据,是该候选资源的设计负载(数量和容量)和实际负载(数量和容量)。
进一步地,所述资源请求消息的广播格式为:<资源请求者,请求时间,请求内容,请求约束条件>。
进一步地,所述资源请求消息的广播方式为时间片广播,即每隔一定的时间片进行一次广播,直至收到候选资源对资源请求消息的竞争响应。
进一步地,对于云计算平台上的某个候选资源A,其闲置度Afree的计算方式如下:Afree = [(1- A1/A2)*100% + (1- A3/A4)*100%]/2。其中,A1、A2分别表示候选资源A的实际负载数量和设计负载数量,而A3、A4分别表示候选资源A的实际负载容量和设计负载容量。
进一步地,各候选资源的最高闲置度包括如下三种情形:
(a)最高闲置度为0;
(b)最高闲置度大于0,且只有一个候选资源具有最高闲置度;
(c)最高闲置度大于0,且多个候选资源同时具有最高闲置度。
进一步地,所述请求内容包括:资源种类、资源数量和资源容量;所述请求时间的格式为:开始时间-结束时间;所述请求约束条件是指用户对计算资源的质量水平约束。
本发明步骤(2)包括以下步骤:
(2a)云计算平台将接收到客户端的的用户资源请求,以消息的形式广播给云计算平台上的各候选资源;
(2b)云计算平台判断是否收到候选资源对广播消息的响应;如果收到响应,则跳转到步骤(3),否则跳转到步骤(2c);
(2c)判断消息广播的次数是否达到或超过设定的次数;如果达到或超过设定的次数,则跳转到步骤(2d),否则跳转到步骤(2a);
(2d)资源请求失败,反馈用户。
本发明步骤(3)包括以下步骤:
(3a)竞争资源请求的各候选资源分别计算其闲置度;
(3b)计算各候选资源的最大闲置度;如果最大闲置度等于0,则跳转到步骤(2d),否则跳转到步骤(3c);
(3c)选择闲置度最大的候选资源作为中标的候选资源。
有益效果:与现有技术相比,本发明的效果体现在:1)将负载信息分散记录到各个独立的计算资源,克服了传统注册中心的集中式记录方式的不足,提高了存储及访问负载信息的安全性和高效性;2)通过消息广播,确保云计算平台上的每个候选资源都能收到用户的资源请求,实现了候选资源在响应用户请求时的完整性。3)通过主动竞争的方式,确保用户的资源请求被分派到负载最小的候选资源,从而有效实现了云计算资源的负载均衡,并提高了各候选资源在负载均衡时的灵活性。
本发明可以应用于具有众多计算资源和海量资源请求的云计算平台,以支持云计算平台的资源负载均衡,属于计算机应用领域。
附图说明
下面结合附图和具体实施方式对本发明做更进一步的具体说明,通过附图说明,本发明的上述和/或其他方面的优点将会变得更加清楚。
图1为本发明的云计算平台的资源负载均衡方法流程图。
图2为本发明的云计算平台的资源负载均衡实例。
具体实施方式
如图1所示,本发明公开了一种云计算平台的资源负载均衡方法,包括如下步骤:
(1)用户将自己的资源请求以规定的格式提交给云计算平台,来请求所需的计算资源。在云计算环境下,用户资源请求的提交格式为<资源请求者,请求时间,请求内容,请求约束条件>。其中,“资源请求者”是用户使用云计算平台的唯一身份标识;“请求时间”是用户希望使用计算资源的起止时间;“请求内容”是用户请求的计算资源的种类、数量和容量;“请求约束条件”是指用户对所请求的计算资源的质量水平约束(如:可靠性约束)。
(2)云计算平台接收来自客户端的资源请求,然后以即时广播的形式将该资源请求消息,发送给云计算平台上的各候选资源。包括以下步骤:(2a)云计算平台将接收到的用户资源请求,以消息的形式广播给云计算平台上的各候选资源,这里的候选资源是指云计算平台上能够满足用户功能需求的计算资源,资源请求消息的广播格式为:<资源请求者,请求时间,请求内容,请求约束条件>,而资源请求消息的广播方式为时间片广播;(2b)云计算平台判断是否收到候选资源对广播消息的响应:如果收到响应,则跳转到步骤(3),否则跳转到步骤(2c);(2c)判断消息广播的次数是否达到或超过设定的次数:如果广播次数达到或超过设定的次数仍未收到来自计算资源的响应,则说明当前云计算平台中没有计算资源能够满足用户的资源请求,此时跳转到步骤(2d),否则跳转到步骤(2a)继续进行消息广播;(2d)资源请求失败,将失败信息反馈用户。
(3)收到云计算平台发送的资源请求广播之后,满足请求约束条件的各候选资源分别计算其对于资源请求的闲置度。闲置度是对候选资源空闲程度的定量度量值,其值越大代表候选资源的空闲程度越高,负载压力越小。包括以下步骤:(3a)竞争资源请求的各候选资源分别计算其闲置度:某候选资源A对于资源请求的闲置度Afree的计算依据,包括该候选资源的实际负载数量A1、设计负载数量A2、实际负载容量A3和设计负载容量A4,具体的计算公式如下所示:Afree = [(1- A1/A2)*100% + (1- A3/A4)*100%]/2。;(3b)计算各候选资源的最大闲置度:如果最大闲置度等于0,说明当前各候选资源的实际负载已经达到(或接近)设计负载,无法接受新的资源请求,跳转到步骤(2d),否则跳转到步骤(3c);(3c)选择闲置度最大的候选资源,来满足用户的资源请求:如果只有一个候选资源具有最高闲置度,则云计算平台选择该候选资源,来满足用户的资源请求;如果多个候选资源同时具有最高闲置度,则云计算平台选择设计负载容量最大的候选资源,来满足用户的资源请求。
(4)云计算平台对用户的资源请求上下文(计算资源满足用户请求所必须的约束条件,如I/O数据的格式一致等)进行封装和移植,并根据资源请求上下文,对中标的候选资源进行运行前的配置和部署工作。
(5)在竞争获得用户的资源请求之后,中标的候选资源的实际负载数量和实际负载容量增加,其闲置度也需及时调整更新。闲置度更新完毕,中标的候选资源根据资源请求上下文,开始执行用户的资源请求。
(6)执行完毕,中标的候选资源由于实际负载数量和实际负载容量降低,需再次更新其闲置度,并等候新一轮的资源请求。
实施例
下面以图2中的内存资源请求示例来说明云计算平台的资源负载均衡方法,其步骤如下:
(1)用户user1将自己的内存资源请求,以规定的格式<user1,10am-4pm,内存(1个,2G),可靠性≥99%>提交给云计算平台,其中“10am-4pm”代表用户请求资源的时间为上午10点到下午4点,“内存(1个,2G)”代表用户向云计算平台请求1个容量为2G的内存资源。
(2)云计算平台接收来自客户端的资源请求,然后以即时广播(广播次数设定为3)的形式,将该资源请求消息,发送给云计算平台上的各候选资源R1、R2和R3。这里的候选资源R1、R2和R3均能在用户期望的时间10am-4pm,以用户期望的可靠性质量水平(≥99%),为用户user1提供1个容量为2G的内存资源。
(3)收到云计算平台发送的资源请求广播之后,候选资源R1、R2和R3分别计算其对于资源请求的闲置度。R1、R2和R3的设计负载数量分别为3、6、8,设计负载容量分别为10G、20G、30G;而R1、R2和R3的实际负载数量分别为2、3、4,实际负载容量分别为9G、16G、24G。经计算R1、R2和R3的闲置度分别为R1free = 21.7%,R2free = 35%,R3free = 35%。其中,R2和R3的闲置度最高,同为35%;由于R3的设计负载容量(30G)大于R2的设计负载容量(20G),因此,云计算平台选择R3来处理用户user1的内存资源请求。
(4)云计算平台对user1的内存资源请求上下文进行封装,并移植到中标的候选资源R3,根据资源请求上下文,对R3进行运行前的配置和部署工作。
(5)获得user1的内存资源请求之后,R3的实际负载数量增加1变为5,R3的实际负载容量增加2G变为26G,其闲置度也及时调整更新为R3free = 25.4%。闲置度更新完毕,R3开始执行user1的内存资源请求。
(6)执行完毕,R3的实际负载数量降低1变为4,R3的实际负载容量减少2G变为24G,因此再次更新R3 的闲置度为R3free = 35%,并等候新一轮的资源请求。
在云计算技术飞速发展的今天,云计算平台逐渐成为广大用户请求计算资源、实现计算应用的主要途径,而云计算平台所面临的资源负载平衡压力也日益突出。本发明达到以下效果:根据云计算平台的资源负载现状,动态配置来自客户端的资源请求,以实现云计算平台的资源负载均衡,提高云计算平台中各计算资源的利用率。
本发明提供了一种云计算平台的资源负载均衡方法的思路及方法,具体实现该技术方案的方法和途径很多,以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。本实施例中未明确的各组成部分均可用现有技术加以实现。
Claims (10)
1.一种云计算平台的资源负载均衡方法,包括以下步骤:
(1)用户通过云计算平台提供的客户端接口,向云计算平台发送资源请求;
(2)云计算平台接收来自客户端的资源请求,并将该资源请求消息广播给云计算平台上的各候选资源;所述候选资源为云计算平台中能够满足用户资源请求的各计算资源;
(3)各候选资源根据其闲置度,对用户的资源请求进行竞争,其中,闲置度最高的候选资源中标竞得该资源请求;
(4)云计算平台对用户的资源请求上下文进行封装和移植,并根据上下文配置中标的候选资源;
(5)中标的候选资源更新其闲置度,并开始执行用户的资源请求;
(6)执行完毕,中标的候选资源更新其闲置度,等候新一轮的资源请求。
2.根据权利要求1所述的云计算平台的资源负载均衡方法,其特征在于:所述资源请求消息是以即时广播的形式,由云计算平台发送给各候选资源。
3.根据权利要求1或2所述的云计算平台的资源负载均衡方法,其特征在于,资源请求消息的广播格式为:<资源请求者,请求时间,请求内容,请求约束条件>,所述请求内容包括:资源种类、资源数量和资源容量;所述请求时间格式为:开始时间-结束时间;所述请求约束条件是指用户对计算资源的质量水平约束。
4.根据权利要求3所述的云计算平台的资源负载均衡方法,其特征在于,资源请求消息的广播方式为时间片广播,即每隔一定的时间片进行一次广播,直至收到候选资源对资源请求消息的竞争响应。
5.根据权利要求1所述的云计算平台的资源负载均衡方法,其特征在于:所述闲置度是对候选资源空闲程度的定量度量值,其值越大代表候选资源的空闲程度越高。
6.根据权利要求1所述的云计算平台的资源负载均衡方法,其特征在于:所述资源请求上下文,是指计算资源满足用户请求所必须的约束条件。
7.根据权利要求1或5所述的云计算平台的资源负载均衡方法,其特征在于,对于云计算平台上的某候选资源A,其闲置度Afree的计算方式如下:
Afree = [(1- A1/A2)*100% + (1- A3/A4)*100%]/2
其中,A1、A2分别表示候选资源A的实际负载数量和设计负载数量,而A3、A4分别表示候选资源A的实际负载容量和设计负载容量。
8.根据权利要求1或5所述的云计算平台的资源负载均衡方法,其特征在于,各候选资源的最高闲置度包括如下三种情形:
(1)最高闲置度为0;
(2)最高闲置度大于0,且只有一个候选资源具有最高闲置度;
(3)最高闲置度大于0,且多个候选资源同时具有最高闲置度。
9.根据权利要求8所述的云计算平台的资源负载均衡方法,其特征在于,步骤(2)包括以下步骤:
(2a)云计算平台将接收到客户端的的用户资源请求,以消息的形式广播给云计算平台上的各候选资源;
(2b)云计算平台判断是否收到候选资源对广播消息的响应;如果收到响应,则跳转到步骤(3),否则跳转到步骤(2c);
(2c)判断消息广播的次数是否达到或超过设定的次数;如果达到或超过设定的次数,则跳转到步骤(2d),否则跳转到步骤(2a);
(2d)资源请求失败,反馈用户。
10.根据权利要求9所述的云计算平台的资源负载均衡方法,其特征在于,步骤(3)包括以下步骤:
(3a)竞争资源请求的各候选资源分别计算其闲置度;
(3b)计算各候选资源的最大闲置度;如果最大闲置度等于0,则跳转到步骤(2d),否则跳转到步骤(3c);
(3c)选择闲置度最大的候选资源作为中标的候选资源。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2012104069327A CN102882984A (zh) | 2012-10-24 | 2012-10-24 | 一种云计算平台的资源负载均衡方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2012104069327A CN102882984A (zh) | 2012-10-24 | 2012-10-24 | 一种云计算平台的资源负载均衡方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102882984A true CN102882984A (zh) | 2013-01-16 |
Family
ID=47484126
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2012104069327A Pending CN102882984A (zh) | 2012-10-24 | 2012-10-24 | 一种云计算平台的资源负载均衡方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102882984A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104539673A (zh) * | 2014-12-18 | 2015-04-22 | 国云科技股份有限公司 | 一种适用于平衡云平台计算资源的方法 |
CN105407162A (zh) * | 2015-11-27 | 2016-03-16 | 国云科技股份有限公司 | 一种基于SLA服务等级的云计算Web应用资源负载均衡算法 |
CN108449401A (zh) * | 2018-03-12 | 2018-08-24 | 厦门益东智能科技有限公司 | 一种基于区块链技术的算力共享方法及系统 |
CN109460293A (zh) * | 2018-10-11 | 2019-03-12 | 东南大学 | 无线云计算系统中分布式计算环境下的计算资源选择方法 |
CN113283785A (zh) * | 2021-06-09 | 2021-08-20 | 广东工业大学 | 一种多任务制造资源的协同调度优化方法 |
CN117714452A (zh) * | 2023-12-14 | 2024-03-15 | 摩尔线程智能科技(北京)有限责任公司 | 一种流量负载均衡方法、系统及装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020178254A1 (en) * | 2001-05-23 | 2002-11-28 | International Business Machines Corporation | Dynamic deployment of services in a computing network |
CN101444053A (zh) * | 2005-12-22 | 2009-05-27 | 吉尼塞斯电信实验室公司 | 用于经由在数据分组网络上广播的请求来定位和获取服务连接的系统和方法 |
CN101719082A (zh) * | 2009-12-24 | 2010-06-02 | 中国科学院计算技术研究所 | 虚拟化计算平台中应用请求调度的方法及其系统 |
-
2012
- 2012-10-24 CN CN2012104069327A patent/CN102882984A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020178254A1 (en) * | 2001-05-23 | 2002-11-28 | International Business Machines Corporation | Dynamic deployment of services in a computing network |
CN101444053A (zh) * | 2005-12-22 | 2009-05-27 | 吉尼塞斯电信实验室公司 | 用于经由在数据分组网络上广播的请求来定位和获取服务连接的系统和方法 |
CN101719082A (zh) * | 2009-12-24 | 2010-06-02 | 中国科学院计算技术研究所 | 虚拟化计算平台中应用请求调度的方法及其系统 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104539673A (zh) * | 2014-12-18 | 2015-04-22 | 国云科技股份有限公司 | 一种适用于平衡云平台计算资源的方法 |
CN105407162A (zh) * | 2015-11-27 | 2016-03-16 | 国云科技股份有限公司 | 一种基于SLA服务等级的云计算Web应用资源负载均衡算法 |
CN105407162B (zh) * | 2015-11-27 | 2018-11-06 | 国云科技股份有限公司 | 一种基于SLA服务等级的云计算Web应用资源负载均衡方法 |
CN108449401A (zh) * | 2018-03-12 | 2018-08-24 | 厦门益东智能科技有限公司 | 一种基于区块链技术的算力共享方法及系统 |
CN109460293A (zh) * | 2018-10-11 | 2019-03-12 | 东南大学 | 无线云计算系统中分布式计算环境下的计算资源选择方法 |
CN109460293B (zh) * | 2018-10-11 | 2022-01-28 | 东南大学 | 无线云计算系统中分布式计算环境下的计算资源选择方法 |
CN113283785A (zh) * | 2021-06-09 | 2021-08-20 | 广东工业大学 | 一种多任务制造资源的协同调度优化方法 |
CN117714452A (zh) * | 2023-12-14 | 2024-03-15 | 摩尔线程智能科技(北京)有限责任公司 | 一种流量负载均衡方法、系统及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102882984A (zh) | 一种云计算平台的资源负载均衡方法 | |
US11429449B2 (en) | Method for fast scheduling for balanced resource allocation in distributed and collaborative container platform environment | |
CN109218355B (zh) | 负载均衡引擎,客户端,分布式计算系统以及负载均衡方法 | |
US20200034725A1 (en) | Methods and system for managing predictive models | |
US10841397B2 (en) | Methods, apparatus, and systems to dynamically discover and host services in fog servers | |
US9471364B2 (en) | Virtual machine specification adjustment method and apparatus | |
CN102185779B (zh) | 与综合配置能力成比例的数据中心资源负载均衡的方法及装置 | |
CN109960585A (zh) | 一种基于kubernetes的资源调度方法 | |
CN110231976B (zh) | 一种基于负载预测的边缘计算平台容器部署方法及系统 | |
CN109788046B (zh) | 一种基于改进蜂群算法的多策略边缘计算资源调度方法 | |
CN108628674A (zh) | 基于云平台的任务调度方法、云平台及计算机存储介质 | |
CN113110938B (zh) | 一种资源分配方法、装置、计算机设备及存储介质 | |
CN109561148A (zh) | 边缘计算网络中基于有向无环图的分布式任务调度方法 | |
US12099884B2 (en) | Scheduling method for selecting optimal cluster within cluster of distributed collaboration type | |
CN106897299B (zh) | 一种数据库访问方法及装置 | |
CN108563500A (zh) | 基于云平台的任务调度方法、云平台及计算机存储介质 | |
CN106357823B (zh) | 一种节能控制的云资源优化分配方法 | |
CN111147604B (zh) | 一种车联网边缘计算的负载均衡方法 | |
CN104243405A (zh) | 一种请求处理方法、装置及系统 | |
CN112783607A (zh) | 容器集群中任务部署方法及装置 | |
CN106998340B (zh) | 一种板卡资源的负载均衡方法及装置 | |
CN111858050B (zh) | 服务器集群混合部署方法、集群管理节点及相关系统 | |
KR20200054368A (ko) | 전자 장치 및 이의 제어방법 | |
CN111447646B (zh) | 一种用户设备ue接入amf的方法及其网络设备 | |
CN105955816A (zh) | 一种事件调度方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20130116 |