CN108063805B - 一种利润感知的分布式数据中心负载管理方法 - Google Patents
一种利润感知的分布式数据中心负载管理方法 Download PDFInfo
- Publication number
- CN108063805B CN108063805B CN201711291850.1A CN201711291850A CN108063805B CN 108063805 B CN108063805 B CN 108063805B CN 201711291850 A CN201711291850 A CN 201711291850A CN 108063805 B CN108063805 B CN 108063805B
- Authority
- CN
- China
- Prior art keywords
- data center
- load
- server
- active
- profit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000007726 management method Methods 0.000 title claims abstract description 13
- 230000005611 electricity Effects 0.000 claims abstract description 5
- 230000000694 effects Effects 0.000 claims description 10
- 238000000034 method Methods 0.000 claims description 8
- 238000005070 sampling Methods 0.000 claims description 3
- 230000008569 process Effects 0.000 claims description 2
- 238000005265 energy consumption Methods 0.000 abstract description 11
- 230000000875 corresponding effect Effects 0.000 description 10
- 230000004044 response Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 101001094649 Homo sapiens Popeye domain-containing protein 3 Proteins 0.000 description 1
- 101000608234 Homo sapiens Pyrin domain-containing protein 5 Proteins 0.000 description 1
- 101000578693 Homo sapiens Target of rapamycin complex subunit LST8 Proteins 0.000 description 1
- 102100027802 Target of rapamycin complex subunit LST8 Human genes 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/1001—Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
- H04L67/1004—Server selection for load balancing
- H04L67/1023—Server selection for load balancing based on a hash applied to IP addresses or costs
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/1001—Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
- H04L67/1004—Server selection for load balancing
- H04L67/1008—Server selection for load balancing based on parameters of servers, e.g. available memory or workload
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/56—Provisioning of proxy services
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/60—Scheduling or organising the servicing of application requests, e.g. requests for application data transmissions using the analysis and optimisation of the required network resources
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Computer Hardware Design (AREA)
- General Engineering & Computer Science (AREA)
- Computer And Data Communications (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公布了一种利润感知的分布式数据中心负载管理方法,该方法基于前端代理服务器、全局分派器和局部管理器的体系结构,以最大化分布式数据中心运营商的运营利润为目标,综合考虑不同时间和不同地点的电价差异、数据中心的能效差异以及服务质量需求,联合优化分布式数据中心的负载分配、活动服务器的数量以及活动服务器上CPU的运行频率,以便在高服务质量与低能耗之间进行有效的折中,从而使分布式数据中心运营商可以获得更多的利润。
Description
技术领域
本发明涉及分布式数据中心的负载管理领域,尤其是涉及一种最大化数据中心运营商利润的分层负载管理方法。
背景技术
随着搜索引擎、在线游戏和社交网络等在线服务的盛行,数据中心作为支撑在线服务的核心物理平台,开始进入快速发展的阶段。许多数据中心运营商,包括Amazon、Google、Microsoft、Yahoo和IBM等,在世界各地新部署了大量的数据中心为日益增长的在线服务提供计算、存储和网络等资源。对于数据中心运营商而言,最关心的问题是如何最大化分布式数据中心的运营利润。
数据中心运营商的利润是运营收入减去运营成本,运营成本主要由分布式数据中心的电能消耗决定,运行收入主要由服务的质量与数量决定,目前的解决方案主要通过在保证服务质量的前提下尽可能减少分布式数据中心的电能消耗来降低分布式数据中心的运营成本,从而提高分布式数据中心运营商的利润。
在分布式数据中心里,服务的质量与能耗和服务量成正相关,服务质量越高所需的能耗也越高,相对的可服务量也越高,若为了满足服务质量,会迫使数据中心用较高的功耗进行运算,造成数据中心的能耗成本增加,若为了节省能耗而降低服务的质量会造成单位时间内服务量减少,导致客户满意度下降,并向客户支付罚金,造成数据中心的收入减少。由于目前的解决方案没有考虑上述的影响,所以不能在高质量服务与低能耗之间进行有效的折衷,从而无法获得更高的利润。
发明内容
本发明的目的在于提供一种利润感知的分布式数据中心负载管理方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:
本发明提供一种分布式数据中心利润感知的负载管理方法,由前端代理服务器、全局分派器和局部管理器构成;其中,前端代理服务器负责接收客户端的服务请求,并传递客户端的服务请求到全局分派器,然后基于全局分配器返回的负载分配方案,分发客户请求到对应的数据中心。
全局分派器负责计算负载如何在分布式数据中心间分配;基本思想是联合考虑数据中心的电力成本和服务能力来进行负载的指派。具体来说,首先使用下面的公式计算指派负载j到任意一个数据中心i的优先级PRi,j:
上式中,PUEi代表数据中心i的电能使用效率,大小等于数据中心的总能耗除以数据中心计算设备的能耗,理想的取值是1,该值越小表明数据中心的能源使用效率越高,Pi(t)代表数据中心i所在位置的电价,N代表分布式数据中心的总数,ACi代表数据中心i的最大服务能力,基于上面公式的求解结果,指派负载到具有最大优先级的数据中心。
在每个数据中心内部,局部管理器负责将指派到该数据中心的负载在计算服务器间进行分配,并根据所形成的负载分配方案打开或关闭计算服务器,进行实际的负载分配,最后调节活动计算服务器上CPU的运行频率。具体的步骤如下:
(1)计算数据中心内每个计算服务器的CPU利用率,指派负载到利用率最小的服务器,该过程迭代进行,直到所有的负载都分配完毕,由此而形成的负载指派集合记作MapSet;根据负载指派的结果计算活动计算服务器的CPU频率,并记录到集合FreSet;然后设置空闲计算服务器的状态为不活动,将所有活动的计算服务器记录到集合NASet;
(2)基于当前集合MapSet、FreSet和NASet,利用下面的等式计算数据中心当前的利润ηi:
ηi=Ri-Ci
上式中,Ri代表数据中心i的服务收入,Ci代表数据中心i的成本支出。Ri的值由下面的公式求得:
Ri=(1-qi(t))λi(t)δit-qi(t)λi(t)γit
其中,t代表局部管理器相邻两次运行的时间间隔;λi(t)代表负载的到达速率,计算公式如下:
其中,F代表前端代理服务器的数量;mi(t)代表数据中心i在间隔t内活动服务器的数量。代表间隔t内从前端代理服务器路由到数据中心i内计算服务器s上服务请求的数量,δi代表在指定的最大响应时间之前完成一个服务请求而获得的收入,γi代表在指定的最大响应时间之后完成一个服务请求而支出的罚金,qi(t)代表间隔t内在指定的最大响应时间之后完成一个服务请求的概率,基于M/M/N队列理论,可以得知:
其中,Dmax代表指定的最大响应时间;ρi(t)=λi(t)/μi(t)是间隔t内数据中心i的利用率;是间隔t内数据中心i的服务速率;是间隔t内数据中心i中一台计算服务器s的服务速率;fi s(t)是间隔t内数据中心i中一台计算服务器s的CPU频率;是一个与数据中心i内一台计算服务器s相关的参数,用来区别不同计算服务器CPU的处理能力大小;由下式定义:
数据中心i的成本支出Ci(t)定义如下:
(3)从NASet集合中,选择一个负载最小的计算服务器s,尝试将该计算服务器上的负载依次分配到数据中心内其它活动的负载最少的计算服务器上,如果尝试失败,转向步骤(4);否则设置所选计算服务器s的状态为不活动,并更新相应的集合MapSet、FreSet和NASet,然后计算新的利润比较ηi与的值,若大于ηi,转向步骤(3),否则还原所选计算服务器s的状态为活动并还原相应的集合MapSet、FreSet和NASet;
(4)根据集合MapSet、FreSet和NASet的最终结果,打开或关闭相应的计算服务器,分配负载到相应的计算服务器,设置每个活动计算服务器的CPU频率;
本发明提出的方法按照图1所示的流程工作,具体包括以下的步骤:
步骤1:客户端通过Internet网发送服务请求;服务请求可以是任何类型的Web服务请求,例如,电子邮件服务、视频会议服务、文件传输服务、在线游戏服务等等;
步骤2:前端代理服务器通过Internet网接收客户端的服务请求,客户端与前端代理服务器通讯时采用的协议可以是任何类型的应用层协议,例如:POP3、HTTP、FTP等等;
步骤3:前端代理服务器发送接收到的服务请求信息到全局分派器;前端代理服务器与全局分配器通过组织内部的Intranet网进行通信;
步骤4:全局分派器计算负载如何在分布式数据中心间分派,形成一个全局的负载分配方案;
步骤5:全局分派器通过Intranet网发送全局负载分配方案到前端的代理服务器;
步骤6:前端代理服务器基于接收到的全局负载分配方案分发负载到对应数据中心的局部管理器上,前端代理服务器与局部管理器之间通过Intranet网进行通信;
步骤7:局部管理器计算负载如何在数据中心内部的服务器间分派,形成一个局部的负载分配集合、活动计算服务器的集合以及活动计算服务器的CPU频率设置集合;
步骤8:基于局部负载分配集合、活动计算服务器的集合与活动计算服务器的CPU频率设置集合,局部管理器打开或关闭计算服务器,分发负载到对应的计算服务器上,调节活动计算服务器的CPU频率;
步骤9:检测客户端是否还有服务请求要处理,若有,转向步骤1,否则,转向步骤9。
与现有技术相比,本发明的有益效果是:
本发明的特色与创新为提出一个基于利润最大化方法的分布式数据中心负载分配机制,该机制综合考虑分布式数据中心的负载变化、电价变化、能耗成本、用户请求的服务质量,联合优化分布式数据中心的负载分配、活动计算服务器的数量以及活动计算服务器上CPU的运行频率,以便最大化分布式数据中心运营商的利润。
附图说明
图1为利润感知的分布式数据中心负载管理方法的工作流程图。
图2为利润感知的分布式数据中心负载管理方法的技术架构图。
图3为利润感知的分布式数据中心负载管理方法的实例部署图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围;
请参阅图1-3,
步骤1:在分布式数据中心前端集群中设置一台服务器充当全局分派器,剩余的服务器作为前端代理服务器;
步骤2:在每个数据中心内部,设置一台服务器充当局部管理器,剩余服务器作为计算服务器;
步骤3:把每个数据中心的最大服务能力ACi和电能使用效率PUEi保存到全局分派器内;
步骤4:把每个数据中心所在电力区域的电价信息保存到全局分派器内;
步骤6:当前端代理服务器接收到服务请求时,首先将服务请求信息发送到全局分配器,全局分派器求解一个全局的负载分配方案,返回给前端代理服务器,前端代理服务器根据收到的全局负载分配方案分发负载到对应数据中心的局部管理器上;然后局部管理器求解一个局部的负载分配方案,基于该分配方案打开或关闭对应的计算服务器,分发负载到对应活动计算服务器上,设置活动计算服务器上CPU的运行频率;
由于CPU只能在几个离散的频率下运行,我们通过相邻的两个离散频率值来近似局部管理器求解出的连续频率值fi s,计算公式如下:
其中,f1与f2是fi s的两个相邻的离散频率值,(t1+t2)是采样周期;例如,一个处理器只支持两个运行频率,分别是2.0Ghz和2.2Ghz,为了在30秒的采样周期内近似一个2.15Ghz的处理器运行频率,我们可以让处理器首先在2.0Ghz运行7.5秒,然后再在2.2Ghz下运行22.5秒。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。
Claims (2)
1.一种利润感知的分布式数据中心负载管理方法,其特征在于,利用前端代理服务器、全局分派器和局部管理器进行分布式数据中心的负载分配,以便最大化分布式数据中心运营商的利润,具体包括以下步骤:
步骤1:客户端通过Internet网发送Web服务请求;
步骤2:前端代理服务器通过Internet网接收客户端的服务请求;
步骤3:前端代理服务器通过Intranet网发送接收到的服务请求信息到全局分派器;
步骤4:全局分派器计算负载如何在分布式数据中心间分派,形成一个全局的负载分配方案;
其中,所述步骤4中的全局负载分配方案通过以下方法确定:
全局分派器首先使用下面的公式计算指派负载j到任意一个数据中心i的优先级PRi,j:
上式中,PUEi代表数据中心i的电能使用效率, Pi(t)代表数据中心i所在位置的电价,N代表分布式数据中心的总数,ACi代表数据中心i的最大服务能力,然后,基于上面公式的求解结果,指派负载到具有最大优先级的数据中心;
步骤5:全局分派器通过Intranet网发送全局负载分配方案到前端的代理服务器;
步骤6:前端代理服务器基于接收到的全局负载分配方案,利用Intranet网,分发负载到对应数据中心的局部管理器上;
步骤7:局部管理器计算负载如何在数据中心内部的计算服务器间分派,形成一个局部的负载分配集合、活动计算服务器的集合以及活动计算服务器的CPU频率设置集合;
步骤8:基于局部负载分配集合、活动计算服务器的集合与活动计算服务器的CPU频率设置集合,局部管理器打开或关闭计算服务器,分发负载到对应的计算服务器上,调节活动计算服务器的CPU频率;
步骤9:检测客户端是否还有服务请求要处理,若有,转向步骤1,否则,转向步骤9;
其中,所述步骤7中的局部负载分配集合、活动计算服务器的集合以及活动计算服务器CPU频率设置集合通过以下方法确定:
(1)计算数据中心内每个计算服务器的CPU利用率,指派负载到利用率最小的计算服务器,该过程迭代进行,直到所有的负载都分配完毕,由此形成初始的负载指派集合MapSet、活动计算服务器集合NASet;活动计算服务器CPU频率设置集合FreSet;
(2)基于集合MapSet、FreSet和NASet,利用下面的等式计算数据中心当前的利润ηi:
ηi=Ri-Ci
上式中,Ri代表数据中心i的服务收入,Ci代表数据中心i的成本支出;
(3)从NASet集合中,选择一个负载最小的计算服务器s,尝试将该服务器上的负载依次分配到数据中心内其它活动的负载最少的计算服务器上,如果尝试失败,当前的MapSet、FreSet和NASet就是所求的负载指派集合、活动计算服务器CPU频率设置集合以及活动计算服务器集合;否则设置所选计算服务器s的状态为不活动,并更新相应的集合MapSet、FreSet和NASet,然后基于(2)中的利润求解等式计算新的利润比较ηi与的值,若大于ηi,转向(3)迭代,否则还原所选计算服务器s的状态为活动并还原相应的集合MapSet、FreSet和NASet,此时它们就是所求的局部负载分配集合、活动计算服务器CPU频率设置集合以及活动计算服务器集合。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711291850.1A CN108063805B (zh) | 2017-12-08 | 2017-12-08 | 一种利润感知的分布式数据中心负载管理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711291850.1A CN108063805B (zh) | 2017-12-08 | 2017-12-08 | 一种利润感知的分布式数据中心负载管理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108063805A CN108063805A (zh) | 2018-05-22 |
CN108063805B true CN108063805B (zh) | 2020-07-14 |
Family
ID=62135513
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711291850.1A Active CN108063805B (zh) | 2017-12-08 | 2017-12-08 | 一种利润感知的分布式数据中心负载管理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108063805B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101504620A (zh) * | 2009-03-03 | 2009-08-12 | 华为技术有限公司 | 一种虚拟化集群系统负载平衡方法、装置及系统 |
CN102207891A (zh) * | 2011-06-10 | 2011-10-05 | 浙江大学 | 对数据划分分布式环境实现动态划分和负载均衡的方法 |
CN103631657A (zh) * | 2013-11-19 | 2014-03-12 | 浪潮电子信息产业股份有限公司 | 一种基于MapReduce的任务调度算法 |
CN103957261A (zh) * | 2014-05-06 | 2014-07-30 | 湖南体运通信息技术有限公司 | 一种基于能耗优化的云计算资源分配的方法 |
CN105744006A (zh) * | 2016-05-10 | 2016-07-06 | 中国民航大学 | 一种面向多类型服务的粒子群优化用户请求调度方法 |
CN106161120A (zh) * | 2016-10-08 | 2016-11-23 | 电子科技大学 | 动态均衡负载的分布式元数据管理方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6658449B1 (en) * | 2000-02-17 | 2003-12-02 | International Business Machines Corporation | Apparatus and method for periodic load balancing in a multiple run queue system |
-
2017
- 2017-12-08 CN CN201711291850.1A patent/CN108063805B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101504620A (zh) * | 2009-03-03 | 2009-08-12 | 华为技术有限公司 | 一种虚拟化集群系统负载平衡方法、装置及系统 |
CN102207891A (zh) * | 2011-06-10 | 2011-10-05 | 浙江大学 | 对数据划分分布式环境实现动态划分和负载均衡的方法 |
CN103631657A (zh) * | 2013-11-19 | 2014-03-12 | 浪潮电子信息产业股份有限公司 | 一种基于MapReduce的任务调度算法 |
CN103957261A (zh) * | 2014-05-06 | 2014-07-30 | 湖南体运通信息技术有限公司 | 一种基于能耗优化的云计算资源分配的方法 |
CN105744006A (zh) * | 2016-05-10 | 2016-07-06 | 中国民航大学 | 一种面向多类型服务的粒子群优化用户请求调度方法 |
CN106161120A (zh) * | 2016-10-08 | 2016-11-23 | 电子科技大学 | 动态均衡负载的分布式元数据管理方法 |
Also Published As
Publication number | Publication date |
---|---|
CN108063805A (zh) | 2018-05-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9112782B2 (en) | Reactive auto-scaling of capacity | |
Zhang et al. | Dynamic service placement in geographically distributed clouds | |
Yao et al. | Data centers power reduction: A two time scale approach for delay tolerant workloads | |
US9386086B2 (en) | Dynamic scaling for multi-tiered distributed systems using payoff optimization of application classes | |
Mazzucco et al. | Maximizing cloud providers' revenues via energy aware allocation policies | |
Zhang et al. | Intelligent workload factoring for a hybrid cloud computing model | |
US8291424B2 (en) | Method and system of managing resources for on-demand computing | |
Samanta et al. | Latency-oblivious distributed task scheduling for mobile edge computing | |
CN108021435B (zh) | 一种基于截止时间的具有容错能力的云计算任务流调度方法 | |
CN102223419A (zh) | 面向网络化操作系统的虚拟资源动态反馈均衡分配机制 | |
Baranwal et al. | FONS: a fog orchestrator node selection model to improve application placement in fog computing | |
WO2009081412A2 (en) | System and method for a cdn balancing and sharing platform | |
Xiang et al. | Greening geo-distributed data centers by joint optimization of request routing and virtual machine scheduling | |
CN115048224B (zh) | 一种基于多个云服务商的算力复用管理方法及其装置 | |
Sudeepa et al. | Resource allocation in cloud computing | |
Yao et al. | Cost-efficient tasks scheduling for smart grid communication network with edge computing system | |
Dreibholz et al. | Towards a lightweight task scheduling framework for cloud and edge platform | |
Dyachuk et al. | On allocation policies for power and performance | |
Lu et al. | A game theoretical balancing approach for offloaded tasks in edge datacenters | |
Vyas et al. | An Efficient Technique for Cloud Resource Management Using Machine Learning Model | |
CN113778675A (zh) | 一种基于面向区块链网络的计算任务分配系统及方法 | |
CN108063805B (zh) | 一种利润感知的分布式数据中心负载管理方法 | |
Krishnaswamy et al. | An open NFV and cloud architectural framework for managing application virality behaviour | |
Gnibga et al. | Latency, Energy and Carbon Aware Collaborative Resource Allocation with Consolidation and QoS Degradation Strategies in Edge Computing | |
Sharma et al. | Multi-objective resources allocation using improved genetic algorithm at cloud data center |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |