CN110138830A - 基于超图分割的跨数据中心任务调度与带宽分配方法 - Google Patents
基于超图分割的跨数据中心任务调度与带宽分配方法 Download PDFInfo
- Publication number
- CN110138830A CN110138830A CN201910280808.2A CN201910280808A CN110138830A CN 110138830 A CN110138830 A CN 110138830A CN 201910280808 A CN201910280808 A CN 201910280808A CN 110138830 A CN110138830 A CN 110138830A
- Authority
- CN
- China
- Prior art keywords
- task
- data center
- network
- data
- hypergraph
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000638 solvent extraction Methods 0.000 title claims abstract description 37
- 238000000034 method Methods 0.000 title claims abstract description 27
- 230000002452 interceptive effect Effects 0.000 claims abstract description 6
- 238000001514 detection method Methods 0.000 claims abstract description 4
- 230000000737 periodic effect Effects 0.000 claims abstract description 3
- 230000005540 biological transmission Effects 0.000 claims description 12
- 230000000694 effects Effects 0.000 claims description 5
- 238000005192 partition Methods 0.000 claims description 5
- 230000008569 process Effects 0.000 claims description 5
- 230000009467 reduction Effects 0.000 claims description 5
- 230000011218 segmentation Effects 0.000 claims description 5
- 238000005520 cutting process Methods 0.000 claims description 3
- 238000011156 evaluation Methods 0.000 claims description 3
- 238000003062 neural network model Methods 0.000 claims description 2
- 235000013399 edible fruits Nutrition 0.000 claims 1
- 238000012544 monitoring process Methods 0.000 claims 1
- 238000005303 weighing Methods 0.000 claims 1
- 238000005516 engineering process Methods 0.000 abstract description 2
- 238000004891 communication Methods 0.000 abstract 1
- 230000006870 function Effects 0.000 description 4
- 238000003860 storage Methods 0.000 description 4
- 238000009826 distribution Methods 0.000 description 3
- 230000007812 deficiency Effects 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 210000005036 nerve Anatomy 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000007115 recruitment Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L45/00—Routing or path finding of packets in data switching networks
- H04L45/12—Shortest path evaluation
- H04L45/125—Shortest path evaluation based on throughput or bandwidth
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L47/00—Traffic control in data switching networks
- H04L47/70—Admission control; Resource allocation
- H04L47/83—Admission control; Resource allocation based on usage prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L47/00—Traffic control in data switching networks
- H04L47/70—Admission control; Resource allocation
- H04L47/82—Miscellaneous aspects
- H04L47/822—Collecting or measuring resource availability data
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/60—Scheduling or organising the servicing of application requests, e.g. requests for application data transmissions using the analysis and optimisation of the required network resources
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明涉及云计算技术领域,为解决跨地域的数据中心的任务调度问题,优化任务在数据中心内的调度结果,从而最小化整体完成时间。为此,本发明,基于超图分割的跨数据中心任务调度与带宽分配方法,由任务调度控制部分和网络带宽分配部分组成,任务调度控制部分负责实现任务在基于网络互连的数据中心间的调度部署,任务调度部分周期性的检测作业到达并启动调度算法,通过结合当前监控采集到的数据中心资源容量、任务完成状态等信息生成调度方案;网络流量控制部分分为两类:实时在线应用交互式网络流和任务调度过程中的数据传输非交互网络流。本发明主要应用于通信控制场合。
Description
技术领域
本发明涉及云计算技术领域,特别是数据中心的任务调度与优化领域。具体涉及基于超图分割的跨数据中心任务调度与带宽分配方法。
背景技术
最新的趋势表明,云计算数据中心正朝着超大规模的方向发展,同时部署形式也由单一集中式部署转向全球化分布式部署。与此同时,面对跨地域的数据中心迫切需要优化调度算法去更好地整合数据中心的计算、存储和网络资源,从而实现高效的资源调度和任务部署,提高数据中心的生产效益。但是跨地域的数据中心管理也必须解决诸如广域分布式数据、数据共享、网络带宽传输成本、数据中心资源限制以及最小化总体完成时间的目标等一系列的问题。该场景下的调度需要考虑多个维度的约束条件,增加了问题的复杂性,同时需要求解的问题属于NP-难类型,难以在多项式内的时间里求出最优解。因此跨地域的数据中心调度面临着诸多挑战。
目前,已经有很多工作针对数据中心的资源管理和任务调度做出了研究,比如Greedy,CDS[1],HPS[2],Flutter[3]等调度方法,但是这些方法都存在着或多或少的缺陷,难以适应复杂的调度需要。Greedy采用贪心算法并基于最大数据本地化的思想去进行任务调度;CDS将任务调度建模为一个社区发现问题,通过迭代式的调度算法来实现数据本地化的最优目标,但是Greedy和CDS都忽略了任务调度顺序对WAN数据传输量的潜在影响,导致了过大的数据量传输;HPS采用了超图分割的思想,以增加文件传输总量的代价去实现各个数据中心总体时间的均衡,同时偏重于处理资源需要远大于资源容量的情况,其调度性能在计算资源充足的场景下表现不佳;Flutter将跨中心中心的调度形式化为字典序最小-最大整数线性规划问题,但是它的求解过程需要一系列的限制条件,导致了其适用范围较差,同时对于带宽不足的调度场景求解能力很差。
1Y.Li,L.Zhao,C.Cui,and C.Yu.Fast big data analysis in geodistributedcloud.In 2016IEEE International Conference on Cluster Computing(CLUSTER),pages 388–391,Sept 2016.
2L.Yin,J.Sun,L.Zhao,C.Cui,J.Xiao,and C.Yu.Joint scheduling of dataand computation in geo-distributed cloud systems.In CCGrid,pages 657–666.IEEE,2015.
3Zhiming Hu,Baochun Li,and Jun Luo.Flutter:Scheduling tasks closer todata across geo-distributed datacenters.In Proceedings-IEEE INFOCOM,pages423–428,2016.
发明内容
为克服现有技术的不足,本发明旨在解决跨地域的数据中心的任务调度问题,通过综合考虑数据中心资源限制,网络传输带宽消耗,数据副本及共享等因素,优化任务在数据中心内的调度结果,从而最小化整体完成时间。为此,本发明采取的技术方案是,基于超图分割的跨数据中心任务调度与带宽分配方法,由任务调度控制部分和网络带宽分配部分组成,任务调度控制部分负责实现任务在基于网络互连的数据中心间的调度部署,任务调度部分周期性的检测作业到达并启动调度算法,通过结合当前监控采集到的数据中心资源容量、任务完成状态等信息生成调度方案;网络流量控制部分分为两类:实时在线应用交互式网络流和任务调度过程中的数据传输非交互网络流;对于交互式网络流,通过深度神经网络模型去预测下一步的流量需求并预分配相应的带宽满足其需要;对于非交互网络流,通过网络带宽分配RBA算法去为具有不同大小数据传输量的任务分配相应带宽,结合任务的CPU计算时间去调整对应的数据传输时间,均衡所有任务的总时间消耗,实现最小化整体完成时间的目标。
任务调度部分具体步骤如下:
1)周期性检测作业到达,拆分作业成多个子任务Taski,放入当前任务队列NT,如果检测到NT已满,转入步骤2),否则继续步骤1);
2)构建数据中心图GS=(NS,ES),其中NS代表数据中心集合,ES代表数据中心的连接,之后采集当前系统内数据中心集合NS的CPU核心数量Ri,i∈NS;
3)构建任务图GV=(NV,EV),其中NV=NT∪NF,NT代表任务集合,NF代表他们对应是输入文件,EV代表任务和文件之间的依赖关系,一个文件也可能被多个任务共享,一个任务可能需要多个文件,每个文件有多个副本分布在不同的数据中心内,但是每个任务只指定其中一个副本作为其输入;
4)构建扩展任务图GAG=(NAG,EAG),其中
NG=NT∪NF∪NS,NAG包含了属于NT,NF和NS的所有顶点,代表存储了文件f副本的数据中心的集合,基础的任务图只包含任务-文件二者之间的关系,在扩展图中,通过使用连接边将f∈NF连接到中的底层节点,从而得到EAG,EAG描述了任务-文件-数据中心三者之间的关系;
5)将扩展任务图建模成超图H=(V,E),其中V代表顶点集合,E代表网络集合,每一个超边代表连接到某个文件的所有顶点;
6)定义k路超图分割方法:即给定一个超图H=(V,E),寻找一个k路划分V→P,使得H集合中的顶点映射到k个不相交的分区,满足给定的限制条件同时使得成本最小化,其中P={H1,H2,...Hk,},对于H1∪H2...∪Hk=H,如果对于一个特定的分区,它的顶点映射到多个分区,那么超图的一个超边e是一个切割;
7)求解k路超图分割结果从而在满足给定的平衡标准时最小化超边切割,共包含四个主要核心点:
7.1)引入具有单位权重的虚拟任务N*,为了消除原始超图分割中平衡机制对于调度结果的负面影响,引入S-R个虚拟任务去填充数据中心的多余资源,S代表NS总的CPU资源容量,R代表NT总的CPU资源需求,每个N*请求一个CPU核心,既没有文件输入也不产生输出,计算时间为0,N*只存在于调度阶段,不进行实际的执行,在超图H={V,E}中,顶点包括3种,用公式定义为|V|=|NT|+|NS|+|N*|;
7.2)给数据中心节点赋值负权重。对于一个任务顶点vt∈NT∪N*,其权重值设置为对应任务的资源需求量,即而对于一个数据中心顶点vs∈NS,其权重值为负的资源总量大小,即一个超边nj∈E代表与文件fj相关联的顶点的连接信息,相关顶点包含中的任务顶点和中的数据中心顶点,nj的成本设置为文件的数据量大小,即注意到虚拟任务N*没有输入,所以其不存在任务和文件关联超边;
7.3)数据传输量无重复计算的分割成本函数定义,每一个分区都包含一组任务节点和一个单独的数据中心节点,它建议该分区中的任务都被调度到该数据中心中执行,从而最小化网络传输数据量,在超图分割的设置中令k=|NS|,用Λj表示网络nj的连接集合,即nj连接的区域集合,λj=|Λj|代表区域的数量,fj需要被传输次,表示存储有fj的数据中心数量,成本函数Cut(P)定义为:
7.4)趋近于0的均衡约束,超图分割的目标是保证权重划分平衡的同时最小化分割成本Cut(P),即其中ε是预定义好的趋近于0的常量,意味着不平衡比率,在上述约束条件下,每个分割区域包含且只包含一个数据中心顶点,同时数据中心的负值权重和任务需求的正值权重求和,正负值相抵趋近于0,使得在达到任务均衡调度的同时,每个数据中心的资源使用不会超过其资源总量限制;
8)超图分割问题求解,采用Zoltan工具包进行求解,得到超图分割调度结果。
RBA算法主要步骤如下:
1)初始化整体完成时间c,赋予一个最大值MAX;
2)基于公式
计算所需要的网络带宽bij,从满足c的最短路径出发,根据bij对它们进行分配;
3)每次以△c的量减小整体完成时间c,其中△c=c1-c,计算新的带宽分配增量△b,更新当前路径的每个网络链路带宽和剩余的带宽;
4)如果数据流ij的当前路径不能提供更多的网络带宽去满足△b,则从Pij[N]中选择次短路径去分配带宽,同样的,如果一条数据流的可用带宽耗尽,就将其从分配过程中移除,继续处理下一条数据流;
5)如果链路中无带宽可用或者全部带宽需要都得到满足,则算法结束,否则重复步骤3)。
本发明的特点及有益效果是:
本发明在中国天文台数据中心网络和谷歌B4数据中心网络进行了效果评估。天文台数据中心系统包含5个数据中心和7个WAN链路,数据总量超过150TB,数据中心总资源容量超过2500个CPU核心,HPS+进行2000个任务的调度;Google B4网络包括12个数据中心,17条WAN链路,HPS+进行1500个任务的调度,结果评估对比显示,相比现有的方法,HPS+可以降低53%的数据传输量,减少39%的总体完成时间,改善效果显著。
附图说明:
图1为调度系统的架构设计,系统包括任务的调度器(负责副本选择和任务放置),SDN控制器(负责网络数据流量分发控制),系统运行在跨地域的数据中心网络内,提供任务调度方案计算。
图2为HPS+调度示例场景,该场景具有5个资源异构的数据中心,通过5条WAN链接互联,包含5个文件,部分文件存在副本,需要调度5个任务,我们利用该场景演示HPS+的调度过程。
图3为示例场景下的超图分割结果,扩展任务图经过HPS+算法的分割后,生成的调度结果如右侧子图所示,黑色虚线表示超图中的关联边,红色虚线代表文件传输路径。
图4为RBA带宽分配算法演示图,该算法可以根据不同任务的计算时间和数据传输量,调整不同任务文件传输路径中的带宽,平衡各个任务的总体完成时间。
图5为HPS+算法数据传输量对比,相比Greedy,CDS,HPS和Flutter算法,HPS+在不同任务数的调度组中,均具有更小的数据传输量。
图6为HPS+算法总体完成时间对比,相比Greedy,CDS,HPS和Flutter算法,HPS+在不同任务数的调度组中,均具有更小的总体完成时间。
具体实施方式
为了弥补现有方法的不足,本发明提出了基于超图分割的跨数据中心调度方法HPS+。相比现有的工作,HPS+综合考虑了数据中心的计算、存储和网络资源,同时首次构建了基于任务-数据-数据中心依赖的扩展任务图,并采用了超图分割方法去最小化网络数据传输量。HPS+可以根据数据中心的能力有效地在一个划分步骤中分配任务,这种单相超图划分方法使得其具有更优异的性能,即HPS+可以结合数据中心的资源异构性并将更多的任务分配给容量更大的数据中心。其次,HPS+充分考虑了任务之间的网络争用风险,设计了任务感知路由和带宽分配(RBA)算法用于协调任务之间的数据传输和计算,以最小化整体完成时间。
跨地域的数据中心任务调度面临着三个问题,分别是如何进行数据副本选择,如何进行任务放置以及如何路由网络数据流传输。为了解决上述问题,本发明提供了一种最小化整体完成时间的调度方法,通过将任务-数据-数据中心的关联关系扩展为增强超图并进行分割求解,并设计了共享式的任务感知路由和带宽分配(RBA)算法,实现数据传输量的优化和整体完成时间最小化。本发明的高效调度方法主要由任务调度控制器和网络带宽分配器两部分组成。
1.任务调度控制器
任务调度控制器主要负责实现任务在基于网络互连的数据中心间的调度部署。任务调度器周期性的检测作业到达并启动调度算法,通过结合当前监控采集到的数据中心资源容量、任务完成状态等信息生成调度方案。具体步骤如下:
1)周期性检测作业到达,拆分作业成多个子任务Taski,放入当前任务队列NT,如果检测到NT已满,转入步骤2),否则继续步骤1);
2)构建数据中心图GS=(NS,ES),其中NS代表数据中心集合,ES代表数据中心的连接。之后采集当前系统内数据中心集合NS的CPU核心数量Ri,i∈NS。
3)构建任务图GV=(NV,EV),其中NV=NT∪NF,NT代表任务集合,NF代表他们对应是输入文件,EV代表任务和文件之间的依赖关系。一个文件也可能被多个任务共享,一个任务可能需要多个文件,每个文件有多个副本分布在不同的数据中心内,但是每个任务只指定其中一个副本作为其输入。
4)构建扩展任务图GAG=(NAG,EAG),其中
NG=NT∪NF∪NS,NAG包含了属于NT,NF和NS的所有顶点,代表存储了文件f副本的数据中心的集合。基础的任务图只包含任务-文件二者之间的关系。在扩展图中,通过使用连接边将f∈NF连接到中的底层节点,从而得到EAG,EAG描述了任务-文件-数据中心三者之间的关系。
5)将扩展任务图建模成超图H=(V,E),其中V代表顶点集合,E代表网络(超边)集合。每一个超边代表连接到某个文件的所有顶点(含数据中心节点和任务节点)。
6)定义k路超图分割方法:即给定一个超图H=(V,E),寻找一个k路划分V→P,使得H集合中的顶点映射到k个不相交的分区,满足给定的限制条件同时使得成本最小化。其中P={H1,H2,...Hk,},对于H1∪H2...∪Hk=H。如果对于一个特定的分区,它的顶点映射到多个分区,那么超图的一个超边e是一个切割。
7)求解k路超图分割结果从而在满足给定的平衡标准时最小化超边切割。共包含四个主要核心点:
7.1)引入具有单位权重的虚拟任务N*。为了消除原始超图分割中平衡机制对于调度结果的负面影响,HPS+引入了S-R个虚拟任务去填充数据中心的多余资源,S代表NS总的CPU资源容量,R代表NT总的CPU资源需求。每个N*请求一个CPU核心,既没有文件输入也不产生输出,计算时间为0。N*只存在于调度阶段,不进行实际的执行。在HPS+的超图H={V,E}中,顶点包括3种,用公式定义为|V|=|NT|+|NS|+|N*|。
7.2)给数据中心节点赋值负权重。对于一个任务顶点vt∈NT∪N*,其权重值设置为对应任务的资源需求量,即而对于一个数据中心顶点vs∈NS,其权重值为负的资源总量大小,即一个超边nj∈E代表与文件fj相关联的顶点的连接信息,相关顶点包含中的任务顶点和中的数据中心顶点。nj的成本设置为文件的数据量大小,即注意到虚拟任务N*没有输入,所以其不存在任务和文件关联超边。
7.3)数据传输量无重复计算的分割成本函数定义。每一个分区都包含一组任务节点和一个单独的数据中心节点,它建议该分区中的任务都被调度到该数据中心中执行,从而最小化网络传输数据量。在超图分割的设置中令k=|NS|,用Λj表示网络nj的连接集合,即nj连接的区域集合,λj=|Λj|代表区域的数量。fj需要被传输次,表示存储有fj的数据中心数量。成本函数Cut(P)定义为:
7.4)趋近于0的均衡约束。超图分割的目标是保证权重划分平衡的同时最小化分割成本Cut(P),即其中ε是预定义好的趋近于0的常量,意味着不平衡比率,在上述约束条件下,每个分割区域包含且只包含一个数据中心顶点,同时数据中心的负值权重和任务需求的正值权重求和,正负值相抵趋近于0,使得在达到任务均衡调度的同时,每个数据中心的资源使用不会超过其资源总量限制。
8)超图分割问题求解,HPS+采用了改进的Zoltan(一个超图分割求解算法)工具包进行求解,得到超图分割调度结果。
2.网络带宽分配器
网络流量控制主要分为两类:交互式网络流(实时在线应用)和非交互网络流(任务调度过程中的数据传输)。对于交互式网络流,网络带宽控制器通过深度神经网络模型去预测下一步的流量需求并预分配相应的带宽满足其需要。对于非交互网络流,SDN控制器通过RBA算法去为具有不同大小数据传输量的任务分配相应带宽,结合任务的CPU计算时间去调整对应的数据传输时间,均衡所有任务的总时间消耗,实现最小化整体完成时间的目标。
RBA算法主要步骤如下:
1)初始化整体完成时间c,赋予一个最大值MAX;
2)基于公式
计算所需要的网络带宽bij,从满足c的最短路径出发,根据bij对它们进行分配;
3)每次以△c的量减小整体完成时间c,其中△c=c1-c,计算新的带宽分配增量△b,更新当前路径的每个网络链路带宽和使用剩余的带宽;
4)如果数据流ij的当前路径不能提供更多的网络带宽去满足△b,则从Pij[N]中选择次短路径去分配带宽。同样的,如果一条数据流的可用带宽耗尽,就将其从分配过程中移除,继续处理下一条数据流;
5)若链路中无带宽可用或者全部带宽需要都得到满足,算法结束,否则重复步骤3);
以下结合图2及较佳实施例,对依据本发明提供的具体实施方式、结构、特征及其功效,详细说明如下:
1.超图分割任务调度
1)周期性检测作业到达,并生成任务队列NT={T1,T2,T3,T4,T5},任务的CPU计算资源需求h分别为60,50,50,50,50,计算时间p分别为70,80,60,100,90。
2)定义数据中心图GS=(NS,ES),数据中心集合为NS={S1,S2,S3,S4,S5},其对应的资源容量R分别为100,100,100,100,110,数据中心的连接Ruv分别为R12=20,R13=40,R14=20,R15=50,R45=50,Ruv为双向传输连接。
3)定义任务图GV=(NV,EV),其中任务和文件关联关系为 文件大小sf分别为1000,800,1000,1000,1000。
4)构建扩展任务图GAG=(NAG,EAG),其中
5)将扩展任务图建模成超图H=(V,E),超图中的顶点集合定义为共包括5个数据中心顶点和5个任务顶点,由于数据中心总资源量为总的任务资源需求量所以V中包含了250个虚拟任务节点V对应的权重分别为w(V)={-100,-100,-100,-100,-110,60,50,50,50,50,11,12,...,1250}。超边集合E定义为E={<f1,S1>,<f2,S1>,<f2,S3>,<f3,S1>,<f3,S2>,<f4,S4>,<f5,S1>,<f1,T1>,……<f1,T3>,<f2,T2>,<f2,T3>,<f3,T2>,<f4,T4>,<f4,T5>,<f5,T5>}。
6)超图分割问题求解,HPS+采用了改进的Zoltan工具包进行求解,得到超图分割调度结果,划分的5个分区集合分别为:Partition={<S1,T2,T3>,<S2>,<S3,T1>,<S4,T4,T5>,<S5>},最终的数据传输量为2000。
2.RBA路由与网络带宽分配
根据上述超图分割求解得出的调度方案,任务和数据中心的部署分布如下:Partition={<S1,T2,T3>,<S2>,<S3,T1>,<S4,T4,T5>,<S5>},之后利用RBA算法进行路由和网络分配,需要处理的数据流包含两条,数据中心S1将文件f1传输至S3,数据中心S1将文件f5传输至S4。算法主要步骤如下:
1)初始化整体完成时间c,赋予一个最大值MAX=20000;
2)各个文件的大小为sf={1000,800,1000,1000,1000},各个任务的计算时间为p={70,80,60,100,90},S1至S4的最短路径为S1→S4,次短路径为S1→S5→S4;S1至S5的最短路径为S1→S5,次短路径为S1→S4→S5。基于公式计算所需要的网络带宽bij,从满足c的最短路径出发,根据bij对它们进行分配;
3)每次以△c=500的量减小整体完成时间c,根据公式
计算新的带宽分配增量△b,更新当前路径的每个网络链路带宽和使用剩余的带宽;
4)计算链路中全部带宽需要都得到满足,算法结束,否则重复步骤3,计算得到RBA算法调度的总体完成时间为104.3秒。
3.调度算法执行开销
HPS+的调度阶段的算法时间复杂度为O(|NT|+|NS|+|N*|+μ|NF|)。
RBA路由与带宽分配阶段的算法时间复杂度为O(φ|EV|),φ代表c减少的迭代次数,|EV|是任务产生的最大流的数量。
HPS+总体算法复杂度为O(|NT|+|NS|+|N*|+μ|NF|+φ|EV|),在2000个调度任务量级下平均执行时间小于2秒,Greedy算法执行时间最短,平均为0.2秒,CDS,HPS和Flutter这些现有的算法执行时间随着任务的增大而提高,在调度上本发明具有执行时间短且稳定的优点。
Claims (3)
1.一种基于超图分割的跨数据中心任务调度与带宽分配方法,其特征是,由任务调度控制部分和网络带宽分配部分组成,任务调度控制部分负责实现任务在基于网络互连的数据中心间的调度部署,任务调度部分周期性的检测作业到达并启动调度算法,通过结合当前监控采集到的数据中心资源容量、任务完成状态等信息生成调度方案;网络流量控制部分分为两类:实时在线应用交互式网络流和任务调度过程中的数据传输非交互网络流;对于交互式网络流,通过深度神经网络模型去预测下一步的流量需求并预分配相应的带宽满足其需要;对于非交互网络流,通过网络带宽分配RBA算法去为具有不同大小数据传输量的任务分配相应带宽,结合任务的CPU计算时间去调整对应的数据传输时间,均衡所有任务的总时间消耗,实现最小化整体完成时间的目标。
2.如权利要求1所述的基于超图分割的跨数据中心任务调度与带宽分配方法,其特征是,任务调度部分具体步骤如下:
1)周期性检测作业到达,拆分作业成多个子任务Taski,放入当前任务队列NT,如果检测到NT已满,转入步骤2),否则继续步骤1);
2)构建数据中心图GS=(NS,ES),其中NS代表数据中心集合,ES代表数据中心的连接,之后采集当前系统内数据中心集合NS的CPU核心数量Ri,i∈NS;
3)构建任务图GV=(NV,EV),其中NV=NT∪NF,NT代表任务集合,NF代表他们对应是输入文件,EV代表任务和文件之间的依赖关系,一个文件也可能被多个任务共享,一个任务可能需要多个文件,每个文件有多个副本分布在不同的数据中心内,但是每个任务只指定其中一个副本作为其输入;
4)构建扩展任务图GAG=(NAG,EAG),其中
NG=NT∪NF∪NS,NAG包含了属于NT,NF和NS的所有顶点,代表存储了文件f副本的数据中心的集合,基础的任务图只包含任务-文件二者之间的关系,在扩展图中,通过使用连接边将f∈NF连接到中的底层节点,从而得到EAG,EAG描述了任务-文件-数据中心三者之间的关系;
5)将扩展任务图建模成超图H=(V,E),其中V代表顶点集合,E代表网络集合,每一个超边代表连接到某个文件的所有顶点;
6)定义k路超图分割方法:即给定一个超图H=(V,E),寻找一个k路划分V→P,使得H集合中的顶点映射到k个不相交的分区,满足给定的限制条件同时使得成本最小化,其中P={H1,H2,...Hk,},对于H1∪H2...∪Hk=H,如果对于一个特定的分区,它的顶点映射到多个分区,那么超图的一个超边e是一个切割;
7)求解k路超图分割结果从而在满足给定的平衡标准时最小化超边切割,共包含四个主要核心点:
7.1)引入具有单位权重的虚拟任务N*,为了消除原始超图分割中平衡机制对于调度结果的负面影响,引入S-R个虚拟任务去填充数据中心的多余资源,S代表NS总的CPU资源容量,R代表NT总的CPU资源需求,每个N*请求一个CPU核心,既没有文件输入也不产生输出,计算时间为0,N*只存在于调度阶段,不进行实际的执行,在超图H={V,E}中,顶点包括3种,用公式定义为|V|=|NT|+|NS|+|N*|;
7.2)给数据中心节点赋值负权重。对于一个任务顶点vt∈NT∪N*,其权重值设置为对应任务的资源需求量,即而对于一个数据中心顶点vs∈NS,其权重值为负的资源总量大小,即一个超边nj∈E代表与文件fj相关联的顶点的连接信息,相关顶点包含中的任务顶点和中的数据中心顶点,nj的成本设置为文件的数据量大小,即注意到虚拟任务N*没有输入,所以其不存在任务和文件关联超边;
7.3)数据传输量无重复计算的分割成本函数定义,每一个分区都包含一组任务节点和一个单独的数据中心节点,它建议该分区中的任务都被调度到该数据中心中执行,从而最小化网络传输数据量,在超图分割的设置中令k=|NS|,用Λj表示网络nj的连接集合,即nj连接的区域集合,λj=|Λj|代表区域的数量,fj需要被传输次,表示存储有fj的数据中心数量,成本函数Cut(P)定义为:
7.4)趋近于0的均衡约束,超图分割的目标是保证权重划分平衡的同时最小化分割成本Cut(P),即其中ε是预定义好的趋近于0的常量,意味着不平衡比率,在上述约束条件下,每个分割区域包含且只包含一个数据中心顶点,同时数据中心的负值权重和任务需求的正值权重求和,正负值相抵趋近于0,使得在达到任务均衡调度的同时,每个数据中心的资源使用不会超过其资源总量限制;
8)超图分割问题求解,采用Zoltan工具包进行求解,得到超图分割调度结果。
3.如权利要求1所述的基于超图分割的跨数据中心任务调度与带宽分配方法,其特征是,RBA算法主要步骤如下:
1)初始化整体完成时间c,赋予一个最大值MAX;
2)基于公式
计算所需要的网络带宽bij,从满足c的最短路径出发,根据bij对它们进行分配;
3)每次以Δc的量减小整体完成时间c,其中Δc=c1-c,计算新的带宽分配增量Δb,更新当前路径的每个网络链路带宽和剩余的带宽;
4)如果数据流ij的当前路径不能提供更多的网络带宽去满足Δb,则从Pij[N]中选择次短路径去分配带宽,同样的,如果一条数据流的可用带宽耗尽,就将其从分配过程中移除,继续处理下一条数据流;
5)如果链路中无带宽可用或者全部带宽需要都得到满足,则算法结束,否则重复步骤3)。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910280808.2A CN110138830B (zh) | 2019-04-09 | 2019-04-09 | 基于超图分割的跨数据中心任务调度与带宽分配方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910280808.2A CN110138830B (zh) | 2019-04-09 | 2019-04-09 | 基于超图分割的跨数据中心任务调度与带宽分配方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110138830A true CN110138830A (zh) | 2019-08-16 |
CN110138830B CN110138830B (zh) | 2021-10-15 |
Family
ID=67569520
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910280808.2A Active CN110138830B (zh) | 2019-04-09 | 2019-04-09 | 基于超图分割的跨数据中心任务调度与带宽分配方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110138830B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112395605A (zh) * | 2020-11-23 | 2021-02-23 | 国网四川省电力公司信息通信公司 | 基于关联规则的电力物联网数据融合方法 |
WO2021129575A1 (zh) * | 2019-12-26 | 2021-07-01 | 华为技术有限公司 | 带宽调度方法、流量传输方法及相关产品 |
US11212212B2 (en) | 2020-04-15 | 2021-12-28 | Hewlett Packard Enterprise Development Lp | Non-isolated topologies in computing network environments |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6088691A (en) * | 1995-01-30 | 2000-07-11 | International Business Machines Corporation | Enumerating projection in SQL queries containing outer and full outer joins in the presence of inner joins |
CN102835974A (zh) * | 2012-08-23 | 2012-12-26 | 华南理工大学 | 基于并行计算机的医学超声三维成像方法 |
CN103885839A (zh) * | 2014-04-06 | 2014-06-25 | 孙凌宇 | 基于多水平划分法和赋权有向超图的云计算任务调度方法 |
CN106411770A (zh) * | 2016-09-08 | 2017-02-15 | 重庆邮电大学 | 一种基于sdn架构的数据中心网络节能路由算法 |
-
2019
- 2019-04-09 CN CN201910280808.2A patent/CN110138830B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6088691A (en) * | 1995-01-30 | 2000-07-11 | International Business Machines Corporation | Enumerating projection in SQL queries containing outer and full outer joins in the presence of inner joins |
CN102835974A (zh) * | 2012-08-23 | 2012-12-26 | 华南理工大学 | 基于并行计算机的医学超声三维成像方法 |
CN103885839A (zh) * | 2014-04-06 | 2014-06-25 | 孙凌宇 | 基于多水平划分法和赋权有向超图的云计算任务调度方法 |
CN106411770A (zh) * | 2016-09-08 | 2017-02-15 | 重庆邮电大学 | 一种基于sdn架构的数据中心网络节能路由算法 |
Non-Patent Citations (2)
Title |
---|
LINGYAN YIN: ""Joint Scheduling of Data and Computation in Geo-distributed Cloud Systems"", 《2015 15TH IEEE/ACM INTERNATIONAL SYMPOSIUM ON CLUSTER, CLOUD AND GRID COMPUTING》 * |
YUE LI: ""Fast Big Data Analysis in Geo-Distributed Cloud "", 《2016 IEEE INTERNATIONAL CONFERENCE ON CLUSTER COMPUTING》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021129575A1 (zh) * | 2019-12-26 | 2021-07-01 | 华为技术有限公司 | 带宽调度方法、流量传输方法及相关产品 |
US11929942B2 (en) | 2019-12-26 | 2024-03-12 | Huawei Cloud Computing Technologies Co., Ltd. | Method and device for network traffic scheduling |
US11212212B2 (en) | 2020-04-15 | 2021-12-28 | Hewlett Packard Enterprise Development Lp | Non-isolated topologies in computing network environments |
CN112395605A (zh) * | 2020-11-23 | 2021-02-23 | 国网四川省电力公司信息通信公司 | 基于关联规则的电力物联网数据融合方法 |
CN112395605B (zh) * | 2020-11-23 | 2022-10-11 | 国网四川省电力公司信息通信公司 | 基于关联规则的电力物联网数据融合方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110138830B (zh) | 2021-10-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109981438B (zh) | 一种面向sdn和nfv协同部署框架的卫星网络负载均衡方法 | |
US11243805B2 (en) | Job distribution within a grid environment using clusters of execution hosts | |
CN110297699B (zh) | 调度方法、调度器、存储介质及系统 | |
CN108566659B (zh) | 一种基于可靠性的5g网络切片在线映射方法 | |
CN105610715B (zh) | 一种基于sdn的云数据中心多虚拟机迁移调度计划方法 | |
CN110138830A (zh) | 基于超图分割的跨数据中心任务调度与带宽分配方法 | |
Sharkh et al. | A resource scheduling model for cloud computing data centers | |
Thirumalaiselvan et al. | A strategic performance of virtual task scheduling in multi cloud environment | |
Rodrigues et al. | Network-aware container scheduling in multi-tenant data center | |
Bin-Obaid et al. | Fairness in resource allocation: Foundation and applications | |
Wang et al. | A survey on resource scheduling for data transfers in inter-datacenter WANs | |
Elsharkawey et al. | Mlrts: multi-level real-time scheduling algorithm for load balancing in fog computing environment | |
CN110958192B (zh) | 一种基于虚拟交换机的虚拟数据中心资源分配系统及方法 | |
CN105577834B (zh) | 具有可预测性能的云数据中心两层带宽分配方法及系统 | |
Bisht et al. | Survey on Load Balancing and Scheduling Algorithms in Cloud Integrated Fog Environment | |
Shahid et al. | A precedence based load balancing strategy for batch of DAGs for computational grid | |
CN114978913A (zh) | 一种基于切链的服务功能链跨域部署方法及系统 | |
Bo et al. | Adaptive scheme based on status feedback for virtual network mapping | |
Bolodurina et al. | The optimization of traffic management for cloud application and services in the virtual data center | |
Venuthurumilli et al. | An Energy and Deadline Aware Scheduling Using Greedy Algorithm for Cloud Computing. | |
Gamal Ahmed Bekhit | Resource Allocation and Optimal Scheduling of Virtual Network Functions in Software Defined Networks | |
Bekhit | Resource Allocation and Optimal Scheduling of Virtual Network Functions in Software Defined Networks | |
Patel et al. | A new approach for grid load balancing among heterogeneous resources with bandwidth consideration | |
Mosayyebi et al. | A clonal selection mechanism for load balancing in the cloud computing system | |
Aoun et al. | Service differentiation based on flexible time constraints in market-oriented grids |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |