CN115129466B - 云计算资源分层调度方法、系统、设备及介质 - Google Patents

云计算资源分层调度方法、系统、设备及介质 Download PDF

Info

Publication number
CN115129466B
CN115129466B CN202210334976.7A CN202210334976A CN115129466B CN 115129466 B CN115129466 B CN 115129466B CN 202210334976 A CN202210334976 A CN 202210334976A CN 115129466 B CN115129466 B CN 115129466B
Authority
CN
China
Prior art keywords
cloud computing
target
physical node
computing center
preset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210334976.7A
Other languages
English (en)
Other versions
CN115129466A (zh
Inventor
李金库
韦昊典
康博瑞
韩飞
刘源
马建峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xidian University
Original Assignee
Xidian University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xidian University filed Critical Xidian University
Priority to CN202210334976.7A priority Critical patent/CN115129466B/zh
Publication of CN115129466A publication Critical patent/CN115129466A/zh
Application granted granted Critical
Publication of CN115129466B publication Critical patent/CN115129466B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5061Partitioning or combining of resources
    • G06F9/5072Grid computing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5011Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resources being hardware resources other than CPUs, Servers and Terminals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5011Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resources being hardware resources other than CPUs, Servers and Terminals
    • G06F9/5016Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resources being hardware resources other than CPUs, Servers and Terminals the resource being the memory
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • G06F9/5038Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering the execution order of a plurality of tasks, e.g. taking priority or time dependency constraints into consideration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • G06F9/505Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering the load
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5083Techniques for rebalancing the load in a distributed system
    • G06F9/5088Techniques for rebalancing the load in a distributed system involving task migration
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种云计算资源分层调度方法、系统、设备及介质,方法包括:云计算平台根据预设的第一调度方法,选择目标云计算中心,并下发作业任务至所述目标云计算中心;所述目标云计算中心根据预设的第二调度方法,选择目标物理节点,并下发所述作业任务至所述目标物理节点;所述目标云计算中心根据预设的第三调度方法,选择目标载体,并下发所述作业任务至所述目标载体;其中,所述预设的第一调度方法、预设的第二调度方法及预设的第三调度方法均为基于拍卖理论设计的算法;本发明有效降低了云计算中心的总能耗,同时有效降低了在层次间调度过程采用不同算法而产生的冗杂度;通过对目标载体类型的选择,有效提升了云计算中心的安全性。

Description

云计算资源分层调度方法、系统、设备及介质
技术领域
本发明属于云计算技术领域,特别涉及一种云计算资源分层调度方法、系统、设备及介质。
背景技术
随着互联网的快速发展和广泛使用,基于互联网产生的数据变得越来越复杂,且规模越来越大;云计算平台以其高效、方便及廉价的特点,实现了对大数据处理、计算和存储的需求;而云计算中心作为云计算平台的基础支持设施,也是支持云服务的物理载体,在云计算技术领域的重要性不言而喻。
如今,云计算服务的规模不断扩大,越来越多的企业、组织开始采用由多个云计算中心组成的云计算平台为用户提供各类云服务;此类云计算平台可以根据用户不同的要求以及地理位置,选择更合适的云计算中心向用户提供服务,达到交互时延更短,成本更低的目的,从而进一步提升云计算的性能;同时,上述云计算平台还可以构建容灾备份机制,增强平台的可用性,提供更可靠的服务;因此,合理并高效地统一管理、调度、分配多个云计算中心的各类资源,完成用户提交的作业,已成为一个重要的研究方向。
目前,对于仅有单个云计算中心的云计算平台而言,当用户提交具体的作业需求,选定期望获得的虚拟资源数量之后,接下来的具体资源分配工作,即是选定云计算中心内某台物理节点,在此物理节点上创建用户所需的虚拟节点,向用户提供服务;其中,选择物理节点的过程,就是云计算资源调度的过程;根据调度结果在选定物理节点上创建虚拟节点,可以达到负载均衡,提高服务质量QoS等目的;但拥有多个云计算中心的云计算平台,在处理同样的资源调度问题上,在选定物理节点前,首先要经过对云计算中心的一次选择;这意味着调度过程变得更复杂,规模更大。
PUE值是指数据中心消耗的所有能源与IT负载消耗的能源之比,PUE值越接近于1,表示一个数据中心的绿色化程度越高;而IT设备和空调制冷设备是数据中心的主要能耗来源,两者通常占数据中心总能耗的85%,当空调制冷设备消耗越低,PUE值也就越低。云计算中心,也称作云计算数据中心,作为一种新型的数据中心,也可以用PUE值衡量能源比。现有的很多云计算资源调度算法,考虑的是提高单台物理节点的资源利用率,减少云计算中心活动的物理节点数量,从而降低能耗;但不均衡的系统负载,除了会影响服务器的寿命,还会导致机房环境的热不平衡,进而影响冷却系统负载,带来高能耗;因此,保证系统负载均衡,是在处理云计算资源调度问题中不可缺少的一环。
因此,设计并实现一个云计算资源调度系统,解决涉及多个云计算中心的云计算资源调度问题,达到降低云计算中心总能耗、提高云计算平台服务质量以及增强云服务的安全性、可靠性的目的,具有较高的实用价值与现实意义。
发明内容
针对现有技术中存在的技术问题,本发明提供了一种云计算资源分层调度方法、系统、设备及介质,以解决多个云计算中心的云计算资源调度,实现降低云计算中心能耗,提高云服务的安全性和可靠性的技术问题。
为达到上述目的,本发明采用的技术方案为:
本发明提供了一种云计算资源分层调度方法,包括:
获取待执行的用户作业,并将所述待执行的用户作业拆解为若干个作业任务;
根据预设的分层调度方法,将每个作业任务下发至目标载体;
其中,所述每个作业任务下发至目标载体的过程,具体如下:
云计算平台根据预设的第一调度方法,选择目标云计算中心,并下发作业任务至所述目标云计算中心;
所述目标云计算中心根据预设的第二调度方法,选择目标物理节点,并下发所述作业任务至所述目标物理节点;
所述目标云计算中心根据预设的第三调度方法,选择目标载体,并下发所述作业任务至所述目标载体;其中,所述目标载体作为运行所述作业任务的载体,包括所述目标物理节点或所述目标物理节点上的虚拟节点;
其中,所述预设的第一调度方法、预设的第二调度方法及预设的第三调度方法均为基于拍卖理论设计的算法。
进一步的,若目标载体为所述目标物理节点上的虚拟节点时,在下发所述作业任务至所述目标载体之前,还包括状态检查步骤:
所述状态检查步骤,具体包括:
查询所述目标物理节点上的虚拟节点的创建状态;若所述虚拟节点创建失败,则返回至目标物理节点的选择步骤;若所述虚拟节点创建成功,则下发所述作业任务至所述虚拟节点;
查询所述作业任务在所述虚拟节点上的运行状态;若所述作业任务运行失败,则返回至目标物理节点的选择步骤;若所述作业任务运行成功,则结束。
进一步的,云计算平台根据预设的第一调度方法,选择目标云计算中心,并下发作业任务至所述目标云计算中心之后,还包括定时检查步骤;所述定时检查步骤,每间隔预设时间段执行一次,具体包括:
遍历查询所述目标云计算中心内所有物理节点的运行状态;若某个物理节点无法正常通信,则对所述物理节点内运行的作业任务,执行目标物理节点的选择步骤;
查询所有目标云计算中心内所有虚拟节点的运行状态;若某个虚拟节点无法正常通信,则对所述虚拟节点内运行的作业任务,执行目标物理节点的选择步骤;
查询所述目标云计算中心内负责运行的作业任务的运行状态;若运行失败,则对所述作业任务,执行目标物理节点的选择步骤;
预设所述目标云计算中心内所有物理节点的未来某个时间的系统负载状态;若系统负载状态超标,则对所述物理节点内运行的作业任务进行迁移。
进一步的,云计算平台根据预设的第一调度方法,选择目标云计算中心,并下发作业任务至所述目标云计算中心的过程,具体如下:
云计算平台向云计算平台内的所有云计算中心发送一级拍卖通知;所述一级拍卖通知包括所述作业任务的资源信息;
每个所述云计算中心响应所述一级拍卖通知,分别向云计算平台提交一级标书FbidFi
其中,所述一级标书FbidFi为:
FbidFi=(FrsoFi,SrFi,RgFi)
FrsoFi=(coFi,roFi,doFi,noFi,goFi)
其中,FrsoFi为第i个云计算中心的资源可用量;SrFi为第i个云计算中心的历史任务完成率;RgFi为第i个云计算中心的地理因素;coFi为第i个云计算中心的可提供CPU核数;roFi为第i个云计算中心的内存量;doFi为第i个云计算中心的硬盘量;noFi为第i个云计算中心的网宽;goFi为第i个云计算中心的GPU核数;
根据所述一级标书FbidFi,利用预设的第一竞价函数,计算每个云计算中心的投标结果;
根据所述每个云计算中心的投标结果,确定目标云计算中心;
下发作业任务至所述目标云计算中心。
进一步的,所述目标云计算中心根据预设的第二调度方法,选择目标物理节点,并下发所述作业任务至所述目标物理节点的过程,具体如下:
所述目标云计算中心接收作业任务后,向所述目标云计算中心内的所有可用物理节点发送二级拍卖通知;所述二级拍卖通知包括所述作业任务的资源信息;
每个所述可用物理节点响应所述二级拍卖通知,分别向所述目标云计算中心提交二级标书SbidSj
其中,所述二级标书SbidSj为:
SbidSj=(SrsoSj,srSj,vnSj)
SrsoSj=(coSj,roSj,doSj,noSj,goSj)
其中,SrsoSj为第j个可用物理节点的资源剩余量;srSj为第j个可用物理节点的历史任务完成率;vnSj为第j个可用物理节点上当前运行的虚拟节点数量;coSj为第j个可用物理节点的可提供CPU核数;roSj为第j个可用物理节点的内存量;doSj为第j个可用物理节点的硬盘量;noSj为第j个可用物理节点的网宽;goSj为第j个可用物理节点的GPU核数;
根据所述二级标书SbidSj,利用预设的第二竞价函数,计算每个可用物理节点的投标结果;
根据所述每个可用物理节点的投标结果,确定目标物理节点;
下发作业任务至所述目标物理节点。
进一步的,所述目标云计算中心根据预设的第三调度方法,选择目标载体,并下发所述作业任务至所述目标载体的过程,具体如下:
所述目标云计算中心读取目标物理节点的资源信息,以获取三级标书TbidTm
其中,所述三级标书TbidTm为:
TbidTm=(TrsoTm,safeTm,speedTm)
TrsoTm=(coTm,roTm,doTm,noTm,goTm)
其中,TrsoTm为目标物理节点的资源剩余量;safeTm为目标物理节点及物理节点上的虚拟节点的安全等级;speedTm为目标物理节点或物理节点上的虚拟节点的启动速度;coTm为目标物理节点的可提供CPU核数;roTm为目标物理节点的内存量;doTm为目标物理节点的硬盘量;noTm为目标物理节点的网宽;goTm为目标物理节点的GPU核数;
根据所述三级标书TbidTm,利用预设的第三竞价函数,计算所述目标物理节点以及物理节点上的虚拟节点的投标结果;
根据所述目标物理节点以及物理节点上的虚拟节点的投标结果,确定目标载体;
下发作业任务至所述目标载体。
进一步的,所述目标物理节点上的虚拟节点为在所述目标物理节点上创建的虚拟机或容器。
本发明还提供了一种云计算资源分层调度系统,包括:
作业模块,用于获取待执行的用户作业,并将所述待执行的用户作业拆解为若干个作业任务;
分层调度模块,用于根据预设的分层调度方法,将每个作业任务下发至目标载体;
其中,所述每组任务需求下发至目标载体的过程,具体如下:
云计算平台根据预设的第一调度方法,选择目标云计算中心,并下发作业任务至所述目标云计算中心;
所述目标云计算中心根据预设的第二调度方法,选择目标物理节点,并下发所述作业任务至所述目标物理节点;
所述目标云计算中心根据预设的第三调度方法,选择目标载体,并下发所述作业任务至所述目标载体;其中,所述目标载体作为运行所述作业任务的载体,包括所述目标物理节点或所述目标物理节点上的虚拟节点;
其中,所述预设的第一调度方法、预设的第二调度方法及预设的第三调度方法均为基于拍卖理论设计的算法。
本发明还提供了一种云计算资源分层调度设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现所述的云计算资源分层调度方法的步骤。
本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现所述的云计算资源分层调度方法的步骤。
与现有技术相比,本发明的有益效果为:
本发明提供了一种云计算资源分层调度方法及系统,将待执行的用户作业拆解为若干组任务需求,对每组任务需求按照预设的分层调度方法选择目标载体,以实现将用户作业从云计算平台下发到目标云计算中心内的物理节点上,有效降低了云计算中心的总能耗;每层调度过程采用基于拍卖理论设计的调度方法,有效降低了在层次间调度过程采用不同算法而产生的冗杂度;通过对目标载体类型的选择,有效提升了云计算中心的安全性。
进一步的,通过设置状态检查步骤和定时检查步骤,确保了任务需求调度及任务需求运行的顺利进行,有效提升了云计算系统的可靠性,进而提升了云计算服务的可用性;同时,通过目标云计算中心内所有物理节点的未来某个时间的系统负载状态的定时检查,确保了云计算中心内物理节点系统负载均衡,有效降低了云计算中心内冷却系统的负载压力,最终达到降低云计算中心总能耗的目的。
进一步的,基于拍卖理论设计的调度方法,对云计算中心及物理节点的地理因素、任务完成率的考量,在降低云计算中心总能耗的同时,有效提升了云计算平台的服务质量,从而提高了用户满意度。
附图说明
图1为实施例所述的云计算资源分层调度方法的流程图;
图2为实施例中的云计算资源分层调度总体架构图;
图3为实施例中的状态检查步骤的流程图;
图4为实施例中的定时检查步骤的流程图。
具体实施方式
为了使本发明所解决的技术问题,技术方案及有益效果更加清楚明白,以下具体实施例,对本发明进行进一步的详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明提供了一种云计算资源分层调度方法,包括调度阶段和检查阶段;其中,具体包括以下步骤:
调度阶段:
步骤1、用户上传待执行的用户作业至云计算平台,所述云计算平台获取所述待执行用户作业后,将所述待执行的作用拆解为若干个作业任务;
步骤2、根据预设的分层调度方法,将每个作业任务下发至目标载体。
其中,所述每个作业任务下发至目标载体的过程,包括:第一次调度、第二次调度及第三次调度;具体过程如下:
第一次调度:
云计算平台根据预设的第一调度方法,选择目标云计算中心,并下发作业任务至所述目标云计算中心;其中,所述预设的第一调度方法为基于拍卖理论设计的算法;第一次调度的拍卖物为作业任务,第一次调度的竞拍者为云计算平台内的所有云计算中心,第一次调度的拍卖主持者为云计算平台;第一次调度的拍卖目的是选择目标云计算中心,即为所述作业任务选择最匹配的云计算中心;具体为:
所述云计算平台接收用户提交的待执行的用户作业后,将所述待执行的用户作业拆解为若干个作业任务;向云计算平台内的所有云计算中心发送一级拍卖通知;所述一级拍卖通知包括所述作业任务的资源信息;并调用各云计算中心提供的接口,获取每个所述云计算中心提交的一级标书FbidFi;其中,所述一级标书为每个所述云计算中心响应所述一级拍卖通知后得到,所述一级标书FbidFi具体为:
FbidFi=(FrsoFi,SrFi,RgFi)
FrsoFi=(coFi,roFi,doFi,noFi,goFi)
其中,FrsoFi为第i个云计算中心的资源可用量;SrFi为第i个云计算中心的历史任务完成率;RgFi为第i个云计算中心的地理因素;coFi为第i个云计算中心的可提供CPU核数;roFi为第i个云计算中心的内存量;doFi为第i个云计算中心的硬盘量;noFi为第i个云计算中心的网宽;goFi为第i个云计算中心的GPU核数。
根据所述FbidFi一级标书,利用预设的第一竞价函数,计算每个云计算中心的投标结果;根据所述每个云计算中心的投标结果,确定目标云计算中心;下发所述作业任务至所述目标云计算中心,至此第一次调度完成。
第二次调度:
所述目标云计算中心根据预设的第二调度方法,选择目标物理节点,并下发所述作业任务至所述目标物理节点;其中,所述预设的第二调度方法为基于拍卖理论设计的算法;第二次调度的拍卖物为作业任务,第二次调度的竞拍者为目标云计算中心内的各物理节点;第二次调度的拍卖主持者为目标云计算中心;第二次调度的拍卖目的为选择目标物理节点,即为所述作业任务选择最匹配的物理节点;具体为:
所述目标云计算中心接收作业任务后,向所述目标云计算中心内的所有可用物理节点发送二级拍卖通知;所述二级拍卖通知包括所述作业任务的资源信息;每个所述可用物理节点响应所述二级拍卖通知,分别向所述目标云计算中心提交二级标书SbidSj
其中,所述二级标书SbidSj为:
SbidSj=(SrsoSj,srSj,vnSj)
SrsoSj=(coSj,roSj,doSj,noSj,goSj)
其中,SrsoSj为第j个可用物理节点的资源剩余量;srSj为第j个可用物理节点的历史任务完成率;vnSj为第j个可用物理节点上当前运行的虚拟节点数量;coSj为第j个可用物理节点的可提供CPU核数;roSj为第j个可用物理节点的内存量;doSj为第j个可用物理节点的硬盘量;noSj为第j个可用物理节点的网宽;goSj为第j个可用物理节点的GPU核数。
根据所述二级标书SbidSj,利用预设的第二竞价函数,计算每个可用物理节点的投标结果;根据所述每个可用物理节点的投标结果,确定目标物理节点;下发作业任务至所述目标物理节点;至此第二次调度完成。
第三次调度:
所述目标云计算中心根据预设的第三调度方法,选择目标载体,并下发所述作业任务至所述目标载体;其中,所述预设的第三调度方法为基于拍卖理论设计的算法;第三次调度的拍卖物为作业任务,第三次调度的竞拍者为目标物理节点以及在所述目标物理节点上的虚拟节点;其中,所述虚拟节点为在所述目标物理节点上创建的虚拟机或容器;第三次调度的拍卖主持者为目标云计算中心;第三次调度的拍卖目的为选择目标载体,即为所述作业任务选择最匹配的目标载体,并作为运行所述作业任务的载体;具体为:
所述目标云计算中心读取目标物理节点的资源信息,以获取三级标书TbidTm;其中,所述三级标书TbidTm为:
TbidTm=(TrsoTm,safeTm,speedTm)
TrsoTm=(coTm,roTm,doTm,noTm,goTm)
其中,TrsoTm为目标物理节点的资源剩余量;safeTm为目标物理节点及物理节点上的虚拟节点的安全等级;speedTm为目标物理节点或物理节点上的虚拟节点的启动速度;coTm为目标物理节点的可提供CPU核数;roTm为目标物理节点的内存量;doTm为目标物理节点的硬盘量;noTm为目标物理节点的网宽;goTm为目标物理节点的GPU核数。
根据所述三级标书TbidTm,利用预设的第三竞价函数,计算所述目标物理节点以及物理节点上的虚拟节点的投标结果;根据所述目标物理节点以及物理节点上的虚拟节点的投标结果,确定目标载体;下发作业任务至所述目标载体;至此第三次调度完成,即调度阶段结束。
检查阶段:
本发明中,所述检查阶段包括状态检查步骤及定时检查步骤;其中,所述状态检查步骤,用于对虚拟节点的创建状态以及作业任务执行状态进行检查;所述定时检查步骤,由云计算中心每间隔预设时间自检一次,用于对物理节点的运行状态、虚拟节点的运行状态和作业任务的运行状态进行检查,以及利用马尔科夫预测方法对物理节点的系统负载状态进行预测检查。
状态检查步骤:
若目标载体为所述目标物理节点上的虚拟节点时,在下发所述作业任务至目标载体之前,执行状态检查步骤;具体如下:
查询所述目标物理节点上虚拟节点的创建状态;若所述虚拟节点创建失败,则返回至目标物理节点的选择步骤;若所述虚拟节点创建成功,则下发所述作业任务至所述虚拟节点;
查询所述作业任务在所述虚拟节点上的运行状态;若所述作业任务运行失败,则返回至目标物理节点的选择步骤;若所述作业任务运行成功,则结束。
定时检查步骤:
云计算平台根据预设的第一调度方法选择目标云计算中心,并下发作业任务至所述目标云计算中心之后;所述目标云计算中心,每间隔预设时间段执行一次所述定时检查步骤;所述定时检查步骤,具体如下:
遍历查询所述目标云计算中心内所有物理节点的运行状态;若某个物理节点无法正常通信,则对所述物理节点内运行的作业任务,执行目标物理节点的选择步骤;
查询所有目标云计算中心内所有虚拟节点的运行状态;若某个虚拟节点无法正常通信,则对所述虚拟节点内运行的作业任务,执行目标物理节点的选择步骤;
查询所述目标云计算中心内负责运行的作业任务的运行状态;若运行失败,则对所述作业任务,执行目标物理节点的选择步骤;
预设所述目标云计算中心内所有物理节点的未来某个时间的系统负载状态;若系统负载状态超标,则对所述物理节点内运行的作业任务进行迁移。
本发明所述的云计算资源分层调度方法,通过分层次的调度,可以将作业任务从云计算平台下发到目标云计算中心内的物理节点上,且每次调度均采用基于拍卖理论设计的算法,有效降低了在层次间调度采用不同算法而带来的冗杂度;同时,能保证云计算中心内的物理节点系统负载均衡,从而减轻云计算中心内冷却系统的负载压力,最终达到降低云计算中心总能耗的目的;其次,在降低云计算中心的总能耗的同时,通过调度时对云计算中心地理因素、任务完成率的考虑,可以提升云计算平台的服务质量,从而提高用户满意度;通过调度时对虚拟节点类型的考虑,可以提升云计算中心的安全性;调度系统内的两步检查步骤,保证了作业调度以及作业运行的顺利进行,这提升了系统的可靠性,从而提高了服务的可用性。
本发明还提供了一种云计算资源分层调度系统,包括作业模块及分层调度模块;作业模块,用于获取待执行的用户作业,并将所述待执行的用户作业拆解为若干个作业任务;分层调度模块,用于根据预设的分层调度方法,将每个作业任务下发至目标载体;其中,所述每组任务需求下发至目标载体的过程,具体如下:云计算平台根据预设的第一调度方法,选择目标云计算中心,并下发作业任务至所述目标云计算中心;所述目标云计算中心根据预设的第二调度方法,选择目标物理节点,并下发所述作业任务至所述目标物理节点;所述目标云计算中心根据预设的第三调度方法,选择目标载体,并下发所述作业任务至所述目标载体;其中,所述目标载体作为运行所述作业任务的载体,包括所述目标物理节点或所述目标物理节点上的虚拟节点;其中,所述预设的第一调度方法、预设的第二调度方法及预设的第三调度方法均为基于拍卖理论设计的算法。
本发明还提供了一种云计算资源分层调度设备,包括:存储器,用于存储计算机程序;处理器,用于执行所述计算机程序时实现云计算资源分层调度方法的步骤;所述处理器执行所述计算机程序时实现上述云计算资源分层调度方法的步骤,例如:获取待执行的用户作业,并将所述待执行的用户作业拆解为若干个作业任务;根据预设的分层调度方法,将每个作业任务下发至目标载体;其中,所述每个作业任务下发至目标载体的过程,具体如下:云计算平台根据预设的第一调度方法,选择目标云计算中心,并下发作业任务至所述目标云计算中心;所述目标云计算中心根据预设的第二调度方法,选择目标物理节点,并下发所述作业任务至所述目标物理节点;所述目标云计算中心根据预设的第三调度方法,选择目标载体,并下发所述作业任务至所述目标载体;其中,所述目标载体作为运行所述作业任务的载体,包括所述目标物理节点或所述目标物理节点上的虚拟节点;其中,所述预设的第一调度方法、预设的第二调度方法及预设的第三调度方法均为基于拍卖理论设计的算法。
或者,所述处理器执行所述计算机程序时实现上述系统中各模块的功能,例如:作业模块,用于获取待执行的用户作业,并将所述待执行的用户作业拆解为若干个作业任务;分层调度模块,用于根据预设的分层调度方法,将每个作业任务下发至目标载体;其中,所述每组任务需求下发至目标载体的过程,具体如下:云计算平台根据预设的第一调度方法,选择目标云计算中心,并下发作业任务至所述目标云计算中心;所述目标云计算中心根据预设的第二调度方法,选择目标物理节点,并下发所述作业任务至所述目标物理节点;所述目标云计算中心根据预设的第三调度方法,选择目标载体,并下发所述作业任务至所述目标载体;其中,所述目标载体作为运行所述作业任务的载体,包括所述目标物理节点或所述目标物理节点上的虚拟节点;其中,所述预设的第一调度方法、预设的第二调度方法及预设的第三调度方法均为基于拍卖理论设计的算法。
示例性的,所述计算机程序可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器中,并由所述处理器执行,以完成本发明。所述一个或多个模块/单元可以是能够完成预设功能的一系列计算机程序指令段,所述指令段用于描述所述计算机程序在所述云计算资源分层调度设备中的执行过程。例如,所述计算机程序可以被分割成作业模块及分层调度模块,各模块具体功能如下:作业模块,用于获取待执行的用户作业,并将所述待执行的用户作业拆解为若干个作业任务;分层调度模块,用于根据预设的分层调度方法,将每个作业任务下发至目标载体;其中,所述每组任务需求下发至目标载体的过程,具体如下:云计算平台根据预设的第一调度方法,选择目标云计算中心,并下发作业任务至所述目标云计算中心;所述目标云计算中心根据预设的第二调度方法,选择目标物理节点,并下发所述作业任务至所述目标物理节点;所述目标云计算中心根据预设的第三调度方法,选择目标载体,并下发所述作业任务至所述目标载体;其中,所述目标载体作为运行所述作业任务的载体,包括所述目标物理节点或所述目标物理节点上的虚拟节点;其中,所述预设的第一调度方法、预设的第二调度方法及预设的第三调度方法均为基于拍卖理论设计的算法。
所述云计算资源分层调度设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述云计算资源分层调度设备可包括,但不仅限于处理器、存储器。本领域技术人员可以理解,上述仅仅是云计算资源分层调度设备的示例,并不构成对云计算资源分层调度设备的限定,可以包括比上述更多的部件,或者组合某些部件,或者不同的部件,例如所述云计算资源分层调度设备还可以包括输入输出设备、网络接入设备、总线等。
所称处理器可以是中央处理单元(CentralProcessingUnit,CPU),还可以是其他通用处理器、数字信号处理器(DigitalSignalProcessor,DSP)、专用集成电路(ApplicationSpecificIntegratedCircuit,ASIC)、现成可编程门阵列(Field-ProgrammableGateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者所述处理器也可以是任何常规的处理器等,所述处理器是所述云计算资源分层调度设备的控制中心,利用各种接口和线路连接整个云计算资源分层调度设备的各个部分。
所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现所述云计算资源分层调度设备的各种功能。
所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(SmartMediaCard,SMC),安全数字(SecureDigital,SD)卡,闪存卡(FlashCard)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现所述的一种云计算资源分层调度方法的步骤。
所述云计算资源分层调度系统集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。
基于这样的理解,本发明实现上述云计算资源分层调度方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,所述计算机程序在被处理器执行时,可实现上述云计算资源分层调度方法的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或预设中间形式等。
所述计算机可读存储介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(RandomAccessMemory,RAM)、电载波信号、电信信号以及软件分发介质等。
需要说明的是,所述计算机可读存储介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读存储介质不包括电载波信号和电信信号。
实施例
以某用户a的待执行用户作业Joba的分层调度过程为例。
如附图1-2所示,本实施例提供了一种云计算分层调度方法,包括调度阶段和检查节点;具体过程如下:
调度阶段:
步骤1、用户a向云计算平台提交待执行用户作业Joba;所述云计算平台获取所述待执行用户作业Joba后,将所述待执行作业Joba拆解为若干组任务需求,并将所述每组任务需求拆解为若干个作业任务;本实施例中,以第I组任务需求中第k个作业任务的分层调度过程为例,对本实施例的技术方案进行详细说明。
其中,待用户作业、任务需求及作业任务,具体如下:
Joba=(T1,T2,…,TI,…,TN)T
TI=(TkI1,TkI2,…,TkIk,…,TkIn,tyI)
TkIk=(Rsnk,vtk)
Rsnk=(cnk,rnk,dnk,nnk,gnk)
其中,TI为待执行用户作业Joba中第I组任务需求;TkIk为第I组任务需求中第k个作业任务;tyI为第I组任务需求中所有作业任务的类型;Rsnk为第I组任务需求中第k个作业任务的资源需求;vtk为第I组任务需求中第k个作业任务预设的目标载体类型;cnk为第I组任务需求中第k个作业任务所需的CPU核数;rnk为第I组任务需求中第k个作业任务所需的内存量;dnk为第I组任务需求中第k个作业任务所需的硬盘量;nnk为第I组任务需求中第k个作业任务所需的网宽;gnk为第I组任务需求中第k个作业任务所需的GPU核数。
步骤2、第一次调度
云计算平台根据预设的第一调度方法,选择目标云计算中心,并下发作业任务至所述目标云计算中心;其中,所述预设的第一调度方法为基于拍卖理论设计的算法;具体如下:
步骤21、所述云计算平台向所有云计算中心发送一级拍卖通知,并获取所有每个所述云计算中心提交的一级标书;其中,所述一级拍卖通知包括所述作业任务的资源信息;所述资源信息包括作业任务的资源需求及预设的目标载体类型;所述的一级标书FbidFi为:
FbidFi=(FrsoFi,SrFi,RgFi)
FrsoFi=(coFi,roFi,doFi,noFi,goFi)
其中,FrsoFi为第i个云计算中心的资源可用量;SrFi为第i个云计算中心的历史任务完成率;RgFi为第i个云计算中心的地理因素;coFi为第i个云计算中心的可提供CPU核数;roFi为第i个云计算中心的内存量;doFi为第i个云计算中心的硬盘量;noFi为第i个云计算中心的网宽;goFi为第i个云计算中心的GPU核数。
步骤22、云计算平台根据所述一级标书FbidFi,利用预设的第一竞价函数,计算每个云中心的投标结果;具体如下:
由于一级标书FbidFi中,第i个云计算中心的资源可用量中的元素量纲不统一;本实施例中,对一级标书FbidFi中相同量纲的元素做极差正规化变化;其中,以第I组任务需求中第k个作业任务的资源需求Rsnk与第i个云计算中心的资源可用量FrsoFi为行向量,构建第一变化矩阵;本实施例中,以所述云计算平台内包括三个云计算中心为例。
其中,第一变化矩阵的极差正规化变化过程如下:
i=1,2或3
i=1,2或3
i=1,2或3
i=1,2或3
i=1,2或3
其中,及/>分别对第一变化矩阵的第1-5列的列向量;/>为第一变化矩阵中元素cnk经极差正规化变换后的数值;/>为第一变化矩阵中元素rnk经极差正规化变换后的数值;/>为第一变化矩阵中元素dnk经极差正规化变换后的数值;/>为第一变化矩阵中元素nnk经极差正规化变换后的数值;/>为第一变化矩阵中元素gnk经极差正规化变换后的数值;/>为第一变化矩阵中元素coFi经极差正规化变换后的数值;/>为第一变化矩阵中元素roFi经极差正规化变换后的数值;/>为第一变化矩阵中元素doFi经极差正规化变换后的数值;/>为第一变化矩阵中元素noFi经极差正规化变换后的数值;/>为第一变化矩阵中元素goFi经极差正规化变换后的数值;/>为向量/>中数值最小的元素,i′=1,2,3,4或5;/>为向量/>中数值最大的元素,i′=1,2,3,4或5。
计算第I组任务需求中第k个作业任务的资源需求Rsnk与第i个云计算中心的资源可用量FrsoFi的欧式距离,并记作第一欧式距离d1;其中,所述第一欧式距离d1为:
以第一欧式距离d1为基底,将所述一级标书FbidFi中的第i个云计算中心的历史任务完成率SrFi以及第i个云计算中心的地理因素RgFi为附加项,以预设比例的方式提价,得到第i个云计算中心的投标结果。
其中,所述第i个云计算中心的投标结果Fprice为:
Fprice=d1*F1(SrFi,RgFi)
其中,F1(SrFi,RgFi)为第i个云计算中心的附加项比例值。
步骤23、根据所述每个云计算中心的投标结果,确定目标云计算中心;下发所述作业任务至所述目标云计算中心,至此第一次调度完成。
步骤3、第二次调度
所述目标云计算中心根据预设的第二调度方法,选择目标物理节点,并下发所述作业任务至目标物理节点;其中,所述预设的第二调度方法为基于拍卖理论设计的算法;具体为:
步骤31、所述目标云计算中心接收作业任务后,向所述目标云计算中心内的所有可用物理节点发送二级拍卖通知;所述二级拍卖通知包括所述作业任务的资源信息;每个所述可用物理节点响应所述二级拍卖通知,分别向所述目标云计算中心提交二级标书SbidSj
其中,所述二级标书SbidSj为:
SbidSj=(SrsoSj,srSj,vnSj)
SrsoSj=(coSj,roSj,doSj,noSj,goSj)
其中,SrsoSj为第j个可用物理节点的资源剩余量;srSj为第j个可用物理节点的历史任务完成率;vnSj为第j个可用物理节点上当前运行的虚拟节点数量;coSj为第j个可用物理节点的可提供CPU核数;roSj为第j个可用物理节点的内存量;doSj为第j个可用物理节点的硬盘量;noSj为第j个可用物理节点的网宽;goSj为第j个可用物理节点的GPU核数。
步骤32、所述目标云计算中心根据所述二级标书SbidSj,利用预设的第二竞价函数,计算每个可用物理节点的投标结果;具体如下:
由于所述二级标书SbidSj中,第j个可用物理节点的资源剩余量中的元素量纲不统一;本实施例中,对所述二级标书SbidSj中相同量纲的元素做极差正规化变化;其中,以第I组任务需求中第k个作业任务的资源需求Rsnk与第i个可用物理节点的资源可用量SrsoSj为行向量,构建第二变化矩阵;本实施例中,以所述目标云计算中心内包括三个可用物理节点为例。
其中,所述第二变化矩阵的极差正规化变化过程如下:
j=1,2或3/>
j=1,2或3
j=1,2或3
j=1,2或3
j=1,2或3
其中,及/>分别对第二变化矩阵的第1-5列的列向量;/>为第二变化矩阵中元素cnk经极差正规化变换后的数值;/>为第二变化矩阵中元素rnk经极差正规化变换后的数值;/>为第二变化矩阵中元素dnk经极差正规化变换后的数值;/>为第二变化矩阵中元素nnk经极差正规化变换后的数值;/>为第二变化矩阵中元素gnk经极差正规化变换后的数值;/>为第二变化矩阵中元素coSj经极差正规化变换后的数值;/>为第二变化矩阵中元素roSj经极差正规化变换后的数值;/>为第二变化矩阵中元素doSj经极差正规化变换后的数值;/>为第二变化矩阵中元素noSj经极差正规化变换后的数值;/>为第二变化矩阵中元素goSj经极差正规化变换后的数值;/>为向量/>中数值最小的元素,j′=1,2,3,4或5;/>为向量/>中数值最大的元素,j′=1,2,3,4或5。
计算第I组任务需求中第k个作业任务的资源需求Rsnk与第j个可用物理节点的资源剩余量SrsoSj的欧式距离,并记作第二欧式距离d2;其中,所述第二欧式距离d2为:
以第二欧式距离d2为基底,将所述二级标书SbidSj中的第j个可用物理节点的历史任务完成率SrSi以及第j个可用物理节点上当前运行的虚拟节点数量vnSj为附加项,以预设比例的方式提价,得到第j个可用物理节点的投标结果.
其中,所述第j个可用物理节点的投标结果Sprice为:
Sprice=d2*F2(srSj,vnSj)
其中,F2(srSj,vnSj)为第j个可用物理节点的附加项比例值。
步骤33、根据所述每个可用物理节点的投标结果,确定目标物理节点;下发所述作业任务至所述目标物理节点,至此第二次调度完成。
步骤4、第三次调度
判断所述作业任务是否存在预设的目标载体类型;若有,则根据所述预设的目标载体类型,在所述目标物理节点,选择对应的目标载体;否则,所述目标云计算中心根据预设的第三调度方法,选择目标载体,并下发所述作业任务至目标载体;其中,所述预设的第三调度方法为基于拍卖理论设计的算法;具体为:
步骤41、所述目标云计算中心读取目标物理节点的资源信息,以获取三级标书TbidTm;其中,所述三级标书TbidTm为:
其中,所述三级标书TbidTm为:
TbidTm=(TrsoTm,safeTm,speedTm)
TrsoTm=(coTm,roTm,doTm,noTm,goTm)
其中,TrsoTm为目标物理节点的资源剩余量;safeTm为目标物理节点及物理节点上的虚拟节点的安全等级;speedTm为目标物理节点或物理节点上的虚拟节点的启动速度;coTm为目标物理节点的可提供CPU核数;roTm为目标物理节点的内存量;doTm为目标物理节点的硬盘量;noTm为目标物理节点的网宽;goTm为目标物理节点的GPU核数。
步骤42、所述目标云计算中心根据所述三级标书TbidTm,利用预设的第三竞价函数,计算所述目标物理节点以及物理节点上的虚拟节点的投标结果;其中,所述物理节点上的虚拟节点为在所述目标物理节点上创建的虚拟机或容器;具体如下:
由于所述三级标书TbidTm中,目标物理节点的资源剩余量中的元素量纲不统一;本实施例中,对所述三级标书TbidTm中相同量纲的元素做极差正规化变化;其中,以第I组任务需求中第m个作业任务的资源需求Rsnm与目标物理节点的资源剩余量为行向量,构建第三变化矩阵。
其中,所述第三变化矩阵的极差正规化变化过程如下:
m=1,2或3
m=1,2或3
m=1,2或3
m=1,2或3/>
m=1,2或3
其中,及/>分别对第三变化矩阵的第1-5列的列向量;/>为第三变化矩阵中元素cnk经极差正规化变换后的数值;/>为第三变化矩阵中元素rnk经极差正规化变换后的数值;/>为第三变化矩阵中元素dnk经极差正规化变换后的数值;/>为第三变化矩阵中元素nnk经极差正规化变换后的数值;/>为第三变化矩阵中元素gnk经极差正规化变换后的数值;/>为第三变化矩阵中元素coTm经极差正规化变换后的数值;/>为第三变化矩阵中元素roTm经极差正规化变换后的数值;/>为第三变化矩阵中元素doTm经极差正规化变换后的数值;/>为第三变化矩阵中元素noTm经极差正规化变换后的数值;/>为第三变化矩阵中元素goTm经极差正规化变换后的数值;/>为向量/>中数值最小的元素,m′=1,2,3,4或5;/>为向量/>中数值最大的元素,m′=1,2,3,4或5。
计算第I组任务需求中第k个作业任务的资源需求Rsnk与目标物理节点的资源剩余量的欧式距离,并记作第三欧式距离d3;其中,所述第三欧式距离d3为:
以第三欧式距离d3为基底,将所述三级标书TbidTm中的目标物理节点及物理节点上的虚拟节点的安全等级safeTm以及目标物理节点或物理节点上的虚拟节点的启动速度speedTm为附加项,以预设比例的方式提价,得到目标物理节点及物理节点上的虚拟节点的投标结果;其中,所述目标物理节点及物理节点上的虚拟节点的投标结果Tprice为:
Tprice=d3*F3(safeTm,speedTm)
其中,F3(safeTm,speedTm)为目标物理节点及物理节点上的虚拟节点的附加项比例值。
步骤33、根据所述目标物理节点以及物理节点上的虚拟节点的投标结果,确定目标载体;下发作业任务至所述目标载体;至此第三次调度完成,即调度阶段结束。
通过检查阶段的上述步骤,将待执行用户作业拆解为若干个作业任务,并将每个作业任务作为分层调度的最小单位,历经三个逻辑层次完成调度;
检查阶段:
本实施例中,所述检查阶段包括状态检查步骤及定时检查步骤;其中,所述状态检查步骤,用于对虚拟节点的创建状态以及作业任务执行状态进行检查;所述定时检查步骤,由云计算中心每间隔预设时间自检一次,用于对物理节点的运行状态、虚拟节点的运行状态和作业任务的运行状态进行检查,以及利用马尔科夫预测方法对物理节点的系统负载状态进行预测检查。
状态检查步骤:
如附图3所示,若目标载体为所述目标物理节点上的虚拟节点时,在下发所述作业任务至目标载体之前,执行状态检查步骤;具体如下:
查询所述目标物理节点上虚拟节点的创建状态;若所述虚拟节点创建失败,则返回至目标物理节点的选择步骤;若所述虚拟节点创建成功,则下发所述作业任务至所述虚拟节点;
查询所述作业任务在所述虚拟节点上的运行状态;若所述作业任务运行失败,则返回至目标物理节点的选择步骤;若所述作业任务运行成功,则结束。
定时检查步骤:
如附图4所示,云计算平台根据预设的第一调度方法选择目标云计算中心,并下发作业任务至所述目标云计算中心之后;所述目标云计算中心,每间隔预设时间段执行一次所述定时检查步骤;所述定时检查步骤,具体如下:
遍历查询所述目标云计算中心内所有物理节点的运行状态;若某个物理节点无法正常通信,则对所述物理节点内运行的作业任务,执行目标物理节点的选择步骤;
查询所有目标云计算中心内所有虚拟节点的运行状态;若某个虚拟节点无法正常通信,则对所述虚拟节点内运行的作业任务,执行目标物理节点的选择步骤;
查询所述目标云计算中心内负责运行的作业任务的运行状态;若运行失败,则对所述作业任务,执行目标物理节点的选择步骤;
预设所述目标云计算中心内所有物理节点的未来某个时间的系统负载状态;若系统负载状态超标,则对所述物理节点内运行的作业任务进行迁移。
其中,预设所述目标云计算中心内所有物理节点的未来某个时间的系统负载状态的预测过程,具体如下:
假设服务器集合记为M={1,2,3,…},将当前系统负载程度记为Li;将系统负载程度从0%到100%,以10%的步长划分为10个等级,得到负载状态空间S;其中,负载状态空间S为:S={L1,L2,…,L10};取物理节点前n个时刻的系统负载作为状态转移序列{X1,X2,…,Xn};将相邻时刻系统负载状态,由系统负载程度Li转移为系统负载程度Lj的次数记为Cij,则状态转移概率公式为:
在当前时刻为n时,若系统负载程度为Li,Pij(j∈S)最大的值对应的j则是系统在n+1时刻最有可能的系统负载程度Lj;假设高负载状态为L9及L10;当Lj∈(L9,L10),说明该物理节点上的部分任务需要做迁移。
在具体的迁移操作过程,首先对该物理节点上的各任务作业的资源需求量进行标准化处理;本实施例中以某物理节点需要对其上正在运行的作业任务进行迁移是,且总共有三个作业任务;所述三个作业任务的资源需求量分别为Rsn1、Rsn2及Rsn3
其中,所述标准化处理过程,具体如下:
t=1,2或3
t=1,2或3
t=1,2或3
t=1,2或3
t=1,2或3
其中,及/>分别对物理节点上的各任务作业的资源需求量的向量;/>为任务作业的资源需求量标准化矩阵中元素cnt经极差正规化变换后的数值;/>为任务作业的资源需求量标准化矩阵中元素rnt经极差正规化变换后的数值;/>为任务作业的资源需求量标准化矩阵中元素dnt经极差正规化变换后的数值;/>为任务作业的资源需求量标准化矩阵中元素nnt经极差正规化变换后的数值;/>为任务作业的资源需求量标准化矩阵中元素gnt经极差正规化变换后的数值;/>为向量/>中数值最小的元素,p=1,2,3,4或5;/>为向量/>中数值最大的元素,p=1,2,3,4或5。
计算作业任务的资源需求量与原点(0,0,0,0)的欧式距离,记为迁移欧式距离dt;其中,所述迁移欧式距离dt为:
对所述迁移欧式距离dt的结果,按照从大到小的顺序进行排序,依次将作业任务进行第二次调度后迁出,每迁出一个任务开始进行一次新的预测,直到预测的系统负载程度才不停止迁移操作。
本实施例提供的一种云计算资源分层调度系统、设备及计算机可读存储介质中相关部分的说明可以参见本实施例所述的一种云计算资源分层调度方法中对应部分的详细说明,在此不再赘述。
上述实施例仅仅是能够实现本发明技术方案的实施方式之一,本发明所要求保护的范围并不仅仅受本实施例的限制,还包括在本发明所公开的技术范围内,任何熟悉本技术领域的技术人员所容易想到的变化、替换及其他实施方式。

Claims (7)

1.一种云计算资源分层调度方法,其特征在于,包括:
获取待执行的用户作业,并将所述待执行的用户作业拆解为若干个作业任务;
根据预设的分层调度方法,将每个作业任务下发至目标载体;
其中,所述每个作业任务下发至目标载体的过程,具体如下:
云计算平台根据预设的第一调度方法,选择目标云计算中心,并下发作业任务至所述目标云计算中心;
所述目标云计算中心根据预设的第二调度方法,选择目标物理节点,并下发所述作业任务至所述目标物理节点;
所述目标云计算中心根据预设的第三调度方法,选择目标载体,并下发所述作业任务至所述目标载体;其中,所述目标载体作为运行所述作业任务的载体,包括所述目标物理节点或所述目标物理节点上的虚拟节点;
其中,所述预设的第一调度方法、预设的第二调度方法及预设的第三调度方法均为基于拍卖理论设计的算法;
云计算平台根据预设的第一调度方法,选择目标云计算中心,并下发作业任务至所述目标云计算中心的过程,具体如下:
云计算平台向云计算平台内的所有云计算中心发送一级拍卖通知;所述一级拍卖通知包括所述作业任务的资源信息;
每个所述云计算中心响应所述一级拍卖通知,分别向云计算平台提交一级标书FbidFi
其中,所述一级标书FbidFi为:
FbidFi=(FrsoFi,SrFi,RgFi)
FrsoFi=(coFi,roFi,doFi,noFi,goFi)
其中,FrsoFi为第i个云计算中心的资源可用量;SrFi为第i个云计算中心的历史任务完成率;RgFi为第i个云计算中心的地理因素;coFi为第i个云计算中心的可提供CPU核数;roFi为第i个云计算中心的内存量;doFi为第i个云计算中心的硬盘量;noFi为第i个云计算中心的网宽;goFi为第i个云计算中心的GPU核数;
根据所述一级标书FbidFi,利用预设的第一竞价函数,计算每个云计算中心的投标结果;
根据所述每个云计算中心的投标结果,确定目标云计算中心;
下发作业任务至所述目标云计算中心;
所述目标云计算中心根据预设的第二调度方法,选择目标物理节点,并下发所述作业任务至所述目标物理节点的过程,具体如下:
所述目标云计算中心接收作业任务后,向所述目标云计算中心内的所有可用物理节点发送二级拍卖通知;所述二级拍卖通知包括所述作业任务的资源信息;
每个所述可用物理节点响应所述二级拍卖通知,分别向所述目标云计算中心提交二级标书SbidSj
其中,所述二级标书SbidSj为:
SbidSj=(SrsoSj,srSj,vnSj)
SrsoSj=(coSj,roSj,doSj,noSj,goSj)
其中,SrsoSj为第j个可用物理节点的资源剩余量;srSj为第j个可用物理节点的历史任务完成率;vnSj为第j个可用物理节点上当前运行的虚拟节点数量;coSj为第j个可用物理节点的可提供CPU核数;roSj为第j个可用物理节点的内存量;doSj为第j个可用物理节点的硬盘量;noSj为第j个可用物理节点的网宽;goSj为第j个可用物理节点的GPU核数;
根据所述二级标书SbidSj,利用预设的第二竞价函数,计算每个可用物理节点的投标结果;
根据所述每个可用物理节点的投标结果,确定目标物理节点;
下发作业任务至所述目标物理节点;
所述目标云计算中心根据预设的第三调度方法,选择目标载体,并下发所述作业任务至所述目标载体的过程,具体如下:
所述目标云计算中心读取目标物理节点的资源信息,以获取三级标书TbidTm
其中,所述三级标书TbidTm为:
TbidTm=(TrsoTm,safeTm,speedTm)
TrsoTm=(coTm,roTm,doTm,noTm,goTm)
其中,TrsoTm为目标物理节点的资源剩余量;safeTm为目标物理节点及物理节点上的虚拟节点的安全等级;speedTm为目标物理节点或物理节点上的虚拟节点的启动速度;coTm为目标物理节点的可提供CPU核数;roTm为目标物理节点的内存量;doTm为目标物理节点的硬盘量;noTm为目标物理节点的网宽;goTm为目标物理节点的GPU核数;
根据所述三级标书TbidTm,利用预设的第三竞价函数,计算所述目标物理节点以及物理节点上的虚拟节点的投标结果;
根据所述目标物理节点以及物理节点上的虚拟节点的投标结果,确定目标载体;
下发作业任务至所述目标载体。
2.根据权利要求1所述的一种云计算资源分层调度方法,其特征在于,若目标载体为所述目标物理节点上的虚拟节点时,在下发所述作业任务至所述目标载体之前,还包括状态检查步骤:
所述状态检查步骤,具体包括:
查询所述目标物理节点上的虚拟节点的创建状态;若所述虚拟节点创建失败,则返回至目标物理节点的选择步骤;若所述虚拟节点创建成功,则下发所述作业任务至所述虚拟节点;
查询所述作业任务在所述虚拟节点上的运行状态;若所述作业任务运行失败,则返回至目标物理节点的选择步骤;若所述作业任务运行成功,则结束。
3.根据权利要求1所述的一种云计算资源分层调度方法,其特征在于,云计算平台根据预设的第一调度方法,选择目标云计算中心,并下发作业任务至所述目标云计算中心之后,还包括定时检查步骤;所述定时检查步骤,每间隔预设时间段执行一次,具体包括:
遍历查询所述目标云计算中心内所有物理节点的运行状态;若某个物理节点无法正常通信,则对所述物理节点内运行的作业任务,执行目标物理节点的选择步骤;
查询所有目标云计算中心内所有虚拟节点的运行状态;若某个虚拟节点无法正常通信,则对所述虚拟节点内运行的作业任务,执行目标物理节点的选择步骤;
查询所述目标云计算中心内负责运行的作业任务的运行状态;若运行失败,则对所述作业任务,执行目标物理节点的选择步骤;
预设所述目标云计算中心内所有物理节点的未来某个时间的系统负载状态;若系统负载状态超标,则对所述物理节点内运行的作业任务进行迁移。
4.根据权利要求1所述的一种云计算资源分层调度方法,其特征在于,所述目标物理节点上的虚拟节点为在所述目标物理节点上创建的虚拟机或容器。
5.一种云计算资源分层调度系统,其特征在于,包括:
作业模块,用于获取待执行的用户作业,并将所述待执行的用户作业拆解为若干个作业任务;
分层调度模块,用于根据预设的分层调度方法,将每个作业任务下发至目标载体;
其中,所述每个作业任务下发至目标载体的过程,具体如下:
云计算平台根据预设的第一调度方法,选择目标云计算中心,并下发作业任务至所述目标云计算中心;
所述目标云计算中心根据预设的第二调度方法,选择目标物理节点,并下发所述作业任务至所述目标物理节点;
所述目标云计算中心根据预设的第三调度方法,选择目标载体,并下发所述作业任务至所述目标载体;其中,所述目标载体作为运行所述作业任务的载体,包括所述目标物理节点或所述目标物理节点上的虚拟节点;
其中,所述预设的第一调度方法、预设的第二调度方法及预设的第三调度方法均为基于拍卖理论设计的算法;
云计算平台根据预设的第一调度方法,选择目标云计算中心,并下发作业任务至所述目标云计算中心的过程,具体如下:
云计算平台向云计算平台内的所有云计算中心发送一级拍卖通知;所述一级拍卖通知包括所述作业任务的资源信息;
每个所述云计算中心响应所述一级拍卖通知,分别向云计算平台提交一级标书FbidFi
其中,所述一级标书FbidFi为:
FbidFi=(FrsoFi,SrFi,RgFi)
FrsoFi=(coFi,roFi,doFi,noFi,goFi)
其中,FrsoFi为第i个云计算中心的资源可用量;SrFi为第i个云计算中心的历史任务完成率;RgFi为第i个云计算中心的地理因素;coFi为第i个云计算中心的可提供CPU核数;roFi为第i个云计算中心的内存量;doFi为第i个云计算中心的硬盘量;noFi为第i个云计算中心的网宽;goFi为第i个云计算中心的GPU核数;
根据所述一级标书FbidFi,利用预设的第一竞价函数,计算每个云计算中心的投标结果;
根据所述每个云计算中心的投标结果,确定目标云计算中心;
下发作业任务至所述目标云计算中心;
所述目标云计算中心根据预设的第二调度方法,选择目标物理节点,并下发所述作业任务至所述目标物理节点的过程,具体如下:
所述目标云计算中心接收作业任务后,向所述目标云计算中心内的所有可用物理节点发送二级拍卖通知;所述二级拍卖通知包括所述作业任务的资源信息;
每个所述可用物理节点响应所述二级拍卖通知,分别向所述目标云计算中心提交二级标书SbidSj
其中,所述二级标书SbidSj为:
SbidSj=(SrsoSj,srSj,vnSj)
SrsoSj=(coSj,roSj,doSj,noSj,goSj)
其中,SrsoSj为第j个可用物理节点的资源剩余量;srSj为第j个可用物理节点的历史任务完成率;vnSj为第j个可用物理节点上当前运行的虚拟节点数量;coSj为第j个可用物理节点的可提供CPU核数;roSj为第j个可用物理节点的内存量;doSj为第j个可用物理节点的硬盘量;noSj为第j个可用物理节点的网宽;goSj为第j个可用物理节点的GPU核数;
根据所述二级标书SbidSj,利用预设的第二竞价函数,计算每个可用物理节点的投标结果;
根据所述每个可用物理节点的投标结果,确定目标物理节点;
下发作业任务至所述目标物理节点;
所述目标云计算中心根据预设的第三调度方法,选择目标载体,并下发所述作业任务至所述目标载体的过程,具体如下:
所述目标云计算中心读取目标物理节点的资源信息,以获取三级标书TbidTm
其中,所述三级标书TbidTm为:
TbidTm=(TrsoTm,safeTm,speedTm)
TrsoTm=(coTm,roTm,doTm,noTm,goTm)
其中,TrsoTm为目标物理节点的资源剩余量;safeTm为目标物理节点及物理节点上的虚拟节点的安全等级;speedTm为目标物理节点或物理节点上的虚拟节点的启动速度;coTm为目标物理节点的可提供CPU核数;roTm为目标物理节点的内存量;doTm为目标物理节点的硬盘量;noTm为目标物理节点的网宽;goTm为目标物理节点的GPU核数;
根据所述三级标书TbidTm,利用预设的第三竞价函数,计算所述目标物理节点以及物理节点上的虚拟节点的投标结果;
根据所述目标物理节点以及物理节点上的虚拟节点的投标结果,确定目标载体;
下发作业任务至所述目标载体。
6.一种云计算资源分层调度设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1-4任一项所述的云计算资源分层调度方法的步骤。
7.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-4任一项所述的云计算资源分层调度方法的步骤。
CN202210334976.7A 2022-03-31 2022-03-31 云计算资源分层调度方法、系统、设备及介质 Active CN115129466B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210334976.7A CN115129466B (zh) 2022-03-31 2022-03-31 云计算资源分层调度方法、系统、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210334976.7A CN115129466B (zh) 2022-03-31 2022-03-31 云计算资源分层调度方法、系统、设备及介质

Publications (2)

Publication Number Publication Date
CN115129466A CN115129466A (zh) 2022-09-30
CN115129466B true CN115129466B (zh) 2024-05-10

Family

ID=83376822

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210334976.7A Active CN115129466B (zh) 2022-03-31 2022-03-31 云计算资源分层调度方法、系统、设备及介质

Country Status (1)

Country Link
CN (1) CN115129466B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117539642B (zh) * 2024-01-09 2024-04-02 上海晨钦信息科技服务有限公司 一种信用卡分布式调度平台及调度方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106502780A (zh) * 2016-12-30 2017-03-15 南京理工大学 基于拍卖的动态vm配置及组合分配方法
CN107967179A (zh) * 2017-12-12 2018-04-27 山东省计算中心(国家超级计算济南中心) 一种支持突发应急的云计算资源分配方法
CN109343945A (zh) * 2018-09-11 2019-02-15 中国空间技术研究院 一种基于合同网算法的多任务动态分配方法
CN111045827A (zh) * 2019-12-17 2020-04-21 华东理工大学 云雾环境中基于资源共享的时间有效性的任务调度方法
CN111433745A (zh) * 2017-12-14 2020-07-17 谷歌有限责任公司 共享计算资源的动态容量优化
CN112491964A (zh) * 2020-11-03 2021-03-12 中国人民解放军国防科技大学 移动辅助边缘计算方法、装置、介质和设备

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9904579B2 (en) * 2013-03-15 2018-02-27 Advanced Elemental Technologies, Inc. Methods and systems for purposeful computing
US11614974B2 (en) * 2017-10-06 2023-03-28 Convida Wireless, Llc Enabling a fog service layer with application to smart transport systems

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106502780A (zh) * 2016-12-30 2017-03-15 南京理工大学 基于拍卖的动态vm配置及组合分配方法
CN107967179A (zh) * 2017-12-12 2018-04-27 山东省计算中心(国家超级计算济南中心) 一种支持突发应急的云计算资源分配方法
CN111433745A (zh) * 2017-12-14 2020-07-17 谷歌有限责任公司 共享计算资源的动态容量优化
CN109343945A (zh) * 2018-09-11 2019-02-15 中国空间技术研究院 一种基于合同网算法的多任务动态分配方法
CN111045827A (zh) * 2019-12-17 2020-04-21 华东理工大学 云雾环境中基于资源共享的时间有效性的任务调度方法
CN112491964A (zh) * 2020-11-03 2021-03-12 中国人民解放军国防科技大学 移动辅助边缘计算方法、装置、介质和设备

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
"Auction-Based VM Allocation for Deadline-Sensitive Tasks in Distributed Edge Cloud";Guoju Gao;《IEEE Transactions on Services Computing》;20211231;第14卷(第6期);第1702-1716页 *
"基于OpenStack的云计算资源分层调度系统";韦昊典;《中国优秀硕士学位论文全文数据库 信息科技辑》;20230715(第2023年07期);第I139-173页 *
"多用户环境下移动计算迁移的研究与实现";王菲;《中国优秀硕士学位论文全文数据库 信息科技辑》;20200215(第2020年02期);第I136-998页 *

Also Published As

Publication number Publication date
CN115129466A (zh) 2022-09-30

Similar Documents

Publication Publication Date Title
US10241826B2 (en) Semantic-aware and user-aware admission control for performance management in data analytics and data storage systems
US9542223B2 (en) Scheduling jobs in a cluster by constructing multiple subclusters based on entry and exit rules
CN112801448B (zh) 物料需求分配方法、装置、系统及存储介质
CN109993484A (zh) 数据处理方法及系统、介质和计算设备
CN103970604A (zh) 基于MapReduce架构实现图处理的方法和装置
CN108762687B (zh) Io服务质量控制方法、装置、设备及存储介质
US9448824B1 (en) Capacity availability aware auto scaling
CN104272244A (zh) 用于对处理进行调度以实现空间节省的系统、方法和计算机程序产品
CN111898221A (zh) 选址方法、装置及计算机可读存储介质
CN109521943B (zh) 云数据库实例的分配方法及相关产品
US20120323821A1 (en) Methods for billing for data storage in a tiered data storage system
CN115129466B (zh) 云计算资源分层调度方法、系统、设备及介质
CN113495779A (zh) 一种任务调度方法和装置、任务执行系统
US20220229701A1 (en) Dynamic allocation of computing resources
Nazeri et al. Energy aware resource provisioning for multi-criteria scheduling in cloud computing
CN114461384A (zh) 任务执行方法、装置、计算机设备和存储介质
CN111124619B (zh) 一种面向二次调度的容器调度方法
CN105528303B (zh) 用于管理存储系统的方法和装置
US12008678B2 (en) Discrete optimisation
CN114996019A (zh) 任务分配方法、装置、计算机设备、存储介质和程序产品
CN111523927A (zh) 资源的发送方法、装置、设备及存储介质
CN108694460B (zh) 产品需求预测方法及装置
CN112801144B (zh) 资源分配方法、装置、计算机设备及存储介质
CN111651125A (zh) 一种分布式系统中存储区块的确定方法和相关装置
US10320708B2 (en) Latency reduction with pre-moving of distributed data and adaptive allocating of compute operations

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant