CN114444700A - 一种量子云计算平台作业调度与资源分配方法 - Google Patents
一种量子云计算平台作业调度与资源分配方法 Download PDFInfo
- Publication number
- CN114444700A CN114444700A CN202111679809.8A CN202111679809A CN114444700A CN 114444700 A CN114444700 A CN 114444700A CN 202111679809 A CN202111679809 A CN 202111679809A CN 114444700 A CN114444700 A CN 114444700A
- Authority
- CN
- China
- Prior art keywords
- computing
- request
- resources
- user
- job
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 45
- 238000013468 resource allocation Methods 0.000 title claims abstract description 27
- 230000002787 reinforcement Effects 0.000 claims abstract description 37
- 239000002699 waste material Substances 0.000 claims abstract description 10
- 238000013528 artificial neural network Methods 0.000 claims description 50
- 238000004364 calculation method Methods 0.000 claims description 40
- 238000009826 distribution Methods 0.000 claims description 37
- 238000012549 training Methods 0.000 claims description 16
- 239000013598 vector Substances 0.000 claims description 12
- 238000010801 machine learning Methods 0.000 claims description 9
- 230000008859 change Effects 0.000 claims description 8
- 230000009471 action Effects 0.000 claims description 7
- 238000005457 optimization Methods 0.000 claims description 5
- 230000001537 neural effect Effects 0.000 claims description 4
- 238000003062 neural network model Methods 0.000 claims description 4
- 230000008569 process Effects 0.000 claims description 4
- 230000003044 adaptive effect Effects 0.000 claims description 2
- 210000002569 neuron Anatomy 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 230000006978 adaptation Effects 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000005040 ion trap Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000002096 quantum dot Substances 0.000 description 1
- 230000005610 quantum mechanics Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N10/00—Quantum computing, i.e. information processing based on quantum-mechanical phenomena
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/455—Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
- G06F9/45533—Hypervisors; Virtual machine monitors
- G06F9/45558—Hypervisor-specific management and integration aspects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5061—Partitioning or combining of resources
- G06F9/5077—Logical partitioning of resources; Management or configuration of virtualized resources
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/455—Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
- G06F9/45533—Hypervisors; Virtual machine monitors
- G06F9/45558—Hypervisor-specific management and integration aspects
- G06F2009/45562—Creating, deleting, cloning virtual machine instances
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computational Mathematics (AREA)
- Condensed Matter Physics & Semiconductors (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种量子云计算平台作业调度与资源分配方法,该方法通过将用户的即时计算请求与非即时计算请求分别调度,可以使有限的量子计算机资源得到合理分配,并且平衡用户租用费用与平台运行成本。通过收集历史数据,对可用非即时计算资源与用户计算请求进行预测,并通过强化学习方法调度非即时请求任务,可以在很长一段时间内削峰补谷,进一步优化资源利用率与请求成功率,避免资源不足和资源浪费情况的发生。
Description
技术领域
本发明涉及量子云计算技术领域,更具体地,涉及一种量子云计算平台作业调度与资源分配方法。
背景技术
量子计算是一种遵循量子力学规律操控量子信息单元进行计算的新型计算模式。量子计算借助量子态的叠加性,能够实现多计算状态的叠加。对于特定的计算任务,量子计算机相对于传统计算机拥有指数级别的加速。近年来,量子计算技术快速发展,量子计算机产品开始走向商用化。
由于量子计算机制造和维护成本极高,因此通过云平台方式共享量子计算资源是未来很长一段时间量子计算机商用的关键技术。多用户Alice1,Alice2,……,Alicen向云平台申请使用计算资源的场景下,如何对计算资源进行合理调度是量子云计算普及过程中需要解决的重要问题。现有量子云计算平台面对多用户的计算请求,往往通过先到先得方法对用户请求进行调度,不能根据用户需求智能的调整调度策略。同时,由于大部分用户计算请求集中在固定时间段,因此在请求高峰期量子计算机资源会出现供不应求的情况,造成用户请求长时间等待;空闲时段又会出现计算资源浪费情况发生。
强化学习(Reinforcement Learning,RL)是机器学习领域中的重要方法,被用于解决智能体与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题。目前强化学习方法已经应用于自动控制、资源分配和机器人交互系统等技术领域。但在量子云计算领域,尚无相关技术的应用。
现有发明专利:(CN113419833A)提出一种针对不同用户划分等级,赋予用户任务不同优先度的方式对用户请求进行调度方式。此方法仅仅考虑了不同用户类型,对用户进行了等级划分,不能对同一用户不同种类的计算请求进行灵活调度。
发明内容
本发明提供一种量子云计算平台作业调度与资源分配方法,该方法可优化资源利用率与请求成功率,避免资源不足和资源浪费情况的发生。
为了达到上述技术效果,本发明的技术方案如下:
一种量子云计算平台作业调度与资源分配方法,包括以下步骤:
S1:云服务器接收用户的量子计算请求;
S2:判断用户的请求类型:包括即时计算请求或非即时计算请求;若即时计算请求,进入步骤S3;否则进入步骤S4;
S3:检查当前时刻t计算中心是否有满足计算请求的计算资源,如有,进入步骤S5,否则该计算请求失败,云平台向用户返回失败信息;
S4:检查当前时间段是否存在空闲作业槽:如果有,将该用户请求加入作业槽中等待资源充足时进行调度;否则该请求失败,云平台告知用户该时段预约已满,请用户更改预约计算时间;
S5:计算中心为即时计算请求创建虚拟机,为用户分配计算资源并实时返回计算结果;
S6:检查当前时刻是否有空闲计算资源,如果有,进入步骤S7;
S7:在作业槽中选择一个或多个非即时计算作业为其分配计算资源,等待计算完成并通过云服务器将计算结果返回给用户;
S8:计算中心将分配结果反馈给云服务器,与服务器收集将分配结果加入状态信息并保存至学习库,训练强化学习神经网络优化作业调度与资源分配策略。
进一步地,所述步骤S1中,用户请求报文包括:用户身份ID、计算请求类型、作业的最早开始时间、最晚开始时间、所需资源数量与持续时间。
进一步地,所述步骤S8中,状态信息包括:计算资源、作业槽中用户计算请求资源数量、选择调度作业槽、当前时间段的请求成功率和计算资源占用率;对于强化学习神经网络,其环境为计算资源和作业槽中用户计算请求资源数量;行为为选择调度的请求作业槽;奖励为当前时间段的请求成功率和计算资源占用率。
进一步地,所述步骤S7的具体过程是:
S71:通过机器学习方法预测当前时间段Δt各个时刻t1,t2,……,tm的可用于非即时计算的计算资源数量s1,s2,……,sm;
S72:获取当前状态信息,包括:当前可用计算资源、系统中各作业槽中非即时计算请求的计算资源数量;
S73:将信息转化为向量,输入强化学习神经网络中,通过网络得到输出;
S74:根据神经网络的输出,即作业调度策略选择一个作业槽中的计算请求,使用首次适应算法为其分配计算资源;
S75:根据不同的分配结果,计算当前时间段的请求成功率和计算资源利用率。
进一步地,所述步骤S71中,采用机器学习方法对时刻t可用于非即时计算任务的资源s进行预测,具体方法为:收集历史数据,包括:即时计算任务的概率分布和资源占用;输入神经网络进行训练;当训练结果的精确度达到阈值且稳定时,保存神经网络模型,即可以通过时间t对可用资源s进行预测。
进一步地,所述强化学习神经网络包含输入层,隐藏层和输出层,其中:
输入层接收当前时刻的状态信息,包括:当前可用计算资源、系统中各作业槽中非即时计算请求的计算资源数量。
进一步地,所述神经输入使用向量表示,具体形式为:[s1,s2,……,sm,k1,t1,k2,t2,……,kn,tn];其中,s1,s2,……,sm为m个时间步中可用的计算资源;k1,t1,k2,t2,……,kn,tn为n个作业槽中作业请求的计算资源数量和持续时间。
进一步地,神经网络的奖励为当前时间段的请求成功率和计算资源利用率,其中:计算请求成功率定义为调度成功的请求数量于总请求数量之比。
进一步地,计算资源利用率定义为当前时间段中计算任务占用的资源于总计算资源的比率;资源利用率越高,资源浪费越少;强化学习神经网络通过训练最大化奖励即请求成功率和计算资源利用可满足量子云计算平台灵活的作业调度和高效的资源分配的要求。
与现有技术相比,本发明技术方案的有益效果是:
本发明通过将用户的即时计算请求与非即时计算请求分别调度,可以使有限的量子计算机资源得到合理分配,并且平衡用户租用费用与平台运行成本。通过收集历史数据,对可用非即时计算资源与用户计算请求进行预测,并通过强化学习方法调度非即时请求任务,可以在很长一段时间内削峰补谷,进一步优化资源利用率与请求成功率,避免资源不足和资源浪费情况的发生。
附图说明
图1为实施例1中的一种量子云计算平台系统的结构图;
图2为本发明方法流程图;
图3为本发明提供的非即时计算任务的具体调度流程图;
图4为本发明提供的强化学习非即时计算作业调度示意图。
图5为本发明提供的强化学习神经网络示意图;
具体实施方式
附图仅用于示例性说明,不能理解为对本专利的限制;
为了更好说明本实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;
对于本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。
下面结合附图和实施例对本发明的技术方案做进一步的说明。
实施例1
如图1所示,本实施例中提供了一种量子云计算平台系统,包括:计算中心,云服务器与用户终端;计算中心和云平台之间通过统一的接口进行通信,云服务器和用户之间通过通信链路进行通信。
其中,计算中心包括:量子计算机和控制单元。
量子计算机类型包括:超导量子计算机,离子阱量子计算机,量子点量子计算机,量子光学量子计算机和拓扑量子计算机等。
由于量子计算的特殊性,量子计算机难以使用时分复用技术将一台计算设备的计算资源分配给多个用户,因此需要多台量子计算设备组成资源集群进行统一调度。
为了进一步的高效的管理与分配量子计算资源并简化用户请求,将量子计算机集群虚拟化为抽象的量子计算资源并将其单位化,用户请求与平台的资源调度以计算单元为基本单位。
控制器接收作业云服务器的指令,将用户的计算请求输入量子计算机并在量子计算结束后将计算结果返回给云服务器。
用户终端包含多个请求方Alice1,Alice2,……,Alicen。请求方向云平台发送计算请求,并以虚拟机的形式获得计算资源。其中,请求有两种类型:一种为即时计算请求,需要云平台实时返回计算结果并进行实时交互;另一种为非即时任务,用户仅需要在特定时间之前获取计算结果。
云服务器连接计算中心与用户终端,包括任务调度模块;当接收用户计算请求时,将计算请求转化为计算作业,并根据任务类型给与不同的调度策略;当量子计算中心完成计算任务时,接收计算结果并返回给用户。
其中,调度任务调度模块含有p个作业槽,当云服务器接收到来自用户的非即时计算任务时,将非即时任务加入空闲作业槽中,等待资源充足时通过强化学习神经网络资源分配策略选择一个或多个作业槽中的计算请求进行调度;如果当前时间段已无空闲作业槽,云平台告知用户该时段预约已满,请用户更改预约计算时间。
如图2所示,该量子云计算平台系统应用了一种量子云计算平台作业调度与资源分配方法,该方法包含以下步骤:
S1:云服务器接收用户的量子计算请求;
其中,用户请求报文包括:用户身份ID、计算请求类型、作业的最早开始时间、最晚开始时间、所需资源数量与持续时间;
S2:判断用户的请求类型:包括即时计算请求或非即时计算请求;若即时计算请求,进入步骤S3;否则进入步骤S4;
S3:检查当前时刻t计算中心是否有满足计算请求的计算资源,如有,进入步骤S5,否则该计算请求失败,云平台向用户返回失败信息。
S4:检查当前时间段是否存在空闲作业槽:如果有,将该用户请求加入作业槽中等待资源充足时进行调度;否则该请求失败,云平台告知用户该时段预约已满,请用户更改预约计算时间。
S5:计算中心为即时计算请求创建虚拟机,为用户分配计算资源并实时返回计算结果;
因为总量子计算资源不变,此时即时计算作业会占用一定数量的计算资源,剩余的计算资源可用于分配给非即时计算任务。通过记录并统计即时计算任务的概率分布于资源占用,可以对特定时间段内的可用资源进行预测,进而对非即时计算作业进行科学分配,避免资源不足与资源浪费情况发生。
S6:检查当前时刻是否有空闲计算资源。如果有,进入步骤S7;
S7:在作业槽中选择一个或多个非即时计算作业为其分配计算资源,等待计算完成并通过云服务器将计算结果返回给用户。
S8:计算中心将分配结果反馈给云服务器,与服务器收集将分配结果加入状态信息并保存至学习库,训练强化学习神经网络优化作业调度与资源分配策略。
其中,状态信息包括:计算资源、作业槽中用户计算请求资源数量、选择调度作业槽、当前时间段的请求成功率和计算资源占用率。对于强化学习神经网络,其环境为计算资源和作业槽中用户计算请求资源数量;行为为选择调度的请求作业槽;奖励为当前时间段的请求成功率和计算资源占用率。
本实施例中所述通过强化学习方法调度非即时任务流程图,如图3所示,具体包括:
S71:通过机器学习方法预测当前时间段Δt各个时刻t1,t2,……,tm的可用于非即时计算的计算资源数量s1,s2,……,sm。
优选的,采用机器学习方法对时刻t可用于非即时计算任务的资源s进行预测,具体方法为:收集历史数据,包括:即时计算任务的概率分布和资源占用;输入神经网络进行训练;当训练结果的精确度达到阈值且稳定时,保存神经网络模型,即可以通过时间t对可用资源s进行预测。
更优选的,神经网络的输入为当前时间t,取值范围为(0,1,2,……,10080),即神经网络预测时间长度为一周,时间单位为分钟。原因是用户计算请求的概率分布和资源占用会随着时间变化,具体表现为:工作日的请求频率更高,非工作日的请求频率较低;工作日的工作时间中请求频率更高,深夜和凌晨则几乎没有即时计算请求。
S72:获取当前状态信息,包括:当前可用计算资源、系统中各作业槽中非即时计算请求的计算资源数量。
S73:将信息转化为向量,输入强化学习神经网络中,通过网络得到输出。
S74:根据神经网络的输出,即作业调度策略选择一个作业槽中的计算请求,使用首次适应算法为其分配计算资源,如图4所示。
S75:根据不同的分配结果,计算当前时间段的请求成功率和计算资源利用率。其中,分配结果包括:当前时间段计算资源可以满足计算请求,请求作业成功;当前时间段计算资源无法满足计算请求,请求作业失败。
为了进一步说明强化学习神经网络和作业调度与资源分配策略之间的关系,如图5所示,强化学习神经网络包含输入层,隐藏层和输出层,其中:
输入层接收当前时刻的状态信息,包括:当前可用计算资源、系统中各作业槽中非即时计算请求的计算资源数量。
神经输入使用向量表示,具体形式为:[s1,s2,……,sm,k1,t1,k2,t2,……,kn,tn]。其中,s1,s2,……,sm为m个时间步中可用的计算资源;k1,t1,k2,t2,……,kn,tn为n个作业槽中作业请求的计算资源数量和持续时间。
隐藏层的数量和每层的神经元个数会对训练速度和训练效果产生影响,需根据具体情况进行设置。
输出层神经元数量为p(分别为1,2,3,……,p)。对于不同的强化学习方法,神经网络的输出拥有不同的涵义。如DQN(Deep Q Network)方法中神经网络的p个输出为对应行为的收益;Policy Gradients方法中神经网络的p个输出为对应采取该行为的概率。根据不同的输出形式,选择从p个作业槽中选择序号为p的计算请求并分配计算资源。
优选的,对于本实施例的强化学习方法,神经网络的奖励(award)为当前时间段的请求成功率和计算资源利用率,其中:
计算请求成功率定义为调度成功的请求数量于总请求数量之比;
计算资源利用率定义为当前时间段中计算任务占用的资源于总计算资源的比率。资源利用率越高,资源浪费越少。
强化学习神经网络通过训练最大化奖励(请求成功率和计算资源利用)可以满足量子云计算平台灵活的作业调度和高效的资源分配的要求。
实施例2
如图2所示,一种量子云计算平台作业调度与资源分配方法,包含以下步骤:
S1:云服务器接收用户的量子计算请求;
其中,用户请求报文包括:用户身份ID、计算请求类型、作业的最早开始时间、最晚开始时间、所需资源数量与持续时间;
S2:判断用户的请求类型:包括即时计算请求或非即时计算请求;若即时计算请求,进入步骤S3;否则进入步骤S4;
S3:检查当前时刻t计算中心是否有满足计算请求的计算资源,如有,进入步骤S5,否则该计算请求失败,云平台向用户返回失败信息。
S4:检查当前时间段是否存在空闲作业槽:如果有,将该用户请求加入作业槽中等待资源充足时进行调度;否则该请求失败,云平台告知用户该时段预约已满,请用户更改预约计算时间。
S5:计算中心为即时计算请求创建虚拟机,为用户分配计算资源并实时返回计算结果;
因为总量子计算资源不变,此时即时计算作业会占用一定数量的计算资源,剩余的计算资源可用于分配给非即时计算任务。通过记录并统计即时计算任务的概率分布于资源占用,可以对特定时间段内的可用资源进行预测,进而对非即时计算作业进行科学分配,避免资源不足与资源浪费情况发生。
S6:检查当前时刻是否有空闲计算资源。如果有,进入步骤S7;
S7:在作业槽中选择一个或多个非即时计算作业为其分配计算资源,等待计算完成并通过云服务器将计算结果返回给用户。
S8:计算中心将分配结果反馈给云服务器,与服务器收集将分配结果加入状态信息并保存至学习库,训练强化学习神经网络优化作业调度与资源分配策略。
其中,状态信息包括:计算资源、作业槽中用户计算请求资源数量、选择调度作业槽、当前时间段的请求成功率和计算资源占用率。对于强化学习神经网络,其环境为计算资源和作业槽中用户计算请求资源数量;行为为选择调度的请求作业槽;奖励为当前时间段的请求成功率和计算资源占用率。
实施例3
如图2所示,一种量子云计算平台作业调度与资源分配方法,包含以下步骤:
S1:云服务器接收用户的量子计算请求;
其中,用户请求报文包括:用户身份ID、计算请求类型、作业的最早开始时间、最晚开始时间、所需资源数量与持续时间;
S2:判断用户的请求类型:包括即时计算请求或非即时计算请求;若即时计算请求,进入步骤S3;否则进入步骤S4;
S3:检查当前时刻t计算中心是否有满足计算请求的计算资源,如有,进入步骤S5,否则该计算请求失败,云平台向用户返回失败信息。
S4:检查当前时间段是否存在空闲作业槽:如果有,将该用户请求加入作业槽中等待资源充足时进行调度;否则该请求失败,云平台告知用户该时段预约已满,请用户更改预约计算时间。
S5:计算中心为即时计算请求创建虚拟机,为用户分配计算资源并实时返回计算结果;
因为总量子计算资源不变,此时即时计算作业会占用一定数量的计算资源,剩余的计算资源可用于分配给非即时计算任务。通过记录并统计即时计算任务的概率分布于资源占用,可以对特定时间段内的可用资源进行预测,进而对非即时计算作业进行科学分配,避免资源不足与资源浪费情况发生。
S6:检查当前时刻是否有空闲计算资源。如果有,进入步骤S7;
S7:在作业槽中选择一个或多个非即时计算作业为其分配计算资源,等待计算完成并通过云服务器将计算结果返回给用户。
S8:计算中心将分配结果反馈给云服务器,与服务器收集将分配结果加入状态信息并保存至学习库,训练强化学习神经网络优化作业调度与资源分配策略。
其中,状态信息包括:计算资源、作业槽中用户计算请求资源数量、选择调度作业槽、当前时间段的请求成功率和计算资源占用率。对于强化学习神经网络,其环境为计算资源和作业槽中用户计算请求资源数量;行为为选择调度的请求作业槽;奖励为当前时间段的请求成功率和计算资源占用率。
本实施例中所述通过强化学习方法调度非即时任务流程图,如图3所示,具体包括:
S71:通过机器学习方法预测当前时间段Δt各个时刻t1,t2,……,tm的可用于非即时计算的计算资源数量s1,s2,……,sm。
优选的,采用机器学习方法对时刻t可用于非即时计算任务的资源s进行预测,具体方法为:收集历史数据,包括:即时计算任务的概率分布和资源占用;输入神经网络进行训练;当训练结果的精确度达到阈值且稳定时,保存神经网络模型,即可以通过时间t对可用资源s进行预测。
更优选的,神经网络的输入为当前时间t,取值范围为(0,1,2,……,10080),即神经网络预测时间长度为一周,时间单位为分钟。原因是用户计算请求的概率分布和资源占用会随着时间变化,具体表现为:工作日的请求频率更高,非工作日的请求频率较低;工作日的工作时间中请求频率更高,深夜和凌晨则几乎没有即时计算请求。
S72:获取当前状态信息,包括:当前可用计算资源、系统中各作业槽中非即时计算请求的计算资源数量。
S73:将信息转化为向量,输入强化学习神经网络中,通过网络得到输出。
S74:根据神经网络的输出,即作业调度策略选择一个作业槽中的计算请求,使用首次适应算法为其分配计算资源,如图4所示。
S75:根据不同的分配结果,计算当前时间段的请求成功率和计算资源利用率。其中,分配结果包括:当前时间段计算资源可以满足计算请求,请求作业成功;当前时间段计算资源无法满足计算请求,请求作业失败。
为了进一步说明强化学习神经网络和作业调度与资源分配策略之间的关系,如图5所示,强化学习神经网络包含输入层,隐藏层和输出层,其中:
输入层接收当前时刻的状态信息,包括:当前可用计算资源、系统中各作业槽中非即时计算请求的计算资源数量。
神经输入使用向量表示,具体形式为:[s1,s2,……,sm,k1,t1,k2,t2,……,kn,tn]。其中,s1,s2,……,sm为m个时间步中可用的计算资源;k1,t1,k2,t2,……,kn,tn为n个作业槽中作业请求的计算资源数量和持续时间。
隐藏层的数量和每层的神经元个数会对训练速度和训练效果产生影响,需根据具体情况进行设置。
输出层神经元数量为p(分别为1,2,3,……,p)。对于不同的强化学习方法,神经网络的输出拥有不同的涵义。如DQN(Deep Q Network)方法中神经网络的p个输出为对应行为的收益;Policy Gradients方法中神经网络的p个输出为对应采取该行为的概率。根据不同的输出形式,选择从p个作业槽中选择序号为p的计算请求并分配计算资源。
优选的,对于本实施例的强化学习方法,神经网络的奖励(award)为当前时间段的请求成功率和计算资源利用率,其中:
计算请求成功率定义为调度成功的请求数量于总请求数量之比;
计算资源利用率定义为当前时间段中计算任务占用的资源于总计算资源的比率。资源利用率越高,资源浪费越少。
强化学习神经网络通过训练最大化奖励(请求成功率和计算资源利用)可以满足量子云计算平台灵活的作业调度和高效的资源分配的要求。
相同或相似的标号对应相同或相似的部件;
附图中描述位置关系的用于仅用于示例性说明,不能理解为对本专利的限制;
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。
Claims (10)
1.一种量子云计算平台作业调度与资源分配方法,其特征在于,包括以下步骤:
S1:云服务器接收用户的量子计算请求;
S2:判断用户的请求类型:包括即时计算请求或非即时计算请求;若即时计算请求,进入步骤S3;否则进入步骤S4;
S3:检查当前时刻t计算中心是否有满足计算请求的计算资源,如有,进入步骤S5,否则该计算请求失败,云平台向用户返回失败信息;
S4:检查当前时间段是否存在空闲作业槽:如果有,将该用户请求加入作业槽中等待资源充足时进行调度;否则该请求失败,云平台告知用户该时段预约已满,请用户更改预约计算时间;
S5:计算中心为即时计算请求创建虚拟机,为用户分配计算资源并实时返回计算结果;
S6:检查当前时刻是否有空闲计算资源,如果有,进入步骤S7;
S7:在作业槽中选择一个或多个非即时计算作业为其分配计算资源,等待计算完成并通过云服务器将计算结果返回给用户;
S8:计算中心将分配结果反馈给云服务器,与服务器收集将分配结果加入状态信息并保存至学习库,训练强化学习神经网络优化作业调度与资源分配策略。
2.根据权利要求1所述的量子云计算平台作业调度与资源分配方法,其特征在于,所述步骤S1中,用户请求报文包括:用户身份ID、计算请求类型、作业的最早开始时间、最晚开始时间、所需资源数量与持续时间。
3.根据权利要求2所述的量子云计算平台作业调度与资源分配方法,其特征在于,所述步骤S8中,状态信息包括:计算资源、作业槽中用户计算请求资源数量、选择调度作业槽、当前时间段的请求成功率和计算资源占用率;对于强化学习神经网络,其环境为计算资源和作业槽中用户计算请求资源数量;行为为选择调度的请求作业槽;奖励为当前时间段的请求成功率和计算资源占用率。
4.根据权利要求3所述的量子云计算平台作业调度与资源分配方法,其特征在于,所述步骤S7的具体过程是:
S71:通过机器学习方法预测当前时间段Δt各个时刻t1,t2,……,tm的可用于非即时计算的计算资源数量s1,s2,……,sm;
S72:获取当前状态信息,包括:当前可用计算资源、系统中各作业槽中非即时计算请求的计算资源数量;
S73:将信息转化为向量,输入强化学习神经网络中,通过网络得到输出;
S74:根据神经网络的输出,即作业调度策略选择一个作业槽中的计算请求,使用首次适应算法为其分配计算资源;
S75:根据不同的分配结果,计算当前时间段的请求成功率和计算资源利用率。
5.根据权利要求4所述的量子云计算平台作业调度与资源分配方法,其特征在于,所述步骤S71中,采用机器学习方法对时刻t可用于非即时计算任务的资源s进行预测,具体方法为:收集历史数据,包括:即时计算任务的概率分布和资源占用;输入神经网络进行训练;当训练结果的精确度达到阈值且稳定时,保存神经网络模型,即可以通过时间t对可用资源s进行预测。
6.根据权利要求5所述的量子云计算平台作业调度与资源分配方法,其特征在于,所述神经网络的输入为当前时间t,取值范围为(0,1,2,……,10080),即神经网络预测时间长度为一周,时间单位为分钟。
7.根据权利要求6所述的量子云计算平台作业调度与资源分配方法,其特征在于,所述强化学习神经网络包含输入层,隐藏层和输出层,其中:
输入层接收当前时刻的状态信息,包括:当前可用计算资源、系统中各作业槽中非即时计算请求的计算资源数量。
8.根据权利要求7所述的量子云计算平台作业调度与资源分配方法,其特征在于,所述神经输入使用向量表示,具体形式为:[s1,s2,……,sm,k1,t1,k2,t2,……,kn,tn];其中,s1,s2,……,sm为m个时间步中可用的计算资源;k1,t1,k2,t2,……,kn,tn为n个作业槽中作业请求的计算资源数量和持续时间。
9.根据权利要求8所述的量子云计算平台作业调度与资源分配方法,其特征在于,神经网络的奖励为当前时间段的请求成功率和计算资源利用率,其中:计算请求成功率定义为调度成功的请求数量于总请求数量之比。
10.根据权利要求9所述的量子云计算平台作业调度与资源分配方法,其特征在于,计算资源利用率定义为当前时间段中计算任务占用的资源与总计算资源的比率;资源利用率越高,资源浪费越少;强化学习神经网络通过训练最大化奖励即请求成功率和计算资源利用可满足量子云计算平台灵活的作业调度和高效的资源分配的要求。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111679809.8A CN114444700A (zh) | 2021-12-31 | 2021-12-31 | 一种量子云计算平台作业调度与资源分配方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111679809.8A CN114444700A (zh) | 2021-12-31 | 2021-12-31 | 一种量子云计算平台作业调度与资源分配方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114444700A true CN114444700A (zh) | 2022-05-06 |
Family
ID=81366321
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111679809.8A Pending CN114444700A (zh) | 2021-12-31 | 2021-12-31 | 一种量子云计算平台作业调度与资源分配方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114444700A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115794418A (zh) * | 2023-02-03 | 2023-03-14 | 蒲惠智造科技股份有限公司 | 一种计算资源的分配方法 |
-
2021
- 2021-12-31 CN CN202111679809.8A patent/CN114444700A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115794418A (zh) * | 2023-02-03 | 2023-03-14 | 蒲惠智造科技股份有限公司 | 一种计算资源的分配方法 |
CN115794418B (zh) * | 2023-02-03 | 2023-04-28 | 蒲惠智造科技股份有限公司 | 一种计算资源的分配方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110858161B (zh) | 资源分配方法、装置、系统、设备和介质 | |
US8656404B2 (en) | Statistical packing of resource requirements in data centers | |
CN100473021C (zh) | 用于通过调节网络控制进行自动的系统管理的系统和方法 | |
CN109788315A (zh) | 视频转码方法、装置及系统 | |
CN109783225B (zh) | 一种多租户大数据平台的租户优先级管理方法及系统 | |
Wang et al. | Application-aware offloading policy using SMDP in vehicular fog computing systems | |
CN113760541B (zh) | 边缘资源分配的方法及装置 | |
CN116755867B (zh) | 一种面向卫星云的计算资源调度系统、方法及存储介质 | |
CN110489218A (zh) | 基于半马尔可夫决策过程的车载雾计算系统任务卸载方法 | |
CN114444700A (zh) | 一种量子云计算平台作业调度与资源分配方法 | |
CN110035334B (zh) | 一种电力通信网动态带宽资源优化方法 | |
CN116010064A (zh) | Dag作业调度和集群管理的方法、系统及装置 | |
CN118210609A (zh) | 一种基于dqn模型的云计算调度方法及系统 | |
Gu et al. | Cost-aware cloud workflow scheduling using DRL and simulated annealing | |
CN113190342A (zh) | 用于云-边协同网络的多应用细粒度卸载的方法与系统架构 | |
Lou et al. | Energy-efficient joint task assignment and migration in data centers: A deep reinforcement learning approach | |
CN114138453B (zh) | 一种适合边缘计算环境的资源优化分配方法与系统 | |
CN116263715A (zh) | 一种面向云原生智能排版服务的自动缩放系统及方法 | |
CN112887347B (zh) | 一种工业互联网中边缘计算动态迁移方法和装置 | |
CN115208892A (zh) | 基于动态资源需求的车路协同在线任务调度方法及系统 | |
CN114035919A (zh) | 基于配电网分层分布特征的任务调度系统及方法 | |
Divya et al. | RETRACTED ARTICLE: Efficient optimal resource allocation for profit maximization in software defined network approach to improve quality of service in cloud environments | |
CN114237866A (zh) | 一种面向继电保护整定的云平台计算资源调度方法及系统 | |
CN113448707A (zh) | 在边缘计算中在线批并行任务调度方法 | |
Ssemakula et al. | Deployment of Future Services in a Multi-access Edge Computing Environment Using Intelligence at the Edge |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20231228 Address after: 510000 Room A105 on the First Floor of Ladder A, No. 11 Ailu Road, Science City, Guangzhou High-tech Industrial Development Zone, Guangzhou, Guangdong Province Applicant after: Guangdong Yukopod Technology Development Co.,Ltd. Address before: 510898 No. 55, Zhongshan Avenue West, Tianhe District, Guangzhou, Guangdong Applicant before: SOUTH CHINA NORMAL University |