CN112291320A - 量子计算机集群分布式两层调度方法及系统 - Google Patents

量子计算机集群分布式两层调度方法及系统 Download PDF

Info

Publication number
CN112291320A
CN112291320A CN202011130787.5A CN202011130787A CN112291320A CN 112291320 A CN112291320 A CN 112291320A CN 202011130787 A CN202011130787 A CN 202011130787A CN 112291320 A CN112291320 A CN 112291320A
Authority
CN
China
Prior art keywords
scheduler
layer
resource
cluster
quantum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011130787.5A
Other languages
English (en)
Inventor
李彦祯
刘幼航
刘强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jinan Inspur Hi Tech Investment and Development Co Ltd
Original Assignee
Jinan Inspur Hi Tech Investment and Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jinan Inspur Hi Tech Investment and Development Co Ltd filed Critical Jinan Inspur Hi Tech Investment and Development Co Ltd
Priority to CN202011130787.5A priority Critical patent/CN112291320A/zh
Publication of CN112291320A publication Critical patent/CN112291320A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/51Discovery or management thereof, e.g. service location protocol [SLP] or web services

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明提供了一种量子计算机集群分布式两层调度方法及系统。为量子计算机集群分布式两层调度方法包括:第一层调度器监控集群中量子计算机资源状态并向框架去分配资源,并将集群资源信息发给第二层调度器;第二层调度器接收第一层调度器的集群资源信息,根据实际任务情况和收到的资源进行匹配。量子计算机集群分布式两层调度系统,包括第一层调度器和一个以上的第二层调度器;第一层调度器包括资源位和作业状态位,第一层调度器对应互连多个资源单元;第二层调度器包括多个调度单元用于根据任务需要的资源情况和第一层调度器(scheduler‑1)发送来的资源信息进行相关匹配和调度。

Description

量子计算机集群分布式两层调度方法及系统
技术领域
本发明涉及一种量子计算机集群分布式两层调度方法及系统,属于量子计算机技术领域。
背景技术
在单体调度架构中,中央服务器的单点瓶颈问题,会限制调度的效率。单体调度框架会随着任务类型增加而变得越来越复杂,最终出现扩展瓶颈。
如何提供一种量子计算机集群分布式调度方法时本领域人员急需解决的问题。
发明内容
为了提升调度效率并支持多种类型的任务,本发明提供一种量子计算机集群分布式两层调度方法及系统。
本发明为实现上述目的,通过以下技术方案实现:
一种量子计算机集群分布式两层调度方法,包括:
第一层调度器监控集群中量子计算机资源状态并向框架去分配资源,并将集群资源信息发给第二层调度器;
第二层调度器接收第一层调度器的集群资源信息,根据实际任务情况和收到的资源进行匹配。
上述量子计算机集群分布式两层调度方法基础上,还包括:用户通过云平台或者客户端软件把要执行的量子实验信息提交到云平台的后端数据库。
上述量子计算机集群分布式两层调度方法基础上,第二层调度器接收第一层调度器的资源后根据实验任务ID及实验任务具体内容,确定需要对应比特数量的量子计算机,提交请求到空闲的量子计算机运行量子实验任务,量子计算机执行完实验任务后,把实验任务的ID和实验结果等信息,保存到数据库和文件服务器上;用户通过云平台或者客户端通过接口方式访问量子实验运行结果。
一种量子计算机集群分布式两层调度系统,包括第一层调度器和一个以上的第二层调度器;第一层调度器包括资源位和作业状态位,第一层调度器对应互连多个资源单元用于负责收集和管理集群中资源信息,每个资源单元包括一个资源管理器和多个工作单元;第二层调度器包括多个调度单元,且与第一层调度器互连用于根据任务需要的资源情况和第一层调度器发送来的资源信息进行相关匹配和调度。
本发明的优点在于:
把资源和任务分开调度,一层调度器只负责资源管理和分配,另外一层调度器负责任务与资源的匹配,提升调度效率并支持多种类型的任务。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。
图1为本发明实施例原理框图。
具体实施方式
下面将结合本发明实施例,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
一种量子计算机集群分布式两层调度方法,包括:
用户通过云平台或者客户端软件把要执行的量子实验信息提交到云平台的后端数据库;
第一层调度器scheduler-1监控集群中量子计算机资源状态并向框架去分配资源,并将集群资源信息发给第二层调度器scheduler-2;
第二层调度器scheduler-2接收第一层调度器scheduler-1的集群资源信息,根据实际任务情况和收到的资源进行匹配。
本实施例中,第二层调度器scheduler-2接收第一层调度器scheduler-1的资源后根据实验任务ID及实验任务具体内容,确定需要对应比特数量的量子计算机,提交请求到空闲的量子计算机运行量子实验任务,量子计算机执行完实验任务后,把实验任务的ID和实验结果等信息,保存到数据库和文件服务器上;用户通过云平台或者客户端通过接口方式访问量子实验运行结果。
一种量子计算机集群分布式两层调度系统,包括第一层调度器scheduler-1和一个以上的第二层调度器scheduler-2;第一层调度器scheduler-1包括资源位ResourceState和作业状态位Job State,第一层调度器scheduler-1对应互连多个资源单元Node用于负责收集和管理集群中资源信息,每个资源单元Node包括一个资源管理器ResourceManager和多个工作单元task;第二层调度器scheduler-2包括多个调度单元Job,且与第一层调度scheduler-1互连用于根据任务需要的资源情况和第一层调度器scheduler-1发送来的资源信息进行相关匹配和调度。
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (4)

1.一种量子计算机集群分布式两层调度方法,其特征在于,包括:
第一层调度器(scheduler-1)监控集群中量子计算机资源状态并向框架去分配资源,并将集群资源信息发给第二层调度器(scheduler-2);
第二层调度器(scheduler-2)接收第一层调度器(scheduler-1)的集群资源信息,根据实际任务情况和收到的资源进行匹配。
2.根据权利要求1所述量子计算机集群分布式两层调度方法,其特征在于,还包括:
用户通过云平台或者客户端软件把要执行的量子实验信息提交到云平台的后端数据库。
3.根据权利要求2所述量子计算机集群分布式两层调度方法,其特征在于:第二层调度器(scheduler-2)接收第一层调度器(scheduler-1)的资源后根据实验任务ID及实验任务具体内容,确定需要对应比特数量的量子计算机,提交请求到空闲的量子计算机运行量子实验任务,量子计算机执行完实验任务后,把实验任务的ID和实验结果等信息,保存到数据库和文件服务器上;用户通过云平台或者客户端通过接口方式访问量子实验运行结果。
4.一种量子计算机集群分布式两层调度系统,其特征在于:包括第一层调度器(scheduler-1)和一个以上的第二层调度器(scheduler-2);第一层调度器(scheduler-1)包括资源位(Resource State)和作业状态位(Job State),第一层调度器(scheduler-1)对应互连多个资源单元(Node)用于负责收集和管理集群中资源信息,每个资源单元(Node)包括一个资源管理器(Resource Manager)和多个工作单元(task);第二层调度器(scheduler-2)包括多个调度单元(Job),且与第一层调度器(scheduler-1)互连用于根据任务需要的资源情况和第一层调度器(scheduler-1)发送来的资源信息进行相关匹配和调度。
CN202011130787.5A 2020-10-21 2020-10-21 量子计算机集群分布式两层调度方法及系统 Pending CN112291320A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011130787.5A CN112291320A (zh) 2020-10-21 2020-10-21 量子计算机集群分布式两层调度方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011130787.5A CN112291320A (zh) 2020-10-21 2020-10-21 量子计算机集群分布式两层调度方法及系统

Publications (1)

Publication Number Publication Date
CN112291320A true CN112291320A (zh) 2021-01-29

Family

ID=74423896

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011130787.5A Pending CN112291320A (zh) 2020-10-21 2020-10-21 量子计算机集群分布式两层调度方法及系统

Country Status (1)

Country Link
CN (1) CN112291320A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022236993A1 (zh) * 2021-05-11 2022-11-17 山东浪潮科学研究院有限公司 一种量子计算机集群分布式监控调度方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101599026A (zh) * 2009-07-09 2009-12-09 浪潮电子信息产业股份有限公司 一种具有弹性架构的集群作业调度系统
US20120198455A1 (en) * 2011-01-28 2012-08-02 Oracle International Corporation System and method for supporting service level quorum in a data grid cluster
CN103607459A (zh) * 2013-11-21 2014-02-26 东北大学 一种云计算平台IaaS层的动态资源监测及调度方法
CN107968808A (zh) * 2016-10-20 2018-04-27 上海盛霄云计算技术有限公司 分布式系统中资源状态同步的方法和系统
CN108170417A (zh) * 2017-12-29 2018-06-15 曙光信息产业(北京)有限公司 一种在mesos集群中集成高性能的作业调度框架的方法和装置
CN112235364A (zh) * 2020-09-29 2021-01-15 石家庄市善理通益科技有限公司 一种对讲服务集群的业务级联拓展方法及其执行单元

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101599026A (zh) * 2009-07-09 2009-12-09 浪潮电子信息产业股份有限公司 一种具有弹性架构的集群作业调度系统
US20120198455A1 (en) * 2011-01-28 2012-08-02 Oracle International Corporation System and method for supporting service level quorum in a data grid cluster
CN103607459A (zh) * 2013-11-21 2014-02-26 东北大学 一种云计算平台IaaS层的动态资源监测及调度方法
CN107968808A (zh) * 2016-10-20 2018-04-27 上海盛霄云计算技术有限公司 分布式系统中资源状态同步的方法和系统
CN108170417A (zh) * 2017-12-29 2018-06-15 曙光信息产业(北京)有限公司 一种在mesos集群中集成高性能的作业调度框架的方法和装置
CN112235364A (zh) * 2020-09-29 2021-01-15 石家庄市善理通益科技有限公司 一种对讲服务集群的业务级联拓展方法及其执行单元

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022236993A1 (zh) * 2021-05-11 2022-11-17 山东浪潮科学研究院有限公司 一种量子计算机集群分布式监控调度方法

Similar Documents

Publication Publication Date Title
US11630704B2 (en) System and method for a workload management and scheduling module to manage access to a compute environment according to local and non-local user identity information
CN103092698B (zh) 云计算应用自动部署系统及方法
CN109034396B (zh) 用于处理分布式集群中的深度学习作业的方法和装置
CN102567086B (zh) 一种任务调度的方法、设备和系统
EP1412857B1 (en) Managing server resources for hosted applications
US6732139B1 (en) Method to distribute programs using remote java objects
US20050188075A1 (en) System and method for supporting transaction and parallel services in a clustered system based on a service level agreement
US20080172673A1 (en) Prediction based resource matching for grid environments
US20050071842A1 (en) Method and system for managing data using parallel processing in a clustered network
CN101645022A (zh) 用于多个集群的作业调度管理系统及方法
US11455187B2 (en) Computing system for hierarchical task scheduling
WO2012113290A1 (zh) 基因计算系统和方法
CN116010064A (zh) Dag作业调度和集群管理的方法、系统及装置
In et al. Sphinx: A scheduling middleware for data intensive applications on a grid
Liu et al. KubFBS: A fine‐grained and balance‐aware scheduling system for deep learning tasks based on kubernetes
CN118069349A (zh) 一种面向多场景的可变深度资源管理方法及系统
CN112291320A (zh) 量子计算机集群分布式两层调度方法及系统
CN107454137B (zh) 一种在线业务按需服务的方法、装置与设备
US20230333880A1 (en) Method and system for dynamic selection of policy priorities for provisioning an application in a distributed multi-tiered computing environment
CN112148546A (zh) 电力系统静态安全分析并行计算系统及方法
TWI742774B (zh) 運算系統及其主機資源分配方法
CN114237858A (zh) 一种基于多集群网络的任务调度方法及系统
Mokhtari et al. Solving the Task Starvation and Resources Problem Using Optimized SMPIA in Cloud.
CN112416538A (zh) 一种分布式资源管理框架的多层次架构和管理方法
CN113641495A (zh) 一种基于大数据计算的分布式调度方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210129