CN117251256A - 作业调度方法、装置、设备及计算机可读存储介质 - Google Patents

作业调度方法、装置、设备及计算机可读存储介质 Download PDF

Info

Publication number
CN117251256A
CN117251256A CN202210654171.0A CN202210654171A CN117251256A CN 117251256 A CN117251256 A CN 117251256A CN 202210654171 A CN202210654171 A CN 202210654171A CN 117251256 A CN117251256 A CN 117251256A
Authority
CN
China
Prior art keywords
job
computing
computing clusters
clusters
sent
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210654171.0A
Other languages
English (en)
Inventor
朱波
丁肇辉
沈松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN202210654171.0A priority Critical patent/CN117251256A/zh
Publication of CN117251256A publication Critical patent/CN117251256A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • G06F9/4806Task transfer initiation or dispatching
    • G06F9/4843Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
    • G06F9/4881Scheduling strategies for dispatcher, e.g. round robin, multi-level priority queues
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/54Interprogram communication
    • G06F9/542Event management; Broadcasting; Multicasting; Notifications
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/48Indexing scheme relating to G06F9/48
    • G06F2209/484Precedence

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Multi Processors (AREA)

Abstract

本申请提供一种作业调度方法、装置、设备及计算机可读存储介质,其中,方法应用于包括N个计算集群的调度系统,方法包括如下步骤:首先接收作业,然后获取N个计算集群的属性值,并基于N个计算集群的属性值对N个计算集群按照属性值进行优先级排序,从N个计算集群中确定优先级排在前M的M个计算集群,最后将作业发送至M个计算集群,由M个计算集群来尝试执行作业,其中,M为大于1且小于N的整数,N为整数。该方法能够实现作业的高效执行,以及实现调度系统的资源的合理利用。

Description

作业调度方法、装置、设备及计算机可读存储介质
技术领域
本申请涉及计算机技术领域,尤其涉及一种作业调度方法、装置、设备及计算机可读存储介质。
背景技术
将跨地域的计算集群构建成一体化的调度系统(也可以称为算力网络或分布式计算集群系统),实现算力和数据共享,已成为未来关键技术。例如,目前正在进行的“东数西算”工程,目的是将东部算力需求有序引导到西部,优化数据中心建设布局,促进东西部协同联动,更好地为数字化发展赋能。
目前,多数调度系统正处于构建阶段,在调度系统建成后,需要进一步考虑的问题是:调度系统在接收到用户提交的作业时,如何使用自身包括的多个计算集群执行作业,才能实现作业的高效执行以及资源的合理利用。
发明内容
本申请提供了一种作业调度方法、装置、设备及计算机可读存储介质,可以实现作业的高效执行,以及实现包括多个计算集群的调度系统的资源的合理利用。
第一方面,提供一种作业调度方法,应用于调度系统,该方法包括如下步骤:首先接收作业,然后获取N个计算集群的属性值,并基于N个计算集群的属性值对N个计算集群按照属性值进行优先级排序,从N个计算集群中确定优先级排在前M的M个计算集群,最后将作业发送至M个计算集群,由M个计算集群来尝试执行作业,其中,M为大于1且小于N的整数,N为整数。
其中,计算集群的属性值可以包括如下一种或多种:计算集群的可用资源信息、计算集群与发送作业的客户端的距离、计算集群的可用资源信息与第一资源信息的匹配度,第一资源信息指示执行作业所需的资源,比如该作业需要由何种型号的处理器执行,比如该作业的执行需要占用的内存大小以及需要占用的处理器核数。应理解,上述所列举的计算集群的属性值仅仅是作为示例,不应视为具体限定。
进一步地,计算集群的可用资源信息可以包括可用计算资源(如可用处理器核数、可用处理器型号等)、可用内存资源(如可用虚拟空间、可用物理空间、可用缓存等)、可用网络资源(如可用带宽)等等。可选地,可用资源信息还可以包括可用磁盘容量等等,此处不作具体限定。
计算集群与发送作业的客户端的距离,可以通过获取计算集群的地理位置信息以及发送作业的客户端的地理位置信息,然后基于计算集群的地理位置信息和客户端的地理位置信息计算得到。
计算集群的可用资源信息与第一资源信息的匹配度,以计算集群的可用资源信息为可用处理器型号、第一资源信息为作业的执行需要使用的处理器型号为例,若计算集群的可用处理器型号包括作业执行需要使用的处理器型号,则二者的匹配度为100%,若计算集群的可用处理器型号不包括作业执行需要使用的处理器型号,则二者的匹配度为0。
以N个计算集群的属性值为N个计算集群与发送作业的客户端的距离为例,可以将N个计算集群按照与发送作业的客户端的距离从小到大进行优先级排序,从而确定优先级排在前M的M个计算集群。如此,后续可以使用N个计算集群中距离用户较近的M个计算集群来尝试执行作业。可以理解,由于该M个计算集群距离发送作业的客户端较近,因此,该M个计算集群可以较快接收到作业,尽快执行作业,为用户提供较快的响应速度,能够提高用户的使用体验。
可以看出,上述方案中,基于多个计算集群的属性值对多个计算集群按照属性值进行优先级排序,并从多个计算集群中确定优先级排在前M的M个计算集群,然后将作业发送至该M个计算集群进行排队,由该M个计算集群来尝试执行作业,可以实现作业的高效执行。还可以看出,N个计算集群中除上述优先级排在前M的M个计算集群之外的其它N-M个计算集群,由于无需执行上述作业,因此,在作业在上述M个计算集群上排队时,其它N-M个计算集群可以用于处理其它任务,从而实现资源的合理利用。
在一种可能的实现方式中,第一方面提供的方法还包括如下步骤:在将作业发送至M个计算集群后,当接收到M个计算集群中的任意一个计算集群发送的作业的完成通知时,向M个计算集群中的其它M-1个计算集群发送作业的取消通知。
实施上述实现方式,由于是在接收到M个计算集群中的任意一个计算集群发送的作业的完成通知时,才向M个计算集群中的其它M-1个计算集群发送作业的取消通知,因此,可以尽可能保证完成作业。而且,能够避免在M个计算集群中已经有计算集群完成作业的情况下,M个计算集群中的其它计算集群重复执行作业,可以节省资源。
在一种可能的实现方式中,第一方面提供的方法还包括如下步骤:在将作业发送至M个计算集群后,开始记录第一时间,当第一时间达到第一阈值,且未接收到M个计算集群中的任意一个计算集群发送的作业的启动通知时,从除M个计算集群之外的N-M个计算集群中根据属性值选择优先级最高的第一计算集群,然后,将作业发送至第一计算集群。
可以理解,若当第一时间达到第一阈值时,还未接收到M个计算集群发送的作业的启动通知,说明作业在M个计算集群上已经排队了较长时间。通常,上述情况极可能由M个计算集群均无法执行作业(如出现故障)引起。为了避免作业即便在M个计算集群上等待更长时间,但仍无法启动的情况出现,可以从N个计算集群中除M个计算集群之外的N-M个计算集群中根据属性值选择优先级最高的计算集群,将作业发送至该计算集群,由该计算集群来尝试执行作业,以尽可能地保证作业完成。
在一种可能的实现方式中,第一方面提供的方法还包括如下步骤:在将作业发送至M个计算集群后,可以开始记录M个计算集群对应的M个时间,当M个时间中的任意一个时间达到该时间对应的阈值,且未接收到M个计算集群中的任意一个计算集群发送的作业的启动通知时,从除M个计算集群之外的N-M个计算集群中根据属性值选择优先级最高的第一计算集群,然后,将作业发送至第一计算集群,其中,M个计算集群与M个时间为一一对应关系。
可以理解,当作业在M个计算集群中的某个计算集群上排队的时间达到该时间对应的阈值时,还未接收到该计算集群发送的作业的启动通知,说明作业在该计算集群上已经排队了较长时间。通常,上述情况极可能由该计算集群无法执行作业(如出现故障)引起。为了避免作业即便在该计算集群上等待更长时间,但仍无法启动的情况出现,可以从N个计算集群中除M个计算集群之外的N-M个计算集群中根据属性值选择优先级最高的第一计算集群,将作业发送至第一计算集群,由该计算集群来尝试执行作业,以尽可能地保证作业完成。
在一种可能的实现方式中,第一方面提供的方法还包括如下步骤:在将作业发送至第一计算集群后,开始记录第二时间,当第二时间未达到第二阈值,且接收到M个计算集群及第一计算集群中的第二计算集群发送的作业的启动通知或者完成通知时,向除第二计算集群之外的M个计算集群发送作业的取消通知。
可以理解,若当第二时间未达到第二阈值时,已经接收到M个计算集群及第一计算集群中的第二计算集群发送的作业的启动通知或者完成通知时,说明在第二时间达到第二阈值之前,作业已经启动或者完成,此时,向M个计算集群及第一计算集群中除第二计算集群之外的M个计算集群发送作业的取消通知,可以使得M个计算集群及第一计算集群中除第二计算集群之外的M个计算集群无需继续执行作业,节省该M个计算集群的资源。
第二方面,提供一种作业调度装置,应用于调度系统,该装置包括:接收模块和调度模块,其中,接收模块,用于接收作业,调度模块,用于获取N个计算集群的属性值,并基于所述N个计算集群的属性值对所述N个计算集群按照属性值进行优先级排序,从所述N个计算集群中确定优先级排在前M的M个计算集群,然后,将所述作业发送至所述M个计算集群,由M个计算群来尝试执行作业,其中,M为大于1且小于N的整数,N为整数。
在一种可能的实现方式中,所述计算集群的属性值包括如下一种或多种:所述计算集群的可用资源信息、所述计算集群与发送所述作业的客户端的距离、所述计算集群的可用资源信息与第一资源信息的匹配度,其中,所述第一资源信息指示执行所述作业所需的资源。
在一种可能的实现方式中,所述调度模块,还用于:在将所述作业发送至所述M个计算集群后,当接收到所述M个计算集群中的任意一个计算集群发送的所述作业的完成通知时,向所述M个计算集群中的其它M-1个计算集群发送所述作业的取消通知。
在一种可能的实现方式中,所述调度模块,还用于:在将所述作业发送至所述M个计算集群后,开始记录第一时间,当所述第一时间达到第一阈值,且未接收到所述M个计算集群发送的所述作业的启动通知时,从除所述M个计算集群之外的N-M个计算集群中根据所述属性值选择优先级最高的第一计算集群,然后,将所述作业发送至所述第一计算集群。
在一种可能的实现方式中,所述调度模块,还用于:在将所述作业发送至所述M个计算集群后,开始记录所述M个计算集群对应的M个时间,当所述M个时间中的任意一个时间达到所述任意一个时间对应的阈值,且未接收到所述M个计算集群发送的所述作业的启动通知时,从除所述M个计算集群之外的N-M个计算集群中根据所述属性值选择优先级最高的第一计算集群,其中,所述M个计算集群与所述M个时间为一一对应关系,然后,将所述作业发送至所述第一计算集群。
在一种可能的实现方式中,所述调度模块,还用于:在将所述作业发送至所述第一计算集群后,开始记录第二时间,当所述第二时间未达到所述第二阈值,且接收到所述M个计算集群及所述第一计算集群中的第二计算集群发送的所述作业的启动通知或者完成通知时,向除所述第二计算集群之外的M个计算集群发送所述作业的取消通知。
第三方面,提供一种计算设备,所述计算设备包括处理器和存储器;所述处理器用于执行所述存储器存储的指令,使得所述计算设备实现如上述第一方面或者第一方面的任意可能的实现方式提供的方法。
第四方面,提供一种计算机可读存储介质,所述计算机可读存储介质存储有指令,所述指令用于实现如上述第一方面或者第一方面的任意可能的实现方式提供的方法。
第五方面,提供一种计算机程序产品,包括计算机程序,当所述计算机程序被计算设备读取并执行时,使得所述计算设备执行如上述第一方面或者第一方面的任意可能的实现方式提供的方法。
附图说明
图1为本申请示例性示出的一种调度系统的结构示意图;
图2为本申请提供的一种作业调度方法的流程示意图;
图3是本申请示例性示出的一种作业调度过程的示意图;
图4是本申请提供的另一种作业调度方法的流程示意图;
图5是本申请提供的又一种作业调度方法的流程示意图;
图6是本申请提供的一种作业调度装置的结构示意图;
图7是本申请提供的一种计算设备的结构示意图。
具体实施方式
下面将结合附图,对本申请提供的技术方案进行描述。
为了便于理解本发明的技术方案,首先,对本发明涉及的应用场景进行解释说明。
本申请涉及多个计算集群组成的一体化的调度系统,该调度系统可以用于实现算力和数据共享。具体地,调度系统可以用于接收用户提交的作业(job),如计算作业、模型训练作业等等,然后执行作业。
参见图1,图1为本申请示例性示出的一种调度系统100的结构示意图,如图1所示,调度系统100包括多个计算集群110和调度节点120,每个计算集群110包括至少一个计算节点1101,多个计算集群110以及调度节点120之间可以通过网络(如广域网)进行连接,每个计算集群110包括的计算节点1101之间也可以通过网络进行连接。
调度节点120,可以用于接收用户通过客户端200提交的作业,然后将作业分配至计算集群110进行排队,后续由计算集群110尝试执行作业。调度节点120如何实现作业分配,以及计算集群110如何执行作业,客户端200是不感知的。在客户端200看来,调度系统100就像是只有一个计算集群110。
计算集群110,可以用于接收调度节点120分配的作业,然后尝试执行作业。具体地,计算集群110中可设置有用于缓存作业的队列,当计算集群110先后接收到调度节点120分配的多个作业时,可将多个作业按照先后顺序缓存于队列中,然后,再从队列中一个个取出作业进行执行,通常情况下,后接收到的作业需要等待先接收到的作业执行完毕,才能被执行。
调度节点120以及计算集群110中的计算节点1101可以是个人计算机、物理服务器或者云服务器等,客户端200可以是个人电脑、平板电脑、移动笔记本、智能手机、掌上处理设备、虚拟现实设备、可穿戴设备、一体化掌机等等电子设备,图1以终端设备200为个人电脑为例进行说明,但是本申请不对此进行具体限定。
具体实现中,调度节点120可以独立于多个计算集群110,通过网络与多个计算集群110进行连接,也可以位于某一个计算集群110中,通过网络与调度系统100中的其它计算集群110连接,此处不作具体限定,图1以调度节点120独立于多个计算集群110为例。计算集群110中的不同计算节点1101可以具有相同的硬件和相同的操作系统,也可以具有不同的硬件或者不同的操作系统,此处不作具体限定。
具体实现中,调度系统100中的多个计算集群110可以位于相同的地域,也可以位于不同的地域,该多个计算集群110可以属于同一个厂商,也可以属于不同的厂商,此处不作具体限定。
应理解,图1所示的调度系统100仅仅是作为示例,例如,具体实现中,调度系统100还可以包括管理节点130(图1未示出),管理节点130可以用于管理调度系统100中的计算集群110和调度节点120,图1所示不应视为具体限定。
目前,多数调度系统100正处于构建阶段,在调度系统100建成投入使用后,若调度节点120接收到用户提交的作业,调度节点120如何进行作业分配,才能实现作业的高效执行以及资源的合理利用,是亟需考虑的问题。
针对上述问题,本申请提供了可以应用于图1所示的调度系统100的作业调度方法及装置,具体可以应用于图1所示的调度节点120,在本申请提供的作业调度方法及装置中,调度节点120在接收到作业后,可以获取调度系统100中的多个计算集群110的属性值(如计算集群110的可用资源信息、计算集群110与发送作业的客户端200的距离等),然后,基于多个计算集群110的属性值对多个计算集群110按照属性值进行优先级排序,从多个计算集群110中确定优先级排在前M的M(M为大于1的整数)个计算集群110,最后将作业发送给确定的M个计算集群110进行排队,由该M个计算集群110尝试执行作业。
可以理解,上述M个计算集群110是优先级排在前M的M个计算集群110,表明该M个计算集群110是确定的最适合执行作业的计算集群,将作业发送给该M个计算集群110进行排队,由该M个计算集群110尝试执行作业,能够实现作业的高效执行,而且能够尽可能地保证作业的完成。此外,多个计算集群110中除上述M个计算集群110之外的其它计算集群110无需执行上述作业,在作业在上述M个计算集群110上排队的同时,其它计算集群110可以用于处理其它任务,从而实现资源的合理利用。
为了便于更清楚地理解本申请提供的作业调度方法及装置,下面分别结合对应的附图,进行详细介绍。需要说明的,为了便于描述,在接下来对本申请提供的作业调度方法及装置的介绍过程中,均以调度节点120为执行主体进行描述。
首先,请参见图2,图2为本申请提供的一种作业调度方法的流程示意图,如图2所示,本申请提供的作业调度方法包括如下步骤:
S201:接收作业。
其中,作业可以是用户通过图1所示的客户端200提交给调度节点120的作业,也可以是直接在调度节点120上进行的作业,作业可以是计算作业、备份作业、人工智能类型的作业(如模型训练)、大数据类型的作业(如搜索作业)等等,此处不作具体限定。
S202:获取N个计算集群的属性值,其中,N为大于2的整数。
其中,N个计算集群可以为图1所示的多个计算集群110,计算集群的属性值可以包括如下一种或多种:计算集群的可用资源信息、计算集群与发送作业的客户端的距离、计算集群的可用资源信息与第一资源信息的匹配度,第一资源信息指示执行作业所需的资源,比如该作业需要由何种型号的处理器执行,比如该作业的执行需要占用的内存大小以及需要占用的处理器核数。应理解,上述所列举的计算集群的属性值仅仅是作为示例,不应视为具体限定。
进一步地,计算集群的可用资源信息可以包括可用计算资源(如可用处理器核数、可用处理器型号等)、可用内存资源(如可用虚拟空间、可用物理空间、可用缓存等)、可用网络资源(如可用带宽)等等。可选地,可用资源信息还可以包括可用磁盘容量等等,此处不作具体限定。
计算集群与发送作业的客户端的距离,可以通过获取计算集群的地理位置信息以及发送作业的客户端的地理位置信息,然后基于计算集群的地理位置信息和客户端的地理位置信息计算得到。
计算集群的可用资源信息与第一资源信息的匹配度,以计算集群的可用资源信息为可用处理器型号、第一资源信息为作业的执行需要使用的处理器型号为例,若计算集群的可用处理器型号包括作业执行需要使用的处理器型号,则二者的匹配度为100%,若计算集群的可用处理器型号不包括作业执行需要使用的处理器型号,则二者的匹配度为0。
S203:基于N个计算集群的属性值对N个计算集群按照属性值进行优先级排序,从N个计算集群中确定优先级排在前M的M个计算集群,其中,M为大于1且小于N的整数。
可以理解,在计算集群的属性值不同时,基于N个计算集群的属性值对N个计算集群按照属性值进行优先级排序,从N个计算集群中确定优先级排在前M的M个计算集群的过程存在差异。下面结合具体的示例,详细介绍确定优先级排在前M个的M个计算集群的过程。
首先,以N个计算集群的属性值为N个计算集群的可用处理器核数为例,可以将N个计算集群按照处理器核数从大到小进行优先级排序,从而确定优先级排在前M的M个计算集群。如此,后续可以使用N个计算集群中可用处理器核数较多的M个计算集群来尝试执行作业。
可以理解,由于该M个计算集群具有较多的可用处理器核数,因此,该M个计算集群在接收到作业后,有充足数量的可用处理器核可以用于执行作业,能够尽快执行作业,尽可能地保证作业完成。
再以N个计算集群的属性值为N个计算集群与发送作业的客户端的距离为例,可以将N个计算集群按照与发送作业的客户端的距离从小到大进行优先级排序,从而确定优先级排在前M的M个计算集群。如此,后续可以使用N个计算集群中距离用户较近的M个计算集群来尝试执行作业。
可以理解,由于该M个计算集群距离发送作业的客户端较近,因此,该M个计算集群可以较快接收到调度节点120发送的作业,尽快执行作业,为用户提供较快的响应速度,能够提高用户的使用体验。
最后以N个计算集群的属性值为N个计算集群的可用资源信息与第一资源信息的匹配度为例,可以将N个计算集群按照可用资源信息与第一资源信息的匹配度从大到小进行优先级排序,从而确定优先级排在前M的M个计算集群。如此,后续可以使用N个计算集群中可用资源信息与第一资源信息的匹配度较高的多个计算集群来尝试执行作业。
举例来讲,假设第一资源信息为处理器核类型A,也就是说,作业需要由A类型的处理器核执行,N个计算集群包括计算集群1、计算集群2和计算集群3,其中,计算集群1的可用资源信息包括可用处理器核11和可用处理器核12,可用处理器核11的类型为A,可用处理器核12的类型为B,计算集群2的可用资源信息包括可用处理器核21,可用处理器核21的类型为C,计算集群3包括可用处理器核31、可用处理器核32和可用处理器核33,可用处理器核31的类型为C,可用处理器核32的类型为D,可用处理器核33的类型为A,因此,可以确定计算集群1和计算集群3的可用资源信息与第一资源信息匹配,计算集群2的可用资源信息与第一资源信息不匹配,从而将计算集群1和计算集群3确定为优先级排在前两个的两个计算集群。
可以理解,由于计算集群1和计算集群3均包括与第一资源信息匹配的可用处理器核,因此,当计算集群1和计算集群3接收到作业后,可以正常执行作业。而计算集群2由于不包括与第一资源信息匹配的可用处理器核,若是将作业发送至计算集群2,则作业将一直在计算集群2上排队,永远无法执行。
S204:将作业发送至M个计算集群。
S205:在将作业发送至M个计算集群后,当接收到M个计算集群中的任意一个计算集群发送的作业的完成通知时,向M个计算集群中的其它M-1个计算集群发送作业的取消通知。
举例来讲,假设M个计算集群包括计算集群1、计算集群2和计算集群3,如图3所示,调度节点120首先将作业分别发送至计算集群1、计算集群2和计算集群3,然后,调度节点120在接收到计算集群2发送的作业的完成通知时,向计算集群1和计算集群3发送作业的取消通知。
可以看出,图2所示实施例可以尽可能地保证完成作业,而且能够避免在M个计算集群中已经有计算集群完成作业的情况下,M个计算集群中其它被发送了作业的计算集群重复执行作业,可以节省其它计算集群的资源。此外,N个计算集群中除上述M个计算集群之外没有被发送作业的计算集群由于无需执行作业,可以用于处理其它任务,从而实现资源的合理利用。
参见图4,图4为本申请提供的另一种作业调度方法的流程示意图,如图4所示,本申请提供的另一种作业调度方法具体包括如下步骤:
S401:接收作业。
S402:获取N个计算集群的属性值,其中,N为大于2的整数。
S403:基于N个计算集群的属性值对N个计算集群按照属性值进行优先级排序,从N个计算集群中确定优先级排在前M的M个计算集群,其中,M为大于1且小于N的整数。
S404:将作业发送至M个计算集群。
可以看出,S401至S404与S201至S204对应相同,S401至S404的具体实现过程可以对应参考S201至S204中相关描述,为了说明书的简洁,此次不再展开赘述。
S405:在将作业发送至M个计算集群后,开始记录第一时间,当第一时间达到第一阈值,且未接收到M个计算集群中的任意一个计算集群发送的作业的启动通知时,从除M个计算集群之外的N-M个计算集群中根据属性值选择优先级最高的第一计算集群。
其中,第一时间为作业在M个计算集群上排队的时间。
可以理解,当第一时间达到第一阈值时,还未接收到M个计算集群中的任意一个计算集群发送的作业的启动通知,说明作业在M个计算集群上已经排队了较长时间。通常,上述情况极可能由M个计算集群均无法执行作业(如出现故障)引起。为了避免作业即便在M个计算集群上等待更长时间,但仍无法启动的情况出现,可以从N个计算集群中除M个计算集群之外的N-M个计算集群中根据属性值选择优先级最高的第一计算集群,将作业发送至第一计算集群,由该计算集群来尝试执行作业,以尽可能地保证作业完成。
在本实施例中,当第一时间未达到第一阈值,且接收到M个计算集群中的任意一个计算集群发送的作业的启动通知或者完成通知时,则可以向M个计算集群中的其它M-1个计算集群发送作业的取消通知,节省其它M-1个计算集群的资源。
其中,从除M个计算集群之外的N-M个计算集群中根据属性值选择优先级最高的第一计算集群的过程,与S203中所述基于N个计算集群的属性值对N个计算集群按照属性值进行优先级排序,并从N个计算集群中确定优先级排在前M的M个计算集群的过程相类似,具体可以参考S203中相关描述,为了说明书的简洁,此处不再展开赘述。
S406:将作业发送至第一计算集群。
S407:在将作业发送至第一计算集群后,开始记录第二时间,当第二时间未达到第二阈值,且接收到M个计算集群及第一计算集群中的第二计算集群发送的作业的启动通知或者完成通知时,向除第二计算集群之外的M个计算集群发送作业的取消通知。
其中,第二时间为作业在第一计算集群上排队的时间。
可以理解,当第二时间未达到第二阈值时,已经接收到M个计算集群及第一计算集群中的第二计算集群发送的作业的启动通知或者完成通知,说明在第二时间达到第二阈值之前,作业已经启动或者已经完成,此时,向M个计算集群及第一计算集群中除第二计算集群之外的M个计算集群发送作业的取消通知,可以使得M个计算集群及第一计算集群中除第二计算集群之外的M个计算集群无需继续执行作业,节省该M个计算集群的资源。
在本实施例中,当第二时间达到第二阈值,且未接收到M个计算集群及第一计算集群中的第二计算集群发送的作业的启动通知时,可以从除M个计算集群及第一计算集群之外的N-(M+1)个计算集群中根据属性值确定优先级最高的第三计算集群,然后,将作业发送至第三计算集群,以此类推,直至接收到某个计算集群发送的作业的启动通知或者完成通知。
具体实现中,第一阈值、第二阈值可以根据实际情况进行设置,此处不作具体限定。
可以看出,在本实施例中,在将作业发送至第一计算集群时,并没有向之前已经被发送了作业的M个计算集群发送作业的取消通知,也就是说,当第一计算集群在尝试执行作业时,之前已经被发送了作业的M个计算集群依旧可以尝试执行作业,这样可以尽可能地保证作业完成。
综上可知,图4所示实施例可以尽可能地保证完成作业,避免作业出现永远排队的情况,而且,能够避免在已经有计算集群完成作业的情况下,其它被发送了作业的计算集群重复执行作业,可以节省其它计算集群的资源。而且,N个计算集群中剩余的没有被发送作业的计算集群由于无需执行作业,可以用于处理其它任务,从而实现资源的合理利用。
参见图5,图5为本申请提供的又一种作业调度方法的流程示意图,如图5所示,本申请提供的另一种作业调度方法具体包括如下步骤:
S501:接收作业。
S502:获取N个计算集群的属性值,其中,N为大于2的整数。
S503:基于N个计算集群的属性值对N个计算集群按照属性值进行优先级排序,从N个计算集群中确定优先级排在前M的M个计算集群,其中,M为大于1且小于N的整数。
S504:将作业发送至M个计算集群。
可以看出,S501至S504与S201至S204对应相同,S501至S504的具体实现过程可以对应参考S201至S204中相关描述,为了说明书的简洁,此次不再展开赘述。
S505:在将作业发送至M个计算集群后,开始记录M个计算集群对应的M个时间,当M个时间中的任意一个时间达到该时间对应的阈值,且未接收到M个计算集群中的任意一个计算集群发送的作业的启动通知时,从除M个计算集群之外的N-M个计算集群中根据属性值选择优先级最高的第一计算集群,其中,M个计算集群与M个时间为一一对应关系。
其中,M个计算集群中每个计算集群对应的时间,为作业在该计算集群上排队的时间。
可以理解,当作业在M个计算集群中的某个计算集群上排队的时间达到该时间对应的阈值时,还未接收到该计算集群发送的作业的启动通知,说明作业在该计算集群上已经排队了较长时间。通常,上述情况极可能由该计算集群无法执行作业(如出现故障)引起。为了避免作业即便在该计算集群上等待更长时间,但仍无法启动的情况出现,可以从N个计算集群中除M个计算集群之外的N-M个计算集群中根据属性值选择优先级最高的第一计算集群,将作业发送至第一计算集群,由该计算集群来尝试执行作业,以尽可能地保证作业完成。
在本实施例中,当M个时间中的任意一个时间达到该时间对应的阈值,且接收到M个计算集群中的任意一个计算集群发送的作业的启动通知或者完成通知时,则可以向M个计算集群中的其它M-1个计算集群发送作业的取消通知,节省其它M-1个计算集群的资源。
S506:将作业发送至第一计算集群。
S507:在将作业发送至第一计算集群后,开始记录第二时间,当第二时间未达到第二阈值,且接收到M个计算集群及第一计算集群中的第二计算集群发送的作业的启动通知或者完成通知时,向除第二计算集群之外的M个计算集群发送作业的取消通知。
可以看出,S506和S507与S406和S407对应相同,S506和S507的具体实现过程可以对应参考S406和S407中相关描述,为了说明书的简洁,此次不再展开赘述。
在本实施例中,当第二时间达到第二阈值,且未接收到M个计算集群及第一计算集群中的第二计算集群发送的作业的启动通知时,可以从除M个计算集群及第一计算集群之外的N-(M+1)个计算集群中根据属性值确定优先级最高的第三计算集群,然后,将作业发送至第三计算集群,以此类推,直至接收到某个计算集群发送的作业的启动通知或者完成通知。
可以看出,在本实施例中,在将作业发送至第一计算集群时,并没有向之前已经被发送了作业的M个计算集群发送作业的取消通知,也就是说,当第一计算集群在尝试执行作业时,之前已经被发送了作业的M个计算集群依旧可以尝试启动作业,这样可以尽可能地保证作业完成。
具体实现中,第一阈值、第二阈值及M个时间对应的M个阈值可以根据实际情况进行设置,此处不作具体限定。
综上可知,图5所示实施例可以尽可能地保证完成作业,避免作业出现永远排队的情况,而且,能够避免在已经有计算集群完成作业的情况下,其它被发送了作业的计算集群重复执行作业,可以节省其它计算集群的资源。而且,N个计算集群中剩余的没有被发送作业的计算集群由于无需执行作业,可以用于处理其它任务,从而实现资源的合理利用。
在图2、图4和图5所示的实施例中,调度节点120在接收作业之后,获取N个计算集群的属性值之前,还可以获取作业的优先级/作业所属用户的身份等级(如用户提交的作业中携带作业的优先级/用户的身份等级),在作业的优先级/作业所属用户的身份等级高于优先级阈值/身份等级阈值时,获取N个计算集群的属性值,然后基于N个计算集群的属性值执行后续步骤,实现作业的调度,如此,可以保证用户提交的高优先级作业/身份等级高的用户(如贵宾(very important person,VIP))提交的作业的高效执行。
在作业的优先级/作业所属用户的身份等级低于或者等于优先级阈值/身份等级阈值时,可以获取N个计算集群的属性值,然后基于N个计算集群的属性值对N个计算集群按照属性值进行优先级排序,从而确定优先级排在后T(T为大于0且小于N的整数)的T个计算集群,最后,将作业发送至该T个计算集群,由该T个计算集群来尝试执行作业。如此,可以将优先级排在前M的M个计算集群的资源预留给高优先级作业/身份等级高的用户(如贵宾(very important person,VIP))提交的作业,尽可能地保证完成高优先级作业/身份等级高的用户(如贵宾(very important person,VIP))提交的作业。
上述优先级阈值和身份等级阈值可以根据实际情况进行设置,此处不作具体限定。
应理解,上述图2、图4以及图5所示实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
接下来,介绍本申请提供的作业调度装置,应理解,作业调度装置内部的单元模块也可以有多种划分,各个模块可以是软件模块,也可以是硬件模块,也可以部分是软件模块部分是硬件模块,本申请不对其进行限制。当作业调度装置包括多个单元模块时,该多个单元模块中的各个模块可以部署于同一个计算设备(如服务器)上,也可以部署于不同的计算设备上,本申请不作具体限定。
参见图6,图6是本申请示例性示出的一种作业调度装置600的结构示意图,该装置600包括:接收模块610和调度模块620。下面对作业调度装置600的各个模块的功能进行示例性地介绍。应理解,以下所举例描述的各个模块的功能仅是作业调度装置600在本申请的一些实施例中可以具有的功能,本申请并不对各个模块具有的功能进行限定。
接收模块610,用于接收作业。
调度模块620,用于获取N个计算集群的属性值,并基于N个计算集群的属性值对N个计算集群按照属性值进行优先级排序,从N个计算集群中确定优先级排在前M的M个计算集群,然后,将作业发送至M个计算集群,其中,M为大于1且小于N的整数,N为整数。
在一种可能的实现方式中,计算集群的属性值包括如下一种或多种:计算集群的可用资源信息、计算集群与发送作业的客户端的距离、计算集群的可用资源信息与第一资源信息的匹配度,其中,第一资源信息指示执行作业所需的资源。
在一种可能的实现方式中,调度模块620,还用于:在将作业发送至M个计算集群后,当接收到M个计算集群中的任意一个计算集群发送的作业的完成通知时,向M个计算集群中的其它M-1个计算集群发送作业的取消通知。
在一种可能的实现方式中,调度模块620,还用于:在将作业发送至M个计算集群后,开始记录第一时间,当第一时间达到第一阈值,且未接收到M个计算集群中的任意一个计算集群发送的作业的启动通知时,从除M个计算集群之外的N-M个计算集群中根据属性值选择优先级最高的第一计算集群,然后,将作业发送至第一计算集群。
在一种可能的实现方式中,调度模块620,还用于:在将作业发送至M个计算集群后,开始记录M个计算集群对应的M个时间,当M个时间中的任意一个时间达到任意一个时间对应的阈值,且未接收到M个计算集群中的任意一个计算集群发送的作业的启动通知时,从除M个计算集群之外的N-M个计算集群中根据属性值选择优先级最高的第一计算集群,其中,M个计算集群与M个时间为一一对应关系,然后,将作业发送至第一计算集群。
在一种可能的实现方式中,调度模块620,还用于:在将作业发送至第一计算集群后,开始记录第二时间,当第二时间未达到第二阈值,且接收到M个计算集群及第一计算集群中的第二计算集群发送的作业的启动通知或者完成通知时,向除第二计算集群之外的M个计算集群发送作业的取消通知。
具体地,上述作业调度装置600执行各种操作的具体实现,可参照上述图2、图4或者图5所示的本申请提供的作业调度方法,为了说明书的简洁,这里不再赘述。
综上可知,本申请提供的作业调度装置(如图6所示的装置600)可以尽可能地保证完成作业,避免作业出现永远排队的情况,而且,能够避免在已经有计算集群完成作业的情况下,其它被发送了作业的计算集群重复执行作业,可以节省其它计算集群的资源。而且,N个计算集群中剩余的没有被发送作业的计算集群由于无需执行作业,可以用于处理其它任务,从而实现资源的合理利用。
本申请还提供一种计算设备700,该计算设备700可以是图1-图5实施例中的调度节点120。参见图7,如图7所示,计算设备700包括:处理器710、存储器720和通信接口730,其中,处理器710、存储器720、通信接口730之间可以通过总线740相互连接。
处理器710可以读取存储器720中存储的程序代码(包括指令),执行存储器720中存储的程序代码,使得计算设备700执行图2、图4或者图5所示的本申请提供的作业调度方法,或者使得计算设备700部署作业调度装置600。
处理器710可以有多种具体实现形式,例如中央处理单元(central processingunit,简称CPU),或者CPU和硬件芯片的组合。上述硬件芯片可以是专用集成电路(application-specific integrated circuit,ASIC)、可编程逻辑器件(programmablelogic device,PLD)或其组合。上述PLD可以是复杂可编程逻辑器件(complexprogrammable logic device,CPLD)、现场可编程逻辑门阵列(field-programmable gatearray,FPGA)、通用阵列逻辑(generic array logic,GAL)或其任意组合。处理器710执行各种类型的数字存储指令,例如存储在存储器720中的软件或者固件程序,它能使计算设备700提供多种服务。
存储器720用于存储程序代码,并由处理器710来控制执行。程序代码可以包括一个或多个软件模块,这一个或多个软件模块可以为图6所示实施例中提供的软件模块,如接收模块610和调度模块620。
存储器720可以包括易失性存储器(volatile memory),例如随机存取存储器(random access memory,RAM);存储器720也可以包括非易失性存储器(non-volatilememory),例如只读存储器(read-only memory,ROM)、快闪存储器(flash memory)、硬盘(hard disk drive,HDD)或固态硬盘(solid-state drive,SSD);存储器720还可以包括上述种类的组合。
通信接口730可以为有线接口(例如以太网接口、光纤接口、其他类型接口(例如,infiniBand接口))或无线接口(例如蜂窝网络接口或使用无线局域网接口),用于与其他计算设备或装置进行通信。通信接口730可以采用传输控制协议/网际协议(transmissioncontrol protocol/internet protocol,TCP/IP)之上的协议族,例如,远程函数调用(remote function call,RFC)协议、简单对象访问协议(simple object accessprotocol,SOAP)协议、简单网络管理协议(simple network management protocol,SNMP)协议、公共对象请求代理体系结构(common object request broker architecture,CORBA)协议以及分布式协议等等。
总线740可以是快捷外围部件互连标准(peripheral component interconnectexpress,PCIe)总线、扩展工业标准结构(extended industry standard architecture,EISA)总线、统一总线(unified bus,Ubus或UB)、计算机快速链接(compute express link,CXL)、缓存一致互联协议(cache coherent interconnect for accelerators,CCIX)等。总线740可以分为地址总线、数据总线、控制总线等。总线740除包括数据总线之外,还可以包括电源总线、控制总线和状态信号总线等。但是为了清楚说明起见,在图中将各种总线都标为总线740。为便于表示,图7中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
上述计算设备700用于执行图2、图4或者图5所示的本申请提供的作业调度方法,其具体实现过程详见上述方法实施例,这里不再赘述。
应当理解,计算设备700仅为本申请实施例提供的一个例子,并且,计算设备700可具有比图7示出的部件更多或更少的部件,可以组合两个或更多个部件,或者可具有部件的不同配置实现。
本申请还提供一种计算机可读存储介质,该计算机可读存储介质中存储有指令,该指令被运行时可以实现上述实施例中记载的作业调度方法的部分或者全部步骤。
本申请还提供一种计算机程序产品,当计算机程序产品被计算机读取并执行时,可以实现上述方法实施例中记载的作业调度方法的部分或者全部步骤。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。
在上述实施例中,可以全部或部分地通过软件、硬件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质(例如软盘、硬盘、磁带)、光介质、或者半导体介质等。
以上所述,仅为本申请的具体实施方式。熟悉本技术领域的技术人员根据本申请提供的具体实施方式,可想到变化或替换,都应涵盖在本申请的保护范围之内。

Claims (14)

1.一种作业调度方法,应用于调度系统,其特征在于,所述方法包括:
接收作业;
获取N个计算集群的属性值;
基于所述N个计算集群的属性值对所述N个计算集群按照属性值进行优先级排序,并从所述N个计算集群中确定优先级排在前M的M个计算集群,其中,M为大于1且小于N的整数,N为整数;
将所述作业发送至所述M个计算集群。
2.根据权利要求1所述的方法,其特征在于,所述计算集群的属性值包括如下一种或多种:所述计算集群的可用资源信息、所述计算集群与发送所述作业的客户端的距离、所述计算集群的可用资源信息与第一资源信息的匹配度,其中,所述第一资源信息指示执行所述作业所需的资源。
3.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:
在将所述作业发送至所述M个计算集群后,当接收到所述M个计算集群中的任意一个计算集群发送的所述作业的完成通知时,向所述M个计算集群中的其它M-1个计算集群发送所述作业的取消通知。
4.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:
在将所述作业发送至所述M个计算集群后,开始记录第一时间,当所述第一时间达到第一阈值,且未接收到所述M个计算集群中的任意一个计算集群发送的所述作业的启动通知时,从除所述M个计算集群之外的N-M个计算集群中根据所述属性值选择优先级最高的第一计算集群;
将所述作业发送至所述第一计算集群。
5.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:
在将所述作业发送至所述M个计算集群后,开始记录所述M个计算集群对应的M个时间,当所述M个时间中的任意一个时间达到所述任意一个时间对应的阈值,且未接收到所述M个计算集群中的任意一个计算集群发送的所述作业的启动通知时,从除所述M个计算集群之外的N-M个计算集群中根据所述属性值选择优先级最高的第一计算集群,其中,所述M个计算集群与所述M个时间为一一对应关系;
将所述作业发送至所述第一计算集群。
6.根据权利要求4或5所述的方法,其特征在于,所述方法还包括:
在将所述作业发送至所述第一计算集群后,开始记录第二时间,当所述第二时间未达到所述第二阈值,且接收到所述M个计算集群及所述第一计算集群中的第二计算集群发送的所述作业的启动通知或者完成通知时,向除所述第二计算集群之外的M个计算集群发送所述作业的取消通知。
7.一种作业调度装置,应用于调度系统,其特征在于,所述装置包括:
接收模块,用于接收作业;
调度模块,用于获取N个计算集群的属性值;
所述调度模块,还用于基于所述N个计算集群的属性值对所述N个计算集群按照属性值进行优先级排序,并从所述N个计算集群中确定优先级排在前M的M个计算集群,其中,M为大于1且小于N的整数,N为整数;
所述调度模块,还用于将所述作业发送至所述M个计算集群。
8.根据权利要求7所述的装置,其特征在于,所述计算集群的属性值包括如下一种或多种:所述计算集群的可用资源信息、所述计算集群与发送所述作业的客户端的距离、所述计算集群的可用资源信息与第一资源信息的匹配度,其中,所述第一资源信息指示执行所述作业所需的资源。
9.根据权利要求7或8所述的装置,其特征在于,所述调度模块,还用于:
在接收到所述M个计算集群中的任意一个计算集群发送的所述作业的完成通知后,向所述M个计算集群中的其它M-1个计算集群发送所述作业的取消通知。
10.根据权利要求7或8所述的装置,其特征在于,所述调度模块,还用于:
在将所述作业发送至所述M个计算集群后,开始记录第一时间,当所述第一时间达到第一阈值,且未接收到所述M个计算集群中的任意一个计算集群发送的所述作业的启动通知时,从除所述M个计算集群之外的N-M个计算集群中根据所述属性值选择优先级最高的第一计算集群;
将所述作业发送至所述第一计算集群。
11.根据权利要求7或8所述的装置,其特征在于,所述调度模块,还用于:
在将所述作业发送至所述M个计算集群后,开始记录所述M个计算集群对应的M个时间,当所述M个时间中的任意一个时间达到所述任意一个时间对应的阈值,且未接收到所述M个计算集群中的任意一个计算集群发送的所述作业的启动通知时,从除所述M个计算集群之外的N-M个计算集群中根据所述属性值选择优先级最高的第一计算集群,其中,所述M个计算集群与所述M个时间为一一对应关系;
将所述作业发送至所述第一计算集群。
12.根据权利要求10或11所述的装置,其特征在于,所述调度模块,还用于:
在将所述作业发送至所述第一计算集群后,开始记录第二时间,当所述第二时间未达到所述第二阈值,且接收到所述M个计算集群及所述第一计算集群中的第二计算集群发送的所述作业的启动通知或者完成通知时,向除所述第二计算集群之外的M个计算集群发送所述作业的取消通知。
13.一种计算设备,其特征在于,所述计算设备包括处理器和存储器;所述处理器用于执行所述存储器存储的指令,使得所述计算设备实现权利要求1至6任一项所述的方法。
14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有指令,所述指令用于实现权利要求1至6任一项所述的方法。
CN202210654171.0A 2022-06-10 2022-06-10 作业调度方法、装置、设备及计算机可读存储介质 Pending CN117251256A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210654171.0A CN117251256A (zh) 2022-06-10 2022-06-10 作业调度方法、装置、设备及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210654171.0A CN117251256A (zh) 2022-06-10 2022-06-10 作业调度方法、装置、设备及计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN117251256A true CN117251256A (zh) 2023-12-19

Family

ID=89128160

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210654171.0A Pending CN117251256A (zh) 2022-06-10 2022-06-10 作业调度方法、装置、设备及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN117251256A (zh)

Similar Documents

Publication Publication Date Title
CN109428922B (zh) 一种订阅发布方法及服务器
US10412021B2 (en) Optimizing placement of virtual machines
CN110096336B (zh) 数据监控方法、装置、设备和介质
CN113485822A (zh) 内存管理方法、系统、客户端、服务器及存储介质
CN111224806A (zh) 一种资源分配方法及服务器
CN110740162A (zh) 通信链路建立方法、装置、电子设备及介质
CN111309488B (zh) 无人机集群的计算资源共享方法与系统及计算机存储介质
CN116339954A (zh) 进程迁移方法、装置、存储介质及电子设备
WO2022111456A1 (zh) 基于众核系统的核共享方法及装置、电子设备、介质
CN117076133B (zh) 云游戏平台异构资源分配方法、计算机装置及存储介质
CN116233022A (zh) 一种作业调度方法、服务器及服务器集群
CN117251256A (zh) 作业调度方法、装置、设备及计算机可读存储介质
CN113472591B (zh) 一种业务性能的确定方法及装置
CN114500403A (zh) 一种数据处理方法、装置及计算机可读存储介质
CN115878309A (zh) 资源分配方法、装置、处理核、设备和计算机可读介质
CN115576661A (zh) 数据处理系统、方法和控制器
CN108718285B (zh) 云计算集群的流量控制方法、装置及服务器
CN111092817A (zh) 一种数据传输方法及装置
CN116016539B (zh) 业务请求的处理方法、装置、服务器及存储介质
CN114185689B (zh) 一种医学人工智能与高性能计算资源调度系统及调度方法
CN114401302B (zh) 联动动作的执行方法、装置及存储介质
CN115243394B (zh) 基于网络切片的通信方法、装置、设备及介质
WO2023072223A1 (zh) 一种数据处理的方法、装置和计算设备
CN116418758A (zh) 队列管理方法、装置、网络设备、芯片及存储介质
CN117667782A (zh) 一种事件调度方法、系统及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination