CN116643893B - 算力任务的调度方法、调度装置、存储介质及服务器 - Google Patents

算力任务的调度方法、调度装置、存储介质及服务器 Download PDF

Info

Publication number
CN116643893B
CN116643893B CN202310933669.5A CN202310933669A CN116643893B CN 116643893 B CN116643893 B CN 116643893B CN 202310933669 A CN202310933669 A CN 202310933669A CN 116643893 B CN116643893 B CN 116643893B
Authority
CN
China
Prior art keywords
task
computing
scheduling
target
resources
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310933669.5A
Other languages
English (en)
Other versions
CN116643893A (zh
Inventor
胡德凯
常峰
朱建
李国玉
刘海峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hefei Zhongke Leinao Intelligent Technology Co ltd
Original Assignee
Hefei Zhongke Leinao Intelligent Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hefei Zhongke Leinao Intelligent Technology Co ltd filed Critical Hefei Zhongke Leinao Intelligent Technology Co ltd
Priority to CN202310933669.5A priority Critical patent/CN116643893B/zh
Publication of CN116643893A publication Critical patent/CN116643893A/zh
Application granted granted Critical
Publication of CN116643893B publication Critical patent/CN116643893B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • G06F9/4806Task transfer initiation or dispatching
    • G06F9/4843Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
    • G06F9/4881Scheduling strategies for dispatcher, e.g. round robin, multi-level priority queues
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5061Partitioning or combining of resources
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/48Indexing scheme relating to G06F9/48
    • G06F2209/484Precedence
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本公开是关于一种算力任务的调度方法、算力任务的调度装置、存储介质及服务器。该算力任务的调度方法包括获取目标算力任务执行时关联到的属性特征及所有计算中心的调度资源;基于分级调度策略,进行属性特征与各计算中心的调度资源间的分等级资源匹配,在所有计算中心中确定出符合所有等级资源匹配规则的目标计算中心;基于目标计算中心,调度目标算力任务。本申请中,通过分级调度策略,进行属性特征与各计算中心的调度资源间的分等级资源匹配,在所有计算中心中确定出符合所有等级资源匹配规则的目标计算中心,有利于匹配出符合调度请求的最佳目标计算中心,从而提高计算资源利用率。

Description

算力任务的调度方法、调度装置、存储介质及服务器
技术领域
本公开涉及计算机技术领域,尤其涉及一种算力任务的调度方法、算力任务的调度装置、存储介质及服务器。
背景技术
随着互联网的不断发展,用户可以通过使用远程算力的方式,完成自己的计算任务。这样,用户只需要在本地拥有一个计算能力较弱的计算机,即可使用不断更新换代的新硬件,快速完成自身的任务。对计算资源的提供方而言,随着用户任务的不断增加,其可靠性变得至关重要。故当前提供方通常采用多中心架构,避免因单点失效导致系统不可用,从而影响到用户任务的完成。因此,计算资源的提供方在接收到用户计算任务之后,若用户未指定使用哪个计算中心的情况下,会根据实际情况,在多个中心内找到一个适合的计算中心,来满足用户计算任务的需求。但计算资源终归是有限的,在计算中心较为繁忙时,如何更为合理的进行任务调度,将决定计算资源的利用率。
发明内容
有鉴于此,本公开实施例期望提供一种算力任务的调度方法、算力任务的调度装置、存储介质及服务器。
本公开的技术方案是这样实现的:
第一方面,本公开提供一种算力任务的调度方法。
本公开实施例提供的算力任务的调度方法,包括:
获取目标算力任务执行时关联到的属性特征及所有计算中心的调度资源;
根据所述目标算力任务的调度请求,基于分级调度策略,进行所述属性特征与各所述计算中心的调度资源间的分等级资源匹配,在所述所有计算中心中确定出符合所有等级资源匹配规则的目标计算中心;其中,所述属性特征至少包括目标算力任务的任务类型及目标算力任务执行时所需任务资源;
基于所述目标计算中心,调度所述目标算力任务。
在一些实施例中,所述分级调度策略包括:第一子调度策略、第二子调度策略及第三子调度策略;
所述第一子调度策略旨在根据所述目标算力任务的任务类型,在所有计算中心中确定出支持调度所述任务类型算力任务的一级计算中心;
所述第二子调度策略旨在根据所述一级计算中心的任务标签,在所述一级计算中心中确定出现阶段能够支持调度所述任务类型算力任务的二级计算中心;其中,所述任务标签用于标注计算中心现阶段能够支持调度算力任务的任务类型;
所述第三子调度策略旨在根据所述目标算力任务执行时所需任务资源,及各所述二级计算中心的剩余可用资源,进行资源匹配,确定出最佳匹配的目标计算中心。
在一些实施例中,所述根据所述目标算力任务执行时所需任务资源,及各所述二级计算中心的剩余可用资源,进行资源匹配,确定出最佳匹配的目标计算中心,包括:
根据所述目标算力任务执行时所需各类任务资源间的比重、各所述二级计算中心的剩余可用资源及各所述二级计算中心的总可用资源,确定各所述二级计算中心分别对应的总剩余资源利用率;
根据所述目标算力任务的调度请求,在各所述二级计算中心中确定出剩余资源满足所述目标算力任务的调度需求且总剩余资源利用率最佳匹配所述调度请求的计算中心为所述目标计算中心。
在一些实施例中,所述根据所述目标算力任务的调度请求,在各所述二级计算中心中确定出剩余资源满足所述目标算力任务的调度需求且总剩余资源利用率最佳匹配所述调度请求的计算中心为所述目标计算中心,包括:
若所述目标算力任务的调度请求为选择最大总剩余资源利用率的计算中心,则在剩余资源满足所述目标算力任务的调度需求的各所述二级计算中心中,确定出最大总剩余资源利用率的计算中心为所述目标计算中心;
若所述目标算力任务的调度请求为选择最小总剩余资源利用率的计算中心,则在剩余资源满足所述目标算力任务的调度需求的各所述二级计算中心中,确定出最小总剩余资源利用率的计算中心为所述目标计算中心。
在一些实施例中,所述根据所述目标算力任务执行时所需各类任务资源间的比重、各所述二级计算中心的剩余可用资源及各所述二级计算中心的总可用资源,确定各所述二级计算中心分别对应的总剩余资源利用率,包括:
基于各所述二级计算中心分别对应于任一类任务资源的剩余可用资源及分别对应于任一类任务资源的总可用资源,得到各所述二级计算中心分别对应于任一类任务资源的剩余资源利用率;
基于所述目标算力任务执行时所需各类任务资源间的比重,确定得到所述二级计算中心的所述总剩余资源利用率时,各类任务资源对应的剩余资源利用率间的权重分配;其中,所有二级计算中心中各类任务资源对应的剩余资源利用率间的权重分配相同;
根据各所述二级计算中心分别对应于所有任务资源的剩余资源利用率,及各类任务资源对应的剩余资源利用率间的权重分配,得到各所述二级计算中心分别对应的总剩余资源利用率。
在一些实施例中,所述获取目标算力任务执行时关联到的属性特征及所有计算中心的调度资源前,所述方法包括:
对所有算力任务执行时关联到的属性特征进行分类;
根据属性特征的分类,建立所有算力任务对应的统一属性特征自定义;
对所有计算中心的可用资源进行分类;
根据可用资源的分类,建立所有计算中心对应的统一资源分类自定义。
在一些实施例中,若待调度的算力任务为多个,则根据各算力任务的优先级确定优先级最高的算力任务为所述目标算力任务,以依次执行对各所述算力任务的调度。
第二方面,本公开提供一种算力任务的调度装置,包括:
信息获取模块,用于获取目标算力任务执行时关联到的属性特征及所有计算中心的调度资源;
信息确定模块,用于根据所述目标算力任务的调度请求,基于分级调度策略,进行所述属性特征与各所述计算中心的调度资源间的分等级资源匹配,在所述所有计算中心中确定出符合所有等级资源匹配规则的目标计算中心;其中,所述属性特征至少包括目标算力任务的任务类型及目标算力任务执行时所需任务资源;
任务调度模块,用于基于所述目标计算中心,调度所述目标算力任务。
第三方面,本公开提供一种计算机可读存储介质,其上存储有算力任务的调度程序,该算力任务的调度程序被处理器执行时,实现上述第一方面所述的算力任务的调度方法。
第四方面,本公开提供一种服务器,包括存储器、处理器及存储在存储器上并可在处理器上运行的算力任务的调度程序,所述处理器执行所述算力任务的调度程序时,实现上述第一方面所述的算力任务的调度方法。
根据本公开实施例的算力任务的调度方法包括获取目标算力任务执行时关联到的属性特征及所有计算中心的调度资源;基于分级调度策略,进行属性特征与各计算中心的调度资源间的分等级资源匹配,在所有计算中心中确定出符合所有等级资源匹配规则的目标计算中心;其中,属性特征至少包括目标算力任务的任务类型及目标算力任务执行时所需任务资源;基于目标计算中心,调度目标算力任务。本申请中,通过分级调度策略,进行属性特征与各计算中心的调度资源间的分等级资源匹配,在所有计算中心中确定出符合所有等级资源匹配规则的目标计算中心,有利于匹配出符合调度请求的最佳目标计算中心,从而提高计算资源利用率。
本公开附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本公开的实践了解到。
附图说明
图1是根据一示例性实施例示出的算力任务的调度方法流程图;
图2是根据一示例性实施例示出的算力任务的调度过程示意图;
图3是根据一示例性实施例示出的算力任务的调度装置结构示意图。
具体实施方式
下面详细描述本公开的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本公开,而不能理解为对本公开的限制。
随着互联网的不断发展,用户可以通过使用远程算力的方式,完成自己的计算任务。这样,用户只需要在本地拥有一个计算能力较弱的计算机,即可使用不断更新换代的新硬件,快速完成自身的任务。对计算资源的提供方而言,随着用户任务的不断增加,其可靠性变得至关重要。故当前提供方通常采用多中心架构,避免因单点失效导致系统不可用,从而影响到用户任务的完成。因此,计算资源的提供方在接收到用户计算任务之后,若用户未指定使用哪个计算中心的情况下,会根据实际情况,在多个中心内找到一个适合的计算中心,来满足用户计算任务的需求。但计算资源终归是有限的,在计算中心较为繁忙时,如何更为合理的进行任务调度,将决定计算资源的利用率。
针对上述情况,本公开提供一种算力任务的调度方法。图1是根据一示例性实施例示出的算力任务的调度方法流程图。如图1所示,该算力任务的调度方法包括:
步骤10、获取目标算力任务执行时关联到的属性特征及所有计算中心的调度资源;
步骤11、根据所述目标算力任务的调度请求,基于分级调度策略,进行所述属性特征与各所述计算中心的调度资源间的分等级资源匹配,在所述所有计算中心中确定出符合所有等级资源匹配规则的目标计算中心;其中,所述属性特征至少包括目标算力任务的任务类型及目标算力任务执行时所需任务资源;
步骤12、基于所述目标计算中心,调度所述目标算力任务。
在本示例性实施例中,目标算力任务的任务类型可以包括调试任务、训练任务、在线推理任务等等。目标算力任务执行时所需任务资源可以包括CPU、内存、GPU等。
其中,目标算力任务执行时关联到的属性特征还包括:目标算力任务所属计算中心、运行目标算力任务所需要的镜像、运行目标算力任务所需要的数据集、运行目标算力任务所需要的模型。
在本示例性实施例中,分级调度策略包含有属性特征与各所述计算中心的调度资源间的分等级资源匹配时的匹配方法。根据分级调度策略可在所有计算中心中筛选出符合所有等级资源匹配规则的目标计算中心。
根据本公开实施例的算力任务的调度方法包括获取目标算力任务执行时关联到的属性特征及所有计算中心的调度资源;基于分级调度策略,进行属性特征与各计算中心的调度资源间的分等级资源匹配,在所有计算中心中确定出符合所有等级资源匹配规则的目标计算中心;其中,属性特征至少包括目标算力任务的任务类型及目标算力任务执行时所需任务资源;基于目标计算中心,调度目标算力任务。本申请中,通过分级调度策略,进行属性特征与各计算中心的调度资源间的分等级资源匹配,在所有计算中心中确定出符合所有等级资源匹配规则的目标计算中心,有利于匹配出符合调度请求的最佳目标计算中心,从而提高计算资源利用率。
在一些实施例中,所述分级调度策略包括:第一子调度策略、第二子调度策略及第三子调度策略;
所述第一子调度策略旨在根据所述目标算力任务的任务类型,在所有计算中心中确定出支持调度所述任务类型算力任务的一级计算中心;
所述第二子调度策略旨在根据所述一级计算中心的任务标签,在所述一级计算中心中确定出现阶段能够支持调度所述任务类型算力任务的二级计算中心;其中,所述任务标签用于标注计算中心现阶段能够支持调度算力任务的任务类型;
所述第三子调度策略旨在根据所述目标算力任务执行时所需任务资源,及各所述二级计算中心的剩余可用资源,进行资源匹配,确定出最佳匹配的目标计算中心。
在本示例性实施例中,分级调度策略包括:第一子调度策略、第二子调度策略及第三子调度策略。一种子调度策略对应有一种等级资源匹配规则。
例如,第一子调度策略对应的等级资源匹配规则为:在根据所述目标算力任务的任务类型,在所有计算中心中确定出支持调度所述任务类型算力任务的一级计算中心;
所述第二子调度策略对应的等级资源匹配规则为:在根据所述一级计算中心的任务标签,在所述一级计算中心中确定出现阶段能够支持调度所述任务类型算力任务的二级计算中心;其中,所述任务标签用于标注计算中心现阶段能够支持调度算力任务的任务类型;
所述第三子调度策略对应的等级资源匹配规则为:在根据所述目标算力任务执行时所需任务资源,及各所述二级计算中心的剩余可用资源,进行资源匹配,确定出最佳匹配的目标计算中心。
在本示例性实施例中,针对第一子调度策略:由于每个计算中心所支持调度的任务类型会存在差异。因此需要在所有计算中心中确定出支持调度所述任务类型算力任务的计算中心。例如,目标算力任务为调试任务,但计算中心B不支持调试任务,则此时可以把计算中心B剔除。
同时,针对第二子调度策略:在计算中心A和计算中心C都支持目标算力任务的情况下,但由于计算中心C临时出现故障,现阶段无法执行目标算力任务的调度任务,此时可通过任务标签的形式体现现阶段哪些计算中心可执行目标算力任务。
针对第三子调度策略:根据所述目标算力任务执行时所需任务资源,及各所述二级计算中心的剩余可用资源,进行资源匹配,确定出最佳匹配的目标计算中心,以保证目标算力任务可在执行调度任务的计算中心顺利执行。如此,通过上述三个子调度策略可在所有计算中心中确定出符合所有等级资源匹配规则的最佳匹配目标计算中心,从而有利于提高计算资源利用率。
在一些实施例中,所述根据所述目标算力任务执行时所需任务资源,及各所述二级计算中心的剩余可用资源,进行资源匹配,确定出最佳匹配的目标计算中心,包括:
根据所述目标算力任务执行时所需各类任务资源间的比重、各所述二级计算中心的剩余可用资源及各所述二级计算中心的总可用资源,确定各所述二级计算中心分别对应的总剩余资源利用率;
根据所述目标算力任务的调度请求,在各所述二级计算中心中确定出剩余资源满足所述目标算力任务的调度需求且总剩余资源利用率最佳匹配所述调度请求的计算中心为所述目标计算中心。
在本示例性实施例中,所述根据所述目标算力任务的调度请求,在各所述二级计算中心中确定出剩余资源满足所述目标算力任务的调度需求且总剩余资源利用率最佳匹配所述调度请求的计算中心为所述目标计算中心,包括:
若所述目标算力任务的调度请求为选择最大总剩余资源利用率的计算中心,则在剩余资源满足所述目标算力任务的调度需求的各所述二级计算中心中,确定出最大总剩余资源利用率的计算中心为所述目标计算中心;
若所述目标算力任务的调度请求为选择最小总剩余资源利用率的计算中心,则在剩余资源满足所述目标算力任务的调度需求的各所述二级计算中心中,确定出最小总剩余资源利用率的计算中心为所述目标计算中心。
在本示例性实施例中,所述根据所述目标算力任务执行时所需各类任务资源间的比重、各所述二级计算中心的剩余可用资源及各所述二级计算中心的总可用资源,确定各所述二级计算中心分别对应的总剩余资源利用率,包括:
基于各所述二级计算中心分别对应于任一类任务资源的剩余可用资源及分别对应于任一类任务资源的总可用资源,得到各所述二级计算中心分别对应于任一类任务资源的剩余资源利用率;
基于所述目标算力任务执行时所需各类任务资源间的比重,确定得到所述二级计算中心的所述总剩余资源利用率时,各类任务资源对应的剩余资源利用率间的权重分配;其中,所有二级计算中心中各类任务资源对应的剩余资源利用率间的权重分配相同;
根据各所述二级计算中心分别对应于所有任务资源的剩余资源利用率,及各类任务资源对应的剩余资源利用率间的权重分配,得到各所述二级计算中心分别对应的总剩余资源利用率。
在本示例性实施例中,如果二级计算中心包括计算中心A、计算中心D、计算中心E。目标算力任务执行时所需任务资源可以包括CPU、内存、GPU等。
如果确定目标算力任务执行时所需任务资源可以包括CPU、内存、GPU时,可基于各所述二级计算中心分别对应于CPU的剩余可用资源及分别对应于CPU的总可用资源,得到各所述二级计算中心分别对应于CPU的剩余资源利用率。各所述二级计算中心分别对应于CPU的剩余资源利用率,可以包括计算中心A对应的第一CPU剩余资源利用率、计算中心D对应的第二CPU剩余资源利用率、计算中心E对应的第三CPU剩余资源利用率。
基于各所述二级计算中心分别对应于内存的剩余可用资源及分别对应于内存的总可用资源,得到各所述二级计算中心分别对应于内存的剩余资源利用率。各所述二级计算中心分别对应于内存的剩余资源利用率,可以包括计算中心A对应的第一内存剩余资源利用率、计算中心D对应的第二内存剩余资源利用率、计算中心E对应的第三内存剩余资源利用率。
基于各所述二级计算中心分别对应于GPU的剩余可用资源及分别对应于GPU的总可用资源,得到各所述二级计算中心分别对应于GPU的剩余资源利用率。各所述二级计算中心分别对应于GPU的剩余资源利用率,可以包括计算中心A对应的第一GPU剩余资源利用率、计算中心D对应的第二GPU剩余资源利用率、计算中心E对应的第三GPU剩余资源利用率。
基于所述目标算力任务执行时所需各类任务资源间的比重,确定得到所述二级计算中心的所述总剩余资源利用率时,各类任务资源对应的剩余资源利用率间的权重分配,包括:
确定CPU对应的第一权重值、内存对应的第二权重值、GPU对应的第三权重值。
根据各所述二级计算中心分别对应于所有任务资源的剩余资源利用率,及各类任务资源对应的剩余资源利用率间的权重分配,得到各所述二级计算中心分别对应的总剩余资源利用率,包括:
计算中心A对应的第一CPU剩余资源利用率*CPU对应的第一权重值+计算中心A对应的第一内存剩余资源利用率*内存对应的第二权重值+计算中心A对应的第一GPU剩余资源利用率* GPU对应的第三权重值=计算中心A对应的总剩余资源利用率;
计算中心D对应的第一CPU剩余资源利用率*CPU对应的第一权重值+计算中心D对应的第一内存剩余资源利用率*内存对应的第二权重值+计算中心D对应的第一GPU剩余资源利用率* GPU对应的第三权重值=计算中心D对应的总剩余资源利用率;
计算中心E对应的第一CPU剩余资源利用率*CPU对应的第一权重值+计算中心E对应的第一内存剩余资源利用率*内存对应的第二权重值+计算中心E对应的第一GPU剩余资源利用率* GPU对应的第三权重值=计算中心E对应的总剩余资源利用率。
在本示例性实施例中,剩余资源满足所述目标算力任务的调度需求,包括任一类剩余资源均满足目标算力任务的调度需求。例如,当计算中心A中CPU剩余资源、GPU剩余资源及内存剩余资源均满足目标算力任务的调度需求时,可确定计算中心A为剩余资源满足所述目标算力任务的调度需求的二级计算中心。
在本示例性实施例中,得到各计算中心对应的总剩余资源利用率后,可通过剩余资源利用率*100得到各计算中心对应的打分,根据打分确定各计算中心的剩余资源情况。例如,打分越高说明剩余资源越多。
在一些实施例中,所述获取目标算力任务执行时关联到的属性特征及所有计算中心的调度资源前,所述方法包括:
对所有算力任务执行时关联到的属性特征进行分类;
根据属性特征的分类,建立所有算力任务对应的统一属性特征自定义;
对所有计算中心的可用资源进行分类;
根据可用资源的分类,建立所有计算中心对应的统一资源分类自定义。
在本示例性实施例中,为了方便目标算力任务调度,可事先对所有算力任务执行时关联到的属性特征进行分类;根据属性特征的分类,建立所有算力任务对应的统一属性特征自定义;以及对所有计算中心的可用资源进行分类;根据可用资源的分类,建立所有计算中心对应的统一资源分类自定义。例如,将有关算力任务调度时所需要的参数、模型等进行统一自定义。将所有计算中心的可用资源进行统一自定义等等。
例如,建立不同类型算力任务统一的作业属性定义,包含任务类型(调试任务、训练任务、在线推理任务)、算力任务所属计算中心、运行算力任务所需要的镜像(任务参数)、运行算力任务所需要的数据集(完成作业所需要的任务参数)、运行算力任务所需要的模型(任务可以跑的模型,例如推理任务依赖的模型)、优先级等级(算力任务的优先级调度,可以根据算力任务的紧急程度来确定)、算力任务运行所需的计算资源(CPU、内存、GPU等);
建立统一计算中心资源属性定义,包含运行算力任务的必需资源和资源类型、所支持的算力任务类型、总提供的资源、剩余资源、当前运行的任务数,提供获取计算中心属性的接口等。对算力任务统一的作业属性和计算中心资源属性自定义完成后,可进行存储。
图2是根据一示例性实施例示出的算力任务的调度过程示意图。如图2所示,调度系统接收到算力任务后,将算力任务统一的作业属性和计算中心资源(包括图示的计算中心A/计算中心B/计算中心C)属性自定义进行存储;然后根据分级调度策略得到最优计算中心。
在一些实施例中,若待调度的算力任务为多个,则根据各算力任务的优先级确定优先级最高的算力任务为所述目标算力任务,以依次执行对各所述算力任务的调度。
在本示例性实施例中,如果接收到多个算力任务的调度指令,则可以根据预选定义的各算力任务的优先级,确定优先级最高的算力任务为所述目标算力任务,以依次执行对各所述算力任务的调度。
本公开提供一种算力任务的调度装置。图3是根据一示例性实施例示出的算力任务的调度装置结构示意图。如图3所示,算力任务的调度装置包括:
信息获取模块30,用于获取目标算力任务执行时关联到的属性特征及所有计算中心的调度资源;
信息确定模块31,用于根据所述目标算力任务的调度请求,基于分级调度策略,进行所述属性特征与各所述计算中心的调度资源间的分等级资源匹配,在所述所有计算中心中确定出符合所有等级资源匹配规则的目标计算中心;其中,所述属性特征至少包括目标算力任务的任务类型及目标算力任务执行时所需任务资源;
任务调度模块32,用于基于所述目标计算中心,调度所述目标算力任务。
在本示例性实施例中,目标算力任务的任务类型可以包括调试任务、训练任务、在线推理任务等等。目标算力任务执行时所需任务资源可以包括CPU、内存、GPU等。
其中,目标算力任务执行时关联到的属性特征还包括:目标算力任务所属计算中心、运行目标算力任务所需要的镜像、运行目标算力任务所需要的数据集、运行目标算力任务所需要的模型。
在本示例性实施例中,分级调度策略包含有属性特征与各所述计算中心的调度资源间的分等级资源匹配时的匹配方法。根据分级调度策略可在所有计算中心中筛选出符合所有等级资源匹配规则的目标计算中心。
根据本公开实施例的算力任务的调度装置用于获取目标算力任务执行时关联到的属性特征及所有计算中心的调度资源;基于分级调度策略,进行属性特征与各计算中心的调度资源间的分等级资源匹配,在所有计算中心中确定出符合所有等级资源匹配规则的目标计算中心;其中,属性特征至少包括目标算力任务的任务类型及目标算力任务执行时所需任务资源;基于目标计算中心,调度目标算力任务。本申请中,通过分级调度策略,进行属性特征与各计算中心的调度资源间的分等级资源匹配,在所有计算中心中确定出符合所有等级资源匹配规则的目标计算中心,有利于匹配出符合调度请求的最佳目标计算中心,从而提高计算资源利用率。
在一些实施例中,所述分级调度策略包括:第一子调度策略、第二子调度策略及第三子调度策略;
所述第一子调度策略旨在根据所述目标算力任务的任务类型,在所有计算中心中确定出支持调度所述任务类型算力任务的一级计算中心;
所述第二子调度策略旨在根据所述一级计算中心的任务标签,在所述一级计算中心中确定出现阶段能够支持调度所述任务类型算力任务的二级计算中心;其中,所述任务标签用于标注计算中心现阶段能够支持调度算力任务的任务类型;
所述第三子调度策略旨在根据所述目标算力任务执行时所需任务资源,及各所述二级计算中心的剩余可用资源,进行资源匹配,确定出最佳匹配的目标计算中心。
在本示例性实施例中,分级调度策略包括:第一子调度策略、第二子调度策略及第三子调度策略。一种子调度策略对应有一种等级资源匹配规则。
例如,第一子调度策略对应的等级资源匹配规则为:在根据所述目标算力任务的任务类型,在所有计算中心中确定出支持调度所述任务类型算力任务的一级计算中心;
所述第二子调度策略对应的等级资源匹配规则为:在根据所述一级计算中心的任务标签,在所述一级计算中心中确定出现阶段能够支持调度所述任务类型算力任务的二级计算中心;其中,所述任务标签用于标注计算中心现阶段能够支持调度算力任务的任务类型;
所述第三子调度策略对应的等级资源匹配规则为:在根据所述目标算力任务执行时所需任务资源,及各所述二级计算中心的剩余可用资源,进行资源匹配,确定出最佳匹配的目标计算中心。
在本示例性实施例中,针对第一子调度策略:由于每个计算中心所支持调度的任务类型会存在差异。因此需要在所有计算中心中确定出支持调度所述任务类型算力任务的计算中心。例如,目标算力任务为调试任务,但计算中心B不支持调试任务,则此时可以把计算中心B剔除。
同时,针对第二子调度策略:在计算中心A和计算中心C都支持目标算力任务的情况下,但由于计算中心C临时出现故障,现阶段无法执行目标算力任务的调度任务,此时可通过任务标签的形式体现现阶段哪些计算中心可执行目标算力任务。
针对第三子调度策略:根据所述目标算力任务执行时所需任务资源,及各所述二级计算中心的剩余可用资源,进行资源匹配,确定出最佳匹配的目标计算中心,以保证目标算力任务可在执行调度任务的计算中心顺利执行。如此,通过上述三个子调度策略可在所有计算中心中确定出符合所有等级资源匹配规则的最佳匹配目标计算中心,从而有利于提高计算资源利用率。
在一些实施例中,所述根据所述目标算力任务执行时所需任务资源,及各所述二级计算中心的剩余可用资源,进行资源匹配,确定出最佳匹配的目标计算中心,包括:
根据所述目标算力任务执行时所需各类任务资源间的比重、各所述二级计算中心的剩余可用资源及各所述二级计算中心的总可用资源,确定各所述二级计算中心分别对应的总剩余资源利用率;
根据所述目标算力任务的调度请求,在各所述二级计算中心中确定出剩余资源满足所述目标算力任务的调度需求且总剩余资源利用率最佳匹配所述调度请求的计算中心为所述目标计算中心。
在一些实施例中,所述信息确定模块,用于若所述目标算力任务的调度请求为选择最大总剩余资源利用率的计算中心,则在剩余资源满足所述目标算力任务的调度需求的各所述二级计算中心中,确定出最大总剩余资源利用率的计算中心为所述目标计算中心;
若所述目标算力任务的调度请求为选择最小总剩余资源利用率的计算中心,则在剩余资源满足所述目标算力任务的调度需求的各所述二级计算中心中,确定出最小总剩余资源利用率的计算中心为所述目标计算中心。
在一些实施例中,所述信息确定模块,用于基于各所述二级计算中心分别对应于任一类任务资源的剩余可用资源及分别对应于任一类任务资源的总可用资源,得到各所述二级计算中心分别对应于任一类任务资源的剩余资源利用率;
基于所述目标算力任务执行时所需各类任务资源间的比重,确定得到所述二级计算中心的所述总剩余资源利用率时,各类任务资源对应的剩余资源利用率间的权重分配;其中,所有二级计算中心中各类任务资源对应的剩余资源利用率间的权重分配相同;
根据各所述二级计算中心分别对应于所有任务资源的剩余资源利用率,及各类任务资源对应的剩余资源利用率间的权重分配,得到各所述二级计算中心分别对应的总剩余资源利用率。
在本示例性实施例中,如果二级计算中心包括计算中心A、计算中心D、计算中心E。目标算力任务执行时所需任务资源可以包括CPU、内存、GPU等。
如果确定目标算力任务执行时所需任务资源可以包括CPU、内存、GPU时,可基于各所述二级计算中心分别对应于CPU的剩余可用资源及分别对应于CPU的总可用资源,得到各所述二级计算中心分别对应于CPU的剩余资源利用率。各所述二级计算中心分别对应于CPU的剩余资源利用率,可以包括计算中心A对应的第一CPU剩余资源利用率、计算中心D对应的第二CPU剩余资源利用率、计算中心E对应的第三CPU剩余资源利用率。
基于各所述二级计算中心分别对应于内存的剩余可用资源及分别对应于内存的总可用资源,得到各所述二级计算中心分别对应于内存的剩余资源利用率。各所述二级计算中心分别对应于内存的剩余资源利用率,可以包括计算中心A对应的第一内存剩余资源利用率、计算中心D对应的第二内存剩余资源利用率、计算中心E对应的第三内存剩余资源利用率。
基于各所述二级计算中心分别对应于GPU的剩余可用资源及分别对应于GPU的总可用资源,得到各所述二级计算中心分别对应于GPU的剩余资源利用率。各所述二级计算中心分别对应于GPU的剩余资源利用率,可以包括计算中心A对应的第一GPU剩余资源利用率、计算中心D对应的第二GPU剩余资源利用率、计算中心E对应的第三GPU剩余资源利用率。
基于所述目标算力任务执行时所需各类任务资源间的比重,确定得到所述二级计算中心的所述总剩余资源利用率时,各类任务资源对应的剩余资源利用率间的权重分配,包括:
确定CPU对应的第一权重值、内存对应的第二权重值、GPU对应的第三权重值。
根据各所述二级计算中心分别对应于所有任务资源的剩余资源利用率,及各类任务资源对应的剩余资源利用率间的权重分配,得到各所述二级计算中心分别对应的总剩余资源利用率,包括:
计算中心A对应的第一CPU剩余资源利用率*CPU对应的第一权重值+计算中心A对应的第一内存剩余资源利用率*内存对应的第二权重值+计算中心A对应的第一GPU剩余资源利用率* GPU对应的第三权重值=计算中心A对应的总剩余资源利用率;
计算中心D对应的第一CPU剩余资源利用率*CPU对应的第一权重值+计算中心D对应的第一内存剩余资源利用率*内存对应的第二权重值+计算中心D对应的第一GPU剩余资源利用率* GPU对应的第三权重值=计算中心D对应的总剩余资源利用率;
计算中心E对应的第一CPU剩余资源利用率*CPU对应的第一权重值+计算中心E对应的第一内存剩余资源利用率*内存对应的第二权重值+计算中心E对应的第一GPU剩余资源利用率* GPU对应的第三权重值=计算中心E对应的总剩余资源利用率。
在本示例性实施例中,剩余资源满足所述目标算力任务的调度需求,包括任一类剩余资源均满足目标算力任务的调度需求。例如,当计算中心A中CPU剩余资源、GPU剩余资源及内存剩余资源均满足目标算力任务的调度需求时,可确定计算中心A为剩余资源满足所述目标算力任务的调度需求的二级计算中心。
在一些实施例中,所述自定义模块,用于对所有算力任务执行时关联到的属性特征进行分类;
根据属性特征的分类,建立所有算力任务对应的统一属性特征自定义;
对所有计算中心的可用资源进行分类;及
根据可用资源的分类,建立所有计算中心对应的统一资源分类自定义。
在一些实施例中,任务调度模块,用于若待调度的算力任务为多个,则根据各算力任务的优先级确定优先级最高的算力任务为所述目标算力任务,以依次执行对各所述算力任务的调度。
在本示例性实施例中,如果接收到多个算力任务的调度指令,则可以根据预选定义的各算力任务的优先级,确定优先级最高的算力任务为所述目标算力任务,以依次执行对各所述算力任务的调度。
本公开提供一种计算机可读存储介质,其上存储有算力任务的调度程序,该算力任务的调度程序被处理器执行时,实现上述各实施例所述的算力任务的调度方法。
本公开提供一种服务器,包括存储器、处理器及存储在存储器上并可在处理器上运行的算力任务的调度程序,所述处理器执行所述算力任务的调度程序时,实现上述各实施例所述的算力任务的调度方法。
需要说明的是,在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得程序,然后将其存储在计算机存储器中。
应当理解,本公开的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本公开的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
在本公开的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”、“顺时针”、“逆时针”、“轴向”、“径向”、“周向”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本公开和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本公开的限制。
此外,本公开实施例中所使用的“第一”、“第二”等术语,仅用于描述目的,而不可以理解为指示或者暗示相对重要性,或者隐含指明本实施例中所指示的技术特征数量。由此,本公开实施例中限定有“第一”、“第二”等术语的特征,可以明确或者隐含地表示该实施例中包括至少一个该特征。在本公开的描述中,词语“多个”的含义是至少两个或者两个及以上,例如两个、三个、四个等,除非实施例中另有明确具体的限定。
在本公开中,除非实施例中另有明确的相关规定或者限定,否则实施例中出现的术语“安装”、“相连”、“连接”和“固定”等应做广义理解,例如,连接可以是固定连接,也可以是可拆卸连接,或成一体,可以理解的,也可以是机械连接、电连接等;当然,还可以是直接相连,或者通过中间媒介进行间接连接,或者可以是两个元件内部的连通,或者两个元件的相互作用关系。对于本领域的普通技术人员而言,能够根据具体的实施情况理解上述术语在本公开中的具体含义。
在本公开中,除非另有明确的规定和限定,第一特征在第二特征“上”或“下”可以是第一和第二特征直接接触,或第一和第二特征通过中间媒介间接接触。而且,第一特征在第二特征“之上”、“上方”和“上面”可是第一特征在第二特征正上方或斜上方,或仅仅表示第一特征水平高度高于第二特征。第一特征在第二特征“之下”、“下方”和“下面”可以是第一特征在第二特征正下方或斜下方,或仅仅表示第一特征水平高度小于第二特征。
尽管上面已经示出和描述了本公开的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本公开的限制,本领域的普通技术人员在本公开的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (9)

1.一种算力任务的调度方法,其特征在于,包括:
获取目标算力任务执行时关联到的属性特征及所有计算中心的调度资源;
根据所述目标算力任务的调度请求,基于分级调度策略,进行所述属性特征与各所述计算中心的调度资源间的分等级资源匹配,在所述所有计算中心中确定出符合所有等级资源匹配规则的目标计算中心;其中,所述属性特征至少包括目标算力任务的任务类型及目标算力任务执行时所需任务资源;
基于所述目标计算中心,调度所述目标算力任务;其中,所述分级调度策略包括:第一子调度策略、第二子调度策略及第三子调度策略;
所述第一子调度策略旨在根据所述目标算力任务的任务类型,在所有计算中心中确定出支持调度所述任务类型算力任务的一级计算中心;
所述第二子调度策略旨在根据所述一级计算中心的任务标签,在所述一级计算中心中确定出现阶段能够支持调度所述任务类型算力任务的二级计算中心;其中,所述任务标签用于标注计算中心现阶段能够支持调度算力任务的任务类型;
所述第三子调度策略旨在根据所述目标算力任务执行时所需任务资源,及各所述二级计算中心的剩余可用资源,进行资源匹配,确定出最佳匹配的目标计算中心。
2.根据权利要求1所述的算力任务的调度方法,其特征在于,所述根据所述目标算力任务执行时所需任务资源,及各所述二级计算中心的剩余可用资源,进行资源匹配,确定出最佳匹配的目标计算中心,包括:
根据所述目标算力任务执行时所需各类任务资源间的比重、各所述二级计算中心的剩余可用资源及各所述二级计算中心的总可用资源,确定各所述二级计算中心分别对应的总剩余资源利用率;
根据所述目标算力任务的调度请求,在各所述二级计算中心中确定出剩余资源满足所述目标算力任务的调度需求且总剩余资源利用率最佳匹配所述调度请求的计算中心为所述目标计算中心。
3.根据权利要求2所述的算力任务的调度方法,其特征在于,所述根据所述目标算力任务的调度请求,在各所述二级计算中心中确定出剩余资源满足所述目标算力任务的调度需求且总剩余资源利用率最佳匹配所述调度请求的计算中心为所述目标计算中心,包括:
若所述目标算力任务的调度请求为选择最大总剩余资源利用率的计算中心,则在剩余资源满足所述目标算力任务的调度需求的各所述二级计算中心中,确定出最大总剩余资源利用率的计算中心为所述目标计算中心;
若所述目标算力任务的调度请求为选择最小总剩余资源利用率的计算中心,则在剩余资源满足所述目标算力任务的调度需求的各所述二级计算中心中,确定出最小总剩余资源利用率的计算中心为所述目标计算中心。
4.根据权利要求3所述的算力任务的调度方法,其特征在于,所述根据所述目标算力任务执行时所需各类任务资源间的比重、各所述二级计算中心的剩余可用资源及各所述二级计算中心的总可用资源,确定各所述二级计算中心分别对应的总剩余资源利用率,包括:
基于各所述二级计算中心分别对应于任一类任务资源的剩余可用资源及分别对应于任一类任务资源的总可用资源,得到各所述二级计算中心分别对应于任一类任务资源的剩余资源利用率;
基于所述目标算力任务执行时所需各类任务资源间的比重,确定得到所述二级计算中心的所述总剩余资源利用率时,各类任务资源对应的剩余资源利用率间的权重分配;其中,所有二级计算中心中各类任务资源对应的剩余资源利用率间的权重分配相同;
根据各所述二级计算中心分别对应于所有任务资源的剩余资源利用率,及各类任务资源对应的剩余资源利用率间的权重分配,得到各所述二级计算中心分别对应的总剩余资源利用率。
5.根据权利要求1所述的算力任务的调度方法,其特征在于,所述获取目标算力任务执行时关联到的属性特征及所有计算中心的调度资源前,所述方法包括:
对所有算力任务执行时关联到的属性特征进行分类;
根据属性特征的分类,建立所有算力任务对应的统一属性特征自定义;
对所有计算中心的可用资源进行分类;
根据可用资源的分类,建立所有计算中心对应的统一资源分类自定义。
6.根据权利要求1所述的算力任务的调度方法,其特征在于,
若待调度的算力任务为多个,则根据各算力任务的优先级确定优先级最高的算力任务为所述目标算力任务,以依次执行对各所述算力任务的调度。
7.一种算力任务的调度装置,其特征在于,包括:
信息获取模块,用于获取目标算力任务执行时关联到的属性特征及所有计算中心的调度资源;
信息确定模块,用于根据所述目标算力任务的调度请求,基于分级调度策略,进行所述属性特征与各所述计算中心的调度资源间的分等级资源匹配,在所述所有计算中心中确定出符合所有等级资源匹配规则的目标计算中心;其中,所述属性特征至少包括目标算力任务的任务类型及目标算力任务执行时所需任务资源;
任务调度模块,用于基于所述目标计算中心,调度所述目标算力任务;其中,所述分级调度策略包括:第一子调度策略、第二子调度策略及第三子调度策略;
所述第一子调度策略旨在根据所述目标算力任务的任务类型,在所有计算中心中确定出支持调度所述任务类型算力任务的一级计算中心;
所述第二子调度策略旨在根据所述一级计算中心的任务标签,在所述一级计算中心中确定出现阶段能够支持调度所述任务类型算力任务的二级计算中心;其中,所述任务标签用于标注计算中心现阶段能够支持调度算力任务的任务类型;
所述第三子调度策略旨在根据所述目标算力任务执行时所需任务资源,及各所述二级计算中心的剩余可用资源,进行资源匹配,确定出最佳匹配的目标计算中心。
8.一种计算机可读存储介质,其特征在于,其上存储有算力任务的调度程序,该算力任务的调度程序被处理器执行时,实现权利要求1-6中任一项所述的算力任务的调度方法。
9.一种服务器,其特征在于,包括存储器、处理器及存储在存储器上并可在处理器上运行的算力任务的调度程序,所述处理器执行所述算力任务的调度程序时,实现权利要求1-6中任一项所述的算力任务的调度方法。
CN202310933669.5A 2023-07-27 2023-07-27 算力任务的调度方法、调度装置、存储介质及服务器 Active CN116643893B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310933669.5A CN116643893B (zh) 2023-07-27 2023-07-27 算力任务的调度方法、调度装置、存储介质及服务器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310933669.5A CN116643893B (zh) 2023-07-27 2023-07-27 算力任务的调度方法、调度装置、存储介质及服务器

Publications (2)

Publication Number Publication Date
CN116643893A CN116643893A (zh) 2023-08-25
CN116643893B true CN116643893B (zh) 2023-10-20

Family

ID=87643868

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310933669.5A Active CN116643893B (zh) 2023-07-27 2023-07-27 算力任务的调度方法、调度装置、存储介质及服务器

Country Status (1)

Country Link
CN (1) CN116643893B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116860723B (zh) * 2023-09-04 2023-11-21 合肥中科类脑智能技术有限公司 跨计算中心数据迁移方法
CN117648175B (zh) * 2024-01-30 2024-04-12 之江实验室 一种基于动态算法选择的业务执行方法、装置及电子设备

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110362407A (zh) * 2019-07-19 2019-10-22 中国工商银行股份有限公司 计算资源调度方法及装置
CN112256402A (zh) * 2020-10-30 2021-01-22 深圳供电局有限公司 一种云平台数据中心资源预测与调度方法及系统
CN112346859A (zh) * 2020-10-26 2021-02-09 北京市商汤科技开发有限公司 资源调度方法及装置、电子设备和存储介质
CN113590282A (zh) * 2021-07-19 2021-11-02 海宁奕斯伟集成电路设计有限公司 算力调度方法、系统、电子设备及计算机可读存储介质
CN115328663A (zh) * 2022-10-10 2022-11-11 亚信科技(中国)有限公司 基于PaaS平台进行资源调度的方法、装置、设备和存储介质
CN115562879A (zh) * 2022-12-06 2023-01-03 北京邮电大学 算力感知方法、装置、电子设备和存储介质
CN115914392A (zh) * 2022-11-14 2023-04-04 北京邮电大学 算力网络资源调度方法及系统
WO2023071172A1 (zh) * 2021-10-26 2023-05-04 上海商汤智能科技有限公司 任务调度方法、装置、设备、存储介质、计算机程序及计算机程序产品
WO2023098665A1 (zh) * 2021-11-30 2023-06-08 华为技术有限公司 任务处理方法及装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10298512B2 (en) * 2015-06-26 2019-05-21 Vmware, Inc. System and method for performing resource allocation for a host computer cluster
CN106991013B (zh) * 2017-04-18 2018-09-07 腾讯科技(深圳)有限公司 一种对资源请求进行处理的方法及装置
US11972301B2 (en) * 2021-04-13 2024-04-30 Microsoft Technology Licensing, Llc Allocating computing resources for deferrable virtual machines

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110362407A (zh) * 2019-07-19 2019-10-22 中国工商银行股份有限公司 计算资源调度方法及装置
CN112346859A (zh) * 2020-10-26 2021-02-09 北京市商汤科技开发有限公司 资源调度方法及装置、电子设备和存储介质
CN112256402A (zh) * 2020-10-30 2021-01-22 深圳供电局有限公司 一种云平台数据中心资源预测与调度方法及系统
CN113590282A (zh) * 2021-07-19 2021-11-02 海宁奕斯伟集成电路设计有限公司 算力调度方法、系统、电子设备及计算机可读存储介质
WO2023071172A1 (zh) * 2021-10-26 2023-05-04 上海商汤智能科技有限公司 任务调度方法、装置、设备、存储介质、计算机程序及计算机程序产品
WO2023098665A1 (zh) * 2021-11-30 2023-06-08 华为技术有限公司 任务处理方法及装置
CN115328663A (zh) * 2022-10-10 2022-11-11 亚信科技(中国)有限公司 基于PaaS平台进行资源调度的方法、装置、设备和存储介质
CN115914392A (zh) * 2022-11-14 2023-04-04 北京邮电大学 算力网络资源调度方法及系统
CN115562879A (zh) * 2022-12-06 2023-01-03 北京邮电大学 算力感知方法、装置、电子设备和存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
刘泽宁;李凯;吴连涛;王智;杨旸.多层次算力网络中代价感知任务调度算法.计算机研究与发展.2020,(09),全文. *
吕相文;袁家斌;张玉洁.云计算环境下多GPU资源调度机制研究.小型微型计算机系统.2016,(04),全文. *

Also Published As

Publication number Publication date
CN116643893A (zh) 2023-08-25

Similar Documents

Publication Publication Date Title
CN116643893B (zh) 算力任务的调度方法、调度装置、存储介质及服务器
US8037185B2 (en) Dynamic application placement with allocation restrictions, vertical stacking and even load distribution
US20200050935A1 (en) Deep learning model execution using tagged data
CN114356587B (zh) 算力任务跨区域调度方法、系统及设备
CN113886080B (zh) 高性能集群任务调度方法、装置、电子设备及存储介质
CN111930522A (zh) Gpu虚拟化和资源调度方法和装置
CN115292014A (zh) 图像渲染方法、装置和服务器
CN111796933A (zh) 资源调度方法、装置、存储介质和电子设备
CN114416343A (zh) 基于最大熵逆强化学习的无服务器计算资源配置方法
CN117687774A (zh) 用于算力调度的任务模型训练方法及算力调度方法和系统
CN117311973A (zh) 计算设备调度方法、装置、非易失性存储介质及电子设备
CN116302448B (zh) 任务调度方法和系统
CN115396411B (zh) 一种获取目标服务器的方法、装置、系统及介质
CN114997401A (zh) 自适应推理加速方法、装置、计算机设备和存储介质
CN113392249A (zh) 图文信息分类方法、图文分类模型训练方法、介质及设备
CN115514996B (zh) 一种直播转码机器的状态确定方法、装置及可读存储介质
CN112035643B (zh) 一种对话机器人能力复用的方法和装置
US20220036249A1 (en) System and Method for Ensemble Expert Diversification and Control Thereof
US11915114B2 (en) System and method for ensemble expert diversification
CN118245238B (zh) 异构算力设备选择方法、装置、设备、介质、产品及系统
US11823021B2 (en) System and method for ensemble expert diversification via bidding
CN113472552B (zh) 基于深度学习的vim选择方法、装置、计算设备及存储介质
US20230350722A1 (en) Apparatuses and methods for determining an interdependency between resources of a computing system
US20220036138A1 (en) System and Method for Ensemble Expert Diversification via Bidding and Control Thereof
CN117273332A (zh) 换电平台的信息处理方法、装置、存储介质及换电站

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant