CN116185606A - 一种资源调度方法和装置、电子设备和可读存储介质 - Google Patents

一种资源调度方法和装置、电子设备和可读存储介质 Download PDF

Info

Publication number
CN116185606A
CN116185606A CN202211629684.2A CN202211629684A CN116185606A CN 116185606 A CN116185606 A CN 116185606A CN 202211629684 A CN202211629684 A CN 202211629684A CN 116185606 A CN116185606 A CN 116185606A
Authority
CN
China
Prior art keywords
available
node
weight
nodes
resource request
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211629684.2A
Other languages
English (en)
Inventor
刘晓健
苏宝珠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202211629684.2A priority Critical patent/CN116185606A/zh
Publication of CN116185606A publication Critical patent/CN116185606A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • G06F9/4806Task transfer initiation or dispatching
    • G06F9/4843Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
    • G06F9/4881Scheduling strategies for dispatcher, e.g. round robin, multi-level priority queues
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • G06F9/505Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering the load
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/50Indexing scheme relating to G06F9/50
    • G06F2209/508Monitor
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种资源调度方法和装置、电子设备和可读存储介质,涉及资源调度技术领域。方法包括:获取训练任务的资源请求;确定资源请求对应的所有的可用节点;根据各个可用节点的类型,分别为各个可用节点的运行性能参数设置第一权重;根据各个可用节点的类型,分别为资源请求对应的待调度资源在各个可用节点的总资源中的占比,设置第二权重;基于第一权重和所述第二权重,确定资源请求对应的目标节点;将训练任务调度至目标节点运行。可用节点的运行性能参数、可用节点的类型均会直接影响训练任务在可用节点上的运行效率,由此确定的目标节点准确性更高,该训练任务在该目标节点上具有较高的运行效率。

Description

一种资源调度方法和装置、电子设备和可读存储介质
技术领域
本发明涉及资源调度技术领域,特别是涉及一种资源调度方法和装置、电子设备和可读存储介质。
背景技术
模型训练过程中,通常需要将训练任务调度至能为其提供训练资源的可用节点上运行。
目前,在为训练任务匹配可用节点的调度过程中,主要根据可用节点上可用资源的高低进行匹配。
然而,上述调度方法关注的调度因素较为单一,容易存在调度准确性差的问题。
发明内容
本发明提供一种资源调度方法和装置、电子设备和可读存储介质,旨在解决已有的调度方法关注的调度因素较为单一,存在调度准确性差的问题。
本发明的第一方面,提供一种资源调度方法,应用于数据集群,所述方法包括:
获取训练任务的资源请求;
确定所述资源请求对应的所有的可用节点;
根据各个所述可用节点的类型,分别为各个所述可用节点的运行性能参数设置第一权重;
根据各个所述可用节点的类型,分别为所述资源请求对应的待调度资源在各个所述可用节点的总资源中的占比,设置第二权重;
基于所述第一权重和所述第二权重,确定所述资源请求对应的目标节点;
将所述训练任务调度至所述目标节点运行。
本发明中,同时考虑了可用节点的类型、可用节点的运行性能参数以及资源请求对应的待调度资源在各个可用节点的总资源中的占比,可用节点的运行性能参数、可用节点的类型均会直接影响训练任务在可用节点上的运行效率,本发明基于与训练任务的运行效率紧密相关的多个调度因素,确定资源请求对应的目标节点,由此确定的目标节点准确性更高,将该训练任务调度至该目标节点运行,进而可以使得该训练任务在该目标节点上具有较高的运行效率。
可选的,一个所述可用节点的类型为管理及计算节点,或,一个所述可用节点的类型为纯计算节点;所述根据各个所述可用节点的类型,分别为各个所述可用节点的运行性能参数设置第一权重,包括:
在所述可用节点为管理及计算节点的情况下,为所述可用节点的运行性能参数设置第一子权重;
在所述可用节点为纯计算节点的情况下,为所述可用节点的运行性能参数设置第二子权重;所述第一子权重,大于所述第二子权重;
所述根据各个所述可用节点的类型,分别为所述资源请求对应的待调度资源在各个所述可用节点的总资源中的占比,设置第二权重,包括:
在所述可用节点为管理及计算节点的情况下,为所述资源请求对应的待调度资源在各个所述可用节点的总资源中的占比,设置第三子权重;
在所述可用节点为纯计算节点的情况下,为所述资源请求对应的待调度资源在各个所述可用节点的总资源中的占比,设置第四子权重;所述第三子权重,小于所述第四子权重;
所述第一子权重,大于所述第三子权重;所述第二子权重,小于所述第四子权重。
可选的,所述根据各个所述可用节点的类型,分别为各个所述可用节点的运行性能参数设置第一权重之前,所述方法还包括:
创建数据分析容器;
基于所述数据分析容器,分别获取各个所述可用节点的运行性能参数。
可选的,所述可用节点的运行性能参数,包括:所述可用节点在第一预设时长内的平均输入输出负载率、所述可用节点在第二预设时长内的平均内存利用率、所述可用节点在第三预设时长内的平均网络带宽利用率,三者中的至少一种。
可选的,所述基于所述第一权重和所述第二权重,确定所述资源请求对应的目标节点,包括:
在所述可用节点为管理及计算节点的情况下,用所述可用节点的运行性能参数乘以所述第一子权重,得到第一参数,并用所述资源请求对应的待调度资源在所述可用节点的总资源中的占比,乘以所述第三子权重,得到第二参数;
将所述第一参数和所述第二参数求和,得到所述管理及计算节点的调度加权值;
在所述可用节点为纯计算节点的情况下,用所述可用节点的运行性能参数乘以所述第二子权重,得到第三参数,并用所述资源请求对应的待调度资源在所述可用节点的总资源中的占比,乘以所述第四子权重,得到第四参数;
将所述第三参数和所述第四参数求和,得到所述纯计算节点的调度加权值;
从所述资源请求对应的所有的可用节点中,选择最小的所述调度加权值对应的可用节点,作为目标节点。
可选的,所述从所述资源请求对应的所有的可用节点中,选择最小的所述调度加权值对应的可用节点,作为目标节点,包括:
在最小的所述调度加权值对应的可用节点为管理及计算节点和纯计算节点两个节点的情况下,选择所述最小的所述调度加权值对应的纯计算节点,作为目标节点。
可选的,所述根据各个所述可用节点的类型,分别为各个所述可用节点的运行性能参数设置第一权重,包括:
在所述资源请求对应的所有的可用节点的总数量,大于或等于2的情况下,根据各个所述可用节点的类型,分别为各个所述可用节点的运行性能参数设置第一权重;
所述根据各个所述可用节点的类型,分别为所述资源请求对应的待调度资源在各个所述可用节点的总资源中的占比,设置第二权重,包括:
在所述资源请求对应的所有的可用节点的总数量,大于或等于2的情况下,根据各个所述可用节点的类型,分别为所述资源请求对应的待调度资源在各个所述可用节点的总资源中的占比,设置第二权重。
本发明的第二方面,提供一种资源调度装置,所述装置包括:
资源请求获取模块,用于获取训练任务的资源请求;
可用节点确定模块,用于确定所述资源请求对应的所有的可用节点;
第一权重设置模块,用于根据各个所述可用节点的类型,分别为各个所述可用节点的运行性能参数设置第一权重;
第二权重设置模块,用于根据各个所述可用节点的类型,分别为所述资源请求对应的待调度资源在各个所述可用节点的总资源中的占比,设置第二权重;
目标节点确定模块,用于基于所述第一权重和所述第二权重,确定所述资源请求对应的目标节点;
调度模块,用于将所述训练任务调度至所述目标节点运行。
本发明的第三方面,提供一种电子设备,包括:处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如任一前述的资源调度方法的步骤。
本发明的第四方面,提供一种可读存储介质,所述可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如任一前述的资源调度方法的步骤。
本发明中资源调度装置、电子设备、可读存储介质均具有与任一前述的资源调度方法相同或相似的有益效果。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1示出了本发明实施例中的一种资源调度方法的步骤流程图;
图2示出了本发明实施例中的一种资源调度方法的业务逻辑示意图;
图3示出了本发明实施例中的另一种资源调度方法的步骤流程示意图;
图4示出了本发明实施例中的一种资源调度装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1示出了本发明实施例中的一种资源调度方法的步骤流程图。参照图1所示,该资源调度方法可以包括如下步骤:
步骤101,获取训练任务的资源请求。
该训练任务可以包括深度学习的训练任务等。对于训练任务的类型等不作具体限定。
训练任务的资源请求待调度的资源可以包括至少一种资源,对于训练任务而言,此处的资源可以包括:CPU(central processing unit,中央处理)资源、GPU(graphicsprocessing unit,图形处理器)资源等,对于资源请求待调度的资源不作具体限定。
步骤102,确定所述资源请求对应的所有的可用节点。
资源请求对应的可用节点就是该数据集群中,能够满足该资源请求的节点。例如,资源请求中待调度的资源包括:2个GPU,那么,可用节点当前可用的GPU的数量需要大于或等于2。再例如,资源请求中待调度的资源包括:3个CPU,那么,可用节点当前可用的CPU的数量需要大于或等于3。
该步骤就是确定出数据集群中,所有的能够满足该资源请求的节点,作为该资源请求对应的所有的可用节点。
步骤103,根据各个所述可用节点的类型,分别为各个所述可用节点的运行性能参数设置第一权重。
具体的,发明人发现,现有技术中,调度方法关注的调度因素较为单一,容易存在调度准确性差的问题的主要原因在于:一方面不同类型的节点,在数据集群中扮演的角色不同,节点在提供训练任务的资源请求的同时,可能还需要承担其他的任务,而可能承担的其他任务和训练任务的执行效率息息相关,只考虑可用节点上可用资源的高低,而忽略了节点类型,导致调度准确性较差。另一方面,节点的运行性能参数对训练任务在该节点上的运行效率有很大影响,只考虑可用节点上可用资源的高低,而忽略了训练任务的运行过程的影响因素,导致调度准确性较差。
针对上述问题,该步骤中,同时考虑了可用节点的类型、可用节点的运行性能参数,上述两个因素均会直接影响训练任务在可用节点上的运行效率,基于与训练任务的运行效率紧密相关的多个调度因素,确定资源请求对应的目标节点,由此确定的目标节点准确性更高,将该训练任务调度至该目标节点运行,进而可以使得该训练任务在该目标节点上具有较高的运行效率。
该步骤就是根据可用节点的类型,在满足其类型的基础上,为可用节点的运行性能参数设置合理的权重。
可用节点的运行性能参数具体是指影响可用节点正常运行的性能参数。例如,可以包括:内存利用率等。
步骤104,根据各个所述可用节点的类型,分别为所述资源请求对应的待调度资源在各个所述可用节点的总资源中的占比,设置第二权重。
具体的,针对现有技术的上述问题,该步骤中,同时考虑了可用节点的类型、资源请求对应的待调度资源在各个可用节点的总资源中的占比,可用节点的类型、资源请求对应的待调度资源在各个可用节点的总资源中的占比均会直接影响训练任务在可用节点上的运行效率,该步骤基于与训练任务的运行效率紧密相关的多个调度因素,确定资源请求对应的目标节点,由此确定的目标节点准确性更高,将该训练任务调度至该目标节点运行,进而可以使得该训练任务在该目标节点上具有较高的运行效率。
该步骤就是根据可用节点的类型,在满足其类型的基础上,为前述资源请求对应的待调度资源在可用节点的总资源中的占比,设置合理的权重。
资源请求对应的待调度资源若包括GPU资源,该资源请求对应的待调度GPU资源在可用节点的总资源中的占比可以采用公式(1)计算。公式(1)为
Figure BDA0004001407200000061
其中,GPUdistribution为资源请求对应的待调度GPU资源在Nodej可用节点的总资源中的占比,JobGPUrequest为该资源请求对应的待调度GPU资源,NodejGPUallocatable为当前时刻该Nodej可用节点所能够提供的所有的GPU资源。
资源请求对应的待调度资源若包括CPU资源,该资源请求对应的待调度CPU资源在可用节点的总资源中的占比可以采用公式(2)计算。公式(2)为
Figure BDA0004001407200000071
其中,CPUdistribution为资源请求对应的待调度CPU资源在Nodej可用节点的总资源中的占比,JobCPUrequest为该资源请求对应的待调度CPU资源,NodejCPUallocatable为当前时刻该Nodej可用节点所能够提供的所有的CPU资源。
资源请求对应的待调度资源在可用节点的总资源中的占比,能够准确体现该资源请求对应的待调度资源在可用节点的总资源中的占比高低。
例如,1号资源请求对应的待调度资源包括:2个GPU和3个CPU。若在数据集群中,该1号资源请求对应所有的可用节点为可用节点A和可用节点B。其中,可用节点A当前时刻具有8个可用GPU和6个可用CPU。可用节点B当前时刻具有7个可用GPU和8个可用CPU。则,该1号资源请求对应的待调度GPU资源在可用节点A的总资源中的占比为:2/8=0.25,该1号资源请求对应的待调度CPU资源在可用节点A的总资源中的占比为:3/6=0.50。该1号资源请求对应的待调度GPU资源在可用节点B的总资源中的占比为:2/7=0.286,该1号资源请求对应的待调度CPU资源在可用节点B的总资源中的占比为:3/8=0.375。
步骤105,基于所述第一权重和所述第二权重,确定所述资源请求对应的目标节点。
基于前述第一权重和第二权重,从该资源请求在该数据集群的所有的可用节点中,在满足其类型的基础上,选择最适合运行该训练任务的目标节点。
步骤106,将所述训练任务调度至所述目标节点运行。
将该训练任务调度至目标节点运行,由于同时考虑了可用节点的类型、可用节点的运行性能参数以及资源请求对应的待调度资源在各个可用节点的总资源中的占比,可用节点的运行性能参数、可用节点的类型均会直接影响训练任务在可用节点上的运行效率,本发明基于与训练任务的运行效率紧密相关的多个调度因素,确定资源请求对应的目标节点,由此确定的目标节点准确性更高,将该训练任务调度至该目标节点运行,进而可以使得该训练任务在该目标节点上具有较高的运行效率。
可选的,一个可用节点的类型为管理及计算节点,或,一个可用节点的类型为纯计算节点。管理及计算节点具体是指有主服务运行的节点,而且该节点在满足主服务运行的情况下,还可以为训练任务提供可用资源,就是说管理及计算类型节点至少承担两种角色,一是主服务运行节点,另一个是训练任务提供可用资源提供节点。纯计算节点具体是指没有主服务运行,且主要为训练任务提供可用资源的节点,就是说纯计算节点通常只承担一种角色,即训练任务提供可用资源提供节点。前述步骤103可以包括:在可用节点为管理及计算节点的情况下,为该可用节点的运行性能参数设置第一子权重,在该可用节点为纯计算节点的情况下,为该可用节点的运行性能参数设置第二子权重,第一子权重,大于第二子权重。需要说明的是,第一子权重具体比第二子权重大多少不作具体限定。该步骤104可以包括:在该可用节点为管理及计算节点的情况下,为该资源请求对应的待调度资源在各个可用节点的总资源中的占比,设置第三子权重,在该可用节点为纯计算节点的情况下,为该资源请求对应的待调度资源在各个可用节点的总资源中的占比,设置第四子权重。第三子权重,小于第四子权重。第三子权重具体比第四子权重小多少也不作具体限定。同时,第一子权重,大于第三子权重。第二子权重,小于第四子权重。需要说明的是,第一子权重具体比第三子权重大多少不作具体限定,第二子权重具体比第四子权重小多少也不作具体限定。
具体的,在可用节点为管理及计算节点的情况下,为该可用节点的运行性能参数设置较大的权重,在该可用节点为纯计算节点的情况下,为该可用节点的运行性能参数设置较小的权重。由于管理及计算节点上运行有主服务,该可用节点不仅可以为训练任务提供可用资源,还需要保证主服务稳定运行,因此,为该可用节点的运行性能参数设置较大的权重,能够满足该可用节点对于性能参数有较高的要求。在可用节点为纯计算节点的情况下,由于纯计算节点上没有运行有主服务,该可用节点仅为训练任务提供可用资源,为其运行性能参数设置较小的权重,满足其对于运行性能参数的要求不突出的实际需求。
同时,在可用节点为管理及计算节点的情况下,为该可用节点设置的运行性能参数的第一子权重,大于为该资源请求对应的待调度资源在该可用节点的总资源中的占比的第三子权重。由于管理及计算节点上运行有主服务,需要优先保证主服务能够稳定运行,然后才考虑是否可以为训练任务提供资源。然而该主服务对于运行性能参数有较高的要求,才能保证主服务稳定运行,上述第一子权重大于第三子权重可以保障管理及计算节点上运行的主服务,能够稳定运行。
在可用节点为纯计算节点的情况下,为该可用节点设置的运行性能参数的第二子权重,小于为该资源请求对应的待调度资源在该可用节点的总资源中的占比的第四子权重。由于纯计算节点上没有运行有主服务,其主要作用在于为训练任务提供资源,上述第二子权重小于第四子权重与可用节点的实际需求更匹配。
例如,针对前述例子,在可用节点A为管理及计算节点的情况下,为可用节点A的运行性能参数设置的第一子权重可以为60%,为1号资源请求对应的待调度资源在可用节点A的总资源中的占比,设置的第三子权重为40%。在可用节点B为纯计算节点的情况下,为可用节点B的运行性能参数设置的第二子权重可以为30%,为1号资源请求对应的待调度资源在可用节点B的总资源中的占比,设置的第四子权重为70%。第一子权重60%,大于第二子权重30%,即为管理及计算功能的可用节点A的运行性能参数设置较大的第一子权重,满足该可用节点A对于性能参数有较高的要求,为纯计算功能的可用节点B的运行性能参数设置较小的第二子权重,以满足可用节点B对于运行性能参数的要求不突出的实际需求。为可用节点A的运行性能参数设置的第一子权重60%,大于为1号资源请求对应的待调度资源在可用节点A的总资源中的占比,设置的第三子权重40%,进而可以保障管理及计算类型的可用节点A上运行的主服务,能够稳定运行。为可用节点B的运行性能参数设置的第二子权重30%,小于为1号资源请求对应的待调度资源在可用节点B的总资源中的占比,设置的第四子权重70%,与纯计算类型的可用节点B的实际功能更为匹配。
可选的,前述步骤105可以包括:在该可用节点为管理及计算节点的情况下,用该可用节点的运行性能参数乘以前述的第一子权重,得到第一参数,并用该资源请求对应的待调度资源在该可用节点的总资源中的占比,乘以前述第三子权重,得到第二参数。将前述第一参数和前述第二参数求和,得到该管理及计算节点的调度加权值。
在该可用节点为纯计算节点的情况下,用该可用节点的运行性能参数乘以前述第二子权重,得到第三参数,并用该资源请求对应的待调度资源在该可用节点的总资源中的占比,乘以该第四子权重,得到第四参数。将前述第三参数和前述第四参数求和,得到该纯计算节点的调度加权值。
从该资源请求对应的所有的可用节点中,选择最小的调度加权值对应的可用节点,作为目标节点,进而选出了与资源请求匹配,且能够保证该训练任务执行效率较高的目标节点。
例如,针对前述例子,1号资源请求的所有的可用节点为可用节点A和可用节点B。可用节点A为管理及计算节点。可用节点B为纯计算节点。若可用节点A的运行性能参数为68%,可用节点B的运行性能参数为62%。可用节点A为管理及计算节点,可用节点A的运行性能参数的第一子权重为60%,1号资源请求对应的待调度资源在可用节点A的总资源中的占比的第三子权重为40%,具体的,1号资源请求对应的待调度GPU在可用节点A的总GPU资源中的占比的权重为15%,1号资源请求对应的待调度CPU在可用节点A的总CPU资源中的占比的权重为25%。可用节点B为纯计算节点,可用节点B的运行性能参数的第二子权重为30%,1号资源请求对应的待调度资源在可用节点B的总资源中的占比的第四子权重为70%,1号资源请求对应的待调度GPU在可用节点B的总GPU资源中的占比的权重为40%,具体的,1号资源请求对应的待调度CPU在可用节点B的总CPU资源中的占比的权重为30%。该1号资源请求对应的待调度GPU资源在可用节点A的总资源中的占比为:0.25,该1号资源请求对应的待调度CPU资源在可用节点A的总资源中的占比为:0.50。该1号资源请求对应的待调度GPU资源在可用节点B的总资源中的占比为:0.286,该1号资源请求对应的待调度CPU资源在可用节点B的总资源中的占比为:0.375。则,该可用节点A的调度加权值为:68%×60%+15%×0.25+25%×0.5=0.408+0.0375+0.125=0.5705。该可用节点B的调度加权值为:62%×30%+40%×0.286+30%×0.375=0.186+0.1144+0.1125=0.4129。则,1号资源请求对应的所有的可用节点中,调度加权值最小的是可用节点B,则1号资源请求对应的目标节点即为可用节点B,将1号资源请求对应的训练任务加载至可用节点B运行,不仅能够提供良好的资源,而且该训练任务在可用节点B上执行效率高。
需要说明的是,资源请求对应的各项待调度资源在可用节点对应的总资源中的占比的权重之和就等于前述的资源请求对应的待调度资源在可用节点的总资源中的占比的第二权重。例如,前述1号资源请求对应的待调度资源在可用节点A的总资源中的占比的第三子权重为40%,1号资源请求对应的待调度GPU在可用节点A的总GPU资源中的占比的权重为15%,1号资源请求对应的待调度CPU在可用节点A的总CPU资源中的占比的权重为25%,15%+25%=40%。
资源请求对应的待调度CPU在可用节点的总CPU资源中的占比的权重,与资源请求对应的待调度GPU在可用节点的总GPU资源中的占比的权重,两者的相对大小可以依据该训练任务所需的GPU或CPU的资源多少,以及该可用节点的类型来定。例如,若训练任务为图像处理相关的训练任务,图像处理相关的训练任务对于GPU有较高的要求,则,在可用节点为管理及计算节点的情况下,分配给资源请求对应的待调度CPU在可用节点的总CPU资源中的占比的权重,可以大于分配给资源请求对应的待调度GPU在可用节点的总GPU资源中的占比的权重,优先保障管理及计算节点上主服务的稳定运行。在可用节点为纯计算节点的情况下,分配给资源请求对应的待调度CPU在可用节点的总CPU资源中的占比的权重,可以小于分配给资源请求对应的待调度GPU在可用节点的总GPU资源中的占比的权重,充分利用纯计算节点上的GPU资源,以满足该图像处理的训练任务。
可选的,前述从该资源请求对应的所有的可用节点中,选择最小的调度加权值对应的可用节点,作为目标节点,可以包括:在最小的调度加权值对应的可用节点为管理及计算节点和纯计算节点两个节点的情况下,选择该最小的调度加权值对应的纯计算节点,作为目标节点。就是说,管理及计算可用节点中最小的调度加权值,和纯计算可用节点中最小的调度加权值,两者相等,则选择最小的加权调度值对应的纯计算节点作为目标节点,就是在管理及计算可用节点和纯计算可用节点,对于该训练任务而言均较为合适的情况下,优先选择纯计算可用节点,为管理及计算可用节点上的主服务的运行腾出资源,进而尽可能的保障管理及计算可用节点上的主服务稳定运行。
可选的,前述步骤102之前,该方法还可以包括:创建数据分析容器(influxdb_data_analysis),基于该数据分析容器,分别获取各个可用节点的运行性能参数。更为具体的,数据分析容器内置数据分析指令脚本,触发该数据分析容器内的数据分析指令运行,高效、准确获取各个可用节点的运行性能参数。
可选的,该数据分析容器可以创建在纯管理节点上,就是说该纯管理节点用于提供数据分析功能。
可选的,可用节点的运行性能参数,包括:该可用节点在第一预设时长内的平均输入输出负载率、该可用节点在第二预设时长内的平均内存利用率、该可用节点在第三预设时长内的平均网络带宽利用率,三者中的至少一种。此处的第一预设时长、第二预设时长、第三预设时长是否相等不作具体限定。且,第一预设时长、第二预设时长、第三预设时长根据实际需要设定,对其具体数值不作限定。例如,该第一预设时长、第二预设时长、第三预设时长三者相等,均可以为5分钟。上述平均输入输出负载率、平均内存利用率、平均网络带宽利用率能够准确体现该可用节点的实际运行情况。
具体的,可用节点通常存储挂载在某一磁盘上,可用节点的输入输出(I/O)负载率具体是指该可用节点所存储挂载的磁盘的输入输出负载率。平均输入输出负载率能够准确体现第一预设时长内可用节点存储挂载的磁盘的输入输出负载情况。可用节点在第一预设时长内的平均输入输出负载率的计算可以采用公式(3),公式(3):
Figure BDA0004001407200000121
其中,
Figure BDA0004001407200000122
为该可用节点在第一预设时长内的平均输入输出负载率,xi为该第一预设时长内,某一时刻该可用节点所存储挂载的磁盘的一个输入输出负载率,n1为第一预设时长内xi的总个数。
平均内存利用率能够较为准确的体现第二预设时长内可用节点的内存使用情况。该可用节点在第二预设时长内的平均内存利用率可以采用公式(4)计算。公式(4)为:
Figure BDA0004001407200000131
其中,MEM_UTIL为可用节点在第二预设时长内的平均内存利用率,mem_usedi为该第二预设时长内,该可用节点在某一时刻所使用的内存量,mem_total为该可用节点的内存总量,n2为第二预设时长内mem_usedi的总个数。
可用节点网络带宽利用率具体是指某一时刻,流入该可用节点的流率,和该时刻流出该节点的流率,两者的和,除以该时刻该可用节点的带宽。可用节点在第三预设时长内的平均网络带宽利用率可以准确体现该可用节点在第三预设时长内的网络带宽使用情况。可用节点在第三预设时长内的平均网络带宽利用率可以采用公式(5)计算。公式(5)为
Figure BDA0004001407200000132
Figure BDA0004001407200000133
其中,
Figure BDA0004001407200000134
为可用节点在第三预设时长内的平均网络带宽利用率,为rec_bytei为第三预设时长内,某一标准时间内,流入该可用节点的流率,trans_bytei为第三预设时长内,该标准时间内,流出该可用节点的流率,net_speed为第三预设时长内,在该标准时间内,该可用节点的带宽。n3为第三预设时长内rec_bytei的总个数,或者,n3为第三预设时长内trans_bytei的总个数。
需要说明的是,可用节点的运行性能参数的第一权重,等于该可用节点上各个运行性能参数的权重的总和。若运行性能参数包括:可用节点在第一预设时长内的平均输入输出负载率、该可用节点在第二预设时长内的平均内存利用率、该可用节点在第三预设时长内的平均网络带宽利用率。针对前述1号资源请求,则,该可用节点的调度加权值可以采用公式(6)计算,该公式(6)为:
Figure BDA0004001407200000141
Figure BDA0004001407200000142
Figure BDA0004001407200000143
其中,1号资源请求对应的待调度GPU在可用节点的总GPU资源中的占比的权重+1号资源请求对应的待调度CPU在可用节点的总CPU资源中的占比的权重=第二权重,可用节点的I/O权重+可用节点的内存权重+可用节点的带宽权重=第一权重。第一权重+第二权重=1。
例如,针对前述例子,若,可用节点B的I/O权重为13%,可用节点B的内存权重10%,可用节点B的带宽权重为7%。对于1号资源请求而言,可用节点B的调度加权值的计算可以采用公式(7),公式(7)为:
Figure BDA0004001407200000144
再例如,若为某一纯运算的可用节点设置的第一权重为40%,其中,该可用节点的I/O权重为20%,可用节点的内存权重10%,可用节点的带宽权重为10%。为该可用节点设置的第二权重为60%,其中,资源请求对应的待调度GPU在该可用节点的总GPU资源中的占比的权重为30%,资源请求对应的待调度CPU在该可用节点的总CPU资源中的占比的权重为30%,则,可用节点的调度加权值的可以采用公式(8),公式(8)为:
Figure BDA0004001407200000145
可选的,步骤105可以通过iresource-service业务服务容器进行。服务容器将各个可用节点的运行性能参数及其第一权重,资源请求对应的待调度资源在各个可用节点的总资源中的占比,及其第二权重进行计算,得到各个可用节点的调度加权值,然后从所有的可用节点中选出目标节点。
图2示出了本发明实施例中的一种资源调度方法的业务逻辑示意图。如,参照图2所示,本发明中,可以先采用influxdb_data_analysis获取各个可用节点的运行性能参数,可用节点的运行性能参数包括:可用节点在第一预设时长内的平均输入输出负载率、可用节点在第二预设时长内的平均内存利用率、可用节点在第三预设时长内的平均网络带宽利用率。iresource-service获取资源请求对应的待调度资源在各个可用节点的总资源中的占比,资源请求对应的待调度资源包括:GPU待调度资源和CPU待调度资源。iresource-service根据各个权重,计算得到各个可用节点的调度加权值。AI平台业务层可以根据各个可用节点的调度加权值,从该资源请求对应的所有的可用节点中选出目标节点,并将该资源请求对应的训练任务调度至该目标节点运行。
可选的,前述步骤102可以包括:在该资源请求对应的所有的可用节点的总数量,大于或等于2的情况下,根据各个可用节点的类型,分别为各个可用节点的运行性能参数设置第一权重,前述步骤103可以包括:在该资源请求对应的所有的可用节点的总数量,大于或等于2的情况下,根据各个可用节点的类型,分别为该资源请求对应的待调度资源在各个可用节点的总资源中的占比,设置第二权重。就是说,只是在该资源请求对应的所有的可用节点为多个的情况下,才执行上述步骤102和步骤103,在该资源请求对应的所有的可用节点为1个的情况下,不执行上述步骤102和步骤103,可以减少数据集群的资源开销。更为具体的,在该资源请求对应的所有的可用节点的总数量,大于或等于2的情况下,才启动influxdb_data_analysis,才采用influxdb_data_analysis获取各个可用节点的运行性能参数,才进行后续的调度加权值的计算等,无需一直启动influxdb_data_analysis等,能够减小对数据集群的性能影响。
图3示出了本发明实施例中的另一种资源调度方法的步骤流程示意图。可选的,参照图3所示,可以在任务管理页面获取该训练任务的资源请求,然后先进行资源判断,在数据集群的资源不足的情况下,在任务管理页面提示资源不足。在数据集群的资源足够的情况下,可以先确认该训练任务的资源调度请求是否指定节点,若是,将该训练任务调度至该指定节点,否则,在该资源请求对应的所有的可用节点的总数量为1个的情况下,将该训练任务调度至该唯一的可用节点,在该资源请求对应的所有的可用节点的总数量大于或等于2的情况下,执行本方法的后续步骤。
图4示出了本发明实施例中的一种资源调度装置的结构示意图。本发明还提供一种资源调度装置,应用于数据集群,参照图4所示,该装置可以包括:
资源请求获取模块401,用于获取训练任务的资源请求;
可用节点确定模块402,用于确定所述资源请求对应的所有的可用节点;
第一权重设置模块403,用于根据各个所述可用节点的类型,分别为各个所述可用节点的运行性能参数设置第一权重;
第二权重设置模块404,用于根据各个所述可用节点的类型,分别为所述资源请求对应的待调度资源在各个所述可用节点的总资源中的占比,设置第二权重;
目标节点确定模块405,用于基于所述第一权重和所述第二权重,确定所述资源请求对应的目标节点;
调度模块406,用于将所述训练任务调度至所述目标节点运行。
可选的,一个所述可用节点的类型为管理及计算节点,或,一个所述可用节点的类型为纯计算节点;第一权重设置模块403,包括:
第一子权重设置子模块,用于在所述可用节点为管理及计算节点的情况下,为所述可用节点的运行性能参数设置第一子权重;
第二子权重设置子模块,用于在所述可用节点为纯计算节点的情况下,为所述可用节点的运行性能参数设置第二子权重;所述第一子权重,大于所述第二子权重;
第二权重设置模块404,包括:
第三子权重设置子模块,用于在所述可用节点为管理及计算节点的情况下,为所述资源请求对应的待调度资源在各个所述可用节点的总资源中的占比,设置第三子权重;
第四子权重设置子模块,用于在所述可用节点为纯计算节点的情况下,为所述资源请求对应的待调度资源在各个所述可用节点的总资源中的占比,设置第四子权重;所述第三子权重,小于所述第四子权重;
所述第一子权重,大于所述第三子权重;所述第二子权重,小于所述第四子权重。
可选的,所述调度装置还包括:
数据分析容器创建模块,用于创建数据分析容器;
运行性能参数获取模块,用于基于所述数据分析容器,分别获取各个所述可用节点的运行性能参数。
可选的,所述可用节点的运行性能参数,包括:所述可用节点在第一预设时长内的平均输入输出负载率、所述可用节点在第二预设时长内的平均内存利用率、所述可用节点在第三预设时长内的平均网络带宽利用率,三者中的至少一种。
可选的,目标节点确定模块405,包括:
第一计算子模块,用于在所述可用节点为管理及计算节点的情况下,用所述可用节点的运行性能参数乘以所述第一子权重,得到第一参数,并用所述资源请求对应的待调度资源在所述可用节点的总资源中的占比,乘以所述第三子权重,得到第二参数;
调度加权值第一确定子模块,用于将所述第一参数和所述第二参数求和,得到所述管理及计算节点的调度加权值;
第二计算子模块,用于在所述可用节点为纯计算节点的情况下,用所述可用节点的运行性能参数乘以所述第二子权重,得到第三参数,并用所述资源请求对应的待调度资源在所述可用节点的总资源中的占比,乘以所述第四子权重,得到第四参数;
调度加权值第二确定子模块,用于将所述第三参数和所述第四参数求和,得到所述纯计算节点的调度加权值;
目标节点确定子模块,用于从所述资源请求对应的所有的可用节点中,选择最小的所述调度加权值对应的可用节点,作为目标节点。
可选的,目标节点确定子模块,包括:
目标节点确定单元,用于在最小的所述调度加权值对应的可用节点为管理及计算节点和纯计算节点两个节点的情况下,选择所述最小的所述调度加权值对应的纯计算节点,作为目标节点。
可选的,第一权重设置模块,包括:
第一权重设置子模块,用于在所述资源请求对应的所有的可用节点的总数量,大于或等于2的情况下,根据各个所述可用节点的类型,分别为各个所述可用节点的运行性能参数设置第一权重;
第二权重设置模块,包括:
第二权重设置子模块,用于在所述资源请求对应的所有的可用节点的总数量,大于或等于2的情况下,根据各个所述可用节点的类型,分别为所述资源请求对应的待调度资源在各个所述可用节点的总资源中的占比,设置第二权重。
该资源调度装置与任一前述的资源调度方法具有相同或相似的有益效果,可以相互参照,为了避免重复,此处不再赘述。
本发明还提供一种电子设备,电子设备包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现任一前述的资源调度方法的步骤。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
存储器可以包括随机存取存储器(Random Access Memory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
本发明实施例还提供一种可读存储介质,所述可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现任一前述的资源调度方法的步骤。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,这些均属于本发明的保护之内。

Claims (10)

1.一种资源调度方法,其特征在于,应用于数据集群,,所述方法包括:
获取训练任务的资源请求;
确定所述资源请求对应的所有的可用节点;
根据各个所述可用节点的类型,分别为各个所述可用节点的运行性能参数设置第一权重;
根据各个所述可用节点的类型,分别为所述资源请求对应的待调度资源在各个所述可用节点的总资源中的占比,设置第二权重;
基于所述第一权重和所述第二权重,确定所述资源请求对应的目标节点;
将所述训练任务调度至所述目标节点运行。
2.根据权利要求1所述的资源调度方法,其特征在于,一个所述可用节点的类型为管理及计算节点,或,一个所述可用节点的类型为纯计算节点;所述根据各个所述可用节点的类型,分别为各个所述可用节点的运行性能参数设置第一权重,包括:
在所述可用节点为管理及计算节点的情况下,为所述可用节点的运行性能参数设置第一子权重;
在所述可用节点为纯计算节点的情况下,为所述可用节点的运行性能参数设置第二子权重;所述第一子权重,大于所述第二子权重;
所述根据各个所述可用节点的类型,分别为所述资源请求对应的待调度资源在各个所述可用节点的总资源中的占比,设置第二权重,包括:
在所述可用节点为管理及计算节点的情况下,为所述资源请求对应的待调度资源在各个所述可用节点的总资源中的占比,设置第三子权重;
在所述可用节点为纯计算节点的情况下,为所述资源请求对应的待调度资源在各个所述可用节点的总资源中的占比,设置第四子权重;所述第三子权重,小于所述第四子权重;
所述第一子权重,大于所述第三子权重;所述第二子权重,小于所述第四子权重。
3.根据权利要求1或2所述资源调度方法,其特征在于,所述根据各个所述可用节点的类型,分别为各个所述可用节点的运行性能参数设置第一权重之前,所述方法还包括:
创建数据分析容器;
基于所述数据分析容器,分别获取各个所述可用节点的运行性能参数。
4.根据权利要求3所述的资源调度方法,其特征在于,所述可用节点的运行性能参数,包括:所述可用节点在第一预设时长内的平均输入输出负载率、所述可用节点在第二预设时长内的平均内存利用率、所述可用节点在第三预设时长内的平均网络带宽利用率,三者中的至少一种。
5.根据权利要求2所述的资源调度方法,其特征在于,所述基于所述第一权重和所述第二权重,确定所述资源请求对应的目标节点,包括:
在所述可用节点为管理及计算节点的情况下,用所述可用节点的运行性能参数乘以所述第一子权重,得到第一参数,并用所述资源请求对应的待调度资源在所述可用节点的总资源中的占比,乘以所述第三子权重,得到第二参数;
将所述第一参数和所述第二参数求和,得到所述管理及计算节点的调度加权值;
在所述可用节点为纯计算节点的情况下,用所述可用节点的运行性能参数乘以所述第二子权重,得到第三参数,并用所述资源请求对应的待调度资源在所述可用节点的总资源中的占比,乘以所述第四子权重,得到第四参数;
将所述第三参数和所述第四参数求和,得到所述纯计算节点的调度加权值;
从所述资源请求对应的所有的可用节点中,选择最小的所述调度加权值对应的可用节点,作为目标节点。
6.根据权利要求5所述的资源调度方法,其特征在于,所述从所述资源请求对应的所有的可用节点中,选择最小的所述调度加权值对应的可用节点,作为目标节点,包括:
在最小的所述调度加权值对应的可用节点为管理及计算节点和纯计算节点两个节点的情况下,选择所述最小的所述调度加权值对应的纯计算节点,作为目标节点。
7.根据权利要求3所述的资源调度方法,其特征在于,所述根据各个所述可用节点的类型,分别为各个所述可用节点的运行性能参数设置第一权重,包括:
在所述资源请求对应的所有的可用节点的总数量,大于或等于2的情况下,根据各个所述可用节点的类型,分别为各个所述可用节点的运行性能参数设置第一权重;
所述根据各个所述可用节点的类型,分别为所述资源请求对应的待调度资源在各个所述可用节点的总资源中的占比,设置第二权重,包括:
在所述资源请求对应的所有的可用节点的总数量,大于或等于2的情况下,根据各个所述可用节点的类型,分别为所述资源请求对应的待调度资源在各个所述可用节点的总资源中的占比,设置第二权重。
8.一种资源调度装置,其特征在于,包括:
资源请求获取模块,用于获取训练任务的资源请求;
可用节点确定模块,用于确定所述资源请求对应的所有的可用节点;
第一权重设置模块,用于根据各个所述可用节点的类型,分别为各个所述可用节点的运行性能参数设置第一权重;
第二权重设置模块,用于根据各个所述可用节点的类型,分别为所述资源请求对应的待调度资源在各个所述可用节点的总资源中的占比,设置第二权重;
目标节点确定模块,用于基于所述第一权重和所述第二权重,确定所述资源请求对应的目标节点;
调度模块,用于将所述训练任务调度至所述目标节点运行。
9.一种电子设备,其特征在于,包括:处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1-7中任一所述的资源调度方法的步骤。
10.一种可读存储介质,其特征在于,所述可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如权利要求1-7中任一所述的资源调度方法的步骤。
CN202211629684.2A 2022-12-15 2022-12-15 一种资源调度方法和装置、电子设备和可读存储介质 Pending CN116185606A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211629684.2A CN116185606A (zh) 2022-12-15 2022-12-15 一种资源调度方法和装置、电子设备和可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211629684.2A CN116185606A (zh) 2022-12-15 2022-12-15 一种资源调度方法和装置、电子设备和可读存储介质

Publications (1)

Publication Number Publication Date
CN116185606A true CN116185606A (zh) 2023-05-30

Family

ID=86445286

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211629684.2A Pending CN116185606A (zh) 2022-12-15 2022-12-15 一种资源调度方法和装置、电子设备和可读存储介质

Country Status (1)

Country Link
CN (1) CN116185606A (zh)

Similar Documents

Publication Publication Date Title
CN111427679B (zh) 面向边缘计算的计算任务调度方法、系统、装置
CN109561148A (zh) 边缘计算网络中基于有向无环图的分布式任务调度方法
CN109788046B (zh) 一种基于改进蜂群算法的多策略边缘计算资源调度方法
CN113326126A (zh) 任务处理方法、任务调度方法、装置及计算机设备
CN113835865B (zh) 一种任务部署方法和装置、电子设备和存储介质
CN111131486B (zh) 执行节点的负载调节方法、装置、服务器及存储介质
WO2023124947A1 (zh) 一种任务处理方法、装置及相关设备
CN113515382B (zh) 云资源的分配方法、装置、电子设备及存储介质
CN115134371A (zh) 包含边缘网络算力资源的调度方法、系统、设备及介质
CN109510869A (zh) 一种基于边缘计算的物联网服务动态卸载方法及装置
CN109656713B (zh) 一种基于边缘计算框架的容器调度方法
CN116263701A (zh) 算力网络任务调度方法、装置、计算机设备及存储介质
CN116700920A (zh) 云原生混合部署集群资源调度方法及装置
CN114035895A (zh) 一种基于虚拟服务计算能力的全局负载均衡方法和装置
CN115437781B (zh) 一种gpu资源管理方法及系统
CN116185606A (zh) 一种资源调度方法和装置、电子设备和可读存储介质
US20070150907A1 (en) Scheduling method for remote object procedure call and system thereof
CN115361285B (zh) 实现离在线业务混合部署的方法、装置、设备及介质
CN115309520A (zh) 任务迁移方法、装置、电子设备及存储介质
CN114327925A (zh) 一种电力数据实时计算调度优化方法及系统
CN114138453A (zh) 一种适合边缘计算环境的资源优化分配方法与系统
CN115344359A (zh) 算力资源分配方法、装置、计算机可读存储介质及设备
CN112156453A (zh) 实例自适应调整方法、装置、计算机可读存储介质及设备
CN117707797B (zh) 基于分布式云平台的任务调度方法、装置及相关设备
CN113407297B (zh) 容器管理方法、装置及计算设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination