CN114356587A - 算力任务跨区域调度方法、系统及设备 - Google Patents

算力任务跨区域调度方法、系统及设备 Download PDF

Info

Publication number
CN114356587A
CN114356587A CN202210263769.7A CN202210263769A CN114356587A CN 114356587 A CN114356587 A CN 114356587A CN 202210263769 A CN202210263769 A CN 202210263769A CN 114356587 A CN114356587 A CN 114356587A
Authority
CN
China
Prior art keywords
weight
regional
cpu
resource information
resource
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210263769.7A
Other languages
English (en)
Other versions
CN114356587B (zh
Inventor
王伟华
刘井山
吴政
彭文藻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Gradient Cloud Technology Beijing Co ltd
Original Assignee
Gradient Cloud Technology Beijing Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Gradient Cloud Technology Beijing Co ltd filed Critical Gradient Cloud Technology Beijing Co ltd
Priority to CN202210263769.7A priority Critical patent/CN114356587B/zh
Publication of CN114356587A publication Critical patent/CN114356587A/zh
Application granted granted Critical
Publication of CN114356587B publication Critical patent/CN114356587B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明提供了一种算力任务跨区域调度方法、系统及设备,该方法包括:定期获取区域集群资源信息,并存储;所述区域集群资源信息至少包括资源属性;配置各个资源属性的权重比例;获取算力任务重的资源配置要求,基于区域集群资源信息及所述权重比例,计算算力任务在各区域中的综合权重值;基于所述综合权重值,确定与所述算力任务对应的最佳匹配区域。本方案通过周期获取区域的资源信息,实现根据区域资源的实时动态匹配,实现根据算力任务的资源配置智能地匹配算力网络中的最优区域的目的。

Description

算力任务跨区域调度方法、系统及设备
技术领域
本发明涉及计算机资源调度领域,尤其涉及处理算力任务在跨域算力中心之间匹配的方法及策略,特别涉及一种算力任务的跨区域调度方法、系统及设备。
背景技术
云计算是近几年IT产业界和学术界研究的热点。云计算的不断成熟使得云数据中心变得越来越重要和复杂。虚拟化技术的发展使单个物理主机可以同时运行多个虚拟机,这使得任务计算所要求的资源可以按需分配给用户,以满足用户的多样性、动态性的需求。目前基于云计算的算力网络中,节点之间缺乏协同,计算资源利用率低。一方面,单一的计算节点资源受限,难以有效快速处理计算任务,特别是对于一些计算密集型的任务,可能导致计算节点负载重、计算任务处理时间长的问题;另一方面,虽然计算资源呈现出泛在部署的趋势,但是计算节点之间,以及计算节点与云计算节点之间缺乏有效协同机制,计算任务的分配与调度机制尚不完善,造成计算资源利用率低。
在目前的现有技术中个,算力任务在算力网络中的调派只能在配置人员指定区域流转,无法根据区域资源做实时变动。因此,如何基于区域的资源信息,实时根据区域资源合理的调度任务,并且及时确定最优计算区域,成为目前亟待解决的问题。
发明内容
有鉴于此,本发明实施例提供一种算力任务跨区域调度方法、系统及设备,本方案通过周期获取区域的资源信息,实现根据区域资源的实时动态匹配,并且在区域资源满足算力任务的同时,计算出最优区域。具体而言,本发明提供了如下技术方案:
一方面,本发明提供了一种算力任务跨区域调度方法,该方法包括:
步骤1、定期获取区域集群资源信息,并存储;所述区域集群资源信息至少包括资源属性;
步骤2、配置各个资源属性的权重比例;配置各分中心的优先因子;
步骤3、基于步骤1中的区域集群资源的最新记录及步骤2中的优先因子,确定算力任务的资源要求与分中心的区域集群资源的最新记录是否匹配,当匹配时,获取算力任务中的资源配置要求,结合匹配的区域集群资源对应的权重比例,计算算力任务在各区域中的综合权重值;
步骤4、基于所述综合权重值,确定与所述算力任务对应的最佳匹配分中心。
优选的,所述步骤1中,定期获取通过以下方式:
调用区域的资源集群的查询接口;
查询接口返回集群资源信息;
将所述集群资源信息存储在数据库中的集群资源信息表;
所述集群资源信息数据格式为:
{"payload":{"resouces":{"nodeName":"nodeName","ip":"ip","status":"status","capacity":{"cpu","memory"},"allocated":{"cpu","memory"}}}}
其中,capacity表示资源总容量,allocated为已使用资源容量,nodeName为节点名称,status为节点状态,payload表示一种用json格式进行数据传输的方式,resources表示集群资源信息的集合,memory表示内存大小。
优选的,所述步骤2中,所述集群资源信息表中记录的资源信息,以区域中心id和资源属性编码作为联合主键。
优选的,所述步骤2中,所述权重比例及优先因子的配置依据为:
各个属性在算力任务中依赖的程度的评估,以及分中心重要程度和访问频率的评估。
优选的,所述权重比例包括cpu权重比例,所述cpu权重比例的计算方式为:
(capacitycpu–requesetcpu * 10 / capacitycpu) * weightcpu
其中,capacitycpu表示cpu的分中心资源总量,requesetcpu表示当前已经被占用的资源数,weightcpu表示cpu的权重值。
优选的,所述步骤3中,所述综合权重值的计算方式为:
(cpuweight+gpuweight+shmweight+memoryweight)*优先因子
其中,cpuweight表示cpu的权重比例,gpuweight表示gpu的权重比例,shmweight表示共享内存权重,memoryweight表示内存权重。
优选的,所述步骤4进一步包括:
以获取到的综合权重值最高的区域作为最佳匹配区域;或者
当多个区域对应的综合权重值相等时,以随机方式确定最佳匹配区域。
另一方面,本发明还提供了一种算力任务跨区域调度系统,该系统包括:多个区域算力分中心、调度模块、存储模块;
所述多个区域算力分中心与所述调度模块连接,所述调度模块与所述存储模块连接;
所述调度模块包括:
资源信息获取单元,用于定期获取区域集群资源信息,并存储至所述存储模块;所述区域集群资源信息至少包括资源属性;
权重配置单元,用于配置各个资源属性的权重比例,配置各区域算力分中心的优先因子;
综合权重计算单元,用于获取算力任务重的资源配置要求,基于区域集群资源信息及所述权重比例,计算算力任务在各区域中的综合权重值;
基于区域集群资源信息的最新记录及优先因子,确定算力任务的资源要求与区域算力分中心的区域集群资源的最新记录是否匹配,当匹配时,获取算力任务中的资源配置要求,结合匹配的区域集群资源对应的权重比例,计算算力任务在各区域算力分中心的综合权重值;
区域匹配单元,用于基于所述综合权重值,确定与所述算力任务对应的最佳匹配区域。
优选的,所述区域匹配单元中,以获取到的综合权重值最高的区域算力分中心作为最佳匹配区域;或者
当多个区域算力分中心对应的综合权重值相等时,以随机方式确定最佳匹配区域。
优选的,所述资源信息获取单元与各区域算力分中心的查询接口连接,以调用区域的资源集群的查询接口,获取区域集群资源信息。
优选的,所述资源属性包括cpu(即中央处理器)、gpu(即图形处理器)、华为网络处理器NPU(即网络处理器)、mlu(即ai训练卡)、memory(即内存)、shm(即共享内存)等。该些资源属性反应出区域集群资源中对应使用的该些设备或模块的型号、使用要求等,以反应出区域集群中的设备的特性,从而便于后续的信息的对应和筛选。
又一方面,本发明还提供了一种算力任务跨区域调度设备,所述设备包括存储器及处理器,所述处理器可以调用所述存储器中的计算机指令,以执行如上所述的算力任务跨区域调度方法。
与现有技术相比,本发明的技术方案通过周期获取区域的资源信息,实现根据区域资源的实时动态匹配,并且在保证了区域资源满足算力任务的同时,计算出最优区域,实现根据算力任务的资源配置智能地匹配算力网络中的最优区域的目的。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本发明实施例的系统结构图;
图2为本发明实施例的方法流程图。
具体实施方式
下面结合附图对本发明实施例进行详细描述。应当明确,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
本领域技术人员应当知晓,下述具体实施例或具体实施方式,是本发明为进一步解释具体的发明内容而列举的一系列优化的设置方式,而该些设置方式之间均是可以相互结合或者相互关联使用的,除非在本发明明确提出了其中某些或某一具体实施例或实施方式无法与其他的实施例或实施方式进行关联设置或共同使用。同时,下述的具体实施例或实施方式仅作为最优化的设置方式,而不作为限定本发明的保护范围的理解。
如图1所示,在一个具体的实施例中,本发明的方案实施步骤如下:
第一步:
我们可以通过例如Java建立的后台定时任务默认以例如30s/次或者60s/次等的执行频率,调用区域的资源集群接口获取集群资源信息,该接口可以是例如http/https接口。查询接口返回json格式的数据:
{"payload":{"resouces":{"nodeName":"nodeName","ip":"ip","status":"status","capacity":{"cpu":"10","memory":"20000"},"allocated":{"cpu":"2","memory":"10000"}}}},其中capacity表示资源总容量,为map类型数据,该数据的key可以设置为"cpu"、"memory"等关键字,value为容量值;allocated为已使用资源容量,格式定义与capacity相同,nodeName为节点名称,status为节点状态,payload表示一种用json格式进行数据传输的方式,resources表示集群资源信息的集合,memory表示内存大小。
在一个优选的实施方式中,在进行策略调度时,根据更新时间进行排序,取最近时间的集群资源信息作为依据,进行后续的调度和计算。定时任务的执行频率支持可配置,配置文件中对应source_cron的值,如果未配置,默认为60s/次。集群资源信息包括集群ip地址、节点地址、cpu总量/已经使用量、gpu总量/已经使用量、内存总量/已经使用量等信息。接口返回的资源信息存储在mysql数据库的集群资源信息表,资源信息记录以区域中心id和资源属性编码做联合主键,最新数据会覆盖原来的记录。策略调度时根据区域中心id查询到数据后按照下面第三步的具体方式做计算。
第二步:
调度中心会给各个资源属性设置权重比例,资源属性包括:cpu(即中央处理器)、gpu(即图形处理器)、华为网络处理器NPU(即网络处理器)、mlu(即ai训练卡)、memory(即内存)、shm(即共享内存)等,权重比例的取值范围优选设置为0-1之间,精度支持小数点后2位。然后调度中心会给每个分中心需要配置优先因子,优先因子的取值范围优选设置为0-1之间,精度支持小数点后2位,数据存储在mysql数据库中的分中心表中,以weights列表示优先因子。权重比例及优先因子的取值依据来源于2点。1:预先对各个属性在算力任务中依赖的程度的评估;2:分中心重要程度及访问频率的评估。权重比例及优先因子的配置均属于静态配置,在任务调度时均可直接查询使用。
第三步:
解析算力任务中的资源配置,包括cpu的大小要求、gpu的类型及大小要求、内存的大小、shm的大小信息。调度步骤:首先根据算力任务中的分中心id获取到第一步中区域集群资源的最新记录以及第二步中的分中心优先因子,其次对比计算算力任务中的资源要求与分中心的资源最新纪录是否匹配,number(算力任务) <= source(分中心资源记录)即满足调度需求,再次根据资源id获取到第二步中资源的权重比例weight(rs),最后计算综合权重值。
cpu权重比例(cpuweight)属性的权重公式为:
(capacitycpu–requesetcpu * 10 / capacitycpu) * weightcpu
说明:capacitycpu表示cpu的分中心资源总量,requesetcpu表示当前已经被占用的资源数,weightcpu表示cpu的权重值。
在更为优选的实施方式中,gpu、shm、memory的权重比例属性的权重求取方式,可以参考cpu对应的权重公式,具体如下:
对于gpu权重比例(gpuweight)属性的权重公式为:
(capacitygpu–requesetgpu * 10 / capacitygpu) * weightgpu
说明:capacitygpu表示gpu的分中心资源总量,requesetgpu表示当前已经被占用的资源数,weightgpu表示gpu的权重值。
对于shm权重比例(shmweight)属性的权重公式为:
(capacityshm–requesetshm * 10 / capacityshm) * weightshm
说明:capacityshm表示shm的分中心资源总量,requesetshm表示当前已经被占用的资源数,weightshm表示shm的权重值。
对于memory权重比例(memoryweight)属性的权重公式为:
(capacitymemory–requesetmemory * 10 / capacitymemory) * weightmemory
说明:capacitymemory表示memory的分中心资源总量,requesetmemory表示当前已经被占用的资源数,weightmemory表示memory的权重值。
基于上述cpu等权重,可以通过以下方式计算综合权重:
(cpuweight+gpuweight+shmweight+memoryweight)*优先因子
其中,cpuweight表示中央处理器属性权重,gpuweight表示图形处理器权重,shmweight表示共享内存权重,memoryweight表示内存权重。其中,cpuweight、gpuweight、shmweight、memoryweight的计算方式还可以采用其他的权重计算方式,此处不再赘述。
第四步:
获取第三步中的综合权重的最高值,然后将算力任务调派到最高权重对应的区域的分中心。当多个区域对应的综合权重值相等时,以随机方式确定最佳匹配区域。
在又一个具体的实施例中,本发明的方案还可以通过系统的方式来实现,该算力任务跨区域调度系统可以配置为:多个区域算力分中心、调度模块、存储模块;
所述多个区域算力分中心与所述调度模块连接,所述调度模块与所述存储模块连接;
所述调度模块包括:
资源信息获取单元,用于定期获取区域集群资源信息,并存储至所述存储模块;所述区域集群资源信息至少包括资源属性;
权重配置单元,用于配置各个资源属性的权重比例,配置各区域算力分中心的优先因子;
综合权重计算单元,用于获取算力任务重的资源配置要求,基于区域集群资源信息及所述权重比例,计算算力任务在各区域中的综合权重值;
基于区域集群资源信息的最新记录及优先因子,确定算力任务的资源要求与区域算力分中心的区域集群资源的最新记录是否匹配,当匹配时,获取算力任务中的资源配置要求,结合匹配的区域集群资源对应的权重比例,计算算力任务在各区域算力分中心的综合权重值;
区域匹配单元,用于基于所述综合权重值,确定与所述算力任务对应的最佳匹配区域。
优选的,所述区域匹配单元中,以获取到的综合权重值最高的区域算力分中心作为最佳匹配区域;或者
当多个区域算力分中心对应的综合权重值相等时,以随机方式确定最佳匹配区域。
优选的,所述资源信息获取单元与各区域算力分中心的查询接口连接,以调用区域的资源集群的查询接口,获取区域集群资源信息。
优选的,所述资源属性可以是对应的CPU、GPU、网络处理器(NPU)、ai训练卡、内存、共享内存等,基于这些资源属性,可以反应出区域集群资源的具体情况及处理能力、算力等,例如,某区域资源属性可以包括中央处理器-cpu、英伟达图形处理器-nvidia.com/gpu、华为网络处理器-npu.huawei.com/NPU、寒武纪ai训练卡-cambricon.com/mlu、内存-memory、共享内存-shm等。
对于资源信息获取单元,以一个实际的查询接口的查询实例为例,查询接口返回的数据可以是例如json格式的数据:
{"payload":{"resouces":{"nodeName":"nodeName","ip":"ip","status":"status","capacity":{"cpu":"10","memory":"20000"},"allocated":{"cpu":"2","memory":"10000"}}}},其中capacity表示资源总容量,为map类型数据,key为"cpu"、"memory"等关键字,value为容量值;allocated为已使用资源容量,格式定义与capacity相同,nodeName为节点名称,status为节点状态,其中的cpu和memory后的数值10、2、20000、10000是其对应的编号数值等,payload表示一种用json格式进行数据传输的方式,resources表示集群资源信息的集合,memory表示内存大小。
在接口获取数据时,可以设置成定时任务,其执行频率支持可配置,配置文件中对应source_cron的值,如果未配置,则可设置默认为30s/次、60s/次等。
在获取到的集群资源信息中,可以包含例如集群ip地址、节点地址、cpu总量/已经使用量、gpu总量/已经使用量、内存总量/已经使用量等信息。这样便于后续对各分中心进行资源匹配及综合权重值的计算等。
在一个更为优选的实施方式中,权重配置单元中,权重比例的取值范围可以设置在例如0-1之间,精度支持小数点后2位。给每个分中心配置的优先因子的取值范围可以设置为例如0-1之间,精度支持小数点后2位,上述的权重比例和优先因子数据存储在mysql数据库中的分中心表中,以weights列表示优先因子。
本方案在又一种实施方式下,可以通过设备的方式来实现,该设备可以搭载如上述记载的实施例中的算力任务跨区域调度系统,以执行上述各个实施方式中各个或几个步骤的相应模块。因此,可以由相应模块执行上述各个实施方式的每个步骤或几个步骤,并且该电子设备可以包括这些模块中的一个或多个模块。模块可以是专门被配置为执行相应步骤的一个或多个硬件模块、或者由被配置为执行相应步骤的处理器来实现、或者存储在计算机可读介质内用于由处理器来实现、或者通过某种组合来实现。
该设备可以利用总线架构来实现。总线架构可以包括任何数量的互连总线和桥接器,这取决于硬件的特定应用和总体设计约束。总线将包括一个或多个处理器、存储器和/或硬件模块的各种电路连接到一起。总线还可以将诸如外围设备、电压调节器、功率管理电路、外部天线等的各种其它电路连接。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种算力任务跨区域调度方法,其特征在于,所述方法包括:
步骤1、定期获取区域集群资源信息,并存储;所述区域集群资源信息至少包括资源属性;
步骤2、配置各个资源属性的权重比例;配置各分中心的优先因子;
步骤3、基于步骤1中的区域集群资源的最新记录及步骤2中的优先因子,确定算力任务的资源要求与分中心的区域集群资源的最新记录是否匹配,当匹配时,获取算力任务中的资源配置要求,结合匹配的区域集群资源对应的权重比例,计算算力任务在各区域中的综合权重值;
步骤4、基于所述综合权重值,确定与所述算力任务对应的最佳匹配分中心。
2.根据权利要求1所述的方法,其特征在于,所述步骤1中,定期获取通过以下方式:
调用区域的资源集群的查询接口;
查询接口返回集群资源信息;
将所述集群资源信息存储在数据库中的集群资源信息表;
所述集群资源信息数据格式为:
{"payload":{"resouces":{"nodeName":"nodeName","ip":"ip","status":"status","capacity":{"cpu","memory"},"allocated":{"cpu","memory"}}}}
其中,capacity表示资源总容量,allocated为已使用资源容量,nodeName为节点名称,status为节点状态,payload表示一种用json格式进行数据传输的方式,resources表示集群资源信息的集合,memory表示内存大小。
3.根据权利要求2所述的方法,其特征在于,所述步骤2中,所述集群资源信息表中记录的资源信息,以区域中心id和资源属性编码作为联合主键。
4.根据权利要求1所述的方法,其特征在于,所述步骤2中,所述权重比例及优先因子的配置依据为:
各个属性在算力任务中依赖程度的评估,以及分中心重要程度和访问频率的评估。
5.根据权利要求1所述的方法,其特征在于,所述权重比例包括cpu权重比例,所述cpu权重比例的计算方式为:
(capacitycpu–requesetcpu * 10 / capacitycpu) * weightcpu
其中,capacitycpu表示cpu的分中心资源总量,requesetcpu表示当前已经被占用的资源数,weightcpu表示cpu的权重值。
6.根据权利要求1所述的方法,其特征在于,所述步骤3中,所述综合权重值的计算方式为:
(cpuweight+gpuweight+shmweight+memoryweight)*优先因子
其中,cpuweight表示cpu的权重比例,gpuweight表示gpu的权重比例,shmweight表示共享内存权重,memoryweight表示内存权重。
7.根据权利要求1所述的方法,其特征在于,所述步骤4进一步包括:
以获取到的综合权重值最高的区域作为最佳匹配区域;或者
当多个区域对应的综合权重值相等时,以随机方式确定最佳匹配区域。
8.一种算力任务跨区域调度系统,其特征在于,所述系统包括:多个区域算力分中心、调度模块、存储模块;
所述多个区域算力分中心与所述调度模块连接,所述调度模块与所述存储模块连接;
所述调度模块包括:
资源信息获取单元,用于定期获取区域集群资源信息,并存储至所述存储模块;所述区域集群资源信息至少包括资源属性;
权重配置单元,用于配置各个资源属性的权重比例,配置各区域算力分中心的优先因子;
综合权重计算单元,用于获取算力任务重的资源配置要求,基于区域集群资源信息及所述权重比例,计算算力任务在各区域中的综合权重值;
基于区域集群资源信息的最新记录及优先因子,确定算力任务的资源要求与区域算力分中心的区域集群资源的最新记录是否匹配,当匹配时,获取算力任务中的资源配置要求,结合匹配的区域集群资源对应的权重比例,计算算力任务在各区域算力分中心的综合权重值;
区域匹配单元,用于基于所述综合权重值,确定与所述算力任务对应的最佳匹配区域。
9.根据权利要求8所述的系统,其特征在于,所述区域匹配单元中,以获取到的综合权重值最高的区域算力分中心作为最佳匹配区域;或者
当多个区域算力分中心对应的综合权重值相等时,以随机方式确定最佳匹配区域。
10.一种算力任务跨区域调度设备,其特征在于,所述设备包括存储器及处理器,所述处理器可以调用所述存储器中的计算机指令,以执行如权利要求1-7任一所述的算力任务跨区域调度方法。
CN202210263769.7A 2022-03-17 2022-03-17 算力任务跨区域调度方法、系统及设备 Active CN114356587B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210263769.7A CN114356587B (zh) 2022-03-17 2022-03-17 算力任务跨区域调度方法、系统及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210263769.7A CN114356587B (zh) 2022-03-17 2022-03-17 算力任务跨区域调度方法、系统及设备

Publications (2)

Publication Number Publication Date
CN114356587A true CN114356587A (zh) 2022-04-15
CN114356587B CN114356587B (zh) 2022-07-05

Family

ID=81094871

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210263769.7A Active CN114356587B (zh) 2022-03-17 2022-03-17 算力任务跨区域调度方法、系统及设备

Country Status (1)

Country Link
CN (1) CN114356587B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114756384A (zh) * 2022-06-15 2022-07-15 中铱数字科技有限公司 一种基于区块链的任务调度方法及系统
CN115242865A (zh) * 2022-07-11 2022-10-25 北京邮电大学 一种远程视频人工服务的切换标准
CN116302568A (zh) * 2023-05-17 2023-06-23 算力互联(北京)科技有限公司 一种算力资源调度方法及系统、调度中心、数据中心
CN117971502A (zh) * 2024-03-29 2024-05-03 南京认知物联网研究院有限公司 一种针对ai推理集群进行在线优化调度的方法与装置

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080304516A1 (en) * 2007-06-06 2008-12-11 Hanhua Feng Distributed Joint Admission Control And Dynamic Resource Allocation In Stream Processing Networks
US20160380905A1 (en) * 2015-06-26 2016-12-29 Vmware, Inc. System and method for performing resource allocation for a host computer cluster
CN108519911A (zh) * 2018-03-23 2018-09-11 上饶市中科院云计算中心大数据研究院 一种基于容器的集群管理系统中资源的调度方法和装置
CN110008024A (zh) * 2019-04-02 2019-07-12 广西大学 一种多维约束下基于延迟决策的容器调度方法以及装置
CN111625337A (zh) * 2020-05-28 2020-09-04 浪潮电子信息产业股份有限公司 一种任务调度方法、装置、电子设备和可读存储介质
CN111935306A (zh) * 2020-09-11 2020-11-13 腾讯科技(深圳)有限公司 节点调度方法及装置
US20210149737A1 (en) * 2019-11-14 2021-05-20 Korea Electronics Technology Institute Method for fast scheduling for balanced resource allocation in distributed and collaborative container platform environment
CN113741961A (zh) * 2021-11-08 2021-12-03 梯度云科技(北京)有限公司 基于Kubernetes容器编排软件提交大数据计算作业的方法及装置
CN113867907A (zh) * 2021-08-09 2021-12-31 唐维昌 一种基于cpu资源在工程领域调度系统及优化算法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080304516A1 (en) * 2007-06-06 2008-12-11 Hanhua Feng Distributed Joint Admission Control And Dynamic Resource Allocation In Stream Processing Networks
US20160380905A1 (en) * 2015-06-26 2016-12-29 Vmware, Inc. System and method for performing resource allocation for a host computer cluster
CN108519911A (zh) * 2018-03-23 2018-09-11 上饶市中科院云计算中心大数据研究院 一种基于容器的集群管理系统中资源的调度方法和装置
CN110008024A (zh) * 2019-04-02 2019-07-12 广西大学 一种多维约束下基于延迟决策的容器调度方法以及装置
US20210149737A1 (en) * 2019-11-14 2021-05-20 Korea Electronics Technology Institute Method for fast scheduling for balanced resource allocation in distributed and collaborative container platform environment
CN111625337A (zh) * 2020-05-28 2020-09-04 浪潮电子信息产业股份有限公司 一种任务调度方法、装置、电子设备和可读存储介质
CN111935306A (zh) * 2020-09-11 2020-11-13 腾讯科技(深圳)有限公司 节点调度方法及装置
CN113867907A (zh) * 2021-08-09 2021-12-31 唐维昌 一种基于cpu资源在工程领域调度系统及优化算法
CN113741961A (zh) * 2021-11-08 2021-12-03 梯度云科技(北京)有限公司 基于Kubernetes容器编排软件提交大数据计算作业的方法及装置

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
YUN-HANLEE等: "Improving job scheduling algorithms in a grid environment", 《FUTURE GENERATION COMPUTER SYSTEMS》 *
华夏渝等: "基于云计算环境的蚁群优化计算资源分配算法", 《华东师范大学学报(自然科学版)》 *
孟令玺等: "云计算下的资源负载均衡性调度仿真", 《计算机仿真》 *
康妍: "一种基于云计算的资源调度方案的研究与实现", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
黄凯等: "基于Docker swarm集群的动态加权调度策略", 《计算机应用》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114756384A (zh) * 2022-06-15 2022-07-15 中铱数字科技有限公司 一种基于区块链的任务调度方法及系统
CN114756384B (zh) * 2022-06-15 2022-09-13 中铱数字科技有限公司 一种基于区块链的任务调度方法及系统
CN115242865A (zh) * 2022-07-11 2022-10-25 北京邮电大学 一种远程视频人工服务的切换标准
CN116302568A (zh) * 2023-05-17 2023-06-23 算力互联(北京)科技有限公司 一种算力资源调度方法及系统、调度中心、数据中心
CN117971502A (zh) * 2024-03-29 2024-05-03 南京认知物联网研究院有限公司 一种针对ai推理集群进行在线优化调度的方法与装置

Also Published As

Publication number Publication date
CN114356587B (zh) 2022-07-05

Similar Documents

Publication Publication Date Title
CN114356587B (zh) 算力任务跨区域调度方法、系统及设备
CN106776005B (zh) 一种面向容器化应用的资源管理系统及方法
CN110221915B (zh) 节点调度方法和装置
CN109120715A (zh) 一种云环境下动态负载均衡方法
CN107404523A (zh) 云平台自适应资源调度系统和方法
CN112363813A (zh) 资源调度方法、装置、电子设备和计算机可读介质
CN111464659A (zh) 节点的调度、节点的预选处理方法、装置、设备及介质
CN105718364A (zh) 一种云计算平台中计算资源能力动态评估方法
CN111897654A (zh) 将应用迁移到云平台的方法、装置、电子设备和存储介质
CN109710376A (zh) 容器集群管理系统的动态调度方法和装置
CN113946431B (zh) 一种资源调度方法、系统、介质及计算设备
CN113821332B (zh) 自动机器学习系统效能调优方法、装置、设备及介质
CN111752678A (zh) 面向边缘计算中分布式协同学习的低功耗容器放置方法
CN114679451B (zh) 面向边缘计算的服务调度系统及其调度方法
CN113515382B (zh) 云资源的分配方法、装置、电子设备及存储介质
CN115134371A (zh) 包含边缘网络算力资源的调度方法、系统、设备及介质
CN113157379A (zh) 集群节点资源调度方法及装置
CN115543577B (zh) 基于协变量的Kubernetes资源调度优化方法、存储介质及设备
CN111796933B (zh) 资源调度方法、装置、存储介质和电子设备
CN112181613A (zh) 异构资源分布式计算平台批量任务调度方法及存储介质
CN115297112A (zh) 一种基于Kubernetes的动态资源配额及调度组件
CN116263701A (zh) 算力网络任务调度方法、装置、计算机设备及存储介质
CN114666335B (zh) 一种基于数据分发服务dds的分布式系统负载均衡装置
CN115686805A (zh) Gpu资源共享的方法和装置、调度gpu资源共享的方法和装置
US20170083375A1 (en) Thread performance optimization

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant