CN117608848A - 一种异构计算资源控制方法、装置及设备 - Google Patents
一种异构计算资源控制方法、装置及设备 Download PDFInfo
- Publication number
- CN117608848A CN117608848A CN202311632049.4A CN202311632049A CN117608848A CN 117608848 A CN117608848 A CN 117608848A CN 202311632049 A CN202311632049 A CN 202311632049A CN 117608848 A CN117608848 A CN 117608848A
- Authority
- CN
- China
- Prior art keywords
- computing
- communication
- computing node
- network
- resource
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 126
- 238000004891 communication Methods 0.000 claims description 566
- 238000004364 calculation method Methods 0.000 claims description 55
- 230000005540 biological transmission Effects 0.000 claims description 41
- 238000003860 storage Methods 0.000 claims description 34
- 238000012545 processing Methods 0.000 claims description 23
- 235000008694 Humulus lupulus Nutrition 0.000 claims description 20
- 238000013468 resource allocation Methods 0.000 claims description 15
- 230000008569 process Effects 0.000 description 56
- 238000001514 detection method Methods 0.000 description 9
- 238000013500 data storage Methods 0.000 description 8
- 230000001133 acceleration Effects 0.000 description 7
- 230000008859 change Effects 0.000 description 6
- 239000002699 waste material Substances 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 5
- 238000009826 distribution Methods 0.000 description 5
- 230000002159 abnormal effect Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000007726 management method Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 230000000903 blocking effect Effects 0.000 description 1
- 230000000739 chaotic effect Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5005—Allocation of resources, e.g. of the central processing unit [CPU] to service a request
- G06F9/5027—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5061—Partitioning or combining of resources
- G06F9/5072—Grid computing
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本申请提出了一种异构计算资源控制方法、装置及设备,该异构计算资源控制设备确定所在计算集群中各第一计算节点的第一资源配置信息后,由于该第一资源配置信息至少包括对应的第一计算节点中多个第一处理器与多个网络适配器之间的第一通信网络关系,在响应于第一计算节点基于第一通信网络关系执行计算任务过程中,可以获取相应的任务执行信息,从而依据资源调度策略和任务执行信息,确定各第一计算节点的第二资源配置信息,以使第一计算节点基于第二资源配置信息执行计算任务。
Description
技术领域
本申请主要涉及异构计算领域,更具体地说是涉及一种异构计算资源控制方法、装置及设备。
背景技术
随着通信和网络技术的迅速发展,异构计算凭借其能够经济有效地获取高性能计算能力、可扩展性好、计算资源利用率高、发展潜力巨大等特性,已成为并行/分布计算领域中的主要研究热点之一。
然而,在异构计算集群网络中,各节点之间以及节点内部器件之间通常是基于端口绑定关系进行通信控制,在计算负载发生变化后,很容易造成计算延迟,降低计算效率。
发明内容
为了解决上述技术问题,本申请提供了以下技术方案:
一方面,本申请提出了一种异构计算资源控制方法,所述异构计算资源控制方法包括:
确定计算集群中各第一计算节点的第一资源配置信息;所述第一资源配置信息至少包括对应的第一计算节点中多个第一处理器与多个网络适配器之间的第一通信网络关系;
响应于所述第一计算节点基于所述第一通信网络关系执行计算任务,获取相应的任务执行信息;
依据资源调度策略和所述任务执行信息,确定各所述第一计算节点的第二资源配置信息,以使所述第一计算节点基于所述第二资源配置信息执行所述计算任务。
可选的,所述任务执行信息能够表征所述第一计算节点以及所述第一计算节点与所述计算集群中的其他节点之间的通信链路的任务执行情况,所述获取相应的任务执行信息,包括以下至少一种:
获取所述第一计算节点的运行时长;
获取所述第一计算节点中所述网络适配器的通信负载数据;
获取同一所述第一计算节点中不同所述第一处理器之间的通信负载关联关系;
获取针对所述第一计算节点与所述计算集群中的第二计算节点之间的通信链路的计算性能参数;所述第二计算节点是指所述包含第二处理器的节点,所述第二处理器与所述第一处理器的处理方式不同;
获取针对所述第一计算节点与所述计算集群中的存储节点之间的通信链路的通信性能参数。
可选的,所述依据资源调度策略和所述任务执行信息,确定各所述第一计算节点的第二资源配置信息,包括:
基于所述任务执行信息包含的通信负载数据,确定相应的所述第一计算节点中运行的多个所述网络适配器的通信负载超过预设负载范围;
基于所述任务执行信息包含的通信负载数据,按照所述资源调度策略包含的针对所述网络适配器的负载均衡方式,调整所述第一计算节点中的所述第一通信网络关系,获得相应所述第一计算节点的第二资源配置信息;
其中,所述第二资源配置信息至少包括所述第一计算节点中多个所述第一处理器与多个所述网络适配器之间的第二通信网络关系。
可选的,所述依据资源调度策略和所述任务执行信息,确定各所述第一计算节点的第二资源配置信息,包括:
基于所述任务执行信息包含的计算性能参数,从相应所述第一计算节点与所述计算集群中的第二计算节点之间的通信链路中,确定存在计算延迟时间大于计算时间阈值的第一待调度通信链路;
确定所述第一待调度通信链路中存在的通信跳转次数;一次通信跳转是指所述计算集群的位于所述第一待调度通信链路中的一个交换网络设备执行的网络交换操作;
如果所述通信跳转次数大于相应的预设跳转阈值,确定相应的所述第一待调度通信链路存在通信环路;所述预设跳转阈值针对相应的所述第一计算节点与所述第二计算节点之间的通信链路确定;
基于所述任务执行信息中各所述交换网络设备的负载数据,调整所述第一待调度通信链路中存在的通信网络关系,得到相应所述第一计算节点的第二资源配置信息;
其中,调整的所述通信网络关系包括所述第一计算节点的所述网络适配器与所述交换网络设备之间的第三通信网络关系,以及不同所述交换网络设备之间的第四通信网络关系。
可选的,所述依据资源调度策略和所述任务执行信息,确定各所述第一计算节点的第二资源配置信息,包括:
基于所述任务执行信息包含的通信性能参数,从相应所述第一计算节点与所述计算集群中的存储节点之间的通信链路中,确定存在传输延迟时间大于通信时间阈值的第二待调度通信链路;
基于所述任务执行信息包含的通信负载数据,调整所述第二待调度通信链路,得到相应所述第一计算节点的第二资源配置信息。
可选的,所述依据资源调度策略和所述任务执行信息,确定各所述第一计算节点的第二资源配置信息,包括:
基于所述任务执行信息包含的相应所述第一计算节点中不同所述第一处理器之间的通信负载关联关系,确定不同所述第一处理器之间的通信关联度;
基于所述通信关联度,调整相应的所述第一通信网络关系,得到所述第一计算节点的第二资源配置信息。
可选的,所述基于所述通信关联度,调整相应的所述第一通信网络关系,得到所述第一计算节点的第二资源配置信息,包括:
将所述通信关联度大于关联阈值的多个第一处理器调度给相应所述第一计算节点中的同一所述网络适配器,得到对应的第二通信网络关系;
基于所述第二通信网络关系,得到相应所述第一计算节点的第二资源配置信息。
可选的,所述第一计算节点基于所述第二资源配置信息执行所述计算任务,包括:
将所述第二资源配置信息包含的第二通信网络关系发送至对应的所述网络适配器和所述计算集群中的交换网络设备,以调整所述计算集群中的通信链路,通过调整后的通信链路执行所述计算任务;
其中,所述第二通信网络关系是指相应的所述第一计算节点中多个所述第一处理器与多个所述网络适配器之间的通信网络关系。
另一方面,本申请还提出了一种异构计算资源控制装置,所述异构计算资源控制装置包括:
第一资源配置信息确定模块,用于确定计算集群中各第一计算节点的第一资源配置信息;所述第一资源配置信息至少包括对应的第一计算节点中多个第一处理器与多个网络适配器之间的第一通信网络关系;
任务执行信息获取模块,用于响应于所述第一计算节点基于所述第一通信网络关系执行计算任务,获取相应的任务执行信息;
第二资源配置信息确定模块,用于依据资源调度策略和所述任务执行信息,确定各所述第一计算节点的第二资源配置信息,以使所述第一计算节点基于所述第二资源配置信息执行所述计算任务。
又一方面,本申请还提出了一种异构计算资源控制设备,所述异构计算资源控制设备包括:多个通信连接端口和资源调度处理器,其中:
不同所述通信连接端口分别连接计算集群中各计算节点、存储节点和交换网络设备;
所述资源调度处理器连接所述多个通信连接端口,用于执行多个计算机指令,实现以下步骤:
确定计算集群中各第一计算节点的第一资源配置信息;所述第一资源配置信息至少包括对应的第一计算节点中多个第一处理器与多个网络适配器之间的第一通信网络关系;
响应于所述第一计算节点基于所述第一通信网络关系执行计算任务,获取相应的任务执行信息;
依据资源调度策略和所述任务执行信息,确定各所述第一计算节点的第二资源配置信息,以使所述第一计算节点基于所述第二资源配置信息执行所述计算任务。
附图说明
为了更清楚地说明本申请实施例或相关技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为计算集群的一可选系统架构示意图;
图2为本申请提出的异构计算资源控制方法的可选实施例一的流程示意图;
图3为本申请提出的异构计算资源控制方法的可选实施例二的流程示意图;
图4为本申请提出的异构计算资源控制方法的可选实施例三的流程示意图;
图5为本申请提出的异构计算资源控制方法的可选实施例四的流程示意图;
图6为本申请提出的异构计算资源控制方法的可选实施例五的流程示意图;
图7为本申请提出的异构计算资源控制装置的一可选实施例的结构示意图;
图8为本申请提出的异构计算资源控制设备的一可选实施例的硬件结构示意图。
具体实施方式
针对背景技术部分的描述,经过分析得知,在高性能异构计算中,通常是采用CPU与GPU(Graphics Processing Unit,图形处理器)或者其他类型的加速计算处理器相结合的计算方式,如图1所示的一可选计算集群环境的架构示意图,一个计算集群通常是由多个GPU计算节点、交换网络设备(如交换机)、CPU计算节点以及存储节点等构成,不同节点可以通过一个或多个交换网络设备进行通信,使得整个计算集群的网络路径非常复杂。
其中,对于配置有多个GPU处理器或加速计算处理器和多个网络适配器(如HCA卡或其他用于实现与其他节点通信的通信卡)的每个GPU计算节点,若采用如2个GPU处理器通过一个网络适配器对外通信的端口绑定方式进行通信控制,在某计算节点出现宕机时,将会因绑定端口变化而增加网络复杂度,如出现通信环路等,从而降低计算效率,且在不同应用中GPU处理器的负载发生变化后,很容易导致基于绑定端口形成的通信链路过载,或重复执行相同计算等,造成资源浪费和计算延迟等问题,影响计算效率。
为了解决上述技术问题,在计算集群中的各节点按照配置好的资源运行过程中,即其中的如GPU计算节点这类第一计算节点按照配置好的资源配置信息,执行计算任务过程中,能够获取由此生成的任务执行信息,了解计算任务执行过程中,计算集群资源分配是否需要调整,可以依据配置的资源调度策略以及获取的任务执行信息,及时且准确进行资源调度,重新确定该第一计算节点的资源配置信息,使其更符合当前执行的计算任务的资源需求,按照该资源配置信息执行计算任务,能够有效提高计算效率,避免资源浪费。
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
参照图2,为本申请提出的异构计算资源控制方法的可选实施例一的流程示意图,该异构计算资源控制方法可以适用于异构计算资源控制设备,如一台或多台服务器,或者是具有一定数据处理能力的终端设备,其可以作为计算集群的管理者角色,通过本申请提出的异构计算资源控制方法,实现对计算集群中各节点的通信网络关系的动态管理,提高计算效率。本申请对计算集群的系统结构不做限制,可以参照但并不局限于图1所示的计算集群结构,关于异构计算资源控制设备的组成结构可以参照下文实施例对应部分的描述,本实施例在此不做详述。
基于此,如图2所示,本实施例提出的异构计算资源控制方法可以包括但并不局限于以下步骤:
步骤S21,确定计算集群中各第一计算节点的第一资源配置信息;该第一资源配置信息至少包括对应的第一计算节点中多个第一处理器与多个网络适配器之间的第一通信网络关系;
本申请实施例中,第一计算节点可以是如图1所示的GPU(Graphics ProcessingUnit,图形处理器)计算节点,其包含的第一处理器可以是GPU或者其他类型的加速计算处理器,网络适配器可以包括HCA(Host Channel Adapter,主机通道适配器)通信卡,可以插入第一计算节点相应的卡槽内,增强第一计算节点的网络通信能力,本申请对第一计算节点包含的网络适配器的数量和类型以及第一处理器的数量等不做限制,可以依据实际情况确定,也能够适时动态调整,实现过程本申请不做详述。
而且,对于计算集群包含的不同第一计算节点包含的第一处理器的数量,以及网络适配器的数量和类型均可以不同,可以基于计算集群的异构计算需求确定,本申请在此不对计算集群包含的各第一计算节点的硬件结构一一详述。
在计算集群的初始工作过程中,可以对其中的各第一计算节点进行初始资源配置,此时,可以结合应用场景确定每一第一计算节点配置的第一处理器的数量以及网络适配器的类型和数量,如配置8个GPU(或其他加速计算处理器,本申请仅以GPU处理器为例进行说明)和4个HCA通信卡等,与此同时,还会确定各第一处理器与各网络适配器之间的通信对应关系,记为第一通信网络关系,如两个GPU分配使用一个HCA通信卡对外通信等,本申请对第一通信网络关系的内容不做限制。
可选的,对于上述第一通信网络关系,可以在获取各第一处理器具有的唯一设备标识以及各网络适配器具有的唯一通信端口标识后,按照初始化的资源分配策略,将具有第一通信网络关系的第一处理器的设备标识与网络适配器的通信端口标识关联后存储等,本申请对第一通信网络关系的表示方式及其存储方式等不做限制。
需要说明的是,在计算集群的初始资源配置过程中,除了实现对第一计算节点内部的第一处理器和网络适配器之间的通信网络关系的配置外,还会配置计算集群中不同节点和交换网络设备之间的通信网络关系,确定不同节点之间的通信链路,以通过该通信链路实现相应两个节点之间数据传输,本申请对计算集群的资源配置过程以及所得到的资源配置信息不做限制,可视情况而定。
步骤S22,响应于第一计算节点基于第一通信网络关系执行计算任务,获取相应的任务执行信息;
在完成计算集群的资源配置后,其中的每一个第一计算节点执行分配到的计算任务,通过交换网络设备与计算集群中的其他节点进行通信过程中,该第一计算节点中使用的至少一个第一处理器可以基于第一通信网络关系,通过相应的网络适配器实现对外通信,如向其他节点发送数据,接收其他节点发送的数据等。
示例性的,结合上文第一通信网络关系的描述,第一计算节点对外通信时,所使用的每个第一处理器可以基于自身的设备标识,查询与其关联存储的通信端口标识,将输出数据发送至具有该通信端口标识的网络适配器后输出,之后,可以通过该网络适配器对外的通信链路,将该数据传输至对端节点,传输过程本申请不做详述。同理,在第一计算节点的各网络适配器也可以通过连接的通信链路接收数据,将接收到的数据发送至与自身具有第一通信网络关系的第一处理器进行处理,以实现相应的计算任务。
在上述计算任务执行过程中,本申请为了解该计算任务的执行情况,会获取相应的任务执行信息,如计算任务的执行时间、产生的通信负载数据、与其他计算任务的关联度参数、产生的网络延迟等,可以依据计算集群资源配置过程中设置的资源调度条件(其可以记为第一资源调度条件,包含于上述第一资源配置信息中)的内容,检测各计算任务执行过程中产生的相应数据,作为对应计算任务的任务执行信息等,本申请对任务执行信息的内容及其检测方式不做限制。
步骤S23,依据资源调度策略和任务执行信息,确定各第一计算节点的第二资源配置信息,以使第一计算节点基于第二资源配置信息执行计算任务。
如上文对各计算任务的任务执行信息的相关描述,其能够表征相应的第一计算节点以及第一计算节点与计算集群中其他节点之间的通信链路的任务执行情况,本申请按照资源调度策略对各任务执行信息进行分析,可以精准确定是否需要调度第一计算节点的资源,如该任务执行信息是否满足预设的第一资源调度条件等,在不满足该第一资源调度条件的情况下,如何调度第一计算节点的资源,即确定第一计算节点的第二资源配置信息,以解决按照当前第一资源配置信息执行计算任务出现的问题,如出现计算延迟等问题,导致计算效率低。
之后,可以将新确定的第二资源配置信息发送至相应的第一计算节点,使其基于该第二资源配置信息继续执行计算任务,提高计算效率。在此期间,根据需要还可以将第二资源配置信息发送至计算集群中的交换网络设备,以更新计算集群中相应的第一计算节点与其他节点之间的通信链路,解决因通信链路存在的如环路等导致的计算效率低问题,实现过程本申请不做限制。
其中,结合上文对第一资源配置信息的描述,本申请确定的各第一计算节点的第二资源配置信息可以至少包括相应的第一计算节点中多个第一处理器与多个网络适配器之间的第二通信网络关系,该第二通信网络关系区别于上文第一通信网络关系。
可见,本申请通过在各第一计算节点执行计算任务过程,获取实际产生的任务执行信息,从而基于各任务执行信息和资源调度策略,实现对计算集群的资源调度,动态调整第一计算节点中不同第一处理器与网络适配器之间的通信网络关系,优化第一计算节点的资源配置,确定相应的第二资源配置信息,从而使各第一计算节点能够按照第二资源配置信息执行计算任务,提高计算效率。
这样,在计算集群的通信网络环境发生变化,能够及时且合理动态调整第一计算节点的资源配置,相对于第一计算节点基于固定资源配置执行计算任务的方式,本申请提出这种资源动态调整的方式,能够适用于不同应用场景,提高了计算集群的计算适应性,且能够保证不同应用场景下的高计算效率,更好地满足计算需求。
参照图3,为本申请提出的异构计算资源控制方法的可选实施例二的流程示意图,本实施例可以对上文提出的异构计算资源控制方法的一可选细化实现方式进行描述,如图3所示,该异构计算资源控制方法可以包括:
步骤S31,确定计算集群中各第一计算节点的第一资源配置信息;该第一资源配置信息至少包括对应的第一计算节点中多个第一处理器与多个网络适配器之间的第一通信网络关系;
步骤S32,响应于第一计算节点基于第一通信网络关系执行计算任务,获取相应第一计算节点中各网络适配器的通信负载数据;
关于步骤S31以及步骤S32的计算任务执行过程,可以参照上下文实施例对应部分的描述,如步骤S21和步骤S22对应部分的描述内容,本实施例在此不做详述。
需要说明的是,在第一计算节点执行每一计算任务过程中,获取的各计算任务的任务执行信息包括但并不局限于本实施例描述的通信负载数据,还可以包括第一计算节点的运行时长以及如下文实施例描述的其他执行信息等之中的一个或多种组合,以确定相应的任务执行情况,本实施例仅以获取计算任务执行过程中各网络适配器的通信负载数据为例进行说明。
可选的,对于每一网络适配器的通信负载数据,可以包括该网络适配器构成的通信链路执行的计算任务数量、各计算任务占用的网络资源(如通信带宽)等能够表征该网络适配器的通信负载情况的内容,本申请对该通信负载数据的内容及其检测方法不做限制,可视情况而定。
应该理解的是,随着第一计算节点执行的计算任务的不同,以及执行计算任务所使用的计算集群的通信链路及其经过的节点的变化,还有计算集群的网络环境的变化等,都可能会影响各网络适配器的通信负载数据,因此,本申请提出在计算任务执行过程中,可以实时或按照预设时间等获取当前各网络适配器的通信负载数据,来确定当前每一个第一计算节点包含的多个网络适配器的通信负载情况,以避免通信负载过大而影响通信效率,进而降低计算任务的执行效率。
步骤S33,基于获取的通信负载数据,确定相应的第一计算节点中运行的多个网络适配器的通信负载超过预设负载范围;
其中,预设负载范围可以在执行计算任务之前,对计算集群进行资源配置确定,通常可以表征对应的网络适配器的通信网络能力,其所能够承载的通信负载越大,说明其通信网络能力越强,该网络适配器分配到的通信资源越多,本申请对不同网络适配器的预设负载范围的数值不做限制,同一第一计算节点中不同网络适配器的预设负载范围可以相同,也可以不同,这可以依据该网络适配器的通信性能(其可以依据该网络适配器的类型和型号确定)确定。
需要说明,为了避免网络适配器超负荷工作导致计算任务执行失败,所确定的预设负载范围可以小于该网络适配器所能够承担的最大通信负载,即设置对应的通信余量,其数值可视情况而定。
这样,在获取当前各第一计算节点包含的各网络适配器的通信网络数据后,可以与对应的网络适配器的预设负载范围进行比较,确定当前的通信负载数据超过该预设负载范围,若通信负载大于预设负载范围的最大负载,说明该网络适配器高负载工作,这会影响使用该网络适配器构成的通信链路执行的计算任务的计算效率;若该通信负载小于该预设负载范围的最小负载,说明该网络适配器低负载工作,造成该网络适配器的通信资源浪费,这两种情况都可以调整该网络适配器的负载,在保证计算效率的同时,能够充分利用其通信资源,减少资源浪费。
应该理解的是,在某网络适配器的通信负载位于预设负载范围内,说明该网络适配器的负载分配合理,能够保证所承担的计算任务的通信效率的同时,实现了对自身通信资源的充分利用,本申请可以基于该检测结果执行后续步骤的资源调度。可选的,在这种情况下,本申请还可以结合其他任务执行信息,来确定是否需要对其进行资源调度,实现过程可以参照下文实施例对应部分的描述,本实施例不做详述。
步骤S34,基于该第一计算节点中各网络适配器的通信负载数据,按照资源调度策略包含的针对网络适配器的负载均衡方式,调整该第一计算节点的第一通信网络关系,获得该第一计算节点的第二资源配置信息。
继上述分析,通过对每一个第一计算节点包含的各网络适配器当前承担的通信负载情况的分析,确定当前各网络适配器的通信负载分配不符合资源调度策略中对各网络适配器的通信负载分配要求,如负载均衡分配等,可以据此调整相应第一计算节点的第一通信网络关系,以改变网络适配器所承担针对对应的各第一处理器执行的计算任务的通信负载,这种资源调度实现方法本申请不做限制。
其中,对于每一第一计算节点包含的各网络适配器的通信负载分配,资源调度策略包含的相应调度内容包括但并不局限于本实施例描述的负载均衡方式,这可以结合各网络适配器所具有的通信网络能力确定,本实施例以第一计算节点包含相同类型或不同类型但具有基本相同的通信网络能力(即分配到基本相同的通信资源)的多个网络适配器的场景为例进行说明,采用负载均衡方式,实现这多个网络适配器当前的通信负载的调度,即将高通信负载向低通信负载均衡,实现方法本申请不做详述。
由于第一处理器执行计算任务过程中,通过与其具有通信网络关系的网络适配器对外通信,使得该网络适配器产生相应的通信负载数据,可见,第一处理器与网络适配器之间的通信网络关系,直接影响网络适配器所承担的通信负载。所以,在第一计算节点基于第一通信网络关系执行计算任务过程中,使得该第一计算节点包含的各网络适配器的通信负载不均衡,可以通过调整第一通信网络关系,改变所执行的各计算任务使用的网络适配器,实现对各网络适配器的通信负载的调整。对于第一通信网络关系的调整可以依据其表示和存储方式实现,本申请对步骤S34的实现过程不做详述。
可选的,在第一计算节点部署的各网络适配器的通信性能不同的情况下,如不同类型或型号的HCA卡等,对其预先配置的资源调度策略可以包括基于不同网络适配器的通信性能确定的负载调度方式,如通信性能强的网络适配器可以承担更多的通信负载,可以将高负载的计算任务向这类网络适配器调度,即将执行高负载的计算任务的第一处理器与该这类网络适配器通信连接等,之后,在其当前的通信负载数据超过对应的预设负载范围的情况下,可以基于当前的通信负载数据,按照这种负载调度方式,调整第一计算节点的第一通信网络关系,但并不局限于本申请描述的几种负载分配方式。
按照但并不局限于上文描述的方法,对第一计算节点的第一通信网络关系调整后,使得该第一计算节点包含的多个第一处理器和多个网络适配器具有第二通信网络关系,由此得到第一计算节点的新的资源配置信息,记为第二资源配置信息。可见,该第二资源配置信息至少包括该第二通信网络关系,在对第一计算节点的其他资源进行调度的情况下,第二资源配置信息还可以包括相应调度后的资源配置信息,本实施例在此不做详述。
综上,在本申请实施例中,在计算集群中的各第一计算节点执行各自的计算任务过程中,由于不同计算任务所需的通信资源以及计算量等可能不同,导致承担该计算任务的网络适配器产生不同的通信负载数据,为了避免不同网络适配器的通信负载分配不均衡,造成计算延迟,本实施例将获取第一计算节点包含的各网络适配器实际具有的通信负载数据,确定其超过对应的预设负载范围的情况下,将基于资源调度策略包含的负载均衡方式,及时调整相应第一计算节点的第一通信网络关系,改变该第一计算节点中各网络适配器承担的通信负载,避免堵塞,提高通信效率,也能够实现对通信资源的充分利用,避免通信资源的浪费。
参照图4,为本申请提出的异构计算资源控制方法的可选实施例三的流程示意图,本实施例可以对上文提出的异构计算资源控制方法的另一可选细化实现方式进行描述,如图4所示,该异构计算资源控制方法可以包括:
步骤S41,确定计算集群中各第一计算节点的第一资源配置信息;该第一资源配置信息至少包括对应的第一计算节点中多个第一处理器与多个网络适配器之间的第一通信网络关系;
步骤S42,响应于第一计算节点基于第一通信网络关系执行计算任务,获取同一第一计算节点中不同第一处理器之间的通信负载关联关系;
关于步骤S41以及步骤S42的计算任务执行过程,可以参照上下文实施例对应部分的描述,如步骤S21和步骤S22对应部分的描述内容,本实施例在此不做详述。
在实际应用中,由于不同计算任务(如执行某应用功能等)对第一计算节点的通信资源(如通信带宽)使用量以及计算量可能不同,有的计算任务的执行需要第一计算节点与其他节点频繁通信,需要较大通信资源,第一处理器可以采用独占方式(如对应连接一个网络适配器)执行该计算任务,提高通信效率;但有的计算任务执行占用通信资源较小,可以执行这类计算任务的多个第一处理器可以共享一个网络适配器,能够充分利用通信资源,且保证高通信效率。
基于此,若第一计算节点的第一处理器与网络适配器采用端口静态绑定方式进行通信,随着计算任务的变化,很容易造成某些网络适配器的通信负载过大,产生较大计算延迟,从而降低计算效率。面对这种情况,本申请提出对第一处理器与网络适配器之间的通信网络关系进行动态调整,以合理分配通信负载以提高计算效率。在该实现过程中,本申请将考虑各计算任务的相关性,实现对各通信负载分类,据此实现对第一通信网络关系的细粒度调整。
因此,在获取计算任务执行过程中相应的任务执行信息时,本申请实施例将获取不同第一处理器的通信负载关联关系,其可以由通信负载大小确定,本申请对该通信负载关联关系的获取方式及其表示方式不做限制。需要说明,获取的任务执行信息还可以包括上下文描述的其他内容,可以基于一种或多种任务执行信息,来调整第一通信网络关系,本实施例仅以获取通信负载关联关系这一种任务执行信息为例,来说明如何调整第一通信网络关系,对于基于其他内容的调整实现方式,可以参照对应其他实施例的描述。
步骤S43,基于该通信负载关联关系,确定相应的第一计算节点中不同第一处理器之间的通信关联度;
步骤S44,基于该通信关联度,调整相应第一计算节点的第一通信网络关系,得到该第一计算节点的第二资源配置信息。
继上述分析,为了确定第一计算节点执行的多个计算任务中,哪些计算任务可以合并到一个网络适配器实现,哪一个或多个计算任务需要独占一个网络适配器实现,可以对不同第一处理器之间的通信负载关联关系,确定不同第一处理器之间的通信关联度,以将通信关联度较高的多个第一处理器分配到同一个网络适配器,据此调整该第一计算节点当前的第一通信网络关系,以提高通信效率,进而提高计算效率。
基于此,在一些实施例中,上述步骤S44的一可选实现方式可以包括:将同一第一计算节点中通信关联度大于关联阈值(其可以表示通信关联度较高,即互联访问量高,使用同一网络适配器进行通信能够提高通信效率的临界值,本申请对其数值不做限制)的多个第一处理器调度给该第一计算节点中的同一网络适配器,得到对应的第二通信网络关系,之后,可以基于该第二通信网络关系,得到相应第一计算节点的第二资源配置信息。
需要说明,本申请对同一第一计算节点中不同第一处理器之间的通信关联度的获取方法不做限制,包括但并不局限于上文描述的方法。对于通信关联度较高的多个第一处理器,其执行的计算任务具有较高的关联度,可能需要交互实现,这样,使用同一个网络适配器可以缩短通信链路,相对于跨网络适配器的通信方式,提高了通信效率即数据传输效率,有助于提高计算效率。
可选的,在上述第一通信网络关系的调整过程中,在上述实施例的基础上,本申请还可以结合各网络适配器的通信负载数据,来确定多个第一处理器共享使用的一个网络适配器是哪个网络适配器,避免通信网络关系调整后,超过该网络适配器的通信网络能力。因此,在本实施例中,可以按照上文描述的方法,获得每一第一计算节点包含的不同第一处理器之间的通信关联度,以及不同网络适配器的通信负载数据,确定存在通信关联度较高的若干第一处理器,且这些第一处理器并未使用同一网络适配器,可以结合这些第一处理器使用的多个网络适配器的通信负载数据,从中选择一个能够承担通信关联度较高的多个计算任务的通信负载的网络适配器,确定为这若干个第一处理器共享的网络适配器,如其中通信负载最小的网络适配器。
当然,在这些网络适配器的可用通信资源不足的情况下,也可以从其他网络适配器选择若干第一处理器的共享网络适配器,通过调整第一通信网络关系,使得通信关联度较高的若干第一处理器通信连接该网络适配器,达到提高通信效率的目的,但并不局限于本实施例描述的共享网络适配器选择方式。
同理,在第一计算节点中的多个第一处理器包括不同类型的GPU处理器和/或其他类型的加速计算处理器的情况下,在按照上文描述的方法进行第一通信网络关系调整过程中,还可以获取不同第一处理器的处理性能参数和处理负载数据,结合各第一处理器的处理性能参数和处理负载数据,实现第一计算节点执行的各计算任务的调度,以及各第一处理器与不同网络适配器之间的通信网络关系调整,保证所得到的第一计算节点的第二资源配置信息更加合理,据此能够可靠提高计算效率,实现过程本申请不做详述。
参照图5,为本申请提出的异构计算资源控制方法的可选实施例四的流程示意图,本实施例可以对上文提出的异构计算资源控制方法的又一可选细化实现方式进行描述,如图5所示,该异构计算资源控制方法可以包括:
步骤S51,确定计算集群中各第一计算节点的第一资源配置信息;该第一资源配置信息至少包括对应的第一计算节点中多个第一处理器与多个网络适配器之间的第一通信网络关系;
步骤S52,响应于第一计算节点基于第一通信网络关系执行计算任务,获取针对第一计算节点与计算集群中的第二计算节点之间的通信链路的计算性能参数,以及构成该通信链路的各交换网络设备的负载数据;
关于步骤S51以及步骤S52的计算任务执行过程,可以参照上下文实施例对应部分的描述,如步骤S21和步骤S22对应部分的描述内容,本实施例在此不做详述。
本申请实施例中,在获取计算任务执行过程中相应的任务执行信息时,以获取各第一计算节点与各第二计算节点之间的通信链路的计算性能参数这一种任务执行信息为例进行说明,但该任务执行信息包括但并不局限于该计算性能参数这一种信息,如上文实施例还可以包括通信负载数据、运行时长等内容,本实施例可以对如何基于该计算性能参数这种任务执行信息,实现第一计算节点的资源调度方法进行描述。需要说明,在本实施例的基础上,还可以结合上下文实施例描述的基于其他至少一种任务执行信息,来综合实现第一计算节点的资源调度,这也属于本申请技术方案的保护范围,该实现过程本实施例不做详述。
其中,第二计算节点可以是包含至少一个第二处理器的节点,该第二处理器与第一处理器的处理方式不同,是指两种不同的处理器,该第二处理器可以是CPU或其他类型的加速计算处理器,第二计算节点可以是如图1所示的CPU计算节点,本申请对其组成结构不做详述,可以依据支持CPU(和/或其他类型的加速计算处理器)和GPU结合方式实现的异构计算的计算集群的部署确定,附图1仅以GPU计算节点和CPU计算节点结合方式的异构计算架构为例进行说明,对于其他异构计算架构的异构计算资源控制方法类似,本申请不做一一举例详述。
在实际应用中,计算集群中的不同第一计算节点和第二计算节点之间可以通过网络连接,形成相应的通信链路满足计算任务的通信需求,对于该通信链路可以由一层或多层的交换网络设备实现,所以说,计算集群的不同节点之间通信链路(即网络路径)构成的通信网络往往比较复杂,且其能够随着计算任务的变化,以及各节点和交换网络设备的工作情况动态变化,本申请对其网络结构及其变化过程不做详述,可视情况而定。
由此可见,对于任一第一计算节点与第二计算节点之间的通信链路,若通过多个交换网络设备转接,可能会使得该通信链路出现环路,即在同一个交换网络设备处发生两次及其以上次数的网络跳转,使得计算集群的通信链路变得非常混乱和复杂,导致数据传输效率大大下降,即降低了相应通信链路的计算性能。本实施例为了解决该问题,提出在计算任务执行过程中,能够及时获取该计算任务所使用的至少一条通信链路的计算性能参数,即表征实现相应计算任务的计算性能的参数,本申请对该计算性能参数的内容不做限制,可以在设置第一资源配置信息时确定,如上述第一资源调度条件中对应内容。
可选的,本申请可以获取第一计算节点与第二计算节点的计算延迟时间,可以依据第一资源配置信息中的第一资源调度条件包含的相应通信链路的预设传输时长,以及实际检测到的该通信链路对计算任务的数据传输时长,确定执行该计算任务的计算延迟时间,即传输延迟时间,将其作为该通信链路的一种计算性能参数,执行后续步骤。
需要说明,关于通信链路的计算性能参数包括但并不局限于计算延迟时间,还可以包括数据传输速度等其他参数,本申请以计算延迟时间这一种计算性能参数为例进行说明,在计算性能参数包括多种的情况下,据此实现第一通信网络关系调整的实现过程类似,本申请不做一一详述。
步骤S53,基于该计算性能参数,从相应的第一计算节点与第二计算节点之间的通信链路中,确定存在计算延迟时间大于计算时间阈值的第一待调度通信链路;
其中,在计算集群的资源配置过程中,不同节点之间的通信链路确定后,由于计算集群的通信资源已知,可以依据该通信链路的实际通信路径,确定通过该通信链路传输计算任务的数据花费的传输时长,以及允许的传输延迟时长,由此确定使用该通信链路传输数据的计算时间阈值,如允许的最大传输时间等,本申请对其数值不做限制,且该计算时间阈值可以作为第一资源调度条件的内容,包含于第一资源配置信息中。
这样,按照上文描述的方法,获得各第一计算节点与各第二计算节点之间的各通信链路的计算延迟时间后,可以确定各通信链路的计算延迟时间是否大于预设的计算时间阈值,若是,可以将对应的通信链路确定为第一调度通信链路,说明该通信链路的通信路径需要调整,以降低计算延迟,提高计算效率。反之,对于不存在计算延迟或计算延迟时间小于该计算时间阈值的通信链路,可以暂时不做调整,按照上文描述的方法继续进行计算性能参数的检测。
步骤S54,确定第一待调度通信链路中存在的通信跳转次数;
步骤S55,如果该通信跳转次数大于相应的预设跳转阈值,确定相应的第一待调度通信链路存在通信环路;
结合上文实施例对应部分的描述,在第一计算节点与第二计算节点之间的通信链路存在环路的情况下,会导致计算集群的整个网络传输路径混乱和复杂,降低数据传输效率,导致计算延迟。但在实际应用中,也会因通信链路中的某一节点或服务器宕机等其他原因导致计算延迟。
因此,本申请通过上述计算延迟的方式,初步筛选出可能是因通信链路存在环路导致的计算延迟的第一待调度通信链路后,还可以进一步分析该通信链路中存在的通信跳转次数,检测其是否大于该通信链路应该具有的通信跳转次数,即针对相应的第一计算节点与第二计算节点之间的通信链路确定的预设跳转阈值,其可以通过构成该通信链路的交换网络设备的数量确定,若实际的通信跳转次数大于该预设跳转阈值,可以认为该第一待调度通信链路存在通信环路,执行后续步骤。
其中,由于一次通信跳转是指计算集群的位于第一待调度通信链路中的一个交换网络设备执行的网络交换操作,交换网络设备每次执行网络交换操作时会产生相应的日志数据,这样,可以通过检测日志数据,来确定该交换网络设备用于实现其参与的各通信链路的通信跳转次数,基于参与同一通信链路的各交换网络设备执行的通信跳转次数,可以确定该通信链路中存在的通信跳转次数。
可选的,对于第一计算节点与第二计算节点之间的通信链路,在数据传输过程中,每发生一次通信跳转,可以累积一次通信跳转次数,直至传输到对方节点,可以得到该通信链路上存在的通信跳转次数等。本申请对步骤S54的实现方法不做限制。
在另一些实施例中,对于第一待调度通信链路是否通信环路的检测,也可以直接由参与该第一待调度通信链路的每个交换网络设备执行的通信跳转次数是否大于预设跳转次数,即在不产生通信环路的情况下,参与对应的第一计算节点和第二计算节点之间的通信链路的交换网络设备所执行的通信跳转次数等,本申请对其数值不做限制,可以依据计算集群的资源配置后相应通信链路的通信路径确定。
这样,在交换网络设备的实际通信跳转次数大于对应第一待调度通信链路的预设跳转次数的情况下,说明该第一待调度通信链路出现了通信环路,且是由该交换网络设备产生的,后续可以据此进行有针对性的资源调度,实现方法本申请不做限制。
步骤S56,基于交换网络设备的负载数据,调整第一待调度通信链路中存在的通信网络关系,得到相应第一计算节点的第二资源配置信息。
继上述分析,在确定出现较大计算延迟的第一待调度通信链路中存在通信环路的情况下,为了消除该通信环路,解决由此产生的计算延迟问题,从而提高计算效率,本实施例可以基于当前获取的参与第一待调度通信链路的各交换网络设备的负载数据,可以调整该第一待调度通信链路中存在的通信网络关系,如相应的第一计算节点的网络适配器与交换网络设备之间的第三通信网络关系,以及不同交换网络设备之间的第四通信网络关系等,解决通信环路问题,得到该第一计算节点的第二资源配置信息。
其中,对于参与通信环路的交换网络设备的负载数据会超过预设负载,如第一资源调度条件包含的该交换网络设备实现计算集群的各通信链路的负载数据,其数值可以依据计算集群的资源配置确定,本申请对其数值不做限制。对于交换网络设备,可以调整其通信网络关系,减少其对第一待调度通信链路的通信跳转次数。也可以向负载数据较低的交换网络设备规划新的通信路径,以实现对应的第一计算节点与第二计算节点之间的通信,即构建该第一计算节点与第二计算节点之间的新的通信链路,提高通信效率,也使得调整后的计算集群的网络传输路径清晰,便于维护和管理。
本申请提出的又一些实施例中,按照但并不局限于上文描述的方法,确定存在计算延迟的第一待调度通信链路后,若不是因通信环路导致该计算延迟,可以检测参与该第一待调度通信链路的各节点和交换网络设备工作是否正常,所使用的通信端口的通信负载是否超过负载阈值(即确定负载过大而影响通信效率的负载值,本申请对其数值不做限制)等。
若存在工作异常的节点和/或交换网络设备,可以及时替换或将其执行的计算任务迁移到其他节点或交换网络设备,形成新的通信链路;同理,在如网络适配器或其他通信端口的负载过大,可以将其承担的计算任务调度到其他网络适配器或通信端口,形成新的通信链路,以保证相应的计算任务正常高效执行,提高计算效率。
对于导致通信链路产生计算延迟的因素包括但并不局限于上文列举的几种方式,可以基于历史数据或经验等确定,之后,在计算集群进行资源配置过程中,设置对应的资源调度条件时,可以结合确定的这些因素设置相应的资源调度条件内容,以便在计算集群工作过程中,可以基于该资源调度条件,确定需要获取的任务执行信息,进而确定该任务执行信息是否满足该资源调度条件,据此确定是否需要调整相应的通信网络关系,以保证通信效率,进而保证所执行的计算任务的计算效率和可靠性,实现过程本申请不做一一详述。
应该理解的是,在上述处理过程中,可以如上文描述的方式,基于导致第一待调度通信链路计算延迟过大的一种因素,实现通信网络关系的调整,也可以基于多种因素组合,调整相应的通信网络关系,解决计算延迟问题,提高计算效率,本申请不做一一举例详述。
参照图6,为本申请提出的异构计算资源控制方法的可选实施例五的流程示意图,本实施例可以对上文提出的异构计算资源控制方法的又一可选细化实现方式进行描述,区别于上文实施例描述的细化实现方式,如图6所示,该异构计算资源控制方法可以包括:
步骤S61,确定计算集群中各第一计算节点的第一资源配置信息;该第一资源配置信息至少包括对应的第一计算节点中多个第一处理器与多个网络适配器之间的第一通信网络关系;
步骤S62,响应于第一计算节点基于第一通信网络关系执行计算任务,获取针对第一计算节点与计算集群中的存储节点之间的通信链路的通信性能参数和通信负载数据;
关于步骤S61以及步骤S62的计算任务执行过程,可以参照上下文实施例对应部分的描述,如步骤S21和步骤S22对应部分的描述内容,本实施例在此不做详述。
在实际应用中,第一计算节点执行计算任务等操作产生的数据,在需要存储时,可以将数据通过通信链路发送至计算集群中的存储节点,为了保证存储可靠性和效率,本申请所获取的任务执行信息还可以包括第一计算节点与存储节点之间的通信链路的通信性能参数,如检测在实现数据存储过程中的通信延迟参数(如传输延迟时间)等,其检测实现过程与上文描述的计算延迟时间的检测方法类似,本申请不做详述。
此外,为了在出现数据传输过程中的传输延迟过大的问题时,能够及时检测并调整相应通信链路上出现的问题,本申请提出结合检测构建该通信链路的各节点和交换网络设备的通信负载数据,通过检测该通信负载数据是否超过预设负载范围,来确定相应设备是否存在异常问题,因此,在计算任务执行过程,还可以获取该通信负载数据。
其中,为了实现资源动态调度,保证对计算任务执行过程中涉及到的数据存储效率和可靠性,可以在计算集群的资源配置过程中,设置检测上述通信性能参数和通信负载数据,以及各自的合理范围即不需要进行资源调度的数值范围,如用于传输存储数据的最大传输延迟时间和通信负载范围等内容的第一资源调度条件,其可以存储于相应的第一计算节点的第一资源配置信息,这样,在该第一计算节点执行计算任务时,可以基于该第一资源调度条件内容,检测相应的任务执行信息,用以确定检测到的信息内容是否满足该第一资源调度条件,若不满足,可以按照下文步骤描述的方法进行资源调度。
需要说明,在本申请实施例中,为了保证计算任务的计算效率和可靠性,所获取的任务执行信息还可以包括上文描述的计算性能参数、各第一处理器之间的通信关联关系、各网络适配器的通信负载数据等之中的一个或多个,参照上文对应实施例描述的基于对应内容的任务执行信息实现的资源调度方法,获得新的异构计算资源控制方法实施例,实现过程本申请不做一一举例详述。
步骤S63,基于该通信性能参数,从相应第一计算节点与存储节点之间的通信链路中,确定存在传输延迟时间大于通信时间阈值的第二待调度通信链路;
继上述分析,参照上文对第一待调度通信链路的确定方法,本实施例,基于通信性能参数,确定相应的第一计算节点与存储节点之间的通信链路实际出现的传输延迟时间,将其与该第一计算节点的第一资源调度条件包含的针对该通信链路的通信时间阈值进行比较,确定该传输延迟时间大于该通信时间阈值,可以将对应的通信链路确定为第二待调度通信链路,等待后续的资源调度,以解决其存在的数据传输延迟问题,提高数据传输效率。
其中,对于不同第一计算节点与存储节点之间的不同通信链路,由于其传输路径和/或参与设备不同,正常通信情况下,将数据传输到目的设备所花费时长往往不同,对应设备的通信时间阈值可以不同,本申请对不同通信链路的通信时间阈值的数值及其配置方法不做限制,可视情况而定。应该理解的是,对调整通信链路的传输路径后,需要配置新的通信时间阈值,以保证后续异构计算资源控制可靠性。
另外,按照上文描述的处理方式,对于第一计算节点与存储节点之间的通信链路中,不存在传输延迟时间或存在的传输延时时间小于或等于对应的通信时间阈值的通信链路,可以不用执行后续的资源调度处理,也可以结合上文实施例描述的其他内容的任务执行信息,来确定是否需要进行调整,实现过程本实施例在此不做详述。
步骤S64,基于获取的通信负载数据,调整第二待调度通信链路,得到相应第一计算节点的第二资源配置信息。
对于需要调整的第二待调度通信链路,可能是因构成该第二待调度通信链路的各设备故障或超负荷运行等情况导致传输延迟过大,对于这些问题,本申请可以对各设备的通信负载数据进行分析,来确定相应设备是否异常或超负荷运行,从而有针对性的解决该问题,实现对第二待调度通信链路的调整,得到相应第一计算节点的第二资源配置信息。
其中,在通信负载数据非常小甚至为0或非常大超过预设的负载范围的情况下,确定设备异常或超负荷运行,若该设备是第一计算节点,可以参照上文实施例描述的第一通信网络关系的调整方式,实现第二待调度通信链路的调整,避免因网络适配器承担的通信负载过大而影响通信效率。若该设备是交换网络设备,可以调整其对外通信的通信端口,或结合计算集群中的其他交换网络设备的通信负载数据,将其替换为通信负载较低的其他交换网络设备,重新规划相应第一计算节点与存储节点之间的通信链路,实现过程本申请不做详述。
此外,若当前的存储节点的数据存储量或接入量过大,其通信负载数据(如通信链路接入量、通信链路传输数据的数据量等)超过预设负载范围,可以选择通信负载数据较低的其他存储节点替换,构建相应的第一计算节点与新的存储节点之间的通信链路,即实现对第二待调度通信链路的调整,得到该第一计算节点的第二资源配置信息。
可见,上述第二资源配置信息除了包括该第一计算节点内的不同第一处理器与网络适配器之间的通信网络关系外,还可以包括该第一计算节点的网络适配器与存储节点之间的通信网络关系,由此确定该第一计算节点当前使用哪一个或多个存储节点进行数据存储,如记录用于存储其执行的各计算任务的存储节点的设备标识等,本申请对第二资源配置信息的内容不做限制。
需要说明的是,第一计算节点执行多个计算任务的情况下,可以连接相同或不同的存储节点,以实现对不同计算任务的数据存储,这可以依据实际需求确定不同计算任务的数据存储关系。
综上,在需要对第一计算节点执行计算任务所需数据以及产生的数据进行存储的情况下,计算集群会配置相应第一计算节点与存储节点之间的通信链路,这样,在实际运行过程中,可以获取该通信链路的通信性能参数以及通信负载数据,能够基于当前的通信性能参数,及时确定这类通信链路中存在传输延迟过大的第二待调度通信链路,从而基于当前获得通信负载数据,及时且准确调整该第二待调度通信链路,满足相应第一计算节点的数据存储需求的同时,提高了数据传输效率。
结合上文各实施例描述的异构计算资源控制方法,为了避免按照上文任一个或多个组合的方式频繁进行资源动态调度,而消耗大量计算资源,造成不必要的资源浪费,本申请可以在各第一计算节点的第一资源配置信息中,设置对应的第一计算节点工作过程中,运行多长时间即预设时长,按照上文实施例描述的方法基于当前的任务执行信息,执行一次资源调度策略,优化计算集群的资源配置。不同第一计算节点的预设时长可以不同,本申请对各预设时长的数值不做限制,可以结合当前对各第一计算节点的资源配置确定,如其分配到的计算任务较多的情况下,可以设置相对较短的预设时长,以保证计算任务的执行效率和可靠性。
基于此,在任一第一计算节点执行计算任务过程中,获取任务执行信息时,可以先获取该第一计算节点的运行时长(即当前时间距离上一次资源调度时间的时间差),确定该运行时长是否大于对应的预设时长,如果大于预设时长,再检测其他任务执行信息,以按照对应实施例描述的实现方法执行资源调度策略,实现过程本实施例在此不做详述。反之,如果小于或等于该预设时长,暂时可以不用获取其他任务执行信息,也就不用进行资源调度,直至该第一计算节点的实际运行是否大于该预设时长。本申请通过控制资源调度次数的方式,减少资源调度过程中产生的资源消耗。
可选的,在计算集群初始运行之前,对第一计算节点的资源初始化配置过程中,可以对第一计算节点包含的各第一处理器和各网络适配器进行均衡配置,当然,对于计算集群中的其他节点,在构建相应的通信链路时,也可以采用负载均衡方式实现,后续可以依据实际执行的计算任务的变化,再按照上文描述的方法动态调整,保证不同应用场景下的计算效率。需要说明,对于资源的初始化配置方式,并不局限于本实施例描述的负载均衡分配方式,可以依据实际场景确定,本申请不做一一举例详述。
其中,在初始化配置过程中,为了便于后续检测任务执行信息,还可以配置相应的第一资源调度条件,以据此实现相应内容的任务执行信息的检测,还可以确定实际检测到的任务执行信息内容是否满足第一资源调度条件,若不再满足,可以按照相应实施例描述的方法进行资源调度,获得相应第一计算节点的第二资源配置信息,其可以包括第二资源调度条件,后续可以基于该第二资源调度条件继续进行任务执行信息的检测以及资源调度,实现过程类似本申请不做详述。
在确定第一计算节点的第二资源配置信息后,第一计算节点基于该第二资源配置信息执行计算任务的实现过程,可以是将第二资源配置信息包含的第二通信网络关系(即相应第一计算节点中多个第一处理器与网络适配器之间的通信网络关系)发送至相应的网络适配器和计算集群中的交换网络设备,以调整相应的通信链路,从而通过调整后的通信链路执行计算任务,如实现第一计算节点与相应第二计算节点和/或存储节点之间的通信,满足计算需求以及数据存储需求,且避免计算延迟和通信延迟,提高计算效率和数据传输效率。
可见,在计算集群工作过程中,由于第一计算节点中的第一处理器与网络适配器之间的通信网络关系可以动态调整,这样,在哪个网络适配器或计算集群的某交换网络设备故障,通过获取的任务执行信息可以及时发现,结合资源调度策略,及时调整相应的通信网络关系,即优化计算集群的资源配置,从而按照调整后的通信网络关系执行计算任务,保证了不同应用场景下的计算任务执行可靠性,提高了计算效率和适应性。
结合上述分析,在实际应用中,结合如上文实施例描述的细化实现方式,结合任务执行过程中的某一方面的信息,如上述计算性能参数、通信性能参数、通信负载数据、通信负载关联关系等之中任一方面,实现对第一计算节点中第一通信网络关系的动态调整,根据需要还可以重新规划相应的交换网络设备和其他节点,以优化整个网络配置,提高通信效率。
可选的,本申请也可以结合两个或更多方面实现网络配置优化,且在该实现过程中,可以基于不同方面对整个网络性能的影响了,确定相应的调整权重,据此实现各种通信网络关系的动态调整,优化整个网络的传输路径,提高计算效率,也使得计算集群整个网络的传输路径清晰,便于维护管理,实现过程本申请不做详述。
应该理解,在计算集群的网络结构发生变化,如增加节点或删除节点等情况下,仍可以按照本申请提出的异构计算资源控制方法,合理调整通信网络关系,确定使用的各第一计算节点的资源配置信息,据此可靠且高效执行计算任务,满足异构计算需求。
参照图7,为本申请提出的异构计算资源控制装置的一可选实施例的结构示意图,其可以适用于计算集群中的异构计算资源控制设备,如图7所示,该异构计算资源控制装置可以包括:
第一资源配置信息确定模块71,用于确定计算集群中各第一计算节点的第一资源配置信息;所述第一资源配置信息至少包括对应的第一计算节点中多个第一处理器与多个网络适配器之间的第一通信网络关系;
任务执行信息获取模块72,用于响应于所述第一计算节点基于所述第一通信网络关系执行计算任务,获取相应的任务执行信息;
第二资源配置信息确定模块73,用于依据资源调度策略和所述任务执行信息,确定各所述第一计算节点的第二资源配置信息,以使所述第一计算节点基于所述第二资源配置信息执行所述计算任务。
可选的,上述在上述任务执行信息能够表征所述第一计算节点以及所述第一计算节点与所述计算集群中的其他节点之间的通信链路的任务执行情况时,上述任务执行信息获取模块72可以包括以下至少一个获取单元:
运行时长获取单元,用于获取所述第一计算节点的运行时长;
通信负载数据获取单元,用于获取所述第一计算节点中所述网络适配器的通信负载数据;
通信负载关联关系获取单元,用于获取同一所述第一计算节点中不同所述第一处理器之间的通信负载关联关系;
计算性能参数获取单元,用于获取针对所述第一计算节点与所述计算集群中的第二计算节点之间的通信链路的计算性能参数;所述第二计算节点是指所述包含第二处理器的节点,所述第二处理器与所述第一处理器的处理方式不同;
通信性能参数获取单元,用于获取针对所述第一计算节点与所述计算集群中的存储节点之间的通信链路的通信性能参数。
基于此,在一些实施例中,上述第二资源配置信息确定模块73可以包括:
第一确定单元,用于基于所述任务执行信息包含的通信负载数据,确定相应的所述第一计算节点中运行的多个所述网络适配器的通信负载超过预设负载范围;
第一调整单元,用于基于所述任务执行信息包含的通信负载数据,按照所述资源调度策略包含的针对所述网络适配器的负载均衡方式,调整所述第一计算节点中的所述第一通信网络关系;
第一获得单元,用于获得相应所述第一计算节点的第二资源配置信息;
其中,所述第二资源配置信息至少包括所述第一计算节点中多个所述第一处理器与多个所述网络适配器之间的第二通信网络关系。
在另一些实施例中,上述第二资源配置信息确定模块73可以包括:
第二确定单元,用于基于所述任务执行信息包含的计算性能参数,从相应所述第一计算节点与所述计算集群中的第二计算节点之间的通信链路中,确定存在计算延迟时间大于计算时间阈值的第一待调度通信链路;
通信跳转次数确定单元,用于确定所述第一待调度通信链路中存在的通信跳转次数;一次通信跳转是指所述计算集群的位于所述第一待调度通信链路中的一个交换网络设备执行的网络交换操作;
通信环路确定单元,用于如果所述通信跳转次数大于相应的预设跳转阈值,确定相应的所述第一待调度通信链路存在通信环路;所述预设跳转阈值针对相应的所述第一计算节点与所述第二计算节点之间的通信链路确定;
第二调整单元,用于基于所述任务执行信息中各所述交换网络设备的负载数据,调整所述第一待调度通信链路中存在的通信网络关系,得到相应所述第一计算节点的第二资源配置信息;
其中,调整的所述通信网络关系包括所述第一计算节点的所述网络适配器与所述交换网络设备之间的第三通信网络关系,以及不同所述交换网络设备之间的第四通信网络关系。
在又一些实施例中,上述第二资源配置信息确定模块73可以包括:
第三确定单元,用于基于所述任务执行信息包含的通信性能参数,从相应所述第一计算节点与所述计算集群中的存储节点之间的通信链路中,确定存在传输延迟时间大于通信时间阈值的第二待调度通信链路;
第三调整单元,用于基于所述任务执行信息包含的通信负载数据,调整所述第二待调度通信链路,得到相应所述第一计算节点的第二资源配置信息。
在其他实施例中,上述第二资源配置信息确定模块73可以包括:
第四确定单元,用于基于所述任务执行信息包含的相应所述第一计算节点中不同所述第一处理器之间的通信负载关联关系,确定不同所述第一处理器之间的通信关联度;
第四调整单元,用于基于所述通信关联度,调整相应的所述第一通信网络关系,得到所述第一计算节点的第二资源配置信息。
可选的,第四调整单元可以包括:
第二通信网络关系得到单元,用于将所述通信关联度大于关联阈值的多个第一处理器调度给相应所述第一计算节点中的同一所述网络适配器,得到对应的第二通信网络关系;
第二资源配置信息得到单元,用于基于所述第二通信网络关系,得到相应所述第一计算节点的第二资源配置信息。
综上,上述异构计算资源控制装置还可以包括:
第二资源配置信息发送模块,用于将所述第二资源配置信息包含的第二通信网络关系发送至对应的所述网络适配器和所述计算集群中的交换网络设备,以调整所述计算集群中的通信链路,通过调整后的通信链路执行所述计算任务;
其中,所述第二通信网络关系是指相应的所述第一计算节点中多个所述第一处理器与多个所述网络适配器之间的通信网络关系。
需要说明的是,关于上述各装置实施例中的各种模块、单元等,均可以作为程序模块存储在存储器中,由处理器执行存储在存储器中的上述程序模块,以实现相应的功能,关于各程序模块及其组合所实现的功能,以及达到的技术效果,可以参照上述方法实施例相应部分的描述,本实施例不再赘述。
本申请还提供了一种计算机可读存储介质,其上可以存储至少一个计算机指令集,处理设备通过执行该计算机指令,实现本申请提出的异构计算资源控制方法,关于异构计算资源控制方法的实现过程,可以参照上文方法实施例对应部分的描述,本申请在此不做一一举例详述。
参照图8,为本申请提出的异构计算资源控制设备的一可选实施例的硬件结构示意图,该异构计算资源控制设备可以是服务器或具有处理能力的终端设备,其部署在计算集群(如图1所示的系统架构示意图)中,以实现对计算集群的异构计算资源的动态调度,保证计算效率和可靠性。如图8所示,该异构计算资源控制设备可以包括:多个通信连接端口81和资源调度处理器82,其中:
不同通信连接端口81可以分别连接计算集群中各计算节点、存储节点和交换网络设备。因此,该通信连接端口81包括支持如wifi、蓝牙和/或近场通道方式等无线通信方式对应的通讯元件,以使得异构计算资源控制设备可以通过该通讯元件,实现与其他设备(如上述计算集群中的其他节点、交换网络设备等)进行数据传输,如接收任务执行信息,发送资源配置信息等,本申请对通信连接端口81的组成结构及其对应的通信传输机制不做限制,可视情况而定。
可选的,通信连接端口81还可以包括一个或多个支持有线通信方式的接口,如以太网接口、光纤网络接口、通用输入输出(general-purpose input/output,GPIO)接口、USB接口、通用异步收发传输器(universal asynchronous receiver/transmitter,UART)接口等,以实现计算机设备内部各组成部分之间的数据传输,本申请对通信连接端口81的类型和数量不做限制,可视情况而定。其中,对于异构计算资源控制设备中的各组成部分之间可以通过通信总线,如数据总线、指令总线等进行数据交互。
资源调度处理器82可以连接多个通信连接端口81,用于执行多个计算机指令,实现本申请提出的异构计算资源控制方法,实现过程可以参照上文方法实施例对应部分的描述,本实施例在此不做详述。
可选的,资源调度处理器82可以包括至少一个存储单元和至少一个处理单元,处理单元可以执行存储单元存储的计算机指令,实现本申请提出的异构计算资源控制方法。
本申请实施例中,上述资源调度处理器82或其包含的处理单元可以包括加速计算处理器,应用处理器(application processor,AP),调制解调处理器,图形处理器(graphics processing unit,GPU),图像信号处理器(image signal processor,ISP),控制器,视频编解码器,数字信号处理器(digital signal processor,DSP)、中央处理器(Central Processing Unit,CPU)、特定应用集成电路(application-specificintegrated circuit,ASIC)现成可编程门阵列(FPGA)或者其他可编程逻辑器件等。存储单元可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件或其他易失性固态存储器件等,本申请对资源调度处理器82的组成结构不做限制。
应该理解的是,图8所示的异构计算资源控制设备的结构并不构成对本申请实施例中异构计算资源控制设备的限定,在实际应用中,异构计算资源控制设备可以包括比图8所示的更多或更少的部件,或者组合某些部件,可以结合计算集群的管理需求确定,本申请在此不做一一列举。
最后,需要说明的是,关于上述各实施例中,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的步骤和元素,而这些步骤和元素不构成一个排它性的罗列,方法或者设备也可能包含其它的步骤或元素。由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法或者设备中还存在另外的相同要素。
其中,在本申请实施例的描述中,除非另有说明,“/”表示或的意思,例如,A/B可以表示A或B;本文中的“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,在本申请实施例的描述中,“多个”是指两个或多于两个。
本申请涉及到的术语诸如“第一”、“第二”等仅用于描述目的,用来将一个操作、单元或模块与另一个操作、单元或模块区分开来,而不一定要求或者暗示这些单元、操作或模块之间存在任何这种实际的关系或者顺序。且不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量,由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。
另外,本说明书中各个实施例采用递进或并列的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置、设备而言,由于其与实施例公开的方法对应,所以描述的比较简单,相关之处参见方法部分说明即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (10)
1.一种异构计算资源控制方法,所述异构计算资源控制方法包括:
确定计算集群中各第一计算节点的第一资源配置信息;所述第一资源配置信息至少包括对应的第一计算节点中多个第一处理器与多个网络适配器之间的第一通信网络关系;
响应于所述第一计算节点基于所述第一通信网络关系执行计算任务,获取相应的任务执行信息;
依据资源调度策略和所述任务执行信息,确定各所述第一计算节点的第二资源配置信息,以使所述第一计算节点基于所述第二资源配置信息执行所述计算任务。
2.根据权利要求1所述的异构计算资源控制方法,所述任务执行信息能够表征所述第一计算节点以及所述第一计算节点与所述计算集群中的其他节点之间的通信链路的任务执行情况,所述获取相应的任务执行信息,包括以下至少一种:
获取所述第一计算节点的运行时长;
获取所述第一计算节点中所述网络适配器的通信负载数据;
获取同一所述第一计算节点中不同所述第一处理器之间的通信负载关联关系;
获取针对所述第一计算节点与所述计算集群中的第二计算节点之间的通信链路的计算性能参数;所述第二计算节点是指所述包含第二处理器的节点,所述第二处理器与所述第一处理器的处理方式不同;
获取针对所述第一计算节点与所述计算集群中的存储节点之间的通信链路的通信性能参数。
3.根据权利要求2所述的异构计算资源控制方法,所述依据资源调度策略和所述任务执行信息,确定各所述第一计算节点的第二资源配置信息,包括:
基于所述任务执行信息包含的通信负载数据,确定相应的所述第一计算节点中运行的多个所述网络适配器的通信负载超过预设负载范围;
基于所述任务执行信息包含的通信负载数据,按照所述资源调度策略包含的针对所述网络适配器的负载均衡方式,调整所述第一计算节点中的所述第一通信网络关系,获得相应所述第一计算节点的第二资源配置信息;
其中,所述第二资源配置信息至少包括所述第一计算节点中多个所述第一处理器与多个所述网络适配器之间的第二通信网络关系。
4.根据权利要求2所述的异构计算资源控制方法,所述依据资源调度策略和所述任务执行信息,确定各所述第一计算节点的第二资源配置信息,包括:
基于所述任务执行信息包含的计算性能参数,从相应所述第一计算节点与所述计算集群中的第二计算节点之间的通信链路中,确定存在计算延迟时间大于计算时间阈值的第一待调度通信链路;
确定所述第一待调度通信链路中存在的通信跳转次数;一次通信跳转是指所述计算集群的位于所述第一待调度通信链路中的一个交换网络设备执行的网络交换操作;
如果所述通信跳转次数大于相应的预设跳转阈值,确定相应的所述第一待调度通信链路存在通信环路;所述预设跳转阈值针对相应的所述第一计算节点与所述第二计算节点之间的通信链路确定;
基于所述任务执行信息中各所述交换网络设备的负载数据,调整所述第一待调度通信链路中存在的通信网络关系,得到相应所述第一计算节点的第二资源配置信息;
其中,调整的所述通信网络关系包括所述第一计算节点的所述网络适配器与所述交换网络设备之间的第三通信网络关系,以及不同所述交换网络设备之间的第四通信网络关系。
5.根据权利要求2所述的异构计算资源控制方法,所述依据资源调度策略和所述任务执行信息,确定各所述第一计算节点的第二资源配置信息,包括:
基于所述任务执行信息包含的通信性能参数,从相应所述第一计算节点与所述计算集群中的存储节点之间的通信链路中,确定存在传输延迟时间大于通信时间阈值的第二待调度通信链路;
基于所述任务执行信息包含的通信负载数据,调整所述第二待调度通信链路,得到相应所述第一计算节点的第二资源配置信息。
6.根据权利要求2所述的异构计算资源控制方法,所述依据资源调度策略和所述任务执行信息,确定各所述第一计算节点的第二资源配置信息,包括:
基于所述任务执行信息包含的相应所述第一计算节点中不同所述第一处理器之间的通信负载关联关系,确定不同所述第一处理器之间的通信关联度;
基于所述通信关联度,调整相应的所述第一通信网络关系,得到所述第一计算节点的第二资源配置信息。
7.根据权利要求6所述的异构计算资源控制方法,所述基于所述通信关联度,调整相应的所述第一通信网络关系,得到所述第一计算节点的第二资源配置信息,包括:
将所述通信关联度大于关联阈值的多个第一处理器调度给相应所述第一计算节点中的同一所述网络适配器,得到对应的第二通信网络关系;
基于所述第二通信网络关系,得到相应所述第一计算节点的第二资源配置信息。
8.根据权利要求1-7任一项所述的异构计算资源控制方法,所述第一计算节点基于所述第二资源配置信息执行所述计算任务,包括:
将所述第二资源配置信息包含的第二通信网络关系发送至对应的所述网络适配器和所述计算集群中的交换网络设备,以调整所述计算集群中的通信链路,通过调整后的通信链路执行所述计算任务;
其中,所述第二通信网络关系是指相应的所述第一计算节点中多个所述第一处理器与多个所述网络适配器之间的通信网络关系。
9.一种异构计算资源控制装置,所述异构计算资源控制装置包括:
第一资源配置信息确定模块,用于确定计算集群中各第一计算节点的第一资源配置信息;所述第一资源配置信息至少包括对应的第一计算节点中多个第一处理器与多个网络适配器之间的第一通信网络关系;
任务执行信息获取模块,用于响应于所述第一计算节点基于所述第一通信网络关系执行计算任务,获取相应的任务执行信息;
第二资源配置信息确定模块,用于依据资源调度策略和所述任务执行信息,确定各所述第一计算节点的第二资源配置信息,以使所述第一计算节点基于所述第二资源配置信息执行所述计算任务。
10.一种异构计算资源控制设备,所述异构计算资源控制设备包括:多个通信连接端口和资源调度处理器,其中:
不同所述通信连接端口分别连接计算集群中各计算节点、存储节点和交换网络设备;
所述资源调度处理器连接所述多个通信连接端口,用于执行多个计算机指令,实现以下步骤:
确定计算集群中各第一计算节点的第一资源配置信息;所述第一资源配置信息至少包括对应的第一计算节点中多个第一处理器与多个网络适配器之间的第一通信网络关系;
响应于所述第一计算节点基于所述第一通信网络关系执行计算任务,获取相应的任务执行信息;
依据资源调度策略和所述任务执行信息,确定各所述第一计算节点的第二资源配置信息,以使所述第一计算节点基于所述第二资源配置信息执行所述计算任务。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311632049.4A CN117608848A (zh) | 2023-11-30 | 2023-11-30 | 一种异构计算资源控制方法、装置及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311632049.4A CN117608848A (zh) | 2023-11-30 | 2023-11-30 | 一种异构计算资源控制方法、装置及设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117608848A true CN117608848A (zh) | 2024-02-27 |
Family
ID=89955905
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311632049.4A Pending CN117608848A (zh) | 2023-11-30 | 2023-11-30 | 一种异构计算资源控制方法、装置及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117608848A (zh) |
-
2023
- 2023-11-30 CN CN202311632049.4A patent/CN117608848A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3637733B1 (en) | Load balancing engine, client, distributed computing system, and load balancing method | |
US20200167258A1 (en) | Resource allocation based on applicable service level agreement | |
KR102034532B1 (ko) | 스펙트럼 리소스들의 제공 및 분배를 위한 시스템 및 방법 | |
US11751067B2 (en) | Performance assurance and optimization for GAA and PAL devices in a CBRS network for private enterprise environment | |
US11099906B2 (en) | Handling tenant requests in a system that uses hardware acceleration components | |
Zhou et al. | A load balancing strategy of sdn controller based on distributed decision | |
US10572290B2 (en) | Method and apparatus for allocating a physical resource to a virtual machine | |
EP3283953B1 (en) | Providing services in a system having a hardware acceleration plane and a software plane | |
US10469805B2 (en) | Load balancing method, and related apparatus and system | |
CN103401947A (zh) | 多个服务器的任务分配方法和装置 | |
CN107645407B (zh) | 一种适配QoS的方法和装置 | |
RU2679555C1 (ru) | Система управления связью, способ управления связью и носитель записи | |
US20220217089A1 (en) | Path traffic allocation method, network device, and network system | |
CN111181873B (zh) | 数据发送方法、装置、存储介质和电子设备 | |
US10425293B2 (en) | Network resource allocation proposals | |
Borylo et al. | Latency and energy-aware provisioning of network slices in cloud networks | |
KR20200133478A (ko) | 클라우드 시스템에서 자원을 조정하기 위한 장치 및 방법 | |
CN107113323B (zh) | 一种数据存储方法、装置和系统 | |
CN117608848A (zh) | 一种异构计算资源控制方法、装置及设备 | |
WO2017213065A1 (ja) | サービス管理システム、サービス管理方法、および、記録媒体 | |
CN115878309A (zh) | 资源分配方法、装置、处理核、设备和计算机可读介质 | |
WO2024041572A1 (zh) | 业务处理方法、装置、设备、介质及程序产品 | |
WO2023214442A1 (ja) | O-ranにおけるハードウェアアクセラレーション指針の発行 | |
WO2023105670A1 (ja) | リソース管理装置及びプログラム | |
US11695700B2 (en) | Information processing apparatus, computer-readable recording medium storing overload control program, and overload control method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |