CN113315700A - 算力资源调度方法、装置和存储介质 - Google Patents
算力资源调度方法、装置和存储介质 Download PDFInfo
- Publication number
- CN113315700A CN113315700A CN202010118240.7A CN202010118240A CN113315700A CN 113315700 A CN113315700 A CN 113315700A CN 202010118240 A CN202010118240 A CN 202010118240A CN 113315700 A CN113315700 A CN 113315700A
- Authority
- CN
- China
- Prior art keywords
- computing
- network
- matched
- power node
- node
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 44
- 238000003860 storage Methods 0.000 title claims abstract description 15
- 238000004364 calculation method Methods 0.000 claims abstract description 75
- 238000009826 distribution Methods 0.000 claims abstract description 22
- 238000004590 computer program Methods 0.000 claims description 11
- 238000004422 calculation algorithm Methods 0.000 claims description 10
- 230000008859 change Effects 0.000 claims description 9
- 230000005540 biological transmission Effects 0.000 claims description 5
- 238000010586 diagram Methods 0.000 description 18
- 238000007726 management method Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 210000001503 joint Anatomy 0.000 description 2
- 238000013468 resource allocation Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000004883 computer application Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L45/00—Routing or path finding of packets in data switching networks
- H04L45/02—Topology update or discovery
- H04L45/04—Interdomain routing, e.g. hierarchical routing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L47/00—Traffic control in data switching networks
- H04L47/70—Admission control; Resource allocation
- H04L47/83—Admission control; Resource allocation based on usage prediction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5005—Allocation of resources, e.g. of the central processing unit [CPU] to service a request
- G06F9/5027—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5005—Allocation of resources, e.g. of the central processing unit [CPU] to service a request
- G06F9/5027—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
- G06F9/5044—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering hardware capabilities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5061—Partitioning or combining of resources
- G06F9/5072—Grid computing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L45/00—Routing or path finding of packets in data switching networks
- H04L45/12—Shortest path evaluation
- H04L45/124—Shortest path evaluation using a combination of metrics
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L47/00—Traffic control in data switching networks
- H04L47/70—Admission control; Resource allocation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2209/00—Indexing scheme relating to G06F9/00
- G06F2209/50—Indexing scheme relating to G06F9/50
- G06F2209/502—Proximity
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明公开了一种算力资源调度方法、装置和存储介质,涉及计算机技术领域。算力资源调度方法包括:将每个算力节点的访问信息通过报文分发到网络中,进行报文分发的起点为算力节点的接入设备、终点为客户设备的接入设备;根据客户设备获取的报文,确定每个算力节点到客户设备之间的每个网络路径的网络状况;根据客户设备的计算需求、网络状况以及预先确定的每个算力节点的算力资源,确定与计算需求匹配的算力节点和匹配的网络路径;根据匹配的网络路径,建立匹配的算力节点与客户设备之间的连接。本发明能够更合理地为用户分配资源,实现了算力服务的自动化部署。
Description
技术领域
本发明涉及计算机技术领域,特别涉及一种算力资源调度方法、装置和存储介质。
背景技术
随计算机应用业务和计算机技术的发展,各类算力资源池层出不穷。不同类型的算力资源池对应不同的网络接入指标要求,例如时延、抖动等。视频识别等人工智能(Artificial Intelligence,简称:AI)类应用对算力资源和网络状况都有要求。在相关技术中,先为AI应用分配算力资源,再设法完成网络连接要求。
除此之外,在边缘计算节点大规模部署后,边云、边边之间的算力分配与调度成为边缘计算领域最为关心的话题。为了解决这个问题,在相关技术中,方案之一是采用“云边协同”的方案,即将边缘计算同样划分为IaaS(Infrastructure as a Service,基础设施即服务)、PaaS(Platform as a Service,平台即服务)、SaaS(Software as a Service,软件即服务)等多层,然后将EC(Edge Computing,边缘计算)-IaaS与云端IaaS对接实现对网络、虚拟化资源、安全等的资源协同;EC-PaaS与云端PaaS对接实现数据协同、智能协同、应用管理协同、业务管理协同;EC-SaaS与云端SaaS对接实现服务协同。方案二是使用云网融合的方案,实现云和网络的连通和协同工作。
发明内容
发明人经过分析后发现,相关技术的先确定算力资源、再设法完成网络连接的方式导致成本增加,资源配置不能实现全局优化,甚至会出现因低质客户占据高质资源,而有强烈付费意愿的高质客户无法享受服务的状况出现。
而在相关技术中,方案一需要边缘计算节点具备复杂的云计算管理平台,但边缘计算所在的边缘机房一般环境受限,能够容纳的服务器资源有限,此方案需要将过多的资源用于管理和协同,其建设与维护成本可观,存在一定的局限性。而方案二中的云网融合方案还处在一个相对简单的初级阶段。为了实现云网融合,通常需要建设一个横跨云网和网管的超级协同编排系统,运营难度相对复杂。
本发明实施例所要解决的一个技术问题是:如何在提高资源配置合理性的前提下为用户提供算力服务。
根据本发明一些实施例的第一个方面,提供一种算力资源调度方法,包括:将每个算力节点的访问信息通过报文分发到网络中,进行报文分发的起点为算力节点的接入设备、终点为客户设备的接入设备;根据客户设备获取的报文,确定每个算力节点到客户设备之间的每个网络路径的网络状况;根据客户设备的计算需求、网络状况以及预先确定的每个算力节点的算力资源,确定与计算需求匹配的算力节点和匹配的网络路径;根据匹配的网络路径,建立匹配的算力节点与客户设备之间的连接,以便客户设备利用匹配的算力节点进行计算。
在一些实施例中,将每个算力节点的访问信息通过路由协议报文分发到网络中,以便路由协议报文在传输过程中进行更新、并通过一个或多个网络路径到达客户设备。
在一些实施例中,算力节点的访问信息包括算力节点的标识、下一跳地址、本地接口标识、本节点到算力节点的时延中的一个或多个。
在一些实施例中,根据客户设备的计算需求、网络状况以及预先确定的每个算力节点的算力资源,确定与计算需求匹配的算力节点和匹配的网络路径包括:根据客户设备的计算需求,确定客户设备的算力需求和网络需求;将对应的算力节点的算力资源高于算力需求、网络状况高于网络需求的网络路径确定为与计算需求匹配的网络路径,将匹配的网络路径对应的算力节点确定为匹配的算力节点。
在一些实施例中,根据匹配的网络路径,建立匹配的算力节点与客户设备之间的连接包括:在匹配的网络路径有多个的情况下,在匹配的网络路径中,根据网络状况最差的、或者对应的算力节点的算力资源最少的网络路径,建立相应的算力节点与客户设备之间的连接。
在一些实施例中,客户设备的计算需求中包括算力需求和网络需求;或者,客户设备的计算需求中包括应用类型,客户设备的算力需求和网络需求根据预先建立的应用类型与算力需求、网络需求之间的对应关系确定。
在一些实施例中,算力资源调度方法还包括:将算力节点的属性信息以及算力节点支持的算法信息输入到预先训练的算力预测模型中,获得算力预测模型输出的算力节点的算力资源;其中,算力预测模型是根据其他算力节点的属性信息、其他算力节点支持的算法信息以及其他算力节点的算力资源训练的。
在一些实施例中,算力资源调度方法还包括:根据客户设备对业务使用量的变化,预测客户设备的未来计算需求;根据未来计算需求重新确定与计算需求匹配的算力节点和匹配的网络路径;根据重新确定的匹配的网络路径,建立重新确定的匹配的算力节点与客户设备之间的连接,以便客户设备利用重新确定的匹配的算力节点进行计算。
在一些实施例中,根据客户设备对业务使用量的变化,预测客户设备的未来计算需求包括:将客户设备的变化后的业务使用量、业务类型输入到预先训练的未来计算需求预测模型中,获得未来计算需求预测模型输出的客户设备的未来计算需求。
在一些实施例中,网络状况包括时延、丢包率、带宽中的一种或多种。
根据本发明一些实施例的第二个方面,提供一种算力资源调度装置,包括:分发模块,被配置为将每个算力节点的访问信息通过报文分发到网络中,进行报文分发的起点为算力节点的接入设备、终点为客户设备的接入设备;网络状况确定模块,被配置为根据客户设备获取的报文,确定每个算力节点到客户设备之间的每个网络路径的网络状况;匹配模块,被配置为根据客户设备的计算需求、网络状况以及预先确定的每个算力节点的算力资源,确定与计算需求匹配的算力节点和匹配的网络路径;连接建立模块,被配置为根据匹配的网络路径,建立匹配的算力节点与客户设备之间的连接,以便客户设备利用匹配的算力节点进行计算。
根据本发明一些实施例的第三个方面,提供一种算力资源调度装置,包括:存储器;以及耦接至存储器的处理器,处理器被配置为基于存储在存储器中的指令,执行前述任意一种算力资源调度方法。
根据本发明一些实施例的第四个方面,提供一种计算机可读存储介质,其上存储有计算机程序,其中,该程序被处理器执行时实现前述任意一种算力资源调度方法。
上述发明中的一些实施例具有如下优点或有益效果:本发明可以借助网络分发算力节点的访问信息,在分发的过程中确定网络状况,以减轻系统管控的压力。并且,能够根据客户设备的计算需求同时确定最匹配的算力节点和网络路径,从而更合理地为用户分配资源。该过程无需用户指定算力服务的部署位置,实现了算力服务的自动化部署。
通过以下参照附图对本发明的示例性实施例的详细描述,本发明的其它特征及其优点将会变得清楚。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1示出了根据本发明一些实施例的算力资源调度方法的流程示意图。
图2示例性地示出了算力资源调度的一个网络场景。
图3示出了根据本发明一些实施例的算力节点重分配方法的流程示意图。
图4示出了根据本发明一些实施例的算力资源调度装置的结构示意图。
图5示出了根据本发明另一些实施例的算力资源调度装置的结构示意图。
图6示出了根据本发明又一些实施例的算力资源调度装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本发明及其应用或使用的任何限制。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。
同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为授权说明书的一部分。
在这里示出和讨论的所有示例中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它示例可以具有不同的值。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
图1示出了根据本发明一些实施例的算力资源调度方法的流程示意图。如图1所示,该实施例的算力资源调度方法包括步骤S102~S108。
在步骤S102中,将每个算力节点的访问信息通过报文分发到网络中,进行报文分发的起点为算力节点的接入设备、终点为客户设备的接入设备。
在一些实施例中,算力节点的访问信息包括算力节点的标识、下一跳地址、本地接口标识等等。此外,还可以包括本节点到算力节点的时延,时延信息可以在网络中的各个节点的传递过程中不断更新。
在一些实施例中,将每个算力节点的访问信息通过路由协议报文分发到网络中,以便路由协议报文在传输过程中进行更新、并通过一个或多个网络路径到达客户设备。例如,可以使用BGP(Border Gateway Protocol,边界网关协议)传输报文。通过在BGP路由协议中增加算力节点的访问信息的字段,使得算力节点的访问信息可以在BGP邻居之间传递,并在传递算力资源信息的同时,利用网络遥测(Telemetry)等协议,测量出本节点到算力节点之间的时延信息,并更新报文中的时延字段。
在步骤S104中,根据客户设备获取的报文,确定每个算力节点到客户设备之间的每个网络路径的网络状况。网络状况例如为时延、丢包率、带宽等信息。
在步骤S106中,根据客户设备的计算需求、网络状况以及预先确定的每个算力节点的算力资源,确定与计算需求匹配的算力节点和匹配的网络路径。
算力资源例如可以包括CPU、GPU、内存、存储空间等指标。此外,还可以根据预设的规则,将算力节点的多个指标融合并量化为一个数值,以便于进行匹配。
在一些实施例中,客户设备的计算需求中包括算力需求和网络需求。例如,需要的算力值、CPU个数、网络时延、网络丢包率等比较明确的参数。
在一些实施例中,客户设备的计算需求中包括应用类型,客户设备的算力需求和网络需求根据预先建立的应用类型与算力需求、网络需求之间的对应关系确定。例如,计算需求中可以包括{应用类型:人脸识别,响应速度:高},或者计算需求中可以包括{应用类型:人脸识别,延迟:60ms}。这样,当用户不明确算力需求、或者只了解部分算力需求的情况下,也可以使用本发明的方法。应用类型与算力需求、网络需求之间的对应关系可以根据历史数据确定。
在一些实施例中,可以使用机器学习的方法确定算力节点的算力资源。将算力节点的属性信息以及算力节点支持的算法信息输入到预先训练的算力预测模型中,获得算力预测模型输出的算力节点的算力资源;其中,算力预测模型是根据其他算力节点的属性信息、其他算力节点支持的算法信息以及其他算力节点的算力资源训练的,训练的对象可以是机器学习模型。从而,可以准确、高效地评估算力节点的算力资源。在一些实施例中,算力预测模型输出的为算力值,从而便于将算力资源以数值的方式表示,便于不同算力资源之间的横向比较。
在步骤S108中,根据匹配的网络路径,建立匹配的算力节点与客户设备之间的连接,以便客户设备利用匹配的算力节点进行计算。
通过上述实施例的方法,可以借助网络分发算力节点的访问信息,在分发的过程中确定网络状况,以减轻系统管控的压力。并且,能够根据客户设备的计算需求同时确定最匹配的算力节点和网络路径,从而更合理地为用户分配资源。该过程无需用户指定算力服务的部署位置,实现了算力服务的自动化部署。
在一些实施例中,根据客户设备的计算需求,确定客户设备的算力需求和网络需求;将对应的算力节点的算力资源高于算力需求、网络状况高于网络需求的网络路径确定为与计算需求匹配的网络路径,将匹配的网络路径对应的算力节点确定为匹配的算力节点。
图2示例性地示出了算力资源调度的一个网络场景。云计算节点C1、城域计算节点C2和边缘计算节点C3作为算力节点为用户提供算力服务。T1为租户1的客户设备。T1的接入设备为R1。
通过网络确定各个路径的网络状况,并结合预先确定的各个算力节点的算力资源,建立算力节点、算力资源、网络状况的对应关系表,以便于进行匹配。表1示例性地示出了一个对应关系表。
表1
算力节点 | 算力资源 | 路径 | 时延 |
C1 | 100 | R1->R2->R3->R4 | 50 |
C1 | 100 | R1->R6->R5->R4 | 70 |
C2 | 10 | R1->R2->R3 | 10 |
C3 | 5 | R1->R2 | 5 |
设租户1的算力需求为70、时延需求为60,则可以选择表1中的第一个条目作为匹配条目,即算力节点C1、网络路径R1->R2->R3->R4。
在一些实施例中,在匹配的网络路径有多个的情况下,在匹配的网络路径中,根据网络状况最差的、或者对应的算力节点的算力资源最少的网络路径,建立相应的算力节点与客户设备之间的连接。例如,设租户1的算力需求为70、时延需求为75,则表1中的第一和第二个条目均为匹配条目。此时可以选择这两个条目中时延较高、即网络状况更差的第二个条目,以便将第一个条目保留给需求更高的用户。
本发明的实施例还可以预测用户对算力资源需求的变化,以便及时调整为用户分配的算力节点。下面参考图3描述重新分配算力节点的实施例。
图3示出了根据本发明一些实施例的算力节点重分配方法的流程示意图。如图3所示,该实施例的算力节点重分配方法包括步骤S302~S306。
在步骤S302中,根据客户设备对业务使用量的变化,预测客户设备的未来计算需求。
在一些实施例中,步骤S302可以定期执行,以及时发现用户的需求变化。
在步骤S304中,根据未来计算需求重新确定与计算需求匹配的算力节点和匹配的网络路径。
在步骤S306中,根据重新确定的匹配的网络路径,建立重新确定的匹配的算力节点与客户设备之间的连接,以便客户设备利用重新确定的匹配的算力节点进行计算。
例如,某个人脸识别业务部署在了算力节点A,算力节点A和配置的网络路径可以满足普通的使用需求。而当部署该业务的园区举行大规模的会议时,人流量相较以往大幅增长,因此需要在终端多开启一些摄像头,导致业务数据流量激增。在检测到了业务访问数增加、访问流量激增的情况下,算力节点A已经不能满足该业务需求。通过重新匹配算力节点和网络路径,将该业务调度到可以满足业务需求的算力节点B中进行部署,并将用户的业务流量通过匹配的网络路径引导到算力节点B。
在一些实施例中,可以将客户设备的变化后的业务使用量、业务类型输入到预先训练的未来计算需求预测模型中,获得未来计算需求预测模型输出的客户设备的未来计算需求。未来计算需求预测模型可以是根据历史数据对机器学习模型进行训练而得到的。训练数据可以包括业务使用量、业务类型,其标记值为计算需求,例如包括算力资源和网络状况。
通过上述实施例的方法,可以预测用户业务需求的变化,并主动调整算力服务的部署位置,保障用户的业务需求,实现算力资源利用率的最大化。
下面参考图4描述本发明算力资源调度装置的实施例。
图4示出了根据本发明一些实施例的算力资源调度装置的结构示意图。如图4所示,该实施例的算力资源调度装置40包括:分发模块410,被配置为将每个算力节点的访问信息通过报文分发到网络中,进行报文分发的起点为算力节点的接入设备、终点为客户设备的接入设备;网络状况确定模块420,被配置为根据客户设备获取的报文,确定每个算力节点到客户设备之间的每个网络路径的网络状况;匹配模块430,被配置为根据客户设备的计算需求、网络状况以及预先确定的每个算力节点的算力资源,确定与计算需求匹配的算力节点和匹配的网络路径;连接建立模块440,被配置为根据匹配的网络路径,建立匹配的算力节点与客户设备之间的连接,以便客户设备利用匹配的算力节点进行计算。
在一些实施例中,分发模块410进一步被配置为将每个算力节点的访问信息通过路由协议报文分发到网络中,以便路由协议报文在传输过程中进行更新、并通过一个或多个网络路径到达客户设备。
在一些实施例中,算力节点的访问信息包括算力节点的标识、下一跳地址、本地接口标识、本节点到算力节点的时延中的一个或多个。
在一些实施例中,匹配模块430进一步被配置为根据客户设备的计算需求,确定客户设备的算力需求和网络需求;将对应的算力节点的算力资源高于算力需求、网络状况高于网络需求的网络路径确定为与计算需求匹配的网络路径,将匹配的网络路径对应的算力节点确定为匹配的算力节点。
在一些实施例中,连接建立模块440进一步被配置为在匹配的网络路径有多个的情况下,在匹配的网络路径中,根据网络状况最差的、或者对应的算力节点的算力资源最少的网络路径,建立相应的算力节点与客户设备之间的连接。
在一些实施例中,客户设备的计算需求中包括算力需求和网络需求;或者,客户设备的计算需求中包括应用类型,客户设备的算力需求和网络需求根据预先建立的应用类型与算力需求、网络需求之间的对应关系确定。
在一些实施例中,算力资源调度装置40还包括:算力资源确定模块450,被配置为将算力节点的属性信息以及算力节点支持的算法信息输入到预先训练的算力预测模型中,获得算力预测模型输出的算力节点的算力资源;其中,算力预测模型是根据其他算力节点的属性信息、其他算力节点支持的算法信息以及其他算力节点的算力资源训练的。
在一些实施例中,算力资源调度装置40还包括需求变化预测模块460,被配置为根据客户设备对业务使用量的变化,预测客户设备的未来计算需求;根据未来计算需求重新确定与计算需求匹配的算力节点和匹配的网络路径;根据重新确定的匹配的网络路径,建立重新确定的匹配的算力节点与客户设备之间的连接,以便客户设备利用重新确定的匹配的算力节点进行计算。
在一些实施例中,需求变化预测模块460进一步被配置为将客户设备的变化后的业务使用量、业务类型输入到预先训练的未来计算需求预测模型中,获得未来计算需求预测模型输出的客户设备的未来计算需求。
在一些实施例中,网络状况包括时延、丢包率、带宽中的一种或多种。
图5示出了根据本发明另一些实施例的算力资源调度装置的结构示意图。如图5所示,该实施例的算力资源调度装置50包括:存储器510以及耦接至该存储器510的处理器520,处理器520被配置为基于存储在存储器510中的指令,执行前述任意一个实施例中的算力资源调度方法。
其中,存储器510例如可以包括系统存储器、固定非易失性存储介质等。系统存储器例如存储有操作系统、应用程序、引导装载程序(Boot Loader)以及其他程序等。
图6示出了根据本发明又一些实施例的算力资源调度装置的结构示意图。如图6所示,该实施例的算力资源调度置60包括:存储器610以及处理器620,还可以包括输入输出接口630、网络接口640、存储接口650等。这些接口630,640,650以及存储器610和处理器620之间例如可以通过总线660连接。其中,输入输出接口630为显示器、鼠标、键盘、触摸屏等输入输出设备提供连接接口。网络接口640为各种联网设备提供连接接口。存储接口650为SD卡、U盘等外置存储设备提供连接接口。
本发明的实施例还提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现前述任意一种算力资源调度方法。
本领域内的技术人员应当明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用非瞬时性存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解为可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (13)
1.一种算力资源调度方法,包括:
将每个算力节点的访问信息通过报文分发到网络中,进行报文分发的起点为算力节点的接入设备、终点为客户设备的接入设备;
根据所述客户设备获取的报文,确定每个算力节点到所述客户设备之间的每个网络路径的网络状况;
根据客户设备的计算需求、所述网络状况以及预先确定的每个算力节点的算力资源,确定与所述计算需求匹配的算力节点和匹配的网络路径;
根据所述匹配的网络路径,建立所述匹配的算力节点与所述客户设备之间的连接,以便所述客户设备利用所述匹配的算力节点进行计算。
2.根据权利要求1所述的算力资源调度方法,其中,将每个算力节点的访问信息通过路由协议报文分发到网络中,以便路由协议报文在传输过程中进行更新、并通过一个或多个网络路径到达客户设备。
3.根据权利要求1或2所述的算力资源调度方法,其中,所述算力节点的访问信息包括算力节点的标识、下一跳地址、本地接口标识、本节点到算力节点的时延中的一个或多个。
4.根据权利要求1所述的算力资源调度方法,其中,所述根据客户设备的计算需求、所述网络状况以及预先确定的每个算力节点的算力资源,确定与所述计算需求匹配的算力节点和匹配的网络路径包括:
根据客户设备的计算需求,确定所述客户设备的算力需求和网络需求;
将对应的算力节点的算力资源高于所述算力需求、网络状况高于所述网络需求的网络路径确定为与所述计算需求匹配的网络路径,将所述匹配的网络路径对应的算力节点确定为匹配的算力节点。
5.根据权利要求4所述的算力资源调度方法,其中,所述根据所述匹配的网络路径,建立所述匹配的算力节点与所述客户设备之间的连接包括:
在匹配的网络路径有多个的情况下,在匹配的网络路径中,根据网络状况最差的、或者对应的算力节点的算力资源最少的网络路径,建立相应的算力节点与所述客户设备之间的连接。
6.根据权利要求1所述的算力资源调度方法,其中,
所述客户设备的计算需求中包括算力需求和网络需求;或者,
所述客户设备的计算需求中包括应用类型,所述客户设备的算力需求和网络需求根据预先建立的应用类型与算力需求、网络需求之间的对应关系确定。
7.根据权利要求1所述的算力资源调度方法,还包括:
将算力节点的属性信息以及所述算力节点支持的算法信息输入到预先训练的算力预测模型中,获得所述算力预测模型输出的所述算力节点的算力资源;
其中,所述算力预测模型是根据其他算力节点的属性信息、所述其他算力节点支持的算法信息以及所述其他算力节点的算力资源训练的。
8.根据权利要求1所述的算力资源调度方法,还包括:
根据所述客户设备对业务使用量的变化,预测所述客户设备的未来计算需求;
根据所述未来计算需求重新确定与所述计算需求匹配的算力节点和匹配的网络路径;
根据重新确定的所述匹配的网络路径,建立重新确定的匹配的算力节点与所述客户设备之间的连接,以便所述客户设备利用重新确定的匹配的算力节点进行计算。
9.根据权利要求1所述的算力资源调度方法,其中,根据所述客户设备对业务使用量的变化,预测所述客户设备的未来计算需求包括:
将客户设备的变化后的业务使用量、业务类型输入到预先训练的未来计算需求预测模型中,获得所述未来计算需求预测模型输出的所述客户设备的未来计算需求。
10.根据权利要求1所述的算力资源调度方法,其中,所述网络状况包括时延、丢包率、带宽中的一种或多种。
11.一种算力资源调度装置,包括:
分发模块,被配置为将每个算力节点的访问信息通过报文分发到网络中,进行报文分发的起点为算力节点的接入设备、终点为客户设备的接入设备;
网络状况确定模块,被配置为根据所述客户设备获取的报文,确定每个算力节点到所述客户设备之间的每个网络路径的网络状况;
匹配模块,被配置为根据客户设备的计算需求、所述网络状况以及预先确定的每个算力节点的算力资源,确定与所述计算需求匹配的算力节点和匹配的网络路径;
连接建立模块,被配置为根据所述匹配的网络路径,建立所述匹配的算力节点与所述客户设备之间的连接,以便所述客户设备利用所述匹配的算力节点进行计算。
12.一种算力资源调度装置,包括:
存储器;以及
耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器中的指令,执行如权利要求1~10中任一项所述的算力资源调度方法。
13.一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现权利要求1~10中任一项所述的算力资源调度方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010118240.7A CN113315700B (zh) | 2020-02-26 | 2020-02-26 | 算力资源调度方法、装置和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010118240.7A CN113315700B (zh) | 2020-02-26 | 2020-02-26 | 算力资源调度方法、装置和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113315700A true CN113315700A (zh) | 2021-08-27 |
CN113315700B CN113315700B (zh) | 2022-06-28 |
Family
ID=77369956
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010118240.7A Active CN113315700B (zh) | 2020-02-26 | 2020-02-26 | 算力资源调度方法、装置和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113315700B (zh) |
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114039858A (zh) * | 2021-10-25 | 2022-02-11 | 中国联合网络通信集团有限公司 | 一种算网资源融合方法、装置、设备及存储介质 |
CN114090253A (zh) * | 2021-11-23 | 2022-02-25 | 中国电信股份有限公司 | 网络算力资源的分配方法、装置、电子设备和可读介质 |
CN114531448A (zh) * | 2022-02-21 | 2022-05-24 | 联想(北京)有限公司 | 算力确定方法、装置及算力共享系统 |
CN114756340A (zh) * | 2022-03-17 | 2022-07-15 | 中国联合网络通信集团有限公司 | 算力调度系统、方法、装置和存储介质 |
CN114785851A (zh) * | 2022-04-20 | 2022-07-22 | 中国电信股份有限公司 | 资源调用处理方法、装置、存储介质及电子设备 |
CN114827028A (zh) * | 2022-03-09 | 2022-07-29 | 北京邮电大学 | 一种多层算网一体路由系统及方法 |
CN114866430A (zh) * | 2022-03-29 | 2022-08-05 | 北京智芯微电子科技有限公司 | 边缘计算的算力预测方法、算力编排方法及系统 |
CN114884862A (zh) * | 2022-06-06 | 2022-08-09 | 中国联合网络通信集团有限公司 | 一种终端业务的处理方法和装置 |
CN115086230A (zh) * | 2022-06-15 | 2022-09-20 | 中国联合网络通信集团有限公司 | 算网路由的确定方法、装置、设备及存储介质 |
CN115086225A (zh) * | 2022-05-27 | 2022-09-20 | 量子科技长三角产业创新中心 | 算力网计算与存储最优路径确定方法和监测装置 |
CN115118784A (zh) * | 2022-06-30 | 2022-09-27 | 中国电信股份有限公司 | 算力资源的调度方法、装置及系统 |
CN115208812A (zh) * | 2022-07-08 | 2022-10-18 | 中国电信股份有限公司 | 业务处理方法及装置、设备、计算机可读存储介质 |
CN115292046A (zh) * | 2022-08-10 | 2022-11-04 | 中国电信股份有限公司 | 算力分配方法、装置、存储介质及电子设备 |
CN115396514A (zh) * | 2022-08-18 | 2022-11-25 | 中国联合网络通信集团有限公司 | 资源分配方法、装置及存储介质 |
CN116248577A (zh) * | 2022-12-08 | 2023-06-09 | 中国联合网络通信集团有限公司 | 一种确定算力节点的方法及装置 |
WO2024007640A1 (zh) * | 2022-07-08 | 2024-01-11 | 中兴通讯股份有限公司 | 数据传输方法、数据处理方法、电子设备、存储介质 |
WO2024007880A1 (zh) * | 2022-07-06 | 2024-01-11 | 大唐移动通信设备有限公司 | 网络功能确定方法、装置及存储介质 |
WO2024113974A1 (zh) * | 2022-11-29 | 2024-06-06 | 浪潮通信技术有限公司 | 算力网络的路由分配方法、装置、电子设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012221273A (ja) * | 2011-04-11 | 2012-11-12 | Internatl Business Mach Corp <Ibm> | 動的にリソースを割り当てる方法、システム及びプログラム |
US20180152390A1 (en) * | 2016-11-28 | 2018-05-31 | Intel Corporation | Computing infrastructure resource-workload management methods and apparatuses |
CN110427261A (zh) * | 2019-08-12 | 2019-11-08 | 电子科技大学 | 一种基于深度蒙特卡洛树搜索的边缘计算任务分配方法 |
CN110730138A (zh) * | 2019-10-21 | 2020-01-24 | 中国科学院空间应用工程与技术中心 | 天基云雾计算架构的动态资源配置方法、系统和存储介质 |
CN110838979A (zh) * | 2018-08-17 | 2020-02-25 | 中国电信股份有限公司 | 流量转发控制方法、装置、系统和计算机可读存储介质 |
-
2020
- 2020-02-26 CN CN202010118240.7A patent/CN113315700B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012221273A (ja) * | 2011-04-11 | 2012-11-12 | Internatl Business Mach Corp <Ibm> | 動的にリソースを割り当てる方法、システム及びプログラム |
US20180152390A1 (en) * | 2016-11-28 | 2018-05-31 | Intel Corporation | Computing infrastructure resource-workload management methods and apparatuses |
CN110838979A (zh) * | 2018-08-17 | 2020-02-25 | 中国电信股份有限公司 | 流量转发控制方法、装置、系统和计算机可读存储介质 |
CN110427261A (zh) * | 2019-08-12 | 2019-11-08 | 电子科技大学 | 一种基于深度蒙特卡洛树搜索的边缘计算任务分配方法 |
CN110730138A (zh) * | 2019-10-21 | 2020-01-24 | 中国科学院空间应用工程与技术中心 | 天基云雾计算架构的动态资源配置方法、系统和存储介质 |
Cited By (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114039858A (zh) * | 2021-10-25 | 2022-02-11 | 中国联合网络通信集团有限公司 | 一种算网资源融合方法、装置、设备及存储介质 |
CN114039858B (zh) * | 2021-10-25 | 2023-08-22 | 中国联合网络通信集团有限公司 | 一种算网资源融合方法、装置、设备及存储介质 |
CN114090253A (zh) * | 2021-11-23 | 2022-02-25 | 中国电信股份有限公司 | 网络算力资源的分配方法、装置、电子设备和可读介质 |
CN114531448A (zh) * | 2022-02-21 | 2022-05-24 | 联想(北京)有限公司 | 算力确定方法、装置及算力共享系统 |
CN114531448B (zh) * | 2022-02-21 | 2024-02-27 | 联想(北京)有限公司 | 算力确定方法、装置及算力共享系统 |
CN114827028B (zh) * | 2022-03-09 | 2023-03-28 | 北京邮电大学 | 一种多层算网一体路由系统及方法 |
CN114827028A (zh) * | 2022-03-09 | 2022-07-29 | 北京邮电大学 | 一种多层算网一体路由系统及方法 |
CN114756340A (zh) * | 2022-03-17 | 2022-07-15 | 中国联合网络通信集团有限公司 | 算力调度系统、方法、装置和存储介质 |
CN114866430A (zh) * | 2022-03-29 | 2022-08-05 | 北京智芯微电子科技有限公司 | 边缘计算的算力预测方法、算力编排方法及系统 |
CN114785851A (zh) * | 2022-04-20 | 2022-07-22 | 中国电信股份有限公司 | 资源调用处理方法、装置、存储介质及电子设备 |
CN114785851B (zh) * | 2022-04-20 | 2024-01-09 | 中国电信股份有限公司 | 资源调用处理方法、装置、存储介质及电子设备 |
CN115086225B (zh) * | 2022-05-27 | 2023-12-05 | 量子科技长三角产业创新中心 | 算力网计算与存储最优路径确定方法和监测装置 |
CN115086225A (zh) * | 2022-05-27 | 2022-09-20 | 量子科技长三角产业创新中心 | 算力网计算与存储最优路径确定方法和监测装置 |
CN114884862A (zh) * | 2022-06-06 | 2022-08-09 | 中国联合网络通信集团有限公司 | 一种终端业务的处理方法和装置 |
CN115086230A (zh) * | 2022-06-15 | 2022-09-20 | 中国联合网络通信集团有限公司 | 算网路由的确定方法、装置、设备及存储介质 |
CN115118784A (zh) * | 2022-06-30 | 2022-09-27 | 中国电信股份有限公司 | 算力资源的调度方法、装置及系统 |
WO2024007880A1 (zh) * | 2022-07-06 | 2024-01-11 | 大唐移动通信设备有限公司 | 网络功能确定方法、装置及存储介质 |
CN115208812A (zh) * | 2022-07-08 | 2022-10-18 | 中国电信股份有限公司 | 业务处理方法及装置、设备、计算机可读存储介质 |
WO2024007640A1 (zh) * | 2022-07-08 | 2024-01-11 | 中兴通讯股份有限公司 | 数据传输方法、数据处理方法、电子设备、存储介质 |
CN115208812B (zh) * | 2022-07-08 | 2024-06-28 | 中国电信股份有限公司 | 业务处理方法及装置、设备、计算机可读存储介质 |
CN115292046A (zh) * | 2022-08-10 | 2022-11-04 | 中国电信股份有限公司 | 算力分配方法、装置、存储介质及电子设备 |
CN115396514B (zh) * | 2022-08-18 | 2023-05-26 | 中国联合网络通信集团有限公司 | 资源分配方法、装置及存储介质 |
CN115396514A (zh) * | 2022-08-18 | 2022-11-25 | 中国联合网络通信集团有限公司 | 资源分配方法、装置及存储介质 |
WO2024113974A1 (zh) * | 2022-11-29 | 2024-06-06 | 浪潮通信技术有限公司 | 算力网络的路由分配方法、装置、电子设备及存储介质 |
CN116248577A (zh) * | 2022-12-08 | 2023-06-09 | 中国联合网络通信集团有限公司 | 一种确定算力节点的方法及装置 |
CN116248577B (zh) * | 2022-12-08 | 2024-05-17 | 中国联合网络通信集团有限公司 | 一种确定算力节点的方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN113315700B (zh) | 2022-06-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113315700B (zh) | 算力资源调度方法、装置和存储介质 | |
Quang et al. | Single and multi-domain adaptive allocation algorithms for VNF forwarding graph embedding | |
CN112153700B (zh) | 一种网络切片资源管理方法及设备 | |
CN105979007B (zh) | 加速资源处理方法、装置及网络功能虚拟化系统 | |
US9389903B2 (en) | Method, system and apparatus for creating virtual machine | |
Sun et al. | Towards provisioning hybrid virtual networks in federated cloud data centers | |
EP2979409B1 (en) | A method and system to allocate bandwidth for heterogeneous bandwidth request in cloud computing networks | |
Tang et al. | Dynamic request redirection and elastic service scaling in cloud-centric media networks | |
US10652360B2 (en) | Access scheduling method and apparatus for terminal, and computer storage medium | |
WO2023024219A1 (zh) | 云边协同网络中时延和频谱占用联合优化方法及系统 | |
US10356185B2 (en) | Optimal dynamic cloud network control | |
CN103001892B (zh) | 基于云计算的网络资源分配方法及系统 | |
CN105515977B (zh) | 获取网络中传输路径的方法、装置和系统 | |
CN110995470A (zh) | 基于区块链的网络功能分配方法及装置 | |
CN114298431A (zh) | 一种网络路径选择方法、装置、设备及存储介质 | |
Aleyadeh et al. | Optimal container migration/re-instantiation in hybrid computing environments | |
Khoshkholghi et al. | Edge intelligence for service function chain deployment in NFV-enabled networks | |
CN113300861A (zh) | 网络切片配置方法、装置以及存储介质 | |
Fan et al. | Node essentiality assessment and distributed collaborative virtual network embedding in datacenters | |
Chakraborty et al. | Mobility-Aware Controller Orchestration in Multi-Tier Service-Oriented Architecture for IoT | |
Abouelela et al. | Multidomain hierarchical resource allocation for grid applications | |
Happ et al. | On the impact of clustering for IoT analytics and message broker placement across cloud and edge | |
Feng et al. | COVE: Co-operative virtual network embedding for network virtualization | |
Han et al. | Multi-SP Network Slicing Parallel Relieving Edge Network Conflict | |
Nishanbayev et al. | Evaluating the effectiveness of a software-defined cloud data center with a distributed structure |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
EE01 | Entry into force of recordation of patent licensing contract |
Application publication date: 20210827 Assignee: Tianyiyun Technology Co.,Ltd. Assignor: CHINA TELECOM Corp.,Ltd. Contract record no.: X2024110000040 Denomination of invention: Computing resource scheduling method, device, and storage medium Granted publication date: 20220628 License type: Common License Record date: 20240914 |
|
EE01 | Entry into force of recordation of patent licensing contract |