CN114500521A - 一种算力调度方法、装置、调度设备、系统和存储介质 - Google Patents

一种算力调度方法、装置、调度设备、系统和存储介质 Download PDF

Info

Publication number
CN114500521A
CN114500521A CN202011270307.5A CN202011270307A CN114500521A CN 114500521 A CN114500521 A CN 114500521A CN 202011270307 A CN202011270307 A CN 202011270307A CN 114500521 A CN114500521 A CN 114500521A
Authority
CN
China
Prior art keywords
computing power
node
information
computing
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011270307.5A
Other languages
English (en)
Inventor
王升
张昊
张婷婷
陈佳媛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
China Mobile Communications Ltd Research Institute
Original Assignee
China Mobile Communications Group Co Ltd
China Mobile Communications Ltd Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, China Mobile Communications Ltd Research Institute filed Critical China Mobile Communications Group Co Ltd
Priority to CN202011270307.5A priority Critical patent/CN114500521A/zh
Publication of CN114500521A publication Critical patent/CN114500521A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/104Peer-to-peer [P2P] networks
    • H04L67/1074Peer-to-peer [P2P] networks for supporting data block transmission mechanisms

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例公开了一种算力调度方法、装置、调度设备、系统和存储介质。所述方法包括:获得算力节点信息;所述算力节点信息包括各算力节点上报的资源信息;所述资源信息至少包括:算力类型、算力资源相关信息和网络信息;所述算力节点至少包括:网络算力节点和泛终端节点;基于所述算力节点信息确定满足用户的算力需求的至少一个第一算力节点以及每个第一算力节点待调度的算力资源,将各第一算力节点待调度的算力资源分配给所述用户。

Description

一种算力调度方法、装置、调度设备、系统和存储介质
技术领域
本发明涉及边缘计算领域,具体涉及一种算力调度方法、装置、调度设备、系统和存储介质。
背景技术
距离用户的不同距离散布着不同规模的算力,呈现云-边-端三级算力架构。随着5G网络、边缘计算的规模建设,新兴应用将加速驱动数据处理由云端向边侧、端侧的扩散。相关方案只针对边缘计算场景,即边侧的算力部署有简单方案,即移植核心云计算的应用管理编排体系,依靠网络功能虚拟化编排器(NFVO,Network Function VirtualizationOrchestrator)或云管系统,针对用户要求的站点位置,在该节点部署应用,无法根据用户实际业务需求做到动态的边边协同、边网协同,也未考虑泛在计算设备的接入与管理。
发明内容
为解决现有存在的技术问题,本发明实施例提供一种算力调度方法、装置、调度设备、系统和存储介质。
为达到上述目的,本发明实施例的技术方案是这样实现的:
本发明实施例提供了一种算力调度方法,所述方法包括:
获得算力节点信息;所述算力节点信息包括各算力节点上报的资源信息;所述资源信息至少包括:算力类型、算力资源相关信息和网络信息;所述算力节点至少包括:网络算力节点和泛终端节点;
基于所述算力节点信息确定满足用户的算力需求的至少一个第一算力节点以及每个第一算力节点待调度的算力资源,将各第一算力节点待调度的算力资源分配给所述用户。
上述方案中,所述获得算力节点信息,包括:
获得各算力节点的注册信息;所述注册信息包括所述资源信息;和/或,
在算力节点注册完成后,周期性的获得算力节点上报的所述资源信息;
其中,在所述算力节点为网络算力节点的情况下,基于部署在所述算力节点中的虚拟基础设施管理器获得所述算力节点的注册信息;
在所述算力节点为泛终端节点的情况下,基于部署在所述算力节点中的客户端获得所述算力节点的注册信息。
上述方案中,所述获得算力节点信息,包括:
获得网络设备发送的算力节点信息;其中,所述算力节点信息为各算力节点向所述网络设备发送注册信息或者周期性的上报所述资源信息而生成;所述注册信息包括所述资源信息。
上述方案中,所述基于所述算力节点信息确定满足用户的算力需求的至少一个第一算力节点以及每个第一算力节点待调度的算力资源,包括:
基于所述算力节点信息确定满足用户的算力需求的第一算力节点以及待调度的算力资源;或者,
基于所述算力节点信息对用户的算力需求进行分解,得到多个算力子需求,确定满足所述多个算力子需求的多个第一算力节点以及每个第一算力节点待调度的算力资源。
上述方案中,所述方法还包括:
通过其他网络设备获得所述用户的算力需求;或者,
获得用户需求信息,基于所述用户需求信息确定所述用户的算力需求。
上述方案中,所述方法还包括:
在所述用户的算力需求变化时,基于所述算力节点信息对分配给所述用户的第一算力节点和/或各第一算力节点待调度的算力资源进行调整,将调整后的各第一算力节点待调度的算力资源重新分配给所述用户。
上述方案中,所述将各第一算力节点待调度的算力资源分配给所述用户,包括:在所述至少一个第一算力节点上部署应用并进行网络配置,以及向所述用户所在的终端发送对应于各第一算力节点的算力链接信息,以使所述终端基于所述算力链接信息访问所述至少一个第一算力节点并使用算力服务。
本发明实施例还提供了一种算力调度装置,所述装置包括:信息获取模块和调度模块;其中,
所述信息获取模块,用于获得算力节点信息;所述算力节点信息包括各算力节点上报的资源信息;所述资源信息至少包括:算力类型、算力资源相关信息和网络信息;所述算力节点至少包括:网络算力节点和泛终端节点;
所述调度模块,用于基于所述算力节点信息确定满足用户的算力需求的至少一个第一算力节点以及每个第一算力节点待调度的算力资源,将各第一算力节点待调度的算力资源分配给所述用户。
上述方案中,所述信息获取模块包括注册单元,用于获得各算力节点的注册信息;所述注册信息包括所述资源信息;和/或,
所述信息获取模块包括获取单元,用于在算力节点注册完成后,周期性的获得算力节点上报的所述资源信息;
其中,在所述算力节点为网络算力节点的情况下,基于部署在所述算力节点中的虚拟基础设施管理器获得所述算力节点的注册信息;
在所述算力节点为泛终端节点的情况下,基于部署在所述算力节点中的客户端获得所述算力节点的注册信息。
上述方案中,所述信息获取模块,用于获得网络设备发送的算力节点信息;其中,所述算力节点信息为各算力节点向所述网络设备发送注册信息或者周期性的上报所述资源信息而生成;所述注册信息包括所述资源信息。
上述方案中,所述调度模块,用于基于所述算力节点信息确定满足用户的算力需求的第一算力节点以及待调度的算力资源;或者,
所述调度模块包括分解单元和调度单元;
所述分解单元,用于基于所述算力节点信息对用户的算力需求进行分解,得到多个算力子需求;
所述调度单元,用于确定满足所述多个算力子需求的多个第一算力节点以及每个第一算力节点待调度的算力资源。
上述方案中,所述装置还包括需求获取模块,用于通过其他网络设备获得所述用户的算力需求;或者,获得用户需求信息,基于所述用户需求信息确定所述用户的算力需求。
上述方案中,所述调度模块,还用于在所述用户的算力需求变化时,基于所述算力节点信息对分配给所述用户的第一算力节点和/或各第一算力节点待调度的算力资源进行调整,将调整后的各第一算力节点待调度的算力资源重新分配给所述用户。
上述方案中,所述调度模块,用于在所述至少一个第一算力节点上部署应用并进行网络配置,以及向所述用户所在的终端发送对应于各第一算力节点的算力链接信息,以使所述终端基于所述算力链接信息访问所述至少一个第一算力节点并使用算力服务。
本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明实施例所述方法的步骤。
本发明实施例还提供了一种调度设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现本发明实施例所述方法的步骤。
本发明实施例还提供了一种算力调度系统,所述系统包括调度设备和算力节点;所述算力节点至少包括:网络算力节点和泛终端节点;所述调度设备包括本发明实施例所述的算力调度装置。
本发明实施例提供的算力调度方法、装置、调度设备、系统和存储介质,所述方法包括:获得算力节点信息;所述算力节点信息包括各算力节点上报的资源信息;所述资源信息至少包括:算力类型、算力资源相关信息和网络信息;所述算力节点至少包括:网络算力节点和泛终端节点;基于所述算力节点信息确定满足用户的算力需求的至少一个第一算力节点以及每个第一算力节点待调度的算力资源,将各第一算力节点待调度的算力资源分配给所述用户。采用本发明实施例的技术方案,通过对各种类型的算力节点(包括泛终端节点)的算力资源进行收集并汇总,实现了将用户的算力需求与各类型的算力节点的算力资源进行匹配并将匹配的算力进行调度,实现了各种类型的算力节点(包括泛终端节点)提供算力服务,另外也避免了边缘计算节点的算力不足或网络受限等情况下,无法给用户提供算力服务的情况。
附图说明
图1为本发明实施例的算力调度系统的组成结构示意图;
图2为本发明实施例的算力调度方法的流程示意图;
图3为本发明实施例的算力调度方法的交互示意图;
图4为本发明实施例的算力调度装置的组成结构示意图;
图5为本发明实施例的调度设备的硬件结构示意图。
具体实施方式
下面结合附图及具体实施例对本发明作进一步详细的说明。
图1为本发明实施例的算力调度系统的组成结构示意图;如图1所示,本发明实施例的算力调度系统可包括管理编排层和基础设施层;管理编排层包括调度平台,也可称为本发明以下各实施例中的调度设备;基础设施层可包括网络基础设施和算力基础设施。
其中,网络基础设施包括控制面的各级软件定义网络控制器(SDNC,SoftwareDefined Network Controller)和网管设备以及转发面的相应网络设备,构建低时延大吞吐、敏捷、无损、确定性算力传输管道;算力基础设施包括运营商自建、合营的核心数据中心(DC,Data Center)与移动边缘计算(MEC,Mobile Edge Computing)节点、三方云资源池以及泛在的端算力等,聚焦于异构算力的生成。其中,三方云资源池也即第三方建立的云资源形成的资源池。泛在的端算力对应于本发明以下各实施例中的泛终端节点,泛终端节点可以是网络中闲置的、或可提供算力的任何终端设备,例如个人计算机(PC)等等。
本实施例中,调度平台(又称调度设备)可具有:算力注册、算力调度、算力分解、算力状态拓扑、网络调度、网络状态拓扑、生命周期管理、镜像管理、安全管理、策略管理、资源管理/预留等功能。具体的实现方式参见以下各实施例。
基于图1所示的算力调度系统,本发明实施例提供了一种算力调度方法。图2为本发明实施例的算力调度方法的流程示意图;如图2所示,所述方法包括:
步骤101:获得算力节点信息;所述算力节点信息包括各算力节点上报的资源信息;所述资源信息至少包括:算力类型、算力资源相关信息和网络信息;所述算力节点至少包括:网络算力节点和泛终端节点;
步骤102:基于所述算力节点信息确定满足用户的算力需求的至少一个第一算力节点以及每个第一算力节点待调度的算力资源,将各第一算力节点待调度的算力资源分配给所述用户。
本实施例的算力调度方法应用于图1所示的调度平台或调度设备中,可以理解,调度平台或调度设备获得算力节点信息。
本实施例中,算力节点信息包括各算力节点上报的资源信息;其中,算力节点的类型至少包括:网络算力节点和泛终端节点。网络算力节点可包括MEC节点、核心云计算节点(核心网的云计算节点)、三方云资源池等能够提供较大规模、稳定算力的计算节点;泛终端节点可包括闲置的或可提供算力的终端设备、或者小型云池等能够提供较小算力的计算节点。
一些实施方式中,调度平台或调度设备可根据不同的算力节点类型获得算力节点信息。
则在本发明的一些可选实施例中,所述获得算力节点信息,包括:获得各算力节点的注册信息;所述注册信息包括所述资源信息;和/或,在算力节点注册完成后,周期性的获得算力节点上报的所述资源信息;其中,在所述算力节点为网络算力节点的情况下,基于部署在所述算力节点中的虚拟基础设施管理器获得所述算力节点的注册信息;在所述算力节点为泛终端节点的情况下,基于部署在所述算力节点中的客户端获得所述算力节点的注册信息。
本实施例中,在算力节点为具有较大规模、稳定算力的计算节点(即网络算力节点)的算力节点的情况下,可基于算力节点中的虚拟基础设施管理器向调度设备上报资源信息。示例性的,算力节点中的虚拟基础设施管理器可通过API向调度设备上报资源信息。例如,边缘计算节点、云计算节点、第三方云池节点的算力信息可由虚拟基础设施管理器通过北向API上报至调度设备,网络信息可由各域SDNC或网管设备通过标准API上报,完成较大规模、稳定的算力池的计算、网络信息的获取。
在算力节点为具有较小算力的计算节点(即泛终端节点)的情况下,可基于算力节点中部署的客户端向调度设备上报资源信息。其中,客户端可通过在算力节点中放置探针的方式实现部署。示例性的,探针与泛终端节点松耦合,即插即用,通过针对不同操作系统集成相应的系统信息搜集脚本与网络能力测试脚本,获取相应的算力信息与网络信息,实时性的向调度设备上报,调度设备根据收到资源信息做算力状态拓扑和网络状态拓扑的更新。
一些示例中,在算力节点提供算力服务之前,首先需要接入本实施例的算力调度系统,也即接入调度设备以完成算力节点的注册,如图1中所示的调度平台中的算力注册功能。示例性的,各算力节点可通过注册的方式上报资源信息,例如在注册消息中携带上述资源信息。调度设备可根据各算力节点上报的资源信息形成算力节点信息,该算力节点信息即为图1中所示的算力状态拓扑,包括各算力节点的资源信息。在算力节点注册完成后,各算力节点周期性的上报实时的资源信息,以使调度设备可实时更新算力节点信息。
其中,资源信息至少包括算力类型、算力资源相关信息和网络信息。其中,算力类型可表示算力节点可提供的算力类型,算力类型例如可以是中央处理器(CPU)、图形处理器(GPU)等类型中的至少之一。算力资源相关信息例如可包括:能力信息、可提供时长等等。其中,能力信息可表示算力节点可提供的某种类型的算力的能力。例如某算力节点可提供GPU能力,则能力信息可包括该算力节点可提供其本身的GPU能力的百分比(例如60%的GPU能力)。在一些实施例中,调度设备也可根据各算力节点上报的资源信息形成网络状态拓扑,进而根据网络状态拓扑进行网络调度。
在本发明的另一些可选实施例中,所述获得算力节点信息,包括:获得网络设备发送的算力节点信息;其中,所述算力节点信息为各算力节点向所述网络设备发送注册信息或者周期性的上报所述资源信息而生成;所述注册信息包括所述资源信息。
一些实施方式中,本实施例中的算力调度系统可包括多级调度设备(或多级调度平台)。示例性的,算力调度系统包括两级调度设备,本实施例的算力调度方法应用于一级调度设备。各个算力节点通过上述注册方式向二级调度设备(即上述网络设备)进行注册,使得二级调度设备获得各算力节点的资源信息并形成算力节点信息;二级调度设备汇聚管辖区域内的各算力节点的资源信息形成算力节点信息后,向一级调度设备发送该算力节点信息。在其他实施例中,一级调度设备也可直接获得某些类型的算力节点(例如核心云节点)上报的资源信息。
在本发明的一些可选实施例中,所述基于所述算力节点信息确定满足用户的算力需求的至少一个第一算力节点以及每个第一算力节点待调度的算力资源,包括:基于所述算力节点信息确定满足用户的算力需求的第一算力节点以及待调度的算力资源;或者,基于所述算力节点信息对用户的算力需求进行分解,得到多个算力子需求,确定满足所述多个算力子需求的多个第一算力节点以及每个第一算力节点待调度的算力资源。
本实施例中,作为一种实施方式,在调度设备接收到用户的算力需求后,根据算力节点信息(或图1中所示的算力状态拓扑)确定满足用户的算力需求的第一算力节点以及待调度的算力资源。本实施方式适用于第一算力节点的算力能够满足用户的算力需求的情况。作为另一种实施方式,若无法调度出合适的某个第一算力节点,即一个第一算力节点的算力不能够满足用户的算力需求,则需要将用户的算力需求进行分解,分别部署在多个第一算力节点上,以满足用户的业务需求。
示例性的,调度设备可根据用户的算力需求和网络需求等,结合算力节点信息(即算力状态拓扑)和网络状态拓扑等,依据装箱(filter)称重(weight)算法,获得满足用户的算力需求的至少一个第一算力节点,这个功能即为图1中所示的算力调度功能。示例性的,得到的算力节点(第一算力节点)可以是任意类型的算力节点或者多种类型的算力节点的组合。
其中,泛在终端设备、边缘计算节点、核心云各级算力节点能够提供的算力是不同的,差异较大。因此,针对用户的算力需求,若无法调度出合适的某个第一算力节点承载全部的算力需求时,调度设备可对用户的算力需求进行分解,得到多个算力子需求,将各个算力子需求分别部署在不同的第一算力节点上,以满足用户的业务需求。上述功能即为图1中所示的算力分解功能。
例如,用户的算力需求需要10个虚拟机,通过调度设备的调度功能,调度设备根据算力节点信息(即各个算力节点的资源情况)确定3个第一算力节点能够满足用户的算力需求;进而通过调度设备的算力分解功能,进一步分配每个第一算力节点各分配多少算力需求。
在本发明的一些可选实施例中,所述方法还包括:通过其他网络设备获得所述用户的算力需求;或者,获得用户需求信息,基于所述用户需求信息确定所述用户的算力需求。
本实施例中,在一些实施例中,调度设备可自身将用户需求信息解析为用户的算力需求;在另一些实施例中,调度设备可从其他网络设备处获得解析完成的用户的算力需求。
在本发明的一些可选实施例中,所述将各第一算力节点待调度的算力资源分配给所述用户,包括:在所述至少一个第一算力节点上部署应用并进行网络配置,以及向所述用户所在的终端发送对应于各第一算力节点的算力链接信息,以使所述终端基于所述算力链接信息访问所述至少一个第一算力节点并使用算力服务。
本实施例中,调度设备确定满足用户的算力需求的至少一个第一算力节点后,一方面在所述至少一个第一算力节点上部署应用并进行网络配置,具体是向各个第一算力节点下发镜像,完成算法框架的安装,应用的部署,包括应用的上线与网络配置等等;另一方面,向用户所在的终端发送对应于各第一算力节点的算力链接信息,用户所在的终端可根据该算力链接信息分别与各个第一算力节点建立连接,各个第一算力节点提供算力服务。
在本发明的一些可选实施例中,所述方法还包括:在所述用户的算力需求变化时,基于所述算力节点信息对分配给所述用户的第一算力节点和/或各第一算力节点待调度的算力资源进行调整,将调整后的各第一算力节点待调度的算力资源重新分配给所述用户。
本实施例中,在所述用户的算力需求变化时,或者在网络发生异常情况时,例如某个第一算力节点的网络发生异常,已经不能提供算力服务,则调度设备可根据当前的算力节点信息按照上述调度方式重新选取新的第一算力节点,和/或重新分配各算力节点待调度的算力资源等等,将新的第一算力节点分配给用户。示例性的,调度设备向新的第一算力节点下发镜像,完成算法框架的安装,应用的部署,包括应用的上线与网络配置等,并向用户所在终端发送对应于新的第一算力节点的算力链接信息,以使用户所在终端根据新的算力链接信息与新的第一算力节点建立连接,新的第一算力节点提供算力服务;同时在旧的第一算力节点上删除应用,并删除网络配置,在用户不感知的情况下完成应用的迁移。
采用本发明实施例的技术方案,通过对各种类型的算力节点(包括泛终端节点)的算力资源进行收集并汇总,实现了将用户的算力需求与各类型的算力节点的算力资源进行匹配并将匹配的算力进行调度,实现了各种类型的算力节点(包括泛终端节点)提供算力服务,另外也避免了边缘计算节点的算力不足或网络受限等情况下,无法给用户提供算力服务的情况。
本发明实施例面适用的场景更为广泛,通过对网络中所有可提供算力的算力节点的算力资源进行收集及统一,通过调度设备,实时的将算力需求与算力供给进行匹配,同时在应用上线之后根据算力节点的网络或算力资源的变化,智能化、自动化、实时化的调整算力节点,实现边边协同,边网协同,同时打破边缘计算节点孤立、算力有限的问题,联动泛在计算设备,构建“无限节点”,大大丰富了算力提供能力,赋能社会。
下面结合一个具体的示例对本发明实施例的算力调度方法进行说明。
图3为本发明实施例的算力调度方法的交互示意图;本示例中以算力调度系统中部署两级调度设备为例进行说明。如图3所示,调度过程可包括:
1.边缘计算节点、泛终端节点向二级调度设备上报资源信息,并在二级调度设备完成注册,二级调度设备汇聚管辖区域内的各算力节点的资源信息,汇总生成算力节点信息,并将算力节点信息上报至一级调度设备;另外,位置较高的核心云节点可直接上报资源信息至一级调度设备。
其中,资源信息可包括算力类型、能力信息、可提供时长和网络信息等等。
示例性的,如图3所示,算力节点可包括核心云节点、泛PC终端、企业终端/家庭网关、第三方CO(三方云资源池)等算力节点。
2.用户向一级调度设备发送算力需求,申请算力资源;算力需求可包括应用类型、资源数量、算力要求、网络要求、算法要求等信息中的至少之一;或者,算力需求可包括计算结果要求,由一级调度设备自动匹配合适的算法、算力、网络。
3.一级调度设备根据当前的算力节点信息,对用户的算力需求进行分解,选取一个或一组算力节点,例如边缘计算节点与某泛终端节点共同承载算力需求。
4.一级调度设备将选择的节点通知二级调度设备,由二级调度设备向算力节点下发镜像,完成算法框架的安装,应用的部署,包括应用的上线与网络配置,并通知一级调度设备应用的算力链接信息。
5.一级调度设备将算力链接信息发送给用户所在终端,使得用户所在终端的客户端建立到算力节点的服务端的连接,算力链接完成,开始计费。
6.算力节点持续向二级调度设备上报资源信息,二级调度设备即时更新算力节点信息并上报给一级调度设备。当发生网络异常情况,如边缘计算节点的网络抖动变大,已经不满足用户提出的网络要求时,一级调度设备重新调度新的算力节点给用户,在新的算力节点上部署应用服务,配置网络,同时在旧的算力节点上删除应用,删除原网络配置,在用户不感知的情况下完成应用的迁移。
本发明实施例还提供了一种算力调度装置。图4为本发明实施例的算力调度装置的组成结构示意图;如图4所示,所述装置包括:信息获取模块21和调度模块22;其中,
所述信息获取模块21,用于获得算力节点信息;所述算力节点信息包括各算力节点上报的资源信息;所述资源信息至少包括:算力类型、算力资源相关信息和网络信息;所述算力节点至少包括:网络算力节点和泛终端节点;
所述调度模块22,用于基于所述算力节点信息确定满足用户的算力需求的至少一个第一算力节点以及每个第一算力节点待调度的算力资源,将各第一算力节点待调度的算力资源分配给所述用户。
在本发明的一些可选实施例中,所述信息获取模块21包括注册单元,用于获得各算力节点的注册信息;所述注册信息包括所述资源信息;和/或,
所述信息获取模块21包括获取单元,用于在算力节点注册完成后,周期性的获得算力节点上报的所述资源信息;
其中,在所述算力节点为网络算力节点的情况下,基于部署在所述算力节点中的虚拟基础设施管理器获得所述算力节点的注册信息;
在所述算力节点为泛终端节点的情况下,基于部署在所述算力节点中的客户端获得所述算力节点的注册信息。
在本发明的一些可选实施例中,所述信息获取模块21,用于获得网络设备发送的算力节点信息;其中,所述算力节点信息为各算力节点向所述网络设备发送注册信息或者周期性的上报所述资源信息而生成;所述注册信息包括所述资源信息。
在本发明的一些可选实施例中,所述调度模块22,用于基于所述算力节点信息确定满足用户的算力需求的第一算力节点以及待调度的算力资源;或者,
所述调度模块22包括分解单元和调度单元;
所述分解单元,用于基于所述算力节点信息对用户的算力需求进行分解,得到多个算力子需求;
所述调度单元,用于确定满足所述多个算力子需求的多个第一算力节点以及每个第一算力节点待调度的算力资源。
在本发明的一些可选实施例中,所述装置还包括需求获取模块,用于通过其他网络设备获得所述用户的算力需求;或者,获得用户需求信息,基于所述用户需求信息确定所述用户的算力需求。
在本发明的一些可选实施例中,所述调度模块22,还用于在所述用户的算力需求变化时,基于所述算力节点信息对分配给所述用户的第一算力节点和/或各第一算力节点待调度的算力资源进行调整,将调整后的各第一算力节点待调度的算力资源重新分配给所述用户。
在本发明的一些可选实施例中,所述调度模块22,用于在所述至少一个第一算力节点上部署应用并进行网络配置,以及向所述用户所在的终端发送对应于各第一算力节点的算力链接信息,以使所述终端基于所述算力链接信息访问所述至少一个第一算力节点并使用算力服务。
本发明实施例中,所述算力调度装置中的信息获取模块21、调度模块22和需求获取模块,在实际应用中均可由中央处理器(CPU,Central Processing Unit)、数字信号处理器(DSP,Digital Signal Processor)、微控制单元(MCU,Microcontroller Unit)或可编程门阵列(FPGA,Field-Programmable Gate Array)结合通信模组(包含:基础通信套件、操作系统、通信模块、标准化接口和协议等)及收发天线实现。
需要说明的是:上述实施例提供的算力调度装置在进行算力调度时,仅以上述各程序模块的划分进行举例说明,实际应用中,可以根据需要而将上述处理分配由不同的程序模块完成,即将装置的内部结构划分成不同的程序模块,以完成以上描述的全部或者部分处理。另外,上述实施例提供的算力调度装置与算力调度方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
本发明实施例还提供了一种调度设备。图5为本发明实施例的调度设备的硬件结构示意图,如图5所示,调度设备包括存储器32、处理器31及存储在存储器32上并可在处理器31上运行的计算机程序,所述处理器31执行所述程序时实现本发明实施例所述算力调度方法的步骤。
可选地,调度设备还包括网络接口33。调度设备中的各个组件通过总线系统34耦合在一起。可理解,总线系统34用于实现这些组件之间的连接通信。总线系统34除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图5中将各种总线都标为总线系统34。
可以理解,存储器32可以是易失性存储器或非易失性存储器,也可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(ROM,Read Only Memory)、可编程只读存储器(PROM,Programmable Read-Only Memory)、可擦除可编程只读存储器(EPROM,Erasable Programmable Read-Only Memory)、电可擦除可编程只读存储器(EEPROM,Electrically Erasable Programmable Read-Only Memory)、磁性随机存取存储器(FRAM,ferromagnetic random access memory)、快闪存储器(Flash Memory)、磁表面存储器、光盘、或只读光盘(CD-ROM,Compact Disc Read-Only Memory);磁表面存储器可以是磁盘存储器或磁带存储器。易失性存储器可以是随机存取存储器(RAM,Random AccessMemory),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(SRAM,Static Random Access Memory)、同步静态随机存取存储器(SSRAM,Synchronous Static Random Access Memory)、动态随机存取存储器(DRAM,Dynamic Random Access Memory)、同步动态随机存取存储器(SDRAM,SynchronousDynamic Random Access Memory)、双倍数据速率同步动态随机存取存储器(DDRSDRAM,Double Data Rate Synchronous Dynamic Random Access Memory)、增强型同步动态随机存取存储器(ESDRAM,Enhanced Synchronous Dynamic Random Access Memory)、同步连接动态随机存取存储器(SLDRAM,SyncLink Dynamic Random Access Memory)、直接内存总线随机存取存储器(DRRAM,Direct Rambus Random Access Memory)。本发明实施例描述的存储器32旨在包括但不限于这些和任意其它适合类型的存储器。
上述本发明实施例揭示的方法可以应用于处理器31中,或者由处理器31实现。处理器31可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器31中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器31可以是通用处理器、DSP,或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。处理器31可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合本发明实施例所公开的方法的步骤,可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于存储介质中,该存储介质位于存储器32,处理器31读取存储器32中的信息,结合其硬件完成前述方法的步骤。
在示例性实施例中,调度设备可以被一个或多个应用专用集成电路(ASIC,Application Specific Integrated Circuit)、DSP、可编程逻辑器件(PLD,ProgrammableLogic Device)、复杂可编程逻辑器件(CPLD,Complex Programmable Logic Device)、FPGA、通用处理器、控制器、MCU、微处理器(Microprocessor)、或其他电子元件实现,用于执行前述方法。
在示例性实施例中,本发明实施例还提供了一种计算机可读存储介质,例如包括计算机程序的存储器32,上述计算机程序可由调度设备的处理器31执行,以完成前述方法所述步骤。计算机可读存储介质可以是FRAM、ROM、PROM、EPROM、EEPROM、Flash Memory、磁表面存储器、光盘、或CD-ROM等存储器;也可以是包括上述存储器之一或任意组合的各种设备。
本发明实施例提供的计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明实施例所述算力调度方法的步骤。
本发明实施例还提供了一种算力调度系统,所述系统包括调度设备和算力节点;所述算力节点至少包括:网络算力节点和泛终端节点;所属调度设备包括本发明实施例上述的算力调度装置。
本申请所提供的几个方法实施例中所揭露的方法,在不冲突的情况下可以任意组合,得到新的方法实施例。
本申请所提供的几个产品实施例中所揭露的特征,在不冲突的情况下可以任意组合,得到新的产品实施例。
本申请所提供的几个方法或设备实施例中所揭露的特征,在不冲突的情况下可以任意组合,得到新的方法实施例或设备实施例。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元,即可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本发明各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
或者,本发明上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (17)

1.一种算力调度方法,其特征在于,所述方法包括:
获得算力节点信息;所述算力节点信息包括各算力节点上报的资源信息;所述资源信息至少包括:算力类型、算力资源相关信息和网络信息;所述算力节点至少包括:网络算力节点和泛终端节点;
基于所述算力节点信息确定满足用户的算力需求的至少一个第一算力节点以及每个第一算力节点待调度的算力资源,将各第一算力节点待调度的算力资源分配给所述用户。
2.根据权利要求1所述的方法,其特征在于,所述获得算力节点信息,包括:
获得各算力节点的注册信息;所述注册信息包括所述资源信息;和/或,
在算力节点注册完成后,周期性的获得算力节点上报的所述资源信息;
其中,在所述算力节点为网络算力节点的情况下,基于部署在所述算力节点中的虚拟基础设施管理器获得所述算力节点的注册信息;
在所述算力节点为泛终端节点的情况下,基于部署在所述算力节点中的客户端获得所述算力节点的注册信息。
3.根据权利要求1所述的方法,其特征在于,所述获得算力节点信息,包括:
获得网络设备发送的算力节点信息;其中,所述算力节点信息为各算力节点向所述网络设备发送注册信息或者周期性的上报所述资源信息而生成;所述注册信息包括所述资源信息。
4.根据权利要求1所述的方法,其特征在于,所述基于所述算力节点信息确定满足用户的算力需求的至少一个第一算力节点以及每个第一算力节点待调度的算力资源,包括:
基于所述算力节点信息确定满足用户的算力需求的第一算力节点以及待调度的算力资源;或者,
基于所述算力节点信息对用户的算力需求进行分解,得到多个算力子需求,确定满足所述多个算力子需求的多个第一算力节点以及每个第一算力节点待调度的算力资源。
5.根据权利要求1至4任一项所述的方法,其特征在于,所述方法还包括:
通过其他网络设备获得所述用户的算力需求;或者,
获得用户需求信息,基于所述用户需求信息确定所述用户的算力需求。
6.根据权利要求1至4任一项所述的方法,其特征在于,所述方法还包括:
在所述用户的算力需求变化时,基于所述算力节点信息对分配给所述用户的第一算力节点和/或各第一算力节点待调度的算力资源进行调整,将调整后的各第一算力节点待调度的算力资源重新分配给所述用户。
7.根据权利要求1所述的方法,其特征在于,所述将各第一算力节点待调度的算力资源分配给所述用户,包括:
在所述至少一个第一算力节点上部署应用并进行网络配置,以及向所述用户所在的终端发送对应于各第一算力节点的算力链接信息,以使所述终端基于所述算力链接信息访问所述至少一个第一算力节点并使用算力服务。
8.一种算力调度装置,其特征在于,所述装置包括:信息获取模块和调度模块;其中,
所述信息获取模块,用于获得算力节点信息;所述算力节点信息包括各算力节点上报的资源信息;所述资源信息至少包括:算力类型、算力资源相关信息和网络信息;所述算力节点至少包括:网络算力节点和泛终端节点;
所述调度模块,用于基于所述算力节点信息确定满足用户的算力需求的至少一个第一算力节点以及每个第一算力节点待调度的算力资源,将各第一算力节点待调度的算力资源分配给所述用户。
9.根据权利要求8所述的装置,其特征在于,所述信息获取模块包括注册单元,用于获得各算力节点的注册信息;所述注册信息包括所述资源信息;和/或,
所述信息获取模块包括获取单元,用于在算力节点注册完成后,周期性的获得算力节点上报的所述资源信息;
其中,在所述算力节点为网络算力节点的情况下,基于部署在所述算力节点中的虚拟基础设施管理器获得所述算力节点的注册信息;
在所述算力节点为泛终端节点的情况下,基于部署在所述算力节点中的客户端获得所述算力节点的注册信息。
10.根据权利要求8所述的装置,其特征在于,所述信息获取模块,用于获得网络设备发送的算力节点信息;其中,所述算力节点信息为各算力节点向所述网络设备发送注册信息或者周期性的上报所述资源信息而生成;所述注册信息包括所述资源信息。
11.根据权利要求8所述的装置,其特征在于,所述调度模块,用于基于所述算力节点信息确定满足用户的算力需求的第一算力节点以及待调度的算力资源;或者,
所述调度模块包括分解单元和调度单元;
所述分解单元,用于基于所述算力节点信息对用户的算力需求进行分解,得到多个算力子需求;
所述调度单元,用于确定满足所述多个算力子需求的多个第一算力节点以及每个第一算力节点待调度的算力资源。
12.根据权利要求8至11任一项所述的装置,其特征在于,所述装置还包括需求获取模块,用于通过其他网络设备获得所述用户的算力需求;或者,获得用户需求信息,基于所述用户需求信息确定所述用户的算力需求。
13.根据权利要求8至11任一项所述的装置,其特征在于,所述调度模块,还用于在所述用户的算力需求变化时,基于所述算力节点信息对分配给所述用户的第一算力节点和/或各第一算力节点待调度的算力资源进行调整,将调整后的各第一算力节点待调度的算力资源重新分配给所述用户。
14.根据权利要求8所述的装置,其特征在于,所述调度模块,用于在所述至少一个第一算力节点上部署应用并进行网络配置,以及向所述用户所在的终端发送对应于各第一算力节点的算力链接信息,以使所述终端基于所述算力链接信息访问所述至少一个第一算力节点并使用算力服务。
15.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1至7任一项所述方法的步骤。
16.一种调度设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至7任一项所述方法的步骤。
17.一种算力调度系统,其特征在于,所述系统包括调度设备和算力节点;所述算力节点至少包括:网络算力节点和泛终端节点;所述调度设备包括权利要求8至14任一项所述的算力调度装置。
CN202011270307.5A 2020-11-13 2020-11-13 一种算力调度方法、装置、调度设备、系统和存储介质 Pending CN114500521A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011270307.5A CN114500521A (zh) 2020-11-13 2020-11-13 一种算力调度方法、装置、调度设备、系统和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011270307.5A CN114500521A (zh) 2020-11-13 2020-11-13 一种算力调度方法、装置、调度设备、系统和存储介质

Publications (1)

Publication Number Publication Date
CN114500521A true CN114500521A (zh) 2022-05-13

Family

ID=81490382

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011270307.5A Pending CN114500521A (zh) 2020-11-13 2020-11-13 一种算力调度方法、装置、调度设备、系统和存储介质

Country Status (1)

Country Link
CN (1) CN114500521A (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115150374A (zh) * 2022-05-27 2022-10-04 山东浪潮科学研究院有限公司 面向算力网络的泛在算力纳管方法、装置及电子设备
CN115580539A (zh) * 2022-10-13 2023-01-06 联通(广东)产业互联网有限公司 基于人工智能场景的算网储调度方法、系统及设备
CN115766721A (zh) * 2022-11-21 2023-03-07 中国联合网络通信集团有限公司 业务传输方法、装置及其存储介质
CN116302580A (zh) * 2023-05-25 2023-06-23 南方电网数字电网研究院有限公司 纳米继电器算力资源调度方法及装置
CN116414559A (zh) * 2023-01-28 2023-07-11 北京神州泰岳软件股份有限公司 算力统一标识建模、分配的方法、存储介质及电子设备
WO2023241532A1 (zh) * 2022-06-14 2023-12-21 大唐移动通信设备有限公司 算网融合方法和相关设备
WO2023246756A1 (zh) * 2022-06-21 2023-12-28 维沃移动通信有限公司 算力服务方法、装置、终端及核心网设备
WO2024007880A1 (zh) * 2022-07-06 2024-01-11 大唐移动通信设备有限公司 网络功能确定方法、装置及存储介质
WO2024027413A1 (zh) * 2022-08-01 2024-02-08 华为技术有限公司 一种协同调度方法和相关设备
WO2024045784A1 (zh) * 2022-08-29 2024-03-07 华为技术有限公司 作业调度方法、调度器及相关设备
WO2024055880A1 (zh) * 2022-09-13 2024-03-21 大唐移动通信设备有限公司 一种注册方法、装置及可读存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110351375A (zh) * 2019-07-16 2019-10-18 深圳市网心科技有限公司 一种数据处理方法、装置及计算机装置、可读存储介质
CN110532092A (zh) * 2019-08-21 2019-12-03 云湾科技(嘉兴)有限公司 资源匹配方法、装置及设备
CN110851529A (zh) * 2019-11-01 2020-02-28 腾讯科技(深圳)有限公司 算力调度方法及相关设备
WO2020173553A1 (en) * 2019-02-26 2020-09-03 Siemens Aktiengesellschaft Decentralized job scheduling in a topology agnostic environment
CN111625354A (zh) * 2020-05-19 2020-09-04 南京乐贤智能科技有限公司 一种边缘计算设备算力的编排方法及其相关设备
CN111651253A (zh) * 2020-05-28 2020-09-11 中国联合网络通信集团有限公司 算力资源的调度方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020173553A1 (en) * 2019-02-26 2020-09-03 Siemens Aktiengesellschaft Decentralized job scheduling in a topology agnostic environment
CN110351375A (zh) * 2019-07-16 2019-10-18 深圳市网心科技有限公司 一种数据处理方法、装置及计算机装置、可读存储介质
CN110532092A (zh) * 2019-08-21 2019-12-03 云湾科技(嘉兴)有限公司 资源匹配方法、装置及设备
CN110851529A (zh) * 2019-11-01 2020-02-28 腾讯科技(深圳)有限公司 算力调度方法及相关设备
CN111625354A (zh) * 2020-05-19 2020-09-04 南京乐贤智能科技有限公司 一种边缘计算设备算力的编排方法及其相关设备
CN111651253A (zh) * 2020-05-28 2020-09-11 中国联合网络通信集团有限公司 算力资源的调度方法及装置

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115150374A (zh) * 2022-05-27 2022-10-04 山东浪潮科学研究院有限公司 面向算力网络的泛在算力纳管方法、装置及电子设备
CN115150374B (zh) * 2022-05-27 2023-06-27 山东浪潮科学研究院有限公司 面向算力网络的泛在算力纳管方法、装置及电子设备
WO2023241532A1 (zh) * 2022-06-14 2023-12-21 大唐移动通信设备有限公司 算网融合方法和相关设备
WO2023246756A1 (zh) * 2022-06-21 2023-12-28 维沃移动通信有限公司 算力服务方法、装置、终端及核心网设备
WO2024007880A1 (zh) * 2022-07-06 2024-01-11 大唐移动通信设备有限公司 网络功能确定方法、装置及存储介质
WO2024027413A1 (zh) * 2022-08-01 2024-02-08 华为技术有限公司 一种协同调度方法和相关设备
WO2024045784A1 (zh) * 2022-08-29 2024-03-07 华为技术有限公司 作业调度方法、调度器及相关设备
WO2024055880A1 (zh) * 2022-09-13 2024-03-21 大唐移动通信设备有限公司 一种注册方法、装置及可读存储介质
CN115580539A (zh) * 2022-10-13 2023-01-06 联通(广东)产业互联网有限公司 基于人工智能场景的算网储调度方法、系统及设备
CN115766721A (zh) * 2022-11-21 2023-03-07 中国联合网络通信集团有限公司 业务传输方法、装置及其存储介质
CN116414559A (zh) * 2023-01-28 2023-07-11 北京神州泰岳软件股份有限公司 算力统一标识建模、分配的方法、存储介质及电子设备
CN116302580A (zh) * 2023-05-25 2023-06-23 南方电网数字电网研究院有限公司 纳米继电器算力资源调度方法及装置
CN116302580B (zh) * 2023-05-25 2023-09-15 南方电网数字电网研究院有限公司 纳米继电器算力资源调度方法及装置

Similar Documents

Publication Publication Date Title
CN114500521A (zh) 一种算力调度方法、装置、调度设备、系统和存储介质
EP3748908A1 (en) Method, system, network device, storage medium for creating a network slice
CN113301078B (zh) 网络系统、服务部署与网络划分方法、设备及存储介质
CN113742031B (zh) 节点状态信息获取方法、装置、电子设备及可读存储介质
CN113726846A (zh) 边缘云系统、资源调度方法、设备及存储介质
CN109245908B (zh) 一种主从集群切换的方法和装置
US8909189B2 (en) System, method and program product for maintaining deployed response team members synchronized
CN111078404B (zh) 一种计算资源确定方法、装置、电子设备及介质
CN111459749A (zh) 基于Prometheus的私有云监控方法、装置、计算机设备及存储介质
CN111800285A (zh) 实例迁移方法和装置以及电子设备
US11463307B2 (en) Conflict-free change deployment
CN111083177B (zh) 基于协同网关的跨域协同交互方法
Dustdar et al. Towards distributed edge-based systems
CN113220459B (zh) 一种任务处理方法及装置
CN111190731A (zh) 基于权重的集群任务调度系统
Guerrero-Contreras et al. Dynamic replication and deployment of services in mobile environments
CN115630818A (zh) 应急管理方法、装置、电子设备以及存储介质
WO2023209414A1 (en) Methods and apparatus for computing resource allocation
CN114301980A (zh) 容器集群的调度方法、装置、系统及计算机可读介质
Dai et al. Edge trusted sharing: task-driven decentralized resources collaborate in IoT
CN114237873A (zh) 一种私有云环境下管理资源系统及方法
CN113094131A (zh) 提示资源的显示方法、装置、终端、服务器及存储介质
CN110278236B (zh) 一种企业业务融合通信方法及装置
Babou et al. HEC-NerveNet: A Resilient Edge Cloud Architecture for Beyond 5G Networks
CN116112306B (zh) 一种去中心化的网络交互方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination