CN115580539A - 基于人工智能场景的算网储调度方法、系统及设备 - Google Patents

基于人工智能场景的算网储调度方法、系统及设备 Download PDF

Info

Publication number
CN115580539A
CN115580539A CN202211252776.3A CN202211252776A CN115580539A CN 115580539 A CN115580539 A CN 115580539A CN 202211252776 A CN202211252776 A CN 202211252776A CN 115580539 A CN115580539 A CN 115580539A
Authority
CN
China
Prior art keywords
computing power
computing
information
network
node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211252776.3A
Other languages
English (en)
Inventor
黎元宝
冯汉枣
刘运奇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Unicom Guangdong Industrial Internet Co Ltd
Original Assignee
China Unicom Guangdong Industrial Internet Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Unicom Guangdong Industrial Internet Co Ltd filed Critical China Unicom Guangdong Industrial Internet Co Ltd
Priority to CN202211252776.3A priority Critical patent/CN115580539A/zh
Publication of CN115580539A publication Critical patent/CN115580539A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0803Configuration setting
    • H04L41/0823Configuration setting characterised by the purposes of a change of settings, e.g. optimising configuration for enhancing reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/12Discovery or management of network topologies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
    • H04L67/1004Server selection for load balancing

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种基于人工智能场景的算网储调度方法,包括:步骤一:获取算力节点信息;步骤二:通过网络设备获取用户算力需求或用户需求信息;步骤三:基于用户需求信息确定用户算力需求;步骤四:当用户算力需求变化时,根据算力节点信息对分配给用户的算力节点或各算力节点待调度的算力资源进行调整,将调整后的各算力节点待调度的算力资源重新分配给用户。通过调度人工智能场景的算网储中的算力节点,达到对算力资源进行高效合理分配的技术效果。

Description

基于人工智能场景的算网储调度方法、系统及设备
技术领域
本发明涉及算力网络领域,更具体地,涉及基于人工智能场景的算网储调度方法、系统及设备。
背景技术
在计算机科学中,人工智能(AI)有时被称为机器智能,是由机器展示的智能,与人类和动物展示的自然智能形成对比。通俗地说,“人工智能”一词用来描述模仿人类与其他人类思维相关联的“认知”功能的机器,如“学习”和“解决问题”。
人工智能可以分为三种不同类型的系统:分析型、人类启发型和人性化人工智能。分析型人工智能只有与认知智能一致的特征;生成对世界的认知表示,并利用基于过去经验的学习来为未来的决策提供信息。人类启发的人工智能包含认知和情商的元素;除了认知因素之外,还要理解人类情感,并在决策中考虑它们。人性化人工智能显示了所有类型能力(即认知、情感和社会智能)的特征,能够自我意识,并在与他人的互动中自我意识。
算力网络将分布在各地的人工智能计算中心节点连接起来,动态实时根据算力资源状态和需求,实现统筹分配和调度计算任务,构成全国范围内的感知、分配、调度人工智能中心的算力网络,然后在此基础上汇聚和共享算力、数据、算法资源。
在算力网络中,任意节点都可以提供算力以完成差异化服务需求,但是不同的节点具有不同的计算能力,因此亟需要基于人工智能场景的算网储调度方法。
发明内容
本发明旨在克服上述现有技术的至少一种缺陷,提供基于人工智能场景的算网储调度方法,以达到对算力资源进行高效合理分配的技术效果,本发明采取的技术方案包括:
步骤一:获取算力节点信息;
步骤二:通过网络设备获取用户算力需求或用户需求信息;
步骤三:基于用户需求信息确定用户算力需求;
步骤四:当用户算力需求变化时,根据对应的算力节点信息对分配给用户的算力节点或各算力节点待调度的算力资源进行调整,将调整后的各算力节点待调度的算力资源重新分配给用户。
根据算力节点信息对用户的算力节点进行调整,或直接对算力节点对应的,待调度的算力资源进行调整,进而可以达到对算网资源进行动态调度的技术效果,提高算网资源配置的合理性和使用效率。
进一步,所述获取算力节点信息包括:获取各算力节点上报的资源信息、获取各算力节点的注册信息和获取网络设备发送的算力节点信息。
通过获取各算力节点上报的资源信息、各算力节点的注册信息和网络设备发送的算力节点信息,得到与算力节点相关的信息,有利于后续对算网资源的高效合理调度。
进一步,所述各算力节点上报的资源信息包括算力类型、算力资源相关信息和算力网络中的网络资源信息。
通过对算力节点上报的资源信息进行获取,得到详细的资源信息,根据算力节点上报的资源信息,可以对相关资源信息进行分析,得到实时准确的算力节点信息,进而有利于后续算力资源的合理调度。
进一步,所述获取算力网络中的网络资源信息包括以下步骤:
S1:根据网络资源信息构建算力网络的网络拓扑图;
S2:根据网络拓扑图,通过网络拓扑图中连接算力资源池的网络设备,获取算力资源池的信息;
S3:根据算力资源池的信息以及网络拓扑图,构建算网资源视图。
根据网络资源信息构建网络拓扑图,可以将算力网络中的设备的物理布局相互连接,保证信息获取的及时性,针对不同的算力网络结构,可以构建不同类型的网络拓扑图,进而达到有利于管理维护、方便检测和隔离、易于控制、减少网络延迟时间、降低传输误差和提高可靠性等技术效果。
通过网络拓扑图,形成算力资源池,可以综合分析并获取算力资源池的信息,进而再构建算网资源视图,有利于可视化分析,并对算网资源进行合理调度分配。
进一步,将各算力节点的注册信息完成后,周期性的获取算力节点上报的资源信息,其中,在算力节点为网络算力节点的情况下,基于部署在算力节点中的虚拟基础设施管理器获取算力节点的注册信息或者在算力节点为泛终端节点的情况下,基于部署在算力节点中的客户端获取算力节点的注册信息。
通过周期性获取算力节点上报的资源信息,可以减少对硬件的依赖和降低服务器压力,提高信息获取效率。通过在算力节点部署虚拟基础设施管理器,有利于快速获取算力节点的注册信息,进而提高资源调度的效率,保证信息获取的安全性。
进一步,算力节点信息为各算力节点向网络设备发送注册信息或者周期性的上报所述资源信息而生成。
根据算力节点向网络设备发送的注册信息或周期性的上报的所述资源信息获取算力节点信息,可以有效提高算力节点信息的准确性和安全性。
进一步,所述步骤三中算力节点信息确定满足用户的算力需求的至少一个算力节点以及每个算力节点待调度的算力资源,包括:基于所述算力节点信息确定满足用户的算力需求的算力节点以及待调度的算力资源;或者基于所述算力节点信息对用户的算力需求进行分解,得到多个算力子需求,确定满足多个算力子需求的多个算力节点以及每个算力节点待调度的算力资源。
通过将算力需求分解为多个算力子需求,再进行算力需求的分析调度,有利于算力资源的合理调度,避免发生阻塞,提高算力资源的调度效率和合理性。
进一步,所述步骤四中将各算力节点待调度的算力资源分配给用户,包括:在至少一个算力节点上部署应用并进行网络配置,以及向用户所在的终端发送对应于各算力节点的算力链接信息,以使终端基于算力链接信息访问至少一个算力节点并使用算力服务。
通过在至少一个算力节点上部署应用并进行网络配置,以及向用户所在的终端发送对应于各算力节点的算力链接信息,保证终端基于算力链接信息至少访问一个算力节点并使用算力服务,可以避免发生算力资源的无效占用,提高算力资源的使用效率。
本发明还提供一种基于人工智能场景的算网储调度系统,包括:
节点信息获取模块,用于获取算力节点信息;
用户需求获取模块,用于通过网络设备获取用户算力需求或用户需求信息;
算力需求确定模块,用于基于用户需求信息确定用户算力需求;
算力资源分配模块,用于当用户算力需求变化时,根据对应的算力节点信息对分配给用户的算力节点或各算力节点待调度的算力资源进行调整,将调整后的各算力节点待调度的算力资源重新分配给用户。
本发明的基于人工智能场景的算网储调度设备与基于人工智能场景的算网储调度方法基于同样的发明构思,在此不再赘述。
与现有技术相比,本发明的有益效果为:
1.可以对算力资源进行高效合理分配。
2.有利于设备的管理维护、方便检测和隔离、易于控制、减少网络延迟时间、降低传输误差和提高可靠性。
3.避免发生阻塞,提高算力资源的调度效率和合理性。
4.避免发生算力资源的无效占用,提高算力资源的使用效率。
附图说明
图1为本发明的基于人工智能场景的算网储调度方法流程图。
图2为本发明获取算力网络中的网络资源信息的流程图。
具体实施方式
本发明附图仅用于示例性说明,不能理解为对本发明的限制。为了更好说明以下实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;对于本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。
实施例1
如图1所示,本实施例提供一种基于人工智能场景的算网储调度方法,包括:
步骤一:获取算力节点信息;
步骤二:通过网络设备获取用户算力需求或用户需求信息;
步骤三:基于用户需求信息确定用户算力需求;
步骤四:当用户算力需求变化时,根据对应的算力节点信息对分配给用户的算力节点或各算力节点待调度的算力资源进行调整,将调整后的各算力节点待调度的算力资源重新分配给用户。
根据算力节点信息对用户的算力节点进行调整,或直接对算力节点对应的,待调度的算力资源进行调整,进而可以达到对算网资源进行动态调度的技术效果,提高算网资源配置的合理性和使用效率。
优选地,所述获取算力节点信息包括:获取各算力节点上报的资源信息、获取各算力节点的注册信息和获取网络设备发送的算力节点信息。
通过获取各算力节点上报的资源信息、各算力节点的注册信息和网络设备发送的算力节点信息,得到与算力节点相关的信息,有利于后续对算网资源的高效合理调度。
优选地,所述各算力节点上报的资源信息包括算力类型、算力资源相关信息和算力网络中的网络资源信息。
通过对算力节点上报的资源信息进行获取,得到详细的资源信息,根据算力节点上报的资源信息,可以对相关资源信息进行分析,得到实时准确的算力节点信息,进而有利于后续算力资源的合理调度。
优选地,如图2所示,所述获取算力网络中的网络资源信息包括以下步骤:
S1:根据网络资源信息构建算力网络的网络拓扑图;
S2:根据网络拓扑图,通过网络拓扑图中连接算力资源池的网络设备,获取算力资源池的信息;
S3:根据算力资源池的信息以及网络拓扑图,构建算网资源视图。
根据网络资源信息构建网络拓扑图,可以将算力网络中的设备的物理布局相互连接,保证信息获取的及时性,针对不同的算力网络结构,可以构建不同类型的网络拓扑图,进而达到有利于管理维护、方便检测和隔离、易于控制、减少网络延迟时间、降低传输误差和提高可靠性等技术效果。
通过网络拓扑图,形成算力资源池,可以综合分析并获取算力资源池的信息,进而再构建算网资源视图,有利于可视化分析,并对算网资源进行合理调度分配。
优选地,将各算力节点的注册信息完成后,周期性的获取算力节点上报的资源信息,其中,在算力节点为网络算力节点的情况下,基于部署在算力节点中的虚拟基础设施管理器获取算力节点的注册信息或者在算力节点为泛终端节点的情况下,基于部署在算力节点中的客户端获取算力节点的注册信息。
通过周期性获取算力节点上报的资源信息,可以减少对硬件的依赖和降低服务器压力,提高信息获取效率。通过在算力节点部署虚拟基础设施管理器,有利于快速获取算力节点的注册信息,进而提高资源调度的效率,保证信息获取的安全性。
优选地,算力节点信息为各算力节点向网络设备发送注册信息或者周期性的上报所述资源信息而生成。
根据算力节点向网络设备发送的注册信息或周期性的上报的所述资源信息获取算力节点信息,可以有效提高算力节点信息的准确性和安全性。
优选地,所述步骤三中算力节点信息确定满足用户的算力需求的至少一个算力节点以及每个算力节点待调度的算力资源,包括:基于所述算力节点信息确定满足用户的算力需求的算力节点以及待调度的算力资源;或者基于所述算力节点信息对用户的算力需求进行分解,得到多个算力子需求,确定满足多个算力子需求的多个算力节点以及每个算力节点待调度的算力资源。
通过将算力需求分解为多个算力子需求,再进行算力需求的分析调度,有利于算力资源的合理调度,避免发生阻塞,提高算力资源的调度效率和合理性。
优选地,所述步骤四中将各算力节点待调度的算力资源分配给用户,包括:在至少一个算力节点上部署应用并进行网络配置,以及向用户所在的终端发送对应于各算力节点的算力链接信息,以使终端基于算力链接信息访问至少一个算力节点并使用算力服务。
通过在至少一个算力节点上部署应用并进行网络配置,以及向用户所在的终端发送对应于各算力节点的算力链接信息,保证终端基于算力链接信息至少访问一个算力节点并使用算力服务,可以避免发生算力资源的无效占用,提高算力资源的使用效率。
实施例2
本实施例提供一种基于人工智能场景的算网储调度系统,包括:
节点信息获取模块,用于获取算力节点信息;
用户需求获取模块,用于通过网络设备获取用户算力需求或用户需求信息;
算力需求确定模块,用于基于用户需求信息确定用户算力需求;
算力资源分配模块,用于当用户算力需求变化时,根据对应的算力节点信息对分配给用户的算力节点或各算力节点待调度的算力资源进行调整,将调整后的各算力节点待调度的算力资源重新分配给用户。
根据算力节点信息对用户的算力节点进行调整,或直接对算力节点对应的,待调度的算力资源进行调整,进而可以达到对算网资源进行动态调度的技术效果,提高算网资源配置的合理性和使用效率。
显然,本发明的上述实施例仅仅是为清楚地说明本发明技术方案所作的举例,而并非是对本发明的具体实施方式的限定。凡在本发明权利要求书的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。

Claims (10)

1.一种基于人工智能场景的算网储调度方法,其特征在于,包括:
步骤一:获取算力节点信息;
步骤二:通过网络设备获取用户的算力需求或需求信息;
步骤三:基于用户需求信息确定用户的算力需求;
步骤四:当用户的算力需求变化时,根据算力节点信息对分配给用户的算力节点或各算力节点待调度的算力资源进行调整,将调整后的各算力节点待调度的算力资源重新分配给用户。
2.根据权利要求1所述的基于人工智能场景的算网储调度方法,其特征在于:所述获取算力节点信息包括:获取各算力节点上报的资源信息、获取各算力节点的注册信息和获取网络设备发送的算力节点信息。
3.根据权利要求2所述的基于人工智能场景的算网储调度方法,其特征在于:所述各算力节点上报的资源信息包括算力类型、算力资源相关信息和算力网络中的网络资源信息。
4.根据权利要求3所述的基于人工智能场景的算网储调度方法,其特征在于:所述获取算力网络中的网络资源信息包括以下步骤:
S1:根据网络资源信息构建算力网络的网络拓扑图;
S2:根据网络拓扑图,通过网络拓扑图中连接算力资源池的网络设备,获取算力资源池的信息;
S3:根据算力资源池的信息以及网络拓扑图,构建算网资源视图。
5.根据权利要求2所述的基于人工智能场景的算网储调度方法,其特征在于:将各算力节点的注册信息完成后,周期性的获取算力节点上报的资源信息,其中,在算力节点为网络算力节点的情况下,基于部署在算力节点中的虚拟基础设施管理器获取算力节点的注册信息或者在算力节点为泛终端节点的情况下,基于部署在算力节点中的客户端获取算力节点的注册信息。
6.根据权利要求1所述的基于人工智能场景的算网储调度方法,其特征在于:算力节点信息为各算力节点向网络设备发送注册信息或者周期性的上报所述资源信息而生成。
7.根据权利要求1所述的基于人工智能场景的算网储调度方法,其特征在于:所述步骤三中算力节点信息确定满足用户的算力需求的至少一个算力节点以及每个算力节点待调度的算力资源,包括:基于所述算力节点信息确定满足用户的算力需求的算力节点以及待调度的算力资源;或者基于所述算力节点信息对用户的算力需求进行分解,得到多个算力子需求,确定满足多个算力子需求的多个算力节点以及每个算力节点待调度的算力资源。
8.根据权利要求1所述的基于人工智能场景的算网储调度方法,其特征在于:所述步骤四中将各算力节点待调度的算力资源分配给用户,包括:在至少一个算力节点上部署应用并进行网络配置,以及向用户所在的终端发送对应于各算力节点的算力链接信息,以使终端基于算力链接信息访问至少一个算力节点并使用算力服务。
9.一种基于人工智能场景的算网储调度系统,其特征在于,包括:
节点信息获取模块,用于获取算力节点信息;
用户需求获取模块,用于通过网络设备获取用户算力需求或用户需求信息;
算力需求确定模块,用于基于用户需求信息确定用户算力需求;
算力资源分配模块,用于当用户算力需求变化时,根据对应的算力节点信息对分配给用户的算力节点或各算力节点待调度的算力资源进行调整,将调整后的各算力节点待调度的算力资源重新分配给用户。
10.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1~8任一项所述的基于人工智能场景的算网储调度方法。
CN202211252776.3A 2022-10-13 2022-10-13 基于人工智能场景的算网储调度方法、系统及设备 Pending CN115580539A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211252776.3A CN115580539A (zh) 2022-10-13 2022-10-13 基于人工智能场景的算网储调度方法、系统及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211252776.3A CN115580539A (zh) 2022-10-13 2022-10-13 基于人工智能场景的算网储调度方法、系统及设备

Publications (1)

Publication Number Publication Date
CN115580539A true CN115580539A (zh) 2023-01-06

Family

ID=84585566

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211252776.3A Pending CN115580539A (zh) 2022-10-13 2022-10-13 基于人工智能场景的算网储调度方法、系统及设备

Country Status (1)

Country Link
CN (1) CN115580539A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113810438A (zh) * 2020-06-12 2021-12-17 中国移动通信有限公司研究院 服务算力资源的调度、请求方法、节点设备及终端
CN114039858A (zh) * 2021-10-25 2022-02-11 中国联合网络通信集团有限公司 一种算网资源融合方法、装置、设备及存储介质
CN114500521A (zh) * 2020-11-13 2022-05-13 中国移动通信有限公司研究院 一种算力调度方法、装置、调度设备、系统和存储介质
CN115002862A (zh) * 2021-03-02 2022-09-02 中国移动通信有限公司研究院 算力处理的网络系统、业务处理方法及算力网元节点

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113810438A (zh) * 2020-06-12 2021-12-17 中国移动通信有限公司研究院 服务算力资源的调度、请求方法、节点设备及终端
CN114500521A (zh) * 2020-11-13 2022-05-13 中国移动通信有限公司研究院 一种算力调度方法、装置、调度设备、系统和存储介质
CN115002862A (zh) * 2021-03-02 2022-09-02 中国移动通信有限公司研究院 算力处理的网络系统、业务处理方法及算力网元节点
CN114039858A (zh) * 2021-10-25 2022-02-11 中国联合网络通信集团有限公司 一种算网资源融合方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
Naha et al. Deadline-based dynamic resource allocation and provisioning algorithms in fog-cloud environment
Huang et al. An edge computing framework for real-time monitoring in smart grid
Talaat et al. Effective load balancing strategy (ELBS) for real-time fog computing environment using fuzzy and probabilistic neural networks
Rajabinasab et al. Dynamic flexible job shop scheduling with alternative process plans: an agent-based approach
Rezaeipanah et al. Providing a new approach to increase fault tolerance in cloud computing using fuzzy logic
CN112870726B (zh) 图形处理器的资源分配方法、装置和存储介质
Zuhairy et al. Energy-efficient load balancing in wireless sensor network: An application of multinomial regression analysis
Pizzocaro et al. A distributed architecture for heterogeneous multi sensor-task allocation
Yan et al. Edge server deployment for health monitoring with reinforcement learning in internet of medical things
Dadashi Gavaber et al. BADEP: bandwidth and delay efficient application placement in fog‐based IoT systems
CN112668880A (zh) 配网网格的工单调度方法、装置、计算机设备和存储介质
Al-Dulaimy et al. Introduction to edge computing
Alves et al. Scheduling of home health care services based on multi-agent systems
Li et al. Task allocation of multiagent groups in social networked systems
Abbassy et al. Fog computing-based public e-service application in service-oriented architecture
Aiswarya et al. Latency Reduction in Medical IoT Using Fuzzy Systems by Enabling Optimized Fog Computing
CN115580539A (zh) 基于人工智能场景的算网储调度方法、系统及设备
Mahini et al. QoS and traffic aware greedy resource allocation in foggy internet of things
CN113259145A (zh) 网络切片的端到端组网方法、组网装置及网络切片设备
CN116109058A (zh) 一种基于深度强化学习的变电站巡视管理方法和装置
Azimi et al. Performance management in clustered edge architectures using particle swarm optimization
CN115543582A (zh) 超算算力网络统一调度方法、系统及设备
Lass et al. Coordination of first responders under communication and resource constraints (Short Paper)
Kong et al. An intelligent agent‐based method for task allocation in competitive cloud environments
CN113327033A (zh) 配电网故障诊断方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination