CN114968573A - 一种算力资源调度方法、装置及计算机可读存储介质 - Google Patents

一种算力资源调度方法、装置及计算机可读存储介质 Download PDF

Info

Publication number
CN114968573A
CN114968573A CN202210567933.3A CN202210567933A CN114968573A CN 114968573 A CN114968573 A CN 114968573A CN 202210567933 A CN202210567933 A CN 202210567933A CN 114968573 A CN114968573 A CN 114968573A
Authority
CN
China
Prior art keywords
calculation
computing power
domain
target
node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210567933.3A
Other languages
English (en)
Inventor
李希金
唐雄燕
安岗
周晓龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China United Network Communications Group Co Ltd
Original Assignee
China United Network Communications Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China United Network Communications Group Co Ltd filed Critical China United Network Communications Group Co Ltd
Priority to CN202210567933.3A priority Critical patent/CN114968573A/zh
Publication of CN114968573A publication Critical patent/CN114968573A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • G06F9/5044Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering hardware capabilities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种算力资源调度方法、装置及介质,该方法包括:S1,获取目标算力需求节点的算力任务;S2,根据目标算力需求节点与预设区域内各个算力域之间的距离以及网络跳数对各个算力域进行排序,得到排序后的算力域列表;S3,从排序后的算力域列表中选择第一个算力域作为当前算力域;S4,判断当前算力域中是否存在与算力任务相匹配的目标算力提供节点;S5,若存在,则将算力任务发送到目标算力提供节点进行计算,否则,从排序后的算力域列表中选择下一个算力域作为当前算力域,并返回执行步骤S4。该方法、装置及介质能够解决现有基于单一维度的算力资源调度方法,仅考虑地理距离带来的时延而忽略了网络结构及其可能的变化带来的时延的问题。

Description

一种算力资源调度方法、装置及计算机可读存储介质
技术领域
本发明涉及一种算力资源调度方法、装置及计算机可读存储介质。
背景技术
现代工业生产环境中,往往要求更高的算力、更低的时延,,然而,现有的算力资源调度方法往往局限于地理距离,也即单纯的提供最近距离的算力以确保较低的时延,其基于单一维度的算力资源调度方法通常情况下并非最优,存在仅考虑地理距离带来的时延而忽略了网络结构及其可能的变化带来的时延。
发明内容
本发明所要解决的技术问题是针对现有技术的上述不足,提供一种算力资源调度方法、装置及计算机可读存储介质,在考虑地理距离的影响的同时,加上网络跳数参数的影响,用以解决现有基于单一维度的算力资源调度方法,仅考虑地理距离带来的时延而忽略了网络结构及其可能的变化带来的时延的问题。
第一方面,本发明提供一种算力资源调度方法,包括:
S1,获取目标算力需求节点的算力任务;
S2,根据目标算力需求节点与预设区域内各个算力域之间的距离以及网络跳数对各个算力域进行排序,得到排序后的算力域列表,其中,每个所述算力域包括一个或多个算力提供节点;
S3,从所述排序后的算力域列表中选择第一个算力域作为当前算力域;
S4,判断所述当前算力域中是否存在与所述算力任务相匹配的目标算力提供节点;
S5,若存在,则将所述算力任务发送到所述目标算力提供节点进行计算,否则,从所述排序后的算力域列表中选择下一个算力域作为当前算力域,并返回执行步骤S4。
优选地,所述根据目标算力需求节点与预设区域内各个算力域之间的距离以及网络跳数对各个算力域进行排序之前,所述方法还包括:
根据预存的网络拓扑图以及通信链路信息库获取所述目标算力需求节点与预设区域内各个算力域之间的距离以及网络跳数。
优选地,所述根据预存的网络拓扑图以及通信链路信息库获取所述目标算力需求节点与预设区域内各个算力域之间的距离以及网络跳数之前,所述方法还包括:
获取所述网络拓扑图,其中,所述网络拓扑图包含预设区域内各个算力需求节点与各个算力域之间的连接关系;以及,
获取所述网络拓扑图中各个所述算力需求节点与各个算力域之间所有通信链路的距离以及网络跳数,并根据所述距离以及网络跳数生成所述通信链路信息库。
优选地,所述根据目标算力需求节点与预设区域内各个算力域之间的距离以及网络跳数对各个算力域进行排序,得到排序后的算力域列表,具体包括:
根据目标算力需求节点与预设区域内各个算力域之间的欧氏距离和网络跳数计算各个算力域到目标算力需求节点间的加权综合距离;
将各个算力域按照加权综合距离从小到大进行排序以得到排序后的算力域列表。
优选地,所述根据目标算力需求节点与预设区域内各个算力域之间的欧氏距离和网络跳数计算各个算力域到目标算力需求节点间的加权综合距离,具体根据以下公式进行计算:
C=α×A+β×B
其中,C为算力域到目标算力需求节点间的加权综合距离,为算力域到目标算力需求节点间的欧氏距离,B为算力域到目标算力需求节点间的网络跳数,α和β为预设的权值。
优选地,所述判断所述当前算力域中是否存在与所述算力任务相匹配的目标算力提供节点之前,所述方法还包括:
获取所述当前算力域中各个算力提供节点的算力值与算力类型;
根据所述算力值与算力类型获取所述当前算力域中所有与所述算力任务对应的算力类型相同,且算力值满足所述算力任务的算力提供节点,构成算力提供节点列表;
若所述算力提供节点列表不为空,则获取所述算力提供节点列表中各个算力提供节点的实时负载;
从所述算力提供节点列表中选择算力值减去所述实时负载后仍然满足所述算力任务的第一个算力提供节点作为与所述算力任务相匹配的目标算力提供节点。
优选地,所述获取所述当前算力域中各个算力提供节点的算力值与算力类型之前,所述方法还包括:
获取所述当前算力域中各个算力提供节点的算力资源信息,其中,所述算力资源信息包括中央处理器CPU的主频、图形处理器GPU的主频、总线位宽、一级缓存、内存的频率和字节常数中的至少一种;
根据所述算力资源信息计算并存储各个算力提供节点的算力值以及算力类型。
优选地,还包括:
定时或不定时更新所述网络拓扑与通信链路信息库。
第二方面,本发明还提供一种算力资源调度装置,包括:
获取模块,用于获取目标算力需求节点的算力任务;
排序模块,与所述获取模块连接,用于根据目标算力需求节点与预设区域内各个算力域之间的距离以及网络跳数对各个算力域进行排序,得到排序后的算力域列表,其中,每个所述算力域包括一个或多个算力提供节点;
选择模块,与所述排序模块连接,用于从所述排序后的算力域列表中选择第一个算力域作为当前算力域;
判断模块,与所述选择模块连接,用于判断所述当前算力域中是否存在与所述算力任务相匹配的目标算力提供节点;
计算模块,与所述判断模块连接,用于当判断模块判断为是时,将所述算力任务发送到所述目标算力提供节点进行计算,否则,从所述排序后的算力域列表中选择下一个算力域作为当前算力域,并返回判断模块。
第三方面,本发明还提供一种算力资源调度装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以实现上述第一方面所述的算力资源调度方法。
第四方面,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述第一方面所述的算力资源调度方法。
本发明提供的算力资源调度方法、装置及计算机可读存储介质,在获取到目标算力需求节点的算力任务后,首先根据目标算力需求节点与预设区域内各个算力域之间的距离以及网络跳数对各个算力域进行排序,得到排序后的算力域列表,然后从所述排序后的算力域列表中选择第一个算力域作为当前算力域,并判断当前算力域中是否存在与所述算力任务相匹配的目标算力提供节点,若存在,则将所述算力任务发送到所述目标算力提供节点进行计算,否则,从所述排序后的算力域列表中选择下一个算力域作为当前算力域,并返回执行上述的判断步骤,由于本发明在选择目标算力提供节点时,综合考虑了网络跳数和距离带来的时延影响,相较于现有仅仅考虑了距离的算力资源调度方法,能够做到算力资源调度的最优化,从而解决了现有基于单一维度的算力资源调度方法,仅考虑地理距离带来的时延而忽略了网络结构及其可能的变化带来的时延的问题。
附图说明
图1为本发明实施例1的一种算力资源调度方法的流程图;
图2为本发明实施例2的一种算力资源调度装置的结构示意图;
图3为本发明实施例3的一种算力资源调度装置的结构示意图。
具体实施方式
为使本领域技术人员更好地理解本发明的技术方案,下面将结合附图对本发明实施方式作进一步地详细描述。
可以理解的是,此处描述的具体实施例和附图仅仅用于解释本发明,而非对本发明的限定。
可以理解的是,在不冲突的情况下,本发明中的各实施例及实施例中的各特征可相互组合。
可以理解的是,为便于描述,本发明的附图中仅示出了与本发明相关的部分,而与本发明无关的部分未在附图中示出。
可以理解的是,本发明的实施例中所涉及的每个单元、模块可仅对应一个实体结构,也可由多个实体结构组成,或者,多个单元、模块也可集成为一个实体结构。
可以理解的是,在不冲突的情况下,本发明的流程图和框图中所标注的功能、步骤可按照不同于附图中所标注的顺序发生。
可以理解的是,本发明的流程图和框图中,示出了按照本发明各实施例的系统、装置、设备、方法的可能实现的体系架构、功能和操作。其中,流程图或框图中的每个方框可代表一个单元、模块、程序段、代码,其包含用于实现规定的功能的可执行指令。而且,框图和流程图中的每个方框或方框的组合,可用实现规定的功能的基于硬件的系统实现,也可用硬件与计算机指令的组合来实现。
可以理解的是,本发明实施例中所涉及的单元、模块可通过软件的方式实现,也可通过硬件的方式来实现,例如单元、模块可位于处理器中。
实施例1:
本实施例提供一种算力资源调度方法,如图1所示,该方法包括:
步骤S1:获取目标算力需求节点的算力任务。
在本实施例中,算力需求节点为在算力网络中进行计算任务但是自身可用算力不足的节点,目标算力需求节点为当前发送算力任务的算力需求节点,该算力网络可以由预设区域内一个或多个算力需求节点以及一个或多个算力域组成,其中,预设区域可以是一个或多个工业园区覆盖的区域,每个算力域可以包括一个或多个算力提供节点。
步骤S2:根据目标算力需求节点与预设区域内各个算力域之间的距离以及网络跳数对各个算力域进行排序,得到排序后的算力域列表。
在本实施例中,考虑到网络结构中的网络跳数也会影响网络时延,为了找到更低时延的目标算力提供节点,在获取到目标算力需求节点的算力任务后,根据目标算力需求节点与预设区域内各个算力域之间的距离以及网络跳数对各个算力域进行排序,得到排序后的算力域列表。
可选地,根据目标算力需求节点与预设区域内各个算力域之间的距离以及网络跳数对各个算力域进行排序之前,所述方法还可以包括:
根据预存的网络拓扑图以及通信链路信息库获取所述目标算力需求节点与预设区域内各个算力域之间的距离以及网络跳数。
在本实施例中,可以预先将目标算力需求节点与预设区域内各个算力域之间的连接关系保存在网络拓扑图中,同时,计算网络拓扑图中每条通信链路的距离以及网络跳数,并将其保存至通信链路信息库中。
可选地,根据预存的网络拓扑图以及通信链路信息库获取所述目标算力需求节点与预设区域内各个算力域之间的距离以及网络跳数之前,所述方法还可以包括:
获取网络拓扑图,其中,所述网络拓扑图包含预设区域内各个算力需求节点与各个算力域之间的连接关系;以及,
获取网络拓扑图中各个所述算力需求节点与各个算力域之间所有通信链路的距离以及网络跳数,并根据所述距离以及网络跳数生成所述通信链路信息库。
在本实施例中,通信链路信息库除了包含距离以及网络跳数外,还可以存储算力网络中各个通信链路的时延和带宽,为了避免因网络拓扑发生变化或节点上下线导致的距离和网络跳数不准确的问题,可以定时或不定时更新网络拓扑与通信链路信息库,当需要获取目标算力需求节点与预设区域内各个算力域之间的距离以及网络跳数时,只需要读取网络拓扑和通信链路信息库即可。
可选地,步骤S2可以包括:
根据目标算力需求节点与预设区域内各个算力域之间的欧氏距离和网络跳数计算各个算力域到目标算力需求节点间的加权综合距离;
将各个算力域按照加权综合距离从小到大进行排序以得到排序后的算力域列表。
在本实施例中,选择为目标算力需求节点提供算力的算力域时,除了考虑目标算力需求节点和各个算力域之间的欧式距离之外,还考虑网络跳数带来的影响,以减少因为网络自身结构带来的时延。在本实施例中,排名越靠前的算力域表明时延更低,在计算加权综合距离时,除了欧氏距离和网络跳数外,还可以进一步根据通信链路信息库中的时延和带宽进行计算,比如,当存在与目标算力需求节点欧氏距离和网络跳数相同的两个算力域时,可以进一步根据通信链路信息中的时延和带宽进行排序。
具体地,加权综合距离的计算可以根据以下公式进行:
C=α×A+β×B
其中,C为算力域到目标算力需求节点间的加权综合距离,为算力域到目标算力需求节点间的欧氏距离,B为算力域到目标算力需求节点间的网络跳数,α和β为预设的权值。
在本实施例中,α和β可以根据实际的网络情况进行设定,算力域到目标算力需求节点之间的欧氏距离和网络跳数可以是算力域中的网关或路由器到算力需求节点之间的欧氏距离和网络跳数。
步骤S3:从所述排序后的算力域列表中选择第一个算力域作为当前算力域。
在本实施例中,选择欧式距离与网络跳数的加权综合距离最小的算力域,能够进一步降低数据传输的时延。
步骤S4:判断所述当前算力域中是否存在与所述算力任务相匹配的目标算力提供节点。
可选地,步骤S4之前还可以包括:
获取当前算力域中各个算力提供节点的算力资源信息,其中,算力资源信息包括中央处理器CPU的主频、图形处理器GPU的主频、总线位宽、一级缓存、内存的频率和字节常数中的至少一种;
根据算力资源信息计算并存储各个算力提供节点的算力值以及算力类型。
在本实施例中,可以将算力资源信息存储在通信链路信息库中,在对算力提供节点与算力任务进行匹配时可以通过读取通信链路信息库来获得算力提供节点的算力值与算力类型。
具体地,步骤S4包括:
获取当前算力域中各个算力提供节点的算力值与算力类型;
根据算力值与算力类型获取当前算力域中所有与所述算力任务对应的算力类型相同,且算力值满足所述算力任务的算力提供节点,构成算力提供节点列表;
若算力提供节点列表不为空,则获取算力提供节点列表中各个算力提供节点的实时负载;
从算力提供节点列表中选择算力值减去所述实时负载后仍然满足算力任务的第一个算力提供节点作为与算力任务相匹配的目标算力提供节点。
在本实施例中,算力提供节点的实时负载会占用算力值,只有算力提供节点的算力值减去实时负载后任然满足算力任务,才能够作为目标算力提供节点。
步骤S5:若存在,则将所述算力任务发送到所述目标算力提供节点进行计算,否则,从所述排序后的算力域列表中选择下一个算力域作为当前算力域,并返回执行步骤S4。
在本实施例中,若算力域列表排在第一位的算力域中没有满足算力任务的算力提供节点,则在排序在下一位的算力域中获取能够满足算力任务的算力提供节点,依次检索算力域列表中的所有算力域,直到成功获取能够满足算力任务的算力提供节点以作为目标算力提供节点。
本发明实施例提供的算力资源调度方法,在获取到目标算力需求节点的算力任务后,首先根据目标算力需求节点与预设区域内各个算力域之间的距离以及网络跳数对各个算力域进行排序,得到排序后的算力域列表,然后从所述排序后的算力域列表中选择第一个算力域作为当前算力域,并判断当前算力域中是否存在与所述算力任务相匹配的目标算力提供节点,若存在,则将所述算力任务发送到所述目标算力提供节点进行计算,否则,从所述排序后的算力域列表中选择下一个算力域作为当前算力域,并返回执行上述的判断步骤,在选择目标算力提供节点时,综合考虑了网络跳数和距离带来的时延影响,相较于现有仅仅考虑了距离的算力资源调度方法,能够做到算力资源调度的最优化,从而解决了现有基于单一维度的算力资源调度方法,仅考虑地理距离带来的时延而忽略了网络结构及其可能的变化带来的时延的问题。
实施例2:
如图2所示,本实施例提供一种算力资源调度装置,用于执行上述算力资源调度方法,包括:
获取模块11,用于获取目标算力需求节点的算力任务;
排序模块12,与所述获取模块11连接,用于根据目标算力需求节点与预设区域内各个算力域之间的距离以及网络跳数对各个算力域进行排序,得到排序后的算力域列表,其中,每个所述算力域包括一个或多个算力提供节点;
选择模块13,与所述排序模块12连接,用于从所述排序后的算力域列表中选择第一个算力域作为当前算力域;
判断模块14,与所述选择模块13连接,用于判断所述当前算力域中是否存在与所述算力任务相匹配的目标算力提供节点;
计算模块15,与所述判断模块14连接,用于当判断模块14判断为是时,将所述算力任务发送到所述目标算力提供节点进行计算,否则,从所述排序后的算力域列表中选择下一个算力域作为当前算力域,并返回判断模块14。
优选地,所述装置还包括:
距离模块,用于根据预存的网络拓扑图以及通信链路信息库获取所述目标算力需求节点与预设区域内各个算力域之间的距离以及网络跳数。
优选地,所述装置还包括:
生成模块,用于获取所述网络拓扑图,其中,所述网络拓扑图包含预设区域内各个算力需求节点与各个算力域之间的连接关系;以及,
获取所述网络拓扑图中各个所述算力需求节点与各个算力域之间所有通信链路的距离以及网络跳数,并根据所述距离以及网络跳数生成所述通信链路信息库。
优选地,所述排序模块12具体包括:
计算单元,用于根据目标算力需求节点与预设区域内各个算力域之间的欧氏距离和网络跳数计算各个算力域到目标算力需求节点间的加权综合距离;
排序单元,用于将各个算力域按照加权综合距离从小到大进行排序以得到排序后的算力域列表。
优选地,所述计算单元具体根据以下公式计算各个算力域到目标算力需求节点间的加权综合距离:
C=α×A+β×B
其中,C为算力域到目标算力需求节点间的加权综合距离,为算力域到目标算力需求节点间的欧氏距离,B为算力域到目标算力需求节点间的网络跳数,α和β为预设的权值。
优选地,所述装置还包括:
算力模块,用于获取所述当前算力域中各个算力提供节点的算力值与算力类型;
构建模块,用于根据所述算力值与算力类型获取所述当前算力域中所有与所述算力任务对应的算力类型相同,且算力值满足所述算力任务的算力提供节点,构成算力提供节点列表;
负载模块,用于若所述算力提供节点列表不为空,则获取所述算力提供节点列表中各个算力提供节点的实时负载;
处理模块,用于从所述算力提供节点列表中选择算力值减去所述实时负载后仍然满足所述算力任务的第一个算力提供节点作为与所述算力任务相匹配的目标算力提供节点。
优选地,所述装置还包括:
资源模块,用于获取所述当前算力域中各个算力提供节点的算力资源信息,其中,所述算力资源信息包括中央处理器CPU的主频、图形处理器GPU的主频、总线位宽、一级缓存、内存的频率和字节常数中的至少一种;
存储模块,用于根据所述算力资源信息计算并存储各个算力提供节点的算力值以及算力类型。
优选地,所述装置还包括:
更新模块,用于定时或不定时更新所述网络拓扑与通信链路信息库。
实施例3:
如图3所示,本实施例提供一种算力资源调度装置,用于执行上述算力资源调度方法,包括存储器41和处理器42,存储器41中存储有计算机程序,处理器42被设置为运行所述计算机程序以执行实施例1中的算力资源调度方法。
其中,存储器41与处理器42连接,存储器41可采用闪存或只读存储器或其他存储器,处理器42可采用中央处理器或单片机。
实施例4:
本实施例提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述实施例1中的算力资源调度方法。
该计算机可读存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、计算机程序模块或其他数据)的任何方法或技术中实施的易失性或非易失性、可移除或不可移除的介质。计算机可读存储介质包括但不限于RAM(Random Access Memory,随机存取存储器),ROM(Read-Only Memory,只读存储器),EEPROM(Electrically ErasableProgrammable read only memory,带电可擦可编程只读存储器)、闪存或其他存储器技术、CD-ROM(Compact Disc Read-Only Memory,光盘只读存储器),数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。
实施例2至实施例4提供的算力资源调度装置及计算机可读存储介质,在获取到目标算力需求节点的算力任务后,首先根据目标算力需求节点与预设区域内各个算力域之间的距离以及网络跳数对各个算力域进行排序,得到排序后的算力域列表,然后从所述排序后的算力域列表中选择第一个算力域作为当前算力域,并判断当前算力域中是否存在与所述算力任务相匹配的目标算力提供节点,若存在,则将所述算力任务发送到所述目标算力提供节点进行计算,否则,从所述排序后的算力域列表中选择下一个算力域作为当前算力域,并返回执行上述的判断步骤,在选择目标算力提供节点时,综合考虑了网络跳数和距离带来的时延影响,相较于现有仅仅考虑了距离的算力资源调度方法,能够做到算力资源调度的最优化,从而解决了现有基于单一维度的算力资源调度方法,仅考虑地理距离带来的时延而忽略了网络结构及其可能的变化带来的时延的问题。
可以理解的是,以上实施方式仅仅是为了说明本发明的原理而采用的示例性实施方式,然而本发明并不局限于此。对于本领域内的普通技术人员而言,在不脱离本发明的精神和实质的情况下,可以做出各种变型和改进,这些变型和改进也视为本发明的保护范围。

Claims (11)

1.一种算力资源调度方法,其特征在于,包括:
S1,获取目标算力需求节点的算力任务;
S2,根据目标算力需求节点与预设区域内各个算力域之间的距离以及网络跳数对各个算力域进行排序,得到排序后的算力域列表,其中,每个所述算力域包括一个或多个算力提供节点;
S3,从所述排序后的算力域列表中选择第一个算力域作为当前算力域;
S4,判断所述当前算力域中是否存在与所述算力任务相匹配的目标算力提供节点;
S5,若存在,则将所述算力任务发送到所述目标算力提供节点进行计算,否则,从所述排序后的算力域列表中选择下一个算力域作为当前算力域,并返回执行步骤S4。
2.根据权利要求1所述的算力资源调度方法,其特征在于,所述根据目标算力需求节点与预设区域内各个算力域之间的距离以及网络跳数对各个算力域进行排序之前,所述方法还包括:
根据预存的网络拓扑图以及通信链路信息库获取所述目标算力需求节点与预设区域内各个算力域之间的距离以及网络跳数。
3.根据权利要求2所述的算力资源调度方法,其特征在于,所述根据预存的网络拓扑图以及通信链路信息库获取所述目标算力需求节点与预设区域内各个算力域之间的距离以及网络跳数之前,所述方法还包括:
获取所述网络拓扑图,其中,所述网络拓扑图包含预设区域内各个算力需求节点与各个算力域之间的连接关系;以及,
获取所述网络拓扑图中各个所述算力需求节点与各个算力域之间所有通信链路的距离以及网络跳数,并根据所述距离以及网络跳数生成所述通信链路信息库。
4.根据权利要求1所述的算力资源调度方法,其特征在于,所述根据目标算力需求节点与预设区域内各个算力域之间的距离以及网络跳数对各个算力域进行排序,得到排序后的算力域列表,具体包括:
根据目标算力需求节点与预设区域内各个算力域之间的欧氏距离和网络跳数计算各个算力域到目标算力需求节点间的加权综合距离;
将各个算力域按照加权综合距离从小到大进行排序以得到排序后的算力域列表。
5.根据权利要求4所述的算力资源调度方法,其特征在于,所述根据目标算力需求节点与预设区域内各个算力域之间的欧氏距离和网络跳数计算各个算力域到目标算力需求节点间的加权综合距离,具体根据以下公式进行计算:
C=α×A+β×B
其中,C为算力域到目标算力需求节点间的加权综合距离,A为算力域到目标算力需求节点间的欧氏距离,B为算力域到目标算力需求节点间的网络跳数,α和β为预设的权值。
6.根据权利要求1所述的算力资源调度方法,其特征在于,所述判断所述当前算力域中是否存在与所述算力任务相匹配的目标算力提供节点之前,所述方法还包括:
获取所述当前算力域中各个算力提供节点的算力值与算力类型;
根据所述算力值与算力类型获取所述当前算力域中所有与所述算力任务对应的算力类型相同,且算力值满足所述算力任务的算力提供节点,构成算力提供节点列表;
若所述算力提供节点列表不为空,则获取所述算力提供节点列表中各个算力提供节点的实时负载;
从所述算力提供节点列表中选择算力值减去所述实时负载后仍然满足所述算力任务的第一个算力提供节点作为与所述算力任务相匹配的目标算力提供节点。
7.根据权利要求6所述的算力资源调度方法,其特征在于,所述获取所述当前算力域中各个算力提供节点的算力值与算力类型之前,所述方法还包括:
获取所述当前算力域中各个算力提供节点的算力资源信息,其中,所述算力资源信息包括中央处理器CPU的主频、图形处理器GPU的主频、总线位宽、一级缓存、内存的频率和字节常数中的至少一种;
根据所述算力资源信息计算并存储各个算力提供节点的算力值以及算力类型。
8.根据权利要求2所述的算力资源调度方法,其特征在于,还包括:
定时或不定时更新所述网络拓扑与通信链路信息库。
9.一种算力资源调度装置,其特征在于,包括:
获取模块,用于获取目标算力需求节点的算力任务;
排序模块,与所述获取模块连接,用于根据目标算力需求节点与预设区域内各个算力域之间的距离以及网络跳数对各个算力域进行排序,得到排序后的算力域列表,其中,每个所述算力域包括一个或多个算力提供节点;
选择模块,与所述排序模块连接,用于从所述排序后的算力域列表中选择第一个算力域作为当前算力域;
判断模块,与所述选择模块连接,用于判断所述当前算力域中是否存在与所述算力任务相匹配的目标算力提供节点;
计算模块,与所述判断模块连接,用于当判断模块判断为是时,将所述算力任务发送到所述目标算力提供节点进行计算,否则,从所述排序后的算力域列表中选择下一个算力域作为当前算力域,并返回判断模块。
10.一种算力资源调度装置,其特征在于,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以实现如权利要求1-8中任一项所述的算力资源调度方法。
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1-8中任一项所述的算力资源调度方法。
CN202210567933.3A 2022-05-24 2022-05-24 一种算力资源调度方法、装置及计算机可读存储介质 Pending CN114968573A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210567933.3A CN114968573A (zh) 2022-05-24 2022-05-24 一种算力资源调度方法、装置及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210567933.3A CN114968573A (zh) 2022-05-24 2022-05-24 一种算力资源调度方法、装置及计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN114968573A true CN114968573A (zh) 2022-08-30

Family

ID=82985268

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210567933.3A Pending CN114968573A (zh) 2022-05-24 2022-05-24 一种算力资源调度方法、装置及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN114968573A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115622932A (zh) * 2022-08-31 2023-01-17 北京邮电大学 算力调度方法、装置、电子设备及存储介质
CN115695428A (zh) * 2022-11-03 2023-02-03 广州聚百洲信息科技有限公司 一种基于云计算的智慧城市管理及监控系统
CN116015936A (zh) * 2022-12-30 2023-04-25 中国联合网络通信集团有限公司 一种安全能力编排方法、装置及计算机可读存储介质
CN116886404A (zh) * 2023-08-04 2023-10-13 中国电子信息产业集团有限公司第六研究所 一种卫星互联网密钥管理系统及方法
CN116909758A (zh) * 2023-09-13 2023-10-20 中移(苏州)软件技术有限公司 算力任务的处理方法、装置及电子设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113938816A (zh) * 2021-09-10 2022-01-14 中国联合网络通信集团有限公司 算力资源调度方法及其装置
CN114255432A (zh) * 2021-12-24 2022-03-29 中电信数智科技有限公司 视频流处理方法、装置、电子设备、存储介质及系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113938816A (zh) * 2021-09-10 2022-01-14 中国联合网络通信集团有限公司 算力资源调度方法及其装置
CN114255432A (zh) * 2021-12-24 2022-03-29 中电信数智科技有限公司 视频流处理方法、装置、电子设备、存储介质及系统

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115622932A (zh) * 2022-08-31 2023-01-17 北京邮电大学 算力调度方法、装置、电子设备及存储介质
CN115695428A (zh) * 2022-11-03 2023-02-03 广州聚百洲信息科技有限公司 一种基于云计算的智慧城市管理及监控系统
CN116015936A (zh) * 2022-12-30 2023-04-25 中国联合网络通信集团有限公司 一种安全能力编排方法、装置及计算机可读存储介质
CN116015936B (zh) * 2022-12-30 2024-05-03 中国联合网络通信集团有限公司 一种安全能力编排方法、装置及计算机可读存储介质
CN116886404A (zh) * 2023-08-04 2023-10-13 中国电子信息产业集团有限公司第六研究所 一种卫星互联网密钥管理系统及方法
CN116909758A (zh) * 2023-09-13 2023-10-20 中移(苏州)软件技术有限公司 算力任务的处理方法、装置及电子设备
CN116909758B (zh) * 2023-09-13 2024-01-26 中移(苏州)软件技术有限公司 算力任务的处理方法、装置及电子设备

Similar Documents

Publication Publication Date Title
CN114968573A (zh) 一种算力资源调度方法、装置及计算机可读存储介质
US7072304B2 (en) Network path selection based on bandwidth
CN109451540B (zh) 一种网络切片的资源分配方法和设备
US20050076137A1 (en) Utilizing proximity information in an overlay network
US20150327135A1 (en) Apparatus and method for dynamic hybrid routing in sdn networks to avoid congestion and balance loads under changing traffic load
CN110601973A (zh) 一种路由规划方法、系统、服务器及存储介质
CN110519090B (zh) 一种fpga云平台的加速卡分配方法、系统及相关组件
CN114650249A (zh) 算法模型及路径的确定方法、电子设备、sdn控制器和介质
CN110601978A (zh) 流量分发控制方法和装置
CN108347377B (zh) 数据转发方法及装置
CN115277598A (zh) 一种算力资源调度方法、装置及计算机可读存储介质
CN112165505B (zh) 去中心化的数据处理方法、电子装置和存储介质
CN113191432A (zh) 基于离群因子的虚拟机集群的异常检测方法、设备及介质
CN111259007B (zh) 电动车信息监控方法、装置、服务器及电动车管理系统
CN109245948B (zh) 安全感知的虚拟网络映射方法及其装置
CN109474696B (zh) 一种网络服务方法、装置、电子设备及可读存储介质
US20120198060A1 (en) network delay estimation apparatus and a network delay estimation method
CN109256774B (zh) 一种基于电压等级的电网子图划分方法及装置
US11329717B2 (en) Packet forwarding incorporating partial sorting of path costs or utilities
CN109117275B (zh) 基于数据分片的对账方法、装置、计算机设备及存储介质
CN114995900B (zh) 多个微服务模块的部署方法、装置及计算机可读存储介质
CN116436978B (zh) 面向云计算的内存分配方法、内存获取方法、装置和设备
CN114928568B (zh) 一种路由路径选择方法、装置及计算机可读存储介质
CN112749004B (zh) 基于节点访问热度的数据存储方法及装置
CN110213314B (zh) 确定存储节点的方法、装置、服务器

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination