CN116467071A - 算力网络中算力感知的方法、装置、存储介质及电子设备 - Google Patents

算力网络中算力感知的方法、装置、存储介质及电子设备 Download PDF

Info

Publication number
CN116467071A
CN116467071A CN202310287820.2A CN202310287820A CN116467071A CN 116467071 A CN116467071 A CN 116467071A CN 202310287820 A CN202310287820 A CN 202310287820A CN 116467071 A CN116467071 A CN 116467071A
Authority
CN
China
Prior art keywords
computing
force
resource
computing power
power
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310287820.2A
Other languages
English (en)
Other versions
CN116467071B (zh
Inventor
黄剑锋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ultrapower Software Co ltd
Original Assignee
Ultrapower Software Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ultrapower Software Co ltd filed Critical Ultrapower Software Co ltd
Priority to CN202310287820.2A priority Critical patent/CN116467071B/zh
Priority claimed from CN202310287820.2A external-priority patent/CN116467071B/zh
Publication of CN116467071A publication Critical patent/CN116467071A/zh
Application granted granted Critical
Publication of CN116467071B publication Critical patent/CN116467071B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Power Sources (AREA)

Abstract

本申请的一些实施例提供了一种算力网络中算力感知的方法、装置、存储介质及电子设备,该方法包括:通过对算力网络中的算力节点进行监控,更新所述时变算力感知数据模板中的算力资源时变数据,其中,所述算力资源时变数据表征所述算力节点的算力状态;基于所述算力资源时变数据,更新所述一级算力感知数据模板中的一级算力感知属性数据,其中,所述一级算力感知属性数据包括所述算力节点对应的资源属性值;基于所述一级算力感知属性数据,在所述全局算力感知数据模板中生成所述算力节点的算力标签,其中,所述算力标签表征所述算力节点是否空闲。本申请的一些实施例可以实现对算力网络中算力资源节点的分级分布式实时管理,实现算力高效感知。

Description

算力网络中算力感知的方法、装置、存储介质及电子设备
技术领域
本申请涉及算力网络技术领域,具体而言,涉及一种算力网络中算力感知的方法、装置、存储介质及电子设备。
背景技术
随着社会数智化转型不断深入,算力规模出现爆发式的增长、算力供给方式向集群生态转变。为促进算力和网络的深度融合发展,业内提出算力网络一体化信息基础设施和信息服务体系。
算力网络中的算力网关业务节点,将算力业务以网络服务形式开放的一个边界门户,屏蔽算力接入和承载网的接入差异,对所有算力资源的信息状态进行通告和调度,并基于算力资源标签进行算网路由转发。为了实现对算力网络中算力资源的汇总和调度,通常针对不同的算力资源的属性采用不同的协议编程的方式将数据转发给算网大脑进行分析。但是,由于协议编程不可无限扩展且需要占用较多的字节,容易导致算力数据传输稳定性较差且无法实现实时感知。
因此,如何提供一种稳定且实时的算力网络中算力感知的方法的技术方案成为亟需解决的技术问题。
发明内容
本申请的一些实施例的目的在于提供一种算力网络中算力感知的方法、装置、存储介质及电子设备,通过本申请的实施例的技术方案通过对算力网络中的算力节点采用分级分布式实时处理,可以实现网络中的算力实时感知,效率较高。
第一方面,本申请的一些实施例提供了一种算力网络中算力感知的方法,应用于分级算力感知信息系统,所述分级算力感知信息系统包括:时变算力感知数据模板、一级算力感知数据模板和全局算力感知数据模板,所述方法包括:通过对算力网络中的算力节点进行监控,更新所述时变算力感知数据模板中的算力资源时变数据,其中,所述算力资源时变数据表征所述算力节点的算力状态;基于所述算力资源时变数据,更新所述一级算力感知数据模板中的一级算力感知属性数据,其中,所述一级算力感知属性数据包括所述算力节点对应的资源属性值;基于所述一级算力感知属性数据,在所述全局算力感知数据模板中生成所述算力节点的算力标签,其中,所述算力标签表征所述算力节点是否空闲。
本申请的一些实施例通过对算力节点进行监控更新算力资源时变数据,然后通过算力资源时变数据可以更新一级算力感知属性数据,最后通过一级算力感知属性数据生成算力节点的算力标签。本申请实施例通过分级算力感知信息系统中的不同模板可以实现对算力网络中的算力节点采用分级分布式监控和处理,实现网络中的算力实时感知,效率较高。
在一些实施例,所述通过对算力网络中的算力节点进行监控,更新所述时变算力感知数据模板中的算力资源时变数据,包括:按照预设时间周期对所述算力节点的所述算力状态进行检测,在确认所述算力状态发生变化时,更新所述算力状态,其中,所述算力状态包括:正常、故障、告警或失效。
本申请的一些实施例通过在预设时间周期内对算力节点是算力状态进行检测,可以实现对算力节点的算力状态的及时更新。
在一些实施例,所述基于所述算力资源时变数据,更新所述一级算力感知数据模板中的一级算力感知属性数据,包括:在确定所述算力节点的算力状态为正常的情况下,按照预设时间周期获取所述算力节点的资源变化率,其中,所述资源变化率包括:资源占用变化率和/或资源利用变化率;利用所述资源变化率,对所述算力节点对应的资源属性值进行更新,其中,所述资源属性值包括:资源占用属性值和/或资源利用属性值。
本申请的一些实施例通过对算力状态为正常的算力节点进行资源变化率的监控,更新对应的资源属性值,可以实现对算力节点的数据汇聚和及时更新。
在一些实施例,所述利用所述资源变化率,对所述一级算力感知属性数据进行更新,包括:确认所述资源占用变化率超过第一阈值时,更新所述资源占用属性值和/或所述资源利用属性值;或者,确认所述资源利用变化率超过第二阈值时,更新所述资源利用属性值和/或所述资源占用属性值。
本申请的一些实施例通过将资源占用变化率和资源利用率分别与对应的阈值进行对比,确认更新对应的资源属性值,可以实现对算力节点的资源的实时感知,效率较高。
在一些实施例,所述基于所述一级算力感知属性数据,在所述全局算力感知数据模板中生成所述算力节点的算力标签,包括:按照所述预设时间周期,基于所述资源属性值与预设资源阈值的对比结果,生成所述算力标签。
本申请的一些实施例通过将资源属性值与预设资源阈值进行对比,确认算力标签,可以实现对算力节点是否处于空闲状态的准确判定,为后续算力节点调用提供准确的数据支持。
在一些实施例,所述基于所述资源属性值与预设资源阈值的对比结果,生成所述算力标签,包括:确认所述资源占用变化率超过第三阈值且所述资源占用属性值未超过占用阈值时,或者,确认所述资源利用变化率超过第四阈值且所述资源利用属性值未超过利用阈值时,则生成的所述算力标签为第一标签,其中,所述第一标签表征所述算力节点空闲;确认所述资源占用变化率超过第三阈值且所述资源占用属性超过占用阈值时,或者,确认所述资源利用变化率超过第四阈值且所述资源利用属性值超过利用阈值时,则生成的所述算力标签为第二标签,其中,所述第二标签表征所述算力节点非空闲。
本申请的一些实施例通过将资源占用变化率或资源利用变化率与对应的阈值进行对比,并且还需要将资源占用属性值或资源利用属性值与对应的预设阈值进行对比,生成对应的算力节点对应的空闲或非空闲的算力标签,可以实现对算力节点的可用状态的准确判定,为后续算力节点调用提供准确的数据支持。
在一些实施例,所述方法还包括:按照预设时间周期,展示所述算力资源时变数据、所述一级算力感知属性数据以及所述算力标签。
本申请的一些实施例通过预设时间周期展示算力资源时变数据、一级算力感知属性数据以及算力标签,可以实现算力资源的可视化管理。
在一些实施例,所述方法还包括:接收终端设备发送的算力请求;基于所述算力标签确定为所述算力请求提供服务的算力节点。
本申请的一些实施例通过算力标签可以对算力请求进行确定可以提供服务的算力节点,既高效又精准。
在一些实施例,在所述通过对算力网络中的算力节点进行监控,更新所述时变算力感知数据模板中的算力资源时变数据之前,所述方法还包括:响应于对象的操作,生成时变算力感知数据模板、一级算力感知数据模板和全局算力感知数据模板,以便于存储所述算力资源时变数据、所述一级算力感知属性数据以及所述算力标签。
本申请的一些实施例通过设计时变算力感知数据模板、一级算力感知数据模板和全局算力感知数据模板,可以实现算力资源数据的分级分布式存储,存储效率高且清晰。
第二方面,本申请的一些实施例提供了一种算力网络中算力感知的装置,包括:时变数据监控模块,用于通过对算力网络中的算力节点进行监控,更新时变算力感知数据模板中的算力资源时变数据,其中,所述算力资源时变数据表征所述算力节点的算力状态;一级算力更新模块,用于基于所述算力资源时变数据,更新一级算力感知数据模板中的一级算力感知属性数据,其中,所述一级算力感知属性数据包括所述算力节点对应的资源属性值;全局算力更新模块,用于基于所述一级算力感知属性数据,在全局算力感知数据模板中生成所述算力节点的算力标签,其中,所述算力标签表征所述算力节点是否空闲。
第三方面,本申请的一些实施例提供一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时可实现如第一方面任一实施例所述的方法。
第四方面,本申请的一些实施例提供一种电子设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其中,所述处理器执行所述程序时可实现如第一方面任一实施例所述的方法。
第五方面,本申请的一些实施例提供一种计算机程序产品,所述的计算机程序产品包括计算机程序,其中,所述的计算机程序被处理器执行时可实现如第一方面任一实施例所述的方法。
附图说明
为了更清楚地说明本申请的一些实施例的技术方案,下面将对本申请的一些实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请的一些实施例提供的一种算力网络中算力感知的系统图;
图2为本申请的一些实施例提供的算力网络中算力感知的方法流程图;
图3为本申请的一些实施例提供的算力网络中算力感知的架构图;
图4为本申请的一些实施例提供的算力网络中算力感知的装置组成框图;
图5为本申请的一些实施例提供的一种电子设备示意图。
具体实施方式
下面将结合本申请的一些实施例中的附图,对本申请的一些实施例中的技术方案进行描述。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本申请的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
相关技术中,算力网络是以算为中心、网为根基,网、云、数、智、安、边、端、链(ABCDNETS)等深度融合,提供一体化服务的新型信息基础设施。算力网络的目标是实现“算力泛在、算网共生、智能编排、一体服务”,逐步推动算力成为与水电一样,可“一点接入、即取即用”的社会级服务,达成“网络无所不达、算力无所不在、智能无所不及”的愿景。当前整个算力网络中的算力可以由不同的硬件架构组织。总得来说包括CPU、GPU、FPGA和AISC等四类。CPU主要包括X86和ARM,虽然ARM设计之初作为面向低功耗等场景推出的定制化的ASIC芯片,但是随着ARM在服务器和嵌入式终端的广泛应用,目前也是作为通用芯片来应用和部署。GPU主要是矢量的图形化数据能够实现快速处理的专有架构;FPGA作为可编程逻辑门电路在硬件加速等方面具有优势。而面向特定场景的处理需求需要定制专用芯片来进行处理,比如当前针对深度学习设计的各种TPU、NPU应该属于领域的定制的ASIC。
算网大脑作为算力网络的编排管理核心,通过人工智能技术实现算网智能感知、智能编排调度和算网自智,促进算网一体和算网共生发展。算网的智能感知需要对各种异构算力进行统一标识和算力度量建模。并且需要对各种异构算力进行实时高效的信息数据采集和算力状态感知。
传统的对算力状态感知的方法中,算力网关提供了将算力信息转换为网络服务向外开放的手段。而对于算力使用方而言,算力网关提供了将网络中的算力进行汇总并进行动态调度的可能。算力网关间的通道以overlay的形式架设在底层承载网络上,允许通过SRv6-bsid(Segment Routing IPv6,路由转发)等服务化网络能力对算力和网络同时进行保障。但是,由于算力网络中的算力复杂度较高,SRv6 SID可编程空间不可无限扩展,自定义算力度量机制不能无限由此传播,因此无法实现所有的算力数据的有效转发。而且IP路由可在边界进行汇聚,根据地址前缀长度进行路由通告,然而多维算力路由无法应用此机制。算力资源是有状态的,如果使用算力路由通告资源,则路由会随使用状态不断变化,影响网络稳定性。
在另一种现有技术的方案中算力服务网关和算力管控平台的各种算力状态信息数据都需要通过网络向算力网络大脑(简称为:算网大脑)汇聚传输,算网大脑需要承受巨大的网络带宽消耗。由单一的算网大脑节点处理所有算力节点的状态通告信息,其需要承担巨大的计算和处理能力消耗。
由上述相关技术可知,现有技术中对算力感知的方法中不但会产生网络稳定性问题,还无法确保算力状态信息处理的实时性,进而会导致算网大脑在算力选点和算力路由上无法保证最优方案,影响算力网络的稳定性和性能。
鉴于此,本申请的一些实施例提供了一种算力网络中算力感知的方法,该方法通过对算力网络中的算力节点进行监控,更新时变算力感知数据模板中的算力资源时变数据,然后基于算力资源时变时间更新一级算力感知属性数据,最后通过一级算力感知数据生成对应的算力节点的算力标签。本申请的实施例通过分为三级分布式实时处理可以获取算力节点的相关状态和实时数据,在实现算力资源数据汇总的基础上,进一步可以实现对算力资源节点的快速动态调用,可以实现网络中的算力实时感知,效率较高。
下面结合附图1示例性阐述本申请的一些实施例提供的算力网络中算力感知的系统的整体组成结构。
如图1所示,本申请的一些实施例提供了一种算力网络中算力感知的系统,该系统包括:终端100和第一算力节点1、第二算力节点2和第三算力节点3...第n算力节点n(n为正整数)。其中,第一算力节点1、第二算力节点2和第三算力节点3...第n算力节点n共同构成算力网络,且每个算力节点均有算力节点唯一标识。其中,算力节点唯一标识是采用面向对象统一标识建模技术为每个算力节点生成的,以便于在后续对算力请求进行分配时,可以基于算力节点的算力标签确定可为算力请求提供服务的算力节点唯一标识,进而可以通过可为算力请求提供服务的算力节点唯一标识快速查找出对应的算力节点。
在本申请的一些实施例中,终端100可以对第一算力节点1、第二算力节点2和第三算力节点3...第n算力节点n分别进行监控,更新每个算力节点的算力状态,得到算力资源时变数据。之后终端100还可以实时监控第一算力节点1、第二算力节点2和第三算力节点3...第n算力节点n的资源变化率,进而转换成每个算力节点的资源属性值,得到一级算力感知属性数据。最后,终端100通过一级算力感知属性数据可以为每个算力节点生成对应的算力标签,以记录算力节点是否处于空闲状态,是否可以被调用。在后续算力节点调度时,终端100还可以基于算力标签确定可以被调度的算力节点,提高效率。其中,资源变化率是指在不同的时间下,算力节点的算力资源变化情况。例如,算力资源以CPU占用情况来表征,在t1时刻下CPU占用率为a,在t2时刻下CPU占用率为b,CPU占用变化率(作为资源变化率的一个具体示例)为|a-b|/a*100%。
在本申请的一些实施例中,终端100可以是可视化设备,也可以是其他类型的设备,本申请实施例在此不作具体限定。需要说明的是,随着算力网络的不断发展,算力节点的数量具有较高的不确定性,因此算力节点n的取值可以根据实际情况进行设定,本申请实施例在此不作具体限定。
在执行下述方法流程之前,在本申请的一些实施例中,采用云原生内存数据库技术架构底座,结合面向对象统一标识建模技术,在综合可拓展维度对每个算力节点进行唯一标识(也就是一个算力节点对应一个唯一标识,通过唯一标识可以查找到对应的算力节点),构建算力网络。该算力网络中包含每个算力节点唯一标识,以及每个算力节点唯一标识对应的每个算力节点的多维度算力属性信息(例如,位置属性、资源占用率、资源利用率等等)。并且可以根据算力节点的实际情况还进行维度扩展建模,以此实现对算力节点的统一管理。下述实施例中基于构建好的算力网络中的算力网络中的算力节点进行示例性阐述算力网络中算力感知的实现过程。应理解,在本申请的另一些实施例中,除了云原生内存数据库技术架构之外,还可以采用与其功能相似的其他网络架构,本申请实施例并不局限于此。
下面结合附图2示例性阐述本申请的一些实施例提供的由终端100执行的算力网络中算力感知的实现过程。
请参见附图2,图2为本申请的一些实施例提供的一种算力网络中算力感知的方法流程图,算力网络中算力感知的方法应用于分级算力感知信息系统,其中,分级算力感知信息系统包括:时变算力感知数据模板、一级算力感知数据模板和全局算力感知数据模板,该方法包括:
在本申请的一些实施例中,在执行S210之前,算力网络中算力感知的方法还可以包括:响应于对象的操作,生成时变算力感知数据模板、一级算力感知数据模板和全局算力感知数据模板,以便于存储算力资源时变数据、一级算力感知属性数据以及算力标签。
例如,在本申请的一些实施例中,终端100可以在算力资源节点(简称算力节点)部署算力感知数据库集群节点,并基于对象的操作,设计并生成一套时变算力感知数据模板。在算力资源节点还可以部署算力感知数据一级汇聚数据库集群节点,并基于对象的操作,设计并生成一套一级算力感知数据模板,再设计并生成一套全局算力感知数据模板(也可以称为二级全局算力感知数据模板)。其中,算力感知数据库集群节点可以对算力节点的算力状态进行监控,算力感知数据一级汇聚数据库集群节点可以对算力节点的可用资源进行监控,以便于更新一级算力感知数据模板和全局算力感知数据模板。需要说明的是,对象可以是具有设计相应的模板(例如,时变算力感知数据模板、一级算力感知数据模板和全局算力感知数据模板)权限的操作人员、管理人员或者业务人员等等。
S210,通过对算力网络中的算力节点进行监控,更新时变算力感知数据模板中的算力资源时变数据,其中,算力资源时变数据表征算力节点的算力状态。
例如,在本申请的一些实施例中,算力感知数据库集群节点对所有的算力节点进行监测和分析,得到算力节点的算力状态并更新在时变算力感知数据模板中。
在本申请的一些实施例中,S210可以包括:按照预设时间周期对算力节点的算力状态进行检测,在确认算力状态发生变化时,更新其算力状态,其中,算力节点的算力状态包括:正常、故障、告警或失效。
例如,在本申请的一些实施例中,时变算力感知数据模板中可以包括时变数据列表、时变数据分析周期(作为预设时间周期的一个具体示例)、时变数据更新触发门限、时变属性数据(作为算力资源时变数据的一个具体示例)和时变数据更新方法等。其中,时变属性数据包括:算力节点的故障、告警、失效等时变信息。通过对算力资源节点的全栈数据的实时监测和分析,实时更新算力资源节点的时变属性数据。时变数据更新触发门限用于对算力节点的算力状态进行监测,例如,当算力节点由正常变为故障时,会触发时变数据更新触发门限,以使得算力节点的时变属性数据由“正常”修改为“故障”。时变数据分析周期可以是1s,也可以是5s,具体的可以根据实际情况进行设定,本申请在此不作具体限定。时变数据更新方法可以根据实际情况进行设定,时变数据更新方法可以是状态匹配表。例如,算力节点为正常时,通过状态匹配表可知此时识别属性数据可以为属性值1。应理解,时变算力感知数据模板中的信息可以根据实际情况进行适应性设定,本申请实施例并不局限于此。
S220,基于算力资源时变数据,更新一级算力感知数据模板中的一级算力感知属性数据,其中,一级算力感知属性数据包括算力节点资源对应的资源属性值。
例如,在本申请的一些实施例中,算力感知数据一级汇聚数据库集群节点通过时变属性数据可以对相应的一级算力感知数据模板中的算力节点进行一级算力感知属性数据的汇聚和更新。
为了实现对算力节点的算力有效感知,在本申请的一些实施例中,S220可以包括:在确定算力节点的算力状态为正常的情况下,按照预设时间周期获取所述算力节点的资源变化率,其中,所述资源变化率包括:资源占用变化率和/或资源利用变化率;利用所述资源变化率,对所述算力节点对应的资源属性值进行更新,其中,所述资源属性值包括:资源占用属性值和/或资源利用属性值。
例如,在本申请的一些实施例中,一级算力感知数据模板包括包含算力节点对应的算力资源标识的一级汇聚属性数据。一级汇聚属性数据可以包括:算力节点的资源可用状态(作为资源占用属性值的一个具体示例)、资源利用率(作为资源利用属性值的一个具体示例)等中间汇聚属性数据信息。其中,资源可用状态和资源利用率是基于资源变化率的情况进行更新的。
在本申请的一些实施例中,S220可以包括:确认所述资源占用变化率超过第一阈值时,更新所述资源占用属性值和/或所述资源利用属性值;或者,确认所述资源利用变化率超过第二阈值时,更新所述资源利用属性值和/或所述资源占用属性值。
例如,在本申请的一些实施例中,可以以资源占用变化率为基准,更新资源可用状态和资源利用率。或者,还可以以资源利用变化率为基准,更新资源可用状态和资源利用率。例如,第一阈值可以为5%,也就是说当资源占用变化率在本次预设时间周期采集的资源可用状态的属性值与上一个预设时间周期记录的资源可用状态的属性值的变化量超过5%(可以是±5%)时,分别更新资源可用状态和资源利用率对应的属性值。若未超过5%,则不需要进行更新。可以理解的是,第一阈值和第二阈值的具体取值可以根据实际情况进行设定,本申请实施例在此不作具体限定。
S230,基于一级算力感知属性数据,在全局算力感知数据模板中生成算力节点的算力标签,其中,算力标签表征算力节点是否空闲。
例如,在本申请的一些实施例中,通过对一级算力感知属性数据的监控,在一级算力感知属性数据满足相应的条件时,会触发生成算力标签的方法实例,以此可以得到算力节点对应的算力标签。全局算力感知数据模板中包含算力资源标识对象的全局属性,用于算网中的算力选点和算力路由决策。该全局算力感知数据模板中算力资源统一标识建模对象存储在算网大脑的算力资源统一标识数据库集群节点中,负责全局性算力感知信息的监测和实时更新。
在本申请的一些实施例中,S230可以包括:按照预设时间周期,基于所述资源属性值与预设资源阈值的对比结果,生成算力标签。
例如,在本申请的一些实施例中,终端100可以在预设时间周期内对资源属性值和预设资源值进行分析,生成相应的算力标签。
在本申请的一些实施例中,S230可以包括:确认所述资源占用变化率超过第三阈值且所述资源占用属性值未超过占用阈值时,或者,确认所述资源利用变化率超过第四阈值且所述资源利用属性值未超过利用阈值时,则生成的所述算力标签为第一标签,其中,所述第一标签表征所述算力节点空闲。
例如,在本申请的一些实施例中,第三阈值和第四阈值均可以根据实际情况进行设定。其中生成算力标签的依据可以基于资源占用属性值与占用阈值之间的关系,或者资源利用属性值与利用阈值之间的关系。例如,第三阈值和第四阈值可以设置为±10%,占用阈值可以设置为70%,利用阈值可以设置为65%。当某个算力节点的资源占用变化率超过10%且资源占用属性值未超过70%时,此时表征算力节点的可用资源比较多,可以触发生成第一标签的方法实例。在对算力节点生成第一标签后,还可以将其添加到可调用资源集合中,以便于后续被调用。
在本申请的一些实施例中,S230可以包括:确认所述资源占用变化率超过第三阈值且所述资源占用属性超过占用阈值时,或者,确认所述资源利用变化率超过第四阈值且所述资源利用属性值超过利用阈值时,则生成的所述算力标签为第二标签,其中,所述第二标签表征所述算力节点非空闲。
例如,在本申请的一些实施例中,当某个算力节点的资源占用变化率超过10%且资源占用属性值超过70%时,此时表征算力节点的可用资源比较少,当前其业务繁忙,此时可以触发生成第二标签的方法实例。在对算力节点生成第二标签后,还可以将其添加到不可调用资源集合中,以便于后续不被调用。
在本申请的一些实施例中,算力网络中算力感知的方法还可以包括:按照预设时间周期,展示算力资源时变数据、一级算力感知属性数据以及算力标签。
例如,在本申请的一些实施例中,终端100还可以设置有可视化大屏,在预设时间周期内展示每个算力节点的算力资源时变数据、一级算力感知属性数据以及算力标签,以便于实现对算力节点的可视化监控。
需要说明的是,上述S210~S230的实施例中的预设时间周期是相同的,通过设定同一个预设时间周期可以实现对算力节点的算力情况的实时统一更新。
在本申请的一些实施例中,算力网络中算力感知的方法还包括:接收终端设备发送的算力请求;基于所述算力标签确定为所述算力请求提供服务的算力节点。
例如,在本申请的一些实施例中,终端100也可以称为算力大脑,其在接收到算力请求方的算力请求时,可以基于算力标签选择出为其服务的算力节点。在本申请的另一些实施例中,还可以基于算力标签选择出为算力请求提供服务的算力节点唯一标识,通过算力节点唯一标识快速查找到对应的算力节点。例如,终端100可以基于算力请求从可调用资源集合中选取任一算力节点为其提供算力服务,既便捷又高效。
下面结合附图3示例性阐述本申请的一些实施例提供的基于图3所示的算力网络中算力感知的架构图实现算力网络中算力感知的具体过程。
请参见附图3,图3为本申请的一些实施例提供的一种算力网络中算力感知的架构图,该算力网络中算力感知的架构图包括:算力资源节点310、算力管控平台320和算力大脑330。
下面示例性阐述各单元的功能。
在本申请的一些实施例中,算力资源管理节点310用于:通过对算力网络中的算力节点进行监控,更新时变算力感知数据模板中的算力资源时变数据,其中,所述算力资源时变数据表征所述算力节点的算力状态。算力管控平台320用于:基于算力资源时变数据,更新一级算力感知数据模板中的一级算力感知属性数据,其中,所述一级算力感知属性数据包括所述算力节点对应的资源属性值。算力大脑330用于:基于所述一级算力感知属性数据,在全局算力感知数据模板中生成所述算力节点的算力标签,其中,所述算力标签表征所述算力节点是否空闲。
例如,在本申请的一些实施例中,算力资源管理节点310可以实现对算力网络中的所有算力节点的监控。算力管控平台320可以实现对算力数据的汇聚和更新。算力大脑330负责全局性算力感知信息的监测和实时更新。
本申请的一些实施例基于云原生分布式实时内存数据库,架构基于云原生的分级算力感知信息实时更新的技术方法和装置,可以高效便捷地利用算力资源管理节点310、算力管控平台320、算力编排调度平台(也就是算网大脑330)的分级、分布式算力,实现算力感知信息的实时高效处理,避免统一集中处理海量的算力感知信息带来的算力大脑集中统一处理的计算资源瓶颈的问题。
请参考图4,图4示出了本申请的一些实施例提供的算力网络中算力感知的装置的组成框图。应理解,该算力网络中算力感知的装置与上述方法实施例对应,能够执行上述方法实施例涉及的各个步骤,该算力网络中算力感知的装置的具体功能可以参见上文中的描述,为避免重复,此处适当省略详细描述。
图4的算力网络中算力感知的装置包括至少一个能以软件或固件的形式存储于存储器中或固化在算力网络中算力感知的装置中的软件功能模块,该算力网络中算力感知的装置包括:时变数据监控模块410,用于通过对算力网络中的算力节点进行监控,更新时变算力感知数据模板中的算力资源时变数据,其中,所述算力资源时变数据表征所述算力节点的算力状态;一级算力更新模块420,用于基于所述算力资源时变数据,更新一级算力感知数据模板中的一级算力感知属性数据,其中,所述一级算力感知属性数据包括所述算力节点对应的资源属性值;全局算力更新模块430,用于基于所述一级算力感知属性数据,在全局算力感知数据模板中生成所述算力节点的算力标签,其中,所述算力标签表征所述算力节点是否空闲。
在本申请的一些实施例中,时变数据监控模块410,用于按照预设时间周期对所述算力节点的所述算力状态进行检测,在确认所述算力状态发生变化时,更新所述算力状态,其中,所述算力状态包括:正常、故障、告警或失效。
在本申请的一些实施例中,一级算力更新模块420,用于在确定所述算力节点的算力状态为正常的情况下,按照预设时间周期获取所述算力节点的资源变化率,其中,所述资源变化率包括:资源占用变化率和/或资源利用变化率;利用所述资源变化率,对所述算力节点对应的资源属性值进行更新,其中,所述资源属性值包括:资源占用属性值和/或资源利用属性值。
在本申请的一些实施例中,一级算力更新模块420,用于确认所述资源占用变化率超过第一阈值时,更新所述资源占用属性值和/或所述资源利用属性值;或者,确认所述资源利用变化率超过第二阈值时,更新所述资源利用属性值和/或所述资源占用属性值。
在本申请的一些实施例中,全局算力更新模块430,用于按照所述预设时间周期,至少基于所述资源属性值与预设资源阈值的对比结果,生成所述算力标签。
在本申请的一些实施例中,全局算力更新模块430,用于确认所述资源占用变化率超过第三阈值且所述资源占用属性值未超过占用阈值时,或者,确认所述资源利用变化率超过第四阈值且所述资源利用属性值未超过利用阈值时,则生成的所述算力标签为第一标签,其中,所述第一标签表征所述算力节点空闲;确认所述资源占用变化率超过第三阈值且所述资源占用属性超过占用阈值时,或者,确认所述资源利用变化率超过第四阈值且所述资源利用属性值超过利用阈值时,则生成的所述算力标签为第二标签,其中,所述第二标签表征所述算力节点非空闲。
在本申请的一些实施例中,算力网络中算力感知的装置还可以包括:可视化模块(图中未示出),用于按照预设时间周期,展示所述算力资源时变数据、所述一级算力感知属性数据以及所述算力标签。
在本申请的一些实施例中,算力网络中算力感知的装置还可以包括:调度模块(图中未示出),用于接收终端设备发送的算力请求;基于所述算力标签确定为所述算力请求提供服务的算力节点。
在本申请的一些实施例中,在时变数据监控模块410之前,算力网络中算力感知的装置还可以包括:设计模块(图中未示出),用于响应于对象的操作,生成时变算力感知数据模板、一级算力感知数据模板和全局算力感知数据模板,以便于存储所述算力资源时变数据、所述一级算力感知属性数据以及所述算力标签。
本申请的一些实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时可实现如上述实施例提供的上述方法中的任意实施例所对应方法的操作。
本申请的一些实施例还提供了一种计算机程序产品,所述的计算机程序产品包括计算机程序,其中,所述的计算机程序被处理器执行时可实现如上述实施例提供的上述方法中的任意实施例所对应方法的操作。
如图5所示,本申请的一些实施例提供一种电子设备500,该电子设备500包括:存储器510、处理器520以及存储在存储器510上并可在处理器520上运行的计算机程序,其中,处理器520通过总线530从存储器510读取程序并执行所述程序时可实现如上述任意实施例的方法。
处理器520可以处理数字信号,可以包括各种计算结构。例如复杂指令集计算机结构、结构精简指令集计算机结构或者一种实行多种指令集组合的结构。在一些示例中,处理器520可以是微处理器。
存储器510可以用于存储由处理器520执行的指令或指令执行过程中相关的数据。这些指令和/或数据可以包括代码,用于实现本申请实施例描述的一个或多个模块的一些功能或者全部功能。本公开实施例的处理器520可以用于执行存储器510中的指令以实现上述所示的方法。存储器510包括动态随机存取存储器、静态随机存取存储器、闪存、光存储器或其它本领域技术人员所熟知的存储器。
以上所述仅为本申请的实施例而已,并不用于限制本申请的保护范围,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应所述以权利要求的保护范围为准。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

Claims (10)

1.一种算力网络中算力感知的方法,其特征在于,应用于分级算力感知信息系统,所述分级算力感知信息系统包括:时变算力感知数据模板、一级算力感知数据模板和全局算力感知数据模板,所述方法包括:
通过对算力网络中的算力节点进行监控,更新所述时变算力感知数据模板中的算力资源时变数据,其中,所述算力资源时变数据表征所述算力节点的算力状态;
基于所述算力资源时变数据,更新所述一级算力感知数据模板中的一级算力感知属性数据,其中,所述一级算力感知属性数据包括所述算力节点对应的资源属性值;
基于所述一级算力感知属性数据,在所述全局算力感知数据模板中生成所述算力节点的算力标签,其中,所述算力标签表征所述算力节点是否空闲。
2.如权利要求1所述的方法,其特征在于,所述通过对算力网络中的算力节点进行监控,更新所述时变算力感知数据模板中的算力资源时变数据,包括:
按照预设时间周期对所述算力节点的所述算力状态进行检测,在确认所述算力状态发生变化时,更新所述算力状态,其中,所述算力状态包括:正常、故障、告警或失效。
3.如权利要求1或2所述的方法,其特征在于,所述基于所述算力资源时变数据,更新所述一级算力感知数据模板中的一级算力感知属性数据,包括:
在确定所述算力节点的算力状态为正常的情况下,按照预设时间周期获取所述算力节点的资源变化率,其中,所述资源变化率包括:资源占用变化率和/或资源利用变化率;
利用所述资源变化率,对所述算力节点对应的资源属性值进行更新,其中,所述资源属性值包括:资源占用属性值和/或资源利用属性值。
4.如权利要求3所述的方法,其特征在于,所述利用所述资源变化率,对所述一级算力感知属性数据进行更新,包括:
确认所述资源占用变化率超过第一阈值时,更新所述资源占用属性值和/或所述资源利用属性值;或者,
确认所述资源利用变化率超过第二阈值时,更新所述资源利用属性值和/或所述资源占用属性值。
5.如权利要求3所述的方法,其特征在于,所述基于所述一级算力感知属性数据,在所述全局算力感知数据模板中生成所述算力节点的算力标签,包括:
按照所述预设时间周期,基于所述资源属性值与预设资源阈值的对比结果,生成所述算力标签。
6.如权利要求5所述的方法,其特征在于,所述基于所述资源属性值与预设资源阈值的对比结果,生成所述算力标签,包括:
确认所述资源占用变化率超过第三阈值且所述资源占用属性值未超过占用阈值时,或者,确认所述资源利用变化率超过第四阈值且所述资源利用属性值未超过利用阈值时,则生成的所述算力标签为第一标签,其中,所述第一标签表征所述算力节点空闲;
确认所述资源占用变化率超过第三阈值且所述资源占用属性超过占用阈值时,或者,确认所述资源利用变化率超过第四阈值且所述资源利用属性值超过利用阈值时,则生成的所述算力标签为第二标签,其中,所述第二标签表征所述算力节点非空闲。
7.如权利要求1或2所述的方法,其特征在于,所述方法还包括:
按照预设时间周期,展示所述算力资源时变数据、所述一级算力感知属性数据以及所述算力标签。
8.如权利要求1或2所述的方法,其特征在于,所述方法还包括:
接收终端设备发送的算力请求;
基于所述算力标签确定为所述算力请求提供服务的算力节点。
9.如权利要求1或2所述的方法,其特征在于,在所述通过对算力网络中的算力节点进行监控,更新所述时变算力感知数据模板中的算力资源时变数据之前,所述方法还包括:
响应于对象的操作,生成时变算力感知数据模板、一级算力感知数据模板和全局算力感知数据模板,以便于存储所述算力资源时变数据、所述一级算力感知属性数据以及所述算力标签。
10.一种算力网络中算力感知的装置,其特征在于,包括:
时变数据监控模块,用于通过对算力网络中的算力节点进行监控,更新时变算力感知数据模板中的算力资源时变数据,其中,所述算力资源时变数据表征所述算力节点的算力状态;
一级算力更新模块,用于基于所述算力资源时变数据,更新一级算力感知数据模板中的一级算力感知属性数据,其中,所述一级算力感知属性数据包括所述算力节点对应的资源属性值;
全局算力更新模块,用于基于所述一级算力感知属性数据,在全局算力感知数据模板中生成所述算力节点的算力标签,其中,所述算力标签表征所述算力节点是否空闲。
CN202310287820.2A 2023-03-22 算力网络中算力感知的方法、装置、存储介质及电子设备 Active CN116467071B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310287820.2A CN116467071B (zh) 2023-03-22 算力网络中算力感知的方法、装置、存储介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310287820.2A CN116467071B (zh) 2023-03-22 算力网络中算力感知的方法、装置、存储介质及电子设备

Publications (2)

Publication Number Publication Date
CN116467071A true CN116467071A (zh) 2023-07-21
CN116467071B CN116467071B (zh) 2024-06-07

Family

ID=

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113448721A (zh) * 2020-03-27 2021-09-28 中国移动通信有限公司研究院 算力处理的网络系统及算力处理方法
CN114285858A (zh) * 2021-12-14 2022-04-05 中国联合网络通信集团有限公司 一种算力感知方法、装置及存储介质
CN114637603A (zh) * 2022-03-10 2022-06-17 京东科技信息技术有限公司 资源的控制方法、装置、计算机设备及存储介质
CN115225722A (zh) * 2021-04-20 2022-10-21 中兴通讯股份有限公司 算力资源的通告方法及装置、存储介质、电子装置
CN115562879A (zh) * 2022-12-06 2023-01-03 北京邮电大学 算力感知方法、装置、电子设备和存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113448721A (zh) * 2020-03-27 2021-09-28 中国移动通信有限公司研究院 算力处理的网络系统及算力处理方法
WO2021190482A1 (zh) * 2020-03-27 2021-09-30 中国移动通信有限公司研究院 算力处理的网络系统及算力处理方法
CN115225722A (zh) * 2021-04-20 2022-10-21 中兴通讯股份有限公司 算力资源的通告方法及装置、存储介质、电子装置
CN114285858A (zh) * 2021-12-14 2022-04-05 中国联合网络通信集团有限公司 一种算力感知方法、装置及存储介质
CN114637603A (zh) * 2022-03-10 2022-06-17 京东科技信息技术有限公司 资源的控制方法、装置、计算机设备及存储介质
CN115562879A (zh) * 2022-12-06 2023-01-03 北京邮电大学 算力感知方法、装置、电子设备和存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
黄光平;罗鉴;周建锋;: "算力网络架构与场景分析", 信息通信技术, no. 04, 15 August 2020 (2020-08-15), pages 18 - 24 *

Similar Documents

Publication Publication Date Title
Ramaswamy et al. Towards a quality-centric big data architecture for federated sensor services
Li et al. A distributed consensus algorithm for decision making in service-oriented internet of things
CN1956457B (zh) 用于安排网格计算系统中的网格作业的方法和设备
CN111414233A (zh) 一种在线模型推理系统
CN110532078A (zh) 一种边缘计算调度优化方法及系统
Cao et al. The design of an IoT-GIS platform for performing automated analytical tasks
US11231960B2 (en) Method and system for managing data stream processing
CN103259872A (zh) 基于开放式网格体系的多源异构地理信息服务平台
WO2019219005A1 (zh) 一种数据处理系统及方法
CN111966289A (zh) 基于Kafka集群的分区优化方法和系统
Renart et al. An edge-based framework for enabling data-driven pipelines for iot systems
Tong et al. Bloom filter-based workflow management to enable QoS guarantee in wireless sensor networks
Marie-Magdelaine et al. Proactive autoscaling for cloud-native applications using machine learning
CN110460662A (zh) 物联网数据的处理方法和系统
CN106210124A (zh) 一种统一的云数据中心监控系统
CN115033657A (zh) 基于知识图谱的查询方法、装置、设备及存储介质
CN112579319A (zh) 一种基于LRU Cache优化的服务调用方法及装置
CN116684418B (zh) 基于算力服务网关的算力编排调度方法、算力网络及装置
CN111934793B (zh) 一种互联网架构全链路监控方法及装置
CN116467071B (zh) 算力网络中算力感知的方法、装置、存储介质及电子设备
CN110019085A (zh) 一种基于HBase的分布式时序数据库
CN116467071A (zh) 算力网络中算力感知的方法、装置、存储介质及电子设备
Vera-Baquero et al. Big-data analysis of process performance: A case study of smart cities
CN113722141B (zh) 数据任务的延迟原因确定方法、装置、电子设备及介质
CN104394198A (zh) 一种基于esb的全局调度方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant