CN116501501A - 算力资源管理和编排方法、装置、电子设备及存储介质 - Google Patents

算力资源管理和编排方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN116501501A
CN116501501A CN202310742602.3A CN202310742602A CN116501501A CN 116501501 A CN116501501 A CN 116501501A CN 202310742602 A CN202310742602 A CN 202310742602A CN 116501501 A CN116501501 A CN 116501501A
Authority
CN
China
Prior art keywords
computing power
resource
computing
resources
node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310742602.3A
Other languages
English (en)
Inventor
郭建超
王首峰
欧阳晔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Asiainfo Technologies China Inc
Original Assignee
Asiainfo Technologies China Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Asiainfo Technologies China Inc filed Critical Asiainfo Technologies China Inc
Priority to CN202310742602.3A priority Critical patent/CN116501501A/zh
Publication of CN116501501A publication Critical patent/CN116501501A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/445Program loading or initiating
    • G06F9/44594Unloading
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • G06F9/4806Task transfer initiation or dispatching
    • G06F9/4843Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
    • G06F9/4881Scheduling strategies for dispatcher, e.g. round robin, multi-level priority queues
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Abstract

本申请实施例提供了一种算力资源管理和编排方法、装置、电子设备及存储介质,涉及算力网络技术领域。包括:算力编排管理中心接收算力交易中心发送的算力资源需求信息;根据算力资源需求信息,从管理的节点算力资源信息表中查询对应的算力资源并进行算力资源编排,形成相应的候选算力资源配置策略,其中,节点算力资源信息表是通过算力调度中心按照一定规则注册、认证、鉴权后上报得到;在获得算力交易中心对目标算力资源配置策略的确认信息后,向算力调度中心发送资源配置策略,以使其根据资源配置策略进行算力资源调度。可以根据需求对算力资源进行合理化编排和应用,对微观层次具体的特性算力资源进行分类管理,实现算力资源的合理利用。

Description

算力资源管理和编排方法、装置、电子设备及存储介质
技术领域
本申请涉及算力网络技术领域,具体而言,本申请涉及一种算力资源管理和编排方法、装置、电子设备及存储介质。
背景技术
算力,简而言之就是计算能力,小至手机,大到超级计算机,都是算力的载体,没有算力就没有各种软硬件的正常应用。算力最初主要的存在形式是集中化的数据中心,集中化的算力管理技术已经较为成熟。
随着新一轮科技革命和产业变革的深入发展,算力已成为全社会数智化转型的基石,将直接影响数字经济的发展速度,网络作为连接用户、数据、算力的主动脉,与算力逐渐走向融。算力网络逐渐成为数字化转型的新型基础设施,对算力网络的管控与编排也提出的新的挑战。
随着摩尔定律的减速,算力资源增速正在趋近临界点,未来算力增速可能很难实现大幅提升,在没有找到更好的算力替代资源之前,算力有效的、合理化的利用是当下考虑的重点方向。
发明内容
本申请实施例提供了一种算力资源管理和编排方法、装置、电子设备及存储介质,可以实现对于不同类别的算力精细化调用和高效使用。技术方案如下:
根据本申请实施例的一个方面,提供了一种算力资源管理和编排方法,该方法包括:
算力编排和管理中心接收算力交易中心发送的算力资源需求信息;
算力编排和管理中心根据算力资源需求信息,从其管理的节点算力资源信息表中查询对应的算力资源,调用AI能力进行节点选择和路径计算,形成相应的候选算力资源配置策略,其中,节点算力资源信息表是通过算力调度中心按照一定规则注册、认证及鉴权后上报得到的;
算力编排和管理中心在获得算力交易中心对目标算力资源配置策略的确认信息后,向算力调度中心发送资源配置策略,以使其根据资源配置策略进行算力资源调度,目标算力资源配置策略为候选算力资源配置策略中的一个。
在一种可能的实现方式中,算力编排和管理中心根据算力资源需求信息,从其管理的节点算力资源信息表中查询对应的算力资源之前,还包括:
通过算力调度中心对各个算力节点的算力信息进行记录和汇聚,得到节点算力资源信息表;
其中,节点算力资源信息表包括算力节点位置信息和算力节点包含的各个主机的相关信息,相关信息包括主机信息、主机包括的各类算力信息和算力状态信息。
在一种可能的实现方式中,方法还包括:
通过算力调度中心对各个算力节点进行预处理,以及在预处理后对各个算力节点处的不同类型的算力资源进行分类管理,形成不同的算力原子资源池,其中,预处理包括注册、认证及鉴权。
在一种可能的实现方式中,算力资源的分类管理方式包括以下至少一种:
第一类分类管理方式,第一类分类管理方式是对分布于不同层次的算力资源进行分类管理,不同层次包括云、边、端;
第二类分类管理方式,第二类分类管理方式是对处于不同层次存储的资源按资源特性进行分类,资源特性包括以下至少一种:中央处理器CPU、图形处理器GPU、神经网络处理器NPU、数据处理单元DPU、加速处理器APU、张量处理器TPU。
在一种可能的实现方式中,算力资源编排的方式,包括以下至少一种:
第一种方式,对于位置固定型业务或位置移动型业务,应在满足业务资源需求的前提下,选择与业务资源需求的量级匹配的单一算力节点资源或单一算力节点下的单一主机资源;
第二种方式,基于业务运行特征,对业务闲时释放的算力资源进行编排,其中,业务运行特征包括以下至少一种:业务类型、业务运行时间周期特征、资源需求信息;
第三种方式,将复杂业务解析为不同类别的算力原子需求,基于第一种方式采用算力卸载的方式,对业务需求算力资源进行编排。
在一种可能的实现方式中,算力资源需求信息包括以下至少一项:业务类型、业务位置信息、资源需求信息。
根据本申请实施例的另一个方面,提供了一种算力资源管理和编排装置,该装置包括:
接收模块,用于算力编排和管理中心接收算力交易中心发送的算力资源需求信息;
第一处理模块,用于算力编排和管理中心根据算力资源需求信息,从其管理的节点算力资源信息表中查询对应的算力资源,调用AI能力进行节点选择和路径计算,形成相应的候选算力资源配置策略,其中,节点算力资源信息表是通过算力调度中心按照一定规则注册、认证及鉴权后上报得到的;
第二处理模块,用于算力编排和管理中心在获得算力交易中心对目标算力资源配置策略的确认信息后,向算力调度中心发送资源配置策略,以使其根据资源配置策略进行算力资源调度,目标算力资源配置策略为候选算力资源配置策略中的一个。
在一种可能的实现方式中,该装置还包括:
第三处理模块,用于通过算力调度中心对各个算力节点的算力信息进行记录和汇聚,得到节点算力资源信息表;
其中,节点算力资源信息表包括算力节点位置信息和算力节点包含的各个主机的相关信息,相关信息包括主机信息、主机包括的各类算力信息和算力状态信息。
在一种可能的实现方式中,该装置还包括:
第四处理模块,用于通过算力调度中心对各个算力节点进行预处理,以及在预处理后对各个算力节点处的不同类型的算力资源进行分类管理,形成不同的算力原子资源池,其中,预处理包括注册、认证及鉴权。
在一种可能的实现方式中,算力资源的分类管理方式包括以下至少一种:
第一类分类管理方式,第一类分类管理方式是对分布于不同层次的算力资源进行分类管理,不同层次包括云、边、端;
第二类分类管理方式,第二类分类管理方式是对处于不同层次存储的资源按资源特性进行分类,资源特性包括以下至少一种:中央处理器CPU、图形处理器GPU、神经网络处理器NPU、数据处理单元DPU、加速处理器APU、张量处理器TPU。
在一种可能的实现方式中,算力资源编排的方式,包括以下至少一种:
第一种方式,对于位置固定型业务或位置移动型业务,应在满足业务资源需求的前提下,选择与业务资源需求的量级匹配的单一算力节点资源或单一算力节点下的单一主机资源;
第二种方式,基于业务运行特征,对业务闲时释放的算力资源进行编排,其中,业务运行特征包括以下至少一种:业务类型、业务运行时间周期特征、资源需求信息;
第三种方式,将复杂业务解析为不同类别的算力原子需求,基于第一种方式采用算力卸载的方式,对业务需求算力资源进行编排。
在一种可能的实现方式中,算力资源需求信息包括以下至少一项:业务类型、业务位置信息、资源需求信息。
根据本申请实施例的另一个方面,提供了一种电子设备,该电子设备包括:存储器、处理器及存储在存储器上的计算机程序,处理器执行计算机程序以实现上述的算力资源处理方法的步骤。
根据本申请实施例的再一个方面,提供了一种计算机可读存储介质,计算机程序被处理器执行时实现上述的算力资源处理方法的步骤。
根据本申请实施例的一个方面,提供了一种计算机程序产品,计算机程序被处理器执行时实现上述的算力资源处理方法的步骤。
本申请实施例提供的技术方案带来的有益效果是:通过算力编排和管理中心根据接收到的算力资源需求信息表,对满足能够算力资源需求信息表的算力资源进行编排,不仅可以根据需求对算力资源进行合理化编排和应用,还可以在现有的宏观算力资源的管理基础上,对微观层次具体的特性算力资源进行分类管理,最终实现对算力资源的分类管理。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对本申请实施例描述中所需要使用的附图作简单地介绍。
图1为本申请实施例提供的一种算力资源管理和编排方法的流程示意图;
图2为本申请实施例提供的算力资源管理和编排的整体过程示意图;
图3为本申请实施例提供的一种算力资源管理和编排装置的结构示意图;
图4为本申请实施例提供的一种电子设备的结构示意。
具体实施方式
下面结合本申请中的附图描述本申请的实施例。应理解,下面结合附图所阐述的实施方式,是用于解释本申请实施例的技术方案的示例性描述,对本申请实施例的技术方案不构成限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本申请实施例所使用的术语“包括”以及“包含”是指相应特征可以实现为所呈现的特征、信息、数据、步骤、操作、元件和/或组件,但不排除实现为本技术领域所支持其他特征、信息、数据、步骤、操作、元件、组件和/或它们的组合等。应该理解,当我们称一个元件被“连接”或“耦接”到另一元件时,该一个元件可以直接连接或耦接到另一元件,也可以指该一个元件和另一元件通过中间元件建立连接关系。此外,这里使用的“连接”或 “耦接”可以包括无线连接或无线耦接。这里使用的术语“和/或”指示该术语所限定的项目中的至少一个,例如“A和/或B”指示实现为“A”,或者实现为“A”,或者实现为“A和B”。
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
对于现有算力资源的有效利用,一方面是对分布在云、边、端、节点上的算力进行合理化调度(比如东数西算工程)实现业务赋能,另一方面是对不同类别算力资源如何进行合理化编排应用,以提升其效能。
当前的其它方案中,对于算力的使用重点考虑对分布在云、边、端等不同节点上的算力设备进行统一纳管后形成算力资源池、供业务编排调度利用,重点还是宏观层面的算力资源调度,对与不同类别的算力精细化调用、单个节点上的不同类别算力的高效使用研究比较少。
针对上述情况,本申请提出一种算力资源管理和编排的方案,通过算力编排和管理中心根据接收到的算力资源需求信息,对满足能够算力资源需求信息的算力资源进行编排,不仅可以根据需求对算力资源进行合理化编排和应用,还可以在现有的宏观算力资源的管理基础上,对微观层次具体的特性算力资源进行分类管理,最终实现对算力资源的分类管理。
下面通过对几个示例性实施方式的描述,对本申请实施例的技术方案以及本申请的技术方案产生的技术效果进行说明。需要指出的是,下述实施方式之间可以相互参考、借鉴或结合,对于不同实施方式中相同的术语、相似的特征以及相似的实施步骤等,不再重复描述。
图1为本申请实施例提供的算力资源管理和编排方法的流程示意图,如图1所示,该方法包括:步骤S110,算力编排和管理中心接收算力交易中心发送的算力资源需求信息;步骤S120,算力编排和管理中心根据算力资源需求信息,从其管理的节点算力资源信息表中查询对应的算力资源,调用AI能力进行节点选择和路径计算,形成相应的候选算力资源配置策略,其中,节点算力资源信息表是通过算力调度中心按照一定规则注册、认证及鉴权后上报得到的;步骤S130,算力编排和管理中心在获得算力交易中心对目标算力资源配置策略的确认信息后,向算力调度中心发送资源配置策略,以使其根据资源配置策略进行算力资源调度,目标算力资源配置策略是候选算力资源配置策略中的一个。
在本申请实施例提供的方法中,算力交易中心向算力编排和管理中心发送算力资源需求信息,相对应地,算力编排和管理中心接收算力交易中心发送的算力资源需求信息。该资源需求信息中包括有业务类型、业务位置信息和资源需求信息中的至少一种,其中,业务类型可以是面向个人客户的流媒体、游戏等,也可以是面向行业应用的AI(ArtificialIntelligence,人工智能)应用、V2X(vehicle to X,车用无线通信技术)、面向科学计算服务的高并发计算等。
算力编排和管理中心在接收到述的算力资源需求信息后,会查询不同类别算力资源信息列表,进行业务资源编排(比如调用AI能力进行节点选择和路径计算),相当于,算力编排和管理中心根据接收到的算力资源需求信息从其管理的节点算力资源信息表中查询对应的算力资源并进行算力资源编排,该算力资源编排可以是调用AI能力进行节点选择和路径计算,最终形成一个或多个候选算力资源配置策略。可以理解为,算力编排和管理中心对查询到的满足算力资源需求信息的算力资源进行编排(比如调用AI能力进行节点选择和路径计算)并形成一个或多个候选算力资源配置策略。其中,该节点算力资源信息表是通过算力调度中心按照一定规则注册、认证及鉴权后收集上报得到的,算力编排和管理中心对查询到的算力资源进行编排后会形成相应的算力资源配置策略,以用于调度相应的算力资源来满足算力资源需求信息的需求。
算力编排和管理中心在形成或生成相应的候选算力资源配置策略后,会将该候选算力资源配置策略发送算力交易中心,在获得算力交易中心对目标算力资源配置策略的确认信息后,即获得算力交易中心从候选算力资源配置策略中选择确定出的目标算力资源配置策略后,再将目标算力资源配置策略下发给算力调度中心,即下发目标算力资源配置策略给算力调度中心。算力调度中心在接收到目标算力资源配置策略后,会根据目标算力资源配置策略进行算力资源的调度,以满足算力资源需求信息表的需求。其中,目标算力资源配置策略是候选算力资源配置策略中的一个。
本申请实施例的方法,算力编排和管理中心根据接收到的算力资源需求信息,对能够满足算力资源需求信息的算力资源进行编排,不仅可以根据需求对算力资源进行合理化编排和应用,还可以在现有的宏观算力资源的管理基础上,对微观层次具体的特性算力资源进行分类管理,最终实现对算力资源的分类管理。
在本申请实施例的一种可能的实现方式中,该方法还包括通过算力调度中心对各个算力节点的算力信息进行记录和汇聚,得到节点算力资源信息表;其中,节点算力资源信息表包括算力节点位置信息和算力节点包含的各个主机的相关信息,所述主机相关信息包括主机信息、主机包括的各类算力信息和算力状态信息。
在一种可能的实现方式中,算力编排和管理中心在根据算力资源需求信息,从管理的节点算力资源信息表中查询对应的算力资源之前,还可以通过算力调度中心对各个算力节点的算力信息进行记录和汇聚,得到节点算力资源信息表;其中,节点算力资源信息表包括算力节点位置信息和算力节点包含的各个主机的相关信息,该相关信息包括主机信息、主机包括的各类算力信息和算力状态信息。
在一种可能的实现方式中,算力资源的分类管理方式包括第一类分类管理方式和第二类分类管理方式中的至少一种,其中,第一类分类管理方式是对分布于不同层次的算力资源进行分类管理,不同层次包括云、边、端;第二类分类管理方式是对处于不同层次存储的资源按资源特性进行分类,资源特性包括以下至少一种:中央处理器CPU、图形处理器GPU、神经网络处理器NPU、数据处理单元DPU、加速处理器APU、张量处理器TPU。
算力调度中心对每个算力节点进行注册、认证(即资源认证)、鉴权等预处理,在预处理后,可以依据每个算力节点中算力资源的分布情况、存储类型及地理位置(可以理解为是每个算力节点所处的地理位置),对每个算力节点的算力资源进行分类管理。依据上述算力资源的分布情况、存储类型及地理位置,可以将算力资源划分为不同类型,即,将不同分布情况、不同存储类型及不同地理位置的算力资源划分为不同类型的算力资源。相当于,在预处理后对各个算力节点处的不同类型的算力资源进行分类管理。在对算力资源进行分类管理后,可以形成不同的算力原子资源池(可以理解为算力原子能力)。
算力资源的分布情况可以理解为算力资源的不同分布层次,分布于不同层次的算力资源,此处的不同层次可以是指云、边、端等,当然也可以是后续新出现的其他类似的层次,本申请实施例不对其做限制。其中,云可以是传统云算的中心节点,是边缘计算的管控端;边可以是云算力的边缘端,包括基础设施和设备边缘;端可以指终端设备,例如手机、家电和各类传感器等。分布在不同层次的算力资源可以记作第一类算力资源,即第一类算力资源是分布于不同层次(即不同分布层次)的算力资源,不同分布层次包括云、边、端等。第一类算力资源又可以根据上述的不同分布层次进一步细分为更小的算力资源子类型,本申请实施例不对其作限制。
需要说明的是,上述第一类算力资源也可以理解为是处于不同地理位置的算力资源,可以根据不同地理位置进一步细分为更小的算力资源子类型,本申请实施例不对其作限制。
算力资源的存储类型包括CPU(Central Processing Unit,中央处理器)、GPU(Graphics Processing Unit,图形处理器)、NPU(Neural Network Processing Unit,神经网络处理器)、DPU(Data Processing Unit数据处理单元)、APU(Accelerated ProcessingUnit,加速处理器)、TPU(Tensor Processing Unit,张量处理单元)等,可以将存储于CPU、GPU、NPU、DPU、APU、TPU等不同存储资源或存储位置处的算力资源,记作第二类算力资源。第二类算力资源又可以根据上述的存储类型进一步细分为更小的算力资源子类型,本申请实施例不对其作限制。
可见,本申请实施例对分布在不同分布层次(云、边、端等)、不同类型(比如CPU、GPU、NPU、DPU、APU、TPU等)、不同地理位置的算力资源进行精细化编排,可以提升特性资源在其能力特性领域的使用,使特定类别的资源发挥其最大效能。
算力调度中心在形成不同的的算力原子资源池后,会对各个算力节点的算力信息进行记录,其中,记录的算力信息包括算力节点位置信息、算力节点包含的各个主机的主机相关信息(例如主机信息、主机包括的各类型算力信息、动态的算力状态信息情况等),并汇聚所有的算力节点情况(即各个算力节点的算力信息)构成节点算力管理信息表(即节点算力资源信息表)。
算力调度中心在记录和汇聚得到节点算力资源信息表后,将该节点算力资源信息表上报或发送给算力编排和管理中心,即算力编排和管理中心接收算力调度中心收集上报的节点算力资源信息表,从而便于后续利用该节点算力资源信息表对各算力节点的算力资源进行精细化/合理编排,以确保特定类型的算力资源发挥其最大效能。
在本申请实施例的一种可能的实现方式中,算力资源编排的方式,包括以下至少一种:
第一种方式,对于位置固定型业务或位置移动型业务,应在满足业务资源需求的前提下,选择与业务资源需求的量级匹配的单一算力节点资源或单一算力节点下的单一主机资源;
第二种方式,基于业务运行特征,对业务闲时释放的算力资源进行编排,其中,业务运行特征包括以下至少一种:业务类型、业务运行时间周期特征、资源需求信息(比如资源需求近似度);
第三种方式,将复杂业务解析为不同类别的算力原子需求,基于第一种方式采用算力卸载的方式,对业务需求算力资源进行编排。
在具体处理过程中,在面向业务的算力资源编排时,可以在支持业务运行时,不论是位置固定型业务还是位置移动型业务,在满足业务资源需求的前提下,应尽量选择与业务资源需求量级相近(即匹配)的单一节点算力资源或单一算力节点下的主机资源,即通过最少算力节点数或单一算力节点下最少主机数实现业务的算力资源配置。需要说明的是,对于位置移动型业务,可能随着业务的位置变化,需要考虑业务运行时延等问题,切换赋能的算力节点,在业务移动的路径上选择赋能的算力节点时同样可遵循上述规则,实现相关业务目标。该算力资源编排方式,可以使得单一算力节点、单一主机、单一主机包含的单一类型的算力资源实现最大化利用,使赋能业务的算力节点接入数最少,减少业务维护难度,保证业务运行的稳定性。
在具体处理过程中,在面向业务的算力资源编排时,可以基于业务运行特征,对于弹性释放的算力资源进行编排,从而提升业务闲时释放的算力资源的利用率。其中,算力编排和管理中心可以按业务类型、业务运行时间周期特征、资源需求信息(如资源需求近似度)等对业务进行分类管理,对于近似的业务,低优先级的业务在高优先级业务闲时,可以直接复用高优先级业务的算力资源,提升特性资源的利用效率。该算力资源编排方式,可以提升对高优先级业务分配的算力资源在业务闲时的利用率,采用近似业务的分类排序管理,可以减少算力资源编排难度。
在具体处理过程中,在面向业务的算力资源编排时,可以将复杂业务解析为不同类别的算力子需求,基于算力卸载的方式,对业务需求算力资源进行编排。比如,在面向复杂业务时,考虑采用类似算力卸载的方式,对业务需求资源进行编排。先前已经针对不同主机下不同类型算力资源进行分类管理构成了不同的算力原子能力(即算力原子资源池),在面对复杂业务时,可以将复杂业务解析为不同类别的算力资源子需求,本申请实施例在上述方式一的基础上,采用类似算力卸载的形式,分别在各算力原子资源池匹配满足业务需求的算力资源。该算力资源编排方式,可以降低业务实现难度,结合模块化的算力原子管理方法,促进单一算力原子能力在特定业务领域的应用,提升单一算力效能。
为了更好的理解本申请实施例的算力资源管理和编排方法,图2给出了对应的算力资源编制管理流程:
步骤1,发送资源需求信息:算力交易中心向算力编排和管理中心(即图2中的算力编排中心)发送算力资源需求信息,相对应地,算力编排和管理中心接收算力交易中心发送的算力资源需求信息。
步骤2,查询不同类别算力资源信息列表,进行业务资源编排:算力编排和管理中心查询其管理的节点算力资源信息表(比如不同类别的算力资源信息列表),进行业务资源编排(比如调用AI能力进行节点选择和路径计算),形成相应的候选算力资源配置策略,该候选算力资源配置策略可能是一个,也可能是多个,本申请实施例不对其做限定,该生成的候选算力资源配置策略可以理解为是可选资源配置策略(即可选资源配置方案)。
步骤3,反馈可选资源配置方案:算力编排中心向算力交易中心反馈生成的候选算力资源配置策略,即向算力交易中心发送生成的算力资源配置方案,以供算力交易中心从中确认最终的目标算力资源配置策略;
步骤4,确认选择的资源配置方案:算力交易中心向算力编排中心反馈确认的目标资源配置策略,即算力交易中心从候选资源配置策略中确认选择出资源配置策略(即目标算力资源配置策略),然后将确认选择出的资源配置策略(即目标算力资源配置策略)反馈给算力编排和管理中心。在实际应用中,算力交易中心可以通过向算力编排和管理中心发送对目标算力资源配置策略的确认信息的方式告知算力编排和管理中心,相对应地,算力编排和管理中心接收算力交易中心对目标算力资源配置策略的确认信息。
步骤5,下发资源配置策略:算力编排中心下发目标算力资源配置策略给算力调度中心,即将该目标算力资源配置策略发送给算力调度中心。
步骤6,调度资源,执行资源配置策略:算力调度中心根据目标算力资源配置策略调度算力基础设施(即算力节点)的算力资源,即执行目标算力资源配置策略。
步骤7,路径建立和资源开通回复:算力基础设施(即算力节点)根据目标算力资源配置策略进行算力路径建立和资源开通操作,随后向算力调度中心反馈建立的算力路径建立和开通的算力资源。
步骤8,业务开通回复:算力调度中心向算力编排中心回复业务开通的消息。
步骤9,业务开通回复:算力编排中心向算力交易中心回复业务开通的消息。
需要说明的的,算力基础设施(即算力节点)预先在算力调度中心完成节点注册、认证(即资源认证)和监控(即鉴权)等管理/处理。其中,算力基础设施包括云端算力a、边缘算力a、闲散算力a及其他算力等算力,每种算力可能存储于CPU、GPU、NPU、DPU、APU、TPU等,本申请实施例不对其作限制。
可见,本申请实施例给出了一种对分布在不同分布层次(云、边、端等)、不同类型(比如CPU、GPU、NPU、DPU、APU、TPU等)、不同地理位置的算力资源进行精细化编排的方法,可以提升特性资源在其能力特性领域的使用,使特定类别的资源发挥其最大效能。
本申请实施例提供了一种算力资源管理和编排装置,如图3所示,该网络容量预测装置300可以包括:接收模块301、第一处理模块302以及第二处理模块303,其中,
接收模块301,用于算力编排和管理中心接收算力交易中心发送的算力资源需求信息;
第一处理模块302,用于算力编排和管理中心根据算力资源需求信息,从其管理的节点算力资源信息表中查询对应的算力资源,调用AI能力进行节点选择和路径计算,形成相应的候选算力资源配置策略,其中,节点算力资源信息表是通过算力调度中心按照一定规则注册、认证及鉴权后上报得到的;
第二处理模块303,用于算力编排和管理中心在获得算力交易中心对目标算力资源配置策略的确认信息后,向算力调度中心发送资源配置策略,以使其根据资源配置策略进行算力资源调度,目标算力资源配置策略为候选算力资源配置策略中的一个。
在一种可能的实现方式中,该装置还包括:
第三处理模块,用于通过算力调度中心对各个算力节点的算力信息进行记录和汇聚,得到节点算力资源信息表;
其中,节点算力资源信息表包括算力节点位置信息和算力节点包含的各个主机的相关信息,主机相关信息包括主机信息、主机包括的各类算力信息和算力状态信息。
在一种可能的实现方式中,该装置还包括:
第四处理模块,用于通过算力调度中心对各个算力节点进行预处理,以及在预处理后对各个算力节点处的不同类型的算力资源进行分类管理,形成不同的算力原子资源池,其中,预处理包括注册、认证及鉴权。
在一种可能的实现方式中,算力资源的分类管理方式包括以下至少一种:
第一类分类管理方式,第一类分类管理方式是对分布于不同层次的算力资源进行分类管理,不同层次包括云、边、端;
第二类分类管理方式,第二类分类管理方式是对处于不同层次存储的资源按资源特性进行分类,资源特性包括以下至少一种:中央处理器CPU、图形处理器GPU、神经网络处理器NPU、数据处理单元DPU、加速处理器APU、张量处理器TPU。
在一种可能的实现方式中,算力资源编排的方式,包括以下至少一种:
第一种方式,对于位置固定型业务或位置移动型业务,应在满足业务资源需求的前提下,选择与业务资源需求的量级匹配的单一算力节点资源或单一算力节点下的单一主机资源;
第二种方式,基于业务运行特征,对业务闲时释放的算力资源进行编排,其中,业务运行特征包括以下至少一种:业务类型、业务运行时间周期特征、资源需求信息;
第三种方式,将复杂业务解析为不同类别的算力原子需求,基于第一种方式采用算力卸载的方式,对业务需求算力资源进行编排。
在一种可能的实现方式中,算力资源需求信息包括以下至少一项:业务类型、业务位置信息、资源需求信息。
本申请实施例的算力资源管理和编排装置可执行本申请上述实施例所示的算力资源处理方法,其实现原理相类似,本申请各实施例的装置中的各模块所执行的动作是与本申请各实施例的方法中的步骤相对应的,对于装置的各模块的详细功能描述具体可以参见前文中所示的对应方法中的描述,此处不再赘述。
本申请实施例的算力资源管理和编排装置,通过算力编排和管理中心根据接收到的算力资源需求信息表,对能够满足算力资源需求信息表的算力资源进行编排,不仅可以根据需求对算力资源进行合理化编排和应用,还可以在现有的宏观算力资源的管理基础上,对微观层次具体的特性算力资源进行分类管理,最终实现对算力资源的分类管理。
本申请实施例中提供了一种电子设备,包括存储器、处理器及存储在存储器上的计算机程序,该处理器执行上述计算机程序以实现算力资源处理方法的步骤,与现有技术相比可实现:通过算力编排和管理中心根据接收到的算力资源需求信息,对满足能够算力资源需求信息的算力资源进行编排,不仅可以根据需求对算力资源进行合理化编排和应用,还可以在现有的宏观算力资源的管理基础上,对微观层次具体的特性算力资源进行分类管理,最终实现对算力资源的分类管理。
在一个可选实施例中提供了一种电子设备,如图4所示,图4所示的电子设备4000包括:处理器4001和存储器4003。其中,处理器4001和存储器4003相连,如通过总线4002相连。可选地,电子设备4000还可以包括收发器4004,收发器4004可以用于该电子设备与其他电子设备之间的数据交互,如数据的发送和/或数据的接收等。需要说明的是,实际应用中收发器4004不限于一个,该电子设备4000的结构并不构成对本申请实施例的限定。
处理器4001可以是CPU(Central Processing Unit,中央处理器),通用处理器,DSP(Digital Signal Processor,数据信号处理器),ASIC(Application SpecificIntegrated Circuit,专用集成电路),FPGA(Field Programmable Gate Array,现场可编程门阵列)或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器4001也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合等。
总线4002可包括一通路,在上述组件之间传送信息。总线4002可以是PCI(Peripheral Component Interconnect,外设部件互连标准)总线或EISA(ExtendedIndustry Standard Architecture,扩展工业标准结构)总线等。总线4002可以分为地址总线、数据总线、控制总线等。为便于表示,图4中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
存储器4003可以是ROM(Read Only Memory,只读存储器)或可存储静态信息和指令的其他类型的静态存储设备,RAM(Random Access Memory,随机存取存储器)或者可存储信息和指令的其他类型的动态存储设备,也可以是EEPROM(Electrically ErasableProgrammable Read Only Memory,电可擦可编程只读存储器)、CD-ROM(Compact DiscRead Only Memory,只读光盘)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质、其他磁存储设备、或者能够用于携带或存储计算机程序并能够由计算机读取的任何其他介质,在此不做限定。
存储器4003用于存储执行本申请实施例的计算机程序,并由处理器4001来控制执行。处理器4001用于执行存储器4003中存储的计算机程序,以实现前述方法实施例所示的步骤。
本申请实施例提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时可实现前述方法实施例的步骤及相应内容。
本申请实施例还提供了一种计算机程序产品,包括计算机程序,计算机程序被处理器执行时可实现前述方法实施例的步骤及相应内容。
应该理解的是,虽然本申请实施例的流程图中通过箭头指示各个操作步骤,但是这些步骤的实施顺序并不受限于箭头所指示的顺序。除非本文中有明确的说明,否则在本申请实施例的一些实施场景中,各流程图中的实施步骤可以按照需求以其他的顺序执行。此外,各流程图中的部分或全部步骤基于实际的实施场景,可以包括多个子步骤或者多个阶段。这些子步骤或者阶段中的部分或全部可以在同一时刻被执行,这些子步骤或者阶段中的每个子步骤或者阶段也可以分别在不同的时刻被执行。在执行时刻不同的场景下,这些子步骤或者阶段的执行顺序可以根据需求灵活配置,本申请实施例对此不限制。
以上所述仅是本申请部分实施场景的可选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请的方案技术构思的前提下,采用基于本申请技术思想的其他类似实施手段,同样属于本申请实施例的保护范畴。

Claims (10)

1.一种算力资源管理和编排方法,其特征在于,包括:
算力编排和管理中心接收算力交易中心发送的算力资源需求信息;
算力编排和管理中心根据所述算力资源需求信息,从其管理的节点算力资源信息表中查询对应的算力资源,调用AI能力进行节点选择和路径计算,形成相应的候选算力资源配置策略,其中,所述节点算力资源信息表是通过算力调度中心按照一定规则注册、认证及鉴权后上报得到的;
算力编排和管理中心在获得所述算力交易中心对目标算力资源配置策略的确认信息后,向算力调度中心发送所述资源配置策略,以使其根据所述资源配置策略进行算力资源调度,所述目标算力资源配置策略是所述候选算力资源配置策略中的一个。
2.根据权利要求1所述的方法,其特征在于,算力编排和管理中心根据所述算力资源需求信息,从其管理的节点算力资源信息表中查询对应的算力资源之前,还包括:
通过所述算力调度中心对各个算力节点的算力信息进行记录和汇聚,得到所述节点算力资源信息表;
其中,所述节点算力资源信息表包括算力节点位置信息和算力节点包含的各个主机的相关信息,所述相关信息包括主机信息、主机包括的各类算力信息和算力状态信息。
3.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:
通过所述算力调度中心对各个算力节点进行预处理,以及在所述预处理后对各个算力节点处的不同类型的算力资源进行分类管理,形成不同的算力原子资源池,其中,所述预处理包括注册、认证及鉴权。
4.根据权利要求3所述的方法,其特征在于,所述算力资源的分类管理方式包括以下至少一种:
第一类分类管理方式,所述第一类分类管理方式是对分布于不同层次的算力资源进行分类管理,所述不同层次包括云、边、端;
第二类分类管理方式,所述第二类分类管理方式是对处于不同层次存储的资源按资源特性进行分类,所述资源特性包括以下至少一种:中央处理器CPU、图形处理器GPU、神经网络处理器NPU、数据处理单元DPU、加速处理器APU、张量处理器TPU。
5.根据权利要求1或2所述的方法,其特征在于,算力资源编排的方式,包括以下至少一种:
第一种方式,对于位置固定型业务或位置移动型业务,应在满足业务资源需求的前提下,选择与所述业务资源需求的量级匹配的单一算力节点资源或单一算力节点下的单一主机资源;
第二种方式,基于业务运行特征,对业务闲时释放的算力资源进行编排,其中,所述业务运行特征包括以下至少一种:业务类型、业务运行时间周期特征、资源需求信息;
第三种方式,将复杂业务解析为不同类别的算力原子需求,基于所述第一种方式采用算力卸载的方式,对业务需求算力资源进行编排。
6.根据权利要求1或2所述的方法,其特征在于,所述算力资源需求信息包括以下至少一项:业务类型、业务位置信息、资源需求信息。
7.一种算力资源管理和编排装置,其特征在于,包括:
接收模块,用于算力编排和管理中心接收算力交易中心发送的算力资源需求信息;
第一处理模块,用于算力编排和管理中心根据所述算力资源需求信息,从其管理的节点算力资源信息表中查询对应的算力资源,调用AI能力进行节点选择和路径计算,形成相应的候选算力资源配置策略,其中,所述节点算力资源信息表是通过算力调度中心按照一定规则注册、认证及鉴权后上报得到的;
第二处理模块,用于算力编排和管理中心在获得所述算力交易中心对目标算力资源配置策略的确认信息后,向算力调度中心发送所述资源配置策略,以使其根据所述资源配置策略进行算力资源调度,目标算力资源配置策略是候选算力资源配置策略中的一个。
8.一种电子设备,包括存储器、处理器及存储在存储器上的计算机程序,其特征在于,所述处理器执行所述计算机程序以实现权利要求1-6任一项所述方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-6任一项所述的方法的步骤。
10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-6任一项所述方法的步骤。
CN202310742602.3A 2023-06-21 2023-06-21 算力资源管理和编排方法、装置、电子设备及存储介质 Pending CN116501501A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310742602.3A CN116501501A (zh) 2023-06-21 2023-06-21 算力资源管理和编排方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310742602.3A CN116501501A (zh) 2023-06-21 2023-06-21 算力资源管理和编排方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN116501501A true CN116501501A (zh) 2023-07-28

Family

ID=87323408

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310742602.3A Pending CN116501501A (zh) 2023-06-21 2023-06-21 算力资源管理和编排方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN116501501A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116956258A (zh) * 2023-09-21 2023-10-27 杭州锘崴信息科技有限公司 数据运营中数据计算的计算要素认证方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111953526A (zh) * 2020-07-24 2020-11-17 新华三大数据技术有限公司 一种分层算力网络编排方法、装置及存储介质
CN112465359A (zh) * 2020-12-01 2021-03-09 中国联合网络通信集团有限公司 算力调用方法和装置
CN114090253A (zh) * 2021-11-23 2022-02-25 中国电信股份有限公司 网络算力资源的分配方法、装置、电子设备和可读介质
CN114546632A (zh) * 2020-11-26 2022-05-27 中国电信股份有限公司 算力分发方法、平台和系统、计算机可读存储介质
CN115622904A (zh) * 2021-07-14 2023-01-17 中国移动通信有限公司研究院 管理和调度方法、装置、节点及存储介质
CN115827232A (zh) * 2022-12-08 2023-03-21 杭州王道控股有限公司 一种为业务模型确定配置的方法、装置、系统及设备

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111953526A (zh) * 2020-07-24 2020-11-17 新华三大数据技术有限公司 一种分层算力网络编排方法、装置及存储介质
CN114546632A (zh) * 2020-11-26 2022-05-27 中国电信股份有限公司 算力分发方法、平台和系统、计算机可读存储介质
CN112465359A (zh) * 2020-12-01 2021-03-09 中国联合网络通信集团有限公司 算力调用方法和装置
CN115622904A (zh) * 2021-07-14 2023-01-17 中国移动通信有限公司研究院 管理和调度方法、装置、节点及存储介质
CN114090253A (zh) * 2021-11-23 2022-02-25 中国电信股份有限公司 网络算力资源的分配方法、装置、电子设备和可读介质
CN115827232A (zh) * 2022-12-08 2023-03-21 杭州王道控股有限公司 一种为业务模型确定配置的方法、装置、系统及设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116956258A (zh) * 2023-09-21 2023-10-27 杭州锘崴信息科技有限公司 数据运营中数据计算的计算要素认证方法及装置
CN116956258B (zh) * 2023-09-21 2023-12-05 杭州锘崴信息科技有限公司 数据运营中数据计算的计算要素认证方法及装置

Similar Documents

Publication Publication Date Title
CN101800762B (zh) 一种对多个业务进行融合的业务云系统及业务实现方法
Haller et al. The internet of things in an enterprise context
CN110795486A (zh) 一种微服务平台
CN102467411B (zh) 一种工作流处理方法、装置和控制引擎
CN103995807B (zh) 一种基于Web架构下海量数据查询和二次处理的方法
CN102469126B (zh) 一种应用调度系统、方法和相关装置
CN110071965B (zh) 一种基于云平台的数据中心管理系统
CN116501501A (zh) 算力资源管理和编排方法、装置、电子设备及存储介质
Dong et al. NOMA-based energy-efficient task scheduling in vehicular edge computing networks: A self-imitation learning-based approach
CN111506297A (zh) 一种移动顶层设计系统
CN114615096B (zh) 基于事件驱动架构的电信计费方法、系统及相关设备
CN109639598A (zh) 基于微服务的请求处理方法、服务器、存储介质及装置
US20100161368A1 (en) Managing energy in a data center
CN103873523A (zh) 客户端集群访问方法及装置
CN114091941A (zh) 任务分配方法、装置、电子设备及存储介质
CN112202829A (zh) 基于微服务的社交机器人调度系统和调度方法
CN102799488B (zh) 一种应用于数字电视的应用资源管理系统
Qin et al. Optimal workload allocation for edge computing network using application prediction
CN101431475B (zh) 高性能的流媒体服务器的设置以及进行高性能节目读取的方法
CN115080533A (zh) 基于大数据用于数据交换与共享的中台系统
Raj et al. Novel Practices and Trends in Grid and Cloud Computing
CN111125046A (zh) 基于非结构化平台的跨系统文件共享系统及方法
CN113301082B (zh) 资源管理方法、设备、系统及存储介质
CN100440802C (zh) 服务网格系统及处理作业的方法
CN103617084A (zh) 一种基于微内核群集的应急指挥云服务的实现方法及其系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination