CN117971467A - 一种基于标识解析的异构算力共享平台 - Google Patents
一种基于标识解析的异构算力共享平台 Download PDFInfo
- Publication number
- CN117971467A CN117971467A CN202410053605.0A CN202410053605A CN117971467A CN 117971467 A CN117971467 A CN 117971467A CN 202410053605 A CN202410053605 A CN 202410053605A CN 117971467 A CN117971467 A CN 117971467A
- Authority
- CN
- China
- Prior art keywords
- computing power
- computing
- service
- scheduling
- identification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 46
- 238000012423 maintenance Methods 0.000 claims abstract description 8
- 239000002071 nanotube Substances 0.000 claims abstract description 4
- 238000007726 management method Methods 0.000 claims description 54
- 238000012544 monitoring process Methods 0.000 claims description 28
- 238000012549 training Methods 0.000 claims description 13
- 238000004422 calculation algorithm Methods 0.000 claims description 12
- 238000004364 calculation method Methods 0.000 claims description 12
- 230000006870 function Effects 0.000 claims description 9
- 230000008859 change Effects 0.000 claims description 6
- 238000010586 diagram Methods 0.000 claims description 5
- 238000012545 processing Methods 0.000 claims description 5
- ROXBGBWUWZTYLZ-UHFFFAOYSA-N [6-[[10-formyl-5,14-dihydroxy-13-methyl-17-(5-oxo-2h-furan-3-yl)-2,3,4,6,7,8,9,11,12,15,16,17-dodecahydro-1h-cyclopenta[a]phenanthren-3-yl]oxy]-4-methoxy-2-methyloxan-3-yl] 4-[2-(4-azido-3-iodophenyl)ethylamino]-4-oxobutanoate Chemical compound O1C(C)C(OC(=O)CCC(=O)NCCC=2C=C(I)C(N=[N+]=[N-])=CC=2)C(OC)CC1OC(CC1(O)CCC2C3(O)CC4)CCC1(C=O)C2CCC3(C)C4C1=CC(=O)OC1 ROXBGBWUWZTYLZ-UHFFFAOYSA-N 0.000 claims description 3
- 238000004891 communication Methods 0.000 claims description 3
- 238000007405 data analysis Methods 0.000 claims description 3
- 238000012217 deletion Methods 0.000 claims description 3
- 230000037430 deletion Effects 0.000 claims description 3
- 238000011156 evaluation Methods 0.000 claims description 3
- 238000001914 filtration Methods 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims description 3
- 238000000034 method Methods 0.000 claims description 3
- 238000003032 molecular docking Methods 0.000 claims description 3
- 238000013468 resource allocation Methods 0.000 claims description 3
- 239000011435 rock Substances 0.000 claims description 3
- 238000012795 verification Methods 0.000 claims description 3
- 230000000007 visual effect Effects 0.000 claims description 3
- 230000006855 networking Effects 0.000 claims description 2
- 238000013461 design Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及异构算力平台技术领域,具体是一种基于标识解析的异构算力共享平台,包括算力资源层、标识解析层、算力调度层、平台支撑层以及运维管理层,所述算力资源层用于实现各所述算力集群的基础设施资源的统一纳管;所述标识解析层包括标识管理服务、标识解析服务、目录服务和可信认证服务;所述算力调度层用于实现对所述算力资源的管理和分配;所述平台支撑层用于提供统一业务服务支撑;所述运维管理层用于实现算力资源的统一管理。本平台能实现不同类型算力资源的有效管理和统一调度,能够为上层应用提供真实可信、开放共享的计算平台,保障数据在安全、稳定、有效的计算环境中运行和处理。
Description
技术领域
本发明涉及异构算力平台技术领域,尤其涉及一种基于标识解析的异构算力共享平台。
背景技术
异构计算(Heterogeneous Computing)是一种特殊形式的并行和分布式计算,它或是用能同时支持simd方式和mimd方式的单个独立计算机,或是用由高速网络互连的一组独立计算机来完成计算任务。它能协调地使用性能、结构各异的机器以满足不同的计算需求,并使代码(或代码段)能以获取最大总体性能方式来执行。
而随着人工智能的快速发展,数据处理对于CPU、GPU、NPU、TPU、FPGA等异构算力的需求日益增加,现有的平台存在着不能对不同类型算力资源的有效管理和统一调度的技术问题。
因此,亟需一种新的技术方案来解决上述技术问题。
发明内容
本发明的目的在于克服上述现有技术的问题,提供了一种基于标识解析的异构算力共享平台,用以解决现有的平台不能对不同类型算力资源的有效管理和统一调度的技术问题。
上述目的是通过以下技术方案来实现:
一种基于标识解析的异构算力共享平台,包括:
算力资源层,所述算力资源层包括若干算力集群,所述算力资源层用于实现各所述算力集群的基础设施资源的统一纳管;
标识解析层,所述标识解析层包括标识管理服务、标识解析服务、目录服务和可信认证服务,具体为:
所述标识管理服务用于为各所述算力集群及其计算节点提供域名及标识注册服务;
所述标识解析服务用于完成算力资源标识的网络资源分析指向请求,将编码标识映射到所属算力集群;
所述目录服务由各所述算力集群建设,负责记录和查询各计算节点的入口;
所述可信认证服务通过数字签名链的方法为算力信息提供数据不可篡改的保障;
算力调度层,所述算力调度层针对各类作业对计算资源的申请智能地匹配所述算力集群和所述计算节点,实现对所述算力资源的管理和分配;
平台支撑层,所述平台支撑层基于智能计算算法及数据处理、模型训练、模型推理智能计算工具实现高质量智能计算服务,通过开放接口、数据资源服务形式提供统一业务服务支撑;
运维管理层,所述运维管理层通过用户管理模块、业务管理模块、计费管理模块、日志管理模块、监控告警模块实现算力资源的统一管理。
进一步地,在所述算力资源层中,所述基础设施资源包括计算、存储、网络,由不同的硬件架构组成,包括CPU、GPU、FPGA和AISC类型。
进一步地,在所述在所述标识解析层中,工作流程包括:
步骤(1)各所述算力集群在所述标识管理服务中注册,并向各自的所述目录服务提交计算节点索引;同时,所述目录服务器向所述标识解析服务进行标识规则注册,申明新加入的标识由其提供目录服务;
步骤(2)各所述算力集群生成用于数字签名的密钥对,私有密钥对各计算节点的算力数据进行数字签名,公共密钥保存到所述解析服务中;通过提交接口将数字签名和密钥编号保存到所述可信认证服务中;
步骤(3)使用算力资源时,用户通过查询算力标识符向所述标识解析服务发送算力请求,所述标识解析服务将解析结果即所述目录服务的资源入口反馈给用户;
步骤(4)用户向所述目录服务发送查询请求,系统返回计算节点入口地址列表;
步骤(5)用户访问计算节点的域名,获得所需算力;
步骤(6)用户通过所述解析服务获得所述可信认证服务的访问入口,并通过该入口获取数字签名及密钥编号,根据密钥编号从所述解析服务获取实际公钥,对算力数据进行验签,从而判断是否数据的真实性。
进一步地,在所述算力调度层中,所述作业包括:
训练作业,用于根据算法需要的数据集、模型和资源配置,申请计算资源进行模型训练;
推理作业,用于将算法发布成可访问服务的作业功能;
notebook作业,用于在开发者调试阶段完成训练代码的调试工作;
可视化作业,用于AI作业运行时提供TensorBoard形式的展示;
工作流作业,包含多个运行任务,用于任务之间存在一定依赖关系的作业。
进一步地,所述算力调度层包括:
算力资源监控模块,所述算力资源监控模块负责监控各所述算力集群的资源使用情况,和记录所述算力资源变化情况;
算力资源图谱,所述算力资源图谱将不同的所述算力集群构建拓扑关系图,为控制调度引擎提供调度依据;
算力度量引擎,所述算力度量引擎对各所述算力集群的计算节点进行统一标准的算力评估;
调度策略,所述调度策略包括亲和性调度策略、优先级调度策略、公平调度策略、延迟调度策略、批调度策略、资源拓扑感知策略、抢占调度策略、负载感知调度策略和多集群组调度策略;
作业控制器:所述作业控制器用于监听各类作业的实时请求和状态变化信息,解析信息中命令、镜像、数据和资源变量,并根据这些变量执行作业创建、查询、更新、删除操作;
作业选择引擎,所述作业选择引擎用于决定作业调度的优先级;
控制调度引擎,所述控制调度引擎根据作业选择的结果调度,把调度请求广播出去,根据所述算力资源图谱把作业分配到匹配的算力集群,并把结果实时广播给所述算力资源监控模块;
作业调度引擎,所述作业调度引擎根据算力监控数据,决策出当前拥有空闲计算资源的节点,分析计算设备、存储、网络等物理资源信息,负责把作业调度到匹配的计算节点。
进一步地,所述作业调度引擎和所述控制调度引擎以广播-拉取-反馈的通信方式保证调度结果和资源信息实时同步的准确性。
进一步地,在作用调度时,根据内置调度策略或者用户自定义的调度策略对计算节点进行过滤、打分,并将作业优先调度到已经存在数据的计算节点。
进一步地,在所述运维管理层中:
所述用户管理模块用于对平台使用者的身份、账户进行管理、权限控制、配额信息管理、用户成员关系管理,实现用户的角色权限管理,控制用户对算力的使用范围,实现对算力资源的统一调配;
所述业务管理模块根据用户申请分配相应算力资源,支持报表数据导出、数据分析和对接;
所述计费管理模块用于对用户实现配额控制、实时计费、费用充值功能、;
所述日志管理模块用于对系统平台运行日志、用户登录操作日志进行记录,以及提供日志追溯、分析及告警功能;
所述监控告警模块用于实现针对算力资源、系统服务、业务虚拟机的统一监控告警,支持准实时、细粒度的监测项设置,支持自定义的阈值、告警通知设置,有效降低业务岩机风险。
有益效果
本发明所提供的一种基于标识解析的异构算力共享平台,通过建立异构算力统一标识和可溯源的算力管理架构,实现不同类型算力资源的有效管理和统一调度,能够为上层应用提供真实可信、开放共享的计算平台,保障数据在安全、稳定、有效的计算环境中运行和处理。
附图说明
图1为本发明所述一种基于标识解析的异构算力共享平台的框架图;
图2为本发明所述一种基于标识解析的异构算力共享平台中标识解析层中各模块的工作示意图。
具体实施方式
下面根据附图和实施例对本发明作进一步详细说明。所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
如图1所示,本方案提供了一种基于标识解析的异构算力共享平台,需要标准规范体系及信息安全体系贯穿始终,并可支持多样化的应用,如高性能计算、AI训练、AI推理、we服务、算法开发以及新兴的多场景业务融合应用等;本基于标识解析的异构算力共享平台包括:
算力资源层,所述算力资源层包括若干算力集群,所述算力资源层用于实现各所述算力集群的基础设施资源的统一纳管;
标识解析层,所述标识解析层包括标识管理服务、标识解析服务、目录服务和可信认证服务,具体为:
所述标识管理服务用于为各所述算力集群及其计算节点提供域名及标识注册服务;
所述标识解析服务用于完成算力资源标识的网络资源分析指向请求,将编码标识映射到所属算力集群;
所述目录服务由各所述算力集群建设,负责记录和查询各计算节点的入口;
所述可信认证服务通过数字签名链的方法为算力信息提供数据不可篡改的保障;
算力调度层,所述算力调度层针对各类作业对计算资源的申请智能地匹配所述算力集群和所述计算节点,实现对所述算力资源的管理和分配;
平台支撑层,所述平台支撑层面向设计仿真、生物医药、气象预报、能源勘探、芯片设计等不同智能计算场景应用需求,基于智能计算算法及数据处理、模型训练、模型推理等智能计算工具实现高质量智能计算服务,通过开放接口、数据资源服务等形式提供统一业务服务支撑;
运维管理层,所述运维管理层通过用户管理模块、业务管理模块、计费管理模块、日志管理模块、监控告警模块等实现算力资源的统一管理。
本实施例在所述算力资源层中,所述基础设施资源包括计算、存储、网络等,由不同的硬件架构组成,通常包括CPU、GPU、FPGA和AISC等类型;
具体的,所述CPU主要有X86和ARM;所述GPU主要是快速实现矢量的图形化数据处理的专有架构;所述FPGA作为可编程逻辑门电路在硬件加速等方面具有优势,所述ASIC是面向特定用户需求设计的定制芯片,如TPU、DPU、NPU等。
如图2所示,本实施例在所述在所述标识解析层中,工作流程包括:
步骤(1)各所述算力集群在所述标识管理服务中注册,并向各自的所述目录服务提交计算节点索引;同时,所述目录服务器向所述标识解析服务进行标识规则注册,申明新加入的标识由其提供目录服务。此外,可信第三方需要将其可信认证服务的访问入口更新到解析服务的服务资源列表中;
步骤(2)各所述算力集群生成用于数字签名的密钥对,私有密钥对各计算节点的算力数据进行数字签名,公共密钥保存到所述解析服务中;通过提交接口将数字签名和密钥编号保存到所述可信认证服务中;
步骤(3)使用算力资源时,用户通过查询算力标识符向所述标识解析服务发送算力请求,所述标识解析服务将解析结果即所述目录服务的资源入口反馈给用户;
步骤(4)用户向所述目录服务发送查询请求,系统返回计算节点入口地址列表;
步骤(5)用户访问计算节点的域名,获得所需算力;
步骤(6)用户通过所述解析服务获得所述可信认证服务的访问入口,并通过该入口获取数字签名及密钥编号,根据密钥编号从所述解析服务获取实际公钥,对算力数据进行验签,从而判断是否数据的真实性。
本实施例在所述算力调度层中,所述作业包括:
训练作业,用于根据算法需要的数据集、模型和资源配置,申请计算资源进行模型训练;
推理作业,用于将算法发布成可访问服务的作业功能;
notebook作业,用于在开发者调试阶段完成训练代码的调试工作;
可视化作业,用于AI作业运行时提供TensorBoard形式的展示;
工作流作业,包含多个运行任务,用于任务之间存在一定依赖关系的作业。
本实施例中所述算力调度层包括:
算力资源监控模块,所述算力资源监控模块负责监控各所述算力集群的CPU、GPU、内存、磁盘、网络等资源使用情况,和记录所述算力资源变化情况;
算力资源图谱,所述算力资源图谱将不同的所述算力集群按访问能力、可支持的计算作业类型等维度构建拓扑关系图,为控制调度引擎提供调度依据;
算力度量引擎,所述算力度量引擎对各所述算力集群的计算节点进行统一标准的算力评估;
调度策略,所述调度策略包括亲和性调度策略、优先级调度策略、公平调度策略、延迟调度策略、批调度策略、资源拓扑感知策略、抢占调度策略、负载感知调度策略和多集群组调度策略等;
作业控制器:所述作业控制器用于监听各类作业的实时请求和状态变化信息,解析信息中命令、镜像、数据和资源变量,并根据这些变量执行作业创建、查询、更新、删除等操作;
作业选择引擎,所述作业选择引擎用于决定作业调度的优先级。默认的排序算法根据作业的优先级和作业进入队列的时间基于堆排序实现。用户也可以根据业务场景实现其他更高级的排序算法来支持其他优先级策略;
控制调度引擎,所述控制调度引擎根据作业选择的结果调度,把调度请求广播出去,根据所述算力资源图谱把作业分配到匹配的算力集群,并把结果实时广播给所述算力资源监控模块;
作业调度引擎,所述作业调度引擎根据算力监控数据,决策出当前拥有空闲计算资源的节点,分析计算设备、存储、网络等物理资源信息,负责把作业调度到匹配的计算节点。
其中,所述作业调度引擎和所述控制调度引擎以广播-拉取-反馈的通信方式保证调度结果和资源信息实时同步的准确性。
并在作用调度时,根据内置调度策略或者用户自定义的调度策略对计算节点进行过滤、打分,并将作业优先调度到已经存在数据的计算节点。
本实施例在所述运维管理层中:
所述用户管理模块主要用于对平台使用者的身份、账户进行管理(包括增加、删除、修改、查询)、权限控制、配额信息管理、用户成员关系管理等;平台将系统用户共划分四种角色类型,分别为普通用户、团队管理员、团队普通用户、系统管理员。通过用户管理实现用户的角色权限管理,控制用户对算力的使用范围,实现对算力资源的统一调配;
所述业务管理模块根据用户申请分配相应算力资源,支持报表数据导出、数据分析和对接等;实现在分配的算力集群上进行启动、执行和监视,助力用户便捷管理平台资源与服务;
所述计费管理模块用于对用户实现配额控制、实时计费、费用充值等功能、;
所述日志管理模块用于对系统平台运行日志、用户登录操作日志等进行记录,以及提供日志追溯、分析及告警等功能;
所述监控告警模块用于实现针对算力资源、系统服务、业务虚拟机等的统一监控告警,支持准实时、细粒度的监测项设置,支持自定义的阈值、告警通知设置,有效降低业务岩机风险。
以上所述仅为说明本发明的实施方式,并不用于限制本发明,对于本领域的技术人员来说,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (8)
1.一种基于标识解析的异构算力共享平台,其特征在于,包括:
算力资源层,所述算力资源层包括若干算力集群,所述算力资源层用于实现各所述算力集群的基础设施资源的统一纳管;
标识解析层,所述标识解析层包括标识管理服务、标识解析服务、目录服务和可信认证服务,具体为:
所述标识管理服务用于为各所述算力集群及其计算节点提供域名及标识注册服务;
所述标识解析服务用于完成算力资源标识的网络资源分析指向请求,将编码标识映射到所属算力集群;
所述目录服务由各所述算力集群建设,负责记录和查询各计算节点的入口;
所述可信认证服务通过数字签名链的方法为算力信息提供数据不可篡改的保障;
算力调度层,所述算力调度层针对各类作业对计算资源的申请智能地匹配所述算力集群和所述计算节点,实现对所述算力资源的管理和分配;
平台支撑层,所述平台支撑层基于智能计算算法及数据处理、模型训练、模型推理智能计算工具实现高质量智能计算服务,通过开放接口、数据资源服务形式提供统一业务服务支撑;
运维管理层,所述运维管理层通过用户管理模块、业务管理模块、计费管理模块、日志管理模块、监控告警模块实现算力资源的统一管理。
2.根据权利要求1所述的一种基于标识解析的异构算力共享平台,其特征在于,在所述算力资源层中,所述基础设施资源包括计算、存储、网络,由不同的硬件架构组成,包括CPU、GPU、FPGA和AISC类型。
3.根据权利要求1所述的一种基于标识解析的异构算力共享平台,其特征在于,在所述在所述标识解析层中,工作流程包括:
步骤(1)各所述算力集群在所述标识管理服务中注册,并向各自的所述目录服务提交计算节点索引;同时,所述目录服务器向所述标识解析服务进行标识规则注册,申明新加入的标识由其提供目录服务;
步骤(2)各所述算力集群生成用于数字签名的密钥对,私有密钥对各计算节点的算力数据进行数字签名,公共密钥保存到所述解析服务中;通过提交接口将数字签名和密钥编号保存到所述可信认证服务中;
步骤(3)使用算力资源时,用户通过查询算力标识符向所述标识解析服务发送算力请求,所述标识解析服务将解析结果即所述目录服务的资源入口反馈给用户;
步骤(4)用户向所述目录服务发送查询请求,系统返回计算节点入口地址列表;
步骤(5)用户访问计算节点的域名,获得所需算力;
步骤(6)用户通过所述解析服务获得所述可信认证服务的访问入口,并通过该入口获取数字签名及密钥编号,根据密钥编号从所述解析服务获取实际公钥,对算力数据进行验签,从而判断是否数据的真实性。
4.根据权利要求3所述的一种基于标识解析的异构算力共享平台,其特征在于,在所述算力调度层中,所述作业包括:
训练作业,用于根据算法需要的数据集、模型和资源配置,申请计算资源进行模型训练;
推理作业,用于将算法发布成可访问服务的作业功能;
notebook作业,用于在开发者调试阶段完成训练代码的调试工作;
可视化作业,用于AI作业运行时提供TensorBoard形式的展示;
工作流作业,包含多个运行任务,用于任务之间存在一定依赖关系的作业。
5.根据权利要求1所述的一种基于标识解析的异构算力共享平台,其特征在于,所述算力调度层包括:
算力资源监控模块,所述算力资源监控模块负责监控各所述算力集群的资源使用情况,和记录所述算力资源变化情况;
算力资源图谱,所述算力资源图谱将不同的所述算力集群构建拓扑关系图,为控制调度引擎提供调度依据;
算力度量引擎,所述算力度量引擎对各所述算力集群的计算节点进行统一标准的算力评估;
调度策略,所述调度策略包括亲和性调度策略、优先级调度策略、公平调度策略、延迟调度策略、批调度策略、资源拓扑感知策略、抢占调度策略、负载感知调度策略和多集群组调度策略;
作业控制器:所述作业控制器用于监听各类作业的实时请求和状态变化信息,解析信息中命令、镜像、数据和资源变量,并根据这些变量执行作业创建、查询、更新、删除操作;
作业选择引擎,所述作业选择引擎用于决定作业调度的优先级;
控制调度引擎,所述控制调度引擎根据作业选择的结果调度,把调度请求广播出去,根据所述算力资源图谱把作业分配到匹配的算力集群,并把结果实时广播给所述算力资源监控模块;
作业调度引擎,所述作业调度引擎根据算力监控数据,决策出当前拥有空闲计算资源的节点,分析计算设备、存储、网络等物理资源信息,负责把作业调度到匹配的计算节点。
6.根据权利要求4所述的一种基于标识解析的异构算力共享平台,其特征在于,所述作业调度引擎和所述控制调度引擎以广播-拉取-反馈的通信方式保证调度结果和资源信息实时同步的准确性。
7.根据权利要求4所述的一种基于标识解析的异构算力共享平台,其特征在于,在作用调度时,根据内置调度策略或者用户自定义的调度策略对计算节点进行过滤、打分,并将作业优先调度到已经存在数据的计算节点。
8.根据权利要求1所述的一种基于标识解析的异构算力共享平台,其特征在于,在所述运维管理层中:
所述用户管理模块用于对平台使用者的身份、账户进行管理、权限控制、配额信息管理、用户成员关系管理,实现用户的角色权限管理,控制用户对算力的使用范围,实现对算力资源的统一调配;
所述业务管理模块根据用户申请分配相应算力资源,支持报表数据导出、数据分析和对接;
所述计费管理模块用于对用户实现配额控制、实时计费、费用充值功能;
所述日志管理模块用于对系统平台运行日志、用户登录操作日志进行记录,以及提供日志追溯、分析及告警功能;
所述监控告警模块用于实现针对算力资源、系统服务、业务虚拟机的统一监控告警,支持准实时、细粒度的监测项设置,支持自定义的阈值、告警通知设置,有效降低业务岩机风险。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410053605.0A CN117971467A (zh) | 2024-01-15 | 2024-01-15 | 一种基于标识解析的异构算力共享平台 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410053605.0A CN117971467A (zh) | 2024-01-15 | 2024-01-15 | 一种基于标识解析的异构算力共享平台 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117971467A true CN117971467A (zh) | 2024-05-03 |
Family
ID=90852449
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410053605.0A Pending CN117971467A (zh) | 2024-01-15 | 2024-01-15 | 一种基于标识解析的异构算力共享平台 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117971467A (zh) |
-
2024
- 2024-01-15 CN CN202410053605.0A patent/CN117971467A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Huang et al. | Stochastic configuration networks based adaptive storage replica management for power big data processing | |
Shu et al. | A novel energy-efficient resource allocation algorithm based on immune clonal optimization for green cloud computing | |
US7185046B2 (en) | Submitting jobs in a distributed computing environment | |
US10970649B2 (en) | Automated reinforcement-learning-based application manager that uses local agents | |
CN104461740A (zh) | 一种跨域集群计算资源聚合和分配的方法 | |
CN102917006B (zh) | 一种实现计算资源和对象权限的统一控制管理方法及装置 | |
CN101715001A (zh) | 一种控制网格任务执行的方法 | |
Zolfaghari et al. | Application of virtual machine consolidation in cloud computing systems | |
Fan et al. | Intelligent resource scheduling based on locality principle in data center networks | |
Fernández-Cerero et al. | Sphere: Simulator of edge infrastructures for the optimization of performance and resources energy consumption | |
Guo et al. | Energy-efficient fault-tolerant scheduling algorithm for real-time tasks in cloud-based 5G networks | |
Li et al. | Performance optimization of computing task scheduling based on the Hadoop big data platform | |
Wang et al. | Gmpr: a two-phase heuristic algorithm for virtual machine placement in large-scale cloud data centers | |
Liu et al. | KubFBS: A fine‐grained and balance‐aware scheduling system for deep learning tasks based on kubernetes | |
CN113515341A (zh) | 一种灵活的分布式ai训练云平台部署方法及相关平台 | |
CN117971467A (zh) | 一种基于标识解析的异构算力共享平台 | |
KR100609459B1 (ko) | 피투피 방식의 병렬 분산처리시스템 및 방법 | |
Zhang et al. | Repeatable multi-dimensional virtual network embedding in cloud service platform | |
Ala’anzy et al. | Mapping and Consolidation of VMs Using Locust-Inspired Algorithms for Green Cloud Computing | |
Tang et al. | Edge computing energy-efficient resource scheduling based on deep reinforcement learning and imitation learning | |
Kollu et al. | Energy-aware multi-objective differential evolution in cloud computing | |
Xuning et al. | Research of campus resource management based on cloud computing | |
US20230176913A1 (en) | Cross-domain cabin computing system and method based on data resource distribution | |
CN108537429A (zh) | 基于云计算的电能质量智能监测系统 | |
Sabri | A Cutting-Edge Data Mining Approach for Dynamic Data Replication That also Involves the Preventative Deletion of Data Centres That are Not Compatible with One Other |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination |