CN116107727B - 一种基于混合内核架构的算力网络操作系统及电子设备 - Google Patents

一种基于混合内核架构的算力网络操作系统及电子设备 Download PDF

Info

Publication number
CN116107727B
CN116107727B CN202310389973.8A CN202310389973A CN116107727B CN 116107727 B CN116107727 B CN 116107727B CN 202310389973 A CN202310389973 A CN 202310389973A CN 116107727 B CN116107727 B CN 116107727B
Authority
CN
China
Prior art keywords
plug
computing power
service
power network
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310389973.8A
Other languages
English (en)
Other versions
CN116107727A (zh
Inventor
仇树卿
崔洪志
沈林江
崔超
许俊东
耿晓巧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Communication Information System Co Ltd
Original Assignee
Inspur Communication Information System Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Communication Information System Co Ltd filed Critical Inspur Communication Information System Co Ltd
Priority to CN202310389973.8A priority Critical patent/CN116107727B/zh
Publication of CN116107727A publication Critical patent/CN116107727A/zh
Application granted granted Critical
Publication of CN116107727B publication Critical patent/CN116107727B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • G06F9/4806Task transfer initiation or dispatching
    • G06F9/4843Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/30Creation or generation of source code
    • G06F8/36Software reuse
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/445Program loading or initiating
    • G06F9/44521Dynamic linking or loading; Link editing at or after load time, e.g. Java class loading
    • G06F9/44526Plug-ins; Add-ons
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • G06F9/5055Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering software capabilities, i.e. software resources associated or available to the machine
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Abstract

本发明提供一种基于混合内核架构的算力网络操作系统及电子设备,属于算力网络技术领域。该操作系统包括内核层和外核层,内核层包括实现算力网络业务的感知、分析、决策、调度的内核功能模块;外核层包括提供算力网络资源的发布、共享、交易服务,算力网络资源的运营运维管理服务,算力网络场景应用的开发支撑服务的第一外核插件,以及围绕算力网络跨组织、安全可信提供协同能力,围绕算力网络的计算、存储、数据、服务、应用提供适配调度能力的第二外核插件;内核层与外核层之间采用插件管理模式进行通信交互。解决算网多维度异构资源自由化适配、多要素并行任务融合化调度的问题。混合内核的架构保证操作系统的高性能,避免系统耦合度过高。

Description

一种基于混合内核架构的算力网络操作系统及电子设备
技术领域
本发明涉及算力网络技术领域,尤其涉及一种基于混合内核架构的算力网络操作系统及电子设备。
背景技术
算力网络是我国信息通信产业提出的原创性理念,是落实国家“东数西算”战略要求,将“网、云、数、智、安、边、端、链”技术深度融合,提供一体服务,实现从以网络为核心的信息交换到以算力为核心的信息数据处理,是智能化综合性新型信息基础设施的关键部分。众所周知,“网、云、数、智、安、边、端、链”技术中的每一类要素都是由不同厂家、不同设备类型、不同业务场景组织构成的,同时还存在着兼顾既有设备与新上线设备等多样化形态,因此实现技术的深度融合以及对外一体化服务提供存在重重困难,亟需一套新的系统化软件去解决融合、协同、一体化问题。
当前算力网络处于孵化期,现有技术主要利用既有的平台技术与其他产品进行接口对接的方式实现流程打通,但是无法从根本上解决跨区域、跨行业、跨用户算力资源的调度调配需求。
发明内容
本发明提供一种基于混合内核架构的算力网络操作系统及电子设备,用以解决现有技术中无法从根本上解决跨区域、跨行业、跨用户算力资源的调度调配需求的缺陷,实现算力网络在运营管理过程中,算网多维度异构资源自由化适配、算网多要素并行任务融合化调度。
本发明提供一种基于混合内核架构的算力网络操作系统,包括内核层和外核层;
所述内核层包括实现算力网络业务的感知、分析、决策、调度的内核功能模块;
所述外核层包括提供算力网络资源的发布、共享、交易服务,算力网络资源的运营运维管理服务,算力网络场景应用的开发支撑服务的第一外核插件,以及围绕算力网络跨组织、安全可信提供协同能力,围绕算力网络的计算、存储、数据、服务、应用提供适配调度能力的第二外核插件;
所述内核层与外核层之间采用插件管理模式进行通信交互,以实现算力网络的运营管理。
根据本发明提供的一种基于混合内核架构的算力网络操作系统,所述插件管理模式包括:
插件管理方式,用于基于插件注册表机制,通过注册、注销、更新方式实现插件的基础管理;
插件连接方式,用于对插件连接到所述内核层的内核功能模块对应制定不同的连接规范和连接机制;
插件通信方式,用于在实现算力网络业务的过程中,基于所述算力网络业务所需的插件提供对应的消息通道能力。
根据本发明提供的一种基于混合内核架构的算力网络操作系统,所述内核功能模块包括:
感知中枢模块,用于向所述第二外核插件提供资源感知服务、性能感知服务、告警感知服务、业务感知服务;
编排中枢模块,用于向所述第一外核插件和所述第二外核插件提供产品设计服务、能力设计服务、运营运维编排服务;
安全能力中心模块,用于处理所述内核层和所述外核层的安全防护问题;
实训能力中心模块,用于对算力网络业务提供数字化仿真能力,支撑算力网络业务的自动化管理;
配置能力中心模块,用于提供系统级账号配置、基础信息配置、用户角色权限配置、算力网络业务配置;
调度能力中心模块,用于提供算力网络资源调度、任务调度、业务调度;
评估能力中心模块,用于提供业务健康度评估、业务发展预测、关键规则校验。
根据本发明提供的一种基于混合内核架构的算力网络操作系统,所述第一外核插件包括:
共享交易中心插件,用于面向算力网络开放者提供共享交易服务,所述共享交易服务包括算力发布、算力申请、算力交易大厅;
开发者中心插件,用于面向算力网络开发者提供开发者服务,所述开发者服务包括DevOps工具支持、AI算法包集成;
服务中心插件,用于面向算力网络管理者提供管理服务,所述管理服务包括运行检测、任务审核、异常处置、报告发布。
根据本发明提供的一种基于混合内核架构的算力网络操作系统,所述第二外核插件包括:
计算使能插件,用于对公有云数据中心、私有云数据中心、网络云数据中心、超算中心、智算中心、家庭算力、个人算力进行计算使能管理,所述计算使能管理包括计算数据采集、基础维护管理、业务自动配置以及控制调度;
组织使能插件,用于对跨组织、跨行业、跨区域的多组织进行互信与连接,实现角色、权限的融合与统一;
数据使能插件,用于对对象存储数据进行数据生命周期管理,所述数据生命周期管理包括数据远程传送、数据服务目录提供;
安全使能插件,用于对安全隔离与信息交换系统、安全防护系统进行信息与规则数据的采集与交换,形成所述内核层与所述外核层的安全数据交互管理;
服务使能插件,用于对运行在算力网络领域中的服务提供服务注册、服务熔断、服务管理的能力;
应用使能插件,用于对运行在算力网络领域中的应用进行应用托管,所述应用托管包括应用部署、应用升级、应用下线;
网络使能插件,用于对无线网、传输网、数据网、交换网、核心网进行网络使能管理,所述网络使能管理包括网络数据采集、基础维护管理、业务自动配置以及控制调度。
根据本发明提供的一种基于混合内核架构的算力网络操作系统,所述感知中枢模块具体用于:
与所述第二外核插件连接时,实时动态采集所述第二外核插件运行中的资源、性能、告警、业务日志。
根据本发明提供的一种基于混合内核架构的算力网络操作系统,所述感知中枢模块还具体用于:
向所述编排中枢模块提供分析决策能力,以帮助所述编排中枢模块根据需求动态分配调度资源;
通过所述安全能力中心模块获取连接、调用所述第二外核插件的权限,对采集到的数据根据权限范围进行隔离与控制;
通过所述实训能力中心模块实现感知处理的规则设计,通过加载业务模型与规则实现算力网络业务的升级与管理,以使感知运行态势不中断;
向所述评估能力中心模块提供历史运行数据,以供所述评估能力中心模块进行运行态势挖掘与分析。
根据本发明提供的一种基于混合内核架构的算力网络操作系统,所述编排中枢模块具体用于:
获取所述第二外核插件开放的可编排的API能力,基于所述API能力进行管理、设计编排,生成运营运维的模板文件;
获取所述第一外核插件下发的与算力网络相关的资源需求,对所述资源需求进行拆解、匹配、归类处理。
根据本发明提供的一种基于混合内核架构的算力网络操作系统,所述编排中枢模块还具体用于:
在所述编排中枢模块执行任务时,获取所述实训能力中心模块提供对应的编排规则策略,基于所述编排规则策略提供所述运营运维编排服务;
在所述编排中枢模块执行任务时,将请求任务的对象的信息发送至所述安全能力中心模块,以使所述安全能力中心模块向所述对象提供实时的能力分级安全控制以及需求响应安全控制;
将运行中产生的记录数据发送至所述评估能力中心模块进行备份同步,以使所述评估能力中心模块进行实时分析。
本发明还提供一种电子设备,包括如上述任一种所述的基于混合内核架构的算力网络操作系统。
本发明提供的一种基于混合内核架构的算力网络操作系统及电子设备,通过采用混合内核架构的方式实现算力网络领域的资源统一管理与分配,内核层包括了算力网络管理过程中共性通用且稳定性比较强的实现算力网络业务的感知、分析、决策、调度的内核功能模块,外核层包括了提供算力网络资源的发布、共享、交易服务,算力网络资源的运营运维管理服务,算力网络场景应用的开发支撑服务的第一外核插件,以及围绕算力网络跨组织、安全可信提供协同能力,围绕算力网络的计算、存储、数据、服务、应用提供适配调度能力的第二外核插件,内核层与外核层通过插件实现通信交互,具有即插即用的特征,从而解决算力网络在运营管理过程中,算网多维度异构资源自由化适配、算网多要素并行任务融合化调度的问题,解决跨区域、跨行业、跨用户算力资源的调度调配需求。此外,混合内核的架构保证了算力网络操作系统的高性能,避免系统耦合度过高。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的一种基于混合内核架构的算力网络操作系统的架构原理示意图;
图2是本发明提供的一种基于混合内核架构的算力网络操作系统的结构示意图;
图3是本发明提供的感知中枢模块与其他内核功能模块、外核插件之间的关系示意图;
图4是本发明提供的编排中枢模块与其他内核功能模块、外核插件之间的关系示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面结合图1-图4描述本发明的一种基于混合内核架构的算力网络操作系统及电子设备。
如图1所示,为本发明提供的一种基于混合内核架构的算力网络操作系统的架构原理示意图。该算力网络操作系统包括内核层和外核层,内核层与外核层之间采用插件管理模式进行通信交互,以实现算力网络的运营管理。
具体地,可以选取算力网络管理过程中共性通用的且稳定性比较强的功能模块作为内核层的组件;选取算力网络管理过程中频繁升级、个性化适配甚至现有软件功能模块升级的组件为外核层的组件;算力网络操作系统采用插件管理模式实现内核层、外核层之间的通信交互。
在本发明提供的算力网络操作系统中,内核层包括实现算力网络业务的感知、分析、决策、调度的内核功能模块;外核层包括提供算力网络资源的发布、共享、交易服务,算力网络资源的运营运维管理服务,算力网络场景应用的开发支撑服务的第一外核插件,以及围绕算力网络跨组织、安全可信提供协同能力,围绕算力网络的计算、存储、数据、服务、应用提供适配调度能力的第二外核插件。
本发明提供的一种基于混合内核架构的算力网络操作系统,通过采用混合内核架构的方式实现算力网络领域的资源统一管理与分配,内核层包括了算力网络管理过程中共性通用且稳定性比较强的实现算力网络业务的感知、分析、决策、调度的内核功能模块,外核层包括了提供算力网络资源的发布、共享、交易服务,算力网络资源的运营运维管理服务,算力网络场景应用的开发支撑服务的第一外核插件,以及围绕算力网络跨组织、安全可信提供协同能力,围绕算力网络的计算、存储、数据、服务、应用提供适配调度能力的第二外核插件,内核层与外核层通过插件实现通信交互,具有即插即用的特征,从而解决算力网络在运营管理过程中,算网多维度异构资源自由化适配、算网多要素并行任务融合化调度的问题,解决跨区域、跨行业、跨用户算力资源的调度调配需求,实现对算力网络多要素资源的插件式管理以及合理化分配调度。此外,混合内核的架构保证了算力网络操作系统的高性能,避免系统耦合度过高。
可以理解的是,本发明的算力网络操作系统支持的业务场景能力主要包括以下六方面需求:第一方面,围绕算力网络资源的发布、共享、交易;第二方面,围绕算力网络资源的运营运维管理服务;第三方面,围绕算力网络场景应用的开发支撑;第四方面,围绕算力网络跨组织、安全可信提供协同能力;第五方面,围绕算力网络计算、存储、数据、服务、应用等算网对象提供适配调度能力;第六方面,围绕从算力网络业务的感知、分析、决策、调度提供的闭环管理能力。
本发明采用混合内核架构设计可以实现跨区域、跨行业、跨主体的资源灵活调度与分配,以灵活插件模式实现算力网络运营管理目标,操作系统的外核层选用频繁升级、定制化开发较多的组件作为外核关键能力,外核关键能力更多是用于在不同区域、不同客户在部署过程中的适配模式,可以解决现有软件功能的复用,可以减少信息系统在建设过程中的资源重复投入、降低多形态主体参与建设管理的复杂度,从而提升算力网络建设工程的实施效率。
如图1所示,图1中的图例1、2、3分别表示插件管理模式中的三种方式,具体地,图例1表示插件连接方式、图例2表示插件通信方式、图例3表示插件管理方式。在一个实施例中,内核层与外核层之间的通信交互采用插件管理模式,插件具备插件管理、插件连接、插件通信基础能力,即插件管理模式具体包括以下三种:
(1)插件管理方式,用于基于插件注册表机制,通过注册、注销、更新方式实现插件的基础管理。
具体地,插件管理方式具备插件注册表机制,对于外核需要适配的插件,通过注册、注销、更新方式实现插件基础管理,管理内容包括名字、位置、加载时机(按需或静态绑定),操作系统的内核层在需要对不同类别的插件进行分类管理,如计算类插件管理、网络类插件管理等。
(2)插件连接方式,用于对插件连接到所述内核层的内核功能模块对应制定不同的连接规范和连接机制。
具体地,插件连接到算力网络操作系统的内核层,内核层的内核功能模块如感知中枢模块、编排中枢模块、配置能力中心模块、调度能力中心模块会制定不同的连接规范和连接机制,如采用消息队列、restAPI(Representational State Transfer,表征性状态转移;Application Programming Interface,应用程序编程接口)、数据库、依赖注入、分布式协议RPC(Remote Procedure Call,远程过程调用协议)等。
(3)插件通信方式,用于在实现算力网络业务的过程中,基于所述算力网络业务所需的插件提供对应的消息通道能力。
具体地,在实现算力网络的某个业务场景的过程中,需要多个插件配合才能完成,插件通信提供多个插件的消息通道能力,此能力是由算力网络操作系统的内核功能模块完成。
通过上述插件管理模式,可以使得不同厂商、不同连接规范和连接机制的插件可与本发明的算力网络操作系统的内核层进行通信交互,以使现有软件功能的插件可进行复用。
图2为本发明提供的一种基于混合内核架构的算力网络操作系统的结构示意图。混合内核架构设计模式下的算力网络操作系统以“2357”技术体系构成。其中,内核层主要由两大中枢与五项能力中心组成,“2”包括感知中枢、编排中枢,“5”包括安全能力中心、实训能力中心、配置能力中心、调度能力中心、评估能力中心。外核层主要由三类门户与七种使能组成,“3”包括共享交易中心、开发者中心、服务中心,“7”包括计算使能、组织使能、数据使能、安全使能、服务使能、应用使能、网络使能。
如图2所示,该算力网络操作系统的内核层的内核功能模块包括:感知中枢模块、编排中枢模块、安全能力中心模块、实训能力中心模块、配置能力中心模块、调度能力中心模块以及评估能力中心模块。其中:
算力网络操作系统内核层的两大中枢:
(1)感知中枢模块,用于向所述第二外核插件(即7种使能插件)提供资源感知服务、性能感知服务、告警感知服务、业务感知服务。
(2)编排中枢模块,用于向所述第一外核插件和所述第二外核插件(即3类门户插件、7种使能插件)提供产品设计服务、能力设计服务、运营运维编排服务。
算力网络操作系统内核层的五项能力:
(1)安全能力中心模块,用于处理所述内核层和所述外核层的安全防护问题。
具体地,安全能力作为算力网络操作系统的核心能力,安全能力中心主要解决操作系统的内核层中运行的内核功能模块和外核插件的安全防护问题。当多样化算力、网络以及多组织角色联合参与内核运行过程中,需要构建一套永不信任、持续验证、应急防护的安全能力,因此,安全能力中心采用零信任机制,对注册到内核层的插件进行实时安全验证。
(2)实训能力中心模块,用于对算力网络业务提供数字化仿真能力,支撑算力网络业务的自动化管理。
具体地,对于算力网络业务具备数字化仿真能力,同时在仿真能力基础上沟通规则设计引擎,算力网络用户可以在实训能力中心的基础上进行业务设计、模拟演练,并将正确的仿真结果同步到编排中枢、感知中枢、调度能力中心、配置能力中心,支撑业务的自动化管理。
(3)配置能力中心模块,用于提供系统级账号配置、基础信息配置、用户角色权限配置、算力网络业务配置。
具体地,配置能力中心支持具备系统级账号配置、基础信息配置、用户角色权限配置、算力网络业务配置等。
(4)调度能力中心模块,用于提供算力网络资源调度、任务调度、业务调度。
具体地,调度能力中心支持三类调度场景:一、资源调度,对物理机、容器、虚拟器、网络、存储等算力网络资源进行调度;二、任务调度,对跨部门、跨组织、跨区域不同组织之间构建面向人员的任务调度;三、业务调度,构建在资源调度、任务调度基础上的新调度,包括FaaS(Function as a Service,函数即服务)云边端调度、东数西存业务调度等。
(5)评估能力中心模块,用于提供业务健康度评估、业务发展预测、关键规则校验。
具体地,编排中枢、感知中枢等产生的运行数据可以实时或者定时同步到评估能力中心,通过评估能力中心进行业务健康度评估、业务发展预测、关键规则校验等。
如图2所示,该算力网络操作系统的外核层的第一外核插件包括:共享交易中心插件、开发者中心插件、服务中心插件;第二外核插件包括:计算使能插件、组织使能插件、数据使能插件、安全使能插件、服务使能插件、应用使能插件、网络使能插件。其中:
算力网络操作系统外核层的三类门户:
(1)共享交易中心插件,用于面向算力网络开放者提供共享交易服务,具体地,共享交易服务包括算力发布、算力申请、算力交易大厅。
(2)开发者中心插件,用于面向算力网络开发者提供开发者服务,具体地,开发者服务包括DevOps(Development&Operations,开发与运营维护)工具支持、AI(ArtificialIntelligence,人工智能)算法包集成。
(3)服务中心插件,用于面向算力网络管理者提供管理服务,具体地,管理服务包括运行检测、任务审核、异常处置、报告发布。
算力网络操作系统外核层的七种使能:
(1)计算使能插件,用于对公有云数据中心、私有云数据中心、网络云数据中心、超算中心、智算中心、家庭算力、个人算力进行计算使能管理,具体地,计算使能管理包括计算数据采集、基础维护管理、业务自动配置以及控制调度。
(2)组织使能插件,用于对跨组织、跨行业、跨区域的多组织进行互信与连接,实现角色、权限的融合与统一。
(3)数据使能插件,用于对对象存储数据进行数据生命周期管理,具体地,数据生命周期管理包括数据远程传送、数据服务目录提供等内容。
(4)安全使能插件,用于对安全隔离与信息交换系统、安全防护系统进行信息与规则数据的采集与交换,形成内核层与外核层的安全数据交互管理。
(5)服务使能插件,用于对运行在算力网络领域中的服务提供服务注册、服务熔断、服务管理的能力。
(6)应用使能插件,用于对运行在算力网络领域中的应用进行应用托管,具体地,应用托管包括应用部署、应用升级、应用下线等内容。
(7)网络使能插件,用于对无线网、传输网、数据网、交换网、核心网等各专业网络进行网络使能管理,具体地,网络使能管理包括网络数据采集、基础维护管理、业务自动配置以及控制调度。
如图3所示,为本发明提供的感知中枢模块与其他内核功能模块、外核插件之间的关系示意图。针对算力网络相关资源发生调整、故障、隐患时,感知中枢能够具备对算力网络业务实时、动态感知业务能力,动态感知业务能力具体包括资源动态感知、告警动态感知、性能动态感知、业务动态感知等。具体地:
(1)感知中枢模块与第二外核插件(计算使能插件、网络使能插件、数据使能插件、组织使能插件、安全使能插件、应用使能插件、服务使能插件)连接时,实时、动态采集第二外核插件运行中的资源、性能、告警、业务日志。
(2)感知中枢模块向编排中枢模块提供智能化的分析决策能力,即向编排中枢模块提供分析决策依据,以帮助编排中枢模块根据需求动态分配调度资源,例如资源分布、资源延迟、设备健康度、云资源池重大故障、异常隐患发布等。
(3)感知中枢模块通过安全能力中心模块获取连接、调用第二外核插件的权限,即连接信任,同时对采集到的数据根据权限范围进行隔离与控制,即资源限制。
(4)实训能力中心模块提供感知规则策略,感知中枢模块通过实训能力中心模块实现感知处理的规则设计,通过加载业务模型与规则实现算力网络业务的敏捷升级与灵活管理,保证感知运行态势不中断。
(5)感知中枢模块向评估能力中心模块提供历史运行数据,以供评估能力中心模块进行运行态势挖掘与分析。
如图4所示,为本发明提供的编排中枢模块与其他内核功能模块、外核插件之间的关系示意图。通过编排中枢模块可以实现面向算力网络能力以及产品的设计、编排,其核心目标是完成外核插件之间的消息通信。编排中枢模块的基本功能包括:算力网络能力设计、算力网络产品设计、算力网络运营编排、算力网络运维编排。具体地:
(1)编排中枢模块获取第二外核插件(即7种使能插件)开放的可编排的API(Application Programming Interface,应用程序编程接口)能力,编排中枢模块通过对API能力进行管理、设计编排,生成运营运维的模板文件。
(2)编排中枢模块获取第一外核插件(开发者中心、服务中心、共享交易中心)下发的与算力网络相关的资源需求,通过算力网络运营编排、算力网络运维编排功能对资源需求进行拆解、匹配、归类处理,即需求驱动。
(3)在编排中枢模块执行任务时,获取实训能力中心模块提供对应的编排规则策略,基于编排规则策略提供所述运营运维编排服务。具体地,编排规则策略可以只提供明确的范围(如设备类型、开始时间、结束类型、适配业务场景)以及业务逻辑,无需指定具体的资源对象。
(4)在编排中枢模块执行任务时,编排中枢模块会充分考虑请求任务的对象,将请求任务的对象的信息发送至安全能力中心模块,以使安全能力中心模块向对象提供实时的能力分级安全控制以及需求响应安全控制。
(5)将运行中产生的记录数据发送至评估能力中心模块进行备份同步,以使评估能力中心模块进行实时分析,从而形成更智能的编排规则策略。
(6)编排中枢模块针对算力网络资源对象的操作可分为两类:第一类为业务配置,通过对配置能力中心模块下发业务配置规则,实现业务的配置,如新开发者用户进入算力网络、交易中心用户等级提升等;第二类为资源调度,通过调度能力中心模块进行资源调度,如FaaS任务云边调度、地铁监控视频解码异常调度等。
(7)编排中枢模块具备多种编排方式,包括资源编排、流程编排以及服务编排。资源编排构建的是计算资源、网络资源、数据资源、应用资源、服务资源、组织资源、安全资源等算力网络对象底层资源系统的组成和依赖关系,如存储空间依赖CentOS操作系统(Community Enterprise Operating System,社区企业操作系统),Nginx(engine x,一种高性能的HTTP和反向代理web服务器)中间件部署在CentOS操作系统上;流程编排,即具备跨部门、跨组织的协同能力,例如组织A可以跨组织向组织B进行任务下发;服务编排,即具备运行服务编排,将多个服务编排形成可使用能力,如存储资源跨区域调度能力、算力网络产品上架能力等。
上述内核层的两大中枢模块的结合,可以实现算力网络多业务场景的主动化感知。
如表1所示,其为本发明提供的基于混合内核架构的算力网络操作系统与现有的离散化、多系统支撑的算力资源利用率的比较结果。经过对多个算力节点的测算可以得到,本发明提供的基于混合内核架构的算力网络操作系统,针对每个算力节点的算力资源利用率都能有所提升,其算力资源平均利用率可达40%以上。
表1 算力网络操作系统的算力资源利用率的比较结果
Figure SMS_1
本发明提供的上述基于混合内核架构的算力网络操作系统,具备备即插即用、异构编排、感知可信、智能调度的特征。当前的智算中心、超算中心普遍存在算力应用的波峰波谷问题,部分算力甚至利用率不足20%,本发明的算力网络操作系统通过安全可信并网交易,实现算力的高效流通与利用,可将利用率大大提升,经测算,利用率可达40%。本发明的算力网络操作系统可以用于承载的任务式服务、科学计算容器化服务,减少了人工参与工作应用的部署安装调试的投入,提升了应用管理的效率。
本发明还提供一种电子设备,包括如上述任一种所述的基于混合内核架构的算力网络操作系统,即包括内核层和外核层;
所述内核层包括实现算力网络业务的感知、分析、决策、调度的内核功能模块;
所述外核层包括提供算力网络资源的发布、共享、交易服务,算力网络资源的运营运维管理服务,算力网络场景应用的开发支撑服务的第一外核插件,以及围绕算力网络跨组织、安全可信提供协同能力,围绕算力网络的计算、存储、数据、服务、应用提供适配调度能力的第二外核插件;
所述内核层与外核层之间采用插件管理模式进行通信交互,以实现算力网络的运营管理。
在一个实施例中,所述插件管理模式包括:
插件管理方式,用于基于插件注册表机制,通过注册、注销、更新方式实现插件的基础管理;
插件连接方式,用于对插件连接到所述内核层的内核功能模块对应制定不同的连接规范和连接机制;
插件通信方式,用于在实现算力网络业务的过程中,基于所述算力网络业务所需的插件提供对应的消息通道能力。
在一个实施例中,所述内核功能模块包括:
感知中枢模块,用于向所述第二外核插件提供资源感知服务、性能感知服务、告警感知服务、业务感知服务;
编排中枢模块,用于向所述第一外核插件和所述第二外核插件提供产品设计服务、能力设计服务、运营运维编排服务;
安全能力中心模块,用于处理所述内核层和所述外核层的安全防护问题;
实训能力中心模块,用于对算力网络业务提供数字化仿真能力,支撑算力网络业务的自动化管理;
配置能力中心模块,用于提供系统级账号配置、基础信息配置、用户角色权限配置、算力网络业务配置;
调度能力中心模块,用于提供算力网络资源调度、任务调度、业务调度;
评估能力中心模块,用于提供业务健康度评估、业务发展预测、关键规则校验。
在一个实施例中,所述第一外核插件包括:
共享交易中心插件,用于面向算力网络开放者提供共享交易服务,所述共享交易服务包括算力发布、算力申请、算力交易大厅;
开发者中心插件,用于面向算力网络开发者提供开发者服务,所述开发者服务包括DevOps工具支持、AI算法包集成;
服务中心插件,用于面向算力网络管理者提供管理服务,所述管理服务包括运行检测、任务审核、异常处置、报告发布。
在一个实施例中,所述第二外核插件包括:
计算使能插件,用于对公有云数据中心、私有云数据中心、网络云数据中心、超算中心、智算中心、家庭算力、个人算力进行计算使能管理,所述计算使能管理包括计算数据采集、基础维护管理、业务自动配置以及控制调度;
组织使能插件,用于对跨组织、跨行业、跨区域的多组织进行互信与连接,实现角色、权限的融合与统一;
数据使能插件,用于对对象存储数据进行数据生命周期管理,所述数据生命周期管理包括数据远程传送、数据服务目录提供;
安全使能插件,用于对安全隔离与信息交换系统、安全防护系统进行信息与规则数据的采集与交换,形成所述内核层与所述外核层的安全数据交互管理;
服务使能插件,用于对运行在算力网络领域中的服务提供服务注册、服务熔断、服务管理的能力;
应用使能插件,用于对运行在算力网络领域中的应用进行应用托管,所述应用托管包括应用部署、应用升级、应用下线;
网络使能插件,用于对无线网、传输网、数据网、交换网、核心网进行网络使能管理,所述网络使能管理包括网络数据采集、基础维护管理、业务自动配置以及控制调度。
在一个实施例中,所述感知中枢模块具体用于:
与所述第二外核插件连接时,实时动态采集所述第二外核插件运行中的资源、性能、告警、业务日志。
在一个实施例中,所述感知中枢模块还具体用于:
向所述编排中枢模块提供分析决策能力,以帮助所述编排中枢模块根据需求动态分配调度资源;
通过所述安全能力中心模块获取连接、调用所述第二外核插件的权限,对采集到的数据根据权限范围进行隔离与控制;
通过所述实训能力中心模块实现感知处理的规则设计,通过加载业务模型与规则实现算力网络业务的升级与管理,以使感知运行态势不中断;
向所述评估能力中心模块提供历史运行数据,以供所述评估能力中心模块进行运行态势挖掘与分析。
在一个实施例中,所述编排中枢模块具体用于:
获取所述第二外核插件开放的可编排的API能力,基于所述API能力进行管理、设计编排,生成运营运维的模板文件;
获取所述第一外核插件下发的与算力网络相关的资源需求,对所述资源需求进行拆解、匹配、归类处理。
在一个实施例中,所述编排中枢模块还具体用于:
在所述编排中枢模块执行任务时,获取所述实训能力中心模块提供对应的编排规则策略,基于所述编排规则策略提供所述运营运维编排服务;
在所述编排中枢模块执行任务时,将请求任务的对象的信息发送至所述安全能力中心模块,以使所述安全能力中心模块向所述对象提供实时的能力分级安全控制以及需求响应安全控制;
将运行中产生的记录数据发送至所述评估能力中心模块进行备份同步,以使所述评估能力中心模块进行实时分析。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (8)

1.一种基于混合内核架构的算力网络操作系统,其特征在于,包括内核层和外核层;
所述内核层包括实现算力网络业务的感知、分析、决策、调度的内核功能模块;
所述外核层包括提供算力网络资源的发布、共享、交易服务,算力网络资源的运营运维管理服务,算力网络场景应用的开发支撑服务的第一外核插件,以及围绕算力网络跨组织、安全可信提供协同能力,围绕算力网络的计算、存储、数据、服务、应用提供适配调度能力的第二外核插件;
所述内核层与外核层之间采用插件管理模式进行通信交互,以实现算力网络的运营管理;
其中,所述插件管理模式包括:
插件管理方式,用于基于插件注册表机制,通过注册、注销、更新方式实现插件的基础管理;
插件连接方式,用于对插件连接到所述内核层的内核功能模块对应制定不同的连接规范和连接机制;
插件通信方式,用于在实现算力网络业务的过程中,基于所述算力网络业务所需的插件提供对应的消息通道能力;
其中,所述第一外核插件包括:
共享交易中心插件,用于面向算力网络开放者提供共享交易服务,所述共享交易服务包括算力发布、算力申请、算力交易大厅;
开发者中心插件,用于面向算力网络开发者提供开发者服务,所述开发者服务包括DevOps工具支持、AI算法包集成;
服务中心插件,用于面向算力网络管理者提供管理服务,所述管理服务包括运行检测、任务审核、异常处置、报告发布。
2.根据权利要求1所述的基于混合内核架构的算力网络操作系统,其特征在于,所述内核功能模块包括:
感知中枢模块,用于向所述第二外核插件提供资源感知服务、性能感知服务、告警感知服务、业务感知服务;
编排中枢模块,用于向所述第一外核插件和所述第二外核插件提供产品设计服务、能力设计服务、运营运维编排服务;
安全能力中心模块,用于处理所述内核层和所述外核层的安全防护问题;
实训能力中心模块,用于对算力网络业务提供数字化仿真能力,支撑算力网络业务的自动化管理;
配置能力中心模块,用于提供系统级账号配置、基础信息配置、用户角色权限配置、算力网络业务配置;
调度能力中心模块,用于提供算力网络资源调度、任务调度、业务调度;
评估能力中心模块,用于提供业务健康度评估、业务发展预测、关键规则校验。
3.根据权利要求1所述的基于混合内核架构的算力网络操作系统,其特征在于,所述第二外核插件包括:
计算使能插件,用于对公有云数据中心、私有云数据中心、网络云数据中心、超算中心、智算中心、家庭算力、个人算力进行计算使能管理,所述计算使能管理包括计算数据采集、基础维护管理、业务自动配置以及控制调度;
组织使能插件,用于对跨组织、跨行业、跨区域的多组织进行互信与连接,实现角色、权限的融合与统一;
数据使能插件,用于对对象存储数据进行数据生命周期管理,所述数据生命周期管理包括数据远程传送、数据服务目录提供;
安全使能插件,用于对安全隔离与信息交换系统、安全防护系统进行信息与规则数据的采集与交换,形成所述内核层与所述外核层的安全数据交互管理;
服务使能插件,用于对运行在算力网络领域中的服务提供服务注册、服务熔断、服务管理的能力;
应用使能插件,用于对运行在算力网络领域中的应用进行应用托管,所述应用托管包括应用部署、应用升级、应用下线;
网络使能插件,用于对无线网、传输网、数据网、交换网、核心网进行网络使能管理,所述网络使能管理包括网络数据采集、基础维护管理、业务自动配置以及控制调度。
4.根据权利要求2所述的基于混合内核架构的算力网络操作系统,其特征在于,所述感知中枢模块具体用于:
与所述第二外核插件连接时,实时动态采集所述第二外核插件运行中的资源、性能、告警、业务日志。
5.根据权利要求4所述的基于混合内核架构的算力网络操作系统,其特征在于,所述感知中枢模块还具体用于:
向所述编排中枢模块提供分析决策能力,以帮助所述编排中枢模块根据需求动态分配调度资源;
通过所述安全能力中心模块获取连接、调用所述第二外核插件的权限,对采集到的数据根据权限范围进行隔离与控制;
通过所述实训能力中心模块实现感知处理的规则设计,通过加载业务模型与规则实现算力网络业务的升级与管理,以使感知运行态势不中断;
向所述评估能力中心模块提供历史运行数据,以供所述评估能力中心模块进行运行态势挖掘与分析。
6.根据权利要求2所述的基于混合内核架构的算力网络操作系统,其特征在于,所述编排中枢模块具体用于:
获取所述第二外核插件开放的可编排的API能力,基于所述API能力进行管理、设计编排,生成运营运维的模板文件;
获取所述第一外核插件下发的与算力网络相关的资源需求,对所述资源需求进行拆解、匹配、归类处理。
7.根据权利要求6所述的基于混合内核架构的算力网络操作系统,其特征在于,所述编排中枢模块还具体用于:
在所述编排中枢模块执行任务时,获取所述实训能力中心模块提供对应的编排规则策略,基于所述编排规则策略提供所述运营运维编排服务;
在所述编排中枢模块执行任务时,将请求任务的对象的信息发送至所述安全能力中心模块,以使所述安全能力中心模块向所述对象提供实时的能力分级安全控制以及需求响应安全控制;
将运行中产生的记录数据发送至所述评估能力中心模块进行备份同步,以使所述评估能力中心模块进行实时分析。
8.一种电子设备,其特征在于,包括如权利要求1至7任一项所述的基于混合内核架构的算力网络操作系统。
CN202310389973.8A 2023-04-13 2023-04-13 一种基于混合内核架构的算力网络操作系统及电子设备 Active CN116107727B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310389973.8A CN116107727B (zh) 2023-04-13 2023-04-13 一种基于混合内核架构的算力网络操作系统及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310389973.8A CN116107727B (zh) 2023-04-13 2023-04-13 一种基于混合内核架构的算力网络操作系统及电子设备

Publications (2)

Publication Number Publication Date
CN116107727A CN116107727A (zh) 2023-05-12
CN116107727B true CN116107727B (zh) 2023-06-30

Family

ID=86267628

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310389973.8A Active CN116107727B (zh) 2023-04-13 2023-04-13 一种基于混合内核架构的算力网络操作系统及电子设备

Country Status (1)

Country Link
CN (1) CN116107727B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116760885B (zh) * 2023-08-23 2023-10-17 亚信科技(中国)有限公司 算力网络业务管理方法、装置、设备、介质及程序产品

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110149353A (zh) * 2018-02-11 2019-08-20 陕西爱尚物联科技有限公司 一种物联网方法及其系统
CN115297014A (zh) * 2022-09-29 2022-11-04 浪潮通信信息系统有限公司 零信任算网操作系统、管理方法、电子设备、存储介质
CN115951969A (zh) * 2022-12-28 2023-04-11 山东浪潮科学研究院有限公司 一种异构算力资源管理方法及装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102682014A (zh) * 2011-03-14 2012-09-19 腾讯科技(深圳)有限公司 在浏览器上实现的开放式插件管理平台及插件管理方法
US11032213B1 (en) * 2018-12-14 2021-06-08 Amazon Technologies, Inc. Centralized management of computing resources across service provider networks
CN113157335B (zh) * 2021-03-31 2023-06-06 北京临近空间飞行器系统工程研究所 一种可扩展插件化体系架构的软件系统设计方法
CN113238731B (zh) * 2021-05-11 2024-03-22 广州以大计算机科技有限公司 一种Ebeit开发平台
CN115396442A (zh) * 2022-08-26 2022-11-25 北京交通大学 一种面向城市轨道交通的算力共享系统及方法
CN115766768A (zh) * 2022-10-24 2023-03-07 浪潮通信信息系统有限公司 一种算力网络操作系统中感知中枢设计方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110149353A (zh) * 2018-02-11 2019-08-20 陕西爱尚物联科技有限公司 一种物联网方法及其系统
CN115297014A (zh) * 2022-09-29 2022-11-04 浪潮通信信息系统有限公司 零信任算网操作系统、管理方法、电子设备、存储介质
CN115951969A (zh) * 2022-12-28 2023-04-11 山东浪潮科学研究院有限公司 一种异构算力资源管理方法及装置

Also Published As

Publication number Publication date
CN116107727A (zh) 2023-05-12

Similar Documents

Publication Publication Date Title
Khan et al. Edge-computing-enabled smart cities: A comprehensive survey
Cao et al. An overview on edge computing research
Velasquez et al. Fog orchestration for the Internet of Everything: state-of-the-art and research challenges
CN113448721A (zh) 算力处理的网络系统及算力处理方法
CN113176875B (zh) 一种基于微服务的资源共享服务平台架构
KR101509269B1 (ko) 분산 연산 기법을 이용한 유비쿼터스 시스템용 미들웨어 장치
CN102902536A (zh) 一种物联网计算机系统
CN104243496A (zh) 一种软件定义网跨域安全代理方法和系统
CN116107727B (zh) 一种基于混合内核架构的算力网络操作系统及电子设备
CN113821564A (zh) 异构并行区块链及其链上数据与链下合约协同方法
CN112866380B (zh) 一种基于区块链的链网架构
Singh et al. Evolving requirements and application of SDN and IoT in the context of industry 4.0, blockchain and artificial intelligence
Zhang et al. The next big thing: Web services collaboration
Blais et al. Extensible modeling and simulation framework (XMSF) 2004 project summary report
Yaqub et al. A protocol development framework for sla negotiations in cloud and service computing
Modi et al. Towards a reference model for agent-based systems
CN113886061A (zh) 一种工业物联网运维平台
Hou et al. A distributed deployment algorithm of process fragments with uncertain traffic matrix
Jacobs A Reference architecture for IoT-enhanced business processes
CN115150406B (zh) 跨数据中心分布式esb配置管理系统
Poulkov et al. Resource management in future internet
CN117076057B (zh) 一种ai服务请求调度的方法、装置、设备及介质
Kim et al. Self-organizing neural networks for unsupervised pattern recognition
Song et al. Research on multi-data center collaboration technology for multi-station fusion
Apostolakis et al. A network application approach towards 5G and beyond critical communications use cases

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant