CN112737934B - 一种集群式物联网边缘网关装置及方法 - Google Patents
一种集群式物联网边缘网关装置及方法 Download PDFInfo
- Publication number
- CN112737934B CN112737934B CN202011587233.8A CN202011587233A CN112737934B CN 112737934 B CN112737934 B CN 112737934B CN 202011587233 A CN202011587233 A CN 202011587233A CN 112737934 B CN112737934 B CN 112737934B
- Authority
- CN
- China
- Prior art keywords
- node
- working
- application service
- redundant
- nodes
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/66—Arrangements for connecting between networks having differing types of switching systems, e.g. gateways
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16Y—INFORMATION AND COMMUNICATION TECHNOLOGY SPECIALLY ADAPTED FOR THE INTERNET OF THINGS [IoT]
- G16Y30/00—IoT infrastructure
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0654—Management of faults, events, alarms or notifications using network fault recovery
- H04L41/0659—Management of faults, events, alarms or notifications using network fault recovery by isolating or reconfiguring faulty entities
- H04L41/0661—Management of faults, events, alarms or notifications using network fault recovery by isolating or reconfiguring faulty entities by reconfiguring faulty entities
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0654—Management of faults, events, alarms or notifications using network fault recovery
- H04L41/0663—Performing the actions predefined by failover planning, e.g. switching to standby network elements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/08—Configuration management of networks or network elements
- H04L41/0803—Configuration setting
- H04L41/0813—Configuration setting characterised by the conditions triggering a change of settings
- H04L41/082—Configuration setting characterised by the conditions triggering a change of settings the condition being updates or upgrades of network functionality
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/08—Configuration management of networks or network elements
- H04L41/0889—Techniques to speed-up the configuration process
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/1001—Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/1001—Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
- H04L67/1029—Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers using data related to the state of servers by a load balancer
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/51—Discovery or management thereof, e.g. service location protocol [SLP] or web services
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Computing Systems (AREA)
- Hardware Redundancy (AREA)
Abstract
本发明提供一种集群式物联网边缘网关装置,包括ARM处理器、内存、存储器、多个网络交换控制器以及看门狗定时器,ARM处理器电连接看门狗定时器、内存与存储器,看门狗定时器用于监控ARM处理器的运行状态,ARM处理器通过网络交换控制器外接多个应用服务端;ARM处理器作为主节点,连接应用服务端的网络交换控制器为工作节点,未连接应用服务端的网络交换控制器为冗余节点,由主节点及通过通信接口与主节点连接的多个工作节点和多个冗余节点组成的集群节点;主节点用于调度和监控所有的工作节点与冗余节点,工作节点用于运行一个或多个应用服务端,冗余节点随时接受主节点发送的应用服务实施部署;利用硬件集群和软件分布式来实现物联网边缘网关功能。
Description
技术领域
本发明属于物联网技术领域,具体涉及一种集群式物联网边缘网关装置及方法。
背景技术
大数据分析正日益成为科学和工程领域中许多领域的关键。边缘计算正日益成为物联网领域的关键。数据的规模往往导致计算密集型算法的运行速度缓慢,例如地球物理学中的3D傅里叶变换。另一个困难发生在数据集大于计算系统中可用的内存(RAM)时。在这种情况下,必须将数据分为较小的数据集并分别处理,这就需要更长的处理时间。随着数据集越来越大,摩尔定律正在接近其极限,传统的顺序算法变得低效,无法处理最先进的数据分析任务。提高处理效率的合理解决方案是开发并行和分布式算法,并使用计算集群部署完成任务。尤其随着接入物联网的设备爆发式增长的前提下,边缘计算的负荷将越来越大。互联互通的计算设备可用于实施集群计算系统,称为“计算集群”或简称“集群”。在这些系统中,若干离散的计算节点共同完成分配给整个集群的边缘计算任务。不管是嵌入式系统还是超级计算机系统都需要在功耗预算内获得尽可能高的性能。随着大型计算机中内核数量的增加,每个内核的功耗变得越来越高。解决这一功耗问题的方法之一是用传统嵌入式系统中的低功耗处理器取代高端服务器CPU。ARM架构的处理器性能大幅提升,成为新的支持良好、廉价而高性能的嵌入式处理器来源,可以用于边缘计算和集群应用。
集群计算需要在每个集群上执行管理功能,例如服务部署和监控。这些功能通常由运行在一个或多个计算节点或连接到集群的其他计算设备上的集群管理软件或逻辑(“代理”)执行。例如,用户可以将计算作业提交给集群整体,集群管理软件将决定集群的哪个节点应该执行该作业。不同的作业对计算资源有不同的需求,如处理器周期、内存、磁盘存储和网络带宽等。此外,长期运行的作业在运行过程中,对资源的需求也会随时间而变化。一个节点上作业的总资源利用率可能大于单独运行作业的利用率值之和。在一个节点上运行更多的作业可能会增加,例如,分页、交换、总线争用,从而降低该节点的性能。
发明内容
本发明的目的是提供一种集群式物联网边缘网关装置及方法,以解决随着接入设备数量的增加,物联网网关中边缘计算对资源要求越来越高;物联网网关新版本软件升级时会导致运行中断;由于现场总线通信距离受限制,物联网网关需要安装在靠近设备的区域,而这些区域往往环境比较恶劣,所以硬件出现故障时更换比较困难;物联网网关在工业应用中,由于现场环境复杂,不可能使用传统的计算机集群方式来实现其功能;目前应用与物联网网关的计算机普遍使用的是嵌入式计算机系统,这对边缘计算形成瓶颈;利用硬件集群和软件分布式来实现物联网边缘网关功能。
本发明提供了如下的技术方案:
一种集群式物联网边缘网关装置,包括ARM处理器、内存、存储器、多个网络交换控制器以及看门狗定时器,所述ARM处理器电连接看门狗定时器、内存与存储器,所述看门狗定时器用于监控ARM处理器的运行状态,所述ARM处理器通过网络交换控制器外接多个应用服务端;所述ARM处理器作为主节点,连接应用服务端的所述网络交换控制器为工作节点,未连接应用服务端的所述网络交换控制器为冗余节点,由主节点及通过通信接口与所述主节点连接的多个工作节点和多个冗余节点组成的集群节点;所述主节点用于调度和监控所有的工作节点与冗余节点,所述工作节点用于运行一个或多个应用服务端,所述冗余节点随时接受主节点发送的应用服务实施部署。
优选的,所述网络交换控制器包括SDID控制器、UART控制器、GPIO控制器、USB控制器、MAC控制器以及I2C控制器。
一种集群式物联网边缘网关装置的方法,包括以下步骤:
S1、装置中各个节点进行自检;
S2、判断各个节点是否自检成功,若是,则进入S3;若否,则声光报警两分钟,随后重启;
S3、判断自检成功的节点数量是否大于等于2,若是,则建立主节点,进入集群模式,主节点创建工作节点,将所有应用服务部署于各个工作节点;若否,则进入节点模式,将所有应用服务部署于同一节点上;
S4、启动完成。
优选的,所述主节点的故障处理,包括以下步骤:
S101、主节点定时复位看门狗定时器,
S102、判断看门狗定时器复位是否超时,若是,则看门狗定时器触发所有节点重启,并进入启动流程;若否,则返回S101。
优选的,所述工作节点的故障处理,包括以下步骤:
S201、主节点定时监视工作节点的运行状态;
S202、判断是否发现工作节点没有回应,若是,则进入S203;若否,则返回S201;
S203、判断是否发现冗余节点,若是,则将没有回应的工作节点中的应用服务部署到冗余节点,并将上述冗余节点转为工作节点;若否,则根据现有工作节点的运行状态,将没有回应的工作节点中的所有应用服务重新部署到正常运行的工作节点中;
S204、重启没有回应的工作节点,并返回S201。
优选的,所述主节点定时监视工作节点的运行状态,包括以下步骤:
S301、主节点定时监视工作节点的CPU负荷量以及内存占用量;
S302、判断工作节点的CPU负荷量以及内存占用量是否超过预设的指标值,若是,则进入S303;若否,则返回S301;
S303、判断是否存在冗余节点,若是,将应用服务中消耗最大的应用服务部署于该冗余节点,部署后该冗余节点成为工作节点,并关闭相应的原工作节点;若否,则确定出应用服务中消耗最大的应用服务以及相应的工作节点,进入S304;
S304、获取其他工作节点的运行状态,利用最优化算法,判断是否存在能够部署上述消耗最大的应用服务的工作节点,若是,则由主节点将上述消耗最大的应用服务部署于该工作节点中,并返回S301;如否,则报警,提示工作节点超负荷运行。
优选的,所述应用服务的更新,包括以下步骤:
S401、向主节点发送新版本应用服务请求;
S402、判断是否有工作节点满足运行该新版本应用服务的要求,若是,则在该工作节点中部署新版本应用服务,若否,则进入S403;
S403、判断是否有冗余节点,若是,则在该冗余节点中部署新版本应用服务,若否,则关闭旧版本应用服务,在工作节点上部署新版本应用服务,并进入S405;
S404、若新版本应用服务运行正常,并关闭工作节点中旧版本应用服务;
S405、应用服务更新完成。
本发明的有益效果是:
本发明的一种集群式物联网边缘网关装置及方法,1、基于ARM处理器设计的计算节点,将多个计算节点集成到单块电路板上构成集群单元,具有足够紧凑、移动性强、节能、性价比高、易于维护;2.将物联网边缘网关的软件功能拆分成若干个微服务,不同的服务运行在不同的集群节点上,负荷超载的服务可以分配多个节点;3.硬件使用“看门狗”定时器,软件通过采集CPU负荷与内存消耗指标来监视节点的运行状况;4.主节点实时监视工作节点运行,通过在个工作节点间的调度来确保各节点的负荷均衡,以及及时发现节点的硬件故障并且恢复故障节点中运行的服务;5.一旦运行了集群,就可以在其上部署应用服务。主节点指挥工作节点如何创建和更新应用服务。主节点启动后,将应用服务调度到集群中的各个节点上。6.创建应用服务后,主节点监控器会持续监视这些服务实例。如果托管实例的节点关闭或被删除,则主节点监控器会将该实例替换为群集中另一个节点上的实例。这提供了一种自我修复机制来解决机器故障维护问题。7.在没有集群式这种编排系统之前,安装脚本通常用于启动应用程序,但它们不允许从机器故障中恢复。通过创建应用服务实例并使它们在节点之间运行,主节点提供了一种与众不同的应用服务管理方法。8.能够24/7全天候使用,开发人员每天可以多次发布部署新版本的应用程序。集群式的结构使应用程序能够以简单快速的方式发布和更新,而无需停机。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1是本发明的硬件组成框图;
图2是集群节点功能与关系示意图;
图3是本装置的启动流程图;
图4是主节点的故障处理流程图;
图5是工作节点的故障处理流程图;
图6是主节点的监视流程图;
图7是应用服务更新流程图。
具体实施方式
如图1-2所示,一种集群式物联网边缘网关装置,包括ARM处理器、内存、存储器、多个网络交换控制器以及看门狗定时器,ARM处理器电连接看门狗定时器、内存与存储器,看门狗定时器用于监控ARM处理器的运行状态,ARM处理器通过网络交换控制器外接多个应用服务端;ARM处理器作为主节点,连接应用服务端的网络交换控制器为工作节点,未连接应用服务端的网络交换控制器为冗余节点,由主节点及通过通信接口与主节点连接的多个工作节点和多个冗余节点组成的集群节点;主节点用于调度和监控所有的工作节点与冗余节点,工作节点用于运行一个或多个应用服务端,冗余节点随时接受主节点发送的应用服务实施部署,网络交换控制器包括SDID控制器、UART控制器、GPIO控制器、USB控制器、MAC控制器以及I2C控制器。
具体的工作原理如下:
一、该装置的启动方法,包括以下步骤:如图3所示,
S1、装置中各个节点进行自检;
S2、判断各个节点是否自检成功,
若是,则进入S3;
若否,则声光报警两分钟,随后重启;
S3、判断自检成功的节点数量是否大于等于2,
若是,则建立主节点,进入集群模式,主节点创建工作节点,将所有应用服务部署于各个工作节点;
若否,则进入节点模式,将所有应用服务部署于同一节点上;
S4、启动完成。
二、主节点的故障处理,包括以下步骤:如图4所示,
S101、主节点定时复位看门狗定时器,
S102、判断看门狗定时器复位是否超时,
若是,则看门狗定时器触发所有节点重启,并进入启动流程;
若否,则返回S101。
三、工作节点的故障处理,包括以下步骤:如图5所示,
S201、主节点定时监视工作节点的运行状态;
S202、判断是否发现工作节点没有回应,
若是,则进入S203;
若否,则返回S201;
S203、判断是否发现冗余节点,
若是,则将没有回应的工作节点中的应用服务部署到冗余节点,并将上述冗余节点转为工作节点;
若否,则根据现有工作节点的运行状态,将没有回应的工作节点中的所有应用服务重新部署到正常运行的工作节点中;
S204、重启没有回应的工作节点,并返回S201。
上述主节点定时监视工作节点的运行状态,包括以下步骤:如图6所示,
S301、主节点定时监视工作节点的CPU负荷量以及内存占用量;
S302、判断工作节点的CPU负荷量以及内存占用量是否超过预设的指标值,
若是,则进入S303;
若否,则返回S301;
S303、判断是否存在冗余节点,
若是,将应用服务中消耗最大的应用服务部署于该冗余节点,部署后该冗余节点成为工作节点,并关闭相应的原工作节点;
若否,则确定出应用服务中消耗最大的应用服务以及相应的工作节点,进入S304;
S304、获取其他工作节点的运行状态,利用最优化算法,判断是否存在能够部署上述消耗最大的应用服务的工作节点,
若是,则由主节点将上述消耗最大的应用服务部署于该工作节点中,并返回S301;
如否,则报警,提示工作节点超负荷运行。
四、应用服务的更新,包括以下步骤:如图7所示,
S401、向主节点发送新版本应用服务请求;
S402、判断是否有工作节点满足运行该新版本应用服务的要求,
若是,则在该工作节点中部署新版本应用服务,
若否,则进入S403;
S403、判断是否有冗余节点,
若是,则在该冗余节点中部署新版本应用服务,
若否,则关闭旧版本应用服务,在工作节点上部署新版本应用服务,并进入S405;
S404、若新版本应用服务运行正常,并关闭工作节点中旧版本应用服务;
S405、应用服务更新完成。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (6)
1.一种集群式物联网边缘网关装置,其特征在于,包括ARM处理器、内存、存储器、多个网络交换控制器以及看门狗定时器,所述ARM处理器电连接看门狗定时器、内存与存储器,所述看门狗定时器用于监控ARM处理器的运行状态,所述ARM处理器通过网络交换控制器外接多个应用服务端;所述ARM处理器作为主节点,连接应用服务端的所述网络交换控制器为工作节点,未连接应用服务端的所述网络交换控制器为冗余节点,由主节点及通过通信接口与所述主节点连接的多个工作节点和多个冗余节点组成集群节点;所述主节点用于调度和监控所有的工作节点与冗余节点,所述工作节点用于运行一个或多个应用服务端,所述冗余节点随时接受主节点发送的应用服务实施部署;所述ARM处理器、内存、存储器和多个网络交换控制器集成于单块电路板上构成集成单元。
2.根据权利要求1所述的一种集群式物联网边缘网关装置,其特征在于,所述网络交换控制器包括SDID控制器、UART控制器、GPIO控制器、USB控制器、MAC控制器以及I2C控制器。
3.一种如权利要求1所述的集群式物联网边缘网关装置的使用方法,其特征在于,包括以下步骤:
S1、装置中各个节点进行自检;
S2、判断各个节点是否自检成功,
若是,则进入S3;
若否,则声光报警两分钟,随后重启;
S3、判断自检成功的节点数量是否大于等于2,
若是,则建立主节点,进入集群模式,主节点创建工作节点,将所有应用服务部署于各个工作节点;
若否,则进入节点模式,将所有应用服务部署于同一节点上;
S4、启动完成;
所述应用服务的更新,包括以下步骤:
S401、向主节点发送新版本应用服务请求;
S402、判断是否有工作节点满足运行该新版本应用服务的要求,
若是,则在该工作节点中部署新版本应用服务,
若否,则进入S403;
S403、判断是否有冗余节点,
若是,则在该冗余节点中部署新版本应用服务,
若否,则关闭旧版本应用服务,在工作节点上部署新版本应用服务,并进入S405;
S404、若新版本应用服务运行正常,并关闭工作节点中旧版本应用服务;
S405、应用服务更新完成。
4.根据权利要求3所述的一种集群式物联网边缘网关装置的方法,其特征在于,所述主节点的故障处理,包括以下步骤:
S101、主节点定时复位看门狗定时器,
S102、判断看门狗定时器复位是否超时,
若是,则看门狗定时器触发所有节点重启,并进入启动流程;
若否,则返回S101。
5.根据权利要求3所述的一种集群式物联网边缘网关装置的方法,其特征在于,所述工作节点的故障处理,包括以下步骤:
S201、主节点定时监视工作节点的运行状态;
S202、判断是否发现工作节点没有回应,
若是,则进入S203;
若否,则返回S201;
S203、判断是否发现冗余节点,
若是,则将没有回应的工作节点中的应用服务部署到冗余节点,并将上述冗余节点转为工作节点;
若否,则根据现有工作节点的运行状态,将没有回应的工作节点中的所有应用服务重新部署到正常运行的工作节点中;
S204、重启没有回应的工作节点,并返回S201。
6.根据权利要求5所述的一种集群式物联网边缘网关装置的方法,其特征在于,所述主节点定时监视工作节点的运行状态,包括以下步骤:
S301、主节点定时监视工作节点的CPU负荷量以及内存占用量;
S302、判断工作节点的CPU负荷量以及内存占用量是否超过预设的指标值,
若是,则进入S303;
若否,则返回S301;
S303、判断是否存在冗余节点,
若是,将应用服务中消耗最大的应用服务部署于该冗余节点,部署后该冗余节点成为工作节点,并关闭相应的原工作节点;
若否,则确定出应用服务中消耗最大的应用服务以及相应的工作节点,进入S304;
S304、获取其他工作节点的运行状态,利用最优化算法,判断是否存在能够部署上述消耗最大的应用服务的工作节点,
若是,则由主节点将上述消耗最大的应用服务部署于该工作节点中,并返回S301;
如否,则报警,提示工作节点超负荷运行。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011587233.8A CN112737934B (zh) | 2020-12-28 | 2020-12-28 | 一种集群式物联网边缘网关装置及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011587233.8A CN112737934B (zh) | 2020-12-28 | 2020-12-28 | 一种集群式物联网边缘网关装置及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112737934A CN112737934A (zh) | 2021-04-30 |
CN112737934B true CN112737934B (zh) | 2023-07-18 |
Family
ID=75607149
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011587233.8A Active CN112737934B (zh) | 2020-12-28 | 2020-12-28 | 一种集群式物联网边缘网关装置及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112737934B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113542365B (zh) * | 2021-06-22 | 2023-07-18 | 常州森普信息科技有限公司 | 基于多场景应用的端边物联网平台架构 |
CN113472638B (zh) * | 2021-07-05 | 2023-06-09 | 腾讯科技(深圳)有限公司 | 边缘网关控制方法及系统、装置、电子设备、存储介质 |
CN113345566A (zh) * | 2021-07-07 | 2021-09-03 | 上海蓬海涞讯数据技术有限公司 | 一种医院运营管理数据采集集成装置及系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110658759A (zh) * | 2019-09-25 | 2020-01-07 | 上海众壹云计算科技有限公司 | 一种可动态部署ai模型的工业智能控制器 |
US10693813B1 (en) * | 2019-02-17 | 2020-06-23 | Lenovo Enterprise Solutions (Singapore) Pte. Ltd. | Enabling and disabling links of a networking switch responsive to compute node fitness |
CN112035215A (zh) * | 2020-08-31 | 2020-12-04 | 腾讯科技(深圳)有限公司 | 节点集群的节点自治方法、系统、装置及电子设备 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108769170A (zh) * | 2018-05-18 | 2018-11-06 | 郑州云海信息技术有限公司 | 一种集群网络故障自检系统及方法 |
US11244242B2 (en) * | 2018-09-07 | 2022-02-08 | Intel Corporation | Technologies for distributing gradient descent computation in a heterogeneous multi-access edge computing (MEC) networks |
US20200241926A1 (en) * | 2019-01-24 | 2020-07-30 | Intel Corporation | Selection and management of disaggregated computing resources |
CN110445828B (zh) * | 2019-06-14 | 2023-04-18 | 平安科技(深圳)有限公司 | 一种基于Redis的数据分布式处理方法及其相关设备 |
CN110177020A (zh) * | 2019-06-18 | 2019-08-27 | 北京计算机技术及应用研究所 | 一种基于Slurm的高性能集群管理方法 |
CN110488701A (zh) * | 2019-08-20 | 2019-11-22 | 北京计算机技术及应用研究所 | 基于国产化处理器的网络和FlexRay总线的高可用热备份方法 |
CN110677288A (zh) * | 2019-09-25 | 2020-01-10 | 浙江九州云信息科技有限公司 | 一种通用于多场景部署的边缘计算系统及方法 |
-
2020
- 2020-12-28 CN CN202011587233.8A patent/CN112737934B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10693813B1 (en) * | 2019-02-17 | 2020-06-23 | Lenovo Enterprise Solutions (Singapore) Pte. Ltd. | Enabling and disabling links of a networking switch responsive to compute node fitness |
CN110658759A (zh) * | 2019-09-25 | 2020-01-07 | 上海众壹云计算科技有限公司 | 一种可动态部署ai模型的工业智能控制器 |
CN112035215A (zh) * | 2020-08-31 | 2020-12-04 | 腾讯科技(深圳)有限公司 | 节点集群的节点自治方法、系统、装置及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN112737934A (zh) | 2021-04-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112737934B (zh) | 一种集群式物联网边缘网关装置及方法 | |
EP3522013B1 (en) | Method and system for migration of containers in a container orchestration platform between compute nodes | |
US20200104222A1 (en) | Systems and methods for managing server cluster environments and providing failure recovery therein | |
Gupta et al. | Towards realizing the potential of malleable jobs | |
US20120137006A1 (en) | Computing system and computing system management method | |
US10924538B2 (en) | Systems and methods of monitoring software application processes | |
CN112948063B (zh) | 云平台的创建方法、装置、云平台以及云平台实现系统 | |
CN110958311A (zh) | 一种基于yarn的共享集群弹性伸缩系统及方法 | |
US20020083116A1 (en) | Buffered coscheduling for parallel programming and enhanced fault tolerance | |
US11531572B2 (en) | Cross-cluster host reassignment | |
US11656914B2 (en) | Anticipating future resource consumption based on user sessions | |
Ali et al. | Probabilistic normed load monitoring in large scale distributed systems using mobile agents | |
JP5632403B2 (ja) | タスク管理システム、タスク管理サーバ、タスク管理方法、及びタスク管理プログラム | |
WO2022009438A1 (ja) | サーバメンテナンス制御装置、システム、制御方法及びプログラム | |
CN114237891A (zh) | 资源调度方法、装置、电子设备及存储介质 | |
JP2009199213A (ja) | プロセス監視方法、情報処理装置、及びプログラム | |
CN114416276A (zh) | 设备管理服务的调度方法、装置、电子设备及存储介质 | |
CN106844021B (zh) | 计算环境资源管理系统及其管理方法 | |
Goraya et al. | Fault tolerance task execution through cooperative computing in grid | |
Htet et al. | An implementation of job running backup function in user-PC computing system | |
US11595321B2 (en) | Cluster capacity management for hyper converged infrastructure updates | |
Da Silva et al. | Low cost self-healing in MPI applications | |
CN116991591B (zh) | 一种数据调度方法、装置及存储介质 | |
CN118069292A (zh) | 调度容器的方法、装置、电子设备和计算机程序产品 | |
US11126452B2 (en) | Performance modeling for virtualization environments |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |