CN117424903A - 边缘节点管理方法、装置、设备和存储介质 - Google Patents
边缘节点管理方法、装置、设备和存储介质 Download PDFInfo
- Publication number
- CN117424903A CN117424903A CN202311428733.0A CN202311428733A CN117424903A CN 117424903 A CN117424903 A CN 117424903A CN 202311428733 A CN202311428733 A CN 202311428733A CN 117424903 A CN117424903 A CN 117424903A
- Authority
- CN
- China
- Prior art keywords
- edge node
- node
- edge
- current
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000007726 management method Methods 0.000 title claims abstract description 196
- 238000003860 storage Methods 0.000 title claims abstract description 19
- 238000000034 method Methods 0.000 claims abstract description 39
- 238000012545 processing Methods 0.000 claims abstract description 12
- 238000001514 detection method Methods 0.000 claims description 35
- 238000001816 cooling Methods 0.000 claims description 24
- 230000004044 response Effects 0.000 claims description 10
- 230000008859 change Effects 0.000 claims description 8
- 230000003993 interaction Effects 0.000 abstract description 6
- 230000006870 function Effects 0.000 description 26
- 238000011084 recovery Methods 0.000 description 16
- 230000001360 synchronised effect Effects 0.000 description 12
- 238000012797 qualification Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 8
- 230000001960 triggered effect Effects 0.000 description 8
- 238000012544 monitoring process Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 230000010076 replication Effects 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000013468 resource allocation Methods 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/1001—Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
- H04L67/1034—Reaction to server failures by a load balancer
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/1095—Replication or mirroring of data, e.g. scheduling or transport for data synchronisation between network nodes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/52—Network services specially adapted for the location of the user terminal
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请涉及一种边缘节点管理方法、装置、设备和存储介质,该方法包括:当前边缘节点接收中心管理平台下发的数据,所述数据包括每一个边缘节点的节点关键信息;根据所述数据绘制当前边缘节点的边缘地图,其中,所述边缘地图表征所述当前边缘节点与其他边缘节点的关联程度,根据所述边缘地图确定与所述当前边缘节点对应的目标边缘节点;建立所述当前边缘节点与所述目标边缘节点之间的同步关系;当所述当前边缘节点出现故障时,确定所述目标边缘节点执行所述当前边缘节点的任务。本申请可以实现边端之间的信息交互和关联调度,提高处理的速度。
Description
技术领域
本申请涉及云平台管理技术领域,特别是涉及一种边缘节点管理方法、装置、设备和存储介质。
背景技术
Kubernetes边缘管理是一种基于容器的云平台管理技术,它可以将云端的应用程序和基础设施部署在分布式设备上,从而实现更灵活、更可靠、更高效的管理。随着物联网、智能家居、智能制造等技术的发展,越来越多的设备被连接到互联网,这些设备需要高效、可靠、安全的管理平台来支持。Kubernetes边缘管理就是在这样的背景下产生的。随着kubernetes边缘管理能力的逐步完善,被越来越多的企业所采纳,构建基于kubernetes平台的云边协数字化平台,实现中心数据云平台对边缘侧区域资源节点的统一调度管理以及运维运营。
但是,目前基于kubernetes系统建立的边缘管理能力更多的是集中在边端资源与数据中心之间的信息传输和调度管理,边端之间信息交互和管理能力较为欠缺。对于一些需要边端容灾的场景,则无法支持。例如,A、B、C是kuberentes边缘管理系统的三个边缘节点,各自负责一个区域的信息处理,然后将处理后的信息上报中心数据平台进行汇总。如果A边缘节点发生设备故障,需要进行硬件更换时,按照目前kubernetes边缘管理系统的实现逻辑是将原来运行在边缘节点的应用软件在B或者C边缘节点重新调度部署,原来A边缘节点的处理任务暂时由B或者C节点来相应,但是对于调度到B节点还是C节点是由系统自动调度实现,如果调度到距离A边缘节点较远的节点运行,会造成一定的网络延时,影响处理速度。
因此,亟需一种边缘节点管理方法解决边端之间的信息交互问题,实现边缘节点之间的关联调度,提高处理的速度。
发明内容
基于此,本申请提供了一种边缘节点管理方法、装置、设备和存储介质,以解决现有技术中存在的问题。
第一方面,提供一种边缘节点管理方法,该方法包括:
当前边缘节点接收中心管理平台下发的数据,所述数据包括每一个边缘节点的节点关键信息;
根据所述数据绘制当前边缘节点的边缘地图,其中,所述边缘地图表征所述当前边缘节点与其他边缘节点的关联程度,根据所述边缘地图确定与所述当前边缘节点对应的目标边缘节点;
建立所述当前边缘节点与所述目标边缘节点之间的同步关系;
当所述当前边缘节点出现故障时,确定所述目标边缘节点执行所述当前边缘节点的任务。
根据本申请实施例中一种可实现的方式,根据所述数据绘制当前边缘节点的边缘地图,其中,所述边缘地图表征所述当前边缘节点与其他边缘节点的关联程度,根据所述边缘地图确定与所述当前边缘节点对应的目标边缘节点,包括:
根据所述数据中的节点关键信息,确定除所述当前边缘节点之外的其他边缘节点的地理位置信息、节点配置信息和节点运行状态信息;
根据所述其他边缘节点的地理位置信息、节点配置信息和节点运行状态信息,确定所述其他边缘节点的关联数值,根据所述关联数值的大小绘制边缘地图,其中,所述关联数值越大表征所述其他边缘节点与所述当前边缘节点的关联程度越近;
确定所述关联数值最大的其他边缘节点作为与所述当前边缘节点对应的目标边缘节点。
根据本申请实施例中一种可实现的方式,当前边缘节点接收中心管理平台下发的数据,所述数据包括每一个边缘节点的节点关键信息,包括:
确定kuberenetes系统的节点信息数据,所述节点信息包括kuberenetes系统的边缘节点数量以及每一个边缘节点的节点关键信息,并将所述节点信息数据存储在中心管理平台的管理模块;
当前边缘节点接收中心管理平台下发的节点信息数据,并将所述节点信息数据存储在当前边缘节点的管理模块;
响应于所述kuberenetes系统的边缘节点数量或任一个边缘节点的节点关键信息发生变化,生成更新后的节点信息数据,并将述更新后的节点信息数据存储在所述中心管理平台的管理模块;
当前边缘节点接收中心管理平台下发的更新后的节点信息数据,并将所述更新后的节点信息数据存储在当前边缘节点的管理模块。
根据本申请实施例中一种可实现的方式,当所述当前边缘节点出现故障时,确定所述目标边缘节点执行所述当前边缘节点的任务,包括:
所述目标边缘节点基于预设的检测时长向所述当前边缘节点发送心跳检测信号;
响应于所述目标边缘节点在预设的冷却时长之内收到所述当前边缘节点返回的反馈信号,则确定所述当前边缘节点状态为正常,响应于所述目标边缘节点在预设的冷却时长之内未收到所述当前边缘节点返回的反馈信号,则确定所述当前边缘节点状态为故障;
当所述当前边缘节点出现故障时,确定所述目标边缘节点执行所述当前边缘节点的任务。
根据本申请实施例中一种可实现的方式,所述方法还包括:当所述目标边缘节点出现故障时,确定所述当前边缘节点执行所述目标边缘节点的任务;
所述当所述目标边缘节点出现故障时,确定所述当前边缘节点执行所述目标边缘节点的任务,包括:
所述当前边缘节点基于预设的检测时长向所述目标边缘节点发送心跳检测信号;
响应于所述当前边缘节点在预设的冷却时长之内收到所述目标边缘节点返回的反馈信号,则确定所述目标边缘节点状态为正常,响应于所述当前边缘节点在预设的冷却时长之内未收到所述目标边缘节点返回的反馈信号,则确定所述目标边缘节点状态为故障;
当所述目标边缘节点出现故障时,确定所述当前边缘节点执行所述目标边缘节点的任务。
根据本申请实施例中一种可实现的方式,所述建立所述当前边缘节点与所述目标边缘节点之间的同步关系,包括:
确定所述当前边缘节点运行的应用软件使用的第一容器镜像,将所述第一容器镜像同步到所述述目标边缘节点;
确定所述目标边缘节点运行的应用软件使用的第二容器镜像,将所述第二容器镜像同步到所述述当前边缘节点。
根据本申请实施例中一种可实现的方式,所述建立所述当前边缘节点与所述目标边缘节点之间的同步关系,还包括:
确定所述当前边缘节点内存储的第一数据信息,经过预设的时间间隔将所述第一数据信息同步到所述目标边缘节点;
确定所述目标边缘节点内存储的第二数据信息,经过预设的时间间隔将所述第二数据信息同步到所述当前边缘节点。
第二方面,提供了一种边缘节点管理装置,该装置包括:
接收模块:用于当前边缘节点接收中心管理平台下发的数据,所述数据包括每一个边缘节点的节点关键信息;
确定模块:用于根据所述数据绘制当前边缘节点的边缘地图,其中,所述边缘地图表征所述当前边缘节点与其他边缘节点的关联程度,根据所述边缘地图确定与所述当前边缘节点对应的目标边缘节点;
同步模块:用于建立所述当前边缘节点与所述目标边缘节点之间的同步关系;
故障处理模块:用于当所述当前边缘节点出现故障时,确定所述目标边缘节点执行所述当前边缘节点的任务。
第三方面,提供了一种计算机设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机指令,所述计算机指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述第一方面中涉及的方法。
第四方面,提供了一种计算机可读存储介质,其上存储有计算机指令,其特征在于,所述计算机指令用于使计算机执行上述第一方面中涉及的方法。
根据本申请实施例所提供的技术内容,本申请通过当前边缘节点接收中心管理平台下发的数据,根据所述数据绘制当前边缘节点的边缘地图,其中,所述边缘地图表征所述当前边缘节点与其他边缘节点的关联程度,根据所述边缘地图确定与所述当前边缘节点对应的目标边缘节点;建立所述当前边缘节点与所述目标边缘节点之间的同步关系;当所述当前边缘节点出现故障时,确定所述目标边缘节点执行所述当前边缘节点的任务。也就是说边缘节点之间会建立关联关系,针对一些特定的业务场景,不需要由中心平台对边缘节点调度管理,而是由边缘节点之间自动触发,实现业务容灾、数据同步、状态监测等关键功能,不仅有效降低了中心调度造成的网络时延和带宽压力,而且可以有效解决边缘节点就近容灾的业务需求。
附图说明
图1为一个实施例中边缘节点管理方法的应用场景图;
图2为一个实施例中边缘节点管理方法的流程示意图;
图3为一个实施例中边缘节点管理方法的流程示意图;
图4为一个实施例中边缘节点管理方法的流程示意图;
图5为一个实施例中边缘节点管理方法的流程示意图;
图6为一个实施例中边缘节点管理方法的流程示意图;
图7为一个实施例中边缘节点管理装置的结构框图;
图8为一个实施例中计算机设备的示意性结构图。
具体施方式
以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
为了方便理解,首先对本申请所适用的系统架构进行描述。本申请提供的边缘节点管理方法,可以应用于如图1所示的系统架构中。
本申请提供的边缘节点管理方法应用于如图1所示的Kubernetes边缘管理系统。Kubernetes边缘管理是一种基于容器的云平台管理技术,它可以将云端的应用程序和基础设施部署在分布式设备上,从而实现更灵活、更可靠、更高效的管理。随着物联网、智能家居、智能制造等技术的发展,越来越多的设备被连接到互联网,这些设备需要高效、可靠、安全的管理平台来支持。Kubernetes边缘管理就是在这样的背景下产生的。
Kubernetes边缘管理的主要特点包括:(1)分布式架构:Kubernetes边缘管理采用分布式架构,可以在多个设备上部署和管理应用程序和基础设施。这种架构可以保证系统的可靠性和稳定性,即使单个设备出现故障,整个系统仍然可以正常运行。(2)轻量级管理:Kubernetes边缘管理采用轻量级的管理方式,可以快速地部署和管理应用程序和基础设施。此外,Kubernetes边缘管理还提供了自动扩展和自我修复等功能,可以大大减少维护工作量。(3)灵活的可插拔架构:Kubernetes边缘管理采用灵活的可插拔架构,可以根据不同的应用场景选择不同的组件和插件。这种架构可以满足不同应用场景的需求,提高系统的可维护性和可扩展性。(4)安全性和隐私保护:Kubernetes边缘管理提供了安全性和隐私保护机制,可以保证数据的安全性和隐私性。此外,Kubernetes边缘管理还提供了多种加密和认证机制,可以保护数据传输的安全性。(5)与云端无缝集成:Kubernetes边缘管理可以与云端无缝集成,可以实现数据和服务的共享和交互。这种集成方式可以提高系统的灵活性和可靠性,降低维护成本。
如图1所示,Kubernetes边缘管理系统包括一个中心管理平台和若干个边缘节点。基于kubernetes系统建立的边缘管理能力更多的是集中在边端资源与数据中心之间的信息传输和调度管理。对于一些需要边端容灾的场景,则无法支持。详细点解释,就是A、B、C是kuberentes边缘管理系统的3个边缘节点,各自负责一个区域的信息处理,然后将处理后的信息上报中心数据平台进行汇总。如果A边缘节点发生设备故障,需要进行硬件更换时,按照目前kubernetes边缘管理系统的实现逻辑是将原来运行在A边缘节点的应用软件在B或者C边缘节点重新调度部署,原来A边缘节点的处理任务暂时由B或者C节点来相应,但是对于调度到B节点还是C节点是由系统自动调度实现,不会根据边缘节点就近原则调度,如果调度到距离A边缘节点较远的节点运行,会造成一定的网络延时,影响处理速度。此外A边缘节点的应用软件可以被调度到新的边缘节点运行,但是A边缘节点存储的数据,无法同步到新的节点,也会导致应用软件无法正常运行。
基于上述kuberentes边缘管理系统存在的问题,本发明提出了一种基于kuberetnes系统边缘节点自治管理方案,实现边缘节点之间的关联调度能力,也就是说边缘节点之间会建立关联关系,针对一些特定的业务场景,不需要由中心平台对边缘节点调度管理,而是由边缘节点之间自动触发,实现业务容灾、数据同步、状态监测等关键功能。不仅有效降低了中心调度造成的网络时延和带宽压力,而且可以有效解决边缘节点就近容灾的业务需求。
图2为本申请实施例提供的一种边缘节点管理方法的流程图,该方法应用于如图1所示系统中的边缘节点,如图2所示,该方法可以包括以下步骤:
步骤201:当前边缘节点接收中心管理平台下发的数据,数据包括每一个边缘节点的节点关键信息。
具体地,本实施例是基于kuberenetes系统原有功能的基础上新增自治管理功能模块,通过在kubernetes中心管理平台和边缘节点部署新增模式,进而实现边缘节点自治功能。如图3所示,中心自治管理模块部署在kubernetes系统中心管理平台,主要功能是负责收集kuberentes系统的初始节点信息和节点变化信息。也就是说kuberentes系统部署完成后,平台有多少个边缘节点,每个节点的位置信息(地理位置)、节点的资源配置信息(CPU、内存、磁盘、网卡等)、节点运行业务情况等相关信息,以及后期kubernetes系统节点变化,新增节点,删除节点,挂起节点等信息,都会被中心资质管理模块收集。收集的方式是通过kubernetes系统的数据库etcd提供的API接口获取(kubernetes系统的所有信息会存储在etcd数据库中)。当前的边缘节点接收中心管理平台下发的数据,数据是中心管理平台收集kuberentes系统的初始节点信息,例如kuberentes系统部署完成后,平台有多少个边缘节点,每个节点的位置信息(地理位置)、节点的资源配置信息(CPU、内存、磁盘、网卡等)、节点运行业务情况等相关信息。节点关键信息即每个节点的位置信息(地理位置)、节点的资源配置信息(CPU、内存、磁盘、网卡等)、节点运行业务情况等相关信息
在本申请的一个实施例中,当前边缘节点接收中心管理平台下发的数据,数据包括每一个边缘节点的节点关键信息,包括:确定kuberenetes系统的节点信息数据,节点信息包括kuberenetes系统的边缘节点数量以及每一个边缘节点的节点关键信息,并将节点信息数据存储在中心管理平台的管理模块;当前边缘节点接收中心管理平台下发的节点信息数据,并将节点信息数据存储在当前边缘节点的管理模块;响应于kuberenetes系统的边缘节点数量或任一个边缘节点的节点关键信息发生变化,生成更新后的节点信息数据,并将更新后的节点信息数据存储在中心管理平台的管理模块;当前边缘节点接收中心管理平台下发的更新后的节点信息数据,并将更新后的节点信息数据存储在当前边缘节点的管理模块。
具体地,如图3所示,节点信息数据是中心管理平台收集kuberentes系统的初始节点信息,例如kuberentes系统部署完成后,平台有多少个边缘节点,每个节点的位置信息(地理位置)、节点的资源配置信息(CPU、内存、磁盘、网卡等)、节点运行业务情况等相关信息。节点信息包括kuberenetes系统的边缘节点数量以及每一个边缘节点的节点关键信息。每一个边缘节点的节点关键信息包括整个系统的每一个边缘节点的位置信息、运行状态信息、资源配置信息、业务系统数据信息、资源使用情况。确定kuberenetes系统的节点信息数据,节点信息包括kuberenetes系统的边缘节点数量以及每一个边缘节点的节点关键信息,并将节点信息数据存储在中心管理平台的管理模块;当前边缘节点接收中心管理平台下发的节点信息数据,并将节点信息数据存储在当前边缘节点的管理模块。中心自治管理模块收集的信息会以特定的文件格式同步给所有边缘节点的自治管理模块,后期会定时查询etcd数据库进行查询,单边缘节点信息发生变化时,会将变更信息主动推送给所有的边缘节点自治管理模块。响应于kuberenetes系统的边缘节点数量或任一个边缘节点的节点关键信息发生变化,生成更新后的节点信息数据,并将更新后的节点信息数据存储在中心管理平台的管理模块;当前边缘节点接收中心管理平台下发的更新后的节点信息数据,并将更新后的节点信息数据存储在当前边缘节点的管理模块。
步骤202:根据数据绘制当前边缘节点的边缘地图,其中,边缘地图表征当前边缘节点与其他边缘节点的关联程度,根据边缘地图确定与当前边缘节点对应的目标边缘节点。
具体地,要实现边缘节点自治能力的基础条件就是对边缘节点信息的感知,每个边缘节点要能够及时掌握其他边缘节点的关键信息包括地理位置、节点配置、节点运行状态等关键信息,并维护一张边缘节点地图。在需要进行边缘感知互动时候,当前边缘节点可以根据地图信息选择合适的节点来进行通信。而绘制边缘节点地图的关键信息正好是中心自治管理节点从中心平台收集到的数据信息,所以每个边缘节点绘制地图的基础数据就是中心自治管理节点下发的数据。边缘地图表征当前边缘节点与其他边缘节点的关联程度,例如,对当前边缘节点与其他边缘节点的关联程基础数据中的节点信息进行打分,根据分值排序,最终形成可用的边缘节点地图。根据边缘地图确定与当前边缘节点对应的目标边缘节点,目标边缘节点即其他边缘节点中与当前边缘节点的关联程度最高的边缘节点。
步骤203:建立当前边缘节点与目标边缘节点之间的同步关系。
具体地,如图1所示,每个边缘节点存在自治管理模块用于与其他边缘节点的自治管理模块之间建立同步关系。例如,在边缘节点建立关联关系时候,两个节点会自动同步应用软件容器镜像。另外,两个节点会自动进行数据的同步。通过建立当前边缘节点与目标边缘节点之间的同步关系,实现边缘节点之间的关联调度能力,也就是说边缘节点之间会建立关联关系,针对一些特定的业务场景,不需要由中心平台对边缘节点调度管理,而是由边缘节点之间自动触发,实现业务容灾、数据同步、状态监测等关键功能。不仅有效降低了中心调度造成的网络时延和带宽压力,而且可以有效解决边缘节点就近容灾的业务需求。
步骤204:当前边缘节点出现故障时,确定目标边缘节点执行当前边缘节点的任务。
具体地,当前边缘节点根据边缘地图,选择关联最近的节点作为目标边缘节点,如果当前边缘节点检测到关联的节点发生故障,会自动触发业务调度,将关联边缘节点的应用软件和业务数据在同步到目标边缘节点继续执行任务。
可以看出,本申请的实施例通过当前边缘节点接收中心管理平台下发的数据,根据所述数据绘制当前边缘节点的边缘地图,其中,所述边缘地图表征所述当前边缘节点与其他边缘节点的关联程度,根据所述边缘地图确定与所述当前边缘节点对应的目标边缘节点;建立所述当前边缘节点与所述目标边缘节点之间的同步关系;当所述当前边缘节点出现故障时,确定所述目标边缘节点执行所述当前边缘节点的任务。也就是说边缘节点之间会建立关联关系,针对一些特定的业务场景,不需要由中心平台对边缘节点调度管理,而是由边缘节点之间自动触发,实现业务容灾、数据同步、状态监测等关键功能,不仅有效降低了中心调度造成的网络时延和带宽压力,而且可以有效解决边缘节点就近容灾的业务需求。
本发明提出的基于kuberentes系统边缘节点自治管理方案的核心思想是为边缘节点增加管理功能模块,让边缘节点具备节点自治管理功能。新增管理模块承载四大关键能力:边缘地图绘制、心跳信息检测、业务调度管理、业务数据同步。在kuberentes系统的中心管理平台和边缘节点都新增一个自治管理模块。中心管理平台的资质管理模块负责将整个平台的节点信息和配置信息同步到各个节点的资质管理模块,边缘节点的管理模块除了与中心管理平台的自治管理模块保持数据同步,还与其他节点的资质管理模块同步节点信息,与其建立边缘节点管理关系。每个节点应用软件运行在POD容器中,应用软件的数据存储在本地存储磁盘上。基于kuberenetes系统原有功能的基础上新增自治管理功能模块,通过在kubernetes中心管理平台和边缘节点部署新增模式,进而实现边缘节点自治功能。
本申请的实施例通过kuberenetes边缘管理系统的边缘节点具备自治能力,可以在临近节点发生故障时候,快速由最近边缘节点接管业务,继续提供服务,将宕机成本降到最低。也更加符合当前企业对于边缘节点的容灾管理需求。
在本申请的一个实施例中,步骤202中的根据数据绘制当前边缘节点的边缘地图,其中,边缘地图表征当前边缘节点与其他边缘节点的关联程度,根据边缘地图确定与当前边缘节点对应的目标边缘节点,包括:根据数据中的节点关键信息,确定除当前边缘节点之外的其他边缘节点的地理位置信息、节点配置信息和节点运行状态信息;根据其他边缘节点的地理位置信息、节点配置信息和节点运行状态信息,确定其他边缘节点的关联数值,根据关联数值的大小绘制边缘地图,其中,关联数值越大表征其他边缘节点与当前边缘节点的关联程度越近;确定关联数值最大的其他边缘节点作为与当前边缘节点对应的目标边缘节点。
具体地,边缘地图绘制,要实现边缘节点自治能力的基础条件就是对边缘节点信息的感知,每个边缘节点要能够及时掌握其他边缘节点的关键信息包括地理位置、节点配置、节点运行状态等关键信息,并维护一张边缘节点地图,在需要进行边缘感知互动时候,可以根据地图信息选择合适的节点来进行通信。而绘制边缘节点地图的关键信息正好是中心自治管理节点从中心平台收集到的信息,所以每个边缘节点绘制地图的基础数据就是中心自治管理节点下发的数据。边缘自治管理节点根据本发明预置的地域就近管理地图绘制算法,对基础数据中的节点信息进行打分,根据分值排序,最终形成可用的边缘节点地图。
在上述实施例的基础上,根据数据中的节点关键信息,确定除当前边缘节点之外的其他边缘节点的地理位置信息、节点配置信息和节点运行状态信息,包括确定除当前边缘节点之外的其他边缘节点的距离、运行状态、资源配置、业务系统数据、资源使用情况;其中,距离表征其他边缘节点距离本边缘节点的直线距离;运行状态表征边缘节点的运行情况,运行情况分为正常、异常两种;资源配置表征边缘节点CPU、内存、磁盘等资源的配置情况;业务系统数量表征运行在节点上的应用软件个数;资源使用情况表征CPU、内存、磁盘的利用率。根据其他边缘节点的地理位置信息、节点配置信息和节点运行状态信息,确定其他边缘节点的关联数值,包括:
关联数值=(距离*50%+资源配置*30%+(1-资源利用率)*20%)/业务系统数量*运行状态。
根据关联数值的大小绘制边缘地图,其中,关联数值越大表征其他边缘节点与当前边缘节点的关联程度越近。
根据数值由大到小排序,在边缘节点自治管理模块维护一张分值地图表格,如表1所示。具体形式如下,其中,0分的边缘节点是运行状态为异常的无法使用的节点。当前边缘节点会选择得分最高的节点作为边缘自治管理节点,如果当前边缘节点检测到关联的节点发生故障,会自动触发业务调度,将关联边缘节点的应用软件和业务数据在同步到本节点继续提供服务。
表1
本申请的实施例,通过边缘节点的距离、运行状态、资源配置、业务系统数据、资源使用情况确定边缘节点的关联数值,进一步地,根据关联数值的大小绘制边缘地图,可以更加精准地确定系统中各个边缘节点之间的联系,方便建立就近联系,当前边缘节点会选择得分最高的节点作为目标边缘管理节点,可以更加准确地确定边缘节点之间的关联关系。
在本申请的一个实施例中,步骤203中建立当前边缘节点与目标边缘节点之间的同步关系,包括:确定当前边缘节点运行的应用软件使用的第一容器镜像,将第一容器镜像同步到述目标边缘节点;确定目标边缘节点运行的应用软件使用的第二容器镜像,将第二容器镜像同步到述当前边缘节点。
具体地,如图5所示,当前边缘节点与目标边缘节点之间的同步关系包括业务调度管理,在边缘节点建立关联关系时候,两个节点会自动同步应用软件容器镜像。例如在边缘节点Node1运行的应用软件使用的容器镜像是Image1、Image2,在边缘节点Node2中运行的容器镜像是Image3、Image4,但两个节点确定建立关联关系后,自治管理模块触发镜像同步操作,Node1节点的Image1、Image2会同步到Node2节点,Node2节点的Image3、Image4会同步到Node1,这样两个节点的镜像信息保持一致,无论那个节点发生故障,都会在另一个节点上根据镜像重新启动对应的应用软件。
在本申请的一个实施例中,步骤203中建立当前边缘节点与目标边缘节点之间的同步关系,还包括:确定当前边缘节点内存储的第一数据信息,经过预设的时间间隔将第一数据信息同步到目标边缘节点;确定目标边缘节点内存储的第二数据信息,经过预设的时间间隔将第二数据信息同步到当前边缘节点。
具体地,如图6所示,当前边缘节点与目标边缘节点之间的同步关系包括业务数据同步,每个边缘节点产生的数据信息都存储在节点的本地磁盘中,但节点故障,在其他边缘节点继续提供服务时候,需要将原有节点的数据信息也一并同步到关联边缘节点上。但是由于实时同步对于网络带宽压力较大,本发明中的业务数据采用定期异步复制机制,也就是在固定的时间节点发起数据同步,每次同步增量数据。同步的增量数据是距离上一次同步操作后产生的持久化数据信息。这种异步复制模式可能会存在部分数据丢失的情况,如果对于数据敏感度较高的场景,可以将异步复制的时间间隔设置为分钟级,否者建议设置为小时级别。
本申请的实施例,通过边缘节点之间会建立同步的关联关系,针对一些特定的业务场景,不需要由中心平台对边缘节点调度管理,而是由边缘节点之间自动触发,实现业务容灾、数据同步、状态监测等关键功能,有效降低了中心调度造成的网络时延和带宽压力。
在本申请的一个实施例中,步骤204中的当前边缘节点出现故障时,确定目标边缘节点执行当前边缘节点的任务,包括:目标边缘节点基于预设的检测时长向当前边缘节点发送心跳检测信号;响应于目标边缘节点在预设的冷却时长之内收到当前边缘节点返回的反馈信号,则确定当前边缘节点状态为正常,响应于目标边缘节点在预设的冷却时长之内未收到当前边缘节点返回的反馈信号,则确定当前边缘节点状态为故障;当当前边缘节点出现故障时,确定目标边缘节点执行当前边缘节点的任务。
具体地,如图4所示,在确定当前边缘节点的目标边缘节点之后,会同步启动心跳信息检测器,定期发送心跳检测信号,探测关联节点的健康状态。心跳信息检测设置检测的相关阈值信息,包括检测时间间隔,冷却时长,时间间隔指的是心跳检测频率多长时间探测一次节点状态,冷却时间指的是多长时间内检测不到有效信息反馈才可判定节点故障。如下图所示,边缘节点Node1与边缘节点Node2建立关联关系,边缘节点Node3与边缘节点Node4建立关联关系,他们之前定期发送心跳检测信息,判定边缘节点状态。
例如,目标边缘节点(Node1)基于预设的检测时长向当前边缘节点(Node2)发送心跳检测信号;响应于目标边缘节点(Node1)在预设的冷却时长之内收到当前边缘节点(Node2)返回的反馈信号,则确定当前边缘节点(Node2)状态为正常,响应于目标边缘节点(Node1)在预设的冷却时长之内未收到当前边缘节点(Node2)返回的反馈信号,则确定当前边缘节点(Node2)状态为故障;当当前边缘节点出现故障时,确定目标边缘节点(Node1)执行当前边缘节点的任务。
在本申请的一个实施例中,方法还包括步骤205:当目标边缘节点出现故障时,确定当前边缘节点执行目标边缘节点的任务。步骤205中当目标边缘节点出现故障时,确定当前边缘节点执行目标边缘节点的任务,包括:当前边缘节点基于预设的检测时长向目标边缘节点发送心跳检测信号;响应于当前边缘节点在预设的冷却时长之内收到目标边缘节点返回的反馈信号,则确定目标边缘节点状态为正常,响应于当前边缘节点在预设的冷却时长之内未收到目标边缘节点返回的反馈信号,则确定目标边缘节点状态为故障;当目标边缘节点出现故障时,确定当前边缘节点执行目标边缘节点的任务。
具体地,如图4所示,在确定当前边缘节点的目标边缘节点之后,会同步启动心跳信息检测器,定期发送心跳检测信号,探测关联节点的健康状态。心跳信息检测设置检测的相关阈值信息,包括检测时间间隔,冷却时长,时间间隔指的是心跳检测频率多长时间探测一次节点状态,冷却时间指的是多长时间内检测不到有效信息反馈才可判定节点故障。如下图所示,边缘节点Node1与边缘节点Node2建立关联关系,边缘节点Node3与边缘节点Node4建立关联关系,他们之前定期发送心跳检测信息,判定边缘节点状态。
例如,当前边缘节点(Node2)基于预设的检测时长向目标边缘节点(Node1)发送心跳检测信号;响应于当前边缘节点(Node2)在预设的冷却时长之内收到目标边缘节点(Node1)返回的反馈信号,则确定目标边缘节点(Node1)状态为正常,响应于当前边缘节点(Node2)在预设的冷却时长之内未收到目标边缘节点(Node1)返回的反馈信号,则确定目标边缘节点(Node1)状态为故障;当目标边缘节点(Node1)出现故障时,确定当前边缘节点(Node2)执行目标边缘节点的任务。
本申请的实施例通过kuberenetes边缘管理系统的边缘节点具备自治能力,可以在临近节点发生故障时候,快速由最近边缘节点接管业务,继续提供服务,将宕机成本降到最低。也更加符合当前企业对于边缘节点的容灾管理需求。
在上述实施例的基础上,本发明提出的基于kuberentes系统边缘节点自治管理方案的核心思想是为边缘节点增加管理功能模块,让边缘节点具备节点自治管理功能。新增管理模块承载四大关键能力:边缘地图绘制、心跳信息检测、业务调度管理、业务数据同步。在kuberentes系统的中心管理平台和边缘节点都新增一个自治管理模块。中心管理平台的资质管理模块负责将整个平台的节点信息和配置信息同步到各个节点的资质管理模块,边缘节点的管理模块除了与中心管理平台的自治管理模块保持数据同步,还与其他节点的资质管理模块同步节点信息,与其建立边缘节点管理关系。每个节点应用软件运行在POD容器中,应用软件的数据存储在本地存储磁盘上。基于kuberenetes系统原有功能的基础上新增自治管理功能模块,通过在kubernetes中心管理平台和边缘节点部署新增模式,进而实现边缘节点自治功能。
应该理解的是,虽然图1的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本申请中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
图7为本申请实施例提供的一种边缘节点管理装置的结构示意图,如图7所示,该装置可以包括:
接收模块701:用于当前边缘节点接收中心管理平台下发的数据,所述数据包括每一个边缘节点的节点关键信息;
确定模块702:用于根据所述数据绘制当前边缘节点的边缘地图,其中,所述边缘地图表征所述当前边缘节点与其他边缘节点的关联程度,根据所述边缘地图确定与所述当前边缘节点对应的目标边缘节点;
同步模块703:用于建立所述当前边缘节点与所述目标边缘节点之间的同步关系;
故障处理模块704:用于当所述当前边缘节点出现故障时,确定所述目标边缘节点执行所述当前边缘节点的任务。
在本申请的一个实施例中,根据所述数据绘制当前边缘节点的边缘地图,其中,所述边缘地图表征所述当前边缘节点与其他边缘节点的关联程度,根据所述边缘地图确定与所述当前边缘节点对应的目标边缘节点,包括:
根据所述数据中的节点关键信息,确定除所述当前边缘节点之外的其他边缘节点的地理位置信息、节点配置信息和节点运行状态信息;
根据所述其他边缘节点的地理位置信息、节点配置信息和节点运行状态信息,确定所述其他边缘节点的关联数值,根据所述关联数值的大小绘制边缘地图,其中,所述关联数值越大表征所述其他边缘节点与所述当前边缘节点的关联程度越近;
确定所述关联数值最大的其他边缘节点作为与所述当前边缘节点对应的目标边缘节点。
在本申请的一个实施例中,当前边缘节点接收中心管理平台下发的数据,所述数据包括每一个边缘节点的节点关键信息,包括:
确定kuberenetes系统的节点信息数据,所述节点信息包括kuberenetes系统的边缘节点数量以及每一个边缘节点的节点关键信息,并将所述节点信息数据存储在中心管理平台的管理模块;
当前边缘节点接收中心管理平台下发的节点信息数据,并将所述节点信息数据存储在当前边缘节点的管理模块;
响应于所述kuberenetes系统的边缘节点数量或任一个边缘节点的节点关键信息发生变化,生成更新后的节点信息数据,并将述更新后的节点信息数据存储在所述中心管理平台的管理模块;
当前边缘节点接收中心管理平台下发的更新后的节点信息数据,并将所述更新后的节点信息数据存储在当前边缘节点的管理模块。
在本申请的一个实施例中,当所述当前边缘节点出现故障时,确定所述目标边缘节点执行所述当前边缘节点的任务,包括:
所述目标边缘节点基于预设的检测时长向所述当前边缘节点发送心跳检测信号;
响应于所述目标边缘节点在预设的冷却时长之内收到所述当前边缘节点返回的反馈信号,则确定所述当前边缘节点状态为正常,响应于所述目标边缘节点在预设的冷却时长之内未收到所述当前边缘节点返回的反馈信号,则确定所述当前边缘节点状态为故障;
当所述当前边缘节点出现故障时,确定所述目标边缘节点执行所述当前边缘节点的任务。
在本申请的一个实施例中,故障处理模块704:还用于当所述目标边缘节点出现故障时,确定所述当前边缘节点执行所述目标边缘节点的任务;
所述当所述目标边缘节点出现故障时,确定所述当前边缘节点执行所述目标边缘节点的任务,包括:
所述当前边缘节点基于预设的检测时长向所述目标边缘节点发送心跳检测信号;
响应于所述当前边缘节点在预设的冷却时长之内收到所述目标边缘节点返回的反馈信号,则确定所述目标边缘节点状态为正常,响应于所述当前边缘节点在预设的冷却时长之内未收到所述目标边缘节点返回的反馈信号,则确定所述目标边缘节点状态为故障;
当所述目标边缘节点出现故障时,确定所述当前边缘节点执行所述目标边缘节点的任务。
在本申请的一个实施例中,所述建立所述当前边缘节点与所述目标边缘节点之间的同步关系,包括:
确定所述当前边缘节点运行的应用软件使用的第一容器镜像,将所述第一容器镜像同步到所述述目标边缘节点;
确定所述目标边缘节点运行的应用软件使用的第二容器镜像,将所述第二容器镜像同步到所述述当前边缘节点。
在本申请的一个实施例中,所述建立所述当前边缘节点与所述目标边缘节点之间的同步关系,还包括:
确定所述当前边缘节点内存储的第一数据信息,经过预设的时间间隔将所述第一数据信息同步到所述目标边缘节点;
确定所述目标边缘节点内存储的第二数据信息,经过预设的时间间隔将所述第二数据信息同步到所述当前边缘节点。
可以看出,本申请的实施例通过当前边缘节点接收中心管理平台下发的数据,根据所述数据绘制当前边缘节点的边缘地图,其中,所述边缘地图表征所述当前边缘节点与其他边缘节点的关联程度,根据所述边缘地图确定与所述当前边缘节点对应的目标边缘节点;建立所述当前边缘节点与所述目标边缘节点之间的同步关系;当所述当前边缘节点出现故障时,确定所述目标边缘节点执行所述当前边缘节点的任务。也就是说边缘节点之间会建立关联关系,针对一些特定的业务场景,不需要由中心平台对边缘节点调度管理,而是由边缘节点之间自动触发,实现业务容灾、数据同步、状态监测等关键功能,不仅有效降低了中心调度造成的网络时延和带宽压力,而且可以有效解决边缘节点就近容灾的业务需求。
本发明提出的基于kuberentes系统边缘节点自治管理方案的核心思想是为边缘节点增加管理功能模块,让边缘节点具备节点自治管理功能。新增管理模块承载四大关键能力:边缘地图绘制、心跳信息检测、业务调度管理、业务数据同步。在kuberentes系统的中心管理平台和边缘节点都新增一个自治管理模块。中心管理平台的资质管理模块负责将整个平台的节点信息和配置信息同步到各个节点的资质管理模块,边缘节点的管理模块除了与中心管理平台的自治管理模块保持数据同步,还与其他节点的资质管理模块同步节点信息,与其建立边缘节点管理关系。每个节点应用软件运行在POD容器中,应用软件的数据存储在本地存储磁盘上。基于kuberenetes系统原有功能的基础上新增自治管理功能模块,通过在kubernetes中心管理平台和边缘节点部署新增模式,进而实现边缘节点自治功能。
本申请的实施例通过kuberenetes边缘管理系统的边缘节点具备自治能力,可以在临近节点发生故障时候,快速由最近边缘节点接管业务,继续提供服务,将宕机成本降到最低。也更加符合当前企业对于边缘节点的容灾管理需求。
上述各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
需要说明的是,本申请实施例中可能会涉及到对用户数据的使用,在实际应用中,可以在符合所在国的适用法律法规要求的情况下(例如用户明确同意,对用户切实通知,用户明确授权等),在适用法律法规允许的范围内在本文描述的方案中使用用户特定的个人数据。
根据本申请的实施例,本申请还提供了一种计算机设备、一种计算机可读存储介质。本申请还提供了一种计算机设备,包括至少一个处理器,以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的计算机指令,计算机指令被至少一个处理器执行,以使至少一个处理器能够执行上述任一实施例所述边缘节点管理方法。
如图8所示,是根据本申请实施例的计算机设备的框图。计算机设备旨在表示各种形式的数字计算机或移动装置。其中数字计算机可以包括台式计算机、便携式计算机、工作台、个人数字助理、服务器、大型计算机和其它适合的计算机。移动装置可以包括平板电脑、智能电话、可穿戴式设备等。
如图8所示,计算机设备800包括计算单元801、ROM 802、RAM 803、总线804以及输入/输出(I/O)接口805,计算单元801、ROM 802以及RAM 803通过总线804彼此相连。输入/输出(I/O)接口805也连接至总线804。
计算单元801可以根据存储在只读存储器(ROM)802中的计算机指令或者从存储单元808加载到随机访问存储器(RAM)803中的计算机指令,来执行本申请方法实施例中的各种处理。计算单元801可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元801可以包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。在一些实施例中,本申请实施例提供的方法可被实现为计算机软件程序,其被有形地包含于计算机可读存储介质,例如存储单元808。
RAM 803还可存储设备800操作所需的各种程序和数据。计算机程序的部分或者全部可以经由ROM 802和/或通信单元809而被载入和/或安装到设备800上。
计算机设备800中的输入单元806、输出单元807、存储单元808和通信单元809可以连接至I/O接口805。其中,输入单元806可以是诸如键盘、鼠标、触摸屏、麦克风等;输出单元807可以是诸如显示器、扬声器、指示灯等。设备800能够通过通信单元809与其他设备进行信息、数据等的交换。
需要说明的是,该设备还可以包括实现正常运行所必需的其他组件。也可以仅包含实现本申请方案所必需的组件,而不必包含图中所示的全部组件。
此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件和/或它们的组合中实现。
用于实施本申请的方法的计算机指令可以采用一个或多个编程语言的任何组合来编写。这些计算机指令可以提供给计算单元801,使得计算机指令当由诸如处理器等计算单元801执行时使执行本申请方法实施例中涉及的各步骤。
本申请还提供了一种计算机可读存储介质,其上存储有计算机指令,所述计算机指令用于使计算机执行上述任一实施例所述边缘节点管理方法。
本申请提供的计算机可读存储介质可以是有形的介质,其可以包含或存储计算机指令,用以执行本申请方法实施例中涉及的各步骤。计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的等形式的存储介质。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。
Claims (10)
1.一种边缘节点管理方法,其特征在于,该方法包括:
当前边缘节点接收中心管理平台下发的数据,所述数据包括每一个边缘节点的节点关键信息;
根据所述数据绘制当前边缘节点的边缘地图,其中,所述边缘地图表征所述当前边缘节点与其他边缘节点的关联程度,根据所述边缘地图确定与所述当前边缘节点对应的目标边缘节点;
建立所述当前边缘节点与所述目标边缘节点之间的同步关系;
当所述当前边缘节点出现故障时,确定所述目标边缘节点执行所述当前边缘节点的任务。
2.根据权利要求1所述的边缘节点管理方法,其特征在于,根据所述数据绘制当前边缘节点的边缘地图,其中,所述边缘地图表征所述当前边缘节点与其他边缘节点的关联程度,根据所述边缘地图确定与所述当前边缘节点对应的目标边缘节点,包括:
根据所述数据中的节点关键信息,确定除所述当前边缘节点之外的其他边缘节点的地理位置信息、节点配置信息和节点运行状态信息;
根据所述其他边缘节点的地理位置信息、节点配置信息和节点运行状态信息,确定所述其他边缘节点的关联数值,根据所述关联数值的大小绘制边缘地图,其中,所述关联数值越大表征所述其他边缘节点与所述当前边缘节点的关联程度越近;
确定所述关联数值最大的其他边缘节点作为与所述当前边缘节点对应的目标边缘节点。
3.根据权利要求1所述的边缘节点管理方法,其特征在于,当前边缘节点接收中心管理平台下发的数据,所述数据包括每一个边缘节点的节点关键信息,包括:
确定kuberenetes系统的节点信息数据,所述节点信息包括kuberenetes系统的边缘节点数量以及每一个边缘节点的节点关键信息,并将所述节点信息数据存储在中心管理平台的管理模块;
当前边缘节点接收中心管理平台下发的节点信息数据,并将所述节点信息数据存储在当前边缘节点的管理模块;
响应于所述kuberenetes系统的边缘节点数量或任一个边缘节点的节点关键信息发生变化,生成更新后的节点信息数据,并将述更新后的节点信息数据存储在所述中心管理平台的管理模块;
当前边缘节点接收中心管理平台下发的更新后的节点信息数据,并将所述更新后的节点信息数据存储在当前边缘节点的管理模块。
4.根据权利要求1-3任一项所述的边缘节点管理方法,其特征在于,当所述当前边缘节点出现故障时,确定所述目标边缘节点执行所述当前边缘节点的任务,包括:
所述目标边缘节点基于预设的检测时长向所述当前边缘节点发送心跳检测信号;
响应于所述目标边缘节点在预设的冷却时长之内收到所述当前边缘节点返回的反馈信号,则确定所述当前边缘节点状态为正常,响应于所述目标边缘节点在预设的冷却时长之内未收到所述当前边缘节点返回的反馈信号,则确定所述当前边缘节点状态为故障;
当所述当前边缘节点出现故障时,确定所述目标边缘节点执行所述当前边缘节点的任务。
5.根据权利要求1-3任一项所述的边缘节点管理方法,其特征在于,所述方法还包括:当所述目标边缘节点出现故障时,确定所述当前边缘节点执行所述目标边缘节点的任务;
所述当所述目标边缘节点出现故障时,确定所述当前边缘节点执行所述目标边缘节点的任务,包括:
所述当前边缘节点基于预设的检测时长向所述目标边缘节点发送心跳检测信号;
响应于所述当前边缘节点在预设的冷却时长之内收到所述目标边缘节点返回的反馈信号,则确定所述目标边缘节点状态为正常,响应于所述当前边缘节点在预设的冷却时长之内未收到所述目标边缘节点返回的反馈信号,则确定所述目标边缘节点状态为故障;
当所述目标边缘节点出现故障时,确定所述当前边缘节点执行所述目标边缘节点的任务。
6.根据权利要求1所述的边缘节点管理方法,其特征在于,所述建立所述当前边缘节点与所述目标边缘节点之间的同步关系,包括:
确定所述当前边缘节点运行的应用软件使用的第一容器镜像,将所述第一容器镜像同步到所述述目标边缘节点;
确定所述目标边缘节点运行的应用软件使用的第二容器镜像,将所述第二容器镜像同步到所述述当前边缘节点。
7.根据权利要求6所述的边缘节点管理方法,其特征在于,所述建立所述当前边缘节点与所述目标边缘节点之间的同步关系,还包括:
确定所述当前边缘节点内存储的第一数据信息,经过预设的时间间隔将所述第一数据信息同步到所述目标边缘节点;
确定所述目标边缘节点内存储的第二数据信息,经过预设的时间间隔将所述第二数据信息同步到所述当前边缘节点。
8.一种边缘节点管理装置,其特征在于,该装置包括:
接收模块:用于当前边缘节点接收中心管理平台下发的数据,所述数据包括每一个边缘节点的节点关键信息;
确定模块:用于根据所述数据绘制当前边缘节点的边缘地图,其中,所述边缘地图表征所述当前边缘节点与其他边缘节点的关联程度,根据所述边缘地图确定与所述当前边缘节点对应的目标边缘节点;
同步模块:用于建立所述当前边缘节点与所述目标边缘节点之间的同步关系;
故障处理模块:用于当所述当前边缘节点出现故障时,确定所述目标边缘节点执行所述当前边缘节点的任务。
9.一种计算机设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机指令,所述计算机指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-7中任一项所述的方法。
10.一种计算机可读存储介质,其上存储有计算机指令,其特征在于,所述计算机指令用于使计算机执行权利要求1至7中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311428733.0A CN117424903A (zh) | 2023-10-31 | 2023-10-31 | 边缘节点管理方法、装置、设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311428733.0A CN117424903A (zh) | 2023-10-31 | 2023-10-31 | 边缘节点管理方法、装置、设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117424903A true CN117424903A (zh) | 2024-01-19 |
Family
ID=89532273
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311428733.0A Pending CN117424903A (zh) | 2023-10-31 | 2023-10-31 | 边缘节点管理方法、装置、设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117424903A (zh) |
-
2023
- 2023-10-31 CN CN202311428733.0A patent/CN117424903A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3754514B1 (en) | Distributed database cluster system, data synchronization method and storage medium | |
CN109739929B (zh) | 数据同步方法、装置及系统 | |
CN105187464B (zh) | 一种分布式存储系统中的数据同步方法、装置及系统 | |
CN110427284B (zh) | 数据处理方法、分布式系统、计算机系统和介质 | |
US20150067387A1 (en) | Method and apparatus for data storage | |
CN105208060B (zh) | 业务数据同步方法、装置及系统 | |
CN110784498B (zh) | 一种个性化数据容灾方法及装置 | |
JP2012234333A (ja) | クラスタシステム、同期制御方法、サーバ装置および同期制御プログラム | |
CN110633046A (zh) | 一种分布式系统的存储方法、装置、存储设备及存储介质 | |
CN111552701B (zh) | 确定分布式集群中数据一致性的方法及分布式数据系统 | |
CN104780190A (zh) | 数据读写控制方法及装置 | |
CN112631756A (zh) | 一种应用于航天测控软件的分布式调控方法及装置 | |
CN117194562A (zh) | 数据同步方法和装置、电子设备和计算机可读介质 | |
CN117149909A (zh) | 数据同步方法、装置、存储介质及处理器 | |
CN103442033A (zh) | 一种运行状态信息的同步方法和设备 | |
CN117424903A (zh) | 边缘节点管理方法、装置、设备和存储介质 | |
CN114564458B (zh) | 集群间数据同步的方法、装置、设备和存储介质 | |
CN112799879B (zh) | 节点的故障处理方法、装置、设备和存储介质 | |
Lin et al. | ReHRS: A hybrid redundant system for improving MapReduce reliability and availability | |
CN114327973A (zh) | 一种区块链故障处理方法、装置及设备 | |
CN114281600A (zh) | 一种容灾备份和容灾恢复方法、装置、设备及存储介质 | |
CN112751789A (zh) | 一种非对称sdn控制器集群的实现方法及系统 | |
CN113253924A (zh) | 数据处理方法、装置、电子设备及计算机可读存储介质 | |
CN110971872A (zh) | 一种基于分布式集群的视频图像信息采集方法 | |
CN109491838A (zh) | 一种处理虚拟机数据的方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |