CN115408199A - 一种边缘计算节点的容灾处理方法及装置 - Google Patents

一种边缘计算节点的容灾处理方法及装置 Download PDF

Info

Publication number
CN115408199A
CN115408199A CN202110580319.6A CN202110580319A CN115408199A CN 115408199 A CN115408199 A CN 115408199A CN 202110580319 A CN202110580319 A CN 202110580319A CN 115408199 A CN115408199 A CN 115408199A
Authority
CN
China
Prior art keywords
edge computing
computing node
node
backup
service
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110580319.6A
Other languages
English (en)
Inventor
刘伟
齐佳
高有军
任昕旸
郭英喆
李懿达
陈立新
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
China Mobile Xiongan ICT Co Ltd
China Mobile System Integration Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
China Mobile Xiongan ICT Co Ltd
China Mobile System Integration Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, China Mobile Xiongan ICT Co Ltd, China Mobile System Integration Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN202110580319.6A priority Critical patent/CN115408199A/zh
Publication of CN115408199A publication Critical patent/CN115408199A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • G06F11/1464Management of the backup or restore process for networked environments
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • G06F11/1461Backup scheduling policy
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5061Partitioning or combining of resources
    • G06F9/5072Grid computing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5083Techniques for rebalancing the load in a distributed system
    • G06F9/5088Techniques for rebalancing the load in a distributed system involving task migration

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Mathematical Physics (AREA)
  • Hardware Redundancy (AREA)

Abstract

本发明提供一种边缘计算节点的容灾处理方法及装置。其中,该方法包括:接确定目标边缘计算节点的异常状态;确定边缘计算节点集群中与所述目标边缘计算节点对应的备份边缘计算节点,以使所述备份边缘计算节点执行所述目标边缘计算节点的业务;其中,所述边缘计算节点集群包含所述目标边缘计算节点和所述第备份边缘计算节点;所述边缘计算节点集群中包含的边缘计算节点之间互为备份节点。采用本发明公开的边缘计算节点的容灾处理方法,通过建立边缘计算节点互备份的方式实现了数据在接近用户侧的容灾保障,能够保障在边缘计算节点整体故障后快速的在其他边缘计算节点构建业务并提供服务,更大限度的保证了业务连续性。

Description

一种边缘计算节点的容灾处理方法及装置
技术领域
本发明涉及计算机应用技术领域,具体涉及一种边缘计算节点的容灾处理方法和装置。另外,还涉及一种电子设备及处理器可读存储介质。
背景技术
随着互联网的广泛普及,云计算技术也得到了快速发展,集中性的算力集合能够满足按需供应的业务场景。伴随着5G(5th Generation Mobile CommunicationTechnology)技术的发展,由云计算技术与5G技术相结合的边缘计算应运而生。边缘计算是低时延、高带宽和海量接入的算力集合,其具有算力资源相对较贵、形态多样、分布广泛等特点,因此一般的边缘计算都比较轻量化,虚拟层都做了裁剪和压缩。而适用边缘计算场景的应用往往也要求时延低、可靠性高、安全性高等特点。
灾备,即容灾和备份。容灾机制能够使得边缘计算节点在遭遇灾害时能保证信息系统正常运行,实现业务连续性的目标。备份是为了避免灾难来临时造成的数据丢失问题。现有技术中常用的容灾备份方法有:本地备份、异地备份、云备份等。本地备份是定期将数据进行本地化保存,容灾能力低。异地热备是指通过网络将数据备份到其他地点,只保存数据,不承担业务,主站点灾难时,备份站点接替工作来保证业务的连续性。云备份是数据通过云存储方式保存到公有云或私有云上。目前,各主要边缘计算平台采用的云备份方式,将数据备份到集中式的中心云上来保证业务连续性。其具体架构如图2所示。主流的云边协同场景中,边缘计算平台将边缘计算节点连接至中心云端,边缘计算节点业务产生的数据以边缘节点本地备份、云备份保存的方式来达到数据容灾备份的目的。
然而,本地备份无法做到边缘云平台级容灾,云备份虽能在边缘云整体故障时能够保存重要数据,但数据传输延时长。在边缘计算节点(边缘云)出现整体故障时,由于备份路径和恢复路径长,数据传输会占用大量带宽,需等待边缘云故障解除后才能进行数据恢复和业务恢复过程,不仅导致业务恢复时间长,而且对已有业务也会产生影响,会导致整体业务中断。因此,如何设计一种持续、稳定的边缘计算节点的容灾处理方案成为本领域研究的重要课题。
发明内容
为此,本发明提供一种边缘计算节点的容灾处理方法及装置,以解决现有技术中存在的边缘计算节点的容灾处理方案局限性较高、稳定性和持续性逐渐无法满足当前实际使用需求的问题。
第一方面,本发明提供的一种边缘计算节点的容灾处理方法,包括:确定目标边缘计算节点的异常状态;
确定边缘计算节点集群中与所述目标边缘计算节点对应的备份边缘计算节点,以使所述备份边缘计算节点执行所述目标边缘计算节点的业务;
其中,所述边缘计算节点集群包含所述目标边缘计算节点和所述第备份边缘计算节点;所述边缘计算节点集群中包含的边缘计算节点之间互为备份节点。
在一个实施例中,所述确定目标边缘计算节点的异常状态,具体包括:
基于预设的边缘计算运营管理平台获取所述目标边缘计算节点上报的节点运行状态信息;基于所述节点运行状态信息确定所述目标边缘计算节点的异常状态;其中,所述节点运行状态信息包含状态标识字段和身份标识信息;或者,
若超过预设时限阈值未收到所述目标边缘计算节点上报的节点运行状态信息,则确定所述目标边缘计算节点为异常状态;或者,
利用所述边缘计算运营管理平台主动通过网络协议向所述目标边缘计算节点发送建立连接请求,若超过预设时限阈值未收到回复信息,则确定所述目标边缘计算节点为异常状态。
在一个实施例中,所述确定边缘计算节点集群中与所述目标边缘计算节点对应的备份边缘计算节点,以使所述备份边缘计算节点执行所述目标边缘计算节点的业务,具体包括:
基于所述目标边缘计算节点上报的节点运行状态信息,确定所述备份边缘计算节点;其中,所述节点运行状态信息包含所述目标边缘计算节点对应的所述备份边缘计算节点的身份标识信息;
基于所述边缘计算运营管理平台将预设的分流策略发送给核心网控制面网元,并通过所述核心网控制面网元将所述分流策略发送给第一用户端口功能网元和第二用户端口功能网元;
确定用户端连接到基站,并通过所述基站连接到所述第一用户端口功能网元之后,通过所述第一用户端口功能网元根据更新后的所述分流策略将数据访问请求分流到所述第二用户端口功能网元,并通过所述第二用户端口功能网元根据更新后的所述分流策略将数据访问请求发送到所述备份边缘计算节点,以使所述备份边缘计算节点执行所述目标边缘计算节点的业务。
在一个实施例中,所述的边缘计算节点的容灾处理方法,还包括:基于边缘计算运营管理平台将业务配置数据下发到所述备份边缘计算节点上,以使所述备份边缘计算节点上运行所述目标边缘计算节点上的业务应用;并将所述备份边缘计算节点中从所述目标边缘计算节点上预先备份过来的业务运行状态数据与所述业务应用进行关联,以使所述业务应用的运行状态数据由所述目标边缘计算节点完全迁移到所述备份边缘计算节点。
在一个实施例中,所述目标边缘计算节点与所述备份边缘计算节点之间为直连网络。
第二方面,本发明还提供一种边缘计算节点的容灾处理方法,包括:在业务应用运行过程中,将所述业务应用的业务运行状态数据备份到对应的备份边缘计算节点中;
根据预设的上报时间周期,将节点运行状态信息发送到服务器端的边缘计算运营管理平台;其中,所述节点运行状态信息包含状态标识字段和身份标识信息。
第三方面,本发明还提供一种边缘计算节点的容灾处理装置,包括:异常状态确定单元,用于确定目标边缘计算节点的异常状态;
备份边缘计算节点确定单元,用于确定边缘计算节点集群中与所述目标边缘计算节点对应的备份边缘计算节点,以使所述备份边缘计算节点执行所述目标边缘计算节点的业务;
其中,所述边缘计算节点集群包含所述目标边缘计算节点和所述第备份边缘计算节点;所述边缘计算节点集群中包含的边缘计算节点之间互为备份节点。
在一个实施例中,所述异常状态确定单元,具体用于:
基于预设的边缘计算运营管理平台获取所述目标边缘计算节点上报的节点运行状态信息;基于所述节点运行状态信息确定所述目标边缘计算节点的异常状态;其中,所述节点运行状态信息包含状态标识字段和身份标识信息;或者,
若超过预设时限阈值未收到所述目标边缘计算节点上报的节点运行状态信息,则确定所述目标边缘计算节点为异常状态;或者,
利用所述边缘计算运营管理平台主动通过网络协议向所述目标边缘计算节点发送建立连接请求,若超过预设时限阈值未收到回复信息,则确定所述目标边缘计算节点为异常状态。
在一个实施例中,所述备份边缘计算节点确定单元,具体用于:
基于所述目标边缘计算节点上报的节点运行状态信息,确定所述备份边缘计算节点;其中,所述节点运行状态信息包含所述目标边缘计算节点对应的所述备份边缘计算节点的身份标识信息;
基于所述边缘计算运营管理平台将预设的分流策略发送给核心网控制面网元,并通过所述核心网控制面网元将所述分流策略发送给第一用户端口功能网元和第二用户端口功能网元;
确定用户端连接到基站,并通过所述基站连接到所述第一用户端口功能网元之后,通过所述第一用户端口功能网元根据更新后的所述分流策略将数据访问请求分流到所述第二用户端口功能网元,并通过所述第二用户端口功能网元根据更新后的所述分流策略将数据访问请求发送到所述备份边缘计算节点,以使所述备份边缘计算节点执行所述目标边缘计算节点的业务。
在一个实施例中,所述的边缘计算节点的容灾处理装置,还包括:所述备份边缘计算节点处理单元,具体用于:
基于边缘计算运营管理平台将业务配置数据下发到所述备份边缘计算节点上,以使所述备份边缘计算节点上运行所述目标边缘计算节点上的业务应用;并将所述备份边缘计算节点中从所述目标边缘计算节点上预先备份过来的业务运行状态数据与所述业务应用进行关联,以使所述业务应用的运行状态数据由所述目标边缘计算节点完全迁移到所述备份边缘计算节点。
在一个实施例中,所述目标边缘计算节点与所述备份边缘计算节点之间为直连网络。
第四方面,本发明还提供一种边缘计算节点的容灾处理装置,包括:业务运行状态数据备份单元,用于在业务应用运行过程中,将所述业务应用的业务运行状态数据备份到对应的备份边缘计算节点中;
节点运行状态信息上报单元,用于根据预设的上报时间周期,将节点运行状态信息发送到服务器端的边缘计算运营管理平台;其中,所述节点运行状态信息包含状态标识字段和身份标识信息。
第五方面,本发明还提供一种电子设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任意一项所述的边缘计算节点的容灾处理方法的步骤。
第六方面,本发明还提供一种处理器可读存储介质,所述处理器可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现如上述任意一项所述的边缘计算节点的容灾处理方法的步骤。
采用本发明所述的边缘计算节点的容灾处理方法,通过建立边缘计算节点互备份的模式实现了数据在接近用户侧的容灾保障,能够保障在边缘计算节点整体故障后快速的在其他边缘计算节点构建业务并提供服务,更大限度的保证了业务连续性;同时保证了在边缘计算节点整体故障后,用户流量快速的转移到可以正常提供服务的备份边缘计算节点上,屏蔽了用户对边缘计算节点整体故障的感知,既能够实现边缘计算节点的容灾效果,又能保证业务的持续可用性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获取其他的附图。
图1为本发明实施例提供的边缘计算节点的容灾处理方法的流程示意图之一;
图2为本发明实施例提供的基于云备份方式的边缘计算节点容灾处理过程的示意图;
图3为本发明实施例提供的边缘计算节点的容灾处理方法的实际应用示意图;
图4为本发明实施例提供的边缘计算节点的容灾处理装置的结构示意图之一;
图5为本发明实施例提供的边缘计算节点的容灾处理方法的流程示意图之二;
图6为本发明实施例提供的边缘计算节点的容灾处理装置的结构示意图之二;
图7为本发明实施例提供的电子设备的实体结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获取的所有其他实施例,都属于本发明保护的范围。
下面基于本发明所述的边缘计算节点的容灾处理方法,对其实施例进行详细描述。如图1所示,其为本发明实施例提供的边缘计算节点的容灾处理方法的流程示意图之一,具体实现过程包括以下步骤:
步骤101:确定目标边缘计算节点的异常状态。
在本步骤中,所述的目标边缘计算节点可以是指边缘计算节点集群中的任意一个边缘计算节点(又称边缘云)。所述异常状态是指目标边缘计算节点所在位置由于发生如地震、断电、断网等恶劣情况,导致整个边缘计算节点无法供应服务的状态。
具体的,服务器端可基于预设的边缘计算运营管理平台获取所述目标边缘计算节点上报的节点运行状态信息,并基于所述节点运行状态信息确定所述目标边缘计算节点的异常状态。其中,所述节点运行状态信息包含状态标识字段和身份标识信息等。除此之外,若边缘计算运营管理平台检测到超过预设时限阈值未收到所述目标边缘计算节点上报的节点运行状态信息,则确定所述目标边缘计算节点为异常状态。另外,还可通过所述边缘计算运营管理平台主动利用网络协议向所述目标边缘计算节点发送建立连接请求的方式判断所述目标边缘计算节点是否为异常状态,若边缘计算运营管理平台向所述目标边缘计算节点发送建立连接请求之后超过预设时限阈值未收到回复信息,则确定所述目标边缘计算节点为异常状态。所述边缘计算运营管理平台位于服务器端。
步骤102:确定边缘计算节点集群中与所述目标边缘计算节点对应的备份边缘计算节点,以使所述备份边缘计算节点执行所述目标边缘计算节点的业务。
其中,所述边缘计算节点集群包含所述目标边缘计算节点和所述第备份边缘计算节点。所述边缘计算节点集群中包含的边缘计算节点之间互为备份节点。
具体的,边缘计算运营管理平台可基于所述目标边缘计算节点上报的节点运行状态信息,确定所述备份边缘计算节点。其中,所述节点运行状态信息除了包含上述状态标识字段(即目标边缘计算节点的健康状态描述字段,ture为健康状态良好,false为异常)和身份标识信息(即目标边缘计算节点在边缘计算运营管理平台注册的ID,该ID唯一确定所述目标边缘计算节点)之外,还包含所述目标边缘计算节点对应的所述备份边缘计算节点的身份标识信息(即目标边缘计算节点对应的备份边缘云在边缘计算运营管理平台注册的ID),以及目标边缘计算节点作为备份边缘计算节点时对应的主边缘计算节点在边缘计算运营管理平台注册的ID。
基于所述边缘计算运营管理平台将预设的分流策略发送给核心网控制面网元,并通过所述核心网控制面网元将所述分流策略发送给第一用户端口功能网元和第二用户端口功能网元。确定用户端连接到基站,并通过所述基站连接到所述第一用户端口功能网元之后,通过所述第一用户端口功能网元根据更新后的所述分流策略将数据访问请求分流到所述第二用户端口功能网元,并通过所述第二用户端口功能网元根据更新后的所述分流策略将数据访问请求发送到所述备份边缘计算节点,以使所述备份边缘计算节点执行所述目标边缘计算节点的业务。进一步的,边缘计算运营管理平台可将业务配置数据下发到所述备份边缘计算节点上,以使所述备份边缘计算节点上运行所述目标边缘计算节点上的业务应用。并将所述备份边缘计算节点中从所述目标边缘计算节点上预先备份过来的业务运行状态数据与所述业务应用进行关联,以使所述业务应用的运行状态数据由所述目标边缘计算节点完全迁移到所述备份边缘计算节点。
需要说明的是,边缘计算运营管理平台包括了各纳管的边缘计算节点上业务配置数据。在服务上述边缘计算节点时需要预先做好业务配置数据(无状态化信息)和业务运行状态数据(有状态化信息)分离,这是保证业务应用能够顺利迁移和拉起的基础。由于边缘计算运营管理平台维护着各边缘计算节点上的业务配置信息等无状态化信息,且业务配置信息一般很小,因此需要的传输时间也非常少,不会成为业务连续性的瓶颈,有效保证业务的持续性。在具体实施过程中,通过基于边缘计算运营管理平台通过管控命令将业务配置数据下发到所述备份边缘计算节点上,并在所述备份边缘计算节点上运行所述目标边缘计算节点上的业务应用,并将业务应用对应的业务运行状态数据与从目标边缘计算节点上备份过来的数据进行关联,实现了业务应用的运行状态由目标边缘计算节点完全迁移到备份边缘计算节点,并正常向外提供服务。
本发明的边缘计算整体架构:可包含多个边缘计算节点、对应的边缘计算运营管理平台(可以是中心云,也可以是离边缘计算节点更紧的边缘计算统一运营管理平台)、、核心网开放接口模块以及运营商5G核心网体系等。
如图3所示,左侧部分为简化的运营商5G核心网体系,具体包含核心网控制面网元集群、下沉的UPF(User Plane Function;用户端口功能)网元、各类基站和室分。右侧为可以通过5G接入的终端设备。具体包括边缘计算节点、边缘计算运营管理平台以及中间穿越的公网区域。其中,用户端口功能网元不一定与所有边缘计算节点有连接,该图仅作为参考,不做具体限定,本发明的边缘计算整体架构可以按需灵活部署。在具体实施过程中。边缘计算运营管理平台与边缘计算节点间也可以不必通过公网环境,而是部署在同一个局域环境中,在这种情况下备份效率更高、高可用效果更好。
在数据备份过程中:在边缘计算节点正常工作时,对于重要的数据需要实现边缘计算节点间数据互相备份,两个边缘计算节点互为主备。如图3所示,所述的边缘计算节点集群包含三个边缘计算节点,其可以相对分散来提高容灾性。其中,边缘计算节点A(即边缘云A)的应用数据以边缘计算节点B为备份云,边缘计算节点B(即边缘云B)的应用数据以边缘计算节点C为备份云,边缘计算节点C(即边缘云C)的应用数据以边缘计算节点A为备份云。
在具体实施过程中,数据备份路径可以根据实际网络环境做选择,考虑到距离和延时因素,优先选择各边缘计算节点间的直连网络,其次选择通过UPF绕行(多个UPF可以无损传递数据),最后选择通过公网环境绕行边缘计算运营管理平台后进行数据备份。
数据备份方式可以根据业务的不同要求执行不同的备份策略,粗略来说业务中断容忍程度低的业务数据执行热备模式,即主边缘计算节点提供服务的同时,对应的备份边缘计算节点进行接近实时的数据同步。中断容忍程度高的业务数据执行冷备即可。热备和冷备模式的数据同步均通过通用性网络协议进行连接,比如TCP/IP协议。其中,所述的主边缘计算节点即为所述目标边缘计算节点。
数据同步可以是存储同步,也可以是数据库的主备同步。存储同步可通过备份边缘计算节点主动拉取数据,也可通过中间件订阅同步或者通过主边缘计算节点主动推送等方式进行。数据的主备同步可基于数据库主从复制功能进行优化,通过增量同步的方式减少网络负载。
容灾场景中,由于边缘计算节点采用了容器化运行业务应用的方式,业务配置数据和业务运行状态数据无须保存,只需要持久化的数据进行备份,其备份方式可参照上述描述内容,在此不再重复赘述。在某地边缘计算节点环境遇到灾难情况无法继续提供服务时,边缘计算运营管理平台可通过监控信息即时进行处理,确定备份边缘计算节点,并将业务应用在备份边缘计算节点上拉起,并通过网络开放能力将业务配置数据下发到UPF,新业务访问请求通过UPF分流到备份边缘计算节点上进行处理。此过程实现了边缘计算节点灾难场景下业务分钟级延续。关键在于提前的关键数据(比如业务配置数据等)互备、业务应用的数据解耦以及网络分流的快速响应协作达到的平台级高可用。
如图3所示,在一个完整实施过程中,正常情况下用户访问通过1-0路径连接运营商基站,通过1-1路径连接到最近的UPF1(即第一用户端口功能网元),UPF1通过分流策略将业务访问请求卸载到时延最好的边缘计算节点A(即目标边缘计算节点或者边缘云A)上进行业务服务响应。边缘计算节点A通过1-3路径定时向边缘计算运营管理平台(比如中心云)汇报边缘计算节点A的健康状态,即定时上传节点运行状态信息。节点运行状态信息可参考如下内容:
边缘计算节点A在断网情况下节点运行状态信息默认解析为false异常,在边缘计算节点正常工作时会将该字段置为true良好。边缘计算节点A上报超时时限根据网络情况设定,根据考虑到丢包和网络延时,计算出最小超时时限极限值(即预设的时限阈值),超时时限值需大于该极限值,以避免误报频繁出现。边缘计算运营管理平台收到边缘计算节点A上传的节点运行状态信息为正常时,存储和验证个边缘计算节点A之间的备份关系。
此时,边缘计算节点A所处位置发生如地震、断电、断网等恶劣情况,导致整个边缘计算节点A无法供应服务,通过1-3路径发出包含灾难信号或健康状态超时的节点运行状态信息。
边缘计算运营管理平台对应边缘计算节点A无法供应服务的判断过程如下:当边缘计算运营管理平台收到边缘计算节点A上传的节点运行状态信息为异常或超时时限后未收到该边缘计算节点A上报的节点运行状态信息;边缘计算运营管理平台主动通过TCP/IP协议,连接边缘计算节点A超时未收到回复,此时应判断边缘计算节点A已出于无法供应服务的状态,进入到下一处理流程。
边缘计算运营管理平台判断边缘计算节点A已无法供应服务,检索边缘计算节点A的备份云,即边缘计算节点B(备份边缘计算节点),并通过路径1-4上传的节点运行状态信息确认边缘计算节点B的健康状态良好,管控命令通过路径1-4将边缘计算节点A的备份业务在边缘计算节点B上快速拉起。
需要说明的是:边缘计算运营管理平台包括了各纳管的边缘计算节点上业务配置数据,在服务上述边缘计算节点时预先做好业务配置数据(无状态化信息)和业务运行状态数据(有状态化信息)分离。这是保证业务能够顺利迁移和拉起的基础。由于边缘计算运营管理平台维护着各边缘计算节点上业务的业务配置数据等无状态化信息,且业务配置数据一般很小,因此所需的传输时间也非常少,不会成为业务连续性的瓶颈。
所以边缘计算运营管理平台通过管控命令将业务配置数据下发到边缘计算节点B上,并在边缘计算节点B上拉起边缘计算节点A上的业务应用,将业务应用与从边缘计算节点A上备份过来的业务运行状态数据进行关联,实现了业务应用的运行状态由边缘计算节点A完全迁移到边缘计算节点B,并正常向外提供服务。
边缘计算运营管理中心通过网络开发功能,将分流策略通过1-5路径发送给核心网控制面网元(即核心网),该核心网将分流策略通过1-6策略发送给UPF1和UPF2。其中,1-5路径和1-6路径依赖于运营商核心网的开放能力接口,该接口功能基于《5G核心网边缘计算总体技术要求》的标准,能够支持对UPF分流策略的修改,在此不再详细赘述。
基于上述方式实现的边缘计算节点的容灾处理方法,在用户端一侧是无感知的,访问继续通过2-0路径连接到运营商基站,通过2-1路径连接到最近的UPF1,UPF1根据更新后的分流策略,通过路径2-2将访问分流到UPF2,UPF2根据更新后的分流策略通过路径2-3将访问分流到边缘计算节点B,此时边缘计算节点B上的原边缘计算节点A业务已经拉起并能够正常工作,保证了业务跨平台的连续性。
采用本发明实施例所述的边缘计算节点的容灾处理方法,通过建立边缘计算节点互备份的模式实现了数据在接近用户侧的容灾保障,能够保障在边缘计算节点整体故障后快速的在其他边缘计算节点构建业务并提供服务,更大限度的保证了业务连续性;同时保证了在边缘计算节点整体故障后,用户流量快速的转移到可以正常提供服务的备份边缘计算节点上,屏蔽了用户对边缘计算节点整体故障的感知,既能够实现边缘计算节点的容灾效果,又能保证业务的持续可用性。
与上述提供的一种边缘计算节点的容灾处理方法相对应,本发明还提供一种边缘计算节点的容灾处理装置。由于该装置的实施例相似于上述方法实施例,所以描述得比较简单,相关之处请参见上述方法实施例部分的说明即可,下面描述的边缘计算节点的容灾处理装置的实施例仅是示意性的。请参考图4所示,其为本发明实施例提供的一种边缘计算节点的容灾处理装置的结构示意图之一。
本发明所述的一种边缘计算节点的容灾处理装置具体包括如下部分:
异常状态确定单元401,用于确定目标边缘计算节点的异常状态;
备份边缘计算节点确定单元402,用于确定边缘计算节点集群中与所述目标边缘计算节点对应的备份边缘计算节点,以使所述备份边缘计算节点执行所述目标边缘计算节点的业务。
其中,所述边缘计算节点集群包含所述目标边缘计算节点和所述第备份边缘计算节点;所述边缘计算节点集群中包含的边缘计算节点之间互为备份节点。
采用本发明实施例所述的边缘计算节点的容灾处理装置,通过建立边缘计算节点互备份的模式实现了数据在接近用户侧的容灾保障,能够保障在边缘计算节点整体故障后快速的在其他边缘计算节点构建业务并提供服务,更大限度的保证了业务连续性;同时保证了在边缘计算节点整体故障后,用户流量快速的转移到可以正常提供服务的备份边缘计算节点上,屏蔽了用户对边缘计算节点整体故障的感知,既能够实现边缘计算节点的容灾效果,又能保证业务的持续可用性。
相应的,本发明还提供一种客户端一侧的边缘计算节点的容灾处理方法。如图5所示,其为本发明实施例提供的边缘计算节点的容灾处理方法的流程示意图之二。
步骤501:在业务应用运行过程中,将所述业务应用的业务运行状态数据备份到对应的备份边缘计算节点中。
步骤502:根据预设的上报时间周期,将节点运行状态信息发送到服务器端的边缘计算运营管理平台。其中,所述节点运行状态信息包含状态标识字段和身份标识信息。
在具体实施过程中,目标边缘计算节点在业务应用运行过程中,将所述业务应用的业务运行状态数据备份到对应的备份边缘计算节点中,并根据预设的上报时间周期,将节点运行状态信息发送到服务器端的边缘计算运营管理平台。其中,所述节点运行状态信息包含状态标识字段和身份标识信息。
与上述提供的一种边缘计算节点的容灾处理方法相对应,本发明还提供一种边缘计算节点的容灾处理装置。由于该装置的实施例相似于上述方法实施例,所以描述得比较简单,相关之处请参见上述方法实施例部分的说明即可,下面描述的边缘计算节点的容灾处理装置的实施例仅是示意性的。请参考图6所示,其为本发明实施例提供的一种边缘计算节点的容灾处理装置的结构示意图之二。
业务运行状态数据备份单元601,用于在业务应用运行过程中,将所述业务应用的业务运行状态数据备份到对应的备份边缘计算节点中;
节点运行状态信息上报单元602,用于根据预设的上报时间周期,将节点运行状态信息发送到服务器端的边缘计算运营管理平台;其中,所述节点运行状态信息包含状态标识字段和身份标识信息。
采用本发明实施例所述的边缘计算节点的容灾处理方法和装置,通过建立边缘计算节点互备份的模式实现了数据在接近用户侧的容灾保障,能够保障在边缘计算节点整体故障后快速的在其他边缘计算节点构建业务并提供服务,更大限度的保证了业务连续性;同时保证了在边缘计算节点整体故障后,用户流量快速的转移到可以正常提供服务的备份边缘计算节点上,屏蔽了用户对边缘计算节点整体故障的感知,既能够实现边缘计算节点的容灾效果,又能保证业务的持续可用性。
与上述提供的边缘计算节点的容灾处理方法相对应,本发明还提供一种电子设备。由于该电子设备的实施例相似于上述方法实施例,所以描述得比较简单,相关之处请参见上述方法实施例部分的说明即可,下面描述的电子设备仅是示意性的。如图7所示,其为本发明实施例公开的一种电子设备的实体结构示意图。该电子设备可以包括:处理器(processor)701、存储器(memory)702和通信总线703,其中,处理器701,存储器702通过通信总线703完成相互间的通信,通过通信接口704与外部进行通信。处理器701可以调用存储器702中的逻辑指令,以执行边缘计算节点的容灾处理方法,该方法包括:确定目标边缘计算节点的异常状态;确定边缘计算节点集群中与所述目标边缘计算节点对应的备份边缘计算节点,以使所述备份边缘计算节点执行所述目标边缘计算节点的业务;其中,所述边缘计算节点集群包含所述目标边缘计算节点和所述第备份边缘计算节点;所述边缘计算节点集群中包含的边缘计算节点之间互为备份节点。或者包括:在业务应用运行过程中,将所述业务应用的业务运行状态数据备份到对应的备份边缘计算节点中;根据预设的上报时间周期,将节点运行状态信息发送到服务器端的边缘计算运营管理平台;其中,所述节点运行状态信息包含状态标识字段和身份标识信息。
此外,上述的存储器702中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明实施例还提供一种计算机程序产品,所述计算机程序产品包括存储在处理器可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法实施例所提供的边缘计算节点的容灾处理方法,该方法包括:确定目标边缘计算节点的异常状态;确定边缘计算节点集群中与所述目标边缘计算节点对应的备份边缘计算节点,以使所述备份边缘计算节点执行所述目标边缘计算节点的业务;其中,所述边缘计算节点集群包含所述目标边缘计算节点和所述第备份边缘计算节点;所述边缘计算节点集群中包含的边缘计算节点之间互为备份节点。或者包括:在业务应用运行过程中,将所述业务应用的业务运行状态数据备份到对应的备份边缘计算节点中;根据预设的上报时间周期,将节点运行状态信息发送到服务器端的边缘计算运营管理平台;其中,所述节点运行状态信息包含状态标识字段和身份标识信息。
又一方面,本发明实施例还提供一种处理器可读存储介质,所述处理器可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各实施例提供的边缘计算节点的容灾处理方法,该方法包括:确定目标边缘计算节点的异常状态;确定边缘计算节点集群中与所述目标边缘计算节点对应的备份边缘计算节点,以使所述备份边缘计算节点执行所述目标边缘计算节点的业务;其中,所述边缘计算节点集群包含所述目标边缘计算节点和所述第备份边缘计算节点;所述边缘计算节点集群中包含的边缘计算节点之间互为备份节点。或者包括:在业务应用运行过程中,将所述业务应用的业务运行状态数据备份到对应的备份边缘计算节点中;根据预设的上报时间周期,将节点运行状态信息发送到服务器端的边缘计算运营管理平台;其中,所述节点运行状态信息包含状态标识字段和身份标识信息。
所述处理器可读存储介质可以是处理器能够存取的任何可用介质或数据存储设备,包括但不限于磁性存储器(例如软盘、硬盘、磁带、磁光盘(MO)等)、光学存储器(例如CD、DVD、BD、HVD等)、以及半导体存储器(例如ROM、EPROM、EEPROM、非易失性存储器(NANDFLASH)、固态硬盘(SSD))等。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种边缘计算节点的容灾处理方法,其特征在于,包括:
确定目标边缘计算节点的异常状态;
确定边缘计算节点集群中与所述目标边缘计算节点对应的备份边缘计算节点,以使所述备份边缘计算节点执行所述目标边缘计算节点的业务;其中,所述边缘计算节点集群包含所述目标边缘计算节点和所述第备份边缘计算节点;所述边缘计算节点集群中包含的边缘计算节点之间互为备份节点。
2.根据权利要求1所述的边缘计算节点的容灾处理方法,其特征在于,所述确定目标边缘计算节点的异常状态,具体包括:
基于预设的边缘计算运营管理平台获取所述目标边缘计算节点上报的节点运行状态信息;基于所述节点运行状态信息确定所述目标边缘计算节点的异常状态;其中,所述节点运行状态信息包含状态标识字段和身份标识信息;或者,
若超过预设时限阈值未收到所述目标边缘计算节点上报的节点运行状态信息,则确定所述目标边缘计算节点为异常状态;或者,
利用所述边缘计算运营管理平台主动通过网络协议向所述目标边缘计算节点发送建立连接请求,若超过预设时限阈值未收到回复信息,则确定所述目标边缘计算节点为异常状态。
3.根据权利要求1所述的边缘计算节点的容灾处理方法,其特征在于,所述确定边缘计算节点集群中与所述目标边缘计算节点对应的备份边缘计算节点,以使所述备份边缘计算节点执行所述目标边缘计算节点的业务,具体包括:
基于所述目标边缘计算节点上报的节点运行状态信息,确定所述备份边缘计算节点;其中,所述节点运行状态信息包含所述目标边缘计算节点对应的所述备份边缘计算节点的身份标识信息;
基于所述边缘计算运营管理平台将预设的分流策略发送给核心网控制面网元,并通过所述核心网控制面网元将所述分流策略发送给第一用户端口功能网元和第二用户端口功能网元;
确定用户端连接到基站,并通过所述基站连接到所述第一用户端口功能网元之后,通过所述第一用户端口功能网元根据更新后的所述分流策略将数据访问请求分流到所述第二用户端口功能网元,并通过所述第二用户端口功能网元根据更新后的所述分流策略将数据访问请求发送到所述备份边缘计算节点,以使所述备份边缘计算节点执行所述目标边缘计算节点的业务。
4.根据权利要求3所述的边缘计算节点的容灾处理方法,其特征在于,还包括:基于边缘计算运营管理平台将业务配置数据下发到所述备份边缘计算节点上,以使所述备份边缘计算节点上运行所述目标边缘计算节点上的业务应用;并将所述备份边缘计算节点中从所述目标边缘计算节点上预先备份过来的业务运行状态数据与所述业务应用进行关联,以使所述业务应用的运行状态数据由所述目标边缘计算节点完全迁移到所述备份边缘计算节点。
5.根据权利要求1所述的边缘计算节点的容灾处理方法,其特征在于,所述目标边缘计算节点与所述备份边缘计算节点之间为直连网络。
6.一种边缘计算节点的容灾处理方法,其特征在于,包括:
在业务应用运行过程中,将所述业务应用的业务运行状态数据备份到对应的备份边缘计算节点中;
根据预设的上报时间周期,将节点运行状态信息发送到服务器端的边缘计算运营管理平台;其中,所述节点运行状态信息包含状态标识字段和身份标识信息。
7.一种边缘计算节点的容灾处理装置,其特征在于,包括:
异常状态确定单元,用于确定目标边缘计算节点的异常状态;
备份边缘计算节点确定单元,用于确定边缘计算节点集群中与所述目标边缘计算节点对应的备份边缘计算节点,以使所述备份边缘计算节点执行所述目标边缘计算节点的业务;
其中,所述边缘计算节点集群包含所述目标边缘计算节点和所述第备份边缘计算节点;所述边缘计算节点集群中包含的边缘计算节点之间互为备份节点。
8.一种边缘计算节点的容灾处理装置,其特征在于,包括:
业务运行状态数据备份单元,用于在业务应用运行过程中,将所述业务应用的业务运行状态数据备份到对应的备份边缘计算节点中;
节点运行状态信息上报单元,用于根据预设的上报时间周期,将节点运行状态信息发送到服务器端的边缘计算运营管理平台;其中,所述节点运行状态信息包含状态标识字段和身份标识信息。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-6任意一项所述的边缘计算节点的容灾处理方法的步骤。
10.一种处理器可读存储介质,所述处理器可读存储介质上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1-6任意一项所述的边缘计算节点的容灾处理方法的步骤。
CN202110580319.6A 2021-05-26 2021-05-26 一种边缘计算节点的容灾处理方法及装置 Pending CN115408199A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110580319.6A CN115408199A (zh) 2021-05-26 2021-05-26 一种边缘计算节点的容灾处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110580319.6A CN115408199A (zh) 2021-05-26 2021-05-26 一种边缘计算节点的容灾处理方法及装置

Publications (1)

Publication Number Publication Date
CN115408199A true CN115408199A (zh) 2022-11-29

Family

ID=84154762

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110580319.6A Pending CN115408199A (zh) 2021-05-26 2021-05-26 一种边缘计算节点的容灾处理方法及装置

Country Status (1)

Country Link
CN (1) CN115408199A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116887220A (zh) * 2023-08-10 2023-10-13 谷梵科技(青田)有限公司 基于云边协同的v2x服务高可用方法、系统、装置及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116887220A (zh) * 2023-08-10 2023-10-13 谷梵科技(青田)有限公司 基于云边协同的v2x服务高可用方法、系统、装置及存储介质
CN116887220B (zh) * 2023-08-10 2024-05-24 谷梵科技(青田)有限公司 基于云边协同的v2x服务高可用方法、系统、装置及存储介质

Similar Documents

Publication Publication Date Title
CN111095869B (zh) 对计算机网络的高可用性增强的方法和系统
CN112181660A (zh) 一种基于服务器集群的高可用方法
CN105515812A (zh) 资源的故障处理方法及装置
CN104717077B (zh) 一种管理数据中心的方法、装置及系统
CN109861867B (zh) 一种mec业务处理方法及装置
CN103812675A (zh) 一种实现业务交付平台异地容灾切换的方法和系统
CN107276839B (zh) 一种云平台的自监控方法和系统
CN101056254B (zh) 一种网络存储设备的扩展方法、系统及其装置
CN112491700A (zh) 网络路径调整方法、系统、装置、电子设备及存储介质
CN109254876A (zh) 云计算系统中数据库的管理方法和装置
US20140050092A1 (en) Load sharing method and apparatus
CN114465948B (zh) 主备容灾方法、装置、设备及介质
CN114553900B (zh) 一种分布式块存储管理系统、方法及电子设备
CN115408199A (zh) 一种边缘计算节点的容灾处理方法及装置
US11258632B2 (en) Unavailable inter-chassis link storage area network access system
CN111953808A (zh) 一种双机双活架构的数据传输切换方法及架构构建系统
CN102185720A (zh) 一种北向通知管理接口装置及其管理方法
JP2018056633A (ja) クラスタシステム、サーバ、サーバの動作方法、及びプログラム
WO2021249173A1 (zh) 一种分布式存储系统及其异常处理方法和相关装置
CN114727324A (zh) 网络容灾处理方法、装置、存储介质及电子设备
CN117478488B (zh) 一种云管理平台切换的系统、方法、设备及介质
Kitamura Configuration of a Power-saving High-availability Server System Incorporating a Hybrid Operation Method
WO2023274164A1 (zh) 主备自动切换方法、控制面设备、vBRAS系统和存储介质
CN115801789B (zh) 一种物联网数据汇聚系统及方法
CN117560268A (zh) 集群管理方法及相关装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination