CN112860435A - 一种5g场景下解决边缘节点可用性的方法 - Google Patents

一种5g场景下解决边缘节点可用性的方法 Download PDF

Info

Publication number
CN112860435A
CN112860435A CN202110129263.2A CN202110129263A CN112860435A CN 112860435 A CN112860435 A CN 112860435A CN 202110129263 A CN202110129263 A CN 202110129263A CN 112860435 A CN112860435 A CN 112860435A
Authority
CN
China
Prior art keywords
cluster
node
edge node
network
kubel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110129263.2A
Other languages
English (en)
Other versions
CN112860435B (zh
Inventor
王俊
蒋宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tibet Ningsuan Technology Group Co ltd
Original Assignee
Tibet Ningsuan Technology Group Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tibet Ningsuan Technology Group Co ltd filed Critical Tibet Ningsuan Technology Group Co ltd
Priority to CN202110129263.2A priority Critical patent/CN112860435B/zh
Publication of CN112860435A publication Critical patent/CN112860435A/zh
Application granted granted Critical
Publication of CN112860435B publication Critical patent/CN112860435B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5061Partitioning or combining of resources
    • G06F9/5077Logical partitioning of resources; Management or configuration of virtualized resources
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/45595Network integration; Enabling network access in virtual machine instances
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明涉及一种5G场景下解决边缘节点可用性的方法,所述的方法基于原生kubernetes,在Master节点新增一个数据控制器,在边缘节点增加一个缓存组件。本发明有益效果为,缓存组件会代理Worker节点kubelet对Master节点的请求,并在集群网络故障时充当心跳服务器,防止Worker进行Pod驱逐。

Description

一种5G场景下解决边缘节点可用性的方法
技术领域
本发明涉及计算机领域中的云计算领域,特别涉及一种5G场景下边缘节点可用性的方法。
背景技术
Kubernetes是自动化容器操作的开源平台,可以实现容器集群的自动化部署、自动扩缩容、维护等功能。一般而言一个Kubernetes集群由多台主机构成,主机分为Master和Worker两种角色,Master角色负责集群管控和容器的调度,Worker节点承载实际的应用负载。集群中运行的业务应用会以统一的格式储存在Master节点的数据库中,Worker会定时去拉取数据并缓存在本地。另外Worker节点会定时上报自身状态,以便Master节点在感知到Worker节点发生故障后可以及时将应用负载转移到其他可用Worker节点,实现业务的重启。Worker节点在向Master上报自身状态失败后会认为自身已经脱离集群,会将自身运行的应用负载“驱逐”,即删除停止业务运行并删除相应容器。在一个中心加边缘侧部署的Kubernetes集群中,边缘节点可以依托5G网络的边缘侧对外提供服务,业务流量不必流向中心网,提高了整个网络的处理能力。在这种场景下,Worker节点与Master节点之间的通信故障不意味Worker节点无法对外提供服务,但是Worker节点依然会对自身运行的应用负载进行驱逐。
发明内容
针对现有技术存在的不足,本发明的目的在于提供一种5G场景下解决边缘节点可用性的方法。本发明的上述技术目的是通过以下技术方案得以实现的:
一种5G场景下解决边缘节点可用性的方法,基于原生kubernetes,在Master节点新增一个数据控制器,在边缘节点增加一个缓存组件。
数据控制器通过kubernetes提供的API监测边缘节点状态,当集群网络故障时,控制器开始监听Kubernetes集群etcd数据库变更,并将变更通过5G无线网络推送到边缘Worker节点的缓存组件。
数据控制器定时从Kubernetes集群拉取边缘节点状态信息,并在边缘节点与集群出现网络故障后使用专线将集群数据库的变更推送到边缘节点缓存组件。
数据控制器拉取集群边缘节点信息通过调用Kubernetes提供的API实现,当边缘节点状态显示为“NotReady”表示边缘节点已经脱离集群,需要控制器推送集群数据库变更。
边缘节点缓存组件的作用分为两部分:在集群网络正常时,作为透明代理,将边缘节点kubelet对集群的数据库的访问代理到真正的Master节点;在集群网络异常时,缓存Master节点数据控制器推送的集群数据库变更,并返回给节点kubelet。
在集群网络异常时,即当集群网连接出现故障时,边缘节点无法通过集群网络连接拉取集群数据库变更,此时数据控制器会通过专用的5G无线网络将集群数据库变更推送到边缘节点;同时,缓存组件的行为变化为:1)充当心跳服务器,正常返回kubelet的心跳请求,阻止Worker节点因为自身状态异常驱逐Pod;2)接收并缓存数据控制器发送的集群数据库变更,当kubelet查询集群数据库变更时返回缓存的数据;等到集群网络恢复,数据控制器便会停止推送数据库变化,将控制权交回,缓存组件也会开始正常代理kubelet请求。
本发明有益效果为,本发明通过在Master节点增加一个控制器实现和在边缘Worker节点增加一个缓存组件实现。缓存组件会代理Worker节点kubelet对Master节点的请求,并在集群网络故障时充当心跳服务器,防止Worker进行Pod驱逐。缓存组件通过专用5G无线网络与Master节点数据控制器通信,在集群网络故障时,从该专线网络接收集群数据库变更,Worker节点始终从缓存组件拉取集群数据库变更。Master节点控制器定时拉取各个边缘Worker节点的可用性,并在Worker节点不可用时通过5G无线网络推送集群数据库变更到边缘Worker节点的缓存组件。
下面采用附图和具体实施方式对本发明作进一步详细说明。
附图说明
图1为实施例中集群的架构图;
图2为实施例中集群网络异常示例图。
具体实施方式
一种5G场景下解决边缘节点可用性的方法,基于原生kubernetes,在Master节点新增一个数据控制器,在边缘节点增加一个缓存组件。
数据控制器通过kubernetes提供的API监测边缘节点状态,当集群网络故障时,控制器开始监听Kubernetes集群etcd数据库变更,并将变更通过5G无线网络推送到边缘Worker节点的缓存组件。
数据控制器定时从Kubernetes集群拉取边缘节点状态信息,并在边缘节点与集群出现网络故障后使用专线将集群数据库的变更推送到边缘节点缓存组件。
数据控制器拉取集群边缘节点信息通过调用Kubernetes提供的API实现,当边缘节点状态显示为“NotReady”表示边缘节点已经脱离集群,需要控制器推送集群数据库变更。
边缘节点缓存组件的作用分为两部分:在集群网络正常时,作为透明代理,将边缘节点kubelet对集群的数据库的访问代理到真正的Master节点;在集群网络异常时,缓存Master节点数据控制器推送的集群数据库变更,并返回给节点kubelet。
在集群网络异常时,即当集群网连接出现故障时,边缘节点无法通过集群网络连接拉取集群数据库变更,此时数据控制器会通过专用的5G无线网络将集群数据库变更推送到边缘节点;同时,缓存组件的行为变化为:1)充当心跳服务器,正常返回kubelet的心跳请求,阻止Worker节点因为自身状态异常驱逐Pod;2)接收并缓存数据控制器发送的集群数据库变更,当kubelet查询集群数据库变更时返回缓存的数据;等到集群网络恢复,数据控制器便会停止推送数据库变化,将控制权交回,缓存组件也会开始正常代理kubelet请求。
Kubernetes集群中位于中心网的Master节点位于边缘网的Worker节点网络连接关系如图1:
边缘节点并不直接与Master节点通信,边缘节点kubelet进程对Master的访问通过缓存组件代理实现。
边缘缓存组件拥有两条网络线路,一条是正常的Kubernetes集群网络,缓存组件优先使用该网络代理kubelet的请求到Master节点。另一条是专用的5G无线网络线路,使用IPv6协议栈,确保Master节点数据控制器可以直接与边缘节点缓存组件通信。
边缘Worker节点kubelet对Master节点的访问将由缓存组件代理,当集群网络可用时,缓存组件将kubelet请求直接代理到Master节点。
当集群网连接出现故障时,边缘节点无法通过集群网络连接拉取集群数据库变更(如图2所示),此时数据控制器会通过专用的5G无线网络将集群数据库变更推送到边缘节点。同时,缓存组件的行为发生如下变化:
1.充当心跳服务器,正常返回kubelet的心跳请求,阻止Worker节点因为自身状态异常驱逐Pod。
2.接收并缓存数据控制器发送的集群数据库变更,当kubelet查询集群数据库变更时返回缓存的数据。等到集群网络恢复,数据控制器便会停止推送数据库变化,将控制权交回,缓存组件也会开始正常代理kubelet请求。
以上所述的仅是本发明的部分具体实施例(由于本发明的实施例不能穷举,本发明所记载的保护范围以本发明的记载范围和其他技术要点范围为准),方案中公知的具体内容或常识在此未作过多描述。应当指出,上述实施例不以任何方式限制本发明,对于本领域的技术人员来说,凡是采用等同替换或等效变换的方式获得的技术方案均落在本发明的保护范围内。本申请要求的保护范围应当以其权利要求的内容为准,说明书中的具体实施方式等记载可以用于解释权利要求的内容。

Claims (6)

1.一种5G场景下解决边缘节点可用性的方法,其特征在于,所述的方法基于原生kubernetes,在Master节点新增一个数据控制器,在边缘节点增加一个缓存组件。
2.根据权利要求1所述的5G场景下解决边缘节点可用性的方法,其特征在于,所述的数据控制器通过kubernetes提供的API监测边缘节点状态,当集群网络故障时,控制器开始监听Kubernetes集群etcd数据库变更,并将变更通过5G无线网络推送到边缘Worker节点的缓存组件。
3.根据权利要求1所述的5G场景下解决边缘节点可用性的方法,其特征在于,所述的数据控制器定时从Kubernetes集群拉取边缘节点状态信息,并在边缘节点与集群出现网络故障后使用专线将集群数据库的变更推送到边缘节点缓存组件。
4.根据权利要求1所述的5G场景下解决边缘节点可用性的方法,其特征在于,所述的数据控制器拉取集群边缘节点信息通过调用Kubernetes提供的API实现,当边缘节点状态显示为“NotReady”表示边缘节点已经脱离集群,需要控制器推送集群数据库变更。
5.根据权利要求1所述的5G场景下解决边缘节点可用性的方法,其特征在于,所述的边缘节点缓存组件的作用分为两部分:在集群网络正常时,作为透明代理,将边缘节点kubelet对集群的数据库的访问代理到真正的Master节点;
在集群网络异常时,缓存Master节点数据控制器推送的集群数据库变更,并返回给节点kubelet。
6.根据权利要求5所述的5G场景下解决边缘节点可用性的方法,其特征在于,在集群网络异常时,即当集群网连接出现故障时,边缘节点无法通过集群网络连接拉取集群数据库变更,此时数据控制器会通过专用的5G无线网络将集群数据库变更推送到边缘节点;同时,缓存组件的行为变化为:1)充当心跳服务器,正常返回kubelet的心跳请求,阻止Worker节点因为自身状态异常驱逐Pod;2)接收并缓存数据控制器发送的集群数据库变更,当kubelet查询集群数据库变更时返回缓存的数据;等到集群网络恢复,数据控制器便会停止推送数据库变化,将控制权交回,缓存组件也会开始正常代理kubelet请求。
CN202110129263.2A 2021-01-29 2021-01-29 一种5g场景下解决边缘节点可用性的方法 Active CN112860435B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110129263.2A CN112860435B (zh) 2021-01-29 2021-01-29 一种5g场景下解决边缘节点可用性的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110129263.2A CN112860435B (zh) 2021-01-29 2021-01-29 一种5g场景下解决边缘节点可用性的方法

Publications (2)

Publication Number Publication Date
CN112860435A true CN112860435A (zh) 2021-05-28
CN112860435B CN112860435B (zh) 2023-08-01

Family

ID=75987112

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110129263.2A Active CN112860435B (zh) 2021-01-29 2021-01-29 一种5g场景下解决边缘节点可用性的方法

Country Status (1)

Country Link
CN (1) CN112860435B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109039723A (zh) * 2018-07-23 2018-12-18 郑州云海信息技术有限公司 基于数据库集群的网络维护方法及系统
CN109831500A (zh) * 2019-01-30 2019-05-31 无锡华云数据技术服务有限公司 Kubernetes集群中配置文件与Pod的同步方法
CN110825495A (zh) * 2019-11-08 2020-02-21 北京浪潮数据技术有限公司 一种容器云平台的恢复方法、装置、设备及可读存储介质
CN111339118A (zh) * 2020-03-27 2020-06-26 中国建设银行股份有限公司 基于Kubernetes的资源变更历史记录方法及装置
CN111783102A (zh) * 2020-06-30 2020-10-16 福建健康之路信息技术有限公司 一种安全驱逐Kubernetes集群中节点的方法和存储设备
CN111857975A (zh) * 2020-07-30 2020-10-30 杭州安恒信息技术股份有限公司 一种服务更新方法、装置、设备及介质
CN112035217A (zh) * 2020-08-31 2020-12-04 腾讯科技(深圳)有限公司 集群的处理方法、装置、电子设备及计算机可读存储介质
US20210021619A1 (en) * 2020-09-26 2021-01-21 Ned M. Smith Trust-based orchestration of an edge node

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109039723A (zh) * 2018-07-23 2018-12-18 郑州云海信息技术有限公司 基于数据库集群的网络维护方法及系统
CN109831500A (zh) * 2019-01-30 2019-05-31 无锡华云数据技术服务有限公司 Kubernetes集群中配置文件与Pod的同步方法
CN110825495A (zh) * 2019-11-08 2020-02-21 北京浪潮数据技术有限公司 一种容器云平台的恢复方法、装置、设备及可读存储介质
CN111339118A (zh) * 2020-03-27 2020-06-26 中国建设银行股份有限公司 基于Kubernetes的资源变更历史记录方法及装置
CN111783102A (zh) * 2020-06-30 2020-10-16 福建健康之路信息技术有限公司 一种安全驱逐Kubernetes集群中节点的方法和存储设备
CN111857975A (zh) * 2020-07-30 2020-10-30 杭州安恒信息技术股份有限公司 一种服务更新方法、装置、设备及介质
CN112035217A (zh) * 2020-08-31 2020-12-04 腾讯科技(深圳)有限公司 集群的处理方法、装置、电子设备及计算机可读存储介质
US20210021619A1 (en) * 2020-09-26 2021-01-21 Ned M. Smith Trust-based orchestration of an edge node

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
JUSTIN CAPPOS等: "EdgeNet: A Global Cloud That Spreads by Local Action", 《2018 IEEE/ACM SYMPOSIUM ON EDGE COMPUTING (SEC)》, pages 359 - 360 *
腾讯云原生: "一文读懂 SuperEdge 边缘容器架构与原理", pages 1 - 7, Retrieved from the Internet <URL:https://blog.csdn.net/yunxiao6/article/details/112647987> *
阮正平等: "基于KubeEdge架构的边缘智能设备管理研究", 《电力信息与通信技术》, vol. 18, no. 2, pages 63 - 68 *

Also Published As

Publication number Publication date
CN112860435B (zh) 2023-08-01

Similar Documents

Publication Publication Date Title
CN111615066B (zh) 一种基于广播的分布式微服务注册及调用方法
CN101876924B (zh) 数据库故障自动检测及转移方法
CN103905397B (zh) 数据同步方法和系统
US20140108347A1 (en) System and method for providing partition persistent state consistency in a distributed data grid
US7518983B2 (en) Proxy response apparatus
US20060242297A1 (en) Database cluster systems and methods for maintaining client connections
CN108572976A (zh) 一种分布式数据库中数据恢复方法、相关设备和系统
CN105472002A (zh) 基于集群节点间即时拷贝的会话同步方法
CN101262369B (zh) 调度服务器的主备实现方法及调度服务器
CN201497981U (zh) 数据库故障自动检测及转移系统
CN103207841A (zh) 基于键值对缓存的数据读写方法及装置
CN107623703B (zh) 全局事务标识gtid的同步方法、装置及系统
US20130139178A1 (en) Cluster management system and method
CN108055333A (zh) 一种基于ufs的nas-cifs集群负载均衡方法
CN110944044B (zh) 一种分布式api网关系统及其实现方法
CN111371625A (zh) 一种双机热备的实现方法
CN104782081B (zh) 用于转移套接字状态的系统以及用于迁移tcp连接的方法
CN108509297A (zh) 一种数据备份方法和系统
CN113946408A (zh) 云原生边缘容器控制方法、系统及存储介质
CN112860435A (zh) 一种5g场景下解决边缘节点可用性的方法
CN109348073B (zh) 呼叫中心系统及其业务处理方法
CN114553900B (zh) 一种分布式块存储管理系统、方法及电子设备
WO2022222403A1 (zh) 任务分发系统、方法、装置、计算机设备及存储介质
CN113518131B (zh) 一种网络异常的传输数据容错处理方法、装置及系统
CN115514698A (zh) 协议计算方法、交换机、跨设备链路聚合系统及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant