CN112241342A - 一种实现容器云节点自治的方法及系统 - Google Patents

一种实现容器云节点自治的方法及系统 Download PDF

Info

Publication number
CN112241342A
CN112241342A CN202011136226.6A CN202011136226A CN112241342A CN 112241342 A CN112241342 A CN 112241342A CN 202011136226 A CN202011136226 A CN 202011136226A CN 112241342 A CN112241342 A CN 112241342A
Authority
CN
China
Prior art keywords
node
container
service
autonomy
hosting service
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011136226.6A
Other languages
English (en)
Inventor
石光银
蔡卫卫
高传集
孙思清
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Cloud Information Technology Co Ltd
Original Assignee
Inspur Cloud Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Cloud Information Technology Co Ltd filed Critical Inspur Cloud Information Technology Co Ltd
Priority to CN202011136226.6A priority Critical patent/CN112241342A/zh
Publication of CN112241342A publication Critical patent/CN112241342A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/4557Distribution of virtual machine instances; Migration and load balancing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明涉及容器云节点技术领域,具体提供了一种实现容器云节点自治的方法及系统,调用Api服务器创建容器组,容器云通过节点调度策略给容器组分配节点,节点内包括节点托管服务和资源管理服务,所述节点托管服务用于完成节点自治功能,所述资源管理服务调用节点托管服务,获取节点的资源信息;节点自治控制器检测节点是否异常和具有节点生命周期管理的功能。与现有技术相比,本发明提升了容器云的节点自治能力,保证了自治节点的容器应用稳定工作,降低了应用的响应时间,提升了应用的反应速度,提升了容器云的应用稳定性。

Description

一种实现容器云节点自治的方法及系统
技术领域
本发明涉及容器云节点技术领域,具体提供一种实现容器云节点自治的方法及系统。
背景技术
Kubernetes是一个全新的基于容器技术的分布式架构领先方案,为容器化的应用提供部署运行、资源调度、服务发现和动态伸缩等一系列功能,提高了大规模容器集群管理的便捷性和高可用性。
当应用以容器形式运行的容器云时,当容器所在节点网络中断或资源管理服务异常时,容器云的Master节点会检测到这个异常,把异常节点的容器迁移到别的节点上,会造成容器应用中断。当应用使用多副本时,应用通过负载均衡保证持续工作。但是当资源不足或网络不稳定时,会造成容器的频繁漂移,应用容器的频繁漂移会造成应用的不可用和响应慢等问题。
发明内容
本发明是针对上述现有技术的不足,提供一种实用性强的实现容器云节点自治的方法
本发明进一步的技术任务是提供一种设计合理,安全适用的实现容器云节点自治系统。
本发明解决其技术问题所采用的技术方案是:
一种实现容器云节点自治的方法,调用Api服务器创建容器组,容器云通过节点调度策略给容器组分配节点,节点内包括节点托管服务和资源管理服务,所述节点托管服务用于完成节点自治功能,所述资源管理服务调用节点托管服务,获取节点的资源信息;节点自治控制器检测节点是否异常和具有节点生命周期管理的功能。
进一步的,所述节点自治控制器当检测到节点异常后,先判断容器组所在节点是否是自治节点,若是,则不做相应处理;
若不是自治节点,处理节点上的容器组,包括驱逐和状态修改。
作为优选,所述节点自治控制器包括配置、领导者选举、节点处理、容器组处理、污点处理、驱逐处理和节点监控的节点生命周期管理功能。
作为优选,所述节点托管服务包括配置、服务、认证、健康检查、服务代理、本地缓存、本地存储和存储数据GC的功能。
进一步的,所述节点托管服务用于完成节点自治功能的实现方法如下:
当节点托管服务所在节点能连上Api服务器时,会通过远程代理访问Api服务器,并更新本地存储数据;
当节点托管服务所在节点不能连上Api服务器时,会通过本地代理反馈给所述资源管理服务,保证节点资源状态、事件信息不变更。
进一步的,所述资源管理服务从所述节点托管服务获取到节点资源信息后,对所在节点的容器组生命周期进行管理。
一种实现容器云节点自治的系统,调用Api服务器创建容器组,容器云通过节点调度策略给容器组分配节点,所述节点包括节点托管服务模块和资源管理服务模块,
所述节点托管服务模块所在节点能连上Api服务器时,会通过远程代理访问Api服务器,并更新本地存储数据;当节点托管服务所在节点不能连上Api服务器时,会通过本地代理反馈给所述资源管理服务,保证节点资源状态、事件信息不变更;
所述资源管理服务模块调用节点托管服务模块,从节点托管服务模块获取到所在节点资源信息后,对本节点的容器组的生命周期进行管理;
节点自治控制器模块用于检测节点是否异常和具有节点生命周期管理的功能。
进一步的,所述节点自治控制器模块当检测到节点异常后,先判断容器组所在节点是否是自治节点,若是,则不做相应处理;
若不是自治节点,处理节点上的容器组,包括驱逐和状态修改。
作为优选,所述节点自治控制器模块用于配置、领导者选举、节点处理、容器组处理、污点处理、驱逐处理和节点监控。
作为优选,所述节点托管服务用于配置、服务、认证、健康检查、服务代理、本地缓存、本地存储和存储数据GC。
本发明的一种实现容器云节点自治的方法及系统和现有技术相比,具有以下突出的有益效果:
通过使用本发明,提升了容器云的节点自治能力,保证了自治节点的容器应用稳定工作,降低了应用的响应时间,提升了应用的反应速度,提升了容器云的应用稳定性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
附图1是一种实现容器云节点自治的方法的流程示意图(一);
附图2是一种实现容器云节点自治的方法的流程示意图(二);
附图3是一种实现容器云节点自治的方法的流程示意图(三)。
具体实施方式
为了使本技术领域的人员更好的理解本发明的方案,下面结合具体的实施方式对本发明作进一步的详细说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例都属于本发明保护的范围。
下面给出一个最佳实施例:
如图1-3所示,本实施例中的一种实现容器云节点自治的方法,调用Api服务器创建容器组,容器云通过节点调度策略给容器组分配节点,节点内包括节点托管服务和资源管理服务,节点托管服务用于完成节点自治功能,资源管理服务调用节点托管服务,获取节点的资源信息,节点自治控制器检测节点是否异常和具有节点生命周期管理的功能。
节点自治控制器当检测到节点异常后,先判断容器组所在节点是否是自治节点,若是,则不做相应处理;
若不是自治节点,处理节点上的容器组,包括驱逐和状态修改。
其中,节点自治控制器包括配置、领导者选举、节点处理、容器组处理、污点处理、驱逐处理和节点监控的节点生命周期管理功能。
节点托管服务包括配置、服务、认证、健康检查、服务代理、本地缓存、本地存储和存储数据GC的功能。
节点托管服务用于完成节点自治功能的实现方法如下:
当节点托管服务所在节点能连上Api服务器时,会通过远程代理访问Api服务器,并更新本地存储数据;
当节点托管服务所在节点不能连上Api服务器时,会通过本地代理反馈给所述资源管理服务,保证节点资源状态、事件信息不变更。
资源管理服务从所述节点托管服务获取到节点资源信息后,对所在节点的容器组生命周期进行管理。
运行上述方法的系统为:
一种实现容器云节点自治的系统,调用Api服务器创建容器组,容器云通过节点调度策略给容器组分配节点,所述节点包括节点托管服务模块和资源管理服务模块,
所述节点托管服务模块所在节点能连上Api服务器时,会通过远程代理访问Api服务器,并更新本地存储数据;当节点托管服务所在节点不能连上Api服务器时,会通过本地代理反馈给所述资源管理服务,保证节点资源状态、事件信息不变更;
所述资源管理服务模块调用节点托管服务模块,从节点托管服务模块获取到所在节点资源信息后,对本节点的容器组的生命周期进行管理;
节点自治控制器模块用于检测节点是否异常和具有节点生命周期管理的功能。
节点自治控制器模块当检测到节点异常后,先判断容器组所在节点是否是自治节点,若是,则不做相应处理;
若不是自治节点,处理节点上的容器组,包括驱逐和状态修改。
其中,节点自治控制器模块用于配置、领导者选举、节点处理、容器组处理、污点处理、驱逐处理和节点监控。
节点托管服务用于配置、服务、认证、健康检查、服务代理、本地缓存、本地存储和存储数据GC。
上述具体的实施方式仅是本发明具体的个案,本发明的专利保护范围包括但不限于上述具体的实施方式,任何符合本发明的一种实现容器云节点自治的方法权利要求书的且任何所述技术领域普通技术人员对其做出的适当变化或者替换,皆应落入本发明的专利保护范围。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (10)

1.一种实现容器云节点自治的方法,其特征在于,调用Api服务器创建容器组,容器云通过节点调度策略给容器组分配节点,节点内包括节点托管服务和资源管理服务,所述节点托管服务用于完成节点自治功能,所述资源管理服务调用节点托管服务,获取节点的资源信息;节点自治控制器检测节点是否异常和具有节点生命周期管理的功能。
2.根据权利要求1所述的一种实现容器云节点自治的方法,其特征在于,所述节点自治控制器当检测到节点异常后,先判断容器组所在节点是否是自治节点,若是,则不做相应处理;
若不是自治节点,处理节点上的容器组,包括驱逐和状态修改。
3.根据权利要求1或2所述的一种实现容器云节点自治的方法,其特征在于,所述节点自治控制器包括配置、领导者选举、节点处理、容器组处理、污点处理、驱逐处理和节点监控的节点生命周期管理功能。
4.根据权利要求1所述的一种实现容器云节点自治的方法,其特征在于,所述节点托管服务包括配置、服务、认证、健康检查、服务代理、本地缓存、本地存储和存储数据GC的功能。
5.根据权利要求4所述的一种实现容器云节点自治的方法,其特征在于,所述节点托管服务用于完成节点自治功能的实现方法如下:
当节点托管服务所在节点能连上Api服务器时,会通过远程代理访问Api服务器,并更新本地存储数据;
当节点托管服务所在节点不能连上Api服务器时,会通过本地代理反馈给所述资源管理服务,保证节点资源状态、事件信息不变更。
6.根据权利要求1所述的一种实现容器云节点自治的方法,其特征在于,所述资源管理服务从所述节点托管服务获取到节点资源信息后,对所在节点的容器组生命周期进行管理。
7.一种实现容器云节点自治的系统,其特征在于,调用Api服务器创建容器组,容器云通过节点调度策略给容器组分配节点,所述节点包括节点托管服务模块和资源管理服务模块,
所述节点托管服务模块所在节点能连上Api服务器时,会通过远程代理访问Api服务器,并更新本地存储数据;当节点托管服务所在节点不能连上Api服务器时,会通过本地代理反馈给所述资源管理服务,保证节点资源状态、事件信息不变更;
所述资源管理服务模块调用节点托管服务模块,从节点托管服务模块获取到所在节点资源信息后,对本节点的容器组的生命周期进行管理;
节点自治控制器模块用于检测节点是否异常和具有节点生命周期管理的功能。
8.根据权利要求7所述的一种实现容器云节点自治的系统,其特征在于,所述节点自治控制器模块当检测到节点异常后,先判断容器组所在节点是否是自治节点,若是,则不做相应处理;
若不是自治节点,处理节点上的容器组,包括驱逐和状态修改。
9.根据权利要求8所述的一种实现容器云节点自治的系统,其特征在于,所述节点自治控制器模块用于配置、领导者选举、节点处理、容器组处理、污点处理、驱逐处理和节点监控。
10.根据权利要求9所述的一种实现容器云节点自治的系统,其特征在于,所述节点托管服务用于配置、服务、认证、健康检查、服务代理、本地缓存、本地存储和存储数据GC。
CN202011136226.6A 2020-10-22 2020-10-22 一种实现容器云节点自治的方法及系统 Pending CN112241342A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011136226.6A CN112241342A (zh) 2020-10-22 2020-10-22 一种实现容器云节点自治的方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011136226.6A CN112241342A (zh) 2020-10-22 2020-10-22 一种实现容器云节点自治的方法及系统

Publications (1)

Publication Number Publication Date
CN112241342A true CN112241342A (zh) 2021-01-19

Family

ID=74168195

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011136226.6A Pending CN112241342A (zh) 2020-10-22 2020-10-22 一种实现容器云节点自治的方法及系统

Country Status (1)

Country Link
CN (1) CN112241342A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060200494A1 (en) * 2005-03-02 2006-09-07 Jonathan Sparks Automated discovery and inventory of nodes within an autonomic distributed computing system
CN110784347A (zh) * 2019-10-18 2020-02-11 北京浪潮数据技术有限公司 一种容器集群的节点管理方法、系统、设备及存储介质
CN110780822A (zh) * 2019-10-28 2020-02-11 浪潮云信息技术有限公司 一种管理容器云本地存储系统及实现方法
CN111090495A (zh) * 2019-12-02 2020-05-01 中兴通讯股份有限公司 节点管理方法、装置、设备、存储介质和系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060200494A1 (en) * 2005-03-02 2006-09-07 Jonathan Sparks Automated discovery and inventory of nodes within an autonomic distributed computing system
CN110784347A (zh) * 2019-10-18 2020-02-11 北京浪潮数据技术有限公司 一种容器集群的节点管理方法、系统、设备及存储介质
CN110780822A (zh) * 2019-10-28 2020-02-11 浪潮云信息技术有限公司 一种管理容器云本地存储系统及实现方法
CN111090495A (zh) * 2019-12-02 2020-05-01 中兴通讯股份有限公司 节点管理方法、装置、设备、存储介质和系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
黄玉奇: "阿里云如何基于标准K8s打造边缘计算云原生基础设施", 《阿里云开发者社区》 *

Similar Documents

Publication Publication Date Title
US10277525B2 (en) Method and apparatus for disaggregated overlays via application services profiles
US9141491B2 (en) Highly available server system based on cloud computing
CN106657314B (zh) 跨数据中心数据同步系统及方法
US8209272B2 (en) Dynamic computation of optimal placement for services in a distributed computing system
US20100077250A1 (en) Virtualization based high availability cluster system and method for managing failure in virtualization based high availability cluster system
US7870425B2 (en) De-centralized nodal failover handling
US20080256238A1 (en) Method and system for utilizing a resource conductor to optimize resource management in a distributed computing environment
CN109783151B (zh) 规则变更的方法和装置
CN103986748A (zh) 实现服务化的方法和装置
CN112579304A (zh) 基于分布式平台的资源调度方法、装置、设备及介质
US11922059B2 (en) Method and device for distributed data storage
CN116662020B (zh) 应用服务动态管理方法、系统、电子设备及存储介质
US20140372534A1 (en) Using status inquiry and status response messages to exchange management information
CN113946408A (zh) 云原生边缘容器控制方法、系统及存储介质
CN109257396A (zh) 一种分布式锁调度方法及装置
CN111580753A (zh) 存储卷级联架构、批量作业处理系统和电子设备
CN115225645B (zh) 一种服务更新方法、装置、系统和存储介质
CN116149814A (zh) 一种基于kafka的数据持久化任务分布式调度方法及系统
CN112241342A (zh) 一种实现容器云节点自治的方法及系统
CN112822062A (zh) 一种用于桌面云服务平台的管理方法
CN116032932A (zh) 针对边缘服务器的集群管理方法、系统、设备及介质
CN115712521A (zh) 一种集群节点故障处理方法、系统及介质
CN115250227A (zh) 一种边缘计算场景下实现故障迁移的调度系统
CN115686813A (zh) 一种资源调度方法、装置、电子设备和存储介质
CN114629782A (zh) 一种多个云平台间抗毁接替方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210119

RJ01 Rejection of invention patent application after publication