CN111290834A - 一种基于云管理平台实现业务高可用的方法、装置及设备 - Google Patents
一种基于云管理平台实现业务高可用的方法、装置及设备 Download PDFInfo
- Publication number
- CN111290834A CN111290834A CN202010071093.2A CN202010071093A CN111290834A CN 111290834 A CN111290834 A CN 111290834A CN 202010071093 A CN202010071093 A CN 202010071093A CN 111290834 A CN111290834 A CN 111290834A
- Authority
- CN
- China
- Prior art keywords
- deployment
- node
- nodes
- abnormal
- deployment node
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 230000002159 abnormal effect Effects 0.000 claims abstract description 47
- 230000007246 mechanism Effects 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 11
- 238000009434 installation Methods 0.000 claims description 8
- 238000007726 management method Methods 0.000 description 29
- 210000004556 brain Anatomy 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000013475 authorization Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013524 data verification Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/455—Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
- G06F9/45533—Hypervisors; Virtual machine monitors
- G06F9/45558—Hypervisor-specific management and integration aspects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5083—Techniques for rebalancing the load in a distributed system
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/455—Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
- G06F9/45533—Hypervisors; Virtual machine monitors
- G06F9/45558—Hypervisor-specific management and integration aspects
- G06F2009/4557—Distribution of virtual machine instances; Migration and load balancing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/455—Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
- G06F9/45533—Hypervisors; Virtual machine monitors
- G06F9/45558—Hypervisor-specific management and integration aspects
- G06F2009/45595—Network integration; Enabling network access in virtual machine instances
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Abstract
本发明公开了一种基于云管理平台实现业务高可用的方法、装置、设备及计算机可读存储介质,包括:将k8s集群中多个部署节点同时配置为Master和Node;在每个部署节点上运行API server、Controller Manager、Scheduler组件;Controller Manager通过API server提供的接口对其他部署节点的状态进行监控,利用Scheduler将异常部署节点的资源调度至目标部署节点上;当检测到异常部署节点时,利用集群虚拟IP所在的部署节点对异常部署节点的资源进行调度。本发明所提供的方法、装置、设备及计算机可读存储介质,实现了ICM业务的高可用,提高了业务稳定性。
Description
技术领域
本发明涉及计算机集群技术领域,特别是涉及一种基于云管理平台实现业务高可用的方法、装置、设备以及计算机可读存储介质。
背景技术
随着云计算及大数据快速发展,新的技术框架层出不穷,Kubernetes(k8s)应运而生。它是一个全新的基于容器技术的分布式架构,建立在docker技术之上,为容器化的应用提供了资源调度、部署运行、服务发现和扩容缩容等丰富多样的功能。同时k8s是一个开放的平台,供社区用户直接参与应用和开发的框架。k8s的重要的特点是自动化,自动化是指能够实现自动部署,自动重启,自动复制,自动伸缩/扩展。
ICM(Incloud Manager)是基于k8s开发的云管理平台,具有与k8s一致的特征,能够实现自动部署、自动重启、自动复制、自动伸缩或扩展,因此为ICM平台应用的部署提供了极大的方便。平台的高可用是非常重要的,一旦因为某些应用pod或某些部署节点挂掉,服务无法访问将带来严重的后果。
以3个节点为例,现有k8s部署集群中1个节点设置为Master,2个节点设置为Node,从而实现k8s的高可用性。一旦Master节点挂掉后整个集群将崩溃,运行的每个应用pod将无法正常提供服务。ICM是基于K8S的云管平台运行着很多业务应用的pod,一旦节点Master挂掉后整个集群将无法提供服务。
综上所述可以看出,如何在k8s集群Master节点故障时保证ICM业务的稳定性是目前有待解决的问题。
发明内容
本发明的目的是提供一种基于云管理平台实现业务高可用的方法、装置、设备以及计算机可读存储介质,以解决现有技术中Master节点的宕机会导致整个k8s集群崩溃,运行的每个应用pod无法正常提供服务的问题。
为解决上述技术问题,本发明提供一种基于云管理平台实现业务高可用的方法,包括:将k8s集群中的多个部署节点同时配置为Master节点和Node节点,并将k8s集群的虚拟IP配置在安装部署文件中;在每个部署节点上运行API server、Controller Manager、Scheduler三个组件,以便所述Controller Manager通过所述API server提供的接口对其他部署节点的状态进行监控,并在检测到状态为NotReady的异常部署节点时,利用所述Scheduler将所述异常部署节点的资源调度至目标部署节点上;当检测到所述异常部署节点时,利用keepalive及负载均衡机制,通过所述虚拟IP对所述部异常署节点的资源进行调度。
优选地,所述将k8s集群中的多个部署节点同时配置为Master节点和Node节点包括:
通过修改inventory配置文件,将所述k8s集群中的多个部署节点同时配置为Master节点和Node节点。
优选地,还包括:将所述各个部署节点中redis任务Pod创建为多副本运行。
优选地,所述将所述各个部署节点中redis任务pod创建为多副本运行包括:
通过k8s反亲和配置将所述redis任务pod的多个副本部署至不同的部署节点上。
优选地,所述将所述各个部署节点中redis任务pod创建为多副本运行后包括:
在所述各个部署节点中创建Deployment,通过所述Deployment管理所述各个部署节点中redis任务pod的多个副本。
优选地,所述当检测到所述异常部署节点时,利用keepalive及负载均衡机制,通过所述虚拟IP对所述部异常署节点的资源进行调度包括:
当所述虚拟IP落在所述异常部署节点时,在所述keppalive组件通过VRRP算法在其他部署节点中决策备用主节点,以便所述虚拟IP漂移至所述备用主节点上;
通过所述负载均衡机制对所述异常部署节点的资源进行调度。
本发明还提供了一种基于云管理平台实现业务高可用的装置,包括:
配置模块,用于将k8s集群中的多个部署节点同时配置为Master节点和Node节点,并将k8s集群的虚拟IP配置在安装部署文件中;
运行模块,用于在每个部署节点上运行API server、Controller Manager、Scheduler三个组件,以便所述Controller Manager通过所述API server提供的接口对其他部署节点的状态进行监控,并在检测到状态为NotReady的异常部署节点时,利用所述Scheduler将所述异常部署节点的资源调度至目标部署节点上;
资源调度模块,用于当检测到所述异常部署节点时,利用keepalive及负载均衡机制,通过所述虚拟IP对所述部异常署节点的资源进行调度。
优选地,还包括:
创建单元,用于将所述各个部署节点中redis任务Pod创建为多副本运行。
本发明还提供了一种基于云管理平台实现业务高可用的设备,包括:
存储器,用于存储计算机程序;处理器,用于执行所述计算机程序时实现上述一种基于云管理平台实现业务高可用的方法的步骤。
本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述一种基于云管理平台实现业务高可用的方法的步骤。
本发明所提供的基于云管理平台实现业务高可用的方法,将k8s集群中的多个部署节点同时配置为Master节点和Node节点;将k8s集群的虚拟IP配置在安装部署文件中。并且API server、Controller Manager、Scheduler会分别在所述多个部署节点上各自运行一个任务。在每个部署节点中,Controller Manager通过API server提供的接口对其他部署节点的状态进行监控;当Controller Manager检测到状态为NotReady的异常部署节点时,利用Scheduler将所述异常部署节点的资源调度至其他部署节点上。现有的k8s集中仅有Master节点中运行有API Server、Controller Manager、Scheduler三个组件,现有k8s集群中Master节点故障后,无法再对正常控制、调度和提供接口。而本发明将多个部署节点全部设置为Master节点,同时又全部设置为Node节点,这样其中任何一个部署节点机器挂掉,可以利用备用主节点进行正常控制、调度和提供接口,通过调度后资源被调度到状态为Ready的部署节点上,pod可以正常提供服务,大大提高了ICM业务的稳定性,实现了业务高可用。
附图说明
为了更清楚的说明本发明实施例或现有技术的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明所提供的基于云管理平台实现业务高可用的方法的第一种具体实施例的流程图;
图2为本发明所提供的基于云管理平台实现业务高可用的方法的第二种具体实施例的流程图;
图3为本发明实施例提供的一种基于云管理平台实现业务高可用的装置的结构框图。
具体实施方式
本发明的核心是提供一种基于云管理平台实现业务高可用的方法、装置、设备以及计算机可读存储介质,通过将k8s集群节点同时部署为Master与Node,实现了ICM业务的高可用,大大提高了ICM业务的稳定性。
为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参考图1,图1为本发明所提供的基于云管理平台实现业务高可用的方法的第一种具体实施例的流程图;具体操作步骤如下:
步骤S101:将k8s集群中的多个部署节点同时配置为Master节点和Node节点,并将k8s集群的虚拟IP配置在安装部署文件中;
在本实施例中,通过inventroy.ini配置节点,从而使所述k8s集群中的多个部署节点既是Master节点又是Node节点。
当部署节点关闭或挂掉时,该部署节点的运行状态由Ready变为NotReady,运行在部署该节点上的pod状态变为terminating。
步骤S102:在每个部署节点上运行API server、Controller Manager、Scheduler三个组件,以便所述Controller Manager通过所述API server提供的接口对其他部署节点的状态进行监控,并在检测到状态为NotReady的异常部署节点时,利用所述Scheduler将所述异常部署节点的资源调度至目标部署节点上;
在每个部署节点中部署pod,API server、Controller Manager、Scheduler会分别在各个部署节点上各自运行一个任务,负责对本部署节点上的pod的生命周期进行管理与服务代理的功能。
所述API server提供了集群管理的REST API接口,包括认证授权、数据校验以及集群状态变更;提供其他模块之间的数据交互和通信的枢纽,其他模块通过API Server查询或修改数据,只有API Server才直接操作etcd。所述API server是资源配额控制的入口,拥有完备的集群安全机制。
所述Controller Manager作为集群内部的管理控制中心,负责集群内的Node、pod副本、服务端点(Endpoint)、命名空间(Namespace)、服务账号(ServiceAccount)、资源定额(ResourceQuota)的管理,当某个Node意外宕机时,Controller Manager会及时发现并执行自动化修复流程,确保集群始终处于预期的工作状态。
所述Scheduler(调度器)负责接收Controller Manager创建新的pod,为其安排一个落脚的目标Node;安置工作完成后,目标Node上的kubelet服务进程接管后继工作。
需要说明的是,在本发明所提供的其他实施例中,可根据实际需求在所述各个部署节点运行Kubelet、Proxy、KubernetesDocker daemon等组件;
步骤S103:当检测到所述异常部署节点时,利用keepalive及负载均衡机制,通过所述虚拟IP对所述部异常署节点的资源进行调度。
若所述虚拟IP未落在所述异常部署节点上,则通过keepalive和负载均衡机制,并通过虚拟IP对所述异常部署节点上的资源进行调度。若所述虚拟IP落在所述异常部署节点上,则所述虚拟IP会飘移至其他的部署节点上(备用主节点),之后再利用所述keepalive和所述负载均衡机制,并通过虚拟IP所在的部署节点对所述异常部署节点上的资源进行调度。在本实施例中,由于所述多个部署节点既是Master节点,又是Node节点,因此每个部署节点中的Controller Manager均会通过API server提供的接口对其他部署节点的状态进行监控,并在检测到状态为NotReady的异常部署节点时,通过Scheduler将所述异常部署节点中资源调度至运行状态为Ready的部署节点中,从而提高了业务稳定性。
基于上述实施例,在本实施例中,通过集群配置文件将k8s集群中多个部署节点同时设置为Master与Node之后,将所述部署节点中重要应用业务pod创建为多副本,不仅可以有效防止集群节点故障导致业务中断的情况,也可以有效防止某些服务pod挂掉导致业务出现中断的情况。
请参考图2,图2为本发明所提供的基于云管理平台实现业务高可用的方法的第二种具体实施例的流程图;具体操作步骤如下:
步骤S201:通过修改inventory配置文件,将k8s集群中的多个部署节点同时配置为Master节点和Node节点,并将k8s集群的虚拟IP配置在安装部署文件中;
通过修改inventory.ini文件Master节点和Node节点的双重身份,即部署节点既要作为控制节点,也要作为工作节点,这样可以实现部署节点某台宕机后业务能够正常运行。
步骤S202:在每个部署节点上运行API server、Controller Manager、Scheduler三个组件,以便所述Controller Manager通过所述API server提供的接口对其他部署节点的状态进行监控,并在检测到状态为NotReady的异常部署节点时,利用所述Scheduler将所述异常部署节点的资源调度至目标部署节点上;
步骤S203:当所述虚拟IP落在所述异常部署节点时,在keepalive组件通VRRP算法在其他部署节点中决策备用主节点,以便所述虚拟IP漂移至所述备用主节点,通过负载均衡机制对所述异常部署节点中的资源进行调度;
所述keepalive组件为所述k8s集群中的一个组件,VRRP(优先级选举)算法为所述keepalive组件中的一种算法;虚拟IP漂移是通过所述keepalive组件的VRRP算法实现的。
步骤S204:通过k8s反亲和配置将所述各个部署节点中redis任务pod的多个副本部署至不同的部署节点上;
现有技术中正常情况下任务副本数默认为1,如果将该任务删除掉或者意外情况重启后,服务状态出现0/1。而在本实施例中,将redis任务创建为多副本,其默认副本数量可以通过实际情况设置,系统会自动创建多个相同的redis任务,如果任务出现异常关闭或删除操作后,其余副本继续执行,不会影响业务。
通过修改某些重要业务pod的副本数,实现重要业务模块的多副本运行,从而实现某些pod删除或者重启后都不会影响业务的正常执行。
为了避免同一redis业务pod的多个副本同时部署在一个集群节点中,而该节点挂掉后,导致该redis业务无法继续提供服务,本实施例通过k8s的反亲和配置将同一redis业务pod的副本部署在多个不同的集群节点上,无论是节点宕机还是业务pod删除或重启均不会影响到该业务运行。
步骤S205:在所述各个部署节点中创建Deployment,通过所述Deployment管理所述各个部署节点中redis任务pod的多个副本。
本实施为了风险降到最低,将集群节点同时配置为Master与Node的高可用方法与提高redis任务副本数的方法进行合并。高可用方法扩大了集群“大脑”的主体,无论哪台机器故障宕机其他大脑均可以正常运行,提高redis任务副本数的方法扩大了业务pod的备份,无论哪个pod删除或者重启业务均可以正常运行,综上无论是节点宕机还是业务pod删除或重启均不会影响到业务,极大提高了ICM业务的稳定性,为故障的恢复增加了可操作时间。
请参考图3,图3为本发明实施例提供的一种基于云管理平台实现业务高可用的装置的结构框图;具体装置可以包括:
配置模块100,用于将k8s集群中的多个部署节点同时配置为Master节点和Node节点,并将k8s集群的虚拟IP配置在安装部署文件中;
运行模块200,用于在每个部署节点上运行API server、Controller Manager、Scheduler三个组件,以便所述Controller Manager通过所述API server提供的接口对其他部署节点的状态进行监控,并在检测到状态为NotReady的异常部署节点时,利用所述Scheduler将所述异常部署节点的资源调度至目标部署节点上;
资源调度模块,用于当检测到所述异常部署节点时,利用keepalive及负载均衡机制,通过所述虚拟IP对所述部异常署节点的资源进行调度。
本实施例的基于云管理平台实现业务高可用的装置用于实现前述的基于云管理平台实现业务高可用的方法,因此基于云管理平台实现业务高可用的装置中的具体实施方式可见前文中的基于云管理平台实现业务高可用的方法的实施例部分,例如,配置模块100,运行模块200,资源调度模块300,分别用于实现上述基于云管理平台实现业务高可用的方法中步骤S101,S102和S103,所以,其具体实施方式可以参照相应的各个部分实施例的描述,在此不再赘述。
本发明具体实施例还提供了一种基于云管理平台实现业务高可用的设备,包括:存储器,用于存储计算机程序;处理器,用于执行所述计算机程序时实现上述一种基于云管理平台实现业务高可用的方法的步骤。
本发明具体实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述一种基于云管理平台实现业务高可用的方法的步骤。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上对本发明所提供的基于云管理平台实现业务高可用的方法、装置、设备以及计算机可读存储介质进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。
Claims (10)
1.一种基于云管理平台实现业务高可用的方法,其特征在于,包括:
将k8s集群中的多个部署节点同时配置为Master节点和Node节点,并将所述k8s集群的虚拟IP配置在安装部署文件中;
在每个部署节点上运行APIserver、Controller Manager、Scheduler三个组件,以便所述Controller Manager通过所述APIserver提供的接口对其他部署节点的状态进行监控,并在检测到状态为NotReady的异常部署节点时,利用所述Scheduler将所述异常部署节点的资源调度至目标部署节点上;
当检测到所述异常部署节点时,利用keepalive及负载均衡机制,通过所述虚拟IP对所述部异常署节点的资源进行调度。
2.如权利要求1所述的方法,其特征在于,所述将k8s集群中的多个部署节点同时配置为Master节点和Node节点包括:
通过修改inventory配置文件,将所述k8s集群中的多个部署节点同时配置为Master节点和Node节点。
3.如权利要求1所述的方法,其特征在于,还包括:将所述各个部署节点中redis任务Pod创建为多副本运行。
4.如权利要求3所述的方法,其特征在于,所述将所述各个部署节点中redis任务pod创建为多副本运行包括:
通过k8s反亲和配置将所述redis任务pod的多个副本部署至不同的部署节点上。
5.如权利要求4所述的方法,其特征在于,所述将所述各个部署节点中redis任务pod创建为多副本运行后包括:
在所述各个部署节点中创建Deployment,通过所述Deployment管理所述各个部署节点中redis任务pod的多个副本。
6.如权利要求1所述的方法,其特征在于,所述当检测到所述异常部署节点时,利用keepalive及负载均衡机制,通过所述虚拟IP对所述部异常署节点的资源进行调度包括:
当所述虚拟IP落在所述异常部署节点时,在所述keppalive组件通过VRRP算法在其他部署节点中决策备用主节点,以便所述虚拟IP漂移至所述备用主节点上;
通过所述负载均衡机制对所述异常部署节点的资源进行调度。
7.一种基于云管理平台实现业务高可用的装置,其特征在于,包括:
配置模块,用于将k8s集群中的多个部署节点同时配置为Master节点和Node节点,并将所述k8s集群的虚拟IP配置在安装部署文件中;
运行模块,用于在每个部署节点上运行API server、Controller Manager、Scheduler三个组件,以便所述Controller Manager通过所述API server提供的接口对其他部署节点的状态进行监控,并在检测到状态为NotReady的异常部署节点时,利用所述Scheduler将所述异常部署节点的资源调度至目标部署节点上;
资源调度模块,用于当检测到所述异常部署节点时,利用keepalive及负载均衡机制,通过所述虚拟IP对所述部异常署节点的资源进行调度。
8.如权利要求7所述的装置,其特征在于,还包括:
创建单元,用于将所述各个部署节点中redis任务Pod创建为多副本运行。
9.一种基于云管理平台实现业务高可用的设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至6任一项所述一种基于云管理平台实现业务高可用的方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述一种基于云管理平台实现业务高可用的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010071093.2A CN111290834B (zh) | 2020-01-21 | 2020-01-21 | 一种基于云管理平台实现业务高可用的方法、装置及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010071093.2A CN111290834B (zh) | 2020-01-21 | 2020-01-21 | 一种基于云管理平台实现业务高可用的方法、装置及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111290834A true CN111290834A (zh) | 2020-06-16 |
CN111290834B CN111290834B (zh) | 2023-06-16 |
Family
ID=71024331
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010071093.2A Active CN111290834B (zh) | 2020-01-21 | 2020-01-21 | 一种基于云管理平台实现业务高可用的方法、装置及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111290834B (zh) |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111800303A (zh) * | 2020-09-09 | 2020-10-20 | 杭州朗澈科技有限公司 | 混合云场景下保证可用集群数量的方法、装置及系统 |
CN111831394A (zh) * | 2020-06-30 | 2020-10-27 | 新浪网技术(中国)有限公司 | 采用kubernetes部署有状态pod的方法及装置 |
CN112131088A (zh) * | 2020-09-29 | 2020-12-25 | 北京计算机技术及应用研究所 | 一种基于健康检查和容器的高可用方法 |
CN112463535A (zh) * | 2020-11-27 | 2021-03-09 | 中国工商银行股份有限公司 | 多集群异常处理方法及装置 |
CN112698926A (zh) * | 2021-03-25 | 2021-04-23 | 成都新希望金融信息有限公司 | 数据处理方法、装置、设备、存储介质及系统 |
CN112764886A (zh) * | 2021-01-29 | 2021-05-07 | 上海弘积信息科技有限公司 | 一种基于Kubernetes平台的负载均衡控制器 |
CN114157569A (zh) * | 2020-08-17 | 2022-03-08 | 中国电信股份有限公司 | 集群系统及其构建方法和构建装置 |
CN114443059A (zh) * | 2020-10-30 | 2022-05-06 | 中国联合网络通信集团有限公司 | Kubernetes集群的部署方法、装置及设备 |
CN114500549A (zh) * | 2020-11-13 | 2022-05-13 | 天翼云科技有限公司 | 在公共云中为用户部署k8s托管集群的方法、设备和介质 |
CN114900449A (zh) * | 2022-03-30 | 2022-08-12 | 网宿科技股份有限公司 | 一种资源信息管理方法、系统及装置 |
US11418417B2 (en) | 2020-12-21 | 2022-08-16 | Red Hat, Inc. | Managing stateful workloads executing on temporarily available resources of a cloud computing system |
CN115834595A (zh) * | 2022-11-17 | 2023-03-21 | 浪潮云信息技术股份公司 | 一种Kubernetes控制组件的管理方法及系统 |
CN117407125A (zh) * | 2023-12-14 | 2024-01-16 | 中电云计算技术有限公司 | Pod高可用实现方法、装置、设备及可读存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105743995A (zh) * | 2016-04-05 | 2016-07-06 | 北京轻元科技有限公司 | 一种可移植高可用部署和管理容器集群的系统和方法 |
CN107968851A (zh) * | 2017-12-06 | 2018-04-27 | 深信服科技股份有限公司 | 一种基于k8s平台的浮动IP绑定方法及装置 |
CN109783218A (zh) * | 2019-01-24 | 2019-05-21 | 中国—东盟信息港股份有限公司 | 一种基于Kubernetes容器集群的与时间相关联的容器调度方法 |
CN110704165A (zh) * | 2019-10-08 | 2020-01-17 | 浪潮云信息技术有限公司 | 一种容器高可用部署方法 |
-
2020
- 2020-01-21 CN CN202010071093.2A patent/CN111290834B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105743995A (zh) * | 2016-04-05 | 2016-07-06 | 北京轻元科技有限公司 | 一种可移植高可用部署和管理容器集群的系统和方法 |
CN107968851A (zh) * | 2017-12-06 | 2018-04-27 | 深信服科技股份有限公司 | 一种基于k8s平台的浮动IP绑定方法及装置 |
CN109783218A (zh) * | 2019-01-24 | 2019-05-21 | 中国—东盟信息港股份有限公司 | 一种基于Kubernetes容器集群的与时间相关联的容器调度方法 |
CN110704165A (zh) * | 2019-10-08 | 2020-01-17 | 浪潮云信息技术有限公司 | 一种容器高可用部署方法 |
Non-Patent Citations (2)
Title |
---|
YLW6006: "K8S集群Master高可用实践", 《HTTPS://BLOG.51CTO.COM/YLW6006/216498》 * |
爱小天天: "Kubernetes 将Pod调度到Master节点", 《HTTPS://BLOG.CSDN.NET/GAOJING2240/ARTICLE/DETAILS/84303697》 * |
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111831394A (zh) * | 2020-06-30 | 2020-10-27 | 新浪网技术(中国)有限公司 | 采用kubernetes部署有状态pod的方法及装置 |
CN111831394B (zh) * | 2020-06-30 | 2023-10-24 | 新浪技术(中国)有限公司 | 采用kubernetes部署有状态pod的方法及装置 |
CN114157569A (zh) * | 2020-08-17 | 2022-03-08 | 中国电信股份有限公司 | 集群系统及其构建方法和构建装置 |
CN111800303A (zh) * | 2020-09-09 | 2020-10-20 | 杭州朗澈科技有限公司 | 混合云场景下保证可用集群数量的方法、装置及系统 |
CN112131088A (zh) * | 2020-09-29 | 2020-12-25 | 北京计算机技术及应用研究所 | 一种基于健康检查和容器的高可用方法 |
CN112131088B (zh) * | 2020-09-29 | 2024-04-09 | 北京计算机技术及应用研究所 | 一种基于健康检查和容器的高可用方法 |
CN114443059A (zh) * | 2020-10-30 | 2022-05-06 | 中国联合网络通信集团有限公司 | Kubernetes集群的部署方法、装置及设备 |
CN114500549B (zh) * | 2020-11-13 | 2023-08-08 | 天翼云科技有限公司 | 在公共云中为用户部署k8s托管集群的方法、设备和介质 |
CN114500549A (zh) * | 2020-11-13 | 2022-05-13 | 天翼云科技有限公司 | 在公共云中为用户部署k8s托管集群的方法、设备和介质 |
CN112463535A (zh) * | 2020-11-27 | 2021-03-09 | 中国工商银行股份有限公司 | 多集群异常处理方法及装置 |
US11418417B2 (en) | 2020-12-21 | 2022-08-16 | Red Hat, Inc. | Managing stateful workloads executing on temporarily available resources of a cloud computing system |
CN112764886A (zh) * | 2021-01-29 | 2021-05-07 | 上海弘积信息科技有限公司 | 一种基于Kubernetes平台的负载均衡控制器 |
CN112698926A (zh) * | 2021-03-25 | 2021-04-23 | 成都新希望金融信息有限公司 | 数据处理方法、装置、设备、存储介质及系统 |
CN112698926B (zh) * | 2021-03-25 | 2021-07-02 | 成都新希望金融信息有限公司 | 数据处理方法、装置、设备、存储介质及系统 |
CN114900449A (zh) * | 2022-03-30 | 2022-08-12 | 网宿科技股份有限公司 | 一种资源信息管理方法、系统及装置 |
CN114900449B (zh) * | 2022-03-30 | 2024-02-23 | 网宿科技股份有限公司 | 一种资源信息管理方法、系统及装置 |
CN115834595A (zh) * | 2022-11-17 | 2023-03-21 | 浪潮云信息技术股份公司 | 一种Kubernetes控制组件的管理方法及系统 |
CN117407125A (zh) * | 2023-12-14 | 2024-01-16 | 中电云计算技术有限公司 | Pod高可用实现方法、装置、设备及可读存储介质 |
CN117407125B (zh) * | 2023-12-14 | 2024-04-16 | 中电云计算技术有限公司 | Pod高可用实现方法、装置、设备及可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111290834B (zh) | 2023-06-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111290834B (zh) | 一种基于云管理平台实现业务高可用的方法、装置及设备 | |
US10609159B2 (en) | Providing higher workload resiliency in clustered systems based on health heuristics | |
EP3234774B1 (en) | Elasticity for highly availabile applications | |
CN111880936B (zh) | 资源调度方法、装置、容器集群、计算机设备和存储介质 | |
CN110597664A (zh) | 一种高可用集群资源部署方法、装置及相关组件 | |
CN112948063B (zh) | 云平台的创建方法、装置、云平台以及云平台实现系统 | |
CN113204353B (zh) | 一种大数据平台组件部署方法及装置 | |
CN111212129A (zh) | 一种基于边车模式的容器应用高可用方法、装置以及设备 | |
CN113067850A (zh) | 一种多云场景下的集群编排系统 | |
CN109361542A (zh) | 客户端的故障处理方法、装置、系统、终端和服务器 | |
CN111935244B (zh) | 一种业务请求处理系统及超融合一体机 | |
CN109582459A (zh) | 应用的托管进程进行迁移的方法及装置 | |
CN110971662A (zh) | 一种基于Ceph的两节点高可用实现方法及装置 | |
CN111459639A (zh) | 一种支持全球多机房部署的分布式任务管理平台及方法 | |
CN111818188B (zh) | 一种Kubernetes集群的负载均衡可用性提升方法和装置 | |
CN113672336A (zh) | 一种k8s容器集群部署方法、装置、设备及可读存储介质 | |
WO2015147860A1 (en) | Rescheduling a service on a node | |
CN111158956A (zh) | 一种集群系统的数据备份方法及相关装置 | |
CN113032107B (zh) | 一种云数据库的资源管理方法、装置及系统 | |
CN114338670B (zh) | 一种边缘云平台和具有其的网联交通三级云控平台 | |
Stack et al. | Self-healing in a decentralised cloud management system | |
CN114615320A (zh) | 服务治理方法、装置、电子设备及计算机可读存储介质 | |
CN113472886A (zh) | 分布式集群系统及其控制方法 | |
CN115550371B (zh) | 基于Kubernetes的Pod调度方法、系统及云平台 | |
TW201536057A (zh) | 一種服務最佳化的電腦系統及其方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |