CN112015593A - Kubernetes集群的容灾备份方法及相关组件 - Google Patents

Kubernetes集群的容灾备份方法及相关组件 Download PDF

Info

Publication number
CN112015593A
CN112015593A CN202010879749.3A CN202010879749A CN112015593A CN 112015593 A CN112015593 A CN 112015593A CN 202010879749 A CN202010879749 A CN 202010879749A CN 112015593 A CN112015593 A CN 112015593A
Authority
CN
China
Prior art keywords
cluster
controller
resource
pressure value
cluster resource
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010879749.3A
Other languages
English (en)
Other versions
CN112015593B (zh
Inventor
王玉东
崔润兴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Inspur Data Technology Co Ltd
Original Assignee
Beijing Inspur Data Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Inspur Data Technology Co Ltd filed Critical Beijing Inspur Data Technology Co Ltd
Priority to CN202010879749.3A priority Critical patent/CN112015593B/zh
Publication of CN112015593A publication Critical patent/CN112015593A/zh
Application granted granted Critical
Publication of CN112015593B publication Critical patent/CN112015593B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种Kubernetes集群的容灾备份方法,包括:预先设定包括N种集群资源类型的监听池;N为正整数;针对Kubernetes集群中的任意一项集群资源,当该项集群资源的类型属于监听池所设定的集群资源类型的范围时,创建该项集群资源的控制器,并通过控制器监听该项集群资源;当通过任意控制器监听到该控制器对应的集群资源出现变更时,对该控制器对应的集群资源进行备份。应用本申请的方案,提高了备份的实时性。同时,有利于降低备份所带来的资源占用效果。本申请还提供了Kubernetes集群的容灾备份的相关组件,具有相应技术效果。

Description

Kubernetes集群的容灾备份方法及相关组件
技术领域
本发明涉及计算机技术领域,特别是涉及一种Kubernetes集群的容灾备份方法及相关组件。
背景技术
Kubernetes是一个开源的容器编排引擎,支持自动化部署、大规模可伸缩、应用容器化管理。在Kubernetes集群中,可以创建容器,容器中则可以运行应用实例。
Kubernetes在一定程度上需要实现容灾备份,例如运维人员误删除了某个namespace,导致该name space下的所有资源被删除。又如物理原因导致的服务器损坏,或者需要重装系统等。又如需要将一个集群的数据迁移到另一个集群中用于测试等目的,都需要进行Kubernetes集群的容灾备份保障数据的安全。
目前的容灾备份方案主要有两种,一种是通过定时任务备份存储资源数据的etcd,虽然能够实现备份,但是etcd不仅仅存放资源数据,还存放node和pod ip等信息,并且只能够在原集群进行还原,通过etcd还原的粒度较大,存在很多不确定性,且只能全量备份。因此,更广泛地使用的是通过velero的备份方式,但是目前通过velero实现定时或者手动备份时,虽然能够实现备份功能,但是实时性较差。也就是说,一旦在非备份的时间内,集群出现了不可恢复的致命性问题时,便会出现数据丢失严重的情况。
综上所述,如何有效地进行Kubernetes集群的容灾备份,提高备份的实时性,是目前本领域技术人员急需解决的技术问题。
发明内容
本发明的目的是提供一种Kubernetes集群的容灾备份方法及相关组件,以有效地进行Kubernetes集群的容灾备份,提高备份的实时性。
为解决上述技术问题,本发明提供如下技术方案:
一种Kubernetes集群的容灾备份方法,包括:
预先设定包括N种集群资源类型的监听池;N为正整数;
针对Kubernetes集群中的任意一项集群资源,当该项集群资源的类型属于所述监听池所设定的集群资源类型的范围时,创建该项集群资源的控制器,并通过所述控制器监听该项集群资源;
当通过任意控制器监听到该控制器对应的集群资源出现变更时,对该控制器对应的集群资源进行备份。
优选的,所述对该控制器对应的集群资源进行备份,包括:
基于增量更新的方式,对该控制器对应的集群资源进行备份。
优选的,所述通过任意控制器监听到该控制器对应的集群资源出现变更,包括:
通过任意控制器监听到该控制器对应的集群资源出现增加事件,删除事件以及修改事件中的任意一种事件时,确定该控制器对应的集群资源出现变更。
优选的,还包括:
当删除任意一项集群资源时,判断是否存在为该项集群资源创建的控制器,如果是,则删除为该项集群资源创建的控制器。
优选的,还包括:
按照第一周期检测Kubernetes集群的API Server的压力值,并且当检测出的压力值小于等于设定的压力值阈值时,对Kubernetes集群的全部资源进行备份。
优选的,所述对Kubernetes集群的全部资源进行备份,包括:
基于增量更新的方式,对Kubernetes集群的全部资源进行备份。
优选的,还包括:
在任意一次检测出的压力值大于所述压力值阈值时,在该次检测之后的第一时长内实时检测Kubernetes集群的API Server的压力值;
当在所述第一时长内的任意时刻,检测出的压力值小于等于所述压力值阈值时,基于增量更新的方式,对Kubernetes集群的全部资源进行备份;
当在所述第一时长内的任意时刻,检测出的压力值均大于所述压力值阈值时,在所述第一时长的结束时刻,基于增量更新的方式,对Kubernetes集群的全部资源进行备份。
一种Kubernetes集群的容灾备份系统,包括:
监听池设定模块,用于预先设定包括N种集群资源类型的监听池;N为正整数;
控制器创建模块,用于针对Kubernetes集群中的任意一项集群资源,当该项集群资源的类型属于所述监听池所设定的集群资源类型的范围时,创建该项集群资源的控制器,并通过所述控制器监听该项集群资源;
备份模块,用于当通过任意控制器监听到该控制器对应的集群资源出现变更时,对该控制器对应的集群资源进行备份。
一种Kubernetes集群的容灾备份设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序以实现上述任一项所述的Kubernetes集群的容灾备份方法的步骤。
一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实上述任一项所述的Kubernetes集群的容灾备份方法的步骤。
应用本发明实施例所提供的技术方案,预先设定了包括N种集群资源类型的监听池,而针对Kubernetes集群中的任意一项集群资源,当该项集群资源的类型属于监听池所设定的集群资源类型的范围时,本申请会创建该项集群资源的控制器,并通过控制器监听该项集群资源,也就是说,本申请并不需要为Kubernetes集群中的全部资源均创建对应的控制器,只需要为符合预设的监听池的各项集群资源创建对应的控制器。而当通过任意控制器监听到该控制器对应的集群资源出现变更时,本申请会立即对该控制器对应的集群资源进行备份。也就是说,本申请通过设定监听池以及控制器,使得对于特定类型的资源,可以及时进行备份,即提高了备份的实时性。同时,由于是对特定类型的资源进行及时的备份,并不需要实时地对Kubernetes集群中的各项集群资源均进行及时的备份,有利于降低备份所带来的资源占用。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明中一种Kubernetes集群的容灾备份方法的实施流程图;
图2为本发明中一种Kubernetes集群的容灾备份系统的结构示意图;
图3为本发明中一种Kubernetes集群的容灾备份设备的结构示意图。
具体实施方式
本发明的核心是提供一种Kubernetes集群的容灾备份方法,提高了备份的实时性。同时,有利于降低备份所带来的资源占用。
为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参考图1,图1为本发明中一种Kubernetes集群的容灾备份方法的实施流程图,该Kubernetes集群的容灾备份方法可以包括以下步骤:
步骤S101:预先设定包括N种集群资源类型的监听池;N为正整数。
监听池中包括的具体的集群资源类型,可以根据实际需要进行设定,当然,也可以根据需要对监听池的内容进行调整,例如增加一些集群资源类型或者删除一些集群资源类型。
监听池起到的是一个自定义的作用,即定义出哪些类型的集群资源是需要及时地进行备份的。可以理解的是,在实际应用中,应当会将较为重要的集群资源类型设定到监听池中,从而使得这些类型的集群资源能够得到及时的备份。而对于不是特别重要的资源类型,便可以按照其它备份方式进行备份,例如按照较长间隔进行周期备份。
可以看出,由于通过监听池设定了需要及时备份的集群资源类型,使得本申请的方案可以降低备份所带来的资源占用,即不需要将全部的集群资源均及时的进行备份。
步骤S102:针对Kubernetes集群中的任意一项集群资源,当该项集群资源的类型属于监听池所设定的集群资源类型的范围时,创建该项集群资源的控制器,并通过控制器监听该项集群资源。
需要说明的是,步骤S102中描述的针对Kubernetes集群中的任意一项集群资源,既针对在监听池设定完毕时,Kubernetes集群中就已经存在的集群资源,也针对在监听池设定完毕时未存在,是在后续新增的集群资源。例如,一种具体场合中,预先设定的监听池中包括了集群资源类型A和集群资源类型B,在监听池设定完毕时,例如Kubernetes集群中存在集群资源1,集群资源2以及集群资源3,且集群资源1的类型为A,集群资源2的类型为A,集群资源3的类型为C。则可以理解的是,该例子中,需要创建集群资源1的控制器,并且需要创建集群资源2的控制器。例如后续新增了集群资源4和集群资源5,且集群资源4的类型例如为C,集群资源5的类型例如为B。则针对集群资源5,需要创建集群资源5对应的控制器。
针对Kubernetes集群中的任意一项集群资源,当该项集群资源的类型属于监听池所设定的集群资源类型的范围时,也就是说,监听池所设定的N种集群资源类型至少有一种与该项集群资源的类型相同时,需要创建该项集群资源的控制器,并通过该控制器监听该项集群资源。
步骤S103:当通过任意控制器监听到该控制器对应的集群资源出现变更时,对该控制器对应的集群资源进行备份。
当通过任意控制器监听到该控制器对应的集群资源出现变更时,具体的,通过任意控制器监听到该控制器对应的集群资源出现增加事件,删除事件以及修改事件中的任意一种事件时,可以确定该控制器对应的集群资源出现变更,本申请便对该控制器对应的集群资源进行备份。
在实际应用中,为了进一步地降低本申请的备份方案对于资源的占用,可以基于增量更新的方式,对该控制器对应的集群资源进行备份。也就是说,对于某项集群资源,如果是第一次进行触发备份,则将该项集群资源的全部数据进行一次备份,后续该项集群资源再触发备份时,例如该项集群资源增加了一条数据内容时,只需要将增加的该条数据内容进行备份即可,即进行增量备份。
在本发明的一种具体实施方式中,还包括:
当删除任意一项集群资源时,判断是否存在为该项集群资源创建的控制器,如果是,则删除为该项集群资源创建的控制器。
该种实施方式中,为了解放资源,在删除任意一项集群资源,并且确定出此前为该项集群资源创建了控制器时,会删除为该项集群资源创建的控制器,避免了无效的控制器对资源的占用。
在本发明的一种具体实施方式中,还可以包括:
按照第一周期检测Kubernetes集群的API Server的压力值,并且当检测出的压力值小于等于设定的压力值阈值时,对Kubernetes集群的全部资源进行备份。
考虑到前述实施方式中,是针对监听池所设定的各种集群资源类型进行及时的备份,而对于不属于监听池所设定的集群资源类型,本申请该种实施方式中,也会按照第一周期进行备份,进一步地保障了数据的安全,又不会使得备份方案过多占用资源。
并且,本申请的该种实施方式中,考虑到按照第一周期进行备份时,应当是在Kubernetes集群的API Server的压力值较小的时候执行,从而避免在业务繁忙的时候执行备份。因此,本申请会按照第一周期检测Kubernetes集群的API Server的压力值,并且当检测出的压力值小于等于设定的压力值阈值时,才会对Kubernetes集群的全部资源进行备份。
因为是对Kubernetes集群的全部资源进行备份,并且重要的集群资源类型已经被设定在了监听池中可以及时备份,因此,该种实施方式中,为了实现全部资源的备份而设定的第一周期,通常数值不会设置地太短,例如可以设置为3个小时。
进一步的,该种实施方式中,对Kubernetes集群的全部资源进行备份,也可以具体包括:基于增量更新的方式,对Kubernetes集群的全部资源进行备份。相较于全量更新,增量更新有利于避免重复数据对资源的占用。
在本发明的一种具体实施方式中,还可以包括:
在任意一次检测出的压力值大于压力值阈值时,在该次检测之后的第一时长内实时检测Kubernetes集群的API Server的压力值;
当在第一时长内的任意时刻,检测出的压力值小于等于压力值阈值时,基于增量更新的方式,对Kubernetes集群的全部资源进行备份;
当在第一时长内的任意时刻,检测出的压力值均大于压力值阈值时,在第一时长的结束时刻,基于增量更新的方式,对Kubernetes集群的全部资源进行备份。
前述实施方式中,按照第一周期进行备份时,还考虑到了的API Server的压力值,即是在Kubernetes集群的API Server的压力值较小的时候执行。该种实施方式中,进一步地考虑到在实际应用中,可以出现API Server的压力值波动较大,或者API Server的压力值持续较高的情况,如果刚好在按照第一周期进行API Server的压力值的检测的时刻,APIServer的压力值较高,便需要等到下一个检测周期才能出发备份,这样增大了数据丢失的风险。
因此,该种实施方式中,在任意一次检测出的压力值大于压力值阈值时,在该次检测之后的第一时长内会进一步地实时检测Kubernetes集群的API Server的压力值。第一时长的具体取值可以根据实际需要进行设定和调整,但可以理解的是,第一时长的取值通常会低于第一周期,例如一种具体场合中,第一时长设置为30分钟。
当在第一时长内的任意时刻,检测出的压力值小于等于压力值阈值时,便不用等到下一个检测周期,该时刻便会基于增量更新的方式,对Kubernetes集群的全部资源进行备份。
与此同时,如果在第一时长内的任意时刻,检测出的压力值均大于压力值阈值时,则在第一时长的结束时刻,本申请也会强制备份,即在第一时长的结束时刻,本申请会基于增量更新的方式,对Kubernetes集群的全部资源进行备份。
该种实施方式有利于避免由于API Server的压力值较大使得长时间未触发全部资源备份的情况,进一步地保障了数据的安全性。
应用本发明实施例所提供的技术方案,预先设定了包括N种集群资源类型的监听池,而针对Kubernetes集群中的任意一项集群资源,当该项集群资源的类型属于监听池所设定的集群资源类型的范围时,本申请会创建该项集群资源的控制器,并通过控制器监听该项集群资源,也就是说,本申请并不需要为Kubernetes集群中的全部资源均创建对应的控制器,只需要为符合预设的监听池的各项集群资源创建对应的控制器。而当通过任意控制器监听到该控制器对应的集群资源出现变更时,本申请会立即对该控制器对应的集群资源进行备份。也就是说,本申请通过设定监听池以及控制器,使得对于特定类型的资源,可以及时进行备份,即提高了备份的实时性。同时,由于是对特定类型的资源进行及时的备份,并不需要实时地对Kubernetes集群中的各项集群资源均进行及时的备份,有利于降低备份所带来的资源占用。
相应于上面的方法实施例,本发明实施例还提供了一种Kubernetes集群的容灾备份系统,可与上文相互对应参照。
参见图2所示,为本发明中一种Kubernetes集群的容灾备份系统的结构示意图,包括:
监听池设定模块201,用于预先设定包括N种集群资源类型的监听池;N为正整数;
控制器创建模块202,用于针对Kubernetes集群中的任意一项集群资源,当该项集群资源的类型属于监听池所设定的集群资源类型的范围时,创建该项集群资源的控制器,并通过控制器监听该项集群资源;
备份模块203,用于当通过任意控制器监听到该控制器对应的集群资源出现变更时,对该控制器对应的集群资源进行备份。
在本发明的一种具体实施方式中,备份模块203,具体用于:
当通过任意控制器监听到该控制器对应的集群资源出现变更时,基于增量更新的方式,对该控制器对应的集群资源进行备份。
在本发明的一种具体实施方式中,备份模块203,具体用于:
当通过任意控制器监听到该控制器对应的集群资源出现增加事件,删除事件以及修改事件中的任意一种事件时,确定该控制器对应的集群资源出现变更,对该控制器对应的集群资源进行备份。
在本发明的一种具体实施方式中,还包括:
控制器删除模块,用于当删除任意一项集群资源时,判断是否存在为该项集群资源创建的控制器,如果是,则删除为该项集群资源创建的控制器。
在本发明的一种具体实施方式中,还包括:
全资源备份模块,用于按照第一周期检测Kubernetes集群的API Server的压力值,并且当检测出的压力值小于等于设定的压力值阈值时,对Kubernetes集群的全部资源进行备份。
在本发明的一种具体实施方式中,全资源备份模块,具体用于:
按照第一周期检测Kubernetes集群的API Server的压力值,并且当检测出的压力值小于等于设定的压力值阈值时,基于增量更新的方式,对Kubernetes集群的全部资源进行备份。
在本发明的一种具体实施方式中,还包括:
压力值实时检测模块,用于在任意一次检测出的压力值大于压力值阈值时,在该次检测之后的第一时长内实时检测Kubernetes集群的API Server的压力值;
第一全资源备份模块,用于当在第一时长内的任意时刻,检测出的压力值小于等于压力值阈值时,基于增量更新的方式,对Kubernetes集群的全部资源进行备份;
第二全资源备份模块,用于当在第一时长内的任意时刻,检测出的压力值均大于压力值阈值时,在第一时长的结束时刻,基于增量更新的方式,对Kubernetes集群的全部资源进行备份。
相应于上面的方法和系统实施例,本发明实施例还提供了一种Kubernetes集群的容灾备份设备以及一种计算机可读存储介质,可与上文相互对应参照。计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现上述任一实施例中的Kubernetes集群的容灾备份方法的步骤。这里所说的计算机可读存储介质包括随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质。
参见图3所示,为本发明中一种Kubernetes集群的容灾备份设备的结构示意图,包括:
存储器301,用于存储计算机程序;
处理器302,用于执行计算机程序以实现上述任一实施例中的Kubernetes集群的容灾备份方法的步骤。
还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的技术方案及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。

Claims (10)

1.一种Kubernetes集群的容灾备份方法,其特征在于,包括:
预先设定包括N种集群资源类型的监听池;N为正整数;
针对Kubernetes集群中的任意一项集群资源,当该项集群资源的类型属于所述监听池所设定的集群资源类型的范围时,创建该项集群资源的控制器,并通过所述控制器监听该项集群资源;
当通过任意控制器监听到该控制器对应的集群资源出现变更时,对该控制器对应的集群资源进行备份。
2.根据权利要求1所述的Kubernetes集群的容灾备份方法,其特征在于,所述对该控制器对应的集群资源进行备份,包括:
基于增量更新的方式,对该控制器对应的集群资源进行备份。
3.根据权利要求1所述的Kubernetes集群的容灾备份方法,其特征在于,所述通过任意控制器监听到该控制器对应的集群资源出现变更,包括:
通过任意控制器监听到该控制器对应的集群资源出现增加事件,删除事件以及修改事件中的任意一种事件时,确定该控制器对应的集群资源出现变更。
4.根据权利要求1至3任一项所述的Kubernetes集群的容灾备份方法,其特征在于,还包括:
当删除任意一项集群资源时,判断是否存在为该项集群资源创建的控制器,如果是,则删除为该项集群资源创建的控制器。
5.根据权利要求1至3任一项所述的Kubernetes集群的容灾备份方法,其特征在于,还包括:
按照第一周期检测Kubernetes集群的API Server的压力值,并且当检测出的压力值小于等于设定的压力值阈值时,对Kubernetes集群的全部资源进行备份。
6.根据权利要求5所述的Kubernetes集群的容灾备份方法,其特征在于,所述对Kubernetes集群的全部资源进行备份,包括:
基于增量更新的方式,对Kubernetes集群的全部资源进行备份。
7.根据权利要求5所述的Kubernetes集群的容灾备份方法,其特征在于,还包括:
在任意一次检测出的压力值大于所述压力值阈值时,在该次检测之后的第一时长内实时检测Kubernetes集群的API Server的压力值;
当在所述第一时长内的任意时刻,检测出的压力值小于等于所述压力值阈值时,基于增量更新的方式,对Kubernetes集群的全部资源进行备份;
当在所述第一时长内的任意时刻,检测出的压力值均大于所述压力值阈值时,在所述第一时长的结束时刻,基于增量更新的方式,对Kubernetes集群的全部资源进行备份。
8.一种Kubernetes集群的容灾备份系统,其特征在于,包括:
监听池设定模块,用于预先设定包括N种集群资源类型的监听池;N为正整数;
控制器创建模块,用于针对Kubernetes集群中的任意一项集群资源,当该项集群资源的类型属于所述监听池所设定的集群资源类型的范围时,创建该项集群资源的控制器,并通过所述控制器监听该项集群资源;
备份模块,用于当通过任意控制器监听到该控制器对应的集群资源出现变更时,对该控制器对应的集群资源进行备份。
9.一种Kubernetes集群的容灾备份设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序以实现如权利要求1至7任一项所述的Kubernetes集群的容灾备份方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的Kubernetes集群的容灾备份方法的步骤。
CN202010879749.3A 2020-08-27 2020-08-27 Kubernetes集群的容灾备份方法及相关组件 Active CN112015593B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010879749.3A CN112015593B (zh) 2020-08-27 2020-08-27 Kubernetes集群的容灾备份方法及相关组件

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010879749.3A CN112015593B (zh) 2020-08-27 2020-08-27 Kubernetes集群的容灾备份方法及相关组件

Publications (2)

Publication Number Publication Date
CN112015593A true CN112015593A (zh) 2020-12-01
CN112015593B CN112015593B (zh) 2022-06-07

Family

ID=73502739

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010879749.3A Active CN112015593B (zh) 2020-08-27 2020-08-27 Kubernetes集群的容灾备份方法及相关组件

Country Status (1)

Country Link
CN (1) CN112015593B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113672341A (zh) * 2021-07-30 2021-11-19 济南浪潮数据技术有限公司 一种提高k8s集群稳定性的方法、系统、装置及存储介质
CN114443356A (zh) * 2021-12-22 2022-05-06 航天信息股份有限公司 一种容器集群的处理方法及系统
CN114584559A (zh) * 2022-03-07 2022-06-03 浪潮云信息技术股份公司 一种实现声明式管理容器云的方法及装置
CN115174364A (zh) * 2022-06-30 2022-10-11 济南浪潮数据技术有限公司 一种容灾场景下的数据还原方法、装置以及介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105389507A (zh) * 2015-11-13 2016-03-09 小米科技有限责任公司 监控系统分区文件的方法及装置
CN111371599A (zh) * 2020-02-26 2020-07-03 山东汇贸电子口岸有限公司 一种基于etcd的集群容灾管理系统
US20200250047A1 (en) * 2019-02-05 2020-08-06 International Business Machines Corporation Performing selective backup operations

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105389507A (zh) * 2015-11-13 2016-03-09 小米科技有限责任公司 监控系统分区文件的方法及装置
US20200250047A1 (en) * 2019-02-05 2020-08-06 International Business Machines Corporation Performing selective backup operations
CN111371599A (zh) * 2020-02-26 2020-07-03 山东汇贸电子口岸有限公司 一种基于etcd的集群容灾管理系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
MEINA SONG等: ""An Auto Scaling System for API Gateway Based on Kubernetes"", 《2018 IEEE 9TH INTERNATIONAL CONFERENCE ON SOFTWARE ENGINEERING AND SERVICE SCIENCE (ICSESS)》, 11 March 2019 (2019-03-11), pages 109 - 112 *
余昌发等: "基于Kubernetes的分布式TensorFlow平台的设计与实现", 《计算机科学》, 15 November 2018 (2018-11-15) *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113672341A (zh) * 2021-07-30 2021-11-19 济南浪潮数据技术有限公司 一种提高k8s集群稳定性的方法、系统、装置及存储介质
CN114443356A (zh) * 2021-12-22 2022-05-06 航天信息股份有限公司 一种容器集群的处理方法及系统
CN114584559A (zh) * 2022-03-07 2022-06-03 浪潮云信息技术股份公司 一种实现声明式管理容器云的方法及装置
CN114584559B (zh) * 2022-03-07 2024-07-12 浪潮云信息技术股份公司 一种实现声明式管理容器云的装置
CN115174364A (zh) * 2022-06-30 2022-10-11 济南浪潮数据技术有限公司 一种容灾场景下的数据还原方法、装置以及介质

Also Published As

Publication number Publication date
CN112015593B (zh) 2022-06-07

Similar Documents

Publication Publication Date Title
CN112015593B (zh) Kubernetes集群的容灾备份方法及相关组件
US10997209B2 (en) Creating replicas at user-defined points in time
US11249860B2 (en) Node down recovery method and apparatus, electronic device, and storage medium
CN107515796B (zh) 一种设备异常监控处理方法及装置
WO2016169166A1 (zh) 虚拟机调度方法和装置
CN109032839A (zh) 一种云主机备份方法及装置
CN111901176B (zh) 故障确定方法、装置、设备及存储介质
CN108958965B (zh) 一种bmc监控可恢复ecc错误的方法、装置及设备
US20150074808A1 (en) Rootkit Detection in a Computer Network
CN112506710A (zh) 分布式文件系统数据修复方法、装置、设备及存储介质
CN109257396B (zh) 一种分布式锁调度方法及装置
CN111625402A (zh) 数据恢复方法、装置、电子设备及计算机可读存储介质
CN110941591A (zh) 一种文件删除方法、装置、设备及可读存储介质
CN117149527B (zh) 一种服务器数据备份与恢复系统及方法
WO2017080362A1 (zh) 数据管理方法及装置
CN114356533B (zh) 微服务无感知发布系统、方法、电子设备及存储介质
JP6269199B2 (ja) 管理サーバおよび障害復旧方法、並びにコンピュータ・プログラム
CN112948020B (zh) 一种配置文件的处理方法和装置
CN113934573A (zh) 一种内存数据库的数据恢复方法及装置
CN111970329A (zh) 一种集群服务的部署方法、系统、设备以及介质
CN110597609A (zh) 一种集群迁移与自动恢复方法及系统
CN114675998B (zh) 一种监控定时快照任务的方法、装置、设备及介质
CN110908776A (zh) 定时任务的执行方法及相关装置、计算机可读存储介质
CN113609211B (zh) 一种集群信息同步方法、装置、计算机设备及存储介质
CN116431608A (zh) 一种数据迁移方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant