CN117201278A - 一种实现信创环境云原生应用主备容灾高可用场景的方法 - Google Patents

一种实现信创环境云原生应用主备容灾高可用场景的方法 Download PDF

Info

Publication number
CN117201278A
CN117201278A CN202311093364.4A CN202311093364A CN117201278A CN 117201278 A CN117201278 A CN 117201278A CN 202311093364 A CN202311093364 A CN 202311093364A CN 117201278 A CN117201278 A CN 117201278A
Authority
CN
China
Prior art keywords
application
cluster
workload
drbd
standby
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311093364.4A
Other languages
English (en)
Inventor
楼哲伟
颜亮
尹东超
石光银
蔡卫卫
高传集
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Cloud Information Technology Co Ltd
Original Assignee
Inspur Cloud Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Cloud Information Technology Co Ltd filed Critical Inspur Cloud Information Technology Co Ltd
Priority to CN202311093364.4A priority Critical patent/CN117201278A/zh
Publication of CN117201278A publication Critical patent/CN117201278A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Hardware Redundancy (AREA)

Abstract

本发明提供一种实现信创环境云原生应用主备容灾高可用场景的方法,属于领域,本发明支持创建高可用应用实例,支持执行高可用应用分发策略分发应用实现应用备份,支持执行高可用应用数据同步策略控制应用主备间的数据同步,支持执行高可用应用主备切换策略保证在故障时能够切换主备应用维持服务可用,从而实现云原生应用的主备容灾高可用场景。

Description

一种实现信创环境云原生应用主备容灾高可用场景的方法
技术领域
本发明涉及容器云平台、信创环境、主备容灾等相关技术领域,尤其涉及一种实现信创环境云原生应用主备容灾高可用场景的方法。
背景技术
随着云计算业务的发展,在云上部署应用已经越来越普遍。在国内信息技术的持续高速发展下,信创环境也成为越来越重要的选择。信创环境云服务平台作为云上应用容器运行的环境,需要为客户提供高可用高可靠的环境。为了解决平台单一可用区集群级别故障可用性问题,实现集群级故障快速恢复能力,最大化提升可用性,降低业务风险,实现信创环境云原生应用的主备容灾高可用是关键技术手段之一。
Clusternet组件是一种兼具多集群管理和跨集群应用编排的云原生项目,支持向不同集群分发和管理各种应用资源,包括原生Kubernetes各类资源、各类CRD资源,以及HelmChart应用等等。
DRBD技术是一种支持存储高可靠的技术,它使用数据同步的方式保证数据备份到其他节点,同时能够自动快速的切换到主备节点并持续对外提供服务,从而减少数据的丢失。
发明内容
为了解决以上技术问题,本发明提供了一种实现信创环境云原生应用主备容灾高可用场景的方法。通过使用该发明,可以支持创建高可用应用实例,支持执行高可用应用分发策略分发应用实现应用备份,支持执行高可用应用数据同步策略控制应用主备间的数据同步,支持执行高可用应用主备切换策略保证在故障时能够切换主备应用维持服务可用,从而实现信创环境云原生应用的主备容灾高可用场景。
本发明的技术方案是:
一种实现信创环境云原生应用主备容灾高可用场景的方法,包括:
创建高可用应用实例,执行应用分发策略实现应用备份,执行数据同步策略,执行主备切换策略提升应用的高可用能力。
进一步的,
创建的高可用应用实例需定义以下属性,包括应用工作负载,应用工作负载配置,分发策略,数据同步策略,主备切换策略。
a.应用工作负载,存放一个应用实例的工作负载信息,包括有状态工作负载,无状态工作负载,及工作负载所关联的资源,包括LV存储、StateulSET、Deployment、Ingress、Namespace;
b.应用工作负载配置,用于配置相关资源的可修改字段,包括以下字段:
1).数据层:pvc的存储容量、sc的信息、LVMVolume的存储容量和运行节点、DRBD的组件信息;
2).服务层:Mysql的副本数、redis的副本数;
3).应用层:deployment的副本数、statefulset的副本数;
4).接入层:ingress的限流、白名单、每秒请求限制、每分请求限制。
c.应用分发策略:定义应用高可用服务实例的分发策略信息,包括应用工作负载分发的优先级,分发的工作流步骤;
d.数据同步策略:定义应用高可用服务实例的数据同步策略信息,在分发策略执行成功后,自动生成同步策略,定义应用有状态工作负载如何从主集群往备集群同步数据;
e.主备切换策略:定义应用高可用服务实例的主备切换策略信息,包括执行主备切换时,主集群应用和备集群应用工作负载的修改策略。
进一步的,
执行应用分发策略实现应用备份,通过应用分发,能够将主集群选择的应用实例及其关联资源在备集群复制,在备集群生成应用,实现应用备份;通过clusternet向备集群分发所有关联的资源,实现备集群的应用部署。
具体包括:
a.获取需要分发的工作负载列表;高可用服务实例中的工作负载定义了相关资源;
b.生成subscription,根据获取得到的工作负载列表定义subscription文件部署资源;
c.获取工作负载配置信息;高可用服务实例的工作负载配置定义了相关信息,包括对各个资源的修改字段值;
d.生成localization,根据获取得到的工作负载配置信息定义localization文件修改相关资源配置;
e.将分发部署后的应用在应用管理器中登记。
进一步的,
执行数据同步策略,使用drbd组件支持应用主备间的数据同步,保证主备集群应用的有状态负载的数据一致性;具体包括
a.获取需要执行数据同步策略的工作负载;需要执行数据同步的工作负载包括有状态负载mysql,redis;
b.获取同步策略配置的参数;包括drbd的节点信息、磁盘名称、数据同步端口、主磁盘名称、主磁盘节点、副磁盘名称、副磁盘节点;
c.分别在主备集群开启工作流生成drbd资源进行数据同步。
主集群工作流包括以下步骤:
1).停止需要同步的工作负载;
2).部署drbd资源;
3).等待主集群drbd资源状态正常;
4).恢复已停止的工作负载。
备集群工作流包括以下步骤:
1).部署drbd资源;
2).等待备集群drbd资源状态正常;
完成上述步骤后,开启主备应用之间的数据同步服务。
进一步的,
执行主备切换策略提升应用的高可用能力,在主集群应用故障时,在备集群启动应用,切换drbd资源的主节点到备集群;
执行高可用应用策略,通过cluseternet将任务工作流分发至对应集群执行,通过工作流模型控制策略执行过程。
执行主备切换策略,具体包括:
a.获取配置信息,包括高可用服务实例信息,主备集群状态信息,主备集群drbd配置信息,应用切换步骤;
b.检查备集群状态,保证备集群状态正常;
c.检查主集群状态;若主集群状态不正常,直接进入下一步开启备集群工作流执行备切主。若主集群状态正常,则需先开启主集群工作流将主切备;
主集群工作流具体流程如下,
1).将使用drbd的工作负载缩容至0;
2).将drbd资源状态主切备;
3).等待主集群drbd资源状态为secondary;
4).主集群切流。
d.开启备集群工作流执行备切主。
备集群工作流具体流程如下,
1).将drbd资源状态备切主;
2).将使用drbd的工作负载扩容至预期副本数;
3).启动服务。
4).备集群接入流量。
完成上述步骤,实现应用主备切换。
本发明的有益效果是
通过使用一种实现信创环境云原生应用主备容灾高可用场景的方法支持创建高可用应用实例,支持执行高可用应用分发策略分发应用实现应用备份,支持执行高可用应用数据同步策略控制应用主备间的数据同步,支持执行高可用应用主备切换策略保证在故障时能够切换主备应用维持服务可用。具体为:
1、通过高可用应用实例分发,实现云原生应用的备集群备份,解决无状态业务负载在单可用区集群级别故障可用性问题。
2、通过执行高可用应用实例数据同步策略,实时同步主备集群间的应用数据,降低数据丢失的可能,提升了应用的高可靠性,使之具备故障快速恢复的前提。
3、当主集群不可用时,通过执行高可用应用主备切换策略,可以在短时间内切换应用至备节点,快速恢复应用服务。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
信创环境云原生应用支持创建高可用应用实例,支持执行高可用应用实例分发策略,支持执行高可用应用数据同步策略,支持执行高可用应用主备切换策略。其技术方案主要具体介绍如下:
(1)高可用应用实例的创建。针对每一个需要实现主备容灾高可用的应用,需要生成一个高可用应用实例对象,用以对高可用应用进行统一的管理和任务策略的定义。一个高可用应用实例应包括以下特征:
a.应用工作负载,存放一个应用实例的工作负载信息,包括但不限于有状态工作负载如Mysql,redis等数据库,无状态工作负载如nginx等组件,及工作负载所关联的资源,包括但不限于LV存储、StateulSET、Deployment、Ingress、Namespace等。
b.应用工作负载配置,用于配置相关资源的可修改字段,包括但不限于以下字段:
1.数据层:pvc的存储容量、sc的信息、LVMVolume的存储容量和运行节点、DRBD的组件信息(节点、磁盘名称、数据同步端口、主磁盘名称、主磁盘节点、副磁盘名称、副磁盘节点等);
2.服务层:Mysql的副本数、redis的副本数等;
3.应用层:deployment的副本数、statefulset的副本数等;
4.接入层:ingress的限流、白名单、每秒请求限制、每分请求限制等。
c.应用分发策略:定义应用高可用服务实例的分发策略信息,包括但不限于应用工作负载分发的优先级,分发的工作流步骤等。
d.数据同步策略:定义应用高可用服务实例的数据同步策略信息,在分发策略执行成功后,自动生成同步策略,主要定义应用有状态工作负载如何从主集群往备集群同步数据。
e.主备切换策略:定义应用高可用服务实例的主备切换策略信息,包括但不限于执行主备切换时,主集群应用和备集群应用工作负载的修改策略。
(2)执行应用分发策略。通过应用分发,能够将主集群选择的应用实例及其关联资源在备集群复制,在备集群生成应用,实现应用备份。通过clusternet向备集群进行资源的分发。具体地,
a.获取需要分发的工作负载列表。高可用服务实例中的工作负载定义了相关资源。
b.生成subscription,根据获取得到的工作负载列表定义subscription文件部署资源。
c.获取工作负载配置信息。高可用服务实例的工作负载配置定义了相关信息,包括对各个资源的修改字段值。
d.生成localization,根据获取得到的工作负载配置信息定义localization文件修改相关资源配置。
e.将分发部署后的应用在应用管理器中登记。
通过上述步骤,完成应用分发,实现备集群应用备份。
(3)执行数据同步策略。通过数据同步,将主集群应用中有状态工作负载的数据同步至备集群,保证数据的一致性。数据同步利用drbd组件完成。具体地,
a.获取需要执行数据同步策略的工作负载。需要执行数据同步的工作负载包括但不限于有状态负载mysql,redis等。
b.获取同步策略配置的参数。包括但不限于drbd的节点信息、磁盘名称、数据同步端口、主磁盘名称、主磁盘节点、副磁盘名称、副磁盘节点等
c.分别在主备集群开启工作流生成drbd资源进行数据同步。
主集群工作流主要包括以下步骤:
1.停止需要同步的工作负载;
2.部署drbd资源;
3.等待主集群drbd资源状态正常;
4.恢复已停止的工作负载。
备集群工作流主要包括以下步骤:
1.部署drbd资源;
2.等待备集群drbd资源状态正常;
完成上述步骤后,开启主备应用之间的数据同步服务。
(4)执行主备切换策略。通过主备切换,在主集群故障时,将应用业务切换至备集群,缩短业务停止时间,提升应用可靠性。具体地,
a.获取配置信息,包括但不限于高可用服务实例信息,主备集群状态信息,主备集群drbd配置信息,应用切换步骤等。
b.检查备集群状态,保证备集群状态正常。
c.检查主集群状态。若主集群状态不正常,直接进入下一步开启备集群工作流执行备切主。若主集群状态正常,则需先开启主集群工作流将主切备。主集群工作流具体流程如下,
1.将使用drbd的工作负载缩容至0;
2.将drbd资源状态主切备;
3.等待主集群drbd资源状态为secondary;
4.主集群切流。
d.开启备集群工作流执行备切主。备集群工作流具体流程如下,
1.将drbd资源状态备切主;
2.将使用drbd的工作负载扩容至预期副本数;
3.启动服务。
4.备集群接入流量。
完成上述步骤,实现应用主备切换,达到应用故障时快速恢复,保证应用高可用的目的。
以上所述仅为本发明的较佳实施例,仅用于说明本发明的技术方案,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所做的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (10)

1.一种实现信创环境云原生应用主备容灾高可用场景的方法,其特征在于,
包括:
创建高可用应用实例,执行应用分发策略实现应用备份,执行数据同步策略,执行主备切换策略提升应用的高可用能力。
2.根据权利要求1所述的方法,其特征在于,
创建的高可用应用实例需定义以下属性,包括应用工作负载,应用工作负载配置,分发策略,数据同步策略,主备切换策略。
3.根据权利要求2所述的方法,其特征在于,
a.应用工作负载,存放应用实例的工作负载信息,包括有状态工作负载,无状态工作负载,及工作负载所关联的资源,包括LV存储、StateulSET、Deployment、Ingress、Namespace;
b.应用工作负载配置,用于配置相关资源的可修改字段,包括以下字段:
1).数据层:pvc的存储容量、sc的信息、LVMVolume的存储容量和运行节点、DRBD的组件信息;
2).服务层:Mysql的副本数、redis的副本数;
3).应用层:deployment的副本数、statefulset的副本数;
4).接入层:ingress的限流、白名单、每秒请求限制、每分请求限制。
c.应用分发策略:定义应用高可用服务实例的分发策略信息,包括应用工作负载分发的优先级,分发的工作流步骤;
d.数据同步策略:定义应用高可用服务实例的数据同步策略信息,在分发策略执行成功后,自动生成同步策略,定义应用有状态工作负载如何从主集群往备集群同步数据;
e.主备切换策略:定义应用高可用服务实例的主备切换策略信息,包括执行主备切换时,主集群应用和备集群应用工作负载的修改策略。
4.根据权利要求1所述的方法,其特征在于,
执行应用分发策略实现应用备份,通过应用分发,能够将主集群选择的应用实例及其关联资源在备集群复制,在备集群生成应用,实现应用备份;通过clusternet向备集群分发所有关联的资源,实现备集群的应用部署。
5.根据权利要求4所述的方法,其特征在于,
执行应用分发策略实现应用备份,具体包括:
a.获取需要分发的工作负载列表;高可用服务实例中的工作负载定义了相关资源;
b.生成subscription,根据获取得到的工作负载列表定义subscription文件部署资源;
c.获取工作负载配置信息;高可用服务实例的工作负载配置定义了相关信息,包括对各个资源的修改字段值;
d.生成localization,根据获取得到的工作负载配置信息定义localization文件修改相关资源配置;
e.将分发部署后的应用在应用管理器中登记。
6.根据权利要求1所述的方法,其特征在于,
执行数据同步策略,使用drbd组件支持应用主备间的数据同步,保证主备集群应用的有状态负载的数据一致性;具体包括
a.获取需要执行数据同步策略的工作负载;需要执行数据同步的工作负载包括有状态负载mysql,redis;
b.获取同步策略配置的参数;包括drbd的节点信息、磁盘名称、数据同步端口、主磁盘名称、主磁盘节点、副磁盘名称、副磁盘节点;
c.分别在主备集群开启工作流生成drbd资源进行数据同步。
7.根据权利要求6所述的方法,其特征在于,
主集群工作流包括以下步骤:
1).停止需要同步的工作负载;
2).部署drbd资源;
3).等待主集群drbd资源状态正常;
4).恢复已停止的工作负载;
备集群工作流包括以下步骤:
1).部署drbd资源;
2).等待备集群drbd资源状态正常;
完成上述步骤后,开启主备应用之间的数据同步服务。
8.根据权利要求1所述的方法,其特征在于,
执行主备切换策略提升应用的高可用能力,在主集群应用故障时,在备集群启动应用,切换drbd资源的主节点到备集群;
执行高可用应用策略,通过cluseternet将任务工作流分发至对应集群执行,通过工作流模型控制策略执行过程。
9.根据权利要求8所述的方法,其特征在于,
执行主备切换策略,具体包括:
a.获取配置信息,包括高可用服务实例信息,主备集群状态信息,主备集群drbd配置信息,应用切换步骤;
b.检查备集群状态,保证备集群状态正常;
c.检查主集群状态;若主集群状态不正常,直接进入下一步开启备集群工作流执行备切主。若主集群状态正常,则需先开启主集群工作流将主切备;
d.开启备集群工作流执行备切主。
10.根据权利要求9所述的方法,其特征在于,
主集群工作流具体流程如下,
1).将使用drbd的工作负载缩容至0;
2).将drbd资源状态主切备;
3).等待主集群drbd资源状态为secondary;
4).主集群切流;
备集群工作流具体流程如下,
1).将drbd资源状态备切主;
2).将使用drbd的工作负载扩容至预期副本数;
3).启动服务;
4).备集群接入流量;
完成上述步骤,实现应用主备切换。
CN202311093364.4A 2023-08-29 2023-08-29 一种实现信创环境云原生应用主备容灾高可用场景的方法 Pending CN117201278A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311093364.4A CN117201278A (zh) 2023-08-29 2023-08-29 一种实现信创环境云原生应用主备容灾高可用场景的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311093364.4A CN117201278A (zh) 2023-08-29 2023-08-29 一种实现信创环境云原生应用主备容灾高可用场景的方法

Publications (1)

Publication Number Publication Date
CN117201278A true CN117201278A (zh) 2023-12-08

Family

ID=88987919

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311093364.4A Pending CN117201278A (zh) 2023-08-29 2023-08-29 一种实现信创环境云原生应用主备容灾高可用场景的方法

Country Status (1)

Country Link
CN (1) CN117201278A (zh)

Similar Documents

Publication Publication Date Title
US11360854B2 (en) Storage cluster configuration change method, storage cluster, and computer system
US11307943B2 (en) Disaster recovery deployment method, apparatus, and system
CN111290834B (zh) 一种基于云管理平台实现业务高可用的方法、装置及设备
CN103414712B (zh) 一种分布式虚拟桌面管理系统和方法
CN106850260A (zh) 一种虚拟化资源管理平台的部署方法和装置
CN103647849A (zh) 一种业务迁移方法、装置和一种容灾系统
CN110912991A (zh) 一种基于超融合双节点高可用的实现方法
CN105630589A (zh) 分布式流程调度系统及流程调度、执行方法
CN115576655B (zh) 容器数据保护系统、方法、装置、设备及可读存储介质
CN111935244B (zh) 一种业务请求处理系统及超融合一体机
CN110764918A (zh) 一种容器集群中主节点管理方法
CN103793296A (zh) 一种在集群中用于辅助备份复制计算机系统的方法
CN114143175A (zh) 主备集群实现方法及系统
CN112243030A (zh) 分布式存储系统的数据同步方法、装置、设备及介质
CN103780433B (zh) 自愈式虚拟资源配置管理数据架构
CN117201278A (zh) 一种实现信创环境云原生应用主备容灾高可用场景的方法
CN107181608A (zh) 一种恢复服务及性能提升的方法及运维管理系统
CN111367711A (zh) 一种基于超融合数据安全容灾方法
CN114584459A (zh) 一种实现容器云平台主备高可用的方法
CN111966469A (zh) 一种集群虚拟机高可用方法及系统
CN109995560A (zh) 云资源池管理系统及方法
CN115510167B (zh) 一种分布式数据库系统及电子设备
Hong et al. Database docker persistence framework based on swarm and ceph
CN116414915A (zh) 分布式数据库集群的管控方法、装置和数据库管控平台
Mishra et al. Design and implementation of an availability management service

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination