CN112929221A - 一种实现云服务产品主备容灾的方法 - Google Patents

一种实现云服务产品主备容灾的方法 Download PDF

Info

Publication number
CN112929221A
CN112929221A CN202110229172.6A CN202110229172A CN112929221A CN 112929221 A CN112929221 A CN 112929221A CN 202110229172 A CN202110229172 A CN 202110229172A CN 112929221 A CN112929221 A CN 112929221A
Authority
CN
China
Prior art keywords
data center
service
main
standby
main data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110229172.6A
Other languages
English (en)
Inventor
石光银
蔡卫卫
高传集
孙思清
王文岗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Cloud Information Technology Co Ltd
Original Assignee
Inspur Cloud Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Cloud Information Technology Co Ltd filed Critical Inspur Cloud Information Technology Co Ltd
Priority to CN202110229172.6A priority Critical patent/CN112929221A/zh
Publication of CN112929221A publication Critical patent/CN112929221A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0663Performing the actions predefined by failover planning, e.g. switching to standby network elements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network

Abstract

本发明特别涉及一种实现云服务产品主备容灾的方法。该实现云服务产品主备容灾的方法,将主备数据中心的机器做成一个容器集群,在主数据中心部署所有产品组件,在备数据中心部署租户关键业务组件,租户关键业务组件在主备数据中心同时运行;租户业务访问负载均衡,负载均衡分发业务流量到主数据中心,当主数据中心不能提供服务时,切换到备数据中心,当主数据中心修复后,业务切回到主数据中心。该实现云服务产品主备容灾的方法,当服务产品所在数据中心由于不可抗拒因素不能提供服务时,能够实现主数据中心与备数据中心的快速切换,不影响用户使用服务提供业务,有效提升了云服务的高可用性,保证了用户业务的持续响应。

Description

一种实现云服务产品主备容灾的方法
技术领域
本发明涉及云服务技术领域,特别涉及一种实现云服务产品主备容灾的方法。
背景技术
Kubernetes是一个基于容器技术的分布式架构领先方案,为容器化的应用提供部署、运行、容器编排、容器调度、服务发现和动态伸缩等一系列功能,提高了大规模容器集群管理的便捷性和高可用性。
容器技术是比较流行的提供微服务的PaaS技术,而Kubernetes是容器编排调度的事实标准,基于Kubernetes提供容器云平台是各大云厂商的首选。
用户运行服务的机器可能由于不可抗拒的因素(比如:机房着火、电缆断裂等)导致不能提供服务,从而导致用户业务中断,如何快速的恢复业务是所有云平台都需要考虑的问题。
基于此,本发明提出了一种实现云服务产品主备容灾的方法。
发明内容
本发明为了弥补现有技术的缺陷,提供了一种简单高效的实现云服务产品主备容灾的方法。
本发明是通过如下技术方案实现的:
一种实现云服务产品主备容灾的方法,其特征在于:将主备数据中心的机器做成一个容器集群,主数据中心部署所有产品组件,备数据中心部署租户关键业务组件,租户关键业务组件在主备数据中心同时运行;
租户业务访问负载均衡,负载均衡分发业务流量到主数据中心,当主数据中心不能提供服务时,切换到备数据中心;
备数据中心使用单副本服务,实时备份关键业务数据,用于容灾使用,当主数据中心修复后,业务切回到主数据中心。
所述备数据中心运行的组件包括Etcd(容器元数据存储数据库)、MariaDB(虚机管理元数据存储数据库)、RabbitMQ(虚机管理消息服务)和Ceph-Mon(容器存储监听器);上述组件在主数据中心部署两组,在备数据中心部署一组。
当需要切到备数据中心时,若主数据中心虚机可用,则关闭主数据中心Keepalived(虚机IP管理器)服务和管理侧虚机,保证主数据中心的虚拟IP和管理侧虚机全部停机后,执行切换逻辑。
执行切换备数据中心逻辑时,在备数据中心启动Etcd组件、MariaDB组件、RabbitMQ组件和Ceph-Mon组件,并去掉主数据中心的ApiServer(容器API服务器)信息和Etcd组件信息,然后启动虚机迁移动作,将租户业务负载到备数据中心,即可提供客户业务访问。
执行切换备数据中心逻辑的具体流程如下:
1)在备数据中心拉起Etcd、Ceph-Mon、MariaDB和RabbitMQ服务;
2)修改备数据中心Nginx(应用服务反向代理服务器)配置,去掉主数据中心的ApiServer信息和Etcd组件信息;
3)修改计算节点主机聚合标识到备数据中心的计算节点,启动虚机迁移动作;
4)修改租户访问业务的负载均衡策略,将租户业务负载到备数据中心,备数据中心即可提供客户业务访问。
当主数据中心修复后,先启动主数据中心的管理侧虚机,然后执行主数据中心恢复逻辑。
执行主数据中心恢复逻辑时,在主数据中心启动Etcd组件、MariaDB组件、RabbitMQ组件和Ceph-Mon组件,并恢复主数据中心的Kubernetes服务和Keepalived服务,保证路由到主数据中心的ApiServer和Etcd组件,然后启动虚机迁移动作,将租户业务负载到主数据中心,即可提供客户业务访问。
执行主数据中心恢复逻辑的具体流程如下:
1)完成主数据中心Etcd、Ceph-Mon、MariaDB和RabbitMQ组件加入备数据中心服务;
2)恢复主数据中心Kubernetes服务和Keepalived服务;
3)修改备数据中心Nginx配置,保证路由到主数据中心的ApiServer和Etcd组件;
4)修改计算节点主机聚合标识到主数据中心的计算节点,启动虚机迁移动作;
5)修改租户访问业务的负载均衡策略,将租户业务负载到主数据中心,主数据中心即可提供客户业务访问。
本发明的有益效果是:该实现云服务产品主备容灾的方法,当服务产品所在数据中心由于不可抗拒因素不能提供服务时,能够实现主数据中心与备数据中心的快速切换,不影响用户使用服务提供业务,有效提升了云服务的高可用性,保证了用户业务的持续响应。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
附图1为本发明主数据中心切换到备数据中心的方法示意图。
附图2为本发明备数据中心切换到主数据中心的方法示意图。
具体实施方式
为了使本技术领域的人员更好的理解本发明中的技术方案,下面将结合本发明实施例,对本发明实施例中的技术方案进行清楚,完整的描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
该实现云服务产品主备容灾的方法,将主备数据中心的机器做成一个容器集群,主数据中心部署所有产品组件,备数据中心部署租户关键业务组件,租户关键业务组件在主备数据中心同时运行;
租户业务访问负载均衡,负载均衡分发业务流量到主数据中心,当主数据中心不能提供服务时,切换到备数据中心;
备数据中心使用单副本服务,实时备份关键业务数据,用于容灾使用,当主数据中心修复后,业务切回到主数据中心。
所述备数据中心运行的组件包括Etcd(容器元数据存储数据库)、MariaDB(虚机管理元数据存储数据库)、RabbitMQ(虚机管理消息服务)和Ceph-Mon(容器存储监听器);上述组件在主数据中心部署两组,在备数据中心部署一组。
当需要切到备数据中心时,若主数据中心虚机可用,则关闭主数据中心Keepalived(虚机IP管理器)服务和管理侧虚机,保证主数据中心的虚拟IP和管理侧虚机全部停机后,执行切换逻辑。
执行切换备数据中心逻辑时,在备数据中心启动Etcd组件、MariaDB组件、RabbitMQ组件和Ceph-Mon组件,并去掉主数据中心的ApiServer(容器API服务器)信息和Etcd组件信息,然后启动虚机迁移动作,将租户业务负载到备数据中心,即可提供客户业务访问。
执行切换备数据中心逻辑的具体流程如下:
1)在备数据中心拉起Etcd、Ceph-Mon、MariaDB和RabbitMQ服务;
2)修改备数据中心Nginx(应用服务反向代理服务器)配置,去掉主数据中心的ApiServer信息和Etcd组件信息;
3)修改计算节点主机聚合标识到备数据中心的计算节点,启动虚机迁移动作;
4)修改租户访问业务的负载均衡策略,将租户业务负载到备数据中心,备数据中心即可提供客户业务访问。
当主数据中心修复后,先启动主数据中心的管理侧虚机,然后执行主数据中心恢复逻辑。
执行主数据中心恢复逻辑时,在主数据中心启动Etcd组件、MariaDB组件、RabbitMQ组件和Ceph-Mon组件,并恢复主数据中心的Kubernetes服务和Keepalived服务,保证路由到主数据中心的ApiServer和Etcd组件,然后启动虚机迁移动作,将租户业务负载到主数据中心,即可提供客户业务访问。
执行主数据中心恢复逻辑的具体流程如下:
1)完成主数据中心Etcd、Ceph-Mon、MariaDB和RabbitMQ组件加入备数据中心服务;
2)恢复主数据中心Kubernetes服务和Keepalived服务;
3)修改备数据中心Nginx配置,保证路由到主数据中心的ApiServer和Etcd组件;
4)修改计算节点主机聚合标识到主数据中心的计算节点,启动虚机迁移动作;
5)修改租户访问业务的负载均衡策略,将租户业务负载到主数据中心,主数据中心即可提供客户业务访问。
以上所述的实施例,只是本发明具体实施方式的一种,本领域的技术人员在本发明技术方案范围内进行的通常变化和替换都应包含在本发明的保护范围内。

Claims (8)

1.一种实现云服务产品主备容灾的方法,其特征在于:将主备数据中心的机器做成一个容器集群,主数据中心部署所有产品组件,备数据中心部署租户关键业务组件,租户关键业务组件在主备数据中心同时运行;
租户业务访问负载均衡,负载均衡分发业务流量到主数据中心,当主数据中心不能提供服务时,切换到备数据中心;
备数据中心使用单副本服务,实时备份关键业务数据,用于容灾使用,当主数据中心修复后,业务切回到主数据中心。
2.根据权利要求1所述的实现云服务产品主备容灾的方法,其特征在于:所述备数据中心运行的组件包括Etcd、MariaDB、RabbitMQ和Ceph-Mon;上述组件在主数据中心部署两组,在备数据中心部署一组。
3.根据权利要求2所述的实现云服务产品主备容灾的方法,其特征在于:当需要切到备数据中心时,若主数据中心虚机可用,则关闭主数据中心Keepalived服务和管理侧虚机,保证主数据中心的虚拟IP和管理侧虚机全部停机后,执行切换逻辑。
4.根据权利要求3所述的实现云服务产品主备容灾的方法,其特征在于:执行切换备数据中心逻辑时,在备数据中心启动Etcd组件、MariaDB组件、RabbitMQ组件和Ceph-Mon组件,并去掉主数据中心的ApiServer信息和Etcd组件信息,然后启动虚机迁移动作,将租户业务负载到备数据中心,即可提供客户业务访问。
5.根据权利要求4所述的实现云服务产品主备容灾的方法,其特征在于:执行切换备数据中心逻辑的具体流程如下:
1)在备数据中心拉起Etcd、Ceph-Mon、MariaDB和RabbitMQ服务;
2)修改备数据中心Nginx配置,去掉主数据中心的ApiServer信息和Etcd组件信息;
3)修改计算节点主机聚合标识到备数据中心的计算节点,启动虚机迁移动作;
4)修改租户访问业务的负载均衡策略,将租户业务负载到备数据中心,备数据中心即可提供客户业务访问。
6.根据权利要求2所述的实现云服务产品主备容灾的方法,其特征在于:当主数据中心修复后,先启动主数据中心的管理侧虚机,然后执行主数据中心恢复逻辑。
7.根据权利要求6所述的实现云服务产品主备容灾的方法,其特征在于:执行主数据中心恢复逻辑时,在主数据中心启动Etcd组件、MariaDB组件、RabbitMQ组件和Ceph-Mon组件,并恢复主数据中心的Kubernetes服务和Keepalived服务,保证路由到主数据中心的ApiServer和Etcd组件,然后启动虚机迁移动作,将租户业务负载到主数据中心,即可提供客户业务访问。
8.根据权利要求7所述的实现云服务产品主备容灾的方法,其特征在于:执行主数据中心恢复逻辑的具体流程如下:
1)完成主数据中心Etcd、Ceph-Mon、MariaDB和RabbitMQ组件加入备数据中心服务;
2)恢复主数据中心Kubernetes服务和Keepalived服务;
3)修改备数据中心Nginx配置,保证路由到主数据中心的ApiServer和Etcd组件;
4)修改计算节点主机聚合标识到主数据中心的计算节点,启动虚机迁移动作;
5)修改租户访问业务的负载均衡策略,将租户业务负载到主数据中心,主数据中心即可提供客户业务访问。
CN202110229172.6A 2021-03-02 2021-03-02 一种实现云服务产品主备容灾的方法 Pending CN112929221A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110229172.6A CN112929221A (zh) 2021-03-02 2021-03-02 一种实现云服务产品主备容灾的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110229172.6A CN112929221A (zh) 2021-03-02 2021-03-02 一种实现云服务产品主备容灾的方法

Publications (1)

Publication Number Publication Date
CN112929221A true CN112929221A (zh) 2021-06-08

Family

ID=76172989

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110229172.6A Pending CN112929221A (zh) 2021-03-02 2021-03-02 一种实现云服务产品主备容灾的方法

Country Status (1)

Country Link
CN (1) CN112929221A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114466027A (zh) * 2022-01-26 2022-05-10 苏州浪潮智能科技有限公司 一种云原生数据库服务提供方法、系统、设备及介质
CN114996352A (zh) * 2022-05-18 2022-09-02 聚好看科技股份有限公司 数据库管理系统及方法
CN116996369A (zh) * 2023-09-26 2023-11-03 苏州元脑智能科技有限公司 容器化管理服务器及其主备管理方法、装置和存储介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103647849A (zh) * 2013-12-24 2014-03-19 华为技术有限公司 一种业务迁移方法、装置和一种容灾系统
US20160306719A1 (en) * 2015-04-14 2016-10-20 Karolin Laicher Disaster recovery framework for cloud delivery
CN107231221A (zh) * 2016-03-25 2017-10-03 阿里巴巴集团控股有限公司 数据中心间的业务流量控制方法、装置及系统
CN108932180A (zh) * 2018-06-21 2018-12-04 郑州云海信息技术有限公司 一种容灾管理方法、装置、存储介质和计算机设备质
CN109471755A (zh) * 2018-11-14 2019-03-15 江苏鸿信系统集成有限公司 一种基于云计算的同城异地灾备的方法及其系统
US20200019479A1 (en) * 2017-03-21 2020-01-16 Huawei Technologies Co., Ltd. Disaster recovery deployment method, apparatus, and system
CN111131451A (zh) * 2019-12-23 2020-05-08 武汉联影医疗科技有限公司 业务处理系统及业务处理方法
CN111130835A (zh) * 2018-11-01 2020-05-08 中国移动通信集团河北有限公司 数据中心双活系统、切换方法、装置、设备及介质
CN112003716A (zh) * 2019-12-12 2020-11-27 军事科学院系统工程研究院网络信息研究所 一种数据中心双活实现方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103647849A (zh) * 2013-12-24 2014-03-19 华为技术有限公司 一种业务迁移方法、装置和一种容灾系统
US20160306719A1 (en) * 2015-04-14 2016-10-20 Karolin Laicher Disaster recovery framework for cloud delivery
CN107231221A (zh) * 2016-03-25 2017-10-03 阿里巴巴集团控股有限公司 数据中心间的业务流量控制方法、装置及系统
US20200019479A1 (en) * 2017-03-21 2020-01-16 Huawei Technologies Co., Ltd. Disaster recovery deployment method, apparatus, and system
CN108932180A (zh) * 2018-06-21 2018-12-04 郑州云海信息技术有限公司 一种容灾管理方法、装置、存储介质和计算机设备质
CN111130835A (zh) * 2018-11-01 2020-05-08 中国移动通信集团河北有限公司 数据中心双活系统、切换方法、装置、设备及介质
CN109471755A (zh) * 2018-11-14 2019-03-15 江苏鸿信系统集成有限公司 一种基于云计算的同城异地灾备的方法及其系统
CN112003716A (zh) * 2019-12-12 2020-11-27 军事科学院系统工程研究院网络信息研究所 一种数据中心双活实现方法
CN111131451A (zh) * 2019-12-23 2020-05-08 武汉联影医疗科技有限公司 业务处理系统及业务处理方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114466027A (zh) * 2022-01-26 2022-05-10 苏州浪潮智能科技有限公司 一种云原生数据库服务提供方法、系统、设备及介质
CN114466027B (zh) * 2022-01-26 2023-08-04 苏州浪潮智能科技有限公司 一种云原生数据库服务提供方法、系统、设备及介质
CN114996352A (zh) * 2022-05-18 2022-09-02 聚好看科技股份有限公司 数据库管理系统及方法
CN116996369A (zh) * 2023-09-26 2023-11-03 苏州元脑智能科技有限公司 容器化管理服务器及其主备管理方法、装置和存储介质
CN116996369B (zh) * 2023-09-26 2024-02-09 苏州元脑智能科技有限公司 容器化管理服务器及其主备管理方法、装置和存储介质

Similar Documents

Publication Publication Date Title
CN112929221A (zh) 一种实现云服务产品主备容灾的方法
EP3433759B1 (en) Method and apparatus for expanding high-availability server cluster
CN111290834B (zh) 一种基于云管理平台实现业务高可用的方法、装置及设备
JP6466003B2 (ja) Vnfフェイルオーバの方法及び装置
CN111641515B (zh) Vnf的生命周期管理方法及装置
CN108200124B (zh) 一种高可用应用程序架构及构建方法
CN105955824A (zh) 一种虚拟资源配置方法以及装置
CN105337780B (zh) 一种服务器节点配置方法及物理节点
CN105183554A (zh) 高性能计算与云计算混合计算系统及其资源管理方法
US10083098B1 (en) Network function virtualization (NFV) virtual network function (VNF) crash recovery
CN111935238A (zh) 一种云平台负载均衡管理系统、方法、设备及介质
CN105404542A (zh) 云计算系统及在其上运行高性能计算的方法
US10860375B1 (en) Singleton coordination in an actor-based system
CN107122229A (zh) 一种虚拟机恢复方法及装置
CN111949444A (zh) 一种基于分布式服务集群的数据备份与恢复系统及方法
CN105357322A (zh) 一种基于拓扑划分的虚拟机分配方法
WO2015154525A1 (zh) 一种使用多板卡保护HQoS的方法和装置
CN104113606A (zh) 一致性动态均衡的分布式元数据节点架构
CN111935244B (zh) 一种业务请求处理系统及超融合一体机
CN111741135A (zh) 一种混合云灾备系统及其控制方法
CN112698838A (zh) 多云容器部署系统及其容器部署方法
CN114448782A (zh) 一种基于云平台对云主机进行容灾的方法、装置及介质
CN104125089A (zh) 网络事务控制方法及执行方法及网络控制器及转发设备
CN112019614B (zh) 双系统之间通信与通信同步的方法、系统与处理器
CN110795209B (zh) 一种控制方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210608

RJ01 Rejection of invention patent application after publication