CN114679376A - 一种多数据中心灾备方法和系统 - Google Patents
一种多数据中心灾备方法和系统 Download PDFInfo
- Publication number
- CN114679376A CN114679376A CN202210160752.9A CN202210160752A CN114679376A CN 114679376 A CN114679376 A CN 114679376A CN 202210160752 A CN202210160752 A CN 202210160752A CN 114679376 A CN114679376 A CN 114679376A
- Authority
- CN
- China
- Prior art keywords
- data center
- type data
- management service
- service module
- module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000011084 recovery Methods 0.000 title claims abstract description 50
- 238000000034 method Methods 0.000 title claims abstract description 27
- 238000004891 communication Methods 0.000 claims abstract description 64
- 238000012545 processing Methods 0.000 claims abstract description 21
- 230000002159 abnormal effect Effects 0.000 claims abstract description 6
- 238000001514 detection method Methods 0.000 claims description 15
- 230000004064 dysfunction Effects 0.000 claims description 9
- 230000005856 abnormality Effects 0.000 claims description 7
- 230000007257 malfunction Effects 0.000 claims 2
- 230000000977 initiatory effect Effects 0.000 claims 1
- 238000007726 management method Methods 0.000 description 125
- 238000010586 diagram Methods 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0654—Management of faults, events, alarms or notifications using network fault recovery
- H04L41/0663—Performing the actions predefined by failover planning, e.g. switching to standby network elements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L1/00—Arrangements for detecting or preventing errors in the information received
- H04L1/22—Arrangements for detecting or preventing errors in the information received using redundant apparatus to increase reliability
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0654—Management of faults, events, alarms or notifications using network fault recovery
- H04L41/0668—Management of faults, events, alarms or notifications using network fault recovery by dynamic selection of recovery network elements, e.g. replacement by the most appropriate element after failure
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/30—Decision processes by autonomous network management units using voting and bidding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/10—Active monitoring, e.g. heartbeat, ping or trace-route
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Cardiology (AREA)
- General Health & Medical Sciences (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明提供了一种多数据中心灾备方法:在第一类型数据中心、第二类型数据中心和第三类型数据中心中的任意两个数据中心建立互访链路;其中第一类型数据中心仅有一个,第二类型和第三类型数据中心的数目为至少一个;第一类型数据中心和第二类型数据中心设置有管理服务模块;各数据中心均设置有网关模块,各网关模块与第一类型数据中心的管理服务模块以及其所在数据中心的各基础信息设备具有通信连接关系;第三类型数据中心设置有决策装置,用于接收并保存所有数据中心互访信息,并与所有数据中心的网关模块保持心跳连接;当第三类型数据中心的决策装置检测到通讯或服务异常时,执行预设处理方案。本发明还提供实现上述方法的多数据中心灾备系统。
Description
技术领域
本发明涉及信息技术领域,尤其涉及一种多数据中心灾备方法和系统。
背景技术
近年来随着数据中心的规模逐年增长,数据中心运维人员面临着大规模、多样化、跨地域的基础设施资源管理及运维难题。基础设施管理平台的建设可实现多个数据中心基础设施资源的统一管理,然而在多数据中心灾备切换时,传统灾备切换模式多采用手工方式进行切换,对于管理海量基础设施的管理平台来说,存在切换效率低、通信质量无法评估、配置错误率高的问题。
发明内容
为确保基础设施管理平台业务连续性,需要提供一种多数据中心再被方案,来解决再被切换的效率和准确性问题。
为实现上述目的,发明人提供了一种多数据中心灾备方法,包括如下步骤:
在第一类型数据中心、第二类型数据中心和第三类型数据中心中的任意两个数据中心建立互访链路;其中第一类型数据中心有且仅有一个,第二类型和第三类型数据中心的数目为至少一个;第一类型数据中心和第二类型数据中心设置有管理服务模块;各数据中心均设置有网关模块,各网关模块与第一类型数据中心的管理服务模块具有通信连接关系、并与其所在数据中心的各基础信息设备具有通信连接关系;第三类型数据中心设置有决策装置,所述决策装置接收并保存所有数据中心互访信息,并与所有数据中心的网关模块保持心跳连接;
当第三类型数据中心的决策装置检测到通讯或服务异常时,执行预设处理方案。
进一步地,所述的多数据中心灾备方法中,步骤“当第三类型数据中心的决策装置检测到通讯或服务异常时,执行预设处理方案”包括:当第三类数据中心的决策装置检测到任意数据中心对第一类型数据中心的管理服务模块的访问故障时,判断该访问故障是由通信连接障碍引起或由第一类型数据中心的管理服务模块功能障碍引起,并根据判定结果执行预设处理方案。
进一步地,所述的多数据中心灾备方法中,步骤“根据判定结果执行预设处理方案”具体包括:当判定任意数据中心对第一类型数据中心的管理服务模块的访问故障由通信连接障碍引起时,借由其他数据中心与第一类型数据中心的管理服务模块的互访链路对第一类型数据中心的管理服务模块进行访问。
进一步地,所述的多数据中心灾备方法中,当第三类数据中心的决策装置判定任意数据中心对第一类型数据中心的管理服务模块的访问故障是由第一类型数据中心的管理服务模块功能障碍引起时,按预设方案启动第二类型数据中心与其他网关模块的连接关系并使其代执行原第一类型数据中心的管理服务模块职能。
进一步地,所述的多数据中心灾备方法中,步骤“按预设方案启动第二类型数据中心的管理服务模块功能使其代执行原第一类型数据中心的管理服务模块职能”具体包括:在仅有一个第二类型数据中心时,直接启动该第二类型数据中心的管理服务模块功能与其他网关模块的连接关系并使其代执行原第一类型数据中心的管理服务模块职能;当第二类型数据中心的数目大于或等于2个时,决策装置按预设选举方案发起新管理者选举,所述预设选举方案包括:通知各数据中心网关模块进行新管理者选举;接收各数据中心网关模块的选举结果信息;判断选举结果;根据选举结果启动当选的第二类型数据中心的管理服务模块与其他网关模块的连接关系并使其代执行原第一类型数据中心的管理服务模块职能。
进一步地,所述的多数据中心灾备方法中,所述预设选举方案还包括:各数据中心网关模块根据预设评分规则对其可连接的第二类型数据中心做出评分,以分数最高者为推荐者,将推荐者身份及其分数数据作为选举结果信息反馈至决策装置;
决策装置根据来自各数据中心网关模块的推荐者身份及其分数数据信息判定当选的第二类型数据中心,启动其管理服务模块与其他网关模块的连接关系并使其执行原第一类型数据中心的管理模块职能。
进一步地,所述的多数据中心灾备方法中,所述预设评分规则中的扣分情形包括:该第二类型数据中心的网关模块具有功能障碍、该第二类型数据中心的管理服务模块具有功能障碍;所述预设评分规则中的加分情形包括:该第二类型数据中心的管理服务模块功能完好并与参与评分的网关模块位于同一个数据中心、该第二类型数据中心的管理服务模块功能完好并于参与评分的网关模块所在数据中心的物理距离大于与其他数据中心的物理距离。
发明人同时还提出了一种多数据中心灾备系统,包括一个第一类型数据中心、至少一个第二类型数据中心和至少一个第三类型数据中心,任意两个数据中心之间具有互访链路;第一类型数据中心和第二类型数据中心设置有管理服务模块;各数据中心均设置有网关模块,所述网关模块与第一类型数据中心的管理服务模块具有通信连接关系、并与其所在数据中心的各基础信息设备具有通信连接关系;第三类型数据中心设置有决策装置,所述决策装置包括存储单元和通信单元,所述存储单元用于接收并保存所有数据中心互访信息,所述通信单元用于与所有数据中心的网关模块保持心跳连接;
第三类型数据中心的决策装置还包括检测单元和执行单元,所述检测单元用于检测通讯或服务异常,所述执行单元用于在检测单元检测到通讯或服务异常时执行预设处理方案。
进一步地,所述的多数据中心灾备系统中,所述决策装置还包括判断单元,所述判断单元用于在检测单元检测到任意数据中心对第一类型数据中心的管理服务模块的访问故障时,判断该访问故障是由通信连接障碍引起或由第一类型数据中心的管理服务模块功能障碍引起,然后执行单元根据判定结果执行预设处理方案。
进一步地,所述的多数据中心灾备系统中,所述执行单元根据判定结果执行预设处理方案具体包括:当判断单元判定任意数据中心对第一类型数据中心的管理服务模块的访问故障由通信连接障碍引起时,执行单元通知其借由其他数据中心与第一类型数据中心的管理服务模块的互访链路对第一类型数据中心的管理服务模块进行访问。
进一步地,所述的多数据中心灾备系统中,当判断单元判定任意数据中心对第一类型数据中心的管理服务模块的访问故障是由第一类型数据中心的管理服务模块功能障碍引起时,执行单元通知按预设方案启动第二类型数据中心与其他网关模块的连接关系并使其代执行原第一类型数据中心的管理服务模块职能。
进一步地,所述的多数据中心灾备系统中,所述“执行单元通知按预设方案启动第二类型数据中心与其他网关模块的连接关系并使其代执行原第一类型数据中心的管理服务模块职能”具体包括:在仅有一个第二类型数据中心时,执行单元直接通知启动该第二类型数据中心的管理服务模块功能与其他网关模块的连接关系并使其代执行原第一类型数据中心的管理服务模块职能;当第二类型数据中心的数目大于或等于2个时,决策装置按预设选举方案发起新管理者选举,所述预设选举方案包括:通信单元通知各数据中心网关模块按预设投票方案进行新管理者选举并接收各数据中心网关模块的选举结果信息;判断单元判定选举结果;执行单元根据选举结果通知启动当选的第二类型数据中心的管理服务模块与其他网关模块的连接关系并使其代执行原第一类型数据中心的管理服务模块职能。
进一步地,所述的多数据中心灾备系统中,所述预设选举方案还包括:各数据中心网关模块根据预设评分规则对其可连接的第二类型数据中心做出评分,以分数最高者为推荐者,将推荐者身份及其分数数据作为选举结果信息反馈至决策装置;
决策装置的判断单元根据来自各数据中心网关模块的推荐者身份及其分数数据信息判定当选的第二类型数据中心,执行单元通知启动其管理服务模块与其他网关模块的连接关系并使其执行原第一类型数据中心的管理模块职能。
进一步地,所述的多数据中心灾备系统中,所述预设评分规则中的扣分情形包括:该第二类型数据中心的网关模块具有功能障碍、该第二类型数据中心的管理服务模块具有功能障碍;所述预设评分规则中的加分情形包括:该第二类型数据中心的管理服务模块功能完好并与参与评分的网关模块位于同一个数据中心、该第二类型数据中心的管理服务模块功能完好并于参与评分的网关模块所在数据中心的物理距离大于与其他数据中心的物理距离。
区别于现有技术,上述技术方案具有如下优点:基于多数据中心环链路路由发现结合管理服务选举机制实现基础设施管理服务在多数据中心灾备自动切换,提高了切换效率、降低了配置错误率,满足大异地小同城数据中心规划设计的要求。
附图说明
图1为本发明第四实施例所述的多中心灾备方法的流程图;
图2为本发明一实施例所述的多中心灾备系统的结构图。
附图标记说明:
1-第一类型数据中心
2-第二类型数据中心甲
3-第二类型数据中心乙
4-第三类型数据中心
51-管理服务模块甲
52-管理服务模块乙
53-管理服务模块丙
61-网关模块甲
62-网关模块乙
63-网关模块丙
64-网关模块丁
7-决策装置
71-存储单元
72-通信单元
73-检测单元
74-执行单元
75-判断单元
具体实施方式
为详细说明技术方案的技术内容、构造特征、所实现目的及效果,以下结合具体实施例并配合附图详予说明。
第一实施例
本实施例提供一种多数据中心灾备方法,包括如下步骤:
S1、在第一类型数据中心、第二类型数据中心和第三类型数据中心中的任意两个数据中心建立互访链路,其中第一类型数据中心有且仅有一个;(本实施方式中,第二类型数据中心的数目为一个,第三类型数据中心的数目为一个;第一类型数据中心和第二类型数据中心均设置有管理服务模块;三个数据中心均设置有网关模块,各网关模块均与第一类型数据中心的管理服务模块具有通信连接关系、并与其所在数据中心的各基础信息设备具有通信连接关系;第三类型数据中心设置有决策装置,所述决策装置接收并保存所有数据中心互访信息,并与所有数据中心的网关模块保持心跳连接;)
S2、第三类型数据中心的决策装置检测到通讯或服务异常;
S3、决策装置判定其检测到的通讯或服务异常是由通信连接障碍引起;
S4、决策装置通知存在通信连接障碍的两个单位通过其他数据中心的线路进行信息转发。
第二实施例
本实施例提供一种多数据中心灾备方法,包括如下步骤:
S1、在第一类型数据中心、第二类型数据中心和第三类型数据中心中的任意两个数据中心建立互访链路,其中第一类型数据中心有且仅有一个;(本实施方式中,第二类型数据中心的数目为一个,第三类型数据中心的数目为一个;第一类型数据中心和第二类型数据中心均设置有管理服务模块;三个数据中心均设置有网关模块,各网关模块均与第一类型数据中心的管理服务模块具有通信连接关系、并与其所在数据中心的各基础信息设备具有通信连接关系;第三类型数据中心设置有决策装置,所述决策装置接收并保存所有数据中心互访信息,并与所有数据中心的网关模块保持心跳连接;)
S2、第三类型数据中心的决策装置检测到第三类型数据中心对第一类型数据中心的管理服务模块的信息接收异常;
S3、决策装置判定其检测到的异常是由第三类型数据中心与第一类型数据中心之间的通信链路故障引起;
S4、决策装置通知第三类型数据中心经由第二类型数据中心与第一类型数据中心的管理服务模块之间的通信线路进行信息转发。
第三实施例
本实施例提供一种多数据中心灾备方法,包括如下步骤:
S1、在第一类型数据中心、第二类型数据中心和第三类型数据中心中的任意两个数据中心建立互访链路,其中第一类型数据中心有且仅有一个;(本实施方式中,第二类型数据中心的数目为一个,第三类型数据中心的数目为一个;第一类型数据中心和第二类型数据中心均设置有管理服务模块;三个数据中心均设置有网关模块,各网关模块均与第一类型数据中心的管理服务模块具有通信连接关系、并与其所在数据中心的各基础信息设备具有通信连接关系;第三类型数据中心设置有决策装置,所述决策装置接收并保存所有数据中心互访信息,并与所有数据中心的网关模块保持心跳连接;)
S2、第三类型数据中心的决策装置检测到第三类型数据中心对第一类型数据中心的管理服务模块的信息接收异常;
S3、决策装置判定其检测到的异常是由第一类型数据中心的管理服务模块的功能障碍引起;
S4、决策装置通知启动第二类型数据中心的管理服务模块功能与其他网关模块的连接关系并使其代执行原第一类型数据中心的管理服务模块职能。
第四实施例
本实施例提供一种多数据中心灾备方法,包括如下步骤:
S1、在第一类型数据中心、第二类型数据中心和第三类型数据中心中的任意两个数据中心建立互访链路,其中第一类型数据中心有且仅有一个;(本实施方式中,第二类型数据中心的数目为二个,分别是第二类型数据中心甲和第二类型数据中心乙;第三类型数据中心的数目为一个;第一类型数据中心和第二类型数据中心均设置有管理服务模块;四个数据中心均设置有网关模块,各网关模块均与第一类型数据中心的管理服务模块具有通信连接关系、并与其所在数据中心的各基础信息设备具有通信连接关系;第三类型数据中心设置有决策装置,所述决策装置接收并保存所有数据中心互访信息,并与所有数据中心的网关模块保持心跳连接;)
S2、第三类型数据中心的决策装置检测到第三类型数据中心对第一类型数据中心的管理服务模块的信息接收异常;
S3、决策装置判定其检测到的异常是由第一类型数据中心的管理服务模块的功能障碍引起;
S4、决策装置根据预设选举方案进行新领导者选举,并获得选举结果;
S5、决策装置根据选举结果通知启动当选的第二类型数据中心的管理服务模块与其他网关模块的连接关系并使其代执行原第一类型数据中心的管理服务模块职能。
具体而言,本实施方式中的步骤S4具体还包括:
S41、决策装置通知各数据中心网关模块进行新管理者选举;
S42、各数据中心网关模块根据预设评分规则对其可连接的第二类型数据中心做出评分,并将结果反馈至决策装置;
S43、决策装置根据收到的信息判断选举结果。
更具体地,步骤S42还包括:各数据中心网关模块根据预设评分规则对其可连接的第二类型数据中心做出评分,以分数最高者为推荐者,将推荐者身份及其分数数据作为选举结果信息反馈至决策装置。本实施方式中,所述预设评分规则包括:对某个第二类型数据中心而言,扣分情形包括:对该第二类型数据中心的网关模块具有功能障碍、该第二类型数据中心的管理服务模块具有功能障碍;所述预设评分规则中的加分情形包括:该第二类型数据中心的管理服务模块功能完好并与参与评分的网关模块位于同一个数据中心、该第二类型数据中心的管理服务模块功能完好并于参与评分的网关模块所在数据中心的物理距离大于与其他数据中心的物理距离。在其他实施方式中,还可以根据具体的灾备要求设置其他能反映灾备需求的评分条件。
第五实施例
本实施例提供一种多数据中心灾备系统,包括一个第一类型数据中心、一个第二类型数据中心和一个第三类型数据中心,三个数据中心中的任意两个数据中心之间具有互访链路;第一类型数据中心和第二类型数据中心设置有管理服务模块;各数据中心均设置有网关模块,所述网关模块与第一类型数据中心的管理服务模块具有通信连接关系、并与其所在数据中心的各基础信息设备具有通信连接关系;第三类型数据中心设置有决策装置,所述决策装置包括存储单元和通信单元,所述存储单元用于接收并保存所有数据中心互访信息,所述通信单元用于与所有数据中心的网关模块保持心跳连接;
第三类型数据中心的决策装置还包括检测单元和执行单元,所述检测单元用于检测通讯或服务异常,所述执行单元用于在检测单元检测到通讯或服务异常时执行预设处理方案。
进一步地,所述决策装置还包括判断单元,所述判断单元用于在检测单元检测到任意数据中心对第一类型数据中心的管理服务模块的访问故障时,判断该访问故障是由通信连接障碍引起或由第一类型数据中心的管理服务模块功能障碍引起,然后执行单元根据判定结果执行预设处理方案。所述执行单元根据判定结果执行预设处理方案具体包括:当判断单元判定任意数据中心对第一类型数据中心的管理服务模块的访问故障由通信连接障碍引起时,执行单元通知其借由其他数据中心与第一类型数据中心的管理服务模块的互访链路对第一类型数据中心的管理服务模块进行访问。当判断单元判定任意数据中心对第一类型数据中心的管理服务模块的访问故障是由第一类型数据中心的管理服务模块功能障碍引起时,执行单元通知按预设方案启动第二类型数据中心与其他网关模块的连接关系并使其代执行原第一类型数据中心的管理服务模块职能。本实施方式中,因仅有一个第二类型数据中心时,故执行单元用于直接通知启动该第二类型数据中心的管理服务模块功能与其他网关模块的连接关系并使其代执行原第一类型数据中心的管理服务模块职能。
第六实施例
请参考图2,图2显示的是本实施例提供一种多数据中心灾备系统的结构示意图。本实施方式提供的多数据中心灾备系统包括一个第一类型数据中心1、二个第二类型数据中心(第二类型数据中心甲2、第二类型数据中心乙3)和一个第三类型数据中心4。四个数据中心中的任意两个数据中心之间具有互访链路;第一类型数据中心1、第二类型数据中心甲2和第二类型数据中心乙3均设置有管理服务模块(分别是设置在第一类型数据中心1中的管理服务模块甲51、设置在第二类型数据中心甲2中的管理服务模块乙52、设置在第二类型数据中心乙3中的管理服务模块丙53);此外,各数据中心均设置有网关模块(分别是设置在第一类型数据中心1中的网关模块甲61、设置在第二类型数据中心甲2中的网关模块乙62、设置在第二类型数据中心乙3中的网关模块丙63和设置在第三类型数据中心4中的网关模块丁64),上述四个网关模块均第一类型数据中心1中的管理服务模块甲51具有通信连接关系、并与其所在数据中心的各基础信息设备具有通信连接关系;此外,第三类型数据中心3还设置有决策装置7,所述决策装置7包括存储单元71和通信单元72,所述存储单元71用于接收并保存所有数据中心互访信息,所述通信单元72用于与所有数据中心的网关模块保持心跳连接;
进一步地,第三类型数据中心3的决策装置7还包括检测单元73和执行单元74,所述检测单元73用于检测通讯或服务异常,所述执行单元74用于在检测单元73检测到通讯或服务异常时执行预设处理方案。
进一步地,所述决策装置还包括判断单元75,所述判断单元75用于在检测单元73检测到任意数据中心对第一类型数据中心1的管理服务模块甲51的访问故障时,判断该访问故障是由通信连接障碍引起或由第一类型数据中心1的管理服务模块甲51功能障碍引起,然后执行单元74根据判定结果执行预设处理方案。所述执行单元74根据判定结果执行预设处理方案具体包括:当判断单元75判定任意数据中心对第一类型数据中心1的管理服务模块甲51的访问故障由通信连接障碍引起时,执行单元74通知其借由其他数据中心与第一类型数据中心1的管理服务模块甲51的互访链路对第一类型数据中心1的管理服务模块甲51进行访问。当判断单元75判定任意数据中心对第一类型数据中心1的管理服务模块甲51的访问故障是由第一类型数据中心1的管理服务模块甲51功能障碍引起时,执行单元74通知按预设方案启动某个第二类型数据中心与其他网关模块的连接关系并使其代执行原第一类型数据中心1的管理服务模块甲51所提供的管理服务职能。本实施方式与第五实施方式不同之处在于,本实施方式中的第二类型数据中心的数目大于或等于2个,因此决策装置7在需要从2个第二类型数据中心中选择一个来替代功能障碍的第一类型数据中心1管理服务模块甲51,这样一来决策装置7就需要按一个预设选举方案发起新管理者选举。本实施方式中,所述预设选举方案包括:通信单元72通知各数据中心网关模块按预设投票方案进行新管理者选举并接收各数据中心网关模块的选举结果信息;判断单元85判定选举结果;执行单元74根据选举结果通知启动当选的第二类型数据中心的管理服务模块与其他网关模块的连接关系并使其代执行原第一类型数据中心1的管理服务模块甲51所提供的管理服务职能。
更具体地,所述预设选举方案还包括:各数据中心网关模块根据预设评分规则对其可连接的第二类型数据中心做出评分,以分数最高者为推荐者,将推荐者身份及其分数数据作为选举结果信息反馈至决策装置7;决策装置7的判断单元75根据来自各数据中心网关模块的推荐者身份及其分数数据信息判定当选的第二类型数据中心,执行单元74通知启动其管理服务模块与其他网关模块的连接关系并使其代执行原第一类型数据中心1的管理服务模块甲51所提供的管理服务职能。
本实施方式中,所述预设评分规则包括:对某个第二类型数据中心而言,扣分情形包括:对该第二类型数据中心的网关模块具有功能障碍、该第二类型数据中心的管理服务模块具有功能障碍;所述预设评分规则中的加分情形包括:该第二类型数据中心的管理服务模块功能完好并与参与评分的网关模块位于同一个数据中心、该第二类型数据中心的管理服务模块功能完好并于参与评分的网关模块所在数据中心的物理距离大于与其他数据中心的物理距离。在其他实施方式中,还可以根据具体的灾备要求设置其他能反映灾备需求的评分条件。
此外,在本发明的各个实施例中,各网关模块均与其所在数据中心的各基础信息设备具有通信连接关系;此处的“基础信息设备”指网络服务器、网络设备、存储设备等等IT设备,网关模块可以作为管理服务模块与各数据中心的基础信息设备通信传输的桥梁,也可实现管理服务模块的指令下发和基础信息设备监控日志上传的转发功能。在图2中,为方便说明,各网关模块与其所在数据中心的基础信息设备的连接关系和基础信息设备在图中略去,但实际技术方案中是存在这些结构和连接关系的。
综上所述,本发明技术方案基于多数据中心环链路路由发现结合管理服务选举机制实现基础设施管理服务在多数据中心灾备自动切换,提高了切换效率、降低了配置错误率,满足大异地小同城数据中心规划设计的要求。
需要说明的是,尽管在本文中已经对上述各实施例进行了描述,但并非因此限制本发明的专利保护范围。因此,基于本发明的创新理念,对本文所述实施例进行的变更和修改,或利用本发明说明书及附图内容所作的等效结构或等效流程变换,直接或间接地将以上技术方案运用在其他相关的技术领域,均包括在本发明的专利保护范围之内。
Claims (14)
1.一种多数据中心灾备方法,其特征在于,包括如下步骤:
在第一类型数据中心、第二类型数据中心和第三类型数据中心中的任意两个数据中心建立互访链路;其中第一类型数据中心有且仅有一个,第二类型和第三类型数据中心的数目为至少一个;第一类型数据中心和第二类型数据中心设置有管理服务模块;各数据中心均设置有网关模块,各网关模块与第一类型数据中心的管理服务模块具有通信连接关系、并与其所在数据中心的各基础信息设备具有通信连接关系;第三类型数据中心设置有决策装置,所述决策装置接收并保存所有数据中心互访信息,并与所有数据中心的网关模块保持心跳连接;
当第三类型数据中心的决策装置检测到通讯或服务异常时,执行预设处理方案。
2.如权利要求1所述的多数据中心灾备方法,其特征在于,步骤“当第三类型数据中心的决策装置检测到通讯或服务异常时,执行预设处理方案”包括:当第三类数据中心的决策装置检测到任意数据中心对第一类型数据中心的管理服务模块的访问故障时,判断该访问故障是由通信连接障碍引起或由第一类型数据中心的管理服务模块功能障碍引起,并根据判定结果执行预设处理方案。
3.如权利要求2所述的多数据中心灾备方法,其特征在于,步骤“根据判定结果执行预设处理方案”具体包括:当判定任意数据中心对第一类型数据中心的管理服务模块的访问故障由通信连接障碍引起时,借由其他数据中心与第一类型数据中心的管理服务模块的互访链路对第一类型数据中心的管理服务模块进行访问。
4.如权利要求2所述的多数据中心灾备方法,其特征在于,当第三类数据中心的决策装置判定任意数据中心对第一类型数据中心的管理服务模块的访问故障是由第一类型数据中心的管理服务模块功能障碍引起时,按预设方案启动第二类型数据中心与其他网关模块的连接关系并使其代执行原第一类型数据中心的管理服务模块职能。
5.如权利要求4所述的多数据中心灾备方法,其特征在于,步骤“按预设方案启动第二类型数据中心的管理服务模块功能使其代执行原第一类型数据中心的管理服务模块职能”具体包括:在仅有一个第二类型数据中心时,直接启动该第二类型数据中心的管理服务模块功能与其他网关模块的连接关系并使其代执行原第一类型数据中心的管理服务模块职能;当第二类型数据中心的数目大于或等于2个时,决策装置按预设选举方案发起新管理者选举,所述预设选举方案包括:通知各数据中心网关模块进行新管理者选举;接收各数据中心网关模块的选举结果信息;判断选举结果;根据选举结果启动当选的第二类型数据中心的管理服务模块与其他网关模块的连接关系并使其代执行原第一类型数据中心的管理服务模块职能。
6.如权利要求5所述的多数据中心灾备方法,其特征在于,所述预设选举方案还包括:各数据中心网关模块根据预设评分规则对其可连接的第二类型数据中心做出评分,以分数最高者为推荐者,将推荐者身份及其分数数据作为选举结果信息反馈至决策装置;
决策装置根据来自各数据中心网关模块的推荐者身份及其分数数据信息判定当选的第二类型数据中心,启动其管理服务模块与其他网关模块的连接关系并使其执行原第一类型数据中心的管理模块职能。
7.如权利要求6所述的多数据中心灾备方法,其特征在于,所述预设评分规则中的扣分情形包括:该第二类型数据中心的网关模块具有功能障碍、该第二类型数据中心的管理服务模块具有功能障碍;所述预设评分规则中的加分情形包括:该第二类型数据中心的管理服务模块功能完好并与参与评分的网关模块位于同一个数据中心、该第二类型数据中心的管理服务模块功能完好并于参与评分的网关模块所在数据中心的物理距离大于与其他数据中心的物理距离。
8.一种多数据中心灾备系统,其特征在于,包括一个第一类型数据中心、至少一个第二类型数据中心和至少一个第三类型数据中心,任意两个数据中心之间具有互访链路;第一类型数据中心和第二类型数据中心设置有管理服务模块;各数据中心均设置有网关模块,所述网关模块与第一类型数据中心的管理服务模块具有通信连接关系、并与其所在数据中心的各基础信息设备具有通信连接关系;第三类型数据中心设置有决策装置,所述决策装置包括存储单元和通信单元,所述存储单元用于接收并保存所有数据中心互访信息,所述通信单元用于与所有数据中心的网关模块保持心跳连接;
第三类型数据中心的决策装置还包括检测单元和执行单元,所述检测单元用于检测通讯或服务异常,所述执行单元用于在检测单元检测到通讯或服务异常时执行预设处理方案。
9.如权利要求8所述的多数据中心灾备系统,其特征在于,所述决策装置还包括判断单元,所述判断单元用于在检测单元检测到任意数据中心对第一类型数据中心的管理服务模块的访问故障时,判断该访问故障是由通信连接障碍引起或由第一类型数据中心的管理服务模块功能障碍引起,然后执行单元根据判定结果执行预设处理方案。
10.如权利要求9所述的多数据中心灾备系统,其特征在于,所述执行单元根据判定结果执行预设处理方案具体包括:当判断单元判定任意数据中心对第一类型数据中心的管理服务模块的访问故障由通信连接障碍引起时,执行单元通知其借由其他数据中心与第一类型数据中心的管理服务模块的互访链路对第一类型数据中心的管理服务模块进行访问。
11.如权利要求9所述的多数据中心灾备方法,其特征在于,当判断单元判定任意数据中心对第一类型数据中心的管理服务模块的访问故障是由第一类型数据中心的管理服务模块功能障碍引起时,执行单元通知按预设方案启动第二类型数据中心与其他网关模块的连接关系并使其代执行原第一类型数据中心的管理服务模块职能。
12.如权利要求11所述的多数据中心灾备系统,其特征在于,所述“执行单元通知按预设方案启动第二类型数据中心与其他网关模块的连接关系并使其代执行原第一类型数据中心的管理服务模块职能”具体包括:在仅有一个第二类型数据中心时,执行单元直接通知启动该第二类型数据中心的管理服务模块功能与其他网关模块的连接关系并使其代执行原第一类型数据中心的管理服务模块职能;当第二类型数据中心的数目大于或等于2个时,决策装置按预设选举方案发起新管理者选举,所述预设选举方案包括:通信单元通知各数据中心网关模块按预设投票方案进行新管理者选举并接收各数据中心网关模块的选举结果信息;判断单元判定选举结果;执行单元根据选举结果通知启动当选的第二类型数据中心的管理服务模块与其他网关模块的连接关系并使其代执行原第一类型数据中心的管理服务模块职能。
13.如权利要求12所述的多数据中心灾备系统,其特征在于,所述预设选举方案还包括:各数据中心网关模块根据预设评分规则对其可连接的第二类型数据中心做出评分,以分数最高者为推荐者,将推荐者身份及其分数数据作为选举结果信息反馈至决策装置;
决策装置的判断单元根据来自各数据中心网关模块的推荐者身份及其分数数据信息判定当选的第二类型数据中心,执行单元通知启动其管理服务模块与其他网关模块的连接关系并使其执行原第一类型数据中心的管理模块职能。
14.如权利要求13所述的多数据中心灾备方法,其特征在于,所述预设评分规则中的扣分情形包括:该第二类型数据中心的网关模块具有功能障碍、该第二类型数据中心的管理服务模块具有功能障碍;所述预设评分规则中的加分情形包括:该第二类型数据中心的管理服务模块功能完好并与参与评分的网关模块位于同一个数据中心、该第二类型数据中心的管理服务模块功能完好并于参与评分的网关模块所在数据中心的物理距离大于与其他数据中心的物理距离。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210160752.9A CN114679376A (zh) | 2022-02-22 | 2022-02-22 | 一种多数据中心灾备方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210160752.9A CN114679376A (zh) | 2022-02-22 | 2022-02-22 | 一种多数据中心灾备方法和系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114679376A true CN114679376A (zh) | 2022-06-28 |
Family
ID=82073130
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210160752.9A Pending CN114679376A (zh) | 2022-02-22 | 2022-02-22 | 一种多数据中心灾备方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114679376A (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020165944A1 (en) * | 2001-05-07 | 2002-11-07 | Wisner Steven P. | System and method for providing network services using redundant resources |
CN103473112A (zh) * | 2013-09-03 | 2013-12-25 | 北京邮电大学 | 一种基于两地三中心的灾备信息系统仿真方法 |
CN110086660A (zh) * | 2019-04-15 | 2019-08-02 | 中国银联股份有限公司 | 一种数据处理方法及装置 |
CN110635950A (zh) * | 2019-09-30 | 2019-12-31 | 深圳供电局有限公司 | 一种双数据中心容灾系统 |
CN111464332A (zh) * | 2020-03-06 | 2020-07-28 | 中国人民财产保险股份有限公司 | 容灾方法、装置及设备 |
CN112272107A (zh) * | 2020-09-29 | 2021-01-26 | 南京信同诚信息技术有限公司 | 一种基于云计算的数据中心容灾系统 |
-
2022
- 2022-02-22 CN CN202210160752.9A patent/CN114679376A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020165944A1 (en) * | 2001-05-07 | 2002-11-07 | Wisner Steven P. | System and method for providing network services using redundant resources |
CN103473112A (zh) * | 2013-09-03 | 2013-12-25 | 北京邮电大学 | 一种基于两地三中心的灾备信息系统仿真方法 |
CN110086660A (zh) * | 2019-04-15 | 2019-08-02 | 中国银联股份有限公司 | 一种数据处理方法及装置 |
CN110635950A (zh) * | 2019-09-30 | 2019-12-31 | 深圳供电局有限公司 | 一种双数据中心容灾系统 |
CN111464332A (zh) * | 2020-03-06 | 2020-07-28 | 中国人民财产保险股份有限公司 | 容灾方法、装置及设备 |
CN112272107A (zh) * | 2020-09-29 | 2021-01-26 | 南京信同诚信息技术有限公司 | 一种基于云计算的数据中心容灾系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10498588B2 (en) | Systems and methods for managing network health | |
CN113014634B (zh) | 集群选举处理方法、装置、设备及存储介质 | |
CN101345663B (zh) | 心跳检测方法和心跳检测设备 | |
US7233568B2 (en) | System and method for selection of redundant control path links in a multi-shelf network element | |
US7389341B2 (en) | Remotely monitoring a data processing system via a communications network | |
CN100407646C (zh) | 一种实现数据业务备份的方法 | |
US7082554B2 (en) | System and method for providing error analysis and correlation in a network element | |
CN108306747B (zh) | 一种云安全检测方法、装置和电子设备 | |
CN104079454A (zh) | 一种设备异常检测方法和设备 | |
CN102026042A (zh) | 一种高级电信计算架构控制面的保活、自愈方法和装置 | |
CN109995554A (zh) | 多级数据中心主备切换的控制方法及云调度指挥器 | |
CN114679376A (zh) | 一种多数据中心灾备方法和系统 | |
CN104199866B (zh) | 一种报盘机异常处理方法及装置 | |
JP4879823B2 (ja) | 監視制御システム | |
CN116340058A (zh) | 主备切换方法及装置 | |
CN101958925A (zh) | 一种控制远程设备的方法以及装置 | |
CN115833927A (zh) | 一种纤芯的切换方法、装置、电子设备和存储介质 | |
CN107359938B (zh) | 数据中心传输系统、系统中控制的实现方法和装置 | |
US10432451B2 (en) | Systems and methods for managing network health | |
CN106789139A (zh) | 一种多点故障处理方法及装置 | |
JP4437416B2 (ja) | ネットワーク保守システム | |
CN100490343C (zh) | 一种通讯设备中主备用单元倒换的实现方法和装置 | |
KR100950555B1 (ko) | 스위치 보드 변경 방법 | |
CN116723111B (zh) | 业务请求的处理方法、系统及电子设备 | |
US9792238B2 (en) | Method and apparatus for configuring a cluster system, and system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |