CN103312541A - 一种高可用互备集群的管理方法 - Google Patents

一种高可用互备集群的管理方法 Download PDF

Info

Publication number
CN103312541A
CN103312541A CN2013102031847A CN201310203184A CN103312541A CN 103312541 A CN103312541 A CN 103312541A CN 2013102031847 A CN2013102031847 A CN 2013102031847A CN 201310203184 A CN201310203184 A CN 201310203184A CN 103312541 A CN103312541 A CN 103312541A
Authority
CN
China
Prior art keywords
cluster
backup
service
main
management method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2013102031847A
Other languages
English (en)
Inventor
王婷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Electronic Information Industry Co Ltd
Original Assignee
Inspur Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Electronic Information Industry Co Ltd filed Critical Inspur Electronic Information Industry Co Ltd
Priority to CN2013102031847A priority Critical patent/CN103312541A/zh
Publication of CN103312541A publication Critical patent/CN103312541A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Hardware Redundancy (AREA)

Abstract

本发明涉及一种高可用集群的管理方法,特别涉及一种高可用互备集群的管理方法。其在单个集群中,通过集群内部的节点互备,保证业务的不中断;当集群整体失效时,能有备份集群来实现现有的业务服务,从而保证业务的不间断提供。

Description

一种高可用互备集群的管理方法
技术领域
本发明涉及一种高可用集群的管理方法,特别涉及一种高可用互备集群的管理方法。
背景技术
高可用集群系统是指能够保证业务24小时不中断,在系统发生问题或者应用软件发生问题时,能够快速恢复业务,从而保证业务的不中断的集群系统。
由于业务复杂性的增加以及类型的增多,现在已存在类似于Oracle RAC这样的软件,他们本身就是一个集群软件,这样为了管理这些复杂的应用,就有必要发明一种能够适应于类似业务的高可用集群软件。他们不但能够管理单集群,使集群内的节点进行互备;同时管理多个集群,使集群之间进行互备。
发明内容
为了解决现有技术的问题,本发明提供了一种高可用互备集群的管理方法,其不但能实现主集群内部节点的互备,从而对外提供不间断的服务,也能实现集群间的互备,保证整个互备集群的业务不中断。
本发明所采用的技术方案如下:
一种高可用互备集群的管理方法,是首先对主集群内节点监测,当节点或者节点上的业务组异常时,进行主集群内部业务组的转接;当主集群内所有节点异常,不能提供正常业务服务时,通知启动备份集群。
运行着业务的主集群需要配置一个能够通知到备份集群启动的特定IP地址,当发现主集群业务异常时能够通过该IP通知备份集群启动集群业务。
备份集群需要设置一个远端IP监视,该IP监视运行集群上的一个特定的IP地址,当发现该IP地址不在时,触发备份集群启动集群业务。
主集群内节点之间通过心跳机制以及业务通知机制实现通知。
主集群和备份集群之间通过socket通知机制实现通知。
本发明的一种高可用互备集群的管理方法,主集群内节点之间通过心跳通信机制以及业务通知机制,实现集群内,最大限度的实现集群对外提供不间断的服务;当主集群内不能提供服务时,互备集群间通过socket通知机制启动备份集群或者备份集群间通过特定IP监视的方法检测启动备份集群。该方法主要涉及到互备集群的配置;IP监视资源监视对端集群管理IP地址,当对端集群IP地址失效时,此时备份集群会启动本集群的备份业务;当本集群的业务完全异常时,集群中的管理节点会通过socket通信通知备份集群启动备份业务。
本发明不仅保证了集群内最大限度的提供业务服务,同时在整个集群出现故障时,启动备份集群提供高可用服务,这样提高了高可用服务的稳定性,同时提高了高可用软件的适用性,使软件能对特定的集群服务进行管理,提高软件的使用价值。
附图说明
图1为本发明中主集群发现异常通知备份集群启动集群业务组的流程示意图;
图2为本发明中备份集群监听运行集群异常时启动集群业务组的流程示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
为了能够对集群进行备份,首先要按照一定的方法进行配置,配置主要包括如下几项
1:运行着业务的主集群需要配置一个能够通知到备份集群启动的特定IP地址,当发现主集群业务异常时能够通过该IP通知备份集群启动集群业务;
2、备份集群需要设置一个远端IP监视,该IP监视正在运行的主集群上的一个特定的IP地址,当发现该IP地址不在时,触发备份集群启动集群业务;
3、启动高可用集群服务时,高可用集群会启动集群业务组,备份高可用集群服务会启动一个远端IP监视组。
根据上述要求配置好集群后方可实施集群之间的监控备份。
实施例1
实施例1是运行着集群业务组的主集群发现异常通知备份集群启动的流程示意图,下面对各个步骤进行详细描述。
步骤1:启动集群业务组的主集群,不断的全方位的监控集群内业务组的状态; 
步骤2:当主集群内节点或节点上的组异常时,进行主集群内部的快速业务转接。
步骤3:主集群发现集群内所有节点上集群业务组都异常,主集群的管理节点连接用户设置的特定IP地址,发送业务组异常的消息给备份集群。
步骤4:主集群发送消息后,触发主集群启动远端IP监控组,开始监控备份集群的状态;
步骤5:备份集群收到了消息后,首先关闭远端IP监控组,然后启动集群业务组,这样避免了远端IP监控触发第二次启动集群业务组; 
步骤6:备份集群启动之后,不断的全方位的监控集群业务组,如果出现异常,同样执行上述步骤。
实施例2
图2是备份集群检测到运行集群异常后工作流程示意图,下面对该流程各个步骤进行详细描述。
步骤1:备份集群不断的监控运行着集群业务组的集群中的特定IP地址。
步骤2:运行集群因为某种故障例如所有机器断电宕机,不能对外提供业务。
步骤3:备用集群检测到集群的异常,停止远端IP监听组。
步骤4:启动集群业务组,并不断监控组的状态。
至此,已经完整实现了高可用互备集群的管理方法,该方法增加了传统高可用集群服务对集群业务管理的功能。该方法不仅保证了集群内最大限度的提供业务服务,同时在整个集群出现故障时,启动备份集群提供高可用服务,这样提高了高可用服务的稳定性,同时提高了高可用软件的适用性,使软件能对特定的集群服务进行管理,提高软件的使用价值。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (5)

1.一种高可用互备集群的管理方法,是首先对主集群内节点监测,当节点或者节点上的业务组异常时,进行主集群内部业务组的转接;当主集群内所有节点异常,不能提供正常业务服务时,通知启动备份集群。
2.根据权利要求1所述的一种高可用互备集群的管理方法,其特征在于,运行着业务的主集群需要配置一个能够通知到备份集群启动的特定IP地址,当发现主集群业务异常时能够通过该IP通知备份集群启动集群业务。
3.根据权利要求1所述的一种高可用互备集群的管理方法,其特征在于,备份集群需要设置一个远端IP监视,该IP监视运行集群上的一个特定的IP地址,当发现该IP地址不在时,触发备份集群启动集群业务。
4.根据权利要求1所述的一种高可用互备集群的管理方法,其特征在于,主集群内节点之间通过心跳机制以及业务通知机制实现通知。
5.根据权利要求1所述的一种高可用互备集群的管理方法,其特征在于,主集群和备份集群之间通过socket通知机制实现通知。
CN2013102031847A 2013-05-28 2013-05-28 一种高可用互备集群的管理方法 Pending CN103312541A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2013102031847A CN103312541A (zh) 2013-05-28 2013-05-28 一种高可用互备集群的管理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2013102031847A CN103312541A (zh) 2013-05-28 2013-05-28 一种高可用互备集群的管理方法

Publications (1)

Publication Number Publication Date
CN103312541A true CN103312541A (zh) 2013-09-18

Family

ID=49137344

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2013102031847A Pending CN103312541A (zh) 2013-05-28 2013-05-28 一种高可用互备集群的管理方法

Country Status (1)

Country Link
CN (1) CN103312541A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103986771A (zh) * 2014-05-22 2014-08-13 浪潮电子信息产业股份有限公司 一种不依赖于共享存储的高可用集群管理方法
CN106911524A (zh) * 2017-04-27 2017-06-30 紫光华山信息技术有限公司 一种ha实现方法及装置
CN107769943A (zh) * 2016-08-17 2018-03-06 阿里巴巴集团控股有限公司 一种主备集群切换的方法和设备
WO2019095577A1 (zh) * 2017-11-14 2019-05-23 平安科技(深圳)有限公司 数据请求处理方法、装置、计算机设备和存储介质
CN111614484A (zh) * 2020-04-13 2020-09-01 网宿科技股份有限公司 一种节点流量的调入、恢复方法、系统及中心服务器
CN113190364A (zh) * 2021-04-30 2021-07-30 平安壹钱包电子商务有限公司 远程调用管理方法、装置、计算机设备及可读存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1512375A (zh) * 2002-12-31 2004-07-14 联想(北京)有限公司 利用机群节点相互备份的容错方法
CN101026496A (zh) * 2007-01-26 2007-08-29 华为技术有限公司 一种容灾系统、方法和网络设备
CN101179432A (zh) * 2007-12-13 2008-05-14 浪潮电子信息产业股份有限公司 一种多机环境中实现系统高可用的方法
US20080250267A1 (en) * 2007-04-04 2008-10-09 Brown David E Method and system for coordinated multiple cluster failover
US20110082832A1 (en) * 2009-10-05 2011-04-07 Ramkumar Vadali Parallelized backup and restore process and system

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1512375A (zh) * 2002-12-31 2004-07-14 联想(北京)有限公司 利用机群节点相互备份的容错方法
CN101026496A (zh) * 2007-01-26 2007-08-29 华为技术有限公司 一种容灾系统、方法和网络设备
US20080250267A1 (en) * 2007-04-04 2008-10-09 Brown David E Method and system for coordinated multiple cluster failover
CN101179432A (zh) * 2007-12-13 2008-05-14 浪潮电子信息产业股份有限公司 一种多机环境中实现系统高可用的方法
US20110082832A1 (en) * 2009-10-05 2011-04-07 Ramkumar Vadali Parallelized backup and restore process and system

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103986771A (zh) * 2014-05-22 2014-08-13 浪潮电子信息产业股份有限公司 一种不依赖于共享存储的高可用集群管理方法
CN107769943A (zh) * 2016-08-17 2018-03-06 阿里巴巴集团控股有限公司 一种主备集群切换的方法和设备
CN107769943B (zh) * 2016-08-17 2021-01-08 阿里巴巴集团控股有限公司 一种主备集群切换的方法和设备
CN106911524A (zh) * 2017-04-27 2017-06-30 紫光华山信息技术有限公司 一种ha实现方法及装置
CN106911524B (zh) * 2017-04-27 2020-07-07 新华三信息技术有限公司 一种ha实现方法及装置
WO2019095577A1 (zh) * 2017-11-14 2019-05-23 平安科技(深圳)有限公司 数据请求处理方法、装置、计算机设备和存储介质
CN111614484A (zh) * 2020-04-13 2020-09-01 网宿科技股份有限公司 一种节点流量的调入、恢复方法、系统及中心服务器
CN113190364A (zh) * 2021-04-30 2021-07-30 平安壹钱包电子商务有限公司 远程调用管理方法、装置、计算机设备及可读存储介质

Similar Documents

Publication Publication Date Title
CN103312541A (zh) 一种高可用互备集群的管理方法
CN101640688B (zh) 基于cdn的节点主备用控制器切换方法及cdn网络
CN104506357B (zh) 一种高可用集群节点管理方法
CN106656589B (zh) 一种服务器双机热备份系统
CN103036719A (zh) 一种基于主备集群服务器的跨地区服务容灾方法及装置
CN103744809A (zh) 基于vrrp的车辆信息管理系统双机热备方法
CN104408071A (zh) 一种基于集群管理器的分布式数据库高可用方法及系统
CN101594383B (zh) 一种双控制器存储系统的服务和控制器状态监控方法
CN106464516B (zh) 网络管理系统中的事件处理
CN105790825B (zh) 一种分布式保护中控制器热备份的方法和装置
CN105915426B (zh) 环形网络的故障恢复方法及装置
WO2007048319A1 (fr) Systeme et procede de recuperation sur sinistre de dispositif de commande de service dans un reseau intelligent
CN103227725A (zh) 一种防火墙双机备份的方法及装置
US10037253B2 (en) Fault handling methods in a home service system, and associated household appliances and servers
CN104317803A (zh) 数据库集群的数据存取结构和方法
CN104580502A (zh) 一种实现负载均衡双机热备的方法
CN108737566B (zh) 一种分布式的实时消息过滤系统
CN103150241A (zh) 多服务器状态监控管理系统和方法
CN112416969A (zh) 分布式数据库中的并行任务调度系统
CN103441987A (zh) 双机防火墙系统的管理方法和装置
CN102932118B (zh) 一种双机主备裁决的方法及系统
CN109347755A (zh) 一种用于堆叠设备的备份方法及系统
CN107071189B (zh) 一种通讯设备物理接口的连接方法
CN103152420B (zh) 一种避免Ovirt虚拟管理平台单点失效的方法
CN103813369A (zh) 一种分布式的电信交换设备备份方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20130918

WD01 Invention patent application deemed withdrawn after publication