CN103118121B - 一种高可用集群在虚拟化技术中的应用方法 - Google Patents

一种高可用集群在虚拟化技术中的应用方法 Download PDF

Info

Publication number
CN103118121B
CN103118121B CN201310053326.6A CN201310053326A CN103118121B CN 103118121 B CN103118121 B CN 103118121B CN 201310053326 A CN201310053326 A CN 201310053326A CN 103118121 B CN103118121 B CN 103118121B
Authority
CN
China
Prior art keywords
group
service
mutual exclusion
node
cluster
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310053326.6A
Other languages
English (en)
Other versions
CN103118121A (zh
Inventor
王婷
殷雷
王佳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Electronic Information Industry Co Ltd
Original Assignee
Inspur Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Electronic Information Industry Co Ltd filed Critical Inspur Electronic Information Industry Co Ltd
Priority to CN201310053326.6A priority Critical patent/CN103118121B/zh
Publication of CN103118121A publication Critical patent/CN103118121A/zh
Application granted granted Critical
Publication of CN103118121B publication Critical patent/CN103118121B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Hardware Redundancy (AREA)

Abstract

本发明提供一种高可用集群在虚拟化技术中的应用方法,虚拟化中的业务资源包括:服务器资源,即虚拟化中真实运行的服务器;并行组业务资源,即运行在服务器上的特殊服务或应用程序;互斥服务组业务资源,只能在一台服务器上运行对外提供服务,并且该服务组依赖于并行服务组,只有在并行服务组运行起来之后互斥组才能正常运行;脚本组业务资源,一种动作组,互斥服务组操作和异常处理执行的脚本。该一种高可用集群在虚拟化技术中的应用方法和现有技术相比,合理的规划虚拟化技术中的业务组,然后把这些业务组进行统一的集群管理,对不同的业务组按照需求进行特殊性处理,对不同的异常执行指定的特殊性处理。

Description

一种高可用集群在虚拟化技术中的应用方法
技术领域
本发明涉及虚拟化技术领域,具体的说是一种通过高可用集群系统,可以提高虚拟化技术的高可用性,对外提供更可靠的不间断的服务的高可用集群应用方法。
背景技术
高可用集群系统是指通过对各种业务资源进行统一管理,在系统发生问题或者业务资源发生问题时,能够快速响应并执行相关的处理,能够快速恢复业务,从而保证业务7*24小时不中断提供。
在虚拟化技术中,为了能够保证服务的正常,需要依赖多种服务、多个服务器、多个磁盘形成的存储池等基础的软硬件设备,并且当发现异常时,需要执行特定的处理方法来抵抗异常。为了减少人工的干预,虚拟化系统需要自动监测依赖软硬件的异常,当发生异常时能够自动执行异常抵抗处理。因此。把高可用集群系统引入到虚拟化项目中成为了一种趋势,通过高可用集群系统,可以自动监测这些异常并且自动执行异常操作,来维护虚拟化系统的稳定性。
综合以上,高可用集群系统如何管理虚拟化技术中的软硬件设备成为了重点和难点。
发明内容
本发明的技术任务是解决现有技术的不足,提供一种高可用集群在虚拟化技术中的应用方法。
本发明的技术方案是按以下方式实现的,该一种高可用集群在虚拟化技术中的应用方法,其中虚拟化中的业务资源包括:
服务器资源,即虚拟化中真实运行的服务器;
并行组业务资源,即运行在服务器上的特殊服务或应用程序;
互斥服务组业务资源,只能在一台服务器上运行对外提供服务,并且该服务组依赖于并行服务组,只有在并行服务组运行起来之后互斥组才能正常运行;
脚本组业务资源,一种动作组,互斥服务组操作和异常处理执行的脚本;
其中各业务组的统一管理过程为:
步骤1、在虚拟化中,高可用集群按照设置决策出一个管理节点;
步骤2、集群管理节点组织所有的节点执行启动集群服务的操作,通过这些相关操作,高可用集群系统对外提供集群服务,这里的所有节点包括管理节点本身;
步骤3、集群管理节点通知所有的节点启动并行服务组;
步骤4、集群管理节点得到所有节点启动并行服务组状态,并且把这些状态同步给所有的节点,所有的节点维护一份状态;
步骤5、集群管理根据配置文件和节点的优先级发送指定的服务器启动指定的互斥业务组;
步骤6、各节点启动管理节点指定的互斥业务组,并且根据互斥组的需求启动指定的脚本业务组资源,执行完成后返回结果给管理节点;
步骤7、集群管理节点收到启动各个互斥组的启动结果,设置该组的状态,并且把状态同步到所有的节点上,这样,集群中的所有节点保持着同样的状态,完成统一管理。
所述虚拟化中的高可用集群系统在统一管理过程中会发现异常,所述的异常包括互斥服务组异常、并行服务组异常以及服务器本身的异常三种。
所述互斥服务组异常发生时,需要把该异常的互斥组首先在原异常运行的服务器上停止,然后迁移到能够正常运行该组的服务器上,保证业务能都对外提供。
所述并行服务组异常发生时,首先把依赖它的上层业务组在并行组异常的节点上停止,然后迁移到正常运行着并行服务组的节点上去。
所述服务器异常发生时,运行在该服务器上的所有互斥组都需要迁移,同时异常节点本身需要把运行在自身上的互斥服务进行停止。
本发明与现有技术相比所产生的有益效果是:
本发明的一种高可用集群在虚拟化技术中的应用方法合理的规划虚拟化技术中的业务组,然后把这些业务组进行统一的集群管理,对不同的业务组按照需求进行特殊性处理,对不同的异常执行指定的特殊性处理;不但能够自动快速的检测到虚拟化中相关的异常,同时可以快速自动的响应异常处理,保证业务的连续性,实现了软硬件的高可用性,保证了虚拟化对外提供不间断的透明的服务。
附图说明
附图1是本发明的虚拟化中业务资源组的规划框图。
附图2是本发明的业务统一管理过程流程图。
附图3是互斥组异常处理流程图。
附图4是并行组异常处理流程图。
附图5是服务器异常处理流程图。
具体实施方式
下面结合附图对本发明的一种高可用集群在虚拟化技术中的应用方法作以下详细说明。
本发明所要解决的技术问题包括如下几项:
1、如何合理的规划虚拟化技术中的业务组,通过规划把虚拟化技术中的关键软硬件成为指定的业务组,从而高可用集群可以进行管理;
2、按照业务的性质,高可用集群如何对这些业务组进行统一管理;
3、按照业务的要求,对不同的业务组按照需求进行特殊处理;
4、对不同的异常执行指定的特殊性处理。
基于上述几点,如附图1、图2所示,现提供一种高可用集群在虚拟化技术中的应用方法,其中虚拟化中的业务资源包括:
服务器资源,即虚拟化中真实运行的服务器。
并行组业务资源,运行在服务器上的特殊的服务或者应用程序,这些资源作为基础支持着虚拟化的业务,例如target服务、stmf服务等。该组需要在所有的服务器上同时运行起来,然后同时服务。
互斥服务组业务资源,只能在一台服务器上运行对外提供服务,并且该服务组依赖于并行服务组,只有在并行服务组运行起来之后互斥组才能正常运行。
脚本组业务资源,一种动作组,互斥服务组操作和异常处理执行的脚本,在执行互斥服务组的动作时需要执行脚本组。脚本服务组的状态不记录在集群的监控范围之内。
其中各业务组的统一管理过程为:
步骤1、在虚拟化中,高可用集群按照设置决策出一个管理节点;
步骤2、集群管理节点组织所有的节点执行启动集群服务的操作,通过这些相关操作,高可用集群系统对外提供集群服务,这里的所有节点包括管理节点本身;
步骤3、集群管理节点通知所有的节点启动并行服务组;
步骤4、集群管理节点得到所有节点启动并行服务组状态,并且把这些状态同步给所有的节点,所有的节点维护一份状态;
步骤5、集群管理根据配置文件和节点的优先级发送指定的服务器启动指定的互斥业务组;
步骤6、各节点启动管理节点指定的互斥业务组,并且根据互斥组的需求启动指定的脚本业务组资源,执行完成后返回结果给管理节点;
步骤7、集群管理节点收到启动各个互斥组的启动结果,设置该组的状态,并且把状态同步到所有的节点上,这样,集群中的所有节点保持着同样的状态,完成统一管理。
只有集群管理节点本身能够对这些服务进行各种操作管理。
所述虚拟化中的高可用集群系统在统一管理过程中会发现异常,所述的异常包括互斥服务组异常、并行服务组异常以及服务器本身的异常三种。
如附图3所示,所述互斥服务组异常发生时,需要把该异常的互斥组首先在原异常运行的服务器上停止,然后迁移到能够正常运行该组的服务器上,保证业务能都对外提供。
其具体处理过程为:
1)节点发现互斥组异常后,发送异常给集群管理节点。
2)集群管理节点发送停止该互斥组的命令给该异常节点。
3)互斥组异常节点把该组中的所有资源停止服务,并执行指定的脚本。
4)集群管理节点发送启动该组命令给正常的节点上。
5)能启动的节点启动该组中的所有资源,并启动指定脚本。
6)返回启动组的操作结果给集群管理节点。
7)集群管理节点设置该组的状态,同步组状态到所有节点上,完成互斥组异常处理。
如附图4所示,所述并行服务组异常发生时,首先把依赖它的上层业务组在并行组异常的节点上停止,然后迁移到正常运行着并行服务组的节点上去。
其具体处理过程为:
1)并行组异常节点发现异常后,发送异常给集群管理节点。
2)集群管理节点查找所有依赖于并行组并运行在异常节点上的互斥组,并发送命令给异常节点依次停止异常节点上的互斥组。
3)异常节点依次停止依赖于异常并行组的互斥组。
4)集群管理节点依次发送启动命令给正常节点。
5)并行组正常节点依次启动这些互斥组,并返回操作结果给集群管理节点。
6)集群管理节点设置各个组的状态,并同步组状态到各个节点,完成并行组异常切换。
如附图5所示,所述服务器异常发生时,运行在该服务器上的所有互斥组都需要迁移,其具体迁移过程为:
1)集群管理节点发现异常节点异常,根据保存的互斥组状态,查找异常互斥组。
2)集群管理节点发送命令给正常节点依次启动异常互斥组。
3)正常节点启动异常互斥组,并返回结果给集群管理节点。
4)集群管理节点设置状态,并同步状态给正常的节点。
同时异常节点本身需要把运行在自身上的互斥服务进行停止,具体处理过程为:
1)服务器故障节点发现自身异常,查找运行在本服务器上的所有互斥组。
2)故障节点依次停止互斥组,解除服务。
3)故障节点完成操作并等待恢复。
综合上述,通过本发明把高可用集群系统融入虚拟化中,不但能够自动快速的检测到虚拟化中相关的异常,同时可以快速自动的响应异常处理,保证业务的连续性,实现了软硬件的高可用性,保证了虚拟化对外提供不间断的透明的服务。

Claims (3)

1.一种高可用集群在虚拟化技术中的应用方法,其特征在于:虚拟化中的业务资源包括:
服务器资源,即虚拟化中真实运行的服务器;
并行服务组业务资源,即运行在服务器上的特殊服务或应用程序;
互斥服务组业务资源,只能在一台服务器上运行对外提供服务,并且该互斥服务组依赖于并行服务组,只有在并行服务组运行起来之后互斥服务组才能正常运行;
脚本组业务资源,用于互斥服务组操作和异常处理执行;
其中各业务组的统一管理过程为:
步骤1、在虚拟化中,高可用集群按照设置决策出一个管理节点;
步骤2、集群管理节点组织所有的节点执行启动集群服务的操作,通过这些相关操作,高可用集群系统对外提供集群服务,这里的所有节点包括管理节点本身;
步骤3、集群管理节点通知所有的节点启动并行服务组;
步骤4、集群管理节点得到所有节点启动并行服务组状态,并且把这些状态同步给所有的节点,所有的节点维护一份状态;
步骤5、集群管理节点根据配置文件和节点的优先级发送启动指定的互斥服务组的消息;
步骤6、各节点启动管理节点指定的互斥服务组,并且根据互斥服务组的需求启动指定的脚本组业务资源,执行完成后返回结果给管理节点;
步骤7、集群管理节点收到启动各个互斥服务组的启动结果,设置各个互斥服务组的状态,并且把状态同步到所有的节点上,这样,集群中的所有节点维护着同样的状态,完成统一管理。
2.根据权利要求1所述的一种高可用集群在虚拟化技术中的应用方法,其特征在于:所述虚拟化中的高可用集群系统在统一管理过程中会发现异常,所述的异常包括互斥服务组异常、并行服务组异常以及服务器本身的异常三种。
3.根据权利要求2所述的一种高可用集群在虚拟化技术中的应用方法,其特征在于:所述服务器异常发生时,运行在该服务器上的所有互斥服务组都需要迁移。
CN201310053326.6A 2013-02-19 2013-02-19 一种高可用集群在虚拟化技术中的应用方法 Active CN103118121B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310053326.6A CN103118121B (zh) 2013-02-19 2013-02-19 一种高可用集群在虚拟化技术中的应用方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310053326.6A CN103118121B (zh) 2013-02-19 2013-02-19 一种高可用集群在虚拟化技术中的应用方法

Publications (2)

Publication Number Publication Date
CN103118121A CN103118121A (zh) 2013-05-22
CN103118121B true CN103118121B (zh) 2017-05-17

Family

ID=48416391

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310053326.6A Active CN103118121B (zh) 2013-02-19 2013-02-19 一种高可用集群在虚拟化技术中的应用方法

Country Status (1)

Country Link
CN (1) CN103118121B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103595771A (zh) * 2013-11-01 2014-02-19 浪潮电子信息产业股份有限公司 一种集群的并行业务组控制和管理的方法
CN105095001B (zh) * 2014-05-08 2018-01-30 中国银联股份有限公司 分布式环境下虚拟机异常恢复方法
CN103986771A (zh) * 2014-05-22 2014-08-13 浪潮电子信息产业股份有限公司 一种不依赖于共享存储的高可用集群管理方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101859317A (zh) * 2010-05-10 2010-10-13 浪潮电子信息产业股份有限公司 一种利用虚拟化构建数据库集群的方法
CN102413172A (zh) * 2011-10-31 2012-04-11 北京联创信安科技有限公司 一种基于集群技术的并行数据共享装置方法和装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7937616B2 (en) * 2005-06-28 2011-05-03 International Business Machines Corporation Cluster availability management

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101859317A (zh) * 2010-05-10 2010-10-13 浪潮电子信息产业股份有限公司 一种利用虚拟化构建数据库集群的方法
CN102413172A (zh) * 2011-10-31 2012-04-11 北京联创信安科技有限公司 一种基于集群技术的并行数据共享装置方法和装置

Also Published As

Publication number Publication date
CN103118121A (zh) 2013-05-22

Similar Documents

Publication Publication Date Title
CN109656911B (zh) 分布式并行处理数据库系统及其数据处理方法
GB201306798D0 (en) Storage management in clustered data processing systems
WO2015131696A1 (zh) 一种虚拟化网络功能管理的方法和装置
CN104410535A (zh) 一种云资源智能监控告警方法
CN103544319A (zh) 一种多租户共享数据库的方法和多租户数据库即服务系统
CN103118121B (zh) 一种高可用集群在虚拟化技术中的应用方法
CN103595572B (zh) 一种云计算集群中节点自修复的方法
CN105260485B (zh) 一种数据加载的方法和装置
EP2115586A2 (en) Distributed platform management for high availability systems
CN103200036A (zh) 一种电力系统云计算平台的自动化配置方法
CN108183971A (zh) 一种分布式系统中的节点选举方法
CN109284339A (zh) 一种数据库数据实时同步的方法和装置
CN105159783A (zh) 一种系统任务分配方法
CN105956481A (zh) 一种数据处理方法及其装置
CN105635311A (zh) 一种云管理平台中资源池信息同步的方法
Zhou et al. A new solution architecture for online power system analysis
CN105450717A (zh) 集群脑裂处理方法和装置
CN111092752A (zh) 跨多个网络切片的故障定位方法及装置
CN110868435A (zh) 一种裸金属服务器调度方法、装置及存储介质
CN105141691A (zh) 一种云计算下虚拟机集群自动扩展系统和方法
CN106789941B (zh) 一种数据库及系统应用心跳统一管理的实现方法
CN110618884A (zh) 故障监控方法、虚拟化的网络功能模块管理器和存储介质
CN112380186A (zh) 一种基于主动适配的国产数据库迁移方法
CN109241029B (zh) 一种实现scada系统数据库平滑迁移的方法和装置
CN112350837A (zh) 一种基于云平台的电力应用集群管理方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant