CN105183591A - 一种高可用集群的实现方法及系统 - Google Patents

一种高可用集群的实现方法及系统 Download PDF

Info

Publication number
CN105183591A
CN105183591A CN201510563888.4A CN201510563888A CN105183591A CN 105183591 A CN105183591 A CN 105183591A CN 201510563888 A CN201510563888 A CN 201510563888A CN 105183591 A CN105183591 A CN 105183591A
Authority
CN
China
Prior art keywords
node
resource
resource group
host node
availability cluster
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510563888.4A
Other languages
English (en)
Inventor
吕倩华
邢天明
张鑫
李建磊
杜彦魁
陈良华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Beijing Electronic Information Industry Co Ltd
Original Assignee
Inspur Beijing Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Beijing Electronic Information Industry Co Ltd filed Critical Inspur Beijing Electronic Information Industry Co Ltd
Priority to CN201510563888.4A priority Critical patent/CN105183591A/zh
Publication of CN105183591A publication Critical patent/CN105183591A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种高可用集群的实现方法及系统,该方法包括:为主节点和备用节点划分共享存储;利用K-HA高可用软件,在共享存储中创建待管理资源组的ORACLE数据库实例;通过管理数据库实例,实现对资源组的管理;当检测到资源组中有资源出现故障时,将主节点中的所有资源切换到备用节点中。本发明中,将浪潮高可用软件K-HA与ORACLE数据库有效地结合,提高了高可用集群的业务切换连续性,进而提高了高可用集群的运行性能。

Description

一种高可用集群的实现方法及系统
技术领域
本发明涉及数据库集群技术领域,特别是涉及一种高可用集群的实现方法及系统。
背景技术
当今,高可用集群,英文原文为HighAvailabilityCluster,简称HACluster,简单的说,集群(cluster)就是一组计算机,它们作为一个整体向用户提供一组网络资源。这些单个的计算机系统就是集群的节点(node)。高可用性集群(HAcluster)是指如单系统一样地运行并支持(计算机)持续正常运行的一个主机群。
高可用集群是指以减少服务中断时间为目的的服务器集群技术。它通过保护用户的业务程序对外不间断提供的服务,把因软件/硬件/人为造成的故障对业务的影响降低到最小程度。高可用集群的应用系统有多样化发展趋势,用途也越来越多样化,同时带来了配置及可操作性方面的复杂性,因此选择好的高可用软件至关重要。
高可用集群的出现是为了使集群的整体服务尽可能可用,从而减少由计算机硬件和软件易错性所带来的损失。如果某个节点失效,它的备用节点将在几秒钟的时间内接管它的职责。然而,由于高可用软件和资源数据库之间的配合状态不佳,导致对于按现有技术实现的高可用集群,其在当前节点失效至备用节点完全替代当前节点之间的反应时间较长,导致业务切换连续性不高,进而影响了整个高可用集群的运行性能。
高可用集群软件的主要作用就是实现故障检查和业务切换的自动化。
发明内容
有鉴于此,本发明提供了一种高可用集群的实现方法及系统,以提高高可用集群的业务切换连续性,进而提高高可用集群的运行性能。
为解决上述技术问题,本发明提供一种高可用集群的实现方法,包括:
为主节点和备用节点划分共享存储;
利用K-HA高可用软件,在所述共享存储中创建待管理资源组的ORACLE数据库实例;
通过管理所述数据库实例,实现对所述资源组的管理;
当检测到所述资源组中有资源出现故障时,将所述主节点中的所有资源切换到所述备用节点中。
上述方法中,优选的,使用SAN存储软件为所述主节点和备用节点划分共享存储。
上述方法中,优选的,所述主节点为主服务器,所述备用节点为备用服务器。
本发明还提供了一种高可用集群的实现系统,包括:
共享存储划分模块,用于为主节点和备用节点划分共享存储;
数据库实例创建模块,用于利用K-HA高可用软件,在所述共享存储中创建待管理资源组的ORACLE数据库实例;
资源组管理模块,用于通过管理所述数据库实例,实现对所述资源组的管理;
节点切换模块,用于当检测到所述资源组中有资源出现故障时,将所述主节点中的所有资源切换到所述备用节点中。
上述系统中,优选的,所述共享存储划分模块包括:
划分子模块,用于使用SAN存储软件为所述主节点和备用节点划分共享存储。
上述系统中,优选的,所述主节点为主服务器,所述备用节点为备用服务器。
以上本发明提供的一种高可用集群的实现方法及系统中,先为所述主节点和备用节点划分共享存储;利用K-HA高可用软件,在所述共享存储中创建待管理资源组的ORACLE数据库实例;通过管理所述数据库实例,实现对所述资源组的管理;当检测到所述资源组中有资源出现故障时,将所述主节点中的所有资源切换到所述备用节点中。本发明中,将浪潮高可用软件K-HA与ORACLE数据库有效地结合,提高了高可用集群的业务切换连续性,进而提高了高可用集群的运行性能。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例所提供的一种高可用集群的实现方法的流程图;
图2为本发明实施例所提供的一种高可用集群的实现系统的结构框图示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的核心是提供一种高可用集群的实现方法及系统,以提高高可用集群的业务切换连续性,进而提高高可用集群的运行性能。
B/S体系结构的数据库之一。ORACLE数据库是目前世界上使用最为广泛的数据库管理系统,它是在数据库领域一直处于领先地位的产品。
为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。
参考图1,示出了本发明实施例所提供的一种高可用集群的实现方法的流程图,该方法具体可以包括如下步骤:
步骤S100、为主节点和备用节点划分共享存储;
具体地,可以使用SAN存储软件为主节点和备用节点划分共享存储。
步骤S101、利用K-HA高可用软件,在共享存储中创建待管理资源组的ORACLE数据库实例;
具体地,在主节点可备用节点上均安装K-HA软件和ORALCE软件,在共享存储上进行ORACLE创建数据库实例,配置监听。
实际应用中,在K-HA软件进行集群配置,添加共有IP、私网IP和心跳磁盘。进行资源配置和资源监听配置,包括浮动IP、磁盘资源、数据库脚本资源、进程监视资源、监听资源等资源。
步骤S102、通过管理数据库实例,实现对资源组的管理;
步骤S103、当检测到资源组中有资源出现故障时,将主节点中的所有资源切换到备用节点中。
进一步地,上述节点可以是服务器,具体地,即主节点为主服务器,备用节点为备用服务器。若资源出现故障,K-HA软件检测到资源发生故障后,自动进行切换,将主服务器上的所有资源切换到备用服务器中,备用服务器将接管主服务器上的所有业务,实现故障检测和切换,保障业务的连续性。
更进一步地,为了达到更高的业务连续性,上述高可用集群的实现方法可以基于安腾平台,这是因为Intel安腾处理器专为要求苛刻的企业和技术应用而设计。基于Intel安腾处理器的平台以较低的成本,提供了业界领先的性能,可帮助企业和机构最大地提高其投资回报。安腾的机器一般划分位小型机一类,他是IA-64的处理器,先进应用软件、高端系统、操作系统以及计算机硬件的所有大制造商和供应商都认可了Itanium和处理器的IA-64架构。同时,Intel安腾处理器家族支持32位Intel架构(IA-32)应用,并将随着32位Intel架构(IA-32)执行层技术的推出进一步增强。
当今,ORACLE数据库系统是美国ORACLE公司(甲骨文)提供的以分布式数据库为核心的一组软件产品,是目前最流行的客户/服务器(CLIENT/SERVER)或B/S体系结构的数据库之一。ORACLE数据库是目前世界上使用最为广泛的数据库管理系统,它是在数据库领域一直处于领先地位的产品。可以说ORACLE数据库系统是目前世界上流行的关系数据库管理系统,系统可移植性好、使用方便、功能强,适用于各类大、中、小、微机环境。它是一种高效率、可靠性好的适应高吞吐量的数据库解决方案。
综上,先为主节点和备用节点划分共享存储;利用K-HA高可用软件,在共享存储中创建待管理资源组的ORACLE数据库实例;通过管理数据库实例,实现对资源组的管理;当检测到资源组中有资源出现故障时,将主节点中的所有资源切换到备用节点中。本发明中,将浪潮高可用软件K-HA与ORACLE数据库有效地结合,提高了高可用集群的业务切换连续性,进而提高了高可用集群的运行性能。
与上述本发明实施例所公开的一种高可用集群的实现方法相对应,本发明实施例还提供了一种高可用集群的实现系统,参考图2,该系统200可以包括如下内容:
共享存储划分模块201,用于为主节点和备用节点划分共享存储;
数据库实例创建模块202,用于利用K-HA高可用软件,在共享存储中创建待管理资源组的ORACLE数据库实例;
资源组管理模块203,用于通过管理数据库实例,实现对资源组的管理;
节点切换模块204,用于当检测到资源组中有资源出现故障时,将主节点中的所有资源切换到备用节点中。
本发明中,上述共享存储划分模块201可以包括划分子模块,用于使用SAN存储软件为主节点和备用节点划分共享存储。
本发明中,上述系统200中,主节点为主服务器,备用节点为备用服务器。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于系统类实施例而言,由于其与方法实施例基本相似,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。
以上对本发明所提供的一种高可用集群的实现方法及系统进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。

Claims (6)

1.一种高可用集群的实现方法,其特征在于,包括:
为主节点和备用节点划分共享存储;
利用K-HA高可用软件,在所述共享存储中创建待管理资源组的ORACLE数据库实例;
通过管理所述数据库实例,实现对所述资源组的管理;
当检测到所述资源组中有资源出现故障时,将所述主节点中的所有资源切换到所述备用节点中。
2.如权利要求1所述的方法,其特征在于,使用SAN存储软件为所述主节点和备用节点划分共享存储。
3.如权利要求1或2所述的方法,其特征在于,所述主节点为主服务器,所述备用节点为备用服务器。
4.一种高可用集群的实现系统,其特征在于,包括:
共享存储划分模块,用于为主节点和备用节点划分共享存储;
数据库实例创建模块,用于利用K-HA高可用软件,在所述共享存储中创建待管理资源组的ORACLE数据库实例;
资源组管理模块,用于通过管理所述数据库实例,实现对所述资源组的管理;
节点切换模块,用于当检测到所述资源组中有资源出现故障时,将所述主节点中的所有资源切换到所述备用节点中。
5.如权利要求4所述的系统,其特征在于,所述共享存储划分模块包括:
划分子模块,用于使用SAN存储软件为所述主节点和备用节点划分共享存储。
6.如权利要求4或5所述的系统,其特征在于,所述主节点为主服务器,所述备用节点为备用服务器。
CN201510563888.4A 2015-09-07 2015-09-07 一种高可用集群的实现方法及系统 Pending CN105183591A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510563888.4A CN105183591A (zh) 2015-09-07 2015-09-07 一种高可用集群的实现方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510563888.4A CN105183591A (zh) 2015-09-07 2015-09-07 一种高可用集群的实现方法及系统

Publications (1)

Publication Number Publication Date
CN105183591A true CN105183591A (zh) 2015-12-23

Family

ID=54905685

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510563888.4A Pending CN105183591A (zh) 2015-09-07 2015-09-07 一种高可用集群的实现方法及系统

Country Status (1)

Country Link
CN (1) CN105183591A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106021370A (zh) * 2016-05-11 2016-10-12 智者四海(北京)技术有限公司 内存数据库实例的管理方法及装置
CN106130763A (zh) * 2016-06-24 2016-11-16 平安科技(深圳)有限公司 服务器集群及适用于该集群的数据库资源组切换控制方法
CN106484528A (zh) * 2016-09-07 2017-03-08 北京百度网讯科技有限公司 分布式框架中用于实现集群动态伸缩的方法及装置
CN108322358A (zh) * 2017-12-15 2018-07-24 北京奇艺世纪科技有限公司 异地多活的分布式消息发送、处理、消费方法及装置
CN110413225A (zh) * 2019-06-28 2019-11-05 苏州浪潮智能科技有限公司 高可靠集群存储双活配置方法、系统、终端及存储介质
CN111240749A (zh) * 2018-11-28 2020-06-05 中国移动通信集团浙江有限公司 一种集群系统中实例的挂起控制方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101237315A (zh) * 2008-02-28 2008-08-06 浪潮电子信息产业股份有限公司 一种用于双控高可用系统的同步检测和故障隔离方法
US20110161973A1 (en) * 2009-12-24 2011-06-30 Delphix Corp. Adaptive resource management
CN103279386A (zh) * 2013-06-09 2013-09-04 浪潮电子信息产业股份有限公司 一种计算机作业调度系统高可用的方法
CN104486131A (zh) * 2014-12-29 2015-04-01 浪潮电子信息产业股份有限公司 一种基于安腾平台的db2数据库的故障检测和切换方法
CN104660386A (zh) * 2015-03-03 2015-05-27 浪潮电子信息产业股份有限公司 一种基于安腾平台下提高db2容灾高可用性的方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101237315A (zh) * 2008-02-28 2008-08-06 浪潮电子信息产业股份有限公司 一种用于双控高可用系统的同步检测和故障隔离方法
US20110161973A1 (en) * 2009-12-24 2011-06-30 Delphix Corp. Adaptive resource management
CN103279386A (zh) * 2013-06-09 2013-09-04 浪潮电子信息产业股份有限公司 一种计算机作业调度系统高可用的方法
CN104486131A (zh) * 2014-12-29 2015-04-01 浪潮电子信息产业股份有限公司 一种基于安腾平台的db2数据库的故障检测和切换方法
CN104660386A (zh) * 2015-03-03 2015-05-27 浪潮电子信息产业股份有限公司 一种基于安腾平台下提高db2容灾高可用性的方法

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106021370A (zh) * 2016-05-11 2016-10-12 智者四海(北京)技术有限公司 内存数据库实例的管理方法及装置
CN106130763A (zh) * 2016-06-24 2016-11-16 平安科技(深圳)有限公司 服务器集群及适用于该集群的数据库资源组切换控制方法
CN106484528A (zh) * 2016-09-07 2017-03-08 北京百度网讯科技有限公司 分布式框架中用于实现集群动态伸缩的方法及装置
CN106484528B (zh) * 2016-09-07 2019-08-27 北京百度网讯科技有限公司 分布式框架中用于实现集群动态伸缩的方法及装置
CN108322358A (zh) * 2017-12-15 2018-07-24 北京奇艺世纪科技有限公司 异地多活的分布式消息发送、处理、消费方法及装置
CN111240749A (zh) * 2018-11-28 2020-06-05 中国移动通信集团浙江有限公司 一种集群系统中实例的挂起控制方法及装置
CN111240749B (zh) * 2018-11-28 2023-07-21 中国移动通信集团浙江有限公司 一种集群系统中实例的挂起控制方法、装置、设备、存储介质
CN110413225A (zh) * 2019-06-28 2019-11-05 苏州浪潮智能科技有限公司 高可靠集群存储双活配置方法、系统、终端及存储介质
CN110413225B (zh) * 2019-06-28 2023-01-10 苏州浪潮智能科技有限公司 高可靠集群存储双活配置方法、系统、终端及存储介质

Similar Documents

Publication Publication Date Title
CN105183591A (zh) 一种高可用集群的实现方法及系统
CN107783975B (zh) 分布式数据库同步处理的方法和装置
JP5102901B2 (ja) データセンタにわたる複数データサーバ間のデータ完全性を保持する方法およびシステム
US11663085B2 (en) Application backup and management
US20130091376A1 (en) Self-repairing database system
US8688642B2 (en) Systems and methods for managing application availability
US8230256B1 (en) Method and apparatus for achieving high availability for an application in a computer cluster
US9098439B2 (en) Providing a fault tolerant system in a loosely-coupled cluster environment using application checkpoints and logs
US9652326B1 (en) Instance migration for rapid recovery from correlated failures
CN112099918A (zh) 容器化环境中的集群的实时迁移
US20170091221A1 (en) System and method for providing a virtualized replication and high availability environment
US9537720B1 (en) Topology discovery for fault finding in virtual computing environments
CN104408071A (zh) 一种基于集群管理器的分布式数据库高可用方法及系统
US20160188426A1 (en) Scalable distributed data store
US20140149696A1 (en) Virtual machine backup using snapshots and current configuration
US10230567B2 (en) Management of a plurality of system control networks
US20140245085A1 (en) Managing error logs in a distributed network fabric
CN103167004A (zh) 云平台主机系统故障修复方法及云平台前端控制服务器
US20200151024A1 (en) Hyper-converged infrastructure (hci) distributed monitoring system
CN103678051B (zh) 一种集群数据处理系统中的在线故障容错方法
CN107480014A (zh) 一种高可用设备切换方法及装置
US10445295B1 (en) Task-based framework for synchronization of event handling between nodes in an active/active data storage system
CN111818188B (zh) 一种Kubernetes集群的负载均衡可用性提升方法和装置
US7519857B2 (en) Method, apparatus, and system for a software based business continuity solution for a computing environment
Qiang et al. CDMCR: multi‐level fault‐tolerant system for distributed applications in cloud

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20151223

RJ01 Rejection of invention patent application after publication