CN101227315B - 动态服务器集群及其控制方法 - Google Patents

动态服务器集群及其控制方法 Download PDF

Info

Publication number
CN101227315B
CN101227315B CN2007100365180A CN200710036518A CN101227315B CN 101227315 B CN101227315 B CN 101227315B CN 2007100365180 A CN2007100365180 A CN 2007100365180A CN 200710036518 A CN200710036518 A CN 200710036518A CN 101227315 B CN101227315 B CN 101227315B
Authority
CN
China
Prior art keywords
business
server
subregion
core
machine
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2007100365180A
Other languages
English (en)
Other versions
CN101227315A (zh
Inventor
秦德霖
吴颖健
王伟俊
徐奎东
陈懿磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Medical Insurance Management Center
Wanda Information Co., Ltd.
Original Assignee
WANDA INFORMATION CO Ltd
SHANGHAI MEDICARE INSURANCE INFORMATION CENTER
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by WANDA INFORMATION CO Ltd, SHANGHAI MEDICARE INSURANCE INFORMATION CENTER filed Critical WANDA INFORMATION CO Ltd
Priority to CN2007100365180A priority Critical patent/CN101227315B/zh
Publication of CN101227315A publication Critical patent/CN101227315A/zh
Application granted granted Critical
Publication of CN101227315B publication Critical patent/CN101227315B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Hardware Redundancy (AREA)

Abstract

本发明揭示了一种动态服务器集群及其控制方法,该集群包括:第一类型服务器,用于第一类型业务;第二类型服务器,采用服务器分区技术分成一个以上的分区,包括业务分区和备份分区;其中,业务分区用于第二类型业务,该第一类型业务具有比第二类型业务高的优先级;备份分区为用于第一类型业务的第一类型服务器的备份机;第二类型服务器大于等于第一类型服务器所具有的处理资源,当第一类型服务器正常工作时,业务分区占有第二类型服务器大多数的处理资源,备份分区只占用足够构成第一类型服务器的备份机的资源,当第一类型的服务器发生故障时,备份分区被分配足够的资源并接管第一类型的业务,业务分区只占用剩余的资源用于第二类型的业务。

Description

动态服务器集群及其控制方法 
技术领域
本发明涉及服务器集群技术,更具体地说,涉及一种动态服务器集群及其控制方法。 
背景技术
集群(Cluster)技术是将若干台主机服务器组成一个服务器群集,统一向客户提供透明的虚拟服务,以防止单台服务器故障引起的服务中断。在系统正常运行时,服务器群集中的所有服务器可共同分担工作负载,并且相互备援;故障发生时,工作正常的服务器将自动接管故障机的工作,无须人工干预,这样故障的出现与恢复对客户端程序来说都是透明不可见的,保证了业务的连续运行。 
传统的集群配置方案 
图1是一个典型的两节点集群(Cluster)100配置的结构图。其包括两个服务器102和104,它们共享资源106,资源106可以包括磁盘等,服务器102和104之间通过一私有集群连接(Private cluster connection)108和一公有集群连接(Public cluster connection)110相连。该公有集群连接110连接到客户端112,使得服务器102和/或服务器104能够通过公有集群连接110为客户端112提供服务。服务器102和104之间的私有集群连接108对于客户端112是不可见的。 
一般情况下,服务器集群方案有三种模式:Active-Standby(主备/热备),Active-Active(对等/互为备份)以及Load-Banalce(负载均衡)。 
Active-Standby(主备/热备)模式 
图2A和图2B示出了Active-Standby(主备/热备)模式的工作原理,同样以两节点集群为例。参考图2A和图2B,在该种模式下,同样由两台 服务器202和204构成服务器集群,向客户机206提供服务,在服务器202和204之间,是共享资源208,此处,使用共享资源208来表示上面图1中所述的资源106、私有集群连接108和公有集群连接110等必要的元素。 
正常情况下,参考图2A所示,群集200中的一台服务器202处于生产状态,称为生产机,享有对共享资源208的操作权限;而另一台服务器204处于空闲等待状态,称为备份机。一旦生产机的网络、系统资源或是关键应用进程出现异常,导致不能继续正常工作,备份机204将全面接管生产机的共享资源208,比如对外服务网络地址、共享磁盘阵列的控制权,以及关键应用服务等资源,保证用户应用的不间断运行。参考图2B所示的情况。 
这种模式最大的缺点,就是备份机在正常情况下处于闲置状态,如上图中的服务器204,资源被极大的浪费。若想要减少这种资源的浪费,就势必会想到降低服务器204的配置。但这种改变会带来一个副作用,一旦服务器202出现故障,服务器204开始接管工作,由于服务器204配置较低,处理性能就必然会下降,服务水平就可能得不到保障。 
Active-Active(对等/互为备份)模式 
Active-Active(对等/互为备份):正常情况下,群集中的任一台服务器都处于生产状态,拥有对外服务网络地址,享有对共享磁盘中各自数据的操作权限,即各自拥有一部分的共享资源,运行各自的应用,实现相互备援。一旦一台服务器发生故障,另一台服务器同样接管故障机的对外服务网络地址、共享磁盘阵列的控制权,以及关键应用服务等资源,保证用户应用的不间断运行。 
实际上,Active-Active(对等/互为备份)模式就是多个Active-Standby(主备/热备)模式的叠加。例如对于图2A和图2B中所示的两节点的集群Cluster配置,第一业务的生产机为服务器202,备份机为服务器204;而第二业务则相反,生产机为服务器204,备份机为服务器202。 
这种模式,表面看来两台服务器平时都在工作,最大化地利用了系统 资源,同时通过相互热备份,又提高了系统的可靠性。因此,也是在项目中经常采取的系统架构。但是深究下去就会发现,一旦任何一台服务器出现故障,另一台服务器就必然要同时承担原来两台主机的工作,类似地处理性能就会下降,两项工作的服务水平就都可能得不到保障。而如果将集群中的两台服务器配置得比单一工作所需再高一些,以预留接管另一项工作所需的处理能力,那么在正常情况下这些预留的资源又会造成一定程度的浪费。 
以及Load-Banalce(负载均衡)模式 
Load-Balance(负载均衡)模式:该模式大多用于Unix环境下的并行数据库环境,群集中的多台服务器同时访问磁盘阵列,对外提供服务,在容错的基础上进一步分担负载,提高系统性能。随着三层结构的出现,该模式也越来越多地应用于三层结构中的中间层,由多台服务器组成负载均衡型的集群系统。 
这种模式与Active-Active(对等/互为备份)模式完全类同,要么接管后单台服务器需要面向更多的客户端提供服务,无法保障服务水平;要么会在正常情况下造成预留资源的浪费。 
随着各行业信息化的发展,用户在服务器等硬件基础设施上的投资不断加大,设备数量也急剧增多。但普遍的问题是,数量众多而且各自独立的硬件设备难以实现资源快速灵活的调整和共享。 
服务器分区技术 
服务器分区技术可将服务器的CPU、内存、I/O等资源合理地进行分区和调配,不同分区内可以执行不同的操作系统或同一操作系统的不同版本,最大限度地挖掘了服务器的性能,一台服务器甚至可以当作几十台使用,提高了硬件利用率。并且,在任何某个分区发生故障时,都不会影响其他分区的运行,不同分区的应用之间保持独立性。系统分区技术在高性能服务器中应用非常普遍,同时非常重要的技术之一,各服务器厂商都有不同的分区技术。
逻辑分区(LPAR)指的是将一个物理的服务器划分成若干个虚拟的或逻辑的服务器,每个虚拟的或逻辑的服务器运行自已独立的操作系统,有自已独享的处理器、内存和I/O资源。逻辑分区技术又可分为静态逻辑分区(LPAR)和动态逻辑分区(DLPAR)两种方式,动态逻辑分区允许在不中断应用操作的情况下,增加或减少分区占用的资源。 
IBM将这些灵活的技术先从大型机(Mainframe)平台带到了基于POWER5处理器的IBM pSeries平台上,从而极大的降低了该技术的价格和成本,而逻辑分区技术大大提高了IBM pSeries服务器使用的灵活性和工作负载。IBM pSeries服务器在逻辑分区技术的基础之上,又增加了动态逻辑分区(DLPAR)的功能,使得当用户将系统资源在逻辑分区中重新分配时,不需要将系统重新引导,也不影响逻辑分区中应用的运行。 
动态逻辑分区技术并不会影响逻辑分区的安全性。对于在某一逻辑分区中的操作系统,其他逻辑分区中的资源甚至系统空闲池中的资源都是不可见的。此逻辑分区中的操作系统只能看见一些虚拟资源连接,当硬件管理控制台向此逻辑分区添加资源时,硬件管理控制台会向此逻辑分区发一条消息,要求操作系统去激活相应的虚拟资源连接。如果硬件管理控制台和hypervisor没有首先向此逻辑分区添加资源,而操作系统试图去激活虚拟资源连接时,操作系统会受到一个错误信息,显示此资源不存在。 
对于服务器资源的分配和工作负载经常变化的应用,动态逻辑分区可带来更大灵活性,以下是一些显而易见的例子: 
当生产系统的CPU压力很大时,将CPU从测试系统逻辑分区移动到生产系统逻辑分区,当压力减小了以后,在将CPU移回测试系统逻辑分区。 
为正在进行大量内存页换进/换出操作的逻辑分区添加内存。 
将不常用的外设在逻辑分区间移动,如安装软件用的CD-ROM和备份用的磁带机。 
从已有的逻辑分区释放一些系统资源,来建立一个新的分区。 
从这些例子可以看出动态逻辑分区技术给用户带来了更大的灵活性,提高了设备的利用率,使得用户的投资更具价值。 
服务器分区技术的出现为服务器集群方案提供一种新的解决途径。
发明内容
本发明将服务器分区技术和服务器集群方案相结合,提供了一种新的动态服务器集群及其控制方法。 
根据本发明的一方面,提供一种动态服务器集群,包括:第一类型服务器,用于第一类型业务;第二类型服务器,采用服务器分区技术分成一个以上的分区,所述分区包括业务分区和备份分区;其中,业务分区用于第二类型业务,该第一类型业务具有比第二类型业务高的优先级;备份分区为用于第一类型业务的第一类型服务器的备份机;第二类型服务器大于等于第一类型服务器所具有的处理资源,当第一类型服务器正常工作时,业务分区占有第二类型服务器大多数的处理资源,备份分区只占用足够构成第一类型服务器的备份机的资源,当第一类型的服务器发生故障时,备份分区被分配足够的资源并接管第一类型的业务,业务分区只占用剩余的资源用于第二类型的业务;还包括:切换模块,当一第一类型服务器发生故障时,切换模块使对应的第二类型服务器中的备份分区从业务分区获取足够的处理资源并接管该第一类型服务器的第一类型业务;该切换模块还将失去处理资源的业务分区对应的第二类型业务的服务等级或服务范围降低。 
比如,所述动态服务器集群具有至少一个第一类型服务器,所述第二类型服务器上具有与第一类型服务器数量相等的备份分区,分别对应一个第一类型服务器。 
或者,所述动态服务器集群具有至少一个第一类型服务器,所述动态服务器集群具有与第一类型服务器数量相等的第二类型服务器,每个第二类型服务器上具有一个备份分区,对应一个第一类型服务器。 
根据一实施例,该动态服务器集群包括一个第一类型服务器,为核心业务生产机,用于第一类型业务,该第一类型业务为核心业务;一个第二类型服务器,采用服务器分区技术分为一个业务分区和一个备份分区,该业务分区为非核心业务生产机,该备份分区为核心业务热备份机。 
较佳的在所述第一类型服务器和第二类型服务器上包括:配置集群软 件,使得该核心业务生产机和该核心业务热备份机构成双机热备系统;分区控制台,获取执行分区动态资源调整命令的权限;集群切换脚本,增加分区动态资源调整的子任务。所述配置集群软件、分区控制台和集群切换脚本在核心业务生产机发生故障时,降低非核心业务的服务等级或者服务范围,将非核心业务生产机的处理资源重新分配给核心业务热备份机,由核心业务热备份机接管核心业务。 
较佳的,该动态服务器集群还包括资源分配判断装置,判断非核心业务生产机的处理资源是否成功地被重新分配给核心业务热备份机,如果重新分配成功,则核心业务热备份机以高配置模式接管核心业务,如果重新分配失败,则核心业务热备份机以低配置模式接管核心业务。 
根据一实施例,所述核心业务包括医保系统的实时费用结算和交易业务;所述非核心业务包括医保系统的个人帐户管理业务、事务管理业务、医保服务点管理业务、统计查询业务、审核结算管理业务、监督审核管理业务、保障卡交换业务、医保政府网站业务、前置机明细上传处理业务。 
根据本发明的第二方面,提供一种动态服务器集群的控制方法,包括:配置第一类型服务器用于第一类型业务;配置第二类型服务器,采用服务器分区技术将第二类型服务器分成一个以上的分区,所述分区包括业务分区和备份分区,其中该第二类型服务器大于等于第一类型服务器所具有的处理资源;配置该业务分区用于第二类型业务,该第一类型业务具有比第二类型业务高的优先级;配置备份分区为用于第一类型业务的第一类型服务器的备份机;当第一类型服务器正常工作时,配置该业务分区占有第二类型服务器大多数的处理资源,备份分区只占用足够构成第一类型服务器的备份机的资源;当第一类型的服务器发生故障时,分配给备份分区足够的资源并接管第一类型的业务,分配给业务分区剩余的资源用于第二类型的业务;当一第一类型服务器发生故障时,使对应的第二类型服务器中的备份分区从业务分区获取足够的处理资源并接管该第一类型服务器的第一类型业务;将失去处理资源的业务分区对应的第二类型业务的服务等级或服务范围降低。 
比如,为该动态服务器集群配置至少一个第一类型服务器,在该第二类型服务器上配置与第一类型服务器数量相等的备份分区,分别对应一个第一类型服务器。 
或者,为该动态服务器集群配置至少一个第一类型服务器,为该动态服务器集群配置与第一类型服务器数量相等的第二类型服务器,每个第二类型服务器上具有一个备份分区,对应一个第一类型服务器。 
根据一实施例,该动态服务器集群的控制方法包括:配置一个第一类型服务器,为核心业务生产机,用于第一类型业务,该第一类型业务为核心业务;配置一个第二类型服务器,采用服务器分区技术分为一个业务分区和一个备份分区,该业务分区为非核心业务生产机,该备份分区为核心业务热备份机。 
较佳的,在所述第一类型服务器和第二类型服务器上设置配置集群软件,使得该核心业务生产机和该核心业务热备份机构成双机热备系统;在所述第一类型服务器和第二类型服务器上设置分区控制台,获取执行分区动态资源调整命令的权限;在所述第一类型服务器和第二类型服务器上设置集群切换脚本,增加分区动态资源调整的子任务。所述配置集群软件、分区控制台和集群切换脚本在核心业务生产机发生故障时,执行:降低非核心业务的服务等级或者服务范围;将非核心业务生产机的处理资源重新分配给核心业务热备份机,由核心业务热备份机接管核心业务。 
较佳的,该动态服务器集群的控制方法还包括判断非核心业务生产机的处理资源是否成功地被重新分配给核心业务热备份机,如果重新分配成功,则核心业务热备份机以高配置模式接管核心业务,如果重新分配失败,则核心业务热备份机以低配置模式接管核心业务。 
根据一实施例,所述核心业务包括医保系统的实时费用结算和交易业务;所述非核心业务包括医保系统的个人帐户管理业务、事务管理业务、医保服务点管理业务、统计查询业务、审核结算管理业务、监督审核管理业务、保障卡交换业务、医保政府网站业务、前置机明细上传处理业务。 
采用本发明的技术方案,该动态服务器集群中平时核心关键业务与非 核心业务使用了各台服务器的绝大部分资源,几乎未造成资源浪费。而一旦核心关键业务的生产机出现硬件故障,又可以以一台资源配置一致的备份机来接管,充分保障了核心关键业务的服务水平和业务连续性。 
附图说明
在本发明中,相同的附图标记始终表示相同的特征,其中, 
图1是现有技术中的一服务器集群配置方案的结构图; 
图2A和图2B是现有技术中采用Active-Standby(主备/热备)模式的服务器配置方案的工作原理图; 
图3A、3B和3C是根据本发明的动态服务器集群的结构图; 
图4是根据本发明的一实施例的动态服务器集群配置方案的结构图; 
图5A、5B和5C是根据本发明的一实施例的动态服务器集群配置方案的工作原理图; 
图6A是本发明的一应用实例根据传统方式进行服务器集群配置的结构图; 
图6B是上述应用实例根据本发明的动态服务器集群配置方案的结构图; 
图7是根据本发明的动态服务器集群控制方法的流程图; 
图8是根据本发明的一实例的动态服务器集群控制方法的流程图。 
具体实施方式
下面结合附图和实施例进一步描述本发明的技术方案。 
本发明将服务器分区技术应用到服务器集群技术中,发明了一种动态服务器集群及其控制方法。 
动态服务器集群 
参考图3A,图3A示出了本发明的动态服务器集群的结构图,该动态服务器集群300包括: 
第一类型服务器302,用于第一类型业务。
第二类型服务器304,采用服务器分区技术分成一个以上的分区,该分区包括业务分区304a和备份分区304b。 
其中,业务分区304a用于第二类型业务,该第一类型业务具有比第二类型业务高的优先级;备份分区304b为用于第一类型业务的第一类型服务器的备份机。 
第二类型服务器304大于等于第一类型服务器302所具有的处理资源,当第一类型服务器302正常工作时,业务分区304a占有第二类型服务器304大多数的处理资源,备份分区304b只占用足够构成第一类型服务器302的备份机的资源,当第一类型的服务器302发生故障时,备份分区304b被分配足够的资源并接管第一类型的业务,业务分区304a只占用剩余的资源用于第二类型的业务。 
根据本发明的一实施例,该动态服务器集群300还包括切换模块306,当一第一类型服务器302发生故障时,切换模块306使对应的第二类型服务器304中的备份分区304b从业务分区304a获取足够的处理资源并接管该第一类型服务器302的第一类型业务;同时,该切换模块306还将失去处理资源的业务分区304a对应的第二类型业务的服务等级或服务范围降低。 
动态服务器集群的扩展配置 
图3A所示的实施例中,动态服务器集群300是以2台服务器为例进行说明,在实际的应用中,在动态服务器集群300中可以拥有多于2台的服务器。 
参考图3B所示的实施例,该动态服务器集群300B包括数个第一类型服务器302,以及一个第二类型服务器304,该第二类型服务器304上具有与第一类型服务器302数量相等的备份分区304b,分别对应一个第一类型服务器。该动态服务器集群300B还包括切换模块306,当一个第一类型服务器302发生故障时,切换模块306使对应的第二类型服务器304中的备份分区304b从业务分区304a获取足够的处理资源并接管该第一类型服务器302的第一类型业务;同时,该切换模块306还将失去处理资源的业务分区304a对应的第二类型业务的服务等级或服务范围降低。
参考图3C所示的实施例,该动态服务器集群300C包括数个第一类型服务器302,还包括与第一类型服务器302数量相等的第二类型服务器304,每个第二类型服务器304上具有一个备份分区304b,对应一个第一类型服务器。该动态服务器集群300C还包括切换模块306,当一个第一类型服务器302发生故障时,切换模块306使对应的第二类型服务器304中的备份分区304b从业务分区304a获取足够的处理资源并接管该第一类型服务器302的第一类型业务;同时,该切换模块306还将失去处理资源的业务分区304a对应的第二类型业务的服务等级或服务范围降低。 
动态服务器集群工作过程 
参考图4,图4是根据本发明的一实施例的动态服务器集群配置方案的结构图。该动态服务器集群400包括: 
一个第一类型服务器402,为核心业务生产机,用于第一类型业务,该第一类型业务为核心业务; 
一个第二类型服务器404,采用服务器分区技术分为一个业务分区404a和一个备份分区404b,该业务分区404a为非核心业务生产机,该备份分区404b为核心业务热备份机。 
根据图4所示的实施例,在第一类型服务器402和第二类型服务器404上还包括: 
配置集群软件406,使得该核心业务生产机402和该核心业务热备份机404b构成双机热备系统; 
分区控制台408,获取执行分区动态资源调整命令的权限; 
集群切换脚本410,增加分区动态资源调整的子任务。 
上述的配置集群软件406、分区控制台408和集群切换脚本410在核心业务生产机402发生故障时,按照集群切换标准流程获取资源,降低非核心业务的服务等级或者服务范围,将非核心业务生产机的处理资源重新分配给核心业务热备份机,由核心业务热备份机404b接管核心业务。 
根据图4所示的实施例,在该动态服务器集群400中还包括资源分配判断装置412,判断非核心业务生产机404a的处理资源是否成功地被重新 分配给核心业务热备份机404b,如果重新分配成功,则核心业务热备份机404b以高配置模式接管核心业务,如果重新分配失败,则核心业务热备份机404b以低配置模式接管核心业务。 
图5A、5B和5C示出了图4所示的动态服务器集群配置方案的工作原理图。 
该集群配置方案首先将业务分为核心关键业务与非核心业务。以一台独立的服务器402作为核心业务的生产机,而另一台服务器404则通过分区技术划分为两个“逻辑子服务器”,分别作为非核心业务的生产机(业务分区404a)与核心业务的备份机(备份分区404b)。 
参考图5A,在正常情况下,业务分区404a占用了服务器404的大部分(CPU与内存)资源,为非核心业务提供高效服务;而备份分区404b只占用最少的资源,与核心业务的生产机402组成热备集群系统,监视着生产机的运行状态,随时待命。 
一旦核心关键业务的生产机出现故障,首先通过分区控制台408和集群切换脚本410自动进行分区资源的动态调整,将原业务分区404a的大部分资源(包括CPU、内存等)划给原来的备份分区404b,参考图5B所示。 
再通过配置集群软件406由备份分区404b接管核心业务,确保核心关键业务的处理性能和业务连续性。而业务分区404a在资源配置下降的状态下,通过限制服务范围或降低服务等级,仍可处理部分非核心的业务,参考图5C所示。 
其中,在由配置集群软件406使得备份分区404b接管核心业务之前,可先由资源分配判断装置412判断非核心业务生产机404a的处理资源是否成功地被重新分配给核心业务热备份机404b,如果重新分配成功,则核心业务热备份机404b以高配置模式接管核心业务,如果重新分配失败,则核心业务热备份机404b以低配置模式接管核心业务。 
动态服务器集群控制方法 
根据本发明的另一方面,还提供一种动态服务器集群的控制方法,参 考图7所示,该方法700包括: 
702.配置第一类型服务器用于第一类型业务; 
704.配置第二类型服务器,采用服务器分区技术将第二类型服务器分成一个以上的分区,所述分区包括业务分区和备份分区,其中该第二类型服务器大于等于第一类型服务器具有的处理资源; 
706.配置该业务分区用于第二类型业务,该第一类型业务具有比第二类型业务高的优先级; 
708.配置备份分区为用于第一类型业务的第一类型服务器的备份机; 
710.当第一类型服务器正常工作时,配置该业务分区占有第二类型服务器大多数的处理资源,备份分区只占用足够构成第一类型服务器的备份机的资源; 
712.当第一类型的服务器发生故障时,分配给备份分区足够的资源并接管第一类型的业务,分配给业务分区剩余的资源用于第二类型的业务。根据一实施例,当第一类型的服务器发生故障时,使对应的第二类型服务器中的备份分区从业务分区获取足够的处理资源并接管该第一类型服务器的第一类型业务;并将失去处理资源的业务分区对应的第二类型业务的服务等级或服务范围降低。 
根据实际应用情况的不同,上述的控制方法可以进行不同的配置,比如: 
为该动态服务器集群配置至少一个第一类型服务器, 
在该第二类型服务器上配置与第一类型服务器数量相等的备份分区,分别对应一个第一类型服务器。 
或者: 
为该动态服务器集群配置至少一个第一类型服务器, 
为该动态服务器集群配置与第一类型服务器数量相等的第二类型服务器,每个第二类型服务器上具有一个备份分区,对应一个第一类型服务器。 
根据一常用的配置实例,动态服务器集群的控制方法800包括如下的步骤,参考图8所示: 
802.配置一个第一类型服务器,为核心业务生产机,用于第一类型业 务,该第一类型业务为核心业务; 
804.配置一个第二类型服务器,采用服务器分区技术分为一个业务分区和一个备份分区,该业务分区为非核心业务生产机,该备份分区为核心业务热备份机。 
806.在所述第一类型服务器和第二类型服务器上设置配置集群软件,使得该核心业务生产机和该核心业务热备份机构成双机热备系统; 
808.在所述第一类型服务器和第二类型服务器上设置分区控制台,获取执行分区动态资源调整命令的权限; 
810.在所述第一类型服务器和第二类型服务器上设置集群切换脚本,增加分区动态资源调整的子任务。 
812.在核心业务生产机发生故障时,上述配置集群软件、分区控制台和集群切换脚本,执行:按照集群切换标准流程获取资源;降低非核心业务的服务等级或者服务范围;将非核心业务生产机的处理资源重新分配给核心业务热备份机,由核心业务热备份机接管核心业务。其中,还可包括如下的处理:判断非核心业务生产机的处理资源是否成功地被重新分配给核心业务热备份机,如果重新分配成功,则核心业务热备份机以高配置模式接管核心业务,如果重新分配失败,则核心业务热备份机以低配置模式接管核心业务。 
应用实例 
人口众多的大型城市的医保系统的核心关键业务,就是7*24小时运行的医疗费用实时结算系统。由于行业自身的特殊性,这一核心关键业务直接关系到广大群众的“治病救命”,必须连续不停机地提供服务,对系统的可靠性与可用性要求极高。一旦中心出现系统故障导致业务中断,将对全市的正常医疗业务操作带来严重后果,直接影响到全市数百万参保人的就医、购药,可谓“性命交关”,社会影响巨大。而且,作为大型城市中的医疗保障关键系统,其高峰业务量甚至远远超过了银行、证券所的交易业务,可靠性、性能要求也是有过之而无不及。 
为了加强医保费用的审核管理,提高医保综合分析能力,更好地为广 大参保人员服务,为政府部门提供决策依据,可以将核心交易业务以外的个人帐户管理系统、事务管理系统、医保服务点管理系统、统计查询系统、审核结算管理系统、监督审核管理系统、保障卡交换系统、医保政府网站、前置机明细上传处理系统等其他10多个业务系统都归并至一个统一、集中的大业务平台上,并建立数据中心,实现数据的共享,在此基础上再通过数据抽取与挖掘建立数据仓库,提供决策支持服务。由于数据量大,业务繁多,这就对大集中平台的数据库服务器提出了很高的性能要求;当然,与核心交易业务相比,这些业务的实时性要求相对就没有如此之高了。 
根据以上的业务需求,按照传统模式,至少要配置三台高性能的服务器,参考图6A所示。两台服务器602a和602b分别作为核心交易业务的生产机与备份机,组成双机热备集群,保证核心实时费用结算业务的可靠性与处理性能。另外一台服务器602c则作为大集中平台的数据库服务器,专门处理非核心业务。 
如果在在医保系统中应用本发明的动态服务器集群,可以参考图4所示结构模式,并且在其中将核心业务定义为医保系统的实时费用结算和交易业务;将非核心业务定义为医保系统的个人帐户管理业务、事务管理业务、医保服务点管理业务、统计查询业务、审核结算管理业务、监督审核管理业务、保障卡交换业务、医保政府网站业务、前置机明细上传处理业务。 
具体结构如图6B所示,只需要配置两台高性能的服务器。其中一台服务器604仍然作为核心交易业务的生产机,而另一台服务器606则通过分区技术划分为两个“逻辑服务器”:该服务器的主体部分构成业务分区606a,作为大集中平台的数据库服务器,平时占用了该服务器606的大部分(CPU与内存)资源,为非核心业务提供海量数据的高效访问服务;该服务器606的剩余部分构成备份分区606b,作为核心交易业务的备份机,平时只占用最少的资源,与核心业务生产机604组成热备集群系统。而利用分区功能的动态分区技术,一旦核心交易业务的生产机604出现故障,将降低实时性要求相对不高的非核心业务的服务等级,对第二台高性能服务器606进行分区动态调整,将原业务分区606a的大部分资源(包括CPU、 内存等)划给原来的备份分区606b,再由备份分区606b接管核心实时费用结算服务,确保核心交易业务的处理性能和连续性。 
这样,在充分保证核心交易业务不受影响、非核心业务较少影响的前提下,节约了一台高性能服务器(约为500万人民币)的投资,大大提高了设备的利用率。 
综合而言,采用本发明的技术方案,该动态服务器集群中平时核心关键业务与非核心业务使用了各台服务器的绝大部分资源,几乎未造成资源浪费。而一旦核心关键业务的生产机出现硬件故障,又可以以一台资源配置一致的备份机来接管,充分保障了核心关键业务的服务水平和业务连续性。

Claims (16)

1.一种动态服务器集群,其特征在于,
包括:
第一类型服务器,用于第一类型业务;
第二类型服务器,采用服务器分区技术分成一个以上的分区,所述分区包括业务分区和备份分区;
其中,业务分区用于第二类型业务,该第一类型业务具有比第二类型业务高的优先级;备份分区为用于第一类型业务的第一类型服务器的备份机;
第二类型服务器大于等于第一类型服务器所具有的处理资源,当第一类型服务器正常工作时,业务分区占有第二类型服务器大多数的处理资源,备份分区只占用足够构成第一类型服务器的备份机的资源,当第一类型的服务器发生故障时,备份分区被分配足够的资源并接管第一类型的业务,业务分区只占用剩余的资源用于第二类型的业务;
还包括:
切换模块,当一第一类型服务器发生故障时,切换模块使对应的第二类型服务器中的备份分区从业务分区获取足够的处理资源并接管该第一类型服务器的第一类型业务;
该切换模块还将失去处理资源的业务分区对应的第二类型业务的服务等级或服务范围降低。
2.如权利要求1所述的动态服务器集群,其特征在于,
所述动态服务器集群具有至少一个第一类型服务器,
所述第二类型服务器上具有与第一类型服务器数量相等的备份分区,分别对应一个第一类型服务器。
3.如权利要求1所述的动态服务器集群,其特征在于,
所述动态服务器集群具有至少一个第一类型服务器,
所述动态服务器集群具有与第一类型服务器数量相等的第二类型服务器,每个第二类型服务器上具有一个备份分区,对应一个第一类型服务器。
4.如权利要求1所述的动态服务器集群,其特征在于,包括
一个第一类型服务器,为核心业务生产机,用于第一类型业务,该第一类型业务为核心业务;
一个第二类型服务器,采用服务器分区技术分为一个业务分区和一个备份分区,该业务分区为非核心业务生产机,该备份分区为核心业务热备份机。
5.如权利要求4所述的动态服务器集群,其特征在于,在所述第一类型服务器和第二类型服务器上包括:
配置集群软件,使得该核心业务生产机和该核心业务热备份机构成双机热备系统;
分区控制台,获取执行分区动态资源调整命令的权限;
集群切换脚本,增加分区动态资源调整的子任务。
6.如权利要求5所述的动态服务器集群,其特征在于,
所述配置集群软件、分区控制台和集群切换脚本在核心业务生产机发生故障时,降低非核心业务的服务等级或者服务范围,将非核心业务生产机的处理资源重新分配给核心业务热备份机,由核心业务热备份机接管核心业务。
7.如权利要求6所述的动态服务器集群,其特征在于,还包括
资源分配判断装置,判断非核心业务生产机的处理资源是否成功地被重新分配给核心业务热备份机,如果重新分配成功,则核心业务热备份机以高配置模式接管核心业务,如果重新分配失败,则核心业务热备份机以低配置模式接管核心业务。
8.如权利要求7所述的动态服务器集群,其特征在于,
所述核心业务包括医保系统的实时费用结算和交易业务;
所述非核心业务包括医保系统的个人帐户管理业务、事务管理业务、医保服务点管理业务、统计查询业务、审核结算管理业务、监督审核管理业务、保障卡交换业务、医保政府网站业务、前置机明细上传处理业务。
9.一种动态服务器集群的控制方法,其特征在于,包括:
配置第一类型服务器用于第一类型业务;
配置第二类型服务器,采用服务器分区技术将第二类型服务器分成一个以上的分区,所述分区包括业务分区和备份分区,其中该第二类型服务器大于等于第一类型服务器所具有的处理资源;
配置该业务分区用于第二类型业务,该第一类型业务具有比第二类型业务高的优先级;
配置备份分区为用于第一类型业务的第一类型服务器的备份机;
当第一类型服务器正常工作时,配置该业务分区占有第二类型服务器大多数的处理资源,备份分区只占用足够构成第一类型服务器的备份机的资源;
当第一类型的服务器发生故障时,分配给备份分区足够的资源并接管第一类型的业务,分配给业务分区剩余的资源用于第二类型的业务;
当一第一类型服务器发生故障时,使对应的第二类型服务器中的备份分区从业务分区获取足够的处理资源并接管该第一类型服务器的第一类型业务;
将失去处理资源的业务分区对应的第二类型业务的服务等级或服务范围降低。
10.如权利要求9所述的动态服务器集群的控制方法,其特征在于,
为该动态服务器集群配置至少一个第一类型服务器,
在该第二类型服务器上配置与第一类型服务器数量相等的备份分区,分别对应一个第一类型服务器。
11.如权利要求9所述的动态服务器集群的控制方法,其特征在于,
为该动态服务器集群配置至少一个第一类型服务器,
为该动态服务器集群配置与第一类型服务器数量相等的第二类型服务器,每个第二类型服务器上具有一个备份分区,对应一个第一类型服务器。
12.如权利要求9所述的动态服务器集群的控制方法,其特征在于,包括:
配置一个第一类型服务器,为核心业务生产机,用于第一类型业务,该第一类型业务为核心业务;
配置一个第二类型服务器,采用服务器分区技术分为一个业务分区和一个备份分区,该业务分区为非核心业务生产机,该备份分区为核心业务热备份机。
13.如权利要求12所述的动态服务器集群的控制方法,其特征在于,还包括:
在所述第一类型服务器和第二类型服务器上设置配置集群软件,使得该核心业务生产机和该核心业务热备份机构成双机热备系统;
在所述第一类型服务器和第二类型服务器上设置分区控制台,获取执行分区动态资源调整命令的权限;
在所述第一类型服务器和第二类型服务器上设置集群切换脚本,增加分区动态资源调整的子任务。
14.如权利要求13所述的动态服务器集群的控制方法,其特征在于,还包括,所述配置集群软件、分区控制台和集群切换脚本在核心业务生产机发生故障时,执行:
降低非核心业务的服务等级或者服务范围;
将非核心业务生产机的处理资源重新分配给核心业务热备份机,由核心业务热备份机接管核心业务。
15.如权利要求14所述的动态服务器集群的控制方法,其特征在于,还包括:
判断非核心业务生产机的处理资源是否成功地被重新分配给核心业务热备份机,如果重新分配成功,则核心业务热备份机以高配置模式接管核心业务,如果重新分配失败,则核心业务热备份机以低配置模式接管核心业务。
16.如权利要求15所述的动态服务器集群的控制方法,其特征在于,
所述核心业务包括医保系统的实时费用结算和交易业务;
所述非核心业务包括医保系统的个人帐户管理业务、事务管理业务、医保服务点管理业务、统计查询业务、审核结算管理业务、监督审核管理业务、保障卡交换业务、医保政府网站业务、前置机明细上传处理业务。
CN2007100365180A 2007-01-17 2007-01-17 动态服务器集群及其控制方法 Active CN101227315B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2007100365180A CN101227315B (zh) 2007-01-17 2007-01-17 动态服务器集群及其控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2007100365180A CN101227315B (zh) 2007-01-17 2007-01-17 动态服务器集群及其控制方法

Publications (2)

Publication Number Publication Date
CN101227315A CN101227315A (zh) 2008-07-23
CN101227315B true CN101227315B (zh) 2011-04-20

Family

ID=39859084

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2007100365180A Active CN101227315B (zh) 2007-01-17 2007-01-17 动态服务器集群及其控制方法

Country Status (1)

Country Link
CN (1) CN101227315B (zh)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101686118B (zh) * 2008-09-27 2016-03-23 中国银联股份有限公司 一种交换业务系统及其工作方法
CN102340525A (zh) * 2010-07-14 2012-02-01 美得康科技股份有限公司 医疗数据备援系统与备援及负载平衡方法
CN101989903B (zh) * 2010-12-03 2013-03-13 国电南瑞科技股份有限公司 综合监控前置通信控制器双机冗余按口切换方法
CN103384882A (zh) * 2011-05-30 2013-11-06 惠普发展公司,有限责任合伙企业 在服务器的共享组中管理使用权的方法
CN102843418B (zh) * 2012-07-03 2016-01-20 广东电网公司信息中心 一种资源调度系统
CN103580902B (zh) 2012-08-07 2015-01-14 腾讯科技(深圳)有限公司 一种计算机信息系统及其动态容灾方法
CN104426968B (zh) * 2013-08-30 2019-05-24 腾讯科技(深圳)有限公司 数据管理方法和装置
CN104426699B (zh) * 2013-08-30 2017-11-28 华为技术有限公司 通信方法、服务器及通信系统
CN103560907A (zh) * 2013-10-23 2014-02-05 曙光信息产业(北京)有限公司 双机负载均衡设备的管理方法和装置
CN104598524A (zh) * 2014-12-23 2015-05-06 苏州博远容天信息科技有限公司 Sql server数据库集群多实例内存管理及分配方法
US9959332B2 (en) * 2015-01-21 2018-05-01 Futurewei Technologies, Inc. System and method for massively parallel processor database
CN106357703B (zh) 2015-07-13 2020-03-10 阿里巴巴集团控股有限公司 集群切换方法与设备
CN105487946B (zh) * 2015-11-30 2019-03-12 北京四达时代软件技术股份有限公司 一种故障计算机自动切换方法及装置
CN106203865A (zh) * 2016-07-18 2016-12-07 浪潮软件集团有限公司 一种大厅管理系统及方法
CN107046584B (zh) * 2017-03-15 2020-08-14 中国互联网络信息中心 一种整体协同调度的dns服务部署方法和系统
CN110457138A (zh) * 2019-08-20 2019-11-15 网易(杭州)网络有限公司 游戏服务器集群的管理方法、装置及电子设备
CN111242509B (zh) * 2020-02-18 2023-09-19 南京东顶科技集团有限公司 一种用于智慧社区的服务管理系统及其服务管理方法
CN111641716B (zh) * 2020-06-01 2023-05-02 第四范式(北京)技术有限公司 参数服务器的自愈方法、参数服务器及参数服务系统
CN112383435B (zh) * 2020-11-17 2022-03-29 珠海大横琴科技发展有限公司 一种故障处理的方法和装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1302022A (zh) * 1999-12-29 2001-07-04 上海龙林通讯技术开发有限公司 Ip网络设备的热备份方法
CN1892612A (zh) * 2005-06-28 2007-01-10 国际商业机器公司 集群可用性管理方法和系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1302022A (zh) * 1999-12-29 2001-07-04 上海龙林通讯技术开发有限公司 Ip网络设备的热备份方法
CN1892612A (zh) * 2005-06-28 2007-01-10 国际商业机器公司 集群可用性管理方法和系统

Also Published As

Publication number Publication date
CN101227315A (zh) 2008-07-23

Similar Documents

Publication Publication Date Title
CN101227315B (zh) 动态服务器集群及其控制方法
EP3487149B1 (en) Data shard storage method, device and system
US5555404A (en) Continuously available database server having multiple groups of nodes with minimum intersecting sets of database fragment replicas
US8370833B2 (en) Method and system for implementing a virtual storage pool in a virtual environment
US7490205B2 (en) Method for providing a triad copy of storage data
JP5102901B2 (ja) データセンタにわたる複数データサーバ間のデータ完全性を保持する方法およびシステム
CN100478894C (zh) 集群代码管理的方法和系统
US9280428B2 (en) Method for designing a hyper-visor cluster that does not require a shared storage device
EP2643771B1 (en) Real time database system
CN110727709A (zh) 一种集群数据库系统
CN102938705B (zh) 一种高可用多机备份路由表管理与切换方法
US7730057B2 (en) Computer data systems implemented using a virtual solution architecture
CN111045602B (zh) 集群系统控制方法及集群系统
CN110912991A (zh) 一种基于超融合双节点高可用的实现方法
CN103124299A (zh) 一种异构环境下的分布式块级别存储系统
US11262918B1 (en) Data storage system with uneven drive wear reduction
CN104486131B (zh) 一种基于安腾平台的db2数据库的故障检测和切换方法
CN107291821A (zh) 一种同城双活架构快速切换的方法
CN114143175B (zh) 主备集群实现方法及系统
CN106844052A (zh) 一种基于Windows Server构建融合集群的方法及装置
CN113626252A (zh) 一种基于集群的城市级容灾方法、装置、电子设备及介质
CN104503871A (zh) 一种基于小型机系统全冗余模型的实现方法
CN208820800U (zh) 一种基于核心业务灾备的95598异地双活系统
US10691564B2 (en) Storage system and storage control method
CN112667440A (zh) 一种高可用MySQL的异地灾备方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: SHANGHAI MUNICIPAL MEDICAL INSURANCE MANAGEMENT CE

Free format text: FORMER OWNER: SHANGHAI MEDICARE INSURANCE INFORMATION CENTER

Effective date: 20120612

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20120612

Address after: 200040 No. 805, Kangding Road, Shanghai, Jingan District

Co-patentee after: Wanda Information Co., Ltd.

Patentee after: Shanghai medical insurance management center

Address before: 200040 No. 805, Kangding Road, Shanghai, Jingan District

Co-patentee before: Wanda Information Co., Ltd.

Patentee before: Shanghai Medicare Insurance Information Center

CP01 Change in the name or title of a patent holder

Address after: 200040 No. 805, Kangding Road, Shanghai, Jingan District

Co-patentee after: Wanda Information Co., Ltd.

Patentee after: Shanghai Medical Insurance Management Center

Address before: 200040 No. 805, Kangding Road, Shanghai, Jingan District

Co-patentee before: Wanda Information Co., Ltd.

Patentee before: Shanghai Medical Insurance Management Center

CP01 Change in the name or title of a patent holder