CN116545845B - 生产服务器冗余备份装置、系统及方法 - Google Patents
生产服务器冗余备份装置、系统及方法 Download PDFInfo
- Publication number
- CN116545845B CN116545845B CN202310808675.8A CN202310808675A CN116545845B CN 116545845 B CN116545845 B CN 116545845B CN 202310808675 A CN202310808675 A CN 202310808675A CN 116545845 B CN116545845 B CN 116545845B
- Authority
- CN
- China
- Prior art keywords
- server
- production
- backup
- redundancy
- service
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004519 manufacturing process Methods 0.000 title claims abstract description 236
- 238000002360 preparation method Methods 0.000 claims abstract description 31
- 238000003860 storage Methods 0.000 claims abstract description 28
- 238000000034 method Methods 0.000 claims abstract description 19
- 238000007726 management method Methods 0.000 claims description 74
- 230000036316 preload Effects 0.000 claims description 46
- 230000004044 response Effects 0.000 claims description 24
- 238000012544 monitoring process Methods 0.000 claims description 18
- 238000013500 data storage Methods 0.000 claims description 11
- 238000002347 injection Methods 0.000 claims description 6
- 239000007924 injection Substances 0.000 claims description 6
- 239000004973 liquid crystal related substance Substances 0.000 claims description 6
- 230000001960 triggered effect Effects 0.000 claims description 5
- 238000001514 detection method Methods 0.000 claims description 3
- 238000009434 installation Methods 0.000 claims description 3
- 238000004883 computer application Methods 0.000 abstract description 2
- 230000006870 function Effects 0.000 abstract description 2
- 239000000243 solution Substances 0.000 description 12
- 238000012545 processing Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 5
- 230000001502 supplementing effect Effects 0.000 description 5
- 238000012423 maintenance Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000013508 migration Methods 0.000 description 2
- 230000005012 migration Effects 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 239000000725 suspension Substances 0.000 description 2
- 208000003035 Pierre Robin syndrome Diseases 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003032 molecular docking Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000008569 process Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0654—Management of faults, events, alarms or notifications using network fault recovery
- H04L41/0668—Management of faults, events, alarms or notifications using network fault recovery by dynamic selection of recovery network elements, e.g. replacement by the most appropriate element after failure
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L49/00—Packet switching elements
- H04L49/10—Packet switching elements characterised by the switching fabric construction
- H04L49/111—Switch interfaces, e.g. port details
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/1095—Replication or mirroring of data, e.g. scheduling or transport for data synchronisation between network nodes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/12—Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/2866—Architectures; Arrangements
- H04L67/30—Profiles
Abstract
本发明提供了生产服务器冗余备份装置、系统及方法,涉及计算机应用技术领域。本发明针对机房中部署有不同工作环境的生产冗余服务器,提供N+1+1式的生产服务器冗余模式,该方案针对N台生产服务器设置一个冗余设备服务器和一个备份管理服务器;通过备份管理服务器对生产服务器组的业务存储盘组、交换机单元和系统相关数据进行管理,通过冗余设备服务器提供冗余硬件资源;实现了快照备份、生产替换、轮值生产、预备冗余等功能,并且仅需添加较少的设备便能实现全自动生产服务器冗余;因此,本发明具备很好地实用与推广价值。
Description
技术领域
本发明涉及计算机应用技术领域,尤其涉及生产服务器冗余备份装置、系统及方法。
背景技术
随着科技的进步和时代的发展,对于信息数据提出了高可用要求,产生了大量保障数据安全的技术;在一些业务场景下,如:政府财政业务处理、个人社保业务处理、医疗病历业务处理等,这些业务场景通常采用具备高安全等级的数据存储系统,生产服务器的挂起、更新、故障等事件发生时,通常不会影响后端数据的安全性。
生产服务器,即指具体投入使用的服务器;虽然这些业务场景对生产服务器的处理能力要求不高,但是在挂起、更新、故障等事件发生时,会影响业务响应及服务情况,也就是我们在相关门户网站经常感受到的卡顿、崩溃、维护等情况;若无法及时处理,则会出现响应业务慢、中断服务长等问题。为了解决生产服务器端的业务连续性问题,现有技术提出了冷备、双机热备和多点集群等方案,但都存在不同的应用问题。
为此,申请号为:CN201210002187.X的发明申请提供了生产服务器冗余备份方法及系统,该申请将多个操作系统相同的生产服务器组成生产服务器组;为生产服务器组配置一个备用服务器;在备份服务器的本地硬盘上安装与生产服务器相同的操作系统和相同的环境配置数据;使每个生产服务器通过光纤交换机与集中存储设备中的对应的一个集中存储盘组相连接,并调用集中存储盘组中存储的数据库、中间件、应用软件和业务数据。
但是,在实际使用中,生产服务器会因为所提供的业务服务不同,采用不同的操作系统、不同的配置环境等;并且很多业务相关的数据是具备敏感性,无法进行数据共享互联;故该方案存在业务场景局限影响实用性、多业务混杂影响安全性、冗余接线复杂影响部署使用等问题。
因此,有必要提供生产服务器冗余备份装置、系统及方法来解决上述技术问题。
发明内容
为解决上述技术问题,本发明提供的生产服务器冗余备份的系统,包括生产服务器组、冗余设备服务器、备份管理服务器、交换机单元和业务存储盘组;
生产服务器组:包括N台生产服务器,并通过业务链路连接各生产服务器;用户根据业务需求提交业务清单,生产服务器组解析业务清单,并将各项业务请求通过业务链路发送至对应生产服务器;
生产服务器:用于响应专项业务请求,并根据响应业务部署对应的操作系统、环境配置和挂盘模式;其中,操作系统为RAMOS系统,挂盘模式包括:有挂盘/无挂盘;
冗余设备服务器:用于向生产服务器组提供设备冗余,并根据冗余模式设置对应预载模式,其中,预载模式包括:有预载系统/无预载系统,挂盘模式为:无挂盘;
业务存储盘组:包括N个数据存储系统,各数据存储系统分别部署在对应的业务存储盘上且互相独立;设置N个数据响应接口,并在验证访问者注册信息后,连接至对应的数据存储系统上;
备份管理服务器:用于对生产服务器组进行快照备份操作、数据写入操作和链路管理操作;其中,快照备份操作的实施对象包括:注册信息、环境配置和操作系统;数据写入操作包括:RAMOS系统写入、环境配置写入和注册信息写入;链路管理操作:对链路结构进行描述和管理,管理包括对各链路进行启用/关闭/切换操作;
交换机单元:受控于备份管理服务器,设置1个管理端口与备份管理服务器连接,组成管理链路;设置N个业务端口连接生产服务器组,组成对应的数据请求链路;设置N个业务端口连接业务存储盘组,组成对应的数据响应链路;设置1个业务端口与冗余设备服务器连接,组成数据冗余链路;其中,各数据请求链路和数据响应链路以1to1模式进行关联,得到数据链路。
作为更进一步的解决方案,各生产服务器根据响应业务需求,判断是否需要存储本地服务数据;若需要,则在生产服务器本地设置下挂硬盘,并设置挂盘模式为:有挂盘;否则,不设置下挂硬盘,并设置挂盘模式为:无挂盘;其中,在挂盘模式为:有挂盘时,备份管理服务器还对盘符及文件路径进行备份;下挂硬盘通过集中下挂盘组或独立下挂硬盘进行设置。
生产服务器冗余备份的方法,运用在如上任一项所述的生产服务器冗余备份的系统中;其中,快照备份操作包括备份操作和快照操作;
在搭建生产服务器组时,进行备份操作:
各生产服务器装载原生RAMOS系统,并通过备份管理服务器进行操作系统备份;
各生产服务器装载对应的环境配置,并通过备份管理服务器进行环境配置备份;
各生产服务器装载对应的注册信息,并通过备份管理服务器进行注册信息备份;
在设定时间/条件触发时,进行快照操作:
通过备份管理服务器对各生产服务器的RAMOS系统进行快照,并保存系统快照数据;
通过备份管理服务器对各生产服务器环境配置列表进行快照,并保存配置更新程序;
通过备份管理服务器对各生产服务器注册信息文件进行快照,并保存注册新增文件。
作为更进一步的解决方案,备份管理服务器通过执行生产替换步骤,使冗余设备服务器替换生产服务器进行专项业务请求响应,生产替换步骤具体包括:
步骤A1:判断预载模式,若为有预载系统,执行步骤A6;若无预载系统,执行步骤A2;
步骤A2:查询并获取待替换生产服务器对应的备份文件;
其中,备份文件包括:操作系统文件、环境配置文件、注册信息文件和链路结构文件;
步骤A3:通过PXE启动冗余设备服务器进入BIOS,并引导操作系统文件装载至RAM中;
步骤A4:启动系统并执行自动安装脚本,引导注入环境配置文件和注册信息文件;
步骤A5:通过系统快照数据、配置更新程序和注册新增文件对冗余设备服务器RAM中的操作系统进行快照同步;
步骤A6:对链路结构文件进行解析,得到业务链路描述文件和数据链路描述文件;
步骤A7:解析链路描述文件中的描述项,并将待替换生产服务器和冗余设备服务器进行描述项互换,完成所有互换后,对业务链路描述文件和数据链路描述文件进行更新;
步骤A8:将更新后的业务链路描述文件输入至生产服务器组,重构业务链路结构;将数据链路描述文件输入至交换机单元,重构数据链路结构;
步骤A9:启用数据冗余链路,通过重构后的业务链路和数据链路使冗余设备服务器加入至生产服务器组,并替换原生产服务器进行专项业务请求响应;
步骤A10:关闭被替换服务器的业务链路和数据链路,得到待检服务器,完成生产替换。
作为更进一步的解决方案,冗余模式包括:轮值冗余、预备冗余和故障冗余;其中,
轮值冗余:预载模式为有预载系统,设置轮值条件并在触发时,执行轮值冗余步骤;
预备冗余:预载模式为有预载系统,设置预备条件并在触发时,执行预备冗余步骤;
故障冗余:预载模式为无预载系统,在生产服务器发生故障时,执行生产替换步骤。
作为更进一步的解决方案,设置轮值条件包括:轮值序列和轮值触发条件;轮值序列:用于描述各生产服务器和冗余设备服务器之间的轮值生产顺序;轮值触发条件:包括时间触发条件和事件触发条件;其中,轮值冗余步骤具体为:
步骤B1:进入轮值冗余模式,为各生产服务器分配与轮值生产顺序对应的序号,得到轮值序列;
步骤B2:读取轮值序列的首项,查询首项对应的生产服务器,得到待替换生产服务器;
步骤B3:执行步骤A2至步骤A6,将系统预载至冗余设备服务器的RAM中;
步骤B4:将预载模式设置为:有预载系统;
步骤B5:持续监测轮值触发条件,并在触发时执行生产替换步骤;
步骤B6:对待检服务器进行检测,并将通过检测的服务器设置为冗余设备服务器;
步骤B7:通过循环模式对轮值序列进行更新,轮值序列各项向前移动一位;
步骤B8:返回步骤B2,直至轮值冗余模式变更或停止。
作为更进一步的解决方案,设置预备条件包括:监测参数、预备阈值和触发阈值;监测参数:服务器温度、服务器载荷和/或服务器生产时长;预备阈值:在监测参数达到时,执行预备冗余步骤;触发阈值:高于预备阈值,并在监测参数达到时,执行生产替换步骤;其中,预备冗余步骤具体为:
步骤C1:进入预备冗余模式,读取预备阈值和触发阈值;
步骤C2:持续对各生产服务器的监测参数,并与预备阈值和触发阈值进行比较:
触发1:当监测参数小于预备阈值时,则返回步骤C1;
触发2:当监测参数不小于触发阈值时,则进行生产替换步骤;
触发3:当监测参数不小于预备阈值,且小于触发阈值时,则进行下一步;
步骤C3:获取触发3的生产服务器,得到待替换生产服务器;
步骤C4:执行步骤A2至步骤A6,将系统预载至冗余设备服务器的RAM中;
步骤C5:将预载模式设置为:有预载系统;
步骤C6:返回步骤C2,直至预备冗余模式变更或停止。
作为更进一步的解决方案,在生产替换步骤后,若被替换服务器有下挂的硬盘;则将被替换服务器进行挂盘卸载,得到下挂硬盘并将挂盘模式调整为:无挂盘;将新生产服务器进行挂盘装载,下挂硬盘装载完成后,新生产服务器执行硬盘唤醒并将挂盘模式调整为:有挂盘。
生产服务器冗余备份的装置,运用在如上任一项所述的生产服务器冗余备份的系统中,将备份文件冷备存储至外部存储介质中;并在备份管理服务器无法进行时,手动将冷备的备份文件注入至生产服务器组和交换机单元中;在进行备份文件注入前,还通过计算备份文件哈希值,验证备份文件是否被篡改。
与相关技术相比较,本发明提供的生产服务器冗余备份装置、系统及方法具有如下有益效果:
本发明针对机房中部署有不同工作环境的生产冗余服务器,提供N+1+1式的生产服务器冗余模式,该方案针对N台生产服务器设置一个冗余设备服务器和一个备份管理服务器;通过备份管理服务器对生产服务器组的业务存储盘组、交换机单元和系统相关数据进行管理,通过冗余设备服务器提供冗余硬件资源;实现了快照备份、生产替换、轮值生产、预备冗余等功能,并且仅需添加较少的设备便能实现全自动生产服务器冗余;因此,本发明具备很好地实用与推广价值。
附图说明
图1为本发明实施例提供的生产服务器冗余备份的系统结构示意图;
图2为本发明实施例提供的生产服务器冗余备份的系统流程示意图;
图3为本发明实施例提供的生产服务器冗余备份的轮值生产准备示意图;
图4为本发明实施例提供的生产服务器冗余备份的轮值条件触发示意图;
图5为本发明实施例提供的生产服务器冗余备份的轮值序列更新示意图。
具体实施方式
下面结合附图和实施方式对本发明作进一步说明。
如图1所示,本实施例提供的生产服务器冗余备份的系统,包括生产服务器组、冗余设备服务器、备份管理服务器、交换机单元和业务存储盘组;
生产服务器组:包括N台生产服务器,并通过业务链路连接各生产服务器;用户根据业务需求提交业务清单,生产服务器组解析业务清单,并将各项业务请求通过业务链路发送至对应生产服务器;
生产服务器:用于响应专项业务请求,并根据响应业务部署对应的操作系统、环境配置和挂盘模式;其中,操作系统为RAMOS系统,挂盘模式包括:有挂盘/无挂盘;
补充:生产服务器上的业务数据主要存储在业务存储盘组中,并且RAMOS系统为内存RAM内运行,启动后不依赖硬盘的系统;因此仅需业务存储盘组就能进行业务相关的数据处理操作,可以脱离本地的挂盘运行,也可以在本地添加挂盘来存储一些本地数据。
此外,生产服务器仅能对某一个专项的任务请求进行处理,通过多个生产服务器得到一个服务组;用户仅需针对服务组仅需各项业务请求,生产服务器组将业务请求分解为一个或者多个专项业务请求,并通过对应生产服务器提供专项业务请求的响应。(如:社保信息查询、医疗信息查询和银行流水查询分别由三台生产服务器提供,但是对外作为一个整体,向用户提供医保报销信息查询一条龙服务),从而在用户的视角里所有服务都是集成在一起的,但是在内部却保持各专项服务的独立性。
冗余设备服务器:用于向生产服务器组提供设备冗余,并根据冗余模式设置对应预载模式,其中,预载模式包括:有预载系统/无预载系统,挂盘模式为:无挂盘;
补充:挂盘模式为无挂盘主要是方便将生产冗余服务器的挂盘快速替换到冗余设备服务器上;并且在有预载系统时,由于预载系统也是RAMOS系统,因此不需要设置本地挂盘,方便对接和节省数据迁移时间与成本。
业务存储盘组:包括N个数据存储系统,各数据存储系统分别部署在对应的业务存储盘上且互相独立;设置N个数据响应接口,并在验证访问者注册信息后,连接至对应的数据存储系统上;
补充:设置业务存储盘组的目的是方便进行生产服务器切换的同时,还能保证各业务存储盘之间的相互独立和数据安全。
备份管理服务器:用于对生产服务器组进行快照备份操作、数据写入操作和链路管理操作;其中,快照备份操作的实施对象包括:注册信息、环境配置和操作系统;数据写入操作包括:RAMOS系统写入、环境配置写入和注册信息写入;链路管理操作:对链路结构进行描述和管理,管理包括对各链路进行启用/关闭/切换操作;
补充:备份管理服务器主要是在不需要进行冗余替换时进行快照备份操作,在需要进行冗余替换时,则对冗余设备服务器进行数据写入操作,完成对业务运行环境的配置;再通过链路管理操作将冗余设备服务器切换至生产服务器的各工作链路上,完成对冗余替换快速自动执行,不需要人工干涉。
交换机单元:受控于备份管理服务器,设置1个管理端口与备份管理服务器连接,组成管理链路;设置N个业务端口连接生产服务器组,组成对应的数据请求链路;设置N个业务端口连接业务存储盘组,组成对应的数据响应链路;设置1个业务端口与冗余设备服务器连接,组成数据冗余链路;其中,各数据请求链路和数据响应链路以1to1模式进行关联,得到数据链路。
补充:交换机单元主要是用于各链路的管理对接,由于本实施例旨在对地方政府、各级医院等业务场景提供冗余替换服务,因此需要保证生产服务器和对应业务硬盘严格一一对应,因此,各数据请求链路和数据响应链路以1to1模式进行关联,在替换时,备份管理服务器只能关联到被替换生产服务器的各链路上,通过交换机单元能使备份管理服务器对各链路进行远程配置,方便快捷安全。
需要说明的是:在地方政府、各级医院等业务场景下,由于其并发用户量小但服务独立性高,因此,专用机房对不同业务场景进行集中运维,专用机房通常由一台或两台服务器提供一项业务服务,多台服务器提供不同的业务服务链,从而保证各服务的独立性和服务链的完整性;如:患者的医保报销和政府医保的财政统筹,就需要协同政府财政业务处理、个人社保业务处理、医疗病例业务处理等多方数据服务。
这些业务场景通常采用独立的、高安全等级的数据存储系统;其运行的环境、相关配置设置是操作系统都存在区别,通常不进行交叉混用,而是通过专用服务器进行部署;但是,机房中同时支持不同环境的服务器,这也给机房维护带来了困难。
传统的N+1式的生产服务器冗余模式是设置N台生产服务器和一台冗余服务器,在生产服务器发生故障时,通过冗余服务器对其进行快速替换恢复;但是该方案需求N台服务器的工作环境相同,否则无法进行冗余替换;现有的1+1式的生产服务器冗余模式是针对一台生产服务器和设置一台冗余服务器,冗余服务器仅针对生产服务器进行冗余替换,能很好地适应不同的工作环境。该方法运用在大型机房中,但是在各地政府机构、医院等场景下无法都能提供如此优渥的硬件条件。
为此,本实施例针对机房中部署有不同工作环境的生产冗余服务器,提供N+1+1式的生产服务器冗余模式,该方案针对N台生产服务器设置一个冗余设备服务器和一个备份管理服务器;通过备份管理服务器对生产服务器组的业务存储盘组、交换机单元和系统相关数据进行管理,通过冗余设备服务器提供冗余硬件资源。
如图1所示,在一个具体的实施例中,包括三台生产服务器分别向用户提供业务A、业务B和业务C;正常运行时,各生产服务器分别将快照备份数据传递给备份管理服务器,并通过对应的业务存储盘获取对应的业务数据,其能正常满足请求清单的业务请求且互不干扰。
如图2所示,在一个具体的实施例中,当提供业务A的生产服务器A发生故障时,备份管理服务器获取生产服务器故障信息,并对生产服务器A的快照备份文件进行查询,并写入至冗余设备服务器中,并将生产服务器A在交换机单元上的各链路关联至冗余设备服务器;若是生产服务器A本地有挂盘,则还将挂盘卸载后装载至冗余设备服务器上。完成上述操作后,将冗余设备服务器上线生产,原生产服务器A下线检修,在检修完毕后将原生产服务器A作为新一轮冗余设备服务器进行使用。由于使用的是RAM系统,因此,该系统严格与原始存储在备份管理服务器中的RAMOS系统相对应,所以仅需写入对应RAMOS系统,便能完美支持对应的业务运行环境,且断电即卸载不会存在系统内文件硬盘泄露问题,并且运行速度更快,载入恢复数据更迅速。
作为更进一步的解决方案,各生产服务器根据响应业务需求,判断是否需要存储本地服务数据;若需要,则在生产服务器本地设置下挂硬盘,并设置挂盘模式为:有挂盘;否则,不设置下挂硬盘,并设置挂盘模式为:无挂盘;其中,在挂盘模式为:有挂盘时,备份管理服务器还对盘符及文件路径进行备份;下挂硬盘通过集中下挂盘组或独立下挂硬盘进行设置。
需要说明的是:是否具备硬盘对于本实施例来说已经不是重点,若是轻量级服务,则完全可以省去硬盘部署维护成本,并且若是有下挂硬盘,由于重装系统不对硬盘进行操作,还省去了硬盘数据迁移的时间。
生产服务器冗余备份的方法,运用在如上任一项所述的生产服务器冗余备份的系统中;其中,快照备份操作包括备份操作和快照操作;
在搭建生产服务器组时,进行备份操作:
各生产服务器装载原生RAMOS系统,并通过备份管理服务器进行操作系统备份;
各生产服务器装载对应的环境配置,并通过备份管理服务器进行环境配置备份;
各生产服务器装载对应的注册信息,并通过备份管理服务器进行注册信息备份;
在设定时间/条件触发时,进行快照操作:
通过备份管理服务器对各生产服务器的RAMOS系统进行快照,并保存系统快照数据;
通过备份管理服务器对各生产服务器环境配置列表进行快照,并保存配置更新程序;
通过备份管理服务器对各生产服务器注册信息文件进行快照,并保存注册新增文件。
需要说明的是:备份操作针对的是环境、操作系统、注册文件等基础类的数据;快照操作则是对生产服务器各时刻所处状态进行快照,在恢复时,首先进行备份恢复,再进行快照恢复,使冗余设备服务器能恢复至未发生故障前一时刻。
作为更进一步的解决方案,备份管理服务器通过执行生产替换步骤,使冗余设备服务器替换生产服务器进行专项业务请求响应,生产替换步骤具体包括:
步骤A1:判断预载模式,若为有预载系统,执行步骤A6;若无预载系统,执行步骤A2;
步骤A2:查询并获取待替换生产服务器对应的备份文件;
其中,备份文件包括:操作系统文件、环境配置文件、注册信息文件和链路结构文件;
步骤A3:通过PXE启动冗余设备服务器进入BIOS,并引导操作系统文件装载至RAM中;
步骤A4:启动系统并执行自动安装脚本,引导注入环境配置文件和注册信息文件;
步骤A5:通过系统快照数据、配置更新程序和注册新增文件对冗余设备服务器RAM中的操作系统进行快照同步;
步骤A6:对链路结构文件进行解析,得到业务链路描述文件和数据链路描述文件;
步骤A7:解析链路描述文件中的描述项,并将待替换生产服务器和冗余设备服务器进行描述项互换,完成所有互换后,对业务链路描述文件和数据链路描述文件进行更新;
步骤A8:将更新后的业务链路描述文件输入至生产服务器组,重构业务链路结构;将数据链路描述文件输入至交换机单元,重构数据链路结构;
步骤A9:启用数据冗余链路,通过重构后的业务链路和数据链路使冗余设备服务器加入至生产服务器组,并替换原生产服务器进行专项业务请求响应;
步骤A10:关闭被替换服务器的业务链路和数据链路,得到待检服务器,完成生产替换。
需要说明的是:利用RAMOS重启还原的特性,可以进行快照退档,重启生产服务器即可进行系统还原,能在错误添加系统快照数据、配置更新程序和注册新增文件、系统崩溃时进行快速恢复;此外,传统的硬盘系统很容易因为硬盘频繁读取发生故障而导致数据全盘丢失无法恢复,本实施例直接能通过备份管理服务器进行系统恢复,且业务数据存储在后端的业务存储盘组中,避免了本地存储业务数据存在的隐患。
作为更进一步的解决方案,冗余模式包括:轮值冗余、预备冗余和故障冗余;其中,
轮值冗余:预载模式为有预载系统,设置轮值条件并在触发时,执行轮值冗余步骤;
预备冗余:预载模式为有预载系统,设置预备条件并在触发时,执行预备冗余步骤;
故障冗余:预载模式为无预载系统,在生产服务器发生故障时,执行生产替换步骤。
需要说明的是:本实施例不仅能进行故障冗余,还能进行轮值冗余和预备冗余;其中,轮值冗余即:预先载入对应设备的系统,并在出发条件时更换生产服务器设备,以达到轮换生产延长使用寿命,无缝进行服务器维护的目的。预备冗余,则是警惕一些已经有故障倾向的生产服务器,提前载入对应的系统;在故障发生时,第一时间进行无缝生产切换,达到快速恢复业务的目的。
作为更进一步的解决方案,设置轮值条件包括:轮值序列和轮值触发条件;轮值序列:用于描述各生产服务器和冗余设备服务器之间的轮值生产顺序;轮值触发条件:包括时间触发条件和事件触发条件;其中,轮值冗余步骤具体为:
步骤B1:进入轮值冗余模式,为各生产服务器分配与轮值生产顺序对应的序号,得到轮值序列;
步骤B2:读取轮值序列的首项,查询首项对应的生产服务器,得到待替换生产服务器;
步骤B3:执行步骤A2至步骤A6,将系统预载至冗余设备服务器的RAM中;
步骤B4:将预载模式设置为:有预载系统;
步骤B5:持续监测轮值触发条件,并在触发时执行生产替换步骤;
步骤B6:对待检服务器进行检测,并将通过检测的服务器设置为冗余设备服务器;
步骤B7:通过循环模式对轮值序列进行更新,轮值序列各项向前移动一位;
步骤B8:返回步骤B2,直至轮值冗余模式变更或停止。
需要说明的是:如图3所示,在轮值生产预备时,根据轮值序列预载轮值替换的生产服务器对应系统;如图4所示,在触发轮值条件时,则直接替换生产服务器;如图5所示,完成替换后,新的生产服务器上线,并对轮值序列进行更新。
作为更进一步的解决方案,设置预备条件包括:监测参数、预备阈值和触发阈值;监测参数:服务器温度、服务器载荷和/或服务器生产时长;预备阈值:在监测参数达到时,执行预备冗余步骤;触发阈值:高于预备阈值,并在监测参数达到时,执行生产替换步骤;其中,预备冗余步骤具体为:
步骤C1:进入预备冗余模式,读取预备阈值和触发阈值;
步骤C2:持续对各生产服务器的监测参数,并与预备阈值和触发阈值进行比较:
触发1:当监测参数小于预备阈值时,则返回步骤C1;
触发2:当监测参数不小于触发阈值时,则进行生产替换步骤;
触发3:当监测参数不小于预备阈值,且小于触发阈值时,则进行下一步;
步骤C3:获取触发3的生产服务器,得到待替换生产服务器;
步骤C4:执行步骤A2至步骤A6,将系统预载至冗余设备服务器的RAM中;
步骤C5:将预载模式设置为:有预载系统;
步骤C6:返回步骤C2,直至预备冗余模式变更或停止。
作为更进一步的解决方案,在生产替换步骤后,若被替换服务器有下挂的硬盘;则将被替换服务器进行挂盘卸载,得到下挂硬盘并将挂盘模式调整为:无挂盘;将新生产服务器进行挂盘装载,下挂硬盘装载完成后,新生产服务器执行硬盘唤醒并将挂盘模式调整为:有挂盘。
生产服务器冗余备份的装置,运用在如上任一项所述的生产服务器冗余备份的系统中,将备份文件冷备存储至外部存储介质中;并在备份管理服务器无法进行时,手动将冷备的备份文件注入至生产服务器组和交换机单元中;在进行备份文件注入前,还通过计算备份文件哈希值,验证备份文件是否被篡改。
需要说明的是:由于本实施例方案针对政府、医院等场景,因此还将备份文件冷备存储至外部存储介质中,并通过备份文件哈希值验证备份文件是否被篡改;进一步增加系统安全性。
以上仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其它相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (9)
1.生产服务器冗余备份的系统,其特征在于,包括生产服务器组、冗余设备服务器、备份管理服务器、交换机单元和业务存储盘组;
生产服务器组:包括N台生产服务器,并通过业务链路连接各生产服务器;用户根据业务需求提交业务清单,生产服务器组解析业务清单,并将各项业务请求通过业务链路发送至对应生产服务器;
生产服务器:用于响应专项业务请求,并根据响应业务部署对应的操作系统、环境配置和挂盘模式;其中,操作系统为RAMOS系统,挂盘模式包括:有挂盘/无挂盘;
冗余设备服务器:用于向生产服务器组提供设备冗余,并根据冗余模式设置对应预载模式,其中,预载模式包括:有预载系统/无预载系统,挂盘模式为:无挂盘;冗余模式包括:轮值冗余、预备冗余和故障冗余;轮值冗余:预载模式为有预载系统,设置轮值条件并在触发时,执行轮值冗余步骤;预备冗余:预载模式为有预载系统,设置预备条件并在触发时,执行预备冗余步骤;故障冗余:预载模式为无预载系统,在生产服务器发生故障时,执行生产替换步骤;
业务存储盘组:包括N个数据存储系统,各数据存储系统分别部署在对应的业务存储盘上且互相独立;设置N个数据响应接口,并在验证访问者注册信息后,连接至对应的数据存储系统上;
备份管理服务器:用于对生产服务器组进行快照备份操作、数据写入操作和链路管理操作;其中,快照备份操作的实施对象包括:注册信息、环境配置和操作系统;数据写入操作包括:RAMOS系统写入、环境配置写入和注册信息写入;链路管理操作:对链路结构进行描述和管理,管理包括对各链路进行启用/关闭/切换操作;备份管理服务器在不需要进行冗余替换时进行快照备份操作,在需要进行冗余替换时,则对冗余设备服务器进行数据写入操作,完成对业务运行环境的配置;再通过链路管理操作将冗余设备服务器切换至生产服务器的各工作链路上,完成对冗余替换快速自动执行;快照备份操作包括备份操作和快照操作;在搭建生产服务器组时,进行备份操作:各生产服务器装载原生RAMOS系统,并通过备份管理服务器进行操作系统备份;各生产服务器装载对应的环境配置,并通过备份管理服务器进行环境配置备份;各生产服务器装载对应的注册信息,并通过备份管理服务器进行注册信息备份;在设定时间/条件触发时,进行快照操作:通过备份管理服务器对各生产服务器的RAMOS系统进行快照,并保存系统快照数据;通过备份管理服务器对各生产服务器环境配置列表进行快照,并保存配置更新程序;通过备份管理服务器对各生产服务器注册信息文件进行快照,并保存注册新增文件;
交换机单元:受控于备份管理服务器,设置1个管理端口与备份管理服务器连接,组成管理链路;设置N个业务端口连接生产服务器组,组成对应的数据请求链路;设置N个业务端口连接业务存储盘组,组成对应的数据响应链路;设置1个业务端口与冗余设备服务器连接,组成数据冗余链路;其中,各数据请求链路和数据响应链路以1to1模式进行关联,得到数据链路。
2.根据权利要求1所述的生产服务器冗余备份的系统,其特征在于,各生产服务器根据响应业务需求,判断是否需要存储本地服务数据;若需要,则在生产服务器本地设置下挂硬盘,并设置挂盘模式为:有挂盘;否则,不设置下挂硬盘,并设置挂盘模式为:无挂盘;其中,在挂盘模式为:有挂盘时,备份管理服务器还对盘符及文件路径进行备份;下挂硬盘通过集中下挂盘组或独立下挂硬盘进行设置。
3.生产服务器冗余备份的方法,运用在如权利要求1至权利要求2任一项所述的生产服务器冗余备份的系统中,其特征在于,快照备份操作包括备份操作和快照操作;
在搭建生产服务器组时,进行备份操作:
各生产服务器装载原生RAMOS系统,并通过备份管理服务器进行操作系统备份;
各生产服务器装载对应的环境配置,并通过备份管理服务器进行环境配置备份;
各生产服务器装载对应的注册信息,并通过备份管理服务器进行注册信息备份;
在设定时间/条件触发时,进行快照操作:
通过备份管理服务器对各生产服务器的RAMOS系统进行快照,并保存系统快照数据;
通过备份管理服务器对各生产服务器环境配置列表进行快照,并保存配置更新程序;
通过备份管理服务器对各生产服务器注册信息文件进行快照,并保存注册新增文件。
4.根据权利要求3所述的生产服务器冗余备份的方法,其特征在于,备份管理服务器通过执行生产替换步骤,使冗余设备服务器替换生产服务器进行专项业务请求响应,生产替换步骤具体包括:
步骤A1:判断预载模式,若为有预载系统,执行步骤A6;若无预载系统,执行步骤A2;
步骤A2:查询并获取待替换生产服务器对应的备份文件;
其中,备份文件包括:操作系统文件、环境配置文件、注册信息文件和链路结构文件;
步骤A3:通过PXE启动冗余设备服务器进入BIOS,并引导操作系统文件装载至RAM中;
步骤A4:启动系统并执行自动安装脚本,引导注入环境配置文件和注册信息文件;
步骤A5:通过系统快照数据、配置更新程序和注册新增文件对冗余设备服务器RAM中的操作系统进行快照同步;
步骤A6:对链路结构文件进行解析,得到业务链路描述文件和数据链路描述文件;
步骤A7:解析链路描述文件中的描述项,并将待替换生产服务器和冗余设备服务器进行描述项互换,完成所有互换后,对业务链路描述文件和数据链路描述文件进行更新;
步骤A8:将更新后的业务链路描述文件输入至生产服务器组,重构业务链路结构;将数据链路描述文件输入至交换机单元,重构数据链路结构;
步骤A9:启用数据冗余链路,通过重构后的业务链路和数据链路使冗余设备服务器加入至生产服务器组,并替换原生产服务器进行专项业务请求响应;
步骤A10:关闭被替换服务器的业务链路和数据链路,得到待检服务器,完成生产替换。
5.根据权利要求4所述的生产服务器冗余备份的方法,其特征在于,冗余模式包括:轮值冗余、预备冗余和故障冗余;其中,
轮值冗余:预载模式为有预载系统,设置轮值条件并在触发时,执行轮值冗余步骤;
预备冗余:预载模式为有预载系统,设置预备条件并在触发时,执行预备冗余步骤;
故障冗余:预载模式为无预载系统,在生产服务器发生故障时,执行生产替换步骤。
6.根据权利要求5所述的生产服务器冗余备份的方法,其特征在于,设置轮值条件包括:轮值序列和轮值触发条件;轮值序列:用于描述各生产服务器和冗余设备服务器之间的轮值生产顺序;轮值触发条件:包括时间触发条件和事件触发条件;其中,轮值冗余步骤具体为:
步骤B1:进入轮值冗余模式,为各生产服务器分配与轮值生产顺序对应的序号,得到轮值序列;
步骤B2:读取轮值序列的首项,查询首项对应的生产服务器,得到待替换生产服务器;
步骤B3:执行步骤A2至步骤A6,将系统预载至冗余设备服务器的RAM中;
步骤B4:将预载模式设置为:有预载系统;
步骤B5:持续监测轮值触发条件,并在触发时执行生产替换步骤;
步骤B6:对待检服务器进行检测,并将通过检测的服务器设置为冗余设备服务器;
步骤B7:通过循环模式对轮值序列进行更新,轮值序列各项向前移动一位;
步骤B8:返回步骤B2,直至轮值冗余模式变更或停止。
7.根据权利要求5所述的生产服务器冗余备份的方法,其特征在于,设置预备条件包括:监测参数、预备阈值和触发阈值;监测参数:服务器温度、服务器载荷和/或服务器生产时长;预备阈值:在监测参数达到时,执行预备冗余步骤;触发阈值:高于预备阈值,并在监测参数达到时,执行生产替换步骤;其中,预备冗余步骤具体为:
步骤C1:进入预备冗余模式,读取预备阈值和触发阈值;
步骤C2:持续对各生产服务器的监测参数,并与预备阈值和触发阈值进行比较:
触发1:当监测参数小于预备阈值时,则返回步骤C1;
触发2:当监测参数不小于触发阈值时,则进行生产替换步骤;
触发3:当监测参数不小于预备阈值,且小于触发阈值时,则进行下一步;
步骤C3:获取触发3的生产服务器,得到待替换生产服务器;
步骤C4:执行步骤A2至步骤A6,将系统预载至冗余设备服务器的RAM中;
步骤C5:将预载模式设置为:有预载系统;
步骤C6:返回步骤C2,直至预备冗余模式变更或停止。
8.根据权利要求4所述的生产服务器冗余备份的方法,其特征在于,在生产替换步骤后,若被替换服务器有下挂的硬盘;则将被替换服务器进行挂盘卸载,得到下挂硬盘并将挂盘模式调整为:无挂盘;将新生产服务器进行挂盘装载,下挂硬盘装载完成后,新生产服务器执行硬盘唤醒并将挂盘模式调整为:有挂盘。
9.生产服务器冗余备份的装置,运用在如权利要求1至权利要求2任一项所述的生产服务器冗余备份的系统中,其特征在于,将备份文件冷备存储至外部存储介质中;并在备份管理服务器无法进行时,手动将冷备的备份文件注入至生产服务器组和交换机单元中;在进行备份文件注入前,还通过计算备份文件哈希值,验证备份文件是否被篡改。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310808675.8A CN116545845B (zh) | 2023-07-04 | 2023-07-04 | 生产服务器冗余备份装置、系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310808675.8A CN116545845B (zh) | 2023-07-04 | 2023-07-04 | 生产服务器冗余备份装置、系统及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116545845A CN116545845A (zh) | 2023-08-04 |
CN116545845B true CN116545845B (zh) | 2023-09-08 |
Family
ID=87456253
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310808675.8A Active CN116545845B (zh) | 2023-07-04 | 2023-07-04 | 生产服务器冗余备份装置、系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116545845B (zh) |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5403639A (en) * | 1992-09-02 | 1995-04-04 | Storage Technology Corporation | File server having snapshot application data groups |
CN101083779A (zh) * | 2007-05-22 | 2007-12-05 | 深圳市智林机电技术有限公司 | 实现廉价冗余网络阵列的方法及其设备 |
CN101316274A (zh) * | 2008-05-12 | 2008-12-03 | 华中科技大学 | 一种适用于广域网的数据容灾系统 |
CN101751020A (zh) * | 2008-12-17 | 2010-06-23 | 中国科学院沈阳自动化研究所 | 一种高可用性功能块冗余方法 |
CN102117233A (zh) * | 2005-06-24 | 2011-07-06 | 信科索尔特公司 | 用于高性能企业数据保护的系统和方法 |
CN103944697A (zh) * | 2014-03-27 | 2014-07-23 | 广东佳和通信技术有限公司 | 一种双链路双服务器的语音调度系统及冗余备份方法 |
CN105955836A (zh) * | 2016-05-09 | 2016-09-21 | 深圳市前海云端容灾信息技术有限公司 | 一种冷热备份自动演练多功能系统 |
CN109005070A (zh) * | 2018-08-31 | 2018-12-14 | 北京计算机技术及应用研究所 | 一种基于共享内存的双机冗余热备设备 |
CN112988466A (zh) * | 2021-04-07 | 2021-06-18 | 中国联合网络通信集团有限公司 | 数据备份方法、装置、设备、存储介质及程序产品 |
CN114978987A (zh) * | 2022-05-17 | 2022-08-30 | 北京交通大学 | 服务器冗余备份方法 |
CN115202939A (zh) * | 2022-05-20 | 2022-10-18 | 中核武汉核电运行技术股份有限公司 | 一种核电信息系统服务器主备冗余框架管理系统及方法 |
CN115981921A (zh) * | 2022-12-30 | 2023-04-18 | 上海爱数信息技术股份有限公司 | 一种备份方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7401254B2 (en) * | 2003-04-23 | 2008-07-15 | Dot Hill Systems Corporation | Apparatus and method for a server deterministically killing a redundant server integrated within the same network storage appliance chassis |
-
2023
- 2023-07-04 CN CN202310808675.8A patent/CN116545845B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5403639A (en) * | 1992-09-02 | 1995-04-04 | Storage Technology Corporation | File server having snapshot application data groups |
CN102117233A (zh) * | 2005-06-24 | 2011-07-06 | 信科索尔特公司 | 用于高性能企业数据保护的系统和方法 |
CN101083779A (zh) * | 2007-05-22 | 2007-12-05 | 深圳市智林机电技术有限公司 | 实现廉价冗余网络阵列的方法及其设备 |
CN101316274A (zh) * | 2008-05-12 | 2008-12-03 | 华中科技大学 | 一种适用于广域网的数据容灾系统 |
CN101751020A (zh) * | 2008-12-17 | 2010-06-23 | 中国科学院沈阳自动化研究所 | 一种高可用性功能块冗余方法 |
CN103944697A (zh) * | 2014-03-27 | 2014-07-23 | 广东佳和通信技术有限公司 | 一种双链路双服务器的语音调度系统及冗余备份方法 |
CN105955836A (zh) * | 2016-05-09 | 2016-09-21 | 深圳市前海云端容灾信息技术有限公司 | 一种冷热备份自动演练多功能系统 |
CN109005070A (zh) * | 2018-08-31 | 2018-12-14 | 北京计算机技术及应用研究所 | 一种基于共享内存的双机冗余热备设备 |
CN112988466A (zh) * | 2021-04-07 | 2021-06-18 | 中国联合网络通信集团有限公司 | 数据备份方法、装置、设备、存储介质及程序产品 |
CN114978987A (zh) * | 2022-05-17 | 2022-08-30 | 北京交通大学 | 服务器冗余备份方法 |
CN115202939A (zh) * | 2022-05-20 | 2022-10-18 | 中核武汉核电运行技术股份有限公司 | 一种核电信息系统服务器主备冗余框架管理系统及方法 |
CN115981921A (zh) * | 2022-12-30 | 2023-04-18 | 上海爱数信息技术股份有限公司 | 一种备份方法 |
Non-Patent Citations (1)
Title |
---|
茅建锋.中国优秀硕士学位论文全文数据库.2008,(第S2期),全文. * |
Also Published As
Publication number | Publication date |
---|---|
CN116545845A (zh) | 2023-08-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6477663B1 (en) | Method and apparatus for providing process pair protection for complex applications | |
US9280430B2 (en) | Deferred replication of recovery information at site switchover | |
CN102782656B (zh) | 管理应用程序可用性的系统和方法 | |
EP3179359B1 (en) | Data sending method, data receiving method, and storage device | |
US6658589B1 (en) | System and method for backup a parallel server data storage system | |
US6785838B2 (en) | Method and apparatus for recovering from failure of a mirrored boot device | |
EP1428149B1 (en) | A system and method for a multi-node environment with shared storage | |
US9098439B2 (en) | Providing a fault tolerant system in a loosely-coupled cluster environment using application checkpoints and logs | |
CN110807064B (zh) | Rac分布式数据库集群系统中的数据恢复装置 | |
US11650891B2 (en) | Preventing non-detectable data loss during site switchover | |
US20080162915A1 (en) | Self-healing computing system | |
CN101344863A (zh) | 备份系统和方法 | |
US7702757B2 (en) | Method, apparatus and program storage device for providing control to a networked storage architecture | |
KR20110044858A (ko) | 데이터 센터들에 걸쳐 데이터 서버들내 데이터 무결정의 유지 | |
US5996087A (en) | Program product for serializating actions of independent process groups | |
CN103136070B (zh) | 一种数据容灾处理的方法和装置 | |
US9367413B2 (en) | Detecting data loss during site switchover | |
EP0987630B1 (en) | Resilience in a multi-computer system | |
CN113986450A (zh) | 一种虚拟机备份方法及装置 | |
US11550677B2 (en) | Client-less database system recovery | |
CN111416753B (zh) | 一种两节点Ceph集群的高可用方法 | |
CN109445909A (zh) | 虚拟机数据的备份方法、系统、终端及存储介质 | |
CN116545845B (zh) | 生产服务器冗余备份装置、系统及方法 | |
CN111240903A (zh) | 数据恢复方法及相关设备 | |
CN102520880A (zh) | 一种系统raid管理模块设计方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |