CN101316184B - 容灾切换方法、系统、装置 - Google Patents

容灾切换方法、系统、装置 Download PDF

Info

Publication number
CN101316184B
CN101316184B CN2007101073885A CN200710107388A CN101316184B CN 101316184 B CN101316184 B CN 101316184B CN 2007101073885 A CN2007101073885 A CN 2007101073885A CN 200710107388 A CN200710107388 A CN 200710107388A CN 101316184 B CN101316184 B CN 101316184B
Authority
CN
China
Prior art keywords
disaster tolerance
database
data
memory device
disaster
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2007101073885A
Other languages
English (en)
Other versions
CN101316184A (zh
Inventor
袁继伟
李晓明
张永森
李一鸣
何伟
杨洁
邓志杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN2007101073885A priority Critical patent/CN101316184B/zh
Publication of CN101316184A publication Critical patent/CN101316184A/zh
Application granted granted Critical
Publication of CN101316184B publication Critical patent/CN101316184B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种容灾切换方法,包括:生产侧的容灾客户端在启动容灾切换后指示生产侧的第一数据库将缓存中的数据写入生产侧的第一存储设备,并清空日志;将写入的数据从第一存储设备同步到容灾侧的第二存储设备;容灾侧的容灾服务端对第二存储设备的数据做一份快照;使用快照启动容灾侧的第二数据库,启动后的第二数据库根据清空后新产生的日志做自我恢复操作。本发明还提供了一种容灾切换系统、容灾切换服务端装置和容灾切换客户端装置。本发明缩短了容灾恢复时数据库的恢复时间。

Description

容灾切换方法、系统、装置
技术领域
本发明涉及通信领域,更具体而言,涉及容灾切换方法、系统、服务端装置和客户端装置。
背景技术
在网络设备处理过程中有时可能出现大范围的中断,无法正常提供服务,并且无法在一定的时间内解决,这种情况称为数据灾难,典型的例子有火灾、爆炸事件、地震、水灾等自然原因,以及电源、机器故障、人为因素等非自然原因引起的灾难。电信运营系统的存储设备中保存有大量的数据资源,一旦发生数据灾难,设备中止运行,将导致大面积的用户无法正常使用业务,对运营商来说,也会造成大量的经济损失。
远程容灾系统是生产双机系统的延伸。在该系统中,通过使用复制软件将生产系统存储设备的数据、以及业务运行过程中对数据的改动同步到远端的容灾系统,来保证生产系统和容灾系统数据的同步一致。同时容灾软件监控着生产系统的运行,当其检测到生产系统异常,或是接收到网管的切换命令时,将拉起容灾系统的数据库以及应用来接管服务,保证了业务的连续性、高可用性。
当容灾切换发生时,容灾软件拉起数据库,在数据库启动过程中需要根据数据库日志来恢复数据,恢复数据需要的时长取决于日志的多少,而发生容灾切换时间点距数据库上次检查点(Checkpoint)操作时间越久,堆积的日志就越多。所谓检查点操作,就是将缓存中的数据写入存储设备,并清空日志的操作。
图1示出了现有技术的容灾切换处理过程,具体来说,包括以下步骤:
1.容灾服务端收到网管的容灾切换命令或自动决策进行容灾切换。
2.容灾服务端对容灾侧的数据做一份快照。数据库快照是数据库(源数据库)创建快照时的只读静态视图。如果源数据库出现用户错误,可将源数据库恢复到创建快照时的状态,丢失的数据仅限于创建快照后数据库更新的数据。
3.容灾服务端使用快照数据来启动数据库,数据库根据日志做自我恢复的操作。
4.数据库启动完毕后,启动应用程序以正式接管业务。
然而,在实现本发明过程中,发明人发现:
一般地,因为根据数据库日志恢复数据需要对日志的每条记录逐条滚动操作,而发生容灾切换时间点距数据库上次检查点操作时间越久,堆积的日志就越多,所以导致数据库恢复的时间就越长。因此造成容灾接管的速度慢,不能满足客户对运营系统高可用的需求。
发明内容
本发明实施例旨在提供一种容灾切换方法、系统、服务端装置和客户端装置,以解决数据库恢复时间较长的问题。
本发明的一个实施例提供了一种容灾切换方法,包括:生产侧的容灾客户端在启动容灾切换后指示生产侧的第一数据库将缓存中的数据写入生产侧的第一存储设备,并清空日志;将写入的数据从第一存储设备同步到容灾侧的第二存储设备;容灾侧的容灾服务端对第二存储设备的数据做一份快照;使用快照启动容灾侧的第二数据库,启动后的第二数据库根据清空后新产生的日志做自我恢复操作。
本发明的另一实施例提供了一种容灾切换系统,包括:容灾客户端,其处于生产侧,用于在启动容灾切换后指示生产侧的第一数据库将缓存中的数据写入生产侧的第一存储设备,并清空日志;第一存储设备和第一数据库,处于生产侧;第二存储设备,其处于容灾侧,用于同步写入第一存储设备的数据;容灾服务端,其处于容灾侧,用于对第二存储设备的数据做一份快照,使用快照启动第二数据库;第二数据库,其处于容灾侧,用于根据清空后新产生的日志做自我恢复操作。
本发明的另一实施例提供了一种容灾切换服务端装置,处于系统的容灾侧,包括:接收模块,用于接收容灾切换命令;指示模块,用于在收到容灾切换命令后启动容灾切换或者通过自动决策指示处于生产侧的容灾客户端启动生产侧的第一数据库的检查点操作,其中,检查点操作用于将缓存中的数据写入生产侧的第一存储设备,并清空日志;快照模块,用于对第二存储装置的数据做一份快照,其中,第二存储装置处于容灾侧,其数据与第一存储装置的数据保持同步;恢复模块,用于指示处于容灾侧的第二数据库使用快照启动,以及指示启动后的第二数据库根据清空后新产生的日志做自我恢复操作。
本发明的另一实施例提供了一种容灾切换客户端装置,处于系统的生产侧,包括:接收模块,用于接收来自容灾侧的容灾服务端的容灾指示;控制模块,用于指示处于生产侧的第一数据库做检查点操作,利用检查点操作将缓存中的数据写入生产侧的第一存储设备,并清空日志。
通过上述技术方案,数据库启动后是根据清空后所产生的日志做自我恢复操作,从而由于减少了日志的记录条数,缩短了数据库恢复时间。
附图说明
在附图中:
图1示出了现有技术的容灾切换处理过程;
图2示出了根据本发明实施例的容灾切换处理方法的流程图;
图3示出了根据本发明实施例的容灾切换系统及其处理过程;
图4示出了根据本发明实施例的容灾切换服务端装置的方框图;
图5示出了根据本发明实施例的容灾切换客户端装置的方框图。
具体实施方式
下面将参考附图并结合实施例,来详细说明本发明。
图2示出了根据本发明实施例的容灾切换处理方法的流程图,包括以下步骤:
步骤S10,生产侧的容灾客户端在例如收到网管的容灾切换命令和自动决策而启动容灾切换后,指示生产侧的第一数据库将缓存中的数据写入生产侧的第一存储设备,并清空日志;
步骤S20,将写入的数据从第一存储设备同步到容灾侧的第二存储设备;
步骤S30,容灾侧的容灾服务端对第二存储设备的数据做一份快照;
步骤S40,使用快照启动容灾侧的第二数据库,启动后的第二数据库根据清空后新产生的日志做自我恢复操作。
上述实施例中,数据库启动后是根据清空后所产生的日志做自我恢复操作,从而由于减少了日志的记录条数,缩短了数据库恢复时间。
当灾难发生时,现有技术提供的方案容灾接管速度慢,不能满足客户对运营系统的速度要求。而本发明通过优化容灾切换过程中容灾软件启动数据库的策略,加快了容灾系统接管速度。例如某运营商的业务系统采用现有技术中的容灾方案,启动数据库可能长达2小时,通过测试,采用上述实施例的容灾方案,在短时间内可启动完毕,启动时间缩短至60秒。
具体来说,容灾客户端可以指示数据库执行检查点操作,利用检查点操作将缓存中的数据写入第一存储设备,并清空日志。可以利用复制程序将检查点操作写入第一存储设备的数据同步到容灾侧的第二存储设备。
数据库根据检查点操作清空日志后新产生的日志对快照数据做自我恢复操作。数据库可以是Informix数据库、DB2数据库。Oracle数据库、Sybase数据库等各种大型数据库。
在现有技术中,容灾切换发生时,生产侧数据库缓存中数据没有被写入磁盘,会造成容灾切换后部分数据丢失。本发明实施例通过预先执行检查点操作,主动将生产机缓存中数据写入磁盘,该部分数据被同步到容灾侧,从而减少了数据的丢失。
图3示出了根据本发明实施例的容灾切换系统及其处理过程,包括:
容灾客户端,其处于生产侧,用于在启动容灾切换后指示生产侧的第一数据库将缓存中的数据写入生产侧的第一存储设备,并清空日志;
第一存储设备和第一数据库,处于生产侧;
第二存储设备,其处于容灾侧,用于同步写入第一存储设备的数据;
容灾服务端,其处于容灾侧,用于保存第二存储设备的数据做一份快照,使用快照启动第二数据库;
第二数据库,其处于容灾侧,用于根据清空后新产生的日志做自我恢复操作。
在上述的容灾切换系统中,容灾客户端可以通过指示数据库执行检查点操作,利用检查点操作将缓存中的数据写入存储设备,并清空日志。
图3所示的处理过程包括以下步骤:
1.容灾服务端收到网管的容灾切换命令或自动决策进行容灾切换。
2.容灾服务端指示生产侧的容灾客户端将要进行容灾切换,对第一数据库做检查点操作。
3.容灾客户端收到指示后,指示第一数据库做检查点操作。
4.第一数据库做检查点操作。通过该操作,将生产机缓存中数据写入了第一存储设备(即磁盘),并清空了日志,该操作可以在很短时间例如三秒内完成。
5.数据复制模块将写入第一存储设备的数据同步到容灾侧的第二存储设备。
6.容灾服务端对容灾侧第二存储设备的数据做一份快照。
7.容灾服务端使用快照数据来启动第二数据库,第二数据库根据日志做自我恢复的操作。因为日志在步骤4中被检查点操作清空了,所以此时数据库的日志量较少,恢复时间显著缩短。
8.第二数据库启动完毕后,启动应用正式将业务切换到第二数据库进行。
在一个实施例中,上述的数据库采用了Informix数据库,显然还可以采用DB2数据库。Oracle数据库、Sybase数据库等其他大型数据库。
图4示出了根据本发明实施例的容灾切换服务端装置的方框图,该容灾切换服务端装置处于系统的容灾侧,包括:
接收模块10,用于接收容灾切换命令;
指示模块20,用于在收到容灾切换命令后启动容灾切换或者通过自动决策指示处于生产侧的容灾客户端启动生产侧的第一数据库的检查点操作,其中,检查点操作用于将缓存中的数据写入生产侧的第一存储设备,并清空日志;
快照模块30,用于对第二存储装置的数据做一份快照,其中,第二存储装置处于容灾侧,其数据与第一存储装置的数据保持同步;
恢复模块40,用于指示处于容灾侧的第二数据库使用快照启动,以及指示启动后的第二数据库根据清空后新产生的日志做自我恢复操作。
图5示出了根据本发明实施例的容灾切换客户端装置的方框图,该容灾切换客户端装置处于系统的生产侧,包括:
接收模块50,用于接收来自容灾侧的容灾服务端的容灾指示;
控制模块60,用于指示处于生产侧的第一数据库做检查点操作,利用检查点操作将缓存中的数据写入生产侧的第一存储设备,并清空日志。
从以上的描述中,可以看出,本发明上述的实施例在容灾切换时,通过预先执行检查点操作主动对生产机数据库日志做清理操作,从而达到了加快容灾接管速度的目的,业务中断时间显著缩短。另外,上述实施例通过预先执行检查点操作主动将生产机缓存中数据写入磁盘,该部分数据被同步到容灾侧,从而减少了数据的丢失。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种容灾切换方法,其特征在于,包括:
生产侧的容灾客户端在启动容灾切换后指示所述生产侧的第一数据库执行检查点操作,利用所述检查点操作将缓存中的数据写入生产侧的第一存储设备,并清空日志;
将写入的数据从所述第一存储设备同步到所述容灾侧的第二存储设备;
容灾侧的容灾服务端对所述第二存储设备的数据做一份快照;
使用所述快照启动所述容灾侧的第二数据库,启动后的所述第二数据库根据清空后新产生的日志做自我恢复操作。
2.根据权利要求1所述的容灾切换方法,其特征在于,将写入的数据从所述第一存储设备同步到所述容灾侧的第二存储设备具体包括:
将所述检查点操作写入所述第一存储设备的数据同步到所述第二存储设备。
3.根据权利要求2所述的容灾切换方法,其特征在于,所述第二数据库根据所述检查点操作清空所述日志后新产生的日志做自我恢复操作。
4.根据上述权利要求任一项所述的容灾切换方法,其特征在于,所述第一数据库和所述第二数据库是Informix数据库、DB2数据库、Oracle数据库或Sybase数据库。
5.一种容灾切换系统,其特征在于,包括:
容灾客户端,处于生产侧,用于在启动容灾切换后指示生产侧的第一数据库执行检查点操作,利用所述检查点操作将缓存中的数据写入生产侧的第一存储设备,并清空日志;
所述第一存储设备和所述第一数据库,处于所述生产侧;
所述第二存储设备,处于容灾侧,用于同步写入所述第一存储设备的数据;
容灾服务端,处于所述容灾侧,用于对所述第二存储设备的数据做一份快照,使用所述快照启动第二数据库;
所述第二数据库,处于所述容灾侧,根据清空后新产生的日志做自我恢复操作。
6.根据权利要求5所述的容灾切换系统,其特征在于,启动后的所述第二数据库用于根据所述检查点操作清空所述日志后新产生的日志做自我恢复操作。
7.一种容灾切换服务端装置,处于系统的容灾侧,其特征在于,包括:
接收模块,用于接收容灾切换命令;
指示模块,用于在收到所述容灾切换命令后启动容灾切换或者通过自动决策指示处于生产侧的容灾客户端启动所述生产侧的第一数据库的检查点操作,其中,所述检查点操作用于将缓存中的数据写入生产侧的第一存储设备,并清空日志;
快照模块,用于对第二存储装置的数据做一份快照,其中,所述第二存储装置处于容灾侧,其数据与所述第一存储装置的数据保持同步;
恢复模块,用于指示处于所述容灾侧的第二数据库使用所述快照启动,以及指示启动后的所述第二数据库根据清空后新产生的日志做自我恢复操作。
8.一种容灾切换客户端装置,处于系统的生产侧,其特征在于,包括:
接收模块,用于接收来自容灾侧的容灾服务端的容灾指示;
控制模块,用于指示处于所述生产侧的第一数据库做检查点操作,利用所述检查点操作将缓存中的数据写入所述生产侧的第一存储设备,并清空日志。
CN2007101073885A 2007-06-01 2007-06-01 容灾切换方法、系统、装置 Expired - Fee Related CN101316184B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2007101073885A CN101316184B (zh) 2007-06-01 2007-06-01 容灾切换方法、系统、装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2007101073885A CN101316184B (zh) 2007-06-01 2007-06-01 容灾切换方法、系统、装置

Publications (2)

Publication Number Publication Date
CN101316184A CN101316184A (zh) 2008-12-03
CN101316184B true CN101316184B (zh) 2010-09-15

Family

ID=40107041

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2007101073885A Expired - Fee Related CN101316184B (zh) 2007-06-01 2007-06-01 容灾切换方法、系统、装置

Country Status (1)

Country Link
CN (1) CN101316184B (zh)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101557320B (zh) * 2009-05-25 2011-05-04 杭州华三通信技术有限公司 容灾的实现方法及其通信设备
CN102043686B (zh) * 2009-10-20 2012-11-14 华为技术有限公司 一种内存数据库的容灾方法、备用服务器及系统
CN101763321B (zh) 2010-02-24 2013-01-02 华为技术有限公司 数据容灾的方法、装置及系统
CN102891849B (zh) * 2012-09-25 2015-07-22 北京星网锐捷网络技术有限公司 业务数据同步方法、恢复方法及装置和网络设备
CN103914359B (zh) * 2012-12-31 2017-09-26 中国移动通信集团浙江有限公司 一种数据恢复方法及装置
CN103150232B (zh) * 2013-02-01 2016-06-01 浪潮(北京)电子信息产业有限公司 存储快照创建方法和装置
CN103617269B (zh) * 2013-12-05 2018-03-23 中国联合网络通信集团有限公司 一种容灾接管方法及容灾接管系统
CN105677673B (zh) * 2014-11-20 2019-01-04 阿里巴巴集团控股有限公司 业务处理方法、装置及系统
CN105528259B (zh) * 2016-03-01 2018-08-21 浪潮天元通信信息系统有限公司 一种应用级容灾自动化切换控制设计方法
CN108153787B (zh) * 2016-12-02 2019-11-26 中科星图股份有限公司 一种数据库的容灾方法
CN109308643B (zh) * 2017-07-27 2022-04-08 阿里巴巴集团控股有限公司 一种打底数据生成方法、数据容灾方法及相关设备
CN109522161A (zh) * 2018-11-29 2019-03-26 上海新炬网络技术有限公司 Oracle GoldenGate在非共享存储部署下的实现方法
CN111381770B (zh) * 2018-12-30 2021-07-06 浙江宇视科技有限公司 一种数据存储切换方法、装置、设备及存储介质
CN109885427A (zh) * 2019-01-31 2019-06-14 郑州云海信息技术有限公司 一种数据库短期数据保护方法、装置、存储器及设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1746855A (zh) * 2005-10-26 2006-03-15 北京启明星辰信息技术有限公司 一种基于伪块设备的应用层透明容灾备份方法及系统
CN1852455A (zh) * 2005-11-22 2006-10-25 华为技术有限公司 一种数据容灾系统及其容灾方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1746855A (zh) * 2005-10-26 2006-03-15 北京启明星辰信息技术有限公司 一种基于伪块设备的应用层透明容灾备份方法及系统
CN1852455A (zh) * 2005-11-22 2006-10-25 华为技术有限公司 一种数据容灾系统及其容灾方法

Also Published As

Publication number Publication date
CN101316184A (zh) 2008-12-03

Similar Documents

Publication Publication Date Title
CN101316184B (zh) 容灾切换方法、系统、装置
CN102891849B (zh) 业务数据同步方法、恢复方法及装置和网络设备
CN102955720B (zh) 一种提高ext文件系统稳定性的方法
CN101739313B (zh) 一种连续数据保护和恢复方法
US6691245B1 (en) Data storage with host-initiated synchronization and fail-over of remote mirror
CN106776121B (zh) 一种数据灾备装置、系统及方法
CN110209726A (zh) 分布式数据库集群系统、数据同步方法及存储介质
US9576040B1 (en) N-site asynchronous replication
CN106815097A (zh) 数据库容灾系统和方法
CN105335255B (zh) 实现业务快速恢复的系统和方法
CN111427728B (zh) 状态管理方法、主备切换方法及电子设备
WO2014059804A1 (zh) 数据同步方法及系统
CN101741536A (zh) 数据级容灾方法、系统和生产中心节点
CN103336728A (zh) 一种磁盘数据恢复方法
CN108804523A (zh) 数据同步方法、系统及计算机可读存储介质
CN107038091B (zh) 一种基于异步远程镜像的数据安全性保护系统与电力应用系统数据保护方法
US7152183B2 (en) Method and apparatus for volume replication management at planned and unplanned link down
CN103905220B (zh) 数据同步处理方法及系统
CN108614876B (zh) 一种基于Redis数据库的系统和数据处理方法
CN107256184A (zh) 一种基于存储池的数据灾难备份方法及装置
CN103605616A (zh) 一种多控制器间的缓存数据一致性保障方法
CN102045187A (zh) 一种利用检查点实现高可用性系统的方法和设备
CN101527656B (zh) Ngn业务平台数据库应急切换系统及其实现方法
CN109960602B (zh) 信息管理方法、装置、设备及介质
CN104243554A (zh) 一种集群系统中的时序库主备机内存同步方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20100915