CN117743026A - 一种数据容灾的方法、系统、设备及存储介质 - Google Patents
一种数据容灾的方法、系统、设备及存储介质 Download PDFInfo
- Publication number
- CN117743026A CN117743026A CN202311586489.0A CN202311586489A CN117743026A CN 117743026 A CN117743026 A CN 117743026A CN 202311586489 A CN202311586489 A CN 202311586489A CN 117743026 A CN117743026 A CN 117743026A
- Authority
- CN
- China
- Prior art keywords
- center
- production
- disaster recovery
- data
- local
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000011084 recovery Methods 0.000 title claims abstract description 104
- 238000000034 method Methods 0.000 title claims abstract description 77
- 238000003860 storage Methods 0.000 title claims abstract description 37
- 238000004519 manufacturing process Methods 0.000 claims abstract description 308
- 230000000737 periodic effect Effects 0.000 claims abstract description 57
- 230000010076 replication Effects 0.000 claims abstract description 52
- 230000000694 effects Effects 0.000 claims abstract description 12
- 230000009977 dual effect Effects 0.000 claims description 11
- 230000004044 response Effects 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 8
- 238000012261 overproduction Methods 0.000 claims description 6
- 230000001360 synchronised effect Effects 0.000 description 20
- 238000010586 diagram Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 10
- 238000007726 management method Methods 0.000 description 10
- 230000008569 process Effects 0.000 description 6
- 230000008901 benefit Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 239000013307 optical fiber Substances 0.000 description 3
- 238000010276 construction Methods 0.000 description 2
- 230000005855 radiation Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000005553 drilling Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例提供一种数据容灾的方法、系统、设备及存储介质。方法包括:生产主机将产生的生产数据写入第一生产中心;基于第一生产中心和第二生产中心之间的双活关系,第一生产中心将写入的生产数据同步写入第二生产中心;基于第一生产中心与本地灾备中心之间的第一周期复制关系,第一生产中心将写入的生产数据周期性同步至本地灾备中心,以及,基于第二生产中心与异地灾备中心之间的第二周期复制关系,第二生产中心将写入的生产数据周期性同步至异地灾备中心。旨在提升存储系统的容灾可靠性。
Description
技术领域
本申请涉及存储技术领域,尤其涉及一种数据容灾的方法、系统、设备及存储介质。
背景技术
两地三中心容灾解决方案中的“两地三中心”指的是一个生产中心、一个同城灾难备份中心、一个异地灾难备份中心,三者均用于对生产数据进行存储。生产中心与同城灾难备份中心之间为同步复制关系,即数据写入生产中心的同时也会写入同城灾难备份。同城灾难备份中心与异地灾难备份中心之间为周期异步复制关系,即数据写入同城灾难备份中心后,会周期性的将数据同步到异地灾难备份中心。生产中心和同城灾难备份中心距离较近,一般在同一机房,同城灾难备份中心与异地灾难备份中心距离较远,可能会跨机房甚至跨城市。通过该机制,数据可以在本地生成一个实时同步的副本,在异地生成一个次新的副本。在生产中心发生故障后,可以启用同城灾难备份中心保证业务持续进行。在更严重的本地机房发生故障后,可以启用异地灾难备份中心保证业务继续,而该容灾解决方案的可靠性仍有不足,如在生产中心故障时,该容灾解决方案中的整个存储系统将无法再进行生产数据的备份。
发明内容
有鉴于此,本申请提供一种数据容灾的方法、系统、设备及存储介质。旨在提升存储系统的容灾可靠性。
在本申请实施例的第一方面,提供了一种数据容灾的方法,所述方法包括:
生产主机将产生的生产数据写入第一生产中心;
基于第一生产中心和第二生产中心之间的双活关系,所述第一生产中心将写入的所述生产数据同步写入所述第二生产中心;
基于所述第一生产中心与本地灾备中心之间的第一周期复制关系,所述第一生产中心将写入的所述生产数据周期性同步至所述本地灾备中心,以及,基于所述第二生产中心与异地灾备中心之间的第二周期复制关系,所述第二生产中心将写入的所述生产数据周期性同步至所述异地灾备中心。
可选的,在生产主机将产生的生产数据写入第一生产中心之前,所述方法还包括:
将所述第一生产中心和所述第二生产中心均布置在目标机房,并建立双活关系;
将所述本地灾备中心布置在所述目标机房的第一预设距离范围内,并建立所述第一生产中心与所述本地灾备中心之间的第一周期复制关系;
将所述异地灾备中心布置在所述目标机房的第二预设距离范围内,并建立所述第二生产中心与所述异地灾备中心之间的第二周期复制关系。
可选的,所述方法还包括:
确定所述第一生产中心和所述第二生产中心是否故障;
在所述第一生产中心故障和所述第二生产中心未故障的情况下,通过仲裁确定所述第二生产中心接管生产数据写入业务。
可选的,所述方法还包括:
确定所述第一生产中心是否故障恢复;
在所述第一生产中心故障恢复的情况下,所述第二生产中心将所述第一生产中心故障期间的增量生产数据同步至所述第一生产中心;
确定所述增量生产数据是否在所述第一生产中心同步完成;
在所述增量生产数据在所述第一生产中心同步完成的情况下,恢复所述第一生产中心与所述本地灾备中心之间的连接并启动增量同步和启动所述本地灾备中心的保护快照;
所述第一生产中心将所述增量生产数据增量同步至所述本地灾备中心;
确定所述增量生产数据是否在所述本地灾备中心同步完成;
在所述增量生产数据在所述本地灾备中心同步完成的情况下,启动所述第一生产中心和所述第二生产中心的双写模式,并恢复所述第一生产中心和所述本地灾备中心之间的第一周期复制关系;
在预设时长后,所述第一生产中心接管生产数据写入业务。
可选的,所述方法还包括:在所述第一数据LUN和所述第二数据LUN均故障的情况下,
确定所述本地灾备中心的第三数据LUN和所述异地灾备中心的第四数据LUN是否故障;
在所述第三数据LUN和所述第四数据LUN均未故障的情况下,启动所述本地灾备中心接管生产数据写入业务,并切换所述生产主机至所述本地灾备中心对应的主机。
可选的,所述方法还包括:
确定所述第一生产中心和所述第二生产中心是否故障恢复;
在所述第一生产中心和所述第二生产中心均故障恢复的情况下,启动所述本地灾备中心的反向增量同步,并启动所述第一生产中心的保护快照;
基于所述第一周期复制关系,所述本地灾备中心将所述第一生产中心和所述第二生产中心故障期间的增量生产数据周期性同步至所述第一生产中心;
确定所述增量生产数据是否在所述第一生产中心同步完成;
在所述增量生产数据在所述第一生产中心同步完成的情况下,所述本地灾备中心启动反向周期同步,以将所述本地灾备中心中的生产数据周期性同步至所述第一生产中心;
确定所述本地灾备中心与所述第一生产中心之间是否完成生产数据同步;
在所述本地灾备中心与所述第一生产中心之间完成生产数据同步的情况下,启动所述第一生产中心接管生产数据写入业务,并切换所述本地灾备中心的主机至所述生产主机;
在所述本地灾备中心的主机切换至所述生产主机的情况下,所述本地灾备中心的反向周期同步切换为正向周期同步。
可选的,所述方法还包括:
确定所述第二生产中心是否完成所述生产数据的写入;
在所述第二生产中心完成所述生产数据的写入的情况下,所述第二生产中心向所述第一生产中心进行完成生产数据写入的应答;
根据接收到的所述应答,所述第一生产中心向所述生产主机进行完成生产数据写入的应答。
可选的,所述方法还包括:对所述本地灾备中心进行故障演练;
所述对所述本地灾备中心进行故障演练,包括:
在所述第一生产中心和所述第二生产中心正常状态下,所述生产主机和所述本地灾备中心对应的主机同时启动,并启动所述本地灾备中心的测试生产数据写入业务进行故障演练;
在所述本地灾备中心完成故障演练的情况下,关闭所述本地灾备中心对应的主机和测试生产数据写入业务,并启动所述本地灾备中心的保护快照;
所述第一生产中心中的增量数据对所述本地灾备中心中的测试生产数据进行增量覆盖同步;
在增量覆盖同步完成的情况下,恢复原始拓扑关系。
在本申请实施例的第二方面,本申请提供一种数据容灾的系统,所述系统包括第一生产中心、第二生产中心、本地灾备中心、异地灾备中心和生产主机:
所述生产主机,用于产生生产数据;
所述第一生产中心,用于同步所述生产主机产生的所述生产数据;
所述第二生产中心,用于基于所述第一生产中心和所述第二生产中心之间的双活关系,对所述第一生产中心中的所述生产数据进行实时同步;
所述本地灾备中心,用于基于所述第一生产中心与所述本地灾备中心之间的第一周期复制关系,对所述第一生产中心中的所述生产数据进行周期性同步;
所述异地灾备中心,用于基于所述第二生产中心与所述异地灾备中心之间的第二周期复制关系,对所述第二生产中心中的所述生产数据进行周期性同步。
在本申请实施例的第三方面,本申请提供一种电子设备,包括:处理器、存储器及存储在所述存储器上并在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如本申请第一方面所述的数据容灾的方法中的步骤。
在本申请实施例的第四方面,本申请提供一种计算机非易失性可读存储介质,所述计算机非易失性可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如本申请第一方面所述的数据容灾的方法中的步骤。
针对在先技术,本申请具备如下优点:
本申请实施例提供的一种数据容灾的方法,首先生产主机将产生的生产数据写入第一生产中心;基于第一生产中心和第二生产中心之间的双活关系,第一生产中心将写入的生产数据实时同步写入第二生产中心;基于第一生产中心与本地灾备中心之间的第一周期复制关系,第一生产中心将写入的生产数据周期性同步至本地灾备中心,以及,基于第二生产中心与异地灾备中心之间的第二周期复制关系,第二生产中心将写入的生产数据周期性同步至异地灾备中心。由此,两个生产中心组成双活关系,生产数据在写入第一生产中心的同时实时同步写入第二生产中心,而第一生产中心周期性的将写入自身的生产数据周期性同步写入本地灾备中心,而第二生产中心周期性的将写入自身的生产数据周期性同步写入异地灾备中心。这样即使在任意一个生产中心故障时,同样可以由另一个生产中心与对应的灾备中心进行生产数据同步,由此可有效提升整个存储系统(也就是由第一生产中心、第二生产中心、本地灾备中心和异地灾备中心构成的容灾存储系统)的容灾可靠性。
上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
图1为本申请实施例提供的一种数据容灾的方法的流程图;
图2示出了本申请实施例提供的一种数据容灾的方法的示意图;
图3示出了本申请实施例提供的一种数据容灾的方法中的容灾存储系统的结构图;
图4示出了本申请实施例提供的一种数据容灾的方法中的第一生产中心故障的容灾示意图;
图5示出了本申请实施例提供的一种数据容灾的方法中的第一生产中心故障恢复的容灾示意图;
图6示出了本申请实施例提供的一种数据容灾的方法中的生产中心均故障的容灾示意图;
图7示出了本申请实施例提供的一种数据容灾的方法中的生产中心均故障恢复的容灾示意图;
图8示出了本申请实施例提供的一种数据容灾的方法中的故障演练的容灾示意图;
图9示出了本申请实施例提供的一种数据容灾的系统的示意图;
图10示出了本申请实施例提供的一种电子设备的示意图。
具体实施方式
下面将参照附图更详细地描述本申请的实例性实施例。
在对本申请进行说明之前,先对后续所涉及的相关名词进行解释说明,以便于对实施方式的理解。
RPO:Recovery Point Objective,数据恢复点目标,主要指的是业务系统所能容忍的数据丢失量。RPO为0,指的是已提交的数据都不会被丢失。
RoCE:RDMA over Converged Ethernet,由InfiniBand Trade Association(IBTA)标准定义的网络协议,它允许数据从一台机器传输到另一台机器,而CPU完成的工作要少得多。通常,RoCE有两个主要版本:RoCEv1和RoCEv2。RoCE v1是以太网链路层协议,而RoCE v2是互联网层协议。RoCE实现了比其前身IWARP协议更低的延迟。此外,RoCE的高性价比、高性能、低功耗等优势,可以为现代商业数据中心带来诸多好处,特别适用于性能敏感或成本受限的计算环境,例如云计算。
LUN(Logical Unit Number)是存储领域的术语,用于标识存储设备中的逻辑单元。每个LUN都是存储设备中的一个独立逻辑单元,可以被操作系统或应用程序识别和访问。在存储系统中,LUN通常是由存储阵列(Storage Array)或存储控制器(StorageController)创建和管理的。一个存储设备可以包含多个LUN,每个LUN可以被视为一个独立的存储卷或逻辑磁盘。
图1为本申请实施例提供的一种数据容灾的方法的流程图,如图1所示,该方法包括:
步骤S1:生产主机将产生的生产数据写入第一生产中心。
在本实施例中,如图2所示,图2示出了本申请实施例提供的一种数据容灾的方法的示意图。如图2所示,生产主机用于对用户提交的业务进行执行,并在执行过程中产生相应的数据,该数据即为生产数据,在生产主机产生对应的生产数据后,生产主机将产生的生产数据直接写入容灾存储系统的第一生产中心的数据LUN中。
步骤S2:基于第一生产中心和第二生产中心之间的双活关系,所述第一生产中心将写入的所述生产数据同步写入所述第二生产中心。
在本实施例中,基于第一生产中心与第二生产中心之间建立的双活关系,在生产主机将产生的生产数据直接写入第一生产中心的同时,第一生产中心将写入到自身的数据LUN中的该生产数据实时同步写入到第二生产中心。由此第一生产中心和第二生产中心之间的RPO为0,也就是第一生产中心和第二生产中心两者备份的生产数据是相同的,不存在生产数据丢失的情况。
步骤S3:基于所述第一生产中心与本地灾备中心之间的第一周期复制关系,所述第一生产中心将写入的所述生产数据周期性同步至所述本地灾备中心,以及,基于所述第二生产中心与异地灾备中心之间的第二周期复制关系,所述第二生产中心将写入的所述生产数据周期性同步至所述异地灾备中心。
在本实施例中,基于第一生产中心和本地灾备中心之间的第一周期复制关系,第一生产中心将写入自身的数据LUN中的生产数据周期性的写入至本地灾备中心。同时,基于第二生产中心与异地灾备中心之间的第二周期复制关系,第二生产中心将写入自身的数据LUN中的生产数据周期性的写入至异地灾备中心。
本申请实施例提供的一种数据容灾的方法,首先生产主机将产生的生产数据写入第一生产中心;基于第一生产中心和第二生产中心之间的双活关系,第一生产中心将写入的生产数据同步写入第二生产中心;基于第一生产中心与本地灾备中心之间的第一周期复制关系,第一生产中心将写入的生产数据周期性同步至本地灾备中心,以及,基于第二生产中心与异地灾备中心之间的第二周期复制关系,第二生产中心将写入的生产数据周期性同步至异地灾备中心。由此,两个生产中心组成双活关系,生产数据在写入第一生产中心的同时同步写入第二生产中心,而第一生产中心周期性的将写入自身的生产数据周期性同步写入本地灾备中心,而第二生产中心周期性的将写入自身的生产数据周期性同步写入异地灾备中心。这样即使在任意一个生产中心故障时,同样可以由另一个生产中心与对应的灾备中心进行生产数据同步,由此可有效提升整个存储系统(也就是由第一生产中心、第二生产中心、本地灾备中心和异地灾备中心构成的容灾存储系统)的容灾可靠性。
结合以上实施例,在一种实施方式中,本申请实施例还提供了一种数据容灾的方法。在该数据容灾的方法中,该方法还包括步骤S4至步骤S6:
步骤S4:确定所述第二生产中心是否完成所述生产数据的写入。
在本实施例中,在将一个完整的生产数据写入第一生产中心的同时立即将该生产数据同步备份至第二生产中心,第二生产中心确定是否将该生产数据完全写入第二生产中心。
步骤S5:在所述第二生产中心完成所述生产数据的写入的情况下,所述第二生产中心向所述第一生产中心进行完成生产数据写入的应答;
在本实施例中,在第二生产中心将上述一个完整的生产数据完全写入自身的数据LUN后,第二生产中心将向第一生产中心进行完成该生产数据写入的应答,以告知第一生产中心作为即时备份的第二生产中心已经完成了该生产数据的写入。
步骤S6:根据接收到的所述应答,所述第一生产中心向所述生产主机进行完成生产数据写入的应答。
在本实施例中,第一生产中心在接收到的第二生产中心的上述应答后,第一生产中心随即向生产主机进行应答,以告知生产主机当前已完成在第一生产中心和第二生产中心的生产数据备份工作。
结合以上实施例,在一种实施方式中,本申请实施例还提供了一种数据容灾的方法。在该数据容灾的方法中,在步骤S1之前,该方法还包括步骤S01至步骤S03:
步骤S01:将所述第一生产中心和所述第二生产中心均布置在目标机房,并建立双活关系。
在本实施例中,首先确定一个用于布置生产中心的机房,然后将第一生产中心和第二生产中心均布置在该机房,该机房即为目标机房,然后建立第一生产中心和第二生产中心之间的双活关系,该双活关系指的是将第一生产中心和第二生产中心建立为集中式存储的双活架构,如图2所示,分别在双中心均部署存储来实现存储双活,将第一生产中心和第二生产中心通过光纤或RoCE链路进行连接,组成双活关系,或组成同步远程复制关系。无论是双活关系还是同步远程复制关系,在第一生产中心和第二生产中心进行生产数据备份时均为同步备份,也就是在将生产数据写入第一生产中心的同时,将该生产数据同步写入第二生产中心。
步骤S02:将所述本地灾备中心布置在所述目标机房的第一预设距离范围内,并建立所述第一生产中心与所述本地灾备中心之间的第一周期复制关系。
在本实施例中,将本地灾备中心布置在布置第一生产中心和第二生产中心的目标机房的第一预设距离范围内,以使得本地灾备中心与目标机房处于同一个城市,同时将第一生产中心和本地灾备中心通过光纤,或RoCE,或IP链路进行连接。其中,该第一预设距离范围的大小基于目标机房所处于的城市的大小进行确定,在此不做具体限定,例如,在目标机房所处于的城市辐射半径为100公里的情况下,将第一预设距离范围确定为100公里至200公里的距离范围。同时,建立第一生产中心与本地灾备中心之间的第一周期复制关系,该第一周期复制关系表征的是第一生产中心将在设定周期下每隔第一设定时长将写入自身的数据LUN中的生产数据同步至本地灾备中心,其中,该第一设定时长可根据实际应用场景进行设定,在此不做具体限定,如3分钟、5分钟等。应当理解的是,第一生产中心基于第一周期复制关系每次写入本地灾备中心的生产数据都是第一生产中心之前未写入过本地灾备中心的生产数据。
步骤S03:将所述异地灾备中心布置在所述目标机房的第二预设距离范围内,并建立所述第二生产中心与所述异地灾备中心之间的第二周期复制关系。
在本实施例中,将异地灾备中心布置在布置第一生产中心和第二生产中心的目标机房的第二预设距离范围内,以使得本地灾备中心与目标机房不处于同一个城市,同时将第二生产中心和异地灾备中心通过光纤,或RoCE,或IP链路进行连接。其中,该第二预设距离范围的大小基于目标机房所处于的城市的大小进行确定,在此不做具体限定,例如,在目标机房所处于的城市辐射半径为100公里的情况下,将第二预设距离范围确定为200公里至500公里的距离范围。同时,建立第二生产中心与异地灾备中心之间的第二周期复制关系,该第二周期复制关系表征的是第二生产中心将在设定周期下每隔第二设定时长将写入自身的数据LUN中的生产数据同步至异地灾备中心,其中,该第二设定时长可根据实际应用场景进行设定,在此不做具体限定,如3分钟、5分钟等。应当理解的是,第二生产中心基于第二周期复制关系每次写入异地灾备中心的生产数据都是第二生产中心之前未写入过异地灾备中心的生产数据。其中,为保证容灾存储系统在发生故障时有更多的生产数据可以被备份,将上述第一设定时长和第二设定时长设定为不同取值。
在本实施例中,如图3所示,分别为第一生产中心、第二生产中心、本地灾备中心和异地灾备中心设置灾备管理服务器,用于实现第一生产中心、第二生产中心、本地灾备中心和异地灾备中心的各项灾备功能,包括但不限于保护快照、增量同步、反向增量同步、恢复原始拓扑等功能,同时提供启用本地灾备中心执行生产数据写入业务和启用异地灾备中心执行生产数据写入业务的功能。第一生产中心设置应用服务器用于为用户提供数据写入业务的服务器,第二生产中心、本地灾备中心和异地灾备中心则设置灾备服务器,在第一生产中心故障的情况下,根据实际场景控制与该实际场景对应的灾备服务器接管用户的数据写入业务,例如由第二生产中心的灾备服务器接管用户的数据写入业务,或由本地灾备中心的灾备服务器接管用户的数据写入业务,或由异地灾备中心的灾备服务器接管用户的数据写入业务。其中,在由本地灾备中心的灾备服务器接管用户的数据写入业务时,需要将为用户提供主机业务的生产主机切换为本地灾备中心对应的主机,如图2中的本地灾备主机;在由异地灾备中心的灾备服务器接管用户的数据写入业务时,需要将为用户提供主机业务的生产主机切换为异地灾备中心对应的主机,如图2中的异地灾备主机。
结合以上实施例,在一种实施方式中,本申请实施例还提供了一种数据容灾的方法。在该数据容灾的方法中,该方法还包括步骤S21至步骤S22:
步骤S21:确定各个生产中心和各个灾备中心是否故障。
在本实施例中,如图4所示,通过第一生产中心配置的灾备管理服务器确定第一生产中心是否故障,以及通过第二生产中心配置的灾备管理服务器确定第二生产中心是否故障,以及通过本地灾备中心的灾备管理服务器确定本地灾备中心是否故障,以及通过异地灾备中心的灾备管理服务器确定异地灾备中心是否故障。
步骤S22:在所述第一生产中心故障故障的情况下,通过仲裁确定所述第二生产中心接管生产数据写入业务。
在本实施例中,如图4所示,在第一生产中心、第二生产中心、本地灾备中心和异地灾备中心四者中只有第一生产中心故障的情况下,此时通过同时与第一生产中心和第二生产中心连接的仲裁服务器对第一生产中心和第二生产中心进行仲裁,由于第一生产中心故障,将使得第二生产中心获得仲裁,也就是将使得第二生产中心后续为用户提供生产数据的写入业务,此时仲裁服务器会控制第二生产中心接管对生产主机的生产数据的写入业务。此时由于第一生产中心故障,第一生产数据的第一数据LUN下线,第一生产中心和本地灾备中心之间的数据备份链路断开,本地灾备中心无法再对第一生产中心的数据进行周期性同步。第二生产中心与异地灾备中心之间的数据备份链路仍旧处于正常工作状态,写入第二生产中心的生产数据继续通过第二周期复制关系周期性同步至异地灾备中心。
结合以上实施例,在一种实施方式中,本申请实施例还提供了一种数据容灾的方法。在该数据容灾的方法中,该方法还包括步骤S23至步骤S28:
步骤S23:确定所述第一生产中心是否故障恢复。
在本实施例中,通过第一生产中心的灾备管理服务器确定第一生产中心是否由故障状态恢复至正常状态。
步骤S24:在所述第一生产中心故障恢复的情况下,所述第二生产中心将所述第一生产中心故障期间的增量生产数据同步至所述第一生产中心。
在本实施例中,如图5所示,在原本只有第一生产中心故障的情况下,第一生产中心又从故障状态恢复为正常状态时,第二生产中心启动反向增量同步功能,将第一生产中心故障时间段内的第二生产中心通过执行生产数据写入业务产生的增量生产数据同步备份至第一生产中心。
步骤S25:确定所述增量生产数据是否在所述第一生产中心同步完成。
在本实施例中,实时监测第二生产中心是否将第一生产中心故障时间段内的所有增量生产数据均同步备份至第一生产中心。
步骤S26:在所述增量生产数据在所述第一生产中心同步完成的情况下,恢复所述第一生产中心与所述本地灾备中心之间的连接并启动增量同步和启动所述本地灾备中心的保护快照。
在本实施例中,在第二生产中心将第一生产中心故障时间段内的所有增量生产数据均同步备份至第一生产中心后,第一生产中心与本地灾备中心之间的连接自动恢复,并启动第一生产中心与本地灾备中心之间的增量同步功能。同时,为保证该周期性同步过程中本地灾备中心中被备份的数据的一致性,在第一生产中心与本地灾备中心之间的连接恢复的同时启动本地灾备中心的保护快照功能。
步骤S27:所述第一生产中心将所述增量生产数据增量同步至所述本地灾备中心。
在本实施例中,在恢复第一生产中心和本地灾备中心之间的连接和启动两者之间的增量同步和启动本地灾备中心的保护快照功能后,第一生产中心将从第二生产中心同步过来的增量生产数据,再增量同步至本地灾备中心。
步骤S28:确定所述增量生产数据是否在所述本地灾备中心同步完成。
在本实施例中,实时监测第一生产中心是否将第一生产中心故障时间段内的所有增量生产数据增量同步至本地灾备中心。
步骤S29:在所述增量生产数据在所述本地灾备中心同步完成的情况下,启动所述第一生产中心和所述第二生产中心的双写模式,并恢复所述第一生产中心和所述本地灾备中心之间的第一周期复制关系。
在本实施例中,为保证第一生产中心避免在由故障恢复正常并完成增量数据备份后随即接管生产数据的写入业务带来的生产数据写入压力,在第一生产中心将第一生产中心故障时间段内的所有增量生产数据均周期性同步至本地灾备中心后,启动第一生产中心和第二生产中心的双写模型,也就是第一生产中心和第二生产中心均执行生产数据的写入业务,同时由第一生产中心与本地灾备中心之间的增量同步关系切换为第一周期复制关系。
步骤S210:在预设时长后,所述第一生产中心接管生产数据写入业务。
在本实施例中,在第一生产中心恢复正常的预设时长后,由第一生产中心完全接管生产数据的写入业务。其中,该预设时长可根据实际应用场景进行设定,在此不做具体限定,如10分钟,30分钟,1小时等。
结合以上实施例,在一种实施方式中,本申请实施例还提供了一种数据容灾的方法。在该数据容灾的方法中,该方法还包括步骤S221:在所述第一生产中心和所述第二生产中心均故障的情况下,启动所述本地灾备中心接管生产数据写入业务,并切换所述生产主机至所述本地灾备中心对应的主机。
在本实施例中,如图6所示,在第一生产中心、第二生产中心、本地灾备中心和异地灾备中心四者中第一生产中心和第二生产中心均故障的情况下,此时第一生产中心和第二生产中心均无法进行生产数据写入业务的执行,此时由于本地灾备中心距离生产中心更近,将其作为新的执行生产数据写入业务的节点可以保证数据写入的速率,此时本地灾备中心的灾备服务器接收到第一生产中心和第二生产中心均故障的信息后,启动本地灾备中心接管生产数据的写入业务,然后将原本执行用户的生产数据的产生业务的与第一生产中心和第二生产中心连接的生产主机切换为与本地灾备中心连接的主机,从而使得本地灾备中心连接的主机能够继续向外提供主机业务。此时,由于第一生产中心和第二生产中心均为故障状态,本地灾备中心和异地灾备中心均不再进行生产数据的同步工作。
在本实施例中,对于第一生产中心、第二生产中心、本地灾备中心和异地灾备中心四者中第一生产中心、第二生产中心和本地灾备中心均故障的情况下,此时将智能启动异地灾备中心接管生产数据的写入业务,然后将原本执行用户的生产数据的产生业务的与第一生产中心和第二生产中心连接的生产主机切换为与异地灾备中心连接的主机,从而使得异地灾备中心连接的主机能够继续向外提供主机业务。
结合以上实施例,在一种实施方式中,本申请实施例还提供了一种数据容灾的方法。在该数据容灾的方法中,该方法还包括步骤S222至步骤S229:
步骤S222:确定所述第一生产中心和所述第二生产中心是否故障恢复。
在本实施例中,在步骤S221确定到第一生产中心、第二生产中心、本地灾备中心和异地灾备中心四者中第一生产中心和第二生产中心均故障之后,通过第一生产中心的灾备管理服务器确定第一生产中心是否由故障状态恢复至正常状态,以及通过第二生产中心的灾备管理服务器确定第二生产中心是否由故障状态恢复至正常状态。
步骤S223:在所述第一生产中心和所述第二生产中心均故障恢复的情况下,启动所述本地灾备中心的反向增量同步,并启动所述第一生产中心的保护快照。
在本实施例中,如图7所示,在步骤S222确定到第一生产中心和第二生产中心均由故障恢复至正常状态后,此时本地灾备中心自动启动反向增量同步功能,以将第一生产中心和第二生产中心均处于故障状态的时间段下由本地灾备中心执行生产数据写入业务所写入的增量生产数据同步至第一生产中心,同时为保证同步至第一生产中心的增量生产数据的一致性,因此在进行反向增量同步之前启动第一生产中心的保护快照功能。
步骤S224:基于所述第一周期复制关系,所述本地灾备中心将所述第一生产中心和所述第二生产中心故障期间的增量生产数据周期性同步至所述第一生产中心。
在本实施例中,在本地灾备中心启动反向增量同步,同时第一生产中心启动保护快照后,本地灾备中心通过反向增量同步将本地灾备中心在第一生产中心和第二生产中心均故障的时间段下由本地灾备中心执行生产数据写入业务所写入的增量生产数据同步至第一生产中心。同时,第一生产中心在接收到本地灾备中心同步过来的增量生产数据的同时实时同步备份至第二生产中心,也就是只要有增量生产数据反向增量同步至第一生产中心时,马上将该增量生产数据实时同步备份至第二生产中心。而第二生产中心则基于第二周期复制关系将由第一生产中心同步备份过来的增量生产数据周期性同步至异地灾备中心。
步骤S225:确定所述增量生产数据是否在所述第一生产中心同步完成。
在本实施例中,实时监测本地灾备中心是否将第一生产中心和第二生产中心故障时间段内的所有增量生产数据均反向增量同步至第一生产中心。
步骤S226:在所述增量生产数据在所述第一生产中心同步完成的情况下,所述本地灾备中心启动反向周期同步,以将所述本地灾备中心中的生产数据周期性同步至所述第一生产中心。
在本实施例中,在本地灾备中心将第一生产中心和第二生产中心故障时间段内的所有增量生产数据均反向增量同步至第一生产中心的情况下,启动本地灾备中心的反向周期同步,同时继续由本地灾备中心执行生产数据的写入业务,该反向周期同步同样是以第一周期复制关系中的周期进行同步,只是是由本地灾备中心向第一生产中心进行周期性同步。
步骤S227:确定所述本地灾备中心与所述第一生产中心之间是否完成生产数据同步。
在本实施例中,在启动本地灾备中心的反向周期同步,同时继续由本地灾备中心执行生产数据的写入业务的过程中,本地灾备中心会监测自身还有多少新写入的生产数据未反向周期同步至第一生产中心,在该未反向周期同步至第一生产中心的生产数据不足一个时间周期(该时间周期为第一周期复制关系中的一个周期,如每隔5分钟进行一次反向周期同步,不足一个时间周期指的就是新写入本地灾备中心的生产数据不足5分钟,也就是本地灾备中心和第一生产中心之间的生产数据差异不足5分钟的量)的情况下,本地灾备中心自动关闭生产数据的写入业务,并等待到最近的一个反向周期同步的周期性同步时间点时,将本地灾备中心中的生产数据反向周期同步至第一生产中心,此时确定本地灾备中心与第一生产中心之间完成生产数据同步。
示例地,第一周期复制关系为每隔1分钟进行一次周期性同步,在本地灾备中心监测自身还有50秒新写入的生产数据未反向周期同步至第一生产中心的生产数据的情况下,而50秒不足1分钟,此时本地灾备中心自动关闭生产数据的写入业务,并等待到1分钟的周期性同步时间点时,也就是再等待10秒后,本地灾备中心将该写入本地灾备中心而未反向周期同步至第一生产中心的50秒生产数据反向周期性同步至第一生产中心,此时确定本地灾备中心与第一生产中心之间完成生产数据同步,本地灾备中心和第一生产中心的生产数据是一致的。
步骤S228:在所述本地灾备中心与所述第一生产中心之间完成生产数据同步的情况下,启动所述第一生产中心接管生产数据写入业务,并切换所述本地灾备中心的主机至所述生产主机。
在本实施例中,在确定本地灾备中心与第一生产中心之间完成生产数据同步的情况下,启动第一生产中心的生产数据写入业务以接管本地灾备中心的生产数据写入业务,同时将用于执行用户的生产数据的产生业务的与本地灾备中心连接的主机切换为与第一生产中心连接的生产主机,也就是不再由本地灾备中心对应的主机执行用户的生产数据的产生业务,而由与第一生产中心连接的生产主机执行用户的生产数据的产生业务。
步骤S229:在所述本地灾备中心的主机切换至所述生产主机的情况下,所述本地灾备中心的反向周期同步切换为正向周期同步。
在本实施例中,在将用于执行用户的生产数据的产生业务的与本地灾备中心连接的主机切换为与第一生产中心连接的生产主机后,本地灾备中心由反向周期同步自动切换为正向周期同步,也就是恢复第一生产中心与本地灾备中心之间的第一周期复制关系。此时,整个灾备系统将恢复至初始拓扑关系,也就是由第一生产中心执行生产数据写入业务,第二生产中心实时同步备份写入第一生产中心的生产数据,本地灾备中心基于第一周期复制关系周期性同步写入第一生产中心的生产数据,异地灾备中心基于第二周期复制关系周期性同步写入第二生产中心的生产数据。
结合以上实施例,在一种实施方式中,本申请实施例还提供了一种数据容灾的方法。在该数据容灾的方法中,该方法还包括步骤S7:对所述本地灾备中心进行故障演练。步骤S7包括步骤S71至步骤S74。
步骤S71:在所述第一生产中心和所述第二生产中心正常状态下,所述生产主机和所述本地灾备中心对应的主机同时启动,并启动所述本地灾备中心的测试生产数据写入业务进行故障演练。
在本实施例中,本申请提供的数据容灾的方法还可以用于对本地灾备中心进行故障演练,以模拟在第一生产中心和第二生产中心故障的情况下,本地灾备中心是否能正常进行生产数据写入业务和本地灾备中心对应的主机是否能正常执行用户的生产数据的产生业务。具体地,通过本地灾备中心的灾备管理服务器启动本地灾备中心的测试生产数据写入业务,同时启动与本地灾备中心连接的主机,并控制第一生产数据与本地灾备中心之间的数据传输链路处于空闲状态。此时第一生产中心、第二生产中心和异地灾备中心均处于正常工作状态,只是将本地灾备中心独立出去执行测试生产数据写入业务和执行测试生产数据的产生业务,并不再接收第一生产中心的周期性同步的生产数据。在启动后,由与本地灾备中心连接的主机进行测试生产数据的产生业务,将产生的测试生产数据写入本地灾备中心。此时本地灾备中心执行测试生产数据的写入业务,第一生产中心执行生产数据的写入业务,同时第一生产中心不会将写入的生产数据周期性同步至本地灾备中心。通过故障演练确定本地灾备中心是否能正常执行测试生产数据的写入业务,以及确定与本地灾备中心连接的主机是否能正产执行测试生产数据的产生业务,在两者均能正常执行各自的业务的情况下,确定对本地灾备中心的故障演练通过。
步骤S72:在所述本地灾备中心完成故障演练的情况下,关闭所述本地灾备中心对应的主机和测试生产数据写入业务,并启动所述本地灾备中心的保护快照。
在本实施例中,在确定本地灾备中心的故障演练完成的情况下,本地灾备中心的灾备管理服务器关闭本地灾备中心对应的主机和关闭本地灾备中心的测试生产数据写入业务,同时开启第一生产中心与本地灾备中心之间的增量覆盖同步功能和启动本地灾备中心的保护快照,以准备同步由第一生产中心在故障演练阶段所写入的增量生产数据。
步骤S73:所述第一生产中心中的增量数据对所述本地灾备中心中的测试生产数据进行增量覆盖同步。
在本实施例中,如图8所示,在本地灾备中心启动保护快照和与第一生产中心之间的增量覆盖同步后,第一生产中心将本地灾备中心进行故障演练期间的增量生产数据增量覆盖同步至本地灾备中心,该增量覆盖同步是指第一生产中心将本地灾备中心进行故障演练期间的增量生产数据增量同步至本地灾备中心时覆盖掉本地灾备中心写入的测试生产数据。这是因为本地灾备中心的测试生产数据并不是实际用户产生和需要的生产数据,而是一种测试数据,并不是用户和服务商所需要长期备份的有用数据,因此将其覆盖掉以避免存储空间的浪费。
步骤S74:在增量覆盖同步完成的情况下,恢复原始拓扑关系。
在本实施例中,在增量覆盖同步完成的情况下,恢复原始拓扑关系,也就是恢复为由第一生产中心执行生产数据写入业务,第二生产中心进行对第一生产中心中的生产数据的实时同步,第一生产中心与本地灾备中心进行第一周期复制关系的生产数据周期性同步,第二生产中心与异地灾备中心进行第二周期复制关系的生产数据周期性同步。
基于同一发明构思,本申请第二方面提供一种数据容灾的系统,如图9所示,所述系统包括第一生产中心901、第二生产中心902、本地灾备中心903、异地灾备中心904和生产主机905:
所述生产主机905,用于产生生产数据;
所述第一生产中心901,用于同步所述生产主机产生的所述生产数据;
所述第二生产中心902,用于基于所述第一生产中心和所述第二生产中心之间的双活关系,对所述第一生产中心中的所述生产数据进行实时同步;
所述本地灾备中心903,用于基于所述第一生产中心与所述本地灾备中心之间的第一周期复制关系,对所述第一生产中心中的所述生产数据进行周期性同步;
所述异地灾备中心904,用于基于所述第二生产中心与所述异地灾备中心之间的第二周期复制关系,对所述第二生产中心中的所述生产数据进行周期性同步。
可选地,所述系统900还包括:
双活关系建立模块,用于将所述第一生产中心和所述第二生产中心均布置在目标机房,并建立双活关系;
第一周期复制关系构建模块,用于将所述本地灾备中心布置在所述目标机房的第一预设距离范围内,并建立所述第一生产中心与所述本地灾备中心之间的第一周期复制关系;
第二周期复制关系构建模块,用于将所述异地灾备中心布置在所述目标机房的第二预设距离范围内,并建立所述第二生产中心与所述异地灾备中心之间的第二周期复制关系。
可选地,所述系统900还包括:
故障确定模块,用于确定各个生产中心和各个灾备中心是否故障;
第一业务接管模块,用于在所述第一生产中心故障故障的情况下,通过仲裁确定所述第二生产中心接管生产数据写入业务。
可选地,所述系统900还包括:
第一故障恢复确定模块,用于确定所述第一生产中心是否故障恢复;
第一增量同步模块,用于在所述第一生产中心故障恢复的情况下,所述第二生产中心将所述第一生产中心故障期间的增量生产数据同步至所述第一生产中心;
第一同步完成确定模块,用于确定所述增量生产数据是否在所述第一生产中心同步完成;
第一连接恢复模块,用于在所述增量生产数据在所述第一生产中心同步完成的情况下,恢复所述第一生产中心与所述本地灾备中心之间的连接并启动增量同步和启动所述本地灾备中心的保护快照;
第二增量同步模块,用于所述第一生产中心将所述增量生产数据增量同步至所述本地灾备中心;
第二同步完成确定模块,用于确定所述增量生产数据是否在所述本地灾备中心同步完成;
第二连接恢复模块,用于在所述增量生产数据在所述本地灾备中心同步完成的情况下,启动所述第一生产中心和所述第二生产中心的双写模式,并恢复所述第一生产中心和所述本地灾备中心之间的第一周期复制关系;
第二业务接管模块,用于在预设时长后,所述第一生产中心接管生产数据写入业务。
可选地,所述系统900还包括:
第三业务接管模块,用于在所述第一生产中心和所述第二生产中心均故障的情况下,启动所述本地灾备中心接管生产数据写入业务,并切换所述生产主机至所述本地灾备中心对应的主机。
可选地,所述系统900还包括:
第二故障恢复确定模块,用于确定所述第一生产中心和所述第二生产中心是否故障恢复;
第三增量同步模块,用于在所述第一生产中心和所述第二生产中心均故障恢复的情况下,启动所述本地灾备中心的反向增量同步,并启动所述第一生产中心的保护快照;
第一周期性同步模块,用于基于所述第一周期复制关系,所述本地灾备中心将所述第一生产中心和所述第二生产中心故障期间的增量生产数据周期性同步至所述第一生产中心;
第三同步完成确定模块,用于确定所述增量生产数据是否在所述第一生产中心同步完成;
第二周期性同步模块,用于在所述增量生产数据在所述第一生产中心同步完成的情况下,所述本地灾备中心启动反向周期同步,以将所述本地灾备中心中的生产数据周期性同步至所述第一生产中心;
第四同步完成确定模块,用于确定所述本地灾备中心与所述第一生产中心之间是否完成生产数据同步;
第四业务接管模块,用于在所述本地灾备中心与所述第一生产中心之间完成生产数据同步的情况下,启动所述第一生产中心接管生产数据写入业务,并切换所述本地灾备中心的主机至所述生产主机;
同步切换模块,用于在所述本地灾备中心的主机切换至所述生产主机的情况下,所述本地灾备中心的反向周期同步切换为正向周期同步。
可选地,所述系统900还包括:
第五同步完成确定模块,用于确定所述第二生产中心是否完成所述生产数据的写入;
第一应答模块,用于在所述第二生产中心完成所述生产数据的写入的情况下,所述第二生产中心向所述第一生产中心进行完成生产数据写入的应答;
第二应答模块,用于根据接收到的所述应答,所述第一生产中心向所述生产主机进行完成生产数据写入的应答。
可选地,所述系统900还包括:故障演练模块,用于对所述本地灾备中心进行故障演练;所述故障演练模块,包括:
故障演练子模块模块,用于在所述第一生产中心和所述第二生产中心正常状态下,所述生产主机和所述本地灾备中心对应的主机同时启动,并启动所述本地灾备中心的测试生产数据写入业务进行故障演练;
业务切换模块,用于在所述本地灾备中心完成故障演练的情况下,关闭所述本地灾备中心对应的主机和测试生产数据写入业务,并启动所述本地灾备中心的保护快照;
增量覆盖模块,用于所述第一生产中心中的增量数据对所述本地灾备中心中的测试生产数据进行增量覆盖同步;
拓扑关系恢复模块,用于在增量覆盖同步完成的情况下,恢复原始拓扑关系。
基于同一发明构思,在本申请实施例的第三方面,如图10所示,图10为本申请实施例提供的一种电子设备的示意图。本申请提供一种电子设备1000,包括:处理器1001、存储器1002及存储在所述存储器上并在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如本申请第一方面所述的数据容灾的方法中的步骤。
基于同一发明构思,在本申请实施例的第四方面,本申请提供一种计算机非易失性可读存储介质,所述计算机非易失性可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现本申请第一方面所述的数据容灾的方法中的步骤。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机非易失性可读存储介质中,或者从一个计算机非易失性可读存储介质向另一个计算机非易失性可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机非易失性可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本申请的较佳实施例而已,并非用于限定本申请的保护范围。凡在本申请的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本申请的保护范围内。
Claims (11)
1.一种数据容灾的方法,其特征在于,所述方法包括:
生产主机将产生的生产数据写入第一生产中心;
基于第一生产中心和第二生产中心之间的双活关系,所述第一生产中心将写入的所述生产数据同步写入所述第二生产中心;
基于所述第一生产中心与本地灾备中心之间的第一周期复制关系,所述第一生产中心将写入的所述生产数据周期性同步至所述本地灾备中心,以及,基于所述第二生产中心与异地灾备中心之间的第二周期复制关系,所述第二生产中心将写入的所述生产数据周期性同步至所述异地灾备中心。
2.根据权利要求1所述的数据容灾的方法,其特征在于,在生产主机将产生的生产数据写入第一生产中心之前,所述方法还包括:
将所述第一生产中心和所述第二生产中心均布置在目标机房,并建立双活关系;
将所述本地灾备中心布置在所述目标机房的第一预设距离范围内,并建立所述第一生产中心与所述本地灾备中心之间的第一周期复制关系;
将所述异地灾备中心布置在所述目标机房的第二预设距离范围内,并建立所述第二生产中心与所述异地灾备中心之间的第二周期复制关系。
3.根据权利要求2所述的数据容灾的方法,其特征在于,所述方法还包括:
确定各个生产中心和各个灾备中心是否故障;
在所述第一生产中心故障故障的情况下,通过仲裁确定所述第二生产中心接管生产数据写入业务。
4.根据权利要求3所述的数据容灾的方法,其特征在于,所述方法还包括:
确定所述第一生产中心是否故障恢复;
在所述第一生产中心故障恢复的情况下,所述第二生产中心将所述第一生产中心故障期间的增量生产数据同步至所述第一生产中心;
确定所述增量生产数据是否在所述第一生产中心同步完成;
在所述增量生产数据在所述第一生产中心同步完成的情况下,恢复所述第一生产中心与所述本地灾备中心之间的连接并启动增量同步和启动所述本地灾备中心的保护快照;
所述第一生产中心将所述增量生产数据增量同步至所述本地灾备中心;
确定所述增量生产数据是否在所述本地灾备中心同步完成;
在所述增量生产数据在所述本地灾备中心同步完成的情况下,启动所述第一生产中心和所述第二生产中心的双写模式,并恢复所述第一生产中心和所述本地灾备中心之间的第一周期复制关系;
在预设时长后,所述第一生产中心接管生产数据写入业务。
5.根据权利要求3所述的数据容灾的方法,其特征在于,所述方法还包括:
在所述第一生产中心和所述第二生产中心均故障的情况下,启动所述本地灾备中心接管生产数据写入业务,并切换所述生产主机至所述本地灾备中心对应的主机。
6.根据权利要求5所述的数据容灾的方法,其特征在于,所述方法还包括:
确定所述第一生产中心和所述第二生产中心是否故障恢复;
在所述第一生产中心和所述第二生产中心均故障恢复的情况下,启动所述本地灾备中心的反向增量同步,并启动所述第一生产中心的保护快照;
基于所述第一周期复制关系,所述本地灾备中心将所述第一生产中心和所述第二生产中心故障期间的增量生产数据周期性同步至所述第一生产中心;
确定所述增量生产数据是否在所述第一生产中心同步完成;
在所述增量生产数据在所述第一生产中心同步完成的情况下,所述本地灾备中心启动反向周期同步,以将所述本地灾备中心中的生产数据周期性同步至所述第一生产中心;
确定所述本地灾备中心与所述第一生产中心之间是否完成生产数据同步;
在所述本地灾备中心与所述第一生产中心之间完成生产数据同步的情况下,启动所述第一生产中心接管生产数据写入业务,并切换所述本地灾备中心的主机至所述生产主机;
在所述本地灾备中心的主机切换至所述生产主机的情况下,所述本地灾备中心的反向周期同步切换为正向周期同步。
7.根据权利要求1所述的数据容灾的方法,其特征在于,所述方法还包括:
确定所述第二生产中心是否完成所述生产数据的写入;
在所述第二生产中心完成所述生产数据的写入的情况下,所述第二生产中心向所述第一生产中心进行完成生产数据写入的应答;
根据接收到的所述应答,所述第一生产中心向所述生产主机进行完成生产数据写入的应答。
8.根据权利要求1所述的数据容灾的方法,其特征在于,所述方法还包括:对所述本地灾备中心进行故障演练;
所述对所述本地灾备中心进行故障演练,包括:
在所述第一生产中心和所述第二生产中心正常状态下,所述生产主机和所述本地灾备中心对应的主机同时启动,并启动所述本地灾备中心的测试生产数据写入业务进行故障演练;
在所述本地灾备中心完成故障演练的情况下,关闭所述本地灾备中心对应的主机和测试生产数据写入业务,并启动所述本地灾备中心的保护快照;
所述第一生产中心中的增量数据对所述本地灾备中心中的测试生产数据进行增量覆盖同步;
在增量覆盖同步完成的情况下,恢复原始拓扑关系。
9.一种数据容灾的系统,其特征在于,所述系统包括第一生产中心、第二生产中心、本地灾备中心、异地灾备中心和生产主机:
所述生产主机,用于产生生产数据;
所述第一生产中心,用于同步所述生产主机产生的所述生产数据;
所述第二生产中心,用于基于所述第一生产中心和所述第二生产中心之间的双活关系,对所述第一生产中心中的所述生产数据进行实时同步;
所述本地灾备中心,用于基于所述第一生产中心与所述本地灾备中心之间的第一周期复制关系,对所述第一生产中心中的所述生产数据进行周期性同步;
所述异地灾备中心,用于基于所述第二生产中心与所述异地灾备中心之间的第二周期复制关系,对所述第二生产中心中的所述生产数据进行周期性同步。
10.一种电子设备,其特征在于,包括:处理器、存储器及存储在所述存储器上并在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至8中任一项所述的数据容灾的方法中的步骤。
11.一种计算机非易失性可读存储介质,其特征在于,所述计算机非易失性可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至8中任一项所述的数据容灾的方法中的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311586489.0A CN117743026A (zh) | 2023-11-24 | 2023-11-24 | 一种数据容灾的方法、系统、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311586489.0A CN117743026A (zh) | 2023-11-24 | 2023-11-24 | 一种数据容灾的方法、系统、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117743026A true CN117743026A (zh) | 2024-03-22 |
Family
ID=90259931
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311586489.0A Pending CN117743026A (zh) | 2023-11-24 | 2023-11-24 | 一种数据容灾的方法、系统、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117743026A (zh) |
-
2023
- 2023-11-24 CN CN202311586489.0A patent/CN117743026A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7577867B2 (en) | Cross tagging to data for consistent recovery | |
CN107533499B (zh) | 用于在存储系统之间执行故障转移的方法和系统 | |
US9268659B2 (en) | Detecting failover in a database mirroring environment | |
US7793060B2 (en) | System method and circuit for differential mirroring of data | |
TWI625621B (zh) | 用於資料庫中進行回復的方法、電腦可用程式產品、與資料處理系統 | |
US9842033B2 (en) | Storage cluster failure detection | |
US9311191B2 (en) | Method for a source storage device sending data to a backup storage device for storage, and storage device | |
US9026696B1 (en) | Using I/O track information for continuous push with splitter for storage device | |
US8667330B1 (en) | Information lifecycle management assisted synchronous replication | |
JP4573310B2 (ja) | ストレージ・サブシステム全体にわたる整合的な更新のための方法、システム、およびコンピュータ・プログラム | |
US9329949B2 (en) | Comprehensive error management capabilities for disaster recovery operations | |
CN104158693B (zh) | 数据服务的容灾备份方法和系统 | |
US20140325272A1 (en) | Data transfer and recovery process | |
MXPA06005797A (es) | Sistema y metodo para la recuperacion en caso de fallas. | |
JP2010515987A (ja) | フェイルオーバおよびフェイルバック環境における仮想コピーの使用のための方法、システム、およびプログラム | |
WO2017014814A1 (en) | Replicating memory volumes | |
CN112380062A (zh) | 一种基于系统备份点多次快速恢复系统的方法及系统 | |
JPH086910A (ja) | クラスタ型計算機システム | |
CN114138732A (zh) | 一种数据处理方法及装置 | |
WO2015104835A1 (ja) | データベースシステムの制御方法及びデータベースシステム | |
CN109117317A (zh) | 一种集群故障恢复方法和相关装置 | |
CN111984474A (zh) | 一种双控集群故障恢复的方法、系统及设备 | |
CN117743026A (zh) | 一种数据容灾的方法、系统、设备及存储介质 | |
JP2953639B2 (ja) | バックアップ装置及びその方法 | |
US11249868B2 (en) | Method of fault management in a network of nodes and associated part of network of nodes |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |