CN101635638B - 一种容灾系统及其容灾方法 - Google Patents
一种容灾系统及其容灾方法 Download PDFInfo
- Publication number
- CN101635638B CN101635638B CN200810142532A CN200810142532A CN101635638B CN 101635638 B CN101635638 B CN 101635638B CN 200810142532 A CN200810142532 A CN 200810142532A CN 200810142532 A CN200810142532 A CN 200810142532A CN 101635638 B CN101635638 B CN 101635638B
- Authority
- CN
- China
- Prior art keywords
- data
- backup
- management unit
- disaster tolerance
- remote
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种容灾系统及其容灾方法,所述方法为:(1)数据备份管理单元对当前生产站点的数据进行本地备份,记录备份数据的顺序,并对其可靠性进行校验;(2)远程存储转发管理单元对备份数据进行远程复制并存储;(3)远程存储转发管理单元对备份数据的可靠性进行校验,成功后将其映射到数据存储管理单元中进行存储,并将其并发到各备用生产站点;(4)所述生产站点发生灾难性故障时,容灾管理单元启用备用生产站点,并进行数据的快速恢复。本发明所提出的容灾系统采用分布式容灾系统结构:网络服务系统容灾和网络存储系统容灾,将网络安全机制和网络容灾机制集成一体,整个系统具有很强的系统防护和灾难容忍能力,还改善了系统服务质量。
Description
技术领域
本发明涉及网络通信技术领域,特别涉及一种容灾系统及其容灾方法。
背景技术
随着信息成为越来越重要的企业资产,许多企业都致力于最大限度地降低宕机(宕机是指机器停止运行或异常关闭不能正常工作,即常说的死机现象)风险和避免业务中断的潜在影响。
目前,造成系统出现灾难性问题的主要原因有以下几个方面:
一、系统资源故障,包括硬件故障及软件故障;
二、人为原因导致的灾难;
三、自然原因导致的灾难,如:海难、飓风、地震。
企业通常依赖后台和人工流程来保持业务的正常运行,直到系统恢复为止。面对各种可能的灾难,企业需要方便、灵活地同步基于异构环境下驻留在不同数据库中的数据,这就需要建设一个对各种情况都可以抵御或者化解的本地和异地的容灾系统。
但现在的一些计算机信息系统对于容灾机制的考虑还有欠缺,不少计算机信息系统只是做了简单的本地磁盘的不同分区或者是相同系统上不同磁盘的数据备份,只是严格意义上的数据备份系统,称不上容灾系统,例如数据库系统中常用的镜像备份,也就是文件拷贝方式;基于操作系统文件系统复制的方式;以及基于高端联机存储设备(磁盘阵列)之间的数据写操作同步的方式等。在一般灾难时,可以在一定意义上保证数据的完整性,但很难保证用户数据的可靠性和安全性。
国家标准SHARE 78和GB20988-2007-T信息安全技术信息系统灾难恢复规范中分别对容灾系统的等级以及容灾恢复应遵循的基本规则进行了说明。
目前常用的容灾(Disaster Rocovery“灾难”后恢复)策略有以下几三种:
一是,本地数据保护方式;
本地数据保护方式,主要是对生产数据进行的备份,当系统发生故障和人为的错误时,可以通过恢复备份数据来保证生产。
二是,本地应用的高可用性方式;
本地应用的高可用性方式,是指高可用系统确保本地应用系统在多机环境下具有抗御任何单点故障地能力,一旦系统发生局部地意外(如操作系统故障、掉电、网络故障等),高可用系统可以在最短地时间迅速确保系统地应用继续运行。
三是,异地数据保护方式;
异地数据保护方式,是指用户将本地备份的数据送到远离本地的地方保存抵御灾难。灾难发生后,按预定的数据恢复程序购置和安装备份硬件平台,恢复系统和数据即可。
如果在实际应用中采用上述容灾策略,则存在以下问题:
1)所述的前两种容灾方式为数据和整个生产系统安全提供了基本保障,但它们的共同弱点是无法完全承担应用系统发生灾难时业务系统的安全运行,如备份系统无法保证灾难出现后系统的不间断运行;而高可用系统无法防止重大灾难,如机房破坏等自然灾害。
2)异地数据保护方式常采用的容灾方法是离线式容灾。离线式容灾主要依靠备份技术来实现。其重要步骤是将数据通过备份系统备份到磁带上,而后将磁带运送到异地保存管理。
这种方式主要由备份软件来实现备份与磁带的管理,其缺点比较明显,由于采用磁带存放数据,所以数据恢复较慢,而且备份窗口内的数据都会丢失,实时性比较差,很难能保证业务系统的连续运行。
发明内容
本发明所要解决的技术问题是提供一种容灾系统及其容灾方法,提高系统的防护和灾难容忍能力,改善系统的服务质量。
为解决上述技术问题,本发明是通过以下技术方案实现的:
一种容灾系统,该系统包括:
数据备份管理单元,用于完成当前生产站点的数据的本地备份,为远程镜像提供数据基准;
远程存储转发管理单元,用于以数据备份管理单元所备份的数据为基准进行远程数据复制,将该备份数据存放于虚拟模块中并映射到数据存储管理单元,同时将所述数据并发到各个备用的生产站点;还用于对其他各单元之间的命令及响应进行转发;
容灾管理单元,用于在当前生产站点发生故障时,启用备用的生产站点,并实现数据的快速恢复;
数据存储管理单元,用于接收远程存储转发单元映射的备份数据,对该数据进行存储和转储;
集中控制管理单元,用于对所述数据备份管理单元、远程存储转发管理单元、容灾管理单元以及数据存储管理单元进行总体监控,向所述数据备份管理单元、远程存储转发管理单元、容灾管理单元以及数据存储管理单元下发相关配置命令并对其上报的运行信息进行分析和处理。
其中,所述数据备份管理单元进一步包括:
备份管理模块,用于以卷为基本单位对本地数据进行数据备份;
可靠性校验模块,用于对所述备份数据的正确性进行校验,并对其可恢复性进行检测;
监控分析模块,用于对数据备份过程中出现的错误进行分析,显示错误原因和相关解决方法,将可自动处理的交付给异常处理模块进行处理,并将操作记录到操作日志中;
异常处理模块,用于对备份过程中出现的异常进行处理。
其中,所述远程存储转发管理单元进一步包括:
数据资源池,用于对当前生产站点的数据进行远程复制,将其存放在占用不同的磁盘分区的虚拟模块中,并预留共享虚拟模块,同时将所述数据映射到数据存储管理单元中进行存储;
远程可靠性校验模块,用于对所述数据的可靠性进行校验,检验成功后将该数据并发到各个备用的生产站点;
命令处理模块,用于对其他各单元之间的命令和响应消息进行转发。
其中,所述数据存储管理单元进一步包括:
控制模块,用于对数据存储过程进行监控和管理,并对数据的可靠性进行校验,同时对集中控制管理单元下发的数据上载比较和上载操作命令进行响应;
数据存储模块,用于对远程存储转发管理单元映射过来的数据进行存储,还用于在数据量过大时将数据转存到外部存储设备。
一种容灾方法,该方法包括以下步骤:
(1)数据备份管理单元对当前生产站点的数据进行本地备份,并记录备份数据的顺序,对备份数据的可靠性进行校验;
(2)以数据备份管理单元备份的数据为基准,远程存储转发管理单元对备份数据进行远程复制并存储;
(3)远程存储转发管理单元对备份数据的可靠性进行校验,校验成功后将该备份数据映射到数据存储管理单元中进行存储,并将其并发到各个备用的生产站点;
(4)所述生产站点发生灾难性故障时,容灾管理单元启用备用的生产站点,并进行数据的快速恢复。
其中,所述数据备份管理单元、远程存储转发管理单元以及数据存储管理单元采用首次备份全部数据、此后仅备份增量数据的方式进行数据备份。
其中,所述数据备份管理单元及远程存储转发管理单元将备份数据按照价值级别分别进行存储。
其中,所述步骤(1)中,数据备份管理单元采用先进先出队列来记录备份数据的顺序,若备份发生中断,则在断点处插入标识,以标识数据卷中数据块的变化位置。
其中,所述步骤(2)中,远程存储转发管理单元将同步镜像的数据存放在至少一个占用不同磁盘分区的虚拟模块中,且预留共享虚拟模块。
其中,备份数据的可靠性校验包括:数据的一致性校验和可恢复性校验。
本发明具有以下有益效果:
本发明综合考虑了容灾系统的两个主要指标:RPO(Recovery PointObject,RPO代表了当灾难发生时允许丢失的数据量)和RTO(RecoveryTime Object,RTO则代表了系统恢复的时间),重点在以下三方面做了相应的改进:
其一,采用异地远程的方式,建立多个灾备中心,采用集中控制管理对整个灾备系统进行监控,互相之间可以进行健康状态监视和功能切换,可以共享的数据资源,当一处灾备中心因意外(如火灾、地震等)停止工作时,整个应用系统可以切换到另一处,使得该系统功能可以继续正常工作;并提供在灾难性事件发生时,对整个生产中心节点提供节点级别的系统恢复功能;
其二,本发明采用了近线拷贝技术,即把价值不同的数据分别放在不同性能(价格)的存储介质上进行存放。同时也方便在紧急情况下使重要的数据优先得到保护;
其三,在灾难发生时,集中控制管理中心可对恢复时间和效率做综合评估,下发经济高效的恢复方案,同时可在本地集群和远端集群中快速切换业务,以保证业务的连续性。
附图说明
图1是本发明实施例一的容灾系统的实施方案示意图;
图2是本发明实施例一的容灾方法流程图;
图3是本发明实施例二的容灾系统的实施方案示意图;
图4是本发明实施例三的容灾系统的实施方案示意图。
具体实施方式
本发明所提出的容灾系统是一种网络容灾系统,该系统采用分布式容灾系统结构:网络服务系统容灾(是指对存储转发管理中心的系统容灾)和网络存储系统容灾(是指对数据存储管理中心的系统容灾),将网络安全机制和网络容灾机制集成一体,整个系统具有很强的系统防护和灾难容忍能力,同时还改善了系统服务质量。利用专用的存储网络将关键数据同步镜像至数据资源池,使数据不仅在本地进行保护,而且在异地(备份)进行确认和保护。
本发明在本地和远程的所有数据被更新的同时,利用了双重在线存储。一旦发生灾难,备用站点可以自动取代主用站点进行工作,保证了在容灾过程中的数据连续性。在本地与远程系统中的设备连接中还提供冗余通道,以备工作通道出现故障时及时接替工作。同时,在数据传递过程中保证了数据的可靠性,即无论在本地集群设备还是远程集群设备上所拥有的数据是一致的,并且是可靠的。
下面结合附图及具体实施例对本发明作进一步详细的描述:
实施例一
请参阅图1,该图所示为本实施例的容灾系统的结构示意图。如图所示,容灾系统包含以下几个部分:
A、集中控制管理单元S100,采用集群管理,对本地集群和远程集群采用集中管理的方式,对本地备份、远程复制、以及一旦出现灾难情况后的恢复情况进行总体监控,对各个管理单元上报的运行信息及时进行分析和处理,同时在初始安装系统灾难恢复装置时对各管理单元进行初始配置以及条件的设定。
该单元可以自动或者手动切换故障站点到可用站点,同时,也可以下发上载比较以及上载命令,即比较各站点与数据存储管理单元中的数据是否一致,如果不一致可以将不一致的数据上载到本地(可以设置手动或者自动执行上载比较和数据上载命令)。
一旦生产站点发生故障,集中控制管理单元S100对恢复时间和效率做综合评估,下发最经济高效的恢复方案,同时在本地集群和远端集群中快速切换业务,以保证业务的连续性。而且,为保证站点在中断恢复后可以自动将数据同步到恢复的站点中,集中控制管理单元S100会根据中断的时间以及增加的业务量来判断是增量上载数据信息到恢复后的中断站点,还是重新将最新数据进行一次全量上载(默认是自动同步,在发现有站点重新建立正常通讯时自动执行同步)。
B、在生产站点的数据备份管理单元S101,主要是完成数据的本地备份工作,为远程镜像提供数据基准。该单元主要包括四个功能模块:备份管理模块、可靠性校验模块、监控分析模块和异常处理模块。
b1)备份管理模块:在备份数据时以卷为基本单位进行备份,采用了先进先出队列,如果发生中断,则在断点处插入标识,即在本地打上标签,标识每个数据卷中数据块的变化位置。
b2)可靠性校验模块:是对备份数据的正确性的校验,即与当前的本地数据的一致性的校验,同时,也要对数据的可恢复性进行检测,以保证数据的可靠性。
b3)监控分析模块:主要是对备份过程中出现的错误进行分析,显示错误原因和相关解决方法,可以自动处理的交付异常处理模块进行处理,并将操作记录到操作日志中;该模块同时还要监控备份过程中相关进程的运行状态,监控备份进行是否运行正常,若出现进程死掉或者退出的情况则交付异常处理模块重新调用该进程。
b4)异常处理模块:对备份过程中出现的异常进行处理。在备份过程出现异常时可以回退到未出现异常的情况,并重新备份(只是对出错未完成的备份数据进行重新备份);其他的异常情况则根据出错分析模块提供的解决方法进行操作执行,若不能设备自动处理的则通知用户手动处理。
上述四个功能模块相互协作,以确保可以完成数据备份并保证数据的可靠性。
C、远程存储转发管理单元S102,主要是对命令和数据的统一拆分,其一,是负责进行数据库的远程数据复制,保证数据在远程复制过程中的可靠性,同时并发到各个备用站点;其二,对各模块之间的命令进行转发。该单元,包括三部分:数据资源池、数据可靠性校验和命令处理模块。
c1)数据资源池:主要是将同步镜像的数据存放在多个虚拟模块上,每个虚拟模块不占用相同的磁盘分区,并预留共享虚拟模块,同时将数据映射到数据存储管理单元中进行存储。其中,数据资源池接收来至生产中心的映射数据,远程数据资源池可以被多个灾备中心共享。数据资源池仅会保存最新的完整备份,便于发生灾难时进行快速恢复,所有的历史数据将存储在数据存储管理单元中。
其中,备份数据时采用首次备份全部数据,此后的备份采用增量备份,即只备份更动过的数据,并将增量备份整合后一并写到相应的存储设备(将磁盘数据备份到磁带)。而且,在备份时采用近线拷贝技术,即把价值不同的数据分别放在不同性能(价格)的存储介质上进行存放。同时也方便在紧急情况下使重要的数据优先得到保护。同时,在虚拟模块上将数据按照业务数据和非业务数据分别进行存储,并对业务数据进行分级,分成重要业务数据和轻业务数据,一旦发生灾难时可以对主要业务进行优先恢复。
c2)远程可靠性校验模块:主要是对备份数据的正确性的校验,即本地备份数据与生产中心数据的一致性校验,同时,也要对数据的可恢复性进行检测,以保证数据的可靠性;当数据可靠性校验无误后,将数据并发到各个备用站点,便于本地快速恢复。
c3)命令处理模块:主要是对通讯实体(通讯实体是指各个管理单元以及生产站点和备用站点)之间进行请求响应和命令转发。该模块负责对命令的调度,用链表记录命令,该命令包括集中控制管理单元下发的命令、数据存储管理单元上报的命令、各站点之间的交互命令,如果下发的是应答时,则在链表中登记,以便反馈应答命令时找到对应的调度命令。
D、容灾管理单元S103,主要是当生产站点(也称为主用站点)发生故障时,自动将优先级最高的备用站点启用为主用站点,并对重要数据实现快速恢复。
更进一步,虚拟模块恢复某个单一物理受灾目标或者在断电等情况下自动保存数据(自动切换至备份系统,并且可以将虚拟模块的工作自动切换到另一个物理服务器上)。一旦灾备机制被激活,某个相关的虚拟机灾难恢复站点将替代故障站点设备进行工作,可以自定义其工作流程。
E、数据存储管理单元S104,主要是对数据的存储和转储的作用。该单元主要包括两部分:
e1)控制模块:对数据存储情况进行监控和统一管理,对数据的可靠性进行校验;同时对下发的数据上载比较和上载操作命令进行响应。
e2)数据存储模块:主要存储业务数据和非业务数据,并对业务数据进行分级,分成重要业务数据和轻业务数据,一旦发生灾难时可以对主要业务进行优先恢复;当存储的数据量过大时,利用快照技术将数据备份到磁带库或光盘库中。
上述系统中,各个管理单元之间需要对其执行情况进行反馈通知,并通过远程存储转发管理单元进行转发,以确保从上一个环节到下一环节的数据传输的正确性。
无论是哪个生产站点都可能升任为主用站点,因此主用站点和备用站点都应该具有数据备份管理单元和容灾管理单元的功能。图中S101′和S103′是生产站点故障恢复后,将当前生产站点的数据同步到本地时启动的系统。远程存储转发过程的工作原理相同没做标注,即S102和S102′相同。
其中,一旦发生灾难,当备用站点监测到生产站点运行不正常,或失去通讯,优先级最高的备用站点将自动承担生产站点的工作,当生产站点恢复正常工作状态或生产站点通讯恢复正常时,则需将数据同步给生产站点并将主控权归还给生产站点。
请参阅图2,该图所示为上述容灾系统的容灾方法,具体为:
步骤S200,数据备份管理单元对本地数据进行备份。
在备份过程中,生产站点的数据可以在线写入本地的存储设备的虚拟模块中,本地主备站点同时可以访问该存储设备,即共享相同的数据池;还可提供双备份存储设备,以便其中一个存储设备出现故障时可以启动备用存储设备。上述每个虚拟模块不占用相同的磁盘分区,并预留共享虚拟模块,以提高保护能力。所述虚拟模块恢复某个单一物理受灾目标或者在断电等情况下自动保存数据(自动切换至备份系统,并且可以将虚拟模块的工作自动切换到另一个物理服务模块上)。
备份数据时,采用首次备份全部数据,此后的备份采用增量备份,即只备份更动过的数据,并将增量备份整合后一并写到相应的存储设备(将磁盘数据备份到磁带)。
图中有一个返回箭头,表示在本地备份没有成功时,系统将重新执行本次备份。
步骤S201,按顺序记录操作步骤。此处采用了先进先出队列,来确认备份数据的顺序,如果发生中断,则在断点处插入标识,即在本地打上标签,标识每个数据卷中数据块的变化位置。
步骤S202,对备份数据进行可靠性校验。
可靠性校验,是指对备份数据的正确性的校验,即备份的数据与当前的本地数据的一致性的校验,同时,还包括对数据的可恢复性进行检测,以保证数据的可靠性。可靠性校验后需要返回校验结果,如果检验失败,则需要将信息返回到步骤S200,并重新执行备份操作。
步骤S203,以数据备份管理单元备份的数据为基准,远程存储转发管理单元对备份数据进行远程镜像。
数据在远程复制过程中为了保证数据传输的可靠性,采用了先进先出队列,以确保远程复制的顺序,此复制的顺序即为备份时的顺序,如果发生中断,则在断点处插入标识,即在本地打上标签,标识每个数据卷中数据块的变化位置。
同时,在数据远程复制过程中采用基于卷的复制方式,利用基于IP的互连协议,将生产站点的信息通过现有的TCP/IP网络,远程复制到远程集群中。
其中,生产站点与远程存储转发管理单元使用专用的网络按照事先设定的方式进行传输备份数据,同时应用心跳监控各个站点之间的状态,一旦出现异常会自动启动灾备机制。而且,在本地与远程系统中的设备连接中还提供冗余通道,以备工作通道出现故障时及时接替工作。
步骤S204,远程存储转发管理单元对备份数据进行可靠性校验。
此处的可靠性校验,是指对镜像到远程集群中的数据进行正确性的校验,即生产站点的数据与集群备份的数据一致性校验,同时,也要对数据的可恢复性进行检测,以保证数据的可靠性。
可靠性校验后需要返回校验结果,如果检验失败,则需要将信息返回到步骤S203,并重新执行将本地存储数据镜像到远程集群的操作,同时在记录中做好标记。
步骤S205,远程存储转发管理单元将数据映射到数据存储管理单元进行存储,同时拷贝数据到多个虚拟模块上。
该步骤中,远程存储转发管理单元将备份数据映射到数据存储管理单元中进行存储,同时将备份数据存放在多个虚拟模块上,每个虚拟模块不占用相同的磁盘分区,并预留共享虚拟模块,待数据校验无误后将数据并发到各个备用站点。
其中,若数据存储管理单元中存储的数据量过大,则利用快照技术将其备份到磁带库或光盘库中。
步骤S206,可靠性校验,是远程存储转发管理单元对各虚拟模块上的拷贝数据的可靠性进行校验。
步骤S207,转发数据到备用站点,是指远程存储转发管理单元将数据转发到各个备用站点,使备用站点可以同步更新。
步骤S208,可靠性校验,是指各备用站点进行的可靠性校验,以及数据存储管理单元对备份到本地的数据进行可靠性校验。
其中,各站点之间通过“握手线”相连,可以监控心跳同时也可以对数据的一致性进行校验。
步骤S209,当发生灾难性故障时快速恢复备份数据。
该步骤中,集中控制管理单元对恢复时间和效率做综合评估,下发最经济高效的恢复方案,同时在本地集群和远端集群中快速切换业务,以保证业务的连续性。例如:如果仅仅是数据失效,恢复备份数据即可;如果是本地物理失效,可以启用备用设备;如果是某一虚拟模块出现问题,让其它虚拟模块接管其工作的同时,启用备用虚拟模块。如果是由自然灾害造成数据中心损坏的,则采用远程灾备集群接替数据中心工作。
采用集中控制管理可以更全面掌控数据流向,以及各相关环节的工作状态,综合评估给出经济高效的恢复策略,在灾难时将企业的经济损失降到最低。
实施例二
请参阅图3,该图所示为本实施例的容灾系统的实施方案示意图,图3是图4的一种特例,只有一个备用站点的情况,以下对图3容灾系统的工作流程进行说明(此图中的各管理中心是指相应管理单元所在的服务器)。该系统中包括:集中控制管理中心S300;生产站点S301;备用站点S302;远程存储转发管理中心S303;数据存储管理中心(主)S304;数据存储管理中心(备)S305。
集中控制管理中心S300,主要是对整个灾备系统进行总体监控,下发相关配置操作,同时接收远程存储转发管理中心S303转发的各管理单元上报的信息。
当发生灾难时,集中控制管理中心S300根据各相关环节的工作状态,综合评估给出经济高效的恢复策略,可以对业务进行快速恢复。各站点可以通过集中控制管理中心S300下发上载比较和上载数据操作(可设置手动上载或自动上载),以便于对异常后恢复的站点进行手动数据同步,默认情况下,当站点重新建立通讯后会自动同步一次数据。而且,集中控制管理中心S300根据站点中断的时间决定是增量上载还是全量上载数据。
生产站点S301,将数据备份到本地,并将备份数据映射到远程存储转发管理中心S303中。
备用站点S302,当发生灾难后,替代生产站点S301继续工作。
其中,生产站点S301和备用站点S302之间有握手线可以监控到生产站点S301的工作情况,生产站点S301和备用站点S302可以共享到远程存储转发管理中心S303的备份数据。站点的通讯状况,以及备份和恢复的情况都会通过远程控制管理中心S303转发给集中控制管理中心S300。
远程存储转发管理中心S303,将生产站点S301映射到本地的备份数据存储到数据存储管理中心S304和S305中,同时将备份数据拷贝到远程存储转发管理中心S303中的多个虚拟模块上,将校验后无误的备份数据转发给备用站点S302进行同步。
数据存储管理中心(主)S304,主要是用于存储生产站点S301的数据。当数据存储管理中心S304中存储的数据量过大时,利用快照技术将其备份到磁带库或光盘库中。数据存储管理中心S304可以通过数据存储模块来监控备份过程,并能存储到磁带库或者光盘库中的已到期的数据存储介质上报给用户,告之介质上存储的数据已过保存期,该介质可以被重用。
数据存储管理中心(备)S305,与数据存储管理中心(主)S304的作用基本相同,主要都是对数据的存储,数据存储管理中心(备)S305与数据存储管理中心(主)S304的数据是一致的,当数据存储管理中心(主)S304出现故障时,可以从数据存储管理中心(备)S305获得备份数据。
补充说明,为了便于说明,图3中只画出了一个远程存储转发管理中心S303,并未画出备用的远程存储转发管理中心。
实施例三
请参阅图4,该图所示为本实施例的容灾系统的实施方案示意图,其中包括:集中控制管理中心S400,生产站点S401,备用站点1S402,备用站点N S403,远程存储转发管理中心(主)S404,远程存储转发管理中心(备)S405,数据存储管理中心(主)S406,数据存储管理中心(备)S407。
此图是本发明的容灾系统的另一种实施方案示意图,其工作原理与图3只有一个备用站点的灾备系统基本相同,不再重复。
此处仅作补充说明,对于多个备用站点,在集中控制管理中心S400中可以设置其备用站点的优先级(默认自动生成,也可以手工进行修改)。
其中,备用远程存储转发管理中心S405,与主用远程存储转发管理中心S404的功能相同,在主用远程存储转发管理中心S404工作的期间,备用远程存储转发管理中心S405处于监控状态,当主用不能正常工作时,备用远程存储转发管理中心S405自动取代主用远程存储转发管理中心S404进行工作。
以上实施例仅用以说明本发明的技术方案而非限制,仅仅参照较佳实施例对本发明进行了详细说明。本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,均应涵盖在本发明的权利要求范围当中。
Claims (10)
1.一种容灾系统,其特征在于,该系统包括:
数据备份管理单元,用于完成当前生产站点的数据的本地备份,为远程镜像提供数据基准;
远程存储转发管理单元,用于以数据备份管理单元所备份的数据为基准进行远程数据复制,将该备份数据存放于虚拟模块中并映射到数据存储管理单元,同时将所述数据并发到各个备用的生产站点;还用于对其他各单元之间的命令及响应进行转发;
容灾管理单元,用于在当前生产站点发生故障时,启用备用的生产站点,并实现数据的快速恢复;
数据存储管理单元,用于接收远程存储转发单元映射的备份数据,对该数据进行存储和转储;
集中控制管理单元,用于对所述数据备份管理单元、远程存储转发管理单元、容灾管理单元以及数据存储管理单元进行总体监控,向所述数据备份管理单元、远程存储转发管理单元、容灾管理单元以及数据存储管理单元下发相关配置命令并对其上报的运行信息进行分析和处理。
2.如权利要求1所述的容灾系统,其特征在于,所述数据备份管理单元进一步包括:
备份管理模块,用于以卷为基本单位对本地数据进行数据备份;
可靠性校验模块,用于对所述备份数据的正确性进行校验,并对其可恢复性进行检测;
监控分析模块,用于对数据备份过程中出现的错误进行分析,显示错误原因和相关解决方法,将可自动处理的交付给异常处理模块进行处理,并将操作记录到操作日志中;
异常处理模块,用于对备份过程中出现的异常进行处理。
3.如权利要求1所述的容灾系统,其特征在于,所述远程存储转发管理单元进一步包括:
数据资源池,用于对当前生产站点的数据进行远程复制,将其存放在占用不同的磁盘分区的虚拟模块中,并预留共享虚拟模块,同时将所述数据映射到数据存储管理单元中进行存储;
远程可靠性校验模块,用于对所述数据的可靠性进行校验,检验成功后将该数据并发到各个备用的生产站点;
命令处理模块,用于对其他各单元之间的命令和响应消息进行转发。
4.如权利要求1所述的容灾系统,其特征在于,所述数据存储管理单元进一步包括:
控制模块,用于对数据存储过程进行监控和管理,并对数据的可靠性进行校验,同时对集中控制管理单元下发的数据上载比较和上载操作命令进行响应;
数据存储模块,用于对远程存储转发管理单元映射过来的数据进行存储,还用于在数据量过大时将数据转存到外部存储设备。
5.一种容灾方法,其特征在于,该方法包括以下步骤:
(1)数据备份管理单元对当前生产站点的数据进行本地备份,并记录备份数据的顺序,对备份数据的可靠性进行校验;
(2)以数据备份管理单元备份的数据为基准,远程存储转发管理单元对备份数据进行远程复制并存储;
(3)远程存储转发管理单元对备份数据的可靠性进行校验,校验成功后将该备份数据映射到数据存储管理单元中进行存储,并将其并发到各个备用的生产站点;
(4)所述生产站点发生灾难性故障时,容灾管理单元启用备用的生产站点,并进行数据的快速恢复。
6.如权利要求5所述的容灾方法,其特征在于,所述方法中,所述数据备份管理单元、远程存储转发管理单元以及数据存储管理单元采用首次备份全部数据、此后仅备份增量数据的方式进行数据备份。
7.如权利要求5所述的容灾方法,其特征在于,所述方法中,所述数据备份管理单元及远程存储转发管理单元采用近线拷贝方式,将备份数据按照价值级别分别进行存储。
8.如权利要求5至7任一所述的容灾方法,其特征在于,所述步骤(1)中,数据备份管理单元采用先进先出队列来记录备份数据的顺序,若备份发生中断,则在断点处插入标识,以标识数据卷中数据块的变化位置。
9.如权利要求5至7任一所述的容灾方法,其特征在于,所述步骤(2)中,远程存储转发管理单元将同步镜像的数据存放在至少一个占用不同磁盘分区的虚拟模块中,且预留共享虚拟模块。
10.如权利要求5所述的容灾方法,其特征在于,所述方法中,备份数据的可靠性校验包括:数据的一致性校验和可恢复性校验。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200810142532A CN101635638B (zh) | 2008-07-25 | 2008-07-25 | 一种容灾系统及其容灾方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200810142532A CN101635638B (zh) | 2008-07-25 | 2008-07-25 | 一种容灾系统及其容灾方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101635638A CN101635638A (zh) | 2010-01-27 |
CN101635638B true CN101635638B (zh) | 2012-10-17 |
Family
ID=41594706
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200810142532A Active CN101635638B (zh) | 2008-07-25 | 2008-07-25 | 一种容灾系统及其容灾方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101635638B (zh) |
Families Citing this family (55)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101997930A (zh) * | 2010-12-24 | 2011-03-30 | 南开大学 | 一种基于重传─纠删码传输协议的远程镜像方法和系统 |
US8522068B2 (en) * | 2011-05-02 | 2013-08-27 | International Business Machines Corporation | Coordinated disaster recovery production takeover operations |
US8671308B2 (en) | 2011-05-02 | 2014-03-11 | International Business Machines Corporation | Optimizing disaster recovery systems during takeover operations |
CN102306115B (zh) * | 2011-05-20 | 2014-01-08 | 华为数字技术(成都)有限公司 | 异步远程复制方法、系统及设备 |
CN102360322A (zh) * | 2011-10-11 | 2012-02-22 | 浪潮电子信息产业股份有限公司 | 一种数据保护系统 |
CN103312623B (zh) * | 2012-03-08 | 2016-08-17 | 百度在线网络技术(北京)有限公司 | 任务协作装置及方法 |
CN103425645B (zh) * | 2012-05-14 | 2017-03-01 | 阿里巴巴集团控股有限公司 | 数据库集群单点故障的监控系统及方法 |
CN102932326B (zh) * | 2012-09-19 | 2015-05-20 | 无锡华御信息技术有限公司 | 安全云计算系统 |
CN103686984B (zh) * | 2012-09-20 | 2017-12-12 | 中兴通讯股份有限公司 | 数据同步方法、系统和设备 |
CN102890716B (zh) * | 2012-09-29 | 2017-08-08 | 南京中兴新软件有限责任公司 | 分布式文件系统和分布式文件系统的数据备份方法 |
CN104025062B (zh) * | 2012-11-08 | 2016-11-23 | 华为技术有限公司 | 数据复制方法和存储控制器及系统 |
CN103034564B (zh) * | 2012-12-05 | 2016-06-15 | 华为技术有限公司 | 数据容灾演练方法、数据容灾演练装置及系统 |
CN103049317B (zh) * | 2013-01-10 | 2016-03-23 | 中国南方电网有限责任公司超高压输电公司 | 云环境下基于队列的高并发数据快速写入系统及方法 |
CN103166798A (zh) * | 2013-03-27 | 2013-06-19 | 山东省计算中心 | 一种数据灾备服务系统及灾备设备综合监控系统 |
CN103209218A (zh) * | 2013-04-23 | 2013-07-17 | 深圳市京华科讯科技有限公司 | 容灾一体机管理系统 |
CN104239164A (zh) * | 2013-06-19 | 2014-12-24 | 国家电网公司 | 基于云存储的灾备切换系统 |
CN104281591B (zh) * | 2013-07-04 | 2018-10-12 | 北京中科同向信息技术有限公司 | 基于数据颗粒整合的远程容灾技术 |
CN103843309A (zh) * | 2013-11-22 | 2014-06-04 | 华为技术有限公司 | 数据同步方法和数据同步系统 |
CN103617269B (zh) * | 2013-12-05 | 2018-03-23 | 中国联合网络通信集团有限公司 | 一种容灾接管方法及容灾接管系统 |
WO2015085529A1 (zh) * | 2013-12-12 | 2015-06-18 | 华为技术有限公司 | 数据复制方法、数据复制装置和存储设备 |
CN104754562A (zh) * | 2013-12-27 | 2015-07-01 | 三亚中兴软件有限责任公司 | 数据复制异常的修复方法及装置 |
CN103838646B (zh) * | 2014-02-13 | 2017-10-20 | 中国科学院国家天文台 | 一种用于地面应用大数据异地容灾备份的系统和方法 |
CN104572350B (zh) * | 2014-12-19 | 2018-11-06 | 华为技术有限公司 | 一种元数据处理方法及装置 |
CN104572353B (zh) * | 2015-01-21 | 2018-01-09 | 浪潮(北京)电子信息产业有限公司 | 一种灾备融合管理方法及系统 |
CN104991926A (zh) * | 2015-06-29 | 2015-10-21 | 浪潮(北京)电子信息产业有限公司 | 文件系统恢复方法和系统 |
CN105099793B (zh) | 2015-09-24 | 2019-02-05 | 华为技术有限公司 | 热备方法、装置及系统 |
CN106681858A (zh) * | 2015-11-10 | 2017-05-17 | 中国电信股份有限公司 | 一种虚拟机数据容灾方法及管理装置 |
CN105516365A (zh) * | 2016-01-22 | 2016-04-20 | 浪潮电子信息产业股份有限公司 | 一种基于网络的分布式镜像存储块设备的管理方法 |
KR20170111146A (ko) * | 2016-03-25 | 2017-10-12 | 엘에스산전 주식회사 | 복수의 센터 간 사용자 설정 데이터 동기화 방법 |
CN107404394B (zh) * | 2016-05-20 | 2022-04-12 | 中兴通讯股份有限公司 | 一种iptv系统容灾方法及iptv容灾系统 |
CN106095619A (zh) * | 2016-06-08 | 2016-11-09 | 杭州华三通信技术有限公司 | 一种虚拟机备份方法及装置 |
CN107689879A (zh) * | 2016-08-04 | 2018-02-13 | 中兴通讯股份有限公司 | 虚拟网元的管理方法及装置 |
CN106407047A (zh) * | 2016-09-30 | 2017-02-15 | 郑州云海信息技术有限公司 | 一种容灾系统 |
CN108804248B (zh) * | 2017-04-28 | 2021-07-06 | 南京壹进制信息科技有限公司 | 一种卷实时保护数据的自动校验方法 |
CN107391294B (zh) * | 2017-07-28 | 2021-01-29 | 苏州浪潮智能科技有限公司 | 一种ipsan容灾系统的建立方法及装置 |
CN109426588B (zh) * | 2017-08-28 | 2023-03-14 | 中兴通讯股份有限公司 | 实现数据保护的方法及系统、数据分发处理模块 |
CN109586789A (zh) * | 2017-09-29 | 2019-04-05 | 深圳市中兴微电子技术有限公司 | 一种基于光网络单元实现设备容灾的系统及方法 |
CN109582509A (zh) * | 2017-09-29 | 2019-04-05 | 中兴通讯股份有限公司 | 分布式文件系统容灾配置方法、装置和可读存储介质 |
CN108196979B (zh) * | 2017-12-28 | 2021-07-09 | 北京星选科技有限公司 | 数据备份方法和装置 |
CN108512693A (zh) * | 2018-02-24 | 2018-09-07 | 国家计算机网络与信息安全管理中心 | 一种跨区域容灾方法和装置 |
CN108880874A (zh) * | 2018-06-06 | 2018-11-23 | 郑州云海信息技术有限公司 | 一种对服务器虚拟化平台进行容灾的方法、装置和设备 |
CN109032838B (zh) * | 2018-06-28 | 2022-07-15 | 上海爱数信息技术股份有限公司 | 虚拟机备份恢复数据一致性的自动校验方法 |
CN109117310A (zh) * | 2018-08-08 | 2019-01-01 | 中国建设银行股份有限公司 | 实现数据备份的容灾系统、方法及装置 |
CN109491832A (zh) * | 2018-09-26 | 2019-03-19 | 华为技术有限公司 | 数据容灾方法与站点 |
CN109597718A (zh) * | 2018-12-10 | 2019-04-09 | 浪潮(北京)电子信息产业有限公司 | 一种容灾平台及一种容灾方法 |
CN111381931A (zh) * | 2018-12-29 | 2020-07-07 | 中兴通讯股份有限公司 | 容灾方法、装置及系统 |
CN109839912B (zh) * | 2019-02-26 | 2024-09-17 | 宝信软件(武汉)有限公司 | 汽车生产线数据管理系统以及方法 |
CN113839975A (zh) * | 2020-06-24 | 2021-12-24 | 中兴通讯股份有限公司 | PaaS的中间件容灾方法、容灾装置、容灾设备及存储介质 |
CN111966644A (zh) * | 2020-08-12 | 2020-11-20 | 南方科技大学 | 超级计算机数据存储方法、装置、系统及存储介质 |
CN113988594B (zh) * | 2021-10-26 | 2024-04-30 | 山东大学 | 一种灾难备份数据中心多目标选址方法及系统 |
CN113946474A (zh) * | 2021-10-29 | 2022-01-18 | 蜂巢科技(南通)有限公司 | 一种储存系统高效容灾保护方法及容灾处理系统 |
CN114138348A (zh) * | 2021-11-16 | 2022-03-04 | 中国电信集团系统集成有限责任公司 | 业务恢复优先级评估方法及设备、存储介质和产品 |
CN115509824B (zh) * | 2022-11-23 | 2023-03-14 | 深圳市科力锐科技有限公司 | 数据备份方法、装置、设备及存储介质 |
CN115878386A (zh) * | 2023-02-07 | 2023-03-31 | 天翼云科技有限公司 | 容灾方法、装置、电子设备及存储介质 |
CN116578437A (zh) * | 2023-07-07 | 2023-08-11 | 中国电信股份有限公司 | 数据管理方法、装置、计算机设备、存储介质和程序产品 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1818881A (zh) * | 2006-03-10 | 2006-08-16 | 四川大学 | 异地数据备份中的差错控制方法 |
CN101216874A (zh) * | 2008-01-17 | 2008-07-09 | 四川大学 | 一种跨平台多路数据监控方法 |
CN101221522A (zh) * | 2007-01-11 | 2008-07-16 | 中兴通讯股份有限公司 | 一种容灾备份系统中数据同步的方法 |
-
2008
- 2008-07-25 CN CN200810142532A patent/CN101635638B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1818881A (zh) * | 2006-03-10 | 2006-08-16 | 四川大学 | 异地数据备份中的差错控制方法 |
CN101221522A (zh) * | 2007-01-11 | 2008-07-16 | 中兴通讯股份有限公司 | 一种容灾备份系统中数据同步的方法 |
CN101216874A (zh) * | 2008-01-17 | 2008-07-09 | 四川大学 | 一种跨平台多路数据监控方法 |
Also Published As
Publication number | Publication date |
---|---|
CN101635638A (zh) | 2010-01-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101635638B (zh) | 一种容灾系统及其容灾方法 | |
CA2376242C (en) | Improved remote data copy using a prospective suspend command | |
AU2005263685C1 (en) | Method of improving replica server performance and a replica server system | |
CN202798798U (zh) | 基于云计算技术的高可用系统 | |
CN102024044B (zh) | 分布式文件系统 | |
CN100543690C (zh) | 用于管理故障的方法和系统 | |
US7793060B2 (en) | System method and circuit for differential mirroring of data | |
US20020007469A1 (en) | Disk array device | |
CN102411639B (zh) | 元数据的多副本存储管理方法和系统 | |
CN101094154B (zh) | 一种多主控模式的数据备份异地保护系统以及保护方法 | |
KR20110044858A (ko) | 데이터 센터들에 걸쳐 데이터 서버들내 데이터 무결정의 유지 | |
US10929431B2 (en) | Collision handling during an asynchronous replication | |
CN108964986B (zh) | 协同办公系统应用级双活灾备系统 | |
CN104268038A (zh) | 磁盘阵列的高可用系统 | |
CN103186348A (zh) | 存储系统及其数据读写方法 | |
EP3316114A1 (en) | Data reading and writing method and device | |
US20180004761A1 (en) | Managing manifests for replication | |
WO2017039579A1 (en) | Recovering from an origination node failure during an asynchronous replication | |
JP2004272318A (ja) | 系切り替えシステムおよびその処理方法並びにその処理プログラム | |
CN102833096A (zh) | 一种低成本的高可用系统实现方法及装置 | |
US20180004617A1 (en) | Managing sets of transactions for replication | |
CN102360322A (zh) | 一种数据保护系统 | |
JP2011253400A (ja) | 分散ミラードディスクシステム、コンピュータ装置、ミラーリング方法およびそのプログラム | |
CN112256201A (zh) | 一种分布式块存储系统及其卷信息管理方法 | |
TWI819916B (zh) | 基於分散式儲存技術之雲服務虛擬機災難備援系統及其方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |