CN113821376B - 一种基于云灾备的一体化备份容灾方法及系统 - Google Patents
一种基于云灾备的一体化备份容灾方法及系统 Download PDFInfo
- Publication number
- CN113821376B CN113821376B CN202110953928.1A CN202110953928A CN113821376B CN 113821376 B CN113821376 B CN 113821376B CN 202110953928 A CN202110953928 A CN 202110953928A CN 113821376 B CN113821376 B CN 113821376B
- Authority
- CN
- China
- Prior art keywords
- emergency
- time point
- service system
- disaster recovery
- cloud
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000011084 recovery Methods 0.000 title claims abstract description 132
- 238000000034 method Methods 0.000 title claims abstract description 57
- 230000010076 replication Effects 0.000 claims description 13
- 238000004422 calculation algorithm Methods 0.000 claims description 10
- 238000003860 storage Methods 0.000 claims description 10
- 238000013468 resource allocation Methods 0.000 claims description 2
- 238000005516 engineering process Methods 0.000 description 22
- 239000000370 acceptor Substances 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 230000004044 response Effects 0.000 description 6
- 238000004519 manufacturing process Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000013508 migration Methods 0.000 description 4
- 230000005012 migration Effects 0.000 description 4
- 238000012423 maintenance Methods 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 238000013480 data collection Methods 0.000 description 2
- 238000011981 development test Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 239000002184 metal Substances 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 238000013509 system migration Methods 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000002360 explosive Substances 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1402—Saving, restoring, recovering or retrying
- G06F11/1446—Point-in-time backing up or restoration of persistent data
- G06F11/1458—Management of the backup or restore process
- G06F11/1464—Management of the backup or restore process for networked environments
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1402—Saving, restoring, recovering or retrying
- G06F11/1415—Saving, restoring, recovering or retrying at system level
- G06F11/1438—Restarting or rejuvenating
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1402—Saving, restoring, recovering or retrying
- G06F11/1446—Point-in-time backing up or restoration of persistent data
- G06F11/1458—Management of the backup or restore process
- G06F11/1466—Management of the backup or restore process to make the backup process non-disruptive
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1479—Generic software techniques for error detection or fault masking
- G06F11/1482—Generic software techniques for error detection or fault masking by means of middleware or OS functionality
- G06F11/1484—Generic software techniques for error detection or fault masking by means of middleware or OS functionality involving virtual machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2201/00—Indexing scheme relating to error detection, to error correction, and to monitoring
- G06F2201/815—Virtual
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2201/00—Indexing scheme relating to error detection, to error correction, and to monitoring
- G06F2201/82—Solving problems relating to consistency
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2201/00—Indexing scheme relating to error detection, to error correction, and to monitoring
- G06F2201/84—Using snapshots, i.e. a logical point-in-time copy of the data
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Hardware Redundancy (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于云灾备的一体化备份容灾解决方法,包括:步骤1:将业务系统与其底层平台进行解耦;步骤2:在设定时间点,对业务系统中的操作系统、系统应用及数据进行云备份,得到各时间点对应的镜像虚拟机,整合不同时间点的镜像虚拟机,使其之间具有关联性,形成一个细颗粒度的业务系统虚拟机镜像时空隧道;步骤3:判断当前故障是否为运行业务系统的硬件发生运行故障,若硬件发生运行故障,则执行步骤4进行无缝恢复;若硬件无运行故障,则为业务系统发生故障,执行步骤5进行应急恢复。
Description
技术领域
本发明属于信息技术领域,具体涉及一种基于云灾备的用于对生产中心和灾备中心的企业及应用系统进行管理的一体化备份容灾解决方法及系统。
背景技术
在数据中心运维保障过程中,面临着设备、系统、应用数量爆炸性增长,环境搭建多、环境复用多、系统架构复杂、应用负载不均、资源变更频繁等诸多问题,传统灾备架构(以物理机为中心的物理架构)及传统灾备技术(异地容灾、两地三中心)与环境强关联,需要配套对等的环境资源,架构复杂,成本高,灾备设施常年处于闲置状态,已经难以支撑业务的快速发展。
在当前多云混合架构已是主流趋势的背景下,批量无缝云迁移、云上云下多云之间的灾备已经成为云时代的刚性需求,企业重要资产不再仅仅是文件和数据库,云主机和云环境都是重要数据,云多租户,云数据种类,业务架构都发生了天翻地覆的变化,而目前的传统灾备已经很难应对海量应用业务,业务容灾复制根本无法应对,灾备技术也需要重新变革。
发明内容
发明目的:为解决传统灾备技术架构复杂,无法应对海量应用业务等问题,本发明提供了一种基于云灾备的一体化备份容灾解决方法及系统,该解决方法通过提供灾备云服务、全场景融合的方式提升灾备运行水平,确保生产业务系统安全、稳定运行,在各单部件和链路故障,甚至整个数据中心故障,都可以实现业务无缝或者快速切换。
本发明所采用的技术方案是:一种基于云灾备的一体化备份容灾解决方法,包括以下步骤:
步骤1:将业务系统与其底层平台进行解耦;
步骤2:在设定时间点,对业务系统中的操作系统、系统应用及数据进行云备份,得到各时间点对应的镜像虚拟机,整合不同时间点的镜像虚拟机,使其之间具有关联性,形成一个细颗粒度的业务系统虚拟机镜像时空隧道;
步骤3:判断当前故障是否为运行业务系统的硬件发生运行故障,若硬件发生运行故障,则执行步骤4进行无缝恢复;若硬件无运行故障,则为业务系统发生故障,执行步骤5进行应急恢复;
步骤4:选择一应急接管时间点,启用应急接管时间点对应的镜像虚拟机;并获取一镜像裸机系统,将镜像裸机系统的状态与应急接管时间点对应的镜像虚拟机启用后的状态进行同步,得到最新数据状态,将最新数据状态恢复至发生故障的硬件;所述镜像裸机系统为没有配置操作系统和系统应用的业务系统;
步骤5:选择离业务系统故障发生前最近的时间点,作为应急时间点,启用应急时间点对应的镜像虚拟机,将需应急恢复的业务系统的状态与应急时间点对应的镜像虚拟机启用后的状态进行同步,实现应急接管。
进一步的,步骤2中,通过云镜像级复制方法对业务系统中的操作系统、系统应用及数据进行云备份。
进一步的,步骤2中,通过精简卷复制方法对业务系统中的操作系统、系统应用及数据进行云备份。
进一步的,步骤2中,所述的数据包括操作系统及业务应用的IO级别的数据。
进一步的,所述步骤5具体包括以下步骤:
选择离业务系统故障发生前最近的时间点,作为应急时间点,启用应急时间点对应的镜像虚拟机;
通过弹性容灾方法,将运行业务系统的硬件上的存储资源分配给需应急恢复的业务系统;
通过数据一致性算法,将需应急恢复的业务系统的状态与应急时间点对应的镜像虚拟机启用后的状态进行同步,实现应急接管。
本发明还公开了一种基于云灾备的一体化备份容灾解决系统,包括:
故障判断模块,用于判断当前故障是否为运行业务系统的硬件发生运行故障,若硬件发生运行故障,则控制无缝恢复模块进行无缝恢复;若硬件无运行故障,则控制应急恢复模块进行应急恢复;
无缝恢复模块,用于选择一应急接管时间点,启用应急接管时间点对应的镜像虚拟机;并获取一镜像裸机系统,将镜像裸机系统的状态与应急接管时间点对应的镜像虚拟机启用后的状态进行同步,得到最新数据状态,将最新数据状态恢复至发生故障的硬件;所述镜像裸机系统为没有配置操作系统和系统应用的业务系统;应急恢复模块,用于选择离业务系统故障发生前最近的时间点,作为应急时间点,启用应急时间点对应的镜像虚拟机,将需应急恢复的业务系统的状态与应急时间点对应的镜像虚拟机启用后的状态进行同步,实现应急接管;
其中,各时间点对应的镜像虚拟机由快照生成模块得到;
所述快照生成模块,用于在设定时间点,对业务系统中的操作系统、系统应用及数据进行云备份,得到各时间点对应的镜像虚拟机;所述业务系统为从底层平台解耦得到的业务系统。
进一步的,快照生成模块中,通过云镜像级复制方法对业务系统中的操作系统、系统应用及数据进行云备份。
进一步的,快照生成模块中,通过精简卷复制方法对业务系统中的操作系统、系统应用及数据进行云备份。
进一步的,快照生成模块中的数据包括操作系统及业务应用的IO级别的数据。
进一步的,所述应急恢复模块包括:
启用模块,用于启用应急时间点对应的镜像虚拟机;
存储资源分配模块,用于通过弹性容灾方法,将运行业务系统的硬件上的存储资源分配给需应急恢复的业务系统;
状态同步模块,用于通过数据一致性算法,将需应急恢复的业务系统的状态与应急时间点对应的镜像虚拟机启用后的状态进行同步。
有益效果:本发明与现有技术相比,具有以下优点:
(1)本发明的备份容灾解决方案,在超融合架构或云计算架构下的现有云灾备平台上运用平台解耦技术,将生产业务系统与底层平台解耦,形成可以动态飘移的镜像虚拟机,同时运用任意时间点接管技术,在云灾备平台上对按照时间点对业务系统进行云备份,从而实现了系统迁移、容灾备份、仿真演练、开发测试和数据归集等功能,解决了多云混合架构下的迁移和灾备问题,实现业务连续性管理,确保灾备系统安全、稳定运行,当某个业务系统发生灾难时,镜像虚拟机会应急启动并接管该业务系统,当硬件服务器故障时,镜像虚拟机转化为业务接管虚拟机启动,立即接管业务,达到热备效果,在各单部件和链路故障,甚至整个数据中心故障,都可以实现业务无缝或者快速切换;
(2)本发明的备份容灾解决方案通过精简卷识别技术或云镜像级复制技术,将业务系统、基础应用、数据等整体基于磁盘虚拟化技术,备份到云灾备平台,保证业务连续不中断;
(3)本发明的备份容灾解决方案通过弹性容灾技术,按需弹性分配容灾所需资源,通过平台内的镜像虚拟机可与多个业务系统实时同步,使得在业务系统整个备份同步过程中仅消耗有效的存储资源,无需占用计算资源;当某个业务系统发生灾难时,镜像虚拟机会应急启动并接管该业务系统,如业务系统不发生灾难则0资源消耗,不占用计算资源;
(4)本发明的备份容灾解决方案对所有业务系统一体化实现实时容灾保护,一旦出现业务故障或数据丢失,即可分钟级灾备接管,秒级数据恢复,也可以极大程度上简化运维,减少运维复杂度;
(5)本发明的备份容灾解决方案支持国内外主流的软硬件平台,各种国产的操作系统、数据库,支持操作系统层上的各种用户业务应用。
附图说明
图1为本发明的平台解耦示意图;
图2为本发明的云镜像复制方法示意图;
图3为本发明的精简卷复制方法示意图;
图4为本发明的数据一致性算法示意图;
图5为本发明的任意时间点接管方法示意图;
图6为本发明的弹性容灾示意图;
图7为本发明的系统架构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面结合具体实施方式,进一步阐明本发明。
本发明的一种基于云灾备的一体化备份容灾解决方法,借助平台解耦技术,从物理机、虚拟化平台或云平台IaaS层进行原始环境的剥离,平台解耦后,操作系统、应用、数据实时备份成云镜像。通过云镜像化复制技术或精简卷复制技术,识别操作系统、系统数据等有效数据,把系统及业务的IO级别的这些有效数据变化秒级同步或复制到云平台,使云镜像自动耦合到超融合架构或云计算架构下的云灾备平台中,通过云灾备平台按需启动资源,并自动生成适配和生成云中依赖环境,从业务应用,数据到网络环境,实现弹性敏捷灾备。通过该备份容灾解决方法,实现生产业务系统与底层平台解耦,生成可以动态飘移的镜像虚拟机,从而实现了系统迁移、容灾备份、仿真演练、开发测试和数据归集等功能,解决了多云混合架构下的迁移和灾备问题,实现业务连续性管理。
上述提及的超融合架构是指在同一套单元设备中不仅仅具备计算、网络、存储和服务器虚拟化等资源和技术,而且还包括备份软件、快照技术、重复数据删除、在线数据压缩等元素,而多套单元设备可以通过网络聚合起来,实现模块化的无缝横向扩展,形成统一的资源池。上述提及的云计算架构可以划分为基础设施层、平台层和软件服务层三个层次,通过基于网络的计算方式,将共享的软硬件资源和信息进行组织整合,按需提供给计算机和其他系统使用。
现结合各附图对该解决方法详细说明,包括以下步骤:
步骤1:通过平台解耦技术,将生产业务系统与其底层平台进行解耦,将解耦后的整个生产业务系统耦合到任意云灾备平台或物理设备的镜像虚拟机,形成接管虚拟机;生产业务系统包括1个或多个业务系统,底层平台包括但不限于物理机、虚拟化平台或云平台IaaS层;其中,平台耦合技术指通过虚拟抽象层实现硬件和软件的分离和解耦,即所有的软件只需根据操作系统提供的编程接口,就可以运行在所有基于该操作系统的设备上,而无需考虑设备中各类硬件配置。步骤2:通过任意时间点接管技术,在设定时间点,对业务系统中的操作系统、系统应用及数据进行云备份,形成时间点快照,整合不同时间点的快照,使其之间具有关联性,形成一个细颗粒度的业务系统虚拟机镜像时空隧道;其中,数据为操作系统及业务应用的IO级别的数据。
在该步骤中,可通过云镜像级复制方法对业务系统中的操作系统、系统应用及数据进行云备份,具体为:通过云镜像级复制技术,将操作系统、数据、基础应用、业务应用等整体基于磁盘虚拟化技术,实时转化为该时间点对应的虚拟机镜像,此处的虚拟机镜像备份的是业务系统某个时间点的操作系统、系统应用及数据。真正实现物理、虚拟化、云架构统一的灾备保护,轻松实现任意平台架构的业务负载迁移;
也可通过精简卷复制方法对业务系统中的操作系统、系统应用及数据进行云备份,具体为:通过精简卷复制技术,智能识别区分有效块和无效块,备份复制、同步时仅处理有效块,精简效率高达95%以上,降低备份带宽和备份数据存储空间需求,其中,有效块包括但不限于操作系统和系统数据等核心数据,无效块包括但不限于应用数据、备份数据等冗余数据;
其中,任意时间点接管技术包括:通过基于时间点的和可定制策略的存储数据快照保护技术,按照客户要求定时的周期产生或者按照策略生成任意时间的快照,通过整合不同时间的不同快照,使他们之间建立关联性,形成一个细颗粒度的业务系统虚拟机镜像时空隧道,每个对应时间点的镜像快照就相当于系统在此刻的“录像”,所以当启动时间隧道上任一时间点的镜像快照时,即可还原对应时刻的业务系统数据、状态,从而提供业务测试、安全事故等过程回溯;
步骤3:判断当前故障是否为运行业务系统的硬件发生运行故障,若硬件发生运行故障,则执行步骤4进行无缝恢复;若硬件无运行故障,则为业务系统发生故障,执行步骤5进行应急恢复;
步骤4:获取一镜像裸机系统,镜像虚拟机转化为接管虚拟机启动,在接管虚拟机上运行应急接管点对应的快照,将镜像裸机系统的状态与接管虚拟机在应急接管点对应的快照下的状态进行同步,得到最新数据状态,将最新数据状态恢复至发生故障的硬件;所述镜像裸机系统为没有配置操作系统和系统应用的业务系统;
步骤5:在接管虚拟机上运行应急时间点对应的快照,将需应急恢复的业务系统的状态与接管虚拟机在应急时间点对应的快照下的状态进行同步,实现应急接管;所述应急时间点为离业务系统故障发生前最近的时间点;该步骤具体包括以下步骤:
在接管虚拟机上运行应急时间点对应的时间点快照;
通过弹性容灾方法,将运行业务系统的硬件上的存储资源分配给需应急恢复的业务系统;
通过数据一致性算法,将需应急恢复的业务系统的状态与接管虚拟机在应急时间点对应的时间点快照下的状态进行同步,实现应急接管。
其中,弹性容灾技术包括:在使用的云计算架构下的云灾备平台,云灾备平台有多个弹性云服务器(ECS),弹性云服务器(ECS)是一种计算服务资源,由CPU、内存、映像和弹性卷服务(EVS)磁盘组成,可按需分配和弹性伸缩。通过按需弹性分配容灾所需资源,平台内的镜像虚拟机与多个业务系统实时同步,使得在业务系统整个备份同步过程中仅消耗有效的存储资源,无需占用计算资源。当某个业务系统发生灾难时,镜像虚拟机会应急启动并接管该业务系统。如业务系统不发生灾难则0资源消耗,不占用计算资源。
其中,数据一致性指的是由于数据的复制,不同数据节点中的数据内容是否完整并且相同。数据一致性算法通常使用paxos理论算法,类似于两阶段提交,其算法执行过程分为两个阶段包括:1.承诺2.接受。
阶段一(prepare阶段):
(a)云灾备平台数据库选择一个数据节点编号N,然后向半数以上的Acceptor(单机、双机RAC或业务集群)发送编号为N的数据同步请求。
(b)如果一个Acceptor收到一个编号为N的数据同步请求,如果小于它已经响应过的请求,则拒绝,不回应或回复error,避免重复接受请求。若N大于该Acceptor已经响应过的所有数据同步请求的编号(maxN),则将它已经接受过的编号最大的数据节点作为响应反馈给云灾备平台数据库,同时该Acceptor承诺不再接受任何编号小于N的数据节点。
阶段二(accept阶段):
(a)若云灾备平台数据库收到半数以上Acceptor对其发出的编号为N的数据同步请求的响应,则发送一个针对[N,V]提案的Accept请求给半数以上的Acceptor。注意:V就是收到的响应中编号最大的提案的value(某个Acceptor响应的它已经通过的{acceptN,acceptV}),如果响应中不包含任何提案,那么V就由数据同步请求自己决定。
(b)如果Acceptor收到一个针对编号为N的提案的Accept请求,只要该Acceptor没有对编号大于N的Prepare请求做出过响应,它就接受该提案。如果N小于Acceptor以及响应的Prepare请求,则拒绝,不回应或回复error(当Proposer没有收到过半的回应,那么他会重新进入第一阶段,递增提案号,重新提出数据同步请求)。
通过数据一致性算法保证备份数据一致可用,支持单机、双机和业务集群。
实施例1:
当业务系统数据发生异常,运行业务系统的硬件运行无故障时,本实施例通过上述提及的容灾解决方法进行应急恢复,具体包括以下各个阶段:
将故障主机离线,不能在主机在线状态下应急恢复系统数据,可能会影响业务系统正常运行,因此需先将故障主机离线。
选择需要应急的业务系统故障发生前最近的时间点快照,将此时间点定义为应急时间点,将此时间点下的镜像虚拟机定义为应急接管虚拟机。
启用应急时间点下的应急接管虚拟机,启动应急接管服务,将业务系统同步到应急接管虚拟机在应急时间点下的状态,业务访问恢复正常。
实施例2:
当运行业务系统的硬件运行发生故障时,本实施例通过上述提及的容灾解决方法进行无缝恢复,具体包括以下各个阶段:
通过将一个新的镜像裸机系统引导至恢复环境,由于故障发生时间无从获取,自定义将此镜像裸机系统恢复成某个较早的时间点,并将此时间点定义为应急接管点。
启动应急时间点下的应急接管虚拟机,启动应急接管服务,将裸机系统同步到应急接管虚拟机在应急时间点下的状态。
以应急接管的最新数据状态无缝恢复至此主机。
驱动修复以适配新平台环境。
本发明还公开了一种基于云灾备的一体化备份容灾解决系统,包括:
快照生成模块,用于在设定时间点,对业务系统中的操作系统、系统应用及数据进行云备份,得到各时间点对应的镜像虚拟机;所述业务系统为从底层平台解耦得到的业务系统;
故障判断模块,用于判断当前故障是否为运行业务系统的硬件发生运行故障,若硬件发生运行故障,则控制无缝恢复模块进行无缝恢复;若硬件无运行故障,则控制应急恢复模块进行应急恢复;
无缝恢复模块,用于选择一应急接管时间点,启用应急接管时间点对应的镜像虚拟机;并获取一镜像裸机系统,将镜像裸机系统的状态与应急接管时间点对应的镜像虚拟机启用后的状态进行同步,得到最新数据状态,将最新数据状态恢复至发生故障的硬件;所述镜像裸机系统为没有配置操作系统和系统应用的业务系统;
应急恢复模块,用于选择离业务系统故障发生前最近的时间点,作为应急时间点,启用应急时间点对应的镜像虚拟机,将需应急恢复的业务系统的状态与应急时间点对应的镜像虚拟机启用后的状态进行同步,实现应急接管。
Claims (10)
1.一种基于云灾备的一体化备份容灾解决方法,其特征在于:包括以下步骤:
步骤1:将业务系统与其底层平台进行解耦;
步骤2:在设定时间点,对业务系统中的操作系统、系统应用及数据进行云备份,得到各时间点对应的镜像虚拟机,整合不同时间点的镜像虚拟机,使其之间具有关联性,形成一个细颗粒度的业务系统虚拟机镜像时空隧道;
步骤3:判断当前故障是否为运行业务系统的硬件发生运行故障,若硬件发生运行故障,则执行步骤4进行无缝恢复;若硬件无运行故障,则为业务系统发生故障,执行步骤5进行应急恢复;
步骤4:选择一应急接管时间点,启用应急接管时间点对应的镜像虚拟机;并获取一镜像裸机系统,将镜像裸机系统的状态与应急接管时间点对应的镜像虚拟机启用后的状态进行同步,得到最新数据状态,将最新数据状态恢复至发生故障的硬件;所述镜像裸机系统为没有配置操作系统和系统应用的业务系统;
步骤5:选择离业务系统故障发生前最近的时间点,作为应急时间点,启用应急时间点对应的镜像虚拟机,将需应急恢复的业务系统的状态与应急时间点对应的镜像虚拟机启用后的状态进行同步,实现应急接管。
2.根据权利要求1所述的一种基于云灾备的一体化备份容灾解决方法,其特征在于:步骤2中,通过云镜像级复制方法对业务系统中的操作系统、系统应用及数据进行云备份。
3.根据权利要求1所述的一种基于云灾备的一体化备份容灾解决方法,其特征在于:步骤2中,通过精简卷复制方法对业务系统中的操作系统、系统应用及数据进行云备份。
4.根据权利要求1所述的一种基于云灾备的一体化备份容灾解决方法,其特征在于:步骤2中,所述的数据包括操作系统及业务应用的IO级别的数据。
5.根据权利要求1所述的一种基于云灾备的一体化备份容灾解决方法,其特征在于:所述步骤5具体包括以下步骤:
选择离业务系统故障发生前最近的时间点,作为应急时间点,启用应急时间点对应的镜像虚拟机;
通过弹性容灾方法,将运行业务系统的硬件上的存储资源分配给需应急恢复的业务系统;
通过数据一致性算法,将需应急恢复的业务系统的状态与应急时间点对应的镜像虚拟机启用后的状态进行同步,实现应急接管。
6.一种基于云灾备的一体化备份容灾解决系统,其特征在于:包括:
故障判断模块,用于判断当前故障是否为运行业务系统的硬件发生运行故障,若硬件发生运行故障,则控制无缝恢复模块进行无缝恢复;若硬件无运行故障,则控制应急恢复模块进行应急恢复;
无缝恢复模块,用于选择一应急接管时间点,启用应急接管时间点对应的镜像虚拟机;并获取一镜像裸机系统,将镜像裸机系统的状态与应急接管时间点对应的镜像虚拟机启用后的状态进行同步,得到最新数据状态,将最新数据状态恢复至发生故障的硬件;所述镜像裸机系统为没有配置操作系统和系统应用的业务系统;
应急恢复模块,用于选择离业务系统故障发生前最近的时间点,作为应急时间点,启用应急时间点对应的镜像虚拟机,将需应急恢复的业务系统的状态与应急时间点对应的镜像虚拟机启用后的状态进行同步,实现应急接管;
其中,各时间点对应的镜像虚拟机由快照生成模块得到;
所述快照生成模块,用于在设定时间点,对业务系统中的操作系统、系统应用及数据进行云备份,得到各时间点对应的镜像虚拟机;所述业务系统为从底层平台解耦得到的业务系统。
7.根据权利要求6所述的一种基于云灾备的一体化备份容灾解决系统,其特征在于:快照生成模块中,通过云镜像级复制方法对业务系统中的操作系统、系统应用及数据进行云备份。
8.根据权利要求6所述的一种基于云灾备的一体化备份容灾解决系统,其特征在于:快照生成模块中,通过精简卷复制方法对业务系统中的操作系统、系统应用及数据进行云备份。
9.根据权利要求6所述的一种基于云灾备的一体化备份容灾解决系统,其特征在于:快照生成模块中的数据包括操作系统及业务应用的IO级别的数据。
10.根据权利要求6所述的一种基于云灾备的一体化备份容灾解决系统,其特征在于:所述应急恢复模块包括:
启用模块,用于启用应急时间点对应的镜像虚拟机;
存储资源分配模块,用于通过弹性容灾方法,将运行业务系统的硬件上的存储资源分配给需应急恢复的业务系统;
状态同步模块,用于通过数据一致性算法,将需应急恢复的业务系统的状态与应急时间点对应的镜像虚拟机启用后的状态进行同步。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110953928.1A CN113821376B (zh) | 2021-08-19 | 2021-08-19 | 一种基于云灾备的一体化备份容灾方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110953928.1A CN113821376B (zh) | 2021-08-19 | 2021-08-19 | 一种基于云灾备的一体化备份容灾方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113821376A CN113821376A (zh) | 2021-12-21 |
CN113821376B true CN113821376B (zh) | 2023-11-28 |
Family
ID=78913297
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110953928.1A Active CN113821376B (zh) | 2021-08-19 | 2021-08-19 | 一种基于云灾备的一体化备份容灾方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113821376B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114610535A (zh) * | 2022-02-21 | 2022-06-10 | 广州鼎甲计算机科技有限公司 | 一种Linux操作系统裸机恢复方法、系统、装置及存储介质 |
CN115460081B (zh) * | 2022-09-06 | 2024-05-10 | 长城汽车股份有限公司 | 容灾控制方法、装置、系统、设备及存储介质 |
CN116302711B (zh) * | 2023-05-19 | 2023-10-03 | 山东捷瑞数字科技股份有限公司 | 基于云平台镜像的容灾方法、装置、电子设备及存储介质 |
CN117111836A (zh) * | 2023-06-13 | 2023-11-24 | 贵州电网有限责任公司 | 一种数据迁移系统及方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101207512A (zh) * | 2006-12-22 | 2008-06-25 | 中兴通讯股份有限公司 | 一种数据库系统冗灾备份和切换方法 |
CN112306644A (zh) * | 2020-12-04 | 2021-02-02 | 苏州柏科数据信息科技研究院有限公司 | 一种基于Azure云环境下的CDP方法 |
CN112380062A (zh) * | 2020-11-17 | 2021-02-19 | 上海英方软件股份有限公司 | 一种基于系统备份点多次快速恢复系统的方法及系统 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015123537A1 (en) * | 2014-02-13 | 2015-08-20 | Ashok Ramu | Virtual data backup |
US9772916B2 (en) * | 2014-06-17 | 2017-09-26 | Actifio, Inc. | Resiliency director |
-
2021
- 2021-08-19 CN CN202110953928.1A patent/CN113821376B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101207512A (zh) * | 2006-12-22 | 2008-06-25 | 中兴通讯股份有限公司 | 一种数据库系统冗灾备份和切换方法 |
CN112380062A (zh) * | 2020-11-17 | 2021-02-19 | 上海英方软件股份有限公司 | 一种基于系统备份点多次快速恢复系统的方法及系统 |
CN112306644A (zh) * | 2020-12-04 | 2021-02-02 | 苏州柏科数据信息科技研究院有限公司 | 一种基于Azure云环境下的CDP方法 |
Non-Patent Citations (2)
Title |
---|
BIRDS: A Bare-Metal Recovery Systemfor Instant Restoration of Data Services;Hongliang Yu等;《IEEE Transactions on Computers》;第1392-1407页 * |
云业务应急平台的实现和应用;赖志强等;《软件产业与工程》;第52-56页 * |
Also Published As
Publication number | Publication date |
---|---|
CN113821376A (zh) | 2021-12-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113821376B (zh) | 一种基于云灾备的一体化备份容灾方法及系统 | |
US11360854B2 (en) | Storage cluster configuration change method, storage cluster, and computer system | |
Moser et al. | Extended virtual synchrony | |
US5822531A (en) | Method and system for dynamically reconfiguring a cluster of computer systems | |
CN109151045B (zh) | 一种分布式云系统及监控方法 | |
CN102938705B (zh) | 一种高可用多机备份路由表管理与切换方法 | |
CN110912991A (zh) | 一种基于超融合双节点高可用的实现方法 | |
JP2017504880A (ja) | 分散データグリッドにおいて永続性パーティションリカバリをサポートするためのシステムおよび方法 | |
CN105069152B (zh) | 数据处理方法及装置 | |
CN104660386A (zh) | 一种基于安腾平台下提高db2容灾高可用性的方法 | |
CN114461438A (zh) | 非对称中心模式的分布式数据库容灾系统及方法 | |
CN115878384A (zh) | 一种基于备份容灾系统的分布式集群及构建方法 | |
CN112230853A (zh) | 存储容量调整方法、装置、设备及存储介质 | |
CN103793296A (zh) | 一种在集群中用于辅助备份复制计算机系统的方法 | |
US11522966B2 (en) | Methods, devices and systems for non-disruptive upgrades to a replicated state machine in a distributed computing environment | |
CN105323271B (zh) | 一种云计算系统以及云计算系统的处理方法和装置 | |
CN112243030A (zh) | 分布式存储系统的数据同步方法、装置、设备及介质 | |
CN114598591B (zh) | 嵌入式平台节点故障恢复系统及方法 | |
CN107483257B (zh) | 一种基于x86和arm混合环境的应用系统部署方法及架构 | |
CN111581221B (zh) | 一种分布式多站融合系统信息冗余存储与重构的方法 | |
Lin et al. | ReHRS: A hybrid redundant system for improving MapReduce reliability and availability | |
CN108763312A (zh) | 一种基于负载的从数据节点筛选方法 | |
US11010351B1 (en) | File system replication between software defined network attached storage processes using file system snapshots | |
CN111400098A (zh) | 一种副本管理方法、装置、电子设备及存储介质 | |
CN117827544B (zh) | 热备份系统、方法、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |