CN111611110A - 基于FusionCompute平台的差异恢复方法及差异恢复装置 - Google Patents

基于FusionCompute平台的差异恢复方法及差异恢复装置 Download PDF

Info

Publication number
CN111611110A
CN111611110A CN202010616645.3A CN202010616645A CN111611110A CN 111611110 A CN111611110 A CN 111611110A CN 202010616645 A CN202010616645 A CN 202010616645A CN 111611110 A CN111611110 A CN 111611110A
Authority
CN
China
Prior art keywords
snapshot
backup
difference
data block
recovery
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010616645.3A
Other languages
English (en)
Inventor
钱红江
贺翔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Eisoo Information Technology Co Ltd
Original Assignee
Shanghai Eisoo Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Eisoo Information Technology Co Ltd filed Critical Shanghai Eisoo Information Technology Co Ltd
Priority to CN202010616645.3A priority Critical patent/CN111611110A/zh
Publication of CN111611110A publication Critical patent/CN111611110A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1448Management of the data involved in backup or backup restore
    • G06F11/1451Management of the data involved in backup or backup restore by selection of backup contents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • G06F11/1469Backup restoration techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/84Using snapshots, i.e. a logical point-in-time copy of the data

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种基于FusionCompute平台的差异恢复方法及差异恢复装置,包括以下步骤:对虚拟机进行快照,定义为当前快照,获取备份时间点与当前时间点的差异数据块位置;基于所述差异数据块位置,读取对应位置的数据块并覆盖,写入虚拟机,完成恢复。与现有技术相比,本发明具有减少恢复数据量、恢复时间和网络带宽占用量等优点。

Description

基于FusionCompute平台的差异恢复方法及差异恢复装置
技术领域
本发明涉及一种数据恢复方法,尤其是涉及一种基于FusionCompute平台的差异恢复方法及差异恢复装置。
背景技术
为了减少企业的数据保护的成本和提高保护效率,各家数据保护厂商纷纷提出了各种优化技术,包括完全备份(即对某一时间点完整数据进行备份,如图1)、增量备份(即只备份上次完全备份或增量备份之后变更的数据,如图2)、差异备份(即只备份上次完全备份后变更过的数据,和增量备份的差别是,增量备份可以基于上次的增量备份做,但差异备份必须基于上次的完全备份,如图3)、数据重删(删除备份过程中的重复数据)、LAN-free备份(数据直接通过SAN网络将生产服务器上的数据备份到存储)、Server-free备份(数据在SAN网络内部完成,而大量数据流无需流过生产服务器)等,这些技术确实极大提高了备份效率和降低了数据保护成本,但仔细分析上面的技术不难发现,这些技术都是针对数据备份过程的优化,而数据保护领域不仅仅是数据备份,它还包括数据恢复。
传统的数据恢复过程按照备份的逻辑,假如恢复全量备份时间点,直接恢复完全备份即可,但这种全量备份时间点往往是比较少的;假如恢复差异备份时间点,首先先恢复完全备份,接着恢复差异数据;假如恢复第二次增量备份时间点,首先先恢复完全备份,接着恢复第一次增量数据,最后恢复第二次增量数据。这种方式以两次数据覆盖的形式完成相应时间点的数据恢复,但这种方式也有明显的缺点,就是无论怎么样,恢复的数据总量总是大于完全备份的数据量。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种提高恢复效率、降低网络资源占用的基于FusionCompute平台的差异恢复方法及差异恢复装置。
本发明的目的可以通过以下技术方案来实现:
一种基于FusionCompute平台的差异恢复方法,包括以下步骤:
对虚拟机进行快照,定义为当前快照,获取备份时间点与当前时间点的差异数据块位置;
基于所述差异数据块位置,读取对应位置的数据块并覆盖,写入虚拟机,完成恢复。
进一步地,在存储虚拟化类型下,获取所述差异数据块位置具体为:
通过CBT接口查询获得所述当前快照与要恢复的时间点之间的所述差异数据块位置。
进一步地,所述存储虚拟化类型下,每次备份进行一次快照,并产生对应的changeid,在备份完成后,删除快照,只保留changeid。
进一步地,在FusionStorage存储类型下,获取所述差异数据块位置具体为:
通过差量位图卷接口获取差异位图,基于所述差异位图获取当前快照与最新备份时间点之间的变化块位置,然后将此变化块位置与之前备份过程中记录的变化块进行整合,获得所述差异数据块位置。
进一步地,所述FusionStorage存储类型下,每次备份进行一次快照,在备份完成后,删除上一次备份时的快照,保留本次备份的快照。
本发明还提供一种基于FusionCompute平台的差异恢复装置,包括:
快照单元,用于对虚拟机进行快照,定义为当前快照;
差异数据块获取单元,用于根据所述当前快照获取备份时间点与当前时间点的差异数据块位置;
恢复单元,基于所述差异数据块位置,读取对应位置的数据块并覆盖,写入虚拟机,完成恢复。
进一步地,在存储虚拟化类型下,所述差异数据块获取单元获取所述差异数据块位置具体为:
通过CBT接口查询获得所述当前快照与要恢复的时间点之间的所述差异数据块位置。
进一步地,所述存储虚拟化类型下,每次备份进行一次快照,并产生对应的changeid,在备份完成后,删除快照,只保留changeid。
进一步地,在FusionStorage存储类型下,所述差异数据块获取所述差异数据块位置具体为:
通过差量位图卷接口获取差异位图,基于所述差异位图获取当前快照与最新备份时间点之间的变化块位置,然后将此变化块位置与之前备份过程中记录的变化块进行整合,获得所述差异数据块位置。
进一步地,所述FusionStorage存储类型下,每次备份进行一次快照,在备份完成后,删除上一次备份时的快照,保留本次备份的快照。
与现有技术相比,本发明具有如下有益效果:
1、本发明不需要恢复完全备份的数据量,只恢复差异数据,可以做到恢复的数据总量小于完全备份的数据量,提高恢复效率,有效的降低网络资源占用,从而提高业务连续性。
2、本发明通过逆向思维的方式对备份数据进行恢复,从而达到了减少恢复数据量、恢复时间和网络带宽占用量。
附图说明
图1为现有的完全备份示意图;
图2为现有的增量备份示意图;
图3为现有的差异备份示意图;
图4为本发明差异恢复的流程示意图;
图5为实施例中各时刻数据块变化示意图。
具体实施方式
下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
在虚拟化平台的数据保护领域中,由于FusionCompute虚拟化平台在商业上的广泛应用,它已成为数据保护领域中必不可少的一部分。本发明利用FusionCompute平台实现恢复效率高、资源占用率低的差异恢复。
如图4所示,本发明提供的一种基于FusionCompute平台的差异恢复方法,包括以下步骤:
S01、对虚拟机进行快照,定义为当前快照;
S02、获取备份时间点与当前时间点的差异数据块位置;
S03、基于所述差异数据块位置,读取对应位置的数据块并覆盖,写入虚拟机;
S04、完成恢复,以此将虚拟机恢复到备份时间点状态。
FusionCompute对于不同的存储获取变化数据块集合的方式是不同。FusionCompute主要存在两种类型存储,一种是存储虚拟化,可基于本地磁盘、IPSAN、FCSAN或NAS存储进行虚拟化操作;另一种是FusionStorage存储,基于服务器本地硬盘的分布式存储。两种类型存储获取差异数据块位置的方式不同。
存储虚拟化恢复方式依赖于FusionCompute虚拟化平台提供的CBT(ChangeBlockTracking)接口,该接口能够查询到自上次执行快照(快照可删除)以来,哪些数据块被改动了(每次虚拟机备份都会执行快照,每次执行快照都会产生一个changeid值,CBT通过两个快照的changid值就可以查询到变化数据块)。差异恢复前,先对虚拟机进行快照,通过CBT接口获取此快照与要恢复的时间点之间的差异数据块位置。
FusionStorage存储恢复方式依赖于FusionStorage存储提供的差量位图卷接口,可以获取两个快照(快照必须存在)之间的差量位图,即变化块位置。但虚拟机保存的快照数目是有限的,太多的快照直接影响虚拟机的性能,所以在进行备份时,每进行一次备份都将这些变化块位置记录下来,只保留最后一次备份所留下的快照。差异恢复前,先对虚拟机进行快照,通过差异位图获取此快照与最新备份时间点之间的变化块位置,然后将此变化数据块与之前备份过程中记录的变化块进行整合,找到当前时间点与要恢复的时间点之间的差异数据块位置。
如图5所示,在T1时刻对虚拟机做了完全备份,T2时刻做了增量备份(变化数据块为a),T3时刻做了增量备份(变化数据块为b),现在为T4时刻,现在需要将虚拟机恢复至T2时刻。2)按照传统的恢复逻辑,首先应该恢复T1时刻备份的完备数据,然后恢复T2时刻备份的增量数据,由于恢复了一个完备副本,导致恢复效率较低。而采用本发明上述差异恢复方法时,恢复前先获取T2时刻到T4时刻变化的数据块位置,即c,b,d数据块所在位置。然后从备份介质中获取T2时刻此位置对应的数据块并写入虚拟机。T2时刻对应位置的数据块为:a,B,D。此种恢复方式极大的提高了恢复效率。
对于存储虚拟化,恢复前执行快照产生changeid(T4),通过T2时刻增量备份时产生的changeid(T2)和changeid(T4)即可获取T2至T4时刻的变化块位置(c、b、d数据块的位置),然后根据位置从T1和T2时刻备份的数据中获取数据块(a、B、D)写入虚拟机磁盘,虚拟机就恢复到T2时刻。
对于FusionStorage存储,在每次备份时,记录变化数据块的位置。比如:T2时刻备份时,记录数据块a的位置;T3时刻备份时,记录数据块b的位置。T4时刻恢复前,执行快照获取T3到T4的增量数据块位置(c,d位置)。此时由于需要恢复到T2时刻,整合T3时刻和T4时刻的记录的变化块位置得到T2到T4的变化数据块位置(即c,b,d位置),然后根据位置从T1和T2时刻备份的数据中获取数据块(a、B、D)写入虚拟机磁盘,虚拟机就恢复到T2时刻。
值得注意的是,每次备份是都会进行一次快照,只不过备份完之后,存储虚拟化快照都被删除,只保留changeid,如此我们可以轻松的获取每个备份时间的的changeid;FusionStorage存储删除上一次备份时的快照,保存本次备份的快照。
根据图5获得的恢复数据量的比较如表1所示。
表1
恢复到时间点T1 恢复到时间点T2 恢复到时间点T3
传统恢复 完备副本 完备副本+a 完备副本+a+b
差异恢复 A+B+D a+B+D a+D
如表1所示,传统方式在恢复数据时总是包含完全备份数据,一般来讲完全备份总是大于增量数据的。而本发明的差异恢复总是恢复增量部分的数据,特别是选择的时间点越推后,恢复的增量数据越少。所以差异恢复方式恢复的数据量基本上总是小于传统恢复方式的恢复数据量。
本发明的另一实施方式中提供一种基于FusionCompute平台的差异恢复装置,包括:快照单元,用于对虚拟机进行快照,定义为当前快照;差异数据块获取单元,用于根据所述当前快照获取备份时间点与当前时间点的差异数据块位置;恢复单元,基于所述差异数据块位置,读取对应位置的数据块并覆盖,写入虚拟机,完成恢复。
实施例
为了简单说明,本实施例备份介质为本地存储,目标虚拟机虚拟磁盘为存储虚拟化类型存储,具体恢复过程如下:
1)首先在T1时刻以完全备份的方式备份目标虚拟机,对目标虚拟机执行快照,将磁盘数据全部备份至备份介质中,并记录changeid1,备份完成后删除本次备份快照。
2)打开虚拟机,向虚拟机中添加文件test1和test2。
3)在T2时刻,对虚拟机执行快照,发起增量备份,记录changeid2,备份完成后删除本次快照。
4)打开虚拟机,向虚拟机中添加文件test3和test4。关闭虚拟机。
5)选择恢复备份时间点T2。
6)对虚拟机执行快照,获取当前时间点的changeid3。通过CBT接口查询到changeid2和changeid3之间(即T2时刻到当前时间点)虚拟机数据变化块集合。
7)获得数据变化块集合后,在备份介质中读取T2时刻对应的数据块,并覆盖写入虚拟机磁盘中。
8)打开虚拟机,可以观察到test3和test4文件已消失不见,只剩下test1和test2,说明当前虚拟机已恢复至指定时间点T2。
以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术人员无需创造性劳动就可以根据本发明的构思作出诸多修改和变化。因此,凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。

Claims (10)

1.一种基于FusionCompute平台的差异恢复方法,其特征在于,包括以下步骤:
对虚拟机进行快照,定义为当前快照,获取备份时间点与当前时间点的差异数据块位置;
基于所述差异数据块位置,读取对应位置的数据块并覆盖,写入虚拟机,完成恢复。
2.根据权利要求1所述的基于FusionCompute平台的差异恢复方法,其特征在于,在存储虚拟化类型下,获取所述差异数据块位置具体为:
通过CBT接口查询获得所述当前快照与要恢复的时间点之间的所述差异数据块位置。
3.根据权利要求2所述的基于FusionCompute平台的差异恢复方法,其特征在于,所述存储虚拟化类型下,每次备份进行一次快照,并产生对应的changeid,在备份完成后,删除快照,只保留changeid。
4.根据权利要求1所述的基于FusionCompute平台的差异恢复方法,其特征在于,在FusionStorage存储类型下,获取所述差异数据块位置具体为:
通过差量位图卷接口获取差异位图,基于所述差异位图获取当前快照与最新备份时间点之间的变化块位置,然后将此变化块位置与之前备份过程中记录的变化块进行整合,获得所述差异数据块位置。
5.根据权利要求4所述的基于FusionCompute平台的差异恢复方法,其特征在于,所述FusionStorage存储类型下,每次备份进行一次快照,在备份完成后,删除上一次备份时的快照,保留本次备份的快照。
6.一种基于FusionCompute平台的差异恢复装置,其特征在于,包括:
快照单元,用于对虚拟机进行快照,定义为当前快照;
差异数据块获取单元,用于根据所述当前快照获取备份时间点与当前时间点的差异数据块位置;
恢复单元,基于所述差异数据块位置,读取对应位置的数据块并覆盖,写入虚拟机,完成恢复。
7.根据权利要求1所述的基于FusionCompute平台的差异恢复装置,其特征在于,在存储虚拟化类型下,所述差异数据块获取单元获取所述差异数据块位置具体为:
通过CBT接口查询获得所述当前快照与要恢复的时间点之间的所述差异数据块位置。
8.根据权利要求7所述的基于FusionCompute平台的差异恢复装置,其特征在于,所述存储虚拟化类型下,每次备份进行一次快照,并产生对应的changeid,在备份完成后,删除快照,只保留changeid。
9.根据权利要求1所述的基于FusionCompute平台的差异恢复装置,其特征在于,在FusionStorage存储类型下,所述差异数据块获取所述差异数据块位置具体为:
通过差量位图卷接口获取差异位图,基于所述差异位图获取当前快照与最新备份时间点之间的变化块位置,然后将此变化块位置与之前备份过程中记录的变化块进行整合,获得所述差异数据块位置。
10.根据权利要求4所述的基于FusionCompute平台的差异恢复装置,其特征在于,所述FusionStorage存储类型下,每次备份进行一次快照,在备份完成后,删除上一次备份时的快照,保留本次备份的快照。
CN202010616645.3A 2020-06-30 2020-06-30 基于FusionCompute平台的差异恢复方法及差异恢复装置 Pending CN111611110A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010616645.3A CN111611110A (zh) 2020-06-30 2020-06-30 基于FusionCompute平台的差异恢复方法及差异恢复装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010616645.3A CN111611110A (zh) 2020-06-30 2020-06-30 基于FusionCompute平台的差异恢复方法及差异恢复装置

Publications (1)

Publication Number Publication Date
CN111611110A true CN111611110A (zh) 2020-09-01

Family

ID=72202458

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010616645.3A Pending CN111611110A (zh) 2020-06-30 2020-06-30 基于FusionCompute平台的差异恢复方法及差异恢复装置

Country Status (1)

Country Link
CN (1) CN111611110A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113051030A (zh) * 2021-03-15 2021-06-29 上海爱数信息技术股份有限公司 一种基于FusionCompute虚拟化平台的虚拟机恢复系统及其方法
CN117493074A (zh) * 2023-09-25 2024-02-02 广州鼎甲计算机科技有限公司 虚拟机增量恢复方法、装置、计算机设备和存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104506619A (zh) * 2014-12-22 2015-04-08 华为技术有限公司 一种数据备份、恢复方法及其装置、服务器
CN105938457A (zh) * 2016-03-31 2016-09-14 华为技术有限公司 数据的过滤方法、装置及数据读取系统
CN109582443A (zh) * 2018-12-06 2019-04-05 国网江西省电力有限公司信息通信分公司 基于分布式存储技术的虚拟机备份系统
US20190235971A1 (en) * 2018-01-29 2019-08-01 Rubrik, Inc. Creation of Virtual Machine Packages Using Incremental State Updates
CN111309527A (zh) * 2020-02-29 2020-06-19 上海爱数信息技术股份有限公司 一种在虚拟化备份系统中保留和恢复用户快照的方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104506619A (zh) * 2014-12-22 2015-04-08 华为技术有限公司 一种数据备份、恢复方法及其装置、服务器
CN105938457A (zh) * 2016-03-31 2016-09-14 华为技术有限公司 数据的过滤方法、装置及数据读取系统
US20190235971A1 (en) * 2018-01-29 2019-08-01 Rubrik, Inc. Creation of Virtual Machine Packages Using Incremental State Updates
CN109582443A (zh) * 2018-12-06 2019-04-05 国网江西省电力有限公司信息通信分公司 基于分布式存储技术的虚拟机备份系统
CN111309527A (zh) * 2020-02-29 2020-06-19 上海爱数信息技术股份有限公司 一种在虚拟化备份系统中保留和恢复用户快照的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王春海: "《VMware虚拟化与云计算应用案例详解》", 30 June 2016, 中国铁道出版社 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113051030A (zh) * 2021-03-15 2021-06-29 上海爱数信息技术股份有限公司 一种基于FusionCompute虚拟化平台的虚拟机恢复系统及其方法
CN117493074A (zh) * 2023-09-25 2024-02-02 广州鼎甲计算机科技有限公司 虚拟机增量恢复方法、装置、计算机设备和存储介质

Similar Documents

Publication Publication Date Title
US8250033B1 (en) Replication of a data set using differential snapshots
US9348827B1 (en) File-based snapshots for block-based backups
CN106776130B (zh) 一种日志恢复方法、存储装置和存储节点
US20130080397A1 (en) Database restore using incremental backups in reverse order
US20130110784A1 (en) Managing backups of data objects in containers
CN113626261A (zh) 一种数据备份方法、装置、设备及计算机可读存储介质
CN104461773A (zh) 一种虚拟机备份去重的方法
CN111611110A (zh) 基于FusionCompute平台的差异恢复方法及差异恢复装置
CN104360914A (zh) 增量快照方法和装置
CN112506616B (zh) 一种基于云平台卷实现虚拟机跨云快速恢复的系统及方法
CN105302667A (zh) 基于集群架构的高可靠性数据备份与恢复方法
US10585895B2 (en) Method and apparatus for reconstructing standby node database
CN110569147A (zh) 一种基于索引的删除文件恢复方法、终端设备及存储介质
US10459807B2 (en) Determining modified portions of a RAID storage array
CN113885809B (zh) 数据管理系统及方法
CN107391312B (zh) 数据云备份方法及系统
CN111090549B (zh) 一种基于卷cbt驱动的增量回迁卷级数据到原机的方法
CN104572339A (zh) 基于分布式文件系统的数据备份还原系统及方法
CN105095418A (zh) 一种处理写请求的方法和装置
CN111858159A (zh) 一种基于链式克隆特性实现的备份方法与系统
CN112882859A (zh) 一种虚拟机合成备份方法及系统
CN103902227A (zh) 一种支持追加写和共享读的文件存储方式
CN103412802B (zh) 容灾数据文件访问控制列表备份的方法及装置
CN115658391A (zh) 基于QianBase MPP数据库的WAL机制的备份恢复方法
CN111399774B (zh) 分布式存储系统下基于快照的数据处理方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200901