CN112035296A - 一种增量备份最小变动的备份方法 - Google Patents

一种增量备份最小变动的备份方法 Download PDF

Info

Publication number
CN112035296A
CN112035296A CN202010882390.5A CN202010882390A CN112035296A CN 112035296 A CN112035296 A CN 112035296A CN 202010882390 A CN202010882390 A CN 202010882390A CN 112035296 A CN112035296 A CN 112035296A
Authority
CN
China
Prior art keywords
backup
hard disk
data
cloud hard
incremental
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010882390.5A
Other languages
English (en)
Inventor
赵益鑫
于昊
李凯
冯建奎
高传集
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Cloud Information Technology Co Ltd
Original Assignee
Inspur Cloud Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Cloud Information Technology Co Ltd filed Critical Inspur Cloud Information Technology Co Ltd
Priority to CN202010882390.5A priority Critical patent/CN112035296A/zh
Publication of CN112035296A publication Critical patent/CN112035296A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1448Management of the data involved in backup or backup restore
    • G06F11/1451Management of the data involved in backup or backup restore by selection of backup contents

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及计算OpenStack技术领域,具体提供了一种增量备份最小变动的备份方法,一种增量备份最小变动的备份方法,其特征在于,具有以下步骤:S1、计算出备份链中每一个备份中包含的数据内容;S2、逐个与目标云硬盘的数据内容进行比对;S3、根据步骤S2中得出的结果,按照数据内容差别大小比较,得到备份链中与目标云硬盘的数据内容差别最小的备份;S4、针对云硬盘下一个备份,需要用步骤S3中得到进行创建,此时备份的数据内容变动就是最小的。与现有技术相比,本发明显著节省了备份所需的磁盘空间,有效地缩短了备份过程的时间,提高了云硬盘的备份效率,具有良好的推广价值。

Description

一种增量备份最小变动的备份方法
技术领域
本发明涉及计算OpenStack技术领域,具体提供一种增量备份最小变动的备份方法。
背景技术
OpenStack是一个旨在为私有云和公有云提供可扩展的弹性的云计算服务的开源项目,由计算、存储和网络等几个主要的组件组合起来完成云计算管理工作,其目标是为全球用户提供实施简单、可大规模扩展、丰富、标准统一的云计算管理平台。
Cinder作为OpenStack的存储服务组件,为客户提供丰富的块存储服务。云硬盘作为块存储服务提供给用户的主要服务资源类型可以为客户的云服务器提供高可用、弹性、高性能、低时延的块存储。其中,cinder-backup服务是cinder组件提供的针对云硬盘的备份服务。备份有全量备份和增量备份可以选择,增量备份首先进行一次完整备份,然后下一次备份的时候,仅备份距离上次备份这段时间内更改的内容。这样在数据恢复的时候,首先恢复到第一个完全备份,然后再按时间顺序依次恢复每一个增量备份,即可恢复全部的数据。这种策略的特点是备份速度快,没有重复的备份数据,节省磁盘空间。
针对当前Cinder-backup提供的云硬盘的增量备份方式,都是只能基于上一个备份进行创建,这样的方式没有充分考虑备份和当前云硬盘中的数据内容,可能会造成冗余的多备份一部分不需要的数据。
发明内容
本发明是针对上述现有技术的不足,提供一种实用性强的增量备份最小变动的备份方法。
本发明解决其技术问题所采用的技术方案是:
一种增量备份最小变动的备份方法,具有以下步骤:
S1、计算出备份链中每一个备份中包含的数据内容;
S2、逐个与目标云硬盘的数据内容进行比对;
S3、根据步骤S2中得出的结果,按照数据内容差别大小比较,得到备份链中与目标云硬盘的数据内容差别最小的备份;
S4、针对云硬盘下一个备份,需要用步骤S3中得到进行创建,此时备份的数据内容变动就是最小的。
进一步的,在步骤S1中,通过cinder-backup给云硬盘创建两个备份,且创建的两个备份状态都为可用状态。
作为优选,云硬盘创建的两个备份分别为完全备份和增量备份,且增量备份是基于完全备份创建的。
进一步的,在步骤S1中,将备份链中的每一个备份的数据完整的恢复出来。
进一步的,在步骤S2中,将每一个备份恢复出来的数据与当目标硬盘的数据内容进行对比分析,得出所有的差异结果。
作为优选,在步骤S2中,进一步的包括:
将目标云硬盘已经存在的所有的备份都恢复到一个临时云硬盘中,临时云硬盘与目标云硬盘中数据块进行比对。
进一步的,在步骤S3中,根据临时云硬盘与目标云硬盘中数据块的sha值差异,从而确定数据差异量最小的那个备份。
作为优选,在步骤S3中,进一步包括:
通过打快照并且将快照挂载到cinder-backup所在的主机节点上,比较与目标云硬盘中的数据块的sha值的差异。
进一步的,在步骤S4中,不断的安装数据量最小的备份进行创建,此时备份的数据内容变动就是最小的。
本发明的一种增量备份最小变动的备份方法和现有技术相比,具有以下突出的有益效果:
在云硬盘的备份过程中,充分计算了备份链上每个备份和目标云硬盘中的数据内容,从而选择最优的备份作为基础,再去做一次增量的备份,这样相较于原来的只能基于上一个备份进行创建的方法,显著节省了备份所需的磁盘空间,有效地缩短了备份过程的时间,提高了云硬盘的备份效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
附图1是一种增量备份最小变动的备份方法的云硬盘数据示意图;
附图2是一种增量备份最小变动的备份方法的备份示意图。
具体实施方式
为了使本技术领域的人员更好的理解本发明的方案,下面结合具体的实施方式对本发明作进一步的详细说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例都属于本发明保护的范围。
下面给出一个最佳实施例:
如图1、2所述,本实施例中的一种增量备份最小变动的备份方法,首先,计算出备份链中每一个备份中包含的数据内容;
然后,逐个与目标云硬盘的数据内容进行比对;
根据数据内容比对得出的结果,按照数据内容差别大小比较,得到备份链中与目标云硬盘的数据内容差别最小的备份;
最后,针对云硬盘下一个备份,需要用数据内容差别最小的备份进行创建,此时备份的数据内容变动就是最小的。
具体的步骤为:
S1、选定一个有1GB数据的云硬盘H,通过cinder-backup给云硬盘创建一个完全备份M,并保证此完全备份M状态为可用状态。
S2、往云硬盘H中写入2GB的数据,此时数据量一共为3GB。然后再为云硬盘H创建一个新的备份,这个备份为增量备份N,是基于完全备份M创建的,并保证增量备份N的状态为可用状态。
S3、接着改变云硬盘H中的数据内容,改动后的总数据量为1.5GB。然后为云硬盘H和完全备份M分别打一个快照,将两个快照挂载到cinder-backup所在的主机节点上,每一个数据块(比如32KB)都计算一下sha值,并将sha值进行比较,得到差异的数据块,最后统计所有差异的数据块,得出差异数据量为0.5GB。
S4、使用完全备份M和增量备份N,将备份数据恢复临时云硬盘I中,及S2时的数据状态,总数量为3GB,然后为云硬盘I打一个快照,并将快照挂载到cinder-backup所在的主机节点上,计算每个数据块的sha值,通过与云硬盘H数据块的sha值进行比较,得出差异数据量为1.5GB。
S5、由S3和S4可知,与云硬盘H当前数据内容差异最小的是完全备份M中备份的数据。所以,下次创建新的增量备份时,不再基于增量备份N来创建,而是改为基于完全备份M来创建,这样备份的数据变动是最小的,并保证新创建的增量备份P的状态为可用状态。
S6、再次往云硬盘H写入数据,写入后数据总量为4GB。然后为云硬盘H打一个新的快照,并将此快照挂载到cinder-backup所在的主机节点上,通过比较云硬盘H与完全备份M中的数据块的sha值的差异,得出差异数据量为3GB。
S7、同样,比较云硬盘I与云硬盘H新的快照中的数据块的sha值的差异,得出差异数据量1GB。
S8、使用完全备份M和增量备份P,将备份数据恢复云硬盘J中,即S3时的数据状态,总数量为1.5GB,然后为云硬盘J打一个快照,并将快照挂载到cinder-backup所在的主机节点上,通过比较与云硬盘H中的数据块的sha值的差异,得出差异数据量为2.5GB。
S9、根据S6、S7和S8可知,与云硬盘H当前数据内容差异最小的是完全备份M加上增量备份N这条备份链中备份的数据。所以,下次创建新的增量备份时,不再基于增量备份P来创建,而是改为基于增量备份N来创建,这样备份的数据变动是最小的,并保证新创建的增量备份Q的状态为可用状态。
S10、每次创建新的增量备份的时候,都按照上述的方法,将目标云硬盘已经存在的所有的备份都恢复到一个临时云硬盘中,比较临时云硬盘与目标云硬盘中数据块sha值的差异,从而确定数据差异量最小的那个备份。然后基于数据量差异最小的备份进行创建,就能达到最小数据变动的备份效果。
上述具体的实施方式仅是本发明具体的个案,本发明的专利保护范围包括但不限于上述具体的实施方式,任何符合本发明的一种增量备份最小变动的备份方法权利要求书的且任何所述技术领域普通技术人员对其做出的适当变化或者替换,皆应落入本发明的专利保护范围。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (9)

1.一种增量备份最小变动的备份方法,其特征在于,具有以下步骤:
S1、计算出备份链中每一个备份中包含的数据内容;
S2、逐个与目标云硬盘的数据内容进行比对;
S3、根据步骤S2中得出的结果,按照数据内容差别大小比较,得到备份链中与目标云硬盘的数据内容差别最小的备份;
S4、针对云硬盘下一个备份,需要用步骤S3中得到进行创建,此时备份的数据内容变动就是最小的。
2.根据权利要求1所述的一种增量备份最小变动的备份方法,其特征在于,在步骤S1中,通过cinder-backup给云硬盘创建两个备份,且创建的两个备份状态都为可用状态。
3.根据权利要求1或2所述的一种增量备份最小变动的备份方法,其特征在于,云硬盘创建的两个备份分别为完全备份和增量备份,且增量备份是基于完全备份创建的。
4.根据权利要求1所述的一种增量备份最小变动的备份方法,其特征在于,在步骤S1中,将备份链中的每一个备份的数据完整的恢复出来。
5.根据权利要求1所述的一种增量备份最小变动的备份方法,其特征在于,在步骤S2中,将每一个备份恢复出来的数据与当目标硬盘的数据内容进行对比分析,得出所有的差异结果。
6.根据权利要求5所述的一种增量备份最小变动的备份方法,其特征在于,在步骤S2中,进一步的包括:
将目标云硬盘已经存在的所有的备份都恢复到一个临时云硬盘中,临时云硬盘与目标云硬盘中数据块进行比对。
7.根据权利要求6所述的一种增量备份最小变动的备份方法,其特征在于,在步骤S3中,根据临时云硬盘与目标云硬盘中数据块的sha值差异,从而确定数据差异量最小的那个备份。
8.根据权利要求7所述的一种增量备份最小变动的备份方法,其特征在于,在步骤S3中,进一步包括:
通过打快照并且将快照挂载到cinder-backup所在的主机节点上,比较与目标云硬盘中的数据块的sha值的差异。
9.根据权利要求8所述的一种增量备份最小变动的备份方法,其特征在于,在步骤S4中,不断的安装数据量最小的备份进行创建,此时备份的数据内容变动就是最小的。
CN202010882390.5A 2020-08-28 2020-08-28 一种增量备份最小变动的备份方法 Pending CN112035296A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010882390.5A CN112035296A (zh) 2020-08-28 2020-08-28 一种增量备份最小变动的备份方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010882390.5A CN112035296A (zh) 2020-08-28 2020-08-28 一种增量备份最小变动的备份方法

Publications (1)

Publication Number Publication Date
CN112035296A true CN112035296A (zh) 2020-12-04

Family

ID=73586742

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010882390.5A Pending CN112035296A (zh) 2020-08-28 2020-08-28 一种增量备份最小变动的备份方法

Country Status (1)

Country Link
CN (1) CN112035296A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112698990A (zh) * 2021-01-04 2021-04-23 浪潮云信息技术股份公司 一种备份数据时在线删除重复数据的方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107704342A (zh) * 2017-09-26 2018-02-16 郑州云海信息技术有限公司 一种快照拷贝方法、系统、装置及可读存储介质
CN107818029A (zh) * 2017-11-07 2018-03-20 上海爱数信息技术股份有限公司 一种云硬盘数据恢复一致性的自动化测试方法
US10146590B1 (en) * 2016-03-31 2018-12-04 EMC IP Holding Company LLC Automatically deploying a virtualized object store in an open stack tenant name space
CN109542686A (zh) * 2018-11-22 2019-03-29 郑州云海信息技术有限公司 一种数据备份精简存储方法及系统
CN109542679A (zh) * 2018-11-09 2019-03-29 安徽典典科技发展有限责任公司 一种差异数据比较和同步方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10146590B1 (en) * 2016-03-31 2018-12-04 EMC IP Holding Company LLC Automatically deploying a virtualized object store in an open stack tenant name space
CN107704342A (zh) * 2017-09-26 2018-02-16 郑州云海信息技术有限公司 一种快照拷贝方法、系统、装置及可读存储介质
CN107818029A (zh) * 2017-11-07 2018-03-20 上海爱数信息技术股份有限公司 一种云硬盘数据恢复一致性的自动化测试方法
CN109542679A (zh) * 2018-11-09 2019-03-29 安徽典典科技发展有限责任公司 一种差异数据比较和同步方法
CN109542686A (zh) * 2018-11-22 2019-03-29 郑州云海信息技术有限公司 一种数据备份精简存储方法及系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112698990A (zh) * 2021-01-04 2021-04-23 浪潮云信息技术股份公司 一种备份数据时在线删除重复数据的方法

Similar Documents

Publication Publication Date Title
US9773015B2 (en) Dynamically varying the number of database replicas
US20190220356A1 (en) Data Processing Method, System, and Apparatus
WO2018001110A1 (zh) 一种基于纠删码的存储数据重构方法和装置、存储节点
AU2011312036A1 (en) Automatic replication and migration of live virtual machines
WO2011144425A1 (en) Space reservation in a deduplication system
CN108319596A (zh) 一种数据库的扩容方法和装置
CN109298978B (zh) 一种指定位置的数据库集群的恢复方法及系统
AU2011312100B2 (en) Automatic selection of secondary backend computing devices for virtual machine image replication
CN110633325B (zh) 一种基于Docker的数据库集群扩容方法及装置
CN103902410A (zh) 云存储系统的数据备份加速方法
CN109241023A (zh) 分布式存储系统数据存储方法、装置、系统及存储介质
CN109542684A (zh) 一种存储远程复制方法、装置、设备及存储介质
US11347694B2 (en) Efficient change block tracking in a distributed generation-id (GID) based log structured file system (LSFS)
CN112035296A (zh) 一种增量备份最小变动的备份方法
CN111026711A (zh) 基于区块链数据存储方法、装置、计算机设备及存储介质
CN113254267B (zh) 分布式数据库的数据备份方法和装置
US20210006619A1 (en) Email synchronization method and apparatus, and computer readable storage medium
CN105278881A (zh) 一种恢复ntfs文件系统gpt分区表的方法
CN113965582B (zh) 一种模式转换方法和系统,及存储介质
Goncalves et al. DottedDB: Anti-entropy without merkle trees, deletes without tombstones
CN108429813B (zh) 云存储服务的容灾方法、系统及终端
CN113778334A (zh) 基于电子卷宗的分布式存储系统
US9489271B1 (en) User interface for restoring databases
US8849763B1 (en) Using multiple clients for data backup
CN111770158A (zh) 云平台恢复方法、装置、电子设备及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20201204

RJ01 Rejection of invention patent application after publication