CN103605586A - 一种用于磁带介质的数据恢复方法 - Google Patents

一种用于磁带介质的数据恢复方法 Download PDF

Info

Publication number
CN103605586A
CN103605586A CN201310587598.4A CN201310587598A CN103605586A CN 103605586 A CN103605586 A CN 103605586A CN 201310587598 A CN201310587598 A CN 201310587598A CN 103605586 A CN103605586 A CN 103605586A
Authority
CN
China
Prior art keywords
data
backup
index
tape
backup data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201310587598.4A
Other languages
English (en)
Inventor
穆裕
张道伟
王旭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Electronic Information Industry Co Ltd
Original Assignee
Inspur Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Electronic Information Industry Co Ltd filed Critical Inspur Electronic Information Industry Co Ltd
Priority to CN201310587598.4A priority Critical patent/CN103605586A/zh
Publication of CN103605586A publication Critical patent/CN103605586A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

本发明提供一种用于磁带介质的数据恢复方法,其具体恢复步骤为:设置备份数据,该备份数据是指存储在磁盘介质上的数据,该数据以备份集为单位,每一次备份的数据称为一个备份集数据,分配以一个唯一的ID标识,称为备份集ID,通过备份集ID可以找到备份数据存储位置;通过备份数据索引对每个备份数据的数据版本索引排序;按照排序后索引进行数据恢复。该一种用于磁带介质的数据恢复方法和现有技术相比,减少加载卸载操作,提高恢复效率,实用性强,易于推广。

Description

一种用于磁带介质的数据恢复方法
技术领域
本发明涉及计算机数据恢复技术领域,具体的说是一种用于磁带介质的数据恢复方法。
背景技术
随着信息时代的到来,数据越来越突出地成为社会正常运作的核心。对于一个企业来讲,数据更是影响其生存和发展的关键,各行业的用户和企业对网络应用和数据信息的依赖日益强烈,使得突发性灾难如火灾、洪水、地震或者恐怖事件等对整个企业的数据和业务生产会造成重大影响。因此,如何保证在灾难发生时企业数据不丢失,保证系统服务尽快恢复运行,成为人们关注的话题。而数据恢复的速度直接影响企业业务能否正常运行,成为影响RTO(恢复时间目标,以时间为单位,即在灾难发生后,信息系统或业务功能从停止到必须恢复的时间要求。)和RPO(恢复点目标,以时间为单位,即在灾难发生时,系统和数据必须恢复到的时间点要求。)的关键因素,尤其针对存储在磁带介质上的数据的恢复,传统的按照原备份集索引顺序进行数据恢复的方法,当恢复不同备份集的数据时如恢复一个增量备份集数据,由于多条文件数据备份集ID可能交叉存在且每个备份集存储在不同磁带上,如备份集索引中备份集ID序列为(1、2、3、1),当恢复时会加载、卸载4次磁带,又因为磁带加载、卸载时间远远大于读写时间,这样导致大量时间浪费在加载、卸载磁带上,从而大大降低了恢复的效率,导致恢复时间过长,系统服务无法正常运行,增加用户的损失。为了解决以上问题,本发明根据备份集ID进行分组,并根据不同备份集ID的数据量进行排序,减少加载卸载操作,提高恢复效率。
发明内容
本发明的技术任务是解决现有技术的不足,提供一种用于磁带介质的数据恢复方法。
本发明的技术方案是按以下方式实现的,该一种用于磁带介质的数据恢复方法,其具体恢复步骤为:
一、设置备份数据,该备份数据是指存储在磁盘介质上的数据,该数据以备份集为单位,每一次备份的数据称为一个备份集数据,分配以一个唯一的ID标识,称为备份集ID,通过备份集ID可以找到备份数据存储位置;
二、通过备份数据索引对每个备份数据的数据版本索引排序;
三、按照排序后索引进行数据恢复。
所述备份数据索引为每条备份数据的索引信息,其中包括该条备份数据的路径、类型、写入和访问时间、文件数据大小、备份集ID,所述类型是指文件或路径。
所述备份数据索引通过排序算法完成排序,该排序算法负责将备份数据索引中的每条备份数据索引信息进行排序。
所述排序算法根据备份集ID和不同备份集ID的数据量大小进行排序。
所述步骤三的数据恢复通过数据恢复模块完成,该数据恢复模块将遍历备份数据索引排序算法,排序后的索引信息,加载磁带,将磁带上的数据恢复到指定位置。
本发明与现有技术相比所产生的有益效果是:
本发明的一种用于磁带介质的数据恢复方法采用对每个备份的数据版本索引进行排序,按照排序后索引进行数据恢复,由于数据可能存在于不同磁带上,而磁带这种存储介质其加载、卸载磁带的时间远远大于磁带读写时间,因此采用这种方法能够实现数据读取时间的最小化,减少加载卸载操作,大大提升恢复效率,减少数据恢复时间,从而减少业务中断的时间,实用性强,适用范围广泛,易于推广。
附图说明
附图1为本发明中备份数据索引排序算法排序操作流程图。
附图2为本发明中索引存储结构图。
附图3为本发明中磁盘备份集数据存储结构图。
具体实施方式
下面结合附图对本发明的一种用于磁带介质的数据恢复方法作以下详细说明。
如附图2、图3所示,本发明提供一种用于磁带介质的数据恢复方法,针对磁带存储介质的特性,采用对每个备份的数据版本索引进行排序,按照排序后索引进行数据恢复,其具体恢复步骤为:
一、设置备份数据,该备份数据是指存储在磁盘介质上的数据,该数据以备份集为单位,每一次备份的数据称为一个备份集数据,分配以一个唯一的ID标识,称为备份集ID,通过备份集ID可以找到备份数据存储位置。
备份数据,以备份集为单位,可以跨磁带进行存储。
二、一次备份操作可能导致每条数据(如每一个文件)的备份集ID不同,比如一次增量备份,有些文件变化有些文件没有变化,则变化了的文件在索引中的备份集ID为本次备份ID,没有变化的文件在索引中的备份集ID为上次备份的ID,因此当这两个备份集数据存储在不同磁带上时,会出现加载磁带-卸载磁带-加载磁带操作,这样会在加载与卸载时浪费大量时间。
因此,通过备份数据索引对每个备份数据的数据版本索引排序。
三、按照排序后索引进行数据恢复。
所述备份数据索引为每条备份数据的索引信息,其中包括该条备份数据的路径、类型、写入和访问时间、文件数据大小、备份集ID,所述类型是指文件或路径。
所述备份数据索引通过排序算法完成排序,该排序算法负责将备份数据索引中的每条备份数据索引信息按照一定的规则进行排序,其目的是将索引按照备份集ID分组,按照每个组的数据量进行排序,以达到在恢复过程中尽可能减少加载、卸载磁带的次数。
所述排序算法根据备份集ID和不同备份集ID的数据量大小进行排序,遍历索引,用map数据格式存储备份集ID和此ID的数据量,具体排序过程如附图1所示。
所述步骤三的数据恢复通过数据恢复模块完成,该数据恢复模块将遍历备份数据索引排序算法,排序后的索引信息,加载磁带,将磁带上的数据恢复到指定位置。
本发明的数据恢复方法其价值主要体现在对于增量数据的恢复上面。用户首先需要保证数据存储格式按照备份数据所述要求进行存储,存在符合数据格式的备份数据索引,则在恢复时首先通过遍历索引取出标明存储位置的关键点备份集ID,经过对备份集ID的去重合并,形成备份集ID-数据量这样的Key-Value的列表,按照备份数据索引排序算法排序后,如此能够保证磁带的加载和卸载维持在最低的次数,以减少磁带移动所带来的时间消耗,最后通过数据恢复模块进行数据恢复。
以上所述仅为本发明的实施例而已,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (5)

1.一种用于磁带介质的数据恢复方法,其特征在于其具体恢复步骤为:
一、设置备份数据,该备份数据是指存储在磁盘介质上的数据,该数据以备份集为单位,每一次备份的数据称为一个备份集数据,分配以一个唯一的ID标识,称为备份集ID,通过备份集ID可以找到备份数据存储位置;
二、通过备份数据索引对每个备份数据的数据版本索引排序;
三、按照排序后索引进行数据恢复。
2.根据权利要求1所述的一种用于磁带介质的数据恢复方法,其特征在于:所述备份数据索引为每条备份数据的索引信息,其中包括该条备份数据的路径、类型、写入和访问时间、文件数据大小、备份集ID,所述类型是指文件或路径。
3.根据权利要求1所述的一种用于磁带介质的数据恢复方法,其特征在于:所述备份数据索引通过排序算法完成排序,该排序算法负责将备份数据索引中的每条备份数据索引信息进行排序。
4.根据权利要求3所述的一种用于磁带介质的数据恢复方法,其特征在于:所述排序算法根据备份集ID和不同备份集ID的数据量大小进行排序。
5.根据权利要求3所述的一种用于磁带介质的数据恢复方法,其特征在于:所述步骤三的数据恢复通过数据恢复模块完成,该数据恢复模块将遍历备份数据索引排序算法,排序后的索引信息,加载磁带,将磁带上的数据恢复到指定位置。
CN201310587598.4A 2013-11-21 2013-11-21 一种用于磁带介质的数据恢复方法 Pending CN103605586A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310587598.4A CN103605586A (zh) 2013-11-21 2013-11-21 一种用于磁带介质的数据恢复方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310587598.4A CN103605586A (zh) 2013-11-21 2013-11-21 一种用于磁带介质的数据恢复方法

Publications (1)

Publication Number Publication Date
CN103605586A true CN103605586A (zh) 2014-02-26

Family

ID=50123815

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310587598.4A Pending CN103605586A (zh) 2013-11-21 2013-11-21 一种用于磁带介质的数据恢复方法

Country Status (1)

Country Link
CN (1) CN103605586A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107342944A (zh) * 2017-06-15 2017-11-10 烽火通信科技股份有限公司 一种id标识分配与持久化方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5809435A (en) * 1996-12-23 1998-09-15 Emc Corporation Efficient index arrangement and method for identifying valid records stored on logging digital data storage subsystem
CN101937377A (zh) * 2009-06-29 2011-01-05 百度在线网络技术(北京)有限公司 数据恢复方法和装置
CN102799503A (zh) * 2012-08-08 2012-11-28 浪潮(北京)电子信息产业有限公司 一种应用于大量小文件的恢复方法
CN103176866A (zh) * 2013-04-02 2013-06-26 浪潮电子信息产业股份有限公司 一种应用于ntfs文件系统下的文件权限备份方法
CN103995757A (zh) * 2014-05-12 2014-08-20 浪潮电子信息产业股份有限公司 一种基于变化文件监控的快速文件备份方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5809435A (en) * 1996-12-23 1998-09-15 Emc Corporation Efficient index arrangement and method for identifying valid records stored on logging digital data storage subsystem
CN101937377A (zh) * 2009-06-29 2011-01-05 百度在线网络技术(北京)有限公司 数据恢复方法和装置
CN102799503A (zh) * 2012-08-08 2012-11-28 浪潮(北京)电子信息产业有限公司 一种应用于大量小文件的恢复方法
CN103176866A (zh) * 2013-04-02 2013-06-26 浪潮电子信息产业股份有限公司 一种应用于ntfs文件系统下的文件权限备份方法
CN103995757A (zh) * 2014-05-12 2014-08-20 浪潮电子信息产业股份有限公司 一种基于变化文件监控的快速文件备份方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107342944A (zh) * 2017-06-15 2017-11-10 烽火通信科技股份有限公司 一种id标识分配与持久化方法及系统
CN107342944B (zh) * 2017-06-15 2019-09-17 烽火通信科技股份有限公司 一种id标识分配与持久化方法及系统

Similar Documents

Publication Publication Date Title
CN102222085B (zh) 一种基于相似性与局部性结合的重复数据删除方法
US8108446B1 (en) Methods and systems for managing deduplicated data using unilateral referencing
CN105718548B (zh) 基于去重复存储系统中用于可扩展引用管理的系统和方法
CN104850598A (zh) 一种实时数据库备份恢复方法
CN101777017B (zh) 一种连续数据保护系统的快速恢复方法
CN102750317B (zh) 数据持久化处理方法、装置及数据库系统
US9996557B2 (en) Database storage system based on optical disk and method using the system
CN101916290B (zh) 内存数据库的管理方法和装置
CN102323958A (zh) 重复数据删除方法
CN104346357A (zh) 一种嵌入式终端的文件存取方法及系统
CN104461390A (zh) 将数据写入叠瓦状磁记录smr硬盘的方法及装置
CN104077380A (zh) 一种重复数据删除方法、装置及系统
CN103034592B (zh) 数据处理方法和装置
CN103885855A (zh) 数据备份和恢复的方法及装置
CN104360914A (zh) 增量快照方法和装置
CN102541691A (zh) 面向内存数据库oltp应用的日志检查点恢复方法
CN104461773A (zh) 一种虚拟机备份去重的方法
CN103729149A (zh) 一种存储数据的方法
CN105022680A (zh) 一种数据备份方法及装置
CN103473258A (zh) 云存储文件系统
CN103544124B (zh) Nand Flash存储器的访问方法
CN103176867A (zh) 一种快速文件差异备份方法
CN104268097B (zh) 一种元数据处理方法及系统
CN104050057A (zh) 一种历史感知的数据去重碎片消除方法与系统
CN102609484A (zh) 一种通用系统日志管理方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20140226