CN102193845A - 一种数据恢复方法 - Google Patents

一种数据恢复方法 Download PDF

Info

Publication number
CN102193845A
CN102193845A CN2011101426879A CN201110142687A CN102193845A CN 102193845 A CN102193845 A CN 102193845A CN 2011101426879 A CN2011101426879 A CN 2011101426879A CN 201110142687 A CN201110142687 A CN 201110142687A CN 102193845 A CN102193845 A CN 102193845A
Authority
CN
China
Prior art keywords
file
versions
version
data
recovery
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2011101426879A
Other languages
English (en)
Other versions
CN102193845B (zh
Inventor
曹强
黄建忠
谢长生
杨靖
叶松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangxi Shalan Information Technology Co ltd
Original Assignee
Huazhong University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huazhong University of Science and Technology filed Critical Huazhong University of Science and Technology
Priority to CN 201110142687 priority Critical patent/CN102193845B/zh
Publication of CN102193845A publication Critical patent/CN102193845A/zh
Application granted granted Critical
Publication of CN102193845B publication Critical patent/CN102193845B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种数据恢复方法,该方法首先对文件进行一次预恢复,即只对文件过去版本的间隔性恢复,用户依据预恢复出的文件确定一个或多个中心版本,系统以选定的中心版本为中心,向前向后恢复一定数量的连续的版本,再在这些版本中确定一个精确的版本,即与预先设定的内容或属性相一致的最接近的文件版本,以此版本为全系统的恢复点进行全系统的完整恢复。该方法能使管理员更快更准确的确定系统恢复时间点,有效的减少系统的恢复时间,提高恢复效率,减少损失。

Description

一种数据恢复方法
技术领域
本发明属于数据存储领域,具体涉及一种数据恢复方法,该方法可以提高备份系统所保护的关键数据的恢复效率。
背景技术
随着数据量以爆炸式的不断增长,信息对人类来说越来越重要。人类每天产生大量的数据如个人文档、电子邮件、企业财务报表、客户数据、市场调研数据、企业业务流程、企业业务交易数据、项目设计方案等被存储在计算机系统中,这在很大程度上促进了企业的信息进程,提高了工作效率。但数据的存储安全的重要性也逐渐显现出来。
丢失关键性业务数据会极大的影响工作效率,拖延项目进度,给企业带来严重的经济损失。根据IDC调查,在美国,上世纪九十年代中有过数据灾难的公司中,有一半以上的立即倒闭,另有不到30%的在随后两年内倒闭,其余生存下来的仅占总数的16%。对于通常来想非常安全的数据中心,每年也有五百分之一的概率要经历一次数据灾难。因此用户对存储在系统中的数据的有效保护的需求越来越高。
能否及时的恢复关键性的数据已成为企业在数据灾难后能否再次运转的关键所在。一份来自美国明尼苏达大学的研究报告显示,如果无法在数据灾难发生后的二周内恢复企业的信息系统,则将会有近四分之三的企业会停业。在这些停业的企业中有接近一半的随后倒闭,有接近五分之一的企业在也会在随后的两年之内会破产。
在现实应用中,数据恢复指标可以由两个参数来衡量:恢复时间目标(RTO)和恢复点目标(RPO)。
恢复点目标RPO指的是可以容忍的最大数据丢失量。比如,如果在t0时刻数据出现了差错,但是直到t1时刻才发现这个错误。最理想情况是可以把数据恢复到t0时刻或者是尽可能的接近t0时刻。但现在大多数企业基于成本或性能的考虑基本做不到恢复到t0时刻。如典型的现在一般企业所使用的日常备份方案是一天一备,即两次备份间的间隔是24小时。最坏的情况,在马上要进行下次备份时系统出了问题,此时系统已经运行了24个小时没有备份。因下次备份还没有开始,此时企业能做的就是使系统恢复到之前的一个备份所在的时刻,这时企业将损失这24小时内的所有数据,此时他们的RPO就是24小时。所以RPO可以描述用户所能容忍的最大数据丢失数量。目前,比较热门的数据保护方式--连续数据保护(Continuous Data Protection,CDP)就是改变过去那种一天或几小时一备份的方式,转而连续不断的捕获和保存数据变化,并将变化后的数据独立于初始数据进行保存。利用连续数据保护,用户可以将数据恢复到过去任意一个时间点,这样就基本没有数据的丢失,所以它的RPO就到了0,从而上极大地保护了用户数据。
恢复时间目标RTO是可以接受最大恢复数据时长。其指的是当发现数据出错或丢失后开始恢复直到恢复完成所用的时间。以为上说的为例,如果从发现错误的时刻t1开始恢复,直到t2时刻完成恢复,则此RTO就是t2-t1。当数据灾难发生后,谁能在最短的时间内恢复系统的运行,谁就在竞争中抢占了先机。所以RTO是越小越好。
尽管现在已经有一些方法来减少关键数据的恢复时间,但这其中绝大多数都是假设已知恢复点(用户认定的过去系统数据正常的时刻)的情况下,通过各种方法加快数据恢复到那一点的速度,从而达到减少恢复时间RTO的目的。但这个恢复点是用户的经验值,是用户所想的系统还正常的状态,但往往不是用户真正所期望的数据正确那个最佳的点。还是用上面的例子,设t0是这个最佳的点,如果用户恢复到了t0之前的时刻t3,他将丢失t3到t0时刻间的有用数据。如果用户恢复到了t0时刻之后的t4时刻,这时系统数据并不是一个正确的状态,恢复并不是有效的。无论是以上的哪种情况,这时用户都会选择继续向t0时刻恢复,以达到用户真正想要的正确的状态,这无形中就使恢复时间RTO大大的增加了。
另有部分系统提供过去某些时间点的信息,来辅助管理员快速选择一个相对正确的时间点。这能起到一定的帮助用户正确选择t0时刻的目的,但普遍的它们都以系统为中心的,仅仅是那个时候系统的一些状态和属性,并不是用户所关心的数据的内容,所以并不能真正有效的帮助定位那个数据正确最佳时刻。
发明内容
本发明的目的在于提供一种数据恢复方法,该方法能更快更准确的确定系统恢复时间点,有效的减少系统的恢复时间,提高恢复效率,减少损失。
本发明提供了一种数据恢复方法,包括以下步骤:
(1)列出所有能够恢复的文件;
(2)选择一个或多个文件作为关键文件;
(3)对关键文件按照设定的时间间隔进行恢复,得到多个版本的关键文件;
(4)从多个版本的关键文件中选择一个或多个文件,作为中心文件;
(5)以中心文件所在的时间点为中心,向前向后按照设定的版本数目进行恢复,得到多个版本的中心文件;
(6)判断多个版本的中心文件中是否存在最接近文件,若存在,进入步骤(7),若不存在,转入步骤(4);
(7)确定恢复时间点为最接近文件所在的时间点;
(8)以恢复时间点为基准对系统进行恢复。
进一步的,步骤(6)中如果最接近文件为一个文件,则确定恢复时间点为该文件所在的时间点,如果最接近文件为多个文件,则确定恢复时间点为多个文件中最新的一个文件所在的时间点。
进一步的,步骤(6)中所述的最接近文件的内容与设定的文件内容一致,或者所述的最接近文件的属性与设定的文件属性一致。
本发明是一种以用户为中心的数据恢复方法,根据对用户恢复行为的研究,发现用户判断系统恢复成功与否,依据的仅是恢复后的系统中的其认为的关键文件内容正确与否。这些关键文件数量是非常少的,往往只有几个。因此,为判断系统是否恢复到一个想要的正确时间并不需要对整个文件系统中的所有文件进行恢复,仅需要对部分用户关心的文件进行恢复,得到多个其过去的版本,帮助用户准确定位恢复点。这样可以减少因恢复时间点定位不准确而对整个系统再次进行恢复的时间。由于预恢复仅恢复用户指定的一个或多个文件过去的部分版本,一改过去对整个文件系统中所有的文件进行恢复然后再判断的方式,可以有效减少因恢复不准确而对整个系统再次进行恢复而浪费的时间。所以,较现有方法,可以有效减少恢复时间。
附图说明
图1为文件恢复过程的示意图;
图2为有两个关键文件的间隔恢复视图;
图3为对一个文件的连续恢复视图。
具体实施方式
本发明所述的数据恢复是在已经对数据实现保护的基础之上进行的。可恢复的文件的各种版本均是由保护系统来提供。本发明所述的数据恢复方法不涉及到数据保护的具体实现。
在用户的角度上看,他们所关心的数据在计算机内都是以文件的形式组织的,所以用户判断恢复时间点正确与否是看某些用户认定的关键性的文件内容是否正确。
本发明在恢复数据时首先提供可恢复的文件分类表,由用户选定一个或多个文件作为判断恢复正确与否的关键性文件。系统依据选定,对这些文件进行第一次预恢复。此次恢复不是恢复它们过去的所有版本,只是对这些文件过去版本的间隔性恢复。不同的文件类型在连续数据保护中的表现是不一样的,有些文件类型的改动少,所以他们的版本少,用他们来确定精确恢复点则粒度不够。有些文件经常被修改,选择这种文件来确定恢复点这样粒度就会更小且更加精确。
用户依据以上预恢复出的文件确定一个或多个中心版本。系统以选定的中心版本为中心,向前向后恢复一定数量的连续的版本。例如,如果用户觉得第5个版本最有可能是他想要的,他就预选定第5个版本。系统以第5个版本为中心,向前恢复出2,3,4三个版本,向后恢复出6,7,8三个版本。用户再在这些版本中确定一个精确的版本,即与预先设定的内容或属性相一致的最接近的文件版本,以此版本为全系统的恢复点进行全系统的完整恢复。
如果用户选定的多个关键性文件的最终时间点不一致,以他们中离当前时间最远的那个为准。
本发明提供具体恢复步骤由(C1)~(C8)组成:
(C1)恢复系统开始工作,分析其中所有可以恢复的文件,并按文件类型分类列出,这些文件类型可以以打开方式分为音频文件,图片文件,视频文件,文本文件,可执行文件以及压缩包文件等,也可以按照在系统中的读写次数简单地分为普通文件,日志文件,不可读写文件,核心文件等。
(C2)用户选定(C1)中所列出文件的一个或多个作为关键文件,用于确定最终的恢复时间点。由于日志文件记录着每次的操作,粒度最小,一般选用日志文件,用户也可以根据自己的生产环境,选择写次数最多的或生产系统最核心的几个文件作为关键文件。
(C3)系统依据(C2)中用户的选定,对这些文件按照版本间隔进行恢复,所述的版本间隔可由系统设定。版本间隔由用户在系统配置时确定,并不依赖于特定的系统,其取值可为1~N/2(N为文件版本总数),若N/2不是整数,则取其整数部分。若一个文件过去有10个版本,设定其版本间隔为1,则此次恢复可仅恢复这个文件的第1,3,5,7,9五个版本,即每隔系统总版本数的20%恢复一个版本供用户查看。
(C4)将(C3)中恢复出的各个文件按版本的时间顺序列在时间轴上,如图2所示,在时间轴上的显示可以是按钮形式,也可以是对文件内容的缩略图形式。
(C5)用户通过点击(C4)中所列的各个版本,查看文件的内容和属性,确定一个中心版本。
(C6)以这个中心版本为中心,向前(过去)向后(将来)连续恢复出多个版本,连续恢复出的多个版本的版本数目为版本间隔的2倍(不足2倍则取实际最大值),如图3所示,如果用户以第R个版本为中心版本,版本间隔为1,则系统以第R个版本为中心,向前恢复出R-1、R-2两个版本,向后恢复出R+1、R+2两个版本。
(C7)通过对恢复后的各个版本的内容与属性的检索匹配,对比各个版本的内容或属性数据与预先设定的想要恢复的文件内容或属性是否一致,所述属性可以是文件的最后一次读写操作的时间,所述内容可以是用户最近更新的内容,通过对比就可以确定有没有想要的版本,即有没有需要恢复的最接近文件,如果有,进入(C8),如果没有,说明在(C5)中所确定的中心版本不合适,转入(C5),重新确定一个中心版本。
(C8)如果最接近文件只有一个文件,则以此文件所在的时间点为恢复时间点,如果最接近文件有多个文件,以最早的一个文件的时间为恢复时间点。
(C9)按(C8)中确定的恢复时间点进行系统恢复。
(C10)恢复结束。
本发明不仅局限于上述具体实施方式,本领域一般技术人员根据本发明公开的内容,可以采用其它多种具体实施方式实施本发明,因此,凡是采用本发明的设计结构和思路,做一些简单的变化或更改的设计,都落入本发明保护的范围。

Claims (3)

1.一种数据恢复方法,包括以下步骤:
(1)列出所有能够恢复的文件;
(2)选择一个或多个文件作为关键文件;
(3)对关键文件按照设定的时间间隔进行恢复,得到多个版本的关键文件;
(4)从多个版本的关键文件中选择一个或多个文件,作为中心文件;
(5)以中心文件所在的时间点为中心,向前向后按照设定的版本数目进行恢复,得到多个版本的中心文件;
(6)判断多个版本的中心文件中是否存在最接近文件,若存在,进入步骤(7),若不存在,转入步骤(4);
(7)确定恢复时间点为最接近文件所在的时间点;
(8)以恢复时间点为基准对系统进行恢复。
2.根据权利要求1所述的数据恢复方法,其特征在于,步骤(6)中如果最接近文件为一个文件,则确定恢复时间点为该文件所在的时间点,如果最接近文件为多个文件,则确定恢复时间点为多个文件中最新的一个文件所在的时间点。
3.根据权利要求1所述的数据恢复方法,其特征在于,步骤(6)中所述的最接近文件的内容与设定的文件内容一致,或者所述的最接近文件的属性与设定的文件属性一致。
CN 201110142687 2011-05-30 2011-05-30 一种数据恢复方法 Active CN102193845B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201110142687 CN102193845B (zh) 2011-05-30 2011-05-30 一种数据恢复方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201110142687 CN102193845B (zh) 2011-05-30 2011-05-30 一种数据恢复方法

Publications (2)

Publication Number Publication Date
CN102193845A true CN102193845A (zh) 2011-09-21
CN102193845B CN102193845B (zh) 2012-12-19

Family

ID=44601948

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201110142687 Active CN102193845B (zh) 2011-05-30 2011-05-30 一种数据恢复方法

Country Status (1)

Country Link
CN (1) CN102193845B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104820625A (zh) * 2015-05-19 2015-08-05 重庆大学 一种面向信息管理系统的数据记录、备份及恢复方法
CN117093404A (zh) * 2023-10-17 2023-11-21 西安热工研究院有限公司 可信动态度量过程中不可信进程自恢复方法、系统及设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101430657A (zh) * 2008-11-17 2009-05-13 华中科技大学 一种连续数据保护方法
WO2010065271A2 (en) * 2008-11-25 2010-06-10 Board Of Governors For Higher Education, State Of Rhode Island And Providence Plantations Systems and methods for providing continuous file protection at block level
US7774313B1 (en) * 2005-11-29 2010-08-10 Symantec Corporation Policy enforcement in continuous data protection backup systems
CN101866305A (zh) * 2010-05-21 2010-10-20 武汉大学 支持数据查询和快速恢复的连续数据保护方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7774313B1 (en) * 2005-11-29 2010-08-10 Symantec Corporation Policy enforcement in continuous data protection backup systems
CN101430657A (zh) * 2008-11-17 2009-05-13 华中科技大学 一种连续数据保护方法
WO2010065271A2 (en) * 2008-11-25 2010-06-10 Board Of Governors For Higher Education, State Of Rhode Island And Providence Plantations Systems and methods for providing continuous file protection at block level
CN101866305A (zh) * 2010-05-21 2010-10-20 武汉大学 支持数据查询和快速恢复的连续数据保护方法及系统

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
JIE YAO等: "A CDP method in Object-based file system", 《PROCEEDINGS OF THE 8TH INTERNATIONAL SYMPOSIUM ON OPTICAL STORAGE》 *
XU LI等: "Optimal Implementation of Continuous Data Protection (CDP) in Linux Kernel", 《PROCEEDINGS OF THE 2008 IEEE INTERNATIONAL CONFERENCE ON NETWORKING, ARCHITECTURE, AND STORAGE》 *
向小佳等: "一种细粒度高效多版本文件系统", 《软件学报》 *
姚杰: "分布式存储系统文件级连续数据保护技术研究", 《中国博士学位论文全文数据库》 *
李旭等: "一种改进的块级连续数据保护机制", 《计算机研究与发展》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104820625A (zh) * 2015-05-19 2015-08-05 重庆大学 一种面向信息管理系统的数据记录、备份及恢复方法
CN117093404A (zh) * 2023-10-17 2023-11-21 西安热工研究院有限公司 可信动态度量过程中不可信进程自恢复方法、系统及设备
CN117093404B (zh) * 2023-10-17 2024-02-09 西安热工研究院有限公司 可信动态度量过程中不可信进程自恢复方法、系统及设备

Also Published As

Publication number Publication date
CN102193845B (zh) 2012-12-19

Similar Documents

Publication Publication Date Title
CN103678042B (zh) 一种基于数据分析的备份策略信息生成方法
US20140310245A1 (en) Partition level backup and restore of a massively parallel processing database
CN101073070B (zh) 提供数据存储器内位置的修改历史的系统和方法
CN100517321C (zh) 映象数据存储装置写时间映射
CN102770874B (zh) 用户图像集中的自适应事件时间线
Wang et al. Document update summarization using incremental hierarchical clustering
CN105938457B (zh) 数据的过滤方法、装置及数据读取系统
CN101073064A (zh) 使用检查点从存储事务故障中恢复
CN110516147A (zh) 页面数据生成方法、装置、计算机设备及存储介质
EP3089051B1 (en) Database rollback using wal
JP2015505629A (ja) 情報検索を行う方法及びサーバ
CN106446300A (zh) 一种基于共享存储池的事务处理方法及系统
US20140164379A1 (en) Automatic Attribute Level Detection Methods
CN103827852A (zh) 在搜索引擎结果页面上聚集web页面
US20140173499A1 (en) Systems and methods for integrating storage usage information
CN104361109B (zh) 确定图片筛选结果的方法和装置
CN108647118A (zh) 基于存储集群的副本异常恢复方法、装置及计算机设备
CN102193845B (zh) 一种数据恢复方法
CN104820625B (zh) 一种面向信息管理系统的数据记录、备份及恢复方法
CN102799503A (zh) 一种应用于大量小文件的恢复方法
US11099946B1 (en) Differential restore using block-based backups
CN103176867A (zh) 一种快速文件差异备份方法
CN108304527A (zh) 一种数据提取方法
CN109032762A (zh) 虚拟机回溯方法及相关设备
CN107562576A (zh) 一种数据保护的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20170828

Address after: Qixia District of Nanjing City, Jiangsu province 210000 Yao Jia Lu No. 7 city scenery Beiyuan 16 room 1203

Patentee after: NANJING SUPERSTACK INFORMATION TECHNOLOGY LTD.

Address before: 430074 Hubei Province, Wuhan city Hongshan District Luoyu Road No. 1037

Patentee before: Huazhong University of Science and Technology

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20210723

Address after: 335000 no.67-1, Zhichuang street, high tech Industrial Development Zone, Yingtan City, Jiangxi Province

Patentee after: Jiangxi diejia Information Technology Co.,Ltd.

Address before: Room 1203, building 16, shangchengjingjing Beiyuan, No.7 Yaojia Road, Qixia District, Nanjing City, Jiangsu Province, 210000

Patentee before: NANJING SUPERSTACK INFORMATION TECHNOLOGY Ltd.

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20240430

Address after: No. 32-3 Zhichuang Yitiao Street, Juneng Road, High tech Industrial Zone, Yingtan City, Jiangxi Province

Patentee after: Jiangxi Shalan Information Technology Co.,Ltd.

Country or region after: China

Address before: 335000 no.67-1, Zhichuang street, high tech Industrial Development Zone, Yingtan City, Jiangxi Province

Patentee before: Jiangxi diejia Information Technology Co.,Ltd.

Country or region before: China