CN1315048C - 一种节省存储空间的多台计算机系统共享备份方法 - Google Patents

一种节省存储空间的多台计算机系统共享备份方法 Download PDF

Info

Publication number
CN1315048C
CN1315048C CNB2004100198822A CN200410019882A CN1315048C CN 1315048 C CN1315048 C CN 1315048C CN B2004100198822 A CNB2004100198822 A CN B2004100198822A CN 200410019882 A CN200410019882 A CN 200410019882A CN 1315048 C CN1315048 C CN 1315048C
Authority
CN
China
Prior art keywords
file
backup
data
server
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB2004100198822A
Other languages
English (en)
Other versions
CN1595366A (zh
Inventor
卢凤顺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin Baiwei Software Science & Technology Co Ltd
Original Assignee
Tianjin Baiwei Software Science & Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin Baiwei Software Science & Technology Co Ltd filed Critical Tianjin Baiwei Software Science & Technology Co Ltd
Priority to CNB2004100198822A priority Critical patent/CN1315048C/zh
Publication of CN1595366A publication Critical patent/CN1595366A/zh
Application granted granted Critical
Publication of CN1315048C publication Critical patent/CN1315048C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

一种节省存储空间的多台计算机系统共享备份方法。本发明首先对每个文件的数据,给出一个唯一区别的代码(ID),此代码可用文件大小加上文件内容的MD5值表示。然后将备份文件的数据内容与区别代码ID建立关联,建立一个数据内容列表,并将数据内容与数据内容列表存储在服务器上;同时在服务器上建立一个包含备份文件名称与区别代码ID的备份文件对应列表。当某台计算机备份时,如果所备份的文件已经存在,则不再需要备份存储该文件,仅需纪录该文件与其数据的对应关系即可。通过应用本发明,使多台计算机系统备份成为可能,占用空间可降低到普通方式的十分之一或更少,备份效率大幅提升,有效解决了因系统损坏,误操作,病毒侵害等造成的系统恢复问题。

Description

一种节省存储空间的多台计算机系统共享备份方法
【技术领域】:本发明涉及一种对计算机系统数据进行克隆备份,特别是局域网内计算机的系统数据备份。
【背景技术】:随着计算机的发展,计算机系统安装配置变得越来越复杂,同时,因计算机病毒,入侵,误操作等,使系统及数据极易遭到破坏,重新安装系统,驱动,应用程序等,既复杂又耗时,因此产生了一些对系统进行克隆备份的产品,在系统发生问题时,可直接由克隆备份时生成的数据映像对系统进行恢复。
在每台计算机中,操作系统及应用程序通常占用大量硬盘空间,一般在2-4GB左右,如果将每台计算机中的以上数据都进行备份,需要巨大的网络存储空间,每台计算机,每备份一个版本,都要占用相同的服务器存储空间,所以目前产品,无法有效支持多人同时备份,以及多版本备份,不能实现简单安全的系统管理。
【发明内容】:本发明目的是克服现有技术的不足,提供一种节省存储空间的计算机系统备份方法,对多台计算机,通过数据共享存放,实现系统数据多版本网络备份,达到占用网络存储空间小,备份速度快的目的。
针对计算机中数据的特征,相同的操作系统及应用程序,安装在任何计算机中,其数据内容大部分相同,仅有少量差异化数据。尤其在同一个单位(局域网)内,计算机安装的操作系统及应用程序大致相同,差异化更小。因此,考虑到以上特征,如果能够实现数据共享存放的方式,将不同计算机中的相同的数据,在服务器上仅需要保存一份,这样可大大节省服务器硬盘空间,使多机,多版本备份成为可能。
计算机系统中,数据以文件方式存放,对相同的操作系统及应用程序,在不同计算机中,绝大部份文件内容相同。如果对这些计算机系统进行备份,相同文件仅需要存储一份即可。但不同计算机中,文件名,大小均相同的文件,内容不一定相同,且不同文件名的文件,内容也可能完全相同,所以要实现共享存储,第一个必要条件,是对每个文件的数据,要有一个唯一区别的代码(ID),如果两个文件内容完全相同,则此代码相同,否则代码一定不相同。此代码可用文件大小加上文件内容的MD5值表示,其中MD5为业内通用标准算法,其结果与文件内容的每一个字节相关,对相同大小的数据,可保证其结果的唯一性。
有了以上的文件ID,每个文件备份前,均进行计算,如果计算后该ID对应的文件数据已经存放在服务器上,则不再需要进行存储,否则才将其传输存储到服务器上。
一个文件的备份存储方式如图1所示,文件名称为该文件的区别代码ID,即原始大小以及内容的MD5值,文件内容为原始文件数据内容,或压缩后的数据内容。
通过适当的文件标示转换,将备份文件名称列表与数据文件分离,通过文件名,文件内容ID建立关联,结构如图2所示。
对计算机1及计算机2,备份前,首先生成各自独立的备份文件列表,然后将所有文件进行备份。在服务器上,保存有已经备份过的所有文件的列表,以及所对应的文件数据的存放位置。当某台计算机备份时,经过比对文件数据内容ID,如果所备份的文件在服务器上已经存在,则不再需要备份存储该文件,仅需纪录该文件与其数据的对应关系即可。
综上,本发明具体方法按照以下步骤完成:
1)备份开始,逐一读取需要备份的文件;
2)依据文件大小,以及文件内容所计算出的MD5值,构成该文件的ID;
3)将该ID发送至服务器,进行查询,检查该文件是否已经备份过;
4)如果未备份,则将该文件数据发送至服务器,进行备份;
5)将该文件及其ID对应的数据文件,加入到备份列表;
6)检查是否所有文件备份完成,未完成,读取下一个文件,进行备份;
7)全部完成,结束。
本发明的优点和积极效果:通过备份数据的共享,备份时大部份文件不需要实际发送到服务器,因此实现数据传输量的大幅降低,备份速度显著提高,且对网络带宽的占用也显著降低;通过应用本发明,使多台计算机系统备份成为可能,占用空间可降低到普通方式的十分之一或更少,备份效率大幅提升,有效解决了因系统损坏,误操作,病毒侵害等造成的系统恢复问题。
【附图说明】:
图1是文件的备份存储方式结构示意图;
图2是备份文件名称列表与数据文件对应表及备份数据结构关联示意图;
图3是一台计算机具体的系统备份流程示意图。
【具体实施方式】:
实施例:
如图3所示,为一台计算机的系统备份流程示意图,具体流程说明如下:
3-1:备份开始,逐一读取需要备份的文件;
3-2:依据文件大小,以及文件内容所计算出的MD5值,构成该文件的ID;
3-3:将该ID发送至服务器,进行查询,检查该文件是否已经备份过;
3-4:如果未备份,则将该文件数据发送至服务器,进行备份;
3-5:将该文件及其ID对应的数据文件,加入到备份列表;
3-6:检查是否所有文件备份完成,未完成,读取下一个文件,进行备份;
3-7:全部完成,结束。
具体应用对比实例:
下面以共享备份系统(ezDRP),对本发明的实施效果进行说明。
普通计算机中,操作系统及应用程序,以安装WindowsXP系统,Office等工具软件为例,通常占用3GB左右数据空间。不同计算机中,以上系统及应用程序所包含文件完全相同的比例,约为90-95%,即相同文件约为2.8GB以上。
在对以上典型配置的计算机系统进行备份时,单台计算机,就需要备份3GB数据到服务器上。假设一个单位内有20台计算机,要实现对全部计算机系统进行备份,则需要备份约60GB数据,占用大量服务器存储空间,且如果要进行多版本备份,则每个版本,都要再备份3GB数据。
而采用本发明的方法,快速甄别出不同计算机中的相同文件,将该文件仅保存一份,按照以上情况,备份全部20台计算机系统,仅需要备份2.8+0.2*20=6.8GB,备份数据仅为普通方式的11%左右,节省大量存储空间。并且因此可实现多版本备份,每台计算机增加一个备份版本,仅最多增加约0.2G备份数据。

Claims (1)

1、一种节省存储空间的多台计算机系统共享备份方法,其特征是该方法按照以下步骤完成:
1)备份开始,逐一读取需要备份的文件;
2)依据文件大小,以及文件内容所计算出的MD5值,构成该文件的ID;
3)将该ID发送至服务器,进行查询,检查该文件是否已经备份过;
4)如果未备份,则将该文件数据发送至服务器,进行备份;
5)将该文件及其ID对应的数据文件,加入到备份列表;
6)检查是否所有文件备份完成,未完成,读取下一个文件,进行备份;
7)全部完成,结束。
CNB2004100198822A 2004-07-06 2004-07-06 一种节省存储空间的多台计算机系统共享备份方法 Expired - Fee Related CN1315048C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB2004100198822A CN1315048C (zh) 2004-07-06 2004-07-06 一种节省存储空间的多台计算机系统共享备份方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB2004100198822A CN1315048C (zh) 2004-07-06 2004-07-06 一种节省存储空间的多台计算机系统共享备份方法

Publications (2)

Publication Number Publication Date
CN1595366A CN1595366A (zh) 2005-03-16
CN1315048C true CN1315048C (zh) 2007-05-09

Family

ID=34663107

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2004100198822A Expired - Fee Related CN1315048C (zh) 2004-07-06 2004-07-06 一种节省存储空间的多台计算机系统共享备份方法

Country Status (1)

Country Link
CN (1) CN1315048C (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111090857A (zh) * 2018-10-23 2020-05-01 财团法人工业技术研究院 防御恶意软件攻击文件的方法、计算机系统以及记录介质

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8468604B2 (en) 2005-08-16 2013-06-18 Emc Corporation Method and system for detecting malware
JP2009505295A (ja) * 2005-08-16 2009-02-05 イーエムシー コーポレイション 情報保護方法およびシステム
US8255998B2 (en) 2005-08-16 2012-08-28 Emc Corporation Information protection method and system
US7788234B2 (en) * 2007-08-23 2010-08-31 Microsoft Corporation Staged, lightweight backup system
CN101950336B (zh) * 2010-08-18 2015-08-26 北京奇虎科技有限公司 一种清除恶意程序的方法和装置
CN102163167A (zh) * 2011-03-02 2011-08-24 奇智软件(北京)有限公司 系统拯救的方法及装置
CN102708192B (zh) 2012-05-15 2017-11-28 华为技术有限公司 一种文档共享的方法及系统、设备
CN104077338B (zh) 2013-06-25 2016-02-17 腾讯科技(深圳)有限公司 一种数据处理的方法及装置
CN106294025B (zh) * 2016-08-15 2020-01-14 Oppo广东移动通信有限公司 一种终端软体的下载方法和装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5060185A (en) * 1988-03-25 1991-10-22 Ncr Corporation File backup system
US6154852A (en) * 1998-06-10 2000-11-28 International Business Machines Corporation Method and apparatus for data backup and recovery

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5060185A (en) * 1988-03-25 1991-10-22 Ncr Corporation File backup system
US6154852A (en) * 1998-06-10 2000-11-28 International Business Machines Corporation Method and apparatus for data backup and recovery

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111090857A (zh) * 2018-10-23 2020-05-01 财团法人工业技术研究院 防御恶意软件攻击文件的方法、计算机系统以及记录介质
CN111090857B (zh) * 2018-10-23 2022-05-31 财团法人工业技术研究院 防御恶意软件攻击文件的方法、计算机系统以及记录介质

Also Published As

Publication number Publication date
CN1595366A (zh) 2005-03-16

Similar Documents

Publication Publication Date Title
US7707184B1 (en) System and method for snapshot full backup and hard recovery of a database
EP1721261B1 (en) System and method for recovery units in databases
US8027958B1 (en) System and method for creating a point-in-time restoration of a database file
US9250824B2 (en) Backing up method, device, and system for virtual machine
CN100547555C (zh) 一种基于指纹的数据备份系统
CN1315048C (zh) 一种节省存储空间的多台计算机系统共享备份方法
CN100337218C (zh) 网络存储系统中的数据管理方法及其构建的网络存储系统
US8904137B1 (en) Deduplication system space recycling through inode manipulation
US8341367B2 (en) Space reservation in a deduplication system
CN102594849B (zh) 数据备份、恢复方法、虚拟机快照删除、回滚方法及装置
US7925622B2 (en) System and method for file system snapshot of a virtual logical disk
US8726072B1 (en) System and method for improving cluster performance using an operation thread for passive nodes
US9317373B2 (en) Snapshots in a hybrid storage device comprising a magnetic disk and a solid state disk
US7681001B2 (en) Storage system
CN101079896A (zh) 一种并行存储系统的多可用性机制共存架构
CN105550062B (zh) 基于持续数据保护与时间点浏览恢复的数据回流方法
EP1816555A2 (en) Snapshot format conversion method and apparatus
CN101814045A (zh) 一种用于备份服务的数据组织方法
CN1902595A (zh) 在复制环境中的协调的存储管理操作
EP2454670B1 (en) Operating system restoration using remote backup system and local system restore function
CN102713856A (zh) 具有选择性按需数据可用性的多阶段文件系统恢复
CN101059768A (zh) 实现操作系统备用的系统及方法
CN1801107A (zh) 数据恢复方法
CN101201767A (zh) 计算机系统数据的磁盘镜像备份与恢复系统及方法
CN1241125C (zh) 硬盘数据备份及恢复的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20070509

Termination date: 20140706

EXPY Termination of patent right or utility model