CN101453490A - 一种合成备份方法和装置 - Google Patents

一种合成备份方法和装置 Download PDF

Info

Publication number
CN101453490A
CN101453490A CN 200810207619 CN200810207619A CN101453490A CN 101453490 A CN101453490 A CN 101453490A CN 200810207619 CN200810207619 CN 200810207619 CN 200810207619 A CN200810207619 A CN 200810207619A CN 101453490 A CN101453490 A CN 101453490A
Authority
CN
China
Prior art keywords
file
data file
date
synthesized
backup
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 200810207619
Other languages
English (en)
Other versions
CN101453490B (zh
Inventor
贺鸿富
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Eisoo Information Technology Co Ltd
Original Assignee
Shanghai Eisoo Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Eisoo Software Co Ltd filed Critical Shanghai Eisoo Software Co Ltd
Priority to CN 200810207619 priority Critical patent/CN101453490B/zh
Publication of CN101453490A publication Critical patent/CN101453490A/zh
Application granted granted Critical
Publication of CN101453490B publication Critical patent/CN101453490B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种合成备份方法和装置,其中,该方法包括:从存储介质当前存储的待合成的增量备份文件中确定出未过期的数据文件;将确定出的未过期的数据文件保存到所述存储介质存储的全备份文件中。采用本发明,可以仅移动存储介质所存储的增量备份文件中未过期的数据文件,而全备份文件中的数据文件不执行移动操作,减少了数据文件的移动量,大大降低了合成备份的操作时间,提高了合成备份的性能。

Description

一种合成备份方法和装置
技术领域
本发明涉及数据备份技术,特别涉及一种合成备份方法和装置。
背景技术
数据备份是目前最常用的一种防止数据丢失的方案,其基本原理是对保存在计算机系统中的数据文件提供冗余的存储,当计算机系统中的原始数据文件由于硬件故障、软件故障或者用户的误操作等原因而导致丢失时,可从冗余的存储中恢复该数据文件,从而对保存在计算机系统中的数据文件提供有效的保护。
随着计算机的普及,网络备份系统由于可对一组计算机进行集中和统一的备份管理等优点而得到了发展。在网络备份系统中,通常提供两种备份方式,一种是全备份;另一种是增量备份。其中,全备份是将计算机中的所有数据文件都复制到存储介质上,该存储介质为网络备份系统提供的一个用于统一存储原数据文件的备份的介质,该存储介质上存储的数据文件和原数据文件相同,即全备份实现了计算机系统中所有数据文件的备份,全备份是克服系统不安全的最直接的方式,操作比较简单;增量备份是仅将上次备份之后内容发生变化的数据文件复制到存储介质上,即只备份已更新的数据文件,相比于全备份,增量备份更能够节省时间。
网络备份系统为使数据得到更有效的保护,采用周期性全备份和定时增量备份的方法来实现数据的保护,该方法可使数据得到保护,但却能导致同一份数据文件在存储介质上会存在多个备份,浪费了存储介质的资源;并且,由于全备份是周期执行的,这意味着需要周期占用用户网络环境中的传输带宽,且每达到一个周期时,都需要对计算机上的所有数据文件进行一次全备份,在需要备份的数据文件量比较大时,会占用用户网络环境中更多的传输带宽,大大影响了用户网络环境。
随着备份技术的不断发展,在网络备份系统中引进了一种新型的备份方式,即合成备份,该方式无需周期执行全备份,并可有效减少用户网络环境的传输带宽占用率。该方式中,利用完全移动数据算法对存储介质当前存储的全备份和所有增量备份中的数据文件进行合成,具体地,该方式包括:在存储介质上创建一个合成备份文件;从存储介质存储的全备份文件和增量备份文件中获得未过期的数据文件,其中,全备份文件和增量备份文件中的数据文件都有自身的属性信息,该属性信息中包含数据文件的名称、备份时间和修改时间等,未过期的数据文件为内容当前为最新的数据文件。比如,参见图1,图1为全备份文件、增量备份文件和合成备份文件的示意图,如图1所示,全备份文件中包含5个数据文件,即文件A1至文件A5;增量备份1中包含文件A1的内容发生变化后的备份文件(文件A11)和文件A5中内容发生变化的备份文件(文件A55);增量备份2中包含文件A11的内容发生变化后的备份文件(文件A111)和文件A4中内容发生变化的备份文件(文件A44),则可以知道,存储介质当前存储的全备份文件和增量备份文件中未过期的数据文件为文件A111、文件A2、文件A3、文件A44和文件A55,相应地,也可知道文件A1、文件A11、文件A4和文件A5中的内容不是最新的,即为已过期文件。之后,逐一将获得的数据文件写入到合成备份文件中,形成的合成备份文件如图1所示,最后删除全备份和增量备份中的数据文件。
可见,现有的合成备份是将存储介质上已保存的全备份和增量备份中未过期的数据文件进行全备份,该合成备份文件实质上为全备份和增量备份中未过期的数据文件的全备份文件,如此,为使数据得到有效的保护,只要定期执行合成备份即可,无需周期性执行全备份,进而有效地减少用户网络环境中传输带宽的占用。但是,现有的合成备份由于需要从全备份和增量备份中获得未过期的数据文件,之后,再逐一将获得的未过期的数据文件写入到合成备份文件中,即需要移动全备份和增量备份中的数据文件,这大大增加了合成备份的操作时间,降低了合成备份效率。
发明内容
有鉴于此,本发明提供了一种合成备份方法和装置,有利于降低合成备份的操作时间,提高合成备份效率。
一种合成备份方法,包括:
从存储介质当前存储的待合成的增量备份文件中确定出未过期的数据文件;
将确定出的未过期的数据文件保存到所述存储介质存储的全备份文件中。
一种合成备份装置,包括:存储单元、文件确定单元和合成单元;其中,
所述存储单元用于存储全备份文件和增量备份文件;
所述文件确定单元用于从所述存储单元中确定出待合成的增量备份文件中未过期的数据文件;
所述合成单元用于将所述文件确定单元确定出的未过期的数据文件的保存到所述存储单元存储的全备份文件中。
由以上技术方案可以看出,在本发明提供的合成备份方法和装置中,首先需要从存储介质当前存储的待合成的增量备份文件中确定出未过期的数据文件;之后,将确定出的未过期的数据文件保存到所述存储介质存储的全备份文件中,这样,可以实现仅移动增量备份文件中未过期的数据文件,而全备份文件中的数据文件不执行移动操作,如此,减少了数据文件的移动量,大大降低了合成备份的操作时间,提高了合成备份的性能。
附图说明
图1为现有技术中全备份文件、增量备份文件和合成备份文件的示意图;
图2为本发明实施例提供的合成备份流程图;
图3a为本发明实施例中存储介质当前存储的增量备份示意图;
图3b为本发明实施例中存储介质当前存储的全备份示意图;
图3c为本发明实施例提供的合成备份的示意图;
图4为本发明实施例提供的合成备份的详细流程图;
图5为本发明实施例提供的数据归档流程图;
图6为本发明实施例提供的采用完全移动算法得到合成全备份文件后的归档流程图;
图7为本发明实施例提供的合成备份装置的基本结构图;
图8为本发明实施例提供的合成备份装置的详细结构图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本发明进行详细描述。
参见图2,图2为本发明实施例提供的合成备份流程图。如图2所示,该流程可包括以下步骤:
步骤201,从存储介质当前存储的待合成的增量备份文件中确定出未过期的数据文件。
这里,增量备份文件中未过期的数据文件为数据内容最新的文件,参见图3a,图3a为本实施例中存储介质当前存储的增量备份示意图,如图3a所示,存储介质当前存储的增量备份文件包含增量备份文件1和增量备份文件2,其中,增量备份文件1中的文件A11和文件A55分别为全备份文件中的文件A1和文件A5的内容发生变化后所对应的备份文件;全备份文件的示意图可参见图3b。增量备份文件2中的文件A111和文件A44分别为增量备份文件1中的文件A11和全备份中的文件A4的内容发生变化后所对应的备份文件。如此,可以知道,数据内容最新的文件为增量备份文件1中的文件A44、增量备份文件2中的文件A111和文件A55,相应地,也可知道,增量备份文件1中的文件A11为已过期的数据文件,这样,步骤201中确定出的未过期的数据文件为文件A44、文件A111和文件A55。
步骤202,将确定出的未过期的数据文件保存到所述存储介质存储的全备份文件中。
这里,步骤202中具体可将确定的数据文件写入到全备份文件的尾部。本步骤仅移动增量备份文件中未过期的数据文件,无需移动全备份文件中未过期的文件,减少了数据移动量,大大降低了合成备份的操作时间,提高了合成备份的性能。
为叙述简便,本实施例可将确定出的未过期的数据文件保存到所述存储介质存储的全备份文件后,更新该全备份文件为合成备份文件。具体地,若采用图3a所示的增量备份文件和图3b所示的全备份文件,则将确定出的未过期的数据文件保存到所述存储介质存储的全备份文件中最后形成的全备份文件可参见图3c所示。
如此,实现了合成备份的操作。之后,只要定期执行本发明实施例提供的合成备份操作即实现数据的有效保护,减少用户网络环境的传输带宽占用率。
为使本实施例更加清楚,下面结合具体实施例对本发明所提供的上述方法进行详细描述。
参见图4,图4为本发明实施例提供的合成备份的详细流程图。本实施例中,为改进合成备份的性能和实现数据的有效保护,可从存储介质的空间大小和待合成数据文件的大小来考虑如何实现数据文件的合成备份,如图4所示,该流程包括以下步骤:
步骤401,判断待合成的数据文件量是否小于第一预设数N倍的存储介质可用空间,如果是,执行步骤402,否则,执行步骤404。
这里,待合成的数据文件量为存储介质存储的全备份文件的大小和所有的增量备份文件的大小之和,其中,全备份文件的大小为全备份文件中所有未过期文件的大小和所有已过期文件的大小之和,增量备份文件的大小为增量备份文件中所有未过期文件的大小和所有已过期文件的大小之和。
这里,N为自然数,可从待合成数据文件的大小、存储介质可用空间以及实际的网络运行环境等角度来设置第一预设数N,其中,N可为固定数值,如2、3等,也可为系统配置参数,本实施例对此并未限定。
具体地,每一个备份文件都有自己的属性信息,该属性信息中可包含该文件的大小,若增量备份文件、全备份文件分别如图3a和图3b所示,N为2,则步骤401具体可为判断全备份文件、增量备份文件1和增量备份文件2三文件的大小之和是否小于2倍的存储介质可用空间,如果是,执行步骤402,否则,执行步骤404。
步骤402,判断全备份文件中未过期数据文件量是否大于第二预设数M倍的待合成的增量备份文件中未过期数据文件量,如果是,则执行步骤403,否则,执行步骤404。
这里,全备份文件中未过期数据文件量为全备份文件中所有未过期数据文件的大小之和,待合成的增量备份文件中未过期数据文件量为所有待合成的增量备份文件中的未过期数据文件的大小之和。
本实施例可从全备份文件中所有未过期数据文件的大小、待合成的增量备份文件中所有未过期数据文件的大小以及实际的网络运行环境来设置第二预设数M,其中,M为自然数,M的取值与N无关,其可为固定数值,如2、3等,也可为系统配置参数,本实施例对此并未限定。
具体地,若增量备份文件、全备份文件分别如图3a和图3b所示,M为2,则全备份文件中未过期数据文件量为文件A2和文件A3的大小之和;待合成的增量备份文件中未过期数据文件量为文件A111、文件A4和文件A5的大小之和,如此,步骤402为判断文件A2和文件A3的大小之和是否大于2倍的文件A111、文件A4和文件A5的大小之和,如果是,则执行步骤403,否则,执行步骤404。
步骤403,判断全备份文件中未过期数据文件量是否大于第三预设数P倍的已过期数据文件量,如果是,执行步骤405,否则,执行步骤404。
这里,全备份文件中未过期数据文件量为全备份文件中所有未过期数据文件的大小之和,已过期数据文件量为全备份文件中所有已过期数据文件的大小之和。
本实施例可从全备份文件中未过期数据文件的大小、已过期数据文件的大小以及实际的网络运行环境考虑来设置第三预设数P,其中,P为自然数,其取值与M、N的取值无关,其可为固定数值,如2、3等,也可为系统配置参数,本实施例对此并未限定。
步骤404,采用完全移动算法对存储介质存储的全备份和所有的增量备份中未过期的数据文件进行合成,得到合成备份文件,结束流程。
这里,采用完全移动算法得到合成备份文件的操作与现有技术类似,本实施例不再赘述。
步骤405,打开全备份文件。
步骤406,获得增量备份文件中未过期的数据文件列表。
这里,未过期的数据文件列表中可包含未过期的数据文件的属性信息,其中,该属性信息可包含未过期的数据文件的名称、修改时间和备份时间等。
步骤407,遍历上述获得的未过期的数据文件列表,针对每一个未过期的数据文件,从增量备份文件中读取该数据文件的内容,将读取的内容写入到打开的全备份文件中。
步骤408,关闭该全备份文件,得到合成备份文件。
其中,该合成备份文件具体为写入未过期的数据文件的全备份文件。如此,实现了合成备份的操作。
需要说明的是,步骤405和步骤406并未有固定的时间先后顺序,比如步骤406中的操作可在步骤405之前执行。
需要说明的是,为便于后续数据文件的分类,在得到的合成备份文件后,本实施例还可在步骤408之后,进一步包括:打开合成备份文件,逐一将合成备份文件中已过期的数据文件标记为删除,然后关闭该合成备份文件的操作。
为便于数据文件后续的检索,在完成合成备份的操作后,还可执行数据归档的操作。其中,数据归档是对数据实施管理的一个重要手段,通过数据归档,可将一些当前不需要使用的数据长期保存,以遵从法律法规的要求,达到数据可供追查的目的。现有技术中,合成备份和数据归档分别归属于两个独立的操作单元,本实施例根据合成备份和数据归档的特点,对合成备份和数据归档进行了整合,即利用一个操作单元在执行合成备份之后,直接进行数据归档。
通常,数据归档具有一定的归档策略,该归档策略中包含归档条件和归档介质等。其中,归档条件可以为:数据文件的类型、数据文件的创建时间和数据文件的备份时间等;归档介质可为磁盘、光盘、磁带等。
参见图5,图5为本发明实施例提供的数据归档流程图。本实施例中,在步骤408得到合成备份文件后,如图5所示,该流程可包括以下步骤:
步骤501,逐一打开存储介质当前存储的增量备份文件和合成备份文件。
这里,若增量备份文件、合成备份文件分别如图3a和图3c所示,则步骤501中逐一打开增量备份文件1、增量备份文件2和合成备份文件(步骤408中得到的合成备份文件)。
步骤502,获得增量备份文件和合成备份文件中已过期数据文件的列表。
这里,已过期的数据文件列表可包含数据文件的属性信息,其中,该属性信息可包含数据文件的名称、修改时间和备份时间等。
若增量备份文件、合成备份文件分别如图3a和图3c所示,则获得的列表中包含文件A11、文件A1、文件A4和文件A5的属性信息。
步骤503,针对步骤502中获得的列表中的每一个已过期数据文件,判断该数据文件是否满足预设定的归档条件,如果是,执行步骤504,否则,忽略该数据文件。
这里,预设定的归档条件可有多种形式,比如,数据文件类型、数据文件的备份时间或修改时间等,本实施例对此并未限定。
步骤504,将该已过期数据文件复制到归档介质上。
这里,归档介质可有多种形式,如可为磁盘或者光盘等,本实施例对此并未限定。
如此,实现了数据文件的归档操作。
优选地,在执行步骤504之后,为节省存储介质的资源,可执行步骤505。
步骤505,删除存储介质中所有的增量备份文件。
需要说明的是,图5所示的归档操作是针对步骤408中得到的合成备份文件。本实施例还提供了针对步骤404采用完全移动算法得到合成全备份文件后的归档操作。参见图6,图6为本发明实施例提供的采用完全移动算法得到合成全备份文件后的归档流程图,如图6所示,该流程可包括以下步骤:
步骤601,逐一打开存储介质当前存储的全备份文件和所有的增量备份文件。
步骤602,获得全备份文件和增量备份文件中已过期数据文件的列表。
步骤603和步骤604分别与步骤503和步骤504相同,这里不再赘述。
优选地,在执行步骤604之后,为节省存储介质的资源,可执行步骤605。
步骤605,删除存储介质当前存储的全备份文件和增量备份文件。
至此,实现了数据文件的归档操作。
以上对本发明实施例提供的方法进行了描述,下面对本发明实施例提供的装置进行详细描述。
参见图7,图7为本实施例提供的合成备份装置的基本结构图。如图7所示,该装置可包括:存储单元701、文件确定单元702和合成单元703。
其中,存储单元701用于存储全备份文件和待合成的增量备份文件。
文件确定单元702用于从存储单元701中确定出待合成的增量备份文件中未过期的数据文件。
合成单元703用于将文件确定单元702确定出的未过期的数据文件保存到存储单元701当前存储的全备份文件中。
采用图7所示的装置可以实现仅移动增量备份文件中未过期的数据文件,无需移动全备份文件中未过期的文件,减少了数据移动量,大大降低了合成备份的操作时间,提高了合成备份的性能。
优选地,为进一步提高合成备份的性能,本实施例还提供了合成备份装置的详细结构图。参见图8,图8为本实施例提供的合成备份装置的详细结构图。如图8所示,该装置包括:存储单元801、文件确定单元802、合成单元803和第一判断单元804。
其中,存储单元801用于存储全备份文件和增量备份文件。
第一判断单元804用于判断待合成的数据文件量是否小于第一预设数N倍的存储单元801的可用空间,其中,N为自然数,所述待合成的数据文件量为所述存储单元存储的全备份文件的大小和待合成的增量备份文件的大小之和,如果是,发送第一判断通知给文件确定单元802,否则,发送第一合成通知给合成单元803。
文件确定单元802接收到第一判断通知后,执行从存储单元801存储的待合成的增量备份文件中确定出未过期的数据文件的操作。
合成单元803接收到第一合成通知后,利用现用技术中的完全移动算法对所述存储介质存储的全备份文件和所有的增量备份文件中未过期的数据文件执行合成备份操作。
优选地,如图8中的虚线所示,该装置进一步包括:第二判断单元805。
其中,第二判断单元805连接在第一判断单元804与文件确定单元802之间,用于接收第一判断通知,判断全备份文件中未过期数据文件量是否大于第二预设数M倍的待合成的增量备份文件中未过期数据文件量,其中,M为自然数,全备份文件中未过期数据文件量为全备份文件中所有未过期数据文件的大小之和,待合成的增量备份文件中未过期数据文件量为所有待合成的增量备份文件中的未过期数据文件的大小之和,如果是,将接收的第一判断通知转发给文件确定单元802;否则,发送第二合成通知给合成单元803。
如此,合成单元803接收到第二合成通知后,利用现用技术中的完全移动算法对所述存储介质存储的全备份文件和所有的增量备份文件中未过期的数据文件执行合成备份操作。
优选地,如图8中的虚线所示,该装置进一步包括:第三判断单元806。
其中,第三判断单元806连接在第二判断单元805与文件确定单元802之间,用于接收所述第一判断通知,判断全备份文件中未过期数据文件量是否大于第三预设数P倍的已过期数据文件量,其中,P为自然数,所述全备份文件中未过期数据文件量为全备份文件中所有未过期数据文件的大小之和,所述已过期数据文件量为全备份文件中所有已过期数据文件的大小之和;如果是,将接收的所述第一判断通知转发给文件确定单元802;否则,发送第三合成通知给合成单元803。
如此,合成单元803接收到第三合成通知后,利用现用技术中的完全移动算法对所述存储介质存储的全备份文件和所有的增量备份文件中未过期的数据文件执行合成备份操作。
优选地,如图8中的虚线所示,该装置进一步包括:获取单元807、遍历单元808和归档单元809。
其中,获取单元807用于从所述全备份文件和待合成的增量备份文件中获取已过期数据文件的列表,该列表中可包含获取的各个数据文件的属性信息。
遍历单元808用于遍历获取单元807获取的已过期数据文件的列表,对每一个已过期的数据文件,判断该已过期的数据文件是否符合预设定的归档条件,如果是,则复制该已过期数据文件中的内容到所述归档单元中,否则,忽略该已过期的数据文件。
归档单元809用于存储遍历单元808复制的已过期数据文件中的内容。
可见,在本发明提供的合成备份方法和装置中,首先需要确定存储介质当前存储的待合成的增量备份文件中未过期的数据文件,之后,将确定的数据文件的内容写入到所述存储介质存储的全备份文件中,这样,可以实现仅移动增量备份文件中未过期的数据文件,而全备份文件中的数据文件不执行移动操作,如此,减少了数据文件的移动量,大大降低了合成备份的操作时间,提高了合成备份的性能。
进一步地,本发明实施例通过对数据备份和数据归档的特点进行分析,提出了在执行合成备份之后,可直接进行数据归档,即对合成备份和数据归档进行了整合,这样,在需要对数据文件进行归档管理时,不需要现有技术中借助于第三方归档软件从数据源端重新收集该数据并传输给档系统,大大减少了数据源和网络的工作负荷,有利于进行高效和统一的数据管理。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (12)

1、一种合成备份方法,其特征在于,该方法包括:
从存储介质当前存储的待合成的增量备份文件中确定出未过期的数据文件;
将确定出的未过期的数据文件保存到所述存储介质存储的全备份文件中。
2、根据权利要求1所述的方法,其特征在于,在从存储介质当前存储的待合成的增量备份文件中确定出未过期的数据文件之前,该方法进一步包括:
判断待合成的数据文件量是否小于第一预设数N倍的存储介质可用空间,其中,N为自然数,所述待合成的数据文件量为存储介质存储的全备份文件的大小和待合成的增量备份文件的大小之和,如果是,继续执行所述从存储介质当前存储的待合成的增量备份文件中确定出未过期的数据文件的操作,否则,利用现用技术中的完全移动算法对所述存储介质存储的全备份文件和所有的增量备份文件中未过期的数据文件执行合成备份的操作。
3、根据权利要求2所述的方法,其特征在于,在判断出待合成的数据文件量小于第一预设数N倍的存储介质可用空间之后,并在执行从存储介质当前存储的待合成的增量备份文件中确定出未过期的数据文件的操作之前,进一步包括:
判断全备份文件中未过期数据文件量是否大于第二预设数M倍的待合成的增量备份文件中未过期数据文件量,其中,M为自然数,所述全备份文件中未过期数据文件量为全备份文件中所有未过期数据文件的大小之和,所述待合成的增量备份文件中未过期数据文件量为所有待合成的增量备份文件中的未过期数据文件的大小之和,如果是,继续执行从存储介质当前存储的待合成的增量备份文件中确定出未过期的数据文件的操作,否则,利用现用技术中的完全移动算法对所述存储介质存储的全备份文件和所有的增量备份文件中未过期的数据文件执行合成备份的操作。
4、根据权利要求3所述的方法,其特征在于,在判断出全备份文件中未过期数据文件量大于第二预设数M倍的待合成的增量备份文件中未过期数据文件量之后,并在执行从存储介质当前存储的待合成的增量备份文件中确定出未过期的数据文件的操作之前,进一步包括:
判断全备份文件中未过期数据文件量是否大于第三预设数P倍的已过期数据文件量,其中,P为自然数,所述全备份文件中未过期数据文件量为全备份文件中所有未过期数据文件的大小之和,所述已过期数据文件量为全备份文件中所有已过期数据文件的大小之和;如果是,继续执行从存储介质当前存储的待合成的增量备份文件中确定出未过期的数据文件的操作,否则,利用现用技术中的完全移动算法对所述存储介质存储的全备份文件和所有的增量备份文件中未过期的数据文件执行合成备份的操作。
5、根据权利要求1至4任一所述的方法,其特征在于,在所述将确定出的未过期的数据文件保存到存储介质存储的全备份文件中之后,进一步包括:
从所述全备份文件中确定出已过期的数据文件;
将确定出的已过期的数据文件标记为删除。
6、根据权利要求1至4任一所述的方法,其特征在于,在所述将确定出的未过期的数据文件保存到存储介质存储的全备份文件中之后,进一步包括:
从所述全备份文件和待合成的增量备份文件中获取已过期数据文件的列表;
遍历所述已过期数据文件的列表,针对每一个已过期的数据文件,判断该数据文件是否符合预设定的归档条件,如果是,则复制该已过期数据文件到归档介质中,否则,忽略该已过期数据文件。
7、根据权利要求3所述的方法,其特征在于,当遍历完所述已过期数据文件的列表后,进一步包括:删除待合成的增量备份文件。
8、一种合成备份装置,其特征在于,该装置包括:存储单元、文件确定单元和合成单元;其中,
所述存储单元用于存储全备份文件和增量备份文件;
所述文件确定单元用于从所述存储单元中确定出待合成的增量备份文件中未过期的数据文件;
所述合成单元用于将所述文件确定单元确定出的未过期的数据文件保存到所述存储单元存储的全备份文件中。
9、根据权利要求8所述的装置,其特征在于,该装置进一步包括:第一判断单元;其中,
所述第一判断单元用于判断待合成的数据文件量是否小于第一预设数N倍的所述存储单元的可用空间,其中,N为自然数,所述待合成的数据文件量为所述存储单元存储的全备份文件的大小和待合成的增量备份文件的大小之和,如果是,发送第一判断通知给所述文件确定单元,否则,发送第一合成通知给所述合成单元;
所述文件确定单元接收到第一判断通知后,执行从所述存储单元存储的待合成的增量备份文件中确定出未过期的数据文件的操作;
所述合成单元接收到第一合成通知后,利用现用技术中的完全移动算法对所述存储介质存储的全备份文件和所有的增量备份文件中未过期的数据文件执行合成备份操作。
10、根据权利要求9所述的装置,其特征在于,该装置进一步包括:第二判断单元;其中,
所述第二判断单元连接在所述第一判断单元与所述文件确定单元之间,用于接收所述第一判断通知,判断全备份文件中未过期数据文件量是否大于第二预设数M倍的待合成的增量备份文件中未过期数据文件量,其中,M为自然数,所述全备份文件中未过期数据文件量为全备份文件中所有未过期数据文件的大小之和,所述待合成的增量备份文件中未过期数据文件量为所有待合成的增量备份文件中的未过期数据文件的大小之和,如果是,将接收的所述第一判断通知转发给所述文件确定单元;否则,发送第二合成通知给所述合成单元;
所述合成单元接收到第二合成通知后,利用现用技术中的完全移动算法对所述存储介质存储的全备份文件和所有的增量备份文件中未过期的数据文件执行合成备份操作。
11、根据权利要求10所述的装置,其特征在于,该装置进一步包括:第三判断单元;其中,
所述第三判断单元连接在所述第二判断单元与所述文件确定单元之间,用于接收所述第一判断通知,判断全备份文件中未过期数据文件量是否大于第三预设数P倍的已过期数据文件量,其中,P为自然数,所述全备份文件中未过期数据文件量为全备份文件中所有未过期数据文件的大小之和,所述已过期数据文件量为全备份文件中所有已过期数据文件的大小之和;如果是,将接收的所述第一判断通知转发给所述文件确定单元;否则,发送第三合成通知给所述合成单元;
所述合成单元接收到第三合成通知后,利用现用的完全移动算法对所述存储介质存储的全备份和所有的增量备份中的数据文件进行合成。
12、根据权利要求8至11任一所述的装置,其特征在于,该装置进一步包括:获取单元、遍历单元和归档单元;其中,
所述获取单元用于从所述全备份文件和待合成的增量备份文件中获取已过期数据文件的列表;
所述遍历单元用于遍历所述获取单元获取的已过期数据文件的列表,对每一个已过期的数据文件,判断该已过期的数据文件是否符合预设定的归档条件,如果是,则复制该已过期数据文件中的内容到所述归档单元中,否则,忽略该已过期的数据文件;
所述归档单元用于存储所述遍历单元复制的已过期数据文件中的内容。
CN 200810207619 2008-12-23 2008-12-23 一种合成数据备份方法和装置 Active CN101453490B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 200810207619 CN101453490B (zh) 2008-12-23 2008-12-23 一种合成数据备份方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 200810207619 CN101453490B (zh) 2008-12-23 2008-12-23 一种合成数据备份方法和装置

Publications (2)

Publication Number Publication Date
CN101453490A true CN101453490A (zh) 2009-06-10
CN101453490B CN101453490B (zh) 2012-12-19

Family

ID=40735510

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 200810207619 Active CN101453490B (zh) 2008-12-23 2008-12-23 一种合成数据备份方法和装置

Country Status (1)

Country Link
CN (1) CN101453490B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103473149A (zh) * 2013-08-16 2013-12-25 赵利林 避免数据快照遗留在存储系统上的方法
CN103988201A (zh) * 2011-12-21 2014-08-13 Emc公司 有效的备份复制
CN104750572A (zh) * 2013-12-31 2015-07-01 中国移动通信集团设计院有限公司 一种数据备份方法、装置和移动终端
CN105373452A (zh) * 2015-12-11 2016-03-02 上海爱数信息技术股份有限公司 一种数据备份方法
CN105653393A (zh) * 2014-11-11 2016-06-08 南京壹进制信息技术有限公司 一种基于usn日志方式进行海量文件备份的方法
CN107608830A (zh) * 2017-09-26 2018-01-19 郑州云海信息技术有限公司 一种数据备份方法、装置及计算机可读存储介质
WO2019127034A1 (zh) * 2017-12-26 2019-07-04 华为技术有限公司 一种过期备份处理方法及备份服务器
CN116541210A (zh) * 2023-06-26 2023-08-04 成都融见软件科技有限公司 一种源文件的备份方法及系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101064730A (zh) * 2006-09-21 2007-10-31 上海交通大学 计算机网络数据文件本地和远程的备份方法
CN101051285A (zh) * 2006-09-21 2007-10-10 上海交通大学 计算机网络数据备份中文件匹配的方法

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103988201A (zh) * 2011-12-21 2014-08-13 Emc公司 有效的备份复制
US9465695B2 (en) 2011-12-21 2016-10-11 Emc Corporation Efficient backup replication
CN103988201B (zh) * 2011-12-21 2017-06-06 Emc 公司 有效的备份复制
CN103473149B (zh) * 2013-08-16 2016-09-14 江苏爱科赛尔云数据科技有限公司 避免数据快照遗留在存储系统上的方法
CN103473149A (zh) * 2013-08-16 2013-12-25 赵利林 避免数据快照遗留在存储系统上的方法
CN104750572A (zh) * 2013-12-31 2015-07-01 中国移动通信集团设计院有限公司 一种数据备份方法、装置和移动终端
CN104750572B (zh) * 2013-12-31 2018-11-16 中国移动通信集团设计院有限公司 一种数据备份方法、装置和移动终端
CN105653393A (zh) * 2014-11-11 2016-06-08 南京壹进制信息技术有限公司 一种基于usn日志方式进行海量文件备份的方法
CN105653393B (zh) * 2014-11-11 2018-09-21 南京壹进制信息技术股份有限公司 一种基于usn日志方式进行海量文件备份的方法
CN105373452B (zh) * 2015-12-11 2019-02-01 上海爱数信息技术股份有限公司 一种数据备份方法
CN105373452A (zh) * 2015-12-11 2016-03-02 上海爱数信息技术股份有限公司 一种数据备份方法
CN107608830A (zh) * 2017-09-26 2018-01-19 郑州云海信息技术有限公司 一种数据备份方法、装置及计算机可读存储介质
WO2019127034A1 (zh) * 2017-12-26 2019-07-04 华为技术有限公司 一种过期备份处理方法及备份服务器
CN110998537A (zh) * 2017-12-26 2020-04-10 华为技术有限公司 一种过期备份处理方法及备份服务器
CN110998537B (zh) * 2017-12-26 2022-09-02 华为技术有限公司 一种过期备份处理方法及备份服务器
US11615000B2 (en) 2017-12-26 2023-03-28 Huawei Technologies Co., Ltd. Method and backup server for processing expired backups
CN116541210A (zh) * 2023-06-26 2023-08-04 成都融见软件科技有限公司 一种源文件的备份方法及系统
CN116541210B (zh) * 2023-06-26 2023-11-17 成都融见软件科技有限公司 一种源文件的备份方法及系统

Also Published As

Publication number Publication date
CN101453490B (zh) 2012-12-19

Similar Documents

Publication Publication Date Title
CN101453490B (zh) 一种合成数据备份方法和装置
US9785666B2 (en) Using index partitioning and reconciliation for data deduplication
CN102414673B (zh) 智能的备份数据分层
US10180951B2 (en) Place snapshots
US9501501B2 (en) Log record management
US8380957B2 (en) Continuous data protection over intermittent connections, such as continuous data backup for laptops or wireless devices
US8805968B2 (en) Accessing cached data from a peer cloud controller in a distributed filesystem
US8799414B2 (en) Archiving data for a distributed filesystem
US20170123676A1 (en) Reference Block Aggregating into a Reference Set for Deduplication in Memory Management
JP5130386B2 (ja) 代表的な情報を比較することによる効率的なデータベースの同期化
US11093387B1 (en) Garbage collection based on transmission object models
US20100318759A1 (en) Distributed rdc chunk store
US20110106768A1 (en) Backup using metadata virtual hard drive and differential virtual hard drive
CN102591947A (zh) 用于数据去重复的快速且低ram占用的索引
CN103095843A (zh) 一种基于版本矢量的数据备份方法及客户端
JP2014508362A (ja) データー重複排除のためのバックアップおよび復元方策
MX2011010287A (es) Restauracion de archivo de sistema de diferencial apartir de pares y la nube.
CN102880663A (zh) 部分去重复的文件的优化
CN104541252A (zh) 用于实现基于服务器的分层大容量存储系统的系统和方法
CN106909651A (zh) 一种基于hdfs小文件写入和读取的方法
CN103116615A (zh) 一种基于版本矢量的数据索引方法及服务器
US20170123689A1 (en) Pipelined Reference Set Construction and Use in Memory Management
US10642530B2 (en) Global occupancy aggregator for global garbage collection scheduling
CN114942908B (zh) 索引系统、数据处理方法、电子设备及介质
CN110413583A (zh) 一种基于flume系统的日志监控方法、装置及服务器

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C56 Change in the name or address of the patentee
CP03 Change of name, title or address

Address after: 201112 Shanghai, Minhang District, United Airlines route 1188, building second layer A-1 unit 8

Patentee after: SHANGHAI EISOO INFORMATION TECHNOLOGY CO., LTD.

Address before: 201103, room 25, 204 Zhenkang Road, Cambridge, Shanghai, Pudong New Area

Patentee before: Shanghai Eisoo Software Co.,Ltd.