CN1543617A - 高效的计算机文件备份系统和方法 - Google Patents

高效的计算机文件备份系统和方法 Download PDF

Info

Publication number
CN1543617A
CN1543617A CNA028161971A CN02816197A CN1543617A CN 1543617 A CN1543617 A CN 1543617A CN A028161971 A CNA028161971 A CN A028161971A CN 02816197 A CN02816197 A CN 02816197A CN 1543617 A CN1543617 A CN 1543617A
Authority
CN
China
Prior art keywords
file
hash key
backup
specific
computer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA028161971A
Other languages
English (en)
Other versions
CN1294514C (zh
Inventor
K��˹Ƥ˹
K·德斯皮格莱尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NortonLifeLock Inc
Original Assignee
Datact Technologies N V
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Datact Technologies N V filed Critical Datact Technologies N V
Publication of CN1543617A publication Critical patent/CN1543617A/zh
Application granted granted Critical
Publication of CN1294514C publication Critical patent/CN1294514C/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1448Management of the data involved in backup or backup restore
    • G06F11/1453Management of the data involved in backup or backup restore using de-duplication of the data
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/953Organization of data
    • Y10S707/959Network
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99951File or database maintenance
    • Y10S707/99952Coherency, e.g. same view to multiple users
    • Y10S707/99953Recoverability
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99951File or database maintenance
    • Y10S707/99952Coherency, e.g. same view to multiple users
    • Y10S707/99955Archiving or backup

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Techniques For Improving Reliability Of Storages (AREA)

Abstract

一种用于高效地把计算机文件备份和恢复到中央存储系统的系统和方法。为要备份到目标计算机上的每一文件计算散列密钥。该散列密钥与本地存储的散列密钥列表相比较,看看先前是否已经备份了该本地文件。如果没有在本地列出该散列密钥,则将该散列密钥与中央备份文件的散列密钥列表相比较。只有当在本地和中央列表中不存在该散列密钥时,才对该文件进行备份。为了进一步的效率,可以根据文件的散列密钥对备份文件进行重命名。

Description

高效的计算机文件备份系统和方法
本发明一般地涉及一种用于备份和恢复在计算机系统上的数据文件和程序的方法,更具体来讲,本发明涉及一种高效的方法,用于确定先前是否已经备份了一文件或者程序,或者如果存在该文件的一份备份副本,则然后仅仅备份那些先前没有被备份的、并且没有备份副本的程序。因此,该系统和方法使得能够为本地或者远程备份计算机和/或计算机系统的文件而高效地利用带宽。
传统的用于备份计算机程序和数据文件的方法常常使用大量昂贵的网络带宽和过量的处理器(CPU)处理时间。当前,许多备份过程对计算机或者计算机系统的整个程序和数据储存库进行备份,这引起备份文件和程序的重复,并且要求大量网络带宽和过量的存储介质(例如磁带或者光盘(CD))。
许多组织的网络常常包括数据中心(“服务器群组(server farms)”),用于存储和管理大量的因特网可存取数据。数据中心常常包括几个计算机系统,例如因特网服务器,雇员工作站(employee workstations),文件服务器,等等。常常,这样的数据中心具有使用传统备份系统的可扩缩性问题。所要求的带宽和存储器不足以执行数据中心环境的大规模备份。可扩缩的并且能够随着组织的壮大而发展的系统将是很有益的。
能够通过增量备份方法实现一些带宽和存储介质的节省,该方法仅仅对已经改变的或者已经更新的文件进行备份。然而,这些方法没有解决这样的问题:重复在一个网络、乃至不同网络上的不同计算机上驻留的文件,常常仍以重复的形式获得备份,耗尽大量存储介质。
例如,在许多人之间常常共享数据文件,并且重复的副本驻留在许多不同计算机上,这引起跨越一个或者多个计算机网络的、文件的许多多重副本。进一步来讲,计算机常常使用重复的程序和数据文件,用于运行操作系统和应用程序。例如,在运行Microsoft Windows的网络中,每一计算机可能具有重复的操作系统文件和程序。使用传统方法对整个网络进行备份可能导致那些文件和程序的许多多重备份,引起存储介质的过度浪费。除去备份文件和程序的重复的装置将是合乎需要的,可能的好处导致对于存储介质、处理时间和网络带宽的更加高效的利用。
进一步来讲,通过组织实现的传统的备份方法常常使用许多计算机服务器来执行该备份,常常备份到磁带介质,这引起数据备份的分布式存储,此外还在介质和处理器时间两方面都引起重复和浪费。
再进一步来讲,分布式的备份过程通常引起对于存储许多备份磁带、或者其他类似备份介质的需要,并且要求一种追踪多个介质的方法。这样一种系统常常是很难恢复的,特别是如果使用了增量备份过程。正确的存储介质必须被定位,并且必须被以正确的顺序加载。磁带恢复是一种冗长的、费时的过程。常常,恢复过程是如此低效率和易出错,以致它是无效的,导致数据损失甚至生产率的损失,因为必须重新安装程序,并且必须重建数据。引起更加有效的和更容易实现的恢复过程的、更加高效易用的备份系统将有益于使用计算机系统的组织。
本发明涉及在备份技术方面的改进,更具体来讲,本发明创建了一种解决方案,用于在因特网数据中心和企业数据中心环境中进行大规模服务器备份,并结果产生了一种用于灾难恢复和数据保护的解决方案。
本发明是一种使用文件内容的散列密钥的改进系统和方法,用于更加高效的和更加有效备份计算机文件和计算机程序。
该过程中的第一步骤是扫描目标机(待备份的计算机系统)上的文件系统,并且创建散列密钥,为每一个待备份的文件创建一个唯一的数字代码。在优选实施例中,为了减少处理时间,仅仅为具有修改日期属性的、也就是比上次备份更新近的文件创建散列密钥。
作为结果的散列密钥被存储在本地数据库——目标计算机上的数据库——中,例如供在当前、以及将来的备份会话中作进一步的比较。所述本地数据库还包括每一备份文件的完整路径。
对照在本地数据库中的先前的散列密钥项目,对所存储的散列密钥进行校验。以这种方式,所述散列密钥被用于校验每一本地文件,以便确定先前是否在目标系统中对其进行了备份。没有在本地数据库密钥列表中查找到的散列密钥被用于该过程的下一步骤。
对照在中央存储服务器上存储的文件的散列密钥,对没有在本地的散列密钥数据库中查找到的散列密钥进行校验。这一校验用于确定是否已经在中央存储服务器上存在特定文件。该文件可以作为来自另一服务器或者系统的备份、或者来自先前备份操作的结果来存在。
例如,逐文件地、而不是逐块地执行是否进行备份的判定。这强有力地减少了比较次数和本地数据库的尺寸,并且极其适用于群组服务器,在所述群组服务器中,不仅数据块、而且常常是完整的文件在多个服务器之间被重复。
附图的简短说明
图1是显示根据本发明的一方面的备份过程的主要步骤的方框图;
图2是显示根据本发明的一方面的备份决策进行过程的方框图;
图3是显示依据本发明、用于实现本发明的方法的系统的一种实现方式的方框图;
图4是显示本发明的备份子系统的更加详细的实现方式的方框图;
传统上,无论是否执行计算机、服务器或者系统的增量或者全部备份,备份解决方案都极大地增加了网络通信量,并且能够使用巨大的存储容量。本发明使用内容散列密钥来做出是否备份某些数据的智能决策,并且使用中央存储器容量来提供更加高效的和更加有效的备份存储和恢复活动。
本发明是一种使用文件内容的散列密钥的系统和方法,用于更加高效的和更加有效的备份计算机文件和计算机程序。在本说明中,术语“文件”、“程序”、“计算机文件”、“计算机程序”、“数据文件”和“数据”是可交换地使用的,并且依据使用的上下文,任何一个的使用都可能暗示了另一个术语。
本发明利用了一种使用散列机制的过程,用于检验一个文件在备份系统中是否是唯一的。仅仅唯一的、并且还未备份的文件才将被存储在中央存储系统上,这在使用网络带宽和存储介质时产生了效率。该过程利用将新创建的内容密钥与所有先前产生的散列密钥(使用本地化的和/或中央化的列表)相匹配、以产生备份判定,产生执行备份的整体分析,并且更加有效地和更少麻烦地完成恢复功能。作为结果的方法通过减少网络通信量和备份文件存储器两方面的重复,具有最小的带宽消耗和最小的存储容量使用。这对于备份操作系统文件和常用的应用程序特别有用。
图1提供了对于依据本发明的备份过程的一种实现方式的方法的概观。由框10示出的该过程中的第一步骤是对目标计算机/系统(待备份的单独计算机或者计算机系统)上的文件系统进行扫描,并且例如如框12所示,以32或者64字节模式创建一个内容散列密钥。所述散列密钥对于每一个待备份文件来讲,是唯一的数字代码。对于每一个唯一的文件来讲,所述散列密钥是唯一的。进一步来讲,对于文件的相同副本来讲,所述散列密钥是相同的。以这种方式,对于该文件和任何相同的复制来讲,所述散列密钥成为一个唯一标识符。因此,如果两个文件具有相同的散列代码,则它们是相同的,并且,能够而且将会被同样地处理。能够使用工业散列过程,MD5。
作为结果的散列密钥被存储在本地数据库404(图3)中,供在当前、以及将来的备份会话中作进一步的比较。这由图1中的框14表示。对应于所述散列密钥的该文件的路径和/或文件名与所述散列密钥一起被存储。
对这一过程的改进可以是将所述散列密钥追加到计算机文件自身。以这种方式,已经进行了散列处理的文件能够被所述散列过程旁路掉,这在计算机处理方面提供了进一步的节省。然而,并不能够对所有的文件进行这样的追加,所以这一改进对于所有计算机文件类型可能是不可行的。
对照本地数据库404中的先前的散列密钥项目,对所存储的散列密钥进行校验,如图1中的框16所示。以这种方式,所述散列密钥被用于校验是否每一本地文件都曾在以前、在目标系统中进行了备份。没有在本地数据库中查找到的散列密钥被用于该过程的下一步骤。因为只有那些没有由于被最近备份、或者至少最近处理过而被记录的文件才需经历进一步的处理。这使得可以有效利用计算机资源。
现在对照中央数据库408中存储的文件,对没有在本地散列密钥数据库中查找到的散列密钥进行校验,如图1中的框18所示。对应于每一散列密钥的文件的路径和/或文件名与存储在本地数据库中的每一散列密钥一起被存储。所述散列密钥被用于确定是否已经在所述中央存储服务器400上存在所述对应的文件,并因此不需要对其进行备份。所述文件可能作为来自不同的目标计算机300乃至不同的目标网络的一次备份而存在。原理是不管有多少不同的目标计算机可能包含该相同,且完全相同的文件,都在中央存储系统内存储每一个唯一文件的单一副本。
如果在中央数据库中不存在与给定的散列密钥的匹配,则该散列密钥被添加到所述中央数据库408,并且将所对应的文件上载(图1中的框20)到所述中央存储系统400(框22),所述中央存储系统400管理所述文件和散列密钥列表。能够由所述服务器保存所述过程的记录(参见日志存档框22a)。如果期望的话,为了安全原因,对待存档的文件进行加密(框24),并且对所述文件进行压缩,以便减少存储介质需求(框28)。举例来说,可以通过使用所述散列密钥产生加密密钥,并通过已知的、但是安全的算法对其进行变换。
最后,接着执行调度过程(图1中的框30)。基于所述散列密钥,所述调度过程将决定所述文件需要被调度到哪一位置中,并且它应该被存储在哪一存储设备(32a,32b,32c,32d…32n)上。所述存储设备可能被集中地放置,以便增加效率,但是本发明也能够使用分布式的、乃至远程放置的设备。散列密钥可被用于将文件调度到存储网络中的不同位置中。
在优选实施例中,使用所述散列密钥作为文件名对所存储的文件进行重命名。这可使文件的检索变得简单、并且更加快速。当恢复的时候,将通过将所述散列密钥与被恢复机器上的文件名和/或文件路径交叉参照,来恢复原始文件名。
图2中的流程图更详细地示出了进行所述文件备份决策过程。通过框100中的步骤示出了本地扫描。在步骤102中扫描文件,并且通过步骤104形成散列密钥。在优选实施例中,仅仅为具有修改或者创建日期属性的、也就是比上次备份日期更新近的文件计算散列密钥。每一散列密钥与本地数据库404中的本地存储的散列密钥列表相比较。本地数据库404为先前已经备份的每一文件包含一个记录,该记录包括散列密钥和该文件的完整路径和名称(步骤106)。那些具有匹配的文件将不被备份(步骤110),而那些具有与本地列表不匹配的散列密钥的文件(步骤106)需要进一步处理(框200中的步骤)。至少对于每一非匹配文件来讲,在本地数据库中存储一个新记录,该新记录包括该散列密钥和该文件的完整路径和名称。用于非匹配文件的散列密钥被收集、以供转发(步骤108),并且被转发出去,以便与中央存储的(中央数据库408)密钥列表相比较(步骤202)。如果密钥与先前中央存储的散列密钥匹配(步骤204),则不备份该文件(步骤210)。然而,只有当没有匹配时(步骤204),才备份该文件。所述散列密钥将被存储在中央数据库408中,并且该文件在被备份或者存档到存储器中之前,可以经受如上所述的处理(即,加密和压缩)。
能够通过保存文件的历史副本、以及散列列表404、408的历史副本实现对上述过程的进一步改进,以致能够将任何单独机器恢复到它在过去某一给定时刻的文件系统状态。显然,实现这一改进需要中央存储系统400中的额外存储介质,以便在适宜的时机保存这些“快照”。对于人们能够倒退存档文件系统多远的的唯一限制是专用于该任务的存储量。因此,如果对于一种具体的实现方式来讲,计算机文件系统的历史快照不是令人想要的,则人们能够通过不实现本发明的这一特征来节省资本费用。
依据系统恢复文件基本上是通过将过程反向来实施的。因为每一目标计算机300或者系统都具有本地数据库404,该本地数据库404包括已处理文件的散列密钥的记录,所以本地数据库上的那些散列密钥可用于将目标计算机300上的需要被恢复的文件标识为该记录中指示的路径。本地数据库的备份副本还应该被存储在不同的机器上、乃至中央地备份,以便可获得散列密钥的列表和对应的路径来重建毁坏机器中的文件系统。
该系统通过恢复在本地计算机的数据库404上列出的每一文件来恢复该毁坏机器的文件系统,存储在中央存储系统400中文件对应于它们的散列密钥。进一步来讲,可在中央存储系统400中存储本地数据库404本身、以便保留计算机文件系统状态记录,或者在该中央存储系统400中备份这一本地数据库。
类似地,如果打算实现这一特征,将计算机系统恢复到先前的历史文件系统状态,则仅仅需要为该时刻获取该本地数据库,然后依据所述历史的本地数据库恢复文件系统文件。能够本地地、中央地、或者最好是同时在两个位置中存储所述历史的本地数据库。
所述散列码本身可用于在备份和恢复过程期间确保文件的完整性。通过对被备份的和/或被恢复的文件运行所述散列过程,产生了可与原始散列码相比较的散列码。如果所述密钥不是完全相同的,则产生文件误差,并且不能保证文件的完整性。如果是完全相同的,则确保了文件的完整性。
图3示出了用于实践依据本发明方法的一种系统的实现方式的可能的高层概观。目标计算机或者目标系统300是待备份的系统。备份代理402能够被运行或许在目标系统上、或者在所述目标系统是它的一个客户端的服务器上。此外,所述备份代理能够远程地被运行。所述备份代理402实现在上文中论及的文件扫描和散列功能。所述备份代理402还使用了包含有用于先前已被备份的每一文件的记录的本地数据库404,并且实现本地的比较操作(图2中的框100),以便确定所述目标300上的文件先前是否已经被备份。
为了更高的效率或者为了避免目标计算机上的消耗,所述备份代理402能够在专用服务器上运行,并为这一功能而进行优化。所述备份代理402也可以包括恢复功能,或者一个单独的模块能够实现所述恢复功能。所述备份代理402和/或所述恢复代理能够使用万维网(web)界面,来允许经由诸如因特网的广域网(WAN),或者在本地经由局域网(LAN)或者其他网络对所述目标系统的文件备份进行远程管理。替换地或者并行地,还可以经由相同的或者类似的web界面对下文中将论及的备份服务器406进行管理。这能够允许所述备份和/或恢复操作被远程控制,而无论可能是从何处提供了对于所述代理402和/或所述服务器406的访问。
利用了中央存储系统400来实现集中式备份功能,包括图2中的框200中的集中式比较操作。尽管是作为集中式系统来描述的,但是将理解的是,针对这种集中式系统描述的所述功能和/或部件远程地被分布或者放置,取决于本发明的期望实现方式。
备份和恢复服务器406被用于指导所述集中式备份操作。所述服务器406从代理402接收表示未在本地密钥列表中列出的文件的散列密钥列表。然后服务器406将所述失配的密钥列表与中央散列密钥数据库408中存储的(先前备份文件的)密钥列表相比较。将理解的是,如果期望的话,这一数据库能够被存储到下文中论及的一个或多个存储设备414里。如果当前在所述中央设备414中没有备份该文件,则将不存在与中央密钥数据库408中包含的散列密钥的匹配。这意味着需要备份对应的文件。在该情况下,所述服务器406从代理402获取对应的文件,或者替换地,所述服务器可以获取所述文件自身,并将其重命名为它的散列密钥,将重命名地文件转发到加密和压缩模块410(如果要求加密和/或压缩),这实现了上述的加密和压缩步骤。将理解的是,如果期望的话,能够在服务器406上,或者通过单独的计算机/服务器运行所述加密和/或压缩模块。
然后,将所述加密和压缩文件转发到到文件调度器412,所述文件调度器412基于所述散列密钥或者关于所述文件应该被存储在哪里的其它指示符,将所述文件引导到适当的存储设备414a、414b……414n。依照希望,这些数据库414n可以被中央地或者分布地放置。
为了恢复唯一的文件,所述目标服务器300从本地数据库(在目标服务器上)、为该文件请求散列密钥,并且使用该名称、从中央存储服务器406检索该文件。
可能的是:相对于所述目标系统300,远程地或者在本地放置所述集中式备份系统400。可以由服务供应商使用ASP或者XSP商业模型远程提供所述备份系统400,其中所述中央系统被提供给运行该目标系统300的付费客户端。这样一种系统能够使用诸如因特网之类的公众WAN,以便在中央系统和目标客户端之间提供网络连接性。替换地,专用网(WAN或者LAN,等等)能够连接这两个系统。还可以利用公共网络上的虚拟专用网络(VPN)。此外,客户端可能希望本地地实现这样一种系统,以便确保本地控制和自治,特别是在待存储的信息可能是特别敏感的、有价值的和/或是私人所有的情况下。然而,如果此类考虑不是优先的话,能够将更加成本有效的服务市场化,在这种服务中,由服务供应商提供所述中央系统。在该情况下,因特网连接性可能是合算的,并且如上所述,基于web的管理系统也会是有用的,并且依据本发明被容易地适应。
可能使用自助模型实现利用本发明的系统,这使得客户网络管理员能够备份和恢复客户端系统。在该情况下,网络管理员会经由诸如上述基于web的实现方式之类的界面访问该服务。替换地,可以实现集中管理,来卸载客户端的备份职责。对于IDC服务器群组、以及对于与DataCenter技术的操作系统相结合来讲,这样的系统会是很有用的。此外,所述系统可以利用众多其它开放标准,诸如XML/SOAP,HTTP,和FTP。
图4示出了在图3中给出的系统概述中的备份子系统的更详细的潜在实现方式,其示出了客户端和系统服务器的各种部件。这一附图对应于本发明方法的一种潜在实现方式的更详细的描述(在下文中给出)。
依据所述系统的更详细的潜在实现方式,用户会访问GUI,以便使用附加的进度表配置备份作业。这一备份作业会包含待备份文件/目录、OS具体备份选项和进度表选项的选择。当备份被人工执行、或者被所述进度表引起的时候:
(I)文件系统扫描产生目标服务器300上现有的、并且将被作为“当前_备份”表存储在本地数据库404中的文件。为这一表中的每一文件,存储所述文件的位置、属性和最后修改时间。
(II)接下来,将所述表“当前_备份”与存储有先前备份历史的、数据库404中的表“先前_备份”相比较。比较结果会是已经改变了最后修改时间的文件。
(III)产生所述改变文件的内容校验和、并将其存储在本地数据库404中的“当前_备份”表中。
(IV)然后对照在中央存储服务器400上的中央数据库408中物理地驻留的、校验和的全局库,校验这些校验和。这一校验的结果集合是遗漏的校验和的列表。
(V)这些遗留的校验和代表需要被传输给中央存储服务器400的文件。具有遗漏的校验和的每一文件将有一个备份过程,所述备份过程包括与存储服务器的数据同步、其内容的物理传输、压缩、加密以及在所述不同阶段期间的完整性校验,以便保证文件的成功接收。
(VI)当已经成功地备份所述文件的时候,所述文件将被标记为在本地数据库404中成功地备份。
(VII)在所述备份过程之后,客户端和存储服务器400之间的数据同步为所有目标服务器(客户端)产生中央备份历史。
基于所述备份历史被存储的不同位置,可以以多种方式执行所述恢复过程。作为默认,从本地数据库404中存储的历史执行恢复。由操作员选择文件的先前备份集合的子集。这一列表为每一文件包含:原始位置,内容密钥,和文件属性。基于这一信息,代理可以从库中获得该文件,对该内容进行解压缩和解密,将所述文件恢复到其原始位置,继之以恢复关于所述恢复文件的属性。
恢复文件的第二种方式是从快照文件获得备份历史。这是一个纯文本文件,在备份过程期间被创建,并且包含一个文件列表。在备份期间,紧挨着每一文件的原始位置存储了内容密钥和文件属性。当我们将这样一种文件提供给客户端计算机上的代理的时候,所述代理能够基于上述说明恢复这些文件。
还可以从存储在中央数据库408中的备份历史创建快照文件,其驻留在中央存储服务器400上。

Claims (17)

1.一种用于判定目标计算机(300)上的特定文件是否应该被备份到中央存储系统(400)的方法,所述方法包括步骤:
根据所述特定文件的内容计算特定散列密钥;
验证所述特定散列密钥是否已经存在于本地数据库(404)中,其中,所述本地数据库为所述目标计算机(300)上的、先前已经被备份的每一计算机文件包括一个记录,所述记录包括:
根据所述计算机文件计算的文件散列密钥;以及
在所述目标计算机中的、所述计算机文件应该被恢复到那里的本地文件路径,所述文件路径与所述文件散列密钥相关联;
如果所述特定散列密钥没有存在于所述本地数据库中,则通过执行以下步骤对所述特定文件进行备份:
A.创建备份文件,所述备份文件是所述特定文件的复制;
B.将所述备份文件重命名为所述特定散列密钥;
C.将所述重命名的备份文件存储在所述中央存储系统(400)中;以及
D.在所述本地数据库(404)中存储一个新记录,该新记录包括所述特定散列密钥和在所述目标计算机(300)中的、所述特定文件应该被恢复到那里的特定路径;以及
如果所述特定散列密钥存在于所述本地数据库(404)中,则不将所述特定文件备份到所述中央存储系统(400)中。
2.如权利要求1所述的方法,进一步包括步骤:
验证所述特定散列密钥是否已经存在于根据已经被备份在所述中央存储系统(400)中的计算机文件所导出的文件散列密钥的至少一个中央数据库(408)中;以及
当且仅当所述特定散列密钥没有存在于所述中央存储系统(400)的所述至少一个中央数据库(408)中,才对所述特定文件进行备份。
3.如权利要求2所述的方法,其中所述目标计算机(300)与LAN连接,并且进一步来讲,其中所述中央存储系统(400)通过WAN与所述LAN连接。
4.如权利要求1至3之一所述的方法,其中多个目标计算机(300)与所述中央存储系统(400)连接,并且进一步来讲,其中如果作为从任一目标计算机进行的一次备份的结果,所述特定文件已经存在于所述中央存储系统中,则不备份所述特定文件。
5.如权利要求4所述的方法,其中所述重命名的备份文件在所述中央存储系统(400)中的位置取决于所述特定散列密钥。
6.如权利要求5所述的方法,其中所述中央存储系统包括多个存储设备(414a,414b,414n)。
7.一种用于将特定文件恢复到目标计算机(300)的方法,所述方法包括步骤:
从为每一已备份的计算机文件存储一个先前计算的散列密钥的本地数据库(404)中请求对应于所述特定文件的特定散列密钥;
从所述本地数据库(404)请求与所述特定散列密钥相关联的特定路径位置;
使用所述特定散列密钥从中央存储服务器(400)中检索备份文件,所述备份文件是所述特定文件的复制;以及
将所述备份文件保存到所述目标计算机(300)上的所述特定路径位置。
8.如权利要求7所述的方法,其中在所述中央存储服务器中已经存储了所述备份文件的位置取决于所述散列密钥。
9.如权利要求8所述的方法,其中所述备份文件已经在所述中央存储服务器中被存储在其下的名称取决于所述散列密钥。
10.一种用于备份目标计算机(300)上的特定文件的系统,包括:
用于根据所述特定文件的内容计算特定散列密钥的装置;
用于验证所述特定散列密钥是否已经存在于本地数据库(404)中的装置,其中,所述本地数据库为所述目标计算机(300)上的、先前已经被备份的每一计算机文件包括一个记录,所述记录包括:
根据所述计算机文件计算的文件散列密钥;以及
在所述目标计算机中的、所述计算机文件应该被恢复到那里的本地文件路径,所述文件路径与所述文件散列密钥相关联;
用于在所述特定散列密钥没有存在于所述本地数据库中的情况下对所述特定文件进行备份的装置,所述备份包括以下步骤:
A.创建备份文件,所述备份文件是所述特定文件的复制;
B.将所述备份文件重命名为所述特定散列密钥;
C.将所述重命名的备份文件存储在所述中央存储系统(400)中;以及
D.在所述本地数据库(404)中存储一个新记录,该新记录包括所述特定散列密钥和在所述目标服务器中的、所述特定文件应该被恢复到那里的特定路径;
其中,如果所述特定散列密钥存在于所述本地数据库(404)中,则不备份所述特定文件。
11.如权利要求10所述的系统,是一个中央存储系统,并且进一步包括用于验证所述特定散列密钥是否已经存在于所述中央存储系统(400)的至少一个中央数据库(408)中的装置,所述中央数据库(408)包括根据已经被备份在所述中央存储系统中的计算机文件所导出的文件散列密钥,其中仅当所述特定散列密钥没有存在于所述至少一个中央数据库中时,才执行所述用于备份的装置。
12.如权利要求11所述的系统,其特征在于所述目标计算机与LAN连接,并且进一步来讲,其中所述中央存储系统通过WAN与所述LAN连接。
13.如权利要求10至12之一所述的中央存储系统,其中多个目标计算机与所述中央存储系统连接,并且进一步来讲,其中如果作为从任一目标计算机进行的一次备份的结果,所述特定文件已经存在于所述中央存储系统中,则不备份所述特定文件。
14.如权利要求13所述的中央存储系统,其中所述重命名的备份文件在所述中央存储系统(400)中的位置取决于所述特定散列密钥。
15.如权利要求10至12之一所述的中央存储系统,进一步包括用于将所述特定文件从所述中央存储系统(400)恢复到所述目标计算机(300)的装置,包括:
用于从所述中央数据库请求对应于所述特定文件的特定散列密钥的装置;
用于从所述本地数据库和所述中央数据库之一请求与所述特定散列密钥相关联的特定路径位置的装置;
用于使用所述特定散列密钥从所述系统检索所述备份文件的装置;以及
用于将在所述目标计算机上的所述备份文件保存到所述特定路径位置的装置。
16.如权利要求15所述的系统,其中在所述备份期间,如果所述特定散列密钥没有存在于所述本地数据库(404)中,则在将所述备份文件存储到所述中央存储系统中之前,将所述备份文件重命名为所述特定散列密钥,并且进一步来讲,其中在所述恢复期间,在将所述备份文件保存到所述目标计算机之前,将所述备份文件重命名为所述特定文件的名称。
17.一种存储在计算机可用介质上的计算机程序产品,包括计算机可读程序装置,用于令所述计算机执行权利要求1至9之一中的步骤。
CNB028161971A 2001-08-20 2002-03-08 高效的计算机文件备份系统和方法 Expired - Lifetime CN1294514C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP01120041.7 2001-08-20
EP01120041 2001-08-20

Publications (2)

Publication Number Publication Date
CN1543617A true CN1543617A (zh) 2004-11-03
CN1294514C CN1294514C (zh) 2007-01-10

Family

ID=8178374

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB028161971A Expired - Lifetime CN1294514C (zh) 2001-08-20 2002-03-08 高效的计算机文件备份系统和方法

Country Status (7)

Country Link
US (2) US7254596B2 (zh)
EP (1) EP1419457B1 (zh)
JP (1) JP4446738B2 (zh)
CN (1) CN1294514C (zh)
AU (1) AU2002304842A1 (zh)
HK (1) HK1069651A1 (zh)
WO (1) WO2003019412A2 (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100357901C (zh) * 2005-12-21 2007-12-26 华为技术有限公司 一种主设备和备份设备之间数据核查的方法
CN102236588A (zh) * 2010-04-23 2011-11-09 阿里巴巴集团控股有限公司 数据远程备份方法、设备及系统
CN102360320A (zh) * 2011-09-30 2012-02-22 奇智软件(北京)有限公司 一种基于云架构的终端备份对象共享恢复方法
CN102495772A (zh) * 2011-09-30 2012-06-13 奇智软件(北京)有限公司 一种基于特征的终端程序云备份及恢复方法
CN103500127A (zh) * 2011-09-30 2014-01-08 北京奇虎科技有限公司 终端程序云备份及恢复方法
CN105593839A (zh) * 2013-12-17 2016-05-18 日立数据系统公司 分布式灾难恢复文件同步服务器系统
CN107797889A (zh) * 2017-11-14 2018-03-13 北京思特奇信息技术股份有限公司 一种检验系统文件备份完整性的方法和装置
CN108038028A (zh) * 2017-12-13 2018-05-15 江苏神州信源系统工程有限公司 文件备份方法、装置及文件还原方法、装置

Families Citing this family (79)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3800527B2 (ja) * 2002-05-30 2006-07-26 インターナショナル・ビジネス・マシーンズ・コーポレーション ネットワークを利用したデータのバックアップ技術
US8402001B1 (en) * 2002-10-08 2013-03-19 Symantec Operating Corporation System and method for archiving data
US8943024B1 (en) 2003-01-17 2015-01-27 Daniel John Gardner System and method for data de-duplication
US8375008B1 (en) 2003-01-17 2013-02-12 Robert Gomes Method and system for enterprise-wide retention of digital or electronic data
WO2005041043A1 (ja) * 2003-10-22 2005-05-06 Olympus Corporation ファイル生成方法及びファイル検索方法
GB2413654B (en) * 2004-04-29 2008-02-13 Symbian Software Ltd A method of backing up and restoring data in a computing device
US7809898B1 (en) * 2004-05-18 2010-10-05 Symantec Operating Corporation Detecting and repairing inconsistencies in storage mirrors
US7330997B1 (en) * 2004-06-03 2008-02-12 Gary Odom Selective reciprocal backup
EP1782210A4 (en) * 2004-07-23 2012-02-01 Emc Corp MONITORING MODIFIED OBJECTS BETWEEN COMPUTER SAFEGUARD OPERATIONS
US20060212439A1 (en) * 2005-03-21 2006-09-21 Microsoft Corporation System and method of efficient data backup in a networking environment
US7802134B1 (en) * 2005-08-18 2010-09-21 Symantec Corporation Restoration of backed up data by restoring incremental backup(s) in reverse chronological order
US8930402B1 (en) * 2005-10-31 2015-01-06 Verizon Patent And Licensing Inc. Systems and methods for automatic collection of data over a network
JP2007140887A (ja) * 2005-11-18 2007-06-07 Hitachi Ltd ストレージシステム、ディスクアレイ装置、ボリューム提示方法及びデータ一致性確認方法
US7441092B2 (en) * 2006-04-20 2008-10-21 Microsoft Corporation Multi-client cluster-based backup and restore
US8478755B2 (en) * 2006-04-20 2013-07-02 Microsoft Corporation Sorting large data sets
KR101381551B1 (ko) 2006-05-05 2014-04-11 하이버 인크 그룹 기반의 완료 및 증분 컴퓨터 파일 백업 시스템, 프로세스 및 장치
US7844581B2 (en) * 2006-12-01 2010-11-30 Nec Laboratories America, Inc. Methods and systems for data management using multiple selection criteria
US8041641B1 (en) * 2006-12-19 2011-10-18 Symantec Operating Corporation Backup service and appliance with single-instance storage of encrypted data
US8850140B2 (en) * 2007-01-07 2014-09-30 Apple Inc. Data backup for mobile device
US20080294453A1 (en) * 2007-05-24 2008-11-27 La La Media, Inc. Network Based Digital Rights Management System
US8209540B2 (en) * 2007-06-28 2012-06-26 Apple Inc. Incremental secure backup and restore of user settings and data
US8615490B1 (en) 2008-01-31 2013-12-24 Renew Data Corp. Method and system for restoring information from backup storage media
US9766983B2 (en) 2008-03-05 2017-09-19 Ca, Inc. Proximity and in-memory map based signature searching for duplicate data
US8751561B2 (en) * 2008-04-08 2014-06-10 Roderick B. Wideman Methods and systems for improved throughput performance in a distributed data de-duplication environment
US9098495B2 (en) * 2008-06-24 2015-08-04 Commvault Systems, Inc. Application-aware and remote single instance data management
US8060476B1 (en) * 2008-07-14 2011-11-15 Quest Software, Inc. Backup systems and methods for a virtual computing environment
US8046550B2 (en) 2008-07-14 2011-10-25 Quest Software, Inc. Systems and methods for performing backup operations of virtual machine files
US8135930B1 (en) 2008-07-14 2012-03-13 Vizioncore, Inc. Replication systems and methods for a virtual computing environment
US8392361B2 (en) * 2008-08-11 2013-03-05 Vmware, Inc. Centralized management of virtual machines
US8209343B2 (en) * 2008-10-06 2012-06-26 Vmware, Inc. Namespace mapping to central storage
US8171278B2 (en) * 2008-08-11 2012-05-01 Vmware, Inc. Booting a computer system from central storage
US8429649B1 (en) 2008-09-25 2013-04-23 Quest Software, Inc. Systems and methods for data management in a virtual computing environment
US8495032B2 (en) * 2008-10-01 2013-07-23 International Business Machines Corporation Policy based sharing of redundant data across storage pools in a deduplicating system
CN101414277B (zh) * 2008-11-06 2010-06-09 清华大学 一种基于虚拟机的按需增量恢复容灾系统及方法
US8055614B1 (en) * 2008-12-23 2011-11-08 Symantec Corporation Method and apparatus for providing single instance restoration of data files
JP5294014B2 (ja) * 2008-12-26 2013-09-18 株式会社日立製作所 ファイル共有方法、計算機システム及びジョブスケジューラ
US8161255B2 (en) * 2009-01-06 2012-04-17 International Business Machines Corporation Optimized simultaneous storing of data into deduplicated and non-deduplicated storage pools
US20100215175A1 (en) * 2009-02-23 2010-08-26 Iron Mountain Incorporated Methods and systems for stripe blind encryption
US8397051B2 (en) * 2009-02-23 2013-03-12 Autonomy, Inc. Hybrid hash tables
US8090683B2 (en) * 2009-02-23 2012-01-03 Iron Mountain Incorporated Managing workflow communication in a distributed storage system
US8145598B2 (en) * 2009-02-23 2012-03-27 Iron Mountain Incorporated Methods and systems for single instance storage of asset parts
US9792384B2 (en) * 2009-02-26 2017-10-17 Red Hat, Inc. Remote retreival of data files
US8806062B1 (en) * 2009-03-27 2014-08-12 Symantec Corporation Adaptive compression using a sampling based heuristic
EP2237170A1 (en) * 2009-03-31 2010-10-06 BRITISH TELECOMMUNICATIONS public limited company Data sorage system
EP2237144A1 (en) * 2009-03-31 2010-10-06 BRITISH TELECOMMUNICATIONS public limited company Method of remotely storing data and related data storage system
US8996468B1 (en) 2009-04-17 2015-03-31 Dell Software Inc. Block status mapping system for reducing virtual machine backup storage
US8171202B2 (en) * 2009-04-21 2012-05-01 Google Inc. Asynchronous distributed object uploading for replicated content addressable storage clusters
US8255365B2 (en) * 2009-06-08 2012-08-28 Symantec Corporation Source classification for performing deduplication in a backup operation
US9058298B2 (en) * 2009-07-16 2015-06-16 International Business Machines Corporation Integrated approach for deduplicating data in a distributed environment that involves a source and a target
US9778946B2 (en) 2009-08-07 2017-10-03 Dell Software Inc. Optimized copy of virtual machine storage files
WO2011075610A1 (en) * 2009-12-16 2011-06-23 Renew Data Corp. System and method for creating a de-duplicated data set
US9032243B2 (en) * 2010-01-27 2015-05-12 International Business Machines Corporation Target operating system and file system agnostic bare-metal restore
US9569446B1 (en) 2010-06-08 2017-02-14 Dell Software Inc. Cataloging system for image-based backup
US8898114B1 (en) 2010-08-27 2014-11-25 Dell Software Inc. Multitier deduplication systems and methods
CN101945156B (zh) * 2010-09-01 2014-04-16 惠州Tcl移动通信有限公司 一种移动终端数据信息的备份方法及装置
EP2455922B1 (fr) 2010-11-17 2018-12-05 Inside Secure Procédé et système de transaction NFC
US8683026B2 (en) 2010-12-08 2014-03-25 International Business Machines Corporation Framework providing unified infrastructure management for polymorphic information technology (IT) functions across disparate groups in a cloud computing environment
US8661259B2 (en) * 2010-12-20 2014-02-25 Conformal Systems Llc Deduplicated and encrypted backups
US10049116B1 (en) * 2010-12-31 2018-08-14 Veritas Technologies Llc Precalculation of signatures for use in client-side deduplication
KR20130133243A (ko) 2011-01-07 2013-12-06 톰슨 라이센싱 온라인 저장을 위한 장치 및 방법, 송신 장치 및 방법, 및 수신 장치 및 방법
US8874520B2 (en) 2011-02-11 2014-10-28 Symantec Corporation Processes and methods for client-side fingerprint caching to improve deduplication system backup performance
CN102841897B (zh) * 2011-06-23 2016-03-02 阿里巴巴集团控股有限公司 一种实现增量数据抽取的方法、装置及系统
CN102622394A (zh) * 2011-11-28 2012-08-01 江苏奇异点网络有限公司 可编辑文档的局域网备份方法
US8959605B2 (en) 2011-12-14 2015-02-17 Apple Inc. System and method for asset lease management
US9311375B1 (en) 2012-02-07 2016-04-12 Dell Software Inc. Systems and methods for compacting a virtual machine file
US9262423B2 (en) * 2012-09-27 2016-02-16 Microsoft Technology Licensing, Llc Large scale file storage in cloud computing
US9495379B2 (en) 2012-10-08 2016-11-15 Veritas Technologies Llc Locality aware, two-level fingerprint caching
CN103365996B (zh) * 2013-07-12 2017-11-03 北京奇虎科技有限公司 文件管理及处理方法、装置和系统
US20150082054A1 (en) * 2013-08-21 2015-03-19 Venux LLC System and Method for Establishing a Secure Digital Environment
CN103645905B (zh) * 2013-12-20 2017-08-08 北京中电普华信息技术有限公司 一种增量数据获取方法及装置
JP6269174B2 (ja) 2014-03-05 2018-01-31 富士通株式会社 データ処理プログラム、データ処理装置及びデータ処理方法
US10762074B2 (en) * 2015-10-20 2020-09-01 Sanjay JAYARAM System for managing data
CN106302641B (zh) * 2016-07-27 2019-10-01 北京小米移动软件有限公司 一种上传文件的方法、装置和系统
CN108255640B (zh) * 2017-12-15 2021-11-02 云南省科学技术情报研究院 分布式存储中冗余数据快速恢复方法及装置
US10630602B1 (en) 2018-10-08 2020-04-21 EMC IP Holding Company LLC Resource allocation using restore credits
US11201828B2 (en) 2018-10-08 2021-12-14 EMC IP Holding Company LLC Stream allocation using stream credits
US11005775B2 (en) * 2018-10-08 2021-05-11 EMC IP Holding Company LLC Resource allocation using distributed segment processing credits
US11184423B2 (en) 2018-10-24 2021-11-23 Microsoft Technology Licensing, Llc Offloading upload processing of a file in a distributed system using a key that includes a hash created using attribute(s) of a requestor and/or the file
CN110515765B (zh) * 2019-07-31 2022-04-22 苏州浪潮智能科技有限公司 一种许可证密钥获取方法及装置、存储系统

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5202982A (en) * 1990-03-27 1993-04-13 Sun Microsystems, Inc. Method and apparatus for the naming of database component files to avoid duplication of files
US5301286A (en) * 1991-01-02 1994-04-05 At&T Bell Laboratories Memory archiving indexing arrangement
EP0706686B1 (en) * 1993-07-01 1998-10-14 Legent Corporation System and method for distributed storage management on networked computer systems
WO1996025801A1 (en) * 1995-02-17 1996-08-22 Trustus Pty. Ltd. Method for partitioning a block of data into subblocks and for storing and communicating such subblocks
US5778395A (en) * 1995-10-23 1998-07-07 Stac, Inc. System for backing up files from disk volumes on multiple nodes of a computer network
US5754844A (en) * 1995-12-14 1998-05-19 Sun Microsystems, Inc. Method and system for accessing chunks of data using matching of an access tab and hashing code to generate a suggested storage location
WO1999009480A1 (en) * 1997-07-29 1999-02-25 Telebackup Systems, Inc. Method and system for nonredundant backup of identical files stored on remote computers
EP0899662A1 (en) * 1997-08-29 1999-03-03 Hewlett-Packard Company Backup and restore system for a computer network
US6374266B1 (en) * 1998-07-28 2002-04-16 Ralph Shnelvar Method and apparatus for storing information in a data processing system
JP2000200208A (ja) 1999-01-06 2000-07-18 Fujitsu Ltd ファイルバックアップ方法,装置およびそのプログラム記録媒体
US6513051B1 (en) * 1999-07-16 2003-01-28 Microsoft Corporation Method and system for backing up and restoring files stored in a single instance store
US6526418B1 (en) * 1999-12-16 2003-02-25 Livevault Corporation Systems and methods for backing up data files
US6971018B1 (en) * 2000-04-28 2005-11-29 Microsoft Corporation File protection service for a computer system

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100357901C (zh) * 2005-12-21 2007-12-26 华为技术有限公司 一种主设备和备份设备之间数据核查的方法
CN102236588A (zh) * 2010-04-23 2011-11-09 阿里巴巴集团控股有限公司 数据远程备份方法、设备及系统
CN102360320A (zh) * 2011-09-30 2012-02-22 奇智软件(北京)有限公司 一种基于云架构的终端备份对象共享恢复方法
CN102495772A (zh) * 2011-09-30 2012-06-13 奇智软件(北京)有限公司 一种基于特征的终端程序云备份及恢复方法
CN103500127A (zh) * 2011-09-30 2014-01-08 北京奇虎科技有限公司 终端程序云备份及恢复方法
CN103500127B (zh) * 2011-09-30 2016-11-02 北京奇虎科技有限公司 终端程序云备份及恢复方法
CN105593839A (zh) * 2013-12-17 2016-05-18 日立数据系统公司 分布式灾难恢复文件同步服务器系统
CN105593839B (zh) * 2013-12-17 2018-08-28 日立数据管理有限公司 分布式灾难恢复文件同步服务器系统
CN107797889A (zh) * 2017-11-14 2018-03-13 北京思特奇信息技术股份有限公司 一种检验系统文件备份完整性的方法和装置
CN107797889B (zh) * 2017-11-14 2021-05-04 北京思特奇信息技术股份有限公司 一种检验系统文件备份完整性的方法和装置
CN108038028A (zh) * 2017-12-13 2018-05-15 江苏神州信源系统工程有限公司 文件备份方法、装置及文件还原方法、装置
CN108038028B (zh) * 2017-12-13 2021-03-23 北信源系统集成有限公司 文件备份方法、装置及文件还原方法、装置

Also Published As

Publication number Publication date
US7254596B2 (en) 2007-08-07
EP1419457A2 (en) 2004-05-19
WO2003019412A3 (en) 2003-10-30
JP2005501342A (ja) 2005-01-13
AU2002304842A1 (en) 2003-03-10
US20080034021A1 (en) 2008-02-07
HK1069651A1 (en) 2005-05-27
CN1294514C (zh) 2007-01-10
US20040236803A1 (en) 2004-11-25
EP1419457B1 (en) 2012-07-25
WO2003019412A2 (en) 2003-03-06
JP4446738B2 (ja) 2010-04-07
US7752171B2 (en) 2010-07-06

Similar Documents

Publication Publication Date Title
CN1294514C (zh) 高效的计算机文件备份系统和方法
US11755590B2 (en) Data connector component for implementing integrity checking, anomaly detection, and file system metadata analysis
US9135264B2 (en) Distributed catalog, data store, and indexing
US8041677B2 (en) Method and system for data backup
US9841898B2 (en) Subsegmenting for efficient storage, resemblance determination, and transmission
US8326896B2 (en) System and program for storing data for retrieval and transfer
CN1230747C (zh) 用于备份和恢复计算机数据的方法和装置
EP1975800B1 (en) Replication and restoration of single-instance storage pools
US7992037B2 (en) Scalable secondary storage systems and methods
US7680998B1 (en) Journaled data backup during server quiescence or unavailability
US5765173A (en) High performance backup via selective file saving which can perform incremental backups and exclude files and uses a changed block signature list
JP4075203B2 (ja) データバックアップシステム
US20070094312A1 (en) Method for managing real-time data history of a file system
US20020194340A1 (en) Enterprise storage resource management system
CN104932956A (zh) 一种面向大数据的云容灾备份方法
CN104813276A (zh) 从备份系统流式恢复数据库
US20220138151A1 (en) Sibling object generation for storing results of operations performed upon base objects
CN101901173A (zh) 一种灾备系统及灾备方法
EP3995964A1 (en) Data connector component for implementing integrity checking, anomaly detection, and file system metadata analysis

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1069651

Country of ref document: HK

C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1069651

Country of ref document: HK

ASS Succession or assignment of patent right

Owner name: SYMANTEC CORP.

Free format text: FORMER OWNER: DATACT TECHNOLOGIES N. V.

Effective date: 20110923

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20110923

Address after: American California

Patentee after: Symantec Corp.

Address before: Belgium Los Christie

Patentee before: Datact Technologies N. V.

CX01 Expiry of patent term

Granted publication date: 20070110

CX01 Expiry of patent term