CN105940379A - 基线安装的备份 - Google Patents
基线安装的备份 Download PDFInfo
- Publication number
- CN105940379A CN105940379A CN201580006191.5A CN201580006191A CN105940379A CN 105940379 A CN105940379 A CN 105940379A CN 201580006191 A CN201580006191 A CN 201580006191A CN 105940379 A CN105940379 A CN 105940379A
- Authority
- CN
- China
- Prior art keywords
- data block
- backup
- calculating equipment
- reference document
- advance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000009434 installation Methods 0.000 title 1
- 238000000034 method Methods 0.000 claims abstract description 24
- 238000005516 engineering process Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000001172 regenerating effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1402—Saving, restoring, recovering or retrying
- G06F11/1446—Point-in-time backing up or restoration of persistent data
- G06F11/1448—Management of the data involved in backup or backup restore
- G06F11/1453—Management of the data involved in backup or backup restore using de-duplication of the data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1402—Saving, restoring, recovering or retrying
- G06F11/1446—Point-in-time backing up or restoration of persistent data
- G06F11/1458—Management of the backup or restore process
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/1097—Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
一种备份计算设备的方法,包括:在计算设备的任何首次备份之前,将选择的预先填入的引用文件存储在计算设备中,该引用文件包括对被存储在计算设备中的数据块中的至少一些数据块的一个或多个引用。然后,可以发起首次备份。首次备份可以使对计算设备中的未被表示在预先填入的引用文件中的数据块的引用被添加到引用文件。然后,与所添加的引用相对应的数据块可以通过计算机网络被发送至备份服务器。
Description
背景技术
随着企业数据增长的加速,各组织奋力寻找更有效的方式来管理该数据。一种用于控制数据增长的新兴的方法是删除重复数据。删除重复数据技术与备份尤其有关,因为尽管小心地使用差异和增量式备份策略,但是一部分备份仍然包括重复的数据。
附图说明
图1是在其中可以实施实施例的环境的框图。
图2是示出了一个实施例的方面的框图。
图3是示出了一个实施例的方面的框图。
图4是根据一个实施例的方法的流程图。
具体实施方式
当发布/出售新的计算设备(包括但不限于:例如,台式计算机、膝上型计算机、平板计算机、智能手机、服务器、网络附加存储(NAS))时,其通常具有操作系统(例如,Windows或Mac OS)和多个应用。在该方面中,新发布的或出售的计算设备可能是与另一个计算设备非常相似的计算设备。例如,在企业市场中,由IT部门新发布的计算设备可以具有诸如微软Windows的操作系统、某个数据库软件、电子邮件客户端和工作效率套件。由于很多数据通常已经被存储在新的或新配置的计算设备上,所以就时间和带宽二者而言,对其的初始完全备份是代价高昂的。
在数据被存储、备份或归档时,删除重复(还被称为“重复数据删除技术(dedupe)”)去除重复的信息。重复数据删除技术过程可以按照文件级和/或按照子文件或字节级执行,在按照文件级执行时,重复的文件是利用指向文件的一个副本的标记符来代替的,在按照子文件或字节级执行时,重复的数据字节被删除并且被引用所代替,导致存储容量需求的显著减少。
删除重复数据是一种通过识别和消除冗余数据来减少数据量的技术。为了支持基于数据块的删除重复,早期的用于单一实例存储的基于文件粒度的删除重复的技术大部分已经消失,在基于数据块的删除重复中,文件被表示为多个块。将文件的每个数据块与已知的数据块进行比较。如果数据块先前已经被存储,那么该数据块就仅仅被引用,而不是被再次存储。然后,被存储仅一次的每个数据块可以使用编码技术来压缩。
图1是在其中可以实施实施例的示例性环境的框图。如其中示出的,服务器(例如,备份服务器)62可以被耦合或者以其它方式被配置为接入网络60。服务器62可以如图1中示出的直接地或通过网络60被耦合至存储64。存储64可以包括非暂时性的有形存储,其包括例如,硬盘驱动器、固态存储,或者包括硬盘和固态存储二者的混合存储。存储64可以被配置例如作为网络附加存储(NAS)、直接附加存储(DAC)、独立磁盘冗余阵列(RAID),和/或可以被不同地配置。根据一个实施例,存储64可以被配置为存储备份,而服务器62可以被配置为处理备份或者以其它方式执行或体现本文描述的功能。在52、54和56处示出了多个客户端计算设备。计算设备52、54和56可以通过网络60被耦合至备份服务器。根据一个实施例,计算设备52、54和56可以被配置为向备份服务器62发送要被备份的数据的数据块,用于进行处理。计算设备52、54或56中的一个或多个可以被耦合至如58处示出的外部存储。例如,外部存储58可以被配置作为NAS、DAC或RAID,并且可以被直接地耦合至计算设备或可以通过网络60由计算设备可访问。计算设备52、54和56的任何一个还可以被配置为处理备份,或者以其它方式执行或体现本文描述的功能。计算设备52、54、56和/或备份服务器62可以包括例如与处理器202相通信的存储器203。处理器202可以被耦合至存储,所述存储可以包括例如,磁盘或其它旋转介质、非易失性半导体存储器或其混合。根据一个实施例,处理器202可以被配置为执行指令序列,所述指令序列实现本文描述和示出的功能和方法。
图2是示出了一个实施例的方面的框图。如其中示出的,每个备份客户端(例如,图1中的计算设备52-56)可以存储或以其它方式使用引用文件,所述引用文件包括对数据块的引用。在服务器侧,这些数据块可以被存储在唯一数据块池102中。根据一个实施例,这些引用包括块标识符(下文的块ID)。根据一个实施例,引用文件可以包括块ID(其可以包括例如,复数多项式和哈希值的结果,例如,MD5)和大小。由于在标识符与唯一的数据块之间存在一一对应的关系,所以唯一的块ID可以被配置,使得它们尽可能地全局唯一。然而,相同的数据块可以被标识有相同的块标识符。然而,在一个实施例中,单一的块ID一定不能指代两个或更多个不同的数据块。实施例存储引用(在一个实施例中是块ID),其引用被存储在备份客户端上的引用文件中的单独存储的块,而不是哪怕将数据的压缩版本作为备份存储在客户端或服务器上。相似的但是不同的引用文件可以被存储在如102处示出的服务器侧。例如并且参照图2,第一备份客户端可以存储引用文件1,其可以包括对块B21、B13、B18、B51和B2的引用。这些块可以不被存储在客户端中,但是可以被存储在图2的服务器侧处的唯一数据块池102中。唯一数据块池102可以被存储在备份服务器中,或者可以通过计算机网络以其它方式对于备份服务器可访问。
例如,注意到的是,对数据块2的引用(BLKID2)存在于备份客户端1和3二者的引用文件中。然而,唯一块池102不需要存储数据块2的两个实例。实际上,唯一数据块池102可以被配置为包括引用文件内的各引用所引用的每个唯一块的单一实例。唯一数据块池102内的块中的一个或多个块可以在引用文件中被提及一次,并且唯一数据块池102内的块中的一个或多个块可以在一个以上的引用文件中被提及或表示。例如,与备份客户端1和备份客户端3相关联的引用文件1和引用文件3二者存储对块B2的引用,块B2的单一实例被存储在唯一数据块池102中。在图2中示出的客户端侧中的每个备份客户端处创建并且适当地更新单一引用文件。以该方式,引用文件1可以与第一备份客户端相关联,引用文件2可以与第二备份客户端相关联,引用文件3可以与第三备份客户端相关联以及引用文件4可以与第四备份客户端相关联,依此类推。
服务器侧还可以存储或使用如104处示出的引用文件。然而,服务器侧的引用文件104可以被配置地与备份客户端中的每个中的引用文件稍微不同。虽然每个备份客户端的引用文件可以包括对每个备份的数据块的引用(例如,BKLID),但是服务器侧的引用文件可以被配置为既包括对数据块的引用(例如,BLKID),也包括针对每个被表示的数据块的指针或对唯一数据块池102内的位置的其它引用(例如,偏移)。唯一数据块池内的每个数据块的位置使得备份服务器能够很容易地随意从唯一数据块池102取回数据块。
根据一个实施例,备份客户端引用文件和服务器侧引用文件可以被保持同步,使得备份客户端的引用文件中的每个BLKID在服务器引用文件104中具有相应的条目。如果不再是这样的情况,备份客户端引用文件可以通过重新扫描客户端计算设备并且重新生成备份客户端引用文件来重建。
在将计算设备分配给新员工之前,IT部门可以将计算设备装备有操作系统、一个或多个数据库应用、浏览器、电子邮件客户端和工作效率套件。要被运送给消费者的新的计算设备也可以被类似地配置。在将计算设备交付给其预期的接受者之前或之后,该初始配置可以被调度用于初始备份。这样的计算设备的初始备份可能是相当冗长的,因为其是完全备份。实际上,初始备份可以不仅备份计算设备的操作系统,而且备份被供应给计算设备的任何文件和程序,其中理解的是,稍后的备份很可能是增量备份,其只备份先前未被表示在首次备份中的数据。这或者延迟了对计算设备的交付,或者将首次备份的责任交到计算设备的接受者手中,其可能不是最优的。此外,这样的初始完全备份可能是相当资源密集的(例如,处理器周期、带宽和存储),并且可能降低计算设备的性能,直到首次备份完成为止。
一个实施例将备份引用文件预先填入有对数据块的引用(例如,在一个实施例中是BLKID),使得预先填入的引用文件与一个或多个类似装备的计算设备的引用文件是相同的或类似的。备份引用文件的这种预先填入在进行首次备份时节省了时间和带宽。例如,在首次备份期间,计算设备可以检查最初的引用文件,确定没有数据或很少的数据已经改变,并且只备份由引用文件指示的额外的数据。根据一个实施例,引用文件不需要在每次计算设备被暂时征用时从零开始生成,因为合适的预先填入的引用文件(即,那些引用或多或少准确地代表了被存储于计算设备上的数据的引用文件)可能已经存在。预先填入的引用文件可以是在多个预先存在的和预先填入的引用文件中选择的。
图3示出了多个计算设备,并且这些计算设备均与其它计算设备配置得不同。例如,计算设备304可以具有被存储在其上的某种预先确定的操作系统、应用和数据的组合。该组合可以根据计算设备304的预期的用途由计算设备304的预期的用户和/或由例如公司的IT部门来选择。例如,计算设备302可能预期用于销售人员,并且因此可以被预装入区域跟踪软件、产品规范和应用的工作效率套件。另一计算设备306虽然在规范上与计算设备302以其它方式相类似,但是可能预期用于工程师。因此,计算设备306可以被预装入有建模和设计软件,和/或其它将被预装入计算设备302上的数据。类似地,计算设备304的购买者可能已经预先选择了计算设备供应商的其它供货中不存在的操作系统和应用的特定组合。移动计算设备308均可以被配置得不同。因此,根据一个实施例,这些计算设备302-310中的每个计算设备(或者这些类型的计算设备302-310中的每个计算设备)可以凭借它们的不同的配置(在图3中被标记为CONFIG1、CONFIG2、CONFIG3、CONFIG4和CONFIG5)可以与单独的、不同的和预先存在的引用文件相关联,这些引用文件在图3中被示作引用文件1、引用文件2、引用文件3、引用文件4和引用文件5。根据一个实施例,这些引用文件中的每个引用文件可以包括对被存储在它们各自的计算设备302-310中的数据组块(在本文被称为数据块)的引用(例如,BLKID)。这些引用文件可以被存储在备份服务器中或可以对于备份服务器以其它方式可访问。由引用文件中的引用标识的数据块可以被存储在如图1中的102处示出的唯一数据块池中。
其后,当计算设备302-310中的一者被购买、交付或以其它方式投入使用时,相应的引用文件可以仅仅被存储在所购买的计算设备上。由于新购买的计算设备中的引用文件包括对被存储在计算设备中的数据中的至少一些数据的引用(例如,BLKID),并且由于唯一数据块池102已经存储了由预装入引用文件中的引用提及的每个数据块的样本,所以不需要计算设备的初始完全备份,因为此种实际上已经被执行。创建、复制和存储预先填入的引用文件的动作实际上执行了计算设备的初始完全备份,而任何数据块都不必通过网络被发送给唯一数据块池102。
计算设备存储一些未被表示在由引用文件中的引用提及的数据块中的数据是可能的。然而,在该情况下,下一次备份可以以一个或多个数据块的形式拾取该数据,并且适当地更新计算设备的引用文件具有相应的BLKID或对该数据的其它引用。
其后,在计算设备被交付给其预期的接受者之后,和/或当新的数据块被创建时,只有对新的数据块的引用才需要被添加到预先填入的引用文件,所述新的数据块未被预先填入的引用文件中的相应的引用(例如,BLKID)表示。然后,备份服务可以检查服务器引用文件104是否包括其中的相应的BLKID。如果服务器引用文件104事实上确实包括与新的块ID相对应的条目,那么相应的数据块不需要被发送给备份服务器,因为该数据块的样本已经存在于唯一数据块池102中。然而,如果备份服务检查服务器引用文件104并且未发现对要被备份的新的数据块的相应的引用,那么对新的数据块的引用可以与唯一数据块池中可以找到新的数据块的位置的指针一起,被添加到客户端侧计算设备的引用文件并且被添加到服务器侧引用文件104。在每一步骤处,可以注意确保客户端引用文件与服务器引用文件之间的完整性和同步性。根据一个实施例,唯一数据块池可以被配置作为通用块池(UBP)。
因为在企业领域和消费者市场二者中的许多计算设备的初始配置在机器与机器之间是非常类似的,所以在备份客户端中存储选择的和预先填入的引用文件的动作消除了针对以其它方式要求的初始完全备份的需求。因此,任何这样的计算设备或其它处理设备或机器的首次备份都可能与任何其它相同的或类似的机器的首次备份类似。实际上,相同的数据块将由于首次扫描和备份而创建,相同的引用文件将被构建,并且相同的块中的许多块将被发送到服务器,用于列在唯一数据块池中来存储。因此,一个实施例允许初始完全备份的近似物以引用文件的形式被预先存储在计算设备上,而不需要(或在其它方面比该情况少得多地)向唯一块池102发送任何数据块。其后,首次“实际的”备份只需要对预先填入的引用文件的增量改变,和向远程服务器发送非常有限数量的先前未被表示的数据块。事实上,创建的新的数据块中的一个或多个数据块与过去已经被备份的数据块相同。如果新创建的数据块的唯一标识符存在于服务器侧引用文件104中,那么相应的数据块不需要通过网络被发送给唯一块池102,因为其样本已经存在于其中。
因此,一个实施例包括选择和/或将引用文件预先填入到计算设备(例如,备份客户端)中,其中预先填入的引用文件包括对与例如OS、应用和/或数据文件相对应的数据块的引用。由于新的机器与其内容已经被备份到服务器的其它机器类似,所以不需要将新机器的扫描块发送到备份服务器,因为这样的块已经在那里了。不需要构建引用文件,因为其它类似构成的机器已经被构建了在这种情况下非常可接受地为该新机器服务的引用。例如,如果IT部门针对准备好的七个具有与图3中的计算设备306相同的配置的新的计算设备,那么IT部门将选择引用文件3,并且这七个计算设备中的每个计算设备可以被提供有引用文件3的副本,其中,尽管初始完全备份事实上从未被执行过,但是引用文件3有效地起初始完全备份的结果的作用。因为引用文件3先前已经被创建,所以由引用文件3的组成引用所引用的数据块已经存在于唯一数据块池102中,从而消除了对于再次发送它们的需求。因此,根据一个实施例,新的机器可以被提供有选择的并且预先填入的引用文件,该引用文件实际上意味着已经完成了初始完全备份,而永远不向远程存储服务器发送任何数据块。
根据一个实施例,预先填入的被提供在计算设备上的引用文件可以包括对未被表示在计算设备上的块的一个或多个引用。这仅仅少量地增加了预先填入的引用文件的大小,并且不影响未来的增量备份。在一个实施例中,一个或多个引用与程序或更新相关联,其中预期所述程序或更新将被安装在计算设备上,使得当这些程序或更新在未来被安装时,下次的备份操作更快或者甚至不必要。类似地,计算设备可以存储未被所提供的引用文件中的相应引用表示的数据块。这样的引用文件中的引用或者计算设备上的未被表示的数据块的差异可能是从一个类似的计算设备到下一个类似的计算设备的小的配置差异的结果。任何这样的差异在首次或任何后续增量备份时可以被忽略或被拾取。
因为相似构成的机器之间的差异可能是小的,并且因为任何后续(首次的、实际的)备份可能是相当小的,所以只需要考虑增量变化(该特定机器与其它类似机器的数据块之间的增量)。也就是说,在首次备份时,该预先填入的引用文件只需要被更新具有对未被表示在预先选择的和预先填入的引用文件中的数据块。然后,与那些被添加的引用相对应的数据块可以被发送到服务器。替代地,首次和后续备份均可以创建单独的引用文件版本。只要由引用文件内的构成引用所指向的基础数据块的样本已经存在于唯一数据块池中,新的引用文件的创建就不需要将由引用文件内的构成引用所指向的基础数据块重新发送给唯一数据块池。按照这种方式,只有那些未(由例如相应的BLKID)表示在选择的和预先填入的引用文件中的数据块被添加到引用文件。
因此,从其创建预先填入的引用文件的计算设备与在其上执行首次备份的计算设备之间的相似度可以对首次备份的长度和先前未被表示的块的数量起到制约作用,这些块被发送到备份服务器用于存储在唯一数据块池中。非常相似的计算设备将非常快地完成它们的首次备份,因为预先填入的引用文件可能已经包括了对计算设备上的数据块中的所有数据块或几乎所有数据块的引用。包含较大数量的数据块的计算设备(对所述较大数量的数据块的引用不在预先填入的引用文件中)可能需要相当长的时段来完成,并且可能导致相当大数量的块要被发送到备份服务器,用于包括在被存储在其中的唯一块池中,或对其可访问。应当理解的是,服务器引用文件在每次更新唯一块池时被更新。
如果任何客户端侧引用文件损坏了,那么可以仅仅通过重新扫描计算设备并且重新填入新的引用文件来重构。替代地,预先填入的引用文件(其副本可能已经被保留在安全的位置)可以被用来预先播撒备份过程,从而加速所损坏的引用文件的重构。例如,这样的预先填入的引用文件的副本可以被存储在计算设备本身上、可移动的介质上或从网络位置下载。
根据一个实施例,可以提前准备若干预先填入的引用文件,一个预先填入的引用文件用于每种“类型”的新的计算设备/软件组合或配置,并且适当的引用(例如,指针)可以被预先填入到每种不同“类型”的机器/软件组合的引用文件中。将预先存在的和预先填入的引用文件存储在计算设备中,有效地执行了已经是计算设备的初始完全备份的内容,而无需向备份服务器发送计算设备的任何数据块。显著地,这在首次备份时节省了时间和带宽。其后,在计算设备已经被交付给其预期的用户并且已经生成先前未被表示在计算设备上的数据块之后,可以执行计算设备的首次备份。该首次备份不是初始完全备份,因为初始完全备份已经通过将预先存在的和预先填入的引用文件存储在大容量存储的计算设备中而被有效地执行。实际上,该首次备份可以是增量备份,其仅仅备份类似引用机器/软件组合(如由被存储在其中的所选择的预先填入的引用文件表示的)与新的计算设备/软件组合之间的差异以及在将计算设备交付给其预期的接受者之后和/或在使用计算设备之后可能已经被创建的任何新的数据块。在这样的首次增量备份期间,需要通过计算机网络被发送给备份服务器的数据量和作为结果的数据块数可能是非常小的,因为大部分用户每天只创建几MB的数据。结果,该首次增量备份可以比另外的初始完全备份可能需要的执行得更快。需要注意的是,实施例可以被实现在上文描述的重复数据删除操作的上下文内或结合它们来实现,或者完全单独地和独立地实现。
图4是根据一个实施例的方法的流程图。如其中示出的,备份包括多个数据块的计算设备的方法可以包括:如B41处示出的,在计算设备的首次备份之前,在计算设备中存储选择的预先填入的引用文件,所述引用文件包括对数据块中的至少一些数据块的一个或多个引用。其后,计算设备可以被交付给其预期的用户,然后所述用户可以使用该计算设备,并且生成与新的数据块相对应的新的数据,如B42处建议的。在某个稍后的时间点处,如B43处示出的,可以发起首次备份。根据一个实施例并且如B44处示出的,可以通过将对计算设备中的未被表示在预先填入的引用文件中的数据块的引用添加到引用文件中来发起首次备份。替代地,可以创建新的引用文件,其包括老引用文件的引用中的所有引用和对任何新的或未被表示的数据块的新引用。在B44之前或之后,先前未被表示的数据块或对应于所添加的引用的数据块可以通过计算机网络被发送到备份服务器,如B45处示出的。可以执行检查,以确定服务器引用文件是否已经包含对新的数据块的引用的条目。根据一个实施例,如果包含,则其可以不必发送数据块,用于存储在唯一数据块池中,因为该数据块已经被存储在其中,如由服务器引用文件中的其相应的条目证明的。
根据一个实施例,首次备份是用于仅备份那些对其的引用不存在于所选择的预先填入的引用文件中的数据块的增量备份。如上所述,这样的增量备份可以在不需要执行初始完全备份的情况下被发起。实际上,在首次备份被发起之前,备份服务器包括、存储或以其它方式使用唯一数据块池或其它储存,该唯一数据块池或其它储存包括由被存储在计算设备中的所选择的预先填入的引用文件中的一个或多个引用所引用的数据块。有效地,存储所选择的预先填入的引用文件将计算设备的数据块中的至少一些数据块备份到备份服务器,而不需要通过网络将计算设备的数据块中的任何数据块发送到备份服务器。
根据一个实施例,所预先填入的引用文件可以是根据计算设备的配置从多个预先存在的和预先填入的引用文件中选择的。对数据块中的至少一些数据块的一个或多个引用包括例如对被存储在计算设备上的操作系统、应用程序和/或用户或其它数据的数据块的引用。以该方式,首次备份可以将比已经存在于引用文件中的更少的对计算设备的数据块的引用添加到引用文件。可以在由其预期的用户使用计算设备之前,有利地执行对所选择的预先填入的引用文件的存储。实际上,可以在将计算设备交付给预期的用户之后,在已经在计算设备中创建了先前未存在于计算设备中的数据块之后,执行对计算设备的首次备份的发起。在首次备份期间,根据一个实施例,仅仅与所添加的引用相对应的数据块可以通过计算机网络被发送给备份服务器。
虽然已经描述了本公开内容的某些实施例,但是这些实施例仅通过示例的方式来呈现,而不旨在限制本公开内容的范围。实际上,本文描述的新颖的方法、设备和系统可以用各种各样的其它形式来体现。此外,可以在不背离本公开内容的精神的情况下,以本文描述的方法和系统的形式做出各种省略、替换和改变。所附权利要求及其等效物旨在涵盖如将落入本公开内容的范围和精神内的这样的形式或修改。例如,本领域的技术人员将意识到的是,在各个实施例中,实际的物理和逻辑结构可能与附图中示出的那些不同。根据实施例,在上文的示例中描述的某些步骤可以被去除,可以添加其它步骤。此外,上文公开的具体实施例的特征和属性可以用不同的方式来组合,以形成另外的实施例,实施例中的所有实施例均落入本公开内容的范围之内。尽管本公开内容提供了某些优选的实施例和应用,但是对本领域的普通技术人员而言显而易见的其它实施例,包括未提供本文阐述的特征和优点中的所有特征和优点的实施例,也在本公开内容的范围之内。
Claims (22)
1.一种备份包括多个数据块的计算设备的方法,包括:
在对所述计算设备的首次备份之前,将选择的预先填入的引用文件存储在所述计算设备中,所述选择的预先填入的引用文件包括对所述数据块中的至少一些数据块的一个或多个引用;以及
通过下列操作发起对所述计算设备的所述首次备份:
将对所述计算设备中的未被表示在所述预先填入的引用文件中的数据块的引用添加到所述引用文件;以及
通过计算机网络,将与所添加的引用相对应的所述数据块发送到备份服务器。
2.如权利要求1所述的方法,其中,所述首次备份是用于仅仅备份对其的引用不存在于所述选择的预先填入的引用文件中的那些数据块的增量备份。
3.如权利要求2所述的方法,其中,所述增量备份是在无需执行初始完全备份的情况下发起的。
4.如权利要求1所述的方法,其中,存储所述选择的预先填入的引用文件在无需通过所述网络将所述计算设备的所述数据块中的任何数据块发送到所述备份服务器的情况下,将所述计算设备的所述数据块中的至少一些数据块备份到所述备份服务器。
5.如权利要求1所述的方法,其中,在所述首次备份被发起之前,所述备份服务器包括唯一数据块池,所述唯一数据块池包括由被存储在所述计算设备中的所述选择的预先填入的引用文件中的所述一个或多个引用所引用的数据块。
6.如权利要求1所述的方法,还包括根据所述计算设备的配置,从多个预先存在的和预先填入的引用文件中选择所述预先填入的引用文件。
7.如权利要求1所述的方法,其中,对所述数据块中的至少一些数据块的所述一个或多个引用包括对被存储在所述计算设备上的操作系统、应用程序和用户数据中的至少一项的数据块的引用。
8.如权利要求1所述的方法,其中,添加包括将比已经存在于所述引用文件中的更少的对所述计算设备的数据块的引用添加到所述引用文件。
9.如权利要求1所述的方法,其中,存储所述选择的预先填入的引用文件是在由其预期的用户使用所述计算设备之前执行的。
10.如权利要求1所述的方法,其中,发起对所述计算设备的所述首次备份是在将所述计算设备交付给其预期的用户之后、在先前未存在于所述计算设备中的数据块已经被创建在所述计算设备中之后执行的。
11.如权利要求1所述的方法,其中,发送包括在所述首次备份期间,通过所述计算机网络仅仅将与所添加的引用相对应的所述数据块发送到所述备份服务器。
12.一种包括多个数据块的计算设备,包括:
大容量存储;
处理器,其被连接到所述大容量存储,所述处理器被配置为:
在对所述计算设备的首次备份之前,将选择的预先填入的引用文件存储在所述大容量存储中,所述选择的预先填入的引用文件包括对所述数据块中的至少一些数据块的一个或多个引用;以及
通过下列操作发起对所述计算设备的所述首次备份:
将对所述计算设备中的未被表示在所述预先填入的引用文件中的数据块的引用添加到所述引用文件;以及
通过计算机网络,将与所添加的引用相对应的所述数据块发送到备份服务器。
13.如权利要求12所述的计算设备,其中,所述首次备份是用于仅仅备份对其的引用不存在于所述选择的预先填入的引用文件中的那些数据块的增量备份。
14.如权利要求13所述的计算设备,其中,所述增量备份是在无需执行初始完全备份的情况下发起的。
15.如权利要求12所述的计算设备,其中,所述选择的预先填入的引用文件在无需通过所述网络将所述计算设备的所述数据块中的任何数据块发送到所述备份服务器的情况下,将所述计算设备的所述数据块中的至少一些数据块备份到所述备份服务器。
16.如权利要求12所述的计算设备,其中,在所述首次备份被发起之前,所述备份服务器包括唯一数据块池,所述唯一数据块池包括由被存储在所述计算设备中的所述选择的预先填入的引用文件中的所述一个或多个引用所引用的数据块。
17.如权利要求12所述的计算设备,其中,所述处理器还被配置为:根据所述计算设备的配置,从多个预先存在的和预先填入的引用文件中选择所述预先填入的引用文件。
18.如权利要求12所述的计算设备,其中,对所述数据块中的至少一些数据块的所述一个或多个引用包括对被存储在所述计算设备上的操作系统、应用程序和用户数据中的至少一项的数据块的引用。
19.如权利要求12所述的计算设备,其中,添加包括将比已经存在于所述引用文件中的更少的对所述计算设备的数据块的引用添加到所述引用文件。
20.如权利要求12所述的计算设备,其中,所述处理器还被配置为:在由所述计算设备的预期的用户使用所述计算设备之前,将所述选择的预先填入的引用文件存储在所述大容量存储中。
21.如权利要求12所述的计算设备,其中,所述处理器还被配置为:在由所述计算设备的预期的用户使用所述计算设备之后,在先前未存在于所述计算设备中的数据块已经被创建在所述计算设备中之后,发起对所述计算设备的所述首次备份。
22.如权利要求12所述的计算设备,其中,所述处理器被配置为:在所述首次备份期间,通过所述计算机网络仅仅将与所添加的引用相对应的所述数据块发送到所述备份服务器。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201461934355P | 2014-01-31 | 2014-01-31 | |
US61/934,355 | 2014-01-31 | ||
US14/246,706 | 2014-04-07 | ||
US14/246,706 US9514000B2 (en) | 2014-01-31 | 2014-04-07 | Backup of baseline installation |
PCT/US2015/013534 WO2015116826A1 (en) | 2014-01-31 | 2015-01-29 | Backup of baseline installation |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105940379A true CN105940379A (zh) | 2016-09-14 |
CN105940379B CN105940379B (zh) | 2019-04-26 |
Family
ID=53754915
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201580006191.5A Active CN105940379B (zh) | 2014-01-31 | 2015-01-29 | 基线安装的备份 |
Country Status (4)
Country | Link |
---|---|
US (1) | US9514000B2 (zh) |
EP (1) | EP3100164B1 (zh) |
CN (1) | CN105940379B (zh) |
WO (1) | WO2015116826A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110858123A (zh) * | 2018-08-23 | 2020-03-03 | 华为技术有限公司 | 一种计算备份文件大小的方法及装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6560617B1 (en) * | 1993-07-20 | 2003-05-06 | Legato Systems, Inc. | Operation of a standby server to preserve data stored by a network server |
US20070027937A1 (en) * | 2004-05-21 | 2007-02-01 | Mcgrattan Emma K | Method and apparatus for storage backup |
US20080250085A1 (en) * | 2007-04-09 | 2008-10-09 | Microsoft Corporation | Backup system having preinstalled backup data |
CN103049353A (zh) * | 2012-12-21 | 2013-04-17 | 华为技术有限公司 | 一种数据备份方法及相关装置 |
US20130339307A1 (en) * | 2012-06-14 | 2013-12-19 | International Business Machines Corporation | Managing system image backup |
Family Cites Families (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5765173A (en) * | 1996-01-11 | 1998-06-09 | Connected Corporation | High performance backup via selective file saving which can perform incremental backups and exclude files and uses a changed block signature list |
US7587467B2 (en) | 1999-12-02 | 2009-09-08 | Western Digital Technologies, Inc. | Managed peer-to-peer applications, systems and methods for distributed data access and storage |
US8793374B2 (en) | 1999-12-02 | 2014-07-29 | Western Digital Technologies, Inc. | Managed peer-to-peer applications, systems and methods for distributed data access and storage |
US9191443B2 (en) | 1999-12-02 | 2015-11-17 | Western Digital Technologies, Inc. | Managed peer-to-peer applications, systems and methods for distributed data access and storage |
AU2056401A (en) | 1999-12-02 | 2001-06-12 | Senvid, Inc. | Method, system and service model for remote recording of television programs |
US6499054B1 (en) | 1999-12-02 | 2002-12-24 | Senvid, Inc. | Control and observation of physical devices, equipment and processes by multiple users over computer networks |
US7120692B2 (en) | 1999-12-02 | 2006-10-10 | Senvid, Inc. | Access and control system for network-enabled devices |
US8688797B2 (en) | 1999-12-02 | 2014-04-01 | Western Digital Technologies, Inc. | Managed peer-to-peer applications, systems and methods for distributed data access and storage |
US7934251B2 (en) | 1999-12-02 | 2011-04-26 | Western Digital Technologies, Inc. | Managed peer-to-peer applications, systems and methods for distributed data access and storage |
US7917628B2 (en) | 1999-12-02 | 2011-03-29 | Western Digital Technologies, Inc. | Managed peer-to-peer applications, systems and methods for distributed data access and storage |
US7055008B2 (en) * | 2003-01-22 | 2006-05-30 | Falconstor Software, Inc. | System and method for backing up data |
US7454443B2 (en) | 2003-08-26 | 2008-11-18 | Tamir Ram | Method, system, and program for personal data management using content-based replication |
EP1751745B1 (en) | 2003-11-14 | 2019-07-10 | Western Digital Technologies, Inc. | Managed peer-to-peer applications, systems and methods for distributed data access and storage |
US8209540B2 (en) | 2007-06-28 | 2012-06-26 | Apple Inc. | Incremental secure backup and restore of user settings and data |
US8004791B2 (en) | 2008-02-22 | 2011-08-23 | Western Digital Technologies, Inc. | Information storage device with a bridge controller and a plurality of electrically coupled conductive shields |
US8108638B2 (en) * | 2009-02-06 | 2012-01-31 | International Business Machines Corporation | Backup of deduplicated data |
US20100211983A1 (en) | 2009-02-19 | 2010-08-19 | Pixel8 Networks, Inc. | Virtual private content delivery network and method thereof |
WO2010113167A1 (en) | 2009-03-30 | 2010-10-07 | Hewlett-Packard Development Company L.P. | Deduplication of data stored in a copy volume |
JP4924645B2 (ja) | 2009-03-31 | 2012-04-25 | 富士通株式会社 | ストレージ制御装置、ストレージシステム及びコピー方法。 |
US9058298B2 (en) * | 2009-07-16 | 2015-06-16 | International Business Machines Corporation | Integrated approach for deduplicating data in a distributed environment that involves a source and a target |
US8255661B2 (en) | 2009-11-13 | 2012-08-28 | Western Digital Technologies, Inc. | Data storage system comprising a mapping bridge for aligning host block size with physical block size of a data storage device |
US8285965B2 (en) | 2009-11-20 | 2012-10-09 | Western Digital Technologies, Inc. | Aligning data storage device partition to boundary of physical data sector |
US8526798B2 (en) | 2009-12-23 | 2013-09-03 | Western Digital Technologies, Inc. | Portable content container displaying A/V files in response to a command received from a consumer device |
US8458131B2 (en) | 2010-02-26 | 2013-06-04 | Microsoft Corporation | Opportunistic asynchronous de-duplication in block level backups |
US8631284B2 (en) | 2010-04-30 | 2014-01-14 | Western Digital Technologies, Inc. | Method for providing asynchronous event notification in systems |
US10019741B2 (en) | 2010-08-09 | 2018-07-10 | Western Digital Technologies, Inc. | Methods and systems for a personal multimedia content archive |
WO2012030383A1 (en) | 2010-08-31 | 2012-03-08 | Falconstor, Inc. | Data deduplication |
US9823981B2 (en) | 2011-03-11 | 2017-11-21 | Microsoft Technology Licensing, Llc | Backup and restore strategies for data deduplication |
US8819443B2 (en) | 2012-02-14 | 2014-08-26 | Western Digital Technologies, Inc. | Methods and devices for authentication and data encryption |
US8646054B1 (en) | 2012-03-23 | 2014-02-04 | Western Digital Technologies, Inc. | Mechanism to manage access to user data area with bridged direct-attached storage devices |
US8831217B2 (en) | 2012-04-10 | 2014-09-09 | Western Digital Technologies, Inc. | Digital rights management system and methods for accessing content from an intelligent storage |
US8914634B2 (en) | 2012-04-10 | 2014-12-16 | Western Digital Technologies, Inc. | Digital rights management system transfer of content and distribution |
US9015122B2 (en) * | 2012-12-21 | 2015-04-21 | Zetta, Inc. | Systems and methods for minimizing network bandwidth for replication/back up |
-
2014
- 2014-04-07 US US14/246,706 patent/US9514000B2/en active Active
-
2015
- 2015-01-29 CN CN201580006191.5A patent/CN105940379B/zh active Active
- 2015-01-29 EP EP15743894.6A patent/EP3100164B1/en active Active
- 2015-01-29 WO PCT/US2015/013534 patent/WO2015116826A1/en active Application Filing
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6560617B1 (en) * | 1993-07-20 | 2003-05-06 | Legato Systems, Inc. | Operation of a standby server to preserve data stored by a network server |
US20070027937A1 (en) * | 2004-05-21 | 2007-02-01 | Mcgrattan Emma K | Method and apparatus for storage backup |
US20080250085A1 (en) * | 2007-04-09 | 2008-10-09 | Microsoft Corporation | Backup system having preinstalled backup data |
US20130339307A1 (en) * | 2012-06-14 | 2013-12-19 | International Business Machines Corporation | Managing system image backup |
CN103049353A (zh) * | 2012-12-21 | 2013-04-17 | 华为技术有限公司 | 一种数据备份方法及相关装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110858123A (zh) * | 2018-08-23 | 2020-03-03 | 华为技术有限公司 | 一种计算备份文件大小的方法及装置 |
CN110858123B (zh) * | 2018-08-23 | 2021-06-01 | 华为技术有限公司 | 一种计算备份文件大小的方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
EP3100164A4 (en) | 2017-09-20 |
WO2015116826A1 (en) | 2015-08-06 |
US9514000B2 (en) | 2016-12-06 |
EP3100164A1 (en) | 2016-12-07 |
CN105940379B (zh) | 2019-04-26 |
EP3100164B1 (en) | 2023-05-24 |
US20150220403A1 (en) | 2015-08-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102395967B (zh) | 用于复制内容可寻址存储集群的异步分布式对象上载 | |
US11010103B2 (en) | Distributed batch processing of non-uniform data objects | |
US10552640B2 (en) | In-situ data verification for the cloud | |
US9633065B2 (en) | Efficient data rehydration | |
US11068437B2 (en) | Periodic snapshots of a pluggable database in a container database | |
CN106445488A (zh) | 一种代码发布及回退的方法 | |
US9875160B2 (en) | Efficiently providing virtual machine reference points | |
US9619334B2 (en) | System and method for merging continuous volume snapshots | |
US10146633B2 (en) | Data recovery from multiple data backup technologies | |
CN101539873A (zh) | 数据恢复的方法、数据节点及分布式文件系统 | |
CN107667351A (zh) | 用于移动设备上的自动基于云的全数据备份和恢复的系统和方法 | |
US11620189B2 (en) | Efficient management of point in time copies of data in object storage | |
CN104035837A (zh) | 一种在线备份同/异构UNIX/Linux主机的方法 | |
US20210181995A1 (en) | Network storage gateway | |
US9348828B1 (en) | System and method of enhanced backup and recovery configuration | |
US8312237B2 (en) | Automated relocation of in-use multi-site protected data storage | |
CN105940379A (zh) | 基线安装的备份 | |
US20180307437A1 (en) | Backup control method and backup control device | |
US10678650B1 (en) | Managing snaps at a destination based on policies specified at a source | |
CN110019056A (zh) | 用于云层的容器元数据分离 | |
CN111125047B (zh) | 冷热数据目录识别方法及装置 | |
JP2022070579A (ja) | 分散台帳管理方法、分散台帳システム、およびノード | |
US20200341891A1 (en) | Garbage collection for a deduplicated cloud tier | |
JP6733214B2 (ja) | 制御装置、ストレージシステム、制御方法及びプログラム | |
KR102597867B1 (ko) | 다중 시점과 완전 삭제를 지원하는 실시간 병렬처리 기반의 데이터 백업 장치 및 그 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |