CN110858123A - 一种计算备份文件大小的方法及装置 - Google Patents

一种计算备份文件大小的方法及装置 Download PDF

Info

Publication number
CN110858123A
CN110858123A CN201810966824.2A CN201810966824A CN110858123A CN 110858123 A CN110858123 A CN 110858123A CN 201810966824 A CN201810966824 A CN 201810966824A CN 110858123 A CN110858123 A CN 110858123A
Authority
CN
China
Prior art keywords
backup file
backup
data block
target
file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810966824.2A
Other languages
English (en)
Other versions
CN110858123B (zh
Inventor
古文武
刘继朋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201810966824.2A priority Critical patent/CN110858123B/zh
Priority to PCT/CN2019/079390 priority patent/WO2020037985A1/zh
Publication of CN110858123A publication Critical patent/CN110858123A/zh
Application granted granted Critical
Publication of CN110858123B publication Critical patent/CN110858123B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0604Improving or facilitating administration, e.g. storage management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0638Organizing or formatting or addressing of data
    • G06F3/064Management of blocks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0646Horizontal data movement in storage systems, i.e. moving data in between storage devices or systems
    • G06F3/065Replication mechanisms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/067Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Quality & Reliability (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及数据保护领域,公开了一种计算备份文件大小的方法及装置,用以解决现有技术中在计算备份文件的大小时,计算速度慢的问题。该方法为:确定目标备份文件以及第一备份文件,第一备份文件为创建时间位于目标备份文件的创建时间之前的,且创建时间与目标备份文件的创建时间最近的备份文件第一备份文件未被删除;根据所述目标备份文件的元数据中记录的数据块的引用信息以及所述第一备份文件的元数据中记录的数据块的引用信息,获得归属于所述目标备份文件的数据块;根据归属于所述目标备份文件的数据块,计算所述目标备份文件的大小。实现了快速计算备份文件的大小。

Description

一种计算备份文件大小的方法及装置
技术领域
本申请实施例涉及数据保护技术领域,尤其涉及一种计算备份文件大小的方法及装置。
背景技术
随着公有云、私有云、混合云如火如荼的发展,使用云资源对用户的数据进行备份成为一种主流。通常采用增量备份技术,在云资源上对用户的数据进行备份。其中,增量备份技术的原理为:在对用户的数据进行首次备份时,进行全量备份,备份全部的数据块。在对数据进行非首次备份时,采用增量备份,只备份数据发生变化的数据块,数据未发生变化的数据块不进行备份。
以下举例说明增量备份技术,如图1所示,为增量备份的一种链式结构,对一组数据块:数据块1-数据块6进行了4次备份,在进行首次备份时,备份全部的6个数据块,后续的备份只对数据发生变化的数据块进行备份,数据未发生变化的数据块不再进行备份,其中,数据是否发生变化是相对上一次备份来说的。以第二次备份为例,在第二次备份中,数据块1、数据块2、数据块4相对第一次备份,其中的数据发生了变化,数据块3、数据块5、数据块6相对第一次备份,其中的数据未发生变化。因此在第二次备份中,仅对数据块1、数据块2以及数据块4进行备份,对数据块3、数据块5、数据块6不再进行备份。
在现有技术中,针对数据块组进行的每次备份,均会生成一个元数据记录文件,该元数据记录文件中存储有该数据块组中的每个数据块的标识,以及每个数据块的存储路径。将每次备份对应的数据块组中进行备份的数据块,未进行备份的数据块均认为是备份文件中包含的数据块。
比如,如图2所示,针对第一次备份生成一个元数据记录文件(即标识为备份1的元数据记录文件),存储有数据块1至数据块6的标识(数据块1….数据块6分别对应的标识为Block1….Block6),且存储有数据块1至数据块6的存储路径(数据块1….数据块6分别对应的存储路径为Flie1….Flie6)。针对第二次备份,生成另一个元数据记录文件(即标识为备份2的元数据记录文件),记录文件2中同样存储有数据块1至数据块6的标识,以及数据块1至数据块6的存储路径。不同的是,在第二次备份过程中,仅对数据内容变化了的数据块1、数据块2以及数据块4进行了备份(即标识为备份2的元数据记录文件中存储变化后的数据块1、数据块2以及数据块4的存储路径为Flie1’、File2’、Flie4’),而记录文件2中数据内容未变化的数据块3、数据块5以及数据块6的存储路径与记录文件1中相同(即数据块3、数据块5以及数据块6的存储地址仍为Flie3、File5、Flie6),即表示数据块3、数据块5以及数据块6为引用生成顺序位于该备份文件之前的备份文件中的数据块。
在现有技术中,在计算一个备份文件中包括的数据块占用的存储空间大小时,仅需要计算该备份文件中包含的发生变化的数据块占用的存储空间大小,可以根据备份文件对应的元数据记录文件中记录的发生变化的数据块的存储路径,在存储空间存储的数据中查找到对应的数据块,并识别出查找到的各数据块的大小,得到备份文件的大小。比如计算第二次备份后得到的备份文件中包括的数据块占用的存储空间大小时,可以仅查找Flie1’、File2’、Flie4’对应的3个数据块,将查找到的3个数据块作为第二次备份后得到的备份文件中包括的数据块占用的存储空间大小。这种采用在数据底层查找数据块的方式来计算备份文件的大小,计算的速度较慢。
发明内容
本申请实施例提供一种计算备份文件大小的方法及装置,用以解决现有技术中在计算备份文件的大小时,计算速度慢的问题。本申请实施例提供的具体技术方案如下:
第一方面,提供一种计算备份文件大小的方法,该方法可应用于备份服务器,具体为:
首先,备份服务器确定待计算大小的目标备份文件,并确定第一备份文件,所述第一备份文件为创建时间位于所述目标备份文件的创建时间之前的,且创建时间与所述目标备份文件的创建时间最近的备份文件,所述第一备份文件未被删除。备份文件的元数据中记录有数据块的引用信息,以及数据块的大小,数据块的引用信息用于指示数据块归属的备份文件。然后,备份服务器从所述目标备份文件的元数据中查询目标备份文件中包含的多个数据块中的每个数据块的引用信息,获得归属于所述目标备份文件的第一数据块。然后备份服务器并根据目标备份文件的元数据中记录的目标备份文件中包含的每个数据块的引用信息以及所述第一备份文件的元数据中记录的第一备份文件中包含的每个数据块的引用信息,获得归属于所述目标备份文件的第二数据块。最后,备份服务器根据所述目标备份文件的元数据中记录的所述第一数据块和所述第二数据块的大小,计算所述目标备份文件的大小。
在一种可能的实现中,在计算目标备份文件的大小时,可以是,将第一数据块和第二数据块的大小之和,确定为所述目标备份文件的大小。
在本申请实施例中,由于目标备份文件的元数据和第一备份文件的元数据中各自记录有对应的备份文件中包含的每个数据块的引用信息,可以快速地识别出归属于目标备份文件的数据块,并根据记录的每个归属于目标备份文件的数据块的大小,采用相加的方式,快速地计算出目标备份文件的大小。
在一种可能的实现中,在确定归属于所述目标备份文件的第二数据块时可以是,根据所述目标备份文件的元数据中记录的数据块的引用信息以及所述第一备份文件的元数据中记录的数据块的引用信息,获得归属于第二备份文件的数据块,所述第二备份文件的创建时间位于所述目标备份文件的创建时间之前,且位于所述第一备份文件的创建时间之后,所述第二备份文件已被删除;将所述归属于第二备份文件的数据块,确定为归属于所述目标备份文件的第二数据块。
在本发明实施例中,当第二备份文件被删除后,归属于第二备份文件的数据块更新为归属于目标备份文件,则可以将原本归属于第二备份文件的数据块,确定为归属于所述目标备份文件的第二数据块,快速准确地计算备份文件的大小。
在一种可能的实现中,所述备份服务器可以是在接收到查询请求后,确定目标备份文件,所述查询请求中包含所述目标备份文件的标识,备份服务器根据标识确定目标备份文件。
该查询请求可以是租户发送的,也可以是计费系统发送的。
在一种可能的实现中,第一方面所述的方法还可包括:在所述目标备份文件的元数据中记录所述目标备份文件中包含的每个数据块的引用信息,以及所述每个数据块的大小,以及在第一备份文件的元数据中记录所述第一备份文件中包含的每个数据块的引用信息。
以便后续根据元数据中记录的信息计算备份文件的大小。
第二方面,提供一种计算备份文件大小的方法,该方法可应用于备份服务器,具体为:
首先,备份服务器获取保存的目标备份文件中包含的多个数据块的第一总大小,所述目标备份文件是源文件的备份文件;然后,备份服务器获取保存的目标备份文件中包含的多个数据块中不归属于所述目标备份文件的数据块的第二总大小;最后,根据所述第一总大小,以及所述第二总大小,计算所述目标备份文件的大小。
在一种可能的实现中,将第一总大小与第二总大小的差值,确定为所述目标备份文件的大小。
在本发明实施例中,由于预先保存目标备份文件的第一总大小,以及不归属目标备份文件的第三数据块的第二总大小,采用相减的方式,快速地计算出目标备份文件的大小。
在一种可能的实现中,预先保存目标备份文件中包含的多个数据块的第一总大小的过程包括:备份服务器确定目标备份文件,从所述目标备份文件的元数据中查询所述目标备份文件中包含的每个数据块的大小,将所述目标备份文件中包含的每个数据块的大小之和,确定为所述目标备份文件中包含的多个数据块的第一总大小,并保存。
在一种可能的实现中,预先保存的不归属于所述目标备份文件的数据块的第二总大小的过程包括:备份服务器确定目标备份文件,根据所述目标备份文件的元数据中记录的所述目标备份文件中包含的每个数据块的引用信息,获得所述目标备份文件中包含的多个数据块中不归属于所述目标备份文件的第三数据块,所述每个数据块的引用信息用于指示所述数据块归属的备份文件;根据所述目标备份文件的元数据中记录的所述第三数据块的大小,确定所述目标备份文件中包含的多个数据块中不归属于所述目标备份文件的数据块的第二总大小,第二总大小为第三数据块的大小之和。
在一种可能的实现中,所述备份服务器可以是在接收到查询请求后,确定目标备份文件,所述查询请求中包含所述目标备份文件的标识,备份服务器根据标识确定目标备份文件。
该查询请求可以是租户发送的,也可以是计费系统发送的。
在一种可能的实现中,第二方面所述的方法还可包括:在所述目标备份文件的元数据中记录所述目标备份文件中包含的每个数据块的引用信息,以及所述每个数据块的大小。
以便后续根据元数据中记录的信息计算备份文件的大小。
第三方面,提供一种计算备份文件中删除的数据大小的方法,该方法可应用于备份服务器,具体为:
首先,备份服务器确定目标备份文件,所述目标备份文件中包含多个数据块,所述目标备份文件是源文件的备份文件,所述源文件还具有第一备份文件和第三备份文件,所述第一备份文件包含多个数据块,所述第三备份文件包含多个数据块,所述第一备份文件为创建时间位于所述目标备份文件的创建时间之前的,且创建时间与所述目标备份文件的创建时间最近的备份文件,所述第一备份文件未被删除,所述第三备份文件为创建时间位于所述目标备份文件的创建时间之后的,且创建时间与所述目标备份文件的创建时间最近的备份文件,所述第三备份文件未被删除;
然后,根据所述目标备份文件的元数据中记录的所述目标备份文件中包含的每个数据块的引用信息,获得归属于所述目标备份文件的第一数据块;
再然后,确定第一备份文件,根据所述目标备份文件的元数据中记录的目标备份文件中包含每个数据块的引用信息,以及所述第一备份文件的元数据中记录的第一备份文件中包含的每个数据块的引用信息,获得归属于所述目标备份文件的第二数据块,所述每个数据块的引用信息用于指示所述数据块归属的备份文件;
再然后,确定第三备份文件,根据所述第三备份文件的元数据中记录第三备份文件中包含的每个数据块的引用信息,以获得归属于所述目标备份文件的第一数据块和第二数据块中被第三备份文件引用的第三数据块;
最后,根据所述第一数据块、第二数据块,以及所述第三数据块,确定能够被删除的第四数据块,根据目标备份文件的元数据中记录的每个第四数据块的大小,确定所述目标备份文件中能够被删除的数据的大小。
在一种可能的实现中,将第四数据块的大小之和,确定为所述目标备份文件中能够被删除的数据的大小。
在本发明实施例中,由于目标备份文件的元数据、第一备份文件的元数据和第三备份文件的元数据中各自记录有对应的备份文件中包含的每个数据块的引用信息,可以快速地识别出目标备份文件中能够被删除的数据块,并根据记录的每个能够被删除的数据块的大小,采用相加的方式,快速地计算出目标备份文件中能够被删除的数据的大小。
在一种可能的实现中,在确定所述目标备份文件中能够删除的第四数据块时,可以是将第一数据块和第二数据块中除第三数据块外的数据块确定为能够被删除的第四数据块。
在一种可能的实现中,在确定归属于所述目标备份文件的第二数据块时,首先,根据所述目标备份文件的元数据中记录的数据块的引用信息以及所述第一备份文件的元数据中记录的数据块的引用信息,获得归属于第二备份文件的数据块,所述第二备份文件的创建时间位于所述目标备份文件的创建时间之前,且位于所述第一备份文件的创建时间之后,所述第二备份文件已被删除;然后,将所述归属于第二备份文件的数据块,确定为归属于所述目标备份文件的第二数据块。
在本发明实施例中,当第二备份文件被删除后,归属于第二备份文件的数据块更新为归属于目标备份文件,则可以将原本归属于第二备份文件的数据块,确定为归属于所述目标备份文件的第二数据块。
在一种可能的实现中,所述备份服务器可以是在接收到删除请求后,确定目标备份文件,所述删除请求中包含所述目标备份文件的标识,备份服务器根据标识确定目标备份文件。
该删除请求可以是租户发送的,也可以是其他系统发送的。
在一种可能的实现中,第三方面所述的方法还可包括:在所述目标备份文件的元数据中记录所述目标备份文件中包含的每个数据块的引用信息,以及所述每个数据块的大小,在第一备份文件的元数据中记录所述第一备份文件中包含的每个数据块的引用信息,以及在第三备份文件的元数据中记录所述第三备份文件中包含的每个数据块的引用信息。
以便后续根据元数据中记录的信息计算备份文件中能够被删除的数据的大小。
第四方面,本申请提供一种计算备份文件的大小的装置,用于备份服务器或备份服务器的芯片,包括:用于执行以上任一方面各个步骤的单元或手段(means)。
第五方面,本申请提供一种计算备份文件的大小的装置,用于备份服务器或备份服务器的芯片,包括至少一个处理元件和至少一个存储元件,其中所述至少一个存储元件用于存储程序和数据,所述至少一个处理元件用于执行本申请任一方面提供的方法。
第六方面,本申请提供一种计算备份文件的大小的装置,用于备份服务器包括用于执行以上任一方面的方法的至少一个处理元件(或芯片)。
第七方面,本申请提供一种计算机程序产品,该计算机程序产品包括计算机指令,当该计算机指令被计算机执行时,使得所述计算机执行以上任一方面的方法。
第八方面,本申请提供了一种计算机可读存储介质,该存储介质存储有计算机指令,当所述计算机指令被计算机执行时,使得所述计算机执行以上任一方面的方法。
附图说明
图1为现有技术中的增量备份的一种链式结构图;
图2为现有技术中的备份文件的元数据记录文件示意图;
图3为本申请实施例中的计算备份系统结构图;
图4为本申请实施例中的计算备份文件的大小的方法流程图;
图5为本申请实施例中的备份文件的元数据记录文件示意图;
图6为本申请实施例中的计算备份文件的大小的方法流程图;
图7为本申请实施例中的备份过程示意图;
图8为本申请实施例中的删除备份文件过程示意图;
图9为本申请实施例中的计算备份文件的大小的装置;
图10为本申请实施例中的计算备份文件中删除的数据的大小的装置;
图11为本申请实施例中的计算备份文件的大小的装置;
图12为本申请实施例中的计算备份文件中删除的数据的大小的装置。
具体实施方式
下面将结合附图,对本申请实施例进行详细描述。
图3为本申请实施例提供的一种备份系统300,该系统包括:用户301、备份服务器302、生产存储服务器303、和备份存储服务器304。
用户可以通过备份系统中的备份服务器302进行数据块的备份、恢复和删除备份文件操作,本申请应用于备份和删除场景中,为了防止业务故障时造成的数据丢失,用户301可以定期向备份服务器302发送备份请求,用以对需要备份的数据进行备份。用户301向备份服务器302发起备份任务,备份服务器302从生产存储服务器303中读取需要备份的数据,并将数据存储到备份存储服务器304中,备份服务器302上还具有一个本地数据库,用于管理备份任务数据。用户可以是租户,也可以是其他系统。
租户在云资源上租用的存储空间是有限的,租户可以保存每个备份文件占用的存储空间是多少,从而在租用的存储空间不足时,把某些备份文件给删掉,因此租户可以向备份服务器302查询备份文件的大小并记录下来。
除了租户可以向备份服务302器查询备份文件的大小,计费系统也可以向备份服务器302查询备份文件的大小,计费系统在进行计费时,是针对每个备份文件进行计费的,计费系统需要知道每个备份文件的大小,从而来进行计费。
在现有技术中,备份服务器在计算备份文件的大小时,需要根据备份文件中的数据块的存储路径去底层查询每个数据块的大小,计算的速度较慢,本申请提供了一种计算备份文件大小的方法,可以提高计算的速度。在计算某个备份文件的大小时,可能会涉及到与该备份文件相邻的备份文件,本申请提供的多个备份文件均位于同一个备份链中,也就是针对同一源文件的备份文件。另外,需要理解的是,在本申请的描述中,“第一”、“第二”等词汇,仅用于区分描述的目的,而不能理解为指示或暗示相对重要性,也不能理解为指示或暗示顺序。
如图4所示,本申请公开了一种计算备份文件大小的方法流程图,该流程中的备份服务器具体为图3所示的备份服务器302。可以理解的是,在本申请中,备份服务器的功能也可以通过应用于备份服务器的芯片来实现。该流程具体为:
步骤S401:备份服务器接收查询请求,所述查询请求中包含目标备份文件的标识。
步骤S402:备份服务器确定目标备份文件。
在本申请实施例中,租户或者计费系统在想要了解某个备份文件的大小时,可以向备份服务器发送查询请求,用以查询备份文件的大小。查询请求中包含待查询的备份文件的标识,将待查询的备份文件称为目标备份文件。备份服务器在接收到查询请求后,可以根据查询请求中包含的标识确定出目标备份文件。
在增量备份技术中,在对源文件进行第一次备份时,根据源文件进行全量备份,在进行后续的第二次、第三次、……、第n次备份时,根据前一次备份生成的备份文件进行增量备份,即均是针对数据发生变化的数据块的备份,数据未发生变化的数据块不进行备份,而是引用前一次备份生成的备份文件中的数据块。不管是第一次备份还是非第一次备份,该次备份生成的备份文件都是针对源文件的备份文件。
在每一次的备份中,进行备份的数据块可以认为是归属于该次备份生成的备份文件的数据块。不管是进行备份的数据块,还是未进行备份的数据块,即引用前一次备份生成的备份文件中的数据块,均可以认为是该次备份生成的备份文件中包含的数据块。
如图1所示,在第三次备份中,数据块1,数据块2,数据块4,数据块6为引用前一次备份即第二次备份生成的备份文件中的数据块,数据块3和数据块5为第三次备份中进行备份的数据块,则将第三次备份中的数据块1-数据块6均认为是第三次备份生成的备份文件中包含的数据块,数据块3和数据块5认为是归属于第三次备份生成的备份文件的数据块,数据块1,数据块2,数据块4,数据块6不归属于第三次备份生成的备份文件。
在该申请实施例中,目标备份文件为进行增量备份时生成的备份文件,目标备份文件是源文件的备份文件。每个备份文件都有其元数据,该元数据包括备份文件的标识、备份文件的备份序号,备份文件中包含的每个数据块的信息,其中,备份序号按备份文件的生成顺序递增,数据块的信息包括数据块的大小,数据块的引用信息等。数据块的引用信息用于指示该数据块归属的备份文件,也就是该数据块在进行备份时生成的备份文件,元数据中记录的数据块的引用信息具体可以是该数据块归属的备份文件的标识以及备份序号。备份文件的备份序号用于指示该备份文件的生成顺序。
备份服务器在确定出了目标备份文件后,还可以再进行步骤403:从所述目标备份文件的元数据中查询所述目标备份文件中包含的多个数据块中的每个数据块的引用信息,获取归属于目标备份文件的第一数据块。
在查询出目标备份文件的元数据中记录的目标备份文件中包含的多个数据块中的每个数据块的引用信息后,就可以根据查询到的每个数据块的引用信息,确定出归属于目标备份文件的数据块,仅根据目标备份文件的元数据中记录的数据块的引用信息,确定出归属于目标备份文件的数据块称为第一数据块,第一数据块是原本就归属于目标备份文件的。
在根据查询到的每个数据块的引用信息,确定归属于目标备份文件的数据块时,可以是根据引用信息中的备份文件的标识确定的,具体为识别目标备份文件的元数据中记录的每个数据块归属的备份文件的标识,将其中的目标备份文件的标识对应的数据块确,确定为归属于目标备份文件的第一数据块。也可以是根据引用信息中的备份文件的备份序号确定,具体为识别目标备份文件的元数据中记录的每个数据块归属的备份文件的备份序号,将其中的目标备份文件的备份序号对应的数据块,确定为归属于目标备份文件的第一数据块。
在本发明实施例中,源文件还具有第一备份文件,第一备份文件的创建时间相较于目标备份文件的创建时间早,且两者的创建时间最接近,也就是第一备份文件为创建时间位于所述目标备份文件的创建时间之前的,且创建时间与所述目标备份文件的创建时间最近的备份文件,第一备份文件未被删除。
例如,目标备份文件为第四次备份时生成的备份文件,在不存在被删除的备份文件时,第一备份文件为第三次备份时生成的备份文件。如果存在被删除的备份文件,且被删除的备份文件为第三次备份时生成的备份文件,则第一备份文件为第二次备份时生成的备份文件,并且原本归属于第三次备份生成的备份文件的数据块变更为归属于目标备份文件。如果被删除的备份文件为第三次备份时生成的备份文件和第二次备份时生成的备份文件,则第一备份文件为第一次备份时生成的备份文件,并且原本归属于第三次备份生成的备份文件和第二次备份时生成的备份文件的数据块变更为归属于目标备份文件。
备份服务器确定第一备份文件的过程可以如下:
备份服务器根据记录的每个备份文件的备份序号,确定所述目标备份文件的备份序号,将目标备份文件的备份序号称为目标备份序号,备份服务器确定与目标备份序号相邻,且小于所述目标备份序号的第一备份序号;
并根据记录每个备份文件的备份序号,确定第一备份序号对应的第一备份文件。
为了使确定的备份文件的大小更加准确,还可以进行步骤404:确定第一备份文件,根据目标备份文件的元数据中记录的目标备份文件中包含的每个数据块的引用信息以及所述第一备份文件的元数据中记录的第一备份文件中包含的每个数据块的引用信息,获得归属于第二备份文件的数据块;将所述归属于第二备份文件的数据块,确定为归属于所述目标备份文件的第二数据块,其中,所述第二备份文件的创建时间位于所述目标备份文件的创建时间之前,且位于所述第一备份文件的创建时间之后,所述第二备份文件已被删除。
备份服务器在根据目标备份文件的元数据中记录的目标备份文件中包含的每个数据块的引用信息以及所述第一备份文件的元数据中记录的第一备份文件中包含的每个数据块的引用信息,获得归属于第二备份文件的第二数据块时,具体可以是,针对目标备份文件中除第一数据块外的每个数据块,识别出该数据块在第一备份文件中的对应数据块,该数据块,及该数据块在第一备份文件中的对应数据块,均是针对源文件中的同一数据块的备份数据块,备份服务器判断该数据块的引用信息与该数据块在第一备份文件中的对应数据块的引用信息是否相同,如果不同,则确定该数据块为原本归属于被删除的第二备份文件的数据块,也就是当前归属于目标备份文件的第二数据块。
备份服务器针对目标备份文件中除第一数据块外的每个数据块,识别该数据块在第一备份文件中的对应数据块的过程可以是,备份服务器在每个备份文件的元数据中记录该备份文件中包含的每个数据块的标识,针对源文件中的每个数据块的备份数据块,备份服务器记录的标识可以是相同的。备份服务器可以针对目标备份文件中除第一数据块外的每个数据块,识别第一备份文件中与该数据块的标识相同的数据块,将该标识相同的数据块,确定为目标备份文件中的该数据块在第一备份文件中的对应数据块。
备份服务器在确定出了归属于目标备份文件的第一数据块和第二数据块后,就可以根据所述目标备份文件的元数据中记录的所述第一数据块和所述第二数据块的大小,计算所述目标备份文件的大小。具体可以是执行步骤405:将第一数据块和第二数据块的大小之和,确定为所述目标备份文件的大小。
由于目标备份文件的元数据和第一备份文件的元数据中各自记录有对应的备份文件中包含的每个数据块的引用信息,可以快速地识别出归属于目标备份文件的数据块,并根据记录的每个归属于目标备份文件的数据块的大小,采用相加的方式,快速地计算出目标备份文件的大小。
备份文件的元数据中记录的该备份文件包含的每个数据块的引用信息以及数据块的大小具体可以记录在备份文件的元数据记录文件中,备份文件的元数据记录文件中除了记录如图2所示的已有的每个数据块的标识Block以及数据块的存储路径Flie外,还记录有数据块的大小size,以及数据块归属的备份文件的标识,以及备份文件的备份序号,具体可以参见图5所示的元数据记录文件。图5所示的元数据记录文件仅是用来表示备份文件的元数据记录文件中记录有哪些信息,具体的记录格式可以是如图5所示的格式,也可以是备份服务器设定的其他格式。在图5中,第三列为数据块归属的备份文件的备份序号,可以理解为第三列为一个有序的标识,当然也可以将备份文件的标识及备份序号分开记录,第四列为数据块的大小。以第三次备份为例,第三次备份生成的备份文件的元数据记录文件为图5中的备份3,备份3中的数据块1(Block1)对应的数字“2”表示数据块1归属的备份文件为第二次备份时生成的备份文件,数据块5(Block5)对应的数字“3”表示数据块5归属的备份文件为第三次备份时生成的备份文件。
在该实施例中,目标备份文件不是第一次备份生成的备份文件,则目标备份文件中包含的多个数据块中可能存在不归属于该目标备份文件的数据块。在确定目标备份文件的大小时,可以采用将归属于该目标备份文件的数据块的大小相加的方式计算目标备份文件的大小,也可以采用将目标备份文件中包含的多个数据块的总大小减去不归属于该目标备份文件的每个数据块的大小的方式,计算目标备份文件的大小。
在本申请的另一实施例中,为了进一步快速地计算备份文件的大小,还可以根据备份文件的元数据中记录的该备份文件包含的该备份文件的备份序号,每个数据块的引用信息以及数据块的大小,提前保存备份文件中包含的多个数据块的总大小,以及目标备份文件中包含的多个数据块中不归属于所述目标备份文件的数据块的总大小,为了便于区分,将备份文件中包含的数据块的总大小称为第一总大小,将目标备份文件中包含的多个数据块中不归属于所述目标备份文件的数据块的总大小称为第二总大小。
备份服务器接收查询请求,所述查询请求中包含所述目标备份文件的标识,备份服务器根据标识确定目标备份文件,并获取保存的目标备份文件中包含的多个数据块的第一总大小,所述目标备份文件是源文件的备份文件;然后,备份服务器获取保存的目标备份文件中包含的多个数据块中不归属于所述目标备份文件的数据块的第二总大小;最后,根据所述第一总大小,以及所述第二总大小,计算所述目标备份文件的大小。
具体为将第一总大小与第二总大小的差值,确定为所述目标备份文件的大小。
在本发明实施例中,由于预先保存目标备份文件的第一总大小,以及不归属目标备份文件的第三数据块的第二总大小,采用相减的方式,快速地计算出目标备份文件的大小。
针对目标备份文件,该目标备份文件引用第一备份文件中包含的数据块的总大小为该目标备份文件中包含的多个数据块中不归属于所述目标备份文件的数据块的总大小。在记录目标备份文件中包含的多个数据块中不归属于所述目标备份文件的数据块的总大小时,可以是记录该目标备份文件引用第一备份文件中包含的数据块的总大小,当然还可以记录备份文件中引用创建顺序位于该备份文件的创建顺序之前的每个备份文件中包含的数据块的总大小。
备份文件中包含的多个数据块的总大小,备份文件中引用创建顺序位于该备份文件的创建顺序之前的每个备份文件中包含的数据块的总大小等信息具体可以是保存在备份链引用关系记录文件中,备份链引用关系记录文件中记录的信息包含如表1所示的备份文件的标识(ID),例如可以是备份1、备份2、……、备份n等,备份文件的备份序号(Snaplndex),例如1、2、……、n等,备份文件中包含的多个数据块的总大小(Totasize),备份文件中引用生成顺序位于该备份文件的生成顺序之前的每个备份文件中包含的数据块的总大小(Reference)。后续可根据备份链引用关系记录文件中记录的信息计算备份文件的大小。
ID Snaplndex Totasize Reference
备份1 1 T1
备份2 2 T2 R(2,1)
备份3 3 T3 R(3,1);R(3,2)
备份4 4 T4 R(4,1);R(4,2);R(4,3)
…… …… …… ……
备份n n Tn R(n,1);R(n,2);R(n,3)……R(n,n-1)
表1
以表1中标识为备份3的这一行为例进行说明:T3表示备份序号为3的备份文件中包含的多个数据块的总大小,R(3,1)表示备份序号为3的备份文件中引用备份序号为1的备份文件中包含的数据块的总大小,R(3,2)表示备份序号为3的备份文件中引用备份序号为2的备份文件中包含的数据块的总大小。
备份服务器可以根据备份文件的元数据中记录的该备份文件包含的该备份文件的备份序号,每个数据块的引用信息以及数据块的大小提前在备份链引用关系记录文件中记录用于计算备份文件的大小的相关信息,备份服务器在备份链引用关系记录文件中记录信息时,一般是跟随备份文件的生成过程实时记录的,也就是当生成一个备份文件后,就根据该备份文件的元数据中记录的信息确定备份链引用关系记录文件中记录的信息,在在备份链引用关系记录文件中记录信息的过程中,可以无需考虑存在删除某个备份文件的情况。
备份服务器预先保存目标备份文件中包含的多个数据块的第一总大小的过程包括:备份服务器确定目标备份文件,从所述目标备份文件的元数据中查询所述目标备份文件中包含的每个数据块的大小,将所述目标备份文件中包含的每个数据块的大小之和,确定为所述目标备份文件中包含的多个数据块的第一总大小,并保存所述目标备份文件中包含的多个数据块的第一总大小。
备份服务器预先保存的不归属于所述目标备份文件的数据块的第二总大小的过程包括:备份服务器确定目标备份文件,根据所述目标备份文件的元数据中记录的所述目标备份文件中包含的每个数据块的引用信息,获得所述目标备份文件中包含的多个数据块中不归属于所述目标备份文件的第三数据块,所述每个数据块的引用信息用于指示所述数据块归属的备份文件;根据所述目标备份文件的元数据中记录的所述第三数据块的大小,确定所述目标备份文件中包含的多个数据块中不归属于所述目标备份文件的数据块的第二总大小,第二总大小为所述第三数据块的大小之和。
备份服务器计算目标备份文件的大小,则备份链引用关系记录文件中至少记录有目标备份文件中包含的多个数据块的第一总大小,以及目标备份文件中引用第一备份文件中包含的数据块的总大小,也就是第一目标文件中包含的多个数据块中不归属所述目标备份文件的数据块的第二总大小。
根据目标备份文件的元数据中记录的该目标备份文件中包含的每个数据块的引用信息以及数据块的大小,在备份链引用关系记录文件中记录目标备份文件中包含的多个数据块的总大小的过程包括:
备份服务器确定目标备份文件,根据所述目标备份文件的元数据中记录的每个数据块的大小,将所述目标备份文件的元数据中记录的每个数据块的大小之和,确定为所述备份链引用关系记录文件中记录的目标备份文件中包含的多个数据块的总大小。
根据目标备份文件的元数据中记录的该目标备份文件中包含的每个数据块的引用信息以及数据块的大小,在备份链引用关系记录文件中记录目标备份文件中引用第一备份文件中包含的数据块的第二总大小的过程包括:
备份服务器确定目标备份文件,根据所述目标备份文件的元数据中所述目标备份文件中包含的每个数据块的引用信息,获得所述目标备份文件中包含的多个数据块中不归属于所述目标备份文件的第三数据块,所述每个数据块的引用信息用于指示所述数据块归属的备份文件;根据所述目标备份文件的元数据中记录的所述第三数据块的大小,确定所述目标备份文件中包含的多个数据块中不归属于所述目标备份文件的数据块的第二总大小,第二总大小为第三数据块的大小之和。
在根据所述目标备份文件的元数据中记录的所述目标备份文件中包含的每个数据块的引用信息,获得所述目标备份文件中包含的多个数据块中不归属于所述目标备份文件的第三数据块时,可以是根据引用信息中的备份文件的标识确定的,具体为识别目标备份文件的元数据中记录的每个数据块归属的备份文件的标识,将其中的非目标备份文件的标识对应的数据块,确定为不归属于目标备份文件的第三数据块。也可以是根据引用信息中的备份文件的备份序号确定,具体可以是识别目标备份文件的元数据中记录的每个数据块归属的备份文件的备份序号,将其中的非目标备份文件的备份序号对应的数据块确定为不归属于所述目标备份文件的第三数据块,即目标备份文件中引用第一备份文件中包含的数据块。
结合图5中的标识为备份3的备份文件的元数据记录文件中包含的信息,备份链引用关系记录文件中记录的备份序号为3的备份文件中引用备份序号为1的备份文件中包含的数据块的总大小,即R(3,1)为数据块6(Block6)的大小之,即size6。
备份序号为2的备份文件中包含的数据块6(Block6)为引用备份序号为1的备份文件中包含的数据块,备份链引用关系记录文件中记录的备份序号为3的备份文件中引用备份序号为2的备份文件中包含的数据块的总大小,即R(3,2)为数据块1、数据块2、数据块4和数据块6的大小之和,即size1’、size2’、size4’与size6之和。
针对不存在删除备份文件的情况,备份文件b的生成顺序位于备份文件a的生成顺序之前,在确定某个备份文件a中引用另一备份文件b中包含的数据块的总大小时,可以是识别该备份文件a的元数据中记录的该备份文件a中包含的每个数据块归属的备份文件的备份序号,以及识别备份文件b的元数据中记录的该备份文件b的备份序号,在备份文件a中包含的每个数据块归属的备份文件的备份序号中识别小于以及等于备份文件b的备份序号的特定备份序号;将特定备份序号对应的数据块确定为备份文件a引用备份文件b中包含的数据块,根据备份文件a中包含每个数据块的大小,确定每个特定数据块的大小,将每个特定数据块的大小之和确定为备份文件a引用备份文件b中包含的数据块的总大小。
在查询目标备份文件的大小时,可以根据备份链引用关系记录文件中包含的信息,计算目标备份文件的大小。可以是将目标备份文件中包含的多个数据块的总大小(Totasize)减去不归属于该目标备份文件的数据块的大小。其中,不归属于该目标备份文件的数据块的大小也就是该目标备份文件中引用第一备份文件中包含的数据块的大小。假设目标备份文件中包含的多个数据块的总大小为Ta,目标备份文件中包含的数据块中引用第一备份文件的数据块的大小R(a,p),则目标备份文件的大小为Ta-R(a,p),其中a为目标备份文件的目标备份序号,p为第一备份文件的第一备份序号。
假设,待计算大小的目标备份文件为标识为备份4的备份文件,在不存在删除某个备份文件的情况下,可以根据每个备份文件的备份序号,在备份链引用关系记录文件中查询出第一备份文件为标识为3的备份文件。目标备份文件中包含的多个数据块的总大小为T4,目标备份文件中包含的多个数据块中不归属所述目标备份文件的数据块的总大小为R(4,3),目标备份文件的大小为T4-R(4,3)。
如果标识为备份3的备份文件被删除,则备份链引用关系记录文件中不包含标识为备份3的相关信息,可以根据每个备份文件的备份序号,在备份链引用关系记录文件中查询出第一备份文件为标识为2的备份文件。目标备份文件中包含的多个数据块的总大小为T4,目标备份文件中包含的多个数据块中不归属所述目标备份文件的数据块的总大小为R(4,2),目标备份文件的大小为T4-R(4,2)。
如图6所示,为计算备份文件的大小的流程图,用户向备份服务器发送查询请求,用于查询目标备份文件的大小,备份服务器根据预先保存的备份链引用关系记录文件记录的目标备份文件中包含的数据块的总大小,以及引用第一备份文件的大小,目标备份文件的大小,并向用户反馈目标备份文件的大小。
不管是采用将归属于目标备份文件中包含的多个数据块的大小相加的方式,确定目标备份文件的大小,还是采用将目标备份文件中包含的多个数据块的总大小减去不归属目标备份文件的数据块的总大小的方式,计算目标备份文件的大小,备份服务器使用的每个数据块的引用信息以及每个数据块的大小,均需要在元数据中进行提前记录,在本申请的另一实施例中,还包括:
在所述目标备份文件的元数据中记录所述目标备份文件中包含的每个数据块的引用信息,以及每个数据块的大小,以及在第一备份文件的元数据中记录所述第一备份文件中包含的每个数据块的引用信息。
一般,在进行备份时,生成备份文件,针对该备份文件,在该备份文件的元数据块中记录该备份文件中包含的每个数据块的引用信息。
在本申请实施例中,为了防止业务故障时造成的数据丢失,租户可以向备份服务器发送备份请求,当然还可以是其他系统根据数据块组的备份周期,在周期到达时向备份服务器发送备份请求,备份服务器根据目标数据块组的标识对该目标数据块组中的数据块进行备份,生成目标备份文件,并在目标备份文件的元数据中记录目标备份文件的标识,目标备份文件的备份序号,目标备份文件中包含的每个数据块的引用信息,以及每个数据块的大小。
如图7所示,具体说明备份服务器进行备份的过程以及记录备份文件的标识,备份序号,数据块的引用信息及数据块的大小的过程:
备份服务器在接收到用户发送的备份请求时,创建备份任务,并生成备份文件的标识,将生成的备份文件的标识称为目标标识,备份服务器根据目标标识新建元数据记录文件,以及根据备份服务器中保存的当前存在的最大的备份序号,确定目标备份序号,一般为将最大的备份序号加1确定为目标备份序号,并在新建的元数据记录文件中保存目标标识及目标备份序号。
备份服务器从生产存储服务器中循环读取数据,获取目标数据块组中的每个进行备份的数据块,向备份存储服务器中写入进行备份的数据块实现数据块的备份,并识别每个进行备份的数据块的大小,在新建的元数据记录文件中记录每个进行备份的数据块的大小,以及针对每个进行备份的数据块记录其归属的备份文件的目标标识;
识别所述目标数据块组中的每个未进行备份的数据块,针对每个未进行备份的数据块,识别最大的备份序号对应的备份文件的其他标识,根据所述其他标识查找对应的元数据记录文件;
识别其他标识对应的元数据记录文件中记录的该次备份过程中的每个未进行备份的数据块的大小,以及每个未进行备份的数据块归属的备份文件的标识即备份序号,并在新建的元数据记录文件中记录。
上述的进行备份的数据块以及未进行备份的数据块为该目标标识的备份文件中包含的数据块,进行备份的数据块归属于目标标识的备份文件。根据上述过程,可以算是完成了备份任务,可以通知用户备份完成。
但是,为了后续快速地计算备份文件的大小,还可以根据新建的元数据记录文件中记录的备份序号,每个数据块的大小,以及每个数据块归属的备份文件的标识即备份序号,计算该次备份生成的备份文件包含的数据块的总大小,以及该次备份生成的备份文件中引用生成顺序位于该次备份生成的备份文件之前的每个备份文件中包含的数据块的总大小,并在备份链引用关系记录文件中记录的该次备份生成的备份文件包含的数据块的总大小,以及该次备份生成的备份文件中引用生成顺序位于该次备份生成的备份文件之前的每个备份文件中包含的数据块的总大小。根据以上过程,完成了备份任务。
在本申请的另一实施例中,如果待计算大小的目标备份文件为第一次备份生成的备份文件,则可以直接将待计算大小的目标备份文件中包含的所有的数据块的大小相加,即可得到该目标备份文件的大小。
备份服务器可以是在接收到查询请求时,判断待计算大小的目标备份文件是否为第一次备份生成的备份文件,具体可以是根据预先保存的每个备份文件的备份序号,确定待计算大小的目标备份文件的备份序号是否为待计算大小的目标备份文件所在的备份链中最小的备份的序号,如果是,则确定待计算大小的备份文件为第一次备份时生成的备份文件,否则,则确定待计算大小的备份文件非第一次备份时生成的备份文件。
上述的备份文件的标识,备份序号,备份文件中包含的每个数据块归属的备份文件的标识及备份序号可以在图3所示的备份服务器的本地数据库中保存。
租户在云资源上租用的存储空间是有限的,当租用的存储空间不足时,租户可以把某些备份文件给删掉,租户可以向备份服务器发送删除请求,用以删除备份文件,在现有技术中,备份服务器在删除了备份文件中的数据后,才能计算出删除的备份文件中的数据的大小,整个删除过程耗时较长,不能及时地给租户反馈删除的数据的大小,并且租户已经发送了删除请求,就不应该再对备份文件中能够删除的数据进行计费,在耗时较长的删除过程中,对租户请求删除的备份文件中能够删除的数据的计费是不合理的。
为此在本申请的一个实施例中,提供了一种计算备份文件中删除的数据的大小的方法,可以快速地计算出备份文件中能够删除的数据的大小,无需在删除任务结束后才能计算出备份文件中能够删除的数据的大小,方法包括:
首先,备份服务器确定目标备份文件,所述目标备份文件中包含多个数据块,所述目标备份文件是源文件的备份文件,所述源文件还具有第一备份文件和第三备份文件,所述第一备份文件为创建时间位于所述目标备份文件之前的,且创建时间与所述目标备份文件的创建时间最近的备份文件,所述第三备份文件为创建时间位于所述目标备份文件之后的,且创建时间与所述目标备份文件的创建时间最近的备份文件,第一备份文件与第三备份文件均未被删除。
其次,根据所述目标备份文件的元数据中记录的所述目标备份文件中包含的每个数据块的引用信息,获得归属于所述目标备份文件的第一数据块。
备份服务器确定归属于所述目标备份文件的第一数据块的过程在上述计算备份文件的大小的实施例中已经记载,在此不再进行描述。
再其次,备份服务器确定第一目标备份文件,根据所述目标备份文件的元数据中记录的目标备份文件中包含每个数据块的引用信息,以及所述第一备份文件的元数据中记录的第一备份文件中包含的每个数据块的引用信息,获得归属于所述目标备份文件的第二数据块,所述每个数据块的引用信息用于指示所述数据块归属的备份文件。
备份服务器确定第一备份文件的过程在上述计算备份文件的大小的实施例中已经记载,在此不再进行描述。
备份服务器在确定归属于所述目标备份文件的第二数据块时,可以是根据所述目标备份文件的元数据中记录的数据块的引用信息以及所述第一备份文件的元数据中记录的数据块的引用信息,获得归属于第二备份文件的数据块,所述第二备份文件的创建时间位于所述目标备份文件的创建时间之前,且位于所述第一备份文件的创建时间之后,所述第二备份文件已被删除;然后,将所述归属于第二备份文件的数据块,确定为归属于所述目标备份文件的第二数据块。具体过程在上述计算备份文件的大小的实施例中已经记载,在此不再进行描述。
然后,备份服务器确定第三目标备份文件,根据所述第三备份文件的元数据中记录第三备份文件中包含的每个数据块的引用信息,以获得归属于所述目标备份文件的第一数据块和第二数据块中被第三备份文件引用的第三数据块;
再然后,根据所述第一数据块、第二数据块,以及所述第三数据块,确定能够被删除的第四数据块,具体为在确定所述目标备份文件中能够删除的第四数据块时,可以是将第一数据块和第二数据块中除第三数据块外的数据块确定为能够被删除的第四数据块。
最后,根据目标备份文件的元数据中记录的每个第四数据块的大小,确定所述目标备份文件中能够被删除的数据的大小。具体为将第四数据块的大小之和,确定为所述目标备份文件中能够被删除的数据的大小。
在本申请实施例中,租户在删除某个备份文件时,可以向备份服务器发送删除请求,用以删除备份文件中能够删除的数据。删除请求中包含待删除的备份文件的标识,将待删除的备份文件称为目标备份文件。备份服务器在接收到删除请求后,可以根据删除请求中包含的标识确定出目标备份文件。
备份服务器确定第三备份文件的过程可以如下:
备份服务器根据记录的每个备份文件的备份序号,确定所述目标备份文件的备份序号,将目标备份文件的备份序号称为目标备份序号,备份服务器确定与目标备份序号相邻,且大于所述目标备份序号的第三备份序号;
并根据记录每个备份文件的备份序号,确定第三备份序号对应的第三备份文件。
备份服务器在根据所述第三备份文件的元数据中记录第三备份文件中包含的每个数据块的引用信息,以获得归属于所述目标备份文件的第一数据块和第二数据块中被第三备份文件引用的第三数据块时,具体可以是针对目标备份文件中的每个第一数据块和每个第二数据块,识别出该数据块在第一备份文件中的对应数据块,备份服务器判断该数据块的引用信息与该数据块在第一备份文件中的对应数据块的引用信息是否相同,如果相同,则确定该数据块为被第三备份文件引用的第三数据块,该第三数据块不能删除。
在本发明实施例中,由于目标备份文件的元数据、第一备份文件的元数据和第三备份文件的元数据中各自记录有对应的备份文件中包含的每个数据块的引用信息,可以快速地识别出目标备份文件中能够被删除的数据块,并根据记录的每个能够被删除的数据块的大小,采用相加的方式,快速地计算出目标备份文件中能够被删除的数据的大小。
在本申请的另一实施例中,备份服务器可以是预先保存目标备份文件中包含的多个数据块的第一总大小,目标备份文件中引用第一备份文件中包含的数据块的第二总大小,第三备份文件中引用目标备份文件中包含的数据块的第三总大小,以及第三备份文件中引用第一备份文件中包含的数据块的第四总大小。
其中,目标备份文件中引用第一备份文件中包含的数据块可以理解为目标备份文件中包含的数据块中不归属于目标备份文件的数据块。
第三备份文件中引用目标备份文件中包含的数据块可以理解为第三备份文件中包含的数据块中不归属于第三备份文件的数据块。
第三备份文件中引用第一备份文件中包含的数据块可以理解为第三备份文件中包含的数据块中既不归属于第三备份文件,也不归属于目标备份文件的数据块。
第三备份文件中引用目标备份文件中包含的数据块的第三总大小减去第三备份文件中引用第一备份文件中包含的数据块第四总大小的差值为第三备份文件中包含的数据块中归属于目标备份文件的数据块,这些归属与目标备份文件的数据块被第三备份文件所引用,不进行删除。
在计算目标备份文件中能够被删除的数据的大小时,可以是先计算归属于目标备份文件的数据块的总大小,即第一总大小减去第二总大小的第一差值;再计算归属于目标备份文件的数据块中被第三备份文件所引用数据块的总大小,即第三总大小减去第四总大小的第二差值,归属于目标备份文件的数据块中,但被第三备份文件所引用数据块不被删除;最后,计算归属于目标备份文件的数据块中除被第三备份文件所引用的数据块外的数据块的总大小,也就是第一总大小减去第二总大小的第一差值,再减去第三总大小减去第四总大小的第二差值,即第一总大小,减去第二总大小,再减去第三总大小再加上第四总大小,即为目标备份文件中能够被删除的数据的总大小。
如表1所示,可以在备份链引用关系记录文件中记录备份文件中包含的数据块的总大小,以及备份文件中引用生成顺序位于该备份文件的生成顺序之前的每个备份文件中包含的数据块的总大小等信息。
假设目标备份文件中包含的多个数据块的总大小为Ta,目标备份文件中包含的数据块中引用第一备份文件的数据块的大小R(a,p),则第三备份文件中引用目标备份文件中的数据块的大小R(b,a),第三备份文件中引用第一备份文件中的数据块的大小R(b,p),目标备份文件中删除的数据的大小为Ta-R(a,p)-[R(b,a)-R(b,p)],其中a为目标备份文件的目标备份序号,p为第一备份文件的第一备份序号,b为第三备份文件的第三备份序号。
假设,待删除的目标备份文件为标识为备份4的备份文件,在不存在删除某个备份文件的情况下,可以根据每个备份文件的备份序号,在备份链引用关系记录文件中查询出第一备份文件为标识为3的备份文件,第三备份文件为标识为备份5的备份文件。目标备份文件中包含的多个数据块的总大小为T4,目标备份文件中包含的多个数据块中不归属于所述目标备份文件的数据块的总大小为R(4,3),第三备份文件中包含的多个数据块中归属于目标备份文件的数据块总大小为(R(5,4)-R(5,3),目标备份文件中删除的数据的大小为T4-R(4,3)-[(R(5,4)-R(5,3)]。
如果标识为备份3的备份文件被删除,则备份链引用关系记录文件中不包含标识为备份3的相关信息,可以根据每个备份文件的备份序号,在备份链引用关系记录文件中查询出第一备份文件为标识为2的备份文件,第三备份文件为标识为备份5的备份文件。目标备份文件中包含的多个数据块的总大小为T4,目标备份文件中包含的多个数据块中不归属于目标备份文件的数据块的总大小为R(4,2),第三备份文件中包含的多个数据块中归属于目标备份文件的数据块总大小为(R(5,4)-R(5,2),目标备份文件中删除的数据的大小为T4-R(4,2)-[(R(5,4)-R(5,2)]。
如果标识为备份3和备份5的备份文件被删除,则备份链引用关系记录文件中不包含标识为备份3和备份5的相关信息,可以根据每个备份文件的备份序号,在备份链引用关系记录文件中查询出第一备份文件为标识为2的备份文件,第三备份文件为标识为备份6的备份文件。目标备份文件中包含的多个数据块的总大小为T4,目标备份文件中包含的多个数据块中不归属于目标备份文件的数据块的总大小为R(4,2),第三备份文件中包含的多个数据块中归属于目标备份文件的数据块总大小为(R(6,4)-R(6,2),目标备份文件中删除的数据的大小为T4-R(4,2)-[(R(6,4)-R(6,2)]。
在本申请的另一实施例中,如果待删除的目标备份文件为第一次备份生成的备份文件,则在计算目标备份文件中删除的数据的大小时,可以直接将待删除的目标备份文件中包含的多个数据块的总大小,减去第三备份文件中引用目标备份文件中数据块的大小之和,即作为该目标备份文件中删除的数据的大小。
在本申请的另一实施例中,如果待删除的目标备份文件为最后一次备份生成的备份文件,则在计算目标备份文件中删除的数据的大小时,可以直接将待删除的目标备份文件中包含的多个数据块的总大小,减去目标备份文件中引用第一备份文件中数据块的大小之和,作为该目标备份文件中删除的数据的大小。
备份服务器可以是在接收到删除请求时,判断待删除的目标备份文件是否为第一次备份生成的备份文件,以及是否为最后一次备份生成的备份文件。判断是否为第一次备份生成的备份文件的过程在上述计算备份文件的大小的实施例中已经记载,在此不再进行描述。
在判断目标备份文件是否为最后一次备份生成的备份文件时,具体可以是根据预先保存的每个备份文件的备份序号,确定待删除的目标备份文件的备份序号是否为待删除的目标备份文件所在的备份链中最大的备份的序号,如果是,则确定待删除的目标备份文件为最后一次备份时生成的备份文件,否则,则确定待删除的目标备份文件非最后一次备份时生成的备份文件。
如图8所示,为删除目标备份文件的流程图,用户向备份服务器发送删除请求,用于删除目标备份文件,备份服务器根据预先保存的备份链引用关系记录文件中记录的目标备份文件中包含的多个数据块的总大小,目标备份文件中引用第一备份文件的数据块的总大小,第三备份文件中引用目标备份文件的数据块的总大小,第三备份文件中引用第一备份文件的数据块的总大小,计算目标备份文件中能够删除的数据的大小,并向用户反馈目标备份文件中能够删除的数据的大小。备份服务器还可以删除生产存储服务器中保存的目标备份文件中能够删除的数据。备份服务器在删除目标备份文件中能够删除的数据后,还可以对备份链引用关系记录文件进行更新,具体为删除备份链引用关系记录文件中记录的目标备份文件的相关信息,该相关信息具体包括目标备份文件的标识,备份序号,目标备份文件中包含的多个数据块的总大小,任一备份文件中引用目标备份文件中的数据块的总大小。
基于上述构思,如图9所述,本申请提供一种计算备份文件大小的装置900,该装置可包括处理单元901、收发单元902和存储单元903。所述计算备份文件大小的装置900可应用于备份服务器或备份服务器中的芯片。
存储单元903,可用于存储备份文件;
处理单元901,可用于确定待计算大小的目标备份文件,并确定第一备份文件,所述第一备份文件为创建时间位于所述目标备份文件的创建时间之前的,且创建时间与所述目标备份文件的创建时间最近的备份文件。备份文件的元数据中记录有备份文件的备份序号,数据块的引用信息,以及数据块的大小,数据块的引用信息用于指示数据块归属的备份文件;从所述目标备份文件的元数据中查询所述目标备份文件中包含的每个数据块的引用信息以获得归属于所述目标备份文件的第一数据块,所述每个数据块的引用信息用于指示所述数据块归属的备份文件;
根据所述目标备份文件的元数据中记录的数据块的引用信息以及所述第一备份文件的元数据中记录的数据块的引用信息获得归属于所述目标备份文件的第二数据块;
根据所述目标备份文件的元数据中记录的所述第一数据块和所述第二数据块的大小,确定所述目标备份文件的大小。
进一步地,处理单元901,可具体用于根据所述目标备份文件的元数据中记录的数据块的引用信息以及所述第一备份文件的元数据中记录的数据块的引用信息,获得归属于第二备份文件的数据块,所述第二备份文件的创建时间位于所述目标备份文件的创建时间之前,且位于所述第一备份文件的创建时间之后,所述第二备份文件已被删除;
将所述归属于第二备份文件的数据块,确定为归属于所述目标备份文件的第二数据块。
进一步地,处理单元901,可具体用于将第一数据块和第二数据块的大小之和,确定为所述目标备份文件的大小。
接收单元902,可用于接收查询请求,所述查询请求中包含所述目标备份文件的标识。
存储单元903,可用于在所述目标备份文件的元数据中记录所述每个数据块的引用信息,以及所述每个数据块的大小,以及在第一备份文件的元数据中记录所述第一备份文件中包含的每个数据块的引用信息。
需要说明的是,以上的各个单元的功能可由备份服务器的处理器执行或者处理器调用存储器中的程序进行执行。
基于上述构思,如图10所述,本申请提供一种计算备份文件中删除的数据大小的装置1000,该装置可包括处理单元1001、收发单元1002和存储单元1003。所述计算备份文件大小的装置1000可应用于备份服务器或备份服务器中的芯片。
存储单元1003,可用于存储备份文件;
处理单元1001,可用于确定目标备份文件,所述目标备份文件中包含多个数据块,所述目标备份文件是源文件的备份文件,所述源文件还具有第一备份文件和第三备份文件,所述第一备份文件包含多个数据块,所述第三备份文件包含多个数据块,所述第一备份文件为创建时间位于所述目标备份文件的创建时间之前的,且创建时间与所述目标备份文件的创建时间最近的备份文件,所述第一备份文件未被删除,所述第三备份文件为创建时间位于所述目标备份文件的创建时间之后的,且创建时间与所述目标备份文件的创建时间最近的备份文件,所述第三备份文件未被删除;
根据所述目标备份文件的元数据中记录的所述目标备份文件中包含的每个数据块的引用信息,获得归属于所述目标备份文件的第一数据块;
确定第一备份文件,根据所述目标备份文件的元数据中记录的目标备份文件中包含每个数据块的引用信息,以及所述第一备份文件的元数据中记录的第一备份文件中包含的每个数据块的引用信息,获得归属于所述目标备份文件的第二数据块,所述每个数据块的引用信息用于指示所述数据块归属的备份文件;
确定第三备份文件,根据所述第三备份文件的元数据中记录第三备份文件中包含的每个数据块的引用信息,以获得归属于所述目标备份文件的第一数据块和第二数据块中被第三备份文件引用的第三数据块;
根据所述第一数据块、第二数据块,以及所述第三数据块,确定能够被删除的第四数据块,根据目标备份文件的元数据中记录的每个第四数据块的大小,确定所述目标备份文件中能够被删除的数据的大小。
处理单元1001,可具体用于将第四数据块的大小之和,确定为所述目标备份文件中能够被删除的数据的大小。
处理单元1001,可具体用于将第一数据块和第二数据块中除第三数据块外的数据块确定为能够被删除的第四数据块。
处理单元1001,可具体用于根据所述目标备份文件的元数据中记录的数据块的引用信息以及所述第一备份文件的元数据中记录的数据块的引用信息,获得归属于第二备份文件的数据块,所述第二备份文件的创建时间位于所述目标备份文件的创建时间之前,且位于所述第一备份文件的创建时间之后,所述第二备份文件已被删除;将所述归属于第二备份文件的数据块,确定为归属于所述目标备份文件的第二数据块。
接收单元1002,可用于接收删除请求,所述删除请求中包含所述目标备份文件的标识。
存储单元1003,可用于在所述目标备份文件、第二备份文件、第一备份文件的元数据中记录各自的备份文件的备份序号,以及备份文件中包含的每个数据块的引用信息,所述每个数据块的大小。
需要说明的是,以上的各个单元的功能可由备份服务器的处理器执行或者处理器调用存储器中的程序进行执行。
基于上述构思,如图11所示,本申请还提供一种计算备份文件的大小的装置1100,该计算备份文件的大小的装置1100可应用于备份服务器或备份服务器中的芯片。
该计算备份文件的大小的装置1100可包括处理器1101和存储器1102。
所述存储器1102用于存储计算机指令;
所述处理器1101用于执行所述存储器1102所存储的计算机指令,以使所述计算备份文件的大小的装置实现如上述的计算备份文件大小的任一项所述的方法。
关于处理器1101、存储器1102的介绍,可参见上述计算备份文件的大小所示流程的介绍,在此不再赘述。
基于上述构思,如图12所示,本申请还提供一种计算备份文件中删除的数据的大小的装置1200,该计算备份文件中删除的数据的大小的装置1200可应用于备份服务器或备份服务器中的芯片。
该计算备份文件中删除的数据的大小的装置1200可包括处理器1201和存储器1202。
所述存储器1202用于存储计算机指令;
所述处理器1201用于执行所述存储器1202所存储的计算机指令,以使所述计算备份文件中删除的数据的大小的装置实现如上述的计算备份文件中删除的数据的大小的任一项所述的方法。
关于处理器1201、存储器1202的介绍,可参见上述计算备份文件的大小所示流程的介绍,在此不再赘述。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
显然,本领域的技术人员可以对本申请实施例进行各种改动和变型而不脱离本申请实施例的精神和范围。这样,倘若本申请实施例的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (13)

1.一种计算备份文件大小的方法,其特征在于,包括:
备份服务器确定目标备份文件,所述目标备份文件中包含多个数据块,所述目标备份文件是源文件的备份文件,所述源文件还具有第一备份文件,所述第一备份文件包含多个数据块,所述第一备份文件为创建时间位于所述目标备份文件的创建时间之前的,且创建时间与所述目标备份文件的创建时间最近的备份文件,所述第一备份文件未被删除;
从所述目标备份文件的元数据中查询所述目标备份文件中包含的每个数据块的引用信息以获得归属于所述目标备份文件的第一数据块,所述每个数据块的引用信息用于指示所述数据块归属的备份文件;
根据所述目标备份文件的元数据中记录的数据块的引用信息以及所述第一备份文件的元数据中记录的数据块的引用信息获得归属于所述目标备份文件的第二数据块;
根据所述目标备份文件的元数据中记录的所述第一数据块和所述第二数据块的大小,确定所述目标备份文件的大小。
2.根据权利要求1所述的方法,其特征在于,所述根据所述目标备份文件的元数据中记录的数据块的引用信息以及所述第一备份文件的元数据中记录的数据块的引用信息获得归属于所述目标备份文件的第二数据块包括:
根据所述目标备份文件的元数据中记录的数据块的引用信息以及所述第一备份文件的元数据中记录的数据块的引用信息,获得归属于第二备份文件的数据块,所述第二备份文件的创建时间位于所述目标备份文件的创建时间之前,且位于所述第一备份文件的创建时间之后,所述第二备份文件已被删除;
将所述归属于第二备份文件的数据块,确定为归属于所述目标备份文件的第二数据块。
3.根据权利要求1所述的方法,其特征在于,所述根据所述目标备份文件的元数据中记录的所述第一数据块和所述第二数据块的大小,确定所述目标备份文件的大小包括:
将第一数据块和第二数据块的大小之和,确定为所述目标备份文件的大小。
4.根据权利要求1所述的方法,其特征在于,还包括:
在所述目标备份文件的元数据中记录所述目标备份文件中包含的每个数据块的引用信息,和每个数据块的大小;
在所述第一备份文件的元数据中记录所述第一备份文件中包含的每个数据块的引用信息。
5.根据权利要求1所述的方法,其特征在于,所述备份服务器在确定目标备份文件之前,还包括:
接收查询请求,所述查询请求中包含所述目标备份文件的标识。
6.一种计算备份文件的大小的装置,其特征在于,包括处理单元和存储单元;
所述存储单元,用于存储备份文件;
所述处理单元,用于确定目标备份文件,所述目标备份文件中包含多个数据块,所述目标备份文件是源文件的备份文件,所述源文件还具有第一备份文件,所述第一备份文件包含多个数据块,所述第一备份文件为创建时间位于所述目标备份文件的创建时间之前的,且创建时间与所述目标备份文件的创建时间最近的备份文件,所述第一备份文件未被删除;
从所述目标备份文件的元数据中查询所述目标备份文件中包含的每个数据块的引用信息以获得归属于所述目标备份文件的第一数据块,所述每个数据块的引用信息用于指示所述数据块归属的备份文件;
根据所述目标备份文件的元数据中记录的数据块的引用信息以及所述第一备份文件的元数据中记录的数据块的引用信息获得归属于所述目标备份文件的第二数据块;
根据所述目标备份文件的元数据中记录的所述第一数据块和所述第二数据块的大小,确定所述目标备份文件的大小。
7.根据权利要求6所述的装置,其特征在于,所述处理单元,具体用于根据所述目标备份文件的元数据中记录的数据块的引用信息以及所述第一备份文件的元数据中记录的数据块的引用信息,获得归属于第二备份文件的数据块,所述第二备份文件的创建时间位于所述目标备份文件的创建时间之前,且位于所述第一备份文件的创建时间之后,所述第二备份文件已被删除;
将所述归属于第二备份文件的数据块,确定为归属于所述目标备份文件的第二数据块。
8.根据权利要求6所述的装置,其特征在于,所述处理单元,具体用于将第一数据块和第二数据块的大小之和,确定为所述目标备份文件的大小。
9.根据权利要求6所述的装置,其特征在于,所述存储单元,还用于在所述目标备份文件的元数据中记录所述目标备份文件中包含的每个数据块的引用信息,和每个数据块的大小;
在所述第一备份文件的元数据中记录所述第一备份文件中包含的每个数据块的引用信息。
10.根据权利要求6所述的装置,其特征在于,还包括:
接收单元,用于接收查询请求,所述查询请求中包含所述目标备份文件的标识。
11.一种计算备份文件的大小的装置,其特征在于,包括处理器和存储器;
所述存储器用于存储计算机指令;
所述处理器用于执行所述存储器所存储的计算机指令,以使所述计算备份文件的大小的装置实现如权利要求1至5任一项所述的方法。
12.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机指令,当所述计算机指令被计算机执行时,使得所述计算机执行如权利要求1至5中任一项所述的方法。
13.一种计算机程序产品,其特征在于,所述计算机程序产品包括计算机指令,当所述计算机指令被计算机执行时,使得所述计算机执行如权利要求1至5中任一项所述的方法。
CN201810966824.2A 2018-08-23 2018-08-23 一种计算备份文件大小的方法及装置 Active CN110858123B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201810966824.2A CN110858123B (zh) 2018-08-23 2018-08-23 一种计算备份文件大小的方法及装置
PCT/CN2019/079390 WO2020037985A1 (zh) 2018-08-23 2019-03-23 一种计算备份文件大小的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810966824.2A CN110858123B (zh) 2018-08-23 2018-08-23 一种计算备份文件大小的方法及装置

Publications (2)

Publication Number Publication Date
CN110858123A true CN110858123A (zh) 2020-03-03
CN110858123B CN110858123B (zh) 2021-06-01

Family

ID=69592250

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810966824.2A Active CN110858123B (zh) 2018-08-23 2018-08-23 一种计算备份文件大小的方法及装置

Country Status (2)

Country Link
CN (1) CN110858123B (zh)
WO (1) WO2020037985A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111581013A (zh) * 2020-03-18 2020-08-25 宁波送变电建设有限公司永耀科技分公司 基于元数据和影子文件的系统信息备份与重构方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11531488B2 (en) 2017-08-07 2022-12-20 Kaseya Limited Copy-on-write systems and methods

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2306022B (en) * 1995-10-06 1997-09-17 Mitsubishi Electric Corp Incremental backup system
CN102236586A (zh) * 2010-04-21 2011-11-09 雷州 一种计算机本地及网络多次增量的数据备份、恢复方法
CN102436408A (zh) * 2011-10-10 2012-05-02 上海交通大学 基于Map/Dedup的数据存储云化和云备份方法
CN102436478A (zh) * 2011-10-12 2012-05-02 浪潮(北京)电子信息产业有限公司 一种实现海量数据存取的系统及方法
CN104375905A (zh) * 2014-11-07 2015-02-25 北京云巢动脉科技有限公司 一种基于数据块的增量备份的方法和系统
WO2015199845A1 (en) * 2014-06-26 2015-12-30 Hewlett-Packard Development Company, L.P. Virtual machine data protection
CN105940379A (zh) * 2014-01-31 2016-09-14 西部数据技术公司 基线安装的备份
CN106155843A (zh) * 2016-07-13 2016-11-23 袁凌 一种虚拟机备份和逆向恢复方法
CN108268344A (zh) * 2017-12-26 2018-07-10 华为技术有限公司 一种数据处理方法和装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104317676A (zh) * 2014-11-21 2015-01-28 四川智诚天逸科技有限公司 一种数据备份容灾方法
CN104714864A (zh) * 2015-03-20 2015-06-17 成都云祺科技有限公司 一种计算机数据智能备份方法
CN104866391B (zh) * 2015-05-13 2019-08-02 三星电子(中国)研发中心 一种基于增量信息系统的终端信息备份方法和装置
CN105373452B (zh) * 2015-12-11 2019-02-01 上海爱数信息技术股份有限公司 一种数据备份方法
CN107506258B (zh) * 2016-06-14 2021-11-12 伊姆西Ip控股有限责任公司 用于数据备份的方法和设备
CN106973099B (zh) * 2017-03-28 2019-08-06 Oppo广东移动通信有限公司 一种数据更新方法、装置及系统

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2306022B (en) * 1995-10-06 1997-09-17 Mitsubishi Electric Corp Incremental backup system
CN102236586A (zh) * 2010-04-21 2011-11-09 雷州 一种计算机本地及网络多次增量的数据备份、恢复方法
CN102436408A (zh) * 2011-10-10 2012-05-02 上海交通大学 基于Map/Dedup的数据存储云化和云备份方法
CN102436478A (zh) * 2011-10-12 2012-05-02 浪潮(北京)电子信息产业有限公司 一种实现海量数据存取的系统及方法
CN105940379A (zh) * 2014-01-31 2016-09-14 西部数据技术公司 基线安装的备份
WO2015199845A1 (en) * 2014-06-26 2015-12-30 Hewlett-Packard Development Company, L.P. Virtual machine data protection
CN104375905A (zh) * 2014-11-07 2015-02-25 北京云巢动脉科技有限公司 一种基于数据块的增量备份的方法和系统
CN106155843A (zh) * 2016-07-13 2016-11-23 袁凌 一种虚拟机备份和逆向恢复方法
CN108268344A (zh) * 2017-12-26 2018-07-10 华为技术有限公司 一种数据处理方法和装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111581013A (zh) * 2020-03-18 2020-08-25 宁波送变电建设有限公司永耀科技分公司 基于元数据和影子文件的系统信息备份与重构方法

Also Published As

Publication number Publication date
WO2020037985A1 (zh) 2020-02-27
CN110858123B (zh) 2021-06-01

Similar Documents

Publication Publication Date Title
US11799959B2 (en) Data processing method, apparatus, and system
US10248336B1 (en) Efficient deletion of shared snapshots
EP3678015A1 (en) Metadata query method and device
CN107590207B (zh) 数据同步方法及装置、电子设备
WO2015034827A1 (en) Replication of snapshots and clones
US9990156B1 (en) Deduplicating snapshots associated with a backup operation
CN110858123B (zh) 一种计算备份文件大小的方法及装置
CN107330024B (zh) 标签系统数据的存储方法和装置
CN112579692B (zh) 一种数据同步方法、装置、系统、设备及存储介质
CN106682017B (zh) 一种数据库更新方法及装置
CN109491834B (zh) 一种应用于数据库的数据恢复方法及装置
CN108197170B (zh) 主从同步方法、装置、主服务器及存储介质
GB2587530A (en) Snapshot space reduction method and apparatus
CN109471901B (zh) 一种数据同步方法及装置
CN110716924A (zh) 删除过期数据的方法和装置
CN113157600A (zh) 一种叠瓦式硬盘的空间分配方法、文件存储系统及服务器
US11157367B1 (en) Promotional logic during database differential backup
CN114416689A (zh) 数据迁移方法、装置、计算机设备、存储介质
CN108984343B (zh) 一种基于内容分析的虚拟机备份及存储管理方法
US9483560B2 (en) Data analysis control
CN106484776B (zh) 一种基于多线程的数据处理方法及装置
CN105022796A (zh) 一种文件遍历方法、装置及系统
CN110968587A (zh) 一种数据处理方法及装置
CN112860694B (zh) 业务数据的处理方法、装置及设备
US9158767B2 (en) Lock-free indexing of documents

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant