CN110399333A - 删除快照的方法、设备和计算机程序产品 - Google Patents

删除快照的方法、设备和计算机程序产品 Download PDF

Info

Publication number
CN110399333A
CN110399333A CN201810360804.0A CN201810360804A CN110399333A CN 110399333 A CN110399333 A CN 110399333A CN 201810360804 A CN201810360804 A CN 201810360804A CN 110399333 A CN110399333 A CN 110399333A
Authority
CN
China
Prior art keywords
snapshot
weight
deleted
data block
physical address
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810360804.0A
Other languages
English (en)
Other versions
CN110399333B (zh
Inventor
吕烁
陈欢
胡国玉
韩超
周巧生
刘剑
宫晨
顾聪越
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
EMC Corp
Original Assignee
EMC IP Holding Co LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by EMC IP Holding Co LLC filed Critical EMC IP Holding Co LLC
Priority to CN201810360804.0A priority Critical patent/CN110399333B/zh
Priority to US16/238,710 priority patent/US11100047B2/en
Publication of CN110399333A publication Critical patent/CN110399333A/zh
Application granted granted Critical
Publication of CN110399333B publication Critical patent/CN110399333B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/16File or folder operations, e.g. details of user interfaces specifically adapted to file systems
    • G06F16/162Delete operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/11File system administration, e.g. details of archiving or snapshots
    • G06F16/128Details of file system snapshots on the file-level, e.g. snapshot creation, administration, deletion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1448Management of the data involved in backup or backup restore
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1448Management of the data involved in backup or backup restore
    • G06F11/1451Management of the data involved in backup or backup restore by selection of backup contents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F12/00Accessing, addressing or allocating within memory systems or architectures
    • G06F12/02Addressing or allocation; Relocation
    • G06F12/0223User address space allocation, e.g. contiguous or non contiguous base addressing
    • G06F12/023Free address space management
    • G06F12/0238Memory management in non-volatile memory, e.g. resistive RAM or ferroelectric memory
    • G06F12/0246Memory management in non-volatile memory, e.g. resistive RAM or ferroelectric memory in block erasable memory, e.g. flash memory
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/81Threshold
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/84Using snapshots, i.e. a logical point-in-time copy of the data

Abstract

本公开的实施例涉及一种删除快照的方法、设备和计算机程序产品。该方法包括响应于文件的多个待删除的快照所指向的数据块被共享,确定数据块的物理地址是否与文件的目标快照所指向的数据块的目标物理地址相同。该方法还包括响应于多个待删除的快照所指向的数据块的物理地址与目标物理地址相同,将与多个待删除的快照相关联的标识位设置为第一状态。该方法还包括响应于检测到第一状态,利用多个待删除的快照的权重的总和来更新目标权重,多个待删除的快照的权重和目标权重分别指示多个待删除的快照和目标快照对所指向的数据块共享的份额。

Description

删除快照的方法、设备和计算机程序产品
技术领域
本公开的实施例涉及存储系统,并更为具体地涉及文件系统中的删除快照的方法、设备和计算机程序产品。
背景技术
在存储系统中,通常基于具有一定存储容量的实际存储设备来创建一个或多个文件系统以及文件系统的快照(Snapshot)。快照是文件系统中的文件在特定时间点的拷贝。该拷贝包括相应数据在拷贝开始的时间点的映像,其能够在存储设备发生逻辑错误或文件损坏的情况下进行快速的数据恢复。
当不再需要某些快照或者快照的数目超过阈值时,可以删除这些快照以释放存储空间。目前,对多个快照的删除是逐个进行的,因而需要针对每个快照执行相关联的元数据的读取和写入操作,耗费了大量时间,导致存储空间无法被快速释放。
发明内容
本公开的实施例提供了删除快照的方法、设备以及计算机程序产品。
在本公开的第一方面,提供了一种删除快照的方法。该方法包括:响应于文件的多个待删除的快照所指向的数据块被共享,确定多个待删除的快照所指向的数据块的物理地址是否与文件的目标快照所指向的数据块的目标物理地址相同。该方法还包括响应于多个待删除的快照所指向的数据块的物理地址与目标物理地址相同,将与多个待删除的快照相关联的标识位设置为第一状态。该方法还包括响应于检测到第一状态,利用多个待删除的快照的权重的总和来更新目标权重,多个待删除的快照的权重和目标权重分别指示多个待删除的快照和目标快照对所指向的数据块共享的份额。
在一些实施例中,更新目标权重包括:将多个待删除的快照的权重和目标权重的总和与阈值权重相比较;以及响应于多个待删除的快照的权重和目标权重的总和在阈值权重以下,以多个待删除的快照的权重和目标权重的总和来更新目标权重。
在一些实施例中,该方法进一步包括:响应于多个待删除的快照中的第一快照所指向的数据块的第一物理地址与目标物理地址不同,将与第一快照相关联的标识位设置为第二状态,第二状态不同于第一状态,以及存储第一物理地址。
在一些实施例中,该方法进一步包括:响应于多个待删除的快照中的第二快照所指向的数据块的第二物理地址与目标物理地址不同,第二快照不同于第一快照,确定第二物理地址是否与第一物理地址相同,响应于第二物理地址与第一物理地址相同,将与第一快照相关联的标识位以及与第二快照相关联的标识位设置为第三状态,第三状态不同于第一状态和第二状态,以及响应于检测到第三状态,利用第一快照的第一权重和第二快照的第二权重的总和来更新与第一快照所指向的数据块相关联的总权重,第一权重和第二权重各自占总权重的相应比例。
在一些实施例中,该方法进一步包括:存储与第一快照所指向的数据块相关联的块元数据的物理地址,块元数据记录总权重。
在一些实施例中,该方法进一步包括:将第一权重和第二权重的总和与总权重进行比较;响应于第一权重和第二权重的总和与总权重相等,将与第一快照相关联的标识位以及与第二快照相关联的标识位的第三状态改变为第四状态;以及响应于检测到第四状态,释放第一快照所指向的数据块。
在一些实施例中,该方法进一步包括:基于多个待删除的快照的文件偏移量、多个待删除的快照所指向的数据块的大小以及与多个待删除的快照相关联的叶子间接块的大小,确定多个待删除的快照所指向的数据块的物理地址。
在本公开的第二方面,提供了一种电子设备。该设备包括至少一个处理器、以及包括计算机程序指令的至少一个存储器。至少一个存储器和计算机程序指令被配置为,与至少一个处理器一起,使得设备:响应于文件的多个待删除的快照所指向的数据块被共享,确定数据块的物理地址是否与文件的目标快照所指向的数据块的目标物理地址相同;响应于多个待删除的快照所指向的数据块的物理地址与目标物理地址相同,将与多个待删除的快照相关联的标识位设置为第一状态;以及响应于检测到第一状态,利用多个待删除的快照的权重的总和来更新目标权重,多个待删除的快照的权重和目标权重分别指示多个待删除的快照和目标快照对所指向的数据块共享的份额。
在本公开的第三方面,提供了一种计算机程序产品。该计算机程序产品被有形地存储在非易失性计算机可读介质上并且包括机器可执行指令。机器可执行指令在被执行时使机器执行根据第一方面的方法的步骤。
提供发明内容部分是为了简化的形式来介绍对概念的选择,它们在下文的具体实施方式中将被进一步描述。发明内容部分无意标识本公开的关键特征或主要特征,也无意限制本公开的范围。
附图说明
通过结合附图对本公开示例性实施例进行更详细的描述,本公开的上述以及其它目的、特征和优势将变得更加明显,其中,在本公开示例性实施例中,相同的参考标号通常代表相同部件。
图1示出了存储系统的示意图;
图2示出了另一存储系统的示意图;
图3示出了根据本公开的一个实施例的快照删除方法的流程图;
图4示出了根据本公开的实施例的IB分层结构的示意图;
图5示出了根据本公开的实施例的MP的示意图;
图6示出了根据本公开的另一个实施例的快照删除的方法的流程图;
图7示出了根据本公开的实施例的日志文件中的记录的示例;以及
图8示出了可以被用来实施本公开的实施例的设备的示意性框图。
贯穿所有附图,相同或者相似的参考标号被用来表示相同或者相似的组件。
具体实施方式
下面将参照附图更详细地描述本公开的优选实施例。虽然附图中显示了本公开的优选实施例,然而应该理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。
在本文中使用的术语“包括”及其变形表示开放性包括,即“包括但不限于”。除非特别申明,术语“或”表示“和/或”。术语“基于”表示“至少部分地基于”。术语“一个示例实施例”和“一个实施例”表示“至少一个示例实施例”。术语“另一实施例”表示“至少一个另外的实施例”。术语“第一”、“第二”等等可以指代不同的或相同的对象。下文还可能包括其他明确的和隐含的定义。
图1示出了存储系统100的示意图。如图所示,存储系统100包括源文件102以及源文件102的快照104、106和108。出于简化描述的目的,在图1中仅示出了源文件102的三个快照。然而,应当理解,源文件102可以包括更多的快照。
源文件102及其快照104、106和108共享数据块110。为了指示对数据块110的共享,源文件102及其快照104、106和108分别被指派了权重W0、W1、W2和W3。权重W0、W1、W2和W3分别被存储在与源文件102以及快照104、106和108相关联的叶子间接块(Indirect Block,IB)中。与数据块110相关联的总权重被存储在与数据块110相关联的块元数据(BlockMetadata,BMD)120中。
由于多个快照对单个数据块的共享,因此当删除一个快照时,需要调整权重在快照之间的分配,例如可以将待删除的快照的权重与保留的快照的权重合并(以下简称“权重合并”操作)。例如,当删除快照106时,可以从与快照104相关联的叶子间接块中读取快照104的权重W1,将快照106的权重W2与快照104的权重W1相加而获得总和权重W2+W1,然后以总和权重W2+W1来更新快照104的权重。如果需要继续删除快照108,则可以采用同样的方式将快照108的权重与快照104的权重合并。可见,在删除多个快照时,需要针对每个待删除的快照执行上述权重合并操作,也即,需要多次执行待更新的权重的读取和写入操作,因而是耗时的。当待删除的快照的数目庞大时,可能需要花费几天的时间执行删除操作,使得存储空间无法被快速释放。
当删除一个快照时,可以不执行上述权重合并操作,而是更新与被共享的数据块相关联的BMD(以下简称“权重归还”操作)。以下将参考图2进行描述。
图2示出了存储系统200的示意图。如图所示,存储系统200包括源文件102以及源文件102的快照204、106和108。出于简化描述的目的,在图2中仅示出了源文件102的三个快照。然而,应当理解,源文件102可以包括更多的快照。
与图1不同的是,在图2中,仅源文件102及其快照106和208共享数据块210,而快照204不共享数据块110。为了指示对数据块210的共享,源文件102及其快照106和108分别被指派了权重W4、W5和W6。不同于图1,由于快照204没有共享数据块110,因此在删除快照106时,不能够将快照106的权重W5与快照204的权重进行合并,而是需要利用快照106的权重W5来更新BMD 120中存储的总权重,即从总权重中减去权重W5。如果需要继续删除快照108,则可以采用同样的方式从总权重中再减去权重W6。可见,在删除多个快照时,需要针对每个待删除的快照执行总权重的更新过程,也即,需要多次执行总权重的读取和写入操作,因而是耗时的。
为了至少部分地解决上述问题以及其他潜在问题,本公开的实施例提供了一种多个快照的并行删除方案。根据本公开的各种示例实施例,将共享单个数据块的多个快照的标识位设置为预定状态,对于标识位被设置为相同预定状态的多个快照进行并行删除,由此减少了读取和写入与快照相关联的元数据的次数,提高了快照删除的效率。以下将参考图3至图7详细描述根据本公开实施例的快照删除的方法。
图3示出了根据本公开的一个实施例的快照删除的方法300的流程图。在一些实施例中,方法300可以由存储系统100来实现,例如可以由存储系统100的控制器或控制单元来实现。在其他实施例中,方法300也可以由独立于存储系统100的计算设备来实现。应当理解的是,方法300还可以包括未示出的附加步骤和/或可以省略所示出的步骤,本公开的范围在此方面不受限制。为了方便讨论,将结合图1来讨论方法300。具体地,将以图1中的快照106和108作为待删除的快照的示例并且以快照104作为目标快照的示例进行说明。应当理解,尽管图1中描绘了两个待删除的快照,但是该具体数目仅为示例性的,无意以任何方式限定本公开的实施例的范围。在其他实施例中,存储系统100也可以包括其他不同数目的待删除的快照。
在310处,响应于文件的多个待删除的快照所指向的数据块被共享,确定多个待删除的快照所指向的数据块的物理地址是否与所述文件的目标快照所指向的数据块的目标物理地址相同。也即,确定多个待删除的快照是否与目标快照共享相同的数据块。
在一些实施例中,可以选择文件的任一个非待删除的快照作为目标快照。例如,可以选择创建时间与待删除的快照的创建时间邻近的一个快照作为目标快照。例如,在图1的示例中,多个待删除的快照可以包括快照106和108,并且可以选择快照104作为目标快照。在这样的示例中,可以确定快照106和108所指向的数据块的物理地址是否与目标快照104所指向的数据块的目标物理地址相同。
在一些实施例中,可以从与快照相关联的叶子IB所记录的信息确定待删除的快照所指向的数据块是否被共享,即确定待删除的快照所指向的数据块是否为被共享的数据块。在一些实施例中,快照所指向的数据块的物理地址可以从与快照相关联的叶子IB获取。
在诸如UNIX的操作系统中,文件系统元数据通常包括索引节点(inode)和间接块(Indirect Block,以下简称为IB)等。其中,间接块是最重要的元数据,其是动态分配的指向文件的数据块(即用于存储数据的存储单元)的指针空间。IB采用被称作“IB树”的分层结构被组织,其中上一层IB用于存储下一层IB的地址,并且位于最低层的IB(即,叶子IB)用于存储数据块的物理地址。
图4示出了根据本公开的实施例的IB分层结构400的示意图。出于简化描述的目的,在图4中仅示出了两层IB,即叶子IB和叶子IB的上一层IB(在本文中也被称为“中间IB”)。然而,应当理解,IB分层结构400可以包括更多的层次。
每个IB可以包含多个映射指针(Mapping Pointer,MP)。仅仅出于说明的目的,在图4的示例中示出了每个IB包含1024个MP,但是该具体数目仅为示例性的,无意以任何方式限定本公开的实施例的范围。每个MP可以包含下一层间接块的地址或数据块的物理地址。如图4所示,中间IB 410包含1024个MP,即MP 4101、4102……4101024,MP 4101、4102……4101024分别记录了叶子IB 4201、4202……4201024的地址。同时,每个叶子IB包含1024个MP,每个MP用于记录1024个数据块的地址。例如,叶子IB 4201包含MP 4301、1302……1301024,叶子IB 4202包含MP 4301024+1、4301024+2……4302×1024,叶子IB 4201024包含MP 4301023×1024+1、4301023×1024+2……4301024×1024
在一些实施例中,MP除了记录数据块的物理地址以外,还可以包括用于属性字段、权重字段等。图5示出了根据本公开的实施例的MP 500的示意图。
如图5所示,MP 500包括属性字段510、权重字段520、未使用的字段530和块地址字段540。
属性字段510包含4比特的标记位S、G、D和V。标记位S为共享标记位,用于指示MP500所指向的数据块是否为被共享的数据块。标记位G指示MP 500在所指向的数据块的BMD中是否具有块摘要(digest)。标记位D指示MP 500是否指向其块地址可以根据算法来计算的数据块。标记位V指示MP 500是否为虚拟指针。标记位S可以被设置为预定状态(例如,设置为1)以指示MP 500所指向的数据块为被共享的数据块,否则可以设置为另一状态(例如,设置为0)。标记位G、D和V的设置以此类推,不再赘述。如果标记位D和V被设置为相同状态(例如均设置为1),则指示MP 500所指向的数据块为坏块。
权重字段520包含17比特,用于记录指派给文件或文件的快照的权重,该权重指示文件或文件的快照对MP 500所指向的数据块共享的份额。未使用的字段530包含被保留以供将来使用的1比特。块地址字段540包含42比特,用于记录MP 500所指向的数据块的物理地址。
从图5可以看出,可以根据与待删除的快照相关联的叶子IB中的MP所记录的信息,确定待删除的快照所指向的数据块是否为被共享的数据块。例如,如果MP中的共享标记位被设置为1,则可以确定该MP所指向的数据块为被共享的数据块。此外,可以根据与待删除的快照相关联的叶子IB中的MP的块地址字段,确定待删除的快照所指向的数据块的物理地址。可以根据与目标快照相关联的叶子IB中的MP的块地址字段,确定目标快照所指向的数据块的物理地址(以下也称为“目标物理地址”)。
可以理解,图5所示的MP 500的结构仅是示例,无意以任何方式限定本公开的实施例的范围,采用具有其他结构的MP也是可能的。
继续参考图3,如图在310处确定多个待删除的快照所指向的数据块的物理地址与所述文件的目标快照所指向的数据块的目标物理地址相同,则方法300进行到320,在此将与多个待删除的快照相关联的标识位设置为第一状态。例如,在图1的示例中,可以将与快照106相关联的标识位设置为第一状态以及将与快照108相关联的标识位设置为第一状态。
该第一状态可以指示将要通过执行上述“权重合并”操作来删除多个待删除的快照。例如,在使用3比特标识位的情况下,可以通过将标识位设置为000,以指示将要通过执行上述“权重合并”操作来删除多个待删除的快照。
在330处,响应于检测到第一状态,利用多个待删除的快照的权重的总和来更新目标权重。多个待删除的快照的权重和目标权重分别指示多个待删除的快照和目标快照对所指向的数据块共享的份额。例如,在图1的示例中,可以利用快照106的权重W2和快照108的权重W3的总和来更新目标快照104的目标权重W1,也即,将目标快照104的目标权重W1改变为W1+W2+W3。
根据本公开的实施例,通过将共享单个数据块的多个快照的标识位设置为预定状态,利用标识位被设置为预定状态的多个快照的权重的总和来更新目标快照的权重,而不是像传统方案那样利用单个快照的权重依次更新目标快照的权重,由此减少了读取和写入目标权重的次数,提高了快照删除的效率。
在一些实施例中,在更新目标快照的目标权重之前,可以将多个待删除的快照的权重和目标权重的总和与目标权重的阈值(即,阈值权重)相比较。如果多个待删除的快照的权重和目标权重的总和在阈值权重以下,则以多个待删除的快照的权重和目标权重的总和来更新目标权重。由此可以避免因多个待删除的快照的权重和目标权重的总和超过目标权重的阈值而导致错误操作。
在一些实施例中,可以基于多个待删除的快照的文件偏移量、多个待删除的快照所指向的数据块的大小以及与多个待删除的快照相关联的叶子间接块的大小,确定多个待删除的快照所指向的数据块的物理地址。相比于通过遍历与待删除的快照相关联的IB树来确定待删除的快照所指向的数据块的物理地址的传统方案,根据本公开实施例的方式能够更加快速地定位到与待删除的快照相关联的IB树的叶子IB,从而能够更加快速地确定待删除的快照所指向的数据块的物理地址。
可以理解,在与待删除的快照相关联的叶子IB包含多个(例如1024个)MP的实施例中,可以针对每个MP执行方法300,以删除快照对每个MP所指向的数据块的共享,从而删除该快照。
另一方面,如果在310处确定多个待删除的快照所指向的数据块的物理地址与所述文件的目标快照所指向的数据块的目标物理地址不同,则方法300进行到340,在此执行适当操作。在一些实施例中,在340处可以根据传统方案来删除多个待删除的快照。在另一些实施例中,在340处可以通过执行以下参考图6描述的方法600来删除多个待删除的快照。
图6示出了根据本公开的另一个实施例的快照删除的方法600的流程图。在一些实施例中,方法600可以由存储系统200来实现,例如可以由存储系统200的控制器或控制单元来实现。在其他实施例中,方法600也可以由独立于存储系统200的计算设备来实现。应当理解的是,方法600还可以包括未示出的附加步骤和/或可以省略所示出的步骤,本公开的范围在此方面不受限制。
在610处,确定多个待删除的快照中的第一快照所指向的数据块的第一物理地址与地址集合中记录的物理地址是否相同。该地址集合例如可以存储于内存中。
如果在610处确定第一物理地址与地址集合中记录的物理地址不同,则方法进行到612,在此确定具有第一物理地址的数据块是否为假共享块。例如,可以将第一快照的第一权重与具有第一物理地址的数据块的BMD中记录的总权重进行比较。如果第一权重等于总权重,则可以确定第一快照为假共享块,即没有其他快照与第一快照共享具有第一物理地址的数据块,进而可以在614处释放该数据块。
如果在612处确定具有第一物理地址的数据块不是假共享块,则方法600进行到616,在此将与第一快照相关联的标识位设置为第二状态。该第二状态可以指示将要通过执行上述“权重归还”操作来删除该第一快照。此外,在618处,在地址集合中记录第一物理地址,以便后续快照所指向的数据块的物理地址与之进行比较。在620处,在内存中存储与具有第一物理地址的数据块相关联的BMD的物理地址,从而在随后使用时无需再通过访问磁盘来读取该BMD。随后,在622处,如果后续快照所指向的数据块的物理地址均与第一物理地址,则响应于检测到第二状态而针对第一快照执行上述“权重归还”操作。
另一方面,如果在610处确定第一物理地址与地址集合中记录的物理地址相同,则方法进行到624,在此查找指向具有所记录的物理地址的数据块的快照,例如第二快照。在626,将与第一快照相关联的标识位设置为第三状态以及将与第二快照相关联的标识位设置为第三状态。该第三状态可以指示将要通过针对多个快照执行上述“权重归还”操作来删除多个快照。在下文中,针对多个快照执行上述“权重归还”操作也被称作“多权重归还”操作。
在628处,确定标识位被设置为第三状态的多个快照(例如第一快照和第二控制)的权重的总和与具有第一物理地址的数据块相关联的BMD中记录的总权重是否相等。如果该总和与总权重相等,则方法进行到630,在此释放具有第一物理地址的数据块。如果该总和与总权重不相等,则方法进行到632,在此响应于检测到第三状态,针对标识位被设置为第三状态的快照执行上述“多权重归还”操作,即通过从BMD中记录的总权重中减去这些快照的权重的总和来更新该总权重。
根据本公开的实施例,通过将共享单个数据块的多个快照(例如上述第一快照和第二快照)的标识位设置为第三状态,利用标识位被设置为第三状态的多个快照的权重的总和来更新该数据块的总权重,而不是像传统方案那样利用单个快照的权重依次更新该总权重,由此减少了从磁盘读取和向磁盘写入总权重的次数,提高了快照删除的效率。
应当理解,仅仅出于说明的目的,以第一快照和第二快照为例对方法600进行了描述。然而,当待删除的快照包括两个以上快照时,可以针对每个待删除的快照执行方法600。
在一些实施例中,为了防止因存储系统意外断电而导致内存中的数据与磁盘中的数据的不一致,在针对内存中的待删除的快照执行上述“权重合并”操作、“权重归还”操作和“多权重归还”操作之前,在日志文件中记录将要针对与每个待删除的快照相关联的MP执行的操作的类型、以及与操作相关联的元数据。
如前所述,每个IB可以包含多个MP,例如在图4的示例中示出了每个IB包含1024个MP。在一些实施例中,可以为多个MP中的每个MP指派一个偏移量。例如,在每个IB包含1024个MP的示例中,可以为1024个MP分别指派偏移量0、偏移量1、……、偏移量1023。在本公开的实施例中,可以在日志文件中记录针对多个待删除的快照的相应偏移量是否进行了处理、将要执行的操作的类型以及与操作相关联的元数据。
在一些实施例中,可以采用位图来记录针对相应偏移量是否进行了处理。例如,位图中与偏移量相关联的位可以被设置为预定状态(例如,设置为1)以指示针对该偏移量进行了处理,例如针对该偏移量执行了方法300或600。此外,对于将要执行的操作的类型以及与操作相关联的元数据,例如可以采用如图7所示的记录700。
图7示出了根据本公开的实施例的日志文件中的记录700的示例。如图所示,记录700包括操作码字段710和元数据字段720。
操作码字段710包含4比特的标记位711至714。标记位711至713用于指示针对相应偏移量将要执行的操作的类型,而标记位714被保留供将来使用。例如,标记位711可以用于指示针对相应偏移量是否将要执行“权重合并”操作,标记位712可以用于指示针对相应偏移量是否将要执行“权重归还”操作,标记位713可以用于指示与下一个偏移量相关联的数据的开始。
在一些实施例中,元数据字段720可以包括32比特,用于记录与“权重合并”操作相关联的权重值。在另一些实施例中,元数据字段720可以包括3×32比特(即96比特),用于针对“权重归还”操作,记录该偏移量所指向的数据块的更新后的总权重以及该数据块的物理地址。
可以理解,图7所示的记录700的结构仅是示例,无意以任何方式限定本公开的实施例的范围,在日志文件中采用具有其他结构的记录也是可能的。
根据本公开的实施例,可以针对多个待删除的快照联合记录日志,相比于针对每个待删除的快照单独记录日志的传统方案,减少了记录的次数,提高了效率。
图8示意性地示出了一种可以被用来实施本公开的实施例的设备800的框图。如图8中所示出的,设备800包括中央处理单元(CPU)801,其可以根据存储在只读存储设备(ROM)802中的计算机程序指令或者从存储单元808加载到随机访问存储设备(RAM)803中的计算机程序指令,来执行各种适当的动作和处理。在RAM 803中,还可存储设备800操作所需的各种程序和数据。CPU 801、ROM 802以及RAM 803通过总线804彼此相连。输入/输出(I/O)接口805也连接至总线804。
设备800中的多个部件连接至I/O接口805,包括:输入单元806,例如键盘、鼠标等;输出单元807,例如各种类型的显示器、扬声器等;存储单元808,例如磁盘、光盘等;以及通信单元809,例如网卡、调制解调器、无线通信收发机等。通信单元809允许设备800通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
上文所描述的各个过程和处理,例如方法300、600,可由处理单元801来执行。例如,在一些实施例中,方法300、600可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元808。在一些实施例中,计算机程序的部分或者全部可以经由ROM 802和/或通信单元809而被载入和/或安装到设备800上。当计算机程序被加载到RAM 803并由CPU 801执行时,可以执行上文描述的方法300、600的一个或多个步骤。
如本文所使用的,术语“包括”及其类似用语应当理解为开放性包含,即“包括但不限于”。术语“基于”应当理解为“至少部分地基于”。术语“一个实施例”或“该实施例”应当理解为“至少一个实施例”。术语“第一”、“第二”等等可以指代不同的或相同的对象。本文还可能包括其他明确的和隐含的定义。
如本文所使用的,术语“确定”涵盖各种各样的动作。例如,“确定”可以包括运算、计算、处理、导出、调查、查找(例如,在表格、数据库或另一数据结构中查找)、查明等。此外,“确定”可以包括接收(例如,接收信息)、访问(例如,访问存储器中的数据)等。此外,“确定”可以包括解析、选择、选取、建立等。
应当注意,本公开的实施例可以通过硬件、软件或者软件和硬件的结合来实现。硬件部分可以利用专用逻辑来实现;软件部分可以存储在存储器中,由适当的指令执行系统,例如微处理器或者专用设计硬件来执行。本领域的技术人员可以理解上述的设备和方法可以使用计算机可执行指令和/或包含在处理器控制代码中来实现,例如在可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。
此外,尽管在附图中以特定顺序描述了本公开的方法的操作,但是这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。相反,流程图中描绘的步骤可以改变执行顺序。附加地或备选地,可以省略某些步骤,将多个步骤组合为一个步骤执行,和/或将一个步骤分解为多个步骤执行。还应当注意,根据本公开的两个或更多装置的特征和功能可以在一个装置中具体化。反之,上文描述的一个装置的特征和功能可以进一步划分为由多个装置来具体化。
虽然已经参考若干具体实施例描述了本公开,但是应当理解,本公开不限于所公开的具体实施例。本公开旨在涵盖所附权利要求的精神和范围内所包括的各种修改和等效布置。

Claims (15)

1.一种删除快照的方法,包括:
响应于文件的多个待删除的快照所指向的数据块被共享,确定所述多个待删除的快照所指向的所述数据块的物理地址是否与所述文件的目标快照所指向的数据块的目标物理地址相同;
响应于所述多个待删除的快照所指向的所述数据块的所述物理地址与所述目标物理地址相同,将与所述多个待删除的快照相关联的标识位设置为第一状态;以及
响应于检测到所述第一状态,利用所述多个待删除的快照的权重的总和来更新所述目标权重,所述多个待删除的快照的所述权重和所述目标权重分别指示所述多个待删除的快照和所述目标快照对所指向的所述数据块共享的份额。
2.根据权利要求1所述的方法,其中更新所述目标权重包括:
将所述多个待删除的快照的所述权重和所述目标权重的总和与阈值权重相比较;以及
响应于所述多个待删除的快照的所述权重和所述目标权重的所述总和在所述阈值权重以下,以所述多个待删除的快照的所述权重和所述目标权重的所述总和来更新所述目标权重。
3.根据权利要求1所述的方法,进一步包括:
响应于所述多个待删除的快照中的第一快照所指向的数据块的第一物理地址与所述目标物理地址不同,
将与所述第一快照相关联的标识位设置为第二状态,所述第二状态不同于所述第一状态,以及
存储所述第一物理地址。
4.根据权利要求3所述的方法,进一步包括:
响应于所述多个待删除的快照中的第二快照所指向的数据块的第二物理地址与所述目标物理地址不同,所述第二快照不同于所述第一快照,
确定所述第二物理地址是否与所述第一物理地址相同,
响应于所述第二物理地址与所述第一物理地址相同,将与所述第一快照相关联的所述标识位以及与所述第二快照相关联的标识位设置为第三状态,所述第三状态不同于所述第一状态和所述第二状态,以及
响应于检测到所述第三状态,利用所述第一快照的第一权重和所述第二快照的第二权重的总和来更新与所述第一快照所指向的所述数据块相关联的总权重,所述第一权重和所述第二权重各自占所述总权重的相应比例。
5.根据权利要求4所述的方法,进一步包括:
存储与所述第一快照所指向的所述数据块相关联的块元数据的物理地址,所述块元数据记录所述总权重。
6.根据权利要求4所述的方法,进一步包括:
将所述第一权重和所述第二权重的所述总和与所述总权重进行比较;
响应于所述第一权重和所述第二权重的所述总和与所述总权重相等,将与所述第一快照相关联的所述标识位以及与所述第二快照相关联的所述标识位的所述第三状态改变为第四状态;以及
响应于检测到所述第四状态,释放所述第一快照所指向的所述数据块。
7.根据权利要求1所述的方法,进一步包括:
基于所述多个待删除的快照的文件偏移量、所述多个待删除的快照所指向的所述数据块的大小以及与所述多个待删除的快照相关联的叶子间接块的大小,确定所述多个待删除的快照所指向的所述数据块的所述物理地址。
8.一种电子设备,包括:
至少一个处理器;以及
包括计算机程序指令的至少一个存储器,所述至少一个存储器和所述计算机程序指令被配置为,与所述至少一个处理器一起,使得所述设备:
响应于文件的多个待删除的快照所指向的数据块被共享,确定所述多个待删除的快照所指向的所述数据块的物理地址是否与所述文件的目标快照所指向的数据块的目标物理地址相同;
响应于所述多个待删除的快照所指向的所述数据块的所述物理地址与所述目标物理地址相同,将与所述多个待删除的快照相关联的标识位设置为第一状态;以及
响应于检测到所述第一状态,利用所述多个待删除的快照的权重的总和来更新所述目标权重,所述多个待删除的快照的所述权重和所述目标权重分别指示所述多个待删除的快照和所述目标快照对所指向的所述数据块共享的份额。
9.根据权利要求8所述的设备,其中更新所述目标权重包括:
将所述多个待删除的快照的所述权重和所述目标权重的总和与阈值权重相比较;以及
响应于所述多个待删除的快照的所述权重和所述目标权重的所述总和在所述阈值权重以下,以所述多个待删除的快照的所述权重和所述目标权重的所述总和来更新所述目标权重。
10.根据权利要求8所述的设备,其中所述至少一个存储器和所述计算机程序指令进一步被配置为,与所述至少一个处理器一起,使得所述设备:
响应于所述多个待删除的快照中的第一快照所指向的数据块的第一物理地址与所述目标物理地址不同,
将与所述第一快照相关联的标识位设置为第二状态,所述第二状态不同于所述第一状态,以及
存储所述第一物理地址。
11.根据权利要求10所述的设备,其中所述至少一个存储器和所述计算机程序指令进一步被配置为,与所述至少一个处理器一起,使得所述设备:
响应于所述多个待删除的快照中的第二快照所指向的数据块的第二物理地址与所述目标物理地址不同,所述第二快照不同于所述第一快照,
确定所述第二物理地址是否与所述第一物理地址相同,
响应于所述第二物理地址与所述第一物理地址相同,将与所述第一快照相关联的所述标识位以及与所述第二快照相关联的标识位设置为第三状态,所述第三状态不同于所述第一状态和所述第二状态,以及
响应于检测到所述第三状态,利用所述第一快照的第一权重和所述第二快照的第二权重的总和来更新与所述第一快照所指向的所述数据块相关联的总权重,所述第一权重和所述第二权重各自占所述总权重的相应比例。
12.根据权利要求11所述的设备,其中所述至少一个存储器和所述计算机程序指令进一步被配置为,与所述至少一个处理器一起,使得所述设备:
存储与所述第一快照所指向的所述数据块相关联的块元数据的物理地址,所述块元数据记录所述总权重。
13.根据权利要求11所述的设备,其中所述至少一个存储器和所述计算机程序指令进一步被配置为,与所述至少一个处理器一起,使得所述设备:
将所述第一权重和所述第二权重的所述总和与所述总权重进行比较;
响应于所述第一权重和所述第二权重的所述总和与所述总权重相等,将与所述第一快照相关联的所述标识位以及与所述第二快照相关联的所述标识位的所述第三状态改变为第四状态;以及
响应于检测到所述第四状态,释放所述第一快照所指向的所述数据块。
14.根据权利要求8所述的设备,其中所述至少一个存储器和所述计算机程序指令进一步被配置为,与所述至少一个处理器一起,使得所述设备:
基于所述多个待删除的快照的文件偏移量、所述多个待删除的快照所指向的所述数据块的大小以及与所述多个待删除的快照相关联的叶子间接块的大小,确定所述多个待删除的快照所指向的所述数据块的所述物理地址。
15.一种计算机程序产品,所述计算机程序产品被有形地存储在非易失性计算机可读介质上并且包括机器可执行指令,所述机器可执行指令在被执行时使机器执行根据权利要求1-7中任一项所述的方法的步骤。
CN201810360804.0A 2018-04-20 2018-04-20 删除快照的方法、设备和计算机程序产品 Active CN110399333B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201810360804.0A CN110399333B (zh) 2018-04-20 2018-04-20 删除快照的方法、设备和计算机程序产品
US16/238,710 US11100047B2 (en) 2018-04-20 2019-01-03 Method, device and computer program product for deleting snapshots

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810360804.0A CN110399333B (zh) 2018-04-20 2018-04-20 删除快照的方法、设备和计算机程序产品

Publications (2)

Publication Number Publication Date
CN110399333A true CN110399333A (zh) 2019-11-01
CN110399333B CN110399333B (zh) 2023-07-18

Family

ID=68236406

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810360804.0A Active CN110399333B (zh) 2018-04-20 2018-04-20 删除快照的方法、设备和计算机程序产品

Country Status (2)

Country Link
US (1) US11100047B2 (zh)
CN (1) CN110399333B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110990194A (zh) * 2019-11-22 2020-04-10 浪潮(北京)电子信息产业有限公司 一种快照停止时间的计算方法、计算系统及相关装置

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109726006B (zh) 2017-10-27 2023-06-06 伊姆西Ip控股有限责任公司 用于控制存储系统的方法、装置和计算机存储介质
CN111124747B (zh) 2018-10-31 2023-09-01 伊姆西Ip控股有限责任公司 用于删除快照的方法、设备和计算机可读介质
US11429559B2 (en) * 2020-05-29 2022-08-30 EMC IP Holding Company LLC Compliance recycling algorithm for scheduled targetless snapshots
US11640371B2 (en) * 2020-03-12 2023-05-02 Western Digital Technologies, Inc. Snapshot management in partitioned storage

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080114951A1 (en) * 2006-11-15 2008-05-15 Dot Hill Systems Corp. Method and apparatus for transferring snapshot data
US20080281875A1 (en) * 2007-05-10 2008-11-13 Dot Hill Systems Corp. Automatic triggering of backing store re-initialization
CN102693173A (zh) * 2012-05-15 2012-09-26 记忆科技(深圳)有限公司 基于快照的文件处理方法及具有快照功能的固态硬盘
CN103761159A (zh) * 2014-01-23 2014-04-30 天津中科蓝鲸信息技术有限公司 增量快照处理的方法及系统
CN104484480A (zh) * 2014-12-31 2015-04-01 华为技术有限公司 基于重复数据删除的远程复制方法及装置
CN105138426A (zh) * 2015-08-20 2015-12-09 浪潮(北京)电子信息产业有限公司 一种基于快照的业务级数据一致性保护方法及装置
CN106569738A (zh) * 2016-09-30 2017-04-19 华为技术有限公司 一种删除级联快照的方法及装置
CN106951375A (zh) * 2016-01-06 2017-07-14 北京忆恒创源科技有限公司 在存储系统中删除快照卷的方法及装置
US10248336B1 (en) * 2016-09-30 2019-04-02 Tintri By Ddn, Inc. Efficient deletion of shared snapshots
US10482065B1 (en) * 2015-03-31 2019-11-19 EMC IP Holding Company LLC Managing deletion of replicas of files

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6857059B2 (en) 2001-01-11 2005-02-15 Yottayotta, Inc. Storage virtualization system and methods
JP4292882B2 (ja) * 2003-03-18 2009-07-08 株式会社日立製作所 複数のスナップショット維持方法及びサーバ装置及びストレージ装置
US7953819B2 (en) 2003-08-22 2011-05-31 Emc Corporation Multi-protocol sharable virtual storage objects
US7831560B1 (en) * 2006-12-22 2010-11-09 Symantec Corporation Snapshot-aware secure delete
US8412688B1 (en) 2009-06-29 2013-04-02 Emc Corporation Delegated reference count base file versioning
US8032498B1 (en) 2009-06-29 2011-10-04 Emc Corporation Delegated reference count base file versioning
US8190850B1 (en) * 2009-10-01 2012-05-29 Emc Corporation Virtual block mapping for relocating compressed and/or encrypted file data block blocks
US9460102B1 (en) * 2013-12-26 2016-10-04 Emc Corporation Managing data deduplication in storage systems based on I/O activities
US10387369B1 (en) 2014-06-30 2019-08-20 EMC IP Holding Company LLC Managing file deletions of files and versions of files in storage systems
US10216757B1 (en) 2014-12-23 2019-02-26 EMC IP Holding Company LLC Managing deletion of replicas of files
US10146782B1 (en) 2015-06-30 2018-12-04 EMC IP Holding Company LLC Secure erasure of files by a filesystem
US10242011B1 (en) 2015-09-30 2019-03-26 EMC IP Holding Company LLC Managing truncation of files of file systems
US10242012B1 (en) 2015-09-30 2019-03-26 EMC IP Holding Company LLC Managing truncation of files of file systems
US10261944B1 (en) 2016-03-29 2019-04-16 EMC IP Holding Company LLC Managing file deletions in storage systems
US10809932B1 (en) 2016-09-30 2020-10-20 EMC IP Holding Company LLC Managing data relocations in storage systems
CN110018985B (zh) * 2017-11-08 2022-10-28 阿里巴巴集团控股有限公司 快照删除方法、装置及系统
CN109117308A (zh) * 2018-07-27 2019-01-01 华为技术有限公司 快照处理的方法和装置

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080114951A1 (en) * 2006-11-15 2008-05-15 Dot Hill Systems Corp. Method and apparatus for transferring snapshot data
US20080281875A1 (en) * 2007-05-10 2008-11-13 Dot Hill Systems Corp. Automatic triggering of backing store re-initialization
CN102693173A (zh) * 2012-05-15 2012-09-26 记忆科技(深圳)有限公司 基于快照的文件处理方法及具有快照功能的固态硬盘
CN103761159A (zh) * 2014-01-23 2014-04-30 天津中科蓝鲸信息技术有限公司 增量快照处理的方法及系统
CN104484480A (zh) * 2014-12-31 2015-04-01 华为技术有限公司 基于重复数据删除的远程复制方法及装置
US10482065B1 (en) * 2015-03-31 2019-11-19 EMC IP Holding Company LLC Managing deletion of replicas of files
CN105138426A (zh) * 2015-08-20 2015-12-09 浪潮(北京)电子信息产业有限公司 一种基于快照的业务级数据一致性保护方法及装置
CN106951375A (zh) * 2016-01-06 2017-07-14 北京忆恒创源科技有限公司 在存储系统中删除快照卷的方法及装置
CN106569738A (zh) * 2016-09-30 2017-04-19 华为技术有限公司 一种删除级联快照的方法及装置
US10248336B1 (en) * 2016-09-30 2019-04-02 Tintri By Ddn, Inc. Efficient deletion of shared snapshots

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
NENAVATH SRINIVAS NAIK 等: "Securing information by performing forensic and network analysis on hosted virtualization", 《INTERNATIONAL CONFERENCE ON COMPUTING AND COMMUNICATION TECHNOLOGIES》 *
张沪滨 等: "面向QEMU的分布式块存储系统的设计与实现", 《微型电脑应用》 *
王晓: "混合存储系统高效快照技术研究", 《中国优秀硕士学位论文全文数据库》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110990194A (zh) * 2019-11-22 2020-04-10 浪潮(北京)电子信息产业有限公司 一种快照停止时间的计算方法、计算系统及相关装置

Also Published As

Publication number Publication date
US20190324947A1 (en) 2019-10-24
US11100047B2 (en) 2021-08-24
CN110399333B (zh) 2023-07-18

Similar Documents

Publication Publication Date Title
CN110399333A (zh) 删除快照的方法、设备和计算机程序产品
CN110531940B (zh) 视频文件处理方法及装置
US8880544B2 (en) Method of adapting a uniform access indexing process to a non-uniform access memory, and computer system
CN101189584B (zh) 内存页面管理
CN105608162B (zh) 文件处理方法和装置
JP2015090615A (ja) データを管理するシステムおよび方法
JP2005267600A5 (zh)
CN105468473A (zh) 数据迁移方法及数据迁移装置
CN104160398B (zh) 用于大对象数据内的结构化内容的方法及其系统
CN109478159A (zh) 损坏数据块的在线修复
CN107066498A (zh) 键值kv存储方法和装置
CN113590606B (zh) 一种基于布隆过滤器的大数据量密钥去重方法及系统
CN106980665A (zh) 数据字典实现方法、装置及数据字典管理系统
CN107665219A (zh) 一种日志管理方法及装置
CN107665255A (zh) 键值数据库数据变更的方法、装置、设备及存储介质
CN109189759A (zh) Kv存储系统中的数据读取方法、数据查询方法、装置及设备
CN107408132A (zh) 在列存储中的插入和点查询操作的有效性能
CN105389128B (zh) 一种固态硬盘数据存储方法及存储控制器
JP6812826B2 (ja) 格納方法、格納装置及び格納プログラム
CN110109867A (zh) 改进在线模式检测的方法、装置和计算机程序产品
JP2008225686A (ja) 分散型データ処理プラットフォームにおけるデータ配置管理装置と方法、システム及びプログラム
CN103970671B (zh) 用于在存储器中分配管理数据集的系统和方法
CN110832473B (zh) 日志结构管理系统及方法
US11163642B2 (en) Methods, devices and computer readable medium for managing a redundant array of independent disks
KR102214697B1 (ko) 데이터베이스 관리 시스템에서 데이터 저장을 위한 공간 관리를 제공하는 컴퓨터 프로그램

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant