CN114115738B - 一种基于分布式存储的磁盘空间管理方法及系统 - Google Patents

一种基于分布式存储的磁盘空间管理方法及系统 Download PDF

Info

Publication number
CN114115738B
CN114115738B CN202111396709.4A CN202111396709A CN114115738B CN 114115738 B CN114115738 B CN 114115738B CN 202111396709 A CN202111396709 A CN 202111396709A CN 114115738 B CN114115738 B CN 114115738B
Authority
CN
China
Prior art keywords
layer
space
data
storage
storage space
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111396709.4A
Other languages
English (en)
Other versions
CN114115738A (zh
Inventor
陈双喜
王振宇
汤鸿飞
王筱橦
徐博
季小庭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fiberhome Telecommunication Technologies Co Ltd
Original Assignee
Fiberhome Telecommunication Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fiberhome Telecommunication Technologies Co Ltd filed Critical Fiberhome Telecommunication Technologies Co Ltd
Priority to CN202111396709.4A priority Critical patent/CN114115738B/zh
Publication of CN114115738A publication Critical patent/CN114115738A/zh
Application granted granted Critical
Publication of CN114115738B publication Critical patent/CN114115738B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/067Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0604Improving or facilitating administration, e.g. storage management
    • G06F3/0607Improving or facilitating administration, e.g. storage management by facilitating the process of upgrading existing storage systems, e.g. for improving compatibility between host and storage device
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0629Configuration or reconfiguration of storage systems
    • G06F3/0632Configuration or reconfiguration of storage systems by initialisation or re-initialisation of storage systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0638Organizing or formatting or addressing of data
    • G06F3/064Management of blocks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0638Organizing or formatting or addressing of data
    • G06F3/0644Management of space entities, e.g. partitions, extents, pools

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

一种基于分布式存储的磁盘空间管理方法及系统,涉及分布式存储领域,方法包括:将整个磁盘的物理空间按照不同的空间粒度划分为多层,最上层的空间粒度最小,每下一层的空间粒度均是上一层空间粒度的相同倍数,各层分别构建该层的bitmap;写入数据时,选择空间粒度不大于待写入数据、且最接近待写入数据的一层,为待写入数据分配存储空间,若该层没有足够的存储空间进行分配,则向上一层查找存储空间并重新分配,直至在最上层完成存储空间的分配;删除数据时,对已经分配的存储空间进行回收。本发明提高数据写入磁盘的空间连续性,数据写入磁盘和从磁盘读取时,减少写入和读取的次数,提升存储性能。

Description

一种基于分布式存储的磁盘空间管理方法及系统
技术领域
本发明涉及分布式存储领域,具体涉及一种基于分布式存储的磁盘空间管理方法及系统。
背景技术
分布式存储是将多台服务器(server)组合成一个存储池,数据分散存储到服务器的本地硬盘上。如图1所示,一个存储池里面可以包含多个服务器(如server1、server2和server3),每个服务器上存在多块硬盘(例如server1中的disk1、disk2和disk3),每一块硬盘承载系统的一部分数据(P1~P9)。分布式存储的具备良好的扩展性,也能够提供海量的存储空间。
在分布式块存储场景下,对外提供存储卷供用户进行读写。每个存储卷的数据按照固定大小进行分片,分片后的数据按照一定策略分布式的保存在服务器硬盘上。
针对每块硬盘,分布式存储软件需要管理磁盘上的数据。为了得到比较好的存储性能,一般会直接使用裸盘的方式管理存储空间,也就是由软件直接访问磁盘的LBA(Logical Block Address,逻辑区块地址)地址,按照磁盘起始地址+偏移这种方式来写入和读取数据,同时需要有元数据来记录用户卷上的数据和磁盘上数据的映射关系。
当用户写入新数据时,数据在磁盘地址上的分布情况会直接影响到存储的写入和读取的性能。通常情况下,分布式存储中会使用位图来管理磁盘空间的分布,比如将整个磁盘空间按照4KB大小进行划分,每4KB存储空间使用1个bit来描述使用情况,0表示未使用,1表示已使用。当需要写入新数据时,查找bitmap(位图),分配未使用的bit位所对应的存储空间即可。
通过位图管理磁盘存储空间,当使用一段时间后,数据经过多次的写入,删除之后,由于写入删除的随机性,会导致磁盘空间的碎片化,bitmap上会存在大量的空洞。这时再写入新数据,数据在磁盘的分配上就会变得不连续,数据写入时磁盘需要多次寻道再写入,读取时也需要从磁盘不同位置分别读取数据再拼接起来,这样会导致存储性能的急剧下降。
例如图2中,bitmap分配3个数据块(斜线部分代表分配的数据块),分别为20~24KB,28~36KB,40~44KB,按照分配的物理空间,写入一个16KB的数据,需要3次磁盘写入,读取16KB的数据时,也需要读取3次磁盘。
发明内容
针对现有技术中存在的缺陷,本发明的目的在于提供一种基于分布式存储的磁盘空间管理方法及系统,提高数据写入磁盘的空间连续性,数据写入磁盘和从磁盘读取时,减少写入和读取的次数,提升存储性能。
为达到以上目的,一方面,采取一种基于分布式存储的磁盘空间管理方法,包括:
将整个磁盘的物理空间按照不同的空间粒度划分为多层,最上层的空间粒度最小,每下一层的空间粒度均是上一层空间粒度的相同倍数,各层分别构建该层的bitmap;
写入数据时,选择空间粒度不大于待写入数据、且最接近待写入数据的一层,为待写入数据分配存储空间,若该层没有足够的存储空间进行分配,则向上一层查找存储空间并重新分配,直至在最上层完成存储空间的分配;
删除数据时,对已经分配的存储空间进行回收。
优选的,将整个磁盘的物理空间按照不同的空间粒度划分为多层,包括:
磁盘初始化时,以预设的最小空间粒度将所有存储空间划分为多个数据块,并构造最上层的bitmap,根据最上层的bitmap,在内存中构建其他层的bitmap。
优选的,最上层的bitmap采用1个bit代表最上层数据块的使用情况,1表示已使用,0表示未使用;
其余层的bitmap采用2个比特代表该层数据块的使用情况,00完全未使用、01表示部分未使用和11表示全部已使用。
优选的,存储空间分配完成、以及存储空间回收后,更新每一层的bit位;最上层的bitmap更新后进行持久化保存。
优选的,相邻两层中,下一层的一个数据块对应上一层一组数据块,当上一层的同组数据块全都是1或11时,下一层对应的数据块为11;当上一层同组的数据块全都是0或00时,下一层对应的数据块为00;当上一层同组的数据块属于其他情况时,下一层对应的数据块为01。
优选的,数据读取时,查询数据每个分片的元数据信息,按照元数据中记录的数据存储位置,读取数据;所述元数据信息在数据写入时同步生成,记录每个分片在磁盘上的位置信息。
优选的,删除数据时,查询数据对应的元数据,在最上层将元数据对应位置的数据块置0,然后根据与该数据块同组的其他数据块的bit位,对下一层对应数据块的bit位进行更新,直至最下层对应的数据块更新完毕。
本发明还提供一种基于分布式存储的磁盘空间管理系统,包括:
分配器,其用于将整个磁盘的物理空间按照不同的空间粒度划分为多层,最上层的空间粒度最小,每下一层的空间粒度均是上一层空间粒度的相同倍数,各层分别构建该层的bitmap;
所述分配器还包括写入模块和删除模块,写入模块用于写入数据时,选择空间粒度不大于待写入数据、且最接近待写入数据的一层,为待写入数据分配存储空间,若该层没有足够的存储空间进行分配,则向上一层查找存储空间并重新分配,直至在最上层完成存储空间的分配;删除模块用于删除数据时,对已经分配的存储空间进行回收。
优选的,所述分配器包括:
第一划分模块,用于在磁盘初始化时,以预设的最小空间粒度将所有存储空间划分为多个数据块,并构造最上层的bitmap,
第二划分模块,用于加载最上层的bitmap,根据最上层的bitmap,在内存中构建其他层的bitmap。
优选的,最上层的bitmap采用1个bit代表最小空间粒度的使用情况,1表示已使用,0表示未使用;
其余层的bitmap采用2个比特代表该层空间粒度的使用情况,00表示完全未使用、01表示部分未使用和11表示全部已使用。
优选的,所述写入模块完成存储空间的分配后,更新每一层的bit位;
所述删除模块完成存储空间回收后,更新每一层的bit位;
最上层的bitmap更新后进行持久化保存。
上述技术方案中的一个具有如下有益效果:
物理空间按照不同的空间粒度划分为多层,通过不同层的bitmap来进行存储空间的分配和回收,选择空间粒度不大于待写入数据、且最接近待写入数据的一层,为待写入数据分配连续的存储空间,若该层没有足够的存储空间,则向上一层查找存储空间并重新分配,由于下一层的空间粒度是上一层空间粒度的倍数,因此在level0能够最大限度的保证数据在磁盘上的连续性,提高数据写入时,大块数据在磁盘上的连续保存,减少大块数据被拆分成很多个不连续的小块数据。
并且,在进行数据写入和数据读取时,大部分连续的数据块保存方式能够减少写入和读取的次数,提升存储的整体性能。
附图说明
图1为背景技术中分布式存储集群示意图;
图2为背景技术中bitmap分配示意图;
图3为本发明实施例物理空间按照不同的空间粒度划分为多层的示意图;
图4为本发明实施例在level0的bitmap上分配存储空间示意图;
图5为本发明实施例存储空间分配流程图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
本发明提供一种基于分布式存储的磁盘空间管理方法,按照不同的空间粒度将整个磁盘的物理空间划分为多层,并保证最上层的空间粒度最小,下一层的空间粒度是上一层空间粒度的倍数,且每相邻两层之间的倍数相同,然后每层分别构建该层的bitmap。
写入数据时,选择空间粒度不大于待写入数据、且最接近待写入数据的一层,在该层为待写入数据分配连续的存储空间,若该层没有足够的存储空间进行分配,则向上一层查找存储空间并重新分配,直至在最上层完成存储空间的分配;删除数据时,对已经分配的存储空间进行回收。
如图3所示,提供一个物理空间按照不同的空间粒度划分为多层(N≥2,且N为自然数)的实施例,本实施例中,将整个物理空间分为4层,每一层最小的空间单位代表着空间大小不同,在其他实施例中,也可以分为其他数量的层数。最上层为level0,其存储空间的空间粒度为4KB;下一层为level1,表示空间粒度为16KB的存储空间;再下一层为level2,表示空间粒度为64KB的存储空间;最后一层是level3,表示空间粒度为256KB的存储空间。除level0之外,每一层的空间粒度都是上一层空间粒度的4倍,从level0~level3各自构建自己的bitmap。
进一步的,提供每一层划分的实施例。
首先把物理空间按照最小空间粒度(即最小颗粒度4KB)划分为若干数据块,形成level0,建立level0的bitmap。采用1个bit代表4KB物理空间的使用情况,1表示物理空间已使用,0表示物理空间未使用。
按照Level0最小空间粒度的倍数(本实施例中为4倍)划分磁盘空间,作为level1,并建立level1的bitmap。Level1的每个数据块代表16KB大小的物理空间,由于16KB的存储空间上可能存在部分使用,部分空闲的情况,所以使用两个bit位管理磁盘空间,00表示这16KB的数据完全未使用,01代表部分未使用,11代表全部已使用。
按照level1最小空间粒度的倍数(本实施例中为4倍)划分磁盘空间,作为level2,并建立level2的bitmap,level2的每个数据块代表64KB大小的物理空间,同样使用两个bit位管理磁盘空间,00表示这64KB的数据完全未使用,01代表部分未使用,11代表全部已使用。
按照level2最小空间粒度的倍数(本实施例中为4倍)划分磁盘空间,作为level3,并建立level3的bitmap,level3的每个数据块代表256KB大小的物理空间,同样使用两个bit位管理磁盘空间,00表示这256KB的数据完全未使用,01代表部分未使用,11代表全部已使用。
基于上述实施例,提供一个存储空间分配的实施例,当写入数据时,按照如下策略在磁盘上为待写入数据分配存储空间。
首先判断待写入数据的大小,选择空间粒度不大于待写入数据、并且最接近待写入数据的一层。
当待写入数据大小size≥level3的数据块大小(256KB)时,在level3的bitmap上查找空闲bit,找到后分配空间粒度为256KB的存储空间,如果没有足够的存储空间进行分配(即没有可以分配的256KB空闲空间),则向上查找level2的bitmap,在level2重新空间粒度为分配多个64KB的存储空间,如果level2也没有足够的存储空间进行分配,则再向上查找level1的bitmap,分配空间粒度为16KB的存储空间,如果level1没有足够的存储空间进行分配,则继续向上查找level0的bitmap,按照最小空间粒度4KB完成存储空间的分配。
当待写入数据大小size,满足256KB>size≥level2的数据块大小(64KB)时,在level2的bitmap上查找完全空闲的数据块,找到后分配空间粒度为64KB的存储空间,如果level2没有足够的存储空间进行分配,则向上查找level1的bitmap,分配空间粒度为16KB的存储空间。如果level1还是没有足够的存储空间进行分配,则继续向上查找level0的bitmap,按照最小空间粒度4KB完成存储空间的分配。
当写入磁盘的数据size,满足64KB>size≥level1的数据块大小(16KB)时,在level1的bitmap上查找完全空闲的数据块,找到后分配空间粒度为16KB连续的存储空间,如果level1没有足够的存储空间进行分配,则向上查找level0的bitmap,按照4KB完成存储空间分配。
当写入磁盘的数据size,满足16KB>size≥level0的数据块大小(4KB)时,直接在level0上按照空间粒度为4KB大小分配存储空间。
在上述分配存储空间的过程中,除了level0之外的每层,都需要找到完全空闲的数据块作为存储空间分配,也就是说,需要找到两个bit位为00的数据块。采用两个bit位管理磁盘空间,可以准确标识数据的分配情况。在向上一层的bitmap查找存储空间时,可以利用当前层的bitmap加快存储空间分配的速度,比如针对level3已经标识了11的位置,在level2对应的4个bit位必定也是11,查找level2时就可以直接跳过这4个bit位。
上述存储空间分配完成后,需要更新level0~level3上每一层的bit位。其中,从对应层levelx分配的存储空间,上述实施例中x=0,1,2,3,则该层的bitmap设置为11或1(该层为level0时),levelx至level0所对应的bitmap设置为11或1。从levelx分配存储空间后,需要检查与相邻下层一个数据块对应的本层4个数据中,其他的3个bit值,若均为11或1,则将下一层对应数据块设置为11,若对应本层4个数据块存在00或者01,则下一层对应的对应数据块设置为01。
如图3所示,假定level0中,从左到右只有前四个数据块均为1,其余均为0,那么level1的第一个数据块由于上层对应的一组数据块均为1,则level1的第一个数据块为11,那么同理,level2的第一个数据块为01,level3的第一个数据块为01。
如图4所示,上面为level0的bitmap示意图,假定待写入数据为32KB,满足64KB>32KB≥level1,可以在level1的bitmap上分配存储空间,分配时可以优先选择连续的数据块,本实施例在level1中,找到两个相连的数据块作为分配的存储空间。相对于现有的直接在磁盘上分配不连续的4KB数据块,如图4的下面所示,可以看出,在上一层level0的bitmap上,分配到连续的8个4KB数据块,存储空间的连续性优越。按照分配的物理空间,写入1个32KB的数据,需要1次磁盘写入,后续读取32KB的数据时,只需要读取1次磁盘。
基于上述实施例,提供一个数据回收的实施例。在删除数据时,需要对已经分配出去的存储空间进行回收,具体包括如下内容:
回收数据时,对level0~level3上每一层所对应的bit位都要更新;
对level0的bitmap更新,需要进行持久化保存;
对level1、level2、level3删除数据时,当映射的所有数据块均未使用时,设置00,当还有部分数据块在使用中,设置为01。
具体的,上层业务进行数据删除、或者删除卷等,都会触发底层回收磁盘上的数据。因此删除数据会按照写入时固定的分片,分别删除每一个数据块,每一个数据块都有元数据,元数据是在数据写入时同步生成的。元数据表示每个分片的元数据信息,记录这个分片中数据在磁盘上的位置信息,包括起始地址、长度等。查询元数据可以得到该数据块在磁盘上的偏移位置和长度,所以删除就是对硬盘上指定位置和长度的存储空间进行回收。
删除数据时,查询数据对应的元数据,在最上层将元数据对应位置的数据块置0,然后根据与该数据块同组的其他数据块的bit位,对下一层对应数据块的bit位进行更新,直至最下层对应的数据块更新完毕。
具体的,首先根据指定位置和长度计算所对应的level0的bit位,将对应level0的bit为由1设置为0,然后查询与之相邻的一组bit位,如果全部为0,则更新level1为00,如果部分为0,则更新level1为01,直至level3。
如图5所示,基于上述实施例,提供一种在实际应用中存储空间的分配流程实施例,具体包括如下步骤:
S101.磁盘初始化时,以预设的最小空间粒度(本实施例中为4KB)划分所有存储空间,构造level0的bitmap,并且将level0持久化保存。在初始化时,整个磁盘的存储空间全部都是空闲的,所以整个bitmap全部为0。
S102.采用在软件中增加一个存储空间的分配器的方式,分配器负责存储空间的分配和回收。分配器在启动时,加载磁盘上level0的bitmap,根据level0的bitmap,在内存中构建Level1~level3的bitmap。
S103.数据写入时,判断待写入数据的大小,判断从哪个level上开始进行分配,当size≥256KB时,进入S104;当256KB>size≥64KB时,进入S106;当64KB>size≥16KB时,进入S108;16KB>size≥4KB时,进入S110。
S104.在level3的bitmap开始进行分配,并进行存储空间分配,进入S105;
S105.在level3分配存储空间是否成功,若是,进入S111;若否,进入S106;
S106.在level2的bitmap开始进行分配,并进行存储空间分配,进入S107;
S107.在level2分配存储空间是否成功,若是,进入S111;若否,进入S108;
S108.在level1的bitmap开始进行,并进行存储空间分配,进入S109;
S109.在level1分配存储空间是否成功,若是,进入S111;若否,进入S110;
S110.在level0的bitmap开始查找,并进行存储空间分配,进入S111;
S111.存储空间分配完成,数据写入后,将对应bit置位,对于level0,对应的bit位置1;对于level1、level2、level3,存储空间部分占用设置为01,完全占用设置为11;并且,对于level0,每次更新都需要进行数据的持久化。
上述步骤中,在最开始分配的一层存储空间分配成功,则表示连续性最优,分配失败则表示当前磁盘上已经没有连续的大块空闲空间可用了,则向上一层查找,分配小一级的连续空间,如果此次存储空间分配成功,也能保证相对较优的连续性,如果分配不成功,继续向上一层查找。
优先选用连续的存储空间进行分配,在level0中没有连续存储空间进行分配,可以选择不连续的4K数据块进行分配,但是如果在level0中没有足够的存储空间可分,就表示整个磁盘已经写满了,没有剩余空间可分配,本发明仅针对磁盘存储空间够分配的情况。
上述步骤后,进行数据读取时,查询元数据信息,按照元数据中记录的数据存储位置,读取数据。
本发明还提供一种基于分布式存储的磁盘空间管理系统的实施例,可以用来实现上述方法。该系统包括分配器,用来将整个磁盘的物理空间按照不同的空间粒度划分为多层,最上层的空间粒度最小,每下一层的空间粒度均是上一层空间粒度的相同倍数,各层分别构建自己的bitmap。
进一步的,分配器包括写入模块和删除模块。写入模块用于写入数据时,选择空间粒度不大于待写入数据、且最接近待写入数据的一层,为待写入数据分配连续的存储空间,若没有满足要求的存储空间则向上一层查找,直至在最上层完成存储空间的分配。删除模块用于删除数据时,对已经分配的存储空间进行回收。当写入模块完成存储空间的分配后,更新每一层的bit位。删除模块完成存储空间回收后,也需要更新每一层的bit位。
此外,分配器还包括第一划分模块和第二划分模块。第一划分模块,用于在磁盘初始化时,以预设的最小空间粒度划分所有存储空间,并构造最上层的bitmap。最上层的bitmap采用1个bit代表最小空间粒度的使用情况,分为已使用和未使用,例如1表示物理空间已使用,0表示物理空间未使用。
第二划分模块,用于加载最上层的bitmap,根据最上层的bitmap,在内存中构建其他层的bitmap。其余层的bitmap采用2个比特代表该层空间粒度的使用情况,分为完全未使用、部分未使用和全部已使用,例如00表示这16KB的数据完全未使用,01代表部分未使用,11代表全部已使用。
通过不同空间粒度将磁盘的存储空间划分多层,并根据待写入数据,从开始层逐层查找,能够最大限度的保证数据在磁盘上的连续性,大块数据连续保存,不会被拆分成很多个不连续的小块数据。
以上仅为本发明的实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均包含在申请待批的本发明的权利要求范围之内。

Claims (8)

1.一种基于分布式存储的磁盘空间管理方法,其特征在于,包括:
将整个磁盘的物理空间按照不同的空间粒度划分为多层,最上层的空间粒度最小,每下一层的空间粒度均是上一层空间粒度的相同倍数,各层分别构建该层的bitmap;
写入数据时,选择空间粒度不大于待写入数据、且最接近待写入数据的一层,为待写入数据分配存储空间,若该层没有足够的存储空间进行分配,则向上一层查找存储空间并重新分配,直至在最上层完成存储空间的分配;
删除数据时,对已经分配的存储空间进行回收;
最上层的bitmap采用1个bit代表最上层数据块的使用情况,1表示已使用,0表示未使用;
其余层的bitmap采用2个比特代表该层数据块的使用情况,00完全未使用、01表示部分未使用和11表示全部已使用;
相邻两层中,下一层的一个数据块对应上一层一组数据块,当上一层的同组数据块全都是1或11时,下一层对应的数据块为11;当上一层同组的数据块全都是0或00时,下一层对应的数据块为00;当上一层同组的数据块属于其他情况时,下一层对应的数据块为01。
2.如权利要求1所述的基于分布式存储的磁盘空间管理方法,其特征在于,将整个磁盘的物理空间按照不同的空间粒度划分为多层,包括:
磁盘初始化时,以预设的最小空间粒度将所有存储空间划分为多个数据块,并构造最上层的bitmap,根据最上层的bitmap,在内存中构建其他层的bitmap。
3.如权利要求2所述的基于分布式存储的磁盘空间管理方法,其特征在于,存储空间分配完成、以及存储空间回收后,更新每一层的bit位;最上层的bitmap更新后进行持久化保存。
4.如权利要求3所述的基于分布式存储的磁盘空间管理方法,其特征在于,数据读取时,查询数据每个分片的元数据信息,按照元数据中记录的数据存储位置,读取数据;所述元数据信息在数据写入时同步生成,记录每个分片在磁盘上的位置信息。
5.如权利要求4所述的基于分布式存储的磁盘空间管理方法,其特征在于,删除数据时,查询数据对应的元数据,在最上层将元数据对应位置的数据块置0,然后根据与该数据块同组的其他数据块的bit位,对下一层对应数据块的bit位进行更新,直至最下层对应的数据块更新完毕。
6.一种基于分布式存储的磁盘空间管理系统,其特征在于,包括:
分配器,其用于将整个磁盘的物理空间按照不同的空间粒度划分为多层,最上层的空间粒度最小,每下一层的空间粒度均是上一层空间粒度的相同倍数,各层分别构建该层的bitmap;
所述分配器还包括写入模块和删除模块,写入模块用于写入数据时,选择空间粒度不大于待写入数据、且最接近待写入数据的一层,为待写入数据分配存储空间,若该层没有足够的存储空间进行分配,则向上一层查找存储空间并重新分配,直至在最上层完成存储空间的分配;删除模块用于删除数据时,对已经分配的存储空间进行回收;
最上层的bitmap采用1个bit代表最上层数据块的使用情况,1表示已使用,0表示未使用;
其余层的bitmap采用2个比特代表该层数据块的使用情况,00完全未使用、01表示部分未使用和11表示全部已使用;
相邻两层中,下一层的一个数据块对应上一层一组数据块,当上一层的同组数据块全都是1或11时,下一层对应的数据块为11;当上一层同组的数据块全都是0或00时,下一层对应的数据块为00;当上一层同组的数据块属于其他情况时,下一层对应的数据块为01。
7.如权利要求6所述的基于分布式存储的磁盘空间管理系统,其特征在于,所述分配器包括:
第一划分模块,用于在磁盘初始化时,以预设的最小空间粒度将所有存储空间划分为多个数据块,并构造最上层的bitmap,
第二划分模块,用于加载最上层的bitmap,根据最上层的bitmap,在内存中构建其他层的bitmap。
8.如权利要求7所述的基于分布式存储的磁盘空间管理系统,其特征在于,所述写入模块完成存储空间的分配后,更新每一层的bit位;
所述删除模块完成存储空间回收后,更新每一层的bit位;
最上层的bitmap更新后进行持久化保存。
CN202111396709.4A 2021-11-23 2021-11-23 一种基于分布式存储的磁盘空间管理方法及系统 Active CN114115738B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111396709.4A CN114115738B (zh) 2021-11-23 2021-11-23 一种基于分布式存储的磁盘空间管理方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111396709.4A CN114115738B (zh) 2021-11-23 2021-11-23 一种基于分布式存储的磁盘空间管理方法及系统

Publications (2)

Publication Number Publication Date
CN114115738A CN114115738A (zh) 2022-03-01
CN114115738B true CN114115738B (zh) 2023-12-26

Family

ID=80440193

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111396709.4A Active CN114115738B (zh) 2021-11-23 2021-11-23 一种基于分布式存储的磁盘空间管理方法及系统

Country Status (1)

Country Link
CN (1) CN114115738B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116991595B (zh) * 2023-09-27 2024-02-23 太初(无锡)电子科技有限公司 一种基于Bitmap的内存分配方法、装置、设备及介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101556557A (zh) * 2009-05-14 2009-10-14 浙江大学 一种基于对象存储设备的对象文件组织方法
WO2014015828A1 (zh) * 2012-07-27 2014-01-30 腾讯科技(深圳)有限公司 数据存储空间的处理方法、处理系统及数据存储服务器
US8775368B1 (en) * 2007-06-27 2014-07-08 Emc Corporation Fine grained tiered storage with thin provisioning
CN104317742A (zh) * 2014-11-17 2015-01-28 浪潮电子信息产业股份有限公司 一种优化空间管理的自动精简配置方法
WO2017107015A1 (zh) * 2015-12-21 2017-06-29 华为技术有限公司 存储空间的分配方法及存储设备
CN113672171A (zh) * 2021-07-26 2021-11-19 浙江大华技术股份有限公司 分布式对象存储方法、装置、系统和元数据服务器

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8775368B1 (en) * 2007-06-27 2014-07-08 Emc Corporation Fine grained tiered storage with thin provisioning
CN101556557A (zh) * 2009-05-14 2009-10-14 浙江大学 一种基于对象存储设备的对象文件组织方法
WO2014015828A1 (zh) * 2012-07-27 2014-01-30 腾讯科技(深圳)有限公司 数据存储空间的处理方法、处理系统及数据存储服务器
CN104317742A (zh) * 2014-11-17 2015-01-28 浪潮电子信息产业股份有限公司 一种优化空间管理的自动精简配置方法
WO2017107015A1 (zh) * 2015-12-21 2017-06-29 华为技术有限公司 存储空间的分配方法及存储设备
CN113672171A (zh) * 2021-07-26 2021-11-19 浙江大华技术股份有限公司 分布式对象存储方法、装置、系统和元数据服务器

Also Published As

Publication number Publication date
CN114115738A (zh) 2022-03-01

Similar Documents

Publication Publication Date Title
US20210349632A1 (en) Memory system and method for controlling nonvolatile memory
US9396103B2 (en) Method and system for storage address re-mapping for a memory device
US8250333B2 (en) Mapping address table maintenance in a memory device
US8386746B2 (en) Storage unit management methods and systems
US8832371B2 (en) Storage system with multiple flash memory packages and data control method therefor
KR100526190B1 (ko) 플래시 메모리의 재사상 방법
US20140068152A1 (en) Method and system for storage address re-mapping for a multi-bank memory device
US7694087B2 (en) Duplicate data storing system, duplicate data storing method, and duplicate data storing program for storage device
WO2017000658A1 (zh) 存储系统、存储管理装置、存储器、混合存储装置及存储管理方法
CN108021513B (zh) 一种数据存储方法及装置
JP2020035300A (ja) 情報処理装置および制御方法
US20150169230A1 (en) Method of lun management in a solid state disk array
CN106970765B (zh) 数据存储方法及装置
US8954658B1 (en) Method of LUN management in a solid state disk array
US20180253252A1 (en) Storage system
TW201915747A (zh) 記憶體系統及控制非揮發性記憶體之控制方法
US10083181B2 (en) Method and system for storing metadata of log-structured file system
WO2016076903A1 (en) Online file system check
CN114115738B (zh) 一种基于分布式存储的磁盘空间管理方法及系统
CN115599544A (zh) 内存管理方法、装置、计算机设备及存储介质
CN116540950B (zh) 一种存储器件及其写入数据的控制方法
US11334266B2 (en) Memory system and method for controlling nonvolatile memory
CN111722802B (zh) 一种元数据lsa卷的存储空间分配方法、装置及设备
CN114625318A (zh) 应用于固态硬盘的数据写入方法、装置、设备
CN112162703B (zh) 缓存实现方法及缓存管理模块

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant