CN105045850B

CN105045850B - 云存储日志文件系统中垃圾数据回收方法

Info

Publication number: CN105045850B
Application number: CN201510390367.3A
Authority: CN
Inventors: 贾威威; 张延园; 林奕
Original assignee: Northwestern Polytechnical University
Current assignee: Northwestern Polytechnical University
Priority date: 2015-07-06
Filing date: 2015-07-06
Publication date: 2018-08-14
Anticipated expiration: 2035-07-06
Also published as: CN105045850A

Abstract

本发明公开了一种云存储日志文件系统中垃圾数据回收方法，用于解决现有垃圾数据回收方法存储空间利用率差的技术问题。技术方案是首先进行垃圾数据判断，并在文件系统更新时创建一个新的日志，日志中的索引节点包含三级索引结构，每个文件都对应一个索引节点，三级索引结构存放数据块的索引地址，查找垃圾数据以最新的日志为基准，从最早的日志开始依次对比日志中的索引地址，云存储日志文件系统把数据存储在日志中，把日志又存储在段存储文件中，当段存储文件的垃圾数据量大于阈值时进行垃圾数据回收。本发明利用手动或自动垃圾数据回收，支持手动配置段文件回收阈值，随时回收垃圾数据所占用的存储空间，提高了存储空间的利用率。

Description

云存储日志文件系统中垃圾数据回收方法

技术领域

本发明涉及一种垃圾数据回收方法，特别涉及一种云存储日志文件系统中垃圾数据回收方法。

背景技术

随着互联网大数据的日益增长，各大互联网巨头推出了各自的存储系统，这些存储系统也成为了行业标准。Google设计与实现了Google File System(GFS)和键值存储系统LevelDB,Amazon设计与实现了Simple Storage System(S3)和键值存储系统Dynamo，Yahoo！设计与实现了PNUTS，Facebook设计与实现了Cassandra等等。这些存储系统大部分是不开源的，因此开源组织也针对其公布的论文设计与实现了开源版存储系统，例如Apache基金会设计与实现了GFS开源版Hadoop Distributed File System。这些存储系统是针对互联网业务的特性而设计的，比如需要具备高可用性，可扩展性，容错性等等，但是大部分都没有考虑设计与实现垃圾数据回收子系统，这主要是互联网公司对用户数据的依赖性，用户的任何数据都具有价值，即使用户删除，其系统也不会自动删除，而是保存这些数据。但是，有些应用场景如果不及时删除用户的垃圾数据，存储空间很快就不够用了，例如，嵌入式系统，云存储时代大数据暴增等等。同时，还有很多公司设计了专门的垃圾数据回收方法，但是并没有公开他们的技术方法，例如，微软的内存垃圾数据回收以及磁盘垃圾数据回收方法。Sheepdog是日本NTT公司设计与实现的一款基于QEMU/KVM虚拟机的分布式块存储系统，Sheepdog存储系统中包含了垃圾数据回收子系统，其采用GenerationalReference Counting(GRC)算法进行垃圾回收。GRC算法由Goldberg和Benjamin于1989年发表在了ACM SIGPLAN Notices期刊的第7期第24卷313到321页，这种垃圾回收方法需要消耗额外的存储空间，而且这种垃圾回收方法是针对整个镜像文件，力度较大，灵活度低。

发明内容

为了克服现有垃圾数据回收方法存储空间利用率差的不足，本发明提供一种云存储日志文件系统中垃圾数据回收方法。该方法首先进行垃圾数据判断，并在文件系统更新时创建一个新的日志，日志中包含日志头、数据块、索引数据块、索引节点以及索引节点映射。其中，索引节点包含三级索引结构，每个文件都对应一个索引节点，三级索引结构存放数据块的索引地址，查找垃圾数据以最新的日志为基准，从最早的日志开始依次对比日志中的索引地址，若旧日志的索引地址和最新的日志中的索引地址相同则日志中包含的数据不是的垃圾数据，若不相同则说明该数据是垃圾数据。垃圾数据量达到一定的阀值时进行垃圾数据回收操作。云存储日志文件系统把数据存储在日志中，把日志又存储在段存储文件中，只有当段存储文件的垃圾数据量大于阀值时才进行垃圾数据回收，先把要删除的段存储文件中的有效数据拷贝到新的段存储文件，然后再删除段存储文件。垃圾数据回收通过两种方式实现，一种是用户手动垃圾数据回收，需要用户指定一个段文件，然后系统进行回收，另外一种是系统中自动垃圾数据回收，第一种的好处是用户可以设置垃圾数据阀值，这样使垃圾数据回收更加灵活，也可以节省更多存储空间，提高了存储空间的利用率。

本发明解决其技术问题所采用的技术方案是：一种云存储日志文件系统中垃圾数据回收方法，其特点是包括以下步骤：

步骤一、进行垃圾数据判断，并在文件系统更新时创建一个新的日志，日志中包含日志头、数据块、索引数据块、索引节点以及索引节点映射。所述索引节点包含三级索引结构，每个文件都对应一个索引节点，三级索引结构存放数据块的索引地址，查找垃圾数据需要以最新的日志为基准，从最早的日志开始依次对比日志中的索引地址，若旧日志的索引地址和最新的日志中的索引地址相同则日志中包含的数据不是的垃圾数据，若不相同则说明该数据是垃圾数据。当垃圾数据量达到所配置的阀值时，进行垃圾数据回收操作。

步骤二、垃圾数据回收通过删除和拷贝实现，即云存储日志文件系统底层将数据存储在日志中，将日志存储在段存储文件中，只有当段存储文件的垃圾数据量大于阀值时，先把要删除的段存储文件中的有效数据拷贝到新的段存储文件，然后再删除段存储文件。

所述垃圾数据回收通过以下两种方式中任一方式实现，采用手动垃圾数据回收，需要用户指定一个段文件，然后系统进行回收；或者采用系统中自动垃圾数据回收。

本发明的有益效果是：该方法首先进行垃圾数据判断，并在文件系统更新时创建一个新的日志，日志中包含日志头、数据块、索引数据块、索引节点以及索引节点映射。其中，索引节点包含三级索引结构，每个文件都对应一个索引节点，三级索引结构存放数据块的索引地址，查找垃圾数据以最新的日志为基准，从最早的日志开始依次对比日志中的索引地址，若旧日志的索引地址和最新的日志中的索引地址相同则日志中包含的数据不是的垃圾数据，若不相同则说明该数据是垃圾数据。垃圾数据量达到一定的阀值时进行垃圾数据回收操作。云存储日志文件系统把数据存储在日志中，把日志又存储在段存储文件中，只有当段存储文件的垃圾数据量大于阀值时才进行垃圾数据回收，先把要删除的段存储文件中的有效数据拷贝到新的段存储文件，然后再删除段存储文件。垃圾数据回收通过两种方式实现，一种是用户手动垃圾数据回收，需要用户指定一个段文件，然后系统进行回收，另外一种是系统中自动垃圾数据回收，第一种的好处是用户可以设置垃圾数据阀值，这样使垃圾数据回收更加灵活，也可以节省更多存储空间，提高了存储空间的利用率。

以下结合具体实施方式详细说明本发明。

具体实施方式

本发明云存储日志文件系统中垃圾数据回收方法具体步骤如下：

本发明基于一种分布式文件系统，该分布式文件系统在Hadoop DistributedFile System(HDFS)之上结合日志文件系统实现了日志结构的分布式文件系统，本发明为了解决Apache基金会设计与实现的HDFS等类似分布式文件系统无法解决的垃圾数据回收问题，同时也改进了Sheepdog等存储系统中虽然实现了垃圾回收系统，但是还存在一些问题，如垃圾回收需要消耗额外的存储空间，垃圾回收力度大，不够灵活。

了解决垃圾数据回收问题，本发明首先进行垃圾数据判断，分布式文件系统每次更新都会创建一个新的日志，日志中包含日志头，数据块，索引数据块，索引节点以及索引节点映射。其中，索引节点包含三级索引结构，每个文件都对应一个索引节点(由唯一的索引节点号标示)，三级索引结构存放数据块的索引地址，查找垃圾数据需要以最新的日志为基准，从最早的日志开始依次对比日志中的索引地址，若旧日志的索引地址和最新的日志中的索引地址相同则日志中包含的数据不是的垃圾数据，若不相同则说明该数据是垃圾数据。如果垃圾数据量达到一定的阀值(可配置)然后就进行垃圾数据回收操作。垃圾数据回收操作是通过删除和拷贝实现的，不是所有垃圾数据都进行回收，该专利实现是基于云存储日志文件系统，而这种文件系统底层是把数据存储在日志中，把日志又存储在段存储文件中，只有当段存储文件的垃圾数据量大于阀值时才进行垃圾数据回收，先把要删除的段存储文件中的有效数据拷贝到新的段存储文件，然后再删除段存储文件。垃圾数据回收通过两种方式实现，一种是用户手动垃圾数据回收，需要用户指定一个段文件，然后系统进行回收，另外一种是系统中自动垃圾数据回收，第一种的好处是用户可以设置垃圾数据阀值，这样使垃圾数据回收更加灵活，也可以节省更多存储空间。

本发明针对分布式日志文件系统设计了一种新型的垃圾回收方法，可以有效的回收HDFS等分布式文件系统中的垃圾数据，提高了数据的存储率，同时还改进了Sheepdog等存储系统中垃圾数据回收方法，垃圾数据回收不需要借助额外的存储空间，也提高了垃圾数据回收的灵活度。

云存储日志文件系统中垃圾数据回收方法发明专利包含两部分内容，第一，无快照垃圾数据回收方法；第二，快照下垃圾数据回收方法。以上两部分垃圾数据回收方法通过云存储日志文件系统设计与实现。

云存储日志文件系统基于Hadoop Distributed File System(HDFS)并借助经典日志文件系统的思想，对文件的每次更新都会追加一个日志，因此该文件系统逻辑上的存储空间是由很多个日志组成，这些日志就是天然的快照，可以根据需要回滚并恢复数据。每个日志分为五个部分，依次为日志头，数据块，索引块，索引节点和索引节点映射。日志头包含了整个日志的大小和其他日志元数据，数据块存储了用户的数据，索引块是用来存储数据块的索引地址，索引节点包含了文件所对应的数据块的索引地址，索引节点映射唯一标示了索引节点。为了方便垃圾数据回收以及管理数据，在该日志结构之上又划分了段文件，每个段文件由很多个日志组成，且存储大小不超过64MB，而HDFS默认数据块是64MB，这样刚好吻合，可以提高数据在HDFS之上的存储和读取。当用户对一个文件提出随机写请求，首先被封装成一个日志，然后被追加到当前最新的段文件末尾，而用户的读请求只需要读取最新段文件的最新日志就可以通过索引结构读取到所有数据。该日志文件系统的索引节点中的索引结构和经典文件系统一样，直接索引存储数据块，一级索引存储索引块的地址，以此类推。

为了更高效的管理存储空间，垃圾数据回收的单位并非以日志为单位，因为如果以日志为单位那么管理效率很低，力度不够大，因此在日志之上又划分了段文件，每个段文件都是由若干个日志组成的，段文件大小不超过64MB。整个存储空间是64位，前38位是段号后26位是段内偏移地址，因此该文件系统可以有2^38个段文件，而每个段的大小为64MB。垃圾数据回收分为两个步骤，具体如下：

(1)首先需要统计当前已生成段文件的段使用情况，这里存在一个段内可用数据块的阀值，如果这个段内的可用数据块数量低于这个阀值就需要段回收，相反则保留这个段文件，这个垃圾回收段阀值是可以配置的，根据不同的需求可以在系统初始化的时候设置。

(2)当段统计完成之后，就需要对段文件可用数据块低于阀值的段文件进行回收，段文件回收采用move-and-remove语义，首先创建新的段文件，把要回收的段文件的可用数据块写入到新创建的段文件，然后删除要回收的段文件，整个段回收工作是后台进程完成的，只有在当前没有写入任务的时候才开始执行段回收工作，这样就可以避免并发带来的一系列问题。

该日志文件系统快照分为线性快照和树形快照，线性快照是天然具备的，而树形快照是用户手动生成的，因此垃圾数据回收不能回收用户手动生成的快照，因此快照下的垃圾数据回收需要重新设计。当没有快照的时候，段统计是把当前所有段文件中的日志和最新的日志做比较，如果数据块的索引地址和最新日志的索引地址不一样，那么说明这个数据块中所包含的数据就是垃圾数据，而快照下的垃圾回收则是把存储空间划分为若干个部分，具体由当前快照数决定，然后以第一个快照为参照点开始进行垃圾数据回收，然后从第一个快照点之后的日志开始，以第二个快照为参照点开始进行垃圾数据回收，依次类推，最后完成垃圾数据回收段统计，最后对划分的这些部分执行段回收工作，这个阶段和没有快照一样。

垃圾数据回收是存储系统永久的一个话题，由于磁盘很廉价以及互联网应用特征，因此这个问题一直研究的很少，但是目前由于数据量暴增，垃圾数据回收已经是一个不可避免的话题。Hadoop Distributed File System等存储系统没有引进垃圾回收子系统，因此在一些应用场景不试用，还有一些存储系统已经引进了垃圾回收子系统，例如，Sheepdog等等。Sheepdog是日本NTT公司设计与实现的一款基于QEMU/KVM虚拟机的分布式块存储系统，Sheepdog存储系统中包含了垃圾数据回收子系统，其采用GenerationalReference Counting(GRC)算法进行垃圾回收。这个算法的核心思想是，一个存储对象包含代数和引用计数，这里的代数指的是这个存储对象是第几代引用，而引用计数用来记录这个存储对象被做了几次拷贝。这个算法还引进了一个存储表，这个存储表包含了存储镜像中每个存储对象的总引用计数。每个存储镜像可以包含很多个存储对象。

当一个存储对象A被创建的时候，他的代数和引用计数被初始化为零，同时存储表的第一个域初始化为一，其他均为零，这是因为第一个存储对象已经创建了。当另一个存储对象B基于A对象被克隆，那么B的代数就初始化为A的代数加一，这是因为B是基于A克隆的，A是第一代那么B就是第二代。B的引用计数初始化为零，同时A的引用计数加一。当存储表中的存储对象(A或者B)被删除时，那么一个删除消息发送给存储表，这个删除消息包含要删除的存储对象的代数和引用计数，最后在存储表中通过代数找到这个域，然后减一，同时把这个引用计数值加到下一个域，这是因为这个存储对象被拷贝了引用计数次。当存储表的每个域都为零时，这个存储镜像就可以回收了。在本发明专利的垃圾回收子系统中，不需要开辟存储空间，而Sheepdog垃圾回收是基于GRC算法，需要开辟新的存储空间，如果没有拷贝操作，那么每个存储对象都要产生额外的存储空间来存储代数和引用计数。

表1垃圾数据回收系统和Sheepdog垃圾数据系统对比

从表1可以看出来，通过采用垃圾数据回收阀值，使得垃圾数据回收是细粒度回收，灵活度也提高了，本发明垃圾回收是基于段文件，而Sheepdog垃圾数据回收是针对一个镜像文件，灵活度低，本发明直接基于段存储文件进行垃圾数据回收，不需要开辟新的存储空间，而Sheepdog垃圾回收则需要开辟新的存储空间。本发明垃圾回收子系统支持手动垃圾数据回收，而且支持手动配置段文件回收阀值，这样可以随时回收垃圾数据所占用的存储空间，提高了存储空间的利用率。通过本发明专利设计与实现的垃圾数据回收方法，能有效的回收分布式日志文件系统中所存在的垃圾数据，提高了存储空间利用率，同时也改进了垃圾数据回收的灵活度。

具体实施方法：

1，格式化该日志文件系统，输入日志文件系统所在路径”/home/user/”，数据块大小为4KB，段文件大小为64MB以及日志文件系统最大存储容量为64GB。输出以上输入内容并把以上内容以特定格式写入超级块文件。这样做的原因是，文件系统初始化或者以后运行过程中都可以访问这个超级块文件，进行初始化和进一步运行。

2，写入，读取和更新数据，写入65MB数据，然后读取数据，最后更新前64MB数据，这样做的原因是，更新写入的数据就会产生垃圾数据，因为更新会创建新的数据块代替旧的数据块，接下来就可以采用本专利垃圾数据回收方法执行垃圾回收操作。这一步需要输入日志文件系统存储路径”/home/user/”，每次写入4KB，写入，读取65MB，然后更新64MB。本次写入和更新操作会产生三个段存储文件，写入操作65MB会产生1.seg，2.seg段存储文件，更新操作会产生3.seg段存储文件。

3，手动进行垃圾回收(日志文件系统启动之后，系统自动启动后台线程进行垃圾数据回收，当没有写请求的时候，进行垃圾数据回收)，这一步需要输入日志文件存储路径”/home/user/”和回收阀值30MB，这个阀值就是衡量每个段文件中的垃圾数据块是否大于这个阀值，大于则回收，小于则不回收。输出存储路径”/home/user/”和回收阀值30MB，并进行以下具体回收操作：

(1)根据回收阀值30MB统计并计算段文件中需要回收的数据块，把统计和计算结果写入到段统计文件中，因为接下来段回收将根据这个段统计文件对每个段进行回收。本次统计结果就是1.seg需要回收，垃圾数据量为64MB。

(2)根据段统计文件对要回收的段文件进行回收，具体需要执行Remove-and-Move操作，把要回收段中的有用数据移动到最新的段文件中，然后删除垃圾段文件。针对本次操作，因为1.seg都是垃圾数据，所以不需要拷贝1.seg中有效数据，直接删除即可。

Claims

1.一种云存储日志文件系统中垃圾数据回收方法，其特征在于包括以下步骤：

步骤一、进行垃圾数据判断，在文件系统更新时创建一个新的日志，日志中包含日志头、数据块、索引数据块、索引节点以及索引节点映射；所述索引节点包含三级索引结构，每个文件都对应一个索引节点，三级索引结构存放数据块的索引地址，查找垃圾数据需要以最新的日志为基准，从最早的日志开始依次对比日志中的索引地址，若旧日志的索引地址和最新的日志中的索引地址相同则日志中包含的数据不是垃圾数据，若不相同则说明该数据是垃圾数据；

步骤二、垃圾数据回收通过删除和拷贝实现，即云存储日志文件系统底层将数据存储在日志中，将日志存储在段存储文件中，只有当段存储文件的垃圾数据量大于阈值时，先把要删除的段存储文件中的有效数据拷贝到新的段存储文件，然后再删除段存储文件。

2.根据权利要求1所述的云存储日志文件系统中垃圾数据回收方法，其特征在于：所述垃圾数据回收通过以下两种方式中任一方式实现，采用手动垃圾数据回收，需要用户指定一个段文件，然后系统进行回收；或者采用系统中自动垃圾数据回收。