CN105045850B - 云存储日志文件系统中垃圾数据回收方法 - Google Patents

云存储日志文件系统中垃圾数据回收方法 Download PDF

Info

Publication number
CN105045850B
CN105045850B CN201510390367.3A CN201510390367A CN105045850B CN 105045850 B CN105045850 B CN 105045850B CN 201510390367 A CN201510390367 A CN 201510390367A CN 105045850 B CN105045850 B CN 105045850B
Authority
CN
China
Prior art keywords
data
daily record
junk data
junk
file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510390367.3A
Other languages
English (en)
Other versions
CN105045850A (zh
Inventor
贾威威
张延园
林奕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northwestern Polytechnical University
Original Assignee
Northwestern Polytechnical University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northwestern Polytechnical University filed Critical Northwestern Polytechnical University
Priority to CN201510390367.3A priority Critical patent/CN105045850B/zh
Publication of CN105045850A publication Critical patent/CN105045850A/zh
Application granted granted Critical
Publication of CN105045850B publication Critical patent/CN105045850B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/1805Append-only file systems, e.g. using logs or journals to store data
    • G06F16/1815Journaling file systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/13File access structures, e.g. distributed indices
    • G06F16/134Distributed indices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/14Details of searching files based on file metadata
    • G06F16/148File search processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/16File or folder operations, e.g. details of user interfaces specifically adapted to file systems
    • G06F16/162Delete operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/174Redundancy elimination performed by the file system

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Library & Information Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种云存储日志文件系统中垃圾数据回收方法,用于解决现有垃圾数据回收方法存储空间利用率差的技术问题。技术方案是首先进行垃圾数据判断,并在文件系统更新时创建一个新的日志,日志中的索引节点包含三级索引结构,每个文件都对应一个索引节点,三级索引结构存放数据块的索引地址,查找垃圾数据以最新的日志为基准,从最早的日志开始依次对比日志中的索引地址,云存储日志文件系统把数据存储在日志中,把日志又存储在段存储文件中,当段存储文件的垃圾数据量大于阈值时进行垃圾数据回收。本发明利用手动或自动垃圾数据回收,支持手动配置段文件回收阈值,随时回收垃圾数据所占用的存储空间,提高了存储空间的利用率。

Description

云存储日志文件系统中垃圾数据回收方法
技术领域
本发明涉及一种垃圾数据回收方法,特别涉及一种云存储日志文件系统中垃圾数据回收方法。
背景技术
随着互联网大数据的日益增长,各大互联网巨头推出了各自的存储系统,这些存储系统也成为了行业标准。Google设计与实现了Google File System(GFS)和键值存储系统LevelDB,Amazon设计与实现了Simple Storage System(S3)和键值存储系统Dynamo,Yahoo!设计与实现了PNUTS,Facebook设计与实现了Cassandra等等。这些存储系统大部分是不开源的,因此开源组织也针对其公布的论文设计与实现了开源版存储系统,例如Apache基金会设计与实现了GFS开源版Hadoop Distributed File System。这些存储系统是针对互联网业务的特性而设计的,比如需要具备高可用性,可扩展性,容错性等等,但是大部分都没有考虑设计与实现垃圾数据回收子系统,这主要是互联网公司对用户数据的依赖性,用户的任何数据都具有价值,即使用户删除,其系统也不会自动删除,而是保存这些数据。但是,有些应用场景如果不及时删除用户的垃圾数据,存储空间很快就不够用了,例如,嵌入式系统,云存储时代大数据暴增等等。同时,还有很多公司设计了专门的垃圾数据回收方法,但是并没有公开他们的技术方法,例如,微软的内存垃圾数据回收以及磁盘垃圾数据回收方法。Sheepdog是日本NTT公司设计与实现的一款基于QEMU/KVM虚拟机的分布式块存储系统,Sheepdog存储系统中包含了垃圾数据回收子系统,其采用GenerationalReference Counting(GRC)算法进行垃圾回收。GRC算法由Goldberg和Benjamin于1989年发表在了ACM SIGPLAN Notices期刊的第7期第24卷313到321页,这种垃圾回收方法需要消耗额外的存储空间,而且这种垃圾回收方法是针对整个镜像文件,力度较大,灵活度低。
发明内容
为了克服现有垃圾数据回收方法存储空间利用率差的不足,本发明提供一种云存储日志文件系统中垃圾数据回收方法。该方法首先进行垃圾数据判断,并在文件系统更新时创建一个新的日志,日志中包含日志头、数据块、索引数据块、索引节点以及索引节点映射。其中,索引节点包含三级索引结构,每个文件都对应一个索引节点,三级索引结构存放数据块的索引地址,查找垃圾数据以最新的日志为基准,从最早的日志开始依次对比日志中的索引地址,若旧日志的索引地址和最新的日志中的索引地址相同则日志中包含的数据不是的垃圾数据,若不相同则说明该数据是垃圾数据。垃圾数据量达到一定的阀值时进行垃圾数据回收操作。云存储日志文件系统把数据存储在日志中,把日志又存储在段存储文件中,只有当段存储文件的垃圾数据量大于阀值时才进行垃圾数据回收,先把要删除的段存储文件中的有效数据拷贝到新的段存储文件,然后再删除段存储文件。垃圾数据回收通过两种方式实现,一种是用户手动垃圾数据回收,需要用户指定一个段文件,然后系统进行回收,另外一种是系统中自动垃圾数据回收,第一种的好处是用户可以设置垃圾数据阀值,这样使垃圾数据回收更加灵活,也可以节省更多存储空间,提高了存储空间的利用率。
本发明解决其技术问题所采用的技术方案是:一种云存储日志文件系统中垃圾数据回收方法,其特点是包括以下步骤:
步骤一、进行垃圾数据判断,并在文件系统更新时创建一个新的日志,日志中包含日志头、数据块、索引数据块、索引节点以及索引节点映射。所述索引节点包含三级索引结构,每个文件都对应一个索引节点,三级索引结构存放数据块的索引地址,查找垃圾数据需要以最新的日志为基准,从最早的日志开始依次对比日志中的索引地址,若旧日志的索引地址和最新的日志中的索引地址相同则日志中包含的数据不是的垃圾数据,若不相同则说明该数据是垃圾数据。当垃圾数据量达到所配置的阀值时,进行垃圾数据回收操作。
步骤二、垃圾数据回收通过删除和拷贝实现,即云存储日志文件系统底层将数据存储在日志中,将日志存储在段存储文件中,只有当段存储文件的垃圾数据量大于阀值时,先把要删除的段存储文件中的有效数据拷贝到新的段存储文件,然后再删除段存储文件。
所述垃圾数据回收通过以下两种方式中任一方式实现,采用手动垃圾数据回收,需要用户指定一个段文件,然后系统进行回收;或者采用系统中自动垃圾数据回收。
本发明的有益效果是:该方法首先进行垃圾数据判断,并在文件系统更新时创建一个新的日志,日志中包含日志头、数据块、索引数据块、索引节点以及索引节点映射。其中,索引节点包含三级索引结构,每个文件都对应一个索引节点,三级索引结构存放数据块的索引地址,查找垃圾数据以最新的日志为基准,从最早的日志开始依次对比日志中的索引地址,若旧日志的索引地址和最新的日志中的索引地址相同则日志中包含的数据不是的垃圾数据,若不相同则说明该数据是垃圾数据。垃圾数据量达到一定的阀值时进行垃圾数据回收操作。云存储日志文件系统把数据存储在日志中,把日志又存储在段存储文件中,只有当段存储文件的垃圾数据量大于阀值时才进行垃圾数据回收,先把要删除的段存储文件中的有效数据拷贝到新的段存储文件,然后再删除段存储文件。垃圾数据回收通过两种方式实现,一种是用户手动垃圾数据回收,需要用户指定一个段文件,然后系统进行回收,另外一种是系统中自动垃圾数据回收,第一种的好处是用户可以设置垃圾数据阀值,这样使垃圾数据回收更加灵活,也可以节省更多存储空间,提高了存储空间的利用率。
以下结合具体实施方式详细说明本发明。
具体实施方式
本发明云存储日志文件系统中垃圾数据回收方法具体步骤如下:
本发明基于一种分布式文件系统,该分布式文件系统在Hadoop DistributedFile System(HDFS)之上结合日志文件系统实现了日志结构的分布式文件系统,本发明为了解决Apache基金会设计与实现的HDFS等类似分布式文件系统无法解决的垃圾数据回收问题,同时也改进了Sheepdog等存储系统中虽然实现了垃圾回收系统,但是还存在一些问题,如垃圾回收需要消耗额外的存储空间,垃圾回收力度大,不够灵活。
了解决垃圾数据回收问题,本发明首先进行垃圾数据判断,分布式文件系统每次更新都会创建一个新的日志,日志中包含日志头,数据块,索引数据块,索引节点以及索引节点映射。其中,索引节点包含三级索引结构,每个文件都对应一个索引节点(由唯一的索引节点号标示),三级索引结构存放数据块的索引地址,查找垃圾数据需要以最新的日志为基准,从最早的日志开始依次对比日志中的索引地址,若旧日志的索引地址和最新的日志中的索引地址相同则日志中包含的数据不是的垃圾数据,若不相同则说明该数据是垃圾数据。如果垃圾数据量达到一定的阀值(可配置)然后就进行垃圾数据回收操作。垃圾数据回收操作是通过删除和拷贝实现的,不是所有垃圾数据都进行回收,该专利实现是基于云存储日志文件系统,而这种文件系统底层是把数据存储在日志中,把日志又存储在段存储文件中,只有当段存储文件的垃圾数据量大于阀值时才进行垃圾数据回收,先把要删除的段存储文件中的有效数据拷贝到新的段存储文件,然后再删除段存储文件。垃圾数据回收通过两种方式实现,一种是用户手动垃圾数据回收,需要用户指定一个段文件,然后系统进行回收,另外一种是系统中自动垃圾数据回收,第一种的好处是用户可以设置垃圾数据阀值,这样使垃圾数据回收更加灵活,也可以节省更多存储空间。
本发明针对分布式日志文件系统设计了一种新型的垃圾回收方法,可以有效的回收HDFS等分布式文件系统中的垃圾数据,提高了数据的存储率,同时还改进了Sheepdog等存储系统中垃圾数据回收方法,垃圾数据回收不需要借助额外的存储空间,也提高了垃圾数据回收的灵活度。
云存储日志文件系统中垃圾数据回收方法发明专利包含两部分内容,第一,无快照垃圾数据回收方法;第二,快照下垃圾数据回收方法。以上两部分垃圾数据回收方法通过云存储日志文件系统设计与实现。
云存储日志文件系统基于Hadoop Distributed File System(HDFS)并借助经典日志文件系统的思想,对文件的每次更新都会追加一个日志,因此该文件系统逻辑上的存储空间是由很多个日志组成,这些日志就是天然的快照,可以根据需要回滚并恢复数据。每个日志分为五个部分,依次为日志头,数据块,索引块,索引节点和索引节点映射。日志头包含了整个日志的大小和其他日志元数据,数据块存储了用户的数据,索引块是用来存储数据块的索引地址,索引节点包含了文件所对应的数据块的索引地址,索引节点映射唯一标示了索引节点。为了方便垃圾数据回收以及管理数据,在该日志结构之上又划分了段文件,每个段文件由很多个日志组成,且存储大小不超过64MB,而HDFS默认数据块是64MB,这样刚好吻合,可以提高数据在HDFS之上的存储和读取。当用户对一个文件提出随机写请求,首先被封装成一个日志,然后被追加到当前最新的段文件末尾,而用户的读请求只需要读取最新段文件的最新日志就可以通过索引结构读取到所有数据。该日志文件系统的索引节点中的索引结构和经典文件系统一样,直接索引存储数据块,一级索引存储索引块的地址,以此类推。
为了更高效的管理存储空间,垃圾数据回收的单位并非以日志为单位,因为如果以日志为单位那么管理效率很低,力度不够大,因此在日志之上又划分了段文件,每个段文件都是由若干个日志组成的,段文件大小不超过64MB。整个存储空间是64位,前38位是段号后26位是段内偏移地址,因此该文件系统可以有2^38个段文件,而每个段的大小为64MB。垃圾数据回收分为两个步骤,具体如下:
(1)首先需要统计当前已生成段文件的段使用情况,这里存在一个段内可用数据块的阀值,如果这个段内的可用数据块数量低于这个阀值就需要段回收,相反则保留这个段文件,这个垃圾回收段阀值是可以配置的,根据不同的需求可以在系统初始化的时候设置。
(2)当段统计完成之后,就需要对段文件可用数据块低于阀值的段文件进行回收,段文件回收采用move-and-remove语义,首先创建新的段文件,把要回收的段文件的可用数据块写入到新创建的段文件,然后删除要回收的段文件,整个段回收工作是后台进程完成的,只有在当前没有写入任务的时候才开始执行段回收工作,这样就可以避免并发带来的一系列问题。
该日志文件系统快照分为线性快照和树形快照,线性快照是天然具备的,而树形快照是用户手动生成的,因此垃圾数据回收不能回收用户手动生成的快照,因此快照下的垃圾数据回收需要重新设计。当没有快照的时候,段统计是把当前所有段文件中的日志和最新的日志做比较,如果数据块的索引地址和最新日志的索引地址不一样,那么说明这个数据块中所包含的数据就是垃圾数据,而快照下的垃圾回收则是把存储空间划分为若干个部分,具体由当前快照数决定,然后以第一个快照为参照点开始进行垃圾数据回收,然后从第一个快照点之后的日志开始,以第二个快照为参照点开始进行垃圾数据回收,依次类推,最后完成垃圾数据回收段统计,最后对划分的这些部分执行段回收工作,这个阶段和没有快照一样。
垃圾数据回收是存储系统永久的一个话题,由于磁盘很廉价以及互联网应用特征,因此这个问题一直研究的很少,但是目前由于数据量暴增,垃圾数据回收已经是一个不可避免的话题。Hadoop Distributed File System等存储系统没有引进垃圾回收子系统,因此在一些应用场景不试用,还有一些存储系统已经引进了垃圾回收子系统,例如,Sheepdog等等。Sheepdog是日本NTT公司设计与实现的一款基于QEMU/KVM虚拟机的分布式块存储系统,Sheepdog存储系统中包含了垃圾数据回收子系统,其采用GenerationalReference Counting(GRC)算法进行垃圾回收。这个算法的核心思想是,一个存储对象包含代数和引用计数,这里的代数指的是这个存储对象是第几代引用,而引用计数用来记录这个存储对象被做了几次拷贝。这个算法还引进了一个存储表,这个存储表包含了存储镜像中每个存储对象的总引用计数。每个存储镜像可以包含很多个存储对象。
当一个存储对象A被创建的时候,他的代数和引用计数被初始化为零,同时存储表的第一个域初始化为一,其他均为零,这是因为第一个存储对象已经创建了。当另一个存储对象B基于A对象被克隆,那么B的代数就初始化为A的代数加一,这是因为B是基于A克隆的,A是第一代那么B就是第二代。B的引用计数初始化为零,同时A的引用计数加一。当存储表中的存储对象(A或者B)被删除时,那么一个删除消息发送给存储表,这个删除消息包含要删除的存储对象的代数和引用计数,最后在存储表中通过代数找到这个域,然后减一,同时把这个引用计数值加到下一个域,这是因为这个存储对象被拷贝了引用计数次。当存储表的每个域都为零时,这个存储镜像就可以回收了。在本发明专利的垃圾回收子系统中,不需要开辟存储空间,而Sheepdog垃圾回收是基于GRC算法,需要开辟新的存储空间,如果没有拷贝操作,那么每个存储对象都要产生额外的存储空间来存储代数和引用计数。
表1垃圾数据回收系统和Sheepdog垃圾数据系统对比
从表1可以看出来,通过采用垃圾数据回收阀值,使得垃圾数据回收是细粒度回收,灵活度也提高了,本发明垃圾回收是基于段文件,而Sheepdog垃圾数据回收是针对一个镜像文件,灵活度低,本发明直接基于段存储文件进行垃圾数据回收,不需要开辟新的存储空间,而Sheepdog垃圾回收则需要开辟新的存储空间。本发明垃圾回收子系统支持手动垃圾数据回收,而且支持手动配置段文件回收阀值,这样可以随时回收垃圾数据所占用的存储空间,提高了存储空间的利用率。通过本发明专利设计与实现的垃圾数据回收方法,能有效的回收分布式日志文件系统中所存在的垃圾数据,提高了存储空间利用率,同时也改进了垃圾数据回收的灵活度。
具体实施方法:
1,格式化该日志文件系统,输入日志文件系统所在路径”/home/user/”,数据块大小为4KB,段文件大小为64MB以及日志文件系统最大存储容量为64GB。输出以上输入内容并把以上内容以特定格式写入超级块文件。这样做的原因是,文件系统初始化或者以后运行过程中都可以访问这个超级块文件,进行初始化和进一步运行。
2,写入,读取和更新数据,写入65MB数据,然后读取数据,最后更新前64MB数据,这样做的原因是,更新写入的数据就会产生垃圾数据,因为更新会创建新的数据块代替旧的数据块,接下来就可以采用本专利垃圾数据回收方法执行垃圾回收操作。这一步需要输入日志文件系统存储路径”/home/user/”,每次写入4KB,写入,读取65MB,然后更新64MB。本次写入和更新操作会产生三个段存储文件,写入操作65MB会产生1.seg,2.seg段存储文件,更新操作会产生3.seg段存储文件。
3,手动进行垃圾回收(日志文件系统启动之后,系统自动启动后台线程进行垃圾数据回收,当没有写请求的时候,进行垃圾数据回收),这一步需要输入日志文件存储路径”/home/user/”和回收阀值30MB,这个阀值就是衡量每个段文件中的垃圾数据块是否大于这个阀值,大于则回收,小于则不回收。输出存储路径”/home/user/”和回收阀值30MB,并进行以下具体回收操作:
(1)根据回收阀值30MB统计并计算段文件中需要回收的数据块,把统计和计算结果写入到段统计文件中,因为接下来段回收将根据这个段统计文件对每个段进行回收。本次统计结果就是1.seg需要回收,垃圾数据量为64MB。
(2)根据段统计文件对要回收的段文件进行回收,具体需要执行Remove-and-Move操作,把要回收段中的有用数据移动到最新的段文件中,然后删除垃圾段文件。针对本次操作,因为1.seg都是垃圾数据,所以不需要拷贝1.seg中有效数据,直接删除即可。

Claims (2)

1.一种云存储日志文件系统中垃圾数据回收方法,其特征在于包括以下步骤:
步骤一、进行垃圾数据判断,在文件系统更新时创建一个新的日志,日志中包含日志头、数据块、索引数据块、索引节点以及索引节点映射;所述索引节点包含三级索引结构,每个文件都对应一个索引节点,三级索引结构存放数据块的索引地址,查找垃圾数据需要以最新的日志为基准,从最早的日志开始依次对比日志中的索引地址,若旧日志的索引地址和最新的日志中的索引地址相同则日志中包含的数据不是垃圾数据,若不相同则说明该数据是垃圾数据;
步骤二、垃圾数据回收通过删除和拷贝实现,即云存储日志文件系统底层将数据存储在日志中,将日志存储在段存储文件中,只有当段存储文件的垃圾数据量大于阈值时,先把要删除的段存储文件中的有效数据拷贝到新的段存储文件,然后再删除段存储文件。
2.根据权利要求1所述的云存储日志文件系统中垃圾数据回收方法,其特征在于:所述垃圾数据回收通过以下两种方式中任一方式实现,采用手动垃圾数据回收,需要用户指定一个段文件,然后系统进行回收;或者采用系统中自动垃圾数据回收。
CN201510390367.3A 2015-07-06 2015-07-06 云存储日志文件系统中垃圾数据回收方法 Active CN105045850B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510390367.3A CN105045850B (zh) 2015-07-06 2015-07-06 云存储日志文件系统中垃圾数据回收方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510390367.3A CN105045850B (zh) 2015-07-06 2015-07-06 云存储日志文件系统中垃圾数据回收方法

Publications (2)

Publication Number Publication Date
CN105045850A CN105045850A (zh) 2015-11-11
CN105045850B true CN105045850B (zh) 2018-08-14

Family

ID=54452397

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510390367.3A Active CN105045850B (zh) 2015-07-06 2015-07-06 云存储日志文件系统中垃圾数据回收方法

Country Status (1)

Country Link
CN (1) CN105045850B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106503260B (zh) * 2016-11-18 2020-04-28 北京奇虎科技有限公司 一种提高数据库的有效存储空间的方法和装置
CN106874214B (zh) * 2017-02-15 2022-08-02 腾讯科技(深圳)有限公司 云硬盘资源的回收方法及相关装置
CN107544873A (zh) * 2017-08-28 2018-01-05 郑州云海信息技术有限公司 一种存放备份数据的备份系统和方法
CN110851398B (zh) * 2018-08-20 2023-05-09 阿里巴巴集团控股有限公司 垃圾数据的回收处理方法、装置及电子设备
CN109785871A (zh) * 2019-03-07 2019-05-21 郑江恋 一种云储存拓展装置及其储存拓展方法
CN110471764A (zh) * 2019-08-01 2019-11-19 郑州阿帕斯科技有限公司 一种内存清理的处理方法及装置
CN114879910B (zh) * 2022-05-13 2023-10-13 苏州思萃工业互联网技术研究所有限公司 分布式块存储底层读写系统及方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102033945A (zh) * 2010-12-21 2011-04-27 中兴通讯股份有限公司 一种回收脏块的方法及装置
CN104050268A (zh) * 2014-06-23 2014-09-17 西北工业大学 一种日志空间在线可调整的连续数据保护和恢复方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102033945A (zh) * 2010-12-21 2011-04-27 中兴通讯股份有限公司 一种回收脏块的方法及装置
CN104050268A (zh) * 2014-06-23 2014-09-17 西北工业大学 一种日志空间在线可调整的连续数据保护和恢复方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
云存储日志文件系统中快照的设计与实现;陈莉君 等;《计算机应用与软件》;20130731;第30卷(第7期);204-208页 *
云存储日志结构文件系统中段回收机制的研究;侯浩沨 等;《计算机与数字工程》;20140731;第42卷(第7期);1210-1213,1247页 *

Also Published As

Publication number Publication date
CN105045850A (zh) 2015-11-11

Similar Documents

Publication Publication Date Title
CN105045850B (zh) 云存储日志文件系统中垃圾数据回收方法
US9672235B2 (en) Method and system for dynamically partitioning very large database indices on write-once tables
CN110825748B (zh) 利用差异化索引机制的高性能和易扩展的键值存储方法
US9155320B2 (en) Prefix-based leaf node storage for database system
EP3170106B1 (en) High throughput data modifications using blind update operations
US8037112B2 (en) Efficient access of flash databases
US20160203135A1 (en) In-memory latch-free index structure
CN103838853B (zh) 一种基于不同存储介质的混合文件系统
CN101488153A (zh) 嵌入式Linux下大容量闪存文件系统的实现方法
JP2015512604A (ja) 暗号ハッシュ・データベース
CN101523391A (zh) 信息检索系统和信息检索方法及程序
CN100424699C (zh) 一种属性可扩展的对象文件系统
CN101763415B (zh) 一种数据库的b树索引的生成方法及装置
CN104054071A (zh) 访问存储设备的方法和存储设备
CN103577513A (zh) 藉延迟节点实例化以缓存xml信息集的系统和/或方法
US11262929B2 (en) Thining databases for garbage collection
CN107766374A (zh) 一种海量小文件存储读取的优化方法和系统
CN103942301B (zh) 一种面向多数据类型访问应用的分布式文件系统
US10372605B2 (en) Generational garbage collector for trees under multi-version concurrency control
CN103399915A (zh) 一种搜索引擎索引文件的优化读取方法
CN107273443B (zh) 一种基于大数据模型元数据的混合索引方法
Jensen et al. Optimality in external memory hashing
JP6006740B2 (ja) インデックス管理装置
Doekemeijer et al. Key-Value Stores on Flash Storage Devices: A Survey
US11803525B2 (en) Selection and movement of data between nodes of a distributed storage system

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant