CN108984338A - 一种面向去重备份系统数据恢复的离线最优缓存替换装置及方法 - Google Patents

一种面向去重备份系统数据恢复的离线最优缓存替换装置及方法 Download PDF

Info

Publication number
CN108984338A
CN108984338A CN201810555484.4A CN201810555484A CN108984338A CN 108984338 A CN108984338 A CN 108984338A CN 201810555484 A CN201810555484 A CN 201810555484A CN 108984338 A CN108984338 A CN 108984338A
Authority
CN
China
Prior art keywords
data
container
caching
replacement
standby system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810555484.4A
Other languages
English (en)
Other versions
CN108984338B (zh
Inventor
邓玉辉
杨儒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jinan University
University of Jinan
Original Assignee
Jinan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jinan University filed Critical Jinan University
Priority to CN201810555484.4A priority Critical patent/CN108984338B/zh
Publication of CN108984338A publication Critical patent/CN108984338A/zh
Application granted granted Critical
Publication of CN108984338B publication Critical patent/CN108984338B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • G06F11/1469Backup restoration techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F12/00Accessing, addressing or allocating within memory systems or architectures
    • G06F12/02Addressing or allocation; Relocation
    • G06F12/08Addressing or allocation; Relocation in hierarchically structured memory systems, e.g. virtual memory systems
    • G06F12/12Replacement control
    • G06F12/121Replacement control using replacement algorithms
    • G06F12/123Replacement control using replacement algorithms with age lists, e.g. queue, most recently used [MRU] list or least recently used [LRU] list

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种面向去重备份系统数据恢复的离线最优缓存替换装置及方法。由于逻辑连续的数据被物理分散在不同的磁盘位置,传统去重方法产生的碎片严重影响系统恢复的性能,目前一些优化方法尝试在恢复时利用优化缓存替换策略来改进恢复性能,然而这些方法在数据局部性不强时缓存的命中率低或在线上计算最优的替换次序时耗费的额外计算开销大,导致不能有效地抵抗碎片对恢复性能的影响,针对以上问题,本发明一方面从离线的角度去计算最优的缓存替换策略;另一方面在不牺牲系统去重率下且不需要额外的计算开销下获取最优的替换次序来有效提高恢复性能和吞吐量,离线最优缓存替换策略能够有效优化所需文件的恢复时间,符合现代化数据存储要求。

Description

一种面向去重备份系统数据恢复的离线最优缓存替换装置及 方法
技术领域
本发明涉及去重系统数据恢复技术领域,具体涉及一种面向去重备份系统数据恢复的离线最优缓存替换装置及方法。
背景技术
随着大数据时代的来临,数据量的迅猛增长给数据中心的有限存储空间带来了巨大挑战。重复数据删除技术大大降低了存储数据所需的磁盘开销和网络传输所需带宽,渐渐成为当今备份系统的一项关键数据缩减技术。去重备份系统存储数据的目的是为了以后能够及时的恢复,企业在磁盘出现故障或数据库相关文件损坏等灾难发生时如果其不能及时地恢复数据,所承受的损失将不可估量,数据备份也变得意义不大。由于逻辑连续的数据被物理分散在不同的磁盘位置,传统的去重方法产生的碎片严重影响了系统的恢复性能。之前存在的一些优化方法尝试在恢复时利用优化缓存替换策略来改进恢复性能,然而这些方法不是命中率低就是额外的计算开销大,不能有效地抵抗碎片对恢复性能的影响。
发明内容
本发明的目的是为了解决现有技术中的上述缺陷,提供一种面向去重备份系统数据恢复的离线最优缓存替换装置及方法,通过优化恢复缓存策略来抵抗碎片对恢复性能的损害,同时,在恢复指定备份数据时不需要缓存额外的计算开销,从而可以保证系统的恢复性能。
根据公开的实施例,本发明的第一方面公开了一种面向去重备份系统数据恢复的离线最优缓存替换装置,所述的装置包括顺序连接的访问序列文件、离线最优缓存替换模块、数据恢复模块以及恢复数据存储模块,所述的装置还包括元数据存储模块,与所述的数据恢复模块连接;
其中,所述的访问序列文件,依次记录了备份时每个数据块所属的容器ID号,备份系统在数据备份的同时生成访问序列文件;
所述的离线最优缓存替换模块,在内存中分别维持了访问记录表、排序记录表和离线最优模拟缓存,该模块通过分析访问序列文件,来模拟数据的恢复过程,从而得到最优的缓存替换容器序列号,为后期的数据恢复模块提供缓存替换信息,其中,访问记录表是一个哈希表,其记录了未来一段时间内各个容器将要被访问的次序,排序记录表则记录了当前缓存中所涉及到的容器ID号,其是根据当前访问记录表中的信息对缓存中维持的容器ID进行访问时间的排序;
所述的替换的容器,作为数据恢复时缓存需要踢出的容器;
所述的元数据存储模块,用于备份系统在数据去重后存储每次备份生成的元数据文件,通过访问元数据文件,备份系统完成相应的数据恢复;
所述的数据恢复模块,包括替换记录表和恢复缓存,根据预先指定的恢复命令,备份系统恢复相应的一次备份数据,并将该次备份恢复到指定的目录当中,最终的数据都按照原本的格式落盘;
所述的恢复数据存储模块,用于存储恢复后的数据。
进一步地,结合访问序列文件中的容器ID号,备份系统在离线情况下模拟一个最优的缓存替换过程,并且缓存中的每个容器都会分配相应的固定编号,最终通过离线最优缓存替换模块生成一个缓存替换信息文件,该文件依次记录了数据恢复过程中缓存队列在达到阀值时需要踢出的容器编号,并且通过离线分析确保这个被踢出的容器是未来最长时间内不被访问的。
根据公开的实施例,本发明的第二方面公开了一种面向去重备份系统数据恢复的离线最优缓存替换方法,所述的方法包括下列步骤:
S1、备份系统在完成数据备份后生成备份元数据和访问序列文件;
S2、根据备份元数据和访问序列文件,离线最优缓存替换模块中的访问记录表和排序记录表经过线下模拟分析出最优的替换容器序列号,并将该信息记录在生成的文件中;
S3、当备份系统收到恢复某一备份数据的请求,首先启动数据恢复过程,备份系统将根据元数据文件的信息开始进行数据恢复,且将替换容器序列号预读到替换容器表中;
S4、当缓存发生替换时,直接结合记录替换容器表中的信息将相应的容器踢出缓存队列并进行替换;
S5、最后生成恢复的备份数据到指定的目录。
进一步地,所述的步骤S2中,当备份系统开始模拟数据恢复后,其会一直循环的读取之前备份生成的访问序列文件,并将获取的访问容器ID号插入到模拟缓存中,直到读取到文件结束标志后,数据恢复才完成;在缓存未满时,每次将容器ID号按照LRU的方式插入缓存队列;同时,备份系统会为当前缓存维持一个滑动的窗口,其会周期性地读取访问序列文件,得到未来一段时间被访问的容器ID号,并将这些容器ID号对应的被访问次序记录在访问记录表中,当缓存大小达到预先获取的最大值时,离线最优缓存替换模块以当前访问记录表中的容器访问次序信息为依据,对排序记录表中的容器ID进行排序,最终将访问次序号最大的容器从模拟缓存中踢出,并且这个容器ID号所对应的缓存位置被写入备份系统自动生成的日志中。
进一步地,所述的步骤S3中,
当备份系统进行真实的数据恢复时,为了减少访问磁盘的次数,数据恢复模块将记录替换容器的日志文件全部读到内存,将这些数据维持在一个替换记录队列当中;根据元数据文件中的信息,备份系统将磁盘中的容器预取到缓存中,当缓存未满时,按照先进先出的次序插入数据,反之,当缓存大小达到预定阀值时,OFL缓存将从替换记录队列中取出元素并找到对应的缓存地址将容器踢出。
本发明相对于现有技术具有如下的优点及效果:
(1)、本发明相对传统的最优缓存替换算法,避免了额外的线上计算开销,从而提高了系统的恢复性能。
(2)、本发明相对经典的LRU缓存替换算法,提高了系统恢复缓存的命中率。
(3)、本发明相对传统的数据恢复方法,采用了离线的缓存机制来减少系统的恢复时间。
附图说明
图1是本发明中面向去重备份系统数据恢复的离线最优缓存替换方法模型结构示意图;
图2是本发明中离线缓存替换结构图;
图3是本发明中恢复数据结构图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例
如图1所示,本发明结构包含以下几个部分:①访问序列文件、②离线最优缓存替换模块、③替换的容器、④元数据存储模块、⑤数据恢复模块、⑥恢复数据存储模块,该系统主要由②和⑤两个模块组成。模块②在系统空闲时期通过利用最优的缓存替换策略模拟完成数据恢复,为后期真实的数据恢复过程提供可靠的恢复缓存替换策略,模块⑤主要的工作是通过利用离线最优缓存替换模块②提供的信息完成数据的恢复。
访问序列文件,访问序列文件依次记录了备份时每个数据块所属的容器ID号。系统是在数据备份的同时生成访问序列文件,即生成该文件不会影响到数据恢复的性能,并且该文件为后期的离线分析提供了有效的数据备份信息。
离线最优缓存替换模块,离线最优缓存替换模块在内存中分别维持了访问记录表、排序记录表和离线最优模拟缓存三个结构。该模块通过分析访问序列文件,来模拟数据的恢复过程,从而得到最优的缓存替换容器序列号,为后期的数据恢复模块提供缓存替换信息。访问记录表是一个哈希表,其记录了未来一段时间内各个容器将要被访问的次序。而排序记录表则记录了当前缓存中所涉及到的容器ID号,其是根据当前访问记录表中的信息对缓存中维持的容器ID进行排序,从而得出哪个容器很久不被访问。
替换的容器,替换的容器指数据恢复时缓存需要踢出的容器。结合访问序列文件中的容器ID号,系统在离线的情况下模拟了一个最优的缓存替换过程,并且缓存中的每个容器都会分配相应的固定编号,最终通过离线最优缓存替换模块生成了一个缓存替换信息文件。该文件依次记录了数据恢复过程中缓存队列在达到阀值时需要踢出的容器编号,并且通过离线分析可以确保这个被踢出的容器是未来最长时间内不被访问的。
元数据存储模块,数据去重的目的是为了后期的数据恢复。备份系统在数据去重后都会为本次备份生成一份元数据文件。元数据存储采用文件的形式记录相关的数据信息。通过不断的访问元数据文件,系统完成相应的数据恢复。
数据恢复模块,数据恢复模块包括替换记录表和恢复缓存,根据预先指定的恢复命令,系统可以恢复相应的一次备份数据,并将该次备份恢复到指定的目录当中,最终的数据都按照原本的格式落盘。
如图2所示,本发明提出的离线缓存替换结构,当系统开始模拟数据恢复后,其会一直循环的读取之前备份生成的访问序列文件,并将获取的访问容器ID号插入到模拟缓存中,直到读取到文件结束标志后,数据恢复才完成。在缓存未满时,每次将容器ID号按照LRU的方式插入缓存队列,比如,将当前处理的容器ID号插入到队头。同时,系统会为当前缓存维持一个滑动的窗口,其会周期性地读取访问序列文件,得到未来一段时间被访问的容器ID号,并将这些容器对应的被访问次序记录在访问记录表中,当缓存大小达到预先获取的最大值时,离线最优缓存替换模块以当前访问记录表中的容器访问次序信息为依据,对排序记录表中的容器ID进行排序,最终将访问次序号最大的容器从模拟缓存中踢出,并且这个容器ID号所对应的缓存位置被写入系统自动生成的日志中。当数据模拟恢复结束时,这个日志文件将记录下缓存所有需要替换的容器,其避免了系统在真实恢复数据时需要计算最优替换策略的额外开销,从而提高恢复性能。
离线最优缓存替换策略方法,包括以下步骤:
(1)、系统在完成数据备份后会生成备份元数据和访问序列文件。
(2)、根据步骤(1)中的数据信息,离线最优缓存替换模块中的访问记录表和排序记录表经过一系列的线下模拟分析出最优的替换容器序列号,并将该信息记录在生成的文件中。
(3)、当系统收到恢复某一备份数据的请求,首先启动数据恢复过程,系统将根据元数据文件的信息开始进行数据恢复,且将替换容器序列号预读到替换容器表中。
(4)、在步骤(3)进行的过程中,当缓存发生替换时,直接结合记录替换容器表中的信息将相应的容器踢出缓存队列并进行替换。
(5)、最后生成恢复的备份数据到指定的目录。
如图3所示,本发明提出的数据恢复过程,数据恢复模块大致包含替换记录表和替换OFL缓存两个结构。当OFL系统进行真实的数据恢复时,为了减少访问磁盘的次数,数据恢复模块将记录替换容器的日志文件全部读到内存,将这些数据维持在一个替换记录队列当中。根据元数据文件中的信息,系统将磁盘中的容器预取到缓存中。当缓存未满时,按照先进先出的次序插入数据。反之,当缓存大小达到预定阀值时,OFL缓存将从替换记录队列中取出元素并找到对应的缓存地址将容器踢出。
综上所述,上述实施例提出了一种面向去重备份系统数据恢复的离线最优缓存替换方法,一方面从离线的角度去计算最优的缓存替换策略;另一方面在不牺牲系统去重率下且不需要额外的计算开销下获取最优的替换次序来有效提高恢复性能和吞吐量,离线最优缓存替换策略能够有效地优化所需文件的恢复时间,符合现代化对数据存储的要求
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

Claims (5)

1.一种面向去重备份系统数据恢复的离线最优缓存替换装置,其特征在于,所述的装置包括顺序连接的访问序列文件、离线最优缓存替换模块、数据恢复模块以及恢复数据存储模块,所述的装置还包括元数据存储模块,与所述的数据恢复模块连接;
其中,所述的访问序列文件,依次记录了备份时每个数据块所属的容器ID号,备份系统在数据备份的同时生成访问序列文件;
所述的离线最优缓存替换模块,在内存中分别维持了访问记录表、排序记录表和离线最优模拟缓存,该模块通过分析访问序列文件,来模拟数据的恢复过程,从而得到最优的缓存替换容器序列号,为后期的数据恢复模块提供缓存替换信息,其中,访问记录表是一个哈希表,其记录了未来一段时间内各个容器将要被访问的次序,排序记录表则记录了当前缓存中所涉及到的容器ID号,其是根据当前访问记录表中的信息对缓存中维持的容器ID进行访问时间的排序;
所述的替换的容器,作为数据恢复时缓存需要踢出的容器;
所述的元数据存储模块,用于备份系统在数据去重后存储每次备份生成的元数据文件,通过访问元数据文件,备份系统完成相应的数据恢复;
所述的数据恢复模块,包括替换记录表和恢复缓存,根据预先指定的恢复命令,备份系统恢复相应的一次备份数据,并将该次备份恢复到指定的目录当中,最终的数据都按照原本的格式落盘;
所述的恢复数据存储模块,用于存储恢复后的数据。
2.根据权利要求1所述的一种面向去重备份系统数据恢复的离线最优缓存替换装置,其特征在于,结合访问序列文件中的容器ID号,备份系统在离线情况下模拟一个最优的缓存替换过程,并且缓存中的每个容器都会分配相应的固定编号,最终通过离线最优缓存替换模块生成一个缓存替换信息文件,该文件依次记录了数据恢复过程中缓存队列在达到阀值时需要踢出的容器编号,并且通过离线分析确保这个被踢出的容器是未来最长时间内不被访问的。
3.一种面向去重备份系统数据恢复的离线最优缓存替换方法,其特征在于,所述的方法包括下列步骤:
S1、备份系统在完成数据备份后生成备份元数据和访问序列文件;
S2、根据备份元数据和访问序列文件,离线最优缓存替换模块中的访问记录表和排序记录表经过线下模拟分析出最优的替换容器序列号,并将该信息记录在生成的文件中;
S3、当备份系统收到恢复某一备份数据的请求,首先启动数据恢复过程,备份系统将根据元数据文件的信息开始进行数据恢复,且将替换容器序列号预读到替换容器表中;
S4、当缓存发生替换时,直接结合记录替换容器表中的信息将相应的容器踢出缓存队列并进行替换;
S5、最后生成恢复的备份数据到指定的目录。
4.根据权利要求3中所述的一种面向去重备份系统数据恢复的离线最优缓存替换方法,其特征在于,所述的步骤S2中,当备份系统开始模拟数据恢复后,其会一直循环的读取之前备份生成的访问序列文件,并将获取的访问容器ID号插入到模拟缓存中,直到读取到文件结束标志后,数据恢复才完成;在缓存未满时,每次将容器ID号按照LRU的方式插入缓存队列;同时,备份系统会为当前缓存维持一个滑动的窗口,其会周期性地读取访问序列文件,得到未来一段时间被访问的容器ID号,并将这些容器ID号对应的被访问次序记录在访问记录表中,当缓存大小达到预先获取的最大值时,离线最优缓存替换模块以当前访问记录表中的容器访问次序信息为依据,对排序记录表中的容器ID进行排序,最终将访问次序号最大的容器从模拟缓存中踢出,并且这个容器ID号所对应的缓存位置被写入备份系统自动生成的日志中。
5.根据权利要求3中所述的一种面向去重备份系统数据恢复的离线最优缓存替换方法,其特征在于,所述的步骤S3中,
当备份系统进行真实的数据恢复时,为了减少访问磁盘的次数,数据恢复模块将记录替换容器的日志文件全部读到内存,将这些数据维持在一个替换记录队列当中;根据元数据文件中的信息,备份系统将磁盘中的容器预取到缓存中,当缓存未满时,按照先进先出的次序插入数据,反之,当缓存大小达到预定阀值时,OFL缓存将从替换记录队列中取出元素并找到对应的缓存地址将容器踢出。
CN201810555484.4A 2018-06-01 2018-06-01 一种面向去重备份系统数据恢复的离线最优缓存替换装置及方法 Active CN108984338B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810555484.4A CN108984338B (zh) 2018-06-01 2018-06-01 一种面向去重备份系统数据恢复的离线最优缓存替换装置及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810555484.4A CN108984338B (zh) 2018-06-01 2018-06-01 一种面向去重备份系统数据恢复的离线最优缓存替换装置及方法

Publications (2)

Publication Number Publication Date
CN108984338A true CN108984338A (zh) 2018-12-11
CN108984338B CN108984338B (zh) 2021-11-12

Family

ID=64540422

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810555484.4A Active CN108984338B (zh) 2018-06-01 2018-06-01 一种面向去重备份系统数据恢复的离线最优缓存替换装置及方法

Country Status (1)

Country Link
CN (1) CN108984338B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110941514A (zh) * 2019-11-25 2020-03-31 湖北工业大学 一种数据备份方法、恢复方法、计算机设备和存储介质
CN113849455A (zh) * 2021-09-28 2021-12-28 致真存储(北京)科技有限公司 一种基于混合式存储器的mcu及缓存数据的方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130282964A1 (en) * 2010-05-05 2013-10-24 Microsoft Corporation Flash memory cache including for use with persistent key-value store
CN103473150A (zh) * 2013-08-28 2013-12-25 华中科技大学 一种用于数据去重系统中的碎片重写方法
CN106503051A (zh) * 2016-09-23 2017-03-15 暨南大学 一种基于元数据分类的贪婪预取型数据恢复系统及恢复方法
CN107196998A (zh) * 2017-04-28 2017-09-22 华中科技大学 基于数据去重的移动Web请求处理方法、设备及系统
US9798793B1 (en) * 2014-12-30 2017-10-24 EMC IP Holding Company LLC Method for recovering an index on a deduplicated storage system

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130282964A1 (en) * 2010-05-05 2013-10-24 Microsoft Corporation Flash memory cache including for use with persistent key-value store
CN103473150A (zh) * 2013-08-28 2013-12-25 华中科技大学 一种用于数据去重系统中的碎片重写方法
US9798793B1 (en) * 2014-12-30 2017-10-24 EMC IP Holding Company LLC Method for recovering an index on a deduplicated storage system
CN106503051A (zh) * 2016-09-23 2017-03-15 暨南大学 一种基于元数据分类的贪婪预取型数据恢复系统及恢复方法
CN107196998A (zh) * 2017-04-28 2017-09-22 华中科技大学 基于数据去重的移动Web请求处理方法、设备及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
YOUNG JIN NAM等: ""Assuring Demanded Read Performance of Data Deduplication Storage with Backup Datasets"", 《2012 IEEE 20TH INTERNATIONAL SYMPOSIUM ON MODELING, ANALYSIS AND SIMULATION OF COMPUTER AND TELECOMMUNICATION SYSTEMS》 *
付忞: "面向数据备份的高效数据去重系统构建方法研究", 《中国博士学位论文全文数据库 信息科技辑》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110941514A (zh) * 2019-11-25 2020-03-31 湖北工业大学 一种数据备份方法、恢复方法、计算机设备和存储介质
CN110941514B (zh) * 2019-11-25 2022-05-20 湖北工业大学 一种数据备份方法、恢复方法、计算机设备和存储介质
CN113849455A (zh) * 2021-09-28 2021-12-28 致真存储(北京)科技有限公司 一种基于混合式存储器的mcu及缓存数据的方法
CN113849455B (zh) * 2021-09-28 2023-09-29 致真存储(北京)科技有限公司 一种基于混合式存储器的mcu及缓存数据的方法

Also Published As

Publication number Publication date
CN108984338B (zh) 2021-11-12

Similar Documents

Publication Publication Date Title
CN102521269B (zh) 一种基于索引的计算机连续数据保护方法
CN106662981B (zh) 存储设备、程序和信息处理方法
CN103885895B (zh) 容错集群存储系统中的写入性能
DE112012001302B4 (de) Cachen von Daten in einem Speichersystem mit mehreren Cache-Speichern
CN110262922B (zh) 基于副本数据日志的纠删码更新方法及系统
CN103473150B (zh) 一种用于数据去重系统中的碎片重写方法
CN106503051B (zh) 一种基于元数据分类的贪婪预取型数据恢复系统及恢复方法
US20160212203A1 (en) Multi-site heat map management
US20090292947A1 (en) Cascading index compression
CN111782612B (zh) 跨域虚拟数据空间中文件数据边缘缓存方法
CN103152395A (zh) 一种分布式文件系统的存储方法及装置
CN107832423B (zh) 一种用于分布式文件系统的文件读写方法
CN103366016A (zh) 基于hdfs的电子文件集中存储及优化方法
CN104050103B (zh) 一种用于数据恢复的缓存替换方法与系统
CN110188080A (zh) 基于客户端高效缓存的远程文件数据访问性能优化方法
CN103516549B (zh) 一种基于共享对象存储的文件系统元数据日志机制
CN103514258B (zh) 一种基于离线缓存文件操作集中记录预处理并重放的方法
CN109299115A (zh) 一种数据存储方法、装置、服务器及存储介质
CN110196818A (zh) 缓存数据的方法、缓存设备和存储系统
CN107368608A (zh) 基于arc替换算法的hdfs小文件缓存管理方法
KR20130123897A (ko) 하이브리드 스토리지 시스템의 파일 관리 방법 및 장치
CN108519856B (zh) 基于异构Hadoop集群环境下的数据块副本放置方法
CN111159176A (zh) 一种海量流数据的存储和读取的方法和系统
Yang et al. Tombolo: Performance enhancements for cloud storage gateways
CN104281673A (zh) 一种数据库的缓存构建系统及对应的构建方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant