CN103118133B - 基于文件访问频次的混合云存储方法 - Google Patents

基于文件访问频次的混合云存储方法 Download PDF

Info

Publication number
CN103118133B
CN103118133B CN201310062777.6A CN201310062777A CN103118133B CN 103118133 B CN103118133 B CN 103118133B CN 201310062777 A CN201310062777 A CN 201310062777A CN 103118133 B CN103118133 B CN 103118133B
Authority
CN
China
Prior art keywords
file
frequency
copy
storage policy
queue
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310062777.6A
Other languages
English (en)
Other versions
CN103118133A (zh
Inventor
郑国轴
田帅
陶金火
杨建华
吴朝晖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN201310062777.6A priority Critical patent/CN103118133B/zh
Publication of CN103118133A publication Critical patent/CN103118133A/zh
Application granted granted Critical
Publication of CN103118133B publication Critical patent/CN103118133B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例公开了一种基于文件访问频次的混合云存储方法,包括以下步骤:新文件上传文件系统时,对文件采用多副本方式存储策略;文件上传文件系统完毕后,对文件采用纠删码编码方式存储策略;周期性统计文件系统中每个文件访问频次,将文件划分为三类,分别为高频文件、中频文件、低频文件;系统对不同类型的数据不同类型的文件采用不同的存储策略;系统根据文件访问频次的变化动态调整文件的存储策略。本发明通过周期性统计文件系统中每个文件访问频次将文件分类,对不同类型的文件采用不同的存储策略,而且根据文件访问频次的变化动态调整文件的存储策略,使整个文件系统整体上在保证数据可靠性和访问速度的前提下提高了系统存储资源利用率。

Description

基于文件访问频次的混合云存储方法
技术领域
本发明属于数据存储技术领域,特别地涉及一种基于文件访问频次的混合云存储方法。
背景技术
随着信息技术的不断发展,云存储系统占有举足轻重的地位。特别是在数据爆炸性增长的今天,本地的存储已经很难满足海量数据存储的需要,人们越来越多地使用云存储系统,它可以带来更高的存储能力、可靠性、安全性和移动性。
云存储系统设计中文件的存储分布机制会对许多系统的具体实现方面产生影响。比如,为了保证系统的容错性和数据存储的高可靠性,需要增加存储的冗余;为了提高系统的读取本地化,需要将相同数据的副本分布在更多的节点上;为实现负载均衡需要使数据分布得更加合理。传统的分布式系统大多采用独立磁盘冗余阵列(Redundant Array of Independent Disks,RAID)和复制技术进行数据的冗余,它通过增加存储空间和副本存储数量来实现系统的可靠性和容错性,要达到一定的可靠性对存储空间的要求较高;为了在保证存储的可靠性和容错性的基础上进一步减少额外的存储空间消耗,纠错编码如Reed-Solomon编码等也逐渐在云存储环境中得到应用,但这在提高了可靠性的同时又带来了数据读取和写入时性能的较大损失。
在使用多副本存储方式的分布式文件系统中,一般采用文件分块的方法,并把每个数据块的多个副本分别存储在不同的存储节点上,现在工业界普遍采用三副本的方式,这可以保证丢失任意2个数据块副本后恢复原数据块,提供了一定的数据可靠性,而且在读数据时可以并发读数据提高速度,但是这种策略需要的存储空间是原文件的3倍,大量的存储资源被用于存储数据的冗余副本上。随着文件系统的不断扩展,越来越多的存储资源被用来存储文件块的副本。
在使用纠删码存储方式的分布式文件系统中可以在提供相同可靠性的前提下大大节省存储资源,但是对数据进行纠删码编解码时会使用大量的计算和网络资源,而且因为文件没有多个副本,所以在读数据时不能并发读取以及本地读取的优势,不适合存储读取频繁的热数据。
发明内容
为解决上述问题,本发明的目的在于提供一种基于文件访问频次的混合云存储方法,通过周期性统计文件系统中每个文件访问频次将文件分类,对不同类型的文件采用不同的存储策略,而且根据文件访问频次的变化动态调整文件的存储策略,使整个文件系统整体上在保证数据可靠性和访问速度的前提下提高了系统存储资源利用率。
为实现上述目的,本发明的技术方案为:
基于文件访问频次的混合云存储方法,包括以下步骤,
1) 新文件上传文件系统时,对文件采用多副本方式存储策略,在文件上传时把文件划分为若干数据块,为每个数据块根据系统配置产生N个副本,将所述N个副本存储在不同的存储节点上;
2) 文件上传文件系统完毕后,对文件采用纠删码编码方式存储策略,将文件的所有数据块加入一个转换队列,系统对转换队列中的所有数据块进行纠删编码产生校验块,然后将文件的所有数据块和校验块分布存储在不同的存储节点上并删除多余的副本;
3) 周期性统计文件系统中每个文件每小时内访问频次,将所有文件按照1:2:7的访问频次比例划分为三类,分别为高频文件、中频文件和低频文件;
4) 系统对不同类型的文件采用不同的存储策略进行存储,对高频文件使用多副本方式存储策略,对中频文件使用纠删码编码和多副本混合方式存储策略,对低频文件使用纠删码编码方式存储策略;
5) 系统周期性统计文件的最近访问频率并进行分类,如果每个文件的读取频次发生变化,系统根据文件访问频次的变化动态调整文件的存储策略,根据现在的读取频次将文件采用对应的存储策略。
优选地,所述步骤1)中多个副本在分布在跨机房跨机架的存储节点上。
优选地,所述步骤3)中的周期性统计文件系统中每个文件每小时内访问频次具体为系统记录每个文件最近24小时的读取次数,如果文件刚上传不到24小时则记录文件的存储时间,每次读取文件时对这个文件的计数器加1,用文件访问次数除以24,对于刚上传不到24小时的文件按存储时间来计算。
优选地,所述步骤5)中根据现在的读取频次将文件采用对应的存储策略具体为系统中维护三个队列,三个队列对应三种访问频次,当文件的存储策略需要调整时加入对应的队列,系统对每个队列中的文件采用对应的存储策略,
对于在高频队列中的每个文件将其副本数增加到N份,然后将数据块的多个副本分别存储在不同的存储节点上,多个副本分布在跨机房跨机架的存储节点上,
对于在中频队列中的每个文件查看是否存在校验块,如果不存在校验块则进行纠删编码产生校验块,然后查看文件是否存在多副本,如果文件副本数多于两份则删除多于两份的副本,副本不足两份则拷贝一份额外的副本,
对于在低频队列中的每个文件查看是否存在校验块,如果不存在校验块则进行纠删编码产生校验块,并将文件额外的副本删除只保留一份副本和校验块。
与现有技术相比,本发明的有益效果如下:
本发明适用于云存储的分布式文件系统中,通过周期性统计文件系统中每个文件访问频次,将文件划分为三类,分别为高频文件、中频文件、低频文件,对不同类型的文件采用不同的存储策略,而且根据文件访问频次的变化动态调整文件的存储策略。对高频文件使用多副本方式存储策略可以保证读取高频文件时的速度,对中频文件使用纠删码编码和多副本方式混合方式存储策略可以综合对速度和存储资源利用率的要求,对低频文件使用纠删码编码方式存储策略。系统对整个文件系统中的文件周期性扫描,动态调整文件的存储策略,使整个文件系统整体上在保证数据可靠性和访问速度的前提下提高了系统存储资源利用率。
附图说明
图1为本发明实施例的基于文件访问频次的混合云存储方法的流程图;
图2为本发明实施例的基于文件访问频次的混合云存储方法的高频文件存储策略的示意图;
图3为本发明实施例的基于文件访问频次的混合云存储方法的中频文件存储策略的示意图;
图4为本发明实施例的基于文件访问频次的混合云存储方法的低频文件存储策略的示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
相反,本发明涵盖任何由权利要求定义的在本发明的精髓和范围上做的替代、修改、等效方法以及方案。进一步,为了使公众对本发明有更好的了解,在下文对本发明的细节描述中,详尽描述了一些特定的细节部分。对本领域技术人员来说没有这些细节部分的描述也可以完全理解本发明。
参考图1,所示为本发明实施例的基于基于文件访问频次的混合云存储方法的流程图,其包括以下步骤:
S01,新文件上传文件系统时,对文件采用多副本方式存储策略。
新文件上传文件系统时,为保证上传期间文件的高可靠性对文件采用多副本方式存储策略。在文件上传时把文件划分为数据块,为每个数据块根据系统配置产生N个副本(一般工业界标准是3副本),然后将数据块的多个副本分别存储在不同的存储节点上,多个副本在分布上尽量跨机房跨机架,保证某一节点失效后可以从其他节点上读取副本,而且读文件时可以尽量从最近的存储节点读文件。当这个副本的N个数据块保存完成时即这个数据块上传完成,当这个文件的所有数据块保存完成时即这个文件上传完成。
如图2所示,采用多副本策略时系统丢失任意N-1个数据块都可以恢复原文件,恢复时只需要从其他节点上重新读这个数据块即可。此时所需要存储空间为原文件大小的N倍,例如当N=3时,所需空间为3倍文件大小。
S02,文件上传文件系统完毕后,对文件采用纠删码编码方式存储策略。
文件上传文件系统完毕后,对文件进行纠删码编码以降低文件占用的存储空间资源。将文件的所有数据块加入一个转换队列,系统对转换队列中的所有数据块进行纠删编码产生校验块,然后将文件的所有数据块和校验块分布存储在不同的存储节点上并删除多余的副本。纠删码编码方式存储策略适合存储低频文件,这样不保存额外的副本,只保留校验块。
如图3所示,纠删编码时首先将文件的数据块进行分组,在系统配置项中需要指定每个分组包含数据块的个数X,不足X个数据块时以空数据块补全,在编码时以分组为单位进行编码。
对每个分组进行纠删码编码产生K个额外的校验块(K在系统配置项中指定),此时每个分组包含X+K个块,X个数据块和K个校验块。对每个分组在系统中只保存1份副本并删除其他的副本。
此时每个文件丢失任意K个块都可以通过解码恢复丢失的数据块。所需要存储空间为原文件大小的1+K/X倍,例如当X=10, K=3时,所需空间为1.3倍文件大小。
S03,周期性统计文件系统中每个文件访问频次,将文件划分为三类,分别为高频文件、中频文件、低频文件。
系统需要记录每个文件最近24小时的读取次数,如果文件刚上传不到24小时则需要记录文件的存储时间。每次读取文件时对这个文件的计数器加1。用文件访问次数除以24,对于刚上传不到24小时的文件按存储时间来计算,系统周期性计算每个文件每小时内的访问频次,此即最近访问频率。系统根据文件最近访问频率对所有文件排名,然后按照1:2:7的比例的将所有文件划分为三类,分别为高频文件、中频文件、低频文件。
S04,系统对不同类型的文件采用不同的存储策略。
系统对不同类型的文件采用不同的存储策略,对高频文件使用多副本方式存储策略。此方式保存的数据在读数据时能并发从多个副本读,读取速度快,而且发生数据块丢失时数据恢复方法简单,适合保存高频文件。
对低频文件使用纠删码编码方式存储策略。系统只保留原文件数据块和校验块,不保存多余的副本。此方法节省了空间,但是数据发生丢失时数据恢复策略复杂,在读数据时也不能并发读取数据块,适合保存低频文件。
对中频文件使用纠删码编码和多副本混合方式存储策略,此方法结合多副本以及纠删码编码两种策略,对系统中存储的中频文件首先进行纠删码编码产生校验块,另外对数据块保留一份多余的副本。适合中频文件的存储。
S05,系统根据文件访问频次的变化动态调整文件的存储策略。
系统周期性统计文件的最近访问频率并进行分类,如果每个文件的读取频次发生变化,系统根据文件访问频次的变化动态调整文件的存储策略,根据现在的读取频次将文件采用对应的存储策略。系统中维护三个队列,三个队列对应三种访问频次,当文件的存储策略需要调整时加入对应的队列,系统对每个队列中的文件采用对应的存储策略。
对于在高频队列中的每个文件将其副本数增加到N份,然后将数据块的多个副本分别存储在不同的存储节点上,多个副本在分布上尽量跨机房跨机架。
对于在低频队列中的每个文件查看是否存在校验块,如果不存在校验块则进行纠删编码产生校验块,并将文件额外的副本删除只保留一份副本和校验块。
对于在中频队列中的每个文件查看是否存在校验块,如果不存在校验块则进行纠删编码产生校验块。然后查看文件是否存在多副本,如果文件副本数多于两份则删除多于两份的副本,副本不足两份则拷贝一份额外的副本。此时文件保留两份副本和校验块。如图4所示,文件所需要存储空间为原文件大小的2+K/X倍,例如当X=10, K=3时,所需空间为2.3倍文件大小。这种策略的系统的可靠性最高,当发生数据块丢失时首先通过拷贝副本恢复,如果两份副本同时丢失则通过解码恢复。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (3)

1.基于文件访问频次的混合云存储方法,其特征在于,包括以下步骤,
1)新文件上传文件系统时,对文件采用多副本方式存储策略,在文件上传时把文件划分为若干数据块,为每个数据块根据系统配置产生N个副本,将所述N个副本存储在不同的存储节点上;
2)文件上传文件系统完毕后,对文件采用纠删码编码方式存储策略,将文件的所有数据块加入一个转换队列,系统对转换队列中的所有数据块进行纠删编码产生校验块,然后将文件的所有数据块和校验块分布存储在不同的存储节点上并删除多余的副本;
3)周期性统计文件系统中每个文件每小时内访问频次,将所有文件按照1:2:7的访问频次比例划分为三类,分别为高频文件、中频文件和低频文件;
4)系统对不同类型的文件采用不同的存储策略进行存储,对高频文件使用多副本方式存储策略,对中频文件使用纠删码编码和多副本混合方式存储策略,对低频文件使用纠删码编码方式存储策略;
5)系统周期性统计文件的最近访问频率并进行分类,如果每个文件的读取频次发生变化,系统根据文件访问频次的变化动态调整文件的存储策略,根据现在的读取频次将文件采用对应的存储策略,具体为:
系统中维护三个队列,三个队列对应三种访问频次,当文件的存储策略需要调整时加入对应的队列,系统对每个队列中的文件采用对应的存储策略,
对于在高频队列中的每个文件将其副本数增加到N份,然后将数据块的多个副本分别存储在不同的存储节点上,多个副本分布在跨机房跨机架的存储节点上,
对于在中频队列中的每个文件查看是否存在校验块,如果不存在校验块则进行纠删编码产生校验块,然后查看文件是否存在多副本,如果文件副本数多于两份则删除多于两份的副本,副本不足两份则拷贝一份额外的副本,
对于在低频队列中的每个文件查看是否存在校验块,如果不存在校验块则进行纠删编码产生校验块,并将文件额外的副本删除只保留一份副本和校验块。
2.根据权利要求1所述的基于文件访问频次的混合云存储方法,其特征在于,所述步骤1)中多个副本在分布在跨机房跨机架的存储节点上。
3.根据权利要求1所述的基于文件访问频次的混合云存储方法,其特征在于,所述步骤3)中的周期性统计文件系统中每个文件每小时内访问频次具体为系统记录每个文件最近24小时的读取次数,如果文件刚上传不到24小时则记录文件的存储时间,每次读取文件时对这个文件的计数器加1,用文件访问次数除以24,对于刚上传不到24小时的文件按存储时间来计算。
CN201310062777.6A 2013-02-28 2013-02-28 基于文件访问频次的混合云存储方法 Active CN103118133B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310062777.6A CN103118133B (zh) 2013-02-28 2013-02-28 基于文件访问频次的混合云存储方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310062777.6A CN103118133B (zh) 2013-02-28 2013-02-28 基于文件访问频次的混合云存储方法

Publications (2)

Publication Number Publication Date
CN103118133A CN103118133A (zh) 2013-05-22
CN103118133B true CN103118133B (zh) 2015-09-02

Family

ID=48416403

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310062777.6A Active CN103118133B (zh) 2013-02-28 2013-02-28 基于文件访问频次的混合云存储方法

Country Status (1)

Country Link
CN (1) CN103118133B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107797884A (zh) * 2016-10-28 2018-03-13 湖南大学 一种基于复制和纠删码自适应切换的云存储容错方法

Families Citing this family (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104468654A (zh) * 2013-09-18 2015-03-25 杭州信核数据科技有限公司 连接到云存储的存储管理网关、方法及数据分层备份系统
CN104615606B (zh) * 2013-11-05 2018-04-06 阿里巴巴集团控股有限公司 一种Hadoop分布式文件系统及其管理方法
CN104133880B (zh) * 2014-07-25 2018-04-20 广东睿江云计算股份有限公司 一种设置文件缓存时间的方法与装置
CN104281533B (zh) * 2014-09-18 2018-03-20 深圳市中博科创信息技术有限公司 一种存储数据的方法及装置
EP3238420A4 (en) * 2014-12-24 2018-09-12 McAfee, Inc. Mechanism for automatic creation and access to favorite personal cloud data
CN106294362A (zh) * 2015-05-15 2017-01-04 中兴通讯股份有限公司 一种文件管理的方法、设备和系统
CN106649406B (zh) 2015-11-04 2020-04-28 华为技术有限公司 一种自适应存储文件的方法和装置
CN105677742B (zh) * 2015-12-30 2019-07-05 深圳市瑞驰信息技术有限公司 一种存储文件的方法及装置
CN107547605B (zh) * 2016-06-29 2020-01-31 华为技术有限公司 一种基于节点队列的消息读写方法及节点设备
CN106302757A (zh) * 2016-08-19 2017-01-04 成都全码特时代科技有限公司 一种基于云存储的服务器集群系统
CN106060100A (zh) * 2016-08-19 2016-10-26 成都全码特时代科技有限公司 一种分布式云存储服务器
CN107817947B (zh) * 2016-09-14 2021-03-26 北京金山云网络技术有限公司 一种数据存储方法、装置及系统
CN106708653B (zh) * 2016-12-29 2020-06-30 广州中国科学院软件应用技术研究所 一种基于纠删码与多副本的混合税务大数据安全保护方法
WO2018119976A1 (zh) * 2016-12-30 2018-07-05 日彩电子科技(深圳)有限公司 应用于数据仓库系统的高效优化数据布局方法
CN106657411A (zh) * 2017-02-28 2017-05-10 北京华云网际科技有限公司 分布式系统中卷的访问方法和装置
CN107169056A (zh) * 2017-04-27 2017-09-15 四川长虹电器股份有限公司 分布式文件系统及节省分布式文件系统存储空间的方法
CN109150792B (zh) * 2017-06-15 2022-03-08 杭州海康威视数字技术股份有限公司 一种提高数据存储安全性方法及装置
CN107357685B (zh) * 2017-07-11 2019-06-18 清华大学 一种数据存储的容错冗余方法及设备
CN110019082A (zh) * 2017-07-31 2019-07-16 普天信息技术有限公司 文件数据的分布式多副本存储方法
CN107885463B (zh) * 2017-11-10 2021-08-31 下一代互联网重大应用技术(北京)工程研究中心有限公司 目标文件的处理方法及装置
CN109799948B (zh) * 2017-11-17 2023-05-16 航天信息股份有限公司 一种数据存储方法及装置
CN108073472B (zh) * 2017-12-12 2020-05-19 华中科技大学 一种基于热度感知的内存纠删码分布方法
CN108418871B (zh) * 2018-02-09 2022-02-11 国家电网公司 一种云存储性能优化方法和系统
CN108650298A (zh) * 2018-04-10 2018-10-12 常州大学 面向基因测序大数据的云存储方法
CN108536552A (zh) * 2018-04-17 2018-09-14 北京搜狐新媒体信息技术有限公司 数据的冗余备份处理方法及装置
CN110389715B (zh) * 2018-04-23 2021-07-09 杭州海康威视系统技术有限公司 数据存储方法、存储服务器及云存储系统
CN110019017B (zh) * 2018-04-27 2021-04-27 中国科学院高能物理研究所 一种基于访问特征的高能物理文件存储方法
CN110196682B (zh) * 2018-06-15 2022-03-18 腾讯科技(深圳)有限公司 数据管理方法、装置、计算设备及存储介质
CN111381767B (zh) * 2018-12-28 2024-03-26 阿里巴巴集团控股有限公司 一种数据处理方法及装置
CN111782582A (zh) * 2019-06-14 2020-10-16 北京京东尚科信息技术有限公司 数据转换方法、系统和名称节点
CN112394873B (zh) * 2019-08-12 2024-05-24 深信服科技股份有限公司 一种数据管理方法、系统及电子设备和存储介质
CN111399755A (zh) * 2019-09-10 2020-07-10 杭州海康威视系统技术有限公司 数据存储管理的方法和装置
CN112748868B (zh) * 2019-10-31 2024-09-03 北京白山耘科技有限公司 数据存储方法和装置
CN111008181A (zh) * 2019-10-31 2020-04-14 苏州浪潮智能科技有限公司 一种分布式文件系统存储策略切换方法、系统、终端及存储介质
CN110839069B (zh) * 2019-11-04 2021-09-24 深圳市网心科技有限公司 一种节点数据部署方法、部署节点、系统及介质
CN110895451A (zh) * 2019-11-14 2020-03-20 北京京航计算通讯研究所 基于分布式系统的数据访问性能优化方法
CN110825791A (zh) * 2019-11-14 2020-02-21 北京京航计算通讯研究所 基于分布式系统的数据访问性能优化系统
CN112131049A (zh) * 2020-09-24 2020-12-25 平安科技(深圳)有限公司 基于云存储的数据存储方法、装置、计算机设备及存储介质
CN112783445A (zh) * 2020-11-17 2021-05-11 北京旷视科技有限公司 数据存储方法、装置、系统、电子设备及可读存储介质
CN112558886A (zh) * 2020-12-25 2021-03-26 北京嘀嘀无限科技发展有限公司 一种数据存储方法和系统
CN113420005A (zh) * 2021-02-10 2021-09-21 阿里巴巴集团控股有限公司 数据存储方法、系统、电子设备及计算机存储介质
CN113886115B (zh) * 2021-09-09 2024-02-20 上海智能网联汽车技术中心有限公司 一种基于车路协同的区块链拜占庭容错方法及系统
CN114896098B (zh) * 2022-04-29 2023-05-05 重庆大学 一种数据容错方法及分布式存储系统
CN115391093B (zh) * 2022-08-18 2024-01-02 江苏安超云软件有限公司 一种数据处理方法及系统
CN115686382B (zh) * 2022-12-30 2023-03-21 南京鲸鲨数据科技有限公司 一种数据存储及读取方法
CN116781762B (zh) * 2023-08-24 2023-10-27 四川科瑞软件有限责任公司 云计算数据存储方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102270161A (zh) * 2011-06-09 2011-12-07 华中科技大学 一种基于纠删码的多等级容错数据存储、读取和恢复方法
CN102937967A (zh) * 2012-10-11 2013-02-20 南京中兴新软件有限责任公司 数据冗余实现方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8527482B2 (en) * 2008-06-06 2013-09-03 Chrysalis Storage, Llc Method for reducing redundancy between two or more datasets

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102270161A (zh) * 2011-06-09 2011-12-07 华中科技大学 一种基于纠删码的多等级容错数据存储、读取和恢复方法
CN102937967A (zh) * 2012-10-11 2013-02-20 南京中兴新软件有限责任公司 数据冗余实现方法及装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107797884A (zh) * 2016-10-28 2018-03-13 湖南大学 一种基于复制和纠删码自适应切换的云存储容错方法

Also Published As

Publication number Publication date
CN103118133A (zh) 2013-05-22

Similar Documents

Publication Publication Date Title
CN103118133B (zh) 基于文件访问频次的混合云存储方法
US10289488B1 (en) System and method for recovery of unrecoverable data with erasure coding and geo XOR
US11003533B2 (en) Data processing method, system, and apparatus
CN108170555B (zh) 一种数据恢复方法及设备
US9665427B2 (en) Hierarchical data storage architecture
US11150986B2 (en) Efficient compaction on log-structured distributed file system using erasure coding for resource consumption reduction
US10089176B1 (en) Incremental updates of grid encoded data storage systems
CN110442535B (zh) 提高分布式固态盘键值缓存系统可靠性的方法及系统
US9817715B2 (en) Resiliency fragment tiering
US10552062B2 (en) System and method for storing very large key value objects
US20160182088A1 (en) Method For File Updating And Version Control For Linear Erasure Coded And Network Coded Storage
CN107656832A (zh) 一种低数据重建开销的纠删码方法
CN109491835B (zh) 一种基于动态分组码的数据容错方法
CN112889033A (zh) 提高具有变化的数据冗余方案的系统中的可用存储空间
CN109814807B (zh) 一种数据存储方法及装置
CN103944981A (zh) 一种基于纠删码技术改进的云存储系统及实现方法
US20140317056A1 (en) Method of distributing and storing file-based data
CN107003933B (zh) 部分复制码的构建方法、装置及其数据修复的方法
CN111831223B (zh) 提高数据去重系统可扩展性的容错编码方法、装置及系统
CN110427156B (zh) 一种基于分片的mbr的并行读方法
CN103761195A (zh) 一种利用分布式数据编码的存储方法
CN112799605B (zh) 平方部分重复码构造方法、节点修复方法及容量计算方法
CN111459710B (zh) 感知热度与风险的纠删码内存恢复方法、设备及内存系统
CN107340971A (zh) 一种数据存储与恢复架构与方法
CN107153661A (zh) 一种基于hdfs系统的数据的存储、读取方法及其装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant