CN103838860A - 一种基于动态副本策略的文件存储系统及其存储方法 - Google Patents

一种基于动态副本策略的文件存储系统及其存储方法 Download PDF

Info

Publication number
CN103838860A
CN103838860A CN201410101119.8A CN201410101119A CN103838860A CN 103838860 A CN103838860 A CN 103838860A CN 201410101119 A CN201410101119 A CN 201410101119A CN 103838860 A CN103838860 A CN 103838860A
Authority
CN
China
Prior art keywords
file
storage
storage file
temperature
copies
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410101119.8A
Other languages
English (en)
Inventor
王引娜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ECDATA INFORMATION TECHNOLOGY Co Ltd
Original Assignee
ECDATA INFORMATION TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ECDATA INFORMATION TECHNOLOGY Co Ltd filed Critical ECDATA INFORMATION TECHNOLOGY Co Ltd
Priority to CN201410101119.8A priority Critical patent/CN103838860A/zh
Publication of CN103838860A publication Critical patent/CN103838860A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/11File system administration, e.g. details of archiving or snapshots
    • G06F16/128Details of file system snapshots on the file-level, e.g. snapshot creation, administration, deletion

Abstract

本发明公开了一种基于动态副本策略的文件存储系统,包含:文件热度计算模块,用于计算周期时间内存储的各文件的热度及周期时间内所有存储文件的平均热度;多个存储模块,用于存储数据及访问数据;分别与文件热度计算模块及多个存储模块连接的主控制模块;所述的主控制模块用于根据存储文件的热度动态调整存储文件的副本数;与主控制模块连接的编码解码模块,用于根据存储文件的副本数对符合编码条件的存储文件进行纠删码编码。本发明还公开了一种文件存储方法。本发明增加了高热度的文件的完全副本数,提高了高热度文件的访问速度和负载均衡,低热度文件减少了完全副本的个数,采用RS纠删码编码后存储提高了存储的容错能力和可靠性。

Description

一种基于动态副本策略的文件存储系统及其存储方法
技术领域
本发明涉及文件存储系统技术领域,具体是说一种根据文件被访问的情况的不同来动态调整文件服务器中的文件副本的个数及对文件进行纠删码编码解码的文件存储系统及存储方法。
背景技术
随着大数据时代的到来,海量异构数据的存储和应用给我们带来了巨大的挑战。云存储是通过分布式文件系统、网格计算和集群管理等技术,将大量的存储设备构建成存储资源池,共同对外提供数据存储和管理服务。因为其具有很高的稳定性和高效性,云存储正在被越来越多的企业所应用。
目前,多数文件存储系统采用的静态完全副本冗余机制来保证系统的高可靠性和高效性。然而,静态完全副本策略是将每个文件复制多份副本,分别存储在不同的数据节点上,这样就造成存储成本随着副本数目的增加而线性增加,存在存储效率低、负载均衡能力差等缺点,同时也会增加对副本的管理开销,影响系统的可扩展性。
发明内容
本发明的目的在于提供一种基于动态副本策略的文件存储系统及其存储方法,增加了高热度的文件的完全副本数,提高了高热度文件的访问速度和负载均衡,低热度文件减少了完全副本的个数,采用RS纠删码编码后存储提高了存储的容错能力和可靠性,有效的节省了存储空间。
为了达到上述目的,本发明通过以下技术方案实现:一种基于动态副本策略的文件存储系统,其特点是,包含:
文件热度计算模块,用于计算周期时间内存储的各文件的热度及周期时间内所有存储文件的平均热度;
多个存储模块,用于存储数据及访问数据;
分别与文件热度计算模块及多个存储模块连接的主控制模块;
所述的主控制模块用于将存储文件分块存储在多个存储模块,并记录存储文件的数据块分配信息及文件的完全副本数,根据存储文件的热度动态调整存储文件的副本数;
与主控制模块连接的编码解码模块,用于根据存储文件的副本数对符合编码条件的存储文件进行纠删码编码,形成编码文件,以及访问编码文件时,对编码文件进行解码。
一种基于动态副本策略的文件存储方法,其特点是,包含以下步骤:
步骤1、新存储文件上传至存储系统时,主控制模块将新存储文件划分为若干个数据块,主控制模块为每个数据块产生m个完全副本,并将所述的m个完全副本存储到不同的存储模块上;
步骤2、文件热度计算模块周期性的计算周期时间内存储文件的热度及周期时间内所有存储文件的平均热度,并将各存储文件的热度值及平均热度值传输至主控制模块;
步骤3、主控制模块根据各存储文件的热度值与平均热度值的大小关系,确定存储文件的热度等级,并;
步骤4、主控制模块对不同热度等级的存储文件确定不同的副本个数,
若存储文件的热度与平均热度相当,则存储文件的副本数为m,
若存储文件的热度大于平均热度,则存储文件的副本数相应的增加,
若存储文件的热度小于平均热度,则存储文件的副本数相应的减少,
当存储文件的副本数为1,该存储文件的热度增加时,则主控制模块调用编码解码模块的纠删码编码方式进行存储,对于副本数不为1的存储文件采用多副本策略的方式进行存储;
步骤5、系统每隔固定周期时间重复步骤2至步骤4。
所述的步骤1进一步包含主控制模块记录存储文件的数据块分配信息及存储文件的副本个数。
较佳地,进一步包含当存储文件的副本数不为1时,存储文件被访问时,主控制模块根据存储文件的数据块分配信息及存储文件的副本个数,从多个不同的存储模块上并行读取存储文件的数据。
较佳地,进一步包含当存储文件的副本数为1时,存储文件被访问时,主控制模块调用编码解码模块对存储文件进行解码。
所述的步骤2中文件热度计算模块根据文件的大小及周期时间内存储文件被访问的次数来计算存储文件的热度。
所述的步骤2中存储文件的热度计算公式为:                                                
Figure 679819DEST_PATH_IMAGE001
Figure 109663DEST_PATH_IMAGE002
其中:
Figure 351289DEST_PATH_IMAGE003
为存储文件的热度;
Figure 626412DEST_PATH_IMAGE004
为文件的大小;
m为存储的完全副本个数;
T为周期时间;
Figure 66621DEST_PATH_IMAGE005
为第j个周期时间内文件i的访问次数。
所述的步骤2中周期时间为24小时。
较佳地,所述的步骤4中纠删码编码方式为RS(7,12)方式。
本发明一种基于动态副本策略的文件存储系统及其存储方法与现有技术相比具有以下优点:本发明利用了多副本冗余的数据读取和存储的便利及快速性以及RS纠删码的高存储效率和高容错率的优点,不仅提高了存储数据的可靠性、负载均衡能力,而且降低了存储成本,提升系统的整体性能,有效的节省了存储空间;增加了高热度的文件的完全副本数,提高了高热度文件的访问速度和负载均衡,低热度文件减少了完全副本的个数。
附图说明
图1为本发明一种基于动态副本策略的文件存储系统的结构框图。
图2 为副本调整流程图。
具体实施方式
以下结合附图,通过详细说明一个较佳的具体实施例,对本发明做进一步阐述。
如图1所示,一种基于动态副本策略的文件存储系统,包含:文件热度计算模块1,用于计算周期时间内存储的各文件的热度及周期时间内所有存储文件的平均热度;多个存储模块2,用于存储数据及访问数据;分别与文件热度计算模块1及多个存储模块2连接的主控制模块3;所述的主控制模块3用于将存储文件分块存储在多个存储模块2,并记录存储文件的数据块分配信息及文件的完全副本数,根据存储文件的热度动态调整存储文件的副本数;与主控制模块3连接的编码解码模块4,用于根据存储文件的副本数对符合编码条件的存储文件进行纠删码编码,形成编码文件,以及访问编码文件时,对编码文件进行解码。
一种基于动态副本策略的文件存储方法,包含以下步骤:
步骤1、新存储文件上传至存储系统时,主控制模块3将新存储文件划分为若干个数据块,主控制模块3为每个数据块产生m个完全副本,并将所述的m个完全副本存储到不同的存储模块2上;
步骤2、文件热度计算模块1周期性的计算周期时间内存储文件的热度及周期时间内所有存储文件的平均热度,并将各存储文件的热度值及平均热度值传输至主控制模块3;
步骤3、主控制模块3根据各存储文件的热度值与平均热度值的大小关系,确定存储文件的热度等级,并;
步骤4、主控制模块3对不同热度等级的存储文件确定不同的副本个数,
若存储文件的热度与平均热度相当,则存储文件的副本数为m,
若存储文件的热度大于平均热度,则存储文件的副本数相应的增加,
若存储文件的热度小于平均热度,则存储文件的副本数相应的减少,
当存储文件的副本数为1,该存储文件的热度增加时,则主控制模块(3)调用编码解码模块4的纠删码编码方式进行存储,对于副本数不为1的存储文件采用多副本策略的方式进行存储;
步骤5、系统每隔固定周期时间重复步骤2至步骤4。
所述的步骤1进一步包含主控制模块3记录存储文件的数据块分配信息及存储文件的副本个数。
进一步,当存储文件的副本数不为1时,存储文件被访问时,主控制模块3根据存储文件的数据块分配信息及存储文件的副本个数,从多个不同的存储模块2上并行读取存储文件的数据。
进一步,当存储文件的副本数为1时,存储文件被访问时,主控制模块3调用编码解码模块4对存储文件进行解码。
所述的步骤2中文件热度计算模块1根据文件的大小及周期时间内存储文件被访问的次数来计算存储文件的热度。
所述的步骤2中存储文件的热度计算公式为:
Figure 401787DEST_PATH_IMAGE001
Figure 130709DEST_PATH_IMAGE002
其中:
Figure 209523DEST_PATH_IMAGE003
为存储文件的热度;
为文件的大小;
m为存储的完全副本个数;
T为周期时间;
Figure 479148DEST_PATH_IMAGE005
为第j个周期时间内文件i的访问次数。
所述的步骤2中周期时间为24小时。
所述的步骤4中纠删码编码方式为RS(7,12)方式。
具体应用:搭建一个小型HDFS (Hadoop Distributed File System,Hadoop分布式文件系统)集群环境,集群由1个NameNode(控制节点)节点和12个DataNode(数据节点)节点组成,其中NameNode节点的配置为1颗CPU(Intel Core  i5-3450 4核 3.1GHz)、2G内存和500G硬盘,12个DataNode节点的配置为1颗CPU(Intel Core i3-3220  3.3GHz)、1G内存和500G硬盘,网络带宽为1000Mbps,操作系统为CentOS5.5,Hadoop 版本为 Hadoop-0.20.3,本实施例中HDFS存储的文件大小为1T,HDFS默认的存储策略为3副本,本实施例中同样限定存储文件的完全副本数m=3。
本实施例中定义热度级别与副本个数关系,如表1所示,当某个存储文件的热度是系统中文件平均热度的两倍时,将文件的副本数增加为4,当某个文件的热度低于系统中文件平均热度的1/2时,将文件的副本数减少为2,当某个文件的热度低于系统中文件平均热度的1/8时,将文件的副本数减少为1。 
表1 热度级别副本数
Figure 492103DEST_PATH_IMAGE007
据表1所确定的文件副本数,接下来将对文件的副本进行调整,副本调整的流程图如图2所示。
HDFS采用本发明的方法来管理副本,对于高热度的文件,其副本数高于HDFS默认的3副本策略,而对于低热度的文件,虽然副本数低于3副本策略,但通过RS纠删码编码后,文件的可靠性得到了很大的提高。本实施例采用的RS(7,12)进行编码,任意5个节点故障都能保证数据能够被恢复,而采用3副本策略,任意3个节点故障将会导致文件无法恢复。在本实施例中,HDFS的默认的3副本策略的容错率为
Figure 374609DEST_PATH_IMAGE008
,即系统可以容忍任意的2个节点发生故障;而本策略的容错率为
Figure 727092DEST_PATH_IMAGE009
,即系统可以容忍任意3个节点发生故障。
HDFS文件系统采用本发明的方法后,存储的可靠性得到提升,同时存储效率也得到提高。
采用HDFS默认的存储策略,每个数据块大小为64M,副本数为3,则所需存储空间为3T。当采用本发明,运行3个周期后,我们统计出的各热度级别的文件及存储空间如表2,总存储大小为2861G。
表2 文件分布表
Figure 669641DEST_PATH_IMAGE011
通过以上分析可得,在系统可靠性得到提升的同时,系统的存储效率也得到提升。
本发明中热度级别高的文件被动态的增加了副本,减轻了原来仅有的3个节点所承受的副本负载。分别在HDFS使用默认策略和本发明时,逐渐的增大对HDFS的访问压力,虽然使用方法HDFS的响应时间都会随着访问压力的增大而增加,但采用默认策略时,当对某文件访问频率增大到每分钟100次时,响应时间就超过5s,而采用本发明时,对某文件访问频率增大到每分钟150次时,响应时间才超过5s。通过以上测试数据可以得出采用本测试可以显著提升HDFS的负载均衡能力。
HDFS会自动根据系统的负载情况执行副本调整任务,因此不用担心HDFS文件系统会因为副本调整任务而影响系统主要任务的执行。
当文件的副本数低于3时,则调用编码解码模块4中的纠删码编解码方式对文件进行编码,保证有一份编码文件存在,以最大限度的保证数据的可靠性。编码解码模块4统一负责HDFS文件系统中的文件的编解码工作。
由于RS纠删码冗余量小,且具有超强的纠错能力,性能很接近理论值,因此本发明采用RS纠删码对文件进行编码。RS类纠删码根据其生成矩阵不同分为两类,分别是范德蒙码和柯西码。范德蒙码和柯西码的编码时间复杂度均为O(n2),但是柯西码解码不用求大矩阵的逆,而且把乘法除法运算分别转化为有限域上的加法和减法运算,可用异或实现,因此,柯西码运算复杂度低于范德蒙码。本发明的纠删码编码解码模块采用柯西码进行编解码。
RS 纠删码可以用一个四元组( m,s,k,n) 来表示,其中: m 是编码前文件块的个数,s 是每个文件块包含的比特数,k 是一个不小于 m 的数,n 是编码后的文件块个数。RS 纠删码的纠删原理如下:
首先,用户的文件数据被分成 m 个文件块,用集合表示为
Figure 107575DEST_PATH_IMAGE012
,其中 Fi( 1≤i≤m)是一个包含s比特的文件块。我们假设纠删码的编码函数是E,解码函数是D。对原文件进行编码为:
Figure 528192DEST_PATH_IMAGE013
( 1≤i≤n) 大小仍为 s 比特。设
Figure 63079DEST_PATH_IMAGE014
Figure 176528DEST_PATH_IMAGE015
中任意 k( k≥m,一般 k =m) 个文件块组成的子文件,那么用解码函数解码
Figure 101759DEST_PATH_IMAGE016
,即在得到
Figure 326067DEST_PATH_IMAGE015
中任意 k 个文件块就可以由解码函数D还原为原文件。
本发明采用异步编码模式,当文件写入时先采用多副本方式将文件写入存储系统,因为对于新写入的文件,对它进行更改的概率较高。当系统运行一段时间后,系统会通过文件热度计算模块1计算出文件的热度级别,对于热度低的文件,副本调整模块会调用编码解码模块4中的纠删码编解码方式对文件进行编码。
尽管本发明的内容已经通过上述优选实施例作了详细介绍,但应当认识到上述的描述不应被认为是对本发明的限制。在本领域技术人员阅读了上述内容后,对于本发明的多种修改和替代都将是显而易见的。因此,本发明的保护范围应由所附的权利要求来限定。

Claims (9)

1.一种基于动态副本策略的文件存储系统,其特征在于,包含:
文件热度计算模块(1),用于计算周期时间内存储的各文件的热度及周期时间内所有存储文件的平均热度;
多个存储模块(2),用于存储数据及访问数据;
分别与文件热度计算模块(1)及多个存储模块(2)连接的主控制模块(3);
所述的主控制模块(3)用于将存储文件分块存储在多个存储模块(2),并记录存储文件的数据块分配信息及文件的完全副本数,根据存储文件的热度动态调整存储文件的副本数;
与主控制模块(3)连接的编码解码模块(4),用于根据存储文件的副本数对符合编码条件的存储文件进行纠删码编码,形成编码文件,以及访问编码文件时,对编码文件进行解码。
2.一种基于动态副本策略的文件存储方法,其特征在于,包含以下步骤:
步骤1、新存储文件上传至存储系统时,主控制模块(3)将新存储文件划分为若干个数据块,主控制模块(3)为每个数据块产生m个完全副本,并将所述的m个完全副本存储到不同的存储模块(2)上;
步骤2、文件热度计算模块(1)周期性的计算周期时间内存储文件的热度及周期时间内所有存储文件的平均热度,并将各存储文件的热度值及平均热度值传输至主控制模块(3);
步骤3、主控制模块(3)根据各存储文件的热度值与平均热度值的大小关系,确定存储文件的热度等级,并;
步骤4、主控制模块(3)对不同热度等级的存储文件确定不同的副本个数,
若存储文件的热度与平均热度相当,则存储文件的副本数为m,
若存储文件的热度大于平均热度,则存储文件的副本数相应的增加,
若存储文件的热度小于平均热度,则存储文件的副本数相应的减少,
当存储文件的副本数为1,该存储文件的热度增加时,则主控制模块(3)调用编码解码模块(4)的纠删码编码方式进行存储,对于副本数不为1的存储文件采用多副本策略的方式进行存储;
步骤5、系统每隔固定周期时间重复步骤2至步骤4。
3.如权利要求2所述的文件存储方法,其特征在于,所述的步骤1进一步包含主控制模块(3)记录存储文件的数据块分配信息及存储文件的副本个数。
4.如权利要求3所述的文件存储方法,其特征在于,进一步包含当存储文件的副本数不为1时,存储文件被访问时,主控制模块(3)根据存储文件的数据块分配信息及存储文件的副本个数,从多个不同的存储模块(2)上并行读取存储文件的数据。
5.如权利要求2所述的文件存储方法,其特征在于,进一步包含当存储文件的副本数为1时,存储文件被访问时,主控制模块(3)调用编码解码模块(4)对存储文件进行解码。
6.如权利要求2所述的文件存储方法,其特征在于,所述的步骤2中文件热度计算模块(1)根据文件的大小及周期时间内存储文件被访问的次数来计算存储文件的热度。
7.如权利要求2所述的文件存储方法,其特征在于,所述的步骤2中存储文件的热度计算公式为:                                                
Figure 659008DEST_PATH_IMAGE002
其中:
Figure 2014101011198100001DEST_PATH_IMAGE003
为存储文件的热度;
Figure 576149DEST_PATH_IMAGE004
为文件的大小;
m为存储的完全副本个数;
T为周期时间;
Figure 2014101011198100001DEST_PATH_IMAGE005
为第j个周期时间内文件i的访问次数。
8.如权利要求2所述的文件存储方法,其特征在于,所述的步骤2中周期时间为24小时。
9.如权利要求2所述的文件存储方法,其特征在于,所述的步骤4中纠删码编码方式为RS(7,12)方式。
CN201410101119.8A 2014-03-19 2014-03-19 一种基于动态副本策略的文件存储系统及其存储方法 Pending CN103838860A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410101119.8A CN103838860A (zh) 2014-03-19 2014-03-19 一种基于动态副本策略的文件存储系统及其存储方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410101119.8A CN103838860A (zh) 2014-03-19 2014-03-19 一种基于动态副本策略的文件存储系统及其存储方法

Publications (1)

Publication Number Publication Date
CN103838860A true CN103838860A (zh) 2014-06-04

Family

ID=50802356

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410101119.8A Pending CN103838860A (zh) 2014-03-19 2014-03-19 一种基于动态副本策略的文件存储系统及其存储方法

Country Status (1)

Country Link
CN (1) CN103838860A (zh)

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104281533A (zh) * 2014-09-18 2015-01-14 深圳市中博科创信息技术有限公司 一种存储数据的方法及装置
CN104580427A (zh) * 2014-12-27 2015-04-29 北京奇虎科技有限公司 一种分布式存储系统中的主从平衡方法和装置
CN105335450A (zh) * 2014-08-14 2016-02-17 中兴通讯股份有限公司 数据存储处理方法及装置
CN105608167A (zh) * 2015-12-18 2016-05-25 金蝶软件(中国)有限公司 一种基于kdfs系统的文件备份方法与系统
CN106161170A (zh) * 2016-07-12 2016-11-23 广东工业大学 一种间隔执行的异步文件选择和副本放置方法
WO2016184199A1 (zh) * 2015-05-15 2016-11-24 中兴通讯股份有限公司 一种文件管理的方法、设备和系统
CN106227731A (zh) * 2016-07-06 2016-12-14 联想(北京)有限公司 一种数据处理方法、装置及分布式文件系统
CN106649406A (zh) * 2015-11-04 2017-05-10 华为技术有限公司 一种自适应存储文件的方法和装置
CN107357932A (zh) * 2017-07-31 2017-11-17 云城(北京)数据科技有限公司 一种文件存储方法及装置
CN108228106A (zh) * 2017-12-30 2018-06-29 广东技术师范学院 一种成本驱动副本的自适应控制方法
CN108363643A (zh) * 2018-03-27 2018-08-03 东北大学 一种基于文件访问热度的hdfs副本管理方法
CN108519861A (zh) * 2018-04-02 2018-09-11 广东能龙教育股份有限公司 一种基于提供大规模并行访问的动态存储方法
CN109117292A (zh) * 2017-06-22 2019-01-01 中兴通讯股份有限公司 一种集群存储的方法和装置及集群存储系统
CN109522151A (zh) * 2017-09-15 2019-03-26 北京京东尚科信息技术有限公司 用于数据冗余储存的方法及装置
CN109542678A (zh) * 2018-11-07 2019-03-29 郑州云海信息技术有限公司 一种服务器关键信息定时备份方法及装置
CN110196682A (zh) * 2018-06-15 2019-09-03 腾讯科技(深圳)有限公司 数据管理方法、装置、计算设备及存储介质
CN110389715A (zh) * 2018-04-23 2019-10-29 杭州海康威视系统技术有限公司 数据存储方法、存储服务器及云存储系统
CN111124295A (zh) * 2019-12-11 2020-05-08 成都信息工程大学 一种基于三元影响因子的农业数据存储处理系统及方法
CN112748868A (zh) * 2019-10-31 2021-05-04 北京白山耘科技有限公司 数据存储方法和装置
CN114896098A (zh) * 2022-04-29 2022-08-12 重庆大学 一种数据容错方法及分布式存储系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
孙程: "基于纠删码的分布式存储系统的设计与实现", 《中国优秀硕士学位论文全文数据库》 *
王引娜: "基于RS纠删码的HDFS云存储动态副本策略研究", 《科技创新导报》 *

Cited By (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105335450A (zh) * 2014-08-14 2016-02-17 中兴通讯股份有限公司 数据存储处理方法及装置
WO2016023372A1 (zh) * 2014-08-14 2016-02-18 中兴通讯股份有限公司 数据存储处理方法及装置
CN105335450B (zh) * 2014-08-14 2020-06-05 中兴通讯股份有限公司 数据存储处理方法及装置
CN104281533A (zh) * 2014-09-18 2015-01-14 深圳市中博科创信息技术有限公司 一种存储数据的方法及装置
CN104281533B (zh) * 2014-09-18 2018-03-20 深圳市中博科创信息技术有限公司 一种存储数据的方法及装置
CN104580427A (zh) * 2014-12-27 2015-04-29 北京奇虎科技有限公司 一种分布式存储系统中的主从平衡方法和装置
CN104580427B (zh) * 2014-12-27 2018-09-04 北京奇虎科技有限公司 一种分布式存储系统中的主从平衡方法和装置
WO2016184199A1 (zh) * 2015-05-15 2016-11-24 中兴通讯股份有限公司 一种文件管理的方法、设备和系统
US11182080B2 (en) 2015-11-04 2021-11-23 Huawei Technologies Co., Ltd. Adaptive file storage method and apparatus
CN106649406B (zh) * 2015-11-04 2020-04-28 华为技术有限公司 一种自适应存储文件的方法和装置
CN106649406A (zh) * 2015-11-04 2017-05-10 华为技术有限公司 一种自适应存储文件的方法和装置
CN105608167A (zh) * 2015-12-18 2016-05-25 金蝶软件(中国)有限公司 一种基于kdfs系统的文件备份方法与系统
CN105608167B (zh) * 2015-12-18 2019-10-08 金蝶软件(中国)有限公司 一种基于kdfs系统的文件备份方法与系统
CN106227731A (zh) * 2016-07-06 2016-12-14 联想(北京)有限公司 一种数据处理方法、装置及分布式文件系统
CN106227731B (zh) * 2016-07-06 2019-10-29 联想(北京)有限公司 一种数据处理方法、装置及分布式文件系统
CN106161170A (zh) * 2016-07-12 2016-11-23 广东工业大学 一种间隔执行的异步文件选择和副本放置方法
CN106161170B (zh) * 2016-07-12 2019-08-02 广东工业大学 一种间隔执行的异步文件选择和副本放置方法
CN109117292B (zh) * 2017-06-22 2021-07-13 中兴通讯股份有限公司 一种集群存储的方法和装置及集群存储系统
CN109117292A (zh) * 2017-06-22 2019-01-01 中兴通讯股份有限公司 一种集群存储的方法和装置及集群存储系统
CN107357932A (zh) * 2017-07-31 2017-11-17 云城(北京)数据科技有限公司 一种文件存储方法及装置
CN109522151A (zh) * 2017-09-15 2019-03-26 北京京东尚科信息技术有限公司 用于数据冗余储存的方法及装置
CN108228106A (zh) * 2017-12-30 2018-06-29 广东技术师范学院 一种成本驱动副本的自适应控制方法
CN108363643A (zh) * 2018-03-27 2018-08-03 东北大学 一种基于文件访问热度的hdfs副本管理方法
CN108363643B (zh) * 2018-03-27 2021-06-15 东北大学 一种基于文件访问热度的hdfs副本管理方法
CN108519861A (zh) * 2018-04-02 2018-09-11 广东能龙教育股份有限公司 一种基于提供大规模并行访问的动态存储方法
CN110389715A (zh) * 2018-04-23 2019-10-29 杭州海康威视系统技术有限公司 数据存储方法、存储服务器及云存储系统
WO2019205788A1 (zh) * 2018-04-23 2019-10-31 杭州海康威视系统技术有限公司 数据存储方法、存储服务器及云存储系统
CN110389715B (zh) * 2018-04-23 2021-07-09 杭州海康威视系统技术有限公司 数据存储方法、存储服务器及云存储系统
CN110196682A (zh) * 2018-06-15 2019-09-03 腾讯科技(深圳)有限公司 数据管理方法、装置、计算设备及存储介质
CN109542678A (zh) * 2018-11-07 2019-03-29 郑州云海信息技术有限公司 一种服务器关键信息定时备份方法及装置
CN109542678B (zh) * 2018-11-07 2021-12-17 郑州云海信息技术有限公司 一种服务器关键信息定时备份方法及装置
CN112748868A (zh) * 2019-10-31 2021-05-04 北京白山耘科技有限公司 数据存储方法和装置
CN111124295A (zh) * 2019-12-11 2020-05-08 成都信息工程大学 一种基于三元影响因子的农业数据存储处理系统及方法
CN111124295B (zh) * 2019-12-11 2021-06-04 成都信息工程大学 一种基于三元影响因子的农业数据存储处理系统及方法
CN114896098A (zh) * 2022-04-29 2022-08-12 重庆大学 一种数据容错方法及分布式存储系统
CN114896098B (zh) * 2022-04-29 2023-05-05 重庆大学 一种数据容错方法及分布式存储系统

Similar Documents

Publication Publication Date Title
CN103838860A (zh) 一种基于动态副本策略的文件存储系统及其存储方法
US10866954B2 (en) Storing data in a data section and parity in a parity section of computing devices
Rashmi et al. Having Your Cake and Eating It Too: Jointly Optimal Erasure Codes for {I/O}, Storage, and Network-bandwidth
US20170060469A1 (en) Systems and methods for data organization in storage systems using large erasure codes
US11182080B2 (en) Adaptive file storage method and apparatus
US20160211869A1 (en) Multiple Erasure Codes for Distributed Storage
CN107046812B (zh) 一种数据保存方法和装置
CN109491835B (zh) 一种基于动态分组码的数据容错方法
US10509582B2 (en) System and method for data storage, transfer, synchronization, and security
CN111831223B (zh) 提高数据去重系统可扩展性的容错编码方法、装置及系统
CN105703782B (zh) 一种基于递增移位矩阵的网络编码方法及系统
WO2015180038A1 (zh) 部分复制码的构建方法、装置及其数据修复的方法
Zhu et al. Adaptive fractional repetition codes for dynamic storage systems
CN107153661A (zh) 一种基于hdfs系统的数据的存储、读取方法及其装置
US11243777B2 (en) Process stream replication for content management system synchronization
WO2022007225A1 (zh) 数据存储方法、存储系统、存储设备及存储介质
CN116610731B (zh) 一种大数据分布式存储方法、装置、电子设备及存储介质
Zhu Rethinking fractional repetition codes: New construction and code distance
US11347424B1 (en) Offset segmentation for improved inline data deduplication
WO2020238653A1 (zh) 一种分布式系统环境下的编码方法、解码方法和对应装置
Fang et al. CLRC: A new erasure code localization algorithm for HDFS
Mu et al. HV: An improved coding layout based on erasure coded storage system
Xu et al. CRL: Efficient Concurrent Regeneration Codes with Local Reconstruction in Geo-Distributed Storage Systems
Safaei et al. Implicit effect of decoding time on fault tolerance in erasure coded cloud storage systems
Aktaş et al. Analyzing the download time of availability codes

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20140604