CN105335513B - 一种分布式文件系统及文件存储方法 - Google Patents

一种分布式文件系统及文件存储方法 Download PDF

Info

Publication number
CN105335513B
CN105335513B CN201510728315.2A CN201510728315A CN105335513B CN 105335513 B CN105335513 B CN 105335513B CN 201510728315 A CN201510728315 A CN 201510728315A CN 105335513 B CN105335513 B CN 105335513B
Authority
CN
China
Prior art keywords
memory node
file
node equipment
storage
collaboration server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510728315.2A
Other languages
English (en)
Other versions
CN105335513A (zh
Inventor
文武
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Maipu Communication Technology Co Ltd
Original Assignee
Maipu Communication Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Maipu Communication Technology Co Ltd filed Critical Maipu Communication Technology Co Ltd
Priority to CN201510728315.2A priority Critical patent/CN105335513B/zh
Publication of CN105335513A publication Critical patent/CN105335513A/zh
Application granted granted Critical
Publication of CN105335513B publication Critical patent/CN105335513B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/182Distributed file systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及大数据技术。本发明解决了现有HDFS无法满足低时间延迟的数据访问要求的问题,提供了一种分布式文件系统及存储、读取文件方法,其技术方案可概括为:一种分布式文件系统,包括多个存储节点设备和分布式内存对象缓存系统Memcached数据库,所述系统还包括协同服务器、存储引擎和日志服务器,所述多个存储节点设备分别与协同服务器及Memcached数据库连接,存储引擎分别与日志服务器、协同服务器及Memcached数据库连接。本发明的有益效果是:提升用户体验,保证信息的及时性,适用于分布式文件系统。

Description

一种分布式文件系统及文件存储方法
技术领域
本发明涉及大数据技术,特别涉及基于memcached的分布式文件处理技术。
背景技术
截止到2012年,数据量已经从TB(1024GB=1TB)级别跃升至PB(1024TB=1PB)、EB(1024PB=1EB)级别,乃至ZB(1024EB=1ZB)级别。国际数据公司(IDC)的研究结果表明,2008年全球产生的数据量为0.49ZB,2009年的数据量为0.8ZB,2010年增长为1.2ZB,2011年的数据量更是高达1.82ZB,相当于全球每人产生200GB以上的数据。而到2012年为止,人类生产的所有印刷材料的数据量为200PB,全人类历史上说过的所有话的数据量大约为5EB。IBM的研究称,整个人类文明所获得的全部数据中,有90%是过去两年内产生的。而到了2020年,全世界所产生的数据规模将达到今天的44倍。每一天,全世界会上传超过5亿张图片,每分钟就有20小时时长的视频被分享。然而,即使是人们每天创造的全部信息—包括语音通话、电子邮件和信息在内的各种通信,以及上传的全部图片、视频与音乐,其信息量也无法匹及每一天所创造出的关于人们自身的数字信息量。这些数据具有数据量大、类型繁多、价值密度低及速度快实效高等特征。面对如此多的数据,如何将这些价值密度低的数据更好的存储,使我们获得更高的投资回报率将是我们面临的问题。
分布式文件系统是指文件系统管理的物理存储资源不一定直接连接在本地节点上,而是通过计算机网络与节点相连。
在垂直搜索领域会需要存储大量的数据,并且这些数据速度快实效高,需要能快速的响应用户需求,提升用户体验,HDFS(Hadoop Distributed Filesystem,Hadoop分布式文件系统)可以满足数据的吞吐量,而HDFS却要付出高时延的代价,因此不能满足低时延的业务要求,不能快读响应用户请求。HDFS选取最优节点的方法是:以两个节点间的带宽作为距离来衡量。HDFS将整个网络看作一棵树,两个节点间的距离是他们到最近的共同祖先的距离总和。HDFS仅仅考虑系统中各个节点网络环境的差异。未考虑各个节点的存储能力,只考虑了网络环境,机械的根据网络拓扑来评估各个存储节点的存储能力,判断依据单一,但是在我们实际的应用中各个节点硬件的差异也比较明显,也是影响系统性能的一个关键因素。
发明内容
本发明的目的就是克服目前HDFS无法满足低时间延迟的数据访问要求的缺点,提供一种一种分布式文件系统及存储、读取文件方法。
本发明解决其技术问题,采用的技术方案是,一种分布式文件系统,包括多个存储节点设备和分布式内存对象缓存系统Memcached数据库,所述系统还包括协同服务器、存储引擎和日志服务器,所述多个存储节点设备分别与协同服务器及Memcached数据库连接,存储引擎分别与日志服务器、协同服务器及Memcached数据库连接,
所述协同服务器,用于负责各存储节点设备的注册,并定期向已注册的各存储节点设备发送心跳报文进行保活检测,并将各存储节点设备回应的心跳报文中所携带的当前状态日志信息,发送给日志服务器;
所述日志服务器,用于接收协同服务器发送的各存储节点设备的当前状态日志信息,计算各存储节点设备的实时存储能力,并同步给存储引擎;
所述存储引擎,用于响应协同服务器下发的文件写操作请求,在采用滑动块算法对文件进行分块后,依据通过日志服务器动态获取的各存储节点设备的实时存储能力,为每一个文件块计算出最优存储节点位置,将文件与文件块存储节点位置映射关系写入Memcached数据库后,将各个文件块存入所述最优存储节点位置所在的存储节点设备;
所述Memcached数据库,用于保存文件及文件分块存储节点位置的映射关系;
所述存储节点,用于向协同服务器进行注册,并在向协同服务器回应的心跳报文中携带其状态日志信息,并将存储引擎写入的相应的文件分块进行存储。
具体的,所述各存储节点设备的当前状态日志信息包括该存储节点的存储空间、I/O能力及网络访问速率。
具体的,所述实时存储能力是指存储节点设备当前读或写一个字节所花费的时间。
进一步的,所述存储节点设备,还用于在完成文件的写操作后生成状态日志信息,主动上报协同服务器;所述协同服务器,还用于将各存储节点主动上报的状态日志信息,同步到日志服务器。
进一步的,所述存储引擎,还用于在空闲时,根据各存储节点设备的实时存储能力,对文件存储进行优化以将文件块被均衡的分配到各个存储节点设备。
进一步的,所述存储引擎还用于统计各个文件的访问频率,且将使用频率高的文件分块保存在Memcached数据库的缓存中。
本发明另一个目的,还提供一种分布式文件系统文件存储方法,应用于上述分布式文件系统,包括以下步骤:
A、客户端发起文件写操作请求,协同服务器生成写事务ID,并将其与文件写操作请求一起下发给存储引擎;
B、存储引擎响应协同服务器下发的文件写操作请求,在采用滑动块算法对文件进行分块后,依据通过日志服务器动态获取的各存储节点设备的实时存储能力,为每一个文件块计算出最优存储节点位置;
C、存储引擎将文件与文件块存储节点位置映射关系写入Memcached数据库后,将各个文件块存入所述最优存储节点位置所在的存储节点设备,各个存储节点设备分别写入相应的文件分块。
具体的,在步骤B中,所述为每一个文件块计算出最优存储节点位置的方法包括,为每个文件块选取备份因子个存储能力最优的存储节点位置;所述备份因子是指整个文件在系统中备份的数量。
具体的,在步骤C之后还包括如下步骤:所述各个存储节点设备在完成文件的写操作后生成状态日志信息,主动上报协同服务器。
具体的,在步骤A之前还包括如下步骤:协同服务器接受各存储节点设备的注册,并定期向已注册的各存储节点设备发送心跳报文进行保活检测,并将各存储节点设备回应的心跳报文中所携带的当前状态日志信息,发送给日志服务器。
本发明的有益效果是,通过上述一种分布式文件系统及文件存储方法,利用memcached数据库,提升文件分块索引的速度,同时通过分析日志数据来动态衡量各个存储节点的存储能力,让价值高的文件享有更高的存储资源,提升用户体验,保证信息的及时性,提升存储资源的投资回报率。
附图说明
图1是本发明实施例中分布式文件系统的系统框图。
图2是本发明实施例中分布式文件系统文件存储方法的流程图。
图3是本发明实施例中分布式文件系统文件读取方法的流程图。
具体实施方式
下面结合实施例及附图,详细描述本发明的技术方案。
本发明的一种分布式文件系统,包括多个存储节点设备、高性能分布式内存对象缓存系统(memcached数据库)、协同服务器、存储引擎及日志服务器,其中,所述多个存储节点设备分别与协同服务器及Memcached数据库连接,存储引擎分别与日志服务器、协同服务器及Memcached数据库连接,所述协同服务器,用于负责各存储节点设备的注册,并定期向已注册的各存储节点设备发送心跳报文进行保活检测,并将各存储节点设备回应的心跳报文中所携带的当前状态日志信息,发送给日志服务器;所述日志服务器,用于接收协同服务器发送的各存储节点设备的当前状态日志信息,计算各存储节点设备的实时存储能力,并同步给存储引擎;所述存储引擎,用于响应协同服务器下发的文件写操作请求,在采用滑动块算法对文件进行分块后,依据通过日志服务器动态获取的各存储节点设备的实时存储能力,为每一个文件块计算出最优存储节点位置,将文件与文件块存储节点位置映射关系写入Memcached数据库后,将各个文件块存入所述最优存储节点位置所在的存储节点设备;所述Memcached数据库,用于保存文件及文件分块存储节点位置的映射关系;所述存储节点,用于向协同服务器进行注册,并在向协同服务器回应的心跳报文中携带其状态日志信息,并将存储引擎写入的相应的文件分块进行存储。
本发明的分布式文件系统文件存储方法,应用于上述分布式文件系统中,首先客户端发起文件写操作请求,协同服务器生成写事务ID,并将其与文件写操作请求一起下发给存储引擎;然后存储引擎响应协同服务器下发的文件写操作请求,在采用滑动块算法对文件进行分块后,依据通过日志服务器动态获取的各存储节点设备的实时存储能力,为每一个文件块计算出最优存储节点位置;最后存储引擎将文件与文件块存储节点位置映射关系写入Memcached数据库后,将各个文件块存入所述最优存储节点位置所在的存储节点设备,各个存储节点设备分别写入相应的文件分块。
实施例
本发明实施例中一种分布式文件系统,其系统框图参见图1,包括多个存储节点设备、高性能分布式内存对象缓存系统(memcached数据库)、协同服务器、存储引擎及日志服务器,其中,多个存储节点设备分别与协同服务器及memcached数据库连接,存储引擎分别与日志服务器、协同服务器及memcached数据库连接,日志服务器与协同服务器连接。
这里,协同服务器为系统消息处理中心,通过HTTP协议与存储引擎、各存储节点设备及日志服务器通信,负责各存储节点设备的注册、读写事务的管理及将存储节点设备的当前状态日志传输给日志服务器,并与存储节点设备之间通过心跳检测实现保活,根据存储节点设备发送来的心跳报文获取存储节点的当前状态日志信息,并将每个存储节点设备的当前状态日志信息以日志的形式传输给日志服务器,协同服务器的安全策略可以采用主从备份的方式保证系统的可靠性。存储节点设备的当前状态日志信息包括存储能力、I/O能力及网络能力。存储能力包括磁盘空间大小、占用大小、转速等信息。
日志服务器从协同服务器获取各存储节点设备的当前状态日志信息,计算各存储节点设备的实时存储能力,并将其呈现给存储引擎。实时存储能力是指存储节点当前读或写一个字节所花费的时间,即传输一个字节所花费的时间+节点读写一个字节所花费的时间。存储引擎可以根据该实时存储能力为文件制定存储策略,保证系统的性能达到最优的效果。当一个存储节点的存储状态变化时,如各存储节点完成写事务后生成日志,主动上报协同服务器,协同服务器同步到日志分析引擎。日志分析引擎会根据新的日志数据,重新计算该存储节点的实时存储能力。
日志服务器用于实时记录整个系统的操作记录及为日志分析引擎提供数据依据;memcached数据库用于保存文件及文件分块存储位置的映射关系,以及文件与备份块的映射关系,将其存入内存中,统计各个文件的访问频率,且将部分使用频率高的文件分块保存在缓存中。日志服务器还可用于保证系统维护人员在系统宕机时恢复系统。
存储引擎用于响应协同服务器下发的文件操作请求,采用滑动块(slidingblock)算法对文件进行分块,且通过日志分析引擎呈现的各存储节点的实时存储能力动态维护一个关于存储能力的表项作为存储节点的依据,并写入文件与文件块存储位置映射关系。存储引擎将文件与文件块存储节点位置映射关系写入Memcached数据库后,将各个文件块存入所述最优存储节点位置所在的存储节点设备,各个存储节点设备分别写入相应的文件分块。存储引擎还可以在空闲时,根据各存储节点设备的实时存储能力,对文件存储进行优化以将文件块被均衡的分配到各个存储节点设备。减少高并发时,单个存储节点设备的压力。
在本发明实施例中,存储引擎与日志服务器可以是位于同一个物理服务器上,也可以部署在不同的物理服务器上,不作具体限定。
使用时,本发明文件存储方法实施例的流程图参见图2,其包括以下步骤:
步骤201,客户端发起文件写操作请求,协同服务器生成写事务ID,并将其与文件写操作请求一起下发给存储引擎;
步骤202,存储引擎响应协同服务器下发的文件写操作请求,在采用滑动块算法对文件进行分块后,依据通过日志服务器动态获取的各存储节点设备的实时存储能力,为每一个文件块计算出最优存储节点位置。在本步骤中,所述为每一个文件块计算出最优存储节点位置的方法包括,为每个文件块选取备份因子个存储能力最优的存储节点位置;所述备份因子是指整个文件在系统中备份的数量。
步骤203,存储引擎将文件与文件块存储节点位置映射关系写入Memcached数据库后,将各个文件块存入所述最优存储节点位置所在的存储节点设备,各个存储节点设备分别写入相应的文件分块。在本步骤之后,所述各个存储节点设备在完成文件的写操作后生成状态日志信息,主动上报协同服务器。
另外在本发明实施例中,协同服务器负责接受各存储节点设备的注册,并定期向已注册的各存储节点设备发送心跳报文进行保活检测,并将各存储节点设备回应的心跳报文中所携带的当前状态日志信息,发送给日志服务器。
读取文件的方法流程图参见图3,其包括以下步骤:
步301,客户端发起读取请求,协同服务器响应该读取请求,同时生成对应的读取事务ID,并将其与读取请求一起下发给存储引擎。
步骤302,存储引擎根据该读取请求从memcached数据库中查找所需文件对应的文件块所存储的最优存储节点。本步骤中,所需文件对应的文件块,包括原始文件块及备份存储的文件块。
步骤303,存储引擎从选取的最优存储节点中,将对应文件块透传给客户端。本步骤中,将对应文件块透传给客户端可以为:将对应文件块以数据流的方式透传给客户端。
步骤304,文件读取完成后,存储引擎告知协同服务器,协同服务器结束本次事务。

Claims (10)

1.一种分布式文件系统,包括多个存储节点设备和分布式内存对象缓存系统Memcached数据库,其特征在于,所述系统还包括协同服务器、存储引擎和日志服务器,所述多个存储节点设备分别与协同服务器及Memcached数据库连接,存储引擎分别与日志服务器、协同服务器及Memcached数据库连接,
所述协同服务器,用于负责各存储节点设备的注册,并定期向已注册的各存储节点设备发送心跳报文进行保活检测,并将各存储节点设备回应的心跳报文中所携带的当前状态日志信息,发送给日志服务器;
所述日志服务器,用于接收协同服务器发送的各存储节点设备的当前状态日志信息,计算各存储节点设备的实时存储能力,并同步给存储引擎;
所述存储引擎,用于响应协同服务器下发的文件写操作请求,在采用滑动块算法对文件进行分块后,依据通过日志服务器动态获取的各存储节点设备的实时存储能力,为每一个文件块计算出最优存储节点位置,将文件与文件块存储节点位置映射关系写入Memcached数据库后,将各个文件块存入所述最优存储节点位置所在的存储节点设备;
所述Memcached数据库,用于保存文件及文件分块存储节点位置的映射关系;
所述存储节点,用于向协同服务器进行注册,并在向协同服务器回应的心跳报文中携带其状态日志信息,并将存储引擎写入的相应的文件分块进行存储。
2.如权利要求1所述的分布式文件系统,其特征在于,所述各存储节点设备的当前状态日志信息包括该存储节点的存储空间、I/O能力及网络访问速率。
3.如权利要求1所述的分布式文件系统,其特征在于,所述实时存储能力是指存储节点设备当前读或写一个字节所花费的时间。
4.如权利要求1任一项所述的分布式文件系统,其特征在于,
所述存储节点设备,还用于在完成文件的写操作后生成状态日志信息,主动上报协同服务器;
所述协同服务器,还用于将各存储节点主动上报的状态日志信息,同步到日志服务器。
5.如权利要求1-4任一项所述的分布式文件系统,其特征在于,
所述存储引擎,还用于在空闲时,根据各存储节点设备的实时存储能力,对文件存储进行优化以将文件块被均衡的分配到各个存储节点设备。
6.如权利要求5所述的分布式文件系统,其特征在于,所述存储引擎还用于统计各个文件的访问频率,且将使用频率高的文件分块保存在Memcached数据库的缓存中。
7.分布式文件系统文件存储方法,应用于如权利要求1-6任一项所述的分布式文件系统,其特征在于,包括以下步骤:
A、客户端发起文件写操作请求,协同服务器生成写事务ID,并将其与文件写操作请求一起下发给存储引擎;
B、存储引擎响应协同服务器下发的文件写操作请求,在采用滑动块算法对文件进行分块后,依据通过日志服务器动态获取的各存储节点设备的实时存储能力,为每一个文件块计算出最优存储节点位置;
C、存储引擎将文件与文件块存储节点位置映射关系写入Memcached数据库后,将各个文件块存入所述最优存储节点位置所在的存储节点设备,各个存储节点设备分别写入相应的文件分块。
8.如权利要求7所述的分布式文件系统文件存储方法,其特征在于,在步骤B中,所述为每一个文件块计算出最优存储节点位置的方法包括,为每个文件块选取备份因子个存储能力最优的存储节点位置;所述备份因子是指整个文件在系统中备份的数量。
9.如权利要求8所述的分布式文件系统文件存储方法,其特征在于,在步骤C之后还包括如下步骤:所述各个存储节点设备在完成文件的写操作后生成状态日志信息,主动上报协同服务器。
10.如权利要求8所述的分布式文件系统文件存储方法,其特征在于,在步骤A之前还包括如下步骤:协同服务器接受各存储节点设备的注册,并定期向已注册的各存储节点设备发送心跳报文进行保活检测,并将各存储节点设备回应的心跳报文中所携带的当前状态日志信息,发送给日志服务器。
CN201510728315.2A 2015-10-30 2015-10-30 一种分布式文件系统及文件存储方法 Active CN105335513B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510728315.2A CN105335513B (zh) 2015-10-30 2015-10-30 一种分布式文件系统及文件存储方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510728315.2A CN105335513B (zh) 2015-10-30 2015-10-30 一种分布式文件系统及文件存储方法

Publications (2)

Publication Number Publication Date
CN105335513A CN105335513A (zh) 2016-02-17
CN105335513B true CN105335513B (zh) 2018-09-25

Family

ID=55286040

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510728315.2A Active CN105335513B (zh) 2015-10-30 2015-10-30 一种分布式文件系统及文件存储方法

Country Status (1)

Country Link
CN (1) CN105335513B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4030724A4 (en) * 2019-09-26 2022-11-16 Huawei Cloud Computing Technologies Co., Ltd. METHOD, DEVICE AND SYSTEM FOR MANAGEMENT OF A MIRROR IMAGE FILE, COMPUTER DEVICE AND STORAGE MEDIUM

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106021491B (zh) * 2016-05-20 2019-10-08 天津海量信息技术股份有限公司 基于hdfs的准实时数据存储方法
CN106341478A (zh) * 2016-09-13 2017-01-18 广州中大数字家庭工程技术研究中心有限公司 一种基于Hadoop的教育资源共享系统及实现方法
CN108241640B (zh) * 2016-12-23 2022-04-08 中科星图股份有限公司 一种分布式的文件存储方法
CN108021674A (zh) * 2017-12-06 2018-05-11 浙江远算云计算有限公司 一种同步云端仿真数据的多级缓存传输加速系统
CN110609810A (zh) * 2018-05-29 2019-12-24 深圳市云帆加速科技有限公司 一种文件存储方法及系统
CN108959592A (zh) * 2018-07-12 2018-12-07 广州市闲愉凡生信息科技有限公司 一种云计算平台的文件分布系统
US10802926B2 (en) * 2018-09-21 2020-10-13 Microsoft Technology Licensing, Llc Accessing prior storage segment server state
CN109376122A (zh) * 2018-09-25 2019-02-22 深圳市元征科技股份有限公司 一种文件管理方法、系统及区块链节点设备和存储介质
CN109257439B (zh) * 2018-10-26 2021-11-23 京信网络系统股份有限公司 分布式文件保存系统、文件上传方法和装置
CN109602413B (zh) * 2018-12-06 2022-01-18 Oppo广东移动通信有限公司 心跳检测方法、装置、存储介质及服务器
CN110019105A (zh) * 2019-01-24 2019-07-16 江苏中云科技有限公司 一种可靠高效的分布式文件系统
CN111143364A (zh) * 2019-12-24 2020-05-12 珠海大横琴科技发展有限公司 一种数据块存储方法、装置、电子设备和存储介质
CN111090616B (zh) * 2019-12-30 2024-02-06 北京华胜天成科技股份有限公司 一种文件管理方法、对应装置、设备及存储介质
CN112988474B (zh) * 2021-05-12 2021-11-26 南京云信达科技有限公司 一种海量小文件备份热数据的方法、系统、设备及介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103631820A (zh) * 2012-08-27 2014-03-12 阿里巴巴集团控股有限公司 分布式文件系统的元数据管理方法及设备
CN104063501A (zh) * 2014-07-07 2014-09-24 电子科技大学 基于hdfs的副本平衡方法
CN104123300A (zh) * 2013-04-26 2014-10-29 上海云人信息科技有限公司 数据分布式存储系统及方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5817558B2 (ja) * 2012-01-27 2015-11-18 富士通株式会社 情報処理装置、分散処理システム、キャッシュ管理プログラムおよび分散処理方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103631820A (zh) * 2012-08-27 2014-03-12 阿里巴巴集团控股有限公司 分布式文件系统的元数据管理方法及设备
CN104123300A (zh) * 2013-04-26 2014-10-29 上海云人信息科技有限公司 数据分布式存储系统及方法
CN104063501A (zh) * 2014-07-07 2014-09-24 电子科技大学 基于hdfs的副本平衡方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
In-Memory I/O and Replication for HDFS with Memcached:Early Experiences;Nusrat Sharmin Islam 等;《2014 IEEE International Conference on Big Data》;20150108;213-218 *
基于范德蒙码的HDFS优化存储策略研究;宋宝燕 等;《计算机学报》;20150930;第38卷(第9期);1825-1837 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4030724A4 (en) * 2019-09-26 2022-11-16 Huawei Cloud Computing Technologies Co., Ltd. METHOD, DEVICE AND SYSTEM FOR MANAGEMENT OF A MIRROR IMAGE FILE, COMPUTER DEVICE AND STORAGE MEDIUM

Also Published As

Publication number Publication date
CN105335513A (zh) 2016-02-17

Similar Documents

Publication Publication Date Title
CN105335513B (zh) 一种分布式文件系统及文件存储方法
US9430321B2 (en) Reconstructing data stored across archival data storage devices
CN102411637B (zh) 分布式文件系统的元数据管理方法
US9436571B2 (en) Estimating data storage device lifespan
CN104735110B (zh) 元数据管理方法和系统
CN105025053A (zh) 基于云存储技术的分布式文件的上传方法及其系统
CN102904948A (zh) 一种超大规模低成本存储系统
CN103440244A (zh) 一种大数据存储优化方法
US9424156B2 (en) Identifying a potential failure event for a data storage device
CN106502823A (zh) 数据云备份方法和系统
CN102855239A (zh) 一种分布式地理文件系统
CN103237046A (zh) 支持混合云存储应用的分布式文件系统及实现方法
CN102833580A (zh) 基于infiniband的高清视频应用系统及方法
US9557938B2 (en) Data retrieval based on storage device activation schedules
US9436524B2 (en) Managing archival storage
CN103067488A (zh) 一种统一存储的实现方法
CN105354250A (zh) 一种面向云存储的数据存储方法及装置
CN102480489A (zh) 一种用于分布式环境下的日志记录方法和设备
US20190005534A1 (en) Providing media assets to subscribers of a messaging system
CN109783018A (zh) 一种数据存储的方法及装置
CN103763368A (zh) 一种跨数据中心的数据同步方法
US9430149B2 (en) Pipeline planning for low latency storage system
CN109413130A (zh) 一种云存储系统
CN109831502A (zh) 新型网站云虚拟主机架构
US9430152B2 (en) Data device grouping across data storage device enclosures for synchronized data maintenance

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP02 Change in the address of a patent holder
CP02 Change in the address of a patent holder

Address after: 610041 15-24 floor, 1 1 Tianfu street, Chengdu high tech Zone, Sichuan

Patentee after: MAIPU COMMUNICATION TECHNOLOGY Co.,Ltd.

Address before: 610041 Sichuan city of Chengdu province high tech Zone nine Hing Road No. 16 building, Maipu

Patentee before: MAIPU COMMUNICATION TECHNOLOGY Co.,Ltd.

CP02 Change in the address of a patent holder
CP02 Change in the address of a patent holder

Address after: 610041 nine Xing Xing Road 16, hi tech Zone, Sichuan, Chengdu

Patentee after: MAIPU COMMUNICATION TECHNOLOGY Co.,Ltd.

Address before: 610041 15-24 floor, 1 1 Tianfu street, Chengdu high tech Zone, Sichuan

Patentee before: MAIPU COMMUNICATION TECHNOLOGY Co.,Ltd.