CN104331453A - 一种分布式文件系统及分布式文件系统的构建方法 - Google Patents

一种分布式文件系统及分布式文件系统的构建方法 Download PDF

Info

Publication number
CN104331453A
CN104331453A CN201410601171.XA CN201410601171A CN104331453A CN 104331453 A CN104331453 A CN 104331453A CN 201410601171 A CN201410601171 A CN 201410601171A CN 104331453 A CN104331453 A CN 104331453A
Authority
CN
China
Prior art keywords
file
key
data block
allocation table
head portion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410601171.XA
Other languages
English (en)
Other versions
CN104331453B (zh
Inventor
张奇伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Si Tech Information Technology Co Ltd
Original Assignee
Beijing Si Tech Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Si Tech Information Technology Co Ltd filed Critical Beijing Si Tech Information Technology Co Ltd
Priority to CN201410601171.XA priority Critical patent/CN104331453B/zh
Publication of CN104331453A publication Critical patent/CN104331453A/zh
Application granted granted Critical
Publication of CN104331453B publication Critical patent/CN104331453B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/182Distributed file systems

Abstract

本发明涉及一种分布式文件系统及分布式文件系统的构建方法,包括以下步骤:封装访问函数,定义结构体文件;将磁盘上的所有文件按照预先定义的预定数据块大小拆分为多个预定数据块大小的数据块;将拆分后的每个数据块分别以键值对的形式存储在分布式开源数据库中;根据每个数据块的键头部和文件的文件名建立文件分配表;当外部应用发起文件访问请求时,查询文件分配表,得到查询结果,对分布式开源数据库进行数据块读写同时对分布式开源数据库中的文件分配表进行修改。本发明利用HBASE对小数据块的快速访问,通过自动数据拆分和汇集,实现对任意大小文件均能按照类似传统非分布式文件系统一样快速随机存储和访问。

Description

一种分布式文件系统及分布式文件系统的构建方法
技术领域
本发明涉及一种分布式文件系统及分布式文件系统的构建方法。
背景技术
Hadoop是一个分布式系统基础架构,由Apache基金会开发。Hadoop实现了一个分布式文件系统(HDFS)和一种分布式计算框架(MapReduce)。
HDFS是Hadoop Distributed File System的简称,它是一个分布式文件系统。HDFS有着高容错性的特点,它提供高吞吐量方法来访问应用程序的数据,适合那些有着超大数据集的应用程序,但对数据随机访问和小数据集的读写有着较大的效率瓶颈。
HBase是一个分布式的、面向列的开源数据库,它不是关系型的数据库,数据采用Key-Value方式存储,是一个适合于非结构化数据存储的数据库。目前通用分布式文件系统对小文件(小于64MB)和普通文件随机快速访问具有处理效率低的问题。
发明内容
本发明所要解决的技术问题是提供一种对小文件和普通文件随机快速访问处理效率高的分布式文件系统及分布式文件系统的构建方法。
本发明解决上述技术问题的技术方案如下:一种分布式文件系统的构建方法,包括以下步骤:
步骤1:封装用于进行文件访问的访问函数,定义结构体文件,所述结构体文件用于存储文件分配表的访问指针;
步骤2:将磁盘上的所有文件按照预先定义的预定数据块大小拆分为多个数据块;
步骤3:将拆分后的每个数据块分别以键值对的形式存储在分布式开源数据库中,所述键值对包括键和键值,所述键包括键头部和当前数据块在被拆分的文件中的序号,所述键值用于存储数据块;
步骤4:根据每个数据块的键头部和所有被拆分文件的文件名建立文件分配表,所述文件分配表中还包括被拆分文件的扩展属性;
步骤5:当外部应用向分布式开源数据库发起文件访问请求时,分布式开源数据库根据文件访问请求中携带的文件名利用定义的结构体文件查询文件分配表,得到查询结果,根据封装的访问函数及查询结果对分布式开源数据库进行数据块读写和/或对分布式开源数据库中的文件分配表进行修改。
本发明的有益效果是:本发明利用HBASE对小数据块(HBASE的数据记录)的快速查询访问,通过自动数据拆分和汇集(Map-Reduce),实现对任意大小文件均能按照类似本地文件系统一样快速随机存储和访问,解决了目前通用分布式文件系统对小文件(小于64MB)和普通文件随机快速访问处理效率低的问题。
在上述技术方案的基础上,本发明还可以做如下改进。
进一步,所述键头部包括时间戳、主机名和流水号,所述时间戳为将磁盘上的文件拆分为数据块时所在主机的时间,所述主机名为将磁盘上的文件拆分为数据块时所在主机的主机名,所述流水号用于记录每一个数据块的序号。
进一步,所述步骤5中文件访问请求具体为文件创建请求、文件复写请求或者文件删除请求。
进一步,当文件访问请求为文件创建请求时,分布式开源数据库根据文件访问请求中携带的文件名利用定义的结构体文件查询文件分配表,得到查询结果;
如果文件分配表中存在与文件访问请求中的文件名相同的同名文件,则根据扩展属性判断此文件权限是否允许当前用户修改,如果不允许修改,则返回无权限修改的错误提示;如果允许修改,根据文件分配表中的同名文件的键头部,删除在分布式开源数据库中与该同名文件对应的键值,然后复用此同名文件的键头部,为该键头部重新写入数据块;
如果在文件分配表中未找到同名文件,则新建一个键值对,并将键值对的键值部分存入新的数据块,将文件访问请求中的文件名和键值对的键头部分别对应存入文件分配表,并返回创建文件成功提示。
进一步,当文件访问请求为文件复写请求时,分布式开源数据库根据文件访问请求中携带的文件名利用定义的结构体文件查询文件分配表,得到查询结果;
如果文件分配表中存在与文件访问请求中的文件名相同的同名文件,则根据扩展属性判断此文件权限是否允许当前用户修改,如果不允许修改,则返回无权限修改的错误提示;如果允许修改,根据文件分配表中的同名文件的键头部,在分布式开源数据库中删除与该同名文件对应的键值,然后复用此同名文件的键头部,为该键头部重新写入数据块;
如果在文件分配表中未找到同名文件,则新建一个键值对,将文件访问请求中的文件名和键值对的键头部分别对应存入文件分配表,为键值对的键值部分存入新的数据块,数据块一开始写入时直接写入内存中,当内存写入数据达到预定阀值或外部的应用程序主动调用强制刷新命令要求刷新数据到磁盘时,将内存中缓存数据的当前数据偏移量拼接到键头部,将当前数据偏移量作为键值对中的键及作为键值的内存中的数据块一通写入分布式开源数据库,写入成功后,返回复写函数调用成功提示。
进一步,当文件访问请求为文件删除请求时,外部的应用程序调用删除函数,分布式开源数据库根据文件访问请求中携带的文件名利用定义的结构体文件查询文件分配表,得到查询结果;
如果在文件分配表中未找到同名文件,则返回删除函数调用失败提示;
如果在文件分配表中找到同名文件,从文件分配表中获取与文件删除请求携带的文件名对应的键头部和扩展属性,根据扩展属性判断此文件的权限是否允许当前用户执行删除操作,如果允许,利用获取的键头部从分布式开源数据库中删除相对应的键值,然后从文件分配表中删除与键头部对应的文件名和扩展属性,全部删除完毕后,返回删除函数调用成功。
进一步,一种分布式文件系统,包括封装定义模块,拆分模块,存储模块,建立模块和查询修改模块;
所述封装定义模块,用于封装进行文件访问的访问函数,定义存储文件分配表的访问指针的结构体文件;
所述拆分模块,用于将磁盘上的所有文件按照预先定义的预定数据块大小拆分为多个数据块;
所述存储模块,用于将拆分后的每个数据块分别以键值对的形式存储在分布式开源数据库中,所述键值对包括键和键值,所述键包括键头部和当前数据块在被拆分的文件中的序号,所述键值用于存储数据块;
所述建立模块,用于根据每个数据块的键头部和所有被拆分文件的文件名建立文件分配表,所述文件分配表中还包括被拆分文件的扩展属性;
所述查询修改模块,用于当外部应用向分布式开源数据库发起文件访问请求时,分布式开源数据库根据文件访问请求中携带的文件名利用定义的结构体文件查询文件分配表,得到查询结果,根据封装的访问函数及查询结果对分布式开源数据库进行数据块读写和/或对分布式开源数据库中的文件分配表进行修改。
进一步,所述存储模块存储的键值对的键头部包括时间戳、主机名和流水号,所述时间戳为将磁盘上的文件拆分为数据块时所在主机的时间,所述主机名为将磁盘上的文件拆分为数据块时所在主机的主机名,所述流水号用于记录每一个数据块的序号。
进一步,所述查询修改模块中文件访问请求具体为文件创建请求、文件复写请求或者文件删除请求。
附图说明
图1为本发明方法步骤流程图;
图2为本发明系统结构图。
附图中,各标号所代表的部件列表如下:
1、封装定义模块,2、拆分模块,3、存储模块,4、建立模块,5、查询修改模块。
具体实施方式
以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
如图1所示,为本发明方法步骤流程图;图2为本发明系统结构图。
实施例1
一种分布式文件系统的构建方法,包括以下步骤:
步骤1:封装用于进行文件访问的访问函数,定义结构体文件,所述结构体文件用于存储文件分配表的访问指针;
系统封装标准C的文件访问常用函数,如打开文件(fopen)、关闭文件(fclose)、写文件(fwrite)、读文件(fread)、文件偏移(fseek)、文件位置重置(rewind)、文件改名(rename)等,对函数的标准声明不变,重新定义结构体FILE,在此结构体中存储HBASE默认表的访问句柄;
步骤2:将磁盘上的所有文件按照预先定义的预定数据块大小拆分为多个预定数据块大小的数据块;
步骤3:将拆分后的每个数据块分别以键值对的形式存储在分布式开源数据库中,所述键值对包括键和键值,所述键包括键头部和当前数据块在被拆分的文件中的序号,所述键值用于存储数据块;
步骤4:根据每个数据块的键头部和所有被拆分文件的文件名建立文件分配表,所述文件分配表中还包括被拆分文件的扩展属性;
步骤5:当外部应用向分布式开源数据库发起文件访问请求时,分布式开源数据库根据文件访问请求中携带的文件名利用定义的结构体文件查询文件分配表,得到查询结果,根据封装的访问函数及查询结果对分布式开源数据库进行数据块读写同时对分布式开源数据库中的文件分配表进行修改。
字段名 字段类型 描述
FileName Char(128) 文件名
KeyPre Char(128) Key头部
AddAttr Char(256) 扩展属性
表1.文件分配表(FAT)
分布式文件系统上的文件在被访问时,分布式文件系统会先根据请求的文件名从文件分配表中得到键头部,然后判断扩展属性允许访问后,从分布式开源数据库中根据键头部获取对应的数据片,并将数据片内容提供给外部应用。
所述键头部包括时间戳、主机名和流水号,所述时间戳为将磁盘上的文件拆分为数据块时所在主机的时间,所述主机名为将磁盘上的文件拆分为数据块时所在主机的主机名,所述流水号用于记录每一个数据块的序号。
流水号为从全局系统中获取的长度为8的数字,此数字在同一时刻不会重复,并且主机重启也不会造成此数字的复位。键头部在文件创建的同时生成,并唯一标识此文件,直到文件被删除,此key都不会发生变更;
所述步骤5中文件访问请求具体为文件创建请求、文件复写请求或者文件删除请求。
当文件访问请求为文件创建请求时,分布式开源数据库根据文件访问请求中携带的文件名利用定义的结构体文件查询文件分配表,得到查询结果;
如果文件分配表中存在与文件访问请求中的文件名相同的同名文件,则根据扩展属性判断此文件权限是否允许当前用户修改,如果不允许修改,则返回无权限修改的错误提示;如果允许修改,根据文件分配表中的同名文件的键头部,删除在分布式开源数据库中与该同名文件对应的键值,然后复用此同名文件的键头部,为该键头部重新写入数据块;
如果在文件分配表中未找到同名文件,则新建一个键值对,并将键值对的键值部分存入新的数据块,将文件访问请求中的文件名和键值对的键头部分别对应存入文件分配表,并返回创建文件成功提示。
当文件访问请求为文件复写请求时,分布式开源数据库根据文件访问请求中携带的文件名利用定义的结构体文件查询文件分配表,得到查询结果;
如果文件分配表中存在与文件访问请求中的文件名相同的同名文件,则根据扩展属性判断此文件权限是否允许当前用户修改,如果不允许修改,则返回无权限修改的错误提示;如果允许修改,根据文件分配表中的同名文件的键头部,在分布式开源数据库中删除与该同名文件对应的键值,然后复用此同名文件的键头部,为该键头部重新写入数据块;
如果在文件分配表中未找到同名文件,则新建一个键值对,将文件访问请求中的文件名和键值对的键头部分别对应存入文件分配表,为键值对的键值部分存入新的数据块,数据块一开始写入时直接写入内存中,当内存写入数据达到预定阀值或外部的应用程序主动调用强制刷新命令要求刷新数据到磁盘时,将内存中缓存数据的当前数据偏移量拼接到键头部,将当前数据偏移量作为键值对中的键及作为键值的内存中的数据块一通写入分布式开源数据库,写入成功后,返回复写函数调用成功提示。
当文件访问请求为文件删除请求时,外部的应用程序调用删除函数,分布式开源数据库根据文件访问请求中携带的文件名利用定义的结构体文件查询文件分配表,得到查询结果;
如果在文件分配表中未找到同名文件,则返回删除函数调用失败提示;
如果在文件分配表中找到同名文件,从文件分配表中获取与文件删除请求携带的文件名对应的键头部和扩展属性,根据扩展属性判断此文件的权限是否允许当前用户执行删除操作,如果允许,利用获取的键头部从分布式开源数据库中删除相对应的键值,然后从文件分配表中删除与键头部对应的文件名和扩展属性,全部删除完毕后,返回删除函数调用成功。
一种分布式文件系统,包括封装定义模块1,拆分模块2,存储模块3,建立模块4和查询修改模块;
所述封装定义模块1,用于封装进行文件访问的访问函数,定义存储文件分配表的访问指针的结构体文件;
所述拆分模块2,用于将磁盘上的所有文件按照预先定义的预定数据块大小拆分为多个预定数据块大小的数据块;
所述存储模块3,用于将拆分后的每个数据块分别以键值对的形式存储在分布式开源数据库中,所述键值对包括键和键值,所述键包括键头部和当前数据块在被拆分的文件中的序号,所述键值用于存储数据块;
所述建立模块4,用于根据每个数据块的键头部和所有被拆分文件的文件名建立文件分配表,所述文件分配表中还包括被拆分文件的扩展属性;
所述查询修改模块5,用于当外部应用向分布式开源数据库发起文件访问请求时,分布式开源数据库根据文件访问请求中携带的文件名利用定义的结构体文件查询文件分配表,得到查询结果,根据封装的访问函数及查询结果对分布式开源数据库进行数据块读写和/或对分布式开源数据库中的文件分配表进行修改。
所述存储模块3存储的键值对的键头部包括时间戳、主机名和流水号,所述时间戳为将磁盘上的文件拆分为数据块时所在主机的时间,所述主机名为将磁盘上的文件拆分为数据块时所在主机的主机名,所述流水号用于记录每一个数据块的序号。
所述查询修改模块5中文件访问请求具体为文件创建请求、文件复写请求或者文件删除请求。
本发明针对现有的Hadoop架构下,HDFS和HBASE平台特点,通过本发明所描述的分布式虚拟文件系统(iDVFS),实现一种适合任何尺寸文件快速随机访问的文件系统。
首先,搭建HDFS,并在其上搭建HBASE如图一(为描述方便,图中只画出对应平台的存储节点);
然后,基于HBASE接口,搭建本发明软件——分布式虚拟文件系统(iDVFS)。此文件系统的主要作用在于将一个逻辑文件分解成若干等长的小块,然后以记录的方式存放在HBASE中。当外部应用发起对虚拟文件的读写访问时,iDVFS会将对文件的读写请求分解成HBASE的查询,并将查询结果返回给应用程序;
本发明的主要思路在于:有效利用了HBASE对小数据块(HBASE的数据记录)的快速查询访问,并通过iDVFS的自动数据拆分和汇集(Map-Reduce),实现对任意大小文件均能按照类似本地文件系统一样快速随机访问。
在Hadoop架构下,利用Hadoop提供的Map-Reduce方法将文件读取、写入、删除、随机定位等文件访问过程,分解成对HBASE平台的数据记录的查询、插入、删除、更新访问。
分布式文件系统上的文件,被自动分为固定大小的数据块,以记录的方式存储在HBASE上。
HBASE上记录和分布式文件系统中文件的对应关系,由本专利要求的分布式文件系统管理。
本发明的分布式文件系统构建于HBASE之上,文件虚拟化存在于此文件系统内,文件数据实体存放于HBASE,虚拟文件与文件数据间的对应关系在文件分配表(FAT)中管理。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (9)

1.一种分布式文件系统的构建方法,其特征在于,包括以下步骤:
步骤1:封装用于进行文件访问的访问函数,定义结构体文件,所述结构体文件用于存储文件分配表的访问指针;
步骤2:将磁盘上所有文件按照预先定义的预定数据块大小拆分为多个数据块;
步骤3:将拆分后的每个数据块分别以键值对的形式存储在分布式开源数据库中,所述键值对包括键和键值,所述键包括键头部和当前数据块在被拆分的文件中的序号,所述键值用于存储数据块;
步骤4:根据每个数据块的键头部和所有被拆分文件的文件名建立文件分配表,所述文件分配表中还包括被拆分文件的扩展属性;
步骤5:当外部应用发起文件访问请求时,分布式开源数据库根据文件访问请求中携带的文件名,利用定义的结构体文件查询文件分配表,得到查询结果,根据封装的访问函数及查询结果对分布式开源数据库进行数据块读写,同时对分布式开源数据库中的文件分配表进行修改。
2.根据权利要求1所述的构建方法,其特征在于:所述键头部包括时间戳、主机名和流水号,所述时间戳为将磁盘上的文件拆分为数据块时所在主机的时间,所述主机名为将磁盘上的文件拆分为数据块时所在主机的主机名,所述流水号用于记录每一个数据块的序号。
3.根据权利要求1所述的构建方法,其特征在于:所述步骤5中文件访问请求具体为文件创建请求、文件复写请求或者文件删除请求。
4.根据权利要求3所述的构建方法,其特征在于:当文件访问请求为文件创建请求时,分布式开源数据库根据文件访问请求中携带的文件名,利用定义的结构体文件查询文件分配表,得到查询结果;
如果文件分配表中存在与文件访问请求中的文件名相同的同名文件,则根据扩展属性判断此文件权限是否允许当前用户修改,如果不允许修改,则返回无权限修改的错误提示;如果允许修改,根据文件分配表中的同名文件的键头部,删除在分布式开源数据库中与该同名文件对应的键值,然后复用此同名文件的键头部,为该键头部重新写入数据块;
如果在文件分配表中未找到同名文件,则新建一个键值对,并将键值对的键值部分存入新的数据块,将文件访问请求中的文件名和键值对的键头部分别对应存入文件分配表,并返回创建文件成功提示。
5.根据权利要求3所述的构建方法,其特征在于:当文件访问请求为文件复写请求时,分布式开源数据库根据文件访问请求中携带的文件名利用定义的结构体文件查询文件分配表,得到查询结果;
如果文件分配表中存在与文件访问请求中的文件名相同的同名文件,则根据扩展属性判断此文件权限是否允许当前用户修改,如果不允许修改,则返回无权限修改的错误提示;如果允许修改,根据文件分配表中的同名文件的键头部,在分布式开源数据库中删除与该同名文件对应的键值,然后复用此同名文件的键头部,为该键头部重新写入数据块;
如果在文件分配表中未找到同名文件,则新建一个键值对,将文件访问请求中的文件名和键值对的键头部分别对应存入文件分配表,为键值对的键值部分存入新的数据块,数据块一开始写入时直接写入内存中,当内存写入数据达到预定阀值或外部的应用程序主动调用强制刷新命令要求刷新数据到磁盘时,将内存中缓存数据的当前数据偏移量拼接到键头部,将当前数据偏移量作为键值对中的键及作为键值的内存中的数据块一通写入分布式开源数据库,写入成功后,返回复写函数调用成功提示。
6.根据权利要求3所述的构建方法,其特征在于:当文件访问请求为文件删除请求时,外部的应用程序调用删除函数,分布式开源数据库根据文件访问请求中携带的文件名利用定义的结构体文件查询文件分配表,得到查询结果;
如果在文件分配表中未找到同名文件,则返回删除函数调用失败提示;
如果在文件分配表中找到同名文件,从文件分配表中获取与文件删除请求携带的文件名对应的键头部和扩展属性,根据扩展属性判断此文件的权限是否允许当前用户执行删除操作,如果允许,利用获取的键头部从分布式开源数据库中删除相对应的键值,然后从文件分配表中删除与键头部对应的文件名和扩展属性,全部删除完毕后,返回删除函数调用成功。
7.一种分布式文件系统,其特征在于:包括封装定义模块(1),拆分模块(2),存储模块(3),建立模块(4)和查询修改模块(5);
所述封装定义模块(1),用于封装进行文件访问的访问函数,定义存储文件分配表的访问指针的结构体文件;
所述拆分模块(2),用于将磁盘上所有文件按照预先定义的预定数据块大小拆分为多个数据块;
所述存储模块(3),用于将拆分后的每个数据块分别以键值对的形式存储在分布式开源数据库中,所述键值对包括键和键值,所述键包括键头部和当前数据块在被拆分的文件中的序号,所述键值用于存储数据块;
所述建立模块(4),用于根据每个数据块的键头部和所有被拆分文件的文件名建立文件分配表,所述文件分配表中还包括被拆分文件的扩展属性;
所述查询修改模块(5),用于当外部应用向分布式开源数据库发起文件访问请求时,分布式开源数据库根据文件访问请求中携带的文件名利用定义的结构体文件查询文件分配表,得到查询结果,根据封装的访问函数及查询结果对分布式开源数据库进行数据块读写,同时对分布式开源数据库中的文件分配表进行修改。
8.根据权利要求7所述的分布式文件系统,其特征在于:所述存储模块(3)存储的键值对的键头部包括时间戳、主机名和流水号,所述时间戳为将磁盘上的文件拆分为数据块时所在主机的时间,所述主机名为将磁盘上的文件拆分为数据块时所在主机的主机名,所述流水号用于记录每一个数据块的序号。
9.根据权利要求7所述的分布式文件系统,其特征在于:所述查询修改模块(5)中文件访问请求具体为文件创建请求、文件复写请求或者文件删除请求。
CN201410601171.XA 2014-10-30 2014-10-30 一种分布式文件系统及分布式文件系统的构建方法 Active CN104331453B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410601171.XA CN104331453B (zh) 2014-10-30 2014-10-30 一种分布式文件系统及分布式文件系统的构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410601171.XA CN104331453B (zh) 2014-10-30 2014-10-30 一种分布式文件系统及分布式文件系统的构建方法

Publications (2)

Publication Number Publication Date
CN104331453A true CN104331453A (zh) 2015-02-04
CN104331453B CN104331453B (zh) 2017-10-17

Family

ID=52406180

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410601171.XA Active CN104331453B (zh) 2014-10-30 2014-10-30 一种分布式文件系统及分布式文件系统的构建方法

Country Status (1)

Country Link
CN (1) CN104331453B (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105354311A (zh) * 2015-11-10 2016-02-24 科大智能电气技术有限公司 一种基于嵌入式设备文件系统的数据键值对存储方法
WO2016169322A1 (zh) * 2015-04-22 2016-10-27 中兴通讯股份有限公司 数据库的查询方法和装置、计算机存储介质
CN106843759A (zh) * 2017-01-17 2017-06-13 苏州同元软控信息技术有限公司 一种基于动态系统结果数据的快速读写方法
CN107423431A (zh) * 2017-08-03 2017-12-01 东北林业大学 一种基于分布式文件系统的遥感数据存储方法及系统
CN108616556A (zh) * 2016-12-13 2018-10-02 阿里巴巴集团控股有限公司 数据处理方法、装置和系统
CN109144733A (zh) * 2018-09-06 2019-01-04 北京京东尚科信息技术有限公司 基于Alluxio的数据处理方法及系统
CN109451069A (zh) * 2018-12-29 2019-03-08 江苏鼎峰信息技术有限公司 基于分布式存储的网络数据文件库存储及查询方法
CN109871338A (zh) * 2019-03-15 2019-06-11 北京思特奇信息技术股份有限公司 一种数据存储方法、装置及计算机设备
CN110704875A (zh) * 2019-10-22 2020-01-17 泰康保险集团股份有限公司 客户敏感信息的处理方法、装置、系统、介质及电子设备
CN110717192A (zh) * 2019-09-11 2020-01-21 南京工业职业技术学院 基于Key-Value加速器的面向大数据安全的访问控制方法
CN116501713A (zh) * 2023-06-26 2023-07-28 成都谐盈科技有限公司 一种分布式文件系统的实现方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102375853A (zh) * 2010-08-24 2012-03-14 中国移动通信集团公司 分布式数据库系统、在其中建立索引的方法和查询方法
CN102646121A (zh) * 2012-02-23 2012-08-22 武汉大学 结合RDBMS和Hadoop云存储的两级存储方法
US20140280172A1 (en) * 2013-03-13 2014-09-18 Nice-Systems Ltd. System and method for distributed categorization

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102375853A (zh) * 2010-08-24 2012-03-14 中国移动通信集团公司 分布式数据库系统、在其中建立索引的方法和查询方法
CN102646121A (zh) * 2012-02-23 2012-08-22 武汉大学 结合RDBMS和Hadoop云存储的两级存储方法
US20140280172A1 (en) * 2013-03-13 2014-09-18 Nice-Systems Ltd. System and method for distributed categorization

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
张兴旺等: "云计算环境下大规模数据处理的研究与初步实现", 《现代图书情报技术》 *

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016169322A1 (zh) * 2015-04-22 2016-10-27 中兴通讯股份有限公司 数据库的查询方法和装置、计算机存储介质
CN106156197A (zh) * 2015-04-22 2016-11-23 中兴通讯股份有限公司 一种数据库的查询方法和装置
CN105354311A (zh) * 2015-11-10 2016-02-24 科大智能电气技术有限公司 一种基于嵌入式设备文件系统的数据键值对存储方法
CN105354311B (zh) * 2015-11-10 2018-06-19 科大智能电气技术有限公司 一种基于嵌入式设备文件系统的数据键值对存储方法
CN108616556B (zh) * 2016-12-13 2021-01-19 阿里巴巴集团控股有限公司 数据处理方法、装置和系统
CN108616556A (zh) * 2016-12-13 2018-10-02 阿里巴巴集团控股有限公司 数据处理方法、装置和系统
CN106843759A (zh) * 2017-01-17 2017-06-13 苏州同元软控信息技术有限公司 一种基于动态系统结果数据的快速读写方法
CN107423431A (zh) * 2017-08-03 2017-12-01 东北林业大学 一种基于分布式文件系统的遥感数据存储方法及系统
CN109144733A (zh) * 2018-09-06 2019-01-04 北京京东尚科信息技术有限公司 基于Alluxio的数据处理方法及系统
CN109451069A (zh) * 2018-12-29 2019-03-08 江苏鼎峰信息技术有限公司 基于分布式存储的网络数据文件库存储及查询方法
CN109871338A (zh) * 2019-03-15 2019-06-11 北京思特奇信息技术股份有限公司 一种数据存储方法、装置及计算机设备
CN109871338B (zh) * 2019-03-15 2021-01-29 北京思特奇信息技术股份有限公司 一种数据存储方法、装置及计算机设备
CN110717192A (zh) * 2019-09-11 2020-01-21 南京工业职业技术学院 基于Key-Value加速器的面向大数据安全的访问控制方法
CN110704875A (zh) * 2019-10-22 2020-01-17 泰康保险集团股份有限公司 客户敏感信息的处理方法、装置、系统、介质及电子设备
CN116501713A (zh) * 2023-06-26 2023-07-28 成都谐盈科技有限公司 一种分布式文件系统的实现方法
CN116501713B (zh) * 2023-06-26 2023-09-22 成都谐盈科技有限公司 一种分布式文件系统的实现方法

Also Published As

Publication number Publication date
CN104331453B (zh) 2017-10-17

Similar Documents

Publication Publication Date Title
CN104331453A (zh) 一种分布式文件系统及分布式文件系统的构建方法
US10430398B2 (en) Data storage system having mutable objects incorporating time
US10289315B2 (en) Managing I/O operations of large data objects in a cache memory device by dividing into chunks
US10453076B2 (en) Cold storage for legal hold data
CN107169083B (zh) 公安卡口海量车辆数据存储与检索方法及装置、电子设备
JP6479020B2 (ja) 分散ストレージシステムにおけるオブジェクトの階層チャンキング
CN103179185B (zh) 一种分布式文件系统客户端缓存中文件创建方法及其系统
CN103294710B (zh) 一种数据存取方法和装置
CN106708427A (zh) 一种适用于键值对数据的存储方法
EP3153987B1 (en) Duplicate data deletion method and device
US10516732B2 (en) Disconnected ingest in a distributed storage system
US10157214B1 (en) Process for data migration between document stores
US20180089033A1 (en) Performing data backups using snapshots
CN105718455A (zh) 一种数据查询方法及装置
CN105183839A (zh) 一种基于Hadoop的小文件分级索引的存储优化方法
US9110820B1 (en) Hybrid data storage system in an HPC exascale environment
US8572338B1 (en) Systems and methods for creating space-saving snapshots
CN109804359A (zh) 用于将数据回写到存储设备的系统和方法
CN107679420B (zh) 一种基于分布式文件系统的权限设置方法及系统
CN103399823A (zh) 业务数据的存储方法、设备和系统
CN103473258A (zh) 云存储文件系统
CN103942301A (zh) 一种面向多数据类型访问应用的分布式文件系统
CN107506466A (zh) 一种小文件存储方法及系统
CN105631010A (zh) 一种基于hdfs小文件存储的优化方法
CN105279166B (zh) 文件管理方法和系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant