CN103279568A - 一种元数据管理系统及方法 - Google Patents

一种元数据管理系统及方法 Download PDF

Info

Publication number
CN103279568A
CN103279568A CN2013102427878A CN201310242787A CN103279568A CN 103279568 A CN103279568 A CN 103279568A CN 2013102427878 A CN2013102427878 A CN 2013102427878A CN 201310242787 A CN201310242787 A CN 201310242787A CN 103279568 A CN103279568 A CN 103279568A
Authority
CN
China
Prior art keywords
metadata
catalogue
node
metadata node
subtree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2013102427878A
Other languages
English (en)
Inventor
周海波
苗东
周泉
于强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
WUXI UNIS STORAGE SYSTEM Co Ltd
Original Assignee
WUXI UNIS STORAGE SYSTEM Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by WUXI UNIS STORAGE SYSTEM Co Ltd filed Critical WUXI UNIS STORAGE SYSTEM Co Ltd
Priority to CN2013102427878A priority Critical patent/CN103279568A/zh
Publication of CN103279568A publication Critical patent/CN103279568A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开一种元数据管理系统和方法,该系统包括:消息引擎、节点监视器、元数据管理模块、元数据备份模块、元数据日志模块、目录热度监视器、目录复制模块以及目录迁移模块。本发明中元数据分布在元数据集群中的节点中,而不是内存容量受限的单一容量中,使得存储容量可横向扩展,并且元数据的分布使用动态分布策略,提高了分布式文件系统在企业应用环境所需的高可用性、存储容量以及访问性能的高可扩展性。

Description

一种元数据管理系统及方法
技术领域
本发明涉及分布式文件系统中元数据管理技术领域,尤其涉及一种元数据管理系统和方法。
背景技术
在目前的支持大数据的分布式文件系统中,采用的是单节点的元数据服务模型。首先,如果由于硬件故障或者软件错误导致元数据节点失效,进行文件操作时将无法获得元数据信息,文件系统将无法继续使用,导致整个系统瘫痪。尽管有些技术方案使用了Active-Backup(备份算法)模式增加了备份节点,但是当主节点发生故障后,元数据服务切换到备份节点时的这个过程需要较长的时间,不能满足企业应用要求的高可用性。其次,由于元数据保存在元数据节点的内存中,而元数据节点的内存是有限的,在大数据的应用中,文件系统的规模不断增大,元数据的大小急速增加,元数据节点的内存将无法容纳如此多的元数据,从而限制了文件系统的存储容量;另外,当访问文件系统中的数据时,所有的访问都需要向元数据节点发送请求。当文件系统的访问量增大时,元数据节点就成为文件访问的性能瓶颈。
发明内容
本发明的目的在于通过一种元数据管理系统和方法,来解决以上背景技术部分提到的问题。
为达此目的,本发明采用以下技术方案:
一种元数据管理系统,其包括:消息引擎、节点监视器、元数据管理模块、元数据备份模块、元数据日志模块、目录热度监视器、目录复制模块以及目录迁移模块;
所述消息引擎用于负责与文件系统客户端和存储节点之间通信;
所述节点监视器用于维护元数据集群中的每个节点的健康信息;
所述元数据管理模块用于根据文件系统客户端的文件访问类型,完成对目录以及文件对像的操作请求;
所述元数据备份模块用于根据元数据的备份要求,将相关的目录对象对应的元数据备份到元数据集群中的其它元数据节点中;
所述元数据日志模块用于将文件系统客户端对文件系统操作的日志保存到本地;
所述目录热度监视器用于实时监测目录对象访问的频繁程度,并根据其它元数据节点的负载情况,对目录对象是否需要复制和迁移进行决策;
所述目录复制模块用于根据目录热度监视器发布的目录对象复制要求,完成目录对象向其它元数据节点的复制;
所述目录迁移模块用于根据目录热度监视器发布的目录对象迁移要求,完成目录对象向其它元数据节点的迁移。
特别地,所述消息引擎具体用于:
负责与文件系统客户端和存储节点之间通信,当文件系统客户端进行文件操作时,返回元数据信息,或者数据块映射信息,或者操作结果,并接收来自于存储节点定期上传的数据块映射信息。
特别地,所述每个节点的健康信息包括元数据节点的工作负载、访问热度以及心跳情况。
特别地,所述对目录以及文件对像的操作请求包括:新建目录、删除目录、读取目录、创建文件、删除文件以及重命名文件名称或者目录名称。
本发明还公开了一种元数据管理方法,其包括如下步骤:
A、根据元数据节点的负载,计算目录子树的访问频度,并根据该访问频度择出需要迁移的目录子树;
B、将需要迁移的目录子树迁移到负载较低的元数据节点上,达到元数据集群负载均衡;
C、元数据节点根据目录的访问热度,将目录访问热度符合复制条件的目录子树复制到其它的元数据节点中形成副本。
特别地,所述步骤A具体包括:
A1、元数据节点通过节点监视器获取其它所有元数据节点的负载信息,并由负载最高的元数据节点计算出当前元数据集群的负载均衡度;当负载均衡度达到规定阈值时,执行步骤A2;
A2、通过节点监视器获取其它所有元数据节点的负载信息和目录访问热度信息,目录热度监视器计算目录需要迁移的阈值以及目录子树迁移的目标元数据节点集合。
特别地,所述步骤B具体包括:
B1、在目录子树迁移的目标元数据节点集合中,选取目录访问热度最低的元数据节点,查询该元数据节点的缓存中是否存在从目录访问热度最低的元数据节点迁入的目录,如果符合目录子树迁移条件,则将该类目录子树迁移到目录访问热度最低的元数据节点中;否则,在该元数据节点的目录中选择相应热度的目录子树迁移到目录访问热度最低的元数据节点中;
B2、如果没有目录子树达到迁移的条件,则从目标子树迁移的元数据节点集合中选择下一个元数据节点,重复执行步骤B1。
特别地,所述步骤B1具体包括:
B101、源元数据节点的目录迁移模块接收到目录子树迁移的消息后,冻结该目录子树,并向目标元数据节点发送需要迁移目录子树的路径消息;
B102、目标元数据节点获取需要迁移的目录子树到根目录路径上所有的目录节点的相关信息,创建缓存,并向源元数据节点发送确认信息;
B103、源元数据节点将要迁移的目录子树中的根节点以及其所有叶子结点中的目录节点数据打包发送到目标元数据节点;
B104、目标元数据节点将解包后的目录子树副本数据保存到步骤B102创建的缓存中;
B105、如果该被迁移的目录子树不存在副本,则跳转到步骤B107;否则,向所有拥有被迁移的目录子树副本的元数据节点发送目录子树迁移通知消息;
B106、所述拥有被迁移的目录子树副本的元数据节点修改被迁移目录子树的迁移状态,并发送确认消息;
B107、源元数据节点修改被迁移的目录子树的状态,并将目录子树中所有节点的导出信息打包发送到目标元数据节点中;
B108、目标元数据节点解包目录子树的导出信息,将其缓存到本地,并设置元数据信息的主副状态,再在副本集合中增加源元数据节点的记录,最后向源元数据节点发送确认信息;
B109、在源元数据节点上,如果该被迁移的目录子树不存在副本,则跳转到步骤B1011;否则,向所有拥有被迁移的目录子树副本的元数据节点发送导出通知信息,并修改迁移目录的迁移状态;
B1010、拥有被迁移的目录子树副本的元数据节点修改被迁移的目录子树的迁移状态,并向源元数据节点发送确认消息;
B1011、源元数据节点向目标元数据节点发送目录子树导出的完成消息,并解冻被迁移的目录子树;
B1012、目标元数据节点解冻被迁移的目录子树,迁移过程结束。
特别地,所述步骤A2具体包括:
A201、源元数据节点根据元数据节点的负载信息,选择n个负载大小满足预设要求并且元数据服务处于正常状态的元数据节点作为目录子树的备份元数据节点,并向这些被备份节点发送目录子树复制的通知信息,然后将该目录子树的访问热度调整为原有热度的1/n;
A202、备份元数据节点向源元数据节点发送复制目录子树的查询消息;
A203、源元数据节点将被查询的目录子树的相关数据打包发送给备份元数据节点;
A204、备份元数据节点将目录子树解包,将目录子树的相关数据加载到本地缓存,修改复制目录的副本信息。
本发明中元数据分布在元数据集群中的节点中,而不是内存容量受限的单一容量中,使得存储容量可横向扩展,并且元数据的分布使用动态分布策略,提高了分布式文件系统在企业应用环境所需的高可用性、存储容量以及访问性能的高可扩展性。
附图说明
图1为本发明实施例提供的元数据管理系统拓扑结构示意图;
图2为本发明实施例提供的元数据管理系统框图;
图3为本发明实施例提供的元数据管理方法流程图。
具体实施方式
下面结合附图和实施例对本发明作进一步说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部内容。
请参照图1和图2所示,本实施例中分布式文件系统中的元数据管理系统由多台元数据服务器101组成,元数据服务器101之间通过网络通信定期交互彼此的节点信息,包括节点的健康信息、节点的负载量以及节点的访问热度。其中,所述元数据服务器101包括:消息引擎201、节点监视器202、元数据管理模块203、元数据备份模块204、元数据日志模块205、目录热度监视器206、目录复制模块207以及目录迁移模块208。
所述消息引擎201用于负责与文件系统客户端2010和存储节点2011之间通信。
消息引擎201负责与文件系统客户端2010和存储节点2011之间通信,当文件系统客户端2010进行文件操作时,返回元数据信息,或者数据块映射信息,或者操作结果,并接收来自于存储节点2011定期上传的数据块映射信息。
所述节点监视器202用于维护元数据集群中的每个节点的健康信息。所述健康信息具体包括元数据节点的工作负载、访问热度以及心跳情况。
所述元数据管理模块203用于根据文件系统客户端2010的文件访问类型,完成对目录以及文件对像的操作请求。于本实施例,所述对目录以及文件对像的操作请求包括:新建目录、删除目录、读取目录、创建文件、删除文件以及重命名文件名称或者目录名称。
所述元数据备份模块204用于根据元数据的备份要求,将相关的目录对象对应的元数据备份到元数据集群中的其它元数据节点的数据库209中。
所述元数据日志模块205用于将文件系统客户端2010对文件系统操作的日志保存到本地。这样一来,当元数据节点发生故障异常退出时,可以根据保存的元数据日志恢复客户端对文件系统的操作,保持文件系统数据的一致性。
所述目录热度监视器206用于实时监测目录对象访问的频繁程度,并根据其它元数据节点的负载情况,对目录对象是否需要复制和迁移进行决策。
所述目录复制模块207用于根据目录热度监视器206发布的目录对象复制要求,完成目录对象向其它元数据节点的复制。
所述目录迁移模块208用于根据目录热度监视器206发布的目录对象迁移要求,完成目录对象向其它元数据节点的迁移。
基于上述元数据管理系统,本发明对应公开了一种元数据管理方法,如图3所示,该方法具体包括如下步骤:
步骤S301、根据元数据节点的负载,计算目录子树的访问频度,并根据该访问频度择出需要迁移的目录子树。
元数据节点通过节点监视器获取其它所有元数据节点的负载信息,并由负载最高的元数据节点计算出当前元数据集群的负载均衡度;当负载均衡度达到规定阈值时,通过节点监视器获取其它所有元数据节点的负载信息和目录访问热度信息,目录热度监视器计算目录需要迁移的阈值以及目录子树迁移的目标元数据节点集合。
步骤S302、将需要迁移的目录子树迁移到负载较低的元数据节点上,达到元数据集群负载均衡。
在目录子树迁移的目标元数据节点集合中,选取目录访问热度最低的元数据节点,查询该元数据节点的缓存中是否存在从目录访问热度最低的元数据节点迁入的目录,如果符合目录子树迁移条件,则将该类目录子树迁移到目录访问热度最低的元数据节点中;否则,在该元数据节点的目录中选择相应热度的目录子树迁移到目录访问热度最低的元数据节点中。
如果没有目录子树达到迁移的条件,则从目标子树迁移的元数据节点集合中选择下一个元数据节点,重复执行上述操作。
步骤S303、元数据节点根据目录的访问热度,将目录访问热度符合复制条件的目录子树复制到其它的元数据节点中形成副本。
于本实施例,所述目录子树迁移的具体过程如下:
一、源元数据节点的目录迁移模块接收到目录子树迁移的消息后,冻结该目录子树,并向目标元数据节点发送需要迁移目录子树的路径消息。
二、目标元数据节点获取需要迁移的目录子树到根目录路径上所有的目录节点的相关信息,创建缓存,并向源元数据节点发送确认信息。
三、源元数据节点将要迁移的目录子树中的根节点以及其所有叶子结点中的目录节点数据打包发送到目标元数据节点。
四、目标元数据节点将解包后的目录子树副本数据保存到步骤二创建的缓存中。
五、如果该被迁移的目录子树不存在副本,则跳转到步骤七;否则,向所有拥有被迁移的目录子树副本的元数据节点发送目录子树迁移通知消息。
六、所述拥有被迁移的目录子树副本的元数据节点修改被迁移目录子树的迁移状态,并发送确认消息。
七、源元数据节点修改被迁移的目录子树的状态,并将目录子树中所有节点的导出信息打包发送到目标元数据节点中。
八、目标元数据节点解包目录子树的导出信息,将其缓存到本地,并设置元数据信息的主副状态,再在副本集合中增加源元数据节点的记录,最后向源元数据节点发送确认信息。
九、在源元数据节点上,如果该被迁移的目录子树不存在副本,则跳转到步骤十一;否则,向所有拥有被迁移的目录子树副本的元数据节点发送导出通知信息,并修改迁移目录的迁移状态。
十、拥有被迁移的目录子树副本的元数据节点修改被迁移的目录子树的迁移状态,并向源元数据节点发送确认消息。
十一、源元数据节点向目标元数据节点发送目录子树导出的完成消息,并解冻被迁移的目录子树。
十二、目标元数据节点解冻被迁移的目录子树,迁移过程结束。
当元数据节点中的目录访问热度达到规定阈值时,启动目录子树的复制流程,其具体过程如下:
一、源元数据节点根据元数据节点的负载信息,选择n个负载大小满足预设要求并且元数据服务处于正常状态的元数据节点作为目录子树的备份元数据节点,并向这些被备份节点发送目录子树复制的通知信息,然后将该目录子树的访问热度调整为原有热度的1/n。其中,所述n为正整数,负载大小满足预设要求依据实际应用环境可灵活设定,本实施例中指负载较小。
二、备份元数据节点向源元数据节点发送复制目录子树的查询消息。
三、源元数据节点将被查询的目录子树的相关数据打包发送给备份元数据节点。
四、备份元数据节点将目录子树解包,将目录子树的相关数据加载到本地缓存,修改复制目录的副本信息。
本发明的技术方案提高了分布式文件系统在企业应用环境所需的高可用性、存储容量以及访问性能的高可扩展性。经过测试,使用本发明所述的元数据管理系统,分布式文件系统的平均性能提高了2-4倍,存储容量可以扩展到30-60PB,支持的最大文件数量为3亿左右,系统平均修复时间为30分钟。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重复调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (9)

1.一种元数据管理系统,其特征在于,包括:消息引擎、节点监视器、元数据管理模块、元数据备份模块、元数据日志模块、目录热度监视器、目录复制模块以及目录迁移模块;
所述消息引擎用于负责与文件系统客户端和存储节点之间通信;
所述节点监视器用于维护元数据集群中的每个节点的健康信息;
所述元数据管理模块用于根据文件系统客户端的文件访问类型,完成对目录以及文件对像的操作请求;
所述元数据备份模块用于根据元数据的备份要求,将相关的目录对象对应的元数据备份到元数据集群中的其它元数据节点中;
所述元数据日志模块用于将文件系统客户端对文件系统操作的日志保存到本地;
所述目录热度监视器用于实时监测目录对象访问的频繁程度,并根据其它元数据节点的负载情况,对目录对象是否需要复制和迁移进行决策;
所述目录复制模块用于根据目录热度监视器发布的目录对象复制要求,完成目录对象向其它元数据节点的复制;
所述目录迁移模块用于根据目录热度监视器发布的目录对象迁移要求,完成目录对象向其它元数据节点的迁移。
2.根据权利要求1所述的元数据管理系统,其特征在于,所述消息引擎具体用于:
负责与文件系统客户端和存储节点之间通信,当文件系统客户端进行文件操作时,返回元数据信息,或者数据块映射信息,或者操作结果,并接收来自于存储节点定期上传的数据块映射信息。
3.根据权利要求1所述的元数据管理系统,其特征在于,所述每个节点的健康信息包括元数据节点的工作负载、访问热度以及心跳情况。
4.根据权利要求1至3之一所述的元数据管理系统,其特征在于,所述对目录以及文件对像的操作请求包括:新建目录、删除目录、读取目录、创建文件、删除文件以及重命名文件名称或者目录名称。
5.一种元数据管理方法,其特征在于,包括如下步骤:
A、根据元数据节点的负载,计算目录子树的访问频度,并根据该访问频度择出需要迁移的目录子树;
B、将需要迁移的目录子树迁移到负载较低的元数据节点上,达到元数据集群负载均衡;
C、元数据节点根据目录的访问热度,将目录访问热度符合复制条件的目录子树复制到其它的元数据节点中形成副本。
6.根据权利要求5所述的元数据管理方法,其特征在于,所述步骤A具体包括:
A1、元数据节点通过节点监视器获取其它所有元数据节点的负载信息,并由负载最高的元数据节点计算出当前元数据集群的负载均衡度;当负载均衡度达到规定阈值时,执行步骤A2;
A2、通过节点监视器获取其它所有元数据节点的负载信息和目录访问热度信息,目录热度监视器计算目录需要迁移的阈值以及目录子树迁移的目标元数据节点集合。
7.根据权利要求6所述的元数据管理方法,其特征在于,所述步骤B具体包括:
B1、在目录子树迁移的目标元数据节点集合中,选取目录访问热度最低的元数据节点,查询该元数据节点的缓存中是否存在从目录访问热度最低的元数据节点迁入的目录,如果符合目录子树迁移条件,则将该类目录子树迁移到目录访问热度最低的元数据节点中;否则,在该元数据节点的目录中选择相应热度的目录子树迁移到目录访问热度最低的元数据节点中;
B2、如果没有目录子树达到迁移的条件,则从目标子树迁移的元数据节点集合中选择下一个元数据节点,重复执行步骤B1。
8.根据权利要求7所述的元数据管理方法,其特征在于,所述步骤B1具体包括:
B101、源元数据节点的目录迁移模块接收到目录子树迁移的消息后,冻结该目录子树,并向目标元数据节点发送需要迁移目录子树的路径消息;
B102、目标元数据节点获取需要迁移的目录子树到根目录路径上所有的目录节点的相关信息,创建缓存,并向源元数据节点发送确认信息;
B103、源元数据节点将要迁移的目录子树中的根节点以及其所有叶子结点中的目录节点数据打包发送到目标元数据节点;
B104、目标元数据节点将解包后的目录子树副本数据保存到步骤B102创建的缓存中;
B105、如果该被迁移的目录子树不存在副本,则跳转到步骤B107;否则,向所有拥有被迁移的目录子树副本的元数据节点发送目录子树迁移通知消息;
B106、所述拥有被迁移的目录子树副本的元数据节点修改被迁移目录子树的迁移状态,并发送确认消息;
B107、源元数据节点修改被迁移的目录子树的状态,并将目录子树中所有节点的导出信息打包发送到目标元数据节点中;
B108、目标元数据节点解包目录子树的导出信息,将其缓存到本地,并设置元数据信息的主副状态,再在副本集合中增加源元数据节点的记录,最后向源元数据节点发送确认信息;
B109、在源元数据节点上,如果该被迁移的目录子树不存在副本,则跳转到步骤B1011;否则,向所有拥有被迁移的目录子树副本的元数据节点发送导出通知信息,并修改迁移目录的迁移状态;
B1010、拥有被迁移的目录子树副本的元数据节点修改被迁移的目录子树的迁移状态,并向源元数据节点发送确认消息;
B1011、源元数据节点向目标元数据节点发送目录子树导出的完成消息,并解冻被迁移的目录子树;
B1012、目标元数据节点解冻被迁移的目录子树,迁移过程结束。
9.根据权利要求8所述的元数据管理方法,其特征在于,所述步骤A2具体包括:
A201、源元数据节点根据元数据节点的负载信息,选择n个负载大小满足预设要求并且元数据服务处于正常状态的元数据节点作为目录子树的备份元数据节点,并向这些被备份节点发送目录子树复制的通知信息,然后将该目录子树的访问热度调整为原有热度的1/n;
A202、备份元数据节点向源元数据节点发送复制目录子树的查询消息;
A203、源元数据节点将被查询的目录子树的相关数据打包发送给备份元数据节点;
A204、备份元数据节点将目录子树解包,将目录子树的相关数据加载到本地缓存,修改复制目录的副本信息。
CN2013102427878A 2013-06-18 2013-06-18 一种元数据管理系统及方法 Pending CN103279568A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2013102427878A CN103279568A (zh) 2013-06-18 2013-06-18 一种元数据管理系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2013102427878A CN103279568A (zh) 2013-06-18 2013-06-18 一种元数据管理系统及方法

Publications (1)

Publication Number Publication Date
CN103279568A true CN103279568A (zh) 2013-09-04

Family

ID=49062086

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2013102427878A Pending CN103279568A (zh) 2013-06-18 2013-06-18 一种元数据管理系统及方法

Country Status (1)

Country Link
CN (1) CN103279568A (zh)

Cited By (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103473337A (zh) * 2013-09-22 2013-12-25 北京航空航天大学 一种分布式存储系统中处理面向海量目录和文件的方法
CN103544254A (zh) * 2013-10-15 2014-01-29 华为技术有限公司 一种数据管理方法及装置
CN103581332A (zh) * 2013-11-15 2014-02-12 武汉理工大学 HDFS架构及HDFS架构中NameNode节点的压力分解方法
CN103617293A (zh) * 2013-12-16 2014-03-05 北京航空航天大学 一种面向海量小文件存储系统的Key-Value存储方法
CN103795801A (zh) * 2014-02-12 2014-05-14 浪潮电子信息产业股份有限公司 一种基于实时应用集群的元数据集群设计方法
CN103838682A (zh) * 2014-03-10 2014-06-04 华为技术有限公司 一种文件目录的读取方法和设备
CN104951475A (zh) * 2014-03-31 2015-09-30 中国电信股份有限公司 分布式文件系统和实现方法
CN105022796A (zh) * 2015-06-30 2015-11-04 北京奇艺世纪科技有限公司 一种文件遍历方法、装置及系统
WO2015184925A1 (zh) * 2014-10-24 2015-12-10 中兴通讯股份有限公司 分布式文件系统的数据处理方法及分布式文件系统
CN105530299A (zh) * 2015-12-12 2016-04-27 天津南大通用数据技术股份有限公司 目录服务日志的实现方法
CN106446197A (zh) * 2016-09-30 2017-02-22 华为数字技术(成都)有限公司 一种数据存储方法、装置及系统
CN106506605A (zh) * 2016-10-14 2017-03-15 华南理工大学 一种基于微服务架构的SaaS应用构建方法
CN106598744A (zh) * 2017-01-13 2017-04-26 郑州云海信息技术有限公司 一种元数据集群动态子树分区方法及装置
CN106686113A (zh) * 2017-01-19 2017-05-17 郑州云海信息技术有限公司 一种分布式文件系统智能预读实现方法
CN106844578A (zh) * 2017-01-07 2017-06-13 郑州云海信息技术有限公司 对元数据服务器所负载子树根目录进行查询的方法及装置
CN107480310A (zh) * 2017-09-29 2017-12-15 郑州云海信息技术有限公司 一种元数据集群目录动态负载平衡方法及系统
CN107689876A (zh) * 2016-08-04 2018-02-13 上海德拓信息技术股份有限公司 分布式对象存储系统中元数据的分布管理方法
CN107766159A (zh) * 2017-11-13 2018-03-06 郑州云海信息技术有限公司 一种元数据管理方法、装置和计算机可读存储介质
CN107888655A (zh) * 2017-10-09 2018-04-06 成都启航信息技术有限公司 一种目录服务数据管理方法及系统
WO2018113533A1 (zh) * 2016-12-22 2018-06-28 阿里巴巴集团控股有限公司 一种元数据迁移方法、装置、系统及设备
CN111125024A (zh) * 2019-11-29 2020-05-08 浪潮电子信息产业股份有限公司 一种分布式系统文件的删除方法、装置、设备及存储介质
US10754784B1 (en) 2019-06-07 2020-08-25 Stellus Technologies, Inc. Mechanism for a cache to self-tune efficiently to allow scaling with the size of working set
CN111625192A (zh) * 2020-05-22 2020-09-04 浪潮电子信息产业股份有限公司 一种元数据对象访问方法、装置、设备以及介质
CN111694808A (zh) * 2019-03-15 2020-09-22 阿里巴巴集团控股有限公司 一种数据处理方法、装置及计算设备
US20200349014A1 (en) * 2019-04-30 2020-11-05 Clumio, Inc. Post-Processing in a Cloud-Based Data Protection Service
CN112527880A (zh) * 2020-12-16 2021-03-19 平安壹钱包电子商务有限公司 大数据集群元数据信息的采集方法、装置、设备及介质
CN113055448A (zh) * 2021-02-28 2021-06-29 新华三信息技术有限公司 一种元数据管理方法及装置
CN114785813A (zh) * 2022-06-23 2022-07-22 四川野马科技有限公司 一种工程造价cos成果文件格式化存储方法及系统
CN115952005A (zh) * 2023-02-24 2023-04-11 浪潮电子信息产业股份有限公司 一种元数据负载均衡方法、装置、设备及可读存储介质
CN116490847A (zh) * 2020-11-05 2023-07-25 阿里巴巴集团控股有限公司 支持分布式文件系统中的垃圾收集的虚拟数据复制
US12001397B2 (en) 2019-11-29 2024-06-04 Inspur Electronic Information Industry Co., Ltd. Method, apparatus and device for deleting distributed system file, and storage medium

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120059803A1 (en) * 2010-09-04 2012-03-08 International Business Machines Corporation Disk scrubbing
CN103150394A (zh) * 2013-03-25 2013-06-12 中国人民解放军国防科学技术大学 面向高性能计算的分布式文件系统元数据管理方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120059803A1 (en) * 2010-09-04 2012-03-08 International Business Machines Corporation Disk scrubbing
CN103150394A (zh) * 2013-03-25 2013-06-12 中国人民解放军国防科学技术大学 面向高性能计算的分布式文件系统元数据管理方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
薛伟等: ""一种分布式元数据的动态管理系统"", 《计 算 机 工 程》 *

Cited By (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103473337A (zh) * 2013-09-22 2013-12-25 北京航空航天大学 一种分布式存储系统中处理面向海量目录和文件的方法
CN103544254A (zh) * 2013-10-15 2014-01-29 华为技术有限公司 一种数据管理方法及装置
CN103544254B (zh) * 2013-10-15 2017-10-10 华为技术有限公司 一种数据管理方法及装置
CN103581332A (zh) * 2013-11-15 2014-02-12 武汉理工大学 HDFS架构及HDFS架构中NameNode节点的压力分解方法
CN103581332B (zh) * 2013-11-15 2017-05-24 武汉理工大学 HDFS架构及HDFS架构中NameNode节点的压力分解方法
CN103617293A (zh) * 2013-12-16 2014-03-05 北京航空航天大学 一种面向海量小文件存储系统的Key-Value存储方法
CN103795801A (zh) * 2014-02-12 2014-05-14 浪潮电子信息产业股份有限公司 一种基于实时应用集群的元数据集群设计方法
CN103838682A (zh) * 2014-03-10 2014-06-04 华为技术有限公司 一种文件目录的读取方法和设备
CN104951475A (zh) * 2014-03-31 2015-09-30 中国电信股份有限公司 分布式文件系统和实现方法
CN104951475B (zh) * 2014-03-31 2018-10-23 中国电信股份有限公司 分布式文件系统和实现方法
WO2015184925A1 (zh) * 2014-10-24 2015-12-10 中兴通讯股份有限公司 分布式文件系统的数据处理方法及分布式文件系统
CN105022796B (zh) * 2015-06-30 2019-03-15 北京奇艺世纪科技有限公司 一种文件遍历方法、装置及系统
CN105022796A (zh) * 2015-06-30 2015-11-04 北京奇艺世纪科技有限公司 一种文件遍历方法、装置及系统
CN105530299B (zh) * 2015-12-12 2019-04-23 天津南大通用数据技术股份有限公司 目录服务日志的实现方法
CN105530299A (zh) * 2015-12-12 2016-04-27 天津南大通用数据技术股份有限公司 目录服务日志的实现方法
CN107689876A (zh) * 2016-08-04 2018-02-13 上海德拓信息技术股份有限公司 分布式对象存储系统中元数据的分布管理方法
CN106446197A (zh) * 2016-09-30 2017-02-22 华为数字技术(成都)有限公司 一种数据存储方法、装置及系统
CN106446197B (zh) * 2016-09-30 2019-11-19 华为数字技术(成都)有限公司 一种数据存储方法、装置及系统
CN106506605A (zh) * 2016-10-14 2017-03-15 华南理工大学 一种基于微服务架构的SaaS应用构建方法
CN106506605B (zh) * 2016-10-14 2020-09-22 华南理工大学 一种基于微服务架构的SaaS应用构建方法
WO2018113533A1 (zh) * 2016-12-22 2018-06-28 阿里巴巴集团控股有限公司 一种元数据迁移方法、装置、系统及设备
CN106844578A (zh) * 2017-01-07 2017-06-13 郑州云海信息技术有限公司 对元数据服务器所负载子树根目录进行查询的方法及装置
CN106598744A (zh) * 2017-01-13 2017-04-26 郑州云海信息技术有限公司 一种元数据集群动态子树分区方法及装置
CN106686113A (zh) * 2017-01-19 2017-05-17 郑州云海信息技术有限公司 一种分布式文件系统智能预读实现方法
CN107480310B (zh) * 2017-09-29 2020-09-04 郑州云海信息技术有限公司 一种元数据集群目录动态负载平衡方法及系统
CN107480310A (zh) * 2017-09-29 2017-12-15 郑州云海信息技术有限公司 一种元数据集群目录动态负载平衡方法及系统
CN107888655A (zh) * 2017-10-09 2018-04-06 成都启航信息技术有限公司 一种目录服务数据管理方法及系统
CN107766159A (zh) * 2017-11-13 2018-03-06 郑州云海信息技术有限公司 一种元数据管理方法、装置和计算机可读存储介质
CN111694808A (zh) * 2019-03-15 2020-09-22 阿里巴巴集团控股有限公司 一种数据处理方法、装置及计算设备
CN111694808B (zh) * 2019-03-15 2023-12-29 阿里巴巴集团控股有限公司 一种数据处理方法、装置及计算设备
US20200349014A1 (en) * 2019-04-30 2020-11-05 Clumio, Inc. Post-Processing in a Cloud-Based Data Protection Service
US11888935B2 (en) * 2019-04-30 2024-01-30 Clumio, Inc. Post-processing in a cloud-based data protection service
US11388233B2 (en) 2019-04-30 2022-07-12 Clumio, Inc. Cloud-based data protection service
US10754784B1 (en) 2019-06-07 2020-08-25 Stellus Technologies, Inc. Mechanism for a cache to self-tune efficiently to allow scaling with the size of working set
CN111125024A (zh) * 2019-11-29 2020-05-08 浪潮电子信息产业股份有限公司 一种分布式系统文件的删除方法、装置、设备及存储介质
US12001397B2 (en) 2019-11-29 2024-06-04 Inspur Electronic Information Industry Co., Ltd. Method, apparatus and device for deleting distributed system file, and storage medium
CN111125024B (zh) * 2019-11-29 2022-05-24 浪潮电子信息产业股份有限公司 一种分布式系统文件的删除方法、装置、设备及存储介质
CN111625192A (zh) * 2020-05-22 2020-09-04 浪潮电子信息产业股份有限公司 一种元数据对象访问方法、装置、设备以及介质
CN111625192B (zh) * 2020-05-22 2022-07-05 浪潮电子信息产业股份有限公司 一种元数据对象访问方法、装置、设备以及介质
CN116490847A (zh) * 2020-11-05 2023-07-25 阿里巴巴集团控股有限公司 支持分布式文件系统中的垃圾收集的虚拟数据复制
CN112527880B (zh) * 2020-12-16 2023-08-08 平安壹钱包电子商务有限公司 大数据集群元数据信息的采集方法、装置、设备及介质
CN112527880A (zh) * 2020-12-16 2021-03-19 平安壹钱包电子商务有限公司 大数据集群元数据信息的采集方法、装置、设备及介质
CN113055448A (zh) * 2021-02-28 2021-06-29 新华三信息技术有限公司 一种元数据管理方法及装置
CN114785813B (zh) * 2022-06-23 2022-11-04 四川野马科技有限公司 一种工程造价cos成果文件格式化存储系统
CN114785813A (zh) * 2022-06-23 2022-07-22 四川野马科技有限公司 一种工程造价cos成果文件格式化存储方法及系统
CN115952005A (zh) * 2023-02-24 2023-04-11 浪潮电子信息产业股份有限公司 一种元数据负载均衡方法、装置、设备及可读存储介质

Similar Documents

Publication Publication Date Title
CN103279568A (zh) 一种元数据管理系统及方法
JP5087467B2 (ja) コンピュータストレージシステムにおいてデータ圧縮並びに整合性を管理する方法および装置
CN107423426B (zh) 一种区块链块数据的数据归档方法及电子设备
JP6109967B2 (ja) データストレージシステムにおけるクローンオブジェクトのオブジェクトレベルでの複製
US9703504B2 (en) Storage system, recording medium storing data rebalancing program, and data rebalancing method
US8307019B2 (en) File management method and storage system
JP5556816B2 (ja) 分散ストレージシステム、分散ストレージ方法および分散ストレージ用プログラムとストレージノード
US20150213049A1 (en) Asynchronous backend global deduplication
US8930364B1 (en) Intelligent data integration
CA2935215A1 (en) Hierarchical chunking of objects in a distributed storage system
CN113168404B (zh) 用于在分布式数据库系统中复制数据的系统和方法
US10146694B1 (en) Persistent cache layer in a distributed file system
US20130219125A1 (en) Cache employing multiple page replacement algorithms
US7185030B2 (en) Storage system storing a file with multiple different formats and method thereof
CN104735110A (zh) 元数据管理方法和系统
US10558547B2 (en) Methods for proactive prediction of disk failure in a RAID group and devices thereof
CN104902009A (zh) 一种基于可擦除编码和链式备份的分布式存储系统
US20220342853A1 (en) Methods for managing storage in a distributed de-duplication system and devices thereof
US11061868B1 (en) Persistent cache layer to tier data to cloud storage
CN102023816A (zh) 一种对象存储系统的对象存放策略和访问方法
US10331362B1 (en) Adaptive replication for segmentation anchoring type
JP2006293593A (ja) 計算機システム
CN107943615B (zh) 基于分布式集群的数据处理方法与系统
US20190129802A1 (en) Backup within a file system using a persistent cache layer to tier data to cloud storage
EP3146442B1 (en) Methods and apparatus for storing electronic documents

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20130904

RJ01 Rejection of invention patent application after publication