分布式文件系统管理方法和装置
技术领域
本发明涉及云存储技术领域,特别涉及一种分布式文件系统管理方法和装置。
背景技术
目前的分布式文件系统乃至分布式存储领域,都涉及一个元数据管理的问题。目前通用的架构基本分为三种:集中式元数据、分组集群管理式元数据、无主散列式管理。
在集中式元数据管理中,分布式文件系统配置一或者一对服务器集中管理元数据,则对于海量并发的时候,元数据的数据访问平面势必影响系统对于目录或文件属性的访问请求,甚至超时乃至失败。
在分组集群管理式元数据中,分布式文件系统配置多个元数据服务器,组成集群对外统一服务,当海量并发的业务模型下,各集群的元数据一致性难以保证,对于集中元数据访问跳转节点太多,容易导致失败或数据错误。
在无主散列式管理中,对于分布式文件系统来自元数据的访问请求,在大并发量的业务模型下,需要轮询所有节点获取元数据再组成目录镜像对外服务,效率低下且一致性维护极其困难。
目前这三种架构,在元数据大规模并发访问的情况下,都会对分布式文件系统整体访问造成输入输出I/O瓶颈,甚至导致失败,从而降低了云存储系统的文件并发量级,降低了云存储系统进行查询服务请求的效率和增大了云存储系统的存储成本。
发明内容
针对现有技术的上述缺陷,本发明所要解决的技术问题是如何实现提高分布式文件系统的管理效率。
为实现上述目的,一方面,本发明提供一种分布式文件系统管理方法,该方法包括步骤:
接收目录和/或文件的创建和/或修改信息;
元数据节点创建和/或修改元数据信息;
元数据节点向虚拟元数据目录树模块发起变更请求;
虚拟元数据目录树模块根据变更请求更新目录管理树。
优选地,该方法还包括:
收到目录和/或文件查询请求,访问目录管理树获得查询结果。
优选地,该方法还包括:
如果当前元数据节点查的主机宕机,则启用备机接管服务,保证管理不中断。
优选地,备机接管服务后,当超过预设老化时长,主机仍无法启用,则重新构建所述目录管理树至其他备机。
优选地,所述目录管理树为目录管理B加树,且存储在内存。
优选地,该方法还包括:
如果创建和/或修改文件请求需求超过预设值,根据最近最少使用算法修改内存目录管理树。
另一发明,本发明提供一种分布式文件系统管理装置,包括:
信息接收单元,用于接收目录和/或文件的创建和/或修改信息;
信息修改单元,用于实现元数据节点创建和/或修改元数据信息;
变更请求单元,用于实现元数据节点向虚拟元数据目录树模块发起变更请求;
信息更新单元,用于实现虚拟元数据目录树模块根据变更请求更新目录管理树。
优选地,该装置还包括:
访问单元,用于收到目录和/或文件查询请求,访问目录管理树获得查询结果。
优选地,该装置还包括:
主备切换单元,用于如果当前元数据节点查的主机宕机,则启用备机接管服务,保证管理不中断。
优选地,主备切换单元进一步包括:重建单元,用于备机接管服务后,当超过预设老化时长,主机仍无法启用,则重新构建所述目录管理树至其他备机。
本发明提供的分布式系统管理方法和装置中,采用了基于分布式技术的信息集中化管理思维方法,实现了离散元数据信息的统一管理,使分布式文件系统具备提供元数据查询服务的能力,而并不占用分布式文件系统正常数据访问带宽。与现有技术相比,提高了云存储系统的文件并发量级,达到了满足高并发下完全不影响系统查询服务请求的良好支持效果,取得了高效存储和节约存储成本效果。
附图说明
图1是本发明一个实施例中的分布式文件系统管理方法的流程示意图;
图2是本发明另一个实施例中的分布式文件系统管理装置的结构示意图。
具体实施方式
为使本领域技术人员更好地理解本发明的技术方案,下面结合附图和具体实施方式对本发明作进一步详细描述。
现有技术中的分布式文件系统中,采用集中式元数据管理、分组集群管理式元数据和无主散列式管理中,目前这三种架构,在元数据大规模并发访问的情况下,都会对分布式文件系统整体访问造成输入输出瓶颈,甚至导致失败。本发明提供一种基于元数据目录树镜像的分布式文件系统管理方法和装置,采用逻辑上的分布,并不需要单独的物理元数据服务器载体,可动态生成且迁移,为分布式文件系统提供目录、文件,目录树级别的元数据查询服务,而不需要轮询所有节点获取,也不占用高并发时元数据/数据的访问带宽,提高分布式系统的访问效率,进一步在云存储领域发挥集群云化的成本优势。
图1是本发明一个实施例中的分布式文件系统管理方法的流程示意图,如图1所示,该方法包括步骤:
步骤S1、接收目录和/或文件的创建和/或修改信息;
步骤S2、元数据节点创建和/或修改元数据信息;
步骤S3、元数据节点向虚拟元数据目录树单元发起变更请求;
步骤S4、虚拟元数据目录树单元根据变更请求更新目录管理树。
优选地,该方法还包括:
步骤S6、收到目录和/或文件查询请求,访问目录管理树获得查询结果。
优选地,该方法还包括:
步骤S7、如果当前元数据节点查的主机宕机,则启用备机接管服务,保证管理不中断。
优选地,备机接管服务后,当超过预设老化时长,主机仍无法启用,则重新构建所述目录管理树至其他备机。
优选地,目录管理树为目录管理B加树,且存储在内存。
优选地,如果创建和/或修改文件请求需求超过预设值,根据最近最少使用算法修改内存目录管理树
本领域相关技术人员应能理解,与本发明的方法相对应的,本发明还同时包括一种分布式文件系统管理装置,与上述方法步骤一一对应地,如图2所示,该分布式文件系统管理装置包括:信息接收单元201、信息修改单元202、变更请求单元203和信息更新单元204,其中,信息接收单元201用于接收目录和/或文件的创建和/或修改信息;信息修改单元202用于实现元数据节点创建和/或修改元数据信息;变更请求单元203用于实现元数据节点向虚拟元数据目录树模块发起变更请求;信息更新单元204用于实现虚拟元数据目录树模块根据变更请求更新目录管理树。
优选地,该分布式文件系统管理装置还包括:访问单元205,用于收到目录和/或文件查询请求,访问目录管理树获得查询结果。
优选地,该分布式文件系统管理装置还包括:主备机切换单元206,用于如果当前元数据节点查的主机宕机,则启用备机接管服务,保证管理不中断。具体地,在如果当前系统宕机时,则备机接管服务,保证查询请求不中断,且设置老化时长策略,超过时长系统构建虚拟逻辑目录树到其他节点,保证系统主备镜像单元备份。
优选地,所述变更请求单元203具体包括:
集中分散单元2031,用于集中或者分散元数据节点向虚拟元数据目录树单元发起变更请求,虚拟元数据目录树单元更新目录管理B加树,且保留至系统内存。
优选地,该分布式文件系统管理装置还包括:重建单元206,用于备机接管服务后,当超过预设老化时长,主机仍无法启用,则重新构建所述目录管理树至其他备机。
具体地,在分布式文件系统收到创建和/或修改目录和/或文件的请求后,在虚拟目录树管理模块生成和更新目录树节点信息,且更改目录树仅为系统收到目录、文件查询请求对外服务,不占用集群整体对外服务带宽,并利用系统28服务原则,20%的经常被访问的热点文件可以常驻内存,80%的冷数据常驻持久化存储,如廉价机械式硬盘,使得该系统资源利用率高。本发明中,28比例原则为较优方案,具体比例可配置。
本发明所使用的方法,采用了基于分布式技术的信息集中化管理思维方法,实现了离散元数据信息的统一管理,使系统具备提供元数据查询服务的能力,而并不占用系统正常数据访问带宽。与现有技术相比,提高了云存储系统的文件并发量级,达到了满足高并发下完全不影响系统查询服务请求的良好支持效果,取得了高效存储和节约存储成本效果。
可以理解的是,以上实施方式仅仅是为了说明本发明的原理而采用的示例性实施方式,然而本发明并不局限于此。对于本领域内的普通技术人员而言,在不脱离本发明的精神和实质的情况下,可以做出各种变型和改进,这些变型和改进也视为本发明的保护范围。