CN103544322A - 基于服务器集群的热点元数据管理方法 - Google Patents
基于服务器集群的热点元数据管理方法 Download PDFInfo
- Publication number
- CN103544322A CN103544322A CN201310552106.8A CN201310552106A CN103544322A CN 103544322 A CN103544322 A CN 103544322A CN 201310552106 A CN201310552106 A CN 201310552106A CN 103544322 A CN103544322 A CN 103544322A
- Authority
- CN
- China
- Prior art keywords
- metadata
- subtree
- catalogue
- present
- access
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/18—File system types
- G06F16/182—Distributed file systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种基于服务器集群的热点元数据管理方法,该发明应用于分布式文件系统中的元数据服务器集群中,由元数据访问监控、元数据访问控制、目录树信息管理、目录子树信息管理、目录子树拆分、元数据迁移六个模块组成。该发明完成了系统对元数据访问的实时监控、元数据访问的可控性和目录子树分割形式的一致性等功能,达到了系统在出现热点元数据的情形下实现负载均衡的目标。
Description
技术领域
本发明涉及基于服务器集群的热点元数据管理方法,该方法应用于采用服务器集群的分布式文件系统中,可提高热点元数据的访问速度,属于信息领域。
背景技术
云计算、大数据和虚拟化场景等新兴技术与服务均是依赖于海量数据的存储,应用于海量数据存储的分布式文件系统在这些领域中都发挥着很重要的作用,因此分布式文件系统的性能提升也必然会促进这些新兴技术与服务的进步。然而,分布式文件系统在设计目标、体系结构、系统规模、性能、可扩展性、可用性等方面都有别于传统的文件系统。
目前应用较为广泛的分布式文件系统,比如HDFS、MooseFS和TFS均把文件分成两部分,一部分是文件的元数据(Metadata),包括文件名、属性和权限、修改时间等信息,另外一部分是文件的数据(即文件内容,简称数据)。这两部分数据在分布式文件系统中被存储到不同的服务器中。在某些分布式文件系统中采用了一台服务器来存储所有文件的元数据,这个服务器称为元数据服务器(简称为MDS),但采用一台元数据服务器管理元数据要比采用多台元数据服务器(元数据服务器集群)管理的方式来说,在可靠性、可用性以及可扩展性等方面要逊色很多。
此外,分布式文件系统中文件读写操作与元数据密切相关,元数据管理效率的高低在很大程度上影响了整个分布式文件系统读写性能。因此,有越来越多的分布式文件系统采用元数据服务器集群来管理元数据。
使用元数据服务器集群管理元数据会涉及到元数据分配策略问题,目前使用较为普遍的方式是子树分割法,子树分割法包括静态子树分割法和动态子树分割法。静态子树分割法通过系统管理员的操作将文件目录(称为目录树)分割成多个目录子树(子目录),并将这些目录子树部署到多台MDS上,单台MDS仅负责管理单个目录子树,静态子树分割法的优点是管理简单,但缺点是当出现用户对某个目录子树下的元数据(热点元数据)进行集中访问时就会出现存储热点元数据的那台MDS负载过重的情况。子树分割法中第二种是动态子树分割法,它能够将负载动态地分配到每台MDS上,但是当出现复杂的目录树结构或者是执行重命名等操作时,会出现大量的元数据迁移,并且按这种方式构建的系统的结构也十分复杂。
本发明提出基于服务器集群的热点元数据管理方法,综合了静态子树分割法和动态子树分割法的优点,在保证系统结构较为简单的同时,能够进行负载均衡,解决热点元数据的集中访问问题。
发明内容
本发明“基于服务器集群的热点元数据管理方法”由元数据访问监控、元数据访问控制、目录树信息管理、目录子树信息管理、目录子树拆分、元数据迁移六个模块组成。下面详细介绍基于服务器集群的热点元数据管理方法的结构和各个组成部分的内容。
(1)本发明构架
为了实现本发明“基于服务器集群的热点元数据管理方法”,要求对现有的分布式文件系统的多元数据服务器集群的体系结构进行修改,本发明形成的热点元数据管理架构如图1所示。
(2)本发明的六个组成模块
本发明“基于服务器集群的热点元数据管理方法”由元数据访问监控、元数据访问控制、目录树信息管理、目录子树信息管理、目录子树拆分、元数据迁移六个模块组成。以下就各功能模块及其方法作详细说明。
●元数据访问监控:该模块用于监控每个目录子树的元数据访问情况。这里首先定义目录子树的访问热度和访问热度的阈值。每个目录子树都对应一个访问热度,每到来一个用户的元数据请求时,相应目录子树的访问热度增1,等待时间T后,访问热度减1。当目录子树的访问热度达到访问热度的阈值后,元数据成为热点元数据。当该模块监测到某个目录子树出现热点元数据时,则通知目录子树信息管理模块需要对这个目录子树进行拆分。
●元数据访问控制:该模块用于响应具体的元数据访问请求,建立用户与具体MDS间的通信。当系统在进行目录子树的拆分操作时,会涉及到元数据迁移操作,为保护元数据的安全性和一致性,元数据访问控制模块会暂时将对热点元数据的访问请求置于等待状态,并存入等待队列中,直到目录子树完成拆分操作,并向目录树信息管理模块和目录子树信息管理模块反馈相应的信息后,再开始处理处于等待状态的元数据访问请求。
●目录树信息管理:该模块负责管理每个目录子树间的层次关系,以保障系统能够根据用户提供的文件或目录的绝对路径定位到正确的目录子树上。在系统部署时,由系统管理员对最初目录树进行人工拆分,将拆分得到的目录子树部署到不同的MDS上。
●目录子树信息管理:该模块用于管理系统中所有的目录子树,保存每个目录子树的位置信息,即每个目录子树位于哪台MDS上。
●目录子树的拆分:该模块的主要功能包括两个,即目录子树的分割和目录子树的复制。该模块会对出现热点元数据的目录子树进行分割或复制,形成多个新的目录子树,具体的方式如图2所示。这里将仅拥有单个目录的目录子树结构称为简单类型,否则称之为复杂类型。如果出现热点元数据的目录子树结构为复杂类型,如图2中左侧所示,则将其拆成多个简单类型的目录子树。如果出现热点元数据的目录子树结构为简单类型,如图2中右侧所示,则将目录子树进行复制,形成多个简单类型的目录子树,并通过加锁机制,保障元数据的安全性和一致性。在完成目录子树的拆分操作后,再根据元数据服务器集群中每台MDS的负载情况,将新的目录子树部署到负载较低的MDS上。
●元数据迁移:该模块用于实现元数据迁移的功能。在进行目录子树的拆分操作时,该模块具体实现将新目录子树迁移到负载低的MDS上。
(3)本发明各模块的执行流程
为了说明本发明的执行流程,图3从热点元数据的出现到系统完成负载均衡的整个过程描述了本发明各模块之间的关系和本发明的执行流程,本发明的具体执行流程如下:
●热点元数据监测阶段:元数据访问监控模块监测到某台MDS出现热点元数据,通知元数据访问控制模块阻塞对该目录子树的元数据访问请求,并通知目录子树信息管理模块需要对该目录子树进行拆分,以及哪些MDS负载较低,适合分担负载。
●负载均衡阶段:对出现热点元数据的目录子树进行拆分操作。并调用元数据迁移模块,将热点元数据从原MDS迁移到新MDS上。
●目录树信息更新阶段:在上述操作完成之后,目录树信息管理模块和目录子树信息管理模块需要完成相应信息的更新。
●元数据访问恢复阶段:在目录树信息更新完成后,通知元数据访问控制模块解除对该目录子树元数据访问请求的阻塞,恢复元数据访问请求。
附图说明
图1基于服务器集群的热点元数据管理方法的系统结构
图2目录子树的拆分策略
图3本发明各模块的执行流程
图4系统在出现热点元数据时实现负载均衡的例子
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例也仅仅是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了说明“基于服务器集群的热点元数据管理方法”,这里给出一个“在MDS1出现热点元数据的情形下,系统实现负载均衡”的例子。
●热点元数据监测阶段:元数据访问监控模块检测到MDS1上出现热点元数据,通知元数据访问控制模块阻塞用户a、b、c对热点元数据的访问请求,并将这些访问请求存入等待队列中。通知目录子树信息管理模块MDS1上的目录子树A需要进行拆分,并告知其MDS2和MDS3上的负载较低,适合分担负载。
●负载均衡阶段:目录子树的拆分模块对目录子树A进行拆分,如图4所示,将目录子树A拆分为新的目录子树E和F,并记录拆分后的目录子树对象的层次关系。在拆分完成后,调用元数据迁移模块,原先存于MDS1中的新目录子树E和F迁移至MDS2和MDS3下。
●目录树信息更新阶段:如图4所示,在目录子树信息管理模块中,用新目录子树E和F取代原目录子树A。在目录树信息管理模块中,用新目录子树E和F的层次关系取代原目录子树A在目录树中的位置。
●元数据访问恢复阶段:通知元数据访问控制模块模块恢复用户a、b、c的元数据访问请求,处理保存在等待队列中的元数据访问请求。
本发明的优势
本发明涉及基于服务器集群的热点元数据管理方法,本发明应用于目前分布式文件系统的元数据管理中。本发明的优点主要有四个:
(1)负载均衡的相对性:本发明仅对出现热点元数据的目录子树采用了负载均衡机制,从而保证了系统结构的简单稳定和系统运行的高效性。
(2)元数据访问的实时监控性:本发明对用户的元数据访问采用了实时监控机制,记录了每个目录子树的访问热度,可以实时地监控元数据的访问情况,并及时发现热点元数据的出现。
(3)元数据访问的可控性:本发明对用户的元数据访问请求采用了控制机制。通过对用户的元数据访问请求的控制,在进行目录子树的负载均衡操作期间中,保障了元数据的安全性和一致性。
(4)目录子树分割形式的一致性:本发明采用了统一的目录子树拆分方法,保障了系统结构的稳定性。
Claims (5)
1.本发明涉及一种基于服务器集群的热点元数据管理方法,该方法应用于采用服务器集群的分布式文件系统中,以提高热点元数据的访问速度。本发明由元数据访问监控、元数据访问控制、目录树信息管理、目录子树信息管理、目录子树拆分、元数据迁移六个模块组成。
2.根据权利要求书(1)所述的方法,其特征在于本发明提出了相对的负载均衡,仅对出现热点元数据的目录子树采用了负载均衡机制。
3.根据权利要求书(1)所述的方法,其特征在于本发明对用户的元数据访问采用了实时监控机制。
4.根据权利要求书(1)所述的方法,其特征在于本发明对用户的元数据访问请求采用了控制机制。
5.根据权利要求书(1)所述的方法,其特征在于本发明采用了统一的目录子树拆分方法,并提出了拆分目录子树的标准形式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310552106.8A CN103544322A (zh) | 2013-11-08 | 2013-11-08 | 基于服务器集群的热点元数据管理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310552106.8A CN103544322A (zh) | 2013-11-08 | 2013-11-08 | 基于服务器集群的热点元数据管理方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103544322A true CN103544322A (zh) | 2014-01-29 |
Family
ID=49967774
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310552106.8A Pending CN103544322A (zh) | 2013-11-08 | 2013-11-08 | 基于服务器集群的热点元数据管理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103544322A (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105630903A (zh) * | 2015-12-21 | 2016-06-01 | 中国电子科技集团公司第十五研究所 | 一种海量数据快速存储的方法和装置 |
CN106446197A (zh) * | 2016-09-30 | 2017-02-22 | 华为数字技术(成都)有限公司 | 一种数据存储方法、装置及系统 |
CN106599102A (zh) * | 2016-11-29 | 2017-04-26 | 郑州云海信息技术有限公司 | 一种基于目录切分机制的元数据性能提升方法 |
CN106649608A (zh) * | 2016-11-29 | 2017-05-10 | 郑州云海信息技术有限公司 | 分布式文件系统小文件性能提升方法、目录生成器及系统 |
CN107402870A (zh) * | 2017-07-31 | 2017-11-28 | 郑州云海信息技术有限公司 | 一种元数据服务器中日志段的处理方法及装置 |
CN107590249A (zh) * | 2017-09-18 | 2018-01-16 | 郑州云海信息技术有限公司 | 一种分布式文件系统的负载平衡方法、装置及设备 |
CN107689876A (zh) * | 2016-08-04 | 2018-02-13 | 上海德拓信息技术股份有限公司 | 分布式对象存储系统中元数据的分布管理方法 |
CN114415971A (zh) * | 2022-03-25 | 2022-04-29 | 阿里云计算有限公司 | 数据处理方法以及装置 |
CN118170718A (zh) * | 2024-05-13 | 2024-06-11 | 中移(苏州)软件技术有限公司 | 元数据管理方法、装置、电子设备、介质及芯片 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7328225B1 (en) * | 2002-03-27 | 2008-02-05 | Swsoft Holdings, Ltd. | System, method and computer program product for multi-level file-sharing by concurrent users |
CN102904949A (zh) * | 2012-10-08 | 2013-01-30 | 华中科技大学 | 一种基于副本的动态元数据集群系统 |
CN103106207A (zh) * | 2011-11-10 | 2013-05-15 | 中国移动通信集团公司 | 一种对象存储系统中元数据分布的方法和设备 |
CN103150394A (zh) * | 2013-03-25 | 2013-06-12 | 中国人民解放军国防科学技术大学 | 面向高性能计算的分布式文件系统元数据管理方法 |
-
2013
- 2013-11-08 CN CN201310552106.8A patent/CN103544322A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7328225B1 (en) * | 2002-03-27 | 2008-02-05 | Swsoft Holdings, Ltd. | System, method and computer program product for multi-level file-sharing by concurrent users |
CN103106207A (zh) * | 2011-11-10 | 2013-05-15 | 中国移动通信集团公司 | 一种对象存储系统中元数据分布的方法和设备 |
CN102904949A (zh) * | 2012-10-08 | 2013-01-30 | 华中科技大学 | 一种基于副本的动态元数据集群系统 |
CN103150394A (zh) * | 2013-03-25 | 2013-06-12 | 中国人民解放军国防科学技术大学 | 面向高性能计算的分布式文件系统元数据管理方法 |
Non-Patent Citations (1)
Title |
---|
钱伟: "元数据服务器集群负载均衡技术的研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105630903B (zh) * | 2015-12-21 | 2020-02-21 | 中国电子科技集团公司第十五研究所 | 一种海量数据快速存储的方法和装置 |
CN105630903A (zh) * | 2015-12-21 | 2016-06-01 | 中国电子科技集团公司第十五研究所 | 一种海量数据快速存储的方法和装置 |
CN107689876A (zh) * | 2016-08-04 | 2018-02-13 | 上海德拓信息技术股份有限公司 | 分布式对象存储系统中元数据的分布管理方法 |
CN106446197A (zh) * | 2016-09-30 | 2017-02-22 | 华为数字技术(成都)有限公司 | 一种数据存储方法、装置及系统 |
CN106446197B (zh) * | 2016-09-30 | 2019-11-19 | 华为数字技术(成都)有限公司 | 一种数据存储方法、装置及系统 |
CN106649608A (zh) * | 2016-11-29 | 2017-05-10 | 郑州云海信息技术有限公司 | 分布式文件系统小文件性能提升方法、目录生成器及系统 |
CN106599102A (zh) * | 2016-11-29 | 2017-04-26 | 郑州云海信息技术有限公司 | 一种基于目录切分机制的元数据性能提升方法 |
CN107402870A (zh) * | 2017-07-31 | 2017-11-28 | 郑州云海信息技术有限公司 | 一种元数据服务器中日志段的处理方法及装置 |
CN107402870B (zh) * | 2017-07-31 | 2020-10-16 | 苏州浪潮智能科技有限公司 | 一种元数据服务器中日志段的处理方法及装置 |
CN107590249A (zh) * | 2017-09-18 | 2018-01-16 | 郑州云海信息技术有限公司 | 一种分布式文件系统的负载平衡方法、装置及设备 |
CN114415971A (zh) * | 2022-03-25 | 2022-04-29 | 阿里云计算有限公司 | 数据处理方法以及装置 |
CN114415971B (zh) * | 2022-03-25 | 2022-09-23 | 阿里云计算有限公司 | 数据处理方法以及装置 |
CN118170718A (zh) * | 2024-05-13 | 2024-06-11 | 中移(苏州)软件技术有限公司 | 元数据管理方法、装置、电子设备、介质及芯片 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103544322A (zh) | 基于服务器集群的热点元数据管理方法 | |
US11500730B2 (en) | Storage management of data using an open-archive architecture, including streamlined access to primary data originally stored on network-attached storage and archived to secondary storage | |
US20220245037A1 (en) | Hypervisor-independent reference copies of virtual machine payload data based on block-level pseudo-mount | |
US10489343B2 (en) | Cluster file system comprising data mover modules having associated quota manager for managing back-end user quotas | |
US11199971B2 (en) | Managing operational parameters for migrating data for resized volumes | |
US10853242B2 (en) | Deduplication and garbage collection across logical databases | |
AU2011312029B2 (en) | Automatic replication of virtual machines | |
CN104320401B (zh) | 一种基于分布式文件系统的大数据存储访问系统及方法 | |
US20160132518A1 (en) | Placement policy | |
US9171009B1 (en) | Cluster file system comprising storage server units each having a scale-out network attached storage cluster | |
Chen et al. | Walnut: a unified cloud object store | |
US10802928B2 (en) | Backup and restoration of file system | |
US20210064486A1 (en) | Access arbitration to a shared cache storage area in a data storage management system for live browse, file indexing, backup and/or restore operations | |
CN103064927A (zh) | 分布式文件系统的数据访问方法和装置 | |
US8701113B2 (en) | Switch-aware parallel file system | |
CN104239166A (zh) | 一种对运行中虚拟机实现文件备份的方法 | |
CN103455577A (zh) | 云主机镜像文件的多备份就近存储和读取方法及系统 | |
CN102164177A (zh) | 一种集群共享存储池的方法、装置及系统 | |
US10152493B1 (en) | Dynamic ephemeral point-in-time snapshots for consistent reads to HDFS clients | |
CN105635311A (zh) | 一种云管理平台中资源池信息同步的方法 | |
CN101945131A (zh) | 一种基于存储虚拟化的数据迁移方法 | |
US20230267046A1 (en) | Fileset partitioning for data storage and management | |
CA2813596A1 (en) | Automatic selection of secondary backend computing devices for virtual machine image replication | |
US10067949B1 (en) | Acquired namespace metadata service for controlling access to distributed file system | |
CN102360382B (zh) | 一种高速对象并行存储系统目录复制方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20140129 |