CN104580536A - 一种元数据集群负载平衡实现方法 - Google Patents

一种元数据集群负载平衡实现方法 Download PDF

Info

Publication number
CN104580536A
CN104580536A CN201510064916.8A CN201510064916A CN104580536A CN 104580536 A CN104580536 A CN 104580536A CN 201510064916 A CN201510064916 A CN 201510064916A CN 104580536 A CN104580536 A CN 104580536A
Authority
CN
China
Prior art keywords
metadata
load
cluster
load balance
meta data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510064916.8A
Other languages
English (en)
Inventor
张延良
张在贵
程瑶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Electronic Information Industry Co Ltd
Original Assignee
Inspur Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Electronic Information Industry Co Ltd filed Critical Inspur Electronic Information Industry Co Ltd
Priority to CN201510064916.8A priority Critical patent/CN104580536A/zh
Publication of CN104580536A publication Critical patent/CN104580536A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
    • H04L67/1004Server selection for load balancing
    • H04L67/1008Server selection for load balancing based on parameters of servers, e.g. available memory or workload

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Hardware Design (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开一种元数据集群负载平衡实现方法,涉及计算机存储技术,在集群文件系统中实现多个元数据服务器,通过定时同步各元数据服务器上元数据负载信息,将元数据负载较大的服务器的负载自动分配给压力小的元数据服务器,进行元数据服务器之间的负载平衡;该方法主要由元数据负载统计模块、元数据集群负载平衡模块两部分组成。通过该方法能有效的提高文件系统元数据性能,解决了小文件存储性能问题,实现了元数据集群的负载平衡。

Description

一种元数据集群负载平衡实现方法
技术领域
本发明涉及计算机存储技术,具体的说是一种元数据集群负载平衡实现方法。
背景技术
元数据集群是由多台元数据服务器组成集群,一起提供元数据服务。元数据服务器集群必须把整个文件系统的命名空间按照一定的逻辑分割方法,由不同的元数据服务器进行管理。元数据服务器主要的功能是对元数据库和元数据标准进行管理和操作;可以在多操作系统上运行,如window、Linux操作系统上,元数据服务器本身不能独立运行,需要运行在中间件上面。
任何文件系统中的数据分为数据和元数据。数据是指普通文件中的实际数据,而元数据指用来描述一个文件的特征的系统数据,诸如访问权限、文件拥有者以及文件数据块的分布信息等等。对于大文件而言,数据存储性能是文件系统的瓶颈;而对于小文件而言,元数据存储性能是影响文件系统性能的瓶颈。目前,大部分集群文件系统还是使用单元数据服务器的架构,该架构能满足存储大文件较多的应用,但是无法满足小文件较多的应用场景,并且存在单点失效和元数据服务的可扩展性问题。为了提高文件系统小文件的存储性能,需要开发元数据集群功能,来提高元数据的并发性,从而提高文件系统小文件读写性能。
发明内容
针对现有技术存在的不足之处,本发明提供了一种元数据集群负载平衡实现方法。
本发明所述一种元数据集群负载平衡实现方法,解决上述技术问题采用的技术方案如下:该元数据集群负载平衡实现方法,主要是在集群文件系统中实现多个元数据服务器,通过定时同步各元数据服务器上元数据负载信息,将元数据负载较大的服务器的负载自动分配给压力小的元数据服务器,实现元数据服务器之间的负载平衡。该方法可用在分布式文件系统上,来实现元数据集群之间的负载平衡。
优选的,该元数据集群负载平衡实现方法主要由元数据负载统计模块、元数据集群负载平衡模块两部分组成;通过统计集群文件系统中文件的访问热度来得出元数据负载,并通过元数据集群负载平衡算法将符合导出的有负载的目录分给其他元数据。
优选的,所述元数据负载统计模块:主要是统计一定时间内文件的访问热度来计算元数据负载值;对文件访问热度进行衰减,让在较长时间内不会被访问的文件访问热度值减小或为0。
优选的,集群文件系统目录下文件的读写请求都会和元数据进行消息通信,统计所有的有消息通信的目录访问热度得出相应元数据的负载值。
优选的,所述元数据集群负载平衡模块:将集群文件系统目录设为负载平衡的最小单位,即在集群文件系统中若某个元数据负载较大,则通过负载平衡算法将符合导出目标的有负载的目录分给另一个或其他几个元数据。
优选的,元数据集群依据元数据的个数将有负载的目录导出到其他元数据服务器上;所述负载平衡算法为:
Expo rt load = 1 n MDS load
其中,Exportload为导出的负载值,n为元数据个数,MDSload当前元数据负载。
本发明的一种元数据集群负载平衡实现方法与现有技术相比具有的有益效果是:该方法提供了一种有效的提高元数据性能的方法,主要是统计集群文件系统中文件的访问热度来得出元数据负载,通过元数据集群负载平衡算法将符合导出的有负载的目录分给其他元数据;能有效的提高文件系统元数据性能,特别是对小文件的读写性能有明显的提高,解决了小文件存储性能问题;实现了元数据集群的负载平衡,解决了之前只能依赖一个元数据服务器的性能问题,实现了元数据I/O并发。
附图说明
附图1为所述元数据集群负载平衡实现方法的示意框图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参考附图,对本发明所述一种元数据集群负载平衡实现方法进一步详细说明。
本发明所述一种元数据集群负载平衡实现方法,提出了一种有效的提高元数据性能的方法,主要是在集群文件系统中实现多个元数据服务器,并实现元数据服务器之间的负载平衡。该方法可用在分布式文件系统上,通过定时同步各元数据服务器上元数据负载信息,将元数据负载较大的服务器的负载自动分配给压力小的元数据服务器,来实现元数据集群之间的负载平衡。通过本发明所述元数据集群负载平衡实现方法,能有效的提高文件系统元数据性能,解决了小文件存储性能问题。
实施例:
本实施例所述一种元数据集群负载平衡实现方法,主要由元数据负载统计模块、元数据集群负载平衡模块两部分组成;其内容主要是统计集群文件系统中文件的访问热度来得出元数据负载,通过元数据集群负载平衡算法将符合导出的有负载的目录分给其他元数据。
该元数据集群负载平衡实现方法中,所述元数据负载统计模块:集群文件系统都运行在Linux操作系统下,在Linux系统中数据以文件的形式存在,本方法主要是统计一定时间内文件的访问热度(文件的访问频率)来计算元数据负载值;由于有些文件不会被经常访问,因此要对文件访问热度进行衰减,目的就是让在较长时间内不会被访问的文件访问热度值减小或为0。这样就能通过文件的访问热度来得出元数据负载。
该元数据集群负载平衡实现方法中,所述元数据集群负载平衡模块:在集群文件系统中,文件的上一层为目录,目录的访问热度为其下文件的访问热度之和;本方法为了实现高效的负载平衡算法,将目录设为负载平衡的最小单位,即在集群文件系统中如果某个元数据负载较大,那么负载平衡算法就会将符合导出目标的有负载的目录分给另一个或其他几个元数据,这样就实现了元数据集群的负载平衡。
本实施例所述元数据集群负载平衡实现方法中,集群文件系统目录下文件的读写请求都会和元数据进行消息通信,统计所有的有消息通信的目录访问热度得出相应元数据的负载值。这样元数据集群就会依据元数据的个数将目录负载导出到其他元数据服务器上,实现了元数据集群负载平衡;如附图1所示。所述负载平衡算法为:
Expo rt load = 1 n MDS load
其中,Exportload为导出的负载值,n为元数据个数,MDSload当前元数据负载。
由上述公式得出,如果文件系统有2个元数据,当前有1个元数据负载较大,那么元数据集群就会将当前元数据负载的1/2分给另一个元数据。
通过上述对本实施例所述元数据集群负载平衡实现方法的详细介绍,可知该方法的创新点之一是:元数据集群之间负载同步机制,能定时同步各元数据的负载,让每个元数据服务器都能知道集群文件系统元数据的负载情况,有利于后面的负载导出;另一个创新点是:元数据集群负载平衡机制,将目录设置为最小导出单位,目的是实现高效的负载平衡机制,将符合导出的负载目录直接分到其他元数据上。此外,本实施例所述方法还设置了较小的负载波动值(Exportload*10%),目的是更好、更快地实现负载平衡。
使用本发明所述元数据集群负载平衡实现方法实现元数据集群负载平衡,其具体实施流程如下:
1)元数据集群内部所有元数据定时(10s)向其他元数据发送自己的负载;
2)负载较高的元数据计算需要分出去多少负载;
3)将计算得出的负载值与其下的目录负载比较,查看是否有符合该负载值的目录,负载目录可以累加不可以拆分;
4)将符合导出的负载目录强制导出到其他元数据上;这样,来自客户端的目录下文件的IO请求就相应的发送到对应的元数据上。
上述具体实施方式仅是本发明的具体个案,本发明的专利保护范围包括但不限于上述具体实施方式,任何符合本发明的权利要求书的且任何所属技术领域的普通技术人员对其所做的适当变化或替换,皆应落入本发明的专利保护范围。

Claims (5)

1.一种元数据集群负载平衡实现方法,其特征在于,在集群文件系统中实现多个元数据服务器,通过定时同步各元数据服务器上元数据负载信息,将元数据负载较大的服务器的负载自动分配给压力小的元数据服务器,进行元数据服务器之间的负载平衡;该方法主要由元数据负载统计模块、元数据集群负载平衡模块两部分组成。
2.根据权利要求1所述一种元数据集群负载平衡实现方法,其特征在于,所述元数据负载统计模块:主要是统计一定时间内文件的访问热度来计算元数据负载值;对文件访问热度进行衰减,让在较长时间内不会被访问的文件访问热度值减小或为0。
3.根据权利要求2所述一种元数据集群负载平衡实现方法,其特征在于,集群文件系统目录下文件的读写请求都会和元数据进行消息通信,统计所有的有消息通信的目录访问热度得出相应元数据负载值。
4.根据权利要求1所述一种元数据集群负载平衡实现方法,其特征在于,所述元数据集群负载平衡模块:将集群文件系统目录设为负载平衡的最小单位,即在集群文件系统中若某个元数据负载较大,则通过负载平衡算法将符合导出目标的有负载的目录分给其他几个元数据。
5.根据权利要求4所述一种元数据集群负载平衡实现方法,其特征在于,元数据集群依据元数据的个数将有负载的目录导出到其他元数据服务器上;所述负载平衡算法为:
Export load = 1 n MDS load
其中,Exportload为导出的负载值,n为元数据个数,MDSload当前元数据负载。
CN201510064916.8A 2015-02-06 2015-02-06 一种元数据集群负载平衡实现方法 Pending CN104580536A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510064916.8A CN104580536A (zh) 2015-02-06 2015-02-06 一种元数据集群负载平衡实现方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510064916.8A CN104580536A (zh) 2015-02-06 2015-02-06 一种元数据集群负载平衡实现方法

Publications (1)

Publication Number Publication Date
CN104580536A true CN104580536A (zh) 2015-04-29

Family

ID=53095693

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510064916.8A Pending CN104580536A (zh) 2015-02-06 2015-02-06 一种元数据集群负载平衡实现方法

Country Status (1)

Country Link
CN (1) CN104580536A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106850833A (zh) * 2017-03-01 2017-06-13 郑州云海信息技术有限公司 一种平衡元数据集群负载的方法及装置
CN107066594A (zh) * 2017-04-19 2017-08-18 济南浪潮高新科技投资发展有限公司 一种元数据同步的方法
CN109885552A (zh) * 2019-02-18 2019-06-14 天固信息安全系统(深圳)有限责任公司 分布式文件系统的元数据动态管理方法及分布式文件系统
US10372370B2 (en) 2017-06-21 2019-08-06 Western Digital Technologies, Inc. Metadata load distribution management

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101697526A (zh) * 2009-10-10 2010-04-21 中国科学技术大学 分布式文件系统中元数据管理的负载均衡方法及其系统
US20120030316A1 (en) * 2009-04-24 2012-02-02 Dolby Laboratories Licensing Corporation Unified Media Content Directory Services
CN102624911A (zh) * 2012-03-14 2012-08-01 中山大学 一种基于集群的可视媒体存储系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120030316A1 (en) * 2009-04-24 2012-02-02 Dolby Laboratories Licensing Corporation Unified Media Content Directory Services
CN101697526A (zh) * 2009-10-10 2010-04-21 中国科学技术大学 分布式文件系统中元数据管理的负载均衡方法及其系统
CN102624911A (zh) * 2012-03-14 2012-08-01 中山大学 一种基于集群的可视媒体存储系统

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106850833A (zh) * 2017-03-01 2017-06-13 郑州云海信息技术有限公司 一种平衡元数据集群负载的方法及装置
CN107066594A (zh) * 2017-04-19 2017-08-18 济南浪潮高新科技投资发展有限公司 一种元数据同步的方法
CN107066594B (zh) * 2017-04-19 2021-02-26 浪潮集团有限公司 一种元数据同步的方法
US10372370B2 (en) 2017-06-21 2019-08-06 Western Digital Technologies, Inc. Metadata load distribution management
CN109885552A (zh) * 2019-02-18 2019-06-14 天固信息安全系统(深圳)有限责任公司 分布式文件系统的元数据动态管理方法及分布式文件系统
CN109885552B (zh) * 2019-02-18 2023-08-18 天固信息安全系统(深圳)有限责任公司 分布式文件系统的元数据动态管理方法及分布式文件系统

Similar Documents

Publication Publication Date Title
US11093466B2 (en) Incremental out-of-place updates for index structures
TWI737395B (zh) 日誌結構儲存系統及方法
Eltabakh et al. CoHadoop: flexible data placement and its exploitation in Hadoop
US10853242B2 (en) Deduplication and garbage collection across logical databases
US10019459B1 (en) Distributed deduplication in a distributed system of hybrid storage and compute nodes
TW202117529A (zh) 日誌結構儲存系統
CN101673289B (zh) 分布式文件存储构架的构建方法和装置
TW202113580A (zh) 日誌結構儲存系統
CN101989929A (zh) 容灾数据备份的方法及系统
TW202111564A (zh) 日誌結構儲存系統
US9946724B1 (en) Scalable post-process deduplication
US10146694B1 (en) Persistent cache layer in a distributed file system
US20210185142A1 (en) Cache storage for streaming data
CN104580536A (zh) 一种元数据集群负载平衡实现方法
Zhang et al. Survey of research on big data storage
US10929100B2 (en) Mitigating causality discrepancies caused by stale versioning
CN104462185A (zh) 一种基于混合结构的数字图书馆云存储系统
US10298709B1 (en) Performance of Hadoop distributed file system operations in a non-native operating system
CN103593420A (zh) 一种利用共享在线日志实现异构同平台的数据库集群搭建方法
US9767107B1 (en) Parallel file system with metadata distributed across partitioned key-value store
CN103744882B (zh) 一种基于键值对的目录片段表示方法及装置
Lu et al. Hybrid storage architecture and efficient MapReduce processing for unstructured data
Fan et al. An improved small file storage strategy in ceph file system
WO2015067128A1 (zh) 一种堆叠式重复数据删除文件系统
CN116842012A (zh) 一种Redis集群的分片存储方法、装置、设备及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20150429