CN101697526A - 分布式文件系统中元数据管理的负载均衡方法及其系统 - Google Patents

分布式文件系统中元数据管理的负载均衡方法及其系统 Download PDF

Info

Publication number
CN101697526A
CN101697526A CN200910178458A CN200910178458A CN101697526A CN 101697526 A CN101697526 A CN 101697526A CN 200910178458 A CN200910178458 A CN 200910178458A CN 200910178458 A CN200910178458 A CN 200910178458A CN 101697526 A CN101697526 A CN 101697526A
Authority
CN
China
Prior art keywords
metadata
node
module
load balancing
load
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN200910178458A
Other languages
English (en)
Inventor
朱明�
肖培棕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Science and Technology of China USTC
Original Assignee
University of Science and Technology of China USTC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Science and Technology of China USTC filed Critical University of Science and Technology of China USTC
Priority to CN200910178458A priority Critical patent/CN101697526A/zh
Publication of CN101697526A publication Critical patent/CN101697526A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种分布式文件系统中元数据管理的负载均衡的方法和系统,当元数据的数据结构即目录树成为热点元数据时,通过采用元数据复制的方式更新目录树的访问热度;当元数据的服务节点的负载均衡度超过预定的数值时,通过采用元数据迁移的方式,将部分工作负载从过载节点迁移到过轻节点上,通过上述两种方式来实现多个元数据服务节点之间的负载均衡。该系统包括信息通讯模块、元数据操作模块、元数据服务节点管理模块、元数据管理模块、元数据策略执行模块以及工作负载采集模块。本发明通过元数据复制和元数据迁移这两种方式,提高了元数据服务资源的利用率,达到了负载均衡的目的,使元数据服务系统可以平滑扩展。

Description

分布式文件系统中元数据管理的负载均衡方法及其系统
技术领域
本发明涉及计算机网络技术领域,尤其是涉及一种分布式文件系统中元数据管理的负载均衡的方法及其系统。
背景技术
随着信息技术的进一步发展,以及网络的大规模应用,带来了数据的爆炸性增长,同时给网络存储带来了巨大的发展。其中,以对象存储结构为基础构建的大型分布式文件系统,可扩展性强、可靠性高,能提供较强的并发数据处理能力,因此,元数据服务管理在大型分布式文件系统中显得非常重要。在研究集群负载均衡的基础上,设计和实现元数据管理集群静态负载分配与动态反馈重分配相结合的负载均衡方案成为目前研究的一个重要课题。现有技术中,通常采用通过静态元数据分割算法和元数据分布存储,实现元数据服务负载分流;或者采用动态反馈服务器负载信息,实现不均衡负载重新分配。
但是,传统的元数据管理中只是通过对元数据服务节点做简单的备份来提供元数据服务,没有针对热点元数据进行动态调整,无法实现元数据服务系统的平滑扩展。
发明内容
为此,本发明的目的是提供一种分布式文件系统中元数据管理的负载均衡的方法,该方法通过元数据复制和元数据迁移这两种方式,实现多个元数据服务节点之间的负载均衡。
为达到上述目的,根据本发明提供了如下所述的技术方案。
一种分布式文件系统中元数据管理的负载均衡的方法,当元数据的数据结构即目录树成为热点元数据时,通过采用元数据复制的方式更新目录树的访问热度,从而实现多个元数据服务节点之间的负载均衡;
而当元数据的服务节点的负载均衡度超过预定的数值时,通过采用元数据迁移的方式,将部分工作负载从过载节点迁移到过轻节点上,从而实现多个元数据服务节点之间的负载均衡。
一种用于分布式文件系统中元数据管理的负载均衡的系统,该系统包括如下模块:
元数据操作模块,根据用户的元数据请求,完成对元数据对象的操作;
信息通讯模块,用于交互元数据服务节点间运行时的信息;
元数据服务节点管理模块,用于管理元数据服务节点;
元数据管理模块,用于动态负载均衡策略的决定;
元数据策略执行模块,用于元数据复制或者迁移策略的执行;
工作负载采集模块,用于元数据服务节点工作负载信息的采集与上报;
其中,所述元数据操作模块接入并处理元数据请求,然后将元数据的访问热度和热点元数据分别发送给所述元数据服务节点管理模块和所述元数据管理模块;所述信息通讯模块通过元数据服务节点的维护接口与外界进行通讯,同时由该信息通讯模块将各元数据服务节点间运行时的信息,例如服务节点的访问热度和工作负载等信息发送给所述元数据服务节点管理模块,由所述元数据服务节点管理模块将服务节点的节点管理信息,例如上述的服务节点运行时的信息和一些基本的属性信息等再传给所述元数据管理模块,所述元数据管理模块根据此信息转换为动态负载均衡策略的决定发送给所述元数据策略执行模块,最后通过所述元数据策略执行模块将策略执行的信息,例如元数据复制或者迁移的执行指令信息等反馈给所述信息通讯模块;此外,所述工作负载模块定期将采集到的元数据服务节点的工作负载信息上报给所述元数据服务节点管理模块。
根据本发明的一个实施例,元数据复制包括如下步骤:
(a)源节点的所述元数据操作模块根据元数据的操作实时更新目录树的访问热度;
(b)设定表明某部分元数据是否成为热点元数据的阈值,如果访问热度大于所设定的阈值,判定出现热点元数据,同时向所述元数据管理模块发出目录复制请求;
(c)所述元数据管理模块收到复制请求后,根据系统内当前节点的运行信息,决策出目录复制的目标节点;
(d)所述元数据管理模块向所述元数据策略执行模块发出目录复制指令,并告知目录复制的目标节点;
(e)源节点的所述元数据策略执行模块和目标节点的所述元数据策略执行模块协作,完成目录的复制;
(f)元数据复制的源节点和目标节点的所述元数据服务节点管理模块将更新访问热度同步到其他服务节点。
根据本发明的另一个实施例,元数据迁移包括如下步骤:
(1)所述工作负载采集模块定期采集元数据服务节点上的工作负载,并向所述元数据服务节点管理模块更新工作负载的信息;
(2)所述元数据管理模块定期计算元数据负载均衡子系统负责的节点的负载均衡度,如果不均衡的程度超过预定的程度,则进行目录迁移的决策;
(3)向所述元数据策略执行模块发送目录迁移指令,完成目录迁移;
(4)过载节点和过轻节点向所述元数据服务节点管理模块更新自己的访问热度以及工作负载的信息,同时更新给其他服务节点。
本发明通过元数据复制和元数据迁移这两种方式,提高了元数据服务资源的利用率,达到了负载均衡的目的,使元数据服务系统可以平滑扩展。
附图说明
图1是根据本发明的用于分布式文件系统中元数据管理的负载均衡的系统构成图;
图2是根据本发明的一种实施方式中的目录复制前的元数据服务节点的状态图;
图3是根据本发明的一种实施方式中的目录复制后的元数据服务节点的状态图;
图4是根据本方明的一种实施方式中的目录复制的系统模块间的流程图;
图5是根据本发明的一种实施方式中的目录复制的流程图;
图6是根据本发明的一种实施方式中的目录迁移前的元数据服务节点的状态图;
图7是根据本发明的一种实施方式中的目录迁移后的元数据服务节点的状态图;
图8是根据本发明的一种实施方式中的目录迁移的系统模块间的流程图;
图9是根据本发明的另一种实施方式的目录迁移的流程图;以及
图10是根据本发明的方法中对目录热度更新的示意图。
具体实施方式
下面将参照附图更加详细地描述根据本发明的分布式文件系统中元数据管理的负载均衡的方法及其系统的具体实施例。
图1示出了根据本发明的用于分布式文件系统中元数据管理的负载均衡的系统构成图。如图1所示,该系统包括信息通讯模块,用于元数据服务节点间运行时的信息交互;元数据操作模块,用于根据用户的元数据请求、完成对元数据对象的操作;元数据服务节点管理模块,用于进行元数据服务节点的节点管理;元数据管理模块,用于进行动态负载均衡策略的决策;元数据策略执行模块,用于进行元数据复制或者迁移策略的执行;工作负载采集模块,用于元数据服务节点工作负载信息的采集与上报;其中,元数据操作模块接入并处理元数据请求,然后将元数据的访问热度和热点元数据分别发送给元数据服务节点管理模块和元数据管理模块;信息通讯模块通过元数据服务节点的维护接口与外界进行通讯,同时由该信息通讯模块将各元数据服务节点间运行时的信息,例如服务节点的访问热度和工作负载等信息发送给元数据服务节点管理模块,由元数据服务节点管理模块将服务节点的节点管理信息,例如上述的服务节点运行时的信息和一些基本的属性信息等再传给元数据管理模块,元数据管理模块根据此信息转换为动态负载均衡策略的决定发送给元数据策略执行模块,最后通过元数据策略执行模块将策略执行的信息,例如元数据复制或者迁移的执行指令信息等反馈给信息通讯模块;此外,工作负载模块定期将采集到的元数据服务节点的工作负载信息上报给元数据服务节点管理模块;另外,邻居节点列表是元数据服务节点管理模块用于记录系统的各节点属性信息的表,具体内容包括可以识别系统内各节点的节点标识、IP、访问热度、负载情况以及节点状态等信息。
通常情况,所有元数据请求都是先从目录树根节点开始向下遍历,因为复制或者迁移的关系,根节点在多个元数据服务器上都有副本,所以客户端只在第一次访问的时候可能要经过一个特定的服务器查找相应元数据所在的服务节点,后续的访问直接与该节点打交道即可。
本发明通过采用元数据复制和元数据迁移这两种方式,实现多个元数据服务节点之间的负载均衡,其中目录复制前的元数据节点A、B的状态图请参照图2;目录迁移前的元数据节点A、B的状态图请参照图6。
结合图4和图5,可以看到元数据复制包括如下步骤:
(a)源节点的元数据操作模块根据元数据的操作实时更新目录树的访问热度;
(b)设定表明某部分元数据是否成为热点元数据的阈值T1,如果访问热度大于所设定的阈值T1,判定出现热点元数据,同时向元数据管理模块发出目录复制请求;
(c)元数据管理模块收到复制请求后,根据系统内当前节点的运行信息,决策出目录复制的目标节点;
(d)元数据管理模块向元数据策略执行模块发出目录复制指令,并告知目录复制的目标节点;
(e)源节点的元数据策略执行模块和目标节点的元数据策略执行模块协作,完成目录的复制;
(f)元数据复制的源节点和目标节点的元数据服务节点管理模块将更新访问热度同步到其他服务节点。
其中,步骤(b)中涉及的阈值T1是根据不同业务系统的特性和具体情况,通过前期试验得出的实验数据,并且可以在运行过程中根据不同的目标要求,例如负载均衡灵敏度要求进行调整。首先,计算出当某元数据服务节点工作负载达到或接近最大时对应的元数据热度Popularity(max),然后可以按照占元数据服务节点的元数据热度的百分比来判定该部分元数据是否为热点元数据,如超过20%,即T1=Popularity(max)*20%。
另外,上述步骤(e)还包括如下步骤:
(e1)查询邻居节点列表,选择复制的目标节点,而且必须保证复制之前在该目标节点上没有将被复制的目录树;
(e2)对将被复制的目录树设置操作开始标记mark1,记录此时间标记后的请求的命令序列ProcedureQueue;
(e3)源节点启动同步锁,此时目录树不能对外服务;
(e4)源节点向目标节点发送目录树,目标节点重新构建目录树;
(e5)源节点向目标节点发送ProcedureQueue,目标节点按照ProcedureQueue更新目录树;
(e6)目标节点将目录树的主副本节点设置为源节点;
(e7)更新源节点和目标节点的目录树的访问热度,通常为原来访问热度的一半;
(e8)关闭同步锁,源节点和目标节点重新对外服务。
通过上述步骤,实现对元数据节点的目录复制。目录复制后的元数据节点A、B的状态图请参照图3。
结合图8和图9,可以看到元数据迁移包括如下步骤:
(1)工作负载采集模块定期采集元数据服务节点上的工作负载,并向元数据服务节点管理模块更新工作负载的信息;
(2)元数据管理模块定期计算元数据负载均衡子系统负责的节点的负载均衡度,如果不均衡的程度超过预定的程度即阈值T2,则进行目录迁移的决策;
(3)向元数据策略执行模块发送目录迁移指令,完成目录迁移;
(4)过载节点和过轻节点向所述元数据服务节点管理模块更新自己的访问热度以及工作负载的信息,同时更新给其他服务节点。
其中,上述步骤(2)中所提及的阈值T2是根据不同业务系统的特性和具体情况,通过前期试验得出的实验数据,并且可以在运行过程中根据不同的目标要求,例如负载均衡灵敏度要求进行调整。阈值T2的范围为[0,1],建议取值范围大于0.5,这样才不会使各元数据服务系统内各元数据服务节点的工作负载相差太大。
另外,上述步骤(3)还包括如下步骤:
(3a)查询邻居节点列表,根据各节点的负载信息,作出决策,选择过载节点和过轻节点;
(3b)根据过载节点和过轻节点的负载,计算需要迁移的负载,然后将计算出来的负载量映射为访问热度,根据访问热度来选择将被迁移的目录树;
(3c)对目录树设置操作开始标记mark1,记录此时间标记后的请求的命令序列ProcedureQueue;
(3d)过载节点向过轻节点发送目录树,过轻节点重新构建目录树;
(3e)过载节点向过轻节点发送ProcedureQueue,过轻节点按照ProcedureQueue更新目录树;
(3f)过载节点删除目录树;
(3g)关闭同步锁,过轻节点对外服务。
通过上述步骤,实现对元数据节点的目录迁移。目录迁移后的元数据节点A、B的状态图请参照图6。
多个元数据服务节点中存在一个班长节点,负责决策负载均衡策略,即计算负载均衡度,并且判定是否需要进行目录迁移;同时还存在副班长节点,在班长节点失效时代替履行班长的职责,并且选举新的班长节点。
把实现本技术中涉及的分布式文件系统中元数据管理的系统称之为元数据服务系统中负载均衡子系统(简称元数据负载均衡子系统),称元数据负载均衡子系统中的节点为元数据服务节点(简称MDS)。
元数据的数据结构为目录树,因此下面设计中提到的元数据复制又称为目录复制。目录树具备访问热度(简称热度)的属性,热度值随每次到来的访问而增加1,如图10所示,同时热度随时间的推移进行衰减,其衰减函数为:
Figure G2009101784585D0000071
n′=n,n-1,n-2,...,1
其中,n代表被访问目录节点所在目录树的层数;
n′代表该(目录)节点及其每个祖先(目录)节点的层数;
函数f是关于n′的衰减函数,代表需要更新访问热度的目录树结点的祖先结点包含被访问的目录结点的访问热度的衰减。
元数据负载均衡子系统负责的所有节点通过“邻居节点列表”建立联系。元数据负载均衡子系统负责的所有节点的负载均衡度反映了该节点的负载均衡的程度,具体表现为:
L s = 1 n Σ i | L i - L ‾ | L ‾ , ( L ‾ = 1 n Σ i = 1 n L i )
其中,Ls代表元数据负载均衡子系统的负载均衡度,且0<=Ls<=1,Ls越趋近于0,代表元数据负载均衡子系统的负载均衡程度越好;
n代表负载均衡子系统中元数据服务节点的个数;
Li代表负载均衡子系统中第i个元数据服务节点的工作负载;
L代表负载均衡子系统中所有元数据服务节点工作负载的算术平均值。
元数据服务节点的工作负载为:
Li=W1·Lcpu+W2·Lmem+W3·LnetworkIO,其中W+W2+W3=1
其中,Li代表元数据服务节点i的工作负载;
Lcpu代表元数据服务节点i的CPU占用率;
W1代表Lcpu在Li中所占的权重;
Lmem代表元数据服务节点i的内存占用率;
W2代表Lmem在Li中所占的权重;
LnetworkIO代表元数据服务节点i的网络IO带宽占用率;
W3代表LnetworkIO在Li中所占的权重。
因此,0<=Li<=1。
所述负载映射为访问热度的计算公式如下:
poularity = f ( workload ) = ∂ i · workload i
(if workload∈workloadk,则
Figure G2009101784585D0000084
i≡k;
Figure G2009101784585D0000085
i≠k)
其中,i和k均表示为元数据服务节点的节点标识;
workloadi表示节点标识为i的元数据服务节点的工作负载;
popularity表示为元数据访问热度;
Figure G2009101784585D0000086
表示节点标识为i的元数据服务节点从工作负载映射到访问热度的映射参数。
以上所揭露的仅为本发明的优选实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明申请专利范围所作的等同变化,仍属本发明所涵盖的范围。

Claims (14)

1.一种分布式文件系统中元数据管理的负载均衡的方法,其特征在于,
当元数据的数据结构即目录树成为热点元数据时,通过采用元数据复制的方式更新目录树的访问热度,从而实现多个元数据服务节点之间的负载均衡;
当元数据的服务节点的负载均衡度超过阈值时,通过采用元数据迁移的方式,将部分工作负载从过载节点迁移到过轻节点上,从而实现多个元数据服务节点之间的负载均衡。
2.用于分布式文件系统中元数据管理的负载均衡的系统,其特征在于,该系统包括如下模块:
信息通讯模块,用于元数据服务节点间运行时信息的交互;
元数据操作模块,根据用户的元数据请求,完成对元数据对象的操作;
元数据服务节点管理模块,用于元数据服务节点的节点管理;
元数据管理模块,用于动态负载均衡策略的决策;
元数据策略执行模块,用于元数据复制或者迁移策略的执行;
工作负载采集模块,用于元数据服务节点工作负载信息的采集与上报;
其中,所述元数据操作模块接入并处理元数据请求,然后将元数据的访问热度和热点元数据分别发送给所述元数据服务节点管理模块和所述元数据管理模块;所述信息通讯模块通过元数据服务节点的维护接口与外界进行通讯,同时由该信息通讯模块将各元数据服务节点间运行时的信息发送给所述元数据服务节点管理模块,由所述元数据服务节点管理模块将服务节点的节点管理信息再传给所述元数据管理模块,所述元数据管理模块根据此信息转换为动态负载均衡策略的决策发送给所述元数据策略执行模块,最后通过所述元数据策略执行模块将策略执行的信息反馈给所述信息通讯模块;此外,所述工作负载模块定期将采集到的元数据服务节点的工作负载信息上报给所述元数据服务节点管理模块。
3.如权利要求1所述的分布式文件系统中元数据管理的负载均衡的方法,其特征在于,所述元数据复制包括如下步骤:
(a)源节点的所述元数据操作模块根据元数据的操作实时更新目录树的访问热度;
(b)设定表明某部分元数据是否成为热点元数据的阈值,如果访问热度大于所设定的阈值,判定出现热点元数据,同时向所述元数据管理模块发出目录复制请求;
(c)所述元数据管理模块收到复制请求后,根据系统内当前节点的运行信息,决策出目录复制的目标节点;
(d)所述元数据管理模块向所述元数据策略执行模块发出目录复制指令,并告知目录复制的目标节点;
(e)源节点的所述元数据策略执行模块和目标节点的所述元数据策略执行模块协作,完成目录的复制;
(f)元数据复制的源节点和目标节点的所述元数据服务节点管理模块将更新访问热度到其他服务节点。
4.如权利要求1所述的分布式文件系统中元数据管理的负载均衡的方法,其特征在于,所述元数据迁移包括如下步骤:
(1)所述工作负载采集模块定期采集元数据服务节点上的工作负载,并向所述元数据服务节点管理模块更新工作负载的信息;
(2)所述元数据管理模块定期计算元数据负载均衡子系统负责的节点的负载均衡度,如果不均衡的程度超过预定的程度,则进行目录迁移的决策;
(3)向所述元数据策略执行模块发送目录迁移指令,完成目录迁移;
(4)所述过载节点和所述过轻节点向所述元数据服务节点管理模块更新自己的访问热度以及工作负载的信息,同时更新给其他服务节点。
5.如权利要求1所述的分布式文件系统中元数据管理的负载均衡的方法,其特征在于,所述多个元数据服务节点中存在一个班长节点,负责决策负载均衡策略,即计算负载均衡度,并且判定是否需要进行目录迁移。
6.如权利要求5所述的分布式文件系统中元数据管理的负载均衡的方法,其特征在于,所述多个元数据服务节点中还存在副班长节点,在班长节点失效时代替履行班长的职责,并且选举新的班长节点。
7.如权利要求1或3所述的分布式文件系统中元数据管理的负载均衡的方法,其特征在于,所述目录树的访问热度值,随每次访问的到来增加1,同时随时间的推移进行衰减,其衰减函数为:
其中,n代表被访问目录节点所在目录树的层数;
n′代表该(目录)节点及其每个祖先(目录)节点的层数;
函数f是关于n′的衰减函数,代表需要更新访问热度的目录树结点的祖先结点包含被访问的目录结点的访问热度的衰减。
8.如权利要求1或4所述的分布式文件系统中元数据管理的负载均衡的方法,其特征在于,所述服务节点的负载均衡度反映了该节点的负载均衡的程度,具体表现为:
L s = 1 n Σ i | L i - L ‾ | L ‾ , ( L ‾ = 1 n Σ i = 1 n L i )
其中,Ls代表元数据负载均衡子系统的负载均衡度;
n代表负载均衡子系统中元数据服务节点的个数;
Li代表负载均衡子系统中第i个元数据服务节点的工作负载;
L代表负载均衡子系统中所有元数据服务节点工作负载的算术平均值。
9.如权利要求4所述的分布式文件系统中元数据管理的负载均衡的方法,其特征在于,所述元数据服务节点的工作负载为:
Li=W1·Lcpu+W2·Lmem+W3·LnetworkIO
其中,Li代表元数据服务节点i的工作负载;
Lcpu代表元数据服务节点i的CPU占用率;
W1代表Lcpu在Li中所占的权重;
Lmem代表元数据服务节点i的内存占用率;
W2代表Lmem在Li中所占的权重;
LnetworkIO代表元数据服务节点i的网络IO带宽占用率;
W3代表LnetworkIO在Li中所占的权重。
10.如权利要求2所述的用于分布式文件系统中元数据管理的负载均衡的系统,其特征在于,所述元数据策略执行模块进一步包括:
元数据复制执行模块,负责元数据复制策略的执行;
元数据迁移执行模块,负责元数据迁移策略的执行。
11.如权利要求1所述的分布式文件系统中元数据管理的负载均衡的方法,其特征在于,所述元数据服务节点中的所有节点通过邻居节点列表建立联系。
12.如权利要求3所述的分布式文件系统中元数据管理的负载均衡的方法,其特征在于,所述步骤(e)还包括如下步骤:
(e1)查询邻居节点列表,选择复制的目标节点,而且必须保证复制之前在该目标节点上没有将被复制的目录树;
(e2)对将被复制的目录树设置操作开始标记mark1,记录此时间标记后的请求的命令序列ProcedureQueue;
(e3)源节点启动同步锁,此时目录树不能对外服务;
(e4)源节点向目标节点发送目录树,目标节点重新构建目录树;
(e5)源节点向目标节点发送ProcedureQueue,目标节点按照ProcedureQueue更新目录树;
(e6)目标节点将目录树的主副本节点设置为源节点;
(e7)更新源节点和目标节点的目录树的访问热度,通常为原来访问热度的一半;
(e8)关闭同步锁,源节点和目标节点重新对外服务。
13.如权利要求4所述的分布式文件系统中元数据管理的负载均衡的方法,其特征在于,所述步骤(3)还包括如下步骤:
(3a)查询邻居节点列表,根据各节点的负载信息,作出决策,选择过载节点和过轻节点;
(3b)根据过载节点和过轻节点的负载,计算需要迁移的负载,然后将计算出来的负载量映射为访问热度,根据访问热度来选择将被迁移的目录树;
(3c)对目录树设置操作开始标记mark1,记录此时间标记后的请求的命令序列ProcedureQueue;
(3d)过载节点向过轻节点发送目录树,过轻节点重新构建目录树;
(3e)过载节点向过轻节点发送ProcedureQueue,过轻节点按照ProcedureQueue更新目录树;
(3f)过载节点删除目录树;
(3g)关闭同步锁,过轻节点对外服务。
14.如权利要求13所述的分布式文件系统中元数据管理的负载均衡的方法,其特征在于,所述负载映射为访问热度的计算公式如下:
popularity = f ( workload ) = ∂ i · workload i
(if workload∈workloadk,则
Figure F2009101784585C0000052
其中,i和k均表示为元数据服务节点的节点标识;
workloadi表示节点标识为i的元数据服务节点的工作负载;
popularity表示为元数据访问热度;
Figure F2009101784585C0000053
表示节点标识为i的元数据服务节点从工作负载映射到访问热度的映射参数。
CN200910178458A 2009-10-10 2009-10-10 分布式文件系统中元数据管理的负载均衡方法及其系统 Pending CN101697526A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN200910178458A CN101697526A (zh) 2009-10-10 2009-10-10 分布式文件系统中元数据管理的负载均衡方法及其系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200910178458A CN101697526A (zh) 2009-10-10 2009-10-10 分布式文件系统中元数据管理的负载均衡方法及其系统

Publications (1)

Publication Number Publication Date
CN101697526A true CN101697526A (zh) 2010-04-21

Family

ID=42142600

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200910178458A Pending CN101697526A (zh) 2009-10-10 2009-10-10 分布式文件系统中元数据管理的负载均衡方法及其系统

Country Status (1)

Country Link
CN (1) CN101697526A (zh)

Cited By (54)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101980192A (zh) * 2010-10-15 2011-02-23 中兴通讯股份有限公司 一种基于对象的集群文件系统管理方法及集群文件系统
CN102110146A (zh) * 2011-02-16 2011-06-29 清华大学 基于键值key-value存储的分布式文件系统元数据管理方法
CN102223419A (zh) * 2011-07-05 2011-10-19 北京邮电大学 面向网络化操作系统的虚拟资源动态反馈均衡分配机制
CN102244685A (zh) * 2011-08-11 2011-11-16 中国科学院软件研究所 一种支持负载均衡的分布式缓存动态伸缩方法及系统
CN102281329A (zh) * 2011-08-02 2011-12-14 北京邮电大学 一种PaaS云平台的资源调度方法和系统
CN102739622A (zh) * 2011-04-15 2012-10-17 北京兴宇中科科技开发股份有限公司 一种可扩展的数据存储系统
CN103036994A (zh) * 2012-12-18 2013-04-10 曙光信息产业(北京)有限公司 实现负载均衡的云存储系统
CN103095804A (zh) * 2011-12-13 2013-05-08 微软公司 集群存储系统中的负载平衡
WO2014008652A1 (zh) * 2012-07-12 2014-01-16 华为技术有限公司 元数据管理方法和装置
CN103688257A (zh) * 2012-11-27 2014-03-26 华为技术有限公司 元数据管理方法和装置
CN103761275A (zh) * 2014-01-09 2014-04-30 浪潮电子信息产业股份有限公司 一种分布式文件系统中元数据的管理方法
CN103793534A (zh) * 2014-02-28 2014-05-14 苏州博纳讯动软件有限公司 分布式文件系统及均衡元数据存储和访问负载的实现方法
CN104408106A (zh) * 2014-11-20 2015-03-11 浙江大学 一种用于分布式文件系统中大数据查询的调度方法
CN104484460A (zh) * 2014-12-29 2015-04-01 浪潮(北京)电子信息产业有限公司 一种分布式文件系统元数据热度统计方法
CN104484470A (zh) * 2014-12-31 2015-04-01 天津南大通用数据技术股份有限公司 一种数据库集群元数据管理方法
CN104580471A (zh) * 2015-01-12 2015-04-29 浪潮电子信息产业股份有限公司 一种提升元数据集群性能的方法
CN104580322A (zh) * 2013-10-25 2015-04-29 华为技术有限公司 一种分布式数据流处理方法及装置
CN104580536A (zh) * 2015-02-06 2015-04-29 浪潮电子信息产业股份有限公司 一种元数据集群负载平衡实现方法
CN104809211A (zh) * 2015-04-30 2015-07-29 苏州星熙数据科技有限公司 一种基于HBase高扩展性数据库设计方法
CN104917642A (zh) * 2014-03-11 2015-09-16 深圳业拓讯通信科技有限公司 一种端口镜像数据传输方法及其系统
CN104994156A (zh) * 2015-07-01 2015-10-21 北京京东尚科信息技术有限公司 一种集群的负载均衡方法及系统
CN105230009A (zh) * 2014-05-10 2016-01-06 苏州阔地网络科技有限公司 一种负载均衡处理方法及系统
CN105302817A (zh) * 2014-06-25 2016-02-03 苏宁云商集团股份有限公司 分布式文件系统管理方法和装置
CN105389368A (zh) * 2015-11-16 2016-03-09 天津南大通用数据技术股份有限公司 一种mpp架构数据库集群元数据管理方法
CN105389392A (zh) * 2015-12-18 2016-03-09 浪潮(北京)电子信息产业有限公司 一种元数据负载统计方法与系统
CN105553774A (zh) * 2015-12-23 2016-05-04 厦门市美亚柏科信息股份有限公司 一种互联网数据采集方法及系统
WO2016146023A1 (zh) * 2015-03-19 2016-09-22 阿里巴巴集团控股有限公司 分布式计算系统和方法
CN106294440A (zh) * 2015-05-27 2017-01-04 阿里巴巴集团控股有限公司 数据实时迁移的方法和装置
CN106506605A (zh) * 2016-10-14 2017-03-15 华南理工大学 一种基于微服务架构的SaaS应用构建方法
CN103746839B (zh) * 2013-12-27 2017-06-16 新浪网技术(中国)有限公司 PaaS系统和PaaS应用池中的VM节点调度方法
CN106936899A (zh) * 2017-02-25 2017-07-07 九次方大数据信息集团有限公司 分布式统计分析系统的配置方法及分布式统计分析系统
CN107145307A (zh) * 2017-04-27 2017-09-08 郑州云海信息技术有限公司 一种基于分布式存储的动态元数据优化方法和系统
CN107317864A (zh) * 2017-06-29 2017-11-03 郑州云海信息技术有限公司 一种存储设备的数据均衡方法及装置
CN107436813A (zh) * 2017-08-03 2017-12-05 郑州云海信息技术有限公司 一种元数据服务器动态负载均衡的方法及系统
WO2018000991A1 (zh) * 2016-06-30 2018-01-04 华为技术有限公司 一种数据均衡方法和装置
CN107562757A (zh) * 2016-07-01 2018-01-09 阿里巴巴集团控股有限公司 基于分布式文件系统的查询、访问方法、装置及系统
CN107590249A (zh) * 2017-09-18 2018-01-16 郑州云海信息技术有限公司 一种分布式文件系统的负载平衡方法、装置及设备
CN107679193A (zh) * 2017-10-09 2018-02-09 郑州云海信息技术有限公司 一种用于分布式文件系统的热度统计方法和系统
CN107689876A (zh) * 2016-08-04 2018-02-13 上海德拓信息技术股份有限公司 分布式对象存储系统中元数据的分布管理方法
CN107766159A (zh) * 2017-11-13 2018-03-06 郑州云海信息技术有限公司 一种元数据管理方法、装置和计算机可读存储介质
CN107870954A (zh) * 2016-09-28 2018-04-03 中国移动通信集团广东有限公司 一种分布式数据库的扩展方法及装置
CN108810115A (zh) * 2018-05-29 2018-11-13 电子科技大学 一种适用于分布式数据库的负载均衡方法、装置及服务器
CN108846114A (zh) * 2018-06-26 2018-11-20 郑州云海信息技术有限公司 分布式系统控制方法、装置、设备及可读存储介质
CN110019870A (zh) * 2017-12-29 2019-07-16 浙江宇视科技有限公司 基于内存图像集群的图像检索方法及系统
CN110162273A (zh) * 2019-05-28 2019-08-23 北京计算机技术及应用研究所 一种基于分布式存储系统的衰减式分层存储系统及方法
CN111338801A (zh) * 2020-02-29 2020-06-26 苏州浪潮智能科技有限公司 一种实现元数据负载均衡的子树迁移方法、装置
CN112256438A (zh) * 2020-06-28 2021-01-22 腾讯科技(深圳)有限公司 负载均衡控制方法和装置、存储介质及电子设备
CN112346940A (zh) * 2019-08-08 2021-02-09 北京神州泰岳软件股份有限公司 一种性能采集方法、装置和设备
CN112564978A (zh) * 2020-12-16 2021-03-26 中盈优创资讯科技有限公司 一种基于元数据注册的设备配置服务选择方法
CN112749004A (zh) * 2019-10-30 2021-05-04 中国移动通信集团安徽有限公司 基于节点访问热度的数据存储方法及装置
CN113360455A (zh) * 2021-07-16 2021-09-07 北京天融信网络安全技术有限公司 一种超融合系统的数据处理方法、装置、设备及介质
CN113608876A (zh) * 2021-08-12 2021-11-05 中国科学技术大学 基于负载类型感知的分布式文件系统元数据负载均衡方法
CN113630383A (zh) * 2021-07-08 2021-11-09 付腾瑶 一种边云协同的方法及装置
CN117032996A (zh) * 2023-10-09 2023-11-10 湖南中青能科技有限公司 一种电力元数据管理方法及系统

Cited By (83)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101980192A (zh) * 2010-10-15 2011-02-23 中兴通讯股份有限公司 一种基于对象的集群文件系统管理方法及集群文件系统
CN101980192B (zh) * 2010-10-15 2014-03-12 中兴通讯股份有限公司南京分公司 一种基于对象的集群文件系统管理方法及集群文件系统
CN102110146A (zh) * 2011-02-16 2011-06-29 清华大学 基于键值key-value存储的分布式文件系统元数据管理方法
CN102739622A (zh) * 2011-04-15 2012-10-17 北京兴宇中科科技开发股份有限公司 一种可扩展的数据存储系统
CN102223419A (zh) * 2011-07-05 2011-10-19 北京邮电大学 面向网络化操作系统的虚拟资源动态反馈均衡分配机制
CN102281329B (zh) * 2011-08-02 2013-11-20 北京邮电大学 一种PaaS云平台的资源调度方法和系统
CN102281329A (zh) * 2011-08-02 2011-12-14 北京邮电大学 一种PaaS云平台的资源调度方法和系统
CN102244685B (zh) * 2011-08-11 2013-09-18 中国科学院软件研究所 一种支持负载均衡的分布式缓存动态伸缩方法及系统
CN102244685A (zh) * 2011-08-11 2011-11-16 中国科学院软件研究所 一种支持负载均衡的分布式缓存动态伸缩方法及系统
CN103095804A (zh) * 2011-12-13 2013-05-08 微软公司 集群存储系统中的负载平衡
CN103095804B (zh) * 2011-12-13 2016-11-16 微软技术许可有限责任公司 用于在集群存储系统中进行负载平衡的方法和系统
WO2014008652A1 (zh) * 2012-07-12 2014-01-16 华为技术有限公司 元数据管理方法和装置
CN104054294B (zh) * 2012-07-12 2017-04-26 华为技术有限公司 元数据管理方法和装置
CN104054294A (zh) * 2012-07-12 2014-09-17 华为技术有限公司 元数据管理方法和装置
CN103688257B (zh) * 2012-11-27 2017-04-26 华为技术有限公司 元数据管理方法和装置
CN103688257A (zh) * 2012-11-27 2014-03-26 华为技术有限公司 元数据管理方法和装置
CN103036994A (zh) * 2012-12-18 2013-04-10 曙光信息产业(北京)有限公司 实现负载均衡的云存储系统
CN103036994B (zh) * 2012-12-18 2015-08-19 曙光信息产业(北京)有限公司 实现负载均衡的云存储系统
CN104580322A (zh) * 2013-10-25 2015-04-29 华为技术有限公司 一种分布式数据流处理方法及装置
WO2015058525A1 (zh) * 2013-10-25 2015-04-30 华为技术有限公司 一种分布式数据流处理方法及装置
CN104580322B (zh) * 2013-10-25 2019-02-12 华为技术有限公司 一种分布式数据流处理方法及装置
CN103746839B (zh) * 2013-12-27 2017-06-16 新浪网技术(中国)有限公司 PaaS系统和PaaS应用池中的VM节点调度方法
CN103761275B (zh) * 2014-01-09 2018-04-13 广东浪潮大数据研究有限公司 一种分布式文件系统中元数据的管理方法
CN103761275A (zh) * 2014-01-09 2014-04-30 浪潮电子信息产业股份有限公司 一种分布式文件系统中元数据的管理方法
CN103793534A (zh) * 2014-02-28 2014-05-14 苏州博纳讯动软件有限公司 分布式文件系统及均衡元数据存储和访问负载的实现方法
CN103793534B (zh) * 2014-02-28 2017-09-08 苏州博纳讯动软件有限公司 分布式文件系统及均衡元数据存储和访问负载的实现方法
CN104917642A (zh) * 2014-03-11 2015-09-16 深圳业拓讯通信科技有限公司 一种端口镜像数据传输方法及其系统
CN104917642B (zh) * 2014-03-11 2019-03-22 深圳业拓讯通信科技有限公司 一种端口镜像数据传输方法及其系统
CN105230009A (zh) * 2014-05-10 2016-01-06 苏州阔地网络科技有限公司 一种负载均衡处理方法及系统
CN105302817A (zh) * 2014-06-25 2016-02-03 苏宁云商集团股份有限公司 分布式文件系统管理方法和装置
CN105302817B (zh) * 2014-06-25 2019-10-01 苏宁云计算有限公司 分布式文件系统管理方法和装置
CN104408106B (zh) * 2014-11-20 2017-07-07 浙江大学 一种用于分布式文件系统中大数据查询的调度方法
CN104408106A (zh) * 2014-11-20 2015-03-11 浙江大学 一种用于分布式文件系统中大数据查询的调度方法
CN104484460A (zh) * 2014-12-29 2015-04-01 浪潮(北京)电子信息产业有限公司 一种分布式文件系统元数据热度统计方法
CN104484470B (zh) * 2014-12-31 2018-06-08 天津南大通用数据技术股份有限公司 一种数据库集群元数据管理方法
CN104484470A (zh) * 2014-12-31 2015-04-01 天津南大通用数据技术股份有限公司 一种数据库集群元数据管理方法
CN104580471A (zh) * 2015-01-12 2015-04-29 浪潮电子信息产业股份有限公司 一种提升元数据集群性能的方法
CN104580536A (zh) * 2015-02-06 2015-04-29 浪潮电子信息产业股份有限公司 一种元数据集群负载平衡实现方法
CN106034160A (zh) * 2015-03-19 2016-10-19 阿里巴巴集团控股有限公司 分布式计算系统和方法
WO2016146023A1 (zh) * 2015-03-19 2016-09-22 阿里巴巴集团控股有限公司 分布式计算系统和方法
CN106034160B (zh) * 2015-03-19 2019-06-11 阿里巴巴集团控股有限公司 分布式计算系统和方法
CN104809211A (zh) * 2015-04-30 2015-07-29 苏州星熙数据科技有限公司 一种基于HBase高扩展性数据库设计方法
CN106294440A (zh) * 2015-05-27 2017-01-04 阿里巴巴集团控股有限公司 数据实时迁移的方法和装置
CN106294440B (zh) * 2015-05-27 2019-06-07 阿里巴巴集团控股有限公司 数据实时迁移的方法和装置
CN104994156A (zh) * 2015-07-01 2015-10-21 北京京东尚科信息技术有限公司 一种集群的负载均衡方法及系统
CN105389368A (zh) * 2015-11-16 2016-03-09 天津南大通用数据技术股份有限公司 一种mpp架构数据库集群元数据管理方法
CN105389392A (zh) * 2015-12-18 2016-03-09 浪潮(北京)电子信息产业有限公司 一种元数据负载统计方法与系统
CN105553774A (zh) * 2015-12-23 2016-05-04 厦门市美亚柏科信息股份有限公司 一种互联网数据采集方法及系统
WO2018000991A1 (zh) * 2016-06-30 2018-01-04 华为技术有限公司 一种数据均衡方法和装置
CN107562757A (zh) * 2016-07-01 2018-01-09 阿里巴巴集团控股有限公司 基于分布式文件系统的查询、访问方法、装置及系统
CN107562757B (zh) * 2016-07-01 2021-08-10 阿里巴巴集团控股有限公司 基于分布式文件系统的查询、访问方法、装置及系统
CN107689876A (zh) * 2016-08-04 2018-02-13 上海德拓信息技术股份有限公司 分布式对象存储系统中元数据的分布管理方法
CN107870954A (zh) * 2016-09-28 2018-04-03 中国移动通信集团广东有限公司 一种分布式数据库的扩展方法及装置
CN106506605B (zh) * 2016-10-14 2020-09-22 华南理工大学 一种基于微服务架构的SaaS应用构建方法
CN106506605A (zh) * 2016-10-14 2017-03-15 华南理工大学 一种基于微服务架构的SaaS应用构建方法
CN106936899A (zh) * 2017-02-25 2017-07-07 九次方大数据信息集团有限公司 分布式统计分析系统的配置方法及分布式统计分析系统
CN107145307A (zh) * 2017-04-27 2017-09-08 郑州云海信息技术有限公司 一种基于分布式存储的动态元数据优化方法和系统
CN107317864B (zh) * 2017-06-29 2020-08-21 苏州浪潮智能科技有限公司 一种存储设备的数据均衡方法及装置
CN107317864A (zh) * 2017-06-29 2017-11-03 郑州云海信息技术有限公司 一种存储设备的数据均衡方法及装置
CN107436813A (zh) * 2017-08-03 2017-12-05 郑州云海信息技术有限公司 一种元数据服务器动态负载均衡的方法及系统
CN107590249A (zh) * 2017-09-18 2018-01-16 郑州云海信息技术有限公司 一种分布式文件系统的负载平衡方法、装置及设备
CN107679193A (zh) * 2017-10-09 2018-02-09 郑州云海信息技术有限公司 一种用于分布式文件系统的热度统计方法和系统
CN107766159A (zh) * 2017-11-13 2018-03-06 郑州云海信息技术有限公司 一种元数据管理方法、装置和计算机可读存储介质
CN110019870A (zh) * 2017-12-29 2019-07-16 浙江宇视科技有限公司 基于内存图像集群的图像检索方法及系统
CN108810115A (zh) * 2018-05-29 2018-11-13 电子科技大学 一种适用于分布式数据库的负载均衡方法、装置及服务器
CN108810115B (zh) * 2018-05-29 2020-12-01 电子科技大学 一种适用于分布式数据库的负载均衡方法、装置及服务器
CN108846114A (zh) * 2018-06-26 2018-11-20 郑州云海信息技术有限公司 分布式系统控制方法、装置、设备及可读存储介质
CN110162273A (zh) * 2019-05-28 2019-08-23 北京计算机技术及应用研究所 一种基于分布式存储系统的衰减式分层存储系统及方法
CN112346940B (zh) * 2019-08-08 2024-06-07 北京神州泰岳软件股份有限公司 一种性能采集方法、装置和设备
CN112346940A (zh) * 2019-08-08 2021-02-09 北京神州泰岳软件股份有限公司 一种性能采集方法、装置和设备
CN112749004A (zh) * 2019-10-30 2021-05-04 中国移动通信集团安徽有限公司 基于节点访问热度的数据存储方法及装置
CN112749004B (zh) * 2019-10-30 2023-09-05 中国移动通信集团安徽有限公司 基于节点访问热度的数据存储方法及装置
CN111338801B (zh) * 2020-02-29 2022-12-23 苏州浪潮智能科技有限公司 一种实现元数据负载均衡的子树迁移方法、装置
CN111338801A (zh) * 2020-02-29 2020-06-26 苏州浪潮智能科技有限公司 一种实现元数据负载均衡的子树迁移方法、装置
CN112256438A (zh) * 2020-06-28 2021-01-22 腾讯科技(深圳)有限公司 负载均衡控制方法和装置、存储介质及电子设备
CN112564978A (zh) * 2020-12-16 2021-03-26 中盈优创资讯科技有限公司 一种基于元数据注册的设备配置服务选择方法
CN113630383A (zh) * 2021-07-08 2021-11-09 付腾瑶 一种边云协同的方法及装置
CN113360455A (zh) * 2021-07-16 2021-09-07 北京天融信网络安全技术有限公司 一种超融合系统的数据处理方法、装置、设备及介质
CN113360455B (zh) * 2021-07-16 2024-02-02 北京天融信网络安全技术有限公司 一种超融合系统的数据处理方法、装置、设备及介质
CN113608876A (zh) * 2021-08-12 2021-11-05 中国科学技术大学 基于负载类型感知的分布式文件系统元数据负载均衡方法
CN113608876B (zh) * 2021-08-12 2024-03-29 中国科学技术大学 基于负载类型感知的分布式文件系统元数据负载均衡方法
CN117032996A (zh) * 2023-10-09 2023-11-10 湖南中青能科技有限公司 一种电力元数据管理方法及系统
CN117032996B (zh) * 2023-10-09 2023-12-22 湖南中青能科技有限公司 一种电力元数据管理方法及系统

Similar Documents

Publication Publication Date Title
CN101697526A (zh) 分布式文件系统中元数据管理的负载均衡方法及其系统
EP3596619B1 (en) Methods, devices and systems for maintaining consistency of metadata and data across data centers
CN102521269B (zh) 一种基于索引的计算机连续数据保护方法
US20190188406A1 (en) Dynamic quorum membership changes
US9460008B1 (en) Efficient garbage collection for a log-structured data store
CN102855284B (zh) 一种集群存储系统的数据管理方法及系统
US10853242B2 (en) Deduplication and garbage collection across logical databases
CN101866305B (zh) 支持数据查询和快速恢复的连续数据保护方法及系统
CA2756046C (en) Intelligent tiers of backup data
EP2411918B1 (en) Virtualized data storage system architecture
CN106775446B (zh) 基于固态硬盘加速的分布式文件系统小文件访问方法
US20100257403A1 (en) Restoration of a system from a set of full and partial delta system snapshots across a distributed system
US8930364B1 (en) Intelligent data integration
CN102904949B (zh) 一种基于副本的动态元数据集群系统
US20150095282A1 (en) Multi-site heat map management
CN107885758A (zh) 一种虚拟节点的数据迁移方法和虚拟节点
CN104516967A (zh) 一种电力系统海量数据管理系统及其使用方法
CN103530387A (zh) 一种hdfs针对小文件的改进方法
CN109299056B (zh) 一种基于分布式文件系统的数据同步方法和装置
CN102937964B (zh) 基于分布式系统的智能数据服务方法
WO2020134364A1 (zh) 一种虚拟机迁移方法、云计算管理平台和存储介质
CN103533058A (zh) 面向HDFS/Hadoop存储集群的资源监控系统及方法
CN103631894A (zh) 一种基于hdfs的动态副本管理方法
CN104735110A (zh) 元数据管理方法和系统
CN114780252B (zh) 数据仓库系统的资源管理方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Open date: 20100421