CN104023088A - 一种应用于分布式文件系统的存储服务器选择方法 - Google Patents

一种应用于分布式文件系统的存储服务器选择方法 Download PDF

Info

Publication number
CN104023088A
CN104023088A CN201410301901.4A CN201410301901A CN104023088A CN 104023088 A CN104023088 A CN 104023088A CN 201410301901 A CN201410301901 A CN 201410301901A CN 104023088 A CN104023088 A CN 104023088A
Authority
CN
China
Prior art keywords
storage server
performance
server
data storage
evaluation value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410301901.4A
Other languages
English (en)
Other versions
CN104023088B (zh
Inventor
袁东风
刘亚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong University
Original Assignee
Shandong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong University filed Critical Shandong University
Priority to CN201410301901.4A priority Critical patent/CN104023088B/zh
Publication of CN104023088A publication Critical patent/CN104023088A/zh
Application granted granted Critical
Publication of CN104023088B publication Critical patent/CN104023088B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

一种应用于分布式文件系统的存储服务器选择方法,属于分布式存储技术领域。在分布式集群环境中,针对客户端的写文件请求,元数据管理服务器在选择数据存储服务器时,综合考虑存储服务器的节点状态,包括存储空间空闲率、内存使用率和CPU使用率,动态评价当前服务器的整体性能,作为数据存储服务器选择方法的评价依据,避免因为存储空间不足、服务器CPU、内存这些属性的满载节点而导致数据存储任务的延迟以及失败,提高分布式文件系统存储任务的效率。

Description

一种应用于分布式文件系统的存储服务器选择方法
技术领域
本发明涉及分布式存储技术领域,更确切的说,是一种应用于分布式文件系统的存储服务器选择方法。
背景技术
随着云计算迅速发展,IT界进入“云”时代,云计算中会产生海量的数据存储,传统的文件系统已不能满足其性能要求,作为云存储的核心基础平台,分布式文件系统的重要性日益凸显。分布式文件系统是将分布于不同服务器上的文件组合为单一的名称空间,并使得在网络上建立一个单一的、层次化的文件系统。
分布式文件系统采用可扩展的系统结构,可以实现冗余存储、文件同步、系统容错、故障恢复等原本需要人工手动才能实现的功能,大大降低维护难度,不但提高了系统的可靠性、可用性和存取效率,更易于扩展,可以有效存储并管理利用海量数据。
分布式文件系统主要采用的是主从式服务器架构,将文件数据分成固定大小文件块分散存储在多台通过网络连接起来的计算机节点上,这种模式存在一些节点分配的文件块过多,而另外一些节点却是空闲的,导致系统的数据存储服务器之间数据块分配不均衡问题。数据存储服务器选择方法是分布式文件系统的研究核心之一,是否有好的数据存储服务器选择方法直接影响系统的性能。
现有的应用在分布式文件系统的存储服务器选择方法,当系统进行写文件操作选择存储服务器时,对存储服务器性能的评价标准较为单一,无法综合反映当前存储服务器的性能。申请号为201110259333.2、发明名称为【一种分布式系统的服务负载均衡方法及装置】的发明专利,公开了一种分布式系统的服务负载均衡方法,在进行负载均衡时考虑了服务器的负荷情况和对应的各网口流量,但是没有考虑存储服务器的存储空间利用率,针对分布式存储问题,不能保证存储容量大小对存储节点选择的影响。其他已有的分布式文件系统架构,考虑了存储服务器的存储空间,却没有考虑服务器的负荷性能,在进行分布式存储处理时不能综合考量服务器性能。
发明内容
针对以上缺陷和不足,本发明提出了一种应用于分布式文件系统的存储服务器选择方法,以解决在分布式文件系统中存储服务器选择方法评价标准较为单一的问题。
为了达到上述目的,本发明采用如下的技术方案:
一种应用于分布式文件系统的存储服务器选择方法,在分布式集群环境中,针对客户端的写文件请求,元数据管理服务器在选择数据存储服务器时,综合考虑存储服务器的节点状态,包括存储空间空闲率、内存使用率和CPU使用率,采用线性评价函数模型计算存储器性能权值,动态评价当前服务器的整体性能,作为数据存储服务器选择方法的评价依据,该方法步骤如下:
(1)为数据存储服务器的性能评价值Ci赋初值
CI初始值为大于0小于1的随机数,当客户端发起写文件请求时,元数据管理服务器对数据存储服务器进行轮询,选择评价值Ci>1的数据存储服务器进行写文件操作,当评价值Ci>1的数据存储服务器个数小于所需文件副本数时,则根据存储服务器的性能权重值wi更新存储服务器的性能评价值Ci
(2)计算存储服务器的性能权重值wi
综合考虑服务器的性能评价标准,存储服务器的性能权重用以下几个指标综合量度:存储空间空闲率si,内存利用率memi,CPU利用率cpui,采用线性加权评价函数模型,存储服务器的性能权值wi可以表示为:
wi=k1×si+k2(1-memi)+k3(1-cpui)
其中,存储空间空闲率totalspacei表示存储服务器的总存储空间,usedspacei表示存储服务器已使用存储空间,k1、k2、k3分别为节点状态存储空间空闲率、内存使用率和CPU使用率的加权系数,k1、k2、k3的值根据经验确定,并且满足k1+k2+k3=1;
由wi的计算公式可以看出,存储服务器的存储空间空闲率越大,内存利用率越小,CPU利用率越小,wi的权值越大;
(3)更新存储服务器的性能评价值
根据上述计算的存储服务器的性能权值wi与存储服务器的性能评价值Ci相加,以更新存储服务器的性能评价值,即Ci=Ci+wi,直至性能评价值Ci大于1的存储服务器个数等于所需文件副本数;
(4)对存储服务器性能评价值Ci排序并选出最大值进行写文件操作
将存储服务器性能评价值Ci从大到小进行排序,选出性能评价值Ci最大的存储服务器,进行写文件操作,将客户端所要写入的文件块存入所选的数据存储服务器;
(5)写文件操作结束后,将所选的数据存储服务器的性能评价值Ci减1,即更新为Ci=Ci-1,然后转入步骤(1),更新后的Ci作为下一次循环的初始值。
本发明的有益效果如下,针对分布式文件系统中客户端的写文件操作,在选择数据存储服务器时考虑存储服务器存储空间空闲率,服务器内存使用率、CPU使用率等服务器节点状态,采用线性评价函数模型计算存储器性能权值,动态评价当前服务器的整体性能,作为数据存储服务器选择方法的评价依据。避免因为存储空间利用率、CPU使用率、内存使用率这些属性的满载节点而导致数据传输任务的延迟以及失败,提高存储任务的效率。
附图说明
图1为本发明方法的流程示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步说明,但不限于此。
实施例:
本发明实施例如图1所示,一种应用于分布式文件系统的存储服务器选择方法,在分布式集群环境中,针对客户端的写文件请求,元数据管理服务器在选择数据存储服务器时,综合考虑存储服务器的节点状态,包括存储空间空闲率、内存使用率和CPU使用率,采用线性评价函数模型计算存储器性能权值,动态评价当前服务器的整体性能,作为数据存储服务器选择方法的评价依据,该方法步骤如下:
(1)为数据存储服务器的性能评价值Ci赋初值
Ci初始值为大于0小于1的随机数,当客户端发起写文件请求时,元数据管理服务器对数据存储服务器进行轮询,选择评价值Ci>1的数据存储服务器进行写文件操作,当评价值Ci>1的数据存储服务器个数小于所需文件副本数时,则根据存储服务器的性能权重值wi更新存储服务器的性能评价值Ci
(2)计算存储服务器的性能权重值wi
综合考虑服务器的性能评价标准,存储服务器的性能权重用以下几个指标综合量度:存储空间空闲率si,内存利用率memi,CPU利用率cpui,采用线性加权评价函数模型,存储服务器的性能权值wi可以表示为:
wi=k1×si+k2(1-memi)+k3(1-cpui)
其中,存储空间空闲率totalspacei表示存储服务器的总存储空间,usedspacei表示存储服务器已使用存储空间,k1、k2、k3分别为节点状态存储空间空闲率、内存使用率和CPU使用率的加权系数,k1、k2、k3的值根据经验确定,并且满足k1+k2+k3=1;
由wi的计算公式可以看出,存储服务器的存储空间空闲率越大,内存利用率越小,CPU利用率越小,wi的权值越大;
(3)更新存储服务器的性能评价值
根据上述计算的存储服务器的性能权值wi与存储服务器的性能评价值Ci相加,以更新存储服务器的性能评价值,即Ci=Ci+wi,直至性能评价值Ci大于1的存储服务器个数等于所需文件副本数;
(4)对存储服务器性能评价值Ci排序并选出最大值进行写文件操作
将存储服务器性能评价值Ci从大到小进行排序,选出性能评价值Ci最大的存储服务器,进行写文件操作,将客户端所要写入的文件块存入所选的数据存储服务器;
(5)写文件操作结束后,将所选的数据存储服务器的性能评价值Ci减1,即更新为Ci=Ci-1,然后转入步骤(1),更新后的Ci作为下一次循环的初始值。

Claims (1)

1.一种应用于分布式文件系统的存储服务器选择方法,在分布式集群环境中,针对客户端的写文件请求,元数据管理服务器在选择数据存储服务器时,综合考虑存储服务器的节点状态,包括存储空间空闲率、内存使用率和CPU使用率,采用线性评价函数模型计算存储器性能权值,动态评价当前服务器的整体性能,作为数据存储服务器选择方法的评价依据,该方法步骤如下:
(1)为数据存储服务器的性能评价值Ci赋初值
Ci初始值为大于0小于1的随机数,当客户端发起写文件请求时,元数据管理服务器对数据存储服务器进行轮询,选择评价值Ci>1的数据存储服务器进行写文件操作,当评价值Ci>1的数据存储服务器个数小于所需文件副本数时,则根据存储服务器的性能权重值wi更新存储服务器的性能评价值Ci
(2)计算存储服务器的性能权重值wi
综合考虑服务器的性能评价标准,存储服务器的性能权重用以下几个指标综合量度:存储空间空闲率si,内存利用率memi,CPU利用率cpui,采用线性加权评价函数模型,存储服务器的性能权值wi可以表示为:
wi=k1×si+k2(1-memi)+k3(1-cpui)
其中,存储空间空闲率totalspacei表示存储服务器的总存储空间,usedspqcei表示存储服务器已使用存储空间,k1、k2、k3分别为节点状态存储空间空闲率、内存使用率和CPU使用率的加权系数,k1、k2、k3的值根据经验确定,并且满足k1+k2+k3=1;
由wi的计算公式可以看出,存储服务器的存储空间空闲率越大,内存利用率越小,CPU利用率越小,wi的权值越大;
(3)更新存储服务器的性能评价值
根据上述计算的存储服务器的性能权值wi与存储服务器的性能评价值Ci相加,以更新存储服务器的性能评价值,即Ci=Ci+wi,直至性能评价值Ci大于1的存储服务器个数等于所需文件副本数;
(4)对存储服务器性能评价值Ci排序并选出最大值进行写文件操作
将存储服务器性能评价值Ci从大到小进行排序,选出性能评价值Ci最大的存储服务器,进行写文件操作,将客户端所要写入的文件块存入所选的数据存储服务器;
(5)写文件操作结束后,将所选的数据存储服务器的性能评价值Ci减1,即更新为Ci=Ci-1,然后转入步骤(1),更新后的Ci作为下一次循环的初始值。
CN201410301901.4A 2014-06-28 2014-06-28 一种应用于分布式文件系统的存储服务器选择方法 Active CN104023088B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410301901.4A CN104023088B (zh) 2014-06-28 2014-06-28 一种应用于分布式文件系统的存储服务器选择方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410301901.4A CN104023088B (zh) 2014-06-28 2014-06-28 一种应用于分布式文件系统的存储服务器选择方法

Publications (2)

Publication Number Publication Date
CN104023088A true CN104023088A (zh) 2014-09-03
CN104023088B CN104023088B (zh) 2017-04-19

Family

ID=51439657

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410301901.4A Active CN104023088B (zh) 2014-06-28 2014-06-28 一种应用于分布式文件系统的存储服务器选择方法

Country Status (1)

Country Link
CN (1) CN104023088B (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104796496A (zh) * 2015-05-12 2015-07-22 国网智能电网研究院 一种基于云存储的负载均衡计算方法
CN105072201A (zh) * 2015-08-28 2015-11-18 北京奇艺世纪科技有限公司 一种分布式存储系统及其存储质量控制方法及装置
CN105847358A (zh) * 2016-03-24 2016-08-10 广东三盟信息科技有限公司 一种云计算环境下大数据节点分布的实现方法及其系统
CN106487936A (zh) * 2016-12-29 2017-03-08 深圳市优必选科技有限公司 数据传输方法及设备、分布式存储系统
CN106649401A (zh) * 2015-11-03 2017-05-10 阿里巴巴集团控股有限公司 分布式文件系统中的数据写入方法和装置
CN107766346A (zh) * 2016-08-15 2018-03-06 中国联合网络通信集团有限公司 分布式文件系统文件访问方法及装置
CN108228803A (zh) * 2017-12-29 2018-06-29 北京奇虎科技有限公司 一种文件的存储方法和装置
CN108600386A (zh) * 2018-05-09 2018-09-28 数据堂(北京)科技股份有限公司 一种提供数据服务的方法及系统
CN108875035A (zh) * 2018-06-25 2018-11-23 郑州云海信息技术有限公司 分布式文件系统的数据存储方法及相关设备
CN109831524A (zh) * 2019-03-11 2019-05-31 平安科技(深圳)有限公司 一种负载均衡处理方法及装置
CN110569170A (zh) * 2019-08-28 2019-12-13 深圳力维智联技术有限公司 服务器利用率的评价方法、装置、设备及其存储介质
CN111736772A (zh) * 2020-06-15 2020-10-02 中国工商银行股份有限公司 分布式文件系统的存储空间数据处理方法及装置
CN112148213A (zh) * 2020-08-20 2020-12-29 广东奥博信息产业股份有限公司 基于演化优化的标注数据存储服务器分配方法
CN113535483A (zh) * 2021-09-15 2021-10-22 统信软件技术有限公司 一种文件备份方法、装置及计算设备

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109358996B (zh) * 2018-10-08 2021-09-24 北京天弘瑞智科技有限公司 一种改变请求的处理方法及其处理系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007062258A2 (en) * 2005-11-28 2007-05-31 Storagedna, Inc. Distributed file system with file fragmentation
CN101610287A (zh) * 2009-06-16 2009-12-23 浙江大学 一种应用于分布式海量存储系统的负载均衡方法
CN102055650A (zh) * 2009-10-29 2011-05-11 华为技术有限公司 负载均衡方法及系统和管理服务器
CN102984184A (zh) * 2011-09-05 2013-03-20 上海可鲁系统软件有限公司 一种分布式系统的服务负载均衡方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007062258A2 (en) * 2005-11-28 2007-05-31 Storagedna, Inc. Distributed file system with file fragmentation
CN101610287A (zh) * 2009-06-16 2009-12-23 浙江大学 一种应用于分布式海量存储系统的负载均衡方法
CN102055650A (zh) * 2009-10-29 2011-05-11 华为技术有限公司 负载均衡方法及系统和管理服务器
CN102984184A (zh) * 2011-09-05 2013-03-20 上海可鲁系统软件有限公司 一种分布式系统的服务负载均衡方法及装置

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104796496A (zh) * 2015-05-12 2015-07-22 国网智能电网研究院 一种基于云存储的负载均衡计算方法
CN105072201B (zh) * 2015-08-28 2018-04-13 北京奇艺世纪科技有限公司 一种分布式存储系统及其存储质量控制方法及装置
CN105072201A (zh) * 2015-08-28 2015-11-18 北京奇艺世纪科技有限公司 一种分布式存储系统及其存储质量控制方法及装置
US11055360B2 (en) 2015-11-03 2021-07-06 Alibaba Group Holding Limited Data write-in method and apparatus in a distributed file system
WO2017076184A1 (zh) * 2015-11-03 2017-05-11 阿里巴巴集团控股有限公司 分布式文件系统中的数据写入方法和装置
CN106649401A (zh) * 2015-11-03 2017-05-10 阿里巴巴集团控股有限公司 分布式文件系统中的数据写入方法和装置
CN105847358A (zh) * 2016-03-24 2016-08-10 广东三盟信息科技有限公司 一种云计算环境下大数据节点分布的实现方法及其系统
CN107766346A (zh) * 2016-08-15 2018-03-06 中国联合网络通信集团有限公司 分布式文件系统文件访问方法及装置
CN106487936A (zh) * 2016-12-29 2017-03-08 深圳市优必选科技有限公司 数据传输方法及设备、分布式存储系统
CN108228803A (zh) * 2017-12-29 2018-06-29 北京奇虎科技有限公司 一种文件的存储方法和装置
CN108600386A (zh) * 2018-05-09 2018-09-28 数据堂(北京)科技股份有限公司 一种提供数据服务的方法及系统
CN108875035A (zh) * 2018-06-25 2018-11-23 郑州云海信息技术有限公司 分布式文件系统的数据存储方法及相关设备
CN108875035B (zh) * 2018-06-25 2022-02-18 郑州云海信息技术有限公司 分布式文件系统的数据存储方法及相关设备
CN109831524A (zh) * 2019-03-11 2019-05-31 平安科技(深圳)有限公司 一种负载均衡处理方法及装置
CN109831524B (zh) * 2019-03-11 2023-04-18 平安科技(深圳)有限公司 一种负载均衡处理方法及装置
CN110569170A (zh) * 2019-08-28 2019-12-13 深圳力维智联技术有限公司 服务器利用率的评价方法、装置、设备及其存储介质
CN111736772A (zh) * 2020-06-15 2020-10-02 中国工商银行股份有限公司 分布式文件系统的存储空间数据处理方法及装置
CN112148213A (zh) * 2020-08-20 2020-12-29 广东奥博信息产业股份有限公司 基于演化优化的标注数据存储服务器分配方法
CN112148213B (zh) * 2020-08-20 2022-11-29 广东奥博信息产业股份有限公司 基于演化优化的标注数据存储服务器分配方法
CN113535483A (zh) * 2021-09-15 2021-10-22 统信软件技术有限公司 一种文件备份方法、装置及计算设备

Also Published As

Publication number Publication date
CN104023088B (zh) 2017-04-19

Similar Documents

Publication Publication Date Title
CN104023088B (zh) 一种应用于分布式文件系统的存储服务器选择方法
CN103139302B (zh) 考虑负载均衡的实时副本调度方法
CN103150347B (zh) 基于文件热度的动态副本管理方法
CN102385554B (zh) 重复数据删除系统的优化方法
CN103929500A (zh) 一种分布式存储系统的数据分片方法
CN105025053A (zh) 基于云存储技术的分布式文件的上传方法及其系统
CN107450855B (zh) 一种用于分布式存储的模型可变的数据分布方法及系统
CN102306157B (zh) 数据中心环境下一种面向节能的高可靠数据存储方法
CN103929454A (zh) 一种云计算平台中负载均衡存储的方法和系统
CN107436813A (zh) 一种元数据服务器动态负载均衡的方法及系统
CN103595780A (zh) 基于消重的云计算资源调度方法
WO2016107610A1 (zh) 一种数据库集群的资源协调方法、装置及系统
CN103077197A (zh) 一种数据存储方法装置
CN105574153A (zh) 一种基于文件热度分析和K-means的副本放置方法
CN104580503A (zh) 一种高效动态负载均衡的处理大规模数据的系统及方法
CN105975345A (zh) 一种基于分布式内存的视频帧数据动态均衡存储管理方法
Liao et al. A QoS-aware dynamic data replica deletion strategy for distributed storage systems under cloud computing environments
CN107422989A (zh) 一种Server SAN系统多副本读取方法及存储架构
CN201804331U (zh) 一种基于协处理器的重复数据删除系统
CN102970349B (zh) 一种dht网络的存储负载均衡方法
CN104219163A (zh) 一种基于动态副本法和虚拟节点法的节点动态前移的负载均衡方法
CN101776946B (zh) 一种基于对象存储系统的功耗控制方法
CN110445803A (zh) 一种异构云平台的业务平滑迁移方法
CN113688115B (zh) 一种基于Hadoop的档案大数据分布式存储系统
CN106293537B (zh) 一种轻量级的数据密集型文件系统的自治块管理方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant