CN104462389B - 基于分级存储的分布式文件系统实现方法 - Google Patents

基于分级存储的分布式文件系统实现方法 Download PDF

Info

Publication number
CN104462389B
CN104462389B CN201410756537.0A CN201410756537A CN104462389B CN 104462389 B CN104462389 B CN 104462389B CN 201410756537 A CN201410756537 A CN 201410756537A CN 104462389 B CN104462389 B CN 104462389B
Authority
CN
China
Prior art keywords
data
migration
file system
distributed file
logical partition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410756537.0A
Other languages
English (en)
Other versions
CN104462389A (zh
Inventor
雍帅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Eisoo Information Technology Co Ltd
Original Assignee
Shanghai Eisoo Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Eisoo Information Technology Co Ltd filed Critical Shanghai Eisoo Information Technology Co Ltd
Priority to CN201410756537.0A priority Critical patent/CN104462389B/zh
Publication of CN104462389A publication Critical patent/CN104462389A/zh
Application granted granted Critical
Publication of CN104462389B publication Critical patent/CN104462389B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/182Distributed file systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种基于分级存储的分布式文件系统实现方法,包括以下步骤:1)对系统中的数据采用全局统一命名空间,建立无元数据服务的分布式文件系统;2)将整个分布式文件系统根据业务需要划分为不同的逻辑分区;3)对不同的逻辑分区选用不同的存储介质和存储方式;4)逻辑分区间的数据实现自动迁移,并对迁移后的数据进行数据重定位。与现有技术相比,本发明具有数据访问完全并行化、性能好、硬件成本低等优点。

Description

基于分级存储的分布式文件系统实现方法
技术领域
本发明涉及一种计算机存储技术领域,尤其是涉及一种基于分级存储的分布式文件系统实现方法。
背景技术
在过去的几年里产生的数据量比以往四万年的数据量还要多,大数据时代的来临已经毋庸置疑。面对数据爆炸式增长,需要的存储数量越来越多,并且不同的数据对存储的性能、要求保留的时间、被访问的频度差异很大,当采用采用单一形式的存储无法满足资金、性能、场地、法律法规等的综合要求。而传统的采用人工方式将数据存储到不同的存储系统的方式在海量数据面前已很难管理,容易出错,直接造成数据版本混乱,浪费存储空间。采用传统的数据备份时也恢复效率低,费时费力。总之使用传统的方式难以确保恰当的数据永远只保存在恰当位置。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种数据访问完全并行化、性能好、硬件成本低的基于分级存储的分布式文件系统实现方法,支持scale-out的横向扩展,无元数据服务,只需少量的高速设备实现全系统提速,热点数据自动分级管理,能够对不同区间的逻辑分区的采用不同介质,不同存储方式对数据进行存储。
本发明的目的可以通过以下技术方案来实现:
一种基于分级存储的分布式文件系统实现方法,其特征在于,包括以下步骤:
1)对系统中的数据采用全局统一命名空间,建立无元数据服务的分布式文件系统;
2)将整个分布式文件系统根据业务需要划分为不同的逻辑分区;
3)对不同的逻辑分区选用不同的存储介质和存储方式;
4)逻辑分区间的数据实现自动迁移,并对迁移后的数据进行数据重定位。
所述的分布式文件系统中的各个节点关系对等,并使用弹性哈希算法定位文件。
所述的不同的逻辑分区包括高速集群逻辑分区、半活动集群逻辑分区和低速集群逻辑分区。
所述的对不同的逻辑分区选用不同的存储介质具体为:
对高速集群逻辑分区选用大内存和固态硬盘的存储服务器;
对半活动集群逻辑分区选用SAS接口硬盘的存储服务器;
对低速集群逻辑分区选用SATA接口硬盘的存储服务器。
所述的对不同的逻辑分区选用不同的存储方式具体为:
对高速集群逻辑分区选用三副本的存储模式;
对半活动集群逻辑分区和低速集群逻辑分区选用二副本或单副本外加软RAID的存储模式。
所述的逻辑分区间的数据实现自动迁移具体为:
41)数据使用信息模块采集文件的使用频率、文件的大小、文件所处的逻辑分区信息;
42)数据迁移管理模块根据数据使用信息模块采集信息和用户设定的迁移策略,触发对数据的迁移操作;
43)数据迁移执行模块完成对数据的迁移。
所述的数据迁移管理模块根据数据使用信息模块采集信息和用户设定的迁移策略,触发对数据的迁移操作具体为:
①在高速集群逻辑分区中设置容量迁移阀值,当容量达到阀值时,开始启动迁移;
②首先需要考虑数据的使用频度,根据LRU算法准备迁移数据,其次需要考虑数据迁移的成本,迁移算法具体为:迁移值=使用频率*权重A1-文件大小*权重B1;
③对于半活动集群逻辑分区或低速集群逻辑分区的数据若经常被访问,需要考虑数据回迁,数据回迁的策略值为:回迁值=文件所在区间*权重A2+上级区间所剩空间*权重B2。
所述的数据迁移执行模块进行热迁移,即在数据的迁移的过程应该不能中断上层的相关业务。
所述的热迁移具体为:
当客户端访问的文件正在进行从逻辑分区A到逻辑分区B的迁移时,同步过程需要经过增量的迭代,只有当两边文件全部相同时,才能修改逻辑分区A的原有文件的元信息,将其定位到逻辑分区B上,同时将逻辑分区A上的数据删除已释放相应空间。
所述的对迁移后的数据进行数据重定位具体为:
(1)客户端根据文件定位算法直接访问原文件;
(2)根据当前文件的元信息,返回重定位操作;
(3)根据重定位信息访问新的文件位置;
(4)获取相应的文件操作。
与现有技术相比,本发明具有以下优点:
1)无元数据服务的设计使得文件定位不需要查询索引或者其他服务器,这使得数据访问完全并行化,从而实现真正的近线性扩展。
2)分级的存储管理,使得可以根据业务需求使用较少高速硬件设备,获得相对较高的整体性能,大大节省硬件成本。
3)不同分区使用不同存储方式满足用于在各个数据生命周期的不同应用需求。
4)用户根据业务需求制定相关迁移策略,管理数据的迁移。
5)热点数据的自动迁移,较低用户的使用门槛,以使得其能够在传统行业中推行。
附图说明
图1是无元数据服务的分布式分级存储文件系统整体示意图;
图2是数据迁移期间对文件访问示意图;
图3是迁移后数据访问示意图。
具体实施方式
下面结合附图和具体实施例对本发明进行详细说明。
本发明设计出分级存储的分布式文件系统,本发明的技术问题通过以下技术手段予以解决:
1)建立无元数据服务的分布式文件系统,在分布式系统下的各个节点关系对等,使用弹性哈希算法定位文件。
2)将将整个分布式文件系统根据业务需要划分为不同的逻辑子集群分区,一般可分为高速集群逻辑分区、半活动集群逻辑分区、低速集群逻辑分区。
3)在不同的逻辑分区中,选用不同的存储介质以达到不同的性能要求,如在高速集群逻辑分区选用拥有较大内存的和固态硬盘的存储服务器,而在半活动集群逻辑分区组要选用拥有SAS接口的硬盘的存储服务器。在低速集群逻辑分区中主要选择拥有SATA接口硬盘的存储服务器。
4)在不同的逻辑分区中采用不同的存储方式,如在高速集群逻辑分区中由于数据访问比较频繁,数据的高可用,高性能需求比较强烈可以使用三副本的存储模式,这样既能满足高性能的要求,也能在系统出现故障时自动的进行数据修复。而在半活动集群逻辑分区或低速集群逻辑分区中由于数据访问频率尤其数据的修改频率一般较低可以采用二副本或单副本外加软RAID的方式,这样出现故障时需要少量的人工参与,但一般出现频率较低对故障的解决也相对容易。
5)内嵌的数据使用信息模块完成对数据迁移触发所需的相关信息的采集。
6)用户可以根据业务需要设定相关的迁移参数和相关的迁移策略。数据迁移管理模块根据相关条件触发对数据的迁移操作。
7)数据迁移和回迁执行模块作为数据迁移的执行者完成对数据的搬迁。
8)由于文件系统本身没有元数据,需要对迁移后的数据通过数据的重定位以实现数据访问。
下面将结合本发明实施例中的附图,对本发明的技术方案进行清楚、完整地描述。此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1所示,本系统主要包括以下部分:
1)系统提供全局统一命名空间,数据具体处于何种逻辑分区对用户透明。
2)系统采用无元数据服务的模式建立,对文件定位采用一致性哈希算法。
3)根据存储节点的硬件配置和业务需求组建分布式存储系统并将系统划分为不同的逻辑分区,至少为两个逻辑分区,在实践中一般采用三级分层的模式可分为高速集群逻辑分区、半活动集群逻辑分区、低速集群逻辑分区。
4)一般高速分区中使用高速介质,低速分区采用低速介质,而在不同分区主要可使用的不同的存储方式为:①三副本分布式存储、②二副本分布式存储、③单副本无压缩软RIAD5存储、④单副本软RIAD5压缩存储、⑤高安全性控制存储。这五种存储方式中①为高可用高性能模块,能够在故障时能够自动保证数据的高可用,②的在使用有出现脑裂无法修复风险,但对修改较少时,一般是能够根据业务特点制定其脑裂的数据修复,③、④主要适用数据修改和使用频率都较低的场景,能够保证故障时有一定的错误缓冲期的应用场景。⑤主要针对数据安全性或法律法规的相关规定的特定存储区。
5)内嵌的数据使用信息模块主要采集文件的使用频率信息,文件的大小,文件所处的逻辑分区等信息。
6)根据上述的采集信息,完成对数据触发策略的分析,数据迁移促发策略作为系统的重要组成部分重点考虑数据迁移的效率,防止数据的频繁回迁引起系统的性能抖动,使得尽可能多的数据访问在高速逻辑分区中实现。具体步骤为:
①在高一级逻辑分区中设置容量迁移阀值如30%,当容量达到阀值时,开始启动迁移。
②首先需要考虑数据的使用频度,根据LRU算法准备迁移数据。其次需要考虑数据迁移的成本,如大文件的数据迁移的权重校高,应该尽量少的迁移。所以最终的迁移算法为:迁移值=使用频率*权重A1-文件大小*权重B1;
③对于低级的数据如果经常被访问,需要考虑数据回迁,数据回迁的策略值为:回迁值=文件所在区间*权重A2+上级区间所剩空间*权重B2;
7)在不同的逻辑分区间可根据相关策略实现数据的热迁移,在数据的迁移的过程应该不能中断上层的相关业务,如图2所示,在系统对某个文件迁移时,客户端仍然可以访问原有的数据文件,而当前此文件正在进行从逻辑分区A到逻辑分区B的迁移,由于数据迁移可能为耗费一段时间,所以在文件进行不同的过程中文件本身又发生修改,所以同步过程需要进过增量的迭代,只有当两边文件全部相同时,就可以修改逻辑分区A的原有文件的元信息,将其定位到逻辑分区B上。并将逻辑分区A上的数据删除已释放相应空间。经过重定位后的文件访问过程如图3所示:
①客户端根据文件定位算法直接访问原文件(逻辑分区A上文件);
②根据当前文件的元信息,返回重定位操作;
③根据重定位信息访问新的文件位置;
④获取相应的文件操作。
综上所述,本发明设计的无元数据服务的分布式分级存储文件系统能够实现渐线性水平扩展,数据的智能分级存储分布式存储。
当然,本发明还可有其他多种实施例,在不背离本发明精神及其实质的情况下,熟悉本领域的技术人员当可根据本发明作出各种相应的变化,但这些相应的变化都应属于本发明所附的权利要求的保护范围。

Claims (7)

1.一种基于分级存储的分布式文件系统实现方法,其特征在于,包括以下步骤:
1)对系统中的数据采用全局统一命名空间,建立无元数据服务的分布式文件系统;
2)将整个分布式文件系统根据业务需要划分为不同的逻辑分区;
3)对不同的逻辑分区选用不同的存储介质和存储方式;
4)逻辑分区间的数据实现自动迁移,并对迁移后的数据进行数据重定位;
所述的不同的逻辑分区包括高速集群逻辑分区、半活动集群逻辑分区和低速集群逻辑分区;
所述的逻辑分区间的数据实现自动迁移具体为:
41)数据使用信息模块采集文件的使用频率、文件的大小、文件所处的逻辑分区信息;
42)数据迁移管理模块根据数据使用信息模块采集信息和用户设定的迁移策略,触发对数据的迁移操作;
43)数据迁移执行模块完成对数据的迁移;
所述的数据迁移管理模块根据数据使用信息模块采集信息和用户设定的迁移策略,触发对数据的迁移操作具体为:
①在高速集群逻辑分区中设置容量迁移阀值,当容量达到阀值时,开始启动迁移;
②首先需要考虑数据的使用频度,根据LRU算法准备迁移数据,其次需要考虑数据迁移的成本,迁移算法具体为:迁移值=使用频率*权重A1-文件大小*权重B1;
③对于半活动集群逻辑分区或低速集群逻辑分区的数据若经常被访问,需要考虑数据回迁,数据回迁的策略值为:回迁值=文件所在区间*权重A2+上级区间所剩空间*权重B2。
2.根据权利要求1所述的一种基于分级存储的分布式文件系统实现方法,其特征在于,所述的分布式文件系统中的各个节点关系对等,并使用弹性哈希算法定位文件。
3.根据权利要求1所述的一种基于分级存储的分布式文件系统实现方法,其特征在于,所述的对不同的逻辑分区选用不同的存储介质具体为:
对高速集群逻辑分区选用大内存和固态硬盘的存储服务器;
对半活动集群逻辑分区选用SAS接口硬盘的存储服务器;
对低速集群逻辑分区选用SATA接口硬盘的存储服务器。
4.根据权利要求1所述的一种基于分级存储的分布式文件系统实现方法,其特征在于,所述的对不同的逻辑分区选用不同的存储方式具体为:
对高速集群逻辑分区选用三副本的存储模式;
对半活动集群逻辑分区和低速集群逻辑分区选用二副本或单副本外加软RAID的存储模式。
5.根据权利要求1所述的一种基于分级存储的分布式文件系统实现方法,其特征在于,所述的数据迁移执行模块进行热迁移,即在数据的迁移的过程应该不能中断上层的相关业务。
6.根据权利要求5所述的一种基于分级存储的分布式文件系统实现方法,其特征在于,所述的热迁移具体为:
当客户端访问的文件正在进行从逻辑分区A到逻辑分区B的迁移时,同步过程需要经过增量的迭代,只有当两边文件全部相同时,才能修改逻辑分区A的原有文件的元信息,将其定位到逻辑分区B上,同时将逻辑分区A上的数据删除已释放相应空间。
7.根据权利要求1所述的一种基于分级存储的分布式文件系统实现方法,其特征在于,所述的对迁移后的数据进行数据重定位具体为:
(1)客户端根据文件定位算法直接访问原文件;
(2)根据当前文件的元信息,返回重定位操作;
(3)根据重定位信息访问新的文件位置;
(4)获取相应的文件操作。
CN201410756537.0A 2014-12-10 2014-12-10 基于分级存储的分布式文件系统实现方法 Active CN104462389B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410756537.0A CN104462389B (zh) 2014-12-10 2014-12-10 基于分级存储的分布式文件系统实现方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410756537.0A CN104462389B (zh) 2014-12-10 2014-12-10 基于分级存储的分布式文件系统实现方法

Publications (2)

Publication Number Publication Date
CN104462389A CN104462389A (zh) 2015-03-25
CN104462389B true CN104462389B (zh) 2018-01-30

Family

ID=52908424

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410756537.0A Active CN104462389B (zh) 2014-12-10 2014-12-10 基于分级存储的分布式文件系统实现方法

Country Status (1)

Country Link
CN (1) CN104462389B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109857725A (zh) * 2019-02-20 2019-06-07 北京百度网讯科技有限公司 数据库管理方法及装置、服务器及计算机可读介质

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015112614A1 (en) 2014-01-21 2015-07-30 Oracle International Corporation System and method for supporting multi-tenancy in an application server, cloud, or other environment
CN106471472B (zh) * 2014-06-23 2020-03-03 甲骨文国际公司 用于多租户应用服务器环境中的分区迁移的系统和方法
CN105447086A (zh) * 2015-11-06 2016-03-30 深圳市网心科技有限公司 文件存储方法及实现该存储方法的服务器
CN107015989A (zh) * 2016-01-27 2017-08-04 博雅网络游戏开发(深圳)有限公司 数据处理方法和装置
CN107423422B (zh) * 2017-08-01 2019-09-24 武大吉奥信息技术有限公司 基于网格的空间数据分布式存储及检索方法和系统
CN107562375A (zh) * 2017-08-16 2018-01-09 广东电网有限责任公司东莞供电局 基于数据价值的多副本异构存储方法及架构
CN107798104A (zh) * 2017-10-31 2018-03-13 郑州云海信息技术有限公司 一种目录管理方法、装置、设备及计算机可读存储介质
CN109299089B (zh) * 2018-08-27 2020-05-26 广东电网有限责任公司信息中心 一种画像标签数据的计算及存储方法和计算及存储系统
CN110109872B (zh) * 2019-04-29 2021-12-07 北京空间飞行器总体设计部 一种遥感卫星异构数据统一存储管理装置
CN112115200B (zh) * 2020-09-16 2023-08-29 北京奇艺世纪科技有限公司 数据同步方法、装置、电子设备及可读存储介质
CN113138965B (zh) * 2021-05-06 2023-05-02 中国电子科技集团公司第三十八研究所 一种基于大文件的存储管理方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102724294A (zh) * 2012-05-24 2012-10-10 中国科学院深圳先进技术研究院 数据分布存储方法和系统
CN103106044A (zh) * 2012-12-13 2013-05-15 深圳先进技术研究院 分级存储节能方法
CN103150263A (zh) * 2012-12-13 2013-06-12 深圳先进技术研究院 分级存储方法
CN104050014A (zh) * 2014-05-23 2014-09-17 上海爱数软件有限公司 基于虚拟化平台的高效存储管理方法
CN104123237A (zh) * 2014-06-24 2014-10-29 中电科华云信息技术有限公司 海量小文件分级存储方法及系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102724294A (zh) * 2012-05-24 2012-10-10 中国科学院深圳先进技术研究院 数据分布存储方法和系统
CN103106044A (zh) * 2012-12-13 2013-05-15 深圳先进技术研究院 分级存储节能方法
CN103150263A (zh) * 2012-12-13 2013-06-12 深圳先进技术研究院 分级存储方法
CN104050014A (zh) * 2014-05-23 2014-09-17 上海爱数软件有限公司 基于虚拟化平台的高效存储管理方法
CN104123237A (zh) * 2014-06-24 2014-10-29 中电科华云信息技术有限公司 海量小文件分级存储方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
GlusterFS集群文件系统研究;刘爱贵;《http://blog.csdn.net/liuaigui/article/details/6284551》;20110328;1-10 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109857725A (zh) * 2019-02-20 2019-06-07 北京百度网讯科技有限公司 数据库管理方法及装置、服务器及计算机可读介质

Also Published As

Publication number Publication date
CN104462389A (zh) 2015-03-25

Similar Documents

Publication Publication Date Title
CN104462389B (zh) 基于分级存储的分布式文件系统实现方法
US11687423B2 (en) Prioritizing highly performant storage systems for servicing a synchronously replicated dataset
US11614893B2 (en) Optimizing storage device access based on latency
US11636031B2 (en) Optimized inline deduplication
CN104025054B (zh) 虚拟环境中的动态存储分层
US11966841B2 (en) Search acceleration for artificial intelligence
US11960348B2 (en) Cloud-based monitoring of hardware components in a fleet of storage systems
US11662909B2 (en) Metadata management in a storage system
US11886922B2 (en) Scheduling input/output operations for a storage system
US20220236904A1 (en) Using data similarity to select segments for garbage collection
CN103763383A (zh) 一体化云存储系统及其存储方法
US20220147365A1 (en) Accelerating Segment Metadata Head Scans For Storage System Controller Failover
US20110283062A1 (en) Storage apparatus and data retaining method for storage apparatus
US20220197514A1 (en) Balancing The Number Of Read Operations And Write Operations That May Be Simultaneously Serviced By A Storage System
CN104054071A (zh) 访问存储设备的方法和存储设备
US20240004570A1 (en) Storage cluster data structure expansion
CN103761059A (zh) 一种用于海量数据管理的多盘位存储方法及系统
US20220405200A1 (en) Compressed data management in zones
WO2022164490A1 (en) Optimizing storage device access based on latency
US20180341423A1 (en) Storage control device and information processing system
US10078467B2 (en) Storage device, computer readable recording medium, and storage device control method
CN106844491A (zh) 一种临时数据的写入、读取方法及写入、读取装置
US10922012B1 (en) Fair data scrubbing in a data storage system
US20240231939A1 (en) Queueing Storage Operations
US20230350570A1 (en) Intelligent I/O Throttling in a Container System

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 201112 Shanghai, Minhang District, United Airlines route 1188, building second layer A-1 unit 8

Applicant after: SHANGHAI EISOO INFORMATION TECHNOLOGY CO., LTD.

Address before: 201112 Shanghai, Minhang District, United Airlines route 1188, building second layer A-1 unit 8

Applicant before: Shanghai Eisoo Software Co.,Ltd.

COR Change of bibliographic data
GR01 Patent grant
GR01 Patent grant