CN104378423B - 元数据集群分布式存储系统及读取、写入存储数据的方法 - Google Patents

元数据集群分布式存储系统及读取、写入存储数据的方法 Download PDF

Info

Publication number
CN104378423B
CN104378423B CN201410640925.2A CN201410640925A CN104378423B CN 104378423 B CN104378423 B CN 104378423B CN 201410640925 A CN201410640925 A CN 201410640925A CN 104378423 B CN104378423 B CN 104378423B
Authority
CN
China
Prior art keywords
metadata
management server
data
client
version number
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410640925.2A
Other languages
English (en)
Other versions
CN104378423A (zh
Inventor
江水
车烈权
张志高
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ISOFT INFRASTRUCTURE SOFTWARE CO Ltd
Original Assignee
ISOFT INFRASTRUCTURE SOFTWARE CO Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ISOFT INFRASTRUCTURE SOFTWARE CO Ltd filed Critical ISOFT INFRASTRUCTURE SOFTWARE CO Ltd
Priority to CN201410640925.2A priority Critical patent/CN104378423B/zh
Publication of CN104378423A publication Critical patent/CN104378423A/zh
Application granted granted Critical
Publication of CN104378423B publication Critical patent/CN104378423B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/06Protocols specially adapted for file transfer, e.g. file transfer protocol [FTP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1097Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了元数据集群分布式存储系统及读取、写入存储数据的方法。元数据集群分布式存储系统包括存储网路平台和管理网络平台,存储网路平台用以存储数据,以及向客户端传输数据;管理网络平台用以存储元数据、与所述元数据对应的数据存储于所述存储服务器集群中的所述位置信息,根据预设的分流策略响应客户端的读写请求以及控制所述存储网路平台中的数据文件复制请求,所述管理网络平台为拓扑结构。

Description

元数据集群分布式存储系统及读取、写入存储数据的方法
技术领域
本发明涉及数据存储领域,尤其涉及一种元数据集群分布式存储系统及读取、写入存储数据的方法。
背景技术
在数字化信息时代,全球信息数据总量正在以惊人的速度增长。据互联网数据中心(Internet Data Center,IDC)的调研结果显示,2011年全球创建和被复制的数据总量为1.8ZB,与2010年同期相比,又增长了超过1ZB的数据量。信息数据的高速增长,一方面对信息数据的存储、计算、提取提出了严峻的考验,另一方面对信息数据的容灾系统、备份、归档提出了更严格的要求。在这种情况下,分布式存储技术应运而生。
然而大部分的分布式存储系统普遍采用的方式是对每一份写入数据都写入双份,或存储虚拟机的磁盘文件数据,比较浪费存储空间,且并不能解决大量客户端读操作时造成的单点故障和性能瓶颈问题;且在数据同步更新时,并不具有集群内多个元数据管理服务器协同对外提供读写服务的功能。
发明内容
针对现有的分布式存储系统存在的上述问题,现提供一种旨在实现可用度高、可扩展的元数据集群分布式存储系统及读取、写入存储数据的方法。
具体技术方案如下:
一种元数据集群分布式存储系统,包括:
存储网路平台,用以存储数据,以及向客户端传输数据;
管理网络平台,用以存储元数据、根据预设的分流策略响应客户端的读写请求以及控制所述存储网路平台中的数据文件复制请求,所述管理网络平台为拓扑结构。
优选的,所述存储网路平台为存储服务器集群,所述存储服务器集群包括有复数个数据存储服务器,每个所述数据存储服务器匹配有唯一的位置信息。
优选的,所述管理网络平台为管理服务器集群,所述管理服务器集群包括复数个元数据管理服务器,每个所述元数据管理服务器存储有所述元数据,所述元数据匹配有相应的版本号及所述元数据对应的数据存储于所述存储服务器集群中的所述位置信息。
优选的,还包括:
元数据日志服务器,连接所述管理网络平台,用以对所述管理网络平台中的变化数据进行文件备份。
优选的,所述存储网路平台以预设时刻向所述管理网络平台发送所述存储网路平台的状态信息。
优选的,所述管理网络平台用以响应客户端的垃圾文件空间回收请求和恢复文件请求。
一种采用分流策略读取存储数据的方法,应用所述元数据集群分布式存储系统,所述客户端读取存储数据请求包括下述步骤:
A1.客户端从所述管理服务器集群的拓扑结构中选择一个与所述客户端拓扑关系最近的所述元数据管理服务器单线连接,并记录所述元数据管理服务器对应所述元数据的所述版本号和所述位置信息;
A2.所述客户端随机抽取所述管理服务器集群中一半数目的所述元数据管理服务器,获取一半数目中所述元数据管理服务器的所述版本号中的最大版本号,并记录所述最大版本号;
A3.判断所述最大版本号是否为一个,若是,执行A5;若否,执行A4;
A4.获取与所述客户端拓扑关系最近的所述最大版本号对应的所述元数据管理服务器的位置信息;
A5.判断所述最大版本号是否小于所述版本号,若是,执行A6;若否,执行A7;
A6.所述客户端下载所述版本号对应的所述元数据管理服务器中的所述元数据,根据所述元数据对应的位置信息,获取所述客户端读请求的文件数据对应的位置信息,读取与所述位置信息对应的所述数据存储服务器中的存储数据;以与所述客户端单线连接的所述元数据管理服务器中所述元数据和所述版本号为基准更新所述管理服务器集群,执行A9;
A7.所述客户端断开与所述元数据管理服务器的单线连接,所述客户端连接与所述客户端拓扑关系最近的所述最大版本号对应的所述元数据管理服务器,并记录所述最大版本号以及与所述客户端拓扑关系最近的所述最大版本号对应的所述元数据管理服务器的位置信息;
A8.所述客户端下载与所述客户端拓扑关系最近的所述最大版本号对应的所述元数据管理服务器中的所述元数据,根据所述元数据对应的所述位置信息,获取所述客户端读请求的文件数据对应的位置信息,读取与所述位置信息对应的所述数据存储服务器中的存储数据;以与所述客户端连接的所述元数据管理服务器中所述元数据和所述最大版本号为基准更新所述管理服务器集群;
A9.结束。
一种采用分流策略写入存储数据的方法,应用所述元数据集群分布式存储系统,所述客户端写入存储数据包括下述步骤:
B1.客户端从所述管理服务器集群的拓扑结构中选择一个与所述客户端拓扑关系最近的所述元数据管理服务器单线连接,并记录所述元数据管理服务器对应所述元数据的所述版本号、所述位置信息和所述元数据对应的副本数;
B2.所述客户端将待写数据写入与所述位置信息对应的所述数据存储服务器中;
B3.判断写入所述数据存储服务器中的数据是否写入成功,若是,执行B4;若否,执行B2;
B4.判断所述副本数是否大于1,若否,执行B5;若是,执行B7;
B5.更新与所述客户端拓扑关系最近的所述元数据管理服务器的所述元数据和所述版本号,并以所述与所述客户端拓扑关系最近的所述元数据管理服务器的所述元数据和所述版本号为基础更新所述管理服务器集群中的所述元数据管理服务器的所述元数据和所述版本号;
B6.判断更新的所述元数据管理服务器的数目是否超出所述存储服务器集群中可用所述元数据管理服务器的二分之一,若否,返回执行B1;若是,则结束;
B7.选择除写入所述待写数据的所述数据存储服务器的其他所述数据存储服务器将所述待写数据写入,直至写入成功为止;
B8.判断所述成功写入所述待写数据的数据存储服务器的个数是否等于所述副本数,若是,执行B5,若否,执行B7。
优选的,在所述步骤B6中采用循环冗余校验码校验法校验所述元数据是否正确。
上述技术方案的有益效果:
在本发明中通过利用存储服务器集群的特性及响应多个客户端的读请求,避免了元数据管理节点的单点故障而导致的性能瓶颈的现象;且元数据集群分布式存储系统能够实现管理服务器集群内多个元数据管理服务器中的元数据的一致性,从而保证客户端数据写入的正确性。
附图说明
图1为本发明所述元数据集群分布式存储系统的一种实施例的分布图;
图2为本发明所述采用分流策略读取存储数据的一种实施例的方法流程图;
图3为本发明所述采用分流策略写入存储数据的一种实施例的方法流程图;
图4为本发明所述采用分流策略写入存储数据的另一种实施例的方法流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
下面结合附图和具体实施例对本发明作进一步说明,但不作为本发明的限定。
一种元数据集群分布式存储系统,包括:
存储网路平台,用以存储数据,以及向客户端传输数据;
管理网络平台,用以存储元数据、与所述元数据对应的数据存储于所述存储服务器集群中的所述位置信息,根据预设的分流策略响应客户端的读写请求以及控制所述存储网路平台中的数据文件复制请求,所述管理网络平台为拓扑结构。
如图1所示,在优选的实施例中,存储网路平台为存储服务器集群N,存储服务器集群N,存储服务器集群N包括有复数个数据存储服务器,每个数据存储服务器匹配有唯一的位置信息,数据存储服务器用以存储数据,以及向客户端T传输数据。
进一步地,复数个数据存储服务器分别存储于多个机柜中。
在优选的实施例中,管理网络平台为管理服务器集群W,管理服务器集群W为拓扑结构,管理服务器集群W包括复数个元数据管理服务器,每个元数据管理服务器均匹配有存储于元数据管理服务器中的元数据对应的版本号以及与元数据对应的位置信息。
元数据集群分布式存储系统可在大规模廉价机器上的构建分布式存储系统集群,能够通过增加元数据管理服务器和数据存储服务器增加分布式存储系统的性能,以达到扩展效果。
采用版本号的方式标识元数据,当元数据更新时,可以自然计数法的方式递增版本号。元数据管理服务器之间采用增量同步的方式同步,从而保证元数据管理服务器之间的元数据的一致性。通过利用存储服务器集群的特性及响应多个客户端的读请求,避免了元数据管理节点的单点故障而导致的性能瓶颈的现象。且元数据集群分布式存储系统能够实现管理服务器集群内多个元数据管理服务器中的元数据的一致性,从而保证客户端数据写入的正确性。该系统可应用于Solaris系统、freeBSD系统和Windows系统的Cygwin环境中。元数据集群分布式存储系统可以通过专有网络线路服务保障或确定指定核心元数据管理服务器名单以保证元数据管理服务器的及时更新同步。
在本实施例中使用单一的文件命名空间,在不改变路径名的前提下,文件或者文件集合可以被重定位。元数据集群分布式存储系统中所有元数据管理服务器保持数据的一致性,文件的块可以重新分布复制,块可以增加或者减少副本,副本可以跨机柜存储,而这一切对客户端都是透明的。一个文件可以表示为其内容在不同位置的多个拷贝。
如图1所示,在优选的实施例中,还可包括:
元数据日志服务器U,连接管理服务器集群W(管理网络平台),用以对元数据管理服务器的变化数据进行文件备份。
在本实施例中,元数据日志服务器负责对元数据管理服务器的变化日志文件进行备份,当元数据管理主服务器和所有的元数据管理备份服务器都出现故障时可以手动恢复替换其继续工作,避免因管理服务器集群故障而导致元数据集群分布式存储系统不能正常运行。
在优选的实施例中,当存储服务器集群响应客户端写请求时,同一时间只有一个元数据管理服务器作为元数据管理主服务器,以响应客户端的写请求,其余的元数据管理服务器均作为元数据管理备份服务器。
在本实施例中,管理服务器集群对客户端提供统一的读写接口。每个元数据管理服务器都可以对客户端提供数据读服务,同一时间只能有一台元数据管理服务器负责存储管理服务器的写入,其余的元数据管理服务器均作为元数据管理备份服务器。当大量客户端并发请求读时,管理服务器集群根据读写分流策略将客户端请求分流到负载较小的元数据管理服务器,从而加快系统响应,降低管理服务器集群中主服务器负载,同时扩大管理服务器集群规模,从而提高元数据集群分布式存储系统的高可用性能。
客户端对于文件的读写不会影响其他客户端对同一个文件的读写。任何时间都只允许一个写的客户端,文件经创建并写入之后很少改变,可实现一次写,多次读。
在优选的实施例中,存储服务器集群以预设时刻向管理服务器集群发送存储服务器集群的状态信息,以及向管理服务器集群发送数据存储服务器之间的文件复制请求。
当元数据集群分布式存储系统中的文件由于数据存储服务器的失效、增加或者复制因子的改变或者重新均衡等进行着复制或者移动,而客户端和客户端程序并不需要改变,管理服务器集群会实时记录数据存储服务器中的数据位置的变更。
在本实施例中数据存储服务器服从元数据管理服务器的安排定期向元数据管理服务器发送当前的状态信息,除此之外,还能向客户端提供数据存储空间,并向客户传输数据。客户端可通过fuse内核接口挂载到数据存储服务器上,客户端使用数据存储服务器上的文件系统和使用本地文件系统一样。
在优选的实施例中,管理网络平台用以响应客户端的垃圾文件空间回收请求和恢复文件请求。
在本实施例中元数据集群分布式存储系统的容错能力可以分为两个方面:文件系统的容错性和本身的容错能力。文件系统的容错性包括支持在元数据管理服务器和数据存储服务器间维持心跳检测;管理服务器集群的负载均衡以及元数据的自动迁移;支持元数据变化日志文件的同步;支持垃圾文件回收机制。本身的容错性包括:支持升级和回滚。
如图2所示,一种采用分流策略读取存储数据的方法,应用元数据集群分布式存储系统,客户端读取存储数据请求包括下述步骤:
A1.客户端从管理服务器集群的拓扑结构中选择一个与客户端拓扑关系最近的元数据管理服务器单线连接,并记录元数据管理服务器对应元数据的版本号和位置信息;
A2.客户端随机抽取管理服务器集群中一半数目的元数据管理服务器,获取一半数目中元数据管理服务器的版本号中的最大版本号,并记录最大版本号;
A3.判断最大版本号是否为一个,若是,执行A5;若否,执行A4;
A4.获取与客户端拓扑关系最近的最大版本号对应的元数据管理服务器的位置信息;
A5.判断最大版本号是否小于版本号,若是,执行A6;若否,执行A7;
A6.客户端下载版本号对应的元数据管理服务器中的元数据,根据元数据对应的位置信息,获取客户端读请求的文件数据对应的位置信息,读取与位置信息对应的数据存储服务器中的存储数据;以与客户端单线连接的元数据管理服务器中元数据和版本号为基准更新管理服务器集群,执行A9;
A7.客户端断开与元数据管理服务器的单线连接,客户端连接与客户端拓扑关系最近的最大版本号对应的元数据管理服务器,并记录最大版本号以及与客户端拓扑关系最近的最大版本号对应的元数据管理服务器的位置信息;
A8.客户端下载与客户端拓扑关系最近的最大版本号对应的元数据管理服务器中的元数据,根据元数据对应的位置信息,获取客户端读请求的文件数据对应的位置信息,读取与位置信息对应的数据存储服务器中的存储数据;以与客户端连接的元数据管理服务器中元数据和最大版本号为基准更新管理服务器集群;
A9.结束。
在步骤A1中客户端可根据机柜拓扑配置文件和路由表或FDB表项计算出的存储服务器集群的网络拓扑关系,从而选择离客户端最新的元数据管理服务器。
在步骤A2中以随机抽取管理服务器集群中一半数量的元数据管理服务器为样本,可减少元数据版本号比较空间,从而加快系统数据吞吐。
在步骤A6和步骤A8中对客户端读请求的文件数据进行循环冗余校验码校验法校验,以保证数据的可靠性。
在本实施例中采用该方法能够根据实现管理服务器集群内多个元数据管理服务器响应客户端读请求,分担独立元数据管理服务器的性能瓶颈而造成的负载。当大量客户端并发请求读时,管理服务器集群可根据读写分流策略将客户端请求分流到负载较小的元数据管理服务器,从而加快系统响应,降低管理服务器集群中主服务器负载,同时扩大管理服务器集群规模,从而提高元数据集群分布式存储系统的高可用性能。
进一步地,指定对外虚拟集群管理服务器ip,ip地址为192.168.30.59,构成集群的机器为192.168.30.64,192.168.30.65,192.168.30.66;
创建一份局域网的拓扑配置文件,内容为192.168.30.0/24网段机器属于机柜1,192.168.40.0/24网段机器属于机柜2;
在元数据配置文件中指定虚拟集群管理服务器ip,和日志备份服务器ip地址;
客户端向虚拟集群管理服务器发出读数据请求,在ip为192.168.30.64和192;168.30.66的服务器都断线的情况下,ip为192.168.30.65的机器还能处理读请求;
三个客户端同时请求读数据,和一个客户端请求读数据延迟基本一样,都为600毫秒。
如图3所示,一种采用分流策略写入存储数据的方法,应用元数据集群分布式存储系统,客户端写入存储数据包括下述步骤:
B1.客户端从管理服务器集群的拓扑结构中选择一个与客户端拓扑关系最近的元数据管理服务器单线连接,并记录元数据管理服务器对应元数据的版本号、位置信息和元数据对应的副本数;
B2.客户端将待写数据写入与位置信息对应的数据存储服务器中;
B3.判断写入数据存储服务器中的数据是否写入成功,若是,执行B4;若否,执行B2;
B4.判断副本数是否大于1,若否,执行B5;若是,执行B7;
B5.更新与客户端拓扑关系最近的元数据管理服务器的元数据和版本号,并以与客户端拓扑关系最近的元数据管理服务器的元数据和版本号为基础更新管理服务器集群中的元数据管理服务器的元数据和版本号;
B6.判断更新的元数据管理服务器的数目是否超出存储服务器集群中可用元数据管理服务器的二分之一,若否,返回执行B1;若是,则结束;
B7.选择除写入待写数据的数据存储服务器的其他数据存储服务器将待写数据写入,直至写入成功为止;
B8.判断成功写入待写数据的数据存储服务器的个数是否等于副本数,若是,执行B5,若否,执行B7。
在步骤B1中客户端根据机柜拓扑配置文件和路由表或FDB表项计算出管理服务器集群的网络拓扑关系,选择离客户端最新的元数据管理服务器,能够根据多个数据中心的物理网络拓扑关系辅助拓扑配置文件,实现精确选择最近的元数据管理服务器。
如图4所示,在步骤B7中的具体过程为:
B71.判断副本是否小于或等于机柜数,若是,执行B72;若否,执行B75;
B72.选择除写入待写数据的数据存储服务器所在的机柜外的其他机柜中的一个数据存储服务器写入待写数据;
B73.判断写入数据存储服务器中的数据是否写入成功,若是,执行B74;若否,执行B72;
B74.判断成功写入待写数据的数据存储服务器的个数是否等于副本数,若是,执行B8;若否,执行B72;
B75.选择除写入待写数据的数据存储服务器所在的机柜外的其他机柜中的一个数据存储服务器写入待写数据;
B76.判断写入数据存储服务器中的数据是否写入成功,若是,执行B77;若否,执行B75;
B77.判断成功写入待写数据的数据存储服务器的个数是否等于机柜数,若是,执行B78;若否,执行B75;
B78.随机选择除写入待写数据的数据存储服务器的其他数据存储服务器将待写数据写入;
B79.判断写入数据存储服务器中的数据是否写入成功,若是,执行B710;若否,执行B78;
B710.判断成功写入待写数据的数据存储服务器的个数是否等于副本数,若是,执行B8;若否,执行B78。
在本实施例中副本同步根据拓扑配置文件或计算出的管理服务器集群的网络拓扑关系选择不在一个机柜的数据存储服务器作为复制目标,保证一个机柜掉电或其他物理故障后,还能满足用户的可读请求。
反复确认写入数据存储服务器中的数据是否写入成功可保证客户端数据写入的正确性。
在优选的实施例中,在步骤B6中采用循环冗余校验码校验法校验元数据是否正确,以保证数据的可靠性。
以上所述仅为本发明较佳的实施例,并非因此限制本发明的实施方式及保护范围,对于本领域技术人员而言,应当能够意识到凡运用本发明说明书及图示内容所作出的等同替换和显而易见的变化所得到的方案,均应当包含在本发明的保护范围内。

Claims (7)

1.一种元数据集群分布式存储系统,其特征在于,包括:
存储网路平台,所述存储网路平台为存储服务器集群,所述存储服务器集群包括有复数个数据存储服务器,每个所述数据存储服务器匹配有唯一的位置信息,用以存储数据,以及向客户端传输数据;
管理网络平台,所述管理网络平台为管理服务器集群,用以存储元数据、与所述元数据对应的数据存储于所述存储服务器集群中的位置信息,根据预设的分流策略响应客户端的读写请求以及控制所述存储网路平台中的数据文件复制请求,所述管理网络平台为拓扑结构;
所述管理服务器集群包括复数个元数据管理服务器,每个所述元数据管理服务器存储有所述元数据,所述元数据匹配的相应的版本号及所述元数据对应的数据存储于所述存储服务器集群中的所述位置信息;
根据所述分流策略所述客户端读取存储数据请求包括下述步骤:
A1.客户端从所述管理服务器集群的拓扑结构中选择一个与所述客户端拓扑关系最近的所述元数据管理服务器单线连接,并记录所述元数据管理服务器对应所述元数据的所述版本号和所述位置信息;
A2.所述客户端随机抽取所述管理服务器集群中一半数目的所述元数据管理服务器,获取一半数目中所述元数据管理服务器的所述版本号中的最大版本号,并记录所述最大版本号;
A3.判断所述最大版本号是否为一个,若是,执行A5;若否,执行A4;
A4.获取与所述客户端拓扑关系最近的所述最大版本号对应的所述元数据管理服务器的位置信息;
A5.判断所述最大版本号是否小于所述版本号,若是,执行A6;若否,执行A7;
A6.所述客户端下载所述版本号对应的所述元数据管理服务器中的所述元数据,根据所述元数据对应的位置信息,获取所述客户端读请求的文件数据对应的位置信息,读取与所述位置信息对应的所述数据存储服务器中的存储数据;以与所述客户端单线连接的所述元数据管理服务器中所述元数据和所述版本号为基准更新所述管理服务器集群,执行A9;
A7.所述客户端断开与所述元数据管理服务器的单线连接,所述客户端连接与所述客户端拓扑关系最近的所述最大版本号对应的所述元数据管理服务器,并记录所述最大版本号以及与所述客户端拓扑关系最近的所述最大版本号对应的所述元数据管理服务器的位置信息;
A8.所述客户端下载与所述客户端拓扑关系最近的所述最大版本号对应的所述元数据管理服务器中的所述元数据,根据所述元数据对应的所述位置信息,获取所述客户端读请求的文件数据对应的位置信息,读取与所述位置信息对应的所述数据存储服务器中的存储数据;以与所述客户端连接的所述元数据管理服务器中所述元数据和所述最大版本号为基准更新所述管理服务器集群;
A9.结束。
2.如权利要求1所述元数据集群分布式存储系统,其特征在于,还包括:
元数据日志服务器,连接所述管理网络平台,用以对所述管理网络平台中的变化数据进行文件备份。
3.如权利要求1所述元数据集群分布式存储系统,其特征在于,所述存储网路平台以预设时刻向所述管理网络平台发送所述存储网路平台的状态信息。
4.如权利要求1所述元数据集群分布式存储系统,其特征在于,所述管理网络平台用以响应客户端的垃圾文件空间回收请求和恢复文件请求。
5.一种采用分流策略读取存储数据的方法,其特征在于,应用于 如权利要求1所述元数据集群分布式存储系统,所述客户端读取存储数据请求包括下述步骤:
A1.客户端从所述管理服务器集群的拓扑结构中选择一个与所述客户端拓扑关系最近的所述元数据管理服务器单线连接,并记录所述元数据管理服务器对应所述元数据的所述版本号和所述位置信息;
A2.所述客户端随机抽取所述管理服务器集群中一半数目的所述元数据管理服务器,获取一半数目中所述元数据管理服务器的所述版本号中的最大版本号,并记录所述最大版本号;
A3.判断所述最大版本号是否为一个,若是,执行A5;若否,执行A4;
A4.获取与所述客户端拓扑关系最近的所述最大版本号对应的所述元数据管理服务器的位置信息;
A5.判断所述最大版本号是否小于所述版本号,若是,执行A6;若否,执行A7;
A6.所述客户端下载所述版本号对应的所述元数据管理服务器中的所述元数据,根据所述元数据对应的位置信息,获取所述客户端读请求的文件数据对应的位置信息,读取与所述位置信息对应的所述数据存储服务器中的存储数据;以与所述客户端单线连接的所述元数据管理服务器中所述元数据和所述版本号为基准更新所述管理服务器集群,执行A9;
A7.所述客户端断开与所述元数据管理服务器的单线连接,所述客户端连接与所述客户端拓扑关系最近的所述最大版本号对应的所述元数据管理服务器,并记录所述最大版本号以及与所述客户端拓扑关系最近的所述最大版本号对应的所述元数据管理服务器的位置信息;
A8.所述客户端下载与所述客户端拓扑关系最近的所述最大版本号对应的所述元数据管理服务器中的所述元数据,根据所述元数据对应的所述位置信息,获取所述客户端读请求的文件数据对应的位置信息,读取与所述位置信息对应的所述数据存储服务器中的存储数据;以与所述客户端连接的所述元数据管理服务器中所述元数据和所述最大版本号为基准更新所述管理服务器集群;
A9.结束。
6.一种采用分流策略写入存储数据的方法,其特征在于,应用于 如权利要求1所述元数据集群分布式存储系统,所述客户端写入存储数据包括下述步骤:
B1.客户端从所述管理服务器集群的拓扑结构中选择一个与所述客户端拓扑关系最近的所述元数据管理服务器单线连接,并记录所述元数据管理服务器对应所述元数据的所述版本号、所述位置信息和所述元数据对应的副本数;
B2.所述客户端将待写数据写入与所述位置信息对应的所述数据存储服务器中;
B3.判断写入所述数据存储服务器中的数据是否写入成功,若是,执行
B4;若否,执行B2;
B4.判断所述副本数是否大于1,若否,执行B5;若是,执行B7;
B5.更新与所述客户端拓扑关系最近的所述元数据管理服务器的所述元数据和所述版本号,并以所述与所述客户端拓扑关系最近的所述元数据管理服务器的所述元数据和所述版本号为基础更新所述管理服务器集群中的所述元数据管理服务器的所述元数据和所述版本号;
B6.判断更新的所述元数据管理服务器的数目是否超出所述存储服务器集群中可用所述元数据管理服务器的二分之一,若否,返回执行B1;若是,则结束;
B7.选择除写入所述待写数据的所述数据存储服务器的其他所述数据存储服务器将所述待写数据写入,直至写入成功为止;
B8.判断所述成功写入所述待写数据的数据存储服务器的个数是否等于所述副本数,若是,执行B5,若否,执行B7。
7.如权利要求6所述写入存储数据的方法,其特征在于,在所述步骤B6中采用循环冗余校验码校验法校验所述元数据是否正确。
CN201410640925.2A 2014-11-13 2014-11-13 元数据集群分布式存储系统及读取、写入存储数据的方法 Active CN104378423B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410640925.2A CN104378423B (zh) 2014-11-13 2014-11-13 元数据集群分布式存储系统及读取、写入存储数据的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410640925.2A CN104378423B (zh) 2014-11-13 2014-11-13 元数据集群分布式存储系统及读取、写入存储数据的方法

Publications (2)

Publication Number Publication Date
CN104378423A CN104378423A (zh) 2015-02-25
CN104378423B true CN104378423B (zh) 2018-04-17

Family

ID=52557069

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410640925.2A Active CN104378423B (zh) 2014-11-13 2014-11-13 元数据集群分布式存储系统及读取、写入存储数据的方法

Country Status (1)

Country Link
CN (1) CN104378423B (zh)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105187552B (zh) * 2015-09-29 2019-02-22 北京奇艺世纪科技有限公司 一种文件异地灾备的方法和装置
CN105574148A (zh) * 2015-12-16 2016-05-11 麦克奥迪(厦门)医疗诊断系统有限公司 一种数字切片存储系统和数字切片浏览方法
CN106021327B (zh) * 2016-05-06 2019-10-01 南开大学 一种支持多用户同时读写的网盘系统及其读文件方法、写文件方法
CN107589917B (zh) * 2017-09-29 2020-08-21 苏州浪潮智能科技有限公司 一种分布式存储系统及方法
CN107784093A (zh) * 2017-10-13 2018-03-09 郑州云海信息技术有限公司 一种分布式的大数据处理系统
CN109726600B (zh) * 2017-10-31 2023-07-14 伊姆西Ip控股有限责任公司 针对超融合基础设施提供数据保护的系统和方法
CN107948248A (zh) * 2017-11-01 2018-04-20 平安科技(深圳)有限公司 分布式存储方法、控制服务器及计算机可读存储介质
CN110633168A (zh) * 2018-06-22 2019-12-31 北京东土科技股份有限公司 一种分布式存储系统的数据备份方法和系统
CN109327539A (zh) * 2018-11-15 2019-02-12 上海天玑数据技术有限公司 一种分布式块存储系统及其数据路由方法
CN110083485B (zh) * 2019-03-15 2021-08-06 咪咕文化科技有限公司 分流方法、数据服务系统及其前端、存储介质
CN113392155A (zh) * 2020-09-08 2021-09-14 重庆高新技术产业研究院有限责任公司 面向多类型产业集群互联网流式数据存储与计算系统
CN112866406B (zh) * 2021-02-04 2023-03-24 中国建设银行股份有限公司 一种数据存储方法、系统、装置、设备及存储介质
CN114217734B (zh) * 2021-04-30 2023-10-27 无锡江南计算技术研究所 一种分布式存储系统数据管理方法
CN114297172B (zh) * 2022-01-04 2022-07-12 北京乐讯科技有限公司 一种基于云原生的分布式文件系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101997884A (zh) * 2009-08-18 2011-03-30 升东网络科技发展(上海)有限公司 分布式存储系统和方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8635280B2 (en) * 2010-11-04 2014-01-21 Hitachi, Ltd. Method for utilizing heterogeneous storage systems by cooperating with server side storage software

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101997884A (zh) * 2009-08-18 2011-03-30 升东网络科技发展(上海)有限公司 分布式存储系统和方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
《分布式文件系统元数据管理技术研究与实现》;冯幼乐;《中国优秀硕士学位论文全文数据库信息科技辑》;20110115(第01期);正文第2-5章 *

Also Published As

Publication number Publication date
CN104378423A (zh) 2015-02-25

Similar Documents

Publication Publication Date Title
CN104378423B (zh) 元数据集群分布式存储系统及读取、写入存储数据的方法
US11720456B2 (en) Automatic configuration of a recovery service
CN103842969B (zh) 信息处理系统
CN102143215B (zh) 一种基于网络的pb级云存储系统及其处理方法
CN106250270B (zh) 一种云计算平台下的数据备份方法
AU2015221548B2 (en) A computer implemented method for dynamic sharding
CN102571991B (zh) 基于多级映射的大规模多副本分布式存储系统的应用方法
US9286319B2 (en) Method, system and serving node for data backup and restoration
US9588858B2 (en) Periodic data replication
US9864791B2 (en) Flow for multi-master replication in distributed storage
CN104184812B (zh) 一种基于私有云的多点数据传输方法
CN108076090A (zh) 数据处理方法和存储管理系统
CN105635311A (zh) 一种云管理平台中资源池信息同步的方法
CN110188084A (zh) 一种分布式文件存储系统及文件存储方法
CN106802892A (zh) 用于主备数据一致性校验的方法和设备
CN109582686B (zh) 分布式元数据管理一致性保证方法、装置、系统及应用
CN104793981B (zh) 一种虚拟机集群的在线快照管理方法及装置
CN104899161A (zh) 一种基于云存储环境的连续数据保护的缓存方法
CN109271367A (zh) 分布式文件系统多节点快照回滚方法及系统
CN102833273A (zh) 临时故障时的数据修复方法及分布式缓存系统
CN106919470A (zh) 一种数据恢复方法及装置
CN105187565A (zh) 一种利用网络存储数据的方法
JP3977803B2 (ja) バックアップシステム及び方法並びにプログラム
CN107168642B (zh) 一种数据存储方法及系统
CN103714089B (zh) 一种实现云数据库回滚的方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant