CN103078944A - 基于分布式对称文件系统的数据中心架构 - Google Patents

基于分布式对称文件系统的数据中心架构 Download PDF

Info

Publication number
CN103078944A
CN103078944A CN2013100047450A CN201310004745A CN103078944A CN 103078944 A CN103078944 A CN 103078944A CN 2013100047450 A CN2013100047450 A CN 2013100047450A CN 201310004745 A CN201310004745 A CN 201310004745A CN 103078944 A CN103078944 A CN 103078944A
Authority
CN
China
Prior art keywords
storage array
cloud storage
server
file
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2013100047450A
Other languages
English (en)
Other versions
CN103078944B (zh
Inventor
黄剑
吴江
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Saifun Information Technology (xiamen) Co Ltd
Original Assignee
Saifun Information Technology (xiamen) Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Saifun Information Technology (xiamen) Co Ltd filed Critical Saifun Information Technology (xiamen) Co Ltd
Priority to CN201310004745.0A priority Critical patent/CN103078944B/zh
Publication of CN103078944A publication Critical patent/CN103078944A/zh
Application granted granted Critical
Publication of CN103078944B publication Critical patent/CN103078944B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种数据中心架构。本发明的一种基于分布式对称文件系统的数据中心架构,包括若干组服务节点,服务节点包括云存储阵列组、服务器组、存储网络交换机,云存储阵列组、服务器组连接至存储网络交换机;若干组服务节点的存储网络交换机之间依次连接。其通讯过程如下:过程1:服务器向任一云存储阵列发送文件读写请求;过程2:第一云存储阵列接收该请求,并计算该文件所在的目标云存储阵列地址;过程3:第一云存储阵列查询本地缓存,如果已有该文件,则将结果返回给服务器;如果没有该文件,则将所述文件操作请求转发至目标云存储阵列;过程4:目标云存储阵列向第一云存储阵列发送所需要的结果,并由第一云存储阵列将结果返回给服务器。

Description

基于分布式对称文件系统的数据中心架构
技术领域
本发明涉及一种数据中心架构,具体涉及一种基于分布式对称文件系统的数据中心架构。
背景技术
云计算是网格计算、分布式计算、并行计算、效用计算、网络存储、虚拟化、负载均衡等传统计算机和网络技术发展融合的产物。事实上,许多云计算部署依赖于计算机集群(但与网格的组成、体系机构、目的、工作方式大相径庭),也吸收了自主计算和效用计算的特点。通过使计算分布在大量的分布式计算机上,而非本地计算机或远程服务器中,企业数据中心的运行与互联网更相似。这使得企业能够将资源切换到需要的应用上,根据需求访问计算机和存储系统。
目前,云计算在中国的实现通常分三步走,首先是IDC(Internet Data Center,互联网数据中心)服务器托管,然后是服务虚拟化,在操作客户端安装虚拟机来远程登录托管中心的服务器,最后用后端云计算实现云服务。其中,作为实现云计算的第一步,IDC服务器托管是非常重要的一个环节。
IDC服务器托管中,由于用户的需求不断提高,使得IDC机房机柜不断增加并扩容,目前全国IDC机房机柜数量超过百万,仅上海一市,IDC机柜就超过3万个,托管服务器超过30万台。现有IDC服务器托管的方式中,一般采用的是存储阵列统一放在一个机柜上,该机柜上还设有存储网络交换机,该存储网络交换机与每一个存储阵列通过有线的方式连接;服务器放在另外的机柜上,所有的服务器均通过有线的方式连接到存储网络交换机。上述方式中,如果是小流量的数据,其布线相对较为容易,如图1所示。但是对于大流量的数据,一般采用如2所示的布线,其麻花式的布线非常复杂,除了给施工和维护人员带来极大的不方便意外,也给大流量数据的读取和存储也带来了速度方面的困扰,如果服务器1需要服务器2上的数据,其数据流向如图2所示,服务器1先通过存储网络交换机连接到服务器2,然后服务器2通过存储网络交换机找到相应的存储阵列,然后再将该存储阵列上存储的信息通过存储网络交换机发送至服务器1。上述过程需要经过三级的过程才能实现数据的传输,当传输的数据量大时,在现有的带宽条件下,其传输速度非常受到影响。
另外,现有的存储阵列上一般使用非对称式文件系统。其架构如图3所示,非对称式文件系统的一般包括计算节点client、独立的集中式元数据服务模块MDS以及至少两个对象存储节点。使用非对称式文件系统时,计算节点client首先询问元数据服务模块MDS所需要的数据在哪个对象存储节点上,元数据服务模块MDS查询后进行回复,例如回复该数据在对象存储节点1上,然后计算节点client访问对象存储节点1并获得数据。上述过程需要元数据服务模块MDS的应答和回复,给元数据服务模块MDS带来一定的负担,且限制了存储阵列的可靠性。另外,由于非对称式文件系统的性质,使得扩展对象存储节点时,必须成对的扩展,而不能任意扩展。
发明内容
本发明所要解决的技术问题是,提供一种基于分布式对称文件系统的数据中心架构,对现有托管服务器的架构进行改进,采用小流量布线方法实现大流量服务,去除了麻花布线,提高服务器之间的数据传输速度。
为了解决上述技术问题,本发明所采用的技术方案是,一种基于分布式对称文件系统的数据中心架构,其包括若干组服务节点,服务节点包括设有分布式元数据服务模块DMDS的云存储阵列组、作为计算节点的服务器组、用于通讯的存储网络交换机,所述云存储阵列组、服务器组连接至存储网络交换机;若干组服务节点的存储网络交换机之间依次连接;所述云存储阵列组包括至少一个云存储阵列,所述服务器组包括至少一台服务器。
其中,其通讯过程如下:
过程1:服务器向任一云存储阵列发送文件读写请求(基于NFS,CIFS,FTP等协议),将该云存储阵列记为第一云存储阵列;所述数据操作请求包括文件目录、文件名称和具体操作; 
过程2:第一云存储阵列的分布式元数据服务模块DMDS接收所述文件操作请求,根据文件目录和文件名称计算出该文件所在的目标云存储阵列地址;
过程3:第一云存储阵列查询本地缓存,如果本地缓存中已有该文件,则对该缓存进行操作后将结果返回给服务器,同时缓存模块异步将数据与目标存储阵列进行同步;如果第一云存储阵列没有该文件的本地缓存,则第一云存储阵列将所述文件操作请求通过标准网络协议(如RPC/TCP/IP)转发至目标云存储阵列;
过程4:目标云存储阵列对本地存储进行操作后向第一云存储阵列发送所需要的结果,并由第一云存储阵列将结果返回给服务器。
进一步的,所述过程2中,具体是采用HASH算法根据文件目录和文件名称的字符码计算出该文件的数码特征值,并用该数码特征值对存储服务器数量取模,得到所在的目标云存储阵列地址;同时记录其计算出来的HASH值。
更进一步的,过程3中,第一云存储阵列用过程2中计算的HASH值查询本地缓存,该缓存用过程2中计算的HASH值做分类,并用目录名和文件名做标记。
更进一步的,过程3中,缓存模块异步将数据与目标存储阵列进行同步时,首先缓存模块将被同步文件分块锁定,并对其进行标识;然后分块对比被同步文件是否有更改;如果有更改,则将最新的更改发到目标存储阵列,目标存储阵列确认操作完成后将被同步文件解锁;如果没有更改,则目标存储阵列直接将被同步文件解锁。
上述架构中,为了方便使用,对应连接的一云存储阵列组、一服务器组以及一存储网络交换机放置于同一个机架上,相邻机架之间通过存储网络交换机进行通讯。
本发明通过上述架构,采用了基于分布式对称文件系统的云存储阵列,实现采用小流量布线方法即可实现大流量服务,从而去除了麻花布线;同时,分布式元数据服务模块DMDS根据文件目录和文件名称采用HASH算法自动计算出服务器所操作的目标云存储阵列,在第一次操作时自动将服务转接给该目标云存储阵列并建立本地缓存,从而实现了文件透明分布式存放和服务器就近访问的统一,不仅大大提高了服务器与存储阵列之间的数据传输速度,还实现了数据流向的分散化,进而提供最大限度的聚合数据带宽。还有,缓存模块异步将数据与目标存储阵列进行同步时,首先缓存模块将被同步文件分块锁定,并对其进行标识,然后分块对比被同步文件是否有更改,如果有更改则进行同步操作,没有更改则不需要再进行同步操作,上述操作不仅大大节约了数据带宽,还节约了操作时间。另外,由于采用了分布式对称文件系统,在扩展存储容量时,不再需要进行成对的扩展,而可以任意数量的扩展。
附图说明
图1是现有技术的服务器托管中的小流量的数据中心架构;
图2是现有技术的服务器托管中的大流量的数据中心架构;
图3是非对称式文件系统的架构示意图;
图4是本发明的服务器托管的数据中心架构。
具体实施方式
现结合附图和具体实施方式对本发明进一步说明。
本发明的一种基于分布式对称文件系统的数据中心架构,其包括若干组服务节点,服务节点包括设有分布式元数据服务模块DMDS的云存储阵列组、作为计算节点的服务器组、用于通讯的存储网络交换机,所述云存储阵列组、服务器组连接至存储网络交换机;若干组服务节点的存储网络交换机之间依次连接;所述云存储阵列组包括至少一个云存储阵列,所述服务器组包括至少一台服务器。通常,每个服务节点设于一个机架上。其通讯过程如下:
过程1:服务器向任一云存储阵列发送文件读写请求(基于NFS,CIFS,FTP等协议),将该云存储阵列记为第一云存储阵列;所述数据操作请求包括文件目录、文件名称和具体操作; 
过程2:第一云存储阵列的分布式元数据服务模块DMDS接收所述文件操作请求,采用HASH算法根据文件目录和文件名称的字符码计算出该文件的数码特征值,并用该数码特征值对存储服务器数量取模,得到所在的目标云存储阵列地址;同时记录其计算出来的HASH值;
过程3:第一云存储阵列用过程2中计算的HASH值查询本地缓存(该缓存用过程2中计算的HASH值做分类,并用目录名和文件名做标记)。如果本地缓存中已存在该文件,则对该缓存进行操作后将结果返回给服务器. 同时缓存模块异步将数据与目标存储阵列进行同步。具体的,缓存模块异步将数据与目标存储阵列进行同步时,首先缓存模块将被同步文件分块锁定,并对其进行标识;然后分块对比被同步文件是否有更改;如果有更改,则将最新的更改发到目标存储阵列,目标存储阵列确认操作完成后将被同步文件解锁;如果没有更改,则目标存储阵列直接将被同步文件解锁。如果第一云存储阵列没有该文件的本地缓存,则第一云存储阵列将所述文件操作请求通过标准网络协议(如RPC/TCP/IP)转发至目标云存储阵列;
过程4:目标云存储阵列对本地存储进行操作后向第一云存储阵列发送所需要的结果,并由第一云存储阵列将结果返回给服务器。
如图4所示,本实施例中,一种基于分布式对称文件系统的数据中心架构,包括3个机架:第一机架1、第二机架2和第三机架3。第一机架1上设有存储网络交换机11、云存储阵列12、服务器13、原系统存储器14(服务器自带的存储硬盘)和高可用电源15,所述云存储阵列12、服务器13和原系统存储器14均连接至存储网络交换机11,高可用电源15为该机柜的上述设备进行供电。第二机架2上设有存储网络交换机21、云存储阵列22、服务器23、原系统存储器24和高可用电源25,所述云存储阵列22、服务器23和原系统存储器24均连接至存储网络交换机21,高可用电源25为该机柜的上述设备进行供电。第三机架3上设有存储网络交换机31、云存储阵列32、服务器33、原系统存储器34和高可用电源35,所述云存储阵列32、服务器33和原系统存储器34均连接至存储网络交换机31,高可用电源35为该机柜的上述设备进行供电。存储网络交换机11、存储网络交换机21和存储网络交换机31依次连接。
如果服务器1需要服务器2上的数据,其数据流向如下,服务器1先通过存储网络交换机31和存储网络交换机21找到服务器2,然后服务器2从本地的云存储阵列32找到服务器1所需要的数据,直接发送给服务器1。上述方式中,将计算服务器和存储服务器连接到同一个交换机上,简化了数据的传输和查找过程,大大提高了传输速度。另外,从原系统存储器到新的云存储阵列的迁移,大部分在机柜内发生,最大限度减少数据中心内的网络使用。
本发明采用小流量布线方法实现了大流量服务,去除了麻花布线,机柜间距离可以达到500米,同时实现近距离容灭。
其中,本发明使用的分布式对称文件系统优选采用赛凡信息科技(厦门)有限公司开发的分布式对称文件系统。当然,也可以采用实现同样功能的其他分布式对称文件系统。
尽管结合优选实施方案具体展示和介绍了本发明,但所属领域的技术人员应该明白,在不脱离所附权利要求书所限定的本发明的精神和范围内,在形式上和细节上可以对本发明做出各种变化,均为本发明的保护范围。 

Claims (5)

1.一种基于分布式对称文件系统的数据中心架构,其特征在于:
其包括若干组服务节点,服务节点包括设有分布式元数据服务模块DMDS的云存储阵列组、作为计算节点的服务器组、用于通讯的存储网络交换机,所述云存储阵列组、服务器组连接至存储网络交换机;
若干组服务节点的存储网络交换机之间依次连接;
所述云存储阵列组包括至少一个云存储阵列,所述服务器组包括至少一台服务器;
其通讯过程如下:
过程1:服务器向任一云存储阵列发送文件读写请求,将该云存储阵列记为第一云存储阵列;所述数据操作请求包括文件目录、文件名称和具体操作; 
过程2:第一云存储阵列的分布式元数据服务模块DMDS接收所述文件操作请求,根据文件目录和文件名称计算出该文件所在的目标云存储阵列地址;
过程3:第一云存储阵列查询本地缓存,如果本地缓存中已有该文件,则将结果返回给服务器,同时缓存模块异步将数据与目标存储阵列进行同步;如果第一云存储阵列没有该文件的本地缓存,则第一云存储阵列将所述文件操作请求通过标准网络协议转发至目标云存储阵列;
过程4:目标云存储阵列对本地存储进行操作后向第一云存储阵列发送所需要的结果,并由第一云存储阵列将结果返回给服务器。
2.根据权利要求1所述的一种基于分布式对称文件系统的数据中心架构,其特征在于:过程2中,是采用HASH算法根据文件目录和文件名称的字符码计算出该文件的数码特征值,并用该数码特征值对存储服务器数量取模,得到所在的目标云存储阵列地址;同时记录其计算出来的HASH值。
3.根据权利要求2所述的一种基于分布式对称文件系统的数据中心架构,其特征在于:过程3中,第一云存储阵列用过程2中计算的HASH值查询本地缓存,该缓存用过程2中计算的HASH值做分类,并用目录名和文件名做标记。
4.根据权利要求1所述的一种基于分布式对称文件系统的数据中心架构,其特征在于:过程3中,缓存模块异步将数据与目标存储阵列进行同步时,首先缓存模块将被同步文件分块锁定,并对其进行标识;然后分块对比被同步文件是否有更改;如果有更改,则将最新的更改发到目标存储阵列,目标存储阵列确认操作完成后将被同步文件解锁;如果没有更改,则目标存储阵列直接将被同步文件解锁。
5.根据权利要求1所述的一种基于分布式对称文件系统的数据中心架构,其特征在于:过程1中,服务器向任一云存储阵列发送文件读写请求,所述文件读写请求是基于NFS、CIFS或者FTP协议。
CN201310004745.0A 2013-01-08 2013-01-08 基于分布式对称文件系统的数据中心架构 Active CN103078944B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310004745.0A CN103078944B (zh) 2013-01-08 2013-01-08 基于分布式对称文件系统的数据中心架构

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310004745.0A CN103078944B (zh) 2013-01-08 2013-01-08 基于分布式对称文件系统的数据中心架构

Publications (2)

Publication Number Publication Date
CN103078944A true CN103078944A (zh) 2013-05-01
CN103078944B CN103078944B (zh) 2016-04-06

Family

ID=48155346

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310004745.0A Active CN103078944B (zh) 2013-01-08 2013-01-08 基于分布式对称文件系统的数据中心架构

Country Status (1)

Country Link
CN (1) CN103078944B (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130018942A1 (en) * 2007-03-30 2013-01-17 Paul Jardetzky System and method for bandwidth optimization in a network storage environment
CN103546572A (zh) * 2013-10-30 2014-01-29 北京荣之联科技股份有限公司 一种云存储装置以及多云存储联网系统和方法
CN104142894A (zh) * 2013-05-06 2014-11-12 华为技术有限公司 一种数据读写方法、存储控制器及计算机
CN104615598A (zh) * 2013-11-04 2015-05-13 南京中兴新软件有限责任公司 元数据服务器的迁移处理方法及装置
CN104954392A (zh) * 2014-03-24 2015-09-30 中国移动通信集团河北有限公司 一种云盘及其实现方法、装置
WO2016082078A1 (zh) * 2014-11-24 2016-06-02 华为技术有限公司 路径管理的系统、装置和方法
CN106648453A (zh) * 2015-08-10 2017-05-10 Aupera技术有限公司 用于分布式计算和存储的系统
CN107426288A (zh) * 2017-05-26 2017-12-01 郑州云海信息技术有限公司 一种基于存储网络的资源共享调度方法和装置
CN104142894B (zh) * 2013-05-06 2018-02-09 华为技术有限公司 一种数据读写方法、存储控制器及计算机
CN108255412A (zh) * 2016-12-29 2018-07-06 北京京东尚科信息技术有限公司 用于分布式文件储存的方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070214175A1 (en) * 2006-03-08 2007-09-13 Omneon Video Networks Synchronization of metadata in a distributed file system
CN101520805A (zh) * 2009-03-25 2009-09-02 中兴通讯股份有限公司 一种分布式文件系统及其文件处理方法
CN101754056A (zh) * 2008-12-17 2010-06-23 中国科学院自动化研究所 支持海量数据自动处理的数字内容编目管理系统及方法
CN102420854A (zh) * 2011-11-14 2012-04-18 西安电子科技大学 面向云存储的分布式文件系统
CN102855284A (zh) * 2012-08-03 2013-01-02 北京联创信安科技有限公司 一种集群存储系统的数据管理方法及系统
CN102857547A (zh) * 2012-04-12 2013-01-02 华为技术有限公司 分布式缓存的方法及设备

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070214175A1 (en) * 2006-03-08 2007-09-13 Omneon Video Networks Synchronization of metadata in a distributed file system
CN101754056A (zh) * 2008-12-17 2010-06-23 中国科学院自动化研究所 支持海量数据自动处理的数字内容编目管理系统及方法
CN101520805A (zh) * 2009-03-25 2009-09-02 中兴通讯股份有限公司 一种分布式文件系统及其文件处理方法
CN102420854A (zh) * 2011-11-14 2012-04-18 西安电子科技大学 面向云存储的分布式文件系统
CN102857547A (zh) * 2012-04-12 2013-01-02 华为技术有限公司 分布式缓存的方法及设备
CN102855284A (zh) * 2012-08-03 2013-01-02 北京联创信安科技有限公司 一种集群存储系统的数据管理方法及系统

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130018942A1 (en) * 2007-03-30 2013-01-17 Paul Jardetzky System and method for bandwidth optimization in a network storage environment
US9355103B2 (en) * 2007-03-30 2016-05-31 Netapp, Inc. System and method for bandwidth optimization in a network storage environment
CN104142894A (zh) * 2013-05-06 2014-11-12 华为技术有限公司 一种数据读写方法、存储控制器及计算机
WO2014180112A1 (zh) * 2013-05-06 2014-11-13 华为技术有限公司 一种数据读写方法、存储控制器及计算机
CN104142894B (zh) * 2013-05-06 2018-02-09 华为技术有限公司 一种数据读写方法、存储控制器及计算机
CN103546572B (zh) * 2013-10-30 2017-04-05 北京荣之联科技股份有限公司 一种多云存储联网系统和方法
CN103546572A (zh) * 2013-10-30 2014-01-29 北京荣之联科技股份有限公司 一种云存储装置以及多云存储联网系统和方法
CN104615598A (zh) * 2013-11-04 2015-05-13 南京中兴新软件有限责任公司 元数据服务器的迁移处理方法及装置
CN104615598B (zh) * 2013-11-04 2019-07-09 南京中兴新软件有限责任公司 元数据服务器的迁移处理方法及装置
CN104954392A (zh) * 2014-03-24 2015-09-30 中国移动通信集团河北有限公司 一种云盘及其实现方法、装置
CN105900068A (zh) * 2014-11-24 2016-08-24 华为技术有限公司 路径管理的系统、装置和方法
WO2016082078A1 (zh) * 2014-11-24 2016-06-02 华为技术有限公司 路径管理的系统、装置和方法
CN105900068B (zh) * 2014-11-24 2019-01-15 华为技术有限公司 路径管理的系统、装置和方法
CN106648453A (zh) * 2015-08-10 2017-05-10 Aupera技术有限公司 用于分布式计算和存储的系统
CN108255412A (zh) * 2016-12-29 2018-07-06 北京京东尚科信息技术有限公司 用于分布式文件储存的方法及装置
CN107426288A (zh) * 2017-05-26 2017-12-01 郑州云海信息技术有限公司 一种基于存储网络的资源共享调度方法和装置

Also Published As

Publication number Publication date
CN103078944B (zh) 2016-04-06

Similar Documents

Publication Publication Date Title
CN103078944B (zh) 基于分布式对称文件系统的数据中心架构
CN106294585B (zh) 一种云计算平台下的存储方法
US7562110B2 (en) File switch and switched file system
WO2018045860A1 (zh) 一种挂载文件系统的方法、装置及设备
CN103873505B (zh) 向云存储服务器离线上传的方法、系统与装置
US20080189383A1 (en) Distributed cache between servers of a network
US20070150492A1 (en) Method and system for allocating file in clustered file system
US20040267831A1 (en) Large file support for a network file server
CN106294870B (zh) 基于对象的分布式云存储方法
CN106250270A (zh) 一种云计算平台下的数据备份方法
CN101997924A (zh) 云存储文件传输协议(cftp)
CN105025053A (zh) 基于云存储技术的分布式文件的上传方法及其系统
CN102739720A (zh) 分布式缓存服务器系统及其应用方法、缓存客户端、缓存服务端
JP2008542887A5 (zh)
CN104092758B (zh) 一种分布式高速云存储服务器集群系统的读取方法
CN104811493A (zh) 一种网络感知的虚拟机镜像存储系统及读写请求处理方法
CN106713493A (zh) 一种在计算机集群环境中构建分布式文件系统及方法
US20150324387A1 (en) Broadcast data operations in distributed file systems
US20210297366A1 (en) Resource distribution method and apparatus in internet of things, device, and storage medium
CN103916421A (zh) 云存储数据服务装置、数据传输系统、服务器及方法
CN110727738A (zh) 基于数据分片的全局路由系统、电子设备及存储介质
CN105162623A (zh) 一种云处理方法及云服务器
KR20050071673A (ko) 단일 시스템에서 효율적으로 지원하는 다중 원시 네트워크프로토콜 구현
CN102624932A (zh) 基于索引的异地云数据同步方法
US9544371B1 (en) Method to discover multiple paths to disk devices cluster wide

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant