CN106814976A - 集群存储系统及应用其的数据交互方法 - Google Patents

集群存储系统及应用其的数据交互方法 Download PDF

Info

Publication number
CN106814976A
CN106814976A CN201710043922.4A CN201710043922A CN106814976A CN 106814976 A CN106814976 A CN 106814976A CN 201710043922 A CN201710043922 A CN 201710043922A CN 106814976 A CN106814976 A CN 106814976A
Authority
CN
China
Prior art keywords
microserver
power board
storage system
node
power
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710043922.4A
Other languages
English (en)
Inventor
郭明尧
张健
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Aprocloud Technology Co ltd
Original Assignee
Dongguan City \
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dongguan City \ filed Critical Dongguan City \
Priority to CN201710043922.4A priority Critical patent/CN106814976A/zh
Publication of CN106814976A publication Critical patent/CN106814976A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0604Improving or facilitating administration, e.g. storage management
    • G06F3/0607Improving or facilitating administration, e.g. storage management by facilitating the process of upgrading existing storage systems, e.g. for improving compatibility between host and storage device
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0655Vertical data movement, i.e. input-output transfer; data movement between one or more hosts and one or more storage devices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/067Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Power Sources (AREA)

Abstract

本发明揭露一种集群存储系统及应用其的数据交互方法。集群存储系统包括:至少一个微服务器节点;两块交换板,每一所述交换板上具有一交换机模块,其中,每一所述交换机模块分别与每一所述微服务器节点通讯连接;一基板管理控制器,分别与所述两个交换板及所述至少一个微服务器节点通讯连接,其中,所述基板管理控制器能够控制所述两个交换板在其中一个交换板发生故障时切换至另一个交换板,以使与发生故障的交换板通讯连接的所述微服务器节点能够通过所述另一个交换板进行数据交互。

Description

集群存储系统及应用其的数据交互方法
技术领域
本发明涉及一种集群存储系统,特别涉及一种双交换器集群存储系统及应用其的数据交互方法。
背景技术
传统的存储系统是以SAN(Storage Area Network)为主流,构建一个存储区域网络。而随着云计算及大数据的发展,以及随着PB级数据存储需求的出现,SAN越来越不能满足存储的需要,在大数据领域分布式存储系统逐渐成为主流。
目前分布式存储主要是通过堆叠多台1U或2U的通用服务器的方式来实现存储集群,但这种方式存在占用机房空间大、功耗高的问题。
另外,传统的集群存储系统除了使用通用的1U、2U服务器外,还使用多节点的微服务器。但是,传统的微服务器一般只在机架机箱内集成多个CPU节点,本身并不集成交换机或即使集成两台交换机,每个CPU节点的网络均是接到同一台交换机上。例如,Supermicro公司的3U12节点微服务器5039MS-H12TRF,其没有集成交换机,其是通过外置交换机进行节点间数据交互。如图1所示,其示出了传统微服务器的通讯架构,其中,每一微服务器节点0~N例如是通过以太网端口#0和以太网端口#1与一以太网交换机通讯连接,而该以太网交换机可通过网络接口,例如SFP+接口和RJ45接口,与外部网络通讯连接。这种结构的微服务器系统存在当交换机发生故障时会影响微服务器节点通讯的缺陷。
发明内容
本发明的目的在于提供一种集群存储系统及应用其的数据交互方法,其具有两个交换板模块,与所述交换机模块相连的微服务器节点能够在其中一个交换机模块发生故障时通过另一个交换机模块进行数据交互,从而实现双交换机的双活。
本发明的另一目的在于提供一种集群存储系统及应用其的数据交互方法,通过采用冗余设计和无线缆模块化设计,从而可在一个2U机箱内实现最高12个微服务器节点和最高24个3.5英寸SATA硬盘的集成,进而解决传统分布式存储集群占用机房空间大、功耗高,布线困难的问题。
为了实现上述目的,本发明提供了一种集群存储系统,其特点在于,包括:
至少一个微服务器节点;
两块交换板,每一所述交换板上具有一交换机模块,其中,每一所述交换机模块分别与每一所述微服务器节点通讯连接;
一基板管理控制器,分别与所述两个交换板及所述至少一个微服务器节点通讯连接,其中,所述基板管理控制器能够控制所述两个交换板在其中一个交换板发生故障时切换至另一个交换板,以使与发生故障的交换板通讯连接的所述微服务器节点能够通过所述另一个交换板进行数据交互。
在本发明的一实施例中,每一所述微服务器节点至少包括一第一端口和一第二端口,每一所述微服务器节点上的所述第一端口是与所述两个交换板中的第一交换板上的第一交换机模块通讯连接,每一所述微服务器节点上的所述第二端口是与所述两个交换板中的第二交换板上的第二交换机模块通讯连接。
在本发明的一实施例中,每一所述微服务器节点还与至少一块硬盘通讯连接。
在本发明的一实施例中,每一所述微服务器节点是与两块3.5寸硬盘通讯连接;及/或,所述微服务器节点为ARM微服务器节点。
在本发明的一实施例中,每一所述交换板上的所述交换机模块具有至少一个网络接口,所述网络接口为千兆网络接口或万兆网络接口。
在本发明的一实施例中,所述的集群存储系统还包括一背板,其中,所述微服务器节点、所述交换板、所述基板管理控制器以及所述硬盘是采用无线缆模块化设计安装在所述背板上。
在本发明的一实施例中,所述微服务器节点、所述交换板、所述基板管理控制器以及所述硬盘是集成于一个2U机箱内,每一所述2U机箱内集成有1个所述背板、2个所述交换板、12个所述微服务器节点及24块所述硬盘。
在本发明的一实施例中,每一所述2U机箱内还集成有至少一个电源和至少一个散热风扇模组,且所述电源及所述散热风扇模组是采用无线缆模块化设计。
在本发明的一实施例中,所述电源为2个,所述散热风扇模组为2个。
为了实现上述目的,本发明还提供一种应用如上所述的集群存储系统的数据交互方法,其特点在于,包括:
当其中一个交换板发生故障时,所述基板管理控制器控制与发生故障的所述交换板通讯连接的微服务器节点通过另一个交换板进行数据交互。
本发明的集群存储系统及应用其的数据交互方法,通过两个交换板模块的设计,使与所述交换机模块相连的微服务器节点能够在其中一个交换机模块发生故障时通过另一个交换机模块进行数据交互,从而实现双交换机的双活。
本发明的集群存储系统还通过采用冗余设计和无线缆模块化设计,从而可在一个2U机箱内实现最高12个微服务器节点和最高24个3.5英寸SATA硬盘的集成,进而解决传统分布式存储集群占用机房空间大、功耗高、布线困难的问题。
本发明的双交换器集群存储系统是针对分布式存储特性设计的一款多处理器、高性能、低功耗、易维护的微服务器,尤其适合Swift、Ceph等分布式存储系统。
以下结合附图和具体实施例对本发明进行详细描述,但不作为对本发明的限定。
附图说明
图1为传统微服务器的通讯架构图;
图2为本发明的双交换器集群存储系统的系统架构图;
图3为本发明的双交换器集群存储系统的通讯架构图。
具体实施方式
本发明的双交换器集群存储系统的特别之处在于在单机里集成了2个交换机模块,每个交换机模块分别和每个微服务器节点相连,如此可以使得微服务器节点能够在其中一个交换机模块发生故障时通过另一个交换机模块进行数据交互(包括数据传输、数据存储等),也即,任何一个交换机故障都不会影响微服务节点的通讯。
如图2所示,本发明的双交换器集群存储系统主要包括多个微服务器节点(例如微服务器节点0~N)、两块交换板(例如交换板#0和交换板#1)以及一基板管理控制器(BMC)。其中,每一交换板上具有一交换机模块,每一所述交换机模块是分别与每一所述微服务器节点通讯连接。而所述基板管理控制器是分别与所述两个交换板及每一所述微服务器节点通讯连接,例如所述基板管理控制器可以通过Uart接口分别与交换板#0和交换板#1连接,并利用一串口切换矩阵通过Uart接口与微服务器节点0~N连接。而每一个微服务器节点0~N是包括一第一端口(例如SGMII端口#0)和一第二端口(例如SGMII端口#1),并且,每一个微服务器节点0~N是通过所述第一端口(例如SGMII端口#0)与交换板#0(即第一交换板)上的第一交换机模块(图中未标示)通讯连接,每一个微服务器节点0~N是通过所述第二端口(例如SGMII端口#1)与交换板#1(即第二交换板)上的第二交换机模块(图中未标示)通讯连接,从而可以实现每个微服务器节点0~N与所述交换板#0、交换板#1之间的数据交互。
在本发明中,所述基板管理控制器能够控制所述两个交换板在其中一个交换板发生故障时切换至另一个交换板,以使与发生故障的交换板通讯连接的所述微服务器节点能够通过所述另一个交换板进行数据交互,如此即可实现双交换机的双活(Active-Active)。
较佳地,在本发明中,所述微服务器节点0~N例如可为ARM微服务器节点,即采用ARM芯片作为CPU。而且,每一所述微服务器节点0~N还可与至少一块硬盘通讯连接,例如,在图2所示的实施例中,每一微服务器节点0~N可分别与两块3.5寸SATA硬盘通过SATA接口通讯连接。而每一所述交换板(例如交换板#0或交换板#1)上的交换机模块还具有至少一个网络接口,例如2个,所述网络接口可为千兆(1G)网络接口或万兆(10G)网络接口。例如,在交换板#0和交换板#1上可以分别设置1个SPF+接口和1个RJ45接口。当然,可以理解的是,本发明中微服务器节点的数量和类型、网络接口的数量和接口类型、以及硬盘的数量和类型并不局限于图2所示实施例所示,其可以根据实际需要进行设计,例如采用冗余设计,这些并不作为对本发明的限制。
在本发明中,所述集群存储系统还可包括至少一个电源和至少一个散热风扇模组。所述电源和散热风扇模组例如也可采用冗余设计。更佳的是,本发明的微服务器节点、交换板、基板管理控制器、硬盘、电源及散热风扇模组等部件可采用无线缆模块化设计。如此,可将本发明的微服务器节点、交换板、基板管理控制器、电源、散热风扇模组以及硬盘等部件通过无线缆的模块化接口安装在一背板上,从而可将上述部件集成于一个2U机箱内,例如,本发明可在一个2U机箱内集成1个背板、2个交换板、12个微服务器节点、24块3.5寸SATA硬盘、2个550W电源、及2个热插拔散热风扇模组。
如图3所示,其示出了本发明的集群存储系统的通讯架构图。其中,以部署于以太网中为例,本发明的集群存储系统的多个微服务器节点0~N是分别通过以太网端口#0与以太网交换机#0通讯以在该以太网交换机#0与多个微服务器节点0~N之间进行数据交互,以及分别通过以太网端口#1与以太网交换机#1通讯以在该以太网交换机#1与多个微服务器节点0~N之间进行数据交互。并且,例如,当该以太网交换机#0发生故障时,各微服务器节点0~N可以通过以太网端口#1与以太网交换机#1通讯以进行数据交互。
本发明的双交换器集群存储系统在单机里集成了2个交换机模块,实现了在单台服务器上实现分布式存储集群。本发明可以是针对分布式存储设计的ARM/X86架构微服务器,其可在一个2U机箱内安装高达12个存储节点,每个节点可支持2块3.5寸硬盘,每个节点可支持2个千兆/万兆网络。并且,网络、电源、散热等部件皆可采用冗余设计,不仅解决了传统分布式存储集群占用机房空间大、功耗高的特点,又具备传统SAN架构的双控制器存储产品的双活(Active-Active)特性,因此,可以说本发明是结构上类似SBB(Storage BridgeBay)产品的基于IP架构的分布式存储集群系统。本发明的双交换器集群存储系统尤其适合Swift、Ceph等分布式存储系统,且具有多处理器、高性能、低功耗、易维护等特点。
当然,本发明还可有其它多种实施例,在不背离本发明精神及其实质的情况下,熟悉本领域的技术人员当可根据本发明作出各种相应的改变和变形,但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。

Claims (10)

1.一种集群存储系统,其特征在于,包括:
至少一个微服务器节点;
两块交换板,每一所述交换板上具有一交换机模块,其中,每一所述交换机模块分别与每一所述微服务器节点通讯连接;
一基板管理控制器,分别与所述两个交换板及所述至少一个微服务器节点通讯连接,其中,所述基板管理控制器能够控制所述两个交换板在其中一个交换板发生故障时切换至另一个交换板,以使与发生故障的交换板通讯连接的所述微服务器节点能够通过所述另一个交换板进行数据交互。
2.根据权利要求1所述的集群存储系统,其特征在于,每一所述微服务器节点至少包括一第一端口和一第二端口,每一所述微服务器节点上的所述第一端口是与所述两个交换板中的第一交换板上的第一交换机模块通讯连接,每一所述微服务器节点上的所述第二端口是与所述两个交换板中的第二交换板上的第二交换机模块通讯连接。
3.根据权利要求2所述的集群存储系统,其特征在于,每一所述微服务器节点还与至少一块硬盘通讯连接。
4.根据权利要求3所述的集群存储系统,其特征在于,每一所述微服务器节点是与两块3.5寸硬盘通讯连接;及/或,所述微服务器节点为ARM微服务器节点。
5.根据权利要求4所述的集群存储系统,其特征在于,每一所述交换板上的所述交换机模块具有至少一个网络接口,所述网络接口为千兆网络接口或万兆网络接口。
6.根据权利要求5所述的集群存储系统,其特征在于,还包括一背板,其中,所述微服务器节点、所述交换板、所述基板管理控制器以及所述硬盘是采用无线缆模块化设计安装在所述背板上。
7.根据权利要求3~6中任一权利要求所述的集群存储系统,其特征在于,所述微服务器节点、所述交换板、所述基板管理控制器以及所述硬盘是集成于一个2U机箱内,每一所述2U机箱内集成有1个所述背板、2个所述交换板、12个所述微服务器节点及24块所述硬盘。
8.根据权利要求7所述的集群存储系统,其特征在于,每一所述2U机箱内还集成有至少一个电源和至少一个散热风扇模组,且所述电源及所述散热风扇模组是采用无线缆模块化设计。
9.根据权利要求8所述的集群存储系统,其特征在于,所述电源为2个,所述散热风扇模组为2个。
10.一种应用如权利要求5所述的集群存储系统的数据交互方法,其特征在于,包括:
当其中一个交换板发生故障时,所述基板管理控制器控制与发生故障的所述交换板通讯连接的微服务器节点通过另一个交换板进行数据交互。
CN201710043922.4A 2017-01-19 2017-01-19 集群存储系统及应用其的数据交互方法 Pending CN106814976A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710043922.4A CN106814976A (zh) 2017-01-19 2017-01-19 集群存储系统及应用其的数据交互方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710043922.4A CN106814976A (zh) 2017-01-19 2017-01-19 集群存储系统及应用其的数据交互方法

Publications (1)

Publication Number Publication Date
CN106814976A true CN106814976A (zh) 2017-06-09

Family

ID=59111526

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710043922.4A Pending CN106814976A (zh) 2017-01-19 2017-01-19 集群存储系统及应用其的数据交互方法

Country Status (1)

Country Link
CN (1) CN106814976A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107506144A (zh) * 2017-08-25 2017-12-22 郑州云海信息技术有限公司 一种集群存储系统机箱统一管理方法及系统
CN110275680A (zh) * 2019-06-24 2019-09-24 浙江大华技术股份有限公司 一种双控双活存储系统
CN111884950A (zh) * 2020-07-27 2020-11-03 深圳市信锐网科技术有限公司 数据传输方法、目标交换机、指定交换机及交换机系统
CN113220085A (zh) * 2021-05-19 2021-08-06 北京百度网讯科技有限公司 服务器

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104035831A (zh) * 2014-07-01 2014-09-10 浪潮(北京)电子信息产业有限公司 一种高端容错计算机管理系统及方法
CN104104549A (zh) * 2014-08-01 2014-10-15 浪潮电子信息产业股份有限公司 一种高可用集群存储系统实现方法
CN104486130A (zh) * 2014-12-26 2015-04-01 浪潮电子信息产业股份有限公司 一种面向云服务器的多接口管理网络架构
CN104639469A (zh) * 2015-02-06 2015-05-20 方一信息科技(上海)有限公司 一种基于pcie互连的计算和存储集群系统
CN104991614A (zh) * 2015-06-16 2015-10-21 山东超越数控电子有限公司 一种加固模块化服务器
CN105630104A (zh) * 2015-12-30 2016-06-01 深圳市瑞驰信息技术有限公司 一种集群存储系统
CN105892589A (zh) * 2016-04-21 2016-08-24 深圳市瑞驰信息技术有限公司 一种缓存服务器群集

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104035831A (zh) * 2014-07-01 2014-09-10 浪潮(北京)电子信息产业有限公司 一种高端容错计算机管理系统及方法
CN104104549A (zh) * 2014-08-01 2014-10-15 浪潮电子信息产业股份有限公司 一种高可用集群存储系统实现方法
CN104486130A (zh) * 2014-12-26 2015-04-01 浪潮电子信息产业股份有限公司 一种面向云服务器的多接口管理网络架构
CN104639469A (zh) * 2015-02-06 2015-05-20 方一信息科技(上海)有限公司 一种基于pcie互连的计算和存储集群系统
CN104991614A (zh) * 2015-06-16 2015-10-21 山东超越数控电子有限公司 一种加固模块化服务器
CN105630104A (zh) * 2015-12-30 2016-06-01 深圳市瑞驰信息技术有限公司 一种集群存储系统
CN105892589A (zh) * 2016-04-21 2016-08-24 深圳市瑞驰信息技术有限公司 一种缓存服务器群集

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107506144A (zh) * 2017-08-25 2017-12-22 郑州云海信息技术有限公司 一种集群存储系统机箱统一管理方法及系统
CN110275680A (zh) * 2019-06-24 2019-09-24 浙江大华技术股份有限公司 一种双控双活存储系统
CN110275680B (zh) * 2019-06-24 2020-12-01 浙江大华技术股份有限公司 一种双控双活存储系统
CN111884950A (zh) * 2020-07-27 2020-11-03 深圳市信锐网科技术有限公司 数据传输方法、目标交换机、指定交换机及交换机系统
CN111884950B (zh) * 2020-07-27 2022-08-05 深圳市信锐网科技术有限公司 数据传输方法、目标交换机、指定交换机及交换机系统
CN113220085A (zh) * 2021-05-19 2021-08-06 北京百度网讯科技有限公司 服务器

Similar Documents

Publication Publication Date Title
EP3284218B1 (en) Switch network architecture
US7787482B2 (en) Independent drive enclosure blades in a blade server system with low cost high speed switch modules
CN102546813B (zh) 一种基于x86 PC架构的高性能集群计算系统
CN104135514B (zh) 融合式虚拟化存储系统
CN106814976A (zh) 集群存储系统及应用其的数据交互方法
US8943258B2 (en) Server direct attached storage shared through virtual SAS expanders
KR20020041281A (ko) 네트워크 스위치가 내장된 고밀도 멀티 서버 시스템
CN101277214B (zh) 一种管理刀片式服务器的方法及系统
CN205139890U (zh) 一种基于x86架构的双控双活存储系统
JP2004530972A (ja) 障害の存在下で完全な性能を維持するファイルサーバのツイン接続フェールオーバ
CN101739220A (zh) 一种多控制器存储阵列的设计方法
CN103118103A (zh) 一种可实现多节点间互联与管理的云服务器架构
CN104967577B (zh) Sas交换机和服务器
CN102611560A (zh) 夹层卡、服务器及服务器系统
CN104731727A (zh) 一种双控存储系统监控管理系统及方法
CN105099776A (zh) 云服务器的管理系统
CN202443354U (zh) 多节点无线缆模块化计算机
WO2014067264A1 (zh) 一种交换板和刀片服务器
CN104679714A (zh) 一种基于atca架构的超级计算机集群
WO2019100701A1 (zh) 一种SAS Switch控制器扩展架构及设计方法
CN103605413A (zh) 机架式服务器系统的机柜、机架式服务器系统及其管理方法
WO2016082442A1 (zh) 一种存储系统及交换扩展装置
WO2008052880A1 (en) Blade server system
CN105511990B (zh) 基于融合架构双冗余度存储控制节点架构的装置
CN206649427U (zh) 一种包括双控存储系统的服务器结构

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20180425

Address after: 518129 Room 215, E 215, Bantian International Center, 5 South Road, Longgang District, Shenzhen, Guangdong.

Applicant after: SHENZHEN APROCLOUD TECHNOLOGY CO.,LTD.

Address before: 523660 first floor, No. 4 workshop, Hon Hai Industrial Park, Qinghu Qinghu Industrial Zone, Qingxi Town, Dongguan, Guangdong

Applicant before: DONGGUAN APROCLOUD ELECTRONIC CO.,LTD.

RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170609