CN103023973A - 一种基于cpci结构的集群服务器设计方法 - Google Patents

一种基于cpci结构的集群服务器设计方法 Download PDF

Info

Publication number
CN103023973A
CN103023973A CN201210465064XA CN201210465064A CN103023973A CN 103023973 A CN103023973 A CN 103023973A CN 201210465064X A CN201210465064X A CN 201210465064XA CN 201210465064 A CN201210465064 A CN 201210465064A CN 103023973 A CN103023973 A CN 103023973A
Authority
CN
China
Prior art keywords
head node
blade
blades
data
gigabit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201210465064XA
Other languages
English (en)
Inventor
叶丰华
陈彦灵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Electronic Information Industry Co Ltd
Original Assignee
Inspur Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Electronic Information Industry Co Ltd filed Critical Inspur Electronic Information Industry Co Ltd
Priority to CN201210465064XA priority Critical patent/CN103023973A/zh
Publication of CN103023973A publication Critical patent/CN103023973A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Hardware Redundancy (AREA)

Abstract

本发明提供一种基于CPCI结构的集群服务器设计方法,系统结构包括:1)计算刀片,2)头节点刀片;3)存储模块;4)千兆交换机;5)系统背板,其中:其中:1)在CPCI结构的刀片服务器系统中,设置两个头节点刀片存控刀片,在两个头节点刀片中集成SAS控制器,两个头节点刀片之间通过千兆以太网信号在硬盘背板上互连,实现心跳和互备;2)由SAS硬盘和背板组成两个存储模块,每个头节点刀片能分别访问两个存储模块;3)系统中设置两个网络千兆交换机,在机箱内部通过背板与每个节点刀片互连,对外提供网络接口供外部访问。

Description

一种基于CPCI结构的集群服务器设计方法
技术领域
本发明涉及高性能服务器设计技术领域, 具体地说是一种基于CPCI结构的集群服务器设计方法。
背景技术
CPCI结构刀片服务器在主要应用于工业控制、军用、航天、电信等领域,要求系统的高可靠性,如果能够集群技术运用在CPCI结构的刀片服务器上,通过增加双机互备的带有SAS控制器的头节点刀片,增加系统存储冗余设计,可以为用户提供更加可靠性的服务。
发明内容
本发明的目的是提供一种基于CPCI结构的集群刀片服务器设计方法。
本发明的目的是按以下方式实现的,系统包括:1) 计算刀片,2) 头节点刀片;3)存储模块;4)千兆交换机;5)系统背板,其中:
1)在CPCI结构的刀片服务器系统中,设置两个头节点刀片存控刀片,在两个头节点刀片中集成SAS控制器,两个头节点刀片之间通过千兆以太网信号在硬盘背板上互连,实现心跳和互备;
2)由SAS硬盘和背板组成两个存储模块,每个头节点刀片能分别访问两个存储模块;
3)系统中设置两个网络千兆交换机,在机箱内部通过背板与每个节点刀片互连,对外提供网络接口供外部访问;
设计步骤如下:
1)在CPCI结构刀片服务器中增加的两个头节点刀片组成一个cluster,通过存储模块拥有共享数据存储空间,其他任何一个非头节点刀片服务器均能通过网络访问到头节点刀片,当运行一个应用时,应用数据被存储在共享的数据空间内,但是每个节点的操作系统和应用程序文件存储在其各自的本地存储空间上;
2)两个头节点刀片之间通过千兆以太网进行互相通讯,当其中的一个头节点刀片发生故障时,这台服务器上所运行的应用程序将在第二个头节点刀片上被自动接管,防止用户数据丢失,减少系统停机时间,增加系统存控的可靠性。
操作系统和应用程序安装在头节点刀片中的本地系统硬盘上,整个网络系统的数据是通过存储模块所挂载的共享磁盘阵列集中管理和数据备份的,数据集中管理是通过集群软件系统,将所有站点的数据直接从中央存储设备读取和存储;
1)正常工作状态下,两个头节点刀片通过硬盘背板共享8个SAS硬盘组成的1个存储单元,两个头节点刀片处于active/active工作模式,即双机互备模式,两个节点运行相对独立的应用,但彼此互为备机;
2)两个头节点节点在背板上通过千兆以太网0互相发送“心跳”信号,表明各自系统当前的运行状态,并定时互备访问对方数据信息;
3)一旦“心跳”信号表明其中头节点刀片0系统发生故障,或者头节点刀片1无法收到“心跳”信号,则系统的高可用性管理软件判断头节点刀片0发生故障,要求头节点刀片0停止工作,并将当前工作在短时间内转移到头节点刀片1,当前应用得以持续进行,保证网络服务不间断;
4)整机系统互连拓扑,计算刀片通过千兆交换机形成一个并行处理系统,计算刀片之间没有直接联系,所有的业务数据及系统管理都通过上层两个冗余的千兆交换机传输到计算刀片上,千兆交换机的上行端口直接连接到两个做集群的头节点刀片。
本发明的有益效果是:在该集群系统中,两个千兆交换机做冗余设计,两个两个头节点+两个存储模块做双机互备,真正实现多级冗余设计,在CPCI结构的刀片服务器系统中增加这种集群设计,既保持了CPCI服务器机械结构的优点,又有效的增加了系统的可靠性,为产品的稳定工作提供更加可靠的保障。 
附图说明
图1是机箱前部的结构示意图;
图2是机箱后部的结构示意图;
图3是头节点刀片与存储刀片的通讯结构示意图;
图4是系统拓扑结构示意图。
具体实施方式
 参照说明书附图对本发明的方法作以下详细地说明。
如图3所示,在CPCI结构刀片服务器中增加的两个头节点刀片组成一个cluster,通过存储模块拥有共享数据存储空间,其他任何一个非头节点刀片服务器均可以通过网络访问到头节点刀片,运行一个应用时,应用数据被存储在共享的数据空间内,但是每个节点的操作系统和应用程序文件存储在其各自的本地存储空间上。
两个头节点刀片之间通过千兆以太网进行互相通讯,当其中的一个头节点刀片发生故障时,这台服务器上所运行的应用程序将在第二个头节点刀片上被自动接管,防止用户数据丢失,减少系统停机时间,增加系统存控的可靠性。
此系统设计需要以下组成:
1) 计算刀片
2) 头节点刀片
3)存储模块
4)千兆交换机
5)系统背板。
实施例
头节点刀片与存储模块的关系:
操作系统和应用程序安装在头节点刀片中的本地系统硬盘上,整个网络系统的数据是通过存储模块所挂载的共享磁盘阵列集中管理和数据备份的。数据集中管理是通过集群软件系统,将所有站点的数据直接从中央存储设备读取和存储;
1)  正常工作状态下,两个节点通过硬盘背板共享8个SAS硬盘组成的1个存储单元,两个头节点刀片处于active/active模式,即双机互备模式,两个节点运行相对独立的应用,但彼此互为备机。如右图所示的节点0和节点1;
2)  两个头节点节点在背板上通过千兆以太网0互相发送“心跳”信号,表明各自系统当前的运行状态,并定时互备访问对方数据信息;
3)  一旦“心跳”信号表明其中头节点刀片0系统发生故障,或者头节点刀片1无法收到“心跳”信号,则系统的高可用性管理软件判断头节点刀片0发生故障,要求头节点刀片0停止工作,并将当前工作在短时间内转移到头节点刀片1,当前应用得以持续进行,保证网络服务不间断。
整机系统互连拓扑
计算刀片通过千兆交换机形成一个并行处理系统,计算刀片之间没有直接联系,所有的业务数据及系统管理都通过上层两个冗余的千兆交换机传输到计算刀片上。千兆交换机的上行端口直接连接到两个做集群的头节点刀片;
计算刀片可以使用集群软件通过头节点刀;
片访问存储模块;
在该集群系统中,两个千兆交换机做冗余设计,两个两个头节点+两个存储模块做双机互备,真正实现多级冗余设计,在CPCI结构的刀片服务器系统中增加这种集群设计,既保持了CPCI服务器机械结构的优点,又有效的增加了系统的可靠性,为产品的稳定工作提供更加可靠的保障。 
除说明书所述的技术特征外,均为本专业技术人员的已知技术。

Claims (2)

1.一种基于CPCI结构的集群服务器设计方法,其特征在于系统包括:1) 计算刀片,2) 头节点刀片;3)存储模块;4)千兆交换机;5)系统背板,其中:
1)在CPCI结构的刀片服务器系统中,设置两个头节点刀片存控刀片,在两个头节点刀片中集成SAS控制器,两个头节点刀片之间通过千兆以太网信号在硬盘背板上互连,实现心跳和互备;
2)由SAS硬盘和背板组成两个存储模块,每个头节点刀片能分别访问两个存储模块;
3)系统中设置两个网络千兆交换机,在机箱内部通过背板与每个节点刀片互连,对外提供网络接口供外部访问;
设计步骤如下:
1)在CPCI结构刀片服务器中增加的两个头节点刀片组成一个cluster,通过存储模块拥有共享数据存储空间,其他任何一个非头节点刀片服务器均能通过网络访问到头节点刀片,当运行一个应用时,应用数据被存储在共享的数据空间内,但是每个节点的操作系统和应用程序文件存储在其各自的本地存储空间上;
2)两个头节点刀片之间通过千兆以太网进行互相通讯,当其中的一个头节点刀片发生故障时,这台服务器上所运行的应用程序将在第二个头节点刀片上被自动接管,防止用户数据丢失,减少系统停机时间,增加系统存控的可靠性。
2.根据权利要求1所述的方法,其特征在于,操作系统和应用程序安装在头节点刀片中的本地系统硬盘上,整个网络系统的数据是通过存储模块所挂载的共享磁盘阵列集中管理和数据备份的,数据集中管理是通过集群软件系统,将所有站点的数据直接从中央存储设备读取和存储;
1)正常工作状态下,两个头节点刀片通过硬盘背板共享8个SAS硬盘组成的1个存储单元,两个头节点刀片处于active/active工作模式,即双机互备模式,两个节点运行相对独立的应用,但彼此互为备机;
2)两个头节点节点在背板上通过千兆以太网0互相发送“心跳”信号,表明各自系统当前的运行状态,并定时互备访问对方数据信息;
3)一旦“心跳”信号表明其中头节点刀片0系统发生故障,或者头节点刀片1无法收到“心跳”信号,则系统的高可用性管理软件判断头节点刀片0发生故障,要求头节点刀片0停止工作,并将当前工作在短时间内转移到头节点刀片1,当前应用得以持续进行,保证网络服务不间断;
4)整机系统互连拓扑,计算刀片通过千兆交换机形成一个并行处理系统,计算刀片之间没有直接联系,所有的业务数据及系统管理都通过上层两个冗余的千兆交换机传输到计算刀片上,千兆交换机的上行端口直接连接到两个做集群的头节点刀片。
CN201210465064XA 2012-11-19 2012-11-19 一种基于cpci结构的集群服务器设计方法 Pending CN103023973A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210465064XA CN103023973A (zh) 2012-11-19 2012-11-19 一种基于cpci结构的集群服务器设计方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210465064XA CN103023973A (zh) 2012-11-19 2012-11-19 一种基于cpci结构的集群服务器设计方法

Publications (1)

Publication Number Publication Date
CN103023973A true CN103023973A (zh) 2013-04-03

Family

ID=47972099

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210465064XA Pending CN103023973A (zh) 2012-11-19 2012-11-19 一种基于cpci结构的集群服务器设计方法

Country Status (1)

Country Link
CN (1) CN103023973A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103744743A (zh) * 2014-01-17 2014-04-23 浪潮电子信息产业股份有限公司 一种基于数据库rac模式心跳信号的冗余配置的方法
CN104503871A (zh) * 2014-12-29 2015-04-08 浪潮电子信息产业股份有限公司 一种基于小型机系统全冗余模型的实现方法
CN104793905A (zh) * 2015-05-07 2015-07-22 浪潮电子信息产业股份有限公司 一种多路服务器的存储方法和多路服务器
CN105487609A (zh) * 2015-11-25 2016-04-13 浪潮电子信息产业股份有限公司 一种服务器
CN105515870A (zh) * 2015-12-18 2016-04-20 华为技术有限公司 一种刀片服务器、资源分配方法及系统
CN104035731B (zh) * 2014-06-16 2017-02-15 浪潮(北京)电子信息产业有限公司 一种刀片式服务器的存储头结点
WO2019100701A1 (zh) * 2017-11-23 2019-05-31 郑州云海信息技术有限公司 一种SAS Switch控制器扩展架构及设计方法
CN109885447A (zh) * 2018-12-27 2019-06-14 曙光信息产业(北京)有限公司 集群节点的侦测与管理系统
CN112260969A (zh) * 2020-12-23 2021-01-22 广东利通科技投资有限公司 一种基于cpci架构的刀片式边缘计算设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101150413A (zh) * 2007-10-31 2008-03-26 中兴通讯股份有限公司 一种atca刀片服务器多机框级联系统及方法
CN101494697A (zh) * 2008-01-21 2009-07-29 中兴通讯股份有限公司 一种采用双刀片服务器的负载均衡方法和装置
CN102098196A (zh) * 2010-12-10 2011-06-15 曙光信息产业(北京)有限公司 刀片服务器的数据传输方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101150413A (zh) * 2007-10-31 2008-03-26 中兴通讯股份有限公司 一种atca刀片服务器多机框级联系统及方法
CN101494697A (zh) * 2008-01-21 2009-07-29 中兴通讯股份有限公司 一种采用双刀片服务器的负载均衡方法和装置
CN102098196A (zh) * 2010-12-10 2011-06-15 曙光信息产业(北京)有限公司 刀片服务器的数据传输方法

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103744743A (zh) * 2014-01-17 2014-04-23 浪潮电子信息产业股份有限公司 一种基于数据库rac模式心跳信号的冗余配置的方法
CN104035731B (zh) * 2014-06-16 2017-02-15 浪潮(北京)电子信息产业有限公司 一种刀片式服务器的存储头结点
CN104503871A (zh) * 2014-12-29 2015-04-08 浪潮电子信息产业股份有限公司 一种基于小型机系统全冗余模型的实现方法
CN104793905A (zh) * 2015-05-07 2015-07-22 浪潮电子信息产业股份有限公司 一种多路服务器的存储方法和多路服务器
CN105487609A (zh) * 2015-11-25 2016-04-13 浪潮电子信息产业股份有限公司 一种服务器
CN105515870A (zh) * 2015-12-18 2016-04-20 华为技术有限公司 一种刀片服务器、资源分配方法及系统
CN105515870B (zh) * 2015-12-18 2019-06-21 华为技术有限公司 一种刀片服务器、资源分配方法及系统
WO2019100701A1 (zh) * 2017-11-23 2019-05-31 郑州云海信息技术有限公司 一种SAS Switch控制器扩展架构及设计方法
CN109885447A (zh) * 2018-12-27 2019-06-14 曙光信息产业(北京)有限公司 集群节点的侦测与管理系统
CN112260969A (zh) * 2020-12-23 2021-01-22 广东利通科技投资有限公司 一种基于cpci架构的刀片式边缘计算设备
CN112260969B (zh) * 2020-12-23 2021-04-02 广东利通科技投资有限公司 一种基于cpci架构的刀片式边缘计算设备

Similar Documents

Publication Publication Date Title
CN103023973A (zh) 一种基于cpci结构的集群服务器设计方法
US10129169B2 (en) Specifying a highly-resilient system in a disaggregated compute environment
CN102402395B (zh) 基于仲裁磁盘的高可用系统不间断运行方法
CN101594235B (zh) 一种基于smbus总线对刀片服务器进行管理的方法
CN102546813A (zh) 一种基于x86 PC架构的高性能集群计算系统
CN105337780B (zh) 一种服务器节点配置方法及物理节点
CN104135514B (zh) 融合式虚拟化存储系统
CN102467508A (zh) 提供数据库服务的方法及数据库系统
CN101431432A (zh) 刀片服务器
CN103533081A (zh) 一种基于云计算的计费系统及其实现方法
CN101178634A (zh) 刀片服务器及其应用的存储实现方法
CN105577430A (zh) 一种高端容错服务器的节点管理方法
CN104639469A (zh) 一种基于pcie互连的计算和存储集群系统
CN111045602A (zh) 集群系统控制方法及集群系统
CN106814976A (zh) 集群存储系统及应用其的数据交互方法
CN107682411A (zh) 一种大规模sdn控制器集群及网络系统
CN104298574A (zh) 一种数据高速存储处理系统
CN105162623A (zh) 一种云处理方法及云服务器
CN102801598A (zh) 虚拟交换系统的构建方法、装置和交换设备
CN110806989A (zh) 一种存储服务器
CN111880999B (zh) 用于高密度刀片服务器的高可用监控管理装置及冗余切换方法
CN105607872A (zh) 一种存储装置
CN104503871A (zh) 一种基于小型机系统全冗余模型的实现方法
CN203984462U (zh) 强实时和准实时一体化的公共存储与推送系统
CN104104549A (zh) 一种高可用集群存储系统实现方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20130403