CN104216805B - 一种高端磁盘阵列后端磁盘柜链路失效保护系统和方法 - Google Patents

一种高端磁盘阵列后端磁盘柜链路失效保护系统和方法 Download PDF

Info

Publication number
CN104216805B
CN104216805B CN201410425903.4A CN201410425903A CN104216805B CN 104216805 B CN104216805 B CN 104216805B CN 201410425903 A CN201410425903 A CN 201410425903A CN 104216805 B CN104216805 B CN 104216805B
Authority
CN
China
Prior art keywords
end disk
disk array
jbod
controller
array controller
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410425903.4A
Other languages
English (en)
Other versions
CN104216805A (zh
Inventor
周耀辉
赵静
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Beijing Electronic Information Industry Co Ltd
Original Assignee
Inspur Beijing Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Beijing Electronic Information Industry Co Ltd filed Critical Inspur Beijing Electronic Information Industry Co Ltd
Priority to CN201410425903.4A priority Critical patent/CN104216805B/zh
Publication of CN104216805A publication Critical patent/CN104216805A/zh
Application granted granted Critical
Publication of CN104216805B publication Critical patent/CN104216805B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

本发明提出了一种高端磁盘阵列后端磁盘柜链路失效保护系统和方法,所述系统和方法包括:两个高端磁盘阵列控制器、分成两组分别形成品字型的六个JBOD、两个SAS?HBA卡;每个JBOD采用2个SAS控制器冗余设计;两个高端磁盘阵列控制器通过高速互联网络通信,都可控制其内磁盘,并且实时监控后端磁盘,通过所述高端磁盘阵列控制器之间的通信,判断另一高端磁盘阵列控制器是否与所述后端磁盘断开;根据另一高端磁盘阵列控制器与所述后端磁盘的断开与连接情况在所述两个高端磁盘阵列控制器之间进行存储资源的接管与切换操作。通过本发明的设计,解决了磁盘阵列后端磁盘柜链路失效问题,达到链路的高可用性。

Description

一种高端磁盘阵列后端磁盘柜链路失效保护系统和方法
技术领域
本发明涉及数据存储技术,尤其涉及一种高端磁盘阵列后端磁盘柜链路失效保护系统和方法。
背景技术
数据存储发展到海量存储阶段,就要求磁盘阵列能够提供大容量、高可靠、高可用、高性能的服务。对于这样的需求,高端磁盘阵列就需要具备多协议(ip、fc、ib)存储支持,总容量可扩展到512TB,在软硬件设计上做到无单点故障,在任一控制器发生故障的情况下仍可保证数据存取服务不中断。
高端磁盘阵列包含多个控制器,每个控制器分别包括一个前端卡与一个后端卡,前端卡可以是万兆以太网卡、8GbFC卡或者40GbIB卡,用于连接前端主机;后端卡为6Gb的SAS(SerialAttachedSCSI即串行连接小型计算机系统接口SCSI)2.0HBA(HostBusAdapter主机总线适配器)卡,连接24个JBOD,每个JBOD(JustaBunchOfDisks,磁盘簇)提供16个盘位,磁盘采用2TB的SAS盘,系统总容量可支持到512TB。
控制器两两冗余,支持单点容错,可以实现控制器的高可用,但是一对控制器连接后端6个JBOD,如果某条链路失效,都可能造成数据的丢失和系统的不可靠。
发明内容
为了解决上述问题,本发明提出了一种高端磁盘阵列后端磁盘柜链路失效保护系统和方法,提高了高端磁盘阵列的可用性。
为了达到上述目的,本发明提出了一种高端磁盘阵列后端磁盘柜链路失效保护系统,所述系统包括:两个高端磁盘阵列控制器、六个磁盘簇JBOD、两个串行连接小型计算机系统接口SAS主机总线适配器HBA卡。
所述两个高端磁盘阵列控制器包括第一高端磁盘阵列控制器和第二高端磁盘阵列控制器,所述两个SASHBA卡包含第一SASHBA卡和第二SASHBA卡,所述第一SASHBA卡设置在所述第一高端磁盘阵列控制器的后端,所述第二SASHBA卡设置在所述第二高端磁盘阵列控制器的后端。
所述第一高端磁盘阵列控制器和所述第二高端磁盘阵列控制器之间相互冗余,通过高速互联网络通信,都能控制其内磁盘,并且实时监控后端磁盘;所述第一高端磁盘阵列控制器和所述第二高端磁盘阵列控制器还通过所述两个高端磁盘阵列控制器之间的通信,判断另一高端磁盘阵列控制器是否与所述后端磁盘断开;并且根据所述另一高端磁盘阵列控制器与所述后端磁盘的断开与连接情况在所述两个高端磁盘阵列控制器之间进行存储资源的接管与切换操作。
所述六个JBOD分成两组,每组三个JBOD,所述三个JBOD分成两级,第一级包括一个JBOD,第二级包括两个JBOD。
所述第一SASHBA卡和所述第二SASHBA卡都为双端口卡,通过所述双端口,每个SASHBA卡分别连接每组JBOD的第一级JBOD的一个入口。
优选地,所述第一高端磁盘阵列控制器和所述第二高端磁盘阵列控制器都包含高速互联通信模块、磁盘实时监控模块、控制器存储资源接管回切模块。
所述高速互联通信模块,用于与另一高端磁盘阵列控制器进行通信。
所述磁盘实时监控模块,用于实时扫描本高端磁盘阵列控制器后端磁盘的数量,同时与所述本高端磁盘阵列控制器进行通信,对其所述本高端磁盘阵列控制器是否和所述JBOD的连接断开进行可用性判断。
所述控制器存储资源接管回切模块,用于当本高端磁盘阵列控制器与所述JBOD的链路断开时,阻塞所述本高端磁盘阵列控制器的输入输出IO流,使所述本高端磁盘阵列控制器释放其上的存储资源,并通知所述另一高端磁盘阵列控制器的所述控制器存储资源接管回切模块接管所述存储资,并根据其上的逻辑卷信息重新构建存储资源;当所述本高端磁盘阵列控制器重新和所述JBOD恢复连接后,所述本高端磁盘阵列控制器通知所述另一高端磁盘阵列控制器的所述控制器存储资源接管回切模块进行回切操作,使所述另一高端磁盘阵列控制器释放所接管的存储资源,恢复连接的所述本高端磁盘阵列控制器根据逻辑卷信息,重新组建恢复其所接管的存储资源。
优选地,所述六个JBOD中的每个JBOD都包含两个相互冗余的SAS控制器,分别为第一SAS控制器和第二SAS控制器;并且每个所述SAS控制器包含一个入口和两个出口;所述第一SAS控制器包含第一入口,第一出口和第二出口;所述第二SAS控制器包含第二入口,第三出口和第四出口。
所述第一SAS控制器和所述第二SAS控制器相互冗余,都能控制所述JBOD中的16块磁盘。
优选地,所述通过所述双端口,每个SASHBA卡分别连接每组JBOD的第一级JBOD的一个入口具体是指,所述第一SASHBA卡的所述双端口分别与所述第一级JBOD的所述第一入口相连,所述第二SASHBA卡的所述双端口分别与所述第一级JBOD的所述第二入口相连。
优选地,形成品字型的每组所述三个JBOD之间的连接关系是:所述第一级JBOD的所述第一出口和所述第二出口分别与第二级两个JBOD的第一入口相连,所述第一级JBOD的所述第三出口和所述第四出口分别与所述第二级两个JBOD的所述第二入口相连。
优选地,基于所述每组三个JBOD之间的连接关系,所述两个高端磁盘阵列控制器与所述六个JBOD之间存在两条连接路径,所述JBOD之间连接也是两条路径,所述两条路径相互冗余:一条路径是通过SAS线,每组所述JBOD之间的连接;另一条路径是通过相互冗余的所述两个高端磁盘阵列控制器之间的所述高速互联网络以及对端所述高端磁盘阵列控制器,一组所述JBOD与另一组所述JBOD之间的连接。
本发明还提出一种高端磁盘阵列后端磁盘柜链路失效保护方法,其特征在于,所述方法包括:组建所述高端磁盘阵列后端磁盘柜链路失效保护系统架构。
所述两个高端磁盘阵列控制器包括第一高端磁盘阵列控制器和第二高端磁盘阵列控制器,所述两个SASHBA卡包含第一SASHBA卡和第二SASHBA卡,所述第一SASHBA卡设置在所述第一高端磁盘阵列控制器的后端,所述第二SASHBA卡设置在所述第二高端磁盘阵列控制器的后端。
所述第一高端磁盘阵列控制器和所述第二高端磁盘阵列控制器之间相互冗余,通过高速互联网络通信,都能控制其内磁盘,并且实时监控后端磁盘;所述第一高端磁盘阵列控制器和所述第二高端磁盘阵列控制器还通过所述两个高端磁盘阵列控制器之间的通信,判断另一高端磁盘阵列控制器是否与所述后端磁盘断开。并且根据所述另一高端磁盘阵列控制器与所述后端磁盘的断开与连接情况在所述两个高端磁盘阵列控制器之间进行存储资源的接管与切换操作。
所述六个JBOD分成两组,每组三个JBOD,所述三个JBOD分成两级,第一级包括一个JBOD,第二级包括两个JBOD。
所述第一SASHBA卡和所述第二SASHBA卡都为双端口卡,通过所述双端口,每个SASHBA卡分别连接每组JBOD的第一级JBOD的一个入口。
优选地,所述方法还包括:所述第一高端磁盘阵列控制器和所述第二高端磁盘阵列控制器都配置有高速互联通信模块、磁盘实时监控模块、控制器存储资源接管回切模块。
所述高速互联通信模块实现与另一高端磁盘阵列控制器进行通信。
所述磁盘实时监控模块实现实时扫描本高端磁盘阵列控制器后端磁盘的数量,同时与所述本高端磁盘阵列控制器进行通信,对其所述本高端磁盘阵列控制器是否和所述JBOD的连接断开进行可用性判断。
所述控制器存储资源接管回切模块实现当本高端磁盘阵列控制器与所述JBOD的链路断开时,阻塞所述本高端磁盘阵列控制器的输入输出IO流,使所述本高端磁盘阵列控制器释放其上的存储资源,并通知所述另一高端磁盘阵列控制器的所述控制器存储资源接管回切模块接管所述存储资,并根据其上的逻辑卷信息重新构建存储资源;当所述本高端磁盘阵列控制器重新和所述JBOD恢复连接后,所述本高端磁盘阵列控制器通知所述另一高端磁盘阵列控制器的所述控制器存储资源接管回切模块进行回切操作,使所述另一高端磁盘阵列控制器释放所接管的存储资源,恢复连接的所述本高端磁盘阵列控制器根据逻辑卷信息,重新组建恢复其所接管的存储资源。
优选地,所述六个JBOD中的每个JBOD都包含两个相互冗余的SAS控制器,分别为第一SAS控制器和第二SAS控制器;并且每个所述SAS控制器包含一个入口和两个出口;所述第一SAS控制器包含第一入口,第一出口和第二出口;所述第二SAS控制器包含第二入口,第三出口和第四出口。
所述第一SAS控制器和所述第二SAS控制器相互冗余,都能控制所述JBOD中的16块磁盘。
优选地,所述通过所述双端口,每个SASHBA卡分别连接每组JBOD的第一级JBOD的一个入口具体是指,所述第一SASHBA卡的所述双端口分别与所述第一级JBOD的所述第一入口相连,所述第二SASHBA卡的所述双端口分别与所述第一级JBOD的所述第二入口相连。
优选地,形成品字型的每组所述三个JBOD之间的连接关系是:所述第一级JBOD的所述第一出口和所述第二出口分别与第二级两个JBOD的第一入口相连,所述第一级JBOD的所述第三出口和所述第四出口分别与所述第二级两个JBOD的所述第二入口相连。
优选地,基于所述每组三个JBOD之间的连接关系,所述两个高端磁盘阵列控制器与所述六个JBOD之间存在两条连接路径,所述JBOD之间连接也是两条路径,所述两条路径相互冗余:一条路径是通过SAS线,每组所述JBOD之间的连接;另一条路径是通过相互冗余的所述两个高端磁盘阵列控制器之间的所述高速互联网络以及对端所述高端磁盘阵列控制器,一组所述JBOD与另一组所述JBOD之间的连接。
与现有技术相比,本发明提出了一种高端磁盘阵列后端磁盘柜链路失效保护系统和方法,所述系统和方法包括:两个高端磁盘阵列控制器、六个JBOD、两个SASHBA卡;六个JBOD分成两组,每组三个JBOD形成品字型,每个JBOD采用2个SAS控制器冗余设计,每个SAS控制器都能控制其JBOD中的16块。高端磁盘阵列控制器配置有高速互联通信模块、磁盘实时监控模块、控制器存储资源接管回切模块;通过高速互联网络通信,都可控制其内磁盘,并且实时监控后端磁盘,通过所述高端磁盘阵列控制器之间的通信,判断另一高端磁盘阵列控制器是否与所述后端磁盘断开;根据另一高端磁盘阵列控制器与所述后端磁盘的断开与连接情况在所述两个高端磁盘阵列控制器之间进行存储资源的接管与切换操作。通过本发明的设计,解决了磁盘阵列后端磁盘柜链路失效问题,达到链路的高可用性。
附图说明
下面对本发明实施例中的附图进行说明,实施例中的附图是用于对本发明的进一步理解,与说明书一起用于解释本发明,并不构成对本发明保护范围的限制。
图1是磁盘柜JBOD控制冗余设计图;
图2是高端磁盘阵列磁盘柜的冗余连接图;
图3是高端磁盘阵列与磁盘柜链路失效保护处理图。
具体实施方式
为了便于本领域技术人员的理解,下面结合附图对本发明作进一步的描述,并不能用来限制本发明的保护范围。
为了解决高端磁盘阵列后端磁盘柜链路失效的问题,本发明提出一种高端磁盘阵列后端磁盘柜链路失效保护机制。其保护机制,需要在硬件和软件两方面做高可用设计,具体涉及思路如下:
硬件设计,磁盘柜磁盘簇JBOD采用2个SAS控制器冗余设计,每个串行连接小型计算机系统接口SAS控制器都能控制其JBOD中的16块磁盘参考图1。6个JBOD相互连接参考图2进行连接,成品字型。
软件设计,阵列控制器两两之间采用高速网络交换模块冗余设计,在系统启动时,每个控制器将通过高速交换卡的端口建立连接。设计监控模块实时扫描其控制器后端磁盘数量,同控制器间通信,对其控制器是否和JBOD的连接断开进行可用性判断。并设计控制接管回切模块,当控制器和JBOD断开连接后,阻塞其输入输出IO流,释放其上的存储资源,通知对端控制器,接管其存储资源并根据其上的逻辑卷信息,重新构建存储资源。重新建立起来的逻辑卷,其访问由接管控制器来管理。当控制器重新和JBOD恢复连接后,其控制器通知对端控制器进行回切操作,接管的控制器释放接管的资源,恢复连接的控制器根据逻辑卷信息,重新组建恢复其被接管的资源,其访问由自己来管理,其整个处理可以参考图3。
通过硬件和软件的设计,就可保证了磁盘阵列后端磁盘柜链路失效问题,达到链路的高可用。
具体地,本发明提出了一种高端磁盘阵列后端磁盘柜链路失效保护系统,其特征在于,所述系统包括:两个高端磁盘阵列控制器、六个JBOD、两个串行连接小型计算机系统接口SAS主机总线适配器HBA卡。
所述两个高端磁盘阵列控制器包括第一高端磁盘阵列控制器和第二高端磁盘阵列控制器,所述两个SASHBA卡包含第一SASHBA卡和第二SASHBA卡,所述第一SASHBA卡设置在所述第一高端磁盘阵列控制器的后端,所述第二SASHBA卡设置在所述第二高端磁盘阵列控制器的后端。
所述第一高端磁盘阵列控制器和所述第二高端磁盘阵列控制器之间相互冗余,通过高速互联网络通信,都能控制其内磁盘,并且实时监控后端磁盘;所述第一高端磁盘阵列控制器和所述第二高端磁盘阵列控制器还通过所述两个高端磁盘阵列控制器之间的通信,判断另一高端磁盘阵列控制器是否与所述后端磁盘断开;并且根据所述另一高端磁盘阵列控制器与所述后端磁盘的断开与连接情况在所述两个高端磁盘阵列控制器之间进行存储资源的接管与切换操作。
所述六个JBOD分成两组,每组三个JBOD,所述三个JBOD分成两级,第一级包括一个JBOD,第二级包括两个JBOD,每组所述三个JBOD形成品字型。
所述第一SASHBA卡和所述第二SASHBA卡都为双端口卡,通过所述双端口,每个SASHBA卡分别连接每组JBOD的第一级JBOD的一个入口。
优选地,所述第一高端磁盘阵列控制器和所述第二高端磁盘阵列控制器都包含高速互联通信模块、磁盘实时监控模块、控制器存储资源接管回切模块。
所述高速互联通信模块,用于与另一高端磁盘阵列控制器进行通信。
所述磁盘实时监控模块,用于实时扫描本高端磁盘阵列控制器后端磁盘的数量,同时与所述本高端磁盘阵列控制器进行通信,对其所述本高端磁盘阵列控制器是否和所述JBOD的连接断开进行可用性判断。
所述控制器存储资源接管回切模块,用于当本高端磁盘阵列控制器与所述JBOD的链路断开时,阻塞所述本高端磁盘阵列控制器的输入输出IO流,使所述本高端磁盘阵列控制器释放其上的存储资源,并通知所述另一高端磁盘阵列控制器的所述控制器存储资源接管回切模块接管所述存储资,并根据其上的逻辑卷信息重新构建存储资源;当所述本高端磁盘阵列控制器重新和所述JBOD恢复连接后,所述本高端磁盘阵列控制器通知所述另一高端磁盘阵列控制器的所述控制器存储资源接管回切模块进行回切操作,使所述另一高端磁盘阵列控制器释放所接管的存储资源,恢复连接的所述本高端磁盘阵列控制器根据逻辑卷信息,重新组建恢复其所接管的存储资源。
优选地,所述六个JBOD中的每个JBOD都包含两个相互冗余的SAS控制器,分别为第一SAS控制器和第二SAS控制器;并且每个所述SAS控制器包含一个入口和两个出口;所述第一SAS控制器包含第一入口,第一出口和第二出口;所述第二SAS控制器包含第二入口,第三出口和第四出口。
所述第一SAS控制器和所述第二SAS控制器相互冗余,都能控制所述JBOD中的16块磁盘。
优选地,所述通过所述双端口,每个SASHBA卡分别连接每组JBOD的第一级JBOD的一个入口具体是指,所述第一SASHBA卡的所述双端口分别与所述第一级JBOD的所述第一入口相连,所述第二SASHBA卡的所述双端口分别与所述第一级JBOD的所述第二入口相连。
优选地,形成品字型的每组所述三个JBOD之间的连接关系是:所述第一级JBOD的所述第一出口和所述第二出口分别与第二级两个JBOD的第一入口相连,所述第一级JBOD的所述第三出口和所述第四出口分别与所述第二级两个JBOD的所述第二入口相连。
优选地,其特征在于,基于所述每组三个JBOD之间的连接关系,所述两个高端磁盘阵列控制器与所述六个JBOD之间存在两条连接路径,所述JBOD之间连接也是两条路径,所述两条路径相互冗余:一条路径是通过SAS线,每组所述JBOD之间的连接;另一条路径是通过相互冗余的所述两个高端磁盘阵列控制器之间的所述高速互联网络以及对端所述高端磁盘阵列控制器,一组所述JBOD与另一组所述JBOD之间的连接。
本发明还提出一种高端磁盘阵列后端磁盘柜链路失效保护方法,其特征在于,所述方法包括:组建所述高端磁盘阵列后端磁盘柜链路失效保护系统架构。
所述高端磁盘阵列后端磁盘柜链路失效保护系统包括:两个高端磁盘阵列控制器、六个JBOD、两个SASHBA卡。
所述两个高端磁盘阵列控制器包括第一高端磁盘阵列控制器和第二高端磁盘阵列控制器,所述两个SASHBA卡包含第一SASHBA卡和第二SASHBA卡,所述第一SASHBA卡设置在所述第一高端磁盘阵列控制器的后端,所述第二SASHBA卡设置在所述第二高端磁盘阵列控制器的后端。
所述第一高端磁盘阵列控制器和所述第二高端磁盘阵列控制器之间相互冗余,通过高速互联网络通信,都能控制其内磁盘,并且实时监控后端磁盘;所述第一高端磁盘阵列控制器和所述第二高端磁盘阵列控制器还通过所述两个高端磁盘阵列控制器之间的通信,判断另一高端磁盘阵列控制器是否与所述后端磁盘断开;并且根据所述另一高端磁盘阵列控制器与所述后端磁盘的断开与连接情况在所述两个高端磁盘阵列控制器之间进行存储资源的接管与切换操作。
所述六个JBOD分成两组,每组三个JBOD,所述三个JBOD分成两级,第一级包括一个JBOD,第二级包括两个JBOD。
所述第一SASHBA卡和第二SASHBA卡都为双端口卡,通过所述双端口,每个SASHBA卡分别连接每组JBOD的第一级JBOD的一个入口。
优选地,所述方法还包括:所述第一高端磁盘阵列控制器和所述第二高端磁盘阵列控制器都配置有高速互联通信模块、磁盘实时监控模块、控制器存储资源接管回切模块。
所述高速互联通信模块实现与另一高端磁盘阵列控制器进行通信。
所述磁盘实时监控模块实现实时扫描本高端磁盘阵列控制器后端磁盘的数量,同时与所述本高端磁盘阵列控制器进行通信,对其所述本高端磁盘阵列控制器是否和所述JBOD的连接断开进行可用性判断。
所述控制器存储资源接管回切模块实现当本高端磁盘阵列控制器与所述JBOD的链路断开时,阻塞所述本高端磁盘阵列控制器的输入输出IO流,使所述本高端磁盘阵列控制器释放其上的存储资源,并通知所述另一高端磁盘阵列控制器的所述控制器存储资源接管回切模块接管所述存储资,并根据其上的逻辑卷信息重新构建存储资源;当所述本高端磁盘阵列控制器重新和所述JBOD恢复连接后,所述本高端磁盘阵列控制器通知所述另一高端磁盘阵列控制器的所述控制器存储资源接管回切模块进行回切操作,使所述另一高端磁盘阵列控制器释放所接管的存储资源,恢复连接的所述本高端磁盘阵列控制器根据逻辑卷信息,重新组建恢复其所接管的存储资源。
优选地,所述六个JBOD中的每个JBOD都包含两个相互冗余的SAS控制器,分别为第一SAS控制器和第二SAS控制器;并且每个所述SAS控制器包含一个入口和两个出口;所述第一SAS控制器包含第一入口,第一出口和第二出口;所述第二SAS控制器包含第二入口,第三出口和第四出口。
所述第一SAS控制器和所述第二SAS控制器相互冗余,都能控制所述JBOD中的16块磁盘。
优选地,其特征在于,所述通过所述双端口,每个SASHBA卡分别连接每组JBOD的第一级JBOD的一个入口具体是指,所述第一SASHBA卡的所述双端口分别与所述第一级JBOD的所述第一入口相连,所述第二SASHBA卡的所述双端口分别与所述第一级JBOD的所述第二入口相连。
优选地,形成品字型的每组所述三个JBOD之间的连接关系是:所述第一级JBOD的所述第一出口和所述第二出口分别与第二级两个JBOD的第一入口相连,所述第一级JBOD的所述第三出口和所述第四出口分别与所述第二级两个JBOD的所述第二入口相连。
优选地,基于所述每组三个JBOD之间的连接关系,所述两个高端磁盘阵列控制器与所述六个JBOD之间存在两条连接路径,所述JBOD之间连接也是两条路径,所述两条路径相互冗余:一条路径是通过SAS线,每组所述JBOD之间的连接;另一条路径是通过相互冗余的所述两个高端磁盘阵列控制器之间的所述高速互联网络以及对端所述高端磁盘阵列控制器,一组所述JBOD与另一组所述JBOD之间的连接。
通过以上链接设计就可以在JBOD之间形成多条链路,起到冗余作用,不管JBOD哪条链路断了,都可以从冗余链路中访问到JBOD中的磁盘资源。高端磁盘阵列控制器的SAS卡同JBOD的SAS控制链接只有一条链路,这条链路的保护机制通过磁盘阵列控制的冗余性来设计:高端磁盘阵列中控制器两两通过高速互联网络相互连接,作为控制器HA的通信通路和MPIO路径。
两相互冗余的高端磁盘阵列控制器,其看到的磁盘数是相同的,为了确保数据的一致,在某一时刻JBOD的磁盘只被其一控制器独占访问,控制器的监控模块实时扫描后端磁盘数,通过HA通路进行通信检验,当两方磁盘数相等的时候,表示链路稳定,当某一方磁盘数小于对方,表示为小于方的控制器与JBOD之间的链路断开,唤起控制器接管回切模块,第二控制器接管了第一控制器(与JBOD之间的链路断开)上面的存储资源:RAID、存储池、逻辑卷。当链路恢复稳定后,第一控制器的接管回切模块进行回切操作,第二控制器释放其接管的控制器1的资源,控制器1在其上恢复其被接管的存储资源。
通过以上硬件和软件的两方面的设计,对磁盘阵列后端磁盘柜的链路失效其到了有效的保护,提高了高端磁盘阵列的高可用性。
需要说明的是,以上所述的实施例仅是为了便于本领域的技术人员理解而已,并不用于限制本发明的保护范围,在不脱离本发明的发明构思的前提下,本领域技术人员对本发明所做出的任何显而易见的替换和改进等均在本发明的保护范围之内。

Claims (12)

1.一种高端磁盘阵列后端磁盘柜链路失效保护系统,其特征在于,所述系统包括:两个高端磁盘阵列控制器、六个磁盘簇JBOD、两个串行连接小型计算机系统接口SAS主机总线适配器HBA卡;
所述两个高端磁盘阵列控制器包括第一高端磁盘阵列控制器和第二高端磁盘阵列控制器,所述两个SASHBA卡包含第一SASHBA卡和第二SASHBA卡,所述第一SASHBA卡设置在所述第一高端磁盘阵列控制器的后端,所述第二SASHBA卡设置在所述第二高端磁盘阵列控制器的后端;
所述第一高端磁盘阵列控制器和所述第二高端磁盘阵列控制器之间相互冗余,通过高速互联网络通信,都能控制其内磁盘,并且实时监控后端磁盘;所述第一高端磁盘阵列控制器和所述第二高端磁盘阵列控制器还通过所述两个高端磁盘阵列控制器之间的通信,判断另一高端磁盘阵列控制器是否与所述后端磁盘断开;并且根据所述另一高端磁盘阵列控制器与所述后端磁盘的断开与连接情况在所述两个高端磁盘阵列控制器之间进行存储资源的接管与切换操作;
所述六个JBOD分成两组,每组三个JBOD,所述三个JBOD分成两级,第一级包括一个JBOD,第二级包括两个JBOD;
所述第一SASHBA卡和所述第二SASHBA卡都为双端口卡,通过所述双端口,每个SASHBA卡分别连接每组JBOD的第一级JBOD的一个入口;
所述六个JBOD中的每个JBOD都包含两个相互冗余的SAS控制器,分别为第一SAS控制器和第二SAS控制器;并且每个所述SAS控制器包含一个入口和两个出口;所述第一SAS控制器包含第一入口,第一出口和第二出口;所述第二SAS控制器包含第二入口,第三出口和第四出口。
2.如权利要求1所述的系统,其特征在于,所述第一高端磁盘阵列控制器和所述第二高端磁盘阵列控制器都包含高速互联通信模块、磁盘实时监控模块、控制器存储资源接管回切模块;
所述高速互联通信模块,用于与另一高端磁盘阵列控制器进行通信;
所述磁盘实时监控模块,用于实时扫描本高端磁盘阵列控制器后端磁盘的数量,同时与所述本高端磁盘阵列控制器进行通信,对其所述本高端磁盘阵列控制器是否和所述JBOD的连接断开进行可用性判断;
所述控制器存储资源接管回切模块,用于当本高端磁盘阵列控制器与所述JBOD的链路断开时,阻塞所述本高端磁盘阵列控制器的输入输出IO流,使所述本高端磁盘阵列控制器释放其上的存储资源,并通知所述另一高端磁盘阵列控制器的所述控制器存储资源接管回切模块接管所述存储资源,并根据其上的逻辑卷信息重新构建存储资源;当所述本高端磁盘阵列控制器重新和所述JBOD恢复连接后,所述本高端磁盘阵列控制器通知所述另一高端磁盘阵列控制器的所述控制器存储资源接管回切模块进行回切操作,使所述另一高端磁盘阵列控制器释放所接管的存储资源,恢复连接的所述本高端磁盘阵列控制器根据逻辑卷信息,重新组建恢复其所接管的存储资源。
3.如权利要求1所述的系统,其特征在于,所述第一SAS控制器和所述第二SAS控制器相互冗余,都能控制所述JBOD中的16块磁盘。
4.如权利要求3所述的系统,其特征在于,所述通过所述双端口,每个SASHBA卡分别连接每组JBOD的第一级JBOD的一个入口具体是指,所述第一SASHBA卡的所述双端口分别与所述第一级JBOD的所述第一入口相连,所述第二SASHBA卡的所述双端口分别与所述第一级JBOD的所述第二入口相连。
5.如权利要求3所述的系统,其特征在于,形成品字型的每组所述三个JBOD之间的连接关系是:所述第一级JBOD的所述第一出口和所述第二出口分别与第二级两个JBOD的第一入口相连,所述第一级JBOD的所述第三出口和所述第四出口分别与所述第二级两个JBOD的所述第二入口相连。
6.如权利要求5所述的系统,其特征在于,基于所述每组三个JBOD之间的连接关系,所述两个高端磁盘阵列控制器与所述六个JBOD之间存在两条连接路径,所述JBOD之间连接也是两条路径,所述两条路径相互冗余:一条路径是通过SAS线,每组所述JBOD之间的连接;另一条路径是通过相互冗余的所述两个高端磁盘阵列控制器之间的所述高速互联网络以及对端所述高端磁盘阵列控制器,一组所述JBOD与另一组所述JBOD之间的连接。
7.一种高端磁盘阵列后端磁盘柜链路失效保护方法,其特征在于,所述方法包括:组建所述高端磁盘阵列后端磁盘柜链路失效保护系统架构;
两个高端磁盘阵列控制器包括第一高端磁盘阵列控制器和第二高端磁盘阵列控制器,两个SASHBA卡包含第一SASHBA卡和第二SASHBA卡,所述第一SASHBA卡设置在所述第一高端磁盘阵列控制器的后端,所述第二SASHBA卡设置在所述第二高端磁盘阵列控制器的后端;
所述第一高端磁盘阵列控制器和所述第二高端磁盘阵列控制器之间相互冗余,通过高速互联网络通信,都能控制其内磁盘,并且实时监控后端磁盘;所述第一高端磁盘阵列控制器和所述第二高端磁盘阵列控制器还通过所述两个高端磁盘阵列控制器之间的通信,判断另一高端磁盘阵列控制器是否与所述后端磁盘断开;并且根据所述另一高端磁盘阵列控制器与所述后端磁盘的断开与连接情况在所述两个高端磁盘阵列控制器之间进行存储资源的接管与切换操作;
六个JBOD分成两组,每组三个JBOD,所述三个JBOD分成两级,第一级包括一个JBOD,第二级包括两个JBOD;
所述第一SASHBA卡和所述第二SASHBA卡都为双端口卡,通过所述双端口,每个SASHBA卡分别连接每组JBOD的第一级JBOD的一个入口;
所述六个JBOD中的每个JBOD都包含两个相互冗余的SAS控制器,分别为第一SAS控制器和第二SAS控制器;并且每个所述SAS控制器包含一个入口和两个出口;所述第一SAS控制器包含第一入口,第一出口和第二出口;所述第二SAS控制器包含第二入口,第三出口和第四出口。
8.如权利要求7所述的方法,其特征在于,所述方法还包括:所述第一高端磁盘阵列控制器和所述第二高端磁盘阵列控制器都配置有高速互联通信模块、磁盘实时监控模块、控制器存储资源接管回切模块;
所述高速互联通信模块实现与另一高端磁盘阵列控制器进行通信;
所述磁盘实时监控模块实现实时扫描本高端磁盘阵列控制器后端磁盘的数量,同时与所述本高端磁盘阵列控制器进行通信,对其所述本高端磁盘阵列控制器是否和所述JBOD的连接断开进行可用性判断;
所述控制器存储资源接管回切模块实现当本高端磁盘阵列控制器与所述JBOD的链路断开时,阻塞所述本高端磁盘阵列控制器的输入输出IO流,使所述本高端磁盘阵列控制器释放其上的存储资源,并通知所述另一高端磁盘阵列控制器的所述控制器存储资源接管回切模块接管所述存储资源,并根据其上的逻辑卷信息重新构建存储资源;当所述本高端磁盘阵列控制器重新和所述JBOD恢复连接后,所述本高端磁盘阵列控制器通知所述另一高端磁盘阵列控制器的所述控制器存储资源接管回切模块进行回切操作,使所述另一高端磁盘阵列控制器释放所接管的存储资源,恢复连接的所述本高端磁盘阵列控制器根据逻辑卷信息,重新组建恢复其所接管的存储资源。
9.如权利要求7所述的方法,其特征在于,所述第一SAS控制器和所述第二SAS控制器相互冗余,都能控制所述JBOD中的16块磁盘。
10.如权利要求9所述的方法,其特征在于,所述通过所述双端口,每个SASHBA卡分别连接每组JBOD的第一级JBOD的一个入口具体是指,所述第一SASHBA卡的所述双端口分别与所述第一级JBOD的所述第一入口相连,所述第二SASHBA卡的所述双端口分别与所述第一级JBOD的所述第二入口相连。
11.如权利要求9所述的方法,其特征在于,形成品字型的每组所述三个JBOD之间的连接关系是:所述第一级JBOD的所述第一出口和所述第二出口分别与第二级两个JBOD的第一入口相连,所述第一级JBOD的所述第三出口和所述第四出口分别与所述第二级两个JBOD的所述第二入口相连。
12.如权利要求11所述的方法,其特征在于,基于所述每组三个JBOD之间的连接关系,所述两个高端磁盘阵列控制器与所述六个JBOD之间存在两条连接路径,所述JBOD之间连接也是两条路径,所述两条路径相互冗余:一条路径是通过SAS线,每组所述JBOD之间的连接;另一条路径是通过相互冗余的所述两个高端磁盘阵列控制器之间的所述高速互联网络以及对端所述高端磁盘阵列控制器,一组所述JBOD与另一组所述JBOD之间的连接。
CN201410425903.4A 2014-08-26 2014-08-26 一种高端磁盘阵列后端磁盘柜链路失效保护系统和方法 Active CN104216805B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410425903.4A CN104216805B (zh) 2014-08-26 2014-08-26 一种高端磁盘阵列后端磁盘柜链路失效保护系统和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410425903.4A CN104216805B (zh) 2014-08-26 2014-08-26 一种高端磁盘阵列后端磁盘柜链路失效保护系统和方法

Publications (2)

Publication Number Publication Date
CN104216805A CN104216805A (zh) 2014-12-17
CN104216805B true CN104216805B (zh) 2016-03-23

Family

ID=52098324

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410425903.4A Active CN104216805B (zh) 2014-08-26 2014-08-26 一种高端磁盘阵列后端磁盘柜链路失效保护系统和方法

Country Status (1)

Country Link
CN (1) CN104216805B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105786414A (zh) * 2016-03-24 2016-07-20 天津书生云科技有限公司 存储系统、存储系统的访问方法和存储系统的访问装置
CN104657316B (zh) * 2015-03-06 2018-01-19 北京百度网讯科技有限公司 服务器
CN106201770B (zh) * 2015-05-05 2018-12-25 白静 硬盘备份管理系统
CN106021048A (zh) * 2016-05-17 2016-10-12 浪潮电子信息产业股份有限公司 一种磁盘组乱序验证的方法及装置
CN106712943A (zh) * 2017-01-20 2017-05-24 郑州云海信息技术有限公司 一种安全存储系统
CN110703870A (zh) * 2019-09-12 2020-01-17 苏州浪潮智能科技有限公司 一种jbod主板、一种存储系统
CN115657975B (zh) * 2022-12-29 2023-03-31 浪潮电子信息产业股份有限公司 一种磁盘数据读写控制方法、相关组件及前端共享卡

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101611390A (zh) * 2007-02-08 2009-12-23 多特希尔系统公司 识别机柜和设备的方法和装置
CN101923444A (zh) * 2009-06-09 2010-12-22 Lsi公司 N路直接连接的任一控制器到任一控制器架构
CN103049225A (zh) * 2013-01-05 2013-04-17 浪潮电子信息产业股份有限公司 一种双控双活的存储系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4945363B2 (ja) * 2007-07-30 2012-06-06 株式会社日立製作所 バックエンドで接続されるストレージシステム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101611390A (zh) * 2007-02-08 2009-12-23 多特希尔系统公司 识别机柜和设备的方法和装置
CN101923444A (zh) * 2009-06-09 2010-12-22 Lsi公司 N路直接连接的任一控制器到任一控制器架构
CN103049225A (zh) * 2013-01-05 2013-04-17 浪潮电子信息产业股份有限公司 一种双控双活的存储系统

Also Published As

Publication number Publication date
CN104216805A (zh) 2014-12-17

Similar Documents

Publication Publication Date Title
CN104216805B (zh) 一种高端磁盘阵列后端磁盘柜链路失效保护系统和方法
US8943258B2 (en) Server direct attached storage shared through virtual SAS expanders
CN103152397B (zh) 一种多协议存储系统设计方法
CN104657316B (zh) 服务器
US8074105B2 (en) High data availability SAS-based RAID system
US7793145B2 (en) Method and apparatus for verifying fault tolerant configuration
EP1901522A1 (en) Storage system effectively using free ports
CN108696569A (zh) 在NVMe-oF以太网SSD中提供数据复制的系统和方法
CN102622279B (zh) 冗余控制系统、方法及管理控制器
CN108923992A (zh) 一种nas集群高可用方法、系统及电子设备和存储介质
CN105007307B (zh) 一种存储控制方法和系统
CN105472047A (zh) 存储系统
WO2016062037A1 (zh) 通过接口卡传输信息、控制器故障处理方法、装置及系统
CN104135514B (zh) 融合式虚拟化存储系统
CN104333586A (zh) 一种基于光纤链路的san存储设计方法
CN104539679A (zh) 基于分布式闪存技术的集群数据库系统及其数据传输方法
CN103001998A (zh) 一种fc-san存储系统及提高光纤通道稳定性的方法
CN104077424A (zh) 一种实现硬盘在线热切换的方法及装置
CN109933478A (zh) 一种存储系统的故障处理方法和存储系统
US9021166B2 (en) Server direct attached storage shared through physical SAS expanders
US20140032748A1 (en) Configurable network monitoring methods, systems, and apparatus
CN106055276A (zh) 一种非集中式集群存储系统
CN101833522A (zh) 一种sas链路的通信方法和设备
KR101379166B1 (ko) 데이터 처리 시스템에서 논리적 통신 경로의 보존
CN103257907A (zh) 计算机及该计算机的硬盘数据恢复系统及方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant