CN103106048A - 一种多控多活的存储系统 - Google Patents

一种多控多活的存储系统 Download PDF

Info

Publication number
CN103106048A
CN103106048A CN2013100350373A CN201310035037A CN103106048A CN 103106048 A CN103106048 A CN 103106048A CN 2013100350373 A CN2013100350373 A CN 2013100350373A CN 201310035037 A CN201310035037 A CN 201310035037A CN 103106048 A CN103106048 A CN 103106048A
Authority
CN
China
Prior art keywords
data
module
controller
read
redundancy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2013100350373A
Other languages
English (en)
Inventor
王恩东
葛峰
李素叶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Electronic Information Industry Co Ltd
Original Assignee
Inspur Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Electronic Information Industry Co Ltd filed Critical Inspur Electronic Information Industry Co Ltd
Priority to CN2013100350373A priority Critical patent/CN103106048A/zh
Publication of CN103106048A publication Critical patent/CN103106048A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Memory System Of A Hierarchy Structure (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种多控多活的存储系统,在硬件方面搭建多控多活的存储系统硬件模块,各主要部件均采用模块设计,控制器数据互联模块与至少两个数据交换机通过冗余的数据链路连接,且数据交换机均处于激活active状态。控制器数据互联模块与每一个数据交换机都有独立的数据链路,其通信方式为控制器数据互联模块将所述待发送特定格式的数据分配给所述所连接的数据交换机,分别向各数据交换机发送分配给该数据交换机的部分系统特定格式的数据。控制器数据互联模块之间为active-active互备状态,数据交换机之间也为active-active互备状态,通过多个接口模块之间的冗余设计以确保无单点故障。

Description

一种多控多活的存储系统
技术领域
本发明涉及计算机应用领域,具体地说是一种多控多活的存储系统。
背景技术
在传统存储阵列设备中,根据控制器数量的多寡,可分为单控存储设备和双控存储设备。
在双控阵列中,控制器的互联通过两个控制器的网络接口通信即可;对后端磁盘资源的管理也采用双链路。但当控制器数量超出2个时,采用直接互联的方式,多控制器和后端磁盘资源的管理就不能实现,必须采用新的模块。
本专利多个控制器之间为多条通信链路,多控存储模块即可实现多控制器存储的设计与后端磁盘的统一管理,并实现系统的高可用。
发明内容
本发明的目的是提供一种多控多活的存储系统。
本发明的目的是按以下方式实现的,系统包括:控制器数据互联模块、冗余后端存储互联模块、后端接口模块、全局共享缓存模块和数据锁管理机制,其中:
控制器数据互联模块是多控制器存储系统的核心模块,控制器数据互联模块与至少两个数据交换机通过冗余的数据链路连接,且数据交换机均处于激活状态,控制器数据互联模块与每一个数据交换机都有独立的数据链路,其通信方式为控制器将所述待发送特定格式的数据分配给所述所连接的数据交换机,分别向各数据交换机发送分配给该数据交换机的部分系统特定格式的数据,控制器之间控制器为心跳互备状态,数据交换机之间也为心跳互备状态;
冗余后端存储互联模块通过冗余的SAS链路与至少两个后端接口模块连接,后端接口模块通过冗余的SAS链路与磁盘箱连接,控制器数据互联模块与后端接口模块之间,后端模块与磁盘箱之间均为冗余链路, 如果某一条链路出现故障时,通过其他路径保持数据链路通畅,通过多个接口模块之间的冗余设计以确保无单点故障;
全局共享缓存模块是多控制器系统结构的关键技术,多个控制器数据互联模块的缓存通过逻辑地址映射技术,把所有缓存单元组织成一个大的全局缓存池提供给所有控制器数据互联模块使用,通过读写锁的并发访问控制技术实现对缓存数据的并发访问控制,实现多控制器数据互联模块之间的Cache一致性。
冗余后端存储互联模块首先建立了控制器数据互联模块与至少两个后端接口模块直接冗余的SAS链路连接,保证控制器数据互联模块与后端接口模块直接的点对点的数据路径高可用,其次建立接口模块与磁盘箱之间的冗余路径,保证后端接口模块与磁盘箱之间的点对点的数据路径高可用,同时冗余的接口模块之间的设计能确保后端接口模块无单点故障。
数据锁管理机制,提供从数据区域到数据单元两个级别读写访问锁,数据区域读写锁是若干数据单元读写锁的集合,能保证控制器数据互联模块对一组相关的数据单元进行读写操作时的数据一致性和顺序读写操作时的效率,数据单元读写锁是最小粒度的读写锁,用来锁定全局共享缓存模块的单个页面,它将并发访问冲突限制在单个页面,提高了访问的并发度,分层读写锁使控制器数据互联模块既能够使用粗粒度锁实现缓存数据的快速锁定,提高顺序读写操作的效率,又能够通过细粒度锁提高缓存数据的访问并发度,提高数据访问效率。
本发明的有益效果是:在硬件方面搭建多控多活的存储系统硬件模块,各主要部件均采用模块设计,控制器数据互联模块与至少两个数据交换机通过冗余的数据链路连接,且数据交换机均处于激活active状态。控制器数据互联模块与每一个数据交换机都有独立的数据链路,其通信方式为控制器数据互联模块将所述待发送特定格式的数据分配给所述所连接的数据交换机,分别向各数据交换机发送分配给该数据交换机的部分系统特定格式的数据。控制器数据互联模块之间为active-active互备状态,数据交换机之间也为active-active互备状态。通过多个接口模块之间的冗余设计以确保无单点故障;用来锁定全局共享缓存模块的单个页面,它将并发访问冲突限制在单个页面,提高了访问的并发度,分层读写锁使控制器数据互联模块既能够使用粗粒度锁实现缓存数据的快速锁定,提高顺序读写操作的效率,又能够通过细粒度锁提高缓存数据的访问并发度,提高数据访问效率。
附图说明
图1是 控制器的数据互联模块图;
图2是冗余后端存储互联模块图;
图3是全局共享缓存读写锁结构框图。
具体实施方式
参照说明书附图对本发明的系统作以下详细地说明。
鉴于此,本发明提供了一种数据传输方法和系统,起始控制器向数据交换机发送待同步特定格式的数据,所述数据交换机将待同步特定格式的数据转发至目的控制器。通过这种数据传输模块,实行控制器之间传递控制器状态、控制器缓存、及后端存储等各项系统信息,实现系统同步、服务接管,全局缓存,为系统的高可用提供物理基础。
具体设计步骤如下:
系统包括:控制器数据互联模块、冗余后端存储互联模块、全局共享缓存模块和数据锁管理机制,其中:
控制器数据互联模块,是多控制器存储系统的核心模块。该模块各主要部件均采用模块设计,具有良好的可扩展性,客户按需选择,维护、升级、管理简单方便。
控制器数据互联模块与至少两个数据交换机通过冗余的数据链路连接,且数据交换机均处于激活active状态。控制器数据互联模块与每一个数据交换机都有独立的数据链路,其通信方式为控制器数据互联模块将所述待发送特定格式的数据分配给所述所连接的数据交换机,分别向各数据交换机发送分配给该数据交换机的部分系统特定格式的数据。控制器数据互联模块之间为active-active互备状态,数据交换机之间也为active-active互备状态。
冗余后端存储互联模块,控制器数据互联模块与至少两个后端接口模块通过冗余的SAS链路连接,后端接口模块通过冗余的SAS链路与磁盘箱连接。控制器数据互联模块与后端接口模块之间、后端模块与磁盘箱之间均为冗余链路,如果某一条链路出现故障时,可以通过其他路径保持数据链路通畅。多个接口模块之间的冗余设计,可以确保无单点故障。
全局共享缓存模块,通过逻辑地址映射技术把所有缓存单元组织成一个大的全局缓存池,提供给所有控制器数据互联模块使用。通过共享缓存的读写锁等机制,保证共全局缓存池的性能、可靠性、可用性和可扩展性。多控制器数据互联模块使用读写锁机制访问全局共享缓存池,解决并发数据读写的Cache一致性问题。
数据锁管理机制,提供了从数据区域到数据单元两个级别读写访问锁。数据区域读写锁是若干数据单元读写锁的集合,保证了控制器数据互联模块对一组相关的数据单元进行读写操作时的数据一致性和顺序读写操作时的效率。数据单元读写锁是最小粒度的读写锁,用来锁定全局共享缓存模块的单个页面,它将并发访问冲突限制在单个页面,提高了访问的并发度。分层读写锁使控制器既能够使用粗粒度锁实现缓存数据的快速锁定,提高顺序读写操作的效率,又能够通过细粒度锁提高缓存数据的访问并发度,提高数据访问效率。
除说明书所述的技术特征外,均为本专业技术人员的已知技术。

Claims (3)

1.一种多控多活的存储系统, 其特征在于系统包括:控制器数据互联模块、冗余后端存储互联模块、后端接口模块、全局共享缓存模块,其中:
控制器数据互联模块是多控制器存储系统的核心模块,控制器数据互联模块与至少两个数据交换机通过冗余的数据链路连接,且数据交换机均处于激活状态,控制器数据互联模块与每一个数据交换机都有独立的数据链路,其通信方式为控制器将所述待发送特定格式的数据分配给所述所连接的数据交换机,分别向各数据交换机发送分配给该数据交换机的部分系统特定格式的数据,控制器之间控制器为心跳互备状态,数据交换机之间也为心跳互备状态;
冗余后端存储互联模块通过冗余的SAS链路与至少两个后端接口模块连接,后端接口模块通过冗余的SAS链路与磁盘箱连接,控制器数据互联模块与后端接口模块之间,后端模块与磁盘箱之间均为冗余链路, 如果某一条链路出现故障时,通过其他路径保持数据链路通畅,通过多个接口模块之间的冗余设计以确保无单点故障;
全局共享缓存模块是多控制器系统结构的关键技术,多个控制器数据互联模块的缓存通过逻辑地址映射技术,把所有缓存单元组织成一个大的全局缓存池提供给所有控制器数据互联模块使用,通过读写锁的并发访问控制技术实现对缓存数据的并发访问控制,实现多控制器数据互联模块之间的Cache一致性。
2.根据权利要求1所述的系统,其特征在于冗余后端存储互联模块首先建立了控制器数据互联模块与至少两个后端接口模块直接冗余的SAS链路连接,保证控制器数据互联模块与后端接口模块直接的点对点的数据路径高可用,其次建立接口模块与磁盘箱之间的冗余路径,保证后端接口模块与磁盘箱之间的点对点的数据路径高可用,同时冗余的接口模块之间的设计能确保后端接口模块无单点故障。
3.根据权利要求1所述的系统,其特征在于数据锁管理机制,提供从数据区域到数据单元两个级别读写访问锁,数据区域读写锁是若干数据单元读写锁的集合,能保证控制器数据互联模块对一组相关的数据单元进行读写操作时的数据一致性和顺序读写操作时的效率,数据单元读写锁是最小粒度的读写锁,用来锁定全局共享缓存模块的单个页面,它将并发访问冲突限制在单个页面,提高了访问的并发度,分层读写锁使控制器数据互联模块既能够使用粗粒度锁实现缓存数据的快速锁定,提高顺序读写操作的效率,又能够通过细粒度锁提高缓存数据的访问并发度,提高数据访问效率。
CN2013100350373A 2013-01-30 2013-01-30 一种多控多活的存储系统 Pending CN103106048A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2013100350373A CN103106048A (zh) 2013-01-30 2013-01-30 一种多控多活的存储系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2013100350373A CN103106048A (zh) 2013-01-30 2013-01-30 一种多控多活的存储系统

Publications (1)

Publication Number Publication Date
CN103106048A true CN103106048A (zh) 2013-05-15

Family

ID=48313944

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2013100350373A Pending CN103106048A (zh) 2013-01-30 2013-01-30 一种多控多活的存储系统

Country Status (1)

Country Link
CN (1) CN103106048A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104503709A (zh) * 2015-01-14 2015-04-08 浪潮(北京)电子信息产业有限公司 一种双控存储阵列的共享磁盘争用仲裁方法及系统
CN105072029A (zh) * 2015-08-31 2015-11-18 浪潮(北京)电子信息产业有限公司 一种双活双控存储系统的冗余链路设计方法及系统
CN105426275A (zh) * 2015-10-30 2016-03-23 成都华为技术有限公司 双活集群系统中容灾的方法及装置
CN107589912A (zh) * 2017-09-12 2018-01-16 郑州云海信息技术有限公司 一种硬盘的访问方法及装置
CN108958984A (zh) * 2018-08-13 2018-12-07 深圳市证通电子股份有限公司 基于ceph的双活同步在线热备方法
CN109491587A (zh) * 2017-09-11 2019-03-19 华为技术有限公司 数据访问的方法及装置
CN109857341A (zh) * 2019-01-15 2019-06-07 新华三技术有限公司成都分公司 写锁预取长度的确定方法及装置
CN110635950A (zh) * 2019-09-30 2019-12-31 深圳供电局有限公司 一种双数据中心容灾系统
CN111740927A (zh) * 2020-07-20 2020-10-02 湖南航天捷诚电子装备有限责任公司 一种冗余交换机

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1545033A (zh) * 2003-11-14 2004-11-10 清华大学 Fc-san存储子系统的lun cache方法
US6859867B1 (en) * 2000-05-31 2005-02-22 Intel Corporation Translation and protection table and method of using the same to validate access requests
CN101739220A (zh) * 2009-02-25 2010-06-16 浪潮电子信息产业股份有限公司 一种多控制器存储阵列的设计方法
CN102103471A (zh) * 2011-02-23 2011-06-22 浪潮(北京)电子信息产业有限公司 数据传输方法和系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6859867B1 (en) * 2000-05-31 2005-02-22 Intel Corporation Translation and protection table and method of using the same to validate access requests
CN1545033A (zh) * 2003-11-14 2004-11-10 清华大学 Fc-san存储子系统的lun cache方法
CN101739220A (zh) * 2009-02-25 2010-06-16 浪潮电子信息产业股份有限公司 一种多控制器存储阵列的设计方法
CN102103471A (zh) * 2011-02-23 2011-06-22 浪潮(北京)电子信息产业有限公司 数据传输方法和系统

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104503709A (zh) * 2015-01-14 2015-04-08 浪潮(北京)电子信息产业有限公司 一种双控存储阵列的共享磁盘争用仲裁方法及系统
CN104503709B (zh) * 2015-01-14 2018-05-22 浪潮(北京)电子信息产业有限公司 一种双控存储阵列的共享磁盘争用仲裁方法及系统
CN105072029B (zh) * 2015-08-31 2018-05-04 浪潮(北京)电子信息产业有限公司 一种双活双控存储系统的冗余链路设计方法及系统
CN105072029A (zh) * 2015-08-31 2015-11-18 浪潮(北京)电子信息产业有限公司 一种双活双控存储系统的冗余链路设计方法及系统
CN105426275B (zh) * 2015-10-30 2019-04-19 成都华为技术有限公司 双活集群系统中容灾的方法及装置
US10671498B2 (en) 2015-10-30 2020-06-02 Huawei Technologies Co., Ltd. Method and apparatus for redundancy in active-active cluster system
US11809291B2 (en) 2015-10-30 2023-11-07 Huawei Technologies Co., Ltd. Method and apparatus for redundancy in active-active cluster system
US11194679B2 (en) 2015-10-30 2021-12-07 Huawei Technologies Co., Ltd. Method and apparatus for redundancy in active-active cluster system
CN105426275A (zh) * 2015-10-30 2016-03-23 成都华为技术有限公司 双活集群系统中容灾的方法及装置
CN109491587B (zh) * 2017-09-11 2021-03-23 华为技术有限公司 数据访问的方法及装置
US11119953B2 (en) 2017-09-11 2021-09-14 Huawei Technologies Co., Ltd. Data access method and apparatus for accessing shared cache in a memory access manner
CN109491587A (zh) * 2017-09-11 2019-03-19 华为技术有限公司 数据访问的方法及装置
CN107589912A (zh) * 2017-09-12 2018-01-16 郑州云海信息技术有限公司 一种硬盘的访问方法及装置
CN108958984A (zh) * 2018-08-13 2018-12-07 深圳市证通电子股份有限公司 基于ceph的双活同步在线热备方法
CN109857341A (zh) * 2019-01-15 2019-06-07 新华三技术有限公司成都分公司 写锁预取长度的确定方法及装置
CN109857341B (zh) * 2019-01-15 2022-04-12 新华三技术有限公司成都分公司 写锁预取长度的确定方法及装置
CN110635950A (zh) * 2019-09-30 2019-12-31 深圳供电局有限公司 一种双数据中心容灾系统
CN111740927A (zh) * 2020-07-20 2020-10-02 湖南航天捷诚电子装备有限责任公司 一种冗余交换机

Similar Documents

Publication Publication Date Title
CN103106048A (zh) 一种多控多活的存储系统
Pawlowski Hybrid memory cube (HMC)
US9250687B1 (en) High performance flexible storage system architecture
KR101925266B1 (ko) 하이브리드 메모리 큐브 링크들을 이용하는 상호 접속 시스템들 및 방법들
CN102063274B (zh) 存储阵列和存储系统及数据访问方法
CN104346317B (zh) 共享资源访问方法和装置
EP1760723A2 (en) Shared memory device
CN104135514B (zh) 融合式虚拟化存储系统
CN101739220A (zh) 一种多控制器存储阵列的设计方法
CN102567227B (zh) 共享缓存设备的双控制器存储系统和方法
EP2568392A1 (en) Computer subsystem and computer system
KR102693213B1 (ko) 메모리 시스템
WO2012130134A1 (zh) 计算机系统
CN105472047A (zh) 存储系统
CN103049220A (zh) 存储控制方法、存储控制装置和固态存储系统
CN116185641B (zh) 融合架构系统、非易失性存储系统及存储资源获取方法
CN104408014A (zh) 一种计算系统之间处理单元互连的系统及方法
CN103327074A (zh) 一种全局共享缓存的紧耦合多控多活存储系统的设计方法
CN108205573B (zh) 一种数据分布式存储方法及系统
CN104360982A (zh) 一种基于可重构芯片技术的主机系统目录结构实现方法和系统
CN104125293A (zh) 一种云服务器及其使用方法
CN113946290B (zh) 基于三维异质集成的存储器件以及存储系统
JP6042914B2 (ja) モジュラサーバーシステム、i/oモジュール及びスイッチング方法
CN109684257B (zh) 一种远程内存扩展管理系统
CN106844052A (zh) 一种基于Windows Server构建融合集群的方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20130515