CN110618785A - 双控存储系统 - Google Patents

双控存储系统 Download PDF

Info

Publication number
CN110618785A
CN110618785A CN201811581310.1A CN201811581310A CN110618785A CN 110618785 A CN110618785 A CN 110618785A CN 201811581310 A CN201811581310 A CN 201811581310A CN 110618785 A CN110618785 A CN 110618785A
Authority
CN
China
Prior art keywords
controller
storage system
cache
main controller
instruction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811581310.1A
Other languages
English (en)
Inventor
董文祥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Innovation Software Technology Co Ltd
Original Assignee
Shenzhen Innovation Software Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Innovation Software Technology Co Ltd filed Critical Shenzhen Innovation Software Technology Co Ltd
Priority to CN201811581310.1A priority Critical patent/CN110618785A/zh
Publication of CN110618785A publication Critical patent/CN110618785A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0614Improving the reliability of storage systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0655Vertical data movement, i.e. input-output transfer; data movement between one or more hosts and one or more storage devices
    • G06F3/0658Controller construction arrangements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0683Plurality of storage devices
    • G06F3/0689Disk arrays, e.g. RAID, JBOD

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Memory System Of A Hierarchy Structure (AREA)
  • Hardware Redundancy (AREA)

Abstract

本发明提供一种双控存储系统,包括主控制器和备用控制器,以及两个控制器共用的后端磁盘阵列;主控制器的第一缓存和备用控制器的第二缓存互为备份;双控存储系统还包括每个控制器系统均可访问的N个虚拟机,N≥1,用户通过虚拟机对后端磁盘阵列进行读写操作;当主控制器无故障时,虚拟机在主控制器上运行,当主控制器故障时,将虚拟机切换至备用控制器。本发明的双控存储系统,具有HA功能,且在不增加硬件成本的基础上,可以适应不同的客户端软件平台。

Description

双控存储系统
技术领域
本发明涉及计算机领域,特别涉及一种双控存储系统。
背景技术
图1为传统的存储系统中,其中客户端与后端磁盘阵列通过控制器进行数据传输,控制器通过访问存储在后端磁盘阵列中的实际数据,对客户端进行业务回馈。
该存储系统采用单控模式(只有一个控制器),虽在一定程度上实现客户端的数据操作请求以对存储端进行业务操作,但是,当单控模式的控制器出现硬件故障或者软件宕机问题时,该控制器对客户端提供的业务便无法正常运作,从而导致客户端与后端磁盘阵列之间的数据传输出现故障,存储系统的稳定性较低。
另一方面,企业级存储系统一般运行Linux系统,在图1中对应控制器上的系统为Linux系统,而客户端一般运行在windows平台、Linux平台或MacOS上。当客户端与控制器的系统不同时,一般需为客户端设置一套独立的客户端服务器,然后使客户端服务器与控制器进行通信和数据传输。当客户端种类较多,但后端磁盘阵列规模相对较小的时候,为每一种平台的客户端均配置服务器相对整个存储系统而言成本负担过大。
因此,对于客户端平台种类较多的存储系统,如何消除硬件成本,并提高存储系统的可靠性是目前亟待解决的一个问题。
发明内容
有鉴于此,本发明提供一种双控存储系统,以解决多客户端平台和单控模式存储系统的问题。
本发明提供一种双控存储系统,包括主控制器和备用控制器,以及两个控制器共用的后端磁盘阵列;主控制器的第一缓存和备用控制器的第二缓存互为备份;
双控存储系统还包括每个控制器系统均可访问的N个虚拟机,N≥1,用户通过虚拟机对后端磁盘阵列进行读写操作;当主控制器无故障时,虚拟机在主控制器上运行,当主控制器故障时,将虚拟机切换至备用控制器。
本发明通过在控制器上设置N个虚拟机,不同的虚拟机可安装不同的操作系统,进而可将不同平台的客户端设置到对应的虚拟机上,就可以解决多平台客户端的问题,相比现有技术,无需增加任何硬件。其次,本发明的双控存储系统,两个控制器的缓存实时同步,可确保虚拟机在任一控制器上均可无差别运行,即使主控制器发生故障,虚拟机也可以在继续在备用控制器上运行,提高存储系统的可靠性。
附图说明
图1为现有技术的存储系统;
图2为本发明双控存储系统的结构图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本发明进行详细描述。
本发明的双控存储系统如图2所示,包括主控制器和备用控制器,以及两个控制器共用的后端磁盘阵列;主控制器的第一缓存和备用控制器的第二缓存互为备份(实时同步);
双控存储系统还包括每个控制器系统均可访问的N个虚拟机,N≥1,用户通过虚拟机对后端磁盘阵列进行读写操作;当主控制器无故障时,虚拟机在主控制器上运行,当主控制器故障时,将虚拟机切换至备用控制器。
主控制器对应第一主板,备用控制器对应第二主板,主控制器上安装第一宿主操作系统,备用控制器上安装第二宿主操作系统,一般而言第一宿主操作系统和第二宿主操作系统为同一系统。后端磁盘阵列为两个控制器共用,在第一宿主操作系统和第二宿主操作系统中,后端磁盘阵列显示为相同的逻辑硬盘(或物理块设备、物理块分区)。
为了在双控存储系统中每个控制器系统均可访问的N个虚拟机,虚拟机可通过以下两种方式设置:
(1)将虚拟机设置在后端磁盘阵列的SSD硬盘中,由于每个控制器均可见后端磁盘阵列,因此其中的虚拟机对于每个控制器均可见。
(2)主控制器还包括非公用的第一硬盘,备用服务器还包括非共用的第二硬盘,将虚拟机位于设置第一硬盘和第二硬盘,且第一硬盘与第二硬盘互为备份(实时同步)。
第一种虚拟机的设置方法简单,无需同步,但会占用后端磁盘阵列的存储空间,第二种虚拟机的设置方法相当于在两个控制器上均设置了虚拟机,且使得两个控制器上的虚拟机实时同步,其方案较第一种方案复杂,但无需占用后端磁盘阵列的存储空间。
在宿主操作系统中安装虚拟机,一种实现方式为,首先在宿主操作系统中安装KVM(Kernel-based Virtual Machine)平台,然后在KVM平台上再设置不同的虚拟机,最后虚拟机下安装其他操作系统的客户端软件。需要说明的是,以上仅用于示例说明,其他在宿主操作系统下安装虚拟机的方法也适用于本发明。
本发明通过“主控制器的第一缓存和备用控制器的第二缓存互为备份(实时同步)”实现本发明双控存储系统的高可靠HA(High Available),基于两个控制器的缓存互为镜像,且两个控制器内可运行的虚拟机相同,备用控制器的随时继续执行主控制的数据操作。
主控制器和备用控制器之间通过数据线连接,例如可采用PCIE总线,PCIE总线的数据传输率更高,且不占用网络带宽。
此外,两个控制器缓存同步还可以基于PCIE(或PCIE-NTB芯片)的DMA机制来实现。非透明桥NTB(non-transparent bridge)为PCIE总线在控制器上的接口。利用PCIE来实现同步,其优点在于,不占用控制器的CPU,也无需另行开发同步进程。同时借助两个控制器的电池,可以实现缓存数据掉电保护。
两个控制器之间的切换策略包括:当主控制器无故障时,虚拟机在主控制器上运行,当主控制器故障时,将虚拟机切换至备用控制器;
以及,当主控制器消除故障后,待第二缓存的数据同步至第一缓存后,将虚拟机切换至主控制器。
以下给出本发明双控存储系统的两个应用示例。
应用示例一
当用户通过主控制器访问虚拟机并生成写IO指令后,本发明的双控存储系统还包括:
步骤11:主控制器将写IO指令下发到第一缓存;
步骤12:第一缓存将写IO指令同步至所述第二缓存;
步骤13:当主控制器无故障时,由主控制器执行写IO指令,将写IO指令携带的数据写入后端磁盘阵列,当主控制器故障时,由备用控制器执行写IO指令,将写IO指令携带的数据写入后端磁盘阵列。
控制器可以选择在步骤12执行完毕后向客户端反馈“写入成功”的消息,也可以在步骤13执行完毕之后再向客户端反馈“写入成功”的消息。
当控制器在步骤12执行完毕后向客户端反馈“写入成功”的消息,在步骤13中,控制器可以选择延时写入数据,或者根据当前后端磁盘阵列的IO访问量设置IO延时,以避免IO拥塞。
应用示例二
当用户通过主控制器访问虚拟机并生成读IO指令后,本发明的双控存储系统还包括:
步骤21:主控制器将读IO指令下发到第一缓存;
步骤22:第一缓存将读IO指令同步到第二缓存;
步骤23:当主控制器无故障时,由主控制器执行读IO指令,当主控制器故障时,由备用控制器执行读IO指令。
具体,执行读IO指令的控制器,先判断自身的缓存中是否存在该读IO指令对应的数据,如果是,则直接将缓存中的数据返回给客户端,如果否,则控制器从后端磁盘阵列将数据取回,先存放在自身的缓存中,再将缓存中的数据返回给客户端以及同步到另一个控制器的缓存中。
为了增加缓存的读写效率,将第一缓存或第二缓存中的写IO指令按预设策略进行合并,或对读IO指令进行预读。
预设的策略包括:后端磁盘阵列存储的同一对象的IO指令执行合并,或者,将IO指令长度低于预设值的执行合并。
本发明通过在控制器上设置N个虚拟机,不同的虚拟机可安装不同的操作系统,进而可将不同平台的客户端设置到对应的虚拟机上,就可以解决多平台客户端的问题,相比现有技术,无需增加任何硬件。其次,本发明的双控存储系统,两个控制器的缓存实时同步,可确保虚拟机在任一控制器上均可无差别运行,即使主控制器发生故障,虚拟机也可以在继续在备用控制器上运行,提高存储系统的可靠性。
以上所述仅为本发明的较佳实施例而已,并不用以限定本发明的包含范围,凡在本发明技术方案的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (9)

1.一种双控存储系统,其特征在于,包括主控制器和备用控制器,以及两个控制器共用的后端磁盘阵列;所述主控制器的第一缓存和所述备用控制器的第二缓存互为备份;
所述双控存储系统还包括每个控制器系统均可访问的N个虚拟机,N≥1,用户通过所述虚拟机对所述后端磁盘阵列进行读写操作;当主控制器无故障时,所述虚拟机在所述主控制器上运行,当主控制器故障时,将所述虚拟机切换至所述备用控制器。
2.根据权利要求1所述的双控存储系统,其特征在于,当所述主控制器消除故障后,所述双控存储系统还包括:待所述第二缓存的数据同步至所述第一缓存后,将所述虚拟机切换至所述主控制器。
3.根据权利要求1所述的双控存储系统,其特征在于,所述主控制器和所述备用控制器通过PCIE总线连接。
4.根据权利要求3所述的双控存储系统,其特征在于,所述备份的机制为PCIE的DMA。
5.根据权利要求1所述的双控存储系统,其特征在于,所述虚拟机位于所述后端磁盘阵列的SSD硬盘。
6.根据权利要求1所述的双控存储系统,其特征在于,所述主控制器还包括非公用的第一硬盘,所述备用服务器还包括非共用的第二硬盘,所述虚拟机位于所述第一硬盘和第二硬盘,所述第一硬盘与所述第二硬盘互为备份。
7.根据权利要求1-6任一所述的双控存储系统,其特征在于,当用户通过所述主控制器访问所述虚拟机并生成写IO指令后,所述双控存储系统还包括:
所述主控制器将所述写IO指令下发到第一缓存;所述第一缓存将所述写IO指令同步至所述第二缓存;
当主控制器无故障时,由所述主控制器执行所述写IO指令,将所述写IO指令携带的数据写入所述后端磁盘阵列,当主控制器故障时,由所述备用控制器执行所述写IO指令,将所述写IO指令携带的数据写入所述后端磁盘阵列。
8.根据权利要求1-6任一所述的双控存储系统,其特征在于,当用户通过所述主控制器访问所述虚拟机并生成读IO指令后,所述双控存储系统还包括:
所述主控制器将所述读IO指令下发到第一缓存;所述第一缓存将所述读IO指令同步到所述第二缓存;
当主控制器无故障时,由主控制器执行所述读IO指令,当主控制器故障时,由备用控制器执行所述读IO指令。
9.根据权利要求1所述的双控存储系统,其特征在于,将所述第一缓存或第二缓存中的写IO指令按预设策略进行合并,或对读IO指令执行预读。
CN201811581310.1A 2018-12-24 2018-12-24 双控存储系统 Pending CN110618785A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811581310.1A CN110618785A (zh) 2018-12-24 2018-12-24 双控存储系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811581310.1A CN110618785A (zh) 2018-12-24 2018-12-24 双控存储系统

Publications (1)

Publication Number Publication Date
CN110618785A true CN110618785A (zh) 2019-12-27

Family

ID=68920333

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811581310.1A Pending CN110618785A (zh) 2018-12-24 2018-12-24 双控存储系统

Country Status (1)

Country Link
CN (1) CN110618785A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112000286A (zh) * 2020-08-13 2020-11-27 北京浪潮数据技术有限公司 一种四控全闪存储系统及其故障处理方法、装置
CN112835519A (zh) * 2021-01-29 2021-05-25 杭州海康威视数字技术股份有限公司 一种数据读取方法、装置、电子设备及存储介质
CN112911185A (zh) * 2021-01-18 2021-06-04 浙江大华技术股份有限公司 一种双控设备故障处理方法及装置
CN113805807A (zh) * 2021-09-10 2021-12-17 济南浪潮数据技术有限公司 双控存储阵列数据库同步的方法、装置、设备及可读介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102426512A (zh) * 2011-11-09 2012-04-25 浪潮电子信息产业股份有限公司 一种基于虚拟化的存储双控磁盘阵列的实现方法
CN104636086A (zh) * 2015-02-06 2015-05-20 浙江宇视科技有限公司 一种ha存储设备、管理ha状态的方法
CN104881368A (zh) * 2015-05-07 2015-09-02 北京飞杰信息技术有限公司 应用于双控存储系统的缓存同步方法及系统
CN105389123A (zh) * 2015-10-16 2016-03-09 浪潮(北京)电子信息产业有限公司 一种基于双控制器的存储管理方法及系统
CN107220104A (zh) * 2017-05-27 2017-09-29 郑州云海信息技术有限公司 一种虚拟机备灾方法和装置
CN107632788A (zh) * 2017-09-26 2018-01-26 郑州云海信息技术有限公司 一种多控存储系统io调度的方法及多控存储系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102426512A (zh) * 2011-11-09 2012-04-25 浪潮电子信息产业股份有限公司 一种基于虚拟化的存储双控磁盘阵列的实现方法
CN104636086A (zh) * 2015-02-06 2015-05-20 浙江宇视科技有限公司 一种ha存储设备、管理ha状态的方法
CN104881368A (zh) * 2015-05-07 2015-09-02 北京飞杰信息技术有限公司 应用于双控存储系统的缓存同步方法及系统
CN105389123A (zh) * 2015-10-16 2016-03-09 浪潮(北京)电子信息产业有限公司 一种基于双控制器的存储管理方法及系统
CN107220104A (zh) * 2017-05-27 2017-09-29 郑州云海信息技术有限公司 一种虚拟机备灾方法和装置
CN107632788A (zh) * 2017-09-26 2018-01-26 郑州云海信息技术有限公司 一种多控存储系统io调度的方法及多控存储系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
刘德文等: "优化的信息中心虚拟化实施方案", 《计算机系统应用》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112000286A (zh) * 2020-08-13 2020-11-27 北京浪潮数据技术有限公司 一种四控全闪存储系统及其故障处理方法、装置
CN112000286B (zh) * 2020-08-13 2023-02-28 北京浪潮数据技术有限公司 一种四控全闪存储系统及其故障处理方法、装置
CN112911185A (zh) * 2021-01-18 2021-06-04 浙江大华技术股份有限公司 一种双控设备故障处理方法及装置
CN112835519A (zh) * 2021-01-29 2021-05-25 杭州海康威视数字技术股份有限公司 一种数据读取方法、装置、电子设备及存储介质
CN112835519B (zh) * 2021-01-29 2023-03-14 杭州海康威视数字技术股份有限公司 一种数据读取方法、装置、电子设备及存储介质
CN113805807A (zh) * 2021-09-10 2021-12-17 济南浪潮数据技术有限公司 双控存储阵列数据库同步的方法、装置、设备及可读介质

Similar Documents

Publication Publication Date Title
CN110618785A (zh) 双控存储系统
US7730257B2 (en) Method and computer program product to increase I/O write performance in a redundant array
US8639976B2 (en) Power failure management in components of storage area network
US20160203080A1 (en) Multi-node cache coherency with input output virtualization
US8321622B2 (en) Storage system with multiple controllers and multiple processing paths
US20110231602A1 (en) Non-disruptive disk ownership change in distributed storage systems
US9213500B2 (en) Data processing method and device
CN102187311B (zh) 用于使用存储区域网络恢复计算机系统的方法和系统
US8650471B2 (en) System and method for look-aside parity based raid
US11262918B1 (en) Data storage system with uneven drive wear reduction
US10318393B2 (en) Hyperconverged infrastructure supporting storage and compute capabilities
US9378103B2 (en) Coordination techniques for redundant array of independent disks storage controllers
CN109313593B (zh) 存储系统
US10234929B2 (en) Storage system and control apparatus
US11507307B2 (en) Storage system including a memory controller that enables each storage controller of a plurality of storage controllers to exclusively read and write control information of the memory
WO2021012169A1 (zh) 一种提高存储系统可靠性的方法和相关装置
US10210060B2 (en) Online NVM format upgrade in a data storage system operating with active and standby memory controllers
US10970210B2 (en) Managing data storage devices for spontaneous de-staging of cache
US11385815B2 (en) Storage system
JP2006114064A (ja) 記憶サブシステム
CN114816270A (zh) 一种存储系统全局缓存方法、装置以及介质
US20160132271A1 (en) Computer system
JP5511546B2 (ja) フォールトトレラントの計算機システム、複数の物理サーバとストレージ装置とに接続されるスイッチ装置、及び、サーバ同期制御方法
US11232036B2 (en) Managing write access to data storage devices for spontaneous de-staging of cache
US11467930B2 (en) Distributed failover of a back-end storage director

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20191227

RJ01 Rejection of invention patent application after publication