CN115185747A - 一种四控存储数据访问方法 - Google Patents

一种四控存储数据访问方法 Download PDF

Info

Publication number
CN115185747A
CN115185747A CN202210700682.1A CN202210700682A CN115185747A CN 115185747 A CN115185747 A CN 115185747A CN 202210700682 A CN202210700682 A CN 202210700682A CN 115185747 A CN115185747 A CN 115185747A
Authority
CN
China
Prior art keywords
storage
controller
main
backup
data access
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210700682.1A
Other languages
English (en)
Inventor
马连志
殷双飞
邓玲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Institute of Computer Technology and Applications
Original Assignee
Beijing Institute of Computer Technology and Applications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Institute of Computer Technology and Applications filed Critical Beijing Institute of Computer Technology and Applications
Priority to CN202210700682.1A priority Critical patent/CN115185747A/zh
Publication of CN115185747A publication Critical patent/CN115185747A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2089Redundant storage control functionality
    • G06F11/2092Techniques of failing over between control units
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2094Redundant storage or storage space

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Hardware Redundancy (AREA)

Abstract

本发明涉及一种四控存储数据访问方法,属于计算机信息存储技术领域。该方法在双控存储内部通过数据访问重定向保证主备控制器以负载均衡方式提供数据访问服务;使主存储和备存储通过内网远程复制保证两个双控存储的数据一致性,进而保证四个控制器同时对外以负载均衡方式提供数据访问服务;通过为双控存储以及其内部的控制器配置优先级,保证四控存储能够在任意三个控制器在出现故障的情况下正常提供数据访问服务。该方法不仅能够提高四控存储的整体性能,还可以提高存储系统的可靠性。

Description

一种四控存储数据访问方法
技术领域
本发明属于计算机信息存储技术领域,具体涉及一种四控存储数据访问方法。
背景技术
信息技术和网络技术迅猛发展,数据存储量骤增。随着数据使用场景的不断延伸变化,系统对存储容量、存取速度、可靠性、稳定性有着越来越高的要求。传统双控存储在可靠性和稳定性方面较好,但在应对存储容量的动态扩展以及存储介质并发访问上,受制于单套存储的限制,其性能有限。在现有双控存储硬件状态的基础上,构建一种四控存储,可提高存储系统的横向扩展性。每套双控存储都有自身的物理存储介质,如何保证由两套双控存储构成的四控存储既能够对外并发提供数据访问服务,又可以保证整套存储系统的可靠性,需要设计一种四控存储数据访问方法。
发明内容
(一)要解决的技术问题
本发明要解决的技术问题是:如何根据对四控存储的实际使用需求,对后端存储介质的数据存取方式进行调整,达到四控存储系统性能和可靠性的动态平衡。
(二)技术方案
为了解决上述技术问题,本发明提供了一种四控存储数据访问方法,实现该方法所需的硬件平台由一套四控存储1构成,所述四控存储1包括两套子存储,即主存储2和备存储3:
主存储2和备存储3都为双控存储,都由主控制器21和备控制器22共享访问共享存储介质5,四控存储1中四个控制器可同时对外提供数据访问服务,其中的两套双控存储的后端存储介质可通过同步远程复制保证四控均为正常工作状态,主控制器21和备控制器22可通过心跳通道4检测对端控制器的状态,根据心跳结果进行存储可靠性的处理,当主控制器21出现故障时,备控制器22可进行故障切换;
在四控存储1的4个控制器上,均布置如下的三个模块:
集群数据管理模块,用于四控存储采用集群数据库保存数据访问优先级表和远程复制状态表,数据访问优先级表在四控存储初始化时进行设置,设置完成后,数据访问服务的数据访问路径依据存储优先级、控制器优先级而定;远程复制状态表用于维护子存储中的备控制器检测远程复制状态,当远程复制状态出现异常时,备控制器需要进行故障切换,修复远程复制状态,保证远程复制正常运行;存储优先级即为子存储的优先级,在主存储的两个控制器都出现故障时,备存储若有存活的控制器,备存储的角色提升为主存储;同一存储优先级的控制器,故障切换操作由控制器的优先级决定,低优先级控制器可在高优先级控制器故障时进行故障切换操作,接替高优先级控制器继续对外提供数据访问服务;
负载均衡模块,用于四控存储内子存储的控制器采用负载均衡方式对外提供数据访问服务,客户端可同时读写主备两个控制器的存储介质,客户端访问主控制器的存储介质时,主控制器将直接对本地存储介质进行读写;客户端访问备控制器的存储介质时,备控制器会将数据访问请求重定向到同一子存储的主控制器的存储介质;主备两套存储的主控制器通过同步远程复制,保证两套双控存储的数据一致性;最终,两套双控存储的四个控制器可同时对外提供数据访问服务;
故障处理模块,用于通过为四控存储中的子存储以及其内部的控制器配置优先级,保证四控存储能够在任意三个控制器在出现故障的情况下,正常提供数据访问服务;四控存储将主存储和备存储分为两个等级,同等级的子存储内,备控制器在主控制器出现故障时进行故障切换;当主存储和备存储都仅剩主控制器时,当主存储的主控制器出现故障时,备存储的主控制器进行故障切换;
该方法中,在正常使用情况下,四控存储1配置主存储2和备存储3的角色,在配置数据访问服务时,配置一个远程复制对,将四控存储1中的一个子存储配置为主存储2,服务中所配置的存储介质作为远程复制源端6,另一个子存储配置为备存储3,服务中所配置的存储介质作为远程复制目的端7,整个远程复制的实际数据传输由主存储2和备存储3下的主控制器进行,备控制器不参与远程复制;
此时,集群数据管理模块生成四控存储1四个控制器的数据访问优先级表,该数据访问优先级表保存在四控存储1的集群数据库中,每个控制器都根据该数据访问优先级表进行相关业务的处理;
除了数据访问优先级表外,集群数据管理模块还维护远程复制状态表;
每个控制器可同时通过负载均衡模块对外提供数据访问服务;客户端通过多路径软件发现控制器的所有路径,路径选择方式可配置成负载均衡模式,此时,客户端与四控存储有四条通信方向:
1)客户端->主存储的主控制器;当数据在该通信方向时,主控制器收到数据访问请求,便直接将请求下发到本地存储介质进行处理,并将结果返回给客户端;
2)客户端->主存储的备控制器;当数据在该通信方向时,备控制器将收到的数据访问请求通过内网通信链路重定向到同一主存储的主控制器,主控制器将请求下发到本地存储介质进行处理,并将结果返回给备控制器;最终,备控制器将结果返回给客户端;
3)客户端->备存储的主控制器;当数据在该通信方向时,主控制器收到数据访问请求,便直接将请求下发到本地存储介质进行处理,并将结果返回给客户端;
4)客户端->备存储的备控制器;当数据在该通信方向时,备控制器将收到的数据访问请求通过内网通信链路重定向到同一备存储的主控制器,主控制器将请求下发到本地存储介质进行处理,并将结果返回给备控制器;最终,备控制器将结果返回给客户端;
最终,四条通信方向都有数据响应返回给客户端。
优选地,四控存储中的子存储在正常运行过程中,会出现子存储内部控制器心跳通道不可用的情况,造成该情况发生的原因有两种:心跳通道连接出现故障;控制器出现宕机;所述故障处理模块可对出现的这两种故障进行处理,两种情况的任意一种发生时,子存储中主备控制器都会检测到心跳通道不可用,此时根据当前四控存储中主存储和备存储的控制器状态,进行相应的处理。
优选地,当发生第一种故障情况时,所述故障处理模块进行如下处理:
一、主控制器21检测到心跳不通时,直接判定备控制器22出现故障;
二、备控制器22检测到心跳不通时,首先获取所在子存储的远程复制状态;
1)如果远程复制出现断开状态时,则判定远程复制状态异常,确认主控制器出现故障;
2)如果远程复制状态正常,确认主控制器正常运行,此时心跳通路故障则判定双控出现脑裂状态;备控制器重启,如果重启一定次数后依旧处于脑裂状态,备控制器直接关机;
3)如果远程复制并未运行,则四控存储内的主备存储并未同时运行,需使用内网通信链路发送心跳检测进行辅助验证,如果心跳状态正常,则判定主控制器和备控制器的心跳通信链路出现故障,当前子存储出现脑裂状态,备控制器执行重启操作,如果重启一定次数后依旧处于脑裂状态,备控制器直接关机;如果心跳不通,则判定主控制器出现故障。
优选地,当发生第二种故障情况时,所述故障处理模块进行如下的控制器故障处理:
当出现故障的控制器所在的子存储为备存储时:
1)若故障控制器为备控制器,则不行故障切换;
2)若故障控制器为主控制器,则根据当前备存储中是否还有备控制器正常运行,若存在则备控制器将控制器角色改为主控制器,恢复远程复制状态,若不存在则不进行故障切换,当前如果有远程复制则关闭;
当出现故障的控制器所在的子存储为主存储时:
1)若故障控制器为备控制器,则不进行故障切换;
2)若故障控制器为主控制器,如果同一子存储的备控制器并未运行且备存储也未正常运行时,四控存储中的四个控制器皆宕机,四控存储出现故障;如果同一子存储的备控制器并未运行但备存储正常运行时,备存储将进行故障切换,备存储角色变更为主存储,并关闭远程复制;如果同一子存储的备控制器正常运行且备存储也正常运行时,备控制器修改角色为主控制器并修复远程复制状态,如果同一子存储的备控制器正常运行但备存储并未正常运行时,备控制器只修改角色为主控制器。
优选地,所述主存储(2)提供源端数据,可将本地存储介质的数据同步复制到备存储(3)的目的端。
优选地,所述主存储2和备存储(3)都由主控制器(21)和备控制器(22),通过SAS背板共享访问共享存储介质(5)。
优选地,所述双控存储中两个控制器通过心跳通道互连,两套双控存储间使用内网通道互连。
优选地,所述数据访问优先级表的结构如下:
存储介质 控制器 存储优先级 控制器优先级
lun 主存储的主控制器 1 1
lun 主存储的备控制器 1 2
lun 备存储的主控制器 2 1
lun 备存储的备控制器 2 2
优选地,所述远程复制状态表的结构如下:
存储介质 远程复制状态
lun1 未运行
lun2 正常
lun3 断线重连
lun4 断开
本发明还提供了一种所述方法在计算机信息存储技术领域中的应用。
(三)有益效果
本发明的方法在双控存储内部通过数据访问重定向保证主备控制器以负载均衡方式提供数据访问服务;使主存储和备存储通过内网远程复制保证两个双控存储的数据一致性,进而保证四个控制器同时对外以负载均衡方式提供数据访问服务;通过为双控存储以及其内部的控制器配置优先级,保证四控存储能够在任意三个控制器在出现故障的情况下正常提供数据访问服务。该方法不仅能够提高四控存储的整体性能,还可以提高存储系统的可靠性。
附图说明
图1为本发明的方法所需系统原理架构图;
图2为本发明四控存储远程复制示意图;
图3为本发明客户端数据访问请求处理流程图;
图4为本发明四控存储控制器心跳故障处理流程图;
图5为本发明四控存储控制器故障切换流程图。
其中:
1 四控存储 2 主存储
3 备存储 4 心跳通道
5 共享存储介质 6 远程复制源端
7 远程复制目的端
21 主控制器 22 备控制器。
具体实施方式
为使本发明的目的、内容和优点更加清楚,下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。
本发明提供的一种四控存储数据访问方法,该方法所需的硬件平台由一套四控存储1构成,四控存储1包括两套子存储,即主存储2和备存储3,如图1所示:
主存储2和备存储3都为传统双控存储,都由主控制器21和备控制器22,通过SAS背板共享访问共享存储介质5。双控存储中两个控制器通过心跳通道互连,两套双控存储间使用内网通道互连。四控存储1中四个控制器可同时对外提供数据访问服务,其中的两套双控存储的后端存储介质通过同步远程复制保证四控四活。主控制器21和备控制器22通过心跳通道4检测对端控制器的状态,根据心跳结果进行存储可靠性的处理。当主控制器21出现故障时,备控制器22进行故障切换。
主存储2和备存储3都为系统软件定义上的主备关系,其主备关系在于执行同步远程复制过程中的主备状态。主存储2提供源端数据,将本地存储介质的数据同步复制到备存储3的目的端。
该方法所需的软件处理模块包括:
集群数据管理模块,用于四控存储采用集群数据库保存数据访问优先级表和远程复制状态表。数据访问优先级表在四控存储初始化时进行设置,设置完成后,数据访问服务的数据访问路径依据存储优先级、控制器优先级而定;远程复制状态表用于维护子存储中的备控制器检测远程复制状态,当远程复制状态出现异常时,备控制器需要进行故障切换,修复远程复制状态,保证远程复制正常运行。
负载均衡模块,用于四控存储内子存储的控制器采用负载均衡方式对外提供数据访问服务,客户端可同时读写主备两个控制器的存储介质。客户端访问主控制器的存储介质时,主控制器将直接对本地存储介质进行读写;客户端访问备控制器的存储介质时,备控制器会将数据访问请求重定向到同一子存储的主控制器的存储介质。主备两套存储的主控制器通过同步远程复制,保证两套双控存储的数据一致性。最终,两套双控存储的四个控制器可同时对外提供数据访问服务。
故障处理模块,用于通过为四控存储中的子存储以及其内部的控制器配置优先级,保证四控存储能够在任意三个控制器在出现故障的情况下,正常提供数据访问服务。四控存储将主存储和备存储分为两个等级,同等级的子存储内,备控制器在主控制器出现故障时进行故障切换;当主存储和备存储都仅剩主控制器时,当主存储的主控制器出现故障时,备存储的主控制器进行故障切换。
以上三个软件处理模块在四个控制器上各安装一套。
在正常使用情况下,四控存储1配置主存储2和备存储3的角色。在配置数据访问服务时,需要配置一个远程复制对,将四控存储1中的一个子存储配置为主存储2,服务中所配置的存储介质作为远程复制源端6,另一个子存储配置为备存储3,服务中所配置的存储介质作为远程复制目的端7,参考图2。整个远程复制的实际数据传输由主存储2和备存储3下的主控制器进行,备控制器不参与远程复制。
此时,集群数据管理模块生成四控存储1四个控制器的数据访问优先级表,结构如下:
存储介质 控制器 存储优先级 控制器优先级
lun 主存储的主控制器 1 1
lun 主存储的备控制器 1 2
lun 备存储的主控制器 2 1
lun 备存储的备控制器 2 2
该数据访问优先级表保存在四控存储1的集群数据库中,每个控制器都需要根据该数据访问优先级表进行相关业务的处理。
除了数据访问优先级表外,集群数据管理模块还需要维护远程复制状态表,结构如下:
存储介质 远程复制状态
lun1 未运行
lun2 正常
lun3 断线重连
lun4 断开
该远程复制状态表主要用于备控制器检测远程复制状态,当远程复制状态出现异常时,备控制器需要进行故障切换,修复远程复制状态,保证远程复制正常运行。
存储优先级即为子存储的优先级,在主存储的两个控制器都出现故障时,备存储若有存活的控制器,备存储的角色提升为主存储;同一存储优先级的控制器,故障切换操作由控制器的优先级决定,低优先级控制器可在高优先级控制器故障时进行故障切换操作,接替高优先级控制器继续对外提供数据访问服务。
负载均衡模块负责对外提供数据访问服务管理,如IP SAN、FC SAN,每个控制器可同时对外提供服务。客户端连接四控存储数据访问服务,通过多路径软件发现控制器的所有路径,路径选择方式可配置成负载均衡模式。此时,客户端与四控存储有四条通信方向,如图3所示:
1.客户端->主存储的主控制器。当数据在该通信方向时,主控制器收到数据访问请求,便直接将请求下发到本地存储介质进行处理,并将结果返回给客户端。
2.客户端->主存储的备控制器。当数据在该通信方向时,备控制器将收到的数据访问请求通过内网通信链路重定向到同一主存储的主控制器,主控制器将请求下发到本地存储介质进行处理,并将结果返回给备控制器。最终,备控制器将结果返回给客户端。
3.客户端->备存储的主控制器。当数据在该通信方向时,主控制器收到数据访问请求,便直接将请求下发到本地存储介质进行处理,并将结果返回给客户端。
4.客户端->备存储的备控制器。当数据在该通信方向时,备控制器将收到的数据访问请求通过内网通信链路重定向到同一备存储的主控制器,主控制器将请求下发到本地存储介质进行处理,并将结果返回给备控制器。最终,备控制器将结果返回给客户端。
最终,四条通信方向都有数据响应返回给客户端。
四控存储中的子存储在正常运行过程中,会出现子存储内部控制器心跳通道不可用的情况。造成该情况发生的原因有两种:
1.心跳通道连接出现故障;
2.控制器出现宕机。
故障处理模块对上述出现的故障进行处理。
两种情况的任意一种发生时,子存储中主备控制器都会检测到心跳通道不可用。此时根据当前四控存储中主存储和备存储的控制器状态,进行相应的处理。
当发生第一种情况时,如图4所示,进行如下处理:
1.主控制器21检测到心跳不通时,直接判定备控制器22出现故障;
2.备控制器22检测到心跳不通时,首先获取所在子存储的远程复制状态。
1)如果远程复制出现断开状态时,则判定远程复制状态异常,确认主控制器出现故障;
2)如果远程复制状态正常,确认主控制器正常运行,此时心跳通路故障则判定双控出现脑裂状态。备控制器重启,如果重启5次后依旧处于脑裂状态,备控制器直接关机;
3)如果远程复制并未运行,则四控存储内的主备存储并未同时运行,需使用内网通信链路发送心跳检测进行辅助验证,如果心跳状态正常,则说明主控制器和备控制器的心跳通信链路出现故障,当前子存储出现脑裂状态,备控制器执行重启操作,如果重启5次后依旧处于脑裂状态,备控制器直接关机;如果心跳不通,则判定主控制器出现故障。
当发生第二种情况时,如图5所示,进行控制器故障处理:
1.当出现故障的控制器所在的子存储为备存储时:
3)若故障控制器为备控制器,则不行故障切换;
4)若故障控制器为主控制器,则根据当前备存储中是否还有备控制器正常运行,若存在则备控制器将控制器角色改为主控制器,恢复远程复制状态,若不存在则不进行故障切换,当前如果有远程复制则关闭。
2.当出现故障的控制器所在的子存储为主存储时:
2)若故障控制器为备控制器,则不进行故障切换;
若故障控制器为主控制器,如果同一子存储的备控制器并未运行且备存储也未正常运行时,四控存储中的四个控制器皆宕机,四控存储出现故障;如果同一子存储的备控制器并未运行但备存储正常运行时,备存储将进行故障切换,备存储角色变更为主存储,并关闭远程复制;如果同一子存储的备控制器正常运行且备存储也正常运行时,备控制器修改角色为主控制器并修复远程复制状态,如果同一子存储的备控制器正常运行但备存储并未正常运行时,备控制器只修改角色为主控制器。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变形,这些改进和变形也应视为本发明的保护范围。

Claims (10)

1.一种四控存储数据访问方法,其特征在于,实现该方法所需的硬件平台由一套四控存储(1)构成,所述四控存储(1)包括两套子存储,即主存储(2)和备存储(3):
主存储(2)和备存储(3)都为双控存储,都由主控制器(21)和备控制器(22)共享访问共享存储介质(5),四控存储(1)中四个控制器可同时对外提供数据访问服务,其中的两套双控存储的后端存储介质可通过同步远程复制保证四控均为正常工作状态,主控制器(21和备控制器(22)可通过心跳通道(4)检测对端控制器的状态,根据心跳结果进行存储可靠性的处理,当主控制器(21)出现故障时,备控制器(22)可进行故障切换;
在四控存储(1)的4个控制器上,均布置如下的三个模块:
集群数据管理模块,用于四控存储采用集群数据库保存数据访问优先级表和远程复制状态表,数据访问优先级表在四控存储初始化时进行设置,设置完成后,数据访问服务的数据访问路径依据存储优先级、控制器优先级而定;远程复制状态表用于维护子存储中的备控制器检测远程复制状态,当远程复制状态出现异常时,备控制器需要进行故障切换,修复远程复制状态,保证远程复制正常运行;存储优先级即为子存储的优先级,在主存储的两个控制器都出现故障时,备存储若有存活的控制器,备存储的角色提升为主存储;同一存储优先级的控制器,故障切换操作由控制器的优先级决定,低优先级控制器可在高优先级控制器故障时进行故障切换操作,接替高优先级控制器继续对外提供数据访问服务;
负载均衡模块,用于四控存储内子存储的控制器采用负载均衡方式对外提供数据访问服务,客户端可同时读写主备两个控制器的存储介质,客户端访问主控制器的存储介质时,主控制器将直接对本地存储介质进行读写;客户端访问备控制器的存储介质时,备控制器会将数据访问请求重定向到同一子存储的主控制器的存储介质;主备两套存储的主控制器通过同步远程复制,保证两套双控存储的数据一致性;最终,两套双控存储的四个控制器可同时对外提供数据访问服务;
故障处理模块,用于通过为四控存储中的子存储以及其内部的控制器配置优先级,保证四控存储能够在任意三个控制器在出现故障的情况下,正常提供数据访问服务;四控存储将主存储和备存储分为两个等级,同等级的子存储内,备控制器在主控制器出现故障时进行故障切换;当主存储和备存储都仅剩主控制器时,当主存储的主控制器出现故障时,备存储的主控制器进行故障切换;
该方法中,在正常使用情况下,四控存储(1)配置主存储(2)和备存储(3)的角色,在配置数据访问服务时,配置一个远程复制对,将四控存储(1)中的一个子存储配置为主存储(2),服务中所配置的存储介质作为远程复制源端(6),另一个子存储配置为备存储(3),服务中所配置的存储介质作为远程复制目的端(7),整个远程复制的实际数据传输由主存储(2)和备存储(3)下的主控制器进行,备控制器不参与远程复制;
此时,集群数据管理模块生成四控存储(1)四个控制器的数据访问优先级表,该数据访问优先级表保存在四控存储(1)的集群数据库中,每个控制器都根据该数据访问优先级表进行相关业务的处理;
除了数据访问优先级表外,集群数据管理模块还维护远程复制状态表;
每个控制器可同时通过负载均衡模块对外提供数据访问服务;客户端通过多路径软件发现控制器的所有路径,路径选择方式可配置成负载均衡模式,此时,客户端与四控存储有四条通信方向:
1)客户端->主存储的主控制器;当数据在该通信方向时,主控制器收到数据访问请求,便直接将请求下发到本地存储介质进行处理,并将结果返回给客户端;
2)客户端->主存储的备控制器;当数据在该通信方向时,备控制器将收到的数据访问请求通过内网通信链路重定向到同一主存储的主控制器,主控制器将请求下发到本地存储介质进行处理,并将结果返回给备控制器;最终,备控制器将结果返回给客户端;
3)客户端->备存储的主控制器;当数据在该通信方向时,主控制器收到数据访问请求,便直接将请求下发到本地存储介质进行处理,并将结果返回给客户端;
4)客户端->备存储的备控制器;当数据在该通信方向时,备控制器将收到的数据访问请求通过内网通信链路重定向到同一备存储的主控制器,主控制器将请求下发到本地存储介质进行处理,并将结果返回给备控制器;最终,备控制器将结果返回给客户端;
最终,四条通信方向都有数据响应返回给客户端。
2.如权利要求1所述的方法,四控存储中的子存储在正常运行过程中,会出现子存储内部控制器心跳通道不可用的情况,造成该情况发生的原因有两种:心跳通道连接出现故障;控制器出现宕机;所述故障处理模块可对出现的这两种故障进行处理,两种情况的任意一种发生时,子存储中主备控制器都会检测到心跳通道不可用,此时根据当前四控存储中主存储和备存储的控制器状态,进行相应的处理。
3.如权利要求2所述的方法,其特征在于,当发生第一种故障情况时,所述故障处理模块进行如下处理:
一、主控制器(21)检测到心跳不通时,直接判定备控制器(22)出现故障;
二、备控制器(22)检测到心跳不通时,首先获取所在子存储的远程复制状态;
1)如果远程复制出现断开状态时,则判定远程复制状态异常,确认主控制器出现故障;
2)如果远程复制状态正常,确认主控制器正常运行,此时心跳通路故障则判定双控出现脑裂状态;备控制器重启,如果重启一定次数后依旧处于脑裂状态,备控制器直接关机;
3)如果远程复制并未运行,则四控存储内的主备存储并未同时运行,需使用内网通信链路发送心跳检测进行辅助验证,如果心跳状态正常,则判定主控制器和备控制器的心跳通信链路出现故障,当前子存储出现脑裂状态,备控制器执行重启操作,如果重启一定次数后依旧处于脑裂状态,备控制器直接关机;如果心跳不通,则判定主控制器出现故障。
4.如权利要求3所述的方法,其特征在于,当发生第二种故障情况时,所述故障处理模块进行如下的控制器故障处理:
当出现故障的控制器所在的子存储为备存储时:
1)若故障控制器为备控制器,则不行故障切换;
2)若故障控制器为主控制器,则根据当前备存储中是否还有备控制器正常运行,若存在则备控制器将控制器角色改为主控制器,恢复远程复制状态,若不存在则不进行故障切换,当前如果有远程复制则关闭;
当出现故障的控制器所在的子存储为主存储时:
1)若故障控制器为备控制器,则不进行故障切换;
2)若故障控制器为主控制器,如果同一子存储的备控制器并未运行且备存储也未正常运行时,四控存储中的四个控制器皆宕机,四控存储出现故障;如果同一子存储的备控制器并未运行但备存储正常运行时,备存储将进行故障切换,备存储角色变更为主存储,并关闭远程复制;如果同一子存储的备控制器正常运行且备存储也正常运行时,备控制器修改角色为主控制器并修复远程复制状态,如果同一子存储的备控制器正常运行但备存储并未正常运行时,备控制器只修改角色为主控制器。
5.如权利要求1所述的方法,其特征在于,所述主存储(2)提供源端数据,可将本地存储介质的数据同步复制到备存储(3)的目的端。
6.如权利要求1所述的方法,其特征在于,所述主存储2和备存储(3)都由主控制器(21)和备控制器(22),通过SAS背板共享访问共享存储介质(5)。
7.如权利要求1所述的方法,其特征在于,所述双控存储中两个控制器通过心跳通道互连,两套双控存储间使用内网通道互连。
8.如权利要求1所述的方法,其特征在于,所述数据访问优先级表的结构如下:
Figure FDA0003703869150000041
Figure FDA0003703869150000051
9.如权利要求1所述的方法,其特征在于,所述远程复制状态表的结构如下:
存储介质 远程复制状态 lun1 未运行 lun2 正常 lun3 断线重连 lun4 断开
10.一种如权利要求1至9中任一项所述方法在计算机信息存储技术领域中的应用。
CN202210700682.1A 2022-06-20 2022-06-20 一种四控存储数据访问方法 Pending CN115185747A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210700682.1A CN115185747A (zh) 2022-06-20 2022-06-20 一种四控存储数据访问方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210700682.1A CN115185747A (zh) 2022-06-20 2022-06-20 一种四控存储数据访问方法

Publications (1)

Publication Number Publication Date
CN115185747A true CN115185747A (zh) 2022-10-14

Family

ID=83516244

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210700682.1A Pending CN115185747A (zh) 2022-06-20 2022-06-20 一种四控存储数据访问方法

Country Status (1)

Country Link
CN (1) CN115185747A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117093423A (zh) * 2023-10-18 2023-11-21 西安热工研究院有限公司 可信dcs终端间数据同步方法、系统、电子设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117093423A (zh) * 2023-10-18 2023-11-21 西安热工研究院有限公司 可信dcs终端间数据同步方法、系统、电子设备及存储介质
CN117093423B (zh) * 2023-10-18 2024-01-30 西安热工研究院有限公司 可信dcs终端间数据同步方法、系统、电子设备及存储介质

Similar Documents

Publication Publication Date Title
KR100711396B1 (ko) 서버의 이중화 방법 및 이중화 서버시스템
US7058731B2 (en) Failover and data migration using data replication
CN109729129B (zh) 存储集群系统的配置修改方法、存储集群及计算机系统
US8335899B1 (en) Active/active remote synchronous mirroring
US7730274B1 (en) Preventing undesired trespass in storage arrays
US9182918B2 (en) Network storage systems having clustered raids for improved redundancy and load balancing
US7444541B2 (en) Failover and failback of write cache data in dual active controllers
US5896492A (en) Maintaining data coherency between a primary memory controller and a backup memory controller
US7861107B1 (en) Dual access pathways to serially-connected mass data storage units
EP1712997B1 (en) Disk array device and control method therefor
US20030023893A1 (en) Fault-tolerant routing scheme for a multi-path interconnection fabric in a storage network
US20130151888A1 (en) Avoiding A Ping-Pong Effect On Active-Passive Storage
US20140173330A1 (en) Split Brain Detection and Recovery System
EP2224341B1 (en) Node system, server switching method, server device, and data transfer method
GB2484086A (en) Reliability and performance modes in a distributed storage system
US6909695B2 (en) Fault-tolerant, self-healing routing scheme for a multi-path interconnection fabric in a storage network
JP2004302512A (ja) クラスタコンピューティングシステム、および、そのフェールオーバー方法
US10572188B2 (en) Server-embedded distributed storage system
CN115185747A (zh) 一种四控存储数据访问方法
CN106294031A (zh) 一种业务管理方法和存储控制器
CN115145768A (zh) 一种四控存储数据访问系统
US9582384B2 (en) Method and system for data replication
JP2007334764A (ja) Nasシステムおよびnasシステムの情報処理方法
JP2000132441A (ja) 分散データベースシステム、処理装置及びデータベースアクセス方法
CN117667528A (zh) 一种故障迁移恢复的分布式存储系统高可用方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination