CN105095125B - 基于仲裁磁盘的高可用双控存储系统及其运行方法 - Google Patents
基于仲裁磁盘的高可用双控存储系统及其运行方法 Download PDFInfo
- Publication number
- CN105095125B CN105095125B CN201510398179.5A CN201510398179A CN105095125B CN 105095125 B CN105095125 B CN 105095125B CN 201510398179 A CN201510398179 A CN 201510398179A CN 105095125 B CN105095125 B CN 105095125B
- Authority
- CN
- China
- Prior art keywords
- controller
- master controller
- information
- quorum disk
- survival
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F13/00—Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
- G06F13/14—Handling requests for interconnection or transfer
- G06F13/16—Handling requests for interconnection or transfer for access to memory bus
- G06F13/1605—Handling requests for interconnection or transfer for access to memory bus based on arbitration
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F13/00—Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
- G06F13/14—Handling requests for interconnection or transfer
- G06F13/16—Handling requests for interconnection or transfer for access to memory bus
- G06F13/1605—Handling requests for interconnection or transfer for access to memory bus based on arbitration
- G06F13/1652—Handling requests for interconnection or transfer for access to memory bus based on arbitration in a multiprocessor architecture
- G06F13/1663—Access to shared memory
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Hardware Redundancy (AREA)
Abstract
本发明提供一种基于仲裁磁盘的高可用双控存储系统及其运行方法。其中方法包括以下步骤:高可用双控存储系统上电启动后,主从控制器定时回传心跳信号至内部过程通信模块;若在预设时间内接收到主从控制器的心跳信号,高可用双控存储系统保持运行;若在预设时间内没有接收到主控制器的心跳信号,则从控制器接管第一子系统;若在预设时间内没有接收到从控制器的心跳信号,则主控制器接管第二子系统;内部过程通信模块损坏或停止时,开启仲裁磁盘,主控制器将第一存活信息写入仲裁磁盘,从控制器读取仲裁磁盘以判断主控制器的状态。其提供双重通信检测功能,实现高可用双控存储系统不间断的对外提供服务,且有效避免了误判和脑裂情况的发生。
Description
技术领域
本发明涉及计算机高可用集群系统领域,特别是涉及一种基于仲裁磁盘的高可用双控存储系统及其运行方法。
背景技术
为了对外提供可靠的连续的不间断服务,要求服务器必须具有可靠的稳定性,以保证各种实时在线业务的顺利进行。
基于此可以通过双控制器备份的方式来避免服务器软件或硬件故障而导致的在线交易中断,即在一台服务器故障时另一台服务器可以及时的监测到故障,并接替另一台服务器对外提供服务,以达到服务不中断的要求。
传统的双控制器备份的方式存在较多的弊端,如不能准确的监测到另一台服务器是否正常工作,从而出现误判的情况;另一种是容易出现脑裂情况,从而使得服务器数据库受损,破坏数据。
发明内容
鉴于此,本发明提供了一种基于仲裁磁盘的高可用双控存储系统及其运行方法,能够有效避免误判和脑裂情况的发生。
为达到发明目的,本发明提供一种基于仲裁磁盘的高可用双控存储系统的运行方法,所述基于仲裁磁盘的高可用双控存储系统包括两个控制器,两个子系统,仲裁磁盘和内部过程通信模块;两个所述控制器能够读写所述仲裁磁盘,两个所述控制器通过所述内部过程通信模块进行数据交互,两个所述控制器中一个为主控制器,另一个为从控制器,所述主控制器控制的子系统为第一子系统,所述从控制器控制的子系统为第二子系统,所述方法包括以下步骤:
所述高可用双控存储系统上电启动后,所述主控制器和所述从控制器定时回传心跳信号至所述内部过程通信模块,判断所述内部过程通信模块是否损坏,若所述内部过程通信模块未损坏,则所述内部过程通信模块判断是否在预设时间内接收到所述主控制器和所述从控制器回传的所述心跳信号;
若所述内部过程通信模块在所述预设时间内接收到所述主控制器和所述从控制器回传的所述心跳信号,则所述高可用双控存储系统保持运行;
若所述内部过程通信模块在所述预设时间内没有接收到所述主控制器回传的所述心跳信号,则所述从控制器接管所述第一子系统;
若所述内部过程通信模块在所述预设时间内没有接收到所述从控制器回传的所述心跳信号,则所述主控制器接管所述第二子系统;
若所述内部过程通信模块在所述预设时间内没有接收到所述主控制器回传的所述心跳信号,也没有接收到所述从控制器回传的所述心跳信号,则判定所述内部过程通信模块停止;
若判定所述内部过程通信模块损坏或停止时,开启所述仲裁磁盘,所述主控制器将表明其存活的第一存活信息写入所述仲裁磁盘,所述从控制器读取所述仲裁磁盘,判断所述从控制器是否读取到所述第一存活信息,以获知所述主控制器的状态;
若所述从控制器从所述仲裁磁盘中读取到所述第一存活信息,则所述从控制器当机,所述主控制器接管所述第二子系统;
若所述从控制器没有从所述仲裁磁盘中读取到所述第一存活信息,则将所述从控制器设置为新的主控制器,所述新的主控制器接管所述第一子系统。
作为一种可实施例,在所述主控制器将表明其存活的第一存活信息写入所述仲裁磁盘,所述从控制器读取所述仲裁磁盘,判断所述从控制器是否读取到所述第一存活信息,以获知所述主控制器的状态时,还包括以下步骤:
所述从控制器将表明其存活的第二存活信息写入所述仲裁磁盘,所述主控制器读取所述仲裁磁盘,判断所述主控制器是否读取到所述第二存活信息,以获知所述从控制器的状态,若所述主控制器读取到所述第二存活信息,则判定所述从控制器存活,所述主控制器保持存活,若所述主控制器没有读取到所述第二存活信息,则判定所述从控制器当机,所述主控制器接管所述第二子系统。
作为一种可实施例,所述仲裁磁盘上设置有共享区域;
所述主控制器将表明其存活的第一存活信息写入所述仲裁磁盘,所述从控制器读取所述仲裁磁盘,判断所述从控制器是否读取到所述第一存活信息,以获知所述主控制器的状态,包括如下步骤:
所述主控制器将所述第一存活信息写入所述仲裁磁盘的所述共享区域内,所述从控制器读取所述共享区域,判断所述从控制器是否读取到所述第一存活信息,以获知所述主控制器的状态;
所述从控制器将表明其存活的第二存活信息写入所述仲裁磁盘,所述主控制器读取所述仲裁磁盘,判断所述主控制器是否读取到所述第一存活信息,以获知所述从控制器的状态,,包括如下步骤:
所述从控制器将所述第二存活信息写入所述仲裁磁盘的所述共享区域内,所述主控制器读取所述共享区域,判断所述主控制器是否读取到所述第二存活信息,以获知所述从控制器的状态。
作为一种可实施例,在所述高可用双控存储系统上电启动之后,还包括根据所述控制器的性能信息和位置信息确定所述主控制器的步骤,所述根据所述控制器的性能信息和位置信息确定所述主控制器的步骤包括如下步骤:
获取两个所述控制器的所述性能信息和所述位置信息,并比较两个所述控制器的所述性能信息是否相同;
若两个所述控制器的所述性能信息相同,则根据两个所述控制器的所述位置信息确定所述主控制器;
若两个所述控制器的所述性能信息不相同,则将性能高的所述控制器确定为所述主控制器,另一控制器为所述从控制器或锁定模式。
作为一种可实施例,所述性能信息包括HDD数量,韧体版本和内存大小;
所述位置信息包括所述控制器的编号。
作为一种可实施例,若在所述高可用双控存储系统上电启动后,没有获得两个所述控制器的所述性能信息和所述位置信息,则使用所述仲裁磁盘判定能够控制所述仲裁磁盘的控制器,并将能够控制所述仲裁磁盘的所述控制器设置为存活状态,将另一控制器设置为当机状态。
作为一种可实施例,所述预设时间为13s;
所述第一存活信息包括表明所述主控制器身份的第一标记信息和表明所述主控制器读写所述仲裁磁盘时间的第一时间戳信息;
所述第二存活信息包括表明所述从控制器身份的第二标记信息和表明所述从控制器读写所述仲裁磁盘时间的第二时间戳信息。
本发明还提供一种基于仲裁磁盘的高可用双控存储系统,包括两个控制器,两个子系统,仲裁磁盘和内部过程通信模块;两个所述控制器能够读写所述仲裁磁盘,两个所述控制器通过所述内部过程通信模块进行数据交互,两个所述控制器中一个为主控制器,另一个为从控制器,所述主控制器控制的子系统为第一子系统,所述从控制器控制的子系统为第二子系统;
所述内部过程通信模块包括所述心跳信号回传子模块,所述心跳信号回传子模块包括接收判断单元,第一回传结果单元,第二回传结果单元,第三回传结果单元和第四回传结果单元;
所述仲裁磁盘包括仲裁磁盘判定模块,所述仲裁磁盘判定模块包括第一判断单元以及第一判定单元,其中:
所述接收判断单元,被配置以在所述高可用双控存储系统上电启动后,接收所述主控制器和所述从控制器定时回传的心跳信号,并判断所述内部过程通信模块是否损坏,若所述内部过程通信模块未损坏,则判断是否在预设时间内接收到所述主控制器和所述从控制器回传的所述心跳信号;
所述第一回传结果单元,被配置以若所述接收判断单元在预设时间内接收到所述主控制器和所述从控制器回传的所述心跳信号,则所述高可用双控存储系统保持运行;
所述第二回传结果单元,被配置以若所述接收判断单元在所述预设时间内没有接收到所述主控制器回传的所述心跳信号,则所述从控制器接管所述主控制器控制的所述第一子系统;
所述第三回传结果单元,被配置以若所述接收判断单元在所述预设时间内没有接收到所述从控制器回传的所述心跳信号,则所述主控制器接管所述从控制器控制的所述第二子系统;
所述第四回传结果单元,被配置以若所述内部过程通信模块在所述预设时间内没有接收到所述主控制器回传的所述心跳信号,也没有接收到所述从控制器回传的所述心跳信号,则判定所述内部过程通信模块停止;
所述第一判断单元,被配置以判定所述内部过程通信模块损坏或停止时,所述仲裁磁盘开启,将表明所述主控制器存活的第一存活信息写入所述仲裁磁盘,所述从控制器读取所述仲裁磁盘,判断所述从控制器是否读取到所述第一存活信息,以获知所述主控制器的状态;
所述第一判定单元,被配置以若所述从控制器从所述仲裁磁盘中读取到所述第一存活信息,则判定所述从控制器当机,所述主控制器接管所述从控制器控制的所述第二子系统,若所述从控制器没有从所述仲裁磁盘中读取到所述第一存活信息,则判定所述从控制器为新的主控制器,所述新的主控制器接管所述第一子系统。
作为一种可实施例,仲裁磁盘判定模块还包括第二判断单元以及第二判定单元,其中:
所述第二判断单元,被配置在将表明所述主控制器存活的第一存活信息写入所述仲裁磁盘,所述从控制器读取所述仲裁磁盘,判断所述从控制器是否读取到所述第一存活信息,以获知所述主控制器的状态时,将表明所述从控制器存活的第二存活信息写入所述仲裁磁盘,所述主控制器读取所述仲裁磁盘,判断所述主控制器是否读取到所述第二存活信息,以获知所述从控制器的状态;
所述第二判定单元,被配置以若所述主控制器读取到所述第二存活信息,则判定所述从控制器存活,所述主控制器保持存活,若所述主控制器没有读取到所述第二存活信息,则判定所述从控制器当机,所述主控制器接管所述第二子系统。
作为一种可实施例,所述仲裁磁盘上设置有共享区域;
所述共享区域包括第一共享区域单元和第二共享区域单元,其中:
所述第一共享区域单元,被配置以所述主控制器将所述第一存活信息写入所述仲裁磁盘的所述共享区域内,所述从控制器读取所述共享区域,判断所述从控制器是否读取到所述第一存活信息,以获知所述主控制器的状态;
所述第二共享区域单元,被配置以所述从控制器将所述第二存活信息写入所述仲裁磁盘的所述共享区域内,所述主控制器读取所述共享区域,判断所述主控制器是否读取到所述第二存活信息,以获知所述从控制器的状态。
作为一种可实施例,所述内部过程通信模块还包括主控制器确定子模块,被配置以根据所述控制器的性能信息和位置信息确定所述主控器;
所述主控制器确定子模块包括获取比较单元,第一确定单元和第二确定单元,其中:
所述获取比较单元,被配置以获取两个所述控制器的所述性能信息和所述位置信息,并比较两个所述控制器的所述性能信息是否相同;
所述第一确定单元,被配置以若两个所述控制器的所述性能信息相同,则根据两个所述控制器的所述位置信息确定所述主控制器;
所述第二确定单元,被配置以若两个所述控制器的所述性能信息不相同,则将性能高的所述控制器确定为所述主控制器,另一控制器为所述从控制器或锁定模式。
作为一种可实施例,所述性能信息包括HDD数量,韧体版本和内存大小;
所述位置信息包括所述控制器的编号。
作为一种可实施例,所述仲裁磁盘还包括控制器状态判定模块,被配置以若在所述高可用双控存储系统上电启动后,没有获得两个所述控制器的所述性能信息和所述位置信息,则使用所述仲裁磁盘判定能够控制所述仲裁磁盘的控制器,并将能够控制所述仲裁磁盘的所述控制器设置为存活状态,将另一控制器设置为当机状态。
作为一种可实施例,所述预设时间为13s;
所述第一存活信息包括表明所述主控制器身份的第一标记信息和表明所述主控制器读写所述仲裁磁盘时间的第一时间戳信息;
所述第二存活信息包括表明所述从控制器身份的第二标记信息和表明所述从控制器读写所述仲裁磁盘时间的第二时间戳信息。
本发明的有益效果包括:
本发明的基于仲裁磁盘的高可用双控存储系统及其运行方法,内部过程通信模块或仲裁磁盘提供两个控制器的双重通信检测功能,实现基于仲裁磁盘的高可用双控存储系统不间断对外提供服务的效果,同时仲裁磁盘的使用有效的避免了误判和脑裂情况的发生。
附图说明
图1为本发明的基于仲裁磁盘的高可用双控存储系统的运行方法的一实施例的流程示意图;
图2为本发明的基于仲裁磁盘的高可用双控存储系统的运行方法的另一实施例的流程示意图;
图3为本发明的基于仲裁磁盘的高可用双控存储系统的运行方法的另一实施例的流程示意图;
图4为本发明的基于仲裁磁盘的高可用双控存储系统的一实施例的结构示意图;
图5为本发明的基于仲裁磁盘的高可用双控存储系统中内部过程通信模块的一实施例的结构示意图;
图6为本发明的基于仲裁磁盘的高可用双控存储系统的另一实施例的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例对本发明基于仲裁磁盘的高可用双控存储系统及其运行方法进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
本发明实施例还提供一种基于仲裁磁盘的高可用双控存储系统的运行方法,参见图1,基于仲裁磁盘的高可用双控存储系统包括两个控制器,两个子系统,仲裁磁盘和内部过程通信模块(IPC module,inter processor communication module)。两个控制器能够读写仲裁磁盘,两个控制器通过内部过程通信模块进行数据交互,两个控制器中一个为主控制器,另一个为从控制器,主控制器控制的子系统为第一子系统,从控制器控制的子系统为第二子系统。
该方法包括以下步骤:
S200,高可用双控存储系统上电启动后,主控制器和从控制器定时回传心跳信号至内部过程通信模块,判断内部过程通信模块是否损坏。
S210,若内部过程通信模块未损坏,则内部过程通信模块判断是否在预设时间内接收到主控制器和从控制器回传的心跳信号。
S211,若内部过程通信模块在预设时间内接收到主控制器和从控制器回传的心跳信号,则高可用双控存储系统保持运行。
S212,若内部过程通信模块在预设时间内没有接收到主控制器回传的心跳信号,则从控制器接管主控制器控制的第一子系统;若内部过程通信模块在预设时间内没有接收到从控制器回传的心跳信号,则主控制器接管从控制器控制的第二子系统。
S213,若内部过程通信模块在预设时间内没有接收到主控制器回传的心跳信号,也没有接收到从控制器回传的心跳信号,则判定内部过程通信模块停止。
S220,若判定内部过程通信模块损坏或停止时,开启仲裁磁盘,主控制器将表明其存活的第一存活信息写入仲裁磁盘,从控制器读取仲裁磁盘,判断从控制器是否读取到第一存活信息,以获知主控制器的状态。
S221,若从控制器从仲裁磁盘中读取到第一存活信息,则从控制器当机,主控制器接管从控制器控制的所述第二子系统。
S222,若从控制器没有从仲裁磁盘中读取到第一存活信息,则将从控制器设置为新的主控制器,新的主控制器接管第一子系统。
本发明实施例的基于仲裁磁盘的高可用双控存储系统的运行方法,包括回传心跳信号至内部过程通信模块判断控制器工作状态的步骤和仲裁磁盘决定控制器状态的步骤。当系统上电启动时,首先判断内部过程通信模块是否被损坏,若是被损坏,则直接开启仲裁磁盘决定控制器的状态,若没有被损坏,内部过程通信模块才能接收主控制器和从控制器回传的相应的心跳信息,内部过程通信模块通过判断是否收到主控制器和从控制器的心跳信号,而获得主控制器和从控制器的工作状态(如是否故障),若接收到两个控制器(主控制和从控制器)的心跳信号,则主控制器和从控制器均没有发生故障,高可用双控存储系统保持运行(主控制器依然执行主控制器的功能,从控制器依然执行从控制器的功能),若只接收到从控制器的心跳信号,而没有接收到主控制器的心跳信号,则从控制器接管主控制器控制的第一子系统,此时从控制器执行主控制器及从控制器的功能,若只接收到主控制器的心跳信号,而没有接收到从控制器的心跳信号,则主控制器接管从控制器控制的第二子系统,此时主控制器执行主控制器及从控制器的功能,从而使整个系统不间断的对外提供服务。若内部过程通信模块在预设时间内没有接收到两个控制器的心跳信号,则说明内部过程通信模块停止,两个控制器之间不能再通过内部过程通信模块进行通信,此时,启动仲裁磁盘,由仲裁磁盘决定两个控制器的状态,存活的控制器作为主控制器对外提供连续不间断的服务。
需要说明的是,主控制器执行的是管理服务,如网络服务CLI(Command-lineInterface,命令行界面),从控制器执行的是备份服务,直至从控制器接管主控制器的子系统,作为主控制器时其对应的管理服务功能才执行,这样高可用存储系统实现了单一管理,设计相对简易,易于实施。高可用双控存储系统决定了主控制器运行管理服务,从控制器运行备份服务,有效的解决了固件及硬件的竞争问题,且其支持单一或双控制器的系统配置。其中,IP/MAC接管SAN(Storage Area Network,存储区域网络)控制器的管理以及接管NAS(Network Attached Storage,网络附属存储)控制器的所有网络接口。值得说明的是,控制器的热插拔集中在高可用集群系统上,当检测到某一控制器发生故障时(此时另一控制器会自动接管其控制的子系统),允许用户可以在不关闭系统、不切断电源的情况下取出和更换有故障的控制器。
在两个控制器都没有回传心跳信号至内部过程通信模块时,可能是内部过程通信模块停止,也有可能是控制器或其他部件损坏而使得控制器不能及时回传心跳信号给内部过程通信模块,从而不能正确的判断控制器的工作状态,仲裁磁盘作为两个控制器信息交互的中介,有效避免了误判情况的发生,两个控制器能够正确的判断对方的工作状态。同时,若内部过程通信模块损坏或停止时,仲裁磁盘提供两个控制器之间的信息交互,从而使两个控制器及时获得对方的状态,避免了脑裂情况的发生,不会出现一个控制器管理或控制其相应的子系统时,另一个控制器阻止它管理或控制,避免了数据库受损、数据遭到破坏情况的发生。
其中,基于仲裁磁盘的高可用双控存储系统如图4至图6所示,其采用双控制器备份的方式来避免软件或硬件故障而导致的服务中断,以达到服务不中断的要求。内部过程通信模块或仲裁磁盘实现两个控制器的双重通信,内部过程通信模块的优先级较高,在其没有损坏或停止时,两个控制器通过内部过程通信模块实现通信,在内部过程通信模块损坏或停止时,启动仲裁磁盘实现两个控制器的相互检测,并决定两个控制器的状态,有效的避免了误判及脑裂情况的发生。其中,在FRU(Field Replace Unit,现场可更换单元)故障时(如内部过程通信模块损坏时)可自动通知控制器将表明其存活的存活信息写入仲裁磁盘中。具体的,在其中一个实施例中,子系统中包括RAID(Redundant Arrays ofIndependent Disks,磁盘阵列)、LVM(Logical Volume Manager,逻辑卷管理)和VFS(Virtual File System,虚拟文件系统),子系统从内部过程通信模块及位置信息模块收集讯息后通知给RAID、LVM及VFS。较优的,在其中一个实施例中,第一存活信息包括表明主控制器身份的第一标记信息和表明主控制器读写仲裁磁盘时间的第一时间戳信息,第二存活信息包括表明从控制器身份的第二标记信息和表明从控制器读写仲裁磁盘时间的第二时间戳信息。其中,第一标记信息和第二标记信息均为一个特殊的记号。标记信息表明控制器的身份,时间戳信息表明控制器读写仲裁磁盘的时间,以此便可以得知控制器最后的存活时间。
较优的,在其中一个实施例中,预设时间为13s,主控制器和从控制器每隔3s回传一个心跳信号至内部过程通信模块。每隔3s回传一个心跳信号至内部过程通信模块,实时反映两个控制器是否出现故障,进而根据控制器的故障情况决定哪个控制器对外提供服务。以预设时间(13s)为一个时限,判断主控制器和从控制器是否发生故障,既给主控制器和从控制器足够时间去回传心跳信号(不会出现回传时间不足或控制器偶尔一次没有回传心跳信号的情况),又不会等待太长时间,影响高可用双控存储系统对外的持续服务。
作为一种可实施方式,参见图2,在执行步骤S220时,还包括以下步骤:
S230,从控制器将表明其存活的第二存活信息写入仲裁磁盘,主控制器读取仲裁磁盘,判断主控制器是否读取到第二存活信息,以获知从控制器的状态;
S231,若主控制器读取到第二存活信息,则判定从控制器存活,主控制器保持存活;
S232,若主控制器没有读取到第二存活信息,则判定从控制器当机,主控制器接管第二子系统。
在主控制器将表明其存活的第一存活信息写入仲裁磁盘的同时,从控制器也将表明其存活的第二存活信息存入仲裁磁盘,以供主控制器侦测判断从控制器的状态,即主控制器和从控制器可以同时读写仲裁磁盘。
较优的,在其中一个实施例中,主控制器将第一存活信息持续写入仲裁磁盘中,从控制器持续读取仲裁磁盘以侦测判断主控制器的状态。从控制器将第二存活信息持续的写入仲裁从磁盘中,主控制器持续读取仲裁磁盘以侦测判断从控制器的状态,保证两个控制器信息交互的实时性。
作为一种可实施方式,参见图3,仲裁磁盘上设置有共享区域。
步骤S220还包括如下步骤:
S220',主控制器将第一存活信息写入仲裁磁盘的共享区域内,从控制器读取共享区域,判断从控制器是否读取到第一存活信息,以获知主控制器的状态。
步骤S230还包括如下步骤:
S230',从控制器将第二存活信息写入仲裁磁盘的共享区域内,主控制器读取共享区域,判断主控制器是否读取到第二存活信息,以获知从控制器的状态。
仲裁磁盘为一具有共享能力的磁盘,包括共享区域。较优的,将仲裁磁盘中最后的块作为共享区域,主控制器和从控制器能够同时读写共享区域来侦测判断另一控制器是否存活。仲裁磁盘中最后的块作为共享区域,主控制器和从控制器只需读写共享区域,就能获得另一控制器的状态,读写相对集中,节省磁盘资源。两控制器同时读写共享区域,侦测判断过程同时进行,提高高可用双控存储系统的性能。
作为一种可实施方式,参见图2、图3,还包括步骤S100,根据控制器的性能信息和位置信息确定主控制器。步骤S100包括如下步骤:
S110,获取两个控制器的性能信息和位置信息,并比较两个控制器的性能信息是否相同。
S120,若两个控制器的性能信息相同,则根据两个控制器的位置信息确定主控制器。
S130,若两个控制器的性能信息不相同,则将性能高的控制器确定为主控制器,另一控制器为从控制器或锁定模式。
在高可用双控存储系统上电启动之后,两个子系统之间会相互等待一定时间(如26s),以便获得对方控制器的性能信息和位置信息,并根据两个控制器的性能信息和位置信息确定哪个控制器为主控制器,哪个控制器为从控制器,其中,主控制器执行管理服务,从控制器执行备份服务。若两个控制器的性能信息不相同,则选取性能高的控制器作为主控制器,选取性能低的控制器为从控制器或者将其设置为锁定模式。其中,性能信息包括HDD(Hard Disk Drive,硬盘驱动器)数量,韧体版本和内存大小。性能高指的是该控制器拥有的硬盘数量多,韧体版本高或内存大,若控制器拥有的硬盘数量多或内存大,则该控制器设置为主控制器,另一控制器设置为从控制器;若控制器的韧体版本高,则该控制器设置为主控制器,另一控制器设置为锁定模式。通常两个控制器的性能信息是相同的,此时根据两个控制器的位置信息决定哪个控制器为主控制器,哪个控制器为从控制器。其中,位置信息包括控制器的编号,若两个控制器的性能信息相同,则将编号排前的控制器确定为主控制器,将编号排后的另一控制器设置为从控制器。
作为一种可实施方式,参见图3,还包括步骤S100',若高可用双控存储系统上电启动后,没有获得两个控制器的性能信息和位置信息,则使用仲裁磁盘判定能够控制仲裁磁盘的控制器,并将能够控制仲裁磁盘的控制器设置为存活状态,将另一控制器设置为当机状态。
高可用双控存储系统上电启动一定时间(如26s)之后,仍没有获得两个控制器的位置信息和性能信息,使用仲裁磁盘确定两个控制器的状态,存活的控制器作为主控制器对外提供连续的服务。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁盘、光盘、只读存储器(Read-Only Memory,ROM)或随机存储器(Random Access Memory,RAM)等。其中,仲裁磁盘为具备共享能力的介质,如SAS(Serial Attached SCSI,串行连接SCSI)硬盘,SAS扩展器等。
基于同一发明构思,本发明还提供了一种基于仲裁磁盘的高可用双控存储系统,由于此系统解决问题的原理与前述一种基于仲裁磁盘的高可用双控存储系统的运行方法相似,因此该系统的实施可以参见前述方法的实施,重复之处不再赘述。
本发明实施例提供的基于仲裁磁盘的高可用双控存储系统,参见图4、图5,包括两个控制器,两个子系统,仲裁磁盘400和内部过程通信模块200;两个控制器能够读写仲裁磁盘400,两个控制器通过内部过程通信模块200进行数据交互,两个控制器中一个为主控制器1000a,另一个为从控制器1000b,主控制器控制的子系统为第一子系统100a,从控制器1000b控制的子系统为第二子系统100b。
内部过程通信模块200包括心跳信号回传子模块240,心跳信号回传子模块240包括接收判断单元241,第一回传结果单元242,第二回传结果单元243,第三回传结果单元244和第四回传结果单元245,其中:
接收判断单元241,被配置以在高可用双控存储系统上电启动后,接收主控制器和从控制器定时回传的心跳信号,并判断内部过程通信模块是否损坏,若内部过程通信模块未损坏,则判断是否在预设时间内接收到主控制器和从控制器回传的心跳信号。第一回传结果单元242,被配置以若接收判断单元241在预设时间内接收到主控制器和从控制器回传的心跳信号,则高可用双控存储系统保持运行。第二回传结果单元243,被配置以若接收判断单元241在预设时间内没有接收到主控制器回传的心跳信号,则从控制器接管主控制器控制的第一子系统。第三回传结果单元244,被配置以若接收判断单元241在预设时间内没有接收到从控制器回传的心跳信号,则主控制器接管从控制器控制的第二子系统。第四回传结果单元245,被配置以若内部过程通信模块在预设时间内没有接收到主控制器回传的心跳信号,也没有接收到从控制器回传的心跳信号,则判定内部过程通信模块停止。
仲裁磁盘400包括仲裁磁盘判定模块440,仲裁磁盘判定模块440包括第一判断单元441以及第一判定单元442,其中:
第一判断单元441,被配置以判定内部过程通信模块损坏或停止时,仲裁磁盘开启,将表明主控制器存活的第一存活信息写入仲裁磁盘,从控制器读取仲裁磁盘,判断从控制器是否读取到第一存活信息,以获知主控制器的状态。第一判定单元442,被配置以若从控制器从仲裁磁盘中读取到第一存活信息,则判定从控制器当机,主控制器接管从控制器控制的第二子系统,若从控制器没有从仲裁磁盘中读取到第一存活信息,则判定从控制器为新的主控制器,新的主控制器接管第一子系统。
本发明实施例的基于仲裁磁盘的高可用双控存储系统,包括心跳信号回传子模块240和仲裁磁盘判定模块440,提供双重通信检测的功能,实现高可用双控存储系统不间断的对外提供服务,且有效避免了误判情况和脑裂情况的发生。
值得说明的是,两个控制器中各设置有一个内部过程通信模块200,以保证数据交互的准确性及安全性,如图4或图6所示,主控制器1000a中设置有第一内部过程通信模块200a,从控制器1000b中设置有第二内部过程通信模块200b,第一内部过程通信模块200a和第二内部过程通信模块200b实现相同的功能,如图5所示,第一内部过程通信模块200a主要负责接收主控制器1000a回传的心跳信号,并通过PCIe(PCI Express,总线接口)或SAS(Serial Attached SCSI,串行连接SCSI)将主控制器1000a回传的心跳信号传给第二内部过程通信模块200b,相似的,第二内部过程通信模块200b主要负责接收从控制器1000b回传的心跳信号,并通过PCIe或SAS传给第一内部过程通信模块200a,以实现主控制器1000a和从控制器1000b之间的数据交互。当然,主控制器1000a和从控制器1000b之间也可以只通过一个内部过程通信模块200实现相互的数据交互。
作为一种可实施方式,仲裁磁盘判定模块440还包括第二判断单元443以及第二判定单元444。其中:第二判断单元443,被配置以在将表明主控制器存活的第一存活信息写入仲裁磁盘,从控制器读取仲裁磁盘,判断从控制器是否读取到第一存活信息,以获知主控制器的状态时,将表明从控制器存活的第二存活信息写入所述仲裁磁盘,主控制器读取仲裁磁盘,判断主控制器是否读取到第二存活信息,以获知从控制器的状态。第二判定单元444,被配置以若主控制器读取到第二存活信息,则判定从控制器存活,主控制器保持存活,若主控制器没有读取到第二存活信息,则判定从控制器当机,主控制器接管第二子系统。
作为一种可实施方式,参见图6,仲裁磁盘上设置有共享区域430。共享区域包括第一共享区域单元431和第二共享区域单元432。其中:第一共享区域单元431,被配置以主控制器将第一存活信息写入仲裁磁盘的共享区域内,从控制器读取共享区域,判断从控制器是否读取到第一存活信息,以获知主控制器的状态。第二共享区域单元432,被配置以从控制器将第二存活信息写入仲裁磁盘的共享区域内,主控制器读取共享区域,判断主控制器是否读取到第二存活信息,以获知从控制器的状态。
作为一种可实施方式,内部过程通信模块200还包括主控制器确定子模块220,被配置以根据控制器的性能信息和位置信息确定主控制器。主控制器确定子模块220包括获取比较单元221,第一确定单元222和第二确定单元223。其中:获取比较单元221,被配置以获取两个控制器的性能信息和位置信息,并比较两个控制器的性能信息是否相同。第一确定单元222,被配置以若两个控制器的性能信息相同,则根据两个控制器的位置信息确定主控制器。第二确定单元223,被配置以若两个控制器的性能信息不相同,则将性能高的控制器确定为主控制器,另一控制器为从控制器或锁定模式。
作为一种可实施方式,性能信息包括HDD数量,韧体版本和内存大小,性能高指的是该控制器拥有的硬盘数量多,韧体版本高或内存大,若该控制器拥有的硬盘数量多或内存大,则该控制器设置为主控制器,另一控制器设置为从控制器;若该控制器的韧体版本高,则该控制器设置为主控制器,另一控制器设置为锁定模式。位置信息包括所述控制器的编号,若该控制器的编号排前,则设置为主控制器,另一编号排后的控制器设置为从控制器。
作为一种可实施方式,仲裁磁盘400还包括控制器状态判定模块420,被配置以若高可用双控存储系统上电启动后,没有获得两个所述控制器的性能信息和位置信息,则使用仲裁磁盘判定能够控制仲裁磁盘的控制器,并将能够控制仲裁磁盘的控制器设置为存活状态,将另一控制器设置为当机状态。
作为一种可实施方式,预设时间为13s。第一存活信息包括表明主控制器身份的第一标记信息和表明主控制器读写仲裁磁盘时间的第一时间戳信息。第二存活信息包括表明从控制器身份的第一标记信息和表明从控制器读写仲裁磁盘时间的第二时间戳信息。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
Claims (14)
1.一种基于仲裁磁盘的高可用双控存储系统的运行方法,其特征在于,所述基于仲裁磁盘的高可用双控存储系统包括两个控制器,两个子系统,仲裁磁盘和内部过程通信模块;两个所述控制器能够读写所述仲裁磁盘,两个控制器通过所述内部过程通信模块进行数据交互,两个所述控制器中一个为主控制器,另一个为从控制器,所述主控制器控制的子系统为第一子系统,所述从控制器控制的子系统为第二子系统,所述方法包括以下步骤:
所述高可用双控存储系统上电启动后,所述主控制器和所述从控制器定时回传心跳信号至所述内部过程通信模块,判断所述内部过程通信模块是否损坏,若所述内部过程通信模块未损坏,则所述内部过程通信模块判断是否在预设时间内接收到所述主控制器和所述从控制器回传的所述心跳信号;
若所述内部过程通信模块在所述预设时间内接收到所述主控制器和所述从控制器回传的所述心跳信号,则所述高可用双控存储系统保持运行;
若所述内部过程通信模块在所述预设时间内没有接收到所述主控制器回传的所述心跳信号,则所述从控制器接管所述第一子系统;
若所述内部过程通信模块在所述预设时间内没有接收到所述从控制器回传的所述心跳信号,则所述主控制器接管所述第二子系统;
若所述内部过程通信模块在所述预设时间内没有接收到所述主控制器回传的所述心跳信号,也没有接收到所述从控制器回传的所述心跳信号,则判定所述内部过程通信模块停止;
若判定所述内部过程通信模块损坏或停止时,开启所述仲裁磁盘,所述主控制器将表明其存活的第一存活信息写入所述仲裁磁盘,所述从控制器读取所述仲裁磁盘,判断所述从控制器是否读取到所述第一存活信息,以获知所述主控制器的状态;
若所述从控制器从所述仲裁磁盘中读取到所述第一存活信息,则所述从控制器当机,所述主控制器接管所述第二子系统;
若所述从控制器没有从所述仲裁磁盘中读取到所述第一存活信息,则将所述从控制器设置为新的主控制器,所述新的主控制器接管所述第一子系统。
2.根据权利要求1所述的基于仲裁磁盘的高可用双控存储系统的运行方法,其特征在于,在所述主控制器将表明其存活的第一存活信息写入所述仲裁磁盘,所述从控制器读取所述仲裁磁盘,判断所述从控制器是否读取到所述第一存活信息,以获知所述主控制器的状态时,还包括以下步骤:
所述从控制器将表明其存活的第二存活信息写入所述仲裁磁盘,所述主控制器读取所述仲裁磁盘,判断所述主控制器是否读取到所述第二存活信息,以获知所述从控制器的状态,若所述主控制器读取到所述第二存活信息,则判定所述从控制器存活,所述主控制器保持存活,若所述主控制器没有读取到所述第二存活信息,则判定所述从控制器当机,所述主控制器接管所述第二子系统。
3.根据权利要求2所述的基于仲裁磁盘的高可用双控存储系统的运行方法,其特征在于,所述仲裁磁盘上设置有共享区域;
所述主控制器将表明其存活的第一存活信息写入所述仲裁磁盘,所述从控制器读取所述仲裁磁盘,判断所述从控制器是否读取到所述第一存活信息,以获知所述主控制器的状态,包括如下步骤:
所述主控制器将所述第一存活信息写入所述仲裁磁盘的所述共享区域内,所述从控制器读取所述共享区域,判断所述从控制器是否读取到所述第一存活信息,以获知所述主控制器的状态;
所述从控制器将表明其存活的第二存活信息写入所述仲裁磁盘,所述主控制器读取所述仲裁磁盘,判断所述主控制器是否读取到所述第二存活信息,以获知所述从控制器的状态,包括如下步骤:
所述从控制器将所述第二存活信息写入所述仲裁磁盘的所述共享区域内,所述主控制器读取所述共享区域,判断所述主控制器是否读取到所述第二存活信息,以获知所述从控制器的状态。
4.根据权利要求1所述的基于仲裁磁盘的高可用双控存储系统的运行方法,其特征在于,在所述高可用双控存储系统上电启动之后,还包括根据所述控制器的性能信息和位置信息确定所述主控制器的步骤,所述根据所述控制器的性能信息和位置信息确定所述主控制器的步骤包括如下步骤:
获取两个所述控制器的所述性能信息和所述位置信息,并比较两个所述控制器的所述性能信息是否相同;
若两个所述控制器的所述性能信息相同,则根据两个所述控制器的所述位置信息确定所述主控制器;
若两个所述控制器的所述性能信息不相同,则将性能高的所述控制器确定为所述主控制器,另一控制器为所述从控制器或锁定模式。
5.根据权利要求4所述的基于仲裁磁盘的高可用双控存储系统的运行方法,其特征在于:
所述性能信息包括HDD数量,韧体版本和内存大小;
所述位置信息包括所述控制器的编号。
6.根据权利要求4所述的基于仲裁磁盘的高可用双控存储系统的运行方法,其特征在于,若所述高可用双控存储系统上电启动后,没有获得两个所述控制器的所述性能信息和所述位置信息,则使用所述仲裁磁盘判定能够控制所述仲裁磁盘的控制器,并将能够控制所述仲裁磁盘的所述控制器设置为存活状态,将另一控制器设置为当机状态。
7.根据权利要求2或3所述的基于仲裁磁盘的高可用双控存储系统的运行方法,其特征在于:
所述预设时间为13s;
所述第一存活信息包括表明所述主控制器身份的第一标记信息和表明所述主控制器读写所述仲裁磁盘时间的第一时间戳信息;
所述第二存活信息包括表明所述从控制器身份的第二标记信息和表明所述从控制器读写所述仲裁磁盘时间的第二时间戳信息。
8.一种基于仲裁磁盘的高可用双控存储系统,其特征在于,包括两个控制器,两个子系统,仲裁磁盘和内部过程通信模块;两个所述控制器能够读写所述仲裁磁盘,两个控制器通过所述内部过程通信模块进行数据交互,两个所述控制器中一个为主控制器,另一个为从控制器,所述主控制器控制的子系统为第一子系统,所述从控制器控制的子系统为第二子系统;
所述内部过程通信模块包括心跳信号回传子模块,所述心跳信号回传子模块包括接收判断单元,第一回传结果单元,第二回传结果单元,第三回传结果单元和第四回传结果单元;
所述仲裁磁盘包括仲裁磁盘判定模块,所述仲裁磁盘判定模块包括第一判断单元以及第一判定单元,其中:
所述接收判断单元,被配置以在所述高可用双控存储系统上电启动后,接收所述主控制器和所述从控制器定时回传的心跳信号,并判断所述内部过程通信模块是否损坏,若所述内部过程通信模块未损坏,则判断是否在预设时间内接收到所述主控制器和所述从控制器回传的所述心跳信号;
所述第一回传结果单元,被配置以若所述接收判断单元在预设时间内接收到所述主控制器和所述从控制器回传的所述心跳信号,则所述高可用双控存储系统保持运行;
所述第二回传结果单元,被配置以若所述接收判断单元在所述预设时间内没有接收到所述主控制器回传的所述心跳信号,则所述从控制器接管所述主控制器控制的所述第一子系统;
所述第三回传结果单元,被配置以若所述接收判断单元在所述预设时间内没有接收到所述从控制器回传的所述心跳信号,则所述主控制器接管所述从控制器控制的所述第二子系统;
所述第四回传结果单元,被配置以若所述内部过程通信模块在所述预设时间内没有接收到所述主控制器回传的所述心跳信号,也没有接收到所述从控制器回传的所述心跳信号,则判定所述内部过程通信模块停止;
所述第一判断单元,被配置以判定所述内部过程通信模块损坏或停止时,所述仲裁磁盘开启,将表明所述主控制器存活的第一存活信息写入所述仲裁磁盘,所述从控制器读取所述仲裁磁盘,判断所述从控制器是否读取到所述第一存活信息,以获知所述主控制器的状态;
所述第一判定单元,被配置以若所述从控制器从所述仲裁磁盘中读取到所述第一存活信息,则判定所述从控制器当机,所述主控制器接管所述第二子系统,若所述从控制器没有从所述仲裁磁盘中读取到所述第一存活信息,则判定所述从控制器为新的主控制器,所述新的主控制器接管所述第一子系统。
9.根据权利要求8所述的基于仲裁磁盘的高可用双控存储系统,其特征在于:仲裁磁盘判定模块还包括第二判断单元以及第二判定单元,其中:
所述第二判断单元,被配置以在将表明所述主控制器存活的第一存活信息写入所述仲裁磁盘,所述从控制器读取所述仲裁磁盘,判断所述从控制器是否读取到所述第一存活信息,以获知所述主控制器的状态时,将表明所述从控制器存活的第二存活信息写入所述仲裁磁盘,所述主控制器读取所述仲裁磁盘,判断所述主控制器是否读取到所述第二存活信息,以获知所述从控制器的状态;
所述第二判定单元,被配置以若所述主控制器读取到所述第二存活信息,则判定所述从控制器存活,所述主控制器保持存活,若所述主控制器没有读取到所述第二存活信息,则判定所述从控制器当机,所述主控制器接管所述第二子系统。
10.根据权利要求9所述的基于仲裁磁盘的高可用双控存储系统,其特征在于,所述仲裁磁盘上设置有共享区域;
所述共享区域包括第一共享区域单元以及第二共享区域单元,其中:
所述第一共享区域单元,被配置以所述主控制器将所述第一存活信息写入所述仲裁磁盘的所述共享区域内,所述从控制器读取所述共享区域,判断所述从控制器是否读取到所述第一存活信息,以获知所述主控制器的状态;
所述第二共享区域单元,被配置以所述从控制器将所述第二存活信息写入所述仲裁磁盘的共享区域内,所述主控制器读取所述共享区域,判断所述主控制器是否读取到所述第二存活信息,以获知所述从控制器的状态。
11.根据权利要求8所述的基于仲裁磁盘的高可用双控存储系统,其特征在于,所述内部过程通信模块还包括主控制器确定子模块,被配置以根据所述控制器的性能信息和位置信息确定所述主控制器;
所述主控制器确定子模块包括获取比较单元,第一确定单元和第二确定单元,其中:
所述获取比较单元,被配置以获取两个所述控制器的所述性能信息和所述位置信息,并比较两个所述控制器的所述性能信息是否相同;
所述第一确定单元,被配置以若两个所述控制器的所述性能信息相同,则根据两个所述控制器的所述位置信息确定所述主控制器;
所述第二确定单元,被配置以若两个所述控制器的所述性能信息不相同,则将性能高的所述控制器确定为所述主控制器,另一控制器为所述从控制器或锁定模式。
12.根据权利要求11所述的基于仲裁磁盘的高可用双控存储系统,其特征在于,所述性能信息包括HDD数量,韧体版本和内存大小;
所述位置信息包括所述控制器的编号。
13.根据权利要求11所述的基于仲裁磁盘的高可用双控存储系统,其特征在于,所述仲裁磁盘还包括控制器状态判定模块,被配置以若所述高可用双控存储系统上电启动后,没有获得两个所述控制器的所述性能信息和所述位置信息,则使用所述仲裁磁盘判定能够控制所述仲裁磁盘的控制器,并将能够控制所述仲裁磁盘的所述控制器设置为存活状态,将另一控制器设置为当机状态。
14.根据权利要求9或10所述的基于仲裁磁盘的高可用双控存储系统,其特征在于:
所述预设时间为13s;
所述第一存活信息包括表明所述主控制器身份的第一标记信息和表明所述主控制器读写所述仲裁磁盘时间的第一时间戳信息;
所述第二存活信息包括表明所述从控制器身份的第二标记信息和表明所述从控制器读写所述仲裁磁盘时间的第二时间戳信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510398179.5A CN105095125B (zh) | 2015-07-08 | 2015-07-08 | 基于仲裁磁盘的高可用双控存储系统及其运行方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510398179.5A CN105095125B (zh) | 2015-07-08 | 2015-07-08 | 基于仲裁磁盘的高可用双控存储系统及其运行方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105095125A CN105095125A (zh) | 2015-11-25 |
CN105095125B true CN105095125B (zh) | 2018-10-02 |
Family
ID=54575610
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510398179.5A Active CN105095125B (zh) | 2015-07-08 | 2015-07-08 | 基于仲裁磁盘的高可用双控存储系统及其运行方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105095125B (zh) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106909307B (zh) * | 2015-12-22 | 2020-01-03 | 华为技术有限公司 | 一种管理双活存储阵列的方法及装置 |
EP3319258B1 (en) | 2015-12-23 | 2019-11-27 | Huawei Technologies Co., Ltd. | Service take-over method and storage device, and service take-over apparatus |
CN107220197A (zh) * | 2017-06-19 | 2017-09-29 | 郑州云海信息技术有限公司 | 一种双控存储设备主备控制方法及装置 |
CN107678891B (zh) * | 2017-10-13 | 2021-06-29 | 郑州云海信息技术有限公司 | 一种存储系统的双控方法、装置及可读存储介质 |
CN107918570B (zh) * | 2017-10-20 | 2021-07-23 | 杭州沃趣科技股份有限公司 | 一种双活系统共享仲裁逻辑盘的方法 |
CN109495312B (zh) * | 2018-12-05 | 2020-01-17 | 广州鼎甲计算机科技有限公司 | 基于仲裁盘和双链路的高可用集群的实现方法和系统 |
CN109901954B (zh) * | 2019-02-25 | 2022-08-16 | 浙江大华技术股份有限公司 | 存储设备和资源管理方法 |
CN110442094B (zh) * | 2019-07-26 | 2021-05-07 | 新华三大数据技术有限公司 | 一种分布式系统仲裁方法及装置 |
CN111737063B (zh) * | 2020-05-20 | 2023-11-14 | 山东鲸鲨信息技术有限公司 | 双控脑裂的磁盘锁仲裁方法、装置、设备及介质 |
CN111986707B (zh) * | 2020-08-21 | 2021-12-21 | 苏州浪潮智能科技有限公司 | 一种磁盘链路异常处理测试方法及装置 |
CN114844809B (zh) * | 2022-04-18 | 2024-05-07 | 北京凝思软件股份有限公司 | 基于网络心跳和内核磁盘心跳的多因子仲裁方法、装置 |
CN116743550B (zh) * | 2023-08-11 | 2023-12-29 | 之江实验室 | 一种分布式存储集群的故障存储节点的处理方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103209095A (zh) * | 2013-03-13 | 2013-07-17 | 广东新支点技术服务有限公司 | 一种基于磁盘服务锁的裂脑预防的方法和装置 |
CN103970686A (zh) * | 2013-02-05 | 2014-08-06 | 鸿富锦精密工业(深圳)有限公司 | Gpu扩展卡及扩展方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102011106687A1 (de) * | 2011-07-06 | 2013-01-10 | Festo Ag & Co. Kg | Signalverarbeitungssystem und Verfahren zur Verarbeitung von Signalen in einem Busknoten |
-
2015
- 2015-07-08 CN CN201510398179.5A patent/CN105095125B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103970686A (zh) * | 2013-02-05 | 2014-08-06 | 鸿富锦精密工业(深圳)有限公司 | Gpu扩展卡及扩展方法 |
CN103209095A (zh) * | 2013-03-13 | 2013-07-17 | 广东新支点技术服务有限公司 | 一种基于磁盘服务锁的裂脑预防的方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN105095125A (zh) | 2015-11-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105095125B (zh) | 基于仲裁磁盘的高可用双控存储系统及其运行方法 | |
US9769259B2 (en) | Network storage systems having clustered RAIDs for improved redundancy and load balancing | |
US20180260123A1 (en) | SEPARATION OF DATA STORAGE MANAGEMENT ON STORAGE devices FROM LOCAL CONNECTIONS OF STORAGE DEVICES | |
CN105589776B (zh) | 一种故障定位方法及服务器 | |
CN104503965B (zh) | PostgreSQL高弹性的高可用及负载均衡实现方法 | |
US9189348B2 (en) | High availability database management system and database management method using same | |
CN110807064B (zh) | Rac分布式数据库集群系统中的数据恢复装置 | |
US20080281959A1 (en) | Managing addition and removal of nodes in a network | |
US20020078312A1 (en) | Support for single-node quorum in a two-node nodeset for a shared disk parallel file system | |
CN102880522A (zh) | 面向硬件故障的系统关键文件故障纠正方法及装置 | |
US11176020B2 (en) | Server status monitoring system and method using baseboard management controller | |
CN105975358A (zh) | 一种基于scsi设备的容错方法及系统 | |
US9063854B1 (en) | Systems and methods for cluster raid data consistency | |
CN106909307A (zh) | 一种管理双活存储阵列的方法及装置 | |
CN114116380A (zh) | 一种计算机软件故障监测系统 | |
US6480953B1 (en) | Method and apparatus for ensuring system configuration data structure coherency across multiple controllers in a data storage system | |
CN107729199A (zh) | 一种存储设备的硬盘检测方法和系统 | |
US9244868B2 (en) | Leased lock in active-active high availability DAS systems | |
CN105119765B (zh) | 一种智能处理故障体系架构 | |
US7529776B2 (en) | Multiple copy track stage recovery in a data storage system | |
CN116414661B (zh) | 分布式存储的固态硬盘处理方法和装置 | |
US8996908B1 (en) | Information system, host system and access control method | |
CN113342593B (zh) | 用以进行全快闪存储器阵列伺服器的高可用性管理的方法与设备 | |
CN107229539A (zh) | 一种用于磁盘镜像高可用集群diskless的处理方法和系统 | |
CN114416501A (zh) | 一种存储双活及测试系统和方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20170818 Address after: 100192, A01, room 10, block 8, science and technology wealth center, A, clear road, Haidian District, Beijing Applicant after: Beijing TEAMSUN Software Technology Co., Ltd. Address before: 100192, Beijing, Haidian District School Road 8 (Science and technology wealth center), A block, 2 floor Applicant before: Beijing Fortunet Information Technology Co.,Ltd. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |