CN101916217A - 多控制器切换的方法、控制装置及系统 - Google Patents

多控制器切换的方法、控制装置及系统 Download PDF

Info

Publication number
CN101916217A
CN101916217A CN2010102463160A CN201010246316A CN101916217A CN 101916217 A CN101916217 A CN 101916217A CN 2010102463160 A CN2010102463160 A CN 2010102463160A CN 201010246316 A CN201010246316 A CN 201010246316A CN 101916217 A CN101916217 A CN 101916217A
Authority
CN
China
Prior art keywords
controller
mobility controls
mobility
controls
fault
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2010102463160A
Other languages
English (en)
Other versions
CN101916217B (zh
Inventor
雷婷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN201010246316.0A priority Critical patent/CN101916217B/zh
Publication of CN101916217A publication Critical patent/CN101916217A/zh
Application granted granted Critical
Publication of CN101916217B publication Critical patent/CN101916217B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Hardware Redundancy (AREA)
  • Stored Programmes (AREA)

Abstract

本发明涉及一种多控制器切换的系统,包括:至少两个活动控制器及至少一个备控制器;其中活动控制器用于监测所有活动控制器的状态,根据所有活动控制器的状态,判断是否有活动控制器发生故障,当判断有活动控制器发生故障、且不是本活动控制器发生故障时,则抢占硬件锁,并将抢占成功的活动控制器更新为主控制器,主控制器则根据故障转移预定策略选择备控制器,将备控制器替换发生故障的活动控制器。本发明还提出了一种多控制器切换的方法及控制装置。本发明通过多个活动控制器进行并行处理命令请求。一旦监测到有活动控制器发生故障,则及时地对其进行更换。不但提高了系统管理磁盘阵列的效率,而且还保证了系统管理磁盘阵列的稳定性。

Description

多控制器切换的方法、控制装置及系统
技术领域
本发明涉及存储技术领域,特别涉及一种多控制器切换的方法、控制装置及系统。
背景技术
磁盘阵列(Redundant Arry of Inexpensive,RAID)作为一种安全可靠的数据存储备份方式,在许多企业中被大量采用。但是,考虑磁盘阵列本身可能存在的安全性问题,则需要对其本身进行管理维护。
现有的磁盘阵列管理一般包括单控管理、双控管理及多控管理三种。其中,单控管理方式中磁盘阵列仅由一个控制器管理,虽然管理起来方便简单,但是当控制器出现故障时,将给整个系统造成严重影响。双控管理方式中磁盘阵列由两个控制器管理,一个控制器为主控制器,另外一个为备控制器。当主控制器出现故障时,将主控制器与备控制器进行切换。虽然一定程度提高了系统的可靠性和性能,但是当主控制器及备控制器同时出现故障时,却无法及时地恢复系统的正常运行。多控管理方式用于高端的大型的磁盘阵列管理,虽然可以通过多个控制器对磁盘阵列进行管理,但是如何通过多个控制器的配置和切换来进一步改变系统性能和可靠性成了一个亟待解决的问题。
发明内容
本发明的主要目的是提供一种多控制器切换方法、控制装置及系统,旨在提高管理磁盘阵列的效率及稳定性。
本发明提供了一种多控制器切换的系统,多控制器包括主控制器、从控制器及至少一个备控制器,其中所述主控制器、从控制器均为活动控制器,活动控制器与备控制器均用于管理磁盘阵列;所述活动控制器包括控制装置,所述控制装置进一步包括:
心跳监测模块,用于分别监测所有活动控制器的状态;
故障转移判断模块,用于根据所有活动控制器的状态,判断是否有活动控制器发生故障,当判断有活动控制器发生故障时,再判断是否为本活动控制器发生故障;
抢占模块,用于当不是本活动控制器发生故障时,则抢占硬件锁,并将抢占成功的活动控制器更新为主控制器;
切换模块,用于当本活动控制器抢占成功时,根据故障转移预定策略选择备控制器,将所述备控制器替换发生故障的活动控制器。
优选地,上述抢占模块还用于将抢占失败的活动控制器更新为从控制器,并等待主控制器唤醒。
优选地,上述控制装置还包括:
状态切换模块,用于当本活动控制器抢占结束后,更新本活动控制器的状态;还用于当是本活动控制器发生故障时,则更新所述发生故障的活动控制器的状态。
优选地,上述切换模块还包括:
控制单元,用于当本活动控制器抢占成功时,关闭发生故障的活动控制器;还用于唤醒从控制器继续工作,并更新系统的状态;
故障转移替换单元,用于当本活动控制器抢占成功时,根据故障转移预定策略选择备控制器,将发生故障的活动控制器的数据备份至所述备控制器,将备份好数据的备控制器替换发生故障的活动控制器。
优选地,上述控制装置还包括:
故障恢复判断模块,用于根据所有活动控制器的状态,判断是否有发生故障的活动控制器已恢复正常,是则判断是否为本活动控制器发生故障恢复;当判断不是本活动控制器发生故障恢复时,则判断本活动控制器是否为主控制器;
所述切换模块还包括:
故障恢复替换单元,用于当判断本活动控制器为主控制器时,根据故障恢复预定策略对故障恢复的活动控制器替换为从控制器或者保留为备控制器。
优选地,上述状态切换模块,还用于当判断是本活动活动控制器发生故障恢复时,更新所述发生故障恢复的活动控制器的状态,并等待主控制器替换或保留;还用于当判断不是本活动控制发生故障恢复时,更新本活动控制器的状态。
优选地,上述故障恢复判断模块还用于当判断本活动控制器不是主控制器时,则判断本活动控制器是否被替换;
所述故障恢复替换单元还用于当判断本活动控制器需要被替换时,则将本活动控制器的数据备份至故障恢复的活动控制器,将本活动控制器更新为备控制器;当判断本活动控制器不需要被替换时,则将故障恢复的活动控制器更新为备控制器。
本发明还提供了一种多控制器切换的控制装置,包括:
心跳监测模块,用于分别监测所有活动控制器的状态;
故障转移判断模块,用于根据所有活动控制器的状态,判断是否有活动控制器发生故障,当判断有活动控制器发生故障时,再判断是否为本活动控制器发生故障;
抢占模块,用于当不是本活动控制器发生故障时,则抢占硬件锁,并将抢占成功的活动控制器更新为主控制器;
切换模块,用于当本活动控制器抢占成功时,根据故障转移预定策略选择备控制器,将所述备控制器替换发生故障的活动控制器。
优选地,上述控制装置还包括:
故障恢复判断模块,用于根据所有活动控制器的状态,判断是否有发生故障的活动控制器已恢复正常,是则判断是否为本活动控制器发生故障恢复;当判断不是本活动控制器发生故障恢复时,则判断本活动控制器是否为主控制器;
所述切换模块还包括:
故障恢复替换单元,用于当判断本活动控制器为主控制器时,根据故障恢复预定策略对故障恢复的活动控制器替换为从控制器或者保留为备控制器。
优选地,上述故障恢复判断模块还用于当判断本活动控制器不是主控制器时,则判断本活动控制器是否被替换;
所述故障恢复替换单元还用于当判断本活动控制器需要被替换时,则将本活动控制器的数据备份至故障恢复的活动控制器,将本活动控制器更新为备控制器;当判断本活动控制器不需要被替换时,则将故障恢复的活动控制器更新为备控制器。
本发明又提供了一种多控制器切换的方法,多控制器包括主控制器、从控制器及至少一个备控制器,其中所述主控制器、从控制器均为活动控制器,包括以下步骤:
活动控制器分别监测所有活动控制器的状态;
根据所有活动控制器的状态,判断是否有活动控制器发生故障,当判断有活动控制器发生故障时,再判断是否为本活动控制器发生故障;
当不是本活动控制器发生故障时,则抢占硬件锁,并将抢占成功的活动控制器更新为主控制器;
主控制器根据故障转移预定策略选择备控制器,将所述备控制器替换发生故障的活动控制器。
优选地,上述当不是本活动控制器发生故障时,则抢占硬件锁之后还包括:
将抢占失败的活动控制器更新为从控制器,并更新所述从控制器的状态,等待主控制器唤醒。
优选地,上述判断是否为本活动控制器发生故障之后还包括:
当是本活动控制器发生故障时,则更新所述发生故障的活动控制器的状态。
优选地,上述将抢占成功的活动控制器更新为主控制器之后还包括:
主控制器更新系统的状态。
优选地,上述主控制器根据故障转移预定策略选择备控制器,替换发生故障的活动控制器的步骤具体为:
主控制器关闭发生故障的活动控制器;
根据故障转移预定策略选择备控制器,将发生故障的活动控制器的数据备份至所述备控制器;
将备份好数据的备控制器替换发生故障的活动控制器。
优选地,上述主控制器根据故障转移预定策略选择备控制器,替换发生故障的活动控制器之后还包括:
主控制器唤醒所有没发生故障的从控制器继续工作,并更新系统状态。
优选地,上述主控制器根据故障转移预定策略选择备控制器,将备控制器替换发生故障的活动控制器的步骤之后还包括:
活动控制器分别监测所有活动控制器的状态;
根据所有活动控制器的状态,判断是否有活动控制器发生故障恢复,当判断有活动控制器发生故障恢复时,判断是否为本活动控制器发生故障恢复;当判断不是本活动控制发生故障恢复时,则判断本活动控制器是否为主控制器;
当判断本活动控制器为主控制器时,则根据故障恢复预定策略将恢复故障的活动控制器替换为从控制器或者保留为备控制器。
优选地,上述判断是否为本活动控制器发生故障恢复之后还包括:
当判断是本活动活动控制器发生故障恢复时,更新所述发生故障恢复的活动控制器的状态,并等待主控制器替换或保留;
当判断不是本活动控制发生故障恢复时,更新本活动控制器的状态。
优选地,上述判断本活动控制器是否为主控制器之后还包括:
当判断本活动控制器不是主控制器时,则判断本活动控制器是否被替换;
当判断本活动控制器需要被替换时,则将本活动控制器的数据备份至故障恢复的活动控制器,并将本活动控制器更新为备控制器;或
当判断本活动控制器不需要被替换时,则将故障恢复的活动控制器更新为备控制器。
优选地,上述当判断本活动控制器为主控制器时,则根据故障恢复预定策略将恢复故障的活动控制器替换为从控制器或者保留为备控制器之后还包括:
主控制器唤醒所有的从控制器继续工作,并更新系统的状态。
本发明多控制器切换的方法、控制装置及系统,通过多个活动控制器进行并行工作,且可以同时处理命令请求。一旦监测到有活动控制器发生故障或故障恢复,则及时地对其进行更换或者故障恢复处理。不但提高了系统管理磁盘阵列的效率,而且还保证了系统管理磁盘阵列的稳定性。
附图说明
图1是本发明多控制器切换的系统一实施例的结构示意图;
图2是本发明的控制装置一实施例的结构示意图;
图3是本发明多控制器切换的活动控制器的状态转移示意图
图4是本发明的控制装置一实施例中切换模块的结构示意图;
图5是本发明的控制装置一实施例中系统的状态转换示意图;
图6是本发明多控制器切换的系统进行故障转移处理前的结构示意图;
图7是本发明多控制器切换的系统进行故障转移处理后的结构示意图;
图8是本发明多控制器切换的控制装置另一实施例的结构示意图;
图9是上述实施例中切换模块的结构示意图;
图10是是本发明多控制器切换的系统进行故障恢复处理后的结构示意图;
图11是本发明多控制器切换的方法一实施例的流程示意图;
图12是上述实施例主控制器根据故障转移预定策略选择备控制器,并将该备控制器替换发生故障的活动控制器的步骤的流程示意图;
图13是本发明多控制器切换的方法另一实施例的流程示意图;
图14是本发明多控制器切换的方法另一实施例中主控制器进行故障恢复处理的步骤的流程示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
图1是本发明多控制器切换的系统一实施例的结构示意图。
本实施例多控制器切换的系统包括:
一主控制器(Master-Controller)101,用于控制所有从控制器102进行协同工作。
至少一从控制器(Slave-Controller)102,用于接收用户的配置命令进行处理,并根据主控制器101的控制进行协同工作。
至少一备控制器103(Standby-Controller),备控制器103与主控制器101、从控制器102保持连接,用于当主控制器101、从控制器102发生故障时对其进行数据的备份,并代替其处理用户的配置命令。
上述从控制器102及备控制器103可以为多个。从控制器102越多,多控制器切换的系统的性能越好;备控制器103越多,多控制器切换的系统的稳定性越高;而从控制器102及备控制器103的个数越多,相应的成本也越大。因此,从控制器102及备控制器103个数可以根据成本和系统性能、稳定性的综合考虑而选择,在此不做限定。
上述主控制器101及从控制器102均为活动控制器,用于接收用户的配置命令进行磁盘阵列104的管理。任何一个活动控制器均可以成为主控制器101。每次多控制器切换的系统启动时,最先启动的活动控制器将成为主控制器101,其他的则为从控制器102。若多个活动控制器同时启动,则选择配置文件时间戳最新的活动控制器为主控制器101,其他的则为从控制器102。主控制器101与从控制器102通过控制器间切换通道106(Switch inter-Controller Channel,SCC)连接。活动控制器与备控制器103通过控制器间备份通道107(Backup inter-Controller Channel,BCC)连接。为了保证控制器进行切换后各控制器之间的通讯仍然可以正常地运行,则SCC106和BCC107可以是同一条物理通道,也可以是两条互为冗余的物理通道。
上述主控制器101、从控制器102及备控制器103在多控制器切换的系统中的位置并不是固定的。例如,本次启动多控制器切换的系统时,一控制器可能为主控制器101或从控制器102,而下次启动多控制器切换的系统时,该控制器可能又成为备控制器103。在多控制器切换的系统每次启动前,可以由用户分配活动控制器及备控制器103;而且分配活动控制器与备控制器103的对应关系。也可以在多控制器切换的系统每次启动时,都按照系统默认的分配。
本实施例多控制器切换的系统用于对磁盘阵列104进行管理。主控制器101、从控制器102、备控制器103分别通过光纤通道(Fiber Channel,FC)或者串行连接SCSI(Serial Attached SCSI,SAS)105与磁盘阵列104连接,用于对磁盘阵列104进行管理。
本实施例多控制器切换的系统中,主控制器101、从控制器102可以分别监测所有活动控制器的状态;当监测到有活动控制器发生故障时,再判断是否为自身发生故障;判断不是自身发生故障的活动控制器则分别进行抢占硬件锁,抢占成功的活动控制器(即主控制器101)选择一备控制器103替换发生故障的活动控制器。
当主控制器101、从控制器102监测到发生故障的活动控制器已经恢复正常时,则主控制器101根据故障恢复预定策略对故障恢复的活动控制器替换为从控制器或者保留为备控制器。
因为主控制器101及从控制器102都是并行工作,且可以同时处理命令请求,一旦监测到有活动控制器发生故障,则及时地对其进行更换。而且当发生故障的活动控制器恢复正常时,则及时地对其进行故障恢复处理。所以用户在使用过程中时,几乎感觉不到该处理过程。
综上所述,本实施例多控制器切换的系统,通过多个活动控制器进行并行工作,且可以同时处理命令请求,一旦监测到有活动控制器发生故障,则及时地对其进行更换,提高了多控制器切换的系统管理磁盘阵列的效率及稳定性。
图2是本发明的控制装置一实施例的结构示意图。
本实施例的控制装置设置在活动控制器上。在此需要说明的是,上述实施例的多控制器切换的系统中主控制器101、从控制器102均为活动控制器。且活动控制器及备控制器103均用于管理磁盘阵列104。当然,为了实施本发明中备控制器103替换发生故障的活动控制器后,也具有活动控制器的功能,则备控制器103上也设置该控制装置。
本实施例控制装置包括:
心跳监测模块10,用于监测所有活动控制器的状态;
故障转移判断模块20,用于根据所有活动控制器的状态,判断是否有活动控制器发生故障,当判断有活动控制器发生故障时,再判断是否为本活动控制器发生故障;
抢占模块30,用于当不是本活动控制器发生故障时,则抢占硬件锁,并将抢占成功的活动控制器更新为主控制器101;还用于将抢占失败的活动控制器更新为从控制器,并等待主控制器101唤醒;
切换模块40,用于当本活动控制器抢占成功时,根据故障转移预定策略选择备控制器103,替换发生故障的活动控制器。
上述控制装置还包括:
状态切换模块50,用于当本活动控制器抢占结束后,更新本活动控制器的状态;还用于当是本活动控制器发生故障时,则更新所述发生故障的活动控制器的状态。
参照图3,为活动控制器的状态转换示意图。
活动控制器可以包括以下几种状态:
启动中(Booting):表示活动控制器正在启动中;Booting状态结束后,如果正常则转变为Ok状态,如果有故障则转变为Failed状态;
正常(Ok):表示活动控制器正常工作;处于Ok状态的活动控制器如果出现故障则转变为Failover状态;
故障(Failed):表示活动控制器已经发生故障;处于Failed状态的活动控制器如果恢复正常则转换为Failback状态;
故障转移中(Failover):表示活动控制器出现故障,正在做故障转移处理;故障转移处理结束后转变为Failed状态;
故障恢复(Failback):表示发生故障的活动控制器恢复正常,正在做故障恢复处理;故障恢复处理结束后根据预定的策略转变为Standby状态或者Ok状态;
备用(Standby):表示活动控制器处于备用状态;如果处于备用状态、且被主控制器选择来替换故障控制器,则转变为Ok状态。
当活动控制器发生故障时,则发生故障的活动控制器的状态由正常转变为故障。此时,故障转移判断模块20将监测到有活动控制器发生故障,则判断是否为本活动控制器发生故障。当判断是本活动控制器发生故障时,则将其状态由故障转变为故障转移,并进行故障转移处理(例如,暂停业务处理),等待被主控制器101关闭。
上述抢占模块30中,硬件锁用于保证主控制器101有且仅有一个。当判断有活动控制器发生故障时,所有没发生故障的活动控制器均进行硬件锁的抢占,而且仅有一个活动控制器能抢占成功。当判断不是本活动控制器发生故障,其抢占模块30则进行抢占硬件锁。抢占成功,则将该活动控制器更新为主控制器101;抢占失败,则将该活动控制器更新为从控制器102,并等待主控制器101唤醒。
参照图4、上述切换模块40进一步包括:
控制单元41,用于当本活动控制器抢占成功时,关闭发生故障的活动控制器;
故障转移替换单元42,用于当本活动控制器抢占成功时,根据故障转移预定策略选择备控制器103,将发生故障的活动控制器的数据备份至备控制器103,并将备份好数据的备控制器103替换发生故障的活动控制器。
该故障转移预定策略可以为用户预先指定或多控制器切换的系统默认的活动控制器及备控制器103之间的对应关系。如果没有用户预先制定,则对备控制器进行编号,选择编号最靠前的备份控制器。主控制器101根据从控制器102及备控制器103之间的对应关系,选取与发生故障的活动控制器对应的备控制器103,通过BCC107将发生故障的活动控制器的配置信息等数据备份至该备控制器103。则该备控制器103更新为从控制器102,而发生故障的活动控制器则停止处理用户配置的命令,等待故障被恢复。
上述控制单元41还用于当故障转移处理完后,唤醒没有发生故障的活动控制器继续工作,并更新系统的状态。
参照图5,为系统的状态转换示意图。
系统状态是各活动控制器的状态的综合,可以包括以下几种状态:
启动中(Booting):表示系统正在启动中,系统没有正在运行的控制器,有1个或者1个以上控制器正在启动;
正常(Ok):表示系统正常工作,系统内所有活动控制器都正常工作;
降级(Degraded):表示系统处于降级工作,系统有活动控制器故障且没有相应的备控制器进行替换,活动控制器数量减少;
故障转移中(Failover):表示有某个活动控制器出现故障并处于Failover状态,系统正在做故障转移相关处理;
故障恢复(Failback):表示有某个故障控制器恢复正常并处于Failback状态,系统正在做故障恢复相关处理;
故障(Failed):表示系统故障,系统没有正常工作的活动控制器。
因为多控制器切换的系统中的主控制器101与从控制器102均为活动控制器,从而主控制器01及从控制器102可以进行并行工作,并同时处理命令请求,一旦监测到有活动控制器发生故障,则分别进行相应的故障转移处理,而且主控制器根据故障转移预定策略选择备控制器,进行发生故障的活动控制器的替换,进一步提高了多控制器切换的系统管理磁盘阵列的效率及稳定性。
图6、图7分别是本发明多控制器切换的系统进行故障转移处理前后的结构示意图。
如图6所示,多控制器切换的系统包括:主控制器101、多个从控制器102a~1012d及多个备控制器103a~103d。以从控制器102b发生故障为例。主控制器101、从控制器102a、从控制器102c、从控制器102d均监测到有活动控制器发生故障,且均判断不是自身的活动控制器发生故障,则均进行硬件锁的抢占。结果主控制器101抢占成功,仍然为主控制器101。于是,抢占成功后的主控制器101根据故障转移预定策略从备控制器103a~103d中选取一备控制器(例如备控制器103a),先将从控制器102b的数据备份至备控制器103a,再将备份好数据的备控制器103a替换从控制器102b,成为新的从控制器102e,如图7所示。
图8是本发明控制装置另一实施例的结构示意图。
本实施例的控制装置设置在活动控制器上。在此需要说明的是,上述实施例的多控制器切换的系统中主控制器101、从控制器102均为活动控制器。且活动控制器及备控制器103均用于管理磁盘阵列104。当然,为了实施本发明中备控制器103替换发生故障的活动控制器后,也具有活动控制器的功能,则备控制器103上也设置该控制装置。
在上述实施例的基础上,本实施例的多控制器切换的活动控制器还包括:
故障恢复判断模块60,用于根据所有活动控制器的连接状态,判断是否有活动控制器发生故障恢复,当判断有活动控制器发生故障恢复时,判断是否为本活动控制器发生故障恢复;当判断不是本活动控制器发生故障恢复时,则判断本活动控制器是否为主控制器101。
参照图9,对应的切换模块40还包括:
故障恢复替换单元43,用于当判断本活动控制器为主控制器101时,根据故障恢复预定策略对恢复故障的活动控制器进行故障恢复处理。
该故障恢复预定策略可以为用户预先指定或磁盘阵列管理系统默认的选择策略。主控制器101根据故障恢复预定策略选择一活动控制器,所选择的活动控制器为原先替换发生故障的活动控制器的备控制器103。主控制器101通过BCC107将所选择的活动控制器的配置信息等数据备份至该故障恢复的活动控制器。
上述状态切换模块50,还用于当判断是本活动活动控制器发生故障恢复时,更新所述发生故障恢复的活动控制器的状态,并等待主控制器替换或保留;还用于当判断不是本活动控制发生故障恢复时,更新本活动控制器的状态。
上述故障恢复判断模块60还用于当判断本活动控制器不是主控制器101时,则判断本活动控制器是否被替换。
上述故障恢复替换单元43还用于当判断本活动控制器需要被替换时,则将本活动控制器的数据备份至故障恢复的活动控制器,并将本活动控制器更新为备控制器103;当判断本活动控制器不需要被替换时,则将故障恢复的活动控制器更新为备控制器103。
上述控制单元41还用于当故障恢复处理完后,唤醒所有的从控制器继续工作,并更新系统的状态。
多控制器切换的系统中的主控制器101与从控制器102均包括上述多控制器切换的装置,不但实现了活动控制器发生故障时活动控制器与备控制器之间的替换,而且还实现了活动控制器发生故障恢复时,及时地进行故障恢复处理,进一步提高了多控制器切换的系统管理磁盘阵列的效率及稳定性,还使得多控制器切换的系统实现的功能更加完善。
如图7所示,上述实施例中经过故障转移处理后的多控制器切换的系统包括:主控制器101、多个从控制器102a~1012e及多个备控制器103b~102d。其中,从控制器102b为发生故障的活动控制器,且该从控制器102b的命令处理工作由备控制器103a(即故障转移后的从控制器102e)处理。当发生故障的从控制器102b恢复正常后,则该从控制器102b的连接状态将由故障转变为故障恢复。
主控制器101及其他的从控制器102a~1012e均监测到有活动控制器发生故障恢复。其中,主控制器101判断不是自身的活动控制器发生故障恢复,而且判断自身为主控制器。而从控制器102a、从控制器102c、从控制器102d、从控制器102e均判断不是自身的活动控制器发生故障恢复,且分别判断本活动控制器不是主控制器101,则再判断是否需要被替换。当需要被替换时,主控制器101则根据故障恢复预定策略选择从控制器102e,并将该从控制器102e的配置信息等数据备份至从控制器102b,备份结束后将从控制器102e更新为备控制器103a,如图6所示。当判断从控制器102b不需要被替换时,则将该从控制器102b更新为备控制器103a,如图10所示。
图11是本发明多控制器切换的方法一实施例的流程示意图。
本实施例多控制器切换的方法包括以下步骤:
步骤S10、活动控制器分别监测所有活动控制器的状态;
活动控制器通过心跳监测模块10对所有活动控制器的状态。例如,主控制器101分别监测自身与从控制器102的状态;从控制器102分别监测自身与主控制器101及其他从控制器102的状态。
步骤S11、根据所有活动控制器的状态,判断是否有活动控制器发生故障,当判断有活动控制器发生故障时,则转步骤S12;当判断没有活动控制器发生故障时,则转步骤S10;
活动控制器通过故障转移判断模块20根据所有活动控制器的状态,判断是否有活动控制器发生故障。
步骤S12、判断是否为本活动控制器发生故障;当是本活动控制器发生故障,则转步骤S13;当不是本活动控制器发生故障,则转步骤S14;
当任意一个活动控制器发生故障时,则发生故障的活动控制器的状态由正常转变为故障。此时,活动控制器的故障转移判断模块20则监测到有活动控制器发生故障,并判断是否为本活动控制器发生故障。
步骤S13、进行故障转移处理,等待主控制器101关闭;
当判断是本活动控制器发生故障时,则其状态由故障转变为故障转移,并进行故障转移处理(例如,暂停业务处理),等待主控制器101关闭。
步骤S14、抢占硬件锁,当抢占失败时,转步骤S15;当抢占成功时,转步骤S16;
当判断不是本活动控制器发生故障,抢占模块30则进行抢占硬件锁。
步骤S15、将本活动控制器更新为从控制器102,并更新该从控制器102的状态,等待主控制器101唤醒;
当本活动控制器的抢占硬件锁失败时,抢占模块30则将该活动控制器更新为从控制器102,并等待主控制器101唤醒,结束本流程。
步骤S16、将本活动控制器更新为主控制器101;
当本活动控制器的抢占硬件锁成功时,抢占模块30则将该活动控制器更新为主控制器101。
步骤S17、主控制器101根据故障转移预定策略选择备控制器103,并将该备控制器103替换发生故障的活动控制器。
当本活动控制器为主控制器101时,则切换模块40的故障转移替换单元42根据故障转移预定策略选择备控制器103,并将该备控制器103替换发生故障的活动控制器。
当故障转移处理完成后,主控制器101唤醒没有发生故障的从控制器102继续工作,并更新系统状态。
参照图12,步骤S17进一步包括:
步骤S17A、关闭发生故障的活动控制器;
步骤S17B、根据故障转移预定策略选择备控制器103,将发生故障的活动控制器的数据备份至备控制器103;
步骤S17C、将备份好数据的备控制器103替换发生故障的活动控制器。
主控制器101完成发生故障的活动控制器的替换工作后,唤醒没发生故障的从控制器102继续工作。此时,没发生故障的从控制器102将其连接状态由故障转移转变为正常,而发生故障的活动控制器将其状态由故障转移转变为故障。
本实施例多控制器切换的方法,使得多控制器中的每个活动控制器均可以同时监测所有活动控制器的状态,并根据所有活动控制器的状态,当多控制器中有活动控制器发生故障时进行及时地切换,提高了多控制器切换的系统管理磁盘阵列的效率及稳定性。
图13是本发明多控制器切换的方法另一实施例的流程示意图。
本实施例多控制器切换的方法与上一实施例的区别在于,上述步骤17之后还包括:
步骤S21、活动控制器分别监测所有活动控制器的状态;
上述实施例中,发生故障的活动控制器由备控制器103替换后,将被进行恢复故障处理。当发生故障的活动控制器恢复正常时,则其状态将由故障转变为故障恢复。主控制器101监测自身及所有从控制器102的状态;从控制器102监测自身、主控制器101及其他从控制器102的状态。
步骤S22、根据所有活动控制器的状态,判断是否有活动控制器发生故障恢复,当判断有任一活动控制器发生故障恢复时,则转步骤S23;否则转步骤S21;
当任意一个活动控制器发生故障恢复时,则发生故障恢复的活动控制器的状态由故障转变为故障恢复。此时,本活动控制器的故障恢复判断模块50则监测到有活动控制器发生故障恢复,并判断是否为本活动控制器发生故障。
步骤S23、判断是否为本活动控制器发生故障恢复;当判断不是本活动控制器发生故障恢复时,转步骤S24;当判断是本活动控制器发生故障恢复时,转步骤S26;
步骤S24、判断本活动控制器是否为主控制器101;当判断本活动控制器为主控制器101时,则转步骤S25;当判断本活动控制器不是主控制器101时,则转步骤S26;
当故障恢复判断模块50判断不是本活动控制器发生故障恢复时,更新本活动控制器的状态,再判断本活动控制器是否为主控制器101。
步骤S25、主控制器101根据故障恢复预定策略对恢复故障的活动控制器进行故障恢复处理。
当故障恢复判断模块50判断本活动控制器为主控制器101时,该活动控制器的故障恢复替换单元43根据故障恢复预定策略对恢复故障的活动控制器进行故障恢复处理。
步骤S26、等待主控制器101进行相应地处理。
当故障恢复判断模块50判断是本活动控制器发生故障恢复时,则进行相应的故障恢复处理(例如,初始化处理),并等待主控制器101通知是否需要替换。
当故障恢复判断模块50判断不是本活动控制器发生故障恢复,且判断本活动控制器不是主控制器101时,则本活动控制器为从控制器102。此时,该从控制器102进行的故障恢复处理存在两种情况。一种情况是该从控制器102为原先替换发生故障活动控制器的备控制器103,则该从控制器102等待主控制器101通知是否被替换。当主控制器101通知该从控制器102被替换时,则将该从控制器102的数据备份至故障恢复的活动控制器,并将该从控制器102更新为备控制器103;当主控制器101通知该从控制器102不被替换时,则将该从控制器102更新为备控制器103。另一种情况是该从控制器102不是原先替换发生故障活动控制器的备控制器103,则该从控制器102等待主控制器101唤醒。
参照图14、步骤S25进一步包括:
步骤S25A、判断故障恢复的活动控制器是否需要替换;当故障恢复的活动控制器不需要替换时,则转步骤S25B;当故障恢复的活动控制器需要替换时,则转步骤S25C;
步骤S25B、将故障恢复的活动控制器更新为备控制器103,转步骤S25E;
主控制器101判断故障恢复的活动控制器是否需要替换,该判断规则可以为用户预先设定,也可以为磁盘阵列管理系统默认的。
步骤S25C、根据故障恢复预定策略选择一从控制器;
该故障恢复预定策略可以为用户预先指定或多控制器切换的系统默认的选择策略。主控制器101根据故障恢复预定策略选择一活动控制器,所选择的活动控制器为原先替换发生故障的活动控制器的备控制器103。主控制器101通过BCC106将所选择的活动控制器的配置信息等数据备份至该故障恢复的活动控制器。
步骤S25D、将所选的从控制器的数据备份至故障恢复的活动控制器,并将所选择的活动控制器更新为备控制器103;转步骤S25E;
步骤S25E、唤醒所有的从控制器继续工作。
本实施例多控制器切换的方法,通过多个活动控制器并行工作,且可以同时处理命令请求,一旦监测到有活动控制器发生故障恢复,则及时地进行故障恢复处理。不但提高了多控制器切换的系统管理磁盘阵列的效率及稳定性,还使得多控制器切换的系统实现的功能更加完善。
以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (19)

1.一种多控制器切换的系统,其特征在于,所述多控制器包括主控制器、从控制器及至少一个备控制器,其中所述主控制器、从控制器均为活动控制器;所述活动控制器包括控制装置,所述控制装置进一步包括:
心跳监测模块,用于分别监测所有活动控制器的状态;
故障转移判断模块,用于根据所有活动控制器的状态,判断是否有活动控制器发生故障,当判断有活动控制器发生故障时,再判断是否为本活动控制器发生故障;
抢占模块,用于当不是本活动控制器发生故障时,则抢占硬件锁,并将抢占成功的活动控制器更新为主控制器;
切换模块,用于当本活动控制器抢占成功时,根据故障转移预定策略选择备控制器,将所述备控制器替换发生故障的活动控制器。
2.如权利要求1所述的多控制器切换的系统,其特征在于,所述抢占模块还用于将抢占失败的活动控制器更新为从控制器,并等待主控制器唤醒。
3.如权利要求1所述的多控制器切换的系统,其特征在于,所述控制装置还包括:
状态切换模块,用于当本活动控制器抢占结束后,更新本活动控制器的状态;还用于当是本活动控制器发生故障时,则更新所述发生故障的活动控制器的状态。
4.如权利要求1所述的多控制器切换的系统,其特征在于,所述切换模块还包括:
控制单元,用于当本活动控制器抢占成功时,关闭发生故障的活动控制器;还用于唤醒从控制器继续工作,并更新系统的状态;
故障转移替换单元,用于当本活动控制器抢占成功时,根据故障转移预定策略选择备控制器,将发生故障的活动控制器的数据备份至所述备控制器,将备份好数据的备控制器替换发生故障的活动控制器。
5.如权利要求1至4中任一项所述的多控制器切换的系统,其特征在于,所述控制装置还包括:
故障恢复判断模块,用于根据所有活动控制器的状态,判断是否有发生故障的活动控制器已恢复正常,是则判断是否为本活动控制器发生故障恢复;当判断不是本活动控制器发生故障恢复时,则判断本活动控制器是否为主控制器;
所述切换模块还包括:
故障恢复替换单元,用于当判断本活动控制器为主控制器时,根据故障恢复预定策略对故障恢复的活动控制器替换为从控制器或者保留为备控制器。
6.如权利要求5所述的多控制器切换的系统,其特征在于,所述状态切换模块,还用于当判断是本活动活动控制器发生故障恢复时,更新所述发生故障恢复的活动控制器的状态,并等待主控制器替换或保留;还用于当判断不是本活动控制发生故障恢复时,更新本活动控制器的状态。
7.如权利要求5所述的多控制器切换的系统,其特征在于,所述故障恢复判断模块还用于当判断本活动控制器不是主控制器时,则判断本活动控制器是否被替换;
所述故障恢复替换单元还用于当判断本活动控制器需要被替换时,则将本活动控制器的数据备份至故障恢复的活动控制器,将本活动控制器更新为备控制器;当判断本活动控制器不需要被替换时,则将故障恢复的活动控制器更新为备控制器。
8.一种多控制器切换的控制装置,其特征在于,包括:
心跳监测模块,用于分别监测所有活动控制器的状态;
故障转移判断模块,用于根据所有活动控制器的状态,判断是否有活动控制器发生故障,当判断有活动控制器发生故障时,再判断是否为本活动控制器发生故障;
抢占模块,用于当不是本活动控制器发生故障时,则抢占硬件锁,并将抢占成功的活动控制器更新为主控制器;
切换模块,用于当本活动控制器抢占成功时,根据故障转移预定策略选择备控制器,将所述备控制器替换发生故障的活动控制器。
9.如权利要求8所述的控制装置,其特征在于,还包括:
故障恢复判断模块,用于根据所有活动控制器的状态,判断是否有发生故障的活动控制器已恢复正常,是则判断是否为本活动控制器发生故障恢复;当判断不是本活动控制器发生故障恢复时,则判断本活动控制器是否为主控制器;
所述切换模块还包括:
故障恢复替换单元,用于当判断本活动控制器为主控制器时,根据故障恢复预定策略对故障恢复的活动控制器替换为从控制器或者保留为备控制器。
10.如权利要求9所述的控制装置,其特征在于,所述故障恢复判断模块还用于当判断本活动控制器不是主控制器时,则判断本活动控制器是否被替换;
所述故障恢复替换单元还用于当判断本活动控制器需要被替换时,则将本活动控制器的数据备份至故障恢复的活动控制器,将本活动控制器更新为备控制器;当判断本活动控制器不需要被替换时,则将故障恢复的活动控制器更新为备控制器。
11.一种多控制器切换的方法,其特征在于,所述多控制器包括主控制器、从控制器及至少一个备控制器,其中所述主控制器、从控制器均为活动控制器,包括以下步骤:
活动控制器分别监测所有活动控制器的状态;
根据所有活动控制器的状态,判断是否有活动控制器发生故障,当判断有活动控制器发生故障时,再判断是否为本活动控制器发生故障;
当不是本活动控制器发生故障时,则抢占硬件锁,并将抢占成功的活动控制器更新为主控制器;
主控制器根据故障转移预定策略选择备控制器,将所述备控制器替换发生故障的活动控制器。
12.如权利要求11所述的多控制器切换的方法,其特征在于,所述当不是本活动控制器发生故障时,则抢占硬件锁之后还包括:
将抢占失败的活动控制器更新为从控制器,并更新所述从控制器的状态,等待主控制器唤醒。
13.如权利要求11所述的多控制器切换的方法,其特征在于,所述判断是否为本活动控制器发生故障之后还包括:
当是本活动控制器发生故障时,则更新所述发生故障的活动控制器的状态。
14.如权利要求11至13中任一项所述的多控制器切换的方法,其特征在于,所述主控制器根据故障转移预定策略选择备控制器,替换发生故障的活动控制器的步骤具体为:
主控制器关闭发生故障的活动控制器;
根据故障转移预定策略选择备控制器,将发生故障的活动控制器的数据备份至所述备控制器;
将备份好数据的备控制器替换发生故障的活动控制器。
15.如权利要求11至13中任一项所述的多控制器切换的方法,其特征在于,所述主控制器根据故障转移预定策略选择备控制器,替换发生故障的活动控制器之后还包括:
主控制器唤醒所有没发生故障的从控制器继续工作,并更新系统状态。
16.如权利要求11所述的多控制器切换的方法,其特征在于,所述主控制器根据故障转移预定策略选择备控制器,将备控制器替换发生故障的活动控制器的步骤之后还包括:
活动控制器分别监测所有活动控制器的状态;
根据所有活动控制器的状态,判断是否有活动控制器发生故障恢复,当判断有活动控制器发生故障恢复时,判断是否为本活动控制器发生故障恢复;当判断不是本活动控制发生故障恢复时,则判断本活动控制器是否为主控制器;
当判断本活动控制器为主控制器时,则根据故障恢复预定策略将恢复故障的活动控制器替换为从控制器或者保留为备控制器。
17.如权利要求11所述的多控制器切换的方法,其特征在于,所述判断是否为本活动控制器发生故障恢复之后还包括:
当判断是本活动活动控制器发生故障恢复时,更新所述发生故障恢复的活动控制器的状态,并等待主控制器替换或保留;
当判断不是本活动控制发生故障恢复时,更新本活动控制器的状态。
18.如权利要求11所述的多控制器切换的方法,其特征在于,所述判断本活动控制器是否为主控制器之后还包括:
当判断本活动控制器不是主控制器时,则判断本活动控制器是否被替换;
当判断本活动控制器需要被替换时,则将本活动控制器的数据备份至故障恢复的活动控制器,并将本活动控制器更新为备控制器;或
当判断本活动控制器不需要被替换时,则将故障恢复的活动控制器更新为备控制器。
19.如权利要求16至18中任一项所述的多控制器切换的方法,其特征在于,所述当判断本活动控制器为主控制器时,则根据故障恢复预定策略将恢复故障的活动控制器替换为从控制器或者保留为备控制器之后还包括:
主控制器唤醒所有的从控制器继续工作,并更新系统的状态。
CN201010246316.0A 2010-08-04 2010-08-04 多控制器切换的方法、控制装置及系统 Active CN101916217B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201010246316.0A CN101916217B (zh) 2010-08-04 2010-08-04 多控制器切换的方法、控制装置及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201010246316.0A CN101916217B (zh) 2010-08-04 2010-08-04 多控制器切换的方法、控制装置及系统

Publications (2)

Publication Number Publication Date
CN101916217A true CN101916217A (zh) 2010-12-15
CN101916217B CN101916217B (zh) 2014-08-13

Family

ID=43323734

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201010246316.0A Active CN101916217B (zh) 2010-08-04 2010-08-04 多控制器切换的方法、控制装置及系统

Country Status (1)

Country Link
CN (1) CN101916217B (zh)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103246219A (zh) * 2013-04-28 2013-08-14 付弦 一种控制方法及系统
CN103257908A (zh) * 2013-05-24 2013-08-21 浪潮电子信息产业股份有限公司 一种软硬件协同的多控制器磁盘阵列设计方法
CN103309286A (zh) * 2012-03-06 2013-09-18 北京联动天翼科技有限公司 用于多组锂电池组通讯级联的实现装置和方法
WO2014000430A1 (zh) * 2012-06-29 2014-01-03 华为技术有限公司 一种实现高可用集群的心跳服务的方法及装置
CN103914125A (zh) * 2013-01-06 2014-07-09 海尔集团公司 设备控制方法、设备控制装置、设备和设备控制系统
CN104793896A (zh) * 2015-02-04 2015-07-22 北京神州云科数据技术有限公司 一种双控设备的单双控切换方法及装置
CN105335101A (zh) * 2015-09-29 2016-02-17 浪潮(北京)电子信息产业有限公司 一种数据处理方法和系统
CN105786666A (zh) * 2016-02-05 2016-07-20 浪潮(北京)电子信息产业有限公司 一种用于多控制器存储系统的故障处理方法和系统
WO2016172926A1 (zh) * 2015-04-30 2016-11-03 华为技术有限公司 通信系统中的通信方法和设备及系统
CN106407043A (zh) * 2016-09-13 2017-02-15 郑州云海信息技术有限公司 一种多控制器缓存备份方法
CN107643988A (zh) * 2017-09-15 2018-01-30 郑州云海信息技术有限公司 一种具有失效切换机制的存储系统及存储方法
CN108508880A (zh) * 2017-02-27 2018-09-07 北京百度网讯科技有限公司 自动驾驶车辆控制器的实现方法及自动驾驶车辆控制器
CN109885016A (zh) * 2017-12-06 2019-06-14 富士迈半导体精密工业(上海)有限公司 半导体加工系统
CN110147081A (zh) * 2019-05-16 2019-08-20 北京国电智深控制技术有限公司 一种分散控制系统及其控制方法、计算机可读存储介质
CN111857061A (zh) * 2019-04-28 2020-10-30 北京国电智深控制技术有限公司 一种计算任务实现方法、装置及系统、存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5274554A (en) * 1991-02-01 1993-12-28 The Boeing Company Multiple-voting fault detection system for flight critical actuation control systems
CN1423197A (zh) * 2002-12-16 2003-06-11 华中科技大学 基于多tcp连接映像的高可用系统
WO2004095304A1 (en) * 2003-04-23 2004-11-04 Dot Hill Systems Corporation Network storage appliance with integrated redundant servers and storage controllers
CN101640688A (zh) * 2009-08-20 2010-02-03 中兴通讯股份有限公司 基于cdn的节点主备用控制器切换方法及cdn网络
CN101788939A (zh) * 2009-01-22 2010-07-28 中兴通讯股份有限公司 一种控制器状态监测装置及方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5274554A (en) * 1991-02-01 1993-12-28 The Boeing Company Multiple-voting fault detection system for flight critical actuation control systems
CN1423197A (zh) * 2002-12-16 2003-06-11 华中科技大学 基于多tcp连接映像的高可用系统
WO2004095304A1 (en) * 2003-04-23 2004-11-04 Dot Hill Systems Corporation Network storage appliance with integrated redundant servers and storage controllers
CN101788939A (zh) * 2009-01-22 2010-07-28 中兴通讯股份有限公司 一种控制器状态监测装置及方法
CN101640688A (zh) * 2009-08-20 2010-02-03 中兴通讯股份有限公司 基于cdn的节点主备用控制器切换方法及cdn网络

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103309286B (zh) * 2012-03-06 2016-02-24 北京联动天翼科技有限公司 一种应用用于多组锂电池组通讯级联的实现装置的用于多组锂电池组通讯级联的实现方法
CN103309286A (zh) * 2012-03-06 2013-09-18 北京联动天翼科技有限公司 用于多组锂电池组通讯级联的实现装置和方法
WO2014000430A1 (zh) * 2012-06-29 2014-01-03 华为技术有限公司 一种实现高可用集群的心跳服务的方法及装置
US9658912B2 (en) 2012-06-29 2017-05-23 Huawei Technologies Co., Ltd. Method and apparatus for implementing heartbeat service of high availability cluster
CN103914125A (zh) * 2013-01-06 2014-07-09 海尔集团公司 设备控制方法、设备控制装置、设备和设备控制系统
CN103246219A (zh) * 2013-04-28 2013-08-14 付弦 一种控制方法及系统
CN103246219B (zh) * 2013-04-28 2015-09-16 付弦 一种控制方法及系统
CN103257908A (zh) * 2013-05-24 2013-08-21 浪潮电子信息产业股份有限公司 一种软硬件协同的多控制器磁盘阵列设计方法
CN104793896B (zh) * 2015-02-04 2018-02-16 深圳神州数码云科数据技术有限公司 一种双控设备的单双控切换方法及装置
CN104793896A (zh) * 2015-02-04 2015-07-22 北京神州云科数据技术有限公司 一种双控设备的单双控切换方法及装置
CN106576108A (zh) * 2015-04-30 2017-04-19 华为技术有限公司 通信系统中的通信方法和设备及系统
WO2016172926A1 (zh) * 2015-04-30 2016-11-03 华为技术有限公司 通信系统中的通信方法和设备及系统
CN106576108B (zh) * 2015-04-30 2020-05-08 华为技术有限公司 通信系统中的通信方法和设备及系统
CN105335101A (zh) * 2015-09-29 2016-02-17 浪潮(北京)电子信息产业有限公司 一种数据处理方法和系统
CN105335101B (zh) * 2015-09-29 2018-11-20 浪潮(北京)电子信息产业有限公司 一种数据处理方法和系统
CN105786666A (zh) * 2016-02-05 2016-07-20 浪潮(北京)电子信息产业有限公司 一种用于多控制器存储系统的故障处理方法和系统
CN105786666B (zh) * 2016-02-05 2019-05-10 浪潮(北京)电子信息产业有限公司 一种用于多控制器存储系统的故障处理方法和系统
CN106407043A (zh) * 2016-09-13 2017-02-15 郑州云海信息技术有限公司 一种多控制器缓存备份方法
CN108508880A (zh) * 2017-02-27 2018-09-07 北京百度网讯科技有限公司 自动驾驶车辆控制器的实现方法及自动驾驶车辆控制器
CN107643988A (zh) * 2017-09-15 2018-01-30 郑州云海信息技术有限公司 一种具有失效切换机制的存储系统及存储方法
CN109885016A (zh) * 2017-12-06 2019-06-14 富士迈半导体精密工业(上海)有限公司 半导体加工系统
CN111857061A (zh) * 2019-04-28 2020-10-30 北京国电智深控制技术有限公司 一种计算任务实现方法、装置及系统、存储介质
CN110147081A (zh) * 2019-05-16 2019-08-20 北京国电智深控制技术有限公司 一种分散控制系统及其控制方法、计算机可读存储介质

Also Published As

Publication number Publication date
CN101916217B (zh) 2014-08-13

Similar Documents

Publication Publication Date Title
CN101916217B (zh) 多控制器切换的方法、控制装置及系统
KR100420266B1 (ko) 클러스터 컴퓨터 시스템의 소프트웨어 가용도 개선 방법및 그 장치
JP4659062B2 (ja) フェイルオーバ方法、プログラム、管理サーバおよびフェイルオーバシステム
JP5352115B2 (ja) ストレージシステム及びその監視条件変更方法
US8032786B2 (en) Information-processing equipment and system therefor with switching control for switchover operation
CN101594383B (zh) 一种双控制器存储系统的服务和控制器状态监控方法
WO2012085962A1 (en) Method for recharging a backup battery after power failure with minimal service disruption and corresponding storage apparatus
CN109471759B (zh) 一种基于sas双控设备的数据库故障切换方法及设备
CN100559749C (zh) 一种星上网络总线冗余备份的实现方法
CN103532753A (zh) 一种基于内存换页同步的双机热备方法
JP4491482B2 (ja) 障害回復方法、計算機、クラスタシステム、管理計算機及び障害回復プログラム
JP2012037969A (ja) ストレージシステム、制御装置および制御方法
WO2004104845A1 (ja) ストレージシステム
CN102508746A (zh) 一种用于三机变结构容错计算机系统管理方法
WO2006005251A1 (fr) Procede et systeme de realisation de la fonction de commutation dans un systeme de communication
CN100496030C (zh) 基于高可用性系统的综合接入媒体网关设备
JP2001216204A (ja) 記憶制御装置
CN114337944B (zh) 一种系统级主备冗余通用控制方法
CN112468328A (zh) 一种基于交换式拓扑的双余度fc-ae-1553网络重构方法
JP2005055995A (ja) ストレージ制御方法、および、冗長化機能を有するサーバシステム
JP2012014674A (ja) 仮想環境における故障復旧方法及びサーバ及びプログラム
JP2012014673A (ja) クラスタシステム復旧方法及びサーバ及びプログラム
JP2002136000A (ja) 無停電電源システム
JPH08185330A (ja) 冗長コンピュータシステム切り替え方法
CN100499387C (zh) 一种通信系统中单板的n+1备份的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant