CN1776638A - 将存储卷从故障系统重新分配到完好系统的方法和系统 - Google Patents

将存储卷从故障系统重新分配到完好系统的方法和系统 Download PDF

Info

Publication number
CN1776638A
CN1776638A CNA2005101151480A CN200510115148A CN1776638A CN 1776638 A CN1776638 A CN 1776638A CN A2005101151480 A CNA2005101151480 A CN A2005101151480A CN 200510115148 A CN200510115148 A CN 200510115148A CN 1776638 A CN1776638 A CN 1776638A
Authority
CN
China
Prior art keywords
equipment group
memory device
main frame
disposal system
unit checks
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2005101151480A
Other languages
English (en)
Other versions
CN100388222C (zh
Inventor
M·J·卡洛斯
D·F·小里迪
R·A·利普博格
H·M·尤登弗兰德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN1776638A publication Critical patent/CN1776638A/zh
Application granted granted Critical
Publication of CN100388222C publication Critical patent/CN100388222C/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2089Redundant storage control functionality
    • G06F11/2092Techniques of failing over between control units

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Hardware Redundancy (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种用于将存储卷从故障处理系统重新分配到完好处理系统的方法、系统和程序。第一处理系统检测第二处理系统的故障。所述第一处理系统确定由所述出现故障的第二处理系统管理的存储设备的设备组并为每个确定的设备组确定连接到所述设备组中的存储设备的主机。所述第一处理系统通过所述确定的主机连接到其的所述设备组中的一个存储设备为每个设备组将单元检验发送到指示每个设备组的故障的每个确定的主机。所述确定的主机执行指令以终止在所述设备组中的所述存储设备上正在进行的任何I/O操作以响应指示所述设备组中的一个存储设备的故障的所述单元检验,并向所述设备组的一个存储设备发出命令以结束忙碌状况。

Description

将存储卷从故障系统重新分配到完好系统的方法和系统
技术领域
本发明涉及将存储卷从故障处理系统重新分配到完好处理系统。
背景技术
在某些计算环境中,多个主机系统可以与诸如IBM Enterprise StorageServer(ESS)之类的一个或多个控制单元通信以访问由接收请求的ESS管理的存储设备中的数据。所述控制单元通过一个或多个逻辑路径来管理对诸如互连的硬盘驱动器之类的存储设备的访问。(IBM和ESS是IBM的注册商标)。所述互连的驱动器可以被配置为直接访问存储设备(DASD)、独立磁盘冗余阵列(RAID)、完全磁盘束(JBOD)等。
通常,由控制单元管理的存储系统包括大量互连的硬盘驱动器,从这些硬盘驱动器,卷被配置以供主机使用。存储设备可以被配置为一个或多个阵列(如RAID阵列),并且阵列存储空间然后被分配给卷。
某些控制单元包括双重处理复合体或系统,每个复合体或系统管理对不同逻辑控制单元组的访问,其中每个逻辑控制单元被分配多个存储卷(如逻辑卷)。如果一个处理复合体出现故障,则分配给出现故障的处理复合体的逻辑控制单元将被重新分配给完好的处理复合体。作为此故障转移的一部分,完好的处理器将单元检验状况发送到主机被连接到其的每个存储设备的每个主机以警告它们所述故障,以便所述主机可以重新驱动任何挂起的输入/输出(I/O)请求。由于控制单元允许主机连接到数量不断增加的存储卷,所以主机可能必须消耗相当多的计算资源来处理作为故障转移到主机被连接到其的存储设备(卷)的一部分接收的单元检验。
发明内容
本发明提供了一种用于将存储卷从故障处理系统重新分配到完好处理系统的方法、系统和程序。第一处理系统检测第二处理系统的故障。所述第一处理系统确定由所述出现故障的第二处理系统管理的存储设备的设备组并为每个确定的设备组确定连接到所述设备组中的存储设备的主机。所述第一处理系统通过所述确定的主机连接到其的所述设备组中的一个存储设备为每个设备组将单元检验发送到指示每个设备组的故障的每个确定的主机。所述确定的主机执行指令以终止在所述设备组中的所述存储设备上正在进行的任何I/O操作以响应指示所述设备组中的一个存储设备的故障的所述单元检验,并向所述设备组的一个存储设备发出命令以结束忙碌状况。
附图说明
图1示出了计算环境的实施例;
图2示出了连接信息的实施例;
图3示出了显示分配给逻辑控制单元的存储设备(卷)的信息的实施例;
图4示出了为指示单元检验忙碌状况的主机维护的信息的实施例;
图5、6和7示出了处理在控制单元中的某个处理系统处的故障转移的操作的实施例。
具体实施方式
图1示出了其中实现本发明的各方面的计算环境的实施例。一个或多个主机2(仅示出了一个)包括处理器4、存储器6以及用于处理来自应用的I/O请求的操作系统8。操作系统8通过通道子系统12将I/O请求传送到控制单元10,通道子系统12提供了多个到控制单元10系统配置有的逻辑控制单元14a、14b...14n的逻辑路径。通道子系统12管理延伸通过适配器18的逻辑路径16。适配器18提供了物理层,逻辑路径16通过该物理层延伸到控制单元10。通道子系统12可以进一步将多个逻辑路径16与路径组关联,其中路径组中的所有路径都可以被用来与控制单元10中配置的逻辑控制单元14a、14b...14n通信。
控制单元10包括两个处理系统20a、20b,每个处理系统都包括存储器22a、22b,存储器22a、22b具有I/O管理器24a、24b以管理来自主机2并指向存储系统28中的卷26a、26b...26n(即,逻辑卷、逻辑设备等)的I/O请求。处理系统20a、20b维护连接信息30a、30b以管理从主机2到卷26a、26b...26n的连接。主机2还维护与从主机2到存储卷26a、26b...26n的连接路径有关的连接信息32。变量“n”用来表示部件的整数实例,当与不同的部件一起使用时,可以表示不同的或相同的整数值。例如,14n和26n可以表示逻辑控制单元14n和卷26n的相同或不同编号。
图2示出了由所有处理系统(如处理系统20a、20b中的I/O管理器24a、24b)为主机-LCU(逻辑控制单元)对维护的连接信息,包括:涉及连接(即,路径组)的主机和LCU的主机标识符(ID)52和LCU标识符54;涉及连接的一个或多个连接路径56;概要忙碌状况58,其指示是否将忙碌返回给来自与标识的逻辑控制单元关联的存储设备上的已标识主机2的特定请求;以及概要单元检验状况60,其指示当与所述主机-LCU对关联的已标识主机通信时,对于与标识的逻辑控制单元14a、14b...14n关联的存储设备中的任何一个存储设备,特定单元检验状况被挂起。
图3示出了逻辑控制单元信息70,其包括逻辑控制单元标识符(LCUID)72和忙碌状况74,忙碌状况74指示是否将忙碌返回给来自发起到与逻辑控制单元关联的存储设备的请求的任何主机的任何请求。
图4示出了由I/O管理器24a、24b为存储设备维护的存储设备信息80,存储设备信息80包括存储设备标识符(ID)82以及标识的存储设备与任何主机2之间的一个或多个连接路径84。给定存储设备与给定主机具有的连接路径的集合可以被确定为存储设备连接路径84与图2中的主机-LCU连接路径56的交集(并非主机-LCU对的所有连接都可以应用于LCU上的每个设备)。在一个实施例中,只有具有到给定主机的连接的存储设备才被认为可以如以下描述的那样呈现概要单元检验状况。
图5和6示出了在I/O管理器24a、24b中实现并由处理系统20a、20b和主机通道子系统12执行以处理其中一个处理系统(例如20b)出现故障并且由出现故障的处理系统20b管理的设备组(即,逻辑控制单元14a、14b...14n)被重新分配到完好处理系统(例如20a)的情况的操作。任一处理系统20a、20b都可以执行完好的处理系统的操作。进而,被描述为由通道子系统12执行的操作可以由主操作系统8来执行。当完好的处理系统20a检测到(在方块100)处理系统20b的故障时,完好的处理系统20a的I/O管理器24a确定(在方块102)由出现故障的处理系统20b管理的存储设备(即,逻辑卷26a、26b...26n)的设备组(即,逻辑控制单元14a、14b...14n)。完好的处理系统20a设置(在方块104)用于由出现故障的第二处理系统管理的每个LCU的忙碌状况,即,每个LCU的LCU信息表项70中的忙碌状况74。I/O管理器24a为发布到设置了忙碌状况58(来自任何主机的I/O)的逻辑控制单元(LCU)上的存储设备(卷26a、26b...26n)的任何新的I/O操作呈现(在方块106)忙碌状态。I/O管理器24a还为发布到设置了概要忙碌状况60(来自主机-LCU对中的主机的I/O)的主机-LCU对的存储设备(卷)的任何新的I/O操作(除重置概要单元检验命令和可能某些其他与处理I/O操作无关的命令以外)呈现(在方块106)忙碌状态。此外,I/O管理器不能向任何主机(当忙碌状况被设置时)或向与主机-LCU对(设置了概要忙碌状况)关联的主机呈现任何未经请求的状态情况。由出现故障的第二处理系统管理的逻辑控制单元中的存储设备上正在进行的任何I/O活动连接(I/O操作)被终止(在方块108)。
完好的处理系统20a的I/O管理器24a将由出现故障的第二处理系统管理的LCU重新分配(在方块110)到完好的第一处理系统。对于每个重新分配的LCU,确定(在方块112)连接的主机,这可以从在区段54(图2)中标识重新分配的LCU的连接信息表项50来确定。然后,I/O管理器24a在主机-LCU对连接信息50中为确定的连接主机-LCU对设置(在图6中的方块114)概要单元检验状况60和概要忙碌状况58,即,在区段54中标识重新分配的LCU和在区段52中标识确定的主机的连接信息表项50。在LCU信息表项70中为所有重新分配的逻辑控制单元重置(在方块116)逻辑控制单元忙碌状况74。对于每个设置了概要单元检验状况60的主机-LCU对,I/O管理器24a通过具有到主机(指示存储设备组中的一组设备的故障)的连接的逻辑控制单元的某一存储设备将单元检验发送(在方块118)给每个确定的主机2。一旦被呈现,主机-LCU对的概要单元检验状况60就被重置以便所述单元检验不会被重新发送。
响应于(在方块120)从出现故障的设备组(逻辑控制单元14a、14b...14n)中的某一存储设备(主机2与其相连)接收到指示概要单元检验状况的单元检验,通道子系统12为受影响的存储设备组(逻辑控制单元)中的一组存储设备(卷26a、26b...26n)排队(在方块122)任何新的I/O请求。通道子系统12发出(在方块124)取消指令以取消任何尚未开始并指向设备组(逻辑控制单元14a、14b...14n)(包括在所述单元检验中指示的存储设备(卷))中的任何设备(卷26a、26b...26n)的开始挂起的I/O操作。还发出(在方块126)清除指令以终止并恢复任何活动的并且指向设备组(包括在所述单元检验中指示的存储设备)中的任何设备的I/O操作。在一个实施例中,恢复活动I/O操作的操作可以包括执行错误恢复过程。被取消并恢复的I/O操作被添加到(在方块128)主机存储器6或通道子系统12中的I/O队列(未示出)。
在取消I/O操作之后,通道子系统12向设备组(逻辑控制单元14a、14b...14n)中的某个存储设备(卷26a、26b...26n)发出(在图6中的方块130)重置概要单元检验命令。该重置概要单元检验命令并不受I/O管理器处的存储设备的概要忙碌状况的支配,以便I/O管理器24a在不返回忙碌的情况下处理所述重置概要单元检验命令,尽管与是发出的命令的目标的存储设备关联的主机-LCU对设置了概要忙碌状况。通道子系统12还重新驱动(在方块132)指向由出现故障的第二处理系统管理的设备组中的任何存储设备的任何活动I/O操作。
响应于接收到(在方块134)从主机2到与给定的主机-LCU对关联的存储设备(卷)的重置概要单元检验命令,完好的I/O管理器24a重置(在方块136)所述主机-LCU对的概要忙碌状况58。此时,可以接受后续的新的I/O操作。
图7示出了当为主机-LCU对设置了概要忙碌状况58时,由完好的处理系统20a中的I/O管理器24a执行以响应经过固定时段(在方块140)的操作。作为响应,I/O管理器24a为主机-LCU对设置(在方块142)概要单元检验状况60。I/O管理器24a通过与具有到主机(指示存储设备组的故障)的连接的主机-LCU对关联的任何存储设备将概要单元检验状况60重新呈现(在方块144)给关联的主机。一旦所述主机接受了概要单元检验状况,I/O管理器24a就为主机-LCU对重置所述概要单元检验状况。
在一个实施例中,此处所述的用于为LCU-主机对聚合单元检验的操作可以通过给定主机发出特定命令来被有选择地启用。这允许存储系统针对每个主机采取适当的行为,其中某些主机安装了支持新机制的软件而其他主机可能要求旧的操作模式。
所述实施例提供了一种通过设备组中的某一存储设备警告主机故障来根据所述存储设备的设备组警告所述主机所述故障的技术。以这种方式,用于多个存储设备或卷的各单元检验被聚合成单个单元检验,以便在具有数以千计的连接设备的系统中,不会因单元检验信号而使主机负担过重。
使用生产软件、固件、硬件或它们的任意组合的标准编程和/或工程技术,上述操作可以被实现为方法、装置或制品。此处使用的术语“制品”指在硬件逻辑(例如,集成电路芯片、可编程门阵列(PGA)、专用集成电路(ASIC)等)或诸如磁存储介质(例如,硬盘驱动器、软盘、磁带等)、光学存储装置(CD-ROM、光盘等)、易失性及非易失性存储设备(例如EEPROM、ROM、PROM、RAM、DRAM、SRAM、固件、可编程逻辑等)之类的计算机可读介质中实现的代码或逻辑。计算机可读介质中的代码由处理器来存取和执行。其中实现优选实施例的代码可以进一步通过传输介质或从网络上的文件服务器来访问。在此情况下,其中实现代码的制品可以包括诸如网络传输线、无线传输介质、通过空间传播的信号、无线电波、红外信号等之类的传输介质。因此,“制品”可以包括其中包含代码的介质。此外,“制品”可以包括其中包含、处理以及执行代码的硬件和软件组件的组合。当然,本领域的技术人员将认识到,可以对此配置做出许多修改而不偏离本发明的范围,并且所述制品可以包括本领域中公知的任何信息承载介质。
在所描述的实施例中,所述主机通过一组连接路径来创建与设备的连接。在一个实施例中,在主机与设备之间创建连接的机制是通过主机想在其上建立连接的每个逻辑路径向所述设备发出指定建立功能的设置路径组ID命令。这些命令将连接路径与来自具有指定路径组ID的路径组中的某个主机的设备相关联。在一个实施例中,每个连接的主机都可以建立其自己的到给定设备的路径组,每个路径组都具有唯一的路径组ID。
图2、3和4示出了包括在连接信息表项、逻辑控制单元信息以及存储设备信息中的特定信息。在可替代实施例中,可以以具有不同于所示格式和信息的其他数据结构来存储此信息。
某些实施例可能涉及用于通过将计算机可读代码集成到计算系统中的人员或自动处理来部署计算指令的方法,其中与所述计算系统结合的所述代码被使能执行所述实施例的操作。
图5、6和7的示出的操作显示某些事件以特定的顺序发生。在替代实施例中,某些操作可以以不同的顺序被执行、修改或删除。此外,可以向上述逻辑添加步骤并仍然符合所述实施例。进而,此处所述的操作可以顺序地发生或者某些操作可以被并行地处理。更进一步,操作可以由单个处理复合体或由分布式处理复合体来执行。
出于示例和说明目的提供了本发明的各个实施例的上述说明。其并非旨在是穷举的或将本发明限于所公开的精确形式。根据上述教导,许多修改和变化都是可能的。其旨在本发明的范围并非由此详细说明来限制,而是由此后所附的权利要求来限制。以上说明、实例和数据提供了对本发明的组成部分的制造和使用的完整说明。由于可以在不偏离本发明的精神和范围的情况下做出本发明的许多实施例,所以本发明存在于此后所附的权利要求之内。

Claims (41)

1.一种方法,所述方法包括:
由第一处理系统检测第二处理系统的故障;
由所述第一处理系统确定由所述出现故障的第二处理系统管理的存储设备的设备组;
由所述第一处理系统为每个确定的设备组确定连接到所述设备组中的存储设备的主机;
由所述第一处理系统通过所述确定的主机连接到其的所述设备组中的一个存储设备为每个设备组将单元检验发送到指示每个设备组的故障的每个确定的主机;
由所述确定的主机执行指令以终止在所述设备组中的所述存储设备上正在进行的任何I/O操作以响应指示一个设备组的故障的所述单元检验;以及
由所述确定的主机向所述设备组的一个存储设备发出命令以结束所述发出命令的主机的忙碌状况。
2.根据权利要求1的方法,还包括:
由所述第一处理单元终止任何指向由所述出现故障的第二处理系统管理的所述设备组中的存储设备的活动I/O操作。
3.根据权利要求1的方法,其中由所述确定的主机执行指令以终止任何指向所述设备组中的所述存储设备的I/O操作以便响应所述单元检验,还包括:
发出取消指令以取消任何尚未开始并指向包括所述单元检验中指示的所述存储设备的所述设备组中的任何存储设备的开始挂起的I/O操作;以及
将所述取消的I/O操作添加到I/O队列。
4.根据权利要求1的方法,其中由所述确定的主机执行指令以终止任何指向所述设备组中的所述存储设备的I/O操作以便响应所述单元检验,还包括:
发出清除指令以终止和恢复任何活动的并指向包括所述单元检验中指示的所述存储设备的所述设备组中的任何存储设备的I/O操作;以及
将所述取消的和恢复的I/O操作添加到I/O队列。
5.根据权利要求1的方法,还包括:
由所述第一处理系统在检测到所述第二处理单元的所述故障时为每个由所述出现故障的第二处理系统管理的设备组设置忙碌状况,其中忙碌状态被呈现给任何由具有所述忙碌状况的所述设备组中的存储设备接收的来自任何主机的新的I/O请求。
6.根据权利要求1的方法,还包括:
在指向存储设备的所述设备组的主机请求被允许继续之前,由所述第一处理系统将由所述第二处理系统管理的存储设备的所述设备组重新分配到所述第一处理系统。
7.根据权利要求1的方法,其中每个设备组包括逻辑控制单元,所述逻辑控制单元包括多个存储设备,其中所述主机通过至少一个连接路径连接到每个存储设备,其中所述存储设备包括逻辑卷,并且其中由所述第一处理系统确定连接到所述设备组中的存储设备的主机包括确定具有至少一个到所述设备组中的至少一个存储设备的有效连接路径的主机。
8.根据权利要求1的方法,还包括:
由所述第一处理系统确定具有到带有忙碌状况的存储设备的所述设备组中的所述存储设备的连接的所述主机;以及
由所述第一处理系统设置用于每个设备组和确定的主机对的概要忙碌状况和概要单元检验状况,其中忙碌状态被呈现给任何从一个主机发布到与具有所述概要忙碌状况的主机和设备组对关联的一个存储设备的新的I/O请求。
9.根据权利要求8的方法,还包括:
由接收所述单元检验的所述主机向包括所述单元检验中指示的所述存储设备的所述设备组中的一个存储设备发出命令以响应取消I/O操作,其中所述命令不受所述概要忙碌状况的支配;以及
由所述第一处理系统重置所述接收的命令中指示的所述主机和设备组的所述概要忙碌状况以指示所述主机和所述设备组没有处于所述概要忙碌状况并且指示可以将I/O请求从所述主机提交到所述设备组中的所述存储设备。
10.根据权利要求9的方法,还包括:
由所述第一处理单元重新发送指示所述设备组中的所述存储设备的故障的所述单元检验以响应在固定时段之后没有接收到用于所述设备组的所述命令。
11.根据权利要求1的方法,还包括:
由所述第一处理系统通过与主机和设备组对关联的一个存储设备将单元检验状态发送到与设置了所述概要单元检验状况的所述主机和设备组对关联的每个主机;以及
一旦所述单元检验状态被发送,就由所述第一处理系统为所述主机和设备组对重置所述概要单元检验状况。
12.根据权利要求1的方法,其中当所述忙碌或概要忙碌状况被设置时,所述第一处理系统不会将任何未经请求的状态发送到与所述主机和设备组对关联的任何设备。
13.一种系统,所述系统包括:
第一处理系统;
第二处理系统;
至少一个主机,所述主机与所述第一和第二处理系统通信;
第一计算机可读介质,所述第一计算机可读介质包括由所述第一处理系统执行以便执行以下操作的代码:
(i)检测所述第二处理系统的故障;
(ii)确定由所述出现故障的第二处理系统管理的存储设备的设备组;
(iii)执行指令以终止在所述设备组中的所述存储设备上正在进行的任何I/O操作以响应指示一个设备组的故障的单元检验;以及
(iv)向所述设备组的一个存储设备发出命令以结束发出命令的主机的忙碌状况;
以及
第二计算机可读介质,所述第二计算机可读介质包括由所述至少一个主机执行以便执行以下操作的代码:
(i)执行指令以终止在所述设备组中的所述存储设备上正在进行的
任何I/O操作以响应指示所述设备组中的一个存储设备的故障的单元检验;以及
(ii)向所述设备组的一个存储设备发出命令以结束忙碌状况。
14.根据权利要求13的系统,其中所述代码由所述第一处理系统执行以进一步执行:
终止任何指向由所述出现故障的第二处理系统管理的所述设备组中的存储设备的活动I/O操作。
15.根据权利要求13的系统,其中由确定的主机执行指令以终止任何指向所述设备组中的所述存储设备的I/O操作以便响应所述单元检验,还包括:
发出取消指令以取消任何尚未开始并指向包括所述单元检验中指示的所述存储设备的所述设备组中的任何存储设备的开始挂起的I/O操作;以及
将所述取消的I/O操作添加到I/O队列。
16.根据权利要求13的系统,其中由确定的主机执行指令以终止任何指向所述设备组中的所述存储设备的I/O操作以便响应所述单元检验,还包括:
发出清除指令以终止和恢复任何活动的并指向包括所述单元检验中指示的所述存储设备的所述设备组中的任何设备的I/O操作;以及
将所述取消的和恢复的I/O操作添加到I/O队列。
17.根据权利要求13的系统,其中所述代码由所述第一处理系统执行以进一步执行:
在检测到所述第二处理单元的所述故障时为每个由所述出现故障的第二处理系统管理的设备组设置忙碌状况,其中忙碌状态被呈现给任何由具有所述忙碌状况的所述设备组中的存储设备接收的来自任何主机的新的I/O请求。
18.根据权利要求13的系统,其中所述代码由所述第一处理系统执行以进一步执行:
在指向存储设备的所述设备组的主机请求被允许继续之前,将由所述第二处理系统管理的存储设备的所述设备组重新分配到所述第一处理系统。
19.根据权利要求13的系统,其中每个设备组包括逻辑控制单元,所述逻辑控制单元包括多个存储设备,其中所述主机通过至少一个连接路径连接到每个存储设备,其中所述存储设备包括逻辑卷,并且其中由所述第一处理系统确定连接到所述设备组中的存储设备的主机包括确定具有至少一个到所述设备组中的至少一个存储设备的有效连接路径的主机。
20.根据权利要求13的系统,其中所述代码由所述第一处理系统执行以进一步执行:
确定具有到带有忙碌状况的存储设备的所述设备组中的所述存储设备的连接的所述主机;以及
设置用于每个设备组和确定的主机对的概要忙碌状况和概要单元检验状况,其中忙碌状态被呈现给任何从一个主机发布到与具有所述概要忙碌状况的主机和设备组对关联的一个存储设备的新的I/O请求。
21.根据权利要求20的系统,
其中所述代码由接收所述单元检验的所述至少一个主机执行以进一步执行:向包括所述单元检验中指示的所述存储设备的所述设备组中的一个存储设备发出命令以响应取消I/O操作,其中所述命令不受所述概要忙碌状况的支配;以及
其中所述代码由所述第一处理系统执行以进一步执行:重置所述接收的命令中指示的所述主机和设备组的所述概要忙碌状况以指示所述主机和所述设备组没有处于所述概要忙碌状况并且指示可以将I/O请求从所述主机提交到所述设备组中的所述存储设备。
22.根据权利要求21的系统,其中所述代码由所述第一处理系统执行以进一步执行:
重新发送指示所述设备组中的所述存储设备的故障的所述单元检验以响应在固定时段之后没有接收到用于所述设备组的所述命令。
23.根据权利要求13的系统,其中所述代码由所述第一处理系统执行以进一步执行:
通过与主机和设备组对关联的一个存储设备将单元检验状态发送到与设置了所述概要单元检验状况的所述主机和设备组对关联的每个主机;以及
一旦所述单元检验状态被发送,就为所述主机和设备组对重置所述概要单元检验状况。
24.根据权利要求13的系统,其中所述代码由所述第一处理系统执行以进一步执行:
当所述忙碌或概要忙碌状况被设置时,不将任何未经请求的状态发送到与所述主机和设备组对关联的任何设备。
25.一件实现第一代码和第二代码的制品,所述第一代码由与第二处理系统通信的第一处理系统来执行,所述第二代码由与所述第一和第二处理系统通信的主机来执行,其中所述第一和第二代码被允许分别使所述第一处理系统和主机导致操作被执行,所述操作包括:
由第一处理系统检测第二处理系统的故障;
由所述第一处理系统确定由所述出现故障的第二处理系统管理的存储设备的设备组;
由所述第一处理系统为每个确定的设备组确定连接到所述设备组中的存储设备的主机;
由所述第一处理系统通过所述确定的主机连接到其的所述设备组中的一个存储设备为每个设备组将单元检验发送到指示每个设备组的故障的每个确定的主机;
由所述确定的主机执行指令以终止在所述设备组中的所述存储设备上正在进行的任何I/O操作以响应指示一个设备组的故障的所述单元检验;以及
由所述确定的主机向所述设备组的一个存储设备发出命令以结束所述发出命令的主机的忙碌状况。
26.根据权利要求25的制品,其中所述操作还包括:
由所述第一处理单元终止任何指向由所述出现故障的第二处理系统管理的所述设备组中的存储设备的活动I/O操作。
27.根据权利要求25的制品,其中由所述确定的主机执行指令以终止任何指向所述设备组中的所述存储设备的I/O操作以便响应所述单元检验,还包括:
发出取消指令以取消任何尚未开始并指向包括所述单元检验中指示的所述存储设备的所述设备组中的任何存储设备的开始挂起的I/O操作;以及
将所述取消的I/O操作添加到I/O队列。
28.根据权利要求25的制品,其中由所述确定的主机执行指令以终止任何指向所述设备组中的所述存储设备的I/O操作以便响应所述单元检验,还包括:
发出清除指令以终止和恢复任何活动的并指向包括所述单元检验中指示的所述存储设备的所述设备组中的任何存储设备的I/O操作;以及
将所述取消的和恢复的I/O操作添加到I/O队列。
29.根据权利要求25的制品,其中所述操作还包括:
由所述第一处理系统在检测到所述第二处理单元的所述故障时为每个由所述出现故障的第二处理系统管理的设备组设置忙碌状况,其中忙碌状态被呈现给任何由具有所述忙碌状况的所述设备组中的存储设备接收的来自任何主机的新的I/O请求。
30.根据权利要求25的制品,其中所述操作还包括:
在指向存储设备的所述设备组的主机请求被允许继续之前,由所述第一处理系统将由所述第二处理系统管理的存储设备的所述设备组重新分配到所述第一处理系统。
31.根据权利要求25的制品,其中每个设备组包括逻辑控制单元,所述逻辑控制单元包括多个存储设备,其中所述主机通过至少一个连接路径连接到每个存储设备,其中所述存储设备包括逻辑卷,并且其中由所述第一处理系统确定连接到所述设备组中的存储设备的主机包括确定具有至少一个到所述设备组中的至少一个存储设备的有效连接路径的主机。
32.根据权利要求25的制品,其中所述操作还包括:
由所述第一处理系统确定具有到带有忙碌状况的存储设备的所述设备组中的所述存储设备的连接的所述主机;以及
由所述第一处理系统设置用于每个设备组和确定的主机对的概要忙碌状况和概要单元检验状况,其中忙碌状态被呈现给任何从一个主机发布到与具有所述概要忙碌状况的主机和设备组对关联的一个存储设备的新的I/O请求。
33.根据权利要求32的制品,其中所述操作还包括:
由接收所述单元检验的所述主机向包括所述单元检验中指示的所述存储设备的所述设备组中的一个存储设备发出命令以响应取消I/O操作,其中所述命令不受所述概要忙碌状况的支配;以及
由所述第一处理系统重置所述接收的命令中指示的所述主机和设备组的所述概要忙碌状况以指示所述主机和所述设备组没有处于所述概要忙碌状况并且指示可以将I/O请求从所述主机提交到所述设备组中的所述存储设备。
34.根据权利要求33的制品,其中所述操作还包括:
由所述第一处理单元重新发送指示所述设备组中的所述存储设备的故障的所述单元检验以响应在固定时段之后没有接收到用于所述组的所述重置单元检验。
35.根据权利要求25的制品,其中所述操作还包括:
由所述第一处理系统通过与主机和设备组对关联的一个存储设备将单元检验状态发送到与设置了所述概要单元检验状况的所述主机和设备组对关联的每个主机;以及
一旦所述单元检验状态被发送,就由所述第一处理系统为所述主机和设备组对重置所述概要单元检验状况。
36.根据权利要求25的制品,其中当所述忙碌或概要忙碌状况被设置时,所述第一处理系统不会将任何未经请求的状态发送到与所述主机和设备组对关联的任何设备。
37.根据权利要求25的制品,其中所述操作还包括:
在为适合的设备组设置了适当的概要忙碌和概要单元检验状况之后,重置先前由所述出现故障的处理系统管理的所述设备组上的所述忙碌状况。
38.根据权利要求25的制品,其中由所述确定的主机执行指令以终止任何指向所述组中的所述存储设备中的一个存储设备的I/O操作以便响应所述单元检验,还包括:
排队任何被发布到I/O队列的新的I/O操作。
39.根据权利要求25的制品,其中所述操作还包括:
由一个主机将命令发布到所述第一或第二处理系统、单元以实现由权利要求25中的所述第一处理系统执行的所述操作。
40.一种用于部署计算指令的方法,包括将计算机可读代码集成到第一和第二处理复合体中,其中与所述第一和第二处理复合体结合的所述代码被允许使得所述第一和第二处理复合体执行以下操作:
由第一处理系统检测第二处理系统的故障;
由所述第一处理系统确定由所述出现故障的第二处理系统管理的存储设备的设备组;
由所述第一处理系统为每个确定的设备组确定连接到所述设备组中的存储设备的主机;
由所述第一处理系统通过所述确定的主机连接到其的所述设备组中的一个存储设备为每个设备组将单元检验发送到指示每个设备组的故障的每个确定的主机;
由所述确定的主机执行指令以终止在所述设备组中的所述存储设备上正在进行的任何I/O操作以响应指示一个设备组的故障的所述单元检验;以及
由所述确定的主机向所述设备组的一个存储设备发出命令以结束所述发出命令的主机的忙碌状况。
41.根据权利要求40的方法,还包括:
由所述第一处理单元终止任何指向由所述出现故障的第二处理系统管理的所述设备组中的存储设备的活动I/O操作。
CNB2005101151480A 2004-11-15 2005-11-10 将存储卷从故障系统重新分配到完好系统的方法和系统 Active CN100388222C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/990,038 2004-11-15
US10/990,038 US7437608B2 (en) 2004-11-15 2004-11-15 Reassigning storage volumes from a failed processing system to a surviving processing system

Publications (2)

Publication Number Publication Date
CN1776638A true CN1776638A (zh) 2006-05-24
CN100388222C CN100388222C (zh) 2008-05-14

Family

ID=36575779

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2005101151480A Active CN100388222C (zh) 2004-11-15 2005-11-10 将存储卷从故障系统重新分配到完好系统的方法和系统

Country Status (2)

Country Link
US (2) US7437608B2 (zh)
CN (1) CN100388222C (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7797570B2 (en) * 2005-11-29 2010-09-14 Netapp, Inc. System and method for failover of iSCSI target portal groups in a cluster environment
JP5148236B2 (ja) 2007-10-01 2013-02-20 ルネサスエレクトロニクス株式会社 半導体集積回路及び半導体集積回路の制御方法
US8176222B2 (en) * 2008-02-14 2012-05-08 International Business Machines Corporation Early termination of an I/O operation in an I/O processing system
US8055939B2 (en) * 2008-09-24 2011-11-08 Advanced Micro Devices, Inc. Memory control device and methods thereof
US8806022B2 (en) * 2011-05-09 2014-08-12 International Business Machines Corporation Establishing communication path group identification for multiple storage devices
US8868970B2 (en) * 2011-09-08 2014-10-21 Infinidat Ltd. Object based storage system and method of operating thereof
US11221768B2 (en) 2018-10-29 2022-01-11 International Business Machines Corporation Safe shared volume access
CN112751693B (zh) * 2019-10-31 2022-09-06 北京金山云网络技术有限公司 分布式存储系统的数据处理方法、装置及电子设备

Family Cites Families (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5051887A (en) * 1987-08-25 1991-09-24 International Business Machines Corporation Maintaining duplex-paired storage devices during gap processing using of a dual copy function
US5455934A (en) * 1993-03-23 1995-10-03 Eclipse Technologies, Inc. Fault tolerant hard disk array controller
US5790775A (en) * 1995-10-23 1998-08-04 Digital Equipment Corporation Host transparent storage controller failover/failback of SCSI targets and associated units
JP3628777B2 (ja) * 1995-10-30 2005-03-16 株式会社日立製作所 外部記憶装置
US5852724A (en) * 1996-06-18 1998-12-22 Veritas Software Corp. System and method for "N" primary servers to fail over to "1" secondary server
US5922077A (en) * 1996-11-14 1999-07-13 Data General Corporation Fail-over switching system
US5944838A (en) * 1997-03-31 1999-08-31 Lsi Logic Corporation Method for fast queue restart after redundant I/O path failover
US5968182A (en) * 1997-05-12 1999-10-19 International Business Machines Corporation Method and means for utilizing device long busy response for resolving detected anomalies at the lowest level in a hierarchical, demand/response storage management subsystem
US6145066A (en) * 1997-11-14 2000-11-07 Amdahl Corporation Computer system with transparent data migration between storage volumes
US6061750A (en) * 1998-02-20 2000-05-09 International Business Machines Corporation Failover system for a DASD storage controller reconfiguring a first processor, a bridge, a second host adaptor, and a second device adaptor upon a second processor failure
US5991900A (en) * 1998-06-15 1999-11-23 Sun Microsystems, Inc. Bus controller
US6167459A (en) * 1998-10-07 2000-12-26 International Business Machines Corporation System for reassigning alias addresses to an input/output device
US6526521B1 (en) * 1999-06-18 2003-02-25 Emc Corporation Methods and apparatus for providing data storage access
JP2001134456A (ja) * 1999-11-08 2001-05-18 Hitachi Ltd 自動運用継続システム
US6766470B1 (en) * 2000-03-29 2004-07-20 Intel Corporation Enhancing reliability and robustness of a cluster
US6681339B2 (en) * 2001-01-16 2004-01-20 International Business Machines Corporation System and method for efficient failover/failback techniques for fault-tolerant data storage system
US6802021B1 (en) * 2001-01-23 2004-10-05 Adaptec, Inc. Intelligent load balancing for a multi-path storage system
US6769071B1 (en) * 2001-01-23 2004-07-27 Adaptec, Inc. Method and apparatus for intelligent failover in a multi-path system
US6922791B2 (en) * 2001-08-09 2005-07-26 Dell Products L.P. Failover system and method for cluster environment
US6898730B1 (en) * 2001-11-30 2005-05-24 Western Digital Technologies, Inc. System and method for fail-over switching in a disk storage medium
JP3714613B2 (ja) * 2001-12-12 2005-11-09 インターナショナル・ビジネス・マシーンズ・コーポレーション 記憶装置、該記憶装置を含む情報処理装置および情報記憶システムのリカバリ方法
US7111084B2 (en) * 2001-12-28 2006-09-19 Hewlett-Packard Development Company, L.P. Data storage network with host transparent failover controlled by host bus adapter
US7210068B1 (en) * 2002-03-06 2007-04-24 Network Appliance, Inc. System and method for multipath I/O support for fibre channel devices
US7076690B1 (en) * 2002-04-15 2006-07-11 Emc Corporation Method and apparatus for managing access to volumes of storage
US7134040B2 (en) * 2002-04-17 2006-11-07 International Business Machines Corporation Method, system, and program for selecting a path to a device to use when sending data requests to the device
US6973586B2 (en) * 2002-04-29 2005-12-06 International Business Machines Corporation System and method for automatic dynamic address switching
US7308604B2 (en) * 2002-08-02 2007-12-11 Thomson Licensing Real-time fail-over recovery for a media area network
US7058846B1 (en) * 2002-10-17 2006-06-06 Veritas Operating Corporation Cluster failover for storage management services
US7107483B2 (en) * 2002-11-15 2006-09-12 Lsi Logic Corporation Apparatus and method for enhancing data availability by leveraging primary/backup data storage volumes
US7676600B2 (en) * 2003-04-23 2010-03-09 Dot Hill Systems Corporation Network, storage appliance, and method for externalizing an internal I/O link between a server and a storage controller integrated within the storage appliance chassis
US6968401B2 (en) * 2003-06-26 2005-11-22 International Business Machines Corporation Method, system, and program for maintaining and swapping paths in an MPIO environment
US7085962B1 (en) * 2003-09-08 2006-08-01 Veritas Operating Corporation Method and system for completing a backup job that was interrupted during a backup process
JP4492084B2 (ja) * 2003-10-07 2010-06-30 株式会社日立製作所 ストレージパス制御方法
JP4012498B2 (ja) * 2003-11-18 2007-11-21 株式会社日立製作所 情報処理システム、情報処理装置、情報処理装置の制御方法及びプログラム
US7251743B2 (en) * 2003-11-20 2007-07-31 International Business Machines Corporation Method, system, and program for transmitting input/output requests from a primary controller to a secondary controller

Also Published As

Publication number Publication date
US20080301495A1 (en) 2008-12-04
US7437608B2 (en) 2008-10-14
CN100388222C (zh) 2008-05-14
US20060123273A1 (en) 2006-06-08
US7797577B2 (en) 2010-09-14

Similar Documents

Publication Publication Date Title
CN100388222C (zh) 将存储卷从故障系统重新分配到完好系统的方法和系统
US7111084B2 (en) Data storage network with host transparent failover controlled by host bus adapter
US6526521B1 (en) Methods and apparatus for providing data storage access
US7318138B1 (en) Preventing undesired trespass in storage arrays
US6601138B2 (en) Apparatus system and method for N-way RAID controller having improved performance and fault tolerance
US7536586B2 (en) System and method for the management of failure recovery in multiple-node shared-storage environments
CN100401296C (zh) 配置信息存储和检索系统的方法和系统
CN100495355C (zh) 从磁盘阵列中隔离驱动器以用于诊断操作的系统和方法
CN100399284C (zh) 处理结构故障的方法和系统
US20090198949A1 (en) Hypervolume data storage object and method of data storage
US20120192006A1 (en) Methods and systems for improved storage replication management and service continuance in a computing enterprise
US20030145168A1 (en) Method and apparatus for maintaining data coherency
US7676687B2 (en) Method, computer program product, and system for limiting access by a failed node
US7779308B2 (en) Error processing across multiple initiator network
US8402304B1 (en) High-availability data center
JP2003208267A (ja) クラスタ型ディスク制御装置および負荷分散方法
CN1836217A (zh) 用于处理到远程存储位置的故障恢复的方法、系统以及程序
CN1786920A (zh) 执行与多个代理节点关联的备份节点的计划备份
US20040153833A1 (en) Fault tracing in systems with virtualization layers
CN100401297C (zh) 用于管理信息存储和检索系统的配置信息的方法和系统
EP2645635B1 (en) Cluster monitor, method for monitoring a cluster, and computer-readable recording medium
EP1552392B1 (en) Real-time fail-over recovery for a media area network
CN101158915B (zh) 作为修改记录操作的部分的核实记录的方法和系统
CN100412867C (zh) 配置信息存储和检索系统的方法和系统
US20100083061A1 (en) Method to Manage Path Failure Thresholds

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant