CN101102256A - 存储区域网系统以及在存储网络中确定数据路径的方法 - Google Patents

存储区域网系统以及在存储网络中确定数据路径的方法 Download PDF

Info

Publication number
CN101102256A
CN101102256A CNA2007101269208A CN200710126920A CN101102256A CN 101102256 A CN101102256 A CN 101102256A CN A2007101269208 A CNA2007101269208 A CN A2007101269208A CN 200710126920 A CN200710126920 A CN 200710126920A CN 101102256 A CN101102256 A CN 101102256A
Authority
CN
China
Prior art keywords
storage
controller
mode
storage control
path
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2007101269208A
Other languages
English (en)
Other versions
CN101102256B (zh
Inventor
D·A·辛克莱
L·J·桑德斯
A·L·西蒙
W·J·斯凯尔斯
B·D·怀特
C·F·芬特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN101102256A publication Critical patent/CN101102256A/zh
Application granted granted Critical
Publication of CN101102256B publication Critical patent/CN101102256B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2089Redundant storage control functionality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2002Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant
    • G06F11/2007Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant using redundant communication media
    • G06F11/201Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant using redundant communication media between storage system components

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer And Data Communications (AREA)
  • Hardware Redundancy (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明涉及一种用于存储区域网系统的方法、系统和计算机程序产品,该存储区域网系统包括:存储子系统,包括两个或多个存储控制器以及至少一个控制器监视器;存储区域网,包括应用主机与该存储子系统中两个或多个存储控制器之间的两个或多个路径;路径处理器,用于将应用主机数据定向到通过该网络到达所述存储控制器之一的路径之一上;由此,所述至少一个控制器监视器监视该存储子系统中的存储控制器,并且当其确定该存储控制器的操作状态已改变时以及当其确定该存储控制器的操作状态中的改变是故障或可能出故障时,发送操作状态消息给该路径处理器;并且在收到该操作状态消息时,该路径处理器将应用主机数据重定向通过该网络到达另一路径控制器。

Description

存储区域网系统以及在存储网络中确定数据路径的方法
技术领域
本发明涉及一种存储区域网(SAN)系统。特别地,本发明涉及对SAN系统中从服务器到存储子系统的可选路径的使用。
背景技术
存储子系统的主要功能是为服务器上运行的应用提供存储。在最简单的配置中,服务器只有一种方式来访问存储器,并且该存储设备不含冗余。这通常不是一种相当满意的解决方案,因为如果该访问方法失效,或者存储设备的一部分出故障,则服务器不能再访问所存储的数据。
更好的解决方案通过使用基于SAN的存储子系统来实现更高的可用性,其中存储设备是在SAN上的多个端口处呈现来自该存储设备的数据的一部分存储子系统。这通常是通过在该子系统内具有多个控制器并且安排每个控制器可以将来自存储设备的数据呈现给SAN来实现的。
在另一增强中,应用主机使用多路径处理器来管理到达相同存储设备的不同路径。多个路径使用服务器中的多个端口来访问单个或多个存储控制器。然而,当(a)在服务器中存在一个端口以及在存储控制器中存在多于一个的端口或者(b)在服务器中存在多于一个的端口以及在控制器中存在一个端口时,有可能具有多个路径。
图1示出了包括服务器12和存储子系统13的典型的SAN系统10。服务器12包括应用主机22和访问存储逻辑单元(LUN)18的多路径处理器24,其中存储逻辑单元(LUN)18由具有两个控制器14A和14B的存储子系统13提供。
应用主机22可以通过路径20A、20B、20C和20D的组合来访问LUN18。主机22中的多路径处理器24选择通过两个端口26A和26B之一使用这些路径中的一个或多个。如果一路径出故障,或者存储子系统中的控制器出故障,那么多路径处理器可以使用可选路径。当该路径或该控制器恢复时,多路径处理器可以考虑重新使用该恢复的路径或控制器。多路径处理器通常轮询该故障路径或控制器以便如果并且当故障路径或控制器已变得再次可用时进行建立。如果主机与存储子系统之间存在很多路径,并且存在正呈现给主机的很多LUN,则轮询所有潜在可用的路径来查看任何“损坏”的路径是否已经恢复会占用相当多的时间。
控制器复位可以发生在两种不同的情况下:控制器故障以及有意的控制器复位。从多路径处理器的角度来看,不存在在内部控制器故障实际发生之前预测其会出现的合理方式。另一方面,如果控制器在固件升级或其它维护动作之前被复位,那么多路径处理器仅会获知如果复位源于服务器,则会发生复位。因此,在没有控制器状态的最新知识的情况下,多路径处理器不会有效地选择用于发送数据到LUN的最佳路径。
相反,在控制器复位之后,在完全恢复这些控制器的冗余使用方面存在许多问题。例如,多路径处理器可能花费一些时间来实现:到达最近已被复位的存储控制器的路径进行被恢复。甚至在路径已被恢复时,多路径处理器也可能不能使用该路径,因为控制器仍未准备好接受数据(例如,其可能未使其高速缓存与其配对方重新同步)。
发明内容
根据本发明的第一方面,提供了一种在存储网络中确定数据路径的方法,所述网络具有路径处理器,其用于将数据定向到应用主机与存储子系统中的两个或多个存储控制器之间的两个或多个路径之一上;监视所述存储子系统中存储控制器的操作状态;确定所述存储控制器的操作状态中的改变是故障或是可能出故障;以及将所述确定发送至所述路径处理器;由此,所述路径处理器基于所述确定对来自路径控制器的应用主机数据进行重定向。
根据本发明的第二方面,提供了一种存储区域网系统,所述存储区域网系统包括:存储子系统,其包括两个或多个存储控制器以及至少一个控制器监视器;存储区域网,其包括在应用主机与所述存储子系统中的两个或多个存储控制器之间的两个或多个路径;路径处理器,其用于将应用主机数据定向到通过所述网络到达所述存储控制器之一的路径之一上;由此,所述至少一个控制器监视器监视所述存储子系统中的所述两个或多个存储控制器,并且当其确定存储控制器的操作状态已经改变时将操作状态消息发送至所述路径处理器;以及在收到所述操作状态消息时,所述路径处理器将应用主机数据重定向通过所述网络到达另一路径控制器。
优选地,所述控制器监视器确定所述状态中的改变是故障、可能出故障或是重新连接,并且在所述操作状态消息中发送该确定。在这种情况下,所述多路径处理器并不检查所述存储控制器的状态的细节,并且只是对朝向或离开所述两个相应的存储控制器的应用主机数据进行重定向。
优选地,每当所述操作状态改变时,所述控制器监视器就发送操作状态消息。在这种情况下,所述路径处理器确定所述状态中的改变是故障或是可能出故障,并且然后相应地行动。
附图说明
现在将仅通过举例的方式,参照附图来描述本发明的实施例,其中:
图1是典型的存储区域网系统的原理图;
图2是本发明的优选实施例的原理图;以及
图3是优选实施例的方法的原理图。
具体实施方式
根据本发明的优选实施例是存储区域网(SAN)系统110,其包括:通过多路径存储区域网(SAN)116链接至存储子系统113的服务器112(见图2)。
存储子系统113包括存储控制器114A和114B;控制器监视器115A和115B;以及存储逻辑单元(LUN)118。
SAN 110沿着SAN 116中多个路径120A、120B、120C和120D之一将存储子系统113链接至服务器112。服务器可以使用任何一个路径来从存储子系统113读或写数据。SAN路径包括开关网络,在该开关网络中一些开关比其它开关更快,并且因此在不同的路径上通过网络所花费的时间将不同。同样,一个开关可能比其它开关更繁忙或更为大量地被使用,或者更可靠或更不可靠。链路还可能更长或更短。
服务器112包括:应用主机122和多路径处理器124。
应用主机122包括应用128和应用缓冲器130。当应用主机122需要与存储控制器进行I/O事务时,其选择任意一个路径。
应用128是用于实现诸如事务检索数据库的商业目的的一组指令。这些指令中的一个或多个将是由应用主机所执行的读或写指令。
应用缓冲器130存储从存储子系统113接收到的数据或是将要被传送到存储子系统113的数据。应用主机122执行应用128,并且响应于读或写操作而使用应用缓冲器130。
多路径处理器124包括:端口控制器125;设备端口126A和126B;以及状态消息处理器127。
每个设备端口126A和126B可以通过路径120A、120B、120C和120D向存储控制器进行I/O请求。
状态消息处理器127接收来自存储子系统的状态消息,该状态消息指示以下状态情况:故障、可能出故障;重新连接;或者过载。在优选的实施例中,将这些消息传递至端口处理器125,以便取决于状态类型来选择使用哪个端口和路径。在另一实施例中,状态消息处理器接收来自存储控制器的原始状态数据;状态消息处理器确定状态情况(故障、可能出故障、连接或过载)并且将该状态消息传送至端口控制器125。
端口控制器125按照应用128以及含有状态情况的状态消息的指示接收来自应用主机122的读数据指令。使用该指令和状态情况,端口控制器选择主路径和存储控制器、将该主路径链接至缓冲器130并且使用这一主数据路径请求来自存储控制器的数据。
如果对于特定的存储控制器来说所接收到的状态情况是故障,那么端口控制器不会再次选择该存储控制器,直到接收到“已重新连接”的状态情况。同样,对可以被重定向的任何数据传送任务进行重定向。
如果对于特定的存储控制器来说所接收到的状态情况是可能出故障,那么端口控制器不会选择该存储控制器用于高可靠性传送。然而,其仍将使用该存储控制器进行正常传送,直到接收到“已重新连接”的状态情况。
如果对于特定的存储控制器来说所接收到的状态情况是过载,那么端口控制器将重定向使用该存储控制器的数据传送。更一般的状态情况是用参数来指示负载百分比的“负载”;该“负载”情况将允许端口控制器进行负载平衡。
现在描述存储子系统113组件:存储控制器114A和114B;控制器监视器115A和115B;以及存储逻辑单元(LUN)118。
存储逻辑单元118是通常用于存储硬盘驱动器的单个物理设备。LUN118可以是充当单个逻辑单元的物理驱动器的集合,例如,RAID阵列。
存储控制器114A和114B直接访问存储LUN 118。存储控制器114A和114B可以接收经由不同的路径120A、120B、120C和120D到达的多个读请求。第一读请求将使得适当的数据被加载到存储控制器114A中的高速缓存(未示出),于是随后的读取从该高速缓存得到满足并且不会对性能造成显著的影响。存储控制器收集和存储关于其操作情况的原始数据,并将该原始数据存储在状态寄存器117A和117B中。该原始数据包括:内部冗余组件的故障状态;已经要求的内部重试操作的数目;已经进行的内部重试操作的性质;已经进行的内部复位的数目;单元的寿命和该单元已被加电的时间量;复位状态;吞吐量;温度;以及存储固件等级。
在优选实施例中,控制器监视器115A和115B执行方法300(见图3)。控制器监视器监视(步骤302)存储子系统中存储控制器的操作状态,这通过直接读取存储控制器中的状态寄存器117A或117B来完成。使用状态信息确定(步骤304)存储控制器的情况并且明确该状态情况是否属于以下类型之一:故障;可能出故障;重新连接;或者过载。通过比较当前负载与标准最优负载水平,或者通过比较该控制器上的当前负载与其它控制器上的当前负载来确定过载;然后,控制器监视器将需要“查看”这两个控制器来进行该确定。一旦作出该确定,就将该确定发送至多路径处理器用于对来自或到达路径控制器的数据进行重定向。
在增强的优选实施例中,将两个存储控制器与其相应的控制器监视器一起进行配对,以便每个控制器监视器监视其自己的存储控制器和成对的存储控制器。如果控制器监视器不能进行监视和发出故障的状态情况,那么其成对的控制器监视器将进行该操作。例如,配对存储控制器通过使用具有相对短的超时(1-5秒)的控制器之间的心跳消息(heartbeat message)可以完成该操作。因而,剩余的配对控制器可以告知使用的主机系统其配对方在事件发生的几秒内已经被复位。
在另一实施例中,单个控制器监视器监视两个或多个存储控制器。这提供了本发明的好处,但却不如具有一对控制器监视器那样可靠。
可以使用用于非对称逻辑单元访问的SCSI SPC-3消息接发来传达状态消息。这提供了对有效/优化(Active/Optimized),以及有效/非优化(Active/Non-Optimized)路径的标识。这还提供对将要改变的路径的标识,例如,以便允许有效/优化变成有效/非优化,并且反之亦然。该标识可以用于向主机多路径的驱动器指示主机应当使用的路径已经改变。该标准还提供了对路径已经通过SCSI单元注意机制(SCSI Unit Attentionmechanism)而改变的异步通知,其可以像公开文本中所描述的消息接发那样操作。但应当注意,在一些操作系统环境中,该信息不被传达至多路径的驱动器。在这些环境中,可以使用轮询技术来传达信息。
在增强中,多路径处理器提供反馈来指示对优选路径中的改变的识别,并且指示多路径处理器准备且能够使用新的路径。可以使用该增强而无需在主机驱动器中作进一步改变,其中主机驱动器识别和响应SCSI标准SPC-3信息。对于每个使用的主机系统而言,冗余控制器跟踪在近来短时间周期A(比方说5秒)内已从所述主机系统接收到I/O的每个控制器端口。一旦主机在上一时间周期A内并没有发送任何I/O到非优选的端口,冗余控制器就认为主机已经确认路径中的改变。主机将:开始发送I/O到新的优选路径,并且将不再发送I/O到非优选的路径,并且时间周期A将期满;或者完全停止发送I/O(或许因为应用活动已经静止),并且时间周期A将期满;或者连续发送I/O到非优选的路径,不予处理对路径的新的指定,并且时间周期A不会期满。控制器必须持续等待达更长的时间周期B(比方说1分钟),直到不存在具有未到期的时间周期A的主机;即直到可以认为所有的主机都已经确认了优选的路径。如果在时间周期B之后,主机坚持继续发送I/O,则出现两种选择,如下文所述。
首先,该增强可以指示这样的情况,即主机可能因为系统连通性方面的故障而不能够满足所请求的路径改变,并且对于某些计划内的停机,例如并发代码负载,可以异常中止计划内的停机以便给予允许修复故障的机会,并且因此避免损耗连通性。可选地,该系统需求可以是这样的,即计划内的停机必须在周期B已期满之后继续。该周期B相当于在最初公开的A2中所讨论的超时。这为将要改变路径的、从主机到控制器的消息提供了可选方案。明确的消息提供了有用的可选实现,并且通过使用明确的“虚假”设置目标端口状态命令,这样的消息可以体现在例如SCSI消息接发中。
可以进一步改进以上增强。在开始对所有主机的协调切换之前,确保所有的主机能够发送I/O到预期的新的优选路径是有用的。该需要发生在尤其是其中需要对优选路径进行多个切换的并发代码负载期间。通过等待直到所有的主机都准备好开始切换,才有可能最小化其中I/O被发送至非优选路径的时间周期,并且因此最小化性能影响。所需要的是一种标识主机何时已识别出新近可用路径的手段,例如在并发代码负载过程期间跟随控制器复位操作之后建立的。这可以通过监视主机何时已接收到并处理了设置在这些新路径上的单元注意情况来实现。对于开始优选路径序列中新的改变而言的最佳时间点(通过将不同路径指定为有效/优选和有效/非优选来起动),可以通过等待直到在上一周期C(例如,2分钟)内已发送SCSI任务的所有主机端口都不具有与任意控制器目标端口上未完成的新路径的建立相关联的单元注意(Unit Attentions)来建立。
将描述优选实施例的第一例。如果控制器将要进行计划内的复位,则其应当将消息发送至主机系统,指示该控制器将要被复位,并且指示应当以可控的方式将到达或来自该控制器的传送故障修复到其它控制器。按常规完成到达将要被复位的控制器的正在进行的传送。在增强中,当主机系统已经中断使用到达将要被复位的控制器的路径时,该主机还可以将证实消息发送至控制器。
在对优选实施例的另一增强中,由控制器发送至主机系统的消息可以含有超时值-该超时应当由各主机起动并且如果主机不知道控制器实际上是在该超时内被复位的,那么该主机应当探测所有的控制器来确定它们是否可用。该超时机制旨在处理这样的情况,即控制器认为它将要被复位而控制器复位实际上由于某种原因未被执行。在进一步的增强中,在该超时周期期间控制器及其配对控制器可以刷新它们的写高速缓存,以便由任一控制器所接收的任何新的写入不被高速缓存而被作为直写式操作来处理。写高速缓存的这种抢先刷新由两个控制器并行地进行,这比其中控制器被允许复位并且然后其它的控制器随后刷新其高速缓存(由于在这种情况下只有一个控制器在进行刷新)的情况来说是具性能好处的。这种抢先刷新还保持写高速缓存冗余,于是,倘若在刷新期间损失了单个控制器,也不存在数据丢失。这对原始方案来说是在数据保护方面的改进,在原始方案中,第一控制器被允许复位并且其余的控制器刷新其写高速缓存,因为如果第二控制器在该周期期间出故障,则会丢失数据。
当控制器从当前使用该控制器的所有主机接收在上述第一例中所提及的证实消息时,并且当该控制器及其配对方已经完成刷新它们的高速缓存时,可以执行控制器复位。如果由于某种原因,复位在被执行之前就被取消,则控制器发送消息给所有使用的主机系统以指示该复位被取消,并且该消息告知使用的主机系统重新开始使用到达该控制器的路径。如果复位被执行并且已经完成,则控制器发送消息给使用的主机系统以指示现在准备重新开始传送。这使得使用的主机系统取消它们的超时并且重新开启和使用到达该控制器的路径。两个控制器均重新开始使用它们的快速写高速缓存。
在优选实施例的第二例中,如果控制器进行计划外的复位,则控制器监视器或配对控制器监视器发送状态消息给多路径处理器,指示存储控制器已经被复位。该消息使得使用的主机系统异常中止在到达已经被复位的控制器的路径上未完成的传送,并且重新将该传送发布到其余的控制器。
在增强中,虽然控制器复位正在进行并且可能倒退(afterwards),但是其配对控制器必须刷新其写高速缓存;由该控制器所接收的任何新的写入不会被高速缓存而是会被作为直写式操作来处理。这里假设控制器具有易失性写高速缓存;如果其是非易失性的则将不需要刷新写高速缓存。当被复位的控制器复原时,控制器对然后必须重新同步它们的写高速缓存。这可以通过使未被复位的控制器完全刷新其高速缓存或者通过将该高速缓存的部分已刷新的内容复制到被复位的控制器中的高速缓存来实现。在任何情况下,当被复位的控制器复原时,其可以将指示其现存的消息发送给使用的主机,并且使用的主机立即经由到达该控制器的路径重新开始发送I/O。
在第三例中,一对双重有效的控制器监视器可以确定它们并未有效地使用其资源。一个控制器监视器可以通过状态消息向状态消息处理器给出重新平衡来自主机的传送负载的建议。如果控制器114A资源短缺,则将消息发送至状态消息处理器,以便将更多的传送定向到其它的存储控制器114B。
在第四例中,如果逻辑单元被映射到主机并且该主机已经为该逻辑单元配置了设备,那么删除该逻辑单元,当再次运行主机配置方法时,可能花费相当长的时间来完成这些方法。这是因为主机正在等待对于目前删除的逻辑单元的每个超时命令。如果存储控制器在逻辑单元被删除时发送消息给主机,那么该主机会通知:该设备不再存在并且在运行配置方法时将不必超时每个命令。作为代替,可以只是将设备标记为脱机或者是在该特定的主机OS中适于不存在的设备的任何一种。
本领域的技术人员应当清楚,本发明的方法可以适当地体现于这样的逻辑设备,即该逻辑设备包括执行该方法的步骤的逻辑装置,并且这样的逻辑装置可以包括硬件组件或固件组件。
应当理解还可以全部或部分地以运行于一个或多个处理器(未示出)上的软件来适当地实现上述方法,并且可以将该软件提供为诸如磁或光计算机盘的任何适当的数据载体(也未示出)上所承载的计算机程序元件。用于传输数据的通道还可以包括所有描述的存储介质以及信号承载介质,例如有线或无线信号介质。
本领域的技术人员应当同样清楚,本发明的逻辑配置还可以适当地体现于这样的逻辑设备,即该逻辑设备包括执行该方法的步骤的逻辑装置,并且这样的逻辑装置可以包括诸如在例如可编程逻辑阵列中的逻辑门这样的组件。这样的逻辑配置可以进一步体现于这样的启用装置,即该启用装置用于在使用例如虚拟硬件描述符语言(其可以使用固定的或可传输的载体介质来存储)的这样的阵列中临时地或永久地建立逻辑结构。
本发明可以适当地体现为与计算机系统一起使用的计算机程序产品。这样的实现可以包括固定在诸如计算机可读介质(例如,磁盘、CD-ROM、ROM或硬盘)的有形介质上的一系列计算机可读指令,或者通过有形介质(包括但不限于光通信线路或模拟通信线路)或无形地使用无线技术(包括但不限于微波、红外或其它传输技术),经由调制解调器或其它接口设备可传输至计算机系统的一系列计算机可读指令。该组计算机可读指令含有文中先前所描述的所有或部分功能性。
本领域的技术人员应当理解,可以以与很多计算机体系结构或操作系统一起使用的多种编程语言来书写这样的计算机可读指令。此外,可以使用任何存储技术(当前的或未来的,包括但不限于半导体、磁性的或光学的)来存储这样的指令,或者使用任何通信技术(当前的或未来的,包括但不限于光学的、红外的或微波)来传输这样的指令。设想可以将这样的计算机程序产品分发为伴随着打印或电子文档的可移动介质,例如,收缩包装的软件,随计算机系统预加载在例如系统ROM或固定磁盘上,或者通过网络(例如,因特网或万维网)从服务器或电子公告板上分发。
应当进一步理解,可以以为了消费者而部署的服务的形式来提供本发明的实施例,以便提供按需服务。
还应当理解,上述优选实施例的各种进一步的修改对于本领域的普通技术人员来说是显而易见的。

Claims (21)

1.一种在存储网络中确定数据路径的方法,所述网络具有路径处理器,其用于将数据定向到应用主机与存储子系统中的两个或多个存储控制器之间的两个或多个路径之一上,所述方法包括:
监视所述存储子系统中存储控制器的操作状态;
确定所述存储控制器的操作状态中的改变是故障或是可能出故障;以及
将所述确定发送至所述路径处理器;由此
所述路径处理器基于所述确定对来自路径控制器的应用主机数据进行重定向。
2.根据权利要求1的方法,其中所述确定步骤进一步确定所述存储控制器的操作状态中的改变是否是重新连接。
3.根据权利要求1的方法,其中所述确定步骤进一步确定所述存储控制器的操作状态中的改变是否是所述存储控制器过载。
4.根据权利要求1、2或3的方法,其中所述监视步骤监视所述存储子系统中两个存储控制器的操作状态。
5.根据权利要求1至4中任何一项的方法,其进一步包括维护操作状态信息,其中所述监视步骤针对改变而监视所述操作状态信息。
6.根据权利要求1至5中任何一项的方法,其中所述操作状态指示存储控制器的即时故障,并且在收到所述操作状态消息之后,所述路径处理器立即将应用主机数据重定向到未受出故障的存储控制器影响的另一路径控制器上。
7.根据权利要求1至5中任何一项的方法,其中所述操作状态指示存储控制器可能出故障,并且在收到所述操作状态消息之后,所述路径控制器准备将应用主机数据重定向到未受出故障的存储控制器影响的另一路径控制器上。
8.根据权利要求1至5中任何一项的方法,其中所述操作状态指示存储控制器的重新连接,并且在收到所述操作状态消息之后,所述路径控制器将应用主机数据重定向回重新连接的路径控制器。
9.根据权利要求1至5中任何一项的方法,其中所述操作状态指示存储控制器的过载状态,并且在收到所述操作状态消息之后,所述路径控制器将应用主机数据中的一些重定向到未受过载影响的另一路径控制器上。
10.一种存储区域网系统,其包括:
存储子系统,所述存储子系统包括两个或多个存储控制器以及至少一个控制器监视器;
存储区域网,所述存储区域网包括在应用主机与所述存储子系统中的两个或多个存储控制器之间的两个或多个路径;
路径处理器,所述路径处理器用于将应用主机数据定向到通过所述网络到达所述存储控制器之一的路径之一上;
由此,所述至少一个控制器监视器监视所述存储子系统中的所述两个或多个存储控制器,并且当其确定存储控制器的操作状态已经改变时发送操作状态消息给所述路径处理器;以及
在收到所述操作状态消息时,所述路径处理器对通过所述网络到达或来自所述存储控制器的应用主机数据进行重定向。
11.根据权利要求10的系统,其中所述控制器监视器确定所述状态中的改变是故障、可能出故障或是重新连接,并且在所述操作状态消息中发送该确定。
12.根据权利要求10的系统,其中每当所述操作状态改变时,所述控制器监视器就发送操作状态消息。
13.根据权利要求11、12或13的系统,其中每个存储控制器维护操作状态信息,并且所述至少一个控制器监视器针对改变而监视所述操作状态信息。
14.根据权利要求11至13中任何一项的系统,其中每个存储控制器均具有用于监视其操作信息的对应的控制器监视器。
15.根据权利要求14的系统,其中每个控制器监视器监视对应的存储控制器的状态信息以及所述对应的存储控制器的配对存储控制器的状态信息,由此,如果一个控制器监视器未发送操作状态消息,那么其配对控制器监视器会这么做。
16.根据权利要求10至15中任何一项的系统,其中所述操作状态指示存储控制器的即时故障,并且在收到所述操作状态消息之后,所述路径控制器立即将应用主机数据重定向到未受出故障的存储控制器影响的另一路径控制器上。
17.根据权利要求10至15中任何一项的系统,其中所述操作状态指示存储控制器的内在故障,并且在收到所述操作状态消息之后,所述路径控制器准备将应用主机数据重定向到未受出故障的存储控制器影响的另一路径控制器上。
18.根据权利要求10至15中任何一项的系统,其中所述操作状态指示存储控制器的重新连接,并且在收到所述操作状态消息之后,所述路径控制器将应用主机数据重定向回重新连接的路径控制器。
19.根据权利要求10至15中任何一项的系统,其中所述操作状态指示存储控制器的过载状态,并且在收到所述操作状态消息之后,所述路径控制器将应用主机数据中的一些重定向到未受过载影响的另一路径控制器上。
20.一种计算机程序产品,所述计算机程序产品包括在其上存储有计算机可读代码的计算机可读记录介质,用于在存储网络中确定数据路径,所述网络具有路径处理器,用于将数据定向到应用主机与存储子系统中的两个或多个存储控制器之间的两个或多个路径之一上,所述计算机可读代码在被加载到存储子系统上并且被执行时实现以下步骤:
监视所述存储子系统中存储控制器的操作状态;
确定所述存储控制器的操作状态中的改变是故障或是可能出故障;以及
将所述确定发送至所述路径处理器;由此
所述路径处理器基于所述确定对来自路径控制器的应用主机数据进行重定向。
21.一种存储子系统,其经由存储区域网系统连接至服务器,所述存储子系统包括:
两个或多个存储控制器;以及
控制器监视器,所述控制器监视器用于监视所述存储子系统中存储控制器的操作状态,确定所述存储控制器的操作状态中的改变是故障、可能出故障、重新连接或是负载改变,以及将所述确定发送至所述服务器;由此
所述服务器基于所述确定对来自或到达所述存储子系统中的存储控制器的数据进行重定向。
CN2007101269208A 2006-07-04 2007-07-03 存储区域网系统以及在存储网络中确定数据路径的方法 Expired - Fee Related CN101102256B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
GB0613239.3 2006-07-04
GBGB0613239.3A GB0613239D0 (en) 2006-07-04 2006-07-04 Storage area network system

Publications (2)

Publication Number Publication Date
CN101102256A true CN101102256A (zh) 2008-01-09
CN101102256B CN101102256B (zh) 2013-01-23

Family

ID=36888584

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2007101269208A Expired - Fee Related CN101102256B (zh) 2006-07-04 2007-07-03 存储区域网系统以及在存储网络中确定数据路径的方法

Country Status (3)

Country Link
US (1) US7779170B2 (zh)
CN (1) CN101102256B (zh)
GB (1) GB0613239D0 (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101621465B (zh) * 2009-07-28 2011-12-07 成都市华为赛门铁克科技有限公司 数据包发送方法、装置、系统和交换设备
CN102710516A (zh) * 2012-05-30 2012-10-03 浪潮电子信息产业股份有限公司 一种多控制器存储系统环境下自动化部署的方法
CN103023697A (zh) * 2012-11-29 2013-04-03 华为技术有限公司 一种阵列多路径的管理方法、装置及系统
CN103186489A (zh) * 2011-12-27 2013-07-03 杭州信核数据科技有限公司 存储系统及多路径管理方法
CN103329106A (zh) * 2010-11-12 2013-09-25 赛门铁克公司 Alua首选项和状态转换的主机发现和处理
CN105141459A (zh) * 2015-08-27 2015-12-09 浪潮电子信息产业股份有限公司 一种基于多路径技术的优化方法
CN105900068A (zh) * 2014-11-24 2016-08-24 华为技术有限公司 路径管理的系统、装置和方法
CN106527970A (zh) * 2016-09-22 2017-03-22 华为技术有限公司 通信路径选择方法及装置
CN109427410A (zh) * 2017-09-01 2019-03-05 慧荣科技股份有限公司 快闪存储器装置的重新启动方法以及使用该方法的装置
CN112269533A (zh) * 2020-10-16 2021-01-26 苏州浪潮智能科技有限公司 一种命令处理方法、系统、设备及计算机可读存储介质
WO2021012179A1 (zh) * 2019-07-23 2021-01-28 华为技术有限公司 存储系统中实现存储业务连续性的方法、前端接口卡和存储系统

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8060775B1 (en) * 2007-06-14 2011-11-15 Symantec Corporation Method and apparatus for providing dynamic multi-pathing (DMP) for an asymmetric logical unit access (ALUA) based storage system
US9104323B2 (en) * 2007-08-16 2015-08-11 International Business Machines Corporation Apparatus and method for storage cluster control
US7930448B2 (en) * 2008-03-13 2011-04-19 International Business Machines Corporation System and method for storage subsystem port reassignment in storage area networks
US8244934B2 (en) * 2008-12-22 2012-08-14 Hewlett-Packard Development Company, L.P. Data storage network management
US8291070B2 (en) * 2009-08-31 2012-10-16 Red Hat Israel, Ltd. Determining an operating status of a remote host upon communication failure
US8619555B2 (en) * 2010-11-17 2013-12-31 Netapp, Inc. Method and system for path selection in a network
US8954808B1 (en) * 2010-11-30 2015-02-10 Symantec Corporation Systems and methods for performing input/output path failovers
US9329939B2 (en) * 2011-06-08 2016-05-03 Taejin Info Tech Co., Ltd Two-way raid controller for a semiconductor storage device
TWI518507B (zh) * 2011-09-08 2016-01-21 喬鼎資訊股份有限公司 包含備份記憶體之資料儲存系統及其管理方法
US9417942B1 (en) * 2012-03-29 2016-08-16 Emc Corporation Event-based in-band host registration
US10452284B2 (en) * 2013-02-05 2019-10-22 International Business Machines Corporation Storage system based host computer monitoring
US20160239394A1 (en) * 2015-02-13 2016-08-18 Netapp, Inc. Methods for improving management of input or output operations in a network storage environment with a failure and devices thereof
CN105141675B (zh) * 2015-08-10 2019-02-22 浪潮(北京)电子信息产业有限公司 一种多路径访问远程逻辑设备的方法、发送端及系统
JP2018100768A (ja) * 2016-12-22 2018-06-28 トヨタ自動車株式会社 高圧タンク、高圧タンクの製造方法
WO2020113875A1 (zh) * 2018-12-07 2020-06-11 华为技术有限公司 一种控制设备的切换方法、控制设备、及存储系统
KR20220060909A (ko) * 2020-11-05 2022-05-12 삼성전자주식회사 스토리지 시스템 및 스토리지 시스템의 동작 방법
KR20240018254A (ko) * 2022-08-02 2024-02-13 삼성전자주식회사 스토리지 장치 및 스토리지 시스템

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6308284B1 (en) * 1998-08-28 2001-10-23 Emc Corporation Method and apparatus for maintaining data coherency
EP1026575A3 (en) * 1999-02-08 2006-09-06 Hitachi, Ltd. Disk array system and method of changing its configuration
US7111084B2 (en) * 2001-12-28 2006-09-19 Hewlett-Packard Development Company, L.P. Data storage network with host transparent failover controlled by host bus adapter
JP2004021556A (ja) * 2002-06-14 2004-01-22 Hitachi Ltd 記憶制御装置およびその制御方法
US7085883B1 (en) * 2002-10-30 2006-08-01 Intransa, Inc. Method and apparatus for migrating volumes and virtual disks
US6941396B1 (en) * 2003-02-19 2005-09-06 Istor Networks, Inc. Storage controller redundancy using bi-directional reflective memory channel
US7213102B2 (en) * 2003-06-26 2007-05-01 International Business Machines Corporation Apparatus method and system for alternate control of a RAID array
US7574529B2 (en) * 2004-06-22 2009-08-11 International Business Machines Corporation Addressing logical subsystems in a data storage system
GB0426309D0 (en) * 2004-11-30 2004-12-29 Ibm Method and system for error strategy in a storage system

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101621465B (zh) * 2009-07-28 2011-12-07 成都市华为赛门铁克科技有限公司 数据包发送方法、装置、系统和交换设备
CN103329106A (zh) * 2010-11-12 2013-09-25 赛门铁克公司 Alua首选项和状态转换的主机发现和处理
CN103329106B (zh) * 2010-11-12 2016-12-21 赛门铁克公司 Alua首选项和状态转换的主机发现和处理
CN103186489A (zh) * 2011-12-27 2013-07-03 杭州信核数据科技有限公司 存储系统及多路径管理方法
CN103186489B (zh) * 2011-12-27 2016-03-02 杭州信核数据科技股份有限公司 存储系统及多路径管理方法
CN102710516A (zh) * 2012-05-30 2012-10-03 浪潮电子信息产业股份有限公司 一种多控制器存储系统环境下自动化部署的方法
CN103023697A (zh) * 2012-11-29 2013-04-03 华为技术有限公司 一种阵列多路径的管理方法、装置及系统
CN103023697B (zh) * 2012-11-29 2016-03-09 华为技术有限公司 一种阵列多路径的管理方法、装置及系统
CN105900068A (zh) * 2014-11-24 2016-08-24 华为技术有限公司 路径管理的系统、装置和方法
CN105900068B (zh) * 2014-11-24 2019-01-15 华为技术有限公司 路径管理的系统、装置和方法
CN105141459A (zh) * 2015-08-27 2015-12-09 浪潮电子信息产业股份有限公司 一种基于多路径技术的优化方法
CN106527970A (zh) * 2016-09-22 2017-03-22 华为技术有限公司 通信路径选择方法及装置
WO2018054048A1 (zh) * 2016-09-22 2018-03-29 华为技术有限公司 通信路径选择方法及装置
CN109427410A (zh) * 2017-09-01 2019-03-05 慧荣科技股份有限公司 快闪存储器装置的重新启动方法以及使用该方法的装置
WO2021012179A1 (zh) * 2019-07-23 2021-01-28 华为技术有限公司 存储系统中实现存储业务连续性的方法、前端接口卡和存储系统
US11860719B2 (en) 2019-07-23 2024-01-02 Huawei Technologies Co., Ltd. Method for implementing storage service continuity in storage system, front-end interface card, and storage system
CN112269533A (zh) * 2020-10-16 2021-01-26 苏州浪潮智能科技有限公司 一种命令处理方法、系统、设备及计算机可读存储介质

Also Published As

Publication number Publication date
GB0613239D0 (en) 2006-08-09
US7779170B2 (en) 2010-08-17
CN101102256B (zh) 2013-01-23
US20080126615A1 (en) 2008-05-29

Similar Documents

Publication Publication Date Title
CN101102256B (zh) 存储区域网系统以及在存储网络中确定数据路径的方法
CN101571815B (zh) 信息系统及i/o处理方法
CN100383749C (zh) 远程复制方法及远程复制系统
CN100568881C (zh) 用于选择存储群集以用来存取存储装置的方法和系统
US9182918B2 (en) Network storage systems having clustered raids for improved redundancy and load balancing
CN100403300C (zh) 镜像网络数据以建立虚拟存储区域网络
US9134913B2 (en) Methods and structure for improved processing of I/O requests in fast path circuits of a storage controller in a clustered storage system
JP5165206B2 (ja) バックアップシステムおよびバックアップ方法
US8032793B2 (en) Method of controlling information processing system, information processing system, direct memory access control device and program
US20120166886A1 (en) Non-disruptive failover of rdma connection
CN103262044A (zh) 虚拟机失效转移管理的方法及其支持系统
CN110807064B (zh) Rac分布式数据库集群系统中的数据恢复装置
JP2005326935A (ja) 仮想化ストレージを備える計算機システムの管理サーバおよび障害回避復旧方法
US20090327481A1 (en) Adaptive data throttling for storage controllers
US9058127B2 (en) Data transfer in cluster storage systems
CN1983202A (zh) 用于管理故障的方法和系统
CN103546529A (zh) 集群中的虚拟共享存储
JP2012531654A (ja) ストレージシステム及びストレージシステムの通信パス管理方法
CN103136075A (zh) 磁盘系统、数据保存装置以及磁盘设备
US8015437B2 (en) Restoring data to a distributed storage node
US20100011177A1 (en) Method for migration of synchronous remote copy service to a virtualization appliance
US7418633B1 (en) Method and apparatus for immunizing applications on a host server from failover processing within a switch
JP6810341B2 (ja) 管理装置、情報処理システムおよび管理プログラム
EP3167372B1 (en) Methods for facilitating high availability storage services and corresponding devices
WO2017081748A1 (ja) ストレージシステム、及び、ストレージ管理方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20130123

Termination date: 20150703

EXPY Termination of patent right or utility model