CN100520724C - 用于实现故障切换恢复的网络系统及方法 - Google Patents

用于实现故障切换恢复的网络系统及方法 Download PDF

Info

Publication number
CN100520724C
CN100520724C CNB038184958A CN03818495A CN100520724C CN 100520724 C CN100520724 C CN 100520724C CN B038184958 A CNB038184958 A CN B038184958A CN 03818495 A CN03818495 A CN 03818495A CN 100520724 C CN100520724 C CN 100520724C
Authority
CN
China
Prior art keywords
port
host bus
bus adapter
storage system
link
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB038184958A
Other languages
English (en)
Other versions
CN1714343A (zh
Inventor
尼尔·谢默斯·麦克唐奈
戴维·阿龙·克劳瑟
丹尼尔·埃德温·巴梅
罗伯特·雷蒙德·伍德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Licensing SAS
Original Assignee
Grass Valley USA LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Grass Valley USA LLC filed Critical Grass Valley USA LLC
Publication of CN1714343A publication Critical patent/CN1714343A/zh
Application granted granted Critical
Publication of CN100520724C publication Critical patent/CN100520724C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2002Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant
    • G06F11/2007Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant using redundant communication media
    • G06F11/201Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant using redundant communication media between storage system components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2002Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant
    • G06F11/2007Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant using redundant communication media
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/16Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Computer Hardware Design (AREA)
  • Software Systems (AREA)
  • Debugging And Monitoring (AREA)
  • Hardware Redundancy (AREA)
  • Small-Scale Networks (AREA)

Abstract

一种媒体区域网络(10),包括具有至少一个用于存储数字化信息的存储设备(18)的存储系统(16)。主总线(14)适配器提供了存储系统和用于提供媒体区域网络的整体控制的主系统(12)之间的链路。在主总线适配器中,低水平端口驱动器(24)监控存储系统和主总线适配器之间的通信。如果通信失败,低水平端口驱动器发起从故障端口到备选端口的切换,从而实现故障切换恢复。针对故障切换恢复将响应分配到端口驱动器保证了端口故障的及时处理,从而减少了潜在的等待延迟。

Description

用于实现故障切换恢复的网络系统及方法
本申请根据35U.S.C.119(e)要求于2002年8月2日提交的序列号为60/400635的美国临时专利申请的优先权,在此合并其教益。
技术区域
本发明涉及用于在媒体区域(media area)网络中实现存储设备的故障切换(fail-over)恢复的技术。
背景技术
在广播工业中,存在媒体区域网络(MANs),其包括作为执行非实时操作系统的中央处理器的形式的主系统。主总线适配器连接主系统和存储系统,该存储系统包括一个或多个存储设备。每一个设备可采用单机磁盘或廉价盘(Inexpensive disk)的冗余阵列(RAID)形式。实际上,每一个存储设备保存了对于编辑和/或广播可访问的数字化视频。为了确保可靠性,MAN中的所有组件具有容错性并且尽可能地具有冗余特性,以在出现故障时提供实时恢复。当存储在存储系统的一个或多个存储设备中的视频经历实况传输时,这种实时恢复变得特别关键。
当MAN中出现故障时,对故障的定位能够影响恢复所需的时间。例如,考虑与分配给存储设备的端口有关的故障。当这种故障出现时,错误信号传播到可以将错误信号传送到主总线适配器的光纤信道结构中。主总线适配器典型地具有在故障端口和备选端口之间进行切换以从故障中恢复的能力。不幸地,当前的主总线适配器没有固有地支持媒体区域网络的实时需求。现有的主总线适配器通常引入了明显的等待时间。在错误的接收和端口间的切换之间可以出现差不多10秒的延迟。这些延迟带来相当大的困难。一些主总线适配器的制造商现在提供故障切换恢复软件来管理端口故障。不幸地,这些软件没有证明是透明或是无缝的。经验测试显示这种软件引起差不多15秒的等待延迟。
因此,需要一种用于在MAN中提供故障的近似实时恢复的技术。
发明内容
简要地,根据本发明的一个方面,一种网络系统,包括:存储系统,包括用于存储数字化信息的至少一个存储设备;主系统,用于提供所述网络系统的整体控制;以及主总线适配器,用于提供主系统和存储系统之间的链路,其中每一个存储设备通过连接在所述主总线适配器和所述存储系统之间的双链路来保持与主总线适配器的连接,通过一个链路连接初始端口,通过另一个链路连接备选端口,主总线适配器具有所述主系统外部的低水平端口驱动器,所述低水平端口驱动器包括:监控装置,用于通过有效端口来监控所述存储系统和所述主总线适配器之间的通信,以及切换装置,用于在所述初始端口的通信故障之后实时切换到备选端口,从而实现通信失败情况下的故障切换恢复,所述切换装置包括:将来自出现故障的初始端口的请求送入备选端口的队列的装置;取消初始端口上所有未完成的请求的装置;以及通过备选端口发出至少一个命令的装置。
根据本发明的另一方面,一种用于在网络系统中实现故障切换恢复的方法,所述网络系统包括具有用于存储数字化信息的至少一个存储设备的存储系统、用于提供网络系统的整体控制的主系统和用于提供主系统和存储系统之间的链路的主总线适配器,其中每一个存储设备通过连接在所述主总线适配器和所述存储系统之间的双链路来保持与主总线适配器的连接,通过一个链路连接初始端口,通过另一个链路连接备选端口,所述方法包括以下步骤:
在所述主系统外部的所述主总线适配器的低水平端口驱动器处,监控存储系统和主总线适配器之间的通信状态,并且在故障的情况下:在识别所述故障之后,在低水平端口驱动器处发起到有效备选端口的切换,从而实现故障切换恢复,包括步骤:将来自出现通信故障的初始端口的请求送入备选端口的队列;取消初始端口上所有未完成的请求;以及通过备选端口发出至少一个命令。
针对故障切换恢复将响应分配到端口驱动器保证了端口故障的及时处理,从而减少了潜在的等待延迟。
附图说明
图1示出了根据本原理实现实时故障切换恢复的MAN的方框示意图;
图2示出了用于执行图1的MAN中的存储设备所产生的服务中断的任务的步骤的流程图表示;以及
图3示出了在服务于图2所示的中断期间,检测错误的确定类型后用于执行实时故障切换恢复的步骤的流程图表示。
具体实施方式
图1示出了媒体区域网络(MAN)10的演示实施例的方框示意图,包括通过主总线适配器14连接到存储系统16的主系统12。存储系统16包括一个或多个存储设备,如设备18所示。每一个存储设备18可采用单个设备或廉价盘的冗余阵列(RAID)形式。每一个存储设备18具有以压缩的格式或非压缩的格式存储例如数字化视频的大容量的数字化信息的容量。在存储系统16中,光纤信道结构20将每一个存储设备18连接到主总线适配器14上。光纤信道结构20典型采用一个或多个传统光纤信道转换器和相关链路(未示出)。
主总线适配器14提供在主系统12和存储系统16之间的可切换路径。因此,主总线适配器14包括运行实时操作系统的处理器形式的实时核22,例如可以从Wind River System,Inc.,Alameda,California得到的VxWorksTM操作系统,尽管存在其它实时操作系统且易于使用。实时核22控制低水平(lower level)的小型计算机系统接口(SCSI)的界面端口驱动器24,其根据本发明提供实时故障切换恢复功能。具体地,低水平端口驱动器24包括用于监控单个端口状态的逻辑(采用专用电路或可编程处理器形式)和将信息从和向存储系统16传送的相关链路(未显示)。为了确保冗余,每一个存储设备18通过双链路和双端口来保持与主总线适配器的连接。端口之一及其相关链路用作备选,而其它端口和相关链路保持有效。在故障的情况下(例如,先前的有效端口和/或相关链路的故障),低水平端口驱动器24切换到备选端口(和其相关链路)以实现故障切换恢复。因此,如有关图2和3的更详细所述,低水平端口驱动器24执行与端口切换有关的决策(以及涉及激活冗余存储设备和/或设备控制器的决策)。因此,低水平端口控制器24减轻了主系统12减少等待延迟的该责任。低水平端口驱动器24还用于通过光纤信道结构20便于SCSII/O业务的通信。
在图1的MAN10的演示实施例中,主总线适配器14通过双联接(例如,每一信道两个链路和两个端口)与光纤信道结构20连接。存储系统18同样通过每RAID底盘两个连接与光纤信道结构20相连。按照这种方式,两个主端口中的任一个能与每RAID底盘的两个RAID控制器(未示出)中的任一个通信。这使得能够在端口和两个RAID控制器之间进行独立的故障切换。每一个主端口能够使用RAID底盘中的任一个RAID控制器。在故障情况下,能够出现主端口切换而无需切换RAID控制器,且能够出现RAID控制器切换,而无需切换主端口。
主系统12通过使用执行非实时操作系统的处理器的形式的非实时核26来提供MAN10的整个控制,例如来自Microsoft Corporation的
Figure C03818495D00071
操作系统、来自Sun Microsystems,Santa Clara,California的
Figure C03818495D00081
操作系统或
Figure C03818495D00082
操作系统。非实时核26通过消息技术与主总线适配器进行通信,而不是与每一个存储设备18的直接连接,以管理存储系统16和主系统12之间信息的通信。
图2示出了由图1的低水平端口驱动器24执行的方法的步骤的流程图,以实现图1的存储系统16中存储设备18所产生的服务中断任务。当执行步骤100时,开始服务中断的任务,期间,低水平端口驱动器24检查图1的存储设备18是否以正常方式完成了命令。如果是,则在图2的步骤110中,低水平端口驱动器24将告知图1的主系统12该命令的成功完成。在步骤100中不成功的执行存储系统命令之后,在步骤120中检查错误是否是可校正的。换句话说,低水平端口驱动器24确定是否能够通过切换到备选端口或控制器来校正出现的错误。在图2的步骤130中,当确定不存在校正动作时,图1的主系统12接收到带有该效果的通知。在可校正的错误出现的情况下,在图2的步骤140中,低水平端口驱动器24继续将与产生错误的存储设备有关的端口(未示出)标记为无效。此后,在图2的步骤150中,低水平端口驱动器24设置故障切换恢复任务(即,选择备选端口的任务)的时间。
图3示出了由图1的低水平端口驱动器24执行的故障切换恢复任务的步骤的流程图。当执行图3的步骤200时,开始故障切换恢复任务,期间低水平端口驱动器24等待来自图2的中断任务的信号,所述信号指示了故障切换恢复任务应该发生。当发现故障切换恢复任务现在已经变为有效时,在图3的步骤210中,图1的低水平端口驱动器24将来自无效(即,故障)端口的所有请求设置在队列中。此后,在图3中的步骤215中,低水平端口驱动器24典型地利用第三方进程退出系统(TPPLO)命令来取消来自初始但现在是无效端口的端口所有请求。接下来,在图3的步骤220中,检查TPPLO命令是否失败。当在步骤220中检测到TPPLO命令的失败时,在步骤225中,图1的低水平端口驱动器24作出与存储设备18有关的控制器(未示出)(典型是RAID控制器)失败或与控制器有关的路径失败的推论。在这种环境下,图1的低水平端口驱动器24将通过启动冗余RAID控制器来发起恢复。
步骤225(或当TPPLO命令没有失败时是步骤220)之后,在图3的步骤230中,图1的低水平端口驱动器24完成(即,“整理(cleanup)”)来自任一存储设备18的任意现有测试单元准备好(TUR)响应。最后,在步骤240中,低水平端口驱动器24开始通过新的有效备选端口发出命令,包括以前在步骤210中送入队列以重试的命令。此后,程序执行分支返回到步骤200,以等待恢复任务。
前面描述了通过使低水平端口驱动器24监控故障(无效)端口并然后切换到备选端口以实现恢复,来实现在媒体区域网络中的存储设备的故障切换恢复技术。

Claims (8)

1.一种网络系统(10),包括:
存储系统(16),包括用于存储数字化信息的至少一个存储设备(18);
主系统(12),用于提供所述网络系统(10)的整体控制;以及
主总线适配器(14),用于提供主系统(12)和存储系统(16)之间的链路,其中每一个存储设备通过连接在所述主总线适配器(14)和所述存储系统(16)之间的双链路来保持与主总线适配器(14)的连接,通过一个链路连接初始端口,通过另一个链路连接备选端口,主总线适配器(14)具有所述主系统(12)外部的低水平端口驱动器(24),所述低水平端口驱动器包括:
监控装置,用于通过有效端口来监控所述存储系统(16)和所述主总线适配器(14)之间的通信,以及
切换装置,用于在所述初始端口的通信故障之后实时切换到备选端口,从而实现通信失败情况下的故障切换恢复,所述切换装置包括:将来自出现故障的初始端口的请求送入备选端口的队列的装置;取消初始端口上所有未完成的请求的装置;以及通过备选端口发出至少一个命令的装置。
2.根据权利要求1的网络系统,其特征在于监控装置还包括用于确定存储系统是否成功地完成了至少一个命令的装置。
3.根据权利要求2的网络系统,其特征在于监控装置还包括用于确定是否能够通过所述故障切换恢复来校正在所述故障期间发出的至少一个命令的不成功完成的装置。
4.根据权利要求3的网络系统,其特征在于切换装置还包括检测装置,用于检测是否出现了未完成命令的取消,如果没有出现则发起故障切换恢复。
5.一种用于在网络系统中实现故障切换恢复的方法,所述网络系统包括具有用于存储数字化信息的至少一个存储设备的存储系统(16)、用于提供网络系统的整体控制的主系统(12)和用于提供主系统和存储系统之间的链路的主总线适配器(14),其中每一个存储设备通过连接在所述主总线适配器(14)和所述存储系统(16)之间的双链路来保持与主总线适配器(14)的连接,通过一个链路连接初始端口,通过另一个链路连接备选端口,所述方法包括以下步骤:
在所述主系统外部的所述主总线适配器(14)的低水平端口驱动器处,监控存储系统(16)和主总线适配器(14)之间的通信状态,并且在故障的情况下:
在识别所述故障之后,在低水平端口驱动器处发起到有效备选端口的切换,从而实现故障切换恢复,包括步骤:将来自出现通信故障的初始端口的请求送入备选端口的队列;取消初始端口上所有未完成的请求;以及通过备选端口发出至少一个命令。
6.根据权利要求5的方法,其特征在于监控存储系统和主总线适配器之间的通信状态的步骤还包括步骤:确定存储系统是否成功地完成了至少一个命令。
7.根据权利要求6的方法,还包括步骤:确定是否能够通过故障切换恢复来校正在所述故障期间发出的至少一个命令的不成功完成。
8.根据权利要求5的方法,还包括步骤:检测是否出现未完成命令的取消,如果没有出现,则发起失败存储系统控制器的故障切换恢复。
CNB038184958A 2002-08-02 2003-07-03 用于实现故障切换恢复的网络系统及方法 Expired - Fee Related CN100520724C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US40063502P 2002-08-02 2002-08-02
US60/400,635 2002-08-02

Publications (2)

Publication Number Publication Date
CN1714343A CN1714343A (zh) 2005-12-28
CN100520724C true CN100520724C (zh) 2009-07-29

Family

ID=31495848

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB038184958A Expired - Fee Related CN100520724C (zh) 2002-08-02 2003-07-03 用于实现故障切换恢复的网络系统及方法

Country Status (10)

Country Link
US (1) US7308604B2 (zh)
EP (1) EP1552392B1 (zh)
JP (1) JP2005535034A (zh)
KR (1) KR20050027276A (zh)
CN (1) CN100520724C (zh)
AU (1) AU2003249703A1 (zh)
CA (1) CA2494325A1 (zh)
DE (1) DE60324574D1 (zh)
MX (1) MXPA05001357A (zh)
WO (1) WO2004013719A2 (zh)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FI122373B (fi) * 2002-10-24 2011-12-30 Tellabs Oy Menetelmä, järjestelmä ja verkko-olio yhteysvian havaitsemiseksi
GB2426609B (en) * 2004-03-19 2008-05-14 Zakrytoe Aktsionernoe Obschest Failover and load balancing
US7760626B2 (en) * 2004-03-31 2010-07-20 Intel Corporation Load balancing and failover
US7437608B2 (en) * 2004-11-15 2008-10-14 International Business Machines Corporation Reassigning storage volumes from a failed processing system to a surviving processing system
KR100666953B1 (ko) * 2005-02-28 2007-01-10 삼성전자주식회사 링크 오류 복구를 위한 네트워크 시스템 및 방법
US7707451B2 (en) * 2005-06-28 2010-04-27 Alcatel-Lucent Usa Inc. Methods and devices for recovering from initialization failures
JP2007011682A (ja) * 2005-06-30 2007-01-18 Hitachi Ltd 記憶制御装置及び記憶制御装置のパス切替方法
US20090043922A1 (en) * 2005-11-04 2009-02-12 David Aaron Crowther Method and Apparatus for Managing Media Storage Devices
US7827436B2 (en) * 2006-12-21 2010-11-02 Inventec Corporation Method of updating a dual redundant chassis management system
KR100871699B1 (ko) * 2007-01-26 2008-12-08 삼성전자주식회사 복수의 인터페이스 포트를 구비하는 메모리 카드, 메모리카드 시스템 및 메모리 카드의 데이터 통신 방법
US7596728B2 (en) * 2007-10-10 2009-09-29 Faraday Technology Corp. Built-in self repair circuit for a multi-port memory and method thereof
US8645746B2 (en) * 2010-12-03 2014-02-04 International Business Machines Corporation Cable redundancy and failover for multi-lane PCI express IO interconnections
US8839043B1 (en) * 2012-03-27 2014-09-16 Emc Corporation Managing a port failover in a data storage system
CN104798349B (zh) 2013-01-30 2018-08-07 慧与发展有限责任合伙企业 响应于端口故障的故障转移
US9298566B2 (en) * 2013-04-17 2016-03-29 Hewlett Packard Enterprise Development Lp Automatic cluster-based failover handling
US10007629B2 (en) 2015-01-16 2018-06-26 Oracle International Corporation Inter-processor bus link and switch chip failure recovery
CN107203451B (zh) * 2016-03-18 2020-09-18 伊姆西Ip控股有限责任公司 用于在存储系统中处理故障的方法及设备
JP7100090B2 (ja) * 2020-07-31 2022-07-12 株式会社日立製作所 ストレージシステム、連携方法、およびプログラム

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6154850A (en) * 1993-11-01 2000-11-28 Beaufort River, Inc. Data storage system and method
EP0721162A2 (en) * 1995-01-06 1996-07-10 Hewlett-Packard Company Mirrored memory dual controller disk storage system
US5790775A (en) * 1995-10-23 1998-08-04 Digital Equipment Corporation Host transparent storage controller failover/failback of SCSI targets and associated units
JP3628777B2 (ja) * 1995-10-30 2005-03-16 株式会社日立製作所 外部記憶装置
US5922077A (en) * 1996-11-14 1999-07-13 Data General Corporation Fail-over switching system
US5944838A (en) * 1997-03-31 1999-08-31 Lsi Logic Corporation Method for fast queue restart after redundant I/O path failover
US6006342A (en) * 1997-12-11 1999-12-21 International Business Machines Corporation Failover and failback system for a direct access storage device
US6061750A (en) * 1998-02-20 2000-05-09 International Business Machines Corporation Failover system for a DASD storage controller reconfiguring a first processor, a bridge, a second host adaptor, and a second device adaptor upon a second processor failure
JPH11345175A (ja) * 1998-06-02 1999-12-14 Nec Kofu Ltd 代替パス制御システム及び方法
US6247142B1 (en) * 1998-08-21 2001-06-12 Aspect Communications Apparatus and method for providing redundancy in a transaction processing system
US6148414A (en) * 1998-09-24 2000-11-14 Seek Systems, Inc. Methods and systems for implementing shared disk array management functions
US6449731B1 (en) * 1999-03-03 2002-09-10 Tricord Systems, Inc. Self-healing computer system storage
US6578158B1 (en) * 1999-10-28 2003-06-10 International Business Machines Corporation Method and apparatus for providing a raid controller having transparent failover and failback
US6643795B1 (en) * 2000-03-30 2003-11-04 Hewlett-Packard Development Company, L.P. Controller-based bi-directional remote copy system with storage site failover capability
US6625747B1 (en) * 2000-06-30 2003-09-23 Dell Products L.P. Computer storage system and failover method
JP4039794B2 (ja) * 2000-08-18 2008-01-30 富士通株式会社 マルチパス計算機システム
US6732289B1 (en) 2000-08-31 2004-05-04 Sun Microsystems, Inc. Fault tolerant data storage system
US6944785B2 (en) * 2001-07-23 2005-09-13 Network Appliance, Inc. High-availability cluster virtual server system
US7111084B2 (en) * 2001-12-28 2006-09-19 Hewlett-Packard Development Company, L.P. Data storage network with host transparent failover controlled by host bus adapter
US6779064B2 (en) * 2002-01-24 2004-08-17 Hewlett-Packard Development Company, L.P. System, method, and computer program product for on-line replacement of a host bus adapter
US7406039B2 (en) * 2002-02-26 2008-07-29 Dell Products L.P. System and method for a failover protocol in storage area network controllers
US7036066B2 (en) * 2002-05-24 2006-04-25 Sun Microsystems, Inc. Error detection using data block mapping
US7307948B2 (en) * 2002-10-21 2007-12-11 Emulex Design & Manufacturing Corporation System with multiple path fail over, fail back and load balancing

Also Published As

Publication number Publication date
DE60324574D1 (de) 2008-12-18
AU2003249703A8 (en) 2004-02-23
CN1714343A (zh) 2005-12-28
EP1552392A4 (en) 2006-08-16
EP1552392A2 (en) 2005-07-13
JP2005535034A (ja) 2005-11-17
AU2003249703A1 (en) 2004-02-23
CA2494325A1 (en) 2004-02-12
WO2004013719A2 (en) 2004-02-12
US7308604B2 (en) 2007-12-11
MXPA05001357A (es) 2005-08-26
US20060090094A1 (en) 2006-04-27
WO2004013719A3 (en) 2005-05-12
EP1552392B1 (en) 2008-11-05
KR20050027276A (ko) 2005-03-18

Similar Documents

Publication Publication Date Title
CN100520724C (zh) 用于实现故障切换恢复的网络系统及方法
JP2532317B2 (ja) プロセス制御システムにおける汎用入出力冗長方式のバックアップ方法
EP1437658B1 (en) Coordinating persistent status information with multiple file servers
JP5127491B2 (ja) ストレージサブシステム及びこれの制御方法
US5812748A (en) Method for improving recovery performance from hardware and software errors in a fault-tolerant computer system
GB2302428A (en) Multi-media storage system
JPH08335144A (ja) 外部記憶装置
CN100394394C (zh) 容错双工计算机系统及其控制方法
US20050193228A1 (en) Redundant path control apparatus and redundant path control method
JP2006079418A (ja) 記憶制御装置、制御方法及びプログラム
US6654880B1 (en) Method and apparatus for reducing system down time by restarting system using a primary memory before dumping contents of a standby memory to external storage
JPH11203157A (ja) 冗長装置
US20030204539A1 (en) Facility protection utilizing fault tolerant storage controllers
JP3776438B2 (ja) 記憶装置
JP2006114064A (ja) 記憶サブシステム
JP2000293389A (ja) フォールトトレラントシステムにおけるミラーディスク復旧方式
CN102081579A (zh) 双控制器存储设备的缓存镜像系统及方法
WO1995000906A1 (en) Method for improving disk mirroring error recovery in a computer system including an alternate communication path
JPS5917467B2 (ja) 制御用計算機のバツクアツプ方式
JP5532687B2 (ja) 情報処理システム、情報処理システムの障害対応機構、及び情報処理システムの障害対応方法
JP3216601B2 (ja) ディスク二重化システム
JP4096849B2 (ja) 回線多重化構造を用いた入出力制御システム
JPS6217258B2 (zh)
CN110825322A (zh) 一种基于互联的存储站点的冗余方法、系统及存储介质
CN117667528A (zh) 一种故障迁移恢复的分布式存储系统高可用方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20180508

Address after: La France

Patentee after: Thomson Licensing Trade Co.

Address before: California, USA

Patentee before: Grass Valley U. S. Inc

CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20090729

Termination date: 20210703