CN1300696C - 存储控制器及数据存储方法 - Google Patents

存储控制器及数据存储方法 Download PDF

Info

Publication number
CN1300696C
CN1300696C CNB2004100453652A CN200410045365A CN1300696C CN 1300696 C CN1300696 C CN 1300696C CN B2004100453652 A CNB2004100453652 A CN B2004100453652A CN 200410045365 A CN200410045365 A CN 200410045365A CN 1300696 C CN1300696 C CN 1300696C
Authority
CN
China
Prior art keywords
data
storage area
trooping
guiding
memory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB2004100453652A
Other languages
English (en)
Other versions
CN1573705A (zh
Inventor
许宇程
弗恩·莱格沃尔德
迈克尔·T·本哈斯
迈克尔·H·哈滕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN1573705A publication Critical patent/CN1573705A/zh
Application granted granted Critical
Publication of CN1300696C publication Critical patent/CN1300696C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1415Saving, restoring, recovering or retrying at system level
    • G06F11/1441Resetting or repowering
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99944Object-oriented database structure
    • Y10S707/99945Object-oriented database structure processing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99948Application of database or data structure, e.g. distributed, multimedia, or image

Abstract

一种存储控制器及数据存储和恢复方法。该存储控制器包括用于将数据从主计算机引导到存储设备的第一群集和第二群集。第一和第二高速缓冲存储器分别连接到第一群集和第二群集。第一和第二存储器保存区域分别连接到第一群集和第二群集。正常操作模式下,数据引导到第一高速缓冲存储器并且备份到第二保存区域。数据引导到第二高速缓冲存储器并且备份到第一保存区域。在发生电源故障或类似事件的情况下,来自第一和第二保存区域的数据传输到第一存储设备并存储在其上。来自第一和第二保存区域的数据传输到第二存储设备并存储在其上。因此,当恢复正常操作时,如果群集之一随后不能恢复正常操作,则可以通过工作群集获得来自出故障群集的数据。

Description

存储控制器及数据存储方法
技术领域
本发明一般涉及存储子系统领域,特别涉及管理数据的传输以防止如果在掉电或者其他类似事件之后多群集系统的一个群集不能恢复的情况下发生数据丢失。
背景技术
在大型分布式计算系统中,多个主计算机典型地通过存储控制器连接到多个直接存取存储设备(DASD)如磁带或盘驱动器单元。除了别的功能以外,存储控制器处理特定计算机与DASD之间的连接和断连以传输数据记录。另外,存储控制器将数据存储在电子存储器中以获得较快的输入和输出操作。
国际商业机器(IBM)公司(Armonk,N.Y)企业级存储服务器TM(“ESS”)是控制磁盘单元与主计算机之间的连接的存储控制器的例子。主计算机典型地是大型机系统如IBM 3090TM、Model ES/9000或者其他类似系统。
典型IBM存储控制器可以处理最大可达十六个来自主计算机的信道以及最大可达六十四个磁性存储单元。主计算机通过一至四个信道连接到存储控制器。存储控制器典型地具有两个存储群集,其中每一个群集均提供主计算机与直接存取存储设备之间的选择性连接,并且最好均位于单独的电源分界(power boundary)。每个群集可能包括具有第一和第二存储路径的多路径存储引导器(director)、共享控制阵列(SCA)、高速缓冲存储器以及非易失性存储器(“NVS”)。SCA是在所有存储路径上共享的存储器阵列。
高速缓冲存储器公知为用作计算机存储器的辅助物,其中,它用作频繁存取的指令和数据的高速存储器。自从最后一次使用记录以来的时间长度用作使用频率的指标。高速缓冲存储器不同于系统存储器之处在于其内容从最后使用的时间点开始老化。在计算机存储器地址空间内,在竞争地址空间中的空间的数据获得存取之前,必须释放程序数据。在高速缓冲存储器中,竞争空间导致当数据成为最近最少使用的数据时它从高速缓冲存储器中淘汰出来。虽然不频繁存取的数据周期性地进入高速缓冲存储器,但是它们往往将“老化”,并且从高速缓冲存储器中淘汰出来。高速缓冲存储器中的数据在非易失性存储器中进行全部或部分重复。从直接存取存储设备的磁性介质读取数据(以及向其写入数据)是相当费时的。降慢读取和写入操作的因素包括对于磁盘将记录位置与变换器(transducer)对齐所需的时间以及用来读取和写入数据的磁性变换器的受限带宽。通过在高速缓冲存储器中复制频繁存取的数据,减少数据的读取时间,并且大大改善数据存储系统吞吐量。
在每个群集中,非易失性存储器用作用于缓冲功能的高速缓冲存储器的备份设备(参见图3)。NVS的存取速度快于直接存取存储设备的存取速度,但是一般慢于高速缓冲存储器。数据分支存储到高速缓冲存储器和NVS,以在发生电源故障的情况下备份高速缓冲存储器。写入到NVS的数据视作如同写入到磁性介质一样是安全的。一旦数据记录传输(staging)到NVS,就向主计算机提供数据被成功存储的指示。
传统存储控制单元典型地设计成该单元中的单点故障将不导致整个系统的故障。然而,某些组件的故障会导致控制单元的性能下降。例如,高速缓冲存储器中的故障典型地导致这样的性能下降。不幸的是,主机系统已被调整过,因此依赖于完善工作的高速缓冲存储器所提供的速度,从而与高速缓冲存储器中的故障相关联的性能下降具有与单点故障相同的效果。
例如,共同转让的美国发明专利5,437,022号,名称为“STORAGECONTROLLER HAVING ADDITIONAL CACHE MEMORY AND AMEANS FOR RECOVERING FROM FAILURE ANDRECONFIGURING A CONTROL UNIT THEREOF IN RESPONSETHERETO(具有附加高速缓冲存储器以及用于从故障恢复并且对此响应重新配置其控制单元的装置的存储控制器)”,公布日期为1995年7月25日解决了本技术领域内与之相关的用于减轻与高速缓冲存储器中的故障相关联的存储控制单元中的性能下降的系统和技术这一需要,在此将该文献引作参考。该发明在其中提供了一种具有两个高速缓冲存储器、两个非易失性存储缓冲器的存储控制器。一个群集的NVS存储器例如通过处理器备份另一个群集的高速缓冲存储器(参见图4)。存储控制器还包括用于从故障恢复并且对此响应重新配置其控制单元的微代码。当执行DASD快速写入时,将写入数据同时传输到高速缓冲存储器和NVS中。该系统设计成即使当发生高速缓冲存储器或NVS的故障时也提供对扩展功能操作(例如,DASD快速写入和双重拷贝)的连续可用性。(DASD快速写入是把要写入到存储设备的数据写入到高速缓冲存储器中并且将其备份在非易失性存储器中的操作。双重拷贝涉及数据的指定和保存从而以后备份到存储设备中)。旨在改善存储子系统的健壮性和在发生组件故障的情况下减轻性能下降的其他共同转让的专利包括名称为“FAILOVER AND FAILBACK SYSTEM OR A DIRECTACCESS STORAGE DEVICE(故障克服和故障恢复系统或者直接存取存储设备)”、公布日期为1999年12月21日的美国专利6,006,342号,以及名称为“STORAGE CONTROLLER AND METHOD FORIMPROVED FAILURE RECOVERY USING CROSS-COUPLEDCACHE MEMORY AND NONVOLATILE STORES(使用交叉耦合高速缓冲存储器和非易失性存储器的存储控制器和改良故障恢复方法)”、公布日期为1998年6月23日的美国专利5,771,367号,在此将它们引作参考。
虽然NVS将在发生电源故障的情况下保持数据,但是一个缺点是NVS需要专用、电池供电的存储器子系统,这将增大存储控制器的成本。一种不采用NVS的技术是对于每个群集在发生电源故障的情况下将整个高速缓冲存储器传输到盘(参见图5)。当恢复电源时,可以从盘恢复高速缓冲存储器。然而,该“救火管转储(firehose dump)”方法的缺点是处理传输所需的电池能量与所要保护的存储器的大小成正比。因此,救火管转储方法在具有非常大高速缓冲存储器的系统中是不经济的。
而且,在群集之一在发生电源故障之后不能恢复的情况下,数据的某部分包括修改数据可能不可用于数据处理系统的客户。
因此,仍然需要一种用于在发生电源故障或者类似事件的情况下保护数据尤其是修改数据而无需专用、电池供电的存储器子系统,并且即使群集不能恢复也防止数据丢失的系统和技术。
发明内容
本发明的系统和方法解决了本技术领域内的这一需要。本发明的控制器包括用于将数据从主计算机引导到存储设备的第一群集,以及用于将数据从主计算机引导到存储设备的第二群集。第一群集包括第一高速缓冲存储器、第一存储器保存区域(preserved area)和第一盘设备;第二群集包括第二高速缓冲存储器、第二存储器保存区域和第二盘设备。在正常操作模式下,第一群集中的修改数据引导到第一高速缓冲存储器,并且备份到(第二群集中的)第二保存区域。类似地,第二群集中的修改数据引导到第二高速缓冲存储器,并且备份到(第一群集中的)第一保存区域。在发生电源故障的情况下,修改数据从第一保存区域拷贝到第一盘设备,并且从第二保存区域拷贝到第二盘设备。另外,修改数据还从第一保存区域拷贝到第二盘设备,并且从第二保存区域拷贝到第一盘设备。因此,如果群集之一在电源故障之后不能恢复,则可以通过另一个群集获得来自出故障群集的修改数据。
本发明提供了一种用于在具有至少一个主计算机的数据处理系统中存储数据的方法,在该数据处理系统中一存储控制器与该至少一个主计算机耦合,该方法包括:在正常操作模式下引导存储控制器的第一群集中的第一修改数据存储在存储控制器的第二群集的存储器保存区域中;在正常操作模式下引导第二群集中的第二修改数据存储在第一群集的存储器保存部分中;在检测到存储控制器的电源故障时,由临时电源供电继续操作存储控制器;引导第一修改数据存储在第一群集的第一存储设备中;引导第二修改数据存储在第二群集的第二存储设备中;引导第一修改数据从第二群集的保存区域传输到第二存储设备;以及引导第二修改数据从第一群集的保存区域传输到第一存储设备;尝试将存储控制器恢复到正常操作模式;从而,如果在电源故障之后第一群集不能恢复,则允许第二群集通过第二存储设备处理第一群集的第一修改数据。
本发明还提供了一种存储控制器,包括:第一群集,用于引导主计算机与存储设备之间的数据传输,第一群集包括:第一高速缓冲存储器;第一存储器保存区域;第一盘设备;第二群集,用于引导主计算机与存储设备之间的数据传输,第二群集包括:第二高速缓冲存储器;第二存储器保存区域;第二盘设备;用于在正常操作模式下引导第一修改数据存储在第二群集的保存区域中的装置;用于在正常操作模式下引导第二修改数据存储在第一群集的保存区域中的装置;用于检测存储控制器的电源故障的装置;用于使存储控制器在电源故障模式下操作的临时电源;用于在电源故障模式下引导第一修改数据存储在第一盘设备中的装置;用于在电源故障模式下引导第二修改数据存储在第二盘设备中的装置;用于在电源故障模式下引导第一修改数据从第二群集的保存区域传输到第二盘设备的装置;以及用于在电源故障模式下引导第二修改数据从第一群集的保存区域传输到第一盘设备的装置;以及如果在电源故障之后第一群集不能恢复,则允许第二群集通过第二存储设备处理第一群集的第一修改数据的装置。
本发明还提供了一种数据处理系统,包括:至少一个主计算机;至少一个存储设备;存储控制器,包括:第一群集,用于引导主计算机与存储设备之间的数据传输,第一群集包括:第一高速缓冲存储器;第一存储器保存区域;第一盘设备;第二群集,用于引导主计算机与存储设备之间的数据传输,第二群集包括:第二高速缓冲存储器;第二存储器保存区域;第二盘设备;用于在正常操作模式下引导第一修改数据存储在第二保存区域中的装置;用于在正常操作模式下引导第二修改数据存储在第一保存区域中的装置;用于检测存储控制器的电源故障的装置;用于使存储控制器在电源故障模式下操作的临时电源;用于在电源故障模式下引导第一修改数据存储在第一盘设备中的装置;用于在电源故障模式下引导第二修改数据存储在第二盘设备中的装置;用于在电源故障模式下引导第一修改数据从第二群集的保存区域传输到第二盘设备的装置;以及用于在电源故障模式下引导第二修改数据从第一群集的保存区域传输到第一盘设备的装置;以及如果在电源故障之后第一群集不能恢复,则允许第二群集通过第二存储设备处理第一群集的第一修改数据的装置。
附图说明
图1是数据处理系统的方框图,其中包括可以实现本发明的存储子系统;
图2是可以实现本发明的存储子系统的方框图;
图3是示出现有技术的存储子系统的数据流的方框图,其中,非易失性存储器保持群集高速缓冲存储器的内容的映像;
图4是示出现有技术的存储子系统的数据流的方框图,其中,一个群集的非易失性存储器保持另一个群集的高速缓冲存储器的内容中的至少一些;
图5是示出当发生电源故障时执行“救火管转储”的现有技术的存储子系统的方框图;
图6是本发明的方法的流程图;
图7是示出在正常操作模式下本发明的存储子系统的数据流的方框图;
图8A是示出在电源故障之后的故障模式下的第一步骤中图7的存储子系统的数据流的方框图;
图8B是示出在电源故障之后的故障模式下的第二步骤中图7的存储子系统的数据流的方框图;
图8C是示出在电源故障之后的故障模式下的第三步骤中图7的存储子系统的数据流的方框图;以及
图9是在群集之一不能从电源故障恢复之后的修正操作模式下图7的存储子系统的数据流的方框图。
具体实施方式
图1是数据处理系统100的高级方框图,其中包括可以实现本发明的存储子系统。系统100包括一个或多个主计算机102、一个或多个存储设备如直接存取存储设备(DASD)104以及用于管理主计算机102与存储设备104之间的数据传输的存储控制器200。图2是分区成多个群集如群集0210和群集1220的存储控制器200的方框图。虽然存储控制器200可以分区成多于两个群集,并且本发明同样地适用于具有任何数目群集的存储控制器,但是为简洁起见,本文将仅以两个群集为例进行讨论。每个群集210和220包括通过其连接主计算机102的主机适配器211和221,以及通过其连接存储设备如DASD 104A和104B的设备适配器212和222。每个群集210和220还包括编程成管理群集中的操作的处理器213和223、对应设备适配器212和222与处理器213和223之间的设备适配器总线214和224、耦合于处理器213和223的高速缓冲存储器215和225以及也耦合于处理器213和223的存储器保存区域216和226。主机适配器桥230互连群集210和220。
图6是本发明的方法的流程图,并且将参照图7-9来讨论。在正常操作模式(步骤600)下,要由主计算机102存取的存储在存储设备104中的数据由存储控制器200分配到群集210或220之一(步骤602),并且传输到高速缓冲存储器215或225中(步骤604)。如果数据仅由主计算机102读取,则不需要另外的操作来保护数据:电源故障将不影响存储在存储设备104中的数据的原始副本。然而,如果主计算机102修改数据(步骤606),则本发明提供保护(图7)。第一群集210的高速缓冲存储器215中的修改数据拷贝到第二群集220的保存区域226中。类似地(但未示出),第二群集220的高速缓冲存储器225中的修改数据拷贝到第一群集210的保存区域216中(步骤608)。虽然保存区域216和226可以是传统的电池供电的NVS,但是可替换地,保存区域216和226也可以是每个群集210和220的常规存储器的指定部分。分配给保存区域216和226的存储器的大小可以根据需要进行调整以容纳当前处理的修改数据的数量。应该明白,昂贵NVS的数量可能不容易改变,并且若要改变则将需要增加或移去存储器模块和相关备份电路以及重新配置群集以识别该调整。并且,可能存在将禁止NVS的数量超过规定大小的特定限制。仅保存修改数据将大大降低电池要求。
如果发生掉电或其他类似事件(图8A;步骤610),则存储控制器200将继续在短期电池下工作,并且处理器213将引导存储在群集0210的保存区域216中的所有数据都保存到所附盘104A中(步骤612)。类似地,处理器223将引导存储在群集1220的保存区域226中的所有数据都保存到所附盘104B中(步骤614)。另外,处理器213还将引导存储在群集0210的保存区域216中的所有数据都临时存储到群集1220的保存区域226(或者更一般的存储器228)中(图8B),并且随后保存到所附盘104A中(图8C;步骤616)。类似地,处理器223将引导存储在群集1220的保存区域226中的所有数据都临时存储到群集0210的保存区域216(或者更一般的存储器218)中,并且随后保存到所附盘104B中(步骤618)。因此,群集210和220都将保持来自群集210和220的修改数据的永久性副本。
当掉电结束时,试图将存储控制器200恢复至正常操作(步骤620)。如果群集210和220被完全恢复(步骤622),则可以在不丢失数据的情况下恢复正常操作(步骤624)。如果一个群集(例如,群集1220)的初始微代码装载序列出现故障或者该群集不能从掉电恢复(步骤626),则另一个群集(在本例中为群集0210)可以继续处理其自己的数据(从盘104A恢复)以及来自出故障群集220的数据(也从盘104A恢复)(图9;步骤628)。在修复了出故障群集220(步骤630)之后,则可以恢复正常两群集操作(步骤624)。
本发明的目的通过在此所公开的实施例得到完全实现。本领域的技术人员应该理解本发明的各方面可以在不脱离本发明的本质功能的情况下通过不同实施例来实现。特定实施例仅是示例性的,而并不限制如所附权利要求所述的本发明的范围。例如,虽然本发明的描述是在两群集存储控制器的上下文中给出的,但是也可以在具有多于两个群集的存储控制器中实现它。在一个这种实施例中,在发生电源故障或者其他类似事件的情况下将每个群集的保存区域拷贝到每个群集的所附盘,从而即使所有群集中只有一个群集可以恢复,也保护修改数据。或者,群集可以配对以相互支持。相对于前者实施例,后者实施例将减少数据保护所需的盘空间量、逻辑和时间。

Claims (10)

1.一种用于在具有至少一个主计算机的数据处理系统中存储数据的方法,在该数据处理系统中一存储控制器与该至少一个主计算机耦合,该方法包括:
在正常操作模式下引导存储控制器的第一群集中的第一修改数据存储在存储控制器的第二群集的存储器保存区域中;
在正常操作模式下引导第二群集中的第二修改数据存储在第一群集的存储器保存部分中;
在检测到存储控制器的电源故障时:
由临时电源供电继续操作存储控制器;
引导第一修改数据存储在第一群集的第一存储设备中;
引导第二修改数据存储在第二群集的第二存储设备中;
引导第一修改数据从第二群集的保存区域传输到第二存储设备;以及
引导第二修改数据从第一群集的保存区域传输到第一存储设备;
尝试将存储控制器恢复到正常操作模式;
从而,如果在电源故障之后第一群集不能恢复,则允许第二群集通过第二存储设备处理第一群集的第一修改数据。
2.如权利要求1所述的方法,其中:
引导第一修改数据从第二群集的保存区域传输到第二存储设备,包括:
引导第一修改数据从第一群集的保存区域传输到第二群集的保存区域;以及
引导第一修改数据从第二群集的保存区域传输到第二存储设备;并且
引导第二修改数据从第一群集的保存区域传输到第一存储设备,包括:
引导第二修改数据从第二群集的保存区域传输到第一群集的保存区域;以及
引导第二修改数据从第一群集的保存区域传输到第一存储设备。
3.如权利要求1所述的方法,还包括:
调整第一群集的保存区域的容量以容纳第一和第二修改数据;以及
调整第二群集的保存区域的容量以容纳第一和第二修改数据。
4.如权利要求1所述的方法,还包括:
向第一群集的保存区域提供临时非易失性装置,从而保存存储在第一群集的保存区域中的数据直到该数据传输到第一存储设备;以及
向第二群集的保存区域提供临时非易失性装置,从而保存存储在第二群集的保存区域中的数据直到该数据传输到第二存储设备。
5.一种存储控制器,包括:
第一群集,用于引导主计算机与存储设备之间的数据传输,第一群集包括:
第一高速缓冲存储器;
第一存储器保存区域;
第一盘设备;
第二群集,用于引导主计算机与存储设备之间的数据传输,第二群集包括:
第二高速缓冲存储器;
第二存储器保存区域;
第二盘设备;
用于在正常操作模式下引导第一修改数据存储在第二群集的保存区域中的装置;
用于在正常操作模式下引导第二修改数据存储在第一群集的保存区域中的装置;
用于检测存储控制器的电源故障的装置;
用于使存储控制器在电源故障模式下操作的临时电源;
用于在电源故障模式下引导第一修改数据存储在第一盘设备中的装置;
用于在电源故障模式下引导第二修改数据存储在第二盘设备中的装置;
用于在电源故障模式下引导第一修改数据从第二群集的保存区域传输到第二盘设备的装置;
用于在电源故障模式下引导第二修改数据从第一群集的保存区域传输到第一盘设备的装置;以及
如果在电源故障之后第一群集不能恢复,则允许第二群集通过第二存储设备处理第一群集的第一修改数据的装置。
6.如权利要求5所述的存储控制器,其中:
第一保存区域包括临时非易失性装置,从而保存存储在第一保存区域中的数据直到该数据传输到第一盘设备;以及
第二保存区域包括临时非易失性装置,从而保存存储在第二保存区域中的数据直到该数据传输到第二盘设备。
7.如权利要求5所述的存储控制器,还包括:
用于调整第一群集的保存区域的容量以容纳第一和第二修改数据的装置;以及
用于调整第二群集的保存区域的容量以容纳第一和第二修改数据的装置。
8.一种数据处理系统,包括:
至少一个主计算机;
至少一个存储设备;
存储控制器,包括:
第一群集,用于引导主计算机与存储设备之间的数据传输,第一群集包括:
第一高速缓冲存储器;
第一存储器保存区域;
第一盘设备;
第二群集,用于引导主计算机与存储设备之间的数据传输,第二群集包括:
第二高速缓冲存储器;
第二存储器保存区域;
第二盘设备;
用于在正常操作模式下引导第一修改数据存储在第二保存区域中的装置;
用于在正常操作模式下引导第二修改数据存储在第一保存区域中的装置;
用于检测存储控制器的电源故障的装置;
用于使存储控制器在电源故障模式下操作的临时电源;
用于在电源故障模式下引导第一修改数据存储在第一盘设备中的装置;
用于在电源故障模式下引导第二修改数据存储在第二盘设备中的装置;
用于在电源故障模式下引导第一修改数据从第二群集的保存区域传输到第二盘设备的装置;
用于在电源故障模式下引导第二修改数据从第一群集的保存区域传输到第一盘设备的装置;以及
如果在电源故障之后第一群集不能恢复,则允许第二群集通过第二存储设备处理第一群集的第一修改数据的装置。
9.如权利要求8所述的数据处理系统,其中:
第一保存区域包括临时非易失性装置,从而保存存储在第一保存区域中的数据直到该数据传输到第一盘设备;以及
第二保存区域包括临时非易失性装置,从而保存存储在第二保存区域中的数据直到该数据传输到第二盘设备。
10.如权利要求8所述的数据处理系统,还包括:
用于调整第一群集的保存区域的容量以容纳第一和第二修改数据的装置;以及
用于调整第二群集的保存区域的容量以容纳第一和第二修改数据的装置。
CNB2004100453652A 2003-05-28 2004-05-21 存储控制器及数据存储方法 Expired - Fee Related CN1300696C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/446,911 US7085886B2 (en) 2003-05-28 2003-05-28 Autonomic power loss recovery for a multi-cluster storage sub-system
US10/446,911 2003-05-28

Publications (2)

Publication Number Publication Date
CN1573705A CN1573705A (zh) 2005-02-02
CN1300696C true CN1300696C (zh) 2007-02-14

Family

ID=33510324

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2004100453652A Expired - Fee Related CN1300696C (zh) 2003-05-28 2004-05-21 存储控制器及数据存储方法

Country Status (5)

Country Link
US (1) US7085886B2 (zh)
JP (1) JP4041473B2 (zh)
KR (1) KR100621446B1 (zh)
CN (1) CN1300696C (zh)
TW (1) TWI291103B (zh)

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9047231B2 (en) 2003-10-16 2015-06-02 International Business Machines Corporation Apparatus system and method for deterministically transferring data by rebooting to a data transfer kernel
KR100608012B1 (ko) * 2004-11-05 2006-08-02 삼성전자주식회사 데이터 백업 방법 및 장치
US7406624B2 (en) * 2005-02-15 2008-07-29 General Motors Corporation Method for responding to a control module failure
US20070118693A1 (en) * 2005-11-19 2007-05-24 International Business Machines Cor Method, apparatus and computer program product for cache restoration in a storage system
US8090987B2 (en) * 2005-12-05 2012-01-03 Lg Electronics Inc. Imaging apparatus having automatic backup function and method for controlling the same
US7715307B2 (en) * 2005-12-13 2010-05-11 Alcatel Lucent Communication connection control systems and methods
US7444541B2 (en) * 2006-06-30 2008-10-28 Seagate Technology Llc Failover and failback of write cache data in dual active controllers
US7694031B2 (en) * 2006-10-31 2010-04-06 Globalfoundries Inc. Memory controller including a dual-mode memory interconnect
US7680982B2 (en) * 2007-02-20 2010-03-16 International Business Machines Corporation Preservation of cache data following failover
US7761680B2 (en) * 2007-04-03 2010-07-20 International Business Machines Corporation Copying data from a first cluster to a second cluster to reassign storage areas from the first cluster to the second cluster
JP4977554B2 (ja) * 2007-08-22 2012-07-18 株式会社日立製作所 キャッシュメモリ上のデータをバックアップする機能を備えたストレージシステム
US7861048B2 (en) * 2007-11-14 2010-12-28 Infineon Technologies Ag Method and arrangement for processing a file
JP2009146169A (ja) * 2007-12-14 2009-07-02 Fujitsu Ltd ストレージシステム、ストレージ装置、データバックアップ方法
US7975169B2 (en) * 2008-06-03 2011-07-05 International Business Machines Corporation Memory preserved cache to prevent data loss
US7895465B2 (en) * 2008-06-03 2011-02-22 International Business Machines Corporation Memory preserved cache failsafe reboot mechanism
US8325554B2 (en) * 2008-07-10 2012-12-04 Sanmina-Sci Corporation Battery-less cache memory module with integrated backup
US8055846B2 (en) 2008-08-15 2011-11-08 International Business Machines Corporation Data vaulting in emergency shutdown
US8621569B1 (en) * 2009-04-01 2013-12-31 Netapp Inc. Intercluster relationship management
US9438471B1 (en) * 2012-02-20 2016-09-06 F5 Networks, Inc. Multi-blade network traffic management apparatus with improved failure handling and methods thereof
JP6291776B2 (ja) * 2013-10-11 2018-03-14 富士通株式会社 情報処理システム、情報処理システムの制御方法及び情報処理装置の制御プログラム
US9459676B2 (en) 2013-10-28 2016-10-04 International Business Machines Corporation Data storage device control with power hazard mode
CN103605620B (zh) * 2013-11-28 2017-01-11 北京华胜天成科技股份有限公司 一种集群存储数据保护方法及装置
EP2937785B1 (en) 2014-04-25 2016-08-24 Fujitsu Limited A method of recovering application data
US9489149B2 (en) * 2014-06-16 2016-11-08 Netapp, Inc. Methods and systems for using a write cache in a storage system
WO2016006108A1 (ja) * 2014-07-11 2016-01-14 株式会社日立製作所 ストレージおよびその制御方法
US11416147B2 (en) * 2018-09-06 2022-08-16 International Business Machines Corporation Rack-power-controller-initiated data protection
US11550676B2 (en) * 2018-09-06 2023-01-10 International Business Machines Corporation Hardware-management-console-initiated data protection

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5437022A (en) * 1992-12-17 1995-07-25 International Business Machines Corporation Storage controller having additional cache memory and a means for recovering from failure and reconfiguring a control unit thereof in response thereto
US5771367A (en) * 1992-12-17 1998-06-23 International Business Machines Corporation Storage controller and method for improved failure recovery using cross-coupled cache memories and nonvolatile stores
US6006342A (en) * 1997-12-11 1999-12-21 International Business Machines Corporation Failover and failback system for a direct access storage device
CN1317742A (zh) * 2000-04-10 2001-10-17 国际商业机器公司 恢复数据库时并行读取主从备份的系统和方法

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5454099A (en) * 1989-07-25 1995-09-26 International Business Machines Corporation CPU implemented method for backing up modified data sets in non-volatile store for recovery in the event of CPU failure
JP2888401B2 (ja) * 1992-08-03 1999-05-10 インターナショナル・ビジネス・マシーンズ・コーポレイション 冗長ディスクドライブアレイに対する同期方法
CA2086874E (en) * 1992-08-03 2000-01-04 Renzo Mauro Canetta Methods for administration of taxol
DE4241494A1 (de) * 1992-12-09 1994-06-16 Emitec Emissionstechnologie Verfahren zur Steuerung der Aufheizung eines elektrisch beheizbaren katalytischen Konverters
US5640530A (en) * 1992-12-17 1997-06-17 International Business Machines Corporation Use of configuration registers to control access to multiple caches and nonvolatile stores
JPH06282386A (ja) 1993-03-25 1994-10-07 Toshiba Corp ディスク記憶装置
US5548711A (en) * 1993-08-26 1996-08-20 Emc Corporation Method and apparatus for fault tolerant fast writes through buffer dumping
US5586291A (en) * 1994-12-23 1996-12-17 Emc Corporation Disk controller with volatile and non-volatile cache memories
EP0721162A2 (en) * 1995-01-06 1996-07-10 Hewlett-Packard Company Mirrored memory dual controller disk storage system
US5682513A (en) * 1995-03-31 1997-10-28 International Business Machines Corporation Cache queue entry linking for DASD record updates
US5588110A (en) * 1995-05-23 1996-12-24 Symbios Logic Inc. Method for transferring data between two devices that insures data recovery in the event of a fault
WO1997001139A1 (en) * 1995-06-23 1997-01-09 Elonex Plc Disk array controller with enhanced synchronous write
US5774643A (en) * 1995-10-13 1998-06-30 Digital Equipment Corporation Enhanced raid write hole protection and recovery
US5870537A (en) * 1996-03-13 1999-02-09 International Business Machines Corporation Concurrent switch to shadowed device for storage controller and device errors
US5968182A (en) * 1997-05-12 1999-10-19 International Business Machines Corporation Method and means for utilizing device long busy response for resolving detected anomalies at the lowest level in a hierarchical, demand/response storage management subsystem
US6173374B1 (en) * 1998-02-11 2001-01-09 Lsi Logic Corporation System and method for peer-to-peer accelerated I/O shipping between host bus adapters in clustered computer network
US6324654B1 (en) * 1998-03-30 2001-11-27 Legato Systems, Inc. Computer network remote data mirroring system
US6438661B1 (en) * 1999-03-03 2002-08-20 International Business Machines Corporation Method, system, and program for managing meta data in a storage system and rebuilding lost meta data in cache
US6378037B1 (en) * 1999-06-29 2002-04-23 International Business Machines Corporation Write-twice method of fail-safe write caching
JP3640349B2 (ja) 2001-07-10 2005-04-20 インターナショナル・ビジネス・マシーンズ・コーポレーション クラスタリング・システムおよびクラスタリング・システムにおける障害発生時のデータ復旧方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5437022A (en) * 1992-12-17 1995-07-25 International Business Machines Corporation Storage controller having additional cache memory and a means for recovering from failure and reconfiguring a control unit thereof in response thereto
US5771367A (en) * 1992-12-17 1998-06-23 International Business Machines Corporation Storage controller and method for improved failure recovery using cross-coupled cache memories and nonvolatile stores
US6006342A (en) * 1997-12-11 1999-12-21 International Business Machines Corporation Failover and failback system for a direct access storage device
CN1317742A (zh) * 2000-04-10 2001-10-17 国际商业机器公司 恢复数据库时并行读取主从备份的系统和方法

Also Published As

Publication number Publication date
US20040255181A1 (en) 2004-12-16
CN1573705A (zh) 2005-02-02
KR20040104391A (ko) 2004-12-10
TWI291103B (en) 2007-12-11
JP2004355623A (ja) 2004-12-16
JP4041473B2 (ja) 2008-01-30
KR100621446B1 (ko) 2006-09-08
TW200506636A (en) 2005-02-16
US7085886B2 (en) 2006-08-01

Similar Documents

Publication Publication Date Title
CN1300696C (zh) 存储控制器及数据存储方法
US6006342A (en) Failover and failback system for a direct access storage device
US8806119B2 (en) Storage subsystem that connects fibre channel and supports online backup
US7975168B2 (en) Storage system executing parallel correction write
US7185222B2 (en) Apparatus, system, and method for maintaining data in a storage array
US5437022A (en) Storage controller having additional cache memory and a means for recovering from failure and reconfiguring a control unit thereof in response thereto
US7669008B2 (en) Destage management of redundant data copies
US7600152B2 (en) Configuring cache memory from a storage controller
US6658542B2 (en) Method and system for caching data in a storage system
US5771367A (en) Storage controller and method for improved failure recovery using cross-coupled cache memories and nonvolatile stores
EP1585022B1 (en) Disk array device and data processing method thereof
EP1703397A2 (en) Storage control apparatus and method
US20090077312A1 (en) Storage apparatus and data management method in the storage apparatus
CN102024044A (zh) 分布式文件系统
JP2011170589A (ja) ストレージ制御装置、ストレージ装置およびストレージ制御方法
US6334195B1 (en) Use of hot spare drives to boost performance during nominal raid operation
US6954825B2 (en) Disk subsystem
JP7318367B2 (ja) ストレージ制御装置及びストレージ制御プログラム
EP1987432A2 (en) Apparatus for concurrent raid array relocation
CN111240903A (zh) 数据恢复方法及相关设备
WO2016006108A1 (ja) ストレージおよびその制御方法
JPH07210333A (ja) アレイ型ディスクシステムの制御方式
KR100205289B1 (ko) 기록데이타 손실 방지방법
JPH0736761A (ja) 外部記憶装置のオンライン高信頼複写処理方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20070214

Termination date: 20150521

EXPY Termination of patent right or utility model