CN101127000B - 促进灾难恢复的装置和方法 - Google Patents

促进灾难恢复的装置和方法 Download PDF

Info

Publication number
CN101127000B
CN101127000B CN2007101390160A CN200710139016A CN101127000B CN 101127000 B CN101127000 B CN 101127000B CN 2007101390160 A CN2007101390160 A CN 2007101390160A CN 200710139016 A CN200710139016 A CN 200710139016A CN 101127000 B CN101127000 B CN 101127000B
Authority
CN
China
Prior art keywords
memory device
relevant
response
startup
computer system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2007101390160A
Other languages
English (en)
Other versions
CN101127000A (zh
Inventor
C·B·比肯
J·P·阿戈姆巴
S·沃尔什
C·F·富恩特
S·马克莱特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN101127000A publication Critical patent/CN101127000A/zh
Application granted granted Critical
Publication of CN101127000B publication Critical patent/CN101127000B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2056Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
    • G06F11/2071Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring using a plurality of controllers

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Techniques For Improving Reliability Of Storages (AREA)

Abstract

一种促进第一计算机系统灾难恢复的装置,其中存在于与第一计算机系统相关的第一存储设备上的第一数据可以从存在于与第二计算机系统相关的第二存储设备上的第二数据恢复,并且其中该第二存储设备可以操作为具有相关的启动或关闭状态,所述装置包括:接收器,用于接收用于更新该第二存储设备的更新操作,以及处理器,用于在更新该第二存储设备之前使用更新操作更新非易失性存储装置,其中所述非易失性存储装置与该第二计算机系统相关联。

Description

促进灾难恢复的装置和方法
技术领域
本发明涉及促进灾难恢复的装置。
背景技术
灾难(例如计算机病毒,恐怖分子袭击建筑物,自然灾害如地震等)可能给商业运营带来重大风险。例如,数据损失,财务损失(如收入损失),长期损失(如市场份额损失),恢复成本(如更换基础设施,计算机硬件/软件等的成本),等等。
因此,今天很多商业组织都具有灾难恢复(DR)系统,发生灾难时即可投入使用。
图1示出了根据现有技术的DR系统(100)的一个例子,其中主站点(105)(例如工厂,银行等)包括可以操作为例如典型地通过执行写操作来处理数据的计算机系统(110)。然而,应当理解,也可以执行任何数量的其他操作,例如软件升级等。也应当理解,典型地,读操作不需要DR。
数据代表了存储在一个或多个主存储设备上的主存储映像(115),这些主存储设备例如主站点(105)上的共享存储阵列、磁带库、磁盘存储等。
响应于写操作,通过对主存储设备发出写操作而更新主存储设备。
DR系统还包括位于辅助站点(120)的辅助存储映像(125)。优选地,辅助站点(120)的位置远离主站点(105),使得在发生灾难时(例如地震)辅助站点(120)不受影响。
辅助存储映像(125)是主存储映像(115)的副本,并且存储于一个或多个辅助存储设备上,例如辅助站点(120)上的共享存储阵列、磁带库、磁盘存储等。应当理解,辅助存储映像不必是主存储映像的精确副本。例如,辅助存储映像可以包括主存储映像的一个子集(例如所述子集中包含主存储映像最重要的数据)。所述一个或多个辅助存储设备对应于所述一个或多个主存储设备。应当理解,不需要发生直接对应。
应当理解,所述一个或多个辅助存储设备总是在线。
响应于针对主存储映像(115)的写操作,主存储映像(115)被更新。此外,所述写操作通过数据传送系统(130)(例如以太网,光纤信道等)传送给辅助存储映像(125)。
优选地,向计算机系统(110)传送一个确认,表明收到所述写操作。响应于收到确认,计算机系统(110)的用户可以对主存储映像(115)执行进一步操作。
响应于收到写操作,辅助存储映像(125)也通过向辅助存储设备发出所述写操作而被更新。
在发生灾难时,确保已经对辅助存储映像(125)执行了最后一个完成的写操作(即其中所述写操作是灾难发生前最后一个完整的写操作)。随后辅助存储映像(125)被用于DR目的(例如读取与辅助存储映像(125)相关的数据;使用与辅助存储映像(125)相关联的数据恢复部分/全部主存储映像(115)等)。
维护DR系统的相关成本可能很高;例如,向辅助站点(120)提供能源用于为辅助站点(120)提供动力、为辅助存储设备提供动力和冷却的相关财务成本和环境成本。在另一个例子中,财务成本与为辅助站点(120)提供空间相关。在另一个例子中,财务成本与为辅助存储设备提供空间相关,即由于辅助存储设备的冷却设备可能需要空间,辅助存储设备不能密集布置。
因为即使用DR系统,使用频率也极低,商业组织可能会发现这些成本的比例不相称。
此外,如果辅助站点(120)的辅助存储设备是低性能的存储设备,对辅助存储映像(125)执行的写操作可能需要时间来完成。这是辅助存储设备的性能低造成的。
需要提供一种具有成本效益、效率高和可用性高的DR系统。
发明内容
根据本发明的第一方面提供了一种用于促进第一计算机系统灾难恢复的装置,其中存在于与第一计算机系统相关的第一存储设备上的第一数据可以从存在于与第二计算机系统相关的第二存储设备上的第二数据恢复,并且其中第二存储设备可以操作为具有相关的启动或关闭状态,所述装置包括:接收器,用于接收用于更新第二存储设备的更新操作;以及处理器,用于在更新第二存储设备之前,使用所述更新操作更新非易失性存储装置,其中所述非易失性存储装置与第二计算机系统相关联。
应当理解,所述更新操作可以包括写操作。
根据本发明的第二方面提供了一种用于促进第一计算机系统灾难恢复的方法,其中存在于与所述第一计算机系统相关联的第一存储设备上的第一数据可以从存在于与第二计算机系统相关联的第二存储设备上的第二数据恢复,并且其中所述第二存储设备可以操作为具有相关的启动或关闭状态,所述方法包括以下步骤:接收更新第二存储设备的更新操作;并且在更新第二存储设备之前使用所述更新操作更新非易失性存储装置,其中所述非易失性存储装置与第二计算机系统相关联。
根据本发明的第三个方面提供了包括程序代码装置的计算机程序,当所述程序在计算机上运行时,所述程序代码装置适于执行上文所述方法的所有步骤。
附图说明
现在参照以下附图示出的优选实施例,仅通过例子描述本发明。
图1是现有技术的灾难恢复系统的方框图;
图2是根据优选实施例的灾难恢复系统的方框图;
图3是根据优选实施例的灾难恢复装置的方框图;
图4是根据优选实施例与启动辅助存储设备相关的规则的表示;
图5A是一个流程图,示出了根据优选实施例第一进程涉及的操作步骤;
图5B是一个流程图,示出了根据优选实施例第二进程涉及的操作步骤;
图5C是一个流程图,示出了根据所述实施例第三进程涉及的操作步骤;
图5D是一个流程图,示出了根据所述实施例第四进程涉及的操作步骤;以及
图5E是一个流程图,示出了根据所述实施例第五进程涉及的操作步骤。
具体实施方式
现在参照图2-图5E描述一个优选实施例。图2示出了DR系统(200)的例子,其中主站点(205)(例如工厂、银行等)包括可操作用于例如典型地通过执行写操作来处理数据的计算机系统(210)。
写操作由与存储区域网(SAN)相关的主存储控制器(SC)(270)处理。
SAN是一个网络,其主要目的是在计算机系统和存储单元之间传送数据。在SAN内,存储设备集中并且互相连接。SAN是高速网络,允许在通信基础设置所支持的距离内在存储设备和主机之间建立直接通信。SAN可以在服务器间共享或专属于一个服务器。SAN可以是本地网或按地域分布。
SAN允许存储器外在于服务器并且集中于其他地方。这允许在多个服务器间共享数据。数据共享允许多个计算机平台或服务器访问公共数据以进行处理。
SAN的主服务器基础设施可以包括服务器平台的组合。存储器基础设施包括直接连接到SAN网络的存储设备。SAN可以将存储器接口互相连接成很多网络配置。
在计算机系统(110)上处理的数据代表存储在主站点(205)处的多个物理主存储设备(存储设备1(SD1),存储设备2(SD2)和存储设备3(SD3))上的主存储映像。所述多个主存储设备可以是共享存储阵列、磁带库、磁盘存储等。
响应于写操作,主SC(270)通过对主存储设备发出写操作更新所述主存储设备。
应当理解,主站点(205)也可以包括主SC(270)可以访问的目录。优选地,所述主SC(270)将数据写入目录,其中所述数据包括与写操作相关的数据(例如“写操作已发出”或“写操作未发出”)。
所述DR系统(200)也包括数据传送系统(225)(例如以太网,光纤信道等),用于将写操作从主SC(270)传送到辅助站点(215)的DR装置(220)。优选地,辅助站点(215)远离主站点(205)。辅助站点(215)是主站点(205)的副本。应当理解,所述辅助站点不需要是主立占点的精确副本。
所述DR装置(220)代表构件堆栈,其中数据流经堆栈。
如图3所示,所述DR装置(220)包括可操作为相互通信的接收器(230)和第一写处理器(235)。
所述DR装置(220)还包括:可操作用于与第一写处理器(235)通信的第二写处理器(240);分析器(245)和控制器(250)。第二写处理器(240)也可操作用于与多个物理辅助存储设备(存储设备4(SD4),存储设备5(SD5)和存储设备6(SD6))通信。例如,第二写处理器(240)从多个辅助存储设备接收执行数据(即,其中所述执行数据表明辅助存储设备是在线还是离线)。
应当理解,尽管示出了两个写处理器,可以实施任何数量的写处理器。
分析器(245)可操作用于与第二写处理器(240)和控制器(250)通信。控制器(250)可操作用于与多个辅助存储设备通信。
所述DR装置(220)也包括非易失性存储器(255)区域和日志(260),所述两者在此合称为“高性能高速缓存”(HPC)(275)。第一写处理器(235)和第二写处理器(240)可以访问HPC(275)。
优选地,非易失性存储器(255)具有相关的高性能。优选地,非易失性存储器(255)可以对与主存储映像相关的数据(即存在于全部三个主存储设备上的数据)进行高速缓存。替代地,可提供多个非易失性存储器(255)。优选地,非易失性存储器(255)总是可用。应当理解,非易失性存储器(255)可以存在于任何数量的计算机系统上(例如在一个远程计算机系统中,在SC内部等)。
应当理解,尽管非易失性存储器(255)和日志(260)作为两个独立的存储装置示出,非易失性存储器(255)和日志(260)可以存在于任何数量的存储装置上。
DR装置(220)还包括一个用于存储规则的规则库(265),其中分析器(245)可以访问规则库(265)。
主存储映像的副本即辅助存储映像存储于多个物理辅助存储设备上(存储设备4(SD4),存储设备5(SD5)和存储设备6(SD6))。所述多个物理辅助存储设备可以是共享存储阵列、磁带库、磁盘存储等。应当理解,所述辅助存储映像不需要是主存储映像的精确副本。
所述辅助存储设备与多个主存储设备相对应(分别对应于存储设备1(SD1),存储设备2(SD2)和存储设备3(SD3))。
应当理解,不需要发生直接对应。例如,在虚拟环境下,存储器的逻辑视图与其物理实施分离。这允许在不改变逻辑视图的情况下而进行物理改变。这样,例如,通过在辅助站点使用与辅助SC相关的虚拟功能,辅助存储映像可以在不同的多个辅助存储设备上存储。在主站点的用户不知道物理辅助存储设备的配置。应当理解,至少可以为主站点和辅助站点之一提供虚拟化。替代地,如本文的例子所述,不需要提供虚拟化。
根据一个优选的实施例,应当理解,多个辅助存储设备不需要总是在线,下文将对此做更详细的说明。
现在参照图2-图5E描述根据所述优选实施例的过程。
在第一个例子中,主SC(270)将SD1映射到SD4。
参照图5A,在第一个例子中,用户使用主站点(205)的计算机系统(210)对主存储映像执行(步骤500)一个写操作,在第一个例子中是对存在于SD1上的主存储映像的一个子集执行所述写操作。
所述写操作以主数据块表示。所述主数据块包括数据内容和与存储主存储映像的所述子集的所述主存储设备(即SD1)的位置相关的位置信息。
响应于所述写操作,主SC(270)通过对SD1发出所述写操作而更新SD1(步骤505)。
主SC(270)使用与主数据块相关的数据和与主数据块状态相关的状态数据(即写操作已发出)更新目录。
主SC(270)通过数据传送系统(225)将所述写操作传送(步骤510)给DR装置(220),在该处由接收器(230)接收(步骤515)该数据。
主SC也将与映射到主存储设备的辅助存储设备相关的映射数据(例如所述辅助存储设备的标识符,即“SD4”)传送给接收器(230)。
响应于接收到所述写操作,接收器(230)可以向主站点(205)的计算机系统(210)传送确认。这样,响应于接收到所述确认,用户就可以执行进一步的写操作。
响应于接收到所述写操作,第一写处理器(235)使用所述映射数据询问第二写处理器(240),以确定(步骤520)所映射的辅助存储设备(即SD4)是否在线。第二写处理器(240)使用所述映射数据和执行数据确定所映射的辅助存储设备是否在线。
如果SD4在线,第一写处理器(235)将所述写操作和所述映射数据传递给第二写处理器(240)。
替代地,第一写处理器(235)在将所述写操作和所述映射数据传递给第二写处理器(240)之前,通过向非易失性存储器(255)发出所述写操作而更新非易失性存储器(255)。
参照图5B,第二写处理器(240)通过向SD4发出所述写操作而更新(步骤525)SD4。第二写处理器(240)使用与所述写操作相关的数据(即所写操作已发出)更新日志(260)。
与SD4更新相关的数据被传递给接收器(230)。响应于第二存储设备的更新,接收器(230)可以向主站点(205)的计算机系统(210)传送确认。
SD4中保存的辅助存储映像的子集(以及例如至少SD5和SD6之一中保存的辅助存储映像的子集)现在可以用于DR目的。
例如,所述子集可以是至少下列之一:DR目的的读取;灾难发生后如果一个或多个主存储设备可用,则对所述一个或多个主存储设备进行写操作;向第三个站点的一个或多个存储设备进行写操作;用于创建一个临时主站点-在此情况下,使非易失性存储器(255)离线并且使每个辅助存储设备永久在线。优选地,一旦创建了新主站点,临时主站点就转换回辅助站点。
一旦辅助存储设备更新,现有的关闭机制就可以关闭辅助存储设备(和任何仍然在线的辅助存储设备)。有利地,可以节省功耗。在发生灾难的情况下,可以启动所述辅助存储设备。
如果主站点(205)发生灾难,则第二写处理器(240)检查日志(260)以确定与最后一个写操作相关的状态数据。最后操作可以包括灾难发生前DR装置(220)接收到的最后一个写操作。替代地,所述最后操作可以包括灾难发生前DR装置(220)确认的最后一个写操作。
特别地,第二写处理器(240)检查日志(260)以确定是否在辅助存储设备上更新了所述最后写操作。
如果第二写处理器(240)确定已经对SD4更新了最后一个写操作,则存在于SD4上的已更新的数据(以及,例如存在于至少SD5和SD6之一上的数据)可以用于DR目的。
如果第二写处理器(240)确定没有对SD4更新最后一个写操作,在一个例子中,第二写处理器(240)通过向SD4发出写操作而更新SD4。这样,存在于SD4上的已更新的数据(以及,例如存在于至少SD5和SD6之一上的数据)就可以用于DR目的。
替代地,在另一个例子中,所述第二写处理器(240)不更新辅助存储设备。相反,存在于非易失性存储器(255)中的数据本身就可以用于DR目的。
如果(响应于步骤520),所述写处理器确定SD4离线,参照图5C,第一写处理器(235)通过向非易失性存储器(255)发出写操作而更新(步骤530)非易失性存储器(255)。
第一写处理器(235)使用与写操作相关的数据(即写操作已发出)更新日志(260)。
与非易失性存储器(255)的更新相关的数据被传递给接收器(230)。响应于非易失性存储器(255)的更新,接收器(230)可以向主站点(205)的计算机系统(210)发送确认。
第一写处理器(235)将映射数据传递给第二写处理器(240)。
优选地,响应于非易失性存储器(255)的更新,第二写处理器(240)使用所述映射数据和执行数据以确定(步骤535)被映射的辅助存储设备(即SD4)是否在线,例如在执行了步骤520后SD4可能已经在线。如果SD4在线,则第一写处理器(235)将所述写操作传递给第二写处理器(240)并且执行上文所述的图5B的步骤525。
如果SD4离线,参照图5D,第二写处理器(240)可操作用于调用控制器(250)。控制器(250)可操作用于使SD4在线(步骤540)。
响应于使SD4在线,第一写处理器(235)将写操作传递给第二写处理器(240)并且执行上文所述的图5B的步骤525。
在第二个例子中,主SC(270)将SD1映射到SD4。
参照图5A,执行如上文所述的步骤500到520。
在第二个例子中,第一写处理器(235)确定(步骤520)SD4离线。
参照图5E,在第二个例子中,响应于确定SD4离线,分析器(245)执行(步骤545)分析。所述分析器访问可以由管理员、系统等配置的阈值。所述阈值与功耗相关并且其值为20W(瓦特)。
应当理解,所述阈值可以与任何数量的其他参数相关联,例如已经存在于辅助存储设备上的数据的大小;已经存在于辅助存储设备上的数据的大小的增加率。
分析器(245)还与第二写处理器(240)通信以获得与其他辅助存储设备(即SD5和SD6)相关的执行数据。在第二个例子中,SD5不在线而SD6在线。
分析器(245)还确定与每个辅助存储设备在线时的相关功率消耗值(例如其中功耗值由现有的DR机制提供)。在第二个例子中,每个辅助存储设备在线时的相关功率消耗值为20W。
分析器(245)还确定与被映射的辅助存储设备(即SD4)以及与其他在线的辅助存储设备(即SD6)相关的当前功率消耗值。在第二个例子中,SD4的相关功耗值为0W(由于SD4离线)并且SD6的相关功耗值为20W(由于SD6在线)。
分析器(245)分析与在线的辅助存储设备相关的功耗值和与SD4和SD6相关的当前功耗值,以确定使SD4在线是否会超过功耗阈值。
如果分析器(245)确定使SD4在线不会超过功耗阈值,优选地,分析器(245)调用控制器(250),控制器(250)可操作用于使SD4在线(步骤540)。
响应于使SD4在线,第一写处理器(250)将所述写操作和映射数据传递给第二写处理器(240)。
第二写处理器(240)通过向SD4发出所述写操作更新(步骤525)SD4。第二写处理器(240)使用与所述写操作相关的数据(即写操作已发出)更新日志(260)。
应当理解,一旦被映射的辅助存储设备已经被更新,有利地,其(即SD4)(以及任何其他在线的辅助存储设备(例如SD6))可以被关闭以节约功率。
存在于SD4(以及例如存在于至少SD5和SD6之一上的数据)上的已更新的数据可以用于DR目的。
然而在第二个例子中,分析器(245)确定使SD4在线将会造成总共40W的更大的当前功耗值(即由于SD4在线时相关的功耗值将为20W,并且SD6的当前功耗值为20W)。这样,分析器(245)确定该40W的更大的当前功耗值将超过30W的功耗阈值。
在第二个例子中,响应于确定使SD4在线将超过功耗阈值,分析器(245)执行(步骤545)进一步分析并且访问存储在规则库(265)中的一个或多个可预先配置的规则,例如图4示出的规则1。应当理解,所示出的规则仅为示例。
根据规则1,分析器(245)与第二写处理器(240)通信以获得执行数据并且确定其他的辅助存储设备在线(即SD6)。
响应于SD6在线,第二写处理器(240)通过向SD6发出写操作而更新SD6(根据第一“调用”子规则)。第二写处理器(240)使用与所述写操作相关的数据(即写操作已发出)更新日志(260)(根据第一“更新”子规则)。
所述日志的一个代表如下:
日志:
对SD6发出写操作
分析器(245)监测数据以确定(根据“确定”子规则)何时可以使辅助存储设备在线。在一个例子中,分析器(245)从管理员1接收第一数据,也就是说,一个使SD4在线的明确命令。在另一个例子中,分析器(245)从管理员1接收第二数据,也就是说,一个重设的阈值(例如阈值为80W),这样使SD4在线时就不会超过功耗阈值。
响应于确定可以使辅助存储设备在线,分析器(245)可操作用于调用控制器(250)(根据第二“调用”子规则)。控制器(250)可操作用于使SD4在线(步骤540)。
响应于使SD4在线,第一写处理器(235)将所述写操作和映射数据传递给第二写处理器(240)。
第二写处理器(240)通过向SD4发出写操作而更新(步骤525)(根据第三“调用”子规则)SD4。第二写处理器(240)使用与所述写操作相关的数据(即写操作已发出)更新日志(260)(根据第二“更新”子规则)。所述日志的一个代表如下:
日志:
对SD6发出写操作
对SD4发出写操作
一旦被映射的辅助存储设备已经被更新,其(即SD4)(以及任何剩余在线的辅助存储设备(例如SD6))可以有利地被关闭以节约功率。
存在于SD4(以及例如存在于至少SD5和SD6之一上的数据)上的已更新的数据可以用于DR目的。
如果分析器(245)确定另一个辅助存储设备不在线,这意味着所有的辅助存储设备都离线并且使一个辅助存储设备在线将超过功耗阈值。对于需要使辅助存储设备可用以用于DR目的的DR系统来说是不希望出现的。
这样,优选地,分析器(245)向管理员(即管理员1)传送一个警告(根据“传送”子规则)。优选地,响应于接收到所述警告,管理员1重设功耗阈值,这样使一个或多个辅助存储设备在线时就不会超过功耗阈值。
在第一个和第二个例子中,响应于非易失性存储器(255)更新而更新辅助存储设备。也就是说,如果辅助存储设备在线,则通过向所述辅助存储设备发出所述写操作而更新所述辅助存储设备。如果辅助存储设备不在线,则使所述辅助存储设备在线并且更新该辅助存储设备或者更新已经在线的另一个辅助存储设备。
替代地,可以响应于另一事件(即非易失性存储器(255)更新以外的事件)而更新辅助存储设备。例如,另一事件包括非易失性存储器(255)填满。在另一个例子中,另一事件包括一个时间值,例如与主站点活动增加或减少相关的时间值(例如每天18:00)。在另一个例子中,另一事件包括发生灾难。
有利地,所述优选实施例有助于降低与维护DR系统相关的成本。例如,由于辅助存储设备不需要总是在线,与所述辅助存储设备的供电、冷却等相关的成本降低。此外,由于冷却要求降低,辅助存储设备可以更为密集地布置。此外,通过提供高性能的非易失性存储器(255),对提供高性能(因而昂贵的)辅助存储设备的要求降低。
有利地,根据所述优选实施例,尽管辅助存储设备可以是低性能的辅助存储设备,当对非易失性存储器(255)(其中所述非易失性存储器具有相关的高性能)执行写操作时,所述写操作可以迅速完成。这样,就可以立即向主站点发回确认并且用户可以对主存储映像执行进一步操作。
有利地,由于所述非易失性存储器(255)总是可用,并且至少非易失性存储器(255)和所述辅助存储设备之一可以被更新用于DR目的,所述优选实施例提供可用性高的DR系统。
有利地,所述优选实施例提供具有成本效益,高效和可用性高的DR系统。
本领域普通技术人员将可以理解,本发明优选实施例的方法的部分或全部可以适当地并且有用地在一个逻辑装置或多个逻辑装置中实施,所述一个逻辑装置或多个逻辑装置包括布置用于执行所述方法的步骤的逻辑元件,并且该逻辑元件可以包括硬件组件、固件组件或其组合。
本领域普通技术人员同样可以理解,根据本发明优选实施例的全部或部分逻辑布置可以适当地在包括逻辑元件的逻辑装置中实施以执行所述方法的步骤,并且该逻辑元件可以包括如位于可编程逻辑阵列或特定用途集成电路中的逻辑门这样的元件。该逻辑布置可以进一步实施以允许元件在阵列或电路中使用例如虚拟硬件描述符语言临时地或永久地建立逻辑结构,其可以使用固定的或可传输的载波介质存储和传输。
可以理解,上文描述的方法和布置也可以适当地在运行于一个或多个处理器(图中未示出)上的软件中完全地或部分地实施,并且所述软件可以以一个或多个计算机程序元件的形式提供,所述计算机程序元件由任何适当的数据载体(图中也未示出)例如磁盘或光盘或类似载体承载。用于传送数据的信道类似地可以包括各种描述的存储介质以及信号承载介质如有线或无线的信号承载介质。
本发明可以进一步适当地作为用于计算机系统的计算机程序产品实施。该实施方法可以包括一系列计算机可读指令,所述指令固定在有形介质上例如计算机可读介质如磁盘,CD-ROM,ROM或硬盘,或者可以经由有形介质或使用无线技术的无形介质通过调制解调器或其他接口设备传送给计算机系统,所述有形介质包括但不限于光的或模拟的通信线路,所述无形介质包括但不限于微波、红外或其他传输技术。所述一系列计算机可读指令可全部或部分地实施上文描述的功能性。
本领域普通技术人员可以理解,所述计算机可读指令可以使用很多种程序设计语言编写,用于很多计算机体系结构或操作系统。此外,该指令可以使用任何现有或未来的存储技术存储,所述技术包括但不限于半导体、磁的或光的技术,或使用任何现有或未来的通信技术传输,所述通信技术包括但不限于光的、红外的或微波技术。可以考虑将这样的计算机程序产品作为附带有印刷文档或电子文档的可移除介质分布,例如紧缩套装软件,在系统ROM或硬盘上与计算机系统预装,或者通过网络例如因特网或万维网从服务器或电子公告板分布。
替代地,本发明的优选实施例可以采取部署一项服务的计算机实施方法来实现,该方法包括部署计算机程序代码的步骤,当所述计算机程序代码部署在计算机体系结构上并且执行时可以操作用于促使所述计算机系统执行所述方法的所有步骤。
本领域普通技术人员可以理解,在不背离本发明范围的前提下,可以对上文所述示例性实施例作出各种改进和更改。

Claims (33)

1.一种促进第一计算机系统灾难恢复的装置,其中存在于与所述第一计算机系统相关的第一存储设备上的第一数据可以从存在于与第二计算机系统相关的第二存储设备上的第二数据恢复,并且其中所述第二存储设备可以操作为具有相关的启动或关闭状态,所述装置包括:
接收器,用于接收用于更新所述第二存储设备的更新操作;以及
处理器,用于使用所述更新操作更新非易失性存储装置,并响应于非易性存储器装置的更新而更新所述第二存储设备,其中所述非易失性存储装置与所述第二计算机系统相关联,处理器操作为访问与所述第二存储设备相关的状态数据,并使用所述状态数据以确定所述第二存储设备是启动还是关闭;以及
控制器,其用于在更新所述第二存储设备之前,响应于所述第二存储设备具有相关的关闭状态,启动所述第二存储设备。
2.根据权利要求1所述的装置,其中所述第二计算机系统远离所述第一计算机系统。
3.根据权利要求1或2所述的装置,其中响应于所述第二存储设备具有相关的启动状态,所述处理器可以操作为使用所述更新操作更新所述第二存储设备。
4.根据权利要求1或2所述的装置,进一步包括分析器,其用于在更新所述第二存储设备之前,响应于所述第二存储设备具有相关的关闭状态,执行与启动所述第二存储设备相关的分析。
5.根据权利要求3所述的装置,进一步包括分析器,其用于在更新所述第二存储设备之前,响应于所述第二存储设备具有相关的关闭状态,执行与启动所述第二存储设备相关的分析。
6.根据权利要求4所述的装置,其中所述分析器将与启动所述第二存储设备相关的一个或多个值与阈值相比较。
7.根据权利要求5所述的装置,其中所述分析器将与启动所述第二存储设备相关的一个或多个值与阈值相比较。
8.根据权利要求6所述的装置,其中所述分析器可操作为访问包括与启动所述第二存储设备相关的规则的规则库。
9.根据权利要求7所述的装置,其中所述分析器可操作为访问包括与启动所述第二存储设备相关的规则的规则库。
10.根据权利要求4所述的装置,其中响应于执行分析,所述分析器调用所述控制器以启动所述第二存储设备。
11.根据权利要求5所述的装置,其中响应于执行分析,所述分析器调用所述控制器以启动所述第二存储设备。
12.根据权利要求6所述的装置,其中响应于执行分析,所述分析器调用所述控制器以启动所述第二存储设备。
13.根据权利要求7所述的装置,其中响应于执行分析,所述分析器调用所述控制器以启动所述第二存储设备。
14.根据权利要求8所述的装置,其中响应于执行分析,所述分析器调用所述控制器以启动所述第二存储设备。
15.根据权利要求9所述的装置,其中响应于执行分析,所述分析器调用所述控制器以启动所述第二存储设备。
16.根据权利要求1或2所述的装置,用于在灾难恢复前同步所述非易失性存储装置和所述第二存储设备。
17.一种促进第一计算机系统灾难恢复的方法,其中存在于与第一计算机系统相关的第一存储设备上的第一数据可以从存在于与第二计算机系统相关的第二存储设备上的第二数据恢复,并且其中所述第二存储设备可以操作为具有相关的启动或关闭状态,所述方法包括以下步骤:
接收用于更新所述第二存储设备的更新操作;以及
在更新所述第二存储设备之前,使用所述更新操作更新非易失性存储装置,并响应于非易性存储器装置的更新而更新所述第二存储设备,其中所述非易失性存储装置与所述第二计算机系统相关联,访问与所述第二存储设备相关的状态数据,并使用所述状态数据以确定所述第二存储设备是启动还是关闭;以及
在更新所述第二存储设备之前,响应于所述第二存储设备具有相关的关闭状态,启动所述第二存储设备。
18.根据权利要求17所述的方法,其中所述第二计算机系统远离所述第一计算机系统。
19.根据权利要求17或18所述的方法,进一步包括以下步骤:响应于所述第二存储设备具有相关的启动状态,使用更新操作更新所述第二存储设备。
20.根据权利要求17或18所述的方法,进一步包括以下步骤:在更新所述第二存储设备之前,响应于所述第二存储设备具有相关的关闭状态,执行与启动所述第二存储设备相关的分析。
21.根据权利要求19所述的方法,进一步包括以下步骤:在更新所述第二存储设备之前,响应于所述第二存储设备具有相关的关闭状态,执行与启动所述第二存储设备相关的分析。
22.根据权利要求17或18所述的方法,进一步包括以下步骤:将与启动所述第二存储设备相关的一个或多个值与阈值相比较。
23.根据权利要求19所述的方法,进一步包括以下步骤:将与启动所述第二存储设备相关的一个或多个值与阈值相比较。
24.根据权利要求20所述的方法,进一步包括以下步骤:将与启动所述第二存储设备相关的一个或多个值与阈值相比较。
25.根据权利要求17或18所述的方法,进一步包括以下步骤:访问包括与启动所述第二存储设备相关联的规则的规则库。
26.根据权利要求19所述的方法,进一步包括以下步骤:访问包括与启动所述第二存储设备相关联的规则的规则库。
27.根据权利要求20所述的方法,进一步包括以下步骤:访问包括与启动所述第二存储设备相关联的规则的规则库。
28.根据权利要求22所述的方法,进一步包括以下步骤:访问包括与启动所述第二存储设备相关联的规则的规则库。
29.根据权利要求23所述的方法,进一步包括以下步骤:访问包括与启动所述第二存储设备相关联的规则的规则库。
30.根据权利要求20所述的方法,进一步包括以下步骤:响应于执行分析的步骤,调用所述第二存储设备的启动。
31.根据权利要求21所述的方法,进一步包括以下步骤:响应于执行分析的步骤,调用所述第二存储设备的启动。
32.根据权利要求22所述的方法,进一步包括以下步骤:响应于执行分析的步骤,调用所述第二存储设备的启动。
33.根据权利要求17或18所述的方法,进一步包括以下步骤:在灾难恢复前同步所述非易失性存储装置和所述第二存储设备。
CN2007101390160A 2006-08-17 2007-07-23 促进灾难恢复的装置和方法 Expired - Fee Related CN101127000B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
GBGB0616375.2A GB0616375D0 (en) 2006-08-17 2006-08-17 An apparatus for facilitating disaster recovery
GB0616375.2 2006-08-17

Publications (2)

Publication Number Publication Date
CN101127000A CN101127000A (zh) 2008-02-20
CN101127000B true CN101127000B (zh) 2010-06-23

Family

ID=37081154

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2007101390160A Expired - Fee Related CN101127000B (zh) 2006-08-17 2007-07-23 促进灾难恢复的装置和方法

Country Status (3)

Country Link
US (2) US7873804B2 (zh)
CN (1) CN101127000B (zh)
GB (1) GB0616375D0 (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0616375D0 (en) * 2006-08-17 2006-09-27 Ibm An apparatus for facilitating disaster recovery
US8566636B2 (en) * 2011-01-27 2013-10-22 International Business Machines Corporation Application recovery in a file system
US8595716B2 (en) * 2011-04-06 2013-11-26 Robert Bosch Gmbh Failsafe firmware updates
WO2016040393A1 (en) 2014-09-08 2016-03-17 Microsoft Technology Licensing, Llc Application transparent continuous availability using synchronous replication across data stores in a failover cluster
CN106897171A (zh) * 2017-02-27 2017-06-27 郑州云海信息技术有限公司 一种用于虚拟环境下的存储设备的灾难恢复方法
US10210062B2 (en) * 2017-06-08 2019-02-19 International Business Machines Corporation Data storage system comprising an array of drives

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5337197A (en) * 1993-07-09 1994-08-09 International Business Machines Corporation Method and system for maintaining directory consistency in magneto-optic media
CN1178947A (zh) * 1996-10-03 1998-04-15 国际商业机器公司 在多系统环境中数据备份和恢复的方法及系统
CN1481534A (zh) * 2000-12-21 2004-03-10 ���ܿ���ϵͳ���޹�˾ 主系统和备份系统之间数据的恢复

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6052758A (en) * 1997-12-22 2000-04-18 International Business Machines Corporation Interface error detection and isolation in a direct access storage device DASD system
JP4434407B2 (ja) * 2000-01-28 2010-03-17 株式会社日立製作所 サブシステム及びこれらの統合システム
US7007141B2 (en) * 2001-01-30 2006-02-28 Data Domain, Inc. Archival data storage system and method
US7370217B2 (en) * 2001-11-16 2008-05-06 Intel Corporation Regulating file system device access
US7210004B2 (en) * 2003-06-26 2007-04-24 Copan Systems Method and system for background processing of data in a storage system
JP4060235B2 (ja) * 2003-05-22 2008-03-12 株式会社日立製作所 ディスクアレイ装置及びディスクアレイ装置の制御方法
US7089383B2 (en) * 2003-06-06 2006-08-08 Hewlett-Packard Development Company, L.P. State machine and system for data redundancy
US7039785B2 (en) * 2004-02-24 2006-05-02 Hitachi, Ltd. Method and apparatus for increasing an amount of memory on demand when monitoring remote mirroring performance
US7516346B2 (en) * 2004-10-28 2009-04-07 Nec Laboratories America, Inc. System and method for dynamically changing the power mode of storage disks based on redundancy and system load
US7389379B1 (en) * 2005-04-25 2008-06-17 Network Appliance, Inc. Selective disk offlining
JP5036158B2 (ja) * 2005-10-05 2012-09-26 株式会社日立製作所 情報処理システム及び情報処理システムの制御方法
JP4813872B2 (ja) * 2005-11-21 2011-11-09 株式会社日立製作所 計算機システム及び計算機システムのデータ複製方法
JP4834434B2 (ja) * 2006-03-17 2011-12-14 富士通株式会社 記憶装置の電源制御方法
JP2007293442A (ja) * 2006-04-21 2007-11-08 Hitachi Ltd ストレージシステム及びその制御方法
JP4794370B2 (ja) * 2006-06-20 2011-10-19 株式会社日立製作所 省電力とパフォーマンスを両立したストレージシステム及び記憶制御方法
GB0616375D0 (en) * 2006-08-17 2006-09-27 Ibm An apparatus for facilitating disaster recovery

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5337197A (en) * 1993-07-09 1994-08-09 International Business Machines Corporation Method and system for maintaining directory consistency in magneto-optic media
CN1178947A (zh) * 1996-10-03 1998-04-15 国际商业机器公司 在多系统环境中数据备份和恢复的方法及系统
CN1481534A (zh) * 2000-12-21 2004-03-10 ���ܿ���ϵͳ���޹�˾ 主系统和备份系统之间数据的恢复

Also Published As

Publication number Publication date
US20080065846A1 (en) 2008-03-13
GB0616375D0 (en) 2006-09-27
US20080065847A1 (en) 2008-03-13
CN101127000A (zh) 2008-02-20
US7873804B2 (en) 2011-01-18

Similar Documents

Publication Publication Date Title
CN101127000B (zh) 促进灾难恢复的装置和方法
CN101076782B (zh) 提供虚拟刀片服务器的方法和装置
US20060206666A1 (en) System and method for remotely accessible local virtual storage
CN102067184B (zh) 安全移动环境中访问应用的方法
CN102609281B (zh) 分布式软件补丁更新方法及系统
CN103403680A (zh) 计算对象的上下文历史
CN109683941A (zh) 一种基于单芯片在线加载的应答机软件升级方法
CN106201563A (zh) 启动参数的配置方法和装置、主板启动的方法和装置
CN101364193A (zh) 自动恢复bios的方法以及使用该方法的电脑与系统
CN100397286C (zh) 动态控制时钟信号的系统和方法
CN101344931A (zh) Rfid一体化机
CN101248416A (zh) 组件架构
JP2007233815A (ja) 情報処理システムおよび情報処理装置の割当管理方法
CN102495742A (zh) Bios的刷新方法和装置、以及计算机
CN102597963A (zh) 集群中的动态副本卷交换
CN105320718A (zh) 同步复制环境中的事务完成
CN100562864C (zh) 一种嵌入式异构多核体系片上通信的实现方法
JP2009193453A (ja) ブレードシステム、エンクロージャマネージャ、ブレード、bios管理方法及びbios管理プログラム
CN110502566B (zh) 近实时数据采集方法、装置、电子设备、存储介质
CN102164132A (zh) 一种智能移动微云多媒体终端
CN103389909B (zh) 一种渲染农场节点虚拟化部署系统及其应用
CN103473634A (zh) 数字影音图书馆维护监控方法
CN114281890B (zh) 一种bios带外管理系统及方法
CN106934664B (zh) 一种分布式税控开票服务器及系统
WO2020248754A1 (zh) 电子设备及集群服务器系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20100623

Termination date: 20160723

CF01 Termination of patent right due to non-payment of annual fee