CN100403272C - 用于处理到远程存储位置的故障恢复的方法、系统 - Google Patents

用于处理到远程存储位置的故障恢复的方法、系统 Download PDF

Info

Publication number
CN100403272C
CN100403272C CNB2004800235726A CN200480023572A CN100403272C CN 100403272 C CN100403272 C CN 100403272C CN B2004800235726 A CNB2004800235726 A CN B2004800235726A CN 200480023572 A CN200480023572 A CN 200480023572A CN 100403272 C CN100403272 C CN 100403272C
Authority
CN
China
Prior art keywords
storage system
volume
storage
internet resources
remote
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CNB2004800235726A
Other languages
English (en)
Other versions
CN1836217A (zh
Inventor
罗伯特·弗雷德里克·科恩
戴维·皮特森
鲁尼·威利·路德维格
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Google LLC
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN1836217A publication Critical patent/CN1836217A/zh
Application granted granted Critical
Publication of CN100403272C publication Critical patent/CN100403272C/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2056Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
    • G06F11/2058Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring using more than 2 mirrored copies
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2056Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
    • G06F11/2064Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring while ensuring consistency
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2056Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
    • G06F11/2069Management of state, configuration or failover
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2056Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
    • G06F11/2071Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring using a plurality of controllers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2056Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
    • G06F11/2082Data synchronisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Hardware Redundancy (AREA)
  • Techniques For Improving Reliability Of Storages (AREA)

Abstract

本发明提供一种用于管理数据的方法和系统。处理镜像策略,其表示将第一存储系统中的卷镜像到第二存储系统中的卷,并且将第二存储系统中的卷镜像到第三存储系统中的卷,其中第三存储系统处于第一地理位置,其相对于包括第一和第二存储系统的第二地理位置是遥远的。在第一地理位置处检测第一和第二存储系统的故障。对将I/O请求定向到第一存储系统中的卷的网络资源进行自动重新配置,以便将I/O请求定向到第三存储系统中的卷。检测第一存储系统的故障和第二存储系统的可用,响应于检测到第一存储系统的故障和第二存储系统的可用,重新配置网络资源以便将对第一存储系统中的卷的I/O请求定向到第二存储系统中的卷。

Description

用于处理到远程存储位置的故障恢复的方法、系统
技术领域
该本发明涉及一种用于处理到远程存储位置的故障恢复的系统、方法和程序。
背景技术
灾难恢复系统典型地解决两种故障,在单个时间点的突然灾难性故障或一段时间上的数据丢失。在第二种渐进性灾难中,可能丢失对卷的更新。为了帮助数据更新的恢复,可以在远程位置提供数据的拷贝。当应用系统将新的数据写入到主存储设备时,典型地进行这样的双重或映像(shadow)拷贝。国际商业机器公司(IBM),本专利申请的受让人,提供了两种用于在辅站点处维护数据的远程拷贝的系统,扩展远程拷贝(XRC)和对等远程拷贝(PPRC)。这些系统提供了用于在最近、安全的备份和系统故障之间恢复数据更新的方法。这样的数据映像系统还可以为了非恢复的目的如在远程站点的本地存取,提供附加的远程拷贝。在IBM出版物“Remote Copy:Administrator’s Guide and Reference”IBM文献号SC35-0169-02(IBM Copyright 1994,1996)中描述了这些IBM的XRC和PPRC系统。
在这样的备份系统中,在卷对中维护数据。卷对包括主存储设备中的卷和辅存储设备中的对应卷,其中辅存储设备中的对应卷包括在主卷中所维护的数据的相同拷贝。典型地,将在主直接存取存储设备(DASD)中维护卷对的主卷,并且在对主DASD上的数据进行映像的辅DASD中维护卷对的辅卷。可以提供主存储控制器,以便控制对主DASD的存取,并且可以提供辅存储控制器,以便控制对辅DASD的存取。
在IBM XRC环境中,将数据写入到主卷的应用系统包括sysplex计时器,其提供时刻(TOD)值作为数据写入的时间戳。当将数据集写入到主DASD中的卷时,应用系统对该数据集加上时间戳。数据更新的完整性涉及确保以与在主卷上完成更新相同的次序,在卷对的辅卷处完成它们。在XRC和其它现有技术系统中,由该系统代表应用程序提供的跨系统公共时间戳确定和维护跨越任意数目的存储系统上的任意数目的数据卷的数据更新的逻辑顺序。在很多应用程序如数据库系统中,除非发生了在前的写入,否则不能发生特定写入;否则,将危害数据完整性。其完整性依赖于在前数据写入的发生的这种数据写入被称为相关写入。例如如果客户开帐户、存款$400、然后取款$300,则对系统的取款更新依赖于其它写入即开账户和存款的发生。当将这样的相关事务从主卷拷贝到辅卷时,必须保持事务次序,以便保持相关写入操作的完整性。
当按其逻辑次序传输了所有写入,即,首先传输所有相关写入,然后传输依赖于其的写入时,主和辅DASD中的卷是一致的。在银行业务示例中,这意味着在取款之前将存款写入到辅卷。一致性组是使得以一致的方式确保相关写入的对主卷的更新的集合。例如,在银行业务示例中,这意味着取款事务是在与存款相同的一致性组中或在较后的组中;提取不能在较早的一致性组中。一致性组保持跨越卷和存储设备的数据一致性。例如,如果出现故障,则在取款之前,将存款写入到辅卷。这样,当从辅卷恢复数据时,所恢复的数据将是一致的。
一致性时间是系统从数据集的应用系统时间戳获得的时间。一致性组对于其时间戳等于或早于一致性时间戳的一致性组中的所有数据写入,具有一致性时间。在IBM XRC环境中,一致性时间是系统保证对辅卷的更新一致的最晚时间。只要应用程序将数据写入到主卷,一致性时间就增加。然而,如果更新活动停止,则由于不存在具有时间戳的数据集,以便提供用于另外的一致性组的时间参考,因此一致性时间不改变。如果将一致性组中的所有记录写入到辅卷,则所报告的一致性时间反映一致性组中的所有记录的最晚时间戳。在美国专利No.5,615,329和5,504,861中描述了这样的方法,其用于保持数据写入的顺序一致性并形成一致性组,以便保持在主DASD和辅DASD之间传输数据的顺序一致性,这些文献被转让给本专利申请的受让人IBM,并且在此将其全文引作参考。
一种保持跨越拷贝的一致性的技术是使用被称为SYSPLEX计时器的公共时钟源,对跨越主卷的数据加上时间戳。将在被定义为具有小于特定时间的时间戳的所有更新的组中传输更新。在另外实现中,可以确定主和辅存储控制器上的最晚更新的时间,并且用作一致性组的截止的时间将是具有主和辅控制器上的最高时间戳的更新的最小值。
另一种用于形成一致性组的技术是确定截止时间。被注明日期为到那个截止时间为止、由主控制器高速缓存管理的对主卷的任意更新被传输到辅控制器,以便存储在辅卷中。当传输一致性组中的数据时,主存储控制器对传输一致性组中的数据时的任何主机请求都将返回繁忙。在一致性组中的数据被传输并且主和辅存储控制器被同步,即,其时间戳小于截止时间的任何更新之后,则主控制器将停止向应用程序返回繁忙。这确保了主和副卷到冻结截止时间为止是一致的。
发明内容
本发明提供了一种用于管理数据的方法、程序和系统。处理镜像策略,其表示将第一存储系统中的卷镜像到第二存储系统中的卷,并且将第二存储系统中的卷镜像到第三存储系统中的卷,其中第三存储系统处于第一地理位置,其相对于包括第一和第二存储系统的第二地理位置是遥远的。在第二地理位置处检测第一和第二存储系统的故障。响应于检测到第一和第二存储系统的故障,通过更新配置文件对网络资源进行自动重新配置,以便将I/O请求定向到第三存储系统中的卷,其中所述配置文件用于将来自主机系统中的应用的I/O请求定向到第一存储系统中的卷。检测第一存储系统的故障和第二存储系统的可用,并且作为响应,响应于检测到第一存储系统的故障和第二存储系统的可用,重新配置网络资源以便将对第一存储系统中的卷的I/O请求定向到第二存储系统中的卷。在重新配置网络资源以便将对第一存储系统中的卷的I/O请求定向到第二存储系统中的卷之后,将对第二存储系统的更新拷贝到第三存储系统。
优选地,自动重新配置包括更新将I/O请求定向到第一存储系统中的卷的、与主机系统中的应用程序相关联的文件,以便将I/O请求定向到第二存储系统中的卷。
优选地,监控程序检测第一和第二存储系统的故障并且自动重新配置网络资源,以便定向对第一存储系统中的卷的I/O请求。此外,监控程序位于遥远的地理位置。
可选地,在第一和第二存储系统处检测到故障之后,将表示远程故障恢复操作的消息传送到网络管理员。然后,从网络管理员接收表示是执行还是不执行远程故障恢复的响应,其中如果响应表示执行远程故障恢复,则执行自动重新配置操作。
可选地,自动重新配置网络资源包括提供配置数据库,其表示要重新配置的网络设备处的网络资源。处理配置数据库,确定由网络资源使用的配置设置,以便使网络资源将对第一存储系统中的卷的I/O请求定向到第三存储系统,其中通过用第三存储系统的地址信息更新所确定的配置设置而执行重新配置。
可选地,对网络资源处执行代码,以便更新网络资源处的配置设置,从而将被定向到第一存储系统中的卷的I/O请求发送到第三存储系统。
可选地,位于第一地理位置的监控系统检测故障,自动重新配置网络资源,以使得将对第一存储系统中的卷的I/O请求定向到第二存储系统,并且将对第二存储系统中的卷的更新拷贝到第三存储系统。
优选地,从第一存储系统到第二存储系统同步地拷贝更新,并且从第二存储系统到第三存储系统异步地拷贝更新。
优选地,在自动重新配置之后,到在第二存储系统处最后接收更新的时间之前的时间点为止,位于第三存储系统的数据是一致的。
注意,第一和第二地理位置例如可以相隔至少几百英里。
可选地,以最小限度的对被定向到卷的I/O请求的中断,执行将对第一存储系统中的卷的I/O请求定向到第二存储系统中的卷的网络资源重新配置,以便提供对卷的连续可用性。
附图说明
现在将参考如附图所示的本发明的优选实施例,仅仅作为示例描述本发明,其中:
图1是示出实现本发明各方面的网络计算环境的方框图;
图2示出了在存储控制器处维护以便将数据镜像到不同位置的拷贝信息;
图3、4和5示出了根据本发明实现的为了将数据镜像到不同的存储位置而执行的操作;
图6示出了实现本发明另外方面的网络计算环境;
图7示出了根据本发明实现的包括在远程监控系统内的组件和信息;
图8示出了根据本发明实现的配置数据库信息,其提供关于在远程故障恢复的情况下要重新配置的资源的信息;
图9和10示出了根据本发明实现的为了处理故障恢复而执行的操作;以及
图11示出了网络环境中的计算组件如存储控制器、监控系统、主机、网络资源等的架构。
注意,在附图中,相同的标号始终表示对应的部分。
具体实施方式
图1示出了可以实现本发明各方面的网络计算环境。本地站点2包括两个存储控制器4a、4b,其中每个具有存储管理软件6a、6b,以及附连的存储系统8a、8b。存储控制器4a、4b可以位于相对封闭的地理区域,例如同一大楼,同一校园、同一城市等中的不同大楼。存储控制器4a、4b之间的连接10可以包括专线或网络,例如存储区域网络(SAN)、局域网(LAN)等。可选地,连接10可以包括内联网或因特网。可以相距本地站点数百或数千英里的远程站点20包括两个存储控制器22a、22b,其具有存储管理软件24a、24b,以及附连的存储系统26a、26b。连接28提供存储控制器4b和22a之间的长途连接,其中连接28可以包括由长途电信公司管理的专用光纤网络或由其维护的连接、因特网等。长途连接28可以是洲际的。存储控制器22a、22b之间的连接30提供相对短的连接(例如,几十英里内),其中存储控制器22a、22b可以位于相对封闭的地理区域,例如同一大楼,同一校园、同一城市等中的不同大楼。
位于本地2和远程20站点的主机系统(未示出)可以通过存储控制器4a、4b、22a、22b对存储系统8a、8b、26a、26b中的卷执行输入/输出(I/O)操作。主机系统可以通过在本技术领域内公知的任何网络或连接与存储控制器4a、4b、22a、22b通信。
存储控制器4a、4b、22a、22b还将包括处理器复合装置(processorcomplex)(未示出),并且可以包括在本技术领域内公知的任何存储控制器或服务器,例如IBM企业级存储服务器(ESS)7,39907存储控制器等。(企业级存储服务器是IBM的注册商标)。存储系统8a、8b、26a、26b可以包括存储设备阵列,例如“仅仅一组盘”(JBOD)、独立盘冗余阵列(RAID)阵列、虚拟化设备等。存储管理软件6a、6b、24a、24b可以包括允许数据镜像和发生故障的情况下的数据恢复的代码,例如包括在IBM PPRC扩展距离程序中以便允许在相对短和长的距离上进行数据镜像的代码。在文献号为SG24-6568-00的IBM出版物“IBM TotalStorage Enterprise Storage Server PPRC Extended Distance”(CopyrightIBM,June 2002)中描述了IBM PPRC扩展距离程序的更多细节,在此将其全文引作参考。
图1还示出了具有监控程序34的监控系统32,其中监控程序34对不同存储控制器4a、4b、22a、22b之间的镜像拷贝操作提供控制。由监控程序34启动的监控和拷贝操作可以在系统管理员的初始设置之后自动地运行,或者可以响应于由系统管理员执行的人工命令和监控而运行。镜像策略36包括关于如何管理不同的存储控制器4a、4b、22a、22b之间的镜像拷贝关系的信息。实际上,镜像策略36可以包括由监控程序34执行以便通过将命令发送到存储控制器4a来实现拷贝操作的代码。镜像策略36还可以指定初始的拷贝设置,例如表示存储系统8a中的卷和存储镜像卷的存储系统8b、26a、26b中的卷。例如,镜像策略36可以表示拷贝关系如存储系统8a、8b中的卷对的PPRC关系,其中存储系统8b中的指定卷提供存储系统8a中的指定卷的辅拷贝、和存储系统8b和26a之间的卷对的拷贝关系以及26a和26b之间的拷贝关系。
监控系统32具有分别与存储控制器6a和6b的连接38和40,其中,可以使用在本技术领域内公知的任何网络技术如小型计算机系统接口(SCSI)通道、光纤通道、企业级系统连接(ESCON)7、以太网等,实现这样的连接。在可选实现中,监控系统32可以仅仅连接到存储控制器4a。监控程序34能够通过存储控制器6a和/或6b将命令发布到存储控制器22a、22b。连接10、30、38、以及40可以是相同网络或不同网络的一部分。
图2示出了存储控制器4a、4b、22a、22b中的每个在存储器中维护以便管理镜像对辅控制器的更新的拷贝操作的拷贝信息50。拷贝信息50包括卷更新位图52,其中每个卷位图针对卷中的每个轨道包括一位。当存储控制器4a、4b、22a、22b接收对轨道的更新时,卷位图52中的对应位被“打开”,以表示更新。拷贝卷54信息识别两个存储控制器之间的拷贝关系所涉及的卷对。某些存储控制器如存储控制器4b可以为多个拷贝关系,例如与本地存储控制器4a的拷贝关系和与远程存储控制器22a的拷贝关系,维护拷贝信息。
图3、4和5示出了响应于处理镜像策略36中的信息而由监控程序34执行以便引起存储控制器4a、4b、22a、22b之间的镜像操作的操作。对于图3,监控程序34基于镜像策略36而启动镜像,该镜像策略36表示用于镜像的本地存储系统8a、8b,本地存储系统8b和远程存储系统10a之间,以及远程存储系统10a、10b之间的卷对。镜像策略36还可以表示在不同的存储系统之间镜像的拷贝操作的类型,例如对于存储系统8a、8b中的卷,使用异步拷贝操作;对于本地存储系统8b和远程存储系统26a中的卷,使用扩展距离拷贝操作,例如PPRC XD;以及对于远程存储系统26a、26b,使用FlashCopyJ(FlashCopy是国际商业机器公司的商标)。
FlashCopy7涉及在源和目标卷之间建立逻辑时间点关系。为每个卷维护诸如卷更新位图52(图2)的位图,其针对每个轨道具有一个位值,其表示轨道的数据是位于该卷还是另一卷中。当创建表示所有源数据服从(subject to)快闪拷贝的位图时,建立拷贝。后台拷贝操作将其位图值为“打开”的所有轨道从源卷拷贝到目标卷。在建立操作期间,将目标卷的位图中的所有位值设成“打开”,以表示目标卷的数据位于另一位置。在建立关系之后,如果试图将数据升级(stage)到轨道,则检查包括该轨道的卷的位图中的位值。如果位值为“打开”,从而表示轨道是服从时间点拷贝关系的目标轨道,则将目标轨道从源设备中的对应源轨道升级到目标高速缓存中。如果存取试图从源高速缓存降级源轨道,则检查具有目标轨道的对应目标卷的位图。如果目标位图中的位值为“打开”,则将目标轨道从源设备升级到目标高速缓存,然后从目标高速缓存降级到目标设备,并且将从目标高速缓存降级的轨道的目标位图中的位值设成“关闭”。只有在目标关系位图表示不再有任何将源轨道升级到目标高速缓存的需要之后,才准予对源轨道的存取。
对于图3,监控程序34将执行在镜像策略36中表示的存储控制器4a的所有主卷到辅存储系统4b中的对应卷的初始拷贝(在块102)。当完成在本地主4a和辅4b存储控制器之间的初始拷贝时,监控程序34则发送命令到本地辅控制器4b,以便将从本地主控制器4a拷贝的指定卷异步地拷贝/镜像到远程主存储控制器22a(在块104)。如果监控系统32和存储控制器4b之间存在直接连接40,则可以将在块104发送的命令直接发送到存储控制器4b,或者通过存储控制器4a和连接10发送该命令。此外,可以执行FlashCopy(快闪拷贝)操作,以便向存储系统26b中的指定卷拷贝存储系统26a的卷中的初始拷贝。
对于图4,在建立数据的初始拷贝之后,监控程序34开始让主存储控制器4a将更新异步地拷贝到本地辅存储控制器4b的处理,其中,可以异步地发送更新以避免对主机应用程序的任何延迟,或者可以同步地发送更新(在块150)。在块152,监控程序34将异步拷贝命令发送到主存储控制器4a,以便使存储控制器4a将在卷更新位图52(图2)中表示的任何数据更新,发送到辅存储控制器4b。作为响应,接收更新的辅存储控制器4b将在卷更新位图52中表示从本地主存储控制器4a接收的修改数据(在块154)。主存储控制器4a可以形成数据的一致性组,以便将一致性组中的数据发送到辅存储控制器4b,从而到一致性组的一致性时间为止,存储在辅存储控制器4b中的数据是一致的。
在某点,根据在镜像策略32中指定的参数,镜像程序34将执行图5的逻辑,以便暂停存储控制器4a、4b之间的拷贝,以便允许在本地存储控制器4b和远程存储控制器26a之间进行数据的远程镜像。存储控制器4a、4b之间的拷贝的暂停准许存储控制器4b和22a之间的远程镜像,使得所有跨卷/跨存储子系统的数据在由存储控制器4b和22a管理的所有卷之间是时间一致的。在控制器4b和22a之间提供了一致性之后,则在允许本地存储控制器4a、4b之间的同步拷贝之前,向存储控制器22b提供一致性。在暂停期间,仍然维护一致性点,如果在暂停期间发生灾难,则可以从其进行恢复。例如,如果本地主存储控制器4a出现故障,则在本地辅存储控制器4b和远程主存储控制器22a之间保持一致性,并且作为向远程存储控制器22b的FlashCopy的结果,保持一致性。如果丢失了本地存储控制器4a、4b,则可以从远程存储控制器22b恢复到一致性点为止的数据。此外,如果在本地站点存在故障,则在将数据拷贝到远程辅存储控制器22b之前,可以从远程主存储控制器22a恢复数据,并且在拷贝(例如,FlashCopy)之后,可以从远程辅存储控制器22b恢复数据。
在特定实现中,除了在形成提供给远程存储控制器4a的一致性组的暂停时间的期间之外,存储控制器4a、4b和22a之间的镜像可以是连续的。可以连续地执行图5的处理,例如一旦将数据的一致性组从主存储控制器4a拷贝到辅存储控制器4b,就执行图5的处理。可选地,镜像策略36可以指定在发生事件时,在一天内的特定时间、以例如每5小时的时间间隔执行图4的远程镜像,等等。
当初始化远程镜像(在块200)时,监控程序34将启动冻结操作的命令发送到本地主控制器4b,以便冻结本地主4a和辅4b存储控制器之间的镜像操作(在块202)。然后,监控程序34查询本地辅控制器的卷位图52,以便确定在存储系统8b处已被更新的轨道(在块204)。然后,将诸如PPRC命令的镜像命令直接通过连接40或通过主存储控制器4a,发送到本地辅控制器,以便异步地拷贝已被更新的在本地辅存储控制器4b的卷位图中表示的轨道(在块206)。然后,监控程序34将定期地使本地辅存储控制器4b将诸如PPRC-XD查询命令(例如,CQUERY命令)的扩展查询命令,发送到远程主控制器22a,以确定是否完成了从本地辅控制器4b的所有更新的镜像(在块208)。如果(在块210)如在从查询命令的输出信息中表示的那样,完成了远程镜像,则监控程序34使得将FlashCopy命令发送到远程主存储控制器22a,以便将在镜像策略36中表示的存储系统26a的卷拷贝到远程辅存储控制器22b(在块212)。如果在远程控制器22a、22b之间的拷贝操作是FlashCopy,则最初将拷贝指向主卷的指针以建立拷贝,然后将在后台上拷贝数据。如果没有完成远程镜像(在块210),则控制继续回到块208,以便继续查询直至完成了远程镜像为止。这样,在从本地存储控制器4b到远程存储控制器22a镜像更新之后,将数据的整个镜像拷贝,拷贝到远程辅存储控制器22b,以进一步强化(harden)远程站点20处的一致数据。
当完成在远程主26a和辅26b卷之间的FlashCopy操作(在块214)时,监控程序34将发出命令,以便结束主22a和辅22b存储控制器之间的镜像的暂停,并且继续主4a和辅4b存储控制器之间的更新的异步拷贝。
通过所述实现,在远程站点20中强化一致性组。如果整个本地站点2中的存储系统被毁灭,则可以从远程站点20恢复数据,并且到跨越所有存储系统8a、8b、8c、8d所维护的单个时间点为止,所有数据将是一致的,从而确保了完全的跨卷/跨存储子系统的数据完整性和数据一致性。在人类和自然历史的本时代中,其中灾难性事件可能导致整个地理区域和在该区域中维护的所有数据存储的大规模毁灭,这样的远程镜像是特别有用的。事实上,美国政府近来已经建议了在远程位置镜像重要和关键的数据,例如对于金融基础结构的维护是基本的数据,以便在整个区域内的数据存储被破坏的情况下,确保该基本数据的完整性和幸存。由联邦储备系统案号R-1123发表并且在“http://www.sec.gov/news/studies/34-47638.htm”(2003年4月最后更新)上可获得的、标题为“Interagency Paper on Sound Practices toStrengthen the Resilience of the U.S.Financial System”的出版物中描述了涉及使用远程数据存储以确保国家金融基础结构的数据完整性的美国政府目标,在此将其全文引作参考。
提供连续操作和灾难恢复
企业和商业计算的一个目标是最大化可用性,使得用户应用程序可以连续地访问数据。对于任务关键性的计算事务,包括对于国家保持良好状态是基本的计算事务,例如金融事务,这是特别重要的。另一目标是维护备份策略,其确保数据是一致的并频繁地被备份,并且提供最小化对数据可用性的破坏的灾难故障恢复策略。
图6示出了另一网络计算环境,其中,本地站点302具有连接到网络308的本地存储控制器304a、304b以及本地监控系统306,并且远程站点320具有也连接到网络308的远程存储控制器322a、322b以及远程监控系统324。本地302和远程320站点可以位于如关于图的站点2和20所述那样的地点。此外,存储控制器304a、304b、322a、322b可以包括关于图1所述的存储控制器4a、4b、22a、22b,其具有存储管理软件和与其附连的存储系统(未示出)。本地监控系统可以包括关于监控系统32(图1)所述的组件34和36。此外,主机330、用来解析被定向到网络地址的请求的命名空间332,以及诸如交换机等的网络资源334耦接到网络308。网络可以包括在本技术领域内公知的任何网络布局,诸如互连所有设备的单个网络如广域网(WAN)、因特网、和内联网等。此外,网络308可以包括相对于用来在存储控制器4a、4b、22a、22b(图1)之间传输数据的网络路径10、28和30是带外(out-of-band)的网络。例如,网络路径10、28和30可以包括专用光纤线路,并且网络308可以包括内联网、因特网、虚拟专用网络等。可选地,连接本地2和远程20站点的路径28可以是网络308的一部分。
图7示出了包括在远程监控系统324内的组件和信息,包括远程监控程序350、恢复设备的路径信息352和配置数据库354,其中配置数据库354包括关于网络资源的信息,以便在到远程站点320的故障恢复的情况下重新配置。最初可以将路径信息352设置到远程主存储器系统26a,但是在完成向远程辅存储系统26b的拷贝(在图5中的块212和24)之后,可以将路径信息设置到远程辅存储系统26b,以便在从本地站点302的故障恢复的情况下使用。路径信息352可以表示从本地站点302镜像数据的远程存储子系统的一个或多个网络地址,其可以包括在本地站点302的存储子系统8a、8b(图1)中使用的相同卷名和标识符。配置数据库354包括针对每个要更新的资源的条目,其中资源可以包括程序或设备。
图8示出了包括在每个配置数据库条目360内的信息,包括:设备 地址362:表示包括要重新配置的资源的网络308中的设备的地址; 配置组件364:识别正被更新的位于设备地址362的组件,例如应用程序、数据库程序、操作系统中的配置设置如注册表文件、或设备信息;配置代码366:诸如脚本程序的代码,当被执行时,将用恢复系统352的路径信息更新可配置组件364,以便应用程序或资源将请求定向到与在遇到了故障的位于本地站点的一个存储系统8a、8b相对的位于远程站点20的存储系统26a、26b。
图9示出了当在本地主存储控制器304a处检测到故障(在块400)时,由本地监控系统306中的监控程序34执行的操作。作为响应,本地监控程序306(或图1中的32)重新配置所有附连的主机330(图6)和其它网络资源334的控制块中的设备地址信息,以便指向本地辅存储,从而主机应用程序对于可用的本地辅存储控制器304b执行I/O(在块402)。本地监控系统306可以利用IBM HyperswapJ特性,以便切换主存储器子系统与辅存储子系统而不必停顿主机应用程序。(Hyperswap是国际商业机器公司的商标)。在共同未决且共同转让的以下专利申请中描述了该操作的进一步细节,即在2002年4月29日提交且具有申请序列号10/134,254、发明名称为“System and Method for ConcurrentLogical Device Swapping”,以及在2003年4月29日提交且具有申请序列号10/134,414、发明名称为“System and Method for AutomaticDynamic Address Switching”的专利申请,在此将其全文引作参考。在该切换之后,主机330应用程序和其它网络资源334可以对于幸存的本地辅存储控制器304b执行I/O。
本地监控系统306还将发出命令到本地辅存储控制器304b,以便将在幸存的本地辅存储处接收的任何更新异步地拷贝到远程主存储控制器322a(在块404)。这样,在以仅仅非常短暂的对主机I/O的中断进行到本地辅存储控制器304b的故障恢复之后,将在该故障恢复模式中在本地辅存储控制器304b处接收的更新异步地拷贝到远程主存储控制器322a,以便保持远程主存储控制器322a最新,并且可用于在本地辅存储控制器304b后来在故障恢复模式中操作时出现故障的情况下进行灾难恢复。通过在本地站点302处使用诸如IBM Hyperswap的故障恢复处理,这确保了本地站点302的连续操作,其中当在远程站点320处维护数据一致性和灾难恢复时,该故障恢复处理提供最短的停机时间。到本地辅存储系统8b(图1)的故障恢复可以由于不可预料的主存储系统8a处的故障而无计划地发生,或者如果存在在主存储系统8a处进行的维护则有计划地发生。无论哪种情况,本地监控系统306都将自动地实现到本地辅存储系统8b的故障恢复。
图10示出了由远程监控程序350执行以便处理整个本地站点302的故障的操作,其中该故障需要到远程站点320的故障恢复,远程站点320可以位于在地理上遥远的位置,例如相距数千英里。在块450,远程监控程序350启动在网络308上监控本地站点302的存储控制器304a、304b。然后,远程监控程序350将查询本地存储控制器304a、304b,以确定是否它们可用(在块452)。如果至少一个可用(在块454),则控制结束,这是因为可以由本地监控系统324处理任何故障恢复,其意味着整个本地站点304a没有遇到灾难性事件。如果两个存储控制器304a、304b都不可用,则远程监控程序350向一个或多个指定的远程网络管理员生成警报消息,以向他们通知运转中断(outage)并请求指导。在特定实现中,远程监控系统324对于是否进行远程故障恢复遵从人的决定。网络管理员可能确定本地站点302的故障原因是暂时性的并且不是由于本地站点302的灾难性事件,并且不需要远程故障恢复。远程网络管理员还可能确定本地站点302的系统将在很长的时间内不可用。在此情况下,网络管理员可以返回对来自远程监控系统324的通知的响应,表明要执行远程故障恢复或什么都不做。例如,如果远程监控系统324发送具有表示网络管理员的选择的复选框的电子邮件,则网络管理员可以在答复电子邮件中用一个选择的指示作出响应。可以使用在本技术领域内公知的任何其它的通知和响应机制。例如,响应于通过传呼机、电话等接收到电子自动化通知,网络管理员可以在网络308上从远程位置访问远程监控系统324,并且表示是否要执行远程故障恢复。
如果网络管理员没有表示要执行远程故障恢复(在块458),则控制结束。否则,如果选择了远程故障恢复选项,则针对配置数据库354中的每个条目360,在块460到464执行循环。对于条目i,远程监控程序350将在被识别位于设备地址362的设备处执行条目i中的配置代码366,以便将表示用于卷的设备地址的信息重新配置到在路径信息352中表示的设备地址(在块362)。可以通过更新由诸如数据库程序的应用程序使用的文件、以及提供关于附连设备的信息的操作系统文件如注册表文件,执行重新配置。此外,一个配置数据库条目360可以更新用来解析网络地址的网络命名空间362,以便将被定向到主存储器系统8a的地址解析到在路径信息352中识别的一个远程存储系统26a、26b。
在图10的逻辑中,拒绝主机的存储访问,直至远程监控系统重新配置该特定主机以使用远程存储为止。此外,到可能不包括在发生故障之前进行的对主存储器系统8a的最近更新的时间点为止,在远程存储系统26a、26b处可获得的数据是一致的。在此情况下,所有应用程序和其它网络资源将必须重新初始化到远程存储系统的一致性时间为止。
触发图9的远程故障恢复的故障可以发生在由于本地主存储系统8a的故障而执行图8的操作以使用本地辅存储系统8b之后。
在另外的实现中,远程监控程序350可以传送命令到网络308中的每个主机330和网络资源334,以便使得重新配置主机330和网络资源334的资源,以将远程存储系统识别为用于任何后继的被定向到本地主存储器系统8a的I/O请求的I/O设备,其中,每个主机330和网络资源334将包括用于处理并本地执行来自远程监控程序350的的命令以便重新配置资源以使用远程存储的代码。
所述实现提供了当数据被镜像到本地辅存储8b以及远程辅存储系统8a、8b时,保持连续可用性的技术。此外,所述实现提供了用于以最小化对主机I/O请求的中断的方式,处理到本地辅存储8b或远程辅存储26a、26b的故障恢复的技术。此外,如果在本地站点发生故障恢复,则更新仍然被镜像到远程站点,以便为了数据恢复的目的而保持远程站点一致。
另外的实现细节
用于在不同的存储位置之间镜像数据和处理故障恢复的所述技术可以使用标准编程和/或工程技术被实施为方法、设备或产品,以产生软件、固件、硬件、或其任意组合。这里使用的术语“产品”是指在硬件逻辑电路(例如,集成电路芯片、可编程门阵列(PGA)、专用集成电路(ASIC)等)或者诸如磁存储介质(例如,硬盘驱动器、软盘、磁带等)、光存储装置(CD-ROM、光盘等)、易失和非易失性存储器设备(例如,EEPROM、ROM、PROM、RAM、DRAM、SRAM、固件、可编程逻辑电路等)之类的计算机可读介质中实现的代码或逻辑。由处理器复合装置访问和执行计算机可读介质中的代码。其中实现了优选实施例的代码还可以通过传输介质进行存取,或者可以通过网络从文件服务器访问。在此情况下,其中实现了代码的产品可以包含诸如网络传输线、无线传输介质、通过空间传播的信号、无线电波、红外线信号等之类的传输介质。因此,“产品”可以包括其中包含了代码的介质。另外,“产品”可以包括其中包含、处理、和执行代码的硬件和软件组件的组合。当然,本领域的技术人员应当认识到,可以对该配置进行许多修改而不背离本发明的范围,而且产品可以包括在本技术领域内公知的任何信息承载介质。
所述实现是关于IBM PPRC扩展距离计算环境而描述的。然而,用于维护一致性的所述实现可被应用于在其它计算和供应商环境中维护一致性,并且使用与这里所述不同的其它数据拷贝协议和程序。
在特定实现中,以卷安排存储设备中的数据。在可选系统中,可以根据不同于卷的存储单元对在其上维护数据的存储区域进行分组,以便维护一致性,其中该存储单元以不同于会话的分组方式来分组。
在所述实现中,数据更新在从一个存储控制器被传输到另一个之前,以一致性组被组织。在可选实现中,在不同存储控制器之间拷贝的数据可以不包括一致性组。
由监控程序34执行的逻辑被描述成在与用于数据镜像的存储控制器4a、4b、22a、22b分离的监控系统32中实现。在可选实现中,可以由存储控制器4a、4b、22a、22b之一内的存储管理软件6a、6b、24a、24b执行上述监控程序34操作。监控系统32可以位于本地站点38之内或之外。此外,远程监控系统32可以位于远程站点320之内或之外。
用于建立逻辑时间点拷贝关系的所述实现被描述成与在高可用性是最重要的关键性数据环境中部署的系统一起使用。然而,本领域的技术人员应当理解,这里描述的时间点拷贝操作可以应用于高可用性不是绝对必要的、用于非关键性数据的存储系统。
在所述实现中,在重新配置网络资源之前,远程监控系统324等待网络管理员同意远程故障恢复。在可选实现中,远程监控系统324可以在检测到本地存储控制器不可用时自动地执行重新配置操作,或者执行进一步的测试和诊断,以便确定是否要执行重新配置操作。
图3-5所示的逻辑示出了以特定次序发生的特定事件。在可选实现中,可以以不同的次序执行特定操作、或者可以修改或者删除特定操作。此外,可以将步骤添加到上述逻辑中,并且仍然符合所述实现。此外,在此描述的操作可以顺序进行,或者可以并行处理特定操作。此外,可以由单个处理单元或者由分布式处理单元执行操作。
图11示出了诸如图1所示的监控系统和存储控制器的网络组件的计算机架构500的一种实现。架构500可以包括处理器502(例如,微处理器)、存储器504(例如,易失性存储器装置)、以及存储装置506(例如,非易失性存储装置如磁盘驱动器、光盘驱动器、磁带驱动器等)。存储装置506可以包括内部存储装置、或者附连或网络可存取的存储装置。以在本技术领域内公知的方式,将存储装置506中的程序装载到存储器504中并且由处理器502执行。该架构还包括网卡508,以便使得能够与网络通信。输入设备510用来将用户输入提供给处理器502,并且可以包括键盘、鼠标、输入笔、麦克风、触摸感应显示屏、或者在本技术领域内公知的任何其它激活或输入机构。输出设备512能够呈现从处理器502或其它组件传送的信息,例如显示监视器、打印机、存储装置等。

Claims (12)

1.一种用于管理数据的方法,包括:
处理镜像策略,其表示将第一存储系统中的卷镜像到第二存储系统中的卷,并且将第二存储系统中的卷镜像到第三存储系统中的卷,其中第三存储系统处于第一地理位置,其相对于包括第一和第二存储系统的第二地理位置是遥远的;
在第二地理位置处检测第一和第二存储系统的故障;
响应于检测到第一和第二存储系统的故障,监控程序通过更新配置文件对网络资源进行自动重新配置,以便将来自主机系统中的应用对第一存储系统中的卷的I/O请求定向到第三存储系统中的卷;
检测第一存储系统的故障和第二存储系统的可用;
响应于检测到第一存储系统的故障和第二存储系统的可用,重新配置网络资源以便将对第一存储系统中的卷的I/O请求定向到第二存储系统中的卷;以及
重新配置网络资源以便将对第一存储系统中的卷的I/O请求定向到第二存储系统中的卷之后,将对第二存储系统的更新拷贝到第三存储系统。
2.如权利要求1所述的方法,其中所述监控程序还执行以下步骤:检测第一和第二存储系统的故障并且自动重新配置网络资源,以便定向对第一存储系统中的卷的I/O请求,并且其中所述监控程序的地理位置相对于所述第一地理位置和第二地理位置是遥远的。
3.如权利要求1所述的方法,还包括:
在第一和第二存储系统处检测到故障之后,将表示远程故障恢复操作的消息传送到网络管理员;以及
从网络管理员接收表示是执行还是不执行远程故障恢复的响应,其中如果响应表示执行远程故障恢复,则执行自动重新配置操作。
4.如权利要求1所述的方法,其中自动重新配置网络资源包括:
提供配置数据库,其表示要重新配置的网络设备处的网络资源;以及
处理配置数据库,以确定由网络资源使用的配置设置,以便在检测到第一存储系统和第二存储系统的故障的情况下使网络资源将对第一存储系统中的卷的I/O请求定向到第三存储系统,其中通过用第三存储系统的地址信息更新所确定的配置设置而执行重新配置。
5.如权利要求1所述的方法,还包括:
从第一存储系统到第二存储系统同步地拷贝更新;以及
从第二存储系统到第三存储系统异步地拷贝更新。
6.如权利要求1所述的方法,其中以最小化的中断方式执行被定向到卷的I/O请求,执行将对第一存储系统中的卷的I/O请求定向到第二存储系统中的卷的网络资源重新配置,以便提供对卷的连续可用性。
7.一种用于管理数据的系统,包括:
具有卷的第一存储系统;
具有卷的第二存储系统;
具有卷的第三存储系统;
用于处理镜像策略的装置,该镜像策略表示将第一存储系统中的卷镜像到第二存储系统中的卷,并且将第二存储系统中的卷镜像到第三存储系统中的卷,其中第三存储系统处于第一地理位置,其相对于包括第一和第二存储系统的第二地理位置是遥远的;
用于在第二地理位置处检测第一和第二存储系统的故障的装置;
响应于检测到第一和第二存储系统的故障,通过更新配置文件对网络资源进行自动重新配置,以便将来自主机系统中的应用对第一存储系统中的卷的I/O请求定向到第三存储系统中的卷的装置,
用于检测第一存储系统的故障和第二存储系统的可用的装置;
用于响应于检测到第一存储系统的故障和第二存储系统的可用,重新配置网络资源以便将对第一存储系统中的卷的I/O请求定向到第二存储系统中的卷的装置;以及
用于在重新配置网络资源以便将对第一存储系统中的卷的I/O请求定向到第二存储系统中的卷之后,将对第二存储系统的更新拷贝到第三存储系统的装置。
8.如权利要求7所述的系统,其中用于检测第一和第二存储系统的故障并且自动重新配置网络资源的装置的地理位置相对于所述第一地理位置和第二地理位置是遥远的。
9.如权利要求7所述的系统,还包括:
用于在第一和第二存储系统处检测到故障之后,将表示远程故障恢复操作的消息传送到网络管理员的装置;以及
用于从网络管理员接收表示是执行还是不执行远程故障恢复的响应的装置,其中如果响应表示执行远程故障恢复,则执行自动重新配置操作。
10.如权利要求7所述的系统,其中用于自动重新配置网络资源的装置还执行:
提供配置数据库,其表示要重新配置的网络设备处的网络资源;以及
处理配置数据库,以确定由网络资源使用的配置设置,以便在检测到第一存储系统和第二存储系统的故障的情况下使网络资源将对第一存储系统中的卷的I/O请求定向到第三存储系统,其中通过用第三存储系统的地址信息更新所确定的配置设置而执行重新配置。
11.如权利要求7所述的系统,还包括:
用于从第一存储系统到第二存储系统同步地拷贝更新的装置;以及
用于从第二存储系统到第三存储系统异步地拷贝更新的装置。
12.如权利要求7所述的系统,其中用于重新配置网络资源以便将对第一存储系统中的卷的I/O请求定向到第二存储系统中的卷的装置,以最小化的中断方式执行被定向到卷的I/O请求,以便提供对卷的连续可用性。
CNB2004800235726A 2003-06-18 2004-06-15 用于处理到远程存储位置的故障恢复的方法、系统 Active CN100403272C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/465,726 2003-06-18
US10/465,726 US7043665B2 (en) 2003-06-18 2003-06-18 Method, system, and program for handling a failover to a remote storage location

Publications (2)

Publication Number Publication Date
CN1836217A CN1836217A (zh) 2006-09-20
CN100403272C true CN100403272C (zh) 2008-07-16

Family

ID=33517578

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2004800235726A Active CN100403272C (zh) 2003-06-18 2004-06-15 用于处理到远程存储位置的故障恢复的方法、系统

Country Status (8)

Country Link
US (1) US7043665B2 (zh)
EP (1) EP1639470B1 (zh)
JP (1) JP4405509B2 (zh)
CN (1) CN100403272C (zh)
AT (1) ATE357019T1 (zh)
DE (1) DE602004005344T2 (zh)
TW (1) TWI307851B (zh)
WO (1) WO2005071544A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10162563B2 (en) 2016-12-02 2018-12-25 International Business Machines Corporation Asynchronous local and remote generation of consistent point-in-time snap copies

Families Citing this family (107)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7292723B2 (en) * 2003-02-26 2007-11-06 Walker Digital, Llc System for image analysis in a network that is structured with multiple layers and differentially weighted neurons
TW200417851A (en) * 2003-03-07 2004-09-16 Wistron Corp Computer system capable of maintaining system's stability while memory is unstable and memory control method
US7287186B2 (en) * 2003-06-02 2007-10-23 Surgient Inc. Shared nothing virtual cluster
JP2005157825A (ja) * 2003-11-27 2005-06-16 Hitachi Ltd 障害復旧機能を有する計算機システム、および、障害復旧方法
JP2005018193A (ja) * 2003-06-24 2005-01-20 Hitachi Ltd ディスク装置のインタフェースコマンド制御方法ならびに計算機システム
US7240080B2 (en) * 2003-07-30 2007-07-03 International Business Machines Corporation Method and apparatus for determining using least recently used protocol if one or more computer files should be written to one or more information storage media and synchronously providing one or more computer files between first and storage devices
US7769004B2 (en) * 2003-09-26 2010-08-03 Surgient, Inc. Network abstraction and isolation layer for masquerading machine identity of a computer
JP2005100259A (ja) * 2003-09-26 2005-04-14 Hitachi Ltd ドライブの2重障害を防止するアレイ型ディスク装置、プログラム、及び方法
US7188272B2 (en) * 2003-09-29 2007-03-06 International Business Machines Corporation Method, system and article of manufacture for recovery from a failure in a cascading PPRC system
US7278049B2 (en) * 2003-09-29 2007-10-02 International Business Machines Corporation Method, system, and program for recovery from a failure in an asynchronous data copying system
US7376859B2 (en) * 2003-10-20 2008-05-20 International Business Machines Corporation Method, system, and article of manufacture for data replication
JP4307982B2 (ja) * 2003-12-19 2009-08-05 株式会社日立製作所 データ多重化制御方法
JP2005196683A (ja) * 2004-01-09 2005-07-21 Hitachi Ltd 情報処理システム、情報処理装置、及び情報処理システムの制御方法
JP2005228170A (ja) * 2004-02-16 2005-08-25 Hitachi Ltd 記憶装置システム
US7120769B2 (en) * 2004-03-08 2006-10-10 Hitachi, Ltd. Point in time remote copy for multiple sites
US7277997B2 (en) * 2004-03-16 2007-10-02 International Business Machines Corporation Data consistency for mirroring updatable source data storage
JP2005284980A (ja) * 2004-03-30 2005-10-13 Toshiba Solutions Corp 2重化システム及びリモートディスクミラーリングの初期化処理方法
JP4382602B2 (ja) * 2004-04-23 2009-12-16 株式会社日立製作所 リモートコピーシステム
JP4476683B2 (ja) * 2004-04-28 2010-06-09 株式会社日立製作所 データ処理システム
US7340646B2 (en) * 2004-05-03 2008-03-04 International Business Machines Corporation Apparatus, system, and method for resource group backup
US7058731B2 (en) * 2004-08-03 2006-06-06 Hitachi, Ltd. Failover and data migration using data replication
US7299376B2 (en) * 2004-08-25 2007-11-20 International Business Machines Corporation Apparatus, system, and method for verifying backup data
US20060098790A1 (en) * 2004-11-05 2006-05-11 Mendonca John J Automatically configuring remote monitoring of a provisionable resource
JP4596889B2 (ja) 2004-11-08 2010-12-15 株式会社日立製作所 ストレージシステムの管理方法
JP4671399B2 (ja) * 2004-12-09 2011-04-13 株式会社日立製作所 データ処理システム
JP4688514B2 (ja) * 2005-02-14 2011-05-25 株式会社日立製作所 ストレージ制御装置
US7672979B1 (en) * 2005-04-22 2010-03-02 Symantec Operating Corporation Backup and restore techniques using inconsistent state indicators
US7523176B2 (en) * 2005-08-02 2009-04-21 International Business Machines Corporation Method, apparatus, and computer program product for reconfiguring a storage area network to support the execution of an application automatically upon execution of the application
US7356638B2 (en) * 2005-10-12 2008-04-08 International Business Machines Corporation Using out-of-band signaling to provide communication between storage controllers in a computer storage system
JP4721875B2 (ja) 2005-11-04 2011-07-13 株式会社日立製作所 ホストがデータにアクセスするためのアクセス環境を管理する記憶制御方法
US7660955B2 (en) * 2005-12-01 2010-02-09 International Business Machines Corporation Node polling in consistency group formation
US7823007B2 (en) * 2006-02-17 2010-10-26 International Business Machines Corporation Apparatus, system, and method for switching a volume address association in a point-in-time copy relationship
US7603581B2 (en) * 2006-03-17 2009-10-13 International Business Machines Corporation Remote copying of updates to primary and secondary storage locations subject to a copy relationship
US7571292B2 (en) 2006-03-21 2009-08-04 International Business Machines Corporation Producing tertiary instant virtual copies without volume suspension
US7702866B2 (en) * 2006-03-31 2010-04-20 International Business Machines Corporation Use of volume containers in replication and provisioning management
US8078728B1 (en) 2006-03-31 2011-12-13 Quest Software, Inc. Capacity pooling for application reservation and delivery
JP4920291B2 (ja) * 2006-04-18 2012-04-18 株式会社日立製作所 計算機システム、アクセス制御方法及び管理計算機
US7657782B2 (en) * 2006-06-08 2010-02-02 International Business Machines Corporation Creating and managing multiple virtualized remote mirroring session consistency groups
US7526668B2 (en) * 2006-06-08 2009-04-28 Hitachi, Ltd. Failover method of remotely-mirrored clustered file servers
US7877628B2 (en) * 2006-06-08 2011-01-25 International Business Machines Corporation Mirroring data between primary and secondary sites
US9015520B2 (en) 2006-06-29 2015-04-21 Dssdr, Llc Data transfer and recovery
US8990613B2 (en) 2006-06-29 2015-03-24 Dssdr, Llc Data transfer and recovery
US7487383B2 (en) 2006-06-29 2009-02-03 Dssdr, Llc Data transfer and recovery process
GB0616257D0 (en) * 2006-08-16 2006-09-27 Ibm Storage management system for preserving consistency of remote copy data
US7584378B2 (en) * 2006-09-07 2009-09-01 International Business Machines Corporation Reconfigurable FC-AL storage loops in a data storage system
US7627729B2 (en) * 2006-09-07 2009-12-01 International Business Machines Corporation Apparatus, system, and method for an improved synchronous mirror swap
JP5235292B2 (ja) * 2006-09-29 2013-07-10 富士通株式会社 コンピュータシステム、バックアップシステムへの移行方法、バックアップシステムへの移行プログラム、監視装置、端末装置及びバックアップシステム
JP5057366B2 (ja) 2006-10-30 2012-10-24 株式会社日立製作所 情報システム及び情報システムのデータ転送方法
JP4902403B2 (ja) 2006-10-30 2012-03-21 株式会社日立製作所 情報システム及びデータ転送方法
GB0622140D0 (en) * 2006-11-07 2006-12-20 Ibm Suspension of asynchronous remote copying system
US7734885B2 (en) * 2007-06-14 2010-06-08 International Business Machines Corporation Execution of point-in-time copy operations in continuous mirroring environments
JP2009003499A (ja) * 2007-06-19 2009-01-08 Hitachi Ltd ファイル共有システム及びファイル共有システムを用いて単一の論理的ディレクトリ構成を生成する方法
US7822892B2 (en) * 2007-07-19 2010-10-26 International Business Machines Corporation Managing the copying of writes from primary storages to secondary storages across different networks
US7904682B2 (en) * 2007-07-19 2011-03-08 International Business Machines Corporation Copying writes from primary storages to secondary storages across different networks
US8131957B2 (en) * 2007-08-16 2012-03-06 International Business Machines Corporation Splitting writes between a storage controller and replication engine
US8024534B2 (en) * 2007-08-16 2011-09-20 International Business Machines Corporation Replication engine communicating with a splitter to split writes between a storage controller and replication engine
JP5034790B2 (ja) * 2007-08-31 2012-09-26 富士ゼロックス株式会社 データ処理システム
JP2009075675A (ja) * 2007-09-18 2009-04-09 Nec Computertechno Ltd 整合性チェック方法及び整合性チェックシステム
US8194674B1 (en) 2007-12-20 2012-06-05 Quest Software, Inc. System and method for aggregating communications and for translating between overlapping internal network addresses and unique external network addresses
US8307129B2 (en) * 2008-01-14 2012-11-06 International Business Machines Corporation Methods and computer program products for swapping synchronous replication secondaries from a subchannel set other than zero to subchannel set zero using dynamic I/O
US7761610B2 (en) * 2008-01-25 2010-07-20 International Business Machines Corporation Methods and computer program products for defining synchronous replication devices in a subchannel set other than subchannel set zero
JP2009205505A (ja) * 2008-02-28 2009-09-10 Fujitsu Ltd サテライト管理装置、方法、及び、プログラム
US7962782B2 (en) 2008-05-20 2011-06-14 International Business Machines Corporation Modifying connection records
US8516173B2 (en) * 2008-07-28 2013-08-20 International Business Machines Corporation Swapping PPRC secondaries from a subchannel set other than zero to subchannel set zero using control block field manipulation
EP3699765A1 (en) * 2008-08-08 2020-08-26 Amazon Technologies, Inc. Providing executing programs with reliable access to non-local block data storage
US8019732B2 (en) 2008-08-08 2011-09-13 Amazon Technologies, Inc. Managing access of multiple executing programs to non-local block data storage
US20100274966A1 (en) * 2009-04-24 2010-10-28 Hitachi, Ltd. High availabilty large scale it systems with self recovery functions
JP5286212B2 (ja) * 2009-09-29 2013-09-11 株式会社日立製作所 ストレージクラスタ環境でのリモートコピー制御方法及びシステム
US20110196825A1 (en) * 2009-09-29 2011-08-11 Hitachi, Ltd. Storage system and data duplication method in the same
US8479210B2 (en) * 2009-10-20 2013-07-02 International Business Machines Corporation Evenly distributing workload and providing a predictable failover scenario in a data replication system
US8949565B2 (en) * 2009-12-27 2015-02-03 Intel Corporation Virtual and hidden service partition and dynamic enhanced third party data store
US8627138B1 (en) * 2010-03-26 2014-01-07 Emc Corporation Data protection system and method
US9141289B2 (en) * 2010-03-30 2015-09-22 Os Nexus, Inc. Intelligent data storage utilizing one or more records
CN102033792A (zh) * 2010-12-17 2011-04-27 浪潮(北京)电子信息产业有限公司 一种基于虚拟化的数据远程恢复方法及装置
US8566635B2 (en) * 2011-01-21 2013-10-22 Lsi Corporation Methods and systems for improved storage replication management and service continuance in a computing enterprise
US8566636B2 (en) * 2011-01-27 2013-10-22 International Business Machines Corporation Application recovery in a file system
US9811421B1 (en) * 2011-03-31 2017-11-07 EMC IP Holding Company LLC Managing multi-step storage management operations by using fault recovery policies
WO2013021451A1 (ja) * 2011-08-08 2013-02-14 富士通株式会社 データ管理方法、データ管理プログラム、及び情報処理装置
US8909985B2 (en) * 2012-07-12 2014-12-09 International Business Machines Corporation Multiple hyperswap replication sessions
US9251231B2 (en) 2012-10-17 2016-02-02 International Business Machines Corporation Merging an out of synchronization indicator and a change recording indicator in response to a failure in consistency group formation
US9251230B2 (en) 2012-10-17 2016-02-02 International Business Machines Corporation Exchanging locations of an out of synchronization indicator and a change recording indicator via pointers
US20140324781A1 (en) * 2013-04-30 2014-10-30 Unisys Corporation Input/output (i/o) procedure for database backup to mass storage
US20140365440A1 (en) * 2013-06-05 2014-12-11 Avaya Inc. High availability snapshot core
US9405628B2 (en) 2013-09-23 2016-08-02 International Business Machines Corporation Data migration using multi-storage volume swap
US9264494B2 (en) * 2013-10-21 2016-02-16 International Business Machines Corporation Automated data recovery from remote data object replicas
US9619331B2 (en) 2014-01-18 2017-04-11 International Business Machines Corporation Storage unit replacement using point-in-time snap copy
US9280430B2 (en) * 2014-05-13 2016-03-08 Netapp, Inc. Deferred replication of recovery information at site switchover
US9626367B1 (en) 2014-06-18 2017-04-18 Veritas Technologies Llc Managing a backup procedure
US9747047B2 (en) 2014-06-25 2017-08-29 International Business Machines Corporation Performing a remote point-in-time copy to a source and target storages in further mirror copy relationships
US9832261B2 (en) * 2014-09-30 2017-11-28 Emc Corporation Cloud consistency technology
JP6262879B2 (ja) * 2014-11-28 2018-01-17 株式会社日立製作所 ストレージシステム
CN105159794A (zh) * 2015-08-18 2015-12-16 浪潮(北京)电子信息产业有限公司 镜像实现系统和方法
CN105278522B (zh) * 2015-10-16 2018-09-14 浪潮(北京)电子信息产业有限公司 一种远程复制方法及系统
CN105353984B (zh) * 2015-11-05 2019-01-11 北京飞杰信息技术有限公司 基于软磁盘阵列的高可用集群控制器、控制方法及系统
US11226985B2 (en) 2015-12-15 2022-01-18 Microsoft Technology Licensing, Llc Replication of structured data records among partitioned data storage spaces
US10248709B2 (en) 2015-12-15 2019-04-02 Microsoft Technology Licensing, Llc Promoted properties in relational structured data
US10235406B2 (en) 2015-12-15 2019-03-19 Microsoft Technology Licensing, Llc Reminder processing of structured data records among partitioned data storage spaces
US10599676B2 (en) 2015-12-15 2020-03-24 Microsoft Technology Licensing, Llc Replication control among redundant data centers
JP6407946B2 (ja) * 2016-12-12 2018-10-17 ファナック株式会社 機器情報及び位置情報の管理装置及び管理システム
US10884884B2 (en) * 2017-03-23 2021-01-05 International Business Machines Corporation Reversal of the direction of replication in a remote copy environment by tracking changes associated with a plurality of point in time copies
CN109408279A (zh) * 2017-08-16 2019-03-01 北京京东尚科信息技术有限公司 数据备份方法和装置
US10635541B2 (en) 2017-10-23 2020-04-28 Vmware, Inc. Fine-grained conflict resolution in a shared log
US10649981B2 (en) * 2017-10-23 2020-05-12 Vmware, Inc. Direct access to object state in a shared log
US11392567B2 (en) 2017-10-30 2022-07-19 Vmware, Inc. Just-in-time multi-indexed tables in a shared log
CN108762988B (zh) * 2018-05-31 2022-04-22 郑州云海信息技术有限公司 一种数据处理的方法以及相关设备
CN110888598B (zh) * 2019-10-09 2024-01-19 宜鼎国际股份有限公司 数据储存装置、电子设备及可远程控制电子设备的系统
US11868622B2 (en) * 2020-02-25 2024-01-09 Pure Storage, Inc. Application recovery across storage systems

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5633999A (en) * 1990-11-07 1997-05-27 Nonstop Networks Limited Workstation-implemented data storage re-routing for server fault-tolerance on computer networks
US6144999A (en) * 1998-05-29 2000-11-07 Sun Microsystems, Incorporated Method and apparatus for file system disaster recovery
WO2001035244A1 (en) * 1999-11-11 2001-05-17 Miralink Corporation Flexible remote data mirroring
CN1359216A (zh) * 2000-11-12 2002-07-17 莱特司给网络股份有限公司 分布系统中的数据镜像恢复
US20030014433A1 (en) * 2001-07-13 2003-01-16 Sun Microsystems, Inc. Storage network data replicator

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5504861A (en) 1994-02-22 1996-04-02 International Business Machines Corporation Remote data duplexing
US5615329A (en) 1994-02-22 1997-03-25 International Business Machines Corporation Remote data duplexing
US6029231A (en) 1996-12-03 2000-02-22 Emc Corporation Retrieval of data stored on redundant disks across a network using remote procedure calls
US6845465B2 (en) * 2001-09-17 2005-01-18 Sun Microsystems, Inc. Method and system for leveraging spares in a data storage system including a plurality of disk drives
US6820180B2 (en) * 2002-04-04 2004-11-16 International Business Machines Corporation Apparatus and method of cascading backup logical volume mirrors

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5633999A (en) * 1990-11-07 1997-05-27 Nonstop Networks Limited Workstation-implemented data storage re-routing for server fault-tolerance on computer networks
US6144999A (en) * 1998-05-29 2000-11-07 Sun Microsystems, Incorporated Method and apparatus for file system disaster recovery
WO2001035244A1 (en) * 1999-11-11 2001-05-17 Miralink Corporation Flexible remote data mirroring
CN1359216A (zh) * 2000-11-12 2002-07-17 莱特司给网络股份有限公司 分布系统中的数据镜像恢复
US20030014433A1 (en) * 2001-07-13 2003-01-16 Sun Microsystems, Inc. Storage network data replicator

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10162563B2 (en) 2016-12-02 2018-12-25 International Business Machines Corporation Asynchronous local and remote generation of consistent point-in-time snap copies

Also Published As

Publication number Publication date
EP1639470B1 (en) 2007-03-14
JP2006527875A (ja) 2006-12-07
TW200540680A (en) 2005-12-16
DE602004005344T2 (de) 2007-11-29
US7043665B2 (en) 2006-05-09
JP4405509B2 (ja) 2010-01-27
ATE357019T1 (de) 2007-04-15
CN1836217A (zh) 2006-09-20
TWI307851B (en) 2009-03-21
WO2005071544A1 (en) 2005-08-04
DE602004005344D1 (de) 2007-04-26
EP1639470A1 (en) 2006-03-29
US20040260899A1 (en) 2004-12-23

Similar Documents

Publication Publication Date Title
CN100403272C (zh) 用于处理到远程存储位置的故障恢复的方法、系统
US7467168B2 (en) Method for mirroring data at storage locations
US7225294B2 (en) Storage system control method, storage system, information processing system, managing computer and program
US7660955B2 (en) Node polling in consistency group formation
CN100570574C (zh) 用于管理存储系统之间的数据拷贝的系统和方法
US7516356B2 (en) Method for transmitting input/output requests from a first controller to a second controller
US7577788B2 (en) Disk array apparatus and disk array apparatus control method
US7188222B2 (en) Method, system, and program for mirroring data among storage sites
US7734883B2 (en) Method, system and program for forming a consistency group
US7188187B2 (en) File transfer method and system
CN101755257B (zh) 管理在不同的网络上将写入从首要存储器拷贝到次要存储器
CN100397355C (zh) 用于一致性组形成中的数据传送管理的方法和系统
US8010831B1 (en) High availability data center
CN1983153A (zh) 数据处理系统中执行远程复制的方法和存储数据的方法
JP3572928B2 (ja) バックアップ機能付オンラインデータベース情報処理システム
US20060090050A1 (en) Remote management commands in a mass storage system
JP2021149773A (ja) ハイブリッドクラウドにおけるデータを保護する方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: GOOGLE INC.

Free format text: FORMER OWNER: INTERNATIONAL BUSINESS MACHINES CORP.

Effective date: 20120503

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20120503

Address after: American California

Patentee after: Google Inc.

Address before: American New York

Patentee before: International Business Machines Corp.

CP01 Change in the name or title of a patent holder

Address after: American California

Patentee after: Google limited liability company

Address before: American California

Patentee before: Google Inc.

CP01 Change in the name or title of a patent holder