CN101578586B - 在故障转移和故障回复环境中使用虚拟拷贝 - Google Patents

在故障转移和故障回复环境中使用虚拟拷贝 Download PDF

Info

Publication number
CN101578586B
CN101578586B CN2008800018775A CN200880001877A CN101578586B CN 101578586 B CN101578586 B CN 101578586B CN 2008800018775 A CN2008800018775 A CN 2008800018775A CN 200880001877 A CN200880001877 A CN 200880001877A CN 101578586 B CN101578586 B CN 101578586B
Authority
CN
China
Prior art keywords
memory
level
fault
station
order
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2008800018775A
Other languages
English (en)
Other versions
CN101578586A (zh
Inventor
B·C·比尔德斯雷
R·F·巴尔特福伊
G·E·麦克布赖德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN101578586A publication Critical patent/CN101578586A/zh
Application granted granted Critical
Publication of CN101578586B publication Critical patent/CN101578586B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2056Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
    • G06F11/2082Data synchronisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2056Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
    • G06F11/2069Management of state, configuration or failover
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F5/00Methods or arrangements for data conversion without changing the order or content of the data handled
    • G06F5/06Methods or arrangements for data conversion without changing the order or content of the data handled for changing the speed of data flow, i.e. speed regularising or timing, e.g. delay lines, FIFO buffers; over- or underrun control therefor
    • G06F5/16Multiplexed systems, i.e. using two or more similar devices which are alternately accessed for enqueue and dequeue operations, e.g. ping-pong buffers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2056Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
    • G06F11/2071Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring using a plurality of controllers

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

在一种方法中,在故障转移和故障回复环境中使用虚拟拷贝,在系统运行期间,从一级站处的一级第一存储器向二级站处的二级第一存储器复制更新。在一级和二级站中的至少一个处维护第二存储器。在所述一级站出现故障后执行从所述一级站到所述二级站的故障转移。在所述一级站恢复后使用至少一个第二存储器来使所述二级站与所述一级站同步。响应于所述一级站的恢复,向所述至少一个第二存储器或从所述至少一个第二存储器仅复制在所述故障转移期间对所述二级站做出的更新。

Description

在故障转移和故障回复环境中使用虚拟拷贝
技术领域
本发明涉及在故障转移和故障回复环境中使用虚拟拷贝的方法、系统和程序。
背景技术
在典型灾难恢复解决方案中,数据容纳在一级站处以及容纳在一个或多个二级站处。这些二级站维护数据的同步副本,以便在一级站出现灾难的情况下尽可能减少数据丢失。如果发生灾难,处理或者“故障转移”到二级站之一,或者将数据从二级站复制回一级站。为了实现灾难恢复,二级站典型地在地理上远离一级站,即,位于不同的城市、州等,以便同一灾难不会影响两个站点。
灾难恢复系统典型地解决两类故障:在单个时刻的意外灾难性故障和在一段时间期间的数据丢失。在第二类渐进的灾难中,对卷的更新可能丢失。对于任意一类故障,都可在远程位置提供数据的副本。典型地在应用系统向一级站处的一级存储设备写入新的数据时生成此类双重副本或影子副本。
在镜像备份系统中,在卷对中维护数据。卷对包括一级存储设备中的卷和二级存储设备中的相应卷,后者包括在一级卷中维护的数据的一致副本。典型地,将在一级存储控制单元中维护所述对的一级卷,并且在位于不同于所述一级存储控制单元的物理位置处的二级存储控制单元中维护所述对的二级卷。存储控制单元是物理硬件单元,其包括与一个或多个存储设备集成的存储服务器以向主机提供存储能力。存储服务器是通过提供一个或多个逻辑子系统的功能来提供一个或多个存储设备与主机之间的接口的物理单元。存储服务器可以提供存储设备所未提供的功能。存储服务器包括一个或多个存储设备群集。可以提供一级存储控制单元以控制对一级存储器的访问,以及提供二级存储控制单元以控制对二级存储器的访问。
当使用两个在地理上分散的服务器场来远程镜像数据以用于灾难恢复能力时,在站点之一已停机并且现在恢复后,将出现重新建立镜像的性能问题。在此类情况下,两个站点之间的大部分数据是完全相同的,但在一个站点停机期间,少部分数据已在一个站点处被更改而未在另一站点处被更改。在历史上,为了重新建立站点之间的同步(重新建立镜像),一个站点被选择为是当前的,然后将所有数据复制到另一站点。由于要移动的数据量,此镜像操作是非常耗时的过程(在周的量级)。
此外,在二级站处维护镜像副本的同时,客户可能希望生成二级镜像副本到二级虚拟副本的虚拟拷贝,然后脱离二级虚拟拷贝站运行生产以在虚拟拷贝上进行测试和练习,以便测试二级站的运行。
在某些镜像实施方式中,用户可以使二级站处的二级卷镜像一级站处的一级卷的数据。在此情况下,在故障期间,二级卷用于生产和运行,并且在故障转移到二级卷期间记录更改。在一级卷的恢复期间,执行故障回复以仅复制在故障转移到一级卷之后对二级卷的更改。在实现中,用户可以创建二级卷的虚拟拷贝并在二级卷的虚拟拷贝上进行练习,并且仍然使用二级卷用于恢复目的。在此情况下,在恢复以后,仍从主二级卷恢复更新而不管二级卷的虚拟拷贝。此实施方式要求恢复站具有两种配置,一种用于练习,另一种用于恢复。此类配置增加了复杂性并且增大了在需要恢复操作时引入错误的可能。
在其他镜像实施方式中,为了从虚拟拷贝二级卷恢复,用户可能将二级卷的整个虚拟拷贝复制到一级卷。
本领域中存在持续改进一级与二级站之间的故障和恢复处理的需要。
发明内容
提供了一种方法、系统和制品,用于在故障转移和故障回复环境中使用虚拟拷贝。在系统运行期间,从一级站处的一级第一存储器向二级站处的二级第一存储器复制更新。在一级和二级站中的至少一个处维护第二存储器。在所述一级站出现故障后执行从所述一级站到所述二级站的故障转移。在所述一级站恢复后使用至少一个第二存储器来使所述二级站与所述一级站同步。响应于所述一级站的恢复,向所述至少一个第二存储器或从所述至少一个第二存储器仅复制在所述故障转移期间对所述二级站做出的更新。
在其他实施例中,在所述二级站处存在二级第二存储器并且响应于所述故障转移,生成所述二级第一存储器到所述二级第二存储器的虚拟拷贝。响应于生成所述虚拟拷贝,执行从所述二级第二存储器到所述一级第一存储器的故障转移,其中在所述故障转移后相对于所述二级第二存储器来执行读取和写入操作,并且其中仅复制对所述二级站做出的更新包括:从所述一级第一存储器向所述二级第二存储器复制所述故障转移期间的更新。
在其他实施例中,生成所述虚拟拷贝包括:在所述二级第一和第二存储器中的数据单元之间建立时间点复制关系;以及从所述二级第一存储器向所述二级第二存储器复制在所述时间点复制关系中指示的数据。如果在将所述二级第一存储器处的数据单元复制到所述二级第二存储器之前已更新了所述二级第二存储器中的相应数据单元,则不将所述二级第一存储器处的所述数据单元复制到所述二级第二存储器。
在其他实施例中,从所述一级第一存储器处的所述二级第二存储器发出强制故障转移命令以执行所述故障转移,从而导致记录在所述故障转移期间对所述二级第二存储器的更新。从所述二级第二存储器向所述一级第一存储器发出强制故障回复命令,以导致在所述强制故障转移之后发生的所记录的对所述二级第二存储器的更新被复制到所述一级第一存储器。
在其他实施例中,在所述一级站恢复后,从所述二级第一存储器向所述一级第一存储器复制数据单元,以重写在到所述二级站的故障转移之前发生并且未被复制到所述二级第一存储器的对所述一级第一存储器中的数据单元的更新。向所述二级第二存储器或从所述二级第二存储器复制对所述一级第一存储器的更新发生在从所述二级第一存储器向所述一级第一存储器复制数据单元之后。
在其他实施例中,从所述一级第一存储器向所述二级第一存储器发出故障转移命令以响应所述一级站处的故障,其中在执行所述故障转移命令之后生成所述虚拟拷贝。从所述二级第一存储器向所述一级第一存储器发出故障回复命令以响应所述一级站的恢复,以导致从所述二级第一存储器复制所述数据单元,以便重写在到所述二级站的故障转移之前发生并且未被复制到所述二级第一存储器的对所述一级第一存储器中的数据单元的更新。
在其他实施例中,在所述一级站处存在一级第二存储器并且在所述二级站处存在二级第二存储器,其中执行所述故障转移包括执行从所述一级第一存储器到所述二级第一存储器的第一故障转移。此外,生成所述二级第一存储器到所述二级第二存储器的虚拟拷贝以响应所述故障转移。执行从所述二级第二存储器到所述一级第二存储器的第二故障转移,其中在所述故障转移后相对于所述二级第二存储器来执行读取和写入操作。生成所述一级第一存储器到所述一级第二存储器的虚拟拷贝以响应所述一级站的恢复。仅将所述故障转移之后对所述二级第二存储器做出的更新复制到所述一级第二存储器,以响应到所述一级第二存储器的虚拟拷贝和响应所述一级站的恢复。
在其他实施例中,从所述二级第二存储器向所述一级第二存储器发出强制故障转移命令以执行所述二级第二存储器的故障转移并且进一步导致记录在所述故障转移之后对所述二级第二存储器做出的更新。从所述二级第二存储器向所述一级第二存储器发出强制故障回复命令以导致在所述故障转移之后的所记录的对所述二级第二存储器的更新被复制到所述一级第二存储器。
在其他实施例中,在所述一级站恢复后,从所述二级第一存储器向所述一级第一存储器复制数据单元,以重写在所述故障转移之前发生并且未被复制到所述二级第二存储器的对所述一级第一存储器中的数据单元的更新。发生所述一级第一存储器到所述一级第二存储器的虚拟拷贝操作,以响应在所述一级站恢复后,从所述二级第一存储器向所述一级第一存储器复制数据单元。
在其他实施例中,从所述一级第一存储器向所述二级第一存储器发出故障转移命令以响应所述一级站处的故障。在执行所述故障转移命令之后生成从所述二级第一存储器到所述二级第二存储器的虚拟拷贝。从所述二级第一存储器向所述一级第一存储器发出故障回复命令以响应所述一级站的恢复,以导致从所述二级第一存储器复制所述数据单元,以便重写在到所述二级第一存储器的故障转移之前发生并且未被复制到所述二级站的对所述一级第一存储器中的数据单元的更新。
在其他实施例中,在所述一级站处存在一级第二存储器。执行从所述一级站到所述二级站的故障转移包括:从所述一级第一存储器故障转移到所述二级第一存储器。复制对所述二级站做出的更新以响应所述恢复包括:将系统运行期间在从一级站处的一级存储器故障转移到二级站之后对所述二级第一存储器做出的更新复制到所述一级第一存储器。生成所述一级第一存储器到所述一级站处的一级第二存储器的虚拟拷贝,以响应将所述更新复制到所述一级存储器。
在其他实施例中,将生成所述虚拟拷贝期间对所述二级存储器做出的更新复制到所述一级第二存储器以响应到所述一级第二存储器的虚拟拷贝。
在其他实施例中,从所述二级第一存储器向所述一级第一存储器发出故障回复命令以响应所述一级站的恢复,以导致从所述二级第一存储器复制所述数据单元,以便重写在到所述二级第一存储器的故障转移之前发生并且未被复制到所述二级第一存储器的对所述一级第一存储器中的数据单元的更新。发出强制故障回复命令以响应完成从所述一级第一存储器到所述一级第二存储器的虚拟拷贝,以便在生成所述虚拟拷贝期间执行所述更新的复制。
附图说明
以下将仅通过实例的方式参考附图描述本发明的实施例,这些附图是:
图1示出了数据镜像计算环境的实施例;
图2示出了一级和二级站处的存储器的布置的实施例;
图3示出了建立一级和二级站之间的复制关系的操作的实施例;
图4示出了根据图2的存储器布置处理一级站处的故障的操作的实施例;
图5示出了根据图2的存储器布置处理一级站处的恢复的操作的实施例;
图6示出了一级和二级站处的存储器的布置的实施例;
图7示出了根据图6的存储器布置处理一级站处的故障的操作的实施例;
图8示出了根据图6的存储器布置处理一级站处的恢复的操作的实施例;
图9示出了一级和二级站处的存储器的布置的实施例;
图10示出了根据图9的存储器布置处理一级站处的故障的操作的实施例;
图11示出了根据图9的存储器布置处理一级站处的恢复的操作的实施例。
具体实施方式
图1示出了网络计算环境的实施例。一级站2a包括连接到一级存储器6a的一级服务器4a并且二级站2b包括连接到二级存储器6b的二级服务器4b。在正常运行期间,一级服务器4a通过网络12从主机系统10中的应用8接收更新和输入/输出(I/O)请求(可能存在多个向一级服务器4a提供更新的主机系统10和应用8)。同时,一级服务器4a通过网络12将一级存储器6a处的数据镜像到在二级存储器6b中存储该数据的二级服务器4b。一级4a和二级4b服务器分别包括复制管理器程序14a和14b,后者管理镜像复制操作以允许在二级站2b处镜像一级站2a处的数据。复制管理器程序14a和14b建立和维护各站之间的复制关系,如国际商业机器公司的存储产品中提供的Metro Mirror或Global Mirror复制关系,或其他供应商复制关系技术。在一个实施例中,存储器6a、6b维护组织成逻辑单元(例如,卷、逻辑单元号(LUN),它们包括诸如轨道或块的数据单元)的数据。此外,每个服务器4a、4b包括高速缓存18a、18b,后者包括一个或多个易失性和/或非易失性存储器件。高速缓存18a、18b缓存从主机10接收的更新,直到数据被离台到存储器6a、6b,并且缓存从主机10接收的请求。
服务器4a、4b可以包括企业存储服务器,如IBM DS8000TM服务器或本领域公知的其他适合的存储控制器。(DS8000是国际商业机器公司的商标。)复制管理器14a和14b包括设计为协调一级2a与二级2b站之间的数据的镜像、同步以及重新同步的应用。在所述实施例中,复制管理器14a、14b还被描述为执行通用存储管理操作,如从高速缓存18a、18b登台和离台数据。因此,在所述实施例中,复制管理器14a、14b可以包括用于执行与镜像明确无关的存储操作的代码。存储器6a、6b可以包括存储设备的阵列,如简单磁盘捆绑(JBOD)、直接存取存储设备(DASD)、独立磁盘冗余阵列(RAID)、虚拟化设备、磁带存储、闪存等。网络12可以包括存储区域网络(SAN)、局域网(LAN)、内联网、互联网、广域网(WAN)、对等网络、无线网络、仲裁回路网络等。网络12可以包括一个或多个交换机以提供不同网络12元件之间的一个或多个通信路径。
图1示出了一级2a和二级2b站均包括连接到存储器6a、6b的一个服务器4a、4b。在附加实施例中,站2a、2b可以包括连接到多个存储系统的多个服务器,从而提供服务器场。
图2示出了包括一级存储器50和一级影子存储器52的一级站2a处的存储器6a以及包括二级存储器54和二级影子存储器56的二级站2b处的存储器6b的布置。在正常运行期间,在一级存储器50与二级影子存储器54之间建立复制关系58,如对等或扩展远程复制关系,以便将对一级存储器50的更新镜像到二级影子存储器54。在二级存储器56与一级影子存储器52之间建立另一复制关系60。虚拟拷贝操作64创建一级影子存储器52并且虚拟拷贝操作62创建二级存储器56。复制操作58和60不能同时处于活动状态。当生产位于一级站2a并且数据正在被镜像到二级站2b时,复制操作58可以是活动的。在一级站2a到二级站2b的故障转移期间,复制操作58暂停。一旦一级站2a恢复并且再次运行,就可以启动复制操作60。
虚拟拷贝操作62和64可以包括逻辑的时间点复制操作。时间点复制涉及将所有数据从源卷物理地复制到目标卷,以便目标卷具有数据的时间点副本。还可以通过逻辑地生成数据的副本并且然后在需要时或在后台复制数据(实际上推迟了物理复制)来生成时间点副本。执行此逻辑复制操作以尽量减小不可访问目标卷和源卷的时间。
一种此类逻辑复制操作被称为
Figure G2008800018775D00081
(FlashCopy是国际商业机器公司或“IBM”的注册商标)。
Figure G2008800018775D00082
涉及在不同设备上的一级和二级卷之间建立逻辑时间点复制关系。一旦建立了逻辑关系,主机然后就可以立即访问一级和二级卷上的数据,并且可以作为后台操作的一部分复制数据。作为后台操作的一部分将数据从一级卷复制到二级卷。在复制数据时,对一级高速缓存中尚未使用来自一级存储器的数据更新的任何轨道的读取将导致源轨道被登台到二级高速缓存,然后再将访问提供给来自二级高速缓存的轨道。对二级轨道上尚未复制的数据的任何读取将导致数据被从一级设备复制到二级高速缓存,使得二级目标具有来自源的在
Figure G2008800018775D00083
操作的时刻存在的副本。此外,对一级存储器上尚未被复制的轨道的任何写入将导致一级存储器上的轨道被复制到二级存储器。
图3示出了在复制管理器14a和/或14b中或在一级4a和二级4b服务器外部的复制管理程序中实现将一级存储器50处的数据镜像到二级影子存储器56的操作的实施例。响应于启动备份操作(块100),在一级存储器50与二级影子存储器54之间建立(块102)复制关系58以镜像数据和对一级存储器50的更新。
图4示出了在复制管理器14a和/或14b中或在一级4a和二级4b服务器外部的复制管理程序中实现响应检测到一级站2a处的故障(块120)的操作的实施例。作为响应,发出(块122)故障转移命令以从一级存储器50故障转移到二级影子存储器54以响应一级站2a处的故障。作为响应,生成(块124)二级影子存储器54到二级存储器56的虚拟拷贝62。此外,发出(块126)强制故障转移命令以从二级存储器56故障转移到一级影子存储器52。块122和126处的两个故障转移命令导致二级站存储器54和56维护更改记录位图以指示在故障转移后更新的数据单元(例如,轨道)。在故障转移后使用二级存储器56启动(块128)二级站2b上的主机操作,其中此类更改反映在二级存储器56的更改记录位图中。这样,在虚拟拷贝二级存储器56上练习生产。
图5示出了在复制管理器14a和/或14b中或在一级4a和二级4b服务器外部的复制管理程序中实现处理一级站2a处的恢复的操作的实施例。响应于检测到(块150)一级站2a处的恢复,发出(块152)从二级影子存储器54到一级存储器50的故障回复命令,以便重写一级存储器50中的在故障转移之前被更新并且未被复制到二级影子存储器54的任何数据单元,以使一级存储器50和二级影子存储器54同步。在同步从二级影子存储器54到一级存储器50的所有对之后,生成(块154)一级存储器50到一级影子存储器52的虚拟拷贝。发出(块156)从二级存储器56到一级影子存储器52的强制故障回复命令,以复制在故障转移后并且在建立复制关系60之前由二级存储器56记录的在二级存储器56处更新的数据单元。终止(块158)一级存储器50与二级影子存储器54之间的复制关系58。
在备选恢复实施例中,操作可以在一级站2a恢复后切换到二级站2b。可以通过使一级影子存储器52与恢复后的二级影子存储器56同步来完成此操作。在一级站2a返回同步后,一级站2a处的操作继续而不受影响,并且二级存储器56上的练习会话可以继续而不影响有关一级站的主机操作。此外,从一级存储器50到二级影子存储器54的镜像继续。
通过图2-5的所述实施例,客户可以在两个站点上运行生产并且在两个位置提供了保护。此外,通过所述实施例,仅从二级存储器56复制作为虚拟拷贝操作的结果产生的更改后的更新,其中二级影子存储器54维护故障转移时的数据。虚拟拷贝卷(即,二级存储器56)用于记录更改并且作为故障回复的结果,仅将记录的更改从虚拟拷贝卷复制回一级站。可以通过在建立复制关系60之前执行从虚拟拷贝卷(二级存储器50)到一级影子卷52的强制故障转移来实现此结果,这导致虚拟拷贝卷(二级存储器50)记录故障转移期间更改的更新,以便在故障回复期间仅复制记录的更改。执行从二级影子存储器54到一级存储器50的故障回复,以便删除在一级存储器50处接收的在故障转移前未被复制到二级影子存储器54的任何更新,以使一级存储器50与二级影子存储器54同步。将二级虚拟拷贝卷56处的记录的更改应用于一级虚拟拷贝(一级影子存储器52)(包括同步到一级存储器50的数据)确保了到一级影子存储器52的故障回复将二级站2b与一级站2a同步。此外,图2-5的实施例提供了对称配置,从而就图3-5的操作而言,二级站2b可以用作一级站并且一级站2a可以用作二级站,即,主机操作可以在站2b上运行、从站2b镜像到2a、从站2b故障转移到站2a,然后从站2b恢复和重新同步到站2a。
图6示出了包括一级存储器180和一级影子存储器182的一级站2a处的存储器6a以及包括二级存储器184的二级站2b处的存储器6b的实施例。在正常运行期间,在一级存储器180与二级存储器184之间建立复制关系186,如对等或扩展远程复制关系,以便将一级存储器180的更新镜像到二级存储器184。在一级站2a处的恢复之后,在二级存储器56与一级影子存储器58之间建立其他复制关系188,以便将数据从二级存储器184复制到一级影子存储器182。虚拟拷贝操作190创建一级影子存储器182。虚拟拷贝操作190可以包括如根据图2所述的逻辑时间点复制操作。
图7示出了在复制管理器14a和/或14b中或在一级4a和二级4b服务器外部的复制管理程序中实现响应检测到一级站2a处的故障(块200)的操作的实施例。作为响应,发出(块202)从一级存储器180到二级存储器184的故障转移命令。作为故障转移的结果,在二级存储器184处执行读取和写入,二级存储器184记录故障转移期间与复制关系186一致的任何更改。
图8示出了在复制管理器14a和/或14b中或在一级4a和二级4b服务器外部的复制管理程序中实现处理一级站2a处的恢复的操作的实施例。响应于检测到(块230)一级站2a处的恢复,发出(块232)从二级存储器184到一级存储器180的故障回复,以复制故障转移之后的任何更新以及重写一级存储器180中在故障转移之前更新并且未被复制到二级存储器184的任何数据单元。在二级存储器184被同步到一级存储器180之后,终止(块234)复制关系186。生成(块236)同步后的一级存储器180到一级影子存储器182的虚拟拷贝190。然后发出(块238)从二级存储器184到一级影子存储器182的强制故障回复,以便复制在暂停之后并且在生成虚拟拷贝182期间在二级存储器184处更新的数据单元。在更新一级影子存储器182之后,终止(块240)二级存储器184与一级存储器180之间的复制关系188。
通过图6-8的操作,到一级存储器180的故障回复将作为故障转移和复制关系184的结果记录的更改的更新从二级存储器184复制到一级存储器180。此外,在执行虚拟拷贝190操作时,二级存储器184继续记录对二级存储器184的更改和活动。这些更新然后被复制到一级影子存储器182。在终止复制关系188之后,可以在一级影子存储器182上运行生产。
图9示出了包括一级存储器250的一级站2a处的存储器6a以及包括二级影子存储器252和二级存储器254的二级站2b处的存储器6b的实施例。在正常运行期间,在一级存储器250与二级影子存储器252之间建立复制关系256,如对等或扩展远程复制关系,以便将对一级存储器250的更新镜像到二级存储器252。建立从二级存储器254到一级存储器252的其他复制关系258。虚拟拷贝操作260创建二级存储器254。虚拟拷贝操作260可以包括如根据图2所述的逻辑时间点复制操作。
图10示出了在复制管理器14a和/或14b中或在一级4a和二级4b服务器外部的复制管理程序中实现响应检测到一级站2a处的故障的操作的实施例。响应于故障(块280),发出(块282)故障转移命令以从一级存储器250故障转移到二级影子存储器252。这导致二级影子存储器252维护任何更改的记录位图。生成(块284)二级影子存储器151到二级存储器254的虚拟拷贝,并且发出(块286)从二级存储器254到一级存储器的强制故障转移命令,以便记录故障转移之后对二级存储器254的更新。强制故障转移建立复制关系258,后者使得二级存储器254能够记录故障转移之后的更改。在故障转移之后,就二级存储器254而言,生产在二级站2b处继续。
图11示出了在复制管理器14a和/或14b中或在一级4a和二级4b服务器外部的复制管理程序中实现处理一级站2a处的恢复的操作的实施例。响应于检测到(块300)一级站2a处的恢复,发出(块302)从二级影子存储器252到一级存储器254的故障回复,以便重写一级存储器250中在故障转移之前更新并且未被复制到二级影子存储器252的任何数据单元。在一级存储器250被同步到二级影子存储器252之后,终止(块304)一级存储器250与二级影子存储器252之间的复制关系256。发出(块306)从二级存储器254到一级存储器250的强制故障回复,以便复制在故障转移之后在二级存储器254处更新并且被记录为强制故障转移所建立的复制关系258的一部分的数据单元。
通过图9-11的操作,到一级存储器250的故障回复将作为故障转移和复制关系258的结果记录的更改的更新从二级存储器254复制到一级存储器250。在一级存储器250与虚拟拷贝二级存储器254同步后,二级存储器254可以成为图6中的一级存储器180,并且二级影子存储器252用作图6中的一级影子存储器182,其中一级存储器250将用作图6中的二级存储器184。因此,在同步之后,通过使图9中的二级站2b用作图6中的一级站2a,生产可以在二级存储器254上继续。
其他实施例详细信息
使用生产软件、固件、硬件或它们的任意组合的标准编程和/或工程技术,上述操作可以被实现为方法、装置或制品。所述操作可以被实现为在“计算机可读介质”中维护的代码,其中处理器可以从所述计算机可读介质读取并执行所述代码。计算机可读介质可以包括诸如磁存储介质(例如,硬盘驱动器、软盘、磁带等)、光存储装置(CD-ROM、DVD、光盘等)、易失性和非易失性存储设备(例如,EEPROM、ROM、PROM、RAM、DRAM、SRAM、闪存、固件、可编程逻辑等)之类的介质。实现所述操作的代码还可以在硬件逻辑(例如,集成电路芯片、可编程门阵列(PGA)、专用集成电路(ASIC)等)中实现。此外,实现所述操作的代码可以在“传输信号”中实现,其中传输信号可以通过空间或通过传输介质(如光纤、铜线等)传播。其中编码所述代码或逻辑的传输信号还可以包括无线信号、卫星传输、无线电波、红外线信号、蓝牙等。其中编码所述代码或逻辑的传输信号能够通过发射站发射并且通过接收站接收,其中在传输信号中编码的代码或逻辑可以被解码并存储在接收和发射站或设备处的硬件或计算机可读介质中。“制品”包括其中可以实现代码的计算机可读介质、硬件逻辑、和/或传输信号。其中编码实现所述实施例操作的代码的设备可以包括计算机可读介质或硬件逻辑。当然,本领域的技术人员将认识到,可以对此配置做出许多修改而不偏离本发明的范围,并且所述制品可以包括本领域公知的适合的信息承载介质。
术语“一个实施例”、“实施例”、“多个实施例”、“所述实施例”、“所述多个实施例”、“一个或多个实施例”、“某些实施例”和“某一实施例”指“本发明(多个)的一个或多个(但不是所有)实施例”,除非另外明确指出。
术语“包含”、“包括”、“具有”及其变型指“包括但不限于”,除非另外明确指出。
列举的项目的列表并非暗示任何或所有的项目互相排斥,除非另外明确指出。
术语“一”、“一个”和“所述”指“一个或多个”,除非另外明确指出。
相互通信的设备和组件不必持续地相互通信,除非另外明确指出。此外,相互通信的设备可以直接通信或通过一个或多个媒介间接地通信。
具有若干相互通信的组件的实施例的描述并非暗示所有此类组件都是必需的。相反,描述了各种可选的组件以例示本发明的多种可能的实施例。
此外,尽管可以按照连续的顺序来描述处理步骤、方法步骤、算法或类似步骤,但是此类处理、方法和算法可以被配置为以交替顺序工作。换言之,所描述的步骤的任何序列或顺序并不一定指示要求按此顺序执行步骤。实际可以按任何顺序执行在此描述的处理的步骤。此外,可以同时地执行某些步骤。
当在此描述单个设备或物品时,将显而易见的是,可以使用多个设备/物品(无论它们是否协作)来代替单个设备/物品。同样,当在此描述了多个设备或物品(无论它们是否协作)的情况下,将显而易见的是,可以使用单个设备或物品来代替所述多个设备或物品,或者可以使用不同数量的设备/物品代替所示数量的设备或程序。设备的功能和/或特性可以替代地由一个或多个其他未明确描述为具有此类功能/特性的设备来体现。因此,本发明的其他实施例不必包括设备本身。
图3-5、7-9、10和11的所示操作示出特定事件按照特定顺序发生。在备选实施例中,可以以不同的顺序执行特定操作、修改或删除特定操作。此外,可以将步骤添加到上述逻辑而仍然与所述实施例一致。此外,在此说明的操作可以顺序地发生或可以并行地处理特定操作。进而,可以由单个处理单元或分布式处理单元执行操作。
出于示例和说明目的提供了本发明的各个实施例的上述说明。其并非旨在是穷举的或将本发明限于所公开的精确形式。根据上述教导,许多修改和变化都是可能的。其旨在本发明的范围并非由此详细说明来限制,而是由此后所附的权利要求来限制。以上说明、实例和数据提供了对本发明的组成部分的制造和使用的完整说明。由于可以在不偏离本发明的精神和范围的情况下做出本发明的许多实施例,所以本发明存在于此后所附的权利要求之内。

Claims (24)

1.一种用于同步一级站与二级站之间的数据的方法,包括:
在系统运行期间从所述一级站处的一级第一存储器向所述二级站处的二级第一存储器复制更新;
在所述二级站中维护二级第二存储器;
在所述一级站出现故障后执行从所述一级站到所述二级站的故障转移;
在所述一级站恢复后使用所述二级第二存储器来使所述二级站与所述一级站同步;以及
响应于所述一级站的恢复,从所述二级第二存储器复制在故障转移期间更新的数据单元到所述一级第一存储器,
所述方法还包括:
响应于所述故障转移,生成所述二级第一存储器到所述二级第二存储器的虚拟拷贝;以及
响应于生成所述虚拟拷贝,发出从所述二级第二存储器到所述一级第一存储器的故障转移命令,其中在所述故障转移后相对于所述二级第二存储器来执行读取和写入操作。
2.根据权利要求1的方法,其中生成所述虚拟拷贝包括:
在所述二级第一和第二存储器中的数据单元之间建立时间点复制关系;以及
从所述二级第一存储器向所述二级第二存储器复制在所述时间点复制关系中指示的数据,其中如果在将所述二级第一存储器处的数据单元复制到所述二级第二存储器之前已更新了所述二级第二存储器中的相应数据单元,则不将所述二级第一存储器处的所述数据单元复制到所述二级第二存储器。
3.根据权利要求1的方法,还包括:
发出强制故障转移命令以从所述二级第二存储器故障转移到所述一级第一存储器,从而导致记录在所述故障转移期间对所述二级第二存储器的更新;以及
从所述二级第二存储器向所述一级第一存储器发出强制故障回复命令,以导致在所述强制故障转移之后发生的所记录的对所述二级第二存储器的更新被复制到所述一级第一存储器。
4.根据权利要求1的方法,其中重写所述一级第一存储器中的在故障转移之前被更新并且未被复制到所述二级第一存储器的任何数据单元中的更新发生在从所述二级第一存储器向所述一级第一存储器复制数据单元之后。
5.根据权利要求4的方法,还包括:
从所述一级第一存储器向所述二级第一存储器发出故障转移命令以响应所述一级站处的故障,其中在执行所述故障转移命令之后生成所述虚拟拷贝;以及
从所述二级第一存储器向所述一级第一存储器发出故障回复命令以响应所述一级站的恢复,以导致从所述二级第一存储器复制所述数据单元,以便重写在到所述二级站的故障转移之前发生并且未被复制到所述二级第一存储器的对所述一级第一存储器中的数据单元的更新。
6.根据权利要求1的方法,其中在所述一级站处存在一级第二存储器,其中在所述一级站出现故障后执行从所述一级站到所述二级站的故障转移包括执行从所述一级第一存储器到所述二级第一存储器的第一故障转移,并且所述方法还包括:
生成所述二级第一存储器到所述二级第二存储器的虚拟拷贝以响应所述故障转移;
执行从所述二级第二存储器到所述一级第二存储器的第二故障转移,其中在所述故障转移后相对于所述二级第二存储器来执行读取和写入操作;
生成所述一级第一存储器到所述一级第二存储器的虚拟拷贝以响应所述一级站的恢复;以及
仅将所述故障转移之后对所述二级第二存储器做出的更新复制到所述一级第二存储器,以响应到所述一级第二存储器的虚拟拷贝和响应所述一级站的恢复。
7.根据权利要求6的方法,还包括:
从所述二级第二存储器向所述一级第二存储器发出强制故障转移命令以执行所述二级第二存储器的故障转移并且进一步导致记录在所述故障转移之后对所述二级第二存储器做出的更新;以及
从所述二级第二存储器向所述一级第二存储器发出强制故障回复命令以导致在所述故障转移之后的所记录的对所述二级第二存储器的更新被复制到所述一级第二存储器。
8.根据权利要求6的方法,还包括:
在所述一级站恢复后,从所述二级第一存储器向所述一级第一存储器复制数据单元,以重写在所述故障转移之前发生并且未被复制到所述二级第二存储器的对所述一级第一存储器中的数据单元的更新,其中发生所述一级第一存储器到所述一级第二存储器的虚拟拷贝操作,以响应在所述一级站恢复后,从所述二级第一存储器向所述一级第一存储器复制数据单元。
9.根据权利要求8的方法,还包括:
从所述一级第一存储器向所述二级第一存储器发出故障转移命令以响应所述一级站处的故障,其中在执行所述故障转移命令之后生成从所述二级第一存储器到所述二级第二存储器的虚拟拷贝;以及
从所述二级第一存储器向所述一级第一存储器发出故障回复命令以响应所述一级站的恢复,以导致从所述二级第一存储器复制所述数据单元,以便重写在到所述二级第一存储器的故障转移之前发生并且未被复制到所述二级站的对所述一级第一存储器中的数据单元的更新。
10.根据权利要求1的方法,其中在所述一级站处存在一级第二存储器,其中执行从所述一级站到所述二级站的故障转移包括:从所述一级第一存储器故障转移到所述二级第一存储器;其中复制对所述二级站做出的更新以响应所述恢复包括:将系统运行期间在从一级站处的一级存储器故障转移到二级站之后对所述二级第一存储器做出的更新复制到所述一级第一存储器;还包括:
生成所述一级第一存储器到所述一级站处的一级第二存储器的虚拟拷贝,以响应将所述更新复制到所述一级存储器。
11.根据权利要求10的方法,还包括:
将生成所述虚拟拷贝期间对所述二级存储器做出的更新复制到所述一级第二存储器以响应到所述一级第二存储器的虚拟拷贝。
12.根据权利要求11的方法,还包括:
从所述二级第一存储器向所述一级第一存储器发出故障回复命令以响应所述一级站的恢复,以导致从所述二级第一存储器复制所述数据单元,以便重写在到所述二级第一存储器的故障转移之前发生并且未被复制到所述二级第一存储器的对所述一级第一存储器中的数据单元的更新;以及
发出强制故障回复命令以响应完成从所述一级第一存储器到所述一级第二存储器的虚拟拷贝,以便在生成所述虚拟拷贝期间执行所述更新的复制。
13.一种用于同步一级站与二级站之间的数据的系统,其中所述一级站具有一级第一存储器,其中所述二级站具有二级第一存储器,并且其中在所述一级和二级站中的至少一个处维护第二存储器,包括:
复制管理器组件,其进一步被配置为包括:
使在系统运行期间从所述一级站处的一级第一存储器向所述二级站处的二级第一存储器复制更新的装置;
使在所述二级站中维护二级第二存储器的装置;
使在所述一级站出现故障后执行从所述一级站到所述二级站的故障转移的装置;
在所述一级站恢复后使用所述二级第二存储器来使所述二级站与所述一级站同步的装置;以及
响应于所述一级站的恢复,从所述二级第二存储器复制在故障转移期间更新的数据单元到所述一级第一存储器的装置,
所述复制管理组件还包括:
响应于所述故障转移,生成所述二级第一存储器到所述二级第二存储器的虚拟拷贝的装置;以及
响应于生成所述虚拟拷贝,发出从所述二级第二存储器到所述一级第一存储器的故障转移命令的装置,其中在所述故障转移后相对于所述二级第二存储器来执行读取和写入操作。
14.根据权利要求13的系统,其中生成所述虚拟拷贝的装置包括:
在所述二级第一和第二存储器中的数据单元之间建立时间点复制关系的装置;以及
从所述二级第一存储器向所述二级第二存储器复制在所述时间点复制关系中指示的数据的装置,其中如果在将所述二级第一存储器处的数据单元复制到所述二级第二存储器之前已更新了所述二级第二存储器中的相应数据单元,则不将所述二级第一存储器处的所述数据单元复制到所述二级第二存储器。
15.根据权利要求13的系统,还包括:
发出强制故障转移命令以从所述二级第二存储器故障转移到所述一级第一存储器,从而导致记录在所述故障转移期间对所述二级第二存储器的更新的装置;以及
从所述二级第二存储器向所述一级第一存储器发出强制故障回复命令,以导致在所述强制故障转移之后发生的所记录的对所述二级第二存储器的更新被复制到所述一级第一存储器的装置。
16.根据权利要求13的系统,
其中重写所述一级第一存储器中的在故障转移之前被更新并且未被复制到所述二级第一存储器的任何数据单元中的更新发生在从所述二级第一存储器向所述一级第一存储器复制数据单元之后。
17.根据权利要求16的系统,还包括:
从所述一级第一存储器向所述二级第一存储器发出故障转移命令以响应所述一级站处的故障的装置,其中在执行所述故障转移命令之后生成所述虚拟拷贝;以及
从所述二级第一存储器向所述一级第一存储器发出故障回复命令以响应所述一级站的恢复,以导致从所述二级第一存储器复制所述数据单元,以便重写在到所述二级站的故障转移之前发生并且未被复制到所述二级第一存储器的对所述一级第一存储器中的数据单元的更新的装置。
18.根据权利要求13的系统,其中在所述一级站处存在一级第二存储器,其中使在所述一级站出现故障后执行从所述一级站到所述二级站的故障转移的装置进一步执行从所述一级第一存储器到所述二级第一存储器的第一故障转移,所述系统还包括:
生成所述二级第一存储器到所述二级第二存储器的虚拟拷贝以响应所述故障转移的装置;
执行从所述二级第二存储器到所述一级第二存储器的第二故障转移的装置,其中在所述故障转移后相对于所述二级第二存储器来执行读取和写入操作;
生成所述一级第一存储器到所述一级第二存储器的虚拟拷贝以响应所述一级站的恢复的装置;以及
仅将所述故障转移之后对所述二级第二存储器做出的更新复制到所述一级第二存储器,以响应到所述一级第二存储器的虚拟拷贝和响应所述一级站的恢复的装置。
19.根据权利要求18的系统,还包括:
从所述二级第二存储器向所述一级第二存储器发出强制故障转移命令以执行所述二级第二存储器的故障转移并且进一步导致记录在所述故障转移之后对所述二级第二存储器做出的更新的装置;以及
从所述二级第二存储器向所述一级第二存储器发出强制故障回复命令以导致在所述故障转移之后的所记录的对所述二级第二存储器的更新被复制到所述一级第二存储器的装置。
20.根据权利要求18的系统,还包括:
在所述一级站恢复后,从所述二级第一存储器向所述一级第一存储器复制数据单元,以重写在所述故障转移之前发生并且未被复制到所述二级第二存储器的对所述一级第一存储器中的数据单元的更新的装置,其中发生所述一级第一存储器到所述一级第二存储器的虚拟拷贝操作,以响应在所述一级站恢复后,从所述二级第一存储器向所述一级第一存储器复制数据单元。
21.根据权利要求20的系统,还包括:
从所述一级第一存储器向所述二级第一存储器发出故障转移命令以响应所述一级站处的故障的装置,其中在执行所述故障转移命令之后生成从所述二级第一存储器到所述二级第二存储器的虚拟拷贝;以及
从所述二级第一存储器向所述一级第一存储器发出故障回复命令以响应所述一级站的恢复,以导致从所述二级第一存储器复制所述数据单元,以便重写在到所述二级第一存储器的故障转移之前发生并且未被复制到所述二级站的对所述一级第一存储器中的数据单元的更新的装置。
22.根据权利要求13的系统,其中在所述一级站处存在一级第二存储器,其中执行从所述一级站到所述二级站的故障转移的装置包括:从所述一级第一存储器故障转移到所述二级第一存储器的装置;其中复制对所述二级站做出的更新以响应所述恢复的装置包括:将系统运行期间在从一级站处的一级存储器故障转移到二级站之后对所述二级第一存储器做出的更新复制到所述一级第一存储器的装置;
所述系统还包括:生成所述一级第一存储器到所述一级站处的一级第二存储器的虚拟拷贝,以响应将所述更新复制到所述一级存储器的装置。
23.根据权利要求22的系统,还包括:
将生成所述虚拟拷贝期间对所述二级存储器做出的更新复制到所述一级第二存储器以响应到所述一级第二存储器的虚拟拷贝的装置。
24.根据权利要求23的系统,还包括:
从所述二级第一存储器向所述一级第一存储器发出故障回复命令以响应所述一级站的恢复,以导致从所述二级第一存储器复制所述数据单元,以便重写在到所述二级第一存储器的故障转移之前发生并且未被复制到所述二级第一存储器的对所述一级第一存储器中的数据单元的更新的装置;以及
发出强制故障回复命令以响应完成从所述一级第一存储器到所述一级第二存储器的虚拟拷贝,以便在生成所述虚拟拷贝期间执行所述更新的复制的装置。
CN2008800018775A 2007-01-12 2008-01-03 在故障转移和故障回复环境中使用虚拟拷贝 Active CN101578586B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US11/622,996 US7793148B2 (en) 2007-01-12 2007-01-12 Using virtual copies in a failover and failback environment
US11/622,996 2007-01-12
PCT/EP2008/050032 WO2008084007A1 (en) 2007-01-12 2008-01-03 Using virtual copies in a failover and failback environment

Publications (2)

Publication Number Publication Date
CN101578586A CN101578586A (zh) 2009-11-11
CN101578586B true CN101578586B (zh) 2012-12-12

Family

ID=39344222

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008800018775A Active CN101578586B (zh) 2007-01-12 2008-01-03 在故障转移和故障回复环境中使用虚拟拷贝

Country Status (6)

Country Link
US (2) US7793148B2 (zh)
EP (1) EP2118750B1 (zh)
JP (1) JP5182824B2 (zh)
KR (1) KR101054962B1 (zh)
CN (1) CN101578586B (zh)
WO (1) WO2008084007A1 (zh)

Families Citing this family (67)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8074111B1 (en) * 2006-09-18 2011-12-06 Nortel Networks, Ltd. System and method for responding to failure of a hardware locus at a communication installation
US7587628B2 (en) * 2006-09-20 2009-09-08 International Business Machines Corporation System, method and computer program product for copying data
WO2008129620A1 (ja) * 2007-04-09 2008-10-30 Fujitsu Limited 完全二重化システム、システム制御方法およびシステム制御プログラム
US7631214B2 (en) * 2007-05-31 2009-12-08 International Business Machines Corporation Failover processing in multi-tier distributed data-handling systems
US7822892B2 (en) * 2007-07-19 2010-10-26 International Business Machines Corporation Managing the copying of writes from primary storages to secondary storages across different networks
US7904682B2 (en) * 2007-07-19 2011-03-08 International Business Machines Corporation Copying writes from primary storages to secondary storages across different networks
US8095827B2 (en) * 2007-11-16 2012-01-10 International Business Machines Corporation Replication management with undo and redo capabilities
US7882388B2 (en) * 2008-08-21 2011-02-01 Sierra Wireless America, Inc. Dual independent non volatile memory systems
US8020037B1 (en) * 2008-09-23 2011-09-13 Netapp, Inc. Creation of a test bed for testing failover and failback operations
US8214685B2 (en) * 2008-10-31 2012-07-03 Hewlett-Packard Development Company, L.P. Recovering from a backup copy of data in a multi-site storage system
CN101414277B (zh) * 2008-11-06 2010-06-09 清华大学 一种基于虚拟机的按需增量恢复容灾系统及方法
JP5486793B2 (ja) * 2008-11-07 2014-05-07 株式会社日立製作所 リモートコピー管理システム、方法及び装置
JP2010186285A (ja) * 2009-02-12 2010-08-26 Fujitsu Ltd ミラーリング制御装置、ストレージ装置、ミラーリング制御方法
US8677088B1 (en) * 2009-10-29 2014-03-18 Symantec Corporation Systems and methods for recovering primary sites after failovers to remote secondary sites
US8688642B2 (en) * 2010-02-26 2014-04-01 Symantec Corporation Systems and methods for managing application availability
US10103939B2 (en) 2010-07-06 2018-10-16 Nicira, Inc. Network control apparatus and method for populating logical datapath sets
US9525647B2 (en) 2010-07-06 2016-12-20 Nicira, Inc. Network control apparatus and method for creating and modifying logical switching elements
US8817620B2 (en) 2010-07-06 2014-08-26 Nicira, Inc. Network virtualization apparatus and method
US8392754B2 (en) * 2010-10-11 2013-03-05 International Business Machines Corporation Disaster recovery production takeover
US8479041B2 (en) 2010-10-13 2013-07-02 International Business Machines Corporation Disaster recovery failback
EP2748716B1 (en) 2011-11-15 2018-05-16 Nicira Inc. Network control system for configuring middleboxes
EP2955886B1 (en) 2012-04-18 2020-05-06 Nicira Inc. Using transactions to compute and propagate network forwarding state
US8909985B2 (en) 2012-07-12 2014-12-09 International Business Machines Corporation Multiple hyperswap replication sessions
US8799602B2 (en) * 2012-08-22 2014-08-05 International Business Machines Corporation Automated migration to a new target volume via merged bitmaps to maintain consistency
AU2013323618B2 (en) 2012-09-25 2019-04-04 Mx Technologies Inc. Aggregation source routing
AU2013392579A1 (en) * 2013-06-13 2015-11-26 Tsx Inc. Failover system and method
US10218564B2 (en) 2013-07-08 2019-02-26 Nicira, Inc. Unified replication mechanism for fault-tolerance of state
US9559870B2 (en) 2013-07-08 2017-01-31 Nicira, Inc. Managing forwarding of logical network traffic between physical domains
US10152399B2 (en) 2013-07-30 2018-12-11 Hewlett Packard Enterprise Development Lp Recovering stranded data
US9973382B2 (en) 2013-08-15 2018-05-15 Nicira, Inc. Hitless upgrade for network control applications
US9535612B2 (en) * 2013-10-23 2017-01-03 International Business Machines Corporation Selecting a primary storage device
US9348715B2 (en) * 2014-03-20 2016-05-24 Netapp Inc. Storage device health status synchronization
CN105100136A (zh) * 2014-04-29 2015-11-25 国际商业机器公司 用于访问存储集群中的逻辑存储的方法和装置
US10091120B2 (en) 2014-05-05 2018-10-02 Nicira, Inc. Secondary input queues for maintaining a consistent network state
JP6749072B2 (ja) * 2014-12-12 2020-09-02 富士通株式会社 ストレージ管理装置及びストレージ管理プログラム
US9967134B2 (en) 2015-04-06 2018-05-08 Nicira, Inc. Reduction of network churn based on differences in input state
CN104898435B (zh) * 2015-04-13 2019-01-15 惠州Tcl移动通信有限公司 家庭服务系统及其故障处理方法、家电设备、服务器
US10133643B2 (en) * 2015-05-05 2018-11-20 International Business Machines Corporation Resynchronizing to a first storage system after a failover to a second storage system mirroring the first storage system
US10423588B2 (en) * 2015-08-25 2019-09-24 International Business Machines Corporation Orchestrated disaster recovery
US9836367B2 (en) * 2015-08-28 2017-12-05 Netapp, Inc. Trust relationship migration for data mirroring
US10204122B2 (en) 2015-09-30 2019-02-12 Nicira, Inc. Implementing an interface between tuple and message-driven control entities
US9692815B2 (en) 2015-11-12 2017-06-27 Mx Technologies, Inc. Distributed, decentralized data aggregation
CN105335255B (zh) * 2015-12-10 2018-07-20 上海数腾软件科技股份有限公司 实现业务快速恢复的系统和方法
US9891849B2 (en) 2016-04-14 2018-02-13 International Business Machines Corporation Accelerated recovery in data replication environments
US11019167B2 (en) 2016-04-29 2021-05-25 Nicira, Inc. Management of update queues for network controller
US9946617B2 (en) 2016-06-06 2018-04-17 International Business Machines Corporation Optimized recovery in data replication environments
US10083099B2 (en) 2016-06-20 2018-09-25 International Business Machines Corporation After swapping from a first storage to a second storage, mirroring data from the second storage to the first storage for data in the first storage that experienced data errors
US10078566B2 (en) 2016-06-20 2018-09-18 International Business Machines Corporation Managing health conditions to determine when to restart replication after a swap triggered by a storage health event
US10437730B2 (en) 2016-08-22 2019-10-08 International Business Machines Corporation Read cache synchronization in data replication environments
US10769040B2 (en) * 2016-11-21 2020-09-08 Sap Se Logical equivalent replication with snapshot based fallback of database systems
US10884884B2 (en) * 2017-03-23 2021-01-05 International Business Machines Corporation Reversal of the direction of replication in a remote copy environment by tracking changes associated with a plurality of point in time copies
US10572355B2 (en) 2017-07-27 2020-02-25 International Business Machines Corporation Transfer track format information for tracks in cache at a primary storage system to a secondary storage system to which tracks are mirrored to use after a failover or failback
US10540246B2 (en) 2017-07-27 2020-01-21 International Business Machines Corporation Transfer track format information for tracks in cache at a first processor node to a second process node to which the first processor node is failing over
US10579296B2 (en) 2017-08-01 2020-03-03 International Business Machines Corporation Providing track format information when mirroring updated tracks from a primary storage system to a secondary storage system
US10684788B1 (en) * 2017-12-15 2020-06-16 Veritas Technologies, LLC Data consistency during reverse replication
US10585767B2 (en) 2018-02-07 2020-03-10 International Business Machines Corporation Automatic data healing using a storage controller
US10579285B2 (en) 2018-02-07 2020-03-03 International Business Machines Corporation Automatic data healing by I/O
US10628267B2 (en) 2018-05-02 2020-04-21 Commvault Systems, Inc. Client managed data backup process within an enterprise information management system
US11249863B2 (en) 2018-05-02 2022-02-15 Commvault Systems, Inc. Backup-based media agent configuration
EP3785135A4 (en) * 2018-05-02 2022-01-26 Commvault Systems, Inc. CUSTOMER-MANAGED DATA BACKUP PROCESS IN AN ENTERPRISE INFORMATION MANAGEMENT SYSTEM
US11321183B2 (en) 2018-05-02 2022-05-03 Commvault Systems, Inc. Multi-tiered backup indexing
US10673943B2 (en) 2018-05-02 2020-06-02 Commvault Systems, Inc. Network storage backup using distributed media agents
US10942807B2 (en) * 2018-06-12 2021-03-09 Weka.IO Ltd. Storage system spanning multiple failure domains
CN110321322B (zh) * 2019-07-02 2023-07-14 深信服科技股份有限公司 数据重建方法、装置、设备及计算机可读存储介质
US11263173B2 (en) 2019-07-30 2022-03-01 Commvault Systems, Inc. Transaction log index generation in an enterprise backup system
US11334455B2 (en) * 2019-09-28 2022-05-17 Atlassian Pty Ltd. Systems and methods for repairing a data store of a mirror node
EP4421641A1 (en) * 2022-12-29 2024-08-28 RTST Co., Ltd. Redundant storage device for autonomous vehicle

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6694447B1 (en) * 2000-09-29 2004-02-17 Sun Microsystems, Inc. Apparatus and method for increasing application availability during a disaster fail-back
CN1581091A (zh) * 2003-08-11 2005-02-16 株式会社日立制作所 多点远程拷贝系统

Family Cites Families (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69614009T2 (de) 1995-01-24 2001-11-15 Compaq Computer Corp., Houston Ferndatenbankverdopplungsvorrichtung mit Unterstützung zur Datenbankvervielfältigung für Online-DDL-Operationen
US5852715A (en) 1996-03-19 1998-12-22 Emc Corporation System for currently updating database by one host and reading the database by different host for the purpose of implementing decision support functions
US6044444A (en) * 1996-05-28 2000-03-28 Emc Corporation Remote data mirroring having preselection of automatic recovery or intervention required when a disruption is detected
US6131148A (en) 1998-01-26 2000-10-10 International Business Machines Corporation Snapshot copy of a secondary volume of a PPRC pair
US6912629B1 (en) 1999-07-28 2005-06-28 Storage Technology Corporation System and method for restoring data from secondary volume to primary volume in a data storage system
US6446175B1 (en) 1999-07-28 2002-09-03 Storage Technology Corporation Storing and retrieving data on tape backup system located at remote storage system site
US6499112B1 (en) * 2000-03-28 2002-12-24 Storage Technology Corporation Automatic stand alone recovery for peer to peer remote copy (PPRC) operations
US6654912B1 (en) * 2000-10-04 2003-11-25 Network Appliance, Inc. Recovery of file system data in file servers mirrored file system volumes
US6941490B2 (en) * 2000-12-21 2005-09-06 Emc Corporation Dual channel restoration of data between primary and backup servers
US6871271B2 (en) 2000-12-21 2005-03-22 Emc Corporation Incrementally restoring a mass storage device to a prior state
US7039827B2 (en) 2001-02-13 2006-05-02 Network Appliance, Inc. Failover processing in a storage system
US6728736B2 (en) 2001-03-14 2004-04-27 Storage Technology Corporation System and method for synchronizing a data copy using an accumulation remote copy trio
US6742138B1 (en) * 2001-06-12 2004-05-25 Emc Corporation Data recovery method and apparatus
DE60131028D1 (de) * 2001-08-31 2007-11-29 Legend Beijing Ltd Verfahren zum sichern und wiederherstellen von daten in der festplatte eines computers
US6948089B2 (en) * 2002-01-10 2005-09-20 Hitachi, Ltd. Apparatus and method for multiple generation remote backup and fast restore
US7134044B2 (en) * 2002-08-16 2006-11-07 International Business Machines Corporation Method, system, and program for providing a mirror copy of data
US6730883B2 (en) * 2002-10-02 2004-05-04 Stratagene Flexible heating cover assembly for thermal cycling of samples of biological material
US7188272B2 (en) 2003-09-29 2007-03-06 International Business Machines Corporation Method, system and article of manufacture for recovery from a failure in a cascading PPRC system
US7278049B2 (en) * 2003-09-29 2007-10-02 International Business Machines Corporation Method, system, and program for recovery from a failure in an asynchronous data copying system
JP4282464B2 (ja) * 2003-12-17 2009-06-24 株式会社日立製作所 リモートコピーシステム
JP2005196683A (ja) 2004-01-09 2005-07-21 Hitachi Ltd 情報処理システム、情報処理装置、及び情報処理システムの制御方法
US7457830B1 (en) * 2004-02-27 2008-11-25 Symantec Operating Corporation Method and system of replicating data using a recovery data change log
JP2005309793A (ja) * 2004-04-22 2005-11-04 Hitachi Ltd データ処理システム
US7461100B2 (en) * 2004-05-27 2008-12-02 International Business Machines Corporation Method for fast reverse restore
US7707372B1 (en) * 2004-06-30 2010-04-27 Symantec Operating Corporation Updating a change track map based on a mirror recovery map
JP4401895B2 (ja) * 2004-08-09 2010-01-20 株式会社日立製作所 計算機システム、計算機及びそのプログラム。
US7360113B2 (en) * 2004-08-30 2008-04-15 Mendocino Software, Inc. Protocol for communicating data block copies in an error recovery environment
US7664983B2 (en) * 2004-08-30 2010-02-16 Symantec Corporation Systems and methods for event driven recovery management
JP2006099440A (ja) * 2004-09-29 2006-04-13 Hitachi Ltd リモートコピーシステム
US7519851B2 (en) * 2005-02-08 2009-04-14 Hitachi, Ltd. Apparatus for replicating volumes between heterogenous storage systems
US7672979B1 (en) * 2005-04-22 2010-03-02 Symantec Operating Corporation Backup and restore techniques using inconsistent state indicators
US7627775B2 (en) * 2005-12-13 2009-12-01 International Business Machines Corporation Managing failures in mirrored systems
US7603581B2 (en) * 2006-03-17 2009-10-13 International Business Machines Corporation Remote copying of updates to primary and secondary storage locations subject to a copy relationship
US7613749B2 (en) * 2006-04-12 2009-11-03 International Business Machines Corporation System and method for application fault tolerance and recovery using topologically remotely located computing devices
US7627729B2 (en) * 2006-09-07 2009-12-01 International Business Machines Corporation Apparatus, system, and method for an improved synchronous mirror swap

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6694447B1 (en) * 2000-09-29 2004-02-17 Sun Microsystems, Inc. Apparatus and method for increasing application availability during a disaster fail-back
CN1581091A (zh) * 2003-08-11 2005-02-16 株式会社日立制作所 多点远程拷贝系统

Also Published As

Publication number Publication date
CN101578586A (zh) 2009-11-11
US7793148B2 (en) 2010-09-07
US20080172572A1 (en) 2008-07-17
US20100192008A1 (en) 2010-07-29
US8060779B2 (en) 2011-11-15
EP2118750A1 (en) 2009-11-18
WO2008084007A1 (en) 2008-07-17
JP5182824B2 (ja) 2013-04-17
EP2118750B1 (en) 2016-03-16
KR20090099529A (ko) 2009-09-22
JP2010515987A (ja) 2010-05-13
KR101054962B1 (ko) 2011-08-05

Similar Documents

Publication Publication Date Title
CN101578586B (zh) 在故障转移和故障回复环境中使用虚拟拷贝
CN100570574C (zh) 用于管理存储系统之间的数据拷贝的系统和方法
US7017003B2 (en) Disk array apparatus and disk array apparatus control method
CN100543690C (zh) 用于管理故障的方法和系统
US6732231B1 (en) System and method for management of mirrored storage devices storing device serial numbers
CN101755257B (zh) 管理在不同的网络上将写入从首要存储器拷贝到次要存储器
JP4791051B2 (ja) 任意数のバックアップ・コンポーネント用のシステム・アーキテクチャのための方法、システム、およびコンピュータ・プログラム
CN1996309B (zh) 使用不同复制技术执行数据镜像时保持一致性的方法系统
US7278049B2 (en) Method, system, and program for recovery from a failure in an asynchronous data copying system
EP1814033B1 (en) Storage system and data restoration method thereof
US7334101B2 (en) Point in time remote copy for multiple sites
CN101405701B (zh) 用于拷贝数据的计算机实现的方法及装置
US20070220311A1 (en) Cross tagging of data for consistent recovery
US7457830B1 (en) Method and system of replicating data using a recovery data change log
CN1983153A (zh) 数据处理系统中执行远程复制的方法和存储数据的方法
JP2007310701A (ja) データベースシステム、ストレージ装置、初期コピー方法及びログ適用方法
CN101512495A (zh) 用于改进的同步数据镜像交换的装置、系统和方法
US7275178B2 (en) Computer system having failure recovery function, and failure recovery method thereof
JP2005122453A (ja) ストレージ装置のディスクコントローラ制御方式およびストレージ装置
KR20020036502A (ko) 이중화 구조를 가지는 데이터베이스 관리시스템 및 그의이중화 처리방법
WO2015198449A1 (ja) ストレージシステム
US9582384B2 (en) Method and system for data replication
JP2006058960A (ja) 冗長構成のサーバシステムにおける同期化方法及びシステム
US11354268B2 (en) Optimizing snapshot creation
US6516394B1 (en) System and method for management of storage devices using labels

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant