CN105144119A - 存储系统及数据管理方法 - Google Patents

存储系统及数据管理方法 Download PDF

Info

Publication number
CN105144119A
CN105144119A CN201380073368.4A CN201380073368A CN105144119A CN 105144119 A CN105144119 A CN 105144119A CN 201380073368 A CN201380073368 A CN 201380073368A CN 105144119 A CN105144119 A CN 105144119A
Authority
CN
China
Prior art keywords
memory storage
data
book
daily record
volume
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201380073368.4A
Other languages
English (en)
Inventor
成田宪亮
铃木亨
池谷直子
神梓
斋藤秀雄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Publication of CN105144119A publication Critical patent/CN105144119A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2094Redundant storage or storage space
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2056Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1448Management of the data involved in backup or backup restore
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1471Saving, restoring, recovering or retrying involving logging of persistent data for recovery
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2056Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
    • G06F11/2058Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring using more than 2 mirrored copies
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2056Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
    • G06F11/2071Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring using a plurality of controllers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2056Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
    • G06F11/2082Data synchronisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F12/00Accessing, addressing or allocating within memory systems or architectures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0614Improving the reliability of storage systems
    • G06F3/0619Improving the reliability of storage systems in relation to data integrity, e.g. data losses, bit errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0646Horizontal data movement in storage systems, i.e. moving data in between storage devices or systems
    • G06F3/065Replication mechanisms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/067Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0683Plurality of storage devices
    • G06F3/0689Disk arrays, e.g. RAID, JBOD
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2056Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
    • G06F11/2071Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring using a plurality of controllers
    • G06F11/2074Asynchronous techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2056Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
    • G06F11/2084Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring on the same storage unit
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/825Indexing scheme relating to error detection, to error correction, and to monitoring the problem or solution involving locking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/855Details of asynchronous mirroring using a journal to transfer not-yet-mirrored changes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0638Organizing or formatting or addressing of data
    • G06F3/064Management of blocks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0646Horizontal data movement in storage systems, i.e. moving data in between storage devices or systems

Abstract

本发明提供对数据以及数据的更新信息进行双重化以提高耐故障性的存储系统以及数据管理方法。该存储系统具备:第一存储装置,连接于主机计算机,具有多个第一数据卷和储存被写入多个第一数据卷的数据和表示数据被写入的顺序的更新编号的日志数据的第一日志卷;第二存储装置,连接于主机计算机以及第一存储装置,具备储存多个第一数据卷各自的双重化数据的多个第二数据卷和储存第一日志卷的双重化数据的第二日志卷;第三存储装置,连接于第一存储装置,具有使用从第一存储装置接收的日志数据构成与多个第一数据卷成为远程复制配对的多个第三数据卷;和第四存储装置,连接于第三存储装置,具有储存多个第三数据卷各自的双重化数据的多个第三数据卷。

Description

存储系统及数据管理方法
技术领域
本发明涉及存储系统以及数据管理方法,良好地适用于在多个存储装置中管理数据的存储系统以及数据管理方法。
背景技术
通常而言,信息系统中,作为存储器件而具备搭载例如多个HDD(硬盘驱动器)的存储装置,从多个上位装置(例如主机计算机)经由存储区域网(SAN:StorageAreaNetwork)对包括一个以上这样的存储装置的存储系统进行访问。存储装置中,通过采用基于RAID(RedundantArrayofIndependent(orInexpensive)Disks,独立磁盘冗余阵列)技术的高可靠化方法,从而提供超过HDD单体的可靠性的可靠性。但是,如果发生大规模的地震、海啸、台风等自然灾害,则存储装置本身有可能难以恢复。在这样的情况下,就成为仅靠上述RAID的可靠性无法满足信息系统的可用性(服务持续性)的状况。例如,在金融机构停止服务的情况下,对经济活动的影响也很大,所以寻求防备灾害等而远程制作备份的技术。
作为针对这样的状况的高可用化技术,在专利文献1中公开了,在包括第一存储装置和第二存储装置的本地端与包括第三存储装置和第四存储装置的远程端之间进行远程复制的结构。主机计算机对第一存储装置进行读出/写入请求。第二存储装置是第一存储装置的备份,在第一存储装置发生了故障的情况下,第二存储装置进行失效备援(failover)使业务得以持续。
这里,如果构成为,对2个存储装置例如存储装置A和存储装置B赋予同一标识符、存储装置A将与物理卷A相对应的虚拟卷A提供给主机计算机、存储装置B将与物理卷B相对应且具有与虚拟卷A相同的标识符的虚拟卷B提供给主机计算机,则从通常的具有交替路径功能的主机计算机,将各存储装置内的物理卷识别为1个虚拟卷。
在该结构中,主机计算机能够对双方的存储装置进行访问(读出/写入)。由此,能够既确保冗余性又使访问负载分散到2台存储装置。
为了实现该功能,就需要使2个物理卷间的数据同步。为此,在写入处理中,在二个物理卷中写入了数据后才是写入完成,所以响应耗费时间。因此,在重视响应性能的业务中,需要使物理卷间的距离为比较近的距离。因此,如果发生大范围的灾害,则2个存储装置有可能都变得无法使用。因此,为了提高业务持续性,就必需通过远程复制在远程数据中心具有备份。
现有技术文献
【专利文献】
【专利文献1】日本特开2008-134986号公报
发明内容
发明要解决的课题
如上所述,为了提高服务持续性而使存储装置冗长化。但是,在专利文献1的技术中,变得无法有效地活用冗长化后的存储装置的资源。
也就是,在上述专利文献1的技术中,第一存储装置在通常运行中使用,第二存储装置在第一存储装置的故障时使用。专利文献1中,主机计算机构成为,仅对第一存储装置进行访问,对于针对第一存储装置的写入请求赋予序号,该序号被通知给第二存储装置。因此,专利文献1中对于下述内容未作公开:在主机计算机将卷A和卷B识别为同一卷而发送写入请求的环境下,即使在已对任一存储装置发送了写入请求的情况下,也跨2个存储装置而保证日志的序号的顺序性。
另外,在专利文献1的技术中,在通常运行时第一存储装置接到来自主机计算机的访问。在针对包括第一存储装置的多个卷的日志组制成了日志、即针对向多个卷的写入赋予了一系列序号的情况下,在某一个卷发生了故障时,无法按每个卷进行失效备援,必需以该日志组为单位在第二存储装置进行失效备援。因此,存在主机计算机只能对一个存储装置进行访问,无法有效活用第一存储装置以及第二存储装置的资源这一问题。
本发明是考虑到了以上这一点而完成的,提供下述计算机系统以及数据管理方法:通过对双重化后的存储装置形成远程复制以提高耐故障性,双重化后的存储装置分别储存数据以及用于远程复制的数据的更新信息,主机计算机在通常运行时也能够对任一存储装置进行访问,从而能够有效活用存储装置的资源。
用于解决课题的技术方案
为了解决上述问题,本发明提供一种存储系统,其特征在于,具备:第一存储装置,连接于主机计算机,具有:储存数据的多个第一数据卷;和储存包括被写入所述多个第一数据卷的数据和表示所述数据被写入的顺序的更新编号的日志数据的第一日志卷;第二存储装置,连接于所述主机计算机以及所述第一存储装置,具有:储存所述多个第一数据卷各自的双重化数据的多个第二数据卷;和储存所述第一日志卷的双重化数据的第二日志卷;第三存储装置,连接于所述第一存储装置,具有使用从所述第一存储装置接收的所述日志数据而与所述多个第一数据卷构成远程复制对组的多个第三数据卷;和第四存储装置,连接于所述第三存储装置,具有储存所述多个第三数据卷各自的双重化数据的多个第四数据卷;所述第一存储装置对所述多个第一数据卷分别赋予虚拟卷标识符而将多个虚拟卷提供给所述主机计算机;所述第二存储装置对存储所述多个第一数据卷之一的双重化数据的所述多个第二数据卷之一而将虚拟卷提供给所述主机计算机,在所述第一存储装置的所述多个第一数据卷的任一或所述第二存储装置数据卷的任一发生了故障的情况下,在所述第一存储装置的所述第一日志卷以及所述第二存储装置的所述第二日志卷持续进行所述更新信息而进行双重管理。
发明效果
根据本发明,通过对双重化后的存储装置形成远程复制以提高耐故障性,双重化后的存储装置分别储存数据以及用于远程复制的数据的更新信息,主机计算机在通常运行时也能够对任一存储装置进行访问,从而能够有效活用存储装置的资源。
附图说明
图1是说明本发明的第一实施方式涉及的概要的概念图。
图2是示出该实施方式涉及的存储装置的硬件结构的框图。
图3是说明该实施方式涉及的由HA结构所实现的卷冗长化功能的概念图。
图4是说明该实施方式涉及的由HA结构所实现的卷冗长化功能的概念图。
图5是说明该实施方式涉及的由HA结构所实现的卷冗长化功能的概念图。
图6是说明该实施方式涉及的由HA结构所实现的卷冗长化功能的概念图。
图7是说明该实施方式涉及的由HA结构所实现的卷冗长化功能的概念图。
图8是说明该实施方式涉及的由HA结构所实现的卷冗长化功能的概念图。
图9是说明该实施方式涉及的与RC结构的协作处理的概念图。
图10是说明该实施方式涉及的与RC结构的协作处理的概念图。
图11是说明该实施方式涉及的与RC结构的协作处理的概念图。
图12是针对该实施方式涉及的删除处理进行说明的概念图。
图13是说明该实施方式涉及的第一物理卷发生故障时的处理的概念图。
图14是说明该实施方式涉及的第二物理卷发生故障时的处理的概念图。
图15是说明该实施方式涉及的第一以及第二物理卷发生故障时的处理的概念图。
图16是说明该实施方式涉及的第一存储装置发生故障时的处理的概念图。
图17是说明该实施方式涉及的第二存储装置发生故障时的处理的概念图。
图18是说明该实施方式涉及的第三存储装置发生故障时的处理的概念图。
图19是说明该实施方式涉及的第四存储装置发生故障时的处理的概念图。
图20是该实施方式涉及的路径发生故障时的处理的概念图。
图21是说明该实施方式涉及的路径发生故障时的处理的概念图。
图22是说明该实施方式涉及的第三以及第四物理卷发生故障时的处理的概念图。
图23是说明该实施方式涉及的第一以及第二存储装置发生故障时的处理的概念图。
图24是说明该实施方式涉及的故障暂停时的处理的概念图。
图25是说明该实施方式涉及的第二日志卷发生故障时的处理的概念图。
图26是说明该实施方式涉及的第二日志卷以及第一存储装置发生故障时的处理的概念图。
图27是说明该实施方式涉及的第一日志卷发生故障时的处理的概念图。
图28是说明该实施方式涉及的第一日志卷以及第二存储装置发生故障时的处理的概念图。
图29是说明该实施方式涉及的日志记录前的状态的概念图。
图30是说明该实施方式涉及的日志组的记录处理的概念图。
图31是说明该实施方式涉及的RC结构的配对形成处理的概念图。
图32是说明该实施方式涉及的RC结构的配对形成中的初始复制处理的概念图。
图33是说明该实施方式涉及的使用差分位图的初始复制的概念图。
图34是说明该实施方式涉及的初始复制时的故障发生的概念图。
图35是说明该实施方式涉及的初始复制时的故障发生的概念图。
图36是说明该实施方式涉及的初始复制时发生故障时的处理的概念图。
图37是说明该实施方式涉及的暂停操作时的处理的概念图。
图38是说明对该实施方式涉及的配对形成状态进行管理的位图的概念图。
图39是说明该实施方式涉及的暂停操作时的处理的概念图。
图40是说明该实施方式涉及的暂停操作时的处理的概念图。
图41是说明该实施方式涉及的暂停操作时的处理的概念图。
图42是说明该实施方式涉及的暂停中的I/O操作的概念图。
图43是说明该实施方式涉及的配对再次开始工作的概念图。
图44是说明该实施方式涉及的配对再次开始工作的概念图。
图45是说明该实施方式涉及的配对再次开始工作的概念图。
图46是说明该实施方式涉及的配对再次开始工作的概念图。
图47是示出该实施方式涉及的读出/写入处理的流程图。
图48是示出该实施方式涉及的读出/写入处理的流程图。
图49A是示出该实施方式涉及的主控侧(master)写入处理的流程图。
图49B是示出该实施方式涉及的主控侧写入处理的流程图。
图50是示出该实施方式涉及的双重写入处理的流程图。
图51A是示出该实施方式涉及的备用侧(slave)写入处理的流程图。
图51B是示出该实施方式涉及的备用侧写入处理的流程图。
图52是示出该实施方式涉及的主控侧复原处理的流程图。
图53是示出该实施方式涉及的SVOL侧双重写入传输处理的流程图。
图54是示出该实施方式涉及的SVOL侧双重写入接受处理的流程图。
图55是示出该实施方式涉及的SVOL侧删除处理的流程图。
图56是示出该实施方式涉及的PVOL侧主控的删除处理的流程图。
图57是示出该实施方式涉及的PVOL侧备用的删除处理的流程图。
图58是示出该实施方式涉及的因PVOL侧主控故障所产生的日志属性切换处理的流程图。
图59是示出该实施方式涉及的因PVOL侧主控故障所产生的日志属性切换处理的流程图。
图60是示出该实施方式涉及的因PVOL侧主控故障所产生的日志属性切换的流程图。
图61是示出该实施方式涉及的因PVOL侧主控故障所产生的日志属性切换的流程图。
图62是示出该实施方式涉及的因PVOL侧主控故障所产生的日志属性切换的流程图。
图63是示出该实施方式涉及的因SVOL侧主控故障所产生的日志属性切换的流程图。
图64是示出该实施方式涉及的因SVOL侧主控故障所产生的日志属性切换的流程图。
图65是说明本发明的第二实施方式涉及的利用了标记的数据写入处理的概念图。
图66是说明该实施方式涉及的冻结以及标记发行处理的概念图。
图67是说明该实施方式涉及的利用了标记的复原处理的概念图。
图68是说明该实施方式涉及的利用了标记的复原处理的概念图。
图69是说明该实施方式涉及的利用了标记的删除处理概念图。
具体实施方式
以下,参照附图详细描述本发明的一个实施方式。
(1)第一实施方式
(1-1)本实施方式的概要
首先,参照图1针对本实施方式的概要进行说明。如图1所示,第一存储装置100以及第二存储装置150被赋予同一虚拟存储装置ID,第一存储装置100以及第二存储装置150被主机计算机识别为1个虚拟存储装置10。第一存储装置100以及第二存储装置150具有对由2个存储装置分别管理的2个物理卷赋予同一虚拟卷ID(也成为GlobalDeviceID)并提供给主机计算机的功能。具有交替路径功能的主机计算机30,将第一虚拟存储装置10内的2个物理卷识别为同一卷。以下,有时也将这样不同的存储装置的2个卷虚拟化而使数据双重化的结构称为HA(High-Availability,高可用性)结构,将HA结构的首要(primary)侧称为HA首要、将辅助(secondary)侧称为HA辅助而进行说明。
为了实现上述功能,需要使第一存储装置100与第二存储装置150的2个物理卷的数据保持同步。另外,本实施方式中,为了提高响应性能,而将由第一存储装置100管理的物理卷和由第二存储装置150管理的物理卷近距离设置。只是,第一存储装置和第二存储装置也可以远距离设置。
进一步,第二虚拟存储装置20距离第一虚拟存储装置10较远,由第三存储装置200以及第四存储装置250这2个存储装置构成。第二虚拟存储装置20也与第一虚拟存储装置10同样地,具有对由第三存储装置200以及第四存储装置250这2个存储装置管理的2个物理卷赋予同一虚拟卷ID并将其提供给主机计算机30的功能。针对这样的由HA结构所实现的卷的冗长化功能,将在下文中详细说明。
另外,提高异步远程复制功能,数据被备份于由第三存储装置200以及第四存储装置250管理的物理卷。在发生大范围的灾害,而处于近距离的第一存储装置100以及第二存储装置150的2个物理卷中的任一个变得不能使用的情况下,来自主机计算机30的访问被切换到距离第一虚拟存储装置10较远的第二虚拟存储装置20。以下有时将这样的利用异步远程复制功能而备份数据的结构称为RC(RemoteCopy,远程复制)结构而进行说明。
由此,能够一边有效活用2台存储装置的资源,一边通过异步远程复制将数据备份到距离较远的存储装置以提高系统的可用性。此外,作为能够采用的结构,例如,第一存储装置和第二存储装置设置在同一数据中心内,第三存储装置和第四存储装置设备在不同的远程数据中心内。或者,4个存储装置也可以分别设置在不同的4个数据中心。
另外,第一虚拟存储装置10与第二虚拟存储装置20之间的远程复制,作为使用日志数据的异步远程复制而实施。所谓日志数据是包括数据和表示数据被写入的顺序的序号的数据。
如图1所示,第一存储装置100具有:第一物理卷101A以及101B,为用于储存数据的物理卷(LDEV:LogicalDevice);和第一日志卷102,为储存日志数据的物理卷。同样地,第二存储装置150具有第二物理卷151A以及151B和储存日志数据的第二日志卷152。
第一存储装置100在从主机计算机30接收了写入请求的情况下,按照写入请求将数据储存于第一物理卷101A或101B,且将该数据的日志数据(数据以及表示数据被写入的顺序的序号)储存于第一日志卷102。而且,第一存储装置100向第二存储装置150传输数据和序号。第二存储装置150将接收到的数据储存于第二物理卷151A或151B,基于接收到的序号制作日志并将其储存于第二日志卷152。
另外,第三存储装置200对第一存储装置100发行读出日志(RDJNL)指令,接收被储存于第一日志卷102的日志,从而与远程复制异步地实施向第一存储装置100的写入请求。即,第三存储装置200将从第一存储装置100接收到的日志储存于第二日志卷202,基于日志所含的序号将数据储存于第三物理卷201A或201B,从而复原卷。另外,也从第三存储装置200对第四存储装置250传输数据和序号,写入数据被储存于第四物理卷251A或251B。
本实施方式中,如上所述,从主机计算机30不仅对第一存储装置100而且还对第二存储装置150进行了读出/写入请求。另外,第一存储装置100具有的第一物理卷和第二存储装置具有的第二物理卷,被主机计算机识别为同一卷。此时,根据数据的写入而制作的日志的序号的顺序性成为问题。本实施方式中,通过将获取日志的序号的存储装置固定于第一存储装置100和第二存储装置150的任一,从而保证日志的序号的顺序性。
例如,设为第一物理存储装置100必需获取日志的序号,在从主机计算机30对第一存储装置100进行写入的情况下和对第二存储装置150进行写入的情况下,都由第一存储装置100获取日志的序号。接着,由第一存储装置100获取的日志的序号被传输到第二存储装置150,数据和该序号被储存于第二存储装置150的第二日志卷152。这样一来,能够保证第一虚拟存储装置10中的日志的序号的顺序性。
(1-2)计算机系统的结构
如图1所示,本实施方式涉及的计算机系统由下述部分构成:包括第一存储装置100以及第二存储装置150的第一虚拟存储装置10;包括第三存储装置200以及第四存储装置250的第二虚拟存储装置20;和主机计算机30。
第一存储装置100以及第二存储装置150经由主机计算机30和I/O网络50A以及50B连接。另外,第一存储装置100和第二存储装置150经由I/O网络50C连接。另外,第一存储装置100和第三存储装置200经由I/O网络40A连接,第二存储装置150和第四存储装置250经由I/O网络40B连接。进一步,第三存储装置200和第四存储装置250经由I/O网络40C连接。
此外,图1中,第一存储装置100和第三存储装置200经由I/O网络40A连接,第二存储装置150和第四存储装置250经由I/O网络40B连接,但是不限定于该例子,也可以,第一存储装置100和第四存储装置250经由I/O网络连接,第二存储装置150和第三存储装置200经由I/O网络连接。
第一存储装置100、第二存储装置150、第三存储装置200以及第四存储装置250的硬件结构,在下文中详细说明。
主机计算机30对第一虚拟存储装置10或第二虚拟存储装置20进行数据的读出/写入请求。在主机计算机30具有内部网络,在该网络连接有处理器、存储器和I/O端口。处理器作为运算处理装置发挥作用,按照存储器所存储的程序、运算参数等对主机计算机30的工作进行控制。
I/O网络40A~C以及50A~C,一般认为采用光纤进行连接是最好的,但是除此以外,也可以考虑FICON(FIbreCONnection:注册商标)、Ethernet(注册商标)和TCP/IP(TransmissionControlProtocol/InternetProtocol)和iSCSI(internetSCSI(SmallComputerSystemInterface))的组合、Ethernet(注册商标)和NFS(NetworkFileSystem)、CIFS(CommonInternetFileSystem)等网络文件系统的组合等。进一步,只要是能够传输I/O请求的通信装置,则I/O网络1300也可以是这些之外的装置。
(1-3)存储装置的结构
接下来,参照图2针对第一存储装置100的硬件结构进行说明。如图2所示,第一存储装置100具备控制器110A、110B(以后有时也总称为控制器110进行说明)、高速缓冲存储器118和多个HDD(硬盘驱动器(HardDiskDrive))120。控制器110以及高速缓冲存储器118也可以分别由多个元件构成。通过由多个元件构成,从而即使在元件单体发生了故障而闭塞的情况下,也能够使用剩余元件继续接受以读出和写入为代表的I/O请求。此外,第一存储装置也可以取代HDD而具备SSD(SolidStateDrive,固态驱动器)等存储器件,或者也可以在HDD的基础上还具备SSD(SolidStateDrive)等存储器件。
控制器110A是对第一存储装置100的工作进行控制的装置(例如电路基板)。在控制器110A具有内部网络117,在该内部网络117连接有I/O端口113、高速缓存端口116、管理端口114、后端端口115、处理器(例如CPU(CentralProcessingUnit))111以及存储器112。控制器110A、控制器110B和高速缓冲存储器118通过内部网络117相互连接。另外,控制器110和各HDD120通过多个后端网络121相互连接。
另外,在图1中,在控制器110中存在一个I/O端口113,但是实际上也可以在控制器110存在多个I/O端口113。
另外,第二存储装置150、第三存储装置200以及第四存储装置250的硬件结构,与第一存储装置100相同,因此省略。
通过上述硬件结构,使得主机30能够读出或写入第一存储装置100、第二存储装置150、第三存储装置200或第四存储装置250的HDD120中所保存的全部或部分数据。此外,以下有时也将各存储装置作为主语对处理进行说明,但是实际上,处理器111当然也可以基于各存储装置的存储器112中所存储的程序来执行该处理。
控制器将多个HDD作为RAID组而进行控制。另外,控制器对基于RAID组的存储区域进行分割以构成1个以上物理卷。也就是,物理卷基于RAID组内的多个HDD各自的存储区域的一部分而构成。控制器,如果从主机计算机接到针对卷的读出/写入请求,则确定与卷相对应的HDD并执行数据的读出/写入。
此外,RAID组是按特定的RAID等级将多个HDD统一成1个而成的。针对RAID等级,例如可以举出:将同一数据同时写入多个驱动器的被称为“镜像”的RAID1、将在HDD中储存的数据分割地写入多个驱动器时也记录校验数据的RAID5、双重记录校验数据且在2台驱动器同时发生故障时所具备的RAID6等。在本实施方式中,RAID等级也可以是任意等级。
(1-4)由HA结构所实现的卷冗长化
接下来,参照图3~8针对由HA结构所实现的卷冗长化功能进行说明。如上所述,卷冗长化功能是通过对不同物理卷赋予同一虚拟卷ID从而被主机计算机30识别为恰如1个卷的功能。
使用图3针对虚拟存储装置以及虚拟卷进行说明。第一存储装置100以及第二存储装置150将同一虚拟存储装置ID提供给主机计算机30。由此,如图3所示,主机计算机30不对第一存储装置100和第二存储装置150加以区别而识别为虚拟存储装置10。各存储装置保持各个存储装置ID与虚拟存储装置ID的对应关系。例如,各存储装置的存储器112上储存存储装置ID与虚拟存储装置ID的映射表。虚拟存储装置也可以设定为多个。
在各存储装置的端口ID(例如WWN:WorldWideName)包括存储装置ID的情况下,也可以针对端口ID而设定虚拟端口ID。也就是,在虚拟存储装置上存在多个虚拟端口,各虚拟端口与多个物理存储装置上的任一端口相对应。而且,主机计算机30不区别端口存在于哪个物理存储装置,指定虚拟端口ID而发行访问请求。该情况下,各物理存储装置在存储器上保持表示虚拟端口与物理存储装置的端口的对应关系的信息(例如映射表)。
主机计算机30识别的虚拟卷11,受第一存储装置100的第一物理卷101和第二存储装置140的第二物理卷151双重化管理。具体而言,同一虚拟卷11的虚拟卷ID对应于第一卷101的物理ID和第二物理卷151的物理ID而受到管理。各存储装置保持虚拟卷ID与和虚拟卷ID相对应的多个物理卷ID的对应关系。例如,在各存储装置的存储器112上储存虚拟卷ID与物理卷ID的映射表。
因此,主机计算机30能够将多台存储装置是被为1台虚拟存储装置10,能够与对物理卷的访问同样地对虚拟卷11进行访问。而且,经由虚拟卷11被写入任一物理卷的数据,又被写入另一物理卷使得数据双重化。
因此,在非HA结构的存储系统的情况下,如果物理卷发生故障则向数据的存取变得不能进行,但是通过上述卷冗长化功能,即使在双重后的一个物理卷发生了故障,也能够使用另一物理卷进行针对数据的存取。
另外,在从旧物理存储装置向新物理存储装置转移数据时,通过将物理存储装置虚拟化,使主机计算机将新存储装置识别成与旧存储装置相同的虚拟存储装置,从而能够在转移前后实施同样的运行。也就是,主机计算机不停止业务,就能够进行物理存储装置的置换。
如上所述,卷冗长化功能中,即使双重化了的一个物理卷变得不能使用,也能够使用另一物理卷来进行针对数据的存取。因此,在发生故障时以外,需要将数据双重化而写入2个物理卷。这里,参照图4以及图5针对将数据双重化时的写入处理进行说明。
如图4所示,第一虚拟存储装置10由第一存储装置100以及第二存储装置150构成。以下,将HA结构的首要装置(HA首要)作为第一存储装置100、将HA结构的辅助装置(HA)作为第二存储装置150进行说明。HA结构中,为了保持数据的整合性,需要预先确定表示从2个装置中的哪个装置的卷进行写入的写入规则。以下,针对从HA首要侧即第一存储装置100先写入的写入处理进行说明。
如图4所示,如果从主机计算机30对第一存储装置100进行写入请求(S101),则第一存储装置100将数据写入第一物理卷101(S102)。接着,第一存储装置100将数据传输到第二存储装置150(S103),第二存储装置150将数据写入第二物理卷151(S104)。针对图4所示的仲裁盘(QuorumDisk)的作用,在下文中详细说明。
另外,如图5所示,如果从主机计算机30对第二存储装置150进行写入请求(S111),则第二存储装置150将数据传输到第一存储装置100(S112)。接着,第一存储装置100将数据写入第一物理卷101后(S113),数据又被写入第二存储装置150的第二物理卷151(S114)。
接下来,针对读出处理进行说明。例如,考虑在数据仅被写入首要侧的状态下,读出被仅写入首要侧的数据的情况。此时,在将数据写入辅助侧前首要侧由于故障而变得不能使用,如果对辅助侧发行读出指令,则会读出比首要侧的数据旧的数据。为了避免这样的数据的不整合,就要考虑与写入处理相应地保证读出处理的顺序性的手段、对同一数据范围的写入处理和读出处理进行排他控制。以下,详细进行说明。
首先,参照图6以及图7针对保证读出处理的顺序性的手段进行说明。读出处理中的数据的读出顺序因上述的写入规则而异。在写入处理的序号设为先首要侧后辅助侧的情况下,从辅助侧开始执行读出处理。相反地,在写入处理的序号设为先辅助侧后首要侧的情况下,从首要侧开始执行读出处理。
以下,针对从辅助侧开始进行读入处理的情况进行说明。如图6所述,如果从主机计算机30对第一存储装置100进行读入请求(S121),则从第一存储装置100对第二存储装置200通知读入请求,从第二存储装置200的第二物理卷151读出数据(S122)。
另外,如图7所示,如果从主机计算机30对第二存储装置100进行读入请求(S131),则从第二存储装置100的第二物理卷151读出数据(S132)。这样,在有来自主机计算机30的的读出请求的情况下,必然从辅助侧读出数据,从而能够避免卷故障时的数据的不整合。
接下来,参照图8针对写入处理和读出处理的排他控制进行说明。从主机计算机30对第一存储装置进行写入请求(S141),数据被写入第一卷101(S142)。此后,在数据被传输到第二存储装置150之前第一存储装置100发生了故障的情况下,不进行向第二存储装置的数据传输(S145)和向第二物理卷151的数据写入(S146)。
此时,如果对第二存储装置150进行了数据的读入请求(S147),则新数据未被写入第二物理卷151,所以旧数据被读出(S148)。另一方面,在第一存储装置100侧,只要新数据在第二存储装置150侧的写入没有完成就对向第一卷101的读出指令进行排他。由此,即使在数据传输前第一存储装置100发生了故障,因为在第一存储装置100侧未使新数据读出,所以数据不会发生卷回,能够避免卷故障时的数据的不整合。
接下来,针对构成HA结构时的初始复制进行说明。在HA结构的初始复制中将HA结构的首要侧(HA首要侧)的所有数据复制到HA结构的辅助(HA辅助侧)。而且,从开头数据位置到最终数据位置为止进行差分位图管理,从开头到最终,依次复制差分位图为ON的数据。初始复制时,所有数据的差分位图设定为ON。
读出/写入处理的工作与上述同样地,设为按从HA首要侧到HA辅助侧的顺序实施写入处理。向初始复制完成后的数据位置的写入处理工作,按从HA首要侧向HA辅助侧的顺序实施。另外,向初始复制未完成的数据位置的写入处理,不对辅助侧进行写入而仅向HA首要侧实施写入处理,已写入HA首要侧的数据通过初始复制被写入HA辅助侧。
此外,在初始复制中在HA首要侧发生了故障的情况下,HA辅助侧的数据未完成复制、不能使用,因此在HA首要侧获取仲裁盘的锁定(lock(参照图4等))。仲裁盘105是用于进行装置间的协调所使用的存储器件。HA结构中,使用SCSI指令对仲裁盘105实施共有排他控制。如上所述,在初始复制中在HA首要侧发生了故障的情况下,在HA首要侧获取仲裁盘的锁定,切断向HA辅助侧的访问。
接下来,针对在初始复制完成后发生了故障的情况进行说明。
(HA首要卷故障/装置故障)
在HA首要侧发生了故障的情况下,数据不双重化于HA首要侧,因此HA首要侧的数据变为比HA辅助侧旧的数据。为了防止从主机计算机30对旧数据的存取,而在HA辅助侧获取仲裁盘105的锁定。通过在HA辅助侧的锁定获取,切断向HA首要侧的访问。另外,在HA辅助侧获取到了仲裁盘105的锁定的时刻,曾为HA辅助侧的第二存储装置150具有HA首要侧的属性。而且,无法双重化于HA首要侧的数据在HA辅助侧受差分管理。
(HA辅助卷故障/装置故障)
另外,在HA辅助侧发生了故障的情况下,在HA首要侧获取仲裁盘105的锁定。通过在HA首要侧的锁定获取,切断向HA辅助侧的访问。另外,无法双重化于HA辅助的数据在HA首要侧受差分管理。
(路径故障)
例如,设为从主机计算机30对辅助侧进行了写入请求,但是由于路径故障向首要侧的数据写入变得不可能。此时,在HA辅助侧获取仲裁盘105的锁定。通过在HA辅助侧的锁定获取,切断向HA首要侧的访问。另外,设为从主机计算机30对首要侧进行了写入请求,但由于路径故障而使向辅助侧的数据写入变得不可能。此时,在HA首要获取仲裁盘105的锁定。通过在HA首要侧的锁定获取,切断向HA辅助侧的访问。
(仲裁盘故障)
另外,在仲裁盘105发生了故障的情况下,通过HA首要侧的定期检测而检测到故障。而且,在HA首要侧获取仲裁盘的锁定,将HA辅助侧设为封闭状态。这是因为:在仲裁盘105的故障发生后,在首要侧与辅助侧的数据无法同步的情况下,容易进行哪一个数据是最新数据的判断。而且,在仲裁盘的故障恢复之后,在仲裁盘105写入HA首要侧105的锁定获取信息。
接下来,针对A结构中的故障恢复处理进行说明。首先,针对HA辅助侧的故障恢复的情况进行。先将HA辅助侧的故障部位恢复。接着,从HA首要侧向HA辅助侧实施再同步操作。通过再同步操作实施,复制HA首要侧与HA辅助侧之间的差分数据。接着,在再同步完成时,解除HA首要侧的仲裁盘105的锁定状态。接着,恢复从主机计算机30向HA辅助侧的路径以恢复HA辅助侧的闭塞状态。
另外,在由再同步操作所进行的差分数据复制期间,向差分位图为ON的数据范围的写入处理,保持差分位图为ON的状态,仅在HA首要侧进行写入处理并通过差分复制将其复制到HA辅助侧。也可以考虑在HA首要/HA辅助侧这两则进行写入处理而将差分位图设为OFF,但是在该情况下,由于在向HA辅助侧的写入处理后在HA首要侧使差分位图OFF的处理,响应时间会增加。另外,向差分位图为OFF的数据范围的写入处理,差分位图保持OFF,向HA首要侧和HA辅助侧这两侧双重写入数据。
接下来,针对HA首要侧的故障恢复了的情况进行说明。首先,对原HA首要侧的故障部位进行恢复。此外,从仲裁盘105的锁定获取时刻起,使HA辅助侧和HA首要侧的作用颠倒。接着,从原HA辅助侧向原HA首要侧实施再同步操作。通过再同步操作实施,复制原HA辅助侧与原HA首要侧之间的差分数据。接着,在再同步完成时,解除原HA辅助侧的仲裁盘的锁定状态。接着,恢复从主机计算机30向原HA首要侧的路径以恢复HA首要侧的闭塞状态。
另外,在通过再同步操作所进行的差分数据复制期间,向差分位图为ON的数据范围的写入处理,保持差分位图为ON的情况下,仅向原HA辅助侧进行写入处理,通过差分复制而复制到原HA首要侧。也可以考虑在原HA辅助侧/原HA首要侧这两侧进行写入处理而将差分位图设为OFF,但是在该情况下,由于在向原HA首要侧的写入处理后在HA辅助侧使差分位图OFF的处理,响应时间会増加。另外,向差分位图为OFF的数据范围的写入处理,差分位图保持OFF,向原HA辅助侧和原HA首要侧这两侧双重写入数据。
(1-5)与异步远程复制功能的协作
接下来,针对与上述的异步远程复制功能的协作进行说明。以下,针对使上述HA结构与通过异步远程复制功能对数据进行备份的结构即RC结构协作了的情况下的处理进行说明。
(写入处理之1)
参照图9,针对从主机计算机30向HA首要侧进行了写入请求的情况下的通常处理进行说明。图9与图1的结构同样地,第一存储装置100以及第二存储装置150形成将卷双重化的HA结构,第三存储装置200以及第四存储装置250也形成HA结构。另外,包括第一存储装置以及第二存储装置的第一虚拟存储装置10、和包括第三存储装置200以及第四存储装置250的第二虚拟存储装置20,形成通过异步远程复制功能使数据双重化的RC结构。
首先,如果从主机计算机30向第一存储装置100进行写入请求(S201),则第一存储装置100将数据写入第一物理卷101A(S202)。接着,第一存储装置100获取数据的序号(S203),在第一日志卷102中制作日志(S204)。接着,第一存储装置100将数据和序号传输到第二存储装置200而实施数据的双重化处理(S205)。此外,如图9所示,HA结构的首要侧即制作日志侧的日志属性(图中表记为JNLG状态)变为主控(图中Master),HA结构的辅助侧即接受制作出的日志侧的日志属性变为备用。
第二存储装置150向第二物理卷151A写入数据(S206),使用在步骤S205中发送的序号在对第二日志卷152中制作日志(S207)。接着,第二存储装置150对第一存储装置100作出完成响应(S208),第一存储装置100对主机计算机30作出完成响应(S209)。
接着,第三存储装置200异步地发行RDJNL指令以获取在第一存储装置100的第一日志卷102所储存的日志(S211)。第三存储装置200将日志数据储存于第三日志卷202(S212),实施根据日志数据将数据复原的复原处理(S213)。第三存储装置200将数据和序号传输到第四存储装置250以实施数据的双重化处理(S214)。
接着,第四存储装置250将数据写入第四物理卷251A(S215),第三存储装置200将数据写入第三物理卷201A(S216)。
(写入处理之2)
接下来,参照图10针对从主机计算机30向HA辅助侧进行了写入请求的情况下的通常处理进行说明。
首先,如果从主机计算机30向第二存储装置150进行写入请求(S221),则第二存储装置150将数据传输到第一存储装置100(S222)。接着,第一存储装置100将数据写入第一物理卷101A(S223)并获取数据的序号(S224),在第一日志卷102中制作日志(S225)。接着,第一存储装置100将数据和序号传输到第二存储装置150,作出完成响应(S226)。
第二存储装置150将数据写入第二物理卷151A(S227),使用在步骤S226中发送来的序号而在第二日志卷152中制作日志(S228)。接着,第二存储装置150对主机计算机30作出完成响应(S229)。
接下来,第二虚拟存储装置20的第三存储装置200以及第四存储装置250中的异步远程复制的处理,为图9的处理相同所以省略对其的详细说明。
(写入处理之3)
另外,图11是针对从主机计算机30向HA首要侧以及HA辅助侧这两侧进行了写入请求的情况下的、通常处理进行说明的图,但是向HA首要侧进行写入请求的情况与图9中说明了的处理相同,向HA辅助侧进行写入请求的情况与图10中说明了的处理相同,所以省略详细的说明。另外,在向HA首要侧以及HA辅助侧这两侧进行了写入请求的情况,异步远程复制处理也因为与图9的处理相同,所以省略详细的说明。
本实施方式中,在各存储装置具有多个卷的情况下,针对多个卷制作日志。具体而言,如图11所示,在对第一存储装置100的第一物理卷101B进行了数据写入的情况下(S242),获取针对该数据的序号(S243)以在第一日志卷102中制作日志(S244)。另外,在对第一物理卷101A进行了数据写入的情况下(S253),获取针对该数据的序号(S254)以在第一日志卷102中制作日志(S255)。
这样,本实施方式中,对于向多个卷的写入赋予一系列序号。在多个卷中的一个卷发生了故障的情况下,能够不以发生故障的卷所属的日志组为单位进行失效备援,而以卷为单位进行失效备援。由此,在发生故障时来自主机计算机30的存取偏向于一个存储装置,能够避免变得无法有效活用资源这一事态。
(删除处理)
接着,针对将日志数据废弃的删除处理进行说明。如图12所示,在第二虚拟存储装置20中正常实施双重化处理(S264、S265),向第三存储装置200的第三物理卷201B写入数据(S266),删除日志数据(S267)。
第三存储装置200在使用RDJNL指令从第一存储装置100获取日志时,将日志的可删除序号通知给第一存储装置100(S268)。第一存储装置100从第一日志卷102中删除在步骤S268中通知过的日志(S269)。接着,第一存储装置100向第二存储装置150通知日志的可删除序号(S270)。第二存储装置150将在步骤S270中通知过的序号的日志从第二日志卷152中删除(S271)。
(1-6)故障模式1
接下来,针对在使上述HA结构与通过异步远程复制功能对数据进行备份的结构即RC结构协作的结构中、发生了故障时的处理进行说明。
(故障模式1)
图13示出第一存储装置100的第一物理卷101A发生了故障的情况。如图13所示,若从主机计算机30对第二存储装置150进行写入请求(S221),第二存储装置150将数据传输到第一存储装置150(S222)。但是,因为在第一物理卷101A发生了故障所以不进行数据的写入,就获取数据的序号(S224),在第一日志卷102中制作日志(S225)。
步骤S226以后的处理,因为与图10所示的写入处理相同,所以省略详细的说明。这样,在第一物理卷101A发生了故障的情况下,通过在第一存储装置100获取数据的序号以制作日志,从而也能够确保上述HA结构中的数据的顺序性,同时,在卷故障发生后,进一步在别的成对卷(例如第一物理卷101B和第二物理卷151B的配对)中的任一卷发生了故障的情况下,也能够持续进行异步远程复制。
(故障模式2)
图14示出第二存储装置150的第二物理卷151B发生了故障的情况。如图14所示,如果从主机计算机30向第一存储装置100进行写入请求(S201),则第一存储装置100将数据写入第一物理卷101B(S202)。接着,第一存储装置100获取数据的序号(S203)以在第一日志卷102中制作日志(S204)。接着,第一存储装置100将数据和序号传输到第二存储装置150以实施数据的双重化处理(S205)。
第二存储装置150,因为在第二物理卷151B发生了故障,所以不进行向第二物理卷151B的数据写入,就使用在步骤S205中发送来的序号在第二日志卷152中制作日志(S207)。接着,第二存储装置150对第一存储装置100作出完成响应(S208),第一存储装置100对主机计算机30作出完成响应(S209)。
接下来的第二虚拟存储装置20的第三存储装置200以及第四存储装置250中的异步远程复制的处理,因为与图9的处理相同,所以省略详细的说明。
这样,在第二物理卷101B发生了故障的情况下,通过在第一存储装置100获取数据的序号而制作日志,从而也能够确保上述HA结构中的数据的顺序性,同时,在卷故障发生后,进一步,别的成对卷发生了故障的情况下,也能够持续进行异步远程复制。
(故障模式3)
图15示出第一存储装置100的第一物理卷101A以及第二存储装置150的第二物理卷151B发生了故障的情况。如图15所示,在第一物理卷101A以及第二物理卷151B发生了故障的情况下,在步骤S253以及步骤S246中对两个卷不进行数据的写入。但是,在步骤S243以及步骤S244中,实施序号的获取和日志的制作。另外,也实施步骤S247中的日志制作。
这样,即使两个装置的卷发生了故障也持续进行日志的制作,从而在第一存储装置100或第二存储装置150的卷发生故障后,进一步在别的成对卷发生了故障那样的情况下,也能够持续进行异步的远程复制。
(故障模式4)
图16示出第一存储装置100发生了故障的情况。如果第一存储装置100发生故障,则即使对第二存储装置150进行了写入请求,也无法对第一存储装置100传输数据,无法实施步骤S222~步骤S226的双重化处理。具体而言,第二存储装置150在检测到不能进行向第一存储装置100的双重化写入处理并在仲裁盘105中获取日志锁定后,停止日志的双重化写入处理。
接着,在第二存储装置150能够在仲裁盘105中获取到了卷配对以及日志组的所有锁定的情况下,将第二存储装置150切换到首要侧。接着,将日志属性(图中表记为JNLG状态記)从备用(Slave)切换到主控(Master)而向第二物理卷151A写入数据(S227)。第二存储装置150采用在第二日志卷152中制作完毕的日志的序号上加1所得的序号(S301)而制作日志(S302)。
此外,在第一存储装置100出现了故障的情况下,将日志组以及卷配对的锁定状态设为闭塞状态(Blocked)。另外,在第一存储装置100在将锁定状态设定为闭塞(Block)状态之前死机的情况下,在第一存储装置100的恢复时,读入仲裁盘105,在HA结构的对方侧获取了锁定的情况下,使自身的锁定状态迁移到闭塞状态。
接着,第二存储装置150通知第四存储装置250其日志属性的已切换为主控、即第二存储装置150变为首要侧这一情况。此外,在第二存储装置150和第三存储装置200经由网络连接的情况下,也可以向第三存储装置200通知其日志属性切换为主控。
第四存储装置250接到来自第二存储装置150的日志属性切换的通知,将日志属性变更为主控并对第三存储装置200发行RDJNL停止指示。另外,第三存储装置200接到RDJNL停止指示而停止RDJNL指令的发行。接着,第四存储装置250在针对第二存储装置150复原完毕的序号上加上1以发行RDJNL指令(S311)而获取日志(S312),开始复原(S313)。
接着,第四存储装置250将数据和序号传输到第三存储装置200以实施数据的双重化处理(S314)。第三存储装置200将数据写入第三物理卷201A(S315),第四存储装置250将数据写入第四物理卷251A(S316)。
如上所述,第一存储装置100以及第二存储装置150中,通过HA结构对多个卷和日志都进行双重管理。因此,在第一存储装置100发生了故障的情况下,也能够原样持续进行从主机计算机30向第二存储装置150的访问,持续进行第二存储装置150与RC结构的辅助侧存储装置之间的远程复制。
(故障模式5)
图17示出第二存储装置150发生了故障的情况。如果从主机计算机30向第一存储装置100进行写入请求(S201),则第一存储装置100将数据写入第一物理卷101A(S202)。接着,第一存储装置100获取数据的序号(S203)在第一日志卷102中制作日志(S204)。
接着,第一存储装置100在检测到不能进行向第二存储装置150的第二物理卷151A的双重化写入并获取了仲裁盘105的日志属性的锁定后,停止双重化写入处理。
接下来的第二虚拟存储装置20的第三存储装置200以及第四存储装置250中的异步远程复制的处理,因为与图9的处理相同,所以省略详细的说明。
如上所述,在第二存储装置150发生了故障的情况下,与图16所示的在第一存储装置100发生了故障的情况相同,也能够原样持续进行从主机计算机30向第一存储装置100的访问,也能够持续进行第一存储装置100与RC结构的辅助侧存储装置之间的远程复制。
(故障模式6)
图18示出第三存储装置200发生了故障的情况。图18中,与图11同样地从主机计算机30向HA首要侧以及HA辅助侧这两侧进行写入请求。
第一存储装置100,如果检测到来自第三存储装置200的RDJNL指令的中断,则在第一虚拟存储装置10的首要侧与辅助侧之间进行切换,所以切换日志属性的主控/备用。接着,第二存储装置150通过来自第一存储装置100的通知,将日志属性切换为主控以对第四存储装置250指示主控切换。
此外,在第一存储装置100与第四存储装置250连接的情况下,也可以不在第一虚拟存储装置10中进行首要侧与辅助侧的切换,就进行切换通知,使得从第一存储装置100向第四存储装置250发行RDJNL指令。
接着,第四存储装置250通过来自第二存储装置150的通知而将日志属性切换为主控。另外,因为向第三存储装置200的双重化写入处理不能进行,所以在仲裁盘105中获取卷配对以及日志属性的锁定。
此外,如上所述,在从第一存储装置100向第四存储装置250进行了RDJNL指令发行的切换通知的情况下,因为不能进行向第三存储装置200的双重化写入,所以在仲裁盘105中获取卷配对以及日志属性的锁定。接着,将第四存储装置250的日志属性切换为主控,将用于发行RDJNL指令的路径从第二存储装置150切换为第一存储装置100。
接着,第四存储装置250在针对第二存储装置150复原完毕的序号上加上1以发行RDJNL指令而获取日志(312),开始复原(S313)。向第三存储装置200的双重化处理不能进行,所以第四存储装置250向第四物理卷251B写入数据(S316)。
此外,在第一存储装置100和第四存储装置250连接的情况下,也可以不在第一存储装置100与第二存储装置150之间进行主控/备用切换,第四存储装置250就向第一存储装置100发行RDJNL指令以获取日志数据。
如上所述,在第三存储装置200以及第四存储装置250中,通过HA结构对多个卷和日志都进行双重管理。因此,如上所述,在第三存储装置200发生了故障的情况下,也能够针对第四存储装置250继续进行RDJNL指令的发行等处理,持续进行第四存储装置250与第一虚拟存储装置10的远程复制。
(故障模式7)
图19示出第四存储装置250发生了故障的情况。该情况下,不在RC结构中的辅助侧的第二虚拟存储装置20侧实施数据的双重化处理(S264、S265)。第三存储装置200检测到不能进行向第四存储装置250的双重化写入,而获取第三存储装置200的卷配对的锁定以及日志属性的锁定而停止双重化处理。
在第四存储装置250发生故障期间,无法在RC结构的辅助侧对数据进行双重管理,但是能够原样持续进行第三存储装置200与第一虚拟存储装置10之间的远程复制。
(故障模式8)
图20示出连接第一存储装置100与第三存储装置200的路径发生了故障的情况。第一存储装置100,如果检测到来自第三存储装置200的RDJNL指令中断,则为了在第一虚拟存储装置10中的首要侧与辅助侧之间进行切换,而切换日志属性的主控/备用。接着,第二存储装置150通过来自第一存储装置100的通知,将日志属性切换为主控而向第四存储装置250指示主控切换。
此外,在第一存储装置100与第四存储装置250连接的情况下,也可以不在第一虚拟存储装置10中进行首要侧与辅助侧的切换,就进行切换通知,使得从第一存储装置100向第四存储装置250发行RDJNL指令。
接着,第四存储装置250通过来自第二存储装置150的通知将日志属性切换为主控。
此外,如上所述,在从第一存储装置100向第四存储装置250进行了RDJNL指令发行的切换通知的情况下,将第四存储装置250的日志属性切换为主控,将用于发行RDJNL指令的路径从第二存储装置150切换到第一存储装置100。
接着,第四存储装置250在复原完毕的日志的序号上加上1而对第二存储装置150发行RDJNL指令以获取日志(312),开始复原(S313)。接着,第三存储装置200将数据和序号传输到第四存储装置250,实施数据的双重化处理(S314)。第三存储装置200将数据写入第三物理卷201A(S315),第四存储装置250将数据写入第四物理卷251A(S316)。
如上所述,第三存储装置200以及第四存储装置250中,通过HA结构对多个卷和日志都予以双重管理。因此,如上所述,在将第一存储装置100与第三存储装置200连接的路径发生了故障的情况下,也能够相继于对第四存储装置250发行RDJNL指令等处理,而持续进行第四存储装置250与第一虚拟存储装置10之间的远程复制。另外,也能够持续在第四存储装置250与第三存储装置200之间进行数据的双重化处理。
(故障模式9)
图21示出将第二存储装置150与第四存储装置250连接的路径发生了故障的情况。该故障不会影响到HA结构中的双重化处理也不会影响到RC结构中的异步远程复制处理,所以进行与图11所示的通常处理相同的处理。
在将第二存储装置150与第四存储装置250连接的路径发生了故障的情况下,因为数据还是被写入第四存储装置250的第四物理卷251,所以也能够持续进行第二虚拟存储装置20中的数据的双重化。
(故障模式10)
图22示出形成RC结构的远程复制侧的卷故障。图22中,第三存储装置200的第三物理卷201A以及第四存储装置250的第四物理卷251B发生了故障。该情况下,在远程复制侧不对发生了故障的物理卷进行数据的写入,数据不进行双重化。但是,因为从第三存储装置200向第四存储装置250通知数据的序号,所以在第四存储装置250的第四日志卷储存最新的序号。
如上所述,本实施方式中,由RC结构的辅助侧的第三存储装置200以及第四存储装置250形成HA结构。因此,即使在执行复原处理的RC结构的辅助侧发生卷故障,也能够通过未发生故障的成对卷持续进行复原处理。
(故障模式11)
图23示出第一虚拟存储装置10的第一存储装置100以及第二存储装置150发生了故障的情况。在该情况下,从主机计算机30向第一虚拟存储装置10的访问变得不能进行。因此,切换到有别于主机计算机30的远程主机计算机,从该主机计算机向第三存储装置200或第四存储装置250进行数据的写入处理。该情况下的写入处理,因为与图11中的通常写入处理相同,所以省略详细的说明。
本实施方式中,在RC结构的辅助侧也通过第三存储装置200以及第四存储装置250形成HA结构,所以在RC结构的首要侧的第一存储装置100以及第二存储装置150这两个装置发生了故障的情况下,也能够在位于远程等的RC结构的辅助侧即时地实现与首要侧的HA结构相同的结构。
(故障模式12)
图24示出由于第一存储装置100与第三存储装置20之间的路径故障以及第二存储装置150与第四存储装置250之间的路径故障的发生导致而变为故障暂停的情况。
第一存储装置100,如果检测到来自第三存储装置200的RDJNL指令中断,则要切换日志属性的主控/备用以在第一虚拟存储装置10中的首要侧与辅助侧之间进行切换。但是,因为在第二存储装置150侧也检测到了RDJNL指令的中断,所以判定为不能进行切换,将RC结构的成对状态设为暂停。这里,以下将不实施RC结构中的异步远程复制的状态称为成对状态暂停进行说明。第一存储装置100向第二存储装置150通知暂停,第二存储装置150的成对状态也设为暂停。
在不实施异步远程复制的情况下即、成对状态变为暂停后来自主机计算机30的访问为无RC结构的HA结构的情况下,与上述图4~图7所示的HA结构的读出/写入处理相同。只是,在写入处理时,将在第一存储装置100以及第二存储装置150这两个装置所写入的数据范围的差分位图设为ON。在路径故障恢复后,能够利用该差分位图使第一虚拟存储装置10与第二虚拟存储装置20之间的成对状态同步。
另外,第三存储装置200,因为无法进行根据RDJNL指令所执行的日志获取,所以要切换日志属性的主控/备用以在第二虚拟存储装置20中的首要侧与辅助侧之间进行切换。但是,因为在第四存储装置250侧也无法进行根据RDJNL指令所执行的日志获取,所以将成对状态设为暂停。第三存储装置200也对第四存储装置250通知暂停,而将第四存储装置250的成对状态也设为暂停。
这样,即使在由于路径故障而不实施异步的远程复制就使成对状态变为暂停的情况下,也能够使RC结构的首要侧的HA结构中的双重管理持续进行。另外,在路径故障恢复了的情况下,能够利用差异位图迅速地再次开始通过RC结构所进行的远程复制。
(故障模式13)
图25是示出第二存储装置150的第二日志卷152发生了故障的情况。该情况下,第二存储装置150中的日志制作变得不能进行。但是,向第二物理卷151A以及151B的数据的双重化持续进行,异步远程复制在第二存储装置150与第一存储装置100之间得以持续。因此,第二存储装置150与第四存储装置250之间的成对状态得以维持。只是,第二存储装置150,在日志制作不能进行期间,将被写入第二物理卷151A或151B的数据的差分位图设为ON。
例如,在第二日志卷152发生了故障之后、在第一存储装置100发生故障的情况下,RC结构中的成对状态变为暂停。在上述发生故障时,在第二存储装置150侧差分位图未被设为ON的情况下,在RC结构的成对状态恢复了时,必须复制包括故障发生前的数据在内的所有数据。因此,必须在第二存储装置150侧将用于RC结构的差分位图设为ON。
(故障模式14)
图26示出如图25所示那样在第二存储装置150的第二日志卷152发生了故障后、在第一存储装置100发生了故障的情况。
该情况下,在第一存储装置100和第二存储装置150中都无法制作日志,所以不能进行异步远程复制,RC结构的成对状态就变为暂停。
主机计算机30,因为能够对第二存储装置150进行读出/写入处理,所以对第二存储装置150的第二物理卷151A以及151B实施数据的读出/写入处理。第二存储装置150在实施了写入处理的情况下,将写入的数据的差分位图设为ON。接着,在故障恢复而使异步的远程复制重启了的情况下,使用差分位图使RC结构的成对状态同步。
这样,即使在RC结构的首要侧日志变得无法进行制作的情况下,通过在发生故障时预先将差分位图设为ON,从而在故障恢复了的情况下,无需复制所有数据,只要仅复制差分位图为ON的数据即可,所以能够迅速地再次开始进行通过RC结构所进行的远程复制。
(故障模式15)
图27示出第一存储装置100的第一日志卷102发生了故障的情况。该情况下,第一存储装置100中的日志制作变为不能进行。但是,第一物理卷101A、101B的数据的双重化得以持续、异步远程复制得以持续,所以RC结构中的成对状态得以维持。只是,第一存储装置100,在日志制作不能进行期间,将已写入第一物理卷101A或101B的数据的差分位图设为ON。
例如,在第一日志卷102发生了故障后、第二存储装置150发生故障的情况下,RC结构中的成对状态变为暂停。在上述发生故障时在第一存储装置100侧未将差分位图设为ON的情况下,在RC结构的成对状态恢复了时,必需复制包括故障发生前的数据在内的所有数据。因此,需要在第一存储装置100侧将用于RC结构的差分位图设为ON。
另外,在第一日志卷102发生了故障后,第二存储装置150被切换为日志属性的主控,在第二存储装置150侧获取数据的序号。另外,也可以在第二虚拟存储装置20侧的第三存储装置200以及第四存储装置250侧,也切换日志属性的主控/备用,使得第四存储装置250发行RDJNL指令。
如上所述,在第一存储装置100以及第二存储装置150中,通过HA结构多个卷和日志都受双重管理。因此,即使在上述那样第一存储装置100的第一日志卷102发生了故障的情况下,也能够原样持续从主机计算机30向第一存储装置100的访问,也能够持续进行第二存储装置150与RC结构的辅助侧的存储装置之间的远程复制。另外,在第一日志卷102发生故障期间,替换预先将差分位图设为ON,在第一日志卷102的故障恢复了的情况下,也能够在第一存储装置100与第二存储装置150之间迅速地使日志数据同步。
(故障模式16)
图28示出在如图27所示那样在第一存储装置100的第一日志卷102发生了故障后、在第二存储装置200发生了故障的情况。
该情况下,在第一存储装置100和第二存储装置150中都无法制作日志,所以不能够进行异步远程复制,RC结构的成对状态变为暂停。此外,第一存储装置100,在存在未进行删除处理的日志数据的情况下,也可以使第三存储装置200获取日志,在第三存储装置200中将数据复原并在第四存储装置250将数据双重化后,将日志数据删除、暂停。
另外,第一存储装置100在实施了写入处理的情况下将已写入的数据的差分位图设为ON。接着,在故障恢复而使异步远程复制復活了的情况下,使用差分位图使RC结构的成对状态同比。
即使在这样在RC结构的首要侧日志变得无法制作的情况下,通过在发生故障时预先将差分位图设为ON,从而在故障恢复了的情况下,不需要复制所有数据,只要仅复制差分位图为ON的数据即可,所以能够迅速地再次开始通过RC结构所进行的远程复制。
(1-7)系统的初始形成
(日志记录前)
接下来,针对具有上述的HA结构以及RC结构的计算机系统的初始形成进行说明。图29示出在第一虚拟存储装置10记录日志前的状态。在第一虚拟存储装置10中记录日志前的状态为下述状态:在第一存储装置100与第二存储装置150之间仅形成有HA结构,而未形成第一虚拟存储装置10与第二虚拟存储装置20的RC结构。因此,来自主机计算机30的访问,与无RC结构的HA结构的情况即上述图4~图7所示的HA结构的读出/写入处理相同。
此外,如图29所示,日志记录前,第一存储装置100以及第二存储装置150的成对状态(图中Pair状态)变为无效,日志属性变为无效(Invalid)状态。另外,在第一仲裁盘105的锁定状态(Lock状态)下,第一存储装置100和第二存储装置150这两个装置的物理卷的锁定状态为有效,但两个装置的日志卷的锁定状态为无效。
另外,因为是RC结构的配对未形成的状态,所以第三存储装置200以及第四存储装置250的成对状态、日志属性、日志卷的锁定状态都为无效。
(日志记录)
图30示出第一虚拟存储装置10中的日志组(JNLG)的记录。日志组的记录,分别由第一存储装置100、第二存储装置150、第三存储装置200以及第四存储装置250的各装置实施。各装置对日志组进行记录,从而RC结构的配对形成变为可能。如果在各装置记录日志组,则各装置的日志卷的日志属性变为意味着初始状态的Initial。
在日志属性为初始状态期间,RC结构的配对形成未进行,所以RC的成对状态保持无效(Invalid)状态。此外,来自主机计算机30的存取,与无RC结构的HA结构的情况及即上述图4~图7所示的HA结构的读出/写入处理相同。
(RC结构配对形成)
图31示出日志组被记录后的、RC结构的配对形成处理。在第一存储装置100或第二存储装置150的任一接到最初的RC配对形成指示。在被指定为RC结构的首要卷的卷为HA结构的情况下,RC配对形成指示也传播到形成HA结构的对方侧。而且,在第一存储装置100以及第二存储装置150这两个装置形成RC配对。
在第一虚拟存储装置10侧,将HA结构的首要侧的日志属性设定为主控属性,将HA结构的辅助侧的日志属性设为备用属性。另外,第二虚拟存储装置20侧的日志属性的主控/备用属性设定为,与第一虚拟存储装置10侧的RC结构的日志属性成对。
图31中,第一存储装置100在HA结构的首要侧日志属性变为主控属性,第二存储装置150在HA结构的辅助侧日志属性变为备用属性。另外,与第一存储装置100形成RC结构配对的第三存储装置200的日志属性变为主控属性,与第二存储装置150形成RC结构配对的第四存储装置250的日志属性变为备用属性。
另外,如果如上述那样记录RC结构配对,则仲裁盘105的日志属性的锁定状态也在非锁定(图中表记为NoLock)状态下初始化。接着,将RC的成对状态从无效(Invalid)状态变更为复制(Copy)状态,开始进行从RC结构的首要卷向RC结构的辅助卷的初始复制。
此外,上述RC结构的配对形成处理中的来自主机计算机30的访问,与无RC结构的HA结构的情况即上述图4~图7所示的HA结构的读出/写入处理相同。
(初始复制)
图32示出RC结构的配对形成中的初始复制处理。如图32所示,初始复制处理中,首先,第一存储装置100按序号读出从第一物理卷101A的开头槽(slot)到最终槽的数据(S512),并赋予序号(S511)而在第一日志卷102中制作日志(S513)。
接着,第一存储装置100向第二存储装置150传输序号以及数据槽编号(S514)。第二存储装置200从第二物理卷151A读出与从第一存储装置100传输来的数据槽编号相对应的数据(S515),根据序号在第二日志卷152中制作日志(S516)。接着,第一存储装置100将数据的差分位图设为OFF(S517)。
与来自主机计算机30的写入处理同样地,在初始复制处理中,第一存储装置100也获取序号。在实施上述步骤S511~步骤S517的处理后,第一存储装置100使复制指针进入下一槽,反复进行步骤S511~步骤S517的处理。第一存储装置100从开头槽到最终槽为止,反复实施步骤S511~步骤S517的处理。
用于形成RC结构的复制处理,与上述图9的异步远程复制的处理相同,省略详细的说明。
这里,参照图33针对使用差分位图的初始复制的详情进行说明。具有所有PVOL侧(RC结构的首要侧)的HA首要/HA辅助、SVOL侧(RC结构的辅助侧)的HA首要/HA辅助。即,图32中,第一~第四存储装置的所有装置具有用于形成RC结构的差分位图。在第一~第四存储装置的所有装置为正常状态且实施了上述RC结构的配对形成的情况下,在PVOL侧使用日志属性具有主控属性的第一存储装置100的差分位图,对初始复制进行控制。
(初始复制之1)
如图33所示,复制配对形成后,在初始复制开始时,差分位图全部设定为ON(1),复制指针位于开头槽。
(初始复制之2)
接着,如果日志制作按从HA首要侧到HA辅助的顺序完成,则日志制作的数据范围的差分位图被OFF(0)。而且,如果在HA首要侧以及HA辅助侧这两侧制作初始复制用的日志数据,则复制指针进入下一槽。
(初始复制之3)
如果反复实施图32的步骤S511~步骤S517的处理,初始复制完成,则所有差分位图被OFF,复制指针进入数据的最终位置。
(初始复制中的读出/写入处理)
另外,在初始复制期间有来自主机计算机30的数据读入请求的情况下,与上述图6或图7的HA结构中的读出处理同样地数据被读出。
另外,在初始复制期间有来自主机计算机30的数据的写入处理的情况下,工作因是向复制完毕的区域即位图为OFF的区域的写入处理还是向复制未处理的区域即位图为ON的区域的写入处理而不同。
在复制完毕的区域有写入处理的情况下,数据与上述图11的HA结构与RC结构协作时的写入处理同样地被写入。即,在HA结构的首要侧获取序号,按从HA首要侧向HA辅助侧的顺序数据被双重化,在HA首要以及HA辅助这两侧制作日志。此外,向该范围的写入处理以及初始复制被排他。
另一方面,在复制未处理的区域有写入处理的情况下,数据与图4或图5中所示的不与RC结构协作的情况下的写入处理同样地被写入。即,不实施日志的制作,就按从HA首要侧向HA辅助侧的顺序使数据双重化。该情况下,差分位图保持ON。
(初始复制时的故障)
图34示出初始复制时HA辅助即第二存储装置150的第二物理卷151A发生了故障的情况。该情况下,实施与图32所示的初始复制处理相同的复制处理。如图34所示,如果第二物理卷151A发生故障且HA辅助侧变为闭塞状态,则无法使用HA辅助侧的数据来制作日志数据,但是通过从HA首要侧传输日志数据,从而能够与图32所示的初始复制处理同样地在HA辅助侧制作日志数据。
图35示出在初始复制时HA首要侧即第一存储装置100的第一物理卷101A发生了故障的情况。该情况下,利用HA辅助侧的差分位图来控制初始复制。
如图35所示,在第一物理卷101A发生故障且HA首要侧为闭塞状态的情况下,读出第二存储装置150的数据(S531),该数据被传输到第一存储装置100(S532)。接着,第一存储装置100获取序号(S533),制作日志(S534),并将序号发送到第二存储装置150。第二存储装置150根据发送来的序号制作日志(S535),将差分位图设为OFF(S536)。步骤S531~步骤S536的处理按数据的槽反复。
图36示出在再初始复制时HA首要侧即第一存储装置100的第一物理卷101A发生了故障时、使用HA首要侧的差分位图来控制初始复制的情况。
如图36所示,首先,第一存储装置100获取序号(S541),序号和槽编号被传输到第二存储装置150(S542)。因为第一物理卷101A发生故障、HA首要侧为闭塞状态,所以第二存储装置150读出与槽编号相对应的数据(S543),制作日志(S544)。
接着,第二存储装置150将读出的数据传输到第一存储装置100(S545)。第一存储装置100使用在步骤S541中获取的序号和在步骤S545中传输来的数据来制作日志(S546),将差分位图设为OFF(S547)。步骤S541~步骤S547的处理按数据的槽量重复。
(1-8)暂停操作时的工作
(暂停操作1)
首先,针对在HA首要侧对暂停操作进行控制的情况进行说明。如图37所示,如果HA首要侧即第一存储装置100接到暂停操作(S601),则将日志属性设为暂停(S602)。接着,第一存储装置100向第二存储装置150传播暂停操作(S603),第二存储装置150将日志属性设为暂停(S604)。
另外,在HA辅助侧即第二存储装置150接到了暂停操作的情况下,向第一存储装置100传播暂停操作,而实施上述步骤S602~步骤S604的处理。在第一存储装置100以及第二存储装置150这两方的日志属性设定为暂停状态后,返回暂停操作的完成响应。
(暂停操作2)
如图37所示,在第一存储装置100以及第二存储装置150使日志属性迁移到暂停状态后,使属于该日志组的RC结构的配对暂停。
暂停的状态按每个日志组受到形成日志组的物理卷的位图管理。在使HA结构以及RC结构协作的情况下,在RC结构的首要侧的HA首要以及HA辅助、以及、辅助侧的HA首要以及HA辅助分别对物理卷的配对形成状态进行位图管理。
如图38所示,对配对形成状态进行管理的位图,在初始状态即配对形成前为OFF。而且,如果属于日志组的物理卷的配对形成,则位图被ON。在要将RC结构的配对暂停时,从位图中检索属于已变为暂停状态的日志组的成对物理卷,使成为对象的配对暂停。
如图38所示,例如设为具有CU#0~CU#255且针对各个CU#具有DEV#0~DEV#255的存储装置。在实施暂停处理的情况下,从位图中检索属于日志组的物理卷,通过确定CU#、DEV#从而使成为暂停操作的对象的配对暂停。
如图39所示,在RC结构的首要侧的HA首要正常的情况下,通过HA首要来控制暂停处理。基于RC结构的首要侧的HA首要中的配对形成的位图,第一存储装置100使属于日志组的所有配对迁移到暂停状态(S611)。第一存储装置100,在使所有配对迁移到暂停状态后,在HA首要侧获取序号(S612)、(对谁?)赋予该序号而制作暂停标记(S613)。
另外,第一存储装置100(对谁?)赋予获取的序号,向RC结构的首要侧的HA辅助侧也发送暂停指示(S614)。接到了暂停指示的第二存储装置150,在基于配对形成位图使所有配对迁移到暂停状态之后(S615),按从HA首要侧传输来的序号制作暂停标记(S616)。
此外,在暂停标记制作前制作出的日志数据,全部在RC结构的辅助侧进行复原。为此,在接到暂停操作后,设为暂停过渡期间的状态,直至日志数据在RC结构的辅助侧得到复原为止。而且,在日志数据全部复原后,迁移到暂停状态。
(暂停操作3)
图40示出将RC结构的辅助侧迁移到暂停状态的情况。如图40所示,RC结构的辅助侧的HA首要侧的第三存储装置200,对RC结构的首要侧的HA首要侧的第一存储装置100发行RDJNL指令,如果检测到在第一存储装置100制作出的暂停标记(S621),则将暂停标记储存于第三日志卷202(S622),将暂停标记复原(S623)。第三存储装置200将步骤S623中的暂停标记复原,在暂停过渡期间使日志属性迁移并将所有配对设为暂停状态之后,确定日志组状态为暂停。
接着,第三存储装置200对第四存储装置250发送序号和暂停指示(S625),使第四存储装置250也迁移到暂停状态。此外,暂停标记按照序号在形成RC结构的第二虚拟存储装置20侧受到处理,所以在制作暂停标记前制作完毕的日志数据全部在第二虚拟存储装置20侧的物理卷得到复原,之后,迁移到暂停状态。
(暂停操作4)
如上所述,如果第二虚拟存储装置20侧的第三存储装置200使属于日志组的所有物理卷迁移到暂停状态,则如图41所示,通知第一存储装置100暂停完成了这一情况(S631)。第一存储装置100如果被通知暂停完成,则向第二存储装置150发送暂停确定指示(S632)。
第二存储装置150使所有配对状态迁移到暂停(S633)。具体而言,第二存储装置150根据配对形成位图确定属于日志组的配对从暂停过渡状态迁移到暂停状态。
在第一存储装置100侧,也使所有配对状态迁移到暂停(S634)。具体而言,根据配对形成位图确定属于日志组的配对从暂停过渡状态迁移到暂停状态。
如上所述,配对状态从暂停过渡状态迁移到暂停确定状态,从而能够视为:在RC结构的辅助侧,保证了在实施暂停操作前写入处理的数据全部复制于RC结构的辅助侧的物理卷的状态。
(暂停期间的I/O操作)
图42示出暂停期间来自主机计算机30的I/O操作。在暂停期间有来自主机计算机30的数据的读入请求的情况下,数据与上述图6或图7的HA结构中的读出处理同样地被读出。另外,在暂停期间有来自主机计算机30的数据的写入请求的情况下,数据与上述图4或5的图HA结构中的写入处理同样地被读出。即,在第一虚拟存储装置10中的写入处理时不制作日志。
只是,将差分位图设为ON,而记录RC结构的首要侧与辅助侧的差异位置。因此,在HA首要侧的第一存储装置100和HA辅助侧的第二存储装置150中在数据写入时都不制作日志,将差分位图设为ON。这样将差分位图设为ON的原因是与图24所示的故障模式12的故障暂停时相同的原因。
(配对削除操作)
配对削除操作时的RC结构以及HA结构中的工作,与上述暂停操作相同。只是,不同于暂停操作时,针对日志组的状态,暂停过渡状态变为单纯过渡状态,暂停确定状态变为单纯确定状态,暂停标记变更为削除标记。另外,暂停操作中,在暂停过渡状态下差分位图为ON,但是在配对削除时的单纯过渡状态下差分位图不设为ON这一点不同于暂停操作的工作。另外,在配对削除操作中,从位图中检索属于削除了的日志组的成对物理卷,将成为对象的成对的位图从ON变更为OFF。
(配对再次开始操作)
如果对上述暂停状态的配对实施配对再次开始操作,则配对再次开始,差分位图所记录的差分数据从RC结构的首要侧复制到辅助侧。从RC结构中的首要侧向辅助侧的复制处理,变为与上述初始复制中的复制处理相同的工作。
上述初始复制时,将差分位图全部设定为ON,针对所有数据制作日志数据,而向RC结构的辅助侧复制了数据。另一方面,在配对再次开始时,参照差分位图仅针对差分为ON的数据制作日志数据,从RC结构的首要侧的物理卷向辅助侧的物理卷复制数据。另外,与初始复制时同样地,在RC结构的首要侧的HA首要侧与HA辅助侧这两侧制作日志数据。
此外,在实施SWAP(交换)指定的配对再次开始的情况下,与上述同样地从RC结构的辅助侧向首要侧进行差分复制。另外,有时也在暂停状态下对RC结构的首要侧和辅助侧这两侧写入数据。例如,在暂停状态下连接于RC结构的首要侧的主机计算机30发生故障、主机计算机30向RC结构的辅助侧进行了失效备援的情况下,数据也被写入RC结构的辅助侧。在该情况下,在配对再次开始时,在对RC结构的首要侧与辅助侧的差分位图进行合并后,使差分复制工作。
差分位图的删除处理,首先对RC结构的首要侧的HA首要侧、RC结构的辅助侧的HA首要侧的差分位图进行合并。而且,使差分数据反映于RC结构的首要侧的HA首要侧与HA辅助侧这两侧。在对RC结构的首要侧的差分位图进行合并后,对RC结构的辅助侧的HA首要侧和HA辅助侧的差分位图进行清除。在SWAP指定的配对再次开始操作的情况下,将合并后的差分位图反映于RC结构的元辅助侧,将RC结构的元首要侧的差分位图清除,而从RC结构的元辅助侧向元首要侧使差分复制工作。
如果在RC结构的首要侧接到配对再次开始操作,则RC结构的首要侧使日志组的状态从暂停状态迁移到正常状态。接着,与RC结构的辅助侧进行通信,使所有日志组状态从暂停状态迁移到正常状态。之后,参照RC结构的首要侧的HA首要侧的配对形成位图,使属于日志组的所有RC结构的配对从暂停状态迁移到复制状态,配对再次开始状态。此外,关于从暂停状态向复制状态的迁移,是与通过初始复制使之向复制状态迁移同样的工作。而且,使所有日志组的配对状态从暂停状态迁移到复制状态。
此外,通过配对再次开始操作、从RC结构的首要侧向辅助侧的数据复制期间的来自主机计算机30的I/O操作,与初始形成时的初始复制期间的I/O操作相同。以下,参照图43~图46对配对再次开始工作的详情进行说明。
(配对再次开始之1)
如图43所示,如果第一存储装置100接到配对再次开始操作(S701),则第一存储装置100向第三存储装置200传输配对再次开始指示(S702)。接着,第三存储装置200向第四存储装置250传播配对再次开始指示(S703)。接着,第四存储装置250以及第三存储装置200的日志组状态从暂停迁移到正常(S704、S705)。
另外,第一存储装置100向第二存储装置传播配对再次开始指示(S706)。接着,第二存储装置150以及第一存储装置100的日志组状态从暂停迁移到正常(S707、S708)。
(配对再次开始之2)
图44中,从第一存储装置100向第二存储装置150、第三存储装置200以及第四存储装置200传输或传播配对再次开始指示,在各装置中,属于日志组的所有配对状态从暂停状态迁移到复制状态。
具体而言,进行第一物理卷101A的配对再次开始指示(S711、S712、S715),各装置中第一卷101A和日志组相同的物理卷的配对状态再次开始(S713、S714、S716、S717),接着,进行第一物理卷101B的配对再次开始指示(S718、S719、S722),各装置中第一卷101A和日志组相同的物理卷的配对状态再次开始(S720、S721、S723、S724)。
(配对再次开始之3)
图45示出RC结构的首要侧和辅助侧的差分位图合并处理。首先,从第一存储装置100向第三存储装置200发送第一物理卷101A的差分位图获取指示(S731)。第三存储装置200获取第一物理卷101A的配对即第三物理卷201A的差分位图(S732),将获取到的差分位图传输到第一存储装置10(S733)。
第一存储装置100获取第一物理卷101A的差分位图(S734)。另外,第一存储装置100将在步骤S733中传输来的第三物理卷201A的差分位图传播到第二存储装置150(S735)。第一存储装置100以及第二存储装置150对与第一物理卷101A和第三物理卷201A相对应的差分位图进行合并(S736、S737)。
第一存储装置100指示第三存储装置200清除第三物理卷201A的差分位图(S738)。第三存储装置200向第四存储装置传播第三物理卷201A的差分位图的清除指示(S739)。第三存储装置200以及第四存储装置250将与第三物理卷201A相对应的差分位图清除(S740、S741)。
图46示出差分合并开始前和差分合并实施后的差分位图的状态。如图46所示,差分合并开始前,在RC结构的首要侧(PVOL侧)的差分位图和RC结构的辅助侧(SVOL)侧的差分位图中,针对任一差分位图为ON的槽,PVOL侧的差分位图变为ON。例如,在PVOL侧的差分位图为1且SVOL侧的差分位图为0的情况下,差分合并实施后的PVOL侧的差分位图变为1。这样,在PVOL侧对差分位图进行合并后,SVOL侧的差分位图全部被设为OFF。
这样,在PVOL侧和SVOL侧对差分位图进行合并后,仅在PVOL侧差分位图为ON的槽,数据被复制到SVOL侧。
(1-9)存储系统的工作
(1-9-1)通常时的存储系统的工作的详细情况
接下来,针对存储系统的工作的详细情况进行说明。首先,参照图47针对读出/写入(Read/Write)处理进行说明。主机计算机30对虚拟存储装置的虚拟卷(GDEV)发行读出/写入请求。主机计算机30识别出在虚拟存储装置上存在多个虚拟端口。如果主机计算机30向任一虚拟端口发行读出/写入请求,就是向与各虚拟端口相对应的物理存储装置的端口发送读出/写入请求。也就是,第一存储装置的端口与某一虚拟端口相对应,第二存储装置的端口与另一虚拟端口相对应。图47中,示出向与第一存储装置的端口相对应的虚拟存储装置的端口发行读出/写入请求的情况。如图47所示,第一存储装置100如果从主机计算机30接到读出/写入请求(S1001),则将被指定给主机计算机30的LUN(LogicalUnitNumber)转换成识别第一存储装置100内的虚拟卷(GDEV)的GDEVID(S1002)。
接着,第一存储装置100根据GDEVID来确定物理卷的ID,判定与GDEV相对应的物理卷是否是HA结构(S1003)。在步骤S1003中判定为不是HA结构的情况下,第一存储装置100执行通常的读出/写入处理(S1004)。另一方面,在步骤S1003中判定为是HA结构的情况下,判定该物理卷是否是RC结构(S1005)。这里,物理卷是HA结构还是RC结构,在存储于存储器等的控制信息所含的各物理卷的结构信息(未图示)中予以管理。
在步骤S1005中判定为物理卷不是RC结构的情况下,执行HA结构中的读出/写入处理(S1006)。另一方面,在步骤S1005中判定为物理卷是RC结构的情况下,执行为HA结构且为RC结构中的读出/写入处理(S1007)。
以下,针对为HA结构且为RC结构的情况下的写入处理进行说明。如图48所述,判定第一存储装置100的日志属性是否为主控(S1010)。
在步骤S1010中判定为第一存储装置100的日志属性为主控的情况下,执行从主机计算机30接到的写入指令(S1011)。另一方面,在步骤1011中判定为第一存储装置100的日志属性不是主控的情况下,即判定为第一存储装置100的日志属性为备用的情况下,传输写入指令S1012)。
如上所述,本实施方式中,预先确定在形成HA结构的2个存储装置之间、哪个装置先进行写入处理。本实施方式中,设为HA结构的首要侧即日志属性为主控的装置先执行写入处理。因此,在日志属性为备用的情况下,向实施写入处理的主控侧传输数据。
(主控侧的写入处理)
接下来,参照图49A以及49B针对日志属性为主控的第一存储装置100的写入处理进行说明。
如图49A所示,首先,第一存储装置100获取HA结构的配对状态(S1021),判定HA结构的配对状态是否为闭塞(Block)状态(S1022)。在HA结构的首要侧与辅助侧之间产生了数据差分的情况下,即同步失败的情况下,需要对向旧数据的存取进行引导。本实施方式中,使用上述仲裁盘105的锁定信息(Lock信息)对差分发生时向旧数据的存取进行引导。
在步骤S1022中判定为HA结构的配对状态为闭塞(Block)状态的情况下,第一存储装置100判定是否是来自主机计算机30的I/O(S1023)。在步骤S1023中判定为是来自主机计算机30的响应的情况下,第一存储装置100针对RSP(Response)返回检查响应(S1024)。另一方面,在步骤S1023中判定为不是来自主机计算机30的响应的情况下,存储装置100执行步骤S1037以后的处理。
另外,在步骤S1022中判定为HA结构的配对状态不是闭塞(Block)状态的情况下,第一存储装置100获取GDEV状态,(S1025),判定向访问对象的物理卷的访问是否闭塞(Block:由于硬件故障等而出现不可写入的状态)(S1026)。
在步骤S1026中判定为向访问对象的物理卷的访问闭塞(Block)了的情况下,第一存储装置100将HA结构的配对状态设定为闭塞(Block)(S1027)。接着,第一存储装置100判定是否是来自主机计算机30的I/O(S1028),如果是来自主机计算机30的I/O则向RSP返回检查响应(S1029),结束处理。
另一方面,在步骤S1028中判定为不是来自主机计算机30的I/O的情况下,第一存储装置100向RSP返回检查响应,并且响应HA首要侧为闭塞状态这一情况(S1030),执行步骤S1037以后的处理。通过步骤S1030的响应,将HA首要侧的第一存储装置100处于闭塞(Block)状态这一情况通知给HA辅助侧的第二存储装置150,使第二存储装置150获取仲裁盘105的锁定。
在步骤S1026中判定为向访问对象的物理卷的访问未闭塞的情况下,第一存储装置100对写入对象的第一物理卷101实施写入处理(S1031)。接着,获取HA结构的配对状态(S1032),判定在HA首要侧是否获取了锁定(Lock)(S1033)。
在步骤S1033中判定为在HA首要侧进行了锁定(Lock)获取的情况下,第一存储装置100将HA结构中的差分位图设为ON(S1034)。接着,第一存储装置100判定是否是来自主机计算机30的I/O(S1035),如果是来自主机计算机30的I/O,则执行步骤S1037以后的处理,如果不是来自主机计算机30的I/O则向RSP返回检查响应和锁定响应(S1036)。
在步骤S1033中判定为在HA首要侧获取了锁定(Lock)的情况下、即在HA辅助侧发生了故障的情况下,将HA结构中差分位图设为ON而在HA辅助侧的恢复后对差分数据进行复制。由此,能够在故障恢复时将HA结构恢复。另外,在写入处理是来自HA辅助侧的双重化写入的情况下,为了使HA辅助侧的HA状态迁移到闭塞(Block)状态,而向RSP作出检查响应,对检查响应附加上HA首要侧的锁定(Lock)状态再通知HA辅助侧。由此,能够使HA辅助侧的HA状态迁移到闭塞(Block)状态。
接下来,第一存储装置100获取RC结构的配对状态(S1037),判定第一存储装置100和第三存储装置200的配对状态是否为配对(Pair)(S1038)。
在步骤S1038中判定为不是配对(Pair)的情况下,第一存储装置100判定配对状态是否是复制(Copy)S1039)。在步骤S1039中判定为配对状态为复制(Copy)的情况下,第一存储装置100获取RC结构中的差分位图(S1040)。接着,第一存储装置100判定与在步骤S1040中获取的差分位图相对应的数据是否复制完毕(S1041),在复制完毕的情况下执行步骤S1045以后的处理,在不是复制完毕的情况下执行步骤S1048以后的处理。
另一方面,在步骤S1039中判定为配对状态不是复制的情况下,第一存储装置100判定配对状态是否为暂停(Suspend)(S1042)。在步骤S1042中判定为配对状态是暂停的情况下,第一存储装置100将RC结构中的差分位图设为ON(S1043)。另一方面,在步骤S1042中判定为配对状态不是暂停的情况下,第一存储装置100向RSP返回检查响应(S1044)。
在步骤S1038判定为复制状态为配对的情况下,第一存储装置100获取访问对象的第一物理卷101的日志组编号(S1045),获取并更新序号(S1046),制作日志(S1047)。
接着,第一存储装置100判定是否是来自主机计算机30的I/O(S1048),在不是来自主机计算机30的I/O的情况下,对RSP设定序号(S1055)。
另一方面,在步骤S1048中判定为是来自主机计算机30的I/O的情况下,第一存储装置100对指令(CMD)赋予序号(S1049)。接着,第一存储装置100获取HA结构的配对状态(S1050),判定配对状态是否为锁定(Lock)(S1051)。
在步骤S1051中判定为HA结构的配对状态为锁定(Lock)的情况下,第一存储装置100对指令指定闭塞(Block)(S1052)。在步骤S1052中,第一存储装置100向HA辅助侧的第二存储装置150传输该指令,使第二存储装置150的HA状态迁移到闭塞(Block)。
接下来,第一存储装置100执行双重写入传输(S1053),返回完成响应(S1054),结束处理。步骤S1053中的双重写入传输处理,下面详细说明。
(双重写入处理)
接下来,参照图50针对步骤S1053中的双重写入处理的详情进行说明。如图50所示,第一存储装置100为了数据的双重化处理而向第二存储装置150发送写入数据(S1061)。接着,第一存储装置100对发送结果进行确认(S1062)。
接着,第一存储装置100判定发送结果是否良好(Good)(S1063),在判定为良好(Good)的情况下,对响应指令设定良好(S1064),完成响应(S1076)而结束处理。
另一方面,在步骤S1063中判定为发送结果不良的情况下,第一存储装置100判定发送结果是否为检查响应且在HA辅助侧是否进行了锁定获取(S1065)。在步骤S1065中判定为在HA辅助侧的第二存储装置150进行了锁定获取的情况下,HA辅助侧的数据是最新的,HA首要侧的数据变为旧数据,所以将HA状态设为闭塞,对向HA首要侧的旧数据的存取进行引导。
在步骤S1065中判定为发送结果是检查响应、在HA辅助侧进行了锁定获取的情况下,第一存储装置100将HA状态设定为闭塞(S1066),对响应指令设定检查(S1076),完成响应(S1076)而结束处理。
另外,在步骤S1065中判定为发送结果为检查响应而在HA辅助侧未进行锁定获取的情况下,第一存储装置100获取仲裁锁定(QuorumLock)(S1068)。在HA辅助侧的发送结果不良、未对检查响应赋予锁定获取的情况下,在HA辅助侧变为不能双重写入的状态,所以需要在HA首要侧获取锁定以对HA首要侧与HA辅助侧之间的差分数据进行差分管理。
第一存储装置100在步骤S1068中获取仲裁锁定(QuorumLock)后,对锁定获取结果进行确认(S1069),判定锁定获取结果是否良好(S1070)。
在步骤S1070中判定为锁定获取结果良好(Good)的情况下,第一存储装置100对HA状态设定Lock(S1071),将HA结构的差分位图设为ON(S1072),对响应指令设定良好(S1073),完成响应(S1076)。
另一方面,在步骤S1070中判定为锁定获取结果不为良好(Good)的情况下,第一存储装置100对HA状态设定闭塞(S1074),对响应指令设定检查(S1074),完成响应(S1075)而结束处理。
(备用侧的写入处理)
接下来,参照图51A以及51B针对日志属性为备用的第二存储装置150的写入处理进行说明。首先,第二存储装置150判定是否是来自主机计算机30的I/O(S1081)。在步骤S1081判定为是来自主机计算机30的I/O的情况下,第二存储装置150获取HA结构的配对状态(S1082),判定配对状态是否为正常(S1083)。另一方面,在步骤S1083判定为不是来自主机计算机30的I/O的情况下,第二存储装置150执行步骤S1105以后的处理。
在HA辅助侧的第二存储装置150中进行了锁定获取的情况下,需要对指令指定闭塞,并使HA首要侧的HA状态迁移到闭塞。另外,第二存储装置150未进行锁定获取,在HA首要侧的数据变为最新而HA辅助侧变为旧数据的情况下,需要对向HA辅助侧的旧数据的存取进行引导。
在步骤S1083中判定为HA结构的配对状态为正常的情况下,第二存储装置150执行步骤S1087的处理。另一方面,在步骤S1083中判定为HA结构的配对状态不正常的情况下,第二存储装置150判定自身是否进行了锁定获取(S1084)。
在步骤S1084中判断为自身进行了锁定获取的情况下,第二存储装置150为了使HA首要侧的HA状态迁移到闭塞,而对指令指定闭塞(S1085)。另一方面,在步骤S1084中判定为自身未进行锁定获取的情况下,作出检查响应(S1086)而结束处理。
接着,第二存储装置150向第一存储装置100传输写入指令(S1087)。本实施方式中,如上所述,设为HA首要侧先进行写入处理。因此,即使在从主机计算机30接到了对HA辅助侧的写入请求的情况下,也在HA辅助侧写入数据之前,向HA首要侧传输数据而向HA首要侧写入数据。
接着,第二存储装置150对传输结果进行确认(S1088),判定传输结果是否良好(Good)(S1089)。在步骤S1089中判定为传输结果良好(Good)的情况下,第二存储装置150从RSP中获取序号(S1090)。如上所述,在HA首要侧的第一存储装置100执行写入处理,获取序号,所以HA辅助侧经由RSP收到在HA首要侧所获取的序号。
在步骤S1089中判定为传输结果不良的情况下,第二存储装置150判定传输结果是否是检查响应、在HA首要侧是否进行了锁定获取(S1091)。在步骤S1091中判定为传输结果为检查响应且在HA首要侧进行了锁定获取的情况下,第二存储装置150将HA辅助侧的HA状态设定为闭塞(S1092),返回检查响应(S1093),结束处理。
在步骤S1091中判定为传输结果为检查响应且在HA首要侧未进行锁定获取的情况下,获取HA结构的配对状态(S1094),判定在HA辅助侧进行进行了锁定获取(S1095)。在传输到HA首要侧的指令为检查响应的情况下,向HA首要侧的写入处理失败,所以在HA辅助侧获取锁定以持续进行I/O处理。
在步骤S1095中判定为在HA辅助侧进行了锁定获取的情况下,第二存储装置150执行步骤S1102以后的处理。另一方面,在步骤S1095中判定为在HA辅助侧未进行锁定获取的情况下,第二存储装置150获取仲裁锁定(QuorumLock)(S1096)以对锁定获取结果进行确认(S1097)。
第二存储装置150判定锁定获取结果是否良好(Good)(S1098),在判定为良好(Good)的情况下,对HA辅助侧的HA状态设定锁定(S1099),执行步骤S1102以后的处理。另一方面,在步骤S1098中判定为锁定获取结果不良的情况下,对HA辅助侧的HA状态设定闭塞(S1100),返回检查响应(S1101),结束处理。
接着,第二存储装置150在步骤S1102中获取RC结构的配对状态(S1102),判定RC结构的配对状态是否暂停(Suspend)(S1103)。此时,第二存储装置150因为未从HA首要侧的第一存储装置100获取序号,所以为了将RC结构设为配对状态而持续进行I/O处理,就需要将第二存储装置150的日志属性切换为主控。
在步骤S1103中判定为RC结构的配对状态为暂停的情况下,第二存储装置150执行步骤S1105以后的处理。另一方面,在步骤S1103中判定为RC结构的配对状态不是暂停的情况下,第二存储装置150将日志属性切换为主控(S1104)。
接下来,在步骤S1105中,第二存储装置150获取HA结构的配对状态,判定HA结构的配对状态是否是闭塞(Block)(S1106)。在步骤S1106中判定为HA结构的配对状态为闭塞(Block)的情况下,第二存储装置150执行步骤S1119以后的处理。
另一方面,在步骤S1106中判定为HA结构的配对状态不闭塞的情况下,第二存储装置150获取GDEV状态(S1107),判定向访问对象的物理卷的访问是否被闭塞(由于硬件故障等而不能写入的状态)(S1108)。
在步骤S1108中判定为向访问对象的物理卷的访问被闭塞了的情况下,第二存储装置150将HA结构的配对状态设定为闭塞(Block)(S1109)。接着,第二存储装置150判定是否是来自主机计算机30的I/O(S1110),如果是来自主机计算机30的I/O则向RSP返回检查响应(S1112)并结束处理。
另一方面,在步骤S1110中判定为不是来自主机计算机30的I/O的情况下,存储装置100向RSP进行检查响应并且向其响应HA辅助侧为闭塞(Block)状态这一情况(S1111),执行步骤S1119以后的处理。通过步骤S1111的响应,将HA辅助侧的第二存储装置150处于闭塞状态这一情况通知给HA首要侧的第一存储装置100,使第一存储装置100获取仲裁盘105的锁定。
另外,在步骤S1108中判定为相对于访问对象的物理卷的访问未被闭塞(Block)的情况下,第二存储装置150对写入对象的第二物理卷151实施写入处理(S1113)。接着,获取HA结构的配对状态(S1114),判定在HA辅助侧是否获取了锁定(S1115)。
在步骤S1115中判定为在HA辅助侧进行了锁定获取的情况下,第二存储装置100将HA结构中的差分位图设为ON(S1116)。接着,第二存储装置150判定是否是来自主机计算机30的I/O(S1117),如果是来自主机计算机30的I/O则执行步骤S1119以后的处理,如果不是来自计算机30的I/O则向RSP返回检查响应和锁定响应(S1118)。
在步骤S1115中判定为在HA辅助侧获取了锁定的情况下、即在HA首要侧发生了故障的情况下,将HA结构中的差分位图设为ON,在HA首要侧的恢复后对差分数据进行复制。由此,能够在HA首要侧的故障恢复后恢复HA结构。另外,在写入处理为来自HA首要侧的双重化写入的情况下,为了使HA首要侧的HA状态迁移到Block状态,而对RSP作出检查响应,并作为不能进行检查响应的信息将HA辅助侧的锁定状态通知给HA首要侧。由此,能够使HA首要侧的HA状态迁移到Block状态。
接下来,第二存储装置100获取RC结构的配对状态(S1119),判定第二存储装置150与第四存储装置250的配对状态是否为配对(PAir)(S1120)。
在步骤S1120中判定为不配对的情况下,第二存储装置150判定配对状态是否为复制(Copy)(S1121)。在步骤(S1121)中判定为配对状态为复制的情况下,第二存储装置150获取RC结构中的差分位图(S1122)。接着,第二存储装置150判定与在步骤S1122中获取到的差分位图相对应的数据是否复制完毕(S1123),在复制完毕的情况下执行步骤S1127以后的处理,在复制未完毕的情况下执行步骤S1133以后的处理。
另一方面,在步骤S1121中判定为配对状态不是复制的情况下,第二存储装置150判定配对状态是否为暂停(Suspend)(S1124)。在步骤S1124中判定为配对状态为暂停的情况下,第二存储装置150将RC结构中的差分位图设为ON(S1125)。另一方面,在步骤S1124中判定为配对状态不是暂停的情况下,第二存储装置150对RSP返回检查响应(S1126)并结束处理。
在步骤S1120中判定为复制状态为配对的情况下,第二存储装置150获取访问对象的第二物理卷151的日志组编号(S1127)。接着,第二存储装置150判定日志属性是否发生了切换(S1128)。
在步骤S1128中判定为日志属性发生了切换的情况下,第二存储装置150获取第二日志卷152中所存储的序号而制作日志数据(S1130)。另一方面,在步骤S1128中判定为日志属性未发生切换的情况下,第二存储装置150从RSP获取序号(S1129)。
接着,第二存储装置150更新序号(S1131),制作日志(S1132),返回完成响应(S1133)并结束处理。
(主控侧的复原处理)
接下来,参照图52针对SVOL侧(RC结构的辅助侧)的日志属性为主控的第三存储装置200的复原处理进行说明。
如图52所示,首先,第三存储装置200获取HA结构的配对状态(S1141),判定HA结构的配对状态是否正常(S1142)。在步骤S1142中判定为HA结构的配对状态正常的情况下,执行步骤S1146以后的处理。
另一方面,在步骤S1142中判定为HA结构的配对状态不正常的情况下,第三存储装置200判定自身是否进行了锁定获取(S1143)。
在步骤S1143中判定为自身进行了锁定获取的情况下,第三存储装置100,为了使HA辅助侧的HA状态迁移到Block而对指令指定闭塞(S1144)。另一方面,在步骤S1143中判定为自身未进行锁定获取的情况下,第三存储装置300为了使HA辅助侧获取锁定获取,而对指令指定锁定(S1145)。
接着,在步骤S1146中,第三存储装置300获取GDEV状态(S1146),以判定GDEV状态是否正常(S1147)。
在步骤S1147中判定为GDEV状态正常的情况下,第三存储装置200实施复原处理(S1148),更新复原完毕的序号(S1149)。
另一方面,在步骤S1147中判定为GDEV状态不正常的情况下,第三存储装置200对HA状态指定闭塞(S1150),为了使HA辅助侧的第四存储装置250进行锁定获取,而对指令指定锁定(S1151)。
接下来,第三存储装置200对指令设定序号,为了实施双重写入处理而对RC结构的辅助侧的第四存储装置250传输数据(S1153),结束处理。针对步骤S1153中的SVOL双重写入传输处理,后文详细进行说明。
即使在步骤S1153中HA状态为闭塞且GDEV状态为闭塞的情况下、即第三存储装置200闭塞的情况下,为了向HA辅助侧写入数据,也发送用于双重化的写入数据。另外,即使在HA首要侧进行了锁定获取、在HA辅助侧不能进行写入的状态下、即备用侧的HA辅助侧的卷闭塞了的情况下,也向HA辅助侧传输序号。例如,在之后、从RC结构的辅助侧的SVOL的HA首要侧向PVOL的RDJNL路径闭塞了的情况下,HA辅助侧也能够使用传输来的序号从RC结构的首要侧(PVOL侧)读入日志而再次开始进行复原处理。
(SVOL侧的双重写入传输处理)
接下来,参照图53针对在上述步骤S1153中执行的、由SVOL侧(RC结构的辅助侧)的HA首要侧的第三存储装置200所进行的双重写入传输处理进行说明。
如图53所示,第三存储装置200向第四存储装置250发送用于双重化的写入数据(S1161)。接着,第三存储装置200对发送结果进行确认(S1162)。
接着,第三存储装置200判定发送结果是否良好(Good)(S1163),在良好(Good)的情况下作出完成响应(S1176)。另一方面,在步骤S1163中发送结果不良的情况下,第三存储装置200判定发送结果是否是检查响应、在HA辅助侧是否进行了锁定获取(S1164)。在步骤S11164中判定为在HA辅助侧的第四存储装置250进行了锁定获取的情况下,HA辅助侧的数据是最新的而HA首要侧的数据变为旧数据,所以将HA状态设为闭塞状态而对向HA首要侧的旧数据的存取进行引导。
在步骤S1164中判定为发送结果为检查响应、在HA辅助侧进行了锁定获取的情况下,第三存储装置200将HA状态设定为闭塞(S1165),作出完成响应(S1176)并结束处理。
另外,在步骤S1164中判定为发送结果为检查响应、在HA辅助侧未进行锁定获取的情况下,第三存储装置200获取HA结构的配对状态(S1166)。接着,判定第三存储装置200自身是否进行了锁定获取(S1167)。
在步骤S1167中判定为第三存储装置200自身进行了锁定获取的情况下,将HA结构的差分位图设为ON(S1175),作出完成响应(S1176)并结束处理。
另一方面,在步骤S1167中判定为第三存储装置200自身未进行锁定获取的情况下,第三存储装置200判定HA配对状态是否为闭塞(S1168)。
在步骤S1168中判定为HA结构的配对状态为闭塞的情况下,第三存储装置200设为在RC结构的辅助侧的HA首要和HA辅助都无法进行写入的状态,使RC配对故障暂停(Suspend)(S1173),作出完成响应(S1176)并结束处理。
另一方面,在步骤S1168中判定为HA结构的配对状态不闭塞的情况下,第三存储装置200获取第二仲裁盘205的仲裁锁定(QuorumLock)(S1169)。接着,第三存储装置200对锁定获取结果进行确认(S1170),判定锁定获取结果是否良好(Good)(S1171)。
在步骤S1171中锁定获取结果良好(Good)的情况下,第三存储装置200对HA状态设定锁定(S1172),将HA结构的差分位图设为ON(S1175),作出完成响应(S1176)。另一方面,在步骤S1171中锁定获取结果不良的情况下,第三存储装置200对HA状态设定闭塞(S1174),将HA结构的差分位图设为ON(S1175),作出完成响应(S1176)并结束处理。
(SVOL侧的双重写入接到处理)
接下来,参照图54针对SVOL侧(RC结构的辅助侧)的HA辅助侧的第四存储装置250的双重写入接到处理进行说明。
如图54所示,第四存储装置250获取HA结构的配对状态(S1181),以判定配对状态是否正常(S1182)。在步骤S1182中判定为配对状态正常的情况下,第四存储装置250判定是否向HA辅助侧的第四存储装置250进行了锁定获取指示(S1183)。例如,在HA首要侧无法进行写入处理的情况下,为了向HA辅助侧指示锁定获取,就需要在HA辅助侧进行锁定获取。
在步骤S1182中判定为配对状态不正常的情况下,第四存储装置250判定自身是否进行了锁定获取(S1190),在进行了锁定获取的情况下,执行步骤S1195以后的处理。另一方面,在步骤S1190中判定为未进行锁定获取的情况下,第四存储装置250判定是否作出了锁定获取指示(S1191)。
在步骤S1191中配对状态不正常、自身也未进行锁定获取就作出了锁定获取指示的状态,是在HA首要侧和HA辅助侧都无法进行写入处理的状态。该情况下,向HA首要侧返回检查响应,在HA首要侧使RC配对的故障暂停。
在步骤S1191中判定为进行了锁定获取指示的情况下,第四存储装置250向HA首要侧返回检查响应(S1192),结束处理。另一方面,在步骤S1191中判定为未进行锁定获取指示的情况下,4存储装置250判定是否作出了闭塞指示(S1193)。
在步骤S1193中判定为进行了闭塞指示的情况下,因为是在HA首要侧进行了锁定获取的状态,所以第四存储装置250更新复原完毕的序号(S1200)。另一方面,在步骤S1193中判定为未进行闭塞指示的情况下,对检查响应设定闭塞(S1194),实施S1200以后的处理。所谓既没有来自HA首要侧的锁定获取指示也没有闭塞指示的情况,就是在HA首要侧未进行锁定获取的状态,所以需要在HA主控侧使之进行锁定获取。
在步骤S1183中指示了锁定获取的情况下,第四存储装置250获取第二仲裁盘205的仲裁锁定(QuorumRock)(S1184)以对锁定获取结果进行确认(S1185)。
第四存储装置250判定锁定获取结果是否良好(Good)(S1186),在良好(Good)的情况下,向HA辅助侧的HA状态设定锁定(S1187)。接着,第四存储装置250将HA结构的差分位图设为ON(S1189),执行步骤S1195以后的处理。另一方面,在步骤S109中判定为锁定获取结果不良的情况下,返回检查响应(S1188)并结束处理。
在步骤S1183中未指示锁定获取的情况下,执行步骤S1195以后的处理。
在步骤S1195中第四存储装置250获取GDEV配对状态,以判定GDEV配对状态是否正常(S1196)。在在步骤S1196中判定为GDEV配对状态正常的情况下,第四存储装置250对写入对象的第四物理卷251实施写入处理(S1199)。
另一方面,在步骤S1196中判定为GDEV配对状态不正常的情况下,第四存储装置250将HA的配对状态设定为闭塞,返回检查响应(S1198),实施S1200以后的处理。
接着,步骤S1200中,第四存储装置250更新复原完毕的序号,作出完成响应(1201)并结束处理。
(SVOL侧的删除处理)
接下来,参照图55针对SVOL侧(RC结构的辅助侧)的删除处理进行说明。
如图55所示,判定自身的日志属性是否为主控(S1211)。在步骤S1211中判定为日志属性不是主控的情况下,第三存储装置200结束处理。以下,设为第三存储装置200为SVOL侧的主控而进行说明。
在步骤S1211中判定为日志属性为主控的情况下,第三存储装置200获取复原完毕的序号(S1212)。接着,第三存储装置200删除到复原完毕的序号为止的日志(S1213)。
接下来,第三存储装置200对RDJNL指令设定可删除序号(S1241)。接着,第三存储装置200对PVOL侧的日志属性为主控的第一存储装置100发行RDJNL指令(S1215)。
(PVOL侧主控的删除处理)
接下来,参照图56针对PVOL侧(RC结构的首要侧)的日志属性为主控的删除处理进行说明。以下,将PVOL侧(RC结构的首要侧)的日志属性为主控的装置设为第一存储装置100进行说明。
第一存储装置100接到RDJNL指令(S1221),获取可删除序号(SEQ#)(S1222)。接着,删除到可删除序号为止的日志(S1223)。
接下来,对指令参数设定可删除序号,(S1224),对PVOL侧的日志属性为备用的第二存储装置150发行删除指示指令(S1225)。
(PVOL侧备用的删除处理)
接下来,参照图57针对PVOL侧(RC结构的首要侧)的日志属性为备用的删除处理进行说明。以下,将PVOL侧(RC结构的首要侧)的日志属性为主控的装置设为第二存储装置150进行说明。
第二存储装置150从第一存储装置100接到删除指示指令(S1231)。接着,第二存储装置150获取可删除序号(S1232),删除到可删除序号为止的日志(S1233)。
(1-9-2)故障时的存储系统的工作详情
接下来,参照图58~图64针对故障时的存储系统的工作详情进行说明。
(因PVOL侧主控故障所产生的日志属性切换之1)
首先,参照图58针对因PVOL侧(RC结构的首要侧)的主控的故障所产生的日志属性的切换处理进行说明。以下,针对将PVOL侧(RC结构的首要侧)的日志属性为主控的装置设为第一存储装置100、将日志属性为备用的装置设为第二存储装置150,在第二存储装置150将日志属性从备用切换为主控的情况进行说明。
首先,第二存储装置150判定日志属性是否是备用(S1301),在日志属性为备用的情况下,发行健康检查(S1302)。第二存储装置150通过健康检查来检查日志属性为主控的第一存储装置100是否有故障。
接着,第二存储装置150判定对于在步骤S1302中发行的健康检查有没有响应(S1303)。在步骤S1303中对于健康检查有响应的情况下,第二存储装置150记录健康检查成功这一情况(S1304)。
另一方面,在步骤S1303中对于健康检查没有响应的情况下,第二存储装置150判定前一次健康检查是否成功(S1305)。在步骤S1305中判定为前一次健康检查成功的情况下,记录健康检查失败了这一情况(S1306)。接着,第二存储装置150将当前时刻设定为健康检查开始时间(S1307),执行步骤S1310以后的处理。
另一方面,在步骤S1305判定为前一次健康检查未成功的情况下,第二存储装置150计算从健康检查开始起的经过时间(S1308)。接着,第二存储装置150判定在步骤S1308中计算出的经过时间是否经过了规定的阈值(S1309)。
在步骤S1309中判定为计算出的经过时间经过了规定的阈值的情况下,第二存储装置150执行步骤S1311以后的处理。另一方面,在步骤S1309中判定为计算出的经过时间未经过规定的阈值的情况下,第二存储装置150执行步骤S1310以降的处理。
在步骤S1310中,第二存储装置150判定是否有日志属性的切换请求(S1310)。步骤S1310中的切换请求,不是通过上述健康检查所实施的切换,而是通过使日志属性为主控的第一存储装置100的日志卷102闭塞等所实施的日志属性的切换。
在步骤S1310中判定为有切换请求的情况下,第二存储装置150执行步骤S1311以后的处理。另一方面,在步骤S1310中无切换请求的情况下,第二存储装置150结束处理。
在步骤S1311中,第二存储装置150对于第一仲裁盘105获取属于该装置的日志组的所有配对的锁定(S1311),也获取该日志组的锁定(S1312)。
接着,第二存储装置150判定步骤S1311以及步骤S1312中的锁定获取是否成功(S1313)。在步骤S1313中判定为锁定获取成功了的情况下,第二存储装置150将日志属性从备用切换为主控(S1314)。接着,第二存储装置150向SVOL侧通知日志属性从备用向主控的切换(S1315)。
另一方面,在步骤S1313中判定为锁定获取失败了的情况下,第二存储装置150结束处理。
接下来,第二存储装置150判定SVOL侧的日志属性的切换是否成功(S1316)。在步骤S1316中判定为SVOL侧的日志属性的切换成功了的情况下,第二存储装置150结束处理。另一方面,在步骤S1316中判定为SVOL侧的日志属性的切换失败了的情况下,第二存储装置150将日志属性的RC的配对状态设为暂停(S1317)。
(因PVOL侧主控故障所产生的日志属性切换之2)
接下来,参照图59针对上述步骤S1315中的SVOL侧的日志属性的切换处理进行说明。以下,针对将SVOL侧(RC结构的辅助侧)的日志属性为主控的装置设为第三存储装置200、将日志属性为备用的装置设为第四存储装置250,在第四存储装置250将日志属性从备用切换为主控的情况进行说明。
第四存储装置250向SVOL侧(RC结构的辅助侧)的日志属性为主控的第三存储装置200通知日志属性从主控向备用的切换(S1321)。
第四存储装置250,如果在上述步骤S1315中从第二存储装置150接到日志属性的切换通知,则需要在将自身的日志属性从备用切换为主控前就使主控侧的日志属性切换。
第四存储装置250判定主控侧的日志属性的切换是否成功(S1322)。
在步骤S1322中判定为主控侧的日志属性的切换成功了的情况下,第四存储装置250从第三存储装置获取可复原序号(S1323),存储可复原序号(S1324)。接着,在可复原序号上加上1而作为复原开始序号(S1325),执行步骤S1334以后的处理。
此外,在第四存储装置250能够与第三存储装置200进行通信的情况下,在第三存储装置200实施复原处理直到可在第三存储装置200复原的序号为止。接着,第四存储装置250在可复原序号上加上1而开始RDJNL指令的发行以及复原处理。
另一方面,在步骤S1322中判定为主控侧的日志属性的切换失败了的情况下,第四存储装置250判定是否是因PVOL侧(RC结构的首要侧)的日志属性为主控的第一存储装置100的故障所产生的切换指示(S1326)。在步骤S1326中判定为是因第一存储装置100的故障所产生的切换指示的情况下,第四存储装置250对PVOL侧作出切换失败响应(S1327)。
另一方面,在步骤S1326中判定为不是因第一存储装置100的故障所产生的切换指示的情况下,第四存储装置250获取复原完毕的序号(S1328)。接着,第四存储装置250在复原完毕的序号上加上1(S1329)。
在步骤S1326中判定为不是因第一存储装置100的故障所产生的切换指示的情况下,也可以设想SVOL侧的主控的第三存储装置200发生故障,与SVOL侧的主控的通信失败。该情况下,获取SVOL侧的备用的第四存储装置250的第四日志卷252中所存储的复原完毕的序号,在该序号上加上1而开始RDJNL指令的发行以及复原处理。
接着,第四存储装置250针对第二仲裁盘205获取属于该装置的日志组的所有配对的锁定(S1330),也获取该日志组的锁定(S1331)。
接着,第四存储装置250判定步骤S1330以及步骤S1331中的锁定获取是否成功(S1332)。在步骤S1332中判定为锁定获取失败了的情况下,第四存储装置250对PVOL侧作出切换失败响应(S1333)。
另一方面,在步骤S1332中判定为锁定获取成功的情况下,第四存储装置250判定是否是因PVOL侧(RC结构的首要侧)的日志属性为主控的第一存储装置100的故障所产生的切换指示(S1334)。
作为将SVOL侧的日志属性从备用切换为主控的模式,可以考虑因PVOL侧的主控故障所产生的切换和因SVOL侧的主控故障所产生的切换这2个模式。在为PVOL侧的主控故障的情况下,需要用SVOL侧的主控使用SVOL侧的主控发行完毕RDJNL指令的数据复原。为此,从备用状态设定为主控过渡状态,等待用SVOL侧的主控将RDJNL指令发行完毕的数据复原。另外,在为SVOL侧的主控故障的情况下,不经过渡状态就切换为主控。
在步骤S1334中判定为是因第一存储装置100的故障所产生的切换指示的情况下,第四存储装置250将日志属性从备用切换为主控过渡状态(S1335)。另一方面,在步骤S1334中判定为不是因第一存储装置100的故障所产生的切换指示的情况下,第四存储装置250将日志属性从备用切换为主控(S1336)。
接着,第四存储装置250从复原开始序号起开始RDJNL指令的发行(S1337)并结束处理。
(因PVOL侧主控故障所产生的日志属性切换之3)
接下来,参照图60针对SVOL侧(RC结构の辅助侧)的日志属性为备用的第四存储装置250中的、日志属性从主控过渡状态向主控的切换处理进行说明。
如图60所示,第四存储装置250判定日志属性是否为主控过渡状态(S1341),在不是主控过渡状态的情况下,第四存储装置250结束处理。
在步骤S1341中判定为日志属性是主控过渡状态的情况下,第四存储装置250获取可复原序号(S1342),获取复原完毕序号(S1343)。
在SVOL侧的备用将日志属性从备用切换为主控时,一旦被设定为主控过渡状态就从主控侧获取复原完毕的序号。接着,通过与先前通知过的可复原序号进行比较,能够掌握主控侧的复原处理的剩余数据以监视复原状况。
接着,第四存储装置250判定在步骤S1342和步骤S1343中获取的序号是否一致(S1344)。在步骤S1344中判定为序号一致的情况下,第四存储装置250将日志属性从主控过渡状态切换为主控(S1345),开始复原处理(S1346)。
SVO侧的备用的第四存储装置250,根据在步骤S1344中、可复原序号与复原完毕序号一致,而判定为SVOL侧的主控下的剩余数据的复原处理完成,使日志属性从主控过渡状态确定为主控状态而开始复原处理。
另一方面,在步骤S1344中判定为序号不一致的情况下,第四存储装置250结束处理。
(因PVOL侧主控故障所产生的日志属性切换之4)
接下来,参照图61针对在上述步骤S1321中执行的、SVOL侧(RC结构的辅助侧)的日志属性为主控的第三存储装置200中的、日志属性从主控向备用的切换处理进行说明。
如图61所示,第三存储装置200接到日志属性的切换通知(S1351)。
第三存储装置200获取可复原序号(S1352),将该序号设定为复原停止序号(S1353)。
接着,第三存储装置200将日志属性从主控切换为备用(S1354),停止RDJNL指令的发行(S1355)。
接下来,第三存储装置200报告可复原序号(S1356),报告日志属性的切换成功(S1357)。
在SVOL侧将日志属性从主控切换为备用的情况下,停止RDJNL指令。只是,针对已发行完毕RDJNL指令的数据,作为复原处理未实施的数据而存在。可复原序号是赋予于该数据的编号。因此,在将复原处理未实施的数据复原后,从主控切换为备用。这样,RDJNL指令的发行停止且剩余数据复原了的状态是备用过渡状态。
另外,如上所述,SVOL侧的备用从主控被通知可复原序号,监视在SVOL主控侧到可复原序号为止的复原是否完成。接着,SVOL侧的备用,如果到可复原序号为止的复原完成,则在先前通知过的可复原序号上加上1而开始复原处理。
(因PVOL侧主控故障所产生的日志属性切换之5)
接下来,参照图62针对SVOL侧(RC结构的辅助侧)的日志属性为主控的第三存储装置200中的、日志属性从备用过渡状态向备用的切换处理进行说明。
第三存储装置200判定日志属性是否是备用过渡状态(S1361)。在步骤S1361中判定为日志属性不是备用过渡状态即是正常状态的情况下,第三存储装置200实施复原处理(S1369),更新复原完毕序号(S1370)而结束处理。
另一方面,在步骤S1361中判定为日志属性是备用过渡状态的情况下,第三存储装置200获取复原完毕序号(S1362),获取复原停止序号(S1363)。
接着,第三存储装置200判定在步骤S1362中获取的序号与在步骤S1363中获取的序号是否一致(S1364)。
如上所述,在日志属性为备用过渡状态的情况下,按序号的序号将剩余数据复原,在到复原停止序号为止复原完成了的时刻将复原处理停止,而将日志属性从备用过渡状态确定为备用。另外,切换前为备用侧的原的备用侧,在原主控侧的剩余数据的复原完成且复原停止的时刻,在获取的序号上加上1而再次开始复原处理。
在步骤S1364中判定为序号一致的情况下,第三存储装置200将日志属性从备用过渡状态切换为备用(S1365),停止复原处理(S1366)并结束处理。
另一方面,在步骤S1364中判定为序号不一致的情况下,第三存储装置200实施剩余数据的复原处理(S1367),更新复原完毕的序号(S1368)并结束处理。
(因SVOL侧主控故障所产生的日志属性切换之1)
接下来,参照图63针对因SVOL侧(RC结构的辅助侧)的主控的故障所产生的日志属性的切换处理进行说明。
以下,针对将PVOL侧(RC结构的首要侧)的日志属性为主控的装置设为第一存储装置100、将日志属性为备用的装置设为第二存储装置150、在第一存储装置100将日志属性从主控切换为备用的情况进行说。
首先,第一存储装置100判定日志属性是否是主控(S1371)。在步骤S1371中判定为日志属性不是主控的情况下,第一存储装置100结束处理。
另一方面,在步骤S1371中判定为日志属性为主控的情况下,第一存储装置100计算从RDJNL指令接到时间起的经过时间(S1372),判定经过时间是否超过阈值(S1373)。
在步骤S1373中判定为经过时间未阈值的情况下,第一存储装置100结束处理。
另一方面,在步骤S1373中判定为经过时间超过阈值的情况下,第一存储装置100对PVOL侧的备用的第二存储装置150指示日志属性的切换(S1374)。
接着,第一存储装置1374判断备用侧的日志属性的切换是否成功(S1375)。在步骤S1375中判定为备用侧的日志属性的切换成功了的情况下,第一存储装置100将自身的日志属性从主控切换为备用(S1376)。另一方面,在步骤S1375中判定为备用侧的日志属性的切换失败了的情况下,第一存储装置100结束处理。
(因SVOL侧主控故障所产生的日志属性切换之2)
接下来,参照图64针对在上述步骤S1374中执行的向PVOL侧的备用的第二存储装置150指示日志属性的切换的处理进行说明。
如图64所示,第二存储装置150接到日志属性的切换通知(S1381)。第二存储装置150将日志属性从备用切换为主控(S1382)。
接着,向SVOL侧的备用通知日志属性的切换(S1383)。
接着,在步骤S1384中判定SVOL侧的备用的日志属性的切换是否成功(S1384),在切换成功了的情况下,作出完成响应(S1386)并结束处理。
另一方面,在步骤S1384中判定为SVOL侧的备用的日志属性的切换失败了的情况下,暂停日志组的RC配对(S1385),作出完成响应(S1386)并结束处理。
(因SVOL侧主控故障所产生的日志属性切换之3)
上述步骤S1383中的、SVOL侧(RC辅助侧)的日志属性为备用的第四存储装置250的日志属性切换处理,因为与图59的处理相同,所以省略详细的说明。
(因SVOL侧主控故障所产生的日志属性切换之4)
另外,第四存储装置250中的从日志属性的主控过渡状态向主控的切换处理,也因为与图60的处理相同,所以省略详细的说明。
(因SVOL侧主控故障所产生的日志属性切换之5)
另外,通过第四存储装置250的日志属性切换处理所执行的、第三存储装置200中的日志属性的从主控向备用的切换处理,因为与图61的处理相同,所以省略详细的说明。
(因SVOL侧主控故障所产生的日志属性切换之6)
另外,第三存储装置200中的日志属性的从备用过渡状态向备用的切换处理,因为与图62的处理相同,所以省略详细的说明。
(1-10)本实施方式的效果
以上那样,根据本实施方式,将在第一存储装置100获取的日志的序号传输到第二存储装置150,数据和该序号储存于第二存储装置150的第二日志卷152以保证第一虚拟存储装置10中的日志的序号的顺序性。另外,第三存储装置200,向第一存储装置100发行读出日志指令,接收储存于第一日志卷102的日志,从而与向第一存储装置100的写入请求异步地实施远程复制。另外,也从第三存储装置200向第四存储装置250传输数据和序号,第四存储装置250将接收的数据储存于第四物理卷251A或251B。由此,能够有效活用位于近距离的存储装置的资源,同时通过异步远程复制将数据备份于位于远距离的存储装置以提高系统的可用性。
(2)第二实施方式
(2-1)本实施方式的概要
第一实施方式中,构成为,通常时从第二虚拟存储装置20所含的第三存储装置200和第四存储装置250中的任一装置向第一虚拟存储装置10所含的第一存储装置100和第二存储装置150中的任一装置发行RDJNL指令,而实施异步远程复制。该情况下,将获取日志的序号的装置固定于第一存储装置100和第二存储装置150中的任一方以保证序号的顺序性。
本实施方式中,构成为,第三存储装置200和第四存储装置250中的任一装置也分别向第一存储装置和第二存储装置150中的任一装置发行RDJNL指令,而实施异步的远程复制。该情况下,为了在第一存储装置100以及第二存储装置200这两个装置获取序号,而使得在第一存储装置100与第二存储装置200之间序号异步。但是,在第三存储装置200以及第四存储装置250中,通过利用表示数据复原到哪儿为止好的复原许可标记而实施复原处理,从而在RC结构的首要侧的第一虚拟存储装置10与辅助侧的第二虚拟存储装置20之间使数据同步。
(2-2)计算机系统的结构
本实施方式涉及的计算机系统,因为与第一实施方式涉及的计算机系统的结构相同,所以以下仅针对不同的结构详细进行说明。
本实施方式中,构成为,在定期从主机计算机30的控制应用程序31发行冻结(Freeze)和标记并通过冻结(Freeze)和标记来控制数据的写入处理、复原处理这一点上,与第一实施方式不同。从控制应用程序31发行的冻结(Freeze)是使写入指令待机的指令。如果发行冻结(Freeze),则第一存储装置100以及第二存储装置150不实施数据的写入处理而变为待机状态(冻结(Freeze)状态)。
在冻结(Freeze)发行后所发行的标记是表示在数据的哪个时刻进行了冻结(Freeze)的信息。第一存储装置100以及第二存储装置150分别独立地获取序号,但制作带共用标记的日志。第三存储装置200或第四存储装置250使用该带标记的日志而实施复原。第三存储装置200或第四存储装置250,能够通过将标记所示的范围的数据复原,而使在两个装置复原的数据同步。
(2-3)存储装置的结构
第一存储装置100、第二存储装置150、第三存储装置200以及第四存储装置250的结构,因为与第一实施方式相同,所以省略详细的说明。
(2-4)利用标记的HA结构与RC结构的协作
接下来,参照图65~图69,针对包括利用上述标记而形成HA结构的第一存储装置100以及第二存储装置200的第一虚拟存储装置10、与包括形成RC结构的第三存储装置200以及第四存储装置250的第二虚拟存储装置20的协作进行说明。
(写入处理)
首先,参照图65针对数据的写入处理进行说明。如图65所示,如果从主机计算机30向第一存储装置100进行了写入请求(S801),则第一存储装置100将数据写入第一物理卷101A(S802)。接着,第一存储装置100获取数据的序号(S803),在第一日志卷102A中制作日志(S804)。接着,第一存储装置100将数据传输到第二存储装置200以实施数据的双重化处理(S805)。
第二存储装置150向第二物理卷151A写入数据(S806),获取数据的序号(S807)以在第二日志卷152A中制作日志(S808)。接着,第二存储装置150向第一存储装置100作出完成响应(S809),第一存储装置100对主机计算机30作出完成响应(S810)。这样,在UA结构的首要侧的第一存储装置100以及第二存储装置中,分别独立地获取序号。
接下来,针对RC结构的辅助侧的复原处理进行说明。第三存储装置200异步地发行RDJNL指令以获取第一存储装置100的第一日志卷102中储存的日志(S811)。第三存储装置200在第三日志卷202中储存日志数据(S812)。
另外,第四存储装置250也异步地发行RDJNL指令,以获取第二存储装置150的第二日志卷152中储存的日志(S821)。第四存储装置250在第四日志卷252中储存日志数据(S822)。
(冻结以及标记发行)
接下来,参照图66针对由冻结(Freeze)以及标记发行所进行的冻结(Freeze)设定处理以及带标记日志制作处理进行说明。
如图66所示,如果从主机计算机30的控制应用程序31发行冻结(Freeze)(S831),则第一存储装置100针对第一物理卷101A以及101B设定使写入指令待机的冻结(Freeze)(S832)。接着,向第二存储装置150传播发行了冻结(Freeze)这一情况(S833)。第二存储装置150也针对第一物理卷101A以及101B设定使写入指令待机的冻结(Freeze)(S834)。
如果在从主机计算机30的控制应用程序31发行了冻结(Freeze)后,发行标记(S835),则第一存储装置100获取序号(S836)以制作带标记日志(S837)。之后,第一存储装置100对于第一物理卷101A以及101B解除冻结(Freeze)状态(S838),向第二存储装置150传播标记(S839)。
第二存储装置150获取序号(S840)以制作带标记日志(S841)。之后,第一存储装置100对于第一物理卷101A以及101B解除冻结(Freeze)状态(S842)。
另外,第三存储装置200通过RDJNL指令从第一存储装置100获取带标记的日志(S843),将带标记日志储存于第三日志卷202(S844)。另外,第四存储装置250也通过RDJNL指令从第二存储装置150获取带标记的日志(S845),将带标记日志储存于第三日志卷202(S846)。
(复原处理)
接下来,参照图67以及68针对利用了标记的复原处理进行说明。如图67所示,如果从主机计算机30的控制应用程序31发行可复原标记编号获取指示(S851),则第一存储装置100从第一日志卷102获取可复原标记编号(S852)。接着,第一存储装置100将可复原标记编号报告给主机计算机30(S853)。另外,主机计算机30的控制应用程序31同样也对第二存储装置150发行可复原标记编号获取指示,在第二存储装置150也获取可复原标记编号。
主机计算机30,在统一了第一存储装置100以及第二存储装置150的可复原标记编号时,将可复原标记编号作为复原指示标记编号通知给第一存储装置100以及第二存储装置150(S854)。
第二存储装置150如果从主机计算机30被通知了复原指示标记编号,则从第二日志卷152获取序号(S855),以制作包括复原指示标记编号的复原指示用的日志(S856)。第一存储装置100也同样地使用复原指示标记编号制作包括复原指示标记编号的复原指示用的日志。
接着,第三存储装置200通过RDJNL指令从第一存储装置100获取复原指示用日志(S857),将包括复原指示标记编号的复原指示用日志储存于第三日志卷202(S858)。另外,第四存储装置250也通过RDJNL指令从第一存储装置100获取复原指示用日志(S857),将包括复原指示标记编号的复原指示用日志储存于第三日志卷202(S860)。
接着,如图68所示,第三存储装置200如果在第三日志卷202中检测到复原指示用日志(S861),则将到复原指示用日志所含的复原指示标记编号为止的日志复原到第三物理卷201A以及201B(S862)。第四存储装置250也同样地,如果在第四日志卷252中检测到复原指示用日志(S863),则将到复原指示用日志所含的复原指示标记编号为止的日志复原到第四物理卷251A以及251B(S864)。
在第三存储装置200与第四存储装置250之间,日志数据的序号异步,但如上所述,通过将到复原指示标记编号为止的日志复原,能够使复原的数据同步。
(删除处理)
接下来,参照图69针对删除处理进行说明。从第三存储装置200或第四存储装置250发行的RDJNL指令中含有复原完毕的标记编号。第一存储装置100如果从第三存储装置200被通知了复原完毕标记编号(S871),则从第一日志卷102中删除到复原完毕标记编号为止的数据(S872)。另外,第二存储装置150也同样地,如果从第四存储装置250被通知了复原完毕标记编号(S873),则从第二日志卷152中删除到复原完毕标记编号为止的数据(S874)。
如上所述,在第三存储装置200以及第四存储装置250中,到复原指示标记编号为止的日志,只要按复原指示标记编号依次实施复原,就可保证被复原到各装置的物理卷。因此,能够判断为,到从第三存储装置200或第四存储装置250通知的复原完毕标记编号为止,复原完毕、能够进行删除。
(2-5)本实施方式的效果
以上那样,根据本实施方式,在第三存储装置200以及第四存储装置250中,通过利用表示可以将数据复原到哪儿为止的复原许可标记而实施复原,从而在RC结构的首要侧的第一虚拟存储装置10与辅助侧的第二虚拟存储装置20之间使数据同步。由此,能够有效活用位于近距离的存储装置的资源,同时通过远程复制将数据备份到位于远距离的存储装置以提高系统的可用性。
附图标记说明
10第一虚拟存储装置
20第二虚拟存储装置
30主机计算机
100第一存储装置
101第一物理卷
102第一日志卷
110控制器
112存储器
118高速缓冲存储器
120硬盘驱动器
150第二存储装置
151第二物理卷
152第二日志卷
200第三存储装置
201第三物理卷
202第三日志卷
250第四存储装置
251第四物理卷
252第四日志卷

Claims (15)

1.一种存储系统,其特征在于,具备:
第一存储装置,连接于主机计算机,具有:储存数据的多个第一数据卷;和储存日志数据的第一日志卷,所述日志数据包括被写入所述多个第一数据卷的数据和表示所述数据被写入的顺序的更新编号;
第二存储装置,连接于所述主机计算机以及所述第一存储装置,具有:储存所述多个第一数据卷各自的双重化数据的多个第二数据卷;和储存所述第一日志卷的双重化数据的第二日志卷;
第三存储装置,连接于所述第一存储装置,具有使用从所述第一存储装置接收的所述日志数据而与所述多个第一数据卷构成远程复制配对的多个第三数据卷;和
第四存储装置,连接于所述第三存储装置,具有储存所述多个第三数据卷各自的双重化数据的多个第四数据卷;
所述第一存储装置对所述多个第一数据卷分别赋予虚拟卷标识符而将多个虚拟卷提供给所述主机计算机,
所述第二存储装置对储存所述多个第一数据卷之一的双重化数据的所述多个第二数据卷之一赋予同一所述虚拟卷标识符而将虚拟卷提供给所述主机计算机,
在所述第一存储装置的所述多个第一数据卷的任一或所述第二存储装置的所述多个第二数据卷的任一发生了故障的情况下,在所述第一存储装置的所述第一日志卷以及所述第二存储装置的所述第二日志卷持续进行所述更新信息而进行双重管理。
2.根据权利要求1所述的存储系统,其特征在于,
在对所述第一存储装置有来自所述主机计算机的数据的写入请求的情况下,
所述第一存储装置将该数据写入所述多个第一数据卷的任一第一数据卷,对该数据赋予固有的更新编号,在所述第一日志卷中储存包括所述数据以及所述更新编号的更新信息,将该数据以及该更新信息发送到所述第二存储装置,所述第二存储装置将该数据写入所述多个第二数据卷中与所述第一数据卷相对应的第二数据卷,将该更新信息储存于所述第二日志卷;
在对所述第二存储装置有来自所述主机计算机的数据的写入请求的情况下,
所述第二存储装置将该数据发送到所述第一存储装置,所述第一存储装置将该数据写入所述多个第一数据卷的任一第一数据卷,对该数据赋予固有的更新编号,在所述第一日志卷中储存包括所述数据以及所述更新编号的更新信息,将该更新信息发送到所述第二存储装置,所述第二存储装置将该数据写入所述多个第二数据卷中与所述第一数据卷相对应的第二数据卷,将该更新信息储存于所述第二日志卷。
3.根据权利要求2所述的存储系统,其特征在于,
所述第三存储装置具有与所述第一存储装置的所述多个第一数据卷以及所述第一日志卷或者所述第二存储装置的所述多个第二数据卷以及第二日志卷相对应的多个第三数据卷以及第三日志卷;
所述第四存储装置具有与所述第三存储装置的多个第三数据卷以及第三日志卷相对应的多个第四数据卷以及第四日志卷;
所述第一存储装置根据来自所述第三存储装置的请求,将所述第一日志卷中储存的所述更新信息发送到所述第三存储装置;
所述第三存储装置将所述更新信息储存于所述第三日志卷,将使用所述更新信息复原后的数据写入所述第三数据卷,将所述更新信息发送到所述第四存储装置;
所述第四存储装置将使用所述更新信息复原后的数据写入所述第四数据卷。
4.根据权利要求3所述的存储系统,其特征在于,
所述第一存储装置将所述第三存储装置的所述多个第三数据卷设定为使用所述更新信息对所述多个第一数据卷的数据进行远程复制的复制配对;
所述第二存储装置将所述第四存储装置的所述多个第四数据卷设定为使用所述更新信息对所述多个第二数据卷的数据进行远程复制的复制配对。
5.根据权利要求4所述的存储系统,其特征在于,
在所述第一存储装置发生了故障的情况下,
所述主机计算机持续进行向所述第二存储装置的数据的写入请求,
所述第二存储装置对向所述多个第二数据卷的任一第二数据卷的所述数据的写入赋予固有的更新编号,在所述第二存储装置的所述第二日志卷中储存包括所述数据以及所述更新编号的更新信息,
所述第三存储装置或所述第四存储装置基于所述更新信息执行向第三存储装置以及第四存储装置的与所述第二数据卷相对应的所述数据卷的远程复制。
6.根据权利要求4所述的存储系统,其特征在于,
在所述第三存储装置发生了故障的情况下,
所述第四存储装置将从所述第一存储装置或所述第二存储装置发送的所述更新信息储存于所述第四日志卷,将使用所述更新信息复原后的数据写入所述第四数据卷。
7.根据权利要求4所述的存储系统,其特征在于,
在所述第一存储装置与所述第三存储装置的连接被切断了的情况下,
所述第四存储装置将从所述第一存储装置或所述第二存储装置发送的所述更新信息储存于所述第四日志卷,将使用所述更新信息复原后的数据写入所述第四数据卷,将所述更新信息发送到所述第三存储装置,
所述第三存储装置将使用所述更新信息复原后的数据写入所述第三数据卷。
8.根据权利要求4所述的存储系统,其特征在于,
在所述第三存储装置的所述多个第三数据卷的任一或所述第四存储装置的所述多个第四数据卷的任一发生了故障的情况下,
在所述第三存储装置的所述第三日志卷以及所述第四存储装置的所述第四日志卷持续对所述更新信息进行双重管理。
9.根据权利要求4所述的存储系统,其特征在于,
在所述第一存储装置以及所述第二存储装置发生了故障的情况下,
所述主机计算机对所述第三存储装置或所述第四存储装置进行数据的写入请求,
所述第三存储装置对向所述多个第三数据卷的任一第三数据卷的所述数据的写入赋予固有的更新编号,在所述第三存储装置的所述第三日志卷以及所述第四存储装置的所述第四日志卷对包括所述数据以及所述更新编号的更新信息进行双重管理。
10.根据权利要求4所述的存储系统,其特征在于,
在无法执行所述第三存储装置以及所述第四存储装置中的远程复制的情况下,
所述第一存储装置以及所述第二存储装置,对于向所述多个第一数据卷的任一第一数据卷或所述多个第二数据卷的任一第二数据卷的所述数据的写入,对所述数据的差分信息进行管理以取代对所述更新信息的双重管理。
11.根据权利要求4所述的存储系统,其特征在于,
在所述第一存储装置的所述第一日志卷或所述第二存储装置的所述第二日志卷发生了故障的情况下,
所述第一存储装置以及所述第二存储装置,对于向所述多个第一数据卷的任一第一数据卷或所述多个第二数据卷的任一第二数据卷的所述数据的写入,对所述数据的差分信息进行管理以取代对所述更新信息的双重管理。
12.一种数据管理方法,是存储系统中的数据管理方法,所述存储系统包括连接于主机计算机的第一存储装置以及第二存储装置、和连接于所述第一存储装置或所述第二存储装置的第三存储装置以及第四存储装置,所述数据管理方法的特征在于,
所述第一存储装置具有与所述虚拟卷建立了对应关系的多个第一数据卷以及第一日志卷,所述第二存储装置具有与所述虚拟卷建立了对应关系的多个第二数据卷以及第二日志卷,通过所述第一存储装置以及所述第二存储装置对所述第一存储装置的一个第一数据卷和所述第二存储装置的一个第二数据卷赋予同一识别信息,将与该识别信息相对应的虚拟卷提供给所述主机计算机,从而使数据受到双重管理,
所述数据管理方法包括:第一步骤,在对所述第一存储装置或所述第二存储装置有来自所述主机计算机的数据的写入请求的情况下,所述第一存储装置对于向所述多个第一数据卷的任一第一数据卷的所述数据的写入赋予固有的更新编号,所述第一存储装置以及所述第二存储装置在所述第一存储装置的所述第一日志卷以及所述第二存储装置的所述第二日志卷中对包括所述数据以及所述更新编号的更新信息进行双重管理;
第二步骤,所述第三存储装置或所述第四存储装置根据所述更新信息执行向第三存储装置以及所述第四存储装置的与所述第一数据卷相对应的所述数据卷的远程复制;和
第三步骤,在所述第一存储装置的所述多个第一数据卷的任一或所述第二存储装置的所述多个第二数据卷的任一发生了故障的情况下,所述第一存储装置以及所述第二存储装置在所述第一存储装置的所述第一日志卷以及所述第二存储装置的所述第二日志卷中持续对所述更新信息进行双重管理。
13.根据权利要求12所述的数据管理方法,其特征在于,
所述第一步骤包括:
第五步骤,在对所述第一存储装置有来自所述主机计算机的数据的写入请求的情况下,所述第一存储装置将该数据写入所述多个第一数据卷的任一第一数据卷,对该数据赋予固有的更新编号,在所述第一日志卷中储存包括所述数据以及所述更新编号的更新信息,并将该数据以及该更新信息发送到所述第二存储装置;和
第六步骤,所述第二存储装置将该数据写入所述多个第二数据卷中的与所述第一数据卷相对应的第二数据卷,将该更新信息储存于所述第二日志卷。
14.根据权利要求12所述的数据管理方法,其特征在于,
所述第一步骤包括:
第七步骤,在对所述第二存储装置有来自所述主机计算机的数据的写入请求的情况下,所述第二存储装置将该数据发送到所述第一存储装置;
第八步骤,所述第一存储装置将该数据写入所述多个第一数据卷的任一第一数据卷,对该数据赋予固有的更新编号,在所述第一日志卷中储存包括所述数据以及所述更新编号的更新信息,将该更新信息发送到所述第二存储装置;和
第九步骤,所述第二存储装置将该数据写入所述多个第二数据卷中与所述第一数据卷相对应的第二数据卷,将该更新信息储存于所述第二日志卷。
15.根据权利要求12所述的数据管理方法,其特征在于,
所述第三存储装置具有与所述第一存储装置的所述多个第一数据卷以及所述第一日志卷或所述第二存储装置的所述多个第二数据卷以及第二日志卷相对应的多个第三数据卷以及第三日志卷,所述第四存储装置具有与所述第三存储装置的多个第三数据卷以及第三日志卷相对应的多个第四数据卷以及第四日志卷,
所述第二步骤包括:
第十步骤,所述第一存储装置根据来自所述第三存储装置的请求,将储存于所述第一日志卷的所述更新信息发送到所述第三存储装置;
第十一步骤,所述第三存储装置将所述更新信息储存于所述第三日志卷,将使用所述更新信息复原后的数据写入所述第三数据卷,将所述更新信息发送到所述第四存储装置;和
第十二步骤,所述第四存储装置将使用所述更新信息复原后的数据写入所述第四数据卷。
CN201380073368.4A 2013-05-08 2013-05-08 存储系统及数据管理方法 Pending CN105144119A (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2013/062962 WO2014181406A1 (ja) 2013-05-08 2013-05-08 ストレージシステム及びデータ管理方法

Publications (1)

Publication Number Publication Date
CN105144119A true CN105144119A (zh) 2015-12-09

Family

ID=51866910

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201380073368.4A Pending CN105144119A (zh) 2013-05-08 2013-05-08 存储系统及数据管理方法

Country Status (6)

Country Link
US (1) US9983962B2 (zh)
JP (1) JP5990641B2 (zh)
CN (1) CN105144119A (zh)
DE (1) DE112013006658T5 (zh)
GB (1) GB2526031B (zh)
WO (1) WO2014181406A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107147516A (zh) * 2017-03-22 2017-09-08 华为技术有限公司 服务器、存储系统及相关方法
CN107302495A (zh) * 2017-06-26 2017-10-27 长沙开雅电子科技有限公司 一种存储虚拟化网关新型虚拟映射方法
CN107329709A (zh) * 2017-07-05 2017-11-07 长沙开雅电子科技有限公司 一种存储虚拟化新型虚拟卷实现方法
CN109067865A (zh) * 2018-07-26 2018-12-21 郑州云海信息技术有限公司 建立存储系统伙伴关系的方法及装置

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10747475B2 (en) 2013-08-26 2020-08-18 Vmware, Inc. Virtual disk blueprints for a virtualized storage area network, wherein virtual disk objects are created from local physical storage of host computers that are running multiple virtual machines
US9887924B2 (en) * 2013-08-26 2018-02-06 Vmware, Inc. Distributed policy-based provisioning and enforcement for quality of service
US11016820B2 (en) 2013-08-26 2021-05-25 Vmware, Inc. Load balancing of resources
US9811531B2 (en) 2013-08-26 2017-11-07 Vmware, Inc. Scalable distributed storage architecture
JP6511739B2 (ja) * 2014-06-20 2019-05-15 富士通株式会社 冗長システムおよび冗長化方法
JP6511737B2 (ja) * 2014-06-20 2019-05-15 富士通株式会社 冗長システム、冗長化方法および冗長化プログラム
JP6511738B2 (ja) * 2014-06-20 2019-05-15 富士通株式会社 冗長システム、冗長化方法および冗長化プログラム
JP6318902B2 (ja) * 2014-06-20 2018-05-09 富士通株式会社 冗長システムおよび冗長化方法
US9747047B2 (en) * 2014-06-25 2017-08-29 International Business Machines Corporation Performing a remote point-in-time copy to a source and target storages in further mirror copy relationships
JP6569476B2 (ja) * 2014-12-19 2019-09-04 富士通株式会社 ストレージ装置、ストレージシステムおよびストレージ制御プログラム
US9841923B2 (en) * 2014-12-19 2017-12-12 Fujitsu Limited Storage apparatus and storage system
US10303360B2 (en) 2015-09-30 2019-05-28 International Business Machines Corporation Replicating data in a data storage system
US9684576B1 (en) * 2015-12-21 2017-06-20 EMC IP Holding Company LLC Replication using a virtual distributed volume
US10761767B2 (en) * 2016-07-12 2020-09-01 Hitachi, Ltd. Computer system and method for controlling storage apparatus that has replication direction from first logical device (in first storage) to second logical device (in second storage) and from said second logical device to third logical device (in said second storage), wherein said replication direction is reversed when second computer takes over for first computer
KR102318477B1 (ko) * 2016-08-29 2021-10-27 삼성전자주식회사 Ssd 어레이 관리를 위한 스트림 식별자 기반 스토리지 시스템
WO2018078718A1 (ja) * 2016-10-25 2018-05-03 株式会社日立製作所 ストレージシステム
WO2019080150A1 (zh) 2017-10-25 2019-05-02 华为技术有限公司 一种双活存储系统和地址分配方法
US10452502B2 (en) * 2018-01-23 2019-10-22 International Business Machines Corporation Handling node failure in multi-node data storage systems
CN111143112B (zh) * 2018-11-02 2023-08-25 伊姆西Ip控股有限责任公司 用于恢复元数据的方法、设备和计算机可读存储介质
JP7050707B2 (ja) * 2019-03-15 2022-04-08 Necプラットフォームズ株式会社 ストレージ制御装置、ストレージシステム、ストレージ制御方法、及び、ストレージ制御プログラム
US11205182B2 (en) * 2019-09-25 2021-12-21 Language Line Services, Inc. Resiliency configuration for a cloud-based contact center system
US11301263B2 (en) * 2019-10-30 2022-04-12 EMC IP Holding Company, LLC System and method for suspending and processing commands on a configuration object
JP2021111280A (ja) * 2020-01-15 2021-08-02 キヤノン株式会社 相互認証ペアを形成する方法および認証装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1581091A (zh) * 2003-08-11 2005-02-16 株式会社日立制作所 多点远程拷贝系统
US20080104443A1 (en) * 2006-10-30 2008-05-01 Hiroaki Akutsu Information system, data transfer method and data protection method
CN101482801A (zh) * 2005-09-20 2009-07-15 株式会社日立制作所 存储网络系统
US20120109919A1 (en) * 2009-07-02 2012-05-03 Nhn Business Platform Corporation High availability database management system and database management method using same

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4598387B2 (ja) * 2003-09-17 2010-12-15 株式会社日立製作所 記憶システム
US7149859B2 (en) * 2004-03-01 2006-12-12 Hitachi, Ltd. Method and apparatus for data migration with the efficient use of old assets
US7395265B2 (en) * 2004-08-27 2008-07-01 Hitachi, Ltd. Data processing system and storage subsystem provided in data processing system
JP2007066192A (ja) * 2005-09-01 2007-03-15 Hitachi Ltd ストレージシステム及びその制御方法並びにコンピュータプログラム
JP5057366B2 (ja) 2006-10-30 2012-10-24 株式会社日立製作所 情報システム及び情報システムのデータ転送方法
JP4902403B2 (ja) 2006-10-30 2012-03-21 株式会社日立製作所 情報システム及びデータ転送方法
JP5226125B2 (ja) * 2009-03-19 2013-07-03 株式会社日立製作所 ストレージシステム及びストレージシステムの制御方法
US8566635B2 (en) * 2011-01-21 2013-10-22 Lsi Corporation Methods and systems for improved storage replication management and service continuance in a computing enterprise
US8782632B1 (en) * 2012-06-18 2014-07-15 Tellabs Operations, Inc. Methods and apparatus for performing in-service software upgrade for a network device using system virtualization

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1581091A (zh) * 2003-08-11 2005-02-16 株式会社日立制作所 多点远程拷贝系统
CN101482801A (zh) * 2005-09-20 2009-07-15 株式会社日立制作所 存储网络系统
US20080104443A1 (en) * 2006-10-30 2008-05-01 Hiroaki Akutsu Information system, data transfer method and data protection method
US20120109919A1 (en) * 2009-07-02 2012-05-03 Nhn Business Platform Corporation High availability database management system and database management method using same

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107147516A (zh) * 2017-03-22 2017-09-08 华为技术有限公司 服务器、存储系统及相关方法
CN107147516B (zh) * 2017-03-22 2020-04-28 华为技术有限公司 服务器、存储系统及相关方法
CN107302495A (zh) * 2017-06-26 2017-10-27 长沙开雅电子科技有限公司 一种存储虚拟化网关新型虚拟映射方法
CN107329709A (zh) * 2017-07-05 2017-11-07 长沙开雅电子科技有限公司 一种存储虚拟化新型虚拟卷实现方法
CN109067865A (zh) * 2018-07-26 2018-12-21 郑州云海信息技术有限公司 建立存储系统伙伴关系的方法及装置

Also Published As

Publication number Publication date
JP5990641B2 (ja) 2016-09-14
DE112013006658T5 (de) 2015-12-03
GB201515157D0 (en) 2015-10-07
GB2526031A (en) 2015-11-11
WO2014181406A1 (ja) 2014-11-13
JPWO2014181406A1 (ja) 2017-02-23
US9983962B2 (en) 2018-05-29
GB2526031B (en) 2020-07-29
US20160004616A1 (en) 2016-01-07

Similar Documents

Publication Publication Date Title
CN105144119A (zh) 存储系统及数据管理方法
CN100570574C (zh) 用于管理存储系统之间的数据拷贝的系统和方法
CN100369005C (zh) 执行拷贝操作的方法和系统
US8914671B2 (en) Multiple hyperswap replication sessions
CN101174197B (zh) 信息系统及信息系统的数据转发方法
CN100472423C (zh) 逻辑卷传送方法和存储网络系统
CN101578586B (zh) 在故障转移和故障回复环境中使用虚拟拷贝
JP2004343776A (ja) カスケード式再同期を利用する障害回復システム
US6044444A (en) Remote data mirroring having preselection of automatic recovery or intervention required when a disruption is detected
US7865767B2 (en) Storage system and method for copying data to plurality of sites
CN101557320B (zh) 容灾的实现方法及其通信设备
JPH08305500A (ja) 記憶制御装置、それを含むデータ記憶システムおよび二重ペア抑止方法
CN106155943B (zh) 一种双控存储设备的掉电保护的方法及装置
EP1344135A1 (en) Write logging in mirrored disk subsystems
CN101231652B (zh) 用于数据存储再同步的系统和方法
US9367409B2 (en) Method and system for handling failures by tracking status of switchover or switchback
WO2016024994A1 (en) Method and apparatus to virtualize remote copy pair in three data center configuration
JP2005309793A (ja) データ処理システム
CN106227464A (zh) 一种双层冗余存储系统及其数据写入、读取及恢复方法
CN111158955B (zh) 一种基于卷复制的高可用系统以及多服务器数据同步方法
WO2013118189A1 (en) Storage device replacement method, and storage sub-system adopting storage device replacement method
CN105138280A (zh) 数据写入方法、装置及系统
WO2013168276A1 (ja) ストレージシステム及びストレージシステム制御方法
WO2015198449A1 (ja) ストレージシステム
US20060090050A1 (en) Remote management commands in a mass storage system

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20151209

WD01 Invention patent application deemed withdrawn after publication