WO2017081785A1 - Computer system - Google Patents

Computer system Download PDF

Info

Publication number
WO2017081785A1
WO2017081785A1 PCT/JP2015/081822 JP2015081822W WO2017081785A1 WO 2017081785 A1 WO2017081785 A1 WO 2017081785A1 JP 2015081822 W JP2015081822 W JP 2015081822W WO 2017081785 A1 WO2017081785 A1 WO 2017081785A1
Authority
WO
WIPO (PCT)
Prior art keywords
volume
path
host
vol
pair
Prior art date
Application number
PCT/JP2015/081822
Other languages
French (fr)
Japanese (ja)
Inventor
健志 奥村
一志 宮武
聡 角入
Original Assignee
株式会社日立製作所
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社日立製作所 filed Critical 株式会社日立製作所
Priority to PCT/JP2015/081822 priority Critical patent/WO2017081785A1/en
Publication of WO2017081785A1 publication Critical patent/WO2017081785A1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers

Definitions

  • the present invention relates to a computer system.
  • Patent Document 1 an information system using a plurality of (for example, two) storage apparatuses (hereinafter referred to as apparatus A and apparatus B). Is constructed, and data is double-written (mirrored) in the volume of the device A and the volume of the device B.
  • apparatus A and apparatus B an information system using a plurality of (for example, two) storage apparatuses
  • data is double-written (mirrored) in the volume of the device A and the volume of the device B.
  • the host issues a request (write command) for writing data to the volume of the device A
  • the device A stores a copy of the data in the volume of the device B.
  • the device A After the copy of the data is stored in the volume of the device B, the device A returns to the host that the write command is completed.
  • the same data is always stored in the volume of the device A and the volume of the device B.
  • Patent Document 1 discloses an example in which volume duplication (copy) between device A and device B fails as a result of the link between device A and device B being disconnected. In this case, it is conceivable that the host A switches to access to the device B because a failure has occurred in the device A after the host has used the volume of the device A for a while. However, since only data older than the volume of the device A is stored in the volume of the device B at that time, it is desirable to perform control so that access from the host is not accepted.
  • a problem detection volume that can be accessed in common by apparatus A and apparatus B is provided, and this problem is solved by using it.
  • the device A fails in the volume duplication processing, the device A reads the contents of the failure detection volume and checks whether the failure information flag is written by the device B. When the failure information flag is not written, the device A writes the failure detection flag, and then resumes the processing related to the access request from the host. However, if a failure information flag is written, apparatus A returns an I / O failure to the host. This prevents the host from reading old data.
  • Patent Document 1 In the information system disclosed in Patent Document 1, it is necessary to provide a failure detection volume in addition to the storage devices (devices A and B) for storing data. This increases the cost of the information system. On the other hand, it is possible to eliminate the failure detection volume by substituting a part of the determination process at the time of failure on the host side. For example, in Patent Document 2, when the host makes a write request to the primary storage and receives a remote copy failure response from the storage (in the case of an inter-storage device path failure), the host stores data in both the primary and secondary storages. Transition to the overwriting mode and maintain the data duplex state.
  • the computer system includes a storage system and a plurality of hosts that access the storage system.
  • the storage system has a first storage device having a first volume and a second storage device having a second volume, and operates the first and second volumes as a volume pair. If an access failure occurs when a host accesses a volume pair, the computer system identifies the location where the failure occurred, and changes the setting of the access route to the volume pair of each host based on the information on the identified failure location Or change the setting of the volume pair operated by the storage system.
  • a highly available computer system can be constructed at low cost.
  • processing executed by a computer such as a host may be described using “program” as the subject.
  • the processing described in the program is performed by the processor (CPU (Central Processing Unit)) executing the program, so the expression having the program as the subject is not technically accurate.
  • the contents of the process may be explained with the program as the subject. Further, part or all of the program may be realized by dedicated hardware.
  • Various programs described below may be provided by a storage medium that can be read by a program distribution server or a computer, and may be installed in each device that executes the program.
  • the computer-readable storage medium is a non-transitory computer-readable medium such as a non-volatile storage medium such as an IC card, an SD card, or a DVD.
  • “Volume” means a storage area (storage space) provided by a target device such as a storage device or storage device to an initiator such as a host or storage controller. Further, the storage apparatus according to the embodiment described below can create one logical volume using volumes provided from a plurality of storage devices, and provide this logical volume to the host. This logical volume is referred to herein as a “logical volume” or “logical device”.
  • Remote copy means a process of creating a copy of a storage device volume in a volume of another storage device.
  • the storage apparatus has a function of performing remote copy.
  • the storage apparatus receives write data for the volume from the host, the storage apparatus writes the write data to each volume of the two storage apparatuses.
  • volume in which data is stored first is called “primary volume” or “P-VOL”.
  • second volume in which data is stored is called “secondary volume” or “S-VOL”.
  • a pair of a primary volume and a secondary volume is called a “volume pair” or “pair”.
  • Access path or “path” means an access path when a host accesses a logical device.
  • the access path from the data copy source storage apparatus to the copy destination logical device is also called a “path”.
  • a computer system may employ a configuration in which a plurality of access paths to one logical device are provided. In that case, a host accessing the logical device may use an arbitrary access path provided for the logical device.
  • Device file is an interface for a program executed on the host to access an input / output device such as a disk.
  • a program such as a device driver manages a unique device file name in association with each logical device provided by the storage apparatus.
  • a program executed on the host 1 can access a logical device associated with a device file name by issuing an access request specifying a device file name.
  • a device file is defined for each access path. For example, when there are two access paths to the logical device (first access path and second access path), the first device file associated with the first access path and the first access path associated with the second access path Two device files are defined.
  • the host accesses the logical device using the first device file, the access request and data are transmitted to the logical device via the first access path.
  • the host accesses the logical device using the second device file, the access request and data are transmitted to the logical device via the second access path.
  • FIG. 1 is a diagram illustrating a hardware configuration of a computer system.
  • reference numerals are given to the respective components constituting the computer system.
  • reference numbers with suffixes such as “a” and “b” may be used.
  • Components having different suffixes and the same reference numbers mean the same type of components.
  • the component may be specified using a reference number that abbreviates suffix.
  • the computer system includes a plurality of hosts 1 (hosts 1a and 1b in FIG. 1), a plurality of storage devices (storage devices 2a and 2b in FIG. 1), and a management server 3.
  • the host 1 and the storage device 2 are connected by a network 4.
  • the host 1, the storage device 2, and the management server 3 are connected by a management network 6.
  • the storage device 2a and the storage device 2b are connected by an inter-storage path (5a, 5b).
  • the storage device 2a and the storage device 2b are devices that provide a storage area to the host 1.
  • the hardware configuration of the storage device 2b is not necessarily the same as the hardware configuration of the storage device 2a, in this embodiment, an example in which both hardware configurations are the same will be described.
  • the storage apparatus 2a includes a storage controller (sometimes abbreviated as CTL) 21a and a plurality of DISKs 22a.
  • the storage controller 21a includes a communication interface (called a port in this embodiment) for communicating with the host 1 and the storage device 2b, a processor for processing an I / O request from the host 1, a cache memory, and the like.
  • the DISK 22 a is a storage device that stores write data from the host 1.
  • an HDD Hard Disk Drive
  • a storage device such as an SSD (Solid State Drive) may be used for the DISK 22a.
  • the storage device 2a and the storage device 2b are connected via inter-storage paths (5a, 5b).
  • the storage device 2a can transmit a copy of data written from the host 1 to the storage device 2a to the storage device 2b via the inter-storage path (5a, 5b).
  • FIG. 1 shows a configuration in which each storage device 2 has one CTL 21 and two DISKs 22, but the number is not limited to this. Two or more CTLs 21 may exist in the storage apparatus 2 or three or more DISKs 22 may exist.
  • the host 1 is a computer that makes a data read / write request to the storage device 2 and includes at least a CPU 11, a memory 12, an HBA (Host Bus Adapter) 13, and a NIC (Network Interface Controller) 14.
  • the NIC 14 is a communication interface device for communicating with the management server 3 and the like.
  • the HBA 13 is a communication interface device for communicating with the storage device 2.
  • FIG. 1 shows an example in which two HBAs 13a exist in the host 1a and two HBAs 13b exist in the host 1b.
  • the number of HBAs 13 is not limited to two. Three or more HBAs 13 may exist in each host 1. Alternatively, there may be a configuration in which only one HBA 13 exists in the host 1. Further, the number of HBAs 13 included in each host 1 may not be the same.
  • the host 1a may have two HBAs 13a, and the host 1b may have three HBAs 13a.
  • the memory 12 is a high-speed accessible storage device such as RAM (Random Access Memory) or ROM (Read Only Memory).
  • the host 1 reads a program on the memory 12, and the CPU 11 executes the program.
  • the host 1 may have another type of storage resource (such as an HDD) in addition to or instead of the memory 12.
  • the memory 12 is an example of a storage device.
  • the management server 3 is a computer for performing management operations of the storage apparatus 2 and includes at least a CPU 31, a memory 32, a NIC 33, and a human interface device (HID) 34.
  • the management server 3 reads a program on the memory 32, and the CPU 31 executes the program.
  • the management server 3 may have another type of storage resource (such as an HDD) in addition to or instead of the memory 32.
  • the memory 32 is an example of a storage device.
  • the NIC 33 is a communication interface device for communicating with the host 1, the storage device 2, and the like.
  • the HID 34 is a device group for a user to perform input / output processing of information with respect to the management server 3, and includes, for example, a keyboard and a display.
  • the network 4 is composed of, for example, one or more fiber channel switches 41 and fiber channel cables 42, and is used for data transfer between the host 1 and the storage device 2.
  • the topology between the host 1 and the storage apparatus 2 shown in FIG. 1 is an example, and a topology different from that shown in FIG. 1 may be adopted.
  • At least the network 4 only needs to be configured so that both the host 1a and the host 1b can access the storage areas of the storage apparatuses 2a and 2b.
  • FIG. 1 only one cable 42 that connects one host 1 and one switch 41 or one cable 42 that connects one storage device 2 and one switch 41 is shown. 42 may be provided between the host 1 and the switch 41 (or between the storage apparatus 2 and the switch 41).
  • the inter-storage paths (5a, 5b) are transmission paths used for data transfer between the storage apparatuses 2a, 2b.
  • fiber channel cables are used for the inter-storage paths (5a, 5b).
  • Each of the inter-storage paths (5a, 5b) has a determined data transmission direction.
  • the inter-storage path 5a is used when the storage apparatus 2a transmits a data transmission instruction and data to the storage apparatus 2b.
  • the inter-storage path 5b is used when the storage apparatus 2b transmits a data transmission instruction and data to the storage apparatus 2a.
  • the management network 6 is a network configured using Ethernet as an example, and is used for exchanging management information of the host 1 and the storage device 2. Details of the management information will be described later.
  • FIG. 2 is a software configuration diagram of the computer system according to the present embodiment.
  • the processor in the CTL 21 executes the control program 25.
  • the CTL 21 forms one or a plurality of logical storage areas using one or more DISK 22 storage areas.
  • this logical storage area is called a logical device (LDEV) 24.
  • the storage apparatus 2 provides the LDEV 24 to the host 1, and the host 1 issues an I / O request (read command, write command, etc.) to the LDEV 24 provided from the storage apparatus 2.
  • the CTL 21 executes data access to the LDEV 24 in response to the I / O request received from the host 1.
  • FIG. 2 shows a configuration in which the storage apparatus 2a has one LDEV 24 (LDEV 24a-1) and the storage apparatus 2b has one LDEV 24 (LDEV 24b-1).
  • the storage apparatus 2 can have more than one LDEV.
  • the LDEV 24a-1 may be referred to as “LDEVa”
  • the LDEV 24b-1 may be referred to as “LDEVb”.
  • the storage device 2 further has a function of performing remote copy processing.
  • the storage apparatus 2 manages LDEVa and LDEVb as volume pairs. LDEVa is set as the primary volume, and LDEVb is set as the secondary volume.
  • LDEVa and LDEVb which are volume pairs, maintain the same data stored state. Therefore, even if a failure occurs in the storage device 2a and the host 30 cannot access the LDEVa, if the host 1 accesses the storage device 2b (LDEVb), the data stored in the LDEVa by the host 1 (Replica).
  • the storage apparatus 2 performs so-called synchronous remote copy.
  • the storage apparatus 2a accepts a data write request (write request) from the host 1 to the LDEVa area (assuming the address of this area is A)
  • the storage apparatus 2a writes the data to the address A of the LDEVa and the inter-storage path 5a.
  • the storage device 2b is instructed to write the data passed from the host 1 to the address A of the LDEVb.
  • the storage device 2b receives this instruction (and data), it writes the data to the address A of the LDEVb.
  • the storage apparatus 2b When the data writing to LDEVb is completed, the storage apparatus 2b returns a response to the effect that the data writing is completed to the storage apparatus 2a. The response is returned via the inter-storage path 5a.
  • the storage device 2a Upon receipt of the response from the storage device 2b, the storage device 2a responds to the host 1 that processing for the data write request received from the host 1 has been completed. By performing such processing, the state in which the same data is stored in LDEVa and LDEVb is maintained. Further, when a response to the write request is returned from the storage apparatus 2 to the host 1, it is guaranteed that data is stored in the two volumes constituting the volume pair.
  • the storage apparatus 2 when the host 1 issues a write request to the LDEVb area of the storage apparatus 2b (assuming that the address of this area is B), the storage apparatus 2 performs the following processing.
  • the storage apparatus 2b receives a write request from the host 1, the storage apparatus 2b first instructs the storage apparatus 2a to write data to the address B of the LDEVa via the inter-storage path 5b. Further, the data passed from the host 1 is transmitted together with the instruction.
  • the storage device 2a receives this instruction (and data), it writes the data to the address B of LDEVa.
  • the storage apparatus 2a When the data writing to LDEVa is completed, the storage apparatus 2a returns a response (notifying that the data writing has been completed) to the storage apparatus 2b. The response is returned via the inter-storage path 5b. After receiving the response from the storage device 2a, the storage device 2b writes the data received from the host 1 to the address B of the LDEVb. When the data writing to the LDEVb is completed, the storage apparatus 2b responds to the host 1 that the processing for the data write request received from the host 1 has been completed.
  • LDEVa is the primary volume. That is, when the storage apparatus 2 receives a write request for a volume pair, it first writes data to the primary volume.
  • the example described above is an example when the computer system is operating normally.
  • an operation different from the operation described above may be performed.
  • a failure such as disconnection of the inter-storage path 5b occurs, data cannot be transmitted from the storage device 2b to the storage device 2a.
  • the computer system according to the present embodiment may change the setting of the storage apparatus 2 so as not to accept a write request from the host 1 to the LDEVb.
  • the host 1 issues a write request to a volume pair composed of LDEVa and LDEVb, the write request is issued only to LDEVa. Details will be described later.
  • the storage system 1 stores the write data from the host 1 in two logical devices. For example, when the storage apparatus 2a receives a write request and write data for the LDEV 24a from the host 1, the write data is stored in the LDEV 24a of the storage apparatus 2a and the LDEV 24b of the storage apparatus 2b.
  • FIG. 3 shows the configuration of the pair management table T300.
  • the pair management table T300 is management information that each storage apparatus 2 has. Information on one volume pair is stored in each row of the pair management table T300.
  • the S-VOL in which the copy of the P-VOL is stored is called “a volume that is paired with the P-VOL” or “a pair volume of the P-VOL”.
  • a P-VOL that is a logical device in which copy data of an S-VOL is stored is also referred to as “a volume that is paired with an S-VOL” or “a pair volume of an S-VOL”.
  • the storage apparatus 2 manages each pair with an identifier called a pair number (Pair #).
  • each logical device is managed with an identifier called a logical device number (LDEV #).
  • LDEV # logical device number
  • an integer value of 0 or more is used for each identifier.
  • a volume pair whose pair number is n (n is an integer value of 0 or more) is denoted as “pair #n”.
  • a logical device whose LDEV # is n is expressed as “LDEV # n”.
  • Pair number is stored in Pair # (C301).
  • PDKC # (C303) and P-VOL # (C304) include information on P-VOL belonging to the volume pair (PDKC # and PDK which are the serial numbers of the storage apparatus 2 to which the P-VOL belongs).
  • -VOL LDEV #) is stored.
  • the SDKC # (C305) and S-VOL # (C306) include information on the S-VOL belonging to the volume pair (SDKC #, which is the serial number of the storage apparatus 2 to which the S-VOL belongs, and LDEV # of the S-VOL, respectively). ) Is stored.
  • Pair Status (C302).
  • Each volume pair has one of the states described below. These states are referred to as “pair status” in this embodiment.
  • (A) Initial-Copy state When forming a volume pair, the storage apparatus 2 first performs a process of copying all the contents of the P-VOL to the S-VOL (referred to as an initial copy process). This state during processing is referred to as an “Initial-Copy state”.
  • (B) Duplex state The state of the volume pair in which the contents of the P-VOL and the contents of the S-VOL are the same by the initial copy process or the resynchronization process described later is referred to as a “Duplex state”.
  • the host 1 can issue a write request to either the P-VOL or S-VOL of the volume pair. Regardless of whether the host 1 writes data to the P-VOL or S-VOL of the volume pair, the storage apparatus 2 stores the data in both the P-VOL and S-VOL.
  • the Duplex (S) state means a state of a volume pair in which the contents of the P-VOL and the S-VOL are the same. Data written from the host 1 to the P-VOL of the volume pair in the Duplex (S) state is also copied to the S-VOL.
  • the P-VOL is in a writable state, but the S-VOL is in a state in which writing from the host 1 is impossible. Therefore, when the volume pair is in the Duplex (S) state, the host 1 needs to issue a write request only to the P-VOL of that volume pair (do not write to the S-VOL). At this time, the S-VOL is in a readable state.
  • (D) Suspend state When the pair status of the volume pair is in the states (a) to (c) described above, data written to the volume pair is stored in both the P-VOL and S-VOL. On the other hand, a state in which the contents of the P-VOL are not reflected in the S-VOL is referred to as a “Suspend state”. For example, when the transmission line connecting the storage apparatus 2a and the storage apparatus 2b is cut off and copying becomes impossible, the volume pair becomes “Suspend state”. Alternatively, the volume pair may enter the “Suspend state” according to an instruction from the user.
  • the storage apparatus 2 manages that the P-VOL and S-VOL are in a pair relationship (P-VOL and S-VOL information remains stored in the pair management table T300). For example, when the storage apparatus 2a receives a write request for a pair volume (for example, P-VOL), the storage apparatus 2a performs data write to the P-VOL, but replicates data to the storage apparatus 2b (pair volume). Not implemented. The same applies when the storage apparatus 2b receives a write request.
  • a pair volume for example, P-VOL
  • (E) Duplex-Pending state When the volume pair is in a transitional state from the Suspend state to the Duplex state, the state of the volume pair is referred to as a “Duplex-Pending state”. In this state, the P-VOL (or S-VOL) data is S-VOL (or P-VOL) to match (synchronize) the contents of the P-VOL and S-VOL for the volume pair that was in the Suspend state. VOL). When the copying is completed, the state of the volume pair becomes “Duplex state”. The process of transitioning the “Suspend state” volume pair to the Duplex state is referred to as resynchronization processing (resync processing).
  • resynchronization processing resynchronization processing
  • Pair Status (C302) of the pair management table T300.
  • the status of the volume pair is “Initial-Copy status”.
  • the status of the volume pair is “Duplex status” Represents that.
  • 2 is stored in the Pair Status (C302), it indicates that the volume pair state is “Duplex (S) state”.
  • the state of the volume pair is “Suspend state”. If 4 is stored, the volume pair status is “Duplex-Pending status”.
  • the storage apparatus 2 manages information about whether each logical device can be accessed. Therefore, the storage apparatus 2 has LDEV status information T400.
  • FIG. 4 shows an example of the LDEV status information T400.
  • Mode (C402) stores the state of the logical device specified by LDEV # (C401).
  • LDEV # LDEV #
  • the state of the logical device is referred to as a “Valid state”.
  • the state of the logical device is “Invalid state” or “Blocked state”. Called.
  • Mode (C402) can be either 0 or 1. 0 indicates that the state of the logical device is “Valid state”, and 1 indicates that the state of the logical device is “Invalid state”. When the pair status of the volume pair is “Duplex state”, the states of the P-VOL and S-VOL belonging to the volume pair are “Valid state”.
  • the LDEV status information T400 is information that each storage device 2 has.
  • the LDEV status information T400 stores only the information on the logical device that one storage apparatus 2 has (for example, the LDEV status information T400 that the storage apparatus 2a has stores only the status of the logical device that the storage apparatus 2a has.
  • the LDEV status information T400 of the storage device 2b only the status of the logical device of the storage device 2b is stored).
  • Pair Status (C302) may be changed to “2” (Suspend state).
  • the CTL 21a copies to LDEVb ( (Data writing) fails.
  • the CTL 21a does not change the LDEVa state (Mode (C402)), but changes the Pair Status (C302) of the volume pair to “2” (Suspend state).
  • the memory 12 of the host 1 stores at least an application program (AP) 102, an alternate path program 103, and a device driver 104.
  • AP application program
  • alternate path program 103 alternate path program
  • device driver 104 device driver
  • the device driver 104 is a program for providing an access interface to the LDEV 24 for a higher-level program (AP 102, alternate path program 103).
  • the device driver 104 maps the LDEV 24 (more precisely, the access path to the LDEV 24) to the device file.
  • the device driver 104 issues a read command or a write command to the LDEV 24 mapped to the designated device file.
  • the device driver 104 maps LDEVa to the device file sda (141) and device file sdb (142), and maps LDEVb to the device files sdc (143) and sde (144).
  • scsi device files device files (device files sda (141) to sde (144)) to which the device driver 104 maps the LDEV 24 are referred to as “scsi device files”.
  • the reason why the LDEVa is mapped to the scsi device files sda (141) and sdb (142) is because there are two access paths from the host 1 to the LDEVa of the storage device 2a.
  • There are two HBAs 13 in the host 1 a path for accessing LDEVa via one of the two HBAs 13 is associated with the scsi device file sda (141), and access to LDEVa via the other HBA 13 Is associated with the scsi device file sdb (142).
  • the number of access paths formed between the host 1 and the logical device varies depending on the hardware configuration of the host 1, the setting of the storage device 2, or the setting of the network 4 (such as the fiber channel switch 41). .
  • the network 4 such as the fiber channel switch 41.
  • the alternate path program 103 is a program that dynamically switches the access path to the device file.
  • the alternate path program 103 provides a device file sddlma (131) to a higher-level program such as the AP 102.
  • the device file provided by the alternate path program 103 is called “device file”, and the device driver 104 uses the device files (device files sda (141) to sde (144) used to map the access path to the LDEV 24. )) Is called “scsi device file” and is distinguished from each other.
  • the device file sddlma (131) includes scsi device files sda (141) and sdb (142) mapped to LDEVa, and sdc (143) and sde (144) mapped to LDEVb, which is a pair volume of LDEVa. ) Is mapped. That is, the alternate path program 103 generates one device file (for example, sddlma (131)) for one volume pair and provides it to the AP 102 or the like. When the host 1 (the AP 102) accesses the logical device, it issues an access request using the device file (for example, sdlma (131)).
  • the host 1 (its AP 102) substantially issues an access request to the volume pair. Therefore, in this specification, when the host 1 accesses the P-VOL or S-VOL of the volume pair, it may be referred to as “accessing the volume pair”.
  • the alternate path program 103 accesses any one of the sda (141) to sde (144). For example, when the alternate path program 103 performs data write to sda (141), the device driver 104 writes data to the LDEVa of the storage apparatus 2a. The data written to LDEVa is also copied to LDEVb by the remote copy function of the storage apparatus 2 as described above.
  • the alternate path program 103 stores other scsi device files (sdb (142) to Retry access to LDEVa using sde (144)). Since the access destination is changed transparently to the AP 102, the AP 102 does not need to stop the processing, and the computer system can continue the operation without stopping.
  • the access to the LDEV of the alternate path program 103 may fail. In that case, more complicated processing than that described above is performed. Details of this processing will be described later.
  • the AP 102 is a program that accesses data stored in the LDEV 24.
  • the AP 102 can be any type of program.
  • it may be a database management system (DBMS) or a file system.
  • DBMS database management system
  • cluster software a program that continues business on the host 1b on which the same cluster software is being executed when the host 1a is down due to a failure).
  • a plurality of types of APs 102 may be executed on the host 1.
  • the host 1a is configured to be accessible to both LDEVa and LDEVb.
  • the host 1b is configured to be accessible to both LDEVa and LDEVb.
  • the configuration example in which only one volume pair exists has been described, but a plurality of volume pairs may exist in the storage apparatuses 2a and 2b.
  • the integrated management program 301 is executed.
  • the integrated management program 301 acquires computer system information from the alternate path program 103 executed on each host 1, and sets the volume pair of the storage device 2 and the alternate path for each host 1 based on the acquired information.
  • the setting of the program 103 is changed.
  • the integrated management program 301 changes the settings of the storage apparatus 2 and each host 1, it issues an instruction via the management network 6.
  • FIG. 5 shows an example of the contents of the alternate path management table T100.
  • the alternate path management table T100 is a table for storing management information used by the alternate path program 103.
  • the host-storage all path failure flag (C113), the P ⁇ S all path failure flag (C114), and the S ⁇ P all path failure flag (C115) are provided.
  • Each row (record) stores information of an access path (access path to LDEV) that the host 1 has.
  • the path ID (C105) is an identification number of an access path managed by the host 1, and an identification number unique to the host 1 is used for each access path.
  • LDEV # (C106) is a logical device number of a logical device that can be accessed through an access path.
  • the scsi device file C104 stores the name of the scsi device file defined in the access path.
  • the device file C103 stores the name of the device file that the alternate path program 103 provides to the upper program.
  • the scsi device file with the name stored in the scsi device file (C104) is mapped to the device file with the name stored in the device file (C103).
  • the pair # (C102) stores the pair number of the volume pair to which the LDEV (LDEV (C106)) mapped to the access path belongs.
  • Attribute (C107) is a column for storing information on the attribute of the logical device.
  • P-VOL When “P-VOL” is stored, it means that the logical device is a primary volume, and when “S-VOL” is stored, it means that the logical device is a secondary volume.
  • the path status (C108) represents the status of the access path.
  • Successess When “Success” is stored, it means that the access path to the logical device is normal. If “Failure” is stored, it means that an error has occurred in the access path to the logical device, and the logical device cannot be accessed using the access path.
  • a failure may occur in the network 4 between the host 1 and the storage apparatus 2 (for example, a failure in the fiber channel switch 41 or a disconnection in the fiber channel cable 42).
  • available paths Before describing the number of available paths (C109) and the number of other host usable paths (C109-2), the definition of “available paths” will be described.
  • the path that can be used for accessing the logical device that is, the path status (C108) is normal (Success)).
  • a certain path is called an “available path”.
  • the number of available paths (C109) indicates the number of available paths (path status (C108) is normal (Success)) among paths from the host 1 to the logical device (P-VOL or S-VOL). To express.
  • the number of available paths (C109) is counted for each P-VOL or each S-VOL.
  • the number of P-VOL usable paths in a certain volume pair is specified by identifying a record having an attribute (C107) of “P-VOL” among logical devices having the same device file (C103), and further
  • the path status (C108) is identified by counting the number of records that are normal (Success).
  • the number of usable paths of the S-VOL of the volume pair is specified by the same method.
  • the other host usable path number (C109-2) is information similar to the usable path number (C109). However, the number of paths available to other hosts (C109-2) stores the number of paths that can be used among paths to logical devices (P-VOL or S-VOL) of other hosts 1. Since each host 1 in the computer system cannot know the status of the access path of the other host 1 in principle, the information stored in the number of other host usable paths (C109-2) is obtained from the management server 3. Derived based on information. Details will be described later.
  • the product number (C110) is the product number of the storage device 2 to which the logical device belongs
  • the port name (C111) is the port of the storage device 2 (interface for communication with the host 1) on the path of the access path. It is an identifier.
  • the volume pair status (C112) is a column for storing the pair status of the volume pair.
  • a character string is stored in the volume pair status (C112), for example, a character string such as “Duplex” is stored in the volume pair status (C112) as shown in FIG.
  • An example will be described. Specifically, as described in the description of the pair status, “Initial-Copy”, “Duplex”, “Duplex (S)”, “Suspend”, or “Duplex-pending” is stored.
  • numerical values from 0 to 4 may be stored.
  • the all-path failure flag between host and storage is information defined for each logical device as well as the number of available paths (C109).
  • the path status (C108) of the path from the host to a certain logical device is “Failure”, “ON” is stored in the all-path failure flag (C113) between the host and storage of the logical device. Stores “OFF”.
  • the P ⁇ S all path failure flag (C114) is information defined for the P-VOL. For this reason, no information is stored in the P ⁇ S all-path failure flag (C114) of the row whose attribute (C107) is not “P-VOL”.
  • the P ⁇ S all path failure flag (C114) is set to “ ON "is stored. For example, in FIG. 1, when a P-VOL exists in the storage apparatus 2a and an S-VOL exists in the storage apparatus 2b, the P ⁇ S all path failure flag (C114) is “ON” when the inter-storage path 5a is blocked. Is stored. When there are a plurality of inter-storage paths 5a, "ON" is stored in the P ⁇ S all-path failure flag (C114) when all the inter-storage paths 5a are blocked.
  • the S ⁇ P all-path failure flag (C115) is information defined for the S-VOL. For this reason, no information is stored in the S ⁇ P all-path failure flag (C115) of the row whose attribute (C107) is not “S-VOL”.
  • the S ⁇ P all-path failure flag (C114) is set to “ ON "is stored. For example, in FIG.
  • the S ⁇ P all-path failure flag (C115) is “ON” when the inter-storage path 5b is blocked. Is stored. When there are a plurality of inter-storage paths 5b, "ON" is stored in the S ⁇ P all-path failure flag (C115) when all the inter-storage paths 5b are blocked.
  • the integrated management program 301 of the management server 3 manages the contents of the alternate path management table T100 notified from each host 1.
  • information including the contents of the alternate path management table T100 notified from each host 1 is referred to as an “event”.
  • the contents of the management information (integrated path management table T200) maintained by the integrated management program 301 will be described with reference to FIG.
  • the integrated path management table T200 is also called a path management DB.
  • the integrated path management table T200 includes at least a host name (C201), a pair # (C202), a path ID (C205), an LDEV # (C206), an attribute (C207), a path status (C208), and the number of available paths (C209). , Serial number (C210), port name (C211), volume pair status (C212), host-storage all path failure flag (C213), P ⁇ S all path failure flag (C214), S ⁇ P all paths It has a column of a failure flag (C215).
  • the management server 3 When the management server 3 receives the contents of the alternate path management table T100 from the host 1, it reflects the received contents in the integrated path management table T200. For example, when the contents of the alternate path management table T100 are received from the host 1 whose host name is “host A”, the management server 3 places the host name (C201) in the “host A” line in the integrated path management table T200. Store the received information.
  • the information of (C115) includes pair # (C202), path ID (C205), LDEV # (C206), attribute (C207), path status (C208), number of available paths (C209), and product number (C210).
  • FIG. 6 there is a part described as “OFF ⁇ ON” in the column of the all-path failure flag between S ⁇ P (C215), which represents an update transient state. The meaning of the description of this part will be described later.
  • an event is transmitted from the host 1 to the management server 3 when a volume pair is set or an access path from the host 1 to the volume pair is created. Therefore, when the AP 102 of the host 1 starts accessing the volume pair, the integrated path management table T200 reflects the contents of the alternate path management table T100 received from each host 1.
  • FIG. 7 to FIG. 10 are explanatory diagrams of the processing flow when the host 1 issues a write request to the P-VOL of the storage apparatus 2.
  • the computer system has the configuration shown in FIGS. 1 and 2, the storage apparatus 2a has a P-VOL, and the storage apparatus 2b has an S-VOL that is paired with the P-VOL.
  • the host 1 issues an instruction to the storage apparatus 2a at a place where the processing for the P-VOL by the host 1 is described, such as “issue a write request to the P-VOL” in the following description. Means.
  • a part in which processing for the S-VOL by the host 1 is described such as “issue a write request to the S-VOL” means that the host 1 issues an instruction to the storage apparatus 2b. .
  • the storage apparatus 2a when the storage apparatus 2a receives a write request and write data for the P-VOL from the host 1, the storage apparatus 2a transmits a copy of the write data to the S-VOL (storage apparatus 2b) via the inter-storage path 5a.
  • the storage apparatus 2b receives a write request and write data for the S-VOL from the host 1, the storage apparatus 2b transmits a copy of the write data to the P-VOL (storage apparatus 2a) via the inter-storage path 5b. Therefore, the inter-storage path 5a is referred to as “P-VOL ⁇ S-VOL storage path” or “P ⁇ S storage path”.
  • the inter-storage path 5b is referred to as “S-VOL ⁇ P-VOL storage path” or “S ⁇ P storage path”.
  • the access path from the host 1 to the P-VOL is called “host-P-VOL path”, and the access path from the host 1 to the S-VOL is called “host-S-VOL path”. Call.
  • step 1001 the AP 102 issues a write request to the volume pair (this is equivalent to issuing a write request specifying a device file).
  • the AP 102 designates the device file sddlma.
  • the alternate path program 103 identifies one write-destination access path (scsi device file) by referring to the write request issued by the AP 102 and the alternate path management table T100, and uses the identified access path. Issue a write request to the logical device.
  • the alternate path program 103 identifies one record whose path status 108 is “Success” from the records in which the device file name specified in step 1001 is the same as the device file C103.
  • the alternate path program 103 issues a write request to the logical device using the scsi device file C104 of the record specified here.
  • step 1002 a record whose logical device attribute C107 is “P-VOL” is selected.
  • a write request is issued to the P-VOL (storage device 2a).
  • An example of the case where a record whose logical device attribute C107 is “S-VOL” is selected will be described later (FIGS. 11 to 14).
  • the volume pair status (C112) of the access target volume pair stored in the alternate path management table T100 at the time of execution of step 1002 is “Duplex”.
  • the alternate path program 103 may select a record whose logical device attribute C107 is “P-VOL”. If so, a record that is “S-VOL” may be selected.
  • the volume pair status (C112) of the access target volume pair is “Duplex (S)”
  • the alternate path program 103 issues a write request
  • a record whose logical device attribute C107 is “P-VOL” is displayed. Select (because it is impossible to write to S-VOL).
  • step 1003 the alternate path program 103 receives a response to the write request issued in step 1002 from the storage apparatus 2a (accurately, the response may not be received). If the status of this response is “normal end” (step 1003: Yes), the alternate path program 103 notifies the AP 102 that the write request has been normally made (step 1010), and the processing is ended. If the write process is not performed normally, the processes after step 1004 are performed.
  • the write process is not performed normally, there may be several causes.
  • One is a case where a write request issued by the host 1 does not reach the storage device 2 because a failure has occurred in the network 4. In this embodiment, this state is referred to as “the access path is in a link down state”.
  • Another reason why the write process is not performed normally is when the P-VOL is in a blocked state. For example, when a failure occurs in a plurality of DISKs 22 used for forming a P-VOL, the storage apparatus 2a puts the P-VOL into a blocked state and returns an error response to the host 1. At this time, the storage apparatus 2a notifies the host 1 that the cause of the error is that the logical device is blocked, in the error response.
  • the write process is not performed normally.
  • the storage apparatus 2a transmits a copy of the write data to the storage apparatus 2b, an error is returned from the storage apparatus 2b or no response is returned from the storage apparatus 2b. Therefore, the storage apparatus 2a returns an error response to the host 1. At this time, the storage apparatus 2a notifies the host 1 of the error response that the cause of the error is the storage apparatus 2b side or the inter-storage path 5a.
  • the alternate path program 103 determines that the link is down (step 1004: Yes), and sets the path status (C108) of the write request issue destination access path to “Failure”. "(Step 1005).
  • the alternate path program 103 checks whether the path status (C108) is “Failure” for all access paths to the same logical device (P-VOL) as the access path whose path status (C108) has been changed in step 1005. . As a result, if there is an access path whose path status (C108) is not “Failure” (step 1006: No), a write request is issued to the P-VOL using that access path (that is, step 1002 is executed). Conversely, when all the path statuses (C108) are “Failure” (step 1006: Yes), step 1007 is performed. In step 1007, the alternate path program 103 sets the host-storage all path failure flag (C113) of the P-VOL to be accessed to “ON”.
  • step 1004 When an error response indicating logical device blockage is returned from the storage apparatus 2 (step 1004: No, and step 1011: Yes), the alternate path program 103 sets the path status (for all access paths of the P-VOL to be accessed) C108) is changed to “Failure” (step 1012). This is because when the logical device (P-VOL) is in a blocked state, it is substantially equivalent to a state in which all access paths from the host 1 to the P-VOL are blocked.
  • the alternate path program 103 sets the host-storage all path failure flag (C113) and the P ⁇ S all path failure flag (C114) of the P-VOL to be accessed to "ON", and sets the volume pair to be accessed.
  • the S ⁇ P all-path failure flag (C115) is set to “ON” (step 1013).
  • the reason why the all-path failure flag between P ⁇ S (C114) and the all-path failure flag between S ⁇ P (C115) is set to “ON” is that the logical device (P-VOL or S-VOL) is blocked. This is because mirroring using the remote copy function is not possible.
  • the S ⁇ P all-path failure flag (C115) which is turned “ON” is a flag (C115) defined for the pair volume (S-VOL) of the access target P-VOL.
  • step 1011: No The processing flow when an error other than the logical device blockage has occurred (step 1011: No) will be described later.
  • step 1031 the alternate path program 103 issues a write request to the S-VOL (storage device 2b) that is paired with the P-VOL (step 1031).
  • the process of step 1031 is similar to step 1002, but in step 1031 the alternate path program 103 has the same pair # (C102) as the record selected in step 1002 from the alternate path management table T100, and Select a record whose attribute C107 is “S-VOL” and whose path status (C108) is “Success” (note that before the processing of step 1031, the path status (C108) of the access path to the P-VOL is All are changed to “Failure.” Therefore, in step 1031, the alternate path program 103 does not actually have to determine whether or not the attribute C107 is “S-VOL”).
  • a write request to the logical device is issued using the scsi device file C104 of the record selected here.
  • step 1032 the alternate path program 103 receives a response to the write request issued in step 1031 from the storage apparatus 2b. If the status of this response is “normal end” (step 1032: Yes), the alternate path program 103 notifies the AP 102 that the write request has been made normally (step 1065). Thereafter, the alternate path program 103 notifies the event (failure information) to the integrated management program 301 of the management server 3 (step 1038), and ends the process. As described above, the event (failure information) is information including the contents of the alternate path management table T100.
  • step 1033 If no response is returned from the storage apparatus 2b, that is, if the access path is in a link down state (step 1033: Yes), the alternate path program 103 sets the path status (C108) of the access path that issued the write request to “Failure”. "(Step 1034). This process is the same as step 1005. Then, if there is an access path whose path status (C108) is “Success” among the access paths to the S-VOL, the alternate path program 103 retries the write request using the access path. Is repeated (step 1035, step 1031).
  • the alternate path program 103 indicates that all paths between the host and storage of the S-VOL to be accessed have failed.
  • the flag (C113) is set to “ON” (step 1036).
  • the alternate path program 103 responds to the application program 102 with an I / O error (notifying that the write process has failed) (step 1037). Further, the alternate path program 103 notifies the event (failure information) to the integrated management program 301 of the management server 3 (step 1038), and ends the process.
  • the alternate path program 103 sets the path status (for all access paths of the S-VOL to be accessed) C108) is changed to “Failure” (step 1042). Further, the alternate path program 103 sets the all-path failure flag between host and storage (C113) and the all-path failure flag between S ⁇ P (C115) of the S-VOL to be accessed to “ON”, and the pair of the access target S-VOL. The P ⁇ S all path failure flag (C114) of the volume (P-VOL) is set to “ON” (step 1043). The reason why Step 1043 is performed is the same as the reason why Step 1013 is performed.
  • the alternate path program 103 responds with an I / O error to the application program 102 (step 1037), notifies the integrated management program 301 of the management server 3 of an event (failure information) (step 1038), and ends the processing.
  • Step 1041 No.
  • the alternate path program 103 sets the S ⁇ P all path failure flag (C115) of the access target S-VOL to “ON”, and the P ⁇ S of the pair volume (P-VOL) of the access target S-VOL.
  • the all path failure flag (C114) is set to “ON” (step 1051).
  • the alternate path program 103 checks the access path status to the P-VOL that is the access target in this write process (step 1052). Specifically, the alternate path program 103 refers to the value of the number of other host usable paths (C109-2) of the P-VOL that is the access target in the current write target from the alternate path management table T100. .
  • step 1052 If the value of the number of paths that can be used by other hosts (C109-2) is 0 (step 1052: Yes), all hosts 1 other than the own host in the computer system are accessed by this write process. The VOL cannot be accessed.
  • step 1052 the own host is also in a state where it cannot access the P-VOL that is the access target in this write process.
  • the alternate path program 103 instructs the storage apparatus 2a to block the P-VOL (step 1053). This instruction is transmitted from the host 1 via the management network 6 to the storage apparatus 2a. Upon receipt of the instruction, the storage apparatus 2a closes the P-VOL and sets the pair status of the volume pair to which the P-VOL belongs to “Suspend state”. Thereafter, the alternate path program 103 issues a write request to the S-VOL and stores data in the S-VOL (step 1054). After step 1054, the alternate path program 103 executes step 1065 and step 1038, and ends the process.
  • step 1052 If the value of the number of paths available to other hosts (C109-2) is not 0 (step 1052: No), that is, among the hosts 1 in the computer system, the access to the P-VOL to be accessed in the current write processing
  • the alternate path program 103 responds to the application program 102 with an I / O error (notifying that the write process has failed) (step 1037). Further, the alternate path program 103 notifies the event (failure information) to the integrated management program 301 of the management server 3 (step 1038), and ends the process.
  • the value of the number of paths available to other hosts is a value that is updated when a notification is received from the management server 3 separately from this processing (the processing of FIGS. 7 to 10). Details of the update processing of the number of other host usable paths (C109-2) will be described later.
  • step 1052 described above whether or not there is a host 1 having a normal access path to the access target P-VOL by referring to the value of the number of other host available paths (C109-2). It was judged.
  • the alternate path program 103 requests the integrated management program 301 of the management server 3 to acquire the integrated path management table T200, thereby providing a host having a normal access path to the access target P-VOL. It may be determined whether or not there is one.
  • the alternate path program 103 acquires the integrated path management table T200 from the management server 3
  • the alternate path program 103 includes LDEV # (C206), attribute (C207), storage device serial number among the records of the integrated path management table T200.
  • C210 specifies the same record as the P-VOL that is the access target in the current write target. Then, the alternate path program 103 determines whether all the host-storage all path failure flags (C213) of these records are “ON”. At this time, the alternate path program 103 stores the name of the host 1 executing the alternate path program 103 in the information about the access path of the own host (host name (C201)) in the record of the integrated path management table T200. Record) is not referenced.
  • step 1052: Yes If all the path fault flags between the host and storage (C113) of the specified record are all “ON” (step 1052: Yes), all the hosts 1 in the computer system have become access targets in this write process. The P-VOL cannot be accessed. In this case, the alternate path program 103 executes Step 1053, Step 1054, Step 1065, and Step 1038, and ends the process. If there is a record in which the all-path failure flag between host and storage (C113) is “OFF” in the specified record (step 1052: No), the alternate path program 103 performs steps 1037 and 1038. Then, the process ends.
  • Step 1011 No
  • a failure may have occurred in the inter-storage path 5a, or the S-VOL may be blocked.
  • the alternate path program 103 sets the all-path failure flag (C114) between P ⁇ S of the P-VOL to be accessed to “ON” (step 1015).
  • the alternate path program 103 issues a write request to the S-VOL that is paired with the P-VOL (step 1016).
  • Step 1016 is the same processing as step 1031.
  • Step 1016 when the access path is in the link down state (Step 1017: Yes), the alternate path program 103 changes the path status (C108) of the access path that issued the write request to “Failure” (Step 1017). 1018). This process is the same as step 1034. Then, if there is an access path whose path status (C108) is “Success” among the access paths to the S-VOL, the alternate path program 103 reissues the write request using the access path. Are repeated (step 1019, step 1016).
  • the alternate path program 103 indicates the all-path failure flag between the host and storage of the S-VOL to be accessed (C113). ) Is turned “ON”, and the S ⁇ P all-path failure flag (C115) is turned “ON” (step 1020). Subsequently, the alternate path program 103 instructs the storage apparatus 2b to change the state of the S-VOL to be accessed to the blocked state (step 1070). This instruction is transmitted from the host 1 to the storage apparatus 2b via the management network 6. As a result, this S-VOL becomes inaccessible from all hosts 1.
  • step 1075 the alternate path program 103 issues a write request to the P-VOL that is paired with the S-VOL (step 1075).
  • step 1075 since the access path to the P-VOL is normal (not in the link down state) and the P-VOL is not in the blocked state, the write request from the host 1 to the P-VOL is successful.
  • the alternate path program 103 executes step 1065 and step 1038, and then ends the processing.
  • Step 1016 when an error response indicating logical device blockage is returned from the storage apparatus 2 (Step 1017: No, and Step 1021: Yes), the alternate path program 103 accesses all the S-VOLs to be accessed. For the path, the path status (C108) is changed to “Failure” (step 1022). Further, the alternate path program 103 sets the all-path failure flag between host and storage (C113) and the all-path failure flag between S ⁇ P (C115) of the S-VOL to be accessed to “ON” (step 1023).
  • step 1075 the alternate path program 103 issues a write request to the P-VOL that is paired with the S-VOL (step 1075).
  • step 1075 the alternate path program 103 executes step 1065 and step 1038, and then ends the process.
  • Step 1016 When an error response indicating an inter-storage path failure (in this case, an inter-storage path 5b failure) is returned as a result of executing Step 1016 (Step 1017: No, Step 1021: No, and Step 1024: Yes), an alternate path
  • the program 103 sets the S ⁇ P all path failure flag (C115) of the S-VOL to be accessed to “ON” (step 1026).
  • step 1024 If the determination in step 1024 is affirmative, the alternate path program 103 indicates that the access path from the host 1 to the P-VOL and the access path from the host 1 to the S-VOL are normal, and both the P-VOL and S-VOL are It can be judged that it is in a normal state. However, the remote copy function cannot be executed because there is a failure in the inter-storage path (5a, 5b). As a result, when the determination in step 1024 is performed, the storage apparatuses 2a and 2b have changed the pair status of the access target volume pair to the Suspend state, and the storage apparatus 2a has received a write request to the P-VOL. Copying to the S-VOL is not performed, and the storage apparatus 2b is also configured not to copy to the P-VOL when a write request to the S-VOL is accepted.
  • the alternate path program 103 issues a write request to both the P-VOL and S-VOL, thereby performing data mirroring on behalf of the storage apparatus 2 (step 1060).
  • P-VOL and S-VOL are normal (not in a blocked state). Therefore, it is desirable that the alternate path program 103 writes data in at least either P-VOL or S-VOL.
  • the failure of the inter-storage path (5a, 5b) may not have been detected in the other host 1 (this volume pair may be recognized as normal.
  • the host 1 recognizes that the same data is stored in the P-VOL and S-VOL (data can be read from any logical device).
  • step 1024 if the alternate path program 103 writes data only to the P-VOL (or only S-VOL), the other host 1 is the logical device to which the alternate path program 103 has written data. There is a possibility that data is read from a different logical device and incorrect data is accessed. In order to prevent this, the alternate path program 103 writes data in both the P-VOL and the S-VOL in step 1060.
  • the alternate path program 103 executes step 1065 and step 1038, and then ends the process.
  • the management server 3 integrated management program 301 changes the setting of each host 1 so that each host 1 accesses only one of P-VOL and S-VOL. Will be done. Processing performed by the management server 3 will be described later.
  • step 1024 If the determination at step 1024 is negative, the alternate path program 103 does not execute step 1026 but executes step 1060, step 1065, and step 1038, and ends the process.
  • FIG. 11 to FIG. 14 are explanatory diagrams of processing flow when the host 1 issues a write request to the S-VOL of the storage apparatus 2.
  • the flow of processing described in FIGS. 11 to 14 is similar in many respects to the flow of processing illustrated in FIGS. 7 to 10, and only the differences will be described below.
  • the computer system has the configuration shown in FIGS. 1 and 2 below, the P-VOL exists in the storage apparatus 2a, and the P-VOL is paired with the P-VOL.
  • FIGS. 1 and 2 the configuration shown in FIGS. 1 and 2 below
  • the P-VOL exists in the storage apparatus 2a
  • the P-VOL is paired with the P-VOL.
  • a case where a related S-VOL exists in the storage apparatus 2b will be described as an example.
  • Steps 2001 to 2023 in FIGS. 11 and 12 are almost the same as steps 1001 to 1023 in FIGS.
  • the portion described as P-VOL in Step 1001 to Step 1023 becomes S-VOL in Step 2001 to Step 2023 (changed to processing for S-VOL).
  • the portions described as S-VOL in 1001 to Step 1023 are different in that they become P-VOL (changed to processing for P-VOL) in Step 2001 to Step 2023.
  • step 1002 the alternate path program 103 issues a write request to the P-VOL
  • step 2002 the alternate path program 103 issues a write request to the S-VOL.
  • step 1006 the alternate path program 103 determines whether the path status (C108) of all access paths to the P-VOL to be accessed is “Failure”, but in step 2006, the alternate path program 103 determines whether the alternate path program 103 is the S-target to be accessed. It is determined whether the path status (C108) of all access paths to the VOL is “Failure”.
  • step 1012 the alternate path program 103 changes the path status (C108) to “Failure” for all access paths of the P-VOL to be accessed.
  • step 2012 the alternate path program 103 executes the S-VOL to be accessed. For all the access paths, the path status (C108) is changed to “Failure”.
  • step 1013 the alternate path program 103 sets the all-host-storage path failure flag (C113) of the P-VOL to be accessed to “ON”, but in step 2013, the alternate path program 103 sets the S-target to be accessed. -The VOL all-host failure path failure flag (C113) is set to "ON”.
  • the processing performed on the P-VOL in FIGS. 7 to 8 is changed to the processing performed on the S-VOL in FIGS. Except for this point, the processing in FIGS. 7 and 8 is the same as the processing in FIGS. 11 and 12.
  • step 1031 the alternate path program 103 issues a write request to the S-VOL that is paired with P-VOL, but in step 2031, the alternate path program 103 is a P-pair that is paired with S-VOL.
  • the processing is changed to issue a write request to the VOL.
  • Steps 2051 to 2054 in FIG. 14 are the same processes as steps 1051 to 1054 in FIG. However, in FIG. 14, between step 2051 and step 2054, the same processing as in step 1052 in FIG. 10 (all hosts 1 in the computer system cannot access the S-VOL to be accessed in this write processing) There is no process for determining whether or not.
  • the alternate path program 103 blocks the P-VOL when all the hosts 1 in the computer system cannot access the P-VOL that is the access target in the current write processing, and otherwise In response, an I / O error is returned to the application program 102.
  • the alternate path program 103 uniformly blocks the S-VOL regardless of whether or not all the hosts 1 in the computer system can access the S-VOL accessed by the current write processing.
  • the storage device 2b is instructed (step 2053).
  • Step 2075 is the same processing as Step 1075 in FIG. 10, except that the alternate path program 103 issues a write request to the S-VOL instead of the P-VOL.
  • Steps 2024, 2026, and 2060 are the same processes as steps 1024, 1026, and 1060 in FIG. However, in step 2024, it is determined whether or not an error response indicating a failure in the inter-storage path 5a has been returned.
  • the alternate path program 103 sets the all-path failure flag between P ⁇ S of the P-VOL to be accessed ( C114) is turned “ON”. If no error response indicating a failure in the inter-storage path 5a is returned in step 2024 (step 2024: No), step 2060 is not executed.
  • Step 2071 is similar to step 1070 in FIG. 10, but P-VOL is blocked instead of S-VOL.
  • the same processing as step 1052 of FIG. 10 is performed before step 2071.
  • the alternate path program 103 determines whether there is a host 1 having an access path to the P-VOL that is the access target in the current write processing for all the hosts 1 in the computer system (step 2070). If this determination is affirmative, that is, if there is a normal access path to the P-VOL that is the access target in the current write process (step 2070: No), the alternate path program 103 executes steps 2037 and 2038. Execute to finish the process.
  • step 2070 If the determination in step 2070 is negative (when all the hosts 1 in the computer system do not have a normal access path to the P-VOL that is the access target in the current write process), the alternate path program 103 Instructs the storage apparatus 2a to block the P-VOL (step 2071). Thereafter, the alternate path program 103 executes Step 2075, Step 2065, and Step 2038, and ends the process.
  • the trapezoid box represents the start of the loop process
  • the inverted trapezoid box represents the end of the loop process.
  • FIG. 15 there is a trapezoid box at step 5004 and an inverted trapezoid box at step 5025 in FIG.
  • step 5004 “loop for the number of volume pairs” is described.
  • the processing between Step 5004 and Step 5025 (Step 5005 to Step 5024) is repeatedly executed for the number of volume pairs (volume pairs possessed by the storage apparatus 2) under the management of the management server 3.
  • the integrated management program 301 continues to wait for an event notification from the host 1, and starts the processing from step 5001 when the event is notified from the host 1. In steps 5001 and 5002, the integrated management program 301 receives an event from the host 1, and reflects the content of the received event in the path management DB (integrated path management table T200).
  • the integrated management program 301 receives an event from the host 1, and reflects the content of the received event in the path management DB (integrated path management table T200).
  • the event notified from the host 1 to the management server 3 is information including the contents of the alternate path management table T100 managed by the host 1.
  • the event may include other information, for example, information indicating that the path status of the host 1 has been changed.
  • the management server 3 When the management server 3 is notified of an event from the host 1 whose host name is “host A” (hereinafter, this host 1 is called “host A”), the management server 3 has an alternate path management table that the host 1 has. Receive the entire contents of T100.
  • the integrated management program 301 reflects the received contents of the alternate path management table T100 in the row (record) of the integrated path management table T200 with the host name (C201) being “host A”.
  • step 5002 the contents of the all-path failure flag between P ⁇ S (C214) and the all-path failure flag between S ⁇ P (C215) are also obtained for lines other than the host name (C201) “host A”. May change.
  • FIG. 6 shows a state in which the information received from the host A by the integrated management program 301 is being reflected in the integrated path management table T200.
  • the information in the row of the host name (C201) “host A” in the integrated path management table T200 Represents the state immediately after is reflected.
  • the S ⁇ P all-path failure flag (C215) in the row where the host name (C201) is “host A” is changed to “ON”. Further, this line (the line in which the S ⁇ P all-path failure flag (C215) is changed to “ON”) is a line in which information on the volume pair having the pair # (C202) of 1 is stored. In this case, the S ⁇ P all-path failure flag (C215) is also changed to “ON” for the other rows where the pair # (C202) is 1.
  • the column “OFF ⁇ ON” indicates that the S ⁇ P all-path failure flag (C 215) is changed to “ON” by the event received from the host 1.
  • the management program 301 changes the contents of the P ⁇ S all-path failure flag (C214) and the S ⁇ P all-path failure flag (C215) for lines other than the host name (C201) “host A”. However, if the information of the P ⁇ S all path failure flag (C114) or the S ⁇ P all path failure flag (C115) received from host A is “OFF”, the integrated management program 301 uses the host name ( C201) does not change any lines other than “host A”.
  • the volume that uses the inter-storage path 5 is recovered after the failure of the inter-storage path 5
  • the pair status of the pair returns to a normal state (for example, when the Suspend (or Duplex (S)) state transitions to the Duplex state).
  • the storage device 2 notifies the management server 3 that the pair status has been changed, and the management server 3 accordingly responds to the P ⁇ S all-path failure flag (C214) and the S ⁇ P all-path failure flag ( The content of C215) is changed.
  • the integrated management program 301 reads the contents of the path management DB (integrated path management table T200) (step 5003). Here, the contents for all the hosts 1 are read.
  • step 5004 the integrated management program 301 selects one managed volume pair.
  • Information on all volume pairs under management is recorded in the integrated path management table T200. For example, in the example of FIG. 6, 1, 2, 3, or 4 is stored in the pair # (C202) of each row, so the volume pairs under management are pair # 1 to pair # 4.
  • step 5004 the integrated management program 301 performs steps 5005 to 5024.
  • step 5024 if there is a volume pair that has not yet been processed in steps 5005 to 5024, the integrated management program 301 selects the volume pair (step 5004), and steps 5005 to 5024 for that volume pair. Process. When this process is performed for all volume pairs, the integrated management program 301 ends the process.
  • the processing of Step 5005 to Step 5024 is executed for the pair #n (n is any value of 1 to 4).
  • the integrated management program 301 checks the all-path failure flag of the inter-storage path 5 of the pair #n. Specifically, the integrated management program 301 determines whether the P ⁇ S all-path failure flag (C214) and the S ⁇ P all-path failure flag (C215) in the row where the pair # (C202) is n is OFF or ON. Check. When a plurality of hosts 1 access the pair #n, there are a plurality of rows in which the pair # (C202) is n. In that case, the integrated management program 301 may refer to the P ⁇ S all-path failure flag (C214) and the S ⁇ P all-path failure flag (C215) in any row.
  • step 5006 the integrated management program 301 uses all pairs #n. For the host 1, the status of the path status (C208) of the logical device (P-VOL, S-VOL) belonging to the pair #n is confirmed, and the number of path statuses (C208) is totaled (step 5008). The total result is stored in the number of available paths (C209).
  • step 5008 the integrated management program 301 starts from all the hosts 1 that use the pair #n, and manages the logical devices (P-VOL, P-VOL,) managed by the alternate path management table T100 that the host 1 has.
  • the path status (C108) of S-VOL) may be acquired, and the path status (C208) and the number of available paths (C209) may be updated using the information.
  • step 5008 is performed for all the hosts 1 that use the pair #n
  • the integrated management program 301 executes a normal access path between the P-VOL of the pair #n and all the hosts 1 that use the pair #n.
  • the number of normal paths between the host and P-VOL and the number of normal access paths between the S-VOL of pair #n and all hosts 1 using pair #n
  • host-P-VOL normal path number referred to as “the number of normal paths between the host and S-VOL”.
  • step 5010: Yes the processing from step 5011 to step 5016 is performed. Otherwise (step 5010: No), the integrated management program 301 does not perform the processing of steps 5011 to 5016, but performs step 5017.
  • step 5010 the integrated management program 301 instructs the storage apparatus 2 via the management network 6 to reverse the P-VOL and S-VOL of the pair #n (step 5011).
  • “inversion” means a process of switching the roles of P-VOL and S-VOL. That is, when inversion is instructed, the logical device that was previously P-VOL is changed to S-VOL, and conversely, the logical device that was previously S-VOL is changed to P-VOL.
  • the storage apparatus 2 Upon receipt of this instruction, the storage apparatus 2 sets the logical device that has been P-VOL so far to S-VOL and the logical device that has been S-VOL to P-VOL for pair #n. Specifically, the control program 20 of the storage apparatus 2 reads the contents of PDKC # (C303) and P-VOL # (C304) and the contents of SDKC # (C305) and S-VOL # (C304) in the pair management table T300. Replace. At this time, the integrated management program 301 issues an instruction to both the storage device 2a and the storage device 2b, and the storage device 2a and the storage device 2b each update the contents of the pair management table T300 that they own.
  • step 5012 the integrated management program 301 also updates the information recorded in the integrated path management table T200.
  • the attribute (C207) of the inverted logical device is changed (if “P-VOL” has been stored so far, it is changed to “S-VOL” and “S-VOL” is stored). If it is, it is changed to “P-VOL”).
  • Step 5015 is the same processing as step 5008.
  • the host 1 notified that the P-VOL and S-VOL of the pair #n have been inverted updates the contents of the alternate path management table T100 managed by the host 1 (the P-VOL and S-VOL of the pair #n) , The attribute (C107) is updated).
  • step 5017 the integrated management program 301 instructs the storage apparatus 2 to put the S-VOL of the pair #n into a closed state, and simultaneously updates the contents of the integrated path management table T200.
  • the storage apparatus 2 instructed to close the S-VOL is the storage apparatus 2 having the S-VOL.
  • the integrated management program 301 notifies all the hosts 1 that use the pair #n that the S-VOL of the pair #n is blocked (step 5019). Receiving the notification that the S-VOL is blocked, the host 1 changes the status of all access path paths (C108) to the S-VOL belonging to the pair #n to “Failure”.
  • the integrated management program 301 executes steps 5010 to 5017 to change one of the P-VOL and the S-VOL to the blocked state and leave only the other one accessible from the host 1. Specifically, a logical device having a large number of access paths available from the host 1 is maintained in a state accessible from the host 1, and the other logical device (a logical device having a small number of access paths available from the host 1 is maintained. Device) is blocked.
  • step 5023 the integrated management program 301 notifies all hosts 1 using the pair #n of information on the number of paths available between the P-VOL of the pair #n and each host 1 (step 5023). Exit. Details of step 5023 will be described later.
  • Step 5005 when only the P ⁇ S all-path failure flag (C214) is ON (Step 5006: No, and Step 5030: Yes), the integrated management program 301 first performs Step 5031 to Step 5036. Execute. The processing of step 5031 to step 5036 is the same as that of step 5011 to step 5016. That is, the integrated management program 301 reverses the P-VOL and S-VOL belonging to the pair #n (step 5031), reflects the result in the integrated path management table T200 (step 5032), and uses the pair #n. Each host 1 is notified (step 5034). The path status (C208) is also recounted (step 5035).
  • the integrated management program 301 instructs the storage apparatus 2 to change the pair status of the pair #n (step 5037).
  • an instruction to change the pair status to the Duplex (S) state is sent to the storage apparatus 2.
  • the storage apparatus 2 changes the pair status (Pair Status (C302) of the pair management table T300) of the pair #n to “2”.
  • the integrated management program 301 notifies all the hosts 1 using the pair #n that the pair status of the pair #n has been changed to the Duplex (S) state (step 5041).
  • the host 1 changes the contents of the alternate path management table T100 (volume pair status (C112) of pair #n) to “Duplex (S)”.
  • the host 1 When the volume pair state (C112) of the pair #n is changed to the Duplex (S) state, the host 1 issues a write request only to the P-VOL when writing data to the pair #n. Finally, the integrated management program 301 notifies all the hosts 1 that use the pair #n of the number of paths available between the P-VOL of the pair #n and each host 1 (step 5023), and the processing ends. To do.
  • Step 5005 when only the S ⁇ P all-path failure flag (C215) is ON (Step 5006: No, Step 5030: No, and Step 5038: Yes), the integrated management program 301 Steps 5037 to 5043 and steps 5022 to 5024 are executed, and the process ends. That is, in this case, the process is almost the same as the process performed when only the P ⁇ S all path failure flag (C214) is ON. If only the S ⁇ P all-path failure flag (C215) is ON, Steps 5031 to 5036 are not performed, and only the P ⁇ S all-path failure flag (C214) is ON. The other processing is the same.
  • the integrated management program 301 causes the storage apparatus 2 to change the pair #n to the Duplex (S) state when only one path (when only the inter-storage path 5a or the inter-storage path 5b) is blocked) In addition, P-VOL and S-VOL are inverted as necessary. Also, the integrated management program 301 prevents the host 1 from writing to the S-VOL. As a result, it is possible to maintain a state in which mirroring by the storage apparatus 2 is performed on the pair #n.
  • step 5006 When the P ⁇ S all path failure flag (C214) and the S ⁇ P all path failure flag (C215) are both OFF (step 5006: No, step 5030: No, and step 5038: No), integration
  • the management program 301 totals the number of available paths between the host 1 and the P-VOL and S-VOL belonging to the pair #n for all the hosts 1 that use the pair #n, and the number of available paths (C209) (Step 5052). Subsequently, the integrated management program 301 calculates the average number of available paths between each host 1 and the P-VOL belonging to the pair #n, and at the same time, compares each host 1 with the S-VOL belonging to the pair #n. The average number of available paths is calculated (step 5054).
  • step 5055 the integrated management program 301 executes step 5056 to step 5061.
  • Steps 5056 to 5061 are the same as steps 5031 to 5036. That is, inversion of the P-VOL and S-VOL belonging to the pair #n is performed. This is because fault tolerance is enhanced when a logical device having a large number of normal access paths is set to P-VOL.
  • steps 5056 to 5061 are not performed.
  • the settings of the storage apparatus 2 and the host 1 are changed so that a logical device having a large average access path number from the host 1 becomes a P-VOL.
  • the integrated management program 301 notifies all the hosts 1 using the pair #n of the number of paths available between the P-VOL of the pair #n and each host 1 (steps 5022 to 5024). The process ends.
  • step 5023 the integrated management program 301 refers to the integrated path management table T200 and calculates the total number of available paths (C209) for each logical device. An example will be described with reference to FIG.
  • the logical device having the product number (C210) “0001” and the LDEV # (C206) “1” (hereinafter, this logical device is called a target LDEV) is host A, host B, and host. It can be seen that there is an access path with D.
  • the number of available paths between host A and target LDEV (C209) is “1”
  • the number of available paths between host B and target LDEV (C209) is “1”
  • host D and target LDEV the number of possible paths (C209) is “1”. Therefore, the total number of available paths between all the hosts 1 and the target LDEV is 3.
  • the integrated management program 301 calculates the total number of available paths (C209) for each logical device, and creates notification information T250 for notifying each host 1.
  • An example of the format of the notification information T250 is shown in FIG.
  • the total number of available paths of the logical device specified by the product number (C251) and LDEV # (C252) is stored in the number of paths (C253).
  • the integrated management program 301 transmits this notification information T250 to each host 1.
  • each host 1 that has received the notification information T250 updates the number of paths available to other hosts (C109-2) using the notification information T250.
  • An example of the update method will be described with reference to FIGS. Referring to the notification information T250, the number of paths (C253) of the logical device whose product number (C251) is “0001” and LDEV # (C252) is “1” is “3”.
  • the alternate path program 103 sets the values of the number of available paths (C109) of records with the production number (C110) and the LDEV # (C106) of “0001” and “1”, respectively, among the records of the alternate path management table T100. Identify. In the example of FIG. 5, this value is “1”.
  • the alternate path program uses the number “3” of the number of paths (C253) obtained from the notification information and the number of available paths obtained from the alternate path management table T100 in the number of available host paths (C109-2) in this record.
  • the difference (that is, “2”) of the value “1” of (C109) is stored.
  • the total number of normal access paths between each host other than the own host and the logical device is stored in the alternate path management table T100.
  • the integrated management program 301 changes the setting of the host 1 and the setting of the storage device 2 in accordance with the state of the inter-storage path 5 and the path between the host 1 and the storage device 2 (P-VOL or S-VOL).
  • P-VOL state of the inter-storage path 5 and the path between the host 1 and the storage device 2
  • step 5006 Yes
  • data cannot be replicated by the remote copy function. Therefore, in this case, the integrated management program 301 puts one of the P-VOL and S-VOL in a closed state (step 5017) and stops the remote copy function.
  • the number of normal access paths between the P-VOL and all the hosts 1 and the number of normal access paths between the S-VOL and all the hosts 1 are compared, and a logical device having a large number of normal access paths. Is changed to P-VOL, and S-VOL is blocked (step 5010 to step 5017). This is because the fault tolerance is improved when the setting of the computer system is changed so that the host 1 accesses a logical device having a large number of normal access paths.
  • step 5030 Yes or step 5038: Yes
  • the integrated management program 301 changes the pair status of the volume pair to the Duplex (S) state so that each host 1 accesses the P-VOL (steps 5037 to 5043).
  • the logical device having the larger number of normal access paths among the host 1 and P-VOL path and the host 1 and S-VOL path is changed to P-VOL ( Step 5051 to Step 5061). This is also because the fault tolerance is improved if the setting of the computer system is changed so that the host 1 preferentially accesses a logical device having a large number of normal access paths.
  • the integrated management program 301 may be executed on any one of the plurality of hosts 1. In that case, each host 1 notifies the host 1 on which the integrated management program 301 is executed, and the host 1 on which the integrated management program 301 is executed sets the access path of each host 1 based on the notified event. Or the setting of the storage device 2 is changed.

Abstract

A computer system which is an aspect of the present invention comprises a storage system and a plurality of hosts which access the storage system. The storage system further comprises a first storage device which has a first volume, and a second storage device which has a second volume. The storage system operates the first and second volumes as a volume pair. If an access fault has occurred when the hosts access the volume pair, the computer system identifies the fault occurrence site, and on the basis of information about the identified fault occurrence site, carries out changes of settings of access paths from each host to the volume pair, or a change of settings of the volume pair which the storage system operates.

Description

計算機システムComputer system
 本発明は、計算機システムに関する。 The present invention relates to a computer system.
 現在の計算機システムで用いられる多くのストレージ装置では、たとえばRAID(Redundant Arrays of Independent (or Inexpensive) Disks)技術等の高信頼化技術を採用することで、HDD単体の信頼性を超えた信頼性を提供している。しかし、近年の情報化社会の進化によって、上記RAID技術で提供可能な信頼性では不足する場面も現れてきている。 In many storage devices used in current computer systems, for example, by adopting high reliability technology such as RAID (Redundant Arrays of Independent (or Inexpensive) Disks) technology, the reliability beyond the reliability of HDD alone is achieved. providing. However, due to the recent evolution of the information society, there is a scene where the reliability that can be provided by the RAID technology is insufficient.
 このような状況に対応する高可用化技術として、たとえば特許文献1に開示されているように、複数(たとえば2台)のストレージ装置(以下、装置A、装置Bと呼ぶ)を用いた情報システムを構築し、装置Aのボリュームと装置Bのボリュームとにデータを二重書き(ミラーリング)する技術がある。特許文献1に開示の情報システムでは、ホストが装置Aのボリュームに対してデータを書き込むためのリクエスト(ライトコマンド)を発行すると、装置Aは装置Bのボリュームに、データの複製を格納する。装置Bのボリュームにデータの複製が格納された後、装置Aはホストにライトコマンドが完了した旨を返信する。これにより、装置Aのボリュームと装置Bのボリュームには常時同一データが格納された状態が維持される。 As a high availability technology corresponding to such a situation, as disclosed in Patent Document 1, for example, an information system using a plurality of (for example, two) storage apparatuses (hereinafter referred to as apparatus A and apparatus B). Is constructed, and data is double-written (mirrored) in the volume of the device A and the volume of the device B. In the information system disclosed in Patent Document 1, when the host issues a request (write command) for writing data to the volume of the device A, the device A stores a copy of the data in the volume of the device B. After the copy of the data is stored in the volume of the device B, the device A returns to the host that the write command is completed. As a result, the same data is always stored in the volume of the device A and the volume of the device B.
 このような二重化構成のシステムで求められる要件の1つに、ホストが誤ったデータにアクセスすることを防止できることが挙げられる。特許文献1では、装置Aと装置Bの間のリンクが切断された結果、装置Aと装置Bの間のボリューム二重化(コピー)が失敗した場合の例について開示されている。この場合、ホストが装置Aのボリュームを用いた運用をしばらく行った後、装置Aに障害が発生したために、ホストAが装置Bへのアクセスに切り替えることが考えられる。ただしその時点では装置Bのボリュームには、装置Aのボリュームよりも古いデータしか格納されていないため、ホストからのアクセスを受け付けないように制御することが望ましい。 One of the requirements for such a redundant system is that the host can be prevented from accessing wrong data. Patent Document 1 discloses an example in which volume duplication (copy) between device A and device B fails as a result of the link between device A and device B being disconnected. In this case, it is conceivable that the host A switches to access to the device B because a failure has occurred in the device A after the host has used the volume of the device A for a while. However, since only data older than the volume of the device A is stored in the volume of the device B at that time, it is desirable to perform control so that access from the host is not accepted.
 特許文献1に開示の情報システムでは、装置Aと装置Bが共通にアクセスできる障害検出用ボリュームを設け、それを用いることでこの問題を解決している。装置Aがボリューム二重化の処理に失敗すると、装置Aは障害検出用ボリュームの内容を読み出し、装置Bによって障害情報フラグが書き込まれているかチェックする。障害情報フラグが書き込まれていない場合には、装置Aが障害検出フラグを書き込み、その後ホストからのアクセス要求に係る処理を再開する。ただし障害情報フラグが書き込まれている場合には、装置AはホストにI/O失敗を返却する。これにより、ホストが古いデータを読み出すことを防止している。 In the information system disclosed in Patent Document 1, a problem detection volume that can be accessed in common by apparatus A and apparatus B is provided, and this problem is solved by using it. When the device A fails in the volume duplication processing, the device A reads the contents of the failure detection volume and checks whether the failure information flag is written by the device B. When the failure information flag is not written, the device A writes the failure detection flag, and then resumes the processing related to the access request from the host. However, if a failure information flag is written, apparatus A returns an I / O failure to the host. This prevents the host from reading old data.
 特許文献1に開示の情報システムでは、データを格納するストレージ装置(装置A、B)に加えて、障害検出用ボリュームを設ける必要がある。そのため、情報システムのコストが高くなる。逆にホスト側で、障害時の判定処理の一部を代行することで、障害検出用ボリュームを不要にすることも可能である。たとえば特許文献2には、ホストが正系ストレージにライト要求をした後、リモートコピー失敗の応答をストレージから受領すると(ストレージ装置間パス障害のケース)、ホストが正副両系のストレージにデータを二重書きするモードに遷移してデータ二重化状態を維持する。 In the information system disclosed in Patent Document 1, it is necessary to provide a failure detection volume in addition to the storage devices (devices A and B) for storing data. This increases the cost of the information system. On the other hand, it is possible to eliminate the failure detection volume by substituting a part of the determination process at the time of failure on the host side. For example, in Patent Document 2, when the host makes a write request to the primary storage and receives a remote copy failure response from the storage (in the case of an inter-storage device path failure), the host stores data in both the primary and secondary storages. Transition to the overwriting mode and maintain the data duplex state.
特開2009-266120号公報JP 2009-266120 A 特許第5057366号Patent No. 5057366
 高可用性を求められる情報システムの場合、ストレージのみならず、ホスト側の冗長化対策も必要である。たとえば、ホストを複数台用いてクラスタサーバとして運用する等の対策を行わないと、高可用性のある情報システムにならない。特許文献2に開示の技術では、ストレージ装置にアクセスするホストが複数台存在する情報システムの構成についての考慮がない。 For information systems that require high availability, not only storage but also host side redundancy measures are required. For example, unless measures such as operating a cluster server using a plurality of hosts are taken, a highly available information system cannot be obtained. In the technique disclosed in Patent Document 2, there is no consideration on the configuration of an information system in which a plurality of hosts that access a storage apparatus exist.
 本発明の一態様である計算機システムは、ストレージシステムと、このストレージシステムにアクセスする複数のホストを含む。ストレージシステムは、第1ボリュームを有する第1ストレージ装置と第2ボリュームを有する第2ストレージ装置とを有し、この第1、第2ボリュームをボリュームペアとして運用する。ホストがボリュームペアにアクセスする際にアクセス障害が発生した場合、計算機システムは障害発生部位を特定し、特定した障害発生部位の情報に基づいて、各ホストのボリュームペアへのアクセス経路の設定の変更、またはストレージシステムが運用するボリュームペアの設定変更を行う。 The computer system according to one aspect of the present invention includes a storage system and a plurality of hosts that access the storage system. The storage system has a first storage device having a first volume and a second storage device having a second volume, and operates the first and second volumes as a volume pair. If an access failure occurs when a host accesses a volume pair, the computer system identifies the location where the failure occurred, and changes the setting of the access route to the volume pair of each host based on the information on the identified failure location Or change the setting of the volume pair operated by the storage system.
 本発明によれば、低コストで可用性の高い計算機システムを構築できる。 According to the present invention, a highly available computer system can be constructed at low cost.
実施例に係る計算機システムのハードウェア構成図である。It is a hardware block diagram of the computer system which concerns on an Example. 実施例に係る計算機システムのソフトウェア構成図である。It is a software block diagram of the computer system which concerns on an Example. ペア管理テーブルの一例である。It is an example of a pair management table. LDEVステータス情報の一例である。It is an example of LDEV status information. 交替パス管理テーブルの一例である。It is an example of an alternate path management table. 統合パス管理テーブルの一例である。It is an example of an integrated path management table. ホストがP-VOLにライト要求を発行した時に行われる処理のフローチャート(1)である。It is a flowchart (1) of processing performed when a host issues a write request to a P-VOL. ホストがP-VOLにライト要求を発行した時に行われる処理のフローチャート(2)である。It is a flowchart (2) of processing performed when the host issues a write request to the P-VOL. ホストがP-VOLにライト要求を発行した時に行われる処理のフローチャート(3)である。It is a flowchart (3) of processing performed when the host issues a write request to the P-VOL. ホストがP-VOLにライト要求を発行した時に行われる処理のフローチャート(4)である。It is a flowchart (4) of processing performed when the host issues a write request to the P-VOL. ホストがS-VOLにライト要求を発行した時に行われる処理のフローチャート(1)である。It is a flowchart (1) of processing performed when the host issues a write request to the S-VOL. ホストがS-VOLにライト要求を発行した時に行われる処理のフローチャート(2)である。It is a flowchart (2) of processing performed when the host issues a write request to the S-VOL. ホストがS-VOLにライト要求を発行した時に行われる処理のフローチャート(3)である。It is a flowchart (3) of the processing performed when the host issues a write request to the S-VOL. ホストがS-VOLにライト要求を発行した時に行われる処理のフローチャート(4)である。It is a flowchart (4) of processing performed when the host issues a write request to the S-VOL. 統合管理プログラムで行われる処理のフローチャート(1)である。It is a flowchart (1) of the process performed by an integrated management program. 統合管理プログラムで行われる処理のフローチャート(2)である。It is a flowchart (2) of the process performed by an integrated management program. 統合管理プログラムで行われる処理のフローチャート(3)である。It is a flowchart (3) of the process performed by an integrated management program. 通知情報のフォーマットの例である。It is an example of a format of notification information.
 以下、本発明の実施例について、図面を用いて説明する。なお、以下に説明する実施例は特許請求の範囲に係る発明を限定するものではなく、また実施例の中で説明されている諸要素及びその組み合わせの全てが発明の解決手段に必須であるとは限らない。 Hereinafter, embodiments of the present invention will be described with reference to the drawings. The embodiments described below do not limit the invention according to the claims, and all the elements and combinations described in the embodiments are essential for the solution of the invention. Is not limited.
 また、以後の説明では、ホスト等の計算機で実行される処理について、「プログラム」を主語として説明を行う場合がある。実際には、プロセッサ(CPU(Central Processing Unit))がプログラムを実行することによって、プログラムに記述された処理が行われるので、プログラムを主語とする表現は、技術的に正確ではない。ただし説明が冗長になることを防ぐため、プログラムを主語にして処理の内容を説明することがある。また、プログラムの一部または全ては専用ハードウェアによって実現されてもよい。以下で説明される各種プログラムは、プログラム配布サーバや計算機が読み取り可能な記憶メディアによって提供され、プログラムを実行する各装置にインストールされてもよい。計算機が読み取り可能な記憶メディアとは、非一時的なコンピュータ可読媒体で、例えばICカード、SDカード、DVD等の不揮発性記憶媒体である。 In the following description, processing executed by a computer such as a host may be described using “program” as the subject. Actually, the processing described in the program is performed by the processor (CPU (Central Processing Unit)) executing the program, so the expression having the program as the subject is not technically accurate. However, in order to prevent the explanation from becoming redundant, the contents of the process may be explained with the program as the subject. Further, part or all of the program may be realized by dedicated hardware. Various programs described below may be provided by a storage medium that can be read by a program distribution server or a computer, and may be installed in each device that executes the program. The computer-readable storage medium is a non-transitory computer-readable medium such as a non-volatile storage medium such as an IC card, an SD card, or a DVD.
 実施例の説明に入る前に、以下で説明する実施例で用いられる各種用語について説明する。 Before starting the description of the embodiments, various terms used in the embodiments described below will be described.
 「ボリューム」とは、ストレージ装置や記憶デバイス等のターゲットデバイスが、ホストやストレージコントローラ等のイニシエータに対して提供する記憶領域(記憶空間)のことを意味する。また、以下で説明する実施例に係るストレージ装置は、複数の記憶デバイスから提供されるボリュームを用いて1つの論理的なボリュームを作成し、この論理的なボリュームをホストに提供することができる。この論理的なボリュームのことは、本明細書では「論理ボリューム」または「論理デバイス」と呼ばれる。 “Volume” means a storage area (storage space) provided by a target device such as a storage device or storage device to an initiator such as a host or storage controller. Further, the storage apparatus according to the embodiment described below can create one logical volume using volumes provided from a plurality of storage devices, and provide this logical volume to the host. This logical volume is referred to herein as a “logical volume” or “logical device”.
 「リモートコピー」とは、ストレージ装置のボリュームの複製を、別のストレージ装置のボリュームに作成する処理を意味する。以下で説明する実施例では、ストレージ装置がリモートコピーを実施する機能を有する。ストレージ装置は、ホストからボリュームに対するライトデータを受領すると、2台のストレージ装置の各ボリュームにライトデータを書き込む。 “Remote copy” means a process of creating a copy of a storage device volume in a volume of another storage device. In the embodiment described below, the storage apparatus has a function of performing remote copy. When the storage apparatus receives write data for the volume from the host, the storage apparatus writes the write data to each volume of the two storage apparatuses.
 また、リモートコピーにより、2つのボリュームにデータが格納される時、最初にデータが格納されるボリュームのことは「プライマリボリューム」または「P-VOL」と呼ばれる。そして2番目にデータが格納されるボリュームは「セカンダリボリューム」または「S-VOL」と呼ばれる。そしてプライマリボリュームとセカンダリボリュームのペアのことを「ボリュームペア」または「ペア」と呼ぶ。 Also, when data is stored in two volumes by remote copy, the volume in which data is stored first is called “primary volume” or “P-VOL”. The second volume in which data is stored is called “secondary volume” or “S-VOL”. A pair of a primary volume and a secondary volume is called a “volume pair” or “pair”.
 「アクセスパス」または「パス」とは、ホストが論理デバイスにアクセスする際のアクセス経路を意味する。また、ストレージ装置がリモートコピー機能を有する場合、データコピー元のストレージ装置からコピー先の論理デバイスに至るアクセス経路のことも、「パス」と呼ばれる。耐障害性を高めるために、計算機システムでは1論理デバイスへのアクセスパスが複数設けられる構成が採用されることがある。その場合、論理デバイスにアクセスするホストは、論理デバイスに対して設けられた任意のアクセスパスを用いてよい。 “Access path” or “path” means an access path when a host accesses a logical device. When the storage apparatus has a remote copy function, the access path from the data copy source storage apparatus to the copy destination logical device is also called a “path”. In order to improve fault tolerance, a computer system may employ a configuration in which a plurality of access paths to one logical device are provided. In that case, a host accessing the logical device may use an arbitrary access path provided for the logical device.
 「デバイスファイル」とは、ホスト上で実行されるプログラムが、ディスクなどの入出力装置にアクセスするためのインタフェースである。以下で説明する実施例における、デバイスドライバなどのプログラムは、ストレージ装置が提供する論理デバイスごとに固有のデバイスファイル名を対応付けて管理している。ホスト1上で実行されるプログラムは、デバイスファイル名を指定したアクセス要求を発行することで、デバイスファイル名に対応付けられた論理デバイスにアクセスすることができる。 “Device file” is an interface for a program executed on the host to access an input / output device such as a disk. In the embodiment described below, a program such as a device driver manages a unique device file name in association with each logical device provided by the storage apparatus. A program executed on the host 1 can access a logical device associated with a device file name by issuing an access request specifying a device file name.
 また、ホストから論理デバイスへのアクセスパスが複数存在する場合、アクセスパスごとにデバイスファイルが定義される。たとえば論理デバイスへのアクセスパスが2つ(第1アクセスパス、第2アクセスパス)がある場合、第1アクセスパスに対応付けられた第1デバイスファイルと、第2アクセスパスに対応付けられた第2デバイスファイルとが定義される。ホストは第1デバイスファイルを用いて論理デバイスにアクセスすると、アクセス要求やデータは、第1アクセスパスを経由して論理デバイスに送信される。またホストが第2デバイスファイルを用いて論理デバイスにアクセスすると、アクセス要求やデータは、第2アクセスパスを経由して論理デバイスに送信される。 Also, when there are multiple access paths from the host to the logical device, a device file is defined for each access path. For example, when there are two access paths to the logical device (first access path and second access path), the first device file associated with the first access path and the first access path associated with the second access path Two device files are defined. When the host accesses the logical device using the first device file, the access request and data are transmitted to the logical device via the first access path. When the host accesses the logical device using the second device file, the access request and data are transmitted to the logical device via the second access path.
 以下で、本発明の実施例に係る計算機システムの構成を説明していく。図1は、計算機システムのハードウェア構成を示す図である。 Hereinafter, the configuration of the computer system according to the embodiment of the present invention will be described. FIG. 1 is a diagram illustrating a hardware configuration of a computer system.
 以下で説明する実施例において、計算機システムを構成する各構成要素に参照番号が付されている。同種の構成物が計算機システム内に複数存在する場合、“a”や“b”等のsuffixが付された参照番号が用いられることがある。suffixが異なり参照番号が同一の構成物は、同じ種類の構成物であることを意味する。また、同種の構成物に共通の事項を説明する場合、suffixを略した参照番号を用いて構成物を特定することがある。 In the embodiments described below, reference numerals are given to the respective components constituting the computer system. When there are a plurality of components of the same type in the computer system, reference numbers with suffixes such as “a” and “b” may be used. Components having different suffixes and the same reference numbers mean the same type of components. In addition, when a matter common to the same type of components is described, the component may be specified using a reference number that abbreviates suffix.
 本発明の実施例に係る計算機システムは、複数のホスト1(図1ではホスト1a、1b)と、複数のストレージ装置(図1ではストレージ装置2a、2b)と、管理サーバ3を含む。ホスト1とストレージ装置2は、ネットワーク4で接続される。またホスト1、ストレージ装置2、管理サーバ3は、管理ネットワーク6で接続されている。またストレージ装置2aとストレージ装置2bは、ストレージ間パス(5a、5b)で接続される。 The computer system according to the embodiment of the present invention includes a plurality of hosts 1 ( hosts 1a and 1b in FIG. 1), a plurality of storage devices ( storage devices 2a and 2b in FIG. 1), and a management server 3. The host 1 and the storage device 2 are connected by a network 4. The host 1, the storage device 2, and the management server 3 are connected by a management network 6. The storage device 2a and the storage device 2b are connected by an inter-storage path (5a, 5b).
 ストレージ装置2aとストレージ装置2bは、ホスト1に記憶領域を提供する装置である。ストレージ装置2bのハードウェア構成はストレージ装置2aのハードウェア構成と同一である必要はないが、本実施例では、両者のハードウェア構成は同一である例を説明する。 The storage device 2a and the storage device 2b are devices that provide a storage area to the host 1. Although the hardware configuration of the storage device 2b is not necessarily the same as the hardware configuration of the storage device 2a, in this embodiment, an example in which both hardware configurations are the same will be described.
 ストレージ装置2aを例にとって、ストレージ装置2のハードウェア構成を説明する。ストレージ装置2aは、ストレージコントローラ(CTLと略記されることもある)21aと複数のDISK22aとを備える。ストレージコントローラ21aは、ホスト1やストレージ装置2bと通信を行うための通信インタフェース(本実施例ではポートと呼ぶ)や、ホスト1からのI/O要求を処理するためのプロセッサ、キャッシュメモリなどを備えた装置である。DISK22aは、ホスト1からのライトデータを格納する記憶デバイスである。一例として、HDD(Hard Disk Drive)をDISK22aに用いることができる。ただしHDD以外に、SSD(Solid State Drive)などの記憶デバイスが、DISK22aに用いられてもよい。 Taking the storage device 2a as an example, the hardware configuration of the storage device 2 will be described. The storage apparatus 2a includes a storage controller (sometimes abbreviated as CTL) 21a and a plurality of DISKs 22a. The storage controller 21a includes a communication interface (called a port in this embodiment) for communicating with the host 1 and the storage device 2b, a processor for processing an I / O request from the host 1, a cache memory, and the like. Device. The DISK 22 a is a storage device that stores write data from the host 1. As an example, an HDD (Hard Disk Drive) can be used for the DISK 22a. However, other than the HDD, a storage device such as an SSD (Solid State Drive) may be used for the DISK 22a.
 ストレージ装置2aとストレージ装置2bは、ストレージ間パス(5a、5b)を介して接続されている。ストレージ装置2aはこのストレージ間パス(5a、5b)を介して、ホスト1からストレージ装置2aに書き込まれたデータの複製を、ストレージ装置2bに送信することができる。 The storage device 2a and the storage device 2b are connected via inter-storage paths (5a, 5b). The storage device 2a can transmit a copy of data written from the host 1 to the storage device 2a to the storage device 2b via the inter-storage path (5a, 5b).
 図1では、各ストレージ装置2にCTL21が1つ、DISK22が2つ存在する構成が示されているが、この数に限定されるわけではない。ストレージ装置2内にCTL21が2つ以上存在してもよいし、またDISK22が3つ以上存在しても良い。 FIG. 1 shows a configuration in which each storage device 2 has one CTL 21 and two DISKs 22, but the number is not limited to this. Two or more CTLs 21 may exist in the storage apparatus 2 or three or more DISKs 22 may exist.
 ホスト1は、ストレージ装置2に対してデータのリードライト要求を行う計算機で、少なくともCPU11、メモリ12、HBA(Host Bus Adapter)13、そしてNIC(Network Interface Controller)14を有する。NIC14は、管理サーバ3等と通信を行うための通信インタフェース装置である。HBA13は、ストレージ装置2と通信するための通信インタフェース装置である。 The host 1 is a computer that makes a data read / write request to the storage device 2 and includes at least a CPU 11, a memory 12, an HBA (Host Bus Adapter) 13, and a NIC (Network Interface Controller) 14. The NIC 14 is a communication interface device for communicating with the management server 3 and the like. The HBA 13 is a communication interface device for communicating with the storage device 2.
 図1では、ホスト1aにHBA13aが2つ、ホスト1bにHBA13bが2つ存在する例が示されている。ただしHBA13の数は2つに限定されない。3つ以上のHBA13が各ホスト1に存在してもよい。あるいはホスト1にHBA13が1つだけ存在する構成もあり得る。また、各ホスト1が有するHBA13の数は同じでなくてもよい。ホスト1aがHBA13aを2つ有し、ホスト1bがHBA13aを3つ有する構成でもよい。 FIG. 1 shows an example in which two HBAs 13a exist in the host 1a and two HBAs 13b exist in the host 1b. However, the number of HBAs 13 is not limited to two. Three or more HBAs 13 may exist in each host 1. Alternatively, there may be a configuration in which only one HBA 13 exists in the host 1. Further, the number of HBAs 13 included in each host 1 may not be the same. The host 1a may have two HBAs 13a, and the host 1b may have three HBAs 13a.
 メモリ12は、例えばRAM(Random Access Memory)やROM(Read Only Memory)等の、高速アクセス可能な記憶デバイスである。ホスト1はメモリ12上にプログラムを読み込み、CPU11がそのプログラムを実行する。ホスト1は、メモリ12に加えて又は代えて、別種の記憶資源(HDDなど)を有してもよい。メモリ12は、記憶デバイスの一例である。 The memory 12 is a high-speed accessible storage device such as RAM (Random Access Memory) or ROM (Read Only Memory). The host 1 reads a program on the memory 12, and the CPU 11 executes the program. The host 1 may have another type of storage resource (such as an HDD) in addition to or instead of the memory 12. The memory 12 is an example of a storage device.
 管理サーバ3は、ストレージ装置2の管理操作を行うための計算機で、少なくともCPU31、メモリ32、NIC33、そしてヒューマンインタフェースデバイス(HID)34を有する。管理サーバ3は、メモリ32上にプログラムを読み込み、CPU31がそのプログラムを実行する。管理サーバ3は、メモリ32に加えて又は代えて、別種の記憶資源(HDDなど)を有してもよい。メモリ32は、記憶デバイスの一例である。NIC33は、ホスト1やストレージ装置2等と通信を行うための通信インタフェース装置である。HID34は、ユーザが管理サーバ3に対して情報の入出力処理を行うためのデバイス群であり、たとえばキーボードやディスプレイが含まれる。 The management server 3 is a computer for performing management operations of the storage apparatus 2 and includes at least a CPU 31, a memory 32, a NIC 33, and a human interface device (HID) 34. The management server 3 reads a program on the memory 32, and the CPU 31 executes the program. The management server 3 may have another type of storage resource (such as an HDD) in addition to or instead of the memory 32. The memory 32 is an example of a storage device. The NIC 33 is a communication interface device for communicating with the host 1, the storage device 2, and the like. The HID 34 is a device group for a user to perform input / output processing of information with respect to the management server 3, and includes, for example, a keyboard and a display.
 ネットワーク4は、たとえば1以上のファイバチャネルスイッチ41とファイバチャネルケーブル42で構成され、ホスト1とストレージ装置2間のデータ転送に用いられる。図1に示された、ホスト1とストレージ装置2間のトポロジーは一例であり、図1に示されたものとは異なるトポロジーが採用されてもよい。少なくともネットワーク4は、ホスト1aとホスト1bの両方がストレージ装置2a及び2bの記憶領域にアクセス可能に構成されていればよい。また図1では、1つのホスト1と1つのスイッチ41を接続するケーブル42、あるいは1つのストレージ装置2と1つのスイッチ41を接続するケーブル42が1本のみ記載されているが、複数本のケーブル42がホスト1とスイッチ41間(あるいはストレージ装置2とスイッチ41間)に設けられていてもよい。 The network 4 is composed of, for example, one or more fiber channel switches 41 and fiber channel cables 42, and is used for data transfer between the host 1 and the storage device 2. The topology between the host 1 and the storage apparatus 2 shown in FIG. 1 is an example, and a topology different from that shown in FIG. 1 may be adopted. At least the network 4 only needs to be configured so that both the host 1a and the host 1b can access the storage areas of the storage apparatuses 2a and 2b. In FIG. 1, only one cable 42 that connects one host 1 and one switch 41 or one cable 42 that connects one storage device 2 and one switch 41 is shown. 42 may be provided between the host 1 and the switch 41 (or between the storage apparatus 2 and the switch 41).
 ストレージ間パス(5a、5b)は、ストレージ装置2a、2b間のデータ転送に用いられる伝送路である。ストレージ間パス(5a、5b)には、例えばファイバチャネルケーブルが用いられる。ストレージ間パス(5a、5b)はそれぞれ、データ伝送の方向が決まっている。ストレージ間パス5aは、ストレージ装置2aがストレージ装置2bにデータ送信の指示、及びデータを送信する際に用いられる。一方ストレージ間パス5bは、ストレージ装置2bがストレージ装置2aにデータ送信の指示、及びデータを送信する際に用いられる。図1では、ストレージ間パス5aとストレージ間パス5bが、それぞれ1本のみ示されているが、ストレージ間パス5aとストレージ間パス5bはそれぞれ複数設けられていてもよい。 The inter-storage paths (5a, 5b) are transmission paths used for data transfer between the storage apparatuses 2a, 2b. For example, fiber channel cables are used for the inter-storage paths (5a, 5b). Each of the inter-storage paths (5a, 5b) has a determined data transmission direction. The inter-storage path 5a is used when the storage apparatus 2a transmits a data transmission instruction and data to the storage apparatus 2b. On the other hand, the inter-storage path 5b is used when the storage apparatus 2b transmits a data transmission instruction and data to the storage apparatus 2a. Although only one inter-storage path 5a and inter-storage path 5b are shown in FIG. 1, a plurality of inter-storage paths 5a and inter-storage paths 5b may be provided.
 管理ネットワーク6は、一例としてイーサネットを用いて構成されたネットワークで、ホスト1やストレージ装置2の管理情報のやり取りに用いられる。管理情報の詳細は後述する。 The management network 6 is a network configured using Ethernet as an example, and is used for exchanging management information of the host 1 and the storage device 2. Details of the management information will be described later.
 図2は、本実施例に係る計算機システムのソフトウェア構成図である。ストレージ装置2では、CTL21内のプロセッサが制御プログラム25を実行している。制御プログラム25が実行されることで、CTL21は1以上のDISK22の記憶領域を用いて、1または複数の論理的な記憶領域を形成する。本実施例ではこの論理的な記憶領域のことを、論理デバイス(LDEV)24と呼ぶ。ストレージ装置2はホスト1に対してLDEV24を提供し、ホスト1はストレージ装置2から提供されるLDEV24に対して、I/O要求(リードコマンド、ライトコマンド等)を発行する。CTL21はホスト1から受信したI/O要求に応じて、LDEV24に対するデータアクセスを実行する。 FIG. 2 is a software configuration diagram of the computer system according to the present embodiment. In the storage device 2, the processor in the CTL 21 executes the control program 25. By executing the control program 25, the CTL 21 forms one or a plurality of logical storage areas using one or more DISK 22 storage areas. In this embodiment, this logical storage area is called a logical device (LDEV) 24. The storage apparatus 2 provides the LDEV 24 to the host 1, and the host 1 issues an I / O request (read command, write command, etc.) to the LDEV 24 provided from the storage apparatus 2. The CTL 21 executes data access to the LDEV 24 in response to the I / O request received from the host 1.
 図2では、ストレージ装置2aが1つのLDEV24(LDEV24a-1)を有し、ストレージ装置2bが1つのLDEV24(LDEV24b-1)を有する構成が記載されている。ただしストレージ装置2は1より多くのLDEVを有することができる。以下では、LDEV24a-1のことを「LDEVa」、LDEV24b-1のことを「LDEVb」と表記することもある。 FIG. 2 shows a configuration in which the storage apparatus 2a has one LDEV 24 (LDEV 24a-1) and the storage apparatus 2b has one LDEV 24 (LDEV 24b-1). However, the storage apparatus 2 can have more than one LDEV. Hereinafter, the LDEV 24a-1 may be referred to as “LDEVa” and the LDEV 24b-1 may be referred to as “LDEVb”.
 ストレージ装置2はさらにリモートコピー処理を実施する機能を有する。本実施例に係るストレージ装置2は、LDEVaとLDEVbをボリュームペアとして管理している。またLDEVaがプライマリボリュームに設定され、LDEVbがセカンダリボリュームに設定されている。 The storage device 2 further has a function of performing remote copy processing. The storage apparatus 2 according to the present embodiment manages LDEVa and LDEVb as volume pairs. LDEVa is set as the primary volume, and LDEVb is set as the secondary volume.
 リモートコピー機能により、ボリュームペアであるLDEVaとLDEVbは、同一データが格納された状態が維持される。そのため、ストレージ装置2aに障害が発生して、ホスト30からLDEVaへのアクセスが不可能になった場合でも、ホスト1はストレージ装置2b(LDEVb)にアクセスすれば、ホスト1がLDEVaに格納したデータ(の複製)にアクセスできる。 By the remote copy function, LDEVa and LDEVb, which are volume pairs, maintain the same data stored state. Therefore, even if a failure occurs in the storage device 2a and the host 30 cannot access the LDEVa, if the host 1 accesses the storage device 2b (LDEVb), the data stored in the LDEVa by the host 1 (Replica).
 リモートコピーによる、ボリュームへのデータ書き込み処理の概要を説明する。ストレージ装置2はいわゆる同期型リモートコピーを実施する。ストレージ装置2aは、ホスト1からLDEVaの領域(仮にこの領域のアドレスをAとする)にデータの書き込みの要求(ライト要求)を受け付けると、LDEVaのアドレスAにデータを書き込むとともに、ストレージ間パス5aを介してストレージ装置2bに対し、LDEVbのアドレスAにホスト1から渡されたデータを書き込むことを指示する。ストレージ装置2bはこの指示(及びデータ)を受信すると、LDEVbのアドレスAにデータを書き込む。 Explains the outline of the data write process to the volume by remote copy. The storage apparatus 2 performs so-called synchronous remote copy. When the storage apparatus 2a accepts a data write request (write request) from the host 1 to the LDEVa area (assuming the address of this area is A), the storage apparatus 2a writes the data to the address A of the LDEVa and the inter-storage path 5a. The storage device 2b is instructed to write the data passed from the host 1 to the address A of the LDEVb. When the storage device 2b receives this instruction (and data), it writes the data to the address A of the LDEVb.
 LDEVbへのデータ書き込みが完了すると、ストレージ装置2bはストレージ装置2aに、データ書き込みが完了した旨の応答を返却する。応答はストレージ間パス5a経由で返却される。ストレージ装置2aはストレージ装置2bから応答を受領すると、ホスト1に対し、ホスト1から受領したデータの書き込み要求についての処理が完了した旨を応答する。このような処理が行われることにより、LDEVaとLDEVbには同じデータが格納されている状態が維持される。またストレージ装置2からホスト1に、ライト要求に対する応答が戻ってきた場合には、ボリュームペアを構成する2つのボリュームにデータが格納されたことが保証されている。 When the data writing to LDEVb is completed, the storage apparatus 2b returns a response to the effect that the data writing is completed to the storage apparatus 2a. The response is returned via the inter-storage path 5a. Upon receipt of the response from the storage device 2b, the storage device 2a responds to the host 1 that processing for the data write request received from the host 1 has been completed. By performing such processing, the state in which the same data is stored in LDEVa and LDEVb is maintained. Further, when a response to the write request is returned from the storage apparatus 2 to the host 1, it is guaranteed that data is stored in the two volumes constituting the volume pair.
 また、ホスト1がストレージ装置2bのLDEVbの領域(仮にこの領域のアドレスをBとする)にライト要求を発行した場合には、ストレージ装置2では以下の処理が行われる。ストレージ装置2bがホスト1からライト要求を受け付けると、ストレージ装置2bはまずストレージ間パス5bを介して、ストレージ装置2aに対してLDEVaのアドレスBにデータを書き込むことを指示する。また、指示と共にホスト1から渡されたデータも送信される。ストレージ装置2aはこの指示(及びデータ)を受信すると、LDEVaのアドレスBにデータを書き込む。 Further, when the host 1 issues a write request to the LDEVb area of the storage apparatus 2b (assuming that the address of this area is B), the storage apparatus 2 performs the following processing. When the storage apparatus 2b receives a write request from the host 1, the storage apparatus 2b first instructs the storage apparatus 2a to write data to the address B of the LDEVa via the inter-storage path 5b. Further, the data passed from the host 1 is transmitted together with the instruction. When the storage device 2a receives this instruction (and data), it writes the data to the address B of LDEVa.
 LDEVaへのデータ書き込みが完了すると、ストレージ装置2aはストレージ装置2bに応答(データ書き込みが完了した旨)を返却する。応答はストレージ間パス5b経由で返却される。ストレージ装置2bは、ストレージ装置2aから応答を受領してから、LDEVbのアドレスBにホスト1から受領したデータを書き込む。LDEVbへのデータ書き込みが完了すると、ストレージ装置2bはホスト1に対し、ホスト1から受領したデータの書き込み要求についての処理が完了した旨を応答する。 When the data writing to LDEVa is completed, the storage apparatus 2a returns a response (notifying that the data writing has been completed) to the storage apparatus 2b. The response is returned via the inter-storage path 5b. After receiving the response from the storage device 2a, the storage device 2b writes the data received from the host 1 to the address B of the LDEVb. When the data writing to the LDEVb is completed, the storage apparatus 2b responds to the host 1 that the processing for the data write request received from the host 1 has been completed.
 LDEVbより先にLDEVaにデータが書き込まれる理由は、LDEVaがプライマリボリュームだからである。つまりストレージ装置2は、ボリュームペアに対するライト要求を受け付けると、最初にプライマリボリュームにデータを書き込む。 The reason why data is written to LDEVa before LDEVb is that LDEVa is the primary volume. That is, when the storage apparatus 2 receives a write request for a volume pair, it first writes data to the primary volume.
 なお、上で説明した例は、計算機システムが正常に稼働している場合の例である。計算機システムの一部に障害が発生した場合には、上で説明した動作と異なる動作が行われることがある。たとえばストレージ間パス5bが断線する等の障害が発生した場合、ストレージ装置2bからストレージ装置2aへのデータ送信ができない。その場合本実施例に係る計算機システムは、ホスト1からLDEVbへのライト要求を受け付けないようにストレージ装置2の設定を変更することがある。この場合、ホスト1がLDEVaとLDEVbで構成されるボリュームペアにライト要求を発行する際、LDEVaのみにライト要求を発行するようになる。詳細は後述する。 Note that the example described above is an example when the computer system is operating normally. When a failure occurs in a part of the computer system, an operation different from the operation described above may be performed. For example, when a failure such as disconnection of the inter-storage path 5b occurs, data cannot be transmitted from the storage device 2b to the storage device 2a. In that case, the computer system according to the present embodiment may change the setting of the storage apparatus 2 so as not to accept a write request from the host 1 to the LDEVb. In this case, when the host 1 issues a write request to a volume pair composed of LDEVa and LDEVb, the write request is issued only to LDEVa. Details will be described later.
 続いてストレージ装置2が有する管理情報の、ペア管理テーブルT300について説明する。先に述べたとおり、ストレージシステム1では原則として、ホスト1からのライトデータを2つの論理デバイスに格納する。たとえばストレージ装置2aが、ホスト1からLDEV24aに対するライト要求及びライトデータを受信すると、ストレージ装置2aのLDEV24aとストレージ装置2bのLDEV24bとにライトデータが格納される。 Subsequently, the pair management table T300 of the management information that the storage apparatus 2 has will be described. As described above, in principle, the storage system 1 stores the write data from the host 1 in two logical devices. For example, when the storage apparatus 2a receives a write request and write data for the LDEV 24a from the host 1, the write data is stored in the LDEV 24a of the storage apparatus 2a and the LDEV 24b of the storage apparatus 2b.
 図3にペア管理テーブルT300の構成を示す。ペア管理テーブルT300は、各ストレージ装置2が有している管理情報である。ペア管理テーブルT300の各行には、1つのボリュームペアの情報が格納される。本実施例では、P-VOLの複製が格納されるS-VOLは、「P-VOLとペア関係にあるボリューム」あるいは「P-VOLのペアボリューム」と呼ばれる。逆に、あるS-VOLの複製元データが格納されている論理デバイスであるP-VOLのことも、「S-VOLとペア関係にあるボリューム」、「S-VOLのペアボリューム」と呼ばれる。 FIG. 3 shows the configuration of the pair management table T300. The pair management table T300 is management information that each storage apparatus 2 has. Information on one volume pair is stored in each row of the pair management table T300. In this embodiment, the S-VOL in which the copy of the P-VOL is stored is called “a volume that is paired with the P-VOL” or “a pair volume of the P-VOL”. Conversely, a P-VOL that is a logical device in which copy data of an S-VOL is stored is also referred to as “a volume that is paired with an S-VOL” or “a pair volume of an S-VOL”.
 ストレージ装置2では各ペアに、ペア番号(Pair#)と呼ばれる識別子を付して管理している。またストレージ装置2では各論理デバイスにも、論理デバイス番号(LDEV#)と呼ばれる識別子を付して管理している。本実施例では、各識別子に0以上の整数値が用いられる。以下ではペア番号がn(nは0以上の整数値)のボリュームペアのことを、「ペア#n」と表記する。またLDEV#がnの論理デバイスは、「LDEV#n」と表記される。 The storage apparatus 2 manages each pair with an identifier called a pair number (Pair #). In the storage apparatus 2, each logical device is managed with an identifier called a logical device number (LDEV #). In this embodiment, an integer value of 0 or more is used for each identifier. Hereinafter, a volume pair whose pair number is n (n is an integer value of 0 or more) is denoted as “pair #n”. A logical device whose LDEV # is n is expressed as “LDEV # n”.
 Pair#(C301)にはペア番号が格納される。そして、PDKC#(C303)、P-VOL#(C304)にはそれぞれ、ボリュームペアに属するP-VOLの情報(P-VOLの属するストレージ装置2の製番(シリアル番号)であるPDKC#、P-VOLのLDEV#)が格納される。またSDKC#(C305)、S-VOL#(C306)にはそれぞれ、ボリュームペアに属するS-VOLの情報(S-VOLの属するストレージ装置2の製番であるSDKC#、S-VOLのLDEV#)が格納される。 Pair number is stored in Pair # (C301). Then, PDKC # (C303) and P-VOL # (C304) include information on P-VOL belonging to the volume pair (PDKC # and PDK which are the serial numbers of the storage apparatus 2 to which the P-VOL belongs). -VOL LDEV #) is stored. In addition, the SDKC # (C305) and S-VOL # (C306) include information on the S-VOL belonging to the volume pair (SDKC #, which is the serial number of the storage apparatus 2 to which the S-VOL belongs, and LDEV # of the S-VOL, respectively). ) Is stored.
 Pair Status(C302)には、ボリュームペアの状態(ペアステータス)が格納される。各ボリュームペアは、以下に説明するいずれかの状態を有する。これらの状態のことを本実施例では「ペアステータス」と呼ぶ。 The pair status (pair status) is stored in Pair Status (C302). Each volume pair has one of the states described below. These states are referred to as “pair status” in this embodiment.
 (a)Initial-Copy状態:
 ストレージ装置2は、ボリュームペアを形成する際、最初にP-VOLの内容をすべてS-VOLへとコピーする処理(初期コピー処理と呼ばれる)を行う。この処理中の状態のことを「Initial-Copy状態」と呼ぶ。
(A) Initial-Copy state:
When forming a volume pair, the storage apparatus 2 first performs a process of copying all the contents of the P-VOL to the S-VOL (referred to as an initial copy process). This state during processing is referred to as an “Initial-Copy state”.
 (b)Duplex状態:
 初期コピー処理または後述する再同期処理により、P-VOLの内容とS-VOLの内容が同一になったボリュームペアの状態を「Duplex状態」と呼ぶ。ボリュームペアがDuplex状態の時、ホスト1はそのボリュームペアのP-VOLとS-VOLの何れにもライト要求を発行することができる。ホスト1がボリュームペアのP-VOLとS-VOLの何れにデータの書き込みを行っても、ストレージ装置2はP-VOLとS-VOLの両方にデータを格納する。
(B) Duplex state:
The state of the volume pair in which the contents of the P-VOL and the contents of the S-VOL are the same by the initial copy process or the resynchronization process described later is referred to as a “Duplex state”. When the volume pair is in Duplex state, the host 1 can issue a write request to either the P-VOL or S-VOL of the volume pair. Regardless of whether the host 1 writes data to the P-VOL or S-VOL of the volume pair, the storage apparatus 2 stores the data in both the P-VOL and S-VOL.
 (c)Duplex(S)状態:
 Duplex状態と同様、Duplex(S)状態は、P-VOLの内容とS-VOLの内容が同一になったボリュームペアの状態を意味する。ホスト1からDuplex(S)状態にあるボリュームペアのP-VOLに対して書き込まれたデータは、S-VOLにも複製される。ただしDuplex(S)状態にあるボリュームペアは、P-VOLはライト可能状態にあるが、S-VOLはホスト1からのライトが不可能な状態にある。そのためボリュームペアがDuplex(S)状態にある場合、ホスト1はそのボリュームペアのP-VOLにのみライト要求を発行する必要がある(S-VOLに対してライトしてはいけない)。またこの時、S-VOLはリード可能な状態である。
(C) Duplex (S) state:
Similar to the Duplex state, the Duplex (S) state means a state of a volume pair in which the contents of the P-VOL and the S-VOL are the same. Data written from the host 1 to the P-VOL of the volume pair in the Duplex (S) state is also copied to the S-VOL. However, in the volume pair in the Duplex (S) state, the P-VOL is in a writable state, but the S-VOL is in a state in which writing from the host 1 is impossible. Therefore, when the volume pair is in the Duplex (S) state, the host 1 needs to issue a write request only to the P-VOL of that volume pair (do not write to the S-VOL). At this time, the S-VOL is in a readable state.
 (d)Suspend状態:
 ボリュームペアのペアステータスが、上で述べた(a)~(c)の状態にある時は、ボリュームペアに対して書き込まれるデータはP-VOLとS-VOLの両方に格納される。一方、P-VOLの内容がS-VOLに反映されない状態のことを「Suspend状態」と呼ぶ。たとえばストレージ装置2aとストレージ装置2bを接続する伝送線が遮断されて、コピーが不可能になった場合に、ボリュームペアは「Suspend状態」になる。あるいはユーザからの指示によって、ボリュームペアが「Suspend状態」になることもある。この状態では、ストレージ装置2はP-VOLとS-VOLがペア関係にあるという事は管理している(ペア管理テーブルT300にP-VOLとS-VOLの情報を格納したままにする)。また、たとえばストレージ装置2aがペアボリューム(たとえばP-VOL)に対するライト要求を受け付けると、ストレージ装置2aはP-VOLへのデータライトは実施するが、ストレージ装置2b(ペアボリューム)へのデータ複製を実施しない。ストレージ装置2bがライト要求を受け付けた時も同様である。
(D) Suspend state:
When the pair status of the volume pair is in the states (a) to (c) described above, data written to the volume pair is stored in both the P-VOL and S-VOL. On the other hand, a state in which the contents of the P-VOL are not reflected in the S-VOL is referred to as a “Suspend state”. For example, when the transmission line connecting the storage apparatus 2a and the storage apparatus 2b is cut off and copying becomes impossible, the volume pair becomes “Suspend state”. Alternatively, the volume pair may enter the “Suspend state” according to an instruction from the user. In this state, the storage apparatus 2 manages that the P-VOL and S-VOL are in a pair relationship (P-VOL and S-VOL information remains stored in the pair management table T300). For example, when the storage apparatus 2a receives a write request for a pair volume (for example, P-VOL), the storage apparatus 2a performs data write to the P-VOL, but replicates data to the storage apparatus 2b (pair volume). Not implemented. The same applies when the storage apparatus 2b receives a write request.
 (e)Duplex-Pending状態:
 ボリュームペアが、Suspend状態からDuplex状態に遷移するまでの過渡状態にある場合、そのボリュームペアの状態は「Duplex-Pending状態」と呼ばれる。この状態の時、Suspend状態にあったボリュームペアについて、P-VOLとS-VOLの内容を一致(同期)させるため、P-VOL(またはS-VOL)のデータがS-VOL(またはP-VOL)へとコピーされる。コピーが完了した時点で、そのボリュームペアの状態は「Duplex状態」になる。なお、「Suspend状態」のボリュームペアをDuplex状態に遷移させる処理のことを、再同期処理(リシンク処理)と呼ぶ。
(E) Duplex-Pending state:
When the volume pair is in a transitional state from the Suspend state to the Duplex state, the state of the volume pair is referred to as a “Duplex-Pending state”. In this state, the P-VOL (or S-VOL) data is S-VOL (or P-VOL) to match (synchronize) the contents of the P-VOL and S-VOL for the volume pair that was in the Suspend state. VOL). When the copying is completed, the state of the volume pair becomes “Duplex state”. The process of transitioning the “Suspend state” volume pair to the Duplex state is referred to as resynchronization processing (resync processing).
 ペア管理テーブルT300のPair Status(C302)には、上で説明した5つの状態のいずれかが格納される。Pair Status(C302)に0が格納されている場合、ボリュームペアの状態が「Initial-Copy状態」であることを表し、1が格納されている場合、ボリュームペアの状態が「Duplex状態」であることを表す。またPair Status(C302)に2が格納されている場合、ボリュームペアの状態が「Duplex(S)状態」であることを表し、3が格納されている場合、ボリュームペアの状態が「Suspend状態」であることを表し、4が格納されている場合、ボリュームペアの状態が「Duplex-Pending状態」であることを表す。 One of the five states described above is stored in the Pair Status (C302) of the pair management table T300. When 0 is stored in Pair Status (C302), the status of the volume pair is “Initial-Copy status”. When 1 is stored, the status of the volume pair is “Duplex status” Represents that. Further, when 2 is stored in the Pair Status (C302), it indicates that the volume pair state is “Duplex (S) state”. When 3 is stored, the state of the volume pair is “Suspend state”. If 4 is stored, the volume pair status is “Duplex-Pending status”.
 なお、上では「Initial-Copy状態」と「Duplex-Pending状態」がそれぞれ別な状態であるとして説明した。ただしボリュームペアが「Initial-Copy状態」または「Duplex-Pending状態」である時、いずれもP-VOLとS-VOLの内容が同期中であるという点で一致している。そのため、必ずしも2つの状態を分けて管理する必要はなく、1つの状態として管理するようにしてもよい。 In the above description, it is assumed that the “Initial-Copy state” and the “Duplex-Pending state” are different states. However, when the volume pair is in the “Initial-Copy state” or the “Duplex-Pending state”, both of them agree that the contents of the P-VOL and the S-VOL are in synchronization. Therefore, it is not always necessary to manage the two states separately, and they may be managed as one state.
 またストレージ装置2はボリュームペアについての情報に加えて、各論理デバイスのアクセス可否についての情報を管理する。そのためにストレージ装置2は、LDEVステータス情報T400を持つ。 In addition to the information about the volume pair, the storage apparatus 2 manages information about whether each logical device can be accessed. Therefore, the storage apparatus 2 has LDEV status information T400.
 図4にLDEVステータス情報T400の一例を示す。Mode(C402)には、LDEV#(C401)で特定される論理デバイスの状態が格納される。本明細書では、論理デバイスがホスト1からアクセス可能な状態にある場合、当該論理デバイスの状態は「Valid状態」と呼ばれる。逆に論理デバイスがホスト1からアクセス可能でない状態の場合(リード及びライトができない場合。たとえば論理デバイスに障害が発生した場合である)、当該論理デバイスの状態は「Invalid状態」または「閉塞状態」と呼ばれる。 FIG. 4 shows an example of the LDEV status information T400. Mode (C402) stores the state of the logical device specified by LDEV # (C401). In this specification, when a logical device is in a state accessible from the host 1, the state of the logical device is referred to as a “Valid state”. Conversely, when the logical device is not accessible from the host 1 (when reading and writing cannot be performed, for example, when a failure occurs in the logical device), the state of the logical device is “Invalid state” or “Blocked state”. Called.
 Mode(C402)には、0または1のいずれかの状態をとり得る。0の場合、論理デバイスの状態が「Valid状態」であることを表し、1の場合、論理デバイスの状態が「Invalid状態」であることを表す。なお、ボリュームペアのペアステータスが“Duplex状態”の場合には、当該ボリュームペアに属するP-VOL及びS-VOLの状態はいずれも「Valid状態」である。 Mode (C402) can be either 0 or 1. 0 indicates that the state of the logical device is “Valid state”, and 1 indicates that the state of the logical device is “Invalid state”. When the pair status of the volume pair is “Duplex state”, the states of the P-VOL and S-VOL belonging to the volume pair are “Valid state”.
 LDEVステータス情報T400は、各ストレージ装置2が有している情報である。そしてLDEVステータス情報T400には、1つのストレージ装置2が有する論理デバイスの情報のみが格納される(たとえばストレージ装置2aの有するLDEVステータス情報T400には、ストレージ装置2aの有する論理デバイスのステータスだけが格納され、ストレージ装置2bの有するLDEVステータス情報T400には、ストレージ装置2bの有する論理デバイスのステータスだけが格納される)。 The LDEV status information T400 is information that each storage device 2 has. The LDEV status information T400 stores only the information on the logical device that one storage apparatus 2 has (for example, the LDEV status information T400 that the storage apparatus 2a has stores only the status of the logical device that the storage apparatus 2a has. In the LDEV status information T400 of the storage device 2b, only the status of the logical device of the storage device 2b is stored).
 計算機システムが図2の構成である場合を例にとって、ペアステータス、論理デバイスのステータスの遷移について説明する。ホスト1がLDEVaにライト要求を発行した時、もしLDEVa(LDEVaを構成するDISK22a)に障害が発生しているために、CTL21aがLDEVaへの書き込みに失敗した場合、CTL21aはホスト1にエラーを返却するとともに、LDEVaの状態を閉塞状態にする(Mode(C402)を“1”にする)。またLDEVaがペアボリュームである場合、そのボリュームペアのPair Status(C302)を“2”(Suspend状態)に変更する。 Taking the case where the computer system has the configuration of FIG. 2 as an example, transition of pair status and status of logical device will be described. When the host 1 issues a write request to the LDEVa, if the CTL 21a fails to write to the LDEVa because of a failure in the LDEVa (DISK 22a constituting the LDEVa), the CTL 21a returns an error to the host 1 At the same time, the LDEVa is closed (Mode (C402) is set to “1”). If the LDEVa is a pair volume, the Pair Status (C302) of the volume pair is changed to “2” (Suspend state).
 また、LDEVaに障害が発生していない場合でも、Pair Status(C302)が“2”(Suspend状態)に変更される場合もある。たとえばホスト1がLDEVaにライト要求を発行した時、ストレージ間パス5aに障害が発生している場合、あるいはLDEVaとペア関係にあるLDEVbに障害が発生している場合、CTL21aはLDEVbへのコピー(データ書き込み)に失敗する。この場合CTL21aは、LDEVaの状態(Mode(C402))は変更しないが、ボリュームペアのPair Status(C302)を“2”(Suspend状態)に変更する。 Also, even when no failure has occurred in LDEVa, Pair Status (C302) may be changed to “2” (Suspend state). For example, when the host 1 issues a write request to LDEVa, if a failure occurs in the inter-storage path 5a, or if a failure occurs in LDEVb that is paired with LDEVa, the CTL 21a copies to LDEVb ( (Data writing) fails. In this case, the CTL 21a does not change the LDEVa state (Mode (C402)), but changes the Pair Status (C302) of the volume pair to “2” (Suspend state).
 続いてホスト1が実行する各種プログラムについて、図2を用いて説明する。ホスト1のメモリ12には少なくとも、アプリケーションプログラム(AP)102、交替パスプログラム103、デバイスドライバ104が格納されている。 Next, various programs executed by the host 1 will be described with reference to FIG. The memory 12 of the host 1 stores at least an application program (AP) 102, an alternate path program 103, and a device driver 104.
 デバイスドライバ104は、上位のプログラム(AP102、交替パスプログラム103)に対して、LDEV24へのアクセスインタフェースを提供するためのプログラムである。デバイスドライバ104は、デバイスファイルにLDEV24(正確には、LDEV24へのアクセスパス)をマップする。上位のプログラムがデバイスファイルを指定してリードまたはライト要求を発行すると、デバイスドライバ104は指定されたデバイスファイルにマップされたLDEV24に対して、リードコマンドまたはライトコマンドを発行する。 The device driver 104 is a program for providing an access interface to the LDEV 24 for a higher-level program (AP 102, alternate path program 103). The device driver 104 maps the LDEV 24 (more precisely, the access path to the LDEV 24) to the device file. When the upper program designates a device file and issues a read or write request, the device driver 104 issues a read command or a write command to the LDEV 24 mapped to the designated device file.
 本実施例に係る計算機システムでは、デバイスドライバ104は、LDEVaをデバイスファイルsda(141)とデバイスファイルsdb(142)にマップし、LDEVbをデバイスファイルsdc(143)とsde(144)にマップしている。なお、以下ではデバイスドライバ104がLDEV24をマップしているデバイスファイル(デバイスファイルsda(141)~sde(144))のことを、「scsiデバイスファイル」と呼ぶ。 In the computer system according to this embodiment, the device driver 104 maps LDEVa to the device file sda (141) and device file sdb (142), and maps LDEVb to the device files sdc (143) and sde (144). Yes. Hereinafter, device files (device files sda (141) to sde (144)) to which the device driver 104 maps the LDEV 24 are referred to as “scsi device files”.
 scsiデバイスファイルsda(141)及びsdb(142)にLDEVaがマップされているのは、ホスト1からストレージ装置2aのLDEVaに至るアクセスパスが2つ存在するためである。ホスト1にはHBA13が2つ存在し、2つのHBA13のうち一方のHBA13を介してLDEVaにアクセスする経路がscsiデバイスファイルsda(141)に関連付けられ、そしてもう一方のHBA13を介してLDEVaにアクセスする経路がscsiデバイスファイルsdb(142)に関連付けられている。 The reason why the LDEVa is mapped to the scsi device files sda (141) and sdb (142) is because there are two access paths from the host 1 to the LDEVa of the storage device 2a. There are two HBAs 13 in the host 1, a path for accessing LDEVa via one of the two HBAs 13 is associated with the scsi device file sda (141), and access to LDEVa via the other HBA 13 Is associated with the scsi device file sdb (142).
 なお、ホスト1と論理デバイス間に形成されるアクセスパスの本数は、ホスト1のハードウェア構成、ストレージ装置2の設定、あるいはネットワーク4(ファイバチャネルスイッチ41など)の設定等に依存して変動する。ここでは一例として、ホスト1からLDEVaに至るアクセスパスの数が2本存在する場合の例を説明しただけで、3以上のアクセスパスが存在してもよい。たとえばホスト1からLDEVaに至るアクセスパスの数が4つ存在する場合、LDEVaには4つのscsiデバイスファイルがマップされる。 The number of access paths formed between the host 1 and the logical device varies depending on the hardware configuration of the host 1, the setting of the storage device 2, or the setting of the network 4 (such as the fiber channel switch 41). . Here, as an example, only the case where there are two access paths from the host 1 to the LDEVa has been described, and three or more access paths may exist. For example, when there are four access paths from the host 1 to LDEVa, four scsi device files are mapped to LDEVa.
 交替パスプログラム103は、デバイスファイルに対するアクセス経路を動的に切り替えるプログラムである。交替パスプログラム103は、AP102等の上位のプログラムに対し、デバイスファイルsddlma(131)を提供する。本実施例では、交替パスプログラム103が提供するデバイスファイルは「デバイスファイル」と呼び、デバイスドライバ104がLDEV24へのアクセスパスをマップするために用いるデバイスファイル(デバイスファイルsda(141)~sde(144))は「scsiデバイスファイル」と呼び、両者を区別する。 The alternate path program 103 is a program that dynamically switches the access path to the device file. The alternate path program 103 provides a device file sddlma (131) to a higher-level program such as the AP 102. In this embodiment, the device file provided by the alternate path program 103 is called “device file”, and the device driver 104 uses the device files (device files sda (141) to sde (144) used to map the access path to the LDEV 24. )) Is called “scsi device file” and is distinguished from each other.
 デバイスファイルsddlma(131)には、LDEVaにマップされているscsiデバイスファイルsda(141)とsdb(142)と、そしてLDEVaのペアボリュームであるLDEVbにマップされているsdc(143)とsde(144)がマップされている。つまり交替パスプログラム103は、1つのボリュームペアに対して1つのデバイスファイル(たとえばsddlma(131))を生成し、AP102等に提供する。ホスト1(のAP102)は論理デバイスにアクセスする時、デバイスファイル(たとえばsddlma(131))を用いてアクセス要求を発行する。この時点で、ホスト1のアクセス先論理デバイスがP-VOLかS-VOLかは定まっていない。つまりホスト1(のAP102)は実質的に、ボリュームペアに対してアクセス要求を発行している。そのため本明細書では、ホスト1がボリュームペアのP-VOLまたはS-VOLにアクセスする場合、「ボリュームペアにアクセスする」と呼ぶこともある。 The device file sddlma (131) includes scsi device files sda (141) and sdb (142) mapped to LDEVa, and sdc (143) and sde (144) mapped to LDEVb, which is a pair volume of LDEVa. ) Is mapped. That is, the alternate path program 103 generates one device file (for example, sddlma (131)) for one volume pair and provides it to the AP 102 or the like. When the host 1 (the AP 102) accesses the logical device, it issues an access request using the device file (for example, sdlma (131)). At this time, whether the access destination logical device of the host 1 is P-VOL or S-VOL has not been determined. That is, the host 1 (its AP 102) substantially issues an access request to the volume pair. Therefore, in this specification, when the host 1 accesses the P-VOL or S-VOL of the volume pair, it may be referred to as “accessing the volume pair”.
 たとえばAP102がsddlma(131)に対してアクセス(リードまたはライト)を行うと、交替パスプログラム103はsda(141)~sde(144)のいずれか一つに対してアクセスを行う。たとえば交替パスプログラム103がsda(141)にデータライトを行うと、デバイスドライバ104はデータをストレージ装置2aのLDEVaに書き込む。LDEVaに書き込まれたデータは、先に述べたように、ストレージ装置2のリモートコピー機能によって、LDEVbにも複製される。 For example, when the AP 102 accesses (reads or writes) the sddlma (131), the alternate path program 103 accesses any one of the sda (141) to sde (144). For example, when the alternate path program 103 performs data write to sda (141), the device driver 104 writes data to the LDEVa of the storage apparatus 2a. The data written to LDEVa is also copied to LDEVb by the remote copy function of the storage apparatus 2 as described above.
 またLDEVa(sda(141))がアクセス不可能だった場合、ストレージ装置2aから交替パスプログラム103にエラーが返却されるが、その場合交替パスプログラム103はその他のscsiデバイスファイル(sdb(142)~sde(144))を用いてLDEVaへのアクセスを再試行する。アクセス先の変更はAP102には透過的に行われるので、AP102は処理を停止する必要がなく、計算機システムは無停止で業務継続できる。 If the LDEVa (sda (141)) is inaccessible, an error is returned from the storage apparatus 2a to the alternate path program 103. In this case, the alternate path program 103 stores other scsi device files (sdb (142) to Retry access to LDEVa using sde (144)). Since the access destination is changed transparently to the AP 102, the AP 102 does not need to stop the processing, and the computer system can continue the operation without stopping.
 ただし、障害の原因によっては、その他のscsiデバイスファイルを用いてLDEVへのアクセスを再試行しても、交替パスプログラム103のLDEVへのアクセスは失敗することがある。その場合には上で述べたものよりも複雑な処理が行われる。この処理の詳細は後述する。 However, depending on the cause of the failure, even if the access to the LDEV is retried using another scsi device file, the access to the LDEV of the alternate path program 103 may fail. In that case, more complicated processing than that described above is performed. Details of this processing will be described later.
 AP102は、LDEV24に格納されるデータのアクセスを行うプログラムである。AP102は任意の種類のプログラムであり得る。たとえばデータベース管理システム(DBMS)であってもよいし、あるいはファイルシステムでも良い。あるいは、クラスタソフトウェア(ホスト1aが障害によりダウンした時に、同じクラスタソフトウェアが実行されているホスト1bで業務継続するプログラム)であってもよい。また、ホスト1で複数種類のAP102が実行されていてもよい。 The AP 102 is a program that accesses data stored in the LDEV 24. The AP 102 can be any type of program. For example, it may be a database management system (DBMS) or a file system. Alternatively, it may be cluster software (a program that continues business on the host 1b on which the same cluster software is being executed when the host 1a is down due to a failure). A plurality of types of APs 102 may be executed on the host 1.
 本実施例に係る計算機システムでは、ホスト1aはLDEVa、LDEVbのいずれにもアクセス可能に構成されている。同様にホスト1bも、LDEVa、LDEVbのいずれにもアクセス可能に構成されている。なお、ここではボリュームペアが1つだけ存在する構成例を説明したが、ストレージ装置2a、2bに複数のボリュームペアが存在していても良い。 In the computer system according to the present embodiment, the host 1a is configured to be accessible to both LDEVa and LDEVb. Similarly, the host 1b is configured to be accessible to both LDEVa and LDEVb. Here, the configuration example in which only one volume pair exists has been described, but a plurality of volume pairs may exist in the storage apparatuses 2a and 2b.
 一方、管理サーバ3では、統合管理プログラム301が実行される。統合管理プログラム301は、各ホスト1で実行される交替パスプログラム103から、計算機システムの情報を取得し、取得した情報に基づいて、ストレージ装置2のボリュームペアの設定や、各ホスト1の交替パスプログラム103の設定の変更を行う。統合管理プログラム301がストレージ装置2や各ホスト1の設定の変更を行う時、管理ネットワーク6経由で指示を発行する。 On the other hand, in the management server 3, the integrated management program 301 is executed. The integrated management program 301 acquires computer system information from the alternate path program 103 executed on each host 1, and sets the volume pair of the storage device 2 and the alternate path for each host 1 based on the acquired information. The setting of the program 103 is changed. When the integrated management program 301 changes the settings of the storage apparatus 2 and each host 1, it issues an instruction via the management network 6.
 続いて、ホスト1のプログラム(交替パスプログラム103)が使用する管理情報の内容について説明する。図5には、交替パス管理テーブルT100の内容の一例が示されている。交替パス管理テーブルT100は、交替パスプログラム103が用いる管理情報を格納するためのテーブルで、ペア#(C102)、デバイスファイルC103、scsiデバイスファイルC104、パスID(C105)、LDEV#(C106)、属性(C107)、パスステータス(C108)、利用可能パス本数(C109)、他ホスト利用可能パス本数(C109-2)、製番(C110)、ポート名(C111)、ボリュームペア状態(C112)、ホストーストレージ間全パス障害フラグ(C113)、P→S間全パス障害フラグ(C114)、S→P間全パス障害フラグ(C115)のカラムを有する。 Next, the contents of the management information used by the host 1 program (alternate path program 103) will be described. FIG. 5 shows an example of the contents of the alternate path management table T100. The alternate path management table T100 is a table for storing management information used by the alternate path program 103. The pair # (C102), the device file C103, the scsi device file C104, the path ID (C105), the LDEV # (C106), Attribute (C107), path status (C108), number of available paths (C109), number of paths available to other hosts (C109-2), product number (C110), port name (C111), volume pair status (C112), The host-storage all path failure flag (C113), the P → S all path failure flag (C114), and the S → P all path failure flag (C115) are provided.
 各行(レコード)には、ホスト1が有するアクセスパス(LDEVへのアクセスパス)の情報が格納される。パスID(C105)は、ホスト1で管理されるアクセスパスの識別番号で、各アクセスパスにはホスト1で一意な識別番号が用いられる。LDEV#(C106)は、アクセスパスによってアクセスできる論理デバイスの論理デバイス番号である。scsiデバイスファイルC104には、アクセスパスに定義されたscsiデバイスファイルの名称が格納される。一方デバイスファイルC103は、交替パスプログラム103が上位のプログラムに提供するデバイスファイルの名称が格納される。デバイスファイル(C103)に格納されている名称のデバイスファイルには、scsiデバイスファイル(C104)に格納されている名称のscsiデバイスファイルがマップされている。ペア#(C102)には、アクセスパスにマッピングされているLDEV(LDEV(C106))が属するボリュームペアのペア番号が格納される。 Each row (record) stores information of an access path (access path to LDEV) that the host 1 has. The path ID (C105) is an identification number of an access path managed by the host 1, and an identification number unique to the host 1 is used for each access path. LDEV # (C106) is a logical device number of a logical device that can be accessed through an access path. The scsi device file C104 stores the name of the scsi device file defined in the access path. On the other hand, the device file C103 stores the name of the device file that the alternate path program 103 provides to the upper program. The scsi device file with the name stored in the scsi device file (C104) is mapped to the device file with the name stored in the device file (C103). The pair # (C102) stores the pair number of the volume pair to which the LDEV (LDEV (C106)) mapped to the access path belongs.
 属性(C107)は論理デバイスの属性についての情報が格納される欄である。“P-VOL”が格納されている場合、論理デバイスがプライマリボリュームであることを意味し、“S-VOL”が格納されている場合、論理デバイスがセカンダリボリュームであることを意味する。 Attribute (C107) is a column for storing information on the attribute of the logical device. When “P-VOL” is stored, it means that the logical device is a primary volume, and when “S-VOL” is stored, it means that the logical device is a secondary volume.
 パスステータス(C108)は、アクセスパスの状態を表す。“Success”が格納されている場合、論理デバイスへのアクセスパスが正常であることを意味する。また“Failure”が格納されている場合、論理デバイスへのアクセスパスに異常が発生しており、アクセスパスを用いた論理デバイスへのアクセスができない状態にあることを意味する。アクセスパスの異常が発生する理由には、様々な理由があり得る。たとえばホスト1とストレージ装置2間のネットワーク4に障害が発生した場合(たとえばファイバチャネルスイッチ41の障害、或いはファイバチャネルケーブル42の断線などである)がありえる。あるいはストレージ装置2あるいは論理デバイスに障害が発生している場合もあり得る。 The path status (C108) represents the status of the access path. When “Success” is stored, it means that the access path to the logical device is normal. If “Failure” is stored, it means that an error has occurred in the access path to the logical device, and the logical device cannot be accessed using the access path. There can be various reasons why an access path abnormality occurs. For example, a failure may occur in the network 4 between the host 1 and the storage apparatus 2 (for example, a failure in the fiber channel switch 41 or a disconnection in the fiber channel cable 42). Alternatively, there may be a failure in the storage device 2 or the logical device.
 利用可能パス本数(C109)と他ホスト利用可能パス本数(C109-2)について説明する前に、「利用可能パス」の定義について説明する。本実施例では、ホスト1から論理デバイス(P-VOLまたはS-VOL)へのパスのうち、論理デバイスへのアクセスに使用することができるパス(つまりパスステータス(C108)が正常(Success)であるパス)のことを、「利用可能なパス」と呼ぶ。 Before describing the number of available paths (C109) and the number of other host usable paths (C109-2), the definition of “available paths” will be described. In this embodiment, of the paths from the host 1 to the logical device (P-VOL or S-VOL), the path that can be used for accessing the logical device (that is, the path status (C108) is normal (Success)). A certain path) is called an “available path”.
 利用可能パス本数(C109)は、ホスト1から論理デバイス(P-VOLまたはS-VOL)へのパスのうち、利用可能な(パスステータス(C108)が正常(Success)である)パスの本数を表す。利用可能パス本数(C109)は、P-VOLごと、あるいはS-VOLごとに計数される。具体的には、あるボリュームペアのP-VOLの利用可能パス本数は、デバイスファイル(C103)が同一の論理デバイスのうち、属性(C107)が“P-VOL”のレコードを特定し、さらにその中で、パスステータス(C108)が正常(Success)であるレコードの数を計数することで、特定される。もちろん、ボリュームペアのS-VOLの利用可能パス本数も、同様の方法で特定される。 The number of available paths (C109) indicates the number of available paths (path status (C108) is normal (Success)) among paths from the host 1 to the logical device (P-VOL or S-VOL). To express. The number of available paths (C109) is counted for each P-VOL or each S-VOL. Specifically, the number of P-VOL usable paths in a certain volume pair is specified by identifying a record having an attribute (C107) of “P-VOL” among logical devices having the same device file (C103), and further The path status (C108) is identified by counting the number of records that are normal (Success). Of course, the number of usable paths of the S-VOL of the volume pair is specified by the same method.
 他ホスト利用可能パス本数(C109-2)は、利用可能パス本数(C109)と類似した情報である。ただし他ホスト利用可能パス本数(C109-2)には、他のホスト1が有する論理デバイス(P-VOLまたはS-VOL)へのパスのうち、利用可能なパスの本数が格納される。計算機システム内の各ホスト1は、原則として他のホスト1のアクセスパスの状態を知ることができないので、他ホスト利用可能パス本数(C109-2)に格納される情報は、管理サーバ3からの情報をもとに導出される。詳細は後述する。 The other host usable path number (C109-2) is information similar to the usable path number (C109). However, the number of paths available to other hosts (C109-2) stores the number of paths that can be used among paths to logical devices (P-VOL or S-VOL) of other hosts 1. Since each host 1 in the computer system cannot know the status of the access path of the other host 1 in principle, the information stored in the number of other host usable paths (C109-2) is obtained from the management server 3. Derived based on information. Details will be described later.
 製番(C110)は、論理デバイスの属するストレージ装置2の製番であり、ポート名(C111)はアクセスパスの経路上にある、ストレージ装置2の有するポート(ホスト1との通信用インタフェース)の識別子である。ボリュームペア状態(C112)は、ボリュームペアのペアステータスが格納される欄である。なお、本実施例では、ボリュームペア状態(C112)に文字列が格納される例、たとえば図5に示されているようにボリュームペア状態(C112)に“Duplex”等の文字列が格納される例を説明する。具体的には、ペアステータスの説明の際に述べたように、“Initial-Copy”、“Duplex”、“Duplex(S)”、“Suspend”、または“Duplex-pending”が格納される。ただし、ペア管理テーブルT300と同様に、0から4までの数値が格納されるようにしてもよい。 The product number (C110) is the product number of the storage device 2 to which the logical device belongs, and the port name (C111) is the port of the storage device 2 (interface for communication with the host 1) on the path of the access path. It is an identifier. The volume pair status (C112) is a column for storing the pair status of the volume pair. In this embodiment, a character string is stored in the volume pair status (C112), for example, a character string such as “Duplex” is stored in the volume pair status (C112) as shown in FIG. An example will be described. Specifically, as described in the description of the pair status, “Initial-Copy”, “Duplex”, “Duplex (S)”, “Suspend”, or “Duplex-pending” is stored. However, similarly to the pair management table T300, numerical values from 0 to 4 may be stored.
 ホストーストレージ間全パス障害フラグ(C113)も利用可能パス本数(C109)と同様に、論理デバイスごとに定義される情報である。ホストからある論理デバイスへのパスのパスステータス(C108)がすべて“Failure”の時、その論理デバイスのホストーストレージ間全パス障害フラグ(C113)には“ON”が格納され、そうでない場合には“OFF”が格納される。 The all-path failure flag between host and storage (C113) is information defined for each logical device as well as the number of available paths (C109). When the path status (C108) of the path from the host to a certain logical device is “Failure”, “ON” is stored in the all-path failure flag (C113) between the host and storage of the logical device. Stores “OFF”.
 P→S間全パス障害フラグ(C114)は、P-VOLに対して定義される情報である。そのため、属性(C107)が“P-VOL”でない行のP→S間全パス障害フラグ(C114)には、情報が格納されない。ストレージ間パス(5a、5b)のうち、プライマリボリュームのあるストレージ装置2からセカンダリボリュームのあるストレージ装置2へのパスがすべて遮断されている場合、P→S間全パス障害フラグ(C114)に“ON”が格納される。たとえば図1において、ストレージ装置2aにP-VOLが、ストレージ装置2bにS-VOLが存在する場合、ストレージ間パス5aが遮断されるとP→S間全パス障害フラグ(C114)に“ON”が格納される。ストレージ間パス5aが複数ある場合、全てのストレージ間パス5aが遮断された時に、P→S間全パス障害フラグ(C114)に“ON”が格納される。 The P → S all path failure flag (C114) is information defined for the P-VOL. For this reason, no information is stored in the P → S all-path failure flag (C114) of the row whose attribute (C107) is not “P-VOL”. In the inter-storage paths (5a, 5b), when all paths from the storage apparatus 2 having the primary volume to the storage apparatus 2 having the secondary volume are blocked, the P → S all path failure flag (C114) is set to “ ON "is stored. For example, in FIG. 1, when a P-VOL exists in the storage apparatus 2a and an S-VOL exists in the storage apparatus 2b, the P → S all path failure flag (C114) is “ON” when the inter-storage path 5a is blocked. Is stored. When there are a plurality of inter-storage paths 5a, "ON" is stored in the P → S all-path failure flag (C114) when all the inter-storage paths 5a are blocked.
 一方、S→P間全パス障害フラグ(C115)はS-VOLに対して定義される情報である。そのため、属性(C107)が“S-VOL”でない行のS→P間全パス障害フラグ(C115)には、情報が格納されない。ストレージ間パス(5a、5b)のうち、セカンダリボリュームのあるストレージ装置2からプライマリボリュームのあるストレージ装置2へのパスがすべて遮断されている場合、S→P間全パス障害フラグ(C114)に“ON”が格納される。たとえば図1において、ストレージ装置2aにP-VOLが、ストレージ装置2bにS-VOLが存在する場合、ストレージ間パス5bが遮断されるとS→P間全パス障害フラグ(C115)に“ON”が格納される。ストレージ間パス5bが複数ある場合、全てのストレージ間パス5bが遮断された時に、S→P間全パス障害フラグ(C115)に“ON”が格納される。 On the other hand, the S → P all-path failure flag (C115) is information defined for the S-VOL. For this reason, no information is stored in the S → P all-path failure flag (C115) of the row whose attribute (C107) is not “S-VOL”. In the inter-storage paths (5a, 5b), when all paths from the storage apparatus 2 having the secondary volume to the storage apparatus 2 having the primary volume are blocked, the S → P all-path failure flag (C114) is set to “ ON "is stored. For example, in FIG. 1, when a P-VOL exists in the storage device 2a and an S-VOL exists in the storage device 2b, the S → P all-path failure flag (C115) is “ON” when the inter-storage path 5b is blocked. Is stored. When there are a plurality of inter-storage paths 5b, "ON" is stored in the S → P all-path failure flag (C115) when all the inter-storage paths 5b are blocked.
 管理サーバ3の統合管理プログラム301は、各ホスト1から通知される交替パス管理テーブルT100の内容を管理する。本実施例では、各ホスト1から通知される交替パス管理テーブルT100の内容を含む情報のことを、「イベント」と呼ぶ。図6を用いて、統合管理プログラム301が維持している管理情報(統合パス管理テーブルT200)の内容の説明を行う。統合パス管理テーブルT200は、パス管理DBとも呼ばれる。 The integrated management program 301 of the management server 3 manages the contents of the alternate path management table T100 notified from each host 1. In the present embodiment, information including the contents of the alternate path management table T100 notified from each host 1 is referred to as an “event”. The contents of the management information (integrated path management table T200) maintained by the integrated management program 301 will be described with reference to FIG. The integrated path management table T200 is also called a path management DB.
 統合パス管理テーブルT200は少なくとも、ホスト名(C201)、ペア#(C202)、パスID(C205)、LDEV#(C206)、属性(C207)、パスステータス(C208)、利用可能パス本数(C209)、製番(C210)、ポート名(C211)、ボリュームペア状態(C212)、ホストーストレージ間全パス障害フラグ(C213)、P→S間全パス障害フラグ(C214)、S→P間全パス障害フラグ(C215)のカラムを有する。このうち、ペア#(C202)、パスID(C205)、LDEV#(C206)、属性(C207)、パスステータス(C208)、利用可能パス本数(C209)、製番(C210)、ポート名(C211)、ボリュームペア状態(C212)、ホストーストレージ間全パス障害フラグ(C213)、P→S間全パス障害フラグ(C214)、S→P間全パス障害フラグ(C215)は、交替パス管理テーブルT100内のペア#(C102)、パスID(C105)、LDEV#(C106)、属性(C107)、パスステータス(C108)、利用可能パス本数(C109)、製番(C110)、ポート名(C111)、ボリュームペア状態(C112)、ホストーストレージ間全パス障害フラグ(C113)、P→S間全パス障害フラグ(C114)、S→P間全パス障害フラグ(C115)と同じ情報である。 The integrated path management table T200 includes at least a host name (C201), a pair # (C202), a path ID (C205), an LDEV # (C206), an attribute (C207), a path status (C208), and the number of available paths (C209). , Serial number (C210), port name (C211), volume pair status (C212), host-storage all path failure flag (C213), P → S all path failure flag (C214), S → P all paths It has a column of a failure flag (C215). Among these, pair # (C202), path ID (C205), LDEV # (C206), attribute (C207), path status (C208), number of available paths (C209), serial number (C210), port name (C211) ), Volume pair status (C212), host-storage all path failure flag (C213), P → S all path failure flag (C214), S → P all path failure flag (C215), alternate path management table Pair # (C102), path ID (C105), LDEV # (C106), attribute (C107), path status (C108), number of available paths (C109), serial number (C110), port name (C111) in T100 ), Volume pair status (C112), host-storage all path failure flag (C113), P → S all path failure Lugs (C114), is the same information as the S → P between the all-path fault flag (C115).
 管理サーバ3はホスト1から、交替パス管理テーブルT100の内容を受信すると、受信した内容を統合パス管理テーブルT200に反映する。たとえばホスト名が“host A”のホスト1から交替パス管理テーブルT100の内容を受信すると、管理サーバ3は統合パス管理テーブルT200の行のうち、ホスト名(C201)が“host A”の行に、受信した情報を格納する。 When the management server 3 receives the contents of the alternate path management table T100 from the host 1, it reflects the received contents in the integrated path management table T200. For example, when the contents of the alternate path management table T100 are received from the host 1 whose host name is “host A”, the management server 3 places the host name (C201) in the “host A” line in the integrated path management table T200. Store the received information.
 具体的には受信した交替パス管理テーブルT100のペア#(C102)、パスID(C105)、LDEV#(C106)、属性(C107)、パスステータス(C108)、利用可能パス本数(C109)、製番(C110)、ポート名(C111)、ボリュームペア状態(C112)、ホストーストレージ間全パス障害フラグ(C113)、P→S間全パス障害フラグ(C114)、S→P間全パス障害フラグ(C115)の情報がそれぞれ、ペア#(C202)、パスID(C205)、LDEV#(C206)、属性(C207)、パスステータス(C208)、利用可能パス本数(C209)、製番(C210)、ポート名(C211)、ボリュームペア状態(C212)、ホストーストレージ間全パス障害フラグ(C213)、P→S間全パス障害フラグ(C214)、S→P間全パス障害フラグ(C215)に反映される。なお、図6ではS→P間全パス障害フラグ(C215)の欄の一部の“OFF→ON”と記載されている箇所があるが、これは更新過渡状態を表す。この箇所の記載の意味については後述する。 Specifically, pair # (C102), path ID (C105), LDEV # (C106), attribute (C107), path status (C108), number of available paths (C109), manufactured in the received alternate path management table T100, (C110), port name (C111), volume pair status (C112), all-path failure flag between host and storage (C113), all-path failure flag between P → S (C114), all-path failure flag between S → P The information of (C115) includes pair # (C202), path ID (C205), LDEV # (C206), attribute (C207), path status (C208), number of available paths (C209), and product number (C210). , Port name (C211), volume pair status (C212), host-storage all path failure flag (C213) , P → S between total path failure flag (C214), is reflected in the S → P between total path failure flag (C215). In FIG. 6, there is a part described as “OFF → ON” in the column of the all-path failure flag between S → P (C215), which represents an update transient state. The meaning of the description of this part will be described later.
 また、ボリュームペアの設定やホスト1からボリュームペアへのアクセスパスの作成が行われた時にも、ホスト1からイベントが管理サーバ3に送信される。そのため、ホスト1のAP102がボリュームペアにアクセスを開始する時点では、統合パス管理テーブルT200には各ホスト1から受領した交替パス管理テーブルT100の内容が反映された状態にある。 Also, an event is transmitted from the host 1 to the management server 3 when a volume pair is set or an access path from the host 1 to the volume pair is created. Therefore, when the AP 102 of the host 1 starts accessing the volume pair, the integrated path management table T200 reflects the contents of the alternate path management table T100 received from each host 1.
 続いて、ホスト1がストレージ装置2にライト要求を発行した時に、ホスト1で行われる処理の流れを説明していく。図7~図10は、ホスト1がストレージ装置2のP-VOLにライト要求を発行した時の処理の流れの説明図である。 Subsequently, the flow of processing performed by the host 1 when the host 1 issues a write request to the storage apparatus 2 will be described. FIG. 7 to FIG. 10 are explanatory diagrams of the processing flow when the host 1 issues a write request to the P-VOL of the storage apparatus 2.
 なお、以下では、計算機システムが図1、図2に示された構成で、ストレージ装置2aにP-VOLが存在し、またこのP-VOLとペア関係にあるS-VOLがストレージ装置2bに存在する場合を例にとって説明する。そのため、以下の説明で「P-VOLにライト要求を発行する」等のように、ホスト1によるP-VOLに対する処理が記載されている箇所は、ホスト1がストレージ装置2aに指示を発行することを意味する。逆に、「S-VOLにライト要求を発行する」等のように、ホスト1によるS-VOLに対する処理が記載されている箇所は、ホスト1がストレージ装置2bに指示を発行することを意味する。 In the following, the computer system has the configuration shown in FIGS. 1 and 2, the storage apparatus 2a has a P-VOL, and the storage apparatus 2b has an S-VOL that is paired with the P-VOL. This will be described as an example. For this reason, the host 1 issues an instruction to the storage apparatus 2a at a place where the processing for the P-VOL by the host 1 is described, such as “issue a write request to the P-VOL” in the following description. Means. On the other hand, a part in which processing for the S-VOL by the host 1 is described such as “issue a write request to the S-VOL” means that the host 1 issues an instruction to the storage apparatus 2b. .
 また、ホスト1からストレージ装置2aがP-VOLに対するライト要求とライトデータを受信すると、ストレージ装置2aはストレージ間パス5aを介してS-VOL(ストレージ装置2b)にライトデータの複製を送信する。またストレージ装置2bがホスト1から、S-VOLに対するライト要求とライトデータを受信すると、ストレージ装置2bはストレージ間パス5bを介してP-VOL(ストレージ装置2a)にライトデータの複製を送信する。そのためストレージ間パス5aのことを、「P-VOL→S-VOL間ストレージパス」または「P→S間ストレージパス」と呼ぶ。一方ストレージ間パス5bのことを、「S-VOL→P-VOL間ストレージパス」または「S→P間ストレージパス」と呼ぶ。また、ホスト1からP-VOLへ至るアクセスパスのことを、「ホストーP-VOL間パス」と呼び、ホスト1からS-VOLへ至るアクセスパスのことを、「ホストーS-VOL間パス」と呼ぶ。 Further, when the storage apparatus 2a receives a write request and write data for the P-VOL from the host 1, the storage apparatus 2a transmits a copy of the write data to the S-VOL (storage apparatus 2b) via the inter-storage path 5a. When the storage apparatus 2b receives a write request and write data for the S-VOL from the host 1, the storage apparatus 2b transmits a copy of the write data to the P-VOL (storage apparatus 2a) via the inter-storage path 5b. Therefore, the inter-storage path 5a is referred to as “P-VOL → S-VOL storage path” or “P → S storage path”. On the other hand, the inter-storage path 5b is referred to as “S-VOL → P-VOL storage path” or “S → P storage path”. The access path from the host 1 to the P-VOL is called “host-P-VOL path”, and the access path from the host 1 to the S-VOL is called “host-S-VOL path”. Call.
 ステップ1001では、AP102がボリュームペアに対してライト要求を発行する(これはデバイスファイルを指定したライト要求を発行することと等価である)。ここではAP102が、デバイスファイルsddlmaを指定した場合を想定する。交替パスプログラム103はステップ1002で、AP102が発行したライト要求と交替パス管理テーブルT100を参照することで、ライト先のアクセスパス(scsiデバイスファイル)を1つ特定し、特定されたアクセスパスを用いて論理デバイスにライト要求を発行する。 In step 1001, the AP 102 issues a write request to the volume pair (this is equivalent to issuing a write request specifying a device file). Here, it is assumed that the AP 102 designates the device file sddlma. In step 1002, the alternate path program 103 identifies one write-destination access path (scsi device file) by referring to the write request issued by the AP 102 and the alternate path management table T100, and uses the identified access path. Issue a write request to the logical device.
 具体的には交替パスプログラム103は、ステップ1001で指定されたデバイスファイル名がデバイスファイルC103と等しいレコードの中から、パスステータス108が“Success”のレコードを1つ特定する。交替パスプログラム103は、ここで特定されたレコードのscsiデバイスファイルC104を用いて、論理デバイスへのライト要求を発行する。 Specifically, the alternate path program 103 identifies one record whose path status 108 is “Success” from the records in which the device file name specified in step 1001 is the same as the device file C103. The alternate path program 103 issues a write request to the logical device using the scsi device file C104 of the record specified here.
 なお、図7~図10はP-VOLにライト要求を発行した時の処理の例を説明する図なので、ステップ1002では、論理デバイスの属性C107が“P-VOL”であるレコードが選択され、P-VOL(ストレージ装置2a)にライト要求が発行される。論理デバイスの属性C107が“S-VOL”であるレコードが選択された場合の例は、後述する(図11~図14)。 7 to 10 are diagrams for explaining an example of processing when a write request is issued to the P-VOL. In step 1002, a record whose logical device attribute C107 is “P-VOL” is selected. A write request is issued to the P-VOL (storage device 2a). An example of the case where a record whose logical device attribute C107 is “S-VOL” is selected will be described later (FIGS. 11 to 14).
 また、図7~図14で説明する例では、ステップ1002の実行時点で、交替パス管理テーブルT100に格納されている、アクセス対象ボリュームペアのボリュームペア状態(C112)は“Duplex”である場合を説明する。アクセス対象ボリュームペアのボリュームペア状態(C112)は“Duplex”の場合、ステップ1002(またはステップ2002)で交替パスプログラム103は論理デバイスの属性C107が“P-VOL”であるレコードを選択することもあれば、“S-VOL”であるレコードを選択することもある。一方アクセス対象ボリュームペアのボリュームペア状態(C112)は“Duplex(S)”の場合、交替パスプログラム103は少なくともライト要求を発行する時には、論理デバイスの属性C107が“P-VOL”であるレコードを選択する(S-VOLへのライトが不可能だからである)。 In the example illustrated in FIGS. 7 to 14, the case where the volume pair status (C112) of the access target volume pair stored in the alternate path management table T100 at the time of execution of step 1002 is “Duplex”. explain. When the volume pair status (C112) of the access target volume pair is “Duplex”, in step 1002 (or step 2002), the alternate path program 103 may select a record whose logical device attribute C107 is “P-VOL”. If so, a record that is “S-VOL” may be selected. On the other hand, when the volume pair status (C112) of the access target volume pair is “Duplex (S)”, at least when the alternate path program 103 issues a write request, a record whose logical device attribute C107 is “P-VOL” is displayed. Select (because it is impossible to write to S-VOL).
 ステップ1003では、交替パスプログラム103はストレージ装置2aから、ステップ1002で発行されたライト要求に対する応答を受領する(正確には、応答を受領できない場合もある)。もしこの応答のステータスが“正常終了”であれば(ステップ1003:Yes)、交替パスプログラム103はAP102にライト要求が正常に行われた旨を通知し(ステップ1010)、処理を終了する。ライト処理が正常に行われなかった場合、ステップ1004以降の処理が行われる。 In step 1003, the alternate path program 103 receives a response to the write request issued in step 1002 from the storage apparatus 2a (accurately, the response may not be received). If the status of this response is “normal end” (step 1003: Yes), the alternate path program 103 notifies the AP 102 that the write request has been normally made (step 1010), and the processing is ended. If the write process is not performed normally, the processes after step 1004 are performed.
 ライト処理が正常に行われなかった場合には、幾つかの原因があり得る。一つには、ネットワーク4に障害が発生したために、ホスト1が発行するライト要求がストレージ装置2に到達しない状態にある場合である。本実施例ではこの状態を、「アクセスパスがリンクダウン状態にある」と呼ぶ。 If the write process is not performed normally, there may be several causes. One is a case where a write request issued by the host 1 does not reach the storage device 2 because a failure has occurred in the network 4. In this embodiment, this state is referred to as “the access path is in a link down state”.
 ライト処理が正常に行われない他の理由として、P-VOLが閉塞状態になっている場合があり得る。たとえば、P-VOLを形成するために用いられる複数のDISK22に障害が発生している場合などには、ストレージ装置2aはそのP-VOLを閉塞状態にし、ホスト1にエラー応答を返却する。この時ストレージ装置2aは、エラーの原因が論理デバイスの閉塞である旨もエラー応答に含めて、ホスト1に通知する。 Another reason why the write process is not performed normally is when the P-VOL is in a blocked state. For example, when a failure occurs in a plurality of DISKs 22 used for forming a P-VOL, the storage apparatus 2a puts the P-VOL into a blocked state and returns an error response to the host 1. At this time, the storage apparatus 2a notifies the host 1 that the cause of the error is that the logical device is blocked, in the error response.
 また、S-VOLが閉塞状態になっている場合、あるいはストレージ間パス5aに障害が発生している場合も、ライト処理が正常に行われない。この場合、ストレージ装置2aがストレージ装置2bにライトデータの複製を送信しても、ストレージ装置2bからエラーが返却されるかあるいはストレージ装置2bから応答が返却されない。そのためストレージ装置2aはホスト1にエラー応答を返却する。この時にはストレージ装置2aは、エラーの原因がストレージ装置2b側またはストレージ間パス5aにある旨をエラー応答に含めて、ホスト1に通知する。 Also, when the S-VOL is in a blocked state, or when a failure occurs in the inter-storage path 5a, the write process is not performed normally. In this case, even if the storage apparatus 2a transmits a copy of the write data to the storage apparatus 2b, an error is returned from the storage apparatus 2b or no response is returned from the storage apparatus 2b. Therefore, the storage apparatus 2a returns an error response to the host 1. At this time, the storage apparatus 2a notifies the host 1 of the error response that the cause of the error is the storage apparatus 2b side or the inter-storage path 5a.
 まず論理デバイスへのアクセスパスがリンクダウン状態であった場合の処理の流れを説明する。交替パスプログラム103は所定時間以内にストレージ装置2aから応答が戻ってこない場合、リンクダウン状態にあると判断し(ステップ1004:Yes)、ライト要求発行先アクセスパスのパスステータス(C108)を“Failure”に変更する(ステップ1005)。 First, the processing flow when the access path to the logical device is in the link down state will be described. If the response is not returned from the storage apparatus 2a within a predetermined time, the alternate path program 103 determines that the link is down (step 1004: Yes), and sets the path status (C108) of the write request issue destination access path to “Failure”. "(Step 1005).
 続いて交替パスプログラム103は、ステップ1005でパスステータス(C108)を変更したアクセスパスと同じ論理デバイス(P-VOL)に対する全アクセスパスについて、パスステータス(C108)が“Failure”であるか確認する。その結果、パスステータス(C108)が“Failure”でないアクセスパスがあれば(ステップ1006:No)、そのアクセスパスを用いてP-VOLへライト要求を発行する(つまりステップ1002を実行する)。逆に全てのパスステータス(C108)が、“Failure”だった場合(ステップ1006:Yes)、ステップ1007が行われる。ステップ1007では、交替パスプログラム103はアクセス対象のP-VOLの、ホストーストレージ間全パス障害フラグ(C113)を“ON”にする。 Subsequently, the alternate path program 103 checks whether the path status (C108) is “Failure” for all access paths to the same logical device (P-VOL) as the access path whose path status (C108) has been changed in step 1005. . As a result, if there is an access path whose path status (C108) is not “Failure” (step 1006: No), a write request is issued to the P-VOL using that access path (that is, step 1002 is executed). Conversely, when all the path statuses (C108) are “Failure” (step 1006: Yes), step 1007 is performed. In step 1007, the alternate path program 103 sets the host-storage all path failure flag (C113) of the P-VOL to be accessed to “ON”.
 ストレージ装置2から、論理デバイス閉塞を示すエラー応答が返却された場合(ステップ1004:No、かつステップ1011:Yes)、交替パスプログラム103はアクセス対象のP-VOLの全アクセスパスについて、パスステータス(C108)を“Failure”に変更する(ステップ1012)。論理デバイス(P-VOL)が閉塞状態にある場合、ホスト1からそのP-VOLへのアクセスパスがすべて遮断されている状態と、実質的に等価な状態だからである。 When an error response indicating logical device blockage is returned from the storage apparatus 2 (step 1004: No, and step 1011: Yes), the alternate path program 103 sets the path status (for all access paths of the P-VOL to be accessed) C108) is changed to “Failure” (step 1012). This is because when the logical device (P-VOL) is in a blocked state, it is substantially equivalent to a state in which all access paths from the host 1 to the P-VOL are blocked.
 さらに交替パスプログラム103はアクセス対象のP-VOLの、ホストーストレージ間全パス障害フラグ(C113)とP→S間全パス障害フラグ(C114)を“ON”にし、またアクセス対象のボリュームペアのS→P間全パス障害フラグ(C115)を“ON”にする(ステップ1013)。P→S間全パス障害フラグ(C114)、S→P間全パス障害フラグ(C115)を“ON”にする理由は、論理デバイス(P-VOLやS-VOL)が閉塞状態にある場合、リモートコピー機能によるミラーリングができないためである。また、ここで“ON”にされるS→P間全パス障害フラグ(C115)は、アクセス対象P-VOLのペアボリューム(S-VOL)に対して定義されているフラグ(C115)である。ステップ1013の後、ステップ1031が行われる。 Further, the alternate path program 103 sets the host-storage all path failure flag (C113) and the P → S all path failure flag (C114) of the P-VOL to be accessed to "ON", and sets the volume pair to be accessed. The S → P all-path failure flag (C115) is set to “ON” (step 1013). The reason why the all-path failure flag between P → S (C114) and the all-path failure flag between S → P (C115) is set to “ON” is that the logical device (P-VOL or S-VOL) is blocked. This is because mirroring using the remote copy function is not possible. Further, the S → P all-path failure flag (C115) which is turned “ON” here is a flag (C115) defined for the pair volume (S-VOL) of the access target P-VOL. After step 1013, step 1031 is performed.
 なお、論理デバイス閉塞以外のエラーが発生している場合(ステップ1011:No)の処理の流れについては、後で述べる。 The processing flow when an error other than the logical device blockage has occurred (step 1011: No) will be described later.
 ステップ1007またはステップ1013の後、交替パスプログラム103は、P-VOLとペア関係にあるS-VOL(ストレージ装置2b)に対してライト要求を発行する(ステップ1031)。ステップ1031の処理はステップ1002と類似しているが、ステップ1031では交替パスプログラム103は交替パス管理テーブルT100の中から、ペア#(C102)が、ステップ1002で選択されたレコードと同じで、かつ属性C107が“S-VOL”で、パスステータス(C108)が“Success”であるレコードを選択する(なお、ステップ1031の処理の前に、P-VOLへのアクセスパスのパスステータス(C108)はすべて“Failure”に変更されている。そのためステップ1031では、交替パスプログラム103は実際には、属性C107が“S-VOL”であるか否かを判断しなくてもよい)。そしてここで選択されたレコードのscsiデバイスファイルC104を用いて、論理デバイスへのライト要求を発行する。 After step 1007 or step 1013, the alternate path program 103 issues a write request to the S-VOL (storage device 2b) that is paired with the P-VOL (step 1031). The process of step 1031 is similar to step 1002, but in step 1031 the alternate path program 103 has the same pair # (C102) as the record selected in step 1002 from the alternate path management table T100, and Select a record whose attribute C107 is “S-VOL” and whose path status (C108) is “Success” (note that before the processing of step 1031, the path status (C108) of the access path to the P-VOL is All are changed to “Failure.” Therefore, in step 1031, the alternate path program 103 does not actually have to determine whether or not the attribute C107 is “S-VOL”). A write request to the logical device is issued using the scsi device file C104 of the record selected here.
 ステップ1032で、交替パスプログラム103はストレージ装置2bから、ステップ1031で発行されたライト要求に対する応答を受領する。この応答のステータスが“正常終了”の場合(ステップ1032:Yes)、交替パスプログラム103はAP102にライト要求が正常に行われた旨を通知する(ステップ1065)。その後交替パスプログラム103は、管理サーバ3の統合管理プログラム301にイベント(障害情報)を通知し(ステップ1038)、処理を終了する。イベント(障害情報)とは先に述べたとおり、交替パス管理テーブルT100の内容を含む情報である。 In step 1032, the alternate path program 103 receives a response to the write request issued in step 1031 from the storage apparatus 2b. If the status of this response is “normal end” (step 1032: Yes), the alternate path program 103 notifies the AP 102 that the write request has been made normally (step 1065). Thereafter, the alternate path program 103 notifies the event (failure information) to the integrated management program 301 of the management server 3 (step 1038), and ends the process. As described above, the event (failure information) is information including the contents of the alternate path management table T100.
 ストレージ装置2bから応答が返ってこなかった場合、つまりアクセスパスがリンクダウン状態だった場合(ステップ1033:Yes)、交替パスプログラム103はライト要求を発行したアクセスパスのパスステータス(C108)を“Failure”に変更する(ステップ1034)。この処理はステップ1005と同様である。そして交替パスプログラム103は、S-VOLへのアクセスパスのうち、パスステータス(C108)が“Success”であるアクセスパスが存在するのであれば、そのアクセスパスを用いてライト要求を再試行することを繰り返す(ステップ1035、ステップ1031)。 If no response is returned from the storage apparatus 2b, that is, if the access path is in a link down state (step 1033: Yes), the alternate path program 103 sets the path status (C108) of the access path that issued the write request to “Failure”. "(Step 1034). This process is the same as step 1005. Then, if there is an access path whose path status (C108) is “Success” among the access paths to the S-VOL, the alternate path program 103 retries the write request using the access path. Is repeated (step 1035, step 1031).
 S-VOLへの全てのアクセスパスのパスステータス(C108)が“Failure”であった場合(ステップ1035:Yes)、交替パスプログラム103はアクセス対象のS-VOLの、ホストーストレージ間全パス障害フラグ(C113)を“ON”にする(ステップ1036)。そして交替パスプログラム103はアプリケーションプログラム102にI/Oエラー(ライト処理が失敗した旨)を応答する(ステップ1037)。さらに交替パスプログラム103は、管理サーバ3の統合管理プログラム301に、イベント(障害情報)を通知し(ステップ1038)、処理を終了する。 If the path status (C108) of all the access paths to the S-VOL is “Failure” (step 1035: Yes), the alternate path program 103 indicates that all paths between the host and storage of the S-VOL to be accessed have failed. The flag (C113) is set to “ON” (step 1036). The alternate path program 103 then responds to the application program 102 with an I / O error (notifying that the write process has failed) (step 1037). Further, the alternate path program 103 notifies the event (failure information) to the integrated management program 301 of the management server 3 (step 1038), and ends the process.
 ストレージ装置2bから、論理デバイス閉塞を示すエラー応答が返却された場合(ステップ1033:No、かつステップ1041:Yes)、交替パスプログラム103はアクセス対象のS-VOLの全アクセスパスについて、パスステータス(C108)を“Failure”に変更する(ステップ1042)。さらに交替パスプログラム103はアクセス対象のS-VOLの、ホストーストレージ間全パス障害フラグ(C113)、S→P間全パス障害フラグ(C115)を“ON”にし、アクセス対象S-VOLのペアボリューム(P-VOL)のP→S間全パス障害フラグ(C114)を“ON”にする(ステップ1043)。ステップ1043が行われる理由は、ステップ1013が行われる理由と同じである。 When an error response indicating logical device blockage is returned from the storage apparatus 2b (step 1033: No, and step 1041: Yes), the alternate path program 103 sets the path status (for all access paths of the S-VOL to be accessed) C108) is changed to “Failure” (step 1042). Further, the alternate path program 103 sets the all-path failure flag between host and storage (C113) and the all-path failure flag between S → P (C115) of the S-VOL to be accessed to “ON”, and the pair of the access target S-VOL. The P → S all path failure flag (C114) of the volume (P-VOL) is set to “ON” (step 1043). The reason why Step 1043 is performed is the same as the reason why Step 1013 is performed.
 その後交替パスプログラム103は、アプリケーションプログラム102にI/Oエラーを応答し(ステップ1037)、管理サーバ3の統合管理プログラム301にイベント(障害情報)を通知し(ステップ1038)、処理を終了する。 Thereafter, the alternate path program 103 responds with an I / O error to the application program 102 (step 1037), notifies the integrated management program 301 of the management server 3 of an event (failure information) (step 1038), and ends the processing.
 論理デバイス(S-VOL)が正常で(閉塞でない)、またアクセスパスがリンクダウン状態でもない場合のエラーは、ストレージ間パス5bに障害が発生していることを意味する(ステップ1041:Noのケース)。この場合交替パスプログラム103は、アクセス対象S-VOLのS→P間全パス障害フラグ(C115)を“ON”にし、またアクセス対象S-VOLのペアボリューム(P-VOL)のP→S間全パス障害フラグ(C114)を“ON”にする(ステップ1051)。ステップ1051が実行される場合、少なくともS-VOLは正常で、またホスト1からS-VOLへのアクセスパスも使用可能であるため、ホストーストレージ間全パス障害フラグ(C113)は“ON”にされない。 An error when the logical device (S-VOL) is normal (not blocked) and the access path is not in a link down state means that a failure has occurred in the inter-storage path 5b (Step 1041: No). Case). In this case, the alternate path program 103 sets the S → P all path failure flag (C115) of the access target S-VOL to “ON”, and the P → S of the pair volume (P-VOL) of the access target S-VOL. The all path failure flag (C114) is set to “ON” (step 1051). When Step 1051 is executed, at least the S-VOL is normal and the access path from the host 1 to the S-VOL can be used, so the all-path failure flag (C113) between the host and storage is set to “ON”. Not.
 続いて交替パスプログラム103は、今回のライト処理でアクセス対象となったP-VOLへのアクセスパス状態を調べる(ステップ1052)。具体的には交替パスプログラム103は、交替パス管理テーブルT100の中から、今回のライト対象でアクセス対象となったP-VOLの、他ホスト利用可能パス本数(C109-2)の値を参照する。 Subsequently, the alternate path program 103 checks the access path status to the P-VOL that is the access target in this write process (step 1052). Specifically, the alternate path program 103 refers to the value of the number of other host usable paths (C109-2) of the P-VOL that is the access target in the current write target from the alternate path management table T100. .
 他ホスト利用可能パス本数(C109-2)の値が0の場合(ステップ1052:Yes)、計算機システム内の、自ホスト以外の全ホスト1は、今回のライト処理でアクセス対象になったP-VOLにアクセスできない状態にある。またステップ1052が実行される場合、自ホストも今回のライト処理でアクセス対象になったP-VOLにアクセスできない状態である。この場合交替パスプログラム103は、P-VOLを閉塞させるようストレージ装置2aに指示する(ステップ1053)。この指示は、ホスト1から管理ネットワーク6経由でストレージ装置2aに送信される。ストレージ装置2aは指示を受領するとP-VOLを閉塞させ、またP-VOLの属するボリュームペアのペアステータスを“Suspend状態”にする。その後交替パスプログラム103は、S-VOLにライト要求を発行してS-VOLにデータを格納する(ステップ1054)。ステップ1054の後、交替パスプログラム103はステップ1065とステップ1038を実行し、処理を終了する。 If the value of the number of paths that can be used by other hosts (C109-2) is 0 (step 1052: Yes), all hosts 1 other than the own host in the computer system are accessed by this write process. The VOL cannot be accessed. When step 1052 is executed, the own host is also in a state where it cannot access the P-VOL that is the access target in this write process. In this case, the alternate path program 103 instructs the storage apparatus 2a to block the P-VOL (step 1053). This instruction is transmitted from the host 1 via the management network 6 to the storage apparatus 2a. Upon receipt of the instruction, the storage apparatus 2a closes the P-VOL and sets the pair status of the volume pair to which the P-VOL belongs to “Suspend state”. Thereafter, the alternate path program 103 issues a write request to the S-VOL and stores data in the S-VOL (step 1054). After step 1054, the alternate path program 103 executes step 1065 and step 1038, and ends the process.
 また他ホスト利用可能パス本数(C109-2)の値が0でない場合(ステップ1052:No)、つまり計算機システム内のホスト1のうち、今回のライト処理でアクセス対象になったP-VOLへの正常なアクセスパスを有するホスト1がある場合、交替パスプログラム103はアプリケーションプログラム102にI/Oエラー(ライト処理が失敗した旨)を応答する(ステップ1037)。さらに交替パスプログラム103は、管理サーバ3の統合管理プログラム301に、イベント(障害情報)を通知し(ステップ1038)、処理を終了する。なお、他ホスト利用可能パス本数(C109-2)の値は、本処理(図7~図10の処理)とは別に、管理サーバ3からの通知が来た時点で更新される値である。他ホスト利用可能パス本数(C109-2)の更新処理の詳細は後述する。 If the value of the number of paths available to other hosts (C109-2) is not 0 (step 1052: No), that is, among the hosts 1 in the computer system, the access to the P-VOL to be accessed in the current write processing When there is a host 1 having a normal access path, the alternate path program 103 responds to the application program 102 with an I / O error (notifying that the write process has failed) (step 1037). Further, the alternate path program 103 notifies the event (failure information) to the integrated management program 301 of the management server 3 (step 1038), and ends the process. Note that the value of the number of paths available to other hosts (C109-2) is a value that is updated when a notification is received from the management server 3 separately from this processing (the processing of FIGS. 7 to 10). Details of the update processing of the number of other host usable paths (C109-2) will be described later.
 なお、上で説明したステップ1052では、他ホスト利用可能パス本数(C109-2)の値を参照することで、アクセス対象P-VOLへの正常なアクセスパスを有するホスト1があるか否かが判定された。ただし別の実施形態として、交替パスプログラム103は管理サーバ3の統合管理プログラム301に依頼して、統合パス管理テーブルT200を取得することで、アクセス対象P-VOLへの正常なアクセスパスを有するホスト1があるか否か判定してもよい。交替パスプログラム103が管理サーバ3から統合パス管理テーブルT200を取得する場合、交替パスプログラム103は、統合パス管理テーブルT200のレコードのうち、LDEV#(C206)、属性(C207)、ストレージ装置製番(C210)が、今回のライト対象でアクセス対象となったP-VOLと同じレコードを特定する。そして交替パスプログラム103は、それらのレコードのホストーストレージ間全パス障害フラグ(C213)がすべて“ON”か判定する。なおこの時交替パスプログラム103は、統合パス管理テーブルT200のレコードのうち、自ホストのアクセスパスについての情報(ホスト名(C201)に、交替パスプログラム103を実行中のホスト1の名称が格納されているレコード)は参照しない。 In step 1052 described above, whether or not there is a host 1 having a normal access path to the access target P-VOL by referring to the value of the number of other host available paths (C109-2). It was judged. However, as another embodiment, the alternate path program 103 requests the integrated management program 301 of the management server 3 to acquire the integrated path management table T200, thereby providing a host having a normal access path to the access target P-VOL. It may be determined whether or not there is one. When the alternate path program 103 acquires the integrated path management table T200 from the management server 3, the alternate path program 103 includes LDEV # (C206), attribute (C207), storage device serial number among the records of the integrated path management table T200. (C210) specifies the same record as the P-VOL that is the access target in the current write target. Then, the alternate path program 103 determines whether all the host-storage all path failure flags (C213) of these records are “ON”. At this time, the alternate path program 103 stores the name of the host 1 executing the alternate path program 103 in the information about the access path of the own host (host name (C201)) in the record of the integrated path management table T200. Record) is not referenced.
 特定されたレコードの、ホストーストレージ間全パス障害フラグ(C113)がすべて“ON”の場合(ステップ1052:Yes)、計算機システム内の全ホスト1は、今回のライト処理でアクセス対象になったP-VOLにアクセスできない状態にある。この場合交替パスプログラム103は、ステップ1053、ステップ1054、ステップ1065とステップ1038を実行し、処理を終了する。また特定されたレコードの中に、ホストーストレージ間全パス障害フラグ(C113)が“OFF”のレコードがある場合には(ステップ1052:No)、交替パスプログラム103はステップ1037、ステップ1038を実施し、処理を終了する。 If all the path fault flags between the host and storage (C113) of the specified record are all “ON” (step 1052: Yes), all the hosts 1 in the computer system have become access targets in this write process. The P-VOL cannot be accessed. In this case, the alternate path program 103 executes Step 1053, Step 1054, Step 1065, and Step 1038, and ends the process. If there is a record in which the all-path failure flag between host and storage (C113) is “OFF” in the specified record (step 1052: No), the alternate path program 103 performs steps 1037 and 1038. Then, the process ends.
 続いてステップ1002を実行した結果、論理デバイス閉塞以外のエラーが発生した場合(ステップ1011:No)について説明する。この場合、ストレージ間パス5aに障害が発生している、あるいはS-VOLが閉塞状態にあることが考えられ、この状態では、少なくともストレージ間パス5aを用いたデータ伝送、つまりP-VOLのデータをS-VOLにコピーする処理ができない。そのためこの場合には、交替パスプログラム103はアクセス対象のP-VOLの、P→S間全パス障害フラグ(C114)を“ON”にする(ステップ1015)。その後交替パスプログラム103は、P-VOLとペア関係にあるS-VOLに対してライト要求を発行する(ステップ1016)。ステップ1016は、ステップ1031と同様の処理である。 Subsequently, the case where an error other than the logical device blockage has occurred as a result of executing Step 1002 (Step 1011: No) will be described. In this case, a failure may have occurred in the inter-storage path 5a, or the S-VOL may be blocked. In this state, at least data transmission using the inter-storage path 5a, that is, P-VOL data Cannot be copied to S-VOL. Therefore, in this case, the alternate path program 103 sets the all-path failure flag (C114) between P → S of the P-VOL to be accessed to “ON” (step 1015). Thereafter, the alternate path program 103 issues a write request to the S-VOL that is paired with the P-VOL (step 1016). Step 1016 is the same processing as step 1031.
 ステップ1016を実行した結果、アクセスパスがリンクダウン状態だった場合(ステップ1017:Yes)、交替パスプログラム103はライト要求を発行したアクセスパスのパスステータス(C108)を“Failure”に変更する(ステップ1018)。この処理はステップ1034と同様である。そして交替パスプログラム103は、S-VOLへのアクセスパスのうち、パスステータス(C108)が“Success”であるアクセスパスが存在するのであれば、そのアクセスパスを用いてライト要求を再発行することを繰り返す(ステップ1019、ステップ1016)。 As a result of executing Step 1016, when the access path is in the link down state (Step 1017: Yes), the alternate path program 103 changes the path status (C108) of the access path that issued the write request to “Failure” (Step 1017). 1018). This process is the same as step 1034. Then, if there is an access path whose path status (C108) is “Success” among the access paths to the S-VOL, the alternate path program 103 reissues the write request using the access path. Are repeated (step 1019, step 1016).
 S-VOLへの全てのアクセスパスのパスステータスが“Failure”であった場合(ステップ1019:Yes)、交替パスプログラム103はアクセス対象のS-VOLの、ホストーストレージ間全パス障害フラグ(C113)を“ON”にするとともに、S→P間全パス障害フラグ(C115)を“ON”にする(ステップ1020)。続いて交替パスプログラム103はアクセス対象のS-VOLの状態を閉塞状態に変更するよう、ストレージ装置2bに指示する(ステップ1070)。この指示は、ホスト1から管理ネットワーク6経由でストレージ装置2bに送信される。この結果、このS-VOLは全てのホスト1からアクセスできない状態になる。 If the path status of all access paths to the S-VOL is “Failure” (step 1019: Yes), the alternate path program 103 indicates the all-path failure flag between the host and storage of the S-VOL to be accessed (C113). ) Is turned “ON”, and the S → P all-path failure flag (C115) is turned “ON” (step 1020). Subsequently, the alternate path program 103 instructs the storage apparatus 2b to change the state of the S-VOL to be accessed to the blocked state (step 1070). This instruction is transmitted from the host 1 to the storage apparatus 2b via the management network 6. As a result, this S-VOL becomes inaccessible from all hosts 1.
 その後、交替パスプログラム103は、S-VOLとペア関係にあるP-VOLに対してライト要求を発行する(ステップ1075)。ステップ1075の実行時点では、P-VOLへのアクセスパスは正常(リンクダウン状態でない)で、かつP-VOLは閉塞状態でもないため、ホスト1からP-VOLへのライト要求は成功する。その後交替パスプログラム103は、ステップ1065、ステップ1038を実行した後、処理を終了する。 Thereafter, the alternate path program 103 issues a write request to the P-VOL that is paired with the S-VOL (step 1075). At the time of execution of step 1075, since the access path to the P-VOL is normal (not in the link down state) and the P-VOL is not in the blocked state, the write request from the host 1 to the P-VOL is successful. Thereafter, the alternate path program 103 executes step 1065 and step 1038, and then ends the processing.
 ステップ1016を実行した結果、ストレージ装置2から論理デバイス閉塞を示すエラー応答が返却された場合(ステップ1017:No、かつステップ1021:Yes)、交替パスプログラム103はアクセス対象のS-VOLの全アクセスパスについて、パスステータス(C108)を“Failure”に変更する(ステップ1022)。さらに交替パスプログラム103はアクセス対象のS-VOLの、ホストーストレージ間全パス障害フラグ(C113)、S→P間全パス障害フラグ(C115)を“ON”にする(ステップ1023)。 As a result of executing Step 1016, when an error response indicating logical device blockage is returned from the storage apparatus 2 (Step 1017: No, and Step 1021: Yes), the alternate path program 103 accesses all the S-VOLs to be accessed. For the path, the path status (C108) is changed to “Failure” (step 1022). Further, the alternate path program 103 sets the all-path failure flag between host and storage (C113) and the all-path failure flag between S → P (C115) of the S-VOL to be accessed to “ON” (step 1023).
 その後交替パスプログラム103は、S-VOLとペア関係にあるP-VOLに対してライト要求を発行する(ステップ1075)。ステップ1075の後、交替パスプログラム103は、ステップ1065、ステップ1038を実行した後、処理を終了する。 Thereafter, the alternate path program 103 issues a write request to the P-VOL that is paired with the S-VOL (step 1075). After step 1075, the alternate path program 103 executes step 1065 and step 1038, and then ends the process.
 ステップ1016を実行した結果、ストレージ間パス障害(ここではストレージ間パス5bの障害)を示すエラー応答が返却された場合(ステップ1017:No、ステップ1021:No、かつステップ1024:Yes)、交替パスプログラム103はアクセス対象のS-VOLの、S→P間全パス障害フラグ(C115)を“ON”にする(ステップ1026)。 When an error response indicating an inter-storage path failure (in this case, an inter-storage path 5b failure) is returned as a result of executing Step 1016 (Step 1017: No, Step 1021: No, and Step 1024: Yes), an alternate path The program 103 sets the S → P all path failure flag (C115) of the S-VOL to be accessed to “ON” (step 1026).
 ステップ1024の判定が肯定的である場合、交替パスプログラム103はホスト1からP-VOLへのアクセスパスとホスト1からS-VOLへのアクセスパスは正常で、またP-VOL,S-VOLともに正常な状態にあると判断できる。ただしストレージ間パス(5a、5b)に障害があるため、リモートコピー機能が実行できない状態である。結果としてステップ1024の判定が行われる時点では、ストレージ装置2a及び2bはアクセス対象ボリュームペアのペアステータスをSuspend状態に変更しており、ストレージ装置2aは、P-VOLへのライト要求を受け付けた時にS-VOLへのコピーを行わないようになっており、またストレージ装置2bも、S-VOLへのライト要求を受け付けた時にP-VOLへのコピーを行わないようになっている。 If the determination in step 1024 is affirmative, the alternate path program 103 indicates that the access path from the host 1 to the P-VOL and the access path from the host 1 to the S-VOL are normal, and both the P-VOL and S-VOL are It can be judged that it is in a normal state. However, the remote copy function cannot be executed because there is a failure in the inter-storage path (5a, 5b). As a result, when the determination in step 1024 is performed, the storage apparatuses 2a and 2b have changed the pair status of the access target volume pair to the Suspend state, and the storage apparatus 2a has received a write request to the P-VOL. Copying to the S-VOL is not performed, and the storage apparatus 2b is also configured not to copy to the P-VOL when a write request to the S-VOL is accepted.
 そのため交替パスプログラム103は、P-VOLとS-VOLの両方にライト要求を発行することで、ストレージ装置2に代わってデータのミラーリングを行う(ステップ1060)。ステップ1024の判定が行われるケースでは、P-VOLとS-VOLは正常である(閉塞状態でない)。そのため交替パスプログラム103は少なくともP-VOLかS-VOLのいずれかにデータを書き込むことが望まれる。ただしこの時点では、他のホスト1でストレージ間パス(5a、5b)の障害が検出されていない可能性がある(このボリュームペアは正常と認識している可能性があり、その場合、他のホスト1はP-VOLとS-VOLに同一データが格納されている(いずれの論理デバイスからデータを読み出してもよい)と認識する)。そのためステップ1024の判定が行われるケースで、交替パスプログラム103がP-VOLのみ(あるいはS-VOLのみ)にデータを書き込むと、他のホスト1は、交替パスプログラム103がデータを書き込んだ論理デバイスと異なる論理デバイスからデータリードを行い、誤ったデータにアクセスする可能性がある。これを防ぐために、ステップ1060で交替パスプログラム103は、P-VOLとS-VOLの両方にデータを書き込む。 Therefore, the alternate path program 103 issues a write request to both the P-VOL and S-VOL, thereby performing data mirroring on behalf of the storage apparatus 2 (step 1060). In the case where the determination in step 1024 is performed, P-VOL and S-VOL are normal (not in a blocked state). Therefore, it is desirable that the alternate path program 103 writes data in at least either P-VOL or S-VOL. However, at this point, the failure of the inter-storage path (5a, 5b) may not have been detected in the other host 1 (this volume pair may be recognized as normal. The host 1 recognizes that the same data is stored in the P-VOL and S-VOL (data can be read from any logical device). Therefore, in the case where the determination of step 1024 is performed, if the alternate path program 103 writes data only to the P-VOL (or only S-VOL), the other host 1 is the logical device to which the alternate path program 103 has written data. There is a possibility that data is read from a different logical device and incorrect data is accessed. In order to prevent this, the alternate path program 103 writes data in both the P-VOL and the S-VOL in step 1060.
 その後交替パスプログラム103は、ステップ1065、ステップ1038を実行してから、処理を終了する。なお、ステップ1038が実行されることで、管理サーバ3(統合管理プログラム301)が、各ホスト1がP-VOLあるいはS-VOLの何れかのみにアクセスするよう、各ホスト1の設定の変更を行わせることになる。管理サーバ3が行う処理については後述する。 After that, the alternate path program 103 executes step 1065 and step 1038, and then ends the process. By executing step 1038, the management server 3 (integrated management program 301) changes the setting of each host 1 so that each host 1 accesses only one of P-VOL and S-VOL. Will be done. Processing performed by the management server 3 will be described later.
 またステップ1024の判定が否定的な場合、交替パスプログラム103はステップ1026を実行しないで、ステップ1060、ステップ1065、ステップ1038を実行して処理を終了する。 If the determination at step 1024 is negative, the alternate path program 103 does not execute step 1026 but executes step 1060, step 1065, and step 1038, and ends the process.
 図11~図14は、ホスト1がストレージ装置2のS-VOLにライト要求を発行した時の処理の流れの説明図である。図11~図14に記載の処理の流れは、図7~図10に記載の処理の流れと多くの点で類似しているので、以下では相違点のみを説明する。また、図7~図10の説明の場合と同様、以下では計算機システムが図1、図2に示された構成であり、ストレージ装置2aにP-VOLが存在し、またこのP-VOLとペア関係にあるS-VOLがストレージ装置2bに存在する場合を例にとって説明する。 FIG. 11 to FIG. 14 are explanatory diagrams of processing flow when the host 1 issues a write request to the S-VOL of the storage apparatus 2. The flow of processing described in FIGS. 11 to 14 is similar in many respects to the flow of processing illustrated in FIGS. 7 to 10, and only the differences will be described below. 7 to 10, the computer system has the configuration shown in FIGS. 1 and 2 below, the P-VOL exists in the storage apparatus 2a, and the P-VOL is paired with the P-VOL. A case where a related S-VOL exists in the storage apparatus 2b will be described as an example.
 図11、図12のステップ2001~ステップ2023は、図7~図8のステップ1001~ステップ1023とほとんど同じである。ただし、ステップ1001~ステップ1023でP-VOLと記載されている箇所(P-VOLに対する処理)は、ステップ2001~ステップ2023ではS-VOLとなり(S-VOLに対する処理に変更される)、またステップ1001~ステップ1023でS-VOLと記載されている箇所(S-VOLに対する処理)は、ステップ2001~ステップ2023ではP-VOLとなる(P-VOLに対する処理に変更される)点が異なる。具体的には、ステップ1002では交替パスプログラム103はP-VOLにライト要求を発行するが、ステップ2002では交替パスプログラム103はS-VOLにライト要求を発行する。 Steps 2001 to 2023 in FIGS. 11 and 12 are almost the same as steps 1001 to 1023 in FIGS. However, the portion described as P-VOL in Step 1001 to Step 1023 (processing for P-VOL) becomes S-VOL in Step 2001 to Step 2023 (changed to processing for S-VOL). The portions described as S-VOL in 1001 to Step 1023 (processing for S-VOL) are different in that they become P-VOL (changed to processing for P-VOL) in Step 2001 to Step 2023. Specifically, in step 1002, the alternate path program 103 issues a write request to the P-VOL, but in step 2002, the alternate path program 103 issues a write request to the S-VOL.
 またステップ1006では、交替パスプログラム103はアクセス対象のP-VOLへの全アクセスパスのパスステータス(C108)が“Failure”か判定するが、ステップ2006では、交替パスプログラム103はアクセス対象のS-VOLへの全アクセスパスのパスステータス(C108)が“Failure”か判定する。ステップ1012では、交替パスプログラム103はアクセス対象のP-VOLの全アクセスパスについて、パスステータス(C108)を“Failure”に変更するが、ステップ2012では交替パスプログラム103は、アクセス対象のS-VOLの全アクセスパスについて、パスステータス(C108)を“Failure”に変更する。 In step 1006, the alternate path program 103 determines whether the path status (C108) of all access paths to the P-VOL to be accessed is “Failure”, but in step 2006, the alternate path program 103 determines whether the alternate path program 103 is the S-target to be accessed. It is determined whether the path status (C108) of all access paths to the VOL is “Failure”. In step 1012, the alternate path program 103 changes the path status (C108) to “Failure” for all access paths of the P-VOL to be accessed. In step 2012, the alternate path program 103 executes the S-VOL to be accessed. For all the access paths, the path status (C108) is changed to “Failure”.
 またステップ1013では、交替パスプログラム103はアクセス対象のP-VOLの、ホストーストレージ間全パス障害フラグ(C113)を“ON”にするが、ステップ2013では、交替パスプログラム103はアクセス対象のS-VOLの、ホストーストレージ間全パス障害フラグ(C113)を“ON”にする。その他のステップにおいても、図7~図8でP-VOLに対して行われる処理が、図11~図12ではS-VOLに対して行われる処理に変更される。それ以外の点は、図7、図8の処理と図11、図12の処理は同じである。 In step 1013, the alternate path program 103 sets the all-host-storage path failure flag (C113) of the P-VOL to be accessed to “ON”, but in step 2013, the alternate path program 103 sets the S-target to be accessed. -The VOL all-host failure path failure flag (C113) is set to "ON". In other steps as well, the processing performed on the P-VOL in FIGS. 7 to 8 is changed to the processing performed on the S-VOL in FIGS. Except for this point, the processing in FIGS. 7 and 8 is the same as the processing in FIGS. 11 and 12.
 図13、図14に記載の各ステップもやはり、図9、図10に記載の各ステップとほとんど同じである。ただし図9、図10でP-VOLと記載されている箇所の処理は、図13、図14ではS-VOLに対する処理に変更されている点が異なる。たとえばステップ1031では交替パスプログラム103は、P-VOLとペア関係にあるS-VOLに対してライト要求を発行するが、ステップ2031では交替パスプログラム103は、S-VOLとペア関係にあるP-VOLに対してライト要求を発行する処理に変更されている。 The steps described in FIGS. 13 and 14 are also almost the same as the steps described in FIGS. However, the processing at the location described as P-VOL in FIGS. 9 and 10 is different from that in FIGS. 13 and 14 in that it is changed to processing for S-VOL. For example, in step 1031, the alternate path program 103 issues a write request to the S-VOL that is paired with P-VOL, but in step 2031, the alternate path program 103 is a P-pair that is paired with S-VOL. The processing is changed to issue a write request to the VOL.
 図14のステップ2051~ステップ2054は、図10のステップ1051~ステップ1054と同様の処理である。ただし図14では、ステップ2051からステップ2054の間に、図10のステップ1052と同等の処理(計算機システム内の全ホスト1が、今回のライト処理でアクセス対象になったS-VOLにアクセスできない状態か否かを判定する処理)は存在しない。図10の処理では交替パスプログラム103は、計算機システム内の全ホスト1が今回のライト処理でアクセス対象になったP-VOLにアクセスできない状態の場合にはP-VOLを閉塞させ、そうでない場合にはアプリケーションプログラム102にI/Oエラーを応答する。図14の処理では交替パスプログラム103は、計算機システム内の全ホスト1が今回のライト処理でアクセス対象になったS-VOLにアクセス可能か否かにかかわらず、一律S-VOLを閉塞させるようストレージ装置2bに指示する(ステップ2053)。 Steps 2051 to 2054 in FIG. 14 are the same processes as steps 1051 to 1054 in FIG. However, in FIG. 14, between step 2051 and step 2054, the same processing as in step 1052 in FIG. 10 (all hosts 1 in the computer system cannot access the S-VOL to be accessed in this write processing) There is no process for determining whether or not. In the processing of FIG. 10, the alternate path program 103 blocks the P-VOL when all the hosts 1 in the computer system cannot access the P-VOL that is the access target in the current write processing, and otherwise In response, an I / O error is returned to the application program 102. In the processing of FIG. 14, the alternate path program 103 uniformly blocks the S-VOL regardless of whether or not all the hosts 1 in the computer system can access the S-VOL accessed by the current write processing. The storage device 2b is instructed (step 2053).
 ステップ2075は、図10のステップ1075と同等の処理で、交替パスプログラム103はP-VOLに代えてS-VOLにライト要求を発行する点だけが異なる。またステップ2024、ステップ2026、ステップ2060は、図10のステップ1024、ステップ1026、ステップ1060と同様の処理である。ただしステップ2024では、ストレージ間パス5aの障害を示すエラー応答が返却されたか否かが判定され、ステップ2026では交替パスプログラム103はアクセス対象のP-VOLの、P→S間全パス障害フラグ(C114)を“ON”にする。またステップ2024で、ストレージ間パス5aの障害を示すエラー応答が返却されなかった場合(ステップ2024:No)、ステップ2060は実行されない。 Step 2075 is the same processing as Step 1075 in FIG. 10, except that the alternate path program 103 issues a write request to the S-VOL instead of the P-VOL. Steps 2024, 2026, and 2060 are the same processes as steps 1024, 1026, and 1060 in FIG. However, in step 2024, it is determined whether or not an error response indicating a failure in the inter-storage path 5a has been returned. In step 2026, the alternate path program 103 sets the all-path failure flag between P → S of the P-VOL to be accessed ( C114) is turned “ON”. If no error response indicating a failure in the inter-storage path 5a is returned in step 2024 (step 2024: No), step 2060 is not executed.
 またステップ2071は、図10のステップ1070と似た処理であるが、S-VOLに代えてP-VOLの閉塞が行われる。また図14ではステップ2071の前に、図10のステップ1052と同様の処理が行われる。つまりステップ2071の前に、交替パスプログラム103は、計算機システム内の全ホスト1について、今回のライト処理でアクセス対象になったP-VOLへのアクセスパスを有するホスト1があるか判定する(ステップ2070)。この判定が肯定的な場合、つまり今回のライト処理でアクセス対象になったP-VOLへの正常なアクセスパスが存在する場合(ステップ2070:No)、交替パスプログラム103はステップ2037、ステップ2038を実行して処理を終了する。ステップ2070の判定が否定的な場合(計算機システム内の全ホスト1が、今回のライト処理でアクセス対象になったP-VOLへの正常なアクセスパスを有していない場合)、交替パスプログラム103はP-VOLを閉塞させるようストレージ装置2aに指示する(ステップ2071)。その後交替パスプログラム103は、ステップ2075、ステップ2065、ステップ2038を実行し、処理を終了する。 Step 2071 is similar to step 1070 in FIG. 10, but P-VOL is blocked instead of S-VOL. In FIG. 14, the same processing as step 1052 of FIG. 10 is performed before step 2071. In other words, before step 2071, the alternate path program 103 determines whether there is a host 1 having an access path to the P-VOL that is the access target in the current write processing for all the hosts 1 in the computer system (step 2070). If this determination is affirmative, that is, if there is a normal access path to the P-VOL that is the access target in the current write process (step 2070: No), the alternate path program 103 executes steps 2037 and 2038. Execute to finish the process. If the determination in step 2070 is negative (when all the hosts 1 in the computer system do not have a normal access path to the P-VOL that is the access target in the current write process), the alternate path program 103 Instructs the storage apparatus 2a to block the P-VOL (step 2071). Thereafter, the alternate path program 103 executes Step 2075, Step 2065, and Step 2038, and ends the process.
 続いて、管理サーバ3(統合管理プログラム301)で行われる処理の流れを、図15~図17を用いて説明する。なお、図15~図17において、台形のボックスはループ処理の開始を表し、逆台形のボックスはループ処理の終了を表す。たとえば図15では、ステップ5004に台形のボックスが、そして図16のステップ5025に逆台形のボックスがある。そしてステップ5004には「ボリュームペア数分ループ」と記載されている。この場合、ステップ5004とステップ5025の間にある処理(ステップ5005~ステップ5024)が、管理サーバ3の管理下にあるボリュームペア(ストレージ装置2の有するボリュームペア)の数だけ、繰り返し実行される。 Subsequently, the flow of processing performed by the management server 3 (integrated management program 301) will be described with reference to FIGS. 15 to 17, the trapezoid box represents the start of the loop process, and the inverted trapezoid box represents the end of the loop process. For example, in FIG. 15, there is a trapezoid box at step 5004 and an inverted trapezoid box at step 5025 in FIG. In step 5004, “loop for the number of volume pairs” is described. In this case, the processing between Step 5004 and Step 5025 (Step 5005 to Step 5024) is repeatedly executed for the number of volume pairs (volume pairs possessed by the storage apparatus 2) under the management of the management server 3.
 統合管理プログラム301は、ホスト1からイベントが通知されるのを待ち続けており、ホスト1からイベントが通知されると、ステップ5001からの処理を開始する。ステップ5001,5002で統合管理プログラム301は、ホスト1からイベントを受領し、パス管理DB(統合パス管理テーブルT200)に、受領したイベントの内容を反映する。 The integrated management program 301 continues to wait for an event notification from the host 1, and starts the processing from step 5001 when the event is notified from the host 1. In steps 5001 and 5002, the integrated management program 301 receives an event from the host 1, and reflects the content of the received event in the path management DB (integrated path management table T200).
 統合パス管理テーブルT200に、受領したイベントの内容が反映される時の処理の概要を説明する。先にも述べたが、ホスト1から管理サーバ3に通知されるイベントは、ホスト1が管理する交替パス管理テーブルT100の内容を含んだ情報である。イベントにはこれ以外の情報、たとえばホスト1のパスステータスが変更された旨の情報などが含まれていてもよい。管理サーバ3が、ホスト名が“host A”であるホスト1(以下、このホスト1を“host A”と呼ぶ)からイベントを通知された時、管理サーバ3はホスト1が有する交替パス管理テーブルT100の全内容を受信する。統合管理プログラム301はステップ5002で、受信した交替パス管理テーブルT100の内容を、統合パス管理テーブルT200の行(レコード)のうち、ホスト名(C201)が“host A”の行に反映する。 An outline of processing when the contents of the received event are reflected in the integrated path management table T200 will be described. As described above, the event notified from the host 1 to the management server 3 is information including the contents of the alternate path management table T100 managed by the host 1. The event may include other information, for example, information indicating that the path status of the host 1 has been changed. When the management server 3 is notified of an event from the host 1 whose host name is “host A” (hereinafter, this host 1 is called “host A”), the management server 3 has an alternate path management table that the host 1 has. Receive the entire contents of T100. In step 5002, the integrated management program 301 reflects the received contents of the alternate path management table T100 in the row (record) of the integrated path management table T200 with the host name (C201) being “host A”.
 なお、この時、ステップ5002では、ホスト名(C201)が“host A”以外の行についても、P→S間全パス障害フラグ(C214)、S→P間全パス障害フラグ(C215)の内容が変更されることがある。図6を例にとって説明する。図6は、統合管理プログラム301がhost Aから受領した情報を統合パス管理テーブルT200に反映中の状態、とくに統合パス管理テーブルT200内の、ホスト名(C201)が“host A”の行に情報が反映された直後の状態を表している。 At this time, in step 5002, the contents of the all-path failure flag between P → S (C214) and the all-path failure flag between S → P (C215) are also obtained for lines other than the host name (C201) “host A”. May change. An explanation will be given by taking FIG. 6 as an example. FIG. 6 shows a state in which the information received from the host A by the integrated management program 301 is being reflected in the integrated path management table T200. In particular, the information in the row of the host name (C201) “host A” in the integrated path management table T200. Represents the state immediately after is reflected.
 図6では、ホスト名(C201)が“host A”の行のS→P間全パス障害フラグ(C215)が“ON”に変更されている。またこの行(S→P間全パス障害フラグ(C215)が“ON”に変更されている行)は、ペア#(C202)が1のボリュームペアに関する情報が格納された行である。この場合、これ以外の行で、ペア#(C202)が1の行についても、S→P間全パス障害フラグ(C215)を、“ON”に変更する。図6において“OFF→ON”と記載されている欄は、ホスト1から受領したイベントによって、S→P間全パス障害フラグ(C215)が“ON”に変更されることを表している。 In FIG. 6, the S → P all-path failure flag (C215) in the row where the host name (C201) is “host A” is changed to “ON”. Further, this line (the line in which the S → P all-path failure flag (C215) is changed to “ON”) is a line in which information on the volume pair having the pair # (C202) of 1 is stored. In this case, the S → P all-path failure flag (C215) is also changed to “ON” for the other rows where the pair # (C202) is 1. In FIG. 6, the column “OFF → ON” indicates that the S → P all-path failure flag (C 215) is changed to “ON” by the event received from the host 1.
 なお、host Aから受領したP→S間全パス障害フラグ(C114)またはS→P間全パス障害フラグ(C115)の情報が“ON”であった場合には、上で説明したように統合管理プログラム301は、ホスト名(C201)が“host A”以外の行について、P→S間全パス障害フラグ(C214)、S→P間全パス障害フラグ(C215)の内容を変更する。ただし、host Aから受領したP→S間全パス障害フラグ(C114)またはS→P間全パス障害フラグ(C115)の情報が“OFF”であった場合は、統合管理プログラム301はホスト名(C201)が“host A”以外の行について変更を行わない。P→S間全パス障害フラグ(C214)やS→P間全パス障害フラグ(C215)の内容が変更される契機は、ストレージ間パス5の障害が復旧し、ストレージ間パス5を使用するボリュームペアのペアステータスが正常な状態に戻った場合(たとえばSuspend(またはDuplex(S))状態からDuplex状態に遷移した場合)である。この場合、ペアステータスが変更されたことがストレージ装置2から管理サーバ3に通知され、管理サーバ3はそれに応じてP→S間全パス障害フラグ(C214)やS→P間全パス障害フラグ(C215)の内容を変更する。 If the P → S all-path failure flag (C114) or S → P all-path failure flag (C115) information received from host A is “ON”, integration is performed as described above. The management program 301 changes the contents of the P → S all-path failure flag (C214) and the S → P all-path failure flag (C215) for lines other than the host name (C201) “host A”. However, if the information of the P → S all path failure flag (C114) or the S → P all path failure flag (C115) received from host A is “OFF”, the integrated management program 301 uses the host name ( C201) does not change any lines other than “host A”. When the contents of the all-path failure flag between P → S (C214) and the all-path failure flag between S → P (C215) are changed, the volume that uses the inter-storage path 5 is recovered after the failure of the inter-storage path 5 This is a case where the pair status of the pair returns to a normal state (for example, when the Suspend (or Duplex (S)) state transitions to the Duplex state). In this case, the storage device 2 notifies the management server 3 that the pair status has been changed, and the management server 3 accordingly responds to the P → S all-path failure flag (C214) and the S → P all-path failure flag ( The content of C215) is changed.
 続いて統合管理プログラム301は、パス管理DB(統合パス管理テーブルT200)の内容を読み出す(ステップ5003)。ここでは全ホスト1についての内容が読み出される。 Subsequently, the integrated management program 301 reads the contents of the path management DB (integrated path management table T200) (step 5003). Here, the contents for all the hosts 1 are read.
 ステップ5004で、統合管理プログラム301は、管理下のボリュームペアを1つ選択する。管理下の全てのボリュームペアの情報は、統合パス管理テーブルT200に記録されている。たとえば図6の例では、各行のペア#(C202)に、1、2,3または4が格納されているので、管理下のボリュームペアはペア#1~ペア#4である。 In step 5004, the integrated management program 301 selects one managed volume pair. Information on all volume pairs under management is recorded in the integrated path management table T200. For example, in the example of FIG. 6, 1, 2, 3, or 4 is stored in the pair # (C202) of each row, so the volume pairs under management are pair # 1 to pair # 4.
 ステップ5004の後、統合管理プログラム301はステップ5005~ステップ5024の処理を行う。ステップ5024の後、まだステップ5005~ステップ5024の処理が行われていないボリュームペアがあったら、統合管理プログラム301はそのボリュームペアを選択し(ステップ5004)、そのボリュームペアについてステップ5005~ステップ5024の処理を行う。この処理を、全てのボリュームペアについて実施したら、統合管理プログラム301は処理を終了する。以下では、ペア#n(nは1~4のいずれかの値)について、ステップ5005~ステップ5024の処理が実行される場合の例を説明する。 After step 5004, the integrated management program 301 performs steps 5005 to 5024. After step 5024, if there is a volume pair that has not yet been processed in steps 5005 to 5024, the integrated management program 301 selects the volume pair (step 5004), and steps 5005 to 5024 for that volume pair. Process. When this process is performed for all volume pairs, the integrated management program 301 ends the process. Hereinafter, an example will be described in which the processing of Step 5005 to Step 5024 is executed for the pair #n (n is any value of 1 to 4).
 ステップ5005では統合管理プログラム301は、ペア#nのストレージ間パス5の全パス障害フラグを確認する。具体的には統合管理プログラム301は、ペア#(C202)がnの行の、P→S間全パス障害フラグ(C214)、S→P間全パス障害フラグ(C215)がOFFかONかを確認する。複数のホスト1がペア#nにアクセスする場合、ペア#(C202)がnの行は複数存在する。その場合、統合管理プログラム301はいずれの行のP→S間全パス障害フラグ(C214)、S→P間全パス障害フラグ(C215)を参照してもよい。 In step 5005, the integrated management program 301 checks the all-path failure flag of the inter-storage path 5 of the pair #n. Specifically, the integrated management program 301 determines whether the P → S all-path failure flag (C214) and the S → P all-path failure flag (C215) in the row where the pair # (C202) is n is OFF or ON. Check. When a plurality of hosts 1 access the pair #n, there are a plurality of rows in which the pair # (C202) is n. In that case, the integrated management program 301 may refer to the P → S all-path failure flag (C214) and the S → P all-path failure flag (C215) in any row.
 P→S間全パス障害フラグ(C214)、S→P間全パス障害フラグ(C215)が両方ともONだった場合(ステップ5006:Yes)、統合管理プログラム301は、ペア#nを使用する全ホスト1について、ペア#nに属する論理デバイス(P-VOL,S-VOL)のパスステータス(C208)の状態を確認し、パスステータス(C208)の数を集計する(ステップ5008)。集計結果は、利用可能パス本数(C209)に格納される。なお、ステップ5008において、統合管理プログラム301は、ペア#nを使用する全ホスト1から、ホスト1が持つ交替パス管理テーブルT100で管理されている、ペア#nに属する論理デバイス(P-VOL,S-VOL)のパスステータス(C108)を取得して、その情報を用いてパスステータス(C208)と利用可能パス本数(C209)の更新を行ってもよい。 If both the P → S all-path failure flag (C214) and the S → P all-path failure flag (C215) are both ON (step 5006: Yes), the integrated management program 301 uses all pairs #n. For the host 1, the status of the path status (C208) of the logical device (P-VOL, S-VOL) belonging to the pair #n is confirmed, and the number of path statuses (C208) is totaled (step 5008). The total result is stored in the number of available paths (C209). In step 5008, the integrated management program 301 starts from all the hosts 1 that use the pair #n, and manages the logical devices (P-VOL, P-VOL,) managed by the alternate path management table T100 that the host 1 has. The path status (C108) of S-VOL) may be acquired, and the path status (C208) and the number of available paths (C209) may be updated using the information.
 ペア#nを使用する全ホスト1について、ステップ5008が行われた後、統合管理プログラム301は、ペア#nのP-VOLとペア#nを使用する全ホスト1との間の正常なアクセスパスの数(以下、「ホスト-P-VOL間正常パス数」と呼ぶ)と、ペア#nのS-VOLとペア#nを使用する全ホスト1との間の正常なアクセスパスの数(以下、「ホスト-S-VOL間正常パス数」と呼ぶ)とを比較する。ホスト-P-VOL間正常パス数がホスト-S-VOL間正常パス数よりも少ない場合(ステップ5010:Yes)、ステップ5011~ステップ5016までの処理が行われる。そうでない場合(ステップ5010:No)、統合管理プログラム301はステップ5011~ステップ5016の処理を行わず、ステップ5017を行う。 After step 5008 is performed for all the hosts 1 that use the pair #n, the integrated management program 301 executes a normal access path between the P-VOL of the pair #n and all the hosts 1 that use the pair #n. (Hereinafter referred to as “the number of normal paths between the host and P-VOL”) and the number of normal access paths between the S-VOL of pair #n and all hosts 1 using pair #n (hereinafter referred to as “host-P-VOL normal path number”). , Referred to as “the number of normal paths between the host and S-VOL”). When the number of normal paths between the host and P-VOL is smaller than the number of normal paths between the host and S-VOL (step 5010: Yes), the processing from step 5011 to step 5016 is performed. Otherwise (step 5010: No), the integrated management program 301 does not perform the processing of steps 5011 to 5016, but performs step 5017.
 ステップ5010の判定がYesの場合、統合管理プログラム301はストレージ装置2に、ペア#nのP-VOLとS-VOLを反転させることを管理ネットワーク6経由で指示する(ステップ5011)。本実施例で「反転」とは、P-VOLとS-VOLの役割を入れ替える処理のことを意味する。つまり、反転が指示されると、これまでP-VOLだった論理デバイスはS-VOLに変更され、逆にこれまでS-VOLだった論理デバイスはP-VOLにされる。 If the determination in step 5010 is Yes, the integrated management program 301 instructs the storage apparatus 2 via the management network 6 to reverse the P-VOL and S-VOL of the pair #n (step 5011). In this embodiment, “inversion” means a process of switching the roles of P-VOL and S-VOL. That is, when inversion is instructed, the logical device that was previously P-VOL is changed to S-VOL, and conversely, the logical device that was previously S-VOL is changed to P-VOL.
 この指示を受信したストレージ装置2は、ペア#nについて、これまでP-VOLだった論理デバイスをS-VOLにし、これまでS-VOLだった論理デバイスをP-VOLにする。具体的にはストレージ装置2の制御プログラム20は、ペア管理テーブルT300のPDKC#(C303)及びP-VOL#(C304)の内容と、SDKC#(C305)及びS-VOL#(C304)の内容を入れ替える。なおこの時、統合管理プログラム301はストレージ装置2aとストレージ装置2bの両方に指示を出し、ストレージ装置2aとストレージ装置2bはそれぞれ、自身の有するペア管理テーブルT300の内容の更新を行う。 Upon receipt of this instruction, the storage apparatus 2 sets the logical device that has been P-VOL so far to S-VOL and the logical device that has been S-VOL to P-VOL for pair #n. Specifically, the control program 20 of the storage apparatus 2 reads the contents of PDKC # (C303) and P-VOL # (C304) and the contents of SDKC # (C305) and S-VOL # (C304) in the pair management table T300. Replace. At this time, the integrated management program 301 issues an instruction to both the storage device 2a and the storage device 2b, and the storage device 2a and the storage device 2b each update the contents of the pair management table T300 that they own.
 またステップ5012で統合管理プログラム301は、統合パス管理テーブルT200に記録されている情報も更新する。つまり、反転された論理デバイスについて、属性(C207)を変更する(これまで“P-VOL”が格納されていた場合には“S-VOL”に変更され、“S-VOL”が格納されていた場合、“P-VOL”に変更される)。 In step 5012, the integrated management program 301 also updates the information recorded in the integrated path management table T200. In other words, the attribute (C207) of the inverted logical device is changed (if “P-VOL” has been stored so far, it is changed to “S-VOL” and “S-VOL” is stored). If it is, it is changed to “P-VOL”).
 続いて統合管理プログラム301は、ペア#nを使用する全ホスト1に対して、ペア#nのP-VOLとS-VOLが反転されたことを通知し(ステップ5014)、またパスステータス(C208)を再集計する(ステップ5015)。ステップ5015はステップ5008と同じ処理である。ペア#nのP-VOLとS-VOLが反転されたことを通知されたホスト1は、自身が管理する交替パス管理テーブルT100の内容を更新する(ペア#nのP-VOLとS-VOLについて、属性(C107)を更新する)。 Subsequently, the integrated management program 301 notifies all the hosts 1 that use the pair #n that the P-VOL and S-VOL of the pair #n have been inverted (step 5014), and the path status (C208). ) Are recounted (step 5015). Step 5015 is the same processing as step 5008. The host 1 notified that the P-VOL and S-VOL of the pair #n have been inverted updates the contents of the alternate path management table T100 managed by the host 1 (the P-VOL and S-VOL of the pair #n) , The attribute (C107) is updated).
 ステップ5017では、統合管理プログラム301はストレージ装置2に、ペア#nのS-VOLを閉塞状態にすることを指示し、同時に統合パス管理テーブルT200の内容を更新する。ここでS-VOLの閉塞が指示されるストレージ装置2は、S-VOLを有しているストレージ装置2である。 In step 5017, the integrated management program 301 instructs the storage apparatus 2 to put the S-VOL of the pair #n into a closed state, and simultaneously updates the contents of the integrated path management table T200. Here, the storage apparatus 2 instructed to close the S-VOL is the storage apparatus 2 having the S-VOL.
 ステップ5017の後、統合管理プログラム301はペア#nを使用する全ホスト1に対して、ペア#nのS-VOLが閉塞状態になったことを通知する(ステップ5019)。S-VOLが閉塞状態になった通知を受けたホスト1は、ペア#nに属するS-VOLへの全アクセスパスパスステータス(C108)を“Failure”に変更する。 After step 5017, the integrated management program 301 notifies all the hosts 1 that use the pair #n that the S-VOL of the pair #n is blocked (step 5019). Receiving the notification that the S-VOL is blocked, the host 1 changes the status of all access path paths (C108) to the S-VOL belonging to the pair #n to “Failure”.
 つまり、P→S間全パス障害フラグ(C214)、S→P間全パス障害フラグ(C215)が両方ともONの場合、ストレージ装置2はリモートコピー機能によるデータの複製ができない。そのため統合管理プログラム301はステップ5010~ステップ5017を実行することにより、P-VOLとS-VOLのうち、一方を閉塞状態に変更し、もう一方だけをホスト1からアクセス可能な状態のまま残す。具体的にはホスト1から利用可能なアクセスパスの数が多い論理デバイスは、ホスト1からアクセス可能な状態が維持され、もう一方の論理デバイス(ホスト1から利用可能なアクセスパスの数が少ない論理デバイス)は閉塞状態にされる。ホスト1から利用可能なアクセスパスの数が多い論理デバイスをアクセス可能な状態のまま残す理由は、アクセスパスの数が多いほど、障害への耐性が強いことが期待されるからである(ホスト1とストレージ装置2間のアクセスパスの障害が発生しても、業務継続が可能)。 That is, when both the P → S all path failure flag (C214) and the S → P all path failure flag (C215) are both ON, the storage apparatus 2 cannot replicate data by the remote copy function. Therefore, the integrated management program 301 executes steps 5010 to 5017 to change one of the P-VOL and the S-VOL to the blocked state and leave only the other one accessible from the host 1. Specifically, a logical device having a large number of access paths available from the host 1 is maintained in a state accessible from the host 1, and the other logical device (a logical device having a small number of access paths available from the host 1 is maintained. Device) is blocked. The reason why a logical device having a large number of access paths available from the host 1 remains in an accessible state is that the larger the number of access paths, the higher the resistance to failure is expected (host 1). Even if an access path failure occurs between the storage device 2 and the storage device 2, the business can be continued).
 その後統合管理プログラム301は、ペア#nを使用する全ホスト1に対して、ペア#nのP-VOLと各ホスト1間の利用可能なパスの本数の情報を通知し(ステップ5023)、処理を終了する。ステップ5023の詳細は後述する。 Thereafter, the integrated management program 301 notifies all hosts 1 using the pair #n of information on the number of paths available between the P-VOL of the pair #n and each host 1 (step 5023). Exit. Details of step 5023 will be described later.
 ステップ5005を実行した結果、P→S間全パス障害フラグ(C214)のみがONだった場合(ステップ5006:No、かつステップ5030:Yes)、統合管理プログラム301はまず、ステップ5031~ステップ5036を実行する。ステップ5031~ステップ5036の処理は、ステップ5011~ステップ5016と同じである。つまり統合管理プログラム301は、ペア#nに属するP-VOLとS-VOLを反転させ(ステップ5031)、その結果を統合パス管理テーブルT200に反映するとともに(ステップ5032)、ペア#nを使用する各ホスト1に通知する(ステップ5034)。またパスステータス(C208)の再集計も行われる(ステップ5035)。 As a result of executing Step 5005, when only the P → S all-path failure flag (C214) is ON (Step 5006: No, and Step 5030: Yes), the integrated management program 301 first performs Step 5031 to Step 5036. Execute. The processing of step 5031 to step 5036 is the same as that of step 5011 to step 5016. That is, the integrated management program 301 reverses the P-VOL and S-VOL belonging to the pair #n (step 5031), reflects the result in the integrated path management table T200 (step 5032), and uses the pair #n. Each host 1 is notified (step 5034). The path status (C208) is also recounted (step 5035).
 その後、統合管理プログラム301はペア#nのペアステータスの変更をストレージ装置2に指示する(ステップ5037)。ここではペアステータスをDuplex(S)状態に変更する指示が、ストレージ装置2に送られる。この指示を受けたストレージ装置2は、ペア#nのペアステータス(ペア管理テーブルT300のPair Status(C302))を“2”に変更する。そして統合管理プログラム301は、ペア#nを使用する全ホスト1に対して、ペア#nのペアステータスをDuplex(S)状態に変更したことを通知する(ステップ5041)。ホスト1はこの通知を受領すると、交替パス管理テーブルT100の内容(ペア#nのボリュームペア状態(C112))を“Duplex(S)”に変更する。ペア#nのボリュームペア状態(C112)がDuplex(S)状態に変更されると、ホスト1はペア#nへのデータ書き込みをする場合、P-VOLにのみライト要求を発行するようになる。最後に統合管理プログラム301はペア#nを使用する全ホスト1に対して、ペア#nのP-VOLと各ホスト1間の利用可能なパスの本数を通知し(ステップ5023)、処理を終了する。 Thereafter, the integrated management program 301 instructs the storage apparatus 2 to change the pair status of the pair #n (step 5037). Here, an instruction to change the pair status to the Duplex (S) state is sent to the storage apparatus 2. Receiving this instruction, the storage apparatus 2 changes the pair status (Pair Status (C302) of the pair management table T300) of the pair #n to “2”. Then, the integrated management program 301 notifies all the hosts 1 using the pair #n that the pair status of the pair #n has been changed to the Duplex (S) state (step 5041). Upon receiving this notification, the host 1 changes the contents of the alternate path management table T100 (volume pair status (C112) of pair #n) to “Duplex (S)”. When the volume pair state (C112) of the pair #n is changed to the Duplex (S) state, the host 1 issues a write request only to the P-VOL when writing data to the pair #n. Finally, the integrated management program 301 notifies all the hosts 1 that use the pair #n of the number of paths available between the P-VOL of the pair #n and each host 1 (step 5023), and the processing ends. To do.
 ステップ5005を実行した結果、S→P間全パス障害フラグ(C215)のみがONだった場合(ステップ5006:No、かつステップ5030:No、かつステップ5038:Yes)、統合管理プログラム301は、ステップ5037~ステップ5043、そしてステップ5022~ステップ5024を実行し、処理を終了する。つまりこの場合、P→S間全パス障害フラグ(C214)のみがONだった時に行われる処理とほとんど同じである。S→P間全パス障害フラグ(C215)のみがONだった場合には、ステップ5031~ステップ5036が行われないことが、P→S間全パス障害フラグ(C214)のみがONだった場合との違いであり、それ以外の処理は同じである。 As a result of executing Step 5005, when only the S → P all-path failure flag (C215) is ON (Step 5006: No, Step 5030: No, and Step 5038: Yes), the integrated management program 301 Steps 5037 to 5043 and steps 5022 to 5024 are executed, and the process ends. That is, in this case, the process is almost the same as the process performed when only the P → S all path failure flag (C214) is ON. If only the S → P all-path failure flag (C215) is ON, Steps 5031 to 5036 are not performed, and only the P → S all-path failure flag (C214) is ON. The other processing is the same.
 つまり、P→S間全パス障害フラグ(C214)のみがONだった場合、あるいはS→P間全パス障害フラグ(C215)のみがONだった場合(言い換えると、ストレージ間パス5a、5bのうち、一方のパス(ストレージ間パス5a、またはストレージ間パス5b)のみが遮断されている場合)、統合管理プログラム301はストレージ装置2に対して、ペア#nをDuplex(S)状態に変更させ、かつ必要に応じてP-VOLとS-VOLを反転させる。また統合管理プログラム301は、ホスト1からS-VOLへの書き込みは行わせないようにする。これにより、ペア#nに対して、ストレージ装置2によるミラーリングが行われる状態を維持することができる。 In other words, when only the P → S all-path failure flag (C214) is ON, or when only the S → P all-path failure flag (C215) is ON (in other words, of the inter-storage paths 5a and 5b). The integrated management program 301 causes the storage apparatus 2 to change the pair #n to the Duplex (S) state when only one path (when only the inter-storage path 5a or the inter-storage path 5b) is blocked) In addition, P-VOL and S-VOL are inverted as necessary. Also, the integrated management program 301 prevents the host 1 from writing to the S-VOL. As a result, it is possible to maintain a state in which mirroring by the storage apparatus 2 is performed on the pair #n.
 P→S間全パス障害フラグ(C214)、S→P間全パス障害フラグ(C215)が両方ともOFFだった場合(ステップ5006:No、かつステップ5030:No、かつステップ5038:No)、統合管理プログラム301は、ペア#nを使用する全ホスト1について、ホスト1とペア#nに属するP-VOL,S-VOLとの間の利用可能なパス本数を集計し、利用可能パス本数(C209)に格納する(ステップ5052)。続いて統合管理プログラム301は、各ホスト1とペア#nに属するP-VOLとの間の利用可能なパス本数の平均を算出するとともに、各ホスト1とペア#nに属するS-VOLとの間の利用可能なパス本数の平均を算出する(ステップ5054)。 When the P → S all path failure flag (C214) and the S → P all path failure flag (C215) are both OFF (step 5006: No, step 5030: No, and step 5038: No), integration The management program 301 totals the number of available paths between the host 1 and the P-VOL and S-VOL belonging to the pair #n for all the hosts 1 that use the pair #n, and the number of available paths (C209) (Step 5052). Subsequently, the integrated management program 301 calculates the average number of available paths between each host 1 and the P-VOL belonging to the pair #n, and at the same time, compares each host 1 with the S-VOL belonging to the pair #n. The average number of available paths is calculated (step 5054).
 各ホスト1とペア#nに属するP-VOLとの間の利用可能なパス本数の平均が、各ホスト1とペア#nに属するS-VOLとの間の利用可能なパス本数の平均よりも小さい場合(ステップ5055:Yes)、統合管理プログラム301はステップ5056~ステップ5061を実行する。ステップ5056~ステップ5061は、ステップ5031~ステップ5036と同じ処理である。つまりペア#nに属するP-VOLとS-VOLの反転等が行われる。これは正常なアクセスパスの数が多い論理デバイスをP-VOLとしたほうが、耐障害性が高まるからである。一方ステップ5055の判定が否定的だった場合、ステップ5056~ステップ5061は行われない。ステップ5054~ステップ5061の処理により、ホスト1からの平均アクセスパス数が多い論理デバイスがP-VOLになるよう、ストレージ装置2とホスト1の設定が変更される。 The average number of available paths between each host 1 and the P-VOL belonging to pair #n is greater than the average number of available paths between each host 1 and S-VOL belonging to pair #n. If it is smaller (step 5055: Yes), the integrated management program 301 executes step 5056 to step 5061. Steps 5056 to 5061 are the same as steps 5031 to 5036. That is, inversion of the P-VOL and S-VOL belonging to the pair #n is performed. This is because fault tolerance is enhanced when a logical device having a large number of normal access paths is set to P-VOL. On the other hand, if the determination in step 5055 is negative, steps 5056 to 5061 are not performed. Through the processing from step 5054 to step 5061, the settings of the storage apparatus 2 and the host 1 are changed so that a logical device having a large average access path number from the host 1 becomes a P-VOL.
 その後、統合管理プログラム301はペア#nを使用する全ホスト1に対して、ペア#nのP-VOLと各ホスト1間の利用可能なパスの本数を通知し(ステップ5022~ステップ5024)、処理を終了する。 Thereafter, the integrated management program 301 notifies all the hosts 1 using the pair #n of the number of paths available between the P-VOL of the pair #n and each host 1 (steps 5022 to 5024). The process ends.
 ステップ5023の具体内容、及びステップ5023の通知を受けた時のホスト1の動作について説明する。ステップ5023では、統合管理プログラム301は統合パス管理テーブルT200を参照し、論理デバイスごとに、利用可能パス本数(C209)の合計を計算する。図6を用いて例を説明する。 The specific contents of step 5023 and the operation of the host 1 when receiving the notification of step 5023 will be described. In step 5023, the integrated management program 301 refers to the integrated path management table T200 and calculates the total number of available paths (C209) for each logical device. An example will be described with reference to FIG.
 図6を参照すると、製番(C210)が“0001”でLDEV#(C206)が“1”の論理デバイス(以下ではこの論理デバイスを、ターゲットLDEVと呼ぶ)は、host A、host B、host Dとの間にアクセスパスが存在することが分かる。またhost AとターゲットLDEV間の、利用可能パス本数(C209)は“1”、host BとターゲットLDEV間の、利用可能パス本数(C209)は“1”、host DとターゲットLDEV間の、利用可能パス本数(C209)は“1”である。そのため、全ホスト1とターゲットLDEV間の利用可能パス本数の合計は3である。 Referring to FIG. 6, the logical device having the product number (C210) “0001” and the LDEV # (C206) “1” (hereinafter, this logical device is called a target LDEV) is host A, host B, and host. It can be seen that there is an access path with D. In addition, the number of available paths between host A and target LDEV (C209) is “1”, the number of available paths between host B and target LDEV (C209) is “1”, and between host D and target LDEV. The number of possible paths (C209) is “1”. Therefore, the total number of available paths between all the hosts 1 and the target LDEV is 3.
 このように統合管理プログラム301は、論理デバイスごとに、利用可能パス本数(C209)の合計を算出し、各ホスト1に通知するための通知情報T250を作成する。通知情報T250のフォーマットの例を図18に示す。製番(C251)、LDEV#(C252)で特定される論理デバイスの利用可能パス本数の合計値が、パス数(C253)に格納されている。統合管理プログラム301はこの通知情報T250を各ホスト1に送信する。 In this way, the integrated management program 301 calculates the total number of available paths (C209) for each logical device, and creates notification information T250 for notifying each host 1. An example of the format of the notification information T250 is shown in FIG. The total number of available paths of the logical device specified by the product number (C251) and LDEV # (C252) is stored in the number of paths (C253). The integrated management program 301 transmits this notification information T250 to each host 1.
 一方、通知情報T250を受信した各ホスト1では、通知情報T250を用いて他ホスト利用可能パス本数(C109-2)を更新する。図5及び図18を用いて更新方法の一例を説明する。通知情報T250を参照すると、製番(C251)が“0001”でLDEV#(C252)が“1”の論理デバイスのパス数(C253)は“3”である。交替パスプログラム103は、交替パス管理テーブルT100のレコードのうち、製番(C110)とLDEV#(C106)がそれぞれ、“0001”、“1”のレコードの利用可能パス本数(C109)の値を特定する。図5の例では、この値は“1”である。 On the other hand, each host 1 that has received the notification information T250 updates the number of paths available to other hosts (C109-2) using the notification information T250. An example of the update method will be described with reference to FIGS. Referring to the notification information T250, the number of paths (C253) of the logical device whose product number (C251) is “0001” and LDEV # (C252) is “1” is “3”. The alternate path program 103 sets the values of the number of available paths (C109) of records with the production number (C110) and the LDEV # (C106) of “0001” and “1”, respectively, among the records of the alternate path management table T100. Identify. In the example of FIG. 5, this value is “1”.
 交替パスプログラムは、このレコードの他ホスト利用可能パス本数(C109-2)に、通知情報から得たパス数(C253)の値“3”と、交替パス管理テーブルT100から得た利用可能パス本数(C109)の値“1”の差(つまり“2”)を格納する。これにより、交替パス管理テーブルT100には、自ホスト以外の各ホストと論理デバイス間の正常なアクセスパス数の合計が格納される。 The alternate path program uses the number “3” of the number of paths (C253) obtained from the notification information and the number of available paths obtained from the alternate path management table T100 in the number of available host paths (C109-2) in this record. The difference (that is, “2”) of the value “1” of (C109) is stored. As a result, the total number of normal access paths between each host other than the own host and the logical device is stored in the alternate path management table T100.
 以上が統合管理プログラム301の処理の流れの説明である。統合管理プログラム301は、ストレージ間パス5と、ホスト1とストレージ装置2(P-VOLやS-VOL)間のパスの状態に応じて、ホスト1の設定、ストレージ装置2の設定を変更する。ストレージ間パス5がすべて使用できない状態の場合(ステップ5006:Yes)、リモートコピー機能によるデータの複製ができない。そのためこの場合、統合管理プログラム301はP-VOL、S-VOLのうち一方のボリュームを閉塞状態にし(ステップ5017)、リモートコピー機能を停止する。さらに、P-VOLと全ホスト1間の正常なアクセスパスの数と、S-VOLと全ホスト1との間の正常なアクセスパスの数を比較し、正常なアクセスパスの数が多い論理デバイスをP-VOLに変更し、かつS-VOLは閉塞する(ステップ5010~ステップ5017)。これは正常なアクセスパスの数が多い論理デバイスに、ホスト1がアクセスするように、計算機システムの設定を変更したほうが、耐障害性が高まるからである。 The above is the description of the processing flow of the integrated management program 301. The integrated management program 301 changes the setting of the host 1 and the setting of the storage device 2 in accordance with the state of the inter-storage path 5 and the path between the host 1 and the storage device 2 (P-VOL or S-VOL). When all the inter-storage paths 5 cannot be used (step 5006: Yes), data cannot be replicated by the remote copy function. Therefore, in this case, the integrated management program 301 puts one of the P-VOL and S-VOL in a closed state (step 5017) and stops the remote copy function. Further, the number of normal access paths between the P-VOL and all the hosts 1 and the number of normal access paths between the S-VOL and all the hosts 1 are compared, and a logical device having a large number of normal access paths. Is changed to P-VOL, and S-VOL is blocked (step 5010 to step 5017). This is because the fault tolerance is improved when the setting of the computer system is changed so that the host 1 accesses a logical device having a large number of normal access paths.
 一方P→S間パスのみ、あるいはS→P間パスのみが使用できない場合(ステップ5030:Yes、またはステップ5038:Yes)、一方向のリモートコピーは実行可能である。そこでこの場合、統合管理プログラム301は、各ホスト1がP-VOLにアクセスするように、ボリュームペアのペアステータスをDuplex(S)状態に変更する(ステップ5037~ステップ5043)。 On the other hand, when only the P → S path or only the S → P path cannot be used (step 5030: Yes or step 5038: Yes), one-way remote copy can be executed. Therefore, in this case, the integrated management program 301 changes the pair status of the volume pair to the Duplex (S) state so that each host 1 accesses the P-VOL (steps 5037 to 5043).
 またストレージ間パス5は正常な場合、ホスト1とP-VOL間パスと、ホスト1とS-VOL間パスのうち、正常なアクセスパス数の多い方の論理デバイスをP-VOLに変更する(ステップ5051~ステップ5061)。これも、正常なアクセスパスの数が多い論理デバイスに、ホスト1が優先的にアクセスするように、計算機システムの設定を変更したほうが、耐障害性が高まるからである。 When the inter-storage path 5 is normal, the logical device having the larger number of normal access paths among the host 1 and P-VOL path and the host 1 and S-VOL path is changed to P-VOL ( Step 5051 to Step 5061). This is also because the fault tolerance is improved if the setting of the computer system is changed so that the host 1 preferentially accesses a logical device having a large number of normal access paths.
 以上が、本発明の一実施形態に係る計算機システムの説明である。本実施例に係る計算機システムでは、ホストがボリュームペアにアクセスするときにアクセス障害が発生した場合、ボリュームペアにアクセス要求を発行したホストだけでなく、計算機システム内の他のホストについてもアクセスパス設定の変更を行う。これにより、ボリュームペアにアクセスするホストが複数存在する環境においても、計算機システムが適切に業務継続できる。 The above is the description of the computer system according to the embodiment of the present invention. In the computer system according to this embodiment, when an access failure occurs when a host accesses a volume pair, access paths are set not only for the host that issued an access request to the volume pair, but also for other hosts in the computer system. Make changes. As a result, even in an environment where there are a plurality of hosts that access the volume pair, the computer system can continue business appropriately.
 以上、本発明の実施例を説明したが、これは、本発明の説明のための例示であって、本発明の範囲をこれらの実施例にのみ限定する趣旨ではない。すなわち、本発明は、他の種々の形態でも実施する事が可能である。 As mentioned above, although the Example of this invention was described, this is an illustration for description of this invention, Comprising: It is not the meaning which limits the scope of the present invention only to these Examples. That is, the present invention can be implemented in various other forms.
 たとえば上で説明した実施例では、ホスト1とは別に管理サーバ3が設けられ、統合管理プログラム301が管理サーバ3で実行される構成が説明された。しかし別の実施形態として、管理サーバ3を設ける代わりに、複数のホスト1のうちいずれかのホスト1で統合管理プログラム301が実行されるようにしてもよい。その場合、各ホスト1は統合管理プログラム301が実行されるホスト1にイベントを通知し、統合管理プログラム301が実行されるホスト1は通知されたイベントを基に、各ホスト1のアクセスパスの設定や、ストレージ装置2の設定の変更を行う。 For example, in the embodiment described above, the configuration in which the management server 3 is provided separately from the host 1 and the integrated management program 301 is executed by the management server 3 has been described. However, as another embodiment, instead of providing the management server 3, the integrated management program 301 may be executed on any one of the plurality of hosts 1. In that case, each host 1 notifies the host 1 on which the integrated management program 301 is executed, and the host 1 on which the integrated management program 301 is executed sets the access path of each host 1 based on the notified event. Or the setting of the storage device 2 is changed.
1:ホスト、2:ストレージ装置、3:管理サーバ、4:ネットワーク、5:ストレージ間パス、6:管理ネットワーク 1: host, 2: storage device, 3: management server, 4: network, 5: path between storages, 6: management network

Claims (15)

  1.  第1ボリュームを有する第1ストレージ装置と第2ボリュームを有する第2ストレージ装置とを有するストレージシステムと、
     前記ストレージシステムにアクセスする複数のホスト、
    とを有する計算機システムであって、
     前記ストレージシステムは、
     前記第1ボリューム及び前記第2ボリュームをボリュームペアとして管理し、
     前記ホストが前記ボリュームペアに対して書き込みを要求したデータを、前記第1ボリューム及び前記第2ボリュームに格納するよう構成されており、
     前記ホストが、前記ボリュームペアにアクセスした際にアクセス障害を検出した場合、前記計算機システムは、
     前記計算機システム内の障害発生部位を特定し、
     特定された前記障害発生部位の情報に基づいて、前記複数のホストの前記ボリュームペアへのアクセスパスの設定の変更、または前記ボリュームペアの設定変更を行うことを特徴とする、計算機システム。
    A storage system having a first storage device having a first volume and a second storage device having a second volume;
    A plurality of hosts accessing the storage system;
    A computer system comprising:
    The storage system
    Managing the first volume and the second volume as a volume pair;
    The host is configured to store data requested to be written to the volume pair in the first volume and the second volume,
    When the host detects an access failure when accessing the volume pair, the computer system
    Identify the fault occurrence site in the computer system,
    A computer system, wherein the setting of the access path to the volume pair of the plurality of hosts is changed or the setting of the volume pair is changed based on the specified information on the failure occurrence site.
  2.  前記計算機システムはさらに管理サーバを有し、
     前記複数のホストはいずれも、前記第1ボリュームへのアクセスパスである第1パスと前記第2ボリュームへのアクセスパスである第2パスとをそれぞれ1以上有し、
     前記ストレージシステムは、前記第1ストレージ装置から前記第2ストレージ装置へデータを転送するための第1転送路と、前記第2ストレージ装置から前記第1ストレージ装置へデータを転送するための第2転送路とを有し、
     前記管理サーバは、前記ホストから前記第1パス及び前記第2パスの状態と、前記第1転送路及び前記第2転送路の状態を受領し、
     前記第1パス、前記第2パス、前記第1転送路及び前記第2転送路の状態に基づいて、前記複数のホストに対して、前記ボリュームペアへのアクセス経路の設定を変更させ、または前記ストレージシステムに対して、前記ボリュームペアの設定変更を行わせる、
    ことを特徴とする、請求項1に記載の計算機システム。
    The computer system further includes a management server,
    Each of the plurality of hosts has at least one first path that is an access path to the first volume and one or more second paths that are access paths to the second volume;
    The storage system includes a first transfer path for transferring data from the first storage device to the second storage device, and a second transfer for transferring data from the second storage device to the first storage device. Road and
    The management server receives the status of the first path and the second path, the status of the first transfer path and the second transfer path from the host,
    Based on the state of the first path, the second path, the first transfer path, and the second transfer path, the setting of the access path to the volume pair is changed for the plurality of hosts, or the Let the storage system change the volume pair settings.
    The computer system according to claim 1, wherein:
  3.  前記管理サーバは、前記第1転送路と前記第2転送路のうち前記第1転送路のみに障害が発生している旨の情報を受領すると、前記複数のホストが前記ボリュームペアに対するデータを書き込む際に、前記第2ボリュームにライト要求を発行するよう、前記複数のホストの設定を変更させる、
    ことを特徴とする、請求項2に記載の計算機システム。
    When the management server receives information indicating that a failure has occurred only in the first transfer path of the first transfer path and the second transfer path, the plurality of hosts write data for the volume pair. And changing the setting of the plurality of hosts so as to issue a write request to the second volume,
    The computer system according to claim 2, wherein:
  4.  前記ストレージシステムは、前記第1ボリュームがプライマリボリュームで前記第2ボリュームがセカンダリボリュームと設定されている場合、前記ホストが前記ボリュームペアに対して書き込みを要求したデータを、前記第1ボリュームに格納した後、前記第2ボリュームに格納するよう、構成されており、
     前記管理サーバは、前記第1転送路と前記第2転送路のうち前記第1転送路のみに障害が発生している旨の情報を受領すると、前記第2ボリュームがプライマリボリュームに、前記第1ボリュームがセカンダリボリュームになるように、前記ストレージシステムの設定を変更させる、
    ことを特徴とする、請求項3に記載の計算機システム。
    When the first volume is set as a primary volume and the second volume is set as a secondary volume, the storage system stores data requested by the host to write to the volume pair in the first volume. And is configured to be stored in the second volume after
    When the management server receives information indicating that a failure has occurred only in the first transfer path out of the first transfer path and the second transfer path, the second volume becomes the primary volume, and the first volume becomes the first volume. Change the setting of the storage system so that the volume becomes a secondary volume,
    The computer system according to claim 3, wherein:
  5.  前記ストレージシステムは、前記第1ボリュームがプライマリボリュームで前記第2ボリュームがセカンダリボリュームと設定されている場合、前記ホストが前記ボリュームペアに対して書き込みを要求したデータを、前記第1ボリュームに格納した後、前記第2ボリュームに格納するよう、構成されており、
     前記管理サーバは、前記第1転送路と前記第2転送路の両方に障害が発生している旨の情報を受領した場合、アクセスに使用可能な前記第1パスの数の合計と、アクセスに使用可能な前記第2パスの数の合計を計数し、
     前記アクセスに使用可能な前記第1パスの数の合計が、前記アクセスに使用可能な前記第2パスの数の合計未満になった場合、前記管理サーバは、
     前記ストレージシステムに前記第1ボリュームを閉塞状態にさせ、
     前記複数のホストが、前記ボリュームペアのうち前記第2ボリュームのみにアクセスするように、前記複数のホストの設定を変更する、
    ことを特徴とする、請求項2に記載の計算機システム。
    When the first volume is set as a primary volume and the second volume is set as a secondary volume, the storage system stores data requested by the host to write to the volume pair in the first volume. And is configured to be stored in the second volume after
    When the management server receives information indicating that a failure has occurred in both the first transfer path and the second transfer path, the management server includes the total number of the first paths that can be used for access and the access. Count the total number of available second passes,
    When the total number of the first paths that can be used for the access is less than the total number of the second paths that can be used for the access, the management server
    Causing the storage system to block the first volume;
    Changing the settings of the plurality of hosts such that the plurality of hosts access only the second volume of the volume pair;
    The computer system according to claim 2, wherein:
  6.  前記ホストが前記ボリュームペアに対してライト要求を発行した時に、前記第1ボリュームまたは前記第2ボリュームが閉塞していることを検知した場合、前記ホストは前記管理サーバに、前記第1転送路及び前記第2転送路に障害が発生している旨の情報を通知する、
    ことを特徴とする、請求項5に記載の計算機システム。
    If the host issues a write request to the volume pair and detects that the first volume or the second volume is blocked, the host sends the first transfer path and the management server to the management server. Notifying information that a failure has occurred in the second transfer path,
    The computer system according to claim 5, wherein:
  7.  前記ストレージシステムは、前記第1ボリュームがプライマリボリュームで前記第2ボリュームがセカンダリボリュームと設定されている場合、前記ホストが前記ボリュームペアに対して書き込みを要求したデータを、前記第1ボリュームに格納した後、前記第2ボリュームに格納するよう、構成されており、
     前記管理サーバは、前記ホストから受領した前記第1パス及び前記第2パスの状態に基づき、利用可能な前記第1パス及び前記第2パスの数を計数し、
     1台の前記ホストあたりの利用可能な前記第1パスの数の平均が、1台の前記ホストあたりの利用可能な前記第2パスの数の平均未満になった場合、前記管理サーバは、前記第2ボリュームがプライマリボリュームに、前記第1ボリュームがセカンダリボリュームになるように、前記ストレージシステムの設定を変更させる、
    ことを特徴とする、請求項2に記載の計算機システム。
    When the first volume is set as a primary volume and the second volume is set as a secondary volume, the storage system stores data requested by the host to write to the volume pair in the first volume. And is configured to be stored in the second volume after
    The management server counts the number of the first path and the second path that can be used based on the state of the first path and the second path received from the host,
    When the average number of the first paths that can be used per one host is less than the average number of the second paths that can be used per one host, the management server Changing the setting of the storage system so that the second volume becomes a primary volume and the first volume becomes a secondary volume;
    The computer system according to claim 2, wherein:
  8.  前記ホストが前記ボリュームペアに対してライトデータを書き込むライト要求を発行した時にアクセス障害が発生し、前記アクセス障害が前記第1転送路及び前記第2転送路の障害であると判定された場合、
     前記ホストは、前記第1ボリュームと前記第2ボリュームの両方に対して前記ライトデータの書き込みを行う、
    ことを特徴とする、請求項2に記載の計算機システム。
    When an access failure occurs when the host issues a write request for writing write data to the volume pair, and the access failure is determined to be a failure in the first transfer path and the second transfer path,
    The host writes the write data to both the first volume and the second volume;
    The computer system according to claim 2, wherein:
  9.  第1ボリュームを有する第1ストレージ装置と第2ボリュームを有する第2ストレージ装置とを有するストレージシステムと、
     前記ストレージシステムにアクセスする複数のホストと、
     管理サーバと、
    を有する計算機システムの制御方法であって、
     前記複数のホストはいずれも、前記第1ボリュームへのアクセスパスである第1パスと前記第2ボリュームへのアクセスパスである第2パスとをそれぞれ1以上有し、
     前記ストレージシステムは、前記第1ストレージ装置から前記第2ストレージ装置へデータを転送するための第1転送路と、前記第2ストレージ装置から前記第1ストレージ装置へデータを転送するための第2転送路とを有し、
     前記ストレージシステムは、
     前記第1ボリューム及び前記第2ボリュームをボリュームペアとして管理し、
     前記ホストが前記ボリュームペアに対して書き込みを要求したデータを、前記第1ボリューム及び前記第2ボリュームに格納するよう構成されており、
     前記方法は、
     1)前記ホストが、前記ボリュームペアにアクセスした際にアクセ
       ス障害を検出する工程と、
     2)前記管理サーバが、前記ホストから前記第1パス及び前記第2
       パスの状態と、前記第1転送路及び前記第2転送路の状態を受
       領する工程と、
     3)前記管理サーバが、前記第1パス、前記第2パス、前記第1転
       送路及び前記第2転送路の状態に基づいて、前記複数のホスト
       の前記ボリュームペアへのアクセスパスの設定の変更、または
       前記ボリュームペアの設定変更を行う工程と、
    を有することを特徴とする、計算機システムの制御方法。
    A storage system having a first storage device having a first volume and a second storage device having a second volume;
    A plurality of hosts accessing the storage system;
    A management server,
    A computer system control method comprising:
    Each of the plurality of hosts has at least one first path that is an access path to the first volume and one or more second paths that are access paths to the second volume;
    The storage system includes a first transfer path for transferring data from the first storage device to the second storage device, and a second transfer for transferring data from the second storage device to the first storage device. Road and
    The storage system
    Managing the first volume and the second volume as a volume pair;
    The host is configured to store data requested to be written to the volume pair in the first volume and the second volume,
    The method
    1) the host detecting an access failure when accessing the volume pair;
    2) The management server receives the first path and the second from the host.
    Receiving a state of a path and states of the first transfer path and the second transfer path;
    3) The management server sets access paths to the volume pairs of the plurality of hosts based on the states of the first path, the second path, the first transfer path, and the second transfer path. Changing, or changing the setting of the volume pair;
    A method for controlling a computer system, comprising:
  10.  前記3)において、前記管理サーバが前記第1転送路と前記第2転送路のうち前記第1転送路のみに障害が発生している旨の情報を受領すると、前記複数のホストが前記ボリュームペアに対するデータを書き込む際に、前記第2ボリュームにライト要求を発行するよう、前記複数のホストの設定を変更させる、
    ことを特徴とする、請求項9に記載の計算機システムの制御方法。
    In 3), when the management server receives information indicating that a failure has occurred only in the first transfer path among the first transfer path and the second transfer path, the plurality of hosts receive the volume pair. Changing the settings of the plurality of hosts so as to issue a write request to the second volume when writing data for
    The computer system control method according to claim 9, wherein:
  11.  前記ストレージシステムは、前記第1ボリュームがプライマリボリュームで前記第2ボリュームがセカンダリボリュームと設定されている場合、前記ホストが前記ボリュームペアに対して書き込みを要求したデータを、前記第1ボリュームに格納した後、前記第2ボリュームに格納するよう、構成されており、
     前記3)において、前記管理サーバが前記第1転送路と前記第2転送路のうち前記第1転送路のみに障害が発生している旨の情報を受領すると、前記第2ボリュームがプライマリボリュームに、前記第1ボリュームがセカンダリボリュームになるように、前記ストレージシステムの設定を変更させる、
    ことを特徴とする、請求項10に記載の計算機システムの制御方法。
    When the first volume is set as a primary volume and the second volume is set as a secondary volume, the storage system stores data requested by the host to write to the volume pair in the first volume. And is configured to be stored in the second volume after
    In 3), when the management server receives information indicating that a failure has occurred only in the first transfer path among the first transfer path and the second transfer path, the second volume becomes a primary volume. Changing the setting of the storage system so that the first volume becomes a secondary volume,
    The computer system control method according to claim 10, wherein:
  12.  前記ストレージシステムは、前記第1ボリュームがプライマリボリュームで前記第2ボリュームがセカンダリボリュームと設定されている場合、前記ホストが前記ボリュームペアに対して書き込みを要求したデータを、前記第1ボリュームに格納した後、前記第2ボリュームに格納するよう、構成されており、
     前記2)において、前記管理サーバが前記第1転送路と前記第2転送路の両方に障害が発生している旨の情報を受領した場合、
     前記3)において、前記管理サーバが
     a) アクセスに使用可能な前記第1パスの数の合計と、アクセスに使用可能な前記第2パスの数の合計を計数し、
     b) 前記アクセスに使用可能な前記第1パスの数の合計が、前記アクセスに使用可能な前記第2パスの数の合計未満になった場合、前記ストレージシステムに前記第1ボリュームを閉塞状態にさせ、前記複数のホストが、前記ボリュームペアのうち前記第2ボリュームのみにアクセスするように、前記複数のホストの設定を変更する、
    ことを特徴とする、請求項9に記載の計算機システムの制御方法。
    When the first volume is set as a primary volume and the second volume is set as a secondary volume, the storage system stores data requested by the host to write to the volume pair in the first volume. And is configured to be stored in the second volume after
    In 2), when the management server receives information indicating that a failure has occurred in both the first transfer path and the second transfer path,
    In 3), the management server a) counts the total number of the first paths that can be used for access and the total number of the second paths that can be used for access;
    b) When the total number of the first paths that can be used for the access is less than the total number of the second paths that can be used for the access, the first volume is put into a blocked state in the storage system. And changing the settings of the plurality of hosts so that the plurality of hosts access only the second volume of the volume pair.
    The computer system control method according to claim 9, wherein:
  13.  前記1)において、前記第1ボリュームまたは前記第2ボリュームが閉塞していることを検知した場合、前記ホストが前記管理サーバに、前記第1転送路及び前記第2転送路に障害が発生している旨の情報を通知する、
    ことを特徴とする、請求項12に記載の計算機システムの制御方法。
    In 1), when it is detected that the first volume or the second volume is blocked, the host has failed in the management server, and the first transfer path and the second transfer path have failed. To inform you that
    The computer system control method according to claim 12, wherein:
  14.  前記ストレージシステムは、前記第1ボリュームがプライマリボリュームで前記第2ボリュームがセカンダリボリュームと設定されている場合、前記ホストが前記ボリュームペアに対して書き込みを要求したデータを、前記第1ボリュームに格納した後、前記第2ボリュームに格納するよう、構成されており、
     前記3)において、前記管理サーバは、前記ホストから受領した前記第1パス及び前記第2パスの状態に基づき、利用可能な前記第1パス及び前記第2パスの数を計数し、1台の前記ホストあたりの利用可能な前記第1パスの数の平均が、1台の前記ホストあたりの利用可能な前記第2パスの数の平均未満になった場合、前記第2ボリュームがプライマリボリュームに、前記第1ボリュームがセカンダリボリュームになるように、前記ストレージシステムの設定を変更させる、
    ことを特徴とする、請求項9に記載の計算機システムの制御方法。
    When the first volume is set as a primary volume and the second volume is set as a secondary volume, the storage system stores data requested by the host to write to the volume pair in the first volume. And is configured to be stored in the second volume after
    In the step 3), the management server counts the number of the first and second paths that can be used based on the state of the first path and the second path received from the host. If the average number of the first paths available per host is less than the average number of the second paths available per host, the second volume becomes a primary volume, Changing the setting of the storage system so that the first volume becomes a secondary volume;
    The computer system control method according to claim 9, wherein:
  15.  前記1)において、前記ホストが前記ボリュームペアに対してライトデータを書き込むライト要求を発行した時に、前記第1転送路及び前記第2転送路の障害を検出した場合、
     前記ホストは、前記第1ボリュームと前記第2ボリュームの両方に対して前記ライトデータの書き込みを行う、
    ことを特徴とする、請求項9に記載の計算機システムの制御方法。
    In 1), when the host issues a write request for writing write data to the volume pair, and detects a failure in the first transfer path and the second transfer path,
    The host writes the write data to both the first volume and the second volume;
    The computer system control method according to claim 9, wherein:
PCT/JP2015/081822 2015-11-12 2015-11-12 Computer system WO2017081785A1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
PCT/JP2015/081822 WO2017081785A1 (en) 2015-11-12 2015-11-12 Computer system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2015/081822 WO2017081785A1 (en) 2015-11-12 2015-11-12 Computer system

Publications (1)

Publication Number Publication Date
WO2017081785A1 true WO2017081785A1 (en) 2017-05-18

Family

ID=58694883

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2015/081822 WO2017081785A1 (en) 2015-11-12 2015-11-12 Computer system

Country Status (1)

Country Link
WO (1) WO2017081785A1 (en)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010113559A (en) * 2008-11-07 2010-05-20 Hitachi Ltd Remote copy management system, method and device
JP2014049116A (en) * 2012-08-31 2014-03-17 Hitachi Ltd Management method of virtual storage system and remote copy system
WO2015162684A1 (en) * 2014-04-22 2015-10-29 株式会社日立製作所 Data migration method of storage system

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010113559A (en) * 2008-11-07 2010-05-20 Hitachi Ltd Remote copy management system, method and device
JP2014049116A (en) * 2012-08-31 2014-03-17 Hitachi Ltd Management method of virtual storage system and remote copy system
WO2015162684A1 (en) * 2014-04-22 2015-10-29 株式会社日立製作所 Data migration method of storage system

Similar Documents

Publication Publication Date Title
US7650446B2 (en) Storage system for back-end communications with other storage system
US8166241B2 (en) Method of improving efficiency of capacity of volume used for copy function and apparatus thereof
US7055057B2 (en) Coherency of non-committed replicate data after failover/failback
JP4387116B2 (en) Storage system control method and storage system
JP5286212B2 (en) Remote copy control method and system in storage cluster environment
JP2007034438A (en) Redundant path controller, method, program, and disk array system
US10896199B2 (en) Apparatus and method for managing storage copy services systems
US20070073986A1 (en) Remote copy control in a storage system
JP2007122117A (en) Storage system and storage control method
US20110167044A1 (en) Computing system and backup method using the same
JP5409799B2 (en) Remote copy system and remote copy control method
US20080288671A1 (en) Virtualization by multipath management software for a plurality of storage volumes
JP2010020410A (en) Remote copy system and remote copy method
US10025655B2 (en) Storage system
US20090177916A1 (en) Storage system, controller of storage system, control method of storage system
JP6039818B2 (en) Information system, host system, and access control method
US20080294858A1 (en) Storage system and data management method
WO2017081785A1 (en) Computer system
US11308122B2 (en) Remote copy system
US10248511B2 (en) Storage system having multiple local and remote volumes and multiple journal volumes using dummy journals for sequence control
US11256586B2 (en) Remote copy system and remote copy management method
JP2008262600A (en) Storage system control method, storage system, and storage device
JP2008065856A (en) Control method of storage system, storage system and storage device
JP2007172646A (en) Data transfer control method, switch system and data control method

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 15908305

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 15908305

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: JP