WO2015151258A1 - 非同期リモートコピーを行うリモートコピーシステムを含んだ計算機システムの管理システム及び管理方法 - Google Patents

非同期リモートコピーを行うリモートコピーシステムを含んだ計算機システムの管理システム及び管理方法 Download PDF

Info

Publication number
WO2015151258A1
WO2015151258A1 PCT/JP2014/059851 JP2014059851W WO2015151258A1 WO 2015151258 A1 WO2015151258 A1 WO 2015151258A1 JP 2014059851 W JP2014059851 W JP 2014059851W WO 2015151258 A1 WO2015151258 A1 WO 2015151258A1
Authority
WO
WIPO (PCT)
Prior art keywords
journal
primary
graph
delay
time
Prior art date
Application number
PCT/JP2014/059851
Other languages
English (en)
French (fr)
Inventor
彩有里 木内
友貴 水野
Original Assignee
株式会社日立製作所
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社日立製作所 filed Critical 株式会社日立製作所
Priority to PCT/JP2014/059851 priority Critical patent/WO2015151258A1/ja
Priority to US14/395,153 priority patent/US9513839B2/en
Publication of WO2015151258A1 publication Critical patent/WO2015151258A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0646Horizontal data movement in storage systems, i.e. moving data in between storage devices or systems
    • G06F3/065Replication mechanisms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • G06F11/328Computer systems status display
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0604Improving or facilitating administration, e.g. storage management
    • G06F3/0605Improving or facilitating administration, e.g. storage management by facilitating the interaction with a user or administrator
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0614Improving the reliability of storage systems
    • G06F3/0619Improving the reliability of storage systems in relation to data integrity, e.g. data losses, bit errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/067Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/14Digital output to display device ; Cooperation and interconnection of the display device with other functional units
    • G06F3/1454Digital output to display device ; Cooperation and interconnection of the display device with other functional units involving copying of the display data of a local workstation or window to a remote workstation or window so that an actual copy of the data is displayed simultaneously on two or more displays, e.g. teledisplay
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G2370/00Aspects of data communication
    • G09G2370/02Networking aspects
    • G09G2370/022Centralised management of display operation, e.g. in a server instead of locally

Definitions

  • the present invention generally relates to management of a computer system including a remote copy system that performs asynchronous remote copy.
  • An asynchronous remote copy system that copies data written to the primary volume of the primary storage system to the secondary volume of the remote secondary storage system that is asynchronous with writing to the primary volume is known.
  • a plurality of data written to the primary volume are written to the secondary volume in the order of writing to the primary volume.
  • delay time length In asynchronous remote copy, there is a difference between the time when data is stored in the primary storage system and the time when the data is stored in the secondary storage system.
  • the difference is referred to as “delay time length”.
  • the delay time length may be deteriorated, which means that the reliability of remote copy is lowered.
  • Patent Document 1 discloses a technique for monitoring the delay time length.
  • Patent Document 1 it is possible to know that the delay time length has deteriorated, but it is not possible to know the essential cause of the delay deterioration (deterioration of the delay time length). If the essential cause of the delay deterioration can be known, it is possible to take an accurate measure, and thus the reliability of the remote copy can be improved.
  • Management system has management information.
  • the management information includes a plurality of delay time lengths respectively corresponding to a plurality of times and a plurality of metric values respectively corresponding to the plurality of times for the primary volume.
  • the management system can compare the delay time length graph that represents the variation in the delay time length with the passage of time and the average writing amount graph that represents the variation of the average writing amount with the passage of time Display in various ways.
  • the average write amount is the amount of data written to the primary volume per write request.
  • the structure of a storage system is shown.
  • the function and information which the management server which concerns on Example 1 has are shown.
  • the structure of a copy pair table is shown.
  • the structure of a structure table is shown.
  • the structure of a VOL usage table is shown.
  • the structure of a delay table is shown.
  • An example of the graph screen which concerns on Example 1 is shown.
  • 6 shows another example of a graph screen according to the first embodiment. It is a flowchart of the calculation process of an average writing amount.
  • the function and information which the management server which concerns on Example 2 has has are shown.
  • the structure of a journal group table is shown.
  • the structure of a processor usage table is shown.
  • the structure of a graph characteristic classification table is shown. An example of identifying the same graph characteristic is shown.
  • An example of the graph screen which concerns on Example 2 is shown.
  • the comparative example of the graph screen which concerns on Example 2 is shown.
  • An example of identification of an average writing amount graph in which the relationship with the delay time length graph satisfies a predetermined condition is shown.
  • xxx table information may be described using the expression “xxx table”, but the information may be expressed in any data structure. That is, “xxx table” can be referred to as “xxx information” to indicate that the information does not depend on the data structure.
  • the primary storage system is one primary storage apparatus and the secondary storage system is one secondary storage apparatus.
  • the primary storage system may be composed of a plurality of primary storage apparatuses.
  • the secondary storage system may be composed of a plurality of secondary storage devices.
  • an ID is used to specify an element (for example, a storage device, a host computer, a pair, etc.), and the ID is composed of at least one of a number and a character. can do.
  • time for example, time, or start time and end time of time width
  • time is expressed in units of hour, minute, and second, but time is expressed in coarser or finer units. It's okay.
  • the process may be described with “program” as the subject, but the program is executed by a processor (for example, a CPU (Central Processing Unit)) so that a predetermined process can be appropriately performed. Since the processing is performed using at least one of a storage resource (for example, a memory) and a communication interface device, the subject of the processing may be a processor and an apparatus having the processor.
  • the processor may include a hardware circuit that performs a part of the processing.
  • the computer program may be installed from a program source.
  • the program source may be a program distribution server or a storage medium (for example, a portable storage medium).
  • a set of one or more computers that manage at least one node (for example, at least one of a host computer and a storage device) included in the computer system may be referred to as a “management system”.
  • the management computer displays the display information
  • the management computer may be a management system.
  • the management system may be a combination of the management computer and the display computer.
  • multiple computers may perform processing equivalent to that of the management computer. In this case, these multiple computers (for display when the display computer performs display) A computer may also be included).
  • the management system includes a management server 10 and a management client 14.
  • the management computer displaying information may be displaying information on a display device of the management computer.
  • the management server 10 is a management client that is an example of a display computer. 14 for transmitting display information. In this case, information represented by the display information is displayed by the management client 14 on a display device (not shown) included in the management client 14.
  • the management server 10 collects information from a node of the computer system (for example, at least one of a host computer and a storage device). The collected information is sent to an inquiry (request) from the management server 10. Information obtained from the node in response may be used, or information transmitted spontaneously from the node without such an inquiry may be used.
  • a node of the computer system for example, at least one of a host computer and a storage device.
  • the collected information is sent to an inquiry (request) from the management server 10.
  • Information obtained from the node in response may be used, or information transmitted spontaneously from the node without such an inquiry may be used.
  • VOL is an abbreviation for volume (logical volume) and is a logical storage device.
  • the VOL may be a substantial VOL (RVOL) or a virtual VOL (VVOL).
  • the VOL may be an online VOL provided to a host computer connected to a storage apparatus that provides the VOL, and an offline VOL that is not provided to the host computer (not recognized by the host computer).
  • RVOL is a VOL based on a physical storage resource (for example, a RAID (Redundant Array of Independent (or Inexpensive) Disks) group composed of a plurality of PDEVs) possessed by the storage apparatus having the RVOL.
  • VVOL an external connection VOL (EVOL) that is a VOL based on a storage virtualization technology based on a storage resource (for example, VOL) of an external storage device connected to the storage device having the VVOL
  • VOL a VOL
  • TPVOL VOL
  • TPVOL consists of multiple virtual pages (virtual storage areas) and complies with capacity virtualization technology (typically Thin Provisioning)
  • a snapshot VOL provided as a snapshot of the original VOL It may be.
  • the TPVOL is typically an online VOL.
  • the snapshot VOL may be an RVOL.
  • PDEV is an abbreviation for non-volatile physical storage device.
  • a plurality of RAID groups may be configured by a plurality of PDEVs.
  • the RAID group may be called a parity group.
  • a “pool” is a logical storage area (for example, a set of a plurality of pool VOLs), and may be prepared for each use.
  • the pool may include a TP pool and a snapshot pool.
  • the TP pool is a storage area composed of a plurality of real pages (substantial storage areas).
  • a real page may be allocated from the TP pool to a virtual page of TPVOL.
  • the snapshot pool may be a storage area in which data saved from the original VOL is stored.
  • the “pool VOL” is a VOL that is a component of the pool.
  • the pool VOL may be an RVOL or an EVOL.
  • the pool VOL is typically an offline VOL.
  • metric is a type of performance or usage that is repeatedly acquired or calculated
  • metric value is a value that represents the performance or usage.
  • VOL a write amount, a write count, and an average write amount, which will be described later, are all examples of metrics
  • the write amount “20” (MB / sec) and the write count “20” (times) / Second) and average writing amount “10” (MB / time) are both examples of metric values.
  • the operation rate is an example of a metric
  • the operation rate “30” (%) is an example of a metric value.
  • Fig. 1 shows the configuration of the computer system.
  • the computer system includes a remote copy system, a management server 10, a management client 14, and host computers 13a and 13b.
  • the remote copy system has a primary storage device 11 at the local site 5 and a secondary storage device 12 at the remote site 6.
  • the devices 10, 11, 12, 13 a and 13 b can transmit and receive data through a communication network (for example, SAN (Storage Area Network)) 15.
  • the management server 10 can transmit / receive data to / from the management client 14 and the host computers 13a and 13b via a communication network (for example, a LAN (Local Area Network)) 18.
  • the primary storage apparatus 11 and the secondary storage apparatus 12 are also connected to the communication network 18, and the management server 10 may collect information from the primary storage apparatus 11 and the secondary storage apparatus 12 through the communication network 18.
  • the primary storage apparatus 11 includes processors 31a and 31b, a memory (not shown) such as a cache memory, a plurality of PDEVs (not shown), and communication ports 21 and 24. Each of these devices may be one or plural.
  • the memory is composed of, for example, DRAM (Dynamic Random Access Memory) or FeRAM (Ferroelectric Random Access Memory).
  • the PDEV includes, for example, an HDD (Hard Disk Drive) or an SSD (Solid State Drive).
  • the communication port 21 is configured by, for example, a Fiber Channel adapter.
  • the communication port 24 is composed of, for example, an Ethernet (registered trademark) adapter.
  • the primary storage apparatus 11 provides a plurality of VOLs.
  • VOL there are PVOL (primary VOL) 42 and PJVOL (primary journal VOL) 43.
  • the PVOL is a kind of online VOL, and is a VOL in which data is written from the host computer 13 (hereinafter, data that can be accessed by the host computer 13 may be referred to as “user data”).
  • PJVOL is an example of a primary journal storage area, is a kind of offline VOL, and is a VOL in which a journal of user data written in PVOL is written.
  • the journal may include user data (more precisely, a copy of the user data) written to the PVOL and user data metadata.
  • the metadata includes the write destination information of the corresponding user data (for example, the ID of the write destination PVOL and the address of the write destination area in the write destination PVOL), and the order that defines the order in which the corresponding user data is written to the PVOL.
  • Information for example, a sequence number or a time stamp.
  • the secondary storage apparatus 12 includes processors 32a and 32b, a memory (not shown) such as a cache memory, a plurality of PDEVs (not shown), and communication ports 22 and 25.
  • the description of each of these devices is the same as that of the primary storage apparatus 11.
  • the communication port 22 is the same type as the communication port 21, and the communication port 25 is the same type as the communication port 24.
  • the secondary storage apparatus 12 also provides a plurality of VOLs.
  • the SVOL is a VOL that forms a pair with the PVOL, and is a VOL that is a copy destination of the user data written in the PVOL.
  • the SJVOL 48 is an example of a secondary journal storage area, and is a copy destination VOL of the journal written in the PJVOL 43. User data included in the journal stored in the SJVOL 48 is written into the SVOL based on the metadata in the journal.
  • the remote copy system includes a plurality (or one) of journal groups 40a and 40b.
  • journal groups 40a and 40b For each journal group 40, one or more PVOLs 42, one or more PJVOLs 43, one or more SJVOLs 48, and one or more SVOLs 47 are associated.
  • Each of the PVOL 42, PJVOL 43, SJVOL 48 and SVOL 47 is associated with one journal group 40 and is not associated with a plurality of different journal groups 40.
  • the PVOL 42 may be the same for a plurality of pairs.
  • the journal group 40a includes PVOL 42a, PJVOL 43a, SJVOL 48a and SVOL 47a
  • the journal group 40b includes PVOL 42b, PJVOL 43b, SJVOL 48b and SVOL 47b.
  • the primary storage apparatus 11 and the secondary storage apparatus 12 perform asynchronous remote copy through a remote path 17 configured on the communication network 16.
  • Asynchronous remote copy is performed for each journal group.
  • Asynchronous remote copy is a technique for copying data written to the PVOL 42 a to the SVOL 47 through the remote path 17 asynchronously with writing of data to the PVOL 42.
  • the asynchronous remote copy is executed as follows, taking the journal group 40a as an example. That is, the primary storage apparatus 11 receives a write request designating the PVOL 42a from the host computer 13, writes user data according to the received write to the cache memory, creates a journal including the user data on the cache memory, The created journal is written to the PJVOL 43a.
  • the primary storage apparatus 11 responds to the host computer 13 with the completion of the write request.
  • the primary storage apparatus 11 transfers the journal in the PJVOL 43a to the secondary storage apparatus 12 in response to a request from the secondary storage apparatus 12 or voluntarily.
  • the secondary storage apparatus 12 receives the transferred journal, writes the received journal to the cache memory, and writes the journal on the cache memory to the SJVOL 48a. Thereafter, the secondary storage apparatus 12 writes the user data stored in the SJVOL 48a into the SVOL 47a based on the metadata in the journal. In this way, the user data written to the PVOL 42a is copied to the SVOL 47a that forms a pair with the PVOL 42a.
  • the host computer 13 has a storage resource (for example, a memory) (not shown), a communication port 23, and a processor (not shown).
  • a processor in the host computer 13 executes one or a plurality of application programs 4.
  • the host computer 13a (13b) transmits an access request specifying the PVOL 42 to the primary storage apparatus 11 by executing the application program 4a (4b).
  • the access request is a write request or a read request. That is, the host computer 13 writes data to the PVOL 42 or reads data from the PVOL 42.
  • the host computer 13 can continue the processing by switching the access destination to the SVOL 47.
  • the delay time length is the difference between the time when the journal is stored in the PJVOL 43 of the primary storage apparatus 11 and the time when the journal is stored in the SJVOL 48 of the secondary storage apparatus 12.
  • the delay time length is calculated for each journal group, for example.
  • the start time of the delay time length may be either the time when the data is stored in the PVOL 42 or the time when the journal including the data is stored in the PJVOL 43, and the end time of the delay time length is stored in the SVOL 47.
  • the time when the journal containing the data is stored in the SJVOL 48 may be used.
  • the delay time length may get worse.
  • the deterioration of the delay time length means that the delay time length exceeds a threshold value (for example, the delay time length exceeds a threshold value for a predetermined time or a predetermined number of times or more).
  • the threshold value of the delay time length may be different for each journal group 40 or may be common to a plurality of journal groups 40.
  • the cause of the deterioration of delay is that a resource (for example, the processor 31 or the communication port 21) related to the asynchronous remote copy among the resources (physical resources) of the primary storage apparatus 11 is exceeded before the delay deterioration time. It may have been a load.
  • One possible cause of the resource overload is that a large number of write requests specifying the PVOL 42 are issued from the host computer 13.
  • the essential cause of the deterioration in delay is not the fact that a large number of write requests specifying PVOL 42 are issued from the host computer 13, but the reason why a large number of write requests are issued, that is, the cause of an increase in write requests. It is.
  • a cause of the increase in the write request an increase in the processing amount (business amount) in the host computer 13 can be considered, but this is not always the cause of the increase in the write request.
  • Another possible cause is a change in the processing mode (business mode) in the host computer 13.
  • the management server 10 determines whether the essential cause of delay deterioration is an increase in the processing amount (business amount) in the host computer 13 or a change in the processing mode (business mode) in the host computer 13. Information that can be estimated by the administrator is displayed on the management client 14.
  • the management system configured by the management server 10 and the management client 14 is a client server system.
  • the management client 14 communicates with the management server 10 by executing a Web browser (not shown), Display information can be displayed by a Web browser.
  • the management client 14 is a so-called input / output console, and includes an input device (for example, a keyboard and a pointing device) and a display device.
  • Example 1 will be described in more detail.
  • FIG. 2 shows functions and information of the management server 10 according to the first embodiment.
  • the management server 10 includes a processor 101, storage resources (for example, a storage device 102 and a memory 103), an I / F (communication interface device) 20, and an internal bus 105 that connects these devices 101, 102, 103, and 20. Have. Various functions of the management server 10 are realized by the processor 101 executing the program.
  • the memory 103 holds a program executed by the processor 101 and data accessed by the processor 101, and is configured by a DRAM, for example.
  • the storage device 102 is an auxiliary storage device and can store a program or data loaded in the memory 103, and is configured by, for example, an HDD or an SSD.
  • the I / F 20 is one or more communication interface devices.
  • a communication interface device for example, a Fiber Channel adapter for connecting the management server 10 to a communication network (for example, SAN) 15 and the management server 10 are connected to the communication network.
  • a communication interface device for example, LANC (LAN Controller) for connecting to (for example, LAN) 18.
  • the internal bus 105 is a transmission path capable of transmitting data bidirectionally, and is configured by, for example, a PCI-Express bus.
  • Information stored in the storage device 102 includes, for example, a copy pair table 200, a configuration table 220, a VOL usage table 240, and a delay table 260. These tables are examples of management information, and at least a part of these tables may be loaded into the memory 103. Further, as a computer program stored in the memory 103 and executed by the processor 101, for example, an information collection program 111 that collects information from a node (at least one of a storage device and a host computer) in the computer system is collected. An average writing amount calculation program 113 for calculating an average writing amount based on the obtained information, and a delay analysis program 115 for generating and displaying a graph representing a time-series change of the calculated average writing amount.
  • FIG. 3 shows the configuration of the copy pair table 200.
  • the copy pair table 200 has a record for each copy pair (a VOL pair for remote copy), and each record includes a pair ID 201, a primary storage ID 202, a secondary storage ID 203, and a primary journal group ID 204 as fields. And a secondary journal group ID 205, a PVOL ID 206, and a SVOL ID 207.
  • the copy pair ID is registered.
  • the ID of the primary storage device 11 and the ID of the secondary storage device 12 are registered, respectively.
  • the ID of the journal group 40 is registered in the primary journal group ID 204 and the secondary journal group ID 205. Since the journal group 40 exists across the primary storage device 11 and the secondary storage device 12, the IDs registered in the primary journal group ID 204 and the secondary journal group ID 205 are the same, and their fields are One common field may be used.
  • PVOL ID 206 and SVOL ID 207 the ID of PVOL 42 and the ID of SVOL 47 are registered, respectively.
  • the journal group “JN_1” includes two copy pairs “PA_1” and “PA_2”.
  • FIG. 4 shows the configuration of the configuration table 220.
  • the configuration table 220 has a record for each set of VOL and host computer. Each record has a VOL ID 221, a storage ID 222, and a host ID 223 as fields.
  • VOL ID 221 the ID of VOL 42 or 47 is registered.
  • storage ID 222 the ID of the storage apparatus 11 or 12 having the VOL 42 or 47 is registered.
  • host ID 223 the ID of the host computer 13 that uses the VOL 42 or 47 is registered.
  • the VOL “VOL_1” is used for one host computer “Host_A”
  • the VOL “VOL_7” is used for two host computers “Host_D” and “Host_A”.
  • FIG. 5 shows the configuration of the VOL usage table 240.
  • the VOL usage table 240 has a record for each VOL usage history. Each record has time 241, VOL ID 242, write amount 243, and write count 244 as fields.
  • time 241 information indicating the time (for example, the start time of the metric value collection cycle) is registered.
  • the VOL ID 242 the ID of the VOL 42 or 47 is registered.
  • the write amount 243 a write amount that is an example of a metric value is registered.
  • the “write amount” is the amount of data written to the VOL 42 or 47 per unit time, in other words, the amount of data for writing transmitted from the host computer 13 to the VOL 42 or 47 per unit time. .
  • the write count 244 a write count that is an example of a metric value is registered.
  • the “number of times of writing” is the number of received write requests specifying VOL 42 or 47 per unit time, in other words, the write request specifying VOL 42 or 47 was transmitted from the host computer 13 per unit time. Is a number.
  • the write amount and the write count registered in the fields 243 and 244 may be specified from information collected from the storage apparatuses 11 and 12, or may be specified from information collected from the host computers 13a and 13b. Also good.
  • FIG. 6 shows the configuration of the delay table 260.
  • the delay table 260 has a record for each set of time and journal group. Each record has a time 261, a journal group ID 262, and a delay time length 263 as fields.
  • time 261 information indicating time (for example, the start time of the metric value collection cycle) is registered.
  • the ID of the journal group 40 is registered.
  • the delay time length 263 stores information representing a delay time length (eg, “second”) that is an example of a metric value.
  • the journal is stored in the SJVOL 48 after 8 seconds since the journal was stored at “8:00:00” in the PJVOL 43 in the journal group “JNL_1”.
  • the information collection program 111 collects various predetermined types of information from each of the host computer 13 and the storage apparatuses 11 and 12 in a predetermined cycle, and registers the collected information in each table 200, 220, 240, 260. .
  • the information collection program 111 reads the write amount “20” (MB / second) corresponding to “8:00:00” from the information acquired about the VOL “VOL_1” from the primary storage apparatus 11 or the host computer “Host_A”. ) And the write count “20” (times / second) are registered, and the specified write amount and write count are registered in the VOL usage table 240 (see FIG. 5).
  • the information collection program 111 receives the same journal in the SJVOL 48 from the time “8:00:00” when the journal is written in the PJVOL 43 for the journal group “JNL_1” from the primary storage apparatus 11 and the secondary storage apparatus 12.
  • the written time “8:00:08” is acquired, and the difference “8 seconds” is registered in the delay table 260 (see FIG. 6).
  • the average writing amount calculation program 113 is a program for calculating an average writing amount.
  • the average writing amount is relatively large.
  • the business of the host computer 13 has more random writes than sequential writes, the number of writing increases but the amount of writing also increases. Therefore, the average writing amount is relatively small and does not change much (at least compared with the case where there are relatively many sequential writes, the average writing amount is small and does not change much).
  • the delay analysis program 115 notifies the administrator (management client 14) when delay deterioration is detected for any journal group 40.
  • the notification belongs to, for example, the ID of the journal group (hereinafter referred to as the delay deterioration journal group) 40 in which the delay deterioration is detected, the delay deterioration time (time when the delay time length exceeds the threshold), and the delay deterioration journal group 40. It may include at least one of the IDs of the host computers 13 that use the PVOL.
  • the delay analysis program 115 generates a graph based on the tables 200, 220, 240 and 260. Specifically, for example, the delay analysis program 115 generates, for each VOL, a write amount graph, which is a graph representing a change in the write amount over time, based on the VOL usage table 240. In addition, for example, the delay analysis program 115 generates a writing number graph, which is a graph representing a change in the number of writings with the passage of time, for each VOL based on the VOL usage table 240. Further, for example, the delay analysis program 115 generates a delay time length graph, which is a graph representing a variation in the delay time length with the passage of time, for each journal group 40 based on the delay table 260. The delay analysis program 115 generates an average write amount graph, which is a graph showing the variation of the average write amount with time, based on the average write amount calculated by the average write amount calculation program 113 for each VOL. To generate.
  • the delay analysis program 115 displays the delay time length graph of the delay deterioration journal group 40 and the average write amount graph of the PVOL belonging to the journal group 40 in a comparable manner.
  • the display in a comparable manner means that the delay time length graph is displayed, and the graph screen and the graph screen on which the average writing amount graph is displayed may be displayed side by side. It is to display on the same graph screen.
  • the time zone corresponding to the graph to be displayed is, for example, a time zone having a predetermined width based on the delay deterioration time.
  • an X axis (horizontal axis) 510 as an example of the first axis represents time (is a time axis), and a right side as an example of the second axis.
  • Y-axis 512 represents the delay time length
  • the left Y-axis (vertical axis) 511 which is an example of the third axis, represents an index relating to the write amount and the write count.
  • the graph screen 500 in FIG. 7 is a screen for one PVOL 42a in the journal group 40a
  • the graph screen 520 in FIG. 8 is a screen for one PVOL 42b in another journal group 40b.
  • the delay time length graph 501 When the administrator looks at the delay time length graph 501, it can be seen that the delay time length has increased from about 8:02:30. Further, the administrator can see from the writing amount graph 502 and the writing number graph 503 that the writing amount and the writing number have increased from around 8:02:30.
  • the administrator determines from the writing amount graph 502 and the writing number graph 503 alone whether the substantial cause of the increase in the delay time length is the increase in the processing amount in the host computer 13 or the processing in the host computer 13. I don't know if it's a form change.
  • the administrator can see from the average writing amount graph 504 that the average writing amount hardly fluctuates even after 8:02:30. Thereby, the administrator can estimate that the essential cause of the increase in the delay time length in the journal group 40a is an increase in the processing amount in the host computer 13. This is because the average write amount has not changed so much, because the write request for random write has increased, the processing load on the processor 31 of the primary storage device 11 has increased, and therefore the delay time length has increased. This is because it can be estimated.
  • the administrator can see that the delay time length has increased from about 8: 2: 30, as in the delay time length graph 501 of FIG.
  • the administrator can estimate that the essential cause of the increase in the delay time length in the journal group 40b is a change in the processing mode in the host computer 13. That is, the administrator can estimate that the processing mode of the host computer 13 has been changed from a processing mode mainly including sequential write to a processing mode mainly including random write. This is because the average write amount has decreased sharply because the processing mode has been changed from a mode in which sequential writing is mainly used to a mode in which random writing is mainly used, and thus the processing load on the processor 31 of the primary storage apparatus 11 is reduced. This is because it can be estimated that the delay time length has increased.
  • the administrator since the average writing amount graph is displayed together with the delay time length graph (for example, on the same coordinates), the administrator is responsible for the increase in the processing amount in the host computer 13 that causes the delay deterioration. It can be easily discriminated whether the processing mode is changed in the host computer 13 or not.
  • FIG. 9 is a flowchart of an average write amount calculation process.
  • the information collection program 111 identifies all the PVOLs 42 belonging to the journal group 40 whose delay time length exceeds the threshold (S101).
  • the average writing amount calculation program 113 performs S102 to S104 for each of all the PVOLs 42 identified in S101. Taking S102 to S104 as an example, one PVOL among the identified PVOLs (hereinafter, “target PVOL” in the description of FIG. 9) will be described.
  • the average write amount calculation program 113 acquires the write amount and the write count corresponding to the target PVOL 42 from the VOL usage table 240 (S102 and S103). At this time, the average writing amount calculation program 113 acquires the writing amount and the number of writings at each time belonging to a predetermined time zone with the delay deterioration time as a reference.
  • the “time zone with a predetermined width based on the delay deterioration time” may include a delay deterioration time and a future time zone, but at least includes a time zone with a predetermined width from the delay deterioration time. This is because the situation in the time zone of the past predetermined width from the delay deterioration time causes the delay deterioration.
  • the average writing amount calculation program 113 calculates the average writing amount using the acquired writing amount and the number of writings for each time belonging to a predetermined time zone with reference to the delay deterioration time (S104).
  • the writing amount, the number of times of writing, and the average writing amount at each time belonging to a predetermined time zone with respect to the delay deterioration time are acquired for each PVOL 42 belonging to the delay deterioration journal group 40. .
  • the delay analysis program 115 determines, for each PVOL 42 belonging to the delay deterioration journal group 40, based on the write amount, the number of writes, and the average write amount at each time belonging to a predetermined time zone with reference to the delay deterioration time. 7 or FIG. 8 is generated, and the delay analysis program 115 displays the generated graph on the same graph screen.
  • the management server 10 displays the average write amount graph of the PVOL belonging to the journal group 40 in a manner comparable to the delay time length graph for the delay deterioration journal group 40. Thereby, the administrator can estimate whether the essential cause of the delay deterioration is an increase in the processing amount (business amount) in the host computer 13 or a change in the processing mode (business mode) in the host computer 13.
  • the management server 10 compares the delay time length graph and the average writing amount graph, estimates the essential cause of delay deterioration based on the comparison result, and outputs the estimated cause. May be. Since the host computer that uses the PVOL is known from the configuration table 220 using the PVOL ID as a key, the administrator can request a user of the host computer to take a predetermined action.
  • Example 2 will be described. Hereinafter, description of points common to the first embodiment will be omitted or simplified, and differences from the first embodiment will be mainly described.
  • the period from the increase in the number of PVOL writes to the deterioration in the delay time length is the number of writes, the write amount, and the physical resources (for example, ports, processors and Depending on the relationship of at least one of the cache memories.
  • the administrator selects at least one of a delay time length graph and a metric value graph (for example, a write amount graph, a write count graph, and an average write amount graph). By comparing with (1), a PVOL estimated as a cause of delay deterioration can be found.
  • the management server 10 determines that the metric value variation (for example, metric value graph) of each PVOL belonging to the PVOL search range is the delay time length variation (for example, delay time length graph) of the delay deterioration journal group 40. It is determined whether the relationship satisfies a predetermined condition.
  • the PVOL search range is one or more PVOLs corresponding to the metric value fluctuations respectively compared with the delay time length fluctuations of the delay deterioration journal group 40, for example, one or more PVOLs belonging to the delay deterioration journal group 40.
  • the displayed metric value graph is narrowed down to a metric value graph with a positive determination result.
  • the above-described PVOL search range can be adjusted according to the presence / absence of an overload common resource related to the delayed deterioration journal group 40.
  • the “common resource” is a physical resource associated with two or more journal groups 40 (particularly, a physical resource that the primary storage apparatus 11 has). “Overload” of a physical resource means that the metric value of the physical resource exceeds a threshold value.
  • the “overloaded common resource associated with the delayed deterioration journal group 40” is a common resource that is associated with the delayed deterioration journal group 40 and has been overloaded in the past predetermined time period from the delayed deterioration time.
  • the PVOL search range is all PVOLs belonging to the delayed deterioration journal group 40, while the PVOL search range is associated with the delayed deterioration journal group 40. If there is an overloaded common resource that is assigned, the PVOL search range includes all the PVOLs that belong to all the other journal groups 40 that the common resource is associated with in addition to all the PVOLs that belong to the delayed deterioration journal group 40. PVOL. In this way, the size of the PVOL search range can be optimized.
  • FIG. 10 shows functions and information of the management server 10 according to the second embodiment.
  • the storage device 102 stores the journal group table 300, the graph characteristic classification table 340, and the processor usage table 320 in addition to the tables 200, 220, 240, and 260 described above. Further, the processor 101 executes an information collection program 1011 that collects more information than the information collection program 111 of the first embodiment and a delay analysis program 1015 having more functions than the delay analysis program 115 of the first embodiment. .
  • FIG. 11 shows the configuration of the journal group table 300.
  • the journal group table 300 has a record for each set of the journal group 40 and the processor. Each record has a journal group ID 301, a storage ID 302, and a processor ID 303 as fields.
  • journal group ID 301 the ID of the journal group 40 is registered.
  • the storage ID 302 the ID of the storage device 11 or 12 is registered.
  • the processor ID 303 the ID of the processor 31 or 32 is registered.
  • the processor “PS_1A” of the primary storage device “ST_A” is associated with a plurality of journal groups “JN_1” and “JN_2”. That is, the processor “PS_1A” processes a write request for any PVOL in the journal groups “JN_1” and “JN_2”.
  • FIG. 12 shows the configuration of the processor usage table 320.
  • the processor usage table 320 has a record for each usage history of the processor 31 or 32. Each record has a time 321, a processor ID 322, and an operation rate 323 as fields.
  • the processor ID 322 the ID of the processor 31 or 32 is registered.
  • the operation rate 323 the operation rate (%) of the processor 31 or 32 is registered.
  • the registered operation rate is an operation rate collected from the storage apparatuses 11 and 12 by the information collection program 111.
  • a processor whose operation rate exceeds a threshold is an overloaded processor.
  • the processor 31 is taken as an example of a physical resource (physical resource in the primary storage apparatus 11) associated with the journal group 40. Therefore, in the journal group table 300 of FIG. 11, the physical resource associated with the journal group 40 is only the processor. As the physical resource associated with the journal group 40, other types of physical resources may be employed.
  • the port 21 connected to the host computer 13 may be employed as the physical resource.
  • the ID of the port 21 may be associated with each journal group 40, and the metric value of the port 21 (for example, the amount of transfer data per unit time) is collected at a predetermined period and It may be registered in the table.
  • the write request is received at the port 21 associated with the journal group 40 to which the PVOL 42 specified by the write request belongs.
  • a port 21 whose metric value exceeds a threshold value is an overloaded port 21.
  • a cache memory (not shown) may be employed as a physical resource associated with the journal group 40.
  • the cache memory ID (for example, an address range in the memory) may be associated with each journal group 40, and the metric value of the cache memory (for example, the ratio of the used capacity to the capacity of the cache memory) ) May be collected at a predetermined cycle and registered in a predetermined table.
  • Data input / output to / from the PVOL 42 is stored in a cache memory associated with the journal group 40 to which the PVOL 42 belongs.
  • a cache memory whose metric value exceeds a threshold value is an overloaded cache memory.
  • FIG. 13 shows the configuration of the graph characteristic classification table 340.
  • the graph characteristic classification table 340 is a table used for determining which graph characteristic (for example, pattern) the graph is classified into, and has a record for each graph characteristic.
  • Each record has a pattern ID 341, an X-axis condition 342, a Y-axis condition 343, and a graph characteristic 344 as fields.
  • a pattern ID as a graph characteristic is registered.
  • a condition for the time t on the X-axis of the graph is registered.
  • a condition for the value y on the Y-axis of the graph is registered.
  • Information describing the characteristics of the graph is registered in the graph characteristics 343.
  • the graph having the graph characteristic “decrease after exceeding the threshold” corresponds to the pattern ID “1”.
  • the time tm of the maximum value ymax (x coordinate corresponding to the maximum y coordinate of the graph) is earlier than the time tn of the minimum value ymin (x coordinate corresponding to the minimum y coordinate of the graph).
  • Tm ⁇ tn the value ya of the start time ta of the time zone T (y coordinate corresponding to the start point x coordinate) is the value yb of the end time tb of the time zone T (y corresponding to the end point x coordinate).
  • the graph having the graph characteristic “first vibration” corresponds to the pattern ID “2”.
  • the time tm of the maximum value ymax is earlier than the time tn of the minimum value ymin (tm ⁇ tn)
  • the value ya of the start time ta is the value yb of the end time tb. Is smaller than (ya ⁇ yb), the graph corresponds to the pattern ID “2”.
  • the graph having the graph characteristic “second vibration” corresponds to the pattern ID “3”.
  • the time tm of the maximum value ymax is later than the time tn of the minimum value ymin (tm> tn), and the value ya of the start time ta is the value yb of the end time tb. Is equal to or larger than (ya ⁇ yb), the graph corresponds to the pattern ID “3”. (4) The graph having the graph characteristic “increase” corresponds to the pattern ID “4”.
  • the time tm of the maximum value ymax is later than the time tn of the minimum value ymin (tm> tn), and the value ya of the start time ta is the value yb of the end time tb. Is smaller than (ya ⁇ yb), the graph corresponds to the pattern ID “4”.
  • the graph having the graph characteristic “constant” corresponds to the pattern ID “5”.
  • the information collection program 1011 collects and registers information related to the tables 300, 320, and 340 in addition to the functions described in the first embodiment.
  • the delay analysis program 1015 may generate a graph (referred to as a “processor operation rate graph”) representing the change in the operation rate of the processor 31 or 32 based on the information in the processor usage table 320.
  • the delay analysis program 1015 determines which pattern ID 341 of the graph characteristic classification table 340 corresponds to the graph in a certain time zone. For example, the delay analysis program 1015 determines which record in the graph characteristic classification table 340 corresponds to the X-axis condition 342 and the Y-axis condition 343 in the time zone T. When the corresponding record exists, the delay analysis program 1015 determines that the graph in the time zone T has the graph characteristic 344 of the pattern ID 341 of the corresponding record.
  • the delay analysis program 1015 searches the PVOL search range for the PVOL 42 corresponding to the metric value graph whose relationship with the delay time length graph for the delay deterioration journal group 40 satisfies a predetermined condition. At that time, the delay analysis program 1015 determines whether or not an overload common processor (an example of an overload common resource) associated with the delay deterioration journal group 40 exists in the primary storage apparatus 11. If there is no such overload common processor 31, the delay analysis program 1015 sets the PVOL search range to only the PVOL 42 belonging to the delay deterioration journal group 40.
  • an overload common processor an example of an overload common resource
  • the delay analysis program 1015 sets the PVOL search range to not only the PVOL 42 belonging to the delay deterioration journal group 40, but also other types associated with the overload common processor 31.
  • the PVOLs 42 belonging to all journal groups 40 are assumed. Two or more including the first and second journal groups 40 due to an increase in the number of writes to the PVOL 42 belonging to the second journal group 40 different from the first journal group 40 whose delay time length has deteriorated
  • the processor (common processor) 31 associated with the journal group 40 of the first journal group 40 may be overloaded, and thereby the delay time length of the first journal group 40 may deteriorate.
  • the size of the PVOL search range can be optimized according to the presence / absence of the overload common processor 31 associated with the delay deterioration journal group 40.
  • the delay analysis program 1015 searches for a metric value graph whose relationship with the delay time length graph satisfies a predetermined condition, thereby narrowing down the metric value graph to be displayed to the metric value graph hit by the search (or the hit metric
  • the PVOL 42 corresponding to the value graph is estimated as the cause of delay deterioration).
  • the delay analysis program 1015 selects only the write count graph having the same graph characteristic as the graph characteristic (for example, pattern) of the delay time length graph among all the write count graphs corresponding to all the PVOLs belonging to the PVOL search range. May be displayed.
  • the delay analysis program 1015 refers to the graph characteristic classification table 340 and identifies the pattern ID of the delay time length graph.
  • the delay analysis program 1015 identifies a writing number graph having the same pattern ID as the identified pattern ID.
  • the delay analysis program 1015 displays the identified writing number graph (or estimates the PVOL corresponding to the writing number graph as a cause of delay deterioration).
  • the delay analysis program 1015 may adopt another metric value graph (for example, a write amount graph) instead of the write count graph as a graph to be compared with the delay time length graph.
  • FIG. 14 shows an example of identification of graphs having the same graph characteristics.
  • the X axis (horizontal axis) 550 represents time
  • the left Y axis (vertical axis) 551 represents an index related to the number of writings
  • the right Y axis 552 represents a delay time length.
  • the entire start time of the graph 540 is “t0” and the end time is “t1”.
  • the end time t1 may be the latest time when the information collection program 1011 collects information.
  • a time when the delay time length graph 542 exceeds a predetermined delay threshold value 541 is set as a delay deterioration time “ts”.
  • a time zone from “delay deterioration time ts to end time t1” is set to “T0”.
  • the delay analysis program 1015 determines which pattern ID the delay time length graph 542 in the time zone T0 corresponds to.
  • the delay analysis program 1015 sets the time zone from “time (ts-d) to time (t1-d)” to “T1”.
  • d is a variable whose initial value is 0 and increases by a predetermined value ⁇ d. That is, the time zone T1 is a time zone obtained by shifting the time zone T0 by d in the past time direction.
  • the delay analysis program 1015 reads the write number graph (write number graph corresponding to a certain PVOL42) 543 in the time zone T1 and the write number graph (write number graph corresponding to another PVOL42) in the time zone T1. ) It is determined to which pattern ID 544 each corresponds. At that time, the delay analysis program 1015 increments d by 0 from 0 to (ts ⁇ t0) (that is, shifts T1 by ⁇ d toward the past time), and writes in any time zone T1. It is determined whether the pattern ID of the frequency graph 543 or 544 matches the pattern ID of the delay time length graph 542.
  • the delay analysis program 1015 displays the matched write count graph as a display target. (Or, the PVOL 42 corresponding to the matched writing number graph is estimated as the cause of delay).
  • the delay analysis program 1015 identifies that the pattern ID of the delay time length graph 542 in the time zone T0 corresponds to “1”. Also, the delay analysis program 1015 identifies that the writing number graph 543 in the time period T1 corresponds to the pattern ID “1” and the writing number graph 544 corresponds to the pattern ID “2”. Therefore, the delay analysis program 1015 determines the writing number graph 543 whose pattern ID matches the delay time length graph as a display target, and does not set the writing number graph 544 whose pattern ID does not match as a display target.
  • the delay analysis program 1015 displays a graph screen 1560 illustrated in FIG.
  • the graph screen 1560 in addition to the delay time length threshold 541 and the delay time length graph 542, only the write number graph 543 whose pattern ID matches the delay time length graph 542 is displayed, and the delay time length graph 542 and the pattern ID are displayed. Is not displayed.
  • the visibility of the graph is increased, and therefore the administrator can easily estimate the PVOL as the cause of the delay deterioration. Can do. As illustrated in FIG.
  • FIG. 17 is a flowchart of the delay cause estimation process.
  • the delay analysis program 1015 identifies all the PVOLs 42 that belong to the PVOL search range according to the presence or absence of the overload common processor 31 associated with the delay deterioration journal group 40 (S301).
  • the delay analysis program 1015 sets “delay deterioration time ts to end time t1” as the time zone T0 (S302).
  • the delay analysis program 1015 identifies the pattern identification process for the time zone T0, that is, the pattern ID of the delay time length graph in the time zone T0 (S303). The pattern identification process will be described later with reference to FIG.
  • the delay analysis program 1015 sets (initializes) “0” in the variable d (S304). The delay analysis program 1015 repeats S305 to S308 until “(delay deterioration time ts ⁇ variable d) ⁇ end time t1” is satisfied.
  • the delay analysis program 1015 adds a predetermined value ⁇ d to the variable d (S305), and sets “(delay deterioration time ts ⁇ variable d) to (end time t1 ⁇ variable d)” as the time zone T1. (S306).
  • the delay analysis program 1015 identifies, for each of all the PVOLs 42 identified in S301, the pattern identification process related to the time zone T1, that is, the pattern ID of the write count graph in the time zone T1 (S307).
  • the delay analysis program 1015 identifies a write count graph having a pattern ID that matches the pattern ID of the delay time length graph, and registers the ID of the PVOL 42 corresponding to the identified write count graph in the related list (S308). .
  • the ID of the PVOL 42 corresponding to the writing number graph having the pattern ID that matches the pattern ID of the delay time length graph is registered in the related list. That is, the ID of the PVOL 42 that is estimated to be the cause of delay deterioration is registered in the related list.
  • the delay analysis program 1015 refers to the related list to determine a writing number graph to be displayed together with the delay time length graph. Specifically, the PVOL writing frequency graph identified from the ID registered in the related list is determined as a display target.
  • FIG. 18 is a flowchart of pattern identification processing.
  • the pattern identification process is performed in S303 and S307 in FIG.
  • the “target graph” in the description of FIG. 18 corresponds to the delay time length graph, and the time zone T corresponds to T0.
  • the “target graph” in the description of FIG. 18 corresponds to a writing number graph corresponding to one PVOL, and the time zone T corresponds to T1.
  • the delay analysis program 1015 refers to the graph characteristic classification table 340 and executes the following processing.
  • the delay analysis program 1015 determines whether or not the time tm of the maximum value ymax is earlier than the time tn of the minimum value ymin (tm ⁇ tn) for the target graph in the time zone T (S401).
  • the delay analysis program 1015 sets the value ya of the start time ta of the time zone T to the value yb of the end time tb of the time zone T for the target graph in the time zone T. It is determined whether it is the same as or larger than (ya ⁇ yb) (S402). If the determination result in S402 is affirmative (S402: YES), the delay analysis program 1015 identifies the pattern ID of the target graph as “1”. When the determination result in S402 is negative (S402: NO), the delay analysis program 1015 identifies the pattern ID of the target graph as “2”.
  • the delay analysis program 1015 determines that the time tm of the maximum value ymax in the time zone T is the time tn of the minimum value ymin in the time zone T for the target graph in the time zone T. It is determined whether it is the future (S410). When the determination result in S410 is negative (S410: NO), the delay analysis program 1015 identifies the pattern ID of the target graph as “5”. When the determination result in S410 is affirmative (S410: YES), the delay analysis program 1015 sets the value ya of the start time ta of the time zone T to the value yb of the end time tb of the time zone T for the target graph in the time zone T.
  • the pattern ID of the target graph is identified.
  • FIG. 19 shows an example of identification of an average write amount graph whose relationship with the delay time length graph satisfies a predetermined condition.
  • the X axis (horizontal axis) 610 represents time
  • the left Y axis (vertical axis) 611 represents an index related to the writing amount
  • the right Y axis 612 represents the delay time length.
  • the start time is “t0”
  • the end time is “t1”
  • the delay deterioration time is “ts”
  • the time zone from “delay deterioration time ts to end time t1” is “T0”.
  • the delay analysis program 1015 estimates the cause of delay as follows, for example.
  • S19-1 The delay analysis program 1015 identifies all PVOLs 42 that belong to a PVOL search range having a width corresponding to the presence or absence of the overload common processor 31 associated with the delay deterioration journal group 40.
  • S19-2) The delay analysis program 1015 sets the time zone T1 obtained by shifting the time zone T0 (delay deterioration time ts to end time t1) by the variable d in the past time direction.
  • S19-3 The delay analysis program 1015 calculates the average writing amount in the time zone T1 for each of the PVOLs 42 identified in (S19-1).
  • the delay analysis program 1015 registers the ID of the PVOL 42 whose average writing amount is smaller than a predetermined threshold in the related list. (S19-5) The delay analysis program 1015 adds the predetermined value ⁇ d to the variable d and returns to the processing of (S19-2).
  • the average write amount graph 603 of the first PVOL 42 represents the average write amount “about 50 bytes”
  • the average write amount graph 604 of the second PVOL 42 represents the average write amount “about 250 bytes”. Is represented.
  • the threshold value is “100 bytes”
  • the delay analysis program 1015 registers the ID of the first PVOL 42 whose average writing amount is smaller than the predetermined threshold value in the related list. That is, the delay analysis program 1015 estimates the first PVOL 42 as a cause of delay. This is because a PVOL with a small average writing amount is likely to have a large number of writings.
  • the delay analysis program 1015 displays only the average write amount graph 603 corresponding to the PVOL ID registered in the related list among the average write amount graphs 603 and 604 and displays the PVOL not registered in the related list.
  • the average writing amount graph 604 corresponding to the ID may be hidden.
  • the program executed by the management server 10 may be executed by another device such as a host computer or a storage device.
  • the delay analysis program 1015 may identify a graph related to the delay time length graph by a method different from the above. Specifically, the delay analysis program 1015 may identify a graph related to the delay time length graph based on normalization, frequency analysis, a correlation coefficient, or the like.
  • one area secured on the cache memory may be an example of a journal storage area.
  • Management server 11 Primary storage device 12: Secondary storage device 13a, 13b: Host computer 14: Management client 40a, 40b: Journal group 42a, 42b: Primary volume (PVOL) 43a, 43b: Primary journal volume (PJVOL) 47a 47b: Secondary volume (SVOL) 48a, 48b: Secondary journal volume (SJVOL)
  • PVOL Primary volume
  • JVOL Primary journal volume
  • SVOL Secondary volume
  • SJVOL Secondary journal volume

Abstract

 管理システムは、管理情報を有する。管理情報は、複数の時刻にそれぞれ対応した複数の遅延時間長と、正ボリュームについて複数の時刻にそれぞれ対応した複数のメトリック値とを含む。管理システムは、管理情報を基に、時刻の経過に伴う遅延時間長の変動を表す遅延時間長グラフ(521)と、時刻の経過に伴う平均書込量の変動を表す平均書込量グラフ(524)とを比較可能な態様で表示する。平均書込量は、書込要求1つ当たりに正ボリュームに書き込まれたデータの量である。

Description

非同期リモートコピーを行うリモートコピーシステムを含んだ計算機システムの管理システム及び管理方法
 本発明は、概して、非同期リモートコピーを行うリモートコピーシステムを含んだ計算機システムの管理に関する。
 正ストレージシステムの正ボリュームに書き込まれるデータを正ボリュームに対する書込みとは非同期で遠隔地にある副ストレージシステムの副ボリュームにコピーする非同期リモートコピーシステムが知られている。非同期リモートコピーシステムによれば、正ボリュームに書き込まれる複数のデータが、正ボリュームへの書込み順通りに、副ボリュームに書き込まれる。
 非同期リモートコピーにおいて、正ストレージシステムにデータが格納された時刻とそのデータが副ストレージシステムに格納された時刻には差がある。以下、その差を「遅延時間長」と言うことにする。遅延時間長は悪化することがあり、それは、リモートコピーの信頼性の低下を意味する。特許文献1は、遅延時間長を監視する技術を開示している。
特開2010-146198号公報
 特許文献1では、遅延時間長が悪化したことを知ることはできるが、遅延悪化(遅延時間長の悪化)の本質的な原因を知ることはできない。遅延悪化の本質的な原因を知ることができれば、正確な対処が可能となり、ひいてはリモートコピーの信頼性を高めることができる。
 管理システムは、管理情報を有する。管理情報は、複数の時刻にそれぞれ対応した複数の遅延時間長と、正ボリュームについて複数の時刻にそれぞれ対応した複数のメトリック値とを含む。管理システムは、管理情報を基に、時刻の経過に伴う遅延時間長の変動を表す遅延時間長グラフと、時刻の経過に伴う平均書込量の変動を表す平均書込量グラフとを比較可能な態様で表示する。平均書込量は、書込要求1つ当たりに正ボリュームに書き込まれたデータの量である。
 非同期リモートコピーの遅延悪化の本質的な原因を推定できる。
ストレージシステムの構成を示す。 実施例1に係る管理サーバの有する機能及び情報を示す。 コピーペアテーブルの構成を示す。 構成テーブルの構成を示す。 VOL使用テーブルの構成を示す。 遅延テーブルの構成を示す。 実施例1に係るグラフ画面の一例を示す。 実施例1に係るグラフ画面の別の一例を示す。 平均書込量の算出処理のフローチャートである。 実施例2に係る管理サーバの有する機能及び情報を示す。 ジャーナルグループテーブルの構成を示す。 プロセッサ使用テーブルの構成を示す。 グラフ特性分類テーブルの構成を示す。 同じグラフ特性の識別の一例を示す。 実施例2に係るグラフ画面の一例を示す。 実施例2に係るグラフ画面の比較例を示す。 遅延原因推定処理のフローチャートである。 パターン識別処理のフローチャートである。 遅延時間長グラフとの関係が所定の条件を満たす平均書込量グラフの識別の例を示す。
 以下、幾つかの実施例を説明する。
 以下の説明では、「×××テーブル」の表現にて情報を説明することがあるが、情報は、どのようなデータ構造で表現されていてもよい。すなわち、情報がデータ構造に依存しないことを示すために、「×××テーブル」を「×××情報」と呼ぶことができる。
 また、以下の説明では、同種の要素を区別して説明する場合には、「ホスト計算機13a」、「ホスト計算機13b」のように、参照符号を使用し、同種の要素を区別しないで説明する場合には、「ホスト計算機13」のように参照符号のうちの共通番号のみを使用することがある。
 また、以下の説明では、正ストレージシステムは、1つの正ストレージ装置であり、副ストレージシステムは、1つの副ストレージ装置であるが、正ストレージシステムは、複数の正ストレージ装置で構成されてよいし、副ストレージシステムは、複数の副ストレージ装置で構成されてもよい。
 また、以下の説明では、要素(例えば、ストレージ装置、ホスト計算機、ペア等)を特定するためにID(Identification)が使用されるが、IDは、番号及び文字等のうちの少なくとも1つで構成することができる。
 また、以下の説明では、時間(例えば、時刻、又は、時間幅の開始時刻と終了時刻)は、時分秒の単位で表現されるが、時間は、それよりも粗い又は細かい単位で表現されてよい。
 また、以下の説明では、「プログラム」を主語として処理を説明する場合があるが、プログラムは、プロセッサ(例えばCPU(Central Processing Unit))によって実行されることで、定められた処理を、適宜に記憶資源(例えばメモリ)及び通信インターフェイスデバイスのうちの少なくとも1つを用いながら行うため、処理の主語が、プロセッサ、そのプロセッサを有する装置とされてもよい。プロセッサは、処理の一部を行うハードウェア回路を含んでもよい。コンピュータプログラムは、プログラムソースからインストールされてよい。プログラムソースは、プログラム配布サーバ又は記憶メディア(例えば可搬型の記憶メディア)であってもよい。
 また、以下の説明では、計算機システムに含まれる少なくとも1つのノード(例えばホスト計算機及びストレージ装置の少なくとも一方)を管理する1以上の計算機の集合を「管理システム」と呼ぶことがある。管理計算機が表示用情報を表示する場合は管理計算機が管理システムでよい。また、管理計算機と表示用計算機の組み合わせも管理システムでよい。また、管理処理の高速化や高信頼化のために複数の計算機で管理計算機と同等の処理を実現してもよく、この場合はそれら複数の計算機(表示を表示用計算機が行う場合は表示用計算機も含んでよい)が管理システムでよい。本実施例では、管理システムは、管理サーバ10と管理クライアント14を含む。また、管理計算機が情報を表示するとは、管理計算機が有する表示デバイスに情報を表示することであってもよいが、以下の実施例では、管理サーバ10が、表示用計算機の一例である管理クライアント14に表示用情報を送信することである。この場合、管理クライアント14が有する表示デバイス(不図示)に、表示用情報が表す情報が管理クライアント14によって表示される。
 また、以下の説明では、管理サーバ10が、計算機システムのノード(例えばホスト計算機及びストレージ装置の少なくとも一方)から情報を収集するが、収集される情報は、管理サーバ10からの問合せ(要求)に応答してノードから得られる情報でもよいし、そのような問合せ無しにノードから自発的に送信された情報でもよい。
 また、以下の説明では、「VOL」は、ボリューム(論理ボリューム)の略であり、論理的な記憶デバイスである。VOLは、実体的なVOL(RVOL)であってもよいし、仮想的なVOL(VVOL)であってもよい。また、VOLは、そのVOLを提供するストレージ装置に接続されているホスト計算機に提供されるオンラインVOLと、ホスト計算機には提供されない(ホスト計算機からは認識されない)オフラインVOLとがあってよい。「RVOL」は、そのRVOLを有するストレージ装置が有する物理的な記憶資源(例えば、複数のPDEVで構成されたRAID(Redundant Array of Independent (or Inexpensive) Disks)グループ)に基づくVOLである。「VVOL」としては、例えば、そのVVOLを有するストレージ装置に接続されている外部のストレージ装置の記憶資源(例えばVOL)に基づいておりストレージ仮想化技術に従うVOLである外部接続VOL(EVOL)と、複数の仮想ページ(仮想的な記憶領域)で構成されており容量仮想化技術(典型的にはThin Provisioning)に従うVOL(TPVOL)と、オリジナルのVOLのスナップショットとして提供されるスナップショットVOLとがあってよい。TPVOLは、典型的にはオンラインVOLである。スナップショットVOLは、RVOLであってもよい。「PDEV」は、不揮発性の物理的な記憶デバイスの略である。複数のPDEVで複数のRAIDグループが構成されてよい。RAIDグループはパリティグループと呼ばれてもよい。「プール」は、論理的な記憶領域(例えば複数のプールVOLの集合)であり、用途ごとに用意されてよい。例えば、プールとして、TPプールと、スナップショットプールとがあってよい。TPプールは、複数の実ページ(実体的な記憶領域)で構成された記憶領域である。TPプールからTPVOLの仮想ページに実ページが割り当てられてよい。スナップショットプールは、オリジナルのVOLから退避されたデータが格納される記憶領域でよい。「プールVOL」は、プールの構成要素となるVOLである。プールVOLは、RVOLであってもよいしEVOLであってもよい。プールVOLは、典型的にはオフラインVOLである。
 また、以下の説明では、「メトリック」とは、繰り返し取得又は算出される性能又は使用状況の種類であり、「メトリック値」とは、その性能又は使用状況を表す値である。例えば、VOLでいえば、後述の書込量、書込回数及び平均書込量がいずれもメトリックの一例であり、書込量「20」(MB/秒)、書込回数「20」(回/秒)、平均書込量「10」(MB/回)がいずれもメトリック値の一例である。また、例えば、プロセッサでいえば、稼働率がメトリックの一例であり、稼働率「30」(%)がメトリック値の一例である。
 図1は、計算機システムの構成を示す。
 計算機システムは、リモートコピーシステムと、管理サーバ10と、管理クライアント14と、ホスト計算機13a、13bとを有する。リモートコピーシステムは、ローカルサイト5にある正ストレージ装置11と、リモートサイト6にある副ストレージ装置12とを有する。装置10、11、12、13a及び13bは、通信ネットワーク(例えばSAN(Storage Area Network))15を通じてデータを送受信できる。管理サーバ10は、管理クライアント14、ホスト計算機13a及び13bと、通信ネットワーク(例えばLAN(Local Area Network))18を通じて、データを送受信できる。なお、正ストレージ装置11及び副ストレージ装置12も、通信ネットワーク18に接続されていて、管理サーバ10は、通信ネットワーク18を通じて、正ストレージ装置11及び副ストレージ装置12から情報を収集してもよい。
 正ストレージ装置11は、プロセッサ31a、31bと、キャッシュメモリ等のメモリ(不図示)と、複数のPDEV(不図示)と、通信ポート21及び24とを有する。これらのデバイスの各々は、1つであってもよいし、複数であってもよい。メモリは、例えば、DRAM(Dynamic Random Access Memory)又はFeRAM(Ferroelectric Random Access Memory)などで構成される。PDEVは、例えば、HDD(Hard Disk Drive)又はSSD(Solid State Drive)など構成される。通信ポート21は、例えば、Fibre Channelアダプタなどで構成される。通信ポート24は、例えば、Ethernet(登録商標)アダプタなどで構成される。正ストレージ装置11は、複数のVOLを提供する。VOLとして、PVOL(正VOL)42とPJVOL(正ジャーナルVOL)43とがある。PVOLは、オンラインVOLの一種であり、ホスト計算機13からデータが書き込まれるVOLである(以下、ホスト計算機13によりアクセスされ得るデータを「ユーザデータ」と言うことがある)。PJVOLは、正ジャーナル記憶領域の一例であり、オフラインVOLの一種であり、PVOLに書き込まれるユーザデータのジャーナルが書き込まれるVOLである。ジャーナルは、PVOLに書き込まれるユーザデータ(正確にはユーザデータの複製)と、ユーザデータのメタデータとを含んでよい。メタデータは、対応するユーザデータの書込み先情報(例えば、書込み先のPVOLのIDと、書込み先PVOLにおける書込み先領域のアドレス)と、対応するユーザデータがPVOLに書き込まれた順番を定義する順番情報(例えば、シーケンス番号、又は、タイムスタンプ)とを含む。
 副ストレージ装置12は、プロセッサ32a、32bと、キャッシュメモリ等のメモリ(不図示)と、複数のPDEV(不図示)と、通信ポート22及び25とを有する。これらのデバイスの各々の説明は、正ストレージ装置11と同様である。例えば、通信ポート22は、通信ポート21と同種であり、通信ポート25は、通信ポート24と同種である。副ストレージ装置12も、複数のVOLを提供する。VOLとして、SVOL(副VOL)47とSJVOL(副ジャーナルVOL)48とがある。SVOLは、PVOLとペアを構成するVOLであり、PVOLに書き込まれたユーザデータのコピー先のVOLである。SJVOL48は、副ジャーナル記憶領域の一例であり、PJVOL43に書き込まれたジャーナルのコピー先のVOLである。SJVOL48に蓄積されたジャーナルが含むユーザデータが、そのジャーナル内のメタデータに基づき、SVOLに書き込まれる。
 リモートコピーシステムには、複数(又は1つ)のジャーナルグループ40a、40bがある。ジャーナルグループ40毎に、1以上のPVOL42、1以上のPJVOL43、1以上のSJVOL48及び1以上のSVOL47が関連付けられる。PVOL42、PJVOL43、SJVOL48及びSVOL47の各々は、1つのジャーナルグループ40に関連付けられ、異なる複数のジャーナルグループ40に関連付けられない。複数のペアについてPVOL42が同一でもよい。ジャーナルグループ40aは、PVOL42a、PJVOL43a、SJVOL48a及びSVOL47aを含み、ジャーナルグループ40bは、PVOL42b、PJVOL43b、SJVOL48b及びSVOL47bを含む。正ストレージ装置11と副ストレージ装置12は、通信ネットワーク16上に構成したリモートパス17を通じて非同期リモートコピーを行う。非同期リモートコピーは、ジャーナルグループ毎に行われる。非同期リモートコピーとは、PVOL42aに書き込まれたデータを、PVOL42に対するデータの書込みとは非同期に、リモートパス17を通じて、SVOL47にコピーする技術である。具体的には、例えば、非同期リモートコピーは、ジャーナルグループ40aを例に取ると、次のように実行される。すなわち、正ストレージ装置11は、PVOL42aを指定した書込要求をホスト計算機13から受信し、受信した書込みに従うユーザデータをキャッシュメモリに書き込み、そのユーザデータを含んだジャーナルをキャッシュメモリ上に作成し、作成したジャーナルをPJVOL43aに書き込む。正ストレージ装置11は、ジャーナルが副ストレージ装置12に転送されたか否かに関わらず、書込要求に対して完了をホスト計算機13に応答する。正ストレージ装置11は、副ストレージ装置12からの要求により、或いは、自発的に、PJVOL43a内のジャーナルを、副ストレージ装置12へ転送する。副ストレージ装置12は、その転送されたジャーナルを受信し、受信したジャーナルをキャッシュメモリに書き込み、キャッシュメモリ上のジャーナルをSJVOL48aに書き込む。その後、副ストレージ装置12は、SJVOL48aに蓄積されたジャーナル内のユーザデータを、そのジャーナル内のメタデータを基に、SVOL47aに書き込む。このようにして、PVOL42aに書き込まれるユーザデータが、そのPVOL42aとペアを構成するSVOL47aにコピーされる。
 ホスト計算機13は、記憶資源(例えばメモリ)(不図示)と、通信ポート23と、プロセッサ(不図示)とを有する。ホスト計算機13内のプロセッサは、1又は複数のアプリケーションプログラム4を実行する。ホスト計算機13a(13b)は、アプリケーションプログラム4a(4b)を実行することにより、PVOL42を指定したアクセス要求を正ストレージ装置11に送信する。アクセス要求は、書込要求又は読出要求である。つまり、ホスト計算機13は、PVOL42にデータを書き込んだり、PVOL42からデータを読み出したりする。ホスト計算機13は、PVOL42にアクセスできない場合、アクセス先をSVOL47に切り替えることにより、処理を継続できる。
 非同期リモートコピーでは、正ストレージ装置11にデータが格納された時刻と、そのデータが副ストレージ装置12に格納された時刻とには、差がある。その差を、「遅延時間長」と言う。本実施例では、遅延時間長は、正ストレージ装置11のPJVOL43にジャーナルが格納された時刻とそのジャーナルが副ストレージ装置12のSJVOL48に格納された時刻との差である。遅延時間長は、例えば、ジャーナルグループ毎に算出される。遅延時間長の開始時刻は、データがPVOL42に格納された時刻と、そのデータを含んだジャーナルがPJVOL43に格納された時刻のどちらでもよく、遅延時間長の終了時刻は、データがSVOL47に格納された時刻と、そのデータを含んだジャーナルがSJVOL48に格納された時刻のどちらでもよい。
 遅延時間長は、悪化することがある。遅延時間長の悪化とは、遅延時間長が閾値を超えること(例えば、遅延時間長が閾値を所定時間以上又は所定回数以上超えること)である。遅延時間長の閾値は、ジャーナルグループ40毎に異なっていてもよいし、複数のジャーナルグループ40に共通でもよい。遅延悪化(遅延時間長の悪化)の原因は、正ストレージ装置11が有するリソース(物理リソース)のうち非同期リモートコピーに関わるリソース(例えばプロセッサ31又は通信ポート21)が遅延悪化時刻よりも前に過負荷になっていたことが考えられる。リソースが過負荷になる1つの原因として、PVOL42を指定した書込要求がホスト計算機13から大量に発行されたことが考えられる。
 しかし、遅延悪化の本質的な原因は、PVOL42を指定した書込要求がホスト計算機13から大量に発行されたことではなく、書込要求の大量に発行された原因、すなわち書込要求増加の原因である。書込要求増加の原因として、ホスト計算機13における処理量(業務量)の増加が考えられるが、常にそれが書込要求増加の原因であるとは限らない。別の原因として、ホスト計算機13における処理形態(業務形態)の変更も考えられる。例えば、或るPVOL42を使用する業務の形態が、シーケンシャルライトが主なバッチ業務からランダムアクセスが主な別の業務に変更された場合、ホスト計算機13における処理量が増加しなくとも、書込要求の数が増加する。
 そこで、実施例1では、管理サーバ10が、遅延悪化の本質的な原因が、ホスト計算機13における処理量(業務量)の増加なのか、それともホスト計算機13における処理形態(業務形態)の変更なのかを管理者により推定できる情報を管理クライアント14に表示する。管理サーバ10と管理クライアント14により構成される管理システムは、クライアントサーバシステムであり、管理クライアント14は、Webブラウザ(不図示)を実行することにより、管理サーバ10と通信し、管理サーバ10からの表示用情報をWebブラウザにより表示することができる。管理クライアント14は、いわゆる入出力コンソールであり、入力デバイス(例えばキーボード及びポインティングデバイス)及び表示デバイスを有する。
 以下、実施例1をより詳細に説明する。
 図2は、実施例1に係る管理サーバ10の有する機能及び情報を示す。
 管理サーバ10は、プロセッサ101と、記憶資源(例えば記憶デバイス102とメモリ103)と、I/F(通信インターフェイスデバイス)20と、これらのデバイス101、102、103及び20を繋ぐ内部バス105とを有する。プロセッサ101がプログラムを実行することにより、管理サーバ10の様々な機能が実現される。メモリ103は、プロセッサ101により実行されるプログラムやプロセッサ101によりアクセスされるデータを保持し、例えば、DRAMなどで構成される。記憶デバイス102は、補助記憶デバイスであり、メモリ103にロードされるプログラム又はデータを記憶でき、例えばHDD又はSSDなどで構成される。I/F20は、1以上の通信インターフェイスデバイスであり、例えば、管理サーバ10を通信ネットワーク(例えばSAN)15に接続するための通信インターフェイスデバイス(例えば、Fibre Channelアダプタ)と、管理サーバ10を通信ネットワーク(例えばLAN)18に接続するための通信インターフェイスデバイス(例えば、LANC(LAN Controller))とを含む。内部バス105は、データを双方向に伝送可能な伝送路であり、例えば、PCI-Expressバスなどで構成される。
 記憶デバイス102が記憶する情報として、例えば、コピーペアテーブル200と、構成テーブル220と、VOL使用テーブル240と、遅延テーブル260とがある。これらのテーブルが、管理情報の一例であり、これらのテーブルの少なくとも一部が、メモリ103にロードされてよい。また、メモリ103に記憶されプロセッサ101に実行されるコンピュータプログラムとして、例えば、計算機システム内のノード(ストレージ装置及びホスト計算機のうちの少なくとも1つ)から情報を収集する情報収集プログラム111と、収集された情報を基に平均書込量を算出する平均書込量算出プログラム113と、算出された平均書込量の時系列変化を表すグラフを生成し表示する遅延分析プログラム115とを有する。
 図3は、コピーペアテーブル200の構成を示す。
 コピーペアテーブル200は、コピーペア(リモートコピーのためのVOLのペア)毎にレコードを有し、各レコードが、フィールドとして、ペアID201と、正ストレージID202と、副ストレージID203と、正ジャーナルグループID204と、副ジャーナルグループID205と、PVOL ID206と、SVOL ID207とを有する。
 ペアID201には、コピーペアのIDが登録される。正ストレージID202及び副ストレージID203には、それぞれ、正ストレージ装置11のID及び副ストレージ装置12のIDが登録される。正ジャーナルグループID204及び副ジャーナルグループID205には、それぞれ、ジャーナルグループ40のIDが登録される。なお、ジャーナルグループ40は、正ストレージ装置11及び副ストレージ装置12に跨って存在するため、正ジャーナルグループID204及び副ジャーナルグループID205の各々に登録されるIDは同じであり、また、それらのフィールドは1つの共通フィールドでもよい。PVOL ID206及びSVOL ID207には、それぞれ、PVOL42のID及びSVOL47のIDが登録される。図3に例示のコピーペアテーブル200によれば、ジャーナルグループ「JN_1」に、2つのコピーペア「PA_1」及び「PA_2」が含まれている。
 図4は、構成テーブル220の構成を示す。
 構成テーブル220は、VOL及びホスト計算機の組毎に、レコードを有する。各レコードは、フィールドとして、VOL ID221と、ストレージID222と、ホストID223とを有する。
 VOL ID221には、VOL42又は47のIDが登録される。ストレージID222には、VOL42又は47を有するストレージ装置11又は12のIDが登録される。ホストID223には、VOL42又は47を使用するホスト計算機13のIDが登録される。図4に例示の構成テーブル220によれば、VOL「VOL_1」が、1つのホスト計算機「Host_A」に使用され、VOL「VOL_7」が、2つのホスト計算機「Host_D」及び「Host_A」に使用される。
 図5は、VOL使用テーブル240の構成を示す。
 VOL使用テーブル240は、VOLの使用履歴毎にレコードを有する。各レコードは、フィールドとして、時刻241と、VOL ID242と、書込量243と、書込回数244とを有する。
 時刻241には、時刻(例えばメトリック値の収集周期の開始時刻)を表す情報が登録される。VOL ID242には、VOL42又は47のIDが登録される。書込量243には、メトリック値の一例である書込量が登録される。「書込量」とは、単位時間あたりにVOL42又は47に書き込まれたデータ量、言い換えれば、単位時間当たりにホスト計算機13からVOL42又は47に対して送信された書込用のデータ量である。書込回数244には、メトリック値の一例である書込回数が登録される。「書込回数」とは、VOL42又は47を指定した書込要求を単位時間当たりに受信した数、言い換えれば、VOL42又は47を指定した書込要求を単位時間当たりにホスト計算機13から送信された数である。フィールド243及び244にそれぞれ登録される書込量及び書込回数は、ストレージ装置11及び12から収集された情報から特定されてもよいし、ホスト計算機13a及び13bから収集された情報から特定されてもよい。
 図6は、遅延テーブル260の構成を示す。
 遅延テーブル260は、時刻及びジャーナルグループの組毎にレコードを有する。各レコードは、フィールドとして、時刻261と、ジャーナルグループID262と、遅延時間長263とを有する。
 時刻261には、時刻(例えばメトリック値の収集周期の開始時刻)を表す情報が登録される。ジャーナルグループID262には、ジャーナルグループ40のIDが登録される。遅延時間長263には、メトリック値の一例である遅延時間長(例えば「秒」)を表す情報が格納される。図6に例示の遅延テーブル260によれば、ジャーナルグループ「JNL_1」内のPJVOL43に「8:00:00」にジャーナルが格納されてから8秒後にそのジャーナルがSJVOL48に格納された(コピーされた)ことがわかる。
 情報収集プログラム111は、所定の周期で、ホスト計算機13及びストレージ装置11及び12の各々から様々な所定種類の情報を収集し、その収集した情報を各テーブル200、220、240、260に登録する。例えば、情報収集プログラム111は、正ストレージ装置11又はホスト計算機「Host_A」からVOL「VOL_1」について取得された情報から、「8:00:00」に対応した書込量「20」(MB/秒)及び書込回数「20」(回/秒)を特定し、特定した書込量及び書込回数をVOL使用テーブル240に登録する(図5参照)。また、例えば、情報収集プログラム111は、正ストレージ装置11及び副ストレージ装置12から、ジャーナルグループ「JNL_1」について、PJVOL43にジャーナルが書き込まれた時刻「8:00:00」とSJVOL48に同一のジャーナルが書き込まれた時刻「8:00:08」とを取得し、それらの差である「8秒」を遅延テーブル260に登録する(図6参照)。
 平均書込量算出プログラム113は、平均書込量を算出するプログラムである。「平均書込量」は、書込要求1つあたりに書き込まれるデータの平均的な量であり、具体的には、平均書込量=書込量/書込回数、である。ホスト計算機13の業務がランダムライトよりシーケンシャルライトが多い場合、書込回数は少なく書込量は大きい。故に、平均書込量が比較的大きい。一方、ホスト計算機13の業務がシーケンシャルライトよりランダムライトが多い場合、書込回数が増えるが書込量も増える。故に、平均書込量は比較的小さく且つあまり変化しない(少なくともシーケンシャルライトが比較的多い場合と比べると、平均書込量の小さく且つあまり変化しない)。
 遅延分析プログラム115は、いずれかのジャーナルグループ40について遅延悪化が検出された場合、管理者(管理クライアント14)に、通知を出す。その通知は、例えば、遅延悪化が検出されたジャーナルグループ(以下、遅延悪化ジャーナルグループ)40のID、遅延悪化時刻(遅延時間長が閾値を超えた時刻)、及び、遅延悪化ジャーナルグループ40に属するPVOLを使用するホスト計算機13のID、のうちの少なくとも1つを含んでよい。
 また、遅延分析プログラム115は、テーブル200、220、240及び260に基づいてグラフを生成する。具体的には、例えば、遅延分析プログラム115は、VOL使用テーブル240に基づいて、時刻の経過に伴う書込量の変動を表すグラフである書込量グラフを、VOL毎に生成する。また、例えば、遅延分析プログラム115は、VOL使用テーブル240に基づいて、時刻の経過に伴う書込回数の変動を表すグラフである書込回数グラフを、VOL毎に生成する。また、例えば、遅延分析プログラム115は、遅延テーブル260に基づいて、時刻の経過に伴う遅延時間長の変動を表すグラフである遅延時間長グラフを、ジャーナルグループ40毎に生成する。遅延分析プログラム115は、平均書込量算出プログラム113によって算出された平均書込量に基づいて、時刻の経過に伴う平均書込量の変動を表すグラフである平均書込量グラフを、VOL毎に生成する。
 また、遅延分析プログラム115は、遅延悪化ジャーナルグループ40の遅延時間長グラフと、そのジャーナルグループ40に属するPVOLの平均書込量グラフとを比較可能な態様で表示する。比較可能な態様で表示とは、遅延時間長グラフが表示されがグラフ画面と平均書込量グラフが表示されたグラフ画面とを並べて表示することでもよいが、本実施例では、それらのグラフを同一グラフ画面上に表示することである。表示対象のグラフに対応した時間帯は、例えば、遅延悪化時刻を基準とした所定幅の時間帯である。
 図7及び図8は、それぞれ、グラフ画面の一例を示す。
 図7のグラフ画面500及び図8のグラフ画面520において、第1の軸の一例であるX軸(横軸)510は時間を表し(時間軸であり)、第2の軸の一例である右側のY軸512は遅延時間長を表し、第3の軸の一例である左側のY軸(縦軸)511は、書込量及び書込回数に係る指標を表す。例えば、図7のグラフ画面500は、ジャーナルグループ40a内の1つのPVOL42aについての画面であり、図8のグラフ画面520は、別のジャーナルグループ40b内の1つのPVOL42bについての画面である。
 まず、図7のグラフ画面500を参照する。
 管理者は、遅延時間長グラフ501を見ると、8時02分30秒頃から、遅延時間長が増加していることがわかる。また、管理者は、書込量グラフ502及び書込回数グラフ503を見ると、同じく8時02分30秒頃から、書込量及び書込回数が増加していることがわかる。
 しかし、管理者は、書込量グラフ502及び書込回数グラフ503からだけでは、遅延時間長の増加の本質的な原因が、ホスト計算機13における処理量の増加なのか、それともホスト計算機13における処理形態の変更なのかはわからない。
 ここで、管理者は、平均書込量グラフ504を見ると、8時02分30秒以降も、平均書込量はほとんど変動していないことがわかる。これにより、管理者は、ジャーナルグループ40aにおける遅延時間長の増加の本質的な原因は、ホスト計算機13における処理量の増加であると推定できる。なぜなら、平均書込量があまり変化していないということは、ランダムライトの書込要求が増加したために、正ストレージ装置11のプロセッサ31の処理負荷が増加し、それ故、遅延時間長が増加したと推定できるからである。
 次に、図8のグラフ画面520を参照する。
 管理者は、遅延時間長グラフ521を見ると、図7の遅延時間長グラフ501と同様、8時2分30秒頃から、遅延時間長が増加していることがわかる。
 しかし、管理者は、平均書込量グラフ524を見ると、図7の平均書込量グラフ504とは異なり、8時2分30秒頃に平均書込量が急激に減少していることがわかる。これにより、管理者は、ジャーナルグループ40bにおける遅延時間長の増加の本質的な原因は、ホスト計算機13における処理形態の変更であると推定できる。すなわち、管理者は、ホスト計算機13の処理形態が、シーケンシャルライトを主とする処理形態からランダムライトを主とする処理形態に変更されたと推定できる。なぜなら、平均書込量が急激に減少したということは、処理形態がシーケンシャルライトを主とする形態からランダムライトを主とする形態に変更されたために、正ストレージ装置11のプロセッサ31の処理負荷が増加し、遅延時間長が増加したと推定できるからである。
 以上のように、遅延時間長グラフと一緒に(例えば同一の座標上に)平均書込量グラフが表示されるので、管理者は、遅延悪化の原因が、ホスト計算機13における処理量の増加なのか、ホスト計算機13における処理形態の変更なのかを容易に判別することができる。
 図9は、平均書込量の算出処理のフローチャートである。
 情報収集プログラム111は、遅延時間長が閾値を超えたジャーナルグループ40に属する全てのPVOL42を識別する(S101)。平均書込量算出プログラム113は、S101で識別した全てのPVOL42の各々について、S102~S104を行う。識別されたPVOLのうちの1つのPVOL(以下、図9の説明において「対象PVOL」)を例に取り、S102~S104を説明する。
 平均書込量算出プログラム113は、VOL使用テーブル240から、対象PVOL42に対応した書込量及び書込回数を取得する(S102及びS103)。このとき、平均書込量算出プログラム113は、遅延悪化時刻を基準とした所定幅の時間帯に属する各時刻の書込量及び書込回数を取得する。「遅延悪化時刻を基準とした所定幅の時間帯」は、遅延悪化時刻及びそれよりも将来の時間帯を含んでもよいが、少なくとも遅延悪化時刻から過去所定幅の時間帯を含む。なぜなら、遅延悪化時刻から過去所定幅の時間帯での状況が遅延悪化の原因となるためである。
 平均書込量算出プログラム113は、遅延悪化時刻を基準とした所定幅の時間帯に属する各時刻について、取得した書込量及び書込回数を用いて平均書込量を算出する(S104)。
 以上の処理により、遅延悪化ジャーナルグループ40に属する各PVOL42について、遅延悪化時刻を基準とした所定幅の時間帯に属する各時刻での書込量、書込回数及び平均書込量が取得される。遅延分析プログラム115が、遅延悪化ジャーナルグループ40に属する各PVOL42について、遅延悪化時刻を基準とした所定幅の時間帯に属する各時刻での書込量、書込回数及び平均書込量を基に、図7又は図8に示したようなグラフを生成し、遅延分析プログラム115が、生成されたグラフを同一グラフ画面上に表示する。
 実施例1によれば、管理サーバ10が、遅延悪化ジャーナルグループ40について、遅延時間長グラフと比較可能な態様で、そのジャーナルグループ40に属するPVOLの平均書込量グラフを表示する。これにより、管理者は、遅延悪化の本質的な原因が、ホスト計算機13における処理量(業務量)の増加なのか、それともホスト計算機13における処理形態(業務形態)の変更なのかを推定できる。なお、実施例1では、管理サーバ10が、遅延時間長グラフと平均書込量グラフを比較し、比較の結果を基に、遅延悪化の本質的な原因を推定し、推定した原因を出力してもよい。PVOLのIDをキーに、構成テーブル220から、そのPVOLを使用するホスト計算機がわかるので、管理者は、ホスト計算機のユーザに対して所定の対処を依頼することができる。
 実施例2を説明する。以下、実施例1との共通点については説明を省略又は簡略し、実施例1との相違点を主に説明する。
 非同期リモートコピーにおいて、PVOLの書込回数が増加してから遅延時間長が悪化するまでの期間は、書込回数、書込量、及び、正ストレージ装置11の物理リソース(例えば、ポート、プロセッサ及びキャッシュメモリのうちの少なくとも1つ)の関係によってまちまちである。遅延悪化が検出されたジャーナルボリューム40に属するPVOL毎に、管理者が、遅延時間長グラフと、メトリック値グラフ(例えば、書込量グラフ、書込回数グラフ及び平均書込量グラフのうちの少なくとも1つ)との比較を行うことで、遅延悪化の原因として推定されるPVOLを見つけることができる。
 しかし、遅延悪化ジャーナルグループ40に多くのPVOLが存在すると、管理者にとってグラフ比較の負担は大きい。
 また、複数のジャーナルグループについて遅延悪化が検出された場合、それら複数のジャーナルグループの各々についてPVOL毎に上述のグラフ比較が必要となると、管理者の負担が大きい。具体的には、例えば、或るジャーナルグループ内の或るPVOLについて書込回数が増加したことが原因で、そのPVOLだけでなく他のジャーナルグループ内の他のPVOLにも関わる物理リソース(共通リソース)が遅延悪化時刻前に過負荷となることがあるが、そうなると、その共通リソースが関わる他のジャーナルグループについても遅延時間長が悪化することがある。このような場合、遅延悪化の原因と推定されるPVOLを見つけることは、管理者にとって負担である。
 そこで、実施例2では、管理サーバ10が、PVOL検索範囲に属する各PVOLのメトリック値変動(例えばメトリック値グラフ)について、遅延悪化ジャーナルグループ40の遅延時間長変動(例えば遅延時間長グラフ)との関係が所定の条件を満たすか否かを判定する。PVOL検索範囲は、遅延悪化ジャーナルグループ40の遅延時間長変動とそれぞれ比較されるメトリック値変動に対応した1以上のPVOLであり、例えば、遅延悪化ジャーナルグループ40に属する1以上のPVOLである。表示されるメトリック値グラフは、判定結果が肯定のメトリック値グラフに絞り込まれる。これにより、グラフの視認性が高まり、その結果、遅延悪化の原因と推定されるPVOLを見つけることが管理者にとって容易になる。PVOLのIDをキーに構成テーブル220から、そのPVOLを使用するホスト計算機がわかるので、遅延悪化の原因のホスト計算機も推定できる。
 また、実施例2では、上述のPVOL検索範囲を、遅延悪化ジャーナルグループ40に関連する過負荷共通リソースの有無に応じて調整することができる。「共通リソース」とは、2以上のジャーナルグループ40に関連付けられている物理リソース(特に正ストレージ装置11が有する物理リソース)である。物理リソースの「過負荷」とは、その物理リソースのメトリック値が閾値を超えていることである。「遅延悪化ジャーナルグループ40に関連付けられている過負荷共通リソース」とは、遅延悪化ジャーナルグループ40に関連付けられており遅延悪化時刻から過去所定幅の時間帯において過負荷となった共通リソースである。実施例2では、遅延悪化ジャーナルグループ40に関連付けられている過負荷共通リソースが無ければ、PVOL検索範囲は、遅延悪化ジャーナルグループ40に属する全てのPVOLであり、一方、遅延悪化ジャーナルグループ40に関連付けられている過負荷共通リソースが有れば、PVOL検索範囲は、遅延悪化ジャーナルグループ40に属する全てのPVOLに加えて、その共通リソースが関連付けられている他の全てのジャーナルグループ40に属する全てのPVOLである。このようにして、PVOL検索範囲の広さを最適にできる。
 以下、実施例2を詳細に説明する。
 図10は、実施例2に係る管理サーバ10の有する機能及び情報を示す。
 記憶デバイス102が、上述したテーブル200、220、240及び260の他に、ジャーナルグループテーブル300、グラフ特性分類テーブル340及びプロセッサ使用テーブル320を記憶する。また、プロセッサ101では、実施例1の情報収集プログラム111よりも多くの情報を収集する情報収集プログラム1011と、実施例1の遅延分析プログラム115よりも多くの機能を有する遅延分析プログラム1015を実行する。
 図11は、ジャーナルグループテーブル300の構成を示す。
 ジャーナルグループテーブル300は、ジャーナルグループ40及びプロセッサの組毎にレコードを有する。各レコードは、フィールドとして、ジャーナルグループID301と、ストレージID302と、プロセッサID303とを有する。
 ジャーナルグループID301には、ジャーナルグループ40のIDが登録される。ストレージID302には、ストレージ装置11又は12のIDが登録される。プロセッサID303には、プロセッサ31又は32のIDが登録される。図11に例示のジャーナルグループテーブル300によれば、正ストレージ装置「ST_A」のプロセッサ「PS_1A」が、複数のジャーナルグループ「JN_1」及び「JN_2」に関連している。つまり、プロセッサ「PS_1A」が、ジャーナルグループ「JN_1」及び「JN_2」のいずれかのPVOLに対する書込要求を処理する。
 図12は、プロセッサ使用テーブル320の構成を示す。
 プロセッサ使用テーブル320は、プロセッサ31又は32の使用履歴毎にレコードを有する。各レコードは、フィールドとして、時刻321と、プロセッサID322と、稼働率323とを有する。
 時刻321には、時刻を表す情報が登録される。プロセッサID322には、プロセッサ31又は32のIDが登録される。稼働率323には、プロセッサ31又は32の稼働率(%)が登録される。登録される稼働率は、情報収集プログラム111によりストレージ装置11及び12から収集された稼働率である。稼働率が閾値を超えたプロセッサが、過負荷のプロセッサである。
 なお、本実施例では、ジャーナルグループ40に関連付けられる物理リソース(正ストレージ装置11内の物理リソース)として、プロセッサ31を例に取っている。このため、図11のジャーナルグループテーブル300において、ジャーナルグループ40に関連付けられている物理リソースはプロセッサのみである。ジャーナルグループ40に関連付けられる物理リソースとして、他種の物理リソースが採用されてもよい。例えば、物理リソースとして、ホスト計算機13に接続されるポート21が採用されてよい。この場合、ジャーナルグループテーブル300において、ポート21のIDがジャーナルグループ40毎に関連付けられてよく、また、ポート21のメトリック値(例えば単位時間当たりの転送データ量)が所定の周期で収集され所定のテーブルに登録されてよい。書込要求は、その書込要求で指定されているPVOL42が属するジャーナルグループ40に関連付けられているポート21で受信される。メトリック値が閾値を超えたポート21が、過負荷のポート21である。また、例えば、ジャーナルグループ40に関連付けられる物理リソースとして、キャッシュメモリ(不図示)が採用されてよい。この場合、ジャーナルグループテーブル300において、キャッシュメモリのID(例えばメモリにおけるアドレス範囲)がジャーナルグループ40毎に関連付けられてよく、また、キャッシュメモリのメトリック値(例えば、キャッシュメモリの容量に対する使用容量の割合)が所定の周期で収集され所定のテーブルに登録されてよい。PVOL42に入出力されるデータは、そのPVOL42が属するジャーナルグループ40に関連付けられているキャッシュメモリに格納される。メトリック値が閾値を超えたキャッシュメモリが、過負荷のキャッシュメモリである。
 図13は、グラフ特性分類テーブル340の構成を示す。
 グラフ特性分類テーブル340は、グラフがいずれのグラフ特性(例えばパターン)に分類されるかの判定に用いられるテーブルであり、グラフ特性毎にレコードを有する。各レコードは、フィールドとして、パターンID341と、X軸条件342と、Y軸条件343と、グラフ特性344とを有する。
 パターンID341には、グラフ特性としてのパターンのIDが登録される。X軸条件342には、グラフのX軸における時刻tに対する条件が登録される。Y軸条件には、グラフのY軸における値yに対する条件が登録される。グラフ特性343には、グラフの特性を説明する情報が登録される。
 図13に例示のグラフ特性分類テーブル340によれば、下記が定義されている。
(1)グラフ特性「閾値を超えた後減少」を有するグラフは、パターンID「1」に該当する。例えば、時間帯Tのグラフが、最大値ymaxの時刻tm(グラフの最大y座標に対応したx座標)が、最小値yminの時刻tn(グラフの最小y座標に対応したx座標)よりも過去であり(tm<tn)、且つ、時間帯Tの開始時刻taの値ya(始点x座標に対応したy座標)が、時間帯Tの終了時刻tbの値yb(終点x座標に対応したy座標)と同じ若しくは大きい(ya≧yb)場合、そのグラフは、パターンID「1」に該当する。
(2)グラフ特性「第1の振動」を有するグラフは、パターンID「2」に該当する。例えば、時間帯Tのグラフが、最大値ymaxの時刻tmが、最小値yminの時刻tnよりも過去であり(tm<tn)、且つ、開始時刻taの値yaが、終了時刻tbの値ybよりも小さい(ya<yb)場合、そのグラフは、パターンID「2」に該当する。
(3)グラフ特性「第2の振動」を有するグラフは、パターンID「3」に該当する。例えば、時間帯Tのグラフが、最大値ymaxの時刻tmが、最小値yminの時刻tnよりも未来であり(tm>tn)、且つ、開始時刻taの値yaが、終了時刻tbの値ybと同じ若しくは大きい(ya≧yb)場合、そのグラフは、パターンID「3」に該当する。
(4)グラフ特性「増加」を有するグラフは、パターンID「4」に該当する。例えば、時間帯Tのグラフが、最大値ymaxの時刻tmが、最小値yminの時刻tnよりも未来であり(tm>tn)、且つ、開始時刻taの値yaが、終了時刻tbの値ybよりも小さい(ya<yb)場合、そのグラフは、パターンID「4」に該当する。
(5)グラフ特性「一定」を有するグラフは、パターンID「5」に該当する。例えば、時間帯Tのグラフが、最大値ymaxの時刻tmと最小値yminの時刻tnとが同じであり(tm=tn)、且つ、開始時刻taの値yaと終了時刻tbの値ybとが同じである(ya=yb)場合、そのグラフは、パターンID「5」に該当する。
 情報収集プログラム1011は、実施例1で説明した機能に加えて、テーブル300、320、340に関する情報についても収集及び登録する。遅延分析プログラム1015は、プロセッサ使用テーブル320の情報に基づいて、プロセッサ31又は32の稼働率の変動を表すグラフ(「プロセッサ稼働率のグラフ」という)を生成してもよい。
 遅延分析プログラム1015は、或る時間帯におけるグラフが、グラフ特性分類テーブル340のいずれのパターンID341に該当するかを判定する。例えば、遅延分析プログラム1015は、時間帯Tにおけるグラフが、グラフ特性分類テーブル340のいずれのレコードのX軸条件342及びY軸条件343に該当するかを判定する。該当するレコードが存在する場合、遅延分析プログラム1015は、その時間帯Tにおけるグラフが、その該当するレコードのパターンID341のグラフ特性344を有すると判定する。
 遅延分析プログラム1015は、遅延悪化ジャーナルグループ40についての遅延時間長グラフとの関係が所定の条件を満たすメトリック値グラフに対応したPVOL42を、PVOL検索範囲の中から検索する。その際、遅延分析プログラム1015は、遅延悪化ジャーナルグループ40に関連付けられている過負荷共通プロセッサ(過負荷共通リソースの一例)が正ストレージ装置11にあるか否かを判断する。そのような過負荷共通プロセッサ31が無ければ、遅延分析プログラム1015は、PVOL検索範囲を、遅延悪化ジャーナルグループ40に属するPVOL42のみとする。一方、そのような過負荷共通プロセッサ31が有れば、遅延分析プログラム1015は、PVOL検索範囲を、遅延悪化ジャーナルグループ40に属するPVOL42のみならず、過負荷共通プロセッサ31が関連付けられている他の全てのジャーナルグループ40に属するPVOL42とする。遅延時間長が悪化している第1のジャーナルグループ40とは別の第2のジャーナルグループ40に属するPVOL42に対する書込回数が増加したことにより、第1及び第2のジャーナルグループ40を含む2以上のジャーナルグループ40に関連付けられているプロセッサ(共通プロセッサ)31が過負荷となり、それにより、第1のジャーナルグループ40について遅延時間長が悪化することがあり得る。本実施例によれば、遅延悪化ジャーナルグループ40に関連付けられている過負荷共通プロセッサ31の有無に応じて、PVOL検索範囲の広さを最適化できる。
 遅延分析プログラム1015は、遅延時間長グラフとの関係が所定の条件を満たすメトリック値グラフを検索することにより、表示対象のメトリック値グラフを検索によりヒットしたメトリック値グラフに絞り込む(又は、ヒットしたメトリック値グラフに対応するPVOL42を遅延悪化の原因と推定する)。例えば、遅延分析プログラム1015は、PVOL検索範囲に属する全てのPVOLに対応した全ての書込回数グラフのうち、遅延時間長グラフのグラフ特性(例えばパターン)と同じグラフ特性を有する書込回数グラフのみを表示してよい。具体的には、例えば、遅延分析プログラム1015は、グラフ特性分類テーブル340を参照し、遅延時間長グラフのパターンIDを識別する。そして、遅延分析プログラム1015は、識別したパターンIDと同じパターンIDを有する書込回数グラフを識別する。遅延分析プログラム1015は、その識別した書込回数グラフを表示する(又は、その書込回数グラフに対応したPVOLを遅延悪化の原因と推定する)。なお、遅延分析プログラム1015は、遅延時間長グラフと比較するグラフとして、書込回数グラフに代えて、他のメトリック値グラフ(例えば書込量グラフ)を採用してもよい。
 以下、遅延時間長グラフのパターンIDと同じパターンIDを有する書込回数グラフの識別の詳細について説明する。
 図14は、同じグラフ特性を有するグラフの識別の一例を示す。
 X軸(横軸)550は時間を表し、左側のY軸(縦軸)551は書込回数に係る指標を表し、右側のY軸552は遅延時間長を表す。ここで、グラフ540の全体の開始時刻を「t0」、終了時刻を「t1」とする。終了時刻t1は、情報収集プログラム1011が情報を収集した最新の時刻であってもよい。また、遅延時間長グラフ542が所定の遅延閾値541を超えた時刻を遅延悪化時刻「ts」とする。また、「遅延悪化時刻ts~終了時刻t1」の時間帯を「T0」とする。
 まず、遅延分析プログラム1015は、時間帯T0における遅延時間長グラフ542がいずれのパターンIDに該当するかを判定する。
 次に、遅延分析プログラム1015は、「時刻(ts-d)~時刻(t1-d)」の時間帯を「T1」とする。ここで、dは、0を初期値とし、所定値Δdずつ増加する変数である。すなわち、時間帯T1は、時間帯T0を過去の時刻の方向にdの分ずらした時間帯である。
 次に、遅延分析プログラム1015は、時間帯T1における書込回数グラフ(或るPVOL42に対応した書込回数グラフ)543及び時間帯T1における書込回数グラフ(別のPVOL42に対応した書込回数グラフ)544がそれぞれいずれのパターンIDに該当するかを判定する。その際、遅延分析プログラム1015は、dを0から(ts-t0)までΔdずつ増加させ(すなわち、T1をΔdずつ過去の時刻の方へずらしていき)、時間帯T1におけるいずれかの書込回数グラフ543又は544のパターンIDが、遅延時間長グラフ542のパターンIDと一致するか判定する。
 時間帯T1においていずれかの書込回数グラフ543又は544のパターンIDが、遅延時間長グラフ542のパターンIDと一致する場合、遅延分析プログラム1015は、その一致した書込回数グラフを表示対象とする(又は、その一致した書込回数グラフに対応するPVOL42を遅延原因と推定する)。
 具体的には、例えば、遅延分析プログラム1015は、時間帯T0における遅延時間長グラフ542のパターンIDは「1」に該当すると識別する。また、遅延分析プログラム1015は、時間帯T1における書込回数グラフ543はパターンID「1」に該当し、書込回数グラフ544はパターンID「2」に該当すると識別する。したがって、遅延分析プログラム1015は、遅延時間長グラフとパターンIDが一致する書込回数グラフ543を表示対象と決定し、パターンIDが一致しない書込回数グラフ544を、表示対象としない。
 遅延分析プログラム1015は、図15に例示するグラフ画面1560を表示する。グラフ画面1560では、遅延時間長の閾値541と遅延時間長グラフ542の他は、遅延時間長グラフ542とパターンIDが一致する書込回数グラフ543のみが表示され、遅延時間長グラフ542とパターンIDが一致しない書込回数グラフ544が表示されない。このように、表示対象のグラフが、遅延時間長グラフ542と関連するグラフに絞り込まれるので、グラフの視認性が高まり、故に、管理者は、遅延悪化の原因としてのPVOLを容易に推定することができる。図16に例示するように、表示対象のグラフが絞り込まれることなく、PVOL検索範囲に属する全てのPVOLについてグラフが表示されるとなると(グラフ543に加えてグラフ544も表示されると)、グラフの視認性が悪く、特に、PVOL検索範囲に多くのPVOLが存在するケースでは、遅延悪化の原因であるPVOLの推定が困難となる。
 図17は、遅延原因推定処理のフローチャートである。
 遅延分析プログラム1015は、遅延悪化ジャーナルグループ40に関連付けられている過負荷共通プロセッサ31の有無に応じたPVOL検索範囲に属する全てのPVOL42を識別する(S301)。遅延分析プログラム1015は、「遅延悪化時刻ts~終了時刻t1」を時間帯T0とする(S302)。
 遅延分析プログラム1015は、時間帯T0に関するパターン識別処理、すなわち、時間帯T0における遅延時間長グラフのパターンIDを識別する(S303)。パターン識別処理については、図18を参照して後述する。
 遅延分析プログラム1015は、変数dに「0」を設定(初期化)する(S304)。遅延分析プログラム1015は、「(遅延悪化時刻ts-変数d)≧終了時刻t1」となるまで、S305~S308を繰り返す。
 具体的には、遅延分析プログラム1015は、変数dに所定値Δdを加算し(S305)、「(遅延悪化時刻ts-変数d)~(終了時刻t1-変数d)」を時間帯T1とする(S306)。遅延分析プログラム1015は、S301で識別した全てのPVOL42の各々について、時間帯T1に関するパターン識別処理、すなわち、時間帯T1における書込回数グラフのパターンIDを識別する(S307)。遅延分析プログラム1015は、遅延時間長グラフのパターンIDと一致するパターンIDを有する書込回数グラフを識別し、その識別した書込回数グラフに対応するPVOL42のIDを関連リストに登録する(S308)。
 以上の処理により、関連リストには、遅延時間長グラフのパターンIDの一致するパターンIDを有する書込回数グラフに対応するPVOL42のIDが登録される。すなわち、関連リストには、遅延悪化の原因と推定されるPVOL42のIDが登録される。遅延分析プログラム1015は、この関連リストを参照して、遅延時間長グラフと一緒に表示する書込回数グラフを決定する。具体的には、関連リストに登録されているIDから識別されるPVOLの書込回数グラフが、表示対象として決定される。
 図18は、パターン識別処理のフローチャートである。
 パターン識別処理は、図17のS303及びS307で行われる。この処理がS303の詳細の場合、図18の説明における「対象グラフ」は遅延時間長グラフに相当し、時間帯TはT0に相当する。この処理がS307の詳細の場合、図18の説明における「対象グラフ」は1つのPVOLに対応した書込回数グラフに相当し、時間帯TはT1に相当する。
 遅延分析プログラム1015は、グラフ特性分類テーブル340を参照して、以下の処理を実行する。
 すなわち、遅延分析プログラム1015は、時間帯Tにおける対象グラフについて、最大値ymaxの時刻tmが、最小値yminの時刻tnよりも過去である(tm<tn)か否かを判定する(S401)。
 S401の判定結果が肯定の場合(S401:YES)、遅延分析プログラム1015は、時間帯Tにおける対象グラフについて、時間帯Tの開始時刻taの値yaが、時間帯Tの終了時刻tbの値ybと同じ若しくは大きい(ya≧yb)か否かを判定する(S402)。S402の判定結果が肯定の場合(S402:YES)、遅延分析プログラム1015は、対象グラフのパターンIDが「1」と識別する。S402の判定結果が否定の場合(S402:NO)、遅延分析プログラム1015は、対象グラフのパターンIDが「2」と識別する。
 S401の判定結果が否定の場合(S401:NO)、遅延分析プログラム1015は、時間帯Tにおける対象グラフについて、時間帯Tにおける最大値ymaxの時刻tmが、時間帯Tにおける最小値yminの時刻tnよりも未来であるか否かを判定する(S410)。S410の判定結果が否定の場合(S410:NO)、遅延分析プログラム1015は、対象グラフのパターンIDが「5」と識別する。S410の判定結果が肯定の場合(S410:YES)、遅延分析プログラム1015は、時間帯Tにおける対象グラフについて、時間帯Tの開始時刻taの値yaが、時間帯Tの終了時刻tbの値ybと同じ若しくは大きい(ya≧yb)か否かを判定する(S411)。S411の判定結果が肯定の場合(S411:YES)、遅延分析プログラム1015は、対象グラフのパターンIDが「3」と識別する。S411の判定結果が否定の場合(S411:NO)、遅延分析プログラム1015は、対象グラフのパターンIDが「4」と識別する。
 以上の処理により、対象グラフのパターンIDが識別される。
 図19は、遅延時間長グラフとの関係が所定の条件を満たす平均書込量グラフの識別の例を示す。
 X軸(横軸)610は時間を表し、左側のY軸(縦軸)611は書込量に係る指標を表し、右側のY軸612は遅延時間長を表す。ここで、開始時刻を「t0」、終了時刻を「t1」、遅延悪化時刻を「ts」、「遅延悪化時刻ts~終了時刻t1」の時間帯を「T0」とする。
 遅延分析プログラム1015は、例えば以下のようにして、遅延原因を推定する。
(S19-1)遅延分析プログラム1015は、遅延悪化ジャーナルグループ40に関連付けられている過負荷共通プロセッサ31の有無に応じた広さのPVOL検索範囲に属する全てのPVOL42を識別する。
(S19-2)遅延分析プログラム1015は、時間帯T0(遅延悪化時刻ts~終了時刻t1)を、過去の時刻の方向に変数dの分ずらした時間帯T1を設定する。
(S19-3)遅延分析プログラム1015は、(S19-1)で識別したPVOL42の各々について、時間帯T1における平均書込量を算出する。
(S19-4)遅延分析プログラム1015は、平均書込量が所定の閾値よりも小さいPVOL42のIDを関連リストに登録する。
(S19-5)遅延分析プログラム1015は、変数dに所定値Δdを加算して(S19-2)の処理に戻る。
 例えば、時間帯T1において、第1のPVOL42の平均書込量グラフ603が平均書込量「約50Byte」を表し、第2のPVOL42の平均書込量グラフ604が平均書込量「約250Byte」を表しているとする。閾値が「100Byte」とすると、遅延分析プログラム1015は、平均書込量が所定の閾値よりも小さい第1のPVOL42のIDを、関連リストに登録する。すなわち、遅延分析プログラム1015は、第1のPVOL42を遅延原因と推定する。なぜなら、平均書込量が小さいPVOLは、書込回数が多い可能性が高いからである。
 遅延分析プログラム1015は、平均書込量グラフ603及び604のうち、関連リストに登録されたPVOL IDに対応する平均書込量グラフ603のみをグラフ画面に表示し、関連リストに登録されなかったPVOL IDに対応する平均書込量グラフ604を非表示にしてよい。
 以上、幾つかの実施例を説明したが、それらの実施例は、本発明の説明のための例示であり、本発明の範囲をそれらの実施例にのみ限定する趣旨ではない。当業者は、本発明の要旨を逸脱することなしに、他の様々な態様で本発明を実施することができる。
 例えば、管理サーバ10で実行されるプログラムは、ホスト計算機又はストレージ装置といった他の装置で実行されてもよい。
 また、例えば、遅延分析プログラム1015は、遅延時間長グラフと関連するグラフを、上述とは異なる方法で識別しても良い。具体的には、遅延分析プログラム1015は、正規化、周波数解析、又は相関係数などに基づいて、遅延時間長グラフと関連するグラフを識別してもよい。
 また、PJVOL及びSJVOLのうちの少なくとも1つに代えて、キャッシュメモリ上に確保された一領域が、ジャーナル記憶領域の一例であってもよい。
 10:管理サーバ 11:正ストレージ装置 12:副ストレージ装置 13a、13b:ホスト計算機 14:管理クライアント 40a、40b:ジャーナルグループ 42a、42b:正ボリューム(PVOL) 43a、43b:正ジャーナルボリューム(PJVOL) 47a、47b:副ボリューム(SVOL) 48a、48b:副ジャーナルボリューム(SJVOL)

 

Claims (15)

  1.  非同期リモートコピーを行うリモートコピーシステムを含んだ計算機システムに接続された通信インターフェイスデバイスと、
     記憶資源と、
     前記通信インターフェイスデバイス及び前記記憶資源に接続されたプロセッサと
    を有し、
     前記リモートコピーシステムは、正ストレージシステムと、前記正ストレージシステムに接続された副ストレージシステムとを有し、
     前記正ストレージシステムは、データが書き込まれる正ボリュームと、前記正ボリュームに書き込まれるデータを含んだジャーナルが書き込まれる正ジャーナル記憶領域とを有し、前記正ジャーナル記憶領域に書き込まれたジャーナルを前記副ストレージシステムに転送し、
     前記副ストレージシステムは、前記正ストレージシステムからのジャーナルが書き込まれる副ジャーナル記憶領域と、前記副ジャーナル記憶領域に蓄積されているジャーナル内のデータが書き込まれる副ボリュームとを有し、
     前記計算機システムは、前記正ボリュームを指定した書込要求を送信するホスト計算機を更に含み、
     前記記憶資源は、複数の時刻にそれぞれ対応した複数の遅延時間長と、前記正ボリュームについて前記複数の時刻にそれぞれ対応した複数のメトリック値とを含んだ管理情報を記憶し、
     各遅延時間長について、開始時刻は、前記正ボリュームにデータが格納された時刻、又は、そのデータを含んだジャーナルが前記正ジャーナル記憶領域に格納された時刻であり、終了時刻は、そのジャーナルが前記副ジャーナル記憶領域に格納された時刻、又は、そのジャーナル内のデータが前記副ボリュームに格納された時刻であり、
     前記プロセッサは、
      前記管理情報を参照し、
      前記管理情報を基に、時刻の経過に伴う遅延時間長の変動を表す遅延時間長グラフと、時刻の経過に伴う平均書込量の変動を表す平均書込量グラフとを比較可能な態様で表示し、平均書込量は、書込要求1つ当たりに前記正ボリュームに書き込まれたデータの量である、
    管理システム。
  2.  前記プロセッサは、前記遅延時間長グラフと前記平均書込量グラフとを同一グラフ画面に表示し、
     前記グラフ画面において、第1の軸が、時刻に対応し、
     前記グラフ画面において、前記第1の軸と直交する一方の軸である第2の軸が、遅延時間長に対応し、
     前記グラフ画面において、前記第1の軸と直交する他方の軸である第3の軸が、平均書込量に対応する、
    請求項1記載の管理システム。
  3.  前記複数の時刻にそれぞれ対応した複数のメトリック値は、前記複数の時刻にそれぞれ対応した複数の書込回数と、前記複数の時刻にそれぞれ対応した複数の書込量であり、
     書込回数は、単位時間当たりの書込要求の数であり、
     書込量は、単位時間当たりに書き込まれたデータの量であり、
     前記プロセッサは、前記複数の時刻の各々について、書込量を書込回数で割ることで平均書込量を算出する、
    請求項1記載の管理システム。
  4.  前記正ストレージシステムが、複数の正ボリュームを有し、
     前記副ストレージシステムが、前記複数の正ボリュームに対応する複数の副ボリュームを有し、
     前記管理情報は、前記複数の正ボリュームの各々について、前記複数の時刻にそれぞれ対応した複数のメトリック値を含み、
     前記プロセッサは、
      遅延時間長変動との関係が所定の条件を満たすメトリック値変動に対応した正ボリュームを識別し、
      前記複数の正ボリュームのうち、識別された正ボリュームについてのみ、前記遅延時間長グラフと比較可能な態様でメトリック値グラフを表示する、
    請求項1記載の管理システム。
  5.  前記プロセッサは、遅延時間長変動との関係が所定の条件を満たすメトリック値変動に対応した正ボリュームを、正ボリューム検索範囲から識別し、
     前記リモートコピーシステムは、1以上のジャーナルグループを有し、
     各ジャーナルグループが、1以上の正ボリュームと、1以上の正ジャーナル記憶領域と、1以上の副ジャーナル記憶領域と、1以上の副ボリュームとを有し、
     前記正ボリューム検索範囲は、遅延悪化ジャーナルグループに属する全ての正ボリュームであり、
     前記遅延悪化ジャーナルグループは、遅延時間長が遅延閾値を超えたジャーナルグループである、
    請求項4記載の管理システム。
  6.  前記リモートコピーシステムは、複数のジャーナルグループを有し、
     前記正ストレージシステムは、前記複数のジャーナルグループに関連付けられた複数の物理リソースを有し、
     前記複数の物理リソースは、前記複数のジャーナルグループのうちの2以上のジャーナルグループに関連付けられた物理リソースである共通物理リソースを含み、
     前記管理情報は、前記複数の物理リソースの各々について、前記複数の時刻にそれぞれ対応した複数のメトリック値を含み、
     前記プロセッサは、前記遅延悪化ジャーナルグループに関連付けられている過負荷共通物理リソースが無ければ、前記正ボリューム検索範囲を、前記遅延悪化ジャーナルグループに属する全ての正ボリュームとし、
     前記プロセッサは、前記遅延悪化ジャーナルグループに関連付けられている過負荷共通物理リソースが有れば、前記正ボリューム検索範囲を、前記遅延悪化ジャーナルグループに属する全ての正ボリュームに加えて、前記遅延悪化ジャーナルグループに関連付けられている他の全てのジャーナルボリュームに属する全ての正ボリュームとし、
     前記遅延悪化ジャーナルグループに関連付けられている過負荷共通物理リソースとは、遅延時間長が閾値を超えた時刻から過去の時間帯においてメトリック値がメトリック閾値を超えた共通物理リソースである、
    請求項5記載の管理システム。
  7.  遅延時間長変動との関係が所定の条件を満たすメトリック値変動とは、前記遅延時間長グラフが有するグラフ特性と同一のグラフ特性を有するメトリック値グラフであり、
     前記遅延時間長グラフが有するグラフ特性は、遅延時間長が前記遅延閾値を超えた時刻を基準とした将来の時間帯でのグラフ特性であり、
     前記メトリック値グラフが有する前記同一のグラフ特性は、遅延時間長が前記遅延閾値を超えた時刻を基準とした過去の時間帯でのグラフ特性である、
    請求項4記載の管理システム。
  8.  前記メトリック値グラフは、単位時間当たりの書込要求の数である書込回数のグラフである、
    請求項6記載の管理システム。
  9.  遅延時間長変動との関係が所定の条件を満たすメトリック値変動とは、遅延時間長が前記遅延閾値を超えた時刻を基準とした過去の時間帯において平均書込量が書込量閾値未満となる平均書込量変動である、
    請求項4記載の管理システム。
  10.  非同期リモートコピーを行うリモートコピーシステムを含んだ計算機システムを管理する計算機で実行されるコンピュータプログラムであって、
      前記リモートコピーシステムは、正ストレージシステムと、前記正ストレージシステムに接続された副ストレージシステムとを有し、
      前記正ストレージシステムは、データが書き込まれる正ボリュームと、前記正ボリュームに書き込まれるデータを含んだジャーナルが書き込まれる正ジャーナル記憶領域とを有し、前記正ジャーナル記憶領域に書き込まれたジャーナルを前記副ストレージシステムに転送し、
      前記副ストレージシステムは、前記正ストレージシステムからのジャーナルが書き込まれる副ジャーナル記憶領域と、前記副ジャーナル記憶領域に蓄積されているジャーナル内のデータが書き込まれる副ボリュームとを有し、
      前記計算機システムは、前記正ボリュームを指定した書込要求を送信するホスト計算機を更に含み、
     前記コンピュータプログラムは、
     複数の時刻にそれぞれ対応した複数の遅延時間長と、前記正ボリュームについて前記複数の時刻にそれぞれ対応した複数のメトリック値とを含んだ管理情報を参照し、各遅延時間長について、開始時刻は、前記正ボリュームにデータが格納された時刻、又は、そのデータを含んだジャーナルが前記正ジャーナル記憶領域に格納された時刻であり、終了時刻は、そのジャーナルが前記副ジャーナル記憶領域に格納された時刻、又は、そのジャーナル内のデータが前記副ボリュームに格納された時刻であり、
     前記管理情報を基に、時刻の経過に伴う遅延時間長の変動を表す遅延時間長グラフと、時刻の経過に伴う平均書込量の変動を表す平均書込量グラフとを比較可能な態様で表示し、平均書込量は、書込要求1つ当たりに前記正ボリュームに書き込まれたデータの量である、
    ことを計算機に実行させるコンピュータプログラム。
  11.  前記遅延時間長グラフと前記平均書込量グラフとが同一グラフ画面に表示され、
     前記グラフ画面において、第1の軸が、時刻に対応し、
     前記グラフ画面において、前記第1の軸と直交する一方の軸である第2の軸が、遅延時間長に対応し、
     前記グラフ画面において、前記第1の軸と直交する他方の軸である第3の軸が、平均書込量に対応する、
    請求項10記載のコンピュータプログラム。
  12.  前記複数の時刻にそれぞれ対応した複数のメトリック値は、前記複数の時刻にそれぞれ対応した複数の書込回数と、前記複数の時刻にそれぞれ対応した複数の書込量であり、
     書込回数は、単位時間当たりの書込要求の数であり、
     書込量は、単位時間当たりに書き込まれたデータの量であり、
     前記複数の時刻の各々について、書込量を書込回数で割ることで平均書込量を算出する、
    ことを計算機に実行させる請求項10記載のコンピュータプログラム。
  13.  前記正ストレージシステムが、複数の正ボリュームを有し、
     前記副ストレージシステムが、前記複数の正ボリュームに対応する複数の副ボリュームを有し、
     前記管理情報は、前記複数の正ボリュームの各々について、前記複数の時刻にそれぞれ対応した複数のメトリック値を含みし、
     遅延時間長変動との関係が所定の条件を満たすメトリック値変動に対応した正ボリュームを識別し、
     前記複数の正ボリュームのうち、識別された正ボリュームについてのみ、前記遅延時間長グラフと比較可能な態様でメトリック値グラフを表示する、
    ことを計算機に実行させる請求項10記載のコンピュータプログラム。
  14.  遅延時間長変動との関係が所定の条件を満たすメトリック値変動に対応した正ボリュームを、正ボリューム検索範囲から識別することを計算機に実行させ、
     前記リモートコピーシステムは、1以上のジャーナルグループを有し、
     各ジャーナルグループが、1以上の正ボリュームと、1以上の正ジャーナル記憶領域と、1以上の副ジャーナル記憶領域と、1以上の副ボリュームとを有し、
     前記正ボリューム検索範囲は、遅延悪化ジャーナルグループに属する全ての正ボリュームであり、
     前記遅延悪化ジャーナルグループは、遅延時間長が遅延閾値を超えたジャーナルグループである、
    請求項13記載のコンピュータプログラム。
  15.  非同期リモートコピーを行うリモートコピーシステムを含んだ計算機システムの管理方法であって、
      前記リモートコピーシステムは、正ストレージシステムと、前記正ストレージシステムに接続された副ストレージシステムとを有し、
      前記正ストレージシステムは、データが書き込まれる正ボリュームと、前記正ボリュームに書き込まれるデータを含んだジャーナルが書き込まれる正ジャーナル記憶領域とを有し、前記正ジャーナル記憶領域に書き込まれたジャーナルを前記副ストレージシステムに転送し、
      前記副ストレージシステムは、前記正ストレージシステムからのジャーナルが書き込まれる副ジャーナル記憶領域と、前記副ジャーナル記憶領域に蓄積されているジャーナル内のデータが書き込まれる副ボリュームとを有し、
      前記計算機システムは、前記正ボリュームを指定した書込要求を送信するホスト計算機を更に含み、
     前記管理方法は、
     複数の時刻にそれぞれ対応した複数の遅延時間長と、前記正ボリュームについて前記複数の時刻にそれぞれ対応した複数のメトリック値とを含んだ管理情報を参照し、各遅延時間長について、開始時刻は、前記正ボリュームにデータが格納された時刻、又は、そのデータを含んだジャーナルが前記正ジャーナル記憶領域に格納された時刻であり、終了時刻は、そのジャーナルが前記副ジャーナル記憶領域に格納された時刻、又は、そのジャーナル内のデータが前記副ボリュームに格納された時刻であり、
     前記管理情報を基に、時刻の経過に伴う遅延時間長の変動を表す遅延時間長グラフと、時刻の経過に伴う平均書込量の変動を表す平均書込量グラフとを比較可能な態様で表示し、平均書込量は、書込要求1つ当たりに前記正ボリュームに書き込まれたデータの量である、
    管理方法。

     
PCT/JP2014/059851 2014-04-03 2014-04-03 非同期リモートコピーを行うリモートコピーシステムを含んだ計算機システムの管理システム及び管理方法 WO2015151258A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
PCT/JP2014/059851 WO2015151258A1 (ja) 2014-04-03 2014-04-03 非同期リモートコピーを行うリモートコピーシステムを含んだ計算機システムの管理システム及び管理方法
US14/395,153 US9513839B2 (en) 2014-04-03 2014-04-03 Management system and management method for computer system comprising remote copy system for performing asynchronous remote copy

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2014/059851 WO2015151258A1 (ja) 2014-04-03 2014-04-03 非同期リモートコピーを行うリモートコピーシステムを含んだ計算機システムの管理システム及び管理方法

Publications (1)

Publication Number Publication Date
WO2015151258A1 true WO2015151258A1 (ja) 2015-10-08

Family

ID=54239621

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2014/059851 WO2015151258A1 (ja) 2014-04-03 2014-04-03 非同期リモートコピーを行うリモートコピーシステムを含んだ計算機システムの管理システム及び管理方法

Country Status (2)

Country Link
US (1) US9513839B2 (ja)
WO (1) WO2015151258A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017182445A (ja) * 2016-03-30 2017-10-05 日本電気株式会社 情報処理装置、情報処理システム、情報処理方法および情報処理プログラム

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6005116B2 (ja) 2014-09-30 2016-10-12 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 特定のアプリケーションによってリコールされたファイルの自動化されたマイグレーション
US10007695B1 (en) * 2017-05-22 2018-06-26 Dropbox, Inc. Replication lag-constrained deletion of data in a large-scale distributed data storage system

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006079488A (ja) * 2004-09-13 2006-03-23 Mitsubishi Electric Corp データ収集装置、データ収集システム及びデータ収集方法
JP2007128293A (ja) * 2005-11-04 2007-05-24 Hitachi Ltd 計算機システム及び管理計算機
JP2010205159A (ja) * 2009-03-05 2010-09-16 Hitachi Ltd 情報処理装置、及びストレージシステムから取得した構成情報の管理方法
JP2012226703A (ja) * 2011-04-22 2012-11-15 Hitachi Solutions Ltd 仮想環境管理システム

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050060574A1 (en) * 2003-09-13 2005-03-17 Finisar Corporation Network analysis graphical user interface
JP2005258850A (ja) * 2004-03-12 2005-09-22 Hitachi Ltd 計算機システム
US20060277384A1 (en) * 2005-06-01 2006-12-07 Hitachi, Ltd. Method and apparatus for auditing remote copy systems
JP2008250695A (ja) * 2007-03-30 2008-10-16 Nec Corp ディスクアレイコントローラ及びこれを備えたディスクアレイシステム
US20090171731A1 (en) * 2007-12-28 2009-07-02 International Business Machines Corporation Use of graphs in managing computing environments
JP4717923B2 (ja) 2008-12-17 2011-07-06 株式会社日立製作所 ストレージシステム、データ復旧可能時刻の推定値の算出方法、および、管理計算機
JP2011034164A (ja) * 2009-07-30 2011-02-17 Hitachi Ltd リモートコピーシステム及びリモートコピー制御方法
US8842119B2 (en) * 2010-11-17 2014-09-23 Hewlett-Packard Development Company, L.P. Displaying system performance information
US8838920B2 (en) * 2010-11-17 2014-09-16 International Business Machines Corporation Determining whether to extend a drain time to copy data blocks from a first storage to a second storage
US9218676B2 (en) * 2011-07-11 2015-12-22 International Business Machines Corporation Displaying computer dashboard information
US9202304B1 (en) * 2012-09-28 2015-12-01 Emc Corporation Path performance mini-charts
US9886451B2 (en) * 2013-04-30 2018-02-06 Hitachi, Ltd. Computer system and method to assist analysis of asynchronous remote replication
US9646276B2 (en) * 2013-08-23 2017-05-09 AppDynamics, Inc. Dashboard for dynamic display of distributed transaction data

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006079488A (ja) * 2004-09-13 2006-03-23 Mitsubishi Electric Corp データ収集装置、データ収集システム及びデータ収集方法
JP2007128293A (ja) * 2005-11-04 2007-05-24 Hitachi Ltd 計算機システム及び管理計算機
JP2010205159A (ja) * 2009-03-05 2010-09-16 Hitachi Ltd 情報処理装置、及びストレージシステムから取得した構成情報の管理方法
JP2012226703A (ja) * 2011-04-22 2012-11-15 Hitachi Solutions Ltd 仮想環境管理システム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"Hitachi Virtual Storage Platform Performance Guide", HITACHI DATA SYSTEMS, 2013, pages 2 - 1 - 2-6, B-41, B-42, XP055228917, [retrieved on 20140530] *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017182445A (ja) * 2016-03-30 2017-10-05 日本電気株式会社 情報処理装置、情報処理システム、情報処理方法および情報処理プログラム

Also Published As

Publication number Publication date
US9513839B2 (en) 2016-12-06
US20160259558A1 (en) 2016-09-08

Similar Documents

Publication Publication Date Title
JP5748932B2 (ja) 計算機システム及び非同期リモートレプリケーションの分析を支援する方法
US7047360B2 (en) Method and apparatus for adjusting performance of logical volume copy destination
US9298633B1 (en) Adaptive prefecth for predicted write requests
JP4744171B2 (ja) 計算機システム及び記憶制御方法
US8250327B2 (en) Storage apparatus and its control method
US11792263B2 (en) Methods and systems for managing a resource in a networked storage environment
US7328326B2 (en) Storage device
US7840771B2 (en) Method and a computer for storage area management
US10678434B2 (en) Storage system and storage control method for improving a deduplication process
US8234470B2 (en) Data repository selection within a storage environment
JP2009110346A (ja) 性能履歴の管理方法および性能履歴の管理システム
WO2013128550A1 (ja) 監視システム及び監視プログラム
WO2014013603A1 (ja) 監視システム及び監視プログラム
WO2011048640A1 (en) Information system adapted to calculate its required data storage capacity
US8122151B2 (en) Storage system for optimally controlling a plurality of data transfer paths and method therefor
JP4514578B2 (ja) データの移行先を選択する方法及び装置
WO2016103471A1 (ja) 計算機システムおよび管理プログラム
US7886186B2 (en) Storage system and management method for the same
WO2015151258A1 (ja) 非同期リモートコピーを行うリモートコピーシステムを含んだ計算機システムの管理システム及び管理方法
JP5167410B2 (ja) 複数のマイクロプロセッサを有するストレージシステム、及び、そのストレージシステムにおける処理分担方法
JP2012108906A (ja) 第1のストレージから第2のストレージへとデータ・ブロックをコピーするためにドレイン時間を延長するか否かを決定するためのコンピュータ・プログラム、システム、および方法(第1のストレージから第2のストレージへとデータ・ブロックをコピーするためにドレイン時間を延長するか否かの決定)
WO2013171865A1 (ja) 管理方法及び管理システム
WO2014068705A1 (ja) 監視システム及び監視プログラム
US8788667B2 (en) Computer system and management method
JP2009199453A (ja) クライアントが適正か不適正かを判定する方法及び記憶制御装置

Legal Events

Date Code Title Description
WWE Wipo information: entry into national phase

Ref document number: 14395153

Country of ref document: US

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 14888068

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 14888068

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: JP