WO2017077583A1 - Information system including storage system, and performance deterioration prediction method for storage system - Google Patents

Information system including storage system, and performance deterioration prediction method for storage system Download PDF

Info

Publication number
WO2017077583A1
WO2017077583A1 PCT/JP2015/080967 JP2015080967W WO2017077583A1 WO 2017077583 A1 WO2017077583 A1 WO 2017077583A1 JP 2015080967 W JP2015080967 W JP 2015080967W WO 2017077583 A1 WO2017077583 A1 WO 2017077583A1
Authority
WO
WIPO (PCT)
Prior art keywords
performance
storage device
value
performance value
delay time
Prior art date
Application number
PCT/JP2015/080967
Other languages
French (fr)
Japanese (ja)
Inventor
拓海 松浪
淳平 清時
Original Assignee
株式会社日立製作所
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社日立製作所 filed Critical 株式会社日立製作所
Priority to PCT/JP2015/080967 priority Critical patent/WO2017077583A1/en
Publication of WO2017077583A1 publication Critical patent/WO2017077583A1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers

Definitions

  • the present invention relates to an information system including a storage system and a performance deterioration prediction method in the storage system, and in particular, information including a storage system that uses a performance deterioration prediction technique for data transfer delay time between a primary storage device and a secondary storage device. It is suitable for application to a system.
  • the present invention has been made in consideration of the above points, and when a specific performance value exceeds a threshold value in the future, even when the tendency of performance deterioration suddenly changes, the time when the predetermined specification is not satisfied is further increased. It is an object of the present invention to propose an information system including a storage system and a performance degradation prediction method in the storage system that can be accurately predicted.
  • a predetermined value is determined between the primary storage device and the secondary storage device.
  • a measurement unit that acquires the measured performance value
  • an analysis unit that analyzes the measured performance value and acquires a performance deterioration tendency of the performance value between the primary storage device and the secondary storage device, and the primary storage
  • An information storage unit that holds a past performance deterioration tendency related to a performance value between a device and the secondary storage device, a performance value of the primary storage device, a performance value of the secondary storage device, the primary storage device and the Secondary stress
  • the primary storage device and the A predicting unit for deriving a future performance value with the secondary storage apparatus.
  • a measurement unit is predetermined between the primary storage device and the secondary storage device.
  • a measurement step of acquiring a performance value, an analysis step of analyzing the measured performance value, and an analysis step of acquiring a performance deterioration tendency of the performance value between the primary storage device and the secondary storage device, information An information storage step in which a storage unit holds a past performance deterioration tendency related to a performance value between the primary storage device and the secondary storage device, and a prediction unit performs a performance value of the primary storage device and a performance value of the secondary storage device.
  • the primary In consideration of a trend coefficient for obtaining a performance value between the storage device and the secondary storage device, and a performance deterioration tendency with respect to the acquired performance value between the primary storage device and the secondary storage device, And a prediction step of deriving a future performance value between the primary storage device and the secondary storage device.
  • the present invention it is possible to more accurately predict the time when the predetermined specification is not satisfied even when the performance deterioration tendency suddenly changes when a specific performance value exceeds a threshold value in the future.
  • FIG. 1 shows a schematic configuration of an information system including a storage system 1 according to this embodiment.
  • the storage system 1 is connected to the performance data management server 400 and the storage system management server 500 via the network 2.
  • the storage system 1 includes a plurality of storage devices that provide storage areas for storing data.
  • the storage system 1 includes a primary storage device 200 and a secondary storage device 300 as such storage devices, and stores data from the application host 100.
  • the application host 100 is a computer such as a desktop or notebook computer, workstation or mainframe.
  • the application host 100 includes a CPU (Central Processing Unit), a memory, a cache, a hard disk drive, an interface, and various interface cards (not shown).
  • the application host 100 implements various functions by the built-in processor executing various programs on the memory.
  • An example of these various programs is a host application.
  • the application host 100 mainly accesses data stored in the primary storage device 200 and executes data processing. The data corresponds to the replication source data.
  • the application host 100 issues a write command to the primary storage device 200 to store the data in the primary storage device 200, while copying the data to a secondary storage device that is another storage device. It is stored in the storage device 300.
  • the storage system can continue processing using data copied to the secondary storage apparatus 300.
  • a storage device that stores data to be replicated (hereinafter referred to as “replication source data”) and a storage that stores data obtained by replicating the replication source data (hereinafter referred to as “replication data”).
  • replication source data data to be replicated
  • replication data data obtained by replicating the replication source data
  • the side storing the copy source data is called “primary”
  • the side storing the copy data is called “secondary”.
  • the storage device that stores the replication source data is referred to as a “primary storage device” and the storage device that stores the replication data is referred to as a “secondary storage device”, depending on whether it is primary or secondary. It shall be called.
  • the volume on the primary storage device side is referred to as a primary volume (corresponding to “P-VOL” in the figure) ”, and the volume in the secondary storage apparatus is referred to as a secondary volume (indicated by“ S-VOL ”in the figure). Equivalent)).
  • the storage apparatuses 200 and 300 are connected by a network or a dedicated line, and communication is performed using a predetermined communication protocol.
  • the secondary storage apparatus 300 stores the replicated data of the data already stored in the primary storage apparatus 200 by synchronous data replication processing described later.
  • the secondary storage apparatus 300 stores differential data based on data already stored in the secondary storage apparatus 300 by asynchronous data replication processing described later.
  • the primary storage apparatus 200 has a function of creating a journal related to the update contents when the copy source data is updated, storing it in the primary journal volume, and replicating the data based on the journal data.
  • the secondary storage device 300 has a function of creating a journal related to the update contents and storing the journal data in the secondary journal volume, almost the same as the primary storage device 200.
  • the primary storage device 200 transfers necessary journal data between both storage devices in the asynchronous data replication processing described later, and updates the replicated data stored in the secondary storage device 300 with the journal data. It has a function to match data with the original data.
  • synchronous data replication As a method (mode) of data replication between the primary storage apparatuses 200, there are synchronous data replication and asynchronous data replication.
  • two types of data replication that is, synchronous data replication and asynchronous data replication, are performed between the two storage apparatuses 200 and 300, whereby two replication data are held for one replication source data.
  • Synchronous data replication is a process of updating replication data in synchronization with the update of the replication source data, and the replication data matches the replication source data.
  • asynchronous data replication is a process of updating the replication data based on the journal asynchronously with the update of the replication source data, and the replication data matches after the update of the replication source data.
  • the storage area of the storage apparatus is logically divided and managed, and the divided storage area is called a logical volume (hereinafter also simply referred to as “volume”).
  • a management unit called a group is provided in order to manage the update order of data within and between the logical volumes. This group corresponds to the copy groups A, B, C,.
  • the primary storage apparatus 200 includes a master disk controller (hereinafter referred to as “host adapter), DKA (disk adapter), CACHE (cache memory), SM (shared memory), and SWITCH (switch). (Also abbreviated as “M-DKC”) and an HDD (hard disk drive).
  • the host adapter, disk adapter, cache memory, and shared memory are connected via a switch.
  • a plurality of hard disk drives are provided, constituting a so-called RAID (Redundant Array of Inexpensive Disks).
  • the primary storage device 200 includes a host adapter and a disk adapter as control units for controlling various processes in addition to command reception processing and the like, and executes programs corresponding to the respective processes by the processors 200b and 200e incorporated therein.
  • the host adapter 110 has a communication interface for communicating with the application host 100 and a function for exchanging input / output commands, and controls data transfer between the application host 100 and the cache memory.
  • the host adapter is connected to the application host 100 and the secondary storage device 300.
  • the disk adapter 120 controls reading and writing of data with respect to the hard disk drive, and controls data transfer between the cache memory and the hard disk drive.
  • the cache memory is a type of memory that temporarily stores mainly data received from the application host 100 or data read from the hard disk drive.
  • the shared memory is a memory that is shared and used by all the host adapters and disk adapters in the primary storage apparatus 200, and mainly stores control information and the like.
  • the primary storage apparatus 200 includes a processor 200b as shown in the figure, and this processor 200b uses a cache 200c by so-called CLPR (Cache Logical Partition), while copying a primary volume 200a (corresponding to “P-VOL” in the figure) Manage groups. Further, the primary storage apparatus 200 includes a processor 200e as shown in the figure, and this processor 200e uses the cache 200f by the CLPR (Cache Logical Partition) and uses master journal data 200d (described in “M-JNL” shown in the figure). Equivalent).
  • the secondary storage apparatus 300 although not shown in detail, has a restore disk controller (CHA (host adapter), DKA (disk adapter) and CACHE (cache memory), SM (shared memory) and SWITCH (switch). (Hereinafter also abbreviated as “R-DKC”) and HDD (hard disk drive).
  • the secondary storage apparatus 300 has basically the same configuration as the primary storage apparatus 200 as described above, and includes a processor 300b.
  • the processor 300b manages a secondary volume 300a (corresponding to “S-VOL” in the figure) and a copy group while using the cache 300c by the CLPR (Cache Logical Partition).
  • the secondary storage apparatus 300 manages restore journal data 300d (corresponding to “R-JNL” in the figure), which will be described later, using the cache 300f using the CLPR (Cache Logical Partition).
  • the journal is data created as information related to data update when the replication source data (primary volume) held by the primary storage device 200 is updated.
  • the journal includes write data and update information.
  • the write data is a copy of data used at the time of data update processing of the primary volume from the application host 100.
  • the data is write data for the update position.
  • the update information is information for managing write data and journal for each update, and the time (update time) as the time stamp when the write command is received, the management number, the logical address of the write command, and the data of the write data Includes size etc.
  • the update information includes, as a data update identifier, at least one of a time (update time) as a time stamp when the write command is received and a management number.
  • the update order identifies the data update order.
  • the storage system management server 500 includes a delay time analysis program 500b and a collection database 500c as an example of an analysis unit.
  • the storage & copy pair management program 500a manages copy pairs between the primary storage apparatus 200 and the secondary storage apparatus 300.
  • the storage & copy pair management program 500a issues a command necessary for instructing the primary storage apparatus 200 to write or read data.
  • the storage & copy pair management program 500a is application software that acquires and manages each state of the primary storage apparatus 200 and the secondary storage apparatus 300.
  • the storage & copy pair management program 500a manages each state according to the execution of the synchronous data replication process described above, and detects the pair state between the primary storage apparatus 200 and the secondary storage apparatus 300.
  • the combination of the states of the two storage devices set in synchronization in the synchronous data replication process is called a “copy pair”.
  • the statuses of the primary storage apparatus 200 and the secondary storage apparatus 300 are changed synchronously, and hence are called “copy pairs”.
  • Examples of the pair state include a duplex state, a suspend state, a copy and pair state, and a writable suspend state (corresponding to a Susp (R) state described later).
  • the duplex state indicates that the data stored in the volumes of both storage devices match.
  • the suspended state indicates a state where data cannot be written or read.
  • the Copy state indicates that data is to be copied, and the Pair state indicates that the same copy data is written to both disks.
  • the writable suspend state is basically a suspend state, but indicates a state where data can be written.
  • the delay time analysis program 500b is an example of a prediction unit, and will be described in detail later.
  • the performance value of the primary storage device 200, the performance value of the secondary storage device 300, and the performance between the primary storage device 200 and the secondary storage device 300 will be described later.
  • the future performance value between the primary storage device 200 and the secondary storage device 300 in consideration of the value and the tendency factor for obtaining the performance deterioration tendency with respect to the performance value between the primary storage device 200 and the secondary storage device 300 To derive.
  • the delay time analysis program 500b analyzes the measured performance value data and acquires the performance deterioration tendency of the performance value between the primary and secondary storage apparatuses.
  • the performance deterioration prediction method by the delay time analysis program 500b will be described with reference to FIG.
  • a delay time related to data transfer between the primary storage apparatus 200 and the secondary storage apparatus 300 is mainly cited.
  • the IO control unit issues an IO command to the primary volume.
  • the primary storage apparatus 200 transfers the write data stored in the primary volume 200a by the command in synchronization with the secondary storage apparatus 300, while the secondary storage apparatus 300 copies the transferred write data to the secondary volume 300a. .
  • the primary storage device 200 When the replication source data stored in the primary volume 200a is updated, the primary storage device 200 creates journal data 200d (corresponding to the illustrated M-JNL) related to the update contents, stores it in the journal volume, and stores the journal data in the journal volume. The data is originally copied.
  • the secondary storage apparatus 300 creates journal data 300d (corresponding to R-JNL in the figure) related to the update contents and stores it in the journal volume, almost like the primary storage apparatus 200.
  • the primary storage apparatus 200 performs data transfer of necessary journal data between these storage apparatuses in asynchronous data replication processing to be described later, and updates the replicated data stored in the secondary storage apparatus 300 with the journal data. It has a function of matching the duplicated data with the original data. Note that the delay time to be targeted later in this embodiment is, for example, a delay time when journal data is transferred between these storage apparatuses.
  • the performance data management server 400 includes a performance monitoring program 400a and a performance database 400b.
  • the performance monitoring program 400a corresponds to an example of a measurement unit, sequentially collects performance values of a predetermined type between the primary storage device 200 and the secondary storage device 300, and a collection database 500c as an example of an information storage unit
  • the data (hereinafter also referred to as “storage performance metric”) is stored.
  • the predetermined (type) performance value between the primary storage apparatus 200 and the secondary storage apparatus 300 is the data transfer delay time between the primary storage apparatus 200 and the secondary storage apparatus 300. Can be illustrated.
  • the performance monitoring program 400a collects performance values (storage performance metrics) having the following names, for example, and stores them in the collection database 500c of the storage system management server 500.
  • R-JNL Usage Rate Performance value 16 R-JNL Processor Busy Rate Performance value 17.
  • R-JNL Cache Write Pending Rate Performance value 18 R-JNL Cache Logical Partition Memory Usage Rate Performance value 19.
  • R-JNL Write Transfer Rate Performance value 20 R-JNL Write I / O Performance value 21.
  • R-JNL Parity Group Write Transfer Rate Performance value 22 R-JNL Parity Group Write I / O Performance value 23.
  • S-VOL Processor Busy Rate Performance value 25 S-VOL Cache Write Pending Rate Performance value 26.
  • S-VOL Cache Logical Partition Memory Usage Rate Performance value 27 S-VOL Write Transfer Rate Performance value 28.
  • Array Port Transfer Rate Performance value 32 32.
  • performance values that have an influence on the delay time are selected in advance from among a large number of storage performance metric (performance value) groups.
  • the underlined performance values correspond to this. That is, it can be said that the following storage performance metrics selected in advance are likely to affect the delay time.
  • Performance value 25 S-VOL Cache Write Pending Rate Performance value 24. S-VOL Processor Busy Rate Performance value 16. R-JNL Processor Busy Rate Performance value 17. R-JNL Cache Write Pending Rate Performance value8. M-JNL Processor Busy Rate Performance value 31. Array Port Transfer Rate
  • the performance value “Cache Write Pending Rate” represents the cache write wait rate, and the higher the value, the higher the possibility that a storage delay of the value to be stored in the volume has occurred.
  • “S-VOL Cache Write Pending Rate” represents the write wait rate of the cache 300c
  • “R-JNL Cache Write Pending Rate” represents the write wait rate of the cache 300f. Care should be taken when the performance value is 40% to 80%.
  • such a range of values that require attention is also referred to as a “caution value range”.
  • Threshold values allowed for performance are set in advance for each performance value described above.
  • the performance database 400b described above stores information (hereinafter also referred to as “limit value information”) relating to a preset threshold value (hereinafter also referred to as “limit value”) that should be allowed for performance for each performance value.
  • limit value information information on a preset attention value range (hereinafter also referred to as “attention value range information”) is stored.
  • C / T Delta represents an index related to a delay time in data transfer between storage apparatuses.
  • S-VOL Cache Write Pending Rate performance value 25
  • the contribution ratio is large
  • the influence of the Array Port Transfer Rate performance value 31
  • the metric contribution is small.
  • the performance value “Processor Busy Rate” represents the usage rate of the processor, and the higher the value, the higher the possibility that processing delay such as I / O for the volume is occurring.
  • the performance value “S-VOL Processor Busy Rate” represents the usage rate of the processor 300b, while the performance value “R-JNL Processor Busy Rate” represents the usage rate of the processor 300e. For example, when the performance value is 30% to 60%, attention is required (corresponding to the attention value range).
  • the S-VOL Cache Write Pending Rate (performance value 25) has the largest influence (metric) among the six selected performance values described above. The contribution ratio is large), and the influence of the Array Port Transfer Rate (performance value 31) is the smallest (the metric contribution is small).
  • the performance value 31 “Array Port Transfer Rate” represents the data transfer amount of the remote path between the primary storage device 200 and the secondary storage device 300, and is close to the line bandwidth set by the user. This indicates that there is a high possibility that the line is tight.
  • the S-VOL Cache Write Pending Rate (performance value 25) has the largest influence (metric) among the six selected performance values described above. The contribution ratio is large), and the influence of the Array Port Transfer Rate (performance value 31) is the smallest (the metric contribution is small).
  • FIGS. 2 to 5 show an example of a procedure for predicting the future value of the delay time.
  • CWPR means “Cache Write Pending Rate”
  • PBR means “Processor Busy Rate”
  • APTR means “Array Port Transfer Rate”.
  • step S1 an actual measurement value period, an allowable delay time, and a communication bandwidth used for analysis are input and set in advance.
  • step S2 the delay time analysis program 500b linearly approximates the delay time up to time t and calculates the slope a of the line.
  • step S3 the delay time analysis program 500b determines whether the slope a of the straight line is 1 or less, and if the slope a of the straight line is 1 or less, there is no tendency for performance degradation. While outputting to the outside (step S4), the delay time analysis program 500b executes performance value prediction processing when the slope a of the straight line is not 1 or less (step S5).
  • step S51 performance values from time t0 to time t are input to a statistical model such as the ARMA model.
  • time t0 represents a time after the start time of the analysis period designated in advance and at which the oldest performance value exists.
  • step S52 the delay time analysis program 500b stores the predicted value of the performance value at time t + 1 in the collection database 500c.
  • step S6 the delay time analysis program 500b determines whether or not the CWPR of the secondary volume 300a (S-VOL) at time t is 40% or more, and the CWPR of the secondary volume 300a is 40% or more. In this case, an upward correction coefficient adding process described later is executed (step S7).
  • step S71 shown in FIG. 4 the delay time analysis program 500b determines whether or not the variable C needs to be initialized. Note that the case where the initialization of the variable C is necessary assumes a case where the first one of the metrics that require the upward correction coefficient c to be considered at the time t is considered.
  • step S71 When it is determined in step S71 that the variable C needs to be initialized, the delay time analysis program 500b initializes the variable C (step S72). Thereafter, or on the other hand, if it is determined in step S71 that the initialization of the variable C is not necessary, step S73 is executed next.
  • the delay time analysis program 500b applies the function f1 for calculating the upward correction coefficient c (hereinafter also referred to as “correction coefficient conversion”) for the attention value range of the storage performance metric (hereinafter also referred to as “metric”).
  • the upward correction coefficient c as an example of the tendency coefficient is obtained.
  • the function f1 which will be described in detail later, has a function of setting a lower limit and an upper limit threshold for each metric and mapping the values between them to a coefficient.
  • step S74 the delay time analysis program 500b adds the metric contribution to the upward correction coefficient c and applies the function f2 to the acquired upward correction coefficient c to acquire the upward correction coefficient c '.
  • step S8 is executed.
  • step S8 the delay time analysis program 500b determines whether or not the PBR of the S-VOL 300a at time t is 30% or more. If the PBR of the S-VOL 300a is 30% or more, it is described above.
  • the upward correction coefficient adding process is executed (step S7).
  • step S8 determines in step S8 that the PBR of the S-VOL 300a is not 30% or more.
  • step S9 the delay time analysis program 500b determines whether or not the CWPR of the R-JNL 300d at time t is 40% or more. If the CWPR is 40% or more, the above-described upward correction coefficient is determined. A seasoning process is executed (step S7).
  • step S10 determines in step S9 that the CWPR of the R-JNL 300d is not 40% or more.
  • step S10 the delay time analysis program 500b determines whether or not the PBR of the R-JNL 300d at time t is 30% or more. If the PBR of the R-JNL 300d is 30% or more, it is described above.
  • the upward correction coefficient adding process is executed (step S7). On the other hand, when the delay time analysis program 500b determines in step S10 that the PBR of the R-JNL 300d is not 30% or more, the following step S11 is executed.
  • step S11 the delay time analysis program 500b determines whether or not the PBR of the M-JNL 200d at time t is 40% or more. If the PBR is 40% or more, the above-described upward correction coefficient is determined. A seasoning process is executed (step S7). On the other hand, when the delay time analysis program 500b determines in step S11 that the PBR is not 40% or more, the following step S11 is executed.
  • step S12 the delay time analysis program 500b determines whether or not the APTR at time t is 90% or more. If the APTR is 90% or more, the above-described upward correction coefficient addition process is executed. (Step S7). On the other hand, when the delay time analysis program 500b determines in step S12 that the APTR is not 90% or more, the following step S13 is executed.
  • the delay time analysis program 500b executes a delay time prediction process.
  • the upward correction coefficient c is calculated, and the delay time at time t + 1 is predicted from the delay time at time t.
  • the delay time analysis program 500b inputs a delay time from time t0 to time t to a statistical model such as the ARMA model (step S131).
  • the delay time analysis program 500b stores the delay time at time t + 1 predicted by the statistical model in the variable d.
  • step S133 the delay time analysis program 500b determines whether or not the delay time at time t is equal to or less than d. When it is determined that the delay time at time t is equal to or less than d, the delay time analysis program 500b sets the predicted value of the delay time at time t + 1 to d (step S134), while the delay time at time t is d. If it is not determined to be less than or equal to, the function f for applying the upward correction coefficient c to the predicted value of the delay time is applied to the predicted value d to obtain the predicted value d ′ (step S135).
  • the predicted value d ′ is calculated from (delay time) ⁇ C.
  • the delay time analysis program 500b sets the predicted value of the delay time at time t + 1 to d '.
  • the delay time analysis program 500b outputs a future prediction value of the delay time and the performance value.
  • Performance value 25 S-VOL Cache Write Pending Rate Performance value 24. S-VOL Processor Busy Rate Performance value 16. R-JNL Processor Busy Rate Performance value 17. R-JNL Cache Write Pending Rate Performance value8. M-JNL Processor Busy Rate Performance value 31. Array Port Transfer Rate
  • the metric contribution of S-VOL CWPR is set to 25%, while the metric contribution of PBR of S-VOL is set to 20%.
  • the R-DKC (restore disk controller) issues a Pull Request as an example of a command for requesting transfer of the next journal from the R-DKC to the M-DKC.
  • This Pull Request by R-DKC is not issued until the data reflection to the secondary volume 300a (hereinafter also referred to as “S-VOL”) is completed (however, the multiplicity is ensured). Therefore, if the data reflection to the S-VOL 300a is delayed, the issue of the next Pull Request is delayed, so the values of CWPR and PBR of the S-VOL 300a become important. Furthermore, the amount of data cached in the S-VOL CLPR has a large effect on C / T Delta. Accordingly, the influence of the PBR that processes the CLPR data of the S-VOL 300a is the second largest.
  • the CWPR metric contribution of the S-VOL 300a is set to 25%
  • the PBR metric contribution of the S-VOL 300a is set to 20%
  • the CWPR metric contribution of the R-JNL 300b is 18%. %
  • the PBR metric contribution of R-JNL300b is set to 15%.
  • journal data in the journal volume
  • the impact level is small compared to the S-VOL upgrade, and the impact level of PBR is also small.
  • the CWPR metric contribution of the S-VOL 300a is set to 25%
  • the PBR metric contribution of the S-VOL 300a is set to 20%
  • the CWPR metric contribution of the R-JNL 300b is 18%. %
  • the PBR metric contribution of the R-JNL 300b is set to 15%
  • the PBR metric contribution of the M-JNL 200d is set to 12%.
  • the CWPR metric contribution of the S-VOL 300a is set to 25%
  • the PBR metric contribution of the S-VOL 300a is set to 20%
  • the CWPR metric contribution of the R-JNL 300b is 18%. %
  • the R-JNL300b PBR metric contribution is set to 15%
  • the M-JNL200d PBR metric contribution is set to 12%
  • the APTR metric contribution is set to 10% .
  • the remote path between storage system enclosures is difficult to predict because the performance and characteristics vary greatly depending on the environment.
  • the degree of influence of APTR on C / T Delta should be minimal (however, the degree of influence is considerable in a tight line situation).
  • the metric contribution of each performance value is determined, and the CWPR metric contribution of the S-VOL 300a is set to 25% as described, and the metric contribution of the PBR of the S-VOL 300a is set.
  • the CWPR metric contribution of the R-JNL300b is set to 18%
  • the PBR metric contribution of the R-JNL300b is set to 15%
  • the PBR metric contribution of the M-JNL200d is The metric contribution of APTR is set to 10%.
  • each numerical value of the metric contribution is set for convenience as an example for use in a conversion formula that reflects the contribution in the delay time, and does not necessarily have to be this numerical value.
  • the priority order is in the order of CWPR of S-VOL 300a, PBR of S-VOL 300a, CWPR of R-JNL 300b, PBR of R-JNL 300b, and PBR of M-JNL 200d. That is, in the present embodiment, it is important that APTR has priority.
  • FIGS. 11A and 11B show an example of how to obtain the upper correction coefficient for each metric.
  • a value range corresponding to the “attention value range” in the description
  • FIG. 11A for example, “Processor Busy Rate” is illustrated as the type of performance value.
  • the attention value range is, for example, 30% to 60% associated with time t1 to time t2.
  • the slope becomes 0 from time t0 to time t1, and has a slope from time t1 to time t2, as shown in FIG. In FIG.
  • the attention value range is, for example, 40% to 80% associated with time t1 to time t2.
  • DelayTime (t + 1) OriginalDelayTime (t + 1) + (OriginalDelayTime (t + 1) ⁇ DelayTime (t)) ⁇ CorrectioFactor (t + 1) It is calculated using the following formula.
  • OriginalDelayTime represents the future value of the delay time predicted by a statistical method. Examples of such statistical methods include applying an ARMA model and adding a slope. However, this is applied only when OriginalDelayTime (t + 1)> DelayTime (t).
  • FIG. 12 to FIG. 23 show how the delay time related to data transfer between the primary storage apparatus 200 and the secondary storage apparatus 300 is predicted, respectively.
  • the horizontal axis represents time (date), while the vertical axis represents the delay time (corresponding to “Delay Time” in the figure), and the right side represents the ratio [%] of each performance value.
  • the delay time analysis program 500b finally tries to predict the delay time affected by each measurement value, regarding whether or not the delay time is scheduled to fall within an allowable range in the future.
  • Step I First, an analysis target period is determined, and it is determined that all data are to be processed.
  • the allowable delay time is set to 40 seconds, for example, and the communication bandwidth between the primary storage device 200 and the secondary storage device 300 is set to 10 MB / second.
  • the delay time analysis program 500b converts it into a ratio [%] to the communication bandwidth set at the time of analysis.
  • the data from January 1, 2015 to January 4, 2015 is as shown in FIG.
  • Step II (first time) The delay time analysis program 500b predicts the value of January 5, 2015 as shown by the broken line in the figure based on the values up to January 4, 2015 for each performance value shown in FIG. At this time, the delay time (Delay Time) is not predicted as illustrated.
  • Step III (first time) The delay time analysis program 500b determines whether or not to consider the upward correction coefficient c for each performance value. It should be noted that the processor busy rate of the S-VOL 300a needs to take into account the upward correction coefficient c, but does not take into account other performance values. As shown in FIG. 14, the delay time analysis program 500b predicts that the processor busy rate of the S-VOL 300a as of January 5, 2015 is 50%, and falls within the above-mentioned attention range of 30 to 60%. Judge that there is.
  • Step IV (first time)
  • the delay time analysis program 500b calculates the upward correction coefficient c as follows.
  • the delay time analysis program 500b applies the upward correction coefficient c for the predicted delay time.
  • Step V (first time)
  • the delay time analysis program 500b has not reached an unacceptable value for the delay time ("Delay Time” in the figure) as shown in FIG. 16, so the future value as of January 6, 2015. Is predicted (return to step II above).
  • Step II (second time) For each performance value, the delay time analysis program 500b predicts the value of January 6, 2015 based on the values up to January 5, 2015, as indicated by the broken line in FIG. That is, the delay time analysis program 500b predicts future values including predicted values.
  • Step III (second time) The delay time analysis program 500b determines whether or not to consider the upward correction coefficient c for each performance value.
  • the Cache Write Pending Rate of the S-VOL 300a and the Processor Busy Rate of the S-VOL 300a need to consider the upward correction coefficient c, but not other performance values.
  • the delay time analysis program 500b predicts that the PBR of the S-VOL 300a is 55% as of January 6, 2015, as shown in FIG. % To 60%. On the other hand, since the delay time analysis program 500b predicts 45% of the S-VOL CWPR as of January 6, 2015, it is in the range of 40% to 80% of the caution range already described.
  • Step IV (second time) Therefore, the delay time analysis program 500b calculates the upward correction coefficient c using the following calculation formula.
  • the delay time analysis program 500b predicts the delay time at time t + 1 using this calculation result. Further, the delay time analysis program 500b applies the upward correction coefficient c for the predicted delay time.
  • Step V (second time) Since the delay time analysis program 500b determines that the delay time (corresponding to “Delay Time” in the drawing) has not reached an unacceptable value, the future value of January 7, 2015 is predicted as shown in FIG. (Return to Step II above).
  • Step II (3rd)
  • the delay time analysis program 500b uses the method almost the same as the second time, and the performance value shown in FIG. 21 is based on the values until January 6, 2015 as shown in FIG. As indicated by the broken line, the value of January 7, 2015 is predicted.
  • Step IV (3rd) Based on this, the delay time analysis program 500b calculates the upward correction coefficient c.
  • the delay time analysis program 500b uses the calculated upward correction coefficient c to predict a delay time at time t + 1 (in the example shown, January 7, 2015) as shown by a broken line in FIG.
  • Step V (third time) Based on this, the delay time analysis program 500b ends because the delay time (corresponding to “Delay Time” in the figure) has reached an unacceptable value (45 seconds in the example in the figure).
  • the delay time analysis program 500b performs the performance value of the primary storage device 200 and the performance of the secondary storage device 300.
  • the delay time analysis program 500b when the performance value selected in advance is within the predetermined attention value range, the delay time analysis program 500b considers the upper correction coefficient c as a thing to be careful and considers a specific performance value (this embodiment). Then, “the above-mentioned delay time of data transfer” is calculated), and a predicted value that will change in the future is calculated.
  • the future predicted value can be obtained more accurately by correcting using the upward correction coefficient c, and the performance deterioration The time can be provided accurately.
  • the performance monitoring program 400a of the performance data management server 400 acquires a plurality of predetermined performance values between the primary storage apparatus 200 and the secondary storage apparatus 300 and stores them in the collection database 500c.
  • the delay time analysis program 500b of the storage system management server 500a refers to these stored performance values and preliminarily assumes that the specific performance value may be influenced from the plurality of types of performance values. A future deterioration tendency of the specific performance value is predicted based on the plurality of selected performance values.
  • the delay time analysis program 500b can predict the data transfer delay time as an example of the specific measurement value more accurately than in the past based on the plurality of performance values selected in advance. become able to.
  • the delay time analysis program 500b sets the metric contribution as an index representing the ease of influence on the specific performance value for each of the plurality of performance values selected in advance.
  • the future predicted value is obtained by multiplying the plurality of types of performance values by the corresponding metric contributions.
  • the calculated future predicted value is calculated after taking into account the characteristics for each of the plural types of performance values selected in advance, so that it can be obtained more accurately.
  • the performance monitoring program 400a is provided in the performance data management server 400 prepared separately from the storage system 1, while the delay time analysis program 500b is prepared separately from the storage system 1.
  • the storage system management server 500 is provided.
  • the performance monitoring program 400a and the delay time analysis program 500b calculate the data transfer time as the specific performance value at a necessary timing without being affected by the processing delay in the storage system 1. be able to.
  • the performance data management server 400 stores information on a plurality of types of performance values selected in advance from the above-described plurality of types of performance values, separately from the performance monitoring program 400a.
  • a performance database 400b is provided.
  • each performance value that tends to affect the specific performance value described above is managed in advance, and future prediction is made regarding the delay time of the data transfer time as the specific performance value as in this embodiment. It will be possible to do accurately.
  • the performance monitoring program 400a and the delay time analysis program 500b are provided in the performance data management server 400 and the storage system management server 500 that are prepared separately from the storage system 1, respectively.
  • the present invention is not limited to this, and the same function may be mounted inside the storage system 1.
  • SYMBOLS 1 ... Storage system, 2 ... Network, 100 ... Application host, 200 ... Primary storage apparatus, 300 ... Secondary storage apparatus, 400 ... Performance management server, 500 ... Storage system management server, 500b ... Delay Time analysis program, 500c ... Collection database.

Abstract

[Problem] To make it possible to accurately predict the point in time when a storage system will begin to fail to satisfy predetermined specifications, even if the storage system undergoes a sudden change in performance deterioration tendency in the future as a result of the value of a specific performance parameter exceeding a threshold value. [Solution] In the storage system according to the present invention, a prediction unit derives a future value of a performance parameter between a primary storage device and a secondary storage device, taking into account an acquired value of the performance parameter between the primary and secondary storage devices, and a tendency coefficient for determining the deterioration tendency of the performance parameter between the primary and secondary storage devices.

Description

ストレージシステムを含む情報システム及びストレージシステムにおける性能劣化予測方法Information system including storage system and performance degradation prediction method in storage system
 本発明は、ストレージシステムを含む情報システム及びストレージシステムにおける性能劣化予測方法に関し、特に、プライマリストレージ装置とセカンダリストレージ装置との間におけるデータ転送遅延時間の性能劣化予測技術を利用するストレージシステムを含む情報システムに適用して好適なものである。 The present invention relates to an information system including a storage system and a performance deterioration prediction method in the storage system, and in particular, information including a storage system that uses a performance deterioration prediction technique for data transfer delay time between a primary storage device and a secondary storage device. It is suitable for application to a system.
 従来より、計算機システムにおいてリソースの負荷などの影響により、徐々に性能劣化が進むことが知られている。このような将来的な性能劣化の傾向を分析する手法として、計算機システム及び非同期リモートレプリケーションの分析を支援する方法が存在している(特許文献1参照)。 Conventionally, it has been known that performance degradation gradually proceeds in a computer system due to the influence of resource load and the like. As a technique for analyzing such a tendency of performance degradation in the future, there is a method for supporting analysis of a computer system and asynchronous remote replication (see Patent Document 1).
 この従来の分析支援方法においては、過去から現在までの性能劣化傾向が今後将来的に継続するであろうとの見込みを基本として、今後将来的な性能劣化の予測を行い、将来の性能劣化が顕在化して当該計算機システムの使用者が希望する仕様を満たさなくなる予定の時期を予測している。 In this conventional analysis support method, based on the expectation that the performance deterioration trend from the past to the present will continue in the future, the future performance deterioration is predicted and the future performance deterioration is apparent. To predict the time when the computer system user will not meet the specifications desired by the computer system.
PCT/JP2013/062573PCT / JP2013 / 062573
 しかしながら、特定の性能値によっては、ある閾値を超えると急に性能劣化が進む場合があり、過去から現在までの性能劣化が必ずしも将来的に継続するとは限らず、性能劣化の予測が困難な場合もある。 However, depending on a specific performance value, performance degradation may suddenly progress beyond a certain threshold, and performance degradation from the past to the present may not always continue in the future, and it is difficult to predict performance degradation There is also.
 本発明は以上の点を考慮してなされたもので、将来的に特定の性能値が閾値を超えたことを契機として急に性能劣化傾向が変化した場合でも既定の仕様を満たさなくなる時期をより正確に予測することができる、ストレージシステムを含む情報システム及びストレージシステムにおける性能劣化予測方法を提案しようとするものである。 The present invention has been made in consideration of the above points, and when a specific performance value exceeds a threshold value in the future, even when the tendency of performance deterioration suddenly changes, the time when the predetermined specification is not satisfied is further increased. It is an object of the present invention to propose an information system including a storage system and a performance degradation prediction method in the storage system that can be accurately predicted.
 かかる課題を解決するため、本発明においては、プライマリストレージ装置とセカンダリストレージ装置との間でデータ転送を行うストレージシステムを含む情報システムにおいて、前記プライマリストレージ装置と前記セカンダリストレージ装置との間における予め定められた性能値を取得する計測部と、前記計測された性能値を分析し、前記プライマリストレージ装置と前記セカンダリストレージ装置との間の性能値の性能劣化傾向を取得する分析部と、前記プライマリストレージ装置と前記セカンダリストレージ装置との間の性能値に関する過去の性能劣化傾向を保持しておく情報記憶部と、前記プライマリストレージ装置の性能値、前記セカンダリストレージ装置の性能値、前記プライマリストレージ装置と前記セカンダリストレージ装置との間における性能値、及び、前記取得した前記プライマリストレージ装置と前記セカンダリストレージ装置との間の性能値に対する性能劣化傾向を求めるための傾向係数を考慮して、前記プライマリストレージ装置と前記セカンダリストレージ装置との間における将来の性能値を導き出す予測部と、を備えることを特徴とする。 In order to solve this problem, in the present invention, in an information system including a storage system that performs data transfer between a primary storage device and a secondary storage device, a predetermined value is determined between the primary storage device and the secondary storage device. A measurement unit that acquires the measured performance value, an analysis unit that analyzes the measured performance value and acquires a performance deterioration tendency of the performance value between the primary storage device and the secondary storage device, and the primary storage An information storage unit that holds a past performance deterioration tendency related to a performance value between a device and the secondary storage device, a performance value of the primary storage device, a performance value of the secondary storage device, the primary storage device and the Secondary stress In consideration of the performance value between the primary storage device and the tendency factor for obtaining the performance degradation tendency with respect to the performance value between the acquired primary storage device and the secondary storage device, the primary storage device and the A predicting unit for deriving a future performance value with the secondary storage apparatus.
 また、本発明においては、プライマリストレージ装置とセカンダリストレージ装置との間でデータ転送を行うストレージシステムにおける性能劣化予測方法において、計測部が前記プライマリストレージ装置と前記セカンダリストレージ装置との間における予め定められた性能値を取得する計測ステップと、分析部が前記計測された性能値を分析し、前記プライマリストレージ装置と前記セカンダリストレージ装置との間の性能値の性能劣化傾向を取得する分析ステップと、情報記憶部が前記プライマリストレージ装置と前記セカンダリストレージ装置との間の性能値に関する過去の性能劣化傾向を保持する情報記憶ステップと、予測部が前記プライマリストレージ装置の性能値、前記セカンダリストレージ装置の性能値、前記プライマリストレージ装置と前記セカンダリストレージ装置との間における性能値、及び、前記取得した前記プライマリストレージ装置と前記セカンダリストレージ装置との間の性能値に対する性能劣化傾向を求めるための傾向係数を考慮して、前記プライマリストレージ装置と前記セカンダリストレージ装置との間における将来の性能値を導き出す予測ステップと、を含むことを特徴とする。 According to the present invention, in the performance degradation prediction method in the storage system for transferring data between the primary storage device and the secondary storage device, a measurement unit is predetermined between the primary storage device and the secondary storage device. A measurement step of acquiring a performance value, an analysis step of analyzing the measured performance value, and an analysis step of acquiring a performance deterioration tendency of the performance value between the primary storage device and the secondary storage device, information An information storage step in which a storage unit holds a past performance deterioration tendency related to a performance value between the primary storage device and the secondary storage device, and a prediction unit performs a performance value of the primary storage device and a performance value of the secondary storage device. The primary In consideration of a trend coefficient for obtaining a performance value between the storage device and the secondary storage device, and a performance deterioration tendency with respect to the acquired performance value between the primary storage device and the secondary storage device, And a prediction step of deriving a future performance value between the primary storage device and the secondary storage device.
 本発明によれば、将来的に特定の性能値が閾値を超えたことを契機として急に性能劣化傾向が変化した場合でも既定の仕様を満たさなくなる時期をより正確に予測することができる。 According to the present invention, it is possible to more accurately predict the time when the predetermined specification is not satisfied even when the performance deterioration tendency suddenly changes when a specific performance value exceeds a threshold value in the future.
本実施の形態によるストレージシステムを含む情報システムの概略構成を示すブロック図である。It is a block diagram which shows schematic structure of the information system containing the storage system by this Embodiment. 本実施の形態によるストレージシステムにおける(データ転送)遅延時間の将来値予測処理の一例を示すフローチャートである。It is a flowchart which shows an example of the future value prediction process of the (data transfer) delay time in the storage system by this Embodiment. 図2に示す性能値予測処理の具体的な処理手順の一例を示すフローチャートである。It is a flowchart which shows an example of the specific process sequence of the performance value prediction process shown in FIG. 図2に示す上方修正係数加味処理の具体的な処理手順の一例を示すフローチャートである。It is a flowchart which shows an example of the specific process sequence of the upward correction coefficient addition process shown in FIG. 図2に示す遅延時間予測処理の具体的な処理手順の一例を示すフローチャートである。It is a flowchart which shows an example of the specific process sequence of the delay time prediction process shown in FIG. 遅延時間に影響を与える影響(メトリック寄与度)の第1の例を示す図である。It is a figure which shows the 1st example of the influence (metric contribution degree) which influences delay time. 遅延時間に影響を与える影響(メトリック寄与度)の第2の例を示す図である。It is a figure which shows the 2nd example of the influence (metric contribution degree) which influences delay time. 遅延時間に影響を与える影響(メトリック寄与度)の第3の例を示す図である。It is a figure which shows the 3rd example of the influence (metric contribution degree) which influences delay time. 遅延時間に影響を与える影響(メトリック寄与度)の第4の例を示す図である。It is a figure which shows the 4th example of the influence (metric contribution degree) which influences delay time. 遅延時間に影響を与える影響(メトリック寄与度)の第5の例を示す図である。It is a figure which shows the 5th example of the influence (metric contribution) which influences delay time. 各メトリックごとの上方修正係数の求め方の一例を示す図である。It is a figure which shows an example of how to obtain | require the upward correction coefficient for every metric. 本実施の形態における遅延時間予測処理によって遅延時間を予測する様子を示す図である。It is a figure which shows a mode that a delay time is estimated by the delay time prediction process in this Embodiment. 本実施の形態における遅延時間予測処理によって遅延時間を予測する様子を示す図である。It is a figure which shows a mode that a delay time is estimated by the delay time prediction process in this Embodiment. 本実施の形態における遅延時間予測処理によって遅延時間を予測する様子を示す図である。It is a figure which shows a mode that a delay time is estimated by the delay time prediction process in this Embodiment. 本実施の形態における遅延時間予測処理によって遅延時間を予測する様子を示す図である。It is a figure which shows a mode that a delay time is estimated by the delay time prediction process in this Embodiment. 本実施の形態における遅延時間予測処理によって遅延時間を予測する様子を示す図である。It is a figure which shows a mode that a delay time is estimated by the delay time prediction process in this Embodiment. 本実施の形態における遅延時間予測処理によって遅延時間を予測する様子を示す図である。It is a figure which shows a mode that a delay time is estimated by the delay time prediction process in this Embodiment. 本実施の形態における遅延時間予測処理によって遅延時間を予測する様子を示す図である。It is a figure which shows a mode that a delay time is estimated by the delay time prediction process in this Embodiment. 本実施の形態における遅延時間予測処理によって遅延時間を予測する様子を示す図である。It is a figure which shows a mode that a delay time is estimated by the delay time prediction process in this Embodiment. 本実施の形態における遅延時間予測処理によって遅延時間を予測する様子を示す図である。It is a figure which shows a mode that a delay time is estimated by the delay time prediction process in this Embodiment. 本実施の形態における遅延時間予測処理によって遅延時間を予測する様子を示す図である。It is a figure which shows a mode that a delay time is estimated by the delay time prediction process in this Embodiment. 本実施の形態における遅延時間予測処理によって遅延時間を予測する様子を示す図である。It is a figure which shows a mode that a delay time is estimated by the delay time prediction process in this Embodiment. 本実施の形態における遅延時間予測処理によって遅延時間を予測する様子を示す図である。It is a figure which shows a mode that a delay time is estimated by the delay time prediction process in this Embodiment.
 以下、図面について、本発明の一実施の形態について詳述する。 Hereinafter, an embodiment of the present invention will be described in detail with reference to the drawings.
 (1)本実施の形態によるストレージシステムの構成
 図1は、本実施の形態によるストレージシステム1を含む情報システムの概略構成を示す。ストレージシステム1は、ネットワーク2を経由して、性能データ管理サーバ400及びストレージシステム管理サーバ500に接続されている。このストレージシステム1は、データが格納される記憶領域を提供する複数のストレージ装置を備えている。ストレージシステム1は、このようなストレージ装置としてプライマリストレージ装置200およびセカンダリストレージ装置300を備え、アプリケーションホスト100からのデータを格納する。アプリケーションホスト100は、デスクトップ若しくはノート型コンピュータ、ワークステーション又はメインフレームのようなコンピュータである。
(1) Configuration of Storage System According to this Embodiment FIG. 1 shows a schematic configuration of an information system including a storage system 1 according to this embodiment. The storage system 1 is connected to the performance data management server 400 and the storage system management server 500 via the network 2. The storage system 1 includes a plurality of storage devices that provide storage areas for storing data. The storage system 1 includes a primary storage device 200 and a secondary storage device 300 as such storage devices, and stores data from the application host 100. The application host 100 is a computer such as a desktop or notebook computer, workstation or mainframe.
 アプリケーションホスト100は、図示しないCPU(Central Processing Unit)、メモリ、キャッシュ、ハードディスクドライブ、インターフェース及び各種インターフェースカードを備えている。アプリケーションホスト100は、内蔵するプロセッサが各種プログラムをメモリ上で実行することで、様々な機能を実現する。これら各種プログラムの一例としてはホストアプリケーションを挙げることができる。アプリケーションホスト100は、主としてプライマリストレージ装置200に格納されたデータにアクセスしてデータ処理を実行する。当該データは上記複製元データに相当する。 The application host 100 includes a CPU (Central Processing Unit), a memory, a cache, a hard disk drive, an interface, and various interface cards (not shown). The application host 100 implements various functions by the built-in processor executing various programs on the memory. An example of these various programs is a host application. The application host 100 mainly accesses data stored in the primary storage device 200 and executes data processing. The data corresponds to the replication source data.
 このストレージシステム1においては、アプリケーションホスト100が書き込みコマンドをプライマリストレージ装置200に対して発行することでデータをプライマリストレージ装置200に記憶させる一方、当該データを複製したデータを別のストレージ装置であるセカンダリストレージ装置300に記憶させておく。当該ストレージシステムは、プライマリストレージ装置200に障害が発生した場合、セカンダリストレージ装置300に複写済みのデータを用いて処理を継続することができる。 In this storage system 1, the application host 100 issues a write command to the primary storage device 200 to store the data in the primary storage device 200, while copying the data to a secondary storage device that is another storage device. It is stored in the storage device 300. When a failure occurs in the primary storage apparatus 200, the storage system can continue processing using data copied to the secondary storage apparatus 300.
 本実施の形態では、複製対象となるデータ(以下「複製元データ」という)を格納する記憶装置と、当該複製元データを複製して得たデータ(以下「複製データ」という)を格納する記憶装置とを区別するために、複製元データを格納する側を「プライマリ」、複製データを格納する側を「セカンダリ」と呼称している。本実施の形態では、プライマリであるかセカンダリであるかに応じて、複製元データを格納する記憶装置を「プライマリストレージ装置」と呼称とともに、複製データを格納する記憶装置を「セカンダリストレージ装置」と呼称することとする。なお、本実施の形態では、プライマリストレージ装置側のボリュームをプライマリボリューム(図示の「P-VOL」に相当)」と呼称し、セカンダリストレージ装置のボリュームをセカンダリボリューム(図示の「S-VOL」に相当)」とも呼称している。 In this embodiment, a storage device that stores data to be replicated (hereinafter referred to as “replication source data”) and a storage that stores data obtained by replicating the replication source data (hereinafter referred to as “replication data”). In order to distinguish between the apparatuses, the side storing the copy source data is called “primary”, and the side storing the copy data is called “secondary”. In this embodiment, the storage device that stores the replication source data is referred to as a “primary storage device” and the storage device that stores the replication data is referred to as a “secondary storage device”, depending on whether it is primary or secondary. It shall be called. In the present embodiment, the volume on the primary storage device side is referred to as a primary volume (corresponding to “P-VOL” in the figure) ”, and the volume in the secondary storage apparatus is referred to as a secondary volume (indicated by“ S-VOL ”in the figure). Equivalent)).
 それらストレージ装置200,300の間は、ネットワークや専用線によって接続されており、所定の通信プロトコルにより通信が行われる。セカンダリストレージ装置300は、後述する同期データ複製処理によって、プライマリストレージ装置200に格納済みのデータの複製データを格納する。セカンダリストレージ装置300は、後述する非同期データ複製処理によって、セカンダリストレージ装置300に格納済みのデータをもとにした差分データを格納する。 The storage apparatuses 200 and 300 are connected by a network or a dedicated line, and communication is performed using a predetermined communication protocol. The secondary storage apparatus 300 stores the replicated data of the data already stored in the primary storage apparatus 200 by synchronous data replication processing described later. The secondary storage apparatus 300 stores differential data based on data already stored in the secondary storage apparatus 300 by asynchronous data replication processing described later.
 プライマリストレージ装置200は、複製元データが更新される時に当該更新内容に関するジャーナルを作成してプライマリジャーナルボリュームに格納し、このジャーナルデータをもとにデータを複製する機能を有する。セカンダリストレージ装置300は、プライマリストレージ装置200とほぼ同様に、それぞれ、更新内容に関するジャーナルを作成し、そのジャーナルデータをセカンダリジャーナルボリュームに格納する機能を有する。プライマリストレージ装置200は、後述する非同期データ複製処理において、両ストレージ装置間で必要なジャーナルデータの転送を行い、当該ジャーナルデータによりセカンダリストレージ装置300に格納済みの複製データを更新することで、当該複製データを複製元データに一致させる機能を有する。 The primary storage apparatus 200 has a function of creating a journal related to the update contents when the copy source data is updated, storing it in the primary journal volume, and replicating the data based on the journal data. The secondary storage device 300 has a function of creating a journal related to the update contents and storing the journal data in the secondary journal volume, almost the same as the primary storage device 200. The primary storage device 200 transfers necessary journal data between both storage devices in the asynchronous data replication processing described later, and updates the replicated data stored in the secondary storage device 300 with the journal data. It has a function to match data with the original data.
 プライマリストレージ装置200間のデータ複製の方式(モード)としては、同期データ複製及び非同期データ複製がある。通常の運用時には、2つのストレージ装置200,300間で、同期データ複製及び非同期データ複製の二種類のデータ複製を行うことで、一つの複製元データに対して二つの複製データが保持される。同期データ複製は、複製元データの更新に同期して複製データを更新する処理であり、複製データは複製元データと一致する。一方、非同期データ複製は、複製元データの更新に非同期で、ジャーナルに基づいて複製データを更新する処理であり、複製データは複製元データの更新後に一致する。 As a method (mode) of data replication between the primary storage apparatuses 200, there are synchronous data replication and asynchronous data replication. During normal operation, two types of data replication, that is, synchronous data replication and asynchronous data replication, are performed between the two storage apparatuses 200 and 300, whereby two replication data are held for one replication source data. Synchronous data replication is a process of updating replication data in synchronization with the update of the replication source data, and the replication data matches the replication source data. On the other hand, asynchronous data replication is a process of updating the replication data based on the journal asynchronously with the update of the replication source data, and the replication data matches after the update of the replication source data.
 本実施の形態によるストレージシステム1では、通常運用時、2つのストレージ装置間でのデータ複製、つまり複製データの保持状態の維持を行うが、あるストレージ装置に障害が生じた時には、障害状態でないストレージ装置間でジャーナルの転送を行ってジャーナルのデータにより更新反映を行うことで上記データ複製を継続し、処理を再開する。 In the storage system 1 according to the present embodiment, during normal operation, data replication between two storage devices, that is, maintaining the retained state of the replicated data is performed. When a failure occurs in a certain storage device, the storage that is not in the failed state The data replication is continued by transferring the journal between the apparatuses and reflecting the update with the journal data, and the process is resumed.
 ここで、ストレージ装置の記憶領域は、論理的に分割して管理されており、分割された記憶領域は論理ボリュームと呼ばれている(以下単に「ボリューム」ともいう)。この論理ボリューム内及び論理ボリューム間におけるデータの更新順序を管理するために、グループという管理単位が設けられている。このグループは、図示のコピーグループA,B,C,・・・に相当する。 Here, the storage area of the storage apparatus is logically divided and managed, and the divided storage area is called a logical volume (hereinafter also simply referred to as “volume”). In order to manage the update order of data within and between the logical volumes, a management unit called a group is provided. This group corresponds to the copy groups A, B, C,.
 <ストレージ装置の構成>
 次に各ストレージ装置のハードウェア構成例について説明する。本実施形態では、主としてプライマリストレージ装置200のハードウェア構成について説明するが、上述したセカンダリストレージ装置300もほぼ同様な構成である。
<Storage device configuration>
Next, a hardware configuration example of each storage apparatus will be described. In the present embodiment, the hardware configuration of the primary storage device 200 will be mainly described, but the secondary storage device 300 described above has a substantially similar configuration.
 プライマリストレージ装置200は、詳細な図示は省略するが、CHA(ホストアダプタ)、DKA(ディスクアダプタ)及びCACHE(キャッシュメモリ)、SM(共有メモリ)及びSWITCH(スイッチ)を含むマスタディスクコントローラ(以下「M-DKC」とも省略する)並びにHDD(ハードディスクドライブ)を備えている。ホストアダプタ、ディスクアダプタ、キャッシュメモリ及び共有メモリは、スイッチを経由して接続されている。ハードディスクドライブは複数設けられており、いわゆるRAID(Redundant Arrays of Inexpensive Disks)を構成している。 Although the detailed illustration is omitted, the primary storage apparatus 200 includes a master disk controller (hereinafter referred to as “host adapter), DKA (disk adapter), CACHE (cache memory), SM (shared memory), and SWITCH (switch). (Also abbreviated as “M-DKC”) and an HDD (hard disk drive). The host adapter, disk adapter, cache memory, and shared memory are connected via a switch. A plurality of hard disk drives are provided, constituting a so-called RAID (Redundant Array of Inexpensive Disks).
 プライマリストレージ装置200は、命令受信処理等の他、各種処理を制御する制御部として、ホストアダプタ及びディスクアダプタを備え、これらに内蔵されているプロセッサ200b,200eによって各処理に対応するプログラムを実行する。ホストアダプタ110は、アプリケーションホスト100と通信を行うための通信インターフェースと入出力命令を授受する機能を備え、アプリケーションホスト100とキャッシュメモリ間のデータ転送を制御する。ホストアダプタは、アプリケーションホスト100及びセカンダリストレージ装置300に接続されている。ディスクアダプタ120は、ハードディスクドライブに対するデータの読み出し及び書き込み等の制御を行い、キャッシュメモリとハードディスクドライブとの間のデータ転送を制御する。 The primary storage device 200 includes a host adapter and a disk adapter as control units for controlling various processes in addition to command reception processing and the like, and executes programs corresponding to the respective processes by the processors 200b and 200e incorporated therein. . The host adapter 110 has a communication interface for communicating with the application host 100 and a function for exchanging input / output commands, and controls data transfer between the application host 100 and the cache memory. The host adapter is connected to the application host 100 and the secondary storage device 300. The disk adapter 120 controls reading and writing of data with respect to the hard disk drive, and controls data transfer between the cache memory and the hard disk drive.
 キャッシュメモリは、主としてアプリケーションホスト100から受信したデータ又はハードディスクドライブから読み出したデータを一時的に記憶するメモリの一種である。共有メモリは、プライマリストレージ装置200内のすべてのホストアダプタ及びディスクアダプタが共有して使用するメモリであり、主に制御情報等を記憶する。 The cache memory is a type of memory that temporarily stores mainly data received from the application host 100 or data read from the hard disk drive. The shared memory is a memory that is shared and used by all the host adapters and disk adapters in the primary storage apparatus 200, and mainly stores control information and the like.
 プライマリストレージ装置200は、図示のようにプロセッサ200bを備え、このプロセッサ200bが、いわゆるCLPR(Cache Logical Partition)によってキャッシュ200cを利用ながら、プライマリボリューム200a(図示の「P-VOL」に相当)やコピーグループを管理している。さらにプライマリストレージ装置200は、図示のようにプロセッサ200eを備え、このプロセッサ200eが、上記CLPR(Cache Logical Partition)によってキャッシュ200fを利用ながら、後述するマスタジャーナルデータ200d(図示の「M-JNL」に相当)を管理している。 The primary storage apparatus 200 includes a processor 200b as shown in the figure, and this processor 200b uses a cache 200c by so-called CLPR (Cache Logical Partition), while copying a primary volume 200a (corresponding to “P-VOL” in the figure) Manage groups. Further, the primary storage apparatus 200 includes a processor 200e as shown in the figure, and this processor 200e uses the cache 200f by the CLPR (Cache Logical Partition) and uses master journal data 200d (described in “M-JNL” shown in the figure). Equivalent).
 一方、セカンダリストレージ装置300は、詳細な図示は省略するが、CHA(ホストアダプタ)、DKA(ディスクアダプタ)及びCACHE(キャッシュメモリ)、SM(共有メモリ)及びSWITCH(スイッチ)を含むリストアディスクコントローラ(以下「R-DKC」とも省略する)並びにHDD(ハードディスクドライブ)を備えている。また同様にセカンダリストレージ装置300は、上述のように基本的にプライマリストレージ装置200とほぼ同様の構成であり、プロセッサ300bを備えている。このプロセッサ300bは、上記CLPR(Cache Logical Partition)によってキャッシュ300cを利用ながら、セカンダリボリューム300a(図示の「S-VOL」に相当)やコピーグループを管理している。さらにセカンダリストレージ装置300は、上記CLPR(Cache Logical Partition)によってキャッシュ300fを利用ながら、後述するリストアジャーナルデータ300d(図示の「R-JNL」に相当)を管理している。 On the other hand, the secondary storage apparatus 300, although not shown in detail, has a restore disk controller (CHA (host adapter), DKA (disk adapter) and CACHE (cache memory), SM (shared memory) and SWITCH (switch). (Hereinafter also abbreviated as “R-DKC”) and HDD (hard disk drive). Similarly, the secondary storage apparatus 300 has basically the same configuration as the primary storage apparatus 200 as described above, and includes a processor 300b. The processor 300b manages a secondary volume 300a (corresponding to “S-VOL” in the figure) and a copy group while using the cache 300c by the CLPR (Cache Logical Partition). Further, the secondary storage apparatus 300 manages restore journal data 300d (corresponding to “R-JNL” in the figure), which will be described later, using the cache 300f using the CLPR (Cache Logical Partition).
 <ジャーナルの構成>
 ジャーナルは、プライマリストレージ装置200の保持する複製元データ(プライマリボリューム)が更新される時に、データ更新に関する情報として作成されるデータである。ジャーナルは、ライトデータ及び更新情報を含んでいる。ライトデータは、アプリケーションホスト100からのプライマリボリュームのデータ更新処理時に用いられたデータのコピーである。当該データは更新位置に対する書き込みデータである。
<Journal structure>
The journal is data created as information related to data update when the replication source data (primary volume) held by the primary storage device 200 is updated. The journal includes write data and update information. The write data is a copy of data used at the time of data update processing of the primary volume from the application host 100. The data is write data for the update position.
 当該更新情報は、更新毎のライトデータ及びジャーナルを管理する情報であり、ライトコマンドを受信したタイムスタンプとしての時刻(更新時刻)、管理番号、そのライトコマンドの論理アドレス、及び、ライトデータのデータサイズ等を含んでいる。当該更新情報は、データ更新の識別子として、上記ライトコマンドを受信したタイムスタンプとしての時刻(更新時刻)及び管理番号の少なくとも一方を含んでいる。当該更新情報によってデータの更新順序が識別される。 The update information is information for managing write data and journal for each update, and the time (update time) as the time stamp when the write command is received, the management number, the logical address of the write command, and the data of the write data Includes size etc. The update information includes, as a data update identifier, at least one of a time (update time) as a time stamp when the write command is received and a management number. The update order identifies the data update order.
 (2)ストレージシステム管理サーバ
 次にストレージシステム管理サーバ500について説明する。ストレージシステム管理サーバ500は、ストレージ&コピーペア管理プログラム500aの他、分析部の一例としての遅延時間分析プログラム500b及び収集データベース500cを備えている。
(2) Storage System Management Server Next, the storage system management server 500 will be described. In addition to the storage & copy pair management program 500a, the storage system management server 500 includes a delay time analysis program 500b and a collection database 500c as an example of an analysis unit.
 ストレージ&コピーペア管理プログラム500aは、プライマリストレージ装置200とセカンダリストレージ装置300との間におけるコピーペアに関する管理を行う。 The storage & copy pair management program 500a manages copy pairs between the primary storage apparatus 200 and the secondary storage apparatus 300.
 ストレージ&コピーペア管理プログラム500aは、プライマリストレージ装置200に対し、データの書き込みや読み出しを指示する場合に必要なコマンドを発行する。 The storage & copy pair management program 500a issues a command necessary for instructing the primary storage apparatus 200 to write or read data.
 ストレージ&コピーペア管理プログラム500aは、プライマリストレージ装置200及びセカンダリストレージ装置300の各状態を取得して管理するアプリケーションソフトウェアである。ストレージ&コピーペア管理プログラム500aは、上述した同期データ複製処理の実行による各状態を管理し、プライマリストレージ装置200とセカンダリストレージ装置300とのペア状態を検知する。 The storage & copy pair management program 500a is application software that acquires and manages each state of the primary storage apparatus 200 and the secondary storage apparatus 300. The storage & copy pair management program 500a manages each state according to the execution of the synchronous data replication process described above, and detects the pair state between the primary storage apparatus 200 and the secondary storage apparatus 300.
 本実施の形態では、同期データ複製処理において同期させて設定する2つの記憶装置の状態の組み合わせを「コピーペア」と呼称している。即ち、本実施の形態では、プライマリストレージ装置200とセカンダリストレージ装置300との状態が同期して変更されるため、「コピーペア」と呼称している。 In the present embodiment, the combination of the states of the two storage devices set in synchronization in the synchronous data replication process is called a “copy pair”. In other words, in the present embodiment, the statuses of the primary storage apparatus 200 and the secondary storage apparatus 300 are changed synchronously, and hence are called “copy pairs”.
 ペア状態としては、例えば、デュプレックス(Duplex)状態、サスペンド状態、Copy及びPair状態及び書き込み可能なサスペンド状態(後述するSusp(R)状態に相当)を挙げることができる。デュプレックス状態は、両記憶装置の各ボリュームに格納されているデータが一致していることを示している。サスペンド状態は、データの書き込み及び読み出しができない状態を示している。Copy状態は、データを複写することを示し、Pair状態は、同一の複写データが両ディスクに書き込むことを示している。書き込み可能なサスペンド状態は、基本的にはサスペンド状態であるがデータの書き込みはできる状態を示している。 Examples of the pair state include a duplex state, a suspend state, a copy and pair state, and a writable suspend state (corresponding to a Susp (R) state described later). The duplex state indicates that the data stored in the volumes of both storage devices match. The suspended state indicates a state where data cannot be written or read. The Copy state indicates that data is to be copied, and the Pair state indicates that the same copy data is written to both disks. The writable suspend state is basically a suspend state, but indicates a state where data can be written.
 遅延時間分析プログラム500bは、予測部の一例であり、詳細は後述するが、プライマリストレージ装置200の性能値、セカンダリストレージ装置300の性能値、プライマリストレージ装置200とセカンダリストレージ装置300との間の性能値、及び、プライマリストレージ装置200とセカンダリストレージ装置300と間における性能値に対する性能劣化傾向を求めるための傾向係数を考慮して、プライマリストレージ装置200とセカンダリストレージ装置300との間における将来の性能値を導き出す。 The delay time analysis program 500b is an example of a prediction unit, and will be described in detail later. The performance value of the primary storage device 200, the performance value of the secondary storage device 300, and the performance between the primary storage device 200 and the secondary storage device 300 will be described later. The future performance value between the primary storage device 200 and the secondary storage device 300 in consideration of the value and the tendency factor for obtaining the performance deterioration tendency with respect to the performance value between the primary storage device 200 and the secondary storage device 300 To derive.
 この遅延時間分析プログラム500bは、例えば、上記計測された性能値データを分析し、上記プライマリ・セカンダリストレージ装置間の性能値の性能劣化傾向を取得する。この遅延時間分析プログラム500bによる性能劣化予測方法については、図2以降を参照しつつ説明する。なお、本実施形態では、このような性能劣化予測として、例えば、主として、プライマリストレージ装置200とセカンダリストレージ装置300との間におけるデータ転送に関する遅延時間を挙げている。 The delay time analysis program 500b, for example, analyzes the measured performance value data and acquires the performance deterioration tendency of the performance value between the primary and secondary storage apparatuses. The performance deterioration prediction method by the delay time analysis program 500b will be described with reference to FIG. In this embodiment, as such performance deterioration prediction, for example, a delay time related to data transfer between the primary storage apparatus 200 and the secondary storage apparatus 300 is mainly cited.
 (3)ストレージシステムの動作例
 ストレージシステム1などは、以上のような構成により、通常運用中においては、プライマリストレージ装置200のプライマリボリューム200aに格納済みのデータと、セカンダリストレージ装置300のセカンダリボリューム300aに格納済みのデータとが一致するように動作している(ペア状態=デュプレックス状態)。
(3) Operation Example of Storage System With the above configuration, the storage system 1 and the like have data stored in the primary volume 200a of the primary storage device 200 and the secondary volume 300a of the secondary storage device 300 during normal operation. Is operating so that the data already stored in the data matches (pair status = duplex status).
 アプリケーションホスト100では、IO制御部が当該プライマリボリュームにIOコマンドを発行する。プライマリストレージ装置200は、当該コマンドによってプライマリボリューム200aに格納されたライトデータをセカンダリストレージ装置300に同期させて転送する一方、セカンダリストレージ装置300は、転送された当該ライトデータをセカンダリボリューム300aに複写する。 In the application host 100, the IO control unit issues an IO command to the primary volume. The primary storage apparatus 200 transfers the write data stored in the primary volume 200a by the command in synchronization with the secondary storage apparatus 300, while the secondary storage apparatus 300 copies the transferred write data to the secondary volume 300a. .
 プライマリストレージ装置200は、プライマリボリューム200aに格納済みの複製元データが更新される時に当該更新内容に関するジャーナルデータ200d(図示のM-JNLに相当)を作成してジャーナルボリュームに格納し、ジャーナルデータをもとにデータを複製している。一方、セカンダリストレージ装置300は、プライマリストレージ装置200とほぼ同様に、それぞれ、更新内容に関するジャーナルデータ300d(図示のR-JNLに相当)を作成してジャーナルボリュームに格納する。プライマリストレージ装置200は、後述する非同期データ複製処理において、これらストレージ装置間で必要なジャーナルデータのデータ転送を行い、当該ジャーナルデータによりセカンダリストレージ装置300に格納済みの複製データを更新することで、当該複製データを複製元データに一致させる機能を有する。なお、本実施形態において後ほど対象とする遅延時間は、一例として、これらストレージ装置間においてジャーナルデータがデータ転送される際の遅延時間である。 When the replication source data stored in the primary volume 200a is updated, the primary storage device 200 creates journal data 200d (corresponding to the illustrated M-JNL) related to the update contents, stores it in the journal volume, and stores the journal data in the journal volume. The data is originally copied. On the other hand, the secondary storage apparatus 300 creates journal data 300d (corresponding to R-JNL in the figure) related to the update contents and stores it in the journal volume, almost like the primary storage apparatus 200. The primary storage apparatus 200 performs data transfer of necessary journal data between these storage apparatuses in asynchronous data replication processing to be described later, and updates the replicated data stored in the secondary storage apparatus 300 with the journal data. It has a function of matching the duplicated data with the original data. Note that the delay time to be targeted later in this embodiment is, for example, a delay time when journal data is transferred between these storage apparatuses.
 (4)性能データ管理サーバ
 次に性能データ管理サーバ400について説明する。この性能データ管理サーバ400は、性能監視プログラム400a及び性能データベース400bを備えている。性能監視プログラム400aは、計測部の一例に相当し、プライマリストレージ装置200とセカンダリストレージ装置300との間における予め定められた種類の性能値を逐次収集し、情報記憶部の一例としての収集データベース500cに、そのデータ(以下「ストレージ性能メトリック」とも云う)を格納する。本実施の形態では、プライマリストレージ装置200とセカンダリストレージ装置300との間における予め定められた(種類の)性能値としては、プライマリストレージ装置200とセカンダリストレージ装置300との間におけるデータ転送の遅延時間を例示することができる。
(4) Performance Data Management Server Next, the performance data management server 400 will be described. The performance data management server 400 includes a performance monitoring program 400a and a performance database 400b. The performance monitoring program 400a corresponds to an example of a measurement unit, sequentially collects performance values of a predetermined type between the primary storage device 200 and the secondary storage device 300, and a collection database 500c as an example of an information storage unit The data (hereinafter also referred to as “storage performance metric”) is stored. In the present embodiment, the predetermined (type) performance value between the primary storage apparatus 200 and the secondary storage apparatus 300 is the data transfer delay time between the primary storage apparatus 200 and the secondary storage apparatus 300. Can be illustrated.
 この性能データ管理サーバ400では、性能監視プログラム400aが、例えば、次のような名称の性能値(ストレージ性能メトリック)を収集し、ストレージシステム管理サーバ500の収集データベース500cに蓄積している。 In this performance data management server 400, the performance monitoring program 400a collects performance values (storage performance metrics) having the following names, for example, and stores them in the collection database 500c of the storage system management server 500.
性能値1.P-VOL Processor Busy Rate
性能値2.P-VOL Cache Write Pending Rate
性能値3.P-VOL Cache Logical Partition Memory Usage Rate
性能値4.P-VOL Write Transfer Rate
性能値5.P-VOL Write I/O
性能値6.P-VOL Parity Group Write Transfer Rate
性能値7.P-VOL Parity Group Write I/O
性能値8.M-JNL Processor Busy Rate
性能値9.M-JNL Cache Write Pending Rate
性能値10.M-JNL Cache Logical Partition Memory Usage Rate
性能値11.M-JNL Write Transfer Rate
性能値12.M-JNL Write I/O
性能値13.M-JNL Parity Group Write Transfer Rate
性能値14.M-JNL Parity Group Write I/O
性能値15.M-JNL Usage Rate
性能値16.R-JNL Processor Busy Rate
性能値17.R-JNL Cache Write Pending Rate
性能値18.R-JNL Cache Logical Partition Memory Usage Rate
性能値19.R-JNL Write Transfer Rate
性能値20.R-JNL Write I/O
性能値21.R-JNL Parity Group Write Transfer Rate
性能値22.R-JNL Parity Group Write I/O
性能値23.R-JNL Usage Rate
性能値24.S-VOL Processor Busy Rate
性能値25.S-VOL Cache Write Pending Rate
性能値26.S-VOL Cache Logical Partition Memory Usage Rate
性能値27.S-VOL Write Transfer Rate
性能値28.S-VOL Write I/O
性能値29.S-VOL Parity Group Write Transfer Rate
性能値30.S-VOL Parity グループ Write I/O
性能値31.Array Port Transfer Rate
性能値32.Array Port I/O, etc.
Performance value P-VOL Processor Busy Rate
Performance value P-VOL Cache Write Pending Rate
2. Performance value P-VOL Cache Logical Partition Memory Usage Rate
Performance value4. P-VOL Write Transfer Rate
4. Performance value P-VOL Write I / O
Performance value P-VOL Parity Group Write Transfer Rate
Performance value P-VOL Parity Group Write I / O
Performance value8. M-JNL Processor Busy Rate
Performance value9. M-JNL Cache Write Pending Rate
Performance value10. M-JNL Cache Logical Partition Memory Usage Rate
Performance value 11. M-JNL Write Transfer Rate
Performance value 12. M-JNL Write I / O
Performance value13. M-JNL Parity Group Write Transfer Rate
Performance value14. M-JNL Parity Group Write I / O
Performance value 15. M-JNL Usage Rate
Performance value 16. R-JNL Processor Busy Rate
Performance value 17. R-JNL Cache Write Pending Rate
Performance value 18. R-JNL Cache Logical Partition Memory Usage Rate
Performance value 19. R-JNL Write Transfer Rate
Performance value 20. R-JNL Write I / O
Performance value 21. R-JNL Parity Group Write Transfer Rate
Performance value 22. R-JNL Parity Group Write I / O
Performance value 23. R-JNL Usage Rate
Performance value 24. S-VOL Processor Busy Rate
Performance value 25. S-VOL Cache Write Pending Rate
Performance value 26. S-VOL Cache Logical Partition Memory Usage Rate
Performance value 27. S-VOL Write Transfer Rate
Performance value 28. S-VOL Write I / O
Performance value 29. S-VOL Parity Group Write Transfer Rate
Performance value 30. S-VOL Parity Group Write I / O
Performance value 31. Array Port Transfer Rate
Performance value 32. Array Port I / O, etc.
 本実施の形態では、上述のように多数のストレージ性能メトリック(性能値)群のうちから遅延時間への影響がある性能値が予め選定されている。なお、上記下線を付した性能値がこれに対応している。即ち、このように予め選定された以下のストレージ性能メトリックは遅延時間に影響を与えやすいと云える。 In the present embodiment, as described above, performance values that have an influence on the delay time are selected in advance from among a large number of storage performance metric (performance value) groups. The underlined performance values correspond to this. That is, it can be said that the following storage performance metrics selected in advance are likely to affect the delay time.
性能値25.S-VOL Cache Write Pending Rate
性能値24.S-VOL Processor Busy Rate
性能値16.R-JNL Processor Busy Rate
性能値17.R-JNL Cache Write Pending Rate
性能値8.M-JNL Processor Busy Rate
性能値31.Array Port Transfer Rate
Performance value 25. S-VOL Cache Write Pending Rate
Performance value 24. S-VOL Processor Busy Rate
Performance value 16. R-JNL Processor Busy Rate
Performance value 17. R-JNL Cache Write Pending Rate
Performance value8. M-JNL Processor Busy Rate
Performance value 31. Array Port Transfer Rate
 まず、性能値「Cache Write Pending Rate」は、キャッシュの書き込み待ち率を表しており、値が高くなるほどボリュームに格納すべき値の格納遅延が起きている可能性が高いことを示している。「S-VOL Cache Write Pending Rate」は、キャッシュ300cの書き込み待ち率を表している一方、「R-JNL Cache Write Pending Rate」は、キャッシュ300fの書き込み待ち率を表している。当該性能値は、40%~80%である場合、注意が必要となる。以下、本実施形態では、このように注意が必要となる値の範囲を「注意値域」ともいう。 First, the performance value “Cache Write Pending Rate” represents the cache write wait rate, and the higher the value, the higher the possibility that a storage delay of the value to be stored in the volume has occurred. “S-VOL Cache Write Pending Rate” represents the write wait rate of the cache 300c, while “R-JNL Cache Write Pending Rate” represents the write wait rate of the cache 300f. Care should be taken when the performance value is 40% to 80%. Hereinafter, in the present embodiment, such a range of values that require attention is also referred to as a “caution value range”.
 上述した各性能値は、性能上許容される閾値が予め設定されている。前述した性能データベース400bは、各性能値ごとに性能上許容されるべき予め設定された閾値(以下、「限界値」ともいう)に関する情報(以下「限界値情報」ともいう)を格納しているとともに、予め設定されている注意値域に関する情報([以下「注意値域情報」ともいう)を格納している。 Threshold values allowed for performance are set in advance for each performance value described above. The performance database 400b described above stores information (hereinafter also referred to as “limit value information”) relating to a preset threshold value (hereinafter also referred to as “limit value”) that should be allowed for performance for each performance value. In addition, information on a preset attention value range (hereinafter also referred to as “attention value range information”) is stored.
 本実施形態では、上記予め選定された各性能値(ストレージ性能メトリック)がC/T Deltaに与える影響の度合いを「メトリック寄与率」という。なお、C/T Deltaは、ストレージ装置間のデータ転送の際の遅延時間に関する指標を表している。このC/T Deltaに与える影響度合い(メトリック寄与度)に関しては、上述した6つ選定した性能値のうちでは、例えばS-VOL Cache Write Pending Rate(性能値25)の影響が最も大きい一方(メトリック寄与率が大きく)、Array Port Transfer Rate(性能値31)の影響が最も小さい(メトリック寄与度が小さい)。 In this embodiment, the degree of influence of each performance value (storage performance metric) selected in advance on C / T Delta is referred to as “metric contribution rate”. C / T Delta represents an index related to a delay time in data transfer between storage apparatuses. Regarding the degree of influence (metric contribution) on C / T Delta, among the above-described six selected performance values, for example, S-VOL Cache Write Pending Rate (performance value 25) has the largest influence (metric). The contribution ratio is large), and the influence of the Array Port Transfer Rate (performance value 31) is the smallest (the metric contribution is small).
 次に、性能値「Processor Busy Rate」は、プロセッサの使用率を表しており、値が高くなるほどボリュームに対するI/Oなどの処理遅延が起きている可能性が高いことを示している。性能値「S-VOL Processor Busy Rate」は、プロセッサ300bの利用率を表している一方、性能値「R-JNL Processor Busy Rate」は、プロセッサ300eの使用率を表している。当該性能値は、例えば30%~60%である場合、注意が必要となる(注意値域に相当)。 Next, the performance value “Processor Busy Rate” represents the usage rate of the processor, and the higher the value, the higher the possibility that processing delay such as I / O for the volume is occurring. The performance value “S-VOL Processor Busy Rate” represents the usage rate of the processor 300b, while the performance value “R-JNL Processor Busy Rate” represents the usage rate of the processor 300e. For example, when the performance value is 30% to 60%, attention is required (corresponding to the attention value range).
 ストレージ性能メトリックがC/T Deltaに与える影響度合い(メトリック寄与度)に関しては、上述した6つの選定した性能値においてはS-VOL Cache Write Pending Rate(性能値25)の影響が最も大きい一方(メトリック寄与率が大きく)、Array Port Transfer Rate(性能値31)の影響が最も小さい(メトリック寄与度が小さい)。 Regarding the degree of influence (metric contribution) that the storage performance metric has on C / T Delta, the S-VOL Cache Write Pending Rate (performance value 25) has the largest influence (metric) among the six selected performance values described above. The contribution ratio is large), and the influence of the Array Port Transfer Rate (performance value 31) is the smallest (the metric contribution is small).
 次に、性能値31「Array Port Transfer Rate」は、プライマリストレージ装置200とセカンダリストレージ装置300との間のリモートパスのデータ転送量を表しており、ユーザ設定の回線帯域幅に近づいている場合は回線逼迫が起きている可能性が高いことを示している。 Next, the performance value 31 “Array Port Transfer Rate” represents the data transfer amount of the remote path between the primary storage device 200 and the secondary storage device 300, and is close to the line bandwidth set by the user. This indicates that there is a high possibility that the line is tight.
 ストレージ性能メトリックがC/T Deltaに与える影響度合い(メトリック寄与度)に関しては、上述した6つの選定した性能値においてはS-VOL Cache Write Pending Rate(性能値25)の影響が最も大きい一方(メトリック寄与率が大きく)、Array Port Transfer Rate(性能値31)の影響が最も小さい(メトリック寄与度が小さい)。 Regarding the degree of influence (metric contribution) that the storage performance metric has on C / T Delta, the S-VOL Cache Write Pending Rate (performance value 25) has the largest influence (metric) among the six selected performance values described above. The contribution ratio is large), and the influence of the Array Port Transfer Rate (performance value 31) is the smallest (the metric contribution is small).
 (5)ストレージシステムにおける性能劣化予測方法
 図2~図5は、遅延時間の将来値の予測処理の手順の一例を示す。なお、以下の説明において「CWPR」は「Cache Write Pending Rate」を意味し、「PBR」は「Processor Busy Rate」を意味し、「APTR」は「Array Port Transfer Rate」を意味している。
(5) Performance Deterioration Prediction Method in Storage System FIGS. 2 to 5 show an example of a procedure for predicting the future value of the delay time. In the following description, “CWPR” means “Cache Write Pending Rate”, “PBR” means “Processor Busy Rate”, and “APTR” means “Array Port Transfer Rate”.
 まずステップS1では、分析に使用される実測値の期間、許容可能な遅延時間、通信帯域幅が予め入力され設定される。次にステップS2では、遅延時間分析プログラム500bが、時刻tまでの遅延時間を直線近似して直線の傾きaを計算する。次にステップS3では、遅延時間分析プログラム500bが、当該直線の傾きaが1以下であるか否かを判定し、当該直線の傾きaが1以下である場合には性能劣化傾向が無いことを外部に出力する一方(ステップS4)、遅延時間分析プログラム500bは、当該直線の傾きaが1以下でない場合には性能値予測処理を実行する(ステップS5)。 First, in step S1, an actual measurement value period, an allowable delay time, and a communication bandwidth used for analysis are input and set in advance. Next, in step S2, the delay time analysis program 500b linearly approximates the delay time up to time t and calculates the slope a of the line. Next, in step S3, the delay time analysis program 500b determines whether the slope a of the straight line is 1 or less, and if the slope a of the straight line is 1 or less, there is no tendency for performance degradation. While outputting to the outside (step S4), the delay time analysis program 500b executes performance value prediction processing when the slope a of the straight line is not 1 or less (step S5).
 この性能値予測処理では、図3に示すように、例えばARMAモデルなどの統計モデルに対して時刻t0から時刻tまでの性能値が入力される(ステップS51)。ここで、時刻t0は、予め指定された分析期間の開始時刻以降で、かつ、最も古い性能値の存在する時刻を表している。次にステップS52では、遅延時間分析プログラム500bが、時刻t+1の性能値の予測値を収集データベース500cに保存する。 In this performance value prediction process, as shown in FIG. 3, for example, performance values from time t0 to time t are input to a statistical model such as the ARMA model (step S51). Here, time t0 represents a time after the start time of the analysis period designated in advance and at which the oldest performance value exists. Next, in step S52, the delay time analysis program 500b stores the predicted value of the performance value at time t + 1 in the collection database 500c.
 次にステップS6では、遅延時間分析プログラム500bが、時刻tにおけるセカンダリボリューム300a(S-VOL)のCWPRが40%以上であるか否かを判定し、セカンダリボリューム300aのCWPRが40%以上である場合には後述の上方修正係数加味処理を実行する(ステップS7)。 Next, in step S6, the delay time analysis program 500b determines whether or not the CWPR of the secondary volume 300a (S-VOL) at time t is 40% or more, and the CWPR of the secondary volume 300a is 40% or more. In this case, an upward correction coefficient adding process described later is executed (step S7).
 この上方修正係数加味処理では、まず、図4に示すステップS71において遅延時間分析プログラム500bが、変数Cの初期化が必要であるか否かを判定する。なお、変数Cの初期化が必要な場合とは、時刻tにおいて上方修正係数cの加味が必要なメトリックのうち最初のものを加味する場合を想定している。 In this upward correction coefficient addition process, first, in step S71 shown in FIG. 4, the delay time analysis program 500b determines whether or not the variable C needs to be initialized. Note that the case where the initialization of the variable C is necessary assumes a case where the first one of the metrics that require the upward correction coefficient c to be considered at the time t is considered.
 上記ステップS71において変数Cの初期化が必要であると判定された場合、遅延時間分析プログラム500bが変数Cを初期化する(ステップS72)。その後、又は、一方、上記ステップS71において変数Cの初期化が必要でないと判定された場合、次にステップS73が実行される。 When it is determined in step S71 that the variable C needs to be initialized, the delay time analysis program 500b initializes the variable C (step S72). Thereafter, or on the other hand, if it is determined in step S71 that the initialization of the variable C is not necessary, step S73 is executed next.
 このステップS73では、遅延時間分析プログラム500bが、ストレージ性能メトリック(以下「メトリック」ともいう)の注意値域に対する上方修正係数cの計算(以下「修正係数化」ともいう)のための関数f1を適用することにより、傾向係数の一例としての上方修正係数cを得る。ここで、関数f1は、詳細は後述するが、メトリックごとに下限、上限の閾値を設け、その間の値を係数にマップする機能を有する。 In this step S73, the delay time analysis program 500b applies the function f1 for calculating the upward correction coefficient c (hereinafter also referred to as “correction coefficient conversion”) for the attention value range of the storage performance metric (hereinafter also referred to as “metric”). By doing so, the upward correction coefficient c as an example of the tendency coefficient is obtained. Here, the function f1, which will be described in detail later, has a function of setting a lower limit and an upper limit threshold for each metric and mapping the values between them to a coefficient.
 次にステップS74では、遅延時間分析プログラム500bが、メトリック寄与度を上方修正係数cに加味するとともに、関数f2を上記取得済み上方修正係数cに適用して上方修正係数c’を取得する。なお、関数f2は、詳細は後述するが、メトリックごとの寄与度を掛ける機能を有し、例えばS-VOLのCWPRの場合、上方修正係数c’=f2(c)=c×0.25により求めることができる。 Next, in step S74, the delay time analysis program 500b adds the metric contribution to the upward correction coefficient c and applies the function f2 to the acquired upward correction coefficient c to acquire the upward correction coefficient c '. The function f2, which will be described in detail later, has a function of multiplying the contribution for each metric. For example, in the case of SWOL CWPR, the upward correction coefficient c ′ = f2 (c) = c × 0.25 Can be sought.
 次にステップS75では、遅延時間分析プログラム500bが、時刻t=t+1を再設定するまでの間に亘って有効な変数C=C+c’を演算する。 Next, in step S75, the delay time analysis program 500b calculates an effective variable C = C + c 'until the time t = t + 1 is reset.
 一方、図2に示すステップS6において遅延時間分析プログラム500bがS-VOL300aのCWPRが40%以上でないと判定した場合には、次のようなステップS8が実行される。 On the other hand, when the delay time analysis program 500b determines in step S6 shown in FIG. 2 that the CWPR of the S-VOL 300a is not 40% or more, the following step S8 is executed.
 次にステップS8では、遅延時間分析プログラム500bが、時刻tにおけるS-VOL300aのPBRが30%以上であるか否かを判定し、S-VOL300aのPBRが30%以上である場合には既述の上方修正係数加味処理を実行する(ステップS7)。 Next, in step S8, the delay time analysis program 500b determines whether or not the PBR of the S-VOL 300a at time t is 30% or more. If the PBR of the S-VOL 300a is 30% or more, it is described above. The upward correction coefficient adding process is executed (step S7).
 一方、ステップS8において遅延時間分析プログラム500bがS-VOL300aのPBRが30%以上でないと判定した場合には、次のようなステップS9が実行される。 On the other hand, when the delay time analysis program 500b determines in step S8 that the PBR of the S-VOL 300a is not 30% or more, the following step S9 is executed.
 次にステップS9では、遅延時間分析プログラム500bが、時刻tにおけるR-JNL300dのCWPRが40%以上であるか否かを判定し、CWPRが40%以上である場合には既述の上方修正係数加味処理を実行する(ステップS7)。 Next, in step S9, the delay time analysis program 500b determines whether or not the CWPR of the R-JNL 300d at time t is 40% or more. If the CWPR is 40% or more, the above-described upward correction coefficient is determined. A seasoning process is executed (step S7).
 一方、ステップS9において遅延時間分析プログラム500bがR-JNL300dのCWPRが40%以上でないと判定した場合には、次のようなステップS10が実行される。 On the other hand, when the delay time analysis program 500b determines in step S9 that the CWPR of the R-JNL 300d is not 40% or more, the following step S10 is executed.
 次にステップS10では、遅延時間分析プログラム500bが、時刻tにおけるR-JNL300dのPBRが30%以上であるか否かを判定し、R-JNL300dのPBRが30%以上である場合には既述の上方修正係数加味処理を実行する(ステップS7)。一方、ステップS10において遅延時間分析プログラム500bがR-JNL300dのPBRが30%以上でないと判定した場合には、次のようなステップS11が実行される。 Next, in step S10, the delay time analysis program 500b determines whether or not the PBR of the R-JNL 300d at time t is 30% or more. If the PBR of the R-JNL 300d is 30% or more, it is described above. The upward correction coefficient adding process is executed (step S7). On the other hand, when the delay time analysis program 500b determines in step S10 that the PBR of the R-JNL 300d is not 30% or more, the following step S11 is executed.
 次にステップS11では、遅延時間分析プログラム500bが、時刻tにおけるM-JNL200dのPBRが40%以上であるか否かを判定し、PBRが40%以上である場合には既述の上方修正係数加味処理を実行する(ステップS7)。一方、ステップS11において遅延時間分析プログラム500bがPBRが40%以上でないと判定した場合には、次のようなステップS11が実行される。 Next, in step S11, the delay time analysis program 500b determines whether or not the PBR of the M-JNL 200d at time t is 40% or more. If the PBR is 40% or more, the above-described upward correction coefficient is determined. A seasoning process is executed (step S7). On the other hand, when the delay time analysis program 500b determines in step S11 that the PBR is not 40% or more, the following step S11 is executed.
 次にステップS12では、遅延時間分析プログラム500bが、時刻tにおけるAPTRが90%以上であるか否かを判定し、APTRが90%以上である場合には既述の上方修正係数加味処理を実行する(ステップS7)。一方、ステップS12において遅延時間分析プログラム500bがAPTRが90%以上でないと判定した場合には、次のようなステップS13が実行される。 Next, in step S12, the delay time analysis program 500b determines whether or not the APTR at time t is 90% or more. If the APTR is 90% or more, the above-described upward correction coefficient addition process is executed. (Step S7). On the other hand, when the delay time analysis program 500b determines in step S12 that the APTR is not 90% or more, the following step S13 is executed.
 このステップS13では、遅延時間分析プログラム500bが遅延時間予測処理を実行する。この遅延時間予測処理では、上方修正係数cを算出し、時刻tの遅延時間から時刻t+1の遅延時間を予測する。 In this step S13, the delay time analysis program 500b executes a delay time prediction process. In this delay time prediction process, the upward correction coefficient c is calculated, and the delay time at time t + 1 is predicted from the delay time at time t.
 具体的には、この遅延時間予測処理では、図5に示すように遅延時間分析プログラム500bがARMAモデルなどの統計モデルに対して時刻t0から時刻tまでの遅延時間を入力する(ステップS131)。次にステップS132では、遅延時間分析プログラム500bが、上記統計モデルで予測された時刻t+1における遅延時間を変数dに格納する。 Specifically, in this delay time prediction process, as shown in FIG. 5, the delay time analysis program 500b inputs a delay time from time t0 to time t to a statistical model such as the ARMA model (step S131). Next, in step S132, the delay time analysis program 500b stores the delay time at time t + 1 predicted by the statistical model in the variable d.
 次にステップS133では、遅延時間分析プログラム500bが、時刻tにおける遅延時間がd以下であるか否かを判定する。この遅延時間分析プログラム500bは、時刻tにおける遅延時間がd以下であると判定された場合には時刻t+1の遅延時間の予測値をdとする一方(ステップS134)、時刻tにおける遅延時間がd以下であると判定されなかった場合には上方修正係数cを遅延時間の予測値に適用する関数fを予測値dに適用し、予測値d’を取得する(ステップS135)。 Next, in step S133, the delay time analysis program 500b determines whether or not the delay time at time t is equal to or less than d. When it is determined that the delay time at time t is equal to or less than d, the delay time analysis program 500b sets the predicted value of the delay time at time t + 1 to d (step S134), while the delay time at time t is d. If it is not determined to be less than or equal to, the function f for applying the upward correction coefficient c to the predicted value of the delay time is applied to the predicted value d to obtain the predicted value d ′ (step S135).
 なお、関数fは、時刻t+1の遅延時間と、時刻tの遅延時間との遅延時間との差に上方修正係数cを掛け合わせる関数であり、例えばd’=f(d)=(d-時刻との遅延時間)×Cにより予測値d’を算出する。次にステップS136では、遅延時間分析プログラム500bが、時刻t+1の遅延時間の予測値をd’とする。 The function f is a function of multiplying the difference between the delay time at the time t + 1 and the delay time at the time t by the upper correction coefficient c, for example, d ′ = f (d) = (d−time). The predicted value d ′ is calculated from (delay time) × C. Next, in step S136, the delay time analysis program 500b sets the predicted value of the delay time at time t + 1 to d '.
 次に、図2に示すステップS14では、遅延時間分析プログラム500bが、時刻t+1の遅延時間が、予め設定されている限界値よりも小さいか否かを判定する。時刻t+1の遅延時間が、当該予め設定されている限界値よりも小さいと判定された場合には、遅延時間分析プログラム500bが、時刻t=t+1と設定した後(ステップS18)、既述のステップS5に戻って実行する。一方、時刻t+1の遅延時間が上記予め設定されている限界値よりも小さいと判定されなかった場合には、遅延時間分析プログラム500bは、ステップS15を実行する。 Next, in step S14 shown in FIG. 2, the delay time analysis program 500b determines whether or not the delay time at time t + 1 is smaller than a preset limit value. If it is determined that the delay time at time t + 1 is smaller than the preset limit value, the delay time analysis program 500b sets time t = t + 1 (step S18), and then the above-described steps. Return to S5 and execute. On the other hand, if it is not determined that the delay time at time t + 1 is smaller than the preset limit value, the delay time analysis program 500b executes step S15.
 このステップS15では、遅延時間分析プログラム500bが、遅延時間及び性能値の将来予測値を出力する。 In this step S15, the delay time analysis program 500b outputs a future prediction value of the delay time and the performance value.
 (6)遅延時間に与える影響(メトリック寄与度)について
 以下では、既述の選定された性能値のうち遅延時間に影響を与える次の性能値について説明する。
(6) Effect on Delay Time (Metric Contribution) The following performance value that affects the delay time among the selected performance values described above will be described below.
性能値25.S-VOL Cache Write Pending Rate
性能値24.S-VOL Processor Busy Rate
性能値16.R-JNL Processor Busy Rate
性能値17.R-JNL Cache Write Pending Rate
性能値8.M-JNL Processor Busy Rate
性能値31.Array Port Transfer Rate
Performance value 25. S-VOL Cache Write Pending Rate
Performance value 24. S-VOL Processor Busy Rate
Performance value 16. R-JNL Processor Busy Rate
Performance value 17. R-JNL Cache Write Pending Rate
Performance value8. M-JNL Processor Busy Rate
Performance value 31. Array Port Transfer Rate
 図6~図10は、それぞれ、遅延時間に与える影響としてのメトリック寄与度の一例を示す。図6に示す例では、S-VOL CWPRのメトリック寄与度が25%に設定されている一方、S-VOLのPBRのメトリック寄与度が20%に設定されている。 6 to 10 each show an example of the metric contribution as an influence on the delay time. In the example shown in FIG. 6, the metric contribution of S-VOL CWPR is set to 25%, while the metric contribution of PBR of S-VOL is set to 20%.
 R-DKC(リストアディスクコントローラ)は、このR-DKCからM-DKCに対して次のジャーナルの転送を要求するコマンドの一例としてPull Requestを発行する。このR-DKCによるPull Requestは、セカンダリボリューム300a(以下「S-VOL」ともいう)へのデータ反映が完了するまで発行されない(ただし、多重度は確保されている)。従って、S-VOL300aへのデータ反映が遅れると、次のPull Requestの発行が遅れるため、S-VOL300aのCWPR及びPBRの値は重要なものとなる。さらにS-VOLのCLPRにキャッシュされたデータの量はC/T Deltaへの影響が大きい。従って、S-VOL300aのCLPRのデータを処理するPBRの影響も次いで大きい。 The R-DKC (restore disk controller) issues a Pull Request as an example of a command for requesting transfer of the next journal from the R-DKC to the M-DKC. This Pull Request by R-DKC is not issued until the data reflection to the secondary volume 300a (hereinafter also referred to as “S-VOL”) is completed (however, the multiplicity is ensured). Therefore, if the data reflection to the S-VOL 300a is delayed, the issue of the next Pull Request is delayed, so the values of CWPR and PBR of the S-VOL 300a become important. Furthermore, the amount of data cached in the S-VOL CLPR has a large effect on C / T Delta. Accordingly, the influence of the PBR that processes the CLPR data of the S-VOL 300a is the second largest.
 図7に示す例では、S-VOL300aのCWPRのメトリック寄与度が25%に設定され、S-VOL300aのPBRのメトリック寄与度が20%に設定され、R-JNL300bのCWPRのメトリック寄与度が18%に設定され、R-JNL300bのPBRのメトリック寄与度が15%に設定されている。 In the example shown in FIG. 7, the CWPR metric contribution of the S-VOL 300a is set to 25%, the PBR metric contribution of the S-VOL 300a is set to 20%, and the CWPR metric contribution of the R-JNL 300b is 18%. %, And the PBR metric contribution of R-JNL300b is set to 15%.
 R-JNL300bのCWPRが大きいときは、M-DKC(マスタディスクコントローラ)から受領したジャーナルデータからの更新データの生成が遅延している。従って、デフォルト(キャッシュ使用オプション=ON)ではCWPRが50%に達するまで(ジャーナルボリュームの)ジャーナルデータは使われない。これにより、ジャーナルデータから更新データへの格上げ遅延は、C/T Delta悪化に繋がるものの、S-VOL格上げに比べると影響度は小さく、PBRも同様に影響度は小さい。 When CWPR of R-JNL300b is large, generation of update data from journal data received from M-DKC (master disk controller) is delayed. Therefore, by default (cache use option = ON), journal data (in the journal volume) is not used until CWPR reaches 50%. As a result, although the upgrade delay from the journal data to the update data leads to the deterioration of C / T Delta, the impact level is small compared to the S-VOL upgrade, and the impact level of PBR is also small.
 図8に示す例では、S-VOL300aのCWPRのメトリック寄与度が25%に設定され、S-VOL300aのPBRのメトリック寄与度が20%に設定され、R-JNL300bのCWPRのメトリック寄与度が18%に設定され、R-JNL300bのPBRのメトリック寄与度が15%に設定され、M-JNL200dのPBRのメトリック寄与度が12%に設定されている。 In the example shown in FIG. 8, the CWPR metric contribution of the S-VOL 300a is set to 25%, the PBR metric contribution of the S-VOL 300a is set to 20%, and the CWPR metric contribution of the R-JNL 300b is 18%. %, The PBR metric contribution of the R-JNL 300b is set to 15%, and the PBR metric contribution of the M-JNL 200d is set to 12%.
 M-JNL200dのPBRが高まるとジャーナルデータの生成に遅延が発生する。ただし、P-VOL書き込みから考えると、C/T Deltaに影響があるようにも見えるが、ジャーナルデータが作成されるまでの時間はC/T Deltaの算出ロジックに含まれない。従って、M-JNL200dをマスタディスクコントローラ(M-DKC)からリストアディスクコントローラ(R-DKC)に送る箇所及びリストアディスクコントローラ(R-DKC)からのPull Request受領時間に影響があるが、S-VOL300a及びR-JNL300bに比べると、C/T Deltaへの影響度は小さいと云える。 If the PBR of M-JNL200d increases, the generation of journal data will be delayed. However, from the viewpoint of P-VOL writing, it appears that C / T Delta is affected, but the time until journal data is created is not included in the calculation logic of C / T Delta. Accordingly, the location where the M-JNL 200d is sent from the master disk controller (M-DKC) to the restore disk controller (R-DKC) and the Pull Request reception time from the restore disk controller (R-DKC) are affected, but the S-VOL 300a Compared to R-JNL300b, the degree of influence on C / T Delta is small.
 図9に示す例では、S-VOL300aのCWPRのメトリック寄与度が25%に設定され、S-VOL300aのPBRのメトリック寄与度が20%に設定され、R-JNL300bのCWPRのメトリック寄与度が18%に設定され、R-JNL300bのPBRのメトリック寄与度が15%に設定され、M-JNL200dのPBRのメトリック寄与度が12%に設定され、APTRのメトリック寄与度が10%に設定されている。 In the example shown in FIG. 9, the CWPR metric contribution of the S-VOL 300a is set to 25%, the PBR metric contribution of the S-VOL 300a is set to 20%, and the CWPR metric contribution of the R-JNL 300b is 18%. %, The R-JNL300b PBR metric contribution is set to 15%, the M-JNL200d PBR metric contribution is set to 12%, and the APTR metric contribution is set to 10% .
 ストレージシステム筐体間リモートパスについては、環境によって性能及び特性が大きく異なるため、予測が困難である。APTRのC/T Deltaへの影響度は最小であるとすべきである(ただし、回線逼迫状況では影響度はかなりある)。 The remote path between storage system enclosures is difficult to predict because the performance and characteristics vary greatly depending on the environment. The degree of influence of APTR on C / T Delta should be minimal (however, the degree of influence is considerable in a tight line situation).
 図10に示す例では、各性能値のメトリック寄与度の確定値をしており、記述のようにS-VOL300aのCWPRのメトリック寄与度が25%に設定され、S-VOL300aのPBRのメトリック寄与度が20%に設定され、R-JNL300bのCWPRのメトリック寄与度が18%に設定され、R-JNL300bのPBRのメトリック寄与度が15%に設定され、M-JNL200dのPBRのメトリック寄与度が12%に設定され、APTRのメトリック寄与度が10%に設定されている。 In the example shown in FIG. 10, the metric contribution of each performance value is determined, and the CWPR metric contribution of the S-VOL 300a is set to 25% as described, and the metric contribution of the PBR of the S-VOL 300a is set. The CWPR metric contribution of the R-JNL300b is set to 18%, the PBR metric contribution of the R-JNL300b is set to 15%, and the PBR metric contribution of the M-JNL200d is The metric contribution of APTR is set to 10%.
 なお、上記メトリック寄与度の各数値は寄与度を遅延時間に反映する変換式で使用するために一例として便宜上設定したものであり、必ずしもこの数値でなければならない訳ではない。本実施形態においては、S-VOL300aのCWPR、S-VOL300aのPBR、R-JNL300bのCWPR、R-JNL300bのPBR、M-JNL200dのPBRの順で優先順位があるという点が重要となる。即ち、本実施形態では、APTRに優先順位があるという点が重要となる。 Note that each numerical value of the metric contribution is set for convenience as an example for use in a conversion formula that reflects the contribution in the delay time, and does not necessarily have to be this numerical value. In the present embodiment, it is important that the priority order is in the order of CWPR of S-VOL 300a, PBR of S-VOL 300a, CWPR of R-JNL 300b, PBR of R-JNL 300b, and PBR of M-JNL 200d. That is, in the present embodiment, it is important that APTR has priority.
 (7)メトリックごとの上方修正係数cの求め方
 図11(A)及び図11(B)は、各メトリックごとの上方修正係数の求め方の一例を示す。既に説明したように経験的に、メトリックに対して注意すべき値域(記述の「注意値域」に相当)が存在している。
(7) How to Obtain Upper Correction Coefficient c for Each Metric FIGS. 11A and 11B show an example of how to obtain the upper correction coefficient for each metric. As already described, empirically, there is a value range (corresponding to the “attention value range” in the description) that should be noted for the metric.
 図11(A)及び図11(B)においては、性能値の種類として、例えば「Processor Busy Rate」を図示している。図11(A)に示すように注意値域は、例えば時刻t1~時刻t2に対応付けられて30%~60%である。これをマッピングすると(即ち、正規化すると)、図11(B)に示すように時刻t0~時刻t1においては傾きが0となり、時刻t1~時刻t2に掛けては傾きを有し、時刻t2以降においては傾きが0となっている。 11A and 11B, for example, “Processor Busy Rate” is illustrated as the type of performance value. As shown in FIG. 11A, the attention value range is, for example, 30% to 60% associated with time t1 to time t2. When this is mapped (ie, normalized), the slope becomes 0 from time t0 to time t1, and has a slope from time t1 to time t2, as shown in FIG. In FIG.
 一方、本実施形態では、性能値の種類として、例えば「Cache Write Pending Rate」を挙げると、注意値域は、例えば時刻t1~時刻t2に対応付けられて40%~80%となる。 On the other hand, in this embodiment, for example, when “Cache Write Pending Rate” is given as the type of performance value, the attention value range is, for example, 40% to 80% associated with time t1 to time t2.
 (8)上方修正係数の適用
 (8-1)上方修正係数の遅延時間への適用
 時刻t+1における遅延時間をDelayTime(t+1)と表すと、この遅延時間は、
DelayTime(t+1)=OriginalDelayTime(t+1)+(OriginalDelayTime(t+1)-DelayTime(t))×CorectioFactor(t+1)
 という計算式を用いて計算される。
(8) Application of upward correction coefficient (8-1) Application of upward correction coefficient to delay time When the delay time at time t + 1 is expressed as DelayTime (t + 1), this delay time is
DelayTime (t + 1) = OriginalDelayTime (t + 1) + (OriginalDelayTime (t + 1) −DelayTime (t)) × CorrectioFactor (t + 1)
It is calculated using the following formula.
 なお、OriginalDelayTimeは、統計的手法で予測した遅延時間の将来値を表している。このような統計的手法とは、例えば、ARMAモデルを適用する、傾きを足していくなどを挙げることができる。ただし、これは、OriginalDelayTime(t+1)>DelayTime(t)となる場合にのみ適用される。 Note that OriginalDelayTime represents the future value of the delay time predicted by a statistical method. Examples of such statistical methods include applying an ARMA model and adding a slope. However, this is applied only when OriginalDelayTime (t + 1)> DelayTime (t).
 (8-2)上方修正係数の求め方
 (8-2-1)各メトリックが上方修正係数cの加味対象となっている場合
 この場合には、CorrectionFactor(t+1)に対して、加味対象の上方修正係数c×メトリック寄与度を、次式のように足し合わせていく。
 (例)S-VOL Cache Write Pending Rate=45%がであり、かつ、M-JNL Processing Busy Rate=35%の場合は次のようになる。
 CorrectionFactor(t+1)=12.5%×25%+16.7%×12%=5.13%
(8-2) How to obtain the upward correction coefficient (8-2-1) When each metric is the target of the upward correction coefficient c In this case, the upper side of the target to be corrected with respect to the CorrectionFactor (t + 1) The correction coefficient c × metric contribution is added as shown in the following equation.
(Example) When S-VOL Cache Write Pending Rate = 45% and M-JNL Processing Busy Rate = 35%, the result is as follows.
CorrectionFactor (t + 1) = 12.5% × 25% + 16.7% × 12% = 5.13%
 (8-2-2)各メトリックが上方修正係数cの加味対象となっていない場合
 この場合には、CorrectionFactor(t+1)=0となる。
(8-2-2) When each metric is not subject to the upward correction coefficient c In this case, CorrectionFactor (t + 1) = 0.
 (9)遅延時間予測の一例
 本実施の形態によるストレージシステム1を含む全体システムの構成などは以上のようであり、次にストレージシステム1における性能劣化予測方法の一例について説明する。
(9) Example of Delay Time Prediction The configuration of the entire system including the storage system 1 according to this embodiment is as described above. Next, an example of a performance deterioration prediction method in the storage system 1 will be described.
 図12~図23は、それぞれ、プライマリストレージ装置200とセカンダリストレージ装置300との間におけるデータ転送に関する遅延時間を予測する様子を示している。図12~図23においては、横軸が時間(日にち)を表す一方、縦軸が左側は遅延時間(図示の「Delay Time」に相当)、右側は各性能値の割合[%]を示している。本実施形態では、最終的に、当該遅延時間が将来的に許容範囲に収まる予定であるか否かに関し、遅延時間分析プログラム500bが、各計測値によって影響を受ける遅延時間を予測しようとしている。 FIG. 12 to FIG. 23 show how the delay time related to data transfer between the primary storage apparatus 200 and the secondary storage apparatus 300 is predicted, respectively. 12 to 23, the horizontal axis represents time (date), while the vertical axis represents the delay time (corresponding to “Delay Time” in the figure), and the right side represents the ratio [%] of each performance value. Yes. In the present embodiment, the delay time analysis program 500b finally tries to predict the delay time affected by each measurement value, regarding whether or not the delay time is scheduled to fall within an allowable range in the future.
 (9-1)第1回目(2015年1月5日時点における予測)
 (9-1-1)前提条件
 本実施の形態では次の3つの前提条件を挙げることができる。第1の前提条件としては、1個のコピーペアで非同期リモートレプリケーションを構成している異を挙げることができる。第2の前提条件としては、過去4日間における1日間隔の遅延時間及び性能値を性能データベース400bに蓄積済みであるものとする。第3の前提条件としては、使用する統計手法は過去値の傾きを現在値に加えるものとする。
(9-1) First time (forecast as of January 5, 2015)
(9-1-1) Preconditions In this embodiment, the following three preconditions can be listed. As a first precondition, there can be mentioned the difference that one copy pair constitutes asynchronous remote replication. As a second precondition, it is assumed that the delay time and the performance value of the one-day interval in the past four days have already been accumulated in the performance database 400b. As a third precondition, it is assumed that the statistical method used adds the slope of the past value to the current value.
 (9-1-2)ステップI(第1回目)
 まず最初に、分析対象期間が決定されるとともに、全データを対象とすることが決定される。許容可能な遅延時間は、例えば40秒に設定され、プライマリストレージ装置200とセカンダリストレージ装置300との間における通信帯域幅は、10MB/秒に設定されている。
(9-1-2) Step I (first time)
First, an analysis target period is determined, and it is determined that all data are to be processed. The allowable delay time is set to 40 seconds, for example, and the communication bandwidth between the primary storage device 200 and the secondary storage device 300 is set to 10 MB / second.
 この場合、性能データベース400b上のAPTRのデータとしては、MB/秒単位のデータを保持することになる。遅延時間分析プログラム500bは、分析時に設定された通信帯域幅に対する割合[%]に変換する。2015年1月1日から2015年1月4日までのデータは、図12に示すようになっている。 In this case, as APTR data on the performance database 400b, data in units of MB / second is held. The delay time analysis program 500b converts it into a ratio [%] to the communication bandwidth set at the time of analysis. The data from January 1, 2015 to January 4, 2015 is as shown in FIG.
 (9-1-3)ステップII(第1回目)
 遅延時間分析プログラム500bは、図13に示す各性能値に関し、2015年1月4日までの値に基づいて、2015年1月5日の値を図示の破線のように予測する。なお、この時点では、図示のように遅延時間(Delay Time)は予測されていない。
(9-1-3) Step II (first time)
The delay time analysis program 500b predicts the value of January 5, 2015 as shown by the broken line in the figure based on the values up to January 4, 2015 for each performance value shown in FIG. At this time, the delay time (Delay Time) is not predicted as illustrated.
 (9-1-4)ステップIII(第1回目)
 遅延時間分析プログラム500bは、各性能値に関して、上方修正係数cを加味するかどうかを判断する。なお、S-VOL300aのProcessor Busy Rateは上方修正係数cを加味する必要があるが、その他の性能値は加味しない。遅延時間分析プログラム500bは、図14に示すように2015年1月5日時点におけるS-VOL300aのProcessor Busy Rateが50%であると予測し、既述の注意値域30~60%の範囲内にあると判定する。
(9-1-4) Step III (first time)
The delay time analysis program 500b determines whether or not to consider the upward correction coefficient c for each performance value. It should be noted that the processor busy rate of the S-VOL 300a needs to take into account the upward correction coefficient c, but does not take into account other performance values. As shown in FIG. 14, the delay time analysis program 500b predicts that the processor busy rate of the S-VOL 300a as of January 5, 2015 is 50%, and falls within the above-mentioned attention range of 30 to 60%. Judge that there is.
 (9-1-5)ステップIV(第1回目)
 遅延時間分析プログラム500bは、図15に示すように、上方修正係数cを次のように算出する。
 CorrectionFactor (2015/1/5)=66.6%×20%=13.3%
(9-1-5) Step IV (first time)
As shown in FIG. 15, the delay time analysis program 500b calculates the upward correction coefficient c as follows.
CorrectionFactor (2015/1/5) = 66.6% × 20% = 13.3%
 なお、「66.6%」は、S-VOL300aのPBR:50%に対する上方修正係数を表しており、「20%」は、S-VOL300aのPBRのメトリック寄与度を表している。遅延時間分析プログラム500bは、予測した遅延時間に対する上方修正係数cを適用する。 It should be noted that “66.6%” represents an upward correction coefficient for PBR of S-VOL 300a: 50%, and “20%” represents the metric contribution of the PBR of S-VOL 300a. The delay time analysis program 500b applies the upward correction coefficient c for the predicted delay time.
 (9-1-6)ステップV(第1回目)
 遅延時間分析プログラム500bは、上記判定の結果、図16にも示すように遅延時間(図示の「Delay Time」)が許容できない値に到達していなかったため、2015年1月6日時点の将来値を予測する(上記ステップIIに戻る)。
(9-1-6) Step V (first time)
As a result of the above determination, the delay time analysis program 500b has not reached an unacceptable value for the delay time ("Delay Time" in the figure) as shown in FIG. 16, so the future value as of January 6, 2015. Is predicted (return to step II above).
 (9-2)第2回目(2015年1月6日時点における予測)
 (9-2-1)前提条件
 第2回目における前提条件は、第1回目の前提条件と同一である。
(9-2) Second time (forecast as of January 6, 2015)
(9-2-1) Preconditions The preconditions in the second round are the same as the preconditions in the first round.
 (9-2-2)ステップII(第2回目)
 遅延時間分析プログラム500bは、各性能値に関して、図17に破線で示すように、2015年1月5日までの値に基づいて2015年1月6日の値を予測する。即ち、遅延時間分析プログラム500bは、予測値も含めて将来値を予測している。
(9-2-2) Step II (second time)
For each performance value, the delay time analysis program 500b predicts the value of January 6, 2015 based on the values up to January 5, 2015, as indicated by the broken line in FIG. That is, the delay time analysis program 500b predicts future values including predicted values.
 (9-2-3)ステップIII(第2回目)
 遅延時間分析プログラム500bは、各性能値に関して上方修正係数cを加味するか否かを判断する。遅延時間分析プログラム500bは、例えばS-VOL300aのCache Write Pending RateとS-VOL300aのProcessor Busy Rateは上方修正係数cを加味する必要があるが、その他の性能値は加味しない。
(9-2-3) Step III (second time)
The delay time analysis program 500b determines whether or not to consider the upward correction coefficient c for each performance value. In the delay time analysis program 500b, for example, the Cache Write Pending Rate of the S-VOL 300a and the Processor Busy Rate of the S-VOL 300a need to consider the upward correction coefficient c, but not other performance values.
 具体的には、遅延時間分析プログラム500bは、S-VOL300aのPBRについて、図18に示すように2015年1月6日時点において55%と予測しているので、既に説明済みの当該注意値域30%~60%の範囲内にある。一方、遅延時間分析プログラム500bは、S-VOLのCWPRについて2015年1月6日時点において45%と予測しているので、既に説明済みの当該注意値域40%~80%の範囲内にある。 Specifically, the delay time analysis program 500b predicts that the PBR of the S-VOL 300a is 55% as of January 6, 2015, as shown in FIG. % To 60%. On the other hand, since the delay time analysis program 500b predicts 45% of the S-VOL CWPR as of January 6, 2015, it is in the range of 40% to 80% of the caution range already described.
 (9-2-4)ステップIV(第2回目)
 そこで、遅延時間分析プログラム500bは、次の計算式を用いて上方修正係数cを算出する。
 CorrectionFactor(2015/1/6)=83.3%×20%+12.5%×25%=19.8%
 遅延時間分析プログラム500bは、この算出結果を用いてt+1時点の遅延時間を予測する。さらに遅延時間分析プログラム500bは、当該予測した遅延時間に対する上方修正係数cを適用する。
(9-2-4) Step IV (second time)
Therefore, the delay time analysis program 500b calculates the upward correction coefficient c using the following calculation formula.
CorrectionFactor (2015/6) = 83.3% × 20% + 12.5% × 25% = 19.8%
The delay time analysis program 500b predicts the delay time at time t + 1 using this calculation result. Further, the delay time analysis program 500b applies the upward correction coefficient c for the predicted delay time.
 (9-2-5)ステップV(第2回目)
 遅延時間分析プログラム500bは、遅延時間(図示の「Delay Time」)に相当)が許容できない値に到達していないと判定したため、図20に示すように2015年1月7日の将来値を予測する(上記ステップIIに戻る)。
(9-2-5) Step V (second time)
Since the delay time analysis program 500b determines that the delay time (corresponding to “Delay Time” in the drawing) has not reached an unacceptable value, the future value of January 7, 2015 is predicted as shown in FIG. (Return to Step II above).
 (9-3)第3回目(2015年1月7日時点における予測)
 (9-3-1)前提条件
 第3回目における前提条件は、第1回目の前提条件及び第2回目の前提条件とそれぞれ同一である。
(9-3) Third time (forecast as of January 7, 2015)
(9-3-1) Preconditions The preconditions for the third time are the same as the first and second preconditions.
 (9-3-2)ステップII(第3回目)
 第3回目では、遅延時間分析プログラム500bは、第2回目とほぼ同様な手法を用いて、性能値に関して、図21に示すように、2015年1月6日までの値に基づいて、図示の破線で示すように2015年1月7日の値を予測する。
(9-3-2) Step II (3rd)
In the third time, the delay time analysis program 500b uses the method almost the same as the second time, and the performance value shown in FIG. 21 is based on the values until January 6, 2015 as shown in FIG. As indicated by the broken line, the value of January 7, 2015 is predicted.
 (9-3-3)ステップIV(第3回目)
 これに基づき、遅延時間分析プログラム500bは、上方修正係数cを算出する。
 CorrectionFactor(2015/1/7)=100%×20%+25%×25%=26.3%
(9-3-3) Step IV (3rd)
Based on this, the delay time analysis program 500b calculates the upward correction coefficient c.
CorrectionFactor (2015/1/7) = 100% × 20% + 25% × 25% = 26.33%
 遅延時間分析プログラム500bは、当該算出した上方修正係数cを用いて、図22において破線で示すようにt+1時点(図示の例では2015年1月7日)の遅延時間を予測する。 The delay time analysis program 500b uses the calculated upward correction coefficient c to predict a delay time at time t + 1 (in the example shown, January 7, 2015) as shown by a broken line in FIG.
 (9-3-4)ステップV(第3回目)
 これに基づき、遅延時間分析プログラム500bは、遅延時間(図示の「Delay Time」に相当)が許容できない値(図示の例では45秒)に到達しているため、終了する。
(9-3-4) Step V (third time)
Based on this, the delay time analysis program 500b ends because the delay time (corresponding to “Delay Time” in the figure) has reached an unacceptable value (45 seconds in the example in the figure).
 (10)本実施の形態の効果等
 以上説明したように本実施の形態によれば、ストレージシステム管理サーバ500では遅延時間分析プログラム500bが、プライマリストレージ装置200の性能値、セカンダリストレージ装置300の性能値、プライマリストレージ装置200とセカンダリストレージ装置300との間の性能値、及び、プライマリストレージ装置200とセカンダリストレージ装置300と間における性能値に対する性能劣化傾向を求めるための傾向係数を考慮して、プライマリストレージ装置200とセカンダリストレージ装置300との間における将来の性能値を導き出している。
(10) Effects of this Embodiment As described above, according to this embodiment, in the storage system management server 500, the delay time analysis program 500b performs the performance value of the primary storage device 200 and the performance of the secondary storage device 300. Value, the performance value between the primary storage device 200 and the secondary storage device 300, and the trend coefficient for obtaining the performance deterioration tendency with respect to the performance value between the primary storage device 200 and the secondary storage device 300, Future performance values between the storage device 200 and the secondary storage device 300 are derived.
 このようにすると、ストレージシステム1上に将来的に特定の性能値が閾値を超えたことを契機として急に性能劣化傾向が変化した場合でも既定の仕様を満たさなくなる時期をより正確に予測することができるようになる。 In this way, it is possible to more accurately predict when the predetermined specification value will not be satisfied even if the tendency of performance deterioration suddenly changes on the storage system 1 when a specific performance value exceeds a threshold value in the future. Will be able to.
 また本実施形態では、遅延時間分析プログラム500bが、予め選定された性能値が既定の注意値域内に該当する場合、注意すべきものとして上方修正係数cを考慮して特定の性能値(本実施形態では「上記データ転送の遅延時間」を例示)が将来推移するであろう予測値を計算する。 Further, in this embodiment, when the performance value selected in advance is within the predetermined attention value range, the delay time analysis program 500b considers the upper correction coefficient c as a thing to be careful and considers a specific performance value (this embodiment). Then, “the above-mentioned delay time of data transfer” is calculated), and a predicted value that will change in the future is calculated.
 このようにすると、当該特定の性能値が将来的に急に性能劣化傾向が変わった場合でも、上方修正係数cを用いて補正することにより将来的な予測値をより正確に求め、性能劣化の時期を正確に提供することができる。 In this way, even if the specific performance value suddenly changes its performance deterioration tendency in the future, the future predicted value can be obtained more accurately by correcting using the upward correction coefficient c, and the performance deterioration The time can be provided accurately.
 また本実施の形態では、性能データ管理サーバ400の性能監視プログラム400aが、プライマリストレージ装置200とセカンダリストレージ装置300との間における予め定められた複数種類の性能値を取得して収集データベース500cに格納する一方、ストレージシステム管理サーバ500aの遅延時間分析プログラム500bが、これら格納済みの性能値を参照し、これら複数種類の性能値のうちから上記特定の性能値により影響を及ぼすおそれのあるものとして予め選定された複数種類の性能値に基づいて前記特定の性能値の将来的な劣化傾向を予測している。 In the present embodiment, the performance monitoring program 400a of the performance data management server 400 acquires a plurality of predetermined performance values between the primary storage apparatus 200 and the secondary storage apparatus 300 and stores them in the collection database 500c. On the other hand, the delay time analysis program 500b of the storage system management server 500a refers to these stored performance values and preliminarily assumes that the specific performance value may be influenced from the plurality of types of performance values. A future deterioration tendency of the specific performance value is predicted based on the plurality of selected performance values.
 このようにすると、遅延時間分析プログラム500bが、当該予め選定された複数種類の性能値に基づいて、当該特定の測定値の一例としてのデータ転送の遅延時間を従来よりも正確に予測することができるようになる。 In this way, the delay time analysis program 500b can predict the data transfer delay time as an example of the specific measurement value more accurately than in the past based on the plurality of performance values selected in advance. become able to.
 本実施形態では、遅延時間分析プログラム500bが、上記予め選定された複数種類の性能値に、各々当該特定の性能値への影響の与えやすさを表す指標としてのメトリック寄与度を設定しており、前記特定の性能値の将来的な予測値の算出に際し、上記複数種類の性能値に、各々対応するメトリック寄与度を掛け合わせて上記将来的な予測値を求める。 In the present embodiment, the delay time analysis program 500b sets the metric contribution as an index representing the ease of influence on the specific performance value for each of the plurality of performance values selected in advance. In calculating the future predicted value of the specific performance value, the future predicted value is obtained by multiplying the plurality of types of performance values by the corresponding metric contributions.
 このようにすると、算出される将来的な予測値が、当該予め選定された複数種類の性能値ごとの特徴も加味された上で算出されるため、より正確に求められるようになる。 In this way, the calculated future predicted value is calculated after taking into account the characteristics for each of the plural types of performance values selected in advance, so that it can be obtained more accurately.
 また本実施形態では、性能監視プログラム400aが、ストレージシステム1とは別途用意された性能データ管理サーバ400に設けられている一方、遅延時間分析プログラム500bが、このストレージシステム1とは別途用意されたストレージシステム管理サーバ500に設けられている。 In the present embodiment, the performance monitoring program 400a is provided in the performance data management server 400 prepared separately from the storage system 1, while the delay time analysis program 500b is prepared separately from the storage system 1. The storage system management server 500 is provided.
 このようにすると、性能監視プログラム400a及び遅延時間分析プログラム500bが、ストレージシステム1内における処理の遅延に影響を受けることなく、必要なタイミングに、当該特定の性能値としてのデータ転送時間を算出することができる。 In this way, the performance monitoring program 400a and the delay time analysis program 500b calculate the data transfer time as the specific performance value at a necessary timing without being affected by the processing delay in the storage system 1. be able to.
 また本実施形態では、性能データ管理サーバ400には、上記性能監視プログラム400aとは別途、既述の複数種類の性能値のうちから予め選定された複数種類の性能値に関する情報が格納されている性能データベース400bが設けられている。 Further, in the present embodiment, the performance data management server 400 stores information on a plurality of types of performance values selected in advance from the above-described plurality of types of performance values, separately from the performance monitoring program 400a. A performance database 400b is provided.
 このようにすると、上述した特定の性能値に影響を与えやすい各性能値を事前に管理し、本実施形態のように当該特定の性能値としてのデータ転送時間の遅延時間に関して将来的な予測を正確に行うことができるようになる。 In this way, each performance value that tends to affect the specific performance value described above is managed in advance, and future prediction is made regarding the delay time of the data transfer time as the specific performance value as in this embodiment. It will be possible to do accurately.
 なお、本実施の形態では、性能監視プログラム400a及び遅延時間分析プログラム500bが、それぞれ、ストレージシステム1とは別途用意された性能データ管理サーバ400やストレージシステム管理サーバ500に設けられていることを例示しているが、これに限られず、ストレージシステム1の内部に同様の機能を搭載させるようにしても良い。 In this embodiment, the performance monitoring program 400a and the delay time analysis program 500b are provided in the performance data management server 400 and the storage system management server 500 that are prepared separately from the storage system 1, respectively. However, the present invention is not limited to this, and the same function may be mounted inside the storage system 1.
 (11)その他の実施形態
 上記実施形態は、本発明を説明するための例示であり、本発明をこれらの実施形態にのみ限定する趣旨ではない。本発明は、その趣旨を逸脱しない限り、様々な形態で実施することができる。例えば、上記実施形態では、各種プログラムの処理をシーケンシャルに説明したが、特にこれにこだわるものではない。従って、処理結果に矛盾が生じない限り、処理の順序を入れ替え又は並行動作するように構成しても良い。
(11) Other Embodiments The above embodiment is an example for explaining the present invention, and is not intended to limit the present invention only to these embodiments. The present invention can be implemented in various forms without departing from the spirit of the present invention. For example, in the above-described embodiment, the processing of various programs is described sequentially, but this is not particularly concerned. Therefore, as long as there is no contradiction in the processing result, the processing order may be changed or the operation may be performed in parallel.
 1……ストレージシステム、2……ネットワーク、100……アプリケーションホスト、200……プライマリストレージ装置、300……セカンダリストレージ装置、400……性能管理サーバ、500……ストレージシステム管理サーバ、500b……遅延時間分析プログラム、500c……収集データベース。 DESCRIPTION OF SYMBOLS 1 ... Storage system, 2 ... Network, 100 ... Application host, 200 ... Primary storage apparatus, 300 ... Secondary storage apparatus, 400 ... Performance management server, 500 ... Storage system management server, 500b ... Delay Time analysis program, 500c ... Collection database.

Claims (12)

  1.  プライマリストレージ装置とセカンダリストレージ装置との間でデータ転送を行うストレージシステムを含む情報システムにおいて、
     前記プライマリストレージ装置と前記セカンダリストレージ装置との間における予め定められた性能値を取得する計測部と、
     前記計測された性能値を分析し、前記プライマリストレージ装置と前記セカンダリストレージ装置との間の性能値の性能劣化傾向を取得する分析部と、
     前記プライマリストレージ装置と前記セカンダリストレージ装置との間の性能値に関する過去の性能劣化傾向を保持する情報記憶部と、
     前記プライマリストレージ装置の性能値、前記セカンダリストレージ装置の性能値、前記プライマリストレージ装置と前記セカンダリストレージ装置との間における性能値、及び、前記取得した前記プライマリストレージ装置と前記セカンダリストレージ装置との間の性能値に対する性能劣化傾向を求めるための傾向係数を考慮して、前記プライマリストレージ装置と前記セカンダリストレージ装置との間における将来の性能値を導き出す予測部と、
     を備えることを特徴とするストレージシステムを含む情報システム。
    In an information system including a storage system that transfers data between a primary storage device and a secondary storage device,
    A measurement unit for obtaining a predetermined performance value between the primary storage device and the secondary storage device;
    Analyzing the measured performance value, and obtaining a performance deterioration tendency of the performance value between the primary storage device and the secondary storage device;
    An information storage unit that holds a past performance deterioration tendency related to a performance value between the primary storage device and the secondary storage device;
    Performance value of the primary storage device, performance value of the secondary storage device, performance value between the primary storage device and the secondary storage device, and between the acquired primary storage device and the secondary storage device In consideration of a trend coefficient for obtaining a performance deterioration tendency with respect to a performance value, a prediction unit for deriving a future performance value between the primary storage device and the secondary storage device,
    An information system including a storage system comprising:
  2.  前記予測部は、予め選定された性能値が既定の注意値域内に該当する場合、注意すべきものとして前記傾向係数を考慮して特定の性能値が将来推移するであろう予測値を計算する請求項1に記載のストレージシステムを含む情報システム。 The prediction unit calculates a prediction value that a specific performance value will change in the future in consideration of the tendency coefficient as a precaution when a performance value selected in advance falls within a predetermined attention value range. An information system including the storage system according to item 1.
  3.  前記計測部は、前記プライマリストレージ装置と前記セカンダリストレージ装置との間における予め定められた複数種類の性能値を取得して前記情報記憶部に格納する一方、
     前記予測部は、前記格納済みの性能値を参照し、前記複数種類の性能値のうちから前記特定の性能値により影響を及ぼすおそれのあるものとして予め選定された複数種類の性能値に基づいて前記特定の性能値の将来的な劣化傾向を予測する請求項2に記載のストレージシステムを含む情報システム。
    While the measurement unit acquires a plurality of predetermined performance values between the primary storage device and the secondary storage device and stores them in the information storage unit,
    The predicting unit refers to the stored performance values, and based on a plurality of types of performance values selected in advance as a risk of affecting the specific performance value from the plurality of types of performance values. The information system including the storage system according to claim 2, wherein a future deterioration tendency of the specific performance value is predicted.
  4.  前記予測部は、
     前記予め選定された複数種類の性能値に、各々当該特定の性能値への影響の与えやすさを表す指標としてのメトリック寄与度を設定しており、前記特定の性能値の将来的な予測値の算出に際し、前記複数種類の性能値に、各々対応するメトリック寄与度を掛け合わせて前記将来的な予測値を求める請求項1に記載のストレージシステムを含む情報システム。
    The prediction unit
    A metric contribution as an index indicating the ease of influence on the specific performance value is set for each of the plurality of performance values selected in advance, and a future predicted value of the specific performance value The information system including the storage system according to claim 1, wherein the future predicted value is obtained by multiplying the plurality of types of performance values by the corresponding metric contributions when calculating the value.
  5.  前記計測部は、前記プライマリストレージ装置及び前記セカンダリストレージ装置とは別途用意されている性能データ管理サーバに設けられている一方、
     前記分析部及び前記予測部は、前記プライマリストレージ装置及び前記セカンダリストレージ装置とは別途用意されているストレージシステム管理サーバに設けられている請求項3に記載のストレージシステムを含む情報システム。
    While the measurement unit is provided in a performance data management server prepared separately from the primary storage device and the secondary storage device,
    The information system including the storage system according to claim 3, wherein the analysis unit and the prediction unit are provided in a storage system management server prepared separately from the primary storage device and the secondary storage device.
  6.  前記性能データ管理サーバには、前記計測部とは別途、既述の複数種類の性能値のうちから予め選定された複数種類の性能値に関する情報が格納されている前記情報記憶部が設けられている請求項5に記載のストレージシステムを含む情報システム。 In addition to the measurement unit, the performance data management server includes the information storage unit that stores information on a plurality of types of performance values selected in advance from the plurality of types of performance values described above. An information system including the storage system according to claim 5.
  7.  プライマリストレージ装置とセカンダリストレージ装置との間でデータ転送を行うストレージシステムにおける性能劣化予測方法において、
     計測部が前記プライマリストレージ装置と前記セカンダリストレージ装置との間における予め定められた性能値を取得する計測ステップと、
     分析部が前記計測された性能値を分析するとともに前記プライマリストレージ装置と前記セカンダリストレージ装置との間の性能値の性能劣化傾向を取得する分析ステップと、
     情報記憶部が前記プライマリストレージ装置と前記セカンダリストレージ装置との間の性能値に関する過去の性能劣化傾向を保持する情報記憶ステップと、
     予測部が前記プライマリストレージ装置の性能値、前記セカンダリストレージ装置の性能値、前記プライマリストレージ装置と前記セカンダリストレージ装置との間における性能値、及び、前記取得した前記プライマリストレージ装置と前記セカンダリストレージ装置との間の性能値に対する性能劣化傾向を求めるための傾向係数を考慮して、前記プライマリストレージ装置と前記セカンダリストレージ装置との間における将来の性能値を導き出す予測ステップと、
     を含むことを特徴とするストレージシステムにおける性能劣化予測方法。
    In a performance degradation prediction method in a storage system that performs data transfer between a primary storage device and a secondary storage device,
    A measurement step in which a measurement unit acquires a predetermined performance value between the primary storage device and the secondary storage device;
    An analysis step in which the analysis unit analyzes the measured performance value and acquires a performance deterioration tendency of the performance value between the primary storage device and the secondary storage device;
    An information storage step in which an information storage unit holds a past performance deterioration tendency related to a performance value between the primary storage device and the secondary storage device;
    A prediction unit configured to calculate the performance value of the primary storage device, the performance value of the secondary storage device, the performance value between the primary storage device and the secondary storage device, and the acquired primary storage device and the secondary storage device; A prediction step for deriving a future performance value between the primary storage device and the secondary storage device in consideration of a trend coefficient for obtaining a performance deterioration tendency with respect to a performance value during
    A method for predicting performance degradation in a storage system, comprising:
  8.  前記予測ステップでは、
     前記予測部が、予め選定された性能値が既定の注意値域内に該当する場合、注意すべきものとして前記傾向係数を考慮して特定の性能値が将来推移するであろう予測値を計算する請求項7に記載のストレージシステムにおける性能劣化予測方法。
    In the prediction step,
    When the performance value selected in advance falls within a predetermined caution value range, the prediction unit calculates a predicted value that a specific performance value will change in the future in consideration of the tendency coefficient as something to be noted. Item 8. A method for predicting performance degradation in a storage system according to Item 7.
  9.  前記計測ステップでは、
     前記計測部が、前記プライマリストレージ装置と前記セカンダリストレージ装置との間における予め定められた複数種類の性能値を取得して前記情報記憶部に格納する一方、
     前記予測ステップでは、
     前記予測部が、前記格納済みの性能値を参照し、前記複数種類の性能値のうちから前記特定の性能値により影響を及ぼすおそれのあるものとして予め選定された複数種類の性能値に基づいて前記特定の性能値の将来的な劣化傾向を予測する請求項8に記載のストレージシステムにおける性能劣化予測方法。
    In the measurement step,
    While the measuring unit obtains a plurality of predetermined performance values between the primary storage device and the secondary storage device and stores them in the information storage unit,
    In the prediction step,
    The prediction unit refers to the stored performance values, and based on a plurality of types of performance values selected in advance as a possibility of affecting the specific performance value from the plurality of types of performance values. 9. The performance deterioration prediction method for a storage system according to claim 8, wherein a future deterioration tendency of the specific performance value is predicted.
  10.  前記予測ステップでは、
     前記予測部が、前記予め選定された複数種類の性能値に、各々当該特定の性能値への影響の与えやすさを表す指標としてのメトリック寄与度を設定しており、前記特定の性能値の将来的な予測値の算出に際し、前記複数種類の性能値に、各々対応するメトリック寄与度を掛け合わせて前記将来的な予測値を求める請求項7に記載のストレージシステムにおける性能劣化予測方法。
    In the prediction step,
    The prediction unit sets a metric contribution as an index representing the ease of influence on the specific performance value for each of the plurality of performance values selected in advance. 8. The method for predicting performance deterioration in a storage system according to claim 7, wherein, in calculating the future predicted value, the future predicted value is obtained by multiplying the plurality of types of performance values by the corresponding metric contributions.
  11.  前記計測部が、前記プライマリストレージ装置及び前記セカンダリストレージ装置とは別途用意されている性能データ管理サーバにおいて動作している一方、
     前記分析部及び前記予測部が、前記プライマリストレージ装置及び前記セカンダリストレージ装置とは別途用意されているストレージシステム管理サーバにおいて動作している請求項9に記載のストレージシステムにおける性能劣化予測方法。
    While the measurement unit is operating in a performance data management server prepared separately from the primary storage device and the secondary storage device,
    The storage system performance degradation prediction method according to claim 9, wherein the analysis unit and the prediction unit operate in a storage system management server prepared separately from the primary storage device and the secondary storage device.
  12.  前記性能データ管理サーバには、前記計測部とは別途、既述の複数種類の性能値のうちから予め選定された複数種類の性能値に関する情報が格納されている前記情報記憶部が設けられている請求項11に記載のストレージシステムにおける性能劣化予測方法。 In addition to the measurement unit, the performance data management server includes the information storage unit that stores information on a plurality of types of performance values selected in advance from the plurality of types of performance values described above. The method for predicting performance degradation in a storage system according to claim 11.
PCT/JP2015/080967 2015-11-02 2015-11-02 Information system including storage system, and performance deterioration prediction method for storage system WO2017077583A1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
PCT/JP2015/080967 WO2017077583A1 (en) 2015-11-02 2015-11-02 Information system including storage system, and performance deterioration prediction method for storage system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2015/080967 WO2017077583A1 (en) 2015-11-02 2015-11-02 Information system including storage system, and performance deterioration prediction method for storage system

Publications (1)

Publication Number Publication Date
WO2017077583A1 true WO2017077583A1 (en) 2017-05-11

Family

ID=58661789

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2015/080967 WO2017077583A1 (en) 2015-11-02 2015-11-02 Information system including storage system, and performance deterioration prediction method for storage system

Country Status (1)

Country Link
WO (1) WO2017077583A1 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021149550A (en) * 2020-03-19 2021-09-27 株式会社日立製作所 Storage system and analytical method of storage system
CN117193675A (en) * 2023-11-08 2023-12-08 上海飞斯信息科技有限公司 Solid-state storage management system based on distributed computing capacity

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014178104A1 (en) * 2013-04-30 2014-11-06 株式会社日立製作所 Computer system and method for assisting analysis of asynchronous remote replication
US20150193323A1 (en) * 2014-01-06 2015-07-09 International Business Machines Corporation Providing a user interface to enable selection of storage systems, components within storage systems and common performance metrics for generating performance metric reports across storage systems and components

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014178104A1 (en) * 2013-04-30 2014-11-06 株式会社日立製作所 Computer system and method for assisting analysis of asynchronous remote replication
US20150193323A1 (en) * 2014-01-06 2015-07-09 International Business Machines Corporation Providing a user interface to enable selection of storage systems, components within storage systems and common performance metrics for generating performance metric reports across storage systems and components

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021149550A (en) * 2020-03-19 2021-09-27 株式会社日立製作所 Storage system and analytical method of storage system
JP7191059B2 (en) 2020-03-19 2022-12-16 株式会社日立製作所 Storage systems and methods of analyzing storage systems
CN117193675A (en) * 2023-11-08 2023-12-08 上海飞斯信息科技有限公司 Solid-state storage management system based on distributed computing capacity
CN117193675B (en) * 2023-11-08 2024-02-02 上海飞斯信息科技有限公司 Solid-state storage management system based on distributed computing capacity

Similar Documents

Publication Publication Date Title
US10642704B2 (en) Storage controller failover system
KR101797836B1 (en) Token-based admission control for replicated writes
CA3054040A1 (en) Synchronously replicating datasets and other managed objects to cloud-based storage systems
US10067840B1 (en) Life expectancy data migration
US10108517B1 (en) Techniques for data storage systems using virtualized environments
US11119663B2 (en) Determining when to perform a data integrity check of copies of a data set by training a machine learning module
JP5938965B2 (en) Node device and processing speed management method of multi-node storage system
JP5286212B2 (en) Remote copy control method and system in storage cluster environment
US9378078B2 (en) Controlling method, information processing apparatus, storage medium, and method of detecting failure
US10795587B2 (en) Storage system and cluster configuration control method
JP2017091456A (en) Control device, control program, and control method
US11128708B2 (en) Managing remote replication in storage systems
US11740823B2 (en) Storage system and storage control method
JP6337598B2 (en) Fault tolerant monitoring device, method and system
WO2017077583A1 (en) Information system including storage system, and performance deterioration prediction method for storage system
US20160274793A1 (en) Storage apparatus, storage control method, and computer-readable recording medium for recording storage control program
US11379144B2 (en) Compliance of replicated data sets
US11481137B2 (en) Data replication techniques
JP2005209055A (en) Method for distributing load of storage
US9483371B2 (en) Storage system, control apparatus, computer product, and control method
JP5941494B2 (en) In-memory management system and in-memory management program
JP2012194867A (en) Storage device and control device
JP2023045641A (en) Storage system and control method
WO2016208014A1 (en) Management computer and method for switching system configuration
JP5636703B2 (en) Blade server

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 15907769

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 15907769

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: JP