WO2017017774A1 - ストレージ監視システムおよびその監視方法 - Google Patents

ストレージ監視システムおよびその監視方法 Download PDF

Info

Publication number
WO2017017774A1
WO2017017774A1 PCT/JP2015/071298 JP2015071298W WO2017017774A1 WO 2017017774 A1 WO2017017774 A1 WO 2017017774A1 JP 2015071298 W JP2015071298 W JP 2015071298W WO 2017017774 A1 WO2017017774 A1 WO 2017017774A1
Authority
WO
WIPO (PCT)
Prior art keywords
information
agent
monitoring
monitoring range
storage device
Prior art date
Application number
PCT/JP2015/071298
Other languages
English (en)
French (fr)
Inventor
旭 二階堂
黒田 沢希
Original Assignee
株式会社日立製作所
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社日立製作所 filed Critical 株式会社日立製作所
Priority to PCT/JP2015/071298 priority Critical patent/WO2017017774A1/ja
Priority to US15/551,249 priority patent/US10585620B2/en
Priority to JP2017530508A priority patent/JP6279816B2/ja
Publication of WO2017017774A1 publication Critical patent/WO2017017774A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0653Monitoring storage devices or systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3024Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a central processing unit [CPU]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3409Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
    • G06F11/3433Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment for load management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3452Performance evaluation by statistical analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0604Improving or facilitating administration, e.g. storage management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/067Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]

Definitions

  • the present invention relates to a storage monitoring system and a monitoring method thereof.
  • Patent Document 1 discloses a storage area network technology provided with a plurality of agents (monitoring devices) in order to distribute and monitor a plurality of different types of devices.
  • Patent Document 1 Using the technique disclosed in Patent Document 1, a large number of different types of devices can be distributed and monitored. However, it is not always possible to cope with a significant increase in the number of components in the device, and it has become difficult to set a large number of components as monitoring targets.
  • an object of the present invention is to make it possible to monitor a plurality of components included in a storage apparatus of a storage system in a distributed manner.
  • a representative storage monitoring system monitoring method is a storage monitoring system monitoring method including a storage device, a manager, and a plurality of agents, wherein the manager includes a plurality of types of components included in the storage device.
  • Information on the first monitoring range by the first agent among the plurality of agents for the first type of components in the first type is stored in association with the information on the first agent, and the first monitoring range To the first agent, and the second monitoring range information by the second agent among the plurality of agents for the plurality of components of the first type corresponds to the information of the second agent. And stores the information on the second monitoring range to the second agent. It is characterized in.
  • a plurality of components included in the storage apparatus of the storage system can be distributed and monitored.
  • program may be used as the subject, but the program is executed by the processor to perform the processing determined by using the memory and the communication port (communication control device).
  • the explanation may be as follows. Further, the processing disclosed with the program as the subject may be processing performed by a computer such as a management server or an information processing apparatus. Further, part or all of the program may be realized by dedicated hardware.
  • the program distribution server includes a CPU (central processing unit) and storage resources, and the storage resources further store a distribution program and a program to be distributed.
  • the distribution program is executed by the CPU, the CPU of the program distribution server distributes the distribution target program to other computers.
  • the computer has input / output devices.
  • input / output devices include a display, a keyboard, and a pointer device, but other devices may be used.
  • serial interfaces and Ethernet interfaces are used as input / output devices, and a display computer having a display, keyboard, or pointer device is connected to these interfaces to display display information.
  • a display computer that performs display and input may be substituted for display and input on the input / output device by transmitting to the computer for display or receiving input information from the display computer.
  • a set of one or more computers that manage the information processing system and display the display information of the present invention may be referred to as a management system.
  • the management computer displays display information
  • the management computer is a management system
  • a combination of the management computer and the display computer is also a management system.
  • processing equivalent to that of the management computer may be realized with a plurality of computers.
  • a plurality of computers when the display computer performs display, a display computer
  • FIG. 1 is a diagram showing an example of a system configuration.
  • a management computer hereinafter also referred to as a manager
  • a monitoring computer hereinafter also referred to as an agent
  • the business computer 103 executes a business application program and reads / writes data in the storage device 104.
  • the performance information of the storage device 104 is performance information resulting from this read / write.
  • the business computer 103 executes a plurality of VMs (virtual machines) 603 in order to execute business application programs.
  • VMs virtual machines
  • VMWare ESX registered trademark
  • a VVOL virtual volume
  • VVOL virtual volume
  • the volume 210 is created or deleted in the storage device 104 as a VVOL.
  • the performance information is based on a combination of the storage device 104 and the volume 210.
  • a protocol converter 108 that converts the protocol of the network 107 (or the business computer 103) and the protocol of the storage device 104 in order to reflect the increase or decrease of the volume 210 due to the volume creation / deletion request to the management of the performance information acquisition target,
  • the volume creation / deletion request may be transferred to the manager 101.
  • the storage apparatus 104 may transfer a volume generation / deletion request to the manager 101.
  • the agent 102 acquires the read / write performance information for the volume 210 according to the monitoring range information 513 and stores it in the performance history information 512.
  • the system includes a plurality of agents 102, and the plurality of volumes 210 are divided into a plurality of monitoring ranges, and each agent 102 acquires performance information of each monitoring range.
  • the monitoring range information 513 does not correspond to the configuration of the volume 210. Therefore, the manager 101 determines a new monitoring range corresponding to the configuration of the volume 210. Then, the monitoring range update is notified to the agent 102.
  • the client computer 105 requests a report on performance information from the manager 101 by a user operation.
  • the manager 101 does not store the performance information itself, manages the agent 102 storing the performance information based on the monitoring range history information 313, and requests performance information from the agent 102 storing the necessary performance information.
  • the requested agent 102 responds to the manager 101 with the performance information stored in the performance history information 512.
  • the manager 101 returns a report based on the returned performance information to the client computer 105.
  • the manager 101 acquires from the monitoring range history information 313 which performance information is stored in which agent 102, and the plurality of agents 102 Requests performance information to the client computer 105 and returns a report that summarizes a plurality of responses from the plurality of agents 102 to the client computer 105.
  • each device in the system is connected by the network 107 and can communicate with each other.
  • the network 107 may be, for example, an Ethernet, the network 107 may include a plurality of networks, and a part of the network 107 may be a fiber channel.
  • the performance information management load can be distributed to a plurality of agents 102 for each monitoring range, and the monitoring range can be updated in accordance with a change in the configuration of performance information acquisition targets.
  • the manager 101 manages the monitoring ranges and histories of the plurality of agents 102, even if the monitoring range is updated by increasing or decreasing the volume 210, it is not necessary to transfer the performance information stored in the agent 102.
  • FIG. 2 is a diagram showing an example of the configuration of the storage apparatus 104.
  • the storage controller 200 reads data from the volume 210 in response to a read request from the business computer 103, transmits read data to the business computer 103, and transfers to the volume 210 in response to a write request from the business computer 103. Controls to write data. Since such an operation is common technical knowledge in the storage technology field, the description of the structure is omitted.
  • the volume 210 stores data in a readable / writable manner, and may be a storage device such as an HDD (hard disk drive), an SSD (solid state drive), or other flash memory, and a part of these storage devices. May be a single volume 210, or a plurality of these storage devices may be a single volume 210.
  • the communication IF (interface) 201 is, for example, an Ethernet interface for communicating with the business computer 103 and the agent 102.
  • the storage controller 200 may have a plurality of communication IFs 201 and may include a fiber channel interface for communicating with the business computer 103.
  • the CPU (processor) 202 executes a program stored in the storage device 203 to transfer information between the communication IF 201, the storage device 203, and the volume 210, and the communication IF 201, the storage device 203, and the volume 210. Judgment is made based on information obtained from either.
  • the storage controller 200 may include a plurality of CPUs 202.
  • the storage device 203 may store a management program 204, storage configuration information 208, and storage performance information 209, or may store programs and information other than these.
  • the request reception unit 205 of the management program 204 is a module that receives a request for creating or deleting a volume 210 from the business computer 103 or the VM management computer 106.
  • the configuration change execution unit 206 is a module that creates or deletes a volume 210 in response to a request received by the request reception unit 205, and registers information on the created volume 210 in the storage configuration information 208 or deletes the volume 210 to be deleted. Is deleted from the storage configuration information 208.
  • the information acquisition IF unit 207 transmits information registered in the storage configuration information 208 and information recorded in the storage performance information 209 to the agent 102 in response to a request from the agent 102.
  • the storage configuration information 208 includes information related to the volume 210, and may include information related to the physical storage device of the volume 210, for example.
  • the storage performance information 209 includes information related to the performance of read / write to the volume 210.
  • the storage performance information 209 may include information on response time from reception of a read IO to reading of data, read IO amount, and write IO amount.
  • Information related to performance such as the read IO amount and the write IO amount may be a cumulative value from a specific time, for example, the startup time of the storage device 104. By using the cumulative value, the amount of data to be recorded can be reduced as compared with the value recorded as the history for each time.
  • FIG. 3 is a diagram showing an example of the configuration of the management computer (manager) 101.
  • the hardware of the manager 101 may be a general computer.
  • the CPU 300 manages the storage device 104 via the agent 102 by executing a program stored in the storage device 302.
  • the communication IF 301 is, for example, an Ethernet interface for communicating with the agent 102, the client computer 105, and the storage device 104. Further, the communication IF 301 may receive a volume creation or deletion request transferred from the protocol converter 108 or the storage apparatus 104.
  • the manager 101 may have a plurality of communication IFs 301.
  • the storage device 302 may store a management program 303, monitoring range history information 313, configuration information 314, and agent list information 317, or may store programs and information other than these.
  • the device registration unit 304 of the management program 303 is a module that registers information as a device of the storage device 104 in the storage information 315 of the configuration information 314.
  • the configuration information acquisition unit 305 is a module that acquires information regarding the volume 210 of the storage apparatus 104 registered by the apparatus registration unit 304, information regarding the communication IF 201, and information regarding the CPU 202.
  • the client request distribution unit 306 is a module that determines the content of the request received from the client computer 105 and distributes it to other modules of the management program 303, which will be further described later with reference to FIG.
  • the request generation unit 307 is a module that specifies a request destination agent 102 and a request period, and generates a request for performance information to the agent 102, which will be further described later with reference to FIG.
  • the agent communication unit 308 is a module that transmits the request generated by the request generation unit 307 to the agent 102, receives a response from the agent 102, and forwards it to the report generation unit 310, which will be further described later with reference to FIG. To do.
  • the monitoring range management unit 309 determines the monitoring range of each of the plurality of agents 102, registers the monitoring range in the monitoring range history information 313, instructs each agent 102 on the monitoring range, and displays the monitoring range on the client computer 105.
  • This information is a module for providing information for the purpose, and will be further described later with reference to FIGS.
  • the report generation unit 310 is a module that generates a report of performance information using the request generation unit 307 and the agent communication unit 308, and provides the report to the client computer 105, which will be further described later with reference to FIG.
  • the alert receiving unit 311 is a module that receives an alert such as an overload in writing performance information from the agent 102, and will be described later with reference to FIG.
  • the agent list management unit 312 is a module that manages the agents 102 that can be assigned to monitoring using the agent list information 317, and will be described later with reference to FIGS.
  • the monitoring range history information 313 is information in which the relationship in monitoring the agent 102 and the volume 210 is recorded as time passes, and will be further described later with reference to FIG.
  • the storage information 315 of the configuration information 314 is information for managing the storage apparatus 104 and will be further described later with reference to FIG.
  • the component information 316 is information for managing components such as the volume 210 in the storage apparatus 104, and will be further described later with reference to FIGS. 8A-8C.
  • the agent list information 317 is information for managing the agents 102 that can be assigned to monitoring, and will be described later with reference to FIG.
  • FIG. 4 is a diagram showing an example of the configuration of the client computer 105.
  • the hardware configuration of the client computer 105 may be a general computer.
  • CPU 400 communicates with manager 101 using communication IF 401 by executing a program stored in storage device 402.
  • the browser program 403 is stored in the storage unit 402, and a value input from the input device (not shown) to the display window of the browser of the display device (not shown) is transmitted to the manager 101. Display the received display information in the browser display window.
  • FIG. 5 is a diagram showing an example of the configuration of the monitoring computer (agent) 102.
  • the hardware of the agent 102 may be a general computer.
  • the CPU 501 communicates with and monitors the storage device 104 by executing a program stored in the storage device 502.
  • the communication IF 500 is, for example, an Ethernet interface for communicating with the manager 101 and the storage apparatus 104.
  • the agent 102 may have a plurality of communication IFs 500.
  • the storage device 502 may store a management program 503, performance history information 512, and monitoring range information 513, or may store programs and information other than these. Further, the performance history information 512 may be stored in a dedicated storage device different from the storage device 502.
  • the scheduler 504 of the management program 503 is a module that activates a set module at a set time interval. For example, the performance acquisition / storage unit 505 is periodically started.
  • the performance acquisition / storage unit 505 refers to the monitoring range information 513 to identify the range of the storage device 104 to be monitored and the component (for example, volume) therein, and the performance information regarding the components in the range within the identified storage device 104 And the obtained performance information is recorded in the performance history information 512, which will be described later with reference to FIG.
  • the manager communication unit 506 is a module that receives a performance information acquisition request from the manager 101 and responds to the manager 101 in response to this request, and will be described later with reference to FIG.
  • the response generation unit 507 is a module that generates a response by referring to the performance history information 512 according to the request received by the manager communication unit 506, and will be described later with reference to FIG.
  • the storage device monitoring unit 508 is a module that calculates a write time for recording in the performance history information 512 of the storage device 502 and determines a write delay according to the write time, which will be further described later with reference to FIG. .
  • the alert notification unit 509 is a module that notifies the manager 101 of an alert based on the determination of the write delay in the storage device monitoring unit 508.
  • the manager request distribution unit 510 is a module that determines the content of the request received from the manager 101 and distributes it to other modules of the management program 503, which will be described later with reference to FIG.
  • the monitoring range update unit 511 is a module that records the monitoring range information notified from the manager 101 in the monitoring range information 513.
  • the performance history information 512 is a history of performance information acquired from the storage apparatus 104, and is information in which performance information is recorded with the storage apparatus 104 to be monitored at each time, and will be further described later with reference to FIG. .
  • the monitoring range information 513 is information for specifying the range of the object to be monitored by the agent 102, and will be described later with reference to FIG. Based on the monitoring range information 513, the agent 102 monitors the storage apparatus 104 and its components.
  • the past performance information of the performance history information 512 may not correspond to the monitoring range information 513, but such past performance information is recorded in the monitoring range history information 313 of the manager 101.
  • FIG. 6 is a diagram showing an example of the configuration of the business computer 103.
  • the hardware of the business computer 103 may be a general computer.
  • a plurality of system images of the VM 603 are stored in the storage device 602, and a program for the hypervisor 604 that manages the VM 603 is stored.
  • the business application program is executed by the CPU 600 using the environment of the VM 603, and reads / writes data to / from the storage apparatus 104 using the communication IF 601.
  • a VVOL may be assigned to each VM 603, and each VVOL may correspond to the volume 210. Therefore, the volume 210 may be created when the VM 603 is generated, and the volume 210 may be deleted when the VM 603 is deleted. Each VM 603 is managed by the VM management computer 106. Therefore, the creation and deletion of the volume 210 may be requested from the business computer 103 to the storage device 104, or may be requested from the VM management computer 106 to the storage device 104.
  • FIG. 7 is a diagram showing an example of the storage information 315.
  • the storage information 315 is stored as the configuration information 314 in the storage device 302 of the manager 101 as described with reference to FIG.
  • the storage ID 700 is information for identifying each storage apparatus 104 in the system.
  • the serial number 701 is a serial number when the storage device 104 is manufactured.
  • the model 702 is a name as a product of each storage apparatus 104.
  • the volume number 703 is the number of volumes 210 of each storage apparatus 104.
  • the update time 704 is the time when the information of each storage device 104 is updated.
  • FIG. 8A is a diagram showing an example of component information 316 related to the volume 210.
  • the component information 316 is stored as the configuration information 314 in the storage device 302 of the manager 101 as described with reference to FIG.
  • the volume ID 800 is information for identifying the volume 210.
  • the storage ID 801 is information for identifying the storage apparatus 104 having the volume 210, and corresponds to the storage ID 700.
  • a capacity 802 is a storage capacity of the volume 210.
  • the allocated capacity 803 is a capacity allocated to the business computer 103 in the storage capacity of the volume 210.
  • the update time 804 is the time when the information of each volume 210 is updated.
  • FIG. 8B is a diagram showing an example of component information 316 related to the CPU 202.
  • the CPU ID 805 is information for identifying the CPU 202.
  • the storage ID 806 is information for identifying the storage device 104 having the CPU 202, and corresponds to the storage ID 700.
  • the update time 807 is the time when the information of the CPU 202 is updated.
  • FIG. 8C is a diagram showing an example of component information 316 related to the communication IF 201.
  • the port ID 808 is information for identifying the port of the communication IF 201.
  • the storage ID 809 is information for identifying the storage apparatus 104 having the communication IF 201, and corresponds to the storage ID 700.
  • An update time 810 is a time when information of each port is updated.
  • volume 210, the CPU 202, and the communication IF 201 are different types of components, and the component information 316 may manage information of other types of components.
  • FIG. 9 is a diagram showing an example of the monitoring range history information 313.
  • the monitoring range history information 313 is stored in the storage device 302 of the manager 101 as described with reference to FIG.
  • the storage ID 900 is information for identifying the storage device 104 and corresponds to the storage ID 700.
  • the primary 901 is information indicating one agent 102 selected from one or a plurality of agents 102 that monitor one storage device 104, and an agent that monitors a monitoring range that is not recorded in the monitoring range history information 313. This information is 102.
  • the port ID 902 is information for identifying the port of the communication IF 201 of the storage apparatus 104.
  • the volume ID 903 is information for identifying the volume 210.
  • the period 904 is information indicating the monitored period represented by the date on which the monitoring is started and the date on which the start is ended.
  • the agent ID 905 is information for identifying the agent 102.
  • the monitoring range history information 313 information indicating which port of which storage device 104 and which volume 210 are monitored by which agent 102 in the order of the period indicated by the period 904 is accumulated as a history.
  • the volume ID 903 “Volume1” to “Volume10000” of the storage device 104 identified by the storage ID “StorageA”
  • the volume 210 identified by is monitored by the agent 102 identified by “Agent1” of the agent ID 905, and the monitored information is recorded in the agent 102 identified by “Agent1”.
  • volume 210 identified by the volume ID “Volume30000” in the storage device 104 identified by the storage ID “StorageA”
  • the volume 210 is not recorded in the monitoring range history information 313.
  • the volume 210 is also monitored by the agent 102 identified by the agent ID “Agent1”.
  • FIG. 10 is a diagram showing an example of the performance history information 512.
  • the performance history information 512 is stored in the storage device 502 of the agent 102 as described with reference to FIG.
  • the recording time 150 is the time when the performance information of the record is recorded.
  • the storage ID 151 is information for identifying the storage device 104, and corresponds to the storage ID 700.
  • the volume ID 152 is information for identifying the volume 210.
  • the performance information related to the target specified by the information of the storage ID 151 and the volume ID 152 is accumulated according to the recording time 150.
  • the total response time 153 to the busy rate 156 is performance information, and the total response time 153 is the time from receiving the read request to responding the read data.
  • the read IO rate 154 and the write IO rate 155 are IO ratios per unit time for each read and write.
  • the busy rate 156 is a ratio of time used for reading or writing during a predetermined time.
  • the performance history information 512 may have a retention period set in advance, and records whose recording time 150 has passed the retention period may be deleted. The same retention period may be set for the monitoring range history information 313, and a record in which the value of the period 904 has passed the retention period may be deleted. When the volume 210 is deleted, none of the records of the performance history information 512 may be deleted, and the performance information regarding the deleted volume 210 may be held until the holding period ends.
  • FIG. 11 is a diagram showing an example of the monitoring range information 513.
  • the monitoring range information 513 is stored in the storage device 502 of the agent 102 as described with reference to FIG.
  • the storage ID 160 is information for identifying the storage device 104, and corresponds to the storage ID 700.
  • the volume ID 161 is information for identifying the volume 210. The target specified by the information of the storage ID 160 and the volume ID 161 is monitored, and the performance information is acquired and recorded in the performance history information 512.
  • the monitoring range information 513 of the agent 102 is changed, and the history of the past monitoring target is managed using the monitoring range history information 313.
  • the example of FIG. 11 is monitoring related to the volume 210, but may include information for identifying components other than the volume 210.
  • FIG. 12 is a diagram showing an example of request information transmitted from the client computer 105 to the manager 101.
  • the example of FIG. 12 is information transmitted when the client computer 105 requests performance information from the manager 101, and is information input by the browser program 403 of the client computer 105.
  • the component for which the performance information is to be acquired is specified by the information for identifying the storage device 104 with the storage ID 250 and the information for identifying the volume 210 with the volume ID 251. Other information may be used as long as the component can be specified.
  • information identifying a component other than the volume 210 may be used instead of the volume ID 251.
  • Period 252 indicates a period for which performance information is acquired.
  • the “total response time” of the metric 1 to 253, the “read IO rate” of the metric 2 to 254, and the “busy rate” of the metric 32 to 255 are the total response time 153 of the performance history information 512 described with reference to FIG. Corresponds to IO rate 154 and busy rate 156.
  • These pieces of information are the metrics of the component identified by the storage ID 250 and the volume ID 251, but may be other metrics as long as they correspond to the metrics recorded in the performance history information 512.
  • “StorageA” which is the same value as FIG. 10 is used, but this is an expression for easy understanding of the explanation, and another value for identifying the same thing. It is good. For this reason, information that can be identified as “StorageA” by the user in the browser may be converted into information that can be identified as “StorageA” actually recorded in the performance history information 512.
  • the total response time is information on one metric of the component called volume 210, it may be called component metric information.
  • FIG. 13 is a diagram showing an example of request information transmitted from the manager 101 to the agent 102.
  • the example of FIG. 13 is information transmitted when the manager 101 requests performance information from the agent 102, and is based on the request information described with reference to FIG. 12, and therefore, the storage ID 351, the volume ID 352, the metric 1 to 354,
  • the metrics 2 to 355 and metric 3 to 356 correspond to the storage ID 250, volume ID 251, metric 1 to 253, metric 2 to 254, and metric 3 to 255, respectively.
  • the agent ID 350 is information for identifying the requested agent 102.
  • a period 353 indicates a period monitored by the agent 102 identified by the agent ID 350 in the period indicated by the period 252.
  • 12 and 13 are examples in which “Agent1” monitors during the period “2014/10 / 1-2014 / 12/31” and other agents 102 monitor during the subsequent period.
  • FIG. 14 is a diagram showing an example of the agent list information 317.
  • the agent list information 317 is information stored in the storage device 302 of the manager 101.
  • the agent ID 450 is information for identifying the agent 102.
  • Allocatable 451 is information indicating whether the monitoring range can be allocated, and is “Y” when the allocation is possible, and “N” when the allocation is not possible.
  • the newly added agent 102 is added to the agent list information 317, and “Y” is set in the assignable 451.
  • the agent 102 to be deleted is deleted from the agent list information 317 after “N” is set in the assignable 451.
  • FIG. 15 is a diagram showing an example of a report request display in the client computer 105.
  • the storage apparatus 104 is selected in the storage apparatus selection 550, information on the selected storage apparatus 104 is displayed in the storage apparatus information 551, and selectable components are displayed in the component selection 552.
  • the component selection 552 when a component is selected by a tab or a check box and the button 553 is pressed, the request information described with reference to FIG.
  • the metrics of the component selected in the component selection 552 may be selectable, or all the metrics of the selected component are requested to the manager 101 and can be selected in the report display described with reference to FIG. Also good.
  • FIG. 16 is a diagram showing an example of report display in the client computer 105.
  • the component selection 552 becomes the performance display 650, and the change in the total response time with the passage of time of the selected volume 210 is displayed as a graph.
  • the performance information may be displayed in a table format other than the graph format, and the performance information of a plurality of metrics may be displayed side by side or displayed in a superimposed manner.
  • FIG. 17 is a diagram showing an example of a processing flow of client request distribution.
  • the client request distribution unit 306 determines whether the client request is an agent monitoring range request (step 751). If it is determined that the client request is a request for the agent monitoring range, the processing proceeds to the agent monitoring range process (step 752). The processing of the agent monitoring range will be further described later with reference to FIG.
  • the client request distribution unit 306 determines whether the client request is a report generation request (step 753). If it is determined that the client request is a report generation request, the process proceeds to report generation processing (step 754). The report generation process will be further described later with reference to FIG.
  • the client request distribution unit 306 determines whether the client request is an agent addition request (step 755). If it is determined that the client request is a request for adding an agent, the process proceeds to an agent addition process (step 756).
  • agent addition process will be further described later with reference to FIG.
  • the client request distribution unit 306 determines whether the client request is an agent deletion request (step 757). If it is determined that the client request is an agent deletion request, the process proceeds to an agent deletion process (step 758). The agent deletion process will be further described later with reference to FIG.
  • the client request distribution unit 306 determines that the client request is not an agent deletion request
  • the client request distribution unit 306 transfers control to the alert reception unit 311.
  • the alert receiving unit 311 accepts a trigger for writing delay to the performance history information 512 from the agent 102 (step 759). Then, in order to eliminate the write delay, the process proceeds to the monitoring range determination / instruction transmission process of the agent 102 (step 760).
  • FIG. 18 is a diagram showing an example of the processing flow of the agent monitoring range.
  • the client computer 105 displays the monitoring range of the agent 102.
  • the monitoring range management unit 309 receives a monitoring range request from the client request distribution unit 306 (step 850), and acquires a record including “Current” in the period 904 of the monitoring range history information 313 (step 851). Then, the acquired record information is transmitted to the client computer 105 (step 852).
  • the acquired record information may be processed for display on the client computer 105. Since the manager 101 determines the monitoring range of the agent 102, the user can confirm the determined state.
  • FIG. 19 is a diagram showing an example of a process flow for generating a report.
  • the request generation unit 307 receives a report generation request from the client request distribution unit 306 (step 950).
  • the report generation request may include the request information described with reference to FIG. Also, the metric information may be omitted and the performance information request for all metrics may be requested.
  • the request generation unit 307 identifies the request destination agent 102 and generates a request according to each request destination agent 102 (step 951). This generation will be further described with reference to FIG.
  • the request generation unit 307 passes the generated request to the agent communication unit 308, and the agent communication unit 308 transmits the request and receives a response to the request (step 952).
  • the agent communication unit 308 combines the received responses and passes them to the report generation unit 310.
  • the report generation unit 310 converts the combined responses into display information to be a report and transmits the display information to the client computer 105.
  • FIG. 20 is a diagram showing an example of a processing flow for request generation. This is the process of step 951 described with reference to FIG. 19, and even if it is the performance information of one component, the performance history information may be distributed to a plurality of agents 102 for each period. In such a case, the request generation unit 307 determines each period and generates a plurality of requests. The request generation unit 307 acquires the storage ID 250, volume ID 251, and period 252 information described with reference to FIG. 12 as report generation range information.
  • the request generation unit 307 searches the monitoring range history information 313, the value of the storage ID 250 matches the value of the storage ID 900, the value of the volume ID 251 is included in the value of the volume ID 903, and the period of the period 252 is the period of the period 904 And find a record that overlaps (step 171).
  • step 172 to step 179 are repeated to determine the performance information acquisition request period to be transmitted to the agent 102 for each retrieved record.
  • the request generation unit 307 sets one of the retrieved records as the processing target in steps 173 to 178 (step 172), and whether the request start time of the period 252 requested from the client computer 105 is earlier than the start time of the period 904. Is determined (step 173). If the request generation unit 307 determines that the performance information acquisition request period is early in step 173, the request generation unit 307 sets the start time of the performance information acquisition request period as the start time of the period 904 (step 174). Is the request start time of the period 252 (step 175).
  • the request generation unit 307 determines whether the request end time of the period 252 requested from the client computer 105 is earlier than the end time of the period 904 (step 176). If the request generation unit 307 determines that the performance information acquisition request period is early in step 176, the request generation unit 307 sets the end time of the performance information acquisition request period as the request end time in period 252; Is the end time of period 904. The request generation unit 307 returns to step 172 if step 173 to step 178 have not been completed for all the retrieved records, and proceeds to step 180 if another record is to be processed.
  • the request generation unit 307 sets the agent ID 350 in FIG. 13 as the information of the agent ID 905, the storage ID 351 as the information of the storage ID 900 (the same applies to the storage ID 250), and the volume ID 352 as the information of the volume ID 251. Then, a request for generating the period 353 as the performance information acquisition request period determined in steps 172 to 179 is generated (step 180). Note that the metric 1 to 354 may be the metric 1 to 253.
  • the port ID 902 may be used instead of the volume ID 903 described above.
  • a record in which the primary 901 is “Y” may be searched instead of the volume ID 903 described above.
  • FIG. 21 is a diagram showing an example of a processing flow for transmitting a request and receiving a response. This is the process of step 952 described with reference to FIG. 19, and the request generated as described with reference to FIG. 20 is transmitted to the agent 102 and a response is received from the agent 102. As described above, since the request is divided into a plurality of performance information acquisition request periods depending on the request period of the period 252, the received responses are combined.
  • step 190 the agent communication unit 308 repeats step 191 for each request generated in step 951, one of the generated requests is targeted (step 190), and the request is transmitted to the agent 102 identified by the agent ID 350 ( Step 191). Return to step 190 until all requests are sent. Here, the transmission of the request in step 191 is repeated without waiting for a response from the agent 102.
  • the agent communication unit 308 waits until a response is received from the agent 102 (step 193). When receiving a response, the agent communication unit 308 determines whether all responses have been received (step 194), and until it determines that all responses have been received. Return to step 193.
  • the response may be, for example, the information described with reference to FIG.
  • the response may include information for identifying the agent 102 that transmitted the response, may include a performance information acquisition request period included in the request, and includes only performance information corresponding to the metric included in the request. May be.
  • the agent communication unit 308 sorts and combines the plurality of received responses in order of oldest performance information acquisition request period or recording time, and passes them to the report generation unit 310 (step 195).
  • FIG. 22 is a diagram showing an example of a processing flow for adding the agent 102. This is the process of step 756 described with reference to FIG.
  • the agent list management unit 312 receives an agent addition request from the client request distribution unit 306 (step 260), adds a record to the agent list information 317, and sets information for identifying the added agent 102 in the agent ID 450.
  • the assignable 451 is set to “Y”.
  • step 262 a process of determining a monitoring range and transmitting instructions of the agent 102 including the added agent 102 is executed (step 262).
  • the monitoring range determination / instruction transmission process of the agent 102 will be further described with reference to FIG. Note that step 262 only reassigns the monitoring range, and performance information accumulated in the past is not transferred between agents 102.
  • FIG. 23 is a diagram showing an example of a processing flow for deleting the agent 102. This is the process of step 758 described with reference to FIG.
  • the agent 102 is deleted, the performance history information 512 accumulated in the deleted agent 102 cannot be used. Therefore, the performance history information 512 that cannot be used due to the deletion is transferred to another agent 102.
  • the monitoring range is reassigned to the agents 102 excluding the agent 102 to be deleted.
  • the agent list management unit 312 receives an agent deletion request from the client request distribution unit 306 (step 360), and can assign a record that matches the information identifying the agent 102 in which the agent ID 450 of the agent list information 317 is deleted 451 Is set to “N” (step 361). As a result, the agent 102 to be deleted from the monitoring range assignment in step 363 is excluded.
  • the agent list management unit 312 notifies the agent 102 to be deleted of the stop of performance information collection (step 362), and executes processing for determining the monitoring range of the agent 102 and transmitting instructions (step 363). In step 363, collection of performance information based on the new assignment is started in each agent 102.
  • the monitoring range determination / instruction transmission process of the agent 102 will be further described with reference to FIG. 24, but the monitoring range is newly assigned to all the agents 102 other than the agent 102 to be deleted. Alternatively, only the monitoring range assigned to the agent 102 to be deleted may be assigned to other than the agent 102 to be deleted.
  • the agent list management unit 312 obtains a list of storage devices 104 in which performance information is recorded in the performance history information 512 of the agent 102 to be deleted or a list corresponding thereto, and targets each storage device 104 in the obtained list. Step 365 to step 369 are repeated (step 364). As a result, the performance history information 512 of the agent 102 to be deleted is transferred to another agent 102.
  • the agent list management unit 312 includes “Current” in the period 904 in the record including the storage ID 900 information of the monitoring range history information 513 that matches the information for identifying the target storage apparatus 104 in Step 364, and The record whose primary 901 is “Y” is searched, and information for identifying the agent 102 of the agent ID 905 of the record obtained by the search is acquired (step 365). Then, it is determined whether the information for identifying the agent 102 to be deleted matches the information for identifying the agent 102 acquired in step 365 (step 366).
  • the agent list management unit 312 determines that they match in step 366, the agent list management unit 312 selects a primary from the agents 102 other than the agent 102 to be deleted, and changes the primary to the selected agent 102 (step 367). As a result, the changed primary also becomes “Current”. If it is determined in step 366 that they do not match, and after step 367 is executed, the performance information of the target storage apparatus 104 in step 364 is changed from the performance history information 512 of the agent 102 to be deleted to “Current” as the primary agent The process proceeds to 102 (step 368).
  • the agent list management unit 312 may issue a transition instruction to the primary agent 102 by the agent 102 to be deleted or “Current”, or the agent 102 to be deleted and “Current” A transition instruction may be issued to both of the primary agents 102.
  • the agent list management unit 312 identifies information for identifying the agent 102 for which the storage ID 900 information in the monitoring range history information 513 matches the information for identifying the storage device 104 targeted in step 364, and the agent ID 905 information is deleted. Information of the agent ID 905 of the record that matches is changed to information for identifying the migration destination agent 102.
  • the agent list management unit 312 returns to step 364 until it determines that all the storage devices 104 in the list acquired in step 364 have been processed, and targets another storage device 104 in the list as a target. If it is determined that the processing has been performed for all, information identifying the agent 102 to be deleted and “N” corresponding thereto are deleted from the agent list information 317.
  • FIG. 24 is a diagram showing an example of a processing flow for determining the monitoring range of the agent 102 and transmitting instructions. This is the processing of step 760 described using FIG. 17, step 262 described using FIG. 22, and step 363 described using FIG.
  • the monitoring range management unit 309 acquires the list of the storage apparatus 104 and the volume 210 and the number of volumes from the configuration information 314 (step 460). Also, the monitoring range management unit 309 acquires a list of agents 102 whose assignable 451 is “Y” from the agent list information 317, and calculates the number of acquired agents 102 (step 461).
  • the monitoring range management unit 309 repeats step 463 and step 464 for each storage device 104 in the list acquired in step 460.
  • the monitoring range management unit 309 calculates the number of volumes per agent 102 by dividing the number of volumes of the storage apparatus 104 targeted in step 462 by the calculated number of agents (step 463).
  • the monitoring range management unit 309 adds a record to the monitoring range history information 313 to allocate the calculated number of volumes to each acquired agent 102, and sets the storage device 104 targeted for the storage ID 900 of the added record.
  • Information for identifying is set, information for identifying the number of volumes calculated in the volume ID 903 is set, and information for identifying the acquired agent 102 is set in the agent ID 905 (step 464).
  • “Current” of the record including “Current” in the period 904 is a clock in the manager 101 that is not shown. “Current” may be set as the end time of the period 904 of the added record. Alternatively, the primary agent 102 may be selected and “Y” may be set for the primary 901.
  • the monitoring range management unit 309 returns to step 462 until all the storage apparatuses 104 in the list acquired in step 460 are processed (step 465). When all the storage apparatuses 104 are processed, the volume assigned to each of the acquired agents 102 is displayed. Notification is made (step 466). Since the number of volumes of the storage device 104 targeted in step 462 is divided and allocated by the calculated number of agents, a plurality of agents 102 for which one storage device 104 has been calculated are targeted for monitoring. .
  • the agent is based on another parameter of the volume, for example, performance information of the volume.
  • the agent 102 may be assigned. Further, the agent 102 may be assigned based on the load of the agent 102, for example, the load of the CPU 501 and the read / write time of the storage device 502, instead of the parameters related to the volume. Further, the monitoring range may be determined so as to be uniform within a preset error range.
  • volume 210 when the volume 210 is created or deleted, the processing described with reference to FIG. 24 may be executed.
  • FIG. 25 is a diagram showing an example of the processing flow of the agent 102.
  • the agent 102 acquires and records performance information from the storage device 104, and executes processing in response to a request from the manager 101.
  • the scheduler 504 is activated, and the performance information acquisition / storage processing from the storage apparatus 104 is started based on the schedule of the scheduler 504. This process will be further described with reference to FIG.
  • the manager request distribution unit 510 of the agent 102 receives a request from the manager 101 (step 581), and determines whether the manager request is a performance acquisition (step 582). If it is determined that the manager request is a performance acquisition, a performance acquisition request acceptance process is executed (step 583). This process will be further described with reference to FIG. If the manager request distribution unit 510 of the agent 102 determines that the manager request is not performance acquisition, it receives the monitoring range update notification from the manager 101 described in step 466 of FIG. 24, and the monitoring range update unit 511 receives the monitoring range. Information 513 is updated (step 584).
  • FIG. 26 is a diagram showing an example of a processing flow for acquiring and storing performance information.
  • the scheduler 504 starts execution of the performance acquisition / storage unit 505 based on a preset interval (step 680).
  • the performance acquisition / storage unit 505 acquires the storage ID 160 and volume ID 161 information of the monitoring range information 513 (step 681), and performs steps from step 683 to each storage device 104 specified by the identification information of the storage ID 160. Repeat the process up to 688.
  • the performance acquisition / storage unit 505 acquires the performance information of the volume 210 specified by the identification information of the volume ID 161 from the target storage apparatus 104 in Step 682 (Step 683).
  • the agent 102 may transmit to the storage apparatus 104 a packet including the storage apparatus 104 corresponding to the information of the storage ID 160 as a destination and including the information of the volume ID 161 as a monitoring range.
  • This destination may be the storage ID 160 information itself, or information obtained by converting the storage ID 160 information.
  • the agent 102 may acquire in advance the IP address of each storage device 104, a unique number that can be used for generating an address, etc. from the manager 101, or these addresses from each storage device 104. You may acquire the information about.
  • the storage device monitoring unit 508 that monitors the performance of the storage device 502 records the start time of writing the performance information acquired in step 683 into the performance history information 512 of the storage device 502 (step 684). Then, the performance acquisition / storage unit 505 writes the acquired performance information into the performance history information 512 (step 685).
  • step 685 the storage device monitoring unit 508 records the write end time (step 686), and calculates the write time from the difference between the start time recorded in step 684 and the end time recorded in step 686 (step 686). 687). Then, the write time calculated in step 687 is added to the total write time (step 688).
  • the performance acquisition / storage unit 505 returns to step 682 until all storage devices 104 specified by the identification information of the storage ID 160 acquired in step 681 are processed (step 690), and processes another storage device 104 for processing. And
  • the storage device monitoring unit 508 determines whether or not the total write time added in step 688 exceeds a preset threshold (step) 691). If it is determined that the threshold value is not exceeded, the processing is terminated. If it is determined that the threshold value is exceeded, the storage device monitoring unit 508 requests the alert notification unit 509 to notify the alert (step 692), and the alert notification unit 509 An alert is sent to 101 (step 693).
  • the threshold value of step 691 may be 50% of the execution interval of step 680, for example.
  • the alert is notified based on the write time.
  • the present invention is not limited to this, and the alert is based on other information related to the writing of the performance history information 512 of the storage device 502 of the agent 102. May be notified.
  • FIG. 27 is a diagram showing an example of a processing flow of a performance acquisition request. This is the processing of step 583 described with reference to FIG. 25, and is executed in response to the request of step 191 described with reference to FIG.
  • the manager communication unit 506 accepts the information request described with reference to FIG. 13 from the manager 101 (step 780) and passes it to the response generation unit 507.
  • the response generation unit 507 matches the information for identifying the storage device 104 and the information for identifying the volume 210 included in the manager request with the information of the storage ID 151 and the information of the volume ID 152, and the recording time 150 during the request period of the manager request.
  • a record including the value of is searched, a response is generated from the record found by the search (step 781), and the result is passed to the manager communication unit 506.
  • the manager communication unit 506 transmits a response to the manager 101 (step 782).
  • the performance information acquisition load can be distributed to a plurality of agents 102 for each monitoring range, and the monitoring range can be updated according to a change in the configuration of the performance information acquisition target.
  • the manager 101 manages performance information stored in a plurality of agents 102, it is not necessary to migrate performance information stored in the agent 102 even if the agent 102 is added and the monitoring range is updated. Since the manager 101 can identify the agent 102 storing the performance information necessary for generating the report, no load is applied to other agents 102. Further, the client computer 105 can receive a performance information report response by a simple request as if performance information is stored in one device.
  • Management computer (manager)
  • Monitoring computer (agent)
  • Commercial computer 104: Storage device 105: Client computer 210: Volume 313: Monitoring range history information 512: Performance history information 513: Monitoring range information

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Computing Systems (AREA)
  • Human Computer Interaction (AREA)
  • Computer Hardware Design (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Debugging And Monitoring (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Computer And Data Communications (AREA)

Abstract

ストレージ装置とマネージャと複数のエージェントを含むストレージ監視システムの監視方法であって、前記マネージャは、前記ストレージ装置に含まれる複数種類のコンポーネントの中の第1の種類の複数コンポーネントに対する前記複数のエージェントの中の第1のエージェントによる第1の監視範囲の情報を前記第1のエージェントの情報と対応付けて記憶し、前記第1の監視範囲の情報を前記第1のエージェントに通知し、前記第1の種類の複数コンポーネントに対する前記複数のエージェントの中の第2のエージェントによる第2の監視範囲の情報を前記第2のエージェントの情報と対応付けて記憶し、前記第2の監視範囲の情報を前記第2のエージェントに通知する。

Description

ストレージ監視システムおよびその監視方法
 本発明は、ストレージ監視システムおよびその監視方法に関するものである。
 近年のストレージシステムの大規模化にともない、ストレージ装置の台数およびストレージ装置内のボリュームなどを含むコンポーネント数は著しく増加している。このようなストレージシステムを監視する負荷も増大するため、複数の監視装置により分散して監視することも知られている。
 特許文献1には、異なるタイプの複数のデバイスを分散して監視するため、複数のエージェント(監視装置)を設けたストレージエリアネットワークの技術が開示されている。
米国特許第7469284号明細書
 特許文献1に開示された技術を用いれば、異なるタイプの多数のデバイスを分散して監視することはできる。しかしながら、デバイス内のコンポーネント数の著しい増加に必ずしも対応できるとは限らず、多量のコンポーネントを監視対象として設定することも困難となってきている。
 そこで、本発明の目的は、ストレージシステムのストレージ装置に含まれる複数のコンポーネントを分散して監視可能にすることにある。
 本発明に係る代表的なストレージ監視システムの監視方法は、ストレージ装置とマネージャと複数のエージェントを含むストレージ監視システムの監視方法であって、前記マネージャは、前記ストレージ装置に含まれる複数種類のコンポーネントの中の第1の種類の複数コンポーネントに対する前記複数のエージェントの中の第1のエージェントによる第1の監視範囲の情報を前記第1のエージェントの情報と対応付けて記憶し、前記第1の監視範囲の情報を前記第1のエージェントに通知し、前記第1の種類の複数コンポーネントに対する前記複数のエージェントの中の第2のエージェントによる第2の監視範囲の情報を前記第2のエージェントの情報と対応付けて記憶し、前記第2の監視範囲の情報を前記第2のエージェントに通知することを特徴とする。
 本発明によれば、ストレージシステムのストレージ装置に含まれる複数のコンポーネントを分散して監視可能になる。
システムの構成の例を示す図である。 ストレージ装置の構成の例を示す図である。 マネージャの構成の例を示す図である。 クライアント計算機の構成の例を示す図である。 エージェントの構成の例を示す図である。 業務用計算機の構成の例を示す図である。 ストレージ情報の例を示す図である。 ボリュームに関するコンポーネント情報の例を示す図である。 CPUに関するコンポーネント情報の例を示す図である。 通信IFに関するコンポーネント情報の例を示す図である。 監視範囲履歴情報の例を示す図である。 性能履歴情報の例を示す図である。 監視範囲情報の例を示す図である。 クライアント計算機からマネージャへ送信される要求の情報の例を示す図である。 マネージャからエージェントへ送信される要求の情報の例を示す図である。 エージェント一覧情報の例を示す図である。 クライアント計算機におけるレポート要求の表示の例を示す図である。 クライアント計算機におけるレポート表示の例を示す図である。 クライアント要求振分の処理フローの例を示す図である。 エージェント監視範囲の処理フローの例を示す図である。 レポート生成の処理フローの例を示す図である。 要求生成の処理フローの例を示す図である。 要求を送信し応答を受信する処理フローの例を示す図である。 エージェントを追加する処理フローの例を示す図である。 エージェントを削除する処理フローの例を示す図である。 エージェントの監視範囲の決定・指示送信の処理フローの例を示す図である。 エージェントの処理フローの例を示す図である。 性能情報取得・格納の処理フローの例を示す図である。 性能取得要求の処理フローの例を示す図である。
 以下の説明では「aaaテーブル」、「aaaリスト」、「aaaDB」、「aaaキュー」などの表現にて本発明の情報を説明するが、これら情報は必ずしもテーブル、リスト、DB(データベース)、キューなどのデータ構造に限定されるものではなく、これらのデータ構造以外で表現されていてもよい。そのため、データ構造に依存しないことを示す目的で「aaaテーブル」、「aaaリスト」、「aaaDB」、「aaaキュー」などについて「aaa情報」と呼ぶことがある。さらに、各情報の内容を説明する際に、「識別情報」、「識別子」、「名」、「名前」、「ID」という表現を用いるが、これらについては、互いに置換が可能である。
 以下の説明では「プログラム」を主語として説明を行う場合もあるが、プログラムはプロセッサによって実行されることで定められた処理をメモリ及び通信ポート(通信制御デバイス)を用いながら行うため、プロセッサを主語とした説明としてもよい。また、プログラムを主語として開示された処理は管理サーバなどの計算機、情報処理装置が行う処理としてもよい。また、プログラムの一部または全ては専用ハードウェアによって実現されてもよい。
 また、各種プログラムはプログラム配布サーバや、計算機が読み取り可能な記憶メディアによって各計算機にインストールされてもよい。この場合、プログラム配布サーバはCPU(中央処理装置)と記憶資源を含み、記憶資源はさらに配布プログラムと配布対象であるプログラムを記憶している。そして、配布プログラムをCPUが実行することで、プログラム配布サーバのCPUは配布対象のプログラムを他の計算機に配布する。
 計算機は入出力デバイスを有する。入出力デバイスの例としてはディスプレイとキーボードとポインタデバイスが考えられるが、これ以外のデバイスであってもよい。また、入出力デバイスの代替としてシリアルインターフェースやイーサーネットインターフェース(イーサネットは登録商標)を入出力デバイスとし、これらのインターフェースにディスプレイまたはキーボードまたはポインタデバイスを有する表示用計算機を接続し、表示用情報を表示用計算機に送信したり、入力用情報を表示用計算機から受信したりすることにより、表示および入力を行う表示用計算機が入出力デバイスでの表示及び入力の代替となってもよい。
 以下の説明では、情報処理システムを管理し、本願発明の表示用情報を表示する一つ以上の計算機の集合を管理システムと呼ぶことがある。管理計算機が表示用情報を表示する場合は管理計算機が管理システムである、また、管理計算機と表示用計算機の組み合わせも管理システムである。また、管理処理の高速化や高信頼化のために複数の計算機で管理計算機と同等の処理を実現してもよく、この場合は複数の計算機(表示を表示用計算機が行う場合は表示用計算機も含め)が管理システムである。
 図1はシステムの構成の例を示す図である。このシステムは、管理計算機(以下、マネージャとも呼ぶ)101と監視用計算機(以下、エージェントとも呼ぶ)102は、ストレージ装置104の性能情報を取得してクライアント計算機105へ提供するものである。業務用計算機103は業務アプリケーションプログラムを実行して、ストレージ装置104のデータをリードライトする。ストレージ装置104の性能情報は、このリードライトに起因する性能情報である。
 業務用計算機103では、業務アプリケーションプログラムを実行するために、複数のVM(仮想マシン)603を実行する。例えばVMWare ESX(登録商標)をハイパーバイザとすることにより、VM603毎にVVOL(仮想ボリューム)を割当て、管理ソフトのvSphere(登録商標)が提供する機能を利用してVVOLを作成したり削除したりできる。そして、業務用計算機103あるいはVM管理用計算機106からの要求により、VVOLとしてストレージ装置104内にボリューム210を生成したり削除したりする。
 1つのVM603は1つのボリューム210のデータをリードライトしてよいため、性能情報はストレージ装置104とボリューム210の組合せが単位となる。性能情報の取得対象の管理へボリューム生成・削除の要求によるボリューム210の増減を反映させるため、ネットワーク107(あるいは業務用計算機103)のプロトコルとストレージ装置104のプロトコルとを変換するプロトコルコンバータ108が、ボリューム生成・削除の要求をマネージャ101へ転送してもよい。また、プロトコルコンバータ108の必要がないシステムあるいはストレージ装置104がプロトコルコンバータ108を内蔵するシステムでは、ストレージ装置104がボリューム生成・削除の要求をマネージャ101へ転送してもよい。
 エージェント102は、監視範囲情報513にしたがって、このようなボリューム210に対するリードライトの性能情報を取得して性能履歴情報512に格納する。ここで、システムは複数のエージェント102を有し、複数のボリューム210は複数の監視範囲に分割され、各監視範囲の性能情報を各エージェント102が取得する。ボリューム生成・削除の要求により性能情報の取得対象のボリューム210が増減すると、監視範囲情報513がボリューム210の構成と対応しなくなるため、ボリューム210の構成と対応する新たな監視範囲をマネージャ101は決定し、監視範囲更新をエージェント102へ通知する。
 クライアント計算機105はユーザの操作により性能情報に関するレポートをマネージャ101へ要求する。マネージャ101は性能情報そのものを格納しておらず、性能情報を格納しているエージェント102を監視範囲履歴情報313により管理し、必要な性能情報を格納しているエージェント102に性能情報を要求する。要求されたエージェント102はマネージャ101へ性能履歴情報512に格納された性能情報を応答する。マネージャ101はクライアント計算機105へ応答された性能情報に基づくレポートを応答する。
 クライアント計算機105の要求するレポートが複数のエージェントに格納された性能情報にまたがる場合、マネージャ101はどの性能情報がどのエージェント102に格納されているかを監視範囲履歴情報313から取得し、複数のエージェント102へ性能情報を要求し、複数のエージェント102からの複数の応答をまとめたレポートをクライアント計算機105へ応答する。
 なお、システム内の各装置はネットワーク107により接続され、互いに通信が可能である。ネットワーク107は例えばイーサネットでもよいし、ネットワーク107は複数のネットワークを含んでもよく、ネットワーク107の一部はファイバチャネルであってもよい。
 このシステムにより、性能情報の管理の負荷を監視範囲ごとに複数のエージェント102へ分散することができ、性能情報の取得対象の構成の変更に応じて監視範囲を更新できる。また、複数のエージェント102の監視範囲やその履歴をマネージャ101が管理するため、ボリューム210の増減により監視範囲が更新されても、エージェント102に格納された性能情報を移行する必要はない。
 図2はストレージ装置104の構成の例を示す図である。ストレージコントローラ200は、業務用計算機103からのリード要求に応じてボリューム210からデータをリードして、業務用計算機103へリードデータを送信し、業務用計算機103からのライト要求に応じてボリューム210へデータをライトするための制御を行う。このような動作は、ストレージ技術分野の技術常識であるので、その構造に関する説明を省略する。
 ボリューム210はデータをリードライト可能に格納するものであり、例えばHDD(ハードディスドライブ)、SSD(ソリッドステートドライブ)、その他のフラッシュメモリなどのストレージデバイスであってもよく、これらストレージデバイスの一部を1つのボリューム210としてもよいし、これらストレージデバイスの複数を1つのボリューム210としてもよい。
 通信IF(インターフェース)201は業務用計算機103やエージェント102と通信するための例えばイーサーネットインターフェースである。ストレージコントローラ200は通信IF201を複数有してもよく、業務用計算機103と通信するためのファイバチャネルインターフェースを含んでもよい。
 CPU(プロセッサ)202は、記憶装置203に格納されたプログラムを実行することにより、通信IF201と記憶装置203とボリューム210との間で情報を転送したり、通信IF201と記憶装置203とボリューム210のいずれかから取得した情報に基づき判定したりする。ストレージコントローラ200はCPU202を複数有してもよい。
 記憶装置203は、管理プログラム204、ストレージ構成情報208、ストレージ性能情報209が格納されてもよく、これら以外のプログラムと情報が格納されてもよい。管理プログラム204の要求受付部205は業務用計算機103あるいはVM管理用計算機106からのボリューム210の作成または削除要求を受け付けるモジュールである。
 構成変更実行部206は要求受付部205の受け付けた要求に応じてボリューム210を作成または削除するモジュールであり、作成されるボリューム210の情報をストレージ構成情報208へ登録したり、削除されるボリューム210の情報をストレージ構成情報208から削除したりする。情報取得IF部207はエージェント102からの要求に応じてストレージ構成情報208に登録されている情報やストレージ性能情報209に記録されている情報をエージェント102へ送信する。
 ストレージ構成情報208はボリューム210に関する情報を含み、例えばボリューム210の物理的なストレージデバイスに関する情報を含んでもよい。ストレージ性能情報209はボリューム210へのリードライトの性能に関する情報を含み、例えばリードIOを受け付けてからデータをリードするまでの応答時間、リードIO量、ライトIO量の情報を含んでもよい。リードIO量とライトIO量などの性能に関する情報は、特定の時刻、例えばストレージ装置104の起動時刻からの累積値であってもよい。累積値とすることにより、時間ごとの履歴として記録した値と比べて、記録するデータ量を減らすことができる。
 図3は管理用計算機(マネージャ)101の構成の例を示す図である。マネージャ101のハードウェアは一般的な計算機であってもよい。CPU300は、記憶装置302に格納されたプログラムを実行することにより、エージェント102を介してストレージ装置104を管理する。通信IF301は、エージェント102、クライアント計算機105、ストレージ装置104と通信するための例えばイーサーネットインターフェースである。また、通信IF301はプロトコルコンバータ108やストレージ装置104から転送されるボリュームの作成や削除の要求を受信してもよい。そして、マネージャ101は通信IF301を複数有してもよい。
 記憶装置302は、管理プログラム303、監視範囲履歴情報313、構成情報314、エージェント一覧情報317が格納されてもよく、これら以外のプログラムと情報が格納されてもよい。管理プログラム303の装置登録部304は、構成情報314のストレージ情報315へストレージ装置104の装置としての情報を登録するモジュールである。構成情報取得部305は、装置登録部304により登録されたストレージ装置104のボリューム210に関する情報、通信IF201に関する情報、CPU202に関する情報を取得するモジュールである。
 クライアント要求振分部306は、クライアント計算機105から受け付けた要求の内容を判定し、管理プログラム303の他のモジュールへ振り分けるモジュールであり、図17を用いて後でさらに説明する。要求生成部307は、要求先のエージェント102と要求する期間を特定し、エージェント102への性能情報の要求を生成するモジュールであり、図20を用いて後でさらに説明する。エージェント通信部308は、要求生成部307の生成した要求をエージェント102へ送信し、エージェント102からの応答を受信してレポート生成部310へ転送するモジュールであり、図21を用いて後でさらに説明する。
 監視範囲管理部309は、複数のエージェント102それぞれの監視範囲を決定し、監視範囲履歴情報313へ登録するとともに、各エージェント102へ監視範囲を指示し、また、クライアント計算機105へ監視範囲を表示するための情報を提供するモジュールであり、図18、22-24を用いて後でさらに説明する。レポート生成部310は、要求生成部307とエージェント通信部308を用いて性能情報のレポートを生成し、クライアント計算機105へ提供するモジュールであり、図19を用いて後でさらに説明する。
 アラート受信部311は、性能情報の書き込みにおける過負荷などのアラートをエージェント102から受信するモジュールであり、図26を用いて後で説明する。エージェント一覧管理部312は、エージェント一覧情報317を使用して、監視に割り当て可能なエージェント102を管理するモジュールであり、図22、23を用いて後でさらに説明する。
 監視範囲履歴情報313は、エージェント102とボリューム210の監視における関係を時刻の経過にしたがって記録された情報であり、図9を用いて後でさらに説明する。構成情報314のストレージ情報315は、ストレージ装置104を管理するための情報であり、図7を用いて後でさらに説明する。コンポーネント情報316は、ストレージ装置104内のボリューム210などのコンポーネントを管理するための情報であり、図8A-8Cを用いて後でさらに説明する。エージェント一覧情報317は、監視に割り当て可能なエージェント102を管理するための情報であり、図14を用いて後で説明する。
 図4はクライアント計算機105の構成の例を示す図である。クライアント計算機105のハードウェア構成は一般的な計算機であってもよい。CPU400は、記憶装置402に格納されたプログラムを実行することにより、通信IF401を使用してマネージャ101と通信する。この例では、記憶措置402にブラウザプログラム403が格納されており、図示を省略した入力デバイスから図示を省略した表示デバイスのブラウザの表示ウィンドウへ入力された値をマネージャ101へ送信し、マネージャ101から受信した表示情報をブラウザの表示ウィンドウへ表示する。
 図5は監視用計算機(エージェント)102の構成の例を示す図である。エージェント102のハードウェアは一般的な計算機であってもよい。CPU501は、記憶装置502に格納されたプログラムを実行することにより、ストレージ装置104と通信して監視する。通信IF500は、マネージャ101およびストレージ装置104と通信するための例えばイーサーネットインターフェースである。エージェント102は複数の通信IF500を有してもよい。
 記憶装置502は、管理プログラム503、性能履歴情報512、監視範囲情報513が格納されてもよく、これら以外のプログラムと情報が格納されてもよい。また、性能履歴情報512は記憶装置502とは別の専用の記憶装置に格納されてもよい。管理プログラム503のスケジューラ504は、設定されたモジュールを設定された時間間隔で起動するモジュールであり、例えば性能取得・格納部505を定期的に起動する。
 性能取得・格納部505は、監視範囲情報513を参照して監視対象のストレージ装置104とその中のコンポーネント(例えばボリューム)の範囲を特定し、特定したストレージ装置104内の範囲のコンポーネントに関する性能情報を取得し、取得した性能情報を性能履歴情報512へ記録するモジュールであり、図26を用いて後で説明する。マネージャ通信部506は、マネージャ101からの性能情報の取得要求を受け付け、この要求に応じてマネージャ101へ応答するモジュールであり、図27を用いて後で説明する。
 応答生成部507は、マネージャ通信部506で受け付けた要求に応じて、性能履歴情報512を参照し、応答を生成するモジュールであり、図27を用いて後で説明する。記憶装置監視部508は、記憶装置502の性能履歴情報512へ記録する際の書き込み時間を算出し、書込み時間に応じて書き込み遅延を判定するモジュールであり、図26を用いて後でさらに説明する。アラート通知部509は、記憶装置監視部508における書き込み遅延の判定に基づいて、マネージャ101へアラートを通知するモジュールである。
 マネージャ要求振分部510は、マネージャ101から受け付けた要求の内容を判定し、管理プログラム503の他のモジュールへ振り分けるモジュールであり、図25を用いて後で説明する。監視範囲更新部511は、マネージャ101から通知された監視範囲の情報を監視範囲情報513へ記録するモジュールである。
 性能履歴情報512は、ストレージ装置104から取得した性能情報の履歴であって、時刻ごとに監視対象のストレージ装置104と性能情報が記録される情報であり、図10を用いて後でさらに説明する。監視範囲情報513はエージェント102が監視する対象の範囲を特定する情報であり、図11を用いて後で説明する。この監視範囲情報513に基づいてエージェント102はストレージ装置104とその中のコンポーネントを監視する。なお、性能履歴情報512の過去の性能情報は監視範囲情報513と対応しない可能性もあるが、そのような過去の性能情報はマネージャ101の監視範囲履歴情報313に記録されている。
 図6は業務用計算機103の構成の例を示す図である。業務用計算機103のハードウェアは一般的な計算機であってもよい。記憶装置602にはVM603のシステムイメージが複数格納され、VM603を管理するハイパーバイザ604のプログラムが格納される。業務アプリケーションプログラムはVM603の環境を使用してCPU600により実行され、通信IF601を使用してストレージ装置104へデータをリードライトする。
 VM603ごとにVVOLが割り当てられ、各VVOLがボリューム210に対応してもよい。このため、VM603が生成されるとボリューム210が作成され、VM603が削除されるとボリューム210が削除されてもよい。各VM603はVM管理用計算機106によって管理される。このため、ボリューム210の作成と削除は、業務用計算機103からストレージ装置104へ要求されてもよいし、VM管理用計算機106からストレージ装置104へ要求されてもよい。
 図7はストレージ情報315の例を示す図である。ストレージ情報315は図3を用いて説明したようにマネージャ101の記憶装置302に構成情報314として格納される。ストレージID700はストレージ装置104それぞれをシステムの中で識別する情報である。シリアルナンバー701はストレージ装置104それぞれの製造時などのシリアルナンバーである。モデル702はストレージ装置104それぞれの製品としての名称である。ボリューム数703はストレージ装置104それぞれのボリューム210の個数である。更新時刻704はストレージ装置104それぞれの情報を更新した時刻である。
 なお、図7の例において、ストレージID700の「StorageA」に対応するシリアルナンバー701の「00001」、モデル702の「R800」、ボリューム数の「20000」、更新時刻704の「2015/1/26 10:13:34」のように、ストレージ情報315をテーブルと見たときの行をレコードと呼ぶ。以下のテーブルと見える各情報においても行をレコードと呼ぶ。
 図8Aはボリューム210に関するコンポーネント情報316の例を示す図である。コンポーネント情報316は図3を用いて説明したようにマネージャ101の記憶装置302に構成情報314として格納される。ボリュームID800はボリューム210を識別する情報である。ストレージID801はボリューム210を有するストレージ装置104を識別する情報であり、ストレージID700と対応する。容量802はボリューム210の記憶容量である。割当容量803はボリューム210の記憶容量の中で業務用計算機103に割り当てられている容量である。更新時刻804はボリューム210それぞれの情報を更新した時刻である。
 図8BはCPU202に関するコンポーネント情報316の例を示す図である。CPU ID805はCPU202を識別する情報である。ストレージID806はCPU202を有するストレージ装置104を識別する情報であり、ストレージID700と対応する。更新時刻807はCPU202それぞれの情報を更新した時刻である。
 図8Cは通信IF201に関するコンポーネント情報316の例を示す図である。ポートID808は通信IF201のポートを識別する情報である。ストレージID809は通信IF201を有するストレージ装置104を識別する情報であり、ストレージID700と対応する。更新時刻810はポートそれぞれの情報を更新した時刻である。
 なお、ボリューム210とCPU202と通信IF201は異なる種類のコンポーネントであり、コンポーネント情報316として他の種類のコンポーネントの情報を管理してもよい。
 図9は監視範囲履歴情報313の例を示す図である。監視範囲履歴情報313は図3を用いて説明したようにマネージャ101の記憶装置302に格納される。ストレージID900はストレージ装置104を識別する情報であり、ストレージID700と対応する。プライマリ901は1つのストレージ装置104を監視する1つまたは複数のエージェント102の中で選ばれた1つのエージェント102を示す情報であり、監視範囲履歴情報313に記録されていない監視範囲を監視したエージェント102であることを示す情報である。
 ポートID902はストレージ装置104の通信IF201のポートを識別する情報である。ボリュームID903はボリューム210を識別する情報である。期間904は監視を開始した年月日と開始を終了した年月日により表される監視した期間を示す情報である。エージェントID905はエージェント102を識別する情報である。
 監視範囲履歴情報313には、期間904の示す期間の順番にどのストレージ装置104のどのポートとどのボリューム210が、どのエージェント102により監視されたかの情報が履歴として蓄積される。図9の例で、期間904の「2014/10/1-2014/12/31」の期間は、ストレージID900の「StorageA」で識別されるストレージ装置104のボリュームID903の「Volume1」から「Volume10000」で識別されるボリューム210が、エージェントID905の「Agent1」で識別されるエージェント102により監視され、その監視された情報は「Agent1」で識別されるエージェント102に記録されたことを示す。
 期間904は、監視が開始されると、監視の開始された年月日と「Current」が記録され、監視が終了すると「Current」の代わりに監視の終了された年月日が記録される。なお、期間904は年月日に加えて時刻が記録されてもよい。
 図9の例では監視範囲履歴情報313にCPU202に関する情報がない。このように監視範囲履歴情報313に記録されていない情報は、プライマリ901が「Y」のレコードのエージェントID905で識別されるエージェント102が監視したことを示す。このため、期間904の「2014/10/1-2014/12/31」の期間は、ストレージID900の「StorageA」で識別されるストレージ装置104のCPU202が、エージェントIDの「Agent1」で識別されるエージェント102により監視されたこと示す。
 また、仮にストレージIDが「StorageA」で識別されるストレージ装置104にボリュームIDが「Volume30000」で識別されるボリューム210が存在すれば、そのボリューム210は監視範囲履歴情報313には記録されていなため、そのボリューム210もエージェントIDの「Agent1」で識別されるエージェント102により監視されたことを示す。
 図10は性能履歴情報512の例を示す図である。性能履歴情報512は図5を用いて説明したようにエージェント102の記憶装置502に格納される。記録時刻150はそのレコードの性能情報の記録された時刻である。ストレージID151はストレージ装置104を識別する情報であり、ストレージID700と対応する。ボリュームID152はボリューム210を識別する情報である。ストレージID151とボリュームID152の情報により特定された対象に関する性能情報が、記録時刻150にしたがって蓄積される。
 トータル応答時間153からビジー率156は性能情報であり、トータル応答時間153はリード要求を受け付けてからリードデータを応答するまでの時間である。リードIO率154とライトIO率155はリードとライトそれぞれの単位時間当たりのIOの比率である。ビジー率156は所定の時間中にリードあるいはライトに使用されている時間の比率である。これらの性能情報はボリューム210に関する情報であるが、これらに限定されるものではなく、ボリューム210に関する他のメトリックが含まれてもよい。また、ボリューム210以外のコンポーネントの性能情報が含まれてもよい。
 性能履歴情報512は予め保持期間が設定され、記録時刻150の値が保持期間を経過したレコードは削除されてもよい。監視範囲履歴情報313も同じ保持期間が設定され、期間904の値が保持期間を経過したレコードも削除されてもよい。ボリューム210が削除された場合に、性能履歴情報512のいずれのレコードも削除されず、削除されたボリューム210に関する性能情報を保持期間が終了するまで保持してもよい。
 図11は監視範囲情報513の例を示す図である。監視範囲情報513は図5を用いて説明したようにエージェント102の記憶装置502に格納される。ストレージID160はストレージ装置104を識別する情報であり、ストレージID700に対応する。ボリュームID161はボリューム210を識別する情報である。ストレージID160とボリュームID161の情報により特定された対象が監視されて、性能情報が取得され、性能履歴情報512に記録される。
 エージェント102の監視対象が変更されると、そのエージェント102の監視範囲情報513は変更され、過去の監視対象の履歴は監視範囲履歴情報313を用いて管理される。図11の例はボリューム210に関する監視であるが、ボリューム210以外のコンポーネントを特定する情報を含んでもよい。
 図12はクライアント計算機105からマネージャ101へ送信される要求の情報の例を示す図である。図12の例は、クライアント計算機105がマネージャ101へ性能情報を要求する際に送信される情報であり、クライアント計算機105のブラウザプログラム403で入力された情報である。ストレージID250のストレージ装置104を識別する情報とボリュームID251のボリューム210を識別する情報により性能情報を取得対象となるコンポーネントを特定する。コンポーネントを特定できれば他の情報でもよく、ボリューム210以外のコンポーネントの性能情報を取得する場合は、ボリュームID251の代わりにボリューム210以外のコンポーネントを識別する情報であってもよい。
 期間252は性能情報の取得対象期間を示す。メトリック1 253の「トータル応答時間」、メトリック2 254の「リードIO率」、メトリック32 255の「ビジー率」のそれぞれは、図10を用いて説明した性能履歴情報512のトータル応答時間153、リードIO率154、ビジー率156に対応する。これらの情報は、ストレージID250とボリュームID251で識別されるコンポーネントのメトリックであるが、性能履歴情報512に記録されたメトリックに対応していれば他のメトリックであってもよい。
 なお、図12に示す例では、例えば図10と同じ値である「StorageA」などを用いたが、これは説明を理解しやすくするための表現であり、同じものを識別するための別の値としてもよい。このために、ブラウザでユーザが「StorageA」と識別できる情報は、性能履歴情報512に実際に記録された「StorageA」と識別できる情報へ変換されてもよい。
 また、トータル応答時間などは、ボリューム210というコンポーネントの1つのメトリックの情報であるため、コンポーネントメトリック情報と呼んでもよい。
 図13はマネージャ101からエージェント102へ送信される要求の情報の例を示す図である。図13の例は、マネージャ101がエージェント102へ性能情報を要求する際に送信される情報であり、図12を用いて説明した要求の情報に基づくため、ストレージID351、ボリュームID352、メトリック1 354、メトリック2 355、メトリック3 356のそれぞれは、ストレージID250、ボリュームID251、メトリック1 253、メトリック2 254、メトリック3 255に対応する。
 エージェントID350は要求先のエージェント102を識別する情報である。期間353は期間252の示す期間の中で、エージェントID350で識別されるエージェント102の監視した期間を示す。図12、13は「2014/10/1-2014/12/31」の期間は「Agent1」が監視し、それ以後の期間は他のエージェント102が監視した例である。
 図14はエージェント一覧情報317の例を示す図である。エージェント一覧情報317はマネージャ101の記憶装置302に格納される情報である。エージェントID450はエージェント102を識別する情報である。割当て可451は監視範囲の割当てが可能か否かを示す情報であり、割当てが可能な場合は「Y」とし、割当てが可能でない場合は「N」とする。
 新規に追加されたエージェント102は、エージェント一覧情報317に追加され、割当て可451に「Y」が設定される。削除されるエージェント102は、割当て可451に「N」が設定された後、エージェント一覧情報317から削除される。これらの処理に関しては、図22、23を用いて後でされに説明する。
 図15はクライアント計算機105におけるレポート要求の表示の例を示す図である。ストレージ装置選択550にてストレージ装置104が選択されると、選択されたストレージ装置104の情報がストレージ装置情報551に表示され、コンポーネント選択552にて選択可能なコンポーネントが表示される。コンポーネント選択552において、タブやチェックボックスなどによりコンポーネントが選択され、ボタン553が押下されると、図12を用いて説明した要求の情報がマネージャ101へ送信される。
 なお、コンポーネント選択552において選択されたコンポーネントのメトリックも選択可能にしてもよいし、選択されたコンポーネントの全てのメトリックをマネージャ101へ要求し、図16を用いて説明するレポート表示にて選択可能としてもよい。
 図16はクライアント計算機105におけるレポート表示の例を示す図である。この例では、コンポーネント選択552が性能表示650となり、選択されたボリューム210の時刻の経過に応じたトータル応答時間の変化がグラフとして表示される。なお、性能情報の表示はグラフ形式以外に表形式で表示されてもよく、複数のメトリックの性能情報が並べられて表示されるまたは重ねられて表示されてもよい。
 図17はクライアント要求振分の処理フローの例を示す図である。クライアント要求振分部306はクライアント計算機105から要求を受け付けると(ステップ750)、クライアント要求がエージェント監視範囲の要求であるかを判定する(ステップ751)。クライアント要求がエージェント監視範囲の要求であると判定した場合は、エージェント監視範囲の処理へ進む(ステップ752)。エージェント監視範囲の処理に関しては、図18を用いて後でさらに説明する。
 クライアント要求振分部306は、クライアント要求がエージェント監視範囲の要求ではないと判定した場合、クライアント要求がレポート生成の要求であるかを判定する(ステップ753)。クライアント要求がレポート生成の要求であると判定した場合は、レポート生成の処理へ進む(ステップ754)。レポート生成の処理に関しては、図19を用いて後でさらに説明する。
 クライアント要求振分部306は、クライアント要求がレポート生成の要求ではないと判定した場合、クライアント要求がエージェント追加の要求であるかを判定する(ステップ755)。クライアント要求がエージェント追加の要求であると判定した場合は、エージェント追加の処理へ進む(ステップ756)。エージェント追加の処理に関しては、図22を用いて後でさらに説明する。
 クライアント要求振分部306は、クライアント要求がエージェント追加の要求ではないと判定した場合、クライアント要求がエージェント削除の要求であるかを判定する(ステップ757)。クライアント要求がエージェント削除の要求であると判定した場合は、エージェント削除の処理へ進む(ステップ758)。エージェント削除の処理に関しては、図23を用いて後でさらに説明する。
 クライアント要求振分部306は、クライアント要求がエージェント削除の要求ではないと判定した場合、アラート受信部311へ制御を移す。アラート受信部311は、エージェント102からの性能履歴情報512への書き込み遅延のトリガーを受け付ける(ステップ759)。そして、書き込み遅延を解消するために、エージェント102の監視範囲の決定・指示送信の処理へ進む(ステップ760)。
 図18はエージェント監視範囲の処理フローの例を示す図である。この処理により、クライアント計算機105がエージェント102の監視範囲を表示する。監視範囲管理部309は、クライアント要求振分部306から監視範囲の要求を受け付け(ステップ850)、監視範囲履歴情報313の期間904に「Current」を含むレコードを取得する(ステップ851)。そして、取得したレコードの情報をクライアント計算機105へ送信する(ステップ852)。ここで、取得したレコードの情報はクライアント計算機105での表示のために何らかの加工がされてもよい。エージェント102の監視範囲はマネージャ101が決定するため、その決定された状態をユーザが確認可能となる。
 図19はレポート生成の処理フローの例を示す図である。要求生成部307はクライアント要求振分部306からレポート生成の要求を受け付ける(ステップ950)。レポート生成の要求は、図12を用いて説明した要求の情報が含まれてもよい。また、メトリックの情報は省略され、全てのメトリックの性能情報の要求であるとしてもよい。
 要求生成部307は、要求先のエージェント102を特定し、各要求先のエージェント102に応じた要求を生成する(ステップ951)。この生成に関しては図20を用いてさらに説明する。要求生成部307は生成した要求をエージェント通信部308へ渡し、エージェント通信部308は要求を送信して要求に対する応答を受信する(ステップ952)。エージェント通信部308は受信した応答を結合してレポート生成部310へ渡し、レポート生成部310は結合した応答からレポートとなる表示情報に変換してクライアント計算機105へ送信する。
 図20は要求生成の処理フローの例を示す図である。これは図19を用いて説明したステップ951の処理であり、1つのコンポーネントの性能情報であっても期間ごとに複数のエージェント102へ性能履歴情報が分散している可能性があるため、そのような場合に要求生成部307はそれぞれの期間を判定し、複数の要求を生成する。要求生成部307は、図12を用いて説明したストレージID250、ボリュームID251、期間252の各情報をレポート生成の範囲情報として取得する。
 要求生成部307は監視範囲履歴情報313を検索して、ストレージID250の値とストレージID900の値が一致し、ボリュームID251の値がボリュームID903の値に含まれ、期間252の期間が期間904の期間とオーバーラップするようなレコードを見つけ出す(ステップ171)。ここで、期間252の期間とオーバーラップする期間が期間904として複数存在する可能性がある。そこで検索したレコードごとにエージェント102へ送信する性能情報取得要求期間を決定するために、ステップ172からステップ179を繰り返す。
 要求生成部307は、検索したレコードの1つをステップ173からステップ178の処理対象とし(ステップ172)、クライアント計算機105から要求された期間252の要求開始時刻が、期間904の開始時刻より早いかを判定する(ステップ173)。要求生成部307は、ステップ173で早いと判定した場合、性能情報取得要求期間の開始時刻を期間904の開始時刻とし(ステップ174)、ステップ173で早くないと判定した場合、性能情報取得要求期間の開始時刻を期間252の要求開始時刻とする(ステップ175)。
 要求生成部307は、クライアント計算機105から要求された期間252の要求終了時刻が、期間904の終了時刻より早いかを判定する(ステップ176)。要求生成部307は、ステップ176で早いと判定した場合、性能情報取得要求期間の終了時刻を期間252の要求終了時刻とし、ステップ176で早くないと判定した場合、性能情報取得要求期間の終了時刻を期間904の終了時刻とする。要求生成部307は、検索したレコードすべてについてステップ173からステップ178が終了していない場合、ステップ172へ戻り、別のレコードを処理対象とし、終了した場合、ステップ180へ進む。
 要求生成部307は、ステップ171で検索したレコードのそれぞれについて、図13のエージェントID350をエージェントID905の情報とし、ストレージID351をストレージID900(ストレージID250でも同じ)の情報とし、ボリュームID352をボリュームID251の情報とし、期間353をステップ172からステップ179で決定した性能情報取得要求期間とする要求を生成する(ステップ180)。なお、メトリック1 354などはメトリック1 253などでもよい。
 性能情報の取得要求の対象コンポーネントがポートである場合は、以上の説明のボリュームID903の代わりにポートID902が使用されてもよい。監視範囲履歴情報313に記録されていないコンポーネントが性能情報の取得要求の対象である場合は、以上の説明のボリュームID903の代わりにプライマリ901が「Y」のレコードを検索してもよい。
 図21は要求を送信し応答を受信する処理フローの例を示す図である。これは図19を用いて説明したステップ952の処理であり、図20を用いて説明したように生成した要求をエージェント102へ送信し、エージェント102から応答を受信する。既に説明したように、要求は、期間252の要求期間によっては複数の性能情報取得要求期間に分割されるため、受信した応答は結合される。
 エージェント通信部308は、ステップ951で生成された要求ごとにステップ191を繰り返すため、生成された要求の1つを対象とし(ステップ190)、エージェントID350で識別されるエージェント102へ要求を送信する(ステップ191)。全ての要求を送信するまでステップ190へ戻る。ここで、ステップ191の要求の送信は、エージェント102からの応答を待たずに繰り返される。
 エージェント通信部308は、エージェント102からの応答を受信するまで待機し(ステップ193)、応答を受信すると全ての応答を受信したか判定し(ステップ194)、全ての応答を受信したと判定するまでステップ193へ戻る。ここで、応答は、例えば図10を用いて説明した情報であってもよい。また、応答は、応答を送信したエージェント102を識別する情報を含んでもよく、要求に含まれた性能情報取得要求期間を含んでもよく、要求に含まれたメトリックに対応する性能情報だけが含まれてもよい。
 エージェント通信部308は、受信した複数の応答を性能情報取得要求期間あるいは記録時刻が古い順番に各応答をソートして結合し、レポート生成部310へ渡す(ステップ195)。
 図22はエージェント102を追加する処理フローの例を示す図である。これは、図17を用いて説明したステップ756の処理である。エージェント一覧管理部312は、クライアント要求振分部306からエージェント追加の要求を受け付け(ステップ260)、エージェント一覧情報317にレコードを追加し、追加されるエージェント102を識別する情報をエージェントID450へ設定して、割当て可451を「Y」にする。
 追加されたエージェント102へ監視範囲を割当てるために、追加されたエージェント102も含めてエージェント102の監視範囲の決定・指示送信の処理を実行する(ステップ262)。エージェント102の監視範囲の決定・指示送信処理に関しては図24を用いてさらに説明する。なお、ステップ262は監視範囲を割当て直すだけであり、過去に蓄積された性能情報をエージェント102間で移行することはない。
 図23はエージェント102を削除する処理フローの例を示す図である。これは、図17を用いて説明したステップ758の処理である。エージェント102が削除されると、削除されたエージェント102に蓄積された性能履歴情報512を使用できなくなるため、削除により使用できなくなる性能履歴情報512を他のエージェント102に移行する。また、削除されるエージェント102を除くエージェント102に監視範囲を割当て直す。
 エージェント一覧管理部312は、クライアント要求振分部306からエージェント削除の要求を受け付け(ステップ360)、エージェント一覧情報317のエージェントID450が削除されるエージェント102を識別する情報と一致するレコードの割当て可451を「N」にする(ステップ361)。これによりステップ363の監視範囲の割当てから削除されるエージェント102が除外される。
 エージェント一覧管理部312は、削除されるエージェント102へ性能情報の収集の停止を通知し(ステップ362)、エージェント102の監視範囲の決定・指示送信の処理を実行する(ステップ363)。ステップ363により、新たな割当てに基づく性能情報の収集が各エージェント102で開始される。エージェント102の監視範囲の決定・指示送信処理に関しては図24を用いてさらに説明するが、削除されるエージェント102以外のエージェント102全てで監視範囲が改めて割当てられる。この代わりに削除されるエージェント102に割当てられた監視範囲のみを、削除されるエージェント102以外に割当ててもよい。
 エージェント一覧管理部312は、削除されるエージェント102の性能履歴情報512に性能情報が記録されたストレージ装置104の一覧あるいはこれに相当する一覧を取得し、取得した一覧の各ストレージ装置104を対象にしてステップ365からステップ369の処理を繰り返す(ステップ364)。これにより削除されるエージェント102の性能履歴情報512が他のエージェント102へ移行される。
 エージェント一覧管理部312は、ステップ364で対象としたストレージ装置104を識別する情報と一致する監視範囲履歴情報513のストレージID900の情報を含むレコードの中で、期間904に「Current」を含み、かつプライマリ901が「Y」であるレコードを検索し、検索して得たレコードのエージェントID905のエージェント102を識別する情報を取得する(ステップ365)。そして、削除されるエージェント102を識別する情報と、ステップ365で取得されたエージェント102を識別する情報とが一致するかを判定する(ステップ366)。
 エージェント一覧管理部312は、ステップ366で一致すると判定した場合、削除されるエージェント102以外のエージェント102の中からプライマリを選択し、選択されたエージェント102にプライマリを変更する(ステップ367)。これにより、変更されたプライマリは「Current」にもなる。ステップ366で一致しないと判定した場合、およびステップ367を実行した後、ステップ364で対象としたストレージ装置104の性能情報を、削除されるエージェント102の性能履歴情報512から「Current」でプライマリのエージェント102へ移行する(ステップ368)。
 ステップ368の移行のために、エージェント一覧管理部312は、削除されるエージェント102あるいは「Current」でプライマリのエージェント102へ移行の指示を出してもよいし、削除されるエージェント102および「Current」でプライマリのエージェント102の両方へ移行の指示をだしてもよい。エージェント一覧管理部312は、監視範囲履歴情報513のストレージID900の情報がステップ364で対象としたストレージ装置104を識別する情報と一致し、かつエージェントID905の情報が削除されるエージェント102を識別する情報と一致するレコードのエージェントID905の情報を移行先のエージェント102を識別する情報に変更する。
 エージェント一覧管理部312は、ステップ364で取得した一覧のストレージ装置104全てを対象として処理したと判定するまでステップ364へ戻り、一覧の中の別のストレージ装置104を対象とし、一覧のストレージ装置104全てを対象として処理したと判定した場合、削除されるエージェント102を識別する情報とそれに対応する「N」をエージェント一覧情報317から削除する。
 図24はエージェント102の監視範囲の決定・指示送信の処理フローの例を示す図である。これは、図17を用いて説明したステップ760、図22を用いて説明したステップ262、図23を用いて説明したステップ363の処理である。監視範囲管理部309は、ストレージ装置104およびボリューム210の一覧、ボリューム数を構成情報314から取得する(ステップ460)。また、監視範囲管理部309は、割当て可451が「Y」のエージェント102の一覧をエージェント一覧情報317から取得し、取得したエージェント102の数を算出する(ステップ461)。
 監視範囲管理部309は、ステップ460で取得した一覧の各ストレージ装置104を対象とし、ステップ463とステップ464を繰り返す。監視範囲管理部309は、ステップ462で対象としたストレージ装置104のボリューム数を、算出したエージェント数で除算し、エージェント102当りのボリューム数を算出する(ステップ463)。
 監視範囲管理部309は、算出したボリューム数のボリュームを、取得したエージェント102それぞれに割当てるため、監視範囲履歴情報313にレコードを追加して、追加したレコードのストレージID900に対象としたストレージ装置104を識別する情報を設定し、ボリュームID903に算出したボリューム数のボリュームを識別する情報を設定し、エージェントID905に取得したエージェント102を識別する情報を設定する(ステップ464)。
 ここで、対象としたストレージ装置104を識別する情報とストレージID900の情報とが一致するレコードの中で期間904に「Current」を含むレコードの「Current」は、マネージャ101内の図示を省略した時計から取得した前日(あるいは当日)に変更され、追加したレコードの期間904の終了時刻は「Current」が設定されてもよい。また、プライマリのエージェント102が選択され、プライマリ901に「Y」が設定されてもよい。
 監視範囲管理部309は、ステップ460で取得した一覧のストレージ装置104を全て処理するまでステップ462に戻り(ステップ465)、ストレージ装置104を全て処理すると、取得したエージェント102のそれぞれへ割当てたボリュームを通知する(ステップ466)。ステップ462で対象としたストレージ装置104のボリューム数を、算出したエージェント数で除算して割当てるため、1つのストレージ装置104を算出の対象となった複数のエージェント102が監視の対象とすることになる。
 図24を用いた説明では、ボリュームの監視範囲として数を等分に割当てられる例を示したが、これに限定されるものではく、ボリュームの別のパラメータ例えばボリュームの性能情報などに基づいてエージェント102が割り当てられてもよい。また、ボリュームに関するパラメータではなく、エージェント102の負荷、例えばCPU501の負荷や記憶装置502のリードライト時間に基づいてエージェント102が割り当てられてもよい。また、予め設定された誤差範囲内で均等になるように監視範囲を決めてもよい。
 また、ボリューム210が生成されたり削除されたりした場合、図24を用いて説明した処理が実行されてもよい。
 図25はエージェント102の処理フローの例を示す図である。エージェント102はストレージ装置104から性能情報を取得して記録するとともに、マネージャ101からの要求に応じた処理を実行する。エージェント102が起動されると、スケジューラ504が起動され、スケジューラ504のスケジュールに基づいてストレージ装置104からの性能情報取得・格納処理が開始される。この処理に関しては図26を用いてさらに説明する。
 エージェント102のマネージャ要求振分部510は、マネージャ101からの要求を受け付け(ステップ581)、マネージャ要求が性能取得であるかを判定する(ステップ582)。マネージャ要求が性能取得であると判定した場合、性能取得要求の受け付け処理を実行する(ステップ583)。この処理に関しては図27を用いてさらに説明する。エージェント102のマネージャ要求振分部510は、マネージャ要求が性能取得でないと判定した場合、図24のステップ466で説明したマネージャ101からの監視範囲の更新通知を受け付け、監視範囲更新部511が監視範囲情報513を更新する(ステップ584)。
 図26は性能情報取得・格納の処理フローの例を示す図である。スケジューラ504は、予め設定された間隔に基づき性能取得・格納部505の実行を開始する(ステップ680)。性能取得・格納部505は、監視範囲情報513のストレージID160とボリュームID161の各情報を取得し(ステップ681)、ストレージID160の識別情報で特定されるストレージ装置104それぞれを対象にしてステップ683からステップ688までの処理を繰り返す。
 性能取得・格納部505は、ステップ682で対象としたストレージ装置104から、ボリュームID161の識別情報で特定されるボリューム210の性能情報を取得する(ステップ683)。ここで、エージェント102からは、ストレージID160の情報に対応するストレージ装置104を宛先として含み、ボリュームID161の情報を監視範囲として含むパケットをストレージ装置104へ送信してもよい。この宛先はストレージID160の情報そのものであってもよいし、ストレージID160の情報を変換した情報であってもよい。この変換のために、エージェント102は、マネージャ101から各ストレージ装置104のIPアドレスなどやアドレスの生成に使用できる固有番号などを予め取得しておいてもよいし、各ストレージ装置104からこれらのアドレスに関する情報を取得しておいてもよい。
 記憶装置502の性能を監視する記憶装置監視部508は、ステップ683で取得した性能情報を記憶装置502の性能履歴情報512へ書き込む開始時刻を記録する(ステップ684)。そして、性能取得・格納部505は、取得した性能情報を性能履歴情報512へ書き込む(ステップ685)。
 記憶装置監視部508は、ステップ685が終了すると、書き込み終了時刻を記録し(ステップ686)、ステップ684で記録した開始時刻とステップ686で記録した終了時刻との差分から書き込み時間を算出する(ステップ687)。そして、合計の書き込み時間へステップ687で算出した書き込み時間を加算する(ステップ688)。性能取得・格納部505は、ステップ681で取得したストレージID160の識別情報で特定されるストレージ装置104全てを処理対象にするまでステップ682へ戻り(ステップ690)、別のストレージ装置104を処理の対象とする。
 全てのストレージ装置104から性能情報を取得し、性能履歴情報512へ書き込むと、記憶装置監視部508は、ステップ688で加算した合計の書き込み時間が、予め設定された閾値を超えたか判定する(ステップ691)。閾値を超えないと判定した場合は処理を終了し、閾値を超えたと判定した場合、記憶装置監視部508はアラート通知部509へアラートの通知を要求し(ステップ692)、アラート通知部509はマネージャ101にアラートを送信する(ステップ693)。
 ステップ691の閾値は例えばステップ680の実行間隔の50%であってもよい。また、図26を用いた説明では、書き込み時間に基づきアラートを通知したが、これに限定されるものではなく、エージェント102の記憶装置502の性能履歴情報512の書き込みに関する他の情報に基づいてアラートを通知してもよい。
 図27は性能取得要求の処理フローの例を示す図である。これは、図25を用いて説明したステップ583の処理であり、図21を用いて説明したステップ191の要求に対して実行される。マネージャ通信部506は、図13を用いて説明した情報の要求をマネージャ101から受け付け(ステップ780)、応答生成部507へ渡す。
 応答生成部507はマネージャ要求に含まれるストレージ装置104を識別する情報とボリューム210を識別する情報のそれぞれがストレージID151の情報とボリュームID152の情報と一致し、かつマネージャ要求の要求期間に記録時刻150の値が含まれるレコードを検索し、検索で見つかったレコードから応答を生成し(ステップ781)、マネージャ通信部506に渡す。マネージャ通信部506は応答をマネージャ101へ送信する(ステップ782)。
 以上で説明したように、性能情報の取得の負荷を監視範囲ごとに複数のエージェント102へ分散することができ、性能情報の取得対象の構成の変更に応じて監視範囲を更新できる。また、複数のエージェント102に格納された性能情報をマネージャ101が管理するため、エージェント102が追加されて監視範囲が更新されても、エージェント102に格納された性能情報を移行する必要はない。そして、マネージャ101はレポート生成に必要な性能情報を格納しているエージェント102を特定できるため、他のエージェント102へ負荷をかけることがない。さらに、クライアント計算機105は、あたかも1つの装置で性能情報が格納されているかのような単純な要求により、性能情報のレポートの応答を受け取ることができる。
101:管理用計算機(マネージャ)
102:監視用計算機(エージェント)
103:業務用計算機
104:ストレージ装置
105:クライアント計算機
210:ボリューム
313:監視範囲履歴情報
512:性能履歴情報
513:監視範囲情報

Claims (15)

  1.  ストレージ装置とマネージャと複数のエージェントを含むストレージ監視システムであって、
     前記ストレージ装置は、
     複数種類のコンポーネントを有し、
     前記複数種類のコンポーネントは第1の種類の複数コンポーネントを含み、
     前記マネージャは、
     第1のプロセッサと第1の記憶装置を有し、
     前記第1のプロセッサは、
     前記複数のエージェントの中の第1のエージェントによる前記第1の種類の複数コンポーネントの第1の監視範囲の情報を前記第1のエージェントの情報と対応付けて前記第1の記憶装置に格納して、前記第1の監視範囲の情報を前記第1のエージェントに通知し、
     前記複数のエージェントの中の第2のエージェントによる前記第1の種類の複数コンポーネントの第2の監視範囲の情報を前記第2のエージェントの情報と対応付けて前記第1の記憶装置に格納して、前記第2の監視範囲の情報を前記第2のエージェントに通知し、
     前記第1のエージェントは、
     第2のプロセッサと第2の記憶装置を有し、
     前記第2のプロセッサは、前記マネージャから通知された前記第1の監視範囲の情報を前記第2の記憶装置に格納し、前記第2の記憶装置に格納された前記第1の監視範囲の情報に基づき前記第1の種類の複数コンポーネントの中の前記第1の監視範囲のコンポーネントの第1のコンポーネントメトリック情報を前記ストレージ装置から取得し、前記第2の記憶装置に前記取得した第1のコンポーネントメトリック情報を格納し、
     前記第2のエージェントは、
     第3のプロセッサと第3の記憶装置を有し、
     前記第3のプロセッサは、前記マネージャから通知された前記第2の監視範囲の情報を前記第3の記憶装置に格納し、前記第3の記憶装置に格納された前記第2の監視範囲の情報に基づき前記第1の種類の複数コンポーネントの中の前記第2の監視範囲のコンポーネントの第2のコンポーネントメトリック情報を前記ストレージ装置から取得し、前記第3の記憶装置に前記取得した第2のコンポーネントメトリック情報を格納する
    ことを特徴とするストレージ監視システム。
  2.  前記マネージャの第1のプロセッサは、
     前記第1の種類の複数コンポーネントの数と前記複数のエージェントの数に基づき前記第1の監視範囲に含まれるコンポーネントの数と前記第2の監視範囲に含まれるコンポーネントの数を算出することにより、コンポーネントの数が予め設定された誤差範囲内で均等になるように前記第1の監視範囲の情報と前記第2の監視範囲の情報を決定し、
     前記第1の記憶装置に既に格納されている監視範囲の情報に対応付けられた監視の終了時刻の情報を更新し、
     前記決定した第1の監視範囲の情報と第2の監視範囲の情報それぞれを監視の開始時刻の情報とともに前記第1の記憶装置に格納する
    ことを特徴とする請求項1に記載のストレー監視ジシステム。
  3.  前記ストレージ監視システムは、
     コンポーネントメトリック情報の要求を前記マネージャに送信するクライアントを含み、
     前記マネージャの第1のプロセッサは、
     前記クライアントが送信した要求に含まれる開始時刻と終了時刻により成る期間の情報から、前記第1のメモリに格納された情報に基づき、前記要求に含まれる期間の要求対象のコンポーネントメトリック情報を保持しているエージェント群を前記複数のエージェントの中から特定し、前記特定されたエージェント群に要求を送信する
    ことを特徴とする請求項2に記載のストレージ監視システム。
  4.  前記特定されたエージェント群は、
     前記エージェント群に送信された要求に応じて、前記要求対象のコンポーネントメトリック情報を前記マネージャに送信し、
     前記マネージャの第1のプロセッサは、
     前記特定されたエージェント群から送信されたコンポーネントメトリック情報を受信して結合し、前記クライアントに送信する
    ことを特徴とする請求項3に記載のストレージ監視システム。
  5.  前記マネージャの第1のプロセッサは、
     前記複数のエージェントの数が増加すると、前記第1の種類の複数コンポーネントの数と前記複数のエージェントの増加した数に基づき前記第1の監視範囲に含まれるコンポーネントの数と前記第2の監視範囲に含まれるコンポーネントの数を算出することにより、コンポーネントの数が予め設定された誤差範囲内で均等になるように前記第1の監視範囲の情報と前記第2の監視範囲の情報を決定する
    ことを特徴とする請求項4記載のストレージ監視システム。
  6.  前記マネージャの第1のプロセッサは、
     前記第1のエージェントが削除されると、前記第1の種類の複数コンポーネントの数と前記複数のエージェントの前記第1のエージェントを除く数に基づき前記前記第2の監視範囲に含まれるコンポーネントの数を算出することにより、コンポーネントの数が予め設定された誤差範囲内で均等になるように前記第2の監視範囲の情報を決定し、
     前記第2の記憶装置に格納された前記第1のコンポーネントメトリック情報を前記複数のエージェントの中の第3のエージェントへ移行するように前記第1のエージェントへ指示し、
     前記第1の記憶装置に格納された前記第1の監視範囲の情報を前記第3のエージェントの情報との対応付けに更新し、
     前記第1のエージェントは、
     前記第2の記憶装置に格納された前記第1のコンポーネントメトリック情報を前記第3のエージェントへ移行する
    ことを特徴とする請求項4記載のストレージ監視システム。
  7.  前記マネージャの第1のプロセッサは、
     前記第1の種類の複数コンポーネントの数が変更されると、前記第1の種類の複数コンポーネントの変更された数と前記複数のエージェントの数に基づき前記第1の監視範囲に含まれるコンポーネントの数と前記第2の監視範囲に含まれるコンポーネントの数を算出することにより、コンポーネントの数が予め設定された誤差範囲内で均等になるように前記第1の監視範囲の情報と前記第2の監視範囲の情報を決定する
    ことを特徴とする請求項4記載のストレージ監視システム。
  8.  前記ストレージ監視システムは、
     前記ストレージ装置へ前記コンポーネントの生成あるいは削除を要求するサーバと、前記ストレージ装置との間に中継器を含み、
     前記サーバは、
     前記コンポーネントの生成あるいは削除の要求を前記中継器へ送信し、
     前記中継器は、
     前記コンポーネントの生成あるいは削除の要求を受信して、前記ストレージ装置と前記マネージャに送信し、
     前記ストレージ装置は、
     前記コンポーネントの生成あるいは削除の要求を受信して、前記コンポーネントを生成あるいは削除し、
     前記マネージャの第1のプロセッサは、
     前記コンポーネントの生成あるいは削除の要求を受信する
    ことを特徴とする請求項7に記載のストレージ監視システム。
  9.  前記サーバは、
     仮想マシンを生成すると、前記コンポーネントの生成の要求を前記中継器に送信し、仮想マシンを削除すると、前記コンポーネントの削除の要求を前記中継器に送信する
    ことを特徴とする請求項8に記載のストレージ監視システム。
  10.  前記第1のエージェントの第2のプロセッサは、
     前記第2の記憶装置に前記第1のコンポーネントメトリック情報を格納する性能を計測し、前記計測した性能が予め設定された閾値より低下したことを判定し、前記マネージャへ通知する
    ことを特徴とする請求項9に記載のストレージ監視システム。
  11.  前記コンポーネントはボリュームであり、
     前記コンポーネントメトリック情報は、前記ボリュームのリードライトの性能情報である
    ことを特徴とする請求項10に記載のストレージ監視システム。
  12.  ストレージ装置とマネージャと複数のエージェントを含むストレージ監視システムの監視方法であって、
     前記マネージャは、
     前記ストレージ装置に含まれる複数種類のコンポーネントの中の第1の種類の複数コンポーネントに対する前記複数のエージェントの中の第1のエージェントによる第1の監視範囲の情報を前記第1のエージェントの情報と対応付けて記憶し、前記第1の監視範囲の情報を前記第1のエージェントに通知し、
     前記第1の種類の複数コンポーネントに対する前記複数のエージェントの中の第2のエージェントによる第2の監視範囲の情報を前記第2のエージェントの情報と対応付けて記憶し、前記第2の監視範囲の情報を前記第2のエージェントに通知する
    ことを特徴とするストレージ監視システムの監視方法。
  13.  前記第1のエージェントは、
     前記マネージャから通知された前記第1の監視範囲の情報を記憶し、前記記憶された前記第1の監視範囲の情報に基づき前記第1の種類の複数コンポーネントの中の前記第1の監視範囲のコンポーネントの第1のコンポーネントメトリック情報を前記ストレージ装置から取得して記憶し、
     前記第2のエージェントは、
     前記マネージャから通知された前記第2の監視範囲の情報を記憶し、前記記憶された前記第2の監視範囲の情報に基づき前記第1の種類の複数コンポーネントの中の前記第2の監視範囲のコンポーネントの第2のコンポーネントメトリック情報を前記ストレージ装置から取得して記憶する
    ことを特徴とする請求項12に記載のストレージ監視システムの監視方法。
  14.  前記マネージャは、
     前記第1の種類の複数コンポーネントの数と前記複数のエージェントの数に基づき前記第1の監視範囲に含まれるコンポーネントの数と前記第2の監視範囲に含まれるコンポーネントの数を算出することにより、コンポーネントの数が予め設定された誤差範囲内で均等になるように前記第1の監視範囲の情報と前記第2の監視範囲の情報を決定し、
     既に記憶されている監視範囲の情報に対応付けられた監視の終了時刻の情報を更新し、
     前記決定した第1の監視範囲の情報と第2の監視範囲の情報それぞれを監視の開始時刻の情報とともに記憶する
    ことを特徴とする請求項13に記載のストレージ監視システムの監視方法。
  15.  前記マネージャは、
     クライアントが送信した要求に含まれる開始時刻と終了時刻により成る期間の情報から、前記マネージャに記憶された情報に基づき、前記要求に含まれる期間の要求対象のコンポーネントメトリック情報を保持しているエージェント群を前記複数のエージェントの中から特定し、前記特定されたエージェント群に要求を送信する
    ことを特徴とする請求項14に記載のストレージ監視システムの監視方法。
PCT/JP2015/071298 2015-07-28 2015-07-28 ストレージ監視システムおよびその監視方法 WO2017017774A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
PCT/JP2015/071298 WO2017017774A1 (ja) 2015-07-28 2015-07-28 ストレージ監視システムおよびその監視方法
US15/551,249 US10585620B2 (en) 2015-07-28 2015-07-28 Storage monitoring system for monitoring components in a storage system in a distributed manner
JP2017530508A JP6279816B2 (ja) 2015-07-28 2015-07-28 ストレージ監視システムおよびその監視方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2015/071298 WO2017017774A1 (ja) 2015-07-28 2015-07-28 ストレージ監視システムおよびその監視方法

Publications (1)

Publication Number Publication Date
WO2017017774A1 true WO2017017774A1 (ja) 2017-02-02

Family

ID=57884295

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2015/071298 WO2017017774A1 (ja) 2015-07-28 2015-07-28 ストレージ監視システムおよびその監視方法

Country Status (3)

Country Link
US (1) US10585620B2 (ja)
JP (1) JP6279816B2 (ja)
WO (1) WO2017017774A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10965566B2 (en) * 2017-11-03 2021-03-30 International Business Machines Corporation System and method for detecting changes in cloud service up-time
US11893407B2 (en) * 2020-09-24 2024-02-06 Red Hat, Inc. Overlay container storage driver for microservice workloads
US11829630B2 (en) * 2020-10-23 2023-11-28 EMC IP Holding Company LLC Synthetically providing multiple types of granular delete operations for a cloud-based object storage

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003051822A (ja) * 2001-08-06 2003-02-21 Nec Commun Syst Ltd ネットワーク監視システム、ネットワーク監視方法、およびそのプログラム
JP2005309838A (ja) * 2004-04-22 2005-11-04 Hitachi Ltd 情報管理システムと情報管理方法、及び、そのための情報管理サブシステム
JP2011090639A (ja) * 2009-10-26 2011-05-06 Hitachi Ltd 情報処理システム、及びストレージ監視サーバの管理方法
JP2011197775A (ja) * 2010-03-17 2011-10-06 Nec Corp データ管理システム、管理サーバ、データ管理方法およびデータ管理用プログラム

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2003903096A0 (en) * 2003-06-18 2003-07-03 Sap Aktiengesellschaft A method of monitoring the utilisation of a hardware component in a computing system
JP4479284B2 (ja) * 2004-03-08 2010-06-09 株式会社日立製作所 計算機システムのモニタリングを設定する管理計算機及びシステム
US7469284B1 (en) 2004-12-28 2008-12-23 Emc Corporation Methods and apparatus for assigning management responsibilities to multiple agents
US7937393B2 (en) * 2005-11-28 2011-05-03 Commvault Systems, Inc. Systems and methods for classifying and transferring information in a storage network
US9231858B1 (en) * 2006-08-11 2016-01-05 Dynatrace Software Gmbh Completeness detection of monitored globally distributed synchronous and asynchronous transactions
JP4980792B2 (ja) * 2007-05-22 2012-07-18 株式会社日立製作所 仮想計算機の性能監視方法及びその方法を用いた装置
JP4724759B2 (ja) * 2009-03-12 2011-07-13 富士通株式会社 アクセス制御装置、ストレージ装置、ネットワーク通信装置、アクセス制御方法、及びアクセス制御プログラム
CN101751228B (zh) * 2009-12-29 2011-07-20 成都市华为赛门铁克科技有限公司 磁盘阵列的实现方法和数据读写方法及装置
WO2012169027A1 (ja) * 2011-06-08 2012-12-13 株式会社日立製作所 計算機システム及びストレージシステム管理方法
WO2014054274A1 (ja) * 2012-10-02 2014-04-10 パナソニック株式会社 監視装置及び監視方法
US9128745B2 (en) * 2012-12-27 2015-09-08 International Business Machines Corporation Automatically managing the storage of a virtual machine
US9519580B2 (en) * 2013-11-11 2016-12-13 Globalfoundries Inc. Load balancing logical units in an active/passive storage system

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003051822A (ja) * 2001-08-06 2003-02-21 Nec Commun Syst Ltd ネットワーク監視システム、ネットワーク監視方法、およびそのプログラム
JP2005309838A (ja) * 2004-04-22 2005-11-04 Hitachi Ltd 情報管理システムと情報管理方法、及び、そのための情報管理サブシステム
JP2011090639A (ja) * 2009-10-26 2011-05-06 Hitachi Ltd 情報処理システム、及びストレージ監視サーバの管理方法
JP2011197775A (ja) * 2010-03-17 2011-10-06 Nec Corp データ管理システム、管理サーバ、データ管理方法およびデータ管理用プログラム

Also Published As

Publication number Publication date
US20180018129A1 (en) 2018-01-18
JP6279816B2 (ja) 2018-02-14
US10585620B2 (en) 2020-03-10
JPWO2017017774A1 (ja) 2017-10-26

Similar Documents

Publication Publication Date Title
JP6215715B2 (ja) クラウドコンピューティング環境を管理する方法およびシステム
JP5130375B2 (ja) コンピュータシステム、コンピュータシステムのリソース資源管理サーバ、及びコンピュータシステムのリソース管理方法
US7933995B2 (en) Computer program and apparatus for controlling computing resources, and distributed processing system
US20160275123A1 (en) Pipeline execution of multiple map-reduce jobs
JP5117120B2 (ja) ストレージ装置のボリュームを管理する計算機システム、方法及びプログラム
JP5370946B2 (ja) リソース管理方法及び計算機システム
US20120117226A1 (en) Monitoring system of computer and monitoring method
JP6186787B2 (ja) データ転送装置、データ転送システム、データ転送方法及びプログラム
EP1750200A2 (en) System and method for executing job step, and computer product
US10503558B2 (en) Adaptive resource management in distributed computing systems
US10810143B2 (en) Distributed storage system and method for managing storage access bandwidth for multiple clients
WO2015049742A1 (ja) ストレージシステムおよびストレージシステム制御方法
JP2007323245A (ja) 計算機システムおよび性能計測方法ならびに管理サーバ装置
KR20160087706A (ko) 가상화 플랫폼을 고려한 분산 데이터 처리 시스템의 자원 할당 장치 및 할당 방법
US20140282540A1 (en) Performant host selection for virtualization centers
US20180176289A1 (en) Information processing device, information processing system, computer-readable recording medium, and information processing method
US20140201356A1 (en) Monitoring system of managing cloud-based hosts and monitoring method using for the same
JP2011197852A (ja) 仮想計算機システムの管理プログラム,管理装置及び管理方法
JP6279816B2 (ja) ストレージ監視システムおよびその監視方法
US11212174B2 (en) Network management device and network management method
JP2019008454A (ja) 情報処理システムおよびリソース割り当て方法
US10552224B2 (en) Computer system including server storage system
US20180246824A1 (en) System provided with computer and storage apparatus and method for control of system
WO2012117471A1 (ja) 仮想サーバシステム、管理サーバ装置及びシステム管理方法
JP2015146148A (ja) 仮想マシン管理装置、仮想マシン管理方法、及び、仮想マシン管理プログラム

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 15899607

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2017530508

Country of ref document: JP

Kind code of ref document: A

WWE Wipo information: entry into national phase

Ref document number: 15551249

Country of ref document: US

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 15899607

Country of ref document: EP

Kind code of ref document: A1