WO2018131100A1 - Management system for managing calculator system - Google Patents

Management system for managing calculator system Download PDF

Info

Publication number
WO2018131100A1
WO2018131100A1 PCT/JP2017/000683 JP2017000683W WO2018131100A1 WO 2018131100 A1 WO2018131100 A1 WO 2018131100A1 JP 2017000683 W JP2017000683 W JP 2017000683W WO 2018131100 A1 WO2018131100 A1 WO 2018131100A1
Authority
WO
WIPO (PCT)
Prior art keywords
resource
resources
information
performance change
change information
Prior art date
Application number
PCT/JP2017/000683
Other languages
French (fr)
Japanese (ja)
Inventor
伸晋 清水
幸祐 柴田
Original Assignee
株式会社日立製作所
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社日立製作所 filed Critical 株式会社日立製作所
Priority to JP2018537551A priority Critical patent/JP6591689B2/en
Priority to PCT/JP2017/000683 priority patent/WO2018131100A1/en
Publication of WO2018131100A1 publication Critical patent/WO2018131100A1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]

Definitions

  • the present invention generally relates to management of a computer system having a plurality of resources.
  • the “performance history” is typically a time-series change of a metric value (performance value).
  • performance value a metric value
  • a “problem resource” is a resource in which a problem such as an abnormality (for example, a metric value exceeds a predetermined threshold) has occurred.
  • a bottleneck resource is a resource that is a bottleneck (for example, root cause) of a problem that has occurred.
  • a computer system usually includes two or more resources having different resource attributes.
  • “resource attribute” means at least one of a resource type and a metric (performance type). For this reason, “resource attributes are different” means that the resource type is different and the metric is different.
  • Patent Document 1 discloses an operation management apparatus.
  • the operation management device includes a performance item or a managed device as an element, and at least a first performance series information indicating a time series change of the performance information related to the first element and a time series change of the performance information related to the second element.
  • a correlation function with the second performance sequence information shown is derived.
  • performance change information that is, time-series changes of measured metric values (actually measured values) are essential for deriving a correlation function. For this reason, even if a problem resource occurs within a short period of time after the operation of the computer system is started, the amount of performance change information that can derive an appropriate correlation function is not accumulated. It is difficult to find a bottleneck resource corresponding to. This problem is particularly great when a correlation function is derived using performance change information including a metric value that is a problem. This is because, in general, it is desirable that the computer system is always normal, and therefore it is unlikely that the metric value in question is obtained during the operation of the computer system.
  • the configuration change of the computer system is appropriately performed.
  • the configuration change of the computer system includes, for example, addition, change or deletion of a logical resource (for example, addition, change or deletion of a virtual machine, addition, change or deletion of a volume), addition, change or deletion of a physical resource ( For example, physical server addition, change or deletion) and path change between resources (for example, addition, change or deletion of resources intervening between resources).
  • a logical resource for example, addition, change or deletion of a virtual machine, addition, change or deletion of a volume
  • a physical resource for example, physical server addition, change or deletion
  • path change between resources for example, addition, change or deletion of resources intervening between resources.
  • Patent Document 1 As described above, resource performance change information is required to derive a correlation function. Therefore, the configuration change of the computer system is equivalent to the start of a new operation of the computer system in Patent Document 1, and therefore the above-described problem exists also about the configuration change of the computer system.
  • Patent Document 1 it is necessary to re-derived a correlation function between resources for changing the configuration of a computer system. This is because in Patent Document 1, the correlation function is derived between individual resources, and when the configuration of the computer system is changed, as described above, a relationship between new resources arises or the same resource This is because the relationship may change even between the two, and as a result, the appropriate correlation function may become inappropriate.
  • Such a problem may be present in at least one of other cases in which the relationship between resources is specified and cases where a conversion method other than the correlation function is adopted.
  • the management system for each of one or more first resources of a computer system having a plurality of resources, actual performance change information according to the resource attribute of the first resource, of the second resource of the computer system Convert to estimated performance change information according to resource attributes.
  • the plurality of resources include two or more resources having different resource attributes.
  • the resource attribute is at least one of a resource type and a metric.
  • the performance change information is information representing a time-series change in the metric value of the resource.
  • the actual performance change information of the first resource is information representing a time-series change of the metric value measured for the first resource.
  • the estimated performance change information of the second resource includes the resource attribute of the first resource and the second of the plurality of conversion methods represented by the management information prepared in advance.
  • the actual performance change information of the first resource is the performance change information converted by using one or more conversion methods corresponding to the resource attribute of the resource.
  • Each of the plurality of conversion methods is a method for converting performance change information according to a resource attribute into performance change information according to another resource attribute.
  • Each of the one or more first resources is a resource related to the second resource in the topology of the computer system.
  • the management system determines the difference between the first resource and the second resource according to the difference between the estimated performance change information of the second resource and the actual performance change information of the second resource.
  • the actual performance change information of the second resource is information representing a time-series change of the metric value measured for the second resource.
  • the management system displays processing result information that is information based on the relationship calculated for each of the one or more first resources.
  • the processing result information includes information on at least one of the one or more first resources.
  • the estimated performance change information of the second resource is acquired based on the actual performance change information of the first resource, and the estimated performance change information and the second resource It can be expected to specify the relationship between resources based on actual performance change information.
  • FIG. 1 shows configurations of a computer system and a management system according to an embodiment.
  • An example of a part of the topology (resource topology) of a computer system is shown.
  • An example of a resource table is shown.
  • An example of a related resource table is shown.
  • An example of a correlation function related table is shown.
  • An example of a correlation function definition table is shown.
  • An example of a performance table is shown.
  • the flow and summary of a bottleneck candidate display process are shown.
  • the flow and outline of a route list generation process (S802 in FIG. 8) are shown.
  • the flow and outline of a bottleneck determination process (S805 in FIG. 8) are shown.
  • the flow and outline of a resource type list generation process (S1001 in FIG. 10) are shown.
  • the flow and outline of problem resource performance history estimation processing (S1002 in FIG. 10) are shown.
  • An outline of one embodiment is shown.
  • each table may be described using the expression “abc table”, but the information may be expressed using a data configuration other than the table.
  • At least one of the “abc tables” can be referred to as “abc information” to indicate that it does not depend on the data configuration.
  • the configuration of each table is an example, and one table may be divided into two or more tables, or all or part of the two or more tables may be a single table. Good.
  • the “interface unit” includes one or more interfaces.
  • the one or more interfaces may be one or more similar interface devices (for example, one or more NIC (Network Interface Card)) or two or more different interface devices (for example, NIC and HBA (Host Bus Adapter)). There may be.
  • NIC Network Interface Card
  • HBA Home Bus Adapter
  • the “storage unit” includes one or more memories.
  • the at least one memory may be a volatile memory or a non-volatile memory.
  • the storage unit is mainly used during processing by the processor unit.
  • the “processor unit” includes one or more processors.
  • the at least one processor is typically a microprocessor such as a CPU (Central Processing Unit).
  • Each of the one or more processors may be a single core or a multi-core.
  • the processor may include a hardware circuit that performs part or all of the processing.
  • the process may be described with “program” as the subject, but the program is executed by a processor (for example, a CPU (Central Processing Unit)) so that a predetermined process can be appropriately performed. Since the processing is performed using a storage unit (for example, a memory) and / or a communication interface device (for example, a communication port), the subject of processing may be a processor.
  • the processing described with the program as the subject may be processing performed by a processor or an apparatus having the processor.
  • the processor may include a hardware circuit that performs part or all of the processing.
  • the program may be installed in a computer-like device from a program source.
  • the program source may be, for example, a recording medium (for example, a non-transitory recording medium) that can be read by a program distribution server or a computer.
  • a recording medium for example, a non-transitory recording medium
  • two or more programs may be realized as one program, or one program may be realized as two or more programs.
  • the management system may be composed of one or more computers.
  • the management computer displays information (specifically, the management computer displays information on its own display device, or the management computer transmits display information to a remote display computer)
  • the management computer is the management system.
  • the plurality of computers may include a display computer when the display computer performs display
  • Input of information to the computer and output of information from the computer may be performed by an input / output device included in the computer. Examples of the input / output device include a display device, a keyboard, and a pointing device, but another device may be employed instead of or in addition to at least one of them.
  • a serial interface device or an Ethernet interface device (Ethernet is a registered trademark) is adopted, and a display computer having a display device, a keyboard, and a pointer device is connected to such an interface device.
  • the information may be output (for example, displayed) and input by the computer transmitting the display information to the display computer or the computer receiving the input information from the display computer.
  • the management server 557 is a management computer
  • the management client 555 is a display computer.
  • resource means a component of a computer system. Specifically, each of a plurality of devices constituting each computer system and each of a plurality of components included in each device. It is a generic name.
  • a device there are a physical device (for example, a network switch) and a logical device (for example, a virtual machine).
  • a component there are a physical component (for example, a microprocessor) and a logical component (for example, an LDEV (logical volume)). That is, there are physical resources and logical resources as resources.
  • the physical resource is, for example, a physical CPU and a physical memory.
  • the logical resource is a resource corresponding to at least one of a resource to which at least a part of one or more physical resources is allocated and a resource using at least a part of the one or more physical resources.
  • the logical resource is, for example, APP, logical volume, VM (Virtual Machine), or the like.
  • a “related resource” (resource related to a resource) of a resource is a resource linked directly or indirectly to the resource.
  • a related resource is “directly” linked to a resource, no other resource is interposed between the resource and the related resource.
  • a related resource is “indirectly” linked to a resource, one or more other resources are interposed between the resource and the related resource.
  • a related resource higher than the resource can be referred to as an “upper related resource”, and a lower related resource than the resource can be referred to as a “lower related resource”.
  • a related resource directly linked to a resource among upper related resources can be referred to as a “parent resource”, and a related resource directly linked to the resource among lower related resources can be referred to as a “child resource”.
  • FC Fibre Channel
  • a “node” is a resource as an element in a resource topology (tree structure).
  • an “edge” is a link between nodes. Thus, for example, if three resources are in series, there are three nodes and two edges.
  • a name is used as resource identification information, but other types of identification information may be used instead of or in addition to the name.
  • FIG. 13 shows an outline of one embodiment.
  • the correlation function is an example of a conversion method for converting a performance history according to a resource attribute of a resource into a performance history according to the resource attribute of another resource.
  • “Performance history” is an example of performance change information, and is a metric value history representing a time-series change of metric values.
  • the “resource attribute” is a resource type and a metric.
  • Correlation functions are prepared not for individual resources but for resource attributes. For this reason, the number of correlation functions to be prepared in advance (the amount of information in a correlation function related table described later) can be suppressed, and the versatility is high. For example, there are VMs (virtual machines) and ports between resources, but the resource attributes of all VMs are the same and the resource attributes of all ports are the same. In this case, the greater the number of VMs and the number of ports, the greater the number between resources, but the number between resource attributes is always 1. Further, when at least one of VM and port is added, changed or deleted, the resource is also added, changed or deleted, but the resource attribute is not changed, and therefore the addition, change or deletion of the correlation function may be unnecessary. .
  • the correlation function can be defined in advance based on know-how (for example, design information and operation knowledge) according to the resource attribute of the resource. Even if the elapsed time from the start of operation or configuration change of the computer system is short (even if the amount of actual performance history of each resource is small), there is an appropriate correlation function, so the resource attribute of the related resource and the problem resource.
  • the actual performance history of the related resource can be converted into the estimated performance history of the problem resource using one or more correlation functions corresponding to the resource attribute.
  • the relationship (correlation coefficient) between the related resource and the problem resource can be calculated using the estimated performance history of the problem resource and the actual performance history of the problem resource.
  • FIG. 1 shows a configuration of a computer system and a management system according to an embodiment.
  • the computer system 100 includes one or more hosts 553 and one or more storage systems 551 connected to the one or more hosts 553.
  • a host 553 is connected to the storage system 551 via a communication network 521 (for example, a SAN (Storage Area Network) or a LAN (Local Area Network)).
  • a communication network 521 for example, a SAN (Storage Area Network) or a LAN (Local Area Network)
  • the storage system 551 has a physical storage device group 563 and a controller 561 connected to the physical storage device group 563.
  • the physical storage device group 563 has one or more PG (Parity Group).
  • the PG may be called a RAID (Redundant Array of Independent (or Inexpensive) Disks) group.
  • the PG is composed of a plurality of physical storage devices, and stores data according to a predetermined RAID level.
  • the physical storage device is, for example, an HDD (Hard Disk Drive) or an SSD (Solid State Drive).
  • the storage system 551 has a plurality of logical volumes. As the logical volume, there is a substantive logical volume (real volume) 565 based on PG and a virtual logical volume (virtual volume) 567 according to thin provisioning or storage virtualization technology.
  • One storage system 551 does not necessarily have a plurality of types of logical volumes. For example, the storage system 551 may have only the real volume 565 as a logical volume.
  • a storage area is allocated from the pool to the virtual volume according to thin provisioning.
  • the pool is a storage area group based on one or more physical storage devices (for example, PG), and may be a set of one or more logical volumes, for example.
  • the pool may be a pool in which a difference between the original logical volume and its snapshot is stored instead of a pool having a storage area allocated to a virtual volume according to thin provisioning.
  • the controller 561 includes a plurality of devices, for example, a port, an MPB (a blade (circuit board) having one or a plurality of microprocessors (MP)), and a cache memory.
  • the port receives an I / O (Input / Output) command (write command or read command) from the host 553, and the MP included in the MPB controls I / O of data according to the I / O command.
  • the MP specifies an I / O destination logical volume from the received I / O command, and performs data I / O on the specified logical volume. Data that is I / O to the logical volume is temporarily stored in the cache memory.
  • the host 553 may be a physical machine (physical computer) or a virtual machine (VM).
  • One or more application programs (APP) 552 are executed on the host 553.
  • APP application programs
  • an I / O command specifying a logical volume is transmitted from the host 553 to the storage system 551.
  • the computer system 100 has a plurality of hierarchical resources.
  • the plurality of resources include resources of two or more resource types such as APP 552, host 553, storage system 551, controller 561, port, MPB, cache memory, logical volume, and PG.
  • a plurality of resources in the same layer may be grouped to define a higher layer resource than that layer resource.
  • the “resource” may be a substantial resource (either a logical resource or a physical resource) such as an APP or a logical volume, and a virtual resource that is a group of a plurality of substantial resources.
  • the management system includes a management server 557 and one or more management clients 555 connected to the management server 557.
  • a management client 555 is connected to the management server 557 via a communication network (for example, LAN, WAN (World Area Network) or the Internet) 521.
  • a communication network for example, LAN, WAN (World Area Network) or the Internet
  • the management client 555 includes an input device 501, a display device 502, a storage device (for example, memory) 505, a communication interface device (hereinafter referred to as I / F) 507, and a processor (for example, a CPU (Central Processing Unit)) connected thereto. 503.
  • the input device 501 is, for example, a pointing device and a keyboard.
  • the display device 502 is a device having a physical screen on which information is displayed, for example. A touch screen in which the input device 501 and the display device 502 are integrated may be employed.
  • the I / F 507 is connected to the communication network 521, and the management client 555 can communicate with the management server 557 via the I / F 507. Note that some or all of the communication network 521 and the network connecting the host 553 and the storage system 551 may be common.
  • the storage unit 505 includes, for example, at least a main storage device (typically a memory) of a main storage device and an auxiliary storage device.
  • the storage unit 505 can store a computer program executed by the processor 503 and information used by the processor 503.
  • the storage unit 505 stores a Web browser 511 and a management client program 513.
  • the management client program 513 may be RIA (Rich Internet Application).
  • the management client program is a program file, which may be downloaded from the management server 557 (or another computer) and stored in the storage unit 505.
  • the management server 557 includes a storage unit 535, an I / F 537, and a processor (for example, a CPU (Central Processing Unit)) 533 connected thereto.
  • the processor 533 is an example of a processor unit.
  • the I / F 537 is connected to the communication network 521, and the management server 557 can communicate with the management client 555 via the I / F 537.
  • the management server 557 can receive an instruction in accordance with a user operation via the I / F 537 and can draw a display object in the layout area. For this reason, the I / F 537 is an example of an I / O interface device.
  • the “layout area” here is an area where a display object can be drawn.
  • the entire or partial range of the layout area is a display range in a frame (for example, a window) displayed by the Web browser 511 (or the management client program 513).
  • a display image (including a display object) in the frame of the layout area in which the display object is drawn can be referred to as a display screen or a GUI screen.
  • drawing an object in the layout area is substantially an example of displaying the object.
  • the storage unit 535 includes, for example, at least a main storage device (typically a memory) of a main storage device and an auxiliary storage device.
  • the storage unit 535 can store a computer program executed by the processor 533 and information used by the processor 533.
  • the storage unit 535 stores a management server program 541 and a management table group 543.
  • the management table group 543 includes a hierarchical relationship (configuration information) of a plurality of resources included in the computer system, failure information of each resource, and the like. Information of at least a part of the management table group 543 may be collected by the management server program 541 or may be acquired by accessing another management system that holds the information.
  • the management server program 541 receives an instruction according to a user operation from the management client 555, and transmits information drawn in the layout area to the management client 555.
  • the GUI screen display corresponding to the user operation is realized by the cooperation processing of the management server program 541, the Web browser 511 (or the client RIA execution environment), and the management client program 513.
  • the management server program 541 creates a screen, provides the display information for the created screen to the management client program 513, and the management client program 513 may display the screen based on the display information.
  • a part of the creation processing (for example, drawing processing) may be offloaded from the management server program 541 to the management client program 513. Examples of cooperation include the following. For simplification of explanation, a case where (cooperation example 2) is adopted in the present embodiment will be described, but it is needless to say that it can also be applied to cooperation example 1.
  • the management server program 541 transmits at least part of the information included in the management table group 543 to the Web browser 511 (or the management client program 513), which is transmitted to the Web browser 511 (or the management client program 513). ) Is stored in the storage unit 505 as temporary information.
  • the web browser 511 (or the management client program 513) draws a display object in the layout area based on the instruction according to the user operation and the temporary information (for example, newly draws, enlarges or reduces the display object).
  • the management server program 541 receives an instruction according to a user operation on the display screen from the Web browser 511 (or the management client program 513), and displays display object display information based on the instruction and the management table group 543.
  • the Web browser 511 (or the management client program 513) receives the display information and draws the display object in the layout area according to the display information. In short, the management server program 541 draws a display object in the layout area.
  • the Web browser 511 (or the management client program 513) transmits an instruction according to the user operation to the management server program 541.
  • FIG. 2 shows an example of a part of the topology (resource topology) of the computer system 100.
  • VM is a virtual machine.
  • HV is a hypervisor that controls one or more virtual machines and is executed on the host.
  • CPU is a physical storage device.
  • DS is a data store recognized as a storage device by the hypervisor.
  • the resource belonging to the layer “SAN” is “FC-Switch” (FC (Fibre Channel) switch in SAN).
  • the resource belonging to the layer “Storage” is “Storage” (storage system).
  • “Port” is a communication port that is connected to the FC switch and receives an I / O command from the VM.
  • LDEV is a logical volume (real volume or virtual volume).
  • MP is a microprocessor.
  • “Pool” is a storage area including a real area allocated to a virtual volume according to thin provisioning.
  • “PG” is a parity group.
  • “Cache” is a cache memory in which data input / output to / from a logical volume is temporarily stored.
  • the topology configuration as shown in FIG. 2 is a configuration specified from the configuration information represented by the management table group 543.
  • One or more resource types may belong to one layer.
  • One group may be composed of two or more resources of the same resource type. In this case, there are a plurality of different groups for one resource type, and one or more resources of the resource type exist for each group. May be. That is, the “layer” is an aggregation of different resource types, and the “group” is an aggregation of different resources with the same resource type. At least one of the layer and the group may be defined by the user.
  • FIG. 3 shows an example of a resource table.
  • the resource table 400 has information on resources.
  • the resource table 400 has a record for each resource, for example.
  • Each record holds information such as a resource name (resource name) and a resource type name (resource type name).
  • FIG. 4 shows an example of a related resource table.
  • the related resource table 500 represents the relationship between resources.
  • the related resource table 500 has a record for each resource, and each record holds information such as a resource name and a child resource name (name of a resource child resource).
  • the management server program 541 can specify the related resource of the selected resource from the related resource table 500 using the resource name of the selected resource.
  • the management server program 541 can specify the lower related resource from the record specified from the related resource table 500 based on the record having the resource name of the selected resource.
  • the management server program 541 can specify the upper related resource from the record specified from the related resource table 500 based on the record having the resource name of the selected resource as the child resource name.
  • Each record of the related resource table 500 may hold a parent resource name instead of or in addition to the child resource name.
  • FIG. 5 shows an example of the correlation function relation table.
  • the correlation function relation table 550 holds information regarding the resource attribute of the conversion source (before conversion) and the resource attribute of the conversion destination (after conversion) for each correlation function.
  • the correlation function relation table 550 has a record for each correlation function, and each record includes a function name (correlation function name), a conversion source attribute (information indicating the resource attribute of the conversion source), and a conversion destination attribute (conversion). Information such as information representing the previous resource attribute).
  • the conversion source attribute is a conversion source resource type name (name of the conversion source resource type) and a conversion source metric name (name of the conversion source metric).
  • the conversion destination attributes are a conversion destination resource type name (the name of the conversion destination resource type) and a conversion destination metric name (the name of the conversion destination metric).
  • FIG. 6 shows an example of a correlation function definition table.
  • the correlation function definition table 600 has information on the definition of the correlation function for each correlation function.
  • the correlation function definition table 600 has a record for each correlation function, for example. Each record holds information such as the function name and function details (eg, the correlation function itself and variables used in the correlation function).
  • FIG. 7 shows an example of the performance table.
  • the performance table is a table having metric data collected for resources.
  • Each record of the performance table has information included in one metric data.
  • each record includes a resource name (a resource name corresponding to the collected metric value), a metric name (a metric name for the collected metric value), a time (a metric value collection time), Information such as a metric value is held.
  • the time is expressed in year / month / day / hour / minute / second, but the expression is not limited thereto.
  • the management server program 541 performs processing for collecting metric data of each of a plurality of resources in the computer system 100 and processing for adding a record including at least part of information of the collected metric data to the performance table 700. It's okay.
  • the metric and the resource type correspond to 1: 1 or many: 1. That is, one or more metrics exist for one resource type, but one metric does not correspond to a plurality of resource types.
  • the present invention is not limited thereto.
  • one metric type may correspond to a plurality of resource types.
  • the correlation coefficient (an example of the relationship) between the problem resource and its related resources can be calculated and displayed.
  • FIG. 8 shows the flow and outline of the bottleneck candidate display process. This process is started, for example, when a problem resource is detected by the management server program 541.
  • the management server program 541 executes a route list generation process (FIG. 9).
  • the route list is a list of resource pairs (a combination of a resource name and a child resource name) related to the problem resource.
  • the resource name included in the route list is as illustrated in FIG. 8 (that is, “HV4”, “DS3” etc.).
  • the resource names of the related resources lower than each of the resources “LDEV15” to “LDEV18” are omitted from the route list, but “Pool31”, “PG58”, and “MP4” Such lower related resource names are also included in the route list.
  • the management server program 541 acquires all child resource names from the route list generated in S801, and eliminates any duplicate child resource names from the acquired child resource names.
  • the list of remaining child resource names is the related resource list.
  • a child resource name constituting the related resource list is referred to as “related resource name”, and a resource represented by “related resource name” is referred to as “related resource”.
  • the management server program 541 sets “bottleneck candidate list” as an internal variable. Thereby, a bottleneck candidate list is generated in the bottleneck candidate display process.
  • S804 and S805 are executed for all related resources corresponding to the related resource list.
  • one related resource is taken as an example (referred to as “target related resource” in the description of FIG. 8).
  • the management server program 541 refers to the route list and identifies a route having the problem resource as the start point and the related resource as the end point.
  • the management server program 541 executes bottleneck determination processing (FIG. 10) for the route specified in S804. In this process, the bottleneck candidate list is updated.
  • the management server program 541 displays a completed bottleneck candidate list.
  • the bottleneck candidate list is a list of information (for example, resource names and correlation coefficients) related to related resources for which the calculated correlation coefficient (an example of the relationship) is greater than or equal to a predetermined value among the related resources of the problem resource “VM21”.
  • VM21 resource names and correlation coefficients
  • FIG. 9 shows the flow and outline of the route list generation process (S802 in FIG. 8).
  • the management server program 541 sets “route list” as an internal variable. Thereby, a route list is generated in the route list generation process.
  • the management server program 541 sets “resource name” as an internal variable.
  • the management server program 541 substitutes the resource name “VM21” of the problem resource as an initial value for “resource name”.
  • S904 and S905 are executed for all child resource names acquired directly or indirectly from the related resource table using the resource name of the problem resource as a key.
  • one child resource name is taken as an example (referred to as “target child resource name” in the description of FIG. 9).
  • the management server program 541 registers a pair of the target child resource name and the corresponding resource name in the route list.
  • the management server program 541 assigns the target child resource name to the internal variable “resource name”.
  • FIG. 10 shows the flow and outline of the bottleneck determination process (S805 in FIG. 8).
  • a single route (a route having the problem resource “VM21” as one end and one related resource “Port3” as the other end) is taken as an example.
  • the one route is referred to as “target route”, and the related resource at one end of the target route is referred to as “target related resource”.
  • the management server program 541 executes a resource type list generation process (FIG. 11).
  • the resource type list includes a resource name and a resource type name for each resource on the target route.
  • S1002 to S1006 are executed for all metrics of the target related resource.
  • one metric referred to as “target metric” in the description of FIGS. 10 and 12
  • target metric is taken as an example.
  • the management server program 541 executes problem resource performance history estimation processing (FIG. 12). That is, the management server program 541 converts the actual performance history for the target metric of the target related resource into the estimated performance history of the problem resource.
  • the management server program 541 acquires the actual performance history of the problem resource from the performance table using the resource name, metric name, and period of the problem resource as keys.
  • the management server program 541 calculates a correlation coefficient between the estimated performance history of the problem resource (performance history acquired in S1002) and the actual performance history of the problem resource (performance history acquired in S1003).
  • the management server program 541 determines whether or not the correlation coefficient calculated in S1004 is greater than or equal to a threshold value.
  • the management server program 541 registers the resource name of the target related resource and the correlation coefficient calculated in S1004 in the bottleneck candidate list.
  • the bottleneck candidate list is displayed in S806 of FIG. 8, but the related resource names (and correlation coefficients) included in the bottleneck candidate list are narrowed down based on the correlation coefficient. Thereby, the visibility of the displayed bottleneck candidate list can be improved.
  • the bottleneck candidate list has been updated for the target related resource.
  • FIG. 11 shows the flow and outline of the resource type list generation process (S1001 in FIG. 10).
  • the management server program 541 sets “resource type list” as an internal variable. Thereby, a resource type list is generated in the resource type list generation process.
  • S1102 and S1103 are executed for all resources on the target route.
  • one resource is taken as an example in the description of S1102 and S1103 (referred to as “target resource” in the description of FIG. 11).
  • the management server program 541 acquires the resource type name from the resource table using the resource name of the target resource as a key.
  • the management server program 541 sets the resource name of the target resource and the resource type name acquired in S1102 in the resource type list.
  • FIG. 12 shows a flow and an outline of the problem resource performance history estimation process (S1002 in FIG. 10).
  • the management server program 541 sets “estimation history” as an internal variable. Thereby, in the problem resource performance history estimation process, an estimated performance history of the problem resource is generated.
  • the management server program 541 acquires the actual performance history of the target related resource from the performance table using the metric name and period of the target related resource as a key.
  • the management server program 541 substitutes the actual performance history of the target related resource as an initial value for the internal variable “estimation history”.
  • S1204 to S1207 are executed for all edges in the target route that is a route from the target related resource to the problem resource.
  • the edges are sequentially selected from the target related resource side to the problem resource side.
  • one edge is taken as an example (referred to as “target edge” in the description of FIG. 12).
  • the management server program 541 acquires the resource type name from the resource type list for each of the conversion source resource and the conversion destination resource using the resource name as a key.
  • the “conversion source resource” is a resource on the target related resource side among the resources at both ends of the target edge.
  • the “conversion destination resource” is a resource on the problem resource side among the resources at both ends of the target edge.
  • the management server program 541 determines the conversion source resource type name (conversion source resource resource type name), conversion source metric name (conversion source resource metric name), conversion destination resource type name (conversion destination resource resource type name). ) And the conversion destination metric name (metric name of the conversion destination resource) as keys, the function name of the correlation function used for estimation is acquired from the correlation function relation table 550.
  • the management server program 541 acquires the correlation function from the correlation function definition table 600 using the acquired function name as a key, and the performance history assigned to the internal variable “estimation history” is used as the acquired correlation function. Use to convert to another performance history.
  • the management server program 541 substitutes the converted estimation history (another performance history in S1206) into the internal variable “estimation history”.
  • edges are sequentially selected from the target related resource side to the problem resource side, and S1204 to S1207 are executed for the selected edge.
  • the target route includes four edges, four performance history conversions, that is, (1) the parent resource “FC” from the actual performance history of the target related resource “Port3” Conversion to the estimated performance history of Switch 4 ”, (2) Conversion from the estimated performance history of the resource“ FC Switch 4 ”to the estimated performance history of the parent resource“ DS3 ”, and (3) From the estimated performance history of the resource“ DS3 ” Conversion to the estimated performance history of the parent resource “HV4” and (4) conversion from the estimated performance history of the resource “HV4” to the estimated performance history of the parent resource (problem resource) “VM21” are executed.
  • the performance history set in the internal variable “estimation history” when S1204 to S1207 are performed for all the edges is the estimated performance history of the problem resource.
  • the performance history conversion may be performed once, that is, the actual performance history of the target related resource may be directly converted to the estimated performance history of the problem resource.
  • the following effects can be expected by sequentially performing edge selection and performance history conversion for the selected edge from the target related resource side to the problem resource side. . That is, without preparing a correlation function for all combinations of resource attributes (resource type and metric) (ie, without considering each of one or more resource attributes interposed between resource attributes), in other words, While suppressing the amount of information in the correlation function relation table 550, it can be expected to improve the accuracy of the performance estimation history of the problem resource.
  • the present invention can be implemented in various other forms.
  • the present invention is not limited to the case of specifying the bottleneck candidate resource of the problem resource, but can be applied to other cases of specifying the relationship between resources. Further, for example, the present invention can be applied to a case where a conversion method other than the correlation function is employed.

Abstract

This management system converts actual performance change information, which is in accordance with resource attributes of a first resource, to estimated performance change information, which is in accordance with resource attributes of a second resource. The resource attributes is at least one among a resource type and a metric. The actual performance change information represents a time-series change of a measured metric value. The estimated performance change information is performance change information that is converted from actual performance change information of the first resource by using one or more conversion methods corresponding to the resource attributes of the first resource and the resource attributes of the second resource among a plurality of conversion methods represented by management information prepared in advance. The first resource relates to a second resource in a topology of a calculator system. A management system calculates a relationship between the first resource and the second resource according to a difference between estimated performance change information of the second resource and actual performance change information of the second resource. The management system displays processing result information based on the relationship calculated with respect to the first resource.

Description

計算機システムを管理する管理システムManagement system for managing computer systems
 本発明は、概して、複数のリソースを有する計算機システムの管理に関する。 The present invention generally relates to management of a computer system having a plurality of resources.
 近年、計算機システム(例えばクラウド基盤)について、「CPU」や「メモリ」等の物理リソースを「仮想マシン」や「ボリューム」などの論理リソースの単位でユーザに割り当てて運用していることが多くなっている。ユーザリソース(例えばユーザが認識する論理リソース)とシステムリソース(例えばユーザが認識しない物理リソース)の関係が複雑となっている計算機システムの性能を監視するために、ベースライン監視等のシステム監視技術を用いて計算機システムの運用を行う技術が存在する。 In recent years, regarding computer systems (for example, cloud platforms), physical resources such as “CPU” and “memory” are often allocated to users in units of logical resources such as “virtual machines” and “volumes”. ing. In order to monitor the performance of a computer system in which the relationship between user resources (for example, logical resources recognized by the user) and system resources (for example, physical resources that are not recognized by the user) is complicated, system monitoring technology such as baseline monitoring is used. There are technologies that use it to operate computer systems.
 この種の技術では、一般に、個々のリソースについて、性能履歴が管理される。「性能履歴」は、典型的には、メトリック値(性能値)の時系列変化である。問題リソースが発見された場合、ユーザは、その問題リソースに対応したボトルネックリソースを探す。リソースの関係が複雑化したことで、人手では、ボトルネックリソースを探すことが難しくなり、この技術の重要性が増している。「問題リソース」とは、異常(例えばメトリック値が所定の閾値を超えた)のような問題が生じているリソースである。ボトルネックリソースとは、生じている問題のボトルネック(例えば根本原因)となっているリソースである。 This type of technology generally manages the performance history for each resource. The “performance history” is typically a time-series change of a metric value (performance value). When a problem resource is found, the user searches for a bottleneck resource corresponding to the problem resource. The complexity of resource relationships makes it difficult for people to find bottleneck resources manually, and the importance of this technology is increasing. A “problem resource” is a resource in which a problem such as an abnormality (for example, a metric value exceeds a predetermined threshold) has occurred. A bottleneck resource is a resource that is a bottleneck (for example, root cause) of a problem that has occurred.
 計算機システムは、通常、リソース属性が異なる2以上のリソースを含んでいる。本明細書において、「リソース属性」とは、リソースタイプとメトリック(性能タイプ)とのうちの少なくとも1つを意味する。このため、「リソース属性が異なる」とは、リソースタイプが異なる、及び、メトリックが異なる、のうちの少なくとも1つに該当することを意味する。 A computer system usually includes two or more resources having different resource attributes. In this specification, “resource attribute” means at least one of a resource type and a metric (performance type). For this reason, “resource attributes are different” means that the resource type is different and the metric is different.
 リソース属性の異なるリソースの性能変化情報(メトリック値の時系列変化)を比較しても、リソース属性の異なるリソース間の関係性(関係の度合)を特定することは難しい。なぜなら、リソース属性の異なるリソース間では、メトリックが異なっていたり、メトリックが同じでも性能変化の傾向が異なっていたりするからである。 Even if the performance change information of resources with different resource attributes (metric value time-series changes) is compared, it is difficult to specify the relationship (degree of relationship) between resources with different resource attributes. This is because resources with different resource attributes have different metrics, and even if the metrics are the same, the tendency of performance change differs.
 特許文献1は、運用管理装置を開示している。その運用管理装置は、性能種目又は被管理装置を要素とし、少なくとも第1の要素に関する性能情報の時系列変化を示す第1の性能系列情報と、第2の要素に関する性能情報の時系列変化を示す第2の性能系列情報との相関関数を導出する。 Patent Document 1 discloses an operation management apparatus. The operation management device includes a performance item or a managed device as an element, and at least a first performance series information indicating a time series change of the performance information related to the first element and a time series change of the performance information related to the second element. A correlation function with the second performance sequence information shown is derived.
特開2011-146073号公報JP 2011-146073
 特許文献1では、相関関数の導出に、性能変化情報、すなわち、測定されたメトリック値(実測値)の時系列変化が必須である。このため、計算機システムを運用開始してから短時間のうちに問題リソースが発生しても、適切な相関関数を導出できる程の量の性能変化情報が蓄積されておらず、故に、その問題リソースに対応したボトルネックリソースを見つけることは困難である。この課題は、特に、問題とされるメトリック値を含んだ性能変化情報を用いて相関関数を導出する場合に大きい。なぜなら、一般に、計算機システムは常に正常であることが望ましく、故に、計算機システムの運用中に問題のメトリック値が得られることは少ないと考えられるからである。 In Patent Document 1, performance change information, that is, time-series changes of measured metric values (actually measured values) are essential for deriving a correlation function. For this reason, even if a problem resource occurs within a short period of time after the operation of the computer system is started, the amount of performance change information that can derive an appropriate correlation function is not accumulated. It is difficult to find a bottleneck resource corresponding to. This problem is particularly great when a correlation function is derived using performance change information including a metric value that is a problem. This is because, in general, it is desirable that the computer system is always normal, and therefore it is unlikely that the metric value in question is obtained during the operation of the computer system.
 また、一般に、計算機システムの構成変更が適宜行われるが、上述の課題は、計算機システムの構成変更についても同様に存在する。具体的には、次の通りである。すなわち、計算機システムの構成変更とは、例えば、論理リソースの追加、変更又は削除(例えば、仮想マシンの追加、変更又は削除、ボリュームの追加、変更又は削除)、物理リソースの追加、変更又は削除(例えば、物理サーバの追加、変更又は削除)、及び、リソース間の経路変更(例えば、リソース間に介在するリソースの追加、変更又は削除)である。このため、計算機システムの構成変更が行われると、新たなリソース間の関係が生じたり、同一リソース間であってもその関係性が変わったりすることがあり、結果として、リソースの性能変化の傾向が変わることがある。特許文献1では、上述したように、相関関数の導出には、リソースの性能変化情報が必要である。従って、計算機システムの構成変更は、特許文献1では計算機システムの新規の運用開始と同等であり、故に、計算機システムの構成変更についても上述の課題がある。 In general, the configuration change of the computer system is appropriately performed. However, the above-mentioned problem similarly exists for the configuration change of the computer system. Specifically, it is as follows. That is, the configuration change of the computer system includes, for example, addition, change or deletion of a logical resource (for example, addition, change or deletion of a virtual machine, addition, change or deletion of a volume), addition, change or deletion of a physical resource ( For example, physical server addition, change or deletion) and path change between resources (for example, addition, change or deletion of resources intervening between resources). For this reason, when a computer system configuration change is made, relationships between new resources may occur, or even relationships between the same resources may change, resulting in a trend of resource performance changes. May change. In Patent Document 1, as described above, resource performance change information is required to derive a correlation function. Therefore, the configuration change of the computer system is equivalent to the start of a new operation of the computer system in Patent Document 1, and therefore the above-described problem exists also about the configuration change of the computer system.
 更に、特許文献1では、計算機システムの構成変更については、リソース間の相関関数を再導出する必要がある。なぜなら、特許文献1では、相関関数は、個々のリソース間について導出されるものであり、計算機システムの構成変更が行われると、上述したように、新たなリソース間の関係が生じたり、同一リソース間であってもその関係性が変わったりすることがあり、結果として、適切であった相関関数が不適切になり得るからである。 Furthermore, in Patent Document 1, it is necessary to re-derived a correlation function between resources for changing the configuration of a computer system. This is because in Patent Document 1, the correlation function is derived between individual resources, and when the configuration of the computer system is changed, as described above, a relationship between new resources arises or the same resource This is because the relationship may change even between the two, and as a result, the appropriate correlation function may become inappropriate.
 このような課題は、リソース間の関係性を特定する他のケース、及び、相関関数以外の変換方法が採用されるケースのうちの少なくとも1つについてあり得る。 Such a problem may be present in at least one of other cases in which the relationship between resources is specified and cases where a conversion method other than the correlation function is adopted.
 管理システムは、複数のリソースを有する計算機システムのうちの1以上の第1のリソースの各々について、その第1のリソースのリソース属性に従う実性能変化情報を、計算機システムのうちの第2のリソースのリソース属性に従う推定性能変化情報に変換する。複数のリソースは、リソース属性が異なる2以上のリソースを含む。複数のリソースの各々について、リソース属性は、リソースタイプ及びメトリックのうちの少なくとも1つである。1以上の第1のリソースと第2のリソースの各々について、性能変化情報は、そのリソースのメトリック値の時系列変化を表す情報である。1以上の第1のリソースの各々について、その第1のリソースの実性能変化情報は、その第1のリソースについて測定されたメトリック値の時系列変化を表す情報である。1以上の第1のリソースの各々について、第2のリソースの推定性能変化情報は、予め用意された管理情報が表す複数の変換方法のうちの、その第1のリソースのリソース属性と第2のリソースのリソース属性とに対応した1以上の変換方法を用いて、その第1のリソースの実性能変化情報が変換された性能変化情報である。複数の変換方法の各々は、リソース属性に従う性能変化情報を別のリソース属性に従う性能変化情報に変換するための方法である。1以上の第1のリソースの各々は、計算機システムのトポロジーにおいて第2のリソースに関連するリソースである。管理システムは、1以上の第1のリソースの各々について、第2のリソースの推定性能変化情報と第2のリソースの実性能変化情報との差分に従いその第1のリソースと第2のリソースとの関係性を算出する。第2のリソースの実性能変化情報は、その第2のリソースについて測定されたメトリック値の時系列変化を表す情報である。管理システムは、1以上の第1のリソースの各々について算出された関係性に基づく情報である処理結果情報を表示する。処理結果情報は、1以上の第1のリソースのうちの少なくとも1つに関する情報を含む。 The management system, for each of one or more first resources of a computer system having a plurality of resources, actual performance change information according to the resource attribute of the first resource, of the second resource of the computer system Convert to estimated performance change information according to resource attributes. The plurality of resources include two or more resources having different resource attributes. For each of the plurality of resources, the resource attribute is at least one of a resource type and a metric. For each of the one or more first resources and second resources, the performance change information is information representing a time-series change in the metric value of the resource. For each of the one or more first resources, the actual performance change information of the first resource is information representing a time-series change of the metric value measured for the first resource. For each of the one or more first resources, the estimated performance change information of the second resource includes the resource attribute of the first resource and the second of the plurality of conversion methods represented by the management information prepared in advance. The actual performance change information of the first resource is the performance change information converted by using one or more conversion methods corresponding to the resource attribute of the resource. Each of the plurality of conversion methods is a method for converting performance change information according to a resource attribute into performance change information according to another resource attribute. Each of the one or more first resources is a resource related to the second resource in the topology of the computer system. For each of the one or more first resources, the management system determines the difference between the first resource and the second resource according to the difference between the estimated performance change information of the second resource and the actual performance change information of the second resource. Calculate the relationship. The actual performance change information of the second resource is information representing a time-series change of the metric value measured for the second resource. The management system displays processing result information that is information based on the relationship calculated for each of the one or more first resources. The processing result information includes information on at least one of the one or more first resources.
 計算機システムの運用開始又構成変更からの時間が短くても、第1リソースの実性能変化情報を基に第2のリソースの推定性能変化情報を取得し、その推定性能変化情報と第2リソースの実性能変化情報とを基にリソース間の関係性を特定することが期待できる。 Even if the time from the start of operation or configuration change of the computer system is short, the estimated performance change information of the second resource is acquired based on the actual performance change information of the first resource, and the estimated performance change information and the second resource It can be expected to specify the relationship between resources based on actual performance change information.
実施例に係る計算機システム及び管理システムの構成を示す。1 shows configurations of a computer system and a management system according to an embodiment. 計算機システムのトポロジー(リソーストポロジー)の一部の一例を示す。An example of a part of the topology (resource topology) of a computer system is shown. リソーステーブルの一例を示す。An example of a resource table is shown. 関連リソーステーブルの一例を示す。An example of a related resource table is shown. 相関関数関連テーブルの一例を示す。An example of a correlation function related table is shown. 相関関数定義テーブルの一例を示す。An example of a correlation function definition table is shown. 性能テーブルの一例を示す。An example of a performance table is shown. ボトルネック候補表示処理のフロー及び概要を示す。The flow and summary of a bottleneck candidate display process are shown. 経路一覧生成処理(図8のS802)のフロー及び概要を示す。The flow and outline of a route list generation process (S802 in FIG. 8) are shown. ボトルネック判定処理(図8のS805)のフロー及び概要を示す。The flow and outline of a bottleneck determination process (S805 in FIG. 8) are shown. リソースタイプ一覧生成処理(図10のS1001)のフロー及び概要を示す。The flow and outline of a resource type list generation process (S1001 in FIG. 10) are shown. 問題リソース性能履歴推定処理(図10のS1002)のフロー及び概要を示す。The flow and outline of problem resource performance history estimation processing (S1002 in FIG. 10) are shown. 一実施例の概要を示す。An outline of one embodiment is shown.
 以下の説明では、「abcテーブル」の表現にて情報を説明することがあるが、情報は、テーブル以外のデータ構成で表現されていてもよい。データ構成に依存しないことを示すために「abcテーブル」のうちの少なくとも1つを「abc情報」と呼ぶことができる。また、以下の説明において、各テーブルの構成は一例であり、1つのテーブルは、2以上のテーブルに分割されてもよいし、2以上のテーブルの全部または一部が1つのテーブルであってもよい。 In the following description, information may be described using the expression “abc table”, but the information may be expressed using a data configuration other than the table. At least one of the “abc tables” can be referred to as “abc information” to indicate that it does not depend on the data configuration. In the following description, the configuration of each table is an example, and one table may be divided into two or more tables, or all or part of the two or more tables may be a single table. Good.
 また、以下の説明では、「インターフェース部」は、1以上のインターフェースを含む。1以上のインターフェースは、1以上の同種のインターフェースデバイス(例えば1以上のNIC(Network Interface Card))であってもよいし2以上の異種のインターフェースデバイス(例えばNICとHBA(Host Bus Adapter))であってもよい。 In the following description, the “interface unit” includes one or more interfaces. The one or more interfaces may be one or more similar interface devices (for example, one or more NIC (Network Interface Card)) or two or more different interface devices (for example, NIC and HBA (Host Bus Adapter)). There may be.
 また、以下の説明では、「記憶部」は、1以上のメモリを含む。少なくとも1つのメモリは、揮発性メモリであってもよいし不揮発性メモリであってもよい。記憶部は、主に、プロセッサ部による処理の際に使用される。 In the following description, the “storage unit” includes one or more memories. The at least one memory may be a volatile memory or a non-volatile memory. The storage unit is mainly used during processing by the processor unit.
 また、以下の説明では、「プロセッサ部」は、1以上のプロセッサを含む。少なくとも1つのプロセッサは、典型的には、CPU(Central Processing Unit)のようなマイクロプロセッサである。1以上のプロセッサの各々は、シングルコアでもよいしマルチコアでもよい。プロセッサは、処理の一部または全部を行うハードウェア回路を含んでもよい。 In the following description, the “processor unit” includes one or more processors. The at least one processor is typically a microprocessor such as a CPU (Central Processing Unit). Each of the one or more processors may be a single core or a multi-core. The processor may include a hardware circuit that performs part or all of the processing.
 また、以下の説明では、「プログラム」を主語として処理を説明する場合があるが、プログラムは、プロセッサ(例えばCPU(Central Processing Unit))によって実行されることで、定められた処理を、適宜に記憶部(例えばメモリ)及び/又は通信インターフェースデバイス(例えば通信ポート)等を用いながら行うため、処理の主語がプロセッサとされてもよい。プログラムを主語として説明された処理は、プロセッサあるいはそのプロセッサを有する装置が行う処理としてもよい。また、プロセッサは、処理の一部または全部を行うハードウエア回路を含んでもよい。プログラムは、プログラムソースから計算機のような装置にインストールされてもよい。プログラムソースは、例えば、プログラム配布サーバまたは計算機が読み取り可能な記録媒体(例えば非一時的な記録媒体)であってもよい。また、以下の説明において、2以上のプログラムが1つのプログラムとして実現されてもよいし、1つのプログラムが2以上のプログラムとして実現されてもよい。 In the following description, the process may be described with “program” as the subject, but the program is executed by a processor (for example, a CPU (Central Processing Unit)) so that a predetermined process can be appropriately performed. Since the processing is performed using a storage unit (for example, a memory) and / or a communication interface device (for example, a communication port), the subject of processing may be a processor. The processing described with the program as the subject may be processing performed by a processor or an apparatus having the processor. The processor may include a hardware circuit that performs part or all of the processing. The program may be installed in a computer-like device from a program source. The program source may be, for example, a recording medium (for example, a non-transitory recording medium) that can be read by a program distribution server or a computer. In the following description, two or more programs may be realized as one program, or one program may be realized as two or more programs.
 また、以下の説明では、管理システムは、1以上の計算機で構成されてよい。具体的には、例えば、管理計算機が情報を表示する場合(具体的には、管理計算機が自分の表示デバイスに情報を表示する、或いは、管理計算機が表示用情報を遠隔の表示用計算機に送信する場合)、管理計算機が管理システムである。また、例えば、複数の計算機で管理計算機と同等の機能が実現されている場合は、当該複数の計算機(表示を表示用計算機が行う場合は表示用計算機を含んでよい)が、管理システムである。計算機への情報の入力や、計算機からの情報の出力は、計算機が有する入出力デバイスにより行われてよい。入出力デバイスの例としては、表示デバイス、キーボード及びポインティングデバイスが考えられるが、これらのうちの少なくとも1つに代えて又は加えて別のデバイスが採用されてよい。また、入出力デバイスの代替として、シリアルインターフェースデバイスやイーサーネットインターフェースデバイス(イーサネットは登録商標)が採用され、そのようなインターフェースデバイスに、表示デバイスとキーボード及びポインタデバイスとを有する表示用計算機が接続され、計算機が表示用情報を表示用計算機に送信したり、計算機が入力用情報を表示用計算機から受信したりすることで、情報の出力(例えば表示)及び入力が行われてよい。以下の説明では、管理サーバ557が管理計算機であり、管理クライアント555が表示用計算機である。 In the following description, the management system may be composed of one or more computers. Specifically, for example, when the management computer displays information (specifically, the management computer displays information on its own display device, or the management computer transmits display information to a remote display computer) The management computer is the management system. For example, when a function equivalent to that of the management computer is realized by a plurality of computers, the plurality of computers (may include a display computer when the display computer performs display) is the management system. . Input of information to the computer and output of information from the computer may be performed by an input / output device included in the computer. Examples of the input / output device include a display device, a keyboard, and a pointing device, but another device may be employed instead of or in addition to at least one of them. As an alternative to the input / output device, a serial interface device or an Ethernet interface device (Ethernet is a registered trademark) is adopted, and a display computer having a display device, a keyboard, and a pointer device is connected to such an interface device. The information may be output (for example, displayed) and input by the computer transmitting the display information to the display computer or the computer receiving the input information from the display computer. In the following description, the management server 557 is a management computer, and the management client 555 is a display computer.
 また、以下の説明では、「リソース」とは、計算機システムの構成要素を意味し、具体的には、計算機システムを構成する複数の装置の各々、及び、各装置が有する複数のコンポーネントの各々の総称である。装置として、物理的な装置(例えばネットワークスイッチ)もあれば論理的な装置(例えば仮想マシン)もある。同様に、コンポーネントとして、物理的なコンポーネント(例えばマイクロプロセッサ)もあれば論理的なコンポーネント(例えばLDEV(論理ボリューム))もある。すなわち、リソースとしては、物理リソースと論理リソースとがある。物理リソースは、例えば、物理CPU及び物理メモリ等である。論理リソースは、1以上の物理リソースの少なくとも一部が割り当てられたリソース、及び、1以上の物理リソースの少なくとも一部を使用するリソースのうちの少なくとも1つに該当するリソースである。論理リソースは、例えば、APP、論理ボリューム及びVM(Virtual Machine)等である。 In the following description, “resource” means a component of a computer system. Specifically, each of a plurality of devices constituting each computer system and each of a plurality of components included in each device. It is a generic name. As a device, there are a physical device (for example, a network switch) and a logical device (for example, a virtual machine). Similarly, as a component, there are a physical component (for example, a microprocessor) and a logical component (for example, an LDEV (logical volume)). That is, there are physical resources and logical resources as resources. The physical resource is, for example, a physical CPU and a physical memory. The logical resource is a resource corresponding to at least one of a resource to which at least a part of one or more physical resources is allocated and a resource using at least a part of the one or more physical resources. The logical resource is, for example, APP, logical volume, VM (Virtual Machine), or the like.
 また、以下の説明では、リソースの「関連リソース」(リソースに関連するリソース)とは、リソースに直接的又は間接的にリンクしたリソースである。リソースに関連リソースが「直接的に」リンクしている場合、リソースと関連リソースの間に他のリソースが介在しない。リソースに関連リソースが「間接的に」リンクしている場合、リソースと関連リソースの間に他の1以上のリソースが介在する。リソースよりも上位の関連リソースを、「上位関連リソース」と言うことができ、リソースよりも下位の関連リソースを、「下位関連リソース」と言うことができる。また、上位関連リソースのうち、リソースに直接的にリンクしている関連リソースを「親リソース」と言うことができ、下位関連リソースのうち、リソースに直接的にリンクしている関連リソースを「子リソース」と言うことができる。なお、「上位/下位」や「親/子」の概念は、ユーザが何を管理(例えば監視)する立場であるかによって変化する場合があり、また省略されてもかまわない。例えば、関連が、サーバとストレージシステムとのFC(Fibre Channel)スイッチを介した「接続関係」の場合、単に接続されているというレベルで見ればサーバとストレージシステムはどちらが上位や親かは一意に定まるものではなく、ユーザの立場によってサーバを上位と考えるか、ストレージシステムを上位と考えるか、又は上下という概念を持ち込まないかが決まってよい。反対に、関連が、包含(例えばノードがコンポーネントを含む)場合は、ノードの下位(又は子)はコンポーネントであるという概念はユーザの立場によらず共通である場合が多い。 In the following description, a “related resource” (resource related to a resource) of a resource is a resource linked directly or indirectly to the resource. When a related resource is “directly” linked to a resource, no other resource is interposed between the resource and the related resource. When a related resource is “indirectly” linked to a resource, one or more other resources are interposed between the resource and the related resource. A related resource higher than the resource can be referred to as an “upper related resource”, and a lower related resource than the resource can be referred to as a “lower related resource”. In addition, a related resource directly linked to a resource among upper related resources can be referred to as a “parent resource”, and a related resource directly linked to the resource among lower related resources can be referred to as a “child resource”. Resource ". Note that the concept of “upper / lower” and “parent / child” may change depending on what the user is managing (for example, monitoring), or may be omitted. For example, if the connection is a “connection relationship” between the server and the storage system via an FC (Fibre Channel) switch, the server or storage system is uniquely identified as the higher level or parent when viewed from the level of simply being connected. It is not fixed, and it may be determined by the user's standpoint whether the server is considered higher, the storage system is considered higher, or the concept of up and down is not introduced. Conversely, if the association is inclusive (for example, a node contains a component), the concept that a subordinate (or child) of a node is a component is often common regardless of the user's position.
 また、以下の説明では、「ノード」は、リソーストポロジー(木構造)における要素としてのリソースである。また、以下の説明では、「エッジ」は、ノード間のリンクである。従って、例えば、3つのリソースが直列になっている場合、ノードは3つであり、エッジは2つである。 In the following description, a “node” is a resource as an element in a resource topology (tree structure). In the following description, an “edge” is a link between nodes. Thus, for example, if three resources are in series, there are three nodes and two edges.
 また、以下の説明では、リソースの識別情報として、名前が使用されるが、名前に代えて又は加えて他種の識別情報が使用されてもよい。 In the following description, a name is used as resource identification information, but other types of identification information may be used instead of or in addition to the name.
 また、以下の説明では、同種の要素を区別しないで説明する場合には、参照符号を使用し、同種の要素を区別して説明する場合は、要素の識別情報としての名前を使用することがある。 Also, in the following description, reference symbols are used when explaining without distinguishing the same type of elements, and names as element identification information may be used when explaining the same type of elements separately. .
 図13は、一実施例の概要を示す。 FIG. 13 shows an outline of one embodiment.
 複数の相関関数が予め用意されている。相関関数は、リソースのリソース属性に従う性能履歴を別のリソースのリソース属性に従う性能履歴に変換するための変換方法の一例である。「性能履歴」は、性能変化情報の一例であり、メトリック値の時系列変化を表すメトリック値履歴である。本実施例では、「リソース属性」は、リソースタイプ及びメトリックである。 • Multiple correlation functions are prepared in advance. The correlation function is an example of a conversion method for converting a performance history according to a resource attribute of a resource into a performance history according to the resource attribute of another resource. “Performance history” is an example of performance change information, and is a metric value history representing a time-series change of metric values. In this embodiment, the “resource attribute” is a resource type and a metric.
 相関関数は、個々のリソース間についてではなく、リソース属性間について用意される。このため、事前に用意されるべき相関関数の数(後述の相関関数関連テーブルの情報量)を抑えることができ、また、汎用性が高い。例えば、リソース間として、VM(仮想マシン)とポート間があるが、全てのVMのリソース属性が同一であり且つ全てのポートのリソース属性が同一であるとする。この場合、VMの数及びポートの数が多い程、リソース間の数も多いが、リソース属性間の数は常に1である。また、VMとポートの少なくとも1つが追加、変更又は削除となると、リソース間も追加、変更又は削除となるが、リソース属性間は変わらず、故に、相関関数の追加、変更又は削除も不要でよい。 ∙ Correlation functions are prepared not for individual resources but for resource attributes. For this reason, the number of correlation functions to be prepared in advance (the amount of information in a correlation function related table described later) can be suppressed, and the versatility is high. For example, there are VMs (virtual machines) and ports between resources, but the resource attributes of all VMs are the same and the resource attributes of all ports are the same. In this case, the greater the number of VMs and the number of ports, the greater the number between resources, but the number between resource attributes is always 1. Further, when at least one of VM and port is added, changed or deleted, the resource is also added, changed or deleted, but the resource attribute is not changed, and therefore the addition, change or deletion of the correlation function may be unnecessary. .
 リソースのリソース属性に従うノウハウ(例えば、設計情報や運用ナレッジ)に基づいて、相関関数を事前に定義しておくことができる。計算機システムの運用開始又は構成変更からの経過時間が短くても(各リソースの実性能履歴の量が少なくても)、適切な相関関数が存在し、故に、関連リソースのリソース属性と問題リソースのリソース属性に対応した1以上の相関関数を用いて、関連リソースの実性能履歴を問題リソースの推定性能履歴に変換することができる。そして、問題リソースの推定性能履歴と、問題リソースの実性能履歴とを用いて、関連リソースと問題リソースの関係性(相関係数)を算出することができる。これは、特に、本実施例のように、第2リソースの一例として、問題リソースが採用され、第1リソースの一例として、問題リソースの関連リソースが採用される場合に大きいと考えられる。なぜなら、問題のあるメトリック値(例えばしきい値を超えたメトリック値)が測定される頻度は、正常なメトリック値が測定される頻度に比べて小さいが、本実施例では、上述したように、リソース属性に従うノウハウに基づいて相関関数を事前に用意しておくことができるため、計算機システムの運用開始又は構成変更からの経過時間が短いうちに問題リソースが検出されても、その問題リソースの関連リソースがボトルネック候補であるか否かを正確に判定することが期待できる。 The correlation function can be defined in advance based on know-how (for example, design information and operation knowledge) according to the resource attribute of the resource. Even if the elapsed time from the start of operation or configuration change of the computer system is short (even if the amount of actual performance history of each resource is small), there is an appropriate correlation function, so the resource attribute of the related resource and the problem resource The actual performance history of the related resource can be converted into the estimated performance history of the problem resource using one or more correlation functions corresponding to the resource attribute. The relationship (correlation coefficient) between the related resource and the problem resource can be calculated using the estimated performance history of the problem resource and the actual performance history of the problem resource. This is considered to be particularly large when a problem resource is employed as an example of the second resource and a related resource of the problem resource is employed as an example of the first resource, as in the present embodiment. This is because the frequency at which problematic metric values (for example, metric values exceeding a threshold value) are measured is smaller than the frequency at which normal metric values are measured, but in this embodiment, as described above, Since a correlation function can be prepared in advance based on know-how according to resource attributes, even if a problem resource is detected while the elapsed time from the start of computer system operation or configuration change is short, the relationship of the problem resource It can be expected to accurately determine whether the resource is a bottleneck candidate.
 以下、本実施例を詳細に説明する。 Hereinafter, this embodiment will be described in detail.
 図1は、一実施例に係る計算機システム及び管理システムの構成を示す。 FIG. 1 shows a configuration of a computer system and a management system according to an embodiment.
 計算機システム100は、1以上のホスト553と、1以上のホスト553に接続された1以上のストレージシステム551とを含む。ストレージシステム551には、例えば、通信ネットワーク521(例えばSAN(Storage Area Network)又はLAN(Local Area Network))を介してホスト553が接続される。 The computer system 100 includes one or more hosts 553 and one or more storage systems 551 connected to the one or more hosts 553. For example, a host 553 is connected to the storage system 551 via a communication network 521 (for example, a SAN (Storage Area Network) or a LAN (Local Area Network)).
 ストレージシステム551は、物理記憶デバイス群563と、物理記憶デバイス群563に接続されたコントローラ561とを有する。 The storage system 551 has a physical storage device group 563 and a controller 561 connected to the physical storage device group 563.
 物理記憶デバイス群563は、1以上のPG(Parity Group)を有する。PGは、RAID(Redundant Array of Independent (or Inexpensive) Disks)グループと呼ぶこともある。PGは、複数の物理記憶デバイスで構成されており、所定のRAIDレベルに従いデータを記憶する。物理記憶デバイスは、例えば、HDD(Hard Disk Drive)或いはSSD(Solid State Drive)である。 The physical storage device group 563 has one or more PG (Parity Group). The PG may be called a RAID (Redundant Array of Independent (or Inexpensive) Disks) group. The PG is composed of a plurality of physical storage devices, and stores data according to a predetermined RAID level. The physical storage device is, for example, an HDD (Hard Disk Drive) or an SSD (Solid State Drive).
 ストレージシステム551は、複数の論理ボリュームを有する。論理ボリュームとしては、PGに基づく実体的な論理ボリューム(実ボリューム)565もあれば、シンプロビジョニング或いはストレージ仮想化技術に従う仮想的な論理ボリューム(仮想ボリューム)567もある。1つのストレージシステム551が必ずしも複数種類の論理ボリュームを有さないでよい。例えば、ストレージシステム551は、論理ボリュームとして、実ボリューム565のみを有してもよい。シンプロビジョニングに従う仮想ボリュームにはプールから記憶領域が割り当てられる。プールは、1以上の物理記憶デバイス(例えばPG)に基づく記憶領域群であり、例えば、1以上の論理ボリュームの集合でよい。プールは、シンプロビジョニングに従う仮想ボリュームに割り当てられる記憶領域を有するプールに代えて、オリジナルの論理ボリュームとそのスナップショットとの差分が格納されるプールでもよい。 The storage system 551 has a plurality of logical volumes. As the logical volume, there is a substantive logical volume (real volume) 565 based on PG and a virtual logical volume (virtual volume) 567 according to thin provisioning or storage virtualization technology. One storage system 551 does not necessarily have a plurality of types of logical volumes. For example, the storage system 551 may have only the real volume 565 as a logical volume. A storage area is allocated from the pool to the virtual volume according to thin provisioning. The pool is a storage area group based on one or more physical storage devices (for example, PG), and may be a set of one or more logical volumes, for example. The pool may be a pool in which a difference between the original logical volume and its snapshot is stored instead of a pool having a storage area allocated to a virtual volume according to thin provisioning.
 コントローラ561は、複数のデバイス、例えば、ポート、MPB(1又は複数のマイクロプロセッサ(MP)を有するブレード(回路基板))及びキャッシュメモリを有している。例えば、ポートが、ホスト553からI/O(Input/Output)コマンド(ライトコマンド又はリードコマンド)を受信し、MPBが有するMPが、そのI/Oコマンドに従うデータのI/Oを制御する。具体的には、例えば、MPは、受信したI/OコマンドからI/O先の論理ボリュームを特定し、特定した論理ボリュームに対してデータのI/Oを行う。論理ボリュームに対してI/Oされるデータは、一時的に、キャッシュメモリに格納される。 The controller 561 includes a plurality of devices, for example, a port, an MPB (a blade (circuit board) having one or a plurality of microprocessors (MP)), and a cache memory. For example, the port receives an I / O (Input / Output) command (write command or read command) from the host 553, and the MP included in the MPB controls I / O of data according to the I / O command. Specifically, for example, the MP specifies an I / O destination logical volume from the received I / O command, and performs data I / O on the specified logical volume. Data that is I / O to the logical volume is temporarily stored in the cache memory.
 ホスト553は、物理マシン(物理計算機)でも仮想マシン(VM)でもよい。ホスト553で、1以上のアプリケーションプログラム(APP)552が実行される。APP552が実行されることにより、論理ボリュームを指定したI/Oコマンドがホスト553からストレージシステム551に送信する。 The host 553 may be a physical machine (physical computer) or a virtual machine (VM). One or more application programs (APP) 552 are executed on the host 553. When the APP 552 is executed, an I / O command specifying a logical volume is transmitted from the host 553 to the storage system 551.
 以上のように、計算機システム100は、階層的な複数のリソースを有する。複数のリソースは、具体的には、APP552、ホスト553、ストレージシステム551、コントローラ561、ポート、MPB、キャッシュメモリ、論理ボリューム及びPG等のうちの2つのリソースタイプ以上のリソースを含む。同じレイヤの複数のリソースがグループ化されることでそのレイヤのリソースより上位レイヤのリソースが定義されてもよい。「リソース」は、APPや論理ボリュームのような実体的なリソース(論理リソースと物理リソースのいずれでもよい)と、複数の実体的なリソースのグループである仮想的なリソースとがあってよい。 As described above, the computer system 100 has a plurality of hierarchical resources. Specifically, the plurality of resources include resources of two or more resource types such as APP 552, host 553, storage system 551, controller 561, port, MPB, cache memory, logical volume, and PG. A plurality of resources in the same layer may be grouped to define a higher layer resource than that layer resource. The “resource” may be a substantial resource (either a logical resource or a physical resource) such as an APP or a logical volume, and a virtual resource that is a group of a plurality of substantial resources.
 管理システムは、管理サーバ557と、管理サーバ557に接続された1以上の管理クライアント555とを含む。管理サーバ557には、通信ネットワーク(例えばLAN、WAN(World Area Network)又はインターネット)521を介して、管理クライアント555が接続される。 The management system includes a management server 557 and one or more management clients 555 connected to the management server 557. A management client 555 is connected to the management server 557 via a communication network (for example, LAN, WAN (World Area Network) or the Internet) 521.
 管理クライアント555は、入力デバイス501、表示デバイス502、記憶デバイス(例えばメモリ)505、通信インターフェースデバイス(以下、I/F)507、及び、それらに接続されたプロセッサ(例えばCPU(Central Processing Unit))503を有する。入力デバイス501は、例えば、ポインティングデバイス及びキーボードである。表示デバイス502は、例えば、情報が表示される物理画面を有するデバイスである。入力デバイス501及び表示デバイス502が一体となったタッチスクリーンが採用されてもよい。I/F507は、通信ネットワーク521に接続され、I/F507を介して、管理クライアント555は管理サーバ557と通信することができる。なお、通信ネットワーク521と、ホスト553とストレージシステム551と、を接続するネットワークとは一部または全てが共通であってもよい。 The management client 555 includes an input device 501, a display device 502, a storage device (for example, memory) 505, a communication interface device (hereinafter referred to as I / F) 507, and a processor (for example, a CPU (Central Processing Unit)) connected thereto. 503. The input device 501 is, for example, a pointing device and a keyboard. The display device 502 is a device having a physical screen on which information is displayed, for example. A touch screen in which the input device 501 and the display device 502 are integrated may be employed. The I / F 507 is connected to the communication network 521, and the management client 555 can communicate with the management server 557 via the I / F 507. Note that some or all of the communication network 521 and the network connecting the host 553 and the storage system 551 may be common.
 記憶部505は、例えば、主記憶デバイス及び補助記憶デバイスのうちの少なくとも主記憶デバイス(典型的にはメモリ)を有する。記憶部505は、プロセッサ503で実行されるコンピュータプログラム、及び、プロセッサ503に使用される情報を記憶することができる。具体的には、例えば、記憶部505は、Webブラウザ511、及び、管理クライアントプログラム513を記憶する。管理クライアントプログラム513は、RIA(Rich Internet Application)でよい。具体的には、例えば、管理クライアントプログラムは、プログラムファイルであり、管理サーバ557(或いは他の計算機)からダウンロードされ、記憶部505に記憶されてよい。 The storage unit 505 includes, for example, at least a main storage device (typically a memory) of a main storage device and an auxiliary storage device. The storage unit 505 can store a computer program executed by the processor 503 and information used by the processor 503. Specifically, for example, the storage unit 505 stores a Web browser 511 and a management client program 513. The management client program 513 may be RIA (Rich Internet Application). Specifically, for example, the management client program is a program file, which may be downloaded from the management server 557 (or another computer) and stored in the storage unit 505.
 管理サーバ557は、記憶部535、I/F537、及び、それらに接続されたプロセッサ(例えばCPU(Central Processing Unit))533を有する。プロセッサ533は、プロセッサ部の一例である。I/F537は、通信ネットワーク521に接続され、I/F537を介して、管理サーバ557は管理クライアント555と通信することができる。管理サーバ557は、I/F537を介して、ユーザ操作に従う指示を受信したり、レイアウト領域に表示オブジェクトを描画したりすることができる。このため、I/F537は、I/Oインターフェースデバイスの一例である。なお、ここで言う「レイアウト領域」とは、表示オブジェクトが描画され得る領域である。レイアウト領域の全部又は一部の範囲が、Webブラウザ511(又は管理クライアントプログラム513)によって表示されるフレーム(例えばウィンドウ)での表示範囲である。表示オブジェクトが描画されたレイアウト領域の、上記フレーム内における表示イメージ(表示オブジェクトを含む)を、表示画面又はGUI画面と言うことができる。レイアウト領域に描画されたオブジェクトのうち、表示範囲に重なるオブジェクトが、表示デバイス502の物理画面上に表示される。このため、レイアウト領域にオブジェクトを描画することは、実質的に、オブジェクトを表示することの一例である。 The management server 557 includes a storage unit 535, an I / F 537, and a processor (for example, a CPU (Central Processing Unit)) 533 connected thereto. The processor 533 is an example of a processor unit. The I / F 537 is connected to the communication network 521, and the management server 557 can communicate with the management client 555 via the I / F 537. The management server 557 can receive an instruction in accordance with a user operation via the I / F 537 and can draw a display object in the layout area. For this reason, the I / F 537 is an example of an I / O interface device. The “layout area” here is an area where a display object can be drawn. The entire or partial range of the layout area is a display range in a frame (for example, a window) displayed by the Web browser 511 (or the management client program 513). A display image (including a display object) in the frame of the layout area in which the display object is drawn can be referred to as a display screen or a GUI screen. Of the objects drawn in the layout area, an object that overlaps the display range is displayed on the physical screen of the display device 502. For this reason, drawing an object in the layout area is substantially an example of displaying the object.
 記憶部535は、例えば、主記憶デバイス及び補助記憶デバイスのうちの少なくとも主記憶デバイス(典型的にはメモリ)を有する。記憶部535は、プロセッサ533で実行されるコンピュータプログラム、及び、プロセッサ533に使用される情報を記憶することができる。具体的には、例えば、記憶部535は、管理サーバプログラム541及び管理テーブル群543を記憶する。管理テーブル群543は、計算機システムが有する複数のリソースの階層関係(構成情報)や、各リソースの障害情報等を含む。管理テーブル群543の少なくとも一部の情報は、管理サーバプログラム541により収集されてもよいし、情報を保有する他の管理システムにアクセスすることで取得してもよい。管理サーバプログラム541は、ユーザ操作に従う指示を管理クライアント555から受信したり、レイアウト領域に描画される情報を管理クライアント555に送信したりする。 The storage unit 535 includes, for example, at least a main storage device (typically a memory) of a main storage device and an auxiliary storage device. The storage unit 535 can store a computer program executed by the processor 533 and information used by the processor 533. Specifically, for example, the storage unit 535 stores a management server program 541 and a management table group 543. The management table group 543 includes a hierarchical relationship (configuration information) of a plurality of resources included in the computer system, failure information of each resource, and the like. Information of at least a part of the management table group 543 may be collected by the management server program 541 or may be acquired by accessing another management system that holds the information. The management server program 541 receives an instruction according to a user operation from the management client 555, and transmits information drawn in the layout area to the management client 555.
 管理サーバプログラム541と、Webブラウザ511(またはクライアントのRIA実行環境)と、管理クライアントプログラム513と、の連携処理によって、ユーザ操作に応じたGUI画面表示が実現される。管理サーバプログラム541が、画面を作成し、作成した画面の表示用情報を管理クライアントプログラム513に提供し、管理クライアントプログラム513が、その表示用情報を基に画面を表示してもよいし、画面作成処理の一部(例えば描画処理)が管理サーバプログラム541から管理クライアントプログラム513にオフロードされてもよい。連携の例としては以下がある。説明の簡略化のために、本実施例において(連携例2)が採用される場合を説明するが、連携例1にも適用可能であることは言うまでもない。
(連携例1)管理サーバプログラム541が、管理テーブル群543が有する情報の少なくとも一部を、Webブラウザ511(又は管理クライアントプログラム513)に送信し、それを、Webブラウザ511(又は管理クライアントプログラム513)が一時情報として記憶部505に格納する。Webブラウザ511(又は管理クライアントプログラム513)が、ユーザ操作に従う指示と一時情報とを基に、レイアウト領域に表示オブジェクトを描画する(例えば、表示オブジェクトを新規描画、拡大又は縮小する)。
(連携例2)管理サーバプログラム541が、表示画面に対するユーザ操作に従う指示をWebブラウザ511(又は管理クライアントプログラム513)から受け、その指示と管理テーブル群543とを基に表示オブジェクトの表示用情報を作成し、その表示用情報を送信する。Webブラウザ511(又は管理クライアントプログラム513)は、表示用情報を受信し、その表示用情報に従い表示オブジェクトをレイアウト領域に描画する。つまり、端的に言えば、管理サーバプログラム541が、レイアウト領域に表示オブジェクトを描画する。Webブラウザ511(又は管理クライアントプログラム513)は、GUI画面に対するユーザ操作がされたら、そのユーザ操作に従う指示を管理サーバプログラム541に送信する。
The GUI screen display corresponding to the user operation is realized by the cooperation processing of the management server program 541, the Web browser 511 (or the client RIA execution environment), and the management client program 513. The management server program 541 creates a screen, provides the display information for the created screen to the management client program 513, and the management client program 513 may display the screen based on the display information. A part of the creation processing (for example, drawing processing) may be offloaded from the management server program 541 to the management client program 513. Examples of cooperation include the following. For simplification of explanation, a case where (cooperation example 2) is adopted in the present embodiment will be described, but it is needless to say that it can also be applied to cooperation example 1.
(Cooperation Example 1) The management server program 541 transmits at least part of the information included in the management table group 543 to the Web browser 511 (or the management client program 513), which is transmitted to the Web browser 511 (or the management client program 513). ) Is stored in the storage unit 505 as temporary information. The web browser 511 (or the management client program 513) draws a display object in the layout area based on the instruction according to the user operation and the temporary information (for example, newly draws, enlarges or reduces the display object).
(Cooperation Example 2) The management server program 541 receives an instruction according to a user operation on the display screen from the Web browser 511 (or the management client program 513), and displays display object display information based on the instruction and the management table group 543. Create and send the display information. The Web browser 511 (or the management client program 513) receives the display information and draws the display object in the layout area according to the display information. In short, the management server program 541 draws a display object in the layout area. When a user operation is performed on the GUI screen, the Web browser 511 (or the management client program 513) transmits an instruction according to the user operation to the management server program 541.
 以下、冗長な説明を避けるために、表示の制御は管理サーバプログラム541(表示制御プログラム130)により行われるとする。 Hereinafter, in order to avoid redundant description, it is assumed that display control is performed by the management server program 541 (display control program 130).
 図2は、計算機システム100のトポロジー(リソーストポロジー)の一部の一例を示す。 FIG. 2 shows an example of a part of the topology (resource topology) of the computer system 100.
 複数のレイヤとして、例えば、上位レイヤから順に、Server、SAN及びStorageがある。レイヤ「Server」に属するリソースは、「VM」、「HV」及び「DS」である。「VM」は、仮想マシンである。「HV」は、1又は複数の仮想マシンを制御しホストで実行されるハイパバイザである。HV(例えばHV4)に含まれるリソースの一例として、CPUとDISK(物理記憶デバイスの一例)がある。「DS」は、ハイパバイザから記憶デバイスとして認識されるデータストアである。レイヤ「SAN」に属するリソースは、「FC-Switch」(SANにおけるFC(Fibre Channel)スイッチ)である。レイヤ「Storage」に属するリソースは、「Storage」(ストレージシステム)である。Storage(例えばStorage2)に含まれるリソースの一例として、ストレージシステムにおける複数のコンポーネント、例えば、「Port」、「LDEV」、「MP」、「Pool」、「PG」及び「Cache」がある。「Port」は、FCスイッチに接続されVMからI/Oコマンドを受け付ける通信ポートである。「LDEV」は、論理ボリューム(実ボリューム又は仮想ボリューム)である。「MP」は、マイクロプロセッサである。「Pool」は、仮想ボリュームにシンプロビジョニングに従い割り当てられる実領域を含んだ記憶領域である。「PG」は、パリティグループである。「Cache」は、論理ボリュームに入出力されるデータが一時的に格納されるキャッシュメモリである。 ∙ As multiple layers, for example, there are Server, SAN and Storage in order from the upper layer. Resources belonging to the layer “Server” are “VM”, “HV”, and “DS”. “VM” is a virtual machine. “HV” is a hypervisor that controls one or more virtual machines and is executed on the host. As an example of resources included in HV (for example, HV4), there are CPU and DISK (an example of a physical storage device). “DS” is a data store recognized as a storage device by the hypervisor. The resource belonging to the layer “SAN” is “FC-Switch” (FC (Fibre Channel) switch in SAN). The resource belonging to the layer “Storage” is “Storage” (storage system). As an example of resources included in Storage (for example, Storage 2), there are a plurality of components in the storage system, for example, “Port”, “LDEV”, “MP”, “Pool”, “PG”, and “Cache”. “Port” is a communication port that is connected to the FC switch and receives an I / O command from the VM. “LDEV” is a logical volume (real volume or virtual volume). “MP” is a microprocessor. “Pool” is a storage area including a real area allocated to a virtual volume according to thin provisioning. “PG” is a parity group. “Cache” is a cache memory in which data input / output to / from a logical volume is temporarily stored.
 図2に示したようなトポロジー構成は、管理テーブル群543が表す構成情報から特定される構成である。1又は複数のリソースタイプが1つのレイヤに属してもよい。同一リソースタイプの2以上のリソースにより1つのグループが構成されてもよく、その場合、1つのリソースタイプについて異なる複数のグループが存在し、グループ毎に、そのリソースタイプの1以上のリソースが存在してもよい。つまり、「レイヤ」は、異なるリソースタイプの集約であり、「グループ」は、同一リソースタイプでの異なるリソースの集約である。レイヤ及びグループのうちの少なくとも一方がユーザにより定義されてもよい。 The topology configuration as shown in FIG. 2 is a configuration specified from the configuration information represented by the management table group 543. One or more resource types may belong to one layer. One group may be composed of two or more resources of the same resource type. In this case, there are a plurality of different groups for one resource type, and one or more resources of the resource type exist for each group. May be. That is, the “layer” is an aggregation of different resource types, and the “group” is an aggregation of different resources with the same resource type. At least one of the layer and the group may be defined by the user.
 以下、図3~図7を参照して、管理テーブル群543に含まれるテーブルの一例を説明する。 Hereinafter, an example of a table included in the management table group 543 will be described with reference to FIGS.
 図3は、リソーステーブルの一例を示す。 FIG. 3 shows an example of a resource table.
 リソーステーブル400は、リソースに関する情報を有する。リソーステーブル400は、例えば、リソース毎にレコードを有する。各レコードが、リソース名(リソースの名前)及びリソースタイプ名(リソースタイプの名前)といった情報を保持する。 The resource table 400 has information on resources. The resource table 400 has a record for each resource, for example. Each record holds information such as a resource name (resource name) and a resource type name (resource type name).
 図4は、関連リソーステーブルの一例を示す。 FIG. 4 shows an example of a related resource table.
 関連リソーステーブル500は、リソース同士の関連を表す。例えば、関連リソーステーブル500は、リソース毎にレコード有し、各レコードは、リソース名及び子リソース名(リソースの子リソースの名前)といった情報を保持する。管理サーバプログラム541は、選択されたリソースのリソース名を用いて、関連リソーステーブル500から、選択されたリソースの関連リソースを特定できる。例えば、管理サーバプログラム541は、選択されたリソースのリソース名を有するレコードを基点に関連リソーステーブル500から特定されるレコードから、下位関連リソースを特定できる。また、管理サーバプログラム541は、選択されたリソースのリソース名を子リソース名として有するレコードを基点に関連リソーステーブル500から特定されるレコードから、上位関連リソースを特定できる。関連リソーステーブル500の各レコードは、子リソース名に代えて又は加えて親リソース名を保持してもよい。 The related resource table 500 represents the relationship between resources. For example, the related resource table 500 has a record for each resource, and each record holds information such as a resource name and a child resource name (name of a resource child resource). The management server program 541 can specify the related resource of the selected resource from the related resource table 500 using the resource name of the selected resource. For example, the management server program 541 can specify the lower related resource from the record specified from the related resource table 500 based on the record having the resource name of the selected resource. Further, the management server program 541 can specify the upper related resource from the record specified from the related resource table 500 based on the record having the resource name of the selected resource as the child resource name. Each record of the related resource table 500 may hold a parent resource name instead of or in addition to the child resource name.
 図5は、相関関数関連テーブルの一例を示す。 FIG. 5 shows an example of the correlation function relation table.
 相関関数関連テーブル550は、相関関数毎にその相関関数の変換元(変換前)のリソース属性と変換先(変換後)のリソース属性とに関する情報を保持する。例えば、相関関数関連テーブル550は、相関関数毎にレコードを有し、各レコードは、関数名(相関関数の名前)、変換元属性(変換元のリソース属性を表す情報)及び変換先属性(変換先のリソース属性を表す情報)といった情報を保持する。変換元属性は、変換元リソースタイプ名(変換元のリソースタイプの名前)及び変換元メトリック名(変換元のメトリックの名前)である。変換先属性は、変換先リソースタイプ名(変換先のリソースタイプの名前)及び変換先メトリック名(変換先のメトリックの名前)である。 The correlation function relation table 550 holds information regarding the resource attribute of the conversion source (before conversion) and the resource attribute of the conversion destination (after conversion) for each correlation function. For example, the correlation function relation table 550 has a record for each correlation function, and each record includes a function name (correlation function name), a conversion source attribute (information indicating the resource attribute of the conversion source), and a conversion destination attribute (conversion). Information such as information representing the previous resource attribute). The conversion source attribute is a conversion source resource type name (name of the conversion source resource type) and a conversion source metric name (name of the conversion source metric). The conversion destination attributes are a conversion destination resource type name (the name of the conversion destination resource type) and a conversion destination metric name (the name of the conversion destination metric).
 図6は、相関関数定義テーブルの一例を示す。 FIG. 6 shows an example of a correlation function definition table.
 相関関数定義テーブル600は、相関関数毎にその相関関数の定義に関する情報を有する。相関関数定義テーブル600は、例えば、相関関数毎にレコードを有する。各レコードが、関数名及び関数詳細(例えば、相関関数それ自体とその相関関数で使用される変数)といった情報を保持する。 The correlation function definition table 600 has information on the definition of the correlation function for each correlation function. The correlation function definition table 600 has a record for each correlation function, for example. Each record holds information such as the function name and function details (eg, the correlation function itself and variables used in the correlation function).
 図7は、性能テーブルの一例を示す。 FIG. 7 shows an example of the performance table.
 性能テーブルは、リソースについて収集されたメトリックデータを有するテーブルである。性能テーブルの各レコードは、1件のメトリックデータに含まれる情報を有する。具体的には、例えば、各レコードは、リソース名(収集されたメトリック値に対応したリソースの名前)、メトリック名(収集されたメトリック値のメトリックの名前)、時刻(メトリック値の収集時刻)、及び、メトリック値といった情報を保持する。時刻は、年月日時分秒で表現されているが、表現はそれに限られない。 The performance table is a table having metric data collected for resources. Each record of the performance table has information included in one metric data. Specifically, for example, each record includes a resource name (a resource name corresponding to the collected metric value), a metric name (a metric name for the collected metric value), a time (a metric value collection time), Information such as a metric value is held. The time is expressed in year / month / day / hour / minute / second, but the expression is not limited thereto.
 計算機システム100における複数のリソースの各々のメトリックデータを収集する処理と、収集されたメトリックデータの少なくとも一部の情報を含んだレコードを性能テーブル700に追加する処理は、管理サーバプログラム541により行われてよい。なお、本実施例において、メトリックとリソースタイプは1:1又は多:1で対応する。すなわち、1つのリソースタイプにつき、メトリックは1又は複数存在するが、1つのメトリックが複数のリソースタイプに対応することはない。しかし、本発明はそれに限定されず、例えば、1つのメトリックタイプが複数のリソースタイプに対応していてもよい。 The management server program 541 performs processing for collecting metric data of each of a plurality of resources in the computer system 100 and processing for adding a record including at least part of information of the collected metric data to the performance table 700. It's okay. In this embodiment, the metric and the resource type correspond to 1: 1 or many: 1. That is, one or more metrics exist for one resource type, but one metric does not correspond to a plurality of resource types. However, the present invention is not limited thereto. For example, one metric type may correspond to a plurality of resource types.
 以上の図3~図7に示したテーブルを含む管理テーブル群543を基に、問題リソースとそれの関連リソース間の相関係数(関係性の一例)の算出及び表示を行うことができる。 Based on the management table group 543 including the tables shown in FIG. 3 to FIG. 7, the correlation coefficient (an example of the relationship) between the problem resource and its related resources can be calculated and displayed.
 以下、本実施例で行われる処理の一例を説明する。 Hereinafter, an example of processing performed in this embodiment will be described.
 図8は、ボトルネック候補表示処理のフロー及び概要を示す。この処理は、例えば、問題リソースが管理サーバプログラム541により検出された場合に開始される。 FIG. 8 shows the flow and outline of the bottleneck candidate display process. This process is started, for example, when a problem resource is detected by the management server program 541.
 S801で、管理サーバプログラム541が、経路一覧生成処理(図9)を実行する。経路一覧は、問題リソースに関わるリソースペア(リソース名と子リソース名との組)の一覧である。図2に例示したリソーストポロジーにおいて、図8に例示するように、問題リソースが“VM21”であるとすると、経路一覧に含まれるリソース名は、図8に例示する通り(すなわち、“HV4”、“DS3”等)である。なお、紙面の都合上、経路一覧からは、リソース“LDEV15”~“LDEV18”の各々よりも下位の関連リソースのリソース名は省略されているが、“Pool31”、“PG58”及び“MP4”のような下位関連リソース名も、経路一覧に含まれる。 In S801, the management server program 541 executes a route list generation process (FIG. 9). The route list is a list of resource pairs (a combination of a resource name and a child resource name) related to the problem resource. In the resource topology illustrated in FIG. 2, if the problem resource is “VM21” as illustrated in FIG. 8, the resource name included in the route list is as illustrated in FIG. 8 (that is, “HV4”, “DS3” etc.). For the sake of space, the resource names of the related resources lower than each of the resources “LDEV15” to “LDEV18” are omitted from the route list, but “Pool31”, “PG58”, and “MP4” Such lower related resource names are also included in the route list.
 S802で、管理サーバプログラム541が、S801で生成した経路一覧から、全ての子リソース名を取得し、取得された子リソース名から重複した子リソース名があればそれを排除する。残った子リソース名の一覧が、関連リソース一覧である。図8の説明において、関連リソース一覧を構成する子リソース名を「関連リソース名」と言い、「関連リソース名」が表すリソースを「関連リソース」と言う。 In S802, the management server program 541 acquires all child resource names from the route list generated in S801, and eliminates any duplicate child resource names from the acquired child resource names. The list of remaining child resource names is the related resource list. In the description of FIG. 8, a child resource name constituting the related resource list is referred to as “related resource name”, and a resource represented by “related resource name” is referred to as “related resource”.
 S803で、管理サーバプログラム541が、内部変数として、“ボトルネック候補一覧”を設定する。これにより、ボトルネック候補表示処理において、ボトルネック候補一覧が生成されるようになる。 In S803, the management server program 541 sets “bottleneck candidate list” as an internal variable. Thereby, a bottleneck candidate list is generated in the bottleneck candidate display process.
 関連リソース一覧に対応した全ての関連リソースについて、S804及びS805が実行される。以下、S804及びS805の説明において、1つの関連リソースを例に取る(図8の説明において「対象関連リソース」と言う)。 S804 and S805 are executed for all related resources corresponding to the related resource list. Hereinafter, in the description of S804 and S805, one related resource is taken as an example (referred to as “target related resource” in the description of FIG. 8).
 S804で、管理サーバプログラム541が、経路一覧を参照し、問題リソースを始点とし関連リソースを終点とした経路を特定する。 In S804, the management server program 541 refers to the route list and identifies a route having the problem resource as the start point and the related resource as the end point.
 S805で、管理サーバプログラム541が、S804で特定された経路についてボトルネック判定処理(図10)を実行する。この処理において、ボトルネック候補一覧が更新される。 In S805, the management server program 541 executes bottleneck determination processing (FIG. 10) for the route specified in S804. In this process, the bottleneck candidate list is updated.
 関連リソース一覧に対応した全ての関連リソースについて、S804及びS805が実行された場合、ボトルネック候補一覧が完成している。 When S804 and S805 are executed for all related resources corresponding to the related resource list, the bottleneck candidate list is completed.
 S806で、管理サーバプログラム541が、完成しているボトルネック候補一覧を表示する。ボトルネック候補一覧は、問題リソース“VM21”の関連リソースのうち、算出された相関係数(関係性の一例)が所定値以上である関連リソースに関する情報(例えばリソース名及び相関係数)の一覧を、問題リソースのボトルネック候補リソースの一覧として含む。 In S806, the management server program 541 displays a completed bottleneck candidate list. The bottleneck candidate list is a list of information (for example, resource names and correlation coefficients) related to related resources for which the calculated correlation coefficient (an example of the relationship) is greater than or equal to a predetermined value among the related resources of the problem resource “VM21”. Are included as a list of bottleneck candidate resources of the problem resource.
 図9は、経路一覧生成処理(図8のS802)のフロー及び概要を示す。 FIG. 9 shows the flow and outline of the route list generation process (S802 in FIG. 8).
 S901で、管理サーバプログラム541が、内部変数として、“経路一覧”を設定する。これにより、経路一覧生成処理において、経路一覧が生成されるようになる。 In S901, the management server program 541 sets “route list” as an internal variable. Thereby, a route list is generated in the route list generation process.
 S902で、管理サーバプログラム541が、内部変数として、“リソース名”を設定する。 In S902, the management server program 541 sets “resource name” as an internal variable.
 S903で、管理サーバプログラム541が、“リソース名”に、初期値として、問題リソースのリソース名“VM21”を代入する。 In S903, the management server program 541 substitutes the resource name “VM21” of the problem resource as an initial value for “resource name”.
 問題リソースのリソース名をキーに直接的に又は間接的に関連リソーステーブルから取得される全ての子リソース名について、S904及びS905が実行される。以下、S904及びS905の説明において、1つの子リソース名を例に取る(図9の説明において「対象子リソース名」と言う)。 S904 and S905 are executed for all child resource names acquired directly or indirectly from the related resource table using the resource name of the problem resource as a key. Hereinafter, in the description of S904 and S905, one child resource name is taken as an example (referred to as “target child resource name” in the description of FIG. 9).
 S904で、管理サーバプログラム541が、対象子リソース名とそれに対応したリソース名とのペアを、経路一覧に登録する。 In S904, the management server program 541 registers a pair of the target child resource name and the corresponding resource name in the route list.
 S905で、管理サーバプログラム541が、内部変数“リソース名”に、対象子リソース名を代入する。 In S905, the management server program 541 assigns the target child resource name to the internal variable “resource name”.
 問題リソースのリソース名をキーに直接的に又は間接的に関連リソーステーブルから取得される全ての子リソース名について、S904及びS905が実行された場合、経路一覧が完成している。 When S904 and S905 are executed for all child resource names acquired directly or indirectly from the related resource table using the resource name of the problem resource as a key, the route list is completed.
 図10は、ボトルネック判定処理(図8のS805)のフロー及び概要を示す。なお、図10の説明では、1つの経路(問題リソース“VM21”を一端とし1つの関連リソース“Port3”を他端とする経路)を例に取る。図10~図12の説明において、その1つの経路を、「対象経路」と言い、対象経路の一端にある関連リソースを「対象関連リソース」と言う。 FIG. 10 shows the flow and outline of the bottleneck determination process (S805 in FIG. 8). In the description of FIG. 10, a single route (a route having the problem resource “VM21” as one end and one related resource “Port3” as the other end) is taken as an example. In the description of FIGS. 10 to 12, the one route is referred to as “target route”, and the related resource at one end of the target route is referred to as “target related resource”.
 S1001で、管理サーバプログラム541が、リソースタイプ一覧生成処理(図11)を実行する。リソースタイプ一覧とは、対象経路上のリソース毎に、リソース名とリソースタイプ名とを含む。 In S1001, the management server program 541 executes a resource type list generation process (FIG. 11). The resource type list includes a resource name and a resource type name for each resource on the target route.
 対象関連リソースの全てのメトリックについて、S1002~S1006が実行される。以下、S1002~S1006の説明において、1つのメトリック(図10及び図12の説明において「対象メトリック」と言う)を例に取る。 S1002 to S1006 are executed for all metrics of the target related resource. Hereinafter, in the description of S1002 to S1006, one metric (referred to as “target metric” in the description of FIGS. 10 and 12) is taken as an example.
 S1002で、管理サーバプログラム541が、問題リソース性能履歴推定処理(図12)を実行する。つまり、管理サーバプログラム541が、対象関連リソースの対象メトリックについての実性能履歴を、問題リソースの推定性能履歴に変換する。 In S1002, the management server program 541 executes problem resource performance history estimation processing (FIG. 12). That is, the management server program 541 converts the actual performance history for the target metric of the target related resource into the estimated performance history of the problem resource.
 S1003で、管理サーバプログラム541が、問題リソースのリソース名、メトリック名、及び期間をキーに、性能テーブルから、問題リソースの実性能履歴を取得する。 In S1003, the management server program 541 acquires the actual performance history of the problem resource from the performance table using the resource name, metric name, and period of the problem resource as keys.
 S1004で、管理サーバプログラム541が、問題リソースの推定性能履歴(S1002で取得された性能履歴)と問題リソースの実性能履歴(S1003で取得された性能履歴)の相関係数を算出する。 In S1004, the management server program 541 calculates a correlation coefficient between the estimated performance history of the problem resource (performance history acquired in S1002) and the actual performance history of the problem resource (performance history acquired in S1003).
 S1005で、管理サーバプログラム541が、S1004で算出された相関係数がしきい値以上か否かを判定する。 In S1005, the management server program 541 determines whether or not the correlation coefficient calculated in S1004 is greater than or equal to a threshold value.
 S1005の判定結果が真の場合(S1005:Yes)、S1006で、管理サーバプログラム541が、対象関連リソースのリソース名と、S1004で算出された相関係数とを、ボトルネック候補一覧に登録する。ボトルネック候補一覧は、図8のS806で表示されるが、そのボトルネック候補一覧に含まれる関連リソース名(及び相関係数)は相関係数を基に絞り込まれる。これにより、表示されたボトルネック候補一覧の視認性を向上できる。 If the determination result in S1005 is true (S1005: Yes), in S1006, the management server program 541 registers the resource name of the target related resource and the correlation coefficient calculated in S1004 in the bottleneck candidate list. The bottleneck candidate list is displayed in S806 of FIG. 8, but the related resource names (and correlation coefficients) included in the bottleneck candidate list are narrowed down based on the correlation coefficient. Thereby, the visibility of the displayed bottleneck candidate list can be improved.
 対象関連リソースの全てのメトリックについて、S1002~S1006が実行された場合、対象関連リソースについて、ボトルネック候補一覧の更新が完了している。 When S1002 to S1006 are executed for all metrics of the target related resource, the bottleneck candidate list has been updated for the target related resource.
 図11は、リソースタイプ一覧生成処理(図10のS1001)のフロー及び概要を示す。 FIG. 11 shows the flow and outline of the resource type list generation process (S1001 in FIG. 10).
 S1101で、管理サーバプログラム541が、内部変数として、“リソースタイプ一覧”を設定する。これにより、リソースタイプ一覧生成処理において、リソースタイプ一覧が生成されるようになる。 In S1101, the management server program 541 sets “resource type list” as an internal variable. Thereby, a resource type list is generated in the resource type list generation process.
 対象経路上の全てのリソースについて、S1102及びS1103が実行される。以下、S1102及びS1103の説明において、1つのリソースを例に取る(図11の説明において「対象リソース」と言う)。 S1102 and S1103 are executed for all resources on the target route. Hereinafter, one resource is taken as an example in the description of S1102 and S1103 (referred to as “target resource” in the description of FIG. 11).
 S1102で、管理サーバプログラム541が、対象リソースのリソース名をキーに、リソーステーブルからリソースタイプ名を取得する。 In S1102, the management server program 541 acquires the resource type name from the resource table using the resource name of the target resource as a key.
 S1103で、管理サーバプログラム541が、対象リソースのリソース名と、S1102で取得されたリソースタイプ名とを、リソースタイプ一覧に設定する。 In S1103, the management server program 541 sets the resource name of the target resource and the resource type name acquired in S1102 in the resource type list.
 対象経路上の全てのリソースについて、S1102及びS1103が実行された場合、対象経路について、リソースタイプ一覧が完成している。 When S1102 and S1103 are executed for all resources on the target route, the resource type list is completed for the target route.
 図12は、問題リソース性能履歴推定処理(図10のS1002)のフロー及び概要を示す。 FIG. 12 shows a flow and an outline of the problem resource performance history estimation process (S1002 in FIG. 10).
 S1201で、管理サーバプログラム541が、内部変数として、“推定履歴”を設定する。これにより、問題リソース性能履歴推定処理において、問題リソースの推定性能履歴が生成されるようになる。 In S1201, the management server program 541 sets “estimation history” as an internal variable. Thereby, in the problem resource performance history estimation process, an estimated performance history of the problem resource is generated.
 S1202で、管理サーバプログラム541が、性能テーブルから、対象関連リソースのメトリック名及び期間をキーに、対象関連リソースの実性能履歴を取得する。 In S1202, the management server program 541 acquires the actual performance history of the target related resource from the performance table using the metric name and period of the target related resource as a key.
 S1203で、管理サーバプログラム541が、内部変数“推定履歴”に、初期値として、対象関連リソースの実性能履歴を代入する。 In S1203, the management server program 541 substitutes the actual performance history of the target related resource as an initial value for the internal variable “estimation history”.
 対象関連リソースから問題リソースまでの経路である対象経路における全てのエッジについて、S1204~S1207が実行される。なお、エッジは、対象関連リソース側から問題リソース側へと順次に選択される。以下、1つのエッジを例に取る(図12の説明において「対象エッジ」と言う)。 S1204 to S1207 are executed for all edges in the target route that is a route from the target related resource to the problem resource. The edges are sequentially selected from the target related resource side to the problem resource side. Hereinafter, one edge is taken as an example (referred to as “target edge” in the description of FIG. 12).
 S1204で、管理サーバプログラム541が、変換元リソース及び変換先リソースの各々について、リソース名をキーに、リソースタイプ一覧から、リソースタイプ名を取得する。ここで、「変換元リソース」は、対象エッジの両端のリソースのうちの対象関連リソース側のリソースである。「変換先リソース」は、対象エッジの両端のリソースのうちの問題リソース側のリソースである。 In S1204, the management server program 541 acquires the resource type name from the resource type list for each of the conversion source resource and the conversion destination resource using the resource name as a key. Here, the “conversion source resource” is a resource on the target related resource side among the resources at both ends of the target edge. The “conversion destination resource” is a resource on the problem resource side among the resources at both ends of the target edge.
 S1205で、管理サーバプログラム541が、変換元リソースタイプ名(変換元リソースのリソースタイプ名)、変換元メトリック名(変換元リソースのメトリック名)、変換先リソースタイプ名(変換先リソースのリソースタイプ名)及び変換先メトリック名(変換先リソースのメトリック名)をキーに、推定に使用する相関関数の関数名を相関関数関連テーブル550より取得する。 In S1205, the management server program 541 determines the conversion source resource type name (conversion source resource resource type name), conversion source metric name (conversion source resource metric name), conversion destination resource type name (conversion destination resource resource type name). ) And the conversion destination metric name (metric name of the conversion destination resource) as keys, the function name of the correlation function used for estimation is acquired from the correlation function relation table 550.
 S1206で、管理サーバプログラム541が、取得した関数名をキーに、相関関数定義テーブル600から相関関数を取得し、内部変数“推定履歴”に代入されている性能履歴を、その取得した相関関数を用いて、別の性能履歴に変換する。 In S1206, the management server program 541 acquires the correlation function from the correlation function definition table 600 using the acquired function name as a key, and the performance history assigned to the internal variable “estimation history” is used as the acquired correlation function. Use to convert to another performance history.
 S1207で、管理サーバプログラム541が、変換後の推定履歴(S1206での別の性能履歴)を、内部変数“推定履歴”に代入する。 In S1207, the management server program 541 substitutes the converted estimation history (another performance history in S1206) into the internal variable “estimation history”.
 対象経路から、対象関連リソース側から問題リソース側へと順次にエッジが選択され、選択されたエッジについて、S1204~S1207が実行される。これにより、例えば図12に例示するように、対象経路が4つのエッジを含む場合、4回の性能履歴変換、すなわち、(1)対象関連リソース“Port3”の実性能履歴からその親リソース“FC Switch4”の推定性能履歴への変換、(2)リソース“FC Switch4”の推定性能履歴からその親リソース“DS3”の推定性能履歴への変換、(3)リソース“DS3”の推定性能履歴からその親リソース“HV4”の推定性能履歴への変換、及び、(4)リソース“HV4”の推定性能履歴からその親リソース(問題リソース)“VM21”の推定性能履歴への変換、が実行される。全てのエッジについてS1204~S1207が行われた場合の内部変数“推定履歴”に設定されている性能履歴が、問題リソースの推定性能履歴である。 From the target route, edges are sequentially selected from the target related resource side to the problem resource side, and S1204 to S1207 are executed for the selected edge. Thus, for example, as illustrated in FIG. 12, when the target route includes four edges, four performance history conversions, that is, (1) the parent resource “FC” from the actual performance history of the target related resource “Port3” Conversion to the estimated performance history of Switch 4 ”, (2) Conversion from the estimated performance history of the resource“ FC Switch 4 ”to the estimated performance history of the parent resource“ DS3 ”, and (3) From the estimated performance history of the resource“ DS3 ” Conversion to the estimated performance history of the parent resource “HV4” and (4) conversion from the estimated performance history of the resource “HV4” to the estimated performance history of the parent resource (problem resource) “VM21” are executed. The performance history set in the internal variable “estimation history” when S1204 to S1207 are performed for all the edges is the estimated performance history of the problem resource.
 一変形例では、対象経路におけるエッジの数に関わらず、性能履歴変換は1回、すなわち、対象関連リソースの実性能履歴から問題リソースの推定性能履歴に直接的に変換されてもよい。しかし、本実施例のように、対象関連リソース側から問題リソース側へと、エッジの選択と、選択されたエッジについて性能履歴変換とを、順次に行っていくことで、次の効果を期待できる。すなわち、リソース属性(リソースタイプ及びメトリック)の全ての組合せについて相関関数を用意すること無しに(すなわち、リソース属性間に介在する1以上のリソース属性の各々を考慮すること無しに)、言い換えれば、相関関数関連テーブル550の情報量を抑えつつ、問題リソースの性能推定履歴の正確性を高めることが期待できる。 In one variation, regardless of the number of edges in the target route, the performance history conversion may be performed once, that is, the actual performance history of the target related resource may be directly converted to the estimated performance history of the problem resource. However, as in this embodiment, the following effects can be expected by sequentially performing edge selection and performance history conversion for the selected edge from the target related resource side to the problem resource side. . That is, without preparing a correlation function for all combinations of resource attributes (resource type and metric) (ie, without considering each of one or more resource attributes interposed between resource attributes), in other words, While suppressing the amount of information in the correlation function relation table 550, it can be expected to improve the accuracy of the performance estimation history of the problem resource.
 以上、一実施例を説明したが、これは本発明の説明のための例示であって、本発明の範囲をこの実施例にのみ限定する趣旨ではない。本発明は、他の種々の形態でも実施することが可能である。例えば、本発明は、問題リソースのボトルネック候補リソースを特定するケースに限らず、リソース間の関係性を特定する他のケースにも適用できる。また、例えば、本発明は、相関関数以外の変換方法が採用されるケースにも適用できる。 Although one embodiment has been described above, this is merely an example for explaining the present invention, and is not intended to limit the scope of the present invention only to this embodiment. The present invention can be implemented in various other forms. For example, the present invention is not limited to the case of specifying the bottleneck candidate resource of the problem resource, but can be applied to other cases of specifying the relationship between resources. Further, for example, the present invention can be applied to a case where a conversion method other than the correlation function is employed.
100:計算機システム 555:管理クライアント 557:管理サーバ 100: Computer system 555: Management client 557: Management server

Claims (15)

  1.  複数の変換方法を表す情報を含んだ管理情報の少なくとも一部を記憶する1以上のメモリを含んだ記憶部と、
     前記記憶部に接続された1以上のプロセッサであるプロセッサ部と
    を有し、
     前記プロセッサ部が、
      (A)複数のリソースを有する計算機システムのうちの1以上の第1のリソースの各々について、その第1のリソースのリソース属性に従う実性能変化情報を、前記計算機システムのうちの第2のリソースのリソース属性に従う推定性能変化情報に変換する変換処理を実行し、
        前記複数のリソースは、リソース属性が異なる2以上のリソースを含み、
        前記複数のリソースの各々について、リソース属性は、リソースタイプ及びメトリックのうちの少なくとも1つであり、
        前記1以上の第1のリソースと前記第2のリソースの各々について、性能変化情報は、そのリソースのメトリック値の時系列変化を表す情報であり、
        前記1以上の第1のリソースの各々について、その第1のリソースの実性能変化情報は、その第1のリソースについて測定されたメトリック値の時系列変化を表す情報であり、
        前記1以上の第1のリソースの各々について、前記第2のリソースの推定性能変化情報は、その第1のリソースのリソース属性と前記第2のリソースのリソース属性とに対応した1以上の変換方法を用いてその第1のリソースの実性能変化情報が変換された性能変化情報であり、
        前記複数の変換方法の各々は、リソース属性に従う性能変化情報を別のリソース属性に従う性能変化情報に変換するための方法であり、
        前記1以上の第1のリソースの各々は、前記計算機システムのトポロジーにおいて前記第2のリソースに関連するリソースであり、
      (B)前記1以上の第1のリソースの各々について、前記第2のリソースの推定性能変化情報と前記第2のリソースの実性能変化情報との差分に従いその第1のリソースと前記第2のリソースとの関係性を算出し、
        前記第2のリソースの実性能変化情報は、その第2のリソースについて測定されたメトリック値の時系列変化を表す情報であり、
      (C)前記1以上の第1のリソースの各々について算出された関係性に基づく情報である処理結果情報を表示し、
        前記処理結果情報は、前記1以上の第1のリソースのうちの少なくとも1つに関する情報を含む、
    管理システム。
    A storage unit including one or more memories for storing at least part of management information including information representing a plurality of conversion methods;
    A processor unit that is one or more processors connected to the storage unit;
    The processor unit is
    (A) For each of one or more first resources of a computer system having a plurality of resources, the actual performance change information according to the resource attribute of the first resource is obtained from the second resource of the computer system. Execute conversion process to convert to estimated performance change information according to resource attribute,
    The plurality of resources include two or more resources having different resource attributes,
    For each of the plurality of resources, the resource attribute is at least one of a resource type and a metric,
    For each of the one or more first resources and the second resource, the performance change information is information indicating a time-series change in the metric value of the resource,
    For each of the one or more first resources, the actual performance change information of the first resource is information indicating a time-series change of the metric value measured for the first resource,
    For each of the one or more first resources, the estimated performance change information of the second resource is one or more conversion methods corresponding to the resource attribute of the first resource and the resource attribute of the second resource. Is the performance change information obtained by converting the actual performance change information of the first resource using
    Each of the plurality of conversion methods is a method for converting performance change information according to a resource attribute into performance change information according to another resource attribute,
    Each of the one or more first resources is a resource associated with the second resource in a topology of the computer system;
    (B) For each of the one or more first resources, according to the difference between the estimated performance change information of the second resource and the actual performance change information of the second resource, the first resource and the second resource Calculate the relationship with the resource,
    The actual performance change information of the second resource is information representing a time-series change of the metric value measured for the second resource,
    (C) displaying processing result information that is information based on the relationship calculated for each of the one or more first resources;
    The processing result information includes information on at least one of the one or more first resources.
    Management system.
  2.  前記1以上の第1のリソースの少なくとも1つについて、その第1のリソースと前記第2のリソースとの間に1以上のリソースである1以上の中間リソースが存在する場合、前記変換処理は、その第1のリソースから前記第2のリソースにかけてリソース間で性能変換情報の変換を順次に行っていく処理である順次変換処理である、
    請求項1記載の管理システム。
    For at least one of the one or more first resources, when there is one or more intermediate resources that are one or more resources between the first resource and the second resource, the conversion process includes: It is a sequential conversion process that is a process of sequentially converting performance conversion information between resources from the first resource to the second resource.
    The management system according to claim 1.
  3.  前記1以上の第1のリソースの少なくとも1つについての前記順次変換処理において、前記プロセッサ部は、
      (a1)性能変化情報の変換が未だのエッジである未処理エッジがその第1のリソースと前記第2のリソース間にあるか否かを判断し、
      (a2)(a1)の判断結果が真の場合、最も第1のリソース寄りの未処理エッジについて、変換元リソース属性と変換先リソース属性とに対応した変換方法を用いて、その変換元リソース属性に従う性能変化情報をその変換先リソース属性に従う推定性能変化情報に変換し、(a1)に戻り、
        当該未処理エッジについて、変換元リソース属性は、当該未処理エッジについての変換元リソースのリソース属性であり、
        当該未処理エッジについて、変換先リソース属性は、当該未処理エッジについての変換先リソースのリソース属性であり、
        当該未処理エッジについて、変換元リソースは、当該未処理エッジの両端のリソースのうちの、当該第1のリソース側のリソースであり、
        当該未処理エッジについて、変換先リソースは、当該未処理エッジの両端のリソースのうちの、前記第2のリソース側のリソースであり、
      (a3)(a1)の判断結果が偽の場合、当該順次変換処理を終了する、
    請求項2記載の管理システム。
    In the sequential conversion process for at least one of the one or more first resources, the processor unit includes:
    (A1) determining whether an unprocessed edge, which is an edge for which performance change information has not yet been converted, is between the first resource and the second resource;
    (A2) When the determination result of (a1) is true, the conversion source resource attribute for the unprocessed edge closest to the first resource is converted using the conversion method corresponding to the conversion source resource attribute and the conversion destination resource attribute. Is converted into estimated performance change information according to the destination resource attribute, and the process returns to (a1).
    For the unprocessed edge, the conversion source resource attribute is the resource attribute of the conversion source resource for the unprocessed edge,
    For the unprocessed edge, the conversion destination resource attribute is the resource attribute of the conversion destination resource for the unprocessed edge,
    For the unprocessed edge, the transformation source resource is the resource on the first resource side among the resources at both ends of the unprocessed edge,
    For the unprocessed edge, the conversion destination resource is a resource on the second resource side among resources at both ends of the unprocessed edge,
    (A3) When the determination result of (a1) is false, the sequential conversion process is terminated.
    The management system according to claim 2.
  4.  前記処理結果情報に関し、前記1以上の第1のリソースの少なくとも1つは、算出された関係性が所定値以上である第1のリソースである、
    請求項1記載の管理システム。
    Regarding the processing result information, at least one of the one or more first resources is a first resource whose calculated relationship is a predetermined value or more.
    The management system according to claim 1.
  5.  前記第2のリソースは、問題が生じているリソースである問題リソースであり、
     前記1以上の第1のリソースの少なくとも1つは、前記問題リソースのボトルネックの候補である、
    請求項4記載の管理システム。
    The second resource is a problem resource that is a resource in which a problem occurs,
    At least one of the one or more first resources is a candidate bottleneck for the problem resource;
    The management system according to claim 4.
  6.  前記第2のリソースは、問題が生じているリソースである問題リソースである、
    請求項1記載の管理システム。
    The second resource is a problem resource that is a resource in which a problem occurs.
    The management system according to claim 1.
  7.  前記複数の変換方法のうちの少なくとも1つは、相関関数を含み、
     前記1以上の第1のリソースの各々について、算出された関係性は、相関係数である、
    請求項1記載の管理システム。
    At least one of the plurality of transformation methods includes a correlation function;
    For each of the one or more first resources, the calculated relationship is a correlation coefficient.
    The management system according to claim 1.
  8.  (A)複数のリソースを有する計算機システムのうちの1以上の第1のリソースの各々について、その第1のリソースのリソース属性に従う実性能変化情報を、前記計算機システムのうちの第2のリソースのリソース属性に従う推定性能変化情報に変換する変換処理を実
      前記複数のリソースは、リソース属性が異なる2以上のリソースを含み、
      前記複数のリソースの各々について、リソース属性は、リソースタイプ及びメトリックのうちの少なくとも1つであり、
      前記1以上の第1のリソースと前記第2のリソースの各々について、性能変化情報は、そのリソースのメトリック値の時系列変化を表す情報であり、
      前記1以上の第1のリソースの各々について、その第1のリソースの実性能変化情報は、その第1のリソースについて測定されたメトリック値の時系列変化を表す情報であり、
      前記1以上の第1のリソースの各々について、前記第2のリソースの推定性能変化情報は、予め用意された管理情報が表す複数の変換方法のうちの、その第1のリソースのリソース属性と前記第2のリソースのリソース属性とに対応した1以上の変換方法を用いて、その第1のリソースの実性能変化情報が変換された性能変化情報であり、
      前記複数の変換方法の各々は、リソース属性に従う性能変化情報を別のリソース属性に従う性能変化情報に変換するための方法であり、
      前記1以上の第1のリソースの各々は、前記計算機システムのトポロジーにおいて前記第2のリソースに関連するリソースであり、
     (B)前記1以上の第1のリソースの各々について、前記第2のリソースの推定性能変化情報と前記第2のリソースの実性能変化情報との差分に従いその第1のリソースと前記第2のリソースとの関係性を算出し、
      前記第2のリソースの実性能変化情報は、その第2のリソースについて測定されたメトリック値の時系列変化を表す情報であり、
     (C)前記1以上の第1のリソースの各々について算出された関係性に基づく情報である処理結果情報を表示し、
      前記処理結果情報は、前記1以上の第1のリソースのうちの少なくとも1つに関する情報を含む、
    をコンピュータに実行させるためのコンピュータプログラムを記録した記録媒体。
    (A) For each of one or more first resources of a computer system having a plurality of resources, the actual performance change information according to the resource attribute of the first resource is obtained from the second resource of the computer system. The conversion process for converting to the estimated performance change information according to the resource attribute is performed. The plurality of resources include two or more resources having different resource attributes,
    For each of the plurality of resources, the resource attribute is at least one of a resource type and a metric,
    For each of the one or more first resources and the second resource, the performance change information is information indicating a time-series change in the metric value of the resource,
    For each of the one or more first resources, the actual performance change information of the first resource is information indicating a time-series change of the metric value measured for the first resource,
    For each of the one or more first resources, the estimated performance change information of the second resource is the resource attribute of the first resource of the plurality of conversion methods represented by the management information prepared in advance, and Using the one or more conversion methods corresponding to the resource attribute of the second resource, the actual performance change information of the first resource is converted performance change information,
    Each of the plurality of conversion methods is a method for converting performance change information according to a resource attribute into performance change information according to another resource attribute,
    Each of the one or more first resources is a resource associated with the second resource in a topology of the computer system;
    (B) For each of the one or more first resources, according to the difference between the estimated performance change information of the second resource and the actual performance change information of the second resource, the first resource and the second resource Calculate the relationship with the resource,
    The actual performance change information of the second resource is information representing a time-series change of the metric value measured for the second resource,
    (C) displaying processing result information that is information based on the relationship calculated for each of the one or more first resources;
    The processing result information includes information on at least one of the one or more first resources.
    A recording medium on which a computer program for causing a computer to execute is recorded.
  9.  前記1以上の第1のリソースの少なくとも1つについて、その第1のリソースと前記第2のリソースとの間に1以上のリソースである1以上の中間リソースが存在する場合、前記変換処理は、その第1のリソースから前記第2のリソースにかけてリソース間で性能変換情報の変換を順次に行っていく処理である順次変換処理である、
    請求項8記載のコンピュータプログラム。
    For at least one of the one or more first resources, when there is one or more intermediate resources that are one or more resources between the first resource and the second resource, the conversion process includes: It is a sequential conversion process that is a process of sequentially converting performance conversion information between resources from the first resource to the second resource.
    The computer program according to claim 8.
  10.  前記1以上の第1のリソースの少なくとも1つについての前記順次変換処理において、
      (a1)性能変化情報の変換が未だのエッジである未処理エッジがその第1のリソースと前記第2のリソース間にあるか否かを判断し、
      (a2)(a1)の判断結果が真の場合、最も第1のリソース寄りの未処理エッジについて、変換元リソース属性と変換先リソース属性とに対応した変換方法を用いて、その変換元リソース属性に従う性能変化情報をその変換先リソース属性に従う推定性能変化情報に変換し、(a1)に戻り、
        当該未処理エッジについて、変換元リソース属性は、当該未処理エッジについての変換元リソースのリソース属性であり、
        当該未処理エッジについて、変換先リソース属性は、当該未処理エッジについての変換先リソースのリソース属性であり、
        当該未処理エッジについて、変換元リソースは、当該未処理エッジの両端のリソースのうちの、当該第1のリソース側のリソースであり、
        当該未処理エッジについて、変換先リソースは、当該未処理エッジの両端のリソースのうちの、前記第2のリソース側のリソースであり、
      (a3)(a1)の判断結果が偽の場合、当該順次変換処理を終了する、
    請求項9記載のコンピュータプログラム。
    In the sequential conversion process for at least one of the one or more first resources,
    (A1) determining whether an unprocessed edge, which is an edge for which performance change information has not yet been converted, is between the first resource and the second resource;
    (A2) When the determination result of (a1) is true, the conversion source resource attribute for the unprocessed edge closest to the first resource is converted using the conversion method corresponding to the conversion source resource attribute and the conversion destination resource attribute. Is converted into estimated performance change information according to the destination resource attribute, and the process returns to (a1).
    For the unprocessed edge, the conversion source resource attribute is the resource attribute of the conversion source resource for the unprocessed edge,
    For the unprocessed edge, the conversion destination resource attribute is the resource attribute of the conversion destination resource for the unprocessed edge,
    For the unprocessed edge, the transformation source resource is the resource on the first resource side among the resources at both ends of the unprocessed edge,
    For the unprocessed edge, the conversion destination resource is a resource on the second resource side among resources at both ends of the unprocessed edge,
    (A3) When the determination result of (a1) is false, the sequential conversion process is terminated.
    The computer program according to claim 9.
  11.  前記処理結果情報に関し、前記1以上の第1のリソースの少なくとも1つは、算出された関係性が所定値以上である第1のリソースである、
    請求項8記載のコンピュータプログラム。
    Regarding the processing result information, at least one of the one or more first resources is a first resource whose calculated relationship is a predetermined value or more.
    The computer program according to claim 8.
  12.  前記第2のリソースは、問題が生じているリソースである問題リソースであり、
     前記1以上の第1のリソースの少なくとも1つは、前記問題リソースのボトルネックの候補である、
    請求項11記載のコンピュータプログラム。
    The second resource is a problem resource that is a resource in which a problem occurs,
    At least one of the one or more first resources is a candidate bottleneck for the problem resource;
    The computer program according to claim 11.
  13.  前記第2のリソースは、問題が生じているリソースである問題リソースである、
    請求項8記載のコンピュータプログラム。
    The second resource is a problem resource that is a resource in which a problem occurs.
    The computer program according to claim 8.
  14.  前記複数の変換方法のうちの少なくとも1つは、相関関数を含み、
     前記1以上の第1のリソースの各々について、算出された関係性は、相関係数である、
    請求項8記載のコンピュータプログラム。
    At least one of the plurality of transformation methods includes a correlation function;
    For each of the one or more first resources, the calculated relationship is a correlation coefficient.
    The computer program according to claim 8.
  15.  (A)複数のリソースを有する計算機システムのうちの1以上の第1のリソースの各々について、その第1のリソースのリソース属性に従う実性能変化情報を、前記計算機システムのうちの第2のリソースのリソース属性に従う推定性能変化情報に変換する変換処理を実
      前記複数のリソースは、リソース属性が異なる2以上のリソースを含み、
      前記複数のリソースの各々について、リソース属性は、リソースタイプ及びメトリックのうちの少なくとも1つであり、
      前記1以上の第1のリソースと前記第2のリソースの各々について、性能変化情報は、そのリソースのメトリック値の時系列変化を表す情報であり、
      前記1以上の第1のリソースの各々について、その第1のリソースの実性能変化情報は、その第1のリソースについて測定されたメトリック値の時系列変化を表す情報であり、
      前記1以上の第1のリソースの各々について、前記第2のリソースの推定性能変化情報は、予め用意された管理情報が表す複数の変換方法のうちの、その第1のリソースのリソース属性と前記第2のリソースのリソース属性とに対応した1以上の変換方法を用いて、その第1のリソースの実性能変化情報が変換された性能変化情報であり、
      前記複数の変換方法の各々は、リソース属性に従う性能変化情報を別のリソース属性に従う性能変化情報に変換するための方法であり、
      前記1以上の第1のリソースの各々は、前記計算機システムのトポロジーにおいて前記第2のリソースに関連するリソースであり、
     (B)前記1以上の第1のリソースの各々について、前記第2のリソースの推定性能変化情報と前記第2のリソースの実性能変化情報との差分に従いその第1のリソースと前記第2のリソースとの関係性を算出し、
      前記第2のリソースの実性能変化情報は、その第2のリソースについて測定されたメトリック値の時系列変化を表す情報であり、
     (C)前記1以上の第1のリソースの各々について算出された関係性に基づく情報である処理結果情報を表示し、
      前記処理結果情報は、前記1以上の第1のリソースのうちの少なくとも1つに関する情報を含む、
    方法。
    (A) For each of one or more first resources of a computer system having a plurality of resources, the actual performance change information according to the resource attribute of the first resource is obtained from the second resource of the computer system. The conversion process for converting to the estimated performance change information according to the resource attribute is performed. The plurality of resources include two or more resources having different resource attributes,
    For each of the plurality of resources, the resource attribute is at least one of a resource type and a metric,
    For each of the one or more first resources and the second resource, the performance change information is information indicating a time-series change in the metric value of the resource,
    For each of the one or more first resources, the actual performance change information of the first resource is information indicating a time-series change of the metric value measured for the first resource,
    For each of the one or more first resources, the estimated performance change information of the second resource is the resource attribute of the first resource of the plurality of conversion methods represented by management information prepared in advance, and Using the one or more conversion methods corresponding to the resource attribute of the second resource, the actual performance change information of the first resource is converted performance change information,
    Each of the plurality of conversion methods is a method for converting performance change information according to a resource attribute into performance change information according to another resource attribute,
    Each of the one or more first resources is a resource associated with the second resource in a topology of the computer system;
    (B) For each of the one or more first resources, according to the difference between the estimated performance change information of the second resource and the actual performance change information of the second resource, the first resource and the second resource Calculate the relationship with the resource,
    The actual performance change information of the second resource is information representing a time-series change of the metric value measured for the second resource,
    (C) displaying processing result information that is information based on the relationship calculated for each of the one or more first resources;
    The processing result information includes information on at least one of the one or more first resources.
    Method.
PCT/JP2017/000683 2017-01-11 2017-01-11 Management system for managing calculator system WO2018131100A1 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2018537551A JP6591689B2 (en) 2017-01-11 2017-01-11 Management system for managing computer systems
PCT/JP2017/000683 WO2018131100A1 (en) 2017-01-11 2017-01-11 Management system for managing calculator system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2017/000683 WO2018131100A1 (en) 2017-01-11 2017-01-11 Management system for managing calculator system

Publications (1)

Publication Number Publication Date
WO2018131100A1 true WO2018131100A1 (en) 2018-07-19

Family

ID=62839638

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2017/000683 WO2018131100A1 (en) 2017-01-11 2017-01-11 Management system for managing calculator system

Country Status (2)

Country Link
JP (1) JP6591689B2 (en)
WO (1) WO2018131100A1 (en)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013001609A1 (en) * 2011-06-28 2013-01-03 株式会社日立製作所 Monitoring system and monitoring method
JP2013206321A (en) * 2012-03-29 2013-10-07 Fujitsu Ltd Management device, resource management method, resource management program and information processing system
JP2016197450A (en) * 2016-07-25 2016-11-24 日本電気株式会社 Operation management device, operation management system, information processing method, and operation management program

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013001609A1 (en) * 2011-06-28 2013-01-03 株式会社日立製作所 Monitoring system and monitoring method
JP2013206321A (en) * 2012-03-29 2013-10-07 Fujitsu Ltd Management device, resource management method, resource management program and information processing system
JP2016197450A (en) * 2016-07-25 2016-11-24 日本電気株式会社 Operation management device, operation management system, information processing method, and operation management program

Also Published As

Publication number Publication date
JPWO2018131100A1 (en) 2019-01-17
JP6591689B2 (en) 2019-10-16

Similar Documents

Publication Publication Date Title
US9864517B2 (en) Actively responding to data storage traffic
WO2016199232A1 (en) Storage management computer and management method for storage device
US10983822B2 (en) Volume management by virtual machine affiliation auto-detection
US10389809B2 (en) Systems and methods for resource management in a networked environment
US9854060B2 (en) Methods and systems for monitoring network storage system resources by an API server
US10084861B2 (en) Systems and methods for managing resources in networked environment
US20190317787A1 (en) Rebuilding a virtual infrastructure based on user data
US20230153217A1 (en) Methods and systems for managing networked storage system resources
US11030060B2 (en) Data validation during data recovery in a log-structured array storage system
US10691337B2 (en) Artificial intelligence and machine learning systems and methods for a storage system
US20170206027A1 (en) Management system and management method of computer system
JP6442642B2 (en) Management system and management method for managing computer system
US10313439B2 (en) Methods and systems for managing resources in a networked storage environment
JP6591689B2 (en) Management system for managing computer systems
US10037156B1 (en) Techniques for converging metrics for file- and block-based VVols
US20160004584A1 (en) Method and computer system to allocate actual memory area from storage pool to virtual volume
JP6842502B2 (en) Fault analysis support system, fault analysis support method, and computer program
US10789139B2 (en) Method of rebuilding real world storage environment
US9983814B1 (en) Techniques for aggregating metrics for VVols within a storage container
Tate et al. IBM Real-time Compression in IBM SAN Volume Controller and IBM Storwize V7000
US11983147B2 (en) Deduplicating data integrity checks across systems
US11777519B2 (en) Partitional data compression
US20220391353A1 (en) Deduplicating data integrity checks across systems
US20230116173A1 (en) Console command composition
Windows Optimizing and Troubleshooting

Legal Events

Date Code Title Description
ENP Entry into the national phase

Ref document number: 2018537551

Country of ref document: JP

Kind code of ref document: A

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 17891711

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 17891711

Country of ref document: EP

Kind code of ref document: A1