WO2018029781A1 - 管理計算機、性能監視方法及び計算機システム - Google Patents

管理計算機、性能監視方法及び計算機システム Download PDF

Info

Publication number
WO2018029781A1
WO2018029781A1 PCT/JP2016/073427 JP2016073427W WO2018029781A1 WO 2018029781 A1 WO2018029781 A1 WO 2018029781A1 JP 2016073427 W JP2016073427 W JP 2016073427W WO 2018029781 A1 WO2018029781 A1 WO 2018029781A1
Authority
WO
WIPO (PCT)
Prior art keywords
component
information
performance
similarity
dynamic threshold
Prior art date
Application number
PCT/JP2016/073427
Other languages
English (en)
French (fr)
Inventor
真希 津田
茂 堀川
幸祐 柴田
Original Assignee
株式会社日立製作所
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社日立製作所 filed Critical 株式会社日立製作所
Priority to US15/759,836 priority Critical patent/US20180267879A1/en
Priority to JP2018510140A priority patent/JP6533623B2/ja
Priority to PCT/JP2016/073427 priority patent/WO2018029781A1/ja
Publication of WO2018029781A1 publication Critical patent/WO2018029781A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • G06F11/3495Performance evaluation by tracing or monitoring for systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3409Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3452Performance evaluation by statistical analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/45595Network integration; Enabling network access in virtual machine instances
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/81Threshold
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects

Definitions

  • the present invention relates to a technique for monitoring the performance of a computer system.
  • Patent Document 1 As a method for detecting the occurrence of a failure by monitoring the performance of the IT infrastructure system, monitoring using a static threshold value that fixes a set value is widely adopted.
  • a monitoring technique using a dynamic threshold is known (for example, Patent Document 1).
  • the system operation management apparatus assigns a judgment criterion in future failure detection from the correlation model of performance information, and detects the failure.
  • the user inputs parameters such as a threshold calculation method and an initial value.
  • This dynamic threshold value calculation method and parameter input require the user to make a judgment based on the characteristics and configuration of the device, and depending on the user's experience to set appropriately.
  • the present invention has been made in view of the above problems, shortens the period until deriving an appropriate threshold, and appropriately sets dynamic threshold calculation methods and parameters regardless of user experience.
  • the purpose is to do.
  • the present invention is a management computer having a processor and a memory for monitoring the performance of a component of a computer system, and storing attribute information for storing characteristic information of the component and a connection relationship between the components.
  • the processor receives the component to be added or updated, the processor updates the attribute information and the component-related information. Then, the processor determines a combination of the component element and the characteristic information based on the component related information and the attribute information, and specially determines between the component elements.
  • the similarity of information is calculated, and the processor selects a component that satisfies a predetermined condition of the similarity of the characteristic information, acquires a dynamic threshold value calculation method set for the component, and receives the acceptance
  • the dynamic threshold value calculation information is registered in the dynamic threshold value calculation information.
  • VM attribute management table
  • FIG. 1 is a block diagram showing an example of a computer system according to an embodiment of the present invention.
  • the computer system includes physical computers 1-A and 1-B that operate one or more virtual computers 12-1 to 12-x, and storage 2-A to provide storage areas to the virtual computers 12-1 to 12-x.
  • Management server 3 for managing 2-C, physical computers 1-A and 1-B, and storages 2-A to 2-C, physical computers 1-A and 1-B, and storages 2-A to 2- C and a switch 5 for connecting the management servers 3 to each other.
  • the entire physical computers 1-A and 1-B are represented by symbols without “ ⁇ ”. The same applies to the reference numerals of other components.
  • the physical computer 1-A has a hardware 17 including a processor 13, a memory 14, an HBA (Host Bus Adapter) 15, and a NIC (Network Interface Card) 16, and the hardware 17 is virtualized (or logically divided).
  • the computer includes the hypervisor 11 assigned to the virtual machines 12-1 to 12-x and the OS 18 executed on the virtual machine 12.
  • the physical computer 1-B has the same configuration.
  • the storage 2 provides a volume (VOL in the figure) 20 as a storage area to the virtual machines 12 provided by the physical machines 1-A and 1-B.
  • the management server 3 controls the configuration of the virtual machine 12 operating on the physical machine 1 and the volume 20 allocated to the virtual machine 12.
  • the switch 5 can be composed of a plurality of switches that provide a network that connects the HBA 15 of the physical computer 1, the storage 2, and the management server 3, and a network that connects the NIC 16 of the physical computer 1 and the management server 3.
  • the management server 3 monitors the constituent elements of the computer system such as the virtual machine 12 and the volume 20, and sets a threshold for monitoring the corresponding constituent elements when the configuration is changed.
  • the management server 3 of this embodiment sets a threshold value calculation method and parameters that can dynamically change the threshold value for each component.
  • the program for monitoring the computer system updates the threshold value with the threshold value calculation method and parameters set by the management server 3 at a predetermined timing, and continues monitoring the components.
  • an example in which a performance monitoring program for monitoring the performance of a component uses a dynamic threshold calculation method and parameters set by the management server 3 as a program for monitoring the performance of the component of the computer system.
  • the dynamic threshold calculation method and parameters set by the management server 3 are not limited to performance monitoring, but are applied to threshold calculation methods and parameters such as failure detection, configuration monitoring, and unauthorized access monitoring. can do.
  • the generation of the virtual machine 12 and the assignment of the hardware 17 and the assignment of the volume 20 to the virtual machine 12 may be executed by a server other than the management server 3.
  • the management server 3 of the present embodiment specifies a component for setting or updating the dynamic threshold calculation method at a predetermined trigger (for example, when a component is added or changed), the characteristic information included in the component, Get associations between components.
  • the management server 3 calculates the similarity of the characteristic information between the constituent elements from the characteristic information of the constituent elements to be set from these pieces of information.
  • the management server 3 selects a component with high similarity based on the similarity.
  • the management server 3 applies the dynamic threshold calculation method and parameters set for the selected component to the configuration target component.
  • the management server 3 calculates the threshold value of the configuration target element using the dynamic threshold value calculation method and parameters, and monitors the performance of each configuration element.
  • FIG. 2 is a block diagram illustrating an example of the management server 3.
  • the management server 3 is a computer that includes a processor 31, a memory 32, a storage device 33, a communication I / F 34, and an input / output device 35.
  • the dynamic threshold value calculation program 41, the dynamic threshold value calculation method generation program 42, and the performance monitoring program 43 are loaded in the memory 32 and executed by the processor 31.
  • the storage device 33 stores a table used by each program.
  • the storage device 33 includes an attribute management table 50, a related component management table (component related information) 51, a similar device configuration table 52, a similarity table 53, a parameter table 54, a threshold table 55, and a dynamic threshold calculation.
  • a method table 56, a component / performance value association table (performance value related information) 57, and a performance value DB (performance information storage unit) 58 are included. Details of each table will be described later.
  • the communication I / F 34 is connected to the switch 5 and can communicate with devices on the network.
  • the input / output device 35 includes a keyboard, a mouse, a touch panel, and a display.
  • the dynamic threshold value calculation program 41 is called from the performance monitoring program 43 or the like at a predetermined timing and dynamically updates the threshold value table 55 as will be described later.
  • the dynamic threshold value calculation method generation program 42 is executed when a component is added or updated, and the similarity is calculated from the configuration information of the component for which the dynamic threshold is set.
  • the dynamic threshold value calculation method and parameters of the configuration target component are determined from the similarity.
  • the performance monitoring program 43 acquires the performance information of each component, updates the performance value DB, and compares the threshold value calculated by the dynamic threshold value calculation method with the performance value. If the performance value satisfies a predetermined condition with respect to the threshold value, the performance monitoring program 43 executes predetermined processing such as resource allocation change or migration.
  • Information such as programs and tables for realizing each function of the management server 3 is stored in the storage device 33, storage subsystem, nonvolatile semiconductor memory, hard disk drive, storage device such as SSD (Solid State Drive), IC card, SD, etc. It can be stored in a computer-readable non-transitory data storage medium such as a card or DVD.
  • FIG. 3 is a block diagram illustrating an example of the storage 2-A. Since the configurations of the other storages 2-B and 2-C are the same, the description overlapping with the storage 2-A is omitted.
  • the storage 2-A is connected to MPBs (Multiple Processors Blades) 24-1 to 24-3 that function as control units, CLPRs (Cache Logical Units) 25-1 and 25-2 that control shared memory, and the switch 5.
  • Network I / F 27 an interface 23 connected to a plurality of storage devices 22, and an internal network 26 that interconnects these components.
  • the storage 2-A can allocate the storage area of the physical storage device 22 to the logical storage areas (pools) 21-1 and 21-2.
  • the storage 2-A assigns the logical storage areas assigned to the pools 21-1 and 21-2 to the volume VOLs 1 to 4 (20-1 to 20-4) that become virtual storage areas in response to a request from the management server 3 or the like.
  • the virtual machine 12 mounts the volume VOL20 provided from the storage 2-A, and executes reading and writing.
  • the storage 2-A allocates pool 1 (21-1) and pool 2 (21-2) to the storage areas of the plurality of storage devices 22, and the volumes 1 to 3 from the pool 1 (21-1).
  • An example is shown in which (20-1 to 20-3) are generated and volume 4 (20-4) is generated from pool 2 (21-2).
  • FIG. 4A is a diagram showing an example of the attribute management table 50-A.
  • FIG. 4B is a diagram showing an example of the attribute management table 50-B.
  • the attribute management table 50 is a table that is registered or updated by the management server 3 when a component to be monitored is generated (or changed).
  • the virtual machine 12 and the volume 20 are used as the components to be monitored. The example which adopted is shown. Since the attribute management table 50 has different requirements such as performance for each type of component, tables in different formats are set.
  • the component to be monitored may be a logical (or virtualized) computer resource that can be generated, moved, stopped, or deleted during operation of the computer system.
  • the attribute management table 50-A in FIG. 4A is assigned to a starting point 501 for storing the identifier of the virtual machine 12 (component), an OS 502 for storing the type of OS executed on the virtual machine 12, and the virtual machine 12
  • One CPU 503 for storing the number of cores of the processor 13, a memory 504 for storing the capacity of the memory 14 allocated to the virtual machine 12, and a disk 505 for storing the capacity of the volume 20 allocated to the virtual machine 12. Included in the entry.
  • the virtual machine 12 is set as a constituent element of the physical machine 1 at the starting point 501, and the OS 502 to Disk 505 handle it as characteristic information indicating the characteristic of the virtual machine 12.
  • the attribute management table 50-B in FIG. 4B includes the starting point 501 for storing the identifier of the volume 20, the storage 506 for storing the identifier of the storage providing the volume 20, and the identifier of the MPB 24 used by the volume 20.
  • the MPB 507 to be stored the CLPR 508 that stores the identifier of the CLPR 25 used by the volume 20, the Pool 509 that stores the identifier of the pool 21 that provides the storage area of the volume 20, and the capacity allocated to the volume 20
  • the storage capacity 510 is included in one entry.
  • the attribute management table 50-A stores information on the virtual machine 12 generated in the physical computer 1, and the attribute management table 50-B stores information on the volume VOL 20 generated in the storage 2.
  • the volume VOL20 is set as a component of the storage 2 at the starting point 501, and the storages 506 to 510 are handled as characteristic information indicating the characteristics of the volume VOL20.
  • FIG. 5A is a diagram showing an example of the related component management table 51-A.
  • FIG. 5B is a diagram showing an example of the related component management table 51-B.
  • the related component management table 51 is a table that is registered or updated when the management server 3 assigns the volume VOL 20 to the virtual machine 12.
  • the table for specifying the storage of the volume VOL 20 used by the virtual machine 12 is the related component management table 51-A, and the table for specifying the virtual machine 12 on the hypervisor 11 using the volume VOL 20 is used. Is the related component management table 51-B.
  • the related component management table 51-A in FIG. 5A includes a starting point 511 for storing the identifier of the virtual machine 12, a Volume 512 for storing the identifier of the volume VOL 20 allocated to the virtual machine 12, and a storage for providing the volume VOL 20 Storage 513 for storing the identifier is included in one entry.
  • the related component management table 51-B in FIG. 5B uses the starting point 511 for storing the identifier of the volume 20, the HYP 514 to which the volume VOL20 is allocated and storing the identifier of the hypervisor 11, and the volume 20.
  • the VM 515 that stores the identifier of the virtual machine 12 is included in one entry.
  • FIG. 6 is a diagram illustrating an example of the similar device configuration table 52.
  • the similar device configuration table 52 is a table generated by the management server 3 when the virtual machine 12 is generated and the volume VOL 20 is allocated.
  • the similar device configuration table 52 includes a starting point 521 for storing the identifier of the virtual machine 12, an OS 522 for storing the type of OS running on the virtual machine 12, and a CPU for storing the number of cores of the processor 13 assigned to the virtual machine 12.
  • One entry includes a volume 526 to be stored and a storage 527 for storing an identifier of the storage that provides the volume VOL20.
  • the similar device configuration table 52 is a table in which the elements of the attribute management tables 50-A and 50-B are linked based on the relationship between the virtual machine 12 and the volume VOL 20 in the related component management table 51.
  • FIG. 6 shows an example in which the identifier of the virtual machine 12 is set as a component at the starting point 521, the identifier of the volume VOL 20 can also be set as a component as will be described later.
  • the identifier of the volume VOL 20 that is a component related to the virtual machine 12 at the starting point 521 is stored in the Volume 526. That is, one of the mutually related components can be set as the starting point 521, and the other component can be handled in the same manner as other characteristic information. The relationship between the component of the starting point and the component included in the characteristic information is the same in other tables.
  • FIG. 7 is a diagram illustrating an example of the similarity table 53.
  • the similarity table 53 is a table that stores the similarity of the configuration of the virtual machine 12 calculated by the virtual machine 12.
  • the similarity of the other virtual machines 12 (VM2 to VM4) to the configuration of the virtual machine 12 (VM1) is shown.
  • the similarity is higher as the value is smaller, and the similarity is lower as the value is larger.
  • FIG. 8 is a diagram illustrating an example of the threshold value table 55.
  • the threshold table 55 holds values calculated by the management server 3 using the dynamic threshold calculation method and parameters set in the dynamic threshold calculation method table 56 and the parameter table 54 for each performance value of each component.
  • the threshold table 55 includes a starting point 551 for storing the identifier of the virtual machine 12 and performance values 1 (552) to 5 (556) for storing the threshold value for each performance value in one entry.
  • the dynamic threshold calculation program 41 of the management server 3 updates the threshold table 55 by a dynamic threshold calculation method at a predetermined timing. Then, the performance monitoring program 43 compares the performance value acquired from the component to be monitored with the threshold value in the threshold value table 55 and performs predetermined processing such as resource shortage and failure detection.
  • the performance values 1 (552) to 5 (556) in the threshold value table 55 depend on the dynamic threshold value calculation method for the performance values 1 to 5 set in the dynamic threshold value calculation method table 56, as will be described later.
  • the calculation result is stored.
  • the management server 3 dynamically updates the threshold table 55 by calculating a threshold using a dynamic threshold calculation method and parameters at a predetermined timing such as a predetermined cycle.
  • FIG. 9 is a diagram illustrating an example of the dynamic threshold calculation method table 56.
  • the dynamic threshold calculation method table 56 the calculation method selected by the dynamic threshold calculation method generation program 42 of the management server 3 for each of the performance values 1 to 5 is set.
  • the dynamic threshold calculation method table 56 and the threshold table 55 include a starting point 551 for storing the identifier of the virtual machine 12, and performance values 1 (552) to 5 (for storing the dynamic threshold calculation method for each performance value). 556) is included in one entry.
  • preset calculation methods such as outlier removal by LOF (Local Outlier Factor), maximum value, average filter (moving average) value, median filter value, etc. are set as methods A to H in the figure. Keep it.
  • LOF Local Outlier Factor
  • maximum value maximum value
  • average filter moving average value
  • median filter value etc.
  • FIG. 10 is a diagram illustrating an example of a relation table 57 between component elements and performance values.
  • the association table 57 between the component elements and the performance value is information set in advance in the management server 3.
  • the component / performance value association table 57 includes, in one entry, a performance value 571 for storing the name of the performance value and a related component 572 for storing characteristic information of the component related to the performance value.
  • the related component 572 stores one or more characteristic information included in the component.
  • the component 572 whose performance value 571 corresponds to “CPU Use Rate” is defined as “OS” and “CPU”, and the OS type and the number of CPUs are defined as related to the usage rate of the processor 31. Yes.
  • OS and CPU are defined for the component 572 whose performance value 571 corresponds to “CPU Ready Rate”, and the OS type and the number of CPUs are defined to be related to the usage rate of the processor 31.
  • CPU Ready Rate indicates the ratio of the time when the processor 31 assigned to the virtual machine 12 is in a waiting state due to contention with another virtual machine 12.
  • the component 572 corresponding to “Disk Read Rate” and “Disk Write Rate” is defined as “Disk”, “Volume”, and “Storage” related to each other. Further, each row of the performance value 571 corresponds to the performance values 1 to 5 of the threshold value table 55 and the dynamic threshold value calculation method table 56.
  • FIG. 11 is a diagram illustrating an example of the parameter table 54.
  • the parameter table 54 stores values selected by the dynamic threshold value calculation method generation program 42 of the management server 3.
  • the parameter table 54 includes a starting point 541 for storing the identifier of the virtual machine 12 and performance values 1 (542) to 5 (546) for storing parameters for each performance value in one entry.
  • parameters used in the methods A to H of the dynamic threshold value calculation method table 56 in FIG. 9 are stored.
  • parameters one or more parameters can be stored in accordance with the methods A to H, such as initial values, filter cutoff values, and recalculation cycles.
  • the performance value DB 58 stores the performance values of the monitoring target components acquired by the performance monitoring program 43 at a predetermined cycle.
  • the performance value DB 58 has a virtual format in the same format as the threshold value table 55 and the dynamic threshold value calculation method table 56.
  • the performance values 1 to 5 can be stored in time series using the computer 12 as an index.
  • FIG. 12 is a diagram illustrating a process of generating a similar device configuration table.
  • the illustrated example shows a process in which the management server 3 generates the similar device configuration table 52 when the virtual machine 12-1 (VM1) and the volume VOL1 (20-1) are added.
  • VM1 virtual machine 12-1
  • VOL1 volume of processing
  • the management server 3 When the virtual machine 12-1 (VM1) is generated and the volume VOL1 (20-1) is assigned to the virtual machine 12-1 (VM1), the management server 3 registers it in the attribute management table 50 and the related component management table 51. .
  • the management server 3 acquires the relationship with the storage 2 of the volume VOL 20 allocated to the added virtual machine 12 from the related component management table 51-A.
  • the management server 3 acquires the characteristic information of the constituent elements of the attribute management tables 50-A and 50-B, and the relationship between the virtual machine 12 set in the related component management table 51-A and the storage 2 of the volume VOL20.
  • a similar device configuration table 52 is generated. Thereafter, the management server 3 calculates the similarity as shown in FIG.
  • FIG. 13 is a diagram illustrating a process of generating a similar device configuration table.
  • the management server 3 when the volume VOL1 (20-1) to be allocated to the virtual machine VM1 (12-1) is added, the management server 3 generates a similar device configuration table 52 starting from the volume VOL1 (20-1). Shows the process.
  • the management server 3 acquires the relationship between the added volume VOL20 and the hypervisor 11 of the virtual machine 12 to which the volume VOL20 is allocated from the related component management table 51-B.
  • the management server 3 acquires information on the components of the attribute management tables 50-A and 50-B, and is similar in the relationship between the volume VOL 20 set in the related component management table 51-B and the hypervisor 11 of the virtual machine 12.
  • a device configuration table 52-B is generated. Thereafter, as described above, the management server 3 calculates the similarity as shown in FIG.
  • the similar device configuration table 52-B stores the identifier of the volume VOL 20 as a starting point, and includes columns of Storage, MPB, CLPR, Pool, capacity, HYP, and VM.
  • the format of the similar device configuration table 52-B can be changed according to the type of the component that is the starting point.
  • the format of the similar device configuration table 52-B is set in advance according to the type of component.
  • FIG. 14 is a diagram showing a process of generating a similarity table 53 from the similar device configuration table 52 and selecting similar components.
  • the management server 3 determines the similarity of the characteristic information between the components for the added virtual machine VM1 (12-1) from the similar equipment configuration table 52 generated as shown in FIG. 12 (or FIG. 13).
  • the similarity table 53 is generated by calculating for each characteristic information of VM2 to VM4.
  • the management server 3 acquires characteristic information for comparing the similarity between the constituent elements from the related constituent elements 572 in the relation table 57 of the constituent elements and the performance values.
  • characteristic information for comparing the similarity between the constituent elements from the related constituent elements 572 in the relation table 57 of the constituent elements and the performance values.
  • an example is shown in which the similarity of characteristic information between components is compared with three performance values.
  • the management server 3 selects similar components based on a plurality of performance values. For example, when the performance value is “Memory Use Rate” and “DISK READ / WRITE RATE”, VM4 with the smallest value of Memory 534 and VM3 with the sum of Disk 535, Volume 536, and Storage 537 as the high similarity components select.
  • a component with high similarity is a component with which similarity satisfies a predetermined condition, and in this embodiment, the component has the minimum similarity.
  • the management server 3 selects the VM 4 having the highest similarity (minimum similarity) among the selected components, and the dynamic threshold value calculation method (methods B, E, F, G) set for the VM 4 , B) and parameters are set as generation of a dynamic threshold value calculation method of the virtual machine VM1 (12-1).
  • the most frequently used for each performance value of each component among the multiple dynamic threshold calculation methods and parameters is selected. Thereby, it is possible to set an optimal dynamic threshold value calculation method and parameters from components having high similarity.
  • parameters that satisfy preset criteria such as the average value of parameters set for these components and the most used values are adopted. You may make it do.
  • the performance value for selecting the component based on the similarity may be one or more, and the performance value to be used among the performance values set in the relationship table 57 (performance value related information) between the component and the performance value. May be specified.
  • the predetermined condition for selecting a component with high similarity is not limited to the component with the minimum similarity, but includes the similarity of other components to which the component is connected. May be.
  • FIG. 15 is a flowchart illustrating an example of processing performed in the management server. This process is a process executed by the dynamic threshold value calculation method generation program 42 when a monitoring target component is added. Note that the processing may be executed when a component to be monitored is changed.
  • the dynamic threshold value calculation method generation program 42 of the management server 3 receives the attribute and relationship of the added component via the input / output device 35, and manages the attribute.
  • the component is registered in the table 50 and the related component management table 51 (S2).
  • the dynamic threshold value calculation method generation program 42 of the management server 3 calculates the similarity degree of the characteristic information of the other constituent elements with respect to the characteristic information of the added constituent elements (S3). .
  • the management server 3 reads the related component management table 51, determines a combination of each component and characteristic information, and generates a similar device configuration table 52 by connecting the related component management table 51 and the attribute management table 50.
  • the management server 3 calculates the similarity of other components with respect to the added component for each characteristic information of the similar device configuration table 52, and generates the similarity table 53.
  • the management server 3 selects a highly similar component from the similarity of the characteristic information in the similarity table 53. Then, the management server 3 selects a dynamic threshold calculation method and a parameter for each performance value of the component from the dynamic threshold calculation method table 56 and the parameter table 54 of the selected component, and moves the added component
  • the dynamic threshold value calculation method and parameters are set in the dynamic threshold value calculation method table 56 and the parameter table 54 (S4). Thereafter, the management server 3 calculates the threshold value of the added component based on the dynamic threshold value calculation method table 56 and the parameter table 54 and stores the calculated threshold value in the threshold value table 55.
  • the management server 3 executes the performance monitoring program 43 in step S5, acquires the performance value, and stores it in the performance value DB 58.
  • the performance monitoring program 43 compares the acquired performance values with the values in the threshold table 55 and executes predetermined processing such as resource shortage or abnormality detection.
  • the management server 3 determines whether or not it is an opportunity to review the dynamic threshold value calculation method in step S6. If it is a predetermined opportunity to review the dynamic threshold calculation method (resource shortage or failure), the process returns to step S2 and the above processing is repeated. On the other hand, if it is not an opportunity to review the dynamic threshold value calculation method, the process returns to step S5 and the performance value monitoring is continued.
  • the dynamic threshold calculation method and parameters set for the component with high similarity among the components already in operation are applied to the added component. By doing so, it is possible to shorten the period until deriving an appropriate threshold value, and to appropriately set the dynamic threshold value calculation method and the parameter setting regardless of the user's experience.
  • the administrator or the like may determine the dynamic threshold calculation method for each of the performance values 1 to 5 in the dynamic threshold calculation method table 56 and generate the threshold table 55.
  • step S6 in addition to the processing of the performance monitoring program 43, when a command from an administrator or the like is accepted, the process returns to step S2 to change the components. Or the processing may be terminated.
  • FIG. 16 is a flowchart showing an example of similarity calculation processing performed in step 3 of FIG.
  • the management server 3 acquires the relationship between the components of the related component management table 51 and acquires characteristic information of the related components from the attribute management table 50.
  • step S12 the characteristic information acquired from the attribute management table 50 by the management server 3 is combined with related components in the related component management table 51 to generate a similar device configuration table 52.
  • step S ⁇ b> 13 the management server 3 calculates the similarity for each characteristic of the similar device configuration table 52.
  • step S13 the similarity of each characteristic information calculated from the similar device configuration table 52 by the management server 3 is stored in the column of the similarity table 53, and the similarity table 53 is generated.
  • the management server 3 generates the similar device configuration table 52 by combining the information of the attribute management table 50 from the relevance between the components of the related component management table 51. Then, the similarity degree table 53 can be generated by calculating the similarity degree from the value of the characteristic information of the added constituent element and the characteristic information of the column of the existing constituent element.
  • FIG. 17 is a flowchart showing an example of the dynamic threshold value calculation method and parameter selection processing performed in step 4 of FIG.
  • step S21 the management server 3 selects one of performance values 1 to 5 not set in the dynamic threshold calculation method table 56 for the added component. This process may be selected by the management server 3 according to the column order or the like.
  • the management server 3 refers to the component / performance value association table 57 and acquires characteristic information of the component associated with the selected performance value. For example, when the performance value 571 of “CPU USE RATE” is selected, the management server 3 sets “OS” and “CPU count” as characteristic information included in the component from the relation table 57 of the component and performance value. select. Next, in step S23, the management server 3 refers to the similarity table 53 and acquires the similarity of the selected characteristic information.
  • step S24 the management server 3 acquires resource information for the selected component.
  • the similarity table 53 is input as resource information, and the management server 3 acquires n similarities of the characteristic information of the selected component from the similarity table 53.
  • the management server 3 selects a starting point 561 that matches the starting point 531 from the dynamic threshold value calculating method table 56, and selects the dynamic threshold value calculating method (method B) set in the characteristic information of the entry (VM4). get. Then, the management server 3 sets the dynamic threshold value calculation method in the dynamic threshold value calculation method table 56 as the dynamic threshold value calculation method for the unset performance value selected in step S21.
  • step S26 the management server 3 acquires resource information using the dynamic threshold value calculation method determined in step S25. That is, the management server 3 selects m entries including the dynamic threshold value calculation method determined in step S25 in the performance value column of the dynamic threshold value calculation method table 56 corresponding to the performance value selected in step S21.
  • step S27 the management server 3 acquires the starting points 531 of the m entries selected in step S26, and selects an entry that matches the starting points 531 of the m entries from the starting points 541 of the parameter table 54.
  • the management server 3 acquires the parameters set in the performance values (552 to 556) of the entry selected in the parameter table 54. Then, the management server 3 sets the parameter in the parameter table 54 corresponding to the unset performance value selected in step S21.
  • step S28 the management server 3 updates the dynamic threshold value calculation method table 56 and the parameter table 54.
  • step S29 it is determined whether or not there is a performance value to be set next among the added components. That is, if there is an unset performance value, the process returns to step S21 to repeat the above process, and if the dynamic threshold value calculation method and parameter settings have been completed for all performance values of the added component, the process ends. .
  • the management server 3 reads the updated dynamic threshold calculation method table 56 and the parameter table 54 by starting the dynamic threshold calculation program 41 at a predetermined timing (for example, a predetermined cycle), The threshold value is calculated and the threshold value table 55 is dynamically updated.
  • the management server 3 when the management server 3 receives a component to be added or updated, the management server 3 updates the attribute management table 50 and the related component management table 51, and the related component management table 51 and the attribute management table. 50, the combination of the component and the characteristic information is determined to generate the similar device configuration table 52, and the similarity of the characteristic information between the components is calculated based on the similar device configuration table 52. Then, the management server 3 selects a component whose characteristic information similarity satisfies a predetermined condition, acquires the dynamic threshold value calculation method set for the component from the dynamic threshold value calculation method table 56, and accepts it. Are registered in the dynamic threshold value calculation method table 56 as the dynamic threshold value calculation method for the component.
  • the threshold value table 55 is updated in the dynamic threshold value calculation method table 56 to shorten the period until the appropriate threshold value is derived, and the setting of the dynamic threshold value calculation method and the parameter setting are performed by the user. It is possible to set optimally without depending on the experience of the administrator.
  • each of the above-described configurations, functions, processing units, processing means, and the like may be realized by hardware by designing a part or all of them with, for example, an integrated circuit.
  • each of the above-described configurations, functions, and the like may be realized by software by the processor interpreting and executing a program that realizes each function.
  • Information such as programs, tables, and files that realize each function can be stored in a memory, a hard disk, a recording device such as an SSD (Solid State Drive), or a recording medium such as an IC card, an SD card, or a DVD.
  • control lines and information lines indicate what is considered necessary for the explanation, and not all the control lines and information lines on the product are necessarily shown. Actually, it may be considered that almost all the components are connected to each other.
  • the dynamic threshold value calculation method and program used by components having high similarity are set in the dynamic threshold value calculation method table 56 and the parameter table 54 of the setting target component. Therefore, it is possible to shorten the period until deriving an appropriate threshold value, and to appropriately set the dynamic threshold value calculation method setting and parameter setting regardless of the experience of a user such as a computer system administrator. .
  • the present invention may be configured as follows.
  • a storage medium storing a program for controlling a computer having a processor and a memory, A first step of storing characteristic information of the component in attribute information; A second step of storing a connection relationship between the components in component-related information; A third step of storing a threshold in the threshold information for each piece of performance information of the component; A fourth step of setting a dynamic threshold calculation method for dynamically updating the threshold to dynamic threshold calculation information for each piece of performance information of the component; A fifth step of setting, in the performance-related information, characteristic information of the component related to the performance information; A sixth step of accepting a component to be added or updated and updating the attribute information and component-related information; A seventh step of determining a combination of the component element and the characteristic information based on the component-related information and the attribute information, and calculating the similarity of the characteristic information between the component elements; An eighth step of selecting a component in which the similarity of the characteristic information satisfies a predetermined condition; A ninth step of acquiring a dynamic threshold value calculation method set for the selected component and registering it

Abstract

計算機システムの構成要素の性能を監視する管理計算機は、構成要素の特性情報を格納する属性情報と、構成要素間の接続関係を格納するコンポーネント関連情報と、閾値を動的に更新する動的閾値算出方法を構成要素の性能情報毎に設定した動的閾値算出情報と、性能情報に関連する構成要素の特性情報を設定した性能関連情報と、を有し、追加または更新する構成要素を受け付けると、属性情報とコンポーネント関連情報を更新し、コンポーネント関連情報と前記属性情報に基づいて構成要素と特性情報の組み合わせを決定し、構成要素間で特性情報の類似度を算出し、特性情報の類似度が所定の条件を満たす構成要素に設定された動的閾値算出方法を取得して、前記受け付けた構成要素の動的閾値算出方法とする。

Description

管理計算機、性能監視方法及び計算機システム
 本発明は、計算機システムの性能を監視するための技術に関する。
 IT基盤システムの性能を監視することで障害発生を検知する方法として、設定した値を固定する静的な閾値による監視が広く採用されている。より高度な監視を行うために動的閾値による監視の技術が知られている(例えば、特許文献1)。この特許文献1では、システム運用管理装置において、性能情報の相関モデルから将来の障害検出における判断基準を付与し、障害の検出を行う。
特開2013-229064号公報
 動的閾値による監視の特徴として、適切な閾値が算出されるまでは一定期間で計算機システムの性能を安定させた環境で性能情報を収集する必要がある。しかしながら、昨今のITシステム基盤では仮想計算機の追加や仮想ボリュームの追加といった構成の変更が顧客ニーズに合わせて頻繁に発生する。このため、管理計算機で適切な閾値が算出される前に、新たな構成変更が実施される場合があり、適切な閾値を算出できないケースが多く存在した。
 そこで、適切な動的閾値を算出する期間を短縮する必要がでてきた。その解決の1つとしてITインフラ管理製品では閾値算出方式や初期値等のパラメータをユーザが入力している。この動的閾値算出方式とパラメータの入力には機器の特性や構成からユーザが判断する必要があり、適切に設定するためにはユーザの経験に依存していた。
 本発明は、上記問題点に鑑みてなされたもので、適切な閾値導出までの期間を短縮し、かつ、動的閾値算出方法の設定およびパラメータの設定を、ユーザの経験によらず適切に設定することを目的とする。
 本発明は、プロセッサとメモリを有して計算機システムの構成要素の性能を監視する管理計算機であって、前記構成要素の特性情報を格納する属性情報と、前記構成要素間の接続関係を格納するコンポーネント関連情報と、前記構成要素の性能情報毎に閾値を格納する閾値情報と、前記閾値を動的に更新する動的閾値算出方法を前記構成要素の性能情報毎に予め設定した動的閾値算出情報と、前記性能情報に関連する構成要素の特性情報を予め設定した性能関連情報と、を有し、前記プロセッサは、追加または更新する構成要素を受け付けると、前記属性情報とコンポーネント関連情報を更新し、前記プロセッサは、前記コンポーネント関連情報と前記属性情報に基づいて、構成要素と特性情報の組み合わせを決定し、前記構成要素間で特性情報の類似度を算出し、前記プロセッサは、前記特性情報の類似度が所定の条件を満たす構成要素を選択して、当該構成要素に設定された動的閾値算出方法を取得して、前記受け付けた構成要素の前記動的閾値算出方法として動的閾値算出情報に登録する。
 したがって、本発明は、適切な閾値導出までの期間を短縮し、かつ、動的閾値算出方法の設定およびパラメータの設定を、ユーザの経験によらず適切に設定することが可能となる。
本発明の実施例を示し、計算機システムの一例を示すブロック図である。 本発明の実施例を示し、管理サーバの一例を示すブロック図である。 本発明の実施例を示し、ストレージの一例を示すブロック図である。 本発明の実施例を示し、属性管理テーブル(VM)の一例を示す図である。 本発明の実施例を示し、属性管理テーブル(Volume)の一例を示す図である。 本発明の実施例を示し、関連コンポーネント管理テーブル(VM)の一例を示す図である。 本発明の実施例を示し、関連コンポーネント管理テーブル(Volume)の一例を示す図である。 本発明の実施例を示し、類似機器構成テーブルの一例を示す図である。 本発明の実施例を示し、類似度テーブルの一例を示す図である。 本発明の実施例を示し、閾値テーブルの一例を示す図である。 本発明の実施例を示し、動的閾値算出方法テーブルの一例を示す図である。 本発明の実施例を示し、構成要素と性能値の関連テーブルの一例を示す図である。 本発明の実施例を示し、パラメータテーブルの一例を示す図である。 本発明の実施例を示し、類似機器構成テーブルを生成する過程を示す図である。 本発明の実施例を示し、類似機器構成テーブルを生成する過程を示す図である。 本発明の実施例を示し、類似機器構成テーブルから類似度テーブルを生成して類似リソースを選択する過程を示す図である。 本発明の実施例を示し、管理サーバで行われる処理の一例を示すフローチャートである。 本発明の実施例を示し、類似度の計算処理の一例を示すフローチャートである。 本発明の実施例を示し、算出方法とパラメータの選択処理の一例を示すフローチャートである。
 以下、本発明の実施形態を添付図面に基づいて説明する。
 図1は、本発明の実施例を示し、計算機システムの一例を示すブロック図である。
 計算機システムは、1以上の仮想計算機12-1~12-xを稼働させる物理計算機1-A、1-Bと、仮想計算機12-1~12-xに記憶領域を提供するストレージ2-A~2-Cと、物理計算機1-A、1-Bと、ストレージ2-A~2-Cを管理する管理サーバ3と、物理計算機1-A、1-Bと、ストレージ2-A~2-Cと、管理サーバ3を相互に接続するスイッチ5とを含む。なお、以下では、物理計算機1-A、1-Bの全体を「-」以降のない符号で表す。他の構成要素(コンポーネント)の符号についても同様である。
 物理計算機1-Aは、プロセッサ13と、メモリ14と、HBA(Host Bus Adapter)15と、NIC(Network Interface Card)16とを含むハードウェア17と、ハードウェア17を仮想化(または論理分割)して仮想計算機12-1~12-xに割り当てるハイパーバイザ11と、仮想計算機12上で実行されるOS18と、を含む計算機である。物理計算機1-Bも同様の構成である。
 ストレージ2は、物理計算機1-A、1-Bが提供する仮想計算機12に、記憶領域としてボリューム(図中VOL)20を提供する。物理計算機1で稼働する仮想計算機12の構成や、仮想計算機12に割り当てるボリューム20は、管理サーバ3が制御する。
 なお、スイッチ5は、物理計算機1のHBA15とストレージ2及び管理サーバ3を接続するネットワークと、物理計算機1のNIC16と管理サーバ3を接続するネットワークを提供する複数のスイッチで構成することができる。
 管理サーバ3は、仮想計算機12とボリューム20等の計算機システムの構成要素を監視し、構成が変更されたときには該当する構成要素を監視するための閾値を設定する。本実施例の管理サーバ3は、構成要素毎に動的に閾値を変更可能な閾値算出方法やパラメータを設定する。計算機システムを監視するプログラムは、所定のタイミングになると、管理サーバ3が設定した閾値算出方法及びパラメータで閾値を更新して、構成要素の監視を継続する。
 本実施例では、計算機システムの構成要素の性能を監視するプログラムとして、構成要素の性能を監視する性能監視プログラムが、管理サーバ3が設定した動的閾値算出方法及びパラメータを利用する例を示す。管理サーバ3が設定する動的閾値算出方法及びパラメータは、性能の監視に限定されるものではなく、障害の検出や、構成の監視や、不正なアクセスの監視などの閾値算出方法及びパラメータに適用することができる。
 なお、仮想計算機12の生成やハードウェア17の割り当てと、仮想計算機12へのボリューム20の割り当ては、管理サーバ3以外のサーバで実行するようにしてもよい。
 <動的閾値算出方法設定の概要>
 以下、本実施例の管理サーバ3が行う動的閾値算出方法及びパラメータの設定処理の概要について説明する。
 本実施例の管理サーバ3は、所定の契機(例えば、構成要素の追加や変更時など)で動的閾値算出方法を設定または更新する構成要素を特定すると、構成要素に含まれる特性情報と、構成要素間の関連性を取得する。
 次に、管理サーバ3は、これらの情報から設定対象の構成要素の特性情報から、構成要素間で特性情報の類似度を算出する。管理サーバ3は、類似度に基づいて類似性の高い構成要素を選択する。そして、管理サーバ3は、選択した構成要素に設定されている動的閾値算出方法及びパラメータを、当該設定対象の構成要素に適用する。
 そして、管理サーバ3は、動的閾値算出方法とパラメータにより設定対象の構成要素の閾値を算出して、各構成要素の性能監視を行う。
 これにより、適切な閾値導出までの期間を短縮し、かつ、動的閾値算出方法の設定およびパラメータの設定を、ユーザの経験によらず適切に設定することが可能となるのである。
 <管理サーバ>
 図2は、管理サーバ3の一例を示すブロック図である。管理サーバ3は、プロセッサ31と、メモリ32と、記憶装置33と、通信I/F34と、入出力装置35を含む計算機である。
 メモリ32には、動的閾値算出プログラム41と、動的閾値算出方法生成プログラム42と、性能監視プログラム43がロードされてプロセッサ31によって実行される。記憶装置33には、各プログラムで利用されるテーブルが格納される。記憶装置33は、属性管理テーブル50と、関連コンポーネント管理テーブル(コンポーネント関連情報)51と、類似機器構成テーブル52と、類似度テーブル53と、パラメータテーブル54と、閾値テーブル55と、動的閾値算出方法テーブル56と、構成要素と性能値の関連テーブル(性能値関連情報)57と、性能値DB(性能情報格納部)58と、を含む。各テーブルの詳細については後述する。
 通信I/F34は、スイッチ5に接続されてネットワーク上の機器と通信を行うことができる。入出力装置35は、キーボードやマウスあるいはタッチパネルやディスプレイで構成される。
 動的閾値算出プログラム41は、後述するように、所定のタイミングで性能監視プログラム43等から呼び出されて、閾値テーブル55を動的に更新する。動的閾値算出方法生成プログラム42は、後述するように、構成要素の追加や更新などの契機で実行され、動的閾値の設定対象の構成要素の構成情報から類似度を算出し、算出された類似度から設定対象の構成要素の動的閾値算出方法とパラメータを決定する。
 性能監視プログラム43は、各構成要素の性能情報を取得して性能値DBを更新し、動的閾値算出方法で算出された閾値と性能値を比較する。性能値が閾値に対して所定の条件を満たせば、性能監視プログラム43は、リソースの割り当て変更やマイグレーションなどの所定の処理を実行する。
 管理サーバ3の各機能を実現するプログラム、テーブル等の情報は、記憶装置33やストレージサブシステムや不揮発性半導体メモリ、ハードディスクドライブ、SSD(Solid State Drive)等の記憶デバイス、または、ICカード、SDカード、DVD等の計算機読み取り可能な非一時的データ記憶媒体に格納することができる。
 <ストレージ>
 図3は、ストレージ2-Aの一例を示すブロック図である。他のストレージ2-B、2-Cの構成も同様であるので、ストレージ2-Aと重複する説明は省略する。
 ストレージ2-Aは、制御部として機能するMPB(Multiple Processor Blade)24-1~24-3と、共有メモリを制御するCLPR(Cache Logical Partition)25-1、25-2と、スイッチ5に接続されるネットワークI/F27と、複数の記憶デバイス22に接続されるインターフェース23と、これらの構成要素を相互に接続する内部ネットワーク26とを含む。
 ストレージ2-Aは、物理的な記憶デバイス22の記憶領域を論理的な記憶領域(プール)21-1、21-2に割り当てることができる。ストレージ2-Aは、プール21-1、21-2に割り当てられた論理記憶領域を、管理サーバ3等からの要求に応じて仮想記憶領域となるボリュームVOL1~4(20-1~20-4)を生成して、物理計算機1で稼働する仮想計算機12に提供する。仮想計算機12は、ストレージ2-Aから提供されるボリュームVOL20をマウントして、読み書きを実行する。
 図示の例では、ストレージ2-Aが、複数の記憶デバイス22の記憶領域にプール1(21-1)とプール2(21-2)を割り当て、プール1(21-1)からボリューム1~3(20-1~20-3)を生成し、プール2(21-2)からボリューム4(20-4)を生成する例を示している。
 <テーブル類>
 以下、管理サーバ3の記憶装置33に格納された各テーブルについて説明する。図4Aは、属性管理テーブル50-Aの一例を示す図である。また、図4Bは、属性管理テーブル50-Bの一例を示す図である。
 属性管理テーブル50は、管理サーバ3が、監視対象の構成要素の生成時(または変更時)に登録または更新するテーブルであり、本実施例では、監視対象の構成要素として仮想計算機12とボリューム20を採用した例を示す。属性管理テーブル50は、構成要素の種類毎に性能などの要件が異なるため、異なるフォーマットのテーブルが設定される。なお、監視対象の構成要素は、計算機システムの稼働中に生成、移動、停止、削除が可能な論理的な(または仮想化された)計算機資源であればよい。
 図4Aの、属性管理テーブル50-Aは、仮想計算機12(構成要素)の識別子を格納する起点501と、仮想計算機12で実行されているOSの種類を格納するOS502と、仮想計算機12に割り当てられたプロセッサ13のコア数を格納するCPU数503と、仮想計算機12に割り当てられたメモリ14の容量を格納するMemory504と、仮想計算機12に割り当てられたボリューム20の容量を格納するDisk505とをひとつのエントリに含む。
 本実施例では、起点501に物理計算機1の構成要素として仮想計算機12を設定し、OS502~Disk505は、仮想計算機12の特性を示す特性情報として扱う。
 図4Bの、属性管理テーブル50-Bは、ボリューム20の識別子を格納する起点501と、ボリューム20を提供するストレージの識別子を格納するストレージ506と、当該ボリューム20が使用しているMPB24の識別子を格納するMPB507と、当該ボリューム20が使用しているCLPR25の識別子を格納するCLPR508と、当該ボリューム20の記憶領域を提供するプール21の識別子を格納するPool509と、当該ボリューム20に割り当てられた容量を格納する容量510と、をひとつのエントリに含む。
 属性管理テーブル50-Aは、物理計算機1に生成された仮想計算機12に関する情報が格納され、属性管理テーブル50-Bには、ストレージ2に生成されたボリュームVOL20の情報が格納される。
 本実施例では、起点501にストレージ2の構成要素としてボリュームVOL20を設定し、ストレージ506~容量510は、ボリュームVOL20の特性を示す特性情報として扱う。
 図5Aは、関連コンポーネント管理テーブル51-Aの一例を示す図である。また、図5Bは、関連コンポーネント管理テーブル51-Bの一例を示す図である。
 関連コンポーネント管理テーブル51は、管理サーバ3が、仮想計算機12にボリュームVOL20を割り当てたときに登録または更新されるテーブルである。本実施例では、仮想計算機12が使用しているボリュームVOL20のストレージを特定するテーブルを関連コンポーネント管理テーブル51-Aとし、ボリュームVOL20を使用しているハイパーバイザ11上の仮想計算機12を特定するテーブルを関連コンポーネント管理テーブル51-Bとする。
 図5Aの、関連コンポーネント管理テーブル51-Aは、仮想計算機12の識別子を格納する起点511と、仮想計算機12に割り当てられたボリュームVOL20の識別子を格納するVolume512と、当該ボリュームVOL20を提供するストレージの識別子を格納するStorage513とをひとつのエントリに含む。
 図5Bの、関連コンポーネント管理テーブル51-Bは、ボリューム20の識別子を格納する起点511と、当該ボリュームVOL20が割り当てられてハイパーバイザ11の識別子を格納するHYP514と、当該ボリューム20を使用している仮想計算機12の識別子を格納するVM515とをひとつのエントリに含む。
 図6は、類似機器構成テーブル52の一例を示す図である。類似機器構成テーブル52は、仮想計算機12が生成されてボリュームVOL20が割り当てられたときに管理サーバ3が生成するテーブルである。
 類似機器構成テーブル52は、仮想計算機12の識別子を格納する起点521と、仮想計算機12で稼働するOSの種類を格納するOS522と、仮想計算機12に割り当てられたプロセッサ13のコア数を格納するCPU数523と、仮想計算機12に割り当てられたメモリ14の容量を格納するMemory524と、仮想計算機12に割り当てられたボリュームVOL20の容量を格納するDisk525と、仮想計算機12に割り当てられたボリュームVOL20の識別子を格納するVolume526と、当該ボリュームVOL20を提供するストレージの識別子を格納するStorage527とをひとつのエントリに含む。
 類似機器構成テーブル52は、関連コンポーネント管理テーブル51の仮想計算機12とボリュームVOL20の関係から、属性管理テーブル50-Aと50-Bの要素を連結したテーブルとなる。
 なお、図6では、起点521に構成要素として仮想計算機12の識別子を設定する例を示したが、後述するように、構成要素としてボリュームVOL20の識別子を設定することもできる。
 また、図6では、起点521の仮想計算機12に関連する構成要素であるボリュームVOL20の識別子をVolume526に格納する。すなわち、相互に関連する構成要素の一方を起点521に設定し、他方の構成要素を他の特性情報と同様に扱うことができる。起点の構成要素と、特性情報に含まれる構成要素の関係は他のテーブルでも同様である。
 図7は、類似度テーブル53の一例を示す図である。類似度テーブル53は、仮想計算機12が算出した仮想計算機12の構成の類似度を格納するテーブルである。図示の例では、仮想計算機12(VM1)の構成に対する他の仮想計算機12(VM2~VM4)の類似度を示す。本実施例の類似度は値が小さいほど類似性が高く、値が大きいほど類似性が低くなる。
 類似度テーブル53の仮想計算機12の識別子を格納する起点531と、仮想計算機12で実行されているOSの種類の類似度を格納するOS532と、仮想計算機12に割り当てられたプロセッサ13のコア数の類似度を格納するCPU数533と、仮想計算機12に割り当てられたメモリ14の容量の類似度を格納するMemory534と、仮想計算機12に割り当てられたボリューム20の容量の類似度を格納するDisk535と、仮想計算機12に割り当てられたボリューム20の識別子の類似度を格納するVolume536と、当該ボリュームVOL20を提供するストレージの識別子の類似度を格納するStorage537とをひとつのエントリに含む。上記各類似度の算出方法については後述する。
 図8は、閾値テーブル55の一例を示す図である。閾値テーブル55は、管理サーバ3が、各構成要素の性能値ごとに動的閾値算出方法テーブル56とパラメータテーブル54で設定された動的閾値算出方法とパラメータで算出した値を保持する。
 閾値テーブル55は、仮想計算機12の識別子を格納する起点551と、各性能値毎に閾値を格納する性能値1(552)~性能値5(556)をひとつのエントリに含む。
 管理サーバ3の動的閾値算出プログラム41は、所定のタイミングで動的閾値算出方法によって閾値テーブル55を更新する。そして、性能監視プログラム43は、監視対象の構成要素から取得した性能値を、閾値テーブル55の閾値と比較してリソース不足や障害の検出などの所定の処理を実施する。
 なお、閾値テーブル55の性能値1(552)~性能値5(556)には、後述するように、動的閾値算出方法テーブル56に設定された性能値1~5の動的閾値算出方法による演算結果が格納される。
 また、管理サーバ3は、所定の周期など所定のタイミングで、動的閾値算出方法とパラメータにより閾値を算出して閾値テーブル55を動的に更新する。
 図9は、動的閾値算出方法テーブル56の一例を示す図である。動的閾値算出方法テーブル56は、管理サーバ3の動的閾値算出方法生成プログラム42が性能値1~5ごとに選択した算出方法が設定される。
 動的閾値算出方法テーブル56と、閾値テーブル55は、仮想計算機12の識別子を格納する起点551と、各性能値毎に動的閾値算出方法を格納する性能値1(552)~性能値5(556)をひとつのエントリに含む。
 動的閾値算出方法としては、LOF(Local Outlier Factor)による外れ値除去や、最大値、平均フィルタ(移動平均)値、メジアンフィルタ値など、予め設定した算出方法を図中方法A~Hとして設定しておく。
 図10は、構成要素と性能値の関連テーブル57の一例を示す図である。構成要素と性能値の関連テーブル57は、管理サーバ3に予め設定された情報である。構成要素と性能値の関連テーブル57は、性能値の名称を格納する性能値571と、性能値に関連する構成要素の特性情報を格納する関連する構成要素572とをひとつのエントリに含む。関連する構成要素572には、構成要素に含まれる1以上の特性情報が格納される。
 図示の例では、性能値571が「CPU Use Rate」に対応する構成要素572は「OS」と「CPU」が定義され、OSの種類とCPU数がプロセッサ31の使用率に関連すると定義されている。
 同様に、性能値571が「CPU Ready Rate」に対応する構成要素572は「OS」と「CPU」が定義され、OSの種類とCPU数がプロセッサ31の使用率に関連すると定義されている。なお、「CPU Ready Rate」は、仮想計算機12に割り当てられたプロセッサ31が他の仮想計算機12と競合して、待ち状態となった時間の比率を示す。
 また、「Disk Read Rate」や「Disk Write Rate」に対応する構成要素572は、「Disk」と「Volume」及び「Storage」が関連すると定義されている。また、性能値571の各行は、閾値テーブル55及び動的閾値算出方法テーブル56の性能値1~5に対応する。
 以上のように、ひとつの性能値に対して1以上の特性情報を関連づけておくことで、後述するように、類似度を比較すべき特性情報を性能値毎に詳細に設定することが可能となるのである。
 図11は、パラメータテーブル54の一例を示す図である。パラメータテーブル54には、管理サーバ3の動的閾値算出方法生成プログラム42で選択された値が格納される。
 パラメータテーブル54は、仮想計算機12の識別子を格納する起点541と、各性能値毎にパラメータを格納する性能値1(542)~性能値5(546)をひとつのエントリに含む。
 性能値1(542)~性能値5(546)には、図9の動的閾値算出方法テーブル56の方法A~Hで使用するパラメータが格納される。パラメータとしては、初期値やフィルタのカットオフ値や再計算の周期など、方法A~Hに応じて1以上のパラメータを格納することができる。
 なお、性能値DB58は、性能監視プログラム43が所定の周期で取得した監視対象の構成要素の性能値が格納され、例えば、閾値テーブル55や動的閾値算出方法テーブル56と同様のフォーマットで、仮想計算機12をインデックスとして性能値1~5を時系列的に格納することができる。
 <処理の概要>
 図12は、類似機器構成テーブルを生成する過程を示す図である。図示の例では、仮想計算機12-1(VM1)とボリュームVOL1(20-1)が追加されたときに、管理サーバ3が類似機器構成テーブル52を生成する過程を示す。
 管理サーバ3は、仮想計算機12-1(VM1)が生成され、ボリュームVOL1(20-1)を仮想計算機12-1(VM1)に割り当てると、属性管理テーブル50と関連コンポーネント管理テーブル51に登録する。
 次に、管理サーバ3は、追加された仮想計算機12に割り当てられたボリュームVOL20のストレージ2との関係を関連コンポーネント管理テーブル51-Aから取得する。管理サーバ3は、属性管理テーブル50-Aと50-Bの構成要素の特性情報を取得して、関連コンポーネント管理テーブル51-Aに設定された仮想計算機12とボリュームVOL20のストレージ2との関係で類似機器構成テーブル52を生成する。この後、管理サーバ3は、図14で示すように類似度を算出する。
 図13は、類似機器構成テーブルを生成する過程を示す図である。図示の例では、仮想計算機VM1(12-1)に割り当てるボリュームVOL1(20-1)が追加されたときに、ボリュームVOL1(20-1)を起点として管理サーバ3が類似機器構成テーブル52を生成する過程を示す。
 管理サーバ3は、追加されたボリュームVOL20と、当該ボリュームVOL20を割り当てる仮想計算機12のハイパーバイザ11の関係を関連コンポーネント管理テーブル51-Bから取得する。管理サーバ3は、属性管理テーブル50-Aと50-Bの構成要素の情報を取得して、関連コンポーネント管理テーブル51-Bに設定されたボリュームVOL20と仮想計算機12のハイパーバイザ11の関係で類似機器構成テーブル52-Bを生成する。この後、上記と同様に、管理サーバ3は、図14で示すように類似度を算出する。
 類似機器構成テーブル52-Bは、図12の類似機器構成テーブル52と異なり、起点にボリュームVOL20の識別子が格納され、Storage、MPB、CLPR、Pool、容量、HYP、VMのカラムで構成される。起点となる構成要素の種類に応じて類似機器構成テーブル52-Bのフォーマットを変更することができる。なお、類似機器構成テーブル52-Bのフォーマットは、構成要素の種類に応じて予め設定したものである。
 図14は、類似機器構成テーブル52から類似度テーブル53を生成して類似する構成要素を選択する過程を示す図である。
 管理サーバ3は、上記図12(または図13)のように生成された類似機器構成テーブル52から、追加された仮想計算機VM1(12-1)に対する構成要素間の特性情報の類似度を仮想計算機VM2~VM4の特性情報毎に算出して、類似度テーブル53を生成する。
 次に、管理サーバ3は、構成要素間の類似度を比較する特性情報を、構成要素と性能値の関連テーブル57の関連する構成要素572から取得する。図示の例では、3つの性能値で構成要素間の特性情報の類似度を比較する例を示す。
 例えば、性能値が「CPU USE RATE」の場合、類似度テーブル53のOS522とCPU数523の類似度の和が最も小さいVM4を、類似性の高い構成要素として選択する。また、管理サーバ3は、複数の性能値によって類似する構成要素の選択を行う。例えば、性能値が「Memory Use Rate」と「DISK READ/WRITE RATE」の場合は、Memory534の値が最小のVM4と、Disk535、Volume536、Storage537の和が最小のVM3を類似性の高い構成要素として選択する。なお、類似性の高い構成要素とは、類似度が所定の条件を満たす構成要素であり、本実施例では、類似度が最小の構成要素となる。
 管理サーバ3は、上記選択した構成要素のうち、最も類似性の高い(類似度が最小)VM4を選択し、当該VM4に設定されている動的閾値算出方法(方法B、E、F、G、B)とパラメータを、仮想計算機VM1(12-1)の動的閾値算出方法生成として設定する。
 なお、複数の性能値で類似度を比較して選択された構成要素が複数存在する場合には、複数の動的閾値算出方法及びパラメータのうち、各構成要素の性能値毎に最も多く使われている動的閾値算出方法及びパラメータのいずれかひとつを選択しても良い。これにより、類似性の高い構成要素から最適な動的閾値算出方法とパラメータを設定することが可能となる。
 また、類似度に基づいて選択した構成要素が複数存在する場合には、これらの構成要素に設定されたパラメータの平均値や、最も使用されている値など、予め設定した基準を満たすパラメータを採用するようにしても良い。
 また、類似度に基づいて構成要素を選択するための性能値は1以上あればよく、構成要素と性能値の関連テーブル57(性能値関連情報)に設定された性能値のうち使用する性能値を指定するようにしても良い。
 また、類似性の高い構成要素を選択する所定の条件は、類似度が最小の構成要素に限定されるものではなく、当該構成要素が接続された他の構成要素の類似性などを含めるようにしても良い。
 <処理の詳細>
 次に、管理サーバ3で行われる処理の詳細について、以下に説明する。図15は、管理サーバで行われる処理の一例を示すフローチャートである。この処理は、監視対象の構成要素の追加を行ったときに動的閾値算出方法生成プログラム42で実行される処理である。なお、監視対象の構成要素の変更を行ったときに当該処理を実行しても良い。
 管理サーバ3の動的閾値算出方法生成プログラム42は、監視対象の構成要素が追加されると(S1)、追加された構成要素の属性や関連を入出力装置35を介して受け付けて、属性管理テーブル50及び関連コンポーネント管理テーブル51へ当該構成要素を登録する(S2)。
 管理サーバ3の動的閾値算出方法生成プログラム42は、図12または図13で示したように、追加された構成要素の特性情報に対する他の構成要素の特性情報の類似度を算出する(S3)。
 管理サーバ3は、関連コンポーネント管理テーブル51を読み込んで、各構成要素と特性情報の組み合わせを決定し、関連コンポーネント管理テーブル51と属性管理テーブル50を連結して類似機器構成テーブル52を生成する。
 そして、管理サーバ3は、追加された構成要素に対する他の構成要素の類似度を、類似機器構成テーブル52の特性情報毎に算出して類似度テーブル53を生成する。
 次に、管理サーバ3は、図14で示したように、類似度テーブル53の特性情報の類似度から類似性の高い構成要素を選択する。そして、管理サーバ3は、選択した構成要素の動的閾値算出方法テーブル56とパラメータテーブル54から、構成要素の性能値毎に動的閾値算出方法とパラメータを選択し、追加された構成要素の動的閾値算出方法及びパラメータとして動的閾値算出方法テーブル56とパラメータテーブル54に設定する(S4)。その後、管理サーバ3は、追加された構成要素の閾値を、動的閾値算出方法テーブル56とパラメータテーブル54に基づいて算出し、閾値テーブル55に格納する。
 管理サーバ3は、ステップS5で性能監視プログラム43を実行して、性能値を取得して性能値DB58に格納する。性能監視プログラム43では、取得した性能値と閾値テーブル55の値を比較して、リソースの不足や異常の検出などの所定の処理を実行する。
 管理サーバ3は、ステップS6で動的閾値算出方法を見直す契機であるか否かを判定する。動的閾値算出方法を見直す所定の契機(リソースの不足や障害の発生)であればステップS2へ戻って、上記処理を繰り返す。一方、動的閾値算出方法を見直す契機でない場合にはステップS5へ戻って、性能値の監視を継続する。
 以上のように、構成要素を追加した場合には、既に稼働している構成要素のうち類似性の高い構成要素に設定されている動的閾値算出方法やパラメータを、追加された構成要素に適用することで適切な閾値導出までの期間を短縮し、かつ、動的閾値算出方法の設定およびパラメータの設定を、ユーザの経験によらず適切に設定することが可能となる。
 なお、管理サーバ3の稼働開始時には、管理者などが動的閾値算出方法テーブル56の性能値1~5毎に動的閾値算出方法を決定して、閾値テーブル55を生成させれば良い。
 なお、ステップS6の動的閾値算出方法を見直す判定は、性能監視プログラム43の処理の他、管理者等からの指令を受け付けた場合には、ステップS2に戻ることで構成要素の変更を各テーブルに反映させることができ、あるいは、処理を終了しても良い。
 なお、上記図15では、構成要素を追加した例を示したが、構成要素を変更したときにも上記と同様の処理を行うことができ、監視対象の構成要素の特性情報を受け付けて(S1)、変更された構成要素の属性や関連を入出力装置35等を介して受け付けて、属性管理テーブル50及び関連コンポーネント管理テーブル51へ当該構成要素を登録すればよい(S2)。
 図16は、図15のステップ3で行われる、類似度の計算処理の一例を示すフローチャートである。ステップS11では、管理サーバ3が関連コンポーネント管理テーブル51の構成要素間の関連性を取得して、関連する構成要素の特性情報を属性管理テーブル50から取得する。
 ステップS12では、管理サーバ3が属性管理テーブル50から取得した特性情報を、関連コンポーネント管理テーブル51で関連のある構成要素と結合して類似機器構成テーブル52を生成する。
 ステップS13では、管理サーバ3が類似機器構成テーブル52の各特性について類似度を算出する。類似度の算出方法は、周知または公知の手法を用いることができ、例えば、追加された構成要素の特性情報の値をD1とし、既存の構成要素の特性情報の値をD2とすると、
 類似度 = |D1-D2|/D1
とし演算することができる。なお、構成要素の項目の値がテキストの場合には、D1=D2であれば類似度=0とし、D1<>D2であれば類似度=1とすればよい。
 ステップS13では、管理サーバ3が類似機器構成テーブル52から算出した各特性情報の類似度を類似度テーブル53のカラムに格納し、類似度テーブル53を生成する。
 上記処理によって、管理サーバ3は、関連コンポーネント管理テーブル51の構成要素間の関連性から属性管理テーブル50の情報を結合して類似機器構成テーブル52を生成する。そして、追加された構成要素の特性情報の値と、既存の構成要素のカラムの特性情報から類似度を算出して類似度テーブル53を生成することができる。
 図17は、図15のステップ4で行われる、動的閾値算出方法とパラメータの選択処理の一例を示すフローチャートである。
 管理サーバ3は、ステップS21で、追加された構成要素について、動的閾値算出方法テーブル56で未設定の性能値1~5の一つを選択する。この処理は、管理サーバ3がカラムの順序等に従って選択すればよい。
 次に、ステップS22では、管理サーバ3が構成要素と性能値の関連テーブル57を参照し、選択された性能値に関連する構成要素の特性情報を取得する。例えば、「CPU USE RATE」の性能値571が選択された場合、管理サーバ3は、構成要素と性能値の関連テーブル57から構成要素に含まれる特性情報として、「OS」と「CPU数」を選択する。次に、ステップS23では、管理サーバ3が類似度テーブル53を参照して、選択した特性情報の類似度を取得する。
 ステップS24では、管理サーバ3が、選択した構成要素についてリソース情報を取得する。本実施例では、リソース情報として類似度テーブル53を入力とし、管理サーバ3は類似度テーブル53から、選択した構成要素の特性情報の類似度をn個取得する。
 ステップS25において、管理サーバ3は、類似性の高い(=類似度が最小)の構成要素の特性情報に対応する動的閾値算出方法テーブル56の性能値に設定されている動的閾値算出方法を取得して、当該追加された構成要素に適用する動的閾値算出方法とする。
 ひとつの性能値に複数の特性情報が関連づけられている場合(例えば、OSとCPU数)には、各特性情報の類似度(OS532とCPU数533)を集計して、類似度テーブル53で当該和(集計値)が最小のエントリ(起点531=VM4)を選択する。そして、管理サーバ3は、当該起点531と一致する起点561を動的閾値算出方法テーブル56から選択し、当該エントリ(VM4)の特性情報に設定されている動的閾値算出方法(方法B)を取得する。そして、管理サーバ3は、当該動的閾値算出方法をステップS21で選択した未設定の性能値の動的閾値算出方法として動的閾値算出方法テーブル56に設定する。
 次にステップS26では、管理サーバ3が、ステップS25で決定した動的閾値算出方法を使用しているリソース情報を取得する。すなわち、管理サーバ3は、ステップS21で選択した性能値に対応する動的閾値算出方法テーブル56の性能値のカラムで、ステップS25で決定した動的閾値算出方法を含むエントリをm個選択する。
 ステップS27では、管理サーバ3はステップS26で選択したm個のエントリの起点531を取得し、パラメータテーブル54の起点541のうちm個のエントリの起点531と一致するエントリを選択する。
 そして、管理サーバ3は、パラメータテーブル54で選択した当該エントリの性能値(552~556)に設定されているパラメータを取得する。そして、管理サーバ3は、当該パラメータをステップS21で選択した未設定の性能値に対応するパラメータテーブル54に設定する。
 ステップS28では、管理サーバ3が、動的閾値算出方法テーブル56とパラメータテーブル54を更新する。そして、ステップS29は、追加された構成要素のうち、次に設定する性能値の有無を判定する。すなわち、未設定の性能値があればステップS21へ戻って上記処理を繰り返し、追加された構成要素の全ての性能値について動的閾値算出方法とパラメータの設定が完了していれば処理を終了する。処理の終了後には、所定のタイミング(例えば、所定の周期)で管理サーバ3が、動的閾値算出プログラム41を起動して更新された動的閾値算出方法テーブル56とパラメータテーブル54を読み込んで、閾値を算出して閾値テーブル55を動的に更新する。
 なお、図14で述べたように、複数の性能値の類似度から選択した構成要素(エントリ)が複数存在する場合には、各構成要素(エントリ)の性能値毎に最も多く使われている動的閾値算出方法とパラメータを採用しても良い。また、類似度に基づいて選択した構成要素(エントリ)が複数存在する場合には、これらの構成要素(エントリ)の性能値に設定されたパラメータの平均値や、最も使用されている値など、予め設定した基準を満たすパラメータを採用するようにしても良い。
 以上のように、本実施例によれば、管理サーバ3は、追加または更新する構成要素を受け付けると、属性管理テーブル50と関連コンポーネント管理テーブル51を更新し、関連コンポーネント管理テーブル51と属性管理テーブル50に基づいて、構成要素と特性情報の組み合わせを決定して類似機器構成テーブル52を生成し、類似機器構成テーブル52に基づいて構成要素間で特性情報の類似度を算出する。そして、管理サーバ3は、特性情報の類似度が所定の条件を満たす構成要素を選択して、構成要素に設定された動的閾値算出方法を動的閾値算出方法テーブル56から取得して、受け付けた構成要素の動的閾値算出方法として動的閾値算出方法テーブル56に登録する。
 これにより、動的閾値算出方法テーブル56で閾値テーブル55を更新することにより動的閾値の適切な閾値導出までの期間を短縮し、かつ、動的閾値算出方法の設定およびパラメータの設定を、ユーザや管理者の経験に頼ることなく最適に設定することが可能となる。
 <まとめ>
 なお、本発明は上記した実施例に限定されるものではなく、様々な変形例が含まれる。例えば、上記した実施例は本発明を分かりやすく説明するために詳細に記載したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、ある実施例の構成の一部を他の実施例の構成に置き換えることが可能であり、また、ある実施例の構成に他の実施例の構成を加えることも可能である。また、各実施例の構成の一部について、他の構成の追加、削除、又は置換のいずれもが、単独で、又は組み合わせても適用可能である。
 また、上記の各構成、機能、処理部、及び処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、上記の各構成、及び機能等は、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行することによりソフトウェアで実現してもよい。各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリや、ハードディスク、SSD(Solid State Drive)等の記録装置、または、ICカード、SDカード、DVD等の記録媒体に置くことができる。
 また、制御線や情報線は説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。実際には殆ど全ての構成が相互に接続されていると考えてもよい。
 以上のように、本実施例では、類似性が高い構成要素が使用している動的閾値算出方法及びプログラムを、設定対象の構成要素の動的閾値算出方法テーブル56とパラメータテーブル54に設定するので、適切な閾値導出までの期間を短縮し、かつ、動的閾値算出方法の設定およびパラメータの設定を、計算機システムの管理者などのユーザの経験によらず適切に設定することが可能となる。
 <補足>
 なお、本発明は、次のような構成であっても良い。
 プロセッサとメモリを有する計算機を制御するプログラムを格納した記憶媒体であって、
 前記構成要素の特性情報を属性情報に格納する第1のステップと、
 前記構成要素間の接続関係をコンポーネント関連情報に格納する第2のステップと、
 前記構成要素の性能情報毎に閾値を閾値情報へ格納する第3のステップと、
 前記閾値を動的に更新する動的閾値算出方法を前記構成要素の性能情報毎に動的閾値算出情報に設定する第4のステップと、
 前記性能情報に関連する構成要素の特性情報を性能関連情報に設定する第5のステップと、
 追加または更新する構成要素を受け付けて、前記属性情報とコンポーネント関連情報を更新する第6のステップと、
 前記コンポーネント関連情報と前記属性情報に基づいて、構成要素と特性情報の組み合わせを決定し、前記構成要素間で特性情報の類似度を算出する第7のステップと、
 前記特性情報の類似度が所定の条件を満たす構成要素を選択する第8のステップと、
 前記選択された構成要素に設定された動的閾値算出方法を取得して、前記受け付けた構成要素の前記動的閾値算出方法として動的閾値算出情報に登録する第9のステップと、
を前記計算機に実行させるプログラムを格納した非一時的な計算機読み取り可能な記憶媒体。

Claims (15)

  1.  プロセッサとメモリを有して計算機システムの構成要素の性能を監視する管理計算機であって、
     前記構成要素の特性情報を格納する属性情報と、
     前記構成要素間の接続関係を格納するコンポーネント関連情報と、
     前記構成要素の性能情報毎に閾値を格納する閾値情報と、
     前記閾値を動的に更新する動的閾値算出方法を前記構成要素の性能情報毎に予め設定した動的閾値算出情報と、
     前記性能情報に関連する構成要素の特性情報を予め設定した性能関連情報と、を有し、
     前記プロセッサは、追加または更新する構成要素を受け付けると、前記属性情報とコンポーネント関連情報を更新し、
     前記プロセッサは、前記コンポーネント関連情報と前記属性情報に基づいて、構成要素と特性情報の組み合わせを決定し、前記構成要素間で特性情報の類似度を算出し、
     前記プロセッサは、前記特性情報の類似度が所定の条件を満たす構成要素を選択して、当該構成要素に設定された動的閾値算出方法を取得して、前記受け付けた構成要素の前記動的閾値算出方法として動的閾値算出情報に登録することを特徴とする管理計算機。
  2.  請求項1に記載の管理計算機であって、
     前記プロセッサは、予め設定された性能値と特性情報の関係を設定した性能値関連情報に基づいて前記構成要素間の特性情報の類似度を集計した後に、当該集計した類似度が所定の条件を満たす構成要素を選択することを特徴とする管理計算機。
  3.  請求項2に記載の管理計算機であって、
     前記プロセッサは、複数の前記性能値で前記類似度が所定の条件を満たす構成要素を複数選択し、これらの構成要素に設定された動的閾値算出方法のいずれかひとつを選択することを特徴とする管理計算機。
  4.  請求項1に記載の管理計算機であって、
     前記閾値を動的に更新する動的閾値算出方法のパラメータを前記構成要素の性能情報毎に予め設定したパラメータ情報をさらに有し、
     前記プロセッサは、前記類似度が所定の条件を満たす構成要素に設定された前記パラメータを取得して、前記受け付けた構成要素のパラメータとして前記パラメータ情報に登録することを特徴とする管理計算機。
  5.  請求項1に記載の管理計算機であって、
     前記プロセッサは、追加する構成要素として仮想計算機を受け付けて、当該仮想計算機に割り当てられたボリュームを特性情報として、前記属性情報とコンポーネント関連情報に追加することを特徴とする管理計算機。
  6.  請求項1に記載の管理計算機であって、
     前記プロセッサは、追加する構成要素としてボリュームを受け付けて、当該ボリュームを割り当てる仮想計算機を特性情報として、前記属性情報とコンポーネント関連情報に追加することを特徴とする管理計算機。
  7.  プロセッサとメモリを有する管理計算機が、計算機システムの構成要素の性能を監視する性能監視方法であって、
     前記管理計算機が、前記構成要素の特性情報を属性情報に格納する第1のステップと、
     前記管理計算機が、前記構成要素間の接続関係をコンポーネント関連情報に格納する第2のステップと、
     前記管理計算機が、前記構成要素の性能情報毎に閾値を閾値情報へ格納する第3のステップと、
     前記管理計算機が、前記閾値を動的に更新する動的閾値算出方法を前記構成要素の性能情報毎に動的閾値算出情報に設定する第4のステップと、
     前記管理計算機が、前記性能情報に関連する構成要素の特性情報を性能関連情報に設定する第5のステップと、
     前記管理計算機が、追加または更新する構成要素を受け付けて、前記属性情報とコンポーネント関連情報を更新する第6のステップと、
     前記管理計算機が、前記コンポーネント関連情報と前記属性情報に基づいて、構成要素と特性情報の組み合わせを決定し、前記構成要素間で特性情報の類似度を算出する第7のステップと、
     前記管理計算機が、前記特性情報の類似度が所定の条件を満たす構成要素を選択する第8のステップと、
     前記管理計算機が、前記選択された構成要素に設定された動的閾値算出方法を取得して、前記受け付けた構成要素の前記動的閾値算出方法として動的閾値算出情報に登録する第9のステップと、
    を含むことを特徴とする性能監視方法。
  8.  請求項7に記載の性能監視方法であって、
     前記第8のステップは、
     予め設定された性能値と特性情報の関係を設定した性能値関連情報に基づいて前記構成要素間の特性情報の類似度を集計した後に、当該集計した類似度が所定の条件を満たす構成要素を選択することを特徴とする性能監視方法。
  9.  請求項8に記載の性能監視方法であって、
     前記第9のステップは、
     複数の前記性能値で前記類似度が所定の条件を満たす構成要素を複数選択し、これらの構成要素に設定された動的閾値算出方法のいずれかひとつを選択することを特徴とする性能監視方法。
  10.  請求項7に記載の性能監視方法であって、
     前記管理計算機が、前記閾値を動的に更新する動的閾値算出方法のパラメータを前記構成要素の性能情報毎にパラメータ情報を設定するステップをさらに含み、
     前記第9のステップは、
     前記類似度が所定の条件を満たす構成要素に設定された前記パラメータを取得して、前記受け付けた構成要素のパラメータとして前記パラメータ情報に登録することを特徴とする性能監視方法。
  11.  請求項7に記載の性能監視方法であって、
     前記第6のステップは、
     追加する構成要素として仮想計算機を受け付けて、当該仮想計算機に割り当てられたボリュームを特性情報として、前記属性情報とコンポーネント関連情報に追加することを特徴とする性能監視方法。
  12.  請求項7に記載の性能監視方法であって、
     前記第6のステップは、
     追加する構成要素としてボリュームを受け付けて、当該ボリュームを割り当てる仮想計算機を特性情報として、前記属性情報とコンポーネント関連情報に追加することを特徴とする性能監視方法。
  13.  プロセッサとメモリを有する管理計算機と、前記管理計算機が性能を監視する計算機と、を有する計算機システムであって、
     前記管理計算機は、
     前記計算機に含まれる構成要素の特性情報を格納する属性情報と、
     前記構成要素間の接続関係を格納するコンポーネント関連情報と、
     前記構成要素の性能情報毎に閾値を格納する閾値情報と、
     前記閾値を動的に更新する動的閾値算出方法を前記構成要素の性能情報毎に予め設定した動的閾値算出情報と、
     前記性能情報に関連する構成要素の特性情報を予め設定した性能関連情報と、
     前記構成要素から取得した性能情報を格納する性能情報格納部と、を有し、
     前記プロセッサは、追加または更新する構成要素を受け付けると、前記属性情報とコンポーネント関連情報を更新し、
     前記プロセッサは、前記コンポーネント関連情報と前記属性情報に基づいて、構成要素と特性情報の組み合わせを決定し、前記構成要素間で特性情報の類似度を算出し、
     前記プロセッサは、前記特性情報の類似度が所定の条件を満たす構成要素を選択して、当該構成要素に設定された動的閾値算出方法を取得して、前記受け付けた構成要素の前記動的閾値算出方法として動的閾値算出情報に登録し、
     前記プロセッサは、所定のタイミングで動的閾値算出情報に基づいて前記閾値を算出し、前記閾値情報を更新することを特徴とする計算機システム。
  14.  請求項13に記載の計算機システムであって、
     前記プロセッサは、予め設定された性能値と特性情報の関係を設定した性能値関連情報に基づいて前記構成要素間の特性情報の類似度を集計した後に、当該集計した類似度が所定の条件を満たす構成要素を選択することを特徴とする計算機システム。
  15.  請求項14に記載の計算機システムであって、
     前記プロセッサは、複数の前記性能値で前記類似度が所定の条件を満たす構成要素を複数選択し、これらの構成要素に設定された動的閾値算出方法のいずれかひとつを選択することを特徴とする計算機システム。
PCT/JP2016/073427 2016-08-09 2016-08-09 管理計算機、性能監視方法及び計算機システム WO2018029781A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
US15/759,836 US20180267879A1 (en) 2016-08-09 2016-08-09 Management computer, performance monitoring method, and computer system
JP2018510140A JP6533623B2 (ja) 2016-08-09 2016-08-09 管理計算機、性能監視方法及び計算機システム
PCT/JP2016/073427 WO2018029781A1 (ja) 2016-08-09 2016-08-09 管理計算機、性能監視方法及び計算機システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2016/073427 WO2018029781A1 (ja) 2016-08-09 2016-08-09 管理計算機、性能監視方法及び計算機システム

Publications (1)

Publication Number Publication Date
WO2018029781A1 true WO2018029781A1 (ja) 2018-02-15

Family

ID=61162842

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2016/073427 WO2018029781A1 (ja) 2016-08-09 2016-08-09 管理計算機、性能監視方法及び計算機システム

Country Status (3)

Country Link
US (1) US20180267879A1 (ja)
JP (1) JP6533623B2 (ja)
WO (1) WO2018029781A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021149132A (ja) * 2020-03-16 2021-09-27 日本電気株式会社 監視装置,監視方法及び監視プログラム

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11341017B1 (en) 2019-04-24 2022-05-24 Snap Inc. Staged release of updates with anomaly monitoring
US11288104B2 (en) * 2019-08-06 2022-03-29 International Business Machines Corporation Automatic dynamic operating system provisioning
USD964315S1 (en) * 2020-07-03 2022-09-20 Epos Group A/S Headset
US11586524B1 (en) 2021-04-16 2023-02-21 Vignet Incorporated Assisting researchers to identify opportunities for new sub-studies in digital health research and decentralized clinical trials
US11789837B1 (en) 2021-02-03 2023-10-17 Vignet Incorporated Adaptive data collection in clinical trials to increase the likelihood of on-time completion of a trial
US11281553B1 (en) 2021-04-16 2022-03-22 Vignet Incorporated Digital systems for enrolling participants in health research and decentralized clinical trials

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009176203A (ja) * 2008-01-28 2009-08-06 Nec Corp 監視装置、監視システム、監視方法およびプログラム
WO2011125138A1 (ja) * 2010-04-06 2011-10-13 株式会社日立製作所 性能監視装置,方法,プログラム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009176203A (ja) * 2008-01-28 2009-08-06 Nec Corp 監視装置、監視システム、監視方法およびプログラム
WO2011125138A1 (ja) * 2010-04-06 2011-10-13 株式会社日立製作所 性能監視装置,方法,プログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021149132A (ja) * 2020-03-16 2021-09-27 日本電気株式会社 監視装置,監視方法及び監視プログラム

Also Published As

Publication number Publication date
US20180267879A1 (en) 2018-09-20
JPWO2018029781A1 (ja) 2018-08-09
JP6533623B2 (ja) 2019-06-19

Similar Documents

Publication Publication Date Title
WO2018029781A1 (ja) 管理計算機、性能監視方法及び計算機システム
JP5756240B2 (ja) 管理システム及び管理方法
US10108460B2 (en) Method and system for integrated deployment planning for virtual appliances
US9600331B1 (en) Virtual machine placement in a cloud computing environment based on factors including optimized processor-memory affinity
US9760294B2 (en) Computer system, storage management computer, and storage management method
US8756608B2 (en) Method and system for performance isolation in virtualized environments
US20160156568A1 (en) Computer system and computer resource allocation management method
JP6383861B2 (ja) ストレージ管理計算機
US10437642B2 (en) Management system for computer system
US11327809B2 (en) Virtual machine memory removal increment selection
JP2013045444A (ja) データセンタ内のリソースの使用効率を改善するための方法及び装置
JPWO2012066640A1 (ja) 計算機システム、マイグレーション方法及び管理サーバ
JP6266657B2 (ja) 仮想ストレージシステムのシン・プロビジョニング
JP2009205696A (ja) マルチコアプロセッサ計算機の制御方法
US20140282584A1 (en) Allocating Accelerators to Threads in a High Performance Computing System
JP5515889B2 (ja) 仮想マシンシステム、自動マイグレーション方法および自動マイグレーションプログラム
JP5492731B2 (ja) 仮想計算機のボリューム割当て方法およびその方法を用いた計算機システム
JP2022034455A (ja) 計算機システムおよび管理方法
JP2021064078A (ja) 複数のノードを含むストレージシステムの拡張構成案を作成する装置
JP2011070464A (ja) 計算機システム及び計算機システムの性能管理方法
US11042395B2 (en) Systems and methods to manage workload domains with heterogeneous hardware specifications
JP7104327B2 (ja) 情報処理装置、仮想マシン管理プログラムおよび仮想マシン管理方法
US20150363128A1 (en) Computer system and management system and management method of storage system
JP6035993B2 (ja) 情報処理装置、装置管理方法および装置管理プログラム
CN117136359A (zh) 用于查询执行的动态存储器分配的系统和方法

Legal Events

Date Code Title Description
ENP Entry into the national phase

Ref document number: 2018510140

Country of ref document: JP

Kind code of ref document: A

WWE Wipo information: entry into national phase

Ref document number: 15759836

Country of ref document: US

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 16912664

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 16912664

Country of ref document: EP

Kind code of ref document: A1