JP5500301B2 - Monitoring control system, monitoring control method, monitoring control server, and monitoring control program - Google Patents

Monitoring control system, monitoring control method, monitoring control server, and monitoring control program Download PDF

Info

Publication number
JP5500301B2
JP5500301B2 JP2013149251A JP2013149251A JP5500301B2 JP 5500301 B2 JP5500301 B2 JP 5500301B2 JP 2013149251 A JP2013149251 A JP 2013149251A JP 2013149251 A JP2013149251 A JP 2013149251A JP 5500301 B2 JP5500301 B2 JP 5500301B2
Authority
JP
Japan
Prior art keywords
server
performance
configuration change
monitoring control
servers
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013149251A
Other languages
Japanese (ja)
Other versions
JP2013242899A (en
Inventor
英男 長谷川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2013149251A priority Critical patent/JP5500301B2/en
Publication of JP2013242899A publication Critical patent/JP2013242899A/en
Application granted granted Critical
Publication of JP5500301B2 publication Critical patent/JP5500301B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)
  • Computer And Data Communications (AREA)

Description

本発明は、スケールアウト型サーバシステムを監視制御する監視制御システム、監視制御方法、監視制御サーバ及び監視制御プログラムに関する。   The present invention relates to a monitoring control system, a monitoring control method, a monitoring control server, and a monitoring control program for monitoring and controlling a scale-out type server system.

企業情報システム、データセンタ、プロバイダなどの比較的大規模なシステムにおいて、スケールアウト型サーバシステムが普及している。
スケールアウト型のサーバシステムとは、サーバの数を増やす(スケールアウト)ことで、サーバ群全体のパフォーマンスを向上させるというものである。
例えば、一台のサーバが10人のユーザしか処理できない場合に、サーバを二台に増やすことで負荷を分散し、20人のユーザへの対応が可能となるというものである。
Scale-out type server systems are widely used in relatively large systems such as enterprise information systems, data centers, and providers.
The scale-out type server system is to increase the performance of the entire server group by increasing the number of servers (scale-out).
For example, when one server can process only 10 users, the load is distributed by increasing the number of servers to two, and it becomes possible to deal with 20 users.

このようなスケールアウト型サーバシステムは、複数のサーバ(物理サーバ及び仮想サーバを含む。)を役割毎にグループ化し、グループ内のサーバに処理要求を均等に割り当てるので、各グループの処理量をサーバの台数で管理できるという利点がある。
そして、サーバをスケールアウトした場合にも、複数のサーバを連携して動作させることになるため、メンテナンスや障害発生時にもサービスを完全に停止させる必要がないというメリットがある。
In such a scale-out type server system, a plurality of servers (including physical servers and virtual servers) are grouped for each role, and processing requests are equally allocated to the servers in the group. There is an advantage that it can be managed by the number of units.
Even when a server is scaled out, a plurality of servers are operated in a coordinated manner, so there is an advantage that it is not necessary to completely stop the service even when maintenance or a failure occurs.

このようなスケールアウト型サーバシステムの普及は、システムの構成変更(スケールアウト)を容易化するサーバプロビジョニングツールの登場も影響しており、システム管理者は、このツールを用いることにより、負荷(ワークロード)に応じたシステムの柔軟な構成変更が可能となった。
また、システムが処理できる毎秒のトランザクション件数に対して、ボトルネック箇所を検出するキャパシティプランニング技術も提供されている。このキャパシティプランニング技術によれば、システム管理者は、システムのボトルネック箇所を特定し、所望の性能に対して必要となるサーバ台数を見積もり、システムの構成変更を行うことが可能となった。
The spread of such scale-out server systems is also affected by the advent of server provisioning tools that facilitate system configuration changes (scale-outs). The system can be flexibly changed according to the load.
In addition, a capacity planning technique for detecting a bottleneck for the number of transactions per second that can be processed by the system is also provided. According to this capacity planning technology, the system administrator can identify the bottleneck part of the system, estimate the number of servers required for desired performance, and change the system configuration.

特開2005−309748号公報JP 2005-309748 A

しかしながら、スケールアウト型サーバシステムでは、現行システムのボトルネックを特定し、そのボトルネックを解消すべく構成変更を行っても、性能が向上しない場合があった。
その理由は、構成変更に伴って許容負荷が増加すると、その影響で別の箇所に2次的にボトルネックが発生する可能性があるからである。
そして、このような2次的なボトルネックの発生は、予測が不可能であるため、実際に構成変更を行った後に、再度ボトルネックの有無を検出し、構成変更を検討する必要があった。
However, in the scale-out type server system, even if the bottleneck of the current system is identified and the configuration is changed to eliminate the bottleneck, the performance may not be improved.
The reason is that when the allowable load increases with the configuration change, a bottleneck may occur secondarily in another place due to the influence.
And since it is impossible to predict the occurrence of such a secondary bottleneck, after actually changing the configuration, it is necessary to detect the presence or absence of the bottleneck again and examine the configuration change. .

ここで、特許文献1には、ストレージシステムの構成を実際に変更する前に、ストレージシステムの各要素の状態に基づいてボトルネックの発生を検出し、このボトルネックを解消するための対策を提示するストレージシステム及びその障害解消方法が示されている。
しかしながら、この特許文献1記載のボトルネックの解消方法は、ホストコンピュータからストレージ装置までの通信経路上に存在する各要素を対象としてボトルネックの検出を行うことに特化されており、スケールアウト型サーバシステムにおいて2次的なボトルネックとなるサーバを予測することはできなかった。
Here, in Patent Document 1, before actually changing the configuration of the storage system, the occurrence of a bottleneck is detected based on the state of each element of the storage system, and a countermeasure for eliminating this bottleneck is presented. A storage system to be used and a failure solving method thereof are shown.
However, the bottleneck elimination method described in Patent Document 1 is specialized in detecting a bottleneck for each element existing on the communication path from the host computer to the storage apparatus. A server that becomes a secondary bottleneck in the server system could not be predicted.

本発明の目的は、上述した課題である2次的なボトルネックの発生を回避しつつ適切な構成変更を可能とするという課題を解決する監視制御システム、監視制御方法、監視制御サーバ及び監視制御プログラムを提供することにある。   An object of the present invention is to provide a monitoring control system, a monitoring control method, a monitoring control server, and monitoring control that solve the problem of enabling appropriate configuration change while avoiding the occurrence of the secondary bottleneck, which is the problem described above. To provide a program.

上記目的を達成するため本発明の監視制御システムは、システムを構成する複数のサーバに接続され、複数のサーバを監視する監視サーバを備え、監視サーバが、複数のサーバから収集した性能情報に基づいて、各サーバの性能をモデル化する性能モデル化手段と、システムの構成変更指示に応じて、構成変更前の性能モデルから構成変更後の性能モデルを生成する構成変更後性能モデル生成手段とを備える構成としてある。   In order to achieve the above object, a monitoring control system of the present invention includes a monitoring server connected to a plurality of servers constituting the system and monitoring the plurality of servers, and the monitoring server is based on performance information collected from the plurality of servers. A performance modeling means for modeling the performance of each server, and a post-change performance model generating means for generating a performance model after the configuration change from the performance model before the configuration change according to a system configuration change instruction. It is as a structure to provide.

また、本発明の監視制御方法は、システムを構成する複数のサーバに、複数のサーバを監視する監視サーバを接続し、監視サーバが、複数のサーバから収集した性能情報に基づいて、各サーバの性能をモデル化し、システムの構成変更指示に応じて、構成変更前の性能モデルから構成変更後の性能モデルを生成する方法としてある。   In addition, the monitoring control method of the present invention connects a monitoring server that monitors a plurality of servers to a plurality of servers that constitute the system, and the monitoring server uses the performance information collected from the plurality of servers to This is a method for modeling performance and generating a performance model after the configuration change from the performance model before the configuration change in accordance with a system configuration change instruction.

また、本発明の監視制御サーバは、システムを構成する複数のサーバに接続され、複数のサーバを監視制御するにあたり、複数のサーバから収集した性能情報に基づいて、各サーバの性能をモデル化する性能モデル化手段と、システムの構成変更指示に応じて、構成変更前の性能モデルから構成変更後の性能モデルを生成する構成変更後性能モデル生成手段とを備える構成としてある。   The monitoring control server of the present invention is connected to a plurality of servers constituting the system, and models the performance of each server based on performance information collected from the plurality of servers when monitoring and controlling the plurality of servers. The configuration includes performance modeling means and configuration-changed performance model generation means for generating a performance model after the configuration change from the performance model before the configuration change according to a system configuration change instruction.

また、本発明の監視制御プログラムは、システムを構成する複数のサーバに接続され、複数のサーバを監視制御するコンピュータに、複数のサーバから収集した性能情報に基づいて、各サーバの性能をモデル化させ、システムの構成変更指示に応じて、構成変更前の性能モデルから構成変更後の性能モデルを生成させる構成としてある。   The monitoring control program of the present invention models the performance of each server based on the performance information collected from the plurality of servers in a computer connected to the plurality of servers constituting the system and monitoring and controlling the plurality of servers. In accordance with the system configuration change instruction, the performance model after the configuration change is generated from the performance model before the configuration change.

本発明によれば、スケールアウト型サーバシステムの構成変更に伴う2次的なボトルネックの発生を事前に予測して、2次的なボトルネックの発生を回避しつつ、適切な構成変更を実施することができる。   According to the present invention, the occurrence of a secondary bottleneck associated with a configuration change of a scale-out type server system is predicted in advance, and an appropriate configuration change is performed while avoiding the occurrence of a secondary bottleneck. can do.

本発明の一実施形態に係る監視制御サーバの概略構成を示す機能ブロック図である。It is a functional block diagram which shows schematic structure of the monitoring control server which concerns on one Embodiment of this invention. 本発明の一実施形態に係る監視制御システムの構成を示す機能ブロック図である。It is a functional block diagram which shows the structure of the monitoring control system which concerns on one Embodiment of this invention. 本発明の一実施形態に係る監視制御サーバの処理手順を示すフローチャートである。It is a flowchart which shows the process sequence of the monitoring control server which concerns on one Embodiment of this invention. 本発明の一実施形態に係る監視制御サーバが収集する性能項目を示す説明図である。It is explanatory drawing which shows the performance item which the monitoring control server which concerns on one Embodiment of this invention collects. 本発明の一実施形態に係る監視制御システムにおいて、サーバ追加前の性能項目間に成り立つ相関関係を示すネットワーク図である。In the monitoring control system concerning one embodiment of the present invention, it is a network figure showing correlation established between performance items before server addition. 本発明の一実施形態に係る監視制御システムにおいて、サーバ追加前の性能項目間に成り立つ相関関係を示す表図である。In the monitoring control system which concerns on one Embodiment of this invention, it is a table | surface figure which shows the correlation established between the performance items before a server addition. 本発明の一実施形態に係る監視制御システムにおいて、論理構成の変更指示を行う画面の説明図である。It is explanatory drawing of the screen which performs the change instruction | indication of a logical structure in the monitoring control system which concerns on one Embodiment of this invention. 本発明の一実施形態に係る監視制御システムにおいて、サーバ追加後の性能項目間に成り立つ相関関係を示すネットワーク図である。In the monitoring control system which concerns on one Embodiment of this invention, it is a network diagram which shows the correlation established between the performance items after a server addition. 本発明の一実施形態に係る監視制御システムにおいて、サーバ追加後の性能項目間に成り立つ相関関係を示す表図である。In the monitoring control system which concerns on one Embodiment of this invention, it is a table | surface figure which shows the correlation established between the performance items after a server addition. 本発明の一実施形態に係る監視制御システムにおいて、サーバ追加後のサーバ毎のワークロードの割り当てを示す説明図である。It is explanatory drawing which shows the allocation of the workload for every server after the server addition in the monitoring control system which concerns on one Embodiment of this invention. 本発明の一実施形態に係る監視制御システムにおいて、所望のワークロードをインプットする画面の説明図である。It is explanatory drawing of the screen which inputs a desired workload in the monitoring control system which concerns on one Embodiment of this invention. 本発明の一実施形態に係る監視制御システムにおいて、サーバ追加後の性能値の計算例を示す表図である。It is a table | surface figure which shows the example of a calculation of the performance value after a server addition in the monitoring control system which concerns on one Embodiment of this invention. 本発明の一実施形態に係る監視制御システムにおいて、サーバ追加後のボトルネック検出例を示す表図である。It is a table | surface figure which shows the bottleneck detection example after a server addition in the monitoring control system which concerns on one Embodiment of this invention. 本発明の一実施形態に係る監視制御システムにおいて、ボトルネック検出結果を示す画面の説明図である。In the monitoring control system concerning one embodiment of the present invention, it is explanatory drawing of the screen which shows a bottleneck detection result.

以下、本発明に係る監視制御システム、監視制御方法、監視制御サーバ及び監視制御プログラムの実施形態について、図面を参照して説明する。
なお、以下に示す本発明の監視制御システム及び監視制御サーバで実行される処理動作は、プログラム(ソフトウェア)の命令によりコンピュータで実行される処理,手段,機能によって実現される。プログラムは、コンピュータの各構成要素に指令を送り、以下に示すような本発明の所定の処理、例えば、複数の被監視制御サーバから収集した性能情報に基づくサーバシステムの性能のモデル化、構成変更前の性能モデルから構成変更後の性能モデルの生成、構成変更後の性能モデルに基づくサーバの構成変更に伴う2次的なボトルネック発生の予測、複数の被監視制御サーバから収集した性能情報とサーバシステムの負荷情報に基づく各被監視制御サーバの性能の相関関数のモデル化等の処理・手順を行わせる。
Hereinafter, embodiments of a monitoring control system, a monitoring control method, a monitoring control server, and a monitoring control program according to the present invention will be described with reference to the drawings.
Note that the processing operations executed by the monitoring control system and monitoring control server of the present invention described below are realized by processing, means, and functions executed by a computer in accordance with instructions of a program (software). The program sends a command to each component of the computer, and performs predetermined processing of the present invention as described below, for example, modeling of the performance of the server system based on performance information collected from a plurality of monitored control servers, configuration change Generation of performance model after configuration change from previous performance model, prediction of secondary bottleneck occurrence due to server configuration change based on performance model after configuration change, performance information collected from multiple monitored servers Processes / procedures such as modeling of the correlation function of the performance of each monitored control server based on the load information of the server system are performed.

このように、本発明における各処理や手段は、プログラムとコンピュータとが協働した具体的手段によって実現される。
なお、プログラムの全部又は一部は、例えば、磁気ディスク,光ディスク,半導体メモリ,その他任意のコンピュータで読取り可能な記録媒体により提供され、記録媒体から読み出されたプログラムがコンピュータにインストールされて実行される。また、プログラムは、記録媒体を介さず、通信回線を通じて直接にコンピュータにロードし実行することもできる。
Thus, each process and means in the present invention are realized by specific means in which the program and the computer cooperate.
Note that all or part of the program is provided by, for example, a magnetic disk, optical disk, semiconductor memory, or any other computer-readable recording medium, and the program read from the recording medium is installed in the computer and executed. The The program can also be loaded and executed directly on a computer through a communication line without using a recording medium.

[監視制御システムの概略]
まず、図1を参照して、本発明の一実施形態に係る監視制御サーバの概略構成について説明する。
図1は、本発明の一実施形態に係る監視制御サーバの概略構成を示す機能ブロック図である。
同図に示すように、本実施形態の監視制御サーバ2は、スケールアウト型サーバシステムを構成する複数の被監視制御サーバ3と通信可能に接続されて、複数の被監視制御サーバ3を監視制御するための監視制御サーバである。
[Overview of monitoring and control system]
First, a schematic configuration of a monitoring control server according to an embodiment of the present invention will be described with reference to FIG.
FIG. 1 is a functional block diagram showing a schematic configuration of a monitoring control server according to an embodiment of the present invention.
As shown in the figure, the monitoring control server 2 of this embodiment is connected to a plurality of monitored control servers 3 constituting a scale-out type server system so as to be communicable, and monitors and controls the plurality of monitored control servers 3. It is a monitoring control server for doing this.

監視制御サーバ2は、例えば、サーバを構成するワークステーションやパーソナルコンピュータ等のコンピュータ(情報処理装置)からなり、コンピュータにインストールされたプログラムが実行されることにより、以下のような各手段を構成するようになっている。
まず、図1(a)に示すように、監視制御サーバ2は、ボトルネック予測手段2aを備える。
また、図1(b)に示すように、監視制御サーバ2は、ボトルネック予測手段2aに加えて、性能モデル化手段2b及び構成変更後性能モデル生成手段2cを備えることができる。
The monitoring control server 2 is composed of, for example, a computer (information processing apparatus) such as a workstation or a personal computer constituting the server, and constitutes the following means by executing a program installed in the computer. It is like that.
First, as shown to Fig.1 (a), the monitoring control server 2 is provided with the bottleneck prediction means 2a.
As shown in FIG. 1B, the monitoring control server 2 can include a performance modeling unit 2b and a post-configuration-change performance model generation unit 2c in addition to the bottleneck prediction unit 2a.

ボトルネック予測手段2aは、複数の被監視制御サーバ3で構成されるスケールアウト型サーバシステムの構成変更に伴う2次的なボトルネックの発生を予測する手段である。
性能モデル化手段2bは、複数の被監視制御サーバ3から収集した性能情報に基づいて、被監視制御サーバ3で構成されるスケールアウト型サーバシステムの性能をモデル化する手段である。
構成変更後性能モデル生成手段2cは、被監視制御サーバ3で構成されるスケールアウト型サーバシステムの構成変更指示に応じて、構成変更前の性能モデルから構成変更後の性能モデルを生成する手段である。
そして、ボトルネック予測手段2aは、構成変更後性能モデル生成手段2cで生成される構成変更後の性能モデルに基づいて、被監視制御サーバ3で構成されるスケールアウト型サーバシステムの構成変更に伴う2次的なボトルネックの発生を予測するようになっている。
The bottleneck predicting means 2a is a means for predicting the occurrence of a secondary bottleneck accompanying a configuration change of a scale-out type server system composed of a plurality of monitored control servers 3.
The performance modeling unit 2 b is a unit that models the performance of the scale-out type server system configured by the monitored control server 3 based on the performance information collected from the plurality of monitored control servers 3.
The post-configuration-change performance model generation unit 2c is a unit that generates a post-configuration-change performance model from the pre-configuration-change performance model in response to the configuration change instruction of the scale-out server system configured by the monitored control server 3. is there.
The bottleneck predicting means 2a accompanies the configuration change of the scale-out type server system configured by the monitored control server 3 based on the performance model after the configuration change generated by the performance model generating means 2c after the configuration change. The occurrence of secondary bottlenecks is predicted.

性能モデル化手段2bは、複数の被監視制御サーバ3から収集した性能情報と、被監視制御サーバ3で構成されるスケールアウト型サーバシステムの負荷情報に基づいて、各被監視制御サーバ3の性能を、負荷を変数とする相関関数にモデル化する処理を行う。
構成変更後性能モデル生成手段2cは、スケールアウト型サーバシステムの構成変更指示に応じて、追加される被監視制御サーバ3と同種の被監視制御サーバを既存の被監視制御サーバ3から選択し、当該既存の被監視制御サーバ3の相関関数を、追加される被監視制御サーバの相関関数として複製する処理を行う。
The performance modeling unit 2b performs the performance of each monitored control server 3 based on the performance information collected from the plurality of monitored control servers 3 and the load information of the scale-out server system composed of the monitored control servers 3. Is processed into a correlation function with the load as a variable.
The post-configuration-change performance model generation means 2c selects a monitored control server of the same type as the monitored control server 3 to be added from the existing monitored control servers 3 according to the configuration change instruction of the scale-out type server system, A process of replicating the correlation function of the existing monitored control server 3 as the correlation function of the monitored control server to be added is performed.

さらに、ボトルネック予測手段2aは、構成変更後の性能モデルである各被監視制御サーバ3の相関関数に所定の負荷を代入し、その出力が所定の閾値を超えている被監視制御サーバ3を、スケールアウト型サーバシステムの構成変更に伴う2次的なボトルネックであるとして抽出・予測する。
ここで、相関関数に代入される負荷データは、任意に指定・入力することができる。
以上のような各手段を備える本実施形態の監視制御サーバ2とこれを備える監視制御システムのより具体的な構成及び動作について、図2〜図14を参照して以下に詳述する。
Further, the bottleneck prediction means 2a assigns a predetermined load to the correlation function of each monitored control server 3 that is the performance model after the configuration change, and determines the monitored control server 3 whose output exceeds a predetermined threshold. Then, it is extracted and predicted as a secondary bottleneck accompanying the configuration change of the scale-out type server system.
Here, the load data to be substituted into the correlation function can be arbitrarily designated / input.
More specific configurations and operations of the monitoring control server 2 according to the present embodiment including the above-described units and the monitoring control system including the same will be described in detail below with reference to FIGS.

[監視制御システムの詳細]
図2は、本発明の実施形態に係る監視制御システムの構成を示すブロック図である。
同図に示すシステムは、スケールアウト型サーバシステムの監視制御を行う監視制御システムであって、監視端末1と、監視制御サーバ2と、複数の被監視制御サーバ3とから構成されている。
監視端末1は、監視制御サーバ2と通信可能に接続された情報処理装置からなり、図2に示すように、性能情報表示部11と、論理構成エディタ12とを備える。
[Details of supervisory control system]
FIG. 2 is a block diagram showing the configuration of the monitoring control system according to the embodiment of the present invention.
The system shown in FIG. 1 is a monitoring control system that performs monitoring control of a scale-out type server system, and includes a monitoring terminal 1, a monitoring control server 2, and a plurality of monitored control servers 3.
The monitoring terminal 1 includes an information processing apparatus that is communicably connected to the monitoring control server 2 and includes a performance information display unit 11 and a logical configuration editor 12 as shown in FIG.

監視制御サーバ2は、図1に示した監視制御サーバ2と同様の情報処理装置からなり、図2に示すように、構成変更後性能予測手段21と、相関モデル蓄積手段23と、相関検出部24と、論理構成データ25と、論理構成管理部26と、監視装置27と、性能情報蓄積手段28と、制御装置29とを備える。
被監視制御サーバ3は、監視制御サーバ2と通信可能に接続された複数のサーバ装置を構成する情報処理装置からなり、図2に示すように、各被監視制御サーバ3が監視制御エージェント31を備えている。
The monitoring control server 2 is composed of the same information processing apparatus as the monitoring control server 2 shown in FIG. 1. As shown in FIG. 2, the post-configuration-change performance prediction means 21, the correlation model storage means 23, and the correlation detection unit 24, logical configuration data 25, logical configuration management unit 26, monitoring device 27, performance information storage means 28, and control device 29.
The monitored control server 3 is composed of information processing devices constituting a plurality of server devices communicably connected to the monitoring control server 2, and each monitored control server 3 has a monitoring control agent 31 as shown in FIG. I have.

被監視制御サーバ3の監視制御エージェント31は、監視制御サーバ2の監視装置27及び制御装置29と通信して、被監視制御サーバ3の性能情報の通知及び制御を行うことができる。
ここで、被監視制御サーバ3の性能情報は、サーバの利用状況によって左右されるが、本実施形態ではスケールアウト型のサーバシステムであるので、同一種類のサーバ間でトランザクションがほぼ均一に振り分けられるようになっている。
The monitoring control agent 31 of the monitored control server 3 can communicate with the monitoring device 27 and the control device 29 of the monitoring control server 2 to notify and control performance information of the monitored control server 3.
Here, the performance information of the monitored control server 3 depends on the usage status of the server, but in the present embodiment, since it is a scale-out type server system, transactions are distributed almost evenly among servers of the same type. It is like that.

被監視制御サーバ3を構成するサーバは、例えば、WEBサーバ、AP(アプリケーション)サーバ、DB(データベース)サーバ等があり、これらサーバのうち、同一種類(WEB層、AP層、DB層)のサーバ間ではトランザクションがほぼ均一に振り分けられることになる。
なお、サーバの性能情報とは、被監視制御サーバ3が持つCPU、メモリ、ネットワークなどの利用状況を示す数値データである。これらの数値データは、性能項目ごとに、所定のタイミング(例えば1分おき)の時系列データとなって収集され、監視装置27に定期的に送信される。
Examples of the servers constituting the monitored control server 3 include a WEB server, an AP (application) server, a DB (database) server, and the like. Among these servers, servers of the same type (WEB layer, AP layer, DB layer) Transactions are distributed almost evenly between them.
The server performance information is numerical data indicating the usage status of the CPU, memory, network, etc. of the monitored control server 3. These numerical data are collected as time-series data at a predetermined timing (for example, every one minute) for each performance item, and are periodically transmitted to the monitoring device 27.

被監視制御サーバ3から収集した時系列の性能情報は、監視制御サーバ2の性能情報蓄積手段28に蓄積される。
監視制御サーバ2の相関検出部24は、収集した性能情報から、後述する相関関数導出方法を用いて相関関係を抽出し、相関モデルとして相関モデル蓄積手段23に蓄積する。
The time-series performance information collected from the monitored control server 3 is stored in the performance information storage means 28 of the monitoring control server 2.
The correlation detection unit 24 of the monitoring control server 2 extracts a correlation from the collected performance information using a correlation function derivation method described later, and stores it in the correlation model storage unit 23 as a correlation model.

監視端末1の論理構成エディタ12は、ユーザからの論理構成変更要求を受け付け、監視制御サーバ2の論理構成管理部26へ構成変更を指示する。
例えば、物理サーバを任意のサーバグループに追加し、稼動サーバの台数を増加させてシステム全体の処理性能を向上させる。
The logical configuration editor 12 of the monitoring terminal 1 receives a logical configuration change request from the user, and instructs the logical configuration management unit 26 of the monitoring control server 2 to change the configuration.
For example, a physical server is added to an arbitrary server group, and the number of active servers is increased to improve the processing performance of the entire system.

監視制御サーバ2の論理構成管理部26は、制御装置29へ構成変更指示を行うとともに、論理構成データ25を更新する。
被監視制御サーバ3には、OSやアプリケーションが導入され、業務に合わせた設定がされているが、それらは、制御装置29を介して伝達される論理構成変更指示にしたがって変更される。
例えば、サーバを異なる用途に転用する場合には、新しいアプリケーションの導入指示や、アプリケーションの設定変更指示が、アプリケーションのインストールファイルとともに監視制御サーバ2の制御装置29から被監視制御サーバ3の監視制御エージェント31に伝達され、監視制御エージェント31が受信して処理することで、被監視制御サーバ3の構成が変更される。
これにより、既存の稼動しているシステムに対して、新規サーバの追加を行うことができる。
The logical configuration management unit 26 of the monitoring control server 2 issues a configuration change instruction to the control device 29 and updates the logical configuration data 25.
The monitored control server 3 is installed with an OS and an application and is set according to the business, but these are changed according to a logical configuration change instruction transmitted via the control device 29.
For example, when the server is diverted to a different use, a new application introduction instruction or an application setting change instruction is sent from the control device 29 of the monitoring control server 2 to the monitoring control agent of the monitored control server 3 together with the application installation file. When the monitoring control agent 31 receives and processes the data, the configuration of the monitored control server 3 is changed.
As a result, a new server can be added to an existing operating system.

監視端末1においてユーザが論理構成の変更を入力・指示することにより、監視制御サーバ2は、論理構成データ25を介して、構成変更後性能予測手段21が構成変更の開始を認識する。
構成変更後性能予測手段21は、相関モデル蓄積手段23より得られる相関モデルから、構成変更後の相関モデルを計算し、構成変更後の性能予測を行う。
When the user inputs / instructs a change in the logical configuration at the monitoring terminal 1, the supervisory control server 2 recognizes the start of the configuration change via the logical configuration data 25 by the performance prediction means 21 after the configuration change.
The post-configuration change performance predicting means 21 calculates a post-configuration change correlation model from the correlation model obtained from the correlation model accumulating means 23, and performs performance prediction after the configuration change.

監視端末1では、ユーザの入力操作等に応じて、さらに性能情報表示部11に表示されるダイアログに、構成変更後に期待するスループットの値が入力される。
性能情報表示部11には、構成変更後の各サーバの必要となるリソース消費見込みが表示される。
この情報から、もし新たなボトルネックが検出されれば、所定の警告が出力・表示される。これにより、監視端末1を操作するユーザは、構成変更前にボトルネックの発生を認識することができ、最終的に適切な構成変更が可能になる。
In the monitoring terminal 1, a throughput value expected after the configuration change is further input to a dialog displayed on the performance information display unit 11 in accordance with a user input operation or the like.
The performance information display unit 11 displays the expected resource consumption required for each server after the configuration change.
If a new bottleneck is detected from this information, a predetermined warning is output and displayed. Thereby, the user who operates the monitoring terminal 1 can recognize the occurrence of the bottleneck before the configuration change, and finally can appropriately change the configuration.

[監視制御サーバの処理内容]
次に、監視制御サーバの具体的な処理内容について、図2〜図14を参照して説明する。
図3は、監視制御サーバの処理手順を示すフローチャート、図4は、監視制御サーバが収集する性能項目を示す説明図、図5は、サーバ追加前の性能項目間に成り立つ相関関係を示すネットワーク図、図6は、サーバ追加前の性能項目間に成り立つ相関関係を示す表図、図7は、論理構成の変更指示を行う画面の説明図、図8は、サーバ追加後の性能項目間に成り立つ相関関係を示すネットワーク図、図9は、サーバ追加後の性能項目間に成り立つ相関関係を示す表図、図10は、サーバ追加後のサーバ毎のワークロードの割り当てを示す説明図、図11は、所望のワークロードをインプットする画面の説明図、図12は、サーバ追加後の性能値の計算例を示す表図、図13は、サーバ追加後のボトルネック検出例を示す表図、図14は、ボトルネック検出結果を示す画面の説明図である。
[Processing contents of the monitoring control server]
Next, specific processing contents of the monitoring control server will be described with reference to FIGS.
FIG. 3 is a flowchart showing the processing procedure of the monitoring control server, FIG. 4 is an explanatory diagram showing performance items collected by the monitoring control server, and FIG. 5 is a network diagram showing the correlation established between the performance items before adding the server. 6 is a table showing the correlation established between the performance items before the server addition, FIG. 7 is an explanatory diagram of a screen for instructing the logical configuration change, and FIG. 8 is established between the performance items after the server addition. FIG. 9 is a table showing the correlation established between the performance items after the server addition, FIG. 10 is an explanatory diagram showing the workload assignment for each server after the server addition, and FIG. FIG. 12 is an explanatory diagram of a screen for inputting a desired workload, FIG. 12 is a table showing an example of calculation of a performance value after adding a server, FIG. 13 is a table showing an example of bottleneck detection after adding a server, and FIG. The It is an explanatory view of a screen showing a Runekku detection result.

「ステップS1:性能モデル化(性能モデル化手段)」
まず、図3のステップS1で示す「性能モデル化」の処理が行われる。この性能モデル化処理が、上述した性能モデル化手段2bに相当する(図1参照)。
具体的には、監視制御サーバ2は、被監視制御サーバ3から収集した時系列の性能情報を性能情報蓄積手段28に蓄積する。例えば、図4に示すように、1列目に時刻、2列目以降に性能情報が格納される。
また、監視制御サーバ2は、システムに対する負荷(ワークロード)も定期的に取得し、性能情報蓄積手段28に蓄積する。図4に示す例では、最終列に負荷が格納されている。負荷の取得方法は、任意であるが、例えば、Webサーバである場合、毎秒のリクエスト数をカウントすることで取得できる。
"Step S1: Performance modeling (performance modeling means)"
First, the “performance modeling” process shown in step S1 of FIG. 3 is performed. This performance modeling process corresponds to the above-described performance modeling means 2b (see FIG. 1).
Specifically, the monitoring control server 2 stores time-series performance information collected from the monitored control server 3 in the performance information storage unit 28. For example, as shown in FIG. 4, the time is stored in the first column, and the performance information is stored in the second column and thereafter.
The monitoring control server 2 also periodically acquires a load (workload) on the system and stores it in the performance information storage means 28. In the example shown in FIG. 4, the load is stored in the last column. The load acquisition method is arbitrary. For example, in the case of a Web server, the load can be acquired by counting the number of requests per second.

次に、相関検出部24は、これら性能情報を分析し、性能モデルとして性能情報間の相関関数(変換関数)を算出する。
ここで、相関検出部24は、図5に示すように、性能情報に含まれる任意の二つの項目を、全ての組み合わせで選択し、それぞれの組み合わせについて相関関数を導出することができる。本実施形態では、各被監視制御サーバ2の性能を、負荷を変数とする相関関数にモデル化する。
相関関数の導出方法としては、様々な方法が知られているが、説明を簡略化するために、近似する一次関数「y=Ax+C」を求める方法を用いて説明する。
Next, the correlation detection unit 24 analyzes the performance information and calculates a correlation function (conversion function) between the performance information as a performance model.
Here, as shown in FIG. 5, the correlation detection unit 24 can select any two items included in the performance information in all combinations, and derive a correlation function for each combination. In the present embodiment, the performance of each monitored control server 2 is modeled as a correlation function with the load as a variable.
Various methods are known as methods for deriving the correlation function. In order to simplify the description, a method for obtaining an approximated linear function “y = Ax + C” will be described.

上記の方法では、負荷をx、性能をyとし、近似する一次関数「y=Ax+C」の係数を求める。
例えば、要素「AP1.CPU」の相関関数は、「y=0.5x+8」として導出することができ、その係数A、Cの値が図6に示すように相関モデル蓄積手段23に蓄積される。
また、相関関数の導出に際しては、重みWも算出され、相関モデル蓄積手段23に蓄積される。この重みWは、相関関数の誤差補正係数であり、導出した相関関数に負荷を代入して得られる性能パターンと、実際に収集した性能パターンとの差分から算出することができる。
In the above method, the load is x, the performance is y, and the coefficient of the approximate linear function “y = Ax + C” is obtained.
For example, the correlation function of the element “AP1.CPU” can be derived as “y = 0.5x + 8”, and the values of the coefficients A and C are stored in the correlation model storage unit 23 as shown in FIG. .
Further, when deriving the correlation function, the weight W is also calculated and stored in the correlation model storage unit 23. This weight W is an error correction coefficient of the correlation function, and can be calculated from the difference between the performance pattern obtained by substituting the load into the derived correlation function and the actually collected performance pattern.

「ステップS2:構成変更の指示」
次に、図3のステップS2で示す「構成変更の指示」の処理が行われる。
具体的には、ユーザ等による監視端末1の入力操作により、監視端末1の論理構成エディタ12の画面(図7参照)で、構成変更の指示が入力・指定される。
例えば、APサーバ群に、AP2と言う名前の新規のAPサーバが追加されて、APサーバ層の構成変更(サーバ追加)が指示・入力される。
この指示は、監視制御サーバ2の論理構成管理部26に受け渡され、論理構成データ25に格納される。
構成変更後性能予測手段21には、論理構成データ25を介して、構成変更(サーバ追加)が行われることが通知される。
"Step S2: Configuration change instruction"
Next, the “configuration change instruction” process shown in step S2 of FIG. 3 is performed.
Specifically, a configuration change instruction is input / designated on the screen of the logical configuration editor 12 of the monitoring terminal 1 (see FIG. 7) by an input operation of the monitoring terminal 1 by a user or the like.
For example, a new AP server named AP2 is added to the AP server group, and the configuration change (server addition) of the AP server layer is instructed / input.
This instruction is transferred to the logical configuration management unit 26 of the monitoring control server 2 and stored in the logical configuration data 25.
The post-configuration change performance prediction means 21 is notified via the logical configuration data 25 that a configuration change (server addition) will be performed.

「ステップS3:相関の再計算(構成変更後性能モデル生成手段)」
次いで、図3のステップS3で示す「相関の再計算」の処理が行われる。この相関の再計算処理が、上述した構成変更後性能モデル生成手段2cに相当する(図1参照)。
具体的には、構成変更後性能予測手段21は、ステップS2の構成変更指示に応じて、構成変更前の性能モデルから構成変更後の性能モデル(図8参照)を生成する。
例えば、図5及び図6に示すように、構成変更前の性能モデルにおいては、相関関数「y=Ax+C」が成立しており、APサーバを追加したい場合、構成変更後性能予測手段21は、サーバが追加されようとしている層から、既存のサーバを選択し、既存のサーバに成り立っている相関関数「y=Ax+C」を、新規サーバにおいても成り立つとして複製し、サーバ追加後の性能モデルを生成する。
例えば、図9に示すように、APサーバ層の既存サーバである「AP1.CPU」のデータ領域からの相関関数の値、A、C、Wが抽出され、「AP2.CPU」のデータ領域に複製される。
図8に、構成変更(サーバ追加)後の性能項目間に成り立つ相関関係を示す。
"Step S3: Recalculation of correlation (performance model generation means after configuration change)"
Next, the process of “recalculation of correlation” shown in step S3 of FIG. 3 is performed. This correlation recalculation process corresponds to the above-described post-configuration-change performance model generation means 2c (see FIG. 1).
Specifically, the post-configuration change performance prediction means 21 generates a post-configuration change performance model (see FIG. 8) from the pre-configuration change performance model in response to the configuration change instruction in step S2.
For example, as shown in FIGS. 5 and 6, in the performance model before the configuration change, the correlation function “y = Ax + C” is established, and if it is desired to add an AP server, the performance prediction means 21 after the configuration change is Select an existing server from the layer where the server is going to be added, and copy the correlation function “y = Ax + C” that holds for the existing server as if it also holds for the new server, and generate a performance model after adding the server To do.
For example, as shown in FIG. 9, the correlation function values A, C, and W are extracted from the data area of “AP1.CPU”, which is an existing server in the AP server layer, and the data area of “AP2.CPU” is extracted. Duplicated.
FIG. 8 shows a correlation established between performance items after configuration change (server addition).

「ステップS4:新たなボトルネックの探索(ボトルネック予測手段)」
さらに、図3のステップS4で示す「新たなボトルネックの探索」の処理が行われる。この新たなボトルネックの探索処理が、上述したボトルネック予測手段2aに相当する(図1参照)。
具体的には、構成変更後性能予測手段21は、構成変更後の性能モデルに基づいて、構成変更に伴う2次的なボトルネックの発生を検出・予測する。
性能モデルを用いたボトルネックの検出は、例えば、性能モデルである相関関数の変数に要求値(例えば、本実施形態では要求負荷)を代入し、得られた性能値が所定の閾値を超えているか否かに基づいて検出することができる。
以下、具体的なボトルネックの検出方法について説明する。
"Step S4: Search for a new bottleneck (bottleneck prediction means)"
Further, a “new bottleneck search” process shown in step S4 of FIG. 3 is performed. This new bottleneck search process corresponds to the bottleneck prediction means 2a described above (see FIG. 1).
Specifically, the post-configuration change performance predicting means 21 detects and predicts the occurrence of a secondary bottleneck associated with the configuration change based on the performance model after the configuration change.
For example, a bottleneck is detected using a performance model by substituting a required value (for example, a required load in this embodiment) into a variable of a correlation function that is a performance model, and the obtained performance value exceeds a predetermined threshold value. It can be detected based on whether or not.
Hereinafter, a specific bottleneck detection method will be described.

図10に示すように、スケールアウト型サーバシステムにおける同種類のサーバの負荷は均一に分散する。従って、例えばAPサーバが1台から2台に増えると、各APサーバにかかる負荷は半分に減少する。
ユーザは、監視端末1を介して、図11に示すような画面において、所望の負荷(ワークロード)として、例えば「300/sec」と所望の要求データを入力することができる。
構成変更後性能予測手段21は、入力された所望の負荷を上限とし、段階的に負荷を増加しながらボトルネックの検出を行う。
例えば、図12及び図13に示すように、「100/sec」から開始し、段階的に「10/sec」ずつ増やしながらボトルネックの検出を行う。
As shown in FIG. 10, the load of the same type of server in the scale-out type server system is uniformly distributed. Therefore, for example, when the number of AP servers increases from one to two, the load on each AP server is reduced by half.
The user can input desired request data such as “300 / sec” as a desired load (workload) on the screen as shown in FIG. 11 via the monitoring terminal 1.
The post-configuration-change performance predicting means 21 detects the bottleneck while increasing the load stepwise with the input desired load as the upper limit.
For example, as shown in FIGS. 12 and 13, the bottleneck is detected while starting from “100 / sec” and gradually increasing by “10 / sec”.

ここで、所望の負荷W’に対して各サーバの性能値を計算する場合には、
y=A・W’・サーバ追加係数+C
とすればよい。(ただし、重みWによる補正は省略)
サーバ追加係数とは、サーバのグループ毎に、
サーバ追加前の台数/サーバ追加後の台数
を計算することで得られる。
この方法にしたがい、全ての性能項目に関して計算を行う。
例えば、APサーバの性能値を計算する場合には、
y=A・W’/2+C
とすればよい。
同様にWEBサーバ及びDBサーバの性能値を計算する場合には、
y=A・W’+C
とすればよい。
Here, when calculating the performance value of each server for the desired load W ′,
y = A ・ W ′ ・ Server additional coefficient + C
And it is sufficient. (However, correction by weight W is omitted)
The server addition factor is for each group of servers.
It can be obtained by calculating the number before adding the server / the number after adding the server.
According to this method, calculations are performed for all performance items.
For example, when calculating the performance value of an AP server,
y = A · W '/ 2 + C
And it is sufficient.
Similarly, when calculating the performance values of the WEB server and DB server,
y = A ・ W '+ C
And it is sufficient.

「ステップS5:判断」
図3のステップS5で示す判断処理が行われる。
この処理ステップでは、ボトルネックが検出されたか否かが判断される。
例えば、図13に示すように、ユーザが負荷=300を設定したところ、負荷が220で、DBサーバに性能の飽和が発生している。
この場合、図14に示すように、結果表示画面において、サーバ追加後のシステムにおいて最初にボトルネックとなるサーバを表示する。
このようにして、APサーバ以外に発生する2次的なボトルネックの発生を、APサーバを追加する前に確認することが可能となる。
“Step S5: Judgment”
The determination process shown in step S5 of FIG. 3 is performed.
In this processing step, it is determined whether a bottleneck has been detected.
For example, as shown in FIG. 13, when the user sets the load = 300, the load is 220, and the DB server is saturated in performance.
In this case, as shown in FIG. 14, on the result display screen, the server that is the first bottleneck in the system after the server addition is displayed.
In this way, it is possible to confirm the occurrence of a secondary bottleneck that occurs outside the AP server before adding the AP server.

「ステップS6:警告」
次に、図3のステップS6で示す「警告」の処理が行われる。
上述したステップS5の処理によりボトルネックの発生が予測された場合は、ユーザに警告を促すことができる。
これは、例えば一種類のサーバの追加だけでは所望のスループットは補えず、他種のサーバの追加も同時に考慮すべきであるからである。
具体的には、上述した例によれば、APサーバの負荷がサーバ追加により軽減されたことにより、APサーバのグループでは所望の負荷を処理することが可能と判断できる一方で、DBサーバについては要求される負荷を満たせないことが理解できる。
従って、このような場合には、所定の警告処理が実行され、監視端末1を操作するユーザに対して警告が促されることになる。
“Step S6: Warning”
Next, the “warning” process shown in step S6 of FIG. 3 is performed.
When the occurrence of a bottleneck is predicted by the process in step S5 described above, a warning can be urged to the user.
This is because, for example, the addition of one type of server alone cannot supplement the desired throughput, and the addition of other types of servers should be considered at the same time.
Specifically, according to the above-described example, it is possible to determine that the AP server group can process a desired load by reducing the load of the AP server by adding the server, It can be understood that the required load cannot be satisfied.
Therefore, in such a case, a predetermined warning process is executed, and a warning is urged to the user who operates the monitoring terminal 1.

「ステップS7:構成変更の実施」
さらに、図3のSステップS7で示す「構成変更の実施」の処理が行われる。
上述したステップS5の処理によりボトルネックが無いことが確認できた場合には、実際に構成の変更が実施される。
以上のステップを経ることにより、構成変更に伴う2次的なボトルネックを発生させることなく、適切な構成変更を実施することが可能となる。
"Step S7: Implementation of configuration change"
Further, the “execution of configuration change” process shown in S step S7 of FIG. 3 is performed.
When it is confirmed that there is no bottleneck by the process in step S5 described above, the configuration is actually changed.
Through the above steps, it is possible to perform an appropriate configuration change without causing a secondary bottleneck associated with the configuration change.

以上説明したように、本実施形態の監視制御システム及び監視制御サーバによれば、スケールアウト型サーバシステムを構成する複数の被監視制御サーバ3に接続され、複数の被監視制御サーバ3を監視制御する監視制御サーバ2を備え、監視制御サーバ2が、スケールアウト型サーバシステムの構成変更に伴う2次的なボトルネックの発生を予測するので、2次的なボトルネックの発生を回避しつつ、適切な構成変更を実施することができる。   As described above, according to the monitoring control system and the monitoring control server of this embodiment, the monitoring control server 3 connected to the plurality of monitored control servers 3 constituting the scale-out server system is monitored and controlled. The monitoring control server 2 predicts the occurrence of a secondary bottleneck associated with the configuration change of the scale-out type server system, and thus avoids the occurrence of a secondary bottleneck. Appropriate configuration changes can be made.

監視制御サーバ2は、複数の被監視制御サーバ3から収集した性能情報に基づいて、スケールアウト型サーバシステムの性能をモデル化し、スケールアウト型サーバシステムの構成変更指示に応じて、構成変更前の性能モデルから構成変更後の性能モデルを生成し、構成変更後の性能モデルに基づいて、スケールアウト型サーバシステムの構成変更に伴う2次的なボトルネックの発生を予測するので、構成変更に伴う2次的なボトルネックの発生を、構成変更前の性能モデルを踏まえて正確に予測することができる。   The monitoring control server 2 models the performance of the scale-out type server system based on the performance information collected from the plurality of monitored control servers 3, and before the configuration change according to the configuration change instruction of the scale-out type server system. A performance model after the configuration change is generated from the performance model, and the occurrence of a secondary bottleneck associated with the configuration change of the scale-out server system is predicted based on the performance model after the configuration change. The occurrence of secondary bottlenecks can be accurately predicted based on the performance model before the configuration change.

また、監視制御サーバ2は、複数の被監視制御サーバ3から収集した性能情報と、スケールアウト型サーバシステムの負荷情報に基づいて、各被監視制御サーバ2の性能を、負荷を変数とする相関関数にモデル化するので、要求負荷に対する各被監視制御サーバ2の性能を容易に算出し、ボトルネックを検出することができる。
また、監視制御サーバ2は、スケールアウト型サーバシステムの構成変更指示に応じて、追加される被監視制御サーバ3と同種の被監視制御サーバ3を既存の被監視制御サーバ3から選択し、当該既存の被監視制御サーバ3の相関関数を、追加される被監視制御サーバ3の相関関数として複製するので、構成変更後の性能モデルを容易に生成することができる。
Further, the monitoring control server 2 correlates the performance of each monitored control server 2 with the load as a variable based on the performance information collected from the plurality of monitored control servers 3 and the load information of the scale-out type server system. Since it is modeled as a function, the performance of each monitored control server 2 with respect to the required load can be easily calculated and a bottleneck can be detected.
The monitoring control server 2 selects the monitored control server 3 of the same type as the monitored control server 3 to be added from the existing monitored control server 3 in response to the configuration change instruction of the scale-out type server system, Since the correlation function of the existing monitored control server 3 is replicated as the correlation function of the monitored control server 3 to be added, the performance model after the configuration change can be easily generated.

また、監視制御サーバ2は、構成変更後の性能モデルである各被監視制御サーバ3の相関関数に所定の負荷を代入し、その出力が所定の閾値を超えている被監視制御サーバ3が、スケールアウト型サーバシステムの構成変更に伴う2次的なボトルネックであると予測するので、簡単な計算処理でボトルネックの検出を行うことができる。
さらに、スケールアウト型サーバシステムの構成変更に伴う2次的なボトルネックを予測する際、相関関数に代入する負荷が任意に指定されるので、ユーザは、様々な負荷を入力して構成変更に伴う2次的なボトルネックを予測し、適切な構成変更を行うことができる。
Further, the monitoring control server 2 assigns a predetermined load to the correlation function of each monitored control server 3 that is the performance model after the configuration change, and the monitored control server 3 whose output exceeds a predetermined threshold Since it is predicted that this is a secondary bottleneck accompanying the configuration change of the scale-out type server system, it is possible to detect the bottleneck with a simple calculation process.
Furthermore, when predicting a secondary bottleneck associated with a configuration change in a scale-out server system, the load to be assigned to the correlation function is arbitrarily specified, so the user can change the configuration by inputting various loads. The accompanying secondary bottleneck can be predicted and appropriate configuration changes can be made.

以上、本発明について、一実施形態を示して説明したが、本発明は、上述した実施形態にのみ限定されるものではなく、特許請求の範囲内で種々の変更が可能であることは言うまでもない。
例えば、上述した実施形態では、被監視制御サーバに設けられるサーバとして、WEBサーバ、AP(アプリケーション)サーバ、DB(データベース)サーバの3種類のサーバを例にとって説明したが、本発明により監視制御の対象となるサーバの種類や数等は特に上述した実施形態の場合に限定されるものではない。
The present invention has been described with reference to the embodiment. However, the present invention is not limited to the above-described embodiment, and various modifications can be made within the scope of the claims. .
For example, in the above-described embodiment, three types of servers, a WEB server, an AP (application) server, and a DB (database) server, have been described as examples of servers provided in the monitored control server. The type and number of the target servers are not particularly limited to the above-described embodiment.

本発明は、スケールアウト型サーバシステムを監視制御する監視制御システム、監視制御方法、監視制御サーバ及び監視制御プログラムとして利用することができる。   The present invention can be used as a monitoring control system, a monitoring control method, a monitoring control server, and a monitoring control program for monitoring and controlling a scale-out type server system.

1 監視端末
11 性能情報表示部
12 論理構成エディタ
2 監視制御サーバ
21 構成変更後性能予測手段
23 相関モデル蓄積手段
24 相関検出部
25 論理構成データ
26 論理構成管理部
27 監視装置
28 性能情報蓄積手段
29 制御装置
3 被監視制御サーバ
31 監視制御エージェント
DESCRIPTION OF SYMBOLS 1 Monitoring terminal 11 Performance information display part 12 Logical configuration editor 2 Monitoring control server 21 Performance prediction means 23 after a configuration change Correlation model storage means 24 Correlation detection part 25 Logical configuration data 26 Logical configuration management part 27 Monitoring apparatus 28 Performance information storage means 29 Control device 3 Monitored control server 31 Monitoring control agent

Claims (9)

システムを構成する複数のサーバに接続され、複数の前記サーバを監視する監視サーバを備え、
前記監視サーバが、
複数の前記サーバから収集した性能情報に基づいて、各サーバの性能をモデル化する性能モデル化手段と、
前記システムの構成変更指示に応じて、構成変更前の性能モデルから構成変更後の性能モデルを生成する構成変更後性能モデル生成手段と、を備える
ことを特徴とする監視制御システム。
A monitoring server connected to a plurality of servers constituting the system and monitoring the plurality of servers;
The monitoring server is
A performance modeling means for modeling the performance of each server based on performance information collected from a plurality of the servers;
A monitoring control system, comprising: a post-configuration-change performance model generation unit that generates a post-configuration-change performance model from a pre-configuration-change performance model in response to the system configuration change instruction.
前記監視サーバが、
構成変更後の性能モデルに基づいて、前記システムの構成変更に伴う2次的なボトルネックの発生を予測するボトルネック予測手段を備える
ことを特徴とする請求項1記載の監視制御システム。
The monitoring server is
The monitoring control system according to claim 1, further comprising: a bottleneck prediction unit that predicts the occurrence of a secondary bottleneck associated with the system configuration change based on the performance model after the configuration change.
前記性能モデル化手段が、
複数の前記サーバから収集した性能情報と、前記システムの負荷情報に基づいて、各サーバの性能を、負荷を変数とする相関関数にモデル化する
ことを特徴とする請求項2記載の監視制御システム。
The performance modeling means comprises:
The monitoring control system according to claim 2, wherein the performance of each server is modeled as a correlation function having a load as a variable based on performance information collected from a plurality of servers and load information of the system. .
前記構成変更後性能モデル生成手段が、
前記システムの構成変更指示に応じて、追加されるサーバと同種のサーバを既存のサーバから選択し、当該既存のサーバの相関関数を、追加されるサーバの相関関数として複製する
ことを特徴とする請求項3記載の監視制御システム。
The performance model generation means after the configuration change,
According to the system configuration change instruction, a server of the same type as the server to be added is selected from existing servers, and the correlation function of the existing server is copied as the correlation function of the added server. The monitoring control system according to claim 3.
前記ボトルネック予測手段が、
構成変更後の性能モデルである各サーバの相関関数に所定の負荷を代入し、その出力が所定の閾値を超えているサーバが、前記システムの構成変更に伴う2次的なボトルネックであると予測する
ことを特徴とする請求項4記載の監視制御システム。
The bottleneck prediction means is
A server in which a predetermined load is assigned to the correlation function of each server, which is a performance model after the configuration change, and the output exceeds a predetermined threshold is a secondary bottleneck accompanying the configuration change of the system The monitoring control system according to claim 4, wherein prediction is performed.
前記システムの構成変更に伴う2次的なボトルネックを予測する際、相関関数に代入する負荷が任意に指定される
ことを特徴とする請求項5記載の監視制御システム。
The monitoring control system according to claim 5, wherein when predicting a secondary bottleneck associated with the system configuration change, a load to be substituted into a correlation function is arbitrarily designated.
システムを構成する複数のサーバに、複数の前記サーバを監視する監視サーバを接続し、
前記監視サーバが、
複数の前記サーバから収集した性能情報に基づいて、各サーバの性能をモデル化し、
前記システムの構成変更指示に応じて、構成変更前の性能モデルから構成変更後の性能モデルを生成する
ことを特徴とする監視制御方法。
Connecting a plurality of monitoring servers that monitor the plurality of servers to a plurality of servers constituting the system,
The monitoring server is
Based on performance information collected from multiple servers, model the performance of each server,
A monitoring control method, comprising: generating a performance model after a configuration change from a performance model before the configuration change according to a configuration change instruction of the system.
システムを構成する複数のサーバに接続され、複数の前記サーバを監視制御するにあたり、
複数の前記サーバから収集した性能情報に基づいて、各サーバの性能をモデル化する性能モデル化手段と、
前記システムの構成変更指示に応じて、構成変更前の性能モデルから構成変更後の性能モデルを生成する構成変更後性能モデル生成手段と、を備える
ことを特徴とする監視制御サーバ。
In monitoring and controlling a plurality of servers connected to a plurality of servers constituting the system,
A performance modeling means for modeling the performance of each server based on performance information collected from a plurality of the servers;
A monitoring control server, comprising: a configuration model after configuration change that generates a performance model after the configuration change from the performance model before the configuration change in response to the configuration change instruction of the system.
システムを構成する複数のサーバに接続され、複数の前記サーバを監視制御するコンピュータに、
複数の前記サーバから収集した性能情報に基づいて、各サーバの性能をモデル化させ、
前記システムの構成変更指示に応じて、構成変更前の性能モデルから構成変更後の性能モデルを生成させる
ことを特徴とする監視制御プログラム。
A computer connected to a plurality of servers constituting the system and monitoring and controlling the plurality of servers;
Based on performance information collected from multiple servers, model the performance of each server,
A monitoring control program for generating a performance model after a configuration change from a performance model before the configuration change in response to a configuration change instruction of the system.
JP2013149251A 2013-07-18 2013-07-18 Monitoring control system, monitoring control method, monitoring control server, and monitoring control program Active JP5500301B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013149251A JP5500301B2 (en) 2013-07-18 2013-07-18 Monitoring control system, monitoring control method, monitoring control server, and monitoring control program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013149251A JP5500301B2 (en) 2013-07-18 2013-07-18 Monitoring control system, monitoring control method, monitoring control server, and monitoring control program

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2009084102A Division JP5321195B2 (en) 2009-03-31 2009-03-31 Monitoring control system, monitoring control method, monitoring control server, and monitoring control program

Publications (2)

Publication Number Publication Date
JP2013242899A JP2013242899A (en) 2013-12-05
JP5500301B2 true JP5500301B2 (en) 2014-05-21

Family

ID=49843647

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013149251A Active JP5500301B2 (en) 2013-07-18 2013-07-18 Monitoring control system, monitoring control method, monitoring control server, and monitoring control program

Country Status (1)

Country Link
JP (1) JP5500301B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017064779A1 (en) * 2015-10-14 2017-04-20 株式会社日立製作所 Computer system, management computer, and cluster control method
JP7166982B2 (en) * 2019-04-22 2022-11-08 株式会社日立製作所 TOPOLOGY MAP PRESENTATION SYSTEM, TOPOLOGY MAP PRESENTATION METHOD, AND COMPUTER PROGRAM

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2171802C (en) * 1996-03-14 2001-06-05 Richard Denison Mcdonald Comparative performance modeling for distributed object oriented applications
JP2002342182A (en) * 2001-05-21 2002-11-29 Hitachi Ltd Support system for operation management in network system
JP4980581B2 (en) * 2004-04-16 2012-07-18 新日鉄ソリューションズ株式会社 Performance monitoring device, performance monitoring method and program
JP4957256B2 (en) * 2007-01-12 2012-06-20 日本電気株式会社 System configuration change rule generation system, method and program

Also Published As

Publication number Publication date
JP2013242899A (en) 2013-12-05

Similar Documents

Publication Publication Date Title
KR101867487B1 (en) System and method of migration based fuzzy in cloud environment
US10652119B2 (en) Automatic recovery engine with continuous recovery state machine and remote workflows
JP5729466B2 (en) Virtual machine management apparatus, virtual machine management method, and program
US8533731B2 (en) Apparatus and method for distrubuting complex events based on correlations therebetween
US7870424B2 (en) Parallel computer system
WO2012056596A1 (en) Computer system and processing control method
US20150227397A1 (en) Energy efficient assignment of workloads in a datacenter
JP5321195B2 (en) Monitoring control system, monitoring control method, monitoring control server, and monitoring control program
US9852007B2 (en) System management method, management computer, and non-transitory computer-readable storage medium
WO2016178316A1 (en) Computer procurement predicting device, computer procurement predicting method, and program
EP2645635B1 (en) Cluster monitor, method for monitoring a cluster, and computer-readable recording medium
TW201347459A (en) Management method and system using the same
CN111443870A (en) Data processing method, device and storage medium
JP2017138895A (en) Virtualization environment management system and virtualization environment management method
JP2008217575A (en) Storage device and configuration optimization method thereof
WO2015141218A1 (en) Information processing device, analysis method, and program recording medium
JP5500301B2 (en) Monitoring control system, monitoring control method, monitoring control server, and monitoring control program
Mohammed et al. An integrated virtualized strategy for fault tolerance in cloud computing environment
US20220229689A1 (en) Virtualization platform control device, virtualization platform control method, and virtualization platform control program
CN105511952A (en) Resource self-migration method and system based on cloud computing platform
JP5443686B2 (en) Information processing apparatus, information processing method, and program
Wang et al. An adaptive elasticity policy for staging based in-situ processing
JP2022028208A (en) Computer device, computer system, and event management method
Mondal et al. Energy modeling of virtual machine replication schemes with checkpointing in data centers
JP6555131B2 (en) Parallel processing device, job monitoring method, and job monitoring program

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140212

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140225

R150 Certificate of patent or registration of utility model

Ref document number: 5500301

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150