JP2006344025A - Operation performance data acquisition method, performance monitor server, work server, computer, and computing system - Google Patents
Operation performance data acquisition method, performance monitor server, work server, computer, and computing system Download PDFInfo
- Publication number
- JP2006344025A JP2006344025A JP2005169474A JP2005169474A JP2006344025A JP 2006344025 A JP2006344025 A JP 2006344025A JP 2005169474 A JP2005169474 A JP 2005169474A JP 2005169474 A JP2005169474 A JP 2005169474A JP 2006344025 A JP2006344025 A JP 2006344025A
- Authority
- JP
- Japan
- Prior art keywords
- collection
- computer
- performance data
- program
- business
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Debugging And Monitoring (AREA)
Abstract
Description
本発明は、プログラムを実行する計算機が動的に割り当てられるシステムにおいて用いられる技術に関する。 The present invention relates to a technique used in a system in which computers that execute programs are dynamically allocated.
近年、業務アプリケーションプログラムを実行する計算機が動的に割り当てられるシステムの1つとして、グリッド・コンピューティングシステムを用いた業務アプリケーションプログラムの処理(以下、グリッドコンピューティング処理という)が、安価な端末でスーパーコンピュータに匹敵する処理性能を得ることができることから注目されている。このグリッドコンピューティング処理では、業務アプリケーションプログラムを実行する最適な計算機を業務アプリケーションプログラムの実行時に割り当て、各計算機を効率よく利用する。
このような状況下、従来、管理者等が、業務アプリケーションプログラムを実行する計算機までの通信経路(IPアドレス等)を特定することにより、この計算機の性能を監視し、計算機の性能を改善する方法が知られている(例えば、特許文献1、特許文献2参照)。
Under such circumstances, conventionally, an administrator or the like has identified a communication path (such as an IP address) to a computer that executes a business application program, thereby monitoring the performance of the computer and improving the performance of the computer. Is known (see, for example, Patent Document 1 and Patent Document 2).
しかしながら、特許文献1に開示された方法では、業務アプリケーションプログラムを実行する計算機に関して、エラーパケット数やキャッシュヒット率といった稼動性能データを収集しないので、計算機の性能監視を充分に行うことができない。 However, the method disclosed in Patent Document 1 does not collect operation performance data such as the number of error packets and a cache hit rate for a computer that executes a business application program, and therefore cannot sufficiently monitor the performance of the computer.
また、特許文献2に開示された方法では、グリッドコンピューティング処理において、業務アプリケーションプログラムを実行する計算機に関して、CPU使用率やメモリ使用率、ハードディスク使用率を考慮して稼動しているが、各計算機は、主処理装置によって分割された演算処理(バイオ,物理,設計,金融などに関するデータ解析のための計算)を行うものである。しかし、例えばWebショッピングシステムにおける各種サーバ機能(Webサーバ、アプリケーションサーバ、データベースサーバ等)の特性を考慮していないので、このようなシステムにおけるサーバの性能監視を充分に行うことができない。 Further, in the method disclosed in Patent Document 2, the computer that executes the business application program is operating in consideration of the CPU usage rate, the memory usage rate, and the hard disk usage rate in the grid computing process. Performs arithmetic processing (calculation for data analysis related to biotechnology, physics, design, finance, etc.) divided by the main processor. However, for example, since the characteristics of various server functions (Web server, application server, database server, etc.) in the Web shopping system are not taken into consideration, the performance of the server in such a system cannot be sufficiently monitored.
また、特許文献1に開示された方法において、たとえ稼動性能データを収集するとしても、業務アプリケーションプログラムが計算機に割り当てられた後、ユーザが業務アプリケーションプログラム監視用のサーバを用いて、監視対象とする計算機までの通信経路を手作業で設定する必要がある。そのため、業務アプリケーションプログラムを実行する計算機が多数ある場合に、その設定は困難であった。 Further, in the method disclosed in Patent Document 1, even if operating performance data is collected, after a business application program is assigned to a computer, a user uses a business application program monitoring server as a monitoring target. It is necessary to manually set the communication path to the computer. Therefore, setting is difficult when there are many computers that execute business application programs.
そこで、本発明では、前記した問題を解決し、プログラムの実行に関する稼動性能を自動的に取得する技術を提供することを目的とする。 Therefore, an object of the present invention is to provide a technique for solving the above-described problems and automatically acquiring operation performance related to program execution.
本発明は、前記課題を解決するために創案されたものであり、稼動性能データ取得方法において、各種のプログラムを実行する複数の計算機と、前記プログラムを前記計算機に割り当て、割り当てた計算機に前記プログラムの実行を要求する業務サーバと、前記プログラムの実行環境に関連する稼動性能データを前記計算機から収集し、前記稼動性能データに基づいて前記計算機の性能を監視する性能監視サーバとを含むコンピューティングシステムを用いて、前記稼動性能データ取得する稼動性能データ取得方法であって、前記業務サーバが、前記割り当てられた当該プログラムを示す業務情報と、そのプログラムを実行する計算機を識別する計算機識別情報とを含み、当該プログラムの収集命令を生成するステップを有し、前記性能監視サーバが、前記収集命令に含まれる業務情報に対応する収集項目をメモリから読み出して、前記計算機識別情報を有する計算機に配布するステップを有し、前記計算機が、配布された収集項目に関する稼動性能データを収集するステップを有し、前記性能監視サーバが、前記収集項目を配布したことによりその収集項目に関する稼動性能データを収集した計算機から、当該収集項目に関する稼動性能データを取得するステップを有することとした。 The present invention was devised to solve the above-described problem, and in an operation performance data acquisition method, a plurality of computers that execute various programs, the program is allocated to the computer, and the program is assigned to the allocated computer. A computing system comprising: a business server that requests execution of the program; and a performance monitoring server that collects operational performance data related to the execution environment of the program from the computer and monitors the performance of the computer based on the operational performance data The operation performance data acquisition method for acquiring the operation performance data, wherein the business server includes business information indicating the assigned program and computer identification information for identifying a computer executing the program. Including the step of generating a collection instruction for the program, the performance monitoring A server reads out a collection item corresponding to the business information included in the collection command from a memory and distributes the collected item to a computer having the computer identification information, and the computer has an operation performance related to the distributed collection item. A step of collecting data, and the performance monitoring server has a step of acquiring operation performance data relating to the collection item from a computer that has collected the operation performance data relating to the collection item by distributing the collection item. It was.
本発明によれば、プログラムの実行に関する稼動性能を自動的に取得することができる。 According to the present invention, it is possible to automatically acquire operation performance related to program execution.
次に、本発明の実施形態について、適宜図面を参照しながら詳細に説明する。
(コンピューティングシステムの構成)
図1は、本発明の実施形態に係るコンピューティングシステムの構成例を示す図である。図1に示すように、このコンピューティングシステム1では、性能監視サーバ100と、業務マネージャ(業務サーバ)200と、グリッドマネージャ(グリッドサーバ)300と、複数(図では3つ)のグリッドエージェントホスト400が、ネットワーク500を介して接続されている。このネットワーク500は、例えばインターネットなどである。コンピューティングシステム1は、所定の業務アプリケーションプログラム(以下、単に業務アプリケーションという)を実行する複数のグリッドエージェントホスト400から、業務アプリケーションの実行に関する稼動性能データを収集するグリッド・コンピューティングシステムである。
本明細書において、業務アプリケーションを含む各種プログラムは、オブジェクト、スレッド、プロセスで実現してもよい。
Next, embodiments of the present invention will be described in detail with reference to the drawings as appropriate.
(Computing system configuration)
FIG. 1 is a diagram illustrating a configuration example of a computing system according to an embodiment of the present invention. As shown in FIG. 1, the computing system 1 includes a
In this specification, various programs including business applications may be realized by objects, threads, and processes.
これらの各装置100,200,300,400は、一般的なコンピュータ(計算機)であり、例えば、CPU(Central Processing Unit)と、RAM(Random Access Memory)と、ROM(Read Only Memory)と、HDD(Hard Disk Drive)と、KB/CRT(Key Board/Cathode Ray Tube)と、通信インタフェースとを含んで構成されている。なお、図1では、性能監視サーバ100と、業務マネージャ200と、グリッドマネージャ300をそれぞれ独立なサーバとして示しているが、これらのサーバは、1台の計算機で構成されていてもよい。
以下に、各装置100〜400の機能を詳細に説明する。
Each of these
Below, the function of each apparatus 100-400 is demonstrated in detail.
[性能監視サーバの機能]
性能監視サーバ100は、業務アプリケーションを実行する複数のグリッドエージェントホスト400から、業務アプリケーションの実行環境に関連する稼動性能データを収集し、この稼動性能データに基づいてグリッドエージェントホスト400の性能を監視するものであって、主として制御手段(CPU等)110と、記憶手段(RAM等)120とを含んで構成される。
[Performance monitoring server functions]
The
制御手段110は、プログラムの実行に従って機能する業務実行通知管理部111と、収集項目配布部112と、稼動性能データ取得部113とを含み、記憶手段120には、収集項目リスト121と、収集ホストリスト122と、稼動性能データ123とが記憶される。
The control unit 110 includes a business execution
業務実行通知管理部(収集命令取得手段)111は、業務マネージャ200から、稼動性能データの取得タイミングに関する命令として、収集開始要求(収集命令)、収集完了要求等を受け取るものである。
収集開始要求は、業務アプリケーションの実行開始を意味し、実行する業務名(業務情報)及び使用するグリッドエージェントホスト400を識別するための名称(ホスト名:計算機識別情報)を含んでいる。
収集完了要求は、収集を完了する業務名及び使用したグリッドエージェントホスト400の名称(ホスト名)を含んでいる。
The business execution notification management unit (collection command acquisition means) 111 receives a collection start request (collection command), a collection completion request, and the like from the
The collection start request means the start of execution of a business application, and includes a business name to be executed (business information) and a name (host name: computer identification information) for identifying the
The collection completion request includes the business name for completing collection and the name (host name) of the
収集項目配布部(収集項目配布手段)112は、業務名に対して予め定められた稼動性能データの収集項目を、収集開始要求に含まれるホスト名で識別されるグリッドエージェントホスト400(業務アプリケーションが割り当てられたグリッドエージェントホスト400)に対し、配布するものである。 The collection item distribution unit (collection item distribution means) 112 is a grid agent host 400 (business application is identified by the host name included in the collection start request) that collects performance performance data collection items predetermined for the business name. It is distributed to the assigned grid agent host 400).
稼動性能データ取得部(稼動性能データ取得手段)113は、稼動性能データの収集項目を配布されたグリッドエージェントホスト400(業務アプリケーションが割り当てられたグリッドエージェントホスト400)から、配布された収集項目で特定される稼動性能データを取得し、記憶手段120に蓄積するものである。
The operation performance data acquisition unit (operation performance data acquisition means) 113 specifies the collection items distributed from the
収集項目リスト121は、業務アプリケーション及び収集すべき稼動性能データの収集項目に関する情報である。
収集ホストリスト122は、稼動性能データの収集項目をどのグリッドエージェントホスト400から収集するかを示す情報である。
稼動性能データ123は、グリッドエージェントホスト400のハードウェア、OS、プログラムの稼動情報などを収集したデータである。なお、この稼動性能データ123を、収集項目リスト121等と合わせて、業務アプリケーションと関連付けるようにしてもよい。
The
The
The
[業務マネージャの機能]
業務マネージャ200は、各種の業務アプリケーションを複数のグリッドエージェントホスト400に割り当て、割り当てたグリッドエージェントホスト400に業務アプリケーションの実行を要求すると共に、性能監視サーバ100に対して、割り当てられた業務アプリケーションの収集開始要求(収集命令)を通知するものであって、業務実行制御部210と、業務プログラムDB220とを含んで構成される。
[Functions of business manager]
The
業務実行制御部(収集命令生成手段)210は、業務アプリケーションの業務名(業務情報)及び使用するグリッドエージェントホスト400を識別するための名称(ホスト名:計算機識別情報)を含んだ収集開始要求(収集命令)を生成するものである。また、業務実行制御部210は、業務アプリケーションの実行のために、性能監視サーバ100、グリッドマネージャ300、及びグリッドエージェントホスト400との間で、以下のような必要な命令及びデータ等の送受信を行う。
The business execution control unit (collection command generation means) 210 includes a business application business name (business information) and a collection start request (host name: computer identification information) for identifying the
業務実行制御部210は、業務アプリケーションを実行するグリッドエージェントホスト400の決定を依頼する命令(ホスト取得要求)を、グリッドマネージャ300に通知する。
業務実行制御部210は、決定されたグリッドエージェントホスト400に対し、業務アプリケーションの実行要求(業務実行)と、その業務アプリケーションを実行するための業務プログラム(ファイル)とを配布する。
業務実行制御部210は、稼動性能データの取得タイミングに関する命令として、収集開始要求(収集命令)、収集完了要求等を性能監視サーバ100に通知する。
業務プログラムDB220は、業務プログラムデータ等を記憶するものである。
The business
The business
The business
The business program DB 220 stores business program data and the like.
[グリッドマネージャの機能]
グリッドマネージャ300は、業務アプリケーションを実行する(業務プログラムを実行する)グリッドエージェントホスト400を決定するものであり、エージェント管理部310と、ホスト情報リストDB320とを含んで構成される。
[Grid Manager functions]
The grid manager 300 determines a
エージェント管理部310は、業務マネージャ200からホスト取得要求を受けたとき、最適なグリッドエージェントホスト400を、グリッドエージェントホスト400の一覧を示すデータであるホスト情報リストから選択する(割り当てる)ものである。
ホスト情報リストDB320は、ホスト情報リストを記憶するものである。
When the
The host
[グリッドエージェントホストの機能]
グリッドエージェントホスト(計算機)400は、業務アプリケーションを実行する(業務プログラムを実行する)ものであり、業務プログラム実行部410と、収集項目管理部420と、稼動性能データ収集部430と、収集項目リストDB440とを含んで構成される。
[Grid agent host functions]
The grid agent host (computer) 400 executes a business application (executes a business program), and includes a business
業務プログラム実行部410は、業務マネージャ200から配布された業務プログラムを実行処理し、所定の処理結果を業務マネージャ200に返信するものである。
収集項目管理部(収集項目管理手段)420は、性能監視サーバ100から配布された収集項目を取得し、取得した収集項目に関する稼動性能データを性能監視サーバ100に通知するものである。この収集項目管理部420は、取得した収集項目を収集項目リストDB440に書込むと共に、収集すべき稼動性能データの収集項目を収集項目リストDB440から読み出す。
The business
The collection item management unit (collection item management means) 420 acquires the collection items distributed from the
稼動性能データ収集部(稼動性能収集手段)430は、収集項目リストDB440に書込まれた収集項目に基づいて、業務アプリケーションの実行環境に関連する稼動性能データを定期的に収集するものである。
収集項目リストDB440は、性能監視サーバ100から配布された収集項目を記憶するものである。
The operation performance data collection unit (operation performance collection means) 430 periodically collects operation performance data related to the execution environment of the business application based on the collection items written in the collection
The collection
[収集項目リストの具体例]
図2は、収集項目リストの一例を示す図である。収集項目リスト121は、図2に示すように、業務名2001と、収集項目2002と、状態2003と、データID2004とを有する。
業務名2001で特定されるすべての業務アプリケーションは、業務マネージャ200が実行するものを指す。例えば、図2では、業務マネージャ200は、「WebサーバA」、「アプリケーションサーバB」及び「データベースサーバC」の業務名で指定された3つの業務を実行する。この場合、3台のグリッドエージェントホスト400が、3つの業務で指定された業務プログラムをそれぞれ実行することにより、「WebサーバA」、「アプリケーションサーバB」及び「データベースサーバC」としての機能を発揮することを意味する。なお、業務名2001は、一意に業務アプリケーションを識別できるものであればよく、例えば数値や文字列からなる業務IDなどの値でもよい。
[Specific example of collection item list]
FIG. 2 is a diagram illustrating an example of the collection item list. As illustrated in FIG. 2, the
All the business applications specified by the
収集項目2002は、業務名2001で特定される業務アプリケーションについて、どんな内容を有する稼動性能データを収集するのかを示したものであり、予め定められている。図2では、エラーパケット数、トランザクション時間、キャッシュヒット率が例示されているが、例えば、CPU使用率やメモリ使用率、ハードディスク使用率等の内容を収集項目としてもよい。
The
状態2003は、対応する業務アプリケーションについての収集状態を示すものである。例えば、初期状態は「未収集」、収集を開始した状態では「収集中」、収集を完了した状態では「収集完了」に設定される。
データID2004は、収集項目2002と、収集項目リスト121以外のデータを各収集項目ごとに一意に割り当てるものである。
なお、収集項目リスト121には、収集間隔、収集期間、収集項目の閾値越え(上限値)等の条件によるイベント通知条件などを設定してもよい。
A
The
In the
[収集ホストリストの具体例]
図3は、収集ホストリストの一例を示す図である。収集ホストリスト122は、図3に示すように、データID3001と、ホスト名3002とを有する。
データID3001は、収集項目リスト121(図2参照)のデータID2004と同様のIDである。これを用いて、どの収集項目(図2参照)に関するデータであるかを特定することができる。
ホスト名3002は、稼動性能データを収集したグリッドエージェントホスト400を特定するものである。このホスト名3002には、図3に示したように「HostA」,「HostC」等の値の他に、例えばIPアドレスやMACアドレス等の値を指定するようにしてもよい。
[Specific example of collection host list]
FIG. 3 is a diagram illustrating an example of the collection host list. The
The
The
[稼動性能データの具体例]
図4は、稼動性能データの一例を示す図である。稼動性能データ123は、図4に示すように、データID4001と、ホスト名4002と、時間4003と、値4004とを有する。
データID4001は、収集項目リスト121(図2参照)のデータID2004と同様のIDである。これを用いて、どの収集項目(図2参照)に関するデータであるかを特定することができる。
ホスト名4002は、収集ホストリスト122(図3参照)のホスト名3002と同様の内容であり、グリッドエージェントホスト400を特定するものである。
時間4003は、データID4001に対応するデータを収集した時間(例えば、年月日と時刻)である。
値4004は、対応するデータについての稼動性能データを表す具体的な値(エラーパケット数等)である。
[Specific examples of operational performance data]
FIG. 4 is a diagram illustrating an example of operation performance data. As shown in FIG. 4, the
The
The
The
A
図4に示した例では、例えば「HostA」で指定されたグリッドエージェントホスト400は、「0002」のデータIDで特定されるデータの収集項目(トランザクション時間:図2参照)の値として、10分間隔(時間4003の項目参照)で、「223」,「232」,「231」を稼動性能データとして収集したことが示されている。また、「HostB」及び「HostC」は、「0003」のデータIDで特定されるデータの収集項目(キャッシュヒット率:図2参照)の値として、「96」,「82」を稼動性能データとして、同時間にそれぞれ収集したことが示されている。
In the example shown in FIG. 4, for example, the
[業務プログラムDBの具体例]
図5は、業務プログラムDBの一例を示す図である。図5では、業務名5001と、ホスト名5002と、業務プログラムデータ5003とを有する。
業務名5001は、収集項目リスト121(図2参照)における業務名2001と同様の内容である。
ホスト名5002は、収集ホストリスト122(図3参照)のホスト名3002と同様の内容であり、業務プログラムを実行するグリッドエージェントホスト400を特定するものである。
業務プログラムデータ5003は、対応する業務アプリケーションを構成するプロセスやスレッドなどのプログラムの関連性や実行順序などを定義した情報(実行ファイル)を表す。
[Specific example of business program DB]
FIG. 5 is a diagram illustrating an example of the business program DB. 5 includes a
The
The
The
図5では、例えば「アプリケーションサーバB」の業務名は、グリッドマネージャ300によって、ホスト名「HostA」のグリッドエージェントホスト400に割り当てられていることが示されている。また、業務名5001で特定される業務アプリケーションがグリッドエージェントホスト400に割り当てられていない場合(業務名「Webサーバ」)、ホスト名5002に空欄(NULL)が設定される。
In FIG. 5, for example, it is indicated that the business name of “application server B” is assigned by the grid manager 300 to the
[ホスト情報リストDBの具体例]
図6は、ホスト情報リストDBの一例を示す図である。図6では、ホスト名6001と、状態6002とを有する。
ホスト名6001は、収集ホストリスト122(図3参照)のホスト名3002と同様の内容であり、グリッドマネージャ300で管理するグリッドエージェントホスト400を特定するものである。
状態6002は、対応するグリッドエージェントホスト400が業務アプリケーションに使用されているかどうかを示すものである。この状態6002は、エージェント管理部310(図1参照)によって、例えば「使用可能」、「使用中」、「使用不可」などに設定される。
[Specific example of host information list DB]
FIG. 6 is a diagram illustrating an example of the host information list DB. In FIG. 6, it has a
The
A
[収集項目リストDBの具体例]
図7は、収集項目リストDBの一例を示す図である。図7では、業務名7001と、収集項目7002と、データID7003とを有する。
業務名7001、収集項目7002、及びデータID7003は、収集項目リスト121(図2参照)における業務名2001、収集項目2002、及びデータID2004と同様の内容であり、収集項目リスト121(図2参照)の中からグリッドエージェントホスト400に配布された稼動性能データの収集項目を示している。
[Specific example of collection item list DB]
FIG. 7 is a diagram illustrating an example of the collection item list DB. In FIG. 7, a
The
[稼動性能データの収集項目設定動作]
次に、コンピューティングシステム1における稼動性能データの収集項目の設定に関する動作を図8を参照して説明する。図8は、業務マネージャにおける業務アプリケーションの実行に連動した稼動性能データの収集項目の設定の流れを示すシーケンス図である。
[Operational data collection item setting operation]
Next, an operation related to setting of collection items of operation performance data in the computing system 1 will be described with reference to FIG. FIG. 8 is a sequence diagram showing a flow of setting operation performance data collection items linked to execution of a business application in the business manager.
ステップ8001では、業務マネージャ200は、ホスト取得要求として、業務実行制御部210によって、業務アプリケーションを実行するグリッドエージェントホスト400の決定を、ネットワーク500を介してグリッドマネージャ300(エージェント管理部310)に要求する。この要求は、例えばオペレータによる業務マネージャ200の操作により複数の業務アプリケーションを実行させるときに行われる。
In
ステップ8002では、グリッドマネージャ300は、ホスト取得要求を受け、エージェント管理部310によって、ホスト情報リストDB320を参照し、当該業務アプリケーションの実行に最適なグリッドエージェントホスト400を割り当てる。具体的には、エージェント管理部310は、ホスト情報リストDB320(図6参照)を参照し、グリッドエージェントホスト400の状態6002を「使用中」に設定し、このホスト名(6001で指定された値)をネットワーク500を介して業務マネージャ200(業務実行制御部210)に通知する。
In
ステップ8003では、業務マネージャ200は、業務実行制御部210によって、通知を受けたホスト名を業務プログラムDB220のホスト名5002(図5参照)に設定する。そして、業務実行制御部210は、収集開始要求(収集命令)を生成し、生成した収集開始要求をネットワーク500を介して性能監視サーバ100(業務実行通知管理部111)に通知する。
In
ステップ8004では、性能監視サーバ100において、業務実行通知管理部111は、通知を受けた収集開始要求に含まれる業務名及びホスト名の値と、稼動性能データの収集項目の条件を作成する指示(条件作成指示ともいう)とを収集項目配布部112に出力する。
In
ステップ8005では、収集項目配布部112(性能監視サーバ100)は、その出力により取得した業務名に基づいて、記憶手段120の収集項目リスト121(図2参照)から、収集項目、業務名及びデータIDの値を抽出し、これらの値を、ステップ8004により取得したホスト名のグリッドエージェントホスト400(収集項目管理部420)に、ネットワーク500を介して配布する。また、収集項目の設定(収集項目設定)をこのグリッドエージェントホスト400に要求する。
In
収集項目の配布が正常に実行された場合、ステップ8006では、当該グリッドエージェントホスト400(収集項目管理部420)は、性能監視サーバ100(収集項目配布部112)に処理の成功を通知する。同様に、ステップ8007では、収集項目配布部112は、業務実行通知管理部111に処理の成功を通知し、ステップ8008では、業務実行通知管理部111(性能監視サーバ100)は、業務マネージャ200(業務実行制御部210)に処理の成功を通知する。
When the collection item distribution is normally executed, in
このとき、当該グリッドエージェントホスト400(収集項目管理部420)は、配布を受けた収集項目等の値を収集項目リストDB440に書き込む。
また、性能監視サーバ(業務実行通知管理部111)は、収集項目リスト121(図2参照)において、配布した収集項目の状態2003を「収集中」に変更すると共に、収集ホストリスト122(図3参照)において、ホスト名3002を、収集項目等の値を配布したグリッドエージェントホスト400を示す値に設定する。
At this time, the grid agent host 400 (collection item management unit 420) writes the value of the collected collection item received in the collection
In addition, the performance monitoring server (business execution notification management unit 111) changes the
ステップ8009では、業務マネージャ200(業務実行制御部210)は、業務プログラムDB220に設定した値のホスト名のグリッドエージェントホスト400(業務プログラム実行部410)に対し、業務アプリケーションの実行要求(業務実行)と、その業務アプリケーションを実行するための業務プログラムとをネットワーク500を介して配布する。
ステップ8010では、グリッドエージェントホスト400は、実行要求を受け、業務プログラム実行部410によって、業務プログラムを実行処理することにより、所定の処理結果を業務マネージャ200(業務実行制御部210)に通知する。
In
In
ステップ8011では、業務マネージャ200(業務実行制御部210)は、当該業務アプリケーションの稼動性能データの収集の完了を、ネットワーク500を介して性能監視サーバ100(業務実行通知管理部111)に要求する(収集完了要求)。この収集完了要求は、例えば業務マネージャ200において終了命令が入力された場合やグリッドエージェントホスト400において業務アプリケーションが完了した場合等、予め定められた場合に性能監視サーバ100に通知される。
In
これにより、性能監視サーバ100(業務実行通知管理部111)は、収集完了要求を受け、収集完了要求に含まれる業務名に基づいて、収集項目リスト121(図2参照)において、状態2003の値を「収集完了」に変更すると共に、収集ホストリスト122(図3参照)のホスト名の値に「NULL」を設定する。
As a result, the performance monitoring server 100 (business execution notification management unit 111) receives the collection completion request, and the value of the
ステップ8012では、性能監視サーバ100(業務実行通知管理部111)は、収集ホストリスト122(図3参照)のホスト名の値を「NULL」に設定変更する前の値を有するグリッドエージェントホスト400(収集項目管理部420)に対し、収集を完了すべき収集項目等のデータの削除をネットワーク500を介して要求する(収集項目削除)。
In
ステップ8013では、グリッドエージェントホスト400は、収集項目削除の要求を受け、収集項目管理部420によって、収集項目リストDB440から当該収集項目等のデータを削除し、削除が正常に実行された場合、性能監視サーバ100(業務実行通知管理部111)に処理の成功を通知する。続けて、ステップ8014では、性能監視サーバ100(業務実行通知管理部111)は、業務マネージャ200(業務実行制御部210)に処理の成功を通知する。
In
ステップ8015では、業務マネージャ200(業務実行制御部210)は、処理の成功通知を受け、業務アプリケーションの実行(稼動性能データの収集)で使用したグリッドエージェントホスト400を解放したことをネットワーク500を介してグリッドマネージャ300に通知する(ホスト解放)。
In
ステップ8016では、グリッドマネージャ300は、ホスト解放の通知を受け、エージェント管理部310によって、性能監視が正常に終了した場合、ホスト情報リストDB320(図6参照)の状態6002を「使用可能」に変更し、業務マネージャ200(業務実行制御部210)に処理の成功を通知する。
In
前記した流れで、業務サーバ200は、業務アプリケーションと、その業務アプリケーションを実行するグリッドエージェントホスト400とのペアを管理し、性能監視サーバ100に対し、稼動性能データの収集タイミングを通知する。したがって、性能監視サーバ100は、必要とする稼動性能データの収集項目を、その業務アプリケーションを実行するグリッドエージェントホスト400に対して、自動的に設定及び解除することができる。以上で、稼動性能データの収集項目の設定に関する動作を終了する。
In the above-described flow, the
[稼動性能データ取得動作]
次に、コンピューティングシステム1における稼動性能データの取得に関する動作を図9を参照して説明する。図9は、性能監視サーバが稼動性能データを取得する流れを示すシーケンス図である。
[Operation performance data acquisition operation]
Next, operations related to acquisition of operation performance data in the computing system 1 will be described with reference to FIG. FIG. 9 is a sequence diagram illustrating a flow in which the performance monitoring server acquires operation performance data.
ステップ9001では、性能監視サーバ100は、収集項目リスト121(図2参照)の状態2003が「収集中」を示しているとき、稼動性能データ取得部113によって、定期的に、収集ホストリスト122(図3参照)のホスト名3002の値で指定されたグリッドエージェントホスト400に対し、対応するデータID3001を通知して稼動性能データの取得を要求する(データ取得)。
In
ステップ9002では、グリッドエージェントホスト400は、収集項目管理部420によって、データIDの通知を受け、稼動性能データの収集を稼動性能データ収集部430に要求する(データ取得)。具体的には、収集項目管理部420は、受け取ったデータIDに対応する収集項目7002(図7参照)を収集項目リストDB440から読み出して稼動性能データ収集部430に通知する。
In
ステップ9003では、稼動性能データ収集部430は、その時点での稼動性能データを収集し、収集結果(稼動性能データ)を収集項目管理部420に通知する。
ステップ9004では、グリッドエージェントホスト400(収集項目管理部420)は、収集結果(稼動性能データ)をネットワーク500を介して性能監視サーバ100に通知する。
In
In
その後、性能監視サーバ100は、稼動性能データ取得部113によって、稼動性能データを取得し、取得した稼動性能データを記憶手段120に蓄積する。蓄積された稼動性能データ123は、図示しないコンピュータディスプレイ等の表示部に表示される。これにより、管理者等は、稼動性能データ123の内容を確認し、例えば、「エラーパケット数」の収集項目の値を監視することにより、どこにボトルネックがあるかを探索することができる。その結果、各グリッドエージェントホスト400の性能を改善することが可能になる。
Thereafter, the
(性能監視サーバ100の動作)
[収集項目配布部に関する動作]
次に、性能監視サーバ100における稼動性能データの収集項目を配布する動作について図10を参照(適宜図1参照)して説明する。図10は、性能監視サーバの収集項目配布部の処理を示すフローチャートである。
収集項目配布部112は、業務実行通知管理部111から、業務名とホスト名の組を取得し(ステップS1)、取得した業務名を、記憶手段120の収集項目リスト121(図2参照)から検索(リストの先頭から順番に検索)する(ステップS2)。
(Operation of the performance monitoring server 100)
[Actions related to the collection item distribution part]
Next, the operation for distributing the collection items of the operation performance data in the
The collection
そして、収集項目配布部112は、取得した業務名が、収集項目リスト121のレコードの値と一致したか否かを判別する(ステップS3)。取得した業務名がレコードの値と一致した場合(ステップS3:Yes)、収集項目配布部112は、ステップS1で取得したホスト名に基づいて、一致した値の業務名を実行するグリッドエージェントホスト400に対し、ネットワーク500を介して、検索で一致したレコードの収集項目を配布する(ステップS4)。
Then, the collection
他方、業務名がレコードの値と一致しない場合(ステップS3:No)、収集項目配布部112は、全ての検索を終了したか否かを判別する(ステップS5)。全ての検索を終了した場合(ステップS5:Yes)、収集項目配布部112は処理を終了し、他方、未検索のレコードが存在する場合(ステップS5:No)、ステップS2へ戻って、処理を繰り返す。
On the other hand, when the business name does not match the value of the record (step S3: No), the collection
[稼動性能データ取得部に関する動作]
次に、性能監視サーバ100における稼動性能データの取得動作について図11を参照(適宜図1参照)して説明する。図11は、性能監視サーバの稼動性能データ取得部の処理を示すフローチャートである。
[Operations related to operation performance data acquisition unit]
Next, the operation performance data acquisition operation in the
稼動性能データ取得部113は、一定時間経過したか否かを判別し(ステップS11)、一定時間が経過するまで判別を繰り返し(ステップS11:No)、一定時間経過した場合(ステップS11:Yes)、収集ホストリスト122(図3参照)の先頭に示されたホスト名の値を取得する(ステップS12)。ここで、一定時間(一定の間隔)とは、稼動性能データの収集間隔のことを意味し、例えばメモリに格納された定義ファイル等に予め定められている。この収集間隔は、収集項目に含まれる1つの内容として与えておいてもよい。
The operation performance
そして、稼動性能データ取得部113は、収集ホストリスト122(図3参照)を参照し、取得する順番のホスト名を指定する値の位置が、収集ホストリスト122の末端に達した(取得すべきホスト名が無くなった)か否かを判別する(ステップS13)。収集ホストリスト122の末端に達した場合(ステップS13:Yes)、稼動性能データ取得部113は、ステップS11に戻る。
Then, the operation performance
他方、収集ホストリスト122の末端に達していない(ホスト名の取得に成功した)場合(ステップS13:No)、稼動性能データ取得部113は、取得した値のホスト名のグリッドエージェントホスト400に対し、取得した値に関連付けられたデータID3001(図3参照)を通知することにより、稼動性能データの取得を要求する(ステップS14)。つまり、稼動性能データ取得部113は、このデータID3001(図3参照)により、稼動性能データのどの収集項目を収集するかをグリッドエージェントホスト400に指示する。
On the other hand, when the end of the
続いて、稼動性能データ取得部113は、取得した稼動性能データを記憶手段120に追加する(ステップS15)。このとき、記憶手段120の稼動性能データ123には、図4に示したように、データID4001、ホスト名4002、時間4003及び値4004で指定された値が追加されることとなる。
Subsequently, the operation performance
そして、稼動性能データ取得部113は、収集ホストリスト122に次のホスト名があるか否か判別する(ステップS16)。その結果、次のホスト名がある場合(ステップS16:Yes)、稼動性能データ取得部113は、収集ホストリスト122から次のホスト名を取得し(ステップS17)、ステップS13に戻る。他方、次のホスト名がない場合(ステップS16:No)、稼動性能データ取得部113は、処理を終了する。
Then, the operation performance
以上説明したように、本実施形態のコンピューティングシステム1は、収集命令に基づいて、業務アプリケーションの実行環境に関連する稼動性能データを取得する性能監視サーバ100を備える構成としたものであり、管理者等は、業務アプリケーションを実際に実行する計算機を意識することなく自動的に、稼動性能データを取得することができる。その結果、業務アプリケーションのチューニングや、障害の事前予防が可能になる。
As described above, the computing system 1 according to the present embodiment is configured to include the
以上本発明について好適な実施形態について例示したが、本発明は前記した実施形態に限定されず、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。例えば、本実施形態では、各グリッドエージェントホスト(計算機)400により構成されたグリッドコンピューティングシステムの場合で説明したが、単一のOSの下で複数のCPUが処理を実行するブレードサーバの環境下で適用してもよい。
また、本実施形態では、性能監視サーバ100が記憶している稼動性能データの収集項目2002(図2参照)は、予め定められているものとしたが、性能監視サーバ100に、この収集項目を設定するための手段を備えるようにしてもよい。
As mentioned above, although preferred embodiment was illustrated about this invention, this invention is not limited to above-described embodiment, In the range which does not deviate from the meaning of this invention, it can change suitably. For example, in the present embodiment, the case of a grid computing system configured by each grid agent host (computer) 400 has been described. However, under the environment of a blade server in which a plurality of CPUs execute processing under a single OS. May be applied.
In the present embodiment, the collection item 2002 (see FIG. 2) of the operation performance data stored in the
1 コンピューティングシステム
100 性能監視サーバ
110 制御手段
111 業務実行通知管理部(収集命令取得手段)
112 収集項目配布部(収集項目配布手段)
113 稼動性能データ取得部(稼動性能データ取得手段)
120 記憶手段
121 収集項目リスト
122 収集ホストリスト
123 稼動性能データ
200 業務マネージャ(業務サーバ)
210 業務実行制御部(収集命令生成手段)
220 業務プログラムDB
300 グリッドマネージャ
310 エージェント管理部
320 ホスト情報リストDB
400 グリッドエージェントホスト(計算機)
410 業務プログラム実行部
420 収集項目管理部(収集項目管理手段)
430 稼動性能データ収集部(稼動性能収集手段)
440 収集項目リストDB
500 ネットワーク
DESCRIPTION OF SYMBOLS 1
112 Collection Item Distribution Department (Collection Item Distribution Unit)
113 Operation performance data acquisition unit (operation performance data acquisition means)
120
210 Business execution control unit (collection command generation means)
220 Business Program DB
300
400 Grid agent host (computer)
410 Business
430 Operation performance data collection unit (operation performance collection means)
440 Collection Item List DB
500 networks
Claims (7)
前記プログラムを前記計算機に割り当て、割り当てた計算機に前記プログラムの実行を要求する業務サーバと、
前記プログラムの実行環境に関連する稼動性能データを前記計算機から収集し、前記稼動性能データに基づいて前記計算機の性能を監視する性能監視サーバとを含むコンピューティングシステムを用いて、前記稼動性能データ取得する稼動性能データ取得方法であって、
前記業務サーバが、前記割り当てられた当該プログラムを示す業務情報と、そのプログラムを実行する計算機を識別する計算機識別情報とを含み、当該プログラムの収集命令を生成するステップを有し、
前記性能監視サーバが、前記収集命令に含まれる業務情報に対応する収集項目をメモリから読み出して、前記計算機識別情報を有する計算機に配布するステップを有し、
前記計算機が、配布された収集項目に関する稼動性能データを収集するステップを有し、
前記性能監視サーバが、前記収集項目を配布したことによりその収集項目に関する稼動性能データを収集した計算機から、当該収集項目に関する稼動性能データを取得するステップを有することを特徴とする稼動性能データ取得方法。 A plurality of computers that execute various programs;
A business server that assigns the program to the computer and requests the assigned computer to execute the program;
The operational performance data acquisition is performed using a computing system including a performance monitoring server that collects operational performance data related to the execution environment of the program from the computer and monitors the performance of the computer based on the operational performance data. An operation performance data acquisition method for
The business server includes business information indicating the assigned program and computer identification information for identifying a computer that executes the program, and generating a collection instruction for the program,
The performance monitoring server has a step of reading a collection item corresponding to business information included in the collection command from a memory and distributing it to a computer having the computer identification information;
The computer has a step of collecting operational performance data relating to a distributed collection item;
An operation performance data acquisition method comprising the step of acquiring operation performance data related to the collection item from a computer that has collected the operation performance data related to the collection item by distributing the collection item. .
前記プログラムを示す業務情報と、そのプログラムを実行する計算機を識別する計算機識別情報とを含み、当該プログラムの収集命令を取得する収集命令取得手段と、
この収集命令に含まれる業務情報に対応する収集項目をメモリから読み出して、前記計算機識別情報を有する計算機に配布する収集項目配布手段と、
前記収集項目を配布したことによりその収集項目に関する稼動性能データを収集した計算機から、当該収集項目に関する稼動性能データを取得する稼動性能データ取得手段と、
を備えることを特徴とする性能監視サーバ。 A performance monitoring server that collects operation performance data related to the execution environment of the program from a plurality of computers that execute various programs, and monitors the performance of the computer based on the operation performance data,
Collection instruction acquisition means for acquiring the collection instruction of the program, including business information indicating the program, and computer identification information for identifying a computer executing the program;
A collection item distribution means for reading out a collection item corresponding to the business information included in the collection command from the memory and distributing it to the computer having the computer identification information;
Operating performance data acquisition means for acquiring operating performance data related to the collected item from a computer that has collected operating performance data related to the collected item by distributing the collected item;
A performance monitoring server comprising:
前記割り当てられた当該プログラムを示す業務情報と、そのプログラムを実行する計算機を識別する計算機識別情報とを含み、当該プログラムの収集命令を生成し、生成した収集命令を請求項3に記載の性能監視サーバに通知する収集命令生成手段を備えることを特徴とする業務サーバ。 A business server that assigns various programs to a plurality of computers and requests the assigned computers to execute the programs,
4. The performance monitoring according to claim 3, comprising business information indicating the assigned program and computer identification information for identifying a computer that executes the program, generating a collection command for the program, A business server comprising collection command generation means for notifying a server.
前記プログラムの実行環境に関連する稼動性能データを収集する稼動性能収集手段と、
請求項3に記載の性能監視サーバから配布された収集項目を取得し、取得した収集項目に関する稼動性能データを前記性能監視サーバに通知する収集項目管理手段と、
を備えることを特徴とする計算機。 A computer that executes various assigned programs,
Operational performance collection means for collecting operational performance data related to the execution environment of the program;
Collection item management means for acquiring collection items distributed from the performance monitoring server according to claim 3 and notifying the performance monitoring server of operational performance data related to the acquired collection items;
A computer comprising:
前記プログラムを前記計算機に割り当て、割り当てた計算機に前記プログラムの実行を要求すると共に、前記割り当てられた当該プログラムを示す業務情報と、そのプログラムを実行する計算機を識別する計算機識別情報とを含み、当該プログラムの収集命令を生成する業務サーバと、
前記収集命令に基づいて、前記プログラムの実行環境に関連する稼動性能データを前記計算機から収集し、前記稼動性能データに基づいて前記計算機の性能を監視する性能監視サーバとを含むコンピューティングシステムであって、
前記性能監視サーバは、
前記収集命令に含まれる業務情報に対応する収集項目をメモリから読み出して、前記計算機識別情報を有する計算機に配布する収集項目配布手段と、
前記収集項目を配布したことによりその収集項目に関する稼動性能データを収集した計算機から、当該収集項目に関する稼動性能データを取得する稼動性能データ取得手段と、
を有することを特徴とするコンピューティングシステム。 A plurality of computers that execute various programs;
The program is assigned to the computer, the assigned computer is requested to execute the program, and includes business information indicating the assigned program, and computer identification information for identifying a computer that executes the program, A business server that generates program collection instructions;
A performance monitoring server that collects operation performance data related to the execution environment of the program from the computer based on the collection command and monitors the performance of the computer based on the operation performance data. And
The performance monitoring server
A collection item distribution means for reading a collection item corresponding to the business information included in the collection command from a memory and distributing the collection item to a computer having the computer identification information;
Operating performance data acquisition means for acquiring operating performance data related to the collected item from a computer that has collected operating performance data related to the collected item by distributing the collected item;
A computing system comprising:
前記プログラムの実行環境に関連する稼動性能データを前記計算機から収集し、前記稼動性能データに基づいて前記計算機の性能を監視する性能監視サーバとを含むコンピューティングシステムであって、
前記性能監視サーバは、
前記プログラムを示す業務情報と、そのプログラムを実行する計算機を識別する計算機識別情報とを含み、当該プログラムの収集命令を取得する収集命令取得手段と、
この収集命令に含まれる業務情報に対応する収集項目をメモリから読み出して、前記計算機識別情報を有する計算機に配布する収集項目配布手段と、
前記収集項目を配布したことによりその収集項目に関する稼動性能データを収集した計算機から、当該収集項目に関する稼動性能データを取得する稼動性能データ取得手段と、
を有することを特徴とするコンピューティングシステム。 A plurality of computers that execute various assigned programs;
A performance monitoring server that collects operational performance data related to the execution environment of the program from the computer and monitors the performance of the computer based on the operational performance data;
The performance monitoring server
Collection instruction acquisition means for acquiring the collection instruction of the program, including business information indicating the program, and computer identification information for identifying a computer executing the program;
A collection item distribution means for reading out a collection item corresponding to the business information included in the collection command from the memory and distributing it to the computer having the computer identification information;
Operating performance data acquisition means for acquiring operating performance data related to the collected item from a computer that has collected operating performance data related to the collected item by distributing the collected item;
A computing system comprising:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005169474A JP2006344025A (en) | 2005-06-09 | 2005-06-09 | Operation performance data acquisition method, performance monitor server, work server, computer, and computing system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005169474A JP2006344025A (en) | 2005-06-09 | 2005-06-09 | Operation performance data acquisition method, performance monitor server, work server, computer, and computing system |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006344025A true JP2006344025A (en) | 2006-12-21 |
Family
ID=37640947
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005169474A Pending JP2006344025A (en) | 2005-06-09 | 2005-06-09 | Operation performance data acquisition method, performance monitor server, work server, computer, and computing system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2006344025A (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012234336A (en) * | 2011-04-28 | 2012-11-29 | Internatl Business Mach Corp <Ibm> | Method and system for executing monitoring-target process |
JP2014515522A (en) * | 2011-05-20 | 2014-06-30 | マイクロソフト コーポレーション | Mutual cloud management and fault diagnosis |
-
2005
- 2005-06-09 JP JP2005169474A patent/JP2006344025A/en active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012234336A (en) * | 2011-04-28 | 2012-11-29 | Internatl Business Mach Corp <Ibm> | Method and system for executing monitoring-target process |
US8914488B2 (en) | 2011-04-28 | 2014-12-16 | International Business Machines Corporation | Method and system for monitoring a monitoring-target process |
US10068015B2 (en) | 2011-04-28 | 2018-09-04 | International Business Machines Corporation | Monitoring a monitoring-target process |
JP2014515522A (en) * | 2011-05-20 | 2014-06-30 | マイクロソフト コーポレーション | Mutual cloud management and fault diagnosis |
US10009238B2 (en) | 2011-05-20 | 2018-06-26 | Microsoft Technology Licensing, Llc | Cross-cloud management and troubleshooting |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9471455B2 (en) | System, method, and computer program product for managing software updates | |
US7979407B2 (en) | Publication of informational messages to software applications in a computing environment | |
US9015316B2 (en) | Correlation of asynchronous business transactions | |
JP6048038B2 (en) | Information processing apparatus, program, and information processing method | |
JP5008991B2 (en) | Apparatus and method for controlling data recovery | |
US20170228296A1 (en) | Hierarchical system manager rollback | |
JP4479284B2 (en) | Management computer and system for setting up monitoring of computer system | |
JP2004280780A (en) | Back up method, system, and program | |
JP2009288836A (en) | System failure recovery method of virtual server, and its system | |
US20080059735A1 (en) | Method of improving efficiency of replication monitoring | |
JP2010092464A (en) | Method, system and computer program, for performing two-way orphan reconciliation in hierarchical storage management (hsm) control storage environment | |
US10430119B2 (en) | Mechanism for multiple coexisting configurations support in virtual tape applications | |
US20130159255A1 (en) | Storage system and method for controlling storage system | |
US8032490B2 (en) | Storage system operable to perform LU auditing | |
JP2009217587A (en) | Batch processing device and method | |
JP2006252459A (en) | Monitoring device and monitoring method | |
JP2006344025A (en) | Operation performance data acquisition method, performance monitor server, work server, computer, and computing system | |
JP6581304B2 (en) | Field system | |
US20160004584A1 (en) | Method and computer system to allocate actual memory area from storage pool to virtual volume | |
WO2014010047A1 (en) | Management system and information acquisition method | |
WO2017168578A1 (en) | Data processing system and data processing method | |
JP6568232B2 (en) | Computer system and device management method | |
JP6585283B2 (en) | Data processing system and data processing method | |
US20240134657A1 (en) | Self-healing data protection system automatically determining attributes for matching to relevant scripts | |
US20210133056A1 (en) | Method and system for efficiently handling backup discovery operations |