JP2006344025A - Operation performance data acquisition method, performance monitor server, work server, computer, and computing system - Google Patents

Operation performance data acquisition method, performance monitor server, work server, computer, and computing system Download PDF

Info

Publication number
JP2006344025A
JP2006344025A JP2005169474A JP2005169474A JP2006344025A JP 2006344025 A JP2006344025 A JP 2006344025A JP 2005169474 A JP2005169474 A JP 2005169474A JP 2005169474 A JP2005169474 A JP 2005169474A JP 2006344025 A JP2006344025 A JP 2006344025A
Authority
JP
Japan
Prior art keywords
collection
computer
performance data
program
business
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005169474A
Other languages
Japanese (ja)
Inventor
Shuhei Sakai
周平 境
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2005169474A priority Critical patent/JP2006344025A/en
Publication of JP2006344025A publication Critical patent/JP2006344025A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a technology for acquiring operation performance related to execution of a program automatically. <P>SOLUTION: In the operation performance data acquisition method: a work manager 200 has a step for generating a collection instruction with respect to work application including a name of work and a name of a host; a performance monitor server 100 has a step for distributing to a grid agent host 400 having the name of the host a collection item corresponding to the name of the work included in the collection instruction; the grid agent host 400 has a step for executing the work application and collecting the operation performance data related to the distributed collection item; and the performance monitor server 100 has a step for acquiring from the grid agent host 400 the operation performance data related to the distributed collection item. <P>COPYRIGHT: (C)2007,JPO&INPIT

Description

本発明は、プログラムを実行する計算機が動的に割り当てられるシステムにおいて用いられる技術に関する。   The present invention relates to a technique used in a system in which computers that execute programs are dynamically allocated.

近年、業務アプリケーションプログラムを実行する計算機が動的に割り当てられるシステムの1つとして、グリッド・コンピューティングシステムを用いた業務アプリケーションプログラムの処理(以下、グリッドコンピューティング処理という)が、安価な端末でスーパーコンピュータに匹敵する処理性能を得ることができることから注目されている。このグリッドコンピューティング処理では、業務アプリケーションプログラムを実行する最適な計算機を業務アプリケーションプログラムの実行時に割り当て、各計算機を効率よく利用する。
このような状況下、従来、管理者等が、業務アプリケーションプログラムを実行する計算機までの通信経路(IPアドレス等)を特定することにより、この計算機の性能を監視し、計算機の性能を改善する方法が知られている(例えば、特許文献1、特許文献2参照)。
特開平5−242034号公報(段落0013〜0027、図2) 特開2004−302741号公報(段落0020〜0042、図1)
In recent years, as one of systems in which computers that execute business application programs are dynamically allocated, processing of business application programs using a grid computing system (hereinafter referred to as grid computing processing) is superposed on an inexpensive terminal. It is attracting attention because it can obtain processing performance comparable to computers. In this grid computing process, an optimal computer that executes a business application program is allocated when the business application program is executed, and each computer is used efficiently.
Under such circumstances, conventionally, an administrator or the like has identified a communication path (such as an IP address) to a computer that executes a business application program, thereby monitoring the performance of the computer and improving the performance of the computer. Is known (see, for example, Patent Document 1 and Patent Document 2).
Japanese Patent Laid-Open No. 5-242034 (paragraphs 0013 to 0027, FIG. 2) Japanese Patent Laying-Open No. 2004-302741 (paragraphs 0020 to 0042, FIG. 1)

しかしながら、特許文献1に開示された方法では、業務アプリケーションプログラムを実行する計算機に関して、エラーパケット数やキャッシュヒット率といった稼動性能データを収集しないので、計算機の性能監視を充分に行うことができない。   However, the method disclosed in Patent Document 1 does not collect operation performance data such as the number of error packets and a cache hit rate for a computer that executes a business application program, and therefore cannot sufficiently monitor the performance of the computer.

また、特許文献2に開示された方法では、グリッドコンピューティング処理において、業務アプリケーションプログラムを実行する計算機に関して、CPU使用率やメモリ使用率、ハードディスク使用率を考慮して稼動しているが、各計算機は、主処理装置によって分割された演算処理(バイオ,物理,設計,金融などに関するデータ解析のための計算)を行うものである。しかし、例えばWebショッピングシステムにおける各種サーバ機能(Webサーバ、アプリケーションサーバ、データベースサーバ等)の特性を考慮していないので、このようなシステムにおけるサーバの性能監視を充分に行うことができない。   Further, in the method disclosed in Patent Document 2, the computer that executes the business application program is operating in consideration of the CPU usage rate, the memory usage rate, and the hard disk usage rate in the grid computing process. Performs arithmetic processing (calculation for data analysis related to biotechnology, physics, design, finance, etc.) divided by the main processor. However, for example, since the characteristics of various server functions (Web server, application server, database server, etc.) in the Web shopping system are not taken into consideration, the performance of the server in such a system cannot be sufficiently monitored.

また、特許文献1に開示された方法において、たとえ稼動性能データを収集するとしても、業務アプリケーションプログラムが計算機に割り当てられた後、ユーザが業務アプリケーションプログラム監視用のサーバを用いて、監視対象とする計算機までの通信経路を手作業で設定する必要がある。そのため、業務アプリケーションプログラムを実行する計算機が多数ある場合に、その設定は困難であった。   Further, in the method disclosed in Patent Document 1, even if operating performance data is collected, after a business application program is assigned to a computer, a user uses a business application program monitoring server as a monitoring target. It is necessary to manually set the communication path to the computer. Therefore, setting is difficult when there are many computers that execute business application programs.

そこで、本発明では、前記した問題を解決し、プログラムの実行に関する稼動性能を自動的に取得する技術を提供することを目的とする。   Therefore, an object of the present invention is to provide a technique for solving the above-described problems and automatically acquiring operation performance related to program execution.

本発明は、前記課題を解決するために創案されたものであり、稼動性能データ取得方法において、各種のプログラムを実行する複数の計算機と、前記プログラムを前記計算機に割り当て、割り当てた計算機に前記プログラムの実行を要求する業務サーバと、前記プログラムの実行環境に関連する稼動性能データを前記計算機から収集し、前記稼動性能データに基づいて前記計算機の性能を監視する性能監視サーバとを含むコンピューティングシステムを用いて、前記稼動性能データ取得する稼動性能データ取得方法であって、前記業務サーバが、前記割り当てられた当該プログラムを示す業務情報と、そのプログラムを実行する計算機を識別する計算機識別情報とを含み、当該プログラムの収集命令を生成するステップを有し、前記性能監視サーバが、前記収集命令に含まれる業務情報に対応する収集項目をメモリから読み出して、前記計算機識別情報を有する計算機に配布するステップを有し、前記計算機が、配布された収集項目に関する稼動性能データを収集するステップを有し、前記性能監視サーバが、前記収集項目を配布したことによりその収集項目に関する稼動性能データを収集した計算機から、当該収集項目に関する稼動性能データを取得するステップを有することとした。   The present invention was devised to solve the above-described problem, and in an operation performance data acquisition method, a plurality of computers that execute various programs, the program is allocated to the computer, and the program is assigned to the allocated computer. A computing system comprising: a business server that requests execution of the program; and a performance monitoring server that collects operational performance data related to the execution environment of the program from the computer and monitors the performance of the computer based on the operational performance data The operation performance data acquisition method for acquiring the operation performance data, wherein the business server includes business information indicating the assigned program and computer identification information for identifying a computer executing the program. Including the step of generating a collection instruction for the program, the performance monitoring A server reads out a collection item corresponding to the business information included in the collection command from a memory and distributes the collected item to a computer having the computer identification information, and the computer has an operation performance related to the distributed collection item. A step of collecting data, and the performance monitoring server has a step of acquiring operation performance data relating to the collection item from a computer that has collected the operation performance data relating to the collection item by distributing the collection item. It was.

本発明によれば、プログラムの実行に関する稼動性能を自動的に取得することができる。   According to the present invention, it is possible to automatically acquire operation performance related to program execution.

次に、本発明の実施形態について、適宜図面を参照しながら詳細に説明する。
(コンピューティングシステムの構成)
図1は、本発明の実施形態に係るコンピューティングシステムの構成例を示す図である。図1に示すように、このコンピューティングシステム1では、性能監視サーバ100と、業務マネージャ(業務サーバ)200と、グリッドマネージャ(グリッドサーバ)300と、複数(図では3つ)のグリッドエージェントホスト400が、ネットワーク500を介して接続されている。このネットワーク500は、例えばインターネットなどである。コンピューティングシステム1は、所定の業務アプリケーションプログラム(以下、単に業務アプリケーションという)を実行する複数のグリッドエージェントホスト400から、業務アプリケーションの実行に関する稼動性能データを収集するグリッド・コンピューティングシステムである。
本明細書において、業務アプリケーションを含む各種プログラムは、オブジェクト、スレッド、プロセスで実現してもよい。
Next, embodiments of the present invention will be described in detail with reference to the drawings as appropriate.
(Computing system configuration)
FIG. 1 is a diagram illustrating a configuration example of a computing system according to an embodiment of the present invention. As shown in FIG. 1, the computing system 1 includes a performance monitoring server 100, a business manager (business server) 200, a grid manager (grid server) 300, and a plurality (three in the figure) of grid agent hosts 400. Are connected via the network 500. This network 500 is, for example, the Internet. The computing system 1 is a grid computing system that collects operational performance data related to execution of business applications from a plurality of grid agent hosts 400 that execute predetermined business application programs (hereinafter simply referred to as business applications).
In this specification, various programs including business applications may be realized by objects, threads, and processes.

これらの各装置100,200,300,400は、一般的なコンピュータ(計算機)であり、例えば、CPU(Central Processing Unit)と、RAM(Random Access Memory)と、ROM(Read Only Memory)と、HDD(Hard Disk Drive)と、KB/CRT(Key Board/Cathode Ray Tube)と、通信インタフェースとを含んで構成されている。なお、図1では、性能監視サーバ100と、業務マネージャ200と、グリッドマネージャ300をそれぞれ独立なサーバとして示しているが、これらのサーバは、1台の計算機で構成されていてもよい。
以下に、各装置100〜400の機能を詳細に説明する。
Each of these devices 100, 200, 300, and 400 is a general computer (computer), for example, a CPU (Central Processing Unit), a RAM (Random Access Memory), a ROM (Read Only Memory), and an HDD. (Hard Disk Drive), KB / CRT (Key Board / Cathode Ray Tube), and a communication interface. In FIG. 1, the performance monitoring server 100, the business manager 200, and the grid manager 300 are shown as independent servers, but these servers may be configured by a single computer.
Below, the function of each apparatus 100-400 is demonstrated in detail.

[性能監視サーバの機能]
性能監視サーバ100は、業務アプリケーションを実行する複数のグリッドエージェントホスト400から、業務アプリケーションの実行環境に関連する稼動性能データを収集し、この稼動性能データに基づいてグリッドエージェントホスト400の性能を監視するものであって、主として制御手段(CPU等)110と、記憶手段(RAM等)120とを含んで構成される。
[Performance monitoring server functions]
The performance monitoring server 100 collects operation performance data related to the execution environment of the business application from a plurality of grid agent hosts 400 that execute the business application, and monitors the performance of the grid agent host 400 based on the operation performance data. It mainly includes a control means (CPU or the like) 110 and a storage means (RAM or the like) 120.

制御手段110は、プログラムの実行に従って機能する業務実行通知管理部111と、収集項目配布部112と、稼動性能データ取得部113とを含み、記憶手段120には、収集項目リスト121と、収集ホストリスト122と、稼動性能データ123とが記憶される。   The control unit 110 includes a business execution notification management unit 111, a collection item distribution unit 112, and an operation performance data acquisition unit 113 that function according to program execution. The storage unit 120 includes a collection item list 121, a collection host, and the like. A list 122 and operating performance data 123 are stored.

業務実行通知管理部(収集命令取得手段)111は、業務マネージャ200から、稼動性能データの取得タイミングに関する命令として、収集開始要求(収集命令)、収集完了要求等を受け取るものである。
収集開始要求は、業務アプリケーションの実行開始を意味し、実行する業務名(業務情報)及び使用するグリッドエージェントホスト400を識別するための名称(ホスト名:計算機識別情報)を含んでいる。
収集完了要求は、収集を完了する業務名及び使用したグリッドエージェントホスト400の名称(ホスト名)を含んでいる。
The business execution notification management unit (collection command acquisition means) 111 receives a collection start request (collection command), a collection completion request, and the like from the business manager 200 as commands related to the acquisition timing of operation performance data.
The collection start request means the start of execution of a business application, and includes a business name to be executed (business information) and a name (host name: computer identification information) for identifying the grid agent host 400 to be used.
The collection completion request includes the business name for completing collection and the name (host name) of the grid agent host 400 used.

収集項目配布部(収集項目配布手段)112は、業務名に対して予め定められた稼動性能データの収集項目を、収集開始要求に含まれるホスト名で識別されるグリッドエージェントホスト400(業務アプリケーションが割り当てられたグリッドエージェントホスト400)に対し、配布するものである。   The collection item distribution unit (collection item distribution means) 112 is a grid agent host 400 (business application is identified by the host name included in the collection start request) that collects performance performance data collection items predetermined for the business name. It is distributed to the assigned grid agent host 400).

稼動性能データ取得部(稼動性能データ取得手段)113は、稼動性能データの収集項目を配布されたグリッドエージェントホスト400(業務アプリケーションが割り当てられたグリッドエージェントホスト400)から、配布された収集項目で特定される稼動性能データを取得し、記憶手段120に蓄積するものである。   The operation performance data acquisition unit (operation performance data acquisition means) 113 specifies the collection items distributed from the grid agent host 400 to which the collection items of operation performance data have been distributed (the grid agent host 400 to which the business application is assigned). Operation performance data is acquired and stored in the storage means 120.

収集項目リスト121は、業務アプリケーション及び収集すべき稼動性能データの収集項目に関する情報である。
収集ホストリスト122は、稼動性能データの収集項目をどのグリッドエージェントホスト400から収集するかを示す情報である。
稼動性能データ123は、グリッドエージェントホスト400のハードウェア、OS、プログラムの稼動情報などを収集したデータである。なお、この稼動性能データ123を、収集項目リスト121等と合わせて、業務アプリケーションと関連付けるようにしてもよい。
The collection item list 121 is information related to collection items of business applications and operation performance data to be collected.
The collection host list 122 is information indicating from which grid agent host 400 the collection items of the operation performance data are collected.
The operation performance data 123 is data obtained by collecting hardware, OS, and program operation information of the grid agent host 400. The operation performance data 123 may be associated with the business application together with the collection item list 121 and the like.

[業務マネージャの機能]
業務マネージャ200は、各種の業務アプリケーションを複数のグリッドエージェントホスト400に割り当て、割り当てたグリッドエージェントホスト400に業務アプリケーションの実行を要求すると共に、性能監視サーバ100に対して、割り当てられた業務アプリケーションの収集開始要求(収集命令)を通知するものであって、業務実行制御部210と、業務プログラムDB220とを含んで構成される。
[Functions of business manager]
The business manager 200 assigns various business applications to the plurality of grid agent hosts 400, requests the assigned grid agent host 400 to execute the business applications, and collects the assigned business applications to the performance monitoring server 100. It notifies a start request (collection command), and includes a business execution control unit 210 and a business program DB 220.

業務実行制御部(収集命令生成手段)210は、業務アプリケーションの業務名(業務情報)及び使用するグリッドエージェントホスト400を識別するための名称(ホスト名:計算機識別情報)を含んだ収集開始要求(収集命令)を生成するものである。また、業務実行制御部210は、業務アプリケーションの実行のために、性能監視サーバ100、グリッドマネージャ300、及びグリッドエージェントホスト400との間で、以下のような必要な命令及びデータ等の送受信を行う。   The business execution control unit (collection command generation means) 210 includes a business application business name (business information) and a collection start request (host name: computer identification information) for identifying the grid agent host 400 to be used (host name: computer identification information). Collection instruction). The business execution control unit 210 transmits and receives the following necessary commands and data to and from the performance monitoring server 100, the grid manager 300, and the grid agent host 400 in order to execute business applications. .

業務実行制御部210は、業務アプリケーションを実行するグリッドエージェントホスト400の決定を依頼する命令(ホスト取得要求)を、グリッドマネージャ300に通知する。
業務実行制御部210は、決定されたグリッドエージェントホスト400に対し、業務アプリケーションの実行要求(業務実行)と、その業務アプリケーションを実行するための業務プログラム(ファイル)とを配布する。
業務実行制御部210は、稼動性能データの取得タイミングに関する命令として、収集開始要求(収集命令)、収集完了要求等を性能監視サーバ100に通知する。
業務プログラムDB220は、業務プログラムデータ等を記憶するものである。
The business execution control unit 210 notifies the grid manager 300 of an instruction (host acquisition request) for requesting determination of the grid agent host 400 that executes the business application.
The business execution control unit 210 distributes a business application execution request (business execution) and a business program (file) for executing the business application to the determined grid agent host 400.
The business execution control unit 210 notifies the performance monitoring server 100 of a collection start request (collection command), a collection completion request, and the like as commands related to operation performance data acquisition timing.
The business program DB 220 stores business program data and the like.

[グリッドマネージャの機能]
グリッドマネージャ300は、業務アプリケーションを実行する(業務プログラムを実行する)グリッドエージェントホスト400を決定するものであり、エージェント管理部310と、ホスト情報リストDB320とを含んで構成される。
[Grid Manager functions]
The grid manager 300 determines a grid agent host 400 that executes a business application (executes a business program), and includes an agent management unit 310 and a host information list DB 320.

エージェント管理部310は、業務マネージャ200からホスト取得要求を受けたとき、最適なグリッドエージェントホスト400を、グリッドエージェントホスト400の一覧を示すデータであるホスト情報リストから選択する(割り当てる)ものである。
ホスト情報リストDB320は、ホスト情報リストを記憶するものである。
When the agent management unit 310 receives a host acquisition request from the business manager 200, the agent management unit 310 selects (assigns) an optimal grid agent host 400 from a host information list that is data indicating a list of grid agent hosts 400.
The host information list DB 320 stores a host information list.

[グリッドエージェントホストの機能]
グリッドエージェントホスト(計算機)400は、業務アプリケーションを実行する(業務プログラムを実行する)ものであり、業務プログラム実行部410と、収集項目管理部420と、稼動性能データ収集部430と、収集項目リストDB440とを含んで構成される。
[Grid agent host functions]
The grid agent host (computer) 400 executes a business application (executes a business program), and includes a business program execution unit 410, a collection item management unit 420, an operation performance data collection unit 430, and a collection item list. DB440 is comprised.

業務プログラム実行部410は、業務マネージャ200から配布された業務プログラムを実行処理し、所定の処理結果を業務マネージャ200に返信するものである。
収集項目管理部(収集項目管理手段)420は、性能監視サーバ100から配布された収集項目を取得し、取得した収集項目に関する稼動性能データを性能監視サーバ100に通知するものである。この収集項目管理部420は、取得した収集項目を収集項目リストDB440に書込むと共に、収集すべき稼動性能データの収集項目を収集項目リストDB440から読み出す。
The business program execution unit 410 executes a business program distributed from the business manager 200 and returns a predetermined processing result to the business manager 200.
The collection item management unit (collection item management means) 420 acquires the collection items distributed from the performance monitoring server 100 and notifies the performance monitoring server 100 of the performance data related to the acquired collection items. The collection item management unit 420 writes the collected collection items to the collection item list DB 440 and reads the collection items of the operation performance data to be collected from the collection item list DB 440.

稼動性能データ収集部(稼動性能収集手段)430は、収集項目リストDB440に書込まれた収集項目に基づいて、業務アプリケーションの実行環境に関連する稼動性能データを定期的に収集するものである。
収集項目リストDB440は、性能監視サーバ100から配布された収集項目を記憶するものである。
The operation performance data collection unit (operation performance collection means) 430 periodically collects operation performance data related to the execution environment of the business application based on the collection items written in the collection item list DB 440.
The collection item list DB 440 stores the collection items distributed from the performance monitoring server 100.

[収集項目リストの具体例]
図2は、収集項目リストの一例を示す図である。収集項目リスト121は、図2に示すように、業務名2001と、収集項目2002と、状態2003と、データID2004とを有する。
業務名2001で特定されるすべての業務アプリケーションは、業務マネージャ200が実行するものを指す。例えば、図2では、業務マネージャ200は、「WebサーバA」、「アプリケーションサーバB」及び「データベースサーバC」の業務名で指定された3つの業務を実行する。この場合、3台のグリッドエージェントホスト400が、3つの業務で指定された業務プログラムをそれぞれ実行することにより、「WebサーバA」、「アプリケーションサーバB」及び「データベースサーバC」としての機能を発揮することを意味する。なお、業務名2001は、一意に業務アプリケーションを識別できるものであればよく、例えば数値や文字列からなる業務IDなどの値でもよい。
[Specific example of collection item list]
FIG. 2 is a diagram illustrating an example of the collection item list. As illustrated in FIG. 2, the collection item list 121 includes a business name 2001, a collection item 2002, a status 2003, and a data ID 2004.
All the business applications specified by the business name 2001 indicate those executed by the business manager 200. For example, in FIG. 2, the business manager 200 executes three businesses specified by the business names of “Web server A”, “application server B”, and “database server C”. In this case, the three grid agent hosts 400 each function as “Web server A”, “application server B”, and “database server C” by executing the business programs specified in the three businesses. It means to do. The business name 2001 may be anything that can uniquely identify a business application, and may be a value such as a business ID composed of a numerical value or a character string, for example.

収集項目2002は、業務名2001で特定される業務アプリケーションについて、どんな内容を有する稼動性能データを収集するのかを示したものであり、予め定められている。図2では、エラーパケット数、トランザクション時間、キャッシュヒット率が例示されているが、例えば、CPU使用率やメモリ使用率、ハードディスク使用率等の内容を収集項目としてもよい。   The collection item 2002 indicates what kind of contents of operation performance data is collected for the business application specified by the business name 2001, and is predetermined. In FIG. 2, the number of error packets, the transaction time, and the cache hit rate are illustrated. However, for example, contents such as a CPU usage rate, a memory usage rate, and a hard disk usage rate may be collected items.

状態2003は、対応する業務アプリケーションについての収集状態を示すものである。例えば、初期状態は「未収集」、収集を開始した状態では「収集中」、収集を完了した状態では「収集完了」に設定される。
データID2004は、収集項目2002と、収集項目リスト121以外のデータを各収集項目ごとに一意に割り当てるものである。
なお、収集項目リスト121には、収集間隔、収集期間、収集項目の閾値越え(上限値)等の条件によるイベント通知条件などを設定してもよい。
A status 2003 indicates a collection status for the corresponding business application. For example, the initial state is set to “uncollected”, “collecting” when collection is started, and “collection completed” when collection is completed.
The data ID 2004 uniquely assigns data other than the collection item 2002 and the collection item list 121 to each collection item.
In the collection item list 121, an event notification condition based on conditions such as a collection interval, a collection period, and a collection item exceeding a threshold (upper limit value) may be set.

[収集ホストリストの具体例]
図3は、収集ホストリストの一例を示す図である。収集ホストリスト122は、図3に示すように、データID3001と、ホスト名3002とを有する。
データID3001は、収集項目リスト121(図2参照)のデータID2004と同様のIDである。これを用いて、どの収集項目(図2参照)に関するデータであるかを特定することができる。
ホスト名3002は、稼動性能データを収集したグリッドエージェントホスト400を特定するものである。このホスト名3002には、図3に示したように「HostA」,「HostC」等の値の他に、例えばIPアドレスやMACアドレス等の値を指定するようにしてもよい。
[Specific example of collection host list]
FIG. 3 is a diagram illustrating an example of the collection host list. The collection host list 122 has a data ID 3001 and a host name 3002 as shown in FIG.
The data ID 3001 is the same ID as the data ID 2004 of the collection item list 121 (see FIG. 2). Using this, it is possible to specify which collection item (see FIG. 2) the data is related to.
The host name 3002 identifies the grid agent host 400 that has collected the performance data. As the host name 3002, as shown in FIG. 3, in addition to values such as “Host A” and “Host C”, values such as an IP address and a MAC address may be designated.

[稼動性能データの具体例]
図4は、稼動性能データの一例を示す図である。稼動性能データ123は、図4に示すように、データID4001と、ホスト名4002と、時間4003と、値4004とを有する。
データID4001は、収集項目リスト121(図2参照)のデータID2004と同様のIDである。これを用いて、どの収集項目(図2参照)に関するデータであるかを特定することができる。
ホスト名4002は、収集ホストリスト122(図3参照)のホスト名3002と同様の内容であり、グリッドエージェントホスト400を特定するものである。
時間4003は、データID4001に対応するデータを収集した時間(例えば、年月日と時刻)である。
値4004は、対応するデータについての稼動性能データを表す具体的な値(エラーパケット数等)である。
[Specific examples of operational performance data]
FIG. 4 is a diagram illustrating an example of operation performance data. As shown in FIG. 4, the operational performance data 123 includes a data ID 4001, a host name 4002, a time 4003, and a value 4004.
The data ID 4001 is the same ID as the data ID 2004 of the collection item list 121 (see FIG. 2). Using this, it is possible to specify which collection item (see FIG. 2) the data is related to.
The host name 4002 has the same contents as the host name 3002 in the collection host list 122 (see FIG. 3), and identifies the grid agent host 400.
The time 4003 is a time (for example, date and time) when data corresponding to the data ID 4001 is collected.
A value 4004 is a specific value (such as the number of error packets) that represents operation performance data for the corresponding data.

図4に示した例では、例えば「HostA」で指定されたグリッドエージェントホスト400は、「0002」のデータIDで特定されるデータの収集項目(トランザクション時間:図2参照)の値として、10分間隔(時間4003の項目参照)で、「223」,「232」,「231」を稼動性能データとして収集したことが示されている。また、「HostB」及び「HostC」は、「0003」のデータIDで特定されるデータの収集項目(キャッシュヒット率:図2参照)の値として、「96」,「82」を稼動性能データとして、同時間にそれぞれ収集したことが示されている。   In the example shown in FIG. 4, for example, the grid agent host 400 specified by “Host A” has 10 minutes as the value of the data collection item (transaction time: see FIG. 2) specified by the data ID “0002”. It is shown that “223”, “232”, and “231” are collected as operation performance data at intervals (see the item of time 4003). “Host B” and “Host C” are values of data collection items (cache hit rate: see FIG. 2) specified by the data ID “0003”, and “96” and “82” are operating performance data. , Each collected in the same time.

[業務プログラムDBの具体例]
図5は、業務プログラムDBの一例を示す図である。図5では、業務名5001と、ホスト名5002と、業務プログラムデータ5003とを有する。
業務名5001は、収集項目リスト121(図2参照)における業務名2001と同様の内容である。
ホスト名5002は、収集ホストリスト122(図3参照)のホスト名3002と同様の内容であり、業務プログラムを実行するグリッドエージェントホスト400を特定するものである。
業務プログラムデータ5003は、対応する業務アプリケーションを構成するプロセスやスレッドなどのプログラムの関連性や実行順序などを定義した情報(実行ファイル)を表す。
[Specific example of business program DB]
FIG. 5 is a diagram illustrating an example of the business program DB. 5 includes a business name 5001, a host name 5002, and business program data 5003.
The business name 5001 has the same contents as the business name 2001 in the collection item list 121 (see FIG. 2).
The host name 5002 has the same contents as the host name 3002 in the collection host list 122 (see FIG. 3), and identifies the grid agent host 400 that executes the business program.
The business program data 5003 represents information (execution file) that defines the relevance and execution order of programs such as processes and threads constituting the corresponding business application.

図5では、例えば「アプリケーションサーバB」の業務名は、グリッドマネージャ300によって、ホスト名「HostA」のグリッドエージェントホスト400に割り当てられていることが示されている。また、業務名5001で特定される業務アプリケーションがグリッドエージェントホスト400に割り当てられていない場合(業務名「Webサーバ」)、ホスト名5002に空欄(NULL)が設定される。   In FIG. 5, for example, it is indicated that the business name of “application server B” is assigned by the grid manager 300 to the grid agent host 400 with the host name “HostA”. When the business application identified by the business name 5001 is not assigned to the grid agent host 400 (business name “Web server”), a blank (NULL) is set in the host name 5002.

[ホスト情報リストDBの具体例]
図6は、ホスト情報リストDBの一例を示す図である。図6では、ホスト名6001と、状態6002とを有する。
ホスト名6001は、収集ホストリスト122(図3参照)のホスト名3002と同様の内容であり、グリッドマネージャ300で管理するグリッドエージェントホスト400を特定するものである。
状態6002は、対応するグリッドエージェントホスト400が業務アプリケーションに使用されているかどうかを示すものである。この状態6002は、エージェント管理部310(図1参照)によって、例えば「使用可能」、「使用中」、「使用不可」などに設定される。
[Specific example of host information list DB]
FIG. 6 is a diagram illustrating an example of the host information list DB. In FIG. 6, it has a host name 6001 and a status 6002.
The host name 6001 has the same contents as the host name 3002 of the collection host list 122 (see FIG. 3), and identifies the grid agent host 400 managed by the grid manager 300.
A state 6002 indicates whether the corresponding grid agent host 400 is used for a business application. This state 6002 is set to, for example, “available”, “in use”, “unusable”, etc. by the agent management unit 310 (see FIG. 1).

[収集項目リストDBの具体例]
図7は、収集項目リストDBの一例を示す図である。図7では、業務名7001と、収集項目7002と、データID7003とを有する。
業務名7001、収集項目7002、及びデータID7003は、収集項目リスト121(図2参照)における業務名2001、収集項目2002、及びデータID2004と同様の内容であり、収集項目リスト121(図2参照)の中からグリッドエージェントホスト400に配布された稼動性能データの収集項目を示している。
[Specific example of collection item list DB]
FIG. 7 is a diagram illustrating an example of the collection item list DB. In FIG. 7, a business name 7001, a collection item 7002, and a data ID 7003 are included.
The business name 7001, the collection item 7002, and the data ID 7003 have the same contents as the business name 2001, the collection item 2002, and the data ID 2004 in the collection item list 121 (see FIG. 2), and the collection item list 121 (see FIG. 2). The collection items of the operation performance data distributed to the grid agent host 400 are shown.

[稼動性能データの収集項目設定動作]
次に、コンピューティングシステム1における稼動性能データの収集項目の設定に関する動作を図8を参照して説明する。図8は、業務マネージャにおける業務アプリケーションの実行に連動した稼動性能データの収集項目の設定の流れを示すシーケンス図である。
[Operational data collection item setting operation]
Next, an operation related to setting of collection items of operation performance data in the computing system 1 will be described with reference to FIG. FIG. 8 is a sequence diagram showing a flow of setting operation performance data collection items linked to execution of a business application in the business manager.

ステップ8001では、業務マネージャ200は、ホスト取得要求として、業務実行制御部210によって、業務アプリケーションを実行するグリッドエージェントホスト400の決定を、ネットワーク500を介してグリッドマネージャ300(エージェント管理部310)に要求する。この要求は、例えばオペレータによる業務マネージャ200の操作により複数の業務アプリケーションを実行させるときに行われる。   In step 8001, the business manager 200 requests the grid manager 300 (agent management unit 310) to determine the grid agent host 400 that executes the business application by the business execution control unit 210 as a host acquisition request via the network 500. To do. This request is made, for example, when a plurality of business applications are executed by an operation of the business manager 200 by an operator.

ステップ8002では、グリッドマネージャ300は、ホスト取得要求を受け、エージェント管理部310によって、ホスト情報リストDB320を参照し、当該業務アプリケーションの実行に最適なグリッドエージェントホスト400を割り当てる。具体的には、エージェント管理部310は、ホスト情報リストDB320(図6参照)を参照し、グリッドエージェントホスト400の状態6002を「使用中」に設定し、このホスト名(6001で指定された値)をネットワーク500を介して業務マネージャ200(業務実行制御部210)に通知する。   In Step 8002, the grid manager 300 receives the host acquisition request, refers to the host information list DB 320 by the agent management unit 310, and assigns the optimal grid agent host 400 for executing the business application. Specifically, the agent management unit 310 refers to the host information list DB 320 (see FIG. 6), sets the status 6002 of the grid agent host 400 to “in use”, and sets the host name (the value specified by 6001). ) To the business manager 200 (business execution control unit 210) via the network 500.

ステップ8003では、業務マネージャ200は、業務実行制御部210によって、通知を受けたホスト名を業務プログラムDB220のホスト名5002(図5参照)に設定する。そして、業務実行制御部210は、収集開始要求(収集命令)を生成し、生成した収集開始要求をネットワーク500を介して性能監視サーバ100(業務実行通知管理部111)に通知する。   In step 8003, the business manager 200 uses the business execution control unit 210 to set the notified host name to the host name 5002 (see FIG. 5) of the business program DB 220. Then, the business execution control unit 210 generates a collection start request (collection command), and notifies the performance monitoring server 100 (business execution notification management unit 111) of the generated collection start request via the network 500.

ステップ8004では、性能監視サーバ100において、業務実行通知管理部111は、通知を受けた収集開始要求に含まれる業務名及びホスト名の値と、稼動性能データの収集項目の条件を作成する指示(条件作成指示ともいう)とを収集項目配布部112に出力する。   In step 8004, in the performance monitoring server 100, the business execution notification management unit 111 instructs to create the business name and host name values included in the received collection start request and conditions for the collection items of the operational performance data ( Is also output to the collection item distribution unit 112.

ステップ8005では、収集項目配布部112(性能監視サーバ100)は、その出力により取得した業務名に基づいて、記憶手段120の収集項目リスト121(図2参照)から、収集項目、業務名及びデータIDの値を抽出し、これらの値を、ステップ8004により取得したホスト名のグリッドエージェントホスト400(収集項目管理部420)に、ネットワーク500を介して配布する。また、収集項目の設定(収集項目設定)をこのグリッドエージェントホスト400に要求する。   In step 8005, the collection item distribution unit 112 (performance monitoring server 100), from the collection item list 121 (see FIG. 2) of the storage unit 120, collects items, business names, and data based on the business names acquired by the output. The ID values are extracted, and these values are distributed via the network 500 to the grid agent host 400 (collection item management unit 420) having the host name acquired in Step 8004. Further, the grid agent host 400 is requested to set collection items (collection item settings).

収集項目の配布が正常に実行された場合、ステップ8006では、当該グリッドエージェントホスト400(収集項目管理部420)は、性能監視サーバ100(収集項目配布部112)に処理の成功を通知する。同様に、ステップ8007では、収集項目配布部112は、業務実行通知管理部111に処理の成功を通知し、ステップ8008では、業務実行通知管理部111(性能監視サーバ100)は、業務マネージャ200(業務実行制御部210)に処理の成功を通知する。   When the collection item distribution is normally executed, in step 8006, the grid agent host 400 (collection item management unit 420) notifies the performance monitoring server 100 (collection item distribution unit 112) of the success of the process. Similarly, in step 8007, the collection item distribution unit 112 notifies the business execution notification management unit 111 of the success of the process, and in step 8008, the business execution notification management unit 111 (performance monitoring server 100) displays the business manager 200 ( The business execution control unit 210) is notified of the success of the processing.

このとき、当該グリッドエージェントホスト400(収集項目管理部420)は、配布を受けた収集項目等の値を収集項目リストDB440に書き込む。
また、性能監視サーバ(業務実行通知管理部111)は、収集項目リスト121(図2参照)において、配布した収集項目の状態2003を「収集中」に変更すると共に、収集ホストリスト122(図3参照)において、ホスト名3002を、収集項目等の値を配布したグリッドエージェントホスト400を示す値に設定する。
At this time, the grid agent host 400 (collection item management unit 420) writes the value of the collected collection item received in the collection item list DB 440.
In addition, the performance monitoring server (business execution notification management unit 111) changes the status 2003 of the collected collection item to “collecting” in the collection item list 121 (see FIG. 2), and also collects the collection host list 122 (FIG. 3). In the reference), the host name 3002 is set to a value indicating the grid agent host 400 to which a value such as a collection item is distributed.

ステップ8009では、業務マネージャ200(業務実行制御部210)は、業務プログラムDB220に設定した値のホスト名のグリッドエージェントホスト400(業務プログラム実行部410)に対し、業務アプリケーションの実行要求(業務実行)と、その業務アプリケーションを実行するための業務プログラムとをネットワーク500を介して配布する。
ステップ8010では、グリッドエージェントホスト400は、実行要求を受け、業務プログラム実行部410によって、業務プログラムを実行処理することにより、所定の処理結果を業務マネージャ200(業務実行制御部210)に通知する。
In step 8009, the business manager 200 (business execution control unit 210) makes a business application execution request (business execution) to the grid agent host 400 (business program execution unit 410) having the host name set in the business program DB 220. And a business program for executing the business application are distributed via the network 500.
In step 8010, the grid agent host 400 receives the execution request and executes the business program by the business program execution unit 410 to notify the business manager 200 (business execution control unit 210) of a predetermined processing result.

ステップ8011では、業務マネージャ200(業務実行制御部210)は、当該業務アプリケーションの稼動性能データの収集の完了を、ネットワーク500を介して性能監視サーバ100(業務実行通知管理部111)に要求する(収集完了要求)。この収集完了要求は、例えば業務マネージャ200において終了命令が入力された場合やグリッドエージェントホスト400において業務アプリケーションが完了した場合等、予め定められた場合に性能監視サーバ100に通知される。   In step 8011, the business manager 200 (business execution control unit 210) requests the performance monitoring server 100 (business execution notification management unit 111) to complete the collection of operation performance data of the business application via the network 500 (step 8011). Collection completion request). This collection completion request is notified to the performance monitoring server 100 when predetermined, for example, when an end command is input in the business manager 200 or a business application is completed in the grid agent host 400.

これにより、性能監視サーバ100(業務実行通知管理部111)は、収集完了要求を受け、収集完了要求に含まれる業務名に基づいて、収集項目リスト121(図2参照)において、状態2003の値を「収集完了」に変更すると共に、収集ホストリスト122(図3参照)のホスト名の値に「NULL」を設定する。   As a result, the performance monitoring server 100 (business execution notification management unit 111) receives the collection completion request, and the value of the state 2003 in the collection item list 121 (see FIG. 2) based on the business name included in the collection completion request. Is changed to “collection complete”, and “NULL” is set as the host name value in the collection host list 122 (see FIG. 3).

ステップ8012では、性能監視サーバ100(業務実行通知管理部111)は、収集ホストリスト122(図3参照)のホスト名の値を「NULL」に設定変更する前の値を有するグリッドエージェントホスト400(収集項目管理部420)に対し、収集を完了すべき収集項目等のデータの削除をネットワーク500を介して要求する(収集項目削除)。   In step 8012, the performance monitoring server 100 (the job execution notification management unit 111) sets the grid agent host 400 (having a value before changing the host name value of the collection host list 122 (see FIG. 3) to “NULL”. The collection item management unit 420) is requested to delete data such as a collection item to be collected via the network 500 (collection item deletion).

ステップ8013では、グリッドエージェントホスト400は、収集項目削除の要求を受け、収集項目管理部420によって、収集項目リストDB440から当該収集項目等のデータを削除し、削除が正常に実行された場合、性能監視サーバ100(業務実行通知管理部111)に処理の成功を通知する。続けて、ステップ8014では、性能監視サーバ100(業務実行通知管理部111)は、業務マネージャ200(業務実行制御部210)に処理の成功を通知する。   In step 8013, the grid agent host 400 receives the collection item deletion request, and the collection item management unit 420 deletes data such as the collection item from the collection item list DB 440. The monitoring server 100 (business execution notification management unit 111) is notified of the success of the process. In step 8014, the performance monitoring server 100 (business execution notification management unit 111) notifies the business manager 200 (business execution control unit 210) of the success of the process.

ステップ8015では、業務マネージャ200(業務実行制御部210)は、処理の成功通知を受け、業務アプリケーションの実行(稼動性能データの収集)で使用したグリッドエージェントホスト400を解放したことをネットワーク500を介してグリッドマネージャ300に通知する(ホスト解放)。   In step 8015, the business manager 200 (the business execution control unit 210) receives the notification of the success of the processing and releases the grid agent host 400 used for the business application execution (collection of operation performance data) via the network 500. To the grid manager 300 (host release).

ステップ8016では、グリッドマネージャ300は、ホスト解放の通知を受け、エージェント管理部310によって、性能監視が正常に終了した場合、ホスト情報リストDB320(図6参照)の状態6002を「使用可能」に変更し、業務マネージャ200(業務実行制御部210)に処理の成功を通知する。   In step 8016, the grid manager 300 receives the host release notification, and changes the state 6002 of the host information list DB 320 (see FIG. 6) to “available” when the agent management unit 310 finishes performance monitoring normally. Then, the success of the process is notified to the business manager 200 (business execution control unit 210).

前記した流れで、業務サーバ200は、業務アプリケーションと、その業務アプリケーションを実行するグリッドエージェントホスト400とのペアを管理し、性能監視サーバ100に対し、稼動性能データの収集タイミングを通知する。したがって、性能監視サーバ100は、必要とする稼動性能データの収集項目を、その業務アプリケーションを実行するグリッドエージェントホスト400に対して、自動的に設定及び解除することができる。以上で、稼動性能データの収集項目の設定に関する動作を終了する。   In the above-described flow, the business server 200 manages a pair of the business application and the grid agent host 400 that executes the business application, and notifies the performance monitoring server 100 of the collection timing of the operation performance data. Therefore, the performance monitoring server 100 can automatically set and release the necessary performance data collection items for the grid agent host 400 that executes the business application. This completes the operation related to the setting of the collection item of the operation performance data.

[稼動性能データ取得動作]
次に、コンピューティングシステム1における稼動性能データの取得に関する動作を図9を参照して説明する。図9は、性能監視サーバが稼動性能データを取得する流れを示すシーケンス図である。
[Operation performance data acquisition operation]
Next, operations related to acquisition of operation performance data in the computing system 1 will be described with reference to FIG. FIG. 9 is a sequence diagram illustrating a flow in which the performance monitoring server acquires operation performance data.

ステップ9001では、性能監視サーバ100は、収集項目リスト121(図2参照)の状態2003が「収集中」を示しているとき、稼動性能データ取得部113によって、定期的に、収集ホストリスト122(図3参照)のホスト名3002の値で指定されたグリッドエージェントホスト400に対し、対応するデータID3001を通知して稼動性能データの取得を要求する(データ取得)。   In step 9001, when the status 2003 of the collection item list 121 (see FIG. 2) indicates “being collected”, the performance monitoring server 100 periodically performs the collection host list 122 ( The corresponding data ID 3001 is notified to the grid agent host 400 specified by the value of the host name 3002 in FIG. 3), and the acquisition of the operation performance data is requested (data acquisition).

ステップ9002では、グリッドエージェントホスト400は、収集項目管理部420によって、データIDの通知を受け、稼動性能データの収集を稼動性能データ収集部430に要求する(データ取得)。具体的には、収集項目管理部420は、受け取ったデータIDに対応する収集項目7002(図7参照)を収集項目リストDB440から読み出して稼動性能データ収集部430に通知する。   In step 9002, the grid agent host 400 receives the data ID notification from the collection item management unit 420 and requests the operation performance data collection unit 430 to collect the operation performance data (data acquisition). Specifically, the collection item management unit 420 reads the collection item 7002 (see FIG. 7) corresponding to the received data ID from the collection item list DB 440 and notifies the operation performance data collection unit 430.

ステップ9003では、稼動性能データ収集部430は、その時点での稼動性能データを収集し、収集結果(稼動性能データ)を収集項目管理部420に通知する。
ステップ9004では、グリッドエージェントホスト400(収集項目管理部420)は、収集結果(稼動性能データ)をネットワーク500を介して性能監視サーバ100に通知する。
In Step 9003, the operation performance data collection unit 430 collects the operation performance data at that time and notifies the collection item management unit 420 of the collection result (operation performance data).
In step 9004, the grid agent host 400 (collection item management unit 420) notifies the performance monitoring server 100 of the collection result (operation performance data) via the network 500.

その後、性能監視サーバ100は、稼動性能データ取得部113によって、稼動性能データを取得し、取得した稼動性能データを記憶手段120に蓄積する。蓄積された稼動性能データ123は、図示しないコンピュータディスプレイ等の表示部に表示される。これにより、管理者等は、稼動性能データ123の内容を確認し、例えば、「エラーパケット数」の収集項目の値を監視することにより、どこにボトルネックがあるかを探索することができる。その結果、各グリッドエージェントホスト400の性能を改善することが可能になる。   Thereafter, the performance monitoring server 100 acquires the operation performance data by the operation performance data acquisition unit 113 and accumulates the acquired operation performance data in the storage unit 120. The accumulated operation performance data 123 is displayed on a display unit such as a computer display (not shown). As a result, the administrator or the like can search the location of the bottleneck by checking the contents of the operation performance data 123 and monitoring the value of the collection item of “number of error packets”, for example. As a result, the performance of each grid agent host 400 can be improved.

(性能監視サーバ100の動作)
[収集項目配布部に関する動作]
次に、性能監視サーバ100における稼動性能データの収集項目を配布する動作について図10を参照(適宜図1参照)して説明する。図10は、性能監視サーバの収集項目配布部の処理を示すフローチャートである。
収集項目配布部112は、業務実行通知管理部111から、業務名とホスト名の組を取得し(ステップS1)、取得した業務名を、記憶手段120の収集項目リスト121(図2参照)から検索(リストの先頭から順番に検索)する(ステップS2)。
(Operation of the performance monitoring server 100)
[Actions related to the collection item distribution part]
Next, the operation for distributing the collection items of the operation performance data in the performance monitoring server 100 will be described with reference to FIG. 10 (refer to FIG. 1 as appropriate). FIG. 10 is a flowchart showing processing of the collection item distribution unit of the performance monitoring server.
The collection item distribution unit 112 acquires a combination of a business name and a host name from the business execution notification management unit 111 (step S1), and acquires the acquired business name from the collection item list 121 (see FIG. 2) in the storage unit 120. Search (search from the top of the list in order) (step S2).

そして、収集項目配布部112は、取得した業務名が、収集項目リスト121のレコードの値と一致したか否かを判別する(ステップS3)。取得した業務名がレコードの値と一致した場合(ステップS3:Yes)、収集項目配布部112は、ステップS1で取得したホスト名に基づいて、一致した値の業務名を実行するグリッドエージェントホスト400に対し、ネットワーク500を介して、検索で一致したレコードの収集項目を配布する(ステップS4)。   Then, the collection item distribution unit 112 determines whether or not the acquired business name matches the value of the record in the collection item list 121 (step S3). If the acquired business name matches the value of the record (step S3: Yes), the collection item distribution unit 112 executes the business name with the matched value based on the host name acquired in step S1. On the other hand, the collection items of the records matched by the search are distributed via the network 500 (step S4).

他方、業務名がレコードの値と一致しない場合(ステップS3:No)、収集項目配布部112は、全ての検索を終了したか否かを判別する(ステップS5)。全ての検索を終了した場合(ステップS5:Yes)、収集項目配布部112は処理を終了し、他方、未検索のレコードが存在する場合(ステップS5:No)、ステップS2へ戻って、処理を繰り返す。   On the other hand, when the business name does not match the value of the record (step S3: No), the collection item distribution unit 112 determines whether or not all searches have been completed (step S5). When all the searches are finished (step S5: Yes), the collection item distribution unit 112 finishes the process. On the other hand, when there is an unsearched record (step S5: No), the process returns to step S2. repeat.

[稼動性能データ取得部に関する動作]
次に、性能監視サーバ100における稼動性能データの取得動作について図11を参照(適宜図1参照)して説明する。図11は、性能監視サーバの稼動性能データ取得部の処理を示すフローチャートである。
[Operations related to operation performance data acquisition unit]
Next, the operation performance data acquisition operation in the performance monitoring server 100 will be described with reference to FIG. 11 (see FIG. 1 as appropriate). FIG. 11 is a flowchart showing the processing of the operation performance data acquisition unit of the performance monitoring server.

稼動性能データ取得部113は、一定時間経過したか否かを判別し(ステップS11)、一定時間が経過するまで判別を繰り返し(ステップS11:No)、一定時間経過した場合(ステップS11:Yes)、収集ホストリスト122(図3参照)の先頭に示されたホスト名の値を取得する(ステップS12)。ここで、一定時間(一定の間隔)とは、稼動性能データの収集間隔のことを意味し、例えばメモリに格納された定義ファイル等に予め定められている。この収集間隔は、収集項目に含まれる1つの内容として与えておいてもよい。   The operation performance data acquisition unit 113 determines whether or not a certain time has elapsed (step S11), and repeats the determination until the certain time has elapsed (step S11: No). When the certain time has elapsed (step S11: Yes) Then, the host name value indicated at the top of the collection host list 122 (see FIG. 3) is acquired (step S12). Here, the fixed time (fixed interval) means a collection interval of operation performance data, and is predetermined in, for example, a definition file stored in a memory. This collection interval may be given as one content included in the collection item.

そして、稼動性能データ取得部113は、収集ホストリスト122(図3参照)を参照し、取得する順番のホスト名を指定する値の位置が、収集ホストリスト122の末端に達した(取得すべきホスト名が無くなった)か否かを判別する(ステップS13)。収集ホストリスト122の末端に達した場合(ステップS13:Yes)、稼動性能データ取得部113は、ステップS11に戻る。   Then, the operation performance data acquisition unit 113 refers to the collection host list 122 (see FIG. 3), and the position of the value specifying the host name in the acquisition order has reached the end of the collection host list 122 (to be acquired). It is determined whether or not the host name has been lost (step S13). When the end of the collection host list 122 is reached (step S13: Yes), the operation performance data acquisition unit 113 returns to step S11.

他方、収集ホストリスト122の末端に達していない(ホスト名の取得に成功した)場合(ステップS13:No)、稼動性能データ取得部113は、取得した値のホスト名のグリッドエージェントホスト400に対し、取得した値に関連付けられたデータID3001(図3参照)を通知することにより、稼動性能データの取得を要求する(ステップS14)。つまり、稼動性能データ取得部113は、このデータID3001(図3参照)により、稼動性能データのどの収集項目を収集するかをグリッドエージェントホスト400に指示する。   On the other hand, when the end of the collection host list 122 has not been reached (acquisition of the host name has succeeded) (step S13: No), the operation performance data acquisition unit 113 applies the acquired value of the host name to the grid agent host 400. Then, by notifying the data ID 3001 (see FIG. 3) associated with the acquired value, the acquisition of the operation performance data is requested (step S14). That is, the operation performance data acquisition unit 113 instructs the grid agent host 400 which collection items of the operation performance data are collected by the data ID 3001 (see FIG. 3).

続いて、稼動性能データ取得部113は、取得した稼動性能データを記憶手段120に追加する(ステップS15)。このとき、記憶手段120の稼動性能データ123には、図4に示したように、データID4001、ホスト名4002、時間4003及び値4004で指定された値が追加されることとなる。   Subsequently, the operation performance data acquisition unit 113 adds the acquired operation performance data to the storage unit 120 (step S15). At this time, the values specified by the data ID 4001, the host name 4002, the time 4003, and the value 4004 are added to the operation performance data 123 of the storage unit 120 as shown in FIG.

そして、稼動性能データ取得部113は、収集ホストリスト122に次のホスト名があるか否か判別する(ステップS16)。その結果、次のホスト名がある場合(ステップS16:Yes)、稼動性能データ取得部113は、収集ホストリスト122から次のホスト名を取得し(ステップS17)、ステップS13に戻る。他方、次のホスト名がない場合(ステップS16:No)、稼動性能データ取得部113は、処理を終了する。   Then, the operation performance data acquisition unit 113 determines whether or not the next host name exists in the collection host list 122 (step S16). As a result, when there is a next host name (step S16: Yes), the operation performance data acquisition unit 113 acquires the next host name from the collection host list 122 (step S17), and returns to step S13. On the other hand, when there is no next host name (step S16: No), the operation performance data acquisition unit 113 ends the process.

以上説明したように、本実施形態のコンピューティングシステム1は、収集命令に基づいて、業務アプリケーションの実行環境に関連する稼動性能データを取得する性能監視サーバ100を備える構成としたものであり、管理者等は、業務アプリケーションを実際に実行する計算機を意識することなく自動的に、稼動性能データを取得することができる。その結果、業務アプリケーションのチューニングや、障害の事前予防が可能になる。   As described above, the computing system 1 according to the present embodiment is configured to include the performance monitoring server 100 that acquires operation performance data related to the execution environment of the business application based on the collection command. The person or the like can automatically acquire the performance data without being aware of the computer that actually executes the business application. As a result, it becomes possible to tune business applications and prevent failures in advance.

以上本発明について好適な実施形態について例示したが、本発明は前記した実施形態に限定されず、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。例えば、本実施形態では、各グリッドエージェントホスト(計算機)400により構成されたグリッドコンピューティングシステムの場合で説明したが、単一のOSの下で複数のCPUが処理を実行するブレードサーバの環境下で適用してもよい。
また、本実施形態では、性能監視サーバ100が記憶している稼動性能データの収集項目2002(図2参照)は、予め定められているものとしたが、性能監視サーバ100に、この収集項目を設定するための手段を備えるようにしてもよい。
As mentioned above, although preferred embodiment was illustrated about this invention, this invention is not limited to above-described embodiment, In the range which does not deviate from the meaning of this invention, it can change suitably. For example, in the present embodiment, the case of a grid computing system configured by each grid agent host (computer) 400 has been described. However, under the environment of a blade server in which a plurality of CPUs execute processing under a single OS. May be applied.
In the present embodiment, the collection item 2002 (see FIG. 2) of the operation performance data stored in the performance monitoring server 100 is determined in advance, but this collection item is stored in the performance monitoring server 100. Means for setting may be provided.

本発明の実施形態に係るコンピューティングシステムの構成を示す図である。It is a figure which shows the structure of the computing system which concerns on embodiment of this invention. 図1に示した収集項目リストの一例を示す図である。It is a figure which shows an example of the collection item list | wrist shown in FIG. 図1に示した収集ホストリストの一例を示す図である。FIG. 2 is a diagram illustrating an example of a collection host list illustrated in FIG. 1. 図1に示した稼動性能データの一例を示す図である。It is a figure which shows an example of the operation performance data shown in FIG. 図1に示した業務プログラムDBの一例を示す図である。It is a figure which shows an example of the business program DB shown in FIG. 図1に示したホスト情報リストDBの一例を示す図である。It is a figure which shows an example of host information list DB shown in FIG. 図1に示した収集項目リストDBの一例を示す図である。It is a figure which shows an example of the collection item list DB shown in FIG. 業務マネージャにおける業務アプリケーションの実行に連動した稼動性能データの収集項目の設定の流れを示すシーケンス図である。FIG. 10 is a sequence diagram showing a flow of setting operation performance data collection items linked to execution of a business application in a business manager. 性能監視サーバが稼動性能データを取得する流れを示すシーケンス図である。It is a sequence diagram which shows the flow from which a performance monitoring server acquires operation performance data. 性能監視サーバの収集項目配布部の処理を示すフローチャートである。It is a flowchart which shows the process of the collection item distribution part of a performance monitoring server. 性能監視サーバの稼動性能データ取得部の処理を示すフローチャートである。It is a flowchart which shows the process of the operation performance data acquisition part of a performance monitoring server.

符号の説明Explanation of symbols

1 コンピューティングシステム
100 性能監視サーバ
110 制御手段
111 業務実行通知管理部(収集命令取得手段)
112 収集項目配布部(収集項目配布手段)
113 稼動性能データ取得部(稼動性能データ取得手段)
120 記憶手段
121 収集項目リスト
122 収集ホストリスト
123 稼動性能データ
200 業務マネージャ(業務サーバ)
210 業務実行制御部(収集命令生成手段)
220 業務プログラムDB
300 グリッドマネージャ
310 エージェント管理部
320 ホスト情報リストDB
400 グリッドエージェントホスト(計算機)
410 業務プログラム実行部
420 収集項目管理部(収集項目管理手段)
430 稼動性能データ収集部(稼動性能収集手段)
440 収集項目リストDB
500 ネットワーク
DESCRIPTION OF SYMBOLS 1 Computing system 100 Performance monitoring server 110 Control means 111 Business execution notification management part (collection command acquisition means)
112 Collection Item Distribution Department (Collection Item Distribution Unit)
113 Operation performance data acquisition unit (operation performance data acquisition means)
120 Storage Means 121 Collection Item List 122 Collection Host List 123 Operation Performance Data 200 Business Manager (Business Server)
210 Business execution control unit (collection command generation means)
220 Business Program DB
300 Grid manager 310 Agent management unit 320 Host information list DB
400 Grid agent host (computer)
410 Business program execution unit 420 Collection item management unit (collection item management means)
430 Operation performance data collection unit (operation performance collection means)
440 Collection Item List DB
500 networks

Claims (7)

各種のプログラムを実行する複数の計算機と、
前記プログラムを前記計算機に割り当て、割り当てた計算機に前記プログラムの実行を要求する業務サーバと、
前記プログラムの実行環境に関連する稼動性能データを前記計算機から収集し、前記稼動性能データに基づいて前記計算機の性能を監視する性能監視サーバとを含むコンピューティングシステムを用いて、前記稼動性能データ取得する稼動性能データ取得方法であって、
前記業務サーバが、前記割り当てられた当該プログラムを示す業務情報と、そのプログラムを実行する計算機を識別する計算機識別情報とを含み、当該プログラムの収集命令を生成するステップを有し、
前記性能監視サーバが、前記収集命令に含まれる業務情報に対応する収集項目をメモリから読み出して、前記計算機識別情報を有する計算機に配布するステップを有し、
前記計算機が、配布された収集項目に関する稼動性能データを収集するステップを有し、
前記性能監視サーバが、前記収集項目を配布したことによりその収集項目に関する稼動性能データを収集した計算機から、当該収集項目に関する稼動性能データを取得するステップを有することを特徴とする稼動性能データ取得方法。
A plurality of computers that execute various programs;
A business server that assigns the program to the computer and requests the assigned computer to execute the program;
The operational performance data acquisition is performed using a computing system including a performance monitoring server that collects operational performance data related to the execution environment of the program from the computer and monitors the performance of the computer based on the operational performance data. An operation performance data acquisition method for
The business server includes business information indicating the assigned program and computer identification information for identifying a computer that executes the program, and generating a collection instruction for the program,
The performance monitoring server has a step of reading a collection item corresponding to business information included in the collection command from a memory and distributing it to a computer having the computer identification information;
The computer has a step of collecting operational performance data relating to a distributed collection item;
An operation performance data acquisition method comprising the step of acquiring operation performance data related to the collection item from a computer that has collected the operation performance data related to the collection item by distributing the collection item. .
前記稼動性能データを取得するステップは、一定の間隔で前記稼動性能データを取得することを特徴とする請求項1に記載の稼動性能データ取得方法。   2. The operation performance data acquisition method according to claim 1, wherein the operation performance data acquisition step acquires the operation performance data at regular intervals. 各種のプログラムを実行する複数の計算機から、前記プログラムの実行環境に関連する稼動性能データを収集し、前記稼動性能データに基づいて前記計算機の性能を監視する性能監視サーバであって、
前記プログラムを示す業務情報と、そのプログラムを実行する計算機を識別する計算機識別情報とを含み、当該プログラムの収集命令を取得する収集命令取得手段と、
この収集命令に含まれる業務情報に対応する収集項目をメモリから読み出して、前記計算機識別情報を有する計算機に配布する収集項目配布手段と、
前記収集項目を配布したことによりその収集項目に関する稼動性能データを収集した計算機から、当該収集項目に関する稼動性能データを取得する稼動性能データ取得手段と、
を備えることを特徴とする性能監視サーバ。
A performance monitoring server that collects operation performance data related to the execution environment of the program from a plurality of computers that execute various programs, and monitors the performance of the computer based on the operation performance data,
Collection instruction acquisition means for acquiring the collection instruction of the program, including business information indicating the program, and computer identification information for identifying a computer executing the program;
A collection item distribution means for reading out a collection item corresponding to the business information included in the collection command from the memory and distributing it to the computer having the computer identification information;
Operating performance data acquisition means for acquiring operating performance data related to the collected item from a computer that has collected operating performance data related to the collected item by distributing the collected item;
A performance monitoring server comprising:
各種のプログラムを複数の計算機に割り当て、割り当てた計算機に前記プログラムの実行を要求する業務サーバであって、
前記割り当てられた当該プログラムを示す業務情報と、そのプログラムを実行する計算機を識別する計算機識別情報とを含み、当該プログラムの収集命令を生成し、生成した収集命令を請求項3に記載の性能監視サーバに通知する収集命令生成手段を備えることを特徴とする業務サーバ。
A business server that assigns various programs to a plurality of computers and requests the assigned computers to execute the programs,
4. The performance monitoring according to claim 3, comprising business information indicating the assigned program and computer identification information for identifying a computer that executes the program, generating a collection command for the program, A business server comprising collection command generation means for notifying a server.
割り当てられた各種のプログラムを実行する計算機であって、
前記プログラムの実行環境に関連する稼動性能データを収集する稼動性能収集手段と、
請求項3に記載の性能監視サーバから配布された収集項目を取得し、取得した収集項目に関する稼動性能データを前記性能監視サーバに通知する収集項目管理手段と、
を備えることを特徴とする計算機。
A computer that executes various assigned programs,
Operational performance collection means for collecting operational performance data related to the execution environment of the program;
Collection item management means for acquiring collection items distributed from the performance monitoring server according to claim 3 and notifying the performance monitoring server of operational performance data related to the acquired collection items;
A computer comprising:
各種のプログラムを実行する複数の計算機と、
前記プログラムを前記計算機に割り当て、割り当てた計算機に前記プログラムの実行を要求すると共に、前記割り当てられた当該プログラムを示す業務情報と、そのプログラムを実行する計算機を識別する計算機識別情報とを含み、当該プログラムの収集命令を生成する業務サーバと、
前記収集命令に基づいて、前記プログラムの実行環境に関連する稼動性能データを前記計算機から収集し、前記稼動性能データに基づいて前記計算機の性能を監視する性能監視サーバとを含むコンピューティングシステムであって、
前記性能監視サーバは、
前記収集命令に含まれる業務情報に対応する収集項目をメモリから読み出して、前記計算機識別情報を有する計算機に配布する収集項目配布手段と、
前記収集項目を配布したことによりその収集項目に関する稼動性能データを収集した計算機から、当該収集項目に関する稼動性能データを取得する稼動性能データ取得手段と、
を有することを特徴とするコンピューティングシステム。
A plurality of computers that execute various programs;
The program is assigned to the computer, the assigned computer is requested to execute the program, and includes business information indicating the assigned program, and computer identification information for identifying a computer that executes the program, A business server that generates program collection instructions;
A performance monitoring server that collects operation performance data related to the execution environment of the program from the computer based on the collection command and monitors the performance of the computer based on the operation performance data. And
The performance monitoring server
A collection item distribution means for reading a collection item corresponding to the business information included in the collection command from a memory and distributing the collection item to a computer having the computer identification information;
Operating performance data acquisition means for acquiring operating performance data related to the collected item from a computer that has collected operating performance data related to the collected item by distributing the collected item;
A computing system comprising:
割り当てられた各種のプログラムを実行する複数の計算機と、
前記プログラムの実行環境に関連する稼動性能データを前記計算機から収集し、前記稼動性能データに基づいて前記計算機の性能を監視する性能監視サーバとを含むコンピューティングシステムであって、
前記性能監視サーバは、
前記プログラムを示す業務情報と、そのプログラムを実行する計算機を識別する計算機識別情報とを含み、当該プログラムの収集命令を取得する収集命令取得手段と、
この収集命令に含まれる業務情報に対応する収集項目をメモリから読み出して、前記計算機識別情報を有する計算機に配布する収集項目配布手段と、
前記収集項目を配布したことによりその収集項目に関する稼動性能データを収集した計算機から、当該収集項目に関する稼動性能データを取得する稼動性能データ取得手段と、
を有することを特徴とするコンピューティングシステム。
A plurality of computers that execute various assigned programs;
A performance monitoring server that collects operational performance data related to the execution environment of the program from the computer and monitors the performance of the computer based on the operational performance data;
The performance monitoring server
Collection instruction acquisition means for acquiring the collection instruction of the program, including business information indicating the program, and computer identification information for identifying a computer executing the program;
A collection item distribution means for reading out a collection item corresponding to the business information included in the collection command from the memory and distributing it to the computer having the computer identification information;
Operating performance data acquisition means for acquiring operating performance data related to the collected item from a computer that has collected operating performance data related to the collected item by distributing the collected item;
A computing system comprising:
JP2005169474A 2005-06-09 2005-06-09 Operation performance data acquisition method, performance monitor server, work server, computer, and computing system Pending JP2006344025A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005169474A JP2006344025A (en) 2005-06-09 2005-06-09 Operation performance data acquisition method, performance monitor server, work server, computer, and computing system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005169474A JP2006344025A (en) 2005-06-09 2005-06-09 Operation performance data acquisition method, performance monitor server, work server, computer, and computing system

Publications (1)

Publication Number Publication Date
JP2006344025A true JP2006344025A (en) 2006-12-21

Family

ID=37640947

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005169474A Pending JP2006344025A (en) 2005-06-09 2005-06-09 Operation performance data acquisition method, performance monitor server, work server, computer, and computing system

Country Status (1)

Country Link
JP (1) JP2006344025A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012234336A (en) * 2011-04-28 2012-11-29 Internatl Business Mach Corp <Ibm> Method and system for executing monitoring-target process
JP2014515522A (en) * 2011-05-20 2014-06-30 マイクロソフト コーポレーション Mutual cloud management and fault diagnosis

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012234336A (en) * 2011-04-28 2012-11-29 Internatl Business Mach Corp <Ibm> Method and system for executing monitoring-target process
US8914488B2 (en) 2011-04-28 2014-12-16 International Business Machines Corporation Method and system for monitoring a monitoring-target process
US10068015B2 (en) 2011-04-28 2018-09-04 International Business Machines Corporation Monitoring a monitoring-target process
JP2014515522A (en) * 2011-05-20 2014-06-30 マイクロソフト コーポレーション Mutual cloud management and fault diagnosis
US10009238B2 (en) 2011-05-20 2018-06-26 Microsoft Technology Licensing, Llc Cross-cloud management and troubleshooting

Similar Documents

Publication Publication Date Title
US9471455B2 (en) System, method, and computer program product for managing software updates
US7979407B2 (en) Publication of informational messages to software applications in a computing environment
US9015316B2 (en) Correlation of asynchronous business transactions
JP6048038B2 (en) Information processing apparatus, program, and information processing method
JP5008991B2 (en) Apparatus and method for controlling data recovery
US20170228296A1 (en) Hierarchical system manager rollback
JP4479284B2 (en) Management computer and system for setting up monitoring of computer system
JP2004280780A (en) Back up method, system, and program
JP2009288836A (en) System failure recovery method of virtual server, and its system
US20080059735A1 (en) Method of improving efficiency of replication monitoring
JP2010092464A (en) Method, system and computer program, for performing two-way orphan reconciliation in hierarchical storage management (hsm) control storage environment
US10430119B2 (en) Mechanism for multiple coexisting configurations support in virtual tape applications
US20130159255A1 (en) Storage system and method for controlling storage system
US8032490B2 (en) Storage system operable to perform LU auditing
JP2009217587A (en) Batch processing device and method
JP2006252459A (en) Monitoring device and monitoring method
JP2006344025A (en) Operation performance data acquisition method, performance monitor server, work server, computer, and computing system
JP6581304B2 (en) Field system
US20160004584A1 (en) Method and computer system to allocate actual memory area from storage pool to virtual volume
WO2014010047A1 (en) Management system and information acquisition method
WO2017168578A1 (en) Data processing system and data processing method
JP6568232B2 (en) Computer system and device management method
JP6585283B2 (en) Data processing system and data processing method
US20240134657A1 (en) Self-healing data protection system automatically determining attributes for matching to relevant scripts
US20210133056A1 (en) Method and system for efficiently handling backup discovery operations