JP5062896B2 - Batch processing monitoring apparatus, batch processing monitoring method and program - Google Patents

Batch processing monitoring apparatus, batch processing monitoring method and program Download PDF

Info

Publication number
JP5062896B2
JP5062896B2 JP2008134180A JP2008134180A JP5062896B2 JP 5062896 B2 JP5062896 B2 JP 5062896B2 JP 2008134180 A JP2008134180 A JP 2008134180A JP 2008134180 A JP2008134180 A JP 2008134180A JP 5062896 B2 JP5062896 B2 JP 5062896B2
Authority
JP
Japan
Prior art keywords
job
server
group
time
execution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008134180A
Other languages
Japanese (ja)
Other versions
JP2009282754A (en
Inventor
清美 和田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2008134180A priority Critical patent/JP5062896B2/en
Publication of JP2009282754A publication Critical patent/JP2009282754A/en
Application granted granted Critical
Publication of JP5062896B2 publication Critical patent/JP5062896B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a batch processing monitoring apparatus, method and program that can easily identify the cause of prolongation of batch processing in which a plurality of servers execute a plurality of jobs each using at least one server. <P>SOLUTION: A monitoring server 300 for monitoring batch processing in which a plurality of servers 110-160 execute a plurality of jobs each using at least one of the servers 110-160 comprises a first organization part for organizing a given job and jobs executed during the execution of the given job into a first group, a detection part for detecting servers 110-160 used by the first group of jobs which are used redundantly, and a first acquisition part for acquiring resource use information 103 representing resource use states in the servers 110-160 which is for at least one of the first group of jobs being executed on the detected servers 110-160. <P>COPYRIGHT: (C)2010,JPO&amp;INPIT

Description

本発明は、バッチ処理を監視する技術に関連し、特に、それぞれが少なくとも1つのサーバを使用する複数のジョブを複数のサーバで実行するバッチ処理を監視するバッチ処理監視装置、バッチ処理監視方法及びプログラムに関する。 The present invention relates to a technique for monitoring batch processing, and in particular, a batch processing monitoring apparatus, a batch processing monitoring method, and a batch processing monitoring method for monitoring batch processing in which a plurality of jobs each using at least one server are executed on a plurality of servers. Regarding the program .

今日、企業情報システムは多数のオープンサーバをはじめとするオープンシステム環境の下、各種業務サービスがWebアプリケーションで提供され、オンライン処理されている。そして、オープンシステムの実装では、JAVA(登録商標)が多用され、JAVA(登録商標)の開発環境が進化し、JAVA(登録商標)環境で動作するツールの充実とともに、各種JAVA(登録商標)関連機能を連携することで、業務サービスとしてのWebアプリケーションの向上が図れるようになってきた。   Today, various business services are provided by Web applications and processed online in an enterprise information system under an open system environment including a large number of open servers. In the implementation of open systems, JAVA (registered trademark) is frequently used, the development environment of JAVA (registered trademark) has evolved, and the tools that operate in the JAVA (registered trademark) environment have been enhanced. By linking functions, it has become possible to improve Web applications as business services.

このような状況の中、オンライン処理されたデータに対して一括処理するバッチ処理を従来のメインフレームからオープンシステム環境で実行すると、次のような3つのメリットがある。   Under such circumstances, when batch processing for batch processing of data processed online is executed in an open system environment from a conventional mainframe, there are the following three advantages.

1つめは、サーバの有効活用ができることである。昼間はオンライン業務処理を優先的に処理し、夜間はバッチ処理業務を優先的に処理するなど、時間帯によってサーバ利用形態を変えることにより、サーバ稼働率を上げることができ、サーバ台数を増やさずに済む。2つめは、各種業務処理変更が発生した場合、オープン環境では、変更業務に関連するサーバグループ以外は影響を受けないため、変更やテスト箇所を局所化できるので、業務変更へ対応しやすい。3つめは、運用管理対象サーバは、オンライン処理あるいはバッチ処理といった処理形態が変わっても、同一プラットフォーム監視であるため、管理者は同一サーバに対する監視スキルを使って効率的に運用管理ができるようになる。   The first is that the server can be used effectively. By changing the server usage mode according to the time of day, for example, online business processing is prioritized during the day and batch processing business is prioritized at night, the server operation rate can be increased without increasing the number of servers. It will end. Second, when various business process changes occur, the server environment related to the changed business is not affected in the open environment, and changes and test locations can be localized, so it is easy to cope with business changes. Third, even if the operation management target server changes the processing mode such as online processing or batch processing, the same platform monitoring is performed so that the administrator can efficiently manage the operation using the monitoring skills for the same server. Become.

一方、これまでのバッチ処理では、メインフレーム単体の実行性能を監視すれば良かったが、複数のサーバで実行される環境では、バッチ処理が長期化しているときに、長期化の原因を特定することが困難であった。   On the other hand, in previous batch processing, it was only necessary to monitor the execution performance of the mainframe alone, but in an environment where multiple servers are executed, when batch processing is prolonged, the cause of the longer is identified. It was difficult.

そこで、バッチ処理の長期化を予防する方法として、バッチ処理実行前に必要なリソースを確保する方法がある。例えば、本番前に予めバッチ処理単位のジョブを実行し、実行開始から終了までの間、サーバリソース増分値を計測し、計測結果をもとに、本番ではジョブ所要時間内に,必要なサーバリソースを確保できるサーバを選択して実行する。これにより、長時間ジョブの場合に、途中でサーバリソースが不足してジョブが失敗することを防ぐようにしたもの(特許文献1参照)や、投入予定のジョブが使用するサーバリソース使用量を、過去に実行したジョブのサーバリソース使用量の履歴と、データベース内の該当するテーブルの登録行数の変化量の履歴とから求めるようにしたもの(特許文献2参照)が知られている。
特開2005−11023号公報 特開2007−249491号公報
Therefore, as a method for preventing the lengthening of batch processing, there is a method of securing necessary resources before executing batch processing. For example, a batch processing unit job is executed in advance before production, and the server resource increment value is measured from the start to the end of execution. Based on the measurement result, the necessary server resources are consumed within the time required for the job in production. Select a server that can secure the server and execute it. As a result, in the case of a long-time job, a server resource is prevented from failing due to a shortage of server resources in the middle (see Patent Document 1), or a server resource usage amount used by a job scheduled to be submitted, There is known one obtained from a history of server resource usage of jobs executed in the past and a history of changes in the number of registered rows in a corresponding table in a database (see Patent Document 2).
JP 2005-11023 A JP 2007-249491 A

しかしながら、特許文献1に記載された方法では、本番前に予めジョブを実行しなければならないうえに、各サーバのサーバリソースの使用予定を知っておかなければならない。また、評価ジョブ及び本番ジョブのリソース使用量が異なる場合、又は本番実行中に予定通りにサーバリソースを確保できない場合があり得る。また、特許文献2に記載された方法では、未来のサーバリソース使用量を過去のサーバリソース使用量から線形予測しているが、実行サーバにおけるサーバリソースの使用状況は、単調増加又は減少とは限らず、サーバリソース使用量が急に変化する場合には対応できない。   However, in the method described in Patent Document 1, it is necessary to execute a job in advance before actual production and to know the use schedule of server resources of each server. Further, there are cases where the resource usage of the evaluation job and the production job are different, or the server resource cannot be secured as scheduled during the production execution. Further, in the method described in Patent Document 2, the future server resource usage is linearly predicted from the past server resource usage, but the usage status of the server resource in the execution server is not always monotonously increasing or decreasing. Therefore, it cannot cope with a sudden change in server resource usage.

これに対し、バッチ処理の自動運用を支援するジョブ管理サーバが知られている。ジョブ管理サーバには、一連のジョブを順に処理するために、複数ジョブによる実行順序を記述したジョブネットを定義する機能と、当該ジョブネットを計画的に実行するためにスケジュールを作成する機能と、自動実行の際、処理効率の向上や実行不良の低減のため、キューイングや多重実行する機能と、指定ジョブネットの進捗状況や各種ジョブネットの予実績を、1日単位又は1ヶ月単位に運用監視する機能とを有する。これにより、指定ジョブネットの進捗状況と、1日単位又は1ヶ月単位のジョブネットの予実績管理情報とを表示することができ、ジョブ管理者は、これらの情報からジョブの詳細情報をみることで、ジョブ管理サーバの直接の実行要求先である実行要求先サーバが分かるので、実行要求先サーバのリソース使用状況を辿ることができる。   On the other hand, a job management server that supports automatic operation of batch processing is known. The job management server includes a function for defining a job net that describes the execution order of a plurality of jobs in order to process a series of jobs in order, a function for creating a schedule for systematically executing the job net, In order to improve processing efficiency and reduce execution failures during automatic execution, the queuing and multiple execution functions, the progress of specified job nets and the expected results of various job nets are operated on a daily or monthly basis. And a monitoring function. As a result, it is possible to display the progress status of the designated job net and the scheduled performance management information of the job net in units of one day or one month, and the job manager can view the detailed job information from these information. Thus, the execution request destination server that is the direct execution request destination of the job management server can be known, and the resource usage status of the execution request destination server can be traced.

しかし、通常、ジョブは複数のサーバを使用して実行されており、例えばジョブにより実行される実行要求先サーバ上の実行プログラムが、実行要求先サーバに接続されるデータベースサーバ上にあるデータに対し、検索、登録又は更新などの処理を行うので、単に実行要求先サーバのリソース使用情報を取得しても、データベースサーバにおける処理が長期化している場合には、原因となっているサーバ(この場合はデータベースサーバ)を特定できなかった。また、複数の実行プログラムが同時にデータベースサーバに対して処理を行う場合には、原因となっているジョブを特定できなかった。このため、ジョブ管理サーバは、実行要求先サーバの実行プログラムから他のサーバ上にある呼び出し先プログラムまでを解析した上で、ジョブ単位にサーバのリソース使用情報を取得する必要があり、実行要求先サーバに接続される全てのサーバを対象して、大量に実行されるジョブ単位に、サーバのリソース使用情報を取得することは、ジョブ管理サーバに監視負荷がかかり過ぎるため現実的ではなく、バッチ処理の長期化の原因を特定できないという問題があった。   However, normally, a job is executed using a plurality of servers. For example, an execution program on an execution request destination server executed by a job is applied to data on a database server connected to the execution request destination server. Since the process such as search, registration, or update is performed, even if the resource usage information of the execution request destination server is obtained, if the process in the database server is prolonged, the server that is the cause (in this case Could not identify the database server). Further, when a plurality of execution programs perform processing on the database server at the same time, the cause job cannot be identified. For this reason, it is necessary for the job management server to acquire server resource usage information for each job after analyzing the execution program of the execution request destination server to the call destination program on another server. Acquiring server resource usage information in units of jobs that are executed in large quantities for all servers connected to the server is not practical because the monitoring load is excessive on the job management server, and batch processing is not possible. There was a problem that the cause of the prolonged period of time could not be identified.

本発明はかかる問題点に鑑みてなされたものであり、その目的とするところは、それぞれが少なくとも1つのサーバを使用する複数のジョブを複数のサーバで実行するバッチ処理の長期化の原因を容易に特定することのできるバッチ処理監視装置、バッチ処理監視方法及びプログラムを提供することにある。 The present invention has been made in view of such problems, and the object of the present invention is to easily cause the cause of prolonged batch processing in which a plurality of jobs each using at least one server are executed by a plurality of servers. It is an object of the present invention to provide a batch processing monitoring device, a batch processing monitoring method, and a program that can be specified in the following.

本発明は前述の目的を達成するために、それぞれが少なくとも1つのサーバを使用する複数のジョブからなる一連のジョブ群を、複数の前記サーバで実行するバッチ処理を監視するバッチ処理監視装置において、前記各ジョブは、使用する前記サーバのうちの1つがホストサーバとして設定されており、前記複数のジョブのうち、ジョブの実行時間が予め設定された予定実行時間を超えるジョブを所定のジョブとして選択する長時間ジョブ選択部と前記長時間ジョブ選択部によって選択された所定のジョブと、設定された前記ホストサーバが前記所定のジョブと同一で、かつ、前記所定のジョブと同じジョブ群で前記所定のジョブの実行中に実行される別の前記ジョブとを、第1グループとして纏める第1纏め部と、前記サーバにおけるリソースの使用状態を示すリソース使用情報であって、前記所定のジョブに設定された前記ホストサーバにおける、前記第1グループの少なくとも1つのジョブの実行中の第1の前記リソース使用情報を取得する第1取得部と、前記第1取得部によって取得された第1のリソース使用情報に含まれるリソースの使用率が所定の閾値以下である場合に、前記長時間ジョブ選択部によって選択された所定のジョブと、前記所定のジョブと同じジョブ群で前記所定のジョブの実行中に実行される別の前記ジョブとを、第グループとして纏める第纏め部と、前記第2纏め部によって纏められたグループの各ジョブが使用する前記サーバのうち、前記第グループの複数のジョブによって使用されるサーバを検出する検出部と、前記検出部によって検出されたサーバにおける、前記第グループの少なくとも1つのジョブの実行中の第2の前記リソース使用情報を取得する第取得部とを備えるバッチ処理監視装置を提案する。 For the present invention to achieve the aforementioned objects, a set of job group composed of a plurality of jobs, each using at least one server, in a batch process monitoring unit for monitoring a batch process to be executed by a plurality of said server, For each of the jobs, one of the servers to be used is set as a host server, and among the plurality of jobs, a job whose job execution time exceeds a preset scheduled execution time is selected as a predetermined job The long-time job selection unit, the predetermined job selected by the long-time job selection unit, and the set host server is the same as the predetermined job and the same job group as the predetermined job A first summarizing unit that collects another job executed during execution of a predetermined job as a first group; Resource usage information indicating a resource usage state, wherein the first resource usage information during execution of at least one job of the first group in the host server set in the predetermined job is acquired. a first obtaining unit, when usage of resource included in the first resource use information acquired by the first acquiring unit is equal to or less than a predetermined threshold value, a predetermined selected by the long job selection unit a job, and another of the job to be executed during execution of the predetermined job in the same job group and the predetermined job, a second summary section summarized as the second group were summarized by the second summary section among the servers each job of the second group uses a detector that detects the server used by the plurality of jobs of the second group, due to the detection unit In the detected server, it proposes a batch process monitoring device and a second acquisition unit for acquiring the second of the resource use information for at least one job in the execution of the second group.

また、本発明は前述の目的を達成するために、それぞれが少なくとも1つのサーバを使用する複数のジョブからなる一連のジョブ群を、複数の前記サーバで実行するバッチ処理を監視するバッチ処理監視方法において、前記各ジョブは、使用する前記サーバのうちの1つがホストサーバとして設定されており、前記複数のジョブのうち、ジョブの実行時間が予め設定された予定実行時間を超えるジョブを所定のジョブとして選択する長時間ジョブ選択ステップと前記長時間ジョブ選択ステップで選択した所定のジョブと、設定された前記ホストサーバが前記所定のジョブと同一で、かつ、前記所定のジョブと同じジョブ群で前記所定のジョブの実行中に実行される別の前記ジョブとを、第1グループとして纏める第1纏めステップと、前記サーバにおけるリソースの使用状態を示すリソース使用情報であって、前記所定のジョブに設定された前記ホストサーバにおける、前記第1グループの少なくとも1つのジョブの実行中の第1の前記リソース使用情報を取得する第1取得ステップと、前記第1取得ステップで取得した第1のリソース使用情報に含まれるリソースの使用率が所定の閾値以下である場合に、前記長時間ジョブ選択ステップで選択した所定のジョブと、前記所定のジョブと同じジョブ群で前記所定のジョブの実行中に実行される別の前記ジョブとを、第グループとして纏める第纏めステップと、前記第2纏めステップで纏めたグループの各ジョブが使用する前記サーバのうち、前記第グループの複数のジョブによって使用されるサーバを検出する検出ステップと、前記検出ステップで検出たサーバにおける、前記第グループの少なくとも1つのジョブの実行中の第2の前記リソース使用情報を取得する第取得ステップとを備えるバッチ処理監視方法を提案する。 In order to achieve the above object, the present invention also provides a batch process monitoring method for monitoring a batch process in which a series of job groups each consisting of a plurality of jobs using at least one server are executed by the plurality of servers. In each of the jobs, one of the servers to be used is set as a host server, and among the plurality of jobs, a job whose job execution time exceeds a preset scheduled execution time is determined as a predetermined job. A long- time job selection step to be selected as a predetermined job, a predetermined job selected in the long-time job selection step, and the set host server is the same as the predetermined job and the same job group as the predetermined job. A first bundling step of bundling another job executed during execution of the predetermined job as a first group; Resource usage information indicating a resource usage state in a server, the first resource usage information during execution of at least one job of the first group in the host server set in the predetermined job. A first acquisition step to be acquired, and a predetermined usage selected in the long-time job selection step when a resource usage rate included in the first resource usage information acquired in the first acquisition step is equal to or less than a predetermined threshold a job, first and another of the job to be executed during execution of the predetermined job in the same job group and the predetermined job, are summarized in the second summary step summarized as a second group, the second summarizes step among the server each job 2 group uses a detection scan to detect the server used by the plurality of jobs of the second group Proposal-up, the server detected by the detecting step, a batch process monitoring method and a second acquisition step of acquiring second of the resource use information of the second at least one job in the execution of the group To do.

また、本発明は前述の目的を達成するために、それぞれが少なくとも1つのサーバを使用する複数のジョブからなる一連のジョブ群を複数の前記サーバで実行するバッチ処理を監視するバッチ処理監視装置におけるコンピュータに実行させるプログラムにおいて前記各ジョブは、使用する前記サーバのうちの1つがホストサーバとして設定されており、前記複数のジョブのうち、ジョブの実行時間が予め設定された予定実行時間を超えるジョブを所定のジョブとして選択する長時間ジョブ選択ステップと前記長時間ジョブ選択ステップで選択した所定のジョブと、設定された前記ホストサーバが前記所定のジョブと同一で、かつ、前記所定のジョブと同じジョブ群で前記所定のジョブの実行中に実行される別の前記ジョブとを、第1グループとして纏める第1纏めステップと、前記サーバにおけるリソースの使用状態を示すリソース使用情報であって、前記所定のジョブに設定された前記ホストサーバにおける、前記第1グループの少なくとも1つのジョブの実行中の第1の前記リソース使用情報を取得する第1取得ステップと、前記第1取得ステップで取得した第1のリソース使用情報に含まれるリソースの使用率が所定の閾値以下である場合に、前記長時間ジョブ選択ステップで選択した所定のジョブと、前記所定のジョブと同じジョブ群で前記所定のジョブの実行中に実行される別の前記ジョブとを、第グループとして纏める第纏めステップと、前記第2纏めステップで纏めたグループの各ジョブが使用する前記サーバのうち、前記第グループの複数のジョブによって使用されるサーバを検出する検出ステップと、前記検出ステップで検出たサーバにおける、前記第グループの少なくとも1つのジョブの実行中の第2の前記リソース使用情報を取得する第取得ステップとをバッチ処理監視装置におけるコンピュータに実行させるプログラムを提案する。 In order to achieve the above-mentioned object, the present invention provides a batch processing monitoring apparatus for monitoring batch processing in which a series of job groups each consisting of a plurality of jobs using at least one server are executed by the plurality of servers. In the program to be executed by the computer, one of the servers to be used for each job is set as a host server, and the execution time of the job exceeds a preset execution time among the plurality of jobs. A long-time job selection step for selecting a job as a predetermined job; the predetermined job selected in the long-time job selection step ; and the set host server is the same as the predetermined job, and the predetermined job Another job executed during execution of the predetermined job in the same job group as the first group. A resource management information indicating a resource usage state in the server, wherein at least one job of the first group is being executed in the host server set in the predetermined job. A first acquisition step of acquiring the first resource usage information, and when the resource usage rate included in the first resource usage information acquired in the first acquisition step is equal to or less than a predetermined threshold, the length and a predetermined job selected by the time the job selection step, and another of the job to be executed during execution of the predetermined job in the same job group and the predetermined job, a second summary step summarized as a second group, among the servers each job of the second group which are summarized in the second collectively step uses a plurality of jobs of the second group Thus a detection step of detecting a server used, the server detected by the detecting step, a second obtaining step of obtaining a second of said resource use information for at least one job in the execution of the second group A program for causing a computer in a batch processing monitoring apparatus to execute the above is proposed.

本発明によれば、例えば所定のジョブとして実行時間が予定実行時間より長い長時間ジョブを選択すると、長時間ジョブと長時間ジョブの実行中に実行されるジョブとが第グループとして纏められ、第グループの各ジョブが使用するサーバのうち、重複して使用されるサーバが検出され、検出されたサーバにおける、第グループの少なくとも1つのジョブの実行中のリソース使用情報が取得される。これにより、長時間ジョブの実行中に実行される第グループにおいて重複して使用され、リソース競合が発生している可能性が高いサーバのリソース使用情報を、長時間ジョブの実行中を含み、リソース競合が発生している可能性が高い第グループの実行時間を単位として、取得することができる。 According to the present invention, for example, when a long-time job whose execution time is longer than the scheduled execution time is selected as the predetermined job, the long-time job and the job executed during the execution of the long-time job are grouped as the second group, Among servers used by each job of the second group, a server that is used redundantly is detected, and resource usage information during execution of at least one job of the second group in the detected server is acquired. Thereby, the resource usage information of the server that is used redundantly in the second group that is executed during the execution of the long-time job and is likely to have resource contention, includes the execution of the long-time job, The execution time of the second group that is likely to have resource contention can be acquired as a unit.

本発明によれば、長時間ジョブの実行中に実行される第グループにおいて重複して使用され、リソース競合が発生している可能性が高いサーバのリソース使用情報を、長時間ジョブの実行中を含み、リソース競合が発生している可能性が高い第グループの実行時間を単位として、取得することができる。これにより、従来のように全てのサーバを対象としてジョブ単位にサーバのリソース使用情報を取得する必要がなく、リソース競合が発生している可能性が高いサーバにおけるリソース競合が発生している可能性が高い時間のリソース使用情報から、容易に長期化の原因を特定することができる。
According to the present invention, resource usage information of a server that is used redundantly in the second group that is executed during the execution of a long-time job and that has a high possibility of resource contention is being generated. And the execution time of the second group that is highly likely to have resource contention can be acquired as a unit. As a result, there is no need to acquire server resource usage information for each server for all servers as in the past, and there is a possibility that resource contention has occurred on servers where there is a high possibility that resource contention has occurred. However, it is possible to easily identify the cause of the prolonged period from the resource usage information of a high time.

以下、図面を参照しながら本発明の一実施の形態を詳述する。なお、以下において、同一構成部分は同一符号をもって表し、その説明を省略する。   Hereinafter, an embodiment of the present invention will be described in detail with reference to the drawings. In the following, the same components are denoted by the same reference numerals, and the description thereof is omitted.

まず、図1乃至図8を用いてバッチ処理システムの構成を説明する。図1は、バッチ処理システムの全体構成を説明する概略構成図である。   First, the configuration of the batch processing system will be described with reference to FIGS. FIG. 1 is a schematic configuration diagram illustrating the overall configuration of the batch processing system.

バッチ処理システム1は、実行サーバ群100、管理サーバ200、及び監視サーバ300から構成され、実行サーバ群100、管理サーバ200、及び監視サーバ300は互いに接続されている。   The batch processing system 1 includes an execution server group 100, a management server 200, and a monitoring server 300. The execution server group 100, the management server 200, and the monitoring server 300 are connected to each other.

実行サーバ群100は、それぞれジョブを実行する複数の実行サーバから構成され、アプリケーションサーバ(以下、APサーバという)として、第1APサーバ110、第2APサーバ120、第3APサーバ130、第4APサーバ140及び第5APサーバ150を備え、データベースサーバ(以下、DBサーバという)としてDBサーバ160を備えている。本実施形態では、APサーバ及びDBサーバを備えるように構成したが、これに限定されず、例えばファイルサーバやプリントサーバなどを備えるようにしてもよい。   The execution server group 100 includes a plurality of execution servers that execute jobs. As application servers (hereinafter referred to as AP servers), a first AP server 110, a second AP server 120, a third AP server 130, a fourth AP server 140, and A fifth AP server 150 is provided, and a DB server 160 is provided as a database server (hereinafter referred to as a DB server). In the present embodiment, the AP server and the DB server are provided. However, the present invention is not limited to this. For example, a file server or a print server may be provided.

実行サーバ群100内の各実行サーバは1つ又は複数のシステムを構成する。すなわち、第1APサーバ110、第2APサーバ120及びDBサーバ160は、受発注管理業務を行う受発注管理業務システム170を構成し、第3APサーバ130、第4APサーバ140及びDBサーバ160は、在庫管理業務を行う在庫管理業務システム180を構成し、第1APサーバ110、第3APサーバ130、第5APサーバ150及びDBサーバ160は、帳票管理業務を行う帳票管理業務システム190を構成する。   Each execution server in the execution server group 100 constitutes one or a plurality of systems. That is, the first AP server 110, the second AP server 120, and the DB server 160 constitute an order management business system 170 that performs order management business, and the third AP server 130, the fourth AP server 140, and the DB server 160 are inventory management. An inventory management business system 180 that performs business is configured, and the first AP server 110, the third AP server 130, the fifth AP server 150, and the DB server 160 configure a form management business system 190 that performs business management.

第1APサーバ110は、ジョブ実行エージェント101、リソース監視エージェント102、リソース使用情報103、受注伝票回収処理プログラム171、受注伝票集計処理プログラム172、受発注伝票印刷処理プログラム191を有する。   The first AP server 110 includes a job execution agent 101, a resource monitoring agent 102, resource usage information 103, an order slip collection processing program 171, an order slip summary processing program 172, and an order placement slip print processing program 191.

ジョブ実行エージェント101は、後述する管理サーバ200によって指定されたジョブの実行要求を受信して指定されたジョブを実行するためのものである。実行要求を受信したジョブ実行エージェント101は、指定されたジョブを登録後に当該ジョブを実行し、ジョブ終了後に管理サーバ200に実行結果を送信する。   The job execution agent 101 is for receiving a job execution request specified by the management server 200 described later and executing the specified job. The job execution agent 101 that has received the execution request executes the job after registering the designated job, and transmits the execution result to the management server 200 after the job ends.

リソース監視エージェント102は、CPU(Central Processing Unit)、メモリ及びハードディスクなどのサーバにおけるリソースを監視し、リソースの使用状態を示すリソース使用情報103を収集するためのものである。リソース監視エージェント102は、リソース使用情報103を所定時間間隔、例えば1分ごとに収集し、後述する監視サーバ300に送信する。   The resource monitoring agent 102 is for monitoring resources in a server such as a CPU (Central Processing Unit), a memory, and a hard disk, and collecting resource usage information 103 indicating a resource usage state. The resource monitoring agent 102 collects the resource usage information 103 at a predetermined time interval, for example, every minute, and transmits it to the monitoring server 300 described later.

受注伝票回収処理プログラム171及び受注伝票集計処理プログラム172は、受発注管理業務システム170で使用されるプログラムである。受発注伝票印刷処理プログラム191は帳票管理業務システム190で使用されるプログラムである。   The order slip collection processing program 171 and the order slip summary processing program 172 are programs used in the ordering management business system 170. The order receipt print processing program 191 is a program used in the form management business system 190.

第2APサーバ120は、ジョブ実行エージェント101、リソース監視エージェント102、リソース使用情報103及び受注伝票回収処理プログラム171を有する。   The second AP server 120 includes a job execution agent 101, a resource monitoring agent 102, resource usage information 103, and an order slip collection processing program 171.

第3APサーバ130は、ジョブ実行エージェント101、リソース監視エージェント102、リソース使用情報103、在庫引き当て処理プログラム181及び受発注伝票印刷処理プログラム191を有する。在庫引き当て処理プログラム181は在庫管理業務システム180で使用されるプログラムである。   The third AP server 130 includes a job execution agent 101, a resource monitoring agent 102, resource usage information 103, an inventory allocation processing program 181, and an order placement slip printing processing program 191. The inventory allocation processing program 181 is a program used in the inventory management business system 180.

第4APサーバ140は、ジョブ実行エージェント101、リソース監視エージェント102、リソース使用情報103及び在庫引き当て処理プログラム181を有する。   The fourth AP server 140 includes a job execution agent 101, a resource monitoring agent 102, resource usage information 103, and an inventory allocation processing program 181.

第5APサーバ150は、ジョブ実行エージェント101、リソース監視エージェント102、リソース使用情報103及び受発注伝票印刷処理プログラム191を有する。   The fifth AP server 150 includes a job execution agent 101, a resource monitoring agent 102, resource usage information 103, and an order placement slip print processing program 191.

本実施形態では、同一プログラムを複数の実行サーバに、例えば受発注管理業務システム170で使用される受注伝票回収処理プログラム171を第1APサーバ110及び第2APサーバ120にインストールし、負荷を分散している。   In the present embodiment, the same program is installed on a plurality of execution servers, for example, the order slip collection processing program 171 used in the order management business system 170 is installed on the first AP server 110 and the second AP server 120, and the load is distributed. Yes.

データベースサーバ160は、リソース監視エージェント102、リソース使用情報103、受注管理表175、発注管理表185及び在庫管理表195を有し、第1APサーバ110、第2APサーバ120、第3APサーバ130、第4APサーバ140及び第5APサーバ150に接続されている。受注管理表175は、受発注管理業務システム170で使用されるデータが格納される表である。発注管理表185は、在庫管理業務システム180で使用されるデータが格納される表である。在庫管理表195は、帳票管理業務システム190で使用されるデータが格納される表である。   The database server 160 includes a resource monitoring agent 102, resource usage information 103, an order management table 175, an order management table 185, and an inventory management table 195. The first AP server 110, the second AP server 120, the third AP server 130, and the fourth AP The server 140 and the fifth AP server 150 are connected. The order management table 175 is a table in which data used in the ordering management business system 170 is stored. The order management table 185 is a table in which data used in the inventory management business system 180 is stored. The inventory management table 195 is a table in which data used in the form management business system 190 is stored.

管理サーバ200は、ジョブ実行制御部210及びジョブ情報記憶部220から構成されている。ジョブ実行制御部210は、CPUやメモリなどから構成され、実行サーバ群100を使用してジョブを実行するためのものである。ジョブ情報記憶部220は、ハードディスクなどの記憶装置から構成され、ジョブネット定義情報221、ジョブネット実行サーバ管理表222、ジョブネット予定表223、ジョブ予定表224、ジョブネット実績表225及びジョブ実績表226を記憶するためのものである。ジョブ実行制御部210は所定時間間隔、例えば1日ごとにジョブネット予定表223及びジョブネット実績表225を監視サーバ300に送信する。   The management server 200 includes a job execution control unit 210 and a job information storage unit 220. The job execution control unit 210 includes a CPU, a memory, and the like, and is for executing a job using the execution server group 100. The job information storage unit 220 includes a storage device such as a hard disk, and includes job net definition information 221, job net execution server management table 222, job net schedule table 223, job schedule table 224, job net result table 225, and job result table. 226 is stored. The job execution control unit 210 transmits the job net schedule table 223 and the job net result table 225 to the monitoring server 300 at predetermined time intervals, for example, every day.

監視サーバ300は、監視部310、記憶部320及び表示部330から構成されている。監視部310は、CPUやメモリなどから構成され、実行サーバ群100で実行されるジョブネットを監視するためのものである。記憶部320は、ハードディスクなどの記憶装置から構成され、管理サーバ200から送信されるジョブネット予定表223及びジョブネット実績表225と、実行サーバ群100の各実行サーバから送信されるリソース使用情報103を格納するリソース使用情報表321とを記憶するためのものである。表示部330は、ディスプレイなどの表示装置から構成され、各ジョブの実行状況を表示するためのものである。   The monitoring server 300 includes a monitoring unit 310, a storage unit 320, and a display unit 330. The monitoring unit 310 is configured by a CPU, a memory, and the like, and is for monitoring a job net executed by the execution server group 100. The storage unit 320 includes a storage device such as a hard disk, and includes a job net schedule table 223 and a job net result table 225 transmitted from the management server 200, and resource usage information 103 transmitted from each execution server of the execution server group 100. Is stored in the resource usage information table 321 for storing. The display unit 330 includes a display device such as a display, and displays the execution status of each job.

図2は、図1に示したリソース使用情報表の構成を説明する構成図である。リソース使用情報表321は、実行サーバごと、かつ、月日ごとに作成され、実行サーバから送信されるリソース使用情報103が、1日における履歴として時系列に1レコードずつ登録される。リソース使用情報表321は、CPU使用率欄321A、メモリ使用率欄321B、ハードディスク使用率欄321C、ハードディスクIO(Input-Output)使用率欄321D及び時刻欄321Eから構成されている。CPU使用率欄321Aには、単位時間におけるCPUが使用される時間の割合が格納される。メモリ使用率欄321Bには、メモリ容量全体における使用される容量の割合が格納される。ハードディスク使用率欄321Cには、ハードディスク容量全体における使用される容量の割合が格納される。ハードディスクIO使用率欄321Dには、単位時間におけるハードディスクのIOが使用される時間の割合が格納される。時刻欄321Eには、リソース使用情報103を収集した時刻が格納される。本実施形態では、リソース使用情報103として使用率を用いるようにしたが、これに限定されず、例えばCPU、メモリ及びハードディスクなどについては、使用量を用いるようにしてもよい。   FIG. 2 is a configuration diagram illustrating the configuration of the resource usage information table shown in FIG. The resource usage information table 321 is created for each execution server and for each month and day, and the resource usage information 103 transmitted from the execution server is registered for each record in time series as a history of one day. The resource usage information table 321 includes a CPU usage rate column 321A, a memory usage rate column 321B, a hard disk usage rate column 321C, a hard disk IO (Input-Output) usage rate column 321D, and a time column 321E. The CPU usage rate column 321A stores the percentage of time the CPU is used in a unit time. The memory usage rate column 321B stores a ratio of the used capacity in the entire memory capacity. The hard disk usage rate column 321C stores the ratio of the used capacity to the entire hard disk capacity. The hard disk IO usage rate column 321D stores a ratio of time during which hard disk IO is used in a unit time. The time column 321E stores the time when the resource usage information 103 is collected. In this embodiment, the usage rate is used as the resource usage information 103. However, the usage rate is not limited to this. For example, the usage amount may be used for a CPU, a memory, a hard disk, and the like.

図3は、図1に示したジョブネット定義情報の構成を説明する構成図である。ジョブネット定義情報221は、複数のジョブを一連の処理として実行するために、複数ジョブの実行順序を表すジョブネットを定義するためのものである。ジョブネット定義情報221は、ジョブネットごとに作成され、管理サーバ200の管理者によって登録、変更及び削除される。図3に示すように、例えば日次ジョブネット(A104)は、A部門受注伝票回収ジョブ(@101)、B部門受注伝票回収ジョブ(@102)及びC部門受注伝票回収ジョブ(@103)を並列に実行し、各部門の受注伝票回収ジョブが終了するまで待ち合わせ、各部門の受注伝票が揃った時点で受注伝票集計ジョブ(@104)を実行し、次に在庫引き当てジョブ(@105)を実行後、A部門受発注伝票印刷ジョブ(@106)、B部門受発注伝票印刷ジョブ(@107)及びC部門受発注伝票印刷ジョブ(@108)を並列に実行する、ように定義されている。   FIG. 3 is a configuration diagram for explaining the configuration of the job net definition information shown in FIG. The job net definition information 221 is for defining a job net representing the execution order of a plurality of jobs in order to execute a plurality of jobs as a series of processes. The job net definition information 221 is created for each job net, and is registered, changed, and deleted by the administrator of the management server 200. As shown in FIG. 3, for example, the daily job net (A104) includes an A department order receipt collection job (@ 101), a B department order receipt collection job (@ 102), and a C department order receipt collection job (@ 103). Execute in parallel, wait until the sales order collection job for each department is completed, execute the sales order collection job (@ 104) when the sales order for each department is ready, and then execute the inventory allocation job (@ 105) After execution, it is defined that the A department order receipt print job (@ 106), the B department order receipt print job (@ 107), and the C department order receipt print job (@ 108) are executed in parallel. .

図4は、図1に示したジョブネット実行サーバ管理表の構成を説明する構成図である。ジョブネット実行サーバ管理表222は、ジョブネットに含まれるジョブごとに、実行サーバを管理するための表である。ジョブネット実行サーバ管理表222は、ジョブネットごとに作成され、管理サーバ200の管理者によって登録、変更及び削除される。図4は、例えば日次ジョブネット(A104)のジョブ実行サーバ管理表222を示す。ジョブネット実行サーバ管理表222は、システム名欄222A、ジョブ番号欄222B、ジョブ名欄222C、第1APサーバ欄222D、第2APサーバ欄222E、第3APサーバ欄222F、第4APサーバ欄222G、第5APサーバ欄222H及びDBサーバ欄222Iから構成されている。   FIG. 4 is a configuration diagram illustrating the configuration of the job net execution server management table shown in FIG. The job net execution server management table 222 is a table for managing the execution server for each job included in the job net. The job net execution server management table 222 is created for each job net, and is registered, changed, and deleted by the administrator of the management server 200. FIG. 4 shows the job execution server management table 222 of the daily job net (A104), for example. The job net execution server management table 222 includes a system name column 222A, a job number column 222B, a job name column 222C, a first AP server column 222D, a second AP server column 222E, a third AP server column 222F, a fourth AP server column 222G, and a fifth AP. It consists of a server column 222H and a DB server column 222I.

システム名欄222Aには、当該ジョブネットが使用する業務システムの名称が格納される。ジョブ番号欄222Bには、当該ジョブネットに含まれ、システム名欄222Bに格納された業務システムに実行されるジョブを、管理サーバ200内で一意に識別可能な番号が格納される。ジョブ名欄222Cには、ジョブ番号欄222Bに格納された番号に対応するジョブの名称が格納される。第1APサーバ欄222D、第2APサーバ欄222E、第3APサーバ欄222F、第4APサーバ欄222G、第5APサーバ欄222H及びDBサーバ欄222Iには、ジョブ番号欄222Bに格納された番号に対応するジョブが使用する実行サーバに該当する場合に「○」が格納され、特に当該ジョブを実行するときに、ジョブ実行制御部210が実行要求を送信する実行サーバ(以下、ホストサーバという)に該当する場合に「◎」が格納される。例えば、ジョブ番号欄222Bが「@101」のジョブ(A部門受注伝票回収ジョブ)は、実行されるときにジョブ実行制御部210が第1APサーバ110に実行要求を送信し、第1APサーバ110及びDBサーバ160を使用するので、第1APサーバ欄222Dに「◎」が格納され、DBサーバ欄222Iに「○」が格納される。   The system name column 222A stores the name of the business system used by the job net. The job number column 222B stores a number that can uniquely identify a job included in the job net and executed by the business system stored in the system name column 222B within the management server 200. The job name column 222C stores a job name corresponding to the number stored in the job number column 222B. In the first AP server column 222D, the second AP server column 222E, the third AP server column 222F, the fourth AP server column 222G, the fifth AP server column 222H, and the DB server column 222I, jobs corresponding to the numbers stored in the job number column 222B “○” is stored when it corresponds to the execution server used by the server, especially when it corresponds to the execution server (hereinafter referred to as the host server) to which the job execution control unit 210 transmits an execution request when executing the job. “◎” is stored. For example, the job execution control unit 210 transmits an execution request to the first AP server 110 when the job having the job number column 222B of “@ 101” (A department order slip collection job) is executed. Since the DB server 160 is used, “◎” is stored in the first AP server column 222D, and “◯” is stored in the DB server column 222I.

図5は、図1に示したジョブネット予定表の構成を説明する構成図である。ジョブネット予定表223は、ジョブネットごとにスケジュールを管理するための表である。ジョブネット予定表223は、月日ごとに作成され、管理サーバ200内のスケジューラプログラム(図示せず)などによって登録、変更及び削除される。図5は、所定の月日におけるジョブネット予定表223を示す。ジョブネット予定表223は、ジョブネット番号欄223A、ジョブネット名欄223B、予定開始時刻欄223C、予定終了時刻欄223D及び予定実行時間欄223Eから構成されている。   FIG. 5 is a block diagram for explaining the configuration of the job net schedule shown in FIG. The job net schedule table 223 is a table for managing a schedule for each job net. The job net schedule 223 is created every month and day, and is registered, changed, and deleted by a scheduler program (not shown) in the management server 200. FIG. 5 shows a job net schedule table 223 for a predetermined date. The job net schedule table 223 includes a job net number column 223A, a job net name column 223B, a scheduled start time column 223C, a scheduled end time column 223D, and a scheduled execution time column 223E.

ジョブネット番号欄223Aは、ジョブネットを管理サーバ200内で一意に識別可能な番号が格納される。ジョブネット名欄223Bには、ジョブネット番号欄223Aに格納された番号に対応するジョブネットの名称が格納される。予定開始時刻欄223C及び予定終了時刻欄223Dには、ジョブネット番号欄223Aに格納された番号に対応するジョブネットの予定開始時刻及び予定終了時刻がそれぞれ格納される。予定実行時間欄223Eには、ジョブネット番号欄223Aに格納された番号に対応するジョブネットの予定実行時間が格納される。なお、ジョブネット予定表223は、予定実行時間欄223Eを有さずに、予定開始時刻欄223C及び予定終了時刻欄223Dに格納される時刻から予定実行時間を算出するようにしてもよい。   The job net number column 223A stores a number that can uniquely identify the job net in the management server 200. The job net name column 223B stores the name of the job net corresponding to the number stored in the job net number column 223A. The scheduled start time column 223C and the scheduled end time column 223D store the scheduled start time and scheduled end time of the job net corresponding to the number stored in the job net number column 223A, respectively. The scheduled execution time column 223E stores the scheduled execution time of the job net corresponding to the number stored in the job net number column 223A. Note that the job net schedule table 223 may calculate the scheduled execution time from the time stored in the scheduled start time field 223C and the scheduled end time field 223D without having the scheduled execution time field 223E.

図6は、ジョブ予定表の構成を説明する構成図である。ジョブ予定表224は、ジョブネットに含まれるジョブごとにスケジュールを管理するための表である。ジョブ予定表224は、ジョブネット予定表223ごと、すなわち月日ごとに作成され、管理サーバ200内のスケジューラプログラム(図示せず)などによって登録、変更及び削除される。図6は、所定の月日における日次ジョブネットのジョブ予定表224を示す。ジョブ予定表224は、ジョブ番号欄224A、ジョブ名欄224B、予定開始時刻欄224C、予定終了時刻欄224D及び予定実行時間欄224Eから構成されている。   FIG. 6 is a configuration diagram illustrating the configuration of the job schedule. The job schedule table 224 is a table for managing a schedule for each job included in the job net. The job schedule table 224 is created for each job net schedule table 223, that is, for each month and day, and is registered, changed, and deleted by a scheduler program (not shown) in the management server 200. FIG. 6 shows the job schedule table 224 of the daily job net for a predetermined month and day. The job schedule table 224 includes a job number column 224A, a job name column 224B, a scheduled start time column 224C, a scheduled end time column 224D, and a scheduled execution time column 224E.

ジョブ番号欄224Aは、当該ジョブネットに含まれるジョブを、管理サーバ200内で一意に識別可能な番号が格納される。ジョブ名欄224Bは、ジョブ番号欄224Aに格納された番号に対応するジョブの名称が格納される。予定開始時刻欄224C及び予定終了時刻欄224Dには、ジョブ番号欄224Aに格納された番号に対応するジョブの予定開始時刻及び予定終了時刻がそれぞれ格納される。予定実行時間欄224Eには、ジョブ番号欄224Aに格納された番号に対応するジョブの予定実行時間が格納される。なお、ジョブ予定表224は、前述のジョブネット予定表223の場合と同様に、予定実行時間欄224Eを有さなくてもよい。   The job number column 224A stores a number that can uniquely identify a job included in the job net within the management server 200. The job name column 224B stores the name of the job corresponding to the number stored in the job number column 224A. The scheduled start time column 224C and the scheduled end time column 224D store the scheduled start time and scheduled end time of the job corresponding to the number stored in the job number column 224A, respectively. The scheduled execution time column 224E stores the scheduled execution time of the job corresponding to the number stored in the job number column 224A. Note that the job schedule table 224 does not have to have the scheduled execution time column 224E as in the case of the job net schedule table 223 described above.

図7は、ジョブネット実績表の構成を説明する構成図である。ジョブネット実績表225は、ジョブネットごとに実績を管理するための表である。ジョブネット実績表225は、月日ごとに作成され、各実行サーバから実行結果を受信したジョブ実行制御部210によって登録される。図7は、所定の月日におけるジョブネット実績表225を示す。ジョブネット実績表225は、ジョブネット番号欄225A、ジョブネット名欄225B、開始時刻欄225C、終了時刻欄225D及び実行時間欄225Eから構成されている。   FIG. 7 is a configuration diagram illustrating the configuration of the job net performance table. The job net result table 225 is a table for managing the results for each job net. The job net result table 225 is created for each month and day, and is registered by the job execution control unit 210 that has received the execution result from each execution server. FIG. 7 shows a job net result table 225 for a predetermined date. The job net result table 225 includes a job net number column 225A, a job net name column 225B, a start time column 225C, an end time column 225D, and an execution time column 225E.

ジョブネット番号欄225A及びジョブネット名欄225Bは、それぞれ前述のジョブネット番号欄223A及びジョブネット名欄223Bと同様であるため、説明を省略する。開始時刻欄225Cには、後述のジョブ実績表226において最初に実行開始されたジョブの開始時刻が格納される。終了時刻欄225Dには、後述のジョブ実績表226において最後に実行終了されたジョブの終了時刻が格納される。実行時間欄225Eには、ジョブネット番号欄225Aに格納された番号に対応するジョブネットの実行時間が格納される。なお、ジョブネット実績表225は、前述のジョブネット予定表223の場合と同様に、実行時間欄225Eを有さなくてもよい。   The job net number column 225A and the job net name column 225B are the same as the above-described job net number column 223A and job net name column 223B, respectively, and thus description thereof is omitted. The start time column 225 </ b> C stores the start time of the job that is first started in the job performance table 226 described later. The end time column 225D stores the end time of the job that has been executed last in the job performance table 226 described later. The execution time column 225E stores the execution time of the job net corresponding to the number stored in the job net number column 225A. Note that the job net result table 225 does not have to include the execution time column 225E as in the case of the job net schedule table 223 described above.

図8は、ジョブ実績表の構成を説明する構成図である。ジョブ実績表226は、ジョブネットに含まれるジョブの実績を管理するための表である。ジョブ実績表226は、ジョブネット実績表225ごと、すなわち月日ごとに作成され、各実行サーバから実行結果を受信したジョブ実行制御部210によって登録される。図8は、所定の月日における日次ジョブネットのジョブ実績表226を示す。ジョブ実績表226は、ジョブ番号欄226A、ジョブ名欄226B、開始時刻欄226C、終了時刻欄226D及び実行時間欄226Eから構成されている。   FIG. 8 is a configuration diagram illustrating the configuration of the job performance table. The job performance table 226 is a table for managing the performance of jobs included in the job net. The job record table 226 is created for each job net record table 225, that is, for each month and day, and is registered by the job execution control unit 210 that has received the execution result from each execution server. FIG. 8 shows a job result table 226 of the daily job net for a predetermined date. The job record table 226 includes a job number column 226A, a job name column 226B, a start time column 226C, an end time column 226D, and an execution time column 226E.

ジョブ番号欄226A及びジョブ名欄226Bは、それぞれ前述のジョブ番号欄224A及びジョブ名欄224Bと同様であるため、説明を省略する。開始時刻226C及び予定終了時刻226Dには、ジョブ番号欄226Aに格納された番号に対応するジョブの開始時刻及び終了時刻がそれぞれ格納される。実行時間226Eには、ジョブ番号欄226Aに格納された番号に対応するジョブの実行時間が格納される。なお、ジョブ実績表226は、前述のジョブネット予定表223と同様に、実行時間欄226Eを有さなくてもよい。   The job number column 226A and the job name column 226B are the same as the above-described job number column 224A and job name column 224B, respectively, and thus description thereof is omitted. The start time and end time of the job corresponding to the number stored in the job number column 226A are stored in the start time 226C and the scheduled end time 226D, respectively. The execution time 226E stores the execution time of the job corresponding to the number stored in the job number column 226A. Note that the job performance table 226 does not have to include the execution time column 226E, like the job net schedule table 223 described above.

次に、図9乃至図13を用いて監視サーバの監視に係る動作を説明する。図9は、図1に示した監視部の動作を説明するフローチャートである。なお、以下において、所定の月日が既に指定されているものとして説明する。   Next, operations related to monitoring by the monitoring server will be described with reference to FIGS. 9 to 13. FIG. 9 is a flowchart for explaining the operation of the monitoring unit shown in FIG. In the following description, it is assumed that a predetermined date has already been specified.

まず、監視部310は、記憶部320に記憶された所定の月日のジョブネット予定表223及びジョブネット実績表225に基づいて、実行時間欄225Eに格納された時間が予定実行時間欄223Eに格納された時間よりも長いジョブネット(以下、長時間ジョブネットという)を選択する(S401)。   First, the monitoring unit 310 sets the time stored in the execution time column 225E in the scheduled execution time column 223E based on the job net schedule table 223 and the job net result table 225 stored in the storage unit 320. A job net longer than the stored time (hereinafter referred to as a long time job net) is selected (S401).

次に、監視部310は、S401で選択した長時間ジョブネットのジョブネット番号に基づいて、管理サーバ200のジョブ情報記憶部220から、長時間ジョブネットのジョブネット実行サーバ管理表222と、所定の月日における長時間ジョブネットのジョブ予定表224及びジョブ実績表226とを取得する(S402)。なお、監視部310は、取得したジョブネット実行サーバ管理表222、ジョブ予定表224及びジョブ実績表226を、記憶部320や、メモリ(図示せず)、キャッシュ(図示せず)などに記憶する。   Next, based on the job net number of the long-time job net selected in S401, the monitoring unit 310 reads the long-time job net job net execution server management table 222 from the job information storage unit 220 of the management server 200, The job schedule table 224 and job result table 226 of the long-time job net for the month and day are acquired (S402). The monitoring unit 310 stores the acquired job net execution server management table 222, job schedule table 224, and job performance table 226 in the storage unit 320, a memory (not shown), a cache (not shown), or the like. .

次に、監視部310は、S402で取得したジョブ予定表224及びジョブ実績表226に基づいて、実行時間欄226Eに格納された時間が予定実行時間欄224Eに格納された時間よりも長いジョブ(以下、長時間ジョブという)を選択する(S403)。これにより、実行時間が予定実行時間よりも長い長時間ジョブが自動的に選択される。   Next, based on the job schedule table 224 and the job record table 226 acquired in S402, the monitoring unit 310 sets a job (the job (in which the time stored in the execution time column 226E is longer than the time stored in the scheduled execution time column 224E)) (Hereinafter referred to as a long time job) is selected (S403). As a result, a long time job whose execution time is longer than the scheduled execution time is automatically selected.

次に、監視部310は、S403で選択した長時間ジョブのジョブ番号に基づいて、S402で取得したジョブネット実行サーバ管理表222から、ホストサーバが長時間ジョブと同一のジョブを抽出する(S404)。次に、ジョブ監視部310は、長時間ジョブの実行中に実行されるジョブを抽出する、後述の長時間ジョブと並列実行するジョブの検出処理を行う(S500)。次に、監視部310は、S403で選択した長時間ジョブと、S404で抽出したジョブ、かつ、S500で抽出したジョブとをグループに纏める(S405)。   Next, based on the job number of the long-time job selected in S403, the monitoring unit 310 extracts the same job as the long-time job from the job net execution server management table 222 acquired in S402 (S404). ). Next, the job monitoring unit 310 extracts a job that is executed during the execution of the long-time job, and performs a job detection process that is executed in parallel with the long-time job, which will be described later (S500). Next, the monitoring unit 310 groups the long-time job selected in S403, the job extracted in S404, and the job extracted in S500 into a group (S405).

次に、監視部310は、記憶部320に記憶された、所定の月日の長時間ジョブのホストサーバにおけるリソース使用情報表321から、S405で纏められたグループの少なくとも1つのジョブが実行中のレコード(リソース使用情報103)を抽出する(S406)。このように、長時間ジョブとホストサーバが同一で、かつ、長時間ジョブの実行中に実行されるジョブとがグループに纏められ、当該ホストサーバにおける、当該グループの少なくとも1つのジョブの実行中のリソース使用情報103が抽出されるので、長時間ジョブの実行中に実行されるグループにおいて共通して使用され、リソース競合が発生している可能性が高いホストサーバのリソース使用情報を、長時間ジョブの実行中を含み、リソース競合が発生している可能性が高いグループの実行時間を単位として、取得することができる。   Next, the monitoring unit 310 is executing at least one job of the group summarized in S405 from the resource usage information table 321 in the host server of the long-time job of the predetermined date stored in the storage unit 320. A record (resource usage information 103) is extracted (S406). In this way, the long-time job and the host server are the same, and the jobs that are executed during the execution of the long-time job are grouped together, and at least one job of the group in the host server is being executed. Since the resource usage information 103 is extracted, the resource usage information of the host server that is commonly used in the group executed during the execution of the long-time job and is likely to have resource contention Can be acquired in units of the execution time of a group that is likely to have resource contention.

次に、監視部310は、S406で抽出したレコード(リソース使用情報103)に含まれる所定のリソースの使用率と、当該所定のリソースに設定された閾値とに基づいて、所定のリソースの使用率が閾値を上回るか否かを判定する(S407)。   Next, the monitoring unit 310 uses the predetermined resource usage rate based on the usage rate of the predetermined resource included in the record (resource usage information 103) extracted in S406 and the threshold set for the predetermined resource. It is determined whether or not exceeds a threshold value (S407).

S407の判定の結果、所定のリソースの使用率が閾値を上回る場合、監視部310は、表示時間帯を設定する後述の表示時間帯設定処理を行い(S600)、S402で取得したジョブ実績表226及びS406で抽出したレコード(リソース使用情報103)に基づいて、S405で纏めたグループの各ジョブの実行時間及び所定のリソースの使用率を、表示部330に表示し(S408)、ジョブ監視部310は処理を終了する。   If the usage rate of the predetermined resource exceeds the threshold value as a result of the determination in S407, the monitoring unit 310 performs a display time zone setting process (to be described later) for setting a display time zone (S600), and the job performance table 226 acquired in S402. And based on the record (resource usage information 103) extracted in S406, the execution time of each job of the group summarized in S405 and the usage rate of a predetermined resource are displayed on the display unit 330 (S408), and the job monitoring unit 310 Ends the process.

S407の判定の結果、所定のリソースの使用率が閾値を上回らない場合、監視部310は、S403で選択した長時間ジョブの実行中に実行されるジョブを抽出する、後述の長時間ジョブと並列実行するジョブの検出処理を再び行い(S500)、監視部310は、S403で選択した長時間ジョブと、S500で抽出したジョブとをグループに纏める(S409)。   As a result of the determination in S407, if the usage rate of the predetermined resource does not exceed the threshold, the monitoring unit 310 extracts a job to be executed during the execution of the long-time job selected in S403, and is parallel to a long-time job described later. The detection process of the job to be executed is performed again (S500), and the monitoring unit 310 groups the long-time job selected in S403 and the job extracted in S500 into a group (S409).

次に、監視部310は、S402で取得したジョブネット実行サーバ管理表222に基づいて、S409で纏めたグループに含まれる各ジョブに重複して使用されるサーバを検出する(S410)。   Next, based on the job net execution server management table 222 acquired in S402, the monitoring unit 310 detects a server used redundantly for each job included in the group summarized in S409 (S410).

次に、監視部310は、記憶部320に記憶された、所定の月日のS410で検出したサーバにおけるリソース使用情報表321から、S409で纏めたグループの少なくとも1つのジョブが実行中のレコード(リソース使用情報103)を抽出する(S411)。このように、長時間ジョブと長時間ジョブの実行中に実行されるジョブとがグループに纏められ、グループに含まれる各ジョブが使用するサーバのうち、重複して使用されるサーバが検出され、検出されたサーバにおける、当該グループの少なくとも1つのジョブの実行中のリソース使用情報103が抽出されるので、長時間ジョブの実行中に実行されるグループにおいて重複して使用され、リソース競合が発生している可能性が高いサーバのリソース使用情報を、長時間ジョブの実行中を含み、リソース競合が発生している可能性が高いグループの実行時間を単位として、取得することができる。   Next, the monitoring unit 310 records, from the resource usage information table 321 in the server detected in S410 stored in the storage unit 320, a record in which at least one job of the group summarized in S409 is being executed ( The resource usage information 103) is extracted (S411). In this way, long-time jobs and jobs that are executed during the execution of long-time jobs are grouped together, and servers that are used in duplicate among the servers used by each job included in the group are detected, Since the resource usage information 103 during the execution of at least one job of the group in the detected server is extracted, it is used redundantly in the group executed during the execution of the job for a long time, and resource contention occurs. It is possible to acquire the resource usage information of the server that is highly likely to be in units of the execution time of the group that is likely to have resource contention, including during long-time job execution.

次に、監視部310は、表示時間帯を設定する後述の表示時間帯設定処理を行い(S600)、S402で取得したジョブ実績表226及びS411で抽出したレコード(リソース使用情報103)に基づいて、S600で設定した表示時間帯における、S409で纏めたグループの各ジョブの実行時間及び所定のリソースの使用率を、表示部330に表示し(S412)、ジョブ監視部310は処理を終了する。   Next, the monitoring unit 310 performs a later-described display time zone setting process for setting a display time zone (S600), and based on the job record table 226 acquired in S402 and the record (resource usage information 103) extracted in S411. , The execution time of each job of the group summarized in S409 and the usage rate of a predetermined resource in the display time zone set in S600 are displayed on the display unit 330 (S412), and the job monitoring unit 310 ends the processing.

以下において、監視サーバ300の記憶部320に、図5に示した所定の月日のジョブネット予定表223及び図7に示した所定の月日のジョブネット実績表225が記憶されているものとして具体的に説明する。   In the following, it is assumed that the job net schedule table 223 shown in FIG. 5 and the job net result table 225 shown in FIG. 7 are stored in the storage unit 320 of the monitoring server 300. This will be specifically described.

S401で、監視部310は、図5のジョブネット予定表223及び図7のジョブネット実績表225に基づいて、実行時間欄225Eに格納された「2時間29分」が予定実行時間欄223Eに格納された「2時間15分」よりも長い「A104」(日次ジョブネット)を、長時間ジョブネットとして選択する。   In S401, the monitoring unit 310 sets “2 hours 29 minutes” stored in the execution time column 225E to the scheduled execution time column 223E based on the job net schedule table 223 in FIG. 5 and the job net result table 225 in FIG. “A104” (daily job net) longer than the stored “2 hours 15 minutes” is selected as the long time job net.

S402で、監視部310は、管理サーバ200のジョブ情報記憶部220から、図4に示した「A104」(日次ジョブネット)のジョブネット実行サーバ管理表222と、図6に示した所定の月日における「A104」(日次ジョブネット)のジョブ予定表224及び図8に示した所定の月日における「A104」(日次ジョブネット)のジョブ実績表226とを取得する。S403で、監視部310は、実行時間欄226Eに格納された「44分」が予定実行時間欄224Eに格納された「30分」よりも長いジョブ「@102」と、実行時間欄226Eに格納された「42分」が予定実行時間欄224Eに格納された「30分」よりも長いジョブ「@107」とを、それぞれ長時間ジョブとして選択する。   In S402, the monitoring unit 310 receives the job net execution server management table 222 of “A104” (daily job net) shown in FIG. 4 from the job information storage unit 220 of the management server 200, and the predetermined information shown in FIG. The job schedule table 224 of “A104” (daily job net) on the date and the job performance table 226 of “A104” (daily job net) on the predetermined date shown in FIG. 8 are acquired. In S403, the monitoring unit 310 stores the job “@ 102” in which “44 minutes” stored in the execution time column 226E is longer than “30 minutes” stored in the scheduled execution time column 224E and the execution time column 226E. The job “@ 107” whose “42 minutes” is longer than “30 minutes” stored in the scheduled execution time column 224E is selected as a long-time job.

S404で、監視部310は、図4のジョブネット実行サーバ管理表222から、長時間ジョブ「@102」のホストサーバである第2APサーバ120と同一のホストサーバが設定されたジョブはないので抽出せず、長時間ジョブ「@107」のホストサーバである第1APサーバ110と同一のホストサーバが設定されたジョブ、すなわち第1APサーバ欄222Dに「◎」が格納されたジョブ番号欄222Bが「@101」、「@103」及び「@104」のジョブを抽出する。   In S404, the monitoring unit 310 extracts from the job net execution server management table 222 of FIG. 4 because there is no job in which the same host server as the second AP server 120 that is the host server of the long-time job “@ 102” is set. The job number field 222B in which “◎” is stored in the first AP server field 222D, ie, a job in which the same host server as the first AP server 110, which is the host server for the long-time job “@ 107”, is set. The jobs “@ 101”, “@ 103”, and “@ 104” are extracted.

図10は、図9に示した長時間ジョブと並列実行するジョブの検出処理を説明するフローチャートである。監視部310は、長時間ジョブ「@102」の開始時刻欄226Cに格納された「10:01」及び終了時刻欄226Dに格納された「10:45」と、長時間ジョブ「@107」の開始時刻欄226Cに格納された「11:48」及び終了時刻欄226Dに格納された「12:30」とを、図8のジョブ実績表226から得る(S501)。   FIG. 10 is a flowchart for explaining a job detection process executed in parallel with the long-time job shown in FIG. The monitoring unit 310 sets “10:01” stored in the start time column 226C of the long time job “@ 102” and “10:45” stored in the end time column 226D and the long time job “@ 107”. “11:48” stored in the start time column 226C and “12:30” stored in the end time column 226D are obtained from the job performance table 226 of FIG. 8 (S501).

次に、監視部310は、開始時刻欄226Cに格納された時刻が長時間ジョブ「@102」の終了時刻「10:45」以前で、終了時刻欄226Dに格納された時刻が開始時刻「10:01」以降のジョブ、すなわち、ジョブ番号欄226Aが「@101」及び「@103」のジョブと、開始時刻欄226Cに格納された時刻が終了時刻「12:30」以前で、終了時刻欄226Dに格納された時刻が長時間ジョブ「@107」の開始時刻「11:48」以降のジョブ、すなわちジョブ番号欄226Aが「@106」及び「@108」のジョブとを、それぞれ図8のジョブ実績表226から抽出する(S502)。これにより、長時間ジョブの実行中に実行されるジョブが抽出される。   Next, the monitoring unit 310 determines that the time stored in the start time column 226C is before the end time “10:45” of the long-time job “@ 102”, and the time stored in the end time column 226D is the start time “10”. : 01 ”and subsequent jobs, that is, jobs whose job number column 226A is“ @ 101 ”and“ @ 103 ”, and the time stored in the start time column 226C is before the end time“ 12:30 ”, the end time column The jobs stored in the time 226D are the jobs after the start time “11:48” of the long-time job “@ 107”, that is, jobs whose job number column 226A is “@ 106” and “@ 108”, respectively, as shown in FIG. Extracted from the job record table 226 (S502). As a result, a job that is executed during the long-time job is extracted.

次に、監視部310は図8のS405に戻り、S405で、ジョブ監視部310は、S404で抽出したジョブ「@101」、「@103」及び「@104」、かつ、S500で抽出したジョブ「@106」及び「@108」を満たすジョブがないので、ここでは、長時間ジョブ「@102」と、長時間ジョブ「@107」とを、それぞれグループとする。   Next, the monitoring unit 310 returns to S405 in FIG. 8, and in S405, the job monitoring unit 310 detects the jobs “@ 101”, “@ 103”, and “@ 104” extracted in S404, and the job extracted in S500. Since there are no jobs that satisfy “@ 106” and “@ 108”, the long-time job “@ 102” and the long-time job “@ 107” are grouped here.

S406で、監視部310は、記憶部320に記憶された、所定の月日の長時間ジョブ「@102」のホストサーバである第2APサーバ120におけるリソース使用情報表321から、長時間ジョブ「@102」が実行中のレコード(リソース使用情報103)を抽出するともに、記憶部320に記憶された、所定の月日の長時間ジョブ「@107」のホストサーバである第1APサーバ110におけるリソース使用情報表321から、長時間ジョブ「@107」が実行中のレコード(リソース使用情報103)を抽出する。   In S <b> 406, the monitoring unit 310 stores the long-term job “@” from the resource usage information table 321 in the second AP server 120, which is the host server of the long-term job “@ 102” of the predetermined date, stored in the storage unit 320. 102 ”extracts the record being executed (resource usage information 103), and uses the resource in the first AP server 110 that is the host server of the long-time job“ @ 107 ”stored in the storage unit 320. From the information table 321, a record (resource usage information 103) in which the long-time job “@ 107” is being executed is extracted.

S407で、監視部310は、S406で抽出したレコード(リソース使用情報103)に含まれる所定のリソースの使用率、例えばCPU使用率欄321Aの格納された値が、CPU使用率に設定された閾値、例えば80%を上回るか否かを判定する。   In S407, the monitoring unit 310 uses a predetermined resource usage rate included in the record (resource usage information 103) extracted in S406, for example, a threshold stored in the CPU usage rate column 321A as the CPU usage rate. For example, it is determined whether it exceeds 80%.

図11は、図9に示した表示時間帯設定処理を説明するフローチャートである。S407の判定の結果、CPU使用率欄321Aの格納された値が80%を上回る場合、図11に示すように、監視部310は、長時間ジョブ「@102」の開始時刻欄226Cに格納された「10:01」及び終了時刻欄226Dに格納された「10:45」と、長時間ジョブ「@107」の開始時刻欄226Cに格納された「11:48」及び終了時刻欄226Dに格納された「12:30」とを、図8のジョブ実績表226から得る(S601)。   FIG. 11 is a flowchart for explaining the display time zone setting process shown in FIG. As a result of the determination in S407, if the value stored in the CPU usage rate column 321A exceeds 80%, the monitoring unit 310 stores the value in the start time column 226C of the long-time job “@ 102” as shown in FIG. In addition, “10:45” stored in the “10:01” and end time column 226D, and “11:48” stored in the start time column 226C of the long time job “@ 107” and stored in the end time column 226D. The obtained “12:30” is obtained from the job record table 226 of FIG. 8 (S601).

次に、監視部310は、S403で選択した長時間ジョブが複数か否かを判定し(S602)、S403で選択した長時間ジョブが複数の場合、監視部310は、S601で得た開示時刻のうち最も早い長時間ジョブ「@102」の開始時刻「10:01」の直前を表示開始時刻に設定し(S603)、S601で得た終了時刻のうち最も遅い長時間ジョブ「@107」の開始時刻「12:30」の直後を表示終了時刻に設定し(S604)、監視部310は処理を終了する。   Next, the monitoring unit 310 determines whether or not there are a plurality of long-time jobs selected in S403 (S602). If there are a plurality of long-time jobs selected in S403, the monitoring unit 310 displays the disclosure time obtained in S601. Immediately before the start time “10:01” of the earliest long-time job “@ 102” is set as the display start time (S603), and among the end times obtained in S601, the latest long-time job “@ 107” Immediately after the start time “12:30” is set as the display end time (S604), and the monitoring unit 310 ends the process.

S403で選択した長時間ジョブが複数でない、すなわち、長時間ジョブが1つの場合、監視部310は、例えば長時間ジョブ「@102」のみを選択したときは、長時間ジョブ「@102」の開始時刻「10:01」の直前を表示開始時刻に設定し(S605)、長時間ジョブ「@102」の開始時刻「10:45」を表示終了時刻に設定し(S606)、監視部310は処理を終了する。   When there are not a plurality of long-time jobs selected in S403, that is, there is one long-time job, for example, when only the long-time job “@ 102” is selected, the monitoring unit 310 starts the long-time job “@ 102”. The time immediately before “10:01” is set as the display start time (S605), the start time “10:45” of the long-time job “@ 102” is set as the display end time (S606), and the monitoring unit 310 performs processing. Exit.

次に、監視部310は図8のS408に戻り、S408で、監視部310は、表示開始時刻「10:01」及び表示終了時刻「12:30」において、長時間ジョブ「@102」の実行時間欄226Eに格納された時間及びCPU使用率欄321Aの格納された値と、長時間ジョブ「@107」の実行時間欄226Eに格納された時間及びCPU使用率欄321Aの格納された値とを、表示部330に表示し、ジョブ監視部310は処理を終了する。   Next, the monitoring unit 310 returns to S408 of FIG. 8, and in S408, the monitoring unit 310 executes the long-time job “@ 102” at the display start time “10:01” and the display end time “12:30”. The time stored in the time column 226E and the stored value in the CPU usage rate column 321A, the time stored in the execution time column 226E of the long time job “@ 107”, and the stored value in the CPU usage rate column 321A Is displayed on the display unit 330, and the job monitoring unit 310 ends the process.

図12は、図1に示した表示部に表示する画面を説明するイメージ図である。図12に示すように、CPU使用率は80%を上回らないので、表示部330に表示されないが、説明のために画面イメージを示す。上段に長時間ジョブ「@102」(B部門受注伝票回収ジョブ)及び長時間ジョブ「@107」(B部門受発注伝票印刷ジョブ)の実行時間を表示し、下段に長時間ジョブ「@102」(B部門受注伝票回収ジョブ)及び長時間ジョブ「@107」(B部門受発注伝票印刷ジョブ)の実行時間中におけるCPU使用率を並べて表示する。ここで、長時間ジョブの実行時間は、横軸の時刻及び縦軸の実行時間で画定される四角の大きさで表される。このように、S405で纏めたグループの長時間ジョブの実行時間とリソース使用情報103に含まれるCPU使用率とが並べて表示されるので、リソース使用情報103におけるジョブごとの内訳を容易に把握することができる。   FIG. 12 is an image diagram for explaining a screen displayed on the display unit shown in FIG. As shown in FIG. 12, since the CPU usage rate does not exceed 80%, it is not displayed on the display unit 330, but a screen image is shown for explanation. The execution time of the long-time job “@ 102” (B department order receipt collection job) and long-time job “@ 107” (B department ordering slip print job) is displayed in the upper section, and the long-time job “@ 102” is displayed in the lower section. CPU usage rates during the execution time of (B department order slip collection job) and long-time job “@ 107” (B department order placement slip print job) are displayed side by side. Here, the execution time of the long-time job is represented by a square size defined by the time on the horizontal axis and the execution time on the vertical axis. As described above, since the execution time of the long-time job of the group summarized in S405 and the CPU usage rate included in the resource usage information 103 are displayed side by side, the breakdown for each job in the resource usage information 103 can be easily grasped. Can do.

S407の判定の結果、CPU使用率欄321Aの格納された値が80%を継続的に上回らない場合、S500で、監視部310は、「@101」及び「@103」のジョブと、「@106」及び「@108」のジョブとを再び抽出し、S409で、監視部310は、長時間ジョブ「@102」と「@101」及び「@103」のジョブとをグループに纏めるとともに、長時間ジョブ「@107」と「@106」及び「@108」のジョブとをグループに纏める。これにより、長時間ジョブの実行中に実行されるジョブが抽出され、長時間ジョブと抽出されたジョブとがグループに纏められる。   As a result of the determination in S407, if the stored value of the CPU usage rate column 321A does not continuously exceed 80%, the monitoring unit 310, in S500, the jobs “@ 101” and “@ 103” and “@ 106 ”and“ @ 108 ”are extracted again, and in step S409, the monitoring unit 310 groups the long-time jobs“ @ 102 ”,“ @ 101 ”, and“ @ 103 ”into a group, The jobs of time jobs “@ 107”, “@ 106”, and “@ 108” are grouped together. As a result, jobs that are executed during the execution of the long-time job are extracted, and the long-time job and the extracted job are grouped together.

S410で、監視部310は、図4のジョブネット実行サーバ管理表222から、長時間ジョブ「@102」と「@101」及び「@103」のジョブとからなるグループにおいて重複して使用されるサーバ、すなわち、第1APサーバ110とDBサーバ160とを検出するとともに、長時間ジョブ「@107」と「@106」及び「@108」のジョブとからなるグループにおいて重複して使用されるサーバ、すなわち、DBサーバ160を検出する。なお、長時間ジョブ「@102」と「@101」及び「@103」のジョブとからなるグループのように、重複して使用されるサーバが複数ある場合には、全てのジョブに共通して使用されるサーバ、すなわち、DBサーバ160を優先して検出する。このように、グループに含まれる各ジョブが使用するサーバのうち、全てのジョブに共通して使用されるサーバが検出されるので、長時間ジョブの実行中に実行されるグループにおいて共通して使用され、リソース競合が発生している可能性が更に高いサーバを検出することができる。   In S410, the monitoring unit 310 is used redundantly in a group including long-time jobs “@ 102”, “@ 101”, and “@ 103” jobs from the job net execution server management table 222 of FIG. Servers that detect the first AP server 110 and the DB server 160, and servers that are used redundantly in a group consisting of long-time jobs “@ 107”, “@ 106”, and “@ 108” jobs, That is, the DB server 160 is detected. If there are multiple servers that are used redundantly, such as a group consisting of long-time jobs “@ 102”, “@ 101”, and “@ 103”, it is common to all jobs. The server to be used, that is, the DB server 160 is preferentially detected. In this way, among the servers used by each job included in the group, a server that is used in common for all jobs is detected, so it is commonly used in a group that is executed during long-time job execution. Thus, it is possible to detect a server that is more likely to have resource contention.

S411で、監視部310は、記憶部320に記憶された、所定の月日のDBサーバ160におけるリソース使用情報表321から、S409で纏められたグループの少なくとも1つのジョブが実行中のレコード(リソース使用情報103)を抽出する。   In S <b> 411, the monitoring unit 310 records (resources) in which at least one job of the group summarized in S <b> 409 is being executed from the resource usage information table 321 in the DB server 160 stored in the storage unit 320. Usage information 103) is extracted.

S600で、監視部310は、表示時間帯を設定し、S412で、監視部310は、表示開始時刻「10:01」及び表示終了時刻「12:30」において、
長時間ジョブ「@102」と「@101」及び「@103」のジョブとからなるグループの各ジョブの実行時間欄226Eに格納にされた時間及びS411で抽出したレコード(リソース使用情報103)に含まれる所定のリソースの使用率、例えばハードディスクIO使用率欄321Dの格納された値を、表示部330に表示し、ジョブ監視部310は処理を終了する。
In S600, the monitoring unit 310 sets a display time zone. In S412, the monitoring unit 310 sets the display start time “10:01” and the display end time “12:30”.
The time stored in the execution time column 226E of each job of the group consisting of the long-time jobs “@ 102”, “@ 101”, and “@ 103” and the record (resource usage information 103) extracted in S411. The usage rate of the predetermined resource included, for example, the value stored in the hard disk IO usage rate column 321D is displayed on the display unit 330, and the job monitoring unit 310 ends the processing.

図13は、図1に示した表示部に表示する画面を説明するイメージ図である。図11に示すように、DBサーバ160は長時間ジョブ「@102」(B部門受注伝票回収ジョブ)の実行中に他のジョブ(A部門受注伝票回収ジョブ及びC部門受注伝票回収ジョブ)を実行するので、リソース競合が発生して太線で表したハーディスクIO使用率が閾値を超えるとともに、長時間ジョブ「@107」(B部門受発注伝票印刷ジョブ)の実行中に他のジョブ(A部門受発注伝票印刷ジョブ及びC部門受発注伝票印刷ジョブ)を実行するので、リソース競合が発生して太線で表したハーディスクIO使用率が閾値を超えている。また、各ジョブの実行時間とハードディスクIO使用率とを重ねて表示することで、部門別の受注伝票回収ジョブでは矢印Bで表したB部門のハードディスクIO使用率が高く、部門別の受発注伝票印刷ジョブでは矢印Bで表したB部門のハードディスクIO使用率が高いことが分かる。このように、S409で纏めたグループの各ジョブの実行時間とリソース使用情報103に含まれるハードディスクIO使用率とが重ねて表示されるので、リソース使用情報103におけるジョブごとの内訳を容易に把握することができる。   FIG. 13 is an image diagram for explaining a screen displayed on the display unit shown in FIG. As shown in FIG. 11, the DB server 160 executes other jobs (A department order receipt collection job and C department order receipt collection job) while the long time job “@ 102” (B department order receipt collection job) is being executed. Therefore, a resource conflict occurs and the hard disk IO usage rate indicated by a bold line exceeds the threshold, and another job (A department) is being executed while the long-time job “@ 107” (B department order receipt print job) is being executed. Order receipt / print order print job and C department order / order print job), resource contention occurs and the hard disk IO usage rate indicated by a bold line exceeds the threshold. Also, by displaying the execution time of each job and the hard disk IO usage rate in an overlapping manner, the departmental order slip collection job has a high hard disk IO usage rate for the department B indicated by the arrow B, and the department-specific ordering slips. It can be seen that in the print job, the hard disk IO usage rate in the B section indicated by the arrow B is high. As described above, since the execution time of each job of the group summarized in S409 and the hard disk IO usage rate included in the resource usage information 103 are displayed, the breakdown for each job in the resource usage information 103 can be easily grasped. be able to.

本実施形態では、S401で監視部310が長時間ジョブネットを選択し、S403で長時間ジョブを選択するようにしたが、これに限定されず、監視サーバの利用者が選択するようにしてもよい。また、本実施形態では、各実行サーバのリソース監視エージェント102が所定時間間隔でリソース使用情報103を監視サーバに送信し、監視部は記憶部320に記憶されたリソース使用情報表321からリソース使用情報103を抽出するようにしたが、これに限定されず、監視部310が各実行サーバからリソース使用情報103を取得するようにしてもよい。さらに、本実施形態では、ジョブネットが終了した状態、すなわち、ジョブネット実績表225の終了時刻欄225D及び実行時間欄225Eに情報が格納され、ジョブ実績表226の終了時刻欄226D及び実行時間欄226Eに情報が格納された状態で監視するようにしたが、これに限定されず、ジョブネットを実行中に監視するようにしてもよい。この場合、ジョブネット実績表225の終了時刻欄225D及び実行時間欄225Eは情報が格納されておらず、ジョブ実績表226の終了時刻欄226D及び実行時間欄226Eは情報が格納されていないため、監視部310は監視時点の時刻を終了時刻とみなし、ジョブネット及び各ジョブの実行時間を算出する。   In this embodiment, the monitoring unit 310 selects a long-time job net in S401 and selects a long-time job in S403. However, the present invention is not limited to this, and the monitoring server user may select it. Good. In this embodiment, the resource monitoring agent 102 of each execution server transmits the resource usage information 103 to the monitoring server at a predetermined time interval, and the monitoring unit uses the resource usage information table 321 stored in the storage unit 320. However, the present invention is not limited to this, and the monitoring unit 310 may acquire the resource usage information 103 from each execution server. Further, in the present embodiment, information is stored in the job net finished state, that is, the end time column 225D and the execution time column 225E of the job net result table 225, and the end time column 226D and the execution time column of the job result table 226 are stored. Although monitoring is performed in a state where information is stored in 226E, the present invention is not limited to this, and the job net may be monitored during execution. In this case, no information is stored in the end time column 225D and the execution time column 225E of the job net result table 225, and no information is stored in the end time column 226D and the execution time column 226E of the job result table 226. The monitoring unit 310 regards the time at the monitoring time as the end time, and calculates the execution time of the job net and each job.

このように、本発明によれば、長時間ジョブと長時間ジョブの実行中に実行されるジョブとがグループに纏められ、グループに含まれる各ジョブが使用するサーバのうち、重複して使用されるサーバが検出され、検出されたサーバにおける、当該グループの少なくとも1つのジョブの実行中のリソース使用情報103が抽出されるので、長時間ジョブの実行中に実行されるグループにおいて重複して使用され、リソース競合が発生している可能性が高いサーバのリソース使用情報を、長時間ジョブの実行中を含み、リソース競合が発生している可能性が高いグループの実行時間を単位として、取得することができる。これにより、従来のように全てのサーバを対象としてジョブ単位にサーバのリソース使用情報を取得する必要がなく、リソース競合が発生している可能性が高いサーバにおける、リソース競合が発生している可能性が高い時間のリソース使用情報103から、容易に長期化の原因を特定することができる。   As described above, according to the present invention, a long-time job and a job that is executed during the execution of a long-time job are grouped together, and are used redundantly among servers used by each job included in the group. Since the resource usage information 103 during the execution of at least one job of the group in the detected server is extracted, it is used redundantly in the group that is executed during the long-time job execution. Obtain resource usage information for servers that are likely to have resource contention, in units of execution time for groups that are likely to have resource contention, including long-running jobs. Can do. As a result, there is no need to acquire server resource usage information for each server for all servers as in the past, and resource contention may occur on servers where there is a high possibility of resource contention. It is possible to easily identify the cause of the prolonged period from the resource use information 103 of the time with high probability.

また、長時間ジョブとホストサーバが同一で、かつ、長時間ジョブの実行中に実行されるジョブとがグループに纏められ、当該ホストサーバにおける、当該グループの少なくとも1つのジョブの実行中のリソース使用情報103が抽出されるので、長時間ジョブの実行中に実行されるグループにおいて共通して使用され、リソース競合が発生している可能性が高いホストサーバのリソース使用情報を、長時間ジョブの実行中を含み、リソース競合が発生している可能性が高いグループの実行時間を単位として、取得することができる。これにより、従来のように全てのサーバを対象としてジョブ単位にサーバのリソース使用情報を取得する必要がなく、リソース競合が発生している可能性が高いホストサーバにおける、リソース競合が発生している可能性が高い時間のリソース使用情報103から、容易に長期化の原因を特定することができる。   Also, the long-time job and the host server are the same, and the job that is executed while the long-time job is being executed is grouped, and the resource usage during execution of at least one job of the group in the host server Since the information 103 is extracted, the resource usage information of the host server that is commonly used in the group that is executed during the execution of a long-time job and that is likely to have resource contention is used for the long-time job execution. It is possible to obtain the execution time of a group including the inside and having a high possibility of resource contention as a unit. As a result, there is no need to acquire server resource usage information for each server for all servers as in the past, and resource contention has occurred on host servers that are likely to have resource contention. It is possible to easily identify the cause of the prolonged period from the resource use information 103 of the time with high possibility.

また、グループに含まれる各ジョブが使用するサーバのうち、全てのジョブに共通して使用されるサーバが検出されるので、長時間ジョブの実行中に実行されるグループにおいて共通して使用され、リソース競合が発生している可能性が更に高いサーバを検出することができる。これにより、リソース競合が発生している可能性が更に高いホストサーバにおける、リソース競合が発生している可能性が高い時間のリソース使用情報103から、容易に長期化の原因を特定することができる。   In addition, among servers used by each job included in the group, a server that is commonly used for all jobs is detected, so that it is commonly used in a group that is executed during long-time job execution, Servers that are more likely to have resource contention can be detected. As a result, it is possible to easily identify the cause of the prolonged period from the resource usage information 103 of the time when the possibility of resource contention occurring is high in the host server where the possibility of resource contention is more likely to occur. .

また、S409で纏めたグループの各ジョブの実行時間とリソース使用情報103に含まれるハードディスクIO使用率とが重ねて表示されるので、リソース使用情報103におけるジョブごとの内訳を容易に把握することができる。   Further, since the execution time of each job of the group summarized in S409 and the hard disk IO usage rate included in the resource usage information 103 are displayed in an overlapping manner, it is possible to easily grasp the breakdown for each job in the resource usage information 103. it can.

また、S405で纏めたグループの長時間ジョブの実行時間とリソース使用情報103に含まれるCPU使用率とが並べて表示されるので、リソース使用情報103におけるジョブごとの内訳を容易に把握することができる。   Further, since the execution time of the long-time job of the group summarized in S405 and the CPU usage rate included in the resource usage information 103 are displayed side by side, the breakdown for each job in the resource usage information 103 can be easily grasped. .

なお、本発明の構成は、前述の実施形態にのみ限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々変更を加えてもよい。   In addition, the structure of this invention is not limited only to the above-mentioned embodiment, You may add a various change within the range which does not deviate from the summary of this invention.

バッチ処理システムの全体構成を説明する概略構成図である。It is a schematic block diagram explaining the whole structure of a batch processing system. 図1に示したリソース使用情報表の構成を説明する構成図である。FIG. 2 is a configuration diagram illustrating a configuration of a resource usage information table illustrated in FIG. 1. 図1に示したジョブネット定義情報の構成を説明する構成図である。FIG. 2 is a configuration diagram illustrating a configuration of job net definition information illustrated in FIG. 1. 図1に示したジョブネット実行サーバ管理表の構成を説明する構成図である。FIG. 2 is a configuration diagram illustrating a configuration of a job net execution server management table illustrated in FIG. 1. 図1に示したジョブネット予定表の構成を説明する構成図である。FIG. 2 is a configuration diagram illustrating a configuration of a job net schedule shown in FIG. 1. 図1に示したジョブ予定表の構成を説明する構成図である。FIG. 2 is a configuration diagram illustrating a configuration of a job schedule table illustrated in FIG. 1. 図1に示したジョブネット実績表の構成を説明する構成図である。FIG. 2 is a configuration diagram illustrating a configuration of a job net performance table illustrated in FIG. 1. 図1に示したジョブ実績表の構成を説明する構成図である。It is a block diagram explaining the structure of the job performance table shown in FIG. 図1に示した監視部の動作を説明するフローチャートである。It is a flowchart explaining operation | movement of the monitoring part shown in FIG. 図9に示した長時間ジョブと並列実行するジョブの検出処理を説明するフローチャートである。10 is a flowchart for describing a job detection process that is executed in parallel with the long-time job illustrated in FIG. 9. 図9に示した表示時間帯設定処理を説明するフローチャートである。10 is a flowchart for explaining display time zone setting processing shown in FIG. 9. 図1に示した表示部に表示する画面を説明するイメージ図である。It is an image figure explaining the screen displayed on the display part shown in FIG. 図1に示した表示部に表示する画面を説明するイメージ図である。It is an image figure explaining the screen displayed on the display part shown in FIG.

符号の説明Explanation of symbols

103…リソース使用情報、110…第1APサーバ、120…第2APサーバ、130…第3APサーバ、140…第4APサーバ、150…第5APサーバ、160…DBサーバ、300…監視サーバ、310…監視部。 DESCRIPTION OF SYMBOLS 103 ... Resource usage information, 110 ... 1st AP server, 120 ... 2nd AP server, 130 ... 3rd AP server, 140 ... 4th AP server, 150 ... 5th AP server, 160 ... DB server, 300 ... Monitoring server, 310 ... Monitoring part .

Claims (13)

それぞれが少なくとも1つのサーバを使用する複数のジョブからなる一連のジョブ群を、複数の前記サーバで実行するバッチ処理を監視するバッチ処理監視装置において、
前記各ジョブは、使用する前記サーバのうちの1つがホストサーバとして設定されており、
前記複数のジョブのうち、ジョブの実行時間が予め設定された予定実行時間を超えるジョブを所定のジョブとして選択する長時間ジョブ選択部と
前記長時間ジョブ選択部によって選択された所定のジョブと、設定された前記ホストサーバが前記所定のジョブと同一で、かつ、前記所定のジョブと同じジョブ群で前記所定のジョブの実行中に実行される別の前記ジョブとを、第1グループとして纏める第1纏め部と、
前記サーバにおけるリソースの使用状態を示すリソース使用情報であって、前記所定のジョブに設定された前記ホストサーバにおける、前記第1グループの少なくとも1つのジョブの実行中の第1の前記リソース使用情報を取得する第1取得部と、
前記第1取得部によって取得された第1のリソース使用情報に含まれるリソースの使用率が所定の閾値以下である場合に、前記長時間ジョブ選択部によって選択された所定のジョブと、前記所定のジョブと同じジョブ群で前記所定のジョブの実行中に実行される別の前記ジョブとを、第グループとして纏める第纏め部と、
前記第2纏め部によって纏められたグループの各ジョブが使用する前記サーバのうち、前記第グループの複数のジョブによって使用されるサーバを検出する検出部と、
前記検出部によって検出されたサーバにおける、前記第グループの少なくとも1つのジョブの実行中の第2の前記リソース使用情報を取得する第取得部と
を備える
ことを特徴とするバッチ処理監視装置。
In a batch processing monitoring apparatus that monitors a batch process executed by a plurality of the servers, a series of job groups each including a plurality of jobs each using at least one server,
In each of the jobs, one of the servers to be used is set as a host server,
A long-time job selection unit that selects, as a predetermined job, a job whose job execution time exceeds a preset scheduled execution time among the plurality of jobs;
The predetermined job selected by the long-time job selection unit and the set host server are the same as the predetermined job and executed during execution of the predetermined job in the same job group as the predetermined job A first summarizing unit that collects the different jobs as a first group;
Resource usage information indicating a resource usage state in the server, the first resource usage information during execution of at least one job of the first group in the host server set in the predetermined job. A first acquisition unit to acquire;
When utilization of resource included in the first resource use information acquired by the first acquiring unit is equal to or less than a predetermined threshold value, and a predetermined job said for a long time selected by the job selection portion, of the predetermined A second summarizing unit that collects another job executed during execution of the predetermined job in the same job group as the job as a second group;
A detection unit for detecting a server used by a plurality of jobs of the second group among the servers used by the jobs of the second group collected by the second collection unit ;
Wherein in the detected server by the detection unit, the batch process monitoring device, characterized in that it comprises a second acquisition unit for acquiring the second of the resource use information for at least one job in the execution of the second group.
前記検出部は、前記第グループの全てのジョブに共通して使用される前記サーバを検出する
ことを特徴とする請求項1に記載のバッチ処理監視装置。
The batch processing monitoring apparatus according to claim 1, wherein the detection unit detects the server used in common for all jobs of the second group.
前記第纏め部は、前記所定のジョブと、設定された前記ホストサーバが前記所定のジョブと同一で、かつ、前記所定のジョブの終了時刻以前に実行を開始し、かつ、前記所定のジョブの開始時刻以降に実行を終了する前記ジョブとを、前記第グループとして纏める
ことを特徴とする請求項1に記載のバッチ処理監視装置。
The first summarizing unit is configured to start execution of the predetermined job and the set host server that is the same as the predetermined job and before an end time of the predetermined job, and the predetermined job. The batch processing monitoring apparatus according to claim 1 , wherein the jobs whose execution ends after the start time are grouped as the first group.
前記第グループの各ジョブの実行時間と、前記第取得部により取得された前記リソース使用情報とを表示する第表示部を備える
ことを特徴とする請求項1に記載のバッチ処理監視装置。
The batch processing monitoring apparatus according to claim 1, further comprising a first display unit that displays an execution time of each job of the first group and the resource usage information acquired by the first acquisition unit. .
前記第2纏め部は、前記所定のジョブと、前記所定のジョブの終了時刻以前に実行を開始し、かつ、前記所定のジョブの開始時刻以降に実行を終了する前記ジョブとを、前記第2グループとして纏める
ことを特徴とする請求項1に記載のバッチ処理監視装置。
The second bundling unit is configured to execute the predetermined job and the job that starts execution before the end time of the predetermined job and ends execution after the start time of the predetermined job. The batch processing monitoring apparatus according to claim 1, wherein the batch processing monitoring apparatus is grouped as a group .
前記第2グループの各ジョブの実行時間と、前記第2取得部により取得された前記リソース使用情報とを表示する第2表示部を備える
ことを特徴とする請求項に記載のバッチ処理監視装置。
The batch processing monitoring apparatus according to claim 1 , further comprising: a second display unit that displays an execution time of each job of the second group and the resource usage information acquired by the second acquisition unit. .
それぞれが少なくとも1つのサーバを使用する複数のジョブからなる一連のジョブ群を、複数の前記サーバで実行するバッチ処理を監視するバッチ処理監視方法において、
前記各ジョブは、使用する前記サーバのうちの1つがホストサーバとして設定されており、
前記複数のジョブのうち、ジョブの実行時間が予め設定された予定実行時間を超えるジョブを所定のジョブとして選択する長時間ジョブ選択ステップと
前記長時間ジョブ選択ステップで選択した所定のジョブと、設定された前記ホストサーバが前記所定のジョブと同一で、かつ、前記所定のジョブと同じジョブ群で前記所定のジョブの実行中に実行される別の前記ジョブとを、第1グループとして纏める第1纏めステップと、
前記サーバにおけるリソースの使用状態を示すリソース使用情報であって、前記所定のジョブに設定された前記ホストサーバにおける、前記第1グループの少なくとも1つのジョブの実行中の第1の前記リソース使用情報を取得する第1取得ステップと、
前記第1取得ステップで取得した第1のリソース使用情報に含まれるリソースの使用率が所定の閾値以下である場合に、前記長時間ジョブ選択ステップで選択した所定のジョブと、前記所定のジョブと同じジョブ群で前記所定のジョブの実行中に実行される別の前記ジョブとを、第グループとして纏める第纏めステップと、
前記第2纏めステップで纏めたグループの各ジョブが使用する前記サーバのうち、前記第グループの複数のジョブによって使用されるサーバを検出する検出ステップと、
前記検出ステップで検出たサーバにおける、前記第グループの少なくとも1つのジョブの実行中の第2の前記リソース使用情報を取得する第取得ステップと
を備える
ことを特徴とするバッチ処理監視方法。
In a batch process monitoring method for monitoring a batch process executed by a plurality of the servers, a series of job groups each including a plurality of jobs each using at least one server,
In each of the jobs, one of the servers to be used is set as a host server,
A long-time job selection step of selecting, as a predetermined job, a job whose job execution time exceeds a preset scheduled execution time among the plurality of jobs;
The predetermined job selected in the long-time job selection step and the set host server are the same as the predetermined job and are executed during execution of the predetermined job in the same job group as the predetermined job. A first bundling step of bundling another job as a first group;
Resource usage information indicating a resource usage state in the server, the first resource usage information during execution of at least one job of the first group in the host server set in the predetermined job. A first acquisition step of acquiring;
A predetermined job selected in the long-time job selection step when the resource usage rate included in the first resource usage information acquired in the first acquisition step is less than or equal to a predetermined threshold ; and another of the job to be executed during execution of the predetermined job in the same job group, and the second summary step summarized as a second group,
A detecting step of detecting a server used by a plurality of jobs of the second group among the servers used by the jobs of the second group collected in the second collecting step ;
At the server detected by the detecting step, a batch process monitoring method characterized by comprising a second acquisition step of acquiring second of the resource use information for at least one job in the execution of the second group.
前記検出ステップは、前記第グループの全てのジョブに共通して使用される前記サーバを検出する
ことを特徴とする請求項に記載のバッチ処理監視方法。
The batch processing monitoring method according to claim 7 , wherein the detecting step detects the server used in common for all jobs of the second group.
前記第1纏めステップは、前記所定のジョブと、設定された前記ホストサーバが前記所定のジョブと同一で、かつ、前記所定のジョブの終了時刻以前に実行を開始し、かつ、前記所定のジョブの開始時刻以降に実行を終了する前記ジョブとを、前記第1グループとして纏める
ことを特徴とする請求項に記載のバッチ処理監視方法。
In the first bundling step, the predetermined job and the set host server start executing before the end time of the predetermined job that is the same as the predetermined job, and the predetermined job The batch processing monitoring method according to claim 7 , wherein the jobs whose execution ends after the start time are grouped as the first group .
前記第1纏めステップは、前記第1グループの各ジョブの実行時間と、前記第1取得ステップにより取得された前記リソース使用情報とを表示する第1表示ステップをさらに含む
ことを特徴とする請求項に記載のバッチ処理監視方法。
The first collecting step further includes a first display step of displaying an execution time of each job of the first group and the resource usage information acquired by the first acquisition step. 8. The batch processing monitoring method according to 7 .
前記第纏めステップは、前記所定のジョブと、前記所定のジョブの終了時刻以前に実行を開始し、かつ、前記所定のジョブの開始時刻以降に実行を終了する前記ジョブとを、前記第グループとして纏める
ことを特徴とする請求項に記載のバッチ処理監視方法。
The second summary step, the a predetermined job, to start the execution end time before the predetermined job, and, and said job finishes execution since the start time of the predetermined job, the second The batch processing monitoring method according to claim 7 , wherein the batch processing monitoring method is summarized as a group.
前記第取得ステップは、前記グループの各ジョブの実行時間と、取得した前記リソース使用情報とを表示する第表示ステップをさらに含む
ことを特徴とする請求項に記載のバッチ処理監視方法。
Said second obtaining step, the second group run time for each job, the batch process monitoring according to claim 7, further comprising a second display step of displaying the acquired the resource use information Method.
それぞれが少なくとも1つのサーバを使用する複数のジョブからなる一連のジョブ群を複数の前記サーバで実行するバッチ処理を監視するバッチ処理監視装置におけるコンピュータに実行させるプログラムにおいて
前記各ジョブは、使用する前記サーバのうちの1つがホストサーバとして設定されており、
前記複数のジョブのうち、ジョブの実行時間が予め設定された予定実行時間を超えるジョブを所定のジョブとして選択する長時間ジョブ選択ステップと
前記長時間ジョブ選択ステップで選択した所定のジョブと、設定された前記ホストサーバが前記所定のジョブと同一で、かつ、前記所定のジョブと同じジョブ群で前記所定のジョブの実行中に実行される別の前記ジョブとを、第1グループとして纏める第1纏めステップと、
前記サーバにおけるリソースの使用状態を示すリソース使用情報であって、前記所定のジョブに設定された前記ホストサーバにおける、前記第1グループの少なくとも1つのジョブの実行中の第1の前記リソース使用情報を取得する第1取得ステップと、
前記第1取得ステップで取得した第1のリソース使用情報に含まれるリソースの使用率が所定の閾値以下である場合に、前記長時間ジョブ選択ステップで選択した所定のジョブと、前記所定のジョブと同じジョブ群で前記所定のジョブの実行中に実行される別の前記ジョブとを、第グループとして纏める第纏めステップと、
前記第2纏めステップで纏めたグループの各ジョブが使用する前記サーバのうち、前記第グループの複数のジョブによって使用されるサーバを検出する検出ステップと、
前記検出ステップで検出たサーバにおける、前記第グループの少なくとも1つのジョブの実行中の第2の前記リソース使用情報を取得する第取得ステップと
バッチ処理監視装置におけるコンピュータに実行させるプログラム
In a program for causing a computer in a batch process monitoring apparatus to monitor a batch process in which a series of job groups each including a plurality of jobs using at least one server are executed by a plurality of the servers,
In each of the jobs, one of the servers to be used is set as a host server,
A long-time job selection step of selecting, as a predetermined job, a job whose job execution time exceeds a preset scheduled execution time among the plurality of jobs;
The predetermined job selected in the long-time job selection step and the set host server are the same as the predetermined job and are executed during execution of the predetermined job in the same job group as the predetermined job. A first bundling step of bundling another job as a first group;
Resource usage information indicating a resource usage state in the server, the first resource usage information during execution of at least one job of the first group in the host server set in the predetermined job. A first acquisition step of acquiring;
A predetermined job selected in the long-time job selection step when the resource usage rate included in the first resource usage information acquired in the first acquisition step is less than or equal to a predetermined threshold ; and another of the job to be executed during execution of the predetermined job in the same job group, and the second summary step summarized as a second group,
A detecting step of detecting a server used by a plurality of jobs of the second group among the servers used by the jobs of the second group collected in the second collecting step ;
At the server detected by the detection step, the program for executing a second acquisition step of acquiring second of the resource use information for at least one job in the execution of the second group to the computer in a batch process monitoring device.
JP2008134180A 2008-05-22 2008-05-22 Batch processing monitoring apparatus, batch processing monitoring method and program Expired - Fee Related JP5062896B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008134180A JP5062896B2 (en) 2008-05-22 2008-05-22 Batch processing monitoring apparatus, batch processing monitoring method and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008134180A JP5062896B2 (en) 2008-05-22 2008-05-22 Batch processing monitoring apparatus, batch processing monitoring method and program

Publications (2)

Publication Number Publication Date
JP2009282754A JP2009282754A (en) 2009-12-03
JP5062896B2 true JP5062896B2 (en) 2012-10-31

Family

ID=41453145

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008134180A Expired - Fee Related JP5062896B2 (en) 2008-05-22 2008-05-22 Batch processing monitoring apparatus, batch processing monitoring method and program

Country Status (1)

Country Link
JP (1) JP5062896B2 (en)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101212339B1 (en) * 2011-06-21 2012-12-13 에스케이씨앤씨 주식회사 Method for monitoring job processing and system using the same
JP5884566B2 (en) * 2012-03-09 2016-03-15 日本電気株式会社 Batch processing system, progress confirmation device, progress confirmation method, and program
WO2014167716A1 (en) * 2013-04-12 2014-10-16 株式会社日立製作所 Computer system management system and management method
JP6273867B2 (en) * 2014-01-29 2018-02-07 日本電気株式会社 Job performance analysis system, job performance analysis method and program
CA2942541C (en) 2014-04-17 2022-11-22 Ab Initio Technology Llc Integrated monitoring and control of processing environment
JP6290810B2 (en) * 2015-03-20 2018-03-07 富士通フロンテック株式会社 Management apparatus and management method
JP6531597B2 (en) * 2015-09-28 2019-06-19 富士通株式会社 Analysis processing program, analysis processing method and analysis processing apparatus

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3537356B2 (en) * 1998-12-09 2004-06-14 株式会社日立製作所 Delay factor analysis method in job system
JP3936924B2 (en) * 2003-06-18 2007-06-27 株式会社日立製作所 Job scheduling method and system
JP2007249491A (en) * 2006-03-15 2007-09-27 Fujitsu Ltd Program, device and method for distributing batch job in multi-server environment
JP4928480B2 (en) * 2008-01-31 2012-05-09 株式会社野村総合研究所 Job processing system and job management method

Also Published As

Publication number Publication date
JP2009282754A (en) 2009-12-03

Similar Documents

Publication Publication Date Title
JP5062896B2 (en) Batch processing monitoring apparatus, batch processing monitoring method and program
JP4255317B2 (en) Operation monitoring method, execution system, and processing program
US6606658B1 (en) Apparatus and method for server resource usage display by comparison of resource benchmarks to determine available performance
JP5701403B2 (en) Monitoring computer and method
US20080127212A1 (en) Memory leak detecting method, memory leak detecting device and memory leak detecting program
JP5948257B2 (en) Information processing system monitoring apparatus, monitoring method, and monitoring program
JP5674248B2 (en) Monitoring status display device, monitoring status display method, and monitoring status display program
WO2012025977A1 (en) Method of managing schedule and schedule management server
US8214758B2 (en) Information processing apparatus, method of control for same, and program
TW200941214A (en) Executing software performance test jobs in a clustered system
JP2005327261A (en) Performance monitoring device, performance monitoring method and program
JP2010146306A (en) Configuration monitoring system and configuration monitoring method
JP5740338B2 (en) Virtual environment operation support system
JP2016178570A (en) Workflow execution processing apparatus, workflow execution system, workflow execution system control method, and program
JP2021189702A (en) Manufacture management support system and method
JP5982513B2 (en) Monitoring computer and method
JP6097666B2 (en) Job management system
WO2013186891A1 (en) Progress status management system, and progress status management method
JP2006235872A (en) Project management apparatus
US10585620B2 (en) Storage monitoring system for monitoring components in a storage system in a distributed manner
EP2741212A1 (en) System resource management method for virtual system
JP2009043188A (en) Operation management support system, and program
JP2009134535A (en) Device for supporting software development, method of supporting software development, and program for supporting software development
JP6335810B2 (en) Worker management device and worker management program
JP7131132B2 (en) Display control method, display control program, and display control device

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100820

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111129

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120110

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120309

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120403

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20120502

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120529

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120710

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120806

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150817

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees