JP2004164271A - Job execution monitoring method and program - Google Patents
Job execution monitoring method and program Download PDFInfo
- Publication number
- JP2004164271A JP2004164271A JP2002329171A JP2002329171A JP2004164271A JP 2004164271 A JP2004164271 A JP 2004164271A JP 2002329171 A JP2002329171 A JP 2002329171A JP 2002329171 A JP2002329171 A JP 2002329171A JP 2004164271 A JP2004164271 A JP 2004164271A
- Authority
- JP
- Japan
- Prior art keywords
- job
- time
- reference time
- log information
- predetermined
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Debugging And Monitoring (AREA)
Abstract
Description
【0001】
【発明の属する技術分野】
本発明は、コンピュータシステムのジョブの実行監視の方法及びプログラムに関し、特に、ジョブ実行時のシステムの異常を検出するジョブ実行監視方法及びプログラムに関する。
【0002】
【従来の技術】
コンピュータシステムの高度利用により、例えば金融機関の事務センタでは、24時間運転が通常となっている。日中には顧客対応を中心とするオンライン業務処理システムが稼動し、夜間にはオンライン業務処理締後の日次処理として、主にバッチ業務処理システムが運用されている。
【0003】
昨今ではジョブ運用における自動化が進展し、バッチ業務処理システムでは無人運転に近い状態でコンピュータシステムが稼動している。したがって、ジョブが正常に稼動し、翌朝のオンライン業務処理システムの稼動開始時刻までにバッチ業務処理が完了していることが求められる。
【0004】
したがって、このようなコンピュータシステムにおいてハードウェアやソフトウェアの不具合に伴う障害が発生した場合にシステムの復旧が遅れると、その後の業務処理システムの運用に大きな影響を与えるため、システム障害発生の早期検出とその後の対応は、緊急を要することとなる。
【0005】
また、コンピュータシステムの処理能力が限界に近く、データ処理量がピークに達する場合には、翌朝の所定時刻までにバッチ業務処理が終了しない事態も想定される。
【0006】
以上述べたようなシステムにおいて、ジョブの運用状況を監視し、所定の処理が既定の基準時刻までに終了していない事象を検出した場合に、システムの障害発生を通知するシステムが知られている(例えば、特許文献1及び特許文献2参照。)。
【0007】
【特許文献1】
特開平11−120033号公報(第2図)
【特許文献2】
特開2002−278804号公報(第1図)
【0008】
【発明が解決しようとする課題】
しかしながら、このようなシステムでは、ジョブが終了することを前提として設計されている。このためジョブ実行中にシステムに障害が発生してジョブが異常終了した場合、ジョブの終了時刻が記録されずに終了予定時刻(特許文献1における実行終了最遅時刻、あるいは特許文献2における比較テーブルの終了時刻)との比較ができなくなる。この場合には運用状況を監視して所定の処理が既定の基準時刻までに終了していない事象を検出することができず、システム障害発生の通知に多大な遅延を生じるという課題がある。
【0009】
したがって、本発明の目的は、ジョブが異常終了した場合でもシステム障害発生を早急に通知することが可能なジョブ実行監視方法及びプログラムを提供することにある。
【0010】
【課題を解決するための手段】
前記目的を達成するために、本発明に係るジョブ実行監視方法は、第1の視点によれば、ジョブが終了する予め定めた終了基準時刻に時刻が達した時点で、前記ジョブに対応するログ情報に所望の値が記録されているか否かを判定する方法とされる。
【0011】
また、本発明に係るジョブ実行監視方法は、第2の視点によれば、ジョブが終了する予め定めた終了基準時刻に時刻が達した時点で、前記ジョブに対応するログ情報が所定量記録されていない場合、または前記ジョブの終了実時刻が前記終了基準時刻を超えている場合に、前記ジョブを実行したシステムに異常がある旨を前記システムの外部に通報する通報システムを起動する方法とされる。
【0012】
さらに、本発明に係るジョブ実行監視方法は、第3の視点によれば、バッチ業務処理がスタートすると動作し、前記バッチ業務処理におけるジョブ毎の予め定めた終了基準時刻を監視し、時刻が前記ジョブの終了基準時刻に達した時点で、前記ジョブに対応するログ情報が所定量記録されていない場合、または前記ジョブの終了実時刻が前記終了基準時刻を超えている場合に、前記バッチ業務処理システムに異常があると判断し、前記バッチ業務処理システムの外部に通報する通報システムを起動する方法とされる。
【0013】
本発明において、好ましくは、終了基準時刻は、前もって定めた基準時刻に所定の時間差分を加えてあってもよい。
【0014】
本発明において、好ましくは、通報システムは、監視端末へのメッセージ表示、ブザーの鳴動によるオペレータコール、予め登録してあるシステム関係者への電話や電子メールによる自動通報の少なくとも一つを実行してもよい。
【0015】
また、本発明に係るジョブ実行監視プログラムは、第4の視点によれば、ジョブ毎に予め定めた終了基準時刻が記録してある監視情報パラメータテーブルと、前記ジョブ毎に終了実時刻を含むログ情報が記録されるログ情報テーブルと、あるジョブに対応する前記監視情報パラメータテーブル内の終了基準時刻に時刻が達したか否かを判定するステップと、時刻が前記終了基準時刻に達したと判定された際に、前記ジョブに対応するログ情報が前記ログ情報テーブルに所定量記録されているかを判定するステップと、前記ジョブに対応するログ情報が所定量記録されている場合に前記ログ情報テーブル内の前記ジョブの終了実時刻が前記ジョブの終了基準時刻を超えているかを判定するステップと、前記ジョブに対応するログ情報が所定量記録されていない場合、または前記ジョブの終了実時刻が前記ジョブの終了基準時刻を超えている場合に、前記ジョブを実行しているシステムに異常がある旨を前記システムの外部に通報する通報システムを起動するステップと、を含むプログラムとされる。
【0016】
本発明において、好ましくは、ジョブ実行監視プログラムは、バッチ業務処理システムがスタートすることで起動されてもよい。
【0017】
【発明の実施の形態】
添付図面を参照して、本発明の実施の形態を以下に説明する。
【0018】
図1は、本発明の実施の形態に係るバッチ業務処理システムの構成を示すブロック図である。バッチ業務処理システムは、ジョブ実行監視システム1とジョブ実行システム2と通報システム7とから構成される。ジョブ実行監視システム1は、ジョブ実行システム2が実行するジョブを監視するシステムであって、監視情報パラメータ・ファイル3と、ログ・ファイル4と、運用監視プログラム5と、通報処理プログラム6と、から構成される。
【0019】
監視情報パラメータ・ファイル3は、予め定義したジョブの処理単位の実行終了基準時刻をテーブル化して記録したファイルである。ログ・ファイル4は、ジョブ実行システム2におけるバッチ業務処理の実行開始から実行終了までの実行時における発生イベント情報すなわちジョブの処理単位のログ情報をテーブル化して記録したファイルである。運用監視プログラム5は、監視情報パラメータ・ファイル3の内容とログ・ファイル4の内容とを処理単位毎に対比・検証するプログラムである。通報処理プログラム6は、運用監視プログラム5においてジョブが異常終了したことを検出した場合に起動され、ジョブの異常終了をシステムの外部に自動通報する通報システム7を起動するためのプログラムである。
【0020】
ジョブ実行システム2は、バッチ業務処理を実行するシステムであって、スタートすると運用監視プログラム5の実行を開始させると共に、バッチ業務に従ったジョブを処理し、設定したチェックポイントにおいてログ情報をログ・ファイル4に出力する。すなわち、ログ出力0、処理1、ログ出力1、処理2、ログ出力2、…、処理n、ログ出力n、…、処理z、ログ出力zを実行し、最後に運用監視プログラム5の実行を終了させる。図1では、ログ出力nまでがログ・ファイル4へ書き込まれている状態を示す。
【0021】
以上のような構成において、運用監視プログラム5は、ジョブ実行システム2がスタートすると動作を開始し、バッチ業務処理におけるジョブ毎に監視情報パラメータ・ファイル3内の終了基準時刻を監視する。ジョブの終了基準時刻に達した時点で、該当のジョブに対応するログ・ファイル4内のログ情報に所望の値が記録されていない場合、例えばログ情報が記録されていない場合あるいは所定量に不足している場合または該当するジョブの終了基準時刻を超えた終了実時刻が記録されている場合には、ジョブが異常終了したと判断する。ジョブが異常終了したと判断した場合に通報処理プログラム6を起動し、通報処理プログラム6は通報システム7を起動し、通報システム7は所定の通報の処理を実行する。
【0022】
したがって、ジョブ実行監視システム1は、以上のように動作するので、時刻があるジョブの終了基準時刻に達した時点でそのジョブの異常終了を検知した場合には、システム障害発生を早急に通知することができる。
【0023】
【実施例】
上記した本発明の実施の形態についてさらに詳細に説明すべく、本発明の実施例について図面を参照して説明する。
【0024】
図2は、本発明の実施例に係る監視情報パラメータ・ファイルのデータ構造を示す図である。ジョブ開始基準時刻Ts0及び処理jの終了基準時刻Tsjがジョブ実行システム稼動前に予め書き込まれている。ただし、jは1からzまでの整数とする。
【0025】
ジョブの稼動状況を検証する判定基準となるジョブ開始基準時刻Ts0及び処理jの終了基準時刻Tsjは、バッチ業務処理システムのジョブ構成及びジョブ実行順序が確定した後に、システム運用検討会等において各処理単位の実行時間等を基に決定される。
【0026】
すなわち、ジョブを構成する各処理単位の終了時点をチェックポイントとし、それぞれの終了基準時刻Tsjは、ジョブの運用開始基準時刻を起点とし、時系列の順に監視情報パラメータ・ファイル3内へ登録されている。
【0027】
なお、終了基準時刻Tsjについて、処理データ量の変動やシステム変更に応じて、定期または随時に見直され、適正な時刻が設定されるように維持する必要がある。
【0028】
図3は、本発明の実施例に係るログ・ファイルのデータ構造を示す図である。ジョブ実行システム2がスタートすると、ログ・ファイル4にはジョブ開始実時刻Tr0が書き込まれ、ジョブjの処理jのチェックポイントにおけるログ情報jが順次書き込まれる。ただし、図3では、jが1からnまで経過した状態の場合を表す。
【0029】
ログ情報jの中には処理jの終了実時刻Trjの項目が含まれる。なお、終了実時刻Trjの項目には、時刻に存在しないような大きな値をジョブ実行前に予め書き込んでおいてもよい。このようにすることで、ジョブが異常終了し、あるいはジョブが終了せずに、ジョブの終了時刻が終了実時刻Trjに書き込まれない場合が生じても、ジョブの終了実時刻が終了基準時刻を超えているものと判断することができる。
【0030】
図4は、本発明の実施例に係る運用監視プログラムの処理フローを示す図である。ジョブ実行システム2がスタートすると、ステップS0で運用監視プログラム5がスタートする。
【0031】
ステップS1では、ログ・ファイル4の初期化を行い、ログ情報をクリアあるいは所定の値にセットする。また、処理順を数えるカウンタiを0にセットする。
【0032】
ステップS2では、現時刻を取得し、ログ・ファイル4内のジョブ開始実時刻Tr0に設定する。
【0033】
ステップS3では、監視情報パラメータ・ファイル3内のジョブ開始基準時刻Ts0と処理iの終了基準時刻Tsi(iは1〜z)とを読み込む。
【0034】
ステップS4では、時間差分Δ=Tr0−Ts0を求める。バッチ業務処理システムにおいて、一般にはジョブ開始基準時刻Ts0で定める定刻にジョブ運用が開始されるとは限らないため、ジョブ開始実時刻Tr0とジョブ開始基準時刻Ts0との時間差分Δを求め、以下のステップにおける終了基準時刻Tsiを補正する。
【0035】
ステップS5では、カウンタiに1を加え、カウントアップする。
【0036】
ステップS6では、カウンタiが上限(z)を超えたか否かを比較する。上限以下の場合には、ステップ7に進む。上限を超えた場合には、ステップS13で、所定のジョブがすべて正常に終了したものとして終了処理を実行し、ステップS15で運用監視プログラムが終了する。
【0037】
ステップS7では、現在の時刻Tを取得する。
【0038】
ステップS8は、待機ルーチンであって、現在の時刻Tが処理iの終了基準時刻Tsiと時間差分Δとの和に達するか超えるかを待つ。すなわち、現在の時刻Tを刻々取得し、Tsi+Δ≦Tの場合には、ステップ9に進む。
【0039】
ステップS9では、ログ・ファイル4内に存在するログ情報i(終了実時刻Triを含む)を読み取る。
【0040】
ステップS10では、ログ情報iの有無を判定する。ログ情報iがない場合あるいは所定量に不足している場合には、何らかのシステム障害に起因してジョブの実行に遅延が生じたものとし、ステップS12に進む。ログ情報iが所定数ある場合にはステップS11に進む。
【0041】
ステップS11では、処理iの終了基準時刻Tsiと時間差分Δとの和が処理iの終了実時刻Tri以上であるか否かを比較する。Tsi+Δ≧Triの場合には、基準時間内でジョブの実行が進行したものとし、ステップ5に進む。Tsi+Δ<Triの場合には、何らかのシステム障害に起因してジョブの実行に遅延が生じているものとし、ステップ12に進む。なお、ステップS10とステップS11とは、その位置を互いに入れ替えてもよい。
【0042】
ステップS12では、通報処理プログラム6を起動し、ステップS14で運用監視プログラムが終了する。
【0043】
以上のようなステップにおいて、運用監視プログラム5は、ジョブ実行システム2がスタートすると動作を開始し、バッチ業務処理におけるジョブ毎に監視情報パラメータ・ファイル3内の終了基準時刻Tsiを監視する。
【0044】
その上で、運用監視プログラム5は、時刻がジョブの終了基準時刻Tsiに達した時点で、ジョブiに対応するログ情報iがログ・ファイル4内に記録されていない場合あるいは所定数に不足する場合、またはジョブiの終了実時刻Triが終了基準時刻Tsiを超えている場合には、ジョブiが異常終了したものと判断する。
【0045】
すなわち、ログ情報iがログ・ファイル4内に記録されていない場合あるいは所定数に不足する場合とは、ジョブiの処理が未完了あるいは途中で異常終了していて、処理単位の実行中におけるプログラムの不具合やハードウェアの障害による異常終了が想定される。また、ジョブiの終了実時刻Triが終了基準時刻Tsiを超えている場合とは、データ処理量が多い等により、あるいはハードウェア資源の制約等の要因により、処理に遅れが生じていると想定される。
【0046】
以上のように何らかのシステム障害が発生してジョブが異常終了したと判断した場合に、運用監視プログラム5は、通報処理プログラム6を起動する。通報処理プログラム6は、通報システム7を動作させる。通報システム7は、例えば監視端末へのメッセージ表示、ブザーの鳴動によるオペレータコール、予め登録してあるシステム関係者への電話や電子メールによる自動通報等を行うことで、システムに障害が発生したことを通知する。
【0047】
【発明の効果】
以上説明したように、本発明によるジョブ実行監視方法及びプログラムは、ジョブの終了基準時刻にジョブが正常に終了したか否かを判定するので、ジョブが異常終了した場合でもシステム障害発生を早急に外部に通知することができる。
【図面の簡単な説明】
【図1】本発明の実施の形態に係るバッチ業務処理システムの構成を示すブロック図である。
【図2】本発明の実施例に係る監視情報パラメータ・ファイルのデータ構造を示す図である。
【図3】本発明の実施例に係るログ・ファイルのデータ構造を示す図である。
【図4】本発明の実施例に係る運用監視プログラムの処理フローを示す図である。
【符号の説明】
1 ジョブ実行監視システム
2 ジョブ実行システム
3 監視情報パラメータ・ファイル
4 ログ・ファイル
5 運用監視プログラム
6 通報処理プログラム
7 通報システム[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to a method and a program for monitoring the execution of a job in a computer system, and more particularly, to a method and a program for monitoring a job execution for detecting a system abnormality during job execution.
[0002]
[Prior art]
Due to the advanced use of computer systems, for example, offices of financial institutions operate 24 hours a day. During the day, an online business processing system mainly for dealing with customers operates, and at night, a batch business processing system is mainly operated as daily processing after the online business processing is closed.
[0003]
In recent years, automation in job operation has been advanced, and in a batch job processing system, a computer system is operating in a state close to unmanned operation. Therefore, it is required that the job operates normally and that the batch business processing is completed by the start of operation of the online business processing system the next morning.
[0004]
Therefore, if a failure due to hardware or software failure occurs in such a computer system and the recovery of the system is delayed, the subsequent operation of the business processing system will be greatly affected. Subsequent actions will be urgent.
[0005]
Further, when the processing capacity of the computer system is close to the limit and the data processing amount reaches a peak, a situation in which the batch job processing is not completed by a predetermined time in the next morning is also assumed.
[0006]
In the system described above, there is known a system that monitors the operation status of a job and notifies the occurrence of a system failure when a predetermined process is not completed by a predetermined reference time. (For example, see
[0007]
[Patent Document 1]
JP-A-11-120033 (FIG. 2)
[Patent Document 2]
JP-A-2002-278804 (FIG. 1)
[0008]
[Problems to be solved by the invention]
However, such a system is designed on the assumption that a job is completed. For this reason, if a system failure occurs during job execution and the job ends abnormally, the job end time is not recorded and the scheduled end time (the latest execution end time in
[0009]
Therefore, an object of the present invention is to provide a job execution monitoring method and a program capable of promptly notifying the occurrence of a system failure even when a job ends abnormally.
[0010]
[Means for Solving the Problems]
To achieve the above object, according to a first aspect, a job execution monitoring method according to the present invention provides a method for monitoring a job corresponding to a job at a time when a predetermined end reference time at which the job ends is reached. It is a method of determining whether or not a desired value is recorded in the information.
[0011]
According to a second aspect, in the job execution monitoring method according to the present invention, a predetermined amount of log information corresponding to the job is recorded at a time when a predetermined end reference time at which the job ends is reached. If not, or if the actual end time of the job exceeds the end reference time, a method is provided for activating a reporting system that reports to the outside of the system that there is an abnormality in the system that executed the job. You.
[0012]
Further, according to a third aspect, the job execution monitoring method according to the present invention operates when the batch job processing starts, monitors a predetermined end reference time for each job in the batch job processing, and When a predetermined amount of log information corresponding to the job is not recorded at the time when the job end reference time is reached, or when the actual job end time exceeds the end reference time, the batch business process It is a method of activating a notification system that determines that there is an abnormality in the system and notifies the outside of the batch business processing system.
[0013]
In the present invention, preferably, the end reference time may be obtained by adding a predetermined time difference to a predetermined reference time.
[0014]
In the present invention, preferably, the notification system executes at least one of a message display on a monitoring terminal, an operator call by sounding a buzzer, and an automatic notification by telephone or e-mail to a system related person registered in advance. Is also good.
[0015]
According to a fourth aspect, a job execution monitoring program according to the present invention includes a monitoring information parameter table in which an end reference time predetermined for each job is recorded, and a log including an actual end time for each job. A log information table in which information is recorded; a step of determining whether a time has reached a reference end time in the monitoring information parameter table corresponding to a certain job; and a determination that the time has reached the reference end time. Determining whether a predetermined amount of log information corresponding to the job is recorded in the log information table; and determining whether the log information corresponding to the job is recorded in a predetermined amount. Determining whether or not the actual end time of the job within the job exceeds the reference end time of the job; and storing log information corresponding to the job in a predetermined amount. If not, or if the actual end time of the job exceeds the reference end time of the job, a notification system that notifies the outside of the system that there is an abnormality in the system executing the job. Activating the program.
[0016]
In the present invention, preferably, the job execution monitoring program may be started when the batch job processing system starts.
[0017]
BEST MODE FOR CARRYING OUT THE INVENTION
Embodiments of the present invention will be described below with reference to the accompanying drawings.
[0018]
FIG. 1 is a block diagram illustrating a configuration of a batch job processing system according to an embodiment of the present invention. The batch job processing system includes a job
[0019]
The monitoring
[0020]
The job execution system 2 is a system for executing batch business processing. When started, the job execution system 2 starts execution of the operation monitoring program 5, processes a job according to the batch business, and logs information at a set checkpoint. Output to file 4. That is,
[0021]
In the above configuration, the operation monitoring program 5 starts operating when the job execution system 2 starts, and monitors the end reference time in the monitoring
[0022]
Therefore, the job
[0023]
【Example】
In order to describe the above-described embodiment of the present invention in more detail, an embodiment of the present invention will be described with reference to the drawings.
[0024]
FIG. 2 is a diagram showing a data structure of a monitoring information parameter file according to the embodiment of the present invention. The job start reference time Ts0 and the end reference time Tsj of the process j are written in advance before the job execution system operates. Here, j is an integer from 1 to z.
[0025]
The job start reference time Ts0 and the end reference time Tsj of the process j, which are the criteria for verifying the job operation status, are determined by the system operation review committee or the like after the job configuration and the job execution order of the batch business processing system are determined. It is determined based on the unit execution time and the like.
[0026]
That is, the end point of each processing unit constituting a job is set as a check point, and each end reference time Tsj is registered in the monitoring
[0027]
It should be noted that the end reference time Tsj needs to be reviewed regularly or at any time according to a change in the processing data amount or a system change, and must be maintained so that an appropriate time is set.
[0028]
FIG. 3 is a diagram illustrating a data structure of a log file according to the embodiment of the present invention. When the job execution system 2 starts, the actual job start time Tr0 is written in the log file 4, and the log information j at the checkpoint of the processing j of the job j is sequentially written. However, FIG. 3 shows a case where j has passed from 1 to n.
[0029]
The log information j includes an item of the actual end time Trj of the process j. A large value that does not exist at the time may be written in the item of the actual end time Trj before executing the job. In this way, even if the job ends abnormally or the job does not end and the job end time is not written to the actual end time Trj, the actual end time of the job is set to the end reference time. It can be determined that it has exceeded.
[0030]
FIG. 4 is a diagram illustrating a processing flow of the operation monitoring program according to the embodiment of the present invention. When the job execution system 2 starts, the operation monitoring program 5 starts in step S0.
[0031]
In step S1, the log file 4 is initialized, and the log information is cleared or set to a predetermined value. Further, a counter i for counting the processing order is set to 0.
[0032]
In step S2, the current time is acquired and set to the actual job start time Tr0 in the log file 4.
[0033]
In step S3, a job start reference time Ts0 and an end reference time Tsi (i is 1 to z) of the process i in the monitoring
[0034]
In step S4, a time difference Δ = Tr0−Ts0 is obtained. In a batch business processing system, generally, job operation is not always started at a time determined by the job start reference time Ts0. Therefore, a time difference Δ between the actual job start time Tr0 and the job start reference time Ts0 is calculated, and The end reference time Tsi in the step is corrected.
[0035]
In step S5, 1 is added to the counter i, and the count is incremented.
[0036]
In step S6, it is determined whether the counter i has exceeded the upper limit (z). If it is equal to or less than the upper limit, the process proceeds to Step 7 If the upper limit is exceeded, the end processing is executed in step S13 assuming that all the predetermined jobs have ended normally, and the operation monitoring program ends in step S15.
[0037]
In step S7, the current time T is obtained.
[0038]
Step S8 is a standby routine, and waits until the current time T reaches or exceeds the sum of the end reference time Tsi of the process i and the time difference Δ. That is, the current time T is acquired every moment, and if Tsi + Δ ≦ T, the process proceeds to step 9.
[0039]
In step S9, the log information i (including the actual end time Tri) existing in the log file 4 is read.
[0040]
In step S10, the presence or absence of log information i is determined. If there is no log information i or the log information is not enough, it is determined that a delay has occurred in the execution of the job due to some system failure, and the process proceeds to step S12. If there is a predetermined number of log information i, the process proceeds to step S11.
[0041]
In step S11, it is determined whether or not the sum of the end reference time Tsi of the process i and the time difference Δ is equal to or longer than the actual end time Tri of the process i. If Tsi + Δ ≧ Tri, it is assumed that the job has been executed within the reference time, and the process proceeds to step S5. If Tsi + Δ <Tri, it is determined that a delay has occurred in the execution of the job due to some system failure, and the process proceeds to step 12. Note that the positions of step S10 and step S11 may be interchanged.
[0042]
In step S12, the notification processing program 6 is started, and in step S14, the operation monitoring program ends.
[0043]
In the above steps, the operation monitoring program 5 starts operating when the job execution system 2 starts, and monitors the end reference time Tsi in the monitoring
[0044]
In addition, when the time reaches the job end reference time Tsi, the operation monitoring program 5 does not record the log information i corresponding to the job i in the log file 4 or runs out of the predetermined number. In this case, or when the actual end time Tri of the job i exceeds the end reference time Tsi, it is determined that the job i has ended abnormally.
[0045]
That is, the case where the log information i is not recorded in the log file 4 or the case where the log information i is insufficient is a predetermined number. Abnormal termination due to a failure of the server or a hardware failure is assumed. Also, the case where the actual end time Tri of the job i exceeds the reference end time Tsi means that the processing is delayed due to a large amount of data processing or a limitation of hardware resources. Is done.
[0046]
As described above, when it is determined that a job has ended abnormally due to some system failure, the operation monitoring program 5 starts the notification processing program 6. The notification processing program 6 operates the
[0047]
【The invention's effect】
As described above, the job execution monitoring method and the program according to the present invention determine whether or not a job has ended normally at the reference time for ending the job. It can be notified outside.
[Brief description of the drawings]
FIG. 1 is a block diagram showing a configuration of a batch job processing system according to an embodiment of the present invention.
FIG. 2 is a diagram showing a data structure of a monitoring information parameter file according to the embodiment of the present invention.
FIG. 3 is a diagram illustrating a data structure of a log file according to the embodiment of the present invention.
FIG. 4 is a diagram showing a processing flow of an operation monitoring program according to the embodiment of the present invention.
[Explanation of symbols]
Claims (8)
前記バッチ業務処理におけるジョブ毎の予め定めた終了基準時刻を監視し、
時刻が前記ジョブの終了基準時刻に達した時点で、前記ジョブに対応するログ情報が所定量記録されていない場合、または前記ジョブの終了実時刻が前記終了基準時刻を超えている場合に、前記バッチ業務処理システムに異常があると判断し、
前記バッチ業務処理システムの外部に通報する通報システムを起動することを特徴とするジョブ実行監視方法。It operates when batch business processing starts,
Monitor a predetermined end reference time for each job in the batch business process,
At the time when the time reaches the end reference time of the job, if a predetermined amount of log information corresponding to the job is not recorded, or if the actual end time of the job exceeds the end reference time, Judge that there is an error in the batch business processing system,
A job execution monitoring method, characterized by activating a notification system for notifying the outside of the batch job processing system.
前記ジョブ毎に終了実時刻を含むログ情報が記録されるログ情報テーブルと、
あるジョブに対応する前記監視情報パラメータテーブル内の終了基準時刻に時刻が達したか否かを判定するステップと、
時刻が前記終了基準時刻に達したと判定された際に、前記ジョブに対応するログ情報が前記ログ情報テーブルに所定量記録されているかを判定するステップと、
前記ジョブに対応するログ情報が所定量記録されている場合に前記ログ情報テーブル内の前記ジョブの終了実時刻が前記ジョブの終了基準時刻を超えているかを判定するステップと、
前記ジョブに対応するログ情報が所定量記録されていない場合、または前記ジョブの終了実時刻が前記ジョブの終了基準時刻を超えている場合に、前記ジョブを実行しているシステムに異常がある旨を前記システムの外部に通報する通報システムを起動するステップと、
を含むことを特徴とするジョブ実行監視プログラム。A monitoring information parameter table in which an end reference time predetermined for each job is recorded,
A log information table in which log information including the actual end time is recorded for each job;
Determining whether or not the time has reached an end reference time in the monitoring information parameter table corresponding to a certain job;
When it is determined that the time has reached the end reference time, determining whether a predetermined amount of log information corresponding to the job is recorded in the log information table;
Determining whether the actual job end time in the log information table exceeds the job end reference time when log information corresponding to the job is recorded by a predetermined amount;
If a predetermined amount of log information corresponding to the job is not recorded, or if the actual end time of the job exceeds the reference end time of the job, the system that is executing the job has an error. Activating a reporting system that reports to the outside of the system,
A job execution monitoring program characterized by including:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002329171A JP2004164271A (en) | 2002-11-13 | 2002-11-13 | Job execution monitoring method and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002329171A JP2004164271A (en) | 2002-11-13 | 2002-11-13 | Job execution monitoring method and program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004164271A true JP2004164271A (en) | 2004-06-10 |
Family
ID=32807243
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002329171A Pending JP2004164271A (en) | 2002-11-13 | 2002-11-13 | Job execution monitoring method and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004164271A (en) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006202076A (en) * | 2005-01-21 | 2006-08-03 | Internatl Business Mach Corp <Ibm> | Trace information collection system, trace information collecting method and trace information collection program |
JP2011159011A (en) * | 2010-01-29 | 2011-08-18 | Toshiba It Service Kk | System and program for monitoring job |
JP2014089603A (en) * | 2012-10-30 | 2014-05-15 | Canon Electronics Inc | Information processing device, normal end determination method for process, and program |
JP2015057685A (en) * | 2013-08-12 | 2015-03-26 | 株式会社三菱東京Ufj銀行 | Monitoring system |
US10346262B2 (en) | 2015-09-18 | 2019-07-09 | Mitsubishi Electric Corporation | Job management apparatus, job management method and computer readable medium to generate and execute a retry job when an error occurs during a job step |
JP2019139262A (en) * | 2018-02-06 | 2019-08-22 | 富士通株式会社 | Determination program, determination method, determination apparatus |
CN110413483A (en) * | 2019-07-30 | 2019-11-05 | 中国工商银行股份有限公司 | Monitoring method, device, electronic equipment and the storage medium of batch jobs data |
CN111274090A (en) * | 2020-01-16 | 2020-06-12 | 泰康保险集团股份有限公司 | Job processing method, job processing apparatus, job processing medium, and electronic device |
-
2002
- 2002-11-13 JP JP2002329171A patent/JP2004164271A/en active Pending
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006202076A (en) * | 2005-01-21 | 2006-08-03 | Internatl Business Mach Corp <Ibm> | Trace information collection system, trace information collecting method and trace information collection program |
US7574626B2 (en) | 2005-01-21 | 2009-08-11 | International Business Machines Corporation | Trace information collecting system, method and program |
JP2011159011A (en) * | 2010-01-29 | 2011-08-18 | Toshiba It Service Kk | System and program for monitoring job |
JP2014089603A (en) * | 2012-10-30 | 2014-05-15 | Canon Electronics Inc | Information processing device, normal end determination method for process, and program |
JP2015057685A (en) * | 2013-08-12 | 2015-03-26 | 株式会社三菱東京Ufj銀行 | Monitoring system |
US10346262B2 (en) | 2015-09-18 | 2019-07-09 | Mitsubishi Electric Corporation | Job management apparatus, job management method and computer readable medium to generate and execute a retry job when an error occurs during a job step |
JP2019139262A (en) * | 2018-02-06 | 2019-08-22 | 富士通株式会社 | Determination program, determination method, determination apparatus |
JP7056193B2 (en) | 2018-02-06 | 2022-04-19 | 富士通株式会社 | Judgment program, judgment method, and judgment device |
CN110413483A (en) * | 2019-07-30 | 2019-11-05 | 中国工商银行股份有限公司 | Monitoring method, device, electronic equipment and the storage medium of batch jobs data |
CN111274090A (en) * | 2020-01-16 | 2020-06-12 | 泰康保险集团股份有限公司 | Job processing method, job processing apparatus, job processing medium, and electronic device |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107515796B (en) | Equipment abnormity monitoring processing method and device | |
CN109660380A (en) | Monitoring method, platform, system and the readable storage medium storing program for executing of operation condition of server | |
WO2014161373A1 (en) | System fault detection and processing method, device, and computer readable storage medium | |
JP4892367B2 (en) | Abnormal sign detection system | |
JP4502414B2 (en) | Production management information output device and production management information output method | |
AU2007261542B2 (en) | Method and system for monitoring non-occurring events | |
JP2004164271A (en) | Job execution monitoring method and program | |
US20040133593A1 (en) | E-maintenance system | |
JPH08286990A (en) | Electronic mail interlocking type fault monitoring system | |
CN113760634A (en) | Data processing method and device | |
CN116483663A (en) | Abnormality warning method and device for platform | |
CN115562932A (en) | Task monitoring and abnormal self-healing method and device based on multi-interface platform | |
JP2006331026A (en) | Message analysis system and message analysis program | |
CN116149932A (en) | Method and device for detecting software system state and electronic equipment | |
US20050005202A1 (en) | Proactive support of a healthcare information system | |
JP7211026B2 (en) | Job management system | |
JP5613570B2 (en) | Batch job delay warning automatic alert system, automatic alert method, and program therefor | |
CN112969151A (en) | Short message monitoring method, device and equipment | |
CN114168371A (en) | Intelligent automatic fault alarm system | |
JP2001022717A (en) | Method for deciding misoperation regarding operation management system in decentralization environment | |
JPH06175887A (en) | Fault monitoring/reporting system | |
CN111930594A (en) | Method and device for monitoring down of target machine and readable storage equipment | |
CN111061609A (en) | Log monitoring method and system | |
JP2003345629A (en) | System monitor device, system monitoring method used for the same, and program therefor | |
CN111625420B (en) | Distributed training task processing method, device, equipment and storage medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040419 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060815 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20061212 |