JP2004164271A - Job execution monitoring method and program - Google Patents

Job execution monitoring method and program Download PDF

Info

Publication number
JP2004164271A
JP2004164271A JP2002329171A JP2002329171A JP2004164271A JP 2004164271 A JP2004164271 A JP 2004164271A JP 2002329171 A JP2002329171 A JP 2002329171A JP 2002329171 A JP2002329171 A JP 2002329171A JP 2004164271 A JP2004164271 A JP 2004164271A
Authority
JP
Japan
Prior art keywords
job
time
reference time
log information
predetermined
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002329171A
Other languages
Japanese (ja)
Inventor
Teruo Iwabori
輝夫 岩堀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Solution Innovators Ltd
Original Assignee
NEC System Technologies Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC System Technologies Ltd filed Critical NEC System Technologies Ltd
Priority to JP2002329171A priority Critical patent/JP2004164271A/en
Publication of JP2004164271A publication Critical patent/JP2004164271A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a job execution monitoring method and a program, capable of immediately giving notice of generation of a system failure even when a job comes to an abnormal end. <P>SOLUTION: This operation monitoring program 5 operates when a job execution system 2 starts, monitors predetermined end standard time of each the job inside a monitoring information parameter file 3, determines that the job execution system 2 has abnormality when log information corresponding to the job inside a log file 4 is not recorded by a prescribed amount at point of time reaching the end standard time of the job or when actual end time of the job passes the end standard time, and starts a notification processing program 6 notifying the outside of it. <P>COPYRIGHT: (C)2004,JPO

Description

【0001】
【発明の属する技術分野】
本発明は、コンピュータシステムのジョブの実行監視の方法及びプログラムに関し、特に、ジョブ実行時のシステムの異常を検出するジョブ実行監視方法及びプログラムに関する。
【0002】
【従来の技術】
コンピュータシステムの高度利用により、例えば金融機関の事務センタでは、24時間運転が通常となっている。日中には顧客対応を中心とするオンライン業務処理システムが稼動し、夜間にはオンライン業務処理締後の日次処理として、主にバッチ業務処理システムが運用されている。
【0003】
昨今ではジョブ運用における自動化が進展し、バッチ業務処理システムでは無人運転に近い状態でコンピュータシステムが稼動している。したがって、ジョブが正常に稼動し、翌朝のオンライン業務処理システムの稼動開始時刻までにバッチ業務処理が完了していることが求められる。
【0004】
したがって、このようなコンピュータシステムにおいてハードウェアやソフトウェアの不具合に伴う障害が発生した場合にシステムの復旧が遅れると、その後の業務処理システムの運用に大きな影響を与えるため、システム障害発生の早期検出とその後の対応は、緊急を要することとなる。
【0005】
また、コンピュータシステムの処理能力が限界に近く、データ処理量がピークに達する場合には、翌朝の所定時刻までにバッチ業務処理が終了しない事態も想定される。
【0006】
以上述べたようなシステムにおいて、ジョブの運用状況を監視し、所定の処理が既定の基準時刻までに終了していない事象を検出した場合に、システムの障害発生を通知するシステムが知られている(例えば、特許文献1及び特許文献2参照。)。
【0007】
【特許文献1】
特開平11−120033号公報(第2図)
【特許文献2】
特開2002−278804号公報(第1図)
【0008】
【発明が解決しようとする課題】
しかしながら、このようなシステムでは、ジョブが終了することを前提として設計されている。このためジョブ実行中にシステムに障害が発生してジョブが異常終了した場合、ジョブの終了時刻が記録されずに終了予定時刻(特許文献1における実行終了最遅時刻、あるいは特許文献2における比較テーブルの終了時刻)との比較ができなくなる。この場合には運用状況を監視して所定の処理が既定の基準時刻までに終了していない事象を検出することができず、システム障害発生の通知に多大な遅延を生じるという課題がある。
【0009】
したがって、本発明の目的は、ジョブが異常終了した場合でもシステム障害発生を早急に通知することが可能なジョブ実行監視方法及びプログラムを提供することにある。
【0010】
【課題を解決するための手段】
前記目的を達成するために、本発明に係るジョブ実行監視方法は、第1の視点によれば、ジョブが終了する予め定めた終了基準時刻に時刻が達した時点で、前記ジョブに対応するログ情報に所望の値が記録されているか否かを判定する方法とされる。
【0011】
また、本発明に係るジョブ実行監視方法は、第2の視点によれば、ジョブが終了する予め定めた終了基準時刻に時刻が達した時点で、前記ジョブに対応するログ情報が所定量記録されていない場合、または前記ジョブの終了実時刻が前記終了基準時刻を超えている場合に、前記ジョブを実行したシステムに異常がある旨を前記システムの外部に通報する通報システムを起動する方法とされる。
【0012】
さらに、本発明に係るジョブ実行監視方法は、第3の視点によれば、バッチ業務処理がスタートすると動作し、前記バッチ業務処理におけるジョブ毎の予め定めた終了基準時刻を監視し、時刻が前記ジョブの終了基準時刻に達した時点で、前記ジョブに対応するログ情報が所定量記録されていない場合、または前記ジョブの終了実時刻が前記終了基準時刻を超えている場合に、前記バッチ業務処理システムに異常があると判断し、前記バッチ業務処理システムの外部に通報する通報システムを起動する方法とされる。
【0013】
本発明において、好ましくは、終了基準時刻は、前もって定めた基準時刻に所定の時間差分を加えてあってもよい。
【0014】
本発明において、好ましくは、通報システムは、監視端末へのメッセージ表示、ブザーの鳴動によるオペレータコール、予め登録してあるシステム関係者への電話や電子メールによる自動通報の少なくとも一つを実行してもよい。
【0015】
また、本発明に係るジョブ実行監視プログラムは、第4の視点によれば、ジョブ毎に予め定めた終了基準時刻が記録してある監視情報パラメータテーブルと、前記ジョブ毎に終了実時刻を含むログ情報が記録されるログ情報テーブルと、あるジョブに対応する前記監視情報パラメータテーブル内の終了基準時刻に時刻が達したか否かを判定するステップと、時刻が前記終了基準時刻に達したと判定された際に、前記ジョブに対応するログ情報が前記ログ情報テーブルに所定量記録されているかを判定するステップと、前記ジョブに対応するログ情報が所定量記録されている場合に前記ログ情報テーブル内の前記ジョブの終了実時刻が前記ジョブの終了基準時刻を超えているかを判定するステップと、前記ジョブに対応するログ情報が所定量記録されていない場合、または前記ジョブの終了実時刻が前記ジョブの終了基準時刻を超えている場合に、前記ジョブを実行しているシステムに異常がある旨を前記システムの外部に通報する通報システムを起動するステップと、を含むプログラムとされる。
【0016】
本発明において、好ましくは、ジョブ実行監視プログラムは、バッチ業務処理システムがスタートすることで起動されてもよい。
【0017】
【発明の実施の形態】
添付図面を参照して、本発明の実施の形態を以下に説明する。
【0018】
図1は、本発明の実施の形態に係るバッチ業務処理システムの構成を示すブロック図である。バッチ業務処理システムは、ジョブ実行監視システム1とジョブ実行システム2と通報システム7とから構成される。ジョブ実行監視システム1は、ジョブ実行システム2が実行するジョブを監視するシステムであって、監視情報パラメータ・ファイル3と、ログ・ファイル4と、運用監視プログラム5と、通報処理プログラム6と、から構成される。
【0019】
監視情報パラメータ・ファイル3は、予め定義したジョブの処理単位の実行終了基準時刻をテーブル化して記録したファイルである。ログ・ファイル4は、ジョブ実行システム2におけるバッチ業務処理の実行開始から実行終了までの実行時における発生イベント情報すなわちジョブの処理単位のログ情報をテーブル化して記録したファイルである。運用監視プログラム5は、監視情報パラメータ・ファイル3の内容とログ・ファイル4の内容とを処理単位毎に対比・検証するプログラムである。通報処理プログラム6は、運用監視プログラム5においてジョブが異常終了したことを検出した場合に起動され、ジョブの異常終了をシステムの外部に自動通報する通報システム7を起動するためのプログラムである。
【0020】
ジョブ実行システム2は、バッチ業務処理を実行するシステムであって、スタートすると運用監視プログラム5の実行を開始させると共に、バッチ業務に従ったジョブを処理し、設定したチェックポイントにおいてログ情報をログ・ファイル4に出力する。すなわち、ログ出力0、処理1、ログ出力1、処理2、ログ出力2、…、処理n、ログ出力n、…、処理z、ログ出力zを実行し、最後に運用監視プログラム5の実行を終了させる。図1では、ログ出力nまでがログ・ファイル4へ書き込まれている状態を示す。
【0021】
以上のような構成において、運用監視プログラム5は、ジョブ実行システム2がスタートすると動作を開始し、バッチ業務処理におけるジョブ毎に監視情報パラメータ・ファイル3内の終了基準時刻を監視する。ジョブの終了基準時刻に達した時点で、該当のジョブに対応するログ・ファイル4内のログ情報に所望の値が記録されていない場合、例えばログ情報が記録されていない場合あるいは所定量に不足している場合または該当するジョブの終了基準時刻を超えた終了実時刻が記録されている場合には、ジョブが異常終了したと判断する。ジョブが異常終了したと判断した場合に通報処理プログラム6を起動し、通報処理プログラム6は通報システム7を起動し、通報システム7は所定の通報の処理を実行する。
【0022】
したがって、ジョブ実行監視システム1は、以上のように動作するので、時刻があるジョブの終了基準時刻に達した時点でそのジョブの異常終了を検知した場合には、システム障害発生を早急に通知することができる。
【0023】
【実施例】
上記した本発明の実施の形態についてさらに詳細に説明すべく、本発明の実施例について図面を参照して説明する。
【0024】
図2は、本発明の実施例に係る監視情報パラメータ・ファイルのデータ構造を示す図である。ジョブ開始基準時刻Ts0及び処理jの終了基準時刻Tsjがジョブ実行システム稼動前に予め書き込まれている。ただし、jは1からzまでの整数とする。
【0025】
ジョブの稼動状況を検証する判定基準となるジョブ開始基準時刻Ts0及び処理jの終了基準時刻Tsjは、バッチ業務処理システムのジョブ構成及びジョブ実行順序が確定した後に、システム運用検討会等において各処理単位の実行時間等を基に決定される。
【0026】
すなわち、ジョブを構成する各処理単位の終了時点をチェックポイントとし、それぞれの終了基準時刻Tsjは、ジョブの運用開始基準時刻を起点とし、時系列の順に監視情報パラメータ・ファイル3内へ登録されている。
【0027】
なお、終了基準時刻Tsjについて、処理データ量の変動やシステム変更に応じて、定期または随時に見直され、適正な時刻が設定されるように維持する必要がある。
【0028】
図3は、本発明の実施例に係るログ・ファイルのデータ構造を示す図である。ジョブ実行システム2がスタートすると、ログ・ファイル4にはジョブ開始実時刻Tr0が書き込まれ、ジョブjの処理jのチェックポイントにおけるログ情報jが順次書き込まれる。ただし、図3では、jが1からnまで経過した状態の場合を表す。
【0029】
ログ情報jの中には処理jの終了実時刻Trjの項目が含まれる。なお、終了実時刻Trjの項目には、時刻に存在しないような大きな値をジョブ実行前に予め書き込んでおいてもよい。このようにすることで、ジョブが異常終了し、あるいはジョブが終了せずに、ジョブの終了時刻が終了実時刻Trjに書き込まれない場合が生じても、ジョブの終了実時刻が終了基準時刻を超えているものと判断することができる。
【0030】
図4は、本発明の実施例に係る運用監視プログラムの処理フローを示す図である。ジョブ実行システム2がスタートすると、ステップS0で運用監視プログラム5がスタートする。
【0031】
ステップS1では、ログ・ファイル4の初期化を行い、ログ情報をクリアあるいは所定の値にセットする。また、処理順を数えるカウンタiを0にセットする。
【0032】
ステップS2では、現時刻を取得し、ログ・ファイル4内のジョブ開始実時刻Tr0に設定する。
【0033】
ステップS3では、監視情報パラメータ・ファイル3内のジョブ開始基準時刻Ts0と処理iの終了基準時刻Tsi(iは1〜z)とを読み込む。
【0034】
ステップS4では、時間差分Δ=Tr0−Ts0を求める。バッチ業務処理システムにおいて、一般にはジョブ開始基準時刻Ts0で定める定刻にジョブ運用が開始されるとは限らないため、ジョブ開始実時刻Tr0とジョブ開始基準時刻Ts0との時間差分Δを求め、以下のステップにおける終了基準時刻Tsiを補正する。
【0035】
ステップS5では、カウンタiに1を加え、カウントアップする。
【0036】
ステップS6では、カウンタiが上限(z)を超えたか否かを比較する。上限以下の場合には、ステップ7に進む。上限を超えた場合には、ステップS13で、所定のジョブがすべて正常に終了したものとして終了処理を実行し、ステップS15で運用監視プログラムが終了する。
【0037】
ステップS7では、現在の時刻Tを取得する。
【0038】
ステップS8は、待機ルーチンであって、現在の時刻Tが処理iの終了基準時刻Tsiと時間差分Δとの和に達するか超えるかを待つ。すなわち、現在の時刻Tを刻々取得し、Tsi+Δ≦Tの場合には、ステップ9に進む。
【0039】
ステップS9では、ログ・ファイル4内に存在するログ情報i(終了実時刻Triを含む)を読み取る。
【0040】
ステップS10では、ログ情報iの有無を判定する。ログ情報iがない場合あるいは所定量に不足している場合には、何らかのシステム障害に起因してジョブの実行に遅延が生じたものとし、ステップS12に進む。ログ情報iが所定数ある場合にはステップS11に進む。
【0041】
ステップS11では、処理iの終了基準時刻Tsiと時間差分Δとの和が処理iの終了実時刻Tri以上であるか否かを比較する。Tsi+Δ≧Triの場合には、基準時間内でジョブの実行が進行したものとし、ステップ5に進む。Tsi+Δ<Triの場合には、何らかのシステム障害に起因してジョブの実行に遅延が生じているものとし、ステップ12に進む。なお、ステップS10とステップS11とは、その位置を互いに入れ替えてもよい。
【0042】
ステップS12では、通報処理プログラム6を起動し、ステップS14で運用監視プログラムが終了する。
【0043】
以上のようなステップにおいて、運用監視プログラム5は、ジョブ実行システム2がスタートすると動作を開始し、バッチ業務処理におけるジョブ毎に監視情報パラメータ・ファイル3内の終了基準時刻Tsiを監視する。
【0044】
その上で、運用監視プログラム5は、時刻がジョブの終了基準時刻Tsiに達した時点で、ジョブiに対応するログ情報iがログ・ファイル4内に記録されていない場合あるいは所定数に不足する場合、またはジョブiの終了実時刻Triが終了基準時刻Tsiを超えている場合には、ジョブiが異常終了したものと判断する。
【0045】
すなわち、ログ情報iがログ・ファイル4内に記録されていない場合あるいは所定数に不足する場合とは、ジョブiの処理が未完了あるいは途中で異常終了していて、処理単位の実行中におけるプログラムの不具合やハードウェアの障害による異常終了が想定される。また、ジョブiの終了実時刻Triが終了基準時刻Tsiを超えている場合とは、データ処理量が多い等により、あるいはハードウェア資源の制約等の要因により、処理に遅れが生じていると想定される。
【0046】
以上のように何らかのシステム障害が発生してジョブが異常終了したと判断した場合に、運用監視プログラム5は、通報処理プログラム6を起動する。通報処理プログラム6は、通報システム7を動作させる。通報システム7は、例えば監視端末へのメッセージ表示、ブザーの鳴動によるオペレータコール、予め登録してあるシステム関係者への電話や電子メールによる自動通報等を行うことで、システムに障害が発生したことを通知する。
【0047】
【発明の効果】
以上説明したように、本発明によるジョブ実行監視方法及びプログラムは、ジョブの終了基準時刻にジョブが正常に終了したか否かを判定するので、ジョブが異常終了した場合でもシステム障害発生を早急に外部に通知することができる。
【図面の簡単な説明】
【図1】本発明の実施の形態に係るバッチ業務処理システムの構成を示すブロック図である。
【図2】本発明の実施例に係る監視情報パラメータ・ファイルのデータ構造を示す図である。
【図3】本発明の実施例に係るログ・ファイルのデータ構造を示す図である。
【図4】本発明の実施例に係る運用監視プログラムの処理フローを示す図である。
【符号の説明】
1 ジョブ実行監視システム
2 ジョブ実行システム
3 監視情報パラメータ・ファイル
4 ログ・ファイル
5 運用監視プログラム
6 通報処理プログラム
7 通報システム
[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to a method and a program for monitoring the execution of a job in a computer system, and more particularly, to a method and a program for monitoring a job execution for detecting a system abnormality during job execution.
[0002]
[Prior art]
Due to the advanced use of computer systems, for example, offices of financial institutions operate 24 hours a day. During the day, an online business processing system mainly for dealing with customers operates, and at night, a batch business processing system is mainly operated as daily processing after the online business processing is closed.
[0003]
In recent years, automation in job operation has been advanced, and in a batch job processing system, a computer system is operating in a state close to unmanned operation. Therefore, it is required that the job operates normally and that the batch business processing is completed by the start of operation of the online business processing system the next morning.
[0004]
Therefore, if a failure due to hardware or software failure occurs in such a computer system and the recovery of the system is delayed, the subsequent operation of the business processing system will be greatly affected. Subsequent actions will be urgent.
[0005]
Further, when the processing capacity of the computer system is close to the limit and the data processing amount reaches a peak, a situation in which the batch job processing is not completed by a predetermined time in the next morning is also assumed.
[0006]
In the system described above, there is known a system that monitors the operation status of a job and notifies the occurrence of a system failure when a predetermined process is not completed by a predetermined reference time. (For example, see Patent Documents 1 and 2).
[0007]
[Patent Document 1]
JP-A-11-120033 (FIG. 2)
[Patent Document 2]
JP-A-2002-278804 (FIG. 1)
[0008]
[Problems to be solved by the invention]
However, such a system is designed on the assumption that a job is completed. For this reason, if a system failure occurs during job execution and the job ends abnormally, the job end time is not recorded and the scheduled end time (the latest execution end time in Patent Document 1 or the comparison table in Patent Document 2). End time) cannot be compared. In this case, there is a problem that an operation status cannot be monitored to detect an event in which a predetermined process has not been completed by a predetermined reference time, and a notice of occurrence of a system failure is greatly delayed.
[0009]
Therefore, an object of the present invention is to provide a job execution monitoring method and a program capable of promptly notifying the occurrence of a system failure even when a job ends abnormally.
[0010]
[Means for Solving the Problems]
To achieve the above object, according to a first aspect, a job execution monitoring method according to the present invention provides a method for monitoring a job corresponding to a job at a time when a predetermined end reference time at which the job ends is reached. It is a method of determining whether or not a desired value is recorded in the information.
[0011]
According to a second aspect, in the job execution monitoring method according to the present invention, a predetermined amount of log information corresponding to the job is recorded at a time when a predetermined end reference time at which the job ends is reached. If not, or if the actual end time of the job exceeds the end reference time, a method is provided for activating a reporting system that reports to the outside of the system that there is an abnormality in the system that executed the job. You.
[0012]
Further, according to a third aspect, the job execution monitoring method according to the present invention operates when the batch job processing starts, monitors a predetermined end reference time for each job in the batch job processing, and When a predetermined amount of log information corresponding to the job is not recorded at the time when the job end reference time is reached, or when the actual job end time exceeds the end reference time, the batch business process It is a method of activating a notification system that determines that there is an abnormality in the system and notifies the outside of the batch business processing system.
[0013]
In the present invention, preferably, the end reference time may be obtained by adding a predetermined time difference to a predetermined reference time.
[0014]
In the present invention, preferably, the notification system executes at least one of a message display on a monitoring terminal, an operator call by sounding a buzzer, and an automatic notification by telephone or e-mail to a system related person registered in advance. Is also good.
[0015]
According to a fourth aspect, a job execution monitoring program according to the present invention includes a monitoring information parameter table in which an end reference time predetermined for each job is recorded, and a log including an actual end time for each job. A log information table in which information is recorded; a step of determining whether a time has reached a reference end time in the monitoring information parameter table corresponding to a certain job; and a determination that the time has reached the reference end time. Determining whether a predetermined amount of log information corresponding to the job is recorded in the log information table; and determining whether the log information corresponding to the job is recorded in a predetermined amount. Determining whether or not the actual end time of the job within the job exceeds the reference end time of the job; and storing log information corresponding to the job in a predetermined amount. If not, or if the actual end time of the job exceeds the reference end time of the job, a notification system that notifies the outside of the system that there is an abnormality in the system executing the job. Activating the program.
[0016]
In the present invention, preferably, the job execution monitoring program may be started when the batch job processing system starts.
[0017]
BEST MODE FOR CARRYING OUT THE INVENTION
Embodiments of the present invention will be described below with reference to the accompanying drawings.
[0018]
FIG. 1 is a block diagram illustrating a configuration of a batch job processing system according to an embodiment of the present invention. The batch job processing system includes a job execution monitoring system 1, a job execution system 2, and a notification system 7. The job execution monitoring system 1 is a system for monitoring a job executed by the job execution system 2, and includes a monitoring information parameter file 3, a log file 4, an operation monitoring program 5, and a notification processing program 6. Be composed.
[0019]
The monitoring information parameter file 3 is a file in which a predefined execution end reference time for each processing unit of a job is tabulated and recorded. The log file 4 is a file in which generated event information, that is, log information of a unit of job processing during execution from the start to the end of the execution of the batch business process in the job execution system 2 is tabulated and recorded. The operation monitoring program 5 is a program for comparing and verifying the contents of the monitoring information parameter file 3 and the contents of the log file 4 for each processing unit. The notification processing program 6 is started when the operation monitoring program 5 detects that a job has abnormally ended, and is a program for starting a notification system 7 for automatically notifying the abnormal end of the job to the outside of the system.
[0020]
The job execution system 2 is a system for executing batch business processing. When started, the job execution system 2 starts execution of the operation monitoring program 5, processes a job according to the batch business, and logs information at a set checkpoint. Output to file 4. That is, log output 0, process 1, log output 1, process 2, log output 2, ..., process n, log output n, ..., process z, and log output z are executed, and finally, the operation monitoring program 5 is executed. Terminate. FIG. 1 shows a state where up to the log output n is written to the log file 4.
[0021]
In the above configuration, the operation monitoring program 5 starts operating when the job execution system 2 starts, and monitors the end reference time in the monitoring information parameter file 3 for each job in the batch job processing. If the desired value is not recorded in the log information in the log file 4 corresponding to the job at the point in time when the job end reference time is reached, for example, the log information is not recorded or the predetermined amount is insufficient. If the job has been completed, or if the actual end time exceeding the reference end time of the corresponding job is recorded, it is determined that the job has ended abnormally. When it is determined that the job has ended abnormally, the notification processing program 6 is started, and the notification processing program 6 starts the notification system 7, and the notification system 7 executes a predetermined notification process.
[0022]
Therefore, the job execution monitoring system 1 operates as described above. When the job execution monitoring system 1 detects an abnormal end of a job when the time reaches a reference end time of the job, the job execution monitoring system 1 immediately notifies the occurrence of a system failure. be able to.
[0023]
【Example】
In order to describe the above-described embodiment of the present invention in more detail, an embodiment of the present invention will be described with reference to the drawings.
[0024]
FIG. 2 is a diagram showing a data structure of a monitoring information parameter file according to the embodiment of the present invention. The job start reference time Ts0 and the end reference time Tsj of the process j are written in advance before the job execution system operates. Here, j is an integer from 1 to z.
[0025]
The job start reference time Ts0 and the end reference time Tsj of the process j, which are the criteria for verifying the job operation status, are determined by the system operation review committee or the like after the job configuration and the job execution order of the batch business processing system are determined. It is determined based on the unit execution time and the like.
[0026]
That is, the end point of each processing unit constituting a job is set as a check point, and each end reference time Tsj is registered in the monitoring information parameter file 3 in chronological order starting from the job operation start reference time. I have.
[0027]
It should be noted that the end reference time Tsj needs to be reviewed regularly or at any time according to a change in the processing data amount or a system change, and must be maintained so that an appropriate time is set.
[0028]
FIG. 3 is a diagram illustrating a data structure of a log file according to the embodiment of the present invention. When the job execution system 2 starts, the actual job start time Tr0 is written in the log file 4, and the log information j at the checkpoint of the processing j of the job j is sequentially written. However, FIG. 3 shows a case where j has passed from 1 to n.
[0029]
The log information j includes an item of the actual end time Trj of the process j. A large value that does not exist at the time may be written in the item of the actual end time Trj before executing the job. In this way, even if the job ends abnormally or the job does not end and the job end time is not written to the actual end time Trj, the actual end time of the job is set to the end reference time. It can be determined that it has exceeded.
[0030]
FIG. 4 is a diagram illustrating a processing flow of the operation monitoring program according to the embodiment of the present invention. When the job execution system 2 starts, the operation monitoring program 5 starts in step S0.
[0031]
In step S1, the log file 4 is initialized, and the log information is cleared or set to a predetermined value. Further, a counter i for counting the processing order is set to 0.
[0032]
In step S2, the current time is acquired and set to the actual job start time Tr0 in the log file 4.
[0033]
In step S3, a job start reference time Ts0 and an end reference time Tsi (i is 1 to z) of the process i in the monitoring information parameter file 3 are read.
[0034]
In step S4, a time difference Δ = Tr0−Ts0 is obtained. In a batch business processing system, generally, job operation is not always started at a time determined by the job start reference time Ts0. Therefore, a time difference Δ between the actual job start time Tr0 and the job start reference time Ts0 is calculated, and The end reference time Tsi in the step is corrected.
[0035]
In step S5, 1 is added to the counter i, and the count is incremented.
[0036]
In step S6, it is determined whether the counter i has exceeded the upper limit (z). If it is equal to or less than the upper limit, the process proceeds to Step 7 If the upper limit is exceeded, the end processing is executed in step S13 assuming that all the predetermined jobs have ended normally, and the operation monitoring program ends in step S15.
[0037]
In step S7, the current time T is obtained.
[0038]
Step S8 is a standby routine, and waits until the current time T reaches or exceeds the sum of the end reference time Tsi of the process i and the time difference Δ. That is, the current time T is acquired every moment, and if Tsi + Δ ≦ T, the process proceeds to step 9.
[0039]
In step S9, the log information i (including the actual end time Tri) existing in the log file 4 is read.
[0040]
In step S10, the presence or absence of log information i is determined. If there is no log information i or the log information is not enough, it is determined that a delay has occurred in the execution of the job due to some system failure, and the process proceeds to step S12. If there is a predetermined number of log information i, the process proceeds to step S11.
[0041]
In step S11, it is determined whether or not the sum of the end reference time Tsi of the process i and the time difference Δ is equal to or longer than the actual end time Tri of the process i. If Tsi + Δ ≧ Tri, it is assumed that the job has been executed within the reference time, and the process proceeds to step S5. If Tsi + Δ <Tri, it is determined that a delay has occurred in the execution of the job due to some system failure, and the process proceeds to step 12. Note that the positions of step S10 and step S11 may be interchanged.
[0042]
In step S12, the notification processing program 6 is started, and in step S14, the operation monitoring program ends.
[0043]
In the above steps, the operation monitoring program 5 starts operating when the job execution system 2 starts, and monitors the end reference time Tsi in the monitoring information parameter file 3 for each job in the batch job processing.
[0044]
In addition, when the time reaches the job end reference time Tsi, the operation monitoring program 5 does not record the log information i corresponding to the job i in the log file 4 or runs out of the predetermined number. In this case, or when the actual end time Tri of the job i exceeds the end reference time Tsi, it is determined that the job i has ended abnormally.
[0045]
That is, the case where the log information i is not recorded in the log file 4 or the case where the log information i is insufficient is a predetermined number. Abnormal termination due to a failure of the server or a hardware failure is assumed. Also, the case where the actual end time Tri of the job i exceeds the reference end time Tsi means that the processing is delayed due to a large amount of data processing or a limitation of hardware resources. Is done.
[0046]
As described above, when it is determined that a job has ended abnormally due to some system failure, the operation monitoring program 5 starts the notification processing program 6. The notification processing program 6 operates the notification system 7. The notification system 7 performs a message display on a monitoring terminal, an operator call by sounding a buzzer, an automatic notification by telephone or e-mail to a pre-registered system-related person, and the like, whereby a system failure occurs. Notify.
[0047]
【The invention's effect】
As described above, the job execution monitoring method and the program according to the present invention determine whether or not a job has ended normally at the reference time for ending the job. It can be notified outside.
[Brief description of the drawings]
FIG. 1 is a block diagram showing a configuration of a batch job processing system according to an embodiment of the present invention.
FIG. 2 is a diagram showing a data structure of a monitoring information parameter file according to the embodiment of the present invention.
FIG. 3 is a diagram illustrating a data structure of a log file according to the embodiment of the present invention.
FIG. 4 is a diagram showing a processing flow of an operation monitoring program according to the embodiment of the present invention.
[Explanation of symbols]
Reference Signs List 1 job execution monitoring system 2 job execution system 3 monitoring information parameter file 4 log file 5 operation monitoring program 6 report processing program 7 report system

Claims (8)

ジョブが終了する予め定めた終了基準時刻に時刻が達した時点で、前記ジョブに対応するログ情報に所望の値が記録されているか否かを判定することを特徴とするジョブ実行監視方法。A job execution monitoring method, comprising: determining whether a desired value is recorded in log information corresponding to a job when a time reaches a predetermined end reference time at which the job ends. ジョブが終了する予め定めた終了基準時刻に時刻が達した時点で、前記ジョブに対応するログ情報が所定量記録されていない場合、または前記ジョブの終了実時刻が前記終了基準時刻を超えている場合に、前記ジョブを実行したシステムに異常がある旨を前記システムの外部に通報する通報システムを起動することを特徴とするジョブ実行監視方法。When a predetermined amount of log information corresponding to the job is not recorded at the time when a predetermined end reference time at which the job ends is reached, or the actual end time of the job exceeds the end reference time In this case, a job execution monitoring method characterized by activating a notification system for notifying the system that has executed the job that there is an abnormality to the outside of the system. バッチ業務処理がスタートすると動作し、
前記バッチ業務処理におけるジョブ毎の予め定めた終了基準時刻を監視し、
時刻が前記ジョブの終了基準時刻に達した時点で、前記ジョブに対応するログ情報が所定量記録されていない場合、または前記ジョブの終了実時刻が前記終了基準時刻を超えている場合に、前記バッチ業務処理システムに異常があると判断し、
前記バッチ業務処理システムの外部に通報する通報システムを起動することを特徴とするジョブ実行監視方法。
It operates when batch business processing starts,
Monitor a predetermined end reference time for each job in the batch business process,
At the time when the time reaches the end reference time of the job, if a predetermined amount of log information corresponding to the job is not recorded, or if the actual end time of the job exceeds the end reference time, Judge that there is an error in the batch business processing system,
A job execution monitoring method, characterized by activating a notification system for notifying the outside of the batch job processing system.
前記終了基準時刻は、前もって定めた基準時刻に所定の時間差分を加算することを特徴とする請求項1〜3記載のジョブ実行監視方法。4. The job execution monitoring method according to claim 1, wherein said end reference time is obtained by adding a predetermined time difference to a predetermined reference time. 前記通報システムは、監視端末へのメッセージ表示、ブザーの鳴動によるオペレータコール、予め登録してあるシステム関係者への電話や電子メールによる自動通報の少なくとも一つを実行することを特徴とする請求項2〜3記載のジョブ実行監視方法。The system according to claim 1, wherein the notification system executes at least one of a message display on a monitoring terminal, an operator call by sounding a buzzer, and an automatic notification by telephone or e-mail to a system related person registered in advance. 4. The job execution monitoring method according to any one of the items 2 to 3. ジョブ毎に予め定めた終了基準時刻が記録してある監視情報パラメータテーブルと、
前記ジョブ毎に終了実時刻を含むログ情報が記録されるログ情報テーブルと、
あるジョブに対応する前記監視情報パラメータテーブル内の終了基準時刻に時刻が達したか否かを判定するステップと、
時刻が前記終了基準時刻に達したと判定された際に、前記ジョブに対応するログ情報が前記ログ情報テーブルに所定量記録されているかを判定するステップと、
前記ジョブに対応するログ情報が所定量記録されている場合に前記ログ情報テーブル内の前記ジョブの終了実時刻が前記ジョブの終了基準時刻を超えているかを判定するステップと、
前記ジョブに対応するログ情報が所定量記録されていない場合、または前記ジョブの終了実時刻が前記ジョブの終了基準時刻を超えている場合に、前記ジョブを実行しているシステムに異常がある旨を前記システムの外部に通報する通報システムを起動するステップと、
を含むことを特徴とするジョブ実行監視プログラム。
A monitoring information parameter table in which an end reference time predetermined for each job is recorded,
A log information table in which log information including the actual end time is recorded for each job;
Determining whether or not the time has reached an end reference time in the monitoring information parameter table corresponding to a certain job;
When it is determined that the time has reached the end reference time, determining whether a predetermined amount of log information corresponding to the job is recorded in the log information table;
Determining whether the actual job end time in the log information table exceeds the job end reference time when log information corresponding to the job is recorded by a predetermined amount;
If a predetermined amount of log information corresponding to the job is not recorded, or if the actual end time of the job exceeds the reference end time of the job, the system that is executing the job has an error. Activating a reporting system that reports to the outside of the system,
A job execution monitoring program characterized by including:
前記終了基準時刻は、前もって定めた基準時刻に所定の時間差分を加算することを特徴とする請求項6記載のジョブ実行監視プログラム。The job execution monitoring program according to claim 6, wherein the end reference time is obtained by adding a predetermined time difference to a predetermined reference time. バッチ業務処理システムがスタートすることで起動されることを特徴とする請求項6記載のジョブ実行監視プログラム。7. The job execution monitoring program according to claim 6, wherein the job execution monitoring program is started when the batch job processing system starts.
JP2002329171A 2002-11-13 2002-11-13 Job execution monitoring method and program Pending JP2004164271A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002329171A JP2004164271A (en) 2002-11-13 2002-11-13 Job execution monitoring method and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002329171A JP2004164271A (en) 2002-11-13 2002-11-13 Job execution monitoring method and program

Publications (1)

Publication Number Publication Date
JP2004164271A true JP2004164271A (en) 2004-06-10

Family

ID=32807243

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002329171A Pending JP2004164271A (en) 2002-11-13 2002-11-13 Job execution monitoring method and program

Country Status (1)

Country Link
JP (1) JP2004164271A (en)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006202076A (en) * 2005-01-21 2006-08-03 Internatl Business Mach Corp <Ibm> Trace information collection system, trace information collecting method and trace information collection program
JP2011159011A (en) * 2010-01-29 2011-08-18 Toshiba It Service Kk System and program for monitoring job
JP2014089603A (en) * 2012-10-30 2014-05-15 Canon Electronics Inc Information processing device, normal end determination method for process, and program
JP2015057685A (en) * 2013-08-12 2015-03-26 株式会社三菱東京Ufj銀行 Monitoring system
US10346262B2 (en) 2015-09-18 2019-07-09 Mitsubishi Electric Corporation Job management apparatus, job management method and computer readable medium to generate and execute a retry job when an error occurs during a job step
JP2019139262A (en) * 2018-02-06 2019-08-22 富士通株式会社 Determination program, determination method, determination apparatus
CN110413483A (en) * 2019-07-30 2019-11-05 中国工商银行股份有限公司 Monitoring method, device, electronic equipment and the storage medium of batch jobs data
CN111274090A (en) * 2020-01-16 2020-06-12 泰康保险集团股份有限公司 Job processing method, job processing apparatus, job processing medium, and electronic device

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006202076A (en) * 2005-01-21 2006-08-03 Internatl Business Mach Corp <Ibm> Trace information collection system, trace information collecting method and trace information collection program
US7574626B2 (en) 2005-01-21 2009-08-11 International Business Machines Corporation Trace information collecting system, method and program
JP2011159011A (en) * 2010-01-29 2011-08-18 Toshiba It Service Kk System and program for monitoring job
JP2014089603A (en) * 2012-10-30 2014-05-15 Canon Electronics Inc Information processing device, normal end determination method for process, and program
JP2015057685A (en) * 2013-08-12 2015-03-26 株式会社三菱東京Ufj銀行 Monitoring system
US10346262B2 (en) 2015-09-18 2019-07-09 Mitsubishi Electric Corporation Job management apparatus, job management method and computer readable medium to generate and execute a retry job when an error occurs during a job step
JP2019139262A (en) * 2018-02-06 2019-08-22 富士通株式会社 Determination program, determination method, determination apparatus
JP7056193B2 (en) 2018-02-06 2022-04-19 富士通株式会社 Judgment program, judgment method, and judgment device
CN110413483A (en) * 2019-07-30 2019-11-05 中国工商银行股份有限公司 Monitoring method, device, electronic equipment and the storage medium of batch jobs data
CN111274090A (en) * 2020-01-16 2020-06-12 泰康保险集团股份有限公司 Job processing method, job processing apparatus, job processing medium, and electronic device

Similar Documents

Publication Publication Date Title
CN107515796B (en) Equipment abnormity monitoring processing method and device
CN109660380A (en) Monitoring method, platform, system and the readable storage medium storing program for executing of operation condition of server
WO2014161373A1 (en) System fault detection and processing method, device, and computer readable storage medium
JP4892367B2 (en) Abnormal sign detection system
JP4502414B2 (en) Production management information output device and production management information output method
AU2007261542B2 (en) Method and system for monitoring non-occurring events
JP2004164271A (en) Job execution monitoring method and program
US20040133593A1 (en) E-maintenance system
JPH08286990A (en) Electronic mail interlocking type fault monitoring system
CN113760634A (en) Data processing method and device
CN116483663A (en) Abnormality warning method and device for platform
CN115562932A (en) Task monitoring and abnormal self-healing method and device based on multi-interface platform
JP2006331026A (en) Message analysis system and message analysis program
CN116149932A (en) Method and device for detecting software system state and electronic equipment
US20050005202A1 (en) Proactive support of a healthcare information system
JP7211026B2 (en) Job management system
JP5613570B2 (en) Batch job delay warning automatic alert system, automatic alert method, and program therefor
CN112969151A (en) Short message monitoring method, device and equipment
CN114168371A (en) Intelligent automatic fault alarm system
JP2001022717A (en) Method for deciding misoperation regarding operation management system in decentralization environment
JPH06175887A (en) Fault monitoring/reporting system
CN111930594A (en) Method and device for monitoring down of target machine and readable storage equipment
CN111061609A (en) Log monitoring method and system
JP2003345629A (en) System monitor device, system monitoring method used for the same, and program therefor
CN111625420B (en) Distributed training task processing method, device, equipment and storage medium

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040419

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060815

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20061212