JP2004318763A - ジョブネットワーク管理システムおよびプログラム - Google Patents

ジョブネットワーク管理システムおよびプログラム Download PDF

Info

Publication number
JP2004318763A
JP2004318763A JP2003115470A JP2003115470A JP2004318763A JP 2004318763 A JP2004318763 A JP 2004318763A JP 2003115470 A JP2003115470 A JP 2003115470A JP 2003115470 A JP2003115470 A JP 2003115470A JP 2004318763 A JP2004318763 A JP 2004318763A
Authority
JP
Japan
Prior art keywords
job
return value
determination information
treatment
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003115470A
Other languages
English (en)
Inventor
Takashi Hasegawa
長谷川  隆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2003115470A priority Critical patent/JP2004318763A/ja
Publication of JP2004318763A publication Critical patent/JP2004318763A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】ジョブネットワークを構成するジョブが異常終了した場合における運用者の負担を軽減する。
【解決手段】ジョブ実行部16は、ジョブネットワークを構成するジョブが異常終了すると、異常原因に対応する返値を含む処理結果を出力し、処理部17はエラーメッセージを表示装置4に表示する。オペレータは、障害原因を取り除く障害回復プログラム52−1を障害回復処理部18で実行し、ジョブを再起動する。再起動したジョブが正常終了すると、ジョブ名と返値と障害回復プログラム52―1のディレクトリ名とを含む処置判定情報が、更新部1Aによって処置判定情報記憶部23に登録される。次回同じジョブが同じ返値を出して異常終了すると、ジョブ終了時処理部17は、登録された処置判定情報を参照して障害回復プログラム52―1を自動的に実行し、その後にジョブを再実行する。
【選択図】 図10

Description

【0001】
【発明の属する技術分野】
本発明は複数のジョブから構成されるジョブネットワークを実行するコンピュータシステムに関し、特にジョブネットワークの実行を管理するジョブネットワーク管理システムに関する。
【0002】
【従来の技術】
複数のジョブから構成されるジョブネットワークは、コンピュータシステムで予め定められた順番で全てのジョブが正常に実行されることにより初めて正常終了し、何れかのジョブが異常終了したままの状態では、ジョブネットワークは正常終了しない。このため、ジョブネットワークの実行を管理するジョブネットワーク管理システムには、ジョブネットワークを構成する複数のジョブの実行順序を管理する機能に加えて、何れかのジョブが異常終了した場合の障害対応機能が必要となる。
【0003】
ジョブネットワークを構成するジョブが異常終了した場合の障害対応方法として従来は、ジョブの処理結果が異常の場合にエラーメッセージを出力してオペレータの処置を待ち、オペレータが障害の原因を取り除き処理再開を指示すると、処理を続行するといった方法が採用されている(例えば、特許文献1参照)。
【0004】
【特許文献1】
特開2000−347884号公報
【0005】
【発明が解決しようとする課題】
しかしながら、ジョブネットワークを構成するジョブが異常終了する毎にエラーメッセージを出力してオペレータの処置を待つ従来の技術では、ジョブの異常終了毎にオペレータが介在する必要があり、オペレータの負担が極めて大きい。
【0006】
本発明の目的は、ジョブネットワークを構成するジョブが異常終了した場合におけるオペレータの負担を軽減することができるジョブネットワーク管理システムを提供することにある。
【0007】
【課題を解決するための手段】
本発明の第1のジョブネットワーク管理システムは、複数のジョブから構成されるジョブネットワークを実行するコンピュータシステムにおけるジョブネットワーク管理システムにおいて、前記ジョブネットワークを構成する各ジョブ毎に、異常終了時にジョブから返される返値のうち、自動復旧対象とする返値については、その返値を判定するための判定値と自動復旧方法を示す処置方法とジョブ識別子とを含む処置判定情報を記憶し、自動復旧対象とする返値以外の返値については、その返値を判定するための判定値とオペレータへ障害を通知することを示す処置方法とジョブ識別子とを含む処置判定情報を記憶した処置判定情報記憶手段と、前記ジョブネットワークを構成する何れかのジョブが異常終了したとき、異常終了したジョブのジョブ識別子および異常終了したジョブから返される返値に合致するジョブ識別子および判定値を持つ処置判定情報組に含まれる処置方法を前記処置判定情報記憶手段から検索し、該検索した処置方法を実行する処理手段とを備える。
【0008】
本発明の第2のジョブネットワーク管理システムは、第1のジョブネットワーク管理システムにおいて、入力装置と、前記入力装置からのオペレータ操作に応答して、前記処置判定情報記憶手段の記憶内容を修正する処置判定登録手段を備える。
【0009】
本発明の第3のジョブネットワーク管理システムは、第1のジョブネットワーク管理システムにおいて、異常終了したジョブのジョブ識別子と前記異常終了したジョブから出力された返値と前記異常終了したジョブの再実行前に実行すべきものとしてオペレータから指定された処置方法とを保持するレジスタと、前記レジスタに保持されたジョブ識別子のジョブが正常終了したことを契機に前記レジスタに保持されたジョブ識別子、返値および処置方法に基づいて前記処置判定情報記憶手段の記憶内容を修正する更新手段を備える。
【0010】
【作用】
1つのジョブネットワークを構成する個々のジョブが終了すると、一般に返値を含むジョブ処理結果が出力され、異常終了時には異常終了原因によって異なる値の返値が出力される。今、複数のジョブのうち、或るジョブAが終了したとき、正常終了なら返値0が出力され、異常終了なら異常終了原因に応じて、1、2、3、4、5の合計5つの返値が返されるものとし、返値1が出された場合には予め定めた自動復旧方法Xを適用し、それ以外の返値が出された場合にはオペレータが介在して障害復旧を行うものとすると、処置判定情報記憶手段には、ジョブAのジョブ識別子を含む「判定値=1、自動復旧方法X」と「判定値≠0、1、エラーメッセージ出力」の2つの処置判定情報が予め設定されている。このような設定状態でジョブネットワークが実行され、ジョブAが異常終了すると、返値1が出された場合には処理手段によって、返値1に適合する判定値=1を持つ処置判定情報中の処置方法(自動復旧方法X)が検索され、自動復旧方法Xが実行されて障害が自動復旧される。他方、ジョブAの異常終了時に返値1以外の返値2、3、4、5が出された場合、処理手段によって、出された返値に適合する判定値≠0、1を持つ処置判定情報中の処置方法(エラーメッセージ出力)が検索され、オペレータにエラーメッセージが出力されてオペレータによる障害回復処置を待つことになる。このように、第1の発明のジョブネットワーク管理システムにあっては、ジョブの異常終了原因に応じて、予め定められた自動復旧方法による復旧とオペレータへの通知による障害回復措置とが選択されるため、従来技術のように、ジョブが異常終了する毎に毎回オペレータが介在する必要がなくなり、オペレータの負担が軽減される。
【0011】
また、例えば返値2で異常終了したジョブAに対して、オペレータが有効な障害回復方法Yを見出した場合、処置判定登録手段を通じて処置判定情報記憶部の処置判定情報を、「判定値=1、自動復旧方法X」、「判定値=2、自動復旧方法Y」、「判定値≠0、1、2、エラーメッセージ出力」のように更新しておくと、同じジョブネットワークを次回実行した際に、ジョブAが異常終了して返値2が出された場合、自動復旧方法Yがオペレータの介在無しに自動的に実行される。このように、第2の発明のジョブネットワーク管理システムにあっては、オペレータによる手動操作によって、処置判定情報記憶部の処置判定情報を修正することができ、同じジョブネットワークが再度実行され、同じ異常原因でジョブが異常終了した場合のオペレータの負担を軽減することができる。更に、第3のジョブネットワーク管理システムによれば、このような処置判定情報記憶部の処置判定情報の修正を自動化でき、オペレータの負担を一層軽減することができる。
【0012】
【発明の第1の実施の形態】
図1を参照すると、本発明の第1の実施の形態にかかるジョブネットワーク管理システムは、プログラム制御により動作するデータ処理装置1と、各種の情報を記憶する主記憶等の記憶装置2と、キーボード等の入力装置3と、LCD等の表示装置4と、各種のデータやプログラムを記憶する磁気ディスク等の外部記憶装置5を含んで構成される。
【0013】
記憶装置2は、ジョブネットワーク情報記憶部21、ジョブ情報記憶部22および処置判定情報記憶部23を有する。
【0014】
ジョブネットワーク情報記憶部21は、コンピュータシステムで実行するジョブネットワークに関する情報を記憶する部分である。その記憶内容の一例を図2に示す。図2を参照すると、ジョブネットワーク情報記憶部21には、各ジョブネットワーク毎に、開始タイミング211、ジョブネットワーク名212および関連ジョブ名213が記憶される。開始タイミング211は、そのジョブネットワークを起動するタイミングを示す。例えば図2の1行目のジョブネットワークは23時55分に起動することを、2行目のジョブネットワークは0時5分に起動することをそれぞれ示している。開始タイミング211は、1日のうちの時刻だけでなく、年月日も設定して良いし、例えば0時〜6時まで1時間毎に起動するといったタイミングを設定することも可能である。ジョブネットワーク名212は、そのジョブネットワークを一意に識別する名前である。関連ジョブ名213は、そのジョブネットワークを構成するジョブを一意に識別する名前をジョブの実行順に並べたものである。例えば1行目のジョブネットワークは、KOUSU−SUMという識別子のジョブを最初に実行し、次にTANKIN−READという識別子のジョブを実行し、以下、図示は省略してあるが、順次起動すべきジョブの識別子が記載されている。
【0015】
ジョブ情報記憶部22は、ジョブネットワーク情報記憶部21に記憶されている個々のジョブネットワークを構成する各ジョブに関する情報を記憶する部分である。その記憶内容の一例を図3に示す。図3を参照すると、ジョブ情報記憶部22には、各ジョブ毎に、ジョブ名221およびジョブ内容222が記憶される。ジョブ名221は、ジョブを一意に識別する名前である。ジョブ内容222には、実行すべきジョブを定義するジョブ制御言語が記憶されている外部記憶装置5内の場所情報(ディレクトリ名)が設定される。ジョブ内容222自体のジョブ制御言語を記憶するようにしても良い。
【0016】
処置判定情報記憶部23は、ジョブネットワークの実行時に何れかのジョブが異常終了した場合に採るべき処置を判定するための処置判定情報を記憶する部分である。具体的には、ジョブネットワーク情報記憶部21に記憶されたジョブネットワークを構成する各ジョブ毎に、異常終了時にジョブから返される返値のうち、自動復旧対象とする返値については、その返値を判定するための判定値と自動復旧方法を示す処置方法とジョブ名とを含む処置判定情報が記憶され、自動復旧対象とする返値以外の返値については、その返値を判定するための判定値とオペレータへ障害を通知することを示す処置方法とジョブ名とを含む処置判定情報が記憶される。また、本実施の形態では、ジョブネットワークの実行時に何れかのジョブが正常終了した場合に採るべき処置を判定するための処置判定情報も処置判定情報記憶部23に記憶されているが、ジョブが正常終了した場合に採るべき処置は、そのジョブの次の順番のジョブがあればそれを起動するという画一的な処理なので、処置判定情報を使用せずにプログラムの論理で実現することもできる。処置判定情報記憶部23の記憶内容の例を図4に示す。
【0017】
例えば、KOUSU−SUMというジョブ名のジョブが正常終了した場合、返値0が返され、異常終了した場合には、−1、−2、−3といった0以外の複数種類の返値のうち発生した異常原因に応じた返値が返されるものとすると、自動復旧対象とする返値が1つもない状況では、例えば図4(a)の2行目に示すように、ジョブ名231に「KOUSU−SUM」が、判定値232に「≠0」が、処置方法233に「C:Call Operator」がそれぞれ設定された処置判定情報が記憶される。ここで、処置方法233に記述されたCall Operatorは、表示装置4にエラーメッセージを表示することを指示するコマンドであり、C:は以降にコマンドが続くことを示す。
【0018】
また、返値−2が返される異常終了に対する適切な自動復旧方法Xが見出された場合、例えば図4(b)の2行目に示すように、ジョブ名231に「KOUSU−SUM」が、判定値232に「−2」が、処置方法233に「D:/usr/bin/SIHARAI/kousu−p/−2」がそれぞれ設定された処置判定情報と、3行目に示すように、ジョブ名231に「KOUSU−SUM」が、判定値232に「≠0、−2」が、処置方法233に「C:Call Operator」がそれぞれ設定された処置判定情報が記憶される。ここで、2行目の処置判定情報に記述された/usr/bin/SIHARAI/kousu−p/−2は、自動復旧方法Xを実現する障害回復プログラムを記憶する外部記憶装置5内の記憶場所(ディレクトリ名)を示し、D:は以降にディレクトリ名が続くことを示す。
【0019】
さらに、本実施の形態では、図4(a)および(b)の1行目に示すように、返値0が返された正常終了時には次のジョブを実行することを指示する処置判定情報が、処置判定情報記憶部23に記憶されている。ここで、NEXT Job Execは、次のジョブを実行することを指示するコマンドである。
【0020】
外部記憶装置5は、ジョブ情報記憶部22に記憶された各ジョブの内容を定義したジョブ制御言語51−1〜51−n、処置判定情報記憶部23に記憶された自動復旧方法を実現する障害回復プログラム52−1〜52−mを記憶する。
【0021】
データ処理装置1は、ジョブネットワーク登録部11、ジョブ登録部12、処置判定登録部13、ジョブネットワーク起動部14、ジョブ起動部15、ジョブ実行部16、ジョブ終了時処理部17および障害回復処理部18を含んで構成される。
【0022】
ジョブネットワーク登録部11は、入力装置3から入力されるジョブネットワーク情報をジョブネットワーク情報記憶部21に追加する処理、入力装置3からの指示に従って登録されたジョブネットワーク情報を更新、削除する処理を行う。また、ジョブ登録部12は、入力装置3から入力されるジョブ情報をジョブ情報記憶部22に追加する処理、入力装置3からの指示に従って登録されたジョブ情報を更新、削除する処理を行う。さらに、処置判定登録部13は、入力装置3から入力される処置判定情報を処置判定情報記憶部23に追加する処理、入力装置3からの指示に従って登録された処置判定情報を更新、削除する処理を行う。これらのジョブネットワーク登録部11、ジョブ登録部12および処置判定登録部13は、例えばテキストエディタ等を用いて実現される。
【0023】
ジョブネットワーク起動部14は、図示しないシステム時計が刻時する現在時刻とジョブネットワーク情報記憶部21に記憶された各ジョブネットワークの開始タイミング211とを比較することにより、起動すべきジョブネットワークを監視し、起動すべきタイミングが到来したジョブネットワークについては、関連ジョブ名213に記載された1番最初に起動すべきジョブ名をジョブ起動部15に通知し、この通知したジョブ名のジョブが正常終了した旨の報告をジョブ終了時処理部17から受けると、2番目に起動すべきジョブ名をジョブ起動部15に通知し、以後、最後のジョブ名まで順番に通知する処理を繰り返す。最後の順番のジョブ名のジョブが正常終了した旨の報告をジョブ終了時処理部17から受けると、そのジョブネットワークの全ジョブが終了した旨をジョブ終了時処理部17に通知する。
【0024】
図5にジョブネットワーク起動部14のフローチャート例を示す。現在時刻と開始タイミング211に基づいて起動すべきジョブネットワークが発生したかどうかを監視すると共に(S101)、ジョブ終了時処理部17から正常終了したジョブの通知を受信したかどうかを監視し(S102)、起動すべき新たなジョブネットワークが発生したら(S101でYES)、最初に起動すべきジョブのジョブ名をジョブ起動部15に通知し(S104)、正常終了ジョブの通知を受けたら(S102でYES)、次に起動するジョブがあるかどうかを調べ(S103)、あれば次に起動すべきジョブのジョブ名をジョブ起動部15に通知し(S104)、なければ正常終了したジョブネットワークのジョブネットワーク名をジョブ終了時処理部17に通知する(S105)。
【0025】
ジョブ起動部15は、ジョブネットワーク起動部14からジョブ名が通知される毎に、通知されたジョブ名でジョブ情報記憶部22を検索し、同じジョブ名221に対応して記憶されたジョブ内容222で指定されたジョブ制御言語を外部記憶装置5から読み出し、ジョブ実行部16に実行させる。また、障害回復処理部18からジョブ名を指定した再起動の要求があった場合、指定されたジョブ名でジョブ情報記憶部22を検索し、同じジョブ名221に対応して記憶されたジョブ内容222で指定されたジョブ制御言語を外部記憶装置5から読み出し、ジョブ実行部16に再実行させる。
【0026】
図6にジョブ起動部15のフローチャートを示す。ジョブネットワーク起動部14または障害回復処理部18から通知があるかどうかを監視し(S201、S202)、ジョブネットワーク起動部14から起動すべきジョブ名の通知を受けると(S201でYES)、通知されたジョブ名のジョブをジョブ実行部16上で起動し(S203)、障害回復処理部18から再起動すべきジョブ名の通知を受けると(S202でYES)、通知されたジョブ名のジョブをジョブ実行部16上で再起動する(S204)。
【0027】
ジョブ実行部16は、ジョブ起動部15から起動されたジョブを実行する部分であり、少なくとも1台の中央処理装置を含んで構成され、主記憶や一次ファイル等を適宜使用しながらジョブを実行する。ジョブ実行部16は、実行中のジョブが終了したときに処理結果としての返値および終了したジョブ名をジョブ終了時処理部17に送出する。返値は、正常終了時と異常終了時とで異なり、また異常終了時であっても異常の原因によって相違する。
【0028】
ジョブ終了時処理部17は、ジョブ実行部16から実行の終了したジョブのジョブ名と返値を受け取る毎に、ジョブ名と返値をキーに処置判定情報記憶部23を検索してジョブ名231が同じで且つ返値を包含する判定値232を持つ処置判定情報を取得し、この取得した処置判定情報中の処置方法233の実行を制御する。具体的には、処置方法233が「NEXT Job Exec」コマンドであった場合、ジョブネットワーク起動部14にジョブ名を指定してそのジョブが正常終了したことを通知すると同時に、表示装置4にジョブ名を指定してそのジョブが正常終了した旨のメッセージを表示する。通知先のジョブネットワーク起動部14からジョブネットワーク名を指定した全ジョブの終了が通知されると、表示装置4にジョブネットワーク名を指定してそのジョブネットワークが正常終了した旨のメッセージを表示する。また、処置方法233が「Call Operator」コマンドであった場合、表示装置にジョブ名および返値を指定してそのジョブが異常終了した旨のエラーメッセージを表示する。さらに、処置方法233が障害回復プログラムの記憶場所情報を指定する情報であった場合、指定された記憶場所情報および再起動すべきジョブ名(異常終了したジョブのジョブ名)を通知して、その障害回復プログラムの実行とその実行後のジョブの再起動を障害回復処理部18に要求し、また、表示装置にジョブ名および返値を指定してそのジョブが異常終了したこと、自動復旧中である旨のメッセージを出力する。
【0029】
図7にジョブ終了時処理部17のフローチャートを示す。ジョブ実行部16からジョブ名および返値を含むジョブ処理結果を受信すると、そのジョブ名および返値に適合する処置判定情報を処置判定情報記憶部23から検索し(S301)、検索した処置判定情報中の処置方法233の内容に応じた処理へと進む(S302)。処置方法233が、NEXT job Execであった場合、ジョブ名を指定して正常終了をジョブネットワーク起動部14に通知し(S303)、ジョブ名を指定した正常終了メッセージを表示装置4に表示する(S304)。ステップS303の通知に対して正常終了したジョブネットワーク名がジョブネットワーク起動部14から通知されてきた場合(図5のS105)、正常終了したジョブネットワーク名を指定した正常終了メッセージをステップS304で併せて表示する。処置方法233が、Call Operatorであった場合、ジョブ名および返値を指定したエラーメッセージを表示装置4に表示する(S305)。処置方法233が、障害回復プログラムを記憶する場所情報(ディレクトリ名)であった場合、そのディレクトリ名と再起動するジョブ名(今回異常終了したジョブ名)とを障害回復処理部18に通知し(S306)、ジョブ名および返値を指定してそのジョブが異常終了したことと自動復旧中であることをメッセージで表示装置4に表示する。。
【0030】
障害回復処理部18は、ジョブ終了時処理部17および入力装置3から実行すべき障害回復プログラムの記憶場所情報と再起動すべきジョブ名を受け取り、外部記憶装置5の指定された記憶場所にある障害回復プログラムを実行し、その実行後にジョブ起動部15に対してジョブの再起動を行う。入力装置3から実行すべき障害回復プログラムの記憶場所情報と再起動すべきジョブ名が渡される場面は、例えば、処置判定情報の処置方法が「Call Operator」コマンドであって、エラーメッセージを確認したオペレータが、今回の異常終了の原因を解析し、その回復に必要な障害回復プログラムを外部記憶装置5に準備して、その準備した障害回復プログラムの実行とその実行後に前記異常終了したジョブの再起動とを入力装置3から障害回復処理部18に要求したときに現れる。
【0031】
図8に障害回復処理部18のフローチャートを示す。ジョブ終了時処理部17または入力装置3から入力された障害回復プログラムの記憶場所情報(ディレクトリ名)と再起動すべきジョブ名を内部に一時的に記憶し(S401)、該当する記憶場所から障害回復プログラムを読み出してジョブ実行部16上で実行し(S402)、その実行完了後に、内部に一時的に記憶してある再起動すべきジョブ名をジョブ起動部15に通知し、ジョブの再起動を要求する(S403)。
【0032】
図1に示した記録媒体6は、CD−ROM、半導体メモリ、磁気ディスク等のコンピュータ可読記録媒体であり、ジョブネットワーク管理プログラムが記録されている。記録媒体6に記録されたプログラムは、データ処理装置1に読み取られ、その動作を制御することにより、データ処理装置1上に、ジョブネットワーク登録部11、ジョブ登録部12、処置判定登録部13、ジョブネットワーク起動部14、ジョブ起動部15、ジョブ実行部16、ジョブ終了時処理部17および障害回復処理部18を実現する。
【0033】
次に本実施の形態の動作を説明する。
【0034】
オペレータは、入力装置3を操作して、ジョブネットワーク登録部11を通じてジョブネットワーク情報記憶部21に図2に示したようなジョブネットワークの情報を登録する。また、登録したジョブネットワークを構成する各ジョブのジョブ制御言語51−1〜51−nを外部記憶装置5に準備し、ジョブ登録部12を通じてジョブ情報記憶部22に図3に示したようなジョブ情報を登録する。さらに、処置判定登録部13を通じて、処置判定情報記憶部23に図4(a)または図4(b)に示したような処置判定情報を登録する。ここでは、ジョブ名KOUSU−SUMについては図4(a)に示したような2つの処置判定情報だけが登録されている状態を想定する。
【0035】
システムの運用が開始されると、ジョブネットワーク起動部14は、図5に示した処理を開始し、システム時刻とジョブネットワーク情報記憶部21に記憶された各ジョブネットワークの開始タイミング211とを比較することにより、各ジョブネットワークの起動時期の到来を監視する(S101)。そして、例えばSIHARAI−SUMMARYという名前のジョブネットワークの起動時期の到来を検出すると、関連ジョブ名213の先頭のジョブ名KOUSU−SUMをジョブ起動部15に通知する(S104)。
【0036】
ジョブ起動部15は、ジョブネットワーク起動部14からジョブ名KOUSU−SUMを受信すると(図6のS201でYES)、ジョブ情報記憶部22をジョブ名KOUSU−SUMで検索し、ジョブ名KOUSU−SUMに対応するジョブ内容222に記載されたディレクトリ名に基づいて外部記憶装置5からジョブ名KOUSU−SUMのジョブの実行に必要なジョブ制御言語(51−1とする)を読み出し、ジョブ実行部16に渡して当該ジョブを起動する(S203)。
【0037】
ジョブ実行部16は、ジョブ名KOUSU−SUMのジョブを実行し、正常終了した場合には、ジョブ名KOUSU−SUMと返値0を含むジョブ処理結果をジョブ終了時処理部17に出力し、異常終了した場合には、ジョブ名KOUSU−SUMと異常終了原因に応じた返値とを含むジョブ処理結果をジョブ終了時処理部17に出力する。
【0038】
ジョブ終了時処理部17は、ジョブ処理結果を受信すると、図7に示した処理を開始し、ジョブ処理結果に含まれるジョブ名と同じジョブ名を持ち、ジョブ処理結果に含まれる返値を包含する判定値を持つ処置判定情報を処置判定情報記憶部23から検索する(S301)。例えば、ジョブ名KOUSU−SUMが正常終了していた結果、返値0を受信した場合、図4(a)の1行目の処置判定情報が検索され、その処置方法233に記述された「NEXT job Exec」コマンドに従って、ジョブ終了時処理部17は、ジョブネットワーク起動部14に対して、ジョブ名KOUSU−SUMのジョブが正常終了した旨を通知し(S303)、表示装置4にジョブ名KOUSU−SUMの正常終了メッセージを表示する(S304)。ジョブネットワーク起動部14は、この通知を受信すると(図5のS102)、ジョブネットワーク情報記憶部21を参照して、ジョブ名KOUSU−SUMの次に実行すべきジョブ名TANKIN−READを取り出し、ジョブ起動部15に通知する(S104)。ジョブ起動部15は、ジョブ名TANKIN−READのジョブ内容をジョブ情報記憶部22から取り出し、ジョブ実行部16にジョブ名TANKIN−READのジョブを実行させる(図6のS203)。以降、ジョブが正常終了する限り、ジョブネットワークSIHARAI−SUMMARYを構成するジョブが順次同様に実行されていき、最後のジョブの正常終了時点で、表示装置4にジョブネットワーク名SIHARAI−SUMMARYのジョブネットワークが正常終了した旨のメッセージが出力され、今回の起動タイミングにおけるジョブネットワークSIHARAI−SUMMARYの実行が終了する。
【0039】
他方、ジョブ名KOUSU−SUMのジョブの実行が何らかの原因で異常終了していたため、ジョブ処理結果の返値が0以外の値、例えば−2であった場合、ジョブ終了時処理部17は、図4(a)の2行目の処置判定情報を取得し、その処置方法233に記述された「Call Operator」コマンドに従って、ジョブ名KOUSU−SUMのジョブが返値−2を出力して異常終了した旨のエラーメッセージを表示装置4に表示する(図7のS305)。オペレータは、このエラーメッセージにより、ジョブ名KOUSU−SUMが異常終了したこと、その返値が−2であったことを認識する。オペレータは、返値−2を出して異常終了した原因を解析し、その障害原因を取り除くために必要な障害回復プログラムが外部記憶装置5に準備されていなければそれを準備する。例えば、障害原因がジョブの実行に必要な記憶装置の空き領域不足の場合、一次ファイルなど不要ファイルを削除する障害回復プログラムが準備されていなければそれを準備する。そして、入力装置3から障害回復処理部18に対して、実行すべき障害回復プログラム(52−1とする)のディレクトリ名とその障害回復プログラム実行後に再起動すべきジョブ名としてKOUSU−SUMを指定する。
【0040】
障害回復処理部18は、オペレータから指定された障害回復プログラム52−1を外部記憶装置5から読み出し、ジョブ実行部16上でその障害回復プログラム52−1を実行し(図8のS401、S402)、その実行完了後に、再起動すべきジョブ名KOUSU−SUMをジョブ起動部15に通知する(S403)。ジョブ起動部15は、この通知を受けて、ジョブ名KOUSU−SUMのジョブをジョブ実行部16に再実行させる(S204)。ジョブ実行部16においてジョブ名KOUSU−SUMのジョブが再実行され、正常終了すると、ジョブ終了時処理部17から表示装置4に正常終了メッセージが出力されるので、オペレータは、行った処置によって障害原因が取り除かれたことを確認することができる。若し、再び異常終了した場合、異常終了メッセージが出力されるので、オペレータは再度その障害原因を解析し、障害原因を取り除くために必要な新たな障害回復プログラムを準備し、前回と同様の作業を繰り返す。
【0041】
行った処置によってジョブ名KOUSU−SUMのジョブが正常終了した場合、オペレータは、入力装置3を操作して、処置判定登録部13に、今回講じた処置にかかる処置判定情報を追加する。例えば、返値−2を出して異常終了したジョブ名KOUSU−SUMのジョブに対して、障害回復プログラム52−1の実行により障害原因が取り除かれて再起動で正常終了した場合、図4(b)の2行目に示すように、ジョブ名231がKOUSU−SUM、判定値232が−2、処置方法233が障害回復プログラム52−1のディレクトリ名とした処置判定情報を追加する。同時に、図4(a)の2行目の処置判定情報を図4(b)の3行目の処置判定情報に示されるように、返値−2を包含しないように変更する。このように処置判定情報記憶部23の内容を更新しておくことで、ジョブネットワーク名SIHARAI−SUMMARYが次回起動され、ジョブ名KOUSU−SUMが前回と同様の原因で返値−2を出して異常終了した場合、ジョブ終了時処理部17は、図4(b)の2行目の処置判定情報を取得し、その処置方法233に従って、障害回復処理部18に対して障害回復プログラム52−1を実行させ、その実行後にジョブ名KOUSU−SUMのジョブを再起動させる。
【0042】
【発明の第2の実施の形態】
図9を参照すると、本発明の第2の実施の形態にかかるジョブネットワーク管理システムは、データ処理装置1に、ジョブ終了時処理部17から表示装置4に最も最近出力されたジョブ異常終了メッセージ中の返値、およびオペレータが入力装置3から障害回復処理部18に対して最も最近入力した障害回復プログラムの記憶場所情報(ディレクトリ名)と再起動すべきジョブ名とを保持するレジスタ19と、レジスタ19に保持された再起動すべきジョブ名と同じジョブ名のジョブの正常終了メッセージがジョブ終了時処理部17から表示装置4に出力されたとき、レジスタ19の記憶内容に基づいて処置判定情報記憶部23の記憶内容を修正する更新部1Aとが新たに追加されている点で、図1に示した第1の実施の形態と相違し、その他の点は第1の実施の形態と同じである。なお、レジスタ19に保持させる再起動すべきジョブ名を、ジョブ終了時処理部17から表示装置4に最も最近出力されたジョブ異常終了メッセージ中のジョブ名とするようにしても良い。
【0043】
図10に更新部1Aのフローチャートを示す。更新部1Aは、レジスタ19にジョブ名等が保持されているかどうかを監視し(S501)、保持されていれば、同じジョブ名を持つジョブの正常終了メッセージがジョブ終了時処理部17から出力されたかどうかを監視する(S502)。そして、レジスタ19に保持されたジョブ名の正常終了メッセージが出力されると(S502でYES)、レジスタ19に保持されたジョブ名、返値および処置方法を新たに追加すべき処置判定情報のジョブ名、判定値および処置方法として入力する(S503)。次に、処置判定情報記憶部23に、入力した処置判定情報とジョブ名および判定値が全く同じ処置判定情報があればそれを削除し(S504)、入力した処置判定情報とジョブ名が同じで、判定値が追加する判定値を包含する処置判定情報があれば、追加する判定値を包含しないように既存の判定値を修正する(S505)。次に、入力した処置判定情報を処置判定情報記憶部23に追加する(S506)。そして、レジスタ19の保持内容をクリアし(S507)、ステップS501に戻る。
【0044】
第1の実施の形態で説明したように、処置判定情報記憶部23が図4(a)のような内容になっている状態において、ジョブ名KOUSU−SUMのジョブの実行が何らかの原因で返値−2を出して異常終了したため、ジョブ終了時処理部17が異常終了メッセージを表示装置4に出力すると、その異常終了メッセージに含まれている返値−2がレジスタ19に保持される。その後、オペレータが返値−2を出して異常終了した原因を解析し、その障害原因を取り除くために必要な障害回復プログラム52−1を外部記憶装置5に準備し、入力装置3から障害回復処理部18に対して、実行すべき障害回復プログラム52−1のディレクトリ名とその障害回復プログラム実行後に再起動すべきジョブ名としてKOUSU−SUMを指定すると、レジスタ19に、障害回復プログラム52−1のディレクトリ名と再起動すべきジョブ名としてKOUSU−SUMが保持される。
【0045】
障害回復処理部18が第1の実施の形態と同様にして障害回復プログラム52−1を実行し、その実行完了後に、再起動すべきジョブ名KOUSU−SUMをジョブ起動部15に通知してジョブを再実行し、その結果、ジョブ名KOUSU−SUMのジョブが正常終了すると、ジョブ終了時処理部17から表示装置4に正常終了メッセージが出力される。更新部1Aは、レジスタ19に保持されたジョブ名KOUSU−SUMを持つ正常終了メッセージが出されたことを検知すると(S502でYES)、レジスタ19に記憶されたジョブ名KOUSU−SUM、返値−2、処理回復プログラム52−1のディレクトリ名に基づき、処置判定情報記憶部23を修正する(S503〜S506)。更新前の処置判定情報記憶部23の内容が図4(a)に示したような内容の場合、2行目の処置判定情報中の判定値≠0は、今回の返値−2を包含しているので、図4(b)の3行目の処置判定情報の判定値のように−2を包含しないように修正する(S505)。その後、図4(b)の2行目の処置判定情報を追加する(S506)。
【0046】
図9に示した記録媒体7は、CD−ROM、半導体メモリ、磁気ディスク等のコンピュータ可読記録媒体であり、ジョブネットワーク管理プログラムが記録されている。記録媒体7に記録されたプログラムは、データ処理装置1に読み取られ、その動作を制御することにより、データ処理装置1上に、ジョブネットワーク登録部11、ジョブ登録部12、処置判定登録部13、ジョブネットワーク起動部14、ジョブ起動部15、ジョブ実行部16、ジョブ終了時処理部17、障害回復処理部18および更新部1Aを実現する。
【0047】
以上本発明の実施の形態について説明したが、本発明は以上の実施の形態にのみ限定されず、その他各種の付加変更が可能である。例えば、自動復旧対象とする返値を判定するための判定値を持つ処置判定情報の処置方法233には、障害回復プログラムの記憶場所情報を設定したが、障害回復プログラムの起動コマンドを設定するようにしても良い。
【0048】
【発明の効果】
以上説明したように、本発明によれば、ジョブネットワークを構成するジョブが異常終了した場合におけるオペレータの負担を軽減することができる。
【図面の簡単な説明】
【図1】本発明の第1の実施の形態にかかるジョブネットワーク管理システムのブロック図である。
【図2】ジョブネットワーク情報記憶部の内容例を示す図である。
【図3】ジョブ情報記憶部の内容例を示す図である。
【図4】処置判定情報記憶部の内容例を示す図である。
【図5】ジョブネットワーク起動部の処理例を示すフローチャートである。
【図6】ジョブ起動部の処理例を示すフローチャートである。
【図7】ジョブ終了時処理部の処理例を示すフローチャートである。
【図8】障害回復処理部の処理例を示すフローチャートである。
【図9】本発明の第2の実施の形態にかかるジョブネットワーク管理システムのブロック図である。
【図10】更新部の処理例を示すフローチャートである。
【符号の説明】
1…データ処理装置
2…記憶装置
3…入力装置
4…表示装置
5…外部記憶装置
6、7…記録媒体
11…ジョブネットワーク登録部
12…ジョブ登録部
13…処置判定登録部
14…ジョブネットワーク起動部
15…ジョブ起動部
16…ジョブ実行部
17…ジョブ終了時処理部
18…障害回復処理部
19…レジスタ
1A…更新部
21…ジョブネットワーク情報記憶部
22…ジョブ情報記憶部
23…処置判定情報記憶部

Claims (6)

  1. 複数のジョブから構成されるジョブネットワークを実行するコンピュータシステムにおけるジョブネットワーク管理システムにおいて、前記ジョブネットワークを構成する各ジョブ毎に、異常終了時にジョブから返される返値のうち、自動復旧対象とする返値については、その返値を判定するための判定値と自動復旧方法を示す処置方法とジョブ識別子とを含む処置判定情報を記憶し、自動復旧対象とする返値以外の返値については、その返値を判定するための判定値とオペレータへ障害を通知することを示す処置方法とジョブ識別子とを含む処置判定情報を記憶した処置判定情報記憶手段と、前記ジョブネットワークを構成する何れかのジョブが異常終了したとき、異常終了したジョブのジョブ識別子および異常終了したジョブから返される返値に合致するジョブ識別子および判定値を持つ処置判定情報組に含まれる処置方法を前記処置判定情報記憶手段から検索し、該検索した処置方法を実行する処理手段とを備えることを特徴とするジョブネットワーク管理システム。
  2. 入力装置と、前記入力装置からのオペレータ操作に応答して、前記処置判定情報記憶手段の記憶内容を修正する処置判定登録手段を備えることを特徴とする請求項1記載のジョブネットワーク管理システム。
  3. 異常終了したジョブのジョブ識別子と前記異常終了したジョブから出力された返値と前記異常終了したジョブの再実行前に実行すべきものとしてオペレータから指定された処置方法とを保持するレジスタと、前記レジスタに保持されたジョブ識別子のジョブが正常終了したことを契機に前記レジスタに保持されたジョブ識別子、返値および処置方法に基づいて前記処置判定情報記憶手段の記憶内容を修正する更新手段を備えることを特徴とする請求項1記載のジョブネットワーク管理システム。
  4. 複数のジョブから構成されるジョブネットワークを実行するコンピュータシステムであって、前記ジョブネットワークを構成する各ジョブ毎に、異常終了時にジョブから返される返値のうち、自動復旧対象とする返値については、その返値を判定するための判定値と自動復旧方法を示す処置方法とジョブ識別子とを含む処置判定情報を記憶し、自動復旧対象とする返値以外の返値については、その返値を判定するための判定値とオペレータへ障害を通知することを示す処置方法とジョブ識別子とを含む処置判定情報を記憶した処置判定情報記憶手段を有するコンピュータシステムを、前記ジョブネットワークを構成する何れかのジョブが異常終了したとき、異常終了したジョブのジョブ識別子および異常終了したジョブから返される返値に合致するジョブ識別子および判定値を持つ処置判定情報組に含まれる処置方法を前記処置判定情報記憶手段から検索し、該検索した処置方法を実行する処理手段、として機能させるプログラム。
  5. 前記コンピュータシステムを、更に、入力装置からのオペレータ操作に応答して、前記処置判定情報記憶手段の記憶内容を修正する処置判定登録手段、として機能させる請求項4記載のプログラム。
  6. 前記コンピュータシステムを、更に、異常終了したジョブのジョブ識別子と、前記異常終了したジョブから出力された返値と、前記異常終了したジョブの再実行前に実行すべきものとしてオペレータから指定された処置方法とを保持するレジスタに保持された前記ジョブ識別子のジョブが正常終了したことを契機に、前記レジスタに保持されたジョブ識別子、返値および処置方法に基づいて前記処置判定情報記憶手段の記憶内容を修正する更新手段、として機能させる請求項4記載のプログラム。
JP2003115470A 2003-04-21 2003-04-21 ジョブネットワーク管理システムおよびプログラム Pending JP2004318763A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003115470A JP2004318763A (ja) 2003-04-21 2003-04-21 ジョブネットワーク管理システムおよびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003115470A JP2004318763A (ja) 2003-04-21 2003-04-21 ジョブネットワーク管理システムおよびプログラム

Publications (1)

Publication Number Publication Date
JP2004318763A true JP2004318763A (ja) 2004-11-11

Family

ID=33474662

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003115470A Pending JP2004318763A (ja) 2003-04-21 2003-04-21 ジョブネットワーク管理システムおよびプログラム

Country Status (1)

Country Link
JP (1) JP2004318763A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008524731A (ja) * 2005-06-30 2008-07-10 フアウェイジシュヨウシアンゴンシ 装置管理におけるタスクを処理するための方法、システム、装置
JP2009539149A (ja) * 2006-04-17 2009-11-12 華為技術有限公司 装置管理におけるタスク処理の方法、システムおよび機器
JP2014049045A (ja) * 2012-09-03 2014-03-17 Hitachi Solutions Ltd ジョブ管理システムにおける障害対応システム及びそのプログラム
JP2014238882A (ja) * 2014-08-19 2014-12-18 キヤノン株式会社 制御装置の処理方法、制御装置、及びプログラム
US9459914B2 (en) 2010-01-06 2016-10-04 Canon Kabushiki Kaisha Processing method for control apparatus involves controlling job subsequent to proceeding job based on execution result acquired by executing the proceeding job

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008524731A (ja) * 2005-06-30 2008-07-10 フアウェイジシュヨウシアンゴンシ 装置管理におけるタスクを処理するための方法、システム、装置
US8875141B2 (en) 2005-06-30 2014-10-28 Huawei Technologies Co., Inc. Execute or cancel a scheduled task execution that missed execution condition on a device based on rule and execution condition received from a management server
US9348647B2 (en) 2005-06-30 2016-05-24 Huawei Technologies Co., Ltd. Execute or cancel a scheduled task that missed execution condition on a device based on rule and execution condition received from a management server
JP2009539149A (ja) * 2006-04-17 2009-11-12 華為技術有限公司 装置管理におけるタスク処理の方法、システムおよび機器
US9459914B2 (en) 2010-01-06 2016-10-04 Canon Kabushiki Kaisha Processing method for control apparatus involves controlling job subsequent to proceeding job based on execution result acquired by executing the proceeding job
JP2014049045A (ja) * 2012-09-03 2014-03-17 Hitachi Solutions Ltd ジョブ管理システムにおける障害対応システム及びそのプログラム
JP2014238882A (ja) * 2014-08-19 2014-12-18 キヤノン株式会社 制御装置の処理方法、制御装置、及びプログラム

Similar Documents

Publication Publication Date Title
JP6342070B2 (ja) ジョブ管理装置及びジョブ管理方法及びジョブ管理プログラム
US9183038B2 (en) Job management system that determines if master data has been updated, then re-executes a sub-job based on available executing computers and data sharing status
WO2009089746A1 (fr) Procédé, dispositif et système de réalisation d'une tâche dans un environnement de grappes
JP2004318763A (ja) ジョブネットワーク管理システムおよびプログラム
CN117591014A (zh) 数据读写控制方法、装置、设备及计算机可读存储介质
JP2001014175A (ja) ジョブ運用管理システム、ジョブ運用管理方法及び記憶媒体
JP2019020798A (ja) 情報処理装置およびプログラム
JP3551079B2 (ja) 修正ロードモジュール置換後の復旧方法ならびに装置
JPH05165539A (ja) バッチプログラムの自動再起動制御方式
JP2006331118A (ja) コマンド実行装置、コマンド実行方法およびコマンド実行プログラム
JP2009098715A (ja) 冗長システム装置並びに冗長システム装置におけるジョブの実行方法及び実行プログラム
KR100800044B1 (ko) 체크포인트 파일 자동 관리 방법
JP2006293582A (ja) ジョブ自動リランシステム
US9244723B2 (en) Medium, method, and apparatus
JPH09274581A (ja) データバックアップ方法
JP2009169579A (ja) コマンドネット実行装置、コマンドネット実行プログラム及びコマンドネット実行プログラムを記録したコンピュータ読み取り可能な記録媒体
JPH0546378A (ja) プログラムの修正処理方法
JP2008234142A (ja) バッチ処理回復方法とシステムおよびプログラム
JPH05100935A (ja) データベース管理方式
JP4738132B2 (ja) 二重化システム
JP6481437B2 (ja) トランザクション処理装置、トランザクション処理方法及び制御プログラム
JP2008186355A (ja) バックアップシステム及び方法
JP2007148906A (ja) 動作環境切り替えプログラム及び情報処理装置
JP2009123082A (ja) 情報処理装置、システム再開方法及びシステム再開プログラム
JPH03225434A (ja) ジョブ再起動方式