JP2001175492A - 分散システムにおけるジョブ再実行装置 - Google Patents

分散システムにおけるジョブ再実行装置

Info

Publication number
JP2001175492A
JP2001175492A JP36035199A JP36035199A JP2001175492A JP 2001175492 A JP2001175492 A JP 2001175492A JP 36035199 A JP36035199 A JP 36035199A JP 36035199 A JP36035199 A JP 36035199A JP 2001175492 A JP2001175492 A JP 2001175492A
Authority
JP
Japan
Prior art keywords
execution
job
file
status
failure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP36035199A
Other languages
English (en)
Inventor
Hiromoto Okayama
博林 岡山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP36035199A priority Critical patent/JP2001175492A/ja
Publication of JP2001175492A publication Critical patent/JP2001175492A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Computer And Data Communications (AREA)
  • Retry When Errors Occur (AREA)
  • Multi Processors (AREA)

Abstract

(57)【要約】 【課題】機能を分散した複数サーバーで構成され、サー
バー間がネットワークにて接続される分散コンピュータ
システムにおいて、複数サーバーを跨ぐ処理での障害時
にサーバを意識すること無く、処理の再実行させる。 【解決手段】分散システムにおける再実行装置として、
障害箇所特定手段及び障害内容取得手段を持つジョブ実
行部40、ファイル受信部60、ファイル送信部80
と、再実行箇所特定手段を持つジョブ監視部100と、
情報収集手段及び再実行手段を持つ再実行依頼部140
とで構成され、全てのサーバーのファイルの送受信、ジ
ョブの状態を監視し、障害内容に応じて適切な箇所から
の再実行を可能とする。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、複数サーバにおけ
る分散システムにおいて複数サーバーに跨るジョブが障
害により異常終了した際に、該ジョブを再実行箇所から
再実行を行う分散システムにおけるジョブ再実行装置に
関する。
【0002】
【従来の技術】通常コンピュータシステムでの障害は大
きく分けてシステム障害、ミドルウェア障害、ジョブの
異常終了があり、それぞれの障害によってジョブの再実
行手段が異なる。ミドルウェア障害、ジョブの異常終了
に関しては当該ジョブが異常終了する際に異常終了情報
をログに出力する為、オペレータは当該情報を分析する
ことにより障害の詳細を把握し、再実行箇所を特定す
る。
【0003】また、システム障害の場合はジョブが異常
終了情報を出力せずに終了する為、オペレータは異常終
了ジョブに加えて未終了のジョブを把握し、当該ジョブ
の終了、未終了を判断し、再実行箇所を特定する。
【0004】また、特開平9−282192号公報、特
開平8−227368号公報では、1システム内にて発
生した障害に関しての障害箇所特定手段、再実行箇所特
定手段、ジョブ再実行手段の各々を迅速に行うジョブ再
実行装置について言及されている。
【0005】
【発明が解決しようとする課題】しかし、従来大型計算
機によって行われていた大規模システムが機能分散によ
るサーバーの複数化により、複数サーバーを跨ぐ処理で
は障害箇所を特定するためにサーバー単位に処理をトレ
ースし障害箇所を特定する必要があり、特開平9−28
2192号公報、特開平8−227368号公報では、
当該処理に関してのジョブ再実行装置には対応していな
い。
【0006】また、マルチベンダ化によるOS、ミドルウ
ェアによる複数システム化やその環境下におけるアプリ
ケーションの多様化に伴い、各々の異常終了情報の出力
箇所が分散化され、障害箇所特定に長時間費やすことと
なる。
【0007】また、サーバー間によるシステムでのデー
タのやり取りは、主にファイル転送にて処理が行われて
いる。よって、サーバー間の障害を考慮した際、ファイ
ル転送処理を含めた再実行装置を考慮する必要がある
が、従来の技術では当該処理の再実行装置に関しての配
慮がされていない。
【0008】本発明は、上記のようなサーバーの分散
化、及びマルチベンダ化によるOS、ミドルウェアの多様
化により、複数システムにおいて好適な箇所からのジョ
ブの再実行が可能な分散システムにおけるジョブ再実行
装置を目的とするものである。
【0009】
【課題を解決するための手段】上記目的を達成するため
に本発明では、機能を分散した複数サーバーで構成さ
れ、サーバー間がネットワークにて接続される分散コン
ピュータシステムにおいて、複数サーバーを跨ぐ処理で
の障害時にその障害箇所を特定する障害箇所特定手段
と、各々の処理に関しての障害内容を取得する障害内容
取得手段と、前記の障害箇所、障害内容から再実行箇所
を特定する再実行箇所特定手段と、各々の処理にて再実
行に必要な情報を収集する情報収集手段と、該処理に関
して再実行の指示を監視することによる再実行手段を備
えたものである。
【0010】また、障害箇所特定手段は該サーバーをネ
ットワークにて接続された分散システムにおいて、該サ
ーバーのジョブの状態をテーブルにて一元管理するだけ
ではなく、他サーバーとのファイルの送受信を管理する
ファイル受信状態テーブル、ファイル送信状態テーブル
を設けることによりサーバー間でのファイルの送受信に
関しての障害特定手段を備えたものである。
【0011】また、再実行箇所特定手段は該障害ジョブ
の実行状態と、該ジョブの完了状態と、該ジョブの障害
内容と、再実行に必要な情報を持つ再実行情報テーブル
と対応が可能な再実行番号を備えたものである。
【0012】また、情報収集手段は全サーバー内のジョ
ブの再実行箇所と再実行に必要な情報を一元管理し、該
サーバーでは再実行番号を備えたものである。
【0013】
【発明の実施の形態】以下、本発明について図面を参照
しながら詳細に説明する。
【0014】図1は、本発明の実施の形態に係る分散シ
ステムにおけるジョブ再実行装置の構成を示すブロック
図である。本実施の形態に係る分散システムにおけるジ
ョブ再実行装置は、サーバーA内においてジョブの実行
を制御するジョブ実行制御部10と、ジョブをスケジュ
ーリングするジョブスケジュールテーブル20と、処理
フローの稼動、非稼動のカレンダー情報を有するカレン
ダーテーブル30と、ジョブを実行するジョブ実行部と
40と、ジョブの実行状態を示すジョブ状態テーブル5
0と、該サーバでファイル受信を管理するファイル受信
部60と、ファイルの受信状態を示すファイル受信状態
テーブル70と、該サーバでファイル送信を管理するフ
ァイル送信部80と、ファイル送信状態を示すファイル
送信状態テーブル90と、ジョブ状態テーブル50、フ
ァイル受信状態テーブル70及びファイル送信状態テー
ブルの異常を監視するジョブ監視部100と、異常箇所
に応じた再実行箇所を示す障害ジョブ管理テーブル11
0、障害ファイル受信管理テーブル120、障害ファイ
ル送信状態130と、ジョブ実行部にジョブの再実行を
依頼する再実行依頼部140と、再実行を依頼するため
に必要な情報を示した再実行情報テーブル150とから
構成されている。
【0015】ジョブ実行制御部10は、サーバーA内に
てカレンダー機能を有するカレンダーテーブル20から
当日の状態を参照し、スケジュールテーブル30内の当
日実行する処理フローを決定し、ジョブ実行部40にジ
ョブの実行依頼を行う。
【0016】スケジュールテーブル20は、サーバーA
内の記憶装置内において、当日の業務スケジュールバッ
チ処理に対して処理フローを備えたテーブル。
【0017】カレンダーテーブル30は、サーバーA内
の記憶装置内において日次、週次、月次、季次、年次処
理におけるカレンダーを備えたテーブル。
【0018】ジョブ実行部40は、サーバA内のCPU等で
実現され、ジョブ実行制御部10の制御により指定され
たプロセスを実行する。プロセス実行時にはプロセス内
にてジョブ状態テーブル50にプロセスの実行状態を格
納する。また、当該ジョブ内にて該ジョブステップが異
常終了した際は、終了状態に異常終了状態を格納する。
【0019】ジョブ状態テーブル50は、サーバーA内
の記憶装置に格納され、該ジョブに関して該ジョブのジ
ョブステップの状態と終了状態を示す。図2にジョブ状
態テーブルの構成例を示す。ジョブの特定を行う為の
「ジョブ名」、ジョブ内の実行中のジョブステップを番号
にて示す「状態」、該ジョブステップの終了状態を示す
「終了状態」、該ジョブの実行中に異常終了をした場合に
異常終了の内容を示す「障害内容」、該ジョブの開始日時
を示す「開始日時」、該ジョブの終了日時を示す「終了日
時」、該ジョブが異常終了、もしくは未終了の場合に再
実行の指示を行う「再実行フラグ」とから構成されてい
る。
【0020】ファイル受信部60は、他サーバーからサ
ーバーAへのファイル転送処理に対してサーバーAのファ
イル受信の管理を行う。サーバーAへのファイル受信状
況はファイル受信状態テーブル70に書き込まれる。
【0021】ファイル受信状態テーブル70は、サーバ
A内の記憶装置に格納され、サーバAに送信されたファイ
ルについての受信状況を示す。図3にファイル受信状態
テーブルについての構成例を示す。サーバーAが受信す
る「ファイルID」、該ファイルの特性を示す「ファイル
名」、サーバーAに上記の該ファイルの受信状態を示す
「受信状態」、該ファイルの受信開始日時を示す「開始日
時」、該ファイルの受信終了日時を示す「終了日時」、フ
ァイルの異常受信の場合に再実行の指示を行う「再実行
フラグ」とから構成されている。
【0022】ファイル送信部80は、サーバーAから他
サーバーへのファイル転送処理に対してサーバーAから
のファイル送信の管理を行う。サーバーAからのファイ
ル送信状況はファイル送信状態テーブル90に書き込ま
れる。
【0023】ファイル送信状態テーブル90は、サーバ
A内の記憶装置に格納され、サーバAから送信されるファ
イルについての送信状況を示す。図4にファイル送信状
態テーブルについての構成例を示す。サーバーAから送
信する「ファイルID」、該ファイルの特性を示す「ファイ
ル名」、サーバーAに該ファイルの送信状態を示す「送信
状態」、該ファイルの送信開始日時を示す「開始日時」、
該ファイルの送信終了日時を示す「終了日時」、ファイル
の異常送信の場合に再実行の指示を行う「再実行フラグ」
とから構成されている。
【0024】ジョブ監視部100はジョブ状態テーブル
50、ファイル受信状態テーブル70、ファイル送信状
態テーブル90の各々のテーブルの状態を監視する。各
テーブルにて異常終了、未終了であり、再実行フラグに
て再実行を指示した場合は障害ジョブ管理テーブルのジ
ョブ名、状態、終了状態、障害内容、障害ファイル受信
テーブルのファイルID、ファイル名、受信状態、障害内
容、障害ファイル送信管理テーブルのファイルID、ファ
イル名、送信状態、障害内容から再実行依頼部140に
再実行依頼の指示を行う。
【0025】図9を参照すると、ジョブ監視部処理は、
ファイル受信処理においての異常終了もしくは未終了の
ものを監視し(ステップS901)、ステップS901が正ならば
再実行フラグを監視する(ステップS902)。再実行フラグ
にて再実行指示を行ったものに関しては、ファイル受信
状態テーブル70(図1)の当該レコードのファイルID、
ファイル名、受信状態、障害内容に一致するレコードを
障害ファイル受信管理テーブル120(図1)を参照し、
一致するレコードから再実行前回復処理番号を取得し、
再実行前回復処理部140(図1)に処理を依頼する。合
わせて、当該レコードのリラン番号を取得し、再実行依
頼部へ処理を依頼する。
【0026】同様に、ジョブ監視部処理は、ジョブ実行
部40(図1)においての異常終了もしくは未終了のもの
を監視し(ステップS903)、ステップS903が正ならば再実
行フラグを監視する(ステップS904)。再実行フラグにて
再実行指示を行ったものに関しては、ジョブ状態テーブ
ル50(図1)の当該レコードのジョブ名、状態、完了状
態、障害内容に一致するレコードを障害ジョブ管理テー
ブル110(図1)を参照し、一致するレコードからリラ
ン番号を取得し、再実行依頼部へ処理を依頼する。
【0027】同様に、ジョブ監視部処理は、ファイル送
信処理においての異常終了もしくは未終了のものを監視
し(ステップS905)、ステップS905が正ならば再実行フラ
グを監視する(ステップS906)。再実行フラグにて再実行
指示を行ったものに関しては、ファイル送信状態テーブ
ル90(図1)の当該レコードのファイルID、ファイル
名、受信状態、障害内容に一致するレコードを障害ファ
イル送信管理テーブル130(図1)を参照し、一致する
レコードからリラン番号を取得し、再実行依頼部へ処理
を依頼する。
【0028】障害ジョブ管理テーブル110は、サーバ
ーA内の記憶装置に格納され、サーバーA内で行われる全
てのジョブに対応した再実行処理方法を示す。図5に障
害ジョブ管理テーブル110の構成例を示す。サーバー
A内で行われるジョブを示す「ジョブ名」、当該ジョブ内
の各ジョブステップを番号にて示す「状態」、当該ジョブ
内のジョブステップの正常、異常終了を示す「終了状
態」、当該ジョブステップの障害内容を示す「障害内
容」、当該ジョブを再実行する為に必要な「リラン番号」
とから構成されている。
【0029】障害受信ファイル管理テーブル120は、
サーバーA内の記憶装置に格納され、他サーバーからサ
ーバーAに送られる全てのファイルに対応した再実行前
回復処理、再実行処理方法を示す。図6に障害受信ファ
イル管理テーブル120の構成例を示す。サーバーAに
送られてきたファイルを示す「ファイルID」、当該ファイ
ルの特性を持つ「ファイル名」、当該ファイルがサーバー
Aに送られた際の状況を示す「受信状態」、ファイルの受
信が異常であった場合に異常内容を示す「障害内容」、当
該ジョブを再実行の依頼をする為に必要な「リラン番号」
とから構成されている。
【0030】障害送信ファイル管理テーブル130は、
サーバーA内の記憶装置に格納され、サーバーAから他サ
ーバーへ送信する全てのファイルに対応した再実行前回
復処理、再実行処理方法を示す。図7に障害送信ファイ
ル管理テーブル130の構成例を示す。サーバーAから
送られるファイルを示す「ファイルID」、当該ファイルの
特性を持つ「ファイル名」、当該ファイルを他サーバーへ
送信した処理状況を示す「送信状態」、ファイルの送信が
異常であった場合に異常内容を示す「障害内容」、当該フ
ァイルを再送信の依頼をする為に必要な「リラン番号」と
から構成されている。
【0031】再実行依頼部140は、各々のサーバー内
のジョブ監視部90から受け取ったリラン番号に基づい
て再実行情報テーブル170から該当するレコードを取
り出し、当該サーバ内の再実行箇所からの実行依頼を行
う。
【0032】図10を参照すると、再実行依頼部は、ジ
ョブ監視部より通知されたログの情報からファイル受信
処理にてファイル受信中に障害が発生した際、ジョブ監
視部100より受信中ファイルの名称を取得する(ステ
ップS1001)。受信中のファイルを削除し再受信を
行う処理を行う為、受信中ファイルの存在を確認する
(ステップS1002)。受信中ファイルが存在する場合
は受信中ファイルを削除(ステップS1003)し、ジョ
ブの再実行に必要な環境情報等のリラン情報をジョブ実
行制御部10へ通知する(ステップS1004)。ジョブ
情報を通知後ジョブ実行制御部10へ通知後ジョブ実行
制御部へジョブ実行依頼を行う(ステップS1005)。
【0033】同様に、再実行依頼部は、ジョブ監視部よ
り通知されたログの情報からジョブ実行中に障害が発生
した際、ジョブ監視部100よりジョブ実行中に使用す
る中間ファイルの名称を取得する(ステップS100
1)。不要な中間ファイルを削除し再実行を行う為、不
要な中間ファイルの存在を確認する(ステップS100
2)。不要な中間ファイルが存在する場合は中間ファイ
ルを削除(ステップS1003)し、ジョブの再実行に必
要な環境情報等のリラン情報をジョブ実行制御部10へ
通知する(ステップS1004)。ジョブ情報を通知後ジ
ョブ実行制御部10へ通知後ジョブ実行制御部へジョブ
実行依頼を行う(ステップS1005)。
【0034】同様に、再実行依頼部は、ジョブ監視部よ
り通知されたログの情報からファイル受信処理にてファ
イル受信中に障害が発生した際、再送信に必要な環境情
報等のリラン情報をジョブ実行制御部10へ通知する
(ステップS1004)。ジョブ情報を通知後ジョブ実行
制御部10へ通知後ジョブ実行制御部へジョブ実行依頼
を行う(ステップS1005)。
【0035】再実行情報テーブル150は、サーバーB
内の記憶装置に格納され、再実行に必要な処理がリラン
番号単位に全てのサーバーに関しての処理を示す。図9
に再実行情報テーブル170の構成例を示す。全ての再
実行処理を番号にて管理する「リラン番号」、再実行処理
を行うサーバーを指定した「ホスト名」、再実行処理を行
う処理フローを示した「処理フロー」、再実行ジョブを示
す「ジョブ名」、環境変数の設定等再実行に必要な情報を
格納した「リラン情報」とから構成されている。
【0036】
【発明の効果】以上の説明により、分散システムにおけ
るジョブ再実行装置は、ファイルの受信状態と、該ジョ
ブ内のジョブステップ単位の状態と、ファイルの送信状
態を監視し、いずれかで異常終了、未終了である場合
は、再実行フラグにて再実行指示を行うことにより、サ
ーバーを意識せずに適切な箇所からの再実行を行うこと
が可能となる。よって、ジョブの異常終了時に関しては
各々のログを参照、解析時間を省略され障害箇所特定時
間を省略することが可能となる。
【0037】また、システム障害に関してはファイル受
信処理とファイル送信処理とジョブ内のジョブステップ
単位における処理が未終了の場合に関しても、異常終了
時と同様に再実行処理をサーバーを意識すること無く再
実行処理が可能となる。
【0038】更に、障害ジョブ監視テーブル110、再
実行情報テーブル170により再実行装置が確立してい
るため、再実行装置の増加への追加が容易である。
【図面の簡単な説明】
【図1】本発明である分散システムにおける再実行装置
の構成図。
【図2】ジョブ状態テーブルの構成を示す図。
【図3】ファイル受信状態テーブルの構成を示す図。
【図4】ファイルの送信状態テーブルの構成を示す図。
【図5】障害ジョブ管理テーブルの構成を示す図。
【図6】障害ファイル受信管理テーブルの構成を示す
図。
【図7】障害ファイル送信管理テーブルの構成を示す
図。
【図8】再実行情報テーブルの構成を示す図。
【図9】本実施例におけるジョブ監視部のフローチャー
ト。
【図10】本実施例における再実行依頼部のフローチャ
ート。
【符号の説明】
A…業務処理用サーバー(複数)、B…再実行処理用サーバ
ー、10…ジョブ実行制御部、20…スケジュールテー
ブル、30…カレンダテーブル、40…ジョブ実行部、
50…ジョブ状態テーブル、60…ファイル受信部、7
0…ファイル受信状態テーブル、80…ファイル送信
部、90…ファイル送信状態テーブル、100…ジョブ
監視部、110…障害ジョブ管理テーブル、120…障
害ファイル受信管理テーブル、130…障害ファイル送
信管理テーブル、140…再実行依頼部、150…再実
行情報テーブル。

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 機能を分散した複数サーバーで構成さ
    れ、サーバー間がネットワークにて接続される分散コン
    ピュータシステムにおいて、複数サーバーを跨ぐ処理で
    の障害時にその障害箇所を特定する障害箇所特定手段
    と、障害箇所から再実行箇所を特定する再実行箇所特定
    手段と、各々の処理にて再実行に必要な情報を収集する
    情報収集手段と、該処理に関して再実行の指示を監視す
    ることによる再実行手段を備える分散システムにおける
    ジョブ再実行装置。
  2. 【請求項2】 障害箇所特定手段は該サーバーをネット
    ワークにて接続された分散システムにおいて、該サーバ
    ーのジョブの状態をテーブルにて一元管理するだけでは
    なく、他サーバーとのファイルの送受信を管理するファ
    イル受信状態テーブル、ファイル送信状態テーブルを設
    けることによりサーバー間でのファイルの送受信に関し
    ての障害特定手段を備えることを特徴とする請求項1に
    記載の分散システムにおけるジョブ再実行装置。
  3. 【請求項3】 再実行箇所特定手段は該障害ジョブの実
    行状態と、該ジョブの完了状態と、該ジョブの障害内容
    と、再実行に必要な情報を持つ再実行情報テーブルと対
    応が可能な再実行番号を備えることを特徴とする請求項
    1に記載の分散システムにおけるジョブ再実行装置。
  4. 【請求項4】 情報収集手段は全サーバーのジョブの再
    実行箇所と再実行に必要な情報を一元管理し、該サーバ
    ーでは請求項3に記載の再実行番号を備えることにより
    再実行箇所及び再実行に必要な情報を取得することを特
    徴とする請求項1に記載の分散システムにおけるジョブ
    再実行装置。
  5. 【請求項5】 再実行手段はジョブ状態を管理する状態
    表示テーブルに再実行フラグを設け、再実行を行う際は
    再実行フラグにて再実行を許可することにより再実行処
    理を行うことを特徴とした分散システムにおけるジョブ
    の再実行装置。
JP36035199A 1999-12-20 1999-12-20 分散システムにおけるジョブ再実行装置 Pending JP2001175492A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP36035199A JP2001175492A (ja) 1999-12-20 1999-12-20 分散システムにおけるジョブ再実行装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP36035199A JP2001175492A (ja) 1999-12-20 1999-12-20 分散システムにおけるジョブ再実行装置

Publications (1)

Publication Number Publication Date
JP2001175492A true JP2001175492A (ja) 2001-06-29

Family

ID=18469034

Family Applications (1)

Application Number Title Priority Date Filing Date
JP36035199A Pending JP2001175492A (ja) 1999-12-20 1999-12-20 分散システムにおけるジョブ再実行装置

Country Status (1)

Country Link
JP (1) JP2001175492A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007533031A (ja) * 2004-04-15 2007-11-15 レイセオン カンパニー Hpcノード障害の検出及び管理を行うシステム及び方法
US7590670B2 (en) 2004-03-16 2009-09-15 Hitachi, Ltd. Management system of difference data among servers and control method of information processing apparatus

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7590670B2 (en) 2004-03-16 2009-09-15 Hitachi, Ltd. Management system of difference data among servers and control method of information processing apparatus
JP2007533031A (ja) * 2004-04-15 2007-11-15 レイセオン カンパニー Hpcノード障害の検出及び管理を行うシステム及び方法

Similar Documents

Publication Publication Date Title
CN111274052A (zh) 数据分发方法、服务器及计算机可读存储介质
US20070198554A1 (en) Apparatus for business service oriented management infrastructure
CN108446172B (zh) 数据调取方法、装置、计算机设备和存储介质
US20140325517A1 (en) Server system, method for controlling the same, and program for executing parallel distributed processing
CN110895488B (zh) 任务调度方法及装置
CN111930489B (zh) 一种任务调度方法、装置、设备及存储介质
US20020049801A1 (en) Remote tracing of data processing nodes in an asynchronous messaging network
US8301750B2 (en) Apparatus, system, and method for facilitating communication between an enterprise information system and a client
CN116319732A (zh) 一种基于RabbitMQ的消息队列集中配置管理系统及方法
JP2007058506A (ja) 文書管理サーバ、文書管理システム、及び、文書管理プログラムとその記録媒体
US20080178182A1 (en) Work state returning apparatus, work state returning method, and computer product
CN113419872A (zh) 一种应用系统接口集成系统、集成方法、设备及存储介质
JP4928480B2 (ja) ジョブ処理システムおよびジョブ管理方法
CN116719623A (zh) 作业调度方法、作业结果处理方法及其装置
JP2001175492A (ja) 分散システムにおけるジョブ再実行装置
JP3973713B2 (ja) 分散処理システムにおける稼働情報自動取得通知方法
CN113965447B (zh) 一种在线云诊断方法、装置、系统、设备及存储介质
CN111538604B (zh) 分布式任务处理系统
CN113127158B (zh) 用于执行数据处理任务的方法及装置
CN114020368A (zh) 基于状态机的信息处理方法、装置和存储介质
CN113434473A (zh) 一种分布式日志的处理方法、装置、介质及电子设备
CN110188008B (zh) 作业调度主备切换方法、装置、计算机设备及存储介质
CN112231152A (zh) 数据同步方法、远程服务器、客户端以及系统
CN115309536B (zh) 高并发的彩票交易场景下数据一致性方法
CN110750369B (zh) 一种分布式节点管理方法及系统