JP5359234B2 - Job execution system and job flow takeover control program - Google Patents

Job execution system and job flow takeover control program Download PDF

Info

Publication number
JP5359234B2
JP5359234B2 JP2008313665A JP2008313665A JP5359234B2 JP 5359234 B2 JP5359234 B2 JP 5359234B2 JP 2008313665 A JP2008313665 A JP 2008313665A JP 2008313665 A JP2008313665 A JP 2008313665A JP 5359234 B2 JP5359234 B2 JP 5359234B2
Authority
JP
Japan
Prior art keywords
job
execution
server
unit
job execution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008313665A
Other languages
Japanese (ja)
Other versions
JP2010140106A (en
Inventor
功介 秀島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2008313665A priority Critical patent/JP5359234B2/en
Publication of JP2010140106A publication Critical patent/JP2010140106A/en
Application granted granted Critical
Publication of JP5359234B2 publication Critical patent/JP5359234B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Hardware Redundancy (AREA)

Description

この発明は、ジョブ実行システム、及びジョブフロー引継ぎ制御プログラムに係り、たとえば自然災害が発生した場合などのような緊急時、稼働系サーバによるジョブフローの制御を待機系サーバに引き継ぐ場合に用いて好適なジョブ実行システム、及びジョブフロー引継ぎ制御プログラムに関する。 The present invention relates to a job execution system and a job flow takeover control program, and is suitable for use when taking over job flow control by an active server to a standby server in an emergency such as when a natural disaster occurs. The present invention relates to a job execution system and a job flow takeover control program.

コンピュータの仕事の単位であるジョブが投入されて順次実行するジョブ実行サーバを有するジョブ実行システムでは、通常状態のとき、同ジョブ実行サーバに対して該当するジョブを投入して実行させる稼働系サーバと、同稼働系サーバに対して通常状態で予備となる待機系サーバとが設けられ、たとえば大規模災害などが発生した場合のシステムダウンに対応するために、2重化された構成となっているものがある。   In a job execution system having a job execution server that sequentially executes a job that is a unit of work of a computer, an active server that submits the job to the job execution server and executes it in a normal state; In addition, a standby server that is reserved in the normal state is provided for the same active server, and is configured to be duplicated in order to cope with a system down when a large-scale disaster occurs, for example. There is something.

この種のジョブ実行システムは、たとえば図7に示すように、稼動系サーバ10と、待機系サーバ20と、スケジュール情報記憶部31と、ジョブフロー情報記憶部32と、系切替え部41,42と、ジョブ実行サーバ50,60とから構成されている。稼動系サーバ10は、スケジュール判断部11と、ジョブフロー制御部12とを有している。待機系サーバ20は、スケジュール判断部21と、ジョブフロー制御部22とを有している。ジョブ実行サーバ50は、ジョブ実行部51と、ジョブ実行状況情報記録部52とを有している。ジョブ実行サーバ60は、ジョブ実行部61と、ジョブ実行状況情報記録部62とを有している。   As shown in FIG. 7, for example, this type of job execution system includes an active server 10, a standby server 20, a schedule information storage unit 31, a job flow information storage unit 32, and system switching units 41 and 42. , And job execution servers 50 and 60. The active server 10 includes a schedule determination unit 11 and a job flow control unit 12. The standby server 20 includes a schedule determination unit 21 and a job flow control unit 22. The job execution server 50 includes a job execution unit 51 and a job execution status information recording unit 52. The job execution server 60 includes a job execution unit 61 and a job execution status information recording unit 62.

このジョブ実行システムでは、スケジュール情報記憶部31に、各ジョブ実行サーバ50,60がジョブを実行するための日時情報がスケジュール情報としてあらかじめ記憶され、また、ジョブフロー情報記憶部32に、ジョブの実行順序及び実行サーバがジョブフロー情報としてあらかじめ記憶されている。稼働系サーバ10では、スケジュール判断部11により、スケジュール情報記憶部31に記憶されているスケジュール情報に基づいて、起動するためのジョブフローがあるか否かが判断され、起動するためのジョブフローがある場合(すなわち、ジョブを実行する日時になったとき)は、ジョブフローの投入要求を行う。ジョブフロー制御部12では、スケジュール判断部11からジョブフローの投入要求が行われたとき、ジョブフロー情報記憶部32に記憶されているジョブフロー情報に基づいて、ジョブの実行順序及び実行サーバを特定し、該当するジョブを系切替え部41,42を経て各ジョブ実行サーバ50,60へ投入すると共に、各ジョブ実行サーバ50,60からのジョブの終了通知を待ち合わせ、上記ジョブがジョブフロー中の最後のジョブであるか否かを判断し、後続のジョブが存在するとき、次に実行するジョブを決定して投入する。   In this job execution system, date and time information for each job execution server 50 and 60 to execute a job is stored in advance as schedule information in the schedule information storage unit 31, and the job execution information is stored in the job flow information storage unit 32. The order and execution server are stored in advance as job flow information. In the active server 10, the schedule determination unit 11 determines whether there is a job flow to be activated based on the schedule information stored in the schedule information storage unit 31, and the job flow for activation is determined. In some cases (that is, when it is time to execute a job), a job flow submission request is made. The job flow control unit 12 specifies the job execution order and execution server based on the job flow information stored in the job flow information storage unit 32 when a job flow input request is made from the schedule determination unit 11. Then, the corresponding job is input to the job execution servers 50 and 60 via the system switching units 41 and 42, and the job end notification from each job execution server 50 and 60 is waited for. If there is a subsequent job, the job to be executed next is determined and submitted.

各ジョブ実行サーバ50,60では、ジョブ実行部51,61により、ジョブフロー制御部12から投入されたジョブの実行が開始されると共に、同ジョブの終了時に同ジョブの終了がジョブフロー制御部12に通知される。また、ジョブ実行状況情報記録部52,62では、ジョブ実行部51,61で実行されたジョブのジョブ実行状況情報(開始、実行中、終了)が記録される。系切替え部41は、系切替え信号scにより制御され、通常状態のとき、各ジョブ実行サーバ50と稼働系サーバ10のジョブフロー制御部12とを接続する一方、系切替え状態となったとき、同各ジョブ実行サーバ50,60と待機系サーバ20のジョブフロー制御部22とを接続する。また、系切替え部42では、通常状態のとき、各ジョブ実行サーバ60と稼働系サーバ10のジョブフロー制御部12とを接続する一方、系切替え状態となったとき、各ジョブ実行サーバ60と待機系サーバ20のジョブフロー制御部22とを接続する。稼働系サーバ10でシステムダウンとなり、系切替え状態となったとき、待機系サーバ20では、スケジュール判断部21により、稼働系サーバ10のスケジュール判断部11と同様の動作が行われ、また、ジョブフロー制御部22により、稼働系サーバ10のジョブフロー制御部12と同様の動作が行われる。   In each of the job execution servers 50 and 60, the job execution units 51 and 61 start the execution of the job input from the job flow control unit 12, and at the end of the same job, the end of the job is terminated by the job flow control unit 12. Will be notified. The job execution status information recording units 52 and 62 record job execution status information (start, executing, and end) of jobs executed by the job execution units 51 and 61. The system switching unit 41 is controlled by a system switching signal sc and connects each job execution server 50 and the job flow control unit 12 of the active server 10 in the normal state. The job execution servers 50 and 60 are connected to the job flow control unit 22 of the standby server 20. The system switching unit 42 connects each job execution server 60 and the job flow control unit 12 of the active server 10 in the normal state, and waits for each job execution server 60 in the system switching state. The job flow control unit 22 of the system server 20 is connected. When the system is down at the active server 10 and the system is switched to the standby server 20, the schedule determination unit 21 performs the same operation as the schedule determination unit 11 of the active server 10 and the job flow. The control unit 22 performs the same operation as the job flow control unit 12 of the active server 10.

上記のジョブ実行システムの他、この種の関連する技術としては、たとえば、特許文献1に記載されたジョブシステムにおける遅延要因解析方法がある。
この解析方法では、管理マネージャ計算機により、各ジョブ実行計算機からジョブの実行履歴が収集され、後に実行されるジョブから前に実行されるジョブに向けて、順次、ジョブの遅延が検出されなくなるまで、各ジョブの履歴が参照され、各ジョブに遅延が生じた要因が判断される。
In addition to the job execution system described above, this type of related technique includes, for example, a delay factor analysis method in a job system described in Patent Document 1.
In this analysis method, the execution history of jobs is collected from each job execution computer by the management manager computer, and until the job delay is not detected sequentially from the job executed later to the job executed earlier, The history of each job is referred to, and the cause of the delay in each job is determined.

また、特許文献2に記載された障害ホストジョブの継続制御方式では、スケジュール実行手段により、スケジュール定義にしたがってジョブが実行されると共に、ジョブ再起動指示を受けて指定されたジョブ以降が、ジョブスケジュールにしたがって実行される。ジョブ動作履歴書き込み手段により、ジョブ起動/停止認識手段を介して得たスケジュール実行手段によるジョブの起動及び停止に関する情報が、共有ファイルであるジョブ動作履歴記録ファイルに記録される。ジョブ動作履歴読み出し手段により、ジョブ動作履歴記録ファイルより他ホスト障害認識手段を介して得られるシステム中断ホストのジョブの起動及び停止動作に関する情報が読み出される。ジョブ動作状態判定手段により、システム中断ホストのジョブの起動及び停止動作に関する情報からシステム中断発生時のジョブの再起動指示が出力される。   In the failure host job continuation control method described in Patent Document 2, the job is executed according to the schedule definition by the schedule execution means, and the job specified after receiving the job restart instruction is the job schedule. It is executed according to The job operation history writing unit records information related to job start and stop by the schedule execution unit obtained through the job start / stop recognition unit in a job operation history recording file that is a shared file. The job operation history reading unit reads information about the job start and stop operations of the system interrupted host obtained from the job operation history recording file via the other host failure recognition unit. The job operation state determination means outputs a job restart instruction when the system is interrupted from information related to the start and stop operations of the system interrupt host.

また、特許文献3に記載されたコンピュータアプリケーションにおけるデータ損失を最小限にするシステムでは、システムに障害が起こったとき、それに応答して、プログラムの保存及び/又は終了を表す既知のコード経路上にプログラムの実行がリダイレクトされ、プログラムが一時中止され、障害が修復された後にリストアされ、アプリケーションの障害の後のリストアに備えてアプリケーションのステートのスナップショットをとることにより、障害が許容される。
特開2000−231502号公報(要約書、図1) 特開平06−124214号公報(要約書、図1) 特表2008−507767号公報(要約書、図1)
Further, in the system for minimizing data loss in the computer application described in Patent Document 3, when a failure occurs in the system, in response to the failure, the program is stored on a known code path indicating the storage and / or termination of the program. The program execution is redirected, the program is suspended, the fault is repaired and restored, and the fault is tolerated by taking a snapshot of the application state in preparation for a restore after the application fault.
Japanese Unexamined Patent Publication No. 2000-231502 (Abstract, FIG. 1) Japanese Patent Laid-Open No. 06-124214 (Abstract, FIG. 1) JP 2008-507767 (abstract, Fig. 1)

しかしながら、上記文献に記載の技術を含む上記技術では、次のような問題点があった。
すなわち、図7のジョブ実行システムでは、稼動系サーバ10及び待機系サーバ20は、互いに遠隔地に配置されることがあるが、スケジュール情報記憶部31及びジョブフロー情報記憶部32が共有され、ネットワークを介して接続されているので、系切替え状態となったとき、稼動系サーバ10から待機系サーバ20へジョブ実行状況情報を引継ぐことは、ネットワークにかかる負荷が大きくなるため、困難になる。また、実行状況情報の引継ぎができない場合、オペレータがジョブフロー中の個々のジョブ実行状況を確認し、ジョブフロー中の実行再開ポイントを決定する必要があり、操作に手間がかかるという問題点がある。
However, the above techniques including the technique described in the above document have the following problems.
That is, in the job execution system of FIG. 7, the active server 10 and the standby server 20 may be remotely located from each other, but the schedule information storage unit 31 and the job flow information storage unit 32 are shared, and the network Therefore, it is difficult to take over job execution status information from the active server 10 to the standby server 20 in a system switching state because the load on the network increases. In addition, if execution status information cannot be taken over, it is necessary for the operator to check the individual job execution status in the job flow and determine the execution restart point in the job flow, which is troublesome. .

また、特許文献1に記載された遅延要因解析方法では、ジョブシステムにより遅延が検出されるが、ジョブフローの実行を引き継ぐものではないため、上記問題点は改善されず、また、情報収集する契機も、稼働系、待機系の切り替え時のみであり、動作が異なっている。   In addition, in the delay factor analysis method described in Patent Document 1, a delay is detected by the job system. However, since the execution of the job flow is not taken over, the above problem is not improved, and an opportunity to collect information is obtained. However, the operation is different only when switching between the active system and the standby system.

特許文献2に記載された継続制御方式では、共有ファイルが用いられているので、ファイルを共有できないような遠隔地での系切り替えには対応できないため、上記問題点は改善されない。   In the continuation control method described in Patent Document 2, since a shared file is used, it is not possible to cope with system switching at a remote place where the file cannot be shared, and thus the above problem is not improved.

特許文献3に記載されたデータ損失を最小限にするシステムは、データ損失を最小限にする機能を有するものであり、ジョブの切り替えを行うものではない。また、アプリケーションを再開させるか否かが判定されるが、ジョブフローの再開を判定するものではなく、上記問題点は改善されない。   The system for minimizing data loss described in Patent Document 3 has a function of minimizing data loss and does not switch jobs. Whether or not to restart the application is determined, but it does not determine whether or not the job flow is restarted, and the above problem is not improved.

この発明は、上述の事情に鑑みてなされたもので、稼働系サーバによるジョブフローの制御を待機系サーバに円滑に引き継ぐジョブ実行システム、及びジョブフロー引継ぎ制御プログラムを提供することを目的としている。 The present invention has been made in view of the above-described circumstances, and an object thereof is to provide a job execution system and a job flow takeover control program for smoothly taking over control of job flow by an active server to a standby server.

上記課題を解決するために、この発明の第1の構成は、投入されたジョブを実行する1つ又は複数のジョブ実行サーバと、通常状態のとき、前記各ジョブ実行サーバに対して該当するジョブを投入して実行させる稼働系サーバと、該稼働系サーバに対して前記通常状態で予備となる待機系サーバと、前記通常状態のとき、前記各ジョブ実行サーバと前記稼働系サーバとを接続する一方、系切替え状態となったとき、前記各ジョブ実行サーバと前記待機系サーバとを接続する系切替え部とを有するジョブ実行システムに係り前記稼働系サーバが、前記各ジョブ実行サーバがジョブを実行するための日時がスケジュール情報としてあらかじめ記憶されている第1のスケジュール情報記憶部と、該第1のスケジュール情報記憶部に記憶されている前記スケジュール情報に基づいて、起動するためのジョブフローがあるか否かを判断し、起動するためのジョブフローがある場合は、ジョブフローの投入要求を行う第1のスケジュール判断部と、ジョブの実行順序及び実行サーバがジョブフロー情報としてあらかじめ記憶されている第1のジョブフロー情報記憶部と、前記第1のスケジュール判断部から前記ジョブフローの投入要求が行われたとき、前記第1のジョブフロー情報記憶部に記憶されている前記ジョブフロー情報に基づいて、前記ジョブの実行順序及び実行サーバを特定し、該当するジョブを前記各ジョブ実行サーバへ投入すると共に、前記各ジョブ実行サーバからのジョブの終了通知を待ち合わせ、前記ジョブがジョブフロー中の最後のジョブであるか否かを判断し、後続のジョブが存在するとき、次に実行するためのジョブを決定して投入する第1のジョブフロー制御部とを備え、前記各ジョブ実行サーバが、前記第1のジョブフロー制御部から投入されたジョブの実行を開始すると共に、該ジョブの終了時に該ジョブの終了を前記第1のジョブフロー制御部に通知するジョブ実行部と、該ジョブ実行部に投入されたジョブのジョブ実行状況情報を記録するジョブ実行状況情報記録部とを備え、前記待機系サーバが、前記稼働系サーバの前記第1のスケジュール情報記憶部と同一のスケジュール情報があらかじめ記憶されている第2のスケジュール情報記憶部と、該第2のスケジュール情報記憶部に記憶されている前記スケジュール情報に基づいて、起動するためのジョブフローがあるか否かを判断し、起動するためのジョブフローがある場合は、ジョブフローの投入要求を行う第2のスケジュール判断部と、前記稼働系サーバの前記第1のジョブフロー情報記憶部と同一のジョブフロー情報があらかじめ記憶されている第2のジョブフロー情報記憶部と、前記系切替え状態となったとき、前記各ジョブ実行サーバの前記ジョブ実行状況情報記録部から前記ジョブ実行状況情報を収集してジョブフロー中の実行中のジョブを決定するジョブフロー引継ぎ部と、該ジョブフロー引継ぎ部で決定された前記実行中のジョブの通知を受け、該ジョブを該当する前記各ジョブ実行サーバへ投入して前記ジョブの実行の継続を指示する第2のジョブフロー制御部とを備えてなることを特徴としている。 In order to solve the above problems, a first configuration of the present invention includes one or a plurality of job execution servers for executing a submitted job, and jobs corresponding to the job execution servers in a normal state. Is connected to the active server, the standby server that is reserved for the active server in the normal state, and the job execution server and the active server are connected in the normal state. Meanwhile, when it becomes the system switching state, relates to the job execution system for chromatic and system switching section for connecting the respective job execution server and the standby server, the operating system server, wherein each job execution server job Is stored in the first schedule information storage unit in which the date and time for executing is stored in advance as schedule information, and in the first schedule information storage unit Based on the schedule information, it is determined whether or not there is a job flow to be activated. If there is a job flow to be activated, a first schedule determination unit that makes a job flow submission request, When the job flow input request is made from the first job flow information storage unit in which the execution order and the execution server are stored in advance as job flow information, and the first schedule determination unit, the first job Based on the job flow information stored in the flow information storage unit, the execution order of the jobs and the execution server are specified, and the corresponding job is submitted to each job execution server. Wait for the job end notification, determine whether the job is the last job in the job flow, A first job flow control unit that determines and submits a job to be executed next when the job exists, and each of the job execution servers is submitted from the first job flow control unit A job execution unit that starts job execution and notifies the first job flow control unit of the end of the job at the end of the job, and records job execution status information of the job input to the job execution unit A second schedule information storage unit in which the same schedule information as that of the first schedule information storage unit of the active server is stored in advance. Based on the schedule information stored in the second schedule information storage unit, it is determined whether there is a job flow to be activated and If there is a job flow for a job flow, the same job flow information as that of the second schedule determination unit that makes a job flow submission request and the first job flow information storage unit of the active server is stored in advance. A job being executed in the job flow by collecting the job execution status information from the second job flow information storage unit and the job execution status information recording unit of each job execution server when the system switching state is entered. A job flow takeover unit that determines the job flow, and a notification of the job being executed determined by the job flow takeover unit, and submits the job to the corresponding job execution server to instruct the continuation of the job execution And a second job flow control unit .

この発明の構成によれば、各ジョブ実行サーバに対するジョブの投入を、稼動系サーバから待機系サーバに円滑に引き継ぐことができる。   According to the configuration of the present invention, it is possible to smoothly transfer the job input to each job execution server from the active server to the standby server.

各ジョブ実行サーバは、少なくともジョブの開始、実行中又は終了を示すジョブ実行状況情報を記録する構成とされ、待機系サーバは、各ジョブ実行サーバが上記ジョブの実行中に、上記系切替え状態となったとき、上記各ジョブ実行サーバから上記ジョブ実行状況情報を収集し、同ジョブ実行状況情報に基づいてジョブフローの再開箇所を決定すると共に、上記各ジョブ実行サーバに対して同再開箇所から上記ジョブの実行の継続を指示するジョブ実行引継ぎ指示手段が設けられているジョブ実行システムを提供する。この発明の構成によれば、各ジョブ実行サーバでジョブ実行状況情報が記録され、同各ジョブ実行サーバがジョブの実行中に、系切替え状態となったとき、待機系サーバにより、同各ジョブ実行サーバからジョブ実行状況情報が収集され、同ジョブ実行状況情報に基づいてジョブフローの再開箇所が決定されると共に、同各ジョブ実行サーバに対して再開箇所からジョブの実行の継続が指示されるので、共有ディスク装置などを用いることなく、各ジョブ実行サーバに対するジョブの投入を、稼動系サーバから待機系サーバに円滑に引き継ぐことができる。   Each job execution server is configured to record at least job execution status information indicating the start, execution, or end of the job, and the standby server is configured so that each job execution server is in the above system switching state while the job is being executed. The job execution status information is collected from each job execution server, the job flow restart location is determined based on the job execution status information, and the job execution server is restarted from the restart location. Provided is a job execution system provided with job execution takeover instruction means for instructing continuation of job execution. According to the configuration of the present invention, job execution status information is recorded in each job execution server, and when each job execution server is in a system switching state during execution of the job, each job execution is executed by the standby server. Job execution status information is collected from the server, the job flow restart location is determined based on the job execution status information, and each job execution server is instructed to continue job execution from the restart location. In addition, the job input to each job execution server can be smoothly transferred from the active server to the standby server without using a shared disk device or the like.

また、この発明の好適な形態では、上記稼働系サーバは、上記各ジョブ実行サーバがジョブを実行するための日時がスケジュール情報としてあらかじめ記憶されている第1のスケジュール情報記憶部と、該第1のスケジュール情報記憶部に記憶されている上記スケジュール情報に基づいて、起動するためのジョブフローがあるか否かを判断し、起動するためのジョブフローがある場合は、ジョブフローの投入要求を行う第1のスケジュール判断部と、ジョブの実行順序及び実行サーバがジョブフロー情報としてあらかじめ記憶されている第1のジョブフロー情報記憶部と、上記スケジュール判断部から上記ジョブフローの投入要求が行われたとき、上記ジョブフロー情報記憶部に記憶されている上記ジョブフロー情報に基づいて、上記ジョブの実行順序及び実行サーバを特定し、該当するジョブを上記各ジョブ実行サーバへ投入すると共に、上記各ジョブ実行サーバからのジョブの終了通知を待ち合わせ、上記ジョブがジョブフロー中の最後のジョブであるか否かを判断し、後続のジョブが存在するとき、次に実行するジョブを決定して投入する第1のジョブフロー制御部とを備え、上記各ジョブ実行サーバは、上記ジョブフロー制御部から投入されたジョブの実行を開始すると共に、該ジョブの終了時に該ジョブの終了を上記ジョブフロー制御部に通知するジョブ実行部と、上記ジョブ実行部で実行されたジョブの上記ジョブ実行状況情報を記録するジョブ実行状況情報記録部とを備え、上記待機系サーバは、上記稼働系サーバの上記第1のスケジュール情報記憶部と同一のスケジュール情報があらかじめ記憶されている第2のスケジュール情報記憶部と、該第2のスケジュール情報記憶部に記憶されている上記スケジュール情報に基づいて、起動するためのジョブフローがあるか否かを判断し、起動するためのジョブフローがある場合は、ジョブフローの投入要求を行う第2のスケジュール判断部と、上記稼働系サーバの上記第1のジョブフロー情報記憶部と同一のジョブフロー情報があらかじめ記憶されている第2のジョブフロー情報記憶部とを有し、上記ジョブ実行引継ぎ指示手段は、上記系切替え状態となったとき、上記各ジョブ実行サーバの上記ジョブ実行状況情報記録部から上記ジョブ実行状況情報を収集してジョブフロー中の実行中のジョブを決定するジョブフロー引継ぎ部と、該ジョブフロー引継ぎ部で決定された上記実行中のジョブの通知を受け、該ジョブを該当する上記各ジョブ実行サーバへ投入して上記ジョブの実行の継続を指示する第2のジョブフロー制御部とを備えている。   According to a preferred aspect of the present invention, the active server includes a first schedule information storage unit in which a date and time for each job execution server to execute a job is stored in advance as schedule information; Based on the schedule information stored in the schedule information storage unit, it is determined whether there is a job flow to be activated, and if there is a job flow to be activated, a job flow input request is made. The job flow input request is made from the first schedule determination unit, the first job flow information storage unit in which the job execution order and execution server are stored in advance as job flow information, and the schedule determination unit. The job flow based on the job flow information stored in the job flow information storage unit. Specify the execution order and execution server, submit the corresponding job to each job execution server, wait for the job end notification from each job execution server, and whether the job is the last job in the job flow A first job flow control unit that determines and submits a job to be executed next when a subsequent job exists, and each of the job execution servers submits from the job flow control unit A job execution unit that starts the execution of the job executed and notifies the job flow control unit of the end of the job when the job ends, and records the job execution status information of the job executed by the job execution unit The standby server is the same schedule as the first schedule information storage unit of the active server. Based on the second schedule information storage unit in which the schedule information is stored in advance and the schedule information stored in the second schedule information storage unit, it is determined whether there is a job flow to be activated. If there is a job flow to be started, the same job flow information as that of the second schedule determination unit that makes a job flow input request and the first job flow information storage unit of the active server is stored in advance. A second job flow information storage unit that stores the job execution takeover instructing means from the job execution status information recording unit of each job execution server when the system switching state is entered. The job flow takeover unit that collects execution status information and determines the job being executed in the job flow, and the job flow takeover unit A second job flow control unit that receives the determined notification of the job being executed, inputs the job to the corresponding job execution server, and instructs the continuation of the job execution;

また、この発明の好適な形態では、上記ジョブフロー引継ぎ部は、上記系切替え状態となったとき、上記各ジョブ実行サーバの上記ジョブ実行状況情報記録部から上記ジョブ実行状況情報を収集するジョブ実行状況情報収集部と、該ジョブ実行状況情報収集部で収集された上記ジョブ実行状況情報に基づいて、実行中のジョブの再開箇所を決定する実行再開箇所判断部とから構成され、上記第2のジョブフロー制御部は、上記実行再開箇所判断部で決定された上記実行中のジョブの再開箇所から上記各ジョブ実行サーバに上記ジョブの実行を継続させる構成とされている。   In a preferred embodiment of the present invention, the job flow takeover unit collects the job execution status information from the job execution status information recording unit of each job execution server when the system switching state is entered. A status information collection unit; and an execution resumption location determination unit that determines a resumption location of a job being executed based on the job execution status information collected by the job execution status information collection unit. The job flow control unit is configured to cause each job execution server to continue the execution of the job from the restart point of the job being executed determined by the execution restart point determination unit.

また、この発明の好適な形態では、上記ジョブ実行状況情報収集部は、上記系切替え状態となったとき、上記各ジョブ実行サーバの上記ジョブ実行状況情報記録部から上記ジョブ実行状況情報のうちの実行中のジョブの情報を優先して収集する構成とされている。   According to a preferred aspect of the present invention, when the job execution status information collecting unit is in the system switching state, the job execution status information recording unit of each job execution server includes the job execution status information of the job execution status information. It is configured to preferentially collect information on running jobs.

また、この発明の好適な形態では、上記実行再開箇所判断部で決定された上記実行中のジョブの再開箇所を上記ジョブ実行システムの管理者に提示して確認させるための実行再開箇所確認部が設けられている。   In a preferred embodiment of the present invention, an execution resumption location confirmation unit for presenting and confirming the resumption location of the job being executed determined by the execution resumption location determination unit to the administrator of the job execution system. Is provided.

実施形態1Embodiment 1

図1は、この発明の第1の実施形態であるジョブ実行システムの要部の電気的構成を示すブロック図である。
この形態のジョブ実行システムは、同図に示すように、稼動系サーバ70と、待機系サーバ80と、系切替え部91,92と、ジョブ実行サーバ100,110とから構成されている。ジョブ実行サーバ100,110は、投入されたジョブを実行する。稼動系サーバ70は、通常状態のとき、各ジョブ実行サーバ100,110に対して該当するジョブを投入して実行させる。待機系サーバ80は、稼働系サーバ70に対して通常状態で予備となる。系切替え部91,92は、系切替え信号scにより制御され、通常状態のとき、各ジョブ実行サーバ100,110と稼働系サーバ70とを接続する一方、系切替え状態となったとき、各ジョブ実行サーバ100,110と待機系サーバ80とを接続する。上記系切替え信号scは、たとえば、このジョブ実行システムの管理者により入力される。
FIG. 1 is a block diagram showing the electrical configuration of the main part of the job execution system according to the first embodiment of the present invention.
As shown in FIG. 1, the job execution system of this embodiment includes an active server 70, a standby server 80, system switching units 91 and 92, and job execution servers 100 and 110. The job execution servers 100 and 110 execute the submitted job. In the normal state, the active server 70 submits the corresponding job to the job execution servers 100 and 110 for execution. The standby server 80 becomes a spare in a normal state with respect to the active server 70. The system switching units 91 and 92 are controlled by a system switching signal sc and connect the job execution servers 100 and 110 to the active server 70 in the normal state, while executing the job when the system switching state is established. The servers 100 and 110 and the standby server 80 are connected. The system switching signal sc is input by an administrator of the job execution system, for example.

特に、この実施形態では、稼働系サーバ70は、スケジュール情報記憶部71と、ジョブフロー情報記憶部72と、スケジュール判断部73と、ジョブフロー制御部74とを備えている。スケジュール情報記憶部71は、たとえばRAM(Random Access Memory)などで構成され、ジョブ実行サーバ100,110がジョブを実行するための日時がスケジュール情報としてあらかじめ記憶されている。ジョブフロー情報記憶部72は、たとえばRAMなどで構成され、ジョブの実行順序及び実行サーバ100,110がジョブフロー情報としてあらかじめ記憶されている。   In particular, in this embodiment, the active server 70 includes a schedule information storage unit 71, a job flow information storage unit 72, a schedule determination unit 73, and a job flow control unit 74. The schedule information storage unit 71 is composed of, for example, a RAM (Random Access Memory) and the like, and the date and time for the job execution servers 100 and 110 to execute jobs is stored in advance as schedule information. The job flow information storage unit 72 is composed of, for example, a RAM and the like, and the job execution order and the execution servers 100 and 110 are stored in advance as job flow information.

スケジュール判断部73は、スケジュール情報記憶部71に記憶されているスケジュール情報に基づいて、起動するためのジョブフローがあるか否かを判断し、起動するためのジョブフローがある場合(すなわち、ジョブを実行する日時になったとき)は、ジョブフローの投入要求を行う。ジョブフロー制御部74は、スケジュール判断部73からジョブフローの投入要求が行われたとき、ジョブフロー情報記憶部72に記憶されているジョブフロー情報に基づいて、ジョブの実行順序及び実行サーバ100,110を特定する。そして、ジョブフロー制御部74は、該当するジョブを各ジョブ実行サーバ100,110へ投入すると共に、各ジョブ実行サーバ100,110からのジョブの終了通知を待ち合わせ、同ジョブがジョブフロー中の最後のジョブであるか否かを判断し、後続のジョブが存在するとき、次に実行するジョブを決定して投入する。   The schedule determination unit 73 determines whether there is a job flow to be activated based on the schedule information stored in the schedule information storage unit 71, and if there is a job flow to be activated (that is, a job When it is time to execute (), a job flow submission request is made. When a job flow input request is made from the schedule determination unit 73, the job flow control unit 74 determines the job execution order and the execution server 100, based on the job flow information stored in the job flow information storage unit 72. 110 is specified. Then, the job flow control unit 74 submits the corresponding job to each job execution server 100, 110, waits for a job end notification from each job execution server 100, 110, and the job is the last in the job flow. It is determined whether the job is a job, and when there is a subsequent job, the job to be executed next is determined and submitted.

ジョブ実行サーバ100は、ジョブ実行部101と、ジョブ実行状況情報記録部102とを備えている。ジョブ実行部101は、ジョブフロー制御部74から投入されたジョブの実行を開始すると共に、同ジョブの終了時に同ジョブの終了を同ジョブフロー制御部74に通知する。ジョブ実行状況情報記録部102は、ジョブ実行部101で実行されたジョブのジョブ実行状況情報(開始、実行中、終了)を記録する。ジョブ実行サーバ110は、ジョブ実行部111と、ジョブ実行状況情報記録部112とを備えている。ジョブ実行部111は、ジョブフロー制御部74から投入されたジョブの実行を開始すると共に、同ジョブの終了時に同ジョブの終了をジョブフロー制御部74に通知する。ジョブ実行状況情報記録部112は、ジョブ実行部111で実行されたジョブのジョブ実行状況情報(開始、実行中、終了)を記録する。   The job execution server 100 includes a job execution unit 101 and a job execution status information recording unit 102. The job execution unit 101 starts executing the job input from the job flow control unit 74 and notifies the job flow control unit 74 of the end of the job when the job ends. The job execution status information recording unit 102 records job execution status information (start, executing, end) of the job executed by the job execution unit 101. The job execution server 110 includes a job execution unit 111 and a job execution status information recording unit 112. The job execution unit 111 starts execution of the job input from the job flow control unit 74 and notifies the job flow control unit 74 of the end of the job when the job ends. The job execution status information recording unit 112 records job execution status information (start, executing, end) of the job executed by the job execution unit 111.

待機系サーバ80は、スケジュール情報記憶部81と、ジョブフロー情報記憶部82と、スケジュール判断部83と、ジョブフロー制御部84と、ジョブフロー引継ぎ部85とを備えている。スケジュール情報記憶部81は、稼働系サーバ70のスケジュール情報記憶部71と同一のスケジュール情報があらかじめ記憶されている。ジョブフロー情報記憶部82は、稼働系サーバ70のジョブフロー情報記憶部72と同一のジョブフロー情報があらかじめ記憶されている。スケジュール判断部83は、スケジュール情報記憶部81に記憶されているスケジュール情報に基づいて、起動するためのジョブフローがあるか否かを判断し、起動するためのジョブフローがある場合(すなわち、ジョブを実行する日時になったとき)は、ジョブフローの投入要求を行う。   The standby server 80 includes a schedule information storage unit 81, a job flow information storage unit 82, a schedule determination unit 83, a job flow control unit 84, and a job flow takeover unit 85. The schedule information storage unit 81 stores the same schedule information as the schedule information storage unit 71 of the active server 70 in advance. The job flow information storage unit 82 stores the same job flow information as the job flow information storage unit 72 of the active server 70 in advance. The schedule determination unit 83 determines whether there is a job flow to be activated based on the schedule information stored in the schedule information storage unit 81, and if there is a job flow to be activated (that is, a job When it is time to execute (), a job flow submission request is made.

ジョブフロー引継ぎ部85は、系切替え信号scにより制御され、ジョブ実行サーバ100,110がジョブの実行中に、系切替え状態となったとき、同ジョブ実行サーバ100,110からジョブ実行状況情報を収集し、同ジョブ実行状況情報に基づいてジョブフローの再開ポイントを決定する。特に、この実施形態では、ジョブフロー引継ぎ部85は、ジョブ実行状況情報収集部85aと、実行再開ポイント判断部85bと、CPU(中央処理装置)85cと、ROM(Read Only Memory)85dとから構成されている。ジョブ実行状況情報収集部85aは、系切替え状態となったとき、各ジョブ実行サーバ100,110のジョブ実行状況情報記録部102,112から上記ジョブ実行状況情報を収集し、特に、この実施形態では、同ジョブ実行状況情報のうちの実行中のジョブの情報を優先して収集する。実行再開ポイント判断部85bは、ジョブ実行状況情報収集部85aで収集された上記ジョブ実行状況情報に基づいて、実行中のジョブの再開ポイント(再開箇所)を決定する。CPU85cは、同ジョブフロー引継ぎ部85全体を制御するコンピュータであり、ROM85dは、同CPU85cを動作させるためのジョブフロー引継ぎ制御プログラムが記録されている。ジョブフロー制御部84は、ジョブフロー引継ぎ部85の実行再開ポイント判断部85bで決定された上記実行中のジョブの再開ポイントから各ジョブ実行サーバ100,110に上記ジョブの実行を継続させる。上記ジョブフロー引継ぎ部85及びジョブフロー制御部84により、ジョブ実行引継ぎ指示手段が構成されている。   The job flow takeover unit 85 is controlled by the system switching signal sc, and collects job execution status information from the job execution servers 100 and 110 when the job execution servers 100 and 110 are in the system switching state during job execution. The job flow resumption point is determined based on the job execution status information. In particular, in this embodiment, the job flow takeover unit 85 includes a job execution status information collection unit 85a, an execution restart point determination unit 85b, a CPU (Central Processing Unit) 85c, and a ROM (Read Only Memory) 85d. Has been. The job execution status information collection unit 85a collects the job execution status information from the job execution status information recording units 102 and 112 of the job execution servers 100 and 110 when the system switching state is entered. The information on the job being executed in the job execution status information is preferentially collected. The execution resumption point determination unit 85b determines a resumption point (resumption location) of the job being executed based on the job execution status information collected by the job execution status information collection unit 85a. The CPU 85c is a computer that controls the entire job flow takeover unit 85, and the ROM 85d stores a job flow takeover control program for operating the CPU 85c. The job flow control unit 84 causes the job execution servers 100 and 110 to continue execution of the job from the restart point of the job being executed determined by the execution restart point determination unit 85b of the job flow takeover unit 85. The job flow takeover unit 85 and job flow control unit 84 constitute job execution takeover instruction means.

図2は、スケジュール判断部73の動作を説明するフローチャート、図3は、ジョブフロー制御部74の動作を説明するフローチャート及び動作説明図、図4は、ジョブ実行部101,111の動作を説明するフローチャート及び動作説明図、及び図5が、ジョブフロー引継ぎ部85の動作を説明するフローチャート及び動作説明図である。
これらの図を参照して、この形態のジョブ実行システムに用いられるジョブフロー引継ぎ方法の処理内容について説明する。
このジョブ実行システムでは、通常状態のとき、稼働系サーバ70により、ジョブ実行サーバ100,110に対して該当するジョブが投入される。ジョブ実行サーバ100,110では、投入されたジョブが実行される。待機系サーバ80は、稼働系サーバ70に対して通常状態で予備となっている。通常状態のとき、系切替え部91,92により、ジョブ実行サーバ100,110と稼働系サーバ70とが接続される一方、系切替え状態となったとき、ジョブ実行サーバ100,110と待機系サーバ80とが接続される。ジョブ実行サーバ100,110にて、ジョブの開始、実行中又は終了を示すジョブ実行状況情報が記録される。ジョブ実行サーバ100,110がジョブの実行中に、系切替え状態となったとき、待機系サーバ80により、同ジョブ実行サーバ100,110からジョブ実行状況情報が収集され、同ジョブ実行状況情報に基づいてジョブフローの再開ポイントが決定されると共に、同ジョブ実行サーバ100,110に対して再開ポイントからジョブの実行の継続が指示される(ジョブ実行引継ぎ指示処理)。
2 is a flowchart for explaining the operation of the schedule determination unit 73, FIG. 3 is a flowchart for explaining the operation of the job flow control unit 74, and an operation explanatory diagram. FIG. 4 is for explaining the operation of the job execution units 101 and 111. FIG. 5 is a flowchart and an operation explanatory diagram for explaining the operation of the job flow takeover unit 85.
The processing contents of the job flow takeover method used in the job execution system of this embodiment will be described with reference to these drawings.
In this job execution system, in a normal state, the active server 70 inputs a corresponding job to the job execution servers 100 and 110. In the job execution servers 100 and 110, the submitted job is executed. The standby server 80 is reserved for the active server 70 in a normal state. In the normal state, the job switching servers 91 and 92 are connected to the active server 70 by the system switching units 91 and 92. On the other hand, in the system switching state, the job execution servers 100 and 110 and the standby server 80 are connected. And are connected. In the job execution servers 100 and 110, job execution status information indicating the start, execution or end of the job is recorded. When the job execution servers 100 and 110 are in a system switching state during job execution, the standby server 80 collects job execution status information from the job execution servers 100 and 110, and based on the job execution status information The job flow resumption point is determined, and the job execution servers 100 and 110 are instructed to continue job execution from the resumption point (job execution takeover instruction processing).

すなわち、スケジュール判断部73では、図2に示すように、スケジュール情報記憶部71からスケジュール情報が読み込まれ(ステップA1)、定義されている日時情報から起動するためのジョブフローがあるか否かが判断され(ステップA2)、起動するためのジョブフローがある場合は、ジョブフロー制御部74に対してジョブフロー投入を要求する(ステップA3)。このとき、ジョブフロー投入の要求には、日時情報(すなわち、何時実行のジョブフローであるかを示す情報)が付与される。   That is, as shown in FIG. 2, the schedule determination unit 73 reads schedule information from the schedule information storage unit 71 (step A1), and determines whether there is a job flow for starting from the defined date and time information. If it is determined (step A2) and there is a job flow to be activated, the job flow control unit 74 is requested to input the job flow (step A3). At this time, date / time information (that is, information indicating when the job flow is executed) is given to the job flow input request.

ジョブフロー制御部74では、図3(a)に示すように、ジョブフロー情報記憶部72からジョブフロー情報が読み込まれ(ステップB1)、ジョブフローの中で実行するジョブが決定される(ステップB2)。ジョブの投入先のジョブ実行サーバが特定され、そのサーバにジョブの投入が行われ(ステップB3)、この後、投入したジョブの終了を待ち合わせる(ステップB4)。終了を待ちあせた後、そのジョブがジョブフロー中の最後のジョブであるか否かが判断され(ステップB5)、後続のジョブが存在すれば、次に実行するジョブが決定されて投入される。この場合、図3(b)に示すように、ジョブフロー1では、スケジュール時刻“12:00”にて、ジョブ実行サーバ100により、先頭のJOB(ジョブ)1から実行され、JOB1が終了した後、ジョブ実行サーバ110により、JOB2が「実行中」の状態である。また、ジョブ実行サーバ100では、JOB3が未実行の状態である。   As shown in FIG. 3A, the job flow control unit 74 reads job flow information from the job flow information storage unit 72 (step B1), and determines a job to be executed in the job flow (step B2). ). A job execution server to which the job is to be input is specified, and the job is input to the server (step B3). Thereafter, the end of the input job is awaited (step B4). After waiting for completion, it is determined whether or not the job is the last job in the job flow (step B5). If there is a subsequent job, the job to be executed next is determined and submitted. . In this case, as shown in FIG. 3B, in the job flow 1, the job execution server 100 executes the job from the first job (job) 1 at the schedule time “12:00”, and after the job 1 is completed. The job execution server 110 is in a state where JOB2 is “being executed”. In the job execution server 100, JOB3 is not executed.

ジョブ実行サーバ100,110では、ジョブ実行部101,111により、図4(a)に示すように、ジョブの投入が受け付けられ(ステップC1)、同ジョブの実行が開始され(ステップC2)、この実行を開始したことがジョブ実行状況情報記録部102,112に記録される(ステップC3)。この後、ジョブ終了の待ち合わせが行われ、終了したら、ジョブフロー制御部74に終了したことが通知され(ステップC4)、また、終了したことがジョブ実行状況情報記録部102,112に記録される(ステップC5)。この場合、図4(b)に示すように、ジョブ実行サーバ100によるJOB1が終了した後、ジョブ実行サーバ110によるJOB2が「実行中」の状態であり、ジョブ実行サーバ100では、JOB3が未実行の状態であるので、図4(c)に示すように、ジョブフロー1では、ジョブ実行サーバ100のジョブ実行状況情報記録部102に、終了したJOB1の情報が記録され、また、図4(d)に示すように、ジョブ実行サーバ110のジョブ実行状況情報記録部112に、実行中のJOB2の情報が記録される。   In the job execution servers 100 and 110, as shown in FIG. 4A, the job execution units 101 and 111 accept the input of the job (step C1), and the execution of the job is started (step C2). The start of execution is recorded in the job execution status information recording units 102 and 112 (step C3). Thereafter, the job completion is waited. When the job is completed, the job flow control unit 74 is notified of the completion (step C4), and the completion is recorded in the job execution status information recording units 102 and 112. (Step C5). In this case, as shown in FIG. 4B, after JOB1 by the job execution server 100 is completed, JOB2 by the job execution server 110 is in the “execution” state, and the job execution server 100 does not execute JOB3. As shown in FIG. 4C, in the job flow 1, information on the completed JOB1 is recorded in the job execution status information recording unit 102 of the job execution server 100, and FIG. As shown in FIG. 6, information on the job 2 being executed is recorded in the job execution status information recording unit 112 of the job execution server 110.

ジョブフロー引継ぎ部85では、図5(a)に示すように、ジョブ実行状況情報収集部85aにより、ジョブ実行サーバ100,110から実行中のジョブの情報のみが収集される(ステップD1)。実行再開ポイント判断部85bにより、ジョブ実行状況情報収集部85aで収集された上記ジョブ実行状況情報に基づいて、ジョブフロー中の実行中のジョブの再開ポイントが決定される(ステップD2)。この決定されたジョブの再開ポイントは、ジョブフロー制御部84に通知される。そして、ジョブフロー制御部84により、実行再開ポイント判断部85bで決定された上記実行中のジョブの再開ポイントから各ジョブ実行サーバ100,110に上記ジョブの実行を継続させる。この後、実行中ジョブ以外の情報についても、ジョブ実行状況情報収集部85aで情報が収集され(ステップD3)、ジョブフローの各ジョブの状態に反映されて決定される(ステップD4)。ジョブフロー引継ぎ部85では、収集したジョブ実行状況情報に基づいて、各ジョブの状態が決定され、実行中のジョブから実行が継続される。この形態では、図5(b)に示すように、JOB2が実行中であるため、同JOB2から実行が引き継がれる。   In the job flow takeover unit 85, as shown in FIG. 5A, the job execution status information collection unit 85a collects only information on the job being executed from the job execution servers 100 and 110 (step D1). Based on the job execution status information collected by the job execution status information collection unit 85a, the execution restart point determination unit 85b determines the resume point of the job being executed in the job flow (step D2). The determined job resumption point is notified to the job flow control unit 84. Then, the job flow control unit 84 causes the job execution servers 100 and 110 to continue the execution of the job from the restart point of the job being executed determined by the execution restart point determination unit 85b. Thereafter, information other than the job being executed is also collected by the job execution status information collection unit 85a (step D3) and is reflected and determined in the state of each job in the job flow (step D4). The job flow takeover unit 85 determines the status of each job based on the collected job execution status information, and continues execution from the job being executed. In this form, as shown in FIG. 5B, since JOB2 is being executed, execution is inherited from JOB2.

以上のように、この第1の実施形態では、ジョブ実行サーバ100,110でジョブ実行状況情報が記録され、同ジョブ実行サーバ100,110がジョブの実行中に、系切替え状態となったとき、待機系サーバ80により、同ジョブ実行サーバ100,110からジョブ実行状況情報が収集され、同ジョブ実行状況情報に基づいてジョブフローの再開ポイントが決定されると共に、同ジョブ実行サーバ100,110に対して再開ポイントからジョブの実行の継続が指示されるので、共有ディスク装置などを用いることなく、ジョブ実行サーバ100,110に対するジョブの投入が、稼動系サーバ70から待機系サーバ80に円滑に引き継がれる。また、系切替え状態となったとき、ジョブ実行状況情報収集部85aにより、ジョブ実行状況情報のうちの実行中のジョブの情報が優先して収集されるので、系切替え状態で必要となるジョブ実行状況情報が短時間で引き継がれる。   As described above, in the first embodiment, when job execution status information is recorded in the job execution servers 100 and 110 and the job execution servers 100 and 110 are in a system switching state during job execution, The standby server 80 collects job execution status information from the job execution servers 100 and 110, determines a job flow resumption point based on the job execution status information, and sends the job execution status information to the job execution servers 100 and 110. Since the job execution is instructed from the restart point, the job input to the job execution servers 100 and 110 is smoothly transferred from the active server 70 to the standby server 80 without using a shared disk device or the like. . In addition, when the system switching state is entered, the job execution status information collecting unit 85a preferentially collects information on the job being executed in the job execution status information, so job execution required in the system switching status is performed. Status information is carried over in a short time.

実施形態2Embodiment 2

図6は、この発明の第2の実施形態であるジョブ実行システムの電気的構成を示すブロック図であり、第1の実施形態を示す図1中の要素と共通の要素には共通の符号が付されている。
この形態のジョブ実行システムでは、同図6に示すように、図1中の待機系サーバ80に代えて、新たな機能が付加された待機系サーバ80Aが設けられている。待機系サーバ80Aでは、待機系サーバ80の構成に加え、実行再開ポイント確認部86が設けられている。実行再開ポイント確認部86は、たとえば液晶表示装置などで構成され、再開ポイント判断部85bで決定された上記実行中のジョブの再開ポイントを、このジョブ実行システムの管理者に提示して確認させるためのものである。
FIG. 6 is a block diagram showing an electrical configuration of the job execution system according to the second embodiment of the present invention. Elements common to those in FIG. 1 showing the first embodiment are denoted by common reference numerals. It is attached.
In the job execution system of this form, as shown in FIG. 6, a standby server 80A to which a new function is added is provided instead of the standby server 80 in FIG. In the standby server 80A, in addition to the configuration of the standby server 80, an execution restart point confirmation unit 86 is provided. The execution resumption point confirmation unit 86 is configured by, for example, a liquid crystal display device, and presents the resumption point of the job being executed determined by the resumption point determination unit 85b to the administrator of the job execution system for confirmation. belongs to.

このジョブ実行システムでは、再開ポイント判断部85bで決定された実行中のジョブの再開ポイントが、実行再開ポイント確認部86により、システムの管理者に提示されるので、同管理者は、容易に再開ポイントを確認することができ、系切り替え時に実際にジョブフローやジョブの実行状況によって引継ぎを行うか否かを選択できるようになり、柔軟に対応することができる。   In this job execution system, since the restart point of the job being executed determined by the restart point determination unit 85b is presented to the system administrator by the execution restart point confirmation unit 86, the administrator can easily restart the job. Points can be confirmed, and whether or not to take over can be selected depending on the actual job flow or job execution status at the time of system switchover.

以上、この発明の実施形態を図面により詳述してきたが、具体的な構成は同実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計の変更などがあっても、この発明に含まれる。
たとえば、系切替え信号scは、上記各実施形態では、管理者により入力されるが、たとえば自然災害が発生した場合に気象庁などから通信回線を介して供給されるものでも良く、また、自然災害を検出する装置(たとえば、地震計など)から供給されるものでも良い。
The embodiment of the present invention has been described in detail with reference to the drawings. However, the specific configuration is not limited to the embodiment, and even if there is a design change without departing from the gist of the present invention, Included in the invention.
For example, the system switching signal sc is input by the administrator in each of the above embodiments. However, for example, when a natural disaster occurs, the system switching signal sc may be supplied via a communication line from the Japan Meteorological Agency or the like. It may be supplied from a detecting device (for example, a seismometer).

この発明は、通常状態で各ジョブ実行サーバに対して該当するジョブを投入して実行させる稼働系サーバと、同該稼働系サーバに対して通常状態で予備となる待機系サーバとを有する2重化された構成のジョブ実行システム全般に適用できる。   The present invention provides a dual server having an active server that submits and executes a corresponding job to each job execution server in a normal state, and a standby server that becomes a backup in the normal state for the active server. It can be applied to all job execution systems with a structured configuration.

この発明の第1の実施例であるジョブ実行システムの要部の電気的構成を示すブロック図である。1 is a block diagram illustrating an electrical configuration of a main part of a job execution system according to a first embodiment of the present invention. スケジュール判断部73の動作を説明するフローチャートである。7 is a flowchart illustrating the operation of a schedule determination unit 73. ジョブフロー制御部74の動作を説明するフローチャート及び動作説明図である。FIG. 7 is a flowchart for explaining the operation of a job flow control unit 74 and an operation explanatory diagram. ジョブ実行部101,111の動作を説明するフローチャート及び動作説明図である。FIG. 6 is a flowchart for explaining the operation of job execution units 101 and 111 and an operation explanatory diagram. ジョブフロー引継ぎ部85の動作を説明するフローチャート及び動作説明図である。FIG. 6 is a flowchart for explaining the operation of a job flow takeover unit 85 and an operation explanatory diagram. この発明の第2の実施形態であるジョブ実行システムの電気的構成を示すブロック図である。It is a block diagram which shows the electric constitution of the job execution system which is 2nd Embodiment of this invention. ジョブ実行システムの電気的構成例を示すブロック図である。It is a block diagram which shows the electrical structural example of a job execution system.

符号の説明Explanation of symbols

70 稼動系サーバ(ジョブ実行システムの一部)
71,81 スケジュール情報記憶部
72,82 ジョブフロー情報記憶部
73,83 スケジュール判断部
74 ジョブフロー制御部
80,80A 待機系サーバ(ジョブ実行システムの一部)
84 ジョブフロー制御部(ジョブ実行引継ぎ指示手段の一部)
85 ジョブフロー引継ぎ部(ジョブ実行引継ぎ指示手段の一部)
85a ジョブ実行状況情報収集部
85b 実行再開ポイント判断部
85c CPU(中央処理装置)
85d ROM(Read Only Memory)
86 実行再開ポイント確認部(実行再開箇所判断部)
91,92 系切替え部(ジョブ実行システムの一部)
100,110 ジョブ実行サーバ(ジョブ実行システムの一部)
101,111 ジョブ実行部
102,112 ジョブ実行状況情報記録部
70 Active server (part of job execution system)
71, 81 Schedule information storage unit 72, 82 Job flow information storage unit 73, 83 Schedule determination unit 74 Job flow control unit 80, 80A Standby server (part of job execution system)
84 Job flow control unit (part of job execution takeover instruction means)
85 Job flow takeover part (part of job execution takeover instruction means)
85a Job execution status information collection unit 85b Execution resume point determination unit 85c CPU (central processing unit)
85d ROM (Read Only Memory)
86 Execution restart point confirmation unit (execution restart point determination unit)
91,92 System switching unit (part of job execution system)
100, 110 Job execution server (part of job execution system)
101, 111 Job execution unit 102, 112 Job execution status information recording unit

Claims (5)

投入されたジョブを実行する1つ又は複数のジョブ実行サーバと、
通常状態のとき、前記各ジョブ実行サーバに対して該当するジョブを投入して実行させる稼働系サーバと、
該稼働系サーバに対して前記通常状態で予備となる待機系サーバと、
前記通常状態のとき、前記各ジョブ実行サーバと前記稼働系サーバとを接続する一方、系切替え状態となったとき、前記各ジョブ実行サーバと前記待機系サーバとを接続する系切替え部とを有するジョブ実行システムであって
前記稼働系サーバは、
前記各ジョブ実行サーバがジョブを実行するための日時がスケジュール情報としてあらかじめ記憶されている第1のスケジュール情報記憶部と、
該第1のスケジュール情報記憶部に記憶されている前記スケジュール情報に基づいて、起動するためのジョブフローがあるか否かを判断し、起動するためのジョブフローがある場合は、ジョブフローの投入要求を行う第1のスケジュール判断部と、
ジョブの実行順序及び実行サーバがジョブフロー情報としてあらかじめ記憶されている第1のジョブフロー情報記憶部と、
前記第1のスケジュール判断部から前記ジョブフローの投入要求が行われたとき、前記第1のジョブフロー情報記憶部に記憶されている前記ジョブフロー情報に基づいて、前記ジョブの実行順序及び実行サーバを特定し、該当するジョブを前記各ジョブ実行サーバへ投入すると共に、前記各ジョブ実行サーバからのジョブの終了通知を待ち合わせ、前記ジョブがジョブフロー中の最後のジョブであるか否かを判断し、後続のジョブが存在するとき、次に実行するためのジョブを決定して投入する第1のジョブフロー制御部とを備え、
前記各ジョブ実行サーバは、
前記第1のジョブフロー制御部から投入されたジョブの実行を開始すると共に、該ジョブの終了時に該ジョブの終了を前記第1のジョブフロー制御部に通知するジョブ実行部と、
該ジョブ実行部に投入されたジョブのジョブ実行状況情報を記録するジョブ実行状況情報記録部とを備え、
前記待機系サーバは、
前記稼働系サーバの前記第1のスケジュール情報記憶部と同一のスケジュール情報があらかじめ記憶されている第2のスケジュール情報記憶部と、
該第2のスケジュール情報記憶部に記憶されている前記スケジュール情報に基づいて、起動するためのジョブフローがあるか否かを判断し、起動するためのジョブフローがある場合は、ジョブフローの投入要求を行う第2のスケジュール判断部と、
前記稼働系サーバの前記第1のジョブフロー情報記憶部と同一のジョブフロー情報があらかじめ記憶されている第2のジョブフロー情報記憶部と、
前記系切替え状態となったとき、前記各ジョブ実行サーバの前記ジョブ実行状況情報記録部から前記ジョブ実行状況情報を収集してジョブフロー中の実行中のジョブを決定するジョブフロー引継ぎ部と、
該ジョブフロー引継ぎ部で決定された前記実行中のジョブの通知を受け、該ジョブを該当する前記各ジョブ実行サーバへ投入して前記ジョブの実行の継続を指示する第2のジョブフロー制御部とを備えてなることを特徴とするジョブ実行システム。
One or more job execution servers that execute submitted jobs;
In the normal state, an active server that submits and executes the corresponding job to each job execution server, and
A standby server serving as a backup in the normal state with respect to the active server;
In the normal state, the job execution server is connected to the active server, and when the system is switched to a system switching unit that connects the job execution server and the standby server. A job execution system that
The active server is
A first schedule information storage unit in which the date and time for each job execution server to execute a job is stored in advance as schedule information;
Based on the schedule information stored in the first schedule information storage unit, it is determined whether or not there is a job flow to be activated. If there is a job flow to be activated, the job flow is input. A first schedule determination unit for making a request;
A first job flow information storage unit in which job execution order and execution servers are stored in advance as job flow information;
When a job flow submission request is made from the first schedule determination unit, the job execution order and execution server are based on the job flow information stored in the first job flow information storage unit. And submits the corresponding job to each job execution server, waits for a job end notification from each job execution server, and determines whether the job is the last job in the job flow. A first job flow control unit that determines and submits a job to be executed next when there is a subsequent job,
Each of the job execution servers is
A job execution unit that starts execution of a job input from the first job flow control unit and notifies the first job flow control unit of the end of the job when the job ends;
A job execution status information recording unit that records job execution status information of a job submitted to the job execution unit,
The standby server is
A second schedule information storage unit in which the same schedule information as the first schedule information storage unit of the active server is stored in advance;
Based on the schedule information stored in the second schedule information storage unit, it is determined whether there is a job flow to be activated. If there is a job flow to be activated, the job flow is input. A second schedule determination unit for making a request;
A second job flow information storage unit that stores in advance the same job flow information as the first job flow information storage unit of the active server;
A job flow takeover unit that collects the job execution status information from the job execution status information recording unit of each job execution server and determines an executing job in the job flow when the system switching state is entered;
A second job flow control unit that receives the notification of the job being executed determined by the job flow takeover unit, inputs the job to the corresponding job execution server, and instructs the continuation of the execution of the job; job execution system characterized in that it comprises a.
前記ジョブフロー引継ぎ部は、
前記系切替え状態となったとき、前記各ジョブ実行サーバの前記ジョブ実行状況情報記録部から前記ジョブ実行状況情報を収集するジョブ実行状況情報収集部と、
該ジョブ実行状況情報収集部で収集された前記ジョブ実行状況情報に基づいて、実行中のジョブの再開箇所を決定する実行再開箇所判断部とから構成され、
前記第2のジョブフロー制御部は、
前記実行再開箇所判断部で決定された前記実行中のジョブの再開箇所から前記各ジョブ実行サーバに前記ジョブの実行を継続させる構成とされていることを特徴とする請求項記載のジョブ実行システム。
The job flow takeover part is
A job execution status information collection unit that collects the job execution status information from the job execution status information recording unit of each job execution server when the system switching state is entered;
Based on the job execution status information collected by the job execution status information collection unit, an execution restart point determination unit that determines a restart point of a job being executed,
The second job flow control unit
Job execution system according to claim 1, characterized in that it is configured to continue execution of the job to the each job execution server from resuming point of the job of the execution resumption point the running as determined at decision section .
前記ジョブ実行状況情報収集部は、
前記系切替え状態となったとき、前記各ジョブ実行サーバの前記ジョブ実行状況情報記録部から前記ジョブ実行状況情報のうちの実行中のジョブの情報を優先して収集する構成とされていることを特徴とする請求項記載のジョブ実行システム。
The job execution status information collection unit
When the system switching state is entered, the job execution status information recording unit of each job execution server is configured to preferentially collect information on the job being executed in the job execution status information. The job execution system according to claim 2, wherein:
前記実行再開箇所判断部で決定された前記実行中のジョブの再開箇所を前記ジョブ実行システムの管理者に提示して確認させるための実行再開箇所確認部が設けられていることを特徴とする請求項又は記載のジョブ実行システム。 An execution resumption location confirmation unit is provided for presenting and confirming the resumption location of the job being executed determined by the execution resumption location determination unit to an administrator of the job execution system. Item 4. The job execution system according to Item 2 or 3 . コンピュータを請求項1、2、3又は4記載のジョブ実行システムとして機能させるための制御プログラム。 A control program for causing a computer to function as the job execution system according to claim 1, 2, 3 or 4 .
JP2008313665A 2008-12-09 2008-12-09 Job execution system and job flow takeover control program Expired - Fee Related JP5359234B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008313665A JP5359234B2 (en) 2008-12-09 2008-12-09 Job execution system and job flow takeover control program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008313665A JP5359234B2 (en) 2008-12-09 2008-12-09 Job execution system and job flow takeover control program

Publications (2)

Publication Number Publication Date
JP2010140106A JP2010140106A (en) 2010-06-24
JP5359234B2 true JP5359234B2 (en) 2013-12-04

Family

ID=42350221

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008313665A Expired - Fee Related JP5359234B2 (en) 2008-12-09 2008-12-09 Job execution system and job flow takeover control program

Country Status (1)

Country Link
JP (1) JP5359234B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5525263B2 (en) * 2010-01-04 2014-06-18 株式会社野村総合研究所 Operation management apparatus, operation system, and definition data synchronization method
JP5961507B2 (en) * 2012-09-27 2016-08-02 株式会社日立ソリューションズ Automatic operation switching system and method in the event of an earthquake

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02109154A (en) * 1988-10-18 1990-04-20 Nippon Telegr & Teleph Corp <Ntt> Job control method
JPH06124214A (en) * 1992-10-09 1994-05-06 Nec Corp Continuation control system for fault hot job
JP2723068B2 (en) * 1995-02-20 1998-03-09 日本電気株式会社 Job re-execution method
JP3139536B2 (en) * 1997-05-26 2001-03-05 日本電気株式会社 Distributed batch job processing system and automatic job restart method in the event of failure
JPH11259326A (en) * 1998-03-13 1999-09-24 Ntt Communication Ware Kk Hot standby system, automatic re-execution method for the same and storage medium therefor
JP3537356B2 (en) * 1998-12-09 2004-06-14 株式会社日立製作所 Delay factor analysis method in job system
JP2001290666A (en) * 2000-04-05 2001-10-19 Nec Software Chubu Ltd Device and method for controlling job entry and recording medium
JP2005242848A (en) * 2004-02-27 2005-09-08 Nec Corp Batch job execution control system, program therefor, and recording medium with the program recorded thereon
WO2006020094A2 (en) * 2004-07-20 2006-02-23 Softricity, Inc. Method and system for minimizing loss in a computer application

Also Published As

Publication number Publication date
JP2010140106A (en) 2010-06-24

Similar Documents

Publication Publication Date Title
US8046632B2 (en) Backup management method based on mode of failure
US7779170B2 (en) Storage area network system
US8996841B2 (en) Hypervolume data storage object and method of data storage
JP4497953B2 (en) Information processing system and information processing method
JP4315016B2 (en) System switching method for computer system
US8880552B2 (en) Database system and database control method
JP4074442B2 (en) Method, apparatus, system, program and storage medium for data backup
JP5359234B2 (en) Job execution system and job flow takeover control program
JPH11259326A (en) Hot standby system, automatic re-execution method for the same and storage medium therefor
JPH1031562A (en) Information processing system
JP3551079B2 (en) Recovery method and device after replacement of modified load module
JP3139536B2 (en) Distributed batch job processing system and automatic job restart method in the event of failure
US7065539B2 (en) Data transfer method
JPH05314075A (en) On-line computer system
US20030225898A1 (en) Method of controlling storage control apparatus, storage control apparatus, and computer readable program for controlling the same
JP2002049509A (en) Data processing system
JP4260141B2 (en) Storage device and storage device host connection processing method
JP2003006018A (en) System, method for restoring processing request, client device and server device
JP7000797B2 (en) Startup management device, startup management system, startup management method, and startup management program
JP2008084327A (en) Method, apparatus, system, program, and recording medium for data backup
WO2014155654A1 (en) Information processing device, and information processing device replacement assistance system and replacement assistance method
JP4700104B2 (en) Server management method, program and apparatus
JP2888222B2 (en) Data backup method
JP2003256399A (en) Control method for switching in hot standby system
JP5791524B2 (en) OS operating device and OS operating program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20111104

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130426

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130514

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130716

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130806

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130819

R150 Certificate of patent or registration of utility model

Ref document number: 5359234

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees