JP2009098715A - Redundant system device, job execution method in redundant system device, and execution program - Google Patents
Redundant system device, job execution method in redundant system device, and execution program Download PDFInfo
- Publication number
- JP2009098715A JP2009098715A JP2007266635A JP2007266635A JP2009098715A JP 2009098715 A JP2009098715 A JP 2009098715A JP 2007266635 A JP2007266635 A JP 2007266635A JP 2007266635 A JP2007266635 A JP 2007266635A JP 2009098715 A JP2009098715 A JP 2009098715A
- Authority
- JP
- Japan
- Prior art keywords
- job
- execution
- executed
- server
- time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Hardware Redundancy (AREA)
Abstract
Description
本発明は冗長システム装置並びに冗長システム装置におけるジョブの実行方法及び実行プログラムに関し、特に、主系サーバと待機系サーバとを備えた多重化によって信頼性を向上させる冗長システム装置並びに冗長システム装置におけるジョブの実行方法及び実行プログラムに関する。 The present invention relates to a redundant system device and a job execution method and execution program in the redundant system device, and more particularly to a redundant system device and a job in the redundant system device that improve reliability by multiplexing with a primary server and a standby server. The present invention relates to an execution method and an execution program.
今日では、さまざまな情報システムがビジネスの根幹となっている。したがって、災害などの要因によってシステムがダウンした場合にも、短時間でシステムを復旧することが求められる。 Today, various information systems are the basis of business. Therefore, even when the system goes down due to a factor such as a disaster, it is required to restore the system in a short time.
そこで、システムを冗長化することによって、システムダウンへの耐性を向上させる技術が知られている。例えば、主系サーバ(本番系)と待機系サーバ(予備系)とを備えたシステムにおいては、主系サーバが故障した場合には、ジョブの実行主体を主系サーバから待機系サーバへと切り換えることによって、継続してジョブを実行させることができる。 In view of this, a technique is known in which a system is made redundant to improve resistance to system down. For example, in a system having a primary server (production system) and a standby server (standby system), if the primary server fails, the job execution subject is switched from the primary server to the standby server. Thus, the job can be continuously executed.
主系サーバと待機系サーバとを備えたシステムの代表的なものとして、ホットスタンバイ方式(ホットスペア方式)及びコールドスタンバイ方式(コールドスペア方式)が知られている。 As a typical system including a main server and a standby server, a hot standby system (hot spare system) and a cold standby system (cold spare system) are known.
ホットスタンバイ方式における待機系サーバは、正常時に稼動している主系サーバと常に同じ動作を行う(すなわち、ミラーリング状態にある)。したがって、主系サーバに異常が発生した場合には、待機系サーバが即座に処理を引き継ぐことができる。 The standby server in the hot standby system always performs the same operation as that of the main server operating normally (that is, in the mirroring state). Therefore, when an abnormality occurs in the primary server, the standby server can immediately take over the processing.
一方、コールドスタンバイ方式における待機系サーバは、主系サーバにおける障害の発生を確認してから起動され、ジョブの実行が引き継がれる。なお、待機系サーバにおいて、OSのみを立ち上げておくことによって、コールドスタンバイ方式よりも迅速な処理の切替を実現する方式(ウォームスタンバイ方式)も知られている。コールドスタンバイ方式は、ホットスタンバイ方式に比べてコストが安い半面、システムダウンへの耐性は劣る。 On the other hand, the standby server in the cold standby system is started after confirming the occurrence of a failure in the main server, and the job execution is taken over. In addition, a method (warm standby method) that realizes faster process switching than the cold standby method by starting up only the OS in the standby server is also known. The cold standby method is less expensive than the hot standby method, but is less resistant to system down.
特許文献1において、ホットスタンバイ方式の一例として、2台のコンピュータがオンライン業務処理を同時に行い、互いの処理結果をつき合わせることでシステム全体の信頼度を高める方式(並列冗長式、デュアル運転方式)が開示されている。 In Patent Document 1, as an example of the hot standby method, two computers simultaneously perform online business processing, and increase the reliability of the entire system by combining the processing results of each other (parallel redundancy method, dual operation method) Is disclosed.
また、特許文献2においても、自動運用される現用サーバと予備サーバとで、現用サーバに障害が発生しても迅速な継続運転が可能なホットスタンバイ方式システムが開示されている。 Also, Patent Document 2 discloses a hot standby system that enables quick continuous operation even if a failure occurs in the active server between the active server and the standby server that are automatically operated.
なお、特許文献3において、オフラインシステムにおいて障害が発生したときに、ジョブ制御言語による記述を修正することなく、処理済みのジョブステップからの再実行を可能とする方式が開示されている。 Note that Patent Document 3 discloses a method that enables re-execution from a processed job step without correcting a description in a job control language when a failure occurs in an offline system.
以下の分析は、本発明者によってなされたものである。 The following analysis was made by the present inventors.
従来のコールドスタンバイ方式においては、短時間で主系サーバと待機系サーバとを切り替えることが困難であった。スケジューリングされているジョブのうち、システムダウンする以前のジョブの実行状況を確認する作業と、実行系を切り替えた後ジョブの継続実行を行う箇所の設定作業とに時間を要していたためである。 In the conventional cold standby method, it is difficult to switch between the primary server and the standby server in a short time. This is because it takes time to check the execution status of the job before the system down among the scheduled jobs and to set the location where the job is continuously executed after switching the execution system.
また、従来のコールドスタンバイ方式システムにおいては、ジョブの実行状況の同期をとる際に、主系サーバと待機系サーバとの間でデータのやりとりを行う必要があり、両系が互いに遠隔地に設置されている場合には、データのやりとりに手間を要していた。 Also, in the conventional cold standby system, when synchronizing the job execution status, it is necessary to exchange data between the primary server and the standby server, and both systems are installed at remote locations. If so, it took time and effort to exchange data.
一方、特許文献1や2に開示されたホットスタンバイ方式システムでは、正常時であっても、待機系サーバは主系サーバと同様にジョブを実行するため、コストが高価となる問題がある。 On the other hand, in the hot standby system disclosed in Patent Documents 1 and 2, the standby server executes a job in the same manner as the main server even when it is normal, so that there is a problem that the cost becomes high.
そこで、正常時には待機系サーバにおいてジョブを実行しない冗長システム装置において、障害発生時に系の切り替え作業を短時間で行うことのできる冗長システム装置を提供することが課題となる。 Therefore, it is an object to provide a redundant system apparatus that can perform a system switching operation in a short time when a failure occurs in a redundant system apparatus that does not execute a job in a standby server during normal operation.
本発明の第1の視点に係る冗長システム装置は、ジョブを実行する時期を格納した実行時期データベース(以下、DBとする。)及び互いに依存関係にある複数のジョブの実行順序を格納した実行順序DBを備えた主系サーバと、前記実行時期DB及び前記実行順序DB並びに前記主系サーバにおいて実行されていないジョブを格納した未実行ジョブDBを備えた待機系サーバとを備えた冗長システム装置であって、正常時において、前記主系サーバが、前記実行時期DBと前記実行順序DBとを参照してジョブを実行して実行済みのジョブを前記待機系サーバへ通知し、前記待機系サーバが、通知された実行済ジョブに基づいて前記未実行ジョブDBを更新するように構成され、異常時において、前記待機系サーバが、前記実行時期DBと前記実行順序DBと前記未実行ジョブDBとを参照し、前記主系サーバにおいて実行されていないジョブであって、そのジョブと依存関係のあるジョブが実行済みであるものを実行するように構成されたことを特徴とする。 The redundant system apparatus according to the first aspect of the present invention includes an execution time database (hereinafter, referred to as DB) storing job execution times and an execution order storing execution orders of a plurality of jobs that are mutually dependent. A redundant system device comprising: a main server having a DB; and a standby server having a non-executed job DB storing jobs that have not been executed in the execution time DB, the execution order DB, and the main server. In the normal state, the primary server executes the job with reference to the execution time DB and the execution order DB, notifies the standby server of the executed job, and the standby server The non-executed job DB is updated based on the notified executed job, and when an abnormality occurs, the standby server is connected to the execution time DB. The execution order DB and the unexecuted job DB are referred to, and a job that has not been executed on the primary server and that has been executed for a job having a dependency relationship with the job is executed. It is characterized by that.
本発明の第2の視点に係る、冗長システム装置におけるジョブの実行方法は、ジョブを実行する時期を格納した実行時期データベース(以下、DBとする。)及び互いに依存関係にある複数のジョブの実行順序を格納した実行順序DBを備えた主系サーバと、前記実行時期DB及び前記実行順序DB並びに前記主系サーバにおいて実行されていないジョブを格納した未実行ジョブDBを備えた待機系サーバとを備えた冗長システム装置におけるジョブの実行方法であって、正常時において、前記主系サーバが、前記実行時期DBと前記実行順序DBとを参照してジョブを実行する工程と、実行済みのジョブを前記待機系サーバへ通知する工程と、前記待機系サーバが、通知された実行済ジョブに基づいて前記未実行ジョブDBを更新する工程とを含み、異常時において、前記待機系サーバが、前記実行時期DBと前記実行順序DBと前記未実行ジョブDBとを参照し、前記主系サーバにおいて実行されていないジョブであって、そのジョブと依存関係のあるジョブが実行済みであるものを実行する工程を含むことを特徴とする。 A job execution method in a redundant system apparatus according to a second aspect of the present invention includes an execution timing database (hereinafter referred to as DB) storing job execution timing and execution of a plurality of jobs that are dependent on each other. A primary server having an execution order DB storing an order; and a standby server having an execution time DB, an execution order DB, and an unexecuted job DB storing jobs not executed on the primary server. A job execution method in a redundant system device comprising: a step of executing a job by referring to the execution time DB and the execution order DB when the main server is in a normal state; A step of notifying the standby server, and a step of the standby server updating the unexecuted job DB based on the notified executed job The standby server refers to the execution time DB, the execution order DB, and the unexecuted job DB, and is not executed on the primary server, and the job It includes a step of executing a job having a dependency relationship that has been executed.
本発明の第3の視点に係る、冗長システム装置におけるジョブの実行プログラムは、ジョブを実行する時期を格納した実行時期データベース(以下、DBとする。)及び互いに依存関係にある複数のジョブの実行順序を格納した実行順序DBを備えた主系サーバと、前記実行時期DB及び前記実行順序DB並びに前記主系サーバにおいて実行されていないジョブを格納した未実行ジョブDBを備えた待機系サーバとを備えた冗長システム装置におけるジョブの実行プログラムであって、正常時において、前記主系サーバに、前記実行時期DBと前記実行順序DBとを参照してジョブを実行させる処理と、前記主系サーバに、実行済みのジョブを前記待機系サーバへ通知させる処理と、前記待機系サーバに、通知された実行済ジョブに基づいて前記未実行ジョブDBを更新させる処理とをコンピュータに実行させ、異常時において、前記待機系サーバに、前記実行時期DBと前記実行順序DBと前記未実行ジョブDBとを参照し、前記主系サーバにおいて実行されていないジョブであって、そのジョブと依存関係のあるジョブが実行済みであるものを実行させる処理をコンピュータに実行させることを特徴とする。 An execution program for a job in a redundant system apparatus according to a third aspect of the present invention includes an execution time database (hereinafter referred to as DB) that stores the time at which a job is executed and the execution of a plurality of jobs that are mutually dependent. A primary server having an execution order DB storing an order; and a standby server having an execution time DB, an execution order DB, and an unexecuted job DB storing jobs not executed on the primary server. A job execution program in a redundant system apparatus comprising: a process for causing the main server to execute a job with reference to the execution time DB and the execution order DB in a normal state; and A process for notifying the standby server of the executed job, and based on the executed job notified to the standby server. The process of updating the unexecuted job DB is executed by a computer, and in the event of an abnormality, the standby server is referred to the execution time DB, the execution order DB, and the unexecuted job DB, and the main server The computer is caused to execute a process for executing a job that has not been executed in step 1 and a job having a dependency relationship with the job has been executed.
第1の展開形態に係る冗長システム装置は、異常時において、前記待機サーバが、前記実行時期DBと前記実行順序DBと前記未実行ジョブDBとを参照し、前記主系サーバにおいて実行されていないジョブであって、そのジョブと依存関係のあるジョブが実行済みでない場合には、依存関係のあるジョブを実行した後に、そのジョブを実行するように構成されることが好ましい。 In the redundant system device according to the first development mode, the standby server refers to the execution time DB, the execution order DB, and the non-executed job DB and is not executed in the primary server when an abnormality occurs. If a job that has a dependency relationship with the job has not been executed, the job is preferably executed after the job having the dependency relationship is executed.
第2の展開形態に係る、冗長システム装置におけるジョブの実行方法は、異常時において、前記待機サーバが、前記実行時期DBと前記実行順序DBと前記未実行ジョブDBとを参照し、前記主系サーバにおいて実行されていないジョブであって、そのジョブと依存関係のあるジョブが実行済みでない場合には、依存関係のあるジョブを実行した後に、そのジョブを実行する工程を含むことが好ましい。 The job execution method in the redundant system apparatus according to the second development mode is such that the standby server refers to the execution time DB, the execution order DB, and the unexecuted job DB when an abnormality occurs, and the main system When a job that has not been executed in the server and a job having a dependency relationship with the job has not been executed, it is preferable to include a step of executing the job after executing the job having a dependency relationship.
本発明に係る冗長システム装置によって、短時間で主系サーバから待機系サーバへと切り替えることができる。待機系サーバでも主系サーバと同じようにスケジュール判断を行っており、未実行ジョブDBとジョブ終了情報から終了済みのジョブが判断できるのでジョブの継続実行を行うポイントの設定が容易にできるためである。 With the redundant system apparatus according to the present invention, it is possible to switch from the primary server to the standby server in a short time. This is because the standby server makes the schedule determination in the same way as the primary server, and it is easy to set the point for continued execution of the job because the completed job can be determined from the unexecuted job DB and job end information. is there.
また、本発明に係る冗長システム装置によって、待機系サーバにおいてジョブの依存関係を自動的に判断し、投入可能なものだけを実行することができる。依存関係のある先行ジョブの稼動状況を蓄積しており、その稼動状況によって投入可能なジョブを判定することができるからである。 Further, the redundant system apparatus according to the present invention can automatically determine the job dependency in the standby server and execute only those that can be submitted. This is because the operation status of a preceding job having a dependency relationship is accumulated, and a job that can be submitted can be determined based on the operation status.
さらに、本発明に係る冗長システム装置によって、ジョブの実行状況の同期を取る際に主系サーバに負荷をかけずに同期をとることができる。ジョブ終了時だけにメッセージを送信しており、少ないデータ量で同期をとることができるためである。 Further, the redundant system apparatus according to the present invention can synchronize the job execution status without imposing a load on the primary server. This is because a message is transmitted only at the end of the job, and synchronization can be achieved with a small amount of data.
本発明の実施形態に係る冗長システム装置について、図面を参照して説明する。 A redundant system apparatus according to an embodiment of the present invention will be described with reference to the drawings.
冗長システム装置は、図1を参照すると、主系サーバ10及び待機系サーバ20を備える。
Referring to FIG. 1, the redundant system device includes a
主系サーバ10は、実行時期DB11、実行順序DB13を備え、さらに、スケジュール判定部15、サーバ判定部16、依存関係判定部17、ジョブ実行部18を備える。
The
待機系サーバ20は、実行時期DB21、未実行ジョブDB22、実行順序DB23、スケジュール判定部25、サーバ判定部26、依存関係判定部27、ジョブ実行部28、ジョブ実行状況同期部29を備える。
The
正常時において、主系サーバ10は、次のように動作する。すなわち、実行時期DB11に基づいて投入されたジョブについて、実行順序DB13によって依存関係のチェックが行われた後、ジョブの実行が行われる。
Under normal conditions, the
主系サーバ10のジョブ実行部18から待機系サーバ20のジョブ実行状況同期部29へ、ジョブの実行状況を示す情報として、各ジョブの終了メッセージのみが送信される。
Only the end message of each job is transmitted as information indicating the job execution status from the
待機系サーバ20は、次のように動作する。すなわち、主系サーバ10の実行時期DB11と同じ実行時期DB21に基づいてジョブの投入が要求される。しかし、待機系サーバ20においては、正常時には、実際のジョブ投入は行われず、未実行ジョブDB22へ投入されなかったジョブが記録される。待機系サーバ20のジョブ実行状況同期部29は、定期的に、主系サーバ10のジョブ実行部18から、ジョブの終了状況を取得し、ジョブの実行状況に関する同期処理を行う。
The
異常時において、主系サーバ10と待機系サーバ20との間で切り替えが発生した場合には、前回の同期処理を行ったポイントから現在までの状況の同期を行い、待機系サーバ20においてジョブの投入が行われる。ここで、未実行ジョブDB22と実行順序DB23とによって、要求されたジョブと依存関係がある先行ジョブにおいて実行されていないものがないかを判定する。要求されたジョブと依存関係がある先行ジョブに実行されていないものがある場合には、要求されたジョブの実行を行わないようにする。したがって、待機系サーバ20では、先行ジョブに依存しないジョブのみが実行される。
When a switch occurs between the
次に、本発明の第1の実施例について図面を参照して詳細に説明する。 Next, a first embodiment of the present invention will be described in detail with reference to the drawings.
図2は、本発明の第1の実施例に係る冗長システム装置のブロック図である。 FIG. 2 is a block diagram of the redundant system apparatus according to the first embodiment of the present invention.
図2を参照すると、本実施例に係る冗長システム装置は、主系サーバ10、待機系サーバ20、実行状況蓄積サーバ40を備える。
Referring to FIG. 2, the redundant system device according to this embodiment includes a
主系サーバ10は、ジョブを実行すべき日時を記述した実行時期DB11、実行時期DBを元に実際に実行されたかどうかを記録する未実行ジョブDB12、フロー制御に必要なジョブの依存関係を格納した実行順序DB13、ジョブの実行に必要な情報を格納したジョブ定義情報14、スケジュール判定部15、サーバ判定部16、依存関係判定部17、ジョブ実行部18を備える。
The
待機系サーバ20は、ジョブを実行すべき日時を記述した実行時期DB21、実行時期DBを元に実際に実行されたかどうかを記録する未実行ジョブDB22、フロー制御に必要なジョブの依存関係を格納した実行順序DB23、ジョブの実行に必要な情報を格納したジョブ定義情報24、スケジュール判定部25、サーバ判定部26、依存関係判定部27、ジョブ実行部28、ジョブ実行状況同期部29を備える。
The
実行状況蓄積サーバ40は、ジョブ終了情報41を備える。
The execution
これらの各部はそれぞれ以下のように動作する。 Each of these units operates as follows.
主系サーバ10のスケジュール判定部15は、実行時期DB11を読み込んで、実行すべき日時が到来したとき、ジョブ投入要求をサーバ判定部16に対して行う。待機系サーバ20のスケジュール判定部25も、同様に、実行時期DB21を読み込んで、実行すべき日時が到来したとき、ジョブ投入要求をサーバ判定部26に対して行う。
The
主系サーバ10のサーバ判定部16は、ジョブの投入要求を依存関係判定部17へ送信する。待機系サーバ20のサーバ判定部26は、ジョブの投入要求を破棄して未実行ジョブDB22にそのジョブが実行されなかった旨を記録する。
The
主系サーバ10においては、未実行ジョブDB12にデータが存在しないため、依存関係判定部17は、ジョブの投入要求をジョブ実行部18へ送信する。
In the
待機系サーバ20の依存関係判定部27は、未実行ジョブDB22にデータが存在する場合は、投入要求されたジョブの依存関係を実行順序DB23の情報を元に判断し、問題がなければ、ジョブ実行部28へジョブの投入要求を送信する。
When there is data in the
主系サーバ10のジョブ実行部18は、ジョブの投入要求に基づいてジョブを実行し、ジョブの終了を検出した場合には、実行状況蓄積サーバ40へジョブ終了情報41を記録する。
The
待機系サーバ20のジョブ実行状況同期部29は、実行状況蓄積サーバ40からジョブ終了情報41を取得し、未実行ジョブDB22に含まれるジョブのうち、ジョブ終了情報41に含まれるジョブを削除する。
The job execution
待機系サーバ20のサーバ判定部26がシステム管理者等による系切替えの通知を受信した場合、待機系サーバ20は、主系サーバ10を代替してジョブの実行を担う。
When the
サーバ判定部26は正常時にはジョブの投入要求を破棄していた。しかし、切替え通知の受信後は、サーバ判定部26は、ジョブの投入要求を依存関係判定部27へ送信する。
The
次に、本実施例に係る冗長システム装置の動作について、図面を参照して詳細に説明する。 Next, the operation of the redundant system apparatus according to the present embodiment will be described in detail with reference to the drawings.
図3は、スケジュール判定部15、25の動作のフローチャートである。
FIG. 3 is a flowchart of the operations of the
スケジュール判定部15、25は、実行時期DB11、21を読み込み(ステップS10)、定義された日時情報に基づいて起動すべきジョブがあるか否かを判定する(ステップS11)。起動すべきジョブがある場合には、ジョブ投入を要求する(ステップS12)。
The
図4は、サーバ判定部16、26の動作のフローチャートである。
FIG. 4 is a flowchart of the operation of the
サーバ判定部16、26は、主系または待機系のいずれであるかに係る情報を読み込む(ステップS20)。主系サーバ10であるか否かを判定し(ステップS21)、主系サーバ10である場合には、ジョブの投入要求を依存関係判定部17へ送信する(ステップS22)。待機系サーバ20である場合には、未実行ジョブDB22へ実行されなかった旨を記録する(ステップS23)。
The
図5は、依存関係判定部17、27及びジョブ実行部18、28の動作のフローチャートである。
FIG. 5 is a flowchart of the operations of the
依存関係判定部17、27は、未実行ジョブDBにジョブがあるか否かを判定し(ステップS30)、未実行ジョブDBにジョブがない場合(ステップS30のNo)には、ジョブ実行部18、28はジョブを実行する(ステップS34)。未実行ジョブDBにジョブがある場合(ステップS30のYes)には、依存関係判定部27は、実行順序DB23を読み込んで(ステップS31)、先に実行すべき依存関係のあるジョブの実行状況を確認する(ステップS32)。依存関係のあるジョブが実行済みであるか否かを判定し(ステップS33)、実行済みである場合(ステップS33のYes)には、ジョブ実行部28は、ジョブの実行を行い(ステップS34)、実行済みでない場合(ステップS33のNo)には、ジョブを実行することなく終了する。
The
ジョブ実行部18は、実行したジョブの終了を検出した場合(ステップS35のYes)、ジョブ終了情報を実行状況蓄積サーバ40へ送信し、ジョブ状況蓄積サーバ40は、受信したジョブ終了情報41を記録する(ステップS36)。
When the
図6は、ジョブ実行状況同期部29の動作のフローチャートである。
FIG. 6 is a flowchart of the operation of the job execution
実行状況蓄積サーバ40からジョブ終了情報41を取得し(ステップS40)、未実行ジョブDB22に記録されたジョブの中に終了したジョブが含まれるか否かを判定し(ステップS41)、含まれる場合(ステップS41のYes)には、未実行ジョブDB22から終了したジョブを削除する(ステップS42)。
The
本発明の第2の実施例に係る冗長システム装置について、図面を参照して説明する。 A redundant system apparatus according to a second embodiment of the present invention will be described with reference to the drawings.
本実施例における待機系サーバ50は、図7を参照すると、第1の実施例に係る冗長システム装置における待機系サーバ20において未実行ジョブ判定部30をさらに備える。
Referring to FIG. 7, the
第1の実施例に係る冗長システム装置は、要求されたジョブについて、依存関係のあるジョブの実行実績がない場合は、要求されたジョブの実行を行わないように構成された。 The redundant system apparatus according to the first embodiment is configured not to execute the requested job when there is no execution result of the dependent job for the requested job.
本実施例の未実行ジョブ判定部30は、依存関係判定部27で抽出された情報に基づいて、依存関係のある未実行のジョブを確認するとともに、未実行のジョブがある場合には、ジョブ実行部28において実行する。ジョブ実行部28は、依存関係のある未実行ジョブの終了後に、要求されたジョブを実行する。
The unexecuted
以上の記載は実施例に基づいて行ったが、本発明は、上記実施例に限定されるものではない。 Although the above description has been made based on examples, the present invention is not limited to the above examples.
バッチジョブ管理システムにおいて、災害発生時にそのシステム切り替えといった用途に適用でき、バックアップセンタの構築も容易になる。 In a batch job management system, it can be applied to a system switching when a disaster occurs, and a backup center can be easily constructed.
10 主系サーバ
11、21 実行時期データベース(DB)
12、22 未実行ジョブDB
13、23 実行順序DB
14、24 ジョブ定義情報
15、25 スケジュール判定部
16、26 サーバ判定部
17、27 依存関係判定部
18、28 ジョブ実行部
20、50 待機系サーバ
29 ジョブ実行状況同期部
30 未実行ジョブ判定部
40 実行状況蓄積サーバ
41 ジョブ終了情報
10
12, 22 Unexecuted job DB
13, 23 Execution order DB
14, 24
Claims (5)
前記実行時期DB及び前記実行順序DB並びに前記主系サーバにおいて実行されていないジョブを格納した未実行ジョブDBを備えた待機系サーバとを備えた冗長システム装置であって、
正常時において、前記主系サーバが、前記実行時期DBと前記実行順序DBとを参照してジョブを実行して実行済みのジョブを前記待機系サーバへ通知し、前記待機系サーバが、通知された実行済ジョブに基づいて前記未実行ジョブDBを更新するように構成され、
異常時において、前記待機系サーバが、前記実行時期DBと前記実行順序DBと前記未実行ジョブDBとを参照し、前記主系サーバにおいて実行されていないジョブであって、そのジョブと依存関係のあるジョブが実行済みであるものを実行するように構成されたことを特徴とする冗長システム装置。 A main server having an execution time database (hereinafter referred to as DB) storing job execution times and an execution order DB storing execution orders of a plurality of jobs that are mutually dependent;
A redundant system device comprising: a standby server having an execution time DB, an execution order DB, and an unexecuted job DB storing a job not executed in the primary server;
In a normal state, the primary server refers to the execution time DB and the execution order DB, executes the job, notifies the standby server of the executed job, and the standby server is notified. Configured to update the unexecuted job DB based on the executed job,
At the time of abnormality, the standby server refers to the execution time DB, the execution order DB, and the unexecuted job DB, and is a job that is not executed on the primary server, and has a dependency relationship with the job. A redundant system device configured to execute a job that has been executed.
前記実行時期DB及び前記実行順序DB並びに前記主系サーバにおいて実行されていないジョブを格納した未実行ジョブDBを備えた待機系サーバとを備えた冗長システム装置におけるジョブの実行方法であって、
正常時において、前記主系サーバが、前記実行時期DBと前記実行順序DBとを参照してジョブを実行する工程と、
実行済みのジョブを前記待機系サーバへ通知する工程と、
前記待機系サーバが、通知された実行済ジョブに基づいて前記未実行ジョブDBを更新する工程とを含み、
異常時において、前記待機系サーバが、前記実行時期DBと前記実行順序DBと前記未実行ジョブDBとを参照し、前記主系サーバにおいて実行されていないジョブであって、そのジョブと依存関係のあるジョブが実行済みであるものを実行する工程を含むことを特徴とする冗長システム装置におけるジョブの実行方法。 A main server having an execution time database (hereinafter referred to as DB) storing job execution times and an execution order DB storing execution orders of a plurality of jobs that are mutually dependent;
A job execution method in a redundant system device including the execution time DB, the execution order DB, and a standby server including an unexecuted job DB storing a job that is not executed in the primary server,
A step in which the main server executes a job with reference to the execution time DB and the execution order DB at a normal time;
Notifying the standby server of the executed job;
The standby server updates the unexecuted job DB based on the notified executed job, and
At the time of abnormality, the standby server refers to the execution time DB, the execution order DB, and the unexecuted job DB, and is a job that is not executed on the primary server, and has a dependency relationship with the job. A method for executing a job in a redundant system apparatus, comprising a step of executing a job that has been executed.
前記実行時期DB及び前記実行順序DB並びに前記主系サーバにおいて実行されていないジョブを格納した未実行ジョブDBを備えた待機系サーバとを備えた冗長システム装置におけるジョブの実行プログラムであって、
正常時において、前記主系サーバに、前記実行時期DBと前記実行順序DBとを参照してジョブを実行させる処理と、
前記主系サーバに、実行済みのジョブを前記待機系サーバへ通知させる処理と、
前記待機系サーバに、通知された実行済ジョブに基づいて前記未実行ジョブDBを更新させる処理とをコンピュータに実行させ、
異常時において、前記待機系サーバに、前記実行時期DBと前記実行順序DBと前記未実行ジョブDBとを参照し、前記主系サーバにおいて実行されていないジョブであって、そのジョブと依存関係のあるジョブが実行済みであるものを実行させる処理をコンピュータに実行させることを特徴とする冗長システム装置におけるジョブの実行プログラム。 A main server having an execution time database (hereinafter referred to as DB) storing job execution times and an execution order DB storing execution orders of a plurality of jobs that are mutually dependent;
A job execution program in a redundant system device including the execution time DB, the execution order DB, and a standby server including an unexecuted job DB storing a job that is not executed in the primary server,
A process of causing the primary server to execute a job with reference to the execution time DB and the execution order DB at a normal time;
A process for causing the primary server to notify the standby server of an executed job;
Causing the standby server to execute a process of updating the unexecuted job DB based on the notified executed job,
At the time of abnormality, the standby server is referred to the execution time DB, the execution order DB, and the unexecuted job DB, and is a job that is not executed on the primary server and has a dependency relationship with the job. A job execution program in a redundant system apparatus, characterized in that a computer executes a process for executing a job that has already been executed.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007266635A JP2009098715A (en) | 2007-10-12 | 2007-10-12 | Redundant system device, job execution method in redundant system device, and execution program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007266635A JP2009098715A (en) | 2007-10-12 | 2007-10-12 | Redundant system device, job execution method in redundant system device, and execution program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2009098715A true JP2009098715A (en) | 2009-05-07 |
Family
ID=40701693
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007266635A Pending JP2009098715A (en) | 2007-10-12 | 2007-10-12 | Redundant system device, job execution method in redundant system device, and execution program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2009098715A (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011076512A (en) * | 2009-10-01 | 2011-04-14 | Hitachi Solutions Ltd | Integrated management system of job management server |
JP2012528382A (en) * | 2009-05-25 | 2012-11-12 | アリババ・グループ・ホールディング・リミテッド | Cache data processing using cache clusters in configurable mode |
CN110188008A (en) * | 2019-05-06 | 2019-08-30 | 平安科技(深圳)有限公司 | Job scheduling main/standby switching method, device, computer equipment and storage medium |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06124214A (en) * | 1992-10-09 | 1994-05-06 | Nec Corp | Continuation control system for fault hot job |
JPH11259326A (en) * | 1998-03-13 | 1999-09-24 | Ntt Communication Ware Kk | Hot standby system, automatic re-execution method for the same and storage medium therefor |
JP2002014938A (en) * | 2000-06-30 | 2002-01-18 | Toshiba Corp | System loaded with cluster software and computer readable storage medium storing program |
JP2005242848A (en) * | 2004-02-27 | 2005-09-08 | Nec Corp | Batch job execution control system, program therefor, and recording medium with the program recorded thereon |
-
2007
- 2007-10-12 JP JP2007266635A patent/JP2009098715A/en active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06124214A (en) * | 1992-10-09 | 1994-05-06 | Nec Corp | Continuation control system for fault hot job |
JPH11259326A (en) * | 1998-03-13 | 1999-09-24 | Ntt Communication Ware Kk | Hot standby system, automatic re-execution method for the same and storage medium therefor |
JP2002014938A (en) * | 2000-06-30 | 2002-01-18 | Toshiba Corp | System loaded with cluster software and computer readable storage medium storing program |
JP2005242848A (en) * | 2004-02-27 | 2005-09-08 | Nec Corp | Batch job execution control system, program therefor, and recording medium with the program recorded thereon |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012528382A (en) * | 2009-05-25 | 2012-11-12 | アリババ・グループ・ホールディング・リミテッド | Cache data processing using cache clusters in configurable mode |
US8972773B2 (en) | 2009-05-25 | 2015-03-03 | Alibaba Group Holding Limited | Cache data processing using cache cluster with configurable modes |
JP2011076512A (en) * | 2009-10-01 | 2011-04-14 | Hitachi Solutions Ltd | Integrated management system of job management server |
CN110188008A (en) * | 2019-05-06 | 2019-08-30 | 平安科技(深圳)有限公司 | Job scheduling main/standby switching method, device, computer equipment and storage medium |
CN110188008B (en) * | 2019-05-06 | 2022-10-21 | 平安科技(深圳)有限公司 | Job scheduling master-slave switching method and device, computer equipment and storage medium |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5075736B2 (en) | System failure recovery method and system for virtual server | |
JP5352115B2 (en) | Storage system and method for changing monitoring condition thereof | |
US20120254342A1 (en) | Method for Providing Access to Data Items from a Distributed Storage System | |
JP4277873B2 (en) | Transaction processing apparatus and transaction processing method | |
JP2009015476A (en) | Journal management method in cdp remote configuration | |
JP5948933B2 (en) | Job continuation management apparatus, job continuation management method, and job continuation management program | |
WO2017028375A1 (en) | Version upgrading method and system | |
JP6558037B2 (en) | Operation management program, operation management method, and operation management apparatus | |
JP5366184B2 (en) | Data storage system and data storage method | |
JP2009098715A (en) | Redundant system device, job execution method in redundant system device, and execution program | |
JP5282569B2 (en) | Management device, management system, management method, and management program | |
US20090249010A1 (en) | Apparatus and method for controlling copying | |
JPH11259326A (en) | Hot standby system, automatic re-execution method for the same and storage medium therefor | |
JP4796086B2 (en) | Cluster system and method for selecting master node in the same system | |
JP2011186588A (en) | Printer device, server device, and update system | |
JP6657725B2 (en) | Database system, replication control device, replication method, and program | |
JP2020095322A (en) | Distributed file device, failover method, program, and storage medium | |
US20120089716A1 (en) | Method for accelerating start up of a computerized system | |
JP3708891B2 (en) | Process pair execution control method, process pair execution control program, and fault tolerant system in fault tolerant system | |
JP5262492B2 (en) | Cluster system and command conflict control method | |
JP5703860B2 (en) | Fault tolerant system, memory control method, and program | |
JP5935439B2 (en) | Backup method for fault-tolerant servers | |
JP2009205568A (en) | Cluster system and its operation method | |
JP2007293650A (en) | Distributed transaction control system and its method | |
JP2008310517A (en) | Data identification method, data identification program, and active system device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110301 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110308 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110509 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20120131 |