JP2003256399A - Control method for switching in hot standby system - Google Patents

Control method for switching in hot standby system

Info

Publication number
JP2003256399A
JP2003256399A JP2002050362A JP2002050362A JP2003256399A JP 2003256399 A JP2003256399 A JP 2003256399A JP 2002050362 A JP2002050362 A JP 2002050362A JP 2002050362 A JP2002050362 A JP 2002050362A JP 2003256399 A JP2003256399 A JP 2003256399A
Authority
JP
Japan
Prior art keywords
computer
transaction
work
business
switching
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002050362A
Other languages
Japanese (ja)
Inventor
Toshihiro Nishizaki
智弘 西崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2002050362A priority Critical patent/JP2003256399A/en
Publication of JP2003256399A publication Critical patent/JP2003256399A/en
Pending legal-status Critical Current

Links

Landscapes

  • Hardware Redundancy (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a control method for switching in a hot standby system of a loosely-coupled multiprocessor comprising more than three computers, which levels out loads of each computer. <P>SOLUTION: A first computer 100 switches a transactional application operated by the first computer 100 to a second computer 200 as an operation for the second computer 200 when the first computer 100 fails. A means 206 to notify switching of a batch application notifies the switching of the batch application to a third computer 300, if a means 205 to judge the switching of the batch applications judges that an application load of the second computer 200 becomes more than the application load of the third computer 300. A first means 302 for switching the batch applications processes a switching process in order to hand over the batch applications to a first means 301 for alternative processing. <P>COPYRIGHT: (C)2003,JPO

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明が属する技術分野】本発明はホットスタンバイシ
ステム切り替え制御方式に関し、特に3台以上の計算機
がチャネル接続されて構成された疎結合マルチプロセッ
サシステムにおけるホットスタンバイシステム切り替え
制御方式に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a hot standby system switching control system, and more particularly to a hot standby system switching control system in a loosely coupled multiprocessor system in which three or more computers are channel-connected.

【0002】[0002]

【従来の技術】従来のホットスタンバイシステムの一例
が、特開平5−165664号公報に記載されている。
この従来のホットスタンバイシステムは、図12に示す
ように、運用系計算機1と代替系計算機2とからなり、
運用系計算機1が、トランザクション処理を実行する業
務処理手段3と、業務処理手段3が正常に動作している
かどうかを監視し、正常な動作時には一定の監視時間間
隔ごとに正常動作を示す正常電文を送信する正常電文送
信手段5と、業務処理手段3においてトランザクション
処理の継続が不可能な障害が発生した場合に、この障害
を検出し、この障害を示す障害電文を送信する障害電文
送信手段8とを備え、代替系計算機2が、トランザクシ
ョン処理を引き継ぎ実行する代替業務処理手段4と、正
常電文送信手段5からの正常電文を受信し、この受信に
よって業務処理手段3が正常に動作していることを認識
し、また障害電文送信手段8からの障害電文を受信しこ
の障害電文を出力する監視電文受信手段6と、監視電文
受信手段6からの障害通知を受け、これを解析し、業務
処理手段3における障害の発生を判定し、障害を通知す
る監視電文解析手段9と、監視電文解析手段9からの障
害通知を受け、これによって代替業務処理手段4にトラ
ンザクション処理を切り替える業務切り替え制御手段7
とを備えて構成されていた。
2. Description of the Related Art An example of a conventional hot standby system is described in Japanese Patent Laid-Open No. 5-165664.
As shown in FIG. 12, this conventional hot standby system includes an active computer 1 and an alternate computer 2,
The operating system computer 1 monitors the business processing means 3 for executing transaction processing and whether the business processing means 3 is operating normally, and at the time of normal operation, a normal message indicating a normal operation at regular monitoring time intervals. When a failure occurs in which the transaction processing cannot be continued in the normal message sending means 5 and the business processing means 3, the failure message sending means 8 detects this failure and sends a failure message indicating this failure. The alternative computer 2 receives the normal business message from the alternative business processing means 4 that takes over the transaction processing and the normal business message sending means 5, and the business processing means 3 is operating normally by this reception. The monitoring message receiving means 6 for recognizing that the failure message is received from the failure message transmitting means 8 and outputting the failure message, and the monitoring message receiving means 6 Receives a harm notification, analyzes it, determines the occurrence of a failure in the business processing means 3, receives a failure notification from the monitoring message analysis means 9 for notifying the failure, and receives a failure notification from the monitoring message analysis means 9, thereby performing alternative business processing. Business switching control means 7 for switching transaction processing to the means 4
It was equipped with and.

【0003】このような構成を有する従来のホットスタ
ンバイシステムは、次のように動作する。
The conventional hot standby system having such a configuration operates as follows.

【0004】運用系計算機1では、業務処理手段3が、
トランザクション業務を処理し、このトランザクション
業務を実行している。正常電文送信手段5は、運用系計
算機1において業務処理手段3が正常に動作しているか
どうかを監視し、正常に動作しているとき、正常動作を
示す正常電文を通信回線を経由して代替系計算機2へ一
定の監視時間間隔ごとに送信する。障害電文送信手段8
は、業務処理手段3の障害発生を監視し、障害を検出し
たときに障害を示す障害電文を代替系計算機2へ送信す
る。
In the operational computer 1, the business processing means 3 is
Process transactional business and execute this transactional business. The normal message transmitting means 5 monitors whether or not the business processing means 3 is operating normally in the operational computer 1, and when it is operating normally, substitutes a normal message indicating normal operation via the communication line. It is transmitted to the system computer 2 at regular monitoring time intervals. Fault message transmitting means 8
Monitors the occurrence of a failure in the business processing means 3, and when a failure is detected, transmits a failure message indicating the failure to the alternative computer 2.

【0005】代替系計算機2では、監視電文受信手段6
が、正常電文を受信すると、業務処理手段3が正常に動
作していることを認識し、正常電文が受信されなけれ
ば、運用系計算機1に障害が発生したとみなし、障害を
業務切り替え制御手段7へ通知する。また、監視電文受
信手段6は、障害電文送信手段8から障害を示す障害電
文を受信したときに障害電文を監視電文解析手段9へ出
力する。監視電文解析手段9は、入力された障害電文の
解析によって運用系計算機1の障害を判定し、業務切り
替え制御手段7へ指示する。業務切り替え制御手段7
は、監視電文受信手段6または監視電文解析手段9から
運用系計算機1の障害を通知されたとき、トランザクシ
ョン業務を代替業務処理手段4に切り替える。代替業務
処理手段4は、運用系計算機1の障害発生時にトランザ
クション業務を引き継ぎ処理を継続し、この引き継ぎ処
理を実行する。
In the alternative computer 2, the monitoring message receiving means 6
When the normal message is received, the business processing means 3 recognizes that it is operating normally. If the normal message is not received, it is considered that a failure has occurred in the operating system computer 1, and the failure is switched to the business switching control means. Notify 7. Further, the monitoring message receiving means 6 outputs the failure message to the monitoring message analyzing means 9 when receiving the failure message indicating the failure from the failure message sending means 8. The monitoring telegram analysis means 9 determines the fault of the operating system computer 1 by analyzing the input fault telegram, and gives an instruction to the work switching control means 7. Business switching control means 7
When the monitoring message receiving means 6 or the monitoring message analyzing means 9 notifies the failure of the active computer 1, the transaction work is switched to the alternative work processing means 4. The alternative business processing means 4 continues the business processing of the transaction when a failure occurs in the operating system computer 1, and executes the processing of the succession.

【0006】上記特開平5−165664号公報に記載
されたホットスタンバイシステムは、運用系計算機と代
替系計算機との2台の計算機からなるものであるが、特
開平07−073061には、3台以上のホストコンピ
ュータよりに構成されたホットスタンバイシステムが開
示されている。
The hot standby system described in Japanese Patent Laid-Open No. 5-165664 is composed of two computers, an active system computer and an alternative system computer. A hot standby system including the above host computer is disclosed.

【0007】特開平07−073061に開示されたホ
ットスタンバイシステムにおける待機系配置ホスト決定
方式は、論理システムの稼働系と待機系および各稼働系
の論理システムの所在の有無をホストコンピュータ毎に
監視する論理システム状況監視装置と、ホストコンピュ
ータ相互の通信を可能とするホスト間通信装置と、予め
システムインストールを実施する時点で与えられるホス
ト負荷数を格納するためのホスト負荷数格納装置と、ホ
スト間通信装置経由で得られた情報とホスト負荷数格納
装置に存在する情報とを基にホットスタンバイシステム
を構成する各ホストコンピュータの負荷を算出してホス
ト負荷状況格納装置に格納するホスト負荷算出装置と、
ホスト負荷状況格納装置から各ホストの負荷情報を取り
出してシステムオペレータがシステムの運行指示・問い
合わせを実施するための運行監視端末とから構成されて
いた。
In the standby system allocation host determination method in the hot standby system disclosed in Japanese Patent Laid-Open No. 07-073061, the presence / absence of the active system and standby system of the logical system and the logical system of each active system is monitored for each host computer. Logical system status monitoring device, inter-host communication device that enables mutual communication between host computers, host load number storage device for storing the host load number given at the time of system installation in advance, and inter-host communication A host load calculation device that calculates the load of each host computer that configures the hot standby system based on the information obtained through the device and the information that exists in the host load number storage device and stores the load in the host load status storage device,
It is composed of an operation monitoring terminal for taking out load information of each host from the host load status storage device and allowing a system operator to instruct and inquire the operation of the system.

【0008】このように構成された従来のホットスタン
バイシステムでは、論理システムの待機系をどのホスト
で立ち上げるのが最適であるかをシステム操作員に表示
することで、システム全体の負荷バランスに応じた論理
システムの配置を適切にかつ動的に行えるようにしてい
る。
In the conventional hot standby system configured as described above, the system operator can be informed which host is most suitable to start up the standby system of the logical system, so that the load balance of the entire system can be determined. The logical system can be arranged appropriately and dynamically.

【0009】[0009]

【発明が解決しようとする課題】しかし、特開平5−1
65664号公報に開示された従来技術には、トランザ
クション業務の切り替えが発生した場合、代替系計算機
においてその後の代替系計算機の業務負荷が高くなるた
め、以降の代替系計算機でのトランザクション業務やバ
ッチ業務の運用に遅延や性能低下が発生する可能性があ
るという問題点があった。
However, JP-A-5-1 is used.
In the prior art disclosed in Japanese Patent No. 65664, when a transaction operation is switched, the operation load of the alternative computer thereafter becomes high in the alternative computer, so that the transaction operation and the batch operation in the subsequent alternative computer are performed. However, there was a problem that there was a possibility of delay and performance degradation in the operation of.

【0010】また、特開平07−073061に開示さ
れた従来技術では、システム操作員が論理システムを立
ち上げる時点でホスト負荷係数の表示を求め、表示に基
づいて論理システムを立ち上げるホストコンピュータを
決定しなければならず、人間の介在による誤った論理シ
ステムの配置がなされるおそれがあるという問題点があ
った。
Further, in the prior art disclosed in Japanese Patent Laid-Open No. 07-073061, the system operator requests the display of the host load coefficient at the time of starting the logical system, and the host computer for starting the logical system is determined based on the display. However, there is a problem that a wrong logical system may be arranged due to human intervention.

【0011】本発明の目的は、3台以上の計算機がチャ
ネル接続されて構成された疎結合マルチプロセッサシス
テムでなるホットスタンバイシステムにおいて、第1の
計算機が障害になった場合に第1の計算機で運用してい
たトランザクション業務を第2の計算機に切り替え、こ
れにより第2の計算機の負荷が高くなった場合には第2
の計算機で運用されていたバッチ業務を第3の計算機に
切り替えるようにしたホットスタンバイシステム切り替
え制御方式を提供することにある。
An object of the present invention is to provide a hot standby system consisting of a loosely coupled multiprocessor system in which three or more computers are connected in a channel, and in the first computer when a failure occurs in the first computer. If the transaction work being operated is switched to the second computer and the load on the second computer becomes high,
Another object of the present invention is to provide a hot standby system switching control method in which a batch job that has been operated on this computer is switched to the third computer.

【0012】[0012]

【課題を解決するための手段】本発明のホットスタンバ
イシステム切り替え制御方式は、3台の計算機がチャネ
ル接続されて構成された疎結合マルチプロセッサシステ
ムであり、通常の業務運用中は、トランザクション業務
を実行する運用系が存在する第1の計算機と、第1の計
算機で発生した障害により運用系でのトランザクション
業務の継続が不可能な状態になった場合に障害となった
トランザクション業務の復旧を行い以降のトランザクシ
ョン業務の運用を引き継ぎ実行する代替系を持つ第2の
計算機と、第3の計算機とが接続されている構成のホッ
トスタンバイシステムにおいて、第1の計算機が、通常
の業務運用中に運用系としてトランザクション業務を実
行するトランザクション業務処理手段と、第1の計算機
に障害が発生した場合に運用系での当該トランザクショ
ン業務の継続が可能か否かを判定する障害事象判定手段
と、前記障害事象判定手段により運用系でのトランザク
ション業務の継続が不可能と判定された場合に第2の計
算機に存在するトランザクション業務切り替え手段に障
害を通知してトランザクション業務の切り替えを指示す
る障害通知手段とを備え、第2の計算機が、前記障害通
知手段からトランザクション業務の切り替え指示を受け
て運用系で実行していたトランザクション業務を実行継
続が可能な状態に復旧するトランザクション業務切り替
え手段と、トランザクション業務の復旧後に以降のトラ
ンザクション業務を引き継ぎ実行して運用を継続するト
ランザクション業務代替処理手段と、通常の運用中にバ
ッチ業務を実行するバッチ業務処理手段と、第2の計算
機の業務負荷を一定の監視時間間隔で監視し第2の計算
機の業務負荷情報を業務負荷情報テーブルに記録する第
1の業務負荷情報監視手段と、第1の計算機で障害が発
生しトランザクション業務の実行が切り替えられ前記ト
ランザクション業務代替処理手段でトランザクション業
務が再開された場合に前記業務負荷情報テーブルを参照
して第2の計算機の業務負荷情報と第3の計算機の業務
負荷情報とを比較し、第2の計算機の業務負荷が高くな
ったことが検知されたときに第3の計算機にバッチ業務
の切り替えを行うか否かを判定するバッチ業務切り替え
判定手段と、第3の計算機にバッチ業務を切り替えると
判定された場合にバッチ業務の切り替えを第3の計算機
に指示するバッチ業務切り替え通知手段とを備え、第3
の計算機が、第3の計算機の業務負荷を一定の監視時間
間隔で監視し第3の計算機の業務負荷情報を前記業務負
荷情報テーブルに記録する第2の業務負荷情報監視手段
と、前記バッチ業務切り替え通知手段により切り替えを
指示されたバッチ業務を第2の計算機から切り替えるバ
ッチ業務切り替え処理手段と、前記バッチ業務切り替え
処理手段により切り替えられたバッチ業務を引き継ぎ以
降の実行を継続するバッチ業務代替処理手段とを備える
ことを特徴とする。
The hot standby system switching control method of the present invention is a loosely coupled multiprocessor system in which three computers are connected in channels, and transaction operations are performed during normal business operations. When the operating system to be executed exists on the first computer and the failure that occurred on the first computer makes it impossible to continue the transaction work on the operating system, restore the failed transaction work. In a hot standby system with a configuration in which a second computer having an alternative system that takes over and executes the subsequent transaction operations and a third computer are connected, the first computer operates during normal business operations. A failure occurred in the transaction business processing means that executes transaction business as a system and the first computer In the case where it is determined by the failure event determination means that the transaction work in the active system cannot be continued, the failure event determination means for determining whether or not the transaction work in the active system can be continued A failure notification means for notifying a transaction operation switching means existing in another computer of the failure and instructing switching of the transaction operation, and the second computer receives the operation instruction for switching the transaction operation from the failure notification means, and the operating system Transaction transaction switching means that restores the transaction transaction that was being executed in a state in which execution can be continued, transaction transaction alternative processing means that continues execution by succeeding and executing subsequent transaction transactions after recovery of transaction transactions, Batch business process that executes batch business during operation And a first work load information monitoring means for monitoring the work load of the second computer at constant monitoring time intervals and recording the work load information of the second computer in the work load information table, and the first computer. When a failure occurs, the execution of the transaction work is switched and the transaction work is resumed by the transaction work alternative processing means, the work load information table is referred to and the work load information of the second computer and the work of the third computer are referred to. A batch job switching determination means for comparing the load information, and determining whether to switch the batch job to the third computer when it is detected that the business load of the second computer has increased; And a batch operation switching notifying means for instructing the third computer to switch the batch operation when it is determined to switch the batch operation to the third computer.
A second work load information monitoring means for monitoring the work load of the third computer at a constant monitoring time interval and recording the work load information of the third computer in the work load information table; and the batch work. Batch job switching processing means for switching a batch job instructed to be switched by the switching notifying means from the second computer, and batch job alternative processing means for continuing execution of the batch job switched by the batch job switching processor And is provided.

【0013】また、本発明のホットスタンバイシステム
切り替え制御方式は、前記業務負荷情報テーブルに、第
2の計算機の業務負荷情報および第3の計算機の業務負
荷情報が各時刻毎に対応して記録されていることを特徴
とする。
Further, in the hot standby system switching control method of the present invention, the work load information of the second computer and the work load information of the third computer are recorded in the work load information table in correspondence with each time. It is characterized by

【0014】さらに、本発明のホットスタンバイシステ
ム切り替え制御方式は、4台以上の計算機がチャネル接
続されて構成された疎結合マルチプロセッサシステムで
あり、通常の業務運用中は、トランザクション業務を実
行する運用系が存在する第1の計算機と、第1の計算機
で発生した障害により運用系でのトランザクション業務
の継続が不可能な状態になった場合に障害となったトラ
ンザクション業務の復旧を行い以降のトランザクション
業務の運用を引き継ぎ実行する代替系を持つ第2の計算
機と、2台以上の第3の計算機とが接続されている構成
のホットスタンバイシステムにおいて、第1の計算機
が、通常の業務運用中に運用系としてトランザクション
業務を実行するトランザクション業務処理手段と、第1
の計算機に障害が発生した場合に運用系での当該トラン
ザクション業務の継続が可能か否かを判定する障害事象
判定手段と、前記障害事象判定手段により運用系でのト
ランザクション業務の継続が不可能と判定された場合に
第2の計算機に存在するトランザクション業務切り替え
手段に障害を通知してトランザクション業務の切り替え
を指示する障害通知手段とを備え、第2の計算機が、前
記障害通知手段からトランザクション業務の切り替え指
示を受けて運用系で実行していたトランザクション業務
を実行継続が可能な状態に復旧するトランザクション業
務切り替え手段と、トランザクション業務の復旧後に以
降のトランザクション業務を引き継ぎ実行して運用を継
続するトランザクション業務代替処理手段と、通常の運
用中にバッチ業務を実行するバッチ業務処理手段と、第
2の計算機の業務負荷を一定の監視時間間隔で監視し第
2の計算機の業務負荷情報を業務負荷情報テーブルに記
録する第1の業務負荷情報監視手段と、第1の計算機で
障害が発生しトランザクション業務の実行が切り替えら
れ前記トランザクション業務代替処理手段でトランザク
ション業務が再開された場合に前記業務負荷情報テーブ
ルを参照して第2の計算機の業務負荷情報と第3の計算
機の業務負荷情報とを比較し、第2の計算機の業務負荷
が高くなったことが検知されたときに第3の計算機で業
務負荷の低いものを特定し、当該第3の計算機にバッチ
業務の切り替えを行うか否かを判定するバッチ業務切り
替え判定手段と、当該第3の計算機にバッチ業務を切り
替えると判定された場合にバッチ業務の切り替えを当該
第3の計算機に指示するバッチ業務切り替え通知手段と
を備え、第3の計算機が、第3の計算機の業務負荷を一
定の監視時間間隔で監視し第3の計算機の業務負荷情報
を前記業務負荷情報テーブルに記録する第2の業務負荷
情報監視手段と、前記バッチ業務切り替え通知手段によ
り切り替えを指示されたバッチ業務を第2の計算機から
切り替えるバッチ業務切り替え処理手段と、前記バッチ
業務切り替え処理手段により切り替えられたバッチ業務
を引き継ぎ以降の実行を継続するバッチ業務代替処理手
段とを備えることを特徴とする。
Further, the hot standby system switching control method of the present invention is a loosely coupled multiprocessor system in which four or more computers are connected in channels, and during normal business operation, transaction business is executed. The first computer where the system exists, and the transaction after the transaction that caused the failure is restored when the transaction in the active system cannot be continued due to the failure that occurred in the first computer In a hot standby system with a configuration in which a second computer that has an alternative system for taking over and executing business operations and two or more third computers are connected, the first computer is Transaction business processing means for executing transaction business as an active system, and first
Failure event determining means for determining whether or not it is possible to continue the transaction work in the active system when a failure occurs in the computer, and it is impossible to continue the transaction work in the active system by the failure event determining means. And a failure notification means for notifying the transaction work switching means existing in the second computer of the failure and instructing switching of the transaction work when the determination is made. Transaction business switching means that receives a switching instruction and restores the transaction business that was being executed in the active system to a state in which it can continue execution, and transaction business that continues operation by succeeding and executing subsequent transaction business after recovery of the transaction business Alternate processing means and batch operations during normal operation A batch work processing means to be executed; a first work load information monitoring means for monitoring the work load of the second computer at a constant monitoring time interval and recording the work load information of the second computer in the work load information table; When a failure occurs in the first computer, the execution of the transaction work is switched, and the transaction work alternative processing means resumes the transaction work, the work load information table is referred to refer to the work load information of the second computer and The third computer is compared with the third computer's workload information, and when it is detected that the second computer's workload is high, the third computer identifies the one with the lowest workload and assigns it to the third computer. Batch job switching determination means for determining whether or not to switch the batch job, and batch job when it is determined to switch the batch job to the third computer. And a batch work switching notification means for instructing the third computer to switch the work load of the third computer, and the third computer monitors the work load of the third computer at constant monitoring time intervals, and the work load information of the third computer. In the work load information table, a batch work switching processing unit for switching the batch work instructed to be switched by the batch work switching notifying unit from the second computer, and the batch work. It is characterized in that it comprises a batch job alternative processing means for continuing the execution after the handover of the batch job switched by the switching processing means.

【0015】さらにまた、本発明のホットスタンバイシ
ステム切り替え制御方式は、前記業務負荷情報テーブル
に、第2の計算機の業務負荷情報,および2台以上の第
3の計算機の業務負荷情報が各時刻毎に対応して記録さ
れていることを特徴とする。
Furthermore, in the hot standby system switching control method of the present invention, the work load information table includes the work load information of the second computer and the work load information of two or more third computers at each time. It is characterized in that it is recorded corresponding to.

【0016】一方、本発明のホットスタンバイシステム
切り替え制御方法は、3台の計算機がチャネル接続され
て構成された疎結合マルチプロセッサシステムであり、
通常の業務運用中は、トランザクション業務を実行する
運用系が存在する第1の計算機と、第1の計算機で発生
した障害により運用系でのトランザクション業務の継続
が不可能な状態になった場合に障害となったトランザク
ション業務の復旧を行い以降のトランザクション業務の
運用を引き継ぎ実行する代替系を持つ第2の計算機と、
第3の計算機とが接続されている構成のホットスタンバ
イシステムにおいて、第1の計算機に障害が発生し、第
1の計算機上でのトランザクション業務の継続が不可能
になった場合に第2の計算機において当該トランザクシ
ョン業務の復旧を行い該トランザクション業務の運用を
第1の計算機から引き継ぎ実行し、これにより第2の計
算機の業務負荷が高くなったときに、第2の計算機で実
行されているバッチ業務を第3の計算機に切り替えて実
行することを特徴とする。
On the other hand, the hot standby system switching control method of the present invention is a loosely coupled multiprocessor system in which three computers are connected in a channel.
During normal business operation, if the first computer on which the active system that executes the transaction business exists and the failure that occurred on the first computer makes it impossible to continue the transaction business on the active system A second computer having an alternative system for recovering the failed transaction operation and taking over the operation of the subsequent transaction operation;
In a hot standby system having a configuration in which a third computer is connected, if a failure occurs in the first computer and it becomes impossible to continue the transaction work on the first computer, the second computer In this case, the transaction business is restored and the operation of the transaction business is taken over from the first computer, and when the business load of the second computer becomes high, the batch business executed by the second computer Is switched to a third computer and executed.

【0017】また、本発明のホットスタンバイシステム
切り替え制御方法は、4台以上の計算機がチャネル接続
されて構成された疎結合マルチプロセッサシステムであ
り、通常の業務運用中は、トランザクション業務を実行
する運用系が存在する第1の計算機と、第1の計算機で
発生した障害により運用系でのトランザクション業務の
継続が不可能な状態になった場合に障害となったトラン
ザクション業務の復旧を行い以降のトランザクション業
務の運用を引き継ぎ実行する代替系を持つ第2の計算機
と、2台以上の第3の計算機とが接続されている構成の
ホットスタンバイシステムにおいて、第1の計算機に障
害が発生し、第1の計算機上でのトランザクション業務
の継続が不可能になった場合に第2の計算機において当
該トランザクション業務の復旧を行い該トランザクショ
ン業務の運用を第1の計算機から引き継ぎ実行し、これ
により第2の計算機の業務負荷が高くなったときに、第
3の計算機で業務負荷の低いものを特定し、当該第3の
計算機に第2の計算機で実行されているバッチ業務を切
り替えて実行することを特徴とする。
The hot standby system switching control method of the present invention is a loosely-coupled multiprocessor system in which four or more computers are channel-connected, and an operation for executing transaction work during normal business operation. The first computer in which the system exists, and the transaction after the transaction that caused the failure is restored when it becomes impossible to continue the transaction business in the active system due to the failure that occurred in the first computer In a hot standby system having a configuration in which a second computer having an alternative system for taking over and executing business operations and two or more third computers are connected, a failure occurs in the first computer, If it becomes impossible to continue the transaction work on this computer, the relevant transaction will be executed on the second computer. The business is restored and the operation of the transaction business is taken over from the first computer. When the business load of the second computer becomes high, the third computer identifies the one with the low business load, It is characterized in that the batch job executed by the second computer is switched to the third computer and executed.

【0018】他方、本発明のプログラムは、コンピュー
タを、通常の業務運用中に運用系としてトランザクショ
ン業務を実行するトランザクション業務処理手段,当該
コンピュータに障害が発生した場合に運用系での当該ト
ランザクション業務の継続が可能か否かを判定する障害
事象判定手段,および前記障害事象判定手段により運用
系でのトランザクション業務の継続が不可能と判定され
た場合に他のコンピュータに存在するトランザクション
業務切り替え手段に障害を通知してトランザクション業
務の切り替えを指示する障害通知手段として動作させる
ことを特徴とする。
On the other hand, the program of the present invention is a transaction business processing means for executing a transaction business as an active system of a computer during a normal business operation; Failure in the failure event determination means for determining whether or not continuation is possible, and the transaction operation switching means existing in another computer when the failure event determination means determines that the transaction operation in the active system cannot be continued Is notified and is operated as a failure notification means for instructing switching of transaction work.

【0019】また、本発明のプログラムは、コンピュー
タを、他のコンピュータの障害通知手段からトランザク
ション業務の切り替え指示を受けて運用系で実行してい
たトランザクション業務を実行継続が可能な状態に復旧
するトランザクション業務切り替え手段,トランザクシ
ョン業務の復旧後に以降のトランザクション業務を引き
継ぎ実行して運用を継続するトランザクション業務代替
処理手段,通常の運用中にバッチ業務を実行するバッチ
業務処理手段,当該コンピュータの業務負荷を一定の監
視時間間隔で監視し当該コンピュータの業務負荷情報を
業務負荷情報テーブルに記録する第1の業務負荷情報監
視手段,第1の計算機で障害が発生しトランザクション
業務の実行が切り替えられ前記トランザクション業務代
替処理手段でトランザクション業務が再開された場合に
前記業務負荷情報テーブルを参照して当該コンピュータ
の計算機の業務負荷情報と別のコンピュータの業務負荷
情報とを比較し、当該コンピュータの業務負荷が高くな
ったことが検知されたときに別のコンピュータにバッチ
業務の切り替えを行うか否かを判定するバッチ業務切り
替え判定手段,および当該別のコンピュータにバッチ業
務を切り替えると判定された場合にバッチ業務の切り替
えを当該別のコンピュータに指示するバッチ業務切り替
え通知手段として動作させることを特徴とする。
Further, the program of the present invention is a transaction for recovering a computer to a state in which it is possible to continue execution of the transaction work executed in the active system in response to an instruction to switch the transaction work from a failure notification means of another computer. Business switching means, transaction business alternative processing means that takes over and executes subsequent transaction business after recovery of transaction business, batch business processing means that executes batch business during normal operation, and constant business load of the computer Monitoring means at a monitoring time interval of 1) to record the workload information of the computer in the workload information table, and the execution of the transaction job is switched when a failure occurs in the first computer and the transaction job replacement is performed. Tiger by processing means When the transaction work is restarted, the workload information of the computer of the computer is compared with the workload information of another computer by referring to the workload information table, and it is detected that the workload of the computer becomes high. Batch job switching determination means for determining whether to switch the batch job to another computer when it is performed, and switching the batch job to another computer when it is determined to switch the batch job to the other computer. It is characterized in that it is operated as a batch work switching notification means for instructing a computer.

【0020】さらに、本発明のプログラムは、コンピュ
ータを、他のコンピュータの障害通知手段からトランザ
クション業務の切り替え指示を受けて運用系で実行して
いたトランザクション業務を実行継続が可能な状態に復
旧するトランザクション業務切り替え手段,トランザク
ション業務の復旧後に以降のトランザクション業務を引
き継ぎ実行して運用を継続するトランザクション業務代
替処理手段,通常の運用中にバッチ業務を実行するバッ
チ業務処理手段,当該コンピュータの業務負荷を一定の
監視時間間隔で監視し当該コンピュータの業務負荷情報
を業務負荷情報テーブルに記録する第1の業務負荷情報
監視手段,第1の計算機で障害が発生しトランザクショ
ン業務の実行が切り替えられトランザクション業務代替
処理手段でトランザクション業務が再開された場合に前
記業務負荷情報テーブルを参照して当該コンピュータの
計算機の業務負荷情報と別のコンピュータの業務負荷情
報とを比較し、当該コンピュータの業務負荷が高くなっ
たことが検知されたときに別のコンピュータで業務負荷
の低いものを特定し、当該別のコンピュータにバッチ業
務の切り替えを行うか否かを判定するバッチ業務切り替
え判定手段,および当該別のコンピュータにバッチ業務
を切り替えると判定された場合にバッチ業務の切り替え
を当該別のコンピュータに指示するバッチ業務切り替え
通知手段として動作させることを特徴とする。
Furthermore, the program of the present invention is a transaction for recovering a computer to a state in which it is possible to continue execution of a transaction job executed in an active system in response to an instruction to switch transaction jobs from a failure notification means of another computer. Business switching means, transaction business alternative processing means that takes over and executes subsequent transaction business after recovery of transaction business, batch business processing means that executes batch business during normal operation, and constant business load of the computer Monitoring means at a monitoring time interval and records the work load information of the computer in the work load information table. The first work load information monitoring means switches the execution of the transaction work due to a failure in the first computer Tran by Means When the operation work is restarted, the work load information table is referred to and the work load information of the computer of the computer is compared with the work load information of another computer to detect that the work load of the computer has increased. When this occurs, another computer with a low work load is identified, batch work switching determination means for determining whether to switch the batch work to the other computer, and batch work is switched to the other computer When it is determined that the batch job switching is instructed, the batch job switching notification means for instructing the other computer is operated.

【0021】さらにまた、本発明のプログラムは、コン
ピュータを、当該コンピュータの業務負荷を一定の監視
時間間隔で監視し当該コンピュータの業務負荷情報を業
務負荷情報テーブルに記録する第2の業務負荷情報監視
手段,他のコンピュータから切り替えを指示されたバッ
チ業務を当該他のコンピュータから切り替えるバッチ業
務切り替え処理手段,および前記バッチ業務切り替え処
理手段により切り替えられたバッチ業務を引き継ぎ以降
の実行を継続するバッチ業務代替処理手段として動作さ
せることを特徴とする。
Furthermore, the program of the present invention is a second work load information monitor for monitoring the work load of the computer at a constant monitoring time interval and recording the work load information of the computer in the work load information table. Means, a batch job switching processing means for switching a batch job instructed to be switched from another computer from the other computer, and a batch job alternative for continuing execution after the batch job switched by the batch job switching processing means It is characterized in that it is operated as a processing means.

【0022】また、本発明のプログラムは、コンピュー
タを、通常の業務運用中に運用系としてトランザクショ
ン業務を実行するトランザクション業務処理手段,当該
コンピュータに障害が発生した場合に運用系での当該ト
ランザクション業務の継続が可能か否かを判定する障害
事象判定手段,前記障害事象判定手段により運用系での
トランザクション業務の継続が不可能と判定された場合
に他のコンピュータに存在するトランザクション業務切
り替え手段に障害を通知してトランザクション業務の切
り替えを指示する障害通知手段,前記障害通知手段から
トランザクション業務の切り替え指示を受けて運用系で
実行していたトランザクション業務を実行継続が可能な
状態に復旧するトランザクション業務切り替え手段,ト
ランザクション業務の復旧後に以降のトランザクション
業務を引き継ぎ実行して運用を継続するトランザクショ
ン業務代替処理手段,通常の運用中にバッチ業務を実行
するバッチ業務処理手段,他のコンピュータの業務負荷
を一定の監視時間間隔で監視し当該他のコンピュータの
業務負荷情報を業務負荷情報テーブルに記録する第1の
業務負荷情報監視手段,当該コンピュータで障害が発生
しトランザクション業務の実行が切り替えられ前記トラ
ンザクション業務代替処理手段でトランザクション業務
が再開された場合に前記業務負荷情報テーブルを参照し
て他のコンピュータの業務負荷情報とさらに別のコンピ
ュータの業務負荷情報とを比較し、当該他のコンピュー
タの業務負荷が高くなったことが検知されたときには別
のコンピュータにバッチ業務の切り替えを行うか否かを
判定するバッチ業務切り替え判定手段,当該別のコンピ
ュータにバッチ業務を切り替えると判定された場合にバ
ッチ業務の切り替えを当該別のコンピュータに指示する
バッチ業務切り替え通知手段,当該コンピュータの業務
負荷を一定の監視時間間隔で監視し当該コンピュータの
業務負荷情報を前記業務負荷情報テーブルに記録する第
2の業務負荷情報監視手段,他のコンピュータから切り
替えを指示されたバッチ業務を当該他のコンピュータか
ら切り替えるバッチ業務切り替え処理手段,および前記
バッチ業務切り替え処理手段により切り替えられたバッ
チ業務を引き継ぎ以降の実行を継続するバッチ業務代替
処理手段として動作させることを特徴とする。
Further, the program of the present invention is a transaction business processing means for executing transaction business as an active system in a computer during normal business operation, and a transaction business processing means for operating the transaction business in the active system when a failure occurs in the computer. Failure event determining means for determining whether or not continuation is possible, and failure by the transaction operation switching means existing in another computer when the failure event determination means determines that transaction operation in the active system cannot be continued Failure notification means for notifying and instructing the switching of transaction business, and transaction business switching means for receiving the transaction business switching instruction from the failure notification means and restoring the transaction business being executed in the active system to a state where execution can be continued , Transaction industry After the recovery, the transaction transaction alternative processing means that inherits and executes the subsequent transaction transactions and continues operation, the batch transaction processing method that executes batch transactions during normal operation, and the workload of other computers at fixed monitoring intervals. A first work load information monitoring unit that monitors and records work load information of the other computer in a work load information table; execution of the transaction work is switched due to a failure in the computer, and transaction work is executed by the transaction work alternative processing unit. When the restart is restarted, the workload information table of the other computer is compared with the workload information of another computer by referring to the workload information table, and it is detected that the workload of the other computer has increased. When the job is executed, the batch job is switched to another computer. Batch job switching determination means for deciding whether or not to carry out a batch job switch notification means for instructing the other computer to switch the batch job when it is judged to switch the batch job to the other computer, the computer Second work load information monitoring means for monitoring the work load of the computer at a constant monitoring time interval and recording the work load information of the computer in the work load information table, and the batch work instructed to be switched by another computer. It is characterized in that it is operated as a batch job switching processing means for switching from the computer and a batch job alternative processing means for continuing the execution after the handover of the batch job switched by the batch job switching processing means.

【0023】さらに、本発明のプログラムは、コンピュ
ータを、通常の業務運用中に運用系としてトランザクシ
ョン業務を実行するトランザクション業務処理手段,当
該コンピュータに障害が発生した場合に運用系での当該
トランザクション業務の継続が可能か否かを判定する障
害事象判定手段,前記障害事象判定手段により運用系で
のトランザクション業務の継続が不可能と判定された場
合に他のコンピュータに存在するトランザクション業務
切り替え手段に障害を通知してトランザクション業務の
切り替えを指示する障害通知手段,前記障害通知手段か
らトランザクション業務の切り替え指示を受けて運用系
で実行していたトランザクション業務を実行継続が可能
な状態に復旧するトランザクション業務切り替え手段,
トランザクション業務の復旧後に以降のトランザクショ
ン業務を引き継ぎ実行して運用を継続するトランザクシ
ョン業務代替処理手段,通常の運用中にバッチ業務を実
行するバッチ業務処理手段,他のコンピュータの業務負
荷を一定の監視時間間隔で監視し当該他のコンピュータ
の業務負荷情報を業務負荷情報テーブルに記録する第1
の業務負荷情報監視手段,当該コンピュータで障害が発
生しトランザクション業務の実行が切り替えられ前記ト
ランザクション業務代替処理手段でトランザクション業
務が再開された場合に前記業務負荷情報テーブルを参照
して他のコンピュータの業務負荷情報と別のコンピュー
タの業務負荷情報とを比較し、当該他のコンピュータの
業務負荷が高くなったことが検知されたときには別のコ
ンピュータで業務負荷の低いものを特定し、当該別のコ
ンピュータにバッチ業務の切り替えを行うか否かを判定
するバッチ業務切り替え判定手段,当該別のコンピュー
タにバッチ業務を切り替えると判定された場合にバッチ
業務の切り替えを当該別のコンピュータに指示するバッ
チ業務切り替え通知手段,当該コンピュータの業務負荷
を一定の監視時間間隔で監視し当該コンピュータの業務
負荷情報を前記業務負荷情報テーブルに記録する第2の
業務負荷情報監視手段,他のコンピュータから切り替え
を指示されたバッチ業務を当該他のコンピュータから切
り替えるバッチ業務切り替え処理手段,および前記バッ
チ業務切り替え処理手段により切り替えられたバッチ業
務を引き継ぎ以降の実行を継続するバッチ業務代替処理
手段として動作させることを特徴とする。
Further, the program of the present invention is a transaction business processing means for executing a transaction business as an active system during a normal business operation of a computer, and a transaction business processing means for executing the transaction business in the active system when a failure occurs in the computer. Failure event determining means for determining whether or not continuation is possible, and failure by the transaction operation switching means existing in another computer when the failure event determination means determines that transaction operation in the active system cannot be continued Failure notification means for notifying and instructing the switching of transaction business, and transaction business switching means for receiving the transaction business switching instruction from the failure notification means and restoring the transaction business being executed in the active system to a state where execution can be continued ,
Subsequent transaction service alternative processing means that continues the operation by succeeding and executing the subsequent transaction business after recovery of the transaction business, batch business processing means that executes the batch business during normal operation, and a certain monitoring time for the workload of other computers Monitoring at intervals and recording work load information of the other computer in the work load information table 1st
The work load information monitoring means of the other computer refers to the work load information table when the execution of the transaction work is switched due to a failure in the computer and the transaction work is resumed by the transaction work alternative processing means. When the load information and the work load information of another computer are compared and it is detected that the work load of the other computer has increased, another computer with a low work load is identified and Batch job switching determination means for deciding whether or not to switch batch jobs, and batch job switch notification means for instructing another computer to switch batch jobs when it is determined to switch batch jobs to the other computer , Monitoring the work load of the computer for a certain period Second work load information monitoring means for remotely monitoring the work load information of the computer and recording the work load information of the computer in the work load information table, batch work switching processing for switching the batch work instructed to be switched by another computer from the other computer And a batch job switching processing means for operating the batch job switched by the batch job switching processing means as a batch job substitute processing means for continuing execution after the handover.

【0024】図1において、本発明のホットスタンバイ
切り替えシステムは、3台以上の計算機がチャネル接続
されて構成された疎結合マルチプロセッサシステムであ
り、通常の業務運用中には、トランザクション業務を実
行する運用系が存在する第1の計算機100と、トラン
ザクション業務が、第1の計算機100で発生した障害
により運用系での業務の継続が不可能な状態になった場
合、障害となったトランザクション業務の復旧を行い、
以降のトランザクション業務の運用を引き継ぎ実行する
代替系を持つ第2の計算機200と、さらに、運用系を
持つ計算機と代替系を持つ計算機との他に、1台以上の
第3の計算機300が接続されている構成のホットスタ
ンバイシステムであり、第1の計算機100において、
通常の業務運用中に運用系としてトランザクション業務
を実行するトランザクション業務処理手段101と、第
1の計算機100に障害が発生した場合、運用系での当
該トランザクション業務の継続が可能か否かを判定する
障害事象判定手段102と、障害事象判定手段102
が、運用系でのトランザクション業務の継続が不可能と
判定した場合、第2の計算機200に存在するトランザ
クション業務切り替え手段202に障害を通知し、トラ
ンザクション業務の切り替えを指示する障害通知手段1
03と、第2の計算機200において、障害通知手段1
03からトランザクション業務の切り替え指示を受け、
運用系で実行していたトランザクション業務の実行に必
要となるデータベースやジャーナルを含む全てのディス
ク装置やネットワーク等の外部装置を取り込み、そのト
ランザクション業務をロールバック復旧し、トランザク
ション業務の実行継続が可能な状態に復旧するトランザ
クション業務切り替え手段202と、トランザクション
業務の復旧後、以降のトランザクション業務を引き継ぎ
実行して運用を継続するトランザクション業務代替処理
手段201と、通常の運用中にバッチ業務を実行するバ
ッチ業務処理手段203と、第2の計算機200の業務
負荷を一定の監視時間間隔で監視し外部記憶装置500
に作成された業務負荷情報テーブル501に第2の計算
機200の業務負荷情報を記録する第1の業務負荷情報
監視手段204と、第1の計算機100で障害が発生し
トランザクション業務の実行が切り替えられ、トランザ
クション業務代替処理手段201でトランザクション業
務が再開された場合、第1の業務負荷情報監視手段20
4が第2の計算機200の業務負荷情報および第3の計
算機300の業務負荷情報を取得し、第2の計算機20
0の業務負荷が高くなったことを検知し、さらに第3の
計算機で業務負荷の低いもの300を特定し、第3の計
算機300にバッチ業務の切り替えを行うか否かを判定
するバッチ業務切り替え判定手段205と、第3の計算
機300にバッチ業務を切り替えると判定された場合、
第3の計算機300にバッチ業務を切り替えるように指
示するバッチ業務切り替え通知手段206と、第3の計
算機300において、第2の計算機200からバッチ業
務を切り替える第1のバッチ業務切り替え処理手段30
2と、切り替えられたバッチ業務を引き継ぎ、以降の実
行を継続する第1のバッチ業務代替処理手段301とを
備えたことを特徴とする。
In FIG. 1, the hot standby switching system of the present invention is a loosely coupled multiprocessor system in which three or more computers are connected in a channel and executes transaction business during normal business operation. When the first computer 100 in which the active system exists and the transactional business become unable to continue the business in the active system due to a failure that occurred in the first computer 100, Restore,
In addition to a second computer 200 having an alternative system that takes over the operation of the subsequent transaction work and a computer having an active system and a computer having an alternative system, one or more third computers 300 are connected. In the first computer 100, which is a hot standby system having a configured
When a failure occurs in the transaction business processing means 101 that executes transaction business as an active system and the first computer 100 during normal business operation, it is determined whether or not the transaction business can be continued in the active system. Failure event determination means 102 and failure event determination means 102
However, when it is determined that the transaction business in the active system cannot be continued, the failure notification means 1 for notifying the transaction business switching means 202 existing in the second computer 200 of the failure and instructing the switching of the transaction business 1
03 and the second computer 200, the failure notification means 1
03 received a transaction business switching instruction,
It is possible to import all external devices such as databases and journals including databases and journals that are required to execute the transaction work that was executed in the active system, roll back the transaction work, and continue executing the transaction work. Transaction business switching means 202 for recovering the state, transaction business alternative processing means 201 for succeeding and executing subsequent transaction business after recovery of the transaction business, and continuing operation, and batch business for executing batch business during normal operation The external storage device 500 monitors the work load of the processing unit 203 and the second computer 200 at regular monitoring time intervals.
The first work load information monitoring means 204 which records the work load information of the second computer 200 in the work load information table 501 created in the above, and the execution of the transaction work due to the failure in the first computer 100 are switched. When the transaction work is resumed by the transaction work alternative processing means 201, the first work load information monitoring means 20
4 acquires the work load information of the second computer 200 and the work load information of the third computer 300, and the second computer 20
Batch work switching that detects that the work load of 0 is high, further identifies the one with a low work load on the third computer 300, and determines whether to switch the batch work to the third computer 300 When it is determined that the batch operation is switched to the determination unit 205 and the third computer 300,
A batch job switching notification unit 206 for instructing the third computer 300 to switch the batch job, and a first batch job switching processing unit 30 for switching the batch job from the second computer 200 in the third computer 300.
2 and a first batch job alternative processing unit 301 that takes over the switched batch job and continues the subsequent execution.

【0025】このようにして、第1の計算機100が障
害になった場合、第1の計算機100で運用されていた
トランザクション業務が第2の計算機200に切り替え
られた際に、このことで、第2の計算機200の業務負
荷が第3の計算機300より極端に高くなることを防
ぎ、第2の計算機200で運用されていたバッチ業務を
第3の計算機300に切り替えて運用することで、各計
算機の業務負荷を平準化することを可能にする。
In this way, when the first computer 100 becomes a failure, when the transaction work being operated on the first computer 100 is switched to the second computer 200, this causes By preventing the work load of the second computer 200 from becoming extremely higher than that of the third computer 300, and switching the batch work that was being operated by the second computer 200 to the third computer 300 and operating it, It is possible to equalize the work load of.

【0026】[0026]

【発明の実施の形態】以下、本発明の実施の形態につい
て図面を参照して詳細に説明する。
BEST MODE FOR CARRYING OUT THE INVENTION Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.

【0027】[第1の実施の形態]図1を参照すると、
本発明の第1の実施の形態に係るホットスタンバイシス
テム切り替え制御方式は、通常の業務運用中にトランザ
クション業務を実行する運用系が存在する第1の計算機
100と、第1の計算機100において障害が発生して
運用系でのトランザクション業務の実行が不可能になっ
た場合に運用系からトランザクション業務を引き継ぎ実
行を継続する代替系が存在する第2の計算機200と、
運用系および代替系を含まない第3の計算機300と、
第1の計算機100,第2の計算機200および第3の
計算機300からそれぞれチャネル接続され、すべての
計算機から共有されている外部記憶装置500とから、
その主要部が構成されている。
[First Embodiment] Referring to FIG.
In the hot standby system switching control method according to the first embodiment of the present invention, there is a failure in the first computer 100 in which the active system that executes the transaction business is present during normal business operation, and in the first computer 100. A second computer 200 having an alternative system that takes over the transaction work from the active system and continues execution when the transaction work cannot be executed in the active system
A third computer 300 that does not include an active system and an alternative system,
From the external storage device 500 that is channel-connected from the first computer 100, the second computer 200, and the third computer 300, and is shared by all the computers,
Its main part is composed.

【0028】第1の計算機100は、運用系において通
常の業務運用中にトランザクション業務を実行するトラ
ンザクション業務処理手段101と、第1の計算機10
0に障害が発生した場合に運用系でのトランザクション
業務の運用継続が可能か否かを判定する障害事象判定手
段102と、障害事象判定手段102により運用系での
トランザクション業務の継続が不可能と判断された場合
に第2の計算機200に存在する代替系にトランザクシ
ョン業務の実行を切り替えるために第2の計算機200
のトランザクション業務切り替え手段202に障害を通
知する障害通知手段103とを含んで構成されている。
The first computer 100 is a transaction business processing means 101 for executing transaction business during normal business operation in an active system, and the first computer 10.
When a failure occurs in 0, the failure event determination means 102 for determining whether or not the transaction business operation in the active system can be continued, and the failure event determination means 102 make it impossible to continue the transaction business in the active system. In order to switch the execution of the transaction work to the alternative system existing in the second computer 200 when it is determined, the second computer 200
The failure notification means 103 for notifying a failure to the transaction work switching means 202 is included.

【0029】第2の計算機200は、障害通知手段10
3から障害の発生を通知され、トランザクション業務の
切り替え指示を受け、運用系で実行していた、トランザ
クション業務の実行に必要となるデータベースやジャー
ナルを含む全てのディスク装置を取り込み、さらに、障
害発生時に実行していたトランザクションをロールバッ
ク復旧し、以降のトランザクション業務の実行を継続可
能な状態に復旧するトランザクション業務切り替え手段
202と、トランザクション業務切り替え手段202が
トランザクション業務の切り替え処理が終了したときに
以降のトランザクション業務の運用を引き継ぎ実行する
トランザクション業務代替処理手段201と、通常の業
務運用中にバッチ業務を実行するバッチ業務処理手段2
03と、第2の計算機200の業務負荷を一定の監視時
間間隔で監視し外部記憶装置500に作成された業務負
荷情報テーブル501に第2の計算機200の業務負荷
情報として記録しておき、さらに、第1の計算機100
に障害が発生し第2の計算機200の代替系にトランザ
クション業務が切り替えられた場合、業務負荷情報テー
ブル501を参照し、トランザクション業務が切り替え
られた後の時点での第2の計算機200の業務負荷情報
および第3の計算機300の業務負荷情報を取得する第
1の業務負荷情報監視手段204と、第2の計算機20
0の業務負荷情報と第3の計算機300の業務負荷情報
とを比較し、第3の計算機300の方が負荷が低い場合
には当該バッチ業務を第3の計算機300に切り替える
ことを判断するバッチ業務切り替え判定手段205と、
バッチ業務を第3の計算機300に切り替える場合に第
3の計算機300にバッチ業務の切り替えを通知するバ
ッチ業務切り替え通知手段206とを含んで構成されて
いる。
The second computer 200 has a fault notifying means 10
3 is notified of the occurrence of a failure, receives an instruction to switch transactional work, imports all the disk devices that are running in the active system, including the databases and journals required for executing transactional work, and when a failure occurs The transaction transaction switching unit 202 that rolls back the transaction that has been executed and recovers the subsequent transaction transaction to a state in which the transaction transaction can be continued, and the transaction transaction switching unit 202 that is used when the transaction transaction switching process ends. Transaction business alternative processing means 201 for taking over the operation of transaction business and batch business processing means 2 for executing batch business during normal business operation
03 and the work load of the second computer 200 are monitored at regular monitoring time intervals and recorded as work load information of the second computer 200 in the work load information table 501 created in the external storage device 500. , The first computer 100
When a transaction has been switched to the alternative system of the second computer 200 due to a failure in the second computer 200, the workload of the second computer 200 at the time after the transaction is switched by referring to the workload information table 501. Information and a work load information of the third computer 300, the first work load information monitoring means 204, and the second computer 20.
A batch that compares the work load information of 0 and the work load information of the third computer 300, and determines that the batch work is to be switched to the third computer 300 when the load of the third computer 300 is lower. Business switching determination means 205,
When the batch job is switched to the third computer 300, the batch job switching notifying unit 206 for notifying the third computer 300 of the switching of the batch job is included.

【0030】第3の計算機300は、第3の計算機30
0の業務負荷を一定の監視時間間隔で監視し外部記憶装
置500に作成された業務負荷情報テーブル501に第
3の計算機300の業務負荷情報を記録しておく第2の
業務負荷情報監視手段303と、第2の計算機200の
バッチ業務切り替え通知手段206からバッチ業務の切
り替えを通知された場合に第3の計算機300へのバッ
チ業務の切り替え処理を行う第1のバッチ業務切り替え
処理手段302と、第1のバッチ業務切り替え処理手段
302により切り替えられたバッチ業務を引き継ぎ以降
のバッチ業務の実行を継続する第1のバッチ業務代替処
理手段301とを含んで構成されている。
The third computer 300 is the third computer 30.
A second work load information monitoring unit 303 which monitors the work load of 0 at a constant monitoring time interval and records the work load information of the third computer 300 in the work load information table 501 created in the external storage device 500. And a first batch job switching processing means 302 for switching the batch job to the third computer 300 when the batch job switching notifying means 206 of the second computer 200 notifies the batch job switching. It is configured to include a first batch job alternative processing unit 301 that continues execution of the batch job after taking over the batch job switched by the first batch job switching processing unit 302.

【0031】外部記憶装置500は、第2の計算機20
0の業務負荷情報および第3の計算機300の業務負荷
情報を情報採取時刻と対応させて記録している業務負荷
情報テーブル501を含んで構成されている。
The external storage device 500 is the second computer 20.
The work load information table 501 records the work load information of 0 and the work load information of the third computer 300 in association with the information collection time.

【0032】これらの手段は、それぞれ概略つぎのよう
に動作する。
Each of these means operates roughly as follows.

【0033】トランザクション業務処理手段101は、
通常の業務運用中、トランザクション業務を実行する。
The transaction business processing means 101 is
Execute transaction business during normal business operation.

【0034】障害事象判定手段102は、第1の計算機
100本体で障害が発生した場合に障害を検出し、第1
の計算機100でのトランザクション業務の運用継続が
可能か否かを判定し、可能でないと判断した場合に障害
通知手段103に通知する。
The fault event judging means 102 detects a fault when a fault occurs in the main body of the first computer 100, and
It is determined whether or not it is possible to continue the operation of the transaction work on the computer 100, and when it is determined that the operation cannot be continued, the failure notification unit 103 is notified.

【0035】障害通知手段103は、障害事象判定手段
102から通知を受けた場合、代替系が存在する第2の
計算機200のトランザクション業務切り替え手段20
2にトランザクション業務の代替系への切り替えを指示
する。
When the failure notification means 103 receives the notification from the failure event determination means 102, the transaction work switching means 20 of the second computer 200 in which the alternate system exists.
Instruct 2 to switch the transaction work to the alternative system.

【0036】トランザクション業務切り替え手段202
は、障害通知手段103からトランザクション業務の切
り替え指示を受信し、第1の計算機100のトランザク
ション業務処理手段101が実行中であったトランザク
ションをロールバック復旧し、以降のトランザクション
業務の運用を再開できるようにする。
Transaction work switching means 202
Receives a transaction business switching instruction from the failure notifying means 103, rolls back the transaction being executed by the transaction business processing means 101 of the first computer 100, and resumes the operation of the subsequent transaction business. To

【0037】トランザクション業務代替処理手段201
は、トランザクション業務切り替え手段202がトラン
ザクション業務の復旧を終了したことを受け、以降のト
ランザクション業務を再開する。
Transaction business alternative processing means 201
Receives the completion of the recovery of the transaction work by the transaction work switching means 202 and restarts the subsequent transaction work.

【0038】バッチ業務処理手段203は、通常の業務
運用中に第2の計算機200においてバッチ業務を実行
する。
The batch job processing means 203 executes a batch job in the second computer 200 during normal business operation.

【0039】第1の業務負荷情報監視手段204は、第
2の計算機200の業務負荷を一定の監視時間間隔で監
視し外部記憶装置500に作成された業務負荷情報テー
ブル501に第2の計算機200の業務負荷情報として
記録しておき、さらに、第1の計算機100に障害が発
生し第2の計算機200の代替系にトランザクション業
務が切り替えられた場合、業務負荷情報テーブル501
を参照し第2の計算機200の業務負荷情報および第3
の計算機300の業務負荷情報を取得する。
The first work load information monitoring means 204 monitors the work load of the second computer 200 at a constant monitoring time interval, and stores the second work load information table 501 in the external storage device 500 in the second work computer 200. If the transaction work is switched to the alternative system of the second computer 200 due to a failure in the first computer 100, the work load information table 501
Refer to the workload information of the second computer 200 and the third
The work load information of the computer 300 is acquired.

【0040】バッチ業務切り替え判定手段205は、ト
ランザクション業務が代替系に切り替えられた場合、第
2の計算機200の業務負荷情報と第3の計算機300
の業務負荷情報とを比較し、第3の計算機300の方が
業務負荷が低い場合は、バッチ業務を第3の計算機30
0に切り替えることを判断する。
When the transaction work is switched to the alternative system, the batch work switching judging means 205 and the third computer 300 work load information of the second computer 200.
If the work load of the third computer 300 is lower than the work load information of the third computer 300, the batch work is compared with the third computer 30.
Determine to switch to 0.

【0041】バッチ業務切り替え通知手段206は、バ
ッチ業務切り替え判定手段205がバッチ業務を第3の
計算機300に切り替えることを判断した場合、第3の
計算機300へのバッチ業務の切り替えを指示する。
When the batch work switching judging means 205 judges that the batch work should be switched to the third computer 300, the batch work switching notifying means 206 gives an instruction to switch the batch work to the third computer 300.

【0042】第1のバッチ業務切り替え処理手段302
は、第2の計算機200のバッチ業務切り替え通知手段
206からバッチ業務の切り替えを指示された場合、バ
ッチ業務の切り替え処理を行う。
First batch job switching processing means 302
Performs a batch job switching process when the batch job switching notification unit 206 of the second computer 200 instructs the batch job switching.

【0043】第1のバッチ業務代替処理手段301は、
第3の計算機300に切り替えられたバッチ業務を引き
継ぎ以降のバッチ業務を継続して実行する。
The first batch job alternative processing means 301 is
The batch job switched to the third computer 300 is continued to execute the batch job after the succeeding batch job.

【0044】第2の業務負荷情報監視手段303は、第
1の業務負荷情報監視手段204と同様に、第3の計算
機300の業務負荷を一定の監視時間間隔で監視し外部
記憶装置500に作成された業務負荷情報テーブル50
1に第3の計算機300の業務負荷情報として記録し、
トランザクション業務が代替系に切り替えられた場合の
第1の業務負荷情報監視手段204による業務負荷情報
の参照に備える。
The second work load information monitoring means 303, like the first work load information monitoring means 204, monitors the work load of the third computer 300 at regular monitoring time intervals and creates it in the external storage device 500. Workload information table 50
1 is recorded as the work load information of the third computer 300,
In preparation for the reference of the work load information by the first work load information monitoring means 204 when the transaction work is switched to the alternative system.

【0045】図2は、外部記憶装置500に作成された
業務負荷情報テーブル501の内容を示している。時刻
t1,t2,t3,t4,…のそれぞれにおいて、第2
の計算機200の業務負荷情報は、第1の業務負荷情報
監視手段204により、それぞれp21,p22,p2
3,p24,…と記録されており、第3の計算機300
の業務負荷情報は、第2の業務負荷情報監視手段303
により、それぞれp31,p32,p33,p34,…
と記録されている。例えば、第1の業務負荷情報監視手
段204が、トランザクション業務の切り替え処理が終
了した時刻t4で取得する、第2の計算機200の業務
負荷情報はp24であり、第3の計算機300の業務負
荷情報はp34である。
FIG. 2 shows the contents of the work load information table 501 created in the external storage device 500. At each of times t1, t2, t3, t4, ...
The work load information of each computer 200 is p21, p22, p2 by the first work load information monitoring means 204, respectively.
3, p24, ..., The third computer 300 is recorded.
The work load information of the second work load information monitoring unit 303
, P31, p32, p33, p34, ...
Is recorded. For example, the work load information of the second computer 200, which is acquired by the first work load information monitoring unit 204 at the time t4 when the transaction work switching process ends, is p24, and the work load information of the third computer 300. Is p34.

【0046】図3(a)は、業務運用中における、第2
の計算機200のCPU(Central Proce
ssing Unit)の負荷状況等を業務負荷情報と
して管理する第1の業務負荷情報監視手段204の処理
を示している。この処理は、タイマセットステップA1
と、業務負荷情報取得ステップA2と、業務負荷情報記
録ステップA3とからなる。
FIG. 3 (a) shows the second operation during business operation.
CPU (Central Process) of the computer 200 of
The processing of the first work load information monitoring unit 204 that manages the load status of the (Singing Unit) as work load information is shown. This process is performed by the timer setting step A1.
And a work load information acquisition step A2 and a work load information recording step A3.

【0047】図3(b)は、業務運用中における、第3
の計算機300のCPUの負荷状況等を業務負荷情報と
して管理する第2の業務負荷情報監視手段303の処理
を示している。この処理は、タイマセットステップA4
と、業務負荷情報取得ステップA5と、業務負荷情報記
録ステップA6とからなる。
FIG. 3 (b) shows the third example during the business operation.
The processing of the second work load information monitoring means 303 that manages the load status of the CPU of the computer 300 as work load information is shown. This process is the timer setting step A4.
And a work load information acquisition step A5 and a work load information recording step A6.

【0048】図4は、第1の計算機100で障害が発生
した場合のトランザクション業務の切り替えの処理を示
している。この処理は、障害検出ステップB1と、運用
系トランザクション業務続行可否判定ステップB2と、
障害通知ステップB3と、切り替え指示ステップB4
と、切り替え処理ステップB5と、切り替え処理終了通
知ステップB6と、切り替え処理終了通知ステップB7
とからなる。
FIG. 4 shows the switching processing of transaction work when a failure occurs in the first computer 100. This process includes a failure detection step B1, an operational transaction work continuability determination step B2,
Failure notification step B3 and switching instruction step B4
Switching process step B5, switching process end notification step B6, and switching process end notification step B7
Consists of.

【0049】図5は、第1の計算機100に障害が発生
し第2の計算機200の代替系にトランザクション業務
が切り替えられた場合、第1の業務負荷情報監視手段2
04にトランザクション業務の切り替え処理が終了した
旨を通知された際の、第2の計算機200で実行されて
いるバッチ業務の切り替えの処理を示している。この処
理は、業務負荷情報取得ステップC1と、業務負荷情報
渡しステップC2と、バッチ業務切り替え必要判定ステ
ップC3と、バッチ業務切り替え通知ステップC4と、
バッチ業務切り替え指示ステップC5と、バッチ業務切
り替えステップC6とからなる。
FIG. 5 shows the first work load information monitoring means 2 when a failure occurs in the first computer 100 and the transaction work is switched to the alternative system of the second computer 200.
Reference numeral 04 denotes the batch job switching process executed by the second computer 200 when the fact that the transaction job switching process has been completed is notified. This process includes a work load information acquisition step C1, a work load information passing step C2, a batch work switching necessity determination step C3, a batch work switching notification step C4,
It comprises a batch job switching instruction step C5 and a batch job switching step C6.

【0050】次に、このように構成された第1の実施の
形態に係るホットスタンバイシステム切り替え制御方式
の動作について、図1,図2,図3,図4および図5を
参照して詳細に説明する。
Next, the operation of the hot standby system switching control system according to the first embodiment configured as described above will be described in detail with reference to FIGS. 1, 2, 3, 4, and 5. explain.

【0051】まず、第1の業務負荷情報監視手段204
は、第2の計算機200の業務負荷情報を取得する一定
の監視時間間隔を定めるためにタイマをセットする(ス
テップA1)。次に、ステップA1のタイマがタイムア
ウトとなると、第1の業務負荷情報監視手段204は、
その時刻における第2の計算機200の業務負荷情報を
取得する(ステップA2)。さらに、第1の業務負荷情
報監視手段204は、取得した第2の計算機200の業
務負荷情報および取得時刻情報を、外部記憶装置500
に作成された業務負荷情報テーブル501に記録する
(ステップA3)。
First, the first work load information monitoring means 204
Sets a timer to set a constant monitoring time interval for acquiring the work load information of the second computer 200 (step A1). Next, when the timer in step A1 times out, the first work load information monitoring means 204
The work load information of the second computer 200 at that time is acquired (step A2). Further, the first work load information monitoring means 204 stores the acquired work load information and acquisition time information of the second computer 200 in the external storage device 500.
It is recorded in the work load information table 501 created in step S3 (step A3).

【0052】一方、第2の業務負荷情報監視手段303
は、第1の業務負荷情報監視手段204と同様に、第3
の計算機300の業務負荷情報を取得する一定の監視時
間間隔を定めるためにタイマをセットする(ステップA
4)。次に、ステップA4のタイマがタイムアウトとな
ると、第2の業務負荷情報監視手段303は、その時刻
における第3の計算機300の業務負荷情報を取得する
(ステップA5)。さらに、第2の業務負荷情報監視手
段303は、取得した第3の計算機300の業務負荷情
報および取得時刻情報を、外部記憶装置500に作成さ
れた業務負荷情報テーブル501に記録する(ステップ
A6)。
On the other hand, the second work load information monitoring means 303
Is similar to the first work load information monitoring means 204 and is the third
A timer is set to set a constant monitoring time interval for acquiring the work load information of the computer 300 (step A)
4). Next, when the timer of step A4 times out, the second work load information monitoring means 303 acquires the work load information of the third computer 300 at that time (step A5). Further, the second work load information monitoring unit 303 records the acquired work load information and acquisition time information of the third computer 300 in the work load information table 501 created in the external storage device 500 (step A6). .

【0053】第1の計算機100で障害が発生すると、
障害事象判定手段102は、障害を検出し(ステップB
1)、第1の計算機100の運用系で動作しているトラ
ンザクション業務が当該計算機上で継続して運用が可能
か否かを判断し(ステップB2)、第1の計算機100
での運用継続が不可能であると判断した場合、障害が発
生した旨を障害通知手段103に通知する(ステップB
3)。次に、当該通知を受けた障害通知手段103は、
第2の計算機200のトランザクション業務切り替え手
段202にトランザクション業務の切り替えを指示する
(ステップB4)。
When a failure occurs in the first computer 100,
The failure event determination means 102 detects a failure (step B
1), it is determined whether or not the transaction work running in the active system of the first computer 100 can be continuously operated on the computer (step B2), and the first computer 100
If it is determined that it is impossible to continue the operation in step S1, the failure notification means 103 is notified that a failure has occurred (step B
3). Next, the failure notification means 103 that has received the notification
The transaction business switching means 202 of the second computer 200 is instructed to switch the transaction business (step B4).

【0054】トランザクション業務の切り替え指示を受
けたトランザクション業務切り替え手段202は、第1
の計算機100で障害が発生した時点で実行中であった
トランザクションをロールバック復旧し、当該トランザ
クション業務を再実行し、以降のトランザクション業務
を引き継ぎ実行するための切り替え処理を行う(ステッ
プB5)。当該切り替え処理が終了すると、トランザク
ション業務切り替え手段202は、トランザクション業
務代替処理手段201に切り替え処理が終了した旨を通
知し(ステップB6)、第1の業務負荷情報監視手段2
04に切り替え処理が終了した旨を通知する(ステップ
B7)。切り替え処理が終了した旨を通知されたトラン
ザクション業務代替処理手段201は、以降のトランザ
クション業務の運用を代替系で引き継ぎ実行する。
The transaction work switching means 202 which has received the transaction work switching instruction
The transaction that was being executed at the time when the failure occurred in the computer 100 is rollback-restored, the transaction transaction is re-executed, and a switching process is executed to take over and execute the subsequent transaction transaction (step B5). When the switching process ends, the transaction work switching unit 202 notifies the transaction work alternative processing unit 201 that the switching process has ended (step B6), and the first work load information monitoring unit 2
04 is notified that the switching process is completed (step B7). The transaction work alternative processing means 201, which has been notified that the switching process has been completed, takes over the subsequent transaction work operation in the alternative system.

【0055】バッチ業務の切り替えでは、まず、第1の
業務負荷情報監視手段204は、業務負荷情報テーブル
501からトランザクション業務の切り替え処理が終了
した時刻での第2の計算機200の業務負荷情報および
第3の計算機300の業務負荷情報を取得し(ステップ
C1)、これら業務負荷情報をバッチ業務切り替え判定
手段205に渡す(ステップC2)。
In the switching of the batch work, first, the first work load information monitoring means 204 uses the work load information of the second computer 200 and the The work load information of the computer 300 of No. 3 is acquired (step C1), and the work load information is passed to the batch work switching determination means 205 (step C2).

【0056】バッチ業務切り替え判定手段205は、当
該業務負荷情報を参照し、第2の計算機200の業務負
荷が第3の計算機300の業務負荷より高く、その後の
業務運用が遅延または性能低下を発生させる可能性があ
るか否かを判断する(ステップC3)。第2の計算機2
00の業務負荷が高く、その後の業務運用が遅延または
性能低下を発生させる可能性があると判断した場合、バ
ッチ業務切り替え判定手段205は、バッチ業務の切り
替えが必要であると認識しバッチ業務切り替え通知手段
206に通知する(ステップC4)。
The batch work switching determination means 205 refers to the work load information, and the work load of the second computer 200 is higher than the work load of the third computer 300, and the subsequent work operation causes delay or performance degradation. It is determined whether or not there is a possibility (Step C3). Second computer 2
When it is determined that the work load of 00 is high and there is a possibility that the subsequent work operation may cause a delay or a performance degradation, the batch work switch determination unit 205 recognizes that the batch work needs to be switched, and switches the batch work. The notification means 206 is notified (step C4).

【0057】当該通知を受けたバッチ業務切り替え通知
手段206は、バッチ業務の切り替えを第3の計算機3
00の第1のバッチ業務切り替え処理手段302に指示
する(ステップC5)。
Receiving the notice, the batch job switching notifying means 206 switches the batch job by the third computer 3.
00 to the first batch job switching processing means 302 (step C5).

【0058】第1のバッチ業務切り替え処理手段302
は、バッチ業務の切り替えの指示を受けると、バッチ業
務処理手段203で実行されていたバッチ業務を第1の
バッチ業務代替処理手段301に引き継ぐための切り替
え処理を行う(ステップC6)。
First batch job switching processing means 302
When receiving the instruction to switch the batch job, the CPU performs a switching process for handing over the batch job being executed by the batch job processing means 203 to the first batch job substitute processing means 301 (step C6).

【0059】当該切り替え処理が終了すると、第1のバ
ッチ業務代替処理手段301は、バッチ業務を再開し以
降のバッチ業務を引き継ぎ実行する。
When the switching process is completed, the first batch job alternative processing means 301 restarts the batch job and succeeds and executes the subsequent batch jobs.

【0060】このように、第1の実施の形態によれば、
運用系を持つ計算機および代替系を持つ計算機の他に、
1台の計算機が接続されている構成のホットスタンバイ
システムにおいて、運用系を持つ計算機で障害が発生
し、運用系でのトランザクション業務の運用の続行が不
可能になった場合、代替系において当該トランザクショ
ン業務の復旧を行い該トランザクション業務の運用継続
を行うとともに、トランザクション業務を代替系に切り
替えて実行することにより、代替系を持つ計算機の業務
負荷が高くなった場合に、代替系を持つ計算機で実行さ
れているバッチ業務を、他の計算機に切り替えて実行す
ることにより、疎結合マルチプロセッサシステムに関し
て、各計算機における業務の業務負荷を平準化でき業務
の遅延や性能低下を防止することができる。その理由
は、代替系を持つ計算機と他の計算機とにおいて、CP
U負荷状況等の業務負荷の状態を監視し、トランザクシ
ョン業務を代替系に切り替えた際に代替系を持つ計算機
の業務負荷が高くなった場合、代替系を持つ計算機で実
行されているバッチ業務を他の計算機に切り替えて実行
するためである。
As described above, according to the first embodiment,
In addition to a computer with an active system and a computer with an alternative system,
In a hot standby system with one computer connected, if a computer with an active system fails and it becomes impossible to continue transaction business operations in the active system, the transaction in the alternate system When the business load of a computer with an alternative system becomes high by executing the transaction recovery and continuing the operation of the transaction business and switching and executing the transaction business By switching the executed batch operation to another computer and executing the same, it is possible to equalize the work load of the work in each computer in the loosely coupled multiprocessor system and prevent the work delay and performance deterioration. The reason is that the CP with the alternative computer and the other computer
If the workload of the computer with the alternate system becomes high when the transaction workload is monitored, such as the U load status, and the transaction workload is switched to the alternate system, the batch jobs executed on the computer with the alternate system will be executed. This is because it is executed by switching to another computer.

【0061】[第2の実施の形態]図6を参照すると、
本発明の第2の実施の形態に係るホットスタンバイシス
テム切り替え制御方式は、通常の業務運用中にトランザ
クション業務を実行する運用系が存在する第1の計算機
100と、第1の計算機100において障害が発生し、
運用系でのトランザクション業務の実行が不可能になっ
た場合、運用系からトランザクション業務を引き継ぎ実
行を継続する代替系が存在する第2の計算機200と、
運用系と代替系とを含まない2台の計算機である第3の
計算機300および第4の計算機400と、第1の計算
機100,第2の計算機200,第3の計算機300お
よび第4の計算機400からそれぞれ接続され、すべて
の計算機から共有されている外部記憶装置500とから
構成されている。
[Second Embodiment] Referring to FIG. 6,
In the hot standby system switching control method according to the second embodiment of the present invention, there is a failure in the first computer 100 in which the active system that executes transaction business exists during normal business operation, and in the first computer 100. Occurs,
A second computer 200 having an alternative system that takes over the transaction work from the active system and continues execution when the transaction work cannot be executed in the active system;
A third computer 300 and a fourth computer 400, which are two computers that do not include an active system and a substitute system, and a first computer 100, a second computer 200, a third computer 300, and a fourth computer. The external storage device 500 is connected to each of the computers 400 and shared by all computers.

【0062】第1の計算機100は、運用系において通
常の業務運用中にトランザクション業務を実行するトラ
ンザクション業務処理手段101と、第1の計算機10
0に障害が発生した場合に運用系でのトランザクション
業務の運用継続が可能か否かを判定する障害事象判定手
段102と、障害事象判定手段102により運用系での
トランザクション業務の継続が不可能と判断された場合
に第2の計算機200に存在する代替系にトランザクシ
ョン業務の実行を切り替えるために第2の計算機200
のトランザクション業務切り替え手段202に障害を通
知する障害通知手段103とを含んで構成されている。
The first computer 100 is a transaction business processing means 101 for executing transaction business during normal business operation in an active system, and the first computer 10.
When a failure occurs in 0, the failure event determination means 102 for determining whether or not the transaction business operation in the active system can be continued, and the failure event determination means 102 make it impossible to continue the transaction business in the active system. In order to switch the execution of the transaction work to the alternative system existing in the second computer 200 when it is determined, the second computer 200
The failure notification means 103 for notifying a failure to the transaction work switching means 202 is included.

【0063】第2の計算機200は、障害通知手段10
3から障害の発生を通知され、トランザクション業務の
切り替え指示を受けて運用系で実行していたトランザク
ション業務の実行に必要となるデータベースやジャーナ
ルを含む全てのディスク装置を取り込み、さらに障害発
生時に実行していたトランザクションをロールバック復
旧して以降のトランザクション業務の実行を継続可能な
状態に復旧するトランザクション業務切り替え手段20
2と、トランザクション業務切り替え手段202がトラ
ンザクション業務の切り替え処理を終了すると、以降の
トランザクション業務の運用を引き継ぎ実行するトラン
ザクション業務代替処理手段201と、通常の業務運用
中にバッチ業務を実行するバッチ業務処理手段203
と、第2の計算機200の業務負荷を一定の監視時間間
隔で監視し外部記憶装置500に作成された業務負荷情
報テーブル501に第2の計算機200の業務負荷情報
として記録しておき、さらに、第1の計算機100に障
害が発生し第2の計算機200の代替系にトランザクシ
ョン業務が切り替えられた場合に業務負荷情報テーブル
501を参照し、トランザクション業務が切り替えられ
た後の時刻での第2の計算機200の業務負荷情報,第
3の計算機300の業務負荷情報および第4の計算機4
00の業務負荷情報を取得する第1の業務負荷情報監視
手段204と、第2の計算機200の業務負荷情報,第
3の計算機300の業務負荷情報および第4の計算機4
00の業務負荷情報を比較し、第2の計算機200より
第3の計算機300または第4の計算機400の方が負
荷が低い場合は、当該バッチ業務を第3の計算機300
または第4の計算機400に切り替えることを判断する
バッチ業務切り替え判定手段205と、バッチ業務を第
3の計算機300または第4の計算機400に切り替え
る際、第3の計算機300または第4の計算機400に
バッチ業務の切り替えを通知するバッチ業務切り替え通
知手段206とを含んで構成されている。
The second computer 200 has the fault notifying means 10
3 is notified of the occurrence of a failure, receives a transaction operation switching instruction, imports all the disk devices including the databases and journals that are required to execute the transaction operation executed in the active system, and executes them when an error occurs. Transaction business switching means 20 that rolls back and recovers the existing transaction to a state in which the execution of subsequent transaction business can be continued.
2, and when the transaction work switching unit 202 completes the transaction work switching process, the transaction work alternative processing unit 201 that takes over the operation of the subsequent transaction work, and the batch work process that executes the batch work during normal business operation Means 203
And the work load of the second computer 200 is monitored at regular monitoring time intervals and recorded in the work load information table 501 created in the external storage device 500 as the work load information of the second computer 200. When a failure occurs in the first computer 100 and the transaction work is switched to the alternative system of the second computer 200, the work load information table 501 is referred to, and the second time is set after the transaction work is switched. Workload information of computer 200, workload information of third computer 300 and fourth computer 4
First work load information monitoring means 204 for acquiring work load information of 00, work load information of the second computer 200, work load information of the third computer 300, and fourth work computer 4
00, and when the load of the third computer 300 or the fourth computer 400 is lower than that of the second computer 200, the batch work is compared to the third computer 300.
Alternatively, the batch job switching determination unit 205 that determines to switch to the fourth computer 400 and the third computer 300 or the fourth computer 400 when switching the batch job to the third computer 300 or the fourth computer 400. It is configured to include a batch job switching notification unit 206 for notifying switching of batch jobs.

【0064】第3の計算機300は、第3の計算機30
0の業務負荷を一定の監視時間間隔で監視し外部記憶装
置500に作成された業務負荷情報テーブル501に業
務負荷情報を記録しておく第2の業務負荷情報監視手段
303と、第2の計算機200のバッチ業務切り替え通
知手段206からバッチ業務の切り替えを通知された場
合、第3の計算機300へのバッチ業務の切り替え処理
を行う第1のバッチ業務切り替え処理手段302と、第
1のバッチ業務切り替え処理手段302により切り替え
られたバッチ業務を引き継ぎ以降のバッチ業務の運用を
継続する第1のバッチ業務代替処理手段301とを含ん
で構成されている。
The third computer 300 is the third computer 30.
A second work load information monitoring means 303 for monitoring the work load of 0 at constant monitoring time intervals and recording the work load information in the work load information table 501 created in the external storage device 500; and a second computer. When the batch job switching notifying means 206 of 200 notifies the batch job switching, the first batch job switching processing means 302 for performing the batch job switching processing to the third computer 300, and the first batch job switching It is configured to include a first batch job alternative processing means 301 for continuing the operation of the batch job after taking over the batch job switched by the processing means 302.

【0065】第4の計算機400は、第3の計算機30
0と同様に、第4の計算機400の業務負荷を一定の監
視時間間隔で監視し外部記憶装置500に作成された業
務負荷情報テーブル501に業務負荷情報を記録してお
く第3の業務負荷情報監視手段403と、第2の計算機
200のバッチ業務切り替え通知手段206からバッチ
業務の切り替えを通知された場合、第4の計算機400
へのバッチ業務の切り替え処理を行う第2のバッチ業務
切り替え処理手段402と、第2のバッチ業務切り替え
処理手段402により切り替えられたバッチ業務を引き
継ぎ以降のバッチ業務の運用を継続する第2のバッチ業
務代替処理手段401とを含んで構成されている。
The fourth computer 400 is the third computer 30.
Similarly to 0, the third work load information in which the work load of the fourth computer 400 is monitored at constant monitoring time intervals and the work load information is recorded in the work load information table 501 created in the external storage device 500. When the monitoring means 403 and the batch work switching notifying means 206 of the second computer 200 are notified of the batch work switching, the fourth computer 400
Second batch job switching processing unit 402 that performs batch job switching processing to the second batch job, and a second batch that continues operation of the batch job that has been switched over by the second batch job switching processing unit 402 The work substitute processing means 401 is included.

【0066】外部記憶装置500は、第2の計算機20
0の業務負荷情報,第3の計算機300の業務負荷情報
および第4の計算機400の業務負荷情報を、情報採取
時刻と対応させて記録している業務負荷情報テーブル5
01を含んで構成されている。
The external storage device 500 is the second computer 20.
A work load information table 5 in which the work load information of 0, the work load information of the third computer 300, and the work load information of the fourth computer 400 are recorded in association with the information collection time.
01 is included.

【0067】これらの手段は、それぞれ概略つぎのよう
な機能を有する。
Each of these means has the following functions.

【0068】トランザクション業務処理手段101は、
通常の業務運用中に、トランザクション業務を実行す
る。
The transaction business processing means 101 is
Execute transaction business during normal business operation.

【0069】障害事象判定手段102は、第1の計算機
100本体で障害が発生した場合、障害を検出し、第1
の計算機100でのトランザクション業務の運用継続が
可能か否かを判定し、可能でないと判断した場合に障害
通知手段103に通知する。
When a failure occurs in the first computer 100 main body, the failure event determination means 102 detects the failure and
It is determined whether or not it is possible to continue the operation of the transaction work on the computer 100, and when it is determined that the operation cannot be continued, the failure notification unit 103 is notified.

【0070】障害通知手段103は、障害事象判定手段
102から通知を受けた場合、代替系が存在する第2の
計算機200のトランザクション業務切り替え手段20
2にトランザクション業務の代替系への切り替えを指示
する。
When the failure notification means 103 receives the notification from the failure event determination means 102, the transaction work switching means 20 of the second computer 200 in which the alternate system exists.
Instruct 2 to switch the transaction work to the alternative system.

【0071】トランザクション業務切り替え手段202
は、障害通知手段103からトランザクション業務の切
り替えの指示を受信し、第1の計算機100のトランザ
クション業務が実行中であったトランザクションをロー
ルバック復旧し、以降のトランザクション業務の運用を
再開することができるようにする。
Transaction business switching means 202
Can receive an instruction for switching transactional work from the failure notifying unit 103, roll back the transaction in which the transactional work of the first computer 100 was being executed, and resume the operation of the subsequent transactional work. To do so.

【0072】トランザクション業務代替処理手段201
は、トランザクション業務切り替え手段202がトラン
ザクション業務の復旧を終了したことを受け、以降のト
ランザクション業務を再開する。
Transaction business alternative processing means 201
Receives the completion of the recovery of the transaction work by the transaction work switching means 202 and restarts the subsequent transaction work.

【0073】バッチ業務処理手段203は、通常の業務
運用中に第2の計算機200においてバッチ業務を実行
する。
The batch job processing means 203 executes the batch job in the second computer 200 during normal business operation.

【0074】第1の業務負荷情報監視手段204は、第
2の計算機200の業務負荷を一定の監視時間間隔で監
視し外部記憶装置500に作成された業務負荷情報テー
ブル501に業務負荷情報として記録しておき、さら
に、第1の計算機100に障害が発生し第2の計算機2
00の代替系にトランザクション業務が切り替えられた
場合、業務負荷情報テーブル501を参照し第2の計算
機200の業務負荷情報,第3の計算機300の業務負
荷情報および第4の計算機400の業務負荷情報を取得
する。
The first work load information monitoring means 204 monitors the work load of the second computer 200 at regular monitoring time intervals and records it as work load information in the work load information table 501 created in the external storage device 500. In addition, if a failure occurs in the first computer 100 and the second computer 2
When the transaction work is switched to the alternative system of 00, the work load information table 501 is referred to, the work load information of the second computer 200, the work load information of the third computer 300, and the work load information of the fourth computer 400. To get.

【0075】バッチ業務切り替え判定手段205は、ト
ランザクション業務が代替系に切り替えられた場合、第
2の計算機200の業務負荷情報,第3の計算機300
の業務負荷情報および第4の計算機400の業務負荷情
報を比較し、第2の計算機200より第3の計算機30
0または第4の計算機400の方が負荷が低い場合は、
当該バッチ業務を第3の計算機300または第4の計算
機400に切り替えることを判断する。
When the transaction work is switched to the alternative system, the batch work switching determination means 205 determines the work load information of the second computer 200 and the third computer 300.
Of the workload information of the fourth computer 400 and the workload information of the fourth computer 400, and the second computer 200 to the third computer 30
If the load of 0 or the fourth computer 400 is lower,
It is determined to switch the batch job to the third computer 300 or the fourth computer 400.

【0076】バッチ業務切り替え通知手段206は、バ
ッチ業務切り替え判定手段205によりバッチ業務を第
3の計算機300に切り替えることが判断された場合
は、第3の計算機300にバッチ業務の切り替えを通知
し、バッチ業務を第4の計算機400に切り替えること
が判断された場合は、第4の計算機400にバッチ業務
の切り替えを通知する。
When the batch work switching judging means 205 judges that the batch work should be switched to the third computer 300, the batch work switching notifying means 206 notifies the third computer 300 of the batch work switching, When it is determined to switch the batch job to the fourth computer 400, the fourth computer 400 is notified of the batch job switch.

【0077】第1のバッチ業務切り替え処理手段302
は、第2の計算機200のバッチ業務切り替え通知手段
206からバッチ業務の切り替えを通知された場合、バ
ッチ業務の切り替え処理を行う。
First batch job switching processing means 302
Performs the batch job switching process when notified of the batch job switching from the batch job switching notifying unit 206 of the second computer 200.

【0078】第1のバッチ業務代替処理手段301は、
第3の計算機300に切り替わったバッチ業務を引き継
ぎ以降のバッチ業務を継続して実行する。
The first batch job alternative processing means 301 is
The batch job switched to the third computer 300 is continuously taken over and the subsequent batch jobs are executed.

【0079】第2の業務負荷情報監視手段303は、第
1の業務負荷情報監視手段204と同様に、第3の計算
機300の業務負荷を一定の監視時間間隔で監視し外部
記憶装置500に作成された業務負荷情報テーブル50
1に業務負荷情報を記録し、トランザクション業務が代
替系に切り替えられた場合の第1の業務負荷情報監視手
段204による業務負荷情報の参照に備える。
The second work load information monitoring means 303, like the first work load information monitoring means 204, monitors the work load of the third computer 300 at regular monitoring time intervals and creates it in the external storage device 500. Workload information table 50
The work load information is recorded in No. 1 to prepare for reference of the work load information by the first work load information monitoring means 204 when the transaction work is switched to the alternative system.

【0080】第2のバッチ業務切り替え処理手段402
は、第1のバッチ業務切り替え処理手段302と同様
に、第2の計算機200のバッチ業務切り替え通知手段
206からバッチ業務の切り替えを通知された場合、バ
ッチ業務の切り替え処理を行う。
Second batch job switching processing means 402
Similarly to the first batch job switching processing unit 302, when the batch job switching notifying unit 206 of the second computer 200 notifies the batch job switching, the batch job switching process is performed.

【0081】第2のバッチ業務代替処理手段401は、
第4の計算機400に切り替わったバッチ業務を引き継
ぎ以降のバッチ業務を継続して実行する。
The second batch job alternative processing means 401 is
The batch job after switching to the fourth computer 400 is continuously executed.

【0082】第3の業務負荷情報監視手段403は、第
1の業務負荷情報監視手段204および第2の業務負荷
情報監視手段303と同様に、第4の計算機400の業
務負荷を一定の監視時間間隔で監視し外部記憶装置50
0に作成された業務負荷情報テーブル501に第4の計
算機400の業務負荷情報を記録し、トランザクション
業務が代替系に切り替えられた場合の第1の業務負荷情
報監視手段204による業務負荷情報の参照に備える。
The third work load information monitoring means 403, like the first work load information monitoring means 204 and the second work load information monitoring means 303, monitors the work load of the fourth computer 400 for a certain monitoring time. External storage device 50 monitored at intervals
The work load information of the fourth computer 400 is recorded in the work load information table 501 created in 0, and the reference of the work load information by the first work load information monitoring means 204 when the transaction work is switched to the alternative system Prepare for

【0083】図7は、外部記憶装置500に作成された
業務負荷情報テーブル501の内容を示している。時刻
t1,t2,t3,t4,…のそれぞれにおいて、第2
の計算機200の業務負荷情報は、第1の業務負荷情報
監視手段204により、それぞれp21,p22,p2
3,p24,…と記録されており、第3の計算機300
の業務負荷情報は、第2の業務負荷情報監視手段303
により、それぞれp31,p32,p33,p34,…
と記録されており、第4の計算機の業務負荷情報は、第
3の業務負荷情報監視手段403により、それぞれp4
1,p42,p43,p44,…と記録されている。例
えば、第1の業務負荷情報監視手段204が、トランザ
クション業務の切り替え処理が終了した時刻t4で取得
する、第2の計算機200の業務負荷情報はp24であ
り、第3の計算機300の業務負荷情報はp34であ
り、第4の計算機400の業務負荷情報はp44であ
る。
FIG. 7 shows the contents of the work load information table 501 created in the external storage device 500. At each of times t1, t2, t3, t4, ...
The work load information of each computer 200 is p21, p22, p2 by the first work load information monitoring means 204, respectively.
3, p24, ..., The third computer 300 is recorded.
The work load information of the second work load information monitoring unit 303
, P31, p32, p33, p34, ...
The work load information of the fourth computer is p4 by the third work load information monitoring means 403.
It is recorded as 1, p42, p43, p44, .... For example, the work load information of the second computer 200, which is acquired by the first work load information monitoring unit 204 at the time t4 when the transaction work switching process ends, is p24, and the work load information of the third computer 300. Is p34, and the work load information of the fourth computer 400 is p44.

【0084】図8(a)は、業務運用中における、第2
の計算機200のCPUの負荷状況等を業務負荷情報と
して管理する第1の業務負荷情報監視手段204の処理
を示している。この処理は、タイマセットステップD1
と、業務負荷情報取得ステップD2と、業務負荷情報記
録ステップD3とからなる。
FIG. 8A shows the second status during the business operation.
The processing of the first work load information monitoring means 204 for managing the load status of the CPU of the computer 200 as work load information is shown. This process is performed by the timer setting step D1.
And a work load information acquisition step D2 and a work load information recording step D3.

【0085】図8(b)は、業務運用中における、第3
の計算機300のCPUの負荷状況等を業務負荷情報と
して管理する第2の業務負荷情報監視手段303の処理
を示している。この処理は、タイマセットステップD4
と、業務負荷情報取得ステップD5と、業務負荷情報記
録ステップD6とからなる。
FIG. 8 (b) shows the third status during business operation.
The processing of the second work load information monitoring means 303 that manages the load status of the CPU of the computer 300 as work load information is shown. This process is the timer setting step D4.
And a work load information acquisition step D5 and a work load information recording step D6.

【0086】図8(c)は、業務運用中における、第4
の計算機400のCPUの負荷状況等を業務負荷情報と
して管理する第3の業務負荷情報監視手段403の処理
を示している。この処理は、タイマセットステップD7
と、業務負荷情報取得ステップD8と、業務負荷情報記
録ステップD9とからなる。
FIG. 8C shows the fourth line during the business operation.
The processing of the third work load information monitoring means 403 for managing the load status of the CPU of the computer 400 as work load information is shown. This process is performed by the timer setting step D7.
And a work load information acquisition step D8 and a work load information recording step D9.

【0087】図9は、第1の計算機100に障害が発生
し第2の計算機200の代替系にトランザクション業務
が切り替えられた場合、第1の業務負荷情報監視手段2
04にトランザクション業務の切り替え処理が終了した
旨が通知された際の、第2の計算機200で実行されて
いるバッチ業務の切り替えの処理を示している。この処
理は、業務負荷情報取得ステップE1と、業務負荷情報
渡しステップE2と、バッチ業務切り替え必要判定ステ
ップE3と、バッチ業務切り替え通知ステップE4と、
バッチ業務切り替え指示ステップE5と、バッチ業務切
り替えステップE6とからなる。
FIG. 9 shows the first work load information monitoring means 2 when the transaction work is switched to the alternative system of the second computer 200 due to the failure of the first computer 100.
Reference numeral 04 indicates the batch job switching processing executed by the second computer 200 when the fact that the transaction job switching processing has been completed is notified. This process includes a work load information acquisition step E1, a work load information passing step E2, a batch work switching necessity determination step E3, a batch work switching notification step E4,
It comprises a batch job switching instruction step E5 and a batch job switching step E6.

【0088】次に、このように構成された第2の実施の
形態に係るホットスタンバイシステム切り替え制御方式
の動作について、図6,図7,図8および図9を参照し
て詳細に説明する。
Next, the operation of the hot standby system switching control system according to the second embodiment configured as described above will be described in detail with reference to FIGS. 6, 7, 8 and 9.

【0089】まず、第1の業務負荷情報監視手段204
は、第2の計算機200の業務負荷情報を取得する一定
の監視時間間隔を定めるためにタイマをセットする(ス
テップD1)。次に、ステップD1のタイマがタイムア
ウトとなると、第1の業務負荷情報監視手段204は、
その時刻における第2の計算機200の業務負荷情報を
取得する(ステップD2)。さらに、第1の業務負荷情
報監視手段204は、取得した第2の計算機200の業
務負荷情報および取得時刻情報を、外部記憶装置500
に作成された業務負荷情報テーブル501に記録する
(ステップD3)。
First, the first work load information monitoring means 204
Sets a timer to set a constant monitoring time interval for acquiring the work load information of the second computer 200 (step D1). Next, when the timer of step D1 times out, the first work load information monitoring means 204
The work load information of the second computer 200 at that time is acquired (step D2). Further, the first work load information monitoring means 204 stores the acquired work load information and acquisition time information of the second computer 200 in the external storage device 500.
It is recorded in the work load information table 501 created in step S3 (step D3).

【0090】一方、第2の業務負荷情報監視手段303
は、第1の業務負荷情報監視手段204と同様に、第3
の計算機300の業務負荷情報を取得する一定の監視時
間間隔を定めるためにタイマをセットする(ステップD
4)。次に、ステップD4のタイマがタイムアウトとな
ると、第2の業務負荷情報監視手段303は、その時刻
における第3の計算機300の業務負荷情報を取得する
(ステップD5)。さらに、第2の業務負荷情報監視手
段303は、取得した第3の計算機300の業務負荷情
報および取得時刻情報を、外部記憶装置500に作成さ
れた業務負荷情報テーブル501に記録する(ステップ
D6)。
On the other hand, the second work load information monitoring means 303
Is similar to the first work load information monitoring means 204 and is the third
A timer to set a constant monitoring time interval for acquiring the workload information of the computer 300 (step D)
4). Next, when the timer of step D4 times out, the second work load information monitoring means 303 acquires the work load information of the third computer 300 at that time (step D5). Further, the second work load information monitoring means 303 records the acquired work load information and acquisition time information of the third computer 300 in the work load information table 501 created in the external storage device 500 (step D6). .

【0091】また、第3の業務負荷情報監視手段403
は、第1の業務負荷情報監視手段204および第2の業
務負荷情報監視手段303と同様に、第4の計算機40
0の業務負荷情報を取得する一定の監視時間間隔を定め
るためにタイマをセットする(ステップD7)。次に、
ステップD7のタイマがタイムアウトとなると、第3の
業務負荷情報監視手段403は、その時刻における第4
の計算機400の業務負荷情報を取得する(ステップD
8)。さらに、第3の業務負荷情報監視手段403は、
取得した第4の計算機400の業務負荷情報および取得
時刻情報を、外部記憶装置500に作成された業務負荷
情報テーブル501に記録する(ステップD9)。
The third work load information monitoring means 403
Is the same as the first work load information monitoring unit 204 and the second work load information monitoring unit 303, the fourth computer 40.
A timer is set in order to set a constant monitoring time interval for acquiring the work load information of 0 (step D7). next,
When the timer in step D7 times out, the third work load information monitoring means 403 causes the third work load information monitoring means 403 to perform the fourth operation at that time.
The workload information of the computer 400 of the above (Step D
8). Furthermore, the third work load information monitoring means 403
The acquired work load information and acquisition time information of the fourth computer 400 are recorded in the work load information table 501 created in the external storage device 500 (step D9).

【0092】第1の計算機100で障害が発生した場合
のトランザクション業務の切り替えの動作は第1の実施
の形態と同じであり、図4を参照しながら説明した第1
の実施の形態における動作の説明をもって、その詳しい
動作の説明を省略する。
The operation of switching the transaction work when a failure occurs in the first computer 100 is the same as that of the first embodiment, and the first operation described with reference to FIG.
The detailed description of the operation will be omitted after the description of the operation in the embodiment.

【0093】バッチ業務の切り替えでは、まず、第1の
業務負荷情報監視手段204は、業務負荷情報テーブル
501からトランザクション業務の切り替え処理が終了
した時刻での第2の計算機200の業務負荷情報,第3
の計算機300の業務負荷情報および第4の計算機40
0の業務負荷情報を取得し(ステップE1)、これら業
務負荷情報をバッチ業務切り替え判定手段205に渡す
(ステップE2)。
In the switching of batch work, first, the first work load information monitoring means 204 uses the work load information table 501 to check the work load information of the second computer 200 at the time when the transaction work switching process is completed. Three
Workload information of the computer 300 and the fourth computer 40
The work load information of 0 is acquired (step E1), and the work load information is passed to the batch work switching determination means 205 (step E2).

【0094】バッチ業務切り替え判定手段205は、当
該業務負荷情報を参照し、第2の計算機200の業務負
荷が第3の計算機300の業務負荷または第4の計算機
400の業務負荷と比較して高く、その後の業務運用が
遅延または性能低下を発生させる可能性があるか否かを
判断する(ステップE3)。さらに、バッチ業務切り替
え判定手段205は、第2の計算機200の業務負荷が
高く、その後の業務運用が遅延または性能低下を発生さ
せる可能性があると判断した場合、第3の計算機300
の業務負荷と第4の計算機400の業務負荷とを比較し
業務負荷が低い方の計算機にバッチ業務を切り替えるこ
とをバッチ業務切り替え通知手段206に通知する(ス
テップE4)。
The batch work switching determination means 205 refers to the work load information, and the work load of the second computer 200 is higher than the work load of the third computer 300 or the work load of the fourth computer 400. Then, it is determined whether or not the subsequent business operation may cause delay or performance degradation (step E3). Furthermore, when the batch work switching determination unit 205 determines that the work load of the second computer 200 is high and there is a possibility that the subsequent work operation will cause delay or performance degradation, the third computer 300
And the workload of the fourth computer 400 are compared, and the batch task switching notifying means 206 is notified that the batch task is switched to the computer with the lower task load (step E4).

【0095】当該通知を受けたバッチ業務切り替え通知
手段206は、第3の計算機300にバッチ業務を切り
替える場合、第3の計算機300の第1のバッチ業務切
り替え処理手段302にバッチ業務の切り替えを指示
し、第4の計算機400にバッチ業務を切り替える場
合、第4の計算機400の第2のバッチ業務切り替え処
理手段402に、バッチ業務の切り替えを指示する(ス
テップE5)。
Upon receiving the notification, the batch job switching notifying means 206 instructs the first batch job switching processing means 302 of the third computer 300 to switch the batch job when switching the batch job to the third computer 300. Then, when the batch job is switched to the fourth computer 400, the second batch job switching processing unit 402 of the fourth computer 400 is instructed to switch the batch job (step E5).

【0096】第1のバッチ業務切り替え処理手段302
または第2のバッチ業務切り替え処理手段402は、当
該切り替えの指示を受けると、バッチ業務処理手段20
3で実行されていたバッチ業務を第1のバッチ業務代替
処理手段301または第2のバッチ業務代替処理手段4
01に引き継ぐための切り替え処理を行う(ステップE
6)。
First batch job switching processing means 302
Alternatively, when the second batch job switching processing means 402 receives the switching instruction, the batch job processing means 20
The first batch job alternative processing means 301 or second batch job alternative processing means 4
The switching process to carry over to 01 is performed (step E
6).

【0097】当該切り替え処理が終了すると、第1のバ
ッチ業務代替処理手段301または第2のバッチ業務代
替処理手段401は、バッチ業務を再開し以降のバッチ
業務を引き継ぎ実行する。
When the switching process is completed, the first batch job alternative processing unit 301 or the second batch job alternative processing unit 401 restarts the batch job and succeeds and executes the subsequent batch jobs.

【0098】第2の実施の形態においても、第1の計算
機100が障害になった場合、第1の計算機100で運
用されていたトランザクション業務が第2の計算機20
0に切り替えられた際に、このことで、第2の計算機2
00の業務負荷が第3の計算機300および第4の計算
機400より極端に高くなることを防ぎ、第2の計算機
200で運用されていたバッチ業務を第3の計算機30
0または第4の計算機400に切り替えて運用すること
で、各計算機の業務負荷を平準化することを可能にす
る。
Also in the second embodiment, when the first computer 100 becomes a failure, the transaction work operated on the first computer 100 is changed to the second computer 20.
This causes the second computer 2 to
It is possible to prevent the work load of 00 from becoming extremely higher than that of the third computer 300 and the fourth computer 400, and to execute the batch work that has been operated on the second computer 200 by the third computer 30.
By switching to 0 or the fourth computer 400 for operation, it is possible to equalize the work load of each computer.

【0099】[第3の実施の形態]図10は、本発明の
第3の実施の形態に係るホットスタンバイシステム切り
替え制御方式の構成を示すブロック図である。図10を
参照すると、本発明の第3の実施の形態は、図1に示し
た第1の実施の形態における第1の計算機100に対し
て第1のプログラム110を、第2の計算機200に対
して第2のプログラム210を、第3の計算機300に
対して第3のプログラム310をそれぞれ備える点が異
なっている。
[Third Embodiment] FIG. 10 is a block diagram showing the configuration of a hot standby system switching control system according to a third embodiment of the present invention. Referring to FIG. 10, in the third exemplary embodiment of the present invention, the first computer 110 in the first exemplary embodiment shown in FIG. In contrast, the second program 210 is different from the third computer 300 in that the third program 310 is provided.

【0100】第1のプログラム110は、第1の計算機
100に読み込まれ、第1の計算機100の動作を、ト
ランザクション業務処理手段101,障害事象判定手段
102および障害通知手段103として制御する。第1
のプログラム110の制御による第1の計算機100の
動作は、第1の実施の形態における第1の計算機100
の動作と全く同様になるので、その詳しい説明を割愛す
る。
The first program 110 is read by the first computer 100 and controls the operation of the first computer 100 as the transaction work processing means 101, the failure event determination means 102 and the failure notification means 103. First
The operation of the first computer 100 under the control of the program 110 of the above is the first computer 100 in the first embodiment.
Since it is exactly the same as the operation of, the detailed explanation is omitted.

【0101】また、第2のプログラム210は、第2の
計算機200に読み込まれ、第2の計算機200の動作
を、トランザクション業務代替処理手段201,トラン
ザクション業務切り替え手段202,バッチ業務処理手
段203,第1の業務負荷情報監視手段204,バッチ
業務切り替え判定手段205およびバッチ業務切り替え
通知手段206として制御する。第2のプログラム21
0の制御による第2の計算機200の動作は、第1の実
施の形態における第2の計算機200の動作と全く同様
になるので、その詳しい説明を割愛する。
Further, the second program 210 is read by the second computer 200, and the operation of the second computer 200 is changed to the transaction work alternative processing means 201, the transaction work switching means 202, the batch work processing means 203, The work load information monitoring unit 204, the batch work switching determination unit 205, and the batch work switching notifying unit 206 are controlled. Second program 21
The operation of the second computer 200 under the control of 0 is exactly the same as the operation of the second computer 200 in the first embodiment, and therefore its detailed description is omitted.

【0102】さらに、第3のプログラム310は、第3
の計算機300に読み込まれ、第3の計算機300の動
作を、第1のバッチ業務代替処理手段301,第1のバ
ッチ業務切り替え処理手段302および第2の業務負荷
情報監視手段303として制御する。第3のプログラム
310の制御による第3の計算機300の動作は、第1
の実施の形態における第3の計算機300の動作と全く
同様になるので、その詳しい説明を割愛する。
Further, the third program 310 is
The third computer 300 reads the data and controls the operation of the third computer 300 as the first batch work substitute processing means 301, the first batch work switching processing means 302, and the second work load information monitoring means 303. The operation of the third computer 300 under the control of the third program 310 is
Since the operation is the same as that of the third computer 300 in the embodiment, detailed description thereof will be omitted.

【0103】[第4の実施の形態]図11は、本発明の
第4の実施の形態に係るホットスタンバイシステム切り
替え制御方式の構成を示すブロック図である。図11を
参照すると、本発明の第4の実施の形態は、図6に示し
た第2の実施の形態における第1の計算機100に対し
て第1のプログラム110を、第2の計算機200に対
して第2のプログラム210を、第3の計算機300お
よび第4の計算機400に対して第3のプログラム31
0をそれぞれ備える点が異なっている。
[Fourth Embodiment] FIG. 11 is a block diagram showing the configuration of a hot standby system switching control system according to a fourth embodiment of the present invention. Referring to FIG. 11, in the fourth exemplary embodiment of the present invention, the first program 110 is stored in the second computer 200 for the first computer 100 in the second exemplary embodiment shown in FIG. On the other hand, the second program 210 is used for the third computer 300 and the fourth computer 400 and the third program 31
They are different in that each has 0.

【0104】第1のプログラム110は、第1の計算機
100に読み込まれ、第1の計算機100の動作を、ト
ランザクション業務処理手段101,障害事象判定手段
102および障害通知手段103として制御する。第1
のプログラム110の制御による第1の計算機100の
動作は、第2の実施の形態における第1の計算機100
の動作と全く同様になるので、その詳しい説明を割愛す
る。
The first program 110 is read by the first computer 100 and controls the operation of the first computer 100 as the transaction work processing means 101, the failure event determination means 102 and the failure notification means 103. First
The operation of the first computer 100 under the control of the program 110 of the first embodiment is the same as that of the first computer 100 in the second embodiment.
Since it is exactly the same as the operation of, the detailed explanation is omitted.

【0105】また、第2のプログラム210は、第2の
計算機200に読み込まれ、第2の計算機200の動作
を、トランザクション業務代替処理手段201,トラン
ザクション業務切り替え手段202,バッチ業務処理手
段203,第1の業務負荷情報監視手段204,バッチ
業務切り替え判定手段205およびバッチ業務切り替え
通知手段206として制御する。第2のプログラム21
0の制御による第2の計算機200の動作は、第2の実
施の形態における第2の計算機200の動作と全く同様
になるので、その詳しい説明を割愛する。
The second program 210 is read by the second computer 200, and the operation of the second computer 200 is changed to the transaction work alternative processing means 201, transaction work switching means 202, batch work processing means 203, The work load information monitoring unit 204, the batch work switching determination unit 205, and the batch work switching notifying unit 206 are controlled. Second program 21
The operation of the second computer 200 under the control of 0 is exactly the same as the operation of the second computer 200 in the second embodiment, and therefore its detailed description is omitted.

【0106】さらに、第3のプログラム310は、第3
の計算機300および第4の計算機400に読み込ま
れ、第3の計算機300および第4の計算機400の動
作を、第1のバッチ業務代替処理手段301,第1のバ
ッチ業務切り替え処理手段302および第2の業務負荷
情報監視手段303として制御する。第3のプログラム
310の制御による第3の計算機300および第4の計
算機400の動作は、第2の実施の形態における第3の
計算機300および第4の計算機400の動作と全く同
様になるので、その詳しい説明を割愛する。
Further, the third program 310 is
Read by the third computer 300 and the fourth computer 400, and the operations of the third computer 300 and the fourth computer 400 are performed by the first batch job substitution processing means 301, the first batch job switching processing means 302 and the second batch job switching processing means 302 and the second batch job switching processing means 302. It is controlled as the work load information monitoring means 303. The operations of the third computer 300 and the fourth computer 400 under the control of the third program 310 are exactly the same as the operations of the third computer 300 and the fourth computer 400 in the second embodiment. I will omit the detailed explanation.

【0107】[0107]

【発明の効果】第1の効果は、運用系を持つ計算機と代
替系を持つ計算機との他に、1台以上の計算機が接続さ
れている構成のホットスタンバイシステムにおいて、運
用系を持つ計算機で障害が発生し、運用系でのトランザ
クション業務の運用の続行が不可能になった場合、代替
系において当該トランザクション業務の復旧を行い該ト
ランザクション業務の運用継続を行うとともに、トラン
ザクション業務を代替系に切り替えて実行することによ
り、代替系を持つ計算機の業務負荷が高くなった場合
に、代替系を持つ計算機で実行されているバッチ業務
を、他の計算機に切り替えて実行することにより、疎結
合マルチプロセッサシステムに関して、各計算機におけ
る業務の業務負荷を平準化でき業務の遅延や性能低下を
防止できることである。その理由は、代替系を持つ計算
機と他の計算機とにおいて、CPU負荷状況等の業務負
荷の状態を監視し、トランザクション業務を代替系に切
り替えた際に代替系を持つ計算機の業務負荷が高くなっ
た場合、代替系を持つ計算機で実行されているバッチ業
務を、他の計算機に切り替えて実行するためである。
The first effect is that in a hot standby system having a configuration in which one or more computers are connected in addition to a computer having an active system and a computer having an alternative system, a computer having an active system is provided. When a failure occurs and it becomes impossible to continue the operation of the transactional business in the active system, the transactional business is restored in the alternate system to continue the operation of the transactional business, and the transactional business is switched to the alternative system. When the workload of the computer with the alternate system becomes high by executing the above, the batch tasks being executed on the computer with the alternate system are switched to another computer and executed Regarding the system, it is possible to equalize the work load of work on each computer and prevent work delay and performance deterioration. The reason is that the computer having the alternative system and the other computer monitor the state of the business load such as the CPU load status, and when the transaction work is switched to the alternative system, the business load of the computer having the alternative system becomes high. This is because, in the case of executing, the batch work being executed by the computer having the alternative system is switched to another computer for execution.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の第1の実施の形態に係るホットスタン
バイシステム切り替え制御方式の構成を示すブロック図
である。
FIG. 1 is a block diagram showing a configuration of a hot standby system switching control method according to a first embodiment of the present invention.

【図2】図1中の業務負荷情報テーブルの内容を示す図
である。
FIG. 2 is a diagram showing the contents of a work load information table in FIG.

【図3】図1中の第1の業務負荷情報監視手段および第
2の業務負荷情報監視手段の処理を示すフローチャート
である。
FIG. 3 is a flowchart showing a process of a first work load information monitoring means and a second work load information monitoring means in FIG.

【図4】図1中の第1の計算機で障害が発生した場合の
トランザクション業務の切り替えの処理を示すフローチ
ャートである。
FIG. 4 is a flow chart showing processing of switching transaction work when a failure occurs in the first computer in FIG.

【図5】図1中の第2の計算機で実行されているバッチ
業務の切り替えの処理を示すフローチャートである。
FIG. 5 is a flow chart showing a process of switching a batch job executed by the second computer in FIG.

【図6】本発明の第2の実施の形態に係るホットスタン
バイシステム切り替え制御方式の構成を示すブロック図
である。
FIG. 6 is a block diagram showing a configuration of a hot standby system switching control method according to a second embodiment of the present invention.

【図7】図6中の業務負荷情報テーブルの内容を示す図
である。
7 is a diagram showing the contents of a work load information table in FIG.

【図8】図6中の第1の業務負荷情報監視手段,第2の
業務負荷情報監視手段および第3の業務負荷情報監視手
段の処理を示すフローチャートである。
8 is a flow chart showing the processing of a first work load information monitoring means, a second work load information monitoring means and a third work load information monitoring means in FIG.

【図9】図6中の第2の計算機で実行されているバッチ
業務の切り替えの処理を示すフローチャートである。
FIG. 9 is a flow chart showing a process of switching a batch job, which is executed by the second computer in FIG.

【図10】本発明の第3の実施の形態に係るホットスタ
ンバイシステム切り替え制御方式の構成を示すブロック
図である。
FIG. 10 is a block diagram showing a configuration of a hot standby system switching control method according to a third embodiment of the present invention.

【図11】本発明の第4の実施の形態に係るホットスタ
ンバイシステム切り替え制御方式の構成を示すブロック
図である。
FIG. 11 is a block diagram showing a configuration of a hot standby system switching control method according to a fourth embodiment of the present invention.

【図12】従来のホットスタンバイシステムの構成を示
すブロック図である。
FIG. 12 is a block diagram showing a configuration of a conventional hot standby system.

【符号の説明】[Explanation of symbols]

100 第1の計算機 101 トランザクション業務処理手段 102 障害事象判定手段 103 障害通知手段 200 第2の計算機 201 トランザクション業務代替処理手段 202 トランザクション業務切り替え手段 203 バッチ業務処理手段 204 第1の業務負荷情報監視手段 205 バッチ業務切り替え判定手段 206 バッチ業務切り替え通知手段 300 第3の計算機 301 第1のバッチ業務代替処理手段 302 第1のバッチ業務切り替え処理手段 303 第2の業務負荷情報監視手段 400 第4の計算機 401 第2のバッチ業務代替処理手段 402 第2のバッチ業務切り替え処理手段 403 第3の業務負荷情報監視手段 500 外部記憶装置 501 業務負荷情報テーブル 100 first calculator 101 transaction business processing means 102 Failure event determination means 103 Failure notification means 200 Second Calculator 201 Transaction business alternative processing means 202 Transaction business switching means 203 Batch business processing means 204 First work load information monitoring means 205 Batch job switching determination means 206 Batch job switching notification means 300 Third Calculator 301 First batch job alternative processing means 302 First batch job switching processing means 303 Second work load information monitoring means 400 Fourth Calculator 401 Second batch job alternative processing means 402 Second batch job switching processing means 403 Third work load information monitoring means 500 external storage device 501 workload information table

Claims (12)

【特許請求の範囲】[Claims] 【請求項1】3台の計算機がチャネル接続されて構成さ
れた疎結合マルチプロセッサシステムであり、通常の業
務運用中は、トランザクション業務を実行する運用系が
存在する第1の計算機と、第1の計算機で発生した障害
により運用系でのトランザクション業務の継続が不可能
な状態になった場合に障害となったトランザクション業
務の復旧を行い以降のトランザクション業務の運用を引
き継ぎ実行する代替系を持つ第2の計算機と、第3の計
算機とが接続されている構成のホットスタンバイシステ
ムにおいて、第1の計算機が、通常の業務運用中に運用
系としてトランザクション業務を実行するトランザクシ
ョン業務処理手段と、第1の計算機に障害が発生した場
合に運用系での当該トランザクション業務の継続が可能
か否かを判定する障害事象判定手段と、前記障害事象判
定手段により運用系でのトランザクション業務の継続が
不可能と判定された場合に第2の計算機に存在するトラ
ンザクション業務切り替え手段に障害を通知してトラン
ザクション業務の切り替えを指示する障害通知手段とを
備え、第2の計算機が、前記障害通知手段からトランザ
クション業務の切り替え指示を受けて運用系で実行して
いたトランザクション業務を実行継続が可能な状態に復
旧するトランザクション業務切り替え手段と、トランザ
クション業務の復旧後に以降のトランザクション業務を
引き継ぎ実行して運用を継続するトランザクション業務
代替処理手段と、通常の運用中にバッチ業務を実行する
バッチ業務処理手段と、第2の計算機の業務負荷を一定
の監視時間間隔で監視し第2の計算機の業務負荷情報を
業務負荷情報テーブルに記録する第1の業務負荷情報監
視手段と、第1の計算機で障害が発生しトランザクショ
ン業務の実行が切り替えられ前記トランザクション業務
代替処理手段でトランザクション業務が再開された場合
に前記業務負荷情報テーブルを参照して第2の計算機の
業務負荷情報と第3の計算機の業務負荷情報とを比較
し、第2の計算機の業務負荷が高くなったことが検知さ
れたときに第3の計算機にバッチ業務の切り替えを行う
か否かを判定するバッチ業務切り替え判定手段と、第3
の計算機にバッチ業務を切り替えると判定された場合に
バッチ業務の切り替えを第3の計算機に指示するバッチ
業務切り替え通知手段とを備え、第3の計算機が、第3
の計算機の業務負荷を一定の監視時間間隔で監視し第3
の計算機の業務負荷情報を前記業務負荷情報テーブルに
記録する第2の業務負荷情報監視手段と、前記バッチ業
務切り替え通知手段により切り替えを指示されたバッチ
業務を第2の計算機から切り替えるバッチ業務切り替え
処理手段と、前記バッチ業務切り替え処理手段により切
り替えられたバッチ業務を引き継ぎ以降の実行を継続す
るバッチ業務代替処理手段とを備えることを特徴とする
ホットスタンバイシステム切り替え制御方式。
1. A loosely coupled multiprocessor system in which three computers are connected in a channel, and a first computer having an active system for executing transaction business during normal business operation and a first computer. If there is a failure that occurred in the other computer and the transaction business in the active system cannot be continued, the failed transaction business is restored and the operation of the subsequent transaction business is taken over and executed. In the hot standby system having a configuration in which the second computer and the third computer are connected, the first computer executes transaction business as an active system during normal business operation, and transaction business processing means, If a failure occurs on another computer, determine whether the transaction business in the active system can be continued When the adverse event determination means and the failure event determination means determine that the transaction business in the active system cannot be continued, the transaction business switching means existing in the second computer is notified of the failure and the transaction business is switched. A transaction notifying means for instructing the transaction transaction, and the second computer receives the instruction to switch the transaction transaction from the failure notifying means and restores the transaction transaction being executed in the active system to a state where execution can be continued. A switching means, a transaction business alternative processing means for continuing and operating the subsequent transaction business after recovery of the transaction business, a batch business processing means for executing the batch business during normal operation, and a second computer Second calculation by monitoring the work load at regular monitoring time intervals First work load information monitoring means for recording the work load information of the above in the work load information table, and execution of the transaction work is switched due to a failure in the first computer, and the transaction work is resumed by the transaction work alternative processing means. In this case, the workload information of the second computer is compared with the workload information of the third computer by referring to the workload information table, and it is detected that the workload of the second computer has increased. And a batch job switching judging means for judging whether to switch the batch job to the third computer.
If the third computer is determined to switch the batch job, the third computer is instructed to switch the batch job to the third computer.
The work load of the computer is monitored at regular monitoring time intervals.
Second work load information monitoring means for recording work load information of another computer in the work load information table, and batch work switching processing for switching the batch work instructed to be switched by the batch work switching notifying means from the second computer A hot standby system switching control method comprising: means and a batch job alternative processing means for continuing execution of the batch job switched by the batch job switching processing means.
【請求項2】前記業務負荷情報テーブルに、第2の計算
機の業務負荷情報および第3の計算機の業務負荷情報が
各時刻毎に対応して記録されていることを特徴とする請
求項1記載のホットスタンバイシステム切り替え制御方
式。
2. The workload information table of the second computer and the workload information of the third computer are recorded in the workload information table in correspondence with each time. Hot standby system switching control method.
【請求項3】4台以上の計算機がチャネル接続されて構
成された疎結合マルチプロセッサシステムであり、通常
の業務運用中は、トランザクション業務を実行する運用
系が存在する第1の計算機と、第1の計算機で発生した
障害により運用系でのトランザクション業務の継続が不
可能な状態になった場合に障害となったトランザクショ
ン業務の復旧を行い以降のトランザクション業務の運用
を引き継ぎ実行する代替系を持つ第2の計算機と、2台
以上の第3の計算機とが接続されている構成のホットス
タンバイシステムにおいて、第1の計算機が、通常の業
務運用中に運用系としてトランザクション業務を実行す
るトランザクション業務処理手段と、第1の計算機に障
害が発生した場合に運用系での当該トランザクション業
務の継続が可能か否かを判定する障害事象判定手段と、
前記障害事象判定手段により運用系でのトランザクショ
ン業務の継続が不可能と判定された場合に第2の計算機
に存在するトランザクション業務切り替え手段に障害を
通知してトランザクション業務の切り替えを指示する障
害通知手段とを備え、第2の計算機が、前記障害通知手
段からトランザクション業務の切り替え指示を受けて運
用系で実行していたトランザクション業務を実行継続が
可能な状態に復旧するトランザクション業務切り替え手
段と、トランザクション業務の復旧後に以降のトランザ
クション業務を引き継ぎ実行して運用を継続するトラン
ザクション業務代替処理手段と、通常の運用中にバッチ
業務を実行するバッチ業務処理手段と、第2の計算機の
業務負荷を一定の監視時間間隔で監視し第2の計算機の
業務負荷情報を業務負荷情報テーブルに記録する第1の
業務負荷情報監視手段と、第1の計算機で障害が発生し
トランザクション業務の実行が切り替えられ前記トラン
ザクション業務代替処理手段でトランザクション業務が
再開された場合に前記業務負荷情報テーブルを参照して
第2の計算機の業務負荷情報と第3の計算機の業務負荷
情報とを比較し、第2の計算機の業務負荷が高くなった
ことが検知されたときに第3の計算機で業務負荷の低い
ものを特定し、当該第3の計算機にバッチ業務の切り替
えを行うか否かを判定するバッチ業務切り替え判定手段
と、当該第3の計算機にバッチ業務を切り替えると判定
された場合にバッチ業務の切り替えを当該第3の計算機
に指示するバッチ業務切り替え通知手段とを備え、第3
の計算機が、第3の計算機の業務負荷を一定の監視時間
間隔で監視し第3の計算機の業務負荷情報を前記業務負
荷情報テーブルに記録する第2の業務負荷情報監視手段
と、前記バッチ業務切り替え通知手段により切り替えを
指示されたバッチ業務を第2の計算機から切り替えるバ
ッチ業務切り替え処理手段と、前記バッチ業務切り替え
処理手段により切り替えられたバッチ業務を引き継ぎ以
降の実行を継続するバッチ業務代替処理手段とを備える
ことを特徴とするホットスタンバイシステム切り替え制
御方式。
3. A loosely-coupled multiprocessor system in which four or more computers are connected in a channel, and during normal business operation, a first computer having an active system for executing transaction business and a first computer, If a failure occurred on the computer of No. 1 makes it impossible to continue the transactional business in the active system, it has an alternative system that recovers the failed transactional business and takes over the operation of the subsequent transactional business. In a hot standby system having a configuration in which a second computer and two or more third computers are connected, a transaction business process in which the first computer executes transaction business as an active system during normal business operation If the means and the first computer fail, is it possible to continue the transaction work in the active system? A fault event determining means for determining whether,
Failure notification means for notifying the transaction operation switching means existing in the second computer of the failure and instructing the transaction operation switching when the failure event determination means determines that the transaction operation in the active system cannot be continued And a transaction operation switching unit for recovering the transaction operation executed in the active system to a state in which the second computer receives the instruction to switch the transaction operation from the failure notifying unit, and the transaction operation After the recovery of the transaction, the transaction transaction alternative processing means for taking over and executing the subsequent transaction transactions and continuing the operation, the batch transaction processing means for executing the batch transaction during normal operation, and the constant monitoring of the workload of the second computer Monitor the workload information of the second computer by monitoring at time intervals. The first work load information monitoring means for recording in the load information table and the work load when the execution of the transaction work is switched due to a failure in the first computer and the transaction work is resumed by the transaction work alternative processing means. The work load information of the second computer is compared with the work load information of the third computer by referring to the information table, and when it is detected that the work load of the second computer has increased, the third computer In the case where it is determined that the batch work is switched to the third computer, the batch work switching determination means that determines whether the work load is low in the third computer and determines whether to switch the batch work to the third computer. And a batch job switching notification means for instructing the third computer to switch the batch job.
A second work load information monitoring means for monitoring the work load of the third computer at a constant monitoring time interval and recording the work load information of the third computer in the work load information table; and the batch work. A batch job switching processing means for switching a batch job instructed to be switched by the switching notifying means from the second computer, and a batch job alternative processing means for continuing execution of the batch job switched by the batch job switching processor A hot-standby system switching control method comprising:
【請求項4】前記業務負荷情報テーブルに、第2の計算
機の業務負荷情報,および2台以上の第3の計算機の業
務負荷情報が各時刻毎に対応して記録されていることを
特徴とする請求項3記載のホットスタンバイシステム切
り替え制御方式。
4. The work load information table records work load information of a second computer and work load information of two or more third computers in correspondence with each time. The hot standby system switching control method according to claim 3.
【請求項5】3台の計算機がチャネル接続されて構成さ
れた疎結合マルチプロセッサシステムであり、通常の業
務運用中は、トランザクション業務を実行する運用系が
存在する第1の計算機と、第1の計算機で発生した障害
により運用系でのトランザクション業務の継続が不可能
な状態になった場合に障害となったトランザクション業
務の復旧を行い以降のトランザクション業務の運用を引
き継ぎ実行する代替系を持つ第2の計算機と、第3の計
算機とが接続されている構成のホットスタンバイシステ
ムにおいて、第1の計算機に障害が発生し、第1の計算
機上でのトランザクション業務の継続が不可能になった
場合に第2の計算機において当該トランザクション業務
の復旧を行い該トランザクション業務の運用を第1の計
算機から引き継ぎ実行し、これにより第2の計算機の業
務負荷が高くなったときに、第2の計算機で実行されて
いるバッチ業務を第3の計算機に切り替えて実行するこ
とを特徴とするホットスタンバイシステム切り替え制御
方法。
5. A loosely coupled multiprocessor system in which three computers are connected in a channel, and a first computer having an active system for executing transaction business during normal business operation and a first computer. If there is an alternative computer that has a failure in the operating system that makes it impossible to continue the transaction business, the failed transaction business is restored and the subsequent transaction business is taken over and executed. In a hot standby system with a configuration in which the second computer and the third computer are connected, a failure occurs in the first computer and it becomes impossible to continue the transaction work on the first computer. In the second computer, the transaction business is restored and the operation of the transaction business is taken over from the first computer. The hot standby system switching control is characterized in that when the work load of the second computer becomes high by this, the batch work being executed in the second computer is switched to the third computer and executed. Method.
【請求項6】4台以上の計算機がチャネル接続されて構
成された疎結合マルチプロセッサシステムであり、通常
の業務運用中は、トランザクション業務を実行する運用
系が存在する第1の計算機と、第1の計算機で発生した
障害により運用系でのトランザクション業務の継続が不
可能な状態になった場合に障害となったトランザクショ
ン業務の復旧を行い以降のトランザクション業務の運用
を引き継ぎ実行する代替系を持つ第2の計算機と、2台
以上の第3の計算機とが接続されている構成のホットス
タンバイシステムにおいて、第1の計算機に障害が発生
し、第1の計算機上でのトランザクション業務の継続が
不可能になった場合に第2の計算機において当該トラン
ザクション業務の復旧を行い該トランザクション業務の
運用を第1の計算機から引き継ぎ実行し、これにより第
2の計算機の業務負荷が高くなったときに、第3の計算
機で業務負荷の低いものを特定し、当該第3の計算機に
第2の計算機で実行されているバッチ業務を切り替えて
実行することを特徴とするホットスタンバイシステム切
り替え制御方法。
6. A loosely-coupled multiprocessor system in which four or more computers are connected in a channel, and during normal business operation, a first computer having an operational system for executing transaction business and a first computer, If a transaction that occurs in the active system makes it impossible to continue transactional transactions in the active system, the failed transactional transaction is restored and the subsequent transactional transaction is taken over and executed. In a hot standby system having a configuration in which a second computer and two or more third computers are connected, a failure occurs in the first computer and continuation of transaction work on the first computer is not possible. When it becomes possible, the transaction is restored on the second computer, and the operation of the transaction is performed by the first calculation. When the business load of the second computer becomes high, the third computer identifies the one with the low business load, and the third computer executes the second computer. A hot standby system switching control method characterized in that batch jobs are switched and executed.
【請求項7】コンピュータを、通常の業務運用中に運用
系としてトランザクション業務を実行するトランザクシ
ョン業務処理手段,当該コンピュータに障害が発生した
場合に運用系での当該トランザクション業務の継続が可
能か否かを判定する障害事象判定手段,および前記障害
事象判定手段により運用系でのトランザクション業務の
継続が不可能と判定された場合に他のコンピュータに存
在するトランザクション業務切り替え手段に障害を通知
してトランザクション業務の切り替えを指示する障害通
知手段として動作させるためのプログラム。
7. A transaction business processing means for executing transaction business as an active system during normal business operation of a computer, and whether or not the transaction business can be continued in the active system when a failure occurs in the computer. Failure transaction determining means, and when the failure event determining means determines that the transaction business in the active system cannot be continued, the transaction business is switched to the transaction business switching means existing in another computer, and the transaction business is performed. A program for operating as failure notification means for instructing switching of the.
【請求項8】コンピュータを、他のコンピュータの障害
通知手段からトランザクション業務の切り替え指示を受
けて運用系で実行していたトランザクション業務を実行
継続が可能な状態に復旧するトランザクション業務切り
替え手段,トランザクション業務の復旧後に以降のトラ
ンザクション業務を引き継ぎ実行して運用を継続するト
ランザクション業務代替処理手段,通常の運用中にバッ
チ業務を実行するバッチ業務処理手段,当該コンピュー
タの業務負荷を一定の監視時間間隔で監視し当該コンピ
ュータの業務負荷情報を業務負荷情報テーブルに記録す
る第1の業務負荷情報監視手段,第1の計算機で障害が
発生しトランザクション業務の実行が切り替えられ前記
トランザクション業務代替処理手段でトランザクション
業務が再開された場合に前記業務負荷情報テーブルを参
照して当該コンピュータの計算機の業務負荷情報と別の
コンピュータの業務負荷情報とを比較し、当該コンピュ
ータの業務負荷が高くなったことが検知されたときに別
のコンピュータにバッチ業務の切り替えを行うか否かを
判定するバッチ業務切り替え判定手段,および当該別の
コンピュータにバッチ業務を切り替えると判定された場
合にバッチ業務の切り替えを当該別のコンピュータに指
示するバッチ業務切り替え通知手段として動作させるた
めのプログラム。
8. A transaction business switching means for recovering a computer to a state in which it is possible to continue execution of a transaction business executed in an active system in response to a transaction business switching instruction from a failure notification means of another computer Alternative transaction processing means that takes over and executes the subsequent transaction operations after recovery, continues the operation, batch job processing means that executes batch operations during normal operation, and monitors the workload of the computer at regular monitoring time intervals Then, the first work load information monitoring means for recording the work load information of the computer in the work load information table, the execution of the transaction work is switched due to a failure in the first computer, and the transaction work is executed by the transaction work alternative processing means. Was resumed In this case, the workload information of the computer of the computer is compared with the workload information of another computer by referring to the workload information table, and when it is detected that the workload of the computer becomes high, another A batch job switching determination means for determining whether to switch the batch job to a computer, and a batch job for instructing the other computer to switch the batch job when it is determined to switch the batch job to the other computer A program for operating as switching notification means.
【請求項9】コンピュータを、他のコンピュータの障害
通知手段からトランザクション業務の切り替え指示を受
けて運用系で実行していたトランザクション業務を実行
継続が可能な状態に復旧するトランザクション業務切り
替え手段,トランザクション業務の復旧後に以降のトラ
ンザクション業務を引き継ぎ実行して運用を継続するト
ランザクション業務代替処理手段,通常の運用中にバッ
チ業務を実行するバッチ業務処理手段,当該コンピュー
タの業務負荷を一定の監視時間間隔で監視し当該コンピ
ュータの業務負荷情報を業務負荷情報テーブルに記録す
る第1の業務負荷情報監視手段,第1の計算機で障害が
発生しトランザクション業務の実行が切り替えられトラ
ンザクション業務代替処理手段でトランザクション業務
が再開された場合に前記業務負荷情報テーブルを参照し
て当該コンピュータの計算機の業務負荷情報と別のコン
ピュータの業務負荷情報とを比較し、当該コンピュータ
の業務負荷が高くなったことが検知されたときに別のコ
ンピュータで業務負荷の低いものを特定し、当該別のコ
ンピュータにバッチ業務の切り替えを行うか否かを判定
するバッチ業務切り替え判定手段,および当該別のコン
ピュータにバッチ業務を切り替えると判定された場合に
バッチ業務の切り替えを当該別のコンピュータに指示す
るバッチ業務切り替え通知手段として動作させるための
プログラム。
9. A transaction business switching means for recovering a computer to a state in which it is possible to continue execution of a transaction business executed in an active system in response to a transaction business switching instruction from a failure notification means of another computer Alternative transaction processing means that takes over and executes the subsequent transaction operations after recovery, continues the operation, batch job processing means that executes batch operations during normal operation, and monitors the workload of the computer at regular monitoring time intervals Then, the first work load information monitoring unit that records the work load information of the computer in the work load information table, the execution of the transaction work is switched due to a failure in the first computer, and the transaction work is resumed by the transaction work alternative processing unit. If done The workload information of the computer of the computer is compared with the workload information of another computer by referring to the workload information table, and when it is detected that the workload of the computer becomes high, the other computer Batch job switching determination means that determines the one with a low business load and determines whether to switch the batch job to the other computer, and batch job when it is determined to switch the batch job to the other computer A program for operating as a batch job switching notification means for instructing the other computer to switch.
【請求項10】コンピュータを、当該コンピュータの業
務負荷を一定の監視時間間隔で監視し当該コンピュータ
の業務負荷情報を業務負荷情報テーブルに記録する第2
の業務負荷情報監視手段,他のコンピュータから切り替
えを指示されたバッチ業務を当該他のコンピュータから
切り替えるバッチ業務切り替え処理手段,および前記バ
ッチ業務切り替え処理手段により切り替えられたバッチ
業務を引き継ぎ以降の実行を継続するバッチ業務代替処
理手段として動作させるためのプログラム。
10. A second method for monitoring a computer work load of the computer at a constant monitoring time interval and recording the work load information of the computer in a work load information table.
Workload information monitoring means, a batch job switching processing means for switching a batch job instructed to be switched by another computer from the other computer, and a batch job switched by the batch job switching processing means for execution after handing over. A program for operating as a continuous batch job alternative processing means.
【請求項11】コンピュータを、通常の業務運用中に運
用系としてトランザクション業務を実行するトランザク
ション業務処理手段,当該コンピュータに障害が発生し
た場合に運用系での当該トランザクション業務の継続が
可能か否かを判定する障害事象判定手段,前記障害事象
判定手段により運用系でのトランザクション業務の継続
が不可能と判定された場合に他のコンピュータに存在す
るトランザクション業務切り替え手段に障害を通知して
トランザクション業務の切り替えを指示する障害通知手
段,前記障害通知手段からトランザクション業務の切り
替え指示を受けて運用系で実行していたトランザクショ
ン業務を実行継続が可能な状態に復旧するトランザクシ
ョン業務切り替え手段,トランザクション業務の復旧後
に以降のトランザクション業務を引き継ぎ実行して運用
を継続するトランザクション業務代替処理手段,通常の
運用中にバッチ業務を実行するバッチ業務処理手段,他
のコンピュータの業務負荷を一定の監視時間間隔で監視
し当該他のコンピュータの業務負荷情報を業務負荷情報
テーブルに記録する第1の業務負荷情報監視手段,当該
コンピュータで障害が発生しトランザクション業務の実
行が切り替えられ前記トランザクション業務代替処理手
段でトランザクション業務が再開された場合に前記業務
負荷情報テーブルを参照して他のコンピュータの業務負
荷情報とさらに別のコンピュータの業務負荷情報とを比
較し、当該他のコンピュータの業務負荷が高くなったこ
とが検知されたときには別のコンピュータにバッチ業務
の切り替えを行うか否かを判定するバッチ業務切り替え
判定手段,当該別のコンピュータにバッチ業務を切り替
えると判定された場合にバッチ業務の切り替えを当該別
のコンピュータに指示するバッチ業務切り替え通知手
段,当該コンピュータの業務負荷を一定の監視時間間隔
で監視し当該コンピュータの業務負荷情報を前記業務負
荷情報テーブルに記録する第2の業務負荷情報監視手
段,他のコンピュータから切り替えを指示されたバッチ
業務を当該他のコンピュータから切り替えるバッチ業務
切り替え処理手段,および前記バッチ業務切り替え処理
手段により切り替えられたバッチ業務を引き継ぎ以降の
実行を継続するバッチ業務代替処理手段として動作させ
るためのプログラム。
11. A transaction business processing means for executing transaction business as an active system during normal business operation of a computer, and whether or not the transaction business can be continued in the active system when a failure occurs in the computer. Failure event determining means for determining whether the transaction operation switching means existing in another computer is notified of the failure when the failure event determining means determines that the transaction operation in the active system cannot be continued. Failure notification means for instructing switching, transaction business switching means for recovering the transaction business executed in the active system to a state in which it is possible to continue execution after receiving a transaction business switching instruction from the failure notification means, and after transaction business is restored Subsequent Transa Transaction business alternative processing means that takes over and continues the operation of the transaction business, batch business processing means that executes the batch business during normal operation, and monitors the business load of other computers at regular monitoring time intervals. First work load information monitoring means for recording work work load information of a computer in the work work load information table, when execution of transaction work is switched due to a failure in the computer and transaction work is resumed by the transaction work alternative processing means And comparing the work load information of another computer with the work load information of another computer by referring to the work load information table, and when it is detected that the work load of the other computer has increased, another Determining whether to switch batch jobs to a computer Switch job switching determination means, batch job switch notification means for instructing the other computer to switch the batch job when it is determined to switch the batch job to the other computer, and the work load of the computer for a certain monitoring time Second work load information monitoring means for monitoring the work load information of the computer at intervals and recording the work load information of the computer in the work load information table, batch work switching processing for switching the batch work instructed to be switched by another computer from the other computer And a program for operating the batch job switched by the batch job switching processing means as a batch job alternative processing means for continuing execution after the handover.
【請求項12】コンピュータを、通常の業務運用中に運
用系としてトランザクション業務を実行するトランザク
ション業務処理手段,当該コンピュータに障害が発生し
た場合に運用系での当該トランザクション業務の継続が
可能か否かを判定する障害事象判定手段,前記障害事象
判定手段により運用系でのトランザクション業務の継続
が不可能と判定された場合に他のコンピュータに存在す
るトランザクション業務切り替え手段に障害を通知して
トランザクション業務の切り替えを指示する障害通知手
段,前記障害通知手段からトランザクション業務の切り
替え指示を受けて運用系で実行していたトランザクショ
ン業務を実行継続が可能な状態に復旧するトランザクシ
ョン業務切り替え手段,トランザクション業務の復旧後
に以降のトランザクション業務を引き継ぎ実行して運用
を継続するトランザクション業務代替処理手段,通常の
運用中にバッチ業務を実行するバッチ業務処理手段,他
のコンピュータの業務負荷を一定の監視時間間隔で監視
し当該他のコンピュータの業務負荷情報を業務負荷情報
テーブルに記録する第1の業務負荷情報監視手段,当該
コンピュータで障害が発生しトランザクション業務の実
行が切り替えられ前記トランザクション業務代替処理手
段でトランザクション業務が再開された場合に前記業務
負荷情報テーブルを参照して他のコンピュータの業務負
荷情報と別のコンピュータの業務負荷情報とを比較し、
当該他のコンピュータの業務負荷が高くなったことが検
知されたときには別のコンピュータで業務負荷の低いも
のを特定し、当該別のコンピュータにバッチ業務の切り
替えを行うか否かを判定するバッチ業務切り替え判定手
段,当該別のコンピュータにバッチ業務を切り替えると
判定された場合にバッチ業務の切り替えを当該別のコン
ピュータに指示するバッチ業務切り替え通知手段,当該
コンピュータの業務負荷を一定の監視時間間隔で監視し
当該コンピュータの業務負荷情報を前記業務負荷情報テ
ーブルに記録する第2の業務負荷情報監視手段,他のコ
ンピュータから切り替えを指示されたバッチ業務を当該
他のコンピュータから切り替えるバッチ業務切り替え処
理手段,および前記バッチ業務切り替え処理手段により
切り替えられたバッチ業務を引き継ぎ以降の実行を継続
するバッチ業務代替処理手段として動作させるためのプ
ログラム。
12. A transaction business processing means for executing transaction business as an active system during normal business operation of a computer, and whether or not the transaction business can be continued in the active system when a failure occurs in the computer. Failure event determining means for determining whether the transaction operation switching means existing in another computer is notified of the failure when the failure event determining means determines that the transaction operation in the active system cannot be continued. Failure notification means for instructing switching, transaction business switching means for recovering the transaction business executed in the active system to a state in which it is possible to continue execution after receiving a transaction business switching instruction from the failure notification means, and after transaction business is restored Subsequent Transa Transaction business alternative processing means that takes over and continues the operation of the transaction business, batch business processing means that executes the batch business during normal operation, and monitors the business load of other computers at regular monitoring time intervals. First work load information monitoring means for recording work work load information of a computer in the work work load information table, when execution of transaction work is switched due to a failure in the computer and transaction work is resumed by the transaction work alternative processing means To compare the work load information of another computer with the work load information of another computer by referring to the work load information table,
When it is detected that the business load of the other computer is high, another computer with a low business load is identified, and it is determined whether to switch the batch work to the other computer. Batch job switching Judgment means, batch operation switch notification means for instructing the other computer to switch the batch job when it is determined to switch the batch job to the other computer, and monitoring the work load of the computer at regular monitoring time intervals Second work load information monitoring means for recording work load information of the computer in the work load information table, batch work switching processing means for switching the batch work instructed to be switched by another computer from the other computer, and The jobs that were switched by the batch job switching processing means Program for operating as a batch job substitute processing means for continuing the execution of a subsequent take over switch operations.
JP2002050362A 2002-02-26 2002-02-26 Control method for switching in hot standby system Pending JP2003256399A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002050362A JP2003256399A (en) 2002-02-26 2002-02-26 Control method for switching in hot standby system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002050362A JP2003256399A (en) 2002-02-26 2002-02-26 Control method for switching in hot standby system

Publications (1)

Publication Number Publication Date
JP2003256399A true JP2003256399A (en) 2003-09-12

Family

ID=28662630

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002050362A Pending JP2003256399A (en) 2002-02-26 2002-02-26 Control method for switching in hot standby system

Country Status (1)

Country Link
JP (1) JP2003256399A (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100362481C (en) * 2005-09-15 2008-01-16 上海华为技术有限公司 Main-standby protection method for multi-processor device units
US7428210B2 (en) 2004-09-07 2008-09-23 Hitachi, Ltd. Fail over method and a computing system having fail over function
JP2013206051A (en) * 2012-03-28 2013-10-07 Nec Corp Program arrangement method
CN112000451A (en) * 2020-08-19 2020-11-27 中国建设银行股份有限公司 Batch job scheduling system, method, device and storage medium
CN112529271A (en) * 2020-12-01 2021-03-19 国网河南省电力公司电力科学研究院 Optimized scheduling method for providing power grid standby auxiliary service by controllable load cluster

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7428210B2 (en) 2004-09-07 2008-09-23 Hitachi, Ltd. Fail over method and a computing system having fail over function
CN100362481C (en) * 2005-09-15 2008-01-16 上海华为技术有限公司 Main-standby protection method for multi-processor device units
JP2013206051A (en) * 2012-03-28 2013-10-07 Nec Corp Program arrangement method
CN112000451A (en) * 2020-08-19 2020-11-27 中国建设银行股份有限公司 Batch job scheduling system, method, device and storage medium
CN112529271A (en) * 2020-12-01 2021-03-19 国网河南省电力公司电力科学研究院 Optimized scheduling method for providing power grid standby auxiliary service by controllable load cluster

Similar Documents

Publication Publication Date Title
US7751310B2 (en) Fault tolerant duplex computer system and its control method
JP5392594B2 (en) Virtual machine redundancy system, computer system, virtual machine redundancy method, and program
JP2006195821A (en) Method for controlling information processing system, information processing system, direct memory access controller, and program
JP4155399B2 (en) Computer processing method, its execution system, and its processing program
JP2002259155A (en) Multiprocessor system
JP5366184B2 (en) Data storage system and data storage method
JP2003256399A (en) Control method for switching in hot standby system
JP3447347B2 (en) Failure detection method
JPH10116261A (en) Check point restarting method for parallel computer system
JP2001331330A (en) Process abnormality detection and restoration system
JP3139536B2 (en) Distributed batch job processing system and automatic job restart method in the event of failure
JPH05314075A (en) On-line computer system
JPH0879246A (en) Distributed communication system and fault recovery method therefor
JP5359234B2 (en) Job execution system and job flow takeover control program
JPH07141308A (en) Back-up method in information processing system
JP2000148525A (en) Method for reducing load of active system in service processor duplex system
JP2513122B2 (en) Hot standby switching system
JP2001175545A (en) Server system, fault diagnosing method, and recording medium
JPH04153810A (en) Abnormality processing system
JPH05224964A (en) Bus abnormality information system
JP2704137B2 (en) Current / spare switching method
JPH02310755A (en) Health check system
JPH07200334A (en) Duplicate synchronization operation system
JP2002063051A (en) Software operation monitoring system, recording medium therefor and software operation monitoring method
JPH0793173A (en) Computer network system and process allocating method for computer therein

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040813

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20050124

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050315

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20050317

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20050712