JPH04262428A - Hot standby system - Google Patents

Hot standby system

Info

Publication number
JPH04262428A
JPH04262428A JP3044458A JP4445891A JPH04262428A JP H04262428 A JPH04262428 A JP H04262428A JP 3044458 A JP3044458 A JP 3044458A JP 4445891 A JP4445891 A JP 4445891A JP H04262428 A JPH04262428 A JP H04262428A
Authority
JP
Japan
Prior art keywords
host
hot standby
active
standby
job
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3044458A
Other languages
Japanese (ja)
Inventor
Asashige Araki
荒木 朝栄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP3044458A priority Critical patent/JPH04262428A/en
Publication of JPH04262428A publication Critical patent/JPH04262428A/en
Pending legal-status Critical Current

Links

Landscapes

  • Hardware Redundancy (AREA)
  • Multi Processors (AREA)

Abstract

PURPOSE:To upgrade the reliability of switching between operating host and waiting host and the switching speed in a hot standby system. CONSTITUTION:An operating type hot standby control job 120, when it detects a failure of the application that an application driving program 130 is executing based on response time or the like, outputs a host switching request 140, whereby a hot standby process 110 initiates a local host forced down means 150 to down an operating host 100 forsibly. When the down processing is completed, the local host forced down means 150 outputs a down notice 103. When receiving the down notice, a hot standby process 210 outputs a switching request 240, and in response to this request, a waiting type hot standby control job 220 uses an application transfer means 223 to take in resource and also to switch an application driving program 230 to the operating type to restart application driving.

Description

【発明の詳細な説明】[Detailed description of the invention]

【0001】0001

【産業上の利用分野】本発明は情報処理システムの高信
頼度を実現するために、異常事態発生時に現用系から待
機系へ迅速に業務を引き継ぐホットスタンバイシステム
に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a hot standby system that quickly takes over operations from an active system to a standby system when an abnormal situation occurs, in order to achieve high reliability in an information processing system.

【0002】0002

【従来の技術】業務運転中の稼動ホストと、稼動ホスト
がダウンした際に業務を引き継ぐために待機している待
機ホストとから構成されるホットスタンバイシステムに
於いては、従来、通信回線,ジョブ間通信等から構成さ
れる通信手段を使って一定間隔で行なっている通信の応
答がない等の事象から間接的に稼動ホストのダウンを検
出するようにしている。そして、稼動ホストのダウンを
検出した場合は、稼動ホストを外部から強制的にダウン
させた後、稼動ホスト,待機ホストの切り替えを行なっ
ている。また、稼動ホストから待機ホストへの業務の引
き継ぎは、資源の利用形態を考慮しながらアプリケーシ
ョンプログラムである業務運転プログラムが独自の方法
で実現している。
[Prior Art] Conventionally, in a hot standby system consisting of an active host in operation and a standby host that stands by to take over the business when the active host goes down, communication lines and job The down state of an active host is indirectly detected from events such as no response to communications performed at regular intervals using communication means consisting of inter-communications and the like. If the active host is detected to be down, the active host is forcibly brought down from the outside and then switched between the active host and the standby host. Furthermore, the business operation program, which is an application program, uses a unique method to take over the business from the active host to the standby host, taking into account the resource usage pattern.

【0003】0003

【発明が解決しようとする課題】第1に、従来は稼動ホ
ストがダウンしたことを、通信手段を使って一定間隔で
行なっている通信の応答がない等の事象から間接的に検
出するようにしているが、通信手段は本来そのような目
的で設計されておらず、他のサービスと同レベルで使用
されることになるため、信頼性,速度の面で劣るという
問題点があると共に、通信手段の障害と稼動ホストの動
作異常とを切り分けることが困難であるという問題があ
った。
[Problems to be Solved by the Invention] Firstly, in the past, failure of an active host was indirectly detected from events such as no response to communications performed at regular intervals using communication means. However, since the communication means were not originally designed for such purposes and are used at the same level as other services, there are problems in terms of reliability and speed, and communication There has been a problem in that it is difficult to distinguish between a failure in the means and an abnormal operation of the operating host.

【0004】第2に、従来は稼動ホスト,待機ホストの
切り替えを行なう際、稼動ホストを外部から強制的にダ
ウンさせた後、稼動ホスト,待機ホストの切り替えを行
なっていたため、稼動ホスト,待機ホストの切り替えを
高速に行なうことが難しいという問題があった。
Second, conventionally, when switching between an active host and a standby host, the active host was forcibly brought down from the outside and then switched between the active host and standby host. There was a problem in that it was difficult to perform high-speed switching.

【0005】第3に、従来は稼動ホスト,待機ホストの
切り替えをアプリケーションプログラムが資源の利用形
態を考慮しながら行なっているため、アプリケーション
プログラムの開発に多くの工程が必要になるという問題
があった。
[0005] Thirdly, in the past, switching between the active host and the standby host was performed by the application program while taking into consideration the resource usage pattern, which resulted in the problem that many steps were required to develop the application program. .

【0006】本発明の目的は、稼動ホスト,待機ホスト
の切り替えを行なう際の信頼性,切り替え速度を向上さ
せると共に、アプリケーションプログラムの開発を容易
なものにすることにある。
An object of the present invention is to improve the reliability and switching speed when switching between an active host and a standby host, and to facilitate the development of application programs.

【0007】[0007]

【課題を解決するための手段】本発明は上記目的を達成
するため、現用系の稼動ホストと、該稼動ホストの運転
中はサービス開始可能な状態で待機している予備系の待
機ホストとから構成されるホットスタンバイシステムに
於いて、前記稼動ホストは、制御下に稼動型として起動
されている第1の業務運転プログラムを有し、自ホスト
の異常を検出することによりホスト切り替え要求を出力
する稼動型ホットスタンバイ制御ジョブと、自ホストを
強制的にダウンさせると共に前記待機ホストへダウン通
知を出力する自ホスト強制ダウン手段と、該自ホスト強
制ダウン手段を制御する第1のホットスタンバイプロセ
スとを含み、前記待機ホストは、制御下に待機型として
起動されている第2の業務運転プログラムを有し、前記
稼動型ホットスタンバイ制御ジョブとのジョブ間通信に
よって前記稼動ホストの異常を検出することにより他系
確認要求を出力し、切り替え要求に応答して業務運転に
必要な資源を取り込むと共に前記待機型として起動され
ている第2の業務運転プログラムを稼動型に切り替えて
運転業務を再開させる待機型ホットスタンバイ制御ジョ
ブと、前記他系確認要求に応答して前記稼動ホストが正
常か否かを判定し、異常と判定することにより強制ダウ
ン要求を出力すると共に、前記ダウン通知に応答して前
記切り替え要求を出力する第2のホットスタンバイプロ
セスとを含み、前記第1のホットスタンバイプロセスは
前記稼動型ホットスタンバイ制御ジョブが出力するホス
ト切り替え要求及び前記第2のホットスタンバイプロセ
スが出力する強制ダウン要求に応答して前記自ホスト強
制ダウン手段を起動して前記稼動ホストをダウンさせる
[Means for Solving the Problems] In order to achieve the above-mentioned object, the present invention provides a system for connecting an active host and a backup standby host that is ready to start service while the active host is in operation. In the configured hot standby system, the active host has a first business operation program activated as an active type under control, and outputs a host switching request by detecting an abnormality in its own host. An active hot standby control job, a host forced down means for forcibly bringing down the host and outputting a down notification to the standby host, and a first hot standby process controlling the host forced down means. The standby host has a second business operation program activated as a standby type under control, and detects an abnormality in the active host through inter-job communication with the active hot standby control job. Standby type that outputs a confirmation request for other systems, takes in the resources necessary for business operation in response to the switching request, and switches the second business operation program that is started as the standby type to the active type to restart the operation job. In response to the hot standby control job and the other system confirmation request, it is determined whether the operating host is normal or not, and if it is determined to be abnormal, a forced down request is output, and the switching is performed in response to the down notification. a second hot standby process that outputs a request, and the first hot standby process responds to a host switching request output from the active hot standby control job and a forced down request output from the second hot standby process. In response, the self-host forced down means is activated to bring down the active host.

【0008】[0008]

【作用】稼動型ホットスタンバイ制御ジョブは制御下の
第1の業務運転プログラムの応答時間等に基づいて稼動
ホストに異常が発生したことを検出すると、ホスト切り
替え要求を出力する。稼動ホスト側の第1のホットスタ
ンバイプロセスは稼動型ホットスタンバイ制御ジョブか
らホスト切り替え要求が出力されると、自ホスト強制ダ
ウン手段を起動する。これにより、自ホスト強制ダウン
手段は稼動ホストをダウンさせ、ダウン通知を出力する
[Operation] When the active hot standby control job detects that an abnormality has occurred in the active host based on the response time of the first business operation program under control, it outputs a host switching request. When a host switching request is output from the active hot standby control job, the first hot standby process on the active host side activates its own host forced down means. As a result, the own host forced down means brings down the active host and outputs a down notification.

【0009】待機ホスト側の第2のホットスタンバイプ
ロセスはダウン通知に応答して切り替え要求を出力する
。これにより、待機型ホットスタンバイ制御ジョブは業
務運転に必要な資源を取り込むと共に、待機型として起
動されている第2の業務運転プログラムを稼動型に切り
替え、業務運転を再開させる。
The second hot standby process on the standby host outputs a switching request in response to the down notification. As a result, the standby type hot standby control job takes in the resources necessary for the business operation, switches the second business operation program started as a standby type to the active type, and restarts the business operation.

【0010】また、待機ホスト側の待機型ホットスタン
バイ制御ジョブは稼動型ホットスタンバイ制御ジョブと
行なっているジョブ間通信により稼動ホストの異常を検
出すると、他系確認要求を出力する。この他系確認要求
に応答して待機ホスト側の第2のホットスタンバイプロ
セスは稼動ホストが正常であるか否かを判定し、異常で
あると判定することにより強制ダウン要求を出力する。
Furthermore, when the standby hot standby control job on the standby host side detects an abnormality in the active host through inter-job communication with the active hot standby control job, it outputs a request for confirmation of other systems. In response to this other system confirmation request, the second hot standby process on the standby host side determines whether the active host is normal or not, and if it determines that it is abnormal, outputs a forced down request.

【0011】稼動ホスト側の第1のホットスタンバイプ
ロセスは強制ダウン要求に応答して自ホスト強制ダウン
手段を起動する。これにより、自ホスト強制ダウン手段
は稼動ホストを強制的にダウンさせ、その後、ダウン通
知を出力する。
The first hot standby process on the active host activates its own host forced down means in response to the forced down request. As a result, the own host forced down means forcibly brings down the active host, and then outputs a down notification.

【0012】待機ホスト側の第2のホットスタンバイプ
ロセスはダウン通知に応答して切り替え要求を出力し、
これにより待機型ホットスタンバイ制御ジョブは業務運
転に必要な資源を取り込むと共に、待機型として起動さ
れている第2の業務運転プログラムを稼動型に切り替え
、業務運転を再開させる。
[0012] The second hot standby process on the standby host outputs a switching request in response to the down notification;
As a result, the standby type hot standby control job takes in the resources necessary for the business operation, switches the second business operation program that has been activated as a standby type to the active type, and restarts the business operation.

【0013】[0013]

【実施例】次に本発明の実施例について図面を参照して
詳細に説明する。図1は本発明の実施例のブロック図で
あり、稼動ホスト100と、待機ホスト200と、稼動
ホスト100と待機ホスト200との間でダウン通知1
03,強制ダウン要求104等を送受信するためのホス
ト間通信手段101と、稼動ホスト100上で動作する
ジョブと待機ホスト200上で動作するジョブとの間で
通信を行なうためのジョブ間通信手段102とから構成
されている。
Embodiments Next, embodiments of the present invention will be described in detail with reference to the drawings. FIG. 1 is a block diagram of an embodiment of the present invention, in which an active host 100, a standby host 200, and a down notification 1
03. An inter-host communication means 101 for transmitting and receiving forced down requests 104, etc.; and an inter-job communication means 102 for communicating between a job running on the active host 100 and a job running on the standby host 200. It is composed of.

【0014】稼動ホスト100はホットスタンバイ制御
ジョブ監視手段111を含むホットスタンバイプロセス
110と、ホットスタンバイ成立手段121及びホット
スタンバイ解除手段122を含む稼動型ホットスタンバ
イ制御ジョブ120と、稼動型ホットスタンバイ制御ジ
ョブ120の制御下で動作する業務運転プログラム13
0と、自ホスト強制ダウン手段150と、制御テーブル
160とから構成されている。尚、稼動型ホットスタン
バイ制御ジョブ120はオペレーティングシステムによ
り構成されている。
The active host 100 includes a hot standby process 110 including a hot standby control job monitoring means 111, an active hot standby control job 120 including a hot standby establishing means 121 and a hot standby canceling means 122, and an active hot standby control job. Business operation program 13 that operates under the control of 120
0, self-host forced down means 150, and control table 160. Note that the active hot standby control job 120 is configured by an operating system.

【0015】待機ホスト200はホットスタンバイ制御
ジョブ監視手段211,他系確認手段212及び他系ホ
スト強制ダウン起動手段213を含むホットスタンバイ
プロセス210と、ホットスタンバイ成立手段221,
ホットスタンバイ解除手段222及び業務引き継ぎ手段
223を含む待機型ホットスタンバイ制御ジョブ220
と、待機型ホットスタンバイ制御ジョブ220の制御下
で動作する業務運転プログラム230と、制御テーブル
260とから構成されている。尚、待機型ホットスタン
バイ制御ジョブ220はオペレーティングシステムによ
り構成されている。
The standby host 200 includes a hot standby process 210 including a hot standby control job monitoring means 211, another system confirmation means 212, and another system host forced down activation means 213, a hot standby establishment means 221,
Standby hot standby control job 220 including hot standby release means 222 and business handover means 223
, a business operation program 230 that operates under the control of the standby hot standby control job 220 , and a control table 260 . Note that the standby hot standby control job 220 is configured by the operating system.

【0016】稼動ホスト100内のホットスタンバイプ
ロセス110は稼動型ホットスタンバイ制御ジョブ12
0からのホスト切り替え要求140及び強制ダウン要求
104に応答して自ホスト強制ダウン手段150を起動
する機能を有すると共に、制御テーブル160の内容を
管理するホットスタンバイ制御ジョブ監視手段111を
有している。
The hot standby process 110 in the active host 100 is the active hot standby control job 12.
It has a function of activating the own host forced down means 150 in response to a host switching request 140 from 0 and a forced down request 104, and also has a hot standby control job monitoring means 111 that manages the contents of the control table 160. .

【0017】稼動型ホットスタンバイ制御ジョブ120
は業務運転プログラム130が行なっているオンライン
業務等の現用系業務に異常が発生したことを検出する機
能,異常を検出することによりホスト切り替え要求14
0をホットスタンバイプロセス110に上げる機能を有
すると共に、ジョブ間通信手段102を用いて待機型ホ
ットスタンバイ制御ジョブ220内のホットスタンバイ
成立手段221と通信を行なってホットスタンバイ成立
状態に入れるか否かを確認し合うホットスタンバイ成立
手段121と、ジョブ間通信手段102を介してホット
スタンバイ解除手段222から送られてきたホットスタ
ンバイ解除通知に応答して稼動型ホットスタンバイ制御
ジョブ120をホットスタンバイ解除状態にすると共に
応答をホットスタンバイ解除手段222に返すホットス
タンバイ解除手段122とを有している。
Active hot standby control job 120
is a function that detects the occurrence of an abnormality in the active business such as online work being performed by the business operation program 130, and requests host switching 14 by detecting the abnormality.
0 to the hot standby process 110, and also communicates with the hot standby establishing means 221 in the standby hot standby control job 220 using the inter-job communication means 102 to determine whether to enter the hot standby established state. The active hot standby control job 120 is brought into a hot standby release state in response to a hot standby release notification sent from the hot standby release means 222 via the mutually confirming hot standby establishment means 121 and the inter-job communication means 102. and hot standby canceling means 122 for returning a response to hot standby canceling means 222.

【0018】自ホスト強制ダウン手段150はホットス
タンバイプロセス110から起動されることにより稼動
ホスト100を強制的にダウンさせる機能,ダウン処理
が完了することによりホスト間通信手段101を用いて
ダウン通知103を待機ホスト200へ送出する機能を
有する。
The self-host forced down means 150 has a function of forcibly bringing down the active host 100 by being started from the hot standby process 110, and sends a down notification 103 using the inter-host communication means 101 when the down processing is completed. It has a function of sending data to the standby host 200.

【0019】制御テーブル160には稼動型ホットスタ
ンバイ制御ジョブ120が準備完了状態になった時及び
業務運転プログラム130の運転が開始された時、ホッ
トスタンバイ制御ジョブ監視手段111によりその状態
を示す情報が登録され、稼動型ホットスタンバイ制御ジ
ョブ120或いは業務運転プログラム130が正常終了
した時、ホットスタンバイ制御ジョブ監視手段111に
より終了したものに対する情報が削除される。
In the control table 160, information indicating the status is stored by the hot standby control job monitoring means 111 when the active hot standby control job 120 becomes ready and when the business operation program 130 starts operating. When the registered active hot standby control job 120 or business operation program 130 normally ends, the hot standby control job monitoring means 111 deletes the information regarding the completed job.

【0020】待機ホスト200内のホットスタンバイプ
ロセス210は、ダウン通知103に応答して切り替え
要求240を出力する機能を有すると共に、制御テーブ
ル260を管理するホットスタンバイ制御ジョブ監視手
段211と、待機型ホットスタンバイ制御ジョブ220
からの他系確認要求250に応答して稼動ホスト100
の状態を確認する他系確認手段212と、他系確認手段
212が稼動ホスト100の異常を確認することにより
ホスト間通信手段101を使用して稼動ホスト100に
強制ダウン要求104を送出する他ホスト強制ダウン起
動手段213とを有している。
The hot standby process 210 in the standby host 200 has a function of outputting a switching request 240 in response to the down notification 103, and also includes a hot standby control job monitoring means 211 that manages a control table 260, Standby control job 220
The active host 100 responds to the other system confirmation request 250 from
and another host that sends a forced down request 104 to the active host 100 using the inter-host communication means 101 when the other system check unit 212 confirms the abnormality of the active host 100. The forced down activation means 213 is also provided.

【0021】待機型ホットスタンバイ制御ジョブ220
は業務運転プログラム230がストール状態に陥ったこ
とを検出する機能,稼動ホスト100に異常が発生した
ことをジョブ間通信により検出する機能,待機型として
起動されている業務運転プログラム230を稼動型にし
て業務運転を再開させる機能を有すると共に、ジョブ間
通信手段102を介して稼動型ホットスタンバイジョブ
120内のホットスタンバイ成立手段121と通信を行
なってホットスタンバイ状態に入れるか否かを確認し合
うホットスタンバイ成立手段221と、業務運転プログ
ラム230がストール状態に陥った時にジョブ間通信手
段102を用いて稼動型ホットスタンバイ制御ジョブ1
20内のホットスタンバイ解除手段122にホットスタ
ンバイ解除通知を送出し、ホットスタンバイ解除手段1
22からの応答を待って待機型ホットスタンバイ制御ジ
ョブ220をホットスタンバイ解除状態にするホットス
タンバイ解除手段222と、業務運転に必要な資源の取
り込み(稼動ホスト100が業務運転のために使用して
いたデータベースやジャーナルファイル等が割り当てら
れているディスク装置等の取り込み)やネットワークの
切り替えを行なう業務引き継ぎ手段223とを有してい
る。
[0021] Standby hot standby control job 220
has a function to detect that the business operation program 230 has fallen into a stall state, a function to detect through inter-job communication that an abnormality has occurred in the active host 100, and a function to change the business operation program 230 that is started as a standby type to an active type. The hot standby job has a function of resuming business operation by using the hot standby job, and also communicates with the hot standby establishing means 121 in the active hot standby job 120 via the inter-job communication means 102 to confirm whether to enter the hot standby state. When the standby establishment means 221 and the business operation program 230 are in a stalled state, the active hot standby control job 1 is executed using the inter-job communication means 102.
A hot standby cancellation notification is sent to the hot standby cancellation unit 122 in the hot standby cancellation unit 1.
A hot standby release means 222 that waits for a response from the hot standby control job 220 and puts the standby hot standby control job 220 into a hot standby release state, and a hot standby release means 222 that waits for a response from the hot standby control job 220 and takes in the resources necessary for business operations (the hot standby control job 220 that is used by the active host 100 for business operations). It also has a business handover means 223 that takes over disk devices to which databases, journal files, etc. are allocated) and switches networks.

【0022】制御テーブル260には待機型ホットスタ
ンバイ制御ジョブ220が準備完了状態となった時及び
業務運転プログラム230が業務引き継ぎ準備完了状態
となった時、ホットスタンバイ制御ジョブ監視手段21
1によりそのことを示す情報が登録され、待機型ホット
スタンバイ制御ジョブ220或いは業務運転プログラム
230が正常終了した時、ホットスタンバイ制御ジョブ
監視手段211により終了するものに対する情報が削除
される。
In the control table 260, when the standby type hot standby control job 220 becomes ready and when the business operation program 230 becomes ready for business handover, the hot standby control job monitoring means 21
1, information indicating this is registered, and when the standby hot standby control job 220 or the business operation program 230 terminates normally, the hot standby control job monitoring means 211 deletes the information regarding the job to be terminated.

【0023】次に本実施例の動作を説明する。Next, the operation of this embodiment will be explained.

【0024】稼動ホスト100,待機ホスト200のシ
ステムが立ち上がると、オペレータは稼動型ホットスタ
ンバイ制御ジョブ120,待機型ホットスタンバイ制御
ジョブ220を起動させる。稼動型ホットスタンバイ制
御ジョブ120,待機型ホットスタンバイ制御ジョブ2
20は準備完了状態になると、ホットスタンバイプロセ
ス110,210へ準備完了状態になったことを通知す
る。
When the systems of the active host 100 and the standby host 200 are started, the operator starts the active hot standby control job 120 and the standby hot standby control job 220. Active hot standby control job 120, standby hot standby control job 2
When the process 20 becomes ready, it notifies the hot standby processes 110 and 210 that it has become ready.

【0025】この通知を受けると、ホットスタンバイプ
ロセス110,210はホットスタンバイ制御ジョブ監
視手段111,211を用いて制御テーブル160,2
60に稼動型ホットスタンバイ制御ジョブ120,待機
型ホットスタンバイ制御ジョブ220が準備完了状態に
なったことを登録する。
Upon receiving this notification, the hot standby process 110, 210 uses the hot standby control job monitoring means 111, 211 to update the control table 160, 2.
60, it is registered that the active type hot standby control job 120 and the standby type hot standby control job 220 have become ready.

【0026】稼動型ホットスタンバイ制御ジョブ120
,待機型ホットスタンバイ制御ジョブ220が準備完了
状態になったことをコンソール等により確認すると、オ
ペレータは業務運転プログラム130,230をそれぞ
れ稼動型,待機型として起動する。これにより、稼動ホ
スト100側はオンライン業務等の現用系業務を開始し
、待機ホスト200側は業務引き継ぎ準備完了状態にな
る。それを確認すると、稼動型ホットスタンバイ制御ジ
ョブ120はホットスタンバイプロセス110へ現用系
業務が開始されたことを通知し、,待機型ホットスタン
バイ制御ジョブ220はホットスタンバイプロセス21
0へ業務引き継ぎ準備完了状態になったことを通知する
Active hot standby control job 120
When the operator confirms through a console or the like that the hot standby control job 220 is ready, the operator starts the business operation programs 130 and 230 as active type and standby type, respectively. As a result, the active host 100 side starts active business such as online business, and the standby host 200 side becomes ready to take over the business. After confirming this, the active hot standby control job 120 notifies the hot standby process 110 that the active business has started, and the standby hot standby control job 220 notifies the hot standby process 110 that the active work has started.
0 is notified that the preparation for business handover is complete.

【0027】この通知を受けると、ホットスタンバイプ
ロセス110内のホットスタンバイ制御ジョブ監視手段
111は制御テーブル160に現用系業務が開始された
ことを登録し、ホットスタンバイプロセス210内のホ
ットスタンバイ制御ジョブ監視手段211は制御テーブ
ル260に業務引き継ぎ準備完了状態になったことを登
録する。
Upon receiving this notification, the hot standby control job monitoring means 111 in the hot standby process 110 registers in the control table 160 that the active work has started, and the hot standby control job monitoring unit 111 in the hot standby process 210 registers the start of the active system job in the control table 160. The means 211 registers in the control table 260 that the preparation for business handover has been completed.

【0028】稼動型ホットスタンバイ制御ジョブ120
は現用系業務が開始されたことを確認すると、ホットス
タンバイ成立手段121を用いて待機型ホットスタンバ
イ制御ジョブ220内のホットスタンバイ成立手段22
1とジョブ間通信手段102を介した通信を行なう。そ
して、待機ホスト200側が業務引き継ぎ準備完了状態
となっていることを確認することによりホットスタンバ
イ成立状態になる。また、待機型ホットスタンバイ制御
ジョブ220は業務引き継ぎ準備完了状態になったこと
を確認すると、ホットスタンバイ成立手段221を用い
て稼動型ホットスタンバイ制御ジョブ120内のホット
スタンバイ成立手段121とジョブ間通信手段102を
介した通信を行なう。そして、稼動ホスト100側が現
用系業務を開始していることを確認することによりホッ
トスタンバイ成立状態となる。尚、ホットスタンバイ成
立状態に於いては、稼動型ホットスタンバイ制御ジョブ
120と待機型ホットスタンバイ制御ジョブ220とは
稼動ホスト100側の異常を間接的に検出するために一
定時間間隔でデータの送受信を行なう。
Active hot standby control job 120
When confirming that the active work has started, the hot standby establishment means 22 in the standby type hot standby control job 220 uses the hot standby establishment means 121.
1 through the inter-job communication means 102. Then, by confirming that the standby host 200 side is ready to take over the business, the hot standby state is established. Further, when the standby type hot standby control job 220 confirms that the job handover preparation is completed, the hot standby establishment means 221 is used to communicate with the hot standby establishment means 121 in the active type hot standby control job 120 and the inter-job communication means. Communication is performed via 102. Then, by confirming that the active host 100 side has started the active service, a hot standby state is established. In addition, in the hot standby established state, the active hot standby control job 120 and the standby hot standby control job 220 send and receive data at fixed time intervals in order to indirectly detect abnormalities on the active host 100 side. Let's do it.

【0029】待機型ホットスタンバイ制御ジョブ220
はホットスタンバイ成立状態に於いて、待機型として起
動された業務運転プログラム230がストール状態に陥
ったことを検出すると、ホットスタンバイ解除手段22
2を用いてホットスタンバイ解除通知を稼動型ホットス
タンバイ制御ジョブ120内のホットスタンバイ解除手
段122にジョブ間通信手段102を介して送出する。 この通知をホットスタンバイ解除手段122が受けると
、稼動型ホットスタンバイ制御ジョブ120はホットス
タンバイ解除状態となり、ジョブ間通信手段102を介
してホットスタンバイ解除手段222へ応答を返す。 ホットスタンバイ解除手段222がホットスタンバイ解
除手段122からの応答を受け取ると、待機型ホットス
タンバイ制御ジョブ220はホットスタンバイ解除状態
となる。
[0029] Standby type hot standby control job 220
In the hot standby established state, when it is detected that the business operation program 230 started as a standby type has fallen into a stall state, the hot standby release means 22
2 is used to send a hot standby release notification to the hot standby release means 122 in the active hot standby control job 120 via the inter-job communication means 102. When the hot standby release means 122 receives this notification, the active hot standby control job 120 enters the hot standby release state and returns a response to the hot standby release means 222 via the inter-job communication means 102. When the hot standby release means 222 receives the response from the hot standby release means 122, the standby hot standby control job 220 enters the hot standby release state.

【0030】また、稼動型ホットスタンバイ制御ジョブ
120はホットスタンバイ成立状態に於いて、稼動ホス
ト100の異常を業務運転プログラム130により行な
っている現用系業務に応答が極端に遅れる等の動作異常
が発生したこと等に基づいて検出すると、ホットスタン
バイプロセス110に対してホスト切り替え要求140
を上げる。
Furthermore, in the active hot standby control job 120, when the hot standby is established, an abnormality occurs in the active host 100, such as an extremely delayed response to the active business being performed by the business operation program 130. If detected based on the fact that the hot standby process 110 has
raise.

【0031】ホスト切り替え要求140を受けると、ホ
ットスタンバイプロセス110は自ホスト強制ダウン手
段150を起動する。これにより、自ホスト強制ダウン
手段150は稼動ホスト100を強制的にダンウさせ、
ダウン処理が完了すると、ホスト間通信手段101を用
いて待機ホスト200へダウン通知103を送出する。
Upon receiving the host switching request 140, the hot standby process 110 activates its own host forced down means 150. As a result, the own host forced down means 150 forcibly downs the active host 100,
When the down processing is completed, a down notification 103 is sent to the standby host 200 using the inter-host communication means 101.

【0032】自ホスト強制ダウン手段150からのダウ
ン通知103はホットスタンバイプロセス210により
受信され、ホットスタンバイプロセス210はダウン通
知103を受信すると、制御テーブル260を参照する
。そして、待機型ホットスタンバイ制御ジョブ220が
業務引き継ぎ準備完了状態になっていることを確認する
と、待機型ホットスタンバイ制御ジョブ220に切り替
え要求240を送る。これにより、待機型ホットスタン
バイ制御ジョブ220は業務引き継ぎ手段223を用い
て現用系業務で使用していたデータベースやジャーナル
ファイル等が割り当てられているディスク装置等の資源
の取り込みやネットワークの切り替え等を行ない、その
後、待機型として起動されている業務運転プログラム2
30を稼動型に切り替えて業務運転を再開する。
The down notification 103 from the own host forced down means 150 is received by the hot standby process 210, and upon receiving the down notification 103, the hot standby process 210 refers to the control table 260. When it is confirmed that the standby hot standby control job 220 is ready for business takeover, it sends a switching request 240 to the standby hot standby control job 220. As a result, the standby hot standby control job 220 uses the business handover means 223 to import resources such as disk devices to which databases, journal files, etc. used in the active business are allocated, and to switch networks. , After that, commercial operation program 2 is started as a standby type.
30 will be switched to operational type and resume commercial operation.

【0033】また、稼動ホスト,待機ホストの切り替え
は以下のような場合にも行なわれる。ホットスタンバイ
成立状態に於いては稼動型ホットスタンバイ制御ジョブ
120と待機型ホットスタンバイ制御ジョブ220とは
ジョブ間通信手段102を介して一定時間間隔でデータ
の送受信を行なっているが、稼動型ホットスタンバイ制
御ジョブ120からのデータが途絶えると、待機型ホッ
トスタンバイ制御ジョブ220はホットスタンバイプロ
セス210に対して他系確認要求250を上げる。これ
により、ホットスタンバイプロセス210は他系確認手
段212を起動する。他系確認手段212は起動される
と、ホスト間通信手段101を用いて他系確認を行ない
、これに対する応答が一定時間経過しても稼動ホスト1
00から返却されない場合はホットスタンバイプロセス
210は稼動ホスト100にストール等の異常が発生し
ていると判断し、他ホスト強制ダウン起動手段213を
用いて稼動ホスト100に強制ダウン要求104を送出
する。
Switching between the active host and the standby host is also performed in the following cases. In the hot standby established state, the active hot standby control job 120 and the standby hot standby control job 220 exchange data at regular intervals via the inter-job communication means 102. When the data from the control job 120 is interrupted, the standby hot standby control job 220 issues an other system confirmation request 250 to the hot standby process 210. As a result, the hot standby process 210 activates the other system confirmation means 212. When activated, the other system confirmation means 212 performs other system confirmation using the inter-host communication means 101, and even if the response to this is not received after a certain period of time, the active host
If the hot standby process 210 does not return from 00, the hot standby process 210 determines that an abnormality such as a stall has occurred in the active host 100, and sends a forced down request 104 to the active host 100 using the other host forced down activation means 213.

【0034】この強制ダウン要求104を受け取ったホ
ットスタンバイプロセス110は自ホスト強制ダウン手
段150を用いて稼動ホスト100を強制的にダウンさ
せ、自ホスト強制ダウン手段150はダウン処理が完了
すると、ホスト間通信手段101を介して待機ホスト2
00にダウン通知103を送出する。ダウン通知103
が送出された後は前述したと同様の動作が行なわれる。
The hot standby process 110 that has received this forced down request 104 forcibly brings down the active host 100 using its own host forced down means 150, and when the own host forced down means 150 completes the down process, the host The standby host 2 via the communication means 101
A down notification 103 is sent to 00. Down notification 103
After the is sent, the same operation as described above is performed.

【0035】[0035]

【発明の効果】以上説明したように、本発明は、稼動ホ
ストに稼動ホストの異常を検出する稼動型ホットスタン
バイ制御ジョブを設けたものであるので、ジョブ間通信
により間接的に稼動ホストの異常を検出していた従来例
に比較して信頼性及び検出速度を向上させることができ
る効果がある。
Effects of the Invention As explained above, the present invention is provided with an active hot standby control job for detecting abnormalities in the active host, so that abnormalities in the active host can be detected indirectly through inter-job communication. This has the effect of improving reliability and detection speed compared to conventional methods that detect .

【0036】また、本発明は稼動型ホットスタンバイ制
御ジョブからのホスト切り替え要求及び待機ホストから
の強制ダウン要求に応答して稼動ホストを強制的にダウ
ンさせる自ホスト強制ダウン手段を設けたものであるの
で、稼動ホスト,待機ホストの切り替えを高速に行なう
ことが可能になる効果がある。
Further, the present invention is provided with self-host forced down means for forcibly bringing down an active host in response to a host switching request from an active hot standby control job and a forced down request from a standby host. Therefore, there is an effect that switching between the active host and the standby host can be performed at high speed.

【0037】また、更に、本発明は待機型ホットスタン
バイ制御ジョブに業務運転を行なうために必要となる資
源を取り込む機能を設けたものであるので、アプリケー
ションプログラムである業務運転プログラムの開発工数
を大幅に削減できる効果がある。
Furthermore, since the present invention provides the standby hot standby control job with a function of importing resources necessary for business operation, the number of man-hours required for developing the business operation program, which is an application program, can be greatly reduced. It has the effect of reducing

【図面の簡単な説明】[Brief explanation of the drawing]

【図1】本発明の実施例のブロック図である。FIG. 1 is a block diagram of an embodiment of the invention.

【符号の説明】[Explanation of symbols]

100…稼動ホスト 101…ホスト間通信手段 102…ジョブ間通信手段 110,210…ホットスタンバイプロセス111,2
11…ホットスタンバイ制御ジョブ監視手段120…稼
動型ホットスタンバイ制御ジョブ121,221…ホッ
トスタンバイ成立手段122,222…ホットスタンバ
イ解除手段130,230…業務運転プログラム 150…自ホスト強制ダウン手段 160,260…制御テーブル 200…待機ホスト 212…他系確認手段 213…他ホスト強制ダウン起動手段 220…待機型ホットスタンバイ制御ジョブ223…業
務引き継ぎ手段
100... Active host 101... Inter-host communication means 102... Inter-job communication means 110, 210... Hot standby process 111, 2
11...Hot standby control job monitoring means 120...Active hot standby control job 121, 221...Hot standby establishing means 122, 222...Hot standby canceling means 130, 230...Business operation program 150...Self host forced down means 160, 260... Control table 200... Standby host 212... Other system confirmation means 213... Other host forced down activation means 220... Standby type hot standby control job 223... Business handover means

Claims (2)

【特許請求の範囲】[Claims] 【請求項1】  現用系の稼動ホストと、該稼動ホスト
の運転中はサービス開始可能な状態で待機している予備
系の待機ホストとから構成されるホットスタンバイシス
テムに於いて、前記稼動ホストは、制御下に稼動型とし
て起動されている第1の業務運転プログラムを有し、自
ホストの異常を検出することによりホスト切り替え要求
を出力する稼動型ホットスタンバイ制御ジョブと、自ホ
ストを強制的にダウンさせると共に前記待機ホストへダ
ウン通知を出力する自ホスト強制ダウン手段と、該自ホ
スト強制ダウン手段を制御する第1のホットスタンバイ
プロセスとを含み、前記待機ホストは、制御下に待機型
として起動されている第2の業務運転プログラムを有し
、前記稼動型ホットスタンバイ制御ジョブとのジョブ間
通信によって前記稼動ホストの異常を検出することによ
り他系確認要求を出力し、切り替え要求に応答して業務
運転に必要な資源を取り込むと共に前記待機型として起
動されている第2の業務運転プログラムを稼動型に切り
替えて運転業務を再開させる待機型ホットスタンバイ制
御ジョブと、前記他系確認要求に応答して前記稼動ホス
トが正常か否かを判定し、異常と判定することにより強
制ダウン要求を出力すると共に、前記ダウン通知に応答
して前記切り替え要求を出力する第2のホットスタンバ
イプロセスとを含み、前記第1のホットスタンバイプロ
セスは前記稼動型ホットスタンバイ制御ジョブが出力す
るホスト切り替え要求及び前記第2のホットスタンバイ
プロセスが出力する強制ダウン要求に応答して前記自ホ
スト強制ダウン手段を起動して前記稼動ホストをダウン
させることを特徴とするホットスタンバイシステム。
Claim 1: In a hot standby system consisting of an active host and a standby standby host that is ready to start service while the active host is in operation, the active host is , has a first business operation program started as an active type under control, and has an active hot standby control job that outputs a host switching request by detecting an abnormality in the own host, and a hot standby control job that forcibly activates the own host. a host host forced down means for causing the host to go down and outputting a down notification to the standby host; and a first hot standby process for controlling the host host forcible down means, wherein the standby host is activated as a standby type under control. has a second business operation program that is configured to operate, and outputs an other system confirmation request by detecting an abnormality in the active host through inter-job communication with the active hot standby control job, and responds to the switching request. A standby type hot standby control job that takes in the resources necessary for the business operation and switches the second business operation program started as the standby type to the active type to resume the operation job, and responds to the other system confirmation request. a second hot standby process that determines whether the operating host is normal or not, outputs a forced down request when determining that it is abnormal, and outputs the switching request in response to the down notification; The first hot standby process activates the own host forced down means in response to the host switching request outputted by the active hot standby control job and the forced down request outputted by the second hot standby process, and A hot standby system characterized by bringing down the operating host.
【請求項2】  前記稼動型ホットスタンバイ制御ジョ
ブは前記第1の業務運転プログラムにより行なっている
業務に於ける応答時間に基づいて前記稼動ホストの異常
を検出することを特徴とする請求項1記載のホットスタ
ンバイシステム。
2. The active hot standby control job detects an abnormality in the active host based on a response time in a job being performed by the first business operation program. hot standby system.
JP3044458A 1991-02-15 1991-02-15 Hot standby system Pending JPH04262428A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3044458A JPH04262428A (en) 1991-02-15 1991-02-15 Hot standby system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3044458A JPH04262428A (en) 1991-02-15 1991-02-15 Hot standby system

Publications (1)

Publication Number Publication Date
JPH04262428A true JPH04262428A (en) 1992-09-17

Family

ID=12692047

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3044458A Pending JPH04262428A (en) 1991-02-15 1991-02-15 Hot standby system

Country Status (1)

Country Link
JP (1) JPH04262428A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008310411A (en) * 2007-06-12 2008-12-25 Nec Corp Duplex device and system switching method in failure
JP2010026714A (en) * 2008-07-17 2010-02-04 Toshiba Corp Computer and program, configuring cluster system

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008310411A (en) * 2007-06-12 2008-12-25 Nec Corp Duplex device and system switching method in failure
JP2010026714A (en) * 2008-07-17 2010-02-04 Toshiba Corp Computer and program, configuring cluster system
JP4599435B2 (en) * 2008-07-17 2010-12-15 株式会社東芝 Computer and program constituting cluster system

Similar Documents

Publication Publication Date Title
US6728746B1 (en) Computer system comprising a plurality of machines connected to a shared memory, and control method for a computer system comprising a plurality of machines connected to a shared memory
JP2003022258A (en) Backup system for server
JP2006072591A (en) Virtual computer control method
JPH06243070A (en) Inter-processor communication system
CN100463411C (en) Controlling service failover in clustered storage apparatus networks and opration method thereof
JPH04262428A (en) Hot standby system
JP2776442B2 (en) Compound computer system
JP2705617B2 (en) Power off method
JPH0341524A (en) Hot stand-by system
JP2545763B2 (en) Restart method of batch processing in hot standby system
JP2629415B2 (en) A business process switching method in a mutual standby system
JPH03278238A (en) Mutual hot stand-by system
JPH05158585A (en) Power source control system for work station
JPH02310755A (en) Health check system
JPH11184814A (en) Terminal switch device
JP2504241B2 (en) Computer system
JP2658215B2 (en) Automatic transaction equipment
JP2555752B2 (en) Event notification processing method
JP3316739B2 (en) Device interface control method
JP3411966B2 (en) Configuration method of service management function of intelligent network
JPH04112314A (en) Monitoring system for cut-off of terminal power supply
JP2003316750A (en) Processing system, processing device, and restart processing method
JPH02135836A (en) Relay path management processing system
JPH11110325A (en) Information processing system
JPS628830B2 (en)