JPH1196033A - Information processor - Google Patents

Information processor

Info

Publication number
JPH1196033A
JPH1196033A JP9255011A JP25501197A JPH1196033A JP H1196033 A JPH1196033 A JP H1196033A JP 9255011 A JP9255011 A JP 9255011A JP 25501197 A JP25501197 A JP 25501197A JP H1196033 A JPH1196033 A JP H1196033A
Authority
JP
Japan
Prior art keywords
unit
active
information processing
standby
processing device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP9255011A
Other languages
Japanese (ja)
Other versions
JP3420919B2 (en
Inventor
Atsuo Kobayashi
敦夫 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Hitachi Information Technology Co Ltd
Original Assignee
Hitachi Ltd
Hitachi Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd, Hitachi Information Technology Co Ltd filed Critical Hitachi Ltd
Priority to JP25501197A priority Critical patent/JP3420919B2/en
Publication of JPH1196033A publication Critical patent/JPH1196033A/en
Application granted granted Critical
Publication of JP3420919B2 publication Critical patent/JP3420919B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Hardware Redundancy (AREA)

Abstract

PROBLEM TO BE SOLVED: To inexpensively realize the sure and quick backup switching for a hot stand-by system. SOLUTION: When an active equipment 100 (1) breaks down, its auxiliary processor 120 (1) drives a reset signal RST to stop a main processor 120 (1), informs a reserve equipment 100 (2) of a break down informing telegram through a communication line 130 to allow a main processor 110 (2) in the reserve equipment 100 (2) to succeed operation. Or when the reserve equipment 100 (2) detects the break down of the active equipment 100 (1) by helth check and outputs a separation request telegram to the line 130 through an auxiliary processor 120 (2), the auxiliary processor 120 (1) starts a reset signal RST to stop the main processor 110 (1) and then the main processor 110 (2) succeeds the operation.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、現用機のバックア
ップのための予備機をホットな状態で待機させるホット
スタンバイシステムの現用機または予備機として動作す
る情報処理装置に係り、特に、ホットスタンバイシステ
ムのバックアップ切り替え高速化、システム稼動率向上
に好適な情報処理装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an information processing apparatus which operates as an active unit or a standby unit of a hot standby system in which a standby unit for backup of an active unit stands by in a hot state, and more particularly to a hot standby system. The present invention relates to an information processing apparatus suitable for speeding up backup switching and improving system operation rate.

【0002】[0002]

【従来の技術】ホットスタンバイシステムのバックアッ
プ切り替え方式として、予備機側で現用機のヘルスチェ
ックを定期的に行い、現用機のダウンを検出した時に予
備機からの制御で現用機の切り離しを行い、しかる後に
予備機が現用機の業務を引き継ぐ方式が従来より広く採
用されている。
2. Description of the Related Art As a backup switching method of a hot standby system, a health check of an active device is periodically performed on a standby device side, and when a down of the active device is detected, the active device is separated by control from the standby device. After that, a system in which a spare machine takes over the work of an active machine has been widely adopted.

【0003】また、現用処理系と待機処理系からなるデ
ュプレックスシステムにおいて、現用処理系で自系の障
害を検出した時に待機処理系へ割込み信号を送出し、そ
れに対する待機処理系からの受付信号を受け取ると割込
み信号送出フラグ情報をセットしておき、待機処理系で
は割込み信号を受け付けた後に強制停止信号を現用処理
系へ送出し、現用処理系では、強制停止信号を受けた時
に、割込み信号送出フラグ情報がセットされていること
を条件に自系の処理実行を停止させ、待機処理系が現用
処理系の処理を引き継ぐ系切替制御方式が知られている
(例えば特公昭63−43771号公報)。
Further, in a duplex system composed of an active processing system and a standby processing system, an interrupt signal is sent to the standby processing system when a failure of the own processing system is detected in the active processing system, and an acceptance signal from the standby processing system is transmitted in response to the interrupt signal. Upon receipt, interrupt signal transmission flag information is set, and the standby processing system sends a forced stop signal to the active processing system after receiving the interrupt signal. The active processing system sends an interrupt signal when the forced stop signal is received. There is known a system switching control system in which the execution of processing of the own system is stopped on condition that the flag information is set, and the standby processing system takes over the processing of the active processing system (for example, Japanese Patent Publication No. 63-43771). .

【0004】[0004]

【発明が解決しようとする課題】前述の予備機によるヘ
ルスチェックによって現用機のダウンを検出してバック
アップ切り替えを行う方式は、確実性にやや欠ける点が
あった。すなわち、一般的に、ヘルスチェックは、予備
機と現用機の間の通信路を通じて、予備機より「Are y
ou alive?」というようなことを意味する電文を現用機
に送り、それに対する「I am alive.」というようなこ
とを意味する応答電文を確認するという単純な折り返し
通信によっているので、通信誤りや電文抜けにより現用
機のダウンを誤検出したり、逆に見過ごしたりする危険
があり、その結果、無用なバックアップ切り替えが起動
されたり、必要なバックアップ切り替えが行われないこ
とがあった。
The above-mentioned system in which the backup of the active unit is detected by the health check by the standby unit and the backup is switched has a little lack of certainty. That is, in general, the health check is performed by the standby unit through the communication path between the standby unit and the active unit.
ou alive? ”Is sent to the current machine, and the response message corresponding to“ I am alive. ”Is confirmed by simple loopback communication. There is a risk that the down of the active device is erroneously detected or conversely overlooked. As a result, unnecessary backup switching may be activated or necessary backup switching may not be performed.

【0005】また、ホットスタンバイシステムにおい
て、現用機がダウンしてから予備機が稼動するまでのバ
ックアップ切り替え時間は不稼動時間となるため、シス
テムの稼働率はバックアップ切り替え時間に大きく依存
するが、このバックアップ切り替え時間はヘルスチェッ
ク時間間隔より短くすることができない。しかるに、ヘ
ルスチェックには上に述べたような通信誤りや電文抜け
の可能性があり、1回の確認応答で現用機のダウンを判
断することは信頼性に問題があるため、ある程度の時間
をとって確認の中身に冗長性を持たせる必要があり、ヘ
ルスチェックの結果、ダウンとしてことを十分な確度で
判定するために要する時間は一般に数十秒から数分とか
なり長い。したがって、バックアップ切り替え時間の短
縮が困難であった。
In a hot standby system, the backup switching time from when the active unit goes down to when the standby unit starts operating is a non-operation time. Therefore, the operating rate of the system greatly depends on the backup switching time. The backup switching time cannot be shorter than the health check time interval. However, the health check has the possibility of communication errors and missing telegrams as described above, and it is not reliable to determine that the active device is down with one confirmation response. Therefore, it is necessary to make the contents of the confirmation redundant, and as a result of the health check, the time required to determine that the state is down with sufficient accuracy is generally quite long, from tens of seconds to several minutes. Therefore, it has been difficult to reduce the backup switching time.

【0006】なお、バックアップ切り替え時間を短縮す
るためにヘルスチェック時間間隔を無理に短縮すると、
上に述べたように信頼性が悪化するほか、ヘルスチッェ
クのために計算機時間が大きく割かれシステムスループ
ットの低下をまねくという別の問題がある。
If the health check time interval is forcibly shortened to shorten the backup switching time,
As described above, there is another problem that the reliability is deteriorated, and that the computer time is largely divided due to the health check, leading to a decrease in the system throughput.

【0007】また、特公昭63−43771号公報の系
切替制御方式は、現用機(現用処理系)と予備機(待機
処理系)の台数の多いホットスタンバイシステムに適用
しようとすると、すべての現用機と予備機との間を割込
み信号、その受付信号、強制停止指示信号等を伝達する
ための信号線で結線しなければならず、バックアップ切
り替え機構が大規模、高価なものになるという問題があ
る。
Further, the system switching control system disclosed in Japanese Patent Publication No. 63-43771 is intended to be applied to a hot standby system having a large number of working machines (working processing systems) and spare machines (standby processing systems). Must be connected by a signal line for transmitting an interrupt signal, a reception signal thereof, a forced stop instruction signal, etc. between the machine and the spare machine, and the problem that the backup switching mechanism becomes large-scale and expensive. is there.

【0008】本発明の目的は、ホットスタンバスシステ
ムの現用機または予備機として動作する情報処理装置に
おいて、システムスループットの低下を招くことなく、
より確実なバックアップ切り替えが可能で、バックアッ
プ切り替え時間も短縮可能な情報処理装置を提供するこ
とにある。
An object of the present invention is to provide an information processing apparatus which operates as an active unit or a standby unit of a hot stun bus system without lowering the system throughput.
An object of the present invention is to provide an information processing apparatus capable of performing more reliable backup switching and shortening the backup switching time.

【0009】本発明のもう一つの目的は、ホットスタン
バイシステムの現用機と予備機の台数が多い場合にも、
バックアップ切り替えのために膨大な信号線の結線を必
要とせず、バックアップ切り替え機構を安価に実現可能
な情報処理装置を提供することにある。
Another object of the present invention is to provide a hot standby system in which the number of active and standby units is large.
An object of the present invention is to provide an information processing apparatus which does not require a huge connection of signal lines for backup switching and can realize a backup switching mechanism at low cost.

【0010】[0010]

【課題を解決するための手段】前記目的を達成するた
め、本発明のホットスタンバイシステムの現用機又は予
備機として動作する情報処理装置によれば、現用機とし
て動作時に当該現用機のダウンを検出して当該現用機の
ためのバックアップ切り替えを起動する手段と、予備機
として動作時に現用機側のダウンを検出して現用機のた
めのバックアップ切り替えを起動する手段の両方が設け
られる。
According to an aspect of the present invention, there is provided an information processing apparatus operating as an active unit or a standby unit of a hot standby system according to the present invention. Both means for activating backup switching for the active device and means for detecting backup of the active device during operation as a standby device and activating backup switching for the active device are provided.

【0011】現用機として動作時、そのダウンを直接的
に検出できるため、ダウンした現用機からバックアップ
切り替えを起動することにより、迅速なバックアップ切
り替え処理が可能になる。そして、そのバックアップ切
り替えの処理に失敗した場合(例えば、ダウンした現用
機の切り離しが予備機に正常に伝達できず、予備機側が
バックアップ処理を行わないような場合)でも、その現
用機のダウンが予備機側で検出されれば、予備機として
動作時に、予備機からバックアップ切り替えが起動さ
れ、バックアップ切り替え処理に成功する可能性が高
い。つまり、本発明の情報処理装置によるホットスタン
バイシステムにおいては、現用機からのバックアップ切
り替え起動と予備機からのバックアップ切り替え起動の
併用により、全体としてバックアップ切り替え時間の短
縮が可能になるとともに、フェイルセーフ効果を得られ
バックアップ切り替えの確実性が高まる。さらに、予備
機側で現用機のダウン検出を従来と同様のヘルスチッェ
クで行う場合でも、システムスループットの低下をもた
らすようなヘルスチェック時間間隔の無理な短縮を行う
必要がない。
When operating as an active unit, its down can be directly detected, so that backup switching can be promptly performed by starting backup switching from the down active unit. Then, even if the backup switching process fails (for example, the disconnection of the down active device cannot be normally transmitted to the backup device and the backup device does not perform the backup process), the backup of the active device fails. If it is detected on the spare device side, backup switching is started from the spare device when operating as a spare device, and there is a high possibility that the backup switching process will succeed. In other words, in the hot standby system using the information processing apparatus of the present invention, the backup switching start-up from the active unit and the backup switching start-up from the standby unit are used together, so that the backup switching time can be shortened as a whole and the fail-safe effect can be obtained. And increase the certainty of switching backups. Further, even when the standby unit detects the down of the active unit by using the same health check as the conventional one, it is not necessary to forcibly shorten the health check time interval to lower the system throughput.

【0012】また、本発明によれば、ダウンした現用機
より、それが切り離されたことが当該現用機に対する予
備機に通知され、また、ダウンした現用機に、当該現用
機に対する予備機より切り離しが指示される。この場
合、バックアップ切り替えに関連した現用機と予備機と
の間での切り離し通知や切り離し指示の受け渡しのため
に、全情報処理装置に共通な一つの通信路を設けるだけ
でよく、システム上の情報処理装置の台数が多い場合で
も、前記特公昭63−43771号の方式のようなバッ
クアップ切り替え機構の大規模化を避けることができ
る。
Also, according to the present invention, a disconnection from the down active unit is notified to the standby unit for the active unit, and the down active unit is disconnected from the standby unit for the active unit. Is indicated. In this case, it is only necessary to provide a single communication path common to all information processing devices for the notification of the disconnection and the transfer of the disconnection instruction between the active device and the backup device related to the backup switching, and the information on the system Even when the number of processing devices is large, it is possible to avoid an increase in the size of the backup switching mechanism as in the method of JP-B-63-43771.

【0013】ところで、ダウンした現用機に対し、その
現用機及び予備機からバックアップ切り替えが重複して
起動され、ダウンした現用機の切り離し処理が重複して
行われると不都合な場合がある。例えば、現用機の切り
離しをシステムリセットによって行うとすると、2回目
のリセットで1回目のリセット時の情報処理装置の状況
が破壊されてしまい、ダウン原因の解析に支障をきたす
恐れがある。本発明の情報処理装置によれば、現用機と
して動作時、その切り離し処理の重複実行を防止するた
めの手段が設けられるため、そのような不都合を回避で
きる。
By the way, it may be inconvenient if backup switching is started from the active unit and the standby unit redundantly for the down active unit, and the disconnection process of the down active unit is performed repeatedly. For example, if the active device is disconnected by a system reset, the situation of the information processing apparatus at the time of the first reset is destroyed by the second reset, which may hinder the analysis of the cause of the down. According to the information processing apparatus of the present invention, such a disadvantage can be avoided because the information processing apparatus is provided with a means for preventing the execution of the disconnection process from being performed repeatedly when operating as the active device.

【0014】[0014]

【発明の実施の形態】以下、図面を用い、本発明の実施
の形態を説明する。図1は、ホットスタンバイシステム
において現用機又は予備機として用いられる本発明の情
報処理装置の一例を示す概略ブロック図である。図1に
おいて、情報処理装置100は、業務処理又はバックア
ップ処理を実行する主処理装置110に加え、バックア
ップ切り替えに関与する補助処理装置120を有する。
補助処理装置120は通信手段121、センサインタフ
ェース部122、通信ポート123、リセット信号駆動
部124及び制御部125からなる。
Embodiments of the present invention will be described below with reference to the drawings. FIG. 1 is a schematic block diagram showing an example of the information processing apparatus of the present invention used as an active unit or a standby unit in a hot standby system. In FIG. 1, the information processing apparatus 100 includes an auxiliary processing device 120 involved in backup switching, in addition to a main processing device 110 that executes a business process or a backup process.
The auxiliary processing device 120 includes a communication unit 121, a sensor interface unit 122, a communication port 123, a reset signal driving unit 124, and a control unit 125.

【0015】リセット信号駆動部124は主処理装置1
10に対するリセット信号RSTの駆動を行うものであ
る。通信手段121は主処理装置110と補助処理装置
120との情報受け渡しのための手段で、例えばシリア
ル通信回線、又は主処理装置110との共有メモリもし
くは共有レジスタである。センサインタフェース部12
2は、主処理装置110の動作異常、電源112の電圧
異常、冷却ファン114の動作異常等、主処理装置11
0による業務続行が不可能な異常を検出するものであ
る。通信ポート123は、補助処理装置間通信路130
に接続された他の情報処理装置の補助処理装置との間で
通信を行うためのものである。この補助処理装置間通信
路130を利用して、複数の情報処理装置の補助処理装
置間で障害発生の通知及び切り離し要求の通知が伝送さ
れる。制御部125は、補助処理装置120内の各部の
制御等を行う部分である。
The reset signal driver 124 is a main processing unit 1
10 is driven by the reset signal RST. The communication unit 121 is a unit for transferring information between the main processing unit 110 and the auxiliary processing unit 120, and is, for example, a serial communication line or a shared memory or a shared register with the main processing unit 110. Sensor interface unit 12
2 is a main processing device 11 such as an abnormal operation of the main processing device 110, an abnormal voltage of the power supply 112, an abnormal operation of the cooling fan 114, or the like.
This is to detect an abnormality that cannot be continued with 0. The communication port 123 is a communication path 130 between the auxiliary processing devices.
For communicating with an auxiliary processing device of another information processing device connected to the information processing device. Using this communication path 130 between auxiliary processing devices, a notification of a failure occurrence and a notification of a disconnection request are transmitted between auxiliary processing devices of a plurality of information processing devices. The control unit 125 is a unit that controls each unit in the auxiliary processing device 120 and the like.

【0016】図2に、図1の情報処理装置が2台、現用
機あるいは予備機1台として利用されるホットスタンバ
イシステムの一例を示す。図2において、2台の情報処
理装置100(1),100(2)はそれぞれ図1に示
した構成のものであるが、図面の煩雑さを避けるため内
部構成は簡略化されている。ここでは、便宜上、情報処
理装置100(1)を現用機、他方の情報処理装置10
0(2)を予備機として説明するが、その逆であっても
構わない。業務用資源200は、主処理装置が業務処理
を実行する上で必要なデータを格納した外部記憶装置、
通信回線等である。
FIG. 2 shows an example of a hot standby system in which two information processing apparatuses shown in FIG. 1 are used as an active unit or a standby unit. In FIG. 2, the two information processing apparatuses 100 (1) and 100 (2) each have the configuration shown in FIG. 1, but the internal configuration is simplified to avoid complication of the drawing. Here, for convenience, the information processing device 100 (1) is an active device, and the other information processing device 10 (1) is
0 (2) will be described as a spare machine, but the reverse is also possible. The business resource 200 is an external storage device that stores data necessary for the main processing device to execute business processing,
It is a communication line or the like.

【0017】まず、予備機100(2)からバックアッ
プ切り替えを起動する場合について説明する。この場
合、現用機100(1)の切り離しの開始契機は、予備
機100(2)のオペレータによる切り離し起動操作、
又は現用機100(1)に対する定期的なヘルスチェッ
クによる異常検出である。このヘルスチェックは、従来
と同様に、予備機100(2)から定期的に現用機10
0(1)へ確認電文を送り、それに対する現用機100
(1)からの応答電文を確認することによって行われ
る。例えば、予備機100(2)において、その主処理
装置110(2)上のプログラムが補助処理装置120
(2)に対し現用機への確認電文の送信を指示する。こ
の指示を通信手段121を介して受け取った補助処理装
置120(2)の制御部125は、現用機100(1)に
対する確認電文を通信ポート123より補助処理装置間
通信路130へ送出する。現用機100(1)におい
て、補助処理装置120(1)はこの確認電文を通信ポ
ート123を介して受信すると、その制御部125はセ
ンサインタフェース部122が異常を検出していなけれ
ば、正常の旨の応答電文を通信ポート123より補助処
理装置間通信路130で予備機100(2)へ返す。予
備機100(2)においては、補助処理装置120
(2)が応答電文を通信ポート123で受信し、それを
通信手段121を介して主処理装置110(2)へ送
る。その主処理装置110(2)上のプログラムは、発
行した確認電文に対する応答電文を確認することによ
り、現用機100(1)が正常であるか異常であるかを
判断する。
First, a case where backup switching is started from the standby unit 100 (2) will be described. In this case, the disconnection start operation of the active unit 100 (1) is performed by the disconnection start operation by the operator of the standby unit 100 (2).
Alternatively, an abnormality is detected by performing a periodic health check on the active device 100 (1). This health check is performed periodically from the standby unit 100 (2) to the active unit 10 as in the conventional case.
A confirmation message is sent to 0 (1), and the
This is performed by confirming the response message from (1). For example, in the spare machine 100 (2), the program on the main processor 110 (2) is
Instruct (2) to transmit a confirmation message to the active device. The control unit 125 of the auxiliary processing device 120 (2) that has received this instruction via the communication unit 121 sends a confirmation message for the active device 100 (1) from the communication port 123 to the communication path 130 between the auxiliary processing devices. In the active unit 100 (1), when the auxiliary processing unit 120 (1) receives this confirmation message via the communication port 123, the control unit 125 determines that the sensor interface unit 122 is normal unless the sensor interface unit 122 detects an abnormality. Is returned from the communication port 123 to the standby unit 100 (2) through the communication path 130 between the auxiliary processing devices. In auxiliary machine 100 (2), auxiliary processing device 120
(2) receives the response message at the communication port 123 and sends it to the main processing unit 110 (2) via the communication means 121. The program on the main processing unit 110 (2) determines whether the active unit 100 (1) is normal or abnormal by confirming a response message to the issued confirmation message.

【0018】予備機100(2)において、ヘルスチェ
ツクにより現用機100(1)の動作異常が検出される
か、あるいはオペレータの切り離し起動操作がなされる
と、主処理装置110(2)上のプログラムが通信手段
121を介して補助処理装置120(2)に対し現用機
の切り離しを指示する。補助処理装置120(2)の制
御部125は、現用機100(1)に対する切り離し要
求電文を通信ポート123より補助処理装置間通信路1
30へ送出する。この切り離し要求電文の形式は図3に
その例を示すとおり、送信先アドレス300、送信元ア
ドレス301及び切り離しコマンド識別子302を含
む。この例では現用機100(1)には#1のアドレス
が割り当てられ、予備機100(2)には#2のアドレ
スが割り当てられている。
In the standby unit 100 (2), when an abnormality in the operation of the active unit 100 (1) is detected by the health check, or when the operator performs the disconnection start operation, the program on the main processing unit 110 (2) is executed. Instructs the auxiliary processing device 120 (2) to disconnect the active device via the communication means 121. The control unit 125 of the auxiliary processing device 120 (2) transmits a disconnection request message to the active device 100 (1) from the communication port 123 to the communication channel 1 between the auxiliary processing devices.
30. As shown in FIG. 3, the format of the disconnection request message includes a destination address 300, a source address 301, and a disconnection command identifier 302. In this example, the address of # 1 is assigned to the active unit 100 (1), and the address of # 2 is assigned to the standby unit 100 (2).

【0019】この切り離し要求電文は、現用機100
(1)の補助処理装置120(1)に通信ポート123
を介して受信される。補助処理装置120(1)の制御
部125は、受信した切り離し要求電文中の送信先アド
レスと自系のアドレスとの一致を確認すると、その電文
を自系に対する切り離し要求電文と判断し、リセット信
号駆動部124でリセット信号RSTを駆動させること
により主処理装置110(1)を停止させる。これによ
り、現用機100(1)の主処理装置110(1)から
業務用資源200へのアクセスが停止する。この後、予
備機100(2)の主処理装置110(2)は業務用資
源200を使用して業務処理を引き継ぐ。現用機100
(1)の主処理装置110(1)により各トランザクシ
ョンを処理中に、その処理進行状況を示す情報が主処理
装置110(1)上の特殊なプログラムによって業務用
資源200に逐次記憶されている。予備機100(2)
は、この情報に基づいて現用機100(1)によるトラ
ンザクション処理の状況を把握し、現用機100(1)
の処理を適切に引き継ぐことができる。
This disconnection request message is sent to the active device 100
The communication port 123 is connected to the auxiliary processing device 120 (1) of (1).
Is received via When the control unit 125 of the auxiliary processing device 120 (1) confirms that the transmission destination address in the received disconnection request message matches the address of the own system, the control unit 125 determines that the message is a disconnection request message for the own system and outputs a reset signal. The drive unit 124 drives the reset signal RST to stop the main processing unit 110 (1). As a result, access from the main processor 110 (1) of the active unit 100 (1) to the business resource 200 is stopped. Thereafter, the main processing unit 110 (2) of the standby unit 100 (2) takes over the business processing using the business resource 200. Working machine 100
While each transaction is being processed by the main processing unit 110 (1) of (1), information indicating the processing progress status is sequentially stored in the business resource 200 by a special program on the main processing unit 110 (1). . Spare machine 100 (2)
Grasps the status of transaction processing by the active device 100 (1) based on this information, and
Can be appropriately taken over.

【0020】次に、現用機100(1)側でその異常を
検出してバックアップ切り替えを起動する場合について
説明する。現用機100(1)の補助処理装置120
(1)において、制御部125はセンサインタフェース
部122を介して主処理装置110(1)のマシンチェ
ック、電源異常、冷却ファン異常など主処理装置110
(1)が動作続行不能な障害状態を検出すると、リセッ
ト信号駆動部124でリセット信号RSTを駆動させる
ことにより主処理装置110(1)を停止させる。これ
で業務用資源200は現用機100(1)から切り離さ
れる。
Next, a case will be described in which the active unit 100 (1) detects the abnormality and starts backup switching. Auxiliary processing unit 120 of working machine 100 (1)
In (1), the control unit 125 transmits the main processing unit 110 (1) through the sensor interface unit 122, such as a machine check of the main processing unit 110 (1), power supply abnormality, and cooling fan abnormality.
When (1) detects a failure state in which the operation cannot be continued, the reset signal driver 124 drives the reset signal RST to stop the main processing device 110 (1). As a result, the business resource 200 is separated from the active device 100 (1).

【0021】この後、現用機100(1)の補助処理装
置120(1)の制御部125は、通信ポート123を
介し予備機100(2)に対するダウン通知電文を補助
処理装置間通信路130へ送出する。このダウン通知電
文は図4に例を示すように、送信先アドレス400、送
信元アドレス、及び電文種別を含む。このダウン通知電
文は、予備機100(2)の補助処理装置120(2)
に通信ポート123を介して受信される。補助処理装置
120(2)の制御部125は、このダウン通知電文の
内容を通信手段121を介して主処理装置110(2)
に渡す。主処理装置110(2)上のプログラムは、そ
のダウン通知電文の送信先アドレスと自系のアドレスと
の一致を確認すると、現用機100(1)のバックアッ
プ処理を開始し、業務用資源200に記憶されている現
用機100(1)の処理進行状況情報を参照して業務処
理を引き継ぐ。なお、予備機100(2)において現用
機100(1)とのバックアップ関係が明かであれば、
ダウン通知電文を図6に示すようなブロードキャスト電
文(後述)としてもよいことは当然である。
Thereafter, the control unit 125 of the auxiliary processing unit 120 (1) of the active unit 100 (1) sends a down notification message to the standby unit 100 (2) via the communication port 123 to the communication line 130 between the auxiliary processing units. Send out. This down notification message includes a transmission destination address 400, a transmission source address, and a message type, as shown in FIG. This down notification message is sent to the auxiliary processing unit 120 (2) of the standby unit 100 (2).
Via the communication port 123. The control unit 125 of the auxiliary processing device 120 (2) transmits the contents of the down notification message via the communication unit 121 to the main processing device 110 (2).
Pass to. When the program on the main processing unit 110 (2) confirms that the transmission destination address of the down notification message matches the address of the own system, the program starts the backup processing of the active device 100 (1) and transfers it to the business resource 200. The business process is taken over by referring to the stored processing progress information of the active device 100 (1). If the backup relationship between the standby unit 100 (2) and the active unit 100 (1) is clear,
Naturally, the down notification message may be a broadcast message (described later) as shown in FIG.

【0022】図5に、図1の情報処理装置が3台、現用
機兼予備機として利用されるホットスタンバイシステム
の一例を示す。図5において、3台の情報処理装置10
0(11),100(12),100(13)はそれぞ
れ図1に示した構成のものであるが、図2の場合と同様
に図面の煩雑さを避けるため内部構成は簡略化されてい
る。
FIG. 5 shows an example of a hot standby system in which three information processing apparatuses shown in FIG. 1 are used as active and standby machines. In FIG. 5, three information processing apparatuses 10
Reference numerals 0 (11), 100 (12), and 100 (13) each have the configuration shown in FIG. 1. However, as in the case of FIG. 2, the internal configuration is simplified to avoid complication of the drawing. .

【0023】業務はプロセスA、プロセスB、プロセス
C、プロセスDの直列系で構成され、業務を実行するに
は4つのプロセスA,B,C,Dが同時に稼動するする
必要があるものとする。4つのプロセスは3台の情報処
理装置に分散して現用プロセスとして実行される。各プ
ロセス毎にその機能実行上必要な外部記憶装置及び通信
回線などのプロセス用資源を持ち、各プロセス用資源は
バックアップ関係にある情報処理装置から互いにアクセ
スできるように接続される。また、各現用プロセスに対
応して、その現用プロセスが実行されている情報処理装
置とは別の情報処理装置上にスタンバイ用の予備プロセ
スを待機しておくものとする。
The business is composed of a series system of process A, process B, process C and process D, and four processes A, B, C and D need to operate simultaneously to execute the business. . The four processes are distributed to three information processing apparatuses and executed as active processes. Each process has process resources such as an external storage device and a communication line necessary for executing the function, and the process resources are connected so as to be mutually accessible from the information processing devices in a backup relationship. Also, it is assumed that a standby spare process is on standby on an information processing apparatus different from the information processing apparatus in which the current process is executed, corresponding to each current process.

【0024】図5の例では、アドレス#1の情報処理装
置100(11)はプロセスAに関する現用機であると
ともにプロセスBに関する予備機であり、通常は現用プ
ロセスAを実行し、予備プロセスBを実行待機する。し
たがって、この情報処理装置100(11)の主処理装
置110(11)には、プロセスA用資源501とプロ
セスB用資源502が接続される。アドレス#2の情報
処理装置100(12)はプロセスB,Cに関する現用機
であるとともにプロセスA,Dに関する予備機であり、
通常は現用プロセスB,Cを実行し、予備プロセスA,
Dを実行待機する。したがって、この情報処理装置10
0(12)の主処理装置110(12)には、プロセス
A用資源501、プロセスB用資源502、プロセスC
用資源503及びプロセスD用資源504が接続され
る。また、アドレス#3の情報処理装置100(13)
はプロセスDに関する現用機であるとともにプロセスC
に関する予備機であり、通常は現用プロセスDを実行
し、プロセスCを実行待機する。この情報処理装置10
0(13)の主処理装置110(13)には、プロセス
C用資源503とプロセスD用資源504が接続され
る。
In the example shown in FIG. 5, the information processing apparatus 100 (11) having the address # 1 is both a working machine for the process A and a spare machine for the process B. Wait for execution. Therefore, the process A resource 501 and the process B resource 502 are connected to the main processing unit 110 (11) of the information processing apparatus 100 (11). The information processing device 100 (12) at address # 2 is an active device for processes B and C, and is a standby device for processes A and D.
Normally, the current processes B and C are executed, and the preliminary processes A and
Wait for D to execute. Therefore, this information processing device 10
0 (12) main processing unit 110 (12) includes a process A resource 501, a process B resource 502, a process C
Resource 503 and process D resource 504 are connected. Further, the information processing device 100 (13) of the address # 3
Is the active machine for process D and process C
Normally, the active process D is executed, and the process C is awaited. This information processing device 10
The process C resource 503 and the process D resource 504 are connected to the main processing unit 110 (13) of 0 (13).

【0025】現用機兼予備機としての各情報処理装置1
00(11),100(12),100(13)は、そ
の主処理装置110(11),110(12),110
(13)上のプログラムにより、対応したプロセスの状
態が、図5の下段に示すようなスタンバイ状態記憶状況
511,512,513として仮想記憶上に記録され
る。これらスタンバイ状態記憶状況には、プロセスが予
備状態である場合に、そのプロセスがバックアップすべ
き情報処理装置のアドレスも併せて記録される。例えば
アドレス#1の情報処理装置100(11)のスタンバ
イ状態記憶状況511は、情報処理装置100(11)
に現用プロセスA521と予備プロセスB522があ
り、予備プロセスB522はアドレス#2の情報処理装
置100(12)上の現用プロセスB523をバックア
ップするため待機していることを示す。同様に、アドレ
ス#2の情報処理装置100(12)のスタンバイ状態
記憶状況512は、情報処理装置100(12)上で現
用プロセスB523、現用プロセスC524が動作し、
予備プロセスA525がアドレス#1の情報処理装置1
00(11)上の現用プロセスAをバックアップして待
機し、予備プロセスD526がアドレス#3の情報処理
装置100(13)上の現用プロセスDをバックアップ
して待機していることを示す。
Each information processing device 1 as an active / standby machine
00 (11), 100 (12) and 100 (13) are the main processing units 110 (11), 110 (12) and 110
(13) By the above program, the status of the corresponding process is recorded on the virtual storage as the standby status storage status 511, 512, 513 as shown in the lower part of FIG. When the process is in the standby state, the address of the information processing apparatus to be backed up by the process is also recorded in these standby state storage states. For example, the standby state storage status 511 of the information processing device 100 (11) at the address # 1 is the information processing device 100 (11).
Shows that the active process A 521 and the backup process B 522 are in standby, and the backup process B 522 is on standby to back up the active process B 523 on the information processing device 100 (12) at address # 2. Similarly, in the standby state storage state 512 of the information processing apparatus 100 (12) at the address # 2, the active process B 523 and the active process C 524 operate on the information processing apparatus 100 (12).
Preparatory process A 525 is the information processing device 1 of address # 1
This indicates that the current process A on 00 (11) is backed up and the standby process D526 is on standby by backing up the current process D on the information processing device 100 (13) at address # 3.

【0026】ここで、アドレス#2の情報処理装置10
0(12)において、主処理装置110(12)の異常
が生じた場合のバックアップ切り替えの動作を説明す
る。
Here, the information processing apparatus 10 at address # 2
The operation of the backup switching when the abnormality occurs in the main processing unit 110 (12) at 0 (12) will be described.

【0027】まず、障害を発生した情報処理装置100
(12)が自らバックアップ切り替えを起動する場合に
ついて説明する。情報処理装置100(12)におい
て、補助処理装置120(12)がセンサインタフェー
ス部122を介して主処理装置110(12)のマシン
チェック、電源異常、冷却ファン異常など主処理装置1
10(12)が動作を続行不能な状態を検出すると、補
助処理装置120(12)の制御部125はリセット信号
駆動部124によってリセット信号RSTを駆動させ、
主処理装置110(12)をプロセス用資源501〜5
04から切り離し、この場合に予備機として動作する情
報処理装置100(11),100(13)との資源アク
セスの競合を防止する。この後、情報処理装置100
(12)の補助処理装置120(12)において、制御
部125は通信ポート123を介しダウン通知電文を補
助処理装置間通信路130へ送出する。
First, the information processing apparatus 100 in which a failure has occurred
The case where (12) starts backup switching by itself will be described. In the information processing device 100 (12), the auxiliary processing device 120 (12) is connected to the main processing device 1 (12) via the sensor interface unit 122, such as a machine check of the main processing device 110 (12), a power failure, and a cooling fan failure.
When 10 (12) detects that the operation cannot be continued, the control unit 125 of the auxiliary processing device 120 (12) drives the reset signal RST by the reset signal driving unit 124,
The main processing unit 110 (12) is used for processing resources 501 to 5
04, and in this case, conflicts in resource access with the information processing apparatuses 100 (11) and 100 (13) operating as standby devices are prevented. Thereafter, the information processing device 100
In the auxiliary processing device 120 (12) of (12), the control unit 125 sends a down notification message to the communication path 130 between the auxiliary processing devices via the communication port 123.

【0028】このダウン通知電文の形式は図6にその例
を示すとおり、システム内の全情報処理装置の補助処理
装置に受信されるべきブロードキャスト通知であり、送
信先アドレス601にブロードキャストアドレスが設定
され、送信元アドレス602にダウンした情報処理装置
100(12)のアドレス#2が設定される。
As shown in FIG. 6, the format of the down notification message is a broadcast notification to be received by the auxiliary processing devices of all the information processing devices in the system, and the broadcast address is set in the transmission destination address 601. , The address # 2 of the down-processed information processing apparatus 100 (12) is set to the source address 602.

【0029】このダウン通知電文を受信したアドレス#
1の情報処理装置100(11)の補助処理装置120
(11)は、ダウン通知電文の内容を通信手段121に
より主処理装置110(11)に伝達する。主処理装置
110(11)上のプログラムは、ダウン通知電文中に
示される送信元アドレスすなわち#2と、スタンバイ状
態記憶状況511中の予備プロセスB522のスタンバ
イ対象アドレスすなわち#2が一致することを条件に、
予備プロセスB522を現用として動作する。予備プロ
セスB522は現用プロセスとなり、プロセスB用資源
502を使用して部分的に業務を引き継ぐ。
Address # that received this down notification message
Auxiliary processing device 120 of one information processing device 100 (11)
(11) transmits the contents of the down notification message to the main processing unit 110 (11) by the communication means 121. The program on the main processing unit 110 (11) requires that the source address, ie, # 2, indicated in the down notification message, and the standby target address, ie, # 2, of the standby process B522 in the standby state storage status 511 match. To
The backup process B <b> 522 is operated as a working process. The spare process B 522 becomes an active process, and partially takes over the business using the process B resource 502.

【0030】ダウン通知電文はブロードキャスト通知で
あるため、アドレス#3の情報処理装置100(13)
の補助処理装置120(13)でも同様に受信される。
これを契機に、アドレス#1の情報処理装置100(1
3)においても、同様のプロセス切り替えを行い、予備
プロセスC528を現用プロセスとし、プロセスC用資
源503を使用して部分的に業務処理を引き継ぐ。この
ようにして、ダウンしたアドレス#2の情報処理装置1
00(12)を除いた2台の情報処理装置100(1
1),100(13)上に業務処理に必要なプロセス
A,B,C,Dがすべて揃い今まで通り業務を続行でき
る。
Since the down notification message is a broadcast notification, the information processing apparatus 100 (13) at address # 3
Is also received by the auxiliary processing device 120 (13).
As a result, the information processing apparatus 100 (1
Also in 3), the same process switching is performed, the spare process C528 is set as the active process, and the business process is partially taken over using the process C resource 503. Thus, the information processing device 1 of the down address # 2
00 (12) except for the two information processing apparatuses 100 (1
Processes A, B, C, and D necessary for business processing are all provided on 1) and 100 (13), and business can be continued as before.

【0031】次に、予備機側からバックアップ切り替え
を起動する場合について説明する。各情報処理装置10
0(11),100(12),100(13)は、予備
プロセスのスタンバイ対象である他の情報処理装置に対
し、定期的なヘルスチェックを行う。例えば、アドレス
#1の情報処理装置100(11)の主処理装置110
(11)上のプログラムは、スタンバイ状態記憶情報5
11を参照し、予備プロセスB522のスタンバイ対象
であるアドレス#2の情報処理装置100(12)に対
する確認電文を補助処理装置120(11)を介して補
助処理装置間通信路130へ送出し、それに対する応答
電文を確認することによりアドレス#2の情報処理装置
100(12)のヘルスチェツクを行う。
Next, a case in which backup switching is started from the standby unit will be described. Each information processing device 10
0 (11), 100 (12), and 100 (13) perform a periodic health check on other information processing devices that are standby targets of the backup process. For example, the main processing device 110 of the information processing device 100 (11) at the address # 1
(11) The above program is the standby state storage information 5
11, a confirmation message for the information processing device 100 (12) at the address # 2 which is a standby target of the preliminary process B 522 is transmitted to the communication path 130 between the auxiliary processing devices via the auxiliary processing device 120 (11). The health check of the information processing apparatus 100 (12) at the address # 2 is performed by confirming the response message to.

【0032】このヘルスチェックでアドレス#2の情報
処理装置100(12)の異常を検出した場合(アドレ
ス#1の情報処理装置100(11)のオペレータによ
りアドレス#2の情報処理装置100(12)の切り離
し起動操作を行った場合も同様)、アドレス#1の情報
処理装置100(11)の主処理装置110(11)上
のプログラムは、通信手段121を介して補助処理装置
120(11)に対しアドレス#2の情報処理装置10
0(12)の切り離しを指示する。補助処理装置120
(11)の制御部125は、ダウンした現用機たる情報
処理装置100(12)に対する切り離し要求電文(図
3)を通信ポート123より補助処理装置間通信路13
0へ送出する。
When the health check detects an abnormality in the information processing apparatus 100 (12) at address # 2 (the operator of the information processing apparatus 100 (11) at address # 1 operates the information processing apparatus 100 (12) at address # 2. Similarly, the program on the main processing device 110 (11) of the information processing device 100 (11) at the address # 1 is transmitted to the auxiliary processing device 120 (11) via the communication means 121. Information processing device 10 at address # 2
0 (12) is instructed. Auxiliary processing unit 120
The control unit 125 of (11) sends the disconnection request message (FIG. 3) to the information processing device 100 (12), which is the working device that has gone down, from the communication port 123 to the communication path 13 between the auxiliary processing devices.
Send to 0.

【0033】この切り離し要求電文を受信したアドレス
#2の情報処理装置100(12)の補助処理装置12
0(12)において、制御部125は、その切り離し要
求電文中の送信先アドレスと自系のアドレスとの一致を
確認すると、その電文を自系に対する切り離し要求電文
と判断し、リセット信号駆動部124でリセット信号R
STを駆動させることにより主処理装置110(12)
を停止させ、プロセス用資源501〜504から切り離
す。この後、補助処理装置120(12)の制御部12
5は、通信ポート123を介し、前述したブロードキャ
スト通知であるダウン通知電文を補助処理装置間通信路
130へ送出する。このダウン通知電文を受信したアド
レス#1の情報処理装置110(11)とアドレス#3
の情報処理装置100(13)は、それぞれ前述したよ
うなプロセスの切り替えを行い、プロセスB,Cを現用
プロセスとして分担し業務処理を続行する。
The auxiliary processing device 12 of the information processing device 100 (12) at address # 2 that has received the disconnection request message
At 0 (12), when the control unit 125 confirms that the transmission destination address in the disconnection request message matches the address of the own system, the control unit 125 determines that the message is a disconnection request message for the own system, and the reset signal driving unit 124 And reset signal R
By driving ST, main processing unit 110 (12)
Is stopped and disconnected from the process resources 501-504. Thereafter, the control unit 12 of the auxiliary processing device 120 (12)
5 transmits the down notification message, which is the above-described broadcast notification, to the communication path 130 between the auxiliary processing devices via the communication port 123. The information processing device 110 (11) of the address # 1 receiving the down notification message and the address # 3
The information processing apparatus 100 (13) switches the processes as described above, shares the processes B and C as the active processes, and continues the business process.

【0034】ところで、同じ情報処理装置に対する切り
離しが重複して起動されることがあり得る。例えば、異
常を発生した情報処理装置が自らの起動により主処理装
置に対するリセット信号を駆動したが、その際のダウン
通知電文がバックアップ側の他の情報処理装置に正常に
伝達されず、その後にバックアップ側の他の情報処理装
置がヘルスチェックでその異常を検出して切り離し要求
電文を送出するようなケースである。もし、その切り離
し要求電文に応答して、異常を発生した情報処理装置で
主処理装置に対するリセット信号を再び駆動してしまう
と、1回目のリセット時の情報処理装置の状況が保存さ
れず、ダウン原因の解析に支障をきたす。これを防止す
るため、各情報処理装置(100)において、補助処理
装置(120)の制御部(125)は、その主処理装置
(110)の切り離し回数をカウントし、そのカウント
が0であることを条件にリセット信号RSTの駆動を行
い、リセット信号RSTの重複駆動を禁止する。そし
て、制御部(125)は、主処理装置(110)のリブ
ート時に、そのカウンタをゼロクリアする。
By the way, there is a possibility that disconnection of the same information processing apparatus is started repeatedly. For example, the information processing device that has generated an error drives the reset signal to the main processing device by its own activation, but the down notification message at that time is not transmitted normally to the other information processing device on the backup side, and then the backup In this case, the other information processing apparatus on the side detects the abnormality in the health check and sends a disconnection request message. If, in response to the disconnection request message, the information processing apparatus in which the abnormality has occurred drives the reset signal to the main processing apparatus again, the state of the information processing apparatus at the time of the first reset is not saved, and Interfere with the cause analysis. In order to prevent this, in each information processing device (100), the control unit (125) of the auxiliary processing device (120) counts the number of disconnections of the main processing device (110), and the count is zero. , The reset signal RST is driven, and the overlap driving of the reset signal RST is prohibited. Then, the control unit (125) clears the counter to zero when the main processing unit (110) is rebooted.

【0035】ここまでは、現用機を業務用資源またはプ
ロセス用資源から切り離すための主処理装置の停止手段
としてリセット信号を用いる例を示したが、システムリ
セットによる切り離しを行うと、情報処理装置内の障害
時のレジスタ内容が失われ障害対策に支障を来すことが
ある。これを防ぐために、前述のバックアップ切り替え
処理手順において補助処理装置がリセット信号に代えて
割込み信号を用い、割込みを受けた主処理装置上のプロ
グラムが業務用資源またはプロセス用資源へのアクセス
を停止する手順を採用することができる。また、割込み
による業務用資源またはプロセス用資源へのアクセス停
止の応答を、通信手段により、予め定められた時間内に
主処理装置から補助処理装置へ伝達することとし、これ
がなされなかった場合に補助処理装置からリセットを行
うようにすることもできる。これらによって、障害機の
切り離しを確実に行ったうえで、障害の程度に応じて可
能な限り詳細な障害状況を情報処理装置内に残すことが
できる。
Up to this point, an example has been described in which the reset signal is used as a stopping means of the main processing unit for separating the active unit from the business resources or the process resources. In this case, the register contents at the time of the failure may be lost, which may hinder the measures against the failure. In order to prevent this, the auxiliary processing device uses an interrupt signal instead of the reset signal in the backup switching processing procedure described above, and the interrupted program on the main processing device stops accessing the business resource or the process resource. Procedures can be adopted. In addition, a response to stop access to the business resource or the process resource due to the interruption is transmitted from the main processing unit to the auxiliary processing unit within a predetermined time by the communication means. The reset may be performed from the processing device. By these means, it is possible to reliably disconnect the faulty machine, and to leave a fault situation as detailed as possible according to the degree of the fault in the information processing apparatus.

【0036】[0036]

【発明の効果】以上の説明から明らかなように、本発明
の情報処理装置によれば、ホットスタンバイシステムの
バックアップ切り替えの確実化、高速化が可能である。
また、システムスループットの低下を招くことなく、バ
ックアップ切り替え時間の短縮が可能である。また、ホ
ットスタンバイシステムを構成する情報処理装置の台数
が多い場合でも、バックアップ切り替え機構の大規模化
を避けることができる。さらに、バックアップ切り替え
の対象となった情報処理装置のダウン時の状況を保存す
ることができる。よって、ホットスタンバイシステムの
稼働効率を向上できる、等々の効果を得られる。
As is apparent from the above description, according to the information processing apparatus of the present invention, it is possible to reliably and quickly switch the backup of the hot standby system.
Also, the backup switching time can be reduced without lowering the system throughput. Further, even when the number of information processing devices constituting the hot standby system is large, it is possible to avoid an increase in the size of the backup switching mechanism. Further, the status at the time of the downtime of the information processing apparatus to be switched can be saved. Therefore, it is possible to obtain the effects of improving the operation efficiency of the hot standby system.

【図面の簡単な説明】[Brief description of the drawings]

【図1】ホットスタンバイシステムに用いられる本発明
の情報処理装置の構成例を示すブロック図である。
FIG. 1 is a block diagram illustrating a configuration example of an information processing apparatus of the present invention used in a hot standby system.

【図2】本発明の情報処理装置が2台からなるホットス
タンバイシステムの一例を示すブロック図である。
FIG. 2 is a block diagram illustrating an example of a hot standby system including two information processing apparatuses according to the present invention.

【図3】切り離し要求電文の一例を示す図である。FIG. 3 is a diagram illustrating an example of a disconnection request message.

【図4】ダウン通知電文の一例を示す図である。FIG. 4 is a diagram showing an example of a down notification message.

【図5】本発明の情報処理装置が3台で4つのプロセス
を相互にバックアップするホットスタンバイシステムの
一例を示すブロック図である。
FIG. 5 is a block diagram showing an example of a hot standby system in which three information processing apparatuses of the present invention mutually back up four processes.

【図6】ダウン通知電文の一例を示す図である。FIG. 6 is a diagram illustrating an example of a down notification message.

【符号の説明】[Explanation of symbols]

100 情報処理装置 110 主処理装置 112 電源 114 冷却ファン 120 補助処理装置 121 通信手段 122 センサインタフェース部 123 通信ポート 124 リセット信号駆動部 125 制御部 130 補助処理装置間通信路 100(1) 情報処理装置(現用機) 100(2) 情報処理装置(予備機) 100(11) 情報処理装置(現用機兼予備機) 100(12) 情報処理装置(現用機兼予備機) 100(13) 情報処理装置(現用機兼予備機) 200 業務用資源 501 プロセスA用資源 502 プロセスB用資源 503 プロセスC用資源 504 プロセスD用資源 511,512,513,514 スタンバイ状態記憶
状況 RST リセット信号
Reference Signs List 100 information processing device 110 main processing device 112 power supply 114 cooling fan 120 auxiliary processing device 121 communication means 122 sensor interface unit 123 communication port 124 reset signal driving unit 125 control unit 130 communication path between auxiliary processing devices 100 (1) information processing device ( 100 (2) Information processing device (spare device) 100 (11) Information processing device (active device and standby device) 100 (12) Information processing device (active device and standby device) 100 (13) Information processing device ( (Working machine and spare machine) 200 Business resources 501 Process A resources 502 Process B resources 503 Process C resources 504 Process D resources 511, 512, 513, 514 Standby state storage status RST Reset signal

Claims (3)

【特許請求の範囲】[Claims] 【請求項1】 ホットスタンバイシステムの現用機又は
予備機として動作する情報処理装置であって、 現用機として動作時に当該現用機のダウンを検出して当
該現用機のためのバックアップ切り替えを起動する手段
と、 予備機として動作時に現用機側のダウンを検出して現用
機のためのバックアップ切り替えを起動する手段を具備
することを特徴とする情報処理装置。
1. An information processing apparatus that operates as an active unit or a standby unit of a hot standby system, and detects a down of the active unit when operating as an active unit and activates backup switching for the active unit. An information processing apparatus comprising: a standby unit that detects a down of the active device during operation and activates backup switching for the active device.
【請求項2】 現用機として動作時に当該現用機のダウ
ンを検出すると、当該現用機を切り離すとともにダウン
通知を予備機側に送信する手段と、 予備機として動作時に現用機側からダウン通知を受信す
ると、当該予備機を現用機に切り替える手段と、 予備機として動作時に現用機側のダウンを検知すると、
切り離し要求を現用機側に送信するとともに当該予備機
を現用機に切り替える手段と、 現用機として動作時に予備機側から切り離し要求を受信
すると、当該現用機を切り離す手段とを具備することを
特徴とする請求項1記載の情報処理装置。
2. A means for disconnecting the active device and transmitting a down notification to the standby device when the active device is detected to be down during operation as the active device, and receiving a down notification from the active device during operation as the standby device. Then, means for switching the spare machine to the working machine, and when the working machine is detected to be down during operation as a spare machine,
Means for transmitting a disconnection request to the active unit and switching the standby unit to the active unit; and a unit for disconnecting the active unit when receiving the disconnection request from the standby unit during operation as the active unit. The information processing apparatus according to claim 1, wherein
【請求項3】 現用機として動作時にその切り離し処理
の重複実行を防止するための手段を具備することを特徴
とする請求項1もしくは2記載の情報処理装置。
3. The information processing apparatus according to claim 1, further comprising: means for preventing a duplicate execution of the disconnection process during operation as an active device.
JP25501197A 1997-09-19 1997-09-19 Information processing device Expired - Fee Related JP3420919B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP25501197A JP3420919B2 (en) 1997-09-19 1997-09-19 Information processing device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP25501197A JP3420919B2 (en) 1997-09-19 1997-09-19 Information processing device

Publications (2)

Publication Number Publication Date
JPH1196033A true JPH1196033A (en) 1999-04-09
JP3420919B2 JP3420919B2 (en) 2003-06-30

Family

ID=17272964

Family Applications (1)

Application Number Title Priority Date Filing Date
JP25501197A Expired - Fee Related JP3420919B2 (en) 1997-09-19 1997-09-19 Information processing device

Country Status (1)

Country Link
JP (1) JP3420919B2 (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006309292A (en) * 2005-04-26 2006-11-09 Nec Corp Server device, server system, and method of switching system in server system
JP2011170445A (en) * 2010-02-16 2011-09-01 Nec Corp Failure monitoring device for server system, the server system and failure monitoring method for the same
JP2012090010A (en) * 2010-10-18 2012-05-10 Nakayo Telecommun Inc Communication apparatus and backup method for the same
JP2013003724A (en) * 2011-06-14 2013-01-07 Denso Corp In-vehicle electronic control unit
JP2017120507A (en) * 2015-12-28 2017-07-06 東芝三菱電機産業システム株式会社 Multiplex system and switching method of monitoring control device in multiplex system

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006309292A (en) * 2005-04-26 2006-11-09 Nec Corp Server device, server system, and method of switching system in server system
JP2011170445A (en) * 2010-02-16 2011-09-01 Nec Corp Failure monitoring device for server system, the server system and failure monitoring method for the same
JP2012090010A (en) * 2010-10-18 2012-05-10 Nakayo Telecommun Inc Communication apparatus and backup method for the same
JP2013003724A (en) * 2011-06-14 2013-01-07 Denso Corp In-vehicle electronic control unit
JP2017120507A (en) * 2015-12-28 2017-07-06 東芝三菱電機産業システム株式会社 Multiplex system and switching method of monitoring control device in multiplex system

Also Published As

Publication number Publication date
JP3420919B2 (en) 2003-06-30

Similar Documents

Publication Publication Date Title
US6148415A (en) Backup switching control system and method
JPH03164837A (en) Spare switching system for communication control processor
JP3806600B2 (en) System switching method for multi-system
JP3420919B2 (en) Information processing device
JP2000020336A (en) Duplex communication system
JPH06197112A (en) Management system
US6480466B1 (en) Terminal switching apparatus and method
JPH10171769A (en) Composite computer system
JP7403433B2 (en) Communication device and communication method for plant control system
JPH09311841A (en) Multiprocessor system
JP2001175545A (en) Server system, fault diagnosing method, and recording medium
JP2007026038A (en) Path monitoring system, path monitoring method and path monitoring program
JPS5870670A (en) Failure information transfer system for exchange of duplex system
JP2636610B2 (en) Backup method
JPH1049450A (en) Recovery system for abnormal time of remote monitor system
JP2000330829A (en) Inter-system communication processor
JP2000349900A (en) Fault processing system for exchange
JP3012491B2 (en) Micro diagnostic method for duplexer
JPH06290126A (en) Fault monitoring system for computer system
JPH08147255A (en) Fault monitoring system
JP2000242616A (en) Fault processor, fault processing method and recording medium
JPS6375843A (en) Abnormality monitor system
JPS63279646A (en) Automatic restart processing system for network management equipment
JPH03237556A (en) Communication control system for multihost system
JPH1069445A (en) Abnormality recovery system for remote monitoring system

Legal Events

Date Code Title Description
S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313115

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313115

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313115

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090418

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090418

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100418

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110418

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120418

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120418

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130418

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140418

Year of fee payment: 11

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees