JPH07121395A - Method for preferentially selecting auxiliary device - Google Patents

Method for preferentially selecting auxiliary device

Info

Publication number
JPH07121395A
JPH07121395A JP5268912A JP26891293A JPH07121395A JP H07121395 A JPH07121395 A JP H07121395A JP 5268912 A JP5268912 A JP 5268912A JP 26891293 A JP26891293 A JP 26891293A JP H07121395 A JPH07121395 A JP H07121395A
Authority
JP
Japan
Prior art keywords
processor
software
spare
processor device
processor unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5268912A
Other languages
Japanese (ja)
Inventor
Hidetaka Ishimoto
英隆 石本
Shigeki Oda
成樹 尾田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP5268912A priority Critical patent/JPH07121395A/en
Publication of JPH07121395A publication Critical patent/JPH07121395A/en
Pending legal-status Critical Current

Links

Landscapes

  • Hardware Redundancy (AREA)

Abstract

PURPOSE:To shorten the recovery time of a system by avoiding the reload of a software by preferentially selecting the same auxiliary device as that of a fault processor for a software previously loaded to a memory. CONSTITUTION:When any fault is generated at a processor unit 1 under operating, first of all, a switch 41 for connection is opened and next, any auxiliary processor is selected. In this case, the same software as the software class of the fault detected processor unit 1 loaded, any processor unit (such as a processor unit N, for example,) under auxiliary waiting is selected, a switch 4N for connection is closed, and the processor unit N is connected to a bus line 11 for processor link. Thus, the operation can be immediately restarted only by transferring peculiar data to each processor unit without the load processing of the software.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、コンピュータシステム
でのプロセッサ装置故障時のシステム回復機能に関し、
特にマルチプロセッサ構成における予備プロセッサの切
替方法に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a system recovery function when a processor device fails in a computer system,
In particular, the present invention relates to a spare processor switching method in a multiprocessor configuration.

【0002】[0002]

【従来の技術】従来、図2に示すような機能分散型のコ
ンピュータシステム(マルチプロセッサシステム)で
は、プロセッサ装置故障時、予め設定した予備プロセッ
サ装置に当該ソフトウェアをロードして制御を切り替え
ていた。なお、機能分散型マルチプロセッサ構成とは、
システム全体で実現する機能を幾つかの機能単位に分割
し、分割された機能単位を個々のプロセッサ装置で分担
するものであり、各プロセッサのメモリへロードするソ
フトウェアによってその分担された機能を実現するもの
である。図2において、各プロセッサ装置1〜N(N:
1以上の整数)は各々1組のプロセッサ(CPU)とメ
モリ(MM)で構成されており、それらのプロセッサ装
置は、プロセッサ装置間を結合するバス線11によって
複数台接続されている。また、複数台設けられるプロセ
ッサ装置の運転管理用に1台のプロセッサ制御装置21
を設ける。この運転管理用のプロセッサ制御装置21に
は、各プロセッサ装置で走行するためのソフトウェアを
格納するファイル格納装置31が接続されており、必要
に応じてファイル格納装置よりソフトウェアを読み出
し、これをソフトウェア転送用線路61を経由して各プ
ロセッサ装置へ転送することで、各プロセッサ装置のメ
モリへソフトウェアのロード処理を実現する。また、プ
ロセッサ装置1〜Nとバス線11との間には接続用スイ
ッチ41〜4Nが設けられており、運転管理用のプロセ
ッサ装置21からプロセッサ装置切替え制御用線路51
を介した制御で接続用スイッチ41〜4Nの開閉を行な
うことで、各プロセッサ装置のバス線への接続/切離を
行なうことができる。このようなシステムでは、通常、
複数台具備されるこれらの疎結合マルチプロセッサ装置
は、任意のプロセッサ装置の故障、またはそれらのプロ
セッサ装置で走行するソフトウェアの異常によって当該
プロセッサ装置の機能が停止し、その結果としてプロセ
ッサシステムの一部または全部の機能が停止する場合が
ある。そのための回復手段として、従来のマルチプロセ
ッサシステムでは任意の冗長数のプロセッサを予備装置
として設けておき、万一、任意の運用中状態のプロセッ
サ装置が何らかの原因で故障した場合には、プロセッサ
制御装置21によって、以下の手順に従い、予備プロセ
ッサ装置を当該故障プロセッサ装置の代替として切替え
ることで、故障によって停止した機能を自動的に復旧さ
せる機能を実現していた。復旧のための手順を以下に示
す。 「手順1」 (1)当該故障装置のバス線からの切り離し (2)任意の予備プロセッサ装置の選択 (3)予備プロセッサ装置のバス線への接続 (4)予備プロセッサ装置内メモリへのソフトウェアの
転送 (5)予備プロセッサ装置内メモリへの各プロセッサ固
有データの転送 (6)予備プロセッサ装置のソフトウェアの起動 なお、運用中プロセッサ装置と予備待機中プロセッサ装
置の装置運転状態は、N台のプロセッサ装置(全プロセ
ッサ装置台数:N)のうち、M台を運用中プロセッサ装
置とし、残るJ台を予備プロセッサ装置とする。この場
合、M,J,Nは正の整数であり、N=M+Jを満足す
る。ここで、図2におけるプロセッサ装置1からプロセ
ッサ装置Mまでが運用中装置、M+1からNが予備待機
中装置であった場合を考える。具体例として、図3のよ
うに、M=5、J=3とし、運用中プロセッサ装置をプ
ロセッサ装置1からプロセッサ装置5、予備待機中プロ
セッサ装置をプロセッサ装置6からプロセッサ装置8と
した場合を仮定する(運用中装置数5台、待機中装置数
3台)。また、各プロセッサ装置のメモリ上にロードさ
れているソフトウェアは、単一ではなく、前述の通り、
機能分散によるマルチプロセッサ構成を実現するために
複数種類存在する。図3の構成では、3種類のソフトウ
ェアが、表1のプロセッサ管理表のようにロードされて
いるとする。
2. Description of the Related Art Conventionally, in a function-distributed computer system (multiprocessor system) as shown in FIG. 2, when a processor device fails, the preset spare processor device is loaded with the software to switch the control. The distributed function multiprocessor configuration is
The functions realized by the entire system are divided into several functional units, and the divided functional units are shared by individual processor devices, and the shared functions are realized by software loaded into the memory of each processor. It is a thing. In FIG. 2, each processor device 1 to N (N:
Each of the integers of 1 or more) is composed of a set of a processor (CPU) and a memory (MM), and a plurality of these processor devices are connected by a bus line 11 connecting the processor devices. Further, one processor control device 21 is used for operation management of a plurality of processor devices.
To provide. A file storage device 31 for storing software for running on each processor device is connected to the processor control device 21 for operation management. The software is read from the file storage device as necessary and is transferred to the software. By transferring the data to each processor device via the communication line 61, software load processing is realized in the memory of each processor device. Further, connecting switches 41 to 4N are provided between the processor devices 1 to N and the bus line 11, and the processor device 21 for operation management is switched from the processor device switching control line 51.
By connecting / disconnecting the connection switches 41 to 4N under the control via, the connection / disconnection of each processor unit to / from the bus line can be performed. In such a system,
These loosely-coupled multiprocessor devices, which are provided in plurality, stop their functions due to failure of any processor device or abnormality of software running on those processor devices, and as a result, a part of the processor system. Or all the functions may stop. As a recovery means therefor, in a conventional multiprocessor system, an optional redundant number of processors is provided as a spare device, and in the unlikely event that an arbitrary operating processor device fails for some reason, the processor control device In accordance with the following procedure, the function of automatically switching back the function stopped by the failure is realized by switching the spare processor apparatus as a substitute for the failed processor apparatus according to the following procedure. The procedure for restoration is shown below. "Procedure 1" (1) Detach the faulty device from the bus line (2) Select any spare processor unit (3) Connect the spare processor unit to the bus line (4) Install software to the memory in the spare processor unit Transfer (5) Transfer of data unique to each processor to the memory in the spare processor unit (6) Activation of software of the spare processor unit The operating states of the processor unit in operation and the processor unit in standby standby are N processor units. Of the (total number of processor devices: N), M units are operating processor devices and the remaining J units are spare processor devices. In this case, M, J, and N are positive integers, and N = M + J is satisfied. Here, consider a case where the processor devices 1 to M in FIG. 2 are operating devices and M + 1 to N are standby standby devices. As a specific example, it is assumed that M = 5 and J = 3, the operating processor units are the processor units 1 to 5, and the standby standby processor units are the processor units 6 to 8 as shown in FIG. Yes (5 devices in operation, 3 devices in standby). Further, the software loaded on the memory of each processor device is not a single software, but as described above,
There are multiple types to realize a multiprocessor configuration by function distribution. In the configuration of FIG. 3, it is assumed that three types of software are loaded as in the processor management table of Table 1.

【表1】 いま、プロセッサ装置1が故障した場合を仮定し、プロ
セッサ装置管理用制御装置21がその故障を検出する
と、その制御装置は上記「手順1」に従い、具体的には
以下の「手順2」の回復処理を行なう。 「手順2」 (1)プロセッサ装置切替え制御用線路を介して接続用
スイッチ41を開放し、プロセッサ装置1をプロセッサ
間結合用バス線11から切り離す。 (2)予備プロセッサ装置(プロセッサ装置6〜8)か
ら、任意の1装置を選択する。いま、ここでは最若番号
のプロセッサ装置6を選択することとする。 (3)接続用スイッチ46を閉じ、予備プロセッサ装置
6をバス線11へ接続する。 (4)表1を参照し、故障プロセッサ装置1で使用して
いたものと同一のプログラム(種類A)を選択する。 (5)プログラム(種類A)をファイル格納装置31か
ら読み出してソフトウェア転送線路61およびバス線1
1を介してプロセッサ装置6へロードする。 (6)プロセッサ装置6のメモリへ各プロセッサ固有の
データを転送する。 (7)プロセッサ装置6へのソフトウェアを起動し、種
類Aの故障前にプロセッサ装置1で提供されていた機能
の代替をさせる。 (8)切替えに伴い表1を書き変え、プロセッサ管理表
を表2の内容とする。
[Table 1] Now, assuming that the processor device 1 has failed, when the processor device management control device 21 detects the failure, the control device follows the above “procedure 1”, specifically, the recovery of the following “procedure 2”. Perform processing. “Procedure 2” (1) The connection switch 41 is opened via the processor device switching control line to disconnect the processor device 1 from the inter-processor coupling bus line 11. (2) Select any one device from the spare processor devices (processor devices 6 to 8). Now, it is assumed here that the processor device 6 having the lowest number is selected. (3) The connection switch 46 is closed and the spare processor device 6 is connected to the bus line 11. (4) Referring to Table 1, select the same program (type A) as that used in the faulty processor device 1. (5) The program (type A) is read from the file storage device 31, and the software transfer line 61 and the bus line 1 are read.
1 to the processor unit 6 via. (6) Data unique to each processor is transferred to the memory of the processor device 6. (7) The software for the processor device 6 is activated to replace the function provided by the processor device 1 before the failure of type A. (8) Table 1 is rewritten according to the switching, and the contents of Table 2 are used as the processor management table.

【表2】 [Table 2]

【0003】[0003]

【発明が解決しようとする課題】上記従来技術では、任
意のプロセッサ装置で故障が発生したことを契機とし
て、予備プロセッサ装置に対して当該故障装置で走行し
ていたものと同一ソフトウェアのロード処理を行なって
いたため、予備装置での運転再開(復旧)までの中断時
間にソフトウェアロード時間が含まれることとなり、全
体の回復時間を遅滞させる原因となっていた。本発明の
目的は、このような問題点を改善し、予備装置に対する
ソフトウェアのロード処理(「手順1」の処理(4)お
よび「手順2」の処理(5))を装置故障の発生から復
旧までの時間に含めないようにすることができ、全体の
回復時間を短縮する、予備装置優先選択方法を提供する
ことにある。
In the above prior art, when a failure occurs in an arbitrary processor device, a load processing of the same software as that running in the failed device is performed on the spare processor device. Since this was done, the software load time was included in the interruption time until the operation was restarted (restored) in the standby device, which was a cause of delaying the overall recovery time. An object of the present invention is to improve such problems and restore the software loading process (the process (4) of the “procedure 1” and the process (5) of the “procedure 2”) to the spare device from the occurrence of the device failure. It is an object of the present invention to provide a method for selecting a backup device preferentially, which can be excluded from the time until, and shortens the overall recovery time.

【0004】[0004]

【課題を解決するための手段】上記目的を達成するた
め、本発明の予備装置優先選択方法は、メモリ上へロー
ドされるソフトウェアの種類によって動作仕様が可変な
複数のプロセッサ装置および代替用の予備プロセッサ装
置を備えた疎結合マルチプロセッサ構成のコンピュータ
システムにおいて、任意のプロセッサ装置の故障を契機
として予備プロセッサ装置を組み込む場合、その故障プ
ロセッサ装置のメモリ上へロードしてあるソフトウェア
の種別を認識し(図1の102)、それと同一種別のソ
フトウェアが予めメモリ上へロードされている予備プロ
セッサ装置がある場合(図1の103)には、その予備
プロセッサ装置を優先的に選択する(図1の104)こ
とに特徴がある。
In order to achieve the above-mentioned object, a method for selecting a spare device priority according to the present invention comprises a plurality of processor devices whose operating specifications are variable depending on the type of software loaded on a memory and a spare spare device. In a loosely coupled multiprocessor computer system equipped with a processor unit, when a spare processor unit is incorporated upon the failure of an arbitrary processor unit, the type of software loaded on the memory of the failed processor unit is recognized ( 1), if there is a spare processor device in which the same type of software is preloaded on the memory (103 in FIG. 1), that spare processor device is preferentially selected (104 in FIG. 1). ) Is characteristic.

【0005】[0005]

【作用】本発明においては、運転ソフトウェア種別と同
一台数以上の冗長予備プロセッサ装置を設け、待機中の
時点でその予備プロセッサ装置のメモリへ各運転ソフト
ウェアと同一種類のソフトウェアを事前にロードしてお
く。なお、各プロセッサ装置の運転状態およびソフトウ
ェア種別はプロセッサ装置管理状態表に登録して管理す
る。また、故障発生時には、その管理状態表を用いて故
障プロセッサと同一のソフトウェア種別が既にロード済
みの予備プロセッサ装置があるか否かを確認し、あれば
優先的にその予備プロセッサ装置を選択するという論理
を具備する。これにより、当該ソフトウェアロード済み
の予備プロセッサ装置がある場合には、従来方式におい
て任意のプロセッサ装置での故障の発生から回復までの
処理に毎回必要としていた、予備プロセッサ装置に対す
るソフトウェアのロード処理は不要となる。従って、予
備装置に対するソフトウェアのロード処理時間を装置故
障の発生から復旧までの時間に含まず、故障発生から復
旧までの回復時間を短縮することができる。
According to the present invention, the same number or more of redundant spare processor units as the type of operating software are provided, and the same type of software as each operating software is loaded in advance into the memory of the spare processor unit during standby. . The operating status and software type of each processor device are registered and managed in the processor device management status table. When a failure occurs, the management status table is used to check whether or not there is a spare processor unit already loaded with the same software type as the failed processor, and if so, the spare processor unit is preferentially selected. Have logic. As a result, if there is a spare processor device that has been loaded with the software, it is not necessary to load the software to the spare processor device, which is required for each process from the occurrence of a failure in any processor device to recovery in the conventional method. Becomes Therefore, the software load processing time for the spare device is not included in the time from the occurrence of the device failure to the recovery, and the recovery time from the failure occurrence to the recovery can be shortened.

【0006】[0006]

【実施例】以下、本発明の一実施例を図面により説明す
る。図4および図5は、本発明の予備装置優先選択方法
を適用するマルチプロセッサシステムの一例を示す構成
図である。本発明の予備装置優先選択方法は、図2に示
した構成はもとより、図4および図5に示す構成のコン
ピュータシステムにも適用することができる。図4は、
図2のソフトウェアファイル転送用線路61をプロセッ
サ結合用バス線11を介さずに、直接各プロセッサ装置
のメモリ制御部に接続する形態であり、図5は、プロセ
ッサ間結合用バス線を二重にし(図5の11,12)、
かつ、スイッチの接続形式を、各プロセッサ結合バスの
何れか一方と接続されるようにしたものである。これら
は、ファイル転送用のバス線を運転中プロセッサ装置間
のプロセッサ間通信に使用する伝送経路とソフトウェア
転送用経路を分離することで、ファイル転送処理による
バス転送能力の低下、並びに、故障プロセッサの異常動
作によるバス線上での信号の擾乱を回避することを目的
としたものである。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS An embodiment of the present invention will be described below with reference to the drawings. 4 and 5 are configuration diagrams showing an example of a multiprocessor system to which the backup device priority selection method of the present invention is applied. The backup device priority selection method of the present invention can be applied not only to the configuration shown in FIG. 2 but also to the computer system having the configurations shown in FIGS. 4 and 5. Figure 4
2 is a form in which the software file transfer line 61 of FIG. 2 is directly connected to the memory control unit of each processor device without the processor connection bus line 11 interposed therebetween. FIG. (11, 12 in FIG. 5),
Moreover, the connection form of the switch is such that it is connected to either one of the processor coupling buses. In these systems, the bus line for file transfer is separated from the transmission path used for inter-processor communication between operating processor units and the path for software transfer, thereby lowering the bus transfer capability due to the file transfer process, and of the failed processor. The purpose is to avoid signal disturbance on the bus line due to abnormal operation.

【0007】次に、従来技術との比較のため、図2に示
した構成をもとにして、本実施例の予備装置優先選択方
法について述べる。図6および図7は、本発明の一実施
例におけるマルチプロセッサシステムの切替え前後の動
作中状態を示す図である。なお、従来技術との比較のた
め、プロセッサ装置数N=8とする。本実施例のプロセ
ッサ装置管理用制御装置21では、各プロセッサ装置の
運転状態を表3に示すプロセッサ装置状態管理表71に
よって把握する。
Next, for comparison with the prior art, the backup device priority selection method of this embodiment will be described based on the configuration shown in FIG. 6 and 7 are diagrams showing the operating state before and after the switching of the multiprocessor system in the embodiment of the present invention. For comparison with the prior art, the number of processor devices N = 8. In the processor device management control device 21 of the present embodiment, the operating condition of each processor device is grasped by the processor device status management table 71 shown in Table 3.

【表3】 このように、表1および表2に示した各プロセッサ装置
対応のソフトウェア情報(プロセッサ番号およびソフト
ウェア種別)の他に、各プロセッサ装置の運転状態(プ
ロセッサ装置状態)も管理する。なお、図6および図7
のようにプロセッサ数N=8とした場合のプロセッサ装
置状態管理表71は、表4(切替え前)および表5(切
替え後)に示す通りである。また、これらの具体例の運
用中ソフトウェアの各プロセッサ装置へのロード状態は
表1に示したものと同一であり、また、このマルチプロ
セッサシステムへ搭載されるソフトウェアの種別につい
ても表1と同様に、A種、B種、C種の3種類とする。
[Table 3] In this way, in addition to the software information (processor number and software type) corresponding to each processor device shown in Tables 1 and 2, the operating state (processor device state) of each processor device is also managed. 6 and 7
As described above, the processor device state management table 71 when the number of processors N = 8 is as shown in Table 4 (before switching) and Table 5 (after switching). Further, the loading state of the operating software of these specific examples to each processor device is the same as that shown in Table 1, and the type of software installed in this multiprocessor system is also the same as in Table 1. , A type, B type, and C type.

【表4】 [Table 4]

【表5】 このように、予備待機中のプロセッサ装置は少くとも、
走行されるソフトウェアの種類に相当する台数分用意さ
れる。すなわち、ソフトウェアの種類数は3であるか
ら、3台の予備待機中のプロセッサ装置6〜8を用意す
る。さらに本実施例では、プロセッサ装置6へA種、プ
ロセッサ装置7へB種、プロセッサ装置8へC種、とい
うように、3種類のソフトウェアを予備待機中のプロセ
ッサ装置へロードした状態でソフトウェアの初期化を実
行し待機させる。
[Table 5] Thus, at least the processor units in standby are
The number of vehicles corresponding to the type of running software is prepared. That is, since the number of types of software is 3, three processor units 6 to 8 in standby are prepared. Further, in the present embodiment, three types of software, such as type A to the processor device 6, type B to the processor device 7, and type C to the processor device 8, are loaded into the processor device in the standby standby, and the software is initialized. Execute and wait.

【0008】次に、本実施例の予備装置の選択処理につ
いて述べる。図1は、本発明の一実施例における予備装
置優先選択方法を示すフローチャートである。いま、運
用中のプロセッサ装置1が故障した場合を考える。この
場合、まず、プロセッサ装置1の故障検出に伴って、接
続用スイッチ41を開放し、次に、予備プロセッサ装置
の選択を行なう。なお、他の任意の運用中プロセッサ装
置が故障した場合にもその回復論理は同一である。本実
施例では、故障が検出されたプロセッサ装置1のソフト
ウェア種別は、A種であったから、A種のソフトウェア
をロードして予備待機中状態にあるプロセッサ装置を選
択する(ステップ101〜103)。上記表4より、当
該条件を満足する予備装置はプロセッサ装置6であるか
ら、接続用スイッチ46を閉じ、プロセッサ装置6をプ
ロセッサ結合用バス線11に接続する。このプロセッサ
装置6は、故障したプロセッサ装置1と同一種別のソフ
トウェアを事前にメモリ上にロードし、初期設定を済ま
せているから、ステップ104の処理を実施することが
可能である。すなわち、バス線11へ予備プロセッサの
接続完了後(ステップ104a)、ソフトウェアのロー
ド処理なしに、各プロセッサ装置に固有のデータを転送
するのみで(ステップ104b)、即座に運転を再開さ
せる(ステップ104c)ことができる。ここで、各プ
ロセッサ装置に固有のデータの転送とは、故障前のプロ
セッサ装置の運用状態を予備プロセッサにて継続するた
めに用いられるデータの転送処理を意味するものであ
り、当該データについては事前に転送しておくことがで
きず、故障プロセッサ装置が決定した時点で転送すべき
データをプロセッサ制御装置21から転送する。なお、
システムによっては本データ転送処理を省略することが
できる場合がある。この装置切替えの結果として、プロ
セッサ装置管理状態表71は、上記表4(切替え前)か
ら表5(切替え後)のように変更され、プロセッサ装置
1〜8の運転状態およびソフトウェア種別は、図6(切
替え前)から図7(切替え後)のようになる。
Next, the process of selecting the backup device of this embodiment will be described. FIG. 1 is a flowchart showing a backup device priority selection method according to an embodiment of the present invention. Consider a case where the processor device 1 in operation now fails. In this case, first, the connection switch 41 is opened in accordance with the failure detection of the processor device 1, and then the spare processor device is selected. It should be noted that the recovery logic is the same when any other operating processor device fails. In the present embodiment, since the software type of the processor device 1 in which the failure is detected is the A type, the software of the A type is loaded and the processor device in the standby state is selected (steps 101 to 103). From Table 4 above, the processor device 6 is the spare device that satisfies this condition, so the connection switch 46 is closed and the processor device 6 is connected to the processor coupling bus line 11. Since the processor device 6 has loaded the software of the same type as that of the failed processor device 1 on the memory in advance and has completed the initial setting, it is possible to perform the processing of step 104. That is, after the connection of the spare processor to the bus line 11 is completed (step 104a), the data unique to each processor device is simply transferred without the software loading process (step 104b), and the operation is immediately restarted (step 104c). )be able to. Here, the transfer of the data unique to each processor device means a transfer process of the data used for continuing the operating state of the processor device before the failure in the spare processor. Cannot be transferred to the processor control device 21, and data to be transferred at the time when the faulty processor device determines it is transferred from the processor control device 21. In addition,
This data transfer process may be omitted depending on the system. As a result of this device switching, the processor device management state table 71 is changed from the above table 4 (before switching) to table 5 (after switching), and the operating states and software types of the processor devices 1 to 8 are as shown in FIG. From (before switching) to FIG. 7 (after switching).

【0009】一方、ステップ103において、故障プロ
セッサ装置と同一種別のソフトウェアをロードした、予
備待機中のプロセッサ装置がない場合には、ステップ1
05に進む。すなわち、従来と同様に、任意の予備プロ
セッサ装置を選択し(ステップ105a)、これに故障
プロセッサと同一種別のソフトウェアをロードしてから
(ステップ105b)、その予備プロセッサ装置に固有
のデータを転送し(ステップ105c)、運用を開始す
る(ステップ105d)。なお、通常は予めソフトウェ
アをロードした予備装置を待機させているため、ステッ
プ105の処理を行なうことは少い。よって、ステップ
105bに示すソフトウェアのロード処理の時間が短縮
できる。
On the other hand, if it is determined in step 103 that there is no standby standby processor device loaded with software of the same type as the faulty processor device, step 1
Go to 05. That is, as in the conventional case, an arbitrary spare processor device is selected (step 105a), software of the same type as the faulty processor is loaded into this (step 105b), and then data unique to the spare processor device is transferred. (Step 105c), operation is started (Step 105d). Note that normally, the standby device in which the software is loaded in advance is on standby, and therefore the process of step 105 is rarely performed. Therefore, the time required for the software loading process shown in step 105b can be shortened.

【0010】なお、故障プロセッサ装置については、こ
れを修理し、正常が確認された段階で、予備プロセッサ
装置として待機させることになるが、この場合は、原則
として故障したプロセッサ装置にて走行していたソフト
ウェアと同種のソフトウェアをロードして予備プロセッ
サ装置として待機させる。本実施例では、運転中状態
(図8の801)のプロセッサ装置1に故障が発生する
と、故障中状態(図8の802)から、故障の原因を解
析した後、当該故障プロセッサ装置の修理等の適当な処
置を行ない、その後、予備待機中状態(図8の804)
となる場合、プロセッサ装置管理用制御装置21は種別
Aのソフトウェアをソフトウェアファイル格納装置31
から読み出し、これをソフトウェア転送用線路51を介
して故障修理を終えたプロセッサ装置1のメモリへ転送
する(図8の803)。
Regarding the faulty processor unit, when it is repaired and normality is confirmed, it is made to stand by as a spare processor unit. In this case, in principle, the faulty processor unit is running. The same kind of software as the above-mentioned software is loaded and made to stand by as a spare processor device. In this embodiment, when a failure occurs in the processor device 1 in the operating state (801 in FIG. 8), the cause of the failure is analyzed from the in-failure state (802 in FIG. 8), and then the failed processor device is repaired. Appropriate measures are taken, and then the standby state (804 in FIG. 8)
In this case, the processor device management control device 21 loads the software of type A into the software file storage device 31.
Read out from the device and transferred to the memory of the processor device 1 which has completed the failure repair via the software transfer line 51 (803 in FIG. 8).

【0011】[0011]

【発明の効果】本発明によれば、ソフトウェアの種類に
よってその動作仕様を可変とする複数プロセッサ装置か
らなるマルチプロセッサ構成のコンピュータシステムで
の任意の1プロセッサ装置の故障を契機として代替予備
プロセッサ装置を組み込む故障回復処理において、予め
メモリ上へロードしてあるソフトウェアの種別が当該故
障プロセッサにロードされていたソフトウェアと同一で
ある予備プロセッサ装置を優先的に選択することで、ソ
フトウェアの再ロード処理を回避し、もってシステムの
復旧時間が短縮される。
According to the present invention, an alternative spare processor unit is triggered by a failure of an arbitrary one processor unit in a computer system having a multiprocessor configuration including a plurality of processor units whose operation specifications are variable depending on the type of software. Avoids software reload processing by preferentially selecting a spare processor unit in which the type of software loaded in memory in advance is the same as the software loaded in the failed processor in the built-in failure recovery processing Therefore, the system recovery time is shortened.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の一実施例における予備装置優先選択方
法を示すフローチャートである。
FIG. 1 is a flowchart showing a backup device priority selection method according to an embodiment of the present invention.

【図2】疎結合マルチプロセッサ装置からなるシステム
の基本構成を示す図である。
FIG. 2 is a diagram showing a basic configuration of a system including loosely coupled multiprocessor devices.

【図3】従来のマルチプロセッサシステムの切替え前の
動作中状態を示す図である。
FIG. 3 is a diagram showing an operating state before switching of a conventional multiprocessor system.

【図4】本発明の予備装置優先選択方法を適用するマル
チプロセッサシステムの一例を示す基本構成図である。
FIG. 4 is a basic configuration diagram showing an example of a multiprocessor system to which the backup device priority selection method of the present invention is applied.

【図5】本発明の予備装置優先選択方法を適用するマル
チプロセッサシステムの一例を示す基本構成図である。
FIG. 5 is a basic configuration diagram showing an example of a multiprocessor system to which the backup device priority selection method of the present invention is applied.

【図6】本発明の一実施例におけるマルチプロセッサシ
ステムの切替え前の動作中状態を示す図である。
FIG. 6 is a diagram showing an operating state before switching of the multiprocessor system according to the embodiment of the present invention.

【図7】本発明の一実施例におけるマルチプロセッサシ
ステムの切替え前の動作中状態を示す図である。
FIG. 7 is a diagram showing an operating state before switching of the multiprocessor system according to the embodiment of the present invention.

【図8】本発明の一実施例におけるプロセッサ装置の状
態遷移を示す図である。
FIG. 8 is a diagram showing a state transition of the processor device in the embodiment of the present invention.

【符号の説明】[Explanation of symbols]

1 マルチプロセッサ装置 2 マルチプロセッサ装置 3 マルチプロセッサ装置 4 マルチプロセッサ装置 5 マルチプロセッサ装置 6 マルチプロセッサ装置 7 マルチプロセッサ装置 8 マルチプロセッサ装置 N マルチプロセッサ装置 11 プロセッサ間結合用バス線 12 プロセッサ間結合用バス線 21 プロセッサ装置管理用制御装置 31 ソフトウェアファイル格納装置 41 接続用スイッチ 42 接続用スイッチ 43 接続用スイッチ 44 接続用スイッチ 45 接続用スイッチ 46 接続用スイッチ 47 接続用スイッチ 48 接続用スイッチ 4N 接続用スイッチ 51 プロセッサ装置切替え制御用線路 61 ソフトウェア転送用線路 62 ソフトウェア転送用線路 71 プロセッサ装置管理状態表 1 multiprocessor device 2 multiprocessor device 3 multiprocessor device 4 multiprocessor device 5 multiprocessor device 6 multiprocessor device 7 multiprocessor device 8 multiprocessor device N multiprocessor device 11 interprocessor coupling bus line 12 interprocessor coupling bus line 21 Processor Device Management Control Device 31 Software File Storage Device 41 Connection Switch 42 Connection Switch 43 Connection Switch 44 Connection Switch 45 Connection Switch 46 Connection Switch 47 Connection Switch 48 Connection Switch 4N Connection Switch 51 Processor Device switching control line 61 Software transfer line 62 Software transfer line 71 Processor device management status table

Claims (1)

【特許請求の範囲】[Claims] 【請求項1】 メモリ上へロードされるソフトウェアの
種類によって動作仕様が可変な複数のプロセッサ装置お
よび代替用の予備プロセッサ装置を備えた疎結合マルチ
プロセッサ構成のコンピュータシステムでの予備プロセ
ッサ装置の選択方法において、任意のプロセッサ装置の
故障を契機として該予備プロセッサ装置を組み込む場
合、該故障プロセッサ装置のメモリ上へロードしてある
ソフトウェアの種別を認識し、該種別と同一種別のソフ
トウェアが予めメモリ上へロードされている予備プロセ
ッサ装置がある場合には、該予備プロセッサ装置を優先
的に選択することを特徴とする予備装置優先選択方法。
1. A method for selecting a spare processor unit in a loosely coupled multiprocessor computer system comprising a plurality of processor units whose operation specifications are variable depending on the type of software loaded on a memory and a spare processor unit for substitution. In the case of incorporating the spare processor device in response to the failure of an arbitrary processor device, the type of software loaded in the memory of the failed processor device is recognized, and software of the same type as the type is loaded in the memory in advance. A spare device preferential selection method characterized in that, when there is a spare processor device loaded, the spare processor device is preferentially selected.
JP5268912A 1993-10-27 1993-10-27 Method for preferentially selecting auxiliary device Pending JPH07121395A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5268912A JPH07121395A (en) 1993-10-27 1993-10-27 Method for preferentially selecting auxiliary device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5268912A JPH07121395A (en) 1993-10-27 1993-10-27 Method for preferentially selecting auxiliary device

Publications (1)

Publication Number Publication Date
JPH07121395A true JPH07121395A (en) 1995-05-12

Family

ID=17465001

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5268912A Pending JPH07121395A (en) 1993-10-27 1993-10-27 Method for preferentially selecting auxiliary device

Country Status (1)

Country Link
JP (1) JPH07121395A (en)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000043882A1 (en) * 1999-01-20 2000-07-27 Fujitsu Limited Database switching apparatus
WO2006040811A1 (en) * 2004-10-12 2006-04-20 Fujitsu Limited Resource exchange processing program and resource exchange processing method
US7971089B2 (en) 2004-10-18 2011-06-28 Fujitsu Limited Switching connection of a boot disk to a substitute server and moving the failed server to a server domain pool
US20120117405A1 (en) * 2010-11-04 2012-05-10 Seiko Epson Corporation Information Processing Device and Data Distribution Method
US8224941B2 (en) 2004-10-18 2012-07-17 Fujitsu Limited Method, apparatus, and computer product for managing operation
US8387013B2 (en) 2004-10-18 2013-02-26 Fujitsu Limited Method, apparatus, and computer product for managing operation
JP2014099001A (en) * 2012-11-13 2014-05-29 Hitachi Ltd Computer system, processing server, aggregation server, and backup method

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000043882A1 (en) * 1999-01-20 2000-07-27 Fujitsu Limited Database switching apparatus
WO2006040811A1 (en) * 2004-10-12 2006-04-20 Fujitsu Limited Resource exchange processing program and resource exchange processing method
US7971089B2 (en) 2004-10-18 2011-06-28 Fujitsu Limited Switching connection of a boot disk to a substitute server and moving the failed server to a server domain pool
US8224941B2 (en) 2004-10-18 2012-07-17 Fujitsu Limited Method, apparatus, and computer product for managing operation
US8387013B2 (en) 2004-10-18 2013-02-26 Fujitsu Limited Method, apparatus, and computer product for managing operation
US20120117405A1 (en) * 2010-11-04 2012-05-10 Seiko Epson Corporation Information Processing Device and Data Distribution Method
JP2012098978A (en) * 2010-11-04 2012-05-24 Seiko Epson Corp Information processing apparatus and distribution method of data
US8819465B2 (en) * 2010-11-04 2014-08-26 Seiko Epson Corporatoin Information processing device and data distribution method
JP2014099001A (en) * 2012-11-13 2014-05-29 Hitachi Ltd Computer system, processing server, aggregation server, and backup method

Similar Documents

Publication Publication Date Title
US4941087A (en) System for bumpless changeover between active units and backup units by establishing rollback points and logging write and read operations
US5548743A (en) Data processing system with duplex common memory having physical and logical path disconnection upon failure
US3864670A (en) Dual computer system with signal exchange system
US6574748B1 (en) Fast relief swapping of processors in a data processing system
US5742851A (en) Information processing system having function to detect fault in external bus
JPS59106056A (en) Failsafe type data processing system
JPH07121395A (en) Method for preferentially selecting auxiliary device
JPS5917467B2 (en) Control computer backup method
JP3448197B2 (en) Information processing device
JPH047645A (en) Fault tolerant computer
JP3363579B2 (en) Monitoring device and monitoring system
JPH05324134A (en) Duplexed computer system
JPH03219360A (en) Multiprocessor control system
JPS6113627B2 (en)
JPH07114521A (en) Multimicrocomputer system
JP2000148709A (en) Multi-cpu constitution system and system reconstituting method
JPS6011901A (en) Back-up device of decentralized controller
JPS6349849A (en) Data processor
JP2815730B2 (en) Adapters and computer systems
JP2896206B2 (en) On-line diagnostics for multiplexed memory devices.
JPH04291553A (en) Transmitter
JPH01259654A (en) (n) versus 1 module backup system for automatic line switching equipment
JPH09146853A (en) Duplex computer and fault system restoration method therefor
JPS62296264A (en) Control system for structure of data processing system
JPH05274169A (en) Computer