JP2002312333A - Multiprocessor initializing/parallel diagnosing method - Google Patents

Multiprocessor initializing/parallel diagnosing method

Info

Publication number
JP2002312333A
JP2002312333A JP2001113419A JP2001113419A JP2002312333A JP 2002312333 A JP2002312333 A JP 2002312333A JP 2001113419 A JP2001113419 A JP 2001113419A JP 2001113419 A JP2001113419 A JP 2001113419A JP 2002312333 A JP2002312333 A JP 2002312333A
Authority
JP
Japan
Prior art keywords
processor
normal
initialization
reserved
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001113419A
Other languages
Japanese (ja)
Other versions
JP3688217B2 (en
Inventor
Shinichi Ochiai
真一 落合
Kazuhiro Murayama
和宏 村山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2001113419A priority Critical patent/JP3688217B2/en
Publication of JP2002312333A publication Critical patent/JP2002312333A/en
Application granted granted Critical
Publication of JP3688217B2 publication Critical patent/JP3688217B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To realize early system operation by setting up a system while using only processors responding within a given time as normal processors, and confirming reserved processes in parallel. SOLUTION: This multiprocessor initializing/parallel diagnosing method has a step S102 for determining the normal processors by giving a command of the initialization of the system, and confirming the response after a predetermined time, a step S302 for starting the system operation by the normal processors which send back the response, and a step S301 for regarding the processor not sending back the response within the predetermined time as the reserved processors and confirming the reserved processors in parallel with the system operation with respect to a multiprocessor system executing information processing.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】この発明は、マルチプロセッ
サにより構成される情報処理システムの初期化処理に関
するものであり、特にシステムを構成するプロセッサの
いくつかに異常がある場合でも、システムの起動時間を
短縮すると同時に、その異常に対処してシステムの信頼
性を向上しようとするものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an initialization process for an information processing system composed of multiprocessors, and more particularly, to reducing the system startup time even if some of the processors constituting the system are abnormal. At the same time, it is intended to deal with the abnormality and improve the reliability of the system.

【0002】[0002]

【従来の技術】従来のマルチプロセッサシステムの初期
化時に障害があった場合の復旧処理方式としては、例え
ば、特開平11−161616号公報に示されるような
ものがあった。図23はこの公報に示されたマルチプロ
セッサシステムの初期化処理方式の動作の一部を示す図
である。
2. Description of the Related Art As a conventional recovery processing method when a failure occurs at the time of initialization of a multiprocessor system, for example, there is a method disclosed in Japanese Patent Application Laid-Open No. H11-161616. FIG. 23 is a diagram showing a part of the operation of the initialization processing method of the multiprocessor system disclosed in this publication.

【0003】この方式の動作を説明する。マルチプロセ
ッサシステムを構成する複数のプロセッサが初期化処理
において異常となった場合に、障害復旧の初期化(IP
L)処理プログラム種別IDをブロードキャスト通信に
より送信し、障害を起こした複数のプロセッサを同時に
復旧させることにより、障害発生時でも起動処理時間を
短縮しようとするものである。障害を起こしたと思われ
るプロセッサに対し、ブロードキャスト通信により起動
指示を再試行すると供に、再試行の起動指示に対し応答
しないプロセッサを切離すという手順により、システム
の初期化処理を完了させる。このように、障害を起こし
た複数のプロセッサに同時に起動処理の再試行を行わせ
ることができるので、障害を起こしたプロセッサごとに
個別に起動処理の再試行を行う場合よりも、高速にシス
テムを起動することができる。しかし、初期化処理の再
試行を行うために、やはりシステムの起動時間は正常時
と比べて遅延する。
The operation of this system will be described. When a plurality of processors constituting the multiprocessor system become abnormal in the initialization processing, initialization of failure recovery (IP
L) By transmitting a processing program type ID by broadcast communication and simultaneously recovering a plurality of failed processors, the startup processing time is reduced even when a failure occurs. The initialization process of the system is completed by retrying the start instruction by broadcast communication with respect to the processor that seems to have failed and by disconnecting the processor that does not respond to the start instruction of the retry. In this way, since a plurality of failed processors can be retried in the boot process at the same time, the system can be faster than in the case of individually retrying the boot process for each failed processor. Can be started. However, since the initialization process is retried, the startup time of the system is also delayed as compared with the normal time.

【0004】[0004]

【発明が解決しようとする課題】従来のマルチプロセッ
サシステムの初期化処理方式は以上のように構成されて
おり、応答が返らないプロセッサの判定処理は、最も起
動処理が遅れた場合をタイムアウト時間として設定する
ので、長い再初期化時間が必要となる。更に信頼性に劣
る通信路を用いたブロードキャスト通信をに頼るので、
このような初期化処理動作が複数回再試行されることに
なる。こうして再試行初期化処理における正常/異常の
判定の間、システムの運用開始が大きく遅延する可能性
が発生する。通常、冗長構成のマルチプロセッサシステ
ムにおいては、いくつかのプロセッサが異常でもシステ
ムは運用可能であるにも関わらず、結果的に異常プロセ
ッサの状態確認が優先して起動時間が遅くなるという課
題があった。
The conventional initialization processing method of a multiprocessor system is configured as described above, and the determination processing of a processor that does not return a response takes a time when the startup processing is delayed most as a timeout time. Setting requires a long re-initialization time. Because it relies on broadcast communication using a less reliable communication path,
Such an initialization processing operation is retried a plurality of times. In this way, during the normal / abnormal determination in the retry initialization process, there is a possibility that the operation start of the system is greatly delayed. Normally, in a multi-processor system with a redundant configuration, even if some processors are abnormal, the system is operable, but as a result, there is a problem in that the status check of the abnormal processor is given priority and the startup time is delayed. Was.

【0005】この発明は上記のような課題を解消するた
めになされたもので、システム運用開始においては必要
となるプロセッサを絞り込んで立ち上げ、システム運用
が立ち上がって後のフェーズで順次、必要なプロセッサ
を参入するようにして信頼性を向上し、プロセッサの初
期化、異常確認と、システムの運用を並行して行うよう
にする。
SUMMARY OF THE INVENTION The present invention has been made to solve the above-mentioned problems. In starting the system operation, the required processors are narrowed down and started, and the required processors are sequentially turned on in a later phase after the system operation is started. In order to improve reliability, the initialization of the processor, the confirmation of the abnormality, and the operation of the system are performed in parallel.

【0006】[0006]

【課題を解決するための手段】この発明に係るマルチプ
ロセッサ初期化/並行診断方法は、情報処理を行うマル
チプロセッサシステムにおいて、システム初期化指令を
行って、所定時間後に応答を確認して正常プロセッサと
判定するステップと、応答があった正常プロセッサによ
りシステム運用を開始するステップと、所定時間内に応
答がないプロセッサを留保プロセッサとして、留保プロ
セッサをシステム運用と並行して確認処理をするステッ
プ、とを備えた。
SUMMARY OF THE INVENTION A multiprocessor initialization / parallel diagnostic method according to the present invention is directed to a multiprocessor system for performing information processing, in which a system initialization command is issued, a response is confirmed after a predetermined time, and a normal processor is checked. Determining, and starting a system operation by a normal processor that has responded, and a step of performing a confirmation process in parallel with the system operation, the processor that does not respond within a predetermined time as a reservation processor, With.

【0007】また更に、留保プロセッサの確認処理を、
正常プロセッサの1つが行うようにした。
Further, the confirmation processing of the reservation processor is
One of the normal processors did so.

【0008】また更に、システム運用時、設定時間内に
通信が確認できない場合は、システムから切り離して正
常プロセッサを代替させ、かつ時間内に確認できないプ
ロセッサを留保プロセッサに移すようにした。
Further, when communication cannot be confirmed within a set time during system operation, the system is disconnected from the system and replaced with a normal processor, and a processor that cannot be confirmed within the time is transferred to a reserved processor.

【0009】また更に、留保プロセッサの確認処理とし
て、初期化指令を行い、再度所定時間内に応答がない場
合は、異常プロセッサとして分離するようにした。
Furthermore, as a confirmation process of the reservation processor, an initialization command is issued, and if there is no response again within a predetermined time, the processor is separated as an abnormal processor.

【0010】また更に、留保プロセッサの確認処理とし
て、初期化指令を行い、所定時間内に応答があれば、正
常プロセッサとして戻すようにした。
Further, as a confirmation process of the reservation processor, an initialization command is issued, and if there is a response within a predetermined time, the processor is returned to a normal processor.

【0011】また更に、システム運用時に時間内通信が
確認できずに留保プロセッサとなった場合は、留保プロ
セッサの確認処理として所定の処理要求を実行させて、
所定時間内に応答が無ければ、異常プロセッサとして分
離するようにした。
Further, when the reserved processor cannot be confirmed during the operation of the system and communication cannot be confirmed within the time period, a predetermined processing request is executed as confirmation processing of the reserved processor.
If there is no response within a predetermined time, it is separated as an abnormal processor.

【0012】また更に、システム運用時に時間内通信が
確認できずに留保プロセッサとなった場合は、留保プロ
セッサの確認処理として所定の処理要求を実行させて、
所定時間内に応答があれば、正常プロセッサとして戻す
ようにした。
[0012] Further, when the reserved processor cannot be confirmed during the time of system operation and communication cannot be confirmed within the time, a predetermined processing request is executed as confirmation processing of the reserved processor.
If a response is received within a predetermined time, the processor is returned as a normal processor.

【0013】また更に、正常プロセッサ数を監視する機
構を設けて、システムが要求するプロセッサ数と比較す
るステップと、この比較の結果、システム運用に支障が
あると判定される場合は、判定結果を出力するようにし
た。
Further, a step of providing a mechanism for monitoring the number of normal processors is provided, and the number of processors is compared with the number of processors required by the system. Added output.

【0014】[0014]

【発明の実施の形態】実施の形態1.マルチプロセッサ
システムの初期化処理において、構成する各プロセッサ
を、正常と判定できた「正常」プロセッサプール、正常
・異常の判定ができなかった「保留」プロセッサプー
ル、異常と判定した「異常」プロセッサプールに分ける
ことにより、個々のプールのその後の処理を変更する方
法を説明する。図1は、この発明の実施の形態1におけ
るマルチプロセッサシステムの初期化処理方式の概念を
示す構成図である。図において、101はシステムを構
成するプロセッサを示す。本実施の形態では、多数のプ
ロセッサで構成され、プロセッサを冗長構成したシステ
ムを想定する。各プロセッサはプロセッサ間のデータ交
換のためにネットワーク103で接続される。このネッ
トワークはバス、LAN、ファイバーチャネルなど、種
々のものであってよい。また、大規模構成を実現するた
めにネットワーク103は、102で示すネットワーク
スイッチにより、階層構造を持つ場合もある。100は
プロセッサの中で、システム管理を行うように選定され
たシステムマスタプロセッサである。システムマスタプ
ロセッサ100は、ネットワーク103、ネットワーク
スイッチ102を介して、他の全てのプロセッサ101
と通信できる。
DESCRIPTION OF THE PREFERRED EMBODIMENTS Embodiment 1 In the initialization processing of the multiprocessor system, the "normal" processor pool that could be determined to be normal, the "pending" processor pool that could not be determined to be normal or abnormal, and the "abnormal" processor pool that was determined to be abnormal in the initialization process of the multiprocessor system A method of changing the subsequent processing of each pool by dividing the processing into the following will be described. FIG. 1 is a configuration diagram showing a concept of an initialization processing method of a multiprocessor system according to Embodiment 1 of the present invention. In the figure, reference numeral 101 denotes a processor constituting the system. In the present embodiment, it is assumed that a system is configured with a large number of processors and the processors are redundantly configured. Each processor is connected by a network 103 for data exchange between the processors. This network may be of various types, such as a bus, a LAN, a fiber channel, and the like. Further, in order to realize a large-scale configuration, the network 103 may have a hierarchical structure by a network switch indicated by 102. Reference numeral 100 denotes a system master processor selected to perform system management among the processors. The system master processor 100 is connected to all other processors 101 via the network 103 and the network switch 102.
Can communicate with.

【0015】このような構成のマルチプロセッサシステ
ムにおいて、システム起動時には、従来例で示された技
術を利用して、システムマスタプロセッサ100が、初
期化指示、もしくは初期プログラムのダウンロード10
4を、全てのプロセッサに対して同時に行って、システ
ムを起動する。各プロセッサ101はその指示に従い、
プロセッサの初期化処理を行う。図2は初期化処理の完
了状態を示す図である。個々のプロセッサ101は初期
化処理が完了すると、システムの同期のために、それぞ
れシステムマスタプロセッサ100に対して完了通知1
05を返す。この完了通知は、システムマスタプロセッ
サ100の特定のレジスタへの書込みによる方法や、メ
ッセージ送信による方法など、種々の方法が利用でき
る。システムマスタプロセッサ100は、この完了通知
の受信により、各プロセッサの初期化処理が正常に完了
したことを確認する。
In the multiprocessor system having such a configuration, at the time of system startup, the system master processor 100 uses the technique shown in the conventional example to issue an initialization instruction or download of an initial program.
4 for all processors simultaneously to start up the system. Each processor 101 follows the instruction,
Performs initialization of the processor. FIG. 2 is a diagram showing a completed state of the initialization processing. Upon completion of the initialization processing, the individual processors 101 notify the system master processor 100 of the completion notification 1 for the purpose of system synchronization.
Returns 05. Various methods such as a method by writing to a specific register of the system master processor 100 and a method by message transmission can be used for the completion notification. Upon receiving the completion notification, the system master processor 100 confirms that the initialization processing of each processor has been completed normally.

【0016】この発明の実施の形態1におけるマルチプ
ロセッサシステムの初期化処理方法では、図1、図の正
常な初期化動作に加えて、システムを構成するプロセッ
サを図3に示すような3種類のプロセッサプールと呼ぶ
論理的なグループに分類する。図3中の200は、正常
動作が確認できたプロセッサが属する「正常」プロセッ
サプールである。201は正常/異常の判定がまだ完了
していないプロセッサが属する「留保」プロセッサプー
ルである。202は異常であり、システム運用に利用で
きないと判断したプロセッサの属する「異常」プロセッ
サプールである。これらのプロセッサプールは、システ
ム管理における論理的な分類であり、プロセッサに対し
て物理的に何らかの変更が行われるわけではない。
In the initialization processing method of the multiprocessor system according to the first embodiment of the present invention, in addition to the normal initialization operation shown in FIGS. They are classified into logical groups called processor pools. Reference numeral 200 in FIG. 3 denotes a “normal” processor pool to which a processor whose normal operation has been confirmed belongs. Reference numeral 201 denotes a “reserved” processor pool to which a processor whose normal / abnormal determination has not been completed yet belongs. Reference numeral 202 denotes an “abnormal” processor pool to which a processor determined to be abnormal and cannot be used for system operation belongs. These processor pools are a logical classification in system management and do not physically make any changes to the processors.

【0017】図3のグループ分けを実現するために、図
4に示す構成要素を用意する。300は「正常」プロセ
ッサプールに属するプロセッサを管理する「正常」プロ
セッサプール管理表であり、「正常」プロセッサプール
に属するプロセッサの識別子が登録される。301は
「留保」プロセッサプールに属するプロセッサを管理す
る「留保」プロセッサプール管理表であり、「留保」プ
ロセッサプールに属するプロセッサの識別子が登録され
る。302は「異常」プロセッサプールに属するプロセ
ッサを管理する「異常」プロセッサプール管理表であ
り、「異常」プロセッサプールに属するプロセッサの識
別子が登録される。本実施の形態では、300〜302
のプロセッサプール管理表はシステムマスタプロセッサ
100が管理している。そして、システムは十分に冗長
度があるプロセッサ101が用意されているので、「正
常」プロセッサによりシステムの立ち上げを完了する。
To realize the grouping shown in FIG. 3, the components shown in FIG. 4 are prepared. Reference numeral 300 denotes a “normal” processor pool management table for managing processors belonging to the “normal” processor pool, in which the identifiers of the processors belonging to the “normal” processor pool are registered. Reference numeral 301 denotes a “reserved” processor pool management table for managing processors belonging to the “reserved” processor pool, and the identifiers of the processors belonging to the “reserved” processor pool are registered. Reference numeral 302 denotes an “abnormal” processor pool management table for managing processors belonging to the “abnormal” processor pool, in which the identifiers of the processors belonging to the “abnormal” processor pool are registered. In the present embodiment, 300 to 302
Is managed by the system master processor 100. Since the system is provided with the processor 101 having sufficient redundancy, the "normal" processor completes the system startup.

【0018】従来は、図2における完了通知の受信のた
めの待ち時間は、どのような状態においても完了通知が
受信できるように、最悪の条件を予想した長い時間を設
定する必要があった。また、一過性の異常を回避するた
めに、応答がない場合は初期化指示の再試行を行う必要
があった。しかし、この実施の形態1によるマルチプロ
セッサシステムの初期化処理方法では、システムを構成
するプロセッサを図3に示したプロセッサプールに分類
し、また、以降のシステムの動作をプロセッサプールご
とに変更する。こうして、完了通知受信のための待ち時
間を短く設定し、正常にも関わらずその時間内に完了通
知を返せなかったプロセッサが存在しても、改めてその
返せなかったプロセッサに絞り込んで正常/異常確認の
再試行を行うことが可能になる。即ち、システムの初期
化処理の効率化が得られ、起動時間が短縮できる。
Conventionally, the waiting time for receiving the completion notification in FIG. 2 needs to be set to a long time in anticipation of the worst condition so that the completion notification can be received in any state. Further, in order to avoid a transient abnormality, it is necessary to retry the initialization instruction when there is no response. However, in the initialization processing method of the multiprocessor system according to the first embodiment, the processors constituting the system are classified into the processor pools shown in FIG. 3, and the subsequent operation of the system is changed for each processor pool. In this way, the waiting time for receiving the completion notification is set short, and even if there is a processor that could not return the completion notification within that time even though the processor was normal, the processor that could not return the completion notification was narrowed down and the normal / abnormal confirmation was performed. Can be retried. That is, the efficiency of the system initialization process can be increased, and the startup time can be reduced.

【0019】以下、この「正常」プロセッサの具体的な
識別と登録方法を述べる。いったん「正常」プロセッサ
が他の「留保」プロセッサ等から分離されると、これら
「正常」プロセッサを使用した高速初期化が可能とな
る。図4は高速初期化処理410の概念を示す図であ
る。この高速初期化処理410は、図1、図2に示した
処理動作を行うが、当然、その初期化処理タイムアウト
時間304を従来よりも短く設定して、その設定時間内
に初期化を終了する。
Hereinafter, a specific identification and registration method of the “normal” processor will be described. Once the "normal" processor is separated from other "reserved" processors, etc., fast initialization using these "normal" processors is possible. FIG. 4 is a diagram showing the concept of the high-speed initialization processing 410. This high-speed initialization processing 410 performs the processing operations shown in FIGS. 1 and 2, but of course, sets the initialization processing timeout time 304 shorter than before, and ends the initialization within the set time. .

【0020】この高速初期化処理410の具体的な動作
フローを図5に示す。まずステップ(以後、ステップの
記述を省略する)S101で、システムマスタプロセッ
サ100は、システムを構成する全プロセッサ101に
対して起動指示を行う。起動指示の方法としては、シス
テムリセット、ブロードキャスト通信による起動指示、
ブロードキャスト通信による初期プログラムのダウンロ
ードなどの種々の方法がある。この後S102で、シス
テムマスタプロセッサは各プロセッサ101からの初期
化処理完了通知を待つ。S102でいずれかのプロセッ
サから初期化処理完了通知を受信すると、S103でそ
の応答を返したプロセッサを「正常」プロセッサプール
200に入れて、そのプロセッサのプロセッサ識別子を
「正常」として、「正常」プロセッサプール管理表30
0へ登録する。
FIG. 5 shows a specific operation flow of the high-speed initialization processing 410. First, in step (hereinafter step description is omitted) S101, the system master processor 100 issues a start instruction to all processors 101 constituting the system. As a method of the start instruction, a system reset, a start instruction by broadcast communication,
There are various methods such as downloading an initial program by broadcast communication. Thereafter, in S102, the system master processor waits for an initialization processing completion notification from each processor 101. Upon receiving the initialization processing completion notification from any of the processors in S102, the processor returning the response in S103 is put into the "normal" processor pool 200, the processor identifier of the processor is set to "normal", and the "normal" processor is set. Pool management table 30
Register to 0.

【0021】このS102、S103の処理を繰り返し
ているうちに、初期化処理タイムアウト時間304にな
ると、S104の条件判断を経てS105に移る。従来
は、ここまでの処理でプロセッサの正常/異常判定を行
わなければならなかったために、初期化処理タイムアウ
ト時間304を十分に長くする必要があり、さらには応
答が得られない場合は、S101の起動指示を再試行し
てプロセッサの異常を確認する必要があった。しかし、
本実施の形態では、S105で完了通知を得られなかっ
たプロセッサを「留保」プロセッサプール201に入れ
てしまう。その方法は、完了通知を得られなかったプロ
セッサの識別子を「留保」プロセッサプール管理表30
1に登録することにより行う。「留保」プロセッサプー
ル201に属するプロセッサは、正常/異常の判定がで
きていないプロセッサであり、改めて正常/異常判定を
行うことになる。一方、「正常」プロセッサプール20
0に属するプロセッサは、既に正常判定を行えたプロセ
ッサであり、システム運用に初期の段階から利用できる
プロセッサとなる。こうして、指定時間で正常と判断で
きなかったプロセッサを別のプロセッサプールに分け、
後で別の処理を行えるようにしたので、従来よりも短い
応答待ち時間を設定でき、また初期化処理の再試行をや
めることが可能で、システムの初期化時間を短縮できる
ことが明らかとなった。
If the initialization processing time-out time 304 is reached during the repetition of the processing of S102 and S103, the processing proceeds to S105 through the condition judgment of S104. Conventionally, the normal / abnormal judgment of the processor had to be performed in the processing up to this point. Therefore, it is necessary to make the initialization processing time-out time 304 sufficiently long. It was necessary to retry the start instruction and confirm the processor error. But,
In the present embodiment, the processor for which the completion notification has not been obtained in S105 is put into the “reserved” processor pool 201. The method uses the “reserve” processor pool management table 30
1 by registering. Processors belonging to the “reserved” processor pool 201 are processors for which normal / abnormality has not been determined, and normality / abnormality determination will be performed again. On the other hand, the “normal” processor pool 20
Processors belonging to 0 are processors for which normality determination has already been made, and are processors that can be used from an early stage for system operation. In this way, the processor that could not be determined to be normal in the specified time is divided into another processor pool,
Since another process can be performed later, it became clear that the response wait time can be set shorter than before, the retry of the initialization process can be stopped, and the system initialization time can be shortened. .

【0022】実施の形態2.本実施の実施の形態では、
「正常」プロセッサ群によるシステムの立ち上げ後に、
システムの運用と並行した選定処理を説明する。以下、
この発明の実施の形態2におけるマルチプロセッサシス
テムの初期化処理方法を図を用いて説明する。先ず、図
6に示すように、「正常」プロセッサプールに属してい
るプロセッサの一つを選定し、それを「留保」プロセッ
サプールを管理する「留保」プロセッサプール・マスタ
400とする。つまり、「正常」プロセッサプールに属
するプロセッサは、既に正常動作が確認できたプロセッ
サであるので、プロセッサプールを管理する動作を行わ
せることができると考えられるからである。この「留
保」プロセッサプール・マスタ400を決定するため
に、本実施の形態では、新たに図に示したシステム初期
化処理内に、「留保」プロセッサプール・マスタ選定処
理510を設ける。また、図7に示すように、システム
マスタプロセッサ100内に、「留保」プロセッサプー
ル・マスタ400の識別子を持つ「留保」プロセッサプ
ール・マスタエントリ500を設ける。
Embodiment 2 FIG. In the present embodiment,
After launching the system with "normal" processors,
The selection process in parallel with the operation of the system will be described. Less than,
The initialization processing method of the multiprocessor system according to the second embodiment of the present invention will be described with reference to the drawings. First, as shown in FIG. 6, one of the processors belonging to the "normal" processor pool is selected, and is set as a "reserved" processor pool master 400 for managing the "reserved" processor pool. In other words, the processors belonging to the “normal” processor pool are processors for which normal operation has already been confirmed, and thus it is considered that an operation for managing the processor pool can be performed. In order to determine the “reserved” processor pool master 400, in the present embodiment, “reserved” processor pool / master selection processing 510 is newly provided in the system initialization processing shown in FIG. As shown in FIG. 7, a “reserved” processor pool master entry 500 having the identifier of the “reserved” processor pool master 400 is provided in the system master processor 100.

【0023】「留保」プロセッサプール・マスタ選定処
理510の動作を図8を用いて説明する。図8の例で
は、この選定処理は図5の動作に引き続き行う動作とし
て記述している。S201でシステムマスタプロセッサ
100は、「正常」プロセッサプール管理表300を参
照し、何らかのアルゴリズムによりプロセッサを一つ選
定する。このプロセッサの識別子を「正常」プロセッサ
プール管理表300のエントリから外し、この選定した
プロセッサを選定プロセッサとする。この選定の方法
は、システムの要求仕様に合わせて、管理表内のシステ
ムマスタプロセッサではない最初のプロセッサを選ぶ方
法や、特定のプロセッサ識別子を持つプロセッサを選択
する方法など種々の方法がありえる。次にS202で、
選定したプロセッサの識別子を「留保」プロセッサプー
ル・マスタエントリ500に登録する。システムは「留
保」プロセッサプール・マスタエントリ500に登録さ
れたプロセッサを「留保」プロセッサプールを管理する
プロセッサとして認識する。
The operation of the "reserve" processor pool / master selection process 510 will be described with reference to FIG. In the example of FIG. 8, this selection processing is described as an operation performed subsequently to the operation of FIG. In S201, the system master processor 100 refers to the "normal" processor pool management table 300 and selects one processor by an algorithm. The identifier of this processor is removed from the entry of the “normal” processor pool management table 300, and the selected processor is set as the selected processor. There are various methods for this selection, such as a method of selecting the first processor that is not the system master processor in the management table and a method of selecting a processor having a specific processor identifier according to the required specifications of the system. Next, in S202,
The identifier of the selected processor is registered in the “reserved” processor pool master entry 500. The system recognizes the processor registered in the “reserved” processor pool master entry 500 as a processor that manages the “reserved” processor pool.

【0024】こうして、既に正常と判定できたプロセッ
サプールの中から一つのプロセッサを「留保」プロセッ
サプールのマスタプロセッサとし、「留保」プロセッサ
プールの管理を行わせるようにしたので、「留保」プロ
セッサプールのプロセッサをシステムマスタプロセッサ
から切離し、「正常」プロセッサプールのプロセッサと
独立して動作させる準備ができた。
As described above, one processor among the processor pools that have already been determined to be normal is set as the master processor of the "reserved" processor pool, and the "reserved" processor pool is managed. Is ready to detach from the system master processor and operate independently of the processors in the "normal" processor pool.

【0025】先ず、並行処理の起動について述べる。こ
の並行処理の起動のために、新たにシステム初期化処理
内に、図4に示される並行起動処理610を持つ。並行
起動処理610は、「正常」プロセッサプール200に
属するプロセッサによる正常系のシステム運用と、「留
保」プロセッサプール・マスタプロセッサ400による
「留保」プロセッサプール201に属するプロセッサの
正常/異常判定処理を同時に動作させる。
First, the activation of the parallel processing will be described. In order to start the parallel processing, a parallel start processing 610 shown in FIG. 4 is newly provided in the system initialization processing. The parallel activation processing 610 simultaneously performs the normal system operation by the processors belonging to the “normal” processor pool 200 and the normal / abnormal judgment processing of the processors belonging to the “reserved” processor pool 201 by the “reserved” processor pool / master processor 400. Make it work.

【0026】並行起動処理610の動作を図9を用いて
説明する。図9の例では、この並行起動処理610は図
8の動作に引き続き行う動作として記述している。S3
01でシステムマスタプロセッサ100は、プロセッサ
間通信により、「留保」プロセッサプール・マスタプロ
セッサ400に「留保」プロセッサプールに属するプロ
セッサの正常/異常判定を行う再確認処理の起動を指示
する。これにより、「留保」プロセッサプール・マスタ
プロセッサは「正常」プロセッサプール内のプロセッサ
と独立して動作する。次にS302で、システムマスタ
プロセッサは「正常」プロセッサプール管理表300を
参照し、そこに登録されている「正常」プロセッサプー
ル内のプロセッサのみで、システムの運用を開始する。
この時点では「正常」プロセッサプールに登録されてい
るプロセッサは、システムを構成するプロセッサの一部
であるが、システム運用の初期段階では演算負荷が小さ
いことが多いことや、また全てのプロセッサが必要とな
るシステム状態は少ないことから、このような起動が可
能となる。
The operation of the parallel activation process 610 will be described with reference to FIG. In the example of FIG. 9, the parallel activation process 610 is described as an operation that is performed subsequently to the operation of FIG. S3
At 01, the system master processor 100 instructs the “reserved” processor pool / master processor 400 to start the reconfirmation process for determining the normality / abnormality of the processors belonging to the “reserved” processor pool by inter-processor communication. This allows the "reserved" processor pool master processor to operate independently of the processors in the "normal" processor pool. Next, in S302, the system master processor refers to the “normal” processor pool management table 300, and starts operating the system only with the processors in the “normal” processor pool registered therein.
At this point, the processors registered in the “normal” processor pool are part of the processors that make up the system, but the computational load is often small in the early stages of system operation, and all processors are required. Since there are few system states, such activation is possible.

【0027】こうして、「留保」プロセッサプール内の
プロセッサに対して行う異常判定などの処理と並行し
て、「正常」プロセッサプール内のプロセッサを使って
システム運用を開始するようにしたので、システムの初
期化時間を短縮できる。
In this way, the system operation is started by using the processors in the "normal" processor pool in parallel with the processing such as the abnormality judgment performed on the processors in the "reserved" processor pool. Initialization time can be reduced.

【0028】次にシステムの立ち上げと並行した、「保
留」プロセッサに対する正常/異常の再認識処理につい
て述べる。この再認識処理のために、図10に示すよう
に、選択された「留保」プロセッサプール・マスタ40
0が再確認処理420を持つ。更にこの再確認処理にお
いて、システムマスタプロセッサ100の持つプロセッ
サプール管理表の操作を行う。再確認処理420におけ
るプロセッサプール管理表に対する操作を図11に示
す。選定された「留保」プロセッサプール・マスタ40
0は、「留保」プロセッサプール管理表301を参照し
て、登録しているプロセッサに対し、従来例と同様なマ
ルチキャスト通信により初期化リトライ要求500を発
行し、正常/異常が確認できていないプロセッサに対
し、初期化処理を再試行する。再試行により最終的に正
常と確認できたプロセッサは、そのプロセッサ識別子を
「留保」プロセッサプール管理表301から外し、「正
常」プロセッサプール管理表300に登録することによ
り、そのプロセッサを「正常」プロセッサプール200
に移行させる。[正常]プロセッサプールに移行された
プロセッサは、システムマスタプロセッサが「正常」プ
ロセッサプール管理表300を参照し、システム運用に
参入させる。
Next, a description will be given of the normal / abnormal re-recognition processing for the "pending" processor in parallel with the start-up of the system. For this re-recognition process, as shown in FIG.
0 has a reconfirmation process 420. Further, in this reconfirmation process, the processor pool management table of the system master processor 100 is operated. FIG. 11 shows an operation on the processor pool management table in the reconfirmation process 420. Selected "reserved" processor pool master 40
0 refers to the “reserved” processor pool management table 301, issues an initialization retry request 500 to the registered processor by multicast communication similar to the conventional example, and confirms whether the processor is normal / abnormal. Retry the initialization process. The processor that has finally been confirmed to be normal by the retry removes the processor identifier from the “reserved” processor pool management table 301 and registers the processor identifier in the “normal” processor pool management table 300, thereby setting the processor to the “normal” processor. Pool 200
Move to [Normal] The processor that has been migrated to the processor pool causes the system master processor to refer to the "normal" processor pool management table 300 and enter the system operation.

【0029】再試行によっても正常と確認できなかった
プロセッサは、そのプロセッサ識別子を「留保」プロセ
ッサプール管理表301から外し、「異常」プロセッサ
管理表302に登録して、そのプロセッサを「異常」プ
ロセッサプール202に入れる。「異常」プロセッサプ
ール202のプロセッサは、H/W異常などの恒久的障
害と判断し、システム運用から切離す。この再確認処理
420が終わると、「留保」プロセッサプールのプロセ
ッサは、「正常」プロセッサプール、もしくは「異常」
プロセッサプールに移行し、「留保」プロセッサプール
は空となる。
A processor that cannot be confirmed as normal by retrying removes its processor identifier from the "reserved" processor pool management table 301 and registers it in the "abnormal" processor management table 302, and registers the processor with the "abnormal" processor. Put into pool 202. The processor in the “abnormal” processor pool 202 determines that the failure is a permanent failure such as an H / W abnormality, and disconnects it from the system operation. When the reconfirmation process 420 is completed, the processors in the “reserved” processor pool are changed to the “normal” processor pool or the “abnormal”
Transition to the processor pool, the "reserved" processor pool is empty.

【0030】上記で概略を示した再確認処理420の詳
細動作を図12を用いて説明する。図12の例では、再
確認処理420は図9S301の指示により起動される
処理として記述している。再確認処理420は、従来と
同様な方法により、確実なプロセッサの正常/異常判定
を行う。まず、S401で、システムで規定した回数の
初期化要求の再試行を実行したかどうかを確認する。指
定回数の再試行を行っていない場合には、S402で
「留保」プロセッサプール管理表301を参照し、登録
してあるプロセッサに対し、単体リセットやマルチキャ
スト通信などの手段により、初期化処理の再試行を要求
する。次にS403で、その初期化処理完了の応答を待
つ。応答があった場合は、S404で完了通知を返した
プロセッサのプロセッサ識別子を「正常」プロセッサプ
ール管理表300へ登録する。S403、S404の動
作をS405で初期化処理タイムアウト時間に達するま
で繰り返す。S405における初期化処理タイムアウト
時間は、実施の形態2の高速初期化処理410における
初期化処理タイムアウト時間304とは異なり、もっと
も初期化処理が遅れた場合の初期化処理時間に設定され
た従来の長いタイムアウト時間である。
The detailed operation of the reconfirmation process 420 outlined above will be described with reference to FIG. In the example of FIG. 12, the reconfirmation process 420 is described as a process activated by the instruction in S301 of FIG. The reconfirmation process 420 performs a reliable processor normal / abnormal judgment by a method similar to the conventional method. First, in S401, it is confirmed whether or not the initialization request has been retried the number of times specified by the system. If the retry has not been performed the specified number of times, the “reserved” processor pool management table 301 is referred to in S402, and the registered processor is re-executed by means such as unit reset or multicast communication with respect to the registered processor. Request an attempt. Next, in step S403, the process waits for a response indicating that the initialization process has been completed. If there is a response, the processor identifier of the processor that returned the completion notification in S404 is registered in the “normal” processor pool management table 300. The operations of S403 and S404 are repeated until the initialization processing timeout time is reached in S405. The initialization processing timeout time in S405 is different from the initialization processing timeout time 304 in the high-speed initialization processing 410 of the second embodiment, and is different from the conventional long initialization processing time set when the initialization processing is delayed most. This is the timeout period.

【0031】次にS406で初期化処理完了通知を返さ
ない未応答のプロセッサが存在するかを確認する。未応
答のプロセッサは、「留保」プロセッサプール管理表に
プロセッサ識別子が残っていることにより判別できる。
未応答のプロセッサが存在する場合はS401に戻り、
S402からの初期化処理再試行を行う。S406で未
応答のプロセッサが存在しない場合は、全てのプロセッ
サを正常と判断し、「正常」プロセッサグループへ移行
させたので、再確認処理420は完了である。S401
でシステムで規定した回数の初期化処理の試行を繰り返
した場合は、S407に移る。S407では、最終的に
初期化処理完了通知を返さなかったプロセッサ、つまり
まだ「留保」プロセッサプール管理表301に残ってい
る全てのプロセッサ識別子のプロセッサを「異常」プロ
セッサプール管理表302に移す。「異常」プロセッサ
プールのプロセッサは恒久的な異常と判断される。
Next, in step S406, it is checked whether there is a processor that has not returned the initialization processing completion notification and has not responded. A processor that has not responded can be determined by a processor identifier remaining in the “reserved” processor pool management table.
If there is a processor that has not responded, the process returns to S401,
The initialization process is retried from S402. If there is no unacknowledged processor in S406, all processors are determined to be normal, and the processor is shifted to the “normal” processor group, so that the reconfirmation process 420 is completed. S401
If the trial of the initialization process is repeated the number of times specified by the system in step S407, the process proceeds to step S407. In S 407, the processor that has not finally returned the initialization processing completion notification, that is, the processor of all the processor identifiers still remaining in the “reserved” processor pool management table 301 is moved to the “abnormal” processor pool management table 302. Processors in the "abnormal" processor pool are determined to be permanent.

【0032】こうして、システム運用と並行して動作す
る「留保」プロセッサプールを使い、従来と同様な初期
化処理の方法により再度正常/異常の判定を行う。これ
により、システム運用を妨げずにプロセッサの正常/異
常判定を行い、システム起動の遅延の発生を回避する。
また、正常と判定されたプロセッサは正常プロセッサプ
ールに加えることによりシステムの運用に参入し、正常
と判定できなかったプロセッサは「異常」プロセッサプ
ールに加えることにより恒久的な異常としてシステム運
用から切離す。
In this way, the normal / abnormal judgment is performed again by the initialization method similar to the conventional one, using the "reserved" processor pool that operates in parallel with the system operation. This makes it possible to determine whether the processor is normal or abnormal without interrupting the system operation, thereby avoiding a delay in system startup.
Processors that are determined to be normal enter the system operation by adding them to the normal processor pool, and processors that cannot be determined to be normal are separated from system operation as permanent abnormalities by being added to the "abnormal" processor pool. .

【0033】実施の形態3.本実施の形態では、実施の
形態1のシステムを運用中に実行プロセッサに異常が発
生した場合の異常対処処理を説明する。即ち、システム
の運用が妨げられないようにする。また、異常プロセッ
サの効果的な初期化再試行が行える方式を説明する。図
13は、本実施の形態における処理概念を示す図であ
る。マルチプロセッサシステムは、プロセッサ間通信に
より、要求プロセッサが実行プロセッサに処理要求を発
行することで、システムの種々の処理が並行して進めら
れるという形式にモデル化できる。図13では、600
が処理要求を発行する要求プロセッサ、601が要求に
基づき処理を実行する実行プロセッサである。従来の技
術では、発行した要求に対して実行プロセッサ601か
ら応答が返らない場合、タイムアウト時間として処理の
最悪実行時間を設定して待ち、さらに通信やプロセッサ
の異常を確認するために、要求プロセッサ600は要求
発行の再試行を実行する必要があった。この判定処理に
は長い時間が必要で、従って、実時間性が必要なシステ
ムでは、不具合が生じる危険性があった。本実施の形態
では、実行プロセッサ601から一定時間内に応答が返
らない場合は、要求の再試行は行わず、実行プロセッサ
601を「留保」プロセッサプール201に入れる。そ
して要求プロセッサは実行プロセッサの代替となる代替
実行プロセッサ602を選択し、それに対して改めて要
求を発行し、処理を継続する。こうして何度も再試行せ
ず、次のプロセッサを代替として処理を行う。一定時間
内に応答を返さなかった実行プロセッサ601の正常/
異常の確認は、実施の形態2で述べた仕組みを利用し
て、システムの運用と並行した「留保」プロセッサプー
ル内の処理として実行する。
Embodiment 3 In the present embodiment, a description will be given of an error handling process when an error occurs in an execution processor during operation of the system of the first embodiment. That is, the operation of the system is not hindered. In addition, a description will be given of a method in which the initialization of the abnormal processor can be effectively retried. FIG. 13 is a diagram illustrating a processing concept according to the present embodiment. A multiprocessor system can be modeled in a form in which a request processor issues a processing request to an execution processor by inter-processor communication, so that various processes of the system can proceed in parallel. In FIG. 13, 600
Is a request processor that issues a processing request, and 601 is an execution processor that executes processing based on the request. In the related art, when a response is not returned from the execution processor 601 to the issued request, the worst execution time of the process is set as a time-out period, the process waits, and further, the request processor 600 Needed to retry requesting. This determination process requires a long time, and therefore, in a system that requires real-time processing, there is a risk of causing a problem. In this embodiment, if no response is returned from the execution processor 601 within a certain time, the request is not retried, and the execution processor 601 is put into the “reserved” processor pool 201. Then, the request processor selects the alternative execution processor 602 as an alternative to the execution processor, issues a request to it again, and continues the processing. Thus, the processing is performed with the next processor as an alternative, without retrying many times. If the execution processor 601 has not returned a response within a predetermined time,
The abnormality check is executed as a process in the “reserved” processor pool in parallel with the operation of the system by using the mechanism described in the second embodiment.

【0034】上記の機能を持たせるため、要求プロセッ
サ600は、図14に示すプロセッサ間通信処理710
を持つ。プロセッサ間通信処理710の動作を図15を
用いて説明する。まず、S501で要求プロセッサ60
0は実行プロセッサ601に必要な処理要求を送信す
る。この後、従来と同様にS502で指定されたタイム
アウト時間まで、実行プロセッサからの受信確認を待
つ。S503でタイムアウト時間までに実行プロセッサ
から受信確認を受信できた場合は正常であり、従来と同
様に運用を継続する。S503で受信確認を受信できな
かった場合は、本実施の形態のプロセッサ間通信処理で
は新たに、S504で処理要求を発行した相手である実
行プロセッサ601の識別子を、システムマスタプロセ
ッサ100に非応答と通知する。これにより、システム
マスタプロセッサ100により非応答の実行プロセッサ
601に対する対応処理が行われる。要求プロセッサ6
00は、S504でシステムマスタプロセッサに対し非
応答プロセッサの通知を行った後、S505で直ちに
「正常」プロセッサプール内にある他のプロセッサを代
替実行プロセッサ602として選択し、これに対して再
度同じ処理要求を送信し、処理を継続する。
To provide the above functions, the request processor 600 performs the inter-processor communication processing 710 shown in FIG.
have. The operation of the inter-processor communication process 710 will be described with reference to FIG. First, in S501, the request processor 60
0 transmits a required processing request to the execution processor 601. Thereafter, as in the conventional case, a reception confirmation from the execution processor is waited until the timeout time designated in S502. If the reception confirmation has been received from the execution processor before the timeout period in S503, it is normal, and the operation is continued as in the related art. If the reception confirmation has not been received in S503, in the inter-processor communication process of the present embodiment, the identifier of the execution processor 601 that has issued the processing request in S504 is newly notified to the system master processor 100 as a non-response. Notice. As a result, the system master processor 100 performs a corresponding process for the non-responding execution processor 601. Request processor 6
00 notifies the system master processor of the non-responding processor in S504, immediately selects another processor in the “normal” processor pool as the alternative execution processor 602 in S505, and performs the same processing again for this. Submit the request and continue processing.

【0035】こうして、プロセッサ間通信で実行プロセ
ッサが応答を返さなかった場合の処理時間を短縮でき
る。本実施の形態では、実行プロセッサが応答を返さな
い場合、代替実行プロセッサに対して同じ処理要求を発
行する時間が必要となるが、従来のようにプロセッサ間
通信処理の中で実行プロセッサの正常/異常を判定する
複数回の再試行や、実行プロセッサの正常/異常判断は
行わないため、プロセッサに異常がある場合でも、予測
可能な時間内で処理が継続される。
Thus, the processing time when the execution processor does not return a response in the communication between the processors can be reduced. In the present embodiment, when the execution processor does not return a response, it takes time to issue the same processing request to the alternative execution processor. Since a plurality of retries for judging an abnormality and a judgment of normality / abnormality of the execution processor are not performed, even if there is an abnormality in the processor, the processing is continued within a predictable time.

【0036】システム運用中に非応答となり「保留」プ
ロセッサ対象となったものの対応処理を説明する。シス
テムマスタプロセッサ100は、図14に示す「留保」
プロセッサプール追加処理810を持つ。この「留保」
プロセッサプール追加処理810は、図16に概念を示
すように、処理要求に対して一定時間以内に応答を返さ
ない実行プロセッサの識別子を「正常」プロセッサプー
ル管理表300から「留保」プロセッサプール管理表3
01へ移すことにより、プロセッサをシステムの運用か
ら一時的に外すと供に、プロセッサの正常/異常の確認
処理を行えるようにする。
A description will now be given of a process for responding to a "non-responding" processor which is not responded during system operation. The system master processor 100 executes the “reserve” shown in FIG.
It has a processor pool addition process 810. This "reserve"
As shown in the concept of FIG. 16, the processor pool addition process 810 changes the identifier of an execution processor that does not return a response to a processing request within a predetermined time from the “normal” processor pool management table 300 to the “reserved” processor pool management table. 3
By moving to 01, the processor can be temporarily removed from the operation of the system, and the process of confirming the normality / abnormality of the processor can be performed.

【0037】「留保」プロセッサプール追加処理810
の動作を図17を用いて説明する。図17の例では、動
作は図15のS504により起動される処理として記述
している。まず、S601で、処理要求に対して一定時
間以内に応答を返さなかった実行プロセッサと判明した
実行プロセッサ601のプロセッサ識別子を「正常」プ
ロセッサプール管理表300から検索し外す。次にS6
02で実行プロセッサ601のプロセッサ識別子を「留
保」プロセッサプール管理表301に追加する。S60
1とS602により実行プロセッサ601は「正常」プ
ロセッサプールから「留保」プロセッサプールに移行し
たことになる。システムマスタプロセッサ100は「正
常」プロセッサプール管理表300を参照し、そこに登
録されているプロセッサのみをシステムの運用に使うの
で、これにより応答を返さなかった実行プロセッサ60
1はシステムの運用から外れることになる。次にS60
3で「留保」プロセッサプール・マスタエントリ500
を参照し、登録されている「留保」プロセッサプール・
マスタプロセッサ400に対し、「留保」プロセッサプ
ールにプロセッサが追加されたことを通知する。
"Reserve" Processor Pool Addition Processing 810
Will be described with reference to FIG. In the example of FIG. 17, the operation is described as the process activated in S504 of FIG. First, in step S601, the processor identifier of the execution processor 601 that has been determined to have not returned a response to the processing request within a predetermined time is retrieved from the "normal" processor pool management table 300 and removed. Next, S6
In step 02, the processor identifier of the execution processor 601 is added to the “reserved” processor pool management table 301. S60
By 1 and S602, the execution processor 601 has shifted from the "normal" processor pool to the "reserved" processor pool. The system master processor 100 refers to the "normal" processor pool management table 300 and uses only the processors registered therein for the operation of the system.
1 will be out of system operation. Next, S60
3 "Reserve" processor pool master entry 500
Refer to the “Reserved” processor pool
Notify master processor 400 that a processor has been added to the "reserved" processor pool.

【0038】こうして、異常の可能性のあるプロセッサ
を「正常」プロセッサプールから「留保」プロセッサプ
ールに移行させ、システム運用から切り離す。従って、
これら、異常の可能性のあるプロセッサに対して、正常
系のシステム運用とは別の処理を行うことができる。
In this way, the processor having a possibility of abnormality is transferred from the "normal" processor pool to the "reserved" processor pool, and is separated from the system operation. Therefore,
Processing different from those of the normal system operation can be performed on the processor having a possibility of abnormality.

【0039】次に、切り離した後の「留保」プロセッサ
の再認識動作を説明する。「留保」プロセッサプール・
マスタプロセッサ400は、図14に示すように、運用
時再確認処理910を持つ。運用時再確認処理910
は、システム初期化時の「留保」プロセッサに対する再
確認処理420に対応した、運用中の再確認処理であ
る。運用時再確認処理910では、「留保」プロセッサ
プール内のプロセッサの復旧処理と正常/異常判定処理
を行う。
Next, the re-recognition operation of the "reserve" processor after disconnection will be described. "Reserve" processor pool
The master processor 400 has an operation reconfirmation process 910 as shown in FIG. Operation reconfirmation process 910
Is a re-confirmation process in operation corresponding to the re-confirmation process 420 for the "reserved" processor at the time of system initialization. In the operation reconfirmation process 910, a recovery process and a normal / abnormal judgment process for the processors in the “reserved” processor pool are performed.

【0040】運用時再確認処理910の動作を図18を
用いて説明する。図18の例では、本動作は図17のS
603により起動される処理として記述している。この
処理ではまず、「留保」プロセッサプール・マスタプロ
セッサが「留保」プロセッサプール内のプロセッサに対
してダミーの処理要求の発行を再試行して、そのプロセ
ッサが正常/異常の判定を行う。まず、S701でダミ
ー処理要求発行の再試行を指定回数行ったかを確認す
る。再試行が指定回数に達していない場合は、S702
で「留保」プロセッサプール管理表301を参照し、登
録されているプロセッサに対しダミー処理要求送信を行
う。要求した処理が実行できるか確認することにより、
プロセッサの正常/異常の判定を行うためである。S7
02ではシステムで指定された時間をタイムアウト時間
として、要求受信確認の応答を待つ。S703でプロセ
ッサからの要求受信確認を受信した場合は、該プロセッ
サは正常であると判断し、S704で再びそのプロセッ
サのプロセッサ識別子を「留保」プロセッサプール管理
表301から外し、「正常」プロセッサプール管理表3
00に登録して、システム運用に参入させる。S703
で応答が返らない場合は、S701に戻り処理要求発行
の再試行を行う。S701で指定回数再試行を繰り返し
た場合は、そのプロセッサに何らかの異常があると判定
し、S705でプロセッサを単体リセットし、プロセッ
サを初期状態に戻す。この後S706で図12の処理を
実行して、初期化処理の再試行を行って、プロセッサが
恒久的異常であるか判定する。初期化処理再試行によ
り、正常が確認された場合は「正常」プロセッサプール
に再参入させる。最終的に正常が確認できなかった場合
は、「異常」プロセッサプールに入れ、システム運用か
ら切離す。
The operation of the operation reconfirmation process 910 will be described with reference to FIG. In the example of FIG. 18, this operation is performed in S of FIG.
603 is described as the processing started. In this process, first, the “reserved” processor pool / master processor re-attempts to issue a dummy processing request to a processor in the “reserved” processor pool, and the processor determines whether it is normal or abnormal. First, in S701, it is confirmed whether the retry of issuing the dummy processing request has been performed a specified number of times. If the number of retries has not reached the specified number, S702
Then, referring to the "reserved" processor pool management table 301, a dummy processing request is transmitted to the registered processors. By confirming that the requested operation can be performed,
This is to determine whether the processor is normal or abnormal. S7
In 02, a time specified by the system is set as a timeout time, and a response to a request reception confirmation is waited. If a request acknowledgment from the processor is received in S703, it is determined that the processor is normal, and in S704, the processor identifier of the processor is removed from the "reserved" processor pool management table 301 again, and the "normal" processor pool management is performed. Table 3
00 to register for system operation. S703
If no response is returned in step S701, the process returns to step S701 to retry issuing the processing request. If the retry has been repeated a specified number of times in S701, it is determined that the processor has some abnormality, and the processor is reset alone in S705 to return the processor to the initial state. Thereafter, in S706, the processing of FIG. 12 is executed, and the initialization processing is retried to determine whether the processor is permanently abnormal. If normality is confirmed by retrying the initialization processing, the processor re-enters the "normal" processor pool. If normality cannot be finally confirmed, place it in the "abnormal" processor pool and disconnect from system operation.

【0041】こうして、システム運用中に検出した異常
の可能性のあるプロセッサに対して、システムから切離
して処理要求の再試行や単体リセットを行って、プロセ
ッサが恒久的異常であるかの判定が行える。従って、シ
ステムのリアルタイム性遅延の発生を回避できる。
In this manner, the processor which has a possibility of abnormality detected during the operation of the system is disconnected from the system, and the processing request is retried or reset alone, so that it can be determined whether the processor has a permanent abnormality. . Therefore, it is possible to avoid a real-time delay of the system.

【0042】実施の形態4.本実施の形態では、「正
常」プロセッサ数が十分ない場合の対処について説明す
る。以下、本実施の形態のマルチプロセッサシステムの
初期化処理方法では、図19に示すように、システムマ
スタプロセッサ100に、「正常」プロセッサプール最
低プロセッサ数700と、「正常」プロセッサプール・
プロセッサ数確認処理1010を持たせる。即ち、「正
常」プロセッサプールにシステムの運用に必要なプロセ
ッサ数が足りなくなったという状態を検出できるように
する。
Embodiment 4 In the present embodiment, a countermeasure in a case where the number of “normal” processors is insufficient will be described. Hereinafter, in the initialization processing method for the multiprocessor system according to the present embodiment, as shown in FIG. 19, the system master processor 100 includes the “normal” processor pool minimum processor number 700 and the “normal” processor pool
A processor number confirmation process 1010 is provided. That is, it is possible to detect a state in which the number of processors required for system operation is insufficient in the “normal” processor pool.

【0043】次に、この「正常」プロセッサプール・プ
ロセッサ数確認処理1010の動作を図20を用いて説
明する。「正常」プロセッサプール・プロセッサ数確認
処理1010は、図9の処理、または図17の処理の後
に起動すべき処理である。まず、S801で「正常」プ
ロセッサプール管理表300に登録されているプロセッ
サ数をカウントする。この数をS802で「正常」プロ
セッサプール最低プロセッサ数700と比較する。「正
常」プロセッサプール最低プロセッサ数700以上のプ
ロセッサが「正常」プロセッサプール管理表300に登
録されている場合は、S803でシステム運用を継続
し、「正常」プロセッサプール・プロセッサ数確認処理
1010を完了する。「正常」プロセッサプール最低プ
ロセッサ数700よりも「正常」プロセッサプール管理
表300に登録されているプロセッサが少ない場合は、
S804でシステムが異常状態と判断し、定義されたシ
ステム異常処理を実行する。システム異常処理として
は、メッセージの出力、システム停止などが想定され
る。
Next, the operation of the "normal" processor pool / processor number confirmation processing 1010 will be described with reference to FIG. The “normal” processor pool / processor number confirmation processing 1010 is processing to be started after the processing in FIG. 9 or the processing in FIG. First, in S801, the number of processors registered in the “normal” processor pool management table 300 is counted. This number is compared with the "normal" processor pool minimum processor number 700 in S802. If the processor having the minimum number of “normal” processor pools of 700 or more is registered in the “normal” processor pool management table 300, the system operation is continued in S803, and the “normal” processor pool / processor number confirmation processing 1010 is completed. I do. If the number of processors registered in the “normal” processor pool management table 300 is smaller than the “normal” processor pool minimum processor number 700,
In S804, the system is determined to be in an abnormal state, and the defined system abnormal processing is executed. As the system abnormality processing, output of a message, system stop, and the like are assumed.

【0044】こうして、「正常」プロセッサプールに登
録されたプロセッサをカウントし、システム運用に最低
限必要なプロセッサ数がに不足の場合は、縮退運用など
を指示して、異常対処を行うことができる。
In this way, the number of processors registered in the "normal" processor pool is counted, and if the minimum number of processors required for system operation is insufficient, a degraded operation or the like is instructed to deal with abnormalities. .

【0045】次にシステム運用中の縮退運用を回避する
対応方法を説明する。このために図21に示すように、
システムマスタプロセッサ100には、「留保」プロセ
ッサプール・マスタプロセッサ交換処理1110を持
つ。
Next, a method for avoiding the degenerate operation during the system operation will be described. For this purpose, as shown in FIG.
The system master processor 100 has a “reserved” processor pool / master processor exchange process 1110.

【0046】「留保」プロセッサプール・マスタプロセ
ッサ交換処理1110の動作を図22を利用して説明す
る。「留保」プロセッサプール・マスタプロセッサ交換
処理1110は、システムマスタプロセッサ100がシ
ステム運用中に一定の時間周期で起動する処理である。
まず、S901で「正常」プロセッサプール管理表30
0から何らかのアルゴリズムによりプロセッサを一つ選
定する。この選定の方法は、システムの要求仕様に合わ
せて、管理表内のシステムマスタプロセッサ、「留保」
プロセッサプール・マスタプロセッサのどちらでもない
最初のプロセッサを選ぶ方法や、特定のプロセッサ識別
子を持つプロセッサを選択する方法など種々の方法があ
りえる。次にS902で「留保」プロセッサプール・マ
スタエントリ500に登録されているプロセッサを「正
常」プロセッサプール管理表300に登録し、そのプロ
セッサを「留保」プロセッサプール・マスタプロセッサ
の役割から外し、システム運用の通常処理に参入させ
る。次にS903でS901で選定したプロセッサを
「留保」プロセッサプール・マスタエントリ500に登
録し、新たな「留保」プロセッサプール・マスタプロセ
ッサとする。こうして、今後の「留保」プロセッサプー
ルの管理処理は、ここで新たに登録したプロセッサが行
うことになる。この「留保」プロセッサプール・マスタ
プロセッサ交換処理1110を定期的に実行することに
より、「留保」プロセッサプール・マスタプロセッサ4
00に異常があった場合でも、定期的なマスタプロセッ
サの交換により、次の周期で復旧し、本発明で述べた処
理を行うことができるようになる。従って、システムを
恒久的な異常状態に陥らせない。また、「留保」プロセ
ッサプール・マスタプロセッサ400を、異常に気づか
ずにS902で「正常」プロセッサプールに参入させた
場合でも、実施の形態3で述べた動作により、異常の可
能性があるプロセッサとして「留保」プロセッサプール
に移され、復旧処理を行わせることができる。
The operation of the "reserve" processor pool / master processor exchange processing 1110 will be described with reference to FIG. The “reserved” processor pool / master processor exchange process 1110 is a process in which the system master processor 100 starts up at a fixed time period during system operation.
First, in S901, the “normal” processor pool management table 30
One processor is selected from 0 by some algorithm. This selection method is based on the system master processor in the management table, "Reserve"
There can be various methods, such as a method of selecting the first processor that is neither the processor pool master processor nor a method of selecting a processor having a specific processor identifier. Next, in step S902, the processor registered in the "reserved" processor pool master entry 500 is registered in the "normal" processor pool management table 300, and the processor is removed from the role of the "reserved" processor pool master processor. Let's get into normal processing. Next, in S903, the processor selected in S901 is registered in the “reserved” processor pool master entry 500, and is set as a new “reserved” processor pool master processor. Thus, the management process of the “reserved” processor pool in the future is performed by the processor newly registered here. By periodically executing the “reserved” processor pool / master processor exchange processing 1110, the “reserved” processor pool / master processor 4
Even if there is an abnormality in 00, it is restored in the next cycle by periodic replacement of the master processor, and the processing described in the present invention can be performed. Therefore, the system does not fall into a permanent abnormal state. In addition, even if the “reserved” processor pool / master processor 400 enters the “normal” processor pool in S902 without noticing the abnormality, the operation described in the third embodiment may be regarded as a processor having a possibility of abnormality. It is moved to the "reserved" processor pool and can be restored.

【0047】[0047]

【発明の効果】以上のようにこの発明によれば、システ
ム初期化指令を行って所定時間後に応答を確認して正常
プロセッサと判定するステップと、応答があった正常プ
ロセッサによりシステム運用を開始するステップと、所
定時間内に応答がないプロセッサを留保プロセッサとし
て、この留保プロセッサをシステム運用と並行して確認
処理をするステップ、とを備えたので、システム立ち上
げの効率化が図れる効果がある。
As described above, according to the present invention, a step of issuing a system initialization command, confirming a response after a predetermined time, and determining that the processor is a normal processor, and starting the system operation by the normal processor that has responded. Since there is a step and a step in which a processor that does not respond within a predetermined time is set as a reservation processor and the reservation processor performs a confirmation process in parallel with the system operation, there is an effect that the efficiency of system startup can be improved.

【0048】また更に、留保プロセッサの確認処理を、
正常プロセッサの1つが行うようにしたので、早期シス
テムの立ち上げとシステム運用には支障無くすることが
できる効果がある。
Further, the confirmation processing of the reservation processor is
Since one of the normal processors performs the operation, there is an effect that the start-up of the system and the operation of the system can be performed without any trouble.

【0049】また更に、留保プロセッサの確認処理とし
て、再初期化指令を行うようにしたので、異常プロセッ
サを確定して交換対象を容易に特定できる効果がある。
Further, since the re-initialization command is issued as the confirmation processing of the reservation processor, there is an effect that the abnormal processor is determined and the replacement target can be easily specified.

【図面の簡単な説明】[Brief description of the drawings]

【図1】 この発明の実施の形態1におけるマルチプロ
セッサシステムにおける初期化方法を説明するためのシ
ステム構成を示す図である。
FIG. 1 is a diagram showing a system configuration for describing an initialization method in a multiprocessor system according to a first embodiment of the present invention.

【図2】 実施の形態1における正常完了動作を説明す
るシステム図である。
FIG. 2 is a system diagram illustrating a normal completion operation according to the first embodiment.

【図3】 実施の形態1における動作を説明するための
グループ図である。
FIG. 3 is a group diagram for describing an operation in the first embodiment.

【図4】 実施の形態1におけるマスタプロセッサが持
つ構成機能を示す図である。
FIG. 4 is a diagram showing configuration functions of a master processor according to the first embodiment.

【図5】 実施の形態1における初期化動作を示すフロ
ー図である。
FIG. 5 is a flowchart showing an initialization operation in the first embodiment.

【図6】 この発明の実施の形態2におけるプロセッサ
グループの区分を説明する図である。
FIG. 6 is a diagram illustrating a division of a processor group according to a second embodiment of the present invention.

【図7】 実施の形態2におけるマスタプロセッサが持
つ構成機能を示す図である。
FIG. 7 is a diagram showing a configuration function of a master processor according to a second embodiment.

【図8】 実施の形態2におけるプロセッサプール・マ
スタ選定処理の動作を示すフロー図である。
FIG. 8 is a flowchart showing an operation of a processor pool / master selection process according to the second embodiment.

【図9】 実施の形態2における平行起動処理の動作を
示すフロー図である。
FIG. 9 is a flowchart showing an operation of a parallel activation process according to the second embodiment.

【図10】 実施の形態2におけるマスタプロセッサが
持つ他の構成機能を示す図である。
FIG. 10 is a diagram showing another configuration function of the master processor according to the second embodiment.

【図11】 実施の形態2におけるマスタプロセッサが
行う動作を示す概念図である。
FIG. 11 is a conceptual diagram showing an operation performed by a master processor according to the second embodiment.

【図12】 実施の形態2における再確認処理の動作を
示すフロー図である。
FIG. 12 is a flowchart showing an operation of a reconfirmation process according to the second embodiment.

【図13】 この発明の実施の形態3におけるシステム
運用時に起こる異常に対する処理概念を示す図である。
FIG. 13 is a diagram showing a concept of processing for an abnormality that occurs during system operation according to Embodiment 3 of the present invention.

【図14】 この発明における他の各種処理機能を示す
図である。
FIG. 14 is a diagram showing other various processing functions in the present invention.

【図15】 実施の形態3におけるプロセッサ間処理の
動作を示すフロー図である。
FIG. 15 is a flowchart showing an operation of processing between processors in the third embodiment.

【図16】 実施の形態3におけるマスタプロセッサが
持つ他の構成機能を示す概念図である。
FIG. 16 is a conceptual diagram showing another configuration function of the master processor according to the third embodiment.

【図17】 実施の形態3におけるプロセッサプール追
加処理の動作を示すフロー図である。
FIG. 17 is a flowchart showing an operation of a processor pool addition process according to the third embodiment.

【図18】 この発明の実施の形態3におけるシステム
運用時に起こる異常に対する処理概念を示す図である。
FIG. 18 is a diagram showing a concept of processing for an abnormality that occurs during system operation according to Embodiment 3 of the present invention.

【図19】 この発明の実施の形態4におけるシステム
運用時のプロセッサ追加のためにシステムマスタプロセ
ッサが持つ構成機能を示す図である。
FIG. 19 is a diagram showing a configuration function of a system master processor for adding a processor during system operation according to a fourth embodiment of the present invention.

【図20】 実施の形態4におけるプロセッサ数確認処
理の動作フロー図である。
FIG. 20 is an operation flowchart of a processor number confirmation process according to the fourth embodiment;

【図21】 実施の形態4における留保交換または補充
の概念を説明する図である。
FIG. 21 is a diagram illustrating the concept of reserved exchange or replenishment in the fourth embodiment.

【図22】 実施の形態4におけるプロセッサ交換処理
の動作フロー図である。
FIG. 22 is an operation flowchart of a processor replacement process in the fourth embodiment.

【図23】 従来のマルチプロセッサシステムの初期化
方法を説明する図である。
FIG. 23 is a diagram for explaining a conventional multiprocessor system initialization method.

【符号の説明】[Explanation of symbols]

S101 起動指示ステップ、S102 初期化完了通
知確認ステップ、S104 タイムアウト確認ステッ
プ、S105 留保プロセッサ登録ステップ、S201
プロセッサ選定ステップ、S301 再確認処理指示
ステップ、S302 システム運用開始ステップ、S4
01 再確認処理開始ステップ、S402再初期化指示
ステップ、S403 再初期化完了通知確認ステップ、
S404正常プロセッサへ戻すステップ、S405 タ
イムアウト確認ステップ、S407 異常プロセッサ登
録ステップ、S501 処理要求送信ステップ、S50
2 タイムアウトまでの確認ステップ、S503 受信
確認ステップ、S504代替プロセッサ選択ステップ、
S602留保プロセッサ登録ステップ、S701 再認
識処理開始ステップ、S702 ダミー要求通信タイム
アウトまでの確認ステップ、S703 受信確認ステッ
プ、S704 正常プロセッサへ戻すステップ、S80
1 正常プロセッサ数カウントステップ、S802 所
要数との比較ステップ、S803 異常通知ステップ、
S902 留保プロセッサからの選択ステップ。
S101 activation instruction step, S102 initialization completion notification confirmation step, S104 timeout confirmation step, S105 reserved processor registration step, S201
Processor selection step, S301 reconfirmation processing instruction step, S302 system operation start step, S4
01 reconfirmation processing start step, S402 reinitialization instruction step, S403 reinitialization completion notification confirmation step,
S404 Step of returning to normal processor, S405 Timeout check step, S407 Abnormal processor registration step, S501 Processing request transmission step, S50
2 a confirmation step until timeout, S503 reception confirmation step, S504 alternative processor selection step,
S602 reserved processor registration step, S701 re-recognition processing start step, S702 confirmation step until dummy request communication timeout, S703 reception confirmation step, S704 step of returning to normal processor, S80
1 normal processor number counting step, S802 comparison step with required number, S803 abnormality notification step,
S902 Selection step from reservation processor.

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G06F 11/22 360 G06F 11/30 310H 11/30 310 1/00 350A Fターム(参考) 5B034 BB11 CC01 DD03 DD05 5B042 GA11 GC10 JJ23 JJ36 KK02 KK04 KK05 LA20 LA21 5B045 HH06 JJ05 5B048 AA17 CC13 5B054 AA20 CC06 ──────────────────────────────────────────────────続 き Continued on the front page (51) Int.Cl. 7 Identification symbol FI Theme coat ゛ (Reference) G06F 11/22 360 G06F 11/30 310H 11/30 310 1/00 350A F-term (Reference) 5B034 BB11 CC01 DD03 DD05 5B042 GA11 GC10 JJ23 JJ36 KK02 KK04 KK05 LA20 LA21 5B045 HH06 JJ05 5B048 AA17 CC13 5B054 AA20 CC06

Claims (8)

【特許請求の範囲】[Claims] 【請求項1】 情報処理を行うマルチプロセッサシステ
ムにおいて、 システム初期化指令を行って、所定時間後に応答を確認
して正常プロセッサと判定するステップと、 上記応答があった正常プロセッサによりシステム運用を
開始するステップと、 上記所定時間内に応答がないプロセッサを留保プロセッ
サとして、該留保プロセッサを上記システム運用と並行
して確認処理をするステップ、とを備えたことを特徴と
するマルチプロセッサ初期化/並行診断方法。
In a multiprocessor system for performing information processing, a step of performing a system initialization command, confirming a response after a predetermined time and determining that the processor is a normal processor, and starting a system operation by the normal processor having received the response Performing a confirmation process in parallel with the operation of the system using the processor that has not responded within the predetermined time as a reserved processor. Diagnostic method.
【請求項2】 留保プロセッサの確認処理を、正常プロ
セッサの1つが行うようにしたことを特徴とする請求項
1記載のマルチプロセッサ初期化/並行診断方法。
2. The multiprocessor initialization / parallel diagnosis method according to claim 1, wherein one of the normal processors performs the check processing of the reservation processor.
【請求項3】 システム運用時、設定時間内に通信が確
認できない場合は、システムから切り離して正常プロセ
ッサを代替させ、かつ上記時間内に確認できないプロセ
ッサを留保プロセッサに移すようにしたことを特徴とす
る請求項1記載のマルチプロセッサ初期化/並行診断方
法。
3. When a communication cannot be confirmed within a set time during system operation, the system is disconnected from the system to replace a normal processor, and a processor that cannot be confirmed within the above time is transferred to a reserved processor. 2. The multiprocessor initialization / parallel diagnosis method according to claim 1, wherein:
【請求項4】 留保プロセッサの確認処理として、初期
化指令を行い、再度所定時間内に応答がない場合は、異
常プロセッサとして分離するようにしたことを特徴とす
る請求項1または請求項3記載のマルチプロセッサ初期
化/並行診断方法。
4. The processor according to claim 1, wherein an initialization command is issued as confirmation processing of the reservation processor, and if there is no response within a predetermined time, the processor is separated as an abnormal processor. Multiprocessor initialization / parallel diagnostic method.
【請求項5】 留保プロセッサの確認処理として、初期
化指令を行い、所定時間内に応答があれば、正常プロセ
ッサとして戻すようにしたことを特徴とする請求項1ま
たは請求項3記載のマルチプロセッサ初期化/並行診断
方法。
5. The multiprocessor according to claim 1, wherein an initialization command is issued as confirmation processing of the reservation processor, and if there is a response within a predetermined time, the processor is returned as a normal processor. Initialization / parallel diagnostic method.
【請求項6】 システム運用時に時間内通信が確認でき
ずに留保プロセッサとなった場合は、留保プロセッサの
確認処理として所定の処理要求を実行させて、所定時間
内に応答が無ければ、異常プロセッサとして分離するよ
うにしたことを特徴とする請求項3記載のマルチプロセ
ッサ初期化/並行診断方法。
6. When a reserved processor is detected without confirming in-time communication during system operation, a predetermined processing request is executed as confirmation processing of the reserved processor, and if there is no response within a predetermined time, an abnormal processor is executed. 4. The multiprocessor initialization / parallel diagnosis method according to claim 3, wherein the method is separated.
【請求項7】 システム運用時に時間内通信が確認でき
ずに留保プロセッサとなった場合は、留保プロセッサの
確認処理として所定の処理要求を実行させて、所定時間
内に応答があれば、正常プロセッサとして戻すようにし
たことを特徴とする請求項3記載のマルチプロセッサ初
期化/並行診断方法。
7. When a reserved processor is determined without confirming in-time communication during system operation, a predetermined processing request is executed as confirmation processing of the reserved processor, and if there is a response within a predetermined time, a normal processor is executed. 4. The multi-processor initialization / parallel diagnosis method according to claim 3, wherein the method is returned as:
【請求項8】 正常プロセッサ数を監視する機構を設け
て、システムが要求するプロセッサ数と比較するステッ
プと、 上記比較の結果、システム運用に支障があると判定され
る場合は、該判定結果を出力するようにしたことを特徴
とする請求項1記載のマルチプロセッサ初期化/並行診
断方法。
8. A step of providing a mechanism for monitoring the number of normal processors, and comparing the number with the number of processors required by the system. If the result of the comparison indicates that there is a problem in system operation, the result of the determination is determined. 2. The multiprocessor initialization / parallel diagnosis method according to claim 1, wherein the multiprocessor initialization / output is performed.
JP2001113419A 2001-04-12 2001-04-12 Multiprocessor initialization / concurrent diagnosis method Expired - Fee Related JP3688217B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001113419A JP3688217B2 (en) 2001-04-12 2001-04-12 Multiprocessor initialization / concurrent diagnosis method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001113419A JP3688217B2 (en) 2001-04-12 2001-04-12 Multiprocessor initialization / concurrent diagnosis method

Publications (2)

Publication Number Publication Date
JP2002312333A true JP2002312333A (en) 2002-10-25
JP3688217B2 JP3688217B2 (en) 2005-08-24

Family

ID=18964641

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001113419A Expired - Fee Related JP3688217B2 (en) 2001-04-12 2001-04-12 Multiprocessor initialization / concurrent diagnosis method

Country Status (1)

Country Link
JP (1) JP3688217B2 (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006001051A1 (en) * 2004-06-24 2006-01-05 Fujitsu Limited Multi-processor system and control method therefor
JP2010170355A (en) * 2009-01-23 2010-08-05 Nec Computertechno Ltd Computer system and method of reintegrating cpu
JP2013196300A (en) * 2012-03-19 2013-09-30 Fujitsu Ltd Test method, test device and program
JP2017004329A (en) * 2015-06-12 2017-01-05 株式会社東芝 Processing device, dsp substrate, and operation error cause determination method

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006001051A1 (en) * 2004-06-24 2006-01-05 Fujitsu Limited Multi-processor system and control method therefor
JP2010170355A (en) * 2009-01-23 2010-08-05 Nec Computertechno Ltd Computer system and method of reintegrating cpu
JP2013196300A (en) * 2012-03-19 2013-09-30 Fujitsu Ltd Test method, test device and program
JP2017004329A (en) * 2015-06-12 2017-01-05 株式会社東芝 Processing device, dsp substrate, and operation error cause determination method

Also Published As

Publication number Publication date
JP3688217B2 (en) 2005-08-24

Similar Documents

Publication Publication Date Title
KR100238926B1 (en) Method and apparatus for recovering from faults in distributed memory type multiprocessor computing system
US7076689B2 (en) Use of unique XID range among multiple control processors
JP2537054B2 (en) Information transmission method
US7065673B2 (en) Staged startup after failover or reboot
WO2006114822A1 (en) Dma controller, node, data transfer control method, and program
JP2006072591A (en) Virtual computer control method
JP3537281B2 (en) Shared disk type multiplex system
JP5013324B2 (en) Computer apparatus and BIOS update method thereof
JPH086910A (en) Cluster type computer system
US20110238959A1 (en) Distributed controller, distributed processing system, and distributed processing method
JP2006178659A (en) Fault tolerant computer system and interrupt control method therefor
JPH08305592A (en) Multiprocessor system
JP2001022599A (en) Fault tolerant system, fault tolerant processing method and recording medium for fault tolerant control program
JP2002312333A (en) Multiprocessor initializing/parallel diagnosing method
CN108984602B (en) Database control method and database system
JP3891994B2 (en) System and method for draining an in-order queue
US5737509A (en) Method and apparatus for restoring data coherency in a duplex shared memory subsystem
US7243257B2 (en) Computer system for preventing inter-node fault propagation
US10909002B2 (en) Fault tolerance method and system for virtual machine group
JP2001027951A (en) File loading device for information processing system of multiprocessor configuration and recording medium
JP6540309B2 (en) Shared memory system, arithmetic processing unit and method
JP2004013723A (en) Device and method for fault recovery of information processing system adopted cluster configuration using shared memory
US11853175B2 (en) Cluster system and restoration method that performs failover control
JP2005208972A (en) Computer device and system
JP2001022712A (en) Initial setting system of information processor

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20040518

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040702

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20041019

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050329

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050428

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050607

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050607

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080617

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090617

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100617

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100617

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110617

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120617

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130617

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees