JP2630100B2 - Fault handling method for interprocessor communication bus - Google Patents

Fault handling method for interprocessor communication bus

Info

Publication number
JP2630100B2
JP2630100B2 JP3078110A JP7811091A JP2630100B2 JP 2630100 B2 JP2630100 B2 JP 2630100B2 JP 3078110 A JP3078110 A JP 3078110A JP 7811091 A JP7811091 A JP 7811091A JP 2630100 B2 JP2630100 B2 JP 2630100B2
Authority
JP
Japan
Prior art keywords
processor
processors
bus
communication bus
failure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP3078110A
Other languages
Japanese (ja)
Other versions
JPH04312043A (en
Inventor
隆文 今
昌浩 向野
淳一 山下
久美 水上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP3078110A priority Critical patent/JP2630100B2/en
Publication of JPH04312043A publication Critical patent/JPH04312043A/en
Application granted granted Critical
Publication of JP2630100B2 publication Critical patent/JP2630100B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Hardware Redundancy (AREA)
  • Multi Processors (AREA)
  • Small-Scale Networks (AREA)

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【産業上の利用分野】本発明はバス方式で接続された複
数のプロセッサを有するマルチプロセッサ方式の交換機
におけるプロセッサ間通信用バスの障害処理方式に関す
る。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a fault handling system for an interprocessor communication bus in a multiprocessor type switch having a plurality of processors connected by a bus system.

【0002】[0002]

【従来の技術】従来、この種のプロセッサ間通信用バス
の障害処理方式では、構成要素である複数のプロセッサ
又はバスケーブル及びプロセッサ間通信バスを制御する
バス制御装置のすべてに対し診断を実施しなければ、障
害装置を特定できない。
2. Description of the Related Art Conventionally, in this type of fault handling system for an inter-processor communication bus, diagnosis is performed for all of a plurality of processors or bus cables which are constituent elements and a bus control device for controlling the inter-processor communication bus. Otherwise, the faulty device cannot be identified.

【0003】しかし、診断実行中は二重化されたプロセ
ッサが一重化となる為、すべてのプロセッサの診断を実
施すると診断処理時間が長くかかりシステムの安全率が
低下することから、たとえバス式に接続されたプロセッ
サが原因であっても、障害発生したプロセッサ又は、バ
ス自体を切り離す方式が一般的になっている。
However, since the duplicated processors are unified during the execution of the diagnosis, if the diagnosis of all the processors is executed, the diagnosis processing time is long and the safety factor of the system is reduced. Even if the cause is a failed processor, it is common to disconnect the failed processor or the bus itself.

【0004】[0004]

【発明が解決しようとする課題】上述したように従来の
プロセッサ間通信用バスの障害処理方式では、構成要素
であるバス式に接続されたプロセッサ又はバスケーブル
及びバス制御装置のどれが障害で有っても、障害を検出
した装置を切り離している為、原因を特定する為には保
守員の介在を必要とする欠点が有る。
As described above, in the conventional fault handling method for the inter-processor communication bus, any of the constituent processors or bus cables connected to the bus system and the bus controller has a fault. Even so, there is a drawback that since the device that has detected the failure is disconnected, maintenance personnel are required to identify the cause.

【0005】又、プロセッサの障害であっても、バス制
御装置で障害を検出すれば、通信バスを切り離すという
欠点が有る。
[0005] In addition, even if a failure occurs in the processor, if the failure is detected by the bus control device, the communication bus is disconnected.

【0006】[0006]

【課題を解決するための手段】本発明のプロセッサ間通
信用バスの障害処理方式は、バス方式で接続された複数
のプロセッサを有するマルチプロセッサシステムにおい
て、プロセッサ間を接続している通信バスで障害が発生
したとき、この障害発生時に情報を転送していたプロセ
ッサ相互及び前記バス方式の両端に接続されているプロ
セッサを診断対象プロセッサとして設定し、各プロセッ
サの自動診断を順次行い原因を探索し、前記診断対象プ
ロセッサの中で障害と判定されたプロセッサだけを自動
でシステムの系構成から切り離す構成である。
According to the present invention, there is provided a multiprocessor system having a plurality of processors connected by a bus system. Occurs, the processors that have transferred information at the time of occurrence of this failure and the processors connected to both ends of the bus system are set as the processors to be diagnosed, and automatic diagnosis of each processor is sequentially performed to search for the cause, In this configuration, only the processor determined as a failure among the processors to be diagnosed is automatically separated from the system configuration of the system.

【0007】[0007]

【実施例】次に本発明について図面を参照して説明す
る。
DESCRIPTION OF THE PREFERRED EMBODIMENTS Next, the present invention will be described with reference to the drawings.

【0008】図1は本発明の一実施例の障害処理におけ
るプログラムの流れを示す図であり、図2は本発明の一
実施例を説明するための交換システムの構成例を示す図
である。図2において、二重化された各プロセッサ1〜
8(ここでは、プロセッサ8台のマルチシステムとす
る)は、二重化された通信バス9,10によりバス式に
接続されバス制御装置11,12により制御されてい
る。以下に例として、プロセッサ3がプロセッサ5に通
信を実施する場合について説明する。
FIG. 1 is a diagram showing the flow of a program in the failure processing according to one embodiment of the present invention, and FIG. 2 is a diagram showing an example of the configuration of an exchange system for explaining one embodiment of the present invention. In FIG. 2, each of the duplicated processors 1 to 1
8 (here, a multi-system with eight processors) is connected in a bus manner by redundant communication buses 9 and 10 and is controlled by bus controllers 11 and 12. Hereinafter, a case where the processor 3 performs communication with the processor 5 will be described as an example.

【0009】プロセッサ3は、通信バス9に対してプロ
セッサ間通信要求を行う。バス制御装置11,12は、
プロセッサ3が通信要求していることを知り、他のプロ
セッサに対して待ち合わせを指示した後、プロセッサ3
に転送指示する。プロセッサ3は通信バス9に相手プロ
セッサ5のアドレス信号を設定して転送を実施する。相
手プロセッサ5は、転送情報を受け取り正常終了を送信
元プロセッサ3に報告する。送信元プロセッサ3は、報
告を受け取ったことにより通信処理を終了する。バス制
御装置11,12は、プロセッサ3の転送終了を待って
他のプロセッサに待ち合わせ解除を指示する。
The processor 3 issues an inter-processor communication request to the communication bus 9. The bus control devices 11 and 12
After knowing that the processor 3 is making a communication request and instructing another processor to wait, the processor 3
To the transfer. The processor 3 sets the address signal of the partner processor 5 on the communication bus 9 and executes the transfer. The partner processor 5 receives the transfer information and reports normal termination to the transmission source processor 3. The transmission source processor 3 ends the communication processing upon receiving the report. The bus controllers 11 and 12 instruct the other processors to cancel the wait after the transfer of the processor 3 is completed.

【0010】図3はプロセッサ3及びプロセッサ5を図
1より抜き出し詳細を示した図である。図2で説明した
各プロセッサ及びバス制御装置は、図3のように0系及
び1系の二重化構成により制御されている。又、各プロ
セッサは、送信及び受信回路によりバスの通信制御をし
ている。以下に図1〜図6を使用して障害処理について
説明するが、この時、バス制御装置及びプロセッサすべ
てで0系が使用されていたと仮定する。従って、1系側
はすべて二重化構成のスタンバイである。
FIG. 3 is a diagram showing details of the processor 3 and the processor 5 extracted from FIG. Each processor and the bus control device described in FIG. 2 are controlled by a redundant configuration of the 0 system and the 1 system as shown in FIG. Further, each processor controls communication of the bus by a transmission and reception circuit. The failure processing will be described below with reference to FIGS. 1 to 6. At this time, it is assumed that the system 0 is used in all the bus control devices and processors. Therefore, all of the first systems are standbys in a duplex configuration.

【0011】図2で説明した処理中に相手側のプロセッ
サ5の送信及び受信回路5fが原因により送信側のプロ
セッサ3で通信障害が検出されると、障害処理プログラ
ムが起動され、図4で示すように送信側のプロセッサ3
の0系をシステムから切り離し、1系にて通信処理を再
開する(ステップ1;S1)。この場合、相手側のプロ
セッサ5が障害原因を有するものと仮定すると、再度障
害が発生するが今度は、送信側のプロセッサ3は、1系
運転の一重化の為、障害処理プログラムは図5で示すよ
うに通信バス9を切り離した後、通信バス10を使用す
る。これによりプロセッサ5は送信及び受信回路5eを
使用するため正常運転出来るようになる。この場合、真
の原因であるプロセッサ5の0系は障害検出出来ない。
When a communication failure is detected in the processor 3 on the transmission side due to the transmission and reception circuit 5f of the processor 5 on the other side during the processing described in FIG. 2, a failure processing program is started and shown in FIG. So the sending processor 3
The system 0 is disconnected from the system, and the communication processing is resumed in the system 1 (step 1; S1). In this case, assuming that the partner processor 5 has the cause of the failure, the failure occurs again. However, this time, the processor 3 on the transmission side performs the single-system operation, and the failure processing program is as shown in FIG. After disconnecting the communication bus 9 as shown, the communication bus 10 is used. This allows the processor 5 to operate normally because of the use of the transmission and reception circuit 5e. In this case, the 0 system of the processor 5, which is the true cause, cannot detect the failure.

【0012】しかし、本発明の処理では、障害処理プロ
グラムにより図4のように切り離された後、障害探索プ
ログラムを起動して図1に示すように各プロセッサ毎に
通信情報セーブエリア及び障害情報セーブエリア内の情
報を探索して、障害時に情報転送を実施していたプロセ
ッサすべてを診断実施対象プロセッサ情報エリアに設定
する(S2)。又、通信バスケーブル等の障害も考慮し
て、バス式に接続された最初と最後のプロセッサも同時
に診断対象プロセッサエリアに設定する。
However, in the processing of the present invention, after being separated as shown in FIG. 4 by the failure processing program, a failure search program is started and, as shown in FIG. The information in the area is searched, and all the processors that have performed the information transfer at the time of the failure are set in the processor information area to be diagnosed (S2). In addition, the first and last processors connected in a bus manner are simultaneously set in the processor area to be diagnosed in consideration of a trouble such as a communication bus cable.

【0013】その後、図5にように通信バス9を切り離
し、バス制御装置11,12の自動診断を通信バス9を
使用して実施する(S3)。この結果正常であれば、診
断対象プロセッサエリアに設定されたプロセッサすべて
に対して障害発生前に使用していた系へ自動診断プログ
ラムにより診断を実施する(S4)。この例の場合、通
信していたプロセッサ3,5及び通信バスの最初と最後
のプロセッサであるプロセッサ1,8が診断対象とな
り、順次診断を実施する。
Thereafter, the communication bus 9 is disconnected as shown in FIG. 5, and the bus controllers 11 and 12 are automatically diagnosed using the communication bus 9 (S3). If the result is normal, the diagnosis is performed by the automatic diagnosis program for all the processors set in the diagnosis target processor area for the system used before the occurrence of the failure (S4). In the case of this example, the communicating processors 3 and 5 and the first and last processors 1 and 8 of the communication bus are to be diagnosed, and the diagnosis is sequentially performed.

【0014】自動診断プログラムの結果、プロセッタ5
の0系バス試験で診断エラーとなる為、プロセッサ5の
0系を切り離した後、それ以外の装置を二重化運転に復
帰させる(S5)。そして、図6のように真の原因であ
るプロセッサ5の0系をシステムから自動で切り離す。
As a result of the automatic diagnosis program, the processor 5
Since a diagnosis error occurs in the 0-system bus test, the 0-system of the processor 5 is disconnected, and then the other devices are returned to the duplex operation (S5). Then, as shown in FIG. 6, the system 0 of the processor 5, which is the true cause, is automatically separated from the system.

【0015】このように、診断対象装置を絞って実施す
るので、プロセッサが多いシステムほど診断時間を短縮
できる効果がある。
As described above, since the diagnosis is performed by narrowing down the devices to be diagnosed, there is an effect that the diagnosis time can be shortened in a system having more processors.

【0016】[0016]

【発明の効果】以上説明したように本発明は、対象プロ
セッサを絞ることによる診断時間の短縮と、特定プロセ
ッサに起因するプロセッサ間通信用バスの障害の場合に
は、通信バスを切り離さないで自動的に特定プロセッサ
の障害系のみを隔離してシステムを再開させることによ
り、保守員を介在せずに障害原因を探索し、システムの
安定性と保守性を向上させることができるという効果が
ある。
As described above, according to the present invention, the diagnosis time can be reduced by narrowing down the target processor, and in the case of a failure in the inter-processor communication bus caused by a specific processor, the communication bus is automatically disconnected without disconnecting the communication bus. By isolating only the faulty system of the specific processor and restarting the system, it is possible to search for the cause of the fault without the intervention of maintenance personnel, thereby improving the stability and maintainability of the system.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の一実施例の障害処理におけるプログラ
ムの流れを示す図である。
FIG. 1 is a diagram showing a flow of a program in failure processing according to an embodiment of the present invention.

【図2】本発明の一実施例を説明するための交換システ
ム構成例を示す図である。
FIG. 2 is a diagram showing a configuration example of an exchange system for explaining an embodiment of the present invention.

【図3】図2のシステム構成例の詳細を示す図である。FIG. 3 is a diagram illustrating details of an example of a system configuration in FIG. 2;

【図4】本発明の一実施例の障害処理におけるシステム
系構成図である。
FIG. 4 is a configuration diagram of a system in failure processing according to an embodiment of the present invention.

【図5】本発明の一実施例の障害処理におけるシステム
系構成図である。
FIG. 5 is a system configuration diagram in a failure process according to an embodiment of the present invention.

【図6】本発明の一実施例の障害処理におけるシステム
系構成図である。
FIG. 6 is a system configuration diagram in a failure process according to an embodiment of the present invention.

【符号の説明】[Explanation of symbols]

1〜8 プロセッサ 9,10 通信バス 11,12 バス制御装置 1-8 processor 9,10 communication bus 11,12 bus controller

───────────────────────────────────────────────────── フロントページの続き (72)発明者 水上 久美 東京都港区芝五丁目7番1号日本電気株 式会社内 (56)参考文献 特開 昭59−219052(JP,A) 特開 昭61−125245(JP,A) 特開 昭64−24650(JP,A) 特開 昭63−227234(JP,A) 特開 平2−288527(JP,A) 特開 昭59−72255(JP,A) 特開 昭60−112155(JP,A) 特開 平2−306362(JP,A) 特開 昭64−88677(JP,A) 実開 昭58−111552(JP,U) ────────────────────────────────────────────────── ─── Continuing on the front page (72) Kumi Mizukami, Inventor 5-7-1 Shiba, Minato-ku, Tokyo Inside NEC Corporation (56) References JP-A-59-219052 (JP, A) JP-A Sho JP-A-64-24650 (JP, A) JP-A-63-227234 (JP, A) JP-A-2-288527 (JP, A) JP-A-59-72255 (JP, A) A) JP-A-60-112155 (JP, A) JP-A-2-306362 (JP, A) JP-A 64-88677 (JP, A)

Claims (1)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 バス方式で接続された複数のプロセッサ
を有するマルチプロセッサシステムにおいて、プロセッ
サ間を接続している通信バスで障害が発生したとき、こ
の障害発生時に情報を転送していたプロセッサ相互及び
前記バス方式の両端に接続されているプロセッサを診断
対象プロセッサとして設定し、各プロセッサの自動診断
を順次行い原因を探索し、前記診断対象プロセッサの中
で障害と判定されたプロセッサだけを自動でシステムの
系構成から切り離すことを特徴とするプロセッサ間通信
用バスの障害処理方式。
1. In a multiprocessor system having a plurality of processors connected by a bus method, when a failure occurs in a communication bus connecting the processors, when a failure occurs, the processors transferring information at the time of the failure and the processors that have transferred information. Processors connected to both ends of the bus system are set as processors to be diagnosed, and automatic diagnosis of each processor is sequentially performed to search for a cause. A fault handling method for an inter-processor communication bus, characterized in that it is separated from the system configuration.
JP3078110A 1991-04-11 1991-04-11 Fault handling method for interprocessor communication bus Expired - Lifetime JP2630100B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3078110A JP2630100B2 (en) 1991-04-11 1991-04-11 Fault handling method for interprocessor communication bus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3078110A JP2630100B2 (en) 1991-04-11 1991-04-11 Fault handling method for interprocessor communication bus

Publications (2)

Publication Number Publication Date
JPH04312043A JPH04312043A (en) 1992-11-04
JP2630100B2 true JP2630100B2 (en) 1997-07-16

Family

ID=13652749

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3078110A Expired - Lifetime JP2630100B2 (en) 1991-04-11 1991-04-11 Fault handling method for interprocessor communication bus

Country Status (1)

Country Link
JP (1) JP2630100B2 (en)

Also Published As

Publication number Publication date
JPH04312043A (en) 1992-11-04

Similar Documents

Publication Publication Date Title
CA2002966C (en) Method of checking test program in duplex processing apparatus
JP2630100B2 (en) Fault handling method for interprocessor communication bus
JPH08265319A (en) Duplex monitoring control system
JPH06259343A (en) Multiple bus control method and system using the same
JP4678384B2 (en) Link failure diagnosis method, disk array system, and link failure diagnosis program
JP2827713B2 (en) Redundant device
JP3156987B2 (en) Bus failure diagnosis method
JPS62271150A (en) Error processing system for common bus structure
JP2626127B2 (en) Backup route test method
JPS6023382B2 (en) Shared I/O bus controller
US20050022056A1 (en) Access by distributed computers to a same hardware resource
JPH1196033A (en) Information processor
JPH0427239A (en) Control method for lan connecting device
JP2636610B2 (en) Backup method
JPS6113627B2 (en)
JPH04101255A (en) Bus backup mechanism
JPH09146853A (en) Duplex computer and fault system restoration method therefor
JP3015537B2 (en) Redundant computer system
JPS6213700B2 (en)
JP2513128B2 (en) Information processing system
JP2815730B2 (en) Adapters and computer systems
JPS62190536A (en) Redundant constitution control system
JPH04211840A (en) Hot standby system
JPH09311841A (en) Multiprocessor system
JPH06282454A (en) Automatic fault diagnostic system

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19970304