JP2000222294A - Computer system and bus fault recovering method - Google Patents

Computer system and bus fault recovering method

Info

Publication number
JP2000222294A
JP2000222294A JP11022810A JP2281099A JP2000222294A JP 2000222294 A JP2000222294 A JP 2000222294A JP 11022810 A JP11022810 A JP 11022810A JP 2281099 A JP2281099 A JP 2281099A JP 2000222294 A JP2000222294 A JP 2000222294A
Authority
JP
Japan
Prior art keywords
line
bus
modules
spare
failure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP11022810A
Other languages
Japanese (ja)
Inventor
Masahiro Horioka
正宏 堀岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP11022810A priority Critical patent/JP2000222294A/en
Publication of JP2000222294A publication Critical patent/JP2000222294A/en
Withdrawn legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To provide a computer system capable of maintaining stable operation against a bus fault without multiplexing a bus. SOLUTION: In the computer system mutually connecting plural modules 1, 2,..., (n) through a bus 12, a spare bus line 13 is prepared for substituting the fault line of the bus 12 and when the fault line of the bus 12 is detected, that fault line is switched to the spare bus line 13 for use. Since the fault line can be substituted for the unit of line just after the detection of fault while using the spare line 13, the computer system can be stably operated until recovery processing such as exchange of a fault spot is executed, and the high- reliability computer system can be provided.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、バスを通じて複数
の集積回路(モジュール)を相互に接続して構成された
計算機システム及びバス障害回復方法に関する。
[0001] 1. Field of the Invention [0002] The present invention relates to a computer system configured by interconnecting a plurality of integrated circuits (modules) via a bus, and a bus failure recovery method.

【0002】[0002]

【従来の技術】従来から、信頼性の要求されるサーバな
どの計算機システムには、バスを流れる信号のビット化
けなどのエラーをECC(Error Correcting Code
:誤り訂正符号)等により訂正する機能が備えられて
いる。バスで検出されたビット化けはバスを構成するい
ずれかのラインの障害によるものとして、エラー検出後
早期に計算機システムを停止させ、障害箇所の交換など
の障害回復作業にとりかかることが一般的に行われてい
る。
2. Description of the Related Art Conventionally, computer systems such as servers requiring reliability require an error correcting code (ECC) such as garbled bits of a signal flowing through a bus.
: Error correction code). Bit corruption detected on the bus is considered to be due to a failure in one of the lines that make up the bus, and it is common practice to stop the computer system early after the error is detected and start work on failure recovery such as replacing the failed part. Have been done.

【0003】しかしながら、このバスの障害回復作業が
実施されるまで、計算機システムは依然不安定な状態で
運用されることになる。このことは、特に高い信頼性の
要求されるサーバ用途等の計算機システムでは解消され
ねばならない課題と言える。
However, the computer system is still operated in an unstable state until this bus failure recovery operation is performed. This can be said to be a problem that must be solved particularly in computer systems such as servers that require high reliability.

【0004】バス障害にそなえ計算機システムの安定動
作を確保する方式として、同じビット幅を有する複数の
バスを用いるバス多重化方式が挙げられる。これによれ
ば、メインバスに障害が起きた場合にサブのバスに切り
替えることによって障害回復作業が施される期間も計算
機システムを安定した状態を保つことができる。しかし
ながら、バスを多重化すると計算機システムそのものの
規模が大幅に大きくなってコストも大幅に増大してしま
う。
As a method for ensuring stable operation of a computer system in response to a bus failure, there is a bus multiplexing method using a plurality of buses having the same bit width. According to this, when a failure occurs in the main bus, the computer system can be maintained in a stable state even during a period in which the failure recovery work is performed by switching to the sub bus. However, when the bus is multiplexed, the scale of the computer system itself is greatly increased, and the cost is also greatly increased.

【0005】[0005]

【発明が解決しようとする課題】このように、従来、バ
スを流れるデータのエラーはECCにより訂正すること
が可能であるが、バスの障害を抱えたままシステムを不
安定な状態のまま稼動しつづけことは危険である。この
問題を解消する方式としてバス多重化システムがある
が、この方式ではハードウェア規模が大きくなり、コス
トの増大を招く。
As described above, conventionally, errors in data flowing through the bus can be corrected by ECC, but the system is operated in an unstable state with a bus failure. Continuing is dangerous. There is a bus multiplexing system as a method for solving this problem. However, in this method, the hardware scale is increased, and the cost is increased.

【0006】本発明はこのような課題を解決するために
なされたもので、バスを多重化することなく、バス障害
に対して安定した動作を維持することのできる計算機シ
ステム及びバス障害回復方法を提供することを目的とし
ている。
SUMMARY OF THE INVENTION The present invention has been made to solve such problems, and a computer system and a bus failure recovery method capable of maintaining stable operation against a bus failure without multiplexing the bus. It is intended to provide.

【0007】[0007]

【課題を解決するための手段】上記した目的を達成する
ために、請求項1記載の発明の計算機システムは、複数
のモジュールと、前記各モジュール間を接続するバス
と、前記バス内の障害ラインを代替するスペアラインと
を有し、前記モジュールは、前記バス内の障害ラインを
検出する障害検出手段と、前記障害検出手段によって障
害ラインが検出されたとき該障害ラインの情報を全ての
前記モジュールに通知する障害通知手段と、前記障害通
知手段より通知された障害ライン情報に基づいて、前記
検出された障害ラインを前記スペアラインに切り替える
切替手段とを具備することを特徴とする。
According to one aspect of the present invention, there is provided a computer system comprising: a plurality of modules; a bus connecting the modules; and a fault line in the bus. A spare line that replaces the module, the module includes: a failure detection unit that detects a failure line in the bus; and when the failure detection unit detects a failure line, information of the failure line is transmitted to all of the modules. And a switching means for switching the detected faulty line to the spare line based on the faulty line information notified by the fault notifying means.

【0008】本発明では、障害バスをスペアラインを用
いてライン単位で代替することができる。したがって、
障害箇所の交換等の障害回復処置が施されるまでの間も
計算機システムを安定して動作させることができ、バス
多重化システムと同等の信頼性を有しかつ安価な計算機
システムを提供することができる。
According to the present invention, a faulty bus can be replaced line by line using a spare line. Therefore,
To provide a computer system that can operate a computer system stably even before a failure recovery procedure such as replacement of a failure point is performed, and has the same reliability and an inexpensive computer system as a bus multiplex system. Can be.

【0009】また、請求項2記載の発明の計算機システ
ムは、複数のモジュールと、前記各モジュール間を接続
するバスと、前記バス内の障害ラインを代替する複数の
スペアラインとを有し、前記モジュールは、前記バス内
の障害ラインを検出する障害検出手段と、前記障害検出
手段によって障害ラインが検出されたとき該障害ライン
の情報を全ての前記モジュールに通知する障害通知手段
と、前記障害通知手段により通知された障害ラインの情
報を複数蓄積可能な記憶手段と、前記記憶手段により記
憶された障害ライン情報に基づき前記障害ラインを前記
スペアラインに切り替える切替手段とを具備することを
特徴とする。
A computer system according to a second aspect of the present invention has a plurality of modules, a bus connecting the modules, and a plurality of spare lines replacing a faulty line in the bus. A module configured to detect a failure line in the bus, a failure notification unit configured to notify information of the failure line to all the modules when the failure detection unit detects the failure line; Storage means capable of accumulating a plurality of pieces of information on the fault line notified by the means, and switching means for switching the fault line to the spare line based on the fault line information stored by the storage means. .

【0010】本発明は、異なるバスサイクルにわたって
複数の障害ラインが発生した場合に、それぞれの障害ラ
インを別々のスペアラインで代替することができる。し
たがって、障害箇所の交換等の障害回復処置が施される
までの間も計算機システムを安定して動作させることが
でき、バス多重化システムよりも信頼性の点で優れしか
も安価な計算機システムを提供することができる。
According to the present invention, when a plurality of faulty lines occur over different bus cycles, each faulty line can be replaced with a separate spare line. Therefore, the computer system can be operated stably even before a fault recovery procedure such as replacement of a fault location is performed, and a computer system that is superior in reliability and cheaper than a bus multiplex system is provided. can do.

【0011】さらに、請求項3記載の発明の計算機シス
テムは、複数のモジュールと、前記各モジュール間を接
続するバスと、前記バス内の障害ラインを代替する複数
のスペアラインとを有し、前記モジュールは、前記バス
を流れるデータのエラー検出およびエラー訂正を前記バ
スを構成する複数のライン群毎に交互に行うエラー検出
訂正手段と、前記エラー検出訂正手段によってあるライ
ン群でエラーが検出されたとき該エラーを起したライン
の情報を全ての前記モジュールに通知する障害通知手段
と、前記障害通知手段により通知されたエラーライン情
報に基づき前記エラーラインを前記スペアラインに切り
替える切替手段とを具備することを特徴とする。
The computer system according to the third aspect of the present invention has a plurality of modules, a bus connecting the modules, and a plurality of spare lines replacing a fault line in the bus. The module includes: an error detection and correction unit that performs error detection and error correction of data flowing through the bus alternately for each of a plurality of line groups configuring the bus; and an error is detected in a certain line group by the error detection and correction unit. A failure notifying unit for notifying information of the line in which the error has occurred to all of the modules; and a switching unit for switching the error line to the spare line based on the error line information notified by the failure notifying unit. It is characterized by the following.

【0012】本発明では、バスに同時に複数の障害ライ
ンが発生した場合でも、それらの障害ラインを複数のス
ペアラインで代替することができる。したがって、障害
箇所の交換等の障害回復処置が施されるまでの間も計算
機システムを安定して動作させることができ、バス多重
化システムと同等の信頼性を有しかつ安価な計算機シス
テムを提供することができる。
According to the present invention, even when a plurality of faulty lines occur simultaneously on the bus, those faulty lines can be replaced with a plurality of spare lines. Therefore, the computer system can be operated stably even before a failure recovery procedure such as replacement of a failure point is performed, and a computer system having the same reliability and an inexpensive computer system as a bus multiplexing system is provided. can do.

【0013】[0013]

【発明の実施の形態】以下、本発明の実施の形態を図面
を参照して詳細に説明する。
Embodiments of the present invention will be described below in detail with reference to the drawings.

【0014】図1は、本発明の第1の実施形態にかかる
計算機システムの構成を示す図である。
FIG. 1 is a diagram showing a configuration of a computer system according to the first embodiment of the present invention.

【0015】同図に示すように、この計算機システム内
の各モジュール1、2、…、nは、少なくともm(ただ
し、mは8の倍数)本のラインで構成されるバス12と
(m/8)本のスペアバスライン13を通じて相互に接
続されている。
As shown in FIG. 1, each module 1, 2,..., N in the computer system has a bus 12 composed of at least m (where m is a multiple of 8) lines 12 and (m / m). 8) The spare bus lines 13 are connected to each other.

【0016】モジュール1は、プロセッサ14、メモリ
15、バスI/F16、バストランシーバ(Tr.)1
7、障害ライン情報レジスタ(EL Reg.)18、
スペアバストランシーバ(S−Tr.)19を有してい
る。さらに、バスI/F16はECC回路(エラー検出
/訂正回路)20を有している。
The module 1 includes a processor 14, a memory 15, a bus I / F 16, and a bus transceiver (Tr.) 1.
7, fault line information register (EL Reg.) 18,
A spare bus transceiver (S-Tr.) 19 is provided. Further, the bus I / F 16 has an ECC circuit (error detection / correction circuit) 20.

【0017】バストランシーバ17はモジュール1とバ
ス12とを接続する機能を有する。スペアバストランシ
ーバ19はモジュール1とスペアバスライン13とを接
続する機能を有する。ECC回路20はバストランシー
バ17を通じてバス12より入力されたmビットのデー
タについてエラー検出とエラー訂正を行う。
The bus transceiver 17 has a function of connecting the module 1 and the bus 12. The spare bus transceiver 19 has a function of connecting the module 1 and the spare bus line 13. The ECC circuit 20 performs error detection and error correction on m-bit data input from the bus 12 through the bus transceiver 17.

【0018】プロセッサ14はECC回路20からのエ
ラー検出結果を基にバス12の障害を検出したとき、そ
の障害を起したバス12のラインがどれであるかを示す
情報(障害ライン情報)をこの情報を書込むことを指示
するコマンドとともにバスI/F16を介して全てのモ
ジュール1、2、…、nに対して発行する機能を有す
る。
When the processor 14 detects a failure in the bus 12 based on the error detection result from the ECC circuit 20, the processor 14 sends information (failure line information) indicating which line of the bus 12 has caused the failure. .., N via the bus I / F 16 together with a command instructing to write information.

【0019】以上説明したモジュール1の構成は他のモ
ジュール2、…、nについても同様である。
The configuration of the module 1 described above is the same for the other modules 2,..., N.

【0020】図2は、図1に示したモジュール1内部の
バストランシーバ17およびスペアバストランシーバ1
9の特定ビット構成を示す図である。
FIG. 2 shows the bus transceiver 17 and the spare bus transceiver 1 inside the module 1 shown in FIG.
9 is a diagram illustrating a specific bit configuration of No. 9; FIG.

【0021】同図に示すように、スペアバストランシー
バ(S−Tr.)19は、障害ライン情報レジスタ(E
L Reg.)18に保持された障害ライン情報に基づ
いてスペアバスライン13へ出力する信号を選択する出
力セレクタ91、この出力セレクタ91によって選択さ
れた信号を増幅する増幅器92、スペアバスライン13
より入力された信号を増幅する増幅器93を有してい
る。出力セレクタ91には特定ビット以外の他のビット
のデータがトランシーバより入力されている。
As shown in FIG. 1, the spare bus transceiver (S-Tr.) 19 includes a fault line information register (E
L Reg. 3) an output selector 91 for selecting a signal to be output to the spare bus line 13 based on the fault line information held in 18, an amplifier 92 for amplifying the signal selected by the output selector 91, and the spare bus line 13.
The amplifier 93 amplifies the input signal. Data of bits other than the specific bit is input to the output selector 91 from the transceiver.

【0022】バストランシーバ(Tr.)17は、障害
ライン情報レジスタ18に保持された障害ライン情報に
基づいて、バス12からの入力信号およびスペアバスラ
イン13からの入力信号を選択する入力セレクタ71、
バスライン12への出力信号を増幅する増幅器72、バ
ス12からの入力信号を増幅する増幅器73を有してい
る。バストランシーバ17は、具体的には、図3に示す
ようにバス12における個々のビットライン毎に設けら
れている(71−1、71−2、…、71−n)。
A bus transceiver (Tr.) 17 has an input selector 71 for selecting an input signal from the bus 12 and an input signal from the spare bus line 13 based on the fault line information held in the fault line information register 18.
An amplifier 72 amplifies an output signal to the bus line 12 and an amplifier 73 amplifies an input signal from the bus 12. The bus transceiver 17 is specifically provided for each individual bit line in the bus 12 as shown in FIG. 3 (71-1, 71-2,..., 71-n).

【0023】次に、この第1の実施形態の動作を説明す
る。
Next, the operation of the first embodiment will be described.

【0024】モジュール1のバスI/F16内のECC
回路20によりバス12の障害が検出された場合を例に
本実施形態の動作を説明する。
ECC in bus I / F 16 of module 1
The operation of the present embodiment will be described by taking as an example a case where a failure of the bus 12 is detected by the circuit 20.

【0025】モジュール1内のプロセッサ14はECC
回路20からのエラー検出信号を受けてバス12の特定
ビットのラインに障害の発生を知ると、その障害の発生
したラインがどれであるかを示す情報(障害発生を示す
特定ビットのライン情報)を、この情報を障害ライン情
報レジスタ18に書き込むことを指示するコマンドとと
もに自身を含む全てのモジュール1、2、…、nに対し
て発行する。
The processor 14 in the module 1 has an ECC
Upon receiving an error detection signal from the circuit 20 and knowing that a failure has occurred in a line of a specific bit of the bus 12, information indicating the line in which the failure has occurred (line information of a specific bit indicating the occurrence of a failure) Is issued to all the modules 1, 2,..., N including itself, together with a command for writing this information to the fault line information register 18.

【0026】バス12に接続されている全てのモジュー
ル1、2、…、nはそれぞれ、バス12より上記障害ラ
イン情報およびコマンドを受けとると、直ちにこのコマ
ンドを実行する。この結果、全てのモジュール1、2、
…、n内の障害ライン情報レジスタ18にそれぞれ共通
の障害ライン情報が同時に(同一のバスサイクルで)書
き込まれる。
When all of the modules 1, 2,..., N connected to the bus 12 receive the fault line information and the command from the bus 12, they execute the command immediately. As a result, all modules 1, 2,
,..., The common fault line information is simultaneously written (in the same bus cycle) to the fault line information registers 18 in n.

【0027】以下、全てのモジュール1、2、…、nに
おいて、障害ライン情報レジスタ18に保持された障害
ライン情報に基づいて、その障害ラインをスペアバスラ
イン13で代替するための切り替え処理が次のように行
われる。
In the following, in all the modules 1, 2,..., N, a switching process for replacing the faulty line with the spare bus line 13 based on the faulty line information held in the faulty line information register 18 is as follows. It is performed as follows.

【0028】全てのモジュール1、2、…、nにおい
て、障害ライン情報レジスタ18に保持された情報はス
ペアバストランシーバ19内の出力セレクタ91に入力
される。出力セレクタ91は入力された障害ライン情報
に基づいて、バス12の障害ラインをスペアバスライン
13に切り替える。これにより、例えば、モジュール1
のプロセッサ14から出力された特定ビットのデータが
出力セレクタ91、増幅器92を介してスペアバスライ
ン13に出力される。
In all the modules 1, 2,..., N, the information held in the fault line information register 18 is input to the output selector 91 in the spare bus transceiver 19. The output selector 91 switches the fault line of the bus 12 to the spare bus line 13 based on the input fault line information. Thereby, for example, module 1
Is output to the spare bus line 13 via the output selector 91 and the amplifier 92.

【0029】また、全てのモジュール1、2、…、nに
おいて、障害ライン情報レジスタ18に保持された情報
はバストランシーバ17内の入力セレクタ71にも入力
される。入力セレクタ71は、入力された障害ライン情
報に基づいて、バス12の障害ライン以外のラインから
の入力を選択するとともにスペアバスライン13からの
入力を選択するように切り替えを行う。これにより、例
えば、モジュール2ではスペアバスライン13から入力
された特定ビットのデータが増幅器93、入力セレクタ
71を介して入力される。
In all the modules 1, 2,..., N, the information held in the fault line information register 18 is also input to the input selector 71 in the bus transceiver 17. The input selector 71 performs switching so as to select an input from a line other than the fault line of the bus 12 and an input from the spare bus line 13 based on the input fault line information. Thus, for example, in the module 2, data of a specific bit input from the spare bus line 13 is input via the amplifier 93 and the input selector 71.

【0030】このようにすることで、障害ライン情報レ
ジスタ18に障害ライン情報が書き込まれた後、次のバ
スサイクルから、スペアバスライン13を利用したモジ
ュール間データ転送が開始される。
In this way, after the failed line information is written into the failed line information register 18, data transfer between modules using the spare bus line 13 is started from the next bus cycle.

【0031】以上の本実施形態では、スペアバスライン
13を利用したモジュール間データ転送時においても、
バスI/F16内のECC回路20によりエラー検出と
エラー訂正は通常通り行われる。すなわち、スペアバス
ライン13を含めたバス12はこれまで通りECC回路
20によって保護される。
In the above embodiment, even when data is transferred between modules using the spare bus line 13,
Error detection and error correction are normally performed by the ECC circuit 20 in the bus I / F 16. That is, the bus 12 including the spare bus line 13 is protected by the ECC circuit 20 as before.

【0032】ところで、障害ライン情報とこれを障害ラ
イン情報レジスタ18に書き込むことを指示するコマン
ドを転送するバスは、ECC回路によって保護されたバ
スであることが好ましい点は言うまでもない。
Incidentally, it is needless to say that the bus for transferring the fault line information and the command for writing the fault line information to the fault line information register 18 is preferably a bus protected by the ECC circuit.

【0033】また、本実施形態の計算機システムでは、
複数のモジュールにおいて同一のバス障害が検出された
場合にそなえ、バスのアービトレーションによって、一
つのモジュールのみが障害ライン情報とコマンドを発行
できるものとしている。バスの使用権を与えられなかっ
た他の障害検出モジュールはバスの仕様に従いコマンド
をキャンセルする。
In the computer system according to the present embodiment,
In the case where the same bus fault is detected in a plurality of modules, only one module can issue fault line information and a command by bus arbitration. Other failure detection modules not given the right to use the bus cancel the command according to the bus specification.

【0034】このように、本実施形態によれば、障害を
起したバス12のラインをスペアバスライン13を用い
てライン単位でしかも障害検出後直ちに代替することが
できる。したがって、障害箇所の交換等の回復処置が施
されるまでの間も計算機システムを安定して動作させる
ことができ、信頼性の高い計算機システムを提供するこ
とができる。また、本実施形態によれば、m本のライン
で構成されるバス12に対してm/8本のスペアバスラ
イン13を用意するだけでよいから、バス多重化システ
ムよりも回路規模およびコストがが小さくてすむという
利点を有する。
As described above, according to the present embodiment, the line of the bus 12 in which a failure has occurred can be replaced line by line using the spare bus line 13 and immediately after the failure is detected. Therefore, the computer system can be operated stably even before recovery processing such as replacement of a faulty part is performed, and a highly reliable computer system can be provided. Further, according to the present embodiment, it is only necessary to prepare m / 8 spare bus lines 13 for the bus 12 composed of m lines, so that the circuit size and cost are lower than those of the bus multiplexing system. Has the advantage of being small.

【0035】次に、本発明の第2の実施形態の計算機シ
ステムについて説明する。
Next, a computer system according to a second embodiment of the present invention will be described.

【0036】本実施形態の計算機システムにおいて、ス
ペアバスラインは、異なるバスサイクルでバス障害が発
生した場合に対応し得るように2本用意されている。
In the computer system of the present embodiment, two spare bus lines are prepared so as to cope with a case where a bus failure occurs in a different bus cycle.

【0037】図4に、かかる本実施形態の計算機システ
ムのモジュール内部のバストランシーバ、障害ライン情
報レジスタおよびスペアバストランシーバの特定ビット
構成を示す。同図に示すように、個々のモジュールは、
第1のスペアバスライン13aに対応する第1のスペア
バストランシーバ19aと、第2のスペアバスライン1
3bに対応する第2のスペアバストランシーバ19b
と、個々のスペアバストランシーバ19a、19bにそ
れぞれ対応する第1の障害ライン情報レジスタ(EL
Reg.1)18aおよび第2の障害ライン情報レジス
タ(EL Reg.2)18bとを有する。
FIG. 4 shows a specific bit configuration of the bus transceiver, the fault line information register, and the spare bus transceiver in the module of the computer system according to the present embodiment. As shown in the figure, each module is
A first spare bus transceiver 19a corresponding to the first spare bus line 13a, and a second spare bus line 1
3b corresponding to the second spare bus transceiver 19b
And a first fault line information register (EL) corresponding to each of the spare bus transceivers 19a and 19b.
Reg. 1) 18a and a second fault line information register (EL Reg. 2) 18b.

【0038】各スペアバストランシーバ19a、19b
はともに、対応する障害ライン情報レジスタ18a、1
8bに保持された障害ライン情報に基づいて、対応する
スペアバスライン13a、13bへ出力する信号を選択
する出力セレクタ91a、91bと、出力セレクタ91
a、91bによって選択された信号を増幅する増幅器9
2a、92bと、対応するスペアバスライン13a、1
3bより入力された信号を増幅する増幅器93a、93
bを有している。出力セレクタ91a、91bには特定
ビット以外の他のビットのデータがトランシーバより入
力されている。各障害ライン情報レジスタ18a、18
bの出力はそれぞれ対応する各スペアバストランシーバ
19a、19b内の出力セレクタ91a、91bに導入
されるとともに、バストランシーバ17内の入力セレク
タ71に導入される。
Each spare bus transceiver 19a, 19b
Are the corresponding fault line information registers 18a, 1
8b, output selectors 91a and 91b for selecting signals to be output to the corresponding spare bus lines 13a and 13b, based on the fault line information held in the output selector 91b.
a, an amplifier 9 for amplifying the signal selected by 91b
2a, 92b and the corresponding spare bus lines 13a, 1
Amplifiers 93a and 93 for amplifying the signal input from 3b
b. Data of bits other than the specific bit is input from the transceiver to the output selectors 91a and 91b. Each fault line information register 18a, 18
The output of b is introduced to the output selectors 91a and 91b in the corresponding spare bus transceivers 19a and 19b, and also to the input selector 71 in the bus transceiver 17.

【0039】次に、本実施形態の動作を説明する。最初
に発生したバス障害に関する障害ライン情報は第1の障
害ライン情報レジスタ18aに書き込まれる。障害ライ
ン情報レジスタ18aに保持された情報は第1のスペア
バストランシーバ19a内の出力セレクタ91aに入力
される。出力セレクタ91aは入力された障害ライン情
報に基づいて、バス12の特定ビットの障害ラインを第
1のスペアバスライン13aに切り替えてデータを出力
する。また、第1の障害ライン情報レジスタ18aに保
持された情報はバストランシーバ17内の入力セレクタ
71にも入力される。入力セレクタ71は、入力された
特定ビットの障害ライン情報に基づいて、他のモジュー
ルから第1のスペアバスライン13を介して送信された
データを選択するように切り替えを行う。以上の動作は
先の実施形態で説明したように、計算機システム内の全
てのモジュール1、2、…、nにおいて実行される。
Next, the operation of this embodiment will be described. The fault line information regarding the first bus fault is written to the first fault line information register 18a. The information held in the fault line information register 18a is input to an output selector 91a in the first spare bus transceiver 19a. The output selector 91a switches a faulty line of a specific bit of the bus 12 to the first spare bus line 13a and outputs data based on the input faulty line information. The information held in the first fault line information register 18a is also input to the input selector 71 in the bus transceiver 17. The input selector 71 performs switching so as to select data transmitted from another module via the first spare bus line 13 based on the input failure line information of the specific bit. The above operation is executed in all the modules 1, 2,..., N in the computer system as described in the previous embodiment.

【0040】バス12の障害箇所の交換等の障害解消処
置が施されるまでの間に再びバス12の他の特定ビット
のラインに障害が発生した場合、この新たな障害ライン
の情報は第2の障害ライン情報レジスタ18bに書き込
まれる。障害ライン情報レジスタ18bに保持された他
の特定ビットのライン情報は第2のスペアバストランシ
ーバ19b内の出力セレクタ91bに入力される。出力
セレクタ91bは入力された障害ライン情報に基づい
て、バス12の他の特定ビットの障害ラインを第2のス
ペアバスライン13bに切り替えてデータを出力する。
また、第2の障害ライン情報レジスタ18bに保持され
た情報はバストランシーバ17内の入力セレクタ71に
も入力される。入力セレクタ71のビットが他の特定ビ
ットであったとすると、第2の障害ライン情報レジスタ
18bから入力された障害ライン情報に基づいて第2の
スペアバスライン13bから信号を入力するように切り
替えを行う。
If a fault occurs again in another specific bit line of the bus 12 before a fault elimination process such as replacement of a faulty portion of the bus 12 is performed, the information of the new faulty line is the second faulty line. Is written to the fault line information register 18b. The line information of another specific bit held in the failure line information register 18b is input to the output selector 91b in the second spare bus transceiver 19b. The output selector 91b switches the failure line of another specific bit of the bus 12 to the second spare bus line 13b based on the inputted failure line information and outputs data.
The information held in the second fault line information register 18b is also input to the input selector 71 in the bus transceiver 17. If the bit of the input selector 71 is another specific bit, switching is performed so that a signal is input from the second spare bus line 13b based on the fault line information input from the second fault line information register 18b. .

【0041】したがって、この第2の実施形態の計算機
システムによれば、2ビットのバスラインにバス障害が
発生しても、それぞれの障害ラインを第1のスペアバス
ライン13aと第2のスペアバスライン13bで代替す
ることができる。したがって、障害箇所の交換等の回復
処置が施されるまでの間もシステムを安定して動作させ
ることができる。また、本実施形態によれば、バス多重
化システムと比べ、より信頼性の高い計算機システムを
提供することができるとともに、より安価な計算機シス
テムを提供することができる。
Therefore, according to the computer system of the second embodiment, even if a bus failure occurs in the 2-bit bus line, each failed line is connected to the first spare bus line 13a and the second spare bus line. Line 13b can be substituted. Therefore, the system can be operated stably even before recovery measures such as replacement of a failed part are performed. Further, according to the present embodiment, it is possible to provide a more reliable computer system as compared with the bus multiplexing system, and it is possible to provide a cheaper computer system.

【0042】なお、この実施形態では、スペアバスライ
ンを2本用意しておくことによって、バス12に発生し
た2ビットのバスラインまでの障害発生に対処できるも
のとしたが、スペアバスラインをx(xは3以上)本以
上用意しておくことによって、バス12に発生したxビ
ットのバスラインの障害発生に対処することが可能であ
る。
In this embodiment, by preparing two spare bus lines, it is possible to cope with the failure of the bus 12 up to the 2-bit bus line. By preparing more than three (x is 3 or more), it is possible to cope with the occurrence of a failure of the x-bit bus line generated in the bus 12.

【0043】次に、本発明の第3の実施形態の計算機シ
ステムについて説明する。
Next, a computer system according to a third embodiment of the present invention will be described.

【0044】バスの隣接するライン間でショート等が発
生した場合、複数のラインで同時に障害が発生する。本
実施形態はこのような障害に対処するものである。
When a short circuit or the like occurs between adjacent lines of the bus, a fault occurs simultaneously in a plurality of lines. The present embodiment addresses such a failure.

【0045】図5に、かかる本実施形態の計算機システ
ムのモジュール内部のバストランシーバ、障害ライン情
報レジスタおよびスペアバストランシーバの構成の詳細
を示す。
FIG. 5 shows the details of the configuration of the bus transceiver, the fault line information register and the spare bus transceiver in the module of the computer system according to the present embodiment.

【0046】同図に示すように、個々のモジュール1、
2、…、nは、バス12の奇数番目の各ラインと接続さ
れた奇数バストランシーバ(Tr.Odd)171と、
バス12の偶数番目の各ラインと接続された偶数バスト
ランシーバ(Tr.Even)172と、第1のスペア
バスライン13aと接続された第1のスペアバストラン
シーバ(S−Tr.1)191と、第2のスペアバスラ
イン13bと接続された第2のスペアバストランシーバ
(S−Tr.2)192と、奇数バストランシーバ17
1および第1のスペアバストランシーバ191に導入す
べき障害ライン情報を保持する第1の障害ライン情報レ
ジスタ(EL Reg.1)18Aと、偶数バストラン
シーバ172および第2のスペアバストランシーバ19
2に導入すべき障害ライン情報を保持する第2の障害ラ
イン情報レジスタ(EL Reg.2)18Bと、バス
12の奇数番目の各ラインのデータに対するエラー検出
とエラー訂正を行う第1のECC回路(ECC1)20
Aと、バス12の偶数番目の各ラインのデータに対する
エラー検出とエラー訂正を行う第2のECC回路(EC
C2)20Bとを有する。
As shown in FIG.
, N are odd-numbered bus transceivers (Tr. Odd) 171 connected to odd-numbered lines of the bus 12,
An even bus transceiver (Tr. Even) 172 connected to each even line of the bus 12, a first spare bus transceiver (S-Tr. 1) 191 connected to the first spare bus line 13a, A second spare bus transceiver (S-Tr. 2) 192 connected to the second spare bus line 13b, and an odd bus transceiver 17
A first fault line information register (EL Reg. 1) 18A for holding fault line information to be introduced into the first and first spare bus transceivers 191, an even bus transceiver 172 and a second spare bus transceiver 19
2, a second fault line information register (EL Reg. 2) 18B for holding fault line information to be introduced into the bus 2, and a first ECC circuit for performing error detection and error correction on data of each odd-numbered line of the bus 12. (ECC1) 20
A and a second ECC circuit (ECC) for performing error detection and error correction on data of each even-numbered line of the bus 12.
C2) 20B.

【0047】次に、この第3実施形態の動作を説明す
る。
Next, the operation of the third embodiment will be described.

【0048】この計算機システムにおいて、バス12の
奇数番目のライン群のビットデータと偶数番目のライン
群のビットデータはそれぞれ第1のECC回路20Aと
第2のECC回路20Bとによってエラー検出/訂正が
行われる。
In this computer system, the bit data of the odd-numbered line group and the bit data of the even-numbered line group of the bus 12 are subjected to error detection / correction by the first ECC circuit 20A and the second ECC circuit 20B, respectively. Done.

【0049】バス12内の隣接する2本のラインがショ
ートしてこれら2本のラインで同時に障害が発生して検
出される場合がある。本計算機システムでは、奇数番目
のライン群のビットデータと偶数番目のライン群のビッ
トデータがそれぞれ別々のECC回路20A、20Bで
エラー検出/訂正されるため、隣接する2本のラインが
同時に障害を起しても正しくエラー訂正を行うことがで
きる。
In some cases, two adjacent lines in the bus 12 are short-circuited, and a fault occurs simultaneously in these two lines and detected. In this computer system, the bit data of the odd-numbered line group and the bit data of the even-numbered line group are detected / corrected by the separate ECC circuits 20A and 20B, respectively. Even if it occurs, the error can be correctly corrected.

【0050】また、各ECC回路20A、20Bでバス
障害がそれぞれ検出されると、第1の障害ライン情報レ
ジスタ18Aに奇数番目のライン群における障害ライン
情報が書き込まれ、また、第2の障害ライン情報レジス
タ18Bに偶数番目のライン群における障害ライン情報
が書き込まれる。
When a bus failure is detected in each of the ECC circuits 20A and 20B, the failure line information in the odd-numbered line group is written into the first failure line information register 18A, and the second failure line information is written. The fault line information in the even-numbered line group is written to the information register 18B.

【0051】第1の障害ライン情報レジスタ18Aに保
持された情報は第1のスペアバストランシーバ191と
奇数バストランシーバ171に入力され、バス12の奇
数番目のライン群内の障害ラインが第1のスペアバスラ
イン13aに切り替えられる。また、第2の障害ライン
情報レジスタ18Bに保持された情報は第2のスペアバ
ストランシーバ192と偶数バストランシーバ172に
入力され、バス12の偶数番目のライン群内の障害ライ
ンが第2のスペアバスライン13bに切り替えられる。
The information held in the first fault line information register 18A is input to the first spare bus transceiver 191 and the odd bus transceiver 171 so that the fault line in the odd line group of the bus 12 is replaced with the first spare bus. It is switched to the bus line 13a. The information held in the second fault line information register 18B is input to the second spare bus transceiver 192 and the even bus transceiver 172, and the fault line in the even line group of the bus 12 is replaced with the second spare bus. The line is switched to the line 13b.

【0052】以上の動作は先の実施形態で説明したよう
に、計算機システム内の全てのモジュール1、2、…、
nにおいて実行される。
The operation described above is performed for all the modules 1, 2,... In the computer system as described in the previous embodiment.
n.

【0053】したがって、この第3の実施形態の計算機
システムによれば、バス12の隣接するラインで同時に
エラーが発生した場合でも、障害箇所の交換等の回復処
置が施されるまでの間システムを安定して動作させるこ
とができ、より信頼性の高い計算機システムを提供する
ことができる。
Therefore, according to the computer system of the third embodiment, even if an error occurs simultaneously in the adjacent lines of the bus 12, the system is maintained until recovery processing such as replacement of a faulty part is performed. A computer system that can be operated stably and has higher reliability can be provided.

【0054】なお、本実施形態の計算機システムは、個
々のモジュールに2つのECC回路20A、20Bを設
け、バス12の全ラインを奇数番目と偶数番目の2グル
ープに分け各グループ毎にエラー検出とエラー訂正を行
うように構成したが、個々のモジュールに3つ以上のE
CC回路を設け、バス12の全ラインを3グループに分
け各グループ毎にエラー検出とエラー訂正を行うように
構成してもよい。
In the computer system of the present embodiment, two ECC circuits 20A and 20B are provided for each module, and all lines of the bus 12 are divided into two groups, odd and even, to detect errors for each group. It is configured to perform error correction, but three or more E
A CC circuit may be provided to divide all lines of the bus 12 into three groups and perform error detection and error correction for each group.

【0055】[0055]

【発明の効果】以上説明したように本発明によれば、障
害バスをスペアラインを用いてライン単位で代替するこ
とができるので、障害箇所の交換等の障害回復処置が施
されるまでの間も計算機システムを安定して動作させる
ことができ、バス多重化システムと同等の信頼性を有し
かつ安価な計算機システムを提供することができる。
As described above, according to the present invention, a faulty bus can be replaced on a line-by-line basis by using a spare line. Can operate the computer system stably, and can provide a computer system having the same reliability as the bus multiplexing system and being inexpensive.

【0056】また、本発明によれば、異なるバスサイク
ルにわたって複数の障害ラインが発生した場合に、それ
ぞれの障害ラインを別々のスペアラインで代替すること
ができるので、障害箇所の交換等の障害回復処置が施さ
れるまでの間も計算機システムを安定して動作させるこ
とができ、バス多重化システムよりも信頼性の点で優れ
しかも安価な計算機システムを提供することができる。
Further, according to the present invention, when a plurality of faulty lines occur in different bus cycles, each faulty line can be replaced with a different spare line, and thus fault recovery such as replacement of a faulty part can be performed. The computer system can be operated stably even before the treatment is performed, and a computer system that is superior in reliability and less expensive than the bus multiplexing system can be provided.

【0057】さらに、本発明によれば、バスに同時に複
数の障害ラインが発生した場合でも、それらの障害ライ
ンを複数のスペアラインで代替することができるので、
障害箇所の交換等の障害回復処置が施されるまでの間も
計算機システムを安定して動作させることができ、バス
多重化システムと同等の信頼性を有しかつ安価な計算機
システムを提供することができる。
Further, according to the present invention, even if a plurality of faulty lines occur simultaneously on the bus, these faulty lines can be replaced by a plurality of spare lines.
To provide a computer system that can operate a computer system stably even before a failure recovery procedure such as replacement of a failure point is performed, and has the same reliability and an inexpensive computer system as a bus multiplex system. Can be.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の第1の実施形態にかかる計算機システ
ムの構成を示す図である。
FIG. 1 is a diagram showing a configuration of a computer system according to a first embodiment of the present invention.

【図2】図1に示したモジュール内部のバストランシー
バおよびスペアバストランシーバの構成の詳細を示す図
である。
FIG. 2 is a diagram showing details of a configuration of a bus transceiver and a spare bus transceiver inside the module shown in FIG. 1;

【図3】図1に示したモジュール内部のバストランシー
バとバスとの接続を示す図である。
FIG. 3 is a diagram showing a connection between a bus transceiver and a bus in the module shown in FIG. 1;

【図4】本発明の第2の実施形態の計算機システムのモ
ジュール内部の構成を示す図である。
FIG. 4 is a diagram showing a configuration inside a module of a computer system according to a second embodiment of the present invention.

【図5】本発明の第3の実施形態の計算機システムのモ
ジュール内部の構成を示す図である。
FIG. 5 is a diagram showing a configuration inside a module of a computer system according to a third embodiment of the present invention.

【符号の説明】[Explanation of symbols]

1、2、…、n モジュール 12 バスライン 13 スペアバスライン 14 プロセッサ 15 メモリ 16 バスI/F 17 バストランシーバ 18 障害ライン情報レジスタ 19 スペアバストランシーバ 20 ECC回路 71 入力セレクタ 91 出力セレクタ 1, 2,..., N module 12 bus line 13 spare bus line 14 processor 15 memory 16 bus I / F 17 bus transceiver 18 fault line information register 19 spare bus transceiver 20 ECC circuit 71 input selector 91 output selector

Claims (6)

【特許請求の範囲】[Claims] 【請求項1】 複数のモジュールと、前記各モジュール
間を接続するバスと、前記バス内の障害ラインを代替す
るスペアラインとを有し、 前記モジュールは、 前記バス内の障害ラインを検出する障害検出手段と、 前記障害検出手段によって障害ラインが検出されたとき
該障害ラインの情報を全ての前記モジュールに通知する
障害通知手段と、 前記障害通知手段より通知された障害ライン情報に基づ
いて、前記検出された障害ラインを前記スペアラインに
切り替える切替手段とを具備することを特徴とする計算
機システム。
1. A module comprising: a plurality of modules; a bus connecting the modules; and a spare line replacing a faulty line in the bus, wherein the module detects a faulty line in the bus. Detecting means, when a fault line is detected by the fault detecting means, a fault notifying means for notifying the information of the fault line to all the modules, and based on the fault line information notified by the fault notifying means, Switching means for switching the detected faulty line to the spare line.
【請求項2】 複数のモジュールと、前記各モジュール
間を接続するバスと、前記バス内の障害ラインを代替す
る複数のスペアラインとを有し、 前記モジュールは、 前記バス内の障害ラインを検出する障害検出手段と、 前記障害検出手段によって障害ラインが検出されたとき
該障害ラインの情報を全ての前記モジュールに通知する
障害通知手段と、 前記障害通知手段により通知された障害ラインの情報を
複数蓄積可能な記憶手段と、 前記記憶手段により記憶された障害ライン情報に基づき
前記障害ラインを前記スペアラインに切り替える切替手
段とを具備することを特徴とする計算機システム。
2. A module comprising: a plurality of modules; a bus connecting the modules; and a plurality of spare lines replacing a faulty line in the bus, wherein the module detects a faulty line in the bus. A failure detection unit that notifies a failure line information to all the modules when a failure line is detected by the failure detection unit; and a plurality of failure line information notified by the failure notification unit. A computer system comprising: storage means capable of storing; and switching means for switching the faulty line to the spare line based on the faulty line information stored by the storage means.
【請求項3】 複数のモジュールと、前記各モジュール
間を接続するバスと、前記バス内の障害ラインを代替す
る複数のスペアラインとを有し、 前記モジュールは、前記バスを流れるデータのエラー検
出およびエラー訂正を前記バスを構成する複数のライン
群毎に交互に行うエラー検出訂正手段と、 前記エラー検出訂正手段によってあるライン群でエラー
が検出されたとき該エラーを起したラインの情報を全て
の前記モジュールに通知する障害通知手段と、 前記障害通知手段により通知されたエラーライン情報に
基づき前記エラーラインを前記スペアラインに切り替え
る切替手段とを具備することを特徴とする計算機システ
ム。
3. A module comprising: a plurality of modules; a bus connecting the modules; and a plurality of spare lines replacing a faulty line in the bus, wherein the module detects an error in data flowing through the bus. Error detection and correction means for alternately performing error correction for each of a plurality of line groups constituting the bus, and when an error is detected in a certain line group by the error detection and correction means, all information on the line that caused the error is obtained. A computer system comprising: a failure notifying unit that notifies the module of the above (1); and a switching unit that switches the error line to the spare line based on the error line information notified by the failure notifying unit.
【請求項4】 複数のモジュールと、前記各モジュール
間を接続するバスと、前記バス内の障害ラインを代替す
るスペアラインとを有する計算機システムのバス障害回
復方法において、 いずれかのモジュールで、前記バス内の障害ラインが検
出されたとき、該検出された障害ラインの情報を全ての
前記モジュールに通知し、全てのモジュールで、前記通
知された障害ライン情報に基づいて前記障害ラインを前
記スペアラインに切り替えることを特徴とする計算機シ
ステムのバス障害回復方法。
4. A bus failure recovery method for a computer system having a plurality of modules, a bus connecting between the modules, and a spare line replacing a failed line in the bus, wherein: When a faulty line in the bus is detected, the information of the detected faulty line is notified to all the modules, and all the modules replace the faulty line based on the notified faulty line information with the spare line. A method for recovering a bus failure of a computer system, characterized by switching to (1).
【請求項5】 複数のモジュールと、前記各モジュール
間を接続するバスと、前記バス内の障害ラインを代替す
る複数のスペアラインとを有する計算機システムのバス
障害回復方法において、 いずれかのモジュールで、前記バス内の障害ラインが検
出されたとき、該障害ラインの情報を全ての前記モジュ
ールに通知し、全てのモジュールでは、前記通知された
障害ラインの情報を一つ又は複数蓄積し、該蓄積された
一つ又は複数の障害ライン情報に基づき前記障害ライン
を前記スペアラインに切り替えることを特徴とする計算
機システムのバス障害回復方法。
5. A bus failure recovery method for a computer system having a plurality of modules, a bus connecting the modules, and a plurality of spare lines replacing a failed line in the bus. When a faulty line in the bus is detected, the information of the faulty line is notified to all the modules, and all the modules store one or more pieces of the information of the notified faulty line, and A bus failure recovery method for a computer system, wherein the failure line is switched to the spare line based on one or a plurality of pieces of failure line information obtained.
【請求項6】 複数のモジュールと、前記各モジュール
間を接続するバスと、前記バス内の障害ラインを代替す
る複数のスペアラインとを有する計算機システムのバス
障害回復方法において、 前記各モジュールはそれぞれ、前記バスを流れるデータ
のエラー検出およびエラー訂正を前記バスを構成する複
数のライン群毎に交互に行うエラー検出訂正手段を有
し、 いずれかのモジュールで、前記エラー検出訂正手段によ
ってあるライン群でエラーが検出されたとき該エラーを
起したラインの情報を全ての前記モジュールに通知し、
全てのモジュールでは、前記通知されたエラーライン情
報に基づき前記エラーラインを前記スペアラインに切り
替えることを特徴とする計算機システムのバス障害回復
方法。
6. A bus failure recovery method for a computer system having a plurality of modules, a bus connecting the modules, and a plurality of spare lines replacing a failed line in the bus, wherein each of the modules comprises: An error detection and correction means for alternately performing error detection and error correction of data flowing through the bus for each of a plurality of line groups constituting the bus; When an error is detected in, the information of the line that caused the error is notified to all the modules,
A bus failure recovery method for a computer system, wherein all modules switch the error line to the spare line based on the notified error line information.
JP11022810A 1999-01-29 1999-01-29 Computer system and bus fault recovering method Withdrawn JP2000222294A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11022810A JP2000222294A (en) 1999-01-29 1999-01-29 Computer system and bus fault recovering method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11022810A JP2000222294A (en) 1999-01-29 1999-01-29 Computer system and bus fault recovering method

Publications (1)

Publication Number Publication Date
JP2000222294A true JP2000222294A (en) 2000-08-11

Family

ID=12093059

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11022810A Withdrawn JP2000222294A (en) 1999-01-29 1999-01-29 Computer system and bus fault recovering method

Country Status (1)

Country Link
JP (1) JP2000222294A (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7073088B2 (en) * 2001-11-29 2006-07-04 Samsung Electronics Co., Ltd. Data bus arrangement and control method for efficiently compensating for faulty signal lines
WO2010000625A1 (en) * 2008-07-01 2010-01-07 International Business Machines Corporation Microprocessor interface with dynamic segment sparing and repair
US7761753B2 (en) 2003-06-05 2010-07-20 Intel Corporation Memory channel with bit lane fail-over
US8516338B2 (en) 2008-07-01 2013-08-20 International Business Machines Corporation Error correcting code protected quasi-static bit communication on a high-speed bus
CN110134631A (en) * 2019-05-09 2019-08-16 中国航空工业集团公司西安航空计算技术研究所 A kind of self- recoverage spi bus communication interface and its self-recovery method

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7073088B2 (en) * 2001-11-29 2006-07-04 Samsung Electronics Co., Ltd. Data bus arrangement and control method for efficiently compensating for faulty signal lines
US7761753B2 (en) 2003-06-05 2010-07-20 Intel Corporation Memory channel with bit lane fail-over
US8020056B2 (en) 2003-06-05 2011-09-13 Intel Corporation Memory channel with bit lane fail-over
US8135999B2 (en) 2003-06-05 2012-03-13 Intel Corporation Disabling outbound drivers for a last memory buffer on a memory channel
US8286039B2 (en) 2003-06-05 2012-10-09 Intel Corporation Disabling outbound drivers for a last memory buffer on a memory channel
US8510612B2 (en) 2003-06-05 2013-08-13 Intel Corporation Disabling outbound drivers for a last memory buffer on a memory channel
WO2010000625A1 (en) * 2008-07-01 2010-01-07 International Business Machines Corporation Microprocessor interface with dynamic segment sparing and repair
US8516338B2 (en) 2008-07-01 2013-08-20 International Business Machines Corporation Error correcting code protected quasi-static bit communication on a high-speed bus
CN110134631A (en) * 2019-05-09 2019-08-16 中国航空工业集团公司西安航空计算技术研究所 A kind of self- recoverage spi bus communication interface and its self-recovery method
CN110134631B (en) * 2019-05-09 2023-05-23 中国航空工业集团公司西安航空计算技术研究所 Self-recovery SPI bus communication interface and self-recovery method thereof

Similar Documents

Publication Publication Date Title
US5134619A (en) Failure-tolerant mass storage system
US4541094A (en) Self-checking computer circuitry
US7331010B2 (en) System, method and storage medium for providing fault detection and correction in a memory subsystem
US5452429A (en) Error correction code on add-on cards for writing portions of data words
US9009556B2 (en) Error correction and recovery in chained memory architectures
KR100878550B1 (en) Memory controller and method of controlling memory
US6442726B1 (en) Error recognition in a storage system
JPH054699B2 (en)
US6985482B2 (en) Cross-bar switch system with redundancy
US7073088B2 (en) Data bus arrangement and control method for efficiently compensating for faulty signal lines
JP2000222294A (en) Computer system and bus fault recovering method
US7392445B2 (en) Autonomic bus reconfiguration for fault conditions
JPH10312340A (en) Error detection and correction system of semiconductor storage device
US6539504B1 (en) Memory system having error monitoring apparatus for multi-bit errors
US6880119B1 (en) Method for supervising parallel processes
JP3156654B2 (en) Duplex computer system and its operation method
JP2000066962A (en) Storage device
JPH10143445A (en) Satellite line connector
JPS61243549A (en) Error detecting and correcting system
JPH01106247A (en) Memory card
US20090119423A1 (en) Transfer control device, LSI, and LSI package
JP4067945B2 (en) Semiconductor integrated circuit, memory control device
CN114064527A (en) Storage device without single failure point
JPS62114054A (en) Data transfer device
JPH10254842A (en) Parallel processor

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20060404