JPH0469747A - Arithmetic processor - Google Patents

Arithmetic processor

Info

Publication number
JPH0469747A
JPH0469747A JP2183006A JP18300690A JPH0469747A JP H0469747 A JPH0469747 A JP H0469747A JP 2183006 A JP2183006 A JP 2183006A JP 18300690 A JP18300690 A JP 18300690A JP H0469747 A JPH0469747 A JP H0469747A
Authority
JP
Japan
Prior art keywords
cache
error signal
caches
bus error
fault
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2183006A
Other languages
Japanese (ja)
Inventor
Fumiaki Ishibashi
石橋 文明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2183006A priority Critical patent/JPH0469747A/en
Publication of JPH0469747A publication Critical patent/JPH0469747A/en
Pending legal-status Critical Current

Links

Landscapes

  • Hardware Redundancy (AREA)
  • Debugging And Monitoring (AREA)
  • Multi Processors (AREA)
  • Memory System Of A Hierarchy Structure (AREA)
  • Techniques For Improving Reliability Of Storages (AREA)

Abstract

PURPOSE:To lower the generation probability of a restart processing caused by a comparison fault or a majority fault by requesting the reissue of an instruction, in the case of an error, etc., are detected by at least one piece of cache, and also, informing all caches of the generation of a fault and making cache data of the corresponding address invalid. CONSTITUTION:When a cache 21 generates a cache fault by a read-out operation, the cache 21 sets a cache error signal 111 to '1'. Subsequently, an OR circuit 40 generates a bus error signal 113, and distributes its signal to processors 10-12 and caches 20-22, respectively. When a bus error signal 113 is informed, the processors 10-12 suspend receiving the data sent through signal lines 130-132, and also, request a re-read-out operation of an instruction or data issued immediately before an input of the bus error signal 113 to the respective caches 20-22 through the signal lines 130-132. In such a way, the generation probability of a restart processing operation caused by a comparison or majority fault becomes low.

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は複数個の演算処理部の処理結果を比較または多
数決確認を行なう回路を有する演算処理装置に関し、特
にキャッシュく読み出し)障害処理手段を有する演算処
理装置に関する。
[Detailed Description of the Invention] [Field of Industrial Application] The present invention relates to an arithmetic processing device having a circuit for comparing the processing results of a plurality of arithmetic processing units or for confirming majority decision, and in particular, it relates to an arithmetic processing device having a circuit for comparing processing results of a plurality of arithmetic processing units or for confirming a majority decision, and in particular, it relates to an arithmetic processing device having a circuit for comparing the processing results of a plurality of arithmetic processing units or for confirming a majority decision, and in particular for an arithmetic processing device having a circuit for comparing the processing results of a plurality of arithmetic processing units or for confirming a majority decision. The present invention relates to an arithmetic processing device having the present invention.

〔従来の技術〕[Conventional technology]

従来この種の演算処理装置は、1個のマイクロプロセッ
サと1個のキャッシュとを1組とする複数の演算部と、
各々の演算部の処理結果を相互に比較または多数決確認
を行なう多数決回路とを有している。演算部は各々独立
に動作しており、1組の演算部にキャッシュ障害が発生
しても、その演算部はキャッシュをバイパスして主記憶
装置に読み出しのアクセスをする。そして、キャッシュ
障害の発生した演算部の動作は他演算部とは同期せず、
比較または多数決回路で処理結果の不一致か検出され、
キャッシュ障害は比較障害または多数決障害として扱わ
れていた。
Conventionally, this type of arithmetic processing device has a plurality of arithmetic units each including one microprocessor and one cache;
It has a majority circuit that compares the processing results of the respective arithmetic units with each other or confirms the majority decision. Each of the arithmetic units operates independently, and even if a cache failure occurs in one set of arithmetic units, that arithmetic unit bypasses the cache and accesses the main storage device for reading. Then, the operation of the calculation unit where the cache failure occurred is not synchronized with other calculation units,
A comparison or majority circuit detects whether there is a discrepancy in the processing results,
Cache failures were treated as comparison failures or majority failures.

この演算処理装置は、比較障害の時には全ての演算部を
直ちにリセットし、その後、再開処理を行う。また、多
数決障害の時は、処理が空いた時に正常なプロセッサの
内部情報を主記憶装置に退避し、全演算部(プロセッサ
及びキャッシュ)をリセットする。そして、退避した正
常なプロセッサの内部情報を各々の演算部にセットした
後、処理の再開を行っていた。
This arithmetic processing device immediately resets all arithmetic units when a comparison failure occurs, and then performs restart processing. Furthermore, in the event of a majority vote failure, the internal information of the normal processor is saved to the main memory when processing is idle, and all arithmetic units (processor and cache) are reset. Then, after setting the saved internal information of the normal processor in each calculation unit, processing was restarted.

〔発明が解決しようとする課題〕[Problem to be solved by the invention]

上述した従来の演算処理装置は、キャッシュ障害が発生
すると、比較または多数決障害として取り扱われていた
。この結果、再開処理動作の発生確率が高く、且つ再開
処理実行時間が無視できないなめ、この演算処理装置を
使用したシステムの効果的な運用に多大な影響を与える
と云う欠点かあった。
In the conventional arithmetic processing device described above, when a cache failure occurs, it is treated as a comparison or majority failure. As a result, the probability of occurrence of the restart processing operation is high, and the execution time of the restart processing cannot be ignored, which has the drawback of greatly affecting the effective operation of a system using this arithmetic processing device.

〔課題を解決するための手段〕[Means to solve the problem]

本発明の演算処理装置は、1個のマイクロプロセッサと
1個のキャッシュとを1組とする複数の演算部と、前記
演算部の処理結果を相互に比較または多数決確認を行な
う回路とを有する演算処理装置において、読み出し障害
を検出するとキャッシュエラー信号を送出する手段とバ
スエラー信号の入力により前記バスエラー信号の入力す
る直前のメモリアクセス命令によって処理されたキャッ
シュデイレクトす」二のキャッシュデータ有効ヒツトを
無効とする手段とを含むキャッシュと、前記複数のキャ
ッシュと接続され前記キャッシュエラー信号の論理和で
ある前記バスエラー信号を作成するパスエラー信号作成
手段と、前記バスエラー信号の入力により前記メモリア
クセス命令の再実行を前記キャッシュに要求する手段を
含むマイクロプロセッサとを含んでいる。
The arithmetic processing device of the present invention has a plurality of arithmetic units each including one microprocessor and one cache, and a circuit that mutually compares the processing results of the arithmetic units or performs majority decision confirmation. In the processing device, means for transmitting a cache error signal when a read failure is detected; path error signal generating means connected to the plurality of caches and generating the bus error signal which is the logical sum of the cache error signals; and a microprocessor including means for requesting the cache to re-execute the access instruction.

〔実施例〕〔Example〕

次に、本発明について図面を参照して説明する。 Next, the present invention will be explained with reference to the drawings.

第1図は本発明の1.実施例のブロック図である。演算
処理装置1は、バス100を介して主記憶装置2と接続
される。演算処理装置1は、3個のプロセッサ10.1
1及び12と、3個のキャッシュ20,2]及び22と
、多数決回路3oとを含んでいる。プロセッサ10とキ
ャッシュ20、プロセッサ11とキャッシュ21.プロ
セッサ12とキャッシュ22が、それぞれ信号線130
.131又は]32によって接続され、3組の演算部を
構成している。キャッシュ201キヤツシユ21及びキ
ャッシュ22は、各々信号線1.20.1.21又は1
22によって多数決回路30に接続される。演算処理装
置1に含まれるOR回路40は、キャッシュ20.キャ
ッシュ21及びキャッシュ22から出力されるキャッシ
ュエラー信号110,111又は112を、各々接続さ
れている信号線から入力する。またキャッシュエラー信
号1.10,111及び112の論理和であるバスエラ
ー信号113を、プロセッサ10.11及び12.キャ
ッシュ20.21及び22に、各々接続されている信号
線により分配する。
FIG. 1 shows 1 of the present invention. FIG. 2 is a block diagram of an embodiment. Arithmetic processing device 1 is connected to main storage device 2 via bus 100 . The arithmetic processing unit 1 includes three processors 10.1
1 and 12, three caches 20, 2] and 22, and a majority circuit 3o. Processor 10 and cache 20, processor 11 and cache 21. Processor 12 and cache 22 each have a signal line 130
.. 131 or ] 32, and constitute three sets of arithmetic units. Cache 201 cache 21 and cache 22 are connected to signal line 1.20.1.21 or 1, respectively.
22 to the majority circuit 30. The OR circuit 40 included in the arithmetic processing device 1 has a cache 20 . Cache error signals 110, 111, or 112 output from the cache 21 and the cache 22 are inputted from respective connected signal lines. Furthermore, the bus error signal 113, which is the logical sum of the cache error signals 1.10, 111, and 112, is applied to the processors 10.11 and 12. It is distributed to caches 20, 21 and 22 by signal lines connected to each cache.

次に、本発明の動作を詳細に説明する。プロセッサ1.
O,1,1及び12は同期して動作する。そして、命令
またははデータ読み出し命令を、信号線1.30,1.
31又は132を介してそれぞれ接続されているキャッ
シュ20.21及び22に同時に発行すると、キャッシ
ュ20.21及び22は各々キャッシュディレクトリを
調べる。そして、対応するアドレスのデータがキャッシ
ュに有れはキャッシュを読み呂し、信号線130,13
1又は132を介しプロセッサ10.11及び12にデ
ータを渡す。
Next, the operation of the present invention will be explained in detail. Processor 1.
O,1,1 and 12 operate synchronously. Then, the command or data read command is transmitted to the signal lines 1.30, 1.
When issuing simultaneously to caches 20.21 and 22, which are connected via 31 or 132, respectively, caches 20.21 and 22 each consult the cache directory. If the data of the corresponding address is in the cache, the cache is read and the signal lines 130 and 13 are read.
1 or 132 to processors 10.11 and 12.

この様な動作において、例えばキャッシュ21が読み出
し動作でキャッシュ障害を発生ずると、キャッシュ21
はキャッシュエラー信号111を′1゛にする。そして
OR回路40はバスエラー信号113を発生し、その信
号をプロセッサ10.11及び12と、キャッシュ20
.21及び22に各々分配する。
In such an operation, if a cache failure occurs in the cache 21 during a read operation, for example, the cache 21
sets the cache error signal 111 to '1'. The OR circuit 40 then generates a bus error signal 113 and sends the signal to the processors 10, 11 and 12 and the cache 20.
.. 21 and 22, respectively.

プロセッサ10.11及び12は、バスエラー信号11
83が通知されると、信号線1.30,131又は13
2を介して送られて来たデータの受取を中止し、かつ、
バスエラー信号113の入力の直前に発行した命令また
はデータの再読み出し動作を信号線130.1.31又
は]32を介してそれぞれのキャッシュ20.21及び
22に要求する。
Processors 10.11 and 12 output bus error signal 11
When 83 is notified, signal line 1.30, 131 or 13
2. Stop receiving data sent via 2, and
A request is made to each of the caches 20.21 and 22 via the signal line 130.1.31 or ]32 to reread the instruction or data issued immediately before the input of the bus error signal 113.

一方、キャッシュ20.21及び22は、バスエラー信
号113が通知されると、その通知の入力直前に出され
た読み出し動作のアドレスに対応したキャッシュディレ
クトリ」二のキャッシュデータ有効ビットを各々パ○′
″にリセットする。このとき、プロセッサ1.0,1.
1及び]2からキャッシュ20.21及び22に、再度
、命令またはデータの読み出し動作要求か来ると、対応
するアドレスのキャッシュブイレフ1へり」二の有効ビ
ットが“′0′′にリセットされているため、キャッシ
ュミスヒツトとなる。そして、キャッシュ20,21及
び22は、読み出し命令を信号線120,121又は1
22を介し多数決回路30に供給する。多数決回路30
は、キャッシュ20.21及び22より送られて来た読
み出し命令の内容に対し、三重多数決判定動作を行い、
正常に演算処理装置が動作していることを確認する。
On the other hand, when the caches 20, 21 and 22 are notified of the bus error signal 113, the cache data valid bits of the cache directories ``2'' corresponding to the address of the read operation issued immediately before the input of the notification are respectively programmed.
". At this time, processors 1.0, 1.
When an instruction or data read operation request comes from the caches 20, 21 and 22 again from the caches 20, 21 and 22, the valid bit of the cache register 1 and 2 at the corresponding address is reset to ``0''. Therefore, a cache miss occurs.Then, the caches 20, 21 and 22 transmit the read command to the signal lines 120, 121 or 1.
22 to the majority circuit 30. Majority circuit 30
performs a triple majority decision operation on the contents of the read commands sent from the caches 20, 21 and 22,
Check that the processing unit is operating normally.

そして多数決回路30は、主記憶読み出し命令をバス1
00を介し主記憶装置2に転送する。主記憶装置2は、
送られて来た主記憶読み出し命令に対応した主記憶アド
レス」二のデータを読み出す。そして、バス100を介
し多数決回路3o、更にキャッシュ20.21及び22
を経由し、プロセッサ10.11及び]2に各々その読
み出されたデータを送る。同時にキャッシュ20.21
及び22は、主記憶装置2から読み出されたデータを対
応するキャッシュのエリアに格納し、かつ対応するキャ
ッシュディレクトリ上にアドレス情報とキャッシュデー
タ有効ピッ1〜” 1 ”をセットする。
Then, the majority circuit 30 sends the main memory read command to bus 1.
00 to the main storage device 2. The main storage device 2 is
Reads the data at main memory address "2" corresponding to the main memory read command sent. The majority circuit 3o is connected via the bus 100 to the caches 20, 21 and 22.
The read data is sent to the processors 10, 11 and ]2, respectively. Simultaneously cache 20.21
and 22 stores the data read from the main storage device 2 in the corresponding cache area, and sets address information and cache data valid pins 1 to "1" on the corresponding cache directory.

尚、本実施例では説明を簡単にするため、プロセッサを
3台用いた三重多数決方式の演算処理装置を説明したが
本発明はこれに限定されず、またプロセッサを2台用い
た比較回路方式においても同様にこの発明を実現できる
ことは云うまでもない。
In this embodiment, in order to simplify the explanation, an arithmetic processing device using a triple majority voting method using three processors has been described, but the present invention is not limited to this, and may also be applied to a comparator circuit method using two processors. It goes without saying that this invention can be realized in the same way.

〔発明の効果〕〔Effect of the invention〕

以上説明したように本発明は、プロセッサとキャッシュ
を組とする演算部を複数個構成し、同期して比較または
多数決動作を行なう演算処理装置において、複数個のキ
ャッシュの同時読み出しを行なう動作の場合に、少なく
とも]個のキャッシュにエラー等が生じた時に、演算部
間の同期が取れなくなるのを防止することができる。即
ち、少なくとも1個のキャッシュでエラー等が検出され
た場合、そのキャッシュは障害を検出した事を全プロセ
ッサに通知して命令の再発行を要求し、且つ、全キャッ
シュに対し障害が発生したことを通知して対応するアド
レスのキャッシュデータを無効にする。その結果、複数
個の演算部会てに対し動作の同期が可能となり、比較障
害または多数決障害による再開処理の発生確率が低下し
、この演算装置を使用するシステムを有効に運用できる
と云う効果がある。
As explained above, the present invention is applicable to an operation in which simultaneous reading of multiple caches is performed in an arithmetic processing device that includes a plurality of arithmetic units each consisting of a processor and a cache and performs a synchronous comparison or majority decision operation. Furthermore, when an error or the like occurs in at least ] caches, it is possible to prevent the arithmetic units from becoming out of synchronization. In other words, if an error or the like is detected in at least one cache, that cache notifies all processors that a failure has been detected and requests reissue of instructions, and also indicates that the failure has occurred in all caches. notification and invalidate the cache data for the corresponding address. As a result, it becomes possible to synchronize the operations of multiple computing subcommittees, reducing the probability of restart processing due to comparison failure or majority vote failure, and allowing effective operation of the system using this computing device. .

第1図は本発明による一実施例のブロック図である。FIG. 1 is a block diagram of one embodiment according to the present invention.

1・・・演算処理装置、2・・・主記憶装置、10〜1
2・・・プロセッサ、20〜22・・・キャッシュ、3
0・・・多数決回路、40・・・OR回路、100・・
・バス、110〜112・・・キャッシュエラー信号、
]13・・・バスエラー信号、1.20〜1.22,1
.30〜132・・・信号線。
1... Arithmetic processing unit, 2... Main storage device, 10-1
2... Processor, 20-22... Cache, 3
0...Majority circuit, 40...OR circuit, 100...
・Bus, 110-112...cache error signal,
]13... Bus error signal, 1.20 to 1.22, 1
.. 30-132...Signal line.

Claims (1)

【特許請求の範囲】[Claims] 1個のマイクロプロセッサと1個のキャッシュとを1組
とする複数の演算部と、前記演算部の処理結果を相互に
比較または多数決確認を行なう回路とを有する演算処理
装置において、読み出し障害を検出するとキャッシュエ
ラー信号を送出する手段とバスエラー信号の入力により
前記バスエラー信号の入力する直前のメモリアクセス命
令によって処理されたキャッシュディレクトリ上のキャ
ッシュデータ有効ビットを無効とする手段とを含むキャ
ッシュと、前記複数のキャッシュと接続され前記キャッ
シュエラー信号の論理和である前記バスエラー信号を作
成するバスエラー信号作成手段と、前記バスエラー信号
の入力により前記メモリアクセス命令の再実行を前記キ
ャッシュに要求する手段を含むマイクロプロセッサとを
含むことを特徴とする演算処理装置。
Detecting a read failure in an arithmetic processing device having a plurality of arithmetic units each including one microprocessor and one cache, and a circuit that mutually compares processing results of the arithmetic units or performs majority decision confirmation. Then, a cache including means for sending a cache error signal and means for invalidating a cache data valid bit on a cache directory processed by a memory access instruction immediately before the input of the bus error signal by inputting the bus error signal; bus error signal generating means connected to the plurality of caches and generating the bus error signal that is a logical sum of the cache error signals; and requesting the cache to re-execute the memory access instruction upon input of the bus error signal. and a microprocessor including means.
JP2183006A 1990-07-11 1990-07-11 Arithmetic processor Pending JPH0469747A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2183006A JPH0469747A (en) 1990-07-11 1990-07-11 Arithmetic processor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2183006A JPH0469747A (en) 1990-07-11 1990-07-11 Arithmetic processor

Publications (1)

Publication Number Publication Date
JPH0469747A true JPH0469747A (en) 1992-03-04

Family

ID=16128100

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2183006A Pending JPH0469747A (en) 1990-07-11 1990-07-11 Arithmetic processor

Country Status (1)

Country Link
JP (1) JPH0469747A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008046701A (en) * 2006-08-11 2008-02-28 Nec Computertechno Ltd Multiprocessor system, and method for operating same

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008046701A (en) * 2006-08-11 2008-02-28 Nec Computertechno Ltd Multiprocessor system, and method for operating same

Similar Documents

Publication Publication Date Title
CA1306546C (en) Dual zone, fault tolerant computer system with error checking on i/o writes
JP2641819B2 (en) Cache controller, fault tolerant computer and data transfer method thereof
US5249187A (en) Dual rail processors with error checking on I/O reads
US4916704A (en) Interface of non-fault tolerant components to fault tolerant system
US6449699B2 (en) Apparatus and method for partitioned memory protection in cache coherent symmetric multiprocessor systems
US4907228A (en) Dual-rail processor with error checking at single rail interfaces
CA1311849C (en) Fault tolerant computer system with fault isolation and repair
US5495570A (en) Mirrored memory multi-processor system
WO1995034860A1 (en) Main memory system and checkpointing protocol for fault-tolerant computer system
JPH04213136A (en) Updating system for reference bit and change bit
JP3129224B2 (en) Cache memory device
KR0153487B1 (en) System and method for communicating between devices
JPH0469747A (en) Arithmetic processor
JP3187446B2 (en) Cache memory controller
JP2937857B2 (en) Lock flag release method and method for common storage
JP3141948B2 (en) Computer system
JP2000187652A (en) Multi-processor system
JPH05265790A (en) Microprocessor device
JP3226557B2 (en) Multiprocessor system
JP3219422B2 (en) Cache memory control method
JP2583617B2 (en) Multiprocessor system
KR930003991B1 (en) Bus snooper for controlling cache memory
JPH0934741A (en) Memory copying system
JPH06124242A (en) Duplex shared memory equivalency guarantee system
JPH02277142A (en) Duplex computer system