JPS63213048A - マルチプロセツサシステムの障害処理方式 - Google Patents

マルチプロセツサシステムの障害処理方式

Info

Publication number
JPS63213048A
JPS63213048A JP62044079A JP4407987A JPS63213048A JP S63213048 A JPS63213048 A JP S63213048A JP 62044079 A JP62044079 A JP 62044079A JP 4407987 A JP4407987 A JP 4407987A JP S63213048 A JPS63213048 A JP S63213048A
Authority
JP
Japan
Prior art keywords
cache memory
memory
fault
dgp3
contents
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP62044079A
Other languages
English (en)
Other versions
JPH0690682B2 (ja
Inventor
Tatsuro Hashiguchi
橋口 達郎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP62044079A priority Critical patent/JPH0690682B2/ja
Priority to US07/160,757 priority patent/US4920479A/en
Publication of JPS63213048A publication Critical patent/JPS63213048A/ja
Publication of JPH0690682B2 publication Critical patent/JPH0690682B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/1666Error detection or correction of the data by redundancy in hardware where the redundant component is memory or memory area
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2017Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where memory access, memory control or I/O control functionality is redundant
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11CSTATIC STORES
    • G11C29/00Checking stores for correct operation ; Subsequent repair; Testing stores during standby or offline operation
    • G11C29/70Masking faults in memories by using spares or by reconfiguring
    • G11C29/88Masking faults in memories by using spares or by reconfiguring with partially good memories
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Hardware Redundancy (AREA)
  • Techniques For Improving Reliability Of Storages (AREA)
  • Debugging And Monitoring (AREA)
  • Multi Processors (AREA)
  • Memory System Of A Hierarchy Structure (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、マルチプロセッサシステムの情報処理装置に
関し、特にストアイン方式のキャッシュメモリを有する
メモリ制御装置の障害処理方式に関する。
〔従来の技術〕
ストアイン方式とは従来周知の技術であシ、簡略に説明
すると、主記憶装置の内容とキャッジ−メモリの内容が
通常は異っているもので、新たに主記憶装置の内容を必
要としキャッシュメモリに空き領域がないときにキャノ
ン−メモリの内容が主記憶装置に戻されるというもので
ある。従来。
この種のメモリ制御装置においては、キャッジ−メモリ
がストアイン方式を採用している場合、該メモリ制御装
置に障害が発生した場合、キャッシュメモリの内容を主
記憶装置に書き戻す手段が力かった。
〔発明が解決しようとする問題点〕
上述した従来のメモリ制御装置は、メモリ制御装置に障
害が発生した場合にキャッシュメモリの内容を主記憶装
置に書き戻す手段がないため、メモリ制御装置のキャッ
ジ−メモリ部以外に障害が発生しても、つまシキャッシ
ーメモリの内容が保証されていても、その内容を主記憶
装置に戻しかつ該メモリ制御装置を切離してシステムの
動作の続行が出きす、システムが停止してしまうという
欠点があった。
〔問題点を解決するだめの手段〕
本発明によるマルチプロセッサシステムの障害ン方式の
キャッシュメモリを有するメモリ制御装置と、前記各装
置と診断インタフェースを介して接続され、前記各装置
の障害発生時の救済を行う障害処理装置とから構成され
る情報処理システムf:2つ有し、各々前記メモリ制御
装置、障害処理装置間で接続されるマルチプロセッサシ
ステムにおいて、前記キャッシュメモリの内容を前記障
害処理装置が前記診断インタフェースを介して読み出し
可能とするキャッシュメモリ読み出し手段と。
前記障害処理装置から前記診断インタフェースを介して
キャッシュメモリを書き換え可能とするキャッシュメモ
リ書き込み手段と、前記2つの障害処理装置間でデータ
転送を可能とする障害処理装置間通信手段とを有し、前
記メモリ制御装置に障害が発生した場合に前記キャッシ
ュメモリの内容を障害処理装置から取り出し、他系障害
処理装置を経由して、他系の前記メモリ制御装置の前記
キャッシュメモリに転送することを可能とする。
〔実施例〕
次に本発明の実施例について図面を参照して説明する。
第1図は本発明の一実施例の構成を示すブロック図であ
る。
主記憶装置(MEM) 1−1 、1−2は1通常はメ
モリ制御装置(MCU)2−1.2−2とそれぞれ接続
されるが、故障等によりMCUの1台が使用不可能な場
合には、1台のMCUに2台のMEMを図中の1点鎖線
によシ接続することが可能である。
キャッシュメモリは、キャッシュメモリアドレス部10
−1.10−2とキャッシュメモリデータ部11−1.
11−2とから構成され、演算処理装置(EPU ) 
4−1 、4.−2又は入出力処理装置(図示しない)
等の主記憶アクセスのデータバッファとして使用される
。障害処理装置(DGP)3−1゜3−2は、各装置の
障害救済処理、障害情報収集処理等を行う。
次に動作について説明する。
■Ml−1.1−2とMCU2−1.2−2は第1図の
実線で示すように接続されているものとし。
この状態のときEPU 4−1がMEM 1−1からデ
ー(s) りを読み出し又はMEM 1−1へデータを書き込む場
合はキャッジ−メモリデータ部11−1を。
MEM 1−2からデータを読み出し又はMEM 1−
2へデータを書き込む場合はキャッシュメモリデータ部
11−2をそれぞれ使用する。このとき、読み出しでキ
ャッジ−メモリがヒツトしなかった場合、キャッシュメ
モリデータ部11−1であれば。
MFEM 1−1からデータがある単位でキャッシュメ
モリデータ部11−1に読み込まれるが、それに先立ち
該当するキャッジ−メモリデータ部11−1の内容がM
EM 11−1に書き戻される。このようにして通常の
動作が行われる。従って、キャッシュメモリデータ部1
1−1はMEM 1−1のデータバッファとしてキャッ
シュメモリデータ部11−2はyfEM 1−2のデー
タバッファとして使用される。
一 次にこの状態でMCU 7k −1のキャッシュメモリ
を除く部分に障害が発生した場合について示す。
MCU 、f −1に′障害が発生すると、 DGP 
3−1にその旨が通知される。DGP 3−1はキャッ
ジ−メモリの内容が保証できることを確認した後、シス
テムを一次停止してキャッシュメモリアドレス部10−
1及びキャッシュメモリデータ部11−1を順次読み出
し、 DGP 3−1とDGP 3−2間の通信手段に
よシデーク転送を行う。DGP 3−2は、データの受
信を行うと、そのデータを相対するキャッジ−メモリア
ドレス部10−2及びキャッシュメモリデータ部11−
2に書き込みを行う。DGP 3−2はこのキャッジ−
メモリの書き込みに先立ちキャッシュメモリデータ部1
1−2のMEM 1−2へのスワップアウト(はき出し
)を通常のスワップアウト回路を使用して行う。
以上のようにしてキャッシュメモリデータ部11−2の
内容はMEM 172へ書き戻され又キャッシュメモリ
データ部11−1の内容はキャッシュメモリ11−2へ
移される。その後に、 DGP 3−2は。
MEM 1−1をMCU 2−2へ接続替えを行う(図
中一点鎖線で示すインタフェースを有効とする)。
これはインタフェース有効、無効フラグを切替えること
により論理的に行わする。以後システムの動作を再開す
る。
次に前述したキャッシュメモリの読み出し及び書き込み
について第2図を使用して説明する。
キャッジ−メモリの読み出し及び書き込みは。
障害が発生した状態で行うため、少量の回路によシ実現
する必要がある。
第2図は一般的に図示したランダムアクセスメモリ(R
AM )の読み出し方法を示した図である。
RAM 20は、書き込みアドレスレジスタ21及び書
き込みデータレジスタ22及び読み出しデータレジスタ
23を備えている。尚9以上の各レジスタは、フリツノ
フロッゾ単位でチェインを構成し。
DGP 3からのデータのスキャンイン、スキャンアウ
ト動作が可能である。今、 RAM 20の内容の読み
出しを行おうとする場合、書き込みアドレスレジスタ2
1にRAM 20の所望のアドレスが入るようにスキャ
ンイン動作を行い1次に読み出しデータレジスタ23に
クロックを1つ発行することによシ、所望のデータがセ
ットされる。この読み出しデータレジスタ23の内容は
スキャンアウト動作を行うことにより取り出される。
〔発明の効果〕
以上説明したように本発明は障害の発生したMCUのキ
ャッシュメモリの内容を正常なMCUへ移送することを
可能とすることによシ、主記憶装置の内容が継続的に保
証でき、システム停止となることを回避できるという効
果がある。又1周知の技術であるプロセッサリリーフ機
能と併用することも可能である。この場合は、障害の発
生したMCU配下のEPUで実行していたジョブのアポ
ート(異常終了)も回避できる。
【図面の簡単な説明】
第1図は本発明の一実施例の構成を示すブロック図、第
2図はキャッシュメモリの書き込み、読み出しを行うだ
めの回路構成図である。 1−1 、1−2・・・主記憶装置(MEM) 、 2
−1 。 2−2・・・メモリ制御装置(MCU) 、 3−1 
、3−2・・・障害処理装置(DGP) 、 4.−1
 、4.−2・・・演算処理装置(EPU)、10−1
.10−2・・・キャッシュメモリアドレス部、11−
1.11−2・・・キャッシュメモリデータ部。 第1図 1−=主iim装置 (MEM)    2−一一メモ
lJ制mlla(MCL/)3− 障害処理装置(DG
P)   4−  演算処理表置(EPU)+0−m−
キャッシュメモリアドレスg15   1i−%ヤッシ
ュメLリテ一タ自6第2図

Claims (1)

    【特許請求の範囲】
  1. 1、主記憶装置と、複数の演算処理装置及び複数の入出
    力処理装置と接続されかつストアイン方式のキャッシュ
    メモリを有するメモリ制御装置と、前記各装置と診断イ
    ンタフェースを介して接続され、前記各装置の障害発生
    時の救済を行う障害処理装置とから構成される情報処理
    システムを2つ有し、各々前記メモリ制御装置、障害処
    理装置間で接続されるマルチプロセッサシステムにおい
    て、前記キャッシュメモリの内容を前記障害処理装置が
    前記診断インタフェースを介して読み出し可能とするキ
    ャッシュメモリ読み出し手段と、前記障害処理装置から
    前記診断インタフェースを介してキャッシュメモリを書
    き換え可能とするキャッシュメモリ書き込み手段と、前
    記2つの障害処理装置間でデータ転送を可能とする障害
    処理装置間通信手段とを有し、前記メモリ制御装置に障
    害が発生した場合に前記キャシュメモリの内容を障害処
    理装置から取り出し、他系障害処理装置を経由して、他
    系の前記メモリ制御装置の前記キャッシュメモリに転送
    することを可能とするマルチプロセッサシステムの障害
    処理方式。
JP62044079A 1987-02-28 1987-02-28 マルチプロセツサシステムの障害処理方式 Expired - Lifetime JPH0690682B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP62044079A JPH0690682B2 (ja) 1987-02-28 1987-02-28 マルチプロセツサシステムの障害処理方式
US07/160,757 US4920479A (en) 1987-02-28 1988-02-26 Multiprocessor system with storage control units including buffer storage units comprising an error recovery system for storage control units

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62044079A JPH0690682B2 (ja) 1987-02-28 1987-02-28 マルチプロセツサシステムの障害処理方式

Publications (2)

Publication Number Publication Date
JPS63213048A true JPS63213048A (ja) 1988-09-05
JPH0690682B2 JPH0690682B2 (ja) 1994-11-14

Family

ID=12681615

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62044079A Expired - Lifetime JPH0690682B2 (ja) 1987-02-28 1987-02-28 マルチプロセツサシステムの障害処理方式

Country Status (2)

Country Link
US (1) US4920479A (ja)
JP (1) JPH0690682B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012083992A (ja) * 2010-10-13 2012-04-26 Nec Computertechno Ltd データ障害処理装置、及びデータ障害処理方法
JP2013020566A (ja) * 2011-07-14 2013-01-31 Nec Commun Syst Ltd 二重化情報処理システム

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5185877A (en) * 1987-09-04 1993-02-09 Digital Equipment Corporation Protocol for transfer of DMA data
US5068851A (en) * 1989-08-01 1991-11-26 Digital Equipment Corporation Apparatus and method for documenting faults in computing modules
US5251227A (en) * 1989-08-01 1993-10-05 Digital Equipment Corporation Targeted resets in a data processor including a trace memory to store transactions
US5068780A (en) * 1989-08-01 1991-11-26 Digital Equipment Corporation Method and apparatus for controlling initiation of bootstrap loading of an operating system in a computer system having first and second discrete computing zones
US5153881A (en) * 1989-08-01 1992-10-06 Digital Equipment Corporation Method of handling errors in software
US5163138A (en) * 1989-08-01 1992-11-10 Digital Equipment Corporation Protocol for read write transfers via switching logic by transmitting and retransmitting an address
US5068852A (en) * 1989-11-23 1991-11-26 John Fluke Mfg. Co., Inc. Hardware enhancements for improved performance of memory emulation method
US5649090A (en) * 1991-05-31 1997-07-15 Bull Hn Information Systems Inc. Fault tolerant multiprocessor computer system
EP0596144A1 (en) * 1992-10-07 1994-05-11 International Business Machines Corporation Hierarchical memory system for microcode and means for correcting errors in the microcode
JPH06214897A (ja) * 1992-12-14 1994-08-05 E Syst Inc 誤り状態検出時に周辺装置に記憶したデータの損失を最少にする方法
US5771367A (en) * 1992-12-17 1998-06-23 International Business Machines Corporation Storage controller and method for improved failure recovery using cross-coupled cache memories and nonvolatile stores
DE59605364D1 (de) * 1995-07-21 2000-07-06 Siemens Ag Rechnersystem
US5748871A (en) * 1995-08-11 1998-05-05 Symbios Logic Inc. Dual bus architecture for a storage device
JP2004302713A (ja) * 2003-03-31 2004-10-28 Hitachi Ltd 記憶システム及びその制御方法
JP2005071196A (ja) * 2003-08-27 2005-03-17 Hitachi Ltd ディスクアレイ装置、及びその障害情報の制御方法
US7549029B2 (en) * 2005-05-06 2009-06-16 International Business Machines Corporation Methods for creating hierarchical copies

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4099241A (en) * 1973-10-30 1978-07-04 Telefonaktiebolaget L M Ericsson Apparatus for facilitating a cooperation between an executive computer and a reserve computer
US4351023A (en) * 1980-04-11 1982-09-21 The Foxboro Company Process control system with improved system security features
JPS5717019A (en) * 1980-07-07 1982-01-28 Fanuc Ltd Numerical controller
JPS6053339B2 (ja) * 1980-10-09 1985-11-25 日本電気株式会社 論理装置のエラ−回復方式
US4371754A (en) * 1980-11-19 1983-02-01 Rockwell International Corporation Automatic fault recovery system for a multiple processor telecommunications switching control
IT1151351B (it) * 1982-01-19 1986-12-17 Italtel Spa Disposizione circuitale atta a realizzare lo scambio di dati tra una coppia di elaboratori operanti secondo il principio master-slave
DE3215177A1 (de) * 1982-04-23 1983-10-27 Hartmann & Braun Ag, 6000 Frankfurt Ueberwachungssystem fuer eine oder mehrere, gleichartig aufgebaute prozessstationen
US4466098A (en) * 1982-06-11 1984-08-14 Siemens Corporation Cross channel circuit for an electronic system having two or more redundant computers
US4684885A (en) * 1985-11-04 1987-08-04 Get Communication Systems Corporation Arrangement for on-line diagnostic testing of an off-line standby processor in a duplicated processor configuration
US4751702A (en) * 1986-02-10 1988-06-14 International Business Machines Corporation Improving availability of a restartable staged storage data base system that uses logging facilities

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012083992A (ja) * 2010-10-13 2012-04-26 Nec Computertechno Ltd データ障害処理装置、及びデータ障害処理方法
JP2013020566A (ja) * 2011-07-14 2013-01-31 Nec Commun Syst Ltd 二重化情報処理システム

Also Published As

Publication number Publication date
US4920479A (en) 1990-04-24
JPH0690682B2 (ja) 1994-11-14

Similar Documents

Publication Publication Date Title
JPS63213048A (ja) マルチプロセツサシステムの障害処理方式
JP2514208B2 (ja) ホットスタンドバイメモリ−コピ−方式
EP0377990A2 (en) Data processing systems
JPH01216459A (ja) 構成変更制御方式
EP0212637A2 (en) Mircrocomputer
JPS58121457A (ja) 情報処理装置
JP3052857B2 (ja) クラスタ間共有メモリアクセス方式
JPH0282330A (ja) ムーブアウト・システム
EP0550976A2 (en) Memory accessing device using address pipeline
JPS63278159A (ja) 情報処理装置
JPH0217550A (ja) マルチプロセッサシステムの障害処理方式
JP3862777B2 (ja) 二重化データ一致化方法および二重化制御装置
JPH04158457A (ja) 二重化システム
JPH0324634A (ja) 二重系システム装置
JP2005010995A (ja) マルチプロセッサシステム及びそのライトバックの障害処理方法
JP2657947B2 (ja) データ処理装置
JP3012402B2 (ja) 情報処理システム
JPH046482A (ja) 半導体装置
JPS59123056A (ja) 冗長機能自動切替システム
JP2008242592A (ja) メモリ監視回路、情報処理装置、及びメモリ監視方法
JPH02277142A (ja) 二重系計算機システム
JPH0421058A (ja) サブプロセッサプログラムローディング方式
JPH058459B2 (ja)
JPH0212448A (ja) 複合電子計算機システム
JPS6231386B2 (ja)