JPS60205640A - エラ−ログ方式 - Google Patents

エラ−ログ方式

Info

Publication number
JPS60205640A
JPS60205640A JP59061526A JP6152684A JPS60205640A JP S60205640 A JPS60205640 A JP S60205640A JP 59061526 A JP59061526 A JP 59061526A JP 6152684 A JP6152684 A JP 6152684A JP S60205640 A JPS60205640 A JP S60205640A
Authority
JP
Japan
Prior art keywords
error
processor
svp
data
bus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59061526A
Other languages
English (en)
Inventor
Tadanobu Okuyama
奥山 忠信
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp, Nippon Electric Co Ltd filed Critical NEC Corp
Priority to JP59061526A priority Critical patent/JPS60205640A/ja
Publication of JPS60205640A publication Critical patent/JPS60205640A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/073Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a memory management context, e.g. virtual memory or cache management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/08Error detection or correction by redundancy in data representation, e.g. by using checking codes
    • G06F11/10Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (技術分野) 本発明はエラーログ方式、とくに情報処理システムの主
記憶装置で発生するエラーを記録するためのエラーログ
方式に関する。
近年の情報処理システムに使用される主記憶装。
置の記憶素子には超LSIと称される超高集積度のIC
が用いられているが、記憶素子のこのような超高集積化
にともない、素子の故障が与える範囲が拡大し、またそ
れとともに、α線粒子によるソフトウェアエラーの発生
確率も増大してきている。
これを防ぐため、一般に書込むデータにはECC(誤シ
訂正符号)と呼ばれるチェックコードを付加してこれを
記憶し、読出し時に、発生したエラーを検出し、エラー
訂正を行なうことを可能にしている。
さらに、このエラー訂正時には訂正動作はか夛でなく、
エラーが発生した個所を明確にするための必要な情報の
収集を行ない、これを記録(ログ)しておくのが一般的
である。本発明はこのエラーログ方式に関するものであ
る。
(従来技術) 第1図は従来例を説明するためのブロック図である。
図において、主記憶装置1′はシステムバス1ooo’
を介して複数のプロセッサ2’−1,2’−2・・・ 
2/Nに接続され、各プロセッサは、それぞれこのバス
1000’を介して共通の主記憶装置1′にアクセスす
る。今、例えは、プロセッサ2′−2が主記憶装置1′
からデータを読出すためのアクセスを行ない、このとき
主記憶装置1′のエラー訂正回路(図示せず)がエラー
を検出したとする。このエラー訂正回路はエラー訂正を
行なうが、それとともにエラー報告線2000’−2を
介してエラーが検出されたことを、この読出すためのア
クセスを行なったプロセッサ2′−2に通報する・この
通報を受けた前記プロセッサ2′−2は、前記エラー訂
正回路から、エラーを起したメモリアドレスおよびビッ
ト位置に関する情報を、バス1000’を介して収集し
、これを処理してシステム中の共通のログ機構にログす
る。その後、訂正されたデータをバス1000’を介し
て読取シ、通常の処理に入る。
この例で示したように、従来は、一般に、主記憶装置に
対するアクセスにおいてエラーが検出されると、このア
クセスを行なったプロセッサがその都度この工2−情報
をログする処理を行なうように構成されている。
このため、主記憶装置に結合されたプロセッサの数が多
くなると、各プロセッサごとに、前述のようなエラー報
告線(第1図2000’−1〜2000’−N)が必要
になシ、また、エラー情報収集手段ならびにエラー管理
手段等の各プロセッサ内部のハードウェア/ファームウ
ェアもそれだけ余分に必要になってくる。またこの余分
なエラー処理機能の追加のため、各プロセッサのデータ
処理能力をそれだけ低減する結果にもなっている。
(発明の目的) 本発明の目的は、複数のプロセッサ群中の特定の一つの
プロセッサにエラーログを担当させ、これによシ上述の
従来の欠点を除去したエラーログ方式を提供することに
ある。
(発明の構成) 本発明の方式は、データを処理する複数のプロセッサ群
とこれらプロセッサ群が共通に使用する主記憶装置とが
システムバスにょ夛互に結合された情報処理システムに
おいて、前記主記憶装置に発生した工2−を検出しこれ
を訂正して前記システムバスに送出する手段と、前記エ
ラーの検出にもとすき前記プロセッサ群中の予め定めた
特定の一つのプロセッサに対してエラーを通報する手段
とを有し、かつ前記通報を受ける特定のプロセッサのみ
が前記主記憶装置に発生するエラーに関する情報の収集
ならびにエラーログを行なう。
(実施例) 次に図面を参照して本発明の詳細な説明する。
第2図を参照すると、本発明の実施例は主8ピ憶装置1
、複数のプロセッサ2−1.2−2.・・・2−N、フ
ロッピィディスク装置3、バス 1000およびエラー
報告線2000を含んでいる。
また、前記主記憶装置1の内部には、第3図に示すよう
に、メモリ回路11、エラー訂正回路(ECC)12、
エラー情報レジスタ13および切替回路14を含んでい
る。
前記複数のプロセッサ2−1 、2−2 、・・・2−
Nの中には演算処理装置(cpu)、入出力制御装置(
IOP)等のプロセッサを含み、またプロセッサ2−N
は本実施例においてはとくにシステム診断用プロセッサ
(以後svp )とする。前記エラー報告l1s200
0はこのSVPに対してだけ設けられている。また、フ
ロッピィディスク装置3はエラーログを行なうための記
録媒体として用いられ、同様にこのSVPに接続されて
いる。
前記複数の各プロセッサ2−1.2−2.・・・2−N
は、すべてバス1oooを介して主記憶装置1をアクセ
スする。
さて、本実施例のエラーログ動作は下記の通シである。
今、あるプロセッサ(例えばプロセッサ2−2)が主記
憶装置1のあるアドレスからデータを読出すとする。こ
のアドレスは、バス1000の中のアドレスパース10
00−1 (第3図)を介してメモリ回路11に供給さ
れ、この指定されたアドレスから、データおよびそれに
付随するパリティピットが読出され、エラー訂正回路1
2に供給される。もし、読出されたデータ中にエラーが
あると、回路12は直ちにこれを検出して訂正し、これ
を出力ライン1200および切替回路14を介してバス
1000に送出する。従って、主記憶装置1に対して読
出しアクセスを行なったプロセッサ2−2はバス100
0 を介してエラーのないデータを受け取ることができ
る。
一方、エラーを検出した回路12は前述のエラー訂正を
行なうとともに、エラーを起したメモリ回路11のメモ
リアドレスと、データ中の工2−を起したビット位置と
を指定する情報を、エラー情報レジスタ13に格納し、
エラー報告線2000を介して工2−検出の通報を行な
う。
このエラー検出の通報はエラー報告線2000を介して
前記SVPに供給され、8VPに対してエラー検出割込
を起す。
この割込が起ると8VPのファームウェアは、直ちにエ
ラー情報レジスタ13の内容を、出力ライン1300.
切替回路14およびバス1000 を介して読出し、内
部に取込み、予め定められたプロセスに従ってこのデー
タを処理し、フロッピィディスク装置3に出力してこれ
をログする。
以上のような方式をとることによシ、システム中の、ど
のプロセッサが記憶装置1からデータを読出す際にエラ
ーが発生しても、これに対するエラーVグはすべて特定
の一つのSvPによって行なわれ、その他のプロセッサ
は何等これに係わることなく正常動作が行なわれる。
このため、SvP以外の各プロセッサは、エラーログ処
理から解放され、従来必要とされたエラー報告線等のハ
ードウェアおよび、エラー情報を収集処理してエラーロ
グを行なうためのファームウェアも不要となル、ハード
ウェア/ファームウェアの簡素化が図れる。またこのた
め、余分の7ブームウエアの付加に起因する各プロセッ
サのデータ処理能力低下も防ぐことができる。
一方、svpにおいては、工2−ログを一つの主要な担
務として取扱かうように構成できるため、これに対する
バー・ドウエア/ファームウエアモ専問化された高機能
を有するものを用いるようにすることができる。従って
エラー情報の収集管理機能が向上し、システムの信頼性
の向上を達成できる。
なお、以上は本発明の一実施例を示したもので本発明は
これに限定されるものではない。
例えは、本実施例においては、システム中の診断用プロ
セッサ(svp)がエラーログを担当するように構成し
たが、これは何も診断用プロセッサに限定される必要は
なく、システム中の適轟な一つのプロセッサを選定して
これにエラーログ機能を担当させるようにすることもで
きる。
また、本実施例においては、エラー情報レジスタ13の
内容は切替回路14およびバス1000t−介してエラ
ーログを担当するプロセッサに導かれたが、このかわり
に、工2−情報レジスタから専用線を介してエラーログ
を担当するプロセッサに転送するようにすることもでき
る。
(発明の効果) 以上のように本発明によると、複数のプロセッサがエラ
ー訂正機能を有する共通の主記憶装置にアクセスするシ
ステムにおいて、この主記憶装置中に発生する工2−に
対するエラーログをシステム中の特定の一つのプロセッ
サだけが担当するように構成し、該プロセッサ以外の各
プロセッサをエラーログ処理から解放し、これによシこ
れら各プロセッサのハードウェア/ファームウェアの簡
素化が達成され、またこれら各プロセッサにエラー処理
機能を付加することに起因する能力低下が回避され、シ
ステムの性能向上が達成される。
また、この特定のプロセッサのエラー処理機能を高度化
してシステムの信頼性向上を図ること示容易となる。
【図面の簡単な説明】
第1図は従来例を説明するためのブロック図、第2図は
本発明の一実施例を示すブロック図および第3図は前記
実施例の一部の詳細を示すブロック図である。 図において、1・・・・・・主記憶装置、2−1.2−
2、・・・2−N・・・・・・プロセッサ、3・・・・
・・フロッピィディスク装置、11・・・・・・メモリ
回路、12・・・・・・エラー訂正回路(ECC)、1
3・・・・・・工2−情報レジスタ、14・・・・・・
切替回路、1000・・・・・・システムバス、200
0・・・・・・エラー報き線。 第3図

Claims (1)

  1. 【特許請求の範囲】 データを処理する複数のプロセッサ群とこれらプロセッ
    サ群が共通に使用する主記憶装置とがシステムバスによ
    り互に結合された情報処理システムにおいて、 前記主記憶装置に発生したエラーを検出しこれを訂正し
    て前記システムバスに送出する手段と、前記エラーの検
    出にもとづき前記プロセッサ群中の予め定めた特定の一
    つのプロセッサに対してエラーを通報する手段とを有し
    、かつ前記通報を受ける特定のプロセッサのみが前記主
    記憶装置に発生するエラーに関する情報の収集ならびに
    エラーログを行なうようにしたことを特徴とするエラー
    ログ方式。
JP59061526A 1984-03-29 1984-03-29 エラ−ログ方式 Pending JPS60205640A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59061526A JPS60205640A (ja) 1984-03-29 1984-03-29 エラ−ログ方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59061526A JPS60205640A (ja) 1984-03-29 1984-03-29 エラ−ログ方式

Publications (1)

Publication Number Publication Date
JPS60205640A true JPS60205640A (ja) 1985-10-17

Family

ID=13173628

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59061526A Pending JPS60205640A (ja) 1984-03-29 1984-03-29 エラ−ログ方式

Country Status (1)

Country Link
JP (1) JPS60205640A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02212946A (ja) * 1989-02-13 1990-08-24 Nec Corp 情報処理装置の障害通知方式

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02212946A (ja) * 1989-02-13 1990-08-24 Nec Corp 情報処理装置の障害通知方式

Similar Documents

Publication Publication Date Title
US6829729B2 (en) Method and system for fault isolation methodology for I/O unrecoverable, uncorrectable error
EP0032957B1 (en) Information processing system for error processing, and error processing method
US4531213A (en) Memory through checking system with comparison of data word parity before and after ECC processing
US4964130A (en) System for determining status of errors in a memory subsystem
US6629273B1 (en) Detection of silent data corruption in a storage system
US3704363A (en) Statistical and environmental data logging system for data processing storage subsystem
US4549295A (en) System for identifying defective media in magnetic tape storage systems
US4964129A (en) Memory controller with error logging
US3735105A (en) Error correcting system and method for monolithic memories
US6615374B1 (en) First and next error identification for integrated circuit devices
US20030140300A1 (en) (146,130) error correction code utilizing address information
JPH0758474B2 (ja) デジタルデータ処理システムにおいて複数の構成要素の起こりそうな故障の一つを検出するエキスパートシステム
US6845469B2 (en) Method for managing an uncorrectable, unrecoverable data error (UE) as the UE passes through a plurality of devices in a central electronics complex
US7089461B2 (en) Method and apparatus for isolating uncorrectable errors while system continues to run
US6842867B2 (en) System and method for identifying memory modules having a failing or defective address
US7346812B1 (en) Apparatus and method for implementing programmable levels of error severity
US6032269A (en) Firmware recovery from hanging channels by buffer analysis
US4761783A (en) Apparatus and method for reporting occurrences of errors in signals stored in a data processor
US6970310B2 (en) Disk control apparatus and its control method
JPS60205640A (ja) エラ−ログ方式
JPH05216771A (ja) データ処理装置内の重要データの回復可能性を保証する方法と装置
JP2806856B2 (ja) 誤り検出訂正回路の診断装置
JPH0255816B2 (ja)
JPH06282385A (ja) 記憶制御装置および記憶制御装置を備える情報処理システム
JPH0374422B2 (ja)