JPS60205640A - エラ−ログ方式 - Google Patents
エラ−ログ方式Info
- Publication number
- JPS60205640A JPS60205640A JP59061526A JP6152684A JPS60205640A JP S60205640 A JPS60205640 A JP S60205640A JP 59061526 A JP59061526 A JP 59061526A JP 6152684 A JP6152684 A JP 6152684A JP S60205640 A JPS60205640 A JP S60205640A
- Authority
- JP
- Japan
- Prior art keywords
- error
- processor
- svp
- data
- bus
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0706—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
- G06F11/073—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a memory management context, e.g. virtual memory or cache management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/08—Error detection or correction by redundancy in data representation, e.g. by using checking codes
- G06F11/10—Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Debugging And Monitoring (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
(技術分野)
本発明はエラーログ方式、とくに情報処理システムの主
記憶装置で発生するエラーを記録するためのエラーログ
方式に関する。
記憶装置で発生するエラーを記録するためのエラーログ
方式に関する。
近年の情報処理システムに使用される主記憶装。
置の記憶素子には超LSIと称される超高集積度のIC
が用いられているが、記憶素子のこのような超高集積化
にともない、素子の故障が与える範囲が拡大し、またそ
れとともに、α線粒子によるソフトウェアエラーの発生
確率も増大してきている。
が用いられているが、記憶素子のこのような超高集積化
にともない、素子の故障が与える範囲が拡大し、またそ
れとともに、α線粒子によるソフトウェアエラーの発生
確率も増大してきている。
これを防ぐため、一般に書込むデータにはECC(誤シ
訂正符号)と呼ばれるチェックコードを付加してこれを
記憶し、読出し時に、発生したエラーを検出し、エラー
訂正を行なうことを可能にしている。
訂正符号)と呼ばれるチェックコードを付加してこれを
記憶し、読出し時に、発生したエラーを検出し、エラー
訂正を行なうことを可能にしている。
さらに、このエラー訂正時には訂正動作はか夛でなく、
エラーが発生した個所を明確にするための必要な情報の
収集を行ない、これを記録(ログ)しておくのが一般的
である。本発明はこのエラーログ方式に関するものであ
る。
エラーが発生した個所を明確にするための必要な情報の
収集を行ない、これを記録(ログ)しておくのが一般的
である。本発明はこのエラーログ方式に関するものであ
る。
(従来技術)
第1図は従来例を説明するためのブロック図である。
図において、主記憶装置1′はシステムバス1ooo’
を介して複数のプロセッサ2’−1,2’−2・・・
2/Nに接続され、各プロセッサは、それぞれこのバス
1000’を介して共通の主記憶装置1′にアクセスす
る。今、例えは、プロセッサ2′−2が主記憶装置1′
からデータを読出すためのアクセスを行ない、このとき
主記憶装置1′のエラー訂正回路(図示せず)がエラー
を検出したとする。このエラー訂正回路はエラー訂正を
行なうが、それとともにエラー報告線2000’−2を
介してエラーが検出されたことを、この読出すためのア
クセスを行なったプロセッサ2′−2に通報する・この
通報を受けた前記プロセッサ2′−2は、前記エラー訂
正回路から、エラーを起したメモリアドレスおよびビッ
ト位置に関する情報を、バス1000’を介して収集し
、これを処理してシステム中の共通のログ機構にログす
る。その後、訂正されたデータをバス1000’を介し
て読取シ、通常の処理に入る。
を介して複数のプロセッサ2’−1,2’−2・・・
2/Nに接続され、各プロセッサは、それぞれこのバス
1000’を介して共通の主記憶装置1′にアクセスす
る。今、例えは、プロセッサ2′−2が主記憶装置1′
からデータを読出すためのアクセスを行ない、このとき
主記憶装置1′のエラー訂正回路(図示せず)がエラー
を検出したとする。このエラー訂正回路はエラー訂正を
行なうが、それとともにエラー報告線2000’−2を
介してエラーが検出されたことを、この読出すためのア
クセスを行なったプロセッサ2′−2に通報する・この
通報を受けた前記プロセッサ2′−2は、前記エラー訂
正回路から、エラーを起したメモリアドレスおよびビッ
ト位置に関する情報を、バス1000’を介して収集し
、これを処理してシステム中の共通のログ機構にログす
る。その後、訂正されたデータをバス1000’を介し
て読取シ、通常の処理に入る。
この例で示したように、従来は、一般に、主記憶装置に
対するアクセスにおいてエラーが検出されると、このア
クセスを行なったプロセッサがその都度この工2−情報
をログする処理を行なうように構成されている。
対するアクセスにおいてエラーが検出されると、このア
クセスを行なったプロセッサがその都度この工2−情報
をログする処理を行なうように構成されている。
このため、主記憶装置に結合されたプロセッサの数が多
くなると、各プロセッサごとに、前述のようなエラー報
告線(第1図2000’−1〜2000’−N)が必要
になシ、また、エラー情報収集手段ならびにエラー管理
手段等の各プロセッサ内部のハードウェア/ファームウ
ェアもそれだけ余分に必要になってくる。またこの余分
なエラー処理機能の追加のため、各プロセッサのデータ
処理能力をそれだけ低減する結果にもなっている。
くなると、各プロセッサごとに、前述のようなエラー報
告線(第1図2000’−1〜2000’−N)が必要
になシ、また、エラー情報収集手段ならびにエラー管理
手段等の各プロセッサ内部のハードウェア/ファームウ
ェアもそれだけ余分に必要になってくる。またこの余分
なエラー処理機能の追加のため、各プロセッサのデータ
処理能力をそれだけ低減する結果にもなっている。
(発明の目的)
本発明の目的は、複数のプロセッサ群中の特定の一つの
プロセッサにエラーログを担当させ、これによシ上述の
従来の欠点を除去したエラーログ方式を提供することに
ある。
プロセッサにエラーログを担当させ、これによシ上述の
従来の欠点を除去したエラーログ方式を提供することに
ある。
(発明の構成)
本発明の方式は、データを処理する複数のプロセッサ群
とこれらプロセッサ群が共通に使用する主記憶装置とが
システムバスにょ夛互に結合された情報処理システムに
おいて、前記主記憶装置に発生した工2−を検出しこれ
を訂正して前記システムバスに送出する手段と、前記エ
ラーの検出にもとすき前記プロセッサ群中の予め定めた
特定の一つのプロセッサに対してエラーを通報する手段
とを有し、かつ前記通報を受ける特定のプロセッサのみ
が前記主記憶装置に発生するエラーに関する情報の収集
ならびにエラーログを行なう。
とこれらプロセッサ群が共通に使用する主記憶装置とが
システムバスにょ夛互に結合された情報処理システムに
おいて、前記主記憶装置に発生した工2−を検出しこれ
を訂正して前記システムバスに送出する手段と、前記エ
ラーの検出にもとすき前記プロセッサ群中の予め定めた
特定の一つのプロセッサに対してエラーを通報する手段
とを有し、かつ前記通報を受ける特定のプロセッサのみ
が前記主記憶装置に発生するエラーに関する情報の収集
ならびにエラーログを行なう。
(実施例)
次に図面を参照して本発明の詳細な説明する。
第2図を参照すると、本発明の実施例は主8ピ憶装置1
、複数のプロセッサ2−1.2−2.・・・2−N、フ
ロッピィディスク装置3、バス 1000およびエラー
報告線2000を含んでいる。
、複数のプロセッサ2−1.2−2.・・・2−N、フ
ロッピィディスク装置3、バス 1000およびエラー
報告線2000を含んでいる。
また、前記主記憶装置1の内部には、第3図に示すよう
に、メモリ回路11、エラー訂正回路(ECC)12、
エラー情報レジスタ13および切替回路14を含んでい
る。
に、メモリ回路11、エラー訂正回路(ECC)12、
エラー情報レジスタ13および切替回路14を含んでい
る。
前記複数のプロセッサ2−1 、2−2 、・・・2−
Nの中には演算処理装置(cpu)、入出力制御装置(
IOP)等のプロセッサを含み、またプロセッサ2−N
は本実施例においてはとくにシステム診断用プロセッサ
(以後svp )とする。前記エラー報告l1s200
0はこのSVPに対してだけ設けられている。また、フ
ロッピィディスク装置3はエラーログを行なうための記
録媒体として用いられ、同様にこのSVPに接続されて
いる。
Nの中には演算処理装置(cpu)、入出力制御装置(
IOP)等のプロセッサを含み、またプロセッサ2−N
は本実施例においてはとくにシステム診断用プロセッサ
(以後svp )とする。前記エラー報告l1s200
0はこのSVPに対してだけ設けられている。また、フ
ロッピィディスク装置3はエラーログを行なうための記
録媒体として用いられ、同様にこのSVPに接続されて
いる。
前記複数の各プロセッサ2−1.2−2.・・・2−N
は、すべてバス1oooを介して主記憶装置1をアクセ
スする。
は、すべてバス1oooを介して主記憶装置1をアクセ
スする。
さて、本実施例のエラーログ動作は下記の通シである。
今、あるプロセッサ(例えばプロセッサ2−2)が主記
憶装置1のあるアドレスからデータを読出すとする。こ
のアドレスは、バス1000の中のアドレスパース10
00−1 (第3図)を介してメモリ回路11に供給さ
れ、この指定されたアドレスから、データおよびそれに
付随するパリティピットが読出され、エラー訂正回路1
2に供給される。もし、読出されたデータ中にエラーが
あると、回路12は直ちにこれを検出して訂正し、これ
を出力ライン1200および切替回路14を介してバス
1000に送出する。従って、主記憶装置1に対して読
出しアクセスを行なったプロセッサ2−2はバス100
0 を介してエラーのないデータを受け取ることができ
る。
憶装置1のあるアドレスからデータを読出すとする。こ
のアドレスは、バス1000の中のアドレスパース10
00−1 (第3図)を介してメモリ回路11に供給さ
れ、この指定されたアドレスから、データおよびそれに
付随するパリティピットが読出され、エラー訂正回路1
2に供給される。もし、読出されたデータ中にエラーが
あると、回路12は直ちにこれを検出して訂正し、これ
を出力ライン1200および切替回路14を介してバス
1000に送出する。従って、主記憶装置1に対して読
出しアクセスを行なったプロセッサ2−2はバス100
0 を介してエラーのないデータを受け取ることができ
る。
一方、エラーを検出した回路12は前述のエラー訂正を
行なうとともに、エラーを起したメモリ回路11のメモ
リアドレスと、データ中の工2−を起したビット位置と
を指定する情報を、エラー情報レジスタ13に格納し、
エラー報告線2000を介して工2−検出の通報を行な
う。
行なうとともに、エラーを起したメモリ回路11のメモ
リアドレスと、データ中の工2−を起したビット位置と
を指定する情報を、エラー情報レジスタ13に格納し、
エラー報告線2000を介して工2−検出の通報を行な
う。
このエラー検出の通報はエラー報告線2000を介して
前記SVPに供給され、8VPに対してエラー検出割込
を起す。
前記SVPに供給され、8VPに対してエラー検出割込
を起す。
この割込が起ると8VPのファームウェアは、直ちにエ
ラー情報レジスタ13の内容を、出力ライン1300.
切替回路14およびバス1000 を介して読出し、内
部に取込み、予め定められたプロセスに従ってこのデー
タを処理し、フロッピィディスク装置3に出力してこれ
をログする。
ラー情報レジスタ13の内容を、出力ライン1300.
切替回路14およびバス1000 を介して読出し、内
部に取込み、予め定められたプロセスに従ってこのデー
タを処理し、フロッピィディスク装置3に出力してこれ
をログする。
以上のような方式をとることによシ、システム中の、ど
のプロセッサが記憶装置1からデータを読出す際にエラ
ーが発生しても、これに対するエラーVグはすべて特定
の一つのSvPによって行なわれ、その他のプロセッサ
は何等これに係わることなく正常動作が行なわれる。
のプロセッサが記憶装置1からデータを読出す際にエラ
ーが発生しても、これに対するエラーVグはすべて特定
の一つのSvPによって行なわれ、その他のプロセッサ
は何等これに係わることなく正常動作が行なわれる。
このため、SvP以外の各プロセッサは、エラーログ処
理から解放され、従来必要とされたエラー報告線等のハ
ードウェアおよび、エラー情報を収集処理してエラーロ
グを行なうためのファームウェアも不要となル、ハード
ウェア/ファームウェアの簡素化が図れる。またこのた
め、余分の7ブームウエアの付加に起因する各プロセッ
サのデータ処理能力低下も防ぐことができる。
理から解放され、従来必要とされたエラー報告線等のハ
ードウェアおよび、エラー情報を収集処理してエラーロ
グを行なうためのファームウェアも不要となル、ハード
ウェア/ファームウェアの簡素化が図れる。またこのた
め、余分の7ブームウエアの付加に起因する各プロセッ
サのデータ処理能力低下も防ぐことができる。
一方、svpにおいては、工2−ログを一つの主要な担
務として取扱かうように構成できるため、これに対する
バー・ドウエア/ファームウエアモ専問化された高機能
を有するものを用いるようにすることができる。従って
エラー情報の収集管理機能が向上し、システムの信頼性
の向上を達成できる。
務として取扱かうように構成できるため、これに対する
バー・ドウエア/ファームウエアモ専問化された高機能
を有するものを用いるようにすることができる。従って
エラー情報の収集管理機能が向上し、システムの信頼性
の向上を達成できる。
なお、以上は本発明の一実施例を示したもので本発明は
これに限定されるものではない。
これに限定されるものではない。
例えは、本実施例においては、システム中の診断用プロ
セッサ(svp)がエラーログを担当するように構成し
たが、これは何も診断用プロセッサに限定される必要は
なく、システム中の適轟な一つのプロセッサを選定して
これにエラーログ機能を担当させるようにすることもで
きる。
セッサ(svp)がエラーログを担当するように構成し
たが、これは何も診断用プロセッサに限定される必要は
なく、システム中の適轟な一つのプロセッサを選定して
これにエラーログ機能を担当させるようにすることもで
きる。
また、本実施例においては、エラー情報レジスタ13の
内容は切替回路14およびバス1000t−介してエラ
ーログを担当するプロセッサに導かれたが、このかわり
に、工2−情報レジスタから専用線を介してエラーログ
を担当するプロセッサに転送するようにすることもでき
る。
内容は切替回路14およびバス1000t−介してエラ
ーログを担当するプロセッサに導かれたが、このかわり
に、工2−情報レジスタから専用線を介してエラーログ
を担当するプロセッサに転送するようにすることもでき
る。
(発明の効果)
以上のように本発明によると、複数のプロセッサがエラ
ー訂正機能を有する共通の主記憶装置にアクセスするシ
ステムにおいて、この主記憶装置中に発生する工2−に
対するエラーログをシステム中の特定の一つのプロセッ
サだけが担当するように構成し、該プロセッサ以外の各
プロセッサをエラーログ処理から解放し、これによシこ
れら各プロセッサのハードウェア/ファームウェアの簡
素化が達成され、またこれら各プロセッサにエラー処理
機能を付加することに起因する能力低下が回避され、シ
ステムの性能向上が達成される。
ー訂正機能を有する共通の主記憶装置にアクセスするシ
ステムにおいて、この主記憶装置中に発生する工2−に
対するエラーログをシステム中の特定の一つのプロセッ
サだけが担当するように構成し、該プロセッサ以外の各
プロセッサをエラーログ処理から解放し、これによシこ
れら各プロセッサのハードウェア/ファームウェアの簡
素化が達成され、またこれら各プロセッサにエラー処理
機能を付加することに起因する能力低下が回避され、シ
ステムの性能向上が達成される。
また、この特定のプロセッサのエラー処理機能を高度化
してシステムの信頼性向上を図ること示容易となる。
してシステムの信頼性向上を図ること示容易となる。
第1図は従来例を説明するためのブロック図、第2図は
本発明の一実施例を示すブロック図および第3図は前記
実施例の一部の詳細を示すブロック図である。 図において、1・・・・・・主記憶装置、2−1.2−
2、・・・2−N・・・・・・プロセッサ、3・・・・
・・フロッピィディスク装置、11・・・・・・メモリ
回路、12・・・・・・エラー訂正回路(ECC)、1
3・・・・・・工2−情報レジスタ、14・・・・・・
切替回路、1000・・・・・・システムバス、200
0・・・・・・エラー報き線。 第3図
本発明の一実施例を示すブロック図および第3図は前記
実施例の一部の詳細を示すブロック図である。 図において、1・・・・・・主記憶装置、2−1.2−
2、・・・2−N・・・・・・プロセッサ、3・・・・
・・フロッピィディスク装置、11・・・・・・メモリ
回路、12・・・・・・エラー訂正回路(ECC)、1
3・・・・・・工2−情報レジスタ、14・・・・・・
切替回路、1000・・・・・・システムバス、200
0・・・・・・エラー報き線。 第3図
Claims (1)
- 【特許請求の範囲】 データを処理する複数のプロセッサ群とこれらプロセッ
サ群が共通に使用する主記憶装置とがシステムバスによ
り互に結合された情報処理システムにおいて、 前記主記憶装置に発生したエラーを検出しこれを訂正し
て前記システムバスに送出する手段と、前記エラーの検
出にもとづき前記プロセッサ群中の予め定めた特定の一
つのプロセッサに対してエラーを通報する手段とを有し
、かつ前記通報を受ける特定のプロセッサのみが前記主
記憶装置に発生するエラーに関する情報の収集ならびに
エラーログを行なうようにしたことを特徴とするエラー
ログ方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59061526A JPS60205640A (ja) | 1984-03-29 | 1984-03-29 | エラ−ログ方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59061526A JPS60205640A (ja) | 1984-03-29 | 1984-03-29 | エラ−ログ方式 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS60205640A true JPS60205640A (ja) | 1985-10-17 |
Family
ID=13173628
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP59061526A Pending JPS60205640A (ja) | 1984-03-29 | 1984-03-29 | エラ−ログ方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS60205640A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02212946A (ja) * | 1989-02-13 | 1990-08-24 | Nec Corp | 情報処理装置の障害通知方式 |
-
1984
- 1984-03-29 JP JP59061526A patent/JPS60205640A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02212946A (ja) * | 1989-02-13 | 1990-08-24 | Nec Corp | 情報処理装置の障害通知方式 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6829729B2 (en) | Method and system for fault isolation methodology for I/O unrecoverable, uncorrectable error | |
EP0032957B1 (en) | Information processing system for error processing, and error processing method | |
US4531213A (en) | Memory through checking system with comparison of data word parity before and after ECC processing | |
US4964130A (en) | System for determining status of errors in a memory subsystem | |
US6629273B1 (en) | Detection of silent data corruption in a storage system | |
US3704363A (en) | Statistical and environmental data logging system for data processing storage subsystem | |
US4549295A (en) | System for identifying defective media in magnetic tape storage systems | |
US4964129A (en) | Memory controller with error logging | |
US3735105A (en) | Error correcting system and method for monolithic memories | |
US6615374B1 (en) | First and next error identification for integrated circuit devices | |
US20030140300A1 (en) | (146,130) error correction code utilizing address information | |
JPH0758474B2 (ja) | デジタルデータ処理システムにおいて複数の構成要素の起こりそうな故障の一つを検出するエキスパートシステム | |
US6845469B2 (en) | Method for managing an uncorrectable, unrecoverable data error (UE) as the UE passes through a plurality of devices in a central electronics complex | |
US7089461B2 (en) | Method and apparatus for isolating uncorrectable errors while system continues to run | |
US6842867B2 (en) | System and method for identifying memory modules having a failing or defective address | |
US7346812B1 (en) | Apparatus and method for implementing programmable levels of error severity | |
US6032269A (en) | Firmware recovery from hanging channels by buffer analysis | |
US4761783A (en) | Apparatus and method for reporting occurrences of errors in signals stored in a data processor | |
US6970310B2 (en) | Disk control apparatus and its control method | |
JPS60205640A (ja) | エラ−ログ方式 | |
JPH05216771A (ja) | データ処理装置内の重要データの回復可能性を保証する方法と装置 | |
JP2806856B2 (ja) | 誤り検出訂正回路の診断装置 | |
JPH0255816B2 (ja) | ||
JPH06282385A (ja) | 記憶制御装置および記憶制御装置を備える情報処理システム | |
JPH0374422B2 (ja) |