JPH0827733B2 - 障害処理システム - Google Patents

障害処理システム

Info

Publication number
JPH0827733B2
JPH0827733B2 JP5166738A JP16673893A JPH0827733B2 JP H0827733 B2 JPH0827733 B2 JP H0827733B2 JP 5166738 A JP5166738 A JP 5166738A JP 16673893 A JP16673893 A JP 16673893A JP H0827733 B2 JPH0827733 B2 JP H0827733B2
Authority
JP
Japan
Prior art keywords
memory
failure
fault
error
registered
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP5166738A
Other languages
English (en)
Other versions
JPH0721049A (ja
Inventor
孝 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP5166738A priority Critical patent/JPH0827733B2/ja
Publication of JPH0721049A publication Critical patent/JPH0721049A/ja
Publication of JPH0827733B2 publication Critical patent/JPH0827733B2/ja
Priority to US08/624,957 priority patent/US5630044A/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11CSTATIC STORES
    • G11C29/00Checking stores for correct operation ; Subsequent repair; Testing stores during standby or offline operation
    • G11C29/70Masking faults in memories by using spares or by reconfiguring
    • G11C29/88Masking faults in memories by using spares or by reconfiguring with partially good memories

Landscapes

  • Techniques For Improving Reliability Of Storages (AREA)
  • Retry When Errors Occur (AREA)
  • For Increasing The Reliability Of Semiconductor Memories (AREA)
  • Debugging And Monitoring (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、情報処理装置を構成す
る論理装置内のメモリで発生する故障についての故障回
復システムに関する。
【0002】
【従来の技術】従来、この種の故障回復システムでは、
例えば、特開昭63−41943公報に開示されてい
る。
【0003】このシステムでは、ある論理装置で障害が
発生した場合、機能の縮退が可能であるならばすぐに故
障を起こした箇所を縮退させ該当装置での再試行を試み
る障害処理方法が採用されている。
【0004】
【発明が解決しようとする課題】従来の障害処理方法で
は、論理装置内で故障を起こした箇所が縮退(デグレー
ド)可能であれば、縮退運転に即移行する。このため、
間欠で発生する故障に対しても機能の縮退が常に行われ
てしまう。
【0005】近年メモリの集積度向上によりメモリのソ
フトエラーによる間欠故障の頻度が高まっている。メモ
リのソフトエラーに関しては、該当メモリを再書き込み
すれば故障が解除される。
【0006】一方で、論理装置内のメモリ以外の部分で
の故障では、障害回復処置を採ることが難しい。
【0007】
【課題を解決するための手段】本発明の障害処理システ
ムは、論理ユニット内のメモリの障害を検出する障害処
理手段(以下障害処理プログラム)と、この障害処理プ
ログラムで検出されたメモリをエラーメモリとして登録
する障害メモリ管理テーブル手段(以下障害メモリ管理
テーブル)と、前記障害処理プログラムで検出されたメ
モリ情報が前記障害メモリ管理テーブルにエラーメモリ
として登録されているか否かを判定する登録判定手段
(以下登録判定ステップ)と、この登録判定ステップで
前記障害メモリ管理テーブルにエラーメモリとして登録
されていないと判定されたら、障害メモリ管理テーブル
に登録する登録手段(以下登録ステップ)と、前記登録
判定ステップで前記障害メモリ管理テーブルにエラーメ
モリとして登録されていると判定されたら、登録された
メモリとして示されたメモリを縮退するよう指示する縮
退指示手段とを含む。
【0008】
【実施例】次に本発明の一実施例について図面を参照し
て詳細に説明する。
【0009】本発明の一実施例に適用されるシステム
は、複数の演算論理ユニット11および12を有する情
報処理装置1と、この情報処理装置1の診断を行う診断
プロセッサ2とを備えている。
【0010】本発明の第1の実施例を含む診断プロセッ
サ2は、演算論理ユニット11および12に対する障害
処理を行う障害処理プログラム21、障害の発生したメ
モリをエラーメモリとして登録する障害メモリ管理テー
ブル22、障害処理プログラム21から渡されたエラー
を検出したメモリ情報を元に障害メモリ管理テーブル2
2を検索し、エラー発生メモリが既に故障を起こして登
録済であるか否かを判定し、未登録と判定されたときは
障害メモリ管理テーブル22にエラーメモリとして登録
し、登録されていると判定されたときは該当メモリの縮
退指示を行う障害メモリ管理プログラム22を含む。
【0011】次に本発明の第1の実施例の動作を図面を
参照して詳細に説明する。
【0012】図1および図2を参照すると、診断プロセ
ッサ2上で動作する障害処理プログラム21は、演算論
理ユニット1におけるメモリのエラーが発生しているか
否かを判定する(ステップ210)。メモリのエラーで
あると判定されたときにはエラー発生のメモリの識別情
報、例えば演算論理ユニット1内のメモリを示す情報と
ともに、障害処理プログラム21は障害メモリ管理プロ
グラム24を呼び出す。このプログラム24は、プログ
ラム21から渡されたエラー発生のメモリを示す情報を
もとに障害メモリ管理テーブル22の対応エリア220
を検索する(ステップ240)。次にプログラム24
は、テーブル22を検索した情報をもとに障害メモリが
既に故障を起してエラーメモリとして登録済であるか否
かを判定する(ステップ241)。新たに障害が発生し
登録されていないことが判定されれば、プログラム24
は、テーブル22にエラーメモリとして登録を行う(ス
テップ242)。もしステップ241で登録済であると
判定されれば、プログラム24は、該当障害メモリであ
る演算論理ユニット1に対し、メモリの使用エリアを縮
退する指示を与える(ステップ243)。
【0013】このように本発明の第1の実施例では障害
発生のメモリが各メモリに対して障害メモリ管理テーブ
ル22の対応部分に登録済であるか否かを判定し、登録
済であればメモリの固定障害であると判断して障害メモ
リに対し縮退指示をする。しかし、テーブル22に登録
済でないと判定されればメモリの間欠障害であると判断
して、障害メモリに対し縮退指示をしない。このため縮
退に伴う性能低下を極力抑えることができる。
【0014】次に本発明の第2の実施例について図面を
参照して詳細に説明する。
【0015】図1および図3を参照すると、本発明の第
2の実施例の特徴は、第1の実施例に障害監視タイマ2
3を付加したことにある。この障害監視タイマ23は、
演算論理ユニット内の各メモリ毎のエラーメモリとして
の登録後一定の時間経過を調べるために用いられる。
【0016】次に本発明の第2の実施例の動作について
図面を参照して詳細に説明する。
【0017】図1および図3を参照すると、本発明の第
2の実施例の動作は、第1の実施例のステップ242、
すなわち、障害を発生したメモリをテーブル22にエラ
ーメモリとて登録するステップまでは同じである。
【0018】第2の実施例では、登録ステップ242の
あと、障害監視タイマ23が起動される(ステップ24
4)。障害監視タイマ23は、一定時間経過後に監視し
ていた演算論理ユニット1の障害発生メモリの監視を中
止させるため、障害メモリ監視テーブル22内の該当メ
モリの内容を削除する(ステップ230)。
【0019】本発明の第2の実施例では、テーブル22
に一旦格納されたエラーメモリも一定時間経過して再び
障害が発生しなければ固定障害ではなく間欠障害である
ため、より正確に間欠障害を表示できる。このため、固
定障害として縮退することによるシステムに性能低下等
を極力抑えることができる。
【0020】次に本発明の第3の実施例について図面を
参照して詳細に説明する。
【0021】図1および図4を参照すると、本発明の第
3の実施例の特徴は、第1および第2の実施例と比較し
て、障害メモリ管理プログラム24が障害メモリ登録済
か否か(ステップ241)を判定し、登録済と判定され
たとき以降の処理にある。
【0022】障害メモリ管理テーブル22にも障害発生
時刻エリア222が設けられている。この障害発生時刻
エリア222にはエラーカウント値フィールド222
1,エラーモードフィールド2222,およびVフィー
ルド2223を備えている。エラーカウント値フィール
ド2221に格納されるエラーカウント値は、エラー発
生回数を示す。エラーモードフィールドに格納されるエ
ラーモードは、メモリに設定された障害時の処理方法を
規定した情報である。例えば、縮退へ移行すべきエラー
発生カウントの規定値や、メモリクリア,すなわちメモ
リの内容の削除により復旧可能か否かを示す情報であ
る。Vフィールド2223に格納される情報は、このメ
モリのテーブルが動作中であるか否かを示す。
【0023】障害メモリ管理プログラム24は、ステッ
プ241で障害メモリ管理テーブル22の対応する演算
論理ユニット用エリアにエラーメモリとして登録されて
いると判定されると、テーブル22の障害発生時刻エリ
ア222を参照する。障害メモリ管理プログラム24
は、参照されたこのエリア222のエラーモードおよび
エラーカウント値をもとに該当メモリの障害処理モード
を決定し障害処理プログラム24に指示する(ステップ
245)。
【0024】この指示を受けた障害処理プログラム21
は、障害処理モードが何かを判定する(ステップ21
1)。この判定によりプログラム21は、ステップ21
2−214の処理を行う。エラーモードがテーブル22
のエリアのメモリの削除により復旧可能を示す情報を示
していれば、プログラム21は、障害監視タイマ23の
ステップ230を実行する(ステップ212)。訂正可
能なメモリで障害が発生したときには、プログラム21
はメモリ内容を訂正する(ステップ214)。エラーカ
ウント値が縮退へ移行すべきエラー発生カウントの規定
値を超えていれば、プログラム21はメモリの縮退を実
行する(ステップ213)。
【0025】本発明の第3の実施例では、テーブル22
にエラー登録されていてもその回数等によりメモリ縮退
動作に移ることなく、縮退動作によるシステム性能の低
下を極力抑えることができるという効果をもたらす。
【0026】
【発明の効果】本発明は演算論理ユニット内のメモリで
発生した故障についてソフトエラーによる間欠障害と、
それ以外の固定故障とを識別し無用な機能縮退への移行
を抑止することができ、性能低下を極力抑えることがで
きるという効果がある。
【図面の簡単な説明】
【図1】本発明の一実施例に適用されるシステムを示す
図である。
【図2】本発明の第1の実施例を示す図である。
【図3】本発明の第2の実施例を示す図である。
【図4】本発明の第3の実施例を示す図である。
【符号の説明】
1 情報処理装置 2 診断プロセッサ 11 演算論理ユニット 12 演算論理ユニット 21 障害処理プログラム 22 障害メモリ管理テーブル 23 障害監視タイマ 24 障害メモリ管理プログラム

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】論理ユニット毎にメモリの障害を検出する
    障害処理手段と、 この障害処理手段で検出されたメモリをエラーメモリと
    して登録する障害メモリ管理テーブル手段と、 前記障害処理手段で検出されたメモリ情報が前記障害メ
    モリ情報が前記障害メモリ管理テーブル手段にエラーメ
    モリとして登録されているとき、登録されたエラーメモ
    リとして示されたメモリを縮退するように指示する障害
    メモリ管理手段と 前記障害処理手段で検出されたメモリ情報が前記障害メ
    モリ管理テーブル手段にエラーメモリとして登録されて
    いないとき、エラーメモリとして登録した時から一定時
    間経過を計時し、一定時間経過後に前記エラーメモリの
    登録を削除する障害監視タイマ手段と を含むことを特徴
    とする障害処理システム。
  2. 【請求項2】前記障害メモリ管理テーブル手段は前記エ
    ラーメモリについて復旧可能か否かを示す情報を記憶
    し、 前記障害メモリ管理手段は障害処理の際前記障害メモリ
    管理テーブル手段に記憶される情報が復旧可能を示して
    いれば前記障害監視タイマ手段の動作を有効にする こと
    を特徴とする請求項1記載の障害処理システム。
JP5166738A 1993-07-06 1993-07-06 障害処理システム Expired - Fee Related JPH0827733B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP5166738A JPH0827733B2 (ja) 1993-07-06 1993-07-06 障害処理システム
US08/624,957 US5630044A (en) 1993-07-06 1996-03-25 Memory fault recovery system which executes degradation or recovery of memory

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5166738A JPH0827733B2 (ja) 1993-07-06 1993-07-06 障害処理システム

Publications (2)

Publication Number Publication Date
JPH0721049A JPH0721049A (ja) 1995-01-24
JPH0827733B2 true JPH0827733B2 (ja) 1996-03-21

Family

ID=15836841

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5166738A Expired - Fee Related JPH0827733B2 (ja) 1993-07-06 1993-07-06 障害処理システム

Country Status (2)

Country Link
US (1) US5630044A (ja)
JP (1) JPH0827733B2 (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5748763A (en) * 1993-11-18 1998-05-05 Digimarc Corporation Image steganography system featuring perceptually adaptive and globally scalable signal embedding
US6560349B1 (en) 1994-10-21 2003-05-06 Digimarc Corporation Audio monitoring using steganographic information
JPH10149064A (ja) * 1996-11-19 1998-06-02 Canon Inc 画像処理装置
US6301670B1 (en) 1998-10-06 2001-10-09 Ricoh Corporation Method and apparatus for erasing data when a problem is identified
US6304948B1 (en) * 1998-10-06 2001-10-16 Ricoh Corporation Method and apparatus for erasing data after expiration
US7325052B1 (en) * 1998-10-06 2008-01-29 Ricoh Company, Ltd. Method and system to erase data after expiration or other condition
US6963884B1 (en) * 1999-03-10 2005-11-08 Digimarc Corporation Recoverable digital content degradation: method and apparatus
JP4034947B2 (ja) * 2001-05-31 2008-01-16 株式会社ルネサステクノロジ 不揮発性記憶システム
US7698502B2 (en) * 2002-07-24 2010-04-13 Seagate Technology Llc File recovery system for a removable portable memory device
US20060156381A1 (en) * 2005-01-12 2006-07-13 Tetsuro Motoyama Approach for deleting electronic documents on network devices using document retention policies
US8272028B2 (en) 2008-10-15 2012-09-18 Ricoh Company, Ltd. Approach for managing access to electronic documents on network devices using document retention policies and document security policies
JP4877396B2 (ja) * 2010-01-20 2012-02-15 日本電気株式会社 メモリ障害処理システム、および、メモリ障害処理方法
JP7332529B2 (ja) * 2020-04-21 2023-08-23 株式会社東海理化電機製作所 異常検出装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4703481A (en) * 1985-08-16 1987-10-27 Hewlett-Packard Company Method and apparatus for fault recovery within a computing system
US4740969A (en) * 1986-06-27 1988-04-26 Hewlett-Packard Company Method and apparatus for recovering from hardware faults
JPS6341943A (ja) * 1986-08-08 1988-02-23 Nec Corp 論理装置のエラ−回復方式
US5295258A (en) * 1989-12-22 1994-03-15 Tandem Computers Incorporated Fault-tolerant computer system with online recovery and reintegration of redundant components
JPH04266117A (ja) * 1991-02-21 1992-09-22 Canon Inc 記憶装置及び記憶制御方法
US5502728A (en) * 1992-02-14 1996-03-26 International Business Machines Corporation Large, fault-tolerant, non-volatile, multiported memory

Also Published As

Publication number Publication date
JPH0721049A (ja) 1995-01-24
US5630044A (en) 1997-05-13

Similar Documents

Publication Publication Date Title
JPH0827733B2 (ja) 障害処理システム
US4549295A (en) System for identifying defective media in magnetic tape storage systems
EP0403415A2 (en) System and method for detecting and diagnosing errors in a computer program
US6845469B2 (en) Method for managing an uncorrectable, unrecoverable data error (UE) as the UE passes through a plurality of devices in a central electronics complex
JPH0950424A (ja) ダンプ採取装置およびダンプ採取方法
JP4689792B2 (ja) Prom切替制御システム
JPH07281929A (ja) トレース情報収集装置
JPH0997197A (ja) 情報処理装置の自己診断方法
JPS63645A (ja) 情報処理装置
JPH02302834A (ja) 障害処理装置
JPS6155744A (ja) エラ−のリカバリ処理方式
JP2606160B2 (ja) パリティチェック回路の故障検出方式
JP4009431B2 (ja) 障害パス保存装置及びそれに用いる障害パス保存方法
JP3097621B2 (ja) 自己診断方式
JP2008217108A (ja) 予備系装置診断方法および予備系装置診断制御システム
JPH04349538A (ja) 障害装置の復旧方式
CN116489001A (zh) 交换机故障诊断及恢复方法、装置、交换机及存储介质
JPH0916442A (ja) Cpu保守システム
JPH01231153A (ja) 障害処理方式
JP2005234903A (ja) コンピュータシステム、入出力制御部及び入出力制御プログラム
JP2001256081A (ja) 情報処理装置
JPH0659984A (ja) メモリ障害処理方式
JPS6312037A (ja) 診断装置付電子計算機システム
JPH064334A (ja) 論理装置の故障診断方式
JPH1091543A (ja) 障害情報記録方法及び情報処理装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19960910

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080321

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090321

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090321

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100321

Year of fee payment: 14

LAPS Cancellation because of no payment of annual fees