JPH064409A - メモリ障害処理方式 - Google Patents

メモリ障害処理方式

Info

Publication number
JPH064409A
JPH064409A JP4160886A JP16088692A JPH064409A JP H064409 A JPH064409 A JP H064409A JP 4160886 A JP4160886 A JP 4160886A JP 16088692 A JP16088692 A JP 16088692A JP H064409 A JPH064409 A JP H064409A
Authority
JP
Japan
Prior art keywords
failure
memory
fault
intermittent
address
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP4160886A
Other languages
English (en)
Inventor
Keiichiro Kato
啓一郎 加藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Solution Innovators Ltd
Original Assignee
NEC Software Hokuriku Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Software Hokuriku Ltd filed Critical NEC Software Hokuriku Ltd
Priority to JP4160886A priority Critical patent/JPH064409A/ja
Publication of JPH064409A publication Critical patent/JPH064409A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Techniques For Improving Reliability Of Storages (AREA)
  • Debugging And Monitoring (AREA)

Abstract

(57)【要約】 【目的】ハードウェア構造に基づいたメモリ障害の障害
波及範囲パターンにより、故障部品を決定して、その部
品に対応するメモリエリアのみ切り離す。また、間欠故
障の場合には、障害波及範囲パターンにより、故障し易
い部品を判定して、警告メッセージ又は、メモリ切り話
しを行う。 【構成】固定故障が発生した時に障害波及範囲パターン
31の情報を基に固定障の波及範囲を判別し、その部分
をシステムから切り離す固定故障切り離し手段11と、
間欠故障が発生した時に、その障害発生回数を障害波及
範囲パターン31で示される単位で計算する間欠故障計
測手段13とを有している。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明はメモリ障害処理方式に関
する。
【0002】
【従来の技術】従来、この種のメモリ障害処理方式で
は、固定故障が発生した場合には、その障害アドレスを
含む一定のメモリ領域をシステムから切り離し間欠故障
が発生した場合には、リトライを行っていた。
【0003】
【発明が解決しようとする課題】上述した従来のメモリ
障害処理方式では、固定故障が発生した時に、その障害
アドレスを含む一定のメモリ領域をシステムから切り離
すために、一定のメモリ領域を越えた障害の場合は再び
他のメモリ領域で固定故障が発生し、一定のメモリより
小さい固定故障の場合には、余分にメモリを切り離すと
いう無駄が発生するという欠点があった。また、間欠故
障の場合には、単純にリトライを行うための間欠故障が
頻発し、システムダウンにつながる可能性が高くなると
いう欠点があった。
【0004】
【課題を解決するための手段】第一の発明の障害処理方
式はハードウェアては救済不可能なメモリ障害が発生し
た場合、システムか障害部分を含むメモリの一部を切り
離して運転を継続するようにメモリ障害処理を行う情報
処理装置において、メモリ障害が発生した時に固定故障
から間欠故障かを判別する故障種判別手段と、メモリの
ハードウェア構造に基づいたメモリ障害の障害波及範囲
パターンと、固定故障が発生した時に前記障害波及範囲
パターンの情報を基に固定故障の波及範囲を判別し、そ
の部分をシステムから切り離す故障切り離し手段と、間
欠故障が発生した時にシステムに対して、リトライを要
求するリトライ要求手段とを有している。
【0005】第二の発明のメモリ障害処理方式は、第一
の発明のメモリ障害処理方式において、間欠故障が発生
した時に、その障害発生回数を前記生涯波及範囲パター
ンで示される単位で計測する間穴故障計測手段とを有し
ている。
【0006】第三の発明のメモリ障害処理方式は、第二
の発生のメモリ障害処理方式において、前記間欠故障計
測手段で格納された間欠故障情報を解析して故障し易い
部品(メモリ領域)があれば、警告メッセージを出力す
る間欠故障警告手段とを有している。
【0007】第四の発明のメモリ障害処理ほ式は、第三
のメモリ障害処理方式において、前記間欠故障警告手段
で故障し易い部品(メモリ領域)があると判別された場
合、前記間欠故障領域計測手段で格納された間欠故障情
報を再び解析して、継続使用が困難な部品(メモリ領
域)をシステムから切り離す間欠故障切り離し手段とを
有している。
【0008】第五の発明のメモリ障害処理方式は、第四
の発明のメモリ障害処理方式において、固定故障及び間
欠故障により切り離されたメモリ領域を記憶し、システ
ムを再立ち上げした際に前記メモリ領域を切り離し記憶
手段とを有している。
【0009】第六の発明による障害処理方式は、第五の
メモリ障害処理方式において、前記間欠故障計測手段で
格納された間欠故障情報を記憶し、システムを再立ち上
げした際も再び継続して計算することを可能にする間欠
故障記憶手段とを有している。
【0010】第七の発明のメモリ障害処理方式は、第六
の発明のメモリ障害処理方式において、前記障害波及範
囲パターンをメモリのハードウェア設計情報ファイルを
基に、自動的に生成する波及範囲パターン格納手段とを
有している。
【0011】
【実施例】次に本発明について、図面を参照して説明す
る。
【0012】図1は本発明の一実施例を示すブロックて
あり、故障種別判別手段10、固定故障切り離し手段1
1リトライ要求手段12、間欠故障計測手段14、間欠
故障切り離し手段15、メモリ切り離し手段16、間欠
故障記憶手段17、波及範囲パターン格納手段18、メ
モリ(主記憶装置)20、ローカルメモリ30、出力装
置40、メモリ20上で動作するOS(オペレーティン
グシステム)50、外部記憶装置60、メモリ20の設
計が格納されているハードウェア設計情報ファイル70
から構成されている。ローカルメモリ内には障害波及範
囲パターン31と間欠故障情報32が記憶されている。
【0013】図2はメモリ20のハードウェア構成を示
している。チップAとチップBの制御回路が制御部S
1,チップCとチップDの制御回路が制御部S2,チッ
プEとチップFの制御回路が制御部S3となっている。
【0014】図3は障害波及範囲パターン31の情報を
示している。部品名は図2のチップA〜F,制御部S1
〜S3であり、それぞれの部品の対応するメモリエリア
の先頭アドレスと終了アドレスを示している。
【0015】図4は間欠故障情報32の内容を示してい
る。部品名は図3の部品名と同様であり、それぞれの部
品で発生した間欠故障発生回数を示している。
【0016】図5は外部記憶装置に格納されているメモ
リ切り離し情報を示している。メモリ切り離し情報は前
記固定故障切り離し手段11及び間欠故障切り離し手段
15によって切り離されたメモリエリアの先頭アドレス
と終了アドレスを示している。
【0017】図6はハードウェアでは救済不可能なメモ
リ障害が発生した場合の動作フローを示している。
【0018】次に動作を説明する。まず、メモリ20に
ハードウェアで救済不可能なメモリ障害が発生すると、
故障種別判別手段10に割り込みが発生し、メモリ障害
となった障害アドレスが通知される(図6ステップ10
0)。故障種別判別手段10は、前記障害アドレスをリ
ードチェックし、再度メモリ障害が発生するかどうか判
別する(図6スップ101)。
【0019】再度メモリ障害が発生したならば、固定故
障だと判定し、固定故障切り離し手段11を起動する
(図6ステップ102)。固定故障手段11は、ローカ
ルメモリ30内に予め格納されいる障害波及範囲パター
ン31から前記障害アドレスに対応する部品名を決定
し、その部品名の先頭アドレスと終了アドレスをリード
チェックすることにより、故障部品を決定する(図6ス
テップ120)。例えば、障害アドレスが150番地で
あった場合、その障害アドレスに対応する部品名は、こ
の例(図3)ではBとS1となり、部品S1の先頭アド
レス000番地と終了アドレス199番地をリードチェ
ックすることにより、メモリ障害となった場合は故障部
品はS1と決定し、メモリ障害とならなかった場合は故
障部品はBと決定する。
【0020】次に、故障部品を決定した後、その先頭ア
ドレスと終了アドレスをOS50に通知しメモリ切り離
し要求を行う。OS50でのメモリ切り離しが終了後、
前記故障部品の先頭アドレスと終了アドレスをメモリ切
り離し記憶手段16に通知して起動する(図6ステッ
プ)。メモリ切り離し記憶手段16は前記故障部品の先
頭アドレスと終了アドレスを外部記憶装置60にメモリ
切り離し情報として記憶する(図6ステップ111)。
【0021】故障種別判別手段10により前記障害アド
レスをリードチェックして、再度メモリ障害が発生しな
かった場合は、間欠故障だと判定し、リトライ要求手段
12を起動する(図6ステップ102)。リトライ要求
手段12は、OS50に対してリトライを要求後、間欠
故障計測手段13を起動する(図6ステップ103)。
間欠故障計測手段13は、障害波及範囲パターン31か
ら前記障害アドレスに対応する部品名を決定し、その部
品名に対応する間欠故障情報32の間欠故障発生回数を
カウントアップした後、間欠故障警告手段14を起動す
る(図6ステップ104)。間欠故障警告手段14は、
間欠故障情報32内を検索し、警告規定値以上ならば、
出力装置40にその部品名に対する警告メッセージを出
力する(図6ステップ105,106,107)。次
に、間欠故障切り離し手段15が起動される。
【0022】間欠故障切り離し手段15は、間欠故障情
報32内を検索し、切り離し規定以上の部品があった場
合、その先頭のアドレスをOS50に通知し、メモリ切
り離し要求を行う(図6ステップ108,109,11
0)。例えば、警告規定値が5、切り離し規定値が10
であった場合、この例(図4,図5)では、部品Dと部
品S2の警告メッセージが出力され、部品がシステムか
ら切り離される。
【0023】次に、OSでの切り離しが終了後、前記部
品の先頭アドレスをメモリ切り離し記憶手段16に通知
して起動する。メモリ切り離し記憶手段16は前記故障
部品の先頭アドレスと終了アドレスを外部記憶装置60
にメモリ切り離し情報として記憶する(図6ステップ1
11)。
【0024】一方リトライ要求手段12によりリトライ
を要求されたOS50は、リトライ終了後に間欠故障記
憶手段17を起動する。間欠故障記憶手段17は、間欠
故障情報32を外部記憶装置に格納する。
【0025】次にシステム一旦ストップし再立ち上げし
た際の動作について説明する。GS50にスタートアッ
プした切り離し情報から以前固定故障及び間欠故障多発
により切り離されていたメモリエリアを再度システムか
ら切り離す。例えば、この例(図6)の場合、システム
の再立ち上げ時に、外部記憶装置60に格納されている
メモリ切り離し情報(図5)により、メモリの300〜
199番地がシステムから切り離される。また、外部記
憶装置60に格納されている間欠故障情報はローカルメ
モリに再度格納され、以前計測していた間欠故障発生回
数が引き続き計測される。
【0026】また、障害波及範囲パターン31は予めシ
ステムに以下のように生成される。波及範囲格納手段1
8を外部より起動すると、波及格納手段18はハードウ
ェア設計情報ファイル70を入力として、障害波及範囲
パターン31を自動的に生成し、ローカルメモリ30内
に格納する。
【0027】
【発明の効果】以上説明したように、本発明はハードウ
ェアでは救済不可能なメモリ障害が発生した場合、メモ
リのハードウェア構造に基づいたメモリ障害の障害波及
範囲パターンにより、故障部品を決定して、その部品に
対応するメモリエリアのみ切り離したメモリ領域以外で
メモリ障害が再発することがなく、また、最小限のメモ
リ領域のみ切り離すため、メモリの使用効率がよい。ま
た、間欠故障の場合には、前記故障波及範囲パターンに
より故障し易い部品を判定して、警告メッセージ又はメ
モリ切り離しを行うため、メモリ障害多発によって起き
るシステムダウンの発生頻度を少なくすることができる
という効果がある。
【図面の簡単な説明】
【図1】本発明の一実施例を示すブロック図である。
【図2】メモリのハードウェア構成を示す図である。
【図3】障害波及範囲パターンの内容の一例を示す図で
ある。
【図4】間欠故障情報の内容の一例を示す図である。
【図5】メモリ切り離し情報の内容の一例を示す図であ
る。
【図6】メモリ障害発生時の動作を示すフローチャート
である。
【符号の説明】
10 故障種別判別手段 11 固定故障切り話し手段 12 リトライ要求手段 13 間欠故障計測手段 14 間欠故障警告手段 15 間欠故障切り離し手段 16 メモリ切り離し記憶手段 17 間欠故障記憶手段 18 波及範囲パターン格納手段 20 メモリ 30 ローカルメモリ 40 出力装置 50 OS 60 外部記憶装置 70 ハードウェア設計情報ファイル

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 メモリ障害が発生した時に固定故障か間
    欠故障を判別する故障種別判別手段と、メモリのハード
    ウェア構造に基づいたメモリ障害を障害波及範囲パター
    ンと固定故障が発生する時に前記生涯波及範囲パターン
    の情報を基に固定故障の波及範囲を判別しその部分をシ
    ステムから切り離し固定故障切り離し手段と、間欠故障
    が発生した時にシステムに対してリトライを要求する要
    求手段とを有することを特徴とするメモリ障害処理方
    式。
  2. 【請求項2】 間欠故障が発生した時に、その障害発生
    回数を前記障害波及範囲パターンで示される単位で計算
    する間欠故障計測手段を有する請求項1の記載メモリ障
    害処理方式。
  3. 【請求項3】 前記間欠故障計測手段で格納された間欠
    故障情報を解析して故障し易い部品(メモリ領域)があ
    れば、警告メッセージを出力する間欠故障手段を有する
    請求項2の記載メモリ障害処理方式。
  4. 【請求項4】 前記間欠故障警告手段で故障し易い部品
    (メモリ領域)があると判断された場合、前記間欠故障
    計測手段で格納された間欠故障情報を再び解析して、継
    続使用が困難な部品(メモリ領域)をシステムから切り
    離す間欠故障切り離し手段を有する請求項3記載をメモ
    リ障害処理方式。
  5. 【請求項5】 固定故障及び間欠故障により切り離され
    たメモリ領域を記憶し、システムを再立ち上げする際に
    前記メモリ領域を切り離すメモリ切り離し記憶手段を有
    する請求項4記載のメモリ障害処理方式。
  6. 【請求項6】 前記間欠故障計測手段で格納された間欠
    故障情報を記憶し、システムを再立ち上げした際も再び
    継続して計算することを可能にする間欠故障手段を有す
    る請求項5記載のメモリ障害処理方式。
  7. 【請求項7】 前記障害波及範囲パターンをメモリのハ
    ードウェア設計情報ファイルを基に、自動的に生成する
    波及範囲パターン格納手段を有する請求項6記載のメモ
    リ障害処理方式。
JP4160886A 1992-06-19 1992-06-19 メモリ障害処理方式 Withdrawn JPH064409A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4160886A JPH064409A (ja) 1992-06-19 1992-06-19 メモリ障害処理方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4160886A JPH064409A (ja) 1992-06-19 1992-06-19 メモリ障害処理方式

Publications (1)

Publication Number Publication Date
JPH064409A true JPH064409A (ja) 1994-01-14

Family

ID=15724497

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4160886A Withdrawn JPH064409A (ja) 1992-06-19 1992-06-19 メモリ障害処理方式

Country Status (1)

Country Link
JP (1) JPH064409A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09146849A (ja) * 1995-11-21 1997-06-06 Nec Corp 情報処理システム及びそのメモリ再構成方法
JP2008305249A (ja) * 2007-06-08 2008-12-18 Mitsubishi Electric Corp 衛星搭載用データレコーダ
KR101105150B1 (ko) * 2006-04-10 2012-01-17 주식회사 만도 제동장치 및 그 브레이크 디스크의 수막제거방법
TWI663074B (zh) * 2015-04-07 2019-06-21 日商新克股份有限公司 功能性筒體的製造方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09146849A (ja) * 1995-11-21 1997-06-06 Nec Corp 情報処理システム及びそのメモリ再構成方法
KR101105150B1 (ko) * 2006-04-10 2012-01-17 주식회사 만도 제동장치 및 그 브레이크 디스크의 수막제거방법
JP2008305249A (ja) * 2007-06-08 2008-12-18 Mitsubishi Electric Corp 衛星搭載用データレコーダ
TWI663074B (zh) * 2015-04-07 2019-06-21 日商新克股份有限公司 功能性筒體的製造方法

Similar Documents

Publication Publication Date Title
US6502206B1 (en) Multi-processor switch and main processor switching method
US4593391A (en) Machine check processing system
JP3481737B2 (ja) ダンプ採取装置およびダンプ採取方法
US6279120B1 (en) Method for storing computer status data given a malfunction that requires a subsequent restarting of the computer
JPS6375963A (ja) システム回復方式
US7206975B1 (en) Internal product fault monitoring apparatus and method
JPH064409A (ja) メモリ障害処理方式
JPH08286990A (ja) 電子メール連動型障害監視システム
CN112068935A (zh) kubernetes程序部署监控方法、装置以及设备
JP3022687B2 (ja) メモリ障害処理方式
JP2005293325A (ja) データベースの即時レプリケーション性能監視システム
JPS6310463B2 (ja)
JP3055507B2 (ja) 電話交換機のアラーム簡易ログ方式および該方式を実現するための制御プログラムを記録した記録媒体
JPH0651864A (ja) 計算機
JPH0818559A (ja) 管理処理装置
CN114020399A (zh) 一种交换机操作系统服务故障侦测方法及装置
CN115499299A (zh) 一种集群设备监控方法及装置
JPH0619744A (ja) マルチプロセッサシステムの動作監視方式
JPH10171683A (ja) 故障情報管理装置
JPH09218835A (ja) リモート保守方式
JPH05233341A (ja) 業務処理プログラムの再起動制御方式
CN113934608A (zh) 数据库的故障诊断方法、装置、主机及存储介质
JP4983806B2 (ja) 二重化タイマを用いたシステム監視装置、および監視方法
CN115952019A (zh) 一种容器集群保护方法、装置及存储介质
CN116263696A (zh) 一种机房任务通知处理方法、装置及任务通知处理系统

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 19990831