JPH07117902B2 - 情報処理装置の再立ち上げ装置 - Google Patents

情報処理装置の再立ち上げ装置

Info

Publication number
JPH07117902B2
JPH07117902B2 JP1014457A JP1445789A JPH07117902B2 JP H07117902 B2 JPH07117902 B2 JP H07117902B2 JP 1014457 A JP1014457 A JP 1014457A JP 1445789 A JP1445789 A JP 1445789A JP H07117902 B2 JPH07117902 B2 JP H07117902B2
Authority
JP
Japan
Prior art keywords
data
main memory
information processing
read
diagnostic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP1014457A
Other languages
English (en)
Other versions
JPH02194444A (ja
Inventor
忠 原
淳 高橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP1014457A priority Critical patent/JPH07117902B2/ja
Publication of JPH02194444A publication Critical patent/JPH02194444A/ja
Publication of JPH07117902B2 publication Critical patent/JPH07117902B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Retry When Errors Occur (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は情報処理装置の再立ち上げ装置に関し、特に破
壊された場合に復旧困難な重要データを格納する重要領
域を主記憶に有する情報処理装置で主記憶障害が発生し
た場合に、前記重要領域の破壊の有無を検査して再立ち
上げの可否を決定する情報処理装置の再立ち上げ装置に
関する。
〔従来の技術〕
通常、情報処理装置で障害が検出された場合、この障害
が診断処理装置に報告され、この診断処理装置において
情報処理装置の再立ち上げ処理が実行されるようになっ
ている。即ち、診断処理装置は上記の報告を受けると、
情報処理装置の動作を止め、障害発生時の情報処理装置
内のソフトウェアビジブルな情報をスキャンパスと呼ば
れるパスにより抜き取り、情報処理装置をクリアして障
害を消した後に、抜き取ったソフトウェアビジブルな情
報を情報処理装置内に再設定する。これにより情報処理
装置はソフトウェアから見て障害発生時点と同じ動作状
態に設定される。情報処理装置の障害が固定の場合は再
度同じ障害が検出され動作不能状態となるが、間欠障害
であれば再立ち上げされることにより正常動作可能とな
る。
ところで、情報処理装置の構成制御情報や状態管理情報
など情報処理装置にとって重要なデータを主記憶の一部
の領域である重要領域に格納している情報処理装置にお
いては、その重要データは主記憶にしか存在しないた
め、それが破壊された場合の復旧が困難であり、情報処
理装置の正常動作に致命的な影響を与える。従って、重
要領域に障害が発生した場合には情報処理装置を再立ち
上げしてはならない。他方、重要領域以外の主記憶の他
の領域にはソフトウェアデータなど外部記憶装置の内容
でバックアップされたデータが記憶されているので、そ
れが破壊されても再ロードすることによって復旧が可能
であり、情報処理装置に致命的な影響は与えない。従っ
て、重要領域以外の主記憶の領域に障害が発生した場合
には情報処理装置の再立ち上げを行うことができる。
このように、重要領域を主記憶に有する情報処理装置で
は、障害箇所が重要領域か否かにより再立ち上げの可能
性が決定するため、それにかかる再立ち上げ制御時に障
害箇所が重要領域か否かを判定している。そしてこの判
定は従来次のようにして行われていた。
情報処理装置からの主記憶アクセスで障害が発生した場
合、障害が検出された主記憶アクセスアドレスが情報処
理装置内に保持されている。そこで診断処理装置は情報
処理装置から障害報告を受けると、その情報処理装置内
に保持されている主記憶アクセスアドレスが重要領域内
アドレスか否かを調べ、重要領域内アドレスであれば重
要領域に障害箇所が存在し、重要領域以外のアドレスで
あれば重要領域に障害箇所は存在しないと判定するもの
である。
〔発明が解決しようとする課題〕
上述の通り従来は、主記憶アクセスにかかる障害が発生
した場合、その障害箇所が重要領域におけるものか、重
要領域以外の領域におけるものかを、障害が検出された
主記憶アクセスアドレスそのもので判定し、再立ち上げ
の可能,不可能を決定していた。
しかし、主記憶の障害のケースとして連続アドレスの障
害があり、かかる障害については、障害が検出された主
記憶アクセスアドレスだけで障害箇所が重要領域かそれ
以外の領域か或いはその双方かを判断することは困難で
ある。即ち、連続アドレスの障害であって障害箇所が重
要領域とそれ以外の領域に存在する場合、重要領域以外
の領域に対するアクセスで障害が検出されると、重要領
域にも障害箇所が存在するにもかかわらず、従来におい
ては障害箇所が重要領域でないと判定され、再立ち上げ
可能と決定されてしまう。
本発明はこのような事情に鑑みて為されたものであり、
その目的は、主記憶にかかる障害の箇所を正確に突き止
め、重要領域に障害が存在する場合に再立ち上げ可能と
決定してしまうことのない情報処理装置の再立ち上げ装
置を提供することにある。
〔課題を解決するための手段〕
本発明は上記の目的を達成するために、破壊された場合
に復旧困難な重要データを格納する重要領域を含む主記
憶を備えた情報処理装置の再立ち上げを行う装置におい
て、前記主記憶の障害発生時に、前記主記憶に格納され
ているデータを読み出す診断リード手段と、この診断リ
ード手段により読み出されたデータのエラーを検出する
エラー検出手段と、前記診断リード手段により読み出さ
れたデータが前記重要領域内のデータか否かを判定する
判定手段と、この判定手段の判定結果および前記エラー
検出手段の検出結果に基づき、前記診断リード手段で読
み出された前記重要領域内のデータのエラー時には前記
情報処理装置の再立ち上げ処理を中止し、それ以外の場
合には再立ち上げ処理を続行する立ち上げ制御手段とを
有している。
〔作用〕
本発明の情報処理装置の再立ち上げ装置においては、主
記憶に障害が発生すると、診断リード手段が主記憶に格
納されているデータを読み出し、この読み出されたデー
タについて、エラー検出手段がエラーの有無を検出する
と共に判定手段が重要領域内のデータか否かを判定し、
これらの結果に基づいて立ち上げ制御手段が、診断リー
ド手段で読み出された重要領域内のデータのエラー時に
は情報処理装置の再立ち上げ処理を中止し、それ以外の
場合には再立ち上げ処理を続行する。
〔実施例〕
次に、本発明の実施例について図面を参照して詳細に説
明する。
第1図は本発明を適用した計算機システムの一例を示す
ブロック図であり、診断処理装置101と、情報処理装置1
02と、主記憶103と、エラー検出回路104とを含むシステ
ムを示す。
同図において、主記憶103は第2図にも示すように重要
領域103aとそれ以外の領域103bとから構成されている。
ここで、重要領域103aは0番地からBAR番地までの若い
アドレスに固定されており、復旧が困難な重要データを
格納する。また、他の領域103bにはソフトウェアデータ
等の復旧可能なデータを格納している。
エラー検出回路104は、主記憶103から読み出されたデー
タ(READ DATA)にエラーが存在するか否かを検出する
回路であり、エラーを検出したときはその旨の報告PTYE
Rをエラー報告線110を介して情報処理装置102および診
断処理装置101に出す。
情報処理装置102で実行されるソフトウェアは主記憶103
に格納されており、情報処理装置102は主記憶アクセス
用のアドレスレジスタ105にアドレス(MEM ADRS)を設
定することにより、主記憶103をアクセスすることがで
きる。即ち、データWRITE DATAを主記憶103に書き込む
ことができ、また主記憶103からデータ(READ DATA)を
読み出すことができる。この読み出されたデータは情報
処理装置102に加えられると共に、前述したエラー検出
回路104および診断処理装置101にも加えられている。な
お、後述する診断リード時に主記憶103から読み出され
たデータは、診断処置装置101においてログ情報として
図示しない外部記憶装置に格納される。また情報処理装
置102には障害検出機構(図示せず)があり、この機構
で障害が検出されると、障害報告CHECKが障害報告線111
を介して診断処理装置101に送出される。ここで、主記
憶103にかかる障害時には、先ず主記憶103から読み出さ
れたデータ(READ DATA)のエラーがエラー検出回路104
で検出されて情報処理装置102にエラー報告が為され、
この情報処理装置102から障害報告線111を介して診断処
理装置101に主記憶103に障害が発生した旨の報告が為さ
れる。
診断処理装置101は、情報処理装置102の再立ち上げを実
行する装置であり、スキャンパス113により情報処理装
置102のソフトウェアビジブルな情報を抜き取ったり、
逆に元に戻す手段や、情報処理装置102に対しデータ(D
ATA)を送出してそれぞれを制御する手段などに加え、
次のような手段を備えている。
・診断リード手段 主記憶103内のデータを抜き取るために、情報処理装置1
02内の主記憶アクセス用のアドレスレジスタ105に診断
リードアドレス設定パス112を介してアドレス(ADRS)
を設定することにより、主記憶103に格納されているデ
ータを読み出す手段である。なお、この診断リードの際
も読み出しデータのエラー検出がエラー検出回路104で
行われる。
・アドレス判定手段 上記の診断リード手段により読み出されたデータが重要
領域103a内のデータか否かを判定する手段である。これ
は本実施例においては、診断リードでアドレスレジスタ
105に設定した主記憶103のアドレス(ADRS)のコピー保
持する診断リードアドレスレジスタ106と、重要領域103
aの最大アドレスBAR(第2図参照)が設定された重要領
域境界アドレスレジスタ107と、両アドレスレジスタの
内容を比較し、診断リードアドレスレジスタ106に保持
されたアドレス(ADRS)が重要領域境界アドレスレジス
タ107に設定されたアドレス(BAR)以下であるとき、重
要領域103a内のデータがリードされたことを再立ち上げ
制御手段109に通知する比較器108とで構成される。
・再立ち上げ制御手段109 情報処理装置102の再立ち上げにかかる主たる制御を行
う手段である。この再立ち上げ制御手段109は、主記憶1
03の重要領域103a内のアドレスに対する診断リード時
に、エラー検出回路104で読み出しデータのエラーが検
出された場合、再立ち上げ処理を中止し、重要領域103a
以外の領域103bのアドレスに対する診断リードで、読み
出しデータのエラーが検出された場合は重要領域103a以
外の全主記憶データを再設定することにより再立ち上げ
処理を継続する機能を有している。
次に、このように構成された本実施例の動作を説明す
る。
情報処理装置102で何等かの障害が検出された場合、こ
れが障害報告線111を介して診断処理装置101に報告され
る。診断処理装置101はこの報告を受けて、情報処理装
置102内のソフトウェアビジブルな情報をスキャンパス1
13にて抜き取る処理,主記憶103内のデータを診断リー
ドにより読み出しつつ再立ち上げの可能性を判断する処
理を行い、また再立ち上げ可能と判断した場合に情報処
理装置102をクリアする処理,抜き取ったソフトウェア
ビジブルな情報を情報処理装置102に再設定する処理,
重要領域103a以外の主記憶データの再ロード処理を行っ
た後に情報処理装置102を動作可能な状態にする処理等
を実行する。
第3図は再立ち上げ制御手段109が行う上述した処理の
うち、障害報告線111を介して情報処理装置102から主記
憶103のアクセスエラーが報告された際に実行される処
理の一部を示している。同図に示すように、主記憶アク
セスエラー時には、診断リードによって主記憶103から
データを1つずつ読み出し(S1)、この読み出しデータ
についてエラー検出回路104でエラーが検出されたか否
かをチェックする(S2)。エラーが検出されれば、その
リードアドレス(ADRS)のコピーを保持する診断リード
アドレスレジスタ106と重要領域103aの最大アドレス(B
AR)が設定された重要領域境界アドレスレジスタ107と
を比較している比較器108の出力をチェックして、今回
の診断リードのアクセスが重要領域103aにおけるものか
否かを判定し(S3)、重要領域103aのアクセスであれば
再立ち上げ不可能と判断して再立ち上げ処理を中止す
る。また、今回の読み出しデータについてエラーが検出
されないか或いは検出されても重要領域103aのデータで
なければ、主記憶103の全アドレスについて診断リード
したか否かを判定し(S4)、終了していなければ処理S1
に戻って次のデータの診断リードを行う。また全アドレ
スを終了していれば再立ち上げ可能と判断して再立ち上
げ処理を続行する。以上のように個々の主記憶データを
診断リードで抜き取るごとに、データの正常性を確かめ
ることで主記憶103内の障害箇所を網羅し、その結果に
応じて再立ち上げの可能性を決定する。なお、主記憶10
3における重要領域103aのサイズはごく小さなものであ
り、間欠障害のほとんどの場合は再立ち上げすることに
より復旧可能である。
〔発明の効果〕
以上説明したように、本発明の情報処理装置の再立ち上
げ装置においては、主記憶にかかる障害の発生時に、主
記憶のデータを順次読み出してエラーの有無をチェック
すると共にそのデータが重要領域内のデータか否かをチ
ェックするものであり、主記憶内の障害箇所を網羅する
ことができるので、主記憶にかかる障害の箇所を正確に
突き止めることができ、重要領域に障害が存在する場合
に再立ち上げ可能と決定し重要領域内のデータが不正の
まま再立ち上げが実行されるのを確実に防止することが
できる効果がある。
【図面の簡単な説明】
第1図は本発明を適用した計算機システムの一例を示す
ブロック図、 第2図は主記憶103の構成例を示す図および、 第3図は再立ち上げ制御手段109の処理の一部を示す流
れ図である。 図において、 101……診断処理装置 102……情報処理装置 103……主記憶 103a……重要領域 103b……重要領域以外の領域 104……エラー検出回路 105……主記憶アクセス用のアドレスレジスタ 106……診断シードアドレスレジスタ 107……重要領域境界アドレスレジスタ 108……アドレスの比較器 109……再立ち上げ制御手段 110……エラー報告線 111……障害報告線 112……診断リードアドレス設定パス 113……スキャンパス

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】破壊された場合に復旧困難な重要データを
    格納する重要領域を含む主記憶を備えた情報処理装置の
    再立ち上げを行う装置において、 前記主記憶の障害発生時に、前記主記憶に格納されてい
    るデータを読み出す診断リード手段と、 該診断リード手段により読み出されたデータのエラーを
    検出するエラー検出手段と、 前記診断リード手段により読み出されたデータが前記重
    要領域内のデータか否かを判定する判定手段と、 該判定手段の判定結果および前記エラー検出手段の検出
    結果に基づき、前記診断リード手段で読み出された前記
    重要領域内のデータのエラー時には前記情報処理装置の
    再立ち上げ処理を中止し、それ以外の場合には再立ち上
    げ処理を続行する立ち上げ制御手段とを有することを特
    徴とする情報処理装置の再立ち上げ装置。
JP1014457A 1989-01-24 1989-01-24 情報処理装置の再立ち上げ装置 Expired - Lifetime JPH07117902B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1014457A JPH07117902B2 (ja) 1989-01-24 1989-01-24 情報処理装置の再立ち上げ装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1014457A JPH07117902B2 (ja) 1989-01-24 1989-01-24 情報処理装置の再立ち上げ装置

Publications (2)

Publication Number Publication Date
JPH02194444A JPH02194444A (ja) 1990-08-01
JPH07117902B2 true JPH07117902B2 (ja) 1995-12-18

Family

ID=11861574

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1014457A Expired - Lifetime JPH07117902B2 (ja) 1989-01-24 1989-01-24 情報処理装置の再立ち上げ装置

Country Status (1)

Country Link
JP (1) JPH07117902B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020081661A (ja) * 2018-11-29 2020-06-04 キヤノン株式会社 放射線撮影システム、制御装置、制御方法及びプログラム

Also Published As

Publication number Publication date
JPH02194444A (ja) 1990-08-01

Similar Documents

Publication Publication Date Title
US6502208B1 (en) Method and system for check stop error handling
US5948112A (en) Method and apparatus for recovering from software faults
US5768496A (en) Method and apparatus for obtaining a durable fault log for a microprocessor
US6516429B1 (en) Method and apparatus for run-time deconfiguration of a processor in a symmetrical multi-processing system
US6012154A (en) Method and apparatus for detecting and recovering from computer system malfunction
US6438709B2 (en) Method for recovering from computer system lockup condition
US6550019B1 (en) Method and apparatus for problem identification during initial program load in a multiprocessor system
US6763456B1 (en) Self correcting server with automatic error handling
JP3481737B2 (ja) ダンプ採取装置およびダンプ採取方法
JPH07134678A (ja) Ram保護装置
US7139942B2 (en) Method and apparatus for memory redundancy and recovery from uncorrectable errors
JP3030658B2 (ja) 電源故障対策を備えたコンピュータシステム及びその動作方法
JPH05225067A (ja) 重要メモリ情報保護装置
EP0125797B1 (en) Interrupt signal handling apparatus
JP3711871B2 (ja) Pciバスの障害解析容易化方式
JPH02156357A (ja) プログラム破壊防止方法
JP3070453B2 (ja) 計算機システムのメモリ障害回復方法および回復システム
JPH07117902B2 (ja) 情報処理装置の再立ち上げ装置
JP3357777B2 (ja) プログラム制御システム
JP3342039B2 (ja) ファイルを管理する処理装置
JPH03130835A (ja) 情報処理装置の再立ち上げ装置
AU683958B2 (en) Microprocessor fault log
JPH04365145A (ja) メモリ障害処理方法
JPH06282451A (ja) マイクロプロセッサを備えた装置のシステムダウン復旧方法
JPH04125753A (ja) メモリのオンライン診断方式