JPS6336016B2 - - Google Patents

Info

Publication number
JPS6336016B2
JPS6336016B2 JP58182161A JP18216183A JPS6336016B2 JP S6336016 B2 JPS6336016 B2 JP S6336016B2 JP 58182161 A JP58182161 A JP 58182161A JP 18216183 A JP18216183 A JP 18216183A JP S6336016 B2 JPS6336016 B2 JP S6336016B2
Authority
JP
Japan
Prior art keywords
error
host computer
handler
data
failure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP58182161A
Other languages
English (en)
Other versions
JPS6074049A (ja
Inventor
Takeshi Ibusuki
Mikio Tsuchimochi
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP58182161A priority Critical patent/JPS6074049A/ja
Publication of JPS6074049A publication Critical patent/JPS6074049A/ja
Publication of JPS6336016B2 publication Critical patent/JPS6336016B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Test And Diagnosis Of Digital Computers (AREA)

Description

【発明の詳細な説明】 〔発明の技術分野〕 本発明は、サービス・プロセツサなどの保守診
断プロセツサのモードとしてRASモードを新設
し、RASモードであるときには、保守診断プロ
セツサの監視プログラムが一定時間間隔毎に
RAS試験プログラムを起動するようにした障害
処理機能の自動試験制御方式に関するものであ
る。
〔従来技術と問題点〕
従来のRAS試験といえば、マニユアルで行う
かスタンド・アロン型の試験プログラムで行なわ
れている。
このような従来方式だと、固定のタイミングで
試験をしているために漏れが生じ易い。ユーザの
使用する状況では、どのようなタイミングでエラ
ーが発生するのが予測がつかないために、エラー
処理のシーケンスを全てにわたつてチエツクする
ことができない。
〔発明の目的〕
本発明は、上記の考察に基づくものであつて、
オペレーテイング・システム(以下OSという)
動作中においても人手を介さずに計算機システム
のRAS機能(障害処理機能)を試験できるよう
になつた障害処理機能の自動診断制御方式を提供
することを目的としている。
〔発明の構成〕
そしてそのため、本発明の障害処理機能の自動
診断制御方式は、ホスト計算機と、該ホスト計算
機の保守診断を行う保守診断プロセツサとを具備
する計算機システムにおける障害処理機能の自動
診断制御方式であつて、上記保守診断プロセツサ
が、事象の発生をサイクリツクに監視し発生した
事象の種類に対応した処理プログラムを起動する
監視プログラムと、ホスト計算機のエラー情報の
収集などを行うマシンチエツク・ハンドラと、ホ
スト計算機にエラー・データをスキヤンインする
エラー発生部とエラー情報が期待値と一致するか
をチエツクするデータ・チエツク部とを持つ診断
プログラムとを有し、且つ上記監視プログラム
が、障害発生検出処理によつてホスト計算機の障
害発生を検出したときには上記マシンチエツク・
ハンドラを起動し、マシンチエツク・ハンドラか
ら制御権が戻されたとき所定モードであることを
条件として上記データ・チエツク部を起動し、上
記障害発生検出処理によつて障害発生が検出され
なかつたときには所定モードであり且つ所定タイ
ミングであることを条件として上記エラー発生部
を起動するように構成されていることを特徴とす
るものである。
〔発明の実施例〕
以下、本発明を図面を参照しつつ説明する。第
1図は本発明におけるSVP監視プログラムの動
作フローを示す図、第2図はRAS試験プログラ
ムのエラー発生部の動作フローを示す図、第3図
はRAS試験プログラムのデータ・チエツク部の
動作フローを示す図、第4図はマシンチエツク・
ハンドラの動作フローを示す図、第5図は本発明
が適用される計算機システムのハードウエア構成
の概要を示す図である。
第5図において、1は中央処理装置、2は主記
憶装置、3はサービス・プロセツサ、4はフロツ
ピイ・デイスク装置をそれぞれ示している。サー
ビス・プロセツサ3は、ハードウエア・コンソー
ルとしての機能やオペレータ・コンソールとして
の機能、保守コンソールとしての機能、保守診断
機能などを有している。サービス・プロセツサ3
は、中央処理装置1やその他の装置(図示せず)
の中のフリツプ・フロツプなどにデータをスキヤ
ンインすることができ、またこれらのフリツプ・
フロツプなどの状態を読取ることが出来る。更
に、サービス・プロセツサ3は、主記憶装置2に
データを書込んだり、主記憶装置2のデータを読
取つたりすることが出来る。フロツピイ・デイス
ク装置4には、ログ情報などが格納される。
サービス・プロセツサ3は、パトロール、
RAS試験プログラム及びハンドラを実行する。
中央処理装置1は、障害発生を検出すると、マシ
ンチエツク割込みでこれをサービス・プロセツサ
3に通知する。なお、中央処理装置側がホスト計
算機となる。
本発明を説明する前に、ユーザ先で障害が発生
した時にシステムがどういう動作を行うかを簡単
に述べる。
通常、ユーザではOSの下で計算機を運用する。
OSが実行中にハードウエアあるいはフアームウ
エアに障害が発生した場合、その障害通知がサー
ビス・プロセツサ3の監視プログラム(このプロ
グラムはキーボードからの割り込みやハードから
の割り込みなど、その他色々の監視を行なうもの
である)に渡される。
監視プログラム(以下、パトロールという)
は、エラー発生の割り込みだと認識すると、マシ
ンチエツクハンドラー(以下、ハンドラーと記
す)を起動する。ハンドラーの処理が終了する
と、パトロールは再びシステムの監視を行なう。
発生エラーの程度によつてシステムがダウンす
るか、続行可能かをフアームで認識して、OSに
通知する。
本発明は、OSが動きながらRAS試験プログラ
ムでエラーが発生させ計算機システムの持つ障害
処理機能が正常に動作しているかを試験するもの
である。
第1図のフローで示すようにパトロールは、
RAS試験モード(PFキー、あるいは他の方法で
SVPから設定できるようにする)にシステムが
なつている場合、一定時間間隔でRAS試験プロ
グラムとリンクをとり起動する。試験プログラム
では中央処理装置側にエラーを発生(スキヤンイ
ンで行う)させた後、再びパトロールに戻る。
パトロールで中央処理装置側のエラーを検出す
るとハンドラーに起動がかゝり、ハンドラーはロ
グ情報(エラー情報など)の収集及びエラーのリ
セツトなどの所定の処理を完了した後、RAS試
験モードの場合、試験プログラムに制御が移る。
RAS試験モードでない場合は、パトロールに戻
る。
試験プログラムでは、自分の起こしたエラーに
よつて作られるべきログ情報の期待値を持つてい
るので、その期待値とハンドラーのログを比較す
る。
第2図はRAS試験プログラムのエラー発生部
の動作フローを示す図である。このエラー発生部
は、マイクロのアドレス・コンベア・ストツプを
設定し、次に期待するアドレスでストツプしたか
否かを調べる。期待したアドレスでストツプした
場合には、中央処理装置などにエラー・データを
スキヤンインし、中央処理装置のマイクロプログ
ラムを走らせる。期待するアドレスでストツプし
なかつた場合には、パトロールに制御権を渡す。
第3図はRAS試験プログラムのデータ・チエ
ツク部の動作のフローである。このデータ・チエ
ツク部は、ログ情報が期待するものと一致しない
場合にはエラー・メツセージを表示し、しかる後
にパトロールにログ情報の不一致を通知する。ロ
グ情報が期待するものと一致した場合には、制御
権をパトロールに渡す。
第4図はマシンチエツク・ハンドラの動作フロ
ーである。このハンドラは、中央処理装置からマ
シン・チエツクが通知されたときにパトロールに
よつて起動されるものであるが、先ず中央処理装
置側のエラー情報の収集を行い、次にエラー・リ
セツトを行い、リトライ可能であるか否かを調べ
る。リトライ可能であればエラーの発生した命令
を中央処理装置1に再度実行させ、しかる後に制
御権をパトロールに渡し、リトライ不可ならば直
ちに制御権をパトロールに戻す。
〔発明の効果〕
以上の説明から明らかなように、本発明によれ
ば、OS下で計算機システムの障害処理機能の自
動試験を行うことが出来る。
【図面の簡単な説明】
第1図は本発明におけるSVP監視プログラム
の動作フローを示す図、第2図はRAS試験プロ
グラムのエラー発生部の動作フローを示す図、第
3図はRAS試験プログラムのデータ・チエツク
部の動作フローを示す図、第4図はマシンチエツ
ク・ハンドラの動作フローを示す図、第5図は本
発明が適用される計算機システムのハードウエア
構成の概要を示す図である。 1……中央処理装置、2……主記憶装置、3…
…サービス・プロセツサ、4……フロツピイ・デ
イスク装置。

Claims (1)

    【特許請求の範囲】
  1. 1 ホスト計算機と、該ホスト計算機の保守診断
    を行う保守診断プロセツサとを具備する計算機シ
    ステムにおける障害処理機能の自動診断制御方式
    であつて、上記保守診断プロセツサが、事象の発
    生をサイクリツクに監視し発生した事象の種類に
    対応した処理プログラムを起動する監視プログラ
    ムと、ホスト計算機のエラー情報の収集などを行
    うマシンチエツク・ハンドラと、ホスト計算機に
    エラー・データをスキヤンインするエラー発生部
    とエラー情報が期待値と一致するかをチエツクす
    るデータ・チエツク部とを持つ診断プログラムと
    を有し、且つ上記監視プログラムが、障害発生検
    出処理によつてホスト計算機の障害発生を検出し
    たときには上記マシンチエツク・ハンドラを起動
    し、マシンチエツク・ハンドラから制御権が戻さ
    れたとき所定モードであることを条件として上記
    データ・チエツク部を起動し、上記障害発生検出
    処理によつて障害発生が検出されなかつたときに
    は所定モードであり且つ所定タイミングであるこ
    とを条件として上記エラー発生部を起動するよう
    に構成されていることを特徴とする障害処理機能
    の自動診断制御方式。
JP58182161A 1983-09-30 1983-09-30 障害処理機能の自動試験制御方式 Granted JPS6074049A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58182161A JPS6074049A (ja) 1983-09-30 1983-09-30 障害処理機能の自動試験制御方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58182161A JPS6074049A (ja) 1983-09-30 1983-09-30 障害処理機能の自動試験制御方式

Publications (2)

Publication Number Publication Date
JPS6074049A JPS6074049A (ja) 1985-04-26
JPS6336016B2 true JPS6336016B2 (ja) 1988-07-18

Family

ID=16113416

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58182161A Granted JPS6074049A (ja) 1983-09-30 1983-09-30 障害処理機能の自動試験制御方式

Country Status (1)

Country Link
JP (1) JPS6074049A (ja)

Also Published As

Publication number Publication date
JPS6074049A (ja) 1985-04-26

Similar Documents

Publication Publication Date Title
US8132057B2 (en) Automated transition to a recovery kernel via firmware-assisted-dump flows providing automated operating system diagnosis and repair
JPH0950424A (ja) ダンプ採取装置およびダンプ採取方法
JPH02294739A (ja) 障害検出方式
JPS6336016B2 (ja)
JP6060781B2 (ja) 障害診断装置およびプログラム
JP2716537B2 (ja) 複合システムにおけるダウン監視処理方式
JP3334174B2 (ja) 障害処理検証装置
JPS6155748A (ja) 電子計算機システム
JP2004030513A (ja) バスモニタリングシステムおよびそのプログラム
CN114356708A (zh) 一种设备故障监控方法、装置、设备及可读存储介质
JPS6223335B2 (ja)
JP3019409B2 (ja) マルチプロセッサシステムのマシンチェックテスト方法
JPH01134637A (ja) 情報処理システムのストール監視方式
JPS59168529A (ja) イニシヤル・プログラム・ロ−ド方式
JPS63279337A (ja) 情報処理システムのスト−ル監視方式
JPS60107145A (ja) 計算機システムのテスト制御方式
JPH03278244A (ja) 周辺制御装置の障害解析情報収集方法
JP2584466B2 (ja) ディスクコントローラの自己診断方法
JPH0355640A (ja) 周辺制御装置の障害解析情報採取方式
JPS6146535A (ja) 擬似エラ−設定制御方式
JPH076103A (ja) 入出力チャネルの障害処理システム
JPH03242739A (ja) 障害解析情報収集方式
JPH0149975B2 (ja)
JPH0374737A (ja) 自動データ収集方式
JPS6295646A (ja) 走行監視機能付マイクロプログラム制御装置