JP2000284992A - 情報処理システム及びそれに用いるホスト監視方法並びにその制御プログラムを記録した記録媒体 - Google Patents

情報処理システム及びそれに用いるホスト監視方法並びにその制御プログラムを記録した記録媒体

Info

Publication number
JP2000284992A
JP2000284992A JP11089643A JP8964399A JP2000284992A JP 2000284992 A JP2000284992 A JP 2000284992A JP 11089643 A JP11089643 A JP 11089643A JP 8964399 A JP8964399 A JP 8964399A JP 2000284992 A JP2000284992 A JP 2000284992A
Authority
JP
Japan
Prior art keywords
monitoring
service processor
failure
control device
diagnostic control
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11089643A
Other languages
English (en)
Inventor
Masakazu Tashiro
正和 田代
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Engineering Ltd
Original Assignee
NEC Engineering Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Engineering Ltd filed Critical NEC Engineering Ltd
Priority to JP11089643A priority Critical patent/JP2000284992A/ja
Publication of JP2000284992A publication Critical patent/JP2000284992A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

(57)【要約】 【課題】 精度の向上及び稼働率の向上を図ることが可
能な情報処理システムを提供する。 【解決手段】 情報処理システムの監視に必要なデータ
は主記憶装置2のホストコマンド制御データ格納部21
を媒介にして、中央処理装置1から診断制御装置3へ、
診断制御装置3からサービスプロセッサ4へと受渡さ
れ、サービスプロセッサ4にて情報処理システムの監視
を行う。情報処理システムの監視中に診断制御装置3あ
るいはサービスプロセッサ4が障害になると、自装置に
おいて復旧動作を行った後にホストコマンド処理を実行
できるかどうかを判断する。診断制御装置3あるいはサ
ービスプロセッサ4は実行可能であればホストコマンド
処理に必要なデータを生成し、コマンド実行の再開を中
央処理装置1に通知することで、自動的にホストコマン
ド処理を再開する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は情報処理システム及
びそれに用いるホスト監視方法並びにその制御プログラ
ムを記録した記録媒体に関し、特に中央処理装置と診断
制御装置及びサービスプロセッサにて構成される単一の
情報処理システムに関する。
【0002】
【従来の技術】中央処理装置と診断制御装置及びサービ
スプロセッサとから構成されている単一の情報処理シス
テムでは、通常のシステムの運用に影響のない診断制御
装置及びサービスプロセッサを利用してホストの監視を
行っている。しかしながら、通常のシステム運用に影響
のない診断制御装置及びサービスプロセッサが障害とな
った場合には、ホストの監視が停止または矛盾を検出し
てシステム停止となってしまう。
【0003】そこで、ホストの監視をできる限り継続ま
たは再開させるために、診断制御装置及びサービスプロ
セッサが動作可能となったことを認識し、ホストの監視
を再開させる方法が必要となる。
【0004】従来の情報処理システムのホスト監視方法
としては、ウォッチドッグタイマ機構をハードウェアと
して取り入れることで、情報処理システムがストールし
ているか否かを検出する方法が一般的である。
【0005】このような従来のホスト監視方法として
は、例えば特開平1−134637号公報に記載された
方法がある。この方法によると、オペレーティングシス
テムからウォッチドッグタイマの起動や停止、及びタイ
マ値の設定を制御することによって、ウォッチドッグタ
イマのランアウトを検出することで情報処理システムの
ストールを監視している。
【0006】従来の情報処理システムのホスト監視方法
の構成を図7に示す。この図7を参照すると、従来の情
報処理システムは演算処理装置5と、主記憶装置6と、
システム制御装置7と、サービスプロセッサ8と、入出
力処理装置9と、入出力処理装置9に接続されるI/O
(入出力)装置10とから構成されている。
【0007】システム制御装置7は演算処理装置5と主
記憶装置6とサービスプロセッサ8と入出力処理装置9
とにそれぞれ接続され、ウォッチドッグタイマ71とイ
ンディケータ72と通知手段73とを備えている。
【0008】上記の構成の情報処理システムにて実現し
ているホスト監視方法は、オペレーティングシステムの
立上げ時にシステム制御装置7内のウォッチドッグタイ
マ71にタイマ値(例えば、15秒等)を設定した後、
ウォッチドッグタイマ71が起動され、設定されたタイ
マ値が減算(−1づつ)され始める。その後、オペレー
ティングシステムは定期的(例えば、10秒毎)にウォ
ッチドッグタイマ71にタイマ値の設定及び起動を実施
する。
【0009】何らかの理由によってオペレーティングシ
ステムがタイマ値の設定及び起動を行うことができなく
なると、システム制御装置7内のウォッチドッグタイマ
71に設定されたタイマ値が0となり、ウォッチドッグ
タイマ71のランアウトが発生する。
【0010】そのウォッチドッグタイマ71のランアウ
トをトリガとして情報処理システムの異常を検出し、ラ
ンアウトが発生した時の状態によってオペレーティング
システム自らストールの原因を採取して情報処理システ
ムを停止させたり、またはサービスプロセッサ8が演算
処理装置5と主記憶装置6とシステム制御装置7と入出
力処理装置9とにおけるハードウェア情報を採取した
後、情報処理システムを停止させる。
【0011】上記のような方法とは違う他のホスト監視
方法としては、特開平1−251839号公報に記載さ
れた方法がある。この方法によると、ホスト装置側にホ
スト装置の機能試験を一定時間間隔で繰返し行い、その
結果、正常であると認識されれば正常信号を伝送路を介
して端末装置側に送信する。端末装置側ではホスト装置
側からの正常信号を受信し、またその正常信号の時間間
隔を監視することで、ホスト装置側からの正常信号の時
間間隔がしきい値を越えると、ホスト装置側の異常を検
出して警報動作を実施している。
【0012】また、別のホスト監視方法としては、特開
平10−171769号公報に記載された方法がある。
この方法によると、複数の計算機システムと、複数の計
算機システムの稼働状態を監視して他の計算機システム
ヘ通知する運転監視装置とがネットワークを介して接続
され、上記の計算機システム内には自らの計算機システ
ムの稼働状態をサービスプロセッサによって監視する稼
働状態監視手段を備え、計算機システムの稼働状態に変
化があれば、運転監視装置を介して他の計算機システム
へと通知している。
【0013】上記の計算機システム内のサービスプロセ
ッサは上記の運転監視装置の監視も行うことによって、
計算機システムのみならず運転監視装置及び伝送路でも
あるネットワークの監視をも実施している。
【0014】
【発明が解決しようとする課題】上述した従来の単一の
情報処理システムでは、ホストの監視をできる限り継続
または再開させるために、診断制御装置及びサービスプ
ロセッサが動作可能となったことを認識し、ホストの監
視を再開させる方法が必要となる。
【0015】そこで、上述したようなホスト監視方法が
提案されているが、ホスト監視方法では、システム制御
装置あるいはそれに相当する装置にウォッチドッグタイ
マ機構を設けねばならないので、ウォッチドッグタイマ
機構が障害となった場合に情報処理システムがどのよう
な状態となっているのかわからないという問題がある。
【0016】この情報処理システムの状態がどうなって
いるのかわからないのは、情報処理システムを監視する
ために設けたウォッチドッグタイマ機構が障害となるこ
とで、情報処理システムのストールを監視する方法がな
くなり、情報処理システムがストールしていてもその原
因を調査するために必要なデータが採取できなくなるか
らである。また、情報処理システムのストールを監視す
ることができなくなることから、ウォッチドッグタイマ
機構の障害時には情報処理システムを強制的に停止させ
て障害データを採取するとういう方法もあるが、情報処
理システムとして運用を継続することができる状態にあ
っても監視機構の障害で情報処理システムを停止させな
ければならないので、情報処理システムの稼働率が低下
してしまう。
【0017】また、上記の他のホスト監視方法では、ホ
スト装置側にホスト装置の機能試験を一定時間間隔で実
施する機構を設けているので、自ホスト装置の機能試験
を自ホスト装置で行い、その結果を端末装置側へ通知し
なければならない。
【0018】この場合、自ホスト装置自身にて機能試験
を行い、その結果を端末装置へと通知する精度にも限界
があり、ホスト装置から端末装置への正常信号を送信す
る機構が常に正常信号しか送信することができなくなる
という故障がホスト装置に発生すると、ホスト装置側の
異常を検出することができなくなる。
【0019】さらに、別のホスト監視方法では、計算機
システムの監視も運転監視装置の監視も計算機システム
内のサービスプロセッサが行っているため、単一の計算
機システムではサービスプロセッサが障害となった場合
に、計算機システムの監視を継続することができなくな
る。
【0020】また、複数の計算機システムによる監視を
目的として運転監視装置が接続されているため、単一の
計算機システムでは運転監視装置そのもの価値がなくな
ってしまう。
【0021】その場合、オペレーティングシステムから
の監視開始命令を受信した後、サービスプロセッサから
一定間隔でオペレーティングシステムに対して生存を確
認する割込みを発生させるが、生存を確認する側である
サービスプロセッサが障害となった場合に、計算機シス
テムがどういう状態となったのかを判断することができ
ない。また、計算機システムの稼働状態の変化を他の計
算機システムへ通知するために運転監視装置が存在して
いるのだが、単一の計算機システムでは稼働状態の変化
を通知する他の計算機システムが存在しないので、サー
ビスプロセッサから運転監視装置へのアクセスそのもの
が無駄となり、不要な処理を実施してしまうこととな
る。
【0022】そこで、本発明の目的は上記の問題点を解
消し、精度の向上及び稼働率の向上を図ることができる
情報処理システム及びそれに用いるホスト監視方法並び
にその制御プログラムを記録した記録媒体を提供するこ
とにある。
【0023】
【課題を解決するための手段】本発明による情報処理シ
ステムは、各々障害発生時に自装置で復旧動作が可能な
診断制御装置及びサービスプロセッサと、中央処理装置
と、主記憶装置とを含む情報処理システムであって、前
記サービスプロセッサに設けられかつ当該システムの障
害監視を行う監視手段と、前記サービスプロセッサに設
けられかつ前記監視手段による監視処理の終了を前記診
断制御装置を介して前記中央処理装置に通知する終了通
知手段と、前記中央処理装置に設けられかつ前記サービ
スプロセッサからの前記監視処理の終了通知を基に前記
診断制御装置及び前記サービスプロセッサの障害を検出
する検出手段と、前記中央処理装置に設けられかつ前記
検出手段で前記診断制御装置及び前記サービスプロセッ
サの障害が検出された時に当該システムの障害監視を停
止する手段と、前記診断制御装置及び前記サービスプロ
セッサ各々に設けられかつ自装置の障害復旧時に当該シ
ステムの障害監視の再開を前記中央処理装置に通知する
再開通知手段とを備えている。
【0024】本発明による情報処理システムのホスト監
視方法は、各々障害発生時に自装置で復旧動作が可能な
診断制御装置及びサービスプロセッサと、中央処理装置
と、主記憶装置とを含む情報処理システムのホスト監視
方法であって、前記サービスプロセッサに設けられかつ
当該システムの障害監視を行うステップと、前記サービ
スプロセッサに設けられかつ前記障害監視の処理終了を
前記診断制御装置を介して前記中央処理装置に通知する
ステップと、前記中央処理装置に設けられかつ前記サー
ビスプロセッサからの前記処理終了の通知を基に前記診
断制御装置及び前記サービスプロセッサの障害を検出す
るステップと、前記中央処理装置に設けられかつ前記診
断制御装置及び前記サービスプロセッサの障害が検出さ
れた時に当該システムの障害監視を停止するステップ
と、前記診断制御装置及び前記サービスプロセッサ各々
に設けられかつ自装置の障害復旧時に当該システムの障
害監視の再開を前記中央処理装置に通知するステップと
を備えている。
【0025】本発明による情報処理システムの監視制御
プログラムを記録した記録媒体は、各々障害発生時に自
装置で復旧動作が可能な診断制御装置及びサービスプロ
セッサと、中央処理装置と、主記憶装置とを含む情報処
理システムにおいて当該システムの障害監視を行うため
のホスト監視制御プログラムを記録した記録媒体であっ
て、前記ホスト監視制御プログラムは前記サービスプロ
セッサに、当該システムの障害監視を行わせ、前記障害
監視の処理終了を前記診断制御装置を介して前記中央処
理装置に通知させ、前記ホスト監視制御プログラムは前
記中央処理装置に、前記サービスプロセッサからの前記
処理終了の通知を基に前記診断制御装置及び前記サービ
スプロセッサの障害を検出させ、前記診断制御装置及び
前記サービスプロセッサの障害が検出された時に当該シ
ステムの障害監視を停止させ、前記ホスト監視制御プロ
グラムは前記診断制御装置及び前記サービスプロセッサ
各々に、自装置の障害復旧時に当該システムの障害監視
の再開を前記中央処理装置に通知させている。
【0026】すなわち、本発明の情報処理システムにお
いては、情報処理システム運用中にホストコマンド処理
部にてホスト監視のデータを作成し、その作成したホス
ト監視データをホストコマンド処理要求部がホストコマ
ンド制御データ格納部に設定する。その後、プロセッサ
通信送信部から診断制御装置に対してホストコマンド処
理の実施を要求するプロセッサ間通信を送信する。
【0027】プロセッサ通信受信部にて中央処理装置か
らのプロセッサ間通信の受信を認識したならば、プロセ
ッサ通信処理部にてホストコマンド制御データ格納部か
らホスト監視用データを読出し、データ送信部から当該
データをサービスプロセッサへと転送する。診断制御装
置からのコマンドを受信したサービスプロセッサはコマ
ンドデコード部にてコマンドのデコードを行い、ホスト
コマンドはホストコマンド処理部にて処理され、情報処
理システムの監視を開始する。
【0028】同時に、ホストコマンド処理が完了したこ
とを処理完了通知部から診断制御装置へと通知する。サ
ービスプロセッサからのホストコマンド処理完了を受け
た診断制御装置は処理完了通知部にて処理結果をホスト
コマンド制御データ格納部へと設定する。
【0029】中央処理装置はホストコマンド処理要求を
送信した後、サービスプロセッサでの処理が完了したか
どうかをホストコマンド制御データ格納部を一定時間参
照し続けることで、ホストコマンド処理が完了したかど
うかを判断し、完了していれば次のホストコマンド処理
を実施する。
【0030】これによって、特に情報処理システムの監
視を行うためだけの機構を設けることなく、通常にて使
用される通信パスを介して情報処理システムの監視を行
うことが可能となる。
【0031】情報処理システムを監視する診断制御装置
あるいはサービスプロセッサが障害となり、情報処理シ
ステムの監視ができなくなった場合にも、その後の診断
制御装置及びサービスプロセッサが修復をトリガとし
て、ホストコマンド再開起動部からホストコマンド再開
通知部にホストコマンド処理の再開が促される。
【0032】ホストコマンド再開通知部ではホストコマ
ンド処理再開に必要な制御データを生成し、中央処理装
置に対するホストコマンド処理の再開を診断制御装置経
由で行う。サービスプロセッサからホストコマンド処理
再開の通知を受けたホストコマンド再開指示部はホスト
コマンド制御データ格納部にホストコマンド再開用のデ
ータを設定した後、プロセッサ通信送信部から中央処理
装置に対してプロセッサ間通信を行うことで、自動的に
情報処理システムの監視を再開することが可能となる。
【0033】情報処理システムの運用を開始した直後
に、中央処理装置のホストコマンド処理部にて情報処理
システムの監視を促す制御データを作成し、ホストコマ
ンド処理要求部がその作成した制御データを主記憶装置
上のホストコマンド制御データ格納部に設定すると、プ
ロセッサ通信送信部から診断制御装置に対してプロセッ
サ間通信が行われる。その後、要求したホストコマンド
処理が終了したか否かをホストコマンド処理部が主記憶
装置上のホストコマンド制御データ格納部を参照するこ
とで判断する。
【0034】上記のプロセッサ間通信をプロセッサ通信
受信部にて受信した診断制御装置は、プロセッサ通信処
理部にて主記憶装置上のホストコマンド制御データ格納
部から制御データを読出し、データ送信部からサービス
プロセッサへと転送する。サービスプロセッサでは診断
制御装置からのコマンドをコマンドデコード部にてデコ
ードし、ホストコマンド処理部へとホストコマンド制御
データを転送する。そのホストコマンド制御データをホ
ストコマンド処理部にて解析した結果、情報処理システ
ムの監視が開始される。
【0035】同時に、ホストコマンド処理を終了したこ
とを処理完了通知部から診断制御装置へと通知する。サ
ービスプロセッサからホストコマンド処理の終了通知を
受け取った診断制御装置の処理完了通知部は、処理終了
結果を主記憶装置上のホストコマンド制御データ格納部
へ設定する。
【0036】主記憶装置上のホストコマンド制御データ
格納部を参照し続けていた中央処理装置のホストコマン
ド処理部はホストコマンド処理の終了結果が設定された
ことによって、一定時間後に上述した動作を繰返し行う
ことで、ホスト側の監視をサービスプロセッサにて、診
断制御装置及びサービスプロセッサ側の監視をホストに
てというように、情報処理システムを構築している装置
相互間で監視することができる。よって、ウォッチドッ
グタイマや運転監視装置といった情報処理システムの監
視を行う特別な機構を設ける必要がない。
【0037】また、ホストとサービスプロセッサとが相
互に監視を実施するので、サービスプロセッサ及び診断
制御装置が発生しても、ホストにて異常を検出すること
が可能となる。
【0038】上記の動作による情報処理システムの監視
中に、監視を行っている診断制御装置あるいはサービス
プロセッサが障害によって情報処理システムの監視がで
きなくなってしまった場合には、ホストにて情報処理シ
ステムの異常を検出してメッセージ出力すると同時に、
監視動作を停止する。
【0039】その後、自動復旧や保守による復旧作業が
実施された後に、診断制御装置あるいはサービスプロセ
ッサのホストコマンド再開起動部からホストコマンド再
開通知部に対してホストコマンド処理の再開を通知す
る。通知を受けたホストコマンド再開通知部ではホスト
コマンド処理の再開に必要な制御データを生成し、中央
処理装置への制御データの引き渡しを診断制御装置へ依
頼する。
【0040】サービスプロセッサからの依頼を受けたホ
ストコマンド再開指示部では主記憶装置上のホストコマ
ンド制御データ格納部ヘサービスプロセッサが生成した
ホストコマンド再開用のデータを設定した後、プロセッ
サ通信送信部から中央処理装置に対してホストコマンド
処理のプロセッサ間通信を行う。
【0041】診断制御装置からのプロセッサ間通信を受
信した中央処理装置のプロセッサ通信受信部はホストコ
マンド処理部ヘホストコマンド処理の通信を受信したこ
とを知らせ、知らせを受けたホストコマンド処理部では
主記憶装置上のホストコマンド制御データ格納部から制
御データを読出し、そのデータを解析した後にホストコ
マンド処理の再開を実施する。これによって、情報処理
システムの精度及び稼働率を高めることが可能となる。
【0042】
【発明の実施の形態】次に、本発明の一実施例について
図面を参照して説明する。図1は本発明の一実施例によ
る情報処理システムの構成を示すブロック図である。図
において、本発明の一実施例による情報処理システムは
中央処理装置1と、主記憶装置2と、診断制御装置3
と、サービスプロセッサ4とから構成されている。
【0043】中央処理装置1はホストコマンド処理部1
1と、ホストコマンド処理要求部12と、プロセッサ
(P)通信送信部13と、プロセッサ通信受信部14と
から構成されている。主記憶装置2はホストコマンド制
御データ格納部21を備えている。
【0044】診断制御装置3はプロセッサ通信受信部3
1と、プロセッサ通信処理部32と、データ送信部33
と、プロセッサ通信送信部34と、処理完了通知部35
と、ホストコマンド再開起動部36と、ホストコマンド
再開指示部37とから構成されている。
【0045】サービスプロセッサ4はコマンドデコード
部41と、ホストコマンド処理部42と、処理完了通知
部43と、ホストコマンド再開起動部44と、ホストコ
マンド再開通知部45とから構成されている。
【0046】上記の情報処理システムにおいて、診断制
御装置3とサービスプロセッサ4との間はイーサネット
(登録商標)で接続され、中央処理装置1と主記憶装置
2と診断制御装置3との間はシステムバスによって接続
されている。
【0047】中央処理装置1のホストコマンド処理部1
1はサービスプロセッサ4にて情報処理システムの監視
を行うために必要となる情報を生成する。ホストコマン
ド処理要求部12はホストコマンド処理部11から起動
され、ホストコマンド処理部11にて生成されたデータ
を主記憶装置2内のホストコマンド制御データ格納部2
1に設定した後、プロセッサ通信送信部13に対して診
断制御装置3へのプロセッサ間通信の送信を促す。
【0048】プロセッサ通信送信部13は診断制御装置
3に対してプロセッサ間通信を送信する。プロセッサ通
信受信部14は診断制御装置3からのプロセッサ間通信
を受信し、ホストコマンド処理部11に対してホストコ
マンド処理に関する通信を受信したことを通知する。主
記憶装置2のホストコマンド制御データ格納部21には
情報処理システムの監視開始/再開を指示するデータが
設定される。
【0049】診断制御装置3のプロセッサ通信受信部3
1は中央処理装置1からのプロセッサ間通信を受信し、
プロセッサ通信処理部32へ通信があったことを認識さ
せる。プロセッサ通信処理部32は中央処理装置1から
のホストコマンド処理要求のプロセッサ間通信であるこ
とを認識し、主記憶装置2上のホストコマンド制御デー
タ格納部21からデータを読出す。データ送信部33は
読出されたデータをサービスプロセッサ4へ転送する。
【0050】プロセッサ通信送信部34は中央処理装置
1にホストコマンド処理の再開を指示するプロセッサ間
通信を送信する。処理完了通知部35はサービスプロセ
ッサ4にて処理したホストコマンド処理の終了結果を受
取り、主記憶装置2上のホストコマンド制御データ格納
部21に設定する。
【0051】ホストコマンド再開起動部36及びサービ
スプロセッサ4のホストコマンド再開起動部44は診断
制御装置3あるいはサービスプロセッサ4が動作不能状
態から復旧し、ホストコマンド処理が実行可能になった
ことをホストコマンド再開通知部45に対して通知す
る。
【0052】ホストコマンド再開指示部37はサービス
プロセッサ4のホストコマンド再開通知部45にて生成
されたホストコマンド処理再開用のデータを主記憶装置
2上のホストコマンド制御データ格納部21に設定した
後、プロセッサ通信送信部33に対して中央処理装置1
へのプロセッサ間通信の送信を促す。
【0053】診断制御装置3は上記の機能とは別に情報
処理システムの立上げ、立下げ、障害処理、保守診断を
行う機能を有しており、自装置に障害が発生した場合に
は上記の機能によって自装置で障害要因をクリアして障
害発生以前の状態へと遷移可能となっている。
【0054】サービスプロセッサ4のコマンドデコード
部41は診断制御装置3から転送されたコマンドをデコ
ードし、転送されたコマンドに応じた処理を起動する。
ホストコマンド処理部42は中央処理装置1が設定した
ホストコマンド制御データに基づいたホストコマンド処
理を実施し、処理が終了すれば処理完了通知部43へ処
理結果を通知する。
【0055】処理完了通知部43はホストコマンド処理
の処理結果を診断制御装置3内の処理完了通知部35へ
と転送する。ホストコマンド再開通知部45は中央処理
装置1のホストコマンド処理部11がホストコマンド処
理の再開を認識できるための制御データを生成する。
【0056】サービスプロセッサ4は上記の機能とは別
に情報処理システムの障害情報の格納、保守診断や運用
を行う際のオペレータインタフェース機能を有してい
る。尚、中央処理装置1と診断制御装置3とサービスプ
ロセッサ4とにはそれぞれ図示せぬ制御メモリが搭載さ
れており、その制御メモリのプログラムを実行すること
で以下のような処理動作を実現している。また、制御メ
モリとしてはROM(リードオンリメモリ)やIC(集
積回路)メモリ等が使用可能である。
【0057】図2は本発明の一実施例による情報処理シ
ステムの監視動作を示すフローチャートであり、図3及
び図4は本発明の一実施例による情報処理システムの監
視中に診断制御装置に障害が発生した場合のホスト監視
が再開されるまでの処理動作を示すフローチャートであ
り、図5及び図6は本発明の一実施例による情報処理シ
ステムの監視中にサービスプロセッサに障害が発生した
場合のホスト監視が再開されるまでの処理動作を示すフ
ローチャートである。これら図1〜図6を参照して本発
明の一実施例による情報処理装置の監視動作について説
明する。
【0058】サービスプロセッサ4からの情報処理シス
テムの立上げ要求によって、診断制御装置3が情報処理
システムを立上げた後、診断制御装置3及びサービスプ
ロセッサ4はアイドル状態となる。
【0059】同時に、情報処理システム自体は運用が開
始されたことによって、中央処理装置1のホストコマン
ド処理部11にて情報処理システムの監視を促すホスト
コマンド処理用のデータを生成し(図2ステップS
1)、ホストコマンド処理要求部12ヘホストコマンド
処理をサービスプロセッサ4に要求するように通知し、
その通知によってホストコマンド処理要求部12は主記
憶装置2のホストコマンド制御データ格納部21にデー
タを設定する(図2ステップS2)。
【0060】この後、プロセッサ通信送信部13から診
断制御装置3に対してホストコマンド処理実行のプロセ
ッサ間通信を送信する(図2ステップS3)。中央処理
装置1からのプロセッサ間通信の受信を認識した診断制
御装置3のプロセッサ通信受信部31はプロセッサ通信
処理部32に対してプロセッサ間通信を受信したことを
通知する(図2ステップS4)。
【0061】通知を受けたプロセッサ通信処理部32で
はホストコマンド処理であることを認識し、主記憶装置
2のホストコマンド制御データ格納部21からデータを
読出した後(図2ステップS5)、データ送信部33か
らサービスプロセッサ4に対してホストコマンド処理の
実行要求のコマンドとともに、読出したデータを転送す
る(図2ステップS6)。
【0062】診断制御装置3からのコマンドを受けたサ
ービスプロセッサ4はコマンドデコード部41にてコマ
ンドをデコードし、ホストコマンド処理要求のコマンド
であればホストコマンド処理部42にてデータを解析
し、情報処理システムの監視を開始する(図2ステップ
S7,S8)。
【0063】同時に、サービスプロセッサ4は処理結果
を処理完了通知部43に渡す。ホストコマンド処理の処
理結果を受取った処理完了通知部43は処理が完了した
ことと処理結果とを診断制御装置3へと通知する(図2
ステップS9)。
【0064】サービスプロセッサ4からの処理終了通知
を受けた診断制御装置3の処理完了通知部35は処理結
果を主記憶装置2のホストコマンド制御データ格納部2
1に設定する(図2ステップS10)。
【0065】中央処理装置1のホストコマンド処理部1
1は診断制御装置3ヘホストコマンド処理要求のプロセ
ッサ間通信を送信した後、主記憶装置2のホストコマン
ド制御データ格納部21からデータを読出し、サービス
プロセッサ4からの処理終了通知が設定されたかどうか
をチェックし(図2ステップS11)、処理が正常に終
了していれば、再度上記のような手順で情報処理システ
ムの監視を促すホストコマンド処理を実行する(図2ス
テップS12)。
【0066】上述したような手順にて情報処理システム
を監視中に、情報処理システムの監視処理の仲介となっ
ている診断制御装置3に障害が発生すると(図3ステッ
プS26)、診断制御装置3は現在実行中の処理を継続
することができなくなる。そのため、中央処理装置1の
ホストコマンド処理部11では要求したホストコマンド
処理の終了結果を一定時間経過しても得ることができな
いので、ホスト監視に異常があったと認識し、異常を検
出した旨のメッセージを出力すると同時に、以降のホス
トコマンド処理の実施を行わないようにする(図3ステ
ップS31,S32)。
【0067】その間、障害となった診断制御装置3は自
装置の障害の要因をリセットしてからファームウェアを
ロードし、その後に立上って障害発生以前の情報等を復
旧し、障害が発生する以前の正常な状態へと遷移する
(図3ステップS27,S28)。診断制御装置3はホ
ストコマンド処理が実行可能になると、ホストコマンド
再開起動部36からサービスプロセッサ4に対してホス
トコマンド処理再開のためのデータの生成を指示する
(図3ステップS29)。
【0068】診断制御装置3からホストコマンド処理再
開の指示を受けたサービスプロセッサ4のホストコマン
ド再開通知部45はホストコマンド処理再開用のデータ
を生成した後、中央処理装置1へのホストコマンド処理
再開の通知を行うように診断制御装置3へ依頼する(図
3ステップS30)。
【0069】診断制御装置3のホストコマンド再開指示
部37ではサービスプロセッサ4から転送されたホスト
コマンド処理再開用のデータを主記憶装置2のホストコ
マンド制御データ格納部21に設定した後(図4ステッ
プS33)、プロセッサ通信送信部34から中央処理装
置1に対してホストコマンド処理のプロセッサ間通信を
送信する(図4ステップS34)。
【0070】診断制御装置3からのプロセッサ間通信を
受信した中央処理装置1のプロセッサ通信受信部14で
はホストコマンド処理部11にホストコマンド処理のプ
ロセッサ間通信があったことを通知し(図4ステップS
35)、ホストコマンド処理部11はその通知によって
主記憶装置2のホストコマンド制御データ格納部21か
らデータを読出し、その読出したデータを解析した後、
情報処理システムの監視を再開するためのホストコマン
ド処理のデータを生成し(図4ステップS36,S3
7)、診断制御装置3を介してサービスプロセッサ4に
ホストコマンド処理を実行させ、情報処理システムの監
視を再開する。
【0071】また、上述したような手順にて情報処理シ
ステムを監視中に、情報処理システムの監視を行ってい
るサービスプロセッサ4に障害が発生したならば(図5
ステップS48)、サービスプロセッサ4は現在実行中
の処理を継続することができなくなる。そのため、中央
処理装置1のホストコマンド処理部11では要求したホ
ストコマンド処理の終了結果を一定時間経過しても得る
ことができないので、ホスト監視中に異常があったと認
識し、異常を検出した旨のメッセージを出力するのと同
時に、以降のホストコマンド処理の実施を行わないよう
にする(図5ステップS51,S52)。
【0072】異常を検出した旨のメッセージによってオ
ペレータが障害を認識したサービスプロセッサ4では保
守作業を実施するため、自装置を情報処理システムから
切離し、故障箇所の修理交換がなされた後、情報処理シ
ステムへと組込まれ、再立上げされ、障害が発生する以
前の正常な状態へと遷移する(図5ステップS49,S
50)。
【0073】その立上げの過程にて、現在、情報処理シ
ステムが運用中であることを認識すると、ホストコマン
ド再開起動部44からホストコマンド再開通知部45に
対してホストコマンド処理再開のためのデータの生成が
指示される(図6ステップS53)。
【0074】指示を受けたホストコマンド再開通知部4
5はホストコマンド処理再開用のデータを生成した後、
中央処理装置1へのホストコマンド処理再開の通知を行
うように診断制御装置3へ依頼する(図6ステップS5
4)。
【0075】診断制御装置3のホストコマンド再開指示
部37ではサービスプロセッサ4から転送されたホスト
コマンド処理再開用のデータを主記憶装置2のホストコ
マンド制御データ格納部21に設定した後(図6ステッ
プS55)、プロセッサ通信送信部34から中央処理装
置1に対してホストコマンド処理のプロセッサ間通信を
送信する(図6ステップS56)。
【0076】診断制御装置3からのプロセッサ間通信を
受信した中央処理装置1のプロセッサ通信受信部14で
はホストコマンド処理部11にホストコマンド処理のプ
ロセッサ間通信があったことを通知し(図6ステップS
57)、ホストコマンド処理部11はその通知によって
主記憶装置2のホストコマンド制御データ格納部21か
らデータを読出し、その読出したデータを解析した後、
情報処理システムの監視を再開するためのホストコマン
ド処理のデータを生成し(図6ステップS58,S5
9)、診断制御装置3を介してサービスプロセッサ4に
ホストコマンド処理を実行させ、情報処理システムの監
視を再開する。
【0077】このように、中央処理装置1側の監視をサ
ービスプロセッサ4にて、診断制御装置3及びサービス
プロセッサ4側の監視を中央処理装置1にてというよう
に、情報処理システムを構築している装置の相互間で監
視することによって、ウォッチドッグタイマや運転監視
装置といった情報処理システムの監視を行う特別な機構
を設ける必要がない。また、中央処理装置1とサービス
プロセッサ4とが相互に監視を実施するので、サービス
プロセッサ4及び診断制御装置3に障害が発生しても、
中央処理装置1にて異常を検出することができる。
【0078】よって、主記憶装置2上のホストコマンド
制御データ格納部21を媒介にして中央処理装置1から
診断制御装置3へ、診断制御装置3からサービスプロセ
ッサ4へと情報処理システムの監視に必要なデータを受
渡し、その応答をサービスプロセッサ4から診断制御装
置3へ、診断制御装置3から中央処理装置1へと受渡す
ことによって、情報処理システムの監視を実現すること
ができ、余分なハードウェアを投資せずに監視の精度を
高めることができる。
【0079】さらに、情報処理システム監視中に診断制
御装置3あるいはサービスプロセッサ4が障害となり、
中央処理装置1側にて情報処理システムの異常を検出し
た結果、監視動作が中止された場合でも、その後の診断
制御装置3及びサービスプロセッサ4の復旧によってホ
ストコマンド処理を自動的に再開することによって、情
報処理システムの監視を再開することができる。
【0080】よって、診断制御装置3あるいはサービス
プロセッサ4の障害によって中央処理装置1側が停止し
ていた情報処理システムの監視を、診断制御装置3ある
いはサービスプロセッサ4の障害が復旧したと同時に、
中央処理装置1に対して情報処理システムの監視の再開
を促すため、診断制御装置3あるいはサービスプロセッ
サ4の復旧が行われ次第、中央処理装置1にて監視を再
開するので、情報処理システムの精度のよい稼働率を図
ることができる。
【0081】さらにまた、診断制御装置3のように自装
置で復旧可能な装置では、運用を優先することによって
保守作業者が介在しない場合があるので、自動的にホス
ト監視を再開することで、安心して情報処理システムの
監視を行うことができる。その際、自動的に中央処理装
置1にて監視を再開するため、人手によって再開させる
場合と比較すれば、人為的ミスが発生する確率がないの
で、安全である。
【0082】
【発明の効果】以上説明したように本発明によれば、各
々障害発生時に自装置で復旧動作が可能な診断制御装置
及びサービスプロセッサと、中央処理装置と、主記憶装
置とを含む情報処理システムにおいて、サービスプロセ
ッサに、当該システムの障害監視を行わせ、その監視処
理の終了を診断制御装置を介して中央処理装置に通知さ
せるとともに、中央処理装置に、サービスプロセッサか
らの監視処理の終了通知を基に診断制御装置及びサービ
スプロセッサの障害を検出させ、診断制御装置及びサー
ビスプロセッサの障害が検出された時に当該システムの
障害監視を停止させ、診断制御装置及びサービスプロセ
ッサ各々に、自装置の障害復旧時に当該システムの障害
監視の再開を中央処理装置に通知させることによって、
精度の向上及び稼働率の向上を図ることができるという
効果がある。
【図面の簡単な説明】
【図1】本発明の一実施例による情報処理システムの構
成を示すブロック図である。
【図2】本発明の一実施例による情報処理システムの監
視動作を示すフローチャートである。
【図3】本発明の一実施例による情報処理システムの監
視中に診断制御装置に障害が発生した場合のホスト監視
が再開されるまでの処理動作を示すフローチャートであ
る。
【図4】本発明の一実施例による情報処理システムの監
視中に診断制御装置に障害が発生した場合のホスト監視
が再開されるまでの処理動作を示すフローチャートであ
る。
【図5】本発明の一実施例による情報処理システムの監
視中にサービスプロセッサに障害が発生した場合のホス
ト監視が再開されるまでの処理動作を示すフローチャー
トである。
【図6】本発明の一実施例による情報処理システムの監
視中にサービスプロセッサに障害が発生した場合のホス
ト監視が再開されるまでの処理動作を示すフローチャー
トである。
【図7】本発明の一実施例による情報処理システムの構
成を示すブロック図である。
【符号の説明】
1 中央処理装置 2 主記憶装置 3 診断制御装置 4 サービスプロセッサ 11 ホストコマンド処理部 12 ホストコマンド処理要求部 13,34 プロセッサ通信送信部 14,31 プロセッサ通信受信部 21 ホストコマンド制御データ格納部 32 プロセッサ通信処理部 33 データ送信部 35,43 処理完了通知部 36,44 ホストコマンド再開起動部 37 ホストコマンド再開指示部 41 コマンドデコード部 42 ホストコマンド処理部 45 ホストコマンド再開通知部

Claims (11)

    【特許請求の範囲】
  1. 【請求項1】 各々障害発生時に自装置で復旧動作が可
    能な診断制御装置及びサービスプロセッサと、中央処理
    装置と、主記憶装置とを含む情報処理システムであっ
    て、前記サービスプロセッサに設けられかつ当該システ
    ムの障害監視を行う監視手段と、前記サービスプロセッ
    サに設けられかつ前記監視手段による監視処理の終了を
    前記診断制御装置を介して前記中央処理装置に通知する
    終了通知手段と、前記中央処理装置に設けられかつ前記
    サービスプロセッサからの前記監視処理の終了通知を基
    に前記診断制御装置及び前記サービスプロセッサの障害
    を検出する検出手段と、前記中央処理装置に設けられか
    つ前記検出手段で前記診断制御装置及び前記サービスプ
    ロセッサの障害が検出された時に当該システムの障害監
    視を停止する手段と、前記診断制御装置及び前記サービ
    スプロセッサ各々に設けられかつ自装置の障害復旧時に
    当該システムの障害監視の再開を前記中央処理装置に通
    知する再開通知手段とを有することを特徴とする情報処
    理システム。
  2. 【請求項2】 前記中央処理装置に設けられかつ当該シ
    ステムの障害監視に必要なデータを前記主記憶装置に記
    憶する手段を含み、当該システムの障害監視に必要なデ
    ータを前記中央処理装置から前記主記憶装置を介して前
    記診断制御装置に転送し、前記診断制御装置から前記サ
    ービスプロセッサに転送するよう構成したことを特徴と
    する請求項1記載の情報処理システム。
  3. 【請求項3】 前記検出手段は、前記監視処理の終了通
    知が予め設定された所定時間内に受信されない時に前記
    診断制御装置及び前記サービスプロセッサのうちの一方
    に障害が発生したことを検出するよう構成したことを特
    徴とする請求項1または請求項2記載の情報処理システ
    ム。
  4. 【請求項4】 前記サービスプロセッサに設けられかつ
    自装置の障害復旧時に当該システムの障害監視に必要な
    データを生成する生成手段と、前記サービスプロセッサ
    に設けられかつ前記生成手段で生成されたデータを前記
    診断制御装置を介して前記主記憶装置に記憶させる手段
    とを含むことを特徴とする請求項1から請求項3のいず
    れか記載の情報処理システム。
  5. 【請求項5】 当該システムは、単一のシステムからな
    ることを特徴とする請求項1から請求項4のいずれか記
    載の情報処理システム。
  6. 【請求項6】 各々障害発生時に自装置で復旧動作が可
    能な診断制御装置及びサービスプロセッサと、中央処理
    装置と、主記憶装置とを含む情報処理システムのホスト
    監視方法であって、前記サービスプロセッサに設けられ
    かつ当該システムの障害監視を行うステップと、前記サ
    ービスプロセッサに設けられかつ前記障害監視の処理終
    了を前記診断制御装置を介して前記中央処理装置に通知
    するステップと、前記中央処理装置に設けられかつ前記
    サービスプロセッサからの前記処理終了の通知を基に前
    記診断制御装置及び前記サービスプロセッサの障害を検
    出するステップと、前記中央処理装置に設けられかつ前
    記診断制御装置及び前記サービスプロセッサの障害が検
    出された時に当該システムの障害監視を停止するステッ
    プと、前記診断制御装置及び前記サービスプロセッサ各
    々に設けられかつ自装置の障害復旧時に当該システムの
    障害監視の再開を前記中央処理装置に通知するステップ
    とを有することを特徴とするホスト監視方法。
  7. 【請求項7】 前記中央処理装置に設けられかつ当該シ
    ステムの障害監視に必要なデータを前記主記憶装置に記
    憶するステップを含み、当該システムの障害監視に必要
    なデータを前記中央処理装置から前記主記憶装置を介し
    て前記診断制御装置に転送し、前記診断制御装置から前
    記サービスプロセッサに転送するようにしたことを特徴
    とする請求項6記載のホスト監視方法。
  8. 【請求項8】 前記診断制御装置及び前記サービスプロ
    セッサの障害を検出するステップは、前記監視処理の終
    了通知が予め設定された所定時間内に受信されない時に
    前記診断制御装置及び前記サービスプロセッサのうちの
    一方に障害が発生したことを検出するようにしたことを
    特徴とする請求項6または請求項7記載のホスト監視方
    法。
  9. 【請求項9】 前記サービスプロセッサに設けられかつ
    自装置の障害復旧時に当該システムの障害監視に必要な
    データを生成するステップと、前記サービスプロセッサ
    に設けられかつその生成されたデータを前記診断制御装
    置を介して前記主記憶装置に記憶させるステップとを含
    むことを特徴とする請求項6から請求項8のいずれか記
    載のホスト監視方法。
  10. 【請求項10】 当該システムは、単一のシステムから
    なることを特徴とする請求項6から請求項9のいずれか
    記載のホスト監視方法。
  11. 【請求項11】 各々障害発生時に自装置で復旧動作が
    可能な診断制御装置及びサービスプロセッサと、中央処
    理装置と、主記憶装置とを含む情報処理システムにおい
    て当該システムの障害監視を行うためのホスト監視制御
    プログラムを記録した記録媒体であって、 前記ホスト監視制御プログラムは前記サービスプロセッ
    サに、当該システムの障害監視を行わせ、前記障害監視
    の処理終了を前記診断制御装置を介して前記中央処理装
    置に通知させ、 前記ホスト監視制御プログラムは前記中央処理装置に、
    前記サービスプロセッサからの前記処理終了の通知を基
    に前記診断制御装置及び前記サービスプロセッサの障害
    を検出させ、前記診断制御装置及び前記サービスプロセ
    ッサの障害が検出された時に当該システムの障害監視を
    停止させ、 前記ホスト監視制御プログラムは前記診断制御装置及び
    前記サービスプロセッサ各々に、自装置の障害復旧時に
    当該システムの障害監視の再開を前記中央処理装置に通
    知させることを特徴とするホスト監視制御プログラムを
    記録した記録媒体。
JP11089643A 1999-03-30 1999-03-30 情報処理システム及びそれに用いるホスト監視方法並びにその制御プログラムを記録した記録媒体 Pending JP2000284992A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11089643A JP2000284992A (ja) 1999-03-30 1999-03-30 情報処理システム及びそれに用いるホスト監視方法並びにその制御プログラムを記録した記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11089643A JP2000284992A (ja) 1999-03-30 1999-03-30 情報処理システム及びそれに用いるホスト監視方法並びにその制御プログラムを記録した記録媒体

Publications (1)

Publication Number Publication Date
JP2000284992A true JP2000284992A (ja) 2000-10-13

Family

ID=13976463

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11089643A Pending JP2000284992A (ja) 1999-03-30 1999-03-30 情報処理システム及びそれに用いるホスト監視方法並びにその制御プログラムを記録した記録媒体

Country Status (1)

Country Link
JP (1) JP2000284992A (ja)

Similar Documents

Publication Publication Date Title
US5870301A (en) System control apparatus including a master control unit and a slave control unit which maintain coherent information
JP2735514B2 (ja) プロセス状態管理方式
JP2000284992A (ja) 情報処理システム及びそれに用いるホスト監視方法並びにその制御プログラムを記録した記録媒体
JP2004086520A (ja) 監視制御装置及び監視制御方法
JP3248483B2 (ja) アラーム処理装置
JPH10283015A (ja) プラント監視制御システム
JP3286108B2 (ja) 監視制御装置
JPH11338724A (ja) スタンバイシステム、スタンバイ方法、および記録媒体
JP2000307591A (ja) 情報処理システムの自動障害復旧装置
JPH10116211A (ja) システムコンソール故障通知方式
JP2675645B2 (ja) システム故障監視装置
TWI390398B (zh) 電腦運行狀態偵測及處理方法和系統
JP2977705B2 (ja) ネットワーク接続された多重化コンピュータシステムの制御方式
JPH11232143A (ja) マルチスレッドの監視方法
JP2000293407A (ja) 監視制御装置及びcpu監視方法並びにプログラム記録媒体
JPH06314132A (ja) システムの自動運転制御装置および起動異常判定方法
CN114044000A (zh) 一种自动驾驶车辆hmi人机交互的安全冗余系统
JPH09198334A (ja) データ伝送システムの障害管理方法
JP2000013469A (ja) 通信機器の復旧装置及び復旧方法
JPH02310755A (ja) ヘルスチェック方式
JPH0679279B2 (ja) マイクロプロセツサ応用機器の監視制御装置
JPH1049450A (ja) 遠隔監視システムの異常時の復旧方式
JPH0691565B2 (ja) 相手処理装置の動作監視装置
JPH05224768A (ja) 計算機システムの自動立ち上げ監視機構
JP2001075935A (ja) プロセッサ間通信方法

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040210

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040224

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040426

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20041109