JP2710668B2 - 計算機システム - Google Patents

計算機システム

Info

Publication number
JP2710668B2
JP2710668B2 JP1174919A JP17491989A JP2710668B2 JP 2710668 B2 JP2710668 B2 JP 2710668B2 JP 1174919 A JP1174919 A JP 1174919A JP 17491989 A JP17491989 A JP 17491989A JP 2710668 B2 JP2710668 B2 JP 2710668B2
Authority
JP
Japan
Prior art keywords
event
monitoring
unit
request
control unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP1174919A
Other languages
English (en)
Other versions
JPH0340040A (ja
Inventor
友明 望月
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP1174919A priority Critical patent/JP2710668B2/ja
Publication of JPH0340040A publication Critical patent/JPH0340040A/ja
Application granted granted Critical
Publication of JP2710668B2 publication Critical patent/JP2710668B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)

Description

【発明の詳細な説明】 〔概要〕 フォールトトレラント化した計算機システムに関し, 事象を監視する側に異常が発生した場合にも事象を監
視できるようにすることを目的とし, 監視依頼に基づいてシステム内に生ずる事象を監視
し、監視対象の事象が生じるとその旨を通知する計算機
システムにおいて、 システム内に生じる所望する事象に対応して当該事象
を監視する監視依頼を通知する監視依頼手段と、 システム内にクラッシュが生じた場合に再起動する再
起動手段と、 前記監視依頼に対応した監視対象の事象のうち、未通
知の監視対象の事象を当該通知の通知先と共に記憶する
記憶手段と、 再度の監視依頼を受信するまで当該監視依頼に対応す
る事象の通知を留保する留保手段と、 前記記憶手段内の未通知の事象を当該再度監視依頼に
対応して当該通知先に通知する通知手段とをそなえ、 前記監視依頼手段は、前記監視依頼に対応して受け付
けた事象に関して当該事象に関する情報を削除するよう
通知すると共に、前記クラッシュ後のシステムの再起動
の後にも前記留保手段に対し再度監視依頼を行うよう構
成する。
〔産業上の利用分野〕
本発明は計算機システムに関し,更に詳しくは,フォ
ールトトレラント化した計算機システムに関する。
近年の計算機システム(以下、データ処理システム)
においては,大規模ネットワークを構築し,多数のノー
ドシステムを設備する傾向がある。このノードシステム
には,無人で運用可能であること,即ち,自動運転等の
プログラムを構築できることが要求される。そして,こ
の自動運転プログラムには,システム内の事象を監視
し,漏れなく必要な全ての事象を監視できることが要求
される。
〔従来の技術〕
第4図は従来技術説明図であり,従来の事象監視処理
について示している。
事象制御部は,データ処理システムのオペレーティン
グシステム(OS)に設けられ,当該システム内で発生す
る事象を受付け,これを必要としている各事象監視部に
通知する。一方,事象監視部は,前述の自動運転のため
に自動運転プログラム等のアプリケーションプログラム
によって実現され,当該システム内で発生する事象を監
視し,自動運転等の処理を実行する。
今,事象監視部が,システム内で発生するある事象に
ついて監視するために,事象制御部に対して当該事象に
ついての監視を依頼する(図中a1で示す)。
この後,システム内で当該事象が発生すると,その都
度,事象制御部は,当該事象を受付け(図中b1,b2),
当該事象を監視依頼a1を行った事象監視部に通知する
(図中c1,c2)。
このように,事象監視部は,自己が必要な事象の各々
についての監視依頼を行うことによって,当該事象が発
生した時に,当該事象を事象制御部から得ることがで
き,これに基づいて自動運転等の処理を行う。一方,事
象制御部は,通知c1,c2を行った事象を削除する。即
ち,先に受付けられ(b1,b2)事象制御部に滞留してい
た当該事象を廃棄する。
〔発明が解決しようとする課題〕
前述の従来技術によれば,事象を監視する側である事
象監視部にクラッシュ等の異常が発生した場合には,必
要な事象を漏れなく監視することが不可能となる。
第4図図示の如く,通知c2に係る事象の処理後に,事
象監視部にクラッシュが発生すると,当該事象監視部は
オペレーティングシステムにより再度起動され,監視依
頼a2(a1と同一)を行う。従って,監視依頼a2後の受付
b5,b6に対応する通知c5,c6に係る事象については,事
象監視部は,通知c1,c2の場合と同様に正しく得ること
ができる。
ところが,クラッシュの発生後,監視依頼a2(正しく
は再度の起動)前の受付b3,b4に対応する通知c3,c4
ついては,事象監視部は,受取ることができない。一
方,事象制御部は,通知c3,c4を行ったことにより,こ
れらに係る事象を削除(廃棄)してしまう。このため,
事象監視部での事象の監視に漏れが生じてしまう。これ
は,事象監視部において受け取った事象についての処理
中にクラッシュが発生した場合も同様である。このよう
に従来は,必要な事象の監視ができなくなる場合があ
り,システムのフォールトトレラント化の実現には問題
があった。
本発明は,事象を監視する側に異常が発生した場合に
も事象を監視できるようにした計算機システムを提供す
ることを目的とする。
〔課題を解決するための手段〕
第1図は本発明の原理構成図であり,本発明による計
算機システム(以下、データ処理システム)を示してい
る。
第1図において,1はデータ処理システム,2はオペレー
ティングシステム(OS),3はアプリケーションプログラ
ム,4は事象制御部,5は事象監視部,6は監視管理表,7は不
揮発メモリである。
事象監視部5は,データ処理システム1を構成するノ
ードシステムを自動運転するための自動運転プログラム
等のアプリケーションプログラム3によって実現され,
当該システム1内で発生するある事象を監視し,この事
象に基づいた自動運転等の処理を行う。また事象監視部
5は,必要な事象についての監視依頼,及び前記処理が
終了した結果として通知された事象が不要になった場合
における削除指示(又は留保解除ともいう)を,事象制
御部4に対して行う。即ち,事象監視部5は,監視依頼
を行う監視依頼手段,及び事象制御部4から通知された
事象が未だ処理されていない(不要になっていない)こ
とを事象制御部4に認識させるための通知手段(図示せ
ず)を備える。
事象制御部4は,データ処理システム1のオペレーテ
ィングシステム2に設けられ,当該システム1内で発生
する事象を受付け,受付けた事象を当該事象について監
視依頼をした事象監視部5に通知する。即ち,事象制御
部4は,受け付けた事象を当該通知先に通知するための
通知手段(図示せず)を備える。また事象制御部4は,
受付けた事象をその事象についての削除指示が事象監視
部5から通知されるまで滞留(又は留保ともいう)させ
る(保存する)。即ち,事象制御部4は,受付けた事象
を滞留させるための留保手段又は滞留手段(図示せず)
を備える。
不揮発メモリ7は,事象監視部5にクラッシュ等の異
常が発生した後に事象監視部5が再度起動されて前記監
視を継続するために必要な継続情報を保存する。
監視管理表6は,事象制御部4が事象及び事象監視部
5を管理するためのものであり,監視依頼を行った事象
監視部5,監視を依頼された事象,当該事象の受付け等に
ついての情報を登録するための記憶手段である。
〔作用〕
第2図は本発明の作用説明図であり,第4図に対応す
るものである。
第2図図示の如く,事象監視部5にクラッシュが発生
すると,事象監視部5は受付b3,b4に対応する通知(図
示せず)をこの時点で受け取ることができない。あるい
は受付b3,b4に対応する通知で受け取った事象に基づい
た処理を行うことができなくなる。従って,当該事象に
ついての削除指示が通知されることはなく,この結果,
当該事象は未通知の事象として事象制御部4に滞留され
る。更に,事象制御部4は事象監視部5に異常が発生し
たことには影響されることなく,監視管理表6に基づい
て監視依頼のあった事象を受付け,滞留させ,管理す
る。一方,クラッシュがあっても,継続情報は不揮発メ
モリ7内にあるので,そのまま保存される。
オペレーティングシステム2は,事象監視部5にクラ
ッシュが発生したことを知ると,これを再起動する。従
って、オペレーティングシステム2は,システム内にク
ラッシュが生じた場合,クラッシュした事象監視部5又
はアプリケーションプログラム3を再起動する再起動手
段を備える。
事象監視部5は,再度起動されると,不揮発メモリ7
を参照して保存されている継続情報を取り出して,これ
を事象制御部4に送る(第2図中,a3で示す)。ここで
継続情報は,クラッシュ前に依頼した監視の継続を依頼
する情報であり,これにより,滞留している事象の事象
監視部5への通知,及びその時点以後の監視の続行がな
されるようにするためのものである。
継続情報の通知に応じて,事象制御部4は,監視管理
表6に基づいて滞留されている事象,即ち受付b3,b4
係る事象を,事象監視部5に通知する(図中c3,c4で示
す)と共に,以後に発生した事象の受付b5,b6及びその
通知c5,c6を行う。
以上のように,事象を監視する側である事象監視部5
に異常が発生した場合にも,必要な事象を漏れなく受取
って監視することが可能となり,事象監視部5をフォー
ルトトレラント化することができる。
〔実施例〕
第3図は事象監視処理説明図である。
以下,第3図に従って,第1図のデータ処理システム
1における事象監視処理について説明する。
(a) 通常の処理 あるアプリケーションプログラム3の事象監視部5
が必要な事象についての監視依頼を事象制御部4に対し
て行う。
事象制御部4は,当該監視依頼を受付け,これを監
視管理表6に登録する。
監視管理表6は,第1図に示す如く,アプリケーショ
ンプログラム3又は事象監視部5の各々に対応して設け
られ,第3図図示の如き構成とされる。即ち,監視管理
表6には,当該事象監視部5から監視依頼があった旨
(図中「あり」として示す),当該事象監視部5の名前
(図中「監視者」として示す),監視依頼された事象
(図中「通知すべき事象」として示す)等が登録され
る。監視管理表6は,未通知の監視対象の事象を当該通
知の通知先と共に記憶する記憶手段であり,事象制御部
4によって設けられ管理される。
事象制御部4は,継続情報を生成し,これを事象監
視部5に通知(返却)する。この生成は,事象監視部5
から,予め自己にクラッシュ等の異常が発生した場合で
も監視を継続する旨が,事象制御部4に対して指示され
た時に行われる。この指示は,監視依頼と共に行われ
る。
継続情報は,異常発生前の事象監視部5と異常発生後
に再度起動された事象監視部5(以下,これを事象監視
部5′として異常発生前と区別する)とを対応づけて,
監視を引き継ぐためのものである。このために継続情報
は,事象監視部5の監視情報,例えば監視管理表6に登
録された内容と同一内容又は監視管理表6を指定する情
報からなる。
事象監視部5は,受取った継続情報を不揮発メモリ
7に格納する。
不揮発メモリ7は,第1図に示す如く,アプリケーシ
ョンプログラム3又は事象監視部5の各々に対応して設
けられる。不揮発メモリ7は,事象監視部5によって設
けられ,管理される。
事象制御部4は,当該システム1内で事象が発生す
るとこれを受付ける。そして監視管理表6を検索して,
受付けた事象についての監視依頼が登録されている場合
に,当該事象を,当該監視依頼を行った事象監視部5に
ついての監視管理表6に滞留させる。即ち,監視管理表
6が,受付けた事象を滞留させるために記憶(以下、単
に滞留)する手段としても使用される。
事象制御部4は,受付けかつ滞留させた事象を監視
依頼を行った事象監視部5に通知する。
事象監視部5は,通知された事象を受取り(受付
け),この事象に基づいた自動運転等の処理を行う。
前記処理の終了後に,事象監視部5は,当該事象が
不要となった旨(削除指示)の通知を事象制御部4に対
して行う。
事象制御部4は,削除指示を受付け,当該指示に係
る滞留している事象を監視管理表6から削除する。
(b) 異常が発生した場合の処理 前述の如き処理を行っている場合において,例えば処
理又は処理を行っている際に,事象監視部5にクラ
ッシュ等の異常が発生したとする。
この場合,通知,受取り又はそれに基づく処理の状態
にあった事象については,削除指示が行われないので,
監視管理表6に滞留することになる。また,異常発生後
から事象監視部5′が(再度)起動されるまでの間に当
該システム1で発生し事象制御部4で受付け(処理)
られた事象(監視依頼のあったもの)も,また,通知
(処理)に対応する削除指示(処理)がないので,
監視管理表6に滞留することになる。
一方,異常発生により停止した事象監視部5は,オペ
レーティングシステムにより再度起動され(事象監視部
5′が起動され),以下の処理を行う。
事象監視部5′は,起動されると,不揮発メモリ7
を参照して,事象監視部5が格納した継続情報を取り出
す。
事象監視部5′は,継続情報を指定して,事象制御
部4に監視(の継続)を依頼する。即ち,監視依頼手段
である事象監視部5′は,システム再起動後に留保手段
である事象制御部4に対し再度監視依頼を行う。
事象制御部4は,継続情報に基づいて監視管理表6
を検索し,事象監視部5についての監視管理表6を知
る。
事象制御部4は,当該監視管理表6に滞留されてい
る事象が存在する場合,これを事象監視部5′に通知す
る。即ち,記憶手段内の未通知の事象をその通知先に通
知する。従って,留保手段である事象制御部4は,再度
監視依頼を受信するまで当該監視依頼に対応する事象の
通知を留保することになる。また,一旦,事象監視部5
に通知された事象であってもその削除指示がなかったも
のについては,再度,事象監視部5′に通知される。
事象監視部5′は,受付けた事象に基づいた処理を
行い,その終了後に前述の処理と同様に削除指示を行
う。即ち,監視依頼手段である事象監視部5′は,シス
テム再起動後に留保手段である事象制御部4に対し留保
解除を通知する。これに応じて,事象制御部4は処理
と同様に滞留していた事象を削除する。
これ以後,通常の処理と同様に処理ないし処理が
繰り返される。なお,このために継続情報が事象制御部
4又は監視管理表6に保持される。
〔発明の効果〕
以上説明したように,本発明によれば,事象監視処理
を行うデータ処理システム(計算機システム)におい
て,事象を削除指示があるまで滞留させることにより,
事象を監視する側に異常が発生した場合にも必要な事象
を漏れなく監視することができるので,事象の監視をフ
ォールトトレラント化することが可能となり,これによ
り,データ処理システム内で発生する全ての事象に対し
て自動運転により対応することができ,当該システムの
無人運転等を構築することができる。
【図面の簡単な説明】
第1図は本発明の原理構成図, 第2図は本発明の作用説明図, 第3図は事象監視処理説明図, 第4図は従来技術説明図。 1はデータ処理システム,2はオペレーティングシステム
(OS),3はアプリケーションプログラム,4は事象制御
部,5は事象監視部,6は監視管理表,7は不揮発メモリであ
る。

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】監視依頼に基づいてシステム内に生ずる事
    象を監視し、監視対象の事象が生じるとその旨を通知す
    る計算機システムにおいて、 システム内に生じる所望する事象に対応して当該事象を
    監視する監視依頼を通知する監視依頼手段と、 システム内にクラッシュが生じた場合に再起動する再起
    動手段と、 前記監視依頼に対応した監視対象の事象のうち、未通知
    の監視対象の事象を当該通知の通知先と共に記憶する記
    憶手段と、 再度の監視依頼を受信するまで当該監視依頼に対応する
    事象の通知を留保する留保手段と、 前記記憶手段内の未通知の事象を当該再度監視依頼に対
    応して当該通知先に通知する通知手段とをそなえ、 前記監視依頼手段は、前記監視依頼に対応して受け付け
    た事象に関して当該事象に関する情報を削除するよう通
    知すると共に、前記クラッシュ後のシステムの再起動の
    後にも前記留保手段に対し再度監視依頼を行うよう構成
    された ことを特徴とする計算機システム。
JP1174919A 1989-07-06 1989-07-06 計算機システム Expired - Lifetime JP2710668B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1174919A JP2710668B2 (ja) 1989-07-06 1989-07-06 計算機システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1174919A JP2710668B2 (ja) 1989-07-06 1989-07-06 計算機システム

Publications (2)

Publication Number Publication Date
JPH0340040A JPH0340040A (ja) 1991-02-20
JP2710668B2 true JP2710668B2 (ja) 1998-02-10

Family

ID=15987006

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1174919A Expired - Lifetime JP2710668B2 (ja) 1989-07-06 1989-07-06 計算機システム

Country Status (1)

Country Link
JP (1) JP2710668B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3265131B2 (ja) * 1994-08-29 2002-03-11 日本電気株式会社 イベント生成分配方式
JP4618224B2 (ja) * 2006-09-19 2011-01-26 株式会社デンソー オブジェクト指向型車両用制御システム
JP5885839B2 (ja) * 2012-07-02 2016-03-16 三菱電機株式会社 通信システム、gui装置及びサービス装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58207162A (ja) * 1982-05-27 1983-12-02 Fujitsu Ltd 会話型処理方式
JPS63228335A (ja) * 1987-03-18 1988-09-22 Fujitsu Ltd 計算機システムにおける事象通知・受取処理方式
JPS6429146A (en) * 1987-07-24 1989-01-31 Nec Corp Transmission control method

Also Published As

Publication number Publication date
JPH0340040A (ja) 1991-02-20

Similar Documents

Publication Publication Date Title
EP0319034B1 (en) Method of recovering failure of online control program
JP4321705B2 (ja) スナップショットの取得を制御するための装置及び記憶システム
US8429654B2 (en) Apparatus and method for guaranteed batch event delivery in a process control system
JP2000105754A (ja) 網内の分散アプリケ―ションの故障を検出し、故障を指定のリプリケ―ションスタイルに従って回復するための方法および装置
JP5948933B2 (ja) ジョブ継続管理装置、ジョブ継続管理方法、及び、ジョブ継続管理プログラム
US8533525B2 (en) Data management apparatus, monitoring apparatus, replica apparatus, cluster system, control method and computer-readable medium
JP2000194678A (ja) クラスタコンピュ―タシステムにおける高度に利用可能な非同期i/o
JP2755437B2 (ja) 通信制御プログラムの連続運転保証処理方法
JP2710668B2 (ja) 計算機システム
JPH11259326A (ja) ホットスタンバイシステムおよびホットスタンバイシステムにおける自動再実行方法およびその記録媒体
EP2038714B1 (en) Method, computer readable medium and system for guaranteed batch event delivery in a process control system
JP4095139B2 (ja) コンピュータシステムおよびファイル管理方法
JP5435205B2 (ja) マルチノードシステム、ノード、メモリダンプ処理方法、及びプログラム
US7065539B2 (en) Data transfer method
JPH09319720A (ja) 分散プロセス管理システム
JP3335779B2 (ja) プラント性能監視システム
JP3604171B2 (ja) プロセス自動再起動処理方式
JP2004302573A (ja) データバックアップ方法及びバッアップシステム
JPH1125062A (ja) 障害回復システム
JP2708955B2 (ja) ファイルアクセス装置
JP2000181735A (ja) システム障害時のバッチジョブリカバリシステム
JP2999024B2 (ja) 子プロセスの終了待ち合わせ処理装置
JPH1040123A (ja) ジョブ管理方式と方法
JP2001134511A (ja) ネットワーク管理システム及びその管理方法並びにその制御プログラムを記録した記録媒体
JP2010140106A (ja) ジョブ実行システム、該システムに用いられるジョブフロー引継ぎ方法及びジョブフロー引継ぎ制御プログラム

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071024

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081024

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081024

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091024

Year of fee payment: 12

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091024

Year of fee payment: 12