JPH03253945A - データ処理システムの異常回復処理機能確認方式 - Google Patents

データ処理システムの異常回復処理機能確認方式

Info

Publication number
JPH03253945A
JPH03253945A JP2053320A JP5332090A JPH03253945A JP H03253945 A JPH03253945 A JP H03253945A JP 2053320 A JP2053320 A JP 2053320A JP 5332090 A JP5332090 A JP 5332090A JP H03253945 A JPH03253945 A JP H03253945A
Authority
JP
Japan
Prior art keywords
abnormality
processing
monitoring device
information
recovery processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2053320A
Other languages
English (en)
Inventor
Hiroshi Egawa
江川 浩
Hitoshi Toyama
遠山 均
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2053320A priority Critical patent/JPH03253945A/ja
Publication of JPH03253945A publication Critical patent/JPH03253945A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [概要] 1以上の処理装置と処理装置の異常を監視する監視装置
とからなり、処理装置の異常によりシステムダウンした
時に監視装置から処理装置へのリセット指令によりシス
テムの再立上げが行われるように構成されたデータ処理
システムにおける異常回復処理機能の確認方式に関し。
データ処理システムにおける異常回復処理機能の確認試
験を自動化して能率よく行えるようにすることを目的と
し。
処理装置は擬似障害生成手段を備えており、外部から異
常回復処理確認試験の指令を受けることで、擬似障害生
成手段が起動されて異常状態となるように構成され、監
視装置は処理装置が擬似障害状態となった時刻情報を含
む異常情報を保持する保持手段を備え、これらの異常情
報に基づいて異常回復処理機能の良否を確認できるよう
になっている。
[産業上の利用分野] 本発明はデータ処理システムにおける異常回復処理機能
の確認方式に関する。
近年、情報化社会の発展に伴い、データ処理システムの
停止が社会に及ぼす影響は計り知れないものがある。従
って、データ処理システムには。
システムがシステムダウンしない機能が必要であること
は勿論のこと、システムダウンしてしまった場合にその
状態からの異常回復処理が正常に行なわれるか否かを確
認する機能も、製品提供側からも、また使用者の立場か
らも益々重要なものになっている。
[従来の技術] lまたは複数の処理装置と少なくとも1つの監視装置か
らなり、ある処理装置に異常が発生した時に残りの処理
装置でシステムの運用を続行するようにしたデータ処理
システムにおいては、システムの異常回復処理方式とし
て、処理装置に次々と異常が発生して遂には残りの処理
装置がなくなってシステムダウンした場合に、監視装置
がこれを検知し全処理装置に対してリセット信号を与え
てシステムを再立上げする方式が一般的に用いられてい
る。
一般にデータ処理システムにおいては、処理装置はハー
ドウェア異常あるいはソフトウェア異常が発生した時に
は自動的にホルト状態(異常状態)となるように処理プ
ログラムが組まれており、また異常内容によっては処理
プログラムが関与することなくハードウェア的にホルト
状態になるようにもなっている。
一方、監視装置は1診断系パスにより常に処理装置の動
作状態を監視しており、各処理装置がホルト状態になっ
ているか否かを監視してホルト状態になった場合にはそ
れを検出する機能を持っている。さらに監視装置は、シ
ステムとして定義されている処理装置の全てがホルト状
態に陥った場合にそれを検出して、全ての処理装置に対
してリセット信号を送る機能を持っている。
そして処理装置には監視装置からリセット信号を受ける
と、自らを再立上げする機能が備えられており、これに
よりシステムダウン時にシステムの再立上げが行なわれ
るようになっている。
[発明が解決しようとする課B] データ処理装置の高信頼化を図るためには、システムが
システムダウンに陥らないよう設計することの他、万一
システムダウンしてしまった場合に上述のような異常回
復処理機能が正常に働くか否かを確認できることが必要
となるが、従来、かかる異常回復処理機能の6I認試験
は、システム内の各処理装置を人手により異常状態に設
定することにより行なわれている。
このように人手を介在して試験を行なっているため、従
来の異常回復処理機能の[認試験は能率が悪く、繰返し
試験の実施が困難であり、そのため試験品質が低いもの
となっていた。
本発明はかかる問題点に鑑みてなされたものであり、デ
ータ処理システムにおける異常回復処理機能の確認試験
を自動化して能率よく行なえるようにすることを目的と
する。
[課題を解決するための手段] 本発明に係るデータ処理システムの異常回復処理機能の
確認方式は、1以上の処理装置1111[1]〜11■
と処理装置11[1]〜llOの異常を監視する監視装
置12とからなり、処理装置tll[1]〜11@の異
常によりシステムダウンした時に監視装置12から処理
装置11[1]〜ll@へのリセット指令によりシステ
ムの再立上げが行われるように構成されたデータ処理シ
ステムにおいて、処理装置11[1]〜11■は擬似障
害生成手段13[1]〜13@を備えており、外部から
異!回復処理EIl認試験の指令を受けることで、擬似
障害生成手段13[1]〜13@が起動されて異常状態
となるように構成され、監視装置I2は処理装置11[
1]〜ll@が擬似障害状態となった時刻情報を含む異
常情報を保持する保持手段14を備え、これらの異常情
報に基づいて異常回復処理機能の良否を確認するように
なっているものである。
[作用J データ処理システムの異常回復処理機能が正常に働くか
否かを確認するための異常回復処理確認試験を行なう時
には、システムを構成する各処理装置11[1]〜11
0に対して外部から異常回復処理確認試験指令を与える
これにより処理装置11[1]〜11@の擬似障害生成
手段13[1]〜130が起動されて、処理装置11[
1]〜llOは自動的に擬似障害による異常状態に陥る
監視装置12は各処理装置11[1]〜ll@の異常を
監視しており、処理装置が異常状態に陥ると、それを検
出して、その異常事象をその発生した時刻情報と共に異
常情報として保持手段14に蓄える。
システムの全ての処理装置11[1]〜11■が異常状
態となると、システムダウンとなり、監視装置I2はそ
れを検出すると、全処理装置11[1]〜ll@に対し
てリセット指令を発する。
これにより各処理装置11[1]〜11■は再立上げ処
理を行い、それによりシステムが再立上げされる。この
再立上げされた時刻情報が処理装置あるいは監視装置等
で検出される。
異常回復処理機能が正常に機能しているか否かの確認は
、これら処理装置の異常によりシステムダウンとなった
時刻情報とシステム再立上げされた時刻情報などから行
うことができる。
[実施例] 以下1図面を参照して本発明の詳細な説明する。
第2図には本発明の一実施例としての異常回復処理機能
確認方式によるデータ処理システムが示される。第2図
において、1は共有メモリ、2[1]〜2@は処理装置
、3は監視装置、4は制御端末である。
各処理装置2[1]〜2■はバス5を介して共有メモリ
lに接続されており、それによりどの処理装置2[1]
〜2@からも共通メモリ1にアクセスできるようになっ
ている。また各処理装置2[1]〜2■はバス6を介し
て監視装置3にも接続されており、それにより両者間で
データの授受ができるようになっている。さらに各処理
装置2[1]〜20と監視装置3間は診断系バス7を介
して各処理装置2[1]〜2■の異常発生を常に監視で
きるようになっている。
またバス6には制御端末4も接続されており。
この制御端末4はバス6を介して各処理装置2[1]〜
2■に対して試験指令を送ったり、あるいは共有メモリ
lにアクセスすることができるようになっている。
各処理装置2[1]〜2■の各個は1通常のシステム運
用のため処理プログラムの他に、自装置を擬似障害状態
に陥れる擬似障害生成用の処理プログラムを備えており
、異常回復処理機能確認試験指令を受けることで、この
擬似障害生成プログラムを起動できるようになっている
また監視装置3は、その内部記憶装置上に障害発生時の
異常情報を記録するための異常情報記憶領域31を持ち
、さらに、各種の事象が発生した時刻を計るための計時
機構32と、各処理装置2[1]〜2@からの要求に従
って異常情報記憶領域31に格納されている異常情報や
計時機構32の現在の時刻情報等を処理装置に転送する
機能を持っている。
以下、第3図を参照しつつ実施例システムの動作が説明
される。ここで第3図には実施例システムの動作シーケ
ンスが示されている。
まず、異常回復処理機能の確認試験に先立って、共有メ
モリlのテスト情報記憶領域に制御端末4からテスト情
報が書き込まれる。このテスト情報としては、各処理装
置が発生する擬似障害の内容(種別)とその発生時刻な
どであり、これらの情報が各処理装置毎に決められて共
有メモリlに格納されるものである。
異常回復処理機能確認試験にあたっては、制御端末4か
ら各処理装置2[1]〜2@に対して確認試験指令が送
出される。これにより各処理装置2[1]〜2@の擬似
障害生成プログラムが起動され。
この擬似障害生成プログラムは共有メモリlにアクセス
してテスト情報を読み出し、自装置がどの時刻にどの種
別の擬似障害を発生すればよいかを知り、それを実行す
る。
監視装置3は診断系バス7を介して各処理装置2[1]
〜2■が次々と擬似障害状態に陥るのを監視しており、
それにより各処理装置2[1]〜2@について、それら
の装置がボルト状態になったこととその時刻とを検出し
て、それを異常情報として異常情報記憶領域31に格納
する。
やがて全ての処理装置2[1]〜2■がホルト状態に陥
ると、監視装置3はその事象を検出して、システムを再
立上げするために、全ての処理装置2[1]〜2■に対
してリセット信号を送出する。
これにより各処理装置2[1]〜2@は再立上げ処理を
行い、再立上げされると、監視装置3に対して異常情報
転送要求を発する。
これにより監視装置3は、その異常情報転送要求を発し
た処理装置に対して、異常情報記憶領域31から読み出
した全処理装置の異常発生時刻情報と計時機構32によ
る現在の時刻情報を転送する。
処理装置の処理プログラムはこれらの情報を取得すると
、それに基づいて、現在の時刻と全処理装置が異常状態
に陥った時刻の差を求める。この差時間はいわゆるダウ
ン時間であり、監視装置がシステム全体の異常を検出し
てからシステムの再立上げに要した時間を示している。
処理装置上の処理プログラムはその値が設計条件の範囲
に入っているかを判定し、それにより異常回復処理機能
が正常に機能しているか否かを確認することができる。
本発明の実施にあたっては種々の変形形態が可能である
。例えば上述の実施例では、異常回復処理機能が正常か
否かの判定を監視装置から各処理装置に異常情報を転送
することで、各処理装置上で行わせているが、勿論、こ
の判定を監視装置上で行うようにしてもよい。
また実施例では各処理装置に対する試験指令を制御端末
から発するようにしたが、これを監視装置から発するよ
うにしてもよい。またこの試験指令は必要な時に任意に
行うものであっても、あるいは定期的に行うものであっ
てもよい。
さらに実施例では各処理装置が共通メモリからテスト情
報を取得するようにしたが、これらのテスト情報を例え
ば制御端末から各処理装置に直接に与えるようにしても
よい。
〔発明の効果] 以上説明したように1本発明によれば、データ処理シス
テムにおける異常回復処理機能が正常に機能するか否か
の確認を自動的に能率よく行うことが可能になり、デー
タ処理システムの高信頼化を図ることに寄与するところ
が大きい。
【図面の簡単な説明】
第1図は本発明に係る原理説明図。 第2図は本発明の一実流例としての異常回復処理機能の
確認方式によるデータ処理システムを示すブロック図、
および。 第3図は実施例システムの処理シーケンスを示す図であ
る。 図において。 1・・・共通メモリ 2[1]〜2@・・−処理装置 3・・一監視装置 4・・−制御端末 5.6・・−バス 7・・−診断系パス 31・・−異常情報記憶領域 32・・・計時機構

Claims (1)

  1. 【特許請求の範囲】 1、1以上の処理装置(11[1]〜11[n])と該
    処理装置(11[1]〜11[n])の異常を監視する
    監視装置(12)とからなり、該処理装置(11[1]
    〜11[n])の異常によりシステムダウンした時に該
    監視装置(12)から該処理装置(11[1]〜11[
    n])へのリセット指令によりシステムの再立上げが行
    われるように構成されたデータ処理システムにおいて、 該処理装置(11[1]〜11[n])は擬似障害生成
    手段(13[1]〜13[n])を備えており、外部か
    ら異常回復処理確認試験の指令を受けることで、該擬似
    障害生成手段(13[1]〜13[n])が起動されて
    異常状態となるように構成され、 該監視装置(12)は該処理装置(11[1]〜11[
    n])が擬似障害状態となった時刻情報を含む異常情報
    を保持する保持手段(14)を備え、これらの異常情報
    に基づいて異常回復処理機能の良否を確認するようにな
    っているデータ処理システムの異常回復処理機能確認方
    式。
JP2053320A 1990-03-05 1990-03-05 データ処理システムの異常回復処理機能確認方式 Pending JPH03253945A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2053320A JPH03253945A (ja) 1990-03-05 1990-03-05 データ処理システムの異常回復処理機能確認方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2053320A JPH03253945A (ja) 1990-03-05 1990-03-05 データ処理システムの異常回復処理機能確認方式

Publications (1)

Publication Number Publication Date
JPH03253945A true JPH03253945A (ja) 1991-11-13

Family

ID=12939431

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2053320A Pending JPH03253945A (ja) 1990-03-05 1990-03-05 データ処理システムの異常回復処理機能確認方式

Country Status (1)

Country Link
JP (1) JPH03253945A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8122288B2 (en) 2009-02-25 2012-02-21 Fujitsu Limited Redundant system, control apparatus, and control method
WO2013094048A1 (ja) * 2011-12-21 2013-06-27 富士通株式会社 試験サーバ、情報処理システム、試験プログラムおよび試験方法
CN110381196A (zh) * 2019-06-17 2019-10-25 深圳盈达机器视觉技术有限公司 移动装置跌落保护的控制方法及移动装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8122288B2 (en) 2009-02-25 2012-02-21 Fujitsu Limited Redundant system, control apparatus, and control method
WO2013094048A1 (ja) * 2011-12-21 2013-06-27 富士通株式会社 試験サーバ、情報処理システム、試験プログラムおよび試験方法
US9026858B2 (en) 2011-12-21 2015-05-05 Fujitsu Limited Testing server, information processing system, and testing method
CN110381196A (zh) * 2019-06-17 2019-10-25 深圳盈达机器视觉技术有限公司 移动装置跌落保护的控制方法及移动装置

Similar Documents

Publication Publication Date Title
US5870301A (en) System control apparatus including a master control unit and a slave control unit which maintain coherent information
CN110943865A (zh) 一种设备故障时间的诊断方法、装置及其相关设备
JPH03253945A (ja) データ処理システムの異常回復処理機能確認方式
JPH0962626A (ja) 分散処理システムのオンラインテスト方法
JP3127941B2 (ja) 二重化装置
JPH1188471A (ja) 試験方法及び試験装置
JPS62271153A (ja) 共通バス構造における診断方式
JPH0695731A (ja) 障害要因診断方式
CN108415788B (zh) 用于对无响应处理电路作出响应的数据处理设备和方法
JPS6314542B2 (ja)
JP3216272B2 (ja) 分散形制御装置
JP2522610B2 (ja) 生産監視システムの復帰方式
JP3110124B2 (ja) マルチコンピュータシステムにおける障害検出方式
JP2707663B2 (ja) メツセージ転送チエツク方式
JPH05233578A (ja) 障害装置の縮退方式
JPH0546426A (ja) 自己診断回路
JP3080150B2 (ja) 汎用インタフェース制御装置及び汎用インタフェース制御方法
JPH0916434A (ja) Cpu暴走時の障害情報検出方法
JP2762550B2 (ja) 制御システム
CN117743008A (zh) 多核处理器故障诊断与异常处理方法、主控板卡及设备
JP2896206B2 (ja) 多重化メモリ装置のオンライン診断方式
JPH08265320A (ja) ネットワークシステム障害検出処理回路
JPS60165192A (ja) 記憶装置異常書込み検出方式
JPH01216438A (ja) 障害通知方式
JPH0522408A (ja) 交換システム保守方式