JPH0334037A - システム異常の検出処理方式 - Google Patents

システム異常の検出処理方式

Info

Publication number
JPH0334037A
JPH0334037A JP1169128A JP16912889A JPH0334037A JP H0334037 A JPH0334037 A JP H0334037A JP 1169128 A JP1169128 A JP 1169128A JP 16912889 A JP16912889 A JP 16912889A JP H0334037 A JPH0334037 A JP H0334037A
Authority
JP
Japan
Prior art keywords
detection
abnormality
system abnormality
occurrence
continuation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP1169128A
Other languages
English (en)
Other versions
JP2665380B2 (ja
Inventor
Katsuhiko Mori
克彦 森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP1169128A priority Critical patent/JP2665380B2/ja
Publication of JPH0334037A publication Critical patent/JPH0334037A/ja
Application granted granted Critical
Publication of JP2665380B2 publication Critical patent/JP2665380B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔概要] データ処理システムのシステム異常の発生を検出するシ
ステム異常の検出処理方式に関し、異常の発生の検出を
システムに負担をかけることなく、かつ精度よく検出で
きるようにすることを目的とし、 システムの異常の発生の有無を所定の検出周期に従って
検出する第1の検出部と、第1の検出部がシステムの異
常の発生を検出するときに、発生したシステムの異常の
継続をより短い検出周期に従って検出する第2の検出部
と、第2の検出部がシステムの異常の継続を検出すると
きに、システムの異常の発生を表示する異常状態表示部
とを備えるよう構成する。
〔産業上の利用分野〕
本発明は、データ処理システムのソフトウェア資源の使
用状態やシステム動作上の内部処理状態を周期的に監視
することで、システムの異常の発生を検出するシステム
異常の検出処理方式に関し、特に、システムの異常の発
生をシステムに負担をかけることなく、かつ精度よく検
出できるようにするシステム異常の検出処理方式に関す
る。
オンライン処理するコンピュータシステムでは、ソフト
ウェアが処理のために必要とする資a(以下、ソフトウ
ェア資源と称する)の使用状態を監視して、ソフトウェ
ア資源の使用が過負荷状態にあるのか否かを検出する処
理や、システム動作上の内部処理状態を監視して、内部
処理状態が過負荷状態にあるのか否かを検出する処理を
行うことになる。このようなシステム異常の検出処理は
、本来のデータ処理を圧迫することなく、かつ精度よく
検出できるように構成していく必要がある。
〔従来の技術〕
従来のシステム異常の検出処理方式では、ソフトウェア
資源の使用状態やシステム動作上の内部処理状態を所定
の検出周期に従って周期的に監視するよう構成するとと
もに、この監視によりシステムの異常が所定回数連続す
ることを検出すると、システムに異常があると判断して
、リカバリー処理に入るべくシステムの異常を表示する
よう処理していた。
〔発明が解決しようとする課題〕
しかしながらこのような従来技術にあって、本来のデー
タ処理を圧迫しないために、システムの異常の発生の検
出のための検出周期を長く設定すると、第7図に示すよ
うに、例えばソフトウェア資源の使用状態の異常で説明
するならば、使用状態の異常が継続するような場合には
使用状態の異常の発生を精度よく検出できるものの、第
8図に示すように、使用状態が正常/異常の判断値を境
界にしてふらつくような場合には、使用状態に異常が発
生しているとは言えないのに異常と判断してしまうとい
う問題点があった。これに対処するためには、システム
の異常の発生の検出のための検出周期を短く設定すれば
よいのであるが、それでは本来のデータ処理を圧迫して
しまうという問題点がでてくることになる。ここで、第
6図では、ソフトウェア資源の使用状態の異常の発生が
4回継続した場合に異常を表示する例を示しである。
本発明はかかる事情に鑑みてなされたものであって、デ
ータ処理システムのシステム異常の発生をシステムに負
担をかけることなく、かつ精度よく検出できるようにす
る新たなシステム異常の検出処理方式を提供することを
目的とする。
(課題を解決するための手段) 第1図は本発明の原理構成図である。
図中、lは本発明を具備するデータ処理システム、l○
はデータ処理実行部であって、所定のデータ処理を実行
するもの、11は動作状態管理部であって、データ処理
実行部10の実行に伴って使用されるソフトウェア資源
の使用状態値やシステム動作上の内部処理状B値を管理
するもの、12は第1の検出部であって、動作状態管理
部11の管理データを参照することでシステムの異常の
発生の有無を検出するもの、13は第1の検出実行依頼
部であって、所定の検出周期に従って第1の検出部12
に対して検出の実行依頼を行うもの、14は第2の検出
部であって、第1の検出部12がシステムの異常の発生
を検出するときに、動作状態管理部11の管理データを
参照することでシステムの異常の継続を検出するもの、
15は第2の検出実行依頼部であって、第1の検出実行
依頼部13の検出周期より短い1つ又は複数の検出周期
に従って第2の検出部14に対して検出の実行依頼を行
うもの、16は異常状態表示部であって、第2の検出部
14がシステムの異常の継続を検出するときに、システ
ムの異常の発生をデータ処理実行部10に通知するもの
である。
〔作用] 本発明では、第1の検出部12は、第1の検出実行依頼
部z3からの起動依頼に応して所定の検出周期に従って
動作状態管理部11の管理データを参照することで、デ
ータ処理システムのソフトウェア資源の使用状態やシス
テム動作上の内部処理状態に異常が発生したのか否かを
検出する。この検出処理によりシステムに異常が発生し
たことが検出されると、続いて、第2の検出部14は、
第2の検出実行依頼部15からの起動依頼に応じて第1
の検出部12の検出周期より短い検出周期に従って動作
状態管理部11の管理データを参照することで、システ
ムの異常の発生が連続して複数回続いているのか否かを
検出することで、システムの異常が継続しているのか否
かを判断する。
この判断により、システムの異常が継続していることが
検出されると、異常状態表示部16は、データ処理実1
テ部10に対してシステムの異常の発生を表示する処理
を行う。
このように、本発明では、先ず最初に、より長い検出周
期に従ってシステムの異常の発生を検出するよう構成す
るとともに、異常の発生が検出されるときには、より短
い検出r@期に従ってシステムの異常の発生のm続を判
断するよう構成したことから、システムの異常の発生を
本来のデータ処理を圧迫することなく、かつ精度よく検
出できるようになる。
更に、この異常の継続の検出処理にあって、第2の検出
実行依頼部15は、用意する複数の検出周期の内の最も
長い検出周期に従って第2の検出部14に対して起動依
頼を行い、この検出周期に従って第2の検出部14が異
常の継続を検出するときには、次に長い検出周期に従っ
て第2の検出部14に対して起動依頼を行うといったよ
うに構成することで、第2の検出部14は、用意される
複数の検出周期の長いものの順に従って発生したシステ
ムの異常の継続を判断するよう処理する。
このように構成すると、本発明の効果を更に大きなもの
にできる。
[実施例] 以下、実施例に従って本発明の詳細な説明する。
第2図に、本発明のシステム構成を図示する。
図中、1はパケット交換機等のデータ処理システム本体
、2ばデータ処理プログラムごあって、所定のデータ処
理をオンラインで実行するもの、3は制御プログラムで
あって、データ処理プログラム2が使用するソフトウェ
ア資a(バッファやトランザクション等)の使用状態や
データ処理プログラム2が実行するシステム動作上の内
部処理状態(出力キュー長等)の異常の発生を検出する
機能を備えるもの、4は入力側端末であって、データ処
理プログラム2にデータを入力するもの、5は出力側端
末であって、データ処理プログラム2からのデータを受
は取るもの、6は入力バッファであって、入力側端末4
から入力されるデータを格納するもの、7は出カバソフ
ァであって、出力側端末5に出力されるデータを格納す
るもの、8は送信待機キューであって、送信待ちの状態
にある出力データをキューに接続して管理するものであ
る。
制御プログラム3は、ソフトウェア資源の使用状態やシ
ステム動作上の内部処理状態の異常の発生を検出するた
めに、監視起動プログラム30と、検出サイクルカウン
タ31と、トランザクションの使用数を監視するトラン
ザクション数監視プログラム32aや送信待ちの状態に
あるキューの滞留数を監視するキュー長監視プログラム
32b等の状態監視プログラム32と、トランザクショ
ンの使用数を管理するトランザクション使用数管理部3
3aや送信待ちの状態にあるキューの滞留数を管理する
キュー長滞留数管理部33b等の状態データ管理部33
とを備えるよう構成される。
第3図に、検出サイクルカウンタ31の構成を示す、こ
の図に示すように、検出サイクルカウンタ31は、各状
態監視プログラム32毎に割り付けられる計数値を管理
するもので、この計数値は、これから説明するように、
初期値を起点にして0゛の値になるまで基本周期に達す
る度毎に1つずつ減算されていくことになる。なお、こ
の初期値は、トランザクション数監視プログラム32a
とキュー長監視プログラム32bとで異なる値が用いら
れるように、状態監視プログラム32の種別に応して適
切な値が用いられることになるが、以下説明の便宜上“
nl“の値を採るものとして説明することにする。
次に、第4図及び第5図に示すフローチャートに従って
、本発明について詳細に説明する。ここで、第4図のフ
ローチャートは、監視起動プログラム30が実行するフ
ローチャートであり、第5図のフローチャートは、状態
監視プログラム32が実行するフローチャートである。
監視起動プログラム30は、第4図のフローチャートの
ステップ1で示すように、タイマを監視することで、現
在の時刻が例えば1分といったような基本時間単位で区
切られる基本周期に達したのか否かを判断する。このス
テップ1の判断で現在の時刻が基本周期に達したと判断
するときには、ステップ2に進んで、検出サイクルカウ
ンタ31が管理するずべての状態監視プログラム32に
ついての計数値を1つ減算する。続いて、ステップ3で
、この減算により検出サイクルカウンタ31の計数値が
“0°゛となる状態監視プログラム32があるのか否か
を判断する。このステノブ3の判断で計数値が“0”と
なる状態監視プログラム32があると判断するときには
、ステップ4に進んで、その計数値が“0”となる状態
監視プログラム32を起動する。そして、次のステップ
5で、データ処理の終了要求があるのか否かを判断して
、終了要求がないと判断するときにはステノブ上に戻る
よう処理する。一方、ステップ3の判断で計数値が“0
”となる状態監視プログラム32がないと判断するとき
には、直らにステップ5に進む処理を実行する。
このようにして、監視起動プ、ログラム30は、検出サ
イクルカウンタ31の初期値“nlにより設定される検
出周期に達すると、対応する状態監視プログラム32を
起動するよう処理することになるのである。
状態監視プログラム32は、監視起動プログラム30に
より起動されると、先ず最初に、第5図のフローチャー
トのステノブ10で示すように、状態データ管理部33
の管理データを参照することで、その時点におけるソフ
トウェア資源の使用状態値やシステム動作上の内部処理
状態値を読み取る。すなわち、トランザクション数監視
プログラム32aが起動されるときには、トランザクシ
ョン使用数管理部33aを参照することで使用中のトラ
ンザクション数を読み取り、また、キュー長監視プログ
ラム32bが起動されるときには、キュー長滞留数管理
部33bを参照することで送信待機キュー8にキューイ
ングされる滞留中の出力データ数を読み取ることになる
次に、状態監視プログラム32は、ステップ11で、読
み取ったソフトウェア資源の使用状態値やシステム動作
上の内部処理状態値の状態値を予め定めである判断値と
比較することで、システムに異常が発生したのか否かを
判断する。このステップ11の判断で使用状態値が判断
値より大きいと判断するとき、すなわち、システムに異
常が発生したと判断するときには、ステップ12に進ん
で、システム異常の継続回数を計数する継続回数カウン
タの計数値を1つ加算し、続くステノブ10で、この加
算した計数値が予め定めである例えば4回といった判断
回数に達したのか否かを判断する。
一方、ステップ11の判断で使用状B値が判断値より小
さいと判断するとき、すなわち、システムに異常が発生
していないか、あるいは、−反発生したもののステップ
13の判断回数分継続せずに消滅した場合には、ステッ
プ14に進んで、検出サイクルカウンタ31に初期値“
n、”をセントシ、続くステップ15で、継続回数カウ
ンタの計数値をクリア処理して処理を終了する。このス
テップ14の処理により、状態監視プログラム32は、
初期値“nlで定められる次の検出周期になると監視起
動プログラム30により再び起動されることになるとと
もに、ステップ15の処理により、システム異常の継続
回数を再び最初から計数できるようになる。
そして、ステップ13の判断で継続回数カウンタの計数
値が判断回数に達していないと判断するときには、ステ
ップ16に進んで、検出サイクルカウンタ31に“nl
より小さな値をとる初期値jlnl“°をセットする。
このステップ16の処理により、状態監視プログラム3
2は、今度はそれまでの初期値“nlで定められる検出
周期より短い検出周期である初期値“nl”で定められ
る検出周期に従って、監視起動プログラム30により起
動されていくよう処理される。一方、ステップ13の判
断で継続回数カウンタの計数値が判断回数に達したと判
断するとき、すなわち、状態監視プログラム32が初期
値nI″で定められる検出周期に従って起動されて、こ
の起動により検出されるシステムの異常が所定の判断回
数分継続したと判断するときには、ステップ17に進ん
で、システムに異常があることを表示する。この表示処
理により、オペレータに対して異常状態の発生を表示で
きるようになるとともに、必要なりカバリ−処理に入れ
るようになる。
このようにして、本発明では、ソフトウェア資源の使用
状態の例で説明するならば、第6図に示すように、通常
は(a)で示されるような長い検出周期に従ってソフト
ウェア資源の使用状態の異常の発生を検出するよう処理
するとともに、この検出処理に従って使用状態の異常が
検出されると、次に、■ないし■で示されるような短い
検出周期に従って異常の発生の継続を判断するよう処理
することになるのである。
この実施例では、1段階のより短い検出周期に従ってシ
ステムの異常の継続を検出していくものを開示したが、
短くする検出周期に更に段数を設けていくよう構成する
ことも可能である。このようにすると、更にデータ処理
プログラム2のデータ処理を圧迫することなく精度よく
使用状態の異常の継続を検出音eできることになる。
以上図示実施例について説明したが、本発明はこれに限
定されるものではない0例えば、システムの異常の継続
を判断するための判断回数は、起動される状態監視プロ
グラム32毎に異なるものであってもよい。
〔発明の効果〕
以上説明したように、本発明によれば、システムの異常
の発生を本来のデータ処理を圧迫せずに精度よく検出で
きるようになる。
【図面の簡単な説明】
第1図は本発明の原理構成図、 第2図は本発明のシステム構成図、 第3図は検出サイクルカウンタの説明図、第4図は監視
起動プログラムが実行するフローチャート、 第5図は状態監視プログラムが実行するフローチャート
、 第6図は本発明の処理内容を説明するための説明図、 第7図及び第8図は従来技術の問題点を説明するための
説明図である。 図中、1はデータ処理システム本体、2はデータ処理プ
ログラム、3は制御プログラム、4は入力側端末、5は
出力側端末、6は入力ハッファ、データ処理実行部、1
1は實A使用状態管理部、12は第1の検出部、14は
第2の検出部、16は異常状態表示部、30は監視起動
プログラム、31は検出サイクルカウンタ、32は状態
監視プログラム、33は状態データ管理部である。 特許出圓人 富士通株式会社 代 理 人  弁理士 森1)寛(外2名)放!1プイ
フル力ウングつ説明図 第3 図 蝕し虎λ2動プログラムカゞ九に−r Tるフロー呼ヤ
ード第4図

Claims (2)

    【特許請求の範囲】
  1. (1)データ処理システムのソフトウェア資源の使用状
    態やシステム動作上の内部処理状態を周期的に監視する
    ことで、システムの異常の発生を検出するシステム異常
    の検出処理方式において、システムの異常の発生の有無
    を所定の検出周期に従って検出する第1の検出部(12
    )と、該第1の検出部(12)がシステムの異常の発生
    を検出するときに、発生したシステムの異常の継続を上
    記検出周期より短い検出周期に従って検出する第2の検
    出部(14)と、 該第2の検出部(14)がシステムの異常の継続を検出
    するときに、システムの異常の発生を表示する異常状態
    表示部(16)とを備えることを、特徴とするシステム
    異常の検出処理方式。
  2. (2)請求項(1)記載のシステム異常の検出処理方式
    において、 第2の検出部(14)は、発生したシステムの異常の継
    続を検出するための検出周期を複数個用意して、該用意
    する複数の検出周期を長いものから順次選択して使用し
    ていくことで、発生したシステムの異常の継続を検出す
    ることを、 特徴とするシステム異常の検出処理方式。
JP1169128A 1989-06-30 1989-06-30 システム異常の検出処理方式 Expired - Fee Related JP2665380B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1169128A JP2665380B2 (ja) 1989-06-30 1989-06-30 システム異常の検出処理方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1169128A JP2665380B2 (ja) 1989-06-30 1989-06-30 システム異常の検出処理方式

Publications (2)

Publication Number Publication Date
JPH0334037A true JPH0334037A (ja) 1991-02-14
JP2665380B2 JP2665380B2 (ja) 1997-10-22

Family

ID=15880800

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1169128A Expired - Fee Related JP2665380B2 (ja) 1989-06-30 1989-06-30 システム異常の検出処理方式

Country Status (1)

Country Link
JP (1) JP2665380B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002041328A (ja) * 2000-07-24 2002-02-08 Tokyo Electron Ltd 処理装置を駆動するソフトウェアの自己診断方法
JP2006221484A (ja) * 2005-02-14 2006-08-24 Meidensha Corp コンピュータの温度異常監視方式
JP2011505043A (ja) * 2007-11-30 2011-02-17 インターナショナル・ビジネス・マシーンズ・コーポレーション 関連のネットワーク・トポロジを有する指定のトランザクション・サーバの動作をモニターするための方法、コンピュータ・プログラム、および装置(e‐ビジネス・システムのパフォーマンスおよび可用性をモニターするために動的にスケジュールされた合成トランザクションを使用するための方法)
EP2031639A3 (en) * 2000-07-07 2012-04-04 Tokyo Electron Limited A method of self-diagnosing software used to drive a processing apparatus

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6428748A (en) * 1987-07-24 1989-01-31 Hitachi Ltd Monitor system

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6428748A (en) * 1987-07-24 1989-01-31 Hitachi Ltd Monitor system

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2031639A3 (en) * 2000-07-07 2012-04-04 Tokyo Electron Limited A method of self-diagnosing software used to drive a processing apparatus
JP2002041328A (ja) * 2000-07-24 2002-02-08 Tokyo Electron Ltd 処理装置を駆動するソフトウェアの自己診断方法
JP2006221484A (ja) * 2005-02-14 2006-08-24 Meidensha Corp コンピュータの温度異常監視方式
JP2011505043A (ja) * 2007-11-30 2011-02-17 インターナショナル・ビジネス・マシーンズ・コーポレーション 関連のネットワーク・トポロジを有する指定のトランザクション・サーバの動作をモニターするための方法、コンピュータ・プログラム、および装置(e‐ビジネス・システムのパフォーマンスおよび可用性をモニターするために動的にスケジュールされた合成トランザクションを使用するための方法)

Also Published As

Publication number Publication date
JP2665380B2 (ja) 1997-10-22

Similar Documents

Publication Publication Date Title
JPH0334037A (ja) システム異常の検出処理方式
JP2001318807A (ja) タスク切り替え制御方法及び装置
JP3859564B2 (ja) イベント通知タスク制御処理方式及び方法並びにプログラム
JPS63163932A (ja) 制御用計算機のシステム監視方式
JP4313858B2 (ja) 計算機
JP2677175B2 (ja) コンピュータシステムの外部イベント検出方式
JP2842748B2 (ja) 情報処理装置の監視制御方式
JP2842213B2 (ja) 情報処理装置の監視システム
JP2814988B2 (ja) 障害処理方式
JPH064318A (ja) エラー検出方式
JPH04280329A (ja) プログラム異常検出方式
JP2730209B2 (ja) 入出力制御方式
JPH0325534A (ja) 複合系計算機システムのプログラム異常処理方式
JPH0293738A (ja) 割込み処理方式
JPS59180758A (ja) Ncpにおけるル−プ検出方式
JPS63280345A (ja) プログラム異常検出方法
JPH03260734A (ja) コンピュータシステムの資源管理方式
JP3042034B2 (ja) 障害処理方式
JPH06131205A (ja) デッドロックリスタート方式
JPH02310755A (ja) ヘルスチェック方式
JPH0287893A (ja) 遠方監視制御装置
JPH10340196A (ja) 演算処理方式
JPS62245456A (ja) 時間監視制御方式
JPH0756773A (ja) 制御装置診断方法
JPH0363833A (ja) プロセッサ診断方式

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees