JP2001022717A - 分散環境の運用管理システムに関する誤操作判別方法 - Google Patents

分散環境の運用管理システムに関する誤操作判別方法

Info

Publication number
JP2001022717A
JP2001022717A JP11197014A JP19701499A JP2001022717A JP 2001022717 A JP2001022717 A JP 2001022717A JP 11197014 A JP11197014 A JP 11197014A JP 19701499 A JP19701499 A JP 19701499A JP 2001022717 A JP2001022717 A JP 2001022717A
Authority
JP
Japan
Prior art keywords
input operation
failure
input
state
execution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11197014A
Other languages
English (en)
Inventor
Hiroshi Ishijima
博史 石島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP11197014A priority Critical patent/JP2001022717A/ja
Publication of JP2001022717A publication Critical patent/JP2001022717A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)
  • Multi Processors (AREA)

Abstract

(57)【要約】 【課題】分散環境で稼動するコンピュータに対する誤操
作により発生する障害を未然に防止する。 【解決手段】操作入力部16から入力された操作を、分
散コンピュータの構成情報・稼動状況のデータ(構成・
稼動情報データベース15)、及び、入力操作に対する
障害履歴情報(履歴情報データベース13)をもとに適
正な操作かどうかを判別し(判別部18)、不適正と判
別された場合は入力操作をキャンセルして警告メッセー
ジを表示(警告表示部17)することにより、誤操作に
よる障害の発生を未然に防止する。 【効果】分散環境におけるコンピュータ群の運用管理シ
ステムにおいて、誤操作によるシステム障害を未然に防
止できる効果がある。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、システムの障害情
報を管理する運用管理システムに係わり、特に、コンピ
ュータおよびアプリケーションに対する停止や再起動な
どの操作によるコンピュータの状態変化を推測すること
により、障害を未然に防止する誤操作の判別方法及びシ
ステムに関する。
【0002】
【従来の技術】従来の方法では、特開平8−13781
3号の記載のように、分散環境の運用管理システムにお
いて、システム障害が発生した後に障害情報をイベント
としてシステム管理者に通知したり、発生したイベント
に応じた対処方法を予め定義しておくことによりシステ
ム運用の自動化を図る、等の事後対処型の運用管理シス
テムに関する発明であった。
【0003】また、システムの状態変化を推測する方法
を用いた運用管理システムの例としては、稼動性能情報
の統計値に従って、ある程度長期的過程にわたってシス
テムの状態変化を予測する手法があるが、システムに対
する操作の直前・直後でシステムの状態がどのように変
化するのかを推測することによりシステム障害を管理す
る手段は考案されていない。
【0004】
【発明が解決しようとする課題】複数台のクライアント
コンピュータが接続されたサーバコンピュータの停止処
理(シャットダウン)は基本的にはサーバコンピュータ
が設置されている部門・部署のエンドユーザが行う場合
が多い。従来であれば、クライアントコンピュータを使
用するエンドユーザが居なくなった時点でサーバコンピ
ュータの停止操作を行えば良かった。しかし、現在で
は、在宅勤務、サテライトオフィス、等の勤務形態の変
化により、誰がいつサーバコンピュータに接続している
のか分からない場合もあり、サーバコンピュータの停止
処理によって当該サーバコンピュータに接続しているク
ライアントコンピュータにシステム障害を引き起こす可
能性もある。また、現在のような分散コンピューティン
グの環境にあっては、コンピュータ間の接続関係が複雑
化しており、エンドユーザがその接続関係を正確に把握
するのは困難である。さらに、サーバコンピュータの停
止処理には当該サーバコンピュータに接続されている他
コンピュータの稼動状況の把握が必要であるが、停止処
理を行う全てのエンドユーザがそのような情報を把握で
きる訳ではなく、意図せずに誤ってサーバコンピュータ
を停止してしまう場合も多い。
【0005】従来技術では、あるコンピュータに対する
操作がネットワークで相互接続された他コンピュータの
障害を誘発する可能性がある場合に、障害を未然に防止
する為の手段を提供していなかった。例えば、前述のよ
うにクライアントマシン上のアプリケーションがサーバ
コンピュータと通信中もしくは接続中にある状態で、当
該サーバコンピュータの接続状態を確認せずに誤って停
止もしくは再起動しようとした時に、クライアントマシ
ンが当該サーバコンピュータに接続中である旨を示す適
切な警告メッセージを通知したり、この操作をキャンセ
ルするような仕組みが従来のシステムには無く、誤操作
によるシステム障害を未然に防止することが課題であっ
た。
【0006】本発明の目的は、複数台のコンピュータ群
から成る分散環境において、あるコンピュータに対する
操作が他コンピュータにどのような影響を及ぼすのかを
推測し、当該操作により他コンピュータの障害を引き起
こすと判別された場合はその操作をキャンセルして警告
メッセージを表示することにより、システム障害を未然
に防止することを目的とする。
【0007】
【課題を解決するための手段】複数台のコンピュータか
ら成る分散環境において、システム管理者もしくはエン
ドユーザから受け付けた入力操作を一時的に保持する手
段、及び、ネットワークで接続された複数コンピュータ
および複数アプリケーションの相互の依存関係を構成情
報として管理する手段と、各コンピュータおよびネット
ワークならびにアプリケーションの稼動状況を監視する
ための手段と、これらのデータを格納するためのデータ
ベースと、一時的に保存した入力操作を実行する手段
と、入力操作実行直後のシステムの障害状況を検出する
手段と、入力操作と入力操作前のシステムの状態ならび
に入力操作後のシステムの障害状況の一連のデータを履
歴情報として管理するためのデータベースと、入力操作
および入力操作前のシステムの状態を履歴情報と照合・
比較して入力操作の適正/不適正を判別する手段と、判
別結果が不適正の場合に入力操作をキャンセルして警告
メッセージを表示する手段と、判別結果が適正の場合に
入力操作を実行する手段、とを備え、入力操作の実行前
に当該操作の適正/不適正を判別して適切な対処を行う
ことにより、本発明の目的は達成される。
【0008】
【発明の実施の形態】次に、本発明の一実施例について
図面で説明する。
【0009】はじめに、本発明のシステム構成について
図1で説明する。
【0010】クライアントコンピュータ2及び3はサー
バコンピュータ1に接続されており、アプリケーション
A20はアプリケーションA10と接続関係にあり、ア
プリケーションB30はアプリケーションB11と接続
関係にある。各コンピュータ間および各アプリケーショ
ン間の接続関係は、構成情報・稼動状況監視エージェン
ト21および31と構成情報・稼動状況監視部14によ
って検出される。さらにアプリケーションA20および
アプリケーションB30の稼動状況は構成情報・稼動状
況監視エージェント21および31によってそれぞれ監
視され、その情報は構成情報・稼動状況監視部14に報
告され、構成・稼動情報データベースに格納される。監
視は、定期的、および、入力操作の実行直後のタイミン
グで行われる。定期的とは、例えば、1分間に1回等の
任意の間隔に設定して監視を行うことを示す。
【0011】サーバコンピュータの停止や再起動などの
操作は、操作入力部16で受け付けられる。なお、入力
された操作は即時実行されるわけではなく、操作が適正
であることが判別されるまで操作入力部で保持される。
入力操作が適正であるかどうかの判別は、判別部18で
行われ、不適正であると判別された場合は入力操作がキ
ャンセルされて警告表示部17に警告メッセージが表示
される。一方、適正であると判別された場合は操作実行
部19で入力操作が実行される。さらに、実行直後のシ
ステムの障害状況は障害検出部12で監視されており、
障害が生じた場合は操作前のシステムの状態と操作後の
システムの障害状況を不適正な操作として履歴情報デー
タベース12に格納する。一方、障害が生じなかった場
合は適正な操作として履歴情報データベース12に格納
される。
【0012】次に、本発明による誤操作判別処理の流れ
を図2のフロー図で説明する。
【0013】最初にシステム管理者もしくはエンドユー
ザがサーバコンピュータのメニュー画面を操作すること
で操作入力部16に入力操作のデータが保存される。入
力操作のデータ形式の一例を図3に示す。次に、取得し
た入力操作のデータを判別部18に送る。判別部18で
は、構成・稼動データベース15を参照して現在のシス
テムの状態を取得する。構成・稼動データベース15の
データ形式の一例を図4に示す。構成・稼動データベー
ス15には、システムの状態を表現するための必要最低
限の情報として、監視対象と接続先および稼動状況なら
びに接続状況のデータが格納されている。なお、図4に
示したデータ以外にも、CPU負荷状況、ディスク使用
量、等の稼動性能情報を使用してシステムの状態をより
詳細に記述することにより、判別の精度を高めることも
可能である。判別部18における判別処理は、入力操作
と操作実行前のシステムの状態を履歴情報と照合・比較
して行われる。履歴情報データベース13のデータ形式
の一例を図5に示す。履歴情報データベース13には、
入力操作と入力操作前のシステムの状態および入力操作
後のシステムの状態ならびに適正/不適正の分類から構
成されるデータが格納されている。
【0014】判別部18における判別処理の一例につい
て、図3、図4、図5で説明する。入力操作が図3に示
される“コンピュータ1:アプリケーションBの停止”
であったとする。判別部18では、はじめに履歴情報デ
ータベース13を検索して当該入力操作と一致するデー
タを抽出する。図5では、#1と#2のデータがこれに
一致する。さらに、抽出したデータを検索して操作入力
時のシステムの状態と一致するデータを抽出する。操作
入力時のシステムの状態とは、図4に示す構成・稼動デ
ータベース15のデータそのものである。本実施例で
は、図5の#1のデータがこれに一致する。最後に、一
致した履歴情報データの分類を参照し、当該データが適
正/不適正のどちらに分類されているかを判別すること
で、入力操作が適正か否かを判別することができる。本
実施例では、図5の#1の分類が“適正”となっている
ため、当該操作を実行してもシステム障害が生じないと
いう判別結果を得ることができる。仮に、履歴情報デー
タベース15の検索の結果、一致するデータが抽出でき
なかった場合は、判別不可能の旨をメッセージとしてエ
ンドユーザに通知し、操作実行の選択をエンドユーザに
委ねるか、もしくは、判別結果が適正として処理するこ
とが考えられる。なお、判別方法として、ニューラルネ
ットワーク等の学習機能を持つ人工知能技術に基づいた
判別方法を適用することも可能である。
【0015】判別結果後の処理については、判別結果が
不適正であった場合、操作入力部16に保持されていた
入力操作をキャンセルして、警告表示部17に警告メッ
セージを通知することでエンドユーザに注意を促す。警
告メッセージとしては、図5の入力操作後のシステムの
状態を使用することにより、起こり得るシステム障害の
状況を具体的に示すことができる。例えば、図5の#2
の入力操作後のシステムの状態に示すように“コンピュ
ータ2:アプリケーションBで障害発生”する旨を警告
メッセージとして通知することにより、エンドユーザは
操作を実行するに当たって、コンピュータ2の使用者に
警告を与える、等の適切な対処を事前に行うことができ
る。
【0016】判別結果が適正であった場合は、操作入力
部16に保持されていた入力操作を操作実行部19にて
実行する。次に、操作実行後のシステム障害状況を障害
検出部12で検出する。システム障害状況の検出方法の
一例は、構成情報・稼動状況監視部14で監視している
システムに異常が発生した時に、障害検出部12にイベ
ントメッセージを通知する等の方法で実現できる。操作
実行後にシステム障害が検出された場合、履歴情報デー
タベース13に入力操作データ、入力操作前のシステム
の状態、入力操作後のシステムの状態を格納すると共に
当該データの分類を不適正とする。一方、システム障害
が検出されなかった場合は当該データの分類を適正とす
る。なお、履歴情報データベース13に当該データが既
に存在する場合は、履歴情報データベースの当該データ
の分類の欄だけを更新するものとする。これにより、図
5に示すようなデータが履歴情報データベース13に格
納され、入力操作の適正/不適正の判別基準となるデー
タの蓄積が可能となる。なお、実際の運用に際しては、
試験的にあらゆるシステム状況下であらゆる入力操作を
繰り返し実行して、履歴情報データベース13に判別基
準となるデータを予め蓄積しておくことも可能である。
【0017】
【発明の効果】以上説明したように、本発明によれば、
分散環境におけるコンピュータ群において、誤操作によ
るシステム障害を未然に防止できる効果がある。
【0018】本発明は、操作対象のコンピュータ画面に
分散コンピュータの稼動状況が表示されていない場合に
特に有効な機能であり、例えば、ログイン画面の状態で
サーバコンピュータを停止する場合など、サーバコンピ
ュータと接続されている他コンピュータの稼動状況がわ
からない状態で停止や再起動の操作しなければいけない
時などに有効な機能である。
【図面の簡単な説明】
【図1】本発明によるシステム構成を示すブロック図で
ある。
【図2】本発明による誤操作判別処理の動作を示すフロ
ー図である。
【図3】本発明の実施例の入力操作データの内容の一例
を示す図である。
【図4】本発明の実施例のシステムを構成する構成・稼
動情報データベースの内容の一例を示す図である。
【図5】本発明の実施例のシステムを構成する履歴情報
データベースの内容の一例を示す図である。
【符号の説明】
1…サーバコンピュータ、10…アプリケーションA、
11…アプリケーションB、12…障害検出部、13…
履歴情報データベース、14…構成情報・稼動状況監視
部、15…構成・稼動情報データベース、16…操作入
力部、17…警告表示部、18…判別部、19…操作実
行部、2…クライアントコンピュータ、20…アプリケ
ーションA、21…構成情報・稼動状況監視エージェン
ト、3…クライアントコンピュータ、30…アプリケー
ションB、31…構成情報・稼動状況監視エージェン
ト。

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 分散環境における運用管理システムに関
    して、システム管理者もしくはエンドユーザの操作が、
    操作対象のコンピュータと接続関係にある他コンピュー
    タも含めたシステム全体に与える影響を推測し、入力さ
    れた操作により障害が生じると判別された場合には入力
    された操作を実行せずにキャンセルすることを特徴とし
    た誤操作判別方法。
  2. 【請求項2】上記の誤操作判別方法において、入力操作
    実行前後のシステムの状態を監視する手段を有し、入力
    操作と操作実行前後のシステムの状態を履歴データとし
    て記録しておくことにより、次に入力される操作の適正
    /不適正の判別を入力操作実行前のシステムの状態と履
    歴データに基づいて行うことを特徴とする誤操作判別方
    法。
  3. 【請求項3】入力された操作と操作実行前のシステムの
    状態を上記の履歴データと照合・比較した結果、入力操
    作と操作実行前のシステムの状態が履歴データの障害事
    例と一致すると判別された場合(当該操作が過去におい
    ても実行され、履歴データに当該操作が記録されてお
    り、かつ、当該操作実行前のシステムの状態が過去の履
    歴データにおいても存在し、この状態で当該入力操作を
    実行した後にシステム障害が検出された事例があった場
    合)に、当該履歴データの障害事例を警告メッセージに
    引用して表示することにより、次に起こり得る障害を詳
    細かつ具体的に通知することを特徴とする警告メッセー
    ジの通知方法。
  4. 【請求項4】上記の入力された操作により発生する障害
    を事前に推測する方法において、入力された操作により
    障害が発生すると判別された場合に、予め定義しておい
    た自動アクション(ある目的を実現するための一連のコ
    マンド)を起動することにより、障害要因を排除してか
    ら入力操作を実行することを特徴とする自動運転システ
    ム方法。
  5. 【請求項5】上記の入力された操作により障害が発生す
    ると推測された場合に、入力操作をキャンセルする代わ
    りに、障害が起こり得る全ての分散コンピュータに対し
    て警告メッセージを通知し、ある時間経過した後に入力
    操作を強制的に実行する、もしくは、全ての分散コンピ
    ュータから操作実行許可の確認を受けた後に入力操作を
    実行することを特徴とする誤操作判別後の入力操作の実
    行方法。
JP11197014A 1999-07-12 1999-07-12 分散環境の運用管理システムに関する誤操作判別方法 Pending JP2001022717A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11197014A JP2001022717A (ja) 1999-07-12 1999-07-12 分散環境の運用管理システムに関する誤操作判別方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11197014A JP2001022717A (ja) 1999-07-12 1999-07-12 分散環境の運用管理システムに関する誤操作判別方法

Publications (1)

Publication Number Publication Date
JP2001022717A true JP2001022717A (ja) 2001-01-26

Family

ID=16367356

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11197014A Pending JP2001022717A (ja) 1999-07-12 1999-07-12 分散環境の運用管理システムに関する誤操作判別方法

Country Status (1)

Country Link
JP (1) JP2001022717A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004295533A (ja) * 2003-03-27 2004-10-21 Nec Corp アプリケーション障害回避システム、監視用コンピュータ、サーバコンピュータ及びプログラム
US7069473B2 (en) 2001-10-05 2006-06-27 Nec Corporation Computer recovery method and system for recovering automatically from fault, and fault monitoring apparatus and program used in computer system
JP2007272802A (ja) * 2006-03-31 2007-10-18 Fujitsu Ltd 画面記録プログラム
WO2014030707A1 (ja) * 2012-08-23 2014-02-27 トヨタ自動車株式会社 自己監視機能を備えたコンピュータ、監視プログラム
JP2014120138A (ja) * 2012-12-19 2014-06-30 Fujitsu Ltd 異常原因推定プログラム、異常原因推定装置及び異常原因推定方法
JP5535391B1 (ja) * 2013-11-06 2014-07-02 ソフトバンクBb株式会社 コマンド処理システム及びプログラム
WO2023245796A1 (zh) * 2022-06-22 2023-12-28 佛山市顺德区美的电子科技有限公司 空调器的控制方法、装置、空调器及存储介质

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7069473B2 (en) 2001-10-05 2006-06-27 Nec Corporation Computer recovery method and system for recovering automatically from fault, and fault monitoring apparatus and program used in computer system
JP2004295533A (ja) * 2003-03-27 2004-10-21 Nec Corp アプリケーション障害回避システム、監視用コンピュータ、サーバコンピュータ及びプログラム
JP2007272802A (ja) * 2006-03-31 2007-10-18 Fujitsu Ltd 画面記録プログラム
WO2014030707A1 (ja) * 2012-08-23 2014-02-27 トヨタ自動車株式会社 自己監視機能を備えたコンピュータ、監視プログラム
JP2014041554A (ja) * 2012-08-23 2014-03-06 Toyota Infotechnology Center Co Ltd 自己監視機能を備えたコンピュータ、監視プログラム
CN104583969A (zh) * 2012-08-23 2015-04-29 丰田自动车株式会社 具备自监视功能的计算机、监视程序
JP2014120138A (ja) * 2012-12-19 2014-06-30 Fujitsu Ltd 異常原因推定プログラム、異常原因推定装置及び異常原因推定方法
JP5535391B1 (ja) * 2013-11-06 2014-07-02 ソフトバンクBb株式会社 コマンド処理システム及びプログラム
WO2023245796A1 (zh) * 2022-06-22 2023-12-28 佛山市顺德区美的电子科技有限公司 空调器的控制方法、装置、空调器及存储介质

Similar Documents

Publication Publication Date Title
CN100498725C (zh) 用于最小化计算机应用程序中的丢失的方法和系统
US8707386B2 (en) Policy processing system, method, and program
US7856575B2 (en) Collaborative troubleshooting computer systems using fault tree analysis
JP4892367B2 (ja) 異常兆候検出システム
US20010011358A1 (en) Fault handling system and fault handling method
CN110659159A (zh) 一种服务进程运行监控方法、装置、设备及存储介质
JP2001022717A (ja) 分散環境の運用管理システムに関する誤操作判別方法
US6067637A (en) Data reduction technique for rule based systems
US7340594B2 (en) Bios-level incident response system and method
JP5613570B2 (ja) バッチジョブ遅延警告自動発報システムおよび自動発報方法、ならびにそのためのプログラム
JP4230946B2 (ja) アプリケーション監視装置、そのプログラム、及びその記録媒体。
CN115037652A (zh) 一种套保系统后台模块运行监控系统
JP2004164271A (ja) ジョブ実行監視方法及びプログラム
JP7263206B2 (ja) 情報処理システム、情報処理システムの制御方法、情報処理装置、及びプログラム
JPH10283015A (ja) プラント監視制御システム
CN114915541A (zh) 系统故障排除方法及装置、电子设备及存储介质
JP2006259891A (ja) システム運用管理支援装置、システム運用管理支援方法、およびシステム運用管理支援プログラム
JP2012181699A (ja) 障害調査情報資料採取システム、管理サーバ、障害調査情報資料採取方法およびそのプログラム
JP5997005B2 (ja) 情報処理装置、プロセスの正常終了判定方法およびプログラム
JP3771001B2 (ja) 分散システムの診断システム及び分散システムの診断プログラムを格納した記憶媒体
JP5978804B2 (ja) システムを管理するためのプログラム、方法及び情報処理装置
JP2020080111A (ja) ジョブ管理システム
CN112506689B (zh) 一种异构柜台系统风险监控方法、装置、设备及介质
JP2001005795A (ja) 分散システムにおける異常検出方法
JP2008204134A (ja) 異常兆候検出対処システム