JPH07297823A - ネットワークシステムの障害管理方式 - Google Patents

ネットワークシステムの障害管理方式

Info

Publication number
JPH07297823A
JPH07297823A JP6086573A JP8657394A JPH07297823A JP H07297823 A JPH07297823 A JP H07297823A JP 6086573 A JP6086573 A JP 6086573A JP 8657394 A JP8657394 A JP 8657394A JP H07297823 A JPH07297823 A JP H07297823A
Authority
JP
Japan
Prior art keywords
fault
information
network system
failure
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6086573A
Other languages
English (en)
Inventor
Kazuyuki Nishikawa
和幸 西川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP6086573A priority Critical patent/JPH07297823A/ja
Publication of JPH07297823A publication Critical patent/JPH07297823A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Computer And Data Communications (AREA)
  • Monitoring And Testing Of Exchanges (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Telephonic Communication Services (AREA)

Abstract

(57)【要約】 【目的】 千差万別な要求をもつユーザシステムの障害
発生時に、人手を介すことなく、障害の発生に適正に対
処可能とする。 【構成】 集中監視ホストコンピュータシステム1、サ
ブネットワークシステム2は、生成・更新ソフトウェア
12、22により作成、更新される障害対処規定情報1
1、21を備える。これらの情報は、通常、格納ファイ
ル14、24に格納されている。障害管理ソフトウェア
16、26は、障害の報告があったとき、規定情報1
1、21の内容を障害情報に基づいて検索し、その結果
の対処方法を、障害対処処理実行ソフトウェア17〜1
A、27〜2Aに実行させる。障害対処処理実行ソフト
ウェアは、遠隔保守センタ3への報告、ネットワーク障
害管理端末15、25への表示等による警報、データベ
ース1B、2Bへの収集情報の格納、サブネットワーク
システム2または端末システム4への報告等を行う。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、ネットワークシステム
の障害管理方式に係り、特に、千差万別で様々な要求を
持つユーザシステムの保守運用に即した障害管理を行う
ことを可能にしたネットワークシステムの障害管理方式
に関する。
【0002】
【従来の技術】コンピュータネットワークシステムの障
害管理方式に関する従来技術として、ホストコンピュー
タシステムに接続されているシステムコンソール、ネッ
トワーク監視装置に、ホストコンピュータシステム及び
サブネットワークシステムで発生する大量の障害メッセ
ージ等の必要なものだけを時系列的に表示し、あるい
は、障害発生部位を地図上に表示するという技術が知ら
れている。そして、この従来技術は、前述の障害メッセ
ージ等の表示に基づいて、保守員がそのネットワークシ
ステムの保守運用に則った障害部位の究明、原因究明等
の作業を行い、人手によりその後の処置を行うというも
のである。
【0003】また、他の従来技術として、ホストコンピ
ュータシステムが、障害部位の究明、原因の究明等の作
業をエキスパートシステム等により自動的に行うことが
できるようにした技術が知られている。一般に、千差万
別な要求を持つユーザのネットワークシステムは、その
構成がほぼ同一であっても、そのユーザの業種、ネット
ワークシステムに採用されているプロトコル、保守運用
形態等の違いにより、システム毎にその障害対処方法が
異なるものである。このため、この障害部位の究明、原
因の究明等の作業をエキスパートシステム等により行う
この従来技術は、個々のシステムに対する要求を汎用的
に実現することが極めて困難なものである。
【0004】なお、この種のネットワークシステムの障
害管理方式に関する従来技術として、例えば、特開平3
−34643号公報、特開平4−156131号公報等
に記載された技術が知られている。
【0005】
【発明が解決しようとする課題】前述した前者の従来技
術は、保守員が保守を担当するネットワークシステムの
障害発生時のシステム構成及び保守運用を事前に知悉し
た上で、発生障害に対処しなければならず、そのため、
ネットワークシステムの構築時に最新のシステム構成図
を作成し、想定されるあらゆる障害への対処方法を検
討、文書化しておく必要のあるものである。
【0006】しかし、この従来技術は、実際の障害発生
時、保守員が障害発生時の慌ただしい状況の中で、膨大
な障害情報の中から適切な情報を検索して、適切な対処
を講じなければならず、多くの時間を要し、適切な対処
を講じることが困難な場合が多いという問題点を有して
いる。
【0007】また、前記従来技術は、システム運用中に
ネットワークシステムの構成変更、ユーザ業務の変更等
が生じた場合、システム構成図を最新のものに変更作成
し、また、障害対処方法のフィードバックを実施しなけ
ればならないという、多大な手間を要するという問題点
を有している。
【0008】さらに、前述した後者の従来技術は、個々
のシステムに対する要求を汎用的に実現することが極め
て困難であるという問題点を有している。
【0009】本発明の目的は、前記従来技術の問題点を
解決し、千差万別な要求をもつユーザシステムの障害発
生時に、人手を介すことなく、適正な部署への障害の早
期通知を行い、障害発生部位の絞り込みによる障害切り
分け精度の向上、適正な箇所への障害情報の格納を行う
ことができるようにしたネットワークシステムの障害管
理方式を提供することにある。
【0010】
【課題を解決するための手段】本発明によれば前記目的
は、複数のサブネットワークシステムと集中監視ホスト
コンピュータシステムとが通信網により接続されて構成
されるネットワークシステムにおいて、前記サブネット
ワークシステムに、該サブネットワークシステム内で検
知される障害に対する対処方法を、そのサブネットワー
クシステムの保守運用方法に対応させて規定した情報フ
ァイルを備え、前記集中監視ホストコンピュータシステ
ムに、該集中監視ホストコンピュータシステム内で検知
される障害に対する対処方法、及び、前記サブネットワ
ークシステムから報告される障害に対する対処方法を、
ネットワークシステムの保守運用方法に対応させて規定
した情報ファイルを備え、前記各システムが、障害の報
告を受けたとき、ファイル内の各障害に対応する対処方
法に従った処理を行うようにすることにより達成され
る。
【0011】また、前記目的は、前述に加え、前記ネッ
トワークシステム及びサブネットワークシステムの保守
運用方法が変更されたとき、保守運用により規定されて
いる障害の対処方法を変更する手段と、障害に対して新
規に作成された対処方法、変更された対処方法を外部記
憶装置に格納する手段と備えることにより達成される。
【0012】
【作用】サブネットワークシステム及び前記集中監視ホ
ストコンピュータシステムは、それらのシステム内で検
知された障害に対する対処方法を、予めそれらのシステ
ムの保守運用方法に即して規定し、この対処方法を外部
記憶装置等に格納したファイルとして保持している。ネ
ットワークシステム内に位置するネットワーク管理シス
テムは、障害発生の通知を契機に、この規定された情報
を解析することにより、前記サブネットワークシステム
及び前記集中監視ホストコンピュータシステム内に設け
られている、障害発生箇所を特定化するための各種テス
トプログラムの実行、遠隔地にある保守監視センターへ
の障害発生の早期通知、任意の時点で障害発生状況を高
速検索、調査するための発生障害情報のデータベースへ
の記録等を、人手を介在させることなく、予め規定され
ている該ネットワークシステムの保守運用に従って実施
することができる。
【0013】また、本発明は、ネットワークシステムの
機器、サブネットワークシステムの増設等によるシステ
ムの構成変更、障害監視方法の変更等により、ネットワ
ークシステムの保守運用に変更が発生した場合、前述の
予め規定された情報を、ネットワークシステムの新たな
保守運用に対応させて、サブネットワークシステムに設
置されているネットワーク管理端末あるいは集中監視ホ
ストコンピュータシステムに設置されているネットワー
ク管理端末から修正することができる。
【0014】
【実施例】以下、本発明によるネットワークシステムの
障害管理方式の一実施例を図面により詳細に説明する。
【0015】図1は本発明の一実施例によるネットワー
クシステムの構成を示すブロック図、図2は各ユーザの
保守運用方式により規定される障害対処方法に関する情
報を説明する図である。図1において、1は集中監視ホ
ストコンピュータシステム、2はサブネットワークシス
テム、3は遠隔保守センター、4は端末システム、5〜
8は通信回線、11、21は障害対処規定情報、12、
22は障害対処規定情報生成・更新ソフトウェア、1
3、23は入出力ソフトウェア、14、24はデータ格
納ファイル、15、25はネットワーク管理端末、1
6、26はネットワーク障害管理ソフトウェア、17〜
1A、27〜2Aは障害対処処理実行ソフトウェア、1
B、2Bはデータベースである。
【0016】本発明が適用されるネットワークシステム
は、例えば、図1に示すように、WAN、LAN等の通
信網に通信回線5を介して集中監視ホストコンピュータ
システム1と1または複数のサブネットワークシステム
2とが接続されると共に、各サブネットワークシステム
2に通信回線7、WAN、LAN等の通信網を介して多
数の端末システム4が接続されて構成されている。ま
た、通信回線6、8を介して接続される遠隔保守センタ
3が備えられている。
【0017】集中監視ホストコンピュータシステム1
は、ネットワークシステムにおける保守運用方式を規定
する障害対処規定情報11、この障害対処規定情報11
を新規作成、更新する障害対処規定情報生成・更新ソフ
トウェア12、障害対処規定情報11を格納するデータ
格納ファイル14、データ格納ファイル14への障害対
処規定情報の書き込み、読み出しを行う入出力ソフトウ
ェア13、障害対処規定情報11の新規作成作業、更新
作業を行い、発生障害の表示、ブザー鳴動等の警告を行
うネットワーク管理端末15、障害発生時に障害対処規
定情報11の規定内容により障害対処制御を行うネット
ワーク障害管理ソフトウェア16、ネットワーク障害管
理ソフトウェア16の制御の下で各障害に対する処理を
実行する障害対処処理実行ソフトウェア17、18、1
9、1A、及び、発生した障害の情報を記録するデータ
ベース1Bを備えて構成される。
【0018】また、サブネットワークシステム2は、集
中監視ホストコンピュータシステム1とほぼ同様に構成
され、サブネットワークシステムでの保守運用方式を規
定する障害対処規定情報21、この障害対処規定情報2
1を新規作成、更新する障害対処規定情報生成・更新ソ
フトウェア22、障害対処規定情報21を格納するデー
タ格納ファイル24、データ格納ファイル24への障害
対処規定情報の書き込み、読み出しを行う入出力ソフト
ウェア23、障害対処規定情報21の新規作成作業、更
新作業を行い、発生障害の表示、ブザー鳴動等の警告を
行うネットワーク管理端末25、障害発生時に障害対処
規定情報21の規定内容により障害対処制御を行うネッ
トワーク障害管理ソフトウェア26、ネットワーク障害
管理ソフトウェア26の制御の下で各障害に対する処理
を実行する障害対処処理実行ソフトウェア27、28、
29、2A、及び、発生した障害の情報を記録するデー
タベース2Bを備えて構成される。
【0019】前述した本発明の一実施例において、ネッ
トワークシステムの構築時に、ネットワークシステムの
保守運用方式を検討し、ネットワークシステム内で発生
する全ての障害に対する対処方法を定める。その定めら
れた対処方法は、集中監視ホストコンピュータシステム
に関するものについて、ネットワーク障害管理端末15
から、また、サブネットワークシステムに関するものに
ついて、ネットワーク障害管理端末25から投入され
る。
【0020】投入された情報は、それぞれの障害対処規
定情報生成・更新ソフトウェア12、22により、図2
に示すような障害対処方法規定情報として作成される。
全ての情報の作成が完了すると、それらの障害対処方法
規定情報は、障害対処規定情報入出力ソフトウェア1
3、23によりデータ格納ファイル14、24に格納さ
れる。
【0021】なお、ネットワークシステムの構成によっ
ては、サブネットワークシステム2にネットワーク障害
管理端末25が設置されない場合がある。このような場
合、サブネットワークシステム2の障害に対する対処方
法の情報は、集中監視ホストコンピュータシステム1の
ネットワーク障害管理端末15から投入され、障害対処
規定情報生成・更新ソフトウェア12により障害対処規
定情報に生成される。そして、この障害対処規定情報
は、入出力ソフトウェア13の制御の下に通信回線5を
通じてサブネットワークシステム2に送信され、サブネ
ットワークシステム2内の入出力ソフトウェア23によ
りデータ格納ファイル24に格納される。
【0022】障害対処規定情報は、集中監視ホストコン
ピュータシステム1、サブネットワークシステム2のそ
れぞれのシステム内で発生する全ての障害に対して、そ
の1つ1つの障害に対する障害対処方法を規定するもの
であり、図2(a)に示すように、障害メッセージ番号
等の障害識別情報に対応して、その障害の予想される発
生部位情報、障害対処メニュー情報、各メニューの詳細
情報を持って構成される。
【0023】障害対処メニュー情報は、その障害に対し
て実行すべき処理を規定する複数のメニューを、メニュ
ーのオフセット情報として指示するものであり、実行す
べき処理として、例えば、図2(b)に示すように、障
害通知処理、障害記録(格納)処理、障害表示警告/処
理、テスト処理等の各処理がある。また、メニュー情報
のそれぞれは、メニュー詳細情報として、図2(c)〜
図2(f)に示すように、その具体的な処理方法を規定
している。
【0024】次に、前述のように構成される本発明の一
実施例の動作を説明する。
【0025】ネットワークシステムの立ち上げ時、デー
タ格納ファイル14、24に格納されている前述で説明
した障害対処規定情報は、入出力ソフトウェア13、2
3により読み出され、障害対処規定情報11、21とし
て、システムのメモリ上に配置されて、ネットワークシ
ステム内での障害発生に対して待機する。
【0026】いま、サブネットワークシステム2内で障
害の発生が検知されると、この障害の発生がネットワー
ク障害管理ソフトウェア26に通知される。ネットワー
ク障害管理ソフトウェア26は、通知された障害情報を
解析して障害識別情報と部位情報とを求める。さらに、
ネットワーク障害管理ソフトウェア26は、解析処理の
結果求めた障害識別情報と部位情報とをキーとして、メ
モリ上の障害対処規定情報21の内容をサーチし、発生
した障害に該当する障害対処規定情報のエントリを特定
する。
【0027】そして、ネットワーク障害管理ソフトウェ
ア26は、図2に示す障害対処規定情報の内容に従っ
て、対応する障害対処処理実行ソフトウェア27、2
8、29、2Aにその処理を実行させ、遠隔保守センタ
3への報告、ネットワーク障害管理端末25への表示等
による警報、データベース2Bへの収集情報の格納、端
末システム4への報告等を行わせる。
【0028】前述では、サブネットワークシステム2内
で障害が発生した場合について説明したが、集中監視ホ
ストコンピュータシステム1内で障害が発生した場合、
ホストコンピュータシステム1内の各ソフトウェアが、
前述したサブネットワークシステムの場合と同様の処理
手順を実行し、最終的に障害対処処理実行ソフトウェア
17、18、19、1Aが障害に対する各種処理を実行
する。
【0029】なお、集中監視ホストコンピュータシステ
ム1は、サブネットワークシステム2から通信回線5を
介して伝送されてくるサブネットワークシステム2の障
害情報に対する処理も実行するので、データ格納ファイ
ル14には、サブネットワークシステム2の障害に対す
る障害対処規定情報も格納されている。但し、この場合
のサブネットワークシステム2の障害に対する障害対処
規定情報は、サブネットワークシステム2の障害に対し
て、集中監視ホストコンピュータシステム1として実行
すべき障害対処規定情報であればよい。
【0030】また、ネットワークシステムの構成及び保
守運用方法に変更が生じた場合、その変更情報は、集中
監視ホストコンピュータシステムに関するものについ
て、ネットワーク障害管理端末15から、サブネットワ
ークシステムに関するものについて、ネットワーク障害
管理端末25から投入されるる。投入された変更情報
は、それぞれ、障害対処規定情報生成・更新ソフトウェ
ア12、22により、障害対処方法規定情報に反映され
て全ての情報が更新される。この更新が完了すると、更
新された障害対処方法規定情報は、障害対処規定情報入
出力ソフトウェア13、23によりデータ格納ファイル
14、24に格納される。
【0031】前述した本発明の一実施例によれば、ネッ
トワークシステムを構成するサブネットワークシステム
と集中監視ホストコンピュータシステムとのそれぞれ
が、システムの運用方法によって異なる自システム内の
障害に対応する対処方法を、ネットワークシステム構築
時に、想定されるあらゆる障害への対処方法の情報とし
て有しており、また、集中監視ホストコンピュータシス
テムが、各サブネットワークシステムの障害に対応する
対処方法の情報を有しているので、これらの情報に基づ
いて、障害発生時に、人手を介すことなく、適正な部署
への障害の早期通知を行い、障害発生部位の絞り込みに
よる障害切り分け精度の向上を図り、適正な箇所への障
害情報の格納を行うことができる。
【0032】また、本発明の一実施例によれば、システ
ムの構成変更、保守運用方法の変更が行われたときに
も、障害に対応する対処方法の情報を変更して、これら
の情報を保持することができるので、常に、システムの
最適な保守運用を図ることができる。
【0033】
【発明の効果】以上説明したように本発明によれば、高
度なスキルをもったネットワークシステムの保守員が減
少しつつある今日的状況の中で、千差万別な要求を持つ
ユーザシステムの障害発生時に、人手を介すことなく、
適正な部署への障害の早期通知を行い、障害発生部位の
絞り込みによる障害切り分け精度の向上を図り、適正な
箇所への障害情報の格納を行うことができる。
【図面の簡単な説明】
【図1】本発明の一実施例によるネットワークシステム
の構成を示すブロック図である。
【図2】各ユーザの保守運用方式により規定される障害
対処方法に関する情報を説明する図である。
【符号の説明】
1 集中監視ホストコンピュータシステム 2 サブネットワークシステム 3 遠隔保守センター 4 端末システム 5〜8 通信回線 11、21 障害対処規定情報 12、22 障害対処規定情報生成・更新ソフトウェア 13、23 入出力ソフトウェア 14、24 データ格納ファイル 15、25 ネットワーク管理端末 16、26 ネットワーク障害管理ソフトウェア 17〜1A、27〜2A 障害対処処理実行ソフトウェ
ア 1B、2B データベース
フロントページの続き (51)Int.Cl.6 識別記号 庁内整理番号 FI 技術表示箇所 H04M 3/22 Z

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 1または複数のサブネットワークシステ
    ムと集中監視ホストコンピュータシステムとが通信網に
    より接続されて構成されるネットワークシステムにおい
    て、前記サブネットワークシステムに、該サブネットワ
    ークシステム内で検知される障害に対する対処方法を、
    そのサブネットワークシステムの保守運用方法に対応さ
    せて規定した情報として格納するファイルを備え、前記
    集中監視ホストコンピュータシステムに、該集中監視ホ
    ストコンピュータシステム内で検知される障害に対する
    対処方法、及び、前記サブネットワークシステムから報
    告される障害に対する対処方法を、ネットワークシステ
    ムの保守運用方法に対応させて規定した情報として格納
    するファイルを備え、前記各システムが、障害の報告を
    受けたとき、ファイル内の各障害に対応する対処方法に
    従った処理を行うことを特徴とするネットワークシステ
    ムの障害管理方式。
  2. 【請求項2】 前記ネットワークシステム及びサブネッ
    トワークシステムの保守運用方法の変更が発生したと
    き、前記保守運用に対応して規定されている障害に対す
    る対処方法を変更する手段を備えることを特徴とする請
    求項1記載のネットワークシステムの障害管理方式。
JP6086573A 1994-04-25 1994-04-25 ネットワークシステムの障害管理方式 Pending JPH07297823A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6086573A JPH07297823A (ja) 1994-04-25 1994-04-25 ネットワークシステムの障害管理方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6086573A JPH07297823A (ja) 1994-04-25 1994-04-25 ネットワークシステムの障害管理方式

Publications (1)

Publication Number Publication Date
JPH07297823A true JPH07297823A (ja) 1995-11-10

Family

ID=13890761

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6086573A Pending JPH07297823A (ja) 1994-04-25 1994-04-25 ネットワークシステムの障害管理方式

Country Status (1)

Country Link
JP (1) JPH07297823A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100357636B1 (ko) * 2000-12-01 2002-10-25 삼성전자 주식회사 망 관리장치에서 경보정보 관리방법

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100357636B1 (ko) * 2000-12-01 2002-10-25 삼성전자 주식회사 망 관리장치에서 경보정보 관리방법

Similar Documents

Publication Publication Date Title
US5655081A (en) System for monitoring and managing computer resources and applications across a distributed computing environment using an intelligent autonomous agent architecture
US6938082B2 (en) Method for controlling managing computer, medium for storing control program, and managing computer
US6289368B1 (en) Method and apparatus for indicating the status of one or more computer processes
JPH0822403A (ja) 計算機システムの監視装置
US20070198908A1 (en) System and method for interfacing with a system monitor
JPH03213891A (ja) フォールト・トリー表示方法、フォールト・トリー表示装置およびプロセス診断支援システム
JP2892675B2 (ja) コンソール装置の監視方法及び情報処理システムのコンソール制御方法
JPH07297823A (ja) ネットワークシステムの障害管理方式
JP3867868B2 (ja) 障害統合管理装置
JP2748832B2 (ja) ネットワーク障害管理方法
JP2000056823A (ja) データ監視システム
JP2001084034A (ja) イベント記録の解析方法
JPH05274193A (ja) ログ編集機能付コンピュータシステム
JPH11212826A (ja) 障害情報出力方式及び装置
JP3622719B2 (ja) 障害情報表示システム
JPH06326751A (ja) ネットワーク障害対策管理システム
CN109558385B (zh) 一种基于Linux系统的日志文件管理装置
JPH0666607A (ja) プラント運転情報提供方法及び装置
JP2877064B2 (ja) 監視制御システムのデータベース整合方式
JP2539826Y2 (ja) 警報表示装置
JPH10198419A (ja) プラント情報監視装置とその入出力点リスト編集処理装置
CN113554329A (zh) 一种运维可视化的规则配置审批管理系统
JPH01256896A (ja) プロセス状態表示装置
JPH06332910A (ja) ホストコントローラのアラーム情報管理方法及び同装置
CA2046747A1 (en) Tracking the resolution of a problem on a computer system in a service network of computer systems