JPH11243390A - ネットワークのイベント相関表作成方法 - Google Patents

ネットワークのイベント相関表作成方法

Info

Publication number
JPH11243390A
JPH11243390A JP10045275A JP4527598A JPH11243390A JP H11243390 A JPH11243390 A JP H11243390A JP 10045275 A JP10045275 A JP 10045275A JP 4527598 A JP4527598 A JP 4527598A JP H11243390 A JPH11243390 A JP H11243390A
Authority
JP
Japan
Prior art keywords
event
network
correlation table
symptom
propagation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP10045275A
Other languages
English (en)
Inventor
Yoshinori Takenami
佳則 武並
Takeshi Onishi
剛 大西
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sumitomo Electric Industries Ltd
Original Assignee
Sumitomo Electric Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sumitomo Electric Industries Ltd filed Critical Sumitomo Electric Industries Ltd
Priority to JP10045275A priority Critical patent/JPH11243390A/ja
Publication of JPH11243390A publication Critical patent/JPH11243390A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)
  • Computer And Data Communications (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

(57)【要約】 【課題】 ネットワークの構成の変化をイベント相関表
に容易に反映させることができる、イベント相関表の作
成方法を提供する。 【解決手段】 イベント相関表作成方法は、ネットワー
ク上の管理対象オブジェクトの構成情報をコンピュータ
の記憶手段内に準備するステップと、管理対象オブジェ
クトの構成情報と、予め定められたオブジェクト間のイ
ベント伝播ルールとに基づいて中間形式のイベントノー
ドネットワークを作成しコンピュータの記憶手段に記憶
させるステップと、このイベントノードネットワークに
基づいて機械可読な形式のイベント相関表を作成するス
テップとを含む。ネットワークの構成の変化をイベント
ノードネットワークに反映させることは容易であり、ま
たイベント相関表を分割することが容易になる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、ネットワーク上の
障害を管理するネットワーク管理システムに関し、特
に、ネットワーク上で観測されるさまざまな複数の障害
の症状から障害の根本原因を特定する機能を有するネッ
トワーク管理システムで、障害の症状と障害の根本原因
とを相関付けるために使用されるイベント相関表の作成
方法に関する。
【0002】
【従来の技術】コンピュータによる通信ネットワークの
大規模化が進んでいる。通信ネットワークが大規模化す
るに従って、ネットワーク上に発生する障害の及ぼす影
響も大規模かつ深刻なものとなりつつある。そのためネ
ットワーク管理をいかに効率よく行なうか、が非常に重
要である。以下、本明細書上で使用されるネットワーク
管理に関する用語について定義をする。
【0003】「イベント」とは、ネットワークにおいて
発生する例外的な状態のことをいう。ハードウェアやソ
フトウェアの故障、停止、性能のボトルネック、ネット
ワークの構成の不整合、設計不十分による意図せざる結
果、コンピュータウィルス等の悪意による被害などを含
む。「不具合」は「イベント」と同じ意味で使用する。
【0004】「症状」とは、観測可能なイベントのこと
をいう。「症状イベント」と同じである。たとえば「あ
る宛先Aに対して常に通信に時間がかかり再送信が必要
となる」、「ある宛先Bに対していつも文字化けが生ず
る」、「ある宛先Cに対していつも受信確認が返ってこ
ない」などの事象をいう。同じ意味で「Symptom 」とい
う語も使用する。「問題」とは、障害の根本原因のこと
をいう。必ずしも観測可能ではない。たとえば通信装置
の送信機破損、通信ケーブルの断線、通信回線の容量不
足などが例である。「問題イベント」は「問題」と同じ
意味である。同じ意味で「プロブレム」(Problem) とい
う語も使用する。
【0005】「オブジェクト」とは、概念や抽象または
対象となる問題に対して明確な境界と意味とを持つ何も
のか、のことをいう。「オブジェクトインスタンス」と
は、後述するあるオブジェクトクラスに属するある特定
の1つのオブジェクトのことをいう。単に「インスタン
ス」ともいう。「オブジェクトクラス」とは、同様の性
質(属性)、共通の振る舞い(操作)、他のオブジェク
トとの共通の関係、および共通の意味を持つオブジェク
トのグループをいう。「クラス」はオブジェクトクラス
と同じである。「サブクラス」とは、あるクラスの下位
クラスとして、そのクラスに包含されるクラスのことを
いう。「属性」とは、クラスに属する各オブジェクトに
よって保持されるデータをいう。
【0006】「オブジェクト図」とは、オブジェクト、
クラス、それらの間の関係のモデル化のための、形式的
な図式記法をいう。「クラス図」とは、多くの可能なイ
ンスタンスを記述するためのスキーマ、パターン、テン
プレートなどである。
【0007】「リポジトリ」とは、必要な情報を集約し
て一覧表的な形式で記憶した記憶部を言う。集約一覧表
メモリとでも呼ぶべきものである。「イベントリポジト
リ」とは、実際に発生した症状パターンを記憶する記憶
部をいう。「オブジェクトリポジトリ」とは、ネットワ
ークの構成モデルのリポジトリのことをいう。これによ
って「ある原因を仮定したときに発生する症状パター
ン」を前もって特定しておくことができる。
【0008】ネットワークのあるリソースにおける1つ
の問題イベントは、関係する複数のリソースの多くの症
状イベントを引き起こし得る。問題の中には、観測可能
なイベントであるものもあるが、一般には必ずしも観測
可能ではない。そのため複数の症状から障害の根本原因
である問題を特定する必要がある。したがって、ネット
ワーク管理者は、根本原因の問題を特定するために、観
測される種々の症状イベントを問題と相関させることが
できなければならない。
【0009】しかし、ネットワークが大規模になると、
観測される症状イベントの数も膨大になる。またどの問
題がどの症状を引き起こすかという「因果関係」とでも
言うべきものも複雑になってくるために、オペレータが
手作業で障害の根本原因の問題を特定することはほとん
ど不可能となる。
【0010】このようなネットワーク上で観測される膨
大な障害の症状イベントから根本原因の問題を正確にか
つ高速に特定するための従来技術手法として、1996
年6月18日発行の米国特許第5,528,516号
(「Apparatus and Method forEvent Correlation and
Problem Reporting(イベント相関および問題報告装置
および方法)」)が提案されている。
【0011】この従来技術は次の2つの技術に分けるこ
とができる。 (1) 管理対象ネットワークのモデリング技術 (2) イベント相関技術 「管理対象ネットワークのモデリング技術」とは、実際
のネットワーク上で発生する問題イベントおよび症状イ
ベントをいかに正確に効率よくモデル化するかという技
術である。(2)のイベント相関技術とは、主として、
観測される膨大な症状イベントからいかに高速に根本原
因である問題を特定するか、という技術である。本発明
は(1)の管理対象ネットワークのモデリング技術に関
連せず、(2)のイベント相関技術に関連する。そのた
め以下では(1)の管理対象ネットワークのモデリング
技術については最小限の説明にとどめる。なお以下の説
明は、障害に関するイベントに限定して行なうが、イベ
ントの種類はどのようなものであってもよく、本発明は
障害に関するイベントのみに制約されるものではない。
【0012】この従来技術で提案されている「管理対象
ネットワークのモデリング技術」について以下に簡単に
説明する。まず、ルータおよびハブなどのネットワーク
機器と、パーソナルコンピュータおよびワークステーシ
ョンなどのコンピュータと、これらを接続するネットワ
ークそのものと、コンピュータ等の上で実行されるソフ
トウェア等とからなるすべてのものを管理対象オブジェ
クトManagedObject としてモデル化する。そして、オブ
ジェクト間の「関係」を重要視し、ネットワーク上で発
生する問題イベントおよび症状イベントは、管理対象オ
ブジェクト間に設定された関係に沿って「伝播」するも
のとしてイベントの伝播をモデル化する。
【0013】上述の従来技術では、このような管理対象
オブジェクトのモデル化およびイベント伝播のモデル化
の静的な側面を抽象化し、モデル化を効率的に行なうた
めにオブジェクト指向の概念を導入している。すなわち
種々の管理対象オブジェクトをクラスとしてモデル化す
る。そしてクラス間の関係を定義する。さらにあるイベ
ントは、クラス間の関係に沿って伝播するものとしてモ
デル化される。オブジェクト指向技術については種々の
教科書があるのでそれらを参照されたい。
【0014】こうして定められたクラスシステムにもと
づいて、管理対象のネットワークをモデル化する。すな
わち、ネットワーク内の管理対象オブジェクトをあるク
ラスの一つのインスタンスとして抽象化し、そのインス
タンスが属するクラスと、他のインスタンスが属するク
ラスとの間に設定された関係にしたがってイベントがこ
れらインスタンス(管理対象オブジェクト)を伝播して
いくものとしてネットワークをモデル化する。さらに、
こうしてモデル化されたネットワークに基づき、問題
と、症状との間の相関を予め特定する。
【0015】まず、管理対象オブジェクトクラスのモデ
ル化について説明する。今、実際のネットワークの例と
して図27に示されるネットワークを考える。このネッ
トワークは、互いにブリッジ540 によって結合された2
つのイーサネットワーク534および536 を含む。一方の
イーサネットワーク534 にはホスト530 が、他方のイー
サネットワーク536 にはホスト532 がそれぞれ接続され
ているものとする。以下の例ではホスト530 にネットワ
ーク管理システム(NMS) が搭載されているものとして考
える。
【0016】図27に示されるネットワークを上述した
考え方を用いてモデル化するために次のようにする。図
28を参照して、各ボックスはオブジェクトクラス(ま
たはサブクラス)を示す。オブジェクトクラスの各ボッ
クスは2つのボックスに分割されている。上部のボック
スに記載されているのはオブジェクトクラス名であり、
下部のボックスに記載されているのはそのクラスのオブ
ジェクトが持つべき属性である。各クラス間には関係が
設定され、各関係はクラス間に引かれた線で示されてい
る。各線の近傍には、その関係の名称が記載されてい
る。なお図28および他の図面において、管理対象オブ
ジェクトモデルについてはOMT記法を用いて記す。
【0017】図28に示されるように、Nodeクラス524
の下に3つのサブクラスTcpNode クラス554 、IpNodeク
ラス556 およびEtherNode クラス558 を定義する。さら
にLinkクラス526 のサブクラスとしてTcpLink クラス56
0 、IpLinkクラス562 、EtherLink クラス564 およびMa
cBridgeLink クラス566 を定義する。なお、各クラスに
はそのクラス特有の属性を定義する必要がある。たとえ
ばIpNodeクラスにはIP(Internet Protocol) アドレス属
性を定義するなど、である。しかし、本発明には属性の
定義は関係しないので、ここでは属性についての詳細な
説明は行わない。
【0018】これらクラス間に設定される関係は、その
関係により結びつけられる2つのクラスのいずれから見
るかによって名称が変わる。たとえばNodeクラス524 と
Linkクラス526 との間の関係608 は一方から見ればConn
ected-via 、他方から見ればConnected-toである。また
図28には示していないが、同一クラス内のオブジェク
ト間に定められる関係もあり得る。
【0019】図28に示されるクラスを用いて、図27
に示すネットワーク例をインスタンス間の関係図として
表現することができる。こうした図は、オブジェクト指
向技術では「インスタンス図」と呼ばれる。
【0020】このようにしてモデル化された管理対象オ
ブジェクトに対して、症状イベントの伝播ルールが予め
準備される。この伝播ルールは、障害の根本原因の問題
イベントが障害の症状イベントに伝播し、その症状イベ
ントが別の症状イベントに伝播するという関係をルール
化したものである。この伝播ルールの集合を伝播モデル
と呼ぶ。
【0021】イベントの中には問題イベントでかつ症状
イベントであるものもあるし、どちらでもないものもあ
る。このような伝播モデル(ルール)において、各イベ
ントは、管理対象オブジェクトのクラス間に定義されて
いる関係に沿ってインスタンス間を伝播するという、イ
ベント伝播のモデル化がなされている。
【0022】このようにしてイベント伝播モデルが想定
されている場合に、図27に示されているネットワーク
でイベントがどのように伝播するかを以下に示す。ここ
では障害の根本原因の問題としてP1,P3,P4,P
5を考える。この場合、これらの問題の結果、イベント
伝播モデルに従って観測されると期待される症状イベン
トとこれら問題との関係はたとえば図29に示されるよ
うになる。
【0023】この表において、最も左側の列の各欄には
症状イベントが、第1行目の各欄には問題イベントが、
それぞれ記載されている。ある問題イベントの列とある
症状イベントの行との交わる欄には、その問題イベント
(原因)が発生したときに、当該症状イベントが発生す
るか否かを示す値が記入されている。この場合症状イベ
ントが生ずる場合に「1」を記入するものとする。たと
えば問題P1が発生したときには症状S1が生じるが、
症状S4は生じない。各ケースについて該当の列を縦に
見ていくと、「1」および「空白(0)」を連ねたもの
が得られる。これを当該問題イベントに対する症状イベ
ント群のコードと称する。たとえば図29のケース1で
は問題P1に対する症状イベント群のコードは「111
00」である。未記入(空白)の箇所は0としてある。
また問題P2に対する症状イベント群のコードは「01
100」である。
【0024】図29からわかるように、問題イベントが
異なると、観測される症状イベント群のコードが異な
る。したがって実際にネットワーク管理システム(NMS
)により観測および収集される症状イベント群と、図
29に示される症状イベント群とを比較することによ
り、障害の根本原因の問題を特定することが可能とな
る。このように、各問題と症状イベントとの相関関係を
表したものをイベント相関表と呼ぶ。実際にはこの比較
は、得られた症状イベント群と、イベント相関表の症状
イベント群との間に定義される「距離」を計算し、最も
距離の小さい問題を特定することにより行なわれる。
【0025】
【発明が解決しようとする課題】このようにある問題イ
ベントに対して生ずる症状イベントを予めパターン化し
ておけば、実際に障害が生じたときの症状パターンとこ
のパターンとを比較するという比較的単純な作業により
障害の根本原因の問題を特定することができる。したが
って、この従来の技術により障害の根本原因の問題の特
定が非常に容易になるかと思われる。しかしこの従来の
技術には次のような問題点がある。
【0026】たとえば図29に示すイベント相関表62
0において、症状S5は問題P5が発生したときしか生
じず、問題P1,P3,P4のときには生じない。これ
については二通りの解釈がある。その第1は、問題P
1,P3,P4が発生したときには症状S5は生じな
い、という解釈である。その第2は、問題P1,P3,
P4と症状S5とは無関係である、という解釈である。
この第2の解釈によると、症状S5と問題P1,P3,
P4とを相関させることは誤りであることになる。
【0027】ところが、図29のイベント相関表620
のように相関表を準備すると、この相関表は常に上述し
た第1番目の解釈にしたがって使用されることになる。
そのため問題P1,P3,P4と症状S5との関係が上
述した第2の解釈にしたがうべきものである場合には、
イベント相関を誤ることになる。つまり、図29におい
て、点線の矩形622および624で囲んだ部分につい
ては、不適切なコードを与えていることになる。
【0028】上記した従来の技術では、こうした場合で
もある程度まで正確に原因を特定することが可能なロバ
ストなアルゴリズムが提案されている。しかし、ネット
ワークが大規模化・複雑化した場合に、イベント相関表
が不適切であると、適切な原因特定処理ができなくなる
おそれが非常に大きい。
【0029】それゆえに請求項1に記載の発明の目的
は、ネットワークの構成の変化をイベント相関表に反映
させることが容易な、ネットワークのイベント相関表を
作成する方法を提供することである。
【0030】請求項2に記載の発明の目的は、ネットワ
ークの構成の変化をイベント相関表に反映させることが
容易で、かつ障害と原因との間の相関付けをより信頼性
高く行なうことができるイベント相関表を作成する方法
を提供することである。
【0031】請求項3に記載の発明の目的は、ネットワ
ークの構成の変化を適時にイベント相関表に反映させる
ことが容易で、かつ要求が発生する障害と原因との間の
相関付けをより信頼性高く行なうことができるイベント
相関表を作成する方法を提供することである。
【0032】
【課題を解決するための手段】請求項1に記載の発明に
かかる方法は、ネットワーク上に発生するイベントを互
いに相関させるためのイベント相関表をコンピュータを
用いて作成するためのネットワークのイベント相関表作
成方法である。この方法は、ネットワーク上の管理対象
オブジェクトの構成情報をコンピュータの記憶手段内に
準備するステップと、管理対象オブジェクトの構成情報
と、予め定められたオブジェクト間のイベント伝播ルー
ルとに基づいてイベントノードネットワークを作成しコ
ンピュータの記憶手段に記憶させるステップと、イベン
トノードネットワークに基づいて機械可読な形式のイベ
ント相関表を作成し、コンピュータの記憶手段に記憶さ
せる相関表作成ステップとを含む。
【0033】この方法によれば、ネットワークが一旦イ
ベントノードネットワークという中間形式でコンピュー
タの記憶手段に記憶される。このイベントノードネット
ワークからイベント相関表が作成される。ネットワーク
の構成が変更されたときに、このイベントノードネット
ワークに構成の変更を示す差分を反映させることは容易
にできる。したがって、ネットワークの構成変更があっ
たときに、最終的に必要とされるイベント相関表も容易
に変更を行なうことができる。また、イベントノードネ
ットワークはイベントの伝播関係を明確に示すので、互
いに独立名イベントノードネットワークを分離すること
が容易にできる。
【0034】請求項2に記載の発明にかかる方法は、請
求項1に記載の発明の構成に加え、相関表作成ステップ
は、イベントノードネットワークに基づいて、互いに独
立なイベントノードネットワークを構成するグループご
とにイベントノードを分類するステップと、所与のイベ
ント相関表作成条件が成立したことに応答して、前記分
類されたイベントノードと、前記イベントノードネット
ワークとに基づいて、各イベントノードグループごとに
機械可読な形式のイベント相関表を作成して、コンピュ
ータの記憶手段に記憶するステップとを含む。
【0035】請求項2に記載の発明にかかる方法によれ
ば、イベントノードネットワークを構成するイベントノ
ードが、互いに独立なイベントノードネットワークを構
成するグループに分類され、各グループごとにイベント
相関表が作成される。そのため、本来無関係なイベント
ノードである症状と原因との間にあたかも何らかの関連
があるかのように取り扱われることがない。従来のよう
に独立したイベント相関表ではない相関表を用いた場合
のように、障害から原因が推論されるにあたって、障害
と原因との間で不適切な相関付けが行われることを防止
できる。その結果、障害と原因との間の相関付けをより
信頼性高く行なうことができるイベント相関表を作成す
ることができる。
【0036】請求項3に記載の発明にかかる方法は、請
求項1または2に記載の方法であって、所定の再構成条
件が成立したことに応答して、前記イベントノードネッ
トワークを再構成するステップと、再構成されたイベン
トノードネットワークに基づいて相関表作成ステップを
再実行するステップとをさらに含む。
【0037】ネットワークの構成が変化し、かつイベン
ト相関表にその変化を反映させたいという要求、または
イベント相関表を、分割したり統合したりする、という
要求を受けるなど、所定の再構成条件が成立したとき
に、イベントノードネットワークを再構成すると、再構
成されたイベントノードネットワークにはネットワーク
の構成の変化が反映される。そこからさらにイベント相
関表を作成するので、イベント相関表にもネットワーク
の構成の変化が反映される。このための処理は、要求が
発生するたびに行なわれ、しかもイベントノードネット
ワークを使用しないときよりも容易に行なうことができ
る。
【0038】
【発明の実施の形態】[全体構成]従来の技術で述べた
問題点が生ずるのは、本来無関係であるはずの問題と症
状とを、必ず何らかの関連があるかのように取り扱って
いることが原因である。したがって本発明では、互いに
無関係な問題と症状とを切り離すための手法を用いる。
【0039】図1に本願発明に係る方法により作成した
イベント相関表を用いるネットワーク管理システム(NM
S)20 をブロック図形式で示す。図1を参照して、ネッ
トワーク管理システム20は、管理対象ネットワーク22に
接続され、SNMP(Simple Network Management Protoco
l)等のネットワーク管理プロトコルを用いて管理対象
装置のMIB (Management Information Base )等のデー
タを取得したり、ポーリングしたりするためのネットワ
ークインターフェイス部24と、ネットワークインターフ
ェイス部24からネットワークの構成情報に関するデータ
を受け、後述するように改善された管理対象オブジェク
トモデル("MO" と省略することがある。)と、これに関
連したイベント伝播モデルとを保持するとともに、これ
らモデルとネットワークの構成情報とに基づき管理対象
オブジェクト構成情報を構築するための構成管理部30
と、構成管理部30により構築された管理対象オブジェク
ト構成情報を保持するための管理対象オブジェクトリポ
ジトリ32と、構成情報データおよび障害情報データをイ
ベントとして保持するためのイベントリポジトリ28と、
ネットワークインターフェイス部24から構成情報データ
および障害情報データをイベントとして受取り、イベン
トリポジトリ28に保持させるためのイベントデータベー
ス部26と、構成管理部30からイベント相関表を受取って
保持し、イベントデータベース部26から障害の症状イベ
ントの集合を受け、イベント相関表の症状イベントパタ
ーンと、実際に観測される症状イベントパターンとを比
較し距離計算をして、障害の根本原因の問題を推論する
ための障害管理部34と、障害管理部34から障害の根本原
因の問題の推論結果を示す情報を受け、ユーザに提示す
るためのユーザインターフェイス部36とを含む。
【0040】本実施の形態では、イベント相関表の作成
方法に改善を行なっているが、それらについては図4以
降を参照して後述することとする。
【0041】図1に示されるネットワーク管理システム
は、実際にはパーソナルコンピュータまたはワークステ
ーションなど、コンピュータ上で実行されるソフトウェ
アにより実現される。図2に、ネットワーク管理システ
ムを実現するコンピュータの外観を示す。図2を参照し
てこのコンピュータは、CD-ROM(Compact Disc Read-On
ly Memory )ドライブ50およびFD(Flexible Disk )ド
ライブ52を備えたコンピュータ本体40と、ディスプレイ
42と、プリンタ44と、キーボード46と、マウス48とを含
む。
【0042】図3に、このコンピュータの構成をブロッ
ク図形式で示す。図3に示されるようにこのシステム20
を構成するコンピュータの本体40は、CD-ROMドライブ50
およびFDドライブ52に加えて、それぞれバス66に接続さ
れたCPU (Central Processing Unit )56と、ROM (Re
ad Only Memory) 58と、RAM (Random Access Memory)
60と、ハードディスク54とを含んでいる。CD-ROMドライ
ブ50にはCD-ROM62が装着される。FDドライブ52にはFD64
が装着される。
【0043】既に述べたようにこのネットワーク管理シ
ステムは、コンピュータハードウェアと、CPU 56により
実行されるソフトウェアとにより実現される。一般的に
こうしたソフトウェアは、CD-ROM62、FD64などの記憶媒
体に格納されて流通し、CD-ROMドライブ50またはFDドラ
イブ52などにより記憶媒体から読取られてハードディス
ク54に一旦格納される。さらにハードディスク54からRA
M 60に読出されてCPU56により実行される。図2および
図3に示したコンピュータのハードウェア自体は一般的
なものである。したがって、本発明の最も本質的な部分
はCD-ROM62、FD64、ハードディスク54などの記憶媒体に
記憶されたソフトウェアである。
【0044】なお図2および図3に示したコンピュータ
自体の動作は周知であるので、ここではその詳細な説明
は繰返さない。
【0045】以下、図1〜図3に示す本願発明の実施の
形態に係る方法により作成したイベント相関表を用いる
ネットワーク管理システム20の動作について説明する。
ネットワークインターフェイス部24は、SNMP等のネット
ワーク管理プロトコルを用いて、管理対象装置のMIB 等
のデータを取得したりポーリングしたりする。またネッ
トワークインターフェイス部24は、管理対象装置からの
トラップイベントを受信する。ネットワークインターフ
ェイス部24はさらに、管理対象装置から取得したデータ
のうち構成情報に関するデータは構成管理部30に、障害
情報に関するデータはイベントデータベース部26に、そ
れぞれ適当な形式に変換して送る。
【0046】構成管理部30は、改善後の管理対象オブジ
ェクトモデルと、これに関連したイベント伝播モデルと
を保持する。構成管理部30は、この管理対象オブジェク
トモデルとイベント伝播モデルとを保持する。なおこれ
らモデルは、図3に示すハードディスク54内のファイル
(図示せず)から読込むこともできるし、ユーザインタ
ーフェイス部36を介してユーザが入力することも可能で
ある。
【0047】構成管理部30はさらに、ネットワークイン
ターフェイス部24から図27に示されるネットワーク例
のような構成情報データを受取り、管理対象オブジェク
トモデルに基づいて管理対象オブジェクト構成情報を構
築する。この管理対象オブジェクト構成情報は管理対象
オブジェクトリポジトリ32に保持される。
【0048】イベントデータベース部26は、構成情報デ
ータおよび所定のタイムウィンドウの間に発生する症状
イベントに関する通知をネットワークインターフェイス
部24から受けて、それらを症状イベントリポジトリ28に
保持する。イベントデータベース部26はこれらイベント
の中で、障害情報に関するデータ、特に障害の症状イベ
ントを障害管理部34に通知する。構成管理部30は、所定
のタイムウィンドウの終了するたびに、そのときの管理
対象オブジェクトモデルおよびイベント伝播モデル、な
らびに管理対象オブジェクトリポジトリ32に保持された
管理対象オブジェクト構成情報を用いて、イベント相関
表を作成する。構成管理部30は、イベント相関表を障害
管理部34に通知する。
【0049】障害管理部34は、構成管理部30から通知さ
れたイベント相関表を受取り保持する。障害管理部34は
また、イベントデータベース部26から所定のタイムウィ
ンドウの間に発生した障害の症状イベントの集合を受取
る。この症状イベントの集合とは、実際に観測される症
状イベントパターンである。障害管理部34は、所定のタ
イムウィンドウの終了するたびに、構成管理部30から受
取ったイベント相関表の症状イベントパターンと、イベ
ントデータベース部26から受取った実際に観測された症
状イベントパターンとを比較して、障害の根本原因の問
題を特定する。特定された問題はユーザインターフェイ
ス部36に通知される。ユーザインターフェイス部36は、
図2および図3に示されるディスプレイ42などによりこ
の障害の根本原因の問題を特定する情報をユーザに提示
する。 [処理の概略]図4以下に、上記した処理を実現するた
めのプログラム群の実行する処理のフローチャートを示
す。図4を参照して、まず、EventNodeNetworkクラスと
呼ばれる、後述するEventNode から構成されるネットワ
ークを管理するクラスのインスタンスを作成する(70)。
各インスタンスはコンピュータのメモリ内に作成され
る。EventNode とは、Problem およびSymptom を表すク
ラスのことをいう。各EventNode は、伝播する全てのEv
entNode とその伝播率の情報とを管理する。EventNodeN
etworkの作成処理の詳細については図5を参照して後述
する。
【0050】続いてインスタンス間のイベントの伝播率
を計算する(72)。伝播率とは、EventNode 間でイベント
が伝播する場合の確率のことをいう。このように伝播率
を導入することにより、具体的なネットワーク内で特有
の問題に対処することができる。たとえばある機器のみ
が、同種の他の機器と比較して問題を発生しやすかった
り、ある機器と他の機器とを接続するケーブルの配置に
よって特定の問題が発生しやすかったりする、という問
題が生ずることがある。この場合、ネットワークを構成
するオブジェクトのクラスのある組合せについて問題の
伝播率が常に一定であるとして考えると実際のネットワ
ークの問題のモデル化として不十分である。ある特定の
ネットワークに特有の問題に対して障害と問題とを適切
に相関付けるために、伝播率をインスタンスレベルで設
定すると有効である。ステップ72ではこの伝播率を計算
する。
【0051】ネットワークでは、トポロジーが変化する
ことが頻繁にある。そのため、イベント相関表を作成す
る際には、最新のトポロジー(ネットワークの構成情報
データ)に基づいて伝播率を計算し直す必要がある。伝
播率の計算方法については図10以下を参照して後述す
る。
【0052】続いて、次のTimeWindowインスタンスを作
成して、次回のイベント相関処理の準備をするととも
に、あるTimeWindowが保持していたProblem がクリアさ
れるごとに、そのTimeWindowをTimeWindowリストから削
除する(74)。なおTimeWindowとは、障害イベントを受け
付ける時間枠を表すクラスをいい、相関付けの結果であ
るProblem とそのProblem の推論に影響するSymptom と
を管理するためのものである。このTimeWindowにより定
められる時間枠(タイムウィンドウ)の終了ごとに、後
述するように相関表の作成と、距離計算(比較)と、次
のTimeWindowの作成と、クライエントへのProblem の通
知とが行なわれる。
【0053】次に、クライエントからのsubscribe/unsu
bscribe 要求の処理を行なう(76)。subscribe とは、あ
るProblem またはSymptom についての通知を要求する、
クライエントからネットワーク管理装置に対しての要求
通知である。subscribe 要求があれば、ネットワーク管
理装置は、その要求を発行したクライエントを、該当す
るEventNode のsubscribe リストに追加する。そして、
当該Problem またはSymptom について、ネットワーク上
で発生するイベントをネットワーク管理装置に対して通
知するようにネットワーク上のEcReporterと呼ばれるク
ラスのインスタンスにsubscribe 要求する。Problem に
ついてのsubscribe 要求のときは、そのProblem から伝
播する全Symptom についての通知もsubscribe 要求す
る。
【0054】unsubscribe 要求のときは、その要求を発
行したクライエントを、該当するEventNode のsubscrib
e リストから削除する。subscribe リストが空になった
ら、Problem に関するものである場合には、そのProble
m のみに関連するSymptom について、EcReporterに対し
てunsubscribe 要求を行なう。Symptom の場合には、su
bscribe されているProblem に関連するSymptom を除き
EcReporterに対してunsubscribe 要求を行なう。
【0055】次に、TimeWindowごとの障害(Symptom) 発
生回数を計算する(78)。この場合、あるTimeWindowごと
の障害の発生回数は、発生状態リストとして保持する。
【0056】次に、EventNodeNetworkと伝播率とに基づ
いてイベント相関表を作成する(80)。相関表の作成処理
については後述する。
【0057】さらに、このようにして作成されたイベン
ト相関表と、ステップ78で取得された障害情報とから距
離計算をして、障害(Symptom) と問題の原因(Problem)
との相関付けを行なう(82)。こうして特定されたProble
m を、subscribe 要求を行なったクライエントに対して
通知する(84)。
【0058】以下、図4に示す各処理のうち主要な処理
について図を参照して説明する。 [EventNodeNetworkの作成]EventNodeNetworkの作成処
理では、まずこのネットワーク管理装置(サーバ)の起
動時に、取得すべきMO Object の全クラス名を管理対象
オブジェクトリポジトリ32から獲得する(90)。
【0059】ステップ90で獲得したクラス名に基づい
て、管理対象オブジェクトリポジトリ32からMO Object
の情報を獲得する(92)。
【0060】ステップ92で獲得したMO Object の情報か
ら、EventNode のインスタンスを作成し、イベントのタ
イプ(Problem, Symptom)ごとにEventNodeNetworkの管理
リストに登録する(94)。EventNode は、イベントノード
名、イベントタイプ、exportの識別子、subscribe リス
ト、伝播先リスト、伝播元リスト、伝播率リスト、伝播
する全Problem/Symptom に対する伝播率の計算値リス
ト、伝播率の識別子、相関表の分割状態の識別子を持
つ。
【0061】さらに、ステップ94で作成した全EventNod
e に対して、伝播の関連付けを行なう(96)。各EventNod
e の伝播先のEventNode をEventNodeNetworkの管理リス
トから検索し、伝播先リストに追加する。このとき、伝
播率リストにその子EventNode への伝播率も登録する。
伝播先リストと伝播率リストとは、互いに同じ順番で管
理される。また同時に、子EventNode の伝播元リストに
親EventNode を登録する。
【0062】ネットワークのトポロジー情報に変更が発
生した場合、その情報をキューに蓄える。そして、クラ
イエントから更新要求を受けたら、変更が加えられたト
ポロジー情報にしたがってEventNodeNetworkを再構成す
る。
【0063】ステップ90およびステップ102 でのEventN
odeNetworkの作成方法について図6〜図9を参照して説
明する。たとえば図6を参照して、Problem P1-P3 およ
びSymptom S1-S3 のEventNodeNetworkが作成済みであっ
たとする。図6において、各円はこれらEventNode を表
し、各円の右下には上段に当該EventNode の伝播元リス
トを、下段には伝播先リストを、それぞれ示す。
【0064】ここにMO Object(Problem P4) の追加通知
を受けた場合、新たにEventNode インスタンスP4が作成
される。結果のEventNodeNetworkを図7に示す。図6と
図7とを比較すると、EventNode P4が追加されたことに
より、EventNode P3の伝播元リストが「P1」から「P
1,P4」に変更されている。
【0065】図7に示されるEventNodeNetworkにおい
て、P1からP3への伝播が削除されたものとする。すると
その結果のEventNodeNetworkは図8に示されるようにな
る。図7と図8とを比較すると、P1の伝播先リストと、
P3の伝播元リストとが変更されていることが分かる。
【0066】また、図7に示されるEventNodeNetworkに
おいて、EventNode P2が削除された場合を想定する。こ
の結果のEventNodeNetworkは図9に示されたようにな
る。図7と図9とを比較すると、EventNode P2が削除さ
れたこと以外に、P1の伝播先リストと、S1およびS2の伝
播元リストとが変更されている。逆にいうと、図6〜図
9に示される各EventNode のリストを維持し、さらに図
6〜図9の各EventNode の右下近傍に記載されているよ
うな伝播元リストおよび伝播先リストを各EventNode に
おいて維持することでEventNodeNetworkが表現される。
したがってEventNodeNetworkの変更は、EventNode リス
トの要素の変更と、各EventNode での伝播元リストおよ
び伝播先リストの変更として表現される。
【0067】図4に示す伝播率の計算について図10以
下を参照して説明する。この処理では同時にイベント相
関表の分割も行なわれる。伝播率は、イベント相関表作
成前に予め計算し、各EventNode に保持しておく。この
計算は、EventNodeNetworkの作成時とネットワークのト
ポロジー変更による更新要求を受けた時に行なう。
【0068】まずEventNodeNetworkのProblem リストの
全てのProblem に対して、伝播率の計算を要求する(19
0) 。この要求を受けて、各Problem は伝播率を再帰的
に計算する。この場合の「再帰的」とは、自己の伝播率
を計算するために、EventNodeNetworkにおいて自己の隣
接するProblem の伝播率を計算して利用し、さらに当該
隣接するProblem の伝播率を計算するためにさらにその
当該隣接するProblem に隣接するProblem の伝播率を計
算して利用し、等々と次々に同じ計算を異なるProblem
に対しておこなっていく、ということである。特に本実
施の形態では、このときの計算を効率良くするために、
EventNodeNetworkの終端のSymptom に近い方から各Prob
lem の伝播率を計算していく点に特徴がある。計算方法
については後述する。各Problem は、こうして計算され
た伝播率を自身に保持する。この値は、EventNodeNetwo
rkにおいてこのProblem に隣接する(Symptomから見て遠
い方の)Problem以降のProblem の伝播率計算に使用され
る。したがって各Problem の伝播率は、それ以降のProb
lem の伝播率の計算に対する中間結果であるということ
ができる。
【0069】この後、イベント相関表分割のための処理
が行なわれる(196) 。 [伝播率の計算方法]図11〜図12を参照して、伝播
率の計算方法について説明する。以下の説明では、二つ
のProblem PrとPsとを想定し、PrからPsへの伝播につい
て考える。PrとPsとに注目したイベントノードネットワ
ーク例を図11に示す。また以下の説明では、Problem
はSymptom をも含むものと考える。実際にはこのイベン
トノードネットワークは、後述するようなリスト形式の
データとしてコンピュータ内のメモリまたは外部記憶装
置に記憶される。なお本実施の形態では、イベントノー
ドネットワークとは、ネットワークを構成する管理対象
オブジェクトに対応するイベントノードと、イベントノ
ード間の伝播関係とを所定のデータ形式で記述したデー
タをいうものとする。この形式はリスト形式には限定さ
れない。イベントノードネットワークは、図11に示さ
れるようなネットワーク図式で表すことができる。
【0070】図11において、fd(Pa, Pb)はProblem Pa
からProblem Pbへのトータルでの伝播率を指す。両者に
関連が存在しないならfd(Pa, Pb)=0である。d(Pa, Pb)
は、Problem PaからProblem Pbへの伝播率として予め定
義された値である。この値は、前述したようにあるネッ
トワーク特有の特徴に対処するために、ネットワークご
とに、かつ二つのProblem の組合せごとに独自に定めら
れるものである。図11において直接的な関連を示す矢
印にはd(Pa, Pb) の値が、間接的な関連を示す矢印には
fd(Pa, Pb)の値が、それぞれ記載されている。ここで
「間接的な関連」とは、二つのProblem の間に別のProb
lem を含むことがあることを示す。
【0071】本実施の形態では、二つのProblem Pr, Ps
間の伝播率の計算は以下の式によるものとする。
【0072】
【数1】 fd(Pr, Ps)=max(d(Pr, Pk)*fd(Pk, Ps)) ...(1) ただしk=1 からn であり、P1〜PnはPrから直接伝播する
Problem であるものとする。ここで、Prから直接Psに伝
播する場合の伝播率の計算を正しく行なうために、fd(P
a, Pa)=1とする。またmax(fk) は、k=1 からn まで変化
させたときのfkすなわちf1からfnのうちの最大値を示
す。
【0073】式(1)は、あるProblem から別のProble
m への伝播経路が複数ある場合、各経路について計算し
た伝播率のうち最大のものをそのProblem 間の伝播率と
することを示す最大伝播率を使用することで、EventNod
eNetworkに閉路(ループも含む)が存在する場合も、伝
播率の計算が容易に行なえる。ループ構造の検出につい
ては後述する。
【0074】イベント相関表を作成するために、上述の
計算を全てのProblem に対して行なうことになる。しか
し、上述した再帰的計算を全てのProblem に対して繰り
返し行なうと、同じ計算を何度も繰り返すことになり、
無駄である。そこで、本実施の形態では一度計算したPr
oblem の伝播率に関する情報は中間結果として各Proble
m に保持しておき、後に同じ計算をする必要が生じたと
きにはこの中間結果を使用することにより計算量を削減
する。
【0075】各Problem は複数の伝播先を持つ可能性が
ある。Prから伝播するProblem およびSymptom が直接、
間接を含めてm 個存在すると仮定する。すると、Prから
各Problem やSymptom に対する伝播率は、Problem と、
伝播率の組のリストで表すことができる。P1〜PmがSymp
tom も含むものとすると、P1からPmについてのこのリス
トは以下のようになる。
【0076】
【数2】 P1:fd(Pr, P1) P2:fd(Pr, P2) ... Pm:fd(Pr, Pm) Prから各Problem への伝播率を表すこのリストをppl(P
r) と表現する。ppl は「Problem and Probability Lis
t」の略である。このリストを使って、PrからPxへの伝
播率をppl(Pr)(Px) と表すものとする。つまり、fd(Pr,
Px)は以下のように書くことができる。
【0077】
【数3】fd(Pr, Px)=ppl(Pr)(Px) ...(2) 既に述べたように計算の便宜上、以下の等式が成立する
ものとする。
【0078】
【数4】fd(Pr, Pr)=ppl(Pr)(Px)=1 この式(2)を式(1)に代入すると以下の式(3)が
得られる。
【0079】
【数5】 fd(Pr, Ps)=max(d(Pr, Pk)*ppl(Pk)(Ps)) ...(3) ただしk=1 〜n であり、P1からPnはPrから直接伝播する
Problem であるものとする。
【0080】このppl を各Problem の中間計算結果とし
て各Problem において保持することで、同じProblem に
ついて同じ計算が複数回行なわれることを避けることが
できる。計算手順を図12に示すイベントノードネット
ワークに対して示す。一般的な計算手順も、この例から
明らかであろう。
【0081】図12に示す例において、d(P0, P1)=a, d
(P0, P2)=b, d(P1, P3)=c, d(P2, P3)=d, d(P3, S1)=e
とする。
【0082】(1) P0は、P1, P2に対してppl(P1), p
pl(P2)を取得し、Problem とSymptom リストを取得す
る。図12に示す例では、Problem は3つ(P1, P2, P
3)、Symptom は1つ(S1)取得される。
【0083】(2) P0は各Problem(P1, P2, P3) およ
びSymptom(S1) に対して伝播率を計算し、ppl(P0) に登
録する。この際の計算は式(3)を用いる。この式で、
P3,S1の伝播率が、ppl(P1) とppl(P2) の計算において
利用されることに注意する必要がある。
【0084】(3) P0から伝播するProblem(P1, P2)
はそれぞれ、上述の(1)(2)の処理を、「P0」を
「P1」または「P2」と置き換えて行なう。P1, P2につい
てP3,S1の伝播率を用いる必要があるので、結局上述し
た計算が再帰的にS1まで行なわれる。
【0085】(4) 最終的に、S1について伝播率が確
定すると、その値を用いてP3, P2,P1, P0からS1への伝
播率が確定する。
【0086】図12に示す例における伝播率の計算結果
を示すと以下の通りである。ppl(P0) について: S1:max(d(P0, P1)*ppl(P1)(S1), d(P0, P2)7PP0(P2)(S1)) =max(a*ppl(P1)(S1), c*ppl(P2)(S1)) =a*b*e P3:max(d(P0, P1)*ppl(P1)(P3), d(P0,P2)*ppl(P2)(P3)) =max(a*ppl(P1)(P3), c*ppl(P2)(P3)) =a*b P1:d(P0,P1)*ppl(P1)(P1)=a P2:d(P0, P2)*ppl(P2)(P2)=c P0:1 ppl(P1) について: S1:d(P1, P3)*ppl(P3)(S1)=b*ppl(P3)(S1) P3:d(P1, P3)*ppl(P3)(P3)=b P1:1 ppl(P2) について: s1:d(P2, P3)*ppl(P3)(S1)=d*ppl(P3)(S1) P3:d(P2, P3)*ppl(P3)(P3)=d P2:1 ppl(P3) について: s1:d(P3, S1)*ppl(S1)(S1)=e P3:1 ppl(S1) について: s1:1 結局、こうした伝播率の計算の手順をまとめると図10
のステップ190, 192,194 に示した通りとなる。 [ループ構造の検出]EventNodeNetworkがループ構造を
含む場合、通常の伝播方法でEventNode を伝播させると
処理が終了しない。そこで、以下の手順でループ構造を
検出し、ループ構造があっても処理を終了させるように
する。
【0087】(1) 各EventNode に伝播率の計算状態
を表す識別子を設定する。識別子としては「未計算」
「計算中」「計算完了」の3種類が設定される。デフォ
ルト値は「未計算」とする。
【0088】(2) 伝播の開始点のEventNode の識別
子を「計算中」に変更し、子(伝播先)EventNode に処
理を移行する。伝播した子EventNode を「計算中」に変
更する。
【0089】(3) 伝播先の子EventNode が、伝播先
を持たないか、そのさらに伝播先のEventNode が「計算
中」の識別子を持つ場合、処理中の伝播先の子EventNod
e の識別子を「計算完了」に変更し、処理中の伝播先の
子EventNode から、伝播元のEventNode に処理を移行す
る。
【0090】(4) 伝播の開始点のEventNode の識別
子が「計算完了」になるまで、手順(2)(3)を繰返
す。
【0091】この手順を実行することにより、EventNod
eNetworkがループ構造を含んでいても伝播計算が確実に
終了する。 [イベント相関表の分割]図10のステップ196 に示し
たイベント相関表の分割処理は、EventNodeNetworkの作
成時とネットワークのトポロジーの変更によるEventNod
eNetworkの再構成のときに行なわれる。その処理は以下
のように行なう。なお以下の説明からも明確なように、
この実施の形態ではイベントノードネットワークをリス
ト形式で保持し、かつこのイベントノードネットワーク
間の伝播関係を保持しておくことによってイベント相関
表の分割が可能になる。また、相関表を作成する上での
中間形式としてイベントノードネットワークを保持して
おくので、ネットワークの構成に変化があったときには
このイベントノードネットワークに対してその変化の差
分を反映させることが容易にできる。その結果、最終的
に作成される相関表にも、ネットワークの構成の変化を
容易に反映させることができる。
【0092】手順の概略は以下のとおりである。 (1) EventNodeNetworkにCodebookGroup インスタン
スを作成し、CodebookGroup リストに追加する。全Even
tNode の分割状態の識別子は「未分割」「分割中」およ
び「分割完了」の3種類であるが、「未分割」で初期化
しておく。なおCodebookGroup クラスはイベント相関表
を分割するためのグループ名を表すクラスであり、Even
tNodeNetworkで管理されるexportされた全Problem とSy
mptom とを管理する。またイベント相関表を表すCodebo
okクラスも定められている。Codebookクラスは、Proble
m とSymptom との関係を伝播率で表したマトリクス、す
なわちイベント相関表を表す。イベント相関表の作成時
には、Codebookクラスの複数のインスタンスが作成され
る。
【0093】(2) EventNodeNetworkのProblem リス
トのProblem を順次CodebookGroupのインスタンスのPro
blem リストに登録する。ここで、exportされていないP
roblem は登録の対象外とする。
【0094】(3) 手順(2)で登録元のProblem か
ら伝播するProblem/Symptom を伝播元と同じCodebookGr
oup に登録する。exportされていないProblem は登録の
対象外とする。伝播先がSymptom の場合には、Codebook
Group のSymptom リストに登録する。CodebookGroup に
登録したProblem/Symptom には「分割中」の識別子を設
定する。
【0095】(4) 手順(3)で、伝播先がなくなる
か、伝播先があったとして、そのEventNode が「分割
中」の場合には、処理中のEventNode を「分割完了」に
変更し、処理を伝播元のEventNode に移行する。export
されていないProblem の場合には「未分割」に変更す
る。仮に伝播先のEventNode が「分割完了」であれば、
手順(5)を行なう。こうして、登録元のProblem が
「分割完了」になるまで手順(3)を繰返す。
【0096】(5) 伝播先のProblem/Symptom が「分
割完了」の場合、イベント相関表の「マージ」を行な
う。イベント相関表のマージについては後述する。
【0097】(6) 手順(4)が完了したら、新たに
CodebookGroup インスタンスを作成し、手順(2)以下
を繰り返す。伝播元のProblem に「分割完了」の識別子
が設定されている場合は無視する。
【0098】図13に、この手順を実現するためのソフ
トウェア処理のフローチャート例を示す。図13を参照
して、まず変数i,j を0に初期化する(110) 。続いてPr
oblem Piがあるかどうかを判定し、なければ処理を終了
する(112) 。Problem Piがある場合、CodebookGroup ク
ラスのインスタンスとしてCodebookGroup _j を作成
し、CodebookGroup リストに追加する(114) 。
【0099】続いて、Problem Piの分割状態識別子が
「分割完了」かどうか判定し、「分割完了」であればこ
のProblem を無視してi をインクリメントして処理をス
テップ112 に戻す。以下、新しいProblem Piに対してス
テップ112 以下の処理を繰り返す。ステップ116 の判定
の結果、Problem Piの分割状態識別子が「分割完了」で
ないときには制御はステップ118 に進む。
【0100】ステップ118 で、CodebookGroup _j のPr
oblem リストにProblem Piを登録する。すなわち、Prob
lem Piが伝播先Problem であるとすれば、Piはその伝播
元のProblem が登録されたのと同じCodebookGroup に登
録される。伝播先がSymptomの場合にはSymptom リスト
に登録される。exportされていないProblem は登録の対
象外である。Codebookgroup _j に登録したProblem/Sy
mptom の分割状態識別子は「分割中」に設定する(120)
【0101】次に、Problem/Symptom Piから伝播先が残
っているかどうかを判定する(122)。残っていない場合
にはPiを「分割完了」にしてj をインクリメントし(12
6) さらにi をインクリメントして(128) ステップ112
に制御を戻す。Problem/Symptom Piから伝播先が残って
いる場合には、制御はステップ124 に進む。ステップ12
4 ではProblem/Symptom 登録処理が行なわれる。
【0102】図14を参照して、まずステップ140 で、
登録元が「分割完了」となっているかどうかを判定す
る。「分割完了」となっていたらこの処理を終了し、図
13のステップ122 に戻る。「分割完了」でないとき
は、次の伝播先を選択し(142) 、その伝播先が「分割完
了」かどうか判定する(144) 。「分割完了」であればマ
ージ処理を行ない(154) 制御をステップ148 に進める。
ステップ144 で伝播先が「分割完了」でないと判例され
たときは、ステップ146 でこの伝播先EventNode をCode
bookGroup _j のproblem/Symptom リストに登録し、制
御をステップ148 に進める。
【0103】ステップ148 では、さらに伝播先があるか
どうかを判定し、なければこのEventNode を「分割完
了」として(156) さらに伝播先ノードに処理を戻して(1
58) ステップ140 以下を実行する。ステップ148 でさら
に伝播先があると判定された場合には、その伝播先が
「分割中」かどうかを判定する(150) 。「分割中」であ
る場合には当該ノードを「分割完了」とし(156) 以下ス
テップ158 から140 に制御を進める。
【0104】ステップ150 で伝播先が「分割中」でない
と判定された場合には、当該ノードを「分割中」に変更
して制御をステップ142 に戻す。
【0105】図15を参照して、マージ処理は以下のよ
うに行なわれる。まず、伝播先のCodebookGroup インス
タンスのProblem/Symptom リストを現CodebookGroup イ
ンスタンスのProblem/Symptom リストにコピーする(17
0) 。その後、伝播先のCodebookGroup インスタンスのP
roblem/Symptom リストを削除する。なおこのとき、Cod
ebookGroup インスタンスが削除されることになるの
で、必要であればCodebookGroup インスタンスの番号を
減分する。
【0106】図16以下を参照して、上述の計算手順
を、図16に示されるEventNodeNetworkについて具体的
に説明する。なお、図16から図23において、白円は
「未分割」のEventNode を、斜線が施された円は「分割
中」のEventNode を、斜線が施されかつ周囲が太線で描
かれた円は「分割完了」のEventNode を、それぞれ示
す。また、図16から図23において、イベントノード
ネットワークの右側にはCodebookGroup と、各Codebook
Group のProblem リスト(上段)、およびSymptomリス
ト(下段)を示す。
【0107】(1) まず、CodebookGroup インスタン
スであるCodebookGroup 0 を作成し、EventNodeNetwork
のCodebookGroup リストに登録する。
【0108】(2) Problem P0をCodebookGroup 0 の
Problem リストに登録し、P0を「分割中」に変更する
(図17)。
【0109】(3) Problem P0から伝播する全Proble
m/Symptom(EventNode)を、直接、間接を問わずCodebook
Group 0 のProblem リスト/Symptomリストに登録し、そ
れぞれ「分割中」に変更する(図18)。伝播先を持た
ないEventNode と、伝播先があったとしても「分割中」
であるようなEventNode は「分割完了」に変更する。
【0110】(4) P0から伝播するEventNode につい
て手順(3)が終了したら、新たにCodebookGroup イン
スタンスであるCodebookGroup 1 を作成し、Problem P1
について手順(2)以下の処理を開始する(図19)。
しかしこの場合P1は「分割完了」となっているので無視
する。
【0111】(5) 続いてProblem P2をCodebookGrou
p 1 に登録する。P2を「分割中」に変更する(図2
0)。
【0112】(6) Problem P2から伝播する全Proble
m/Symptom を、CodebookGroup 1 のProblem リストに登
録する。ただしここでProblem P0については既に「分割
完了」が設定されているので、「マージ」処理が行なわ
れる。具体的には、P0が属するCodebookGroup 0 のProb
lem/Symptom リストを全てCodebookGroup 1 のProblem/
Symptom リストにコピーする。コピーした後、Codebook
Group 0 を CodebookGroupリストから削除する。このと
きの状態を図21に示す。この後、CodebookGroup 0 を
削除したので、CodebookGroup 1 のインデックス「1」
を減分して「0」とし、新たにCodebookGroup 0 に変更
する(図22右側の上段)。
【0113】(7) 新たにCodebookGroup のインスタ
ンスであるCodebookGroup 1 を作成しProblem P3をCode
bookGroup 1 に登録する(図22)。
【0114】(8) Problem P3から伝播する全Proble
m/Symptom をCodebookGroup 1 のProblem リスト/Sympt
omリストに登録する(図23)。この場合、P3から伝播
するのは二つのSymptom S1, S2でありこれらよりさきに
は伝播先は存在しない。かつこれらはいずれも「未分
割」である。したがって結果としてCodebookgroup 1 の
Symptom リストにS1、S2が登録される。
【0115】以上の(8)までの処理によりEventNodeN
etworkの全EventNode に「分割完了」が設定されたこと
になるので、Codebookの分割処理を終了する。図23に
示されるように、CodebookGroup 0 、1 として二つのCo
debookGroup インスタンスが得られ、各イベント相関表
に属するProblem/Symptom のリストが得られた。これら
リストは、互いに独立なイベントノードネットワークに
属するProblem/Symptom のリストとなっている。したが
ってこのCodebookGroup 0, 1から、それぞれ別個のイベ
ント相関表を作成することができる。
【0116】続いて、図4に示した「相関表作成」処理
について図24〜図26を参照して説明する。なお、イ
ベント相関表は、タイムウィンドウのクローズごとに作
成される。こうして作成されたイベント相関表は、直前
にクローズされたタイムウィンドウでのProblem/Sympto
m の相関付けに用いられる。処理の対象となるのは図2
5に示すイベントノードネットワークであるものとし、
斜線を付したEventNode P1 、P3、P4、P5がsubscribe
されたProblem であるものとする。
【0117】図24を参照して、まずCodebook作成を要
するかどうかを判定する(210) 。例えば前タイムウィン
ドウでトポロジー情報の更新、subscribe/unsubscribe
要求、Codebookの分割実行/分割抑制の要求が発生しな
かった場合、Codebookを再構成する必要はなく、前タイ
ムウィンドウで作成したイベント相関表を再利用すれば
よい。したがってイベント相関表作成が不要であると判
定された場合、なにもせず処理を終了する。
【0118】イベント相関表の作成を要する場合、まず
イベント相関表の項目リストを作成する(212) 。この作
成には、subscribe された全Problem と、そのProblem
から伝播する全Symptom とを用いる。これらProblem と
Symptom とが、イベント相関表を構成するイベント相関
マトリクスの行項目と列項目とを決定する。
【0119】次に、イベント相関表の分割実行が設定さ
れているか、分割実行が抑制されているかについての判
定が行なわれる(214) 。この設定は、予めシステム操作
者により設定されるものとする。また変更が必要と判断
された場合にはシステム操作者により変更が指示され
る。
【0120】分割が抑制されている場合には、ステップ
216 に制御が進み、ステップ212 で作成されたProblem
とSymptom との全ての組合せに対する伝播率をEventNod
e の伝播率の計算値リスト(図4のステップ72で計算さ
れたもの)から獲得し、マトリクスに配列してイベント
相関表を作成する。この場合、たとえば図25に示すよ
うなイベントノードネットワークについては、図29に
示したようなイベント相関表228 を作成する。
【0121】分割実行が設定されている場合には、ステ
ップ218 に制御が進み、図13〜図23を用いて説明し
た相関表分割処理で作成されたCodebookGroup のインス
タンスごとに、そのCodebookGroup のProblem リストに
登録されたProblem とSymptom リストに登録されたSymp
tom とによってイベント相関表を作成する。この場合に
得られるイベント相関表は、図26に示すようにCodebo
okGroup ごとに別々のイベント相関表230 、232 にな
る。なお図26においては、便宜的にイベントノード間
の伝播率を全て「1」として示してある。実際には、こ
れらの値はProblem とSymptom の組合せに応じて計算さ
れた伝播率となる。このように伝播率をイベント相関表
に採用することにより、オブジェクトモデルによるモデ
ル化では対応できないような、あるネットワークに特有
の条件をも考慮して障害の原因の推論を行なうことがで
きる。
【0122】このようにして作成されたイベント相関表
は、ネットワーク管理装置を構成するコンピュータのメ
モリ内に記憶され、症状イベントパターンとの距離計算
に用いられ、障害の原因の推論を信頼性高く行なうこと
を可能にする。
【0123】こうしてEventNodeNetworkの形でネットワ
ークの構成情報を機械可読な形式で保持し、EventNodeN
etworkの各EventNode について伝播元リストおよび伝播
先リストを維持しておくことで、イベント相関表を分割
することが可能になった。したがって本発明によれば、
本来無関係であるProblem とSymptom とを文字通り切り
離して、Symptom からProblem を適切に推論できるよう
になる。また、EventNode 間の伝播率を計算するにあた
って、各EventNode での伝播率の計算について式(1)
〜(3)に示される方法を用い、さらに各EventNode で
の伝播率の計算結果を保持し、それらを他のEventNode
での伝播率の計算に使用した。こうすることにより伝播
率の計算が効率化され、ネットワークが大型化し、トポ
ロジーの変化が激しくなっても柔軟にProblem とSympto
m との相関をとることが可能になった。
【図面の簡単な説明】
【図1】本願発明の一実施の形態に係るネットワーク管
理システムのブロック図である。
【図2】本願発明に係るネットワーク管理システムを実
現するためのコンピュータの外観図である。
【図3】図2に示されるコンピュータのブロック図であ
る。
【図4】本発明の一実施の形態のイベント相関処理を実
現するためのソフトウェア処理のフローチャートであ
る。
【図5】イベントノードネットワーク作成処理のフロー
チャートである。
【図6】イベントノードネットワークへのノードの追加
の方法を模式的に示す図である。
【図7】イベントノードネットワークへのノードの追加
の結果を模式的に示す図である。
【図8】イベントノードネットワークからのノード間の
伝播関係の除去の方法を模式的に示す図である。
【図9】イベントノードネットワークからのノード間の
伝播関係の除去の結果を模式的に示す図である。
【図10】伝播率計算処理のフローチャートである。
【図11】伝播率計算の例を示すためのイベントノード
ネットワークの模式図である。
【図12】伝播率計算の例を示すためのイベントノード
ネットワークの模式図である。
【図13】相関表の分割処理の1実現例のフローチャー
トである。
【図14】Problem/Symptom 登録処理の1実現例のフロ
ーチャートである。
【図15】マージ処理の1実現例のフローチャートであ
る。
【図16】相関表の分割処理を説明するための、イベン
トノードネットワークとCodebookGroup インスタンスと
を模式的に示す図である。
【図17】相関表の分割処理を説明するための、イベン
トノードネットワークとCodebookGroup インスタンスと
を模式的に示す図である。
【図18】相関表の分割処理を説明するための、イベン
トノードネットワークとCodebookGroup インスタンスと
を模式的に示す図である。
【図19】相関表の分割処理を説明するための、イベン
トノードネットワークとCodebookGroup インスタンスと
を模式的に示す図である。
【図20】相関表の分割処理を説明するための、イベン
トノードネットワークとCodebookGroup インスタンスと
を模式的に示す図である。
【図21】相関表の分割処理を説明するための、イベン
トノードネットワークとCodebookGroup インスタンスと
を模式的に示す図である。
【図22】相関表の分割処理を説明するための、イベン
トノードネットワークとCodebookGroup インスタンスと
を模式的に示す図である。
【図23】相関表の分割処理を説明するための、イベン
トノードネットワークとCodebookGroup インスタンスと
を模式的に示す図である。
【図24】相関表作成処理のフローチャートである。
【図25】相関表作成処理を説明するためのイベントノ
ードネットワークの模式図である。
【図26】分割実行が設定されている場合に作成される
相関表群の例を模式的に示す図である。
【図27】簡単なネットワークを模式的に示す図であ
る。
【図28】図27に示されるネットワークの管理対象オ
ブジェクトモデルのクラス図である。
【図29】相関表の分割が行なわれない場合に作成され
るイベント相関表の例を模式的に示す図である。
【符号の説明】
20 ネットワーク管理システム 22 管理対象ネットワーク 24 ネットワークインタフェース部 26 イベントデータベース部 28 イベントリポジトリ 30 構成管理部 32 管理対象オブジェクトリポジトリ 34 障害管理部 36 ユーザインタフェース部 40 コンピュータ本体 42 ディスプレイ 44 プリンタ 46 キーボード 48 マウス 50 CD-ROMドライブ 52 FDドライブ 54 ハードディスク 56 CPU 58 ROM 60 RAM 62 CD-ROM 64 フレキシブルディスク Pi プロブレム Si シンプトム

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 ネットワーク上に発生するイベントを互
    いに相関させるためのイベント相関表をコンピュータを
    用いて作成するためのネットワークのイベント相関表作
    成方法であって、 ネットワーク上の管理対象オブジェクトの構成情報をコ
    ンピュータの記憶手段内に準備するステップと、 前記管理対象オブジェクトの構成情報と、予め定められ
    たオブジェクト間のイベント伝播ルールとに基づいてイ
    ベントノードネットワークを作成しコンピュータの記憶
    手段に記憶させるステップと、 前記イベントノードネットワークに基づいて機械可読な
    形式のイベント相関表を作成し、コンピュータの記憶手
    段に記憶させる相関表作成ステップとを含む、ネットワ
    ークのイベント相関表作成方法。
  2. 【請求項2】 前記相関表作成ステップは、 前記イベントノードネットワークに基づいて、互いに独
    立なイベントノードネットワークを構成するグループご
    とにイベントノードを分類するステップと、 所与のイベント相関表作成条件が成立したことに応答し
    て、前記分類されたイベントノードと、前記イベントノ
    ードネットワークとに基づいて、各イベントノードグル
    ープごとに機械可読な形式のイベント相関表を作成し
    て、コンピュータの記憶手段に記憶するステップとを含
    む、請求項1に記載のネットワークのイベント相関表作
    成方法。
  3. 【請求項3】 所定の再構成条件が成立したことに応答
    して、前記イベントノードネットワークを再構成するス
    テップと、 前記再構成されたイベントノードネットワークに基づい
    て前記相関表作成ステップを再実行するステップとをさ
    らに含む、請求項1または2に記載のネットワークのイ
    ベント相関表作成方法。
JP10045275A 1998-02-26 1998-02-26 ネットワークのイベント相関表作成方法 Withdrawn JPH11243390A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10045275A JPH11243390A (ja) 1998-02-26 1998-02-26 ネットワークのイベント相関表作成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10045275A JPH11243390A (ja) 1998-02-26 1998-02-26 ネットワークのイベント相関表作成方法

Publications (1)

Publication Number Publication Date
JPH11243390A true JPH11243390A (ja) 1999-09-07

Family

ID=12714773

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10045275A Withdrawn JPH11243390A (ja) 1998-02-26 1998-02-26 ネットワークのイベント相関表作成方法

Country Status (1)

Country Link
JP (1) JPH11243390A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7660269B2 (en) 2004-12-28 2010-02-09 International Business Machines Corporation Apparatus, method, and program for creating network configuration information
WO2010050381A1 (ja) * 2008-10-30 2010-05-06 インターナショナル・ビジネス・マシーンズ・コーポレーション 障害イベントの検出を支援する装置、障害イベントの検出を支援する方法及びコンピュータプログラム
JP2010108224A (ja) * 2008-10-30 2010-05-13 Internatl Business Mach Corp <Ibm> 障害イベントの検出を支援する装置、障害イベントの検出を支援する方法及びコンピュータプログラム
JP2010108223A (ja) * 2008-10-30 2010-05-13 Internatl Business Mach Corp <Ibm> 障害イベントの検出を支援する装置、障害イベントの検出を支援する方法及びコンピュータプログラム
JP2010108225A (ja) * 2008-10-30 2010-05-13 Internatl Business Mach Corp <Ibm> 障害イベントの検出を支援する装置、障害イベントの検出を支援する方法及びコンピュータプログラム

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7660269B2 (en) 2004-12-28 2010-02-09 International Business Machines Corporation Apparatus, method, and program for creating network configuration information
WO2010050381A1 (ja) * 2008-10-30 2010-05-06 インターナショナル・ビジネス・マシーンズ・コーポレーション 障害イベントの検出を支援する装置、障害イベントの検出を支援する方法及びコンピュータプログラム
JP2010108224A (ja) * 2008-10-30 2010-05-13 Internatl Business Mach Corp <Ibm> 障害イベントの検出を支援する装置、障害イベントの検出を支援する方法及びコンピュータプログラム
JP2010108223A (ja) * 2008-10-30 2010-05-13 Internatl Business Mach Corp <Ibm> 障害イベントの検出を支援する装置、障害イベントの検出を支援する方法及びコンピュータプログラム
JP2010108225A (ja) * 2008-10-30 2010-05-13 Internatl Business Mach Corp <Ibm> 障害イベントの検出を支援する装置、障害イベントの検出を支援する方法及びコンピュータプログラム
JPWO2010050381A1 (ja) * 2008-10-30 2012-03-29 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Maschines Corporation 障害イベントの検出を支援する装置、障害イベントの検出を支援する方法及びコンピュータプログラム
JP5132779B2 (ja) * 2008-10-30 2013-01-30 インターナショナル・ビジネス・マシーンズ・コーポレーション 障害イベントの検出を支援する装置、障害イベントの検出を支援する方法及びコンピュータプログラム
US8762777B2 (en) 2008-10-30 2014-06-24 International Business Machines Corporation Supporting detection of failure event
US8806273B2 (en) 2008-10-30 2014-08-12 International Business Machines Corporation Supporting detection of failure event

Similar Documents

Publication Publication Date Title
US11249728B2 (en) System and method for generating an application structure for an application in a computerized organization
US11238069B2 (en) Transforming a data stream into structured data
US10108411B2 (en) Systems and methods of constructing a network topology
US11086709B1 (en) Intent driven root cause analysis
CN101061688B (zh) 基于简单网络管理协议的网络管理设备和方法
US7860838B2 (en) Dynamic hierarchical data structure tree building and state propagation using common information model
US20050278273A1 (en) System and method for using root cause analysis to generate a representation of resource dependencies
US7529744B1 (en) Search interface server and storage management
US6990520B2 (en) System and method for managing computer networks
US8832654B2 (en) System and method for autonomous generation of software documentation
US20130297603A1 (en) Monitoring methods and systems for data centers
US8930964B2 (en) Automatic event correlation in computing environments
JP2001209622A (ja) データ処理装置構成管理システム
Wang et al. Efficient alarm behavior analytics for telecom networks
US8935388B2 (en) Systems and methods of automated event processing
JP5745932B2 (ja) グラフデータに写像の像であるオブジェクトに対する操作を反映する方法、プログラム、および、システム
CN114553689A (zh) 连接性模板
US8327292B2 (en) Distinct groupings of related objects for display in a user interface
CN115827380A (zh) 云平台监控方法及云平台监控系统
JPH11243390A (ja) ネットワークのイベント相関表作成方法
WO1999034557A1 (en) Method and system for software version management in a network management system
JP2006025434A (ja) 大容量障害相関システム及び方法
JP4522413B2 (ja) リソース管理プログラム、リソース管理方法、およびリソース管理装置
JP2000020428A (ja) ネットワーク管理システム
US11070443B1 (en) Methods and apparatus for centralized operational management of heterogenous network devices through software-based node unification

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20050510