JPH10229396A - サービス管理方法及びシステム - Google Patents
サービス管理方法及びシステムInfo
- Publication number
- JPH10229396A JPH10229396A JP9029436A JP2943697A JPH10229396A JP H10229396 A JPH10229396 A JP H10229396A JP 9029436 A JP9029436 A JP 9029436A JP 2943697 A JP2943697 A JP 2943697A JP H10229396 A JPH10229396 A JP H10229396A
- Authority
- JP
- Japan
- Prior art keywords
- service
- information
- action plan
- network device
- state
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Abstract
合には、どの部分がトラブルの原因と考えられるのか自
動的に判断し、対策方法を立案し、影響を受けているユ
ーザへの報告も自動的に行うサービス管理方法及びシス
テムを提供する。 【解決手段】 本発明は、ネットワークサービスを管理
するため、ネットワーク機器から情報を収集し、サービ
スの運用状態を判断し、管理者にサービスの運用状態を
提示し、ネットワーク機器のトラブルに対処する操作手
順と、ユーザへの利用可能な通知手段を用いて状況報告
を行うための作業手順をアクションプランとして作成
し、管理者にアクションプランを提示し、管理者がアク
ションプランを選択することにより、アクションプラン
を自動的に実行し、サービスを運用管理する。
Description
及びシステムに係り、特に、ネットワークサービスを効
率的に運用するために、ネットワーク機器の適切な使用
を行うと共に、ネットワーク機器のトラブルの発生に迅
速に対処してサービス品質の維持を図り、ユーザへサー
ビス品質の報告を行うサービス管理方法及びシステムに
関する。
は、ネットワークに接続されているサーバやクライアン
トなどに関する機能や性能の諸元などに関する機器情
報、負荷の状況や稼働率などに関する性能情報、ネット
ワーク内の通信状況などに関するトラヒック情報をそれ
ぞれ個別の情報として、別々に表示し、管理を行う人間
が、これらの情報を関連付け、総合してサービスの運用
状態を判断するという方法が一般的である。
集などによって、前述のサービスが適切に運用できなく
なり、ネットワークの構成やサービスの設定を変更する
必要が生じた場合には、管理を行う人間が、ネットワー
ク機器毎に各作業を個別に入力・指示を行い、ユーザへ
のサービス運用状態の報告などはユーザの問い合わせに
応じて調査し、報告している。
従来のネットワークサービスの管理方法では、ネットワ
ークサービスを管理するために、ネットワークサービス
を構成するネットワーク機器の状態をすべて把握し、ネ
ットワークサービスの運用状態を判断する作業を人間が
行わなければならず、企業におけるコンピュータネット
ワークのように多数のネットワーク機器が接続された大
規模なネットワークサービスの運用管理は非常に困難で
ある。
トラブルが生じた場合、トラブルの原因となるネットワ
ーク機器を探索し、復旧作業を1つ1つ人手を介して行
わなければならないため、非常に手間がかかる。また、
上記のトラブル発生時に影響を受けているユーザへサー
ビスの状態を報告する仕組みはなく、ユーザの問い合わ
せが来てからサービスの状態を調査し、報告している。
で、ネットワークサービスを構成するネットワーク機器
の状態把握のための情報収集を自動的に行い、サービス
の運用状態を判断し、サービスの運用状態にトラブルが
発生した場合には、どの部分がトラブルの原因と考えら
れるのか、自動的に判断し、対策方法を立案し、影響を
受けているユーザへの報告も自動的に行うサービス管理
方法及びシステムを提供することを目的とする。
説明するための図である。本発明は、複数のネットワー
ク機器が接続されたネットワーク上で動作するネットワ
ークサービスを管理するサービス管理方法において、ネ
ットワーク機器の過負荷や性能の劣化、機能の停止など
のトラブルが発生した場合に、ネットワーク機器からの
情報を収集し(ステップ1)、サービスの運用状態を判
断し、サービス管理者にサービスの運用状態を提示し
(ステップ2)、ネットワーク機器のトラブルに対処す
る操作手順とユーザへの利用可能な通知手段を用いて状
況報告を行うための作業手順をアクションプランとして
作成し(ステップ3)、サービス管理者にアクションプ
ランを提示し、サービス管理者がアクションプランを選
択することにより、該アクションプランを実行し、サー
ビスを運用管理する(ステップ4)。
ワーク機器から情報を収集する際に、サービスを運用す
る上で必要となるネットワーク機器に、サービス管理を
行う機器から要求する動作を行うエージェントを組み込
み、サービス管理を行う機器からネットワーク機器に情
報を要求し、情報を受け取る。
の運用状態を判断する際に、サービスを運用するために
必要となるネットワーク機器の性能や該ネットワーク機
器の構成をサービス構成として保持し、ネットワーク機
器から収集した情報に基づいて、サービスを運用するた
めに必要な該ネットワーク機器の状態判断を行い、ネッ
トワーク機器の状態を総合して、サービス運用状態を判
断する。
の運用状態を判断する際に、サービスが正常に運用され
ていないと判断された場合には、サービス構成に基づい
て、サービスが正常に運用されていない影響範囲と影響
の度合いを判定する。また、上記ステップ3において、
アクションプランを作成する際に、各サービス毎にサー
ビスの運用方針に関する情報を保持し、サービスの運用
方針に基づいたアクションプランを作成し、サービスの
運用上、優先度の高いアクションプランからサービス管
理者に提示する。
ンプランを実行する際に、当該アクションプランを実行
するために必要な通信方法や、制御方法を適切に選択
し、利用する。図2は、本発明の原理構成図である。本
発明は、複数のネットワーク機器によりネットワークサ
ービスが提供される環境において、ネットワークを管理
するネットワーク管理システムであって、サービスを運
用する上で必要となるネットワーク機器をサービス構成
要素とし、ネットワークに接続されているサービス構成
要素から情報収集を行う情報収集手段100と、サービ
ス構成要素から取得する情報に基づいてサービス構成要
素の状態を判断し、該サービス構成要素の状態とサービ
スを運用する上で必要なサービスの構成情報により、サ
ービスの運用状態を判断するサービス状態判断手段20
0と、サービス状態判断手段200により、判断された
結果に基づいてサービスの運用に従った対処方法をアク
ションプランとしてサービスの運用上優先度の高い該ア
クションプランから順次、作成するアクションプラン作
成手段300と、アクションプラン作成手段300によ
り作成されたアクションプランを優先度の高いものから
管理者に提示し、該管理者が実行したいアクションプラ
ンを選択することで、選択されたアクションプランを実
行するアクションプラン実行手段400と、アクション
プランを管理者に提示する際に用いる表示手段600
と、アクションプランを管理者が選択する際に用いる入
力手段700と、アクションプラン実行手段400にお
いて必要な情報を保持する情報保存手段500とを有す
る。
トワーク機器に組み込まれたサービス管理を行う機器か
らの要求動作を行うエージェントに対し、該サービス管
理を行う機器から必要な情報を要求するコマンドを送信
し、該エージェントから要求した情報を受信する情報要
求手段を含む。
を設定された時間間隔で収集するためのタイマ監視手段
と、収集した情報を保存する情報保存手段を含む。ま
た、上記のサービス状態判断手段200は、サービスが
正常な状態でないと判明した場合に、サービスの利用に
影響を受ける、ユーザの使用するネットワーク機器の影
響範囲と影響の度合いを判定する影響範囲判定手段を含
む。
ビスの構成情報と、情報収集手段100で収集した情
報、サービス状態判断手段200で判断した情報、サー
ビスの運用方針の情報、アクションプラン作成手段30
0で作成された情報、及びアクションプラン実行手段4
00で実行したアクションプランの情報を保持する手段
を含む。
00は、実行したアクションプランの履歴情報を保持す
るアクションプラン履歴情報保持手段と、アクションプ
ランの履歴情報を提示するアクションプラン履歴情報提
示手段とを含む。
クライアントコンピュータ、サーバコンピュータなどの
ネットワーク機器が接続されたネットワーク上で運用さ
れているネットワークサービスにおいて、ネットワーク
機器に何らかのトラブルが発生した場合に、ネットワー
ク機器から収集した情報に基づいて、サービスの運用状
態を判断して、サービスが正常状態でない場合は、ユー
ザが使用するクライアントコンピュータへの影響を識別
して、サービス管理者へ提示すると共に、サービス運用
方針に基づいた対処方法をアクションプランとして作成
し、優先度の高いプランからサービス管理者に提示す
る。さらに、サービス管理者が提示されたアクションプ
ランを選択することで自動的にアクションプランを実行
するものである。
ビスの運用状態を判断することが可能となり、正常状態
でないサービスに対し、迅速に対処することが可能とな
る。また、本発明は、サービスの構成情報に基づいてネ
ットワーク機器からサービスに関する情報を収集し、サ
ービスの状態判断を行い、サービス管理者に提示する。
これは、従来においては、ネットワークに接続された様
々なネットワーク機器を管理するために一般的に用いら
れているManagement Information Base (MIB)情報
を収集する程度であったのに対し、サービス毎にサービ
スを運用する上でネットワーク機器に要求されるMIB
情報以外の性能値まで収集することにより、詳細な状態
監視が可能となる。
機器のレベルではなく、複数のネットワーク機器から構
成されるサービスのレベルで状態管理を行い、ネットワ
ーク機器のトラブルによりサービスが正常状態でないと
判断した場合には、トラブルによってサービスが正常状
態ではなくなった影響範囲と影響の度合いを判定する。
さらに、トラブルに対する対策をアクションプランとし
てサービス運用方針に基づき作成・提示し、サービス管
理者は提示されたアクションプランのうち、実行するプ
ランを選択することによって、選択されたアクションプ
ランが自動的に実行される。
ク機器から収集したMIB情報に基づいて、ネットワー
ク機器の状態変化を監視するのみで、サービスの運用
上、どこがトラブルの原因となり、どの部分へどの程度
影響しているのか、さらに、どのように対処していくべ
きかは管理者の知識にまかされていたのに対し、本発明
では、サービスの状態監視とアクションプランの作成、
実行を行うことにより、管理者の知識のレベルに依存せ
ず、管理者の作業負荷を軽減した迅速なサービス管理が
可能である。
運用しているサービスの構成を記述したサービス構成情
報に基づいて、サービスを運用していく上で必要な構成
要素であるネットワーク機器から情報を収集し、サービ
スの状態判断を行い、トラブルなどにより、サービスが
正常状態でない場合には、トラブルによる影響範囲と影
響具合の判定を行い、トラブルに対するアクションプラ
ンをサービスの運用方式に基づき作成し、サービス管理
者に提示し、サービス管理者が実行したいアクションプ
ランを選択することで、自動的にアクションプランを実
行することにより、管理者自身が、サービスの運用して
いく上で、トラブルを生じているネットワーク機器を調
査し、影響範囲を推定し、対策を考え、実行するという
作業を軽減し、効率的にサービスの運用管理を行うこと
ができる。
を図面を参照して説明する。図3は、本発明のサービス
管理システムの構成を示すブロック図である。同図に示
すシステムは、ネットワーク1、当該ネットワーク1に
接続されるサービス管理コンピュータ4と多数のネット
ワーク機器2から構成される。
ーク機器2によって提供されるサービスを管理するコン
ピュータであり、管理者5への入出力を提供する入出力
制御部6とサービス管理を行うための情報処理を行う情
報処理制御部7と、サービス管理を行うための情報を保
持する情報保存部8とを有する。管理者5は、サービス
管理コンピュータ4を使用する。
ークサービスを提供するために必要となるサーバコンピ
ュータ、クライアントコンピュータ、ハブやルータなど
であり、サービス管理コンピュータから要求された情報
を返信するエージェント26を持つ。ユーザは、サーバ
コンピュータ、クライアントコンピュータなどコンピュ
ータ毎に存在する。
細に説明する。サービス管理コンピュータ4は、入出力
制御部6内に、管理者へサービスの状態や対処策を提示
する表示部9、管理者からの対処策の選択情報など入力
を受け取る入力制御部10とを有する。さらに、情報処
理制御部7内に、情報の収集や処理を行う時間を管理す
るタイマ部11、サービスの状態を判断するサービス状
態判断部12、サービスを構成しているサービス構成要
素の状態を判断するサービス構成要素状態判断部13、
ネットワーク機器2から情報収集を行うネットワーク機
器情報収集部14、サービスの状態から判断してアクシ
ョンプランを作成するアクションプラン作成部15、作
成されたアクションプランを表示部9に提示し、管理者
5からの入力制御部10からの入力に基づいて、アクシ
ョンプランを実行するアクションプラン実行部16、ア
クションプランを実行する際に用いる通知・制御ツール
17とを有する。
器からの収集した情報を保持するネットワーク機器情報
保存部21、サービスを構成しているサービス構成要素
の状態を判断するための情報を保持するサービス構成要
素情報保存部20、サービス構成要素の状態を判断した
評価結果を保持するサービス構成要素状態情報保存部2
5、サービスの状態を判断するための情報を保持するサ
ービス構成情報保存部19、サービスの状態を判断する
際の指針となる情報を保持するサービス運用方針を保持
するサービス運用方針情報保存部22、サービス影響状
態情報保存部23、サービスの状態から判断して作成さ
れたアクションプランを保持するアクションプラン情報
保存部18、実行されたアクションプラン内容を履歴と
して保存するアクションプラン実行履歴情報保存部24
を有する。
ワーク機器から構成されるネットワークサービスをサー
ビス管理コンピュータ4で管理する場合の全体の動作を
図4を参照して説明する。図4は、本発明の全体の動作
の概略を示すフローチャートである。 ステップ100) タイマ部11が時間計測を開始す
る。
収集部14がタイマ部11の時間経過の通知を受け、ネ
ットワーク機器のエージェントに対して収集する情報を
要求するコマンドを送信し、ネットワーク機器のエージ
ェントから要求した情報を含んだ返信を受け、受け取っ
た情報をネットワーク機器情報保存部21に保存する。
この処理の詳細を図5を用いて後述する。
保存部21に保存した収集情報とサービス構成要素情報
保存部20に保存してあるサービスを構成するサービス
構成要素の状態を判断するための情報から、サービス構
成要素状態判断部13がネットワーク機器2のサービス
を提供する上で必要となるサービス構成要素の役割を果
しているかの判断を行う。その判断結果をサービス構成
要素状態情報保存部25に保存する。詳細な動作は図6
を用いて後述する。
情報保存部25に保存したサービス構成要素の状態情報
とサービス構成情報保存部19に保存してあるサービス
の状態を判断するための情報から、サービス状態判断部
12がサービスの状態判断を行う。サービスの状態が正
常でない場合、ユーザへの影響分析を行う。それらの判
断結果をサービス状態情報、サービス影響状態情報保存
部23に保存し、さらに表示部9に渡し、管理者に提示
する。詳細な動作は図7を用いて後述する。
部15は、サービス状態情報、サービス影響状態情報保
存部23を監視し、変化があった場合には、サービス運
用方針情報保存部22から状態変化したサービスに関す
るサービス運用方針情報を読み込み、今後の対象方法を
示すアクションプランを複数作成し、運用上重要なプラ
ンから優先度を付け、アクションプラン情報保存部18
に保存する。詳細な動作は図8を用いて後述する。
部16は、アクションプラン情報保存部18を監視し、
変化があった場合には、表示部9に渡し、管理者に提示
する。管理者の入力は入力制御部10を介してアクショ
ンプラン実行部16が受け取り、通知・制御ツール17
を用いて選択されたアクションプランを実行する。実行
したアクションプランは、アクションプラン実行履歴情
報保存部24に履歴として保存する。詳細な動作は、図
9を用いて後述する。
集部における情報収集動作のフローチャートである。 ステップ201) ネットワーク機器情報収集部14
は、サービス構成要素情報保存部20からネットワーク
機器2のサービス構成要素としての役割を果している
か、状態を判断するための、ネットワーク機器情報とそ
の情報の収集間隔の情報を読み込む。
間経過の通知を用いて、情報の収集間隔が経過したネッ
トワーク機器情報から、その情報を保持しているネット
ワーク機器2に対して、情報収集を要求するコマンドを
送信する。 ステップ203) 送信されたコマンドをネットワーク
機器のエージェントが受け取り、そのエージェントがネ
ットワーク機器2内に保持されている情報から探索、獲
得し、サービス管理コンピュータ4に対して要求された
情報をのせて返信する。
ータ4のネットワーク機器情報収集部14がネットワー
ク機器2から返信されてきた情報を受信する。 ステップ205) ネットワーク機器情報収集部14
は、要求した情報を受信情報から抽出し、ネットワーク
機器情報保存部21に保存する。図6は、本発明の構成
要素状態判断部の動作のフローチャートである。処理の
詳細な動作を示すフローチャートであり、ステップ30
0の内容を詳細に記述したもので、ネットワーク機器2
から収集した情報に基づいてサービス構成の状態判断を
行い、その判断結果を保存する処理の動作である。
判断部13は、サービス構成要素情報保存部20からサ
ービス構成要素の状態を判断するための情報を読み込
む。 ステップ302) タイマ部11からの時間経過の通知
を用いて、サービス構成要素の状態判断を行うために設
定された動作間隔が経過したことを確認する。 ステップ303) サービス構成要素の状態判断を1つ
ずつサービス構成要素を選択して行うが、まだ状態判断
をしていないサービス構成要素が存在するか判断する。
ないサービス構成要素を1つ選択する。 ステップ305) サービス構成要素状態判断部13
は、選択したサービス構成要素に関係する最新の情報を
ネットワーク機器情報保存部21から読み込む。 ステップ306) サービス構成要素に関係するネット
ワーク機器情報の評価を1つずつネットワーク機器情報
を選択して行うが、まだ、評価をしていないネットワー
ク機器情報が存在するか判断する。
ネットワーク機器2を1つ選択し、ステップ301で読
み込んでいる情報の中から対応するサービス構成要素の
状態判断指標を抽出し、ネットワーク機器情報を評価す
る。 ステップ308) サービス構成要素に関係するネット
ワーク機器情報の評価が全て終わった後、それらの評価
を総合してサービス構成要素の状態を判断する。
成要素状態情報保存部25に保存する。図7は、本発明
のサービス状態判定部の動作のフローチャートであり、
サービス構成要素の状態判断結果の情報に基づいてサー
ビスの状態判断を行い、その判断結果を保存する処理の
動作である。
2は、サービス構成情報保存部19からサービスの状態
を判断するための情報を読み込む。 ステップ402) タイマ部11からの時間経過の通知
を用いて、サービスの状態判断を行う設定された動作間
隔が経過したことを確認する。 ステップ403) サービスの状態判断を1つずつサー
ビスを選択して行うが、まだ、状態判断をしていないサ
ービスが存在するか判断する。
ないサービスを1つ選択する。 ステップ405) サービス状態判断部12は、選択し
たサービスを構成するサービス構成要素の状態の最新の
情報をサービス構成要素状態保存部25から読み込む。 ステップ406) サービスの状態を判断する。
果が正常か、正常でないかを識別する。 ステップ408) サービスの状態が正常でない場合、
影響を受けているユーザの判定や影響の度合いの判別な
どサービスの影響状態判断を行う。 ステップ409) サービスの状態判断結果とサービス
が正常でない場合は、サービスの影響状態判断結果をサ
ービス状態情報・サービスの影響状態情報保存部23に
保存する。
の動作のフローチャートであり、サービスの状態判断結
果が正常でなかった場合の対処方法であるアクションプ
ランを作成し、そのアクションプランを保存する処理動
作である。 ステップ501) アクションプラン作成部15は、サ
ービス状態情報・サービス影響状態情報保存部23に書
き込まれる情報を監視する。
ンを作成していない、サービス状態が正常でないサービ
スがあるかを識別する。 ステップ503) ステップ502で識別したサービス
状態が正常でないサービスに関して、アクションプラン
作成部15は、サービス状態情報・サービス影響状態情
報保存部23から情報を読み込む。
部15は、ステップ502で識別したサービス状態が正
常でないサービスに関する運用方式情報をサービス運用
方針情報保存部22から読み込む。 ステップ505) サービスの状態情報・影響情報と運
用方針情報からアクションプランを作成し、運用方針に
基づいてアクションプランに優先順位を付ける。
ランをアクションプラン情報保存部18に保存する。図
9は、本発明のアクションプラン実行部の動作を示すフ
ローチャートであり、アクションプランが新たに作成さ
れた場合に、そのアクションプランを管理者に提示し、
管理者がアクションプランを選択することで、選択され
たアクションプランが自動的に実行され、その実行され
たアクションプランを履歴として保存する。
部16は、アクションプラン情報保存部18に書き込ま
れる情報を監視する。 ステップ602) 新たに書き込まれたアクションプラ
ンがあるか識別する。 ステップ603) 新たなアクションプランがある場合
には、アクションプラン情報保存部18からそのアクシ
ョンプランを読み込み、表示部9に渡し、管理者5に提
示する。
ションプランに関係する、今までに実行したアクション
プランの履歴をアクションプラン実行履歴保存部24か
ら読み込み、表示部9に渡し、管理者5に提示する。 ステップ605) 管理者からの入力が入力制御部10
にあるか、一定時間、監視する。
者からアクションプランの選択が判別された場合、選択
されたアクションプランをアクションプラン実行部16
に通知する。 ステップ607) アクションプラン実行部16は、選
択されたアクションプランの内容を解釈し、通知・制御
ツール部17を用いて、サービスの利用に影響を受けて
いるユーザへ状態通知やネットワーク機器2の遠隔制御
などのアクションプランを実行する。
ランを履歴として残すため、アクションプラン実行履歴
情報保存部24に実行したアクションプランを保存す
る。
る。本例では、複数のネットワーク機器2を用いて構築
されたWWWのネットワークサービスを例に説明する。
まず、サービス構成情報とサービス構成要素情報につい
て情報の内容を定義し、WWWのサービス構成例を示
し、そのサービス構成をサービス構成情報・サービス構
成要素情報の定義で記述した情報を前提として、1つの
サービス構成要素にトラブルが発生した際のサービス構
成要素の状態判断例と、サービス状態判断例、さらに、
サービスの状態を基にしたアクションプラン作成例を示
す手順により説明する。
に必要となる、サービス構成情報とサービス構成要素情
報を図10に示すER図として定義する。このER図で
は、サービスは複数の構成要素から構成されていて
(1)、それぞれの構成要素はリンク情報によって構成
要素間の接続先、リンク属性によって接続関係が決めら
れ(2)、構成要素の接続先、接続関係はサービス毎に
保持される(3)。構成要素がコンピュータの場合に
は、構成要素を使用するユーザが決められる(4)。サ
ービスはその特性によってサービスを運用していく上で
の構成要素に対する制約が決められ(5)、制約を受け
る構成要素名が決められる(6)。
めのデータ項目を持ち(7)、そのデータは情報収集を
すべきデータ項目(9)と収集したデータ項目を評価す
るための閾値(8)からなる。サービスの構成として
は、図11に示すWWWのネットワークサービスの例を
用いる。このサービスは、WWWのサーバは、WWWサ
ーバとWWWサーバの情報を定期的に転送して同一の情
報を保持するミラー化したWWWミラーサーバの2台の
負荷分散構成になっており、ルータ〜ルータの間
は、リング状に接続されており、ルータ間の接続が1か
所故障しても他の接続をたどって通信を停止することな
く続行することができるサービス構成となっている。
ビス構成情報・サービス構成要素定義を用いると、図1
2、図13に示す情報として記述される。図12は、サ
ービス構成の定義を記述したもので、サービス名は“W
WWサービス”であり、サービス構成要素は、WWWサ
ーバ、WWWミラーサーバ、ハブ〜ハブ、ルータ
〜ルータ、クライアント〜クライアントである。
サービス構成から運用上の制約としては、WWWサーバ
とWWWミラーサーバのどちらかが正常であれば、サー
ビスは提供できるので、システム制約数が1で制約を受
ける制約構成要素がWWWサーバとWWWミラーサーバ
となる。
で、構成要素としてWWWサーバとルータの定義を示
している。WWWサーバの構成要素名は、“WWWサー
バ”であり、他の構成要素との接続を示すリンク情報は
ハブであり、サービス運用上の接続関係の役割を表す
リンク属性は、特別な役割はないので、一般であり、W
WWサーバの状態を判断するための状態判断データ項目
としては、Remote Procedure Call (RPC)を用いて
収集するサーバの性能値と性能値に対する閾値、WWW
サービスで使用するHyper Text Transfer Protocol(H
TTP)を用いて試験する項目と試験項目に対する閾
値、Simple Network Management Protocol(SNMP)
を用いて収集するネットワーク性能値と当該性能値に対
する閾値とする。また、このWWWサーバを使用するユ
ーザをAとする。次にルータについては、構成要素名
はルータであり、リンク情報は、ルータ、ルータ
、ハブ、ハブであり、リンク属性は、リンク情報
に対応してルータとはリング構成、ルータとは、リ
ング構成、ハブとは一般、ハブとは一般、状態判断
データ項目はSNMP性能値とそれに対する閾値であ
り、ユーザはユーザが使用するものではないのでなしと
する。
サーバにトラブルが発生した場合を想定し、サービス状
態判断方法を図面を参照して説明する。ネットワーク機
器情報収集部14により、構成要素の状態判断データが
収集され、サービス構成要素状態判断部13により構成
要素の状態判断データを設定された判断指標である閾値
を基準に評価し、それぞれの評価結果を総合して構成要
素の状態判断を行う。図14は、この状態判断過程を示
している。状態判断データとして4つのデータ項目があ
り、それぞれのデータについて判断指標である閾値を基
に評価を行っていて、例えば、状態判断データ項目が必
須プロセス状態であるものについては、RPCを用いて
収集したプロセスの状態値、ダウンに対し、判断指標は
アップとなっているため、状態判断データの評価として
は、「故障状態」と評価する。他の状態判断データ項目
についても、評価を行い、それぞれのデータ項目毎に評
価結果を出す。その評価結果のうち、1つでも『故障状
態』と評価した項目があれば、その構成要素はサービス
運用への役割を欠くことになるため、WWWサーバの状
態を「故障状態」と判断している。
の状態判断結果とサービス構成情報を基に、サービスの
状態判断とサービス影響判断を行う。図15は、この状
態判断過程を示している。WWWサービスのサービス構
成に記述されている構成要素に対してそれぞれ状態判断
結果を調べ、正常でない状態の構成要素が存在するか調
査する。ここでは、WWWサーバが故障状態と判明する
ので、WWWサーバがWWWサービスに及ぼす影響を分
析する。WWWサービスのサービス構成情報内の、制約
構成要素にWWWサーバが含まれていることが判明する
が、システム制約数が1であるため、WWWサーバが故
障してもWWWミラーサーバが正常であれば、サービス
は提供できると判断できる。しかし、性能的にはサーバ
2台で運用していたものを1台で運用するためサービス
の状態が不良になると判断し、サービス状態は不良状態
と判断する。また、WWWサーバの接続関係による影響
を調べるため、、WWWサーバの構成要素情報内のリン
ク属性を調査する。ここでは、リンク属性は一般である
ため、構成要素の接続関係からサービスの状態に影響を
及ぼすことはないと判断する。次に、サービスの状態が
正常状態ではないので、正常でない影響範囲を調べる。
WWWサーバの故障によって影響の及ぶ範囲は、WWW
サーバがサービス構成情報の制約構成要素に含まれるこ
とから、サービスを運用する上で必須の構成要素である
ことが判別し、全てのクライアントに影響を及ぼすこと
が判明する。
め、アクションプランを作成することになる。アクショ
ンプランの作成方法としては、図16に示すように、
誰、何に対して(通知対象)、どのような方法で(通知
方法)、どのようなプランを(プラン内容)作成するの
か、それぞれ設定された候補の中から選択して、組み合
わせる方法をとる。ここでは、電子メールや電子掲示板
のサービスが運用されており、電話やファクシミリが使
用できることを前提としている。
が故障状態にあるので、まず、WWWサーバを修復しな
ければならないこと、そして状況の報告をユーザにしな
ければならないこと、また、状況が悪化している場合に
は、ユーザにサービスの利用を自粛するよう通告しなけ
ればならないこと等が考えられ、それらのプランに優先
度を付けて以下のようなアクションプランを作成する。 1.WWWサーバのシステム管理者に電話や電子メール
で修復依頼: 2.電子掲示板にWWWサービスが不良状態であること
を掲示: 3.ユーザに電子メールでWWWサービスが不良状態で
あることを同報通知: 4.各部署の管理者に電子メールでWWWサービスが不
良状態であるので、利用を控えるよう同報通知: なお、本発明は、上記の実施例に限定されることなく、
特許請求の範囲内で種々変更・応用が可能である。
法及びシステムでは、ネットワーク機器にトラブルが発
生した場合、ネットワーク機器から情報を収集し、サー
ビス構成情報に基づいて、サービスの状態判断を行い、
該トラブルによるサービスの影響範囲と影響程度を判定
し、該トラブルに対する対処方法をサービスの運用方針
に基づき、アクションプランとして作成し、管理者に提
示し、管理者が実行するアクションプランを選択するこ
とにより、選択されたアクションプランを自動的に実行
するため、管理者の知識や経験、勘に頼らず、サービス
の運用方針に適切に反映した対処を迅速にとることがで
き、サービスの運用状態を良い状態に保つことができ
る。
縮や、サービスを運用していく上で、必要となる設備の
適切な配置と構成を可能とし、設備投資コストや、運用
コストを大幅に節約できる。
トである。
情報収集動作のフローチャートである。
ャートである。
ャートである。
ーチャートである。
ーチャートである。
ビス構成要素情報を定義したER図である。
ワーク構成を示す図である。
ス構成情報の内容の例を示す図である。
素情報の内容の例を示す図である。
素の状態判断の内容の例を示す図である。
断の内容の例を示す図である。
ョンプラン作成の内容の例を示す図である。
Claims (12)
- 【請求項1】 複数のネットワーク機器が接続されたネ
ットワーク上で動作するネットワークサービスを管理す
るサービス管理方法において、 前記ネットワーク機器の過負荷や性能の劣化、機能の停
止などのトラブルが発生した場合に、 前記ネットワーク機器からの情報を収集し、 前記サービスの運用状態を判断し、 サービス管理者に前記サービスの運用状態を提示し、 前記ネットワーク機器のトラブルに対処する操作手順と
ユーザへの利用可能な通知手段を用いて状況報告を行う
ための作業手順をアクションプランとして作成し、 前記サービス管理者に前記アクションプランを提示し、 前記サービス管理者が前記アクションプランを選択する
ことにより、該アクションプランを実行し、サービスを
運用管理することを特徴とするサービス管理方法。 - 【請求項2】 前記ネットワーク機器から情報を収集す
る際に、 サービスを運用する上で必要となるネットワーク機器
に、サービス管理を行う機器から要求する動作を行うエ
ージェントを組み込み、 前記サービス管理を行う機器から前記ネットワーク機器
に情報を要求し、情報を受け取る請求項1記載のサービ
ス管理方法。 - 【請求項3】 前記サービスの運用状態を判断する際
に、 サービスを運用するために必要となる前記ネットワーク
機器の性能や該ネットワーク機器の構成をサービス構成
として保持し、 前記ネットワーク機器から収集した情報に基づいて、前
記サービスを運用するために必要な該ネットワーク機器
の状態判断を行い、 前記ネットワーク機器の状態を総合して、前記サービス
運用状態を判断する請求項1記載のサービス管理方法。 - 【請求項4】 前記サービスの運用状態を判断する際
に、 前記サービスが正常に運用されていないと判断された場
合には、 前記サービス構成に基づいて、サービスが正常に運用さ
れていない影響範囲と影響の度合いを判定する請求項1
及び3記載のサービス管理方法。 - 【請求項5】 前記アクションプランを作成する際に、 各サービス毎にサービスの運用方針に関する情報を保持
し、サービスの運用方針に基づいた前記アクションプラ
ンを作成し、サービスの運用上、優先度の高い前記アク
ションプランから前記サービス管理者に提示する請求項
1記載のサービス管理方法。 - 【請求項6】 前記アクションプランを実行する際に、 前記アクションプランを実行するために必要な通信方法
や、制御方法を適切に選択し、利用する請求項1記載の
サービス管理方法。 - 【請求項7】 複数のネットワーク機器によりネットワ
ークサービスが提供される環境において、ネットワーク
を管理するネットワーク管理システムであって、 サービスを運用する上で必要となるネットワーク機器を
サービス構成要素とし、 前記ネットワークに接続されている前記サービス構成要
素から情報収集を行う情報収集手段と、 前記サービス構成要素から取得する情報に基づいて前記
サービス構成要素の状態を判断し、該サービス構成要素
の状態とサービスを運用する上で必要なサービスの構成
情報により、サービスの運用状態を判断するサービス状
態判断手段と、 前記サービス状態判断手段により、判断された結果に基
づいてサービスの運用に従った対処方法をアクションプ
ランとしてサービスの運用上優先度の高い該アクション
プランから順次、作成するアクションプラン作成手段
と、 前記アクションプラン作成手段により作成された前記ア
クションプランを優先度の高いものから管理者に提示
し、該管理者が実行したいアクションプランを選択する
ことで、選択されたアクションプランを実行するアクシ
ョンプラン実行手段と、 前記アクションプランを前記管理者に提示する際に用い
る表示手段と、 前記アクションプランを前記管理者が選択する際に用い
る入力手段と、 前記アクションプラン実行手段において必要な情報を保
持する情報保存手段とを有することを特徴とするサービ
ス管理システム。 - 【請求項8】 前記情報収集手段は、 前記ネットワーク機器に組み込まれたサービス管理を行
う機器からの要求動作を行うエージェントに対し、該サ
ービス管理を行う機器から必要な情報を要求するコマン
ドを送信し、該エージェントから要求した情報を受信す
る情報要求手段を含む請求項7記載のサービス管理シス
テム。 - 【請求項9】 前記情報収集手段は、 情報を設定された時間間隔で収集するためのタイマ監視
手段と、 収集した情報を保存する情報保存手段を含む請求項8記
載のサービス管理システム。 - 【請求項10】 前記サービス状態判断手段は、 サービスが正常な状態でないと判明した場合に、サービ
スの利用に影響を受ける、ユーザの使用するネットワー
ク機器の影響範囲と影響の度合いを判定する影響範囲判
定手段を含む請求項7記載のサービス管理システム。 - 【請求項11】 前記情報保存手段は、 前記サービスの構成情報と、前記情報収集手段で収集し
た情報、前記サービス状態判断手段で判断した情報、前
記サービスの運用方針の情報、前記アクションプラン作
成手段で作成された情報、及び前記アクションプラン実
行手段で実行した前記アクションプランの情報を保持す
る手段を含む請求項7、8、または9記載のサービス管
理システム。 - 【請求項12】 前記アクションプラン実行手段は、 実行したアクションプランの履歴情報を保持するアクシ
ョンプラン履歴情報保持手段と、 前記アクションプランの履歴情報を提示するアクション
プラン履歴情報提示手段とを含む請求項7記載のサービ
ス管理システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2943697A JP3598394B2 (ja) | 1997-02-13 | 1997-02-13 | サービス管理方法及び装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2943697A JP3598394B2 (ja) | 1997-02-13 | 1997-02-13 | サービス管理方法及び装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH10229396A true JPH10229396A (ja) | 1998-08-25 |
JP3598394B2 JP3598394B2 (ja) | 2004-12-08 |
Family
ID=12276094
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2943697A Expired - Lifetime JP3598394B2 (ja) | 1997-02-13 | 1997-02-13 | サービス管理方法及び装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3598394B2 (ja) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003150481A (ja) * | 2001-11-09 | 2003-05-23 | Nec Corp | 情報提供システム、情報端末、情報提供装置、判定装置及びそれらに用いるプログラム並びに情報提供方法 |
JP2005316728A (ja) * | 2004-04-28 | 2005-11-10 | Mitsubishi Electric Corp | 障害解析装置、障害解析方法及び障害解析プログラム |
WO2007004417A1 (ja) * | 2005-07-01 | 2007-01-11 | Yokogawa Electric Corporation | 分散コンピューティング環境における管理システム |
WO2008072851A1 (en) * | 2006-12-15 | 2008-06-19 | Syncoam Co., Ltd | Oscillating-frequency variable oscillator |
WO2009040876A1 (ja) * | 2007-09-28 | 2009-04-02 | Fujitsu Limited | ネットワーク管理装置及びプログラム |
JP2010239528A (ja) * | 2009-03-31 | 2010-10-21 | Tokyo Electric Power Co Inc:The | 通信ネットワークにおける提供サービスの管理システムおよびその方法 |
US7949906B2 (en) | 2005-07-27 | 2011-05-24 | Nec Corporation | Management supporting system, management supporting method, and management supporting program |
WO2019187207A1 (ja) * | 2018-03-30 | 2019-10-03 | 日本電気株式会社 | 運用管理装置、方法及び非一時的なコンピュータ可読媒体 |
WO2020162215A1 (ja) * | 2019-02-07 | 2020-08-13 | 日本電信電話株式会社 | 障害情報周知装置及び障害情報周知方法 |
-
1997
- 1997-02-13 JP JP2943697A patent/JP3598394B2/ja not_active Expired - Lifetime
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003150481A (ja) * | 2001-11-09 | 2003-05-23 | Nec Corp | 情報提供システム、情報端末、情報提供装置、判定装置及びそれらに用いるプログラム並びに情報提供方法 |
US7567800B2 (en) | 2001-11-09 | 2009-07-28 | Nec Corporation | Content delivery system |
JP2005316728A (ja) * | 2004-04-28 | 2005-11-10 | Mitsubishi Electric Corp | 障害解析装置、障害解析方法及び障害解析プログラム |
JP2007011823A (ja) * | 2005-07-01 | 2007-01-18 | Yokogawa Electric Corp | 分散コンピューティング環境における管理システム |
WO2007004417A1 (ja) * | 2005-07-01 | 2007-01-11 | Yokogawa Electric Corporation | 分散コンピューティング環境における管理システム |
US7949906B2 (en) | 2005-07-27 | 2011-05-24 | Nec Corporation | Management supporting system, management supporting method, and management supporting program |
WO2008072851A1 (en) * | 2006-12-15 | 2008-06-19 | Syncoam Co., Ltd | Oscillating-frequency variable oscillator |
WO2009040876A1 (ja) * | 2007-09-28 | 2009-04-02 | Fujitsu Limited | ネットワーク管理装置及びプログラム |
JP2010239528A (ja) * | 2009-03-31 | 2010-10-21 | Tokyo Electric Power Co Inc:The | 通信ネットワークにおける提供サービスの管理システムおよびその方法 |
WO2019187207A1 (ja) * | 2018-03-30 | 2019-10-03 | 日本電気株式会社 | 運用管理装置、方法及び非一時的なコンピュータ可読媒体 |
JPWO2019187207A1 (ja) * | 2018-03-30 | 2021-01-14 | 日本電気株式会社 | 運用管理装置、方法及びプログラム |
WO2020162215A1 (ja) * | 2019-02-07 | 2020-08-13 | 日本電信電話株式会社 | 障害情報周知装置及び障害情報周知方法 |
JP2020129714A (ja) * | 2019-02-07 | 2020-08-27 | 日本電信電話株式会社 | 障害情報周知装置及び障害情報周知方法 |
US11749088B2 (en) | 2019-02-07 | 2023-09-05 | Nippon Telegraph And Telephone Corporation | Failure information announcement device and failure information announcement method |
Also Published As
Publication number | Publication date |
---|---|
JP3598394B2 (ja) | 2004-12-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7051244B2 (en) | Method and apparatus for managing incident reports | |
US6856942B2 (en) | System, method and model for autonomic management of enterprise applications | |
CA2618935C (en) | Monitoring and management of distributed information systems | |
US8504679B2 (en) | Methods, systems and computer program products for managing execution of information technology (IT) processes | |
US6271845B1 (en) | Method and structure for dynamically drilling down through a health monitoring map to determine the health status and cause of health problems associated with network objects of a managed network environment | |
KR100322152B1 (ko) | 분산컴퓨팅환경에 대한 클라이언트에 기초한 애플리케이션 사용가능도 및 응답 모니터링 및 리포팅 | |
US7574502B2 (en) | Early warning of potential service level agreement violations | |
US7028228B1 (en) | Method and apparatus for identifying problems in computer networks | |
US20030135382A1 (en) | Self-monitoring service system for providing historical and current operating status | |
EP1819096B1 (en) | A method for acquiring network key performance indicators and the key performance indicators groupware thereof | |
WO2001080032A1 (en) | A system and method for managing computing devices within a data communications network from a remotely located console | |
US6678729B1 (en) | Method of monitoring the availability of a messaging and VOIP networking | |
US7469287B1 (en) | Apparatus and method for monitoring objects in a network and automatically validating events relating to the objects | |
JP3598394B2 (ja) | サービス管理方法及び装置 | |
Muller | Improving network operations with intelligent agents | |
US20020032764A1 (en) | Technology for managing trouble creating devices in a network | |
Cisco | Monitoring the System | |
JP5974905B2 (ja) | 応答時間監視プログラム、方法および応答時間監視装置 | |
AU2005270749B2 (en) | Monitoring and management of distributed information systems | |
JP2023179110A (ja) | 障害対応支援装置及び方法 | |
Jailani et al. | FMS: A computer network fault management system based on the OSI standards | |
JP2003092571A (ja) | ネットワークサービス監視装置およびその方法、ならびにネットワーク監視プログラムおよび記録媒体 | |
Zohuri et al. | Event Management Categories and Best Practices | |
JP2001005795A (ja) | 分散システムにおける異常検出方法 | |
CN114143160A (zh) | 一种云平台自动化运维系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20031216 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20031224 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040220 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040629 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040726 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20040817 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7426 Effective date: 20040818 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20040830 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080924 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080924 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090924 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090924 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100924 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100924 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110924 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120924 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130924 Year of fee payment: 9 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
EXPY | Cancellation because of completion of term |