JP2004080297A

JP2004080297A - 故障措置システム、及び、故障措置方法

Info

Publication number: JP2004080297A
Application number: JP2002236885A
Authority: JP
Inventors: Kosei Ono; 大野　孝生; Masanori Furuya; 古谷　雅典; Satoshi Oyamada; 小山田　聡; Nobuhiro Tanigawa; 谷川　延広
Original assignee: NTT Docomo Inc
Current assignee: NTT Docomo Inc
Priority date: 2002-08-15
Filing date: 2002-08-15
Publication date: 2004-03-11

Abstract

【課題】故障が発生した場合に、保守者の作業無しに直ちに、正確に故障要因を分析、措置を実施する。
【解決手段】個々の通信装置から故障発生時に通知されるメッセージを集約して受信し、メッセージの内容分析及び、発生時刻前後における関係装置でのメッセージ発生パターンを分析することで、推定ルール記憶部Ａ３に記憶されている推定ルールに従って故障要因を推定する。そして、動作シナリオ記憶部Ａ８に記憶されている動作シナリオ及び動作部品群Ａ９を用いることで、措置動作を自動的に実施する。動作シナリオは、テキストベースでの記述とし、その内容を容易に修正したり、シナリオ自体を新規に追加したりすることができるようにする。
【選択図】　　　　図１

Description

【０００１】
【発明の属する技術分野】
本発明は故障措置システム、及び、故障措置方法に関し、特に通信ネットワークを構成する通信装置において発生した故障に関する通知に応答して適切な措置を行うための故障措置システム、及び、故障措置方法に関する。
【０００２】
【従来の技術】
近年、通信ネットワークの多様化に伴い、大規模かつ複雑に構成される通信ネットワークでは、通信ネットワークの通信状況を一元監視し、通信ネットワーク内で故障が発生した場合に、短時間に故障復旧を行い、サービス中断時間を短縮し、かつ運用コストを圧縮することが要望されている。通信ネットワークで故障が発生した場合、故障要因を特定し、故障措置を自動で行うことが望ましい。その場合、要因となる通信が何かを短時間に分析することが重要な課題である。
【０００３】
通信ネットワーク内で故障が発生した場合に、故障箇所を特定し、復旧する一般的な故障措置方法について、図６を参照して説明する。
同図において、通信ネットワークは、ネットワークを構成する通信装置Ｎ１〜Ｎ４及びＮ１’〜Ｎ３’と、通信装置Ｎ１〜Ｎ４及びＮ１’〜Ｎ３’にそれぞれ接続される通信端末Ｔ１、Ｔ２と、通信媒体を介して通信装置Ｎ１〜Ｎ４及びＮ１’〜Ｎ３’に接続し、通信装置からの通知（メッセージ）を受信し、または通信装置に指示（コマンド）を送出する通信装置対応のオペレーションサポートシステム（Ｏｐｅｒａｔｉｏｎ　Ｓｕｐｐｏｒｔ　Ｓｙｓｔｅｍ）を構成するＯＰＳ（Ｏｐｅｒａｔｉｏｎ　Ｓｙｓｔｅｍ）装置Ｏ１〜Ｏ４と、通信媒体を介して通信装置Ｎ１〜Ｎ４及びＮ１’〜Ｎ３’に接続し、通信装置からの呼処理状況通知（トラヒック情報）を受信し、または通信装置にトラヒック制御（コマンド）を送出するＯＰＳ装置Ｏ５とを含んで構成されている。
【０００４】
さらに、同図に示されている通信ネットワークには、入出力装置Ｄ１〜Ｄ５が接続されている。これら入出力装置Ｄ１〜Ｄ５は、ＯＰＳ装置Ｏ１〜Ｏ５に接続され、オペレーションシステムで受信したメッセージを保守者（オペレータ）に対して表示し、または、保守者からのコマンドをオペレーションシステムに入力するために設けられている。
【０００５】
上記の通信ネットワーク内の通信装置Ｎ１とＮ２との間で故障が発生した場合を例として従来技術での故障対応方法を説明する。
通信装置Ｎ１とＮ２との間で故障が発生すると、故障を知らせるメッセージが通信装置Ｎ１よりＯＰＳ装置Ｏ１と、通信装置Ｎ２よりＯＰＳ装置Ｏ２へそれぞれ送信される。ＯＰＳ装置Ｏ１，Ｏ２では、受信したメッセージを保守者に認識できる表現で入出力装置Ｄ１，Ｄ２に表示を行う。
【０００６】
保守者は、入出力装置Ｄ１，Ｄ２に表示されたメッセージにより、通信装置Ｎ１，Ｎ２での故障の発生を認識し、故障要因となっている箇所を特定するための装置診断や、呼処理の正常性確認試験作業をそれぞれ独立して行う。あわせて、トラヒック状況を確認する必要があると判断した場合には、ＯＰＳ装置Ｏ５に接続された入出力装置Ｄ５を使用して、トラヒック状況を調査する。その上で、故障箇所を特定し、故障回復措置を実施した後、正常性の確認を行う。
【０００７】
【発明が解決しようとする課題】
上述した従来の故障措置においては、故障箇所に関連した上位、下位のそれぞれの通信装置で発生した故障通知を保守者が、それぞれ確認し、経験等に基づき関連の有無を想定しながら、故障要因となっている箇所を特定するための装置診断や、呼処理の正常性確認試験作業をそれぞれ独立して行っていた。
【０００８】
この場合、故障発生から要因の分析までに時間がかかること、さらに保守者それぞれの経験や知識によって、回復時間にむらがあること、故障要因の分析や措置を誤るといった欠点があった。また故障発生時の対応のため、保守者を終日待機させておく必要があった。
本発明は上述した従来技術の欠点を解決するためになされたものであり、その目的は故障が発生した場合に、保守者の作業無しに直ちに、正確に故障要因を分析、措置を実施することのできる故障措置システム、及び、故障措置方法を提供することである。
【０００９】
【課題を解決するための手段】
本発明の請求項１による故障措置システムは、通信ネットワークを構成する複数の通信装置のいずれかにおいて発生した故障の要因を推定する推定手段と、前記推定手段の推定内容に基づいて前記故障に対する措置を行う措置実行手段と、を含むことを特徴とする。故障要因の推定結果に基づいて、適切な措置を自動的に行うことができる。これにより、故障が発生した場合に、短時間に故障復旧を行い、サービス中断時間を短縮でき、かつ、運用コストを圧縮できる。
【００１０】
本発明の請求項２による故障措置システムは、請求項１において、前記推定手段は、前記複数の通信装置それぞれについての故障通知に応答して故障の要因を推定し、ある通信装置に故障の要因が存在しない場合にはその通信装置に対向する他の通信装置について故障の要因を推定することを特徴とする。ある装置と、それに対向する装置とに分けて故障要因を推定することにより、推定の効率を向上させることができる。
【００１１】
本発明の請求項３による故障措置システムは、請求項１又は２において、前記措置実行手段は、前記故障に対する措置を行うために用いる複数種類のソフトウェア部品と、前記推定手段の推定結果に応じて前記複数種類のソフトウェア部品の少なくとも１つを動作させるための複数種類のシナリオとを含み、前記複数種類のシナリオのうち、前記推定手段の推定内容に応じて選択されたシナリオが前記ソフトウェア部品を動作させることにより、前記故障に対する措置を行うことを特徴とする。あらゆる場合を想定した措置についてソフトウェアを用意するとファイルの規模が膨大になるのに対し、ソフトウェア部品とシナリオとを組み合わせればファイルの規模を最小限度に抑えることができる。
【００１２】
本発明の請求項４による故障措置システムは、請求項３において、前記措置実行手段は、適切なシナリオを選択できない場合、その旨をオペレータに報知し、オペレータによる措置を促すことを特徴とする。適切なシナリオが存在しない場合には、オペレータが措置を行うことにより、より適切に措置を行い得る。
本発明の請求項５による故障措置システムは、請求項３又は４において、前記複数種類のシナリオは、テキストファイルによって構成されていることを特徴とする。テキストファイルによってシナリオを構成することにより、シナリオの変更が必要になった場合でも、その内容を容易に修正したり、シナリオ自体を新規に追加したりすることができる。
【００１３】
本発明の請求項６による故障措置方法は、通信ネットワークを構成する複数の通信装置のいずれかにおいて発生した故障の要因を推定する推定ステップと、前記推定ステップにおける推定内容に基づいて前記故障に対する措置を行う措置実行ステップと、を含むことを特徴とする。故障要因の推定結果に基づいて、適切な措置を自動的に行うことができる。
【００１４】
本発明の請求項７による故障措置方法は、請求項６において、前記推定ステップにおいては、前記複数の通信装置それぞれについての故障通知に応答して故障の要因を推定し、ある通信装置に故障の要因が存在しない場合にはその通信装置に対向する他の通信装置について故障の要因を推定することを特徴とする。ある装置と、それに対向する装置とに分けて故障要因を推定することにより、推定の効率を向上させることができる。
【００１５】
本発明の請求項８による故障措置方法は、請求項６又は７において、前記措置実行ステップにおいては、前記故障に対する措置を行うために用いる複数種類のソフトウェア部品を動作させるための複数種類のシナリオを用いることを特徴とする。あらゆる場合を想定した措置についてソフトウェアを用意するとファイルの規模が膨大になるのに対し、ソフトウェア部品とシナリオとを組み合わせればファイルの規模を最小限度に抑えることができる。
【００１６】
本発明の請求項９による故障措置方法は、請求項８において、前記措置実行ステップにおいては、適切なシナリオを選択できない場合、その旨をオペレータに報知し、オペレータによる措置を促すことを特徴とする。適切なシナリオが存在しない場合には、オペレータが措置を行うことにより、より適切に措置を行い得る。
【００１７】
本発明の請求項１０による故障措置方法は、請求項８又は９において、前記複数種類のシナリオは、テキストファイルによって構成されていることを特徴とする。テキストファイルによってシナリオを構成することにより、シナリオの変更が必要になった場合でも、その内容を容易に修正したり、シナリオ自体を新規に追加したりすることができる。
【００１８】
【発明の実施の形態】
次に、図面を参照して本発明の実施の形態について説明する。なお、以下の説明において参照する各図においては、他の図と同等部分に同一符号が付されている。
（通信ネットワーク全体の構成）
図２は本発明による故障措置システムを採用した通信ネットワークの一形態を示すブロック図である。同図に示されているように、本実施形態による故障措置システムを採用した通信ネットワークは、ネットワークを構成する通信装置Ｎ１〜Ｎ４及びＮ１’〜Ｎ３’と、通信装置Ｎ１〜Ｎ４及びＮ１’〜Ｎ３’にそれぞれ接続される通信端末Ｔ１、Ｔ２と、通信媒体を介して通信装置Ｎ１〜Ｎ４及びＮ１’〜Ｎ３’に接続し、通信装置からの通知（メッセージ）を受信し、または通信装置に指示（コマンド）を送出する通信装置対応のオペレーションサポートシステムを構成するＯＰＳ装置Ｏ１〜Ｏ４と、通信媒体を介して通信装置Ｎ１〜Ｎ４及びＮ１’〜Ｎ３’に接続し、通信装置からの呼処理状況通知（トラヒック情報）を受信し、または通信装置にトラヒック制御（コマンド）を送出するＯＰＳ装置Ｏ５と、通信ネットワーク全体を管理する汎用計算機からなるオペレーションサポートシステムを構成するＯＰＳ装置Ｏ６とを含んで構成されている。
【００１９】
さらに、同図に示されている通信ネットワークには、入出力装置Ｄ１〜Ｄ５が接続されている。これら入出力装置Ｄ１〜Ｄ５は、ＯＰＳ装置Ｏ１〜Ｏ６に接続され、オペレーションシステムで受信したメッセージを保守者に対して表示し、または、保守者からのコマンドをオペレーションシステムに入力するために設けられている。
【００２０】
つまり、本システムは、従来のシステムの構成（図６参照）にＯＰＳ装置Ｏ６を追加した構成である。なお、同図に示されている構成は例示にすぎず、他の構成のシステムについて本発明が適用できることは勿論である。
このような構成からなる故障措置システムにおいて、通信装置Ｎ１とＮ２との間で故障が発生した場合、それぞれのＯＰＳ装置経由で故障発生メッセージがＯＰＳ装置Ｏ６に通知される。本ＯＰＳ装置Ｏ６では、それぞれのメッセージの内容を分析し、予め配備している発生パターンに合致しているか確認をし、対応手順を決定する。
【００２１】
その後、対応手順にそってメッセージ通知元の通信装置に対して、装置診断や、呼処理情報収集のコマンドを実施し、その結果により措置手順を決定し、措置手順に従って、装置の初期設定等の故障回復措置を行う。トラヒックヘの影響調査有無も、対応手順に記述される。以上のような、対応手順ないし措置手順は、シナリオとして記述され、この記述されたシナリオが動作シナリオ記憶部（Ａ８）に記憶される。このシナリオは、テキストファイルで構成するのが望ましい。テキストファイルで構成すれば、テキストベースでの修正が可能となるので、シナリオの変更が必要になった場合でも、その内容を容易に修正したり、シナリオ自体を新規に追加したりすることができる。
【００２２】
対応措置の実行によって故障状態から回復できた場合には、発生から対応状況を履歴として蓄積し、措置手順を決定できなかった場合や、故障回復ができなかった場合は、状況を保守者に通知する。従って、通常は、故障メッセージが発生しても保守者の作業無しに故障要因分析、故障回復措置が、自動実行されることになる。このため、保守者の対応が必要となるのは、措置手順を決定できなかった場合や、故障回復ができなかった場合のみである。これらの場合においては、後述するトラブルチケット等によって保守者に報知し、保守者による措置が促される。つまり、本システムを採用することにより、故障原因の推定、及び、故障に対する措置を自動的に行うことができる。
（ＯＰＳ装置Ｏ６の内部構成例）
ここで、図１には、ＯＰＳ装置Ｏ６の内部構成例が示されている。同図において、ＯＰＳ装置Ｏ６は、メッセージの変換等、外部とのインタフェースをなすＯＰＳアダプタ部Ａ１と、メッセージの分析を行うメッセージ分析処理部Ａ２と、後述する推定ルールが記憶されている推定ルール記憶部Ａ３と、推定ルールを実行する推定ルール実行部Ａ４と、ネットワーク構成情報の検索を行う構成情報検索部Ａ５と、通信ネットワークを構成している通信装置についての構成情報を記憶する構成情報ＤＢ（Ｄａｔａ　Ｂａｓｅ）Ａ６と、故障要因を特定しそれに対応する適切な措置を指示する要因特定・故障措置部Ａ７と、故障回復のための動作シナリオが記憶されている動作シナリオ記憶部Ａ８と、ソフトウェアによって所定の動作を実現するための動作部品群Ａ９と、故障措置結果の履歴を記憶する履歴ＤＢ（Ｄａｔａ　Ｂａｓｅ）Ａ１０とを含んで構成されている。
【００２３】
動作部品群Ａ９は、「トラヒック収集」、「診断・試験」、「装置切替・初期設定」、「トラブルチケット発行」等の動作を実現するためのソフトウェアによる部品である。これらの動作は例示にすぎず、その他の必要な動作を実現するためのソフトウェアによる部品が、動作部品群Ａ９に含まれているものとする。
動作シナリオ記憶部Ａ８に記憶されている動作シナリオが、この動作部品群Ａ９のうちの少なくとも１つを動作させることによって、回復措置が自動的に行われる。
【００２４】
次に、以上のような構成からなる本システムの動作例について説明する。ここでは、一例として、上記通信ネットワーク内の通信装置Ｎ１とＮ２との間のどこかで故障が発生した場合について、その故障に対する措置について説明する。
故障が発生すると、その旨を示すメッセージがＯＰＳ装置Ｏ６に通知される。ここでは、故障通知メッセージは、ＯＰＳ装置Ｏ１，Ｏ２経由で、ＯＰＳ装置Ｏ６に通知される。この通知されたメッセージは、ＯＰＳアダプタ部（Ａ１）において、ＯＰＳ装置Ｏ６で処理可能な情報に変換される。変換されたメッセージは、すべてメッセージ分析処理部（Ａ２）で内容を分析し、メッセージ種別、装置名、発生時刻等の情報を抽出する。メッセージ分析処理部では、メッセージ種別毎に対応の要否を判定し、対応要の場合には対応する推定ルール記憶部（Ａ３）を参照して推定ルールを決定する。
【００２５】
推定ルール実行部（Ａ４）では、発生時刻の前後ｔ秒間（ｔ：シナリオに記述した変化可能な値）で、当該推定ルール内に予め定義された関連メッセージ発生有無を確認する。メッセージがある場合には、構成情報検索部（Ａ５）と連携して、装置名をキー情報として構成情報ＤＢ（Ａ６）を検索することにより、そのメッセージが対向通信装置で発生しているかどうかや、上位装置でメッセージが発生しているかどうかを特定し、関連メッセージ発生パターンを分析することで、主要因推定を行い、動作シナリオを決定する。決定された動作シナリオを実行することにより、原則として、保守者の介在なしに故障から回復することができる。
（構成情報の例）
構成情報ＤＢ（Ａ６）で管理する情報の構成例が図３に示されている。同図には、通信装置Ｎ１の回線収容表が示されている。同図を参照すると、収容装置名（パッケージ）として、共通線信号処理装置がある。本例では、この共通線信号処理装置として、「００」と「０１」とがある。前者にはリンク番号「０００」〜「００７」があり、後者にはリンク番号「００８」〜「０１５」がある。これらは、通信装置Ｎ２〜Ｎ４を対向装置とし、回線番号は「１」〜「６」のいずれか１つである。
【００２６】
このような回線収容表は、その他の通信装置Ｎ２、Ｎ３…についても用意されている。したがって、この構成情報ＤＢ（Ａ６）で管理されている回線収容表を参照することにより、通信装置同士の接続関係を把握することができる。
（推定ルール及び動作シナリオの例）
次に、推定ルール及び動作シナリオの例について図４及び図５を参照して説明する。本例においては、図４に示されているように推定処理を行った後、図５に示されているように回復に必要な措置を行う。なお、本例では、リンク番号「００１」、装置名「Ｎ１」において故障が発生し、故障発生時刻は「ｙｙｍｍｄｄｈｈｍｍｓｓ」（年月日時分秒それぞれ２桁で表現される）である。
【００２７】
まず、図４において、同一通信装置Ｎ１にシステムダウンのメッセージがあるか判断する（ステップＳ１０１）。そのメッセージがあれば図５に移行し、通信装置Ｎ１対応の再開対応シナリオを起動する（ステップＳ２０１）。
図４に戻り、そのメッセージがなければ、次に、同一通信装置Ｎ１に上位装置（収容パッケージ）故障メッセージがあるか判断する（ステップＳ１０２）。そのメッセージがあれば図５に移行し、通信装置Ｎ１対応の装置診断シナリオを起動する（ステップＳ２０２）。
【００２８】
図４に戻り、そのメッセージがなければ、次に、同一通信装置Ｎ１に他リンクの同一種類のメッセージがあるか判断する（ステップＳ１０３）。そのメッセージがあれば更に対向通信装置にシステムダウンメッセージがあるか判断する（ステップＳ１０４）。そのメッセージがあれば図５に移行し、対向通信装置Ｎ２対応の再開対応シナリオを起動する（ステップＳ２０３）。
【００２９】
図４に戻り、そのメッセージがなければ、次に、対向通信装置に上位装置（収容パッケージ）故障メッセージがあるか判断する（ステップＳ１０５）。そのメッセージがあれば図５に移行し、対向通信装置Ｎ２対応の故障対応シナリオを起動する（ステップＳ２０４）。
図４に戻り、そのメッセージがなければ、次に、対向通信装置側でリンク故障発生のメッセージがあるか判断する（ステップＳ１０６）。そのメッセージがあれば図５に移行し、対向通信装置Ｎ２対応のリンク故障シナリオを起動する（ステップＳ２０５）。
【００３０】
ステップＳ２０１、Ｓ２０３、Ｓ２０４、Ｓ２０５の各シナリオを起動した場合、その後に措置は終了となる。ステップＳ２０２のシナリオを起動した場合、その後にトラブルチケット発行シナリオを起動し、パッケージ交換を保守者に依頼する（ステップＳ２１０）。
また、ステップＳ１０６において、対向通信装置側でリンク故障発生のメッセージがない場合、トラブルチケット発行シナリオを起動し、ギブアップとして保守者の介入を促す（ステップＳ２０９）。
【００３１】
ステップＳ１０３において、同一通信装置Ｎ１に他リンクの同一種類のメッセージがない場合、図５に移行し、通信装置Ｎ１対応のリンク故障シナリオを起動する。この場合、最初にリンク閉塞・解除によるリンク初期設定で回復したか判断する（ステップＳ２０６）。回復すれば措置は終了となる。
ステップＳ２０６において、回復しない場合、リンク試験結果が正常か判断する（ステップＳ２０７）。リンク試験結果が正常である場合、トラブルチケット発行シナリオを起動し、ギブアップとして保守者の介入を促す（ステップＳ２０９）。一方、リンク試験結果が正常でない場合、トラブルチケット発行シナリオを起動し、保守者の対応を促す（ステップＳ２０８）。
【００３２】
以上、図４及び図５を参照して説明したように、要因特定・故障措置部（Ａ７）では、動作シナリオに従って、トラヒック情報収集による影響把握や、診断・試験による要因特定を自動的に実施し、故障要因を特定する。そして、故障要因特定後は、対象装置に対して、初期設定や、系変更・装置切り替え等の故障措置を実施する。トラヒック情報収集や、診断・試験、装置切り替え等の個々の動作は、上述した動作部品群（Ａ９）として予め準備されている。また、動作部品群を用いた動作が、動作シナリオによって記述されている。そして、要因特定・故障措置部が対象通信装置を指定することにより、対象通信装置へのコマンドを実行することができる。
【００３３】
故障措置の結果、ハード装置の交換作業のような、保守者の対応が必要となった場合には、上述したように入出力装置Ｄ１からトラブルチケットを発行する。この場合、入出力装置Ｄ１の画面にその旨を表示して保守者に報知しても良いし、プリントアウトすることによって保守者に報知しても良い。
また、動作シナリオが決定できなかった場合や、故障回復ができなかった場合にも、上述したように保守者の対応を促すトラブルチケットを通知する。最後に、一連メッセージが通知されることのトリガーとなったメッセージ、決定した動作シナリオ、コマンド実行結果、故障措置結果を履歴ＤＢ（Ａ１０）に格納し、故障措置は完了する。
【００３４】
なお、ＯＰＳ装置Ｏ６のシステム保守者は、定期的に履歴ＤＢ（Ａ１０）内を統計分析し、推定ルール及び動作シナリオの正常性を確認するとともに、動作に不具合がある場合は、テキストベースでの修正を可能とする。すなわち、本例のシナリオは、上述したように、テキストファイルによって構成されているので、シナリオの変更が必要になった場合でも、その内容を容易に修正したり、シナリオ自体を新規に追加したりすることができる。
【００３５】
以上のように本システムは、通信ネットワークを構成する複数の通信装置を通信媒体を介して管理する汎用計算機を構成要素としたオペレーションシステムにおける通信ネットワークの監視・保守運用を行うシステムである。そして、通信装置から通知される自律メッセージの情報を利用し、メッセージの関連付けを行い故障の要因を分析し、自動措置を行うものである。
【００３６】
先述した問題点を解決するため、本システムでは、個々の通信装置から故障発生時に通知されるメッセージの発生パターンを予め具備し、メッセージ発生パターンによって、予め配備した、措置パターンの中から適切な措置手順を決定する。メッセージの発生パターン及び、措置手順は、予めテキストベースのシナリオとして用意され、メッセージが変更になった場合でも、容易に対応できる。このことにより、故障発生直後に保守者の作業無しに自動で故障要因の分析、故障措置が行える。
（故障措置方法）
ところで、以上説明した故障措置システムにおいては、以下のような故障措置方法が実現されている。すなわち、通信ネットワークを構成する複数の通信装置のいずれかにおいて発生した故障の要因を推定する推定ステップと、上記推定ステップにおける推定内容に基づいて上記故障に対する措置を行う措置実行ステップと、を含む故障措置方法が実現されている。故障要因の推定結果に基づいて、適切な措置を自動的に行うことができる。
【００３７】
また、上記推定ステップにおいては、上記複数の通信装置それぞれについての故障通知に応答して故障の要因を推定し、ある通信装置に故障の要因が存在しない場合にはその通信装置に対向する他の通信装置について故障の要因を推定する。ある装置と、それに対向する装置とに分けて故障要因を推定することにより、推定の効率を向上させることができる。
【００３８】
さらに、上記措置実行ステップにおいては、上記故障に対する措置を行うために用いる複数種類のソフトウェア部品を動作させるための複数種類のシナリオを用いる。あらゆる場合を想定した措置についてソフトウェアを用意するとファイルの規模が膨大になるのに対し、ソフトウェア部品とシナリオとを組み合わせればファイルの規模を最小限度に抑えることができる。
【００３９】
なお、上記措置実行ステップにおいては、適切なシナリオを選択できない場合、その旨をオペレータに報知し、オペレータによる措置を促す。適切なシナリオが存在しない場合には、オペレータが措置を行うことにより、より適切に措置を行い得る。また、上記複数種類のシナリオは、テキストファイルによって構成されている。テキストファイルによってシナリオを構成することにより、シナリオの変更が必要になった場合でも、その内容を容易に修正したり、シナリオ自体を新規に追加したりすることができる。
【００４０】
【発明の効果】
以上説明したように本発明は、通信ネットワークを構成する複数の通信装置のいずれかにおいて発生した故障の要因を推定し、この推定内容に基づいて故障に対する措置を行うことにより、故障要因の推定結果に基づいて、適切な措置を自動的に行うので、原則として、保守者の作業無しに故障要因特定、回復措置を直ちに、正確に実施できるという効果がある。
【００４１】
また、複数の通信装置それぞれについての故障通知に応答して故障の要因を推定し、ある通信装置に故障の要因が存在しない場合にはその通信装置に対向する他の通信装置について故障の要因を推定することにより、推定の効率を向上させることができるという効果がある。
故障に対する措置を行うために用いる複数種類のソフトウェア部品と、推定結果に応じて複数種類のソフトウェア部品の少なくとも１つを動作させるための複数種類のシナリオとを用意し、複数種類のシナリオのうち、推定内容に応じて選択されたシナリオがソフトウェア部品を動作させて故障に対する措置を行うことにより、ファイルの規模が膨大にならず、ファイル規模を最小限度に抑えることができる。
【００４２】
そして、適切なシナリオを選択できない場合、その旨をオペレータに報知し、オペレータによる措置を促すことにより、より適切に措置を行い得る。
さらに、複数種類のシナリオを、テキストファイルによって構成することにより、シナリオの変更が必要になった場合でも、その内容を容易に修正したり、シナリオ自体を新規に追加したりすることができる。
【図面の簡単な説明】
【図１】本発明の故障措置システムを実現するためのＯＰＳ装置の構成例を示す機能概要図である。
【図２】本発明の故障措置システムを採用した通信ネットワーク構成概略図である。
【図３】構成情報ＤＢで管理される通信装置Ｎ１の情報の構成例である。
【図４】本システムにおける推定ルールの例を示すフローチャートである。
【図５】図４の推定ルールによる推定後に実行される動作シナリオの処理例を示すフローチャートである。
【図６】通信ネットワークにおける、従来の故障箇所特定及び、故障措置方法について、説明するための通信ネットワーク構成図である。
【符号の説明】
Ｎ１〜Ｎ４　通信装置
Ｔ１、Ｔ２　通信端末
Ｏ１〜Ｏ６　ＯＰＳ装置
Ｄ１〜Ｄ５　入出力装置
Ａ１　ＯＰＳアダプタ部
Ａ２　メッセージ分析処理部
Ａ３　推定ルール記憶部
Ａ４　推定ルール実行部
Ａ５　構成情報検索部
Ａ６　構成情報ＤＢ
Ａ７　要因特定・故障措置部
Ａ８　動作シナリオ記憶部
Ａ９　動作部品群
Ａ１０　履歴ＤＢ

Claims

通信ネットワークを構成する複数の通信装置のいずれかにおいて発生した故障の要因を推定する推定手段と、前記推定手段の推定内容に基づいて前記故障に対する措置を行う措置実行手段と、を含むことを特徴とする故障措置システム。
前記推定手段は、前記複数の通信装置それぞれについての故障通知に応答して故障の要因を推定し、ある通信装置に故障の要因が存在しない場合にはその通信装置に対向する他の通信装置について故障の要因を推定することを特徴とする請求項１記載の故障措置システム。
前記措置実行手段は、前記故障に対する措置を行うために用いる複数種類のソフトウェア部品と、前記推定手段の推定結果に応じて前記複数種類のソフトウェア部品の少なくとも１つを動作させるための複数種類のシナリオとを含み、前記複数種類のシナリオのうち、前記推定手段の推定内容に応じて選択されたシナリオが前記ソフトウェア部品を動作させることにより、前記故障に対する措置を行うことを特徴とする請求項１又は２記載の故障措置システム。
前記措置実行手段は、適切なシナリオを選択できない場合、その旨をオペレータに報知し、オペレータによる措置を促すことを特徴とする請求項３記載の故障措置システム。
前記複数種類のシナリオは、テキストファイルによって構成されていることを特徴とする請求項３又は４記載の故障措置システム。
通信ネットワークを構成する複数の通信装置のいずれかにおいて発生した故障の要因を推定する推定ステップと、前記推定ステップにおける推定内容に基づいて前記故障に対する措置を行う措置実行ステップと、を含むことを特徴とする故障措置方法。
前記推定ステップにおいては、前記複数の通信装置それぞれについての故障通知に応答して故障の要因を推定し、ある通信装置に故障の要因が存在しない場合にはその通信装置に対向する他の通信装置について故障の要因を推定することを特徴とする請求項６記載の故障措置方法。
前記措置実行ステップにおいては、前記故障に対する措置を行うために用いる複数種類のソフトウェア部品を動作させるための複数種類のシナリオを用いることを特徴とする請求項６又は７記載の故障措置方法。
前記措置実行ステップにおいては、適切なシナリオを選択できない場合、その旨をオペレータに報知し、オペレータによる措置を促すことを特徴とする請求項８記載の故障措置方法。
前記複数種類のシナリオは、テキストファイルによって構成されていることを特徴とする請求項８又は９記載の故障措置方法。