JP2004080297A - 故障措置システム、及び、故障措置方法 - Google Patents
故障措置システム、及び、故障措置方法 Download PDFInfo
- Publication number
- JP2004080297A JP2004080297A JP2002236885A JP2002236885A JP2004080297A JP 2004080297 A JP2004080297 A JP 2004080297A JP 2002236885 A JP2002236885 A JP 2002236885A JP 2002236885 A JP2002236885 A JP 2002236885A JP 2004080297 A JP2004080297 A JP 2004080297A
- Authority
- JP
- Japan
- Prior art keywords
- failure
- scenario
- measure
- communication device
- estimation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Monitoring And Testing Of Exchanges (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
【課題】故障が発生した場合に、保守者の作業無しに直ちに、正確に故障要因を分析、措置を実施する。
【解決手段】個々の通信装置から故障発生時に通知されるメッセージを集約して受信し、メッセージの内容分析及び、発生時刻前後における関係装置でのメッセージ発生パターンを分析することで、推定ルール記憶部A3に記憶されている推定ルールに従って故障要因を推定する。そして、動作シナリオ記憶部A8に記憶されている動作シナリオ及び動作部品群A9を用いることで、措置動作を自動的に実施する。動作シナリオは、テキストベースでの記述とし、その内容を容易に修正したり、シナリオ自体を新規に追加したりすることができるようにする。
【選択図】 図1
【解決手段】個々の通信装置から故障発生時に通知されるメッセージを集約して受信し、メッセージの内容分析及び、発生時刻前後における関係装置でのメッセージ発生パターンを分析することで、推定ルール記憶部A3に記憶されている推定ルールに従って故障要因を推定する。そして、動作シナリオ記憶部A8に記憶されている動作シナリオ及び動作部品群A9を用いることで、措置動作を自動的に実施する。動作シナリオは、テキストベースでの記述とし、その内容を容易に修正したり、シナリオ自体を新規に追加したりすることができるようにする。
【選択図】 図1
Description
【0001】
【発明の属する技術分野】
本発明は故障措置システム、及び、故障措置方法に関し、特に通信ネットワークを構成する通信装置において発生した故障に関する通知に応答して適切な措置を行うための故障措置システム、及び、故障措置方法に関する。
【0002】
【従来の技術】
近年、通信ネットワークの多様化に伴い、大規模かつ複雑に構成される通信ネットワークでは、通信ネットワークの通信状況を一元監視し、通信ネットワーク内で故障が発生した場合に、短時間に故障復旧を行い、サービス中断時間を短縮し、かつ運用コストを圧縮することが要望されている。通信ネットワークで故障が発生した場合、故障要因を特定し、故障措置を自動で行うことが望ましい。その場合、要因となる通信が何かを短時間に分析することが重要な課題である。
【0003】
通信ネットワーク内で故障が発生した場合に、故障箇所を特定し、復旧する一般的な故障措置方法について、図6を参照して説明する。
同図において、通信ネットワークは、ネットワークを構成する通信装置N1〜N4及びN1’〜N3’と、通信装置N1〜N4及びN1’〜N3’にそれぞれ接続される通信端末T1、T2と、通信媒体を介して通信装置N1〜N4及びN1’〜N3’に接続し、通信装置からの通知(メッセージ)を受信し、または通信装置に指示(コマンド)を送出する通信装置対応のオペレーションサポートシステム(Operation Support System)を構成するOPS(Operation System)装置O1〜O4と、通信媒体を介して通信装置N1〜N4及びN1’〜N3’に接続し、通信装置からの呼処理状況通知(トラヒック情報)を受信し、または通信装置にトラヒック制御(コマンド)を送出するOPS装置O5とを含んで構成されている。
【0004】
さらに、同図に示されている通信ネットワークには、入出力装置D1〜D5が接続されている。これら入出力装置D1〜D5は、OPS装置O1〜O5に接続され、オペレーションシステムで受信したメッセージを保守者(オペレータ)に対して表示し、または、保守者からのコマンドをオペレーションシステムに入力するために設けられている。
【0005】
上記の通信ネットワーク内の通信装置N1とN2との間で故障が発生した場合を例として従来技術での故障対応方法を説明する。
通信装置N1とN2との間で故障が発生すると、故障を知らせるメッセージが通信装置N1よりOPS装置O1と、通信装置N2よりOPS装置O2へそれぞれ送信される。OPS装置O1,O2では、受信したメッセージを保守者に認識できる表現で入出力装置D1,D2に表示を行う。
【0006】
保守者は、入出力装置D1,D2に表示されたメッセージにより、通信装置N1,N2での故障の発生を認識し、故障要因となっている箇所を特定するための装置診断や、呼処理の正常性確認試験作業をそれぞれ独立して行う。あわせて、トラヒック状況を確認する必要があると判断した場合には、OPS装置O5に接続された入出力装置D5を使用して、トラヒック状況を調査する。その上で、故障箇所を特定し、故障回復措置を実施した後、正常性の確認を行う。
【0007】
【発明が解決しようとする課題】
上述した従来の故障措置においては、故障箇所に関連した上位、下位のそれぞれの通信装置で発生した故障通知を保守者が、それぞれ確認し、経験等に基づき関連の有無を想定しながら、故障要因となっている箇所を特定するための装置診断や、呼処理の正常性確認試験作業をそれぞれ独立して行っていた。
【0008】
この場合、故障発生から要因の分析までに時間がかかること、さらに保守者それぞれの経験や知識によって、回復時間にむらがあること、故障要因の分析や措置を誤るといった欠点があった。また故障発生時の対応のため、保守者を終日待機させておく必要があった。
本発明は上述した従来技術の欠点を解決するためになされたものであり、その目的は故障が発生した場合に、保守者の作業無しに直ちに、正確に故障要因を分析、措置を実施することのできる故障措置システム、及び、故障措置方法を提供することである。
【0009】
【課題を解決するための手段】
本発明の請求項1による故障措置システムは、通信ネットワークを構成する複数の通信装置のいずれかにおいて発生した故障の要因を推定する推定手段と、前記推定手段の推定内容に基づいて前記故障に対する措置を行う措置実行手段と、を含むことを特徴とする。故障要因の推定結果に基づいて、適切な措置を自動的に行うことができる。これにより、故障が発生した場合に、短時間に故障復旧を行い、サービス中断時間を短縮でき、かつ、運用コストを圧縮できる。
【0010】
本発明の請求項2による故障措置システムは、請求項1において、前記推定手段は、前記複数の通信装置それぞれについての故障通知に応答して故障の要因を推定し、ある通信装置に故障の要因が存在しない場合にはその通信装置に対向する他の通信装置について故障の要因を推定することを特徴とする。ある装置と、それに対向する装置とに分けて故障要因を推定することにより、推定の効率を向上させることができる。
【0011】
本発明の請求項3による故障措置システムは、請求項1又は2において、前記措置実行手段は、前記故障に対する措置を行うために用いる複数種類のソフトウェア部品と、前記推定手段の推定結果に応じて前記複数種類のソフトウェア部品の少なくとも1つを動作させるための複数種類のシナリオとを含み、前記複数種類のシナリオのうち、前記推定手段の推定内容に応じて選択されたシナリオが前記ソフトウェア部品を動作させることにより、前記故障に対する措置を行うことを特徴とする。あらゆる場合を想定した措置についてソフトウェアを用意するとファイルの規模が膨大になるのに対し、ソフトウェア部品とシナリオとを組み合わせればファイルの規模を最小限度に抑えることができる。
【0012】
本発明の請求項4による故障措置システムは、請求項3において、前記措置実行手段は、適切なシナリオを選択できない場合、その旨をオペレータに報知し、オペレータによる措置を促すことを特徴とする。適切なシナリオが存在しない場合には、オペレータが措置を行うことにより、より適切に措置を行い得る。
本発明の請求項5による故障措置システムは、請求項3又は4において、前記複数種類のシナリオは、テキストファイルによって構成されていることを特徴とする。テキストファイルによってシナリオを構成することにより、シナリオの変更が必要になった場合でも、その内容を容易に修正したり、シナリオ自体を新規に追加したりすることができる。
【0013】
本発明の請求項6による故障措置方法は、通信ネットワークを構成する複数の通信装置のいずれかにおいて発生した故障の要因を推定する推定ステップと、前記推定ステップにおける推定内容に基づいて前記故障に対する措置を行う措置実行ステップと、を含むことを特徴とする。故障要因の推定結果に基づいて、適切な措置を自動的に行うことができる。
【0014】
本発明の請求項7による故障措置方法は、請求項6において、前記推定ステップにおいては、前記複数の通信装置それぞれについての故障通知に応答して故障の要因を推定し、ある通信装置に故障の要因が存在しない場合にはその通信装置に対向する他の通信装置について故障の要因を推定することを特徴とする。ある装置と、それに対向する装置とに分けて故障要因を推定することにより、推定の効率を向上させることができる。
【0015】
本発明の請求項8による故障措置方法は、請求項6又は7において、前記措置実行ステップにおいては、前記故障に対する措置を行うために用いる複数種類のソフトウェア部品を動作させるための複数種類のシナリオを用いることを特徴とする。あらゆる場合を想定した措置についてソフトウェアを用意するとファイルの規模が膨大になるのに対し、ソフトウェア部品とシナリオとを組み合わせればファイルの規模を最小限度に抑えることができる。
【0016】
本発明の請求項9による故障措置方法は、請求項8において、前記措置実行ステップにおいては、適切なシナリオを選択できない場合、その旨をオペレータに報知し、オペレータによる措置を促すことを特徴とする。適切なシナリオが存在しない場合には、オペレータが措置を行うことにより、より適切に措置を行い得る。
【0017】
本発明の請求項10による故障措置方法は、請求項8又は9において、前記複数種類のシナリオは、テキストファイルによって構成されていることを特徴とする。テキストファイルによってシナリオを構成することにより、シナリオの変更が必要になった場合でも、その内容を容易に修正したり、シナリオ自体を新規に追加したりすることができる。
【0018】
【発明の実施の形態】
次に、図面を参照して本発明の実施の形態について説明する。なお、以下の説明において参照する各図においては、他の図と同等部分に同一符号が付されている。
(通信ネットワーク全体の構成)
図2は本発明による故障措置システムを採用した通信ネットワークの一形態を示すブロック図である。同図に示されているように、本実施形態による故障措置システムを採用した通信ネットワークは、ネットワークを構成する通信装置N1〜N4及びN1’〜N3’と、通信装置N1〜N4及びN1’〜N3’にそれぞれ接続される通信端末T1、T2と、通信媒体を介して通信装置N1〜N4及びN1’〜N3’に接続し、通信装置からの通知(メッセージ)を受信し、または通信装置に指示(コマンド)を送出する通信装置対応のオペレーションサポートシステムを構成するOPS装置O1〜O4と、通信媒体を介して通信装置N1〜N4及びN1’〜N3’に接続し、通信装置からの呼処理状況通知(トラヒック情報)を受信し、または通信装置にトラヒック制御(コマンド)を送出するOPS装置O5と、通信ネットワーク全体を管理する汎用計算機からなるオペレーションサポートシステムを構成するOPS装置O6とを含んで構成されている。
【0019】
さらに、同図に示されている通信ネットワークには、入出力装置D1〜D5が接続されている。これら入出力装置D1〜D5は、OPS装置O1〜O6に接続され、オペレーションシステムで受信したメッセージを保守者に対して表示し、または、保守者からのコマンドをオペレーションシステムに入力するために設けられている。
【0020】
つまり、本システムは、従来のシステムの構成(図6参照)にOPS装置O6を追加した構成である。なお、同図に示されている構成は例示にすぎず、他の構成のシステムについて本発明が適用できることは勿論である。
このような構成からなる故障措置システムにおいて、通信装置N1とN2との間で故障が発生した場合、それぞれのOPS装置経由で故障発生メッセージがOPS装置O6に通知される。本OPS装置O6では、それぞれのメッセージの内容を分析し、予め配備している発生パターンに合致しているか確認をし、対応手順を決定する。
【0021】
その後、対応手順にそってメッセージ通知元の通信装置に対して、装置診断や、呼処理情報収集のコマンドを実施し、その結果により措置手順を決定し、措置手順に従って、装置の初期設定等の故障回復措置を行う。トラヒックヘの影響調査有無も、対応手順に記述される。以上のような、対応手順ないし措置手順は、シナリオとして記述され、この記述されたシナリオが動作シナリオ記憶部(A8)に記憶される。このシナリオは、テキストファイルで構成するのが望ましい。テキストファイルで構成すれば、テキストベースでの修正が可能となるので、シナリオの変更が必要になった場合でも、その内容を容易に修正したり、シナリオ自体を新規に追加したりすることができる。
【0022】
対応措置の実行によって故障状態から回復できた場合には、発生から対応状況を履歴として蓄積し、措置手順を決定できなかった場合や、故障回復ができなかった場合は、状況を保守者に通知する。従って、通常は、故障メッセージが発生しても保守者の作業無しに故障要因分析、故障回復措置が、自動実行されることになる。このため、保守者の対応が必要となるのは、措置手順を決定できなかった場合や、故障回復ができなかった場合のみである。これらの場合においては、後述するトラブルチケット等によって保守者に報知し、保守者による措置が促される。つまり、本システムを採用することにより、故障原因の推定、及び、故障に対する措置を自動的に行うことができる。
(OPS装置O6の内部構成例)
ここで、図1には、OPS装置O6の内部構成例が示されている。同図において、OPS装置O6は、メッセージの変換等、外部とのインタフェースをなすOPSアダプタ部A1と、メッセージの分析を行うメッセージ分析処理部A2と、後述する推定ルールが記憶されている推定ルール記憶部A3と、推定ルールを実行する推定ルール実行部A4と、ネットワーク構成情報の検索を行う構成情報検索部A5と、通信ネットワークを構成している通信装置についての構成情報を記憶する構成情報DB(Data Base)A6と、故障要因を特定しそれに対応する適切な措置を指示する要因特定・故障措置部A7と、故障回復のための動作シナリオが記憶されている動作シナリオ記憶部A8と、ソフトウェアによって所定の動作を実現するための動作部品群A9と、故障措置結果の履歴を記憶する履歴DB(Data Base)A10とを含んで構成されている。
【0023】
動作部品群A9は、「トラヒック収集」、「診断・試験」、「装置切替・初期設定」、「トラブルチケット発行」等の動作を実現するためのソフトウェアによる部品である。これらの動作は例示にすぎず、その他の必要な動作を実現するためのソフトウェアによる部品が、動作部品群A9に含まれているものとする。
動作シナリオ記憶部A8に記憶されている動作シナリオが、この動作部品群A9のうちの少なくとも1つを動作させることによって、回復措置が自動的に行われる。
【0024】
次に、以上のような構成からなる本システムの動作例について説明する。ここでは、一例として、上記通信ネットワーク内の通信装置N1とN2との間のどこかで故障が発生した場合について、その故障に対する措置について説明する。
故障が発生すると、その旨を示すメッセージがOPS装置O6に通知される。ここでは、故障通知メッセージは、OPS装置O1,O2経由で、OPS装置O6に通知される。この通知されたメッセージは、OPSアダプタ部(A1)において、OPS装置O6で処理可能な情報に変換される。変換されたメッセージは、すべてメッセージ分析処理部(A2)で内容を分析し、メッセージ種別、装置名、発生時刻等の情報を抽出する。メッセージ分析処理部では、メッセージ種別毎に対応の要否を判定し、対応要の場合には対応する推定ルール記憶部(A3)を参照して推定ルールを決定する。
【0025】
推定ルール実行部(A4)では、発生時刻の前後t秒間(t:シナリオに記述した変化可能な値)で、当該推定ルール内に予め定義された関連メッセージ発生有無を確認する。メッセージがある場合には、構成情報検索部(A5)と連携して、装置名をキー情報として構成情報DB(A6)を検索することにより、そのメッセージが対向通信装置で発生しているかどうかや、上位装置でメッセージが発生しているかどうかを特定し、関連メッセージ発生パターンを分析することで、主要因推定を行い、動作シナリオを決定する。決定された動作シナリオを実行することにより、原則として、保守者の介在なしに故障から回復することができる。
(構成情報の例)
構成情報DB(A6)で管理する情報の構成例が図3に示されている。同図には、通信装置N1の回線収容表が示されている。同図を参照すると、収容装置名(パッケージ)として、共通線信号処理装置がある。本例では、この共通線信号処理装置として、「00」と「01」とがある。前者にはリンク番号「000」〜「007」があり、後者にはリンク番号「008」〜「015」がある。これらは、通信装置N2〜N4を対向装置とし、回線番号は「1」〜「6」のいずれか1つである。
【0026】
このような回線収容表は、その他の通信装置N2、N3…についても用意されている。したがって、この構成情報DB(A6)で管理されている回線収容表を参照することにより、通信装置同士の接続関係を把握することができる。
(推定ルール及び動作シナリオの例)
次に、推定ルール及び動作シナリオの例について図4及び図5を参照して説明する。本例においては、図4に示されているように推定処理を行った後、図5に示されているように回復に必要な措置を行う。なお、本例では、リンク番号「001」、装置名「N1」において故障が発生し、故障発生時刻は「yymmddhhmmss」(年月日時分秒それぞれ2桁で表現される)である。
【0027】
まず、図4において、同一通信装置N1にシステムダウンのメッセージがあるか判断する(ステップS101)。そのメッセージがあれば図5に移行し、通信装置N1対応の再開対応シナリオを起動する(ステップS201)。
図4に戻り、そのメッセージがなければ、次に、同一通信装置N1に上位装置(収容パッケージ)故障メッセージがあるか判断する(ステップS102)。そのメッセージがあれば図5に移行し、通信装置N1対応の装置診断シナリオを起動する(ステップS202)。
【0028】
図4に戻り、そのメッセージがなければ、次に、同一通信装置N1に他リンクの同一種類のメッセージがあるか判断する(ステップS103)。そのメッセージがあれば更に対向通信装置にシステムダウンメッセージがあるか判断する(ステップS104)。そのメッセージがあれば図5に移行し、対向通信装置N2対応の再開対応シナリオを起動する(ステップS203)。
【0029】
図4に戻り、そのメッセージがなければ、次に、対向通信装置に上位装置(収容パッケージ)故障メッセージがあるか判断する(ステップS105)。そのメッセージがあれば図5に移行し、対向通信装置N2対応の故障対応シナリオを起動する(ステップS204)。
図4に戻り、そのメッセージがなければ、次に、対向通信装置側でリンク故障発生のメッセージがあるか判断する(ステップS106)。そのメッセージがあれば図5に移行し、対向通信装置N2対応のリンク故障シナリオを起動する(ステップS205)。
【0030】
ステップS201、S203、S204、S205の各シナリオを起動した場合、その後に措置は終了となる。ステップS202のシナリオを起動した場合、その後にトラブルチケット発行シナリオを起動し、パッケージ交換を保守者に依頼する(ステップS210)。
また、ステップS106において、対向通信装置側でリンク故障発生のメッセージがない場合、トラブルチケット発行シナリオを起動し、ギブアップとして保守者の介入を促す(ステップS209)。
【0031】
ステップS103において、同一通信装置N1に他リンクの同一種類のメッセージがない場合、図5に移行し、通信装置N1対応のリンク故障シナリオを起動する。この場合、最初にリンク閉塞・解除によるリンク初期設定で回復したか判断する(ステップS206)。回復すれば措置は終了となる。
ステップS206において、回復しない場合、リンク試験結果が正常か判断する(ステップS207)。リンク試験結果が正常である場合、トラブルチケット発行シナリオを起動し、ギブアップとして保守者の介入を促す(ステップS209)。一方、リンク試験結果が正常でない場合、トラブルチケット発行シナリオを起動し、保守者の対応を促す(ステップS208)。
【0032】
以上、図4及び図5を参照して説明したように、要因特定・故障措置部(A7)では、動作シナリオに従って、トラヒック情報収集による影響把握や、診断・試験による要因特定を自動的に実施し、故障要因を特定する。そして、故障要因特定後は、対象装置に対して、初期設定や、系変更・装置切り替え等の故障措置を実施する。トラヒック情報収集や、診断・試験、装置切り替え等の個々の動作は、上述した動作部品群(A9)として予め準備されている。また、動作部品群を用いた動作が、動作シナリオによって記述されている。そして、要因特定・故障措置部が対象通信装置を指定することにより、対象通信装置へのコマンドを実行することができる。
【0033】
故障措置の結果、ハード装置の交換作業のような、保守者の対応が必要となった場合には、上述したように入出力装置D1からトラブルチケットを発行する。この場合、入出力装置D1の画面にその旨を表示して保守者に報知しても良いし、プリントアウトすることによって保守者に報知しても良い。
また、動作シナリオが決定できなかった場合や、故障回復ができなかった場合にも、上述したように保守者の対応を促すトラブルチケットを通知する。最後に、一連メッセージが通知されることのトリガーとなったメッセージ、決定した動作シナリオ、コマンド実行結果、故障措置結果を履歴DB(A10)に格納し、故障措置は完了する。
【0034】
なお、OPS装置O6のシステム保守者は、定期的に履歴DB(A10)内を統計分析し、推定ルール及び動作シナリオの正常性を確認するとともに、動作に不具合がある場合は、テキストベースでの修正を可能とする。すなわち、本例のシナリオは、上述したように、テキストファイルによって構成されているので、シナリオの変更が必要になった場合でも、その内容を容易に修正したり、シナリオ自体を新規に追加したりすることができる。
【0035】
以上のように本システムは、通信ネットワークを構成する複数の通信装置を通信媒体を介して管理する汎用計算機を構成要素としたオペレーションシステムにおける通信ネットワークの監視・保守運用を行うシステムである。そして、通信装置から通知される自律メッセージの情報を利用し、メッセージの関連付けを行い故障の要因を分析し、自動措置を行うものである。
【0036】
先述した問題点を解決するため、本システムでは、個々の通信装置から故障発生時に通知されるメッセージの発生パターンを予め具備し、メッセージ発生パターンによって、予め配備した、措置パターンの中から適切な措置手順を決定する。メッセージの発生パターン及び、措置手順は、予めテキストベースのシナリオとして用意され、メッセージが変更になった場合でも、容易に対応できる。このことにより、故障発生直後に保守者の作業無しに自動で故障要因の分析、故障措置が行える。
(故障措置方法)
ところで、以上説明した故障措置システムにおいては、以下のような故障措置方法が実現されている。すなわち、通信ネットワークを構成する複数の通信装置のいずれかにおいて発生した故障の要因を推定する推定ステップと、上記推定ステップにおける推定内容に基づいて上記故障に対する措置を行う措置実行ステップと、を含む故障措置方法が実現されている。故障要因の推定結果に基づいて、適切な措置を自動的に行うことができる。
【0037】
また、上記推定ステップにおいては、上記複数の通信装置それぞれについての故障通知に応答して故障の要因を推定し、ある通信装置に故障の要因が存在しない場合にはその通信装置に対向する他の通信装置について故障の要因を推定する。ある装置と、それに対向する装置とに分けて故障要因を推定することにより、推定の効率を向上させることができる。
【0038】
さらに、上記措置実行ステップにおいては、上記故障に対する措置を行うために用いる複数種類のソフトウェア部品を動作させるための複数種類のシナリオを用いる。あらゆる場合を想定した措置についてソフトウェアを用意するとファイルの規模が膨大になるのに対し、ソフトウェア部品とシナリオとを組み合わせればファイルの規模を最小限度に抑えることができる。
【0039】
なお、上記措置実行ステップにおいては、適切なシナリオを選択できない場合、その旨をオペレータに報知し、オペレータによる措置を促す。適切なシナリオが存在しない場合には、オペレータが措置を行うことにより、より適切に措置を行い得る。また、上記複数種類のシナリオは、テキストファイルによって構成されている。テキストファイルによってシナリオを構成することにより、シナリオの変更が必要になった場合でも、その内容を容易に修正したり、シナリオ自体を新規に追加したりすることができる。
【0040】
【発明の効果】
以上説明したように本発明は、通信ネットワークを構成する複数の通信装置のいずれかにおいて発生した故障の要因を推定し、この推定内容に基づいて故障に対する措置を行うことにより、故障要因の推定結果に基づいて、適切な措置を自動的に行うので、原則として、保守者の作業無しに故障要因特定、回復措置を直ちに、正確に実施できるという効果がある。
【0041】
また、複数の通信装置それぞれについての故障通知に応答して故障の要因を推定し、ある通信装置に故障の要因が存在しない場合にはその通信装置に対向する他の通信装置について故障の要因を推定することにより、推定の効率を向上させることができるという効果がある。
故障に対する措置を行うために用いる複数種類のソフトウェア部品と、推定結果に応じて複数種類のソフトウェア部品の少なくとも1つを動作させるための複数種類のシナリオとを用意し、複数種類のシナリオのうち、推定内容に応じて選択されたシナリオがソフトウェア部品を動作させて故障に対する措置を行うことにより、ファイルの規模が膨大にならず、ファイル規模を最小限度に抑えることができる。
【0042】
そして、適切なシナリオを選択できない場合、その旨をオペレータに報知し、オペレータによる措置を促すことにより、より適切に措置を行い得る。
さらに、複数種類のシナリオを、テキストファイルによって構成することにより、シナリオの変更が必要になった場合でも、その内容を容易に修正したり、シナリオ自体を新規に追加したりすることができる。
【図面の簡単な説明】
【図1】本発明の故障措置システムを実現するためのOPS装置の構成例を示す機能概要図である。
【図2】本発明の故障措置システムを採用した通信ネットワーク構成概略図である。
【図3】構成情報DBで管理される通信装置N1の情報の構成例である。
【図4】本システムにおける推定ルールの例を示すフローチャートである。
【図5】図4の推定ルールによる推定後に実行される動作シナリオの処理例を示すフローチャートである。
【図6】通信ネットワークにおける、従来の故障箇所特定及び、故障措置方法について、説明するための通信ネットワーク構成図である。
【符号の説明】
N1〜N4 通信装置
T1、T2 通信端末
O1〜O6 OPS装置
D1〜D5 入出力装置
A1 OPSアダプタ部
A2 メッセージ分析処理部
A3 推定ルール記憶部
A4 推定ルール実行部
A5 構成情報検索部
A6 構成情報DB
A7 要因特定・故障措置部
A8 動作シナリオ記憶部
A9 動作部品群
A10 履歴DB
【発明の属する技術分野】
本発明は故障措置システム、及び、故障措置方法に関し、特に通信ネットワークを構成する通信装置において発生した故障に関する通知に応答して適切な措置を行うための故障措置システム、及び、故障措置方法に関する。
【0002】
【従来の技術】
近年、通信ネットワークの多様化に伴い、大規模かつ複雑に構成される通信ネットワークでは、通信ネットワークの通信状況を一元監視し、通信ネットワーク内で故障が発生した場合に、短時間に故障復旧を行い、サービス中断時間を短縮し、かつ運用コストを圧縮することが要望されている。通信ネットワークで故障が発生した場合、故障要因を特定し、故障措置を自動で行うことが望ましい。その場合、要因となる通信が何かを短時間に分析することが重要な課題である。
【0003】
通信ネットワーク内で故障が発生した場合に、故障箇所を特定し、復旧する一般的な故障措置方法について、図6を参照して説明する。
同図において、通信ネットワークは、ネットワークを構成する通信装置N1〜N4及びN1’〜N3’と、通信装置N1〜N4及びN1’〜N3’にそれぞれ接続される通信端末T1、T2と、通信媒体を介して通信装置N1〜N4及びN1’〜N3’に接続し、通信装置からの通知(メッセージ)を受信し、または通信装置に指示(コマンド)を送出する通信装置対応のオペレーションサポートシステム(Operation Support System)を構成するOPS(Operation System)装置O1〜O4と、通信媒体を介して通信装置N1〜N4及びN1’〜N3’に接続し、通信装置からの呼処理状況通知(トラヒック情報)を受信し、または通信装置にトラヒック制御(コマンド)を送出するOPS装置O5とを含んで構成されている。
【0004】
さらに、同図に示されている通信ネットワークには、入出力装置D1〜D5が接続されている。これら入出力装置D1〜D5は、OPS装置O1〜O5に接続され、オペレーションシステムで受信したメッセージを保守者(オペレータ)に対して表示し、または、保守者からのコマンドをオペレーションシステムに入力するために設けられている。
【0005】
上記の通信ネットワーク内の通信装置N1とN2との間で故障が発生した場合を例として従来技術での故障対応方法を説明する。
通信装置N1とN2との間で故障が発生すると、故障を知らせるメッセージが通信装置N1よりOPS装置O1と、通信装置N2よりOPS装置O2へそれぞれ送信される。OPS装置O1,O2では、受信したメッセージを保守者に認識できる表現で入出力装置D1,D2に表示を行う。
【0006】
保守者は、入出力装置D1,D2に表示されたメッセージにより、通信装置N1,N2での故障の発生を認識し、故障要因となっている箇所を特定するための装置診断や、呼処理の正常性確認試験作業をそれぞれ独立して行う。あわせて、トラヒック状況を確認する必要があると判断した場合には、OPS装置O5に接続された入出力装置D5を使用して、トラヒック状況を調査する。その上で、故障箇所を特定し、故障回復措置を実施した後、正常性の確認を行う。
【0007】
【発明が解決しようとする課題】
上述した従来の故障措置においては、故障箇所に関連した上位、下位のそれぞれの通信装置で発生した故障通知を保守者が、それぞれ確認し、経験等に基づき関連の有無を想定しながら、故障要因となっている箇所を特定するための装置診断や、呼処理の正常性確認試験作業をそれぞれ独立して行っていた。
【0008】
この場合、故障発生から要因の分析までに時間がかかること、さらに保守者それぞれの経験や知識によって、回復時間にむらがあること、故障要因の分析や措置を誤るといった欠点があった。また故障発生時の対応のため、保守者を終日待機させておく必要があった。
本発明は上述した従来技術の欠点を解決するためになされたものであり、その目的は故障が発生した場合に、保守者の作業無しに直ちに、正確に故障要因を分析、措置を実施することのできる故障措置システム、及び、故障措置方法を提供することである。
【0009】
【課題を解決するための手段】
本発明の請求項1による故障措置システムは、通信ネットワークを構成する複数の通信装置のいずれかにおいて発生した故障の要因を推定する推定手段と、前記推定手段の推定内容に基づいて前記故障に対する措置を行う措置実行手段と、を含むことを特徴とする。故障要因の推定結果に基づいて、適切な措置を自動的に行うことができる。これにより、故障が発生した場合に、短時間に故障復旧を行い、サービス中断時間を短縮でき、かつ、運用コストを圧縮できる。
【0010】
本発明の請求項2による故障措置システムは、請求項1において、前記推定手段は、前記複数の通信装置それぞれについての故障通知に応答して故障の要因を推定し、ある通信装置に故障の要因が存在しない場合にはその通信装置に対向する他の通信装置について故障の要因を推定することを特徴とする。ある装置と、それに対向する装置とに分けて故障要因を推定することにより、推定の効率を向上させることができる。
【0011】
本発明の請求項3による故障措置システムは、請求項1又は2において、前記措置実行手段は、前記故障に対する措置を行うために用いる複数種類のソフトウェア部品と、前記推定手段の推定結果に応じて前記複数種類のソフトウェア部品の少なくとも1つを動作させるための複数種類のシナリオとを含み、前記複数種類のシナリオのうち、前記推定手段の推定内容に応じて選択されたシナリオが前記ソフトウェア部品を動作させることにより、前記故障に対する措置を行うことを特徴とする。あらゆる場合を想定した措置についてソフトウェアを用意するとファイルの規模が膨大になるのに対し、ソフトウェア部品とシナリオとを組み合わせればファイルの規模を最小限度に抑えることができる。
【0012】
本発明の請求項4による故障措置システムは、請求項3において、前記措置実行手段は、適切なシナリオを選択できない場合、その旨をオペレータに報知し、オペレータによる措置を促すことを特徴とする。適切なシナリオが存在しない場合には、オペレータが措置を行うことにより、より適切に措置を行い得る。
本発明の請求項5による故障措置システムは、請求項3又は4において、前記複数種類のシナリオは、テキストファイルによって構成されていることを特徴とする。テキストファイルによってシナリオを構成することにより、シナリオの変更が必要になった場合でも、その内容を容易に修正したり、シナリオ自体を新規に追加したりすることができる。
【0013】
本発明の請求項6による故障措置方法は、通信ネットワークを構成する複数の通信装置のいずれかにおいて発生した故障の要因を推定する推定ステップと、前記推定ステップにおける推定内容に基づいて前記故障に対する措置を行う措置実行ステップと、を含むことを特徴とする。故障要因の推定結果に基づいて、適切な措置を自動的に行うことができる。
【0014】
本発明の請求項7による故障措置方法は、請求項6において、前記推定ステップにおいては、前記複数の通信装置それぞれについての故障通知に応答して故障の要因を推定し、ある通信装置に故障の要因が存在しない場合にはその通信装置に対向する他の通信装置について故障の要因を推定することを特徴とする。ある装置と、それに対向する装置とに分けて故障要因を推定することにより、推定の効率を向上させることができる。
【0015】
本発明の請求項8による故障措置方法は、請求項6又は7において、前記措置実行ステップにおいては、前記故障に対する措置を行うために用いる複数種類のソフトウェア部品を動作させるための複数種類のシナリオを用いることを特徴とする。あらゆる場合を想定した措置についてソフトウェアを用意するとファイルの規模が膨大になるのに対し、ソフトウェア部品とシナリオとを組み合わせればファイルの規模を最小限度に抑えることができる。
【0016】
本発明の請求項9による故障措置方法は、請求項8において、前記措置実行ステップにおいては、適切なシナリオを選択できない場合、その旨をオペレータに報知し、オペレータによる措置を促すことを特徴とする。適切なシナリオが存在しない場合には、オペレータが措置を行うことにより、より適切に措置を行い得る。
【0017】
本発明の請求項10による故障措置方法は、請求項8又は9において、前記複数種類のシナリオは、テキストファイルによって構成されていることを特徴とする。テキストファイルによってシナリオを構成することにより、シナリオの変更が必要になった場合でも、その内容を容易に修正したり、シナリオ自体を新規に追加したりすることができる。
【0018】
【発明の実施の形態】
次に、図面を参照して本発明の実施の形態について説明する。なお、以下の説明において参照する各図においては、他の図と同等部分に同一符号が付されている。
(通信ネットワーク全体の構成)
図2は本発明による故障措置システムを採用した通信ネットワークの一形態を示すブロック図である。同図に示されているように、本実施形態による故障措置システムを採用した通信ネットワークは、ネットワークを構成する通信装置N1〜N4及びN1’〜N3’と、通信装置N1〜N4及びN1’〜N3’にそれぞれ接続される通信端末T1、T2と、通信媒体を介して通信装置N1〜N4及びN1’〜N3’に接続し、通信装置からの通知(メッセージ)を受信し、または通信装置に指示(コマンド)を送出する通信装置対応のオペレーションサポートシステムを構成するOPS装置O1〜O4と、通信媒体を介して通信装置N1〜N4及びN1’〜N3’に接続し、通信装置からの呼処理状況通知(トラヒック情報)を受信し、または通信装置にトラヒック制御(コマンド)を送出するOPS装置O5と、通信ネットワーク全体を管理する汎用計算機からなるオペレーションサポートシステムを構成するOPS装置O6とを含んで構成されている。
【0019】
さらに、同図に示されている通信ネットワークには、入出力装置D1〜D5が接続されている。これら入出力装置D1〜D5は、OPS装置O1〜O6に接続され、オペレーションシステムで受信したメッセージを保守者に対して表示し、または、保守者からのコマンドをオペレーションシステムに入力するために設けられている。
【0020】
つまり、本システムは、従来のシステムの構成(図6参照)にOPS装置O6を追加した構成である。なお、同図に示されている構成は例示にすぎず、他の構成のシステムについて本発明が適用できることは勿論である。
このような構成からなる故障措置システムにおいて、通信装置N1とN2との間で故障が発生した場合、それぞれのOPS装置経由で故障発生メッセージがOPS装置O6に通知される。本OPS装置O6では、それぞれのメッセージの内容を分析し、予め配備している発生パターンに合致しているか確認をし、対応手順を決定する。
【0021】
その後、対応手順にそってメッセージ通知元の通信装置に対して、装置診断や、呼処理情報収集のコマンドを実施し、その結果により措置手順を決定し、措置手順に従って、装置の初期設定等の故障回復措置を行う。トラヒックヘの影響調査有無も、対応手順に記述される。以上のような、対応手順ないし措置手順は、シナリオとして記述され、この記述されたシナリオが動作シナリオ記憶部(A8)に記憶される。このシナリオは、テキストファイルで構成するのが望ましい。テキストファイルで構成すれば、テキストベースでの修正が可能となるので、シナリオの変更が必要になった場合でも、その内容を容易に修正したり、シナリオ自体を新規に追加したりすることができる。
【0022】
対応措置の実行によって故障状態から回復できた場合には、発生から対応状況を履歴として蓄積し、措置手順を決定できなかった場合や、故障回復ができなかった場合は、状況を保守者に通知する。従って、通常は、故障メッセージが発生しても保守者の作業無しに故障要因分析、故障回復措置が、自動実行されることになる。このため、保守者の対応が必要となるのは、措置手順を決定できなかった場合や、故障回復ができなかった場合のみである。これらの場合においては、後述するトラブルチケット等によって保守者に報知し、保守者による措置が促される。つまり、本システムを採用することにより、故障原因の推定、及び、故障に対する措置を自動的に行うことができる。
(OPS装置O6の内部構成例)
ここで、図1には、OPS装置O6の内部構成例が示されている。同図において、OPS装置O6は、メッセージの変換等、外部とのインタフェースをなすOPSアダプタ部A1と、メッセージの分析を行うメッセージ分析処理部A2と、後述する推定ルールが記憶されている推定ルール記憶部A3と、推定ルールを実行する推定ルール実行部A4と、ネットワーク構成情報の検索を行う構成情報検索部A5と、通信ネットワークを構成している通信装置についての構成情報を記憶する構成情報DB(Data Base)A6と、故障要因を特定しそれに対応する適切な措置を指示する要因特定・故障措置部A7と、故障回復のための動作シナリオが記憶されている動作シナリオ記憶部A8と、ソフトウェアによって所定の動作を実現するための動作部品群A9と、故障措置結果の履歴を記憶する履歴DB(Data Base)A10とを含んで構成されている。
【0023】
動作部品群A9は、「トラヒック収集」、「診断・試験」、「装置切替・初期設定」、「トラブルチケット発行」等の動作を実現するためのソフトウェアによる部品である。これらの動作は例示にすぎず、その他の必要な動作を実現するためのソフトウェアによる部品が、動作部品群A9に含まれているものとする。
動作シナリオ記憶部A8に記憶されている動作シナリオが、この動作部品群A9のうちの少なくとも1つを動作させることによって、回復措置が自動的に行われる。
【0024】
次に、以上のような構成からなる本システムの動作例について説明する。ここでは、一例として、上記通信ネットワーク内の通信装置N1とN2との間のどこかで故障が発生した場合について、その故障に対する措置について説明する。
故障が発生すると、その旨を示すメッセージがOPS装置O6に通知される。ここでは、故障通知メッセージは、OPS装置O1,O2経由で、OPS装置O6に通知される。この通知されたメッセージは、OPSアダプタ部(A1)において、OPS装置O6で処理可能な情報に変換される。変換されたメッセージは、すべてメッセージ分析処理部(A2)で内容を分析し、メッセージ種別、装置名、発生時刻等の情報を抽出する。メッセージ分析処理部では、メッセージ種別毎に対応の要否を判定し、対応要の場合には対応する推定ルール記憶部(A3)を参照して推定ルールを決定する。
【0025】
推定ルール実行部(A4)では、発生時刻の前後t秒間(t:シナリオに記述した変化可能な値)で、当該推定ルール内に予め定義された関連メッセージ発生有無を確認する。メッセージがある場合には、構成情報検索部(A5)と連携して、装置名をキー情報として構成情報DB(A6)を検索することにより、そのメッセージが対向通信装置で発生しているかどうかや、上位装置でメッセージが発生しているかどうかを特定し、関連メッセージ発生パターンを分析することで、主要因推定を行い、動作シナリオを決定する。決定された動作シナリオを実行することにより、原則として、保守者の介在なしに故障から回復することができる。
(構成情報の例)
構成情報DB(A6)で管理する情報の構成例が図3に示されている。同図には、通信装置N1の回線収容表が示されている。同図を参照すると、収容装置名(パッケージ)として、共通線信号処理装置がある。本例では、この共通線信号処理装置として、「00」と「01」とがある。前者にはリンク番号「000」〜「007」があり、後者にはリンク番号「008」〜「015」がある。これらは、通信装置N2〜N4を対向装置とし、回線番号は「1」〜「6」のいずれか1つである。
【0026】
このような回線収容表は、その他の通信装置N2、N3…についても用意されている。したがって、この構成情報DB(A6)で管理されている回線収容表を参照することにより、通信装置同士の接続関係を把握することができる。
(推定ルール及び動作シナリオの例)
次に、推定ルール及び動作シナリオの例について図4及び図5を参照して説明する。本例においては、図4に示されているように推定処理を行った後、図5に示されているように回復に必要な措置を行う。なお、本例では、リンク番号「001」、装置名「N1」において故障が発生し、故障発生時刻は「yymmddhhmmss」(年月日時分秒それぞれ2桁で表現される)である。
【0027】
まず、図4において、同一通信装置N1にシステムダウンのメッセージがあるか判断する(ステップS101)。そのメッセージがあれば図5に移行し、通信装置N1対応の再開対応シナリオを起動する(ステップS201)。
図4に戻り、そのメッセージがなければ、次に、同一通信装置N1に上位装置(収容パッケージ)故障メッセージがあるか判断する(ステップS102)。そのメッセージがあれば図5に移行し、通信装置N1対応の装置診断シナリオを起動する(ステップS202)。
【0028】
図4に戻り、そのメッセージがなければ、次に、同一通信装置N1に他リンクの同一種類のメッセージがあるか判断する(ステップS103)。そのメッセージがあれば更に対向通信装置にシステムダウンメッセージがあるか判断する(ステップS104)。そのメッセージがあれば図5に移行し、対向通信装置N2対応の再開対応シナリオを起動する(ステップS203)。
【0029】
図4に戻り、そのメッセージがなければ、次に、対向通信装置に上位装置(収容パッケージ)故障メッセージがあるか判断する(ステップS105)。そのメッセージがあれば図5に移行し、対向通信装置N2対応の故障対応シナリオを起動する(ステップS204)。
図4に戻り、そのメッセージがなければ、次に、対向通信装置側でリンク故障発生のメッセージがあるか判断する(ステップS106)。そのメッセージがあれば図5に移行し、対向通信装置N2対応のリンク故障シナリオを起動する(ステップS205)。
【0030】
ステップS201、S203、S204、S205の各シナリオを起動した場合、その後に措置は終了となる。ステップS202のシナリオを起動した場合、その後にトラブルチケット発行シナリオを起動し、パッケージ交換を保守者に依頼する(ステップS210)。
また、ステップS106において、対向通信装置側でリンク故障発生のメッセージがない場合、トラブルチケット発行シナリオを起動し、ギブアップとして保守者の介入を促す(ステップS209)。
【0031】
ステップS103において、同一通信装置N1に他リンクの同一種類のメッセージがない場合、図5に移行し、通信装置N1対応のリンク故障シナリオを起動する。この場合、最初にリンク閉塞・解除によるリンク初期設定で回復したか判断する(ステップS206)。回復すれば措置は終了となる。
ステップS206において、回復しない場合、リンク試験結果が正常か判断する(ステップS207)。リンク試験結果が正常である場合、トラブルチケット発行シナリオを起動し、ギブアップとして保守者の介入を促す(ステップS209)。一方、リンク試験結果が正常でない場合、トラブルチケット発行シナリオを起動し、保守者の対応を促す(ステップS208)。
【0032】
以上、図4及び図5を参照して説明したように、要因特定・故障措置部(A7)では、動作シナリオに従って、トラヒック情報収集による影響把握や、診断・試験による要因特定を自動的に実施し、故障要因を特定する。そして、故障要因特定後は、対象装置に対して、初期設定や、系変更・装置切り替え等の故障措置を実施する。トラヒック情報収集や、診断・試験、装置切り替え等の個々の動作は、上述した動作部品群(A9)として予め準備されている。また、動作部品群を用いた動作が、動作シナリオによって記述されている。そして、要因特定・故障措置部が対象通信装置を指定することにより、対象通信装置へのコマンドを実行することができる。
【0033】
故障措置の結果、ハード装置の交換作業のような、保守者の対応が必要となった場合には、上述したように入出力装置D1からトラブルチケットを発行する。この場合、入出力装置D1の画面にその旨を表示して保守者に報知しても良いし、プリントアウトすることによって保守者に報知しても良い。
また、動作シナリオが決定できなかった場合や、故障回復ができなかった場合にも、上述したように保守者の対応を促すトラブルチケットを通知する。最後に、一連メッセージが通知されることのトリガーとなったメッセージ、決定した動作シナリオ、コマンド実行結果、故障措置結果を履歴DB(A10)に格納し、故障措置は完了する。
【0034】
なお、OPS装置O6のシステム保守者は、定期的に履歴DB(A10)内を統計分析し、推定ルール及び動作シナリオの正常性を確認するとともに、動作に不具合がある場合は、テキストベースでの修正を可能とする。すなわち、本例のシナリオは、上述したように、テキストファイルによって構成されているので、シナリオの変更が必要になった場合でも、その内容を容易に修正したり、シナリオ自体を新規に追加したりすることができる。
【0035】
以上のように本システムは、通信ネットワークを構成する複数の通信装置を通信媒体を介して管理する汎用計算機を構成要素としたオペレーションシステムにおける通信ネットワークの監視・保守運用を行うシステムである。そして、通信装置から通知される自律メッセージの情報を利用し、メッセージの関連付けを行い故障の要因を分析し、自動措置を行うものである。
【0036】
先述した問題点を解決するため、本システムでは、個々の通信装置から故障発生時に通知されるメッセージの発生パターンを予め具備し、メッセージ発生パターンによって、予め配備した、措置パターンの中から適切な措置手順を決定する。メッセージの発生パターン及び、措置手順は、予めテキストベースのシナリオとして用意され、メッセージが変更になった場合でも、容易に対応できる。このことにより、故障発生直後に保守者の作業無しに自動で故障要因の分析、故障措置が行える。
(故障措置方法)
ところで、以上説明した故障措置システムにおいては、以下のような故障措置方法が実現されている。すなわち、通信ネットワークを構成する複数の通信装置のいずれかにおいて発生した故障の要因を推定する推定ステップと、上記推定ステップにおける推定内容に基づいて上記故障に対する措置を行う措置実行ステップと、を含む故障措置方法が実現されている。故障要因の推定結果に基づいて、適切な措置を自動的に行うことができる。
【0037】
また、上記推定ステップにおいては、上記複数の通信装置それぞれについての故障通知に応答して故障の要因を推定し、ある通信装置に故障の要因が存在しない場合にはその通信装置に対向する他の通信装置について故障の要因を推定する。ある装置と、それに対向する装置とに分けて故障要因を推定することにより、推定の効率を向上させることができる。
【0038】
さらに、上記措置実行ステップにおいては、上記故障に対する措置を行うために用いる複数種類のソフトウェア部品を動作させるための複数種類のシナリオを用いる。あらゆる場合を想定した措置についてソフトウェアを用意するとファイルの規模が膨大になるのに対し、ソフトウェア部品とシナリオとを組み合わせればファイルの規模を最小限度に抑えることができる。
【0039】
なお、上記措置実行ステップにおいては、適切なシナリオを選択できない場合、その旨をオペレータに報知し、オペレータによる措置を促す。適切なシナリオが存在しない場合には、オペレータが措置を行うことにより、より適切に措置を行い得る。また、上記複数種類のシナリオは、テキストファイルによって構成されている。テキストファイルによってシナリオを構成することにより、シナリオの変更が必要になった場合でも、その内容を容易に修正したり、シナリオ自体を新規に追加したりすることができる。
【0040】
【発明の効果】
以上説明したように本発明は、通信ネットワークを構成する複数の通信装置のいずれかにおいて発生した故障の要因を推定し、この推定内容に基づいて故障に対する措置を行うことにより、故障要因の推定結果に基づいて、適切な措置を自動的に行うので、原則として、保守者の作業無しに故障要因特定、回復措置を直ちに、正確に実施できるという効果がある。
【0041】
また、複数の通信装置それぞれについての故障通知に応答して故障の要因を推定し、ある通信装置に故障の要因が存在しない場合にはその通信装置に対向する他の通信装置について故障の要因を推定することにより、推定の効率を向上させることができるという効果がある。
故障に対する措置を行うために用いる複数種類のソフトウェア部品と、推定結果に応じて複数種類のソフトウェア部品の少なくとも1つを動作させるための複数種類のシナリオとを用意し、複数種類のシナリオのうち、推定内容に応じて選択されたシナリオがソフトウェア部品を動作させて故障に対する措置を行うことにより、ファイルの規模が膨大にならず、ファイル規模を最小限度に抑えることができる。
【0042】
そして、適切なシナリオを選択できない場合、その旨をオペレータに報知し、オペレータによる措置を促すことにより、より適切に措置を行い得る。
さらに、複数種類のシナリオを、テキストファイルによって構成することにより、シナリオの変更が必要になった場合でも、その内容を容易に修正したり、シナリオ自体を新規に追加したりすることができる。
【図面の簡単な説明】
【図1】本発明の故障措置システムを実現するためのOPS装置の構成例を示す機能概要図である。
【図2】本発明の故障措置システムを採用した通信ネットワーク構成概略図である。
【図3】構成情報DBで管理される通信装置N1の情報の構成例である。
【図4】本システムにおける推定ルールの例を示すフローチャートである。
【図5】図4の推定ルールによる推定後に実行される動作シナリオの処理例を示すフローチャートである。
【図6】通信ネットワークにおける、従来の故障箇所特定及び、故障措置方法について、説明するための通信ネットワーク構成図である。
【符号の説明】
N1〜N4 通信装置
T1、T2 通信端末
O1〜O6 OPS装置
D1〜D5 入出力装置
A1 OPSアダプタ部
A2 メッセージ分析処理部
A3 推定ルール記憶部
A4 推定ルール実行部
A5 構成情報検索部
A6 構成情報DB
A7 要因特定・故障措置部
A8 動作シナリオ記憶部
A9 動作部品群
A10 履歴DB
Claims (10)
- 通信ネットワークを構成する複数の通信装置のいずれかにおいて発生した故障の要因を推定する推定手段と、前記推定手段の推定内容に基づいて前記故障に対する措置を行う措置実行手段と、を含むことを特徴とする故障措置システム。
- 前記推定手段は、前記複数の通信装置それぞれについての故障通知に応答して故障の要因を推定し、ある通信装置に故障の要因が存在しない場合にはその通信装置に対向する他の通信装置について故障の要因を推定することを特徴とする請求項1記載の故障措置システム。
- 前記措置実行手段は、前記故障に対する措置を行うために用いる複数種類のソフトウェア部品と、前記推定手段の推定結果に応じて前記複数種類のソフトウェア部品の少なくとも1つを動作させるための複数種類のシナリオとを含み、前記複数種類のシナリオのうち、前記推定手段の推定内容に応じて選択されたシナリオが前記ソフトウェア部品を動作させることにより、前記故障に対する措置を行うことを特徴とする請求項1又は2記載の故障措置システム。
- 前記措置実行手段は、適切なシナリオを選択できない場合、その旨をオペレータに報知し、オペレータによる措置を促すことを特徴とする請求項3記載の故障措置システム。
- 前記複数種類のシナリオは、テキストファイルによって構成されていることを特徴とする請求項3又は4記載の故障措置システム。
- 通信ネットワークを構成する複数の通信装置のいずれかにおいて発生した故障の要因を推定する推定ステップと、前記推定ステップにおける推定内容に基づいて前記故障に対する措置を行う措置実行ステップと、を含むことを特徴とする故障措置方法。
- 前記推定ステップにおいては、前記複数の通信装置それぞれについての故障通知に応答して故障の要因を推定し、ある通信装置に故障の要因が存在しない場合にはその通信装置に対向する他の通信装置について故障の要因を推定することを特徴とする請求項6記載の故障措置方法。
- 前記措置実行ステップにおいては、前記故障に対する措置を行うために用いる複数種類のソフトウェア部品を動作させるための複数種類のシナリオを用いることを特徴とする請求項6又は7記載の故障措置方法。
- 前記措置実行ステップにおいては、適切なシナリオを選択できない場合、その旨をオペレータに報知し、オペレータによる措置を促すことを特徴とする請求項8記載の故障措置方法。
- 前記複数種類のシナリオは、テキストファイルによって構成されていることを特徴とする請求項8又は9記載の故障措置方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002236885A JP2004080297A (ja) | 2002-08-15 | 2002-08-15 | 故障措置システム、及び、故障措置方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002236885A JP2004080297A (ja) | 2002-08-15 | 2002-08-15 | 故障措置システム、及び、故障措置方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004080297A true JP2004080297A (ja) | 2004-03-11 |
Family
ID=32020881
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002236885A Pending JP2004080297A (ja) | 2002-08-15 | 2002-08-15 | 故障措置システム、及び、故障措置方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004080297A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007183730A (ja) * | 2006-01-05 | 2007-07-19 | Hitachi Electronics Service Co Ltd | 自律化促進システム |
US8095819B2 (en) | 2007-06-06 | 2012-01-10 | Nec Corporation | Communication network failure cause analysis system, failure cause analysis method, and failure cause analysis program |
WO2021005686A1 (ja) * | 2019-07-08 | 2021-01-14 | 日本電信電話株式会社 | 自動連携装置、自動連携方法、および自動連携プログラム |
-
2002
- 2002-08-15 JP JP2002236885A patent/JP2004080297A/ja active Pending
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007183730A (ja) * | 2006-01-05 | 2007-07-19 | Hitachi Electronics Service Co Ltd | 自律化促進システム |
US8095819B2 (en) | 2007-06-06 | 2012-01-10 | Nec Corporation | Communication network failure cause analysis system, failure cause analysis method, and failure cause analysis program |
WO2021005686A1 (ja) * | 2019-07-08 | 2021-01-14 | 日本電信電話株式会社 | 自動連携装置、自動連携方法、および自動連携プログラム |
JPWO2021005686A1 (ja) * | 2019-07-08 | 2021-01-14 | ||
JP7273341B2 (ja) | 2019-07-08 | 2023-05-15 | 日本電信電話株式会社 | 自動連携装置、自動連携方法、および自動連携プログラム |
US11775367B2 (en) | 2019-07-08 | 2023-10-03 | Nippon Telegraph And Telephone Corporation | Automatic cooperation apparatus, automatic cooperation method and automatic cooperation program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5488648A (en) | Behavior monitoring and analyzing system for stored program controlled switching system | |
CN106201844B (zh) | 一种日志收集方法及装置 | |
CN101197621B (zh) | 一种对网管系统故障进行远程诊断定位的方法及其系统 | |
CN106789306B (zh) | 通信设备软件故障检测收集恢复方法和系统 | |
CN101296135A (zh) | 故障信息的处理方法和装置 | |
JP5198154B2 (ja) | 障害監視システム及びデバイスと監視装置並びに障害監視方法 | |
CN101388808B (zh) | 一种基于简单网络管理协议的trap处理方法 | |
JP2013130901A (ja) | 監視サーバおよびそれを用いたネットワーク機器復旧システム | |
CN110275992A (zh) | 应急处理方法、装置、服务器及计算机可读存储介质 | |
JP3916232B2 (ja) | ナレッジ型運用管理システム,方法およびプログラム | |
CN101841838B (zh) | 逻辑链路告警的处理方法和装置 | |
JP6317074B2 (ja) | 障害通知装置、障害通知プログラムならびに障害通知方法 | |
JP2005258501A (ja) | 障害影響範囲解析システム及び障害影響範囲解析方法及びプログラム | |
JP2004080297A (ja) | 故障措置システム、及び、故障措置方法 | |
JP3682778B2 (ja) | 故障措置システム、及び、故障要因特定方法 | |
JP2006186633A (ja) | 障害経路診断システム、障害経路診断方法、および障害経路診断プログラム | |
JP2007052756A (ja) | ワイヤレスデバイスの不具合診断に適用する学習型診断データベース | |
JP7421267B2 (ja) | サービス提供用アプリケーションの保守管理システム、保守管理装置、保守管理方法、および、保守管理用プログラム | |
KR100657421B1 (ko) | 학습을 통한 지능형 ums 관리 방법 | |
CN113485861B (zh) | 一种基于资源优化策略的基层故障诊断方法及装置 | |
JP2630255B2 (ja) | ネットワーク障害表示復旧方式 | |
CN100401260C (zh) | 克服单元管理层服务器中故障的方法和计算机产品 | |
JP2011159234A (ja) | 障害対応システム及び障害対応方法 | |
JP4413918B2 (ja) | 通信制御装置及び通信制御方法 | |
JP2004341652A (ja) | 自動試験方法及び自動試験機 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20041203 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20041207 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050207 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20050329 |